嗯哼?
這一句嗯哼驚艷全場(chǎng),AI的反應(yīng)出乎了現(xiàn)場(chǎng)所有人的預(yù)料。誠(chéng)然,對(duì)于人類來(lái)說(shuō),諸如嗯、呃之類的語(yǔ)氣詞是再正常不過(guò)的,但是對(duì)于機(jī)器而言,這是一件難以做到的事情。
據(jù)官方介紹,Google Assistant 之所以能夠在電話中做到與真人相差無(wú)幾的語(yǔ)音互動(dòng),主要依賴于被稱為Google Duplex的技術(shù),這是一種用于通過(guò)電話進(jìn)行自然對(duì)話來(lái)執(zhí)行當(dāng)前任務(wù)的新技術(shù)。
通話音頻通過(guò) ASR 系統(tǒng)進(jìn)行處理,然后用上下文數(shù)據(jù)和其他輸入分析后生成響應(yīng)文本,最后通過(guò) TTS 系統(tǒng)朗讀響應(yīng)文本。為了讓對(duì)話聽(tīng)上去盡可能自然,Google 除了在聲音上下了功夫之外,更重要的是提升了不少自然語(yǔ)言理解的能力。
所以,Google Assistant一經(jīng)面世便占據(jù)了各大媒體頭條,而針對(duì)Google Assistant的真人式語(yǔ)音應(yīng)答,盡管谷歌聲稱會(huì)場(chǎng)演示使用的是真實(shí)的電話錄音,接聽(tīng)者也是真正的商戶,但也有人為此提出了質(zhì)疑,認(rèn)為錄音是存在造假可能性的。
美國(guó)科技媒體Axios表示一般人給商戶打電話的時(shí)候,接電話的人一般會(huì)自報(bào)家門(mén)。對(duì)此,Axios也嘗試給一些理發(fā)店打電話,其中包括位于谷歌總部附近的部分理發(fā)店,每一家門(mén)店在接起電話時(shí)都會(huì)自報(bào)家門(mén)或者先說(shuō)接聽(tīng)者姓名。
但是在Google I/O大會(huì)上,Google Assistant給真實(shí)商戶打電話的時(shí)候,并沒(méi)有出現(xiàn)這樣的場(chǎng)景。
另外,Axios還發(fā)現(xiàn)谷歌放出的兩段錄音中,似乎沒(méi)有任何環(huán)境噪音,例如理發(fā)店吹風(fēng)機(jī)的聲音。畢竟多數(shù)情況下給商家打電話時(shí),是可以明顯聽(tīng)到環(huán)境噪音的。
針對(duì)以上質(zhì)疑,Axios也聯(lián)系到了谷歌,詢問(wèn)演示中理發(fā)店和餐廳的名字,并通過(guò)書(shū)面形式向谷歌保證不會(huì)向外界透露這兩家商戶的名稱,以免它們受到不必要的干擾。此做法是希望能夠聯(lián)系到這兩家商戶,證明它們真實(shí)存在,從而佐證Google I/O大會(huì)上谷歌不是自導(dǎo)自演。
即便最后谷歌的發(fā)言人拒絕了Axios的請(qǐng)求。但不得不承認(rèn),谷歌的AI語(yǔ)音一直都走在世界前沿,谷歌或許已經(jīng)做出了一個(gè)活靈活現(xiàn)的語(yǔ)音助理,未來(lái)將可以使用它來(lái)完成各種瑣事,只是當(dāng)前還沒(méi)有完成極速智能應(yīng)答的終極目標(biāo)。
而針對(duì)各類話務(wù)及服務(wù)推廣需求推出的智能語(yǔ)音機(jī)器人' target='_blank'>語(yǔ)音機(jī)器人——悟空話務(wù)機(jī)器人,也一直在向Google的前沿技術(shù)看齊,不斷通過(guò)神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí),針對(duì)市場(chǎng)需求及行業(yè)痛點(diǎn),及時(shí)更新、升級(jí)產(chǎn)品功能,讓語(yǔ)音機(jī)器人應(yīng)用功能更加完善,語(yǔ)音交互更加智能、更加像真人般與客戶自然、順暢進(jìn)行溝通交流。