首先是語音識別技術(shù)的挑戰(zhàn),前面說到實驗室環(huán)境下語音識別準確率已經(jīng)從2013年的87%提高到了2017年的97%,而在實際環(huán)境中,這個數(shù)字會降低到85%左右,因為實際環(huán)境中有大量的噪音、口音、聲源遠近等問題。在外呼機器人這個領域,短語音識別是一個難點,因為在缺少更多上下文信息的時候,語音識別很難確定你發(fā)的音和對應的字之間的關系,中文更是如此,因為中文是一個同音不同字的語言,還有音調(diào)的變化,比如我發(fā)一個音lao shi ,這在不同的語境下,可能代表這是一個教書育人的職業(yè),在另外的語境下,可能代表這個人的性格很老實。