隨著蘋果Siri的出現(xiàn),語音識別技術開始逐步走進我們的視野。最直觀的感受,就是現(xiàn)在移動互聯(lián)網(wǎng)的應用中越來越多地以語音識別作為新的人機交互手段。
那么語音識別究竟是怎么一回事,它又是怎樣被應用并實現(xiàn)其價值的,通過它企業(yè)又能獲取怎樣的增值服務?帶著這些疑問,我們走進普強信息技術(北京)有限公司,請被譽為語音識別領域舵手的普強CEO何國濤,和CTO李全忠先生來一一解說。

語音識別技術未來將被普遍應用
語音識別技術,簡單地說就是把用戶語音轉(zhuǎn)換成文本。它可以適用于不同的領域,例如移動互聯(lián)網(wǎng),可以讓很多人工密集的呼叫中心實現(xiàn)自動化和智能化,保障信息安全的如聲紋識別類,作為大數(shù)據(jù)挖掘的語音分析系統(tǒng),以及車聯(lián)網(wǎng)和教育產(chǎn)品等等。
微信的語音輸入就是一個應用例子。未來在我們的日常生活中會越來越多的情況下使用語音識別技術,能夠給我們的生活工作帶來很多便捷。
語音識別技術應用價值
語音識別技術可以應用于許多不同的領域?,F(xiàn)在使用最多的是移動互聯(lián)網(wǎng)領域,可以直接把語音轉(zhuǎn)換成文字,為用戶解決了在小屏幕鍵盤輸入的困難;呼叫中心領域,通過采用語音識別技術,自動化處理大量的重復性工作,例如語音分析、語音IVR導航;導航及車聯(lián)網(wǎng),通過智能語音輸入,使駕駛?cè)藛T能夠通過語音控制相應的非駕駛操作,讓駕駛?cè)藛T專注駕駛操作,增加駕駛的安全性;教育領域:口語評測;玩具領域:語音控制;聲紋識別領域:增強系統(tǒng)安全性能,這是今年語音識別的主要收入增長點;醫(yī)療保健領域:應用到電子病歷中,可自動實現(xiàn)醫(yī)生口述病歷及醫(yī)囑等等。
引領語音識別領域 產(chǎn)品技術成熟
普強目前已經(jīng)為金融、電信、保險等行業(yè)提供高準確度和高性能的電話線信道的 ASR(語音識別)引擎。
移動互聯(lián)網(wǎng)方面,普強早在2010年7月便與愛幫網(wǎng)推出了語音版的LBS手機應用,這是國內(nèi)首個基于開放語音云平臺下支持多操作系統(tǒng)的手機應用。近年來,隨著公司不斷的積累,語音識別的技術和產(chǎn)品都相應獲得了全方面領先優(yōu)勢的發(fā)展。在產(chǎn)品的聲學建模上,開發(fā)使用了深度神經(jīng)網(wǎng)絡技術;公司研發(fā)的語音切分技術及識別結果的置信度算法,不但為企業(yè)級應用提供準確的識別結果,同時也提供了精確的說話人分割、時間邊界以及識別結果的置信度等信息,這些信息使企業(yè)在應用中(例如呼叫中心),更加便捷和準確地利用語音作為主要的交互方式,并且可以進一步挖掘、分析和利用海量語音數(shù)據(jù)的內(nèi)容。
普強智能語音分析系統(tǒng)可以廣泛應用于客服中心的質(zhì)檢和企業(yè)的精準營銷中。該產(chǎn)品提供例如熱點發(fā)現(xiàn),趨勢分析,自動建模等領先的功能。在不斷開發(fā)新技術的同時,也在企業(yè)語音應用的多個領域,(例如保險、銀行、證券及電信等的客服中心、增值服務等)積累了海量的數(shù)據(jù)、模型信息和項目的經(jīng)驗。
目前,普強成熟的產(chǎn)品主要有,千語語音平臺,向企業(yè)提供語音識別產(chǎn)品和服務;千語語音云平臺,為手機互聯(lián)網(wǎng)應用提供的語音識別云服務;普強智能語音分析系統(tǒng),為企業(yè)提供全方位、多維度的大數(shù)據(jù)分析(語音,視頻,文本數(shù)據(jù)等)。