數(shù)字經(jīng)濟(jì)時代,消費者需求和企業(yè)運營模式加速向線上傾斜,智能化場景愈加多元和深入。語音識別作為人機(jī)交互最簡單直接的入口,迎來高速發(fā)展期,并逐步由單項技術(shù)發(fā)展向融合發(fā)展模式過度,場景需求更加多元。
捷通華聲作為國內(nèi)最早期從事人工智能技術(shù)研發(fā)和產(chǎn)業(yè)化應(yīng)用的企業(yè),在成立之初便確定“融合技術(shù)、融合應(yīng)用、融合服務(wù)”發(fā)展理念,本著對核心技術(shù)孜孜不倦的探索精神和務(wù)實推進(jìn)的原則,在保持技術(shù)先進(jìn)性的同時,不斷創(chuàng)新場景應(yīng)用。
基于識別算法、解碼器核心、先進(jìn)的聲學(xué)模型和語言模型訓(xùn)練方法,捷通華聲自主研發(fā)的語音識別技術(shù)在大詞匯量連續(xù)識別、文本后處理、模型的擬合能力和魯棒性等方面均保持行業(yè)領(lǐng)先。
考慮到不同地域、不同場景下的需求,靈云語音識別技術(shù)不斷加強(qiáng)對多語言識別能力的研發(fā),并通過靈云開放平臺向全行業(yè)賦能。除普通話,靈云語音識別已支持四川話、上海話、閩南話、粵語等多種方言,維、哈、藏、朝、蒙、彝、壯等少數(shù)民族語言,英、法、日、韓、德、西、阿等多語種識別,更多語言也在陸續(xù)開放過程中。
在政企會議、高峰論壇、研討會等場景,靈云語音識別技術(shù)可以準(zhǔn)確識別發(fā)言人所說內(nèi)容,進(jìn)行實時轉(zhuǎn)寫并以字幕、投屏的形式實時呈現(xiàn),在會后快速生成會議紀(jì)要,豐富會議形式,提升會議效率。
在公檢法審訊、問訊等場景,使用基于語音識別技術(shù)研發(fā)的靈云智錄問詢系統(tǒng),可以自動區(qū)分發(fā)言人角色,在被問詢?nèi)苏f方言或其他語種情況下,也能夠準(zhǔn)確識別,快速生成審訊記錄。
市場需求不斷演變,捷通華聲緊跟市場步伐,針對各行業(yè)場景對智能語音識別技術(shù)進(jìn)行更迭,以滿足市場需求。捷通華聲將始終堅持“賦能百業(yè)共享AI未來”發(fā)展愿景,不斷輸出行業(yè)領(lǐng)先的人工智能技術(shù),讓每一個人都能享受到人工智能帶來的輕松與便捷。