作者簡介
本文作者為攜程基礎業(yè)務研發(fā)部呼叫中心團隊,其在傳統(tǒng)呼叫中心基礎上,結合軟交換、智能分配、自動語音語義處理等技術,為攜程用戶提供人性化、人機互動、便捷的電話語音服務。
一、前言
智能手機早已成為日常生活中不可或缺的一部分,隨著移動互聯(lián)網(wǎng)的快速發(fā)展,人們的生活習慣與工作方式也在不斷發(fā)生改變。從移動通信、移動支付,再到移動辦公,“移動化”已滲透至各行各業(yè),并逐步成為企業(yè)業(yè)務發(fā)展的趨勢。
攜程呼叫中心研發(fā)團隊根據(jù)業(yè)務的需求,研發(fā)完成了一套完整的呼叫中心移動坐席解決方案,使業(yè)務坐席不再受制于工作時間、辦公地點,隨時隨地,有網(wǎng)絡的地方,就有呼叫中心。
二、移動辦公呼叫中心系統(tǒng)架構
移動場景保留了典型的呼叫中心系統(tǒng)架構,在接入端加入 SBC,用于移動呼叫中心語音接入和安全控制。坐席無論身在何處,只需要一臺電腦、智能手機或智能設備,通過 Wifi、3G 或 4G 網(wǎng)絡登錄坐席 App,即可開啟日常工作。
三、移動場景下面臨的挑戰(zhàn)
目前國內(nèi)企業(yè)的 Intranet 基本為 100M,而自有機房的核心網(wǎng)絡可達到 1000M 甚至雙 1000M。因為物理網(wǎng)絡有著高度可靠的帶寬、網(wǎng)絡質量與穩(wěn)定性,用戶基本無需顧慮帶寬、延時、網(wǎng)絡抖動等情況。
而相較于物理網(wǎng)絡,移動環(huán)境普遍存在著穩(wěn)定性差、帶寬波動劇烈、信號覆蓋不均衡導致網(wǎng)絡頻繁切換等多個問題,加之外部環(huán)境的復雜性與多樣性,通話延遲、卡頓、中斷、回聲與噪聲等問題難以避免,克服這些問題便成為了呼叫中心移動化所面臨的巨大挑戰(zhàn)與難點。
四、攜程呼叫中心移動坐席解決方案
攜程呼叫中心通過優(yōu)化標準的 SIP 協(xié)議,減少坐席應用與后端服務的交互;深度定制音頻編解碼器,在提高音質的同時降低了數(shù)據(jù)流量;通過丟包補償技術來提升弱網(wǎng)環(huán)境下的通話質量。
基于優(yōu)化后的 SIP 協(xié)議開發(fā)標準的 SDK,應用層可快速實現(xiàn)電話相關的功能,將原來基于電腦或 IP 電話的 IP-Talk 的方式移植到移動智能終端,突破傳統(tǒng)的空間限制,實現(xiàn)了完全開放的自由移動。
1、CCodec
音頻編解碼器,通俗理解就是把自然界的聲音采集,轉換成數(shù)字信號,再采用相應的壓縮技術,對得到的數(shù)字信號進行壓縮,即可形成常見的音頻文件,如 wav、mp3、aac 等。
而音頻的數(shù)字化采集與處理,理論上無法實現(xiàn)完全與自然發(fā)音相同,只是盡可能優(yōu)化算法,使其最大化接近原始發(fā)音。同等條件下,音頻質量主要取決于以下技術指標:
經(jīng)過相關的編碼、壓縮算法的處理,音質越高所產(chǎn)生的音頻流越大,傳輸所需要的帶寬也越高,與之相對應的,耗費的流量也同比上漲。
移動場景下,音頻編碼及相關的壓縮算法需要在提高音質保證用戶體驗的同時,盡可能降低傳輸帶寬和存儲空間。如果音頻編解碼能支持動態(tài)碼率,便能為用戶帶來更好的通話體驗。所謂動態(tài)碼率支持,即:
攜程呼叫中心研發(fā)團隊通過研究最近的音頻編解碼技術和相關壓縮算法,研發(fā)完成了一套有損音頻編碼器——CCodec。
CCodec 是基于開源音頻編解碼算法研發(fā)的有損音頻編解碼器,不僅可以支持動態(tài)調(diào)整比特率、音頻帶寬和幀大小,同時能在編碼的過程中根據(jù)音頻數(shù)據(jù)的復雜程序即時確定使用的比特率,在保證質量的前提下兼顧編碼后產(chǎn)生文件的大小,即 VBR(Variable Bit Rate)。在保證音頻質量的同時,大大降低了數(shù)據(jù)流量,尤其適合互聯(lián)網(wǎng)上的語音實時交互和音樂傳輸。
CCodec 可用于較多類型的音頻應用,如 VoIP、視頻會議、游戲內(nèi)的語音聊天、基于實時的音樂會直播等。其主要有以下特性:
經(jīng)過實驗對比,除以上技術功能的支持外,它也具有良好的低算法延遲,非常適合實時通訊類的應用。在平衡音質和比特率的情況下,算法延遲可進一步降低到 5ms。
質量比特率對比
從比特率與質量的對比曲線中可以看出,CCodec 編解碼不僅在低比特時對音頻的保真超越了 iLBC、AMR-NB、Speex、AMR-WB,在高比特率的情況下,音質依然越超眾多現(xiàn)有的編解碼。
在移動弱網(wǎng)場景下,可以設置 CCodec 比特率為16-32,優(yōu)先滿足通話功能,進行有效溝通。而當網(wǎng)絡狀態(tài)良好的情況下,可以使用32以上的比特率,以適應傳輸更高品質的音樂等豐富的音頻數(shù)據(jù)流。
比特率遲時對比
呼叫中心系統(tǒng)多用于處理用戶的電話咨詢或售后服務,屬于實時通信系統(tǒng)。在實時通信系統(tǒng)中,音頻的延時對雙方的溝通體驗會造成巨大影響,而延時也是實時通訊系統(tǒng)中極為重要的標準。因此,音頻算法的延時顯得尤為重要。
CCodec 編解碼器算法延時小的特性,非常適合應用于攜程電話、VoIP 或視頻會議等應用場景。
2、CSIP
SIP 是由 IETF 制定的多媒體通信協(xié)議,它是一個基于文本的應用層控制協(xié)議,用于創(chuàng)建、修改和釋放一個或多個參與者的會話,廣泛應用于 CS(Circuit Switched,電路交換),NGN(Next Generation Network,下一代網(wǎng)絡)以及 IMS(IP Multimedia Subsystem,IP 多媒體子系統(tǒng))的網(wǎng)絡中,可支持并應用于語音、視頻、數(shù)據(jù)等多媒體業(yè)務。
而 CSIP 是一個基于 SIP、SDP、RTP、STUN 等協(xié)議而實現(xiàn)的通信庫,可以支持音頻、視頻及短消息的傳輸。為適應移動網(wǎng)絡的抖動、時延,CSIP 實現(xiàn)時加入了以下特性:
-
集成 CCodec 音頻編解碼,抗30%網(wǎng)絡丟包,支持 250ms 網(wǎng)絡遲延。在弱網(wǎng)情況下,提升通話體驗
-
網(wǎng)絡狀態(tài)監(jiān)控,動態(tài)調(diào)整比特率,保障移動網(wǎng)絡下的穩(wěn)定運行
-
斷開自動恢復功能
-
優(yōu)化回聲消除、語音降噪的處理,提升聽覺體驗
3、Ctrip PhoneSDK 便捷接入
CSIP 功能強大且靈活,但由于是基于 C 語言開發(fā),接口及使用方式對于移動開發(fā)來說,比較復雜且不宜使用。PhoneSDK 在 CSIP 的基礎上進行了邏輯封裝,提供簡單且易于使用的接口 API。
考慮到呼叫中心的特殊場景,在 PhoneSDK 的基礎上,團隊進一步擴展了與坐席相關的功能,實現(xiàn)了坐席的登錄、狀態(tài)改變等相關功能,進一步降低了坐席類應用的開發(fā)成本。
PhoneSDK 可快速實現(xiàn)以下網(wǎng)絡電話相關的功能:
-
呼出/應答
-
掛起
-
轉移
-
靜音
-
多人會話
-
會議
-
網(wǎng)絡狀態(tài)監(jiān)測
-
IPv6
-
WebSocket
-
P2P
-
TCP/SSL/UDP
-
噪聲消除
-
回聲抑制
-
丟包補償
-
抗網(wǎng)絡抖動
-
動態(tài)碼率調(diào)整
流量對比
為了使用 PhoneSDK 適應移動場景下的音頻傳輸,在音頻壓縮方面采用了有損壓縮算法,在保證音質的前提下,大大降低了編碼后的音頻大小。在相同的網(wǎng)絡環(huán)境下,使用相同的設備進行測試,在使用 CCodec 48KHz 采樣率的情況下,編碼的音頻僅為微信的1/2,是傳統(tǒng) G711/PCMu 的1/3左右。
五、案例—— “十一貝”呼叫中心私有云
北京十一貝技術有限公司,主要側重于保險營銷業(yè)務,提供去哪兒等用戶群不同類型的保險產(chǎn)品。根據(jù)其業(yè)務特性及具體需求,以移動 App 為主題,利用 PhoneSDK 快速研發(fā)了一套坐席 App,提供十一貝業(yè)務人員使用。