濮阳杆衣贸易有限公司

主頁 > 知識庫 > 鮮為人知的HTML5語音合成功能

鮮為人知的HTML5語音合成功能

熱門標簽:高德地圖標注錯誤怎么修改 江蘇高頻外呼系統(tǒng)線路 平頂山電子地圖標注怎么修改 標準智能外呼系統(tǒng) 搜狗星級酒店地圖標注 地圖標注自己去過的地方 會聲會影怎樣做地圖標注效果 洛陽市伊川縣地圖標注中心官網(wǎng) 電銷機器人視頻

聽一下就會發(fā)現(xiàn),播放出來的聲音并不是預(yù)先錄制好的音頻資料,而是通過文字識別后合成的語音

請先戴上耳機,然后將下面的代碼復(fù)制到chrome控制臺中體驗~

let msg = new SpeechSynthesisUtterance("歡迎你閱讀我的博客");
window.speechSynthesis.speak(msg);

看,前端實現(xiàn)語音合成并不難

今天的主角 Speech Synthesis API

通過上面的例子我們可以猜測到上面調(diào)用的兩個方法的功能

SpeechSyntehesisUtteranc
window.speechSynthesis.speak

當然了,語音合成不僅僅包含這兩個API,but我們先從這兩點入手

SpeechSyntehesisUtteranc

參考:developer.mozilla.org/en-US/docs/… SpeechSyntehesisUtteranc 對象包含了語音服務(wù)要讀取的內(nèi)容和一些參數(shù),比如語言,音高和音量

SpeechSyntehesisUtteranc()
SpeechSynthesisUtterance.lang
SpeechSynthesisUtterance.pitch
SpeechSynthesisUtterance.rate
SpeechSynthesisUtterance.voice
SpeechSynthesisUtterance.volume

注意:以上屬性都是 可讀寫 的! 可以把下面這段代碼copy下來嘗試一下,注釋中會有說明

let msg = new SpeechSynthesisUtterance();
msg.text = "how are you" // 要合成的文本
msg.lang = "en-US" // 美式英語發(fā)音(默認自動選擇)
msg.rate = 2  // 二倍速(默認為 1,范圍 0.1~10)
msg.pitch = 2 // 高音調(diào)(數(shù)字越大越尖銳,默認為 1,范圍 0~2 )
msg.volume = 0.5 // 音量 0.5 倍(默認為1,范圍 0~1)
window.speechSynthesis.speak(msg);

同時這個對象還可以響應(yīng)一系列事件,可能會用到的:

  • start
  • end
  • boundary
  • pause
  • resume

借助這些事件我們可以完成一些簡單的功能,比如英文句子的單詞數(shù)量統(tǒng)計:

let count = 0; // 詞語數(shù)量
let msg = new SpeechSynthesisUtterance();
let synth = window.speechSynthesis;
msg.addEventListener('start',()=>{
    // 開始閱讀
    console.log(`文本內(nèi)容: ${msg.text}`);
    console.log("start");
});
msg.addEventListener('end',()=>{
    // 閱讀結(jié)束
    console.log("end");
    console.log(`文本單詞(詞語)數(shù)量:${count}`);
    count = 0;
});
msg.addEventListener('boundary',()=>{
    // 統(tǒng)計單詞
    count++;
});

經(jīng)過嘗試,由于中文沒有用空格將每個詞語分開,所以會進行自動的識別,比如 歡迎讀者 會被識別為 歡迎 和 讀者 兩個詞語

SpeechSynthesis

參考: developer.mozilla.org/en-US/docs/…

說完了 SpeechSyntehesisUtteranc 我們再來看看 SpeechSynthesis

SpeechSynthesis 的主要作用是對語音進行一系列的控制,比如開始或者暫停

它有三個只讀屬性,表明了語音的狀態(tài):

SpeechSynthesis.paused
SpeechSynthesis.pending

同時還有一系列方法用來操作語音:

•SpeechSynthesis.speak() 開始讀語音,同時觸發(fā) start 事件
•SpeechSynthesis.pause() 暫停,同時觸發(fā) pause 事件
•SpeechSynthesis.resume() 繼續(xù),同時觸發(fā) resume 事件
•SpeechSynthesis.cancel() 取消閱讀,同時觸發(fā) end 事件

基于這些操作方法,我們可以進一步增強我們的文字閱讀器:

回到最初的起點

讓我們回到最初的起點,我們可以基于上面的內(nèi)容猜測一下有些網(wǎng)站中,文章的自動閱讀是怎么實現(xiàn)的

如果這個網(wǎng)站前端采用了 MVVM 框架(以 Vue 為例),那么文章內(nèi)容是也許存儲在 data 中,可以用來構(gòu)造我們需要的語音合成

當然,也有可能文章是通過 ajax 請求得到的,解析請求的數(shù)據(jù),構(gòu)造語音合成對象

如果文章是直接在 html 中寫死的,這個時候就需要對 DOM 進行解析,經(jīng)過測試,即便是下面這樣的混亂的結(jié)構(gòu)

<div id="test">
    <p>1</p>
    <p>2</p>
    <ul>
        <li>3</li>
        <li>4</li>
    </ul>
    <table>
        <tr>
            <td>5</td>
            <td>6</td>
        </tr>
        <tr>
            <td>7</td>
            <td>8</td>
        </tr>
    </table>
    <img src="https://www.baidu.com/img/bd_logo1.png" alt="">
    9
</div>

直接通過 innerText 讀取其中的文本,然后構(gòu)造語音合成對象,也能按照期望順序閱讀(圖片會被忽略)

當然如果我們想要忽略一些特殊的結(jié)構(gòu),比如表格,我們可以花一些精力在解析上,把我們不想要的數(shù)據(jù)或者 DOM 元素篩掉

不管怎樣,我們都能找到合適的解決方案~

閑話

這個特性,是一個還在草案中的特性,沒有被廣泛支持

再次強調(diào),這個 API 暫時還不能應(yīng)用到生產(chǎn)環(huán)境中

目前比較通用的做法是在后端構(gòu)造將文本合成成語音文件的 API(也許是第三方 API),然后在前端作為媒體播放

曾經(jīng)在我迷茫的時候,我去閱讀一些大牛的文章,讀到一些前輩對前端開發(fā)的思考。其中有一點令我印象深刻:

前端是最貼近用戶的,一切要從用戶的的角度考慮,無障礙使用也是一個很重要的課題。雖然做這樣的功能帶來的收益遠遠小于其他業(yè)務(wù),但是為了讓產(chǎn)品更好的服務(wù)用戶,多付出一些勞動也是值得的,這也是前端開發(fā)的一種精神
 

總結(jié)

以上所述是小編給大家介紹的鮮為人知的HTML5語音合成功能,希望對大家有所幫助,如果大家有任何疑問歡迎給我留言,小編會及時回復(fù)大家的!

標簽:松原 蚌埠 廣西 鄂爾多斯 常德 阿克蘇 果洛 廣東

巨人網(wǎng)絡(luò)通訊聲明:本文標題《鮮為人知的HTML5語音合成功能》,本文關(guān)鍵詞  鮮為人知,的,HTML5,語音,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《鮮為人知的HTML5語音合成功能》相關(guān)的同類信息!
  • 本頁收集關(guān)于鮮為人知的HTML5語音合成功能的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    云和县| 汨罗市| 高密市| 子洲县| 疏附县| 五原县| 民勤县| 登封市| 大化| 子洲县| 永川市| 龙江县| 德保县| 泊头市| 黄平县| 建瓯市| 伊通| 万全县| 沛县| 定南县| 白玉县| 云龙县| 陕西省| 武强县| 扎鲁特旗| 南靖县| 灌南县| 庆元县| 永泰县| 弋阳县| 固阳县| 泽普县| 曲松县| 台江县| 天镇县| 阳春市| 临安市| 永寿县| 罗平县| 乌鲁木齐县| 留坝县|