小说阅读网站,盗墓笔记有声小说,欢乐颂小说在线阅读

主頁 > 知識庫 > 詳解HTML5 錄音的踩坑之旅

詳解HTML5 錄音的踩坑之旅

開篇閑扯

前一段時間的一個案子是開發(fā)一個有聲課件，大致就是通過導(dǎo)入文檔、圖片等資源后，頁面變?yōu)轭愃?PPT 的布局，然后選中一張圖片，可以插入音頻，有單頁編輯和全局編輯兩種模式。其中音頻的導(dǎo)入方式有兩種，一種是從資源庫中導(dǎo)入，還有一種就是要提到的錄音。

說實話，一開始都沒接觸過 HTML5 的 Audio API，而且要基于在我們接手前的代碼中進(jìn)行優(yōu)化。當(dāng)然其中也踩了不少坑，這次也會圍繞這幾個坑來說說感受（會省略一些基本對象的初始化和獲取，因為這些內(nèi)容不是這次的重點，有興趣的同學(xué)可以自行查找 MDN 上的文檔）：

調(diào)用 Audio API 的兼容性寫法
獲取錄音聲音的大小（應(yīng)該是頻率）
暫停錄音的兼容性寫法
獲取當(dāng)前錄音時間

錄音前的準(zhǔn)備

開始錄音前，要先獲取當(dāng)前設(shè)備是否支持 Audio API。早期的方法 navigator.getUserMedia 已經(jīng)被 navigator.mediaDevices.getUserMedia 所代替。正常來說現(xiàn)在大部分的現(xiàn)代瀏覽器都已經(jīng)支持 navigator.mediaDevices.getUserMedia 的用法了，當(dāng)然 MDN 上也給出了兼容性的寫法

const promisifiedOldGUM = function(constraints) {
 // First get ahold of getUserMedia, if present
 const getUserMedia =
 navigator.getUserMedia ||
 navigator.webkitGetUserMedia ||
 navigator.mozGetUserMedia;
 
 // Some browsers just don't implement it - return a rejected promise with an error
 // to keep a consistent interface
 if (!getUserMedia) {
 return Promise.reject(
 new Error('getUserMedia is not implemented in this browser')
 );
 }
 
 // Otherwise, wrap the call to the old navigator.getUserMedia with a Promise
 return new Promise(function(resolve, reject) {
 getUserMedia.call(navigator, constraints, resolve, reject);
 });
};
 
// Older browsers might not implement mediaDevices at all, so we set an empty object first
if (navigator.mediaDevices === undefined) {
 navigator.mediaDevices = {};
}
 
// Some browsers partially implement mediaDevices. We can't just assign an object
// with getUserMedia as it would overwrite existing properties.
// Here, we will just add the getUserMedia property if it's missing.
if (navigator.mediaDevices.getUserMedia === undefined) {
 navigator.mediaDevices.getUserMedia = promisifiedOldGUM;
}

因為這個方法是異步的，所以我們可以對無法兼容的設(shè)備進(jìn)行友好的提示

navigator.mediaDevices.getUserMedia(constraints).then(
 function(mediaStream) {
 // 成功
 },
 function(error) {
 // 失敗
 const { name } = error;
 let errorMessage;
 switch (name) {
 // 用戶拒絕
 case 'NotAllowedError':
 case 'PermissionDeniedError':
 errorMessage = '用戶已禁止網(wǎng)頁調(diào)用錄音設(shè)備';
 break;
 // 沒接入錄音設(shè)備
 case 'NotFoundError':
 case 'DevicesNotFoundError':
 errorMessage = '錄音設(shè)備未找到';
 break;
 // 其它錯誤
 case 'NotSupportedError':
 errorMessage = '不支持錄音功能';
 break;
 default:
 errorMessage = '錄音調(diào)用錯誤';
 window.console.log(error);
 }
 return errorMessage;
 }
);

一切順利的話，我們就可以進(jìn)入下一步了。

（這里有對獲取上下文的方法進(jìn)行了省略，因為這不是這次的重點）

開始錄音、暫停錄音

這里有個比較特別的點，就是需要添加一個中間變量來標(biāo)識是否當(dāng)前是否在錄音。因為在火狐瀏覽器上，我們發(fā)現(xiàn)一個問題，錄音的流程都是正常的，但是點擊暫停時卻發(fā)現(xiàn)怎么也暫停不了，我們當(dāng)時是使用 disconnect 方法。這種方式是不行的，這種方法是需要斷開所有的連接才可以。后來發(fā)現(xiàn)，應(yīng)該增加一個中間變量 this.isRecording 來判斷當(dāng)前是否正在錄音，當(dāng)點擊開始時，將其設(shè)置為 true ，暫停時將其設(shè)置為 false 。

當(dāng)我們開始錄音時，會有一個錄音監(jiān)聽的事件 onaudioprocess ，如果返回 true 則會將流寫入，如果返回 false 則不會將其寫入。因此判斷 this.isRecording ，如果為 false 則直接 return

// 一些初始化
const audioContext = new AudioContext();
const sourceNode = audioContext.createMediaStreamSource(mediaStream);
const scriptNode = audioContext.createScriptProcessor(
 BUFFER_SIZE,
 INPUT_CHANNELS_NUM,
 OUPUT_CHANNELS_NUM
);
sourceNode.connect(this.scriptNode);
scriptNode.connect(this.audioContext.destination);
// 監(jiān)聽錄音的過程
scriptNode.onaudioprocess = event => {
 if (!this.isRecording) return; // 判斷是否正則錄音
 this.buffers.push(event.inputBuffer.getChannelData(0)); // 獲取當(dāng)前頻道的數(shù)據(jù)，并寫入數(shù)組
};

當(dāng)然這里也會有個坑，就是無法再使用，自帶獲取當(dāng)前錄音時長的方法了，因為實際上并不是真正的暫停，而是沒有將流寫入罷了。于是我們還需要獲取一下當(dāng)前錄音的時長，需要通過一個公式進(jìn)行獲取

const getDuration = () => {
    return (4096 * this.buffers.length) / this.audioContext.sampleRate // 4096為一個流的長度，sampleRate 為采樣率
}

這樣就能夠獲取正確的錄音時長了。

結(jié)束錄音

結(jié)束錄音的方式，我采用的是先暫停，之后需要試聽或者其它的操作先執(zhí)行，然后再將存儲流的數(shù)組長度置為 0。

獲取頻率

getVoiceSize = analyser => {
 const dataArray = new Uint8Array(analyser.frequencyBinCount);
 analyser.getByteFrequencyData(dataArray);
 const data = dataArray.slice(100, 1000);
 const sum = data.reduce((a, b) => a + b);
 return sum;
};

具體可以參考 https://developer.mozilla.org/zh-CN/docs/Web/API/AnalyserNode/frequencyBinCount

其它

HTTPS：在 chrome 下需要全站有 HTTPS 才允許使用
微信：在微信內(nèi)置的瀏覽器需要調(diào)用 JSSDK 才能使用
音頻格式轉(zhuǎn)換：音頻格式的方式也有很多了，能查到的大部分資料，大家基本上是互相 copy，當(dāng)然還有一個音頻質(zhì)量的問題，這里就不贅述了。

結(jié)語

這次遇到的大部分問題都是兼容性的問題，因此在上面踩了不少坑，尤其是移動端的問題，一開始還有出現(xiàn)因為獲取錄音時長寫法錯誤的問題，導(dǎo)致直接卡死的情況。這次的經(jīng)歷也彌補(bǔ)了 HTML5 API 上的一些空白，當(dāng)然最重要的還是要提醒一下大家，這種原生的 API 文檔還是直接查看 MDN 來的簡單粗暴！

以上就是本文的全部內(nèi)容，希望對大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

標(biāo)簽：十堰咸寧佳木斯酒泉南京淮安廣西西寧

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《詳解HTML5 錄音的踩坑之旅》，本文關(guān)鍵詞詳解,HTML5,錄音,的,踩坑,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。