開篇閑扯
前一段時間的一個案子是開發(fā)一個有聲課件,大致就是通過導(dǎo)入文檔、圖片等資源后,頁面變?yōu)轭愃?PPT 的布局,然后選中一張圖片,可以插入音頻,有單頁編輯和全局編輯兩種模式。其中音頻的導(dǎo)入方式有兩種,一種是從資源庫中導(dǎo)入,還有一種就是要提到的錄音。
說實話,一開始都沒接觸過 HTML5 的 Audio API,而且要基于在我們接手前的代碼中進(jìn)行優(yōu)化。當(dāng)然其中也踩了不少坑,這次也會圍繞這幾個坑來說說感受(會省略一些基本對象的初始化和獲取,因為這些內(nèi)容不是這次的重點,有興趣的同學(xué)可以自行查找 MDN 上的文檔):
- 調(diào)用 Audio API 的兼容性寫法
- 獲取錄音聲音的大小(應(yīng)該是頻率)
- 暫停錄音的兼容性寫法
- 獲取當(dāng)前錄音時間
錄音前的準(zhǔn)備
開始錄音前,要先獲取當(dāng)前設(shè)備是否支持 Audio API。早期的方法 navigator.getUserMedia 已經(jīng)被 navigator.mediaDevices.getUserMedia 所代替。正常來說現(xiàn)在大部分的現(xiàn)代瀏覽器都已經(jīng)支持 navigator.mediaDevices.getUserMedia 的用法了,當(dāng)然 MDN 上也給出了兼容性的寫法
const promisifiedOldGUM = function(constraints) {
// First get ahold of getUserMedia, if present
const getUserMedia =
navigator.getUserMedia ||
navigator.webkitGetUserMedia ||
navigator.mozGetUserMedia;
// Some browsers just don't implement it - return a rejected promise with an error
// to keep a consistent interface
if (!getUserMedia) {
return Promise.reject(
new Error('getUserMedia is not implemented in this browser')
);
}
// Otherwise, wrap the call to the old navigator.getUserMedia with a Promise
return new Promise(function(resolve, reject) {
getUserMedia.call(navigator, constraints, resolve, reject);
});
};
// Older browsers might not implement mediaDevices at all, so we set an empty object first
if (navigator.mediaDevices === undefined) {
navigator.mediaDevices = {};
}
// Some browsers partially implement mediaDevices. We can't just assign an object
// with getUserMedia as it would overwrite existing properties.
// Here, we will just add the getUserMedia property if it's missing.
if (navigator.mediaDevices.getUserMedia === undefined) {
navigator.mediaDevices.getUserMedia = promisifiedOldGUM;
}
因為這個方法是異步的,所以我們可以對無法兼容的設(shè)備進(jìn)行友好的提示
navigator.mediaDevices.getUserMedia(constraints).then(
function(mediaStream) {
// 成功
},
function(error) {
// 失敗
const { name } = error;
let errorMessage;
switch (name) {
// 用戶拒絕
case 'NotAllowedError':
case 'PermissionDeniedError':
errorMessage = '用戶已禁止網(wǎng)頁調(diào)用錄音設(shè)備';
break;
// 沒接入錄音設(shè)備
case 'NotFoundError':
case 'DevicesNotFoundError':
errorMessage = '錄音設(shè)備未找到';
break;
// 其它錯誤
case 'NotSupportedError':
errorMessage = '不支持錄音功能';
break;
default:
errorMessage = '錄音調(diào)用錯誤';
window.console.log(error);
}
return errorMessage;
}
);
一切順利的話,我們就可以進(jìn)入下一步了。
(這里有對獲取上下文的方法進(jìn)行了省略,因為這不是這次的重點)
開始錄音、暫停錄音
這里有個比較特別的點,就是需要添加一個中間變量來標(biāo)識是否當(dāng)前是否在錄音。因為在火狐瀏覽器上,我們發(fā)現(xiàn)一個問題,錄音的流程都是正常的,但是點擊暫停時卻發(fā)現(xiàn)怎么也暫停不了,我們當(dāng)時是使用 disconnect 方法。這種方式是不行的,這種方法是需要斷開所有的連接才可以。后來發(fā)現(xiàn),應(yīng)該增加一個中間變量 this.isRecording 來判斷當(dāng)前是否正在錄音,當(dāng)點擊開始時,將其設(shè)置為 true ,暫停時將其設(shè)置為 false 。
當(dāng)我們開始錄音時,會有一個錄音監(jiān)聽的事件 onaudioprocess ,如果返回 true 則會將流寫入,如果返回 false 則不會將其寫入。因此判斷 this.isRecording ,如果為 false 則直接 return
// 一些初始化
const audioContext = new AudioContext();
const sourceNode = audioContext.createMediaStreamSource(mediaStream);
const scriptNode = audioContext.createScriptProcessor(
BUFFER_SIZE,
INPUT_CHANNELS_NUM,
OUPUT_CHANNELS_NUM
);
sourceNode.connect(this.scriptNode);
scriptNode.connect(this.audioContext.destination);
// 監(jiān)聽錄音的過程
scriptNode.onaudioprocess = event => {
if (!this.isRecording) return; // 判斷是否正則錄音
this.buffers.push(event.inputBuffer.getChannelData(0)); // 獲取當(dāng)前頻道的數(shù)據(jù),并寫入數(shù)組
};
當(dāng)然這里也會有個坑,就是無法再使用,自帶獲取當(dāng)前錄音時長的方法了,因為實際上并不是真正的暫停,而是沒有將流寫入罷了。于是我們還需要獲取一下當(dāng)前錄音的時長,需要通過一個公式進(jìn)行獲取
const getDuration = () => {
return (4096 * this.buffers.length) / this.audioContext.sampleRate // 4096為一個流的長度,sampleRate 為采樣率
}
這樣就能夠獲取正確的錄音時長了。
結(jié)束錄音
結(jié)束錄音的方式,我采用的是先暫停,之后需要試聽或者其它的操作先執(zhí)行,然后再將存儲流的數(shù)組長度置為 0。
獲取頻率
getVoiceSize = analyser => {
const dataArray = new Uint8Array(analyser.frequencyBinCount);
analyser.getByteFrequencyData(dataArray);
const data = dataArray.slice(100, 1000);
const sum = data.reduce((a, b) => a + b);
return sum;
};
具體可以參考 https://developer.mozilla.org/zh-CN/docs/Web/API/AnalyserNode/frequencyBinCount
其它
- HTTPS:在 chrome 下需要全站有 HTTPS 才允許使用
- 微信:在微信內(nèi)置的瀏覽器需要調(diào)用 JSSDK 才能使用
- 音頻格式轉(zhuǎn)換:音頻格式的方式也有很多了,能查到的大部分資料,大家基本上是互相 copy,當(dāng)然還有一個音頻質(zhì)量的問題,這里就不贅述了。
結(jié)語
這次遇到的大部分問題都是兼容性的問題,因此在上面踩了不少坑,尤其是移動端的問題,一開始還有出現(xiàn)因為獲取錄音時長寫法錯誤的問題,導(dǎo)致直接卡死的情況。這次的經(jīng)歷也彌補(bǔ)了 HTML5 API 上的一些空白,當(dāng)然最重要的還是要提醒一下大家,這種原生的 API 文檔還是直接查看 MDN 來的簡單粗暴!
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。