一種錄制音頻的方法及裝置制造方法
【專利摘要】本申請公開了一種錄制音頻的方法及裝置,所述方法包括:進行音頻錄制,得到原始錄音數(shù)據(jù);獲取原始錄音數(shù)據(jù),對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,得到中間錄音數(shù)據(jù),并獲取伴音數(shù)據(jù);將所述中間錄音數(shù)據(jù)與獲取的伴音數(shù)據(jù)進行混音,得到目標(biāo)音頻數(shù)據(jù)。本申請對原始錄音數(shù)據(jù)進行聲道數(shù)量調(diào)整,再將聲道數(shù)量調(diào)整后的錄音數(shù)據(jù)與伴音數(shù)據(jù)進行混音,從而得到目標(biāo)音頻數(shù)據(jù),能夠解決很多智能手機無法錄制多聲道音頻的問題,并且能夠大幅提高獲得的音頻數(shù)據(jù)的品質(zhì),而且能夠避免發(fā)生想要錄制的聲音與伴音分離在不同聲道的問題。
【專利說明】一種錄制音頻的方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及音頻處理【技術(shù)領(lǐng)域】,尤其涉及一種錄制音頻的方法及裝置。
【背景技術(shù)】
[0002] 目前生產(chǎn)智能手機的廠商眾多,眾多的手機廠商生產(chǎn)了型號和性能相差較大且種 類繁多的手機。當(dāng)需要在智能手機上實現(xiàn)錄放多聲道的音頻(如雙聲道音頻)時,有很多 智能手機無法錄制多聲道音頻或者錄制的音頻存在音樂與人聲分離在不同聲道的問題。
[0003] 例如,在移動平臺上實現(xiàn)卡拉0K功能時,實現(xiàn)該功能的最基本條件就是錄制多聲 道音頻(如雙聲道音頻),得到用戶需要的卡拉0K文件(如mp3)。在現(xiàn)有的移動平臺上實 現(xiàn)錄制多聲道音頻時發(fā)現(xiàn),有些智能手機直接錄制(即調(diào)用操作系統(tǒng)的API來錄制多聲道 音頻)的多聲道音頻存在沒有聲音,錄制的雙聲道聲音效果不佳等問題。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明要解決的技術(shù)問題是提供一種錄制音頻的方法及裝置,能夠錄制出高品質(zhì) 的音頻,避免想要錄制的聲音與伴音分離在不同聲道的問題。
[0005] 為解決上述技術(shù)問題,本發(fā)明的一種錄制音頻的方法,包括:
[0006] 進行音頻錄制,得到原始錄音數(shù)據(jù);
[0007] 獲取原始錄音數(shù)據(jù),對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,得到中間錄音數(shù)據(jù),并 獲取伴音數(shù)據(jù);
[0008] 將所述中間錄音數(shù)據(jù)與獲取的伴音數(shù)據(jù)進行混音,得到目標(biāo)音頻數(shù)據(jù)。
[0009] 進一步地,所述對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,包括:
[0010] 所述原始錄音數(shù)據(jù)為單聲道,如果將單聲道調(diào)整為m(m>l)聲道,則以幀為單位, 輪循原始錄音數(shù)據(jù)的每個幀中的采樣點,將原始錄音數(shù)據(jù)的采樣點在中間錄音數(shù)據(jù)的相應(yīng) 幀中連續(xù)賦值m個采樣點,輪循原始錄音數(shù)據(jù)的每個幀后得到m聲道的中間錄音數(shù)據(jù)。 [0011] 進一步地,所述對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,包括:
[0012] 所述原始錄音數(shù)據(jù)為n(n>l)聲道,如果將n聲道調(diào)整為q(q>l) *n聲道,則以幀為 單位,輪循原始錄音數(shù)據(jù)的每個幀中的采樣組,所述采樣組中包含與聲道數(shù)量相同的采樣 點,每個采樣點與一個聲道對應(yīng),將原始錄音數(shù)據(jù)的采樣組賦值給中間錄音數(shù)據(jù)的相應(yīng)幀 的連續(xù)q個采樣組,輪循原始錄音數(shù)據(jù)的每個幀后得到q*n聲道的中間錄音數(shù)據(jù)。
[0013] 進一步地,所述對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,包括:
[0014] 所述原始錄音數(shù)據(jù)為1(1>1)聲道,如果將1聲道調(diào)整為P(P>1)聲道,其中,P與1 為非整數(shù)倍關(guān)系,則以幀為單位,輪循原始錄音數(shù)據(jù)的每個幀中的采樣組,所述采樣組中包 含與聲道數(shù)量相同的采樣點,每個采樣點與一個聲道對應(yīng),對原始錄音數(shù)據(jù)的采樣組中包 含的與聲道數(shù)量相同的采樣點取平均值,將得到的平均值在中間錄音數(shù)據(jù)的相應(yīng)幀中連續(xù) 賦值P個采樣點,輪循原始錄音數(shù)據(jù)的每個幀后得到P聲道的中間錄音數(shù)據(jù)。
[0015] 進一步地,所述伴音數(shù)據(jù)與所述中間錄音數(shù)據(jù)的聲道數(shù)量相同。
[0016] 進一步地,在進行音頻錄制的過程中,如果錄音設(shè)備同時播放伴音,則消除所錄制 的音頻數(shù)據(jù)中的錄音設(shè)備所播放的伴音,將消除伴音的音頻數(shù)據(jù)作為所述原始錄音數(shù)據(jù)。
[0017] 進一步地,所述方法還包括:
[0018] 在對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,得到中間錄音數(shù)據(jù)后,對所述中間錄音 數(shù)據(jù)進行音量調(diào)整;以及在獲取伴音數(shù)據(jù)后,對所述伴音數(shù)據(jù)進行音量調(diào)整,所述音量調(diào)整 包括將數(shù)據(jù)中的每個采樣點與音量百分比相乘。
[0019] 進一步地,一種錄制音頻的裝置,包括:錄音單元、聲道調(diào)整單元、伴音數(shù)據(jù)獲取單 元和混音單元,其中:
[0020] 所述錄音單元,用于進行音頻錄制,得到原始錄音數(shù)據(jù);
[0021] 所述聲道調(diào)整單元,用于獲取原始錄音數(shù)據(jù),對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù) 量,得到中間錄音數(shù)據(jù);
[0022] 所述伴音數(shù)據(jù)獲取單元,用于獲取伴音數(shù)據(jù);
[0023] 所述混音單元,用于將所述中間錄音數(shù)據(jù)與獲取的伴音數(shù)據(jù)進行混音,得到目標(biāo) 音頻數(shù)據(jù)。
[0024] 進一步地,所述聲道調(diào)整單元對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,包括:
[0025] 所述原始錄音數(shù)據(jù)為單聲道,如果將單聲道調(diào)整為m(m>l)聲道,則以幀為單位, 輪循原始錄音數(shù)據(jù)的每個幀中的采樣點,將原始錄音數(shù)據(jù)的采樣點在中間錄音數(shù)據(jù)的相應(yīng) 幀中連續(xù)賦值m個采樣點,輪循原始錄音數(shù)據(jù)的每個幀后得到m聲道的中間錄音數(shù)據(jù);或 者,
[0026] 所述原始錄音數(shù)據(jù)為n (n>l)聲道,如果將n聲道調(diào)整為q (q>l) *n聲道,則以幀為 單位,輪循原始錄音數(shù)據(jù)的每個幀中的采樣組,所述采樣組中包含與聲道數(shù)量相同的采樣 點,每個采樣點與一個聲道對應(yīng),將原始錄音數(shù)據(jù)的采樣組賦值給中間錄音數(shù)據(jù)的相應(yīng)幀 的連續(xù)q個采樣組,輪循原始錄音數(shù)據(jù)的每個幀后得到q*n聲道的中間錄音數(shù)據(jù);或者,
[0027]所述原始錄音數(shù)據(jù)為1(1>1)聲道,如果將1聲道調(diào)整為p(p>l)聲道,其中,p與1 為非整數(shù)倍關(guān)系,則以幀為單位,輪循原始錄音數(shù)據(jù)的每個幀中的采樣組,所述采樣組中包 含與聲道數(shù)量相同的采樣點,每個采樣點與一個聲道對應(yīng),對原始錄音數(shù)據(jù)的采樣組中包 含的與聲道數(shù)量相同的采樣點取平均值,將得到的平均值在中間錄音數(shù)據(jù)的相應(yīng)幀中連續(xù) 賦值P個采樣點,輪循原始錄音數(shù)據(jù)的每個幀后得到P聲道的中間錄音數(shù)據(jù)。
[0028] 進一步地,所述伴音數(shù)據(jù)與所述中間錄音數(shù)據(jù)的聲道數(shù)量相同。
[0029] 綜上所述,本申請對原始錄音數(shù)據(jù)進行聲道數(shù)量調(diào)整,再將聲道數(shù)量調(diào)整后的錄 音數(shù)據(jù)與伴音數(shù)據(jù)進行混音,從而得到目標(biāo)音頻數(shù)據(jù),能夠解決很多智能手機無法錄制多 聲道音頻的問題,并且能夠大幅提高獲得的音頻數(shù)據(jù)的品質(zhì),而且能夠避免發(fā)生想要錄制 的聲音與伴音分離在不同聲道的問題。
【專利附圖】
【附圖說明】
[0030] 圖1為本申請的錄制音頻的方法的流程圖;
[0031] 圖2為本申請的錄制音頻的裝置的架構(gòu)圖。
【具體實施方式】
[0032] 下文中將參考附圖并結(jié)合實施例來詳細說明本發(fā)明。需要說明的是,在不沖突的 情況下,本申請中的實施例及實施例中的特征可以相互組合。
[0033] 如圖1所示,本申請的錄制音頻的方法,包括:
[0034] 步驟101 :進行音頻錄制,得到原始錄音數(shù)據(jù);
[0035]本申請中根據(jù)用戶的操作啟動音頻錄制。原始錄音數(shù)據(jù)保存在操作系統(tǒng)的錄音緩 沖區(qū)中。
[0036] 在進行音頻錄制的過程中,如果錄音設(shè)備沒有同時播放伴音,實際錄制的聲音就 是用戶想要錄制的聲音,則將所錄制的音頻數(shù)據(jù)作為原始錄音數(shù)據(jù);在進行音頻錄制的過 程中,如果錄音設(shè)備同時播放伴音,則需要消除所錄制的音頻數(shù)據(jù)中的錄音設(shè)備所播放的 伴音,將消除伴音的音頻數(shù)據(jù)作為原始錄音數(shù)據(jù)。本申請中可以通過回聲消除的方式消除 掉所錄制的音頻數(shù)據(jù)中的錄音設(shè)備所播放的伴音。
[0037] 本申請中在進行音頻錄制的過程中還可以同時進行噪聲抑制。
[0038] 步驟102 :獲取原始錄音數(shù)據(jù),對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,得到中間錄 音數(shù)據(jù),并獲取伴音數(shù)據(jù);
[0039] 本申請中為了更快的實現(xiàn)錄制音頻,單獨開辟了一個混音線程,即在錄制音頻的 時候就已經(jīng)開始進行混音和編碼,這樣錄音完成的時候基本上混音和編碼也一起完成了。 混音線程獲取原始錄音數(shù)據(jù),并會不停的從保存伴音數(shù)據(jù)的伴音緩存(musicBuffer)中獲 取伴音數(shù)據(jù)。
[0040] 為了提高混音的效率,本申請中創(chuàng)建錄音線程負責(zé)從操作系統(tǒng)的錄音緩沖區(qū)中讀 取原始錄音數(shù)據(jù),然后將原始錄音數(shù)據(jù)回調(diào)到音頻管理器,音頻管理器將原始錄音數(shù)據(jù)寫 入到記錄緩存(recordBuffer)中。recordBuffer采用自增的buffer,即默認開辟1024個 字節(jié)的空間,如果存儲空間足再開辟1024個字節(jié),依次自增。
[0041] 本申請中的混音線程是從recordBuffer中獲取原始錄音數(shù)據(jù)。由于錄音線程和 混音線程均需要訪問recordBuffer,因此訪問的時候需要加鎖。
[0042] 本申請中對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,包括:
[0043] 原始錄音數(shù)據(jù)為單聲道,如果將單聲道調(diào)整為m(m>l)聲道,則以幀為單位,輪循 原始錄音數(shù)據(jù)的每個幀中的采樣點,將原始錄音數(shù)據(jù)的采樣點在中間錄音數(shù)據(jù)的相應(yīng)幀中 連續(xù)賦值m個采樣點,輪循原始錄音數(shù)據(jù)的每個幀后得到m聲道的中間錄音數(shù)據(jù)。
[0044] 幀是音頻的傳遞單位。采樣率是錄音設(shè)備在一秒鐘內(nèi)對聲音信號的采樣次數(shù),采 樣頻率越高聲音的還原就越真實越自然。目前通常采用的采樣率為16K、32K和44K等。采 樣字節(jié)是一個采樣點所占用的字節(jié)數(shù),一般采用兩個字節(jié)來存儲一個采樣點。
[0045] 例如,以米樣率為32K為例,設(shè)置一巾貞的米樣點的數(shù)量為1280,那么對于雙聲道 1280/2/32 = 20ms,即一幀的時長為20ms,在播放音頻的時候需要將音頻數(shù)據(jù)一幀一幀的 輸入到設(shè)備。
[0046] 下面以將單聲道轉(zhuǎn)換成雙聲道為例對本申請進行說明。
[0047] 錄制的單聲道的原始錄音數(shù)據(jù)調(diào)整為雙聲道時,在每一幀的數(shù)據(jù)中需要左右聲道 的米樣點各一半(即左右聲道各640個米樣),且間隔排列。
[0048] 假設(shè)錄制的單聲道聲音為640個采樣點一幀,640/32/1 = 20ms,下表1為單聲道 的數(shù)據(jù)模型。
[0049]表 1
【權(quán)利要求】
1. 一種錄制音頻的方法,其特征在于,包括: 進行音頻錄制,得到原始錄音數(shù)據(jù); 獲取原始錄音數(shù)據(jù),對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,得到中間錄音數(shù)據(jù),并獲取 伴音數(shù)據(jù); 將所述中間錄音數(shù)據(jù)與獲取的伴音數(shù)據(jù)進行混音,得到目標(biāo)音頻數(shù)據(jù)。
2. 如權(quán)利要求1所述的方法,其特征在于,所述對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量, 包括: 所述原始錄音數(shù)據(jù)為單聲道,如果將單聲道調(diào)整為m(m>l)聲道,則以幀為單位,輪循 原始錄音數(shù)據(jù)的每個幀中的采樣點,將原始錄音數(shù)據(jù)的采樣點在中間錄音數(shù)據(jù)的相應(yīng)幀中 連續(xù)賦值m個采樣點,輪循原始錄音數(shù)據(jù)的每個幀后得到m聲道的中間錄音數(shù)據(jù)。
3. 如權(quán)利要求1所述的方法,其特征在于,所述對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量, 包括: 所述原始錄音數(shù)據(jù)為n(n>l)聲道,如果將n聲道調(diào)整為q(q>l)*n聲道,則以幀為單 位,輪循原始錄音數(shù)據(jù)的每個幀中的采樣組,所述采樣組中包含與聲道數(shù)量相同的采樣點, 每個采樣點與一個聲道對應(yīng),將原始錄音數(shù)據(jù)的采樣組賦值給中間錄音數(shù)據(jù)的相應(yīng)幀的連 續(xù)q個采樣組,輪循原始錄音數(shù)據(jù)的每個幀后得到q*n聲道的中間錄音數(shù)據(jù)。
4. 如權(quán)利要求1所述的方法,其特征在于,所述對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量, 包括: 所述原始錄音數(shù)據(jù)為1(1>1)聲道,如果將1聲道調(diào)整為P(P>1)聲道,其中,P與1為 非整數(shù)倍關(guān)系,則以幀為單位,輪循原始錄音數(shù)據(jù)的每個幀中的采樣組,所述采樣組中包含 與聲道數(shù)量相同的采樣點,每個采樣點與一個聲道對應(yīng),對原始錄音數(shù)據(jù)的采樣組中包含 的與聲道數(shù)量相同的采樣點取平均值,將得到的平均值在中間錄音數(shù)據(jù)的相應(yīng)幀中連續(xù)賦 值P個采樣點,輪循原始錄音數(shù)據(jù)的每個幀后得到P聲道的中間錄音數(shù)據(jù)。
5. 如權(quán)利要求1?4任意之一所述的方法,其特征在于,所述伴音數(shù)據(jù)與所述中間錄音 數(shù)據(jù)的聲道數(shù)量相同。
6. 如權(quán)利要求1?4任意之一所述的方法,其特征在于: 在進行音頻錄制的過程中,如果錄音設(shè)備同時播放伴音,則消除所錄制的音頻數(shù)據(jù)中 的錄音設(shè)備所播放的伴音,將消除伴音的音頻數(shù)據(jù)作為所述原始錄音數(shù)據(jù)。
7. 如權(quán)利要求1?4任意之一所述的方法,其特征在于,所述方法還包括: 在對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,得到中間錄音數(shù)據(jù)后,對所述中間錄音數(shù)據(jù) 進行音量調(diào)整;以及在獲取伴音數(shù)據(jù)后,對所述伴音數(shù)據(jù)進行音量調(diào)整,所述音量調(diào)整包括 將數(shù)據(jù)中的每個采樣點與音量百分比相乘。
8. -種錄制音頻的裝置,其特征在于,包括:錄音單元、聲道調(diào)整單元、伴音數(shù)據(jù)獲取 單元和混音單元,其中: 所述錄音單元,用于進行音頻錄制,得到原始錄音數(shù)據(jù); 所述聲道調(diào)整單元,用于獲取原始錄音數(shù)據(jù),對獲取的原始錄音數(shù)據(jù)調(diào)整聲道數(shù)量,得 到中間錄音數(shù)據(jù); 所述伴音數(shù)據(jù)獲取單元,用于獲取伴音數(shù)據(jù); 所述混音單元,用于將所述中間錄音數(shù)據(jù)與獲取的伴音數(shù)據(jù)進行混音,得到目標(biāo)音頻 數(shù)據(jù)。
9. 如權(quán)利要求8所述的裝置,其特征在于,所述聲道調(diào)整單元對獲取的原始錄音數(shù)據(jù) 調(diào)整聲道數(shù)量,包括: 所述原始錄音數(shù)據(jù)為單聲道,如果將單聲道調(diào)整為m(m>l)聲道,則以幀為單位,輪循 原始錄音數(shù)據(jù)的每個幀中的采樣點,將原始錄音數(shù)據(jù)的采樣點在中間錄音數(shù)據(jù)的相應(yīng)幀中 連續(xù)賦值m個采樣點,輪循原始錄音數(shù)據(jù)的每個幀后得到m聲道的中間錄音數(shù)據(jù);或者, 所述原始錄音數(shù)據(jù)為n(n>l)聲道,如果將n聲道調(diào)整為q(q>l)*n聲道,則以幀為單 位,輪循原始錄音數(shù)據(jù)的每個幀中的采樣組,所述采樣組中包含與聲道數(shù)量相同的采樣點, 每個采樣點與一個聲道對應(yīng),將原始錄音數(shù)據(jù)的采樣組賦值給中間錄音數(shù)據(jù)的相應(yīng)幀的連 續(xù)q個采樣組,輪循原始錄音數(shù)據(jù)的每個幀后得到q*n聲道的中間錄音數(shù)據(jù);或者, 所述原始錄音數(shù)據(jù)為1(1>1)聲道,如果將1聲道調(diào)整為P(P>1)聲道,其中,P與1為 非整數(shù)倍關(guān)系,則以幀為單位,輪循原始錄音數(shù)據(jù)的每個幀中的采樣組,所述采樣組中包含 與聲道數(shù)量相同的采樣點,每個采樣點與一個聲道對應(yīng),對原始錄音數(shù)據(jù)的采樣組中包含 的與聲道數(shù)量相同的采樣點取平均值,將得到的平均值在中間錄音數(shù)據(jù)的相應(yīng)幀中連續(xù)賦 值P個采樣點,輪循原始錄音數(shù)據(jù)的每個幀后得到P聲道的中間錄音數(shù)據(jù)。
10. 如權(quán)利要求9所述的裝置,其特征在于,所述伴音數(shù)據(jù)與所述中間錄音數(shù)據(jù)的聲道 數(shù)量相同。
【文檔編號】G11C7/16GK104392744SQ201410427431
【公開日】2015年3月4日 申請日期:2014年8月27日 優(yōu)先權(quán)日:2014年8月27日
【發(fā)明者】陳正超, 石毅, 蔣鴻偉 申請人:貴陽朗瑪信息技術(shù)股份有限公司