本發(fā)明涉及音頻處理技術(shù),尤指一種實現(xiàn)音頻錄制的方法及終端。
背景技術(shù):
在參加會議時,一般會對參會內(nèi)容進行音頻錄制。
為了提高音頻錄制的質(zhì)量,相關(guān)技術(shù)中,進行音頻錄制主要通過雙麥克設(shè)置進行降噪處理,完成指向性錄音。
雙麥克設(shè)置雖然可以到達一定的降噪效果,但會議備忘一般有多個發(fā)言者,對來自不同角度的聲音信號進行音頻錄制,雙麥克設(shè)置方法無法實現(xiàn)對各個不同角度的聲音信號都進行降低噪聲處理,錄音文件的音頻質(zhì)量需要進一步提高。
技術(shù)實現(xiàn)要素:
為了解決上述技術(shù)問題,本發(fā)明實施例提供一種實現(xiàn)音頻錄制的方法及裝置,能夠降低不同角度錄制的聲音信號的噪聲。
本發(fā)明實施例提供了一種實現(xiàn)音頻錄制的方法,包括:
確定音頻錄制對象與麥克陣列的位置關(guān)系;
根據(jù)確定的音頻錄制對象與麥克陣列的位置關(guān)系調(diào)整錄制的音頻文件的增益,獲得錄音文件;
所述麥克陣列為在終端上預先設(shè)置的由三個或三個以上麥克組成的陣列。
可選的,確定音頻錄制對象與麥克陣列的位置關(guān)系具體包括:
確定所述麥克陣列中與所述音頻錄制對象距離最近的麥克;
通過在所述麥克陣列中預先建立的坐標軸,確定所述音頻錄制對象與確定的距離音頻錄制對象最近的麥克的夾角δ;
所述預先建立的坐標軸為以所述麥克陣列的幾何中心作為圓心,以對稱軸作為縱軸建立的坐標軸。
可選的,調(diào)整錄制的音頻文件的增益具體包括:
通過下述公式調(diào)整音頻文件中與音頻錄制對象距離最近的麥克的增益:
其中,δ為偏置系數(shù),ε為增益調(diào)整參數(shù)。
可選的,音頻錄制對象與確定的距離音頻錄制對象最近的麥克的夾角δ為:
計算所述音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度;
確定所述麥克陣列中各麥克與建立的坐標軸構(gòu)成的麥克角度;
分別計算所述音頻錄制角度與各個麥克角度的差并求絕對值后,確定絕對值最小的數(shù)值為所述夾角δ。
可選的,該方法還包括:以所述麥克陣列的幾何中心作為圓心,將所述麥克陣列組成的平面劃分為預設(shè)個數(shù)的扇區(qū);
設(shè)置各扇區(qū)相應的音軌;
根據(jù)所述音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度確定音頻錄制對象所在扇區(qū),將錄制的所述錄音文件存儲到該扇區(qū)對應的音軌中,用于根據(jù)存儲的音軌進行錄音文件的播放。
另一方面,本申請實施例還提供一種實現(xiàn)音頻錄制的裝置,包括:確定單元和調(diào)整單元;其中,
確定單元,用于確定音頻錄制對象與麥克陣列的位置關(guān)系;
調(diào)整單元,用于根據(jù)確定的音頻錄制對象與麥克陣列的位置關(guān)系調(diào)整錄制的音頻文件的增益,獲得錄音文件;
所述麥克陣列為在終端上預先設(shè)置的由三個或三個以上麥克組成的陣列。
可選的,確定單元具體用于,
確定所述麥克陣列中與所述音頻錄制對象距離最近的麥克;
通過在所述麥克陣列中預先建立的坐標軸,確定所述音頻錄制對象與確定的距離音頻錄制對象最近的麥克的夾角δ;
所述預先建立的坐標軸為以所述麥克陣列的幾何中心作為圓心,以對稱軸作為縱軸建立的坐標軸。
可選的,調(diào)整單元具體用于,
根據(jù)確定的音頻錄制對象與麥克陣列的位置關(guān)系,通過下述公式調(diào)整音頻文件中與音頻錄制對象距離最近的麥克的增益:
其中,δ為偏置系數(shù),ε為增益調(diào)整參數(shù)。
可選的,確定單元具體用于,
確定所述麥克陣列中與所述音頻錄制對象距離最近的麥克;
計算音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度;
確定麥克陣列中各麥克與建立的坐標軸構(gòu)成的麥克角度;
分別計算音頻錄制角度與各麥克角度的差并求絕對值后,確定絕對值最小的數(shù)值為所述夾角δ;
所述調(diào)整單元具體用于,根據(jù)夾角δ調(diào)整錄制的音頻文件的增益,獲得錄音文件。
可選的,該裝置還包括音軌單元,用于以麥克陣列的幾何中心作為圓心,將麥克陣列組成的平面劃分為預設(shè)個數(shù)的扇區(qū);
設(shè)置各扇區(qū)相應的音軌;
根據(jù)音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度確定音頻錄制對象所在扇區(qū),將錄制的錄音文件存儲到該扇區(qū)對應的音軌中,用于根據(jù)存儲的音軌進行錄音文件的播放。
與現(xiàn)有技術(shù)相比,本申請技術(shù)方案包括:確定音頻錄制對象與麥克陣列的位置關(guān)系;根據(jù)確定的音頻錄制對象與麥克陣列的位置關(guān)系調(diào)整錄制的音 頻文件的增益,獲得錄音文件;麥克陣列為在終端上預先設(shè)置的由三個或三個以上麥克組成的陣列。本發(fā)明方法通過根據(jù)音頻錄制對象與麥克陣列的位置關(guān)系對各位置音頻錄制對象錄制的音頻文件進行增益調(diào)整,降低了錄音文件中的噪聲,提高了錄音文件的音頻質(zhì)量。
附圖說明
此處所說明的附圖用來提供對本發(fā)明的進一步理解,構(gòu)成本申請的一部分,本發(fā)明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當限定。在附圖中:
圖1為本發(fā)明實現(xiàn)音頻錄制的方法的流程圖;
圖2為本發(fā)明實現(xiàn)音頻錄制的裝置的結(jié)構(gòu)框圖;
圖3為本發(fā)明實施例麥克陣列的幾何分布示意圖;
圖4為本發(fā)明實施例扇區(qū)的分布示意圖;
圖5為本發(fā)明實施例的方法流程圖;
圖6為本發(fā)明實施例音頻錄制對象在麥克陣列中構(gòu)成角度示意圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,下文中將結(jié)合附圖對本發(fā)明的實施例進行詳細說明。需要說明的是,在不沖突的情況下,本申請中的實施例及實施例中的特征可以相互任意組合。
圖1為本發(fā)明實現(xiàn)音頻錄制的方法的流程圖,如圖1所示,包括:
步驟100、確定音頻錄制對象與麥克陣列的位置關(guān)系;這里,麥克陣列為在終端上預先設(shè)置的由三個或三個以上麥克組成的陣列。
本步驟中,確定音頻錄制對象與麥克陣列的位置關(guān)系具體包括:
確定麥克陣列中與音頻錄制對象距離最近的麥克;
通過在麥克陣列中預先建立的坐標軸,確定音頻錄制對象與確定的距離音頻錄制對象最近的麥克的夾角δ。
預先建立的坐標軸為以麥克陣列的幾何中心作為圓心,以對稱軸作為縱 軸建立的坐標軸。
優(yōu)選的,音頻錄制對象與確定的距離音頻錄制對象最近的麥克的夾角δ為:
計算音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度;
確定麥克陣列中各麥克與建立的坐標軸構(gòu)成的麥克角度;
分別計算音頻錄制角度與各麥克角度的差并求絕對值后,確定絕對值最小的數(shù)值為夾角δ。
需要說明的是,計算音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度可以采用波達方向角度估計公式(doa)計算獲得,具體的,計算音頻錄制角度包括以下過程:
把觀測到的語音片段再分成l個相鄰的子段,把每一個子段稱作快拍,把子段總數(shù)稱為快拍數(shù);
根據(jù)l個快拍的頻域陣列輸出矢量xl(fj),l=1,2,...,l,可以得到陣列輸出在頻率fj處的協(xié)方差矩陣估計
根據(jù)fj頻率處的協(xié)方差矩陣估計值
通過對上式進行一維搜索就可以獲得音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度θ。
步驟101、根據(jù)確定的音頻錄制對象與麥克陣列的位置關(guān)系調(diào)整錄制的音頻文件的增益,獲得錄音文件。
本步驟中,調(diào)整錄制的音頻文件的增益具體包括:
通過下述公式調(diào)整音頻文件中與音頻錄制對象距離最近的麥克的增益:
其中,δ為偏置系數(shù),ε為增益調(diào)整參數(shù)。
需要說明的是,偏置系數(shù)主要根據(jù)本領(lǐng)域技術(shù)人員的經(jīng)驗值進行設(shè)定,一般的,偏置系數(shù)取值為0~0.5之間;增益調(diào)整參數(shù)主要根據(jù)本領(lǐng)域技術(shù)人員的經(jīng)驗值進行設(shè)定,一般的,增益調(diào)整參數(shù)取值為0~1之間,具體數(shù)值大小可以根據(jù)麥克陣列中麥克個數(shù),音頻錄制要求等進行調(diào)整。
本發(fā)明方法還包括:以麥克陣列的幾何中心作為圓心,將麥克陣列組成的平面劃分為預設(shè)個數(shù)的扇區(qū);
設(shè)置各扇區(qū)相應的音軌;
根據(jù)音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度確定音頻錄制對象所在扇區(qū),將錄制的錄音文件存儲到該扇區(qū)對應的音軌中,用于根據(jù)存儲的音軌進行錄音文件的播放。
本發(fā)明方法通過根據(jù)音頻錄制對象與麥克陣列的位置關(guān)系對各位置音頻錄制對象錄制的音頻文件進行增益調(diào)整,降低了錄音文件中的噪聲,提高了錄音文件的音頻質(zhì)量。
圖2為本發(fā)明實現(xiàn)音頻錄制的裝置的結(jié)構(gòu)框圖,如圖2所示,包括:確定單元和調(diào)整單元;其中,
確定單元,用于確定音頻錄制對象與麥克陣列的位置關(guān)系;
確定單元具體用于,
確定麥克陣列中與音頻錄制對象距離最近的麥克;
通過在麥克陣列中預先建立的坐標軸,確定音頻錄制對象與確定的距離音頻錄制對象最近的麥克的夾角δ;
預先建立的坐標軸為以麥克陣列的幾何中心作為圓心,以對稱軸作為縱軸建立的坐標軸。
調(diào)整單元,用于根據(jù)確定的音頻錄制對象與麥克陣列的位置關(guān)系調(diào)整錄制的音頻文件的增益,獲得錄音文件。
調(diào)整單元具體用于,
根據(jù)確定的音頻錄制對象與麥克陣列的位置關(guān)系,通過下述公式調(diào)整音 頻文件中與音頻錄制對象距離最近的麥克的增益:
其中,δ為偏置系數(shù),ε為增益調(diào)整參數(shù)。
麥克陣列為在終端上預先設(shè)置的由三個或三個以上麥克組成的陣列。
本發(fā)明裝置還包括音軌單元,用于以麥克陣列的幾何中心作為圓心,將麥克陣列組成的平面劃分為預設(shè)個數(shù)的扇區(qū);
設(shè)置各扇區(qū)相應的音軌;
根據(jù)音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度確定音頻錄制對象所在扇區(qū),將錄制的錄音文件存儲到該扇區(qū)對應的音軌中,用于根據(jù)存儲的音軌進行錄音文件的播放。
確定單元具體用于,
確定麥克陣列中與音頻錄制對象距離最近的麥克;
計算音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度;
確定麥克陣列中各麥克與建立的坐標軸構(gòu)成的麥克角度;
分別計算音頻錄制角度與各麥克角度的差并求絕對值后,確定絕對值最小的數(shù)值為夾角δ。
調(diào)整單元具體用于,根據(jù)夾角δ調(diào)整錄制的音頻文件的增益,獲得錄音文件。
以下通過具體實施例對本發(fā)明方法進行清楚詳細的說明,實施例僅用于陳述本發(fā)明,并不用于限定本發(fā)明方法的保護范圍。
實施例
本實施例麥克陣列是以四個麥克構(gòu)成的陣列,麥克陣列被設(shè)置在錄音筆或手機等可以實現(xiàn)錄音的設(shè)備上,圖3為本發(fā)明實施例麥克陣列的幾何分布示意圖,如圖3所示,圖中的四個圓圈表示四個麥克,本實施例將手機的四個麥克以理想的正方形構(gòu)建麥克陣列,分布設(shè)置在手機上。為了對本發(fā)明錄制的錄音文件進行合理播放,本實施例以麥克陣列的幾何中心作為圓心,將麥克陣列組成的平面劃分為預設(shè)個數(shù)的扇區(qū),本實施例可以設(shè)置扇區(qū)個數(shù)為 6~8個,人數(shù)多時,可以增加扇區(qū)個數(shù),人數(shù)少時,可以做減少扇區(qū)個數(shù)的處理,圖4為本發(fā)明實施例扇區(qū)的分布示意圖,如圖4所示,以麥克陣列中心作為圓心,將麥克陣列組成的平面按照平均角度劃分為8個扇區(qū);設(shè)置各扇區(qū)相應的音軌;根據(jù)音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度確定音頻錄制對象所在扇區(qū),將錄制的錄音文件存儲到該扇區(qū)對應的音軌中,用于根據(jù)存儲的音軌進行錄音文件的播放。
圖5為本發(fā)明實施例的方法流程圖,如圖5所示,包括:
步驟500、確定音頻錄制對象與麥克陣列的位置關(guān)系;
本步驟具體包括:預先建立的坐標軸為以麥克陣列的幾何中心作為圓心,以對稱軸作為縱軸建立的坐標軸。
計算音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度;
確定麥克陣列中各麥克與建立的坐標軸構(gòu)成的麥克角度;
分別計算音頻錄制角度與各麥克角度的差并求絕對值后,確定絕對值最小的數(shù)值為音頻錄制對象與確定的距離音頻錄制對象最近的麥克的夾角δ。
計算音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度采用以下方法計算獲得:
通常把觀測到的語音片段再分成l個相鄰的子段,把每一個子段稱作快拍,把子段總數(shù)稱為快拍數(shù)。因此在寬帶陣列信號處理中快拍的概念與窄帶陣列信號處理是不同的。根據(jù)l個快拍的頻域陣列輸出矢量xl(fj),l=1,2,...,l,可以得到陣列輸出在頻率fj處的協(xié)方差矩陣估計
根據(jù)fj頻率處的協(xié)方差矩陣估計值
通過對上式進行一維搜索就可以獲得音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度θ。
圖6為本發(fā)明實施例音頻錄制對象在麥克陣列中構(gòu)成角度示意圖,如圖6所示,音頻錄制對象在最接近麥克1的位置,音頻錄制角度為θ。
麥克陣列為在終端上預先設(shè)置的由三個或三個以上麥克組成的陣列。
步驟501、根據(jù)確定的音頻錄制對象與麥克陣列的位置關(guān)系調(diào)整錄制的音頻文件的增益,獲得錄音文件;
調(diào)整錄制的音頻文件的增益具體包括:
通過下述公式調(diào)整音頻文件中與音頻錄制對象距離最近的麥克的增益:
其中,δ為偏置系數(shù),ε為增益調(diào)整參數(shù)。
本實施例偏置系數(shù)可以取值為0.25之間;增益調(diào)整參數(shù)可以取值為0.75。
本實施例通過與音頻錄制對象距離最近的麥克的增益的調(diào)整,可以增強錄音文件中音頻錄制對象的音頻增益,使錄音效果更為明顯,噪聲影響降低。
本實施例對多個音頻錄制對象同時發(fā)言的情況,只需要分別增強音頻文件中音頻錄制對象的音頻增益即可,通過對音頻文件按照音頻錄制對象的位置分別進行增益調(diào)整獲得各音頻錄制對象相應的錄音文件。
步驟502、根據(jù)音頻錄制對象與根據(jù)麥克陣列建立的坐標軸構(gòu)成的音頻錄制角度確定音頻錄制對象所在扇區(qū),將錄制的錄音文件存儲到該扇區(qū)對應的音軌中。
步驟503、根據(jù)存儲的音軌進行錄音文件的播放。
雖然本發(fā)明所揭露的實施方式如上,但所述的內(nèi)容僅為便于理解本發(fā)明而采用的實施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所揭露的精神和范圍的前提下,可以在實施的形式及細節(jié)上進行任何的修改與變化,但本發(fā)明的專利保護范圍,仍須以所附的權(quán)利要求書所界定的范圍為準。