一種基于小型麥克風(fēng)陣列的定向語音增強(qiáng)方法

文檔序號(hào)：2830900閱讀：831來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種基于小型麥克風(fēng)陣列的定向語音增強(qiáng)方法
技術(shù)領(lǐng)域：
本發(fā)明涉及語音處理技術(shù)領(lǐng)域，具體的說，本發(fā)明特別涉及一種基于麥克風(fēng)陣列的定向語音增強(qiáng)方法。

背景技術(shù)：
語音信號(hào)的增強(qiáng)和噪聲的消除問題，一直以來都是研究的熱點(diǎn)。針對(duì)這一問題，已經(jīng)存在很多基于麥克風(fēng)陣列的算法，實(shí)現(xiàn)加強(qiáng)語音信號(hào)，同時(shí)抑制干擾(包括各類噪聲和其他語音)的效果。麥克風(fēng)陣列一般體積較大，難以用于在便攜式設(shè)備(如手機(jī)等)。Elko和Luo等人提出和發(fā)展了自適應(yīng)谷點(diǎn)形成算法(Elko and Nguyen，A steerable and variable first-orderdifferential microphone array，ICASSP，1997；Luo，et al.Adaptivenull-forming scheme in digital hearing aids，IEEE Trans.Signal Processing，2002)，可以在小尺度陣列上實(shí)現(xiàn)定向語音增強(qiáng)，但去噪程度有限。另外，后濾波算法在大尺度陣列上已經(jīng)得到廣泛運(yùn)用，效果顯著。但由于小陣列的麥克風(fēng)間距有限，噪聲相關(guān)性較大，基于相關(guān)函數(shù)的后濾波難以得到運(yùn)用。

發(fā)明內(nèi)容
本發(fā)明的目的在于克服已有的定向語音增強(qiáng)方法的不足，將自適應(yīng)谷點(diǎn)形成算法與概率控制的后濾波算法相結(jié)合，提出一種適于便攜設(shè)備的定向語音增強(qiáng)方法，該方法能否在很小的尺度下實(shí)現(xiàn)較強(qiáng)的消噪能力，克服了基于相關(guān)函數(shù)的后濾波器在較小陣列中難以得到應(yīng)用的缺點(diǎn)。
為實(shí)現(xiàn)上述發(fā)明目的，本發(fā)明提供的基于小型麥克風(fēng)陣列的定向語音增強(qiáng)方法，包括如下步驟 1)利用兩個(gè)全指向性麥克風(fēng)采集聲音信號(hào)； 2)利用自適應(yīng)谷點(diǎn)形成算法，對(duì)所采集到聲音信號(hào)進(jìn)行數(shù)據(jù)處理，得到延遲相減信號(hào)的語譜X(ω)和自適應(yīng)濾波后信號(hào)的語譜Z(ω)； 3)根據(jù)X(ω)和Z(ω)，利用單通道語音增強(qiáng)方法計(jì)算出初步增益G′(ω)；根據(jù)X(ω)和Z(ω)，計(jì)算出目標(biāo)信號(hào)存在概率P(ω)； 4)利用所述目標(biāo)信號(hào)存在概率P(ω)，對(duì)初步增益G′(ω)進(jìn)行修正，得出最終增益G(ω)，其中Gm為預(yù)設(shè)的增益最小值； 5)利用最終增益G(ω)，對(duì)自適應(yīng)濾波后的信號(hào)z(t)進(jìn)行增強(qiáng)，得到最終的增強(qiáng)語音信號(hào)r(t)。
上述技術(shù)方案中，所述步驟2)包括如下子步驟 21)利用自適應(yīng)谷點(diǎn)形成算法，對(duì)所采集到聲音信號(hào)進(jìn)行數(shù)據(jù)處理，得到延遲相減信號(hào)x(t)和自適應(yīng)濾波后的信號(hào)z(t)； 22)對(duì)x(t)和z(t)進(jìn)行處理分別形成語譜X(ω)和Z(ω)。
上述技術(shù)方案中，所述步驟1)中，所述兩個(gè)麥克風(fēng)且呈端射式排布，所采集聲音信號(hào)包括fore(t)和back(t)信號(hào)，fore(t)為離說話人較近的麥克風(fēng)收到的信號(hào)，back(t)為離說話人較遠(yuǎn)的麥克風(fēng)收到的信號(hào)。
上述技術(shù)方案中，所述兩個(gè)麥克風(fēng)間距d為2cm-5cm。
上述技術(shù)方案中，所述步驟21)中，對(duì)fore(t)和back(t)進(jìn)行數(shù)據(jù)處理，得到延遲相減信號(hào)x(t)和自適應(yīng)濾波后的信號(hào)z(t)； x(t)＝fore(t)-back(t-d/c) y(t)＝fore(t-d/c)-back(t) 式中，c為聲波的傳輸速度； z(t)是以y(t)做為參考信號(hào)，對(duì)x(t)進(jìn)行自適應(yīng)濾波后得到的信號(hào)。
上述技術(shù)方案中，所述步驟3)中，所述單通道語音增強(qiáng)方法可采用譜減法，維納濾波法或EM方法。
上述技術(shù)方案中，所述步驟4)中，還包括對(duì)G(ω)進(jìn)行分區(qū)間地進(jìn)一步修正；式中，Gm為預(yù)設(shè)的增益最小值，P1是目標(biāo)信號(hào)存在概率的門限值。
上述技術(shù)方案中，所述增益最小值Gm取值在0.01-0.1之間，所述目標(biāo)信號(hào)存在概率的門限值P1的取值在0.85-0.95之間。
本發(fā)明的技術(shù)效果包括將自適應(yīng)谷點(diǎn)形成和概率控制后濾波算法的相結(jié)合，在很小的體積內(nèi)，實(shí)現(xiàn)了定向語音增強(qiáng)算法；并且能夠獲得更大程度的抑制噪聲，提高信噪比。概率控制的后濾波算法的主旨是估算出目標(biāo)信號(hào)在各個(gè)頻率點(diǎn)上是否存在及存在的可能性有多大，藉以決定算法在該頻率點(diǎn)上的降噪策略，這種降噪策略特別適合于小尺度的情況。

以下，結(jié)合附圖來詳細(xì)說明本發(fā)明的實(shí)施例，其中圖1是本發(fā)明中麥克風(fēng)擺放和自適應(yīng)谷點(diǎn)形成示意圖；圖2是本發(fā)明中的概率控制后濾波算法示意圖。

具體實(shí)施例方式 下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步地描述。
如圖1所示，雙麥克風(fēng)接收到的立體聲信號(hào)先經(jīng)過延遲相減，將其結(jié)果x(t)和y(t)每32ms作為一幀，計(jì)算自適應(yīng)濾波器系數(shù)w(n)，其中n為幀序號(hào)。如果一幀信號(hào)包含的采樣點(diǎn)數(shù)為L，則自適應(yīng)濾波器系數(shù)可由下式求得式中α＝0.9。
第n幀的濾波結(jié)果可計(jì)算為 z(nL-L+t)＝x(nL-L+t)-W(n)y(nL-L+t) t＝0，1，...，L-1 將z(t)和y(t)重新組幀，幀長為32ms，相鄰幀重疊50％幀長，第n幀信號(hào)分別記作zn(t)和yn(t)，對(duì)其加窗并進(jìn)行快速傅立葉變換(即短時(shí)傅立葉分析)，得第n幀語譜，如圖2所示。
STFT[zn(t)]＝Zn(ω) STFT[yn(t)]＝Y(jié)n(ω) 用IMCRA方法(Cohen，Noise spectrum estimation in adverseenvironmentsimproved minima controlled recursive averaging，IEEETrans.Speech and Audio processing)計(jì)算出Zn(ω)和Yn(ω)中的噪聲分量NnZ(ω)和NnY(ω)。隨后通過分析Zn(ω)、Yn(ω)、NnZ(ω)和NnY(ω)，計(jì)算出初步增益G′n(ω)和目標(biāo)語音存在概率Pn(ω)(Cohen and Berdugo，Two-channel signaldetection and speech enhancement based on the transientbeam-to-reference ratio，ICASSP 2003)。其中，初步增益G′n(ω)可由各種單通道語音增強(qiáng)方法(如譜減法，維納濾波法，EM方法等)得到，本實(shí)施例中采用EM方法計(jì)算初步增益G′n(ω)。目標(biāo)語音存在概率Pn(ω)表征的是各頻點(diǎn)上目標(biāo)語音成份存在的可能性。本發(fā)明中利用該目標(biāo)語音存在概率Pn(ω)對(duì)初步增益G′n(ω)進(jìn)行修正，從而得出用于增強(qiáng)的最終增益。修正方法如下式所示上式中，Gm為增益的最小值，取值在0.01-0.1之間，P1是存在概率的門限值，取值在0.85-0.95之間。對(duì)Gn(ω)的分段處理可以使其取值在合理的區(qū)間范圍內(nèi)，減少算法對(duì)語音信號(hào)產(chǎn)生的失真。
得到最終增益Gn(ω)后，即可對(duì)Zn(ω)進(jìn)行增強(qiáng)，如下式所示 Rn(ω)＝Gn(ω)·Zn(ω) 對(duì)Rn(ω)做逆傅立葉變換(IFFT)，得到該幀的時(shí)域信號(hào)rn(t)。對(duì)照相鄰幀的重疊量，進(jìn)行幀間疊接相加，最終得到增強(qiáng)后的語音信號(hào)r(t)。
本發(fā)明在很小的體積內(nèi)，實(shí)現(xiàn)了定向語音增強(qiáng)算法，很大程度地抑制了噪聲，提高了信噪比和聽覺舒適度。
為證明本方法的有效性，對(duì)同一組帶噪語音(兩個(gè)干擾源，其一為干擾說話人，另一個(gè)為音樂，信噪比由-10dB到10dB)進(jìn)行處理，噪聲去除量(NoiseReduction)如下表(單位dB)
去噪能力提升均在16dB以上。
權(quán)利要求
1.一種基于小型麥克風(fēng)陣列的定向語音增強(qiáng)方法，包括如下步驟
1)利用兩個(gè)全指向性麥克風(fēng)采集聲音信號(hào)；
2)利用自適應(yīng)谷點(diǎn)形成算法，對(duì)所采集到聲音信號(hào)進(jìn)行數(shù)據(jù)處理，得到延遲相減信號(hào)的語譜X(ω)和自適應(yīng)濾波后信號(hào)的語譜Z(ω)；
3)根據(jù)X(ω)和Z(ω)，利用單通道語音增強(qiáng)方法計(jì)算出初步增益G′(ω)；根據(jù)X(ω)和Z(ω)，計(jì)算出目標(biāo)信號(hào)存在概率P(ω)；
4)利用所述目標(biāo)信號(hào)存在概率P(ω)，對(duì)初步增益G′(ω)進(jìn)行修正，得出最終增益G(ω)，其中Gm為預(yù)設(shè)的增益最小值；
5)利用最終增益G(ω)，對(duì)自適應(yīng)濾波后的信號(hào)z(t)進(jìn)行增強(qiáng)，得到最終的增強(qiáng)語音信號(hào)r(t)。
2.根據(jù)權(quán)利要求1所述的定向語音增強(qiáng)方法，其特征在于，所述步驟2)包括如下子步驟
21)利用自適應(yīng)谷點(diǎn)形成算法，對(duì)所采集到聲音信號(hào)進(jìn)行數(shù)據(jù)處理，得到延遲相減信號(hào)x(t)和自適應(yīng)濾波后的信號(hào)z(t)；
22)對(duì)x(t)和z(t)進(jìn)行處理分別形成語譜X(ω)和Z(ω)。
3.根據(jù)權(quán)利要求2所述的定向語音增強(qiáng)方法，其特征在于，所述步驟1)中，所述兩個(gè)麥克風(fēng)且呈端射式排布，所采集聲音信號(hào)包括fore(t)和back(t)信號(hào)，fore(t)為離說話人較近的麥克風(fēng)收到的信號(hào)，back(t)為離說話人較遠(yuǎn)的麥克風(fēng)收到的信號(hào)。
4.根據(jù)權(quán)利要求3所述的定向語音增強(qiáng)方法，其特征在于，所述兩個(gè)麥克風(fēng)間距d為2cm-5cm。
5.根據(jù)權(quán)利要求3所述的定向語音增強(qiáng)方法，其特征在于，所述步驟21)中，對(duì)fore(t)和back(t)進(jìn)行數(shù)據(jù)處理，得到延遲相減信號(hào)x(t)和自適應(yīng)濾波后的信號(hào)z(t)；
x(t)＝fore(t)-back(t-d/c)
y(t)＝fore(t-d/c)-back(t)
式中，c為聲波的傳輸速度；
z(t)是以y(t)做為參考信號(hào)，對(duì)x(t)進(jìn)行自適應(yīng)濾波后得到的信號(hào)。
6.根據(jù)權(quán)利要求1所述的定向語音增強(qiáng)方法，其特征在于，所述步驟3)中，所述單通道語音增強(qiáng)方法可采用譜減法，維納濾波法或EM方法。
7.根據(jù)權(quán)利要求1所述的定向語音增強(qiáng)方法，其特征在于，所述步驟4)中，還包括對(duì)G(ω)進(jìn)行分區(qū)間地進(jìn)一步修正；
式中，Gm為預(yù)設(shè)的增益最小值，P1是目標(biāo)信號(hào)存在概率的門限值。
8.根據(jù)權(quán)利要求7所述的定向語音增強(qiáng)方法，其特征在于，所述增益最小值Gm取值在0.01-0.1之間，所述目標(biāo)信號(hào)存在概率的門限值P1的取值在0.85-0.95之間。
全文摘要
本發(fā)明提供一種基于小型麥克風(fēng)陣列的定向語音增強(qiáng)方法，包括如下步驟1)利用兩個(gè)全指向性麥克風(fēng)采集聲音信號(hào)；2)利用自適應(yīng)谷點(diǎn)形成算法，對(duì)所采集到聲音信號(hào)進(jìn)行數(shù)據(jù)處理，得到延遲相減信號(hào)x(t)和自適應(yīng)濾波后的信號(hào)z(t)；3)對(duì)x(t)和z(t)進(jìn)行處理分別形成語譜X(ω)和Z(ω)；4)根據(jù)X(ω)和Z(ω)，利用單通道語音增強(qiáng)方法計(jì)算出初步增益G′(ω)；根據(jù)X(ω)和Z(ω)，計(jì)算出目標(biāo)信號(hào)存在概率P(ω)；5)利用所述目標(biāo)信號(hào)存在概率P(ω)，對(duì)初步增益G′(ω)進(jìn)行修正，得出最終增益G(ω)，G(ω)＝(G′(ω))P(ω)Gm1-P(ω)，其中Gm為預(yù)設(shè)的增益最小值；6)利用最終增益G(ω)，對(duì)自適應(yīng)濾波后的信號(hào)z(t)進(jìn)行增強(qiáng)，得到最終的增強(qiáng)語音信號(hào)r(t)。本發(fā)明能夠在很小的體積內(nèi)，實(shí)現(xiàn)定向語音增強(qiáng)算法；并且能夠獲得更大程度的抑制噪聲，提高信噪比。
文檔編號(hào)G10L21/00GK101587712SQ20081011219
公開日2009年11月25日申請(qǐng)日期2008年5月21日優(yōu)先權(quán)日2008年5月21日
發(fā)明者顏永紅, 強(qiáng) 付, 恒張申請(qǐng)人:中國科學(xué)院聲學(xué)研究所, 北京中科信利技術(shù)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：顏永紅;付強(qiáng);張恒
技術(shù)所有人：中國科學(xué)院聲學(xué)研究所;北京中科信利技術(shù)有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

麥克風(fēng)陣列語音增強(qiáng)相關(guān)技術(shù)

麥克風(fēng)陣列語音芯片相關(guān)技術(shù)

qq語音麥克風(fēng)自動(dòng)增強(qiáng)相關(guān)技術(shù)

qq語音麥克風(fēng)增強(qiáng)相關(guān)技術(shù)

麥克風(fēng)陣列相關(guān)技術(shù)

麥克風(fēng)陣列聲源定位相關(guān)技術(shù)

麥克風(fēng)陣列解決方案相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于小型麥克風(fēng)陣列的定向語音增強(qiáng)方法