專利名稱:一種基于小型麥克風(fēng)陣列的定向語音增強(qiáng)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音處理技術(shù)領(lǐng)域,具體的說,本發(fā)明特別涉及一種基于麥克風(fēng)陣列的定向語音增強(qiáng)方法。
背景技術(shù):
語音信號(hào)的增強(qiáng)和噪聲的消除問題,一直以來都是研究的熱點(diǎn)。針對(duì)這一問題,已經(jīng)存在很多基于麥克風(fēng)陣列的算法,實(shí)現(xiàn)加強(qiáng)語音信號(hào),同時(shí)抑制干擾(包括各類噪聲和其他語音)的效果。麥克風(fēng)陣列一般體積較大,難以用于在便攜式設(shè)備(如手機(jī)等)。Elko和Luo等人提出和發(fā)展了自適應(yīng)谷點(diǎn)形成算法(Elko and Nguyen,A steerable and variable first-orderdifferential microphone array,ICASSP,1997;Luo,et al.Adaptivenull-forming scheme in digital hearing aids,IEEE Trans.Signal Processing,2002),可以在小尺度陣列上實(shí)現(xiàn)定向語音增強(qiáng),但去噪程度有限。另外,后濾波算法在大尺度陣列上已經(jīng)得到廣泛運(yùn)用,效果顯著。但由于小陣列的麥克風(fēng)間距有限,噪聲相關(guān)性較大,基于相關(guān)函數(shù)的后濾波難以得到運(yùn)用。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服已有的定向語音增強(qiáng)方法的不足,將自適應(yīng)谷點(diǎn)形成算法與概率控制的后濾波算法相結(jié)合,提出一種適于便攜設(shè)備的定向語音增強(qiáng)方法,該方法能否在很小的尺度下實(shí)現(xiàn)較強(qiáng)的消噪能力,克服了基于相關(guān)函數(shù)的后濾波器在較小陣列中難以得到應(yīng)用的缺點(diǎn)。
為實(shí)現(xiàn)上述發(fā)明目的,本發(fā)明提供的基于小型麥克風(fēng)陣列的定向語音增強(qiáng)方法,包括如下步驟 1)利用兩個(gè)全指向性麥克風(fēng)采集聲音信號(hào); 2)利用自適應(yīng)谷點(diǎn)形成算法,對(duì)所采集到聲音信號(hào)進(jìn)行數(shù)據(jù)處理,得到延遲相減信號(hào)的語譜X(ω)和自適應(yīng)濾波后信號(hào)的語譜Z(ω); 3)根據(jù)X(ω)和Z(ω),利用單通道語音增強(qiáng)方法計(jì)算出初步增益G′(ω);根據(jù)X(ω)和Z(ω),計(jì)算出目標(biāo)信號(hào)存在概率P(ω); 4)利用所述目標(biāo)信號(hào)存在概率P(ω),對(duì)初步增益G′(ω)進(jìn)行修正,得出最終增益G(ω),其中Gm為預(yù)設(shè)的增益最小值; 5)利用最終增益G(ω),對(duì)自適應(yīng)濾波后的信號(hào)z(t)進(jìn)行增強(qiáng),得到最終的增強(qiáng)語音信號(hào)r(t)。
上述技術(shù)方案中,所述步驟2)包括如下子步驟 21)利用自適應(yīng)谷點(diǎn)形成算法,對(duì)所采集到聲音信號(hào)進(jìn)行數(shù)據(jù)處理,得到延遲相減信號(hào)x(t)和自適應(yīng)濾波后的信號(hào)z(t); 22)對(duì)x(t)和z(t)進(jìn)行處理分別形成語譜X(ω)和Z(ω)。
上述技術(shù)方案中,所述步驟1)中,所述兩個(gè)麥克風(fēng)且呈端射式排布,所采集聲音信號(hào)包括fore(t)和back(t)信號(hào),fore(t)為離說話人較近的麥克風(fēng)收到的信號(hào),back(t)為離說話人較遠(yuǎn)的麥克風(fēng)收到的信號(hào)。
上述技術(shù)方案中,所述兩個(gè)麥克風(fēng)間距d為2cm-5cm。
上述技術(shù)方案中,所述步驟21)中,對(duì)fore(t)和back(t)進(jìn)行數(shù)據(jù)處理,得到延遲相減信號(hào)x(t)和自適應(yīng)濾波后的信號(hào)z(t); x(t)=fore(t)-back(t-d/c) y(t)=fore(t-d/c)-back(t) 式中,c為聲波的傳輸速度; z(t)是以y(t)做為參考信號(hào),對(duì)x(t)進(jìn)行自適應(yīng)濾波后得到的信號(hào)。
上述技術(shù)方案中,所述步驟3)中,所述單通道語音增強(qiáng)方法可采用譜減法,維納濾波法或EM方法。
上述技術(shù)方案中,所述步驟4)中,還包括對(duì)G(ω)進(jìn)行分區(qū)間地進(jìn)一步修正; 式中,Gm為預(yù)設(shè)的增益最小值,P1是目標(biāo)信號(hào)存在概率的門限值。
上述技術(shù)方案中,所述增益最小值Gm取值在0.01-0.1之間,所述目標(biāo)信號(hào)存在概率的門限值P1的取值在0.85-0.95之間。
本發(fā)明的技術(shù)效果包括將自適應(yīng)谷點(diǎn)形成和概率控制后濾波算法的相結(jié)合,在很小的體積內(nèi),實(shí)現(xiàn)了定向語音增強(qiáng)算法;并且能夠獲得更大程度的抑制噪聲,提高信噪比。概率控制的后濾波算法的主旨是估算出目標(biāo)信號(hào)在各個(gè)頻率點(diǎn)上是否存在及存在的可能性有多大,藉以決定算法在該頻率點(diǎn)上的降噪策略,這種降噪策略特別適合于小尺度的情況。
以下,結(jié)合附圖來詳細(xì)說明本發(fā)明的實(shí)施例,其中 圖1是本發(fā)明中麥克風(fēng)擺放和自適應(yīng)谷點(diǎn)形成示意圖; 圖2是本發(fā)明中的概率控制后濾波算法示意圖。
具體實(shí)施例方式 下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步地描述。
如圖1所示,雙麥克風(fēng)接收到的立體聲信號(hào)先經(jīng)過延遲相減,將其結(jié)果x(t)和y(t)每32ms作為一幀,計(jì)算自適應(yīng)濾波器系數(shù)w(n),其中n為幀序號(hào)。如果一幀信號(hào)包含的采樣點(diǎn)數(shù)為L,則自適應(yīng)濾波器系數(shù)可由下式求得 式中α=0.9。
第n幀的濾波結(jié)果可計(jì)算為 z(nL-L+t)=x(nL-L+t)-W(n)y(nL-L+t) t=0,1,...,L-1 將z(t)和y(t)重新組幀,幀長為32ms,相鄰幀重疊50%幀長,第n幀信號(hào)分別記作zn(t)和yn(t),對(duì)其加窗并進(jìn)行快速傅立葉變換(即短時(shí)傅立葉分析),得第n幀語譜,如圖2所示。
STFT[zn(t)]=Zn(ω) STFT[yn(t)]=Y(jié)n(ω) 用IMCRA方法(Cohen,Noise spectrum estimation in adverseenvironmentsimproved minima controlled recursive averaging,IEEETrans.Speech and Audio processing)計(jì)算出Zn(ω)和Yn(ω)中的噪聲分量NnZ(ω)和NnY(ω)。隨后通過分析Zn(ω)、Yn(ω)、NnZ(ω)和NnY(ω),計(jì)算出初步增益G′n(ω)和目標(biāo)語音存在概率Pn(ω)(Cohen and Berdugo,Two-channel signaldetection and speech enhancement based on the transientbeam-to-reference ratio,ICASSP 2003)。其中,初步增益G′n(ω)可由各種單通道語音增強(qiáng)方法(如譜減法,維納濾波法,EM方法等)得到,本實(shí)施例中采用EM方法計(jì)算初步增益G′n(ω)。目標(biāo)語音存在概率Pn(ω)表征的是各頻點(diǎn)上目標(biāo)語音成份存在的可能性。本發(fā)明中利用該目標(biāo)語音存在概率Pn(ω)對(duì)初步增益G′n(ω)進(jìn)行修正,從而得出用于增強(qiáng)的最終增益。修正方法如下式所示 上式中,Gm為增益的最小值,取值在0.01-0.1之間,P1是存在概率的門限值,取值在0.85-0.95之間。對(duì)Gn(ω)的分段處理可以使其取值在合理的區(qū)間范圍內(nèi),減少算法對(duì)語音信號(hào)產(chǎn)生的失真。
得到最終增益Gn(ω)后,即可對(duì)Zn(ω)進(jìn)行增強(qiáng),如下式所示 Rn(ω)=Gn(ω)·Zn(ω) 對(duì)Rn(ω)做逆傅立葉變換(IFFT),得到該幀的時(shí)域信號(hào)rn(t)。對(duì)照相鄰幀的重疊量,進(jìn)行幀間疊接相加,最終得到增強(qiáng)后的語音信號(hào)r(t)。
本發(fā)明在很小的體積內(nèi),實(shí)現(xiàn)了定向語音增強(qiáng)算法,很大程度地抑制了噪聲,提高了信噪比和聽覺舒適度。
為證明本方法的有效性,對(duì)同一組帶噪語音(兩個(gè)干擾源,其一為干擾說話人,另一個(gè)為音樂,信噪比由-10dB到10dB)進(jìn)行處理,噪聲去除量(NoiseReduction)如下表(單位dB)
去噪能力提升均在16dB以上。
權(quán)利要求
1.一種基于小型麥克風(fēng)陣列的定向語音增強(qiáng)方法,包括如下步驟
1)利用兩個(gè)全指向性麥克風(fēng)采集聲音信號(hào);
2)利用自適應(yīng)谷點(diǎn)形成算法,對(duì)所采集到聲音信號(hào)進(jìn)行數(shù)據(jù)處理,得到延遲相減信號(hào)的語譜X(ω)和自適應(yīng)濾波后信號(hào)的語譜Z(ω);
3)根據(jù)X(ω)和Z(ω),利用單通道語音增強(qiáng)方法計(jì)算出初步增益G′(ω);根據(jù)X(ω)和Z(ω),計(jì)算出目標(biāo)信號(hào)存在概率P(ω);
4)利用所述目標(biāo)信號(hào)存在概率P(ω),對(duì)初步增益G′(ω)進(jìn)行修正,得出最終增益G(ω),其中Gm為預(yù)設(shè)的增益最小值;
5)利用最終增益G(ω),對(duì)自適應(yīng)濾波后的信號(hào)z(t)進(jìn)行增強(qiáng),得到最終的增強(qiáng)語音信號(hào)r(t)。
2.根據(jù)權(quán)利要求1所述的定向語音增強(qiáng)方法,其特征在于,所述步驟2)包括如下子步驟
21)利用自適應(yīng)谷點(diǎn)形成算法,對(duì)所采集到聲音信號(hào)進(jìn)行數(shù)據(jù)處理,得到延遲相減信號(hào)x(t)和自適應(yīng)濾波后的信號(hào)z(t);
22)對(duì)x(t)和z(t)進(jìn)行處理分別形成語譜X(ω)和Z(ω)。
3.根據(jù)權(quán)利要求2所述的定向語音增強(qiáng)方法,其特征在于,所述步驟1)中,所述兩個(gè)麥克風(fēng)且呈端射式排布,所采集聲音信號(hào)包括fore(t)和back(t)信號(hào),fore(t)為離說話人較近的麥克風(fēng)收到的信號(hào),back(t)為離說話人較遠(yuǎn)的麥克風(fēng)收到的信號(hào)。
4.根據(jù)權(quán)利要求3所述的定向語音增強(qiáng)方法,其特征在于,所述兩個(gè)麥克風(fēng)間距d為2cm-5cm。
5.根據(jù)權(quán)利要求3所述的定向語音增強(qiáng)方法,其特征在于,所述步驟21)中,對(duì)fore(t)和back(t)進(jìn)行數(shù)據(jù)處理,得到延遲相減信號(hào)x(t)和自適應(yīng)濾波后的信號(hào)z(t);
x(t)=fore(t)-back(t-d/c)
y(t)=fore(t-d/c)-back(t)
式中,c為聲波的傳輸速度;
z(t)是以y(t)做為參考信號(hào),對(duì)x(t)進(jìn)行自適應(yīng)濾波后得到的信號(hào)。
6.根據(jù)權(quán)利要求1所述的定向語音增強(qiáng)方法,其特征在于,所述步驟3)中,所述單通道語音增強(qiáng)方法可采用譜減法,維納濾波法或EM方法。
7.根據(jù)權(quán)利要求1所述的定向語音增強(qiáng)方法,其特征在于,所述步驟4)中,還包括對(duì)G(ω)進(jìn)行分區(qū)間地進(jìn)一步修正;
式中,Gm為預(yù)設(shè)的增益最小值,P1是目標(biāo)信號(hào)存在概率的門限值。
8.根據(jù)權(quán)利要求7所述的定向語音增強(qiáng)方法,其特征在于,所述增益最小值Gm取值在0.01-0.1之間,所述目標(biāo)信號(hào)存在概率的門限值P1的取值在0.85-0.95之間。
全文摘要
本發(fā)明提供一種基于小型麥克風(fēng)陣列的定向語音增強(qiáng)方法,包括如下步驟1)利用兩個(gè)全指向性麥克風(fēng)采集聲音信號(hào);2)利用自適應(yīng)谷點(diǎn)形成算法,對(duì)所采集到聲音信號(hào)進(jìn)行數(shù)據(jù)處理,得到延遲相減信號(hào)x(t)和自適應(yīng)濾波后的信號(hào)z(t);3)對(duì)x(t)和z(t)進(jìn)行處理分別形成語譜X(ω)和Z(ω);4)根據(jù)X(ω)和Z(ω),利用單通道語音增強(qiáng)方法計(jì)算出初步增益G′(ω);根據(jù)X(ω)和Z(ω),計(jì)算出目標(biāo)信號(hào)存在概率P(ω);5)利用所述目標(biāo)信號(hào)存在概率P(ω),對(duì)初步增益G′(ω)進(jìn)行修正,得出最終增益G(ω),G(ω)=(G′(ω))P(ω)Gm1-P(ω),其中Gm為預(yù)設(shè)的增益最小值;6)利用最終增益G(ω),對(duì)自適應(yīng)濾波后的信號(hào)z(t)進(jìn)行增強(qiáng),得到最終的增強(qiáng)語音信號(hào)r(t)。本發(fā)明能夠在很小的體積內(nèi),實(shí)現(xiàn)定向語音增強(qiáng)算法;并且能夠獲得更大程度的抑制噪聲,提高信噪比。
文檔編號(hào)G10L21/00GK101587712SQ20081011219
公開日2009年11月25日 申請(qǐng)日期2008年5月21日 優(yōu)先權(quán)日2008年5月21日
發(fā)明者顏永紅, 強(qiáng) 付, 恒 張 申請(qǐng)人:中國科學(xué)院聲學(xué)研究所, 北京中科信利技術(shù)有限公司