專利名稱:用于語音編碼器中的噪聲消除的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于語音編碼器中的噪聲消除的方法和裝置,并且更具體地,涉及低頻噪聲消除,以提高語音編碼器的性能。
背景技術(shù):
無線通信網(wǎng)絡(luò)中的語音通信涉及近端語音信號向遠端用戶的傳輸。問題在于從捕獲的帶噪語音信號中估計干凈的語音信號。移動電話可以配備有單個或者多個麥克風以捕獲語音信號。單麥克風解決方案表現(xiàn)出相對于語音的清晰度而言的在低信噪比(SNR)方面的改進余地,這主要是由于背景噪聲的低頻成分造成的。雙麥克風解決方案意味著有兩個不同的傳感器可用于同時捕獲聲場,該雙麥克風解決方案有可能允許實現(xiàn)對空間信息和聲源的特性(如捕獲的信號的空間相干性)的使用。這些特性與移動電話単元上的兩個麥克風的相對布置以及移動電話的設(shè)計和使用有關(guān)。一種實現(xiàn)雙麥克風解決方案的方式是將具有低SNR的參考麥克風信號與捕獲期望的語音信號和噪聲的主麥克風結(jié)合,以實現(xiàn)自適應(yīng)噪聲消除。換言之,聯(lián)合使用遠離嘴的麥克風(稱為參考麥克風)與靠近嘴的麥克風(稱為主麥克風)。自適應(yīng)濾波器使用參考麥克風捕獲的信號來估計主麥克風處的噪聲信號。減法器根據(jù)主麥克風信號與估計的噪聲信號之間的差產(chǎn)生誤差信號。誤差信號和參考信號被用于優(yōu)化對麥克風處的相關(guān)噪聲的抑制。許多背景噪聲的環(huán)境,諸如汽車車廂和辦公室,可以通過擴散噪聲場來表征。完全擴散噪聲場通常由遠距離的非相關(guān)的在所有方向上均勻分布的隨機噪聲源在無界限的介質(zhì)中產(chǎn)生。擴散噪聲呈現(xiàn)出在低頻處的高的空間相干性和在高頻處的低的相干性。因此,標準噪聲消除器對于遠場噪聲在低頻處呈現(xiàn)高降噪的可能性。然而,該性能取決于麥克風的位置。因為期望的語音信號也可能被參考麥克風捕獲,盡管其功率相對較低,所以包含期望語音的信號將在兩個麥克風處進行相關(guān),并且通過這種方法該信號可能被部分消除。另外,捕獲的語音將出現(xiàn)在用于調(diào)節(jié)自適應(yīng)濾波器的收斂速度的誤差信號中,導(dǎo)致較大的濾波器變化。當語音出現(xiàn)在捕獲的聲場中時,濾波器權(quán)重的適配應(yīng)該停止。先前已經(jīng)提出了基于對近端語音的檢測來調(diào)節(jié)控制自適應(yīng)濾波器的收斂速度的步長大小的許多方法。例如,在US5,953,380中,基于對SNR的估計來調(diào)整步長大小。SNR估計是使用輔自適應(yīng)濾波器來執(zhí)行的,輔自適應(yīng)濾波器使用參考麥克風信號作為輸入來估計捕獲的噪聲信號。估計的噪聲信號被用于計算噪聲功率,并且還被從主麥克風信號中減去以生成對語音信號的估計。然后,估計的語音信號被用于更新輔濾波器權(quán)重。隨后基于對語音和噪聲的功率估計來計算捕獲的聲場的SNR估計。在US 6,963,649中提出了噪聲消除器的另ー實現(xiàn),其中分別針對每個頻率段,基于噪聲消除器的輸出的子帶信號功率與每個頻帶的不同閾值的比較,進行對主自適應(yīng)濾波器的適配。而且,在多抽頭子帶自適應(yīng)濾波器之前,單抽頭自適應(yīng)濾波器產(chǎn)生優(yōu)化對噪聲的抑制的増益。US 5,953,380中提出的解決方案沒有考慮當麥克風位于靠近的范圍中(例如,在移動電話単元中)時在參考麥克風處的語音的出現(xiàn),這影響了 SNR估計。如US 6,963,649中提出的頻域中濾波器輸出信號與閾值的比較不是魯棒的解決方案,因為噪聲也可能具有高的子帶成分,尤其在低頻處,并且因此在那些頻率處不能被消除。而且,在US 5,953,380和US 6,963,649中,當檢測到語音存在時,或者在全頻帶上或者在個別頻帶上停止適配,這意味著,每次語音中斷時算法需要重新收斂。
發(fā)明內(nèi)容
本發(fā)明的目的是實現(xiàn)語音編碼器中的改進的噪聲消除器。這是通過利用主麥克風結(jié)合參考麥克風捕獲聲音信號來實現(xiàn)的。自適應(yīng)陰影濾波 器被適配于主麥克風中捕獲的信號與參考麥克風中捕獲的信號之間的相關(guān)。此外,引入擴散噪聲場檢測器,其檢測擴散噪聲的存在。當擴散噪聲場檢測器檢測到擴散噪聲吋,自適應(yīng)陰影濾波器的濾波器系數(shù)被主濾波器用于消除主麥克風捕獲的信號中的擴散噪聲。因為自適應(yīng)陰影濾波器的濾波器系數(shù)在僅檢測到擴散噪聲時用于消除,所以避免了對語音信號的消除。根據(jù)本發(fā)明的第一方面,提供了一種用于自適應(yīng)噪聲消除器的方法,該自適應(yīng)噪聲消除器與位于靠近說話者嘴邊的主麥克風和比主麥克風離說話者嘴邊遠的參考麥克風相關(guān)聯(lián)。在該方法中,由主麥克風捕獲包括語音和噪聲的第一信號,以及由參考麥克風捕獲主要包括噪聲的第二信號。自適應(yīng)陰影濾波器被適配于第一信號與第二信號之間的相關(guān)的估計。然后,通過分析適配的自適應(yīng)陰影濾波器的頻率特性來確定第二信號是否主要包括擴散噪聲。如果認為第二信號主要包括擴散噪聲,則陰影濾波器的濾波器系數(shù)被傳遞到主濾波器以用于消除第一輸入信號的擴散噪聲。根據(jù)本發(fā)明的第二方面,提供了一種自適應(yīng)噪聲消除器,其包括位于靠近說話者嘴邊的主麥克風和比主麥克風離說話者嘴邊遠的參考麥克風。主麥克風被配置為捕獲包括語音和噪聲的第一信號,以及參考麥克風被配置為由參考麥克風捕獲主要包括噪聲的第二信號(yjt))。自適應(yīng)噪聲消除器還包括自適應(yīng)陰影濾波器和擴散噪聲場檢測器,自適應(yīng)陰影濾波器被配置為適配于第一信號與第二信號之間的相關(guān)的估計,擴散噪聲場檢測器被配置為通過分析適配的自適應(yīng)陰影濾波器的頻率特性來確定第二信號是否主要包括擴散噪聲。另外,自適應(yīng)噪聲消除器還包括主濾波器,主濾波器被配置為使用陰影濾波器的濾波器系數(shù)來消除第一輸入信號的擴散噪聲。所提出的本發(fā)明的實施例中的方案涉及兩個濾波器的組合。第一濾波器充當連續(xù)適配的陰影濾波器,以基于誤差信號估計兩個麥克風處的相關(guān)信號。當認為僅背景(遠場)噪聲出現(xiàn)在捕獲的聲場中時,連續(xù)適配的濾波器的濾波器權(quán)重被傳遞給第二濾波器。因此,本發(fā)明的實施例的優(yōu)點在于因為陰影濾波器連續(xù)適配于輸入數(shù)據(jù),不需要在毎次語音活動中斷時經(jīng)歷突然的重新收斂。而且,遠場噪聲具有擴散相干性,在低頻處具有高度相關(guān)的信號,以及在高頻處具有低的空間相關(guān)性。當僅擴散噪聲出現(xiàn)在捕獲的聲場中吋,陰影濾波器的傳遞函數(shù)表現(xiàn)出低通特性。通過針對陰影濾波器的傳遞函數(shù)檢測高頻處的高幅度成分,進行對捕獲的聲場中的近場信號出現(xiàn)的檢測。這得到本發(fā)明的實施例的另外的好處,因為這樣的方案允許基于空間分布且獨立地基于活躍的聲源的頻譜成分來區(qū)分背景噪聲和近場語音。
圖I示出了根據(jù)本發(fā)明的實施例的自適應(yīng)噪聲消除器。圖2示出了根據(jù)本發(fā)明的實施例的擴散噪聲場檢測器。圖3示出了根據(jù)本發(fā)明的實施例可以實現(xiàn)的頻率的閾值函數(shù)的示例。圖4示出了根據(jù)本發(fā)明的實施例的方法的流程圖。 圖5示出了針對不同值d的完全擴散噪聲場的空間相干性。圖6示出了根據(jù)本發(fā)明的實施例的、來自在真實世界環(huán)境下執(zhí)行的雙麥克風讀數(shù)的并且包括餐館中的背景噪聲的數(shù)據(jù)的空間相干性。圖7示出了在典型的真實世界環(huán)境中獲得的本發(fā)明的實施例的性能的示例。圖8示出了根據(jù)本發(fā)明的實施例的噪聲消除器的示例實現(xiàn)。
具體實施例方式下面將參考附圖更完全地描述本發(fā)明,在附圖中示出了本發(fā)明的優(yōu)選實施例。然而,本發(fā)明可以以許多不同的形式來具體實現(xiàn),并且不應(yīng)該解釋為限于本文闡述的實施例;相反,提供這些實施例以便本公開將是全面的完整的,并且將向本領(lǐng)域普通技術(shù)人員完全傳遞本發(fā)明的范圍。在附圖中,相似的參考標記指代類似的単元。而且,本領(lǐng)域普通技術(shù)人員應(yīng)該明白,本文下面說明的裝置和功能可以使用軟件功能結(jié)合編程的微處理器或通用計算機來實現(xiàn),和/或使用專用集成電路(ASIC)來實現(xiàn)。還應(yīng)該明白,盡管主要以方法和設(shè)備的形式來描述本發(fā)明,但是本發(fā)明還可以具體實現(xiàn)在計算機程序產(chǎn)品以及包括計算機處理器和耦合到處理器的存儲器的系統(tǒng)中,其中存儲器編碼有可以執(zhí)行本文公開的功能的ー個或多個程序。本發(fā)明的實施例涉及如圖I所示的噪聲消除器。自適應(yīng)噪聲消除器150包括主麥克風100,位于靠近說話者嘴邊;以及參考麥克風102,比主麥克風100離說話者嘴邊遠。參考麥克風102可以面對與主麥克風100相反的方向。主麥克風100被配置為捕獲包括語音和噪聲的第一信號yp(t);以及參考麥克風102被配置為捕獲主要包括噪聲的第二信號yr (t)。自適應(yīng)噪聲消除器150還包括自適應(yīng)陰影濾波器104,被配置為適配于第一信號yp(t)與第二信號yjt)之間的相關(guān)的估計;擴散噪聲檢測器112,被配置為通過分析適配的自適應(yīng)陰影濾波器的頻率特性來確定第二信號是否主要包括擴散噪聲。因為對頻率特性進行分析,所以來自自適應(yīng)陰影濾波器的信號通過例如FFT操作110被轉(zhuǎn)換到頻域。包括主濾波器108,主濾波器108被配置為使用陰影濾波器104的濾波器系數(shù)來消除第一輸入信號yp(t)的擴散噪聲。這可以通過減法器40從主麥克風信號(稱為第一信號)yp(t)中減去估計的噪聲來完成,其中低頻處的噪聲被消除。為了使得自適應(yīng)濾波器適配于對第一信號與第二信號之間的相關(guān)的估計,自適應(yīng)陰影濾波器104被配置為對第二信號濾波以產(chǎn)生第二信號的濾波版本,并且噪聲消除器150還包括減法器106,被配置為根據(jù)第一信號與第二信號的濾波版本之間的差來生成誤差信號e(t)。自適應(yīng)陰影濾波器還適合于利用誤差信號e(t)和第二信號更新其濾波器系數(shù),以適配于第一信號中與第二信號相關(guān)的那部分的估計。因此,本發(fā)明的實施例的基本思想在于基于參考麥克風信號和誤差信號,自適應(yīng)陰影濾波器連續(xù)地適配于兩個麥克風處的相關(guān)信號的估計(即第一信號與第二信號之間的相關(guān)的估計),該誤差信號被計算為主麥克風捕獲的信號與估計的相關(guān)信號之間的差。該估計用于當擴散噪聲場檢測器檢測到擴散噪聲時從主麥克風捕獲的信號中消除擴散噪聲。如上所述,擴散噪聲檢測器112 (如在圖2中進ー步說明的)檢測是否僅擴散噪聲出現(xiàn)在估計的信號中。根據(jù)ー個實施例,擴散噪聲場檢測器包括分析器114,其適合于確定適配的自適應(yīng)陰影濾波器的傳遞函數(shù)在高頻處(即高于第一閾值199的頻率處)的幅度的預(yù)定部分是否高于第二閾值116。即,用于定義高頻的第一閾值199是基于主麥克風與參考麥克風之間的距離確定的。第二閾值116可以是ー些參數(shù)的函數(shù),或者是固定閾值,所述參數(shù)例如與輸入信號的功率譜估計相關(guān)(如圖3中例示的那樣)。分析器被配置為如果例如通過比較傳遞 函數(shù)在不同頻率點的幅度,適配的自適應(yīng)陰影濾波器的傳遞函數(shù)在高頻的幅度的預(yù)定部分低于第二閾值,則確定第二信號主要包括擴散噪聲。適配的自適應(yīng)陰影濾波器的傳遞函數(shù)的幅度的預(yù)定部分可以是高于第一閾值199的預(yù)定數(shù)目的頻率點。對高于第一閾值的頻率點進行計數(shù)120,并且與第三閾值進行比較122。確定用于檢測擴散噪聲的第三閾值。當檢測到擴散噪聲吋,決定126經(jīng)由濾波器權(quán)重緩沖器向主濾波器傳遞估計的陰影濾波器的濾波器權(quán)重,其對參考麥克風信號濾波,以產(chǎn)生對噪聲信號的估計。當分析器在捕獲的聲場中檢測到近場信號時,即當不僅檢測到擴散噪聲時,可以使用先前傳遞的濾波器權(quán)重來處理輸入信號。為了進一步描述根據(jù)本發(fā)明的實施例的解決方案,圖I示出的兩個麥克風輸入yp (t)和yr(t)被考慮如下yp(t) = sp (t) +np (t) +vp (t)(I)yr(t) = sr(t)+nr(t)+vr(t)其中,yp(t)是主麥克風的輸入信號,以及(t)是參考麥克風的輸入信號,sp(t)和sjt)分別是主麥克風和參考麥克風處的期望的信號的貢獻,np(t)和njt)是主麥克風和參考麥克風處的相干噪聲分量,以及vp(t)和\(t)是主麥克風和參考麥克風處的非相干
噪聲分量。根據(jù)本發(fā)明的實施例的自適應(yīng)噪聲消除器的目標是利用通過使用輔麥克風信號yr(t)獲得的附加信息來抑制主麥克風信號yp(t)中的相干噪聲分量。相干噪聲分量之間的線性關(guān)系可以假設(shè)如下np(t) = G(z). nr(t)(2)該結(jié)果可以變形為對主麥克風和參考麥克風之間針對噪聲的相干部分的傳遞函數(shù)G(Z)的估計。該傳遞函數(shù)G(Z)可以是非因果關(guān)系的。因此,可以使用信號np(t)的延遲版本來執(zhí)行對傳遞函數(shù)的估計,標為。通過下式給出根據(jù)實施例的自適應(yīng)噪聲消除器的輸出e{t) = yp (I) - G{z).yr (t)
權(quán)利要求
1.一種用于自適應(yīng)噪聲消除器的方法,所述自適應(yīng)噪聲消除器與位于靠近說話者嘴邊的主麥克風和比主麥克風離說話者嘴邊遠的參考麥克風相關(guān)聯(lián),所述方法包括步驟 由主麥克風捕獲(401)包括語音和噪聲的第一信號, 由參考麥克風捕獲(402)主要包括噪聲的第二信號, 將自適應(yīng)陰影濾波器適配(403)于第一信號與第二信號之間的相關(guān)的估計, 通過分析(404a)適配的自適應(yīng)陰影濾波器的頻率特性來確定(404)第二信號是否主要包括擴散噪聲, 如果認為第二信號主要包括擴散噪聲,則 將陰影濾波器的濾波器系數(shù)傳遞(405)到主濾波器以用于消除第一輸入信號的擴散噪聲。
2.根據(jù)權(quán)利要求I所述的方法,其中通過下述方式將自適應(yīng)陰影濾波器適配(403)于第一信號中與第二信號相關(guān)的部分的估計 由自適應(yīng)陰影濾波器對第二信號濾波(407),以產(chǎn)生第二信號的濾波版本, 根據(jù)第一信號與第二信號的濾波版本之間的差來生成(408)誤差信號,以及利用誤差信號和第二信號更新(409)陰影濾波器的濾波器系數(shù),以適配于第一信號中與第二信號相關(guān)的所述部分的估計。
3.根據(jù)權(quán)利要求1-2中的任一項所述的方法,通過下述方式分析適配的自適應(yīng)陰影濾波器的頻率特性 確定(410)適配的自適應(yīng)陰影濾波器的傳遞函數(shù)在高于第一閾值的頻率處的幅度的預(yù)定部分是否低于第二閾值,以及 如果認為適配的自適應(yīng)陰影濾波器的傳遞函數(shù)在高于第一閾值的頻率處的幅度的所述預(yù)定部分低于第二閾值,則確定(411)第二信號主要包括擴散噪聲。
4.根據(jù)權(quán)利要求3所述的方法,其中適配的自適應(yīng)陰影濾波器的傳遞函數(shù)的幅度的所述預(yù)定部分是高于第一閾值的預(yù)定數(shù)目的頻率點。
5.根據(jù)權(quán)利要求3-4中的任一項所述的方法,其中所述第一閾值取決于主麥克風和參考麥克風之間的距離。
6.根據(jù)權(quán)利要求3-4中的任一項所述的方法,其中,所述第二閾值取決于第一輸入信號與第二輸入信號中的至少ー個。
7.根據(jù)權(quán)利要求1-4中的任一項所述的方法,其中如果第二信號不是主要包括擴散噪聲,則使用(406)先前使用的主濾波器的濾波器系數(shù)。
8.一種自適應(yīng)噪聲消除器(150),包括位于靠近說話者嘴邊的主麥克風(100)和比主麥克風(100)離說話者嘴邊遠的參考麥克風(102),其中所述主麥克風(100)被配置為捕獲包括語音和噪聲的第一信號(yp(t)),以及所述參考麥克風(102)被配置為由所述參考麥克風捕獲主要包括噪聲的第二信號(yjt)),所述自適應(yīng)噪聲消除器(150)還包括自適應(yīng)陰影濾波器(104)和擴散噪聲場檢測器(112),所述自適應(yīng)陰影濾波器(104)被配置為適配于第一信號(yp(t))與第二信號(yjt))之間的相關(guān)的估計,所述擴散噪聲場檢測器(112)被配置為通過分析適配的自適應(yīng)陰影濾波器(104)的頻率特性來確定第二信號(yjt))是否主要包括擴散噪聲,以及所述自適應(yīng)噪聲消除器(150)還包括主濾波器(108),所述主濾波器(108)被配置為使用陰影濾波器(104)的濾波器系數(shù)來消除第一輸入信號(yp(t))的擴散噪聲。
9.根據(jù)權(quán)利要求8所述的自適應(yīng)噪聲消除器(150),其中所述自適應(yīng)陰影濾波器(104)被配置為通過下述方式適配于第一信號(yp(t))與第二信號(yjt))之間的相關(guān)的估計 所述自適應(yīng)陰影濾波器(104)被配置為對第二信號濾波,以產(chǎn)生第二信號的濾波版本,以及 所述自適應(yīng)噪聲消除器(150)包括減法器(106),所述減法器(106)被配置為根據(jù)第一信號與第二信號的濾波版本之間的差來生成誤差信號,以及 所述自適應(yīng)陰影濾波器(104)適合于利用誤差信號和第二信號(yjt))更新其濾波器系數(shù),以適配于第一信號中與第二信號相關(guān)的所述部分的估計。
10.根據(jù)權(quán)利要求8-9中的任一項所述的自適應(yīng)噪聲消除器,其中所述擴散噪聲檢測器(112)包括分析器(114),所述分析器(114)適合于 確定適配的自適應(yīng)陰影濾波器的傳遞函數(shù)在高于第一閾值(199)的頻率處的幅度的預(yù)定部分是否高于第二閾值(116),以及 如果認為適配的自適應(yīng)陰影濾波器的傳遞函數(shù)在高于第一閾值的頻率處的幅度低于第二閾值(116),則確定第二信號主要包括擴散噪聲。
11.根據(jù)權(quán)利要求10所述的自適應(yīng)噪聲消除器,其中適配的自適應(yīng)陰影濾波器(104)的傳遞函數(shù)的幅度的所述預(yù)定部分是高于第一閾值(199)的預(yù)定數(shù)目的頻率點。
12.根據(jù)權(quán)利要求10-11中的任一項所述的自適應(yīng)噪聲消除器,其中所述第一閾值(116)取決于主麥克風(100)和參考麥克風(102)之間的距離。
13.根據(jù)權(quán)利要求10-11中的任一項所述的自適應(yīng)噪聲消除器,其中,所述第二閾值(102)取決于第一信號yp(t)與第二信號yr(t)中的至少ー個。
14.根據(jù)權(quán)利要求8-11中的任一項所述的自適應(yīng)噪聲消除器,其中所述主濾波器(100)被配置為如果第二信號yjt)不是主要包括擴散噪聲,則使用先前使用的主濾波器(100)的濾波器系數(shù)。
全文摘要
本發(fā)明涉及用于語音編碼器中的改進的噪聲消除器的方法和裝置。主麥克風聯(lián)合參考麥克風捕獲聲音信號。自適應(yīng)陰影濾波器被適配于在主麥克風中捕獲的信號與參考麥克風中捕獲的信號之間的相關(guān)。此外,引入擴散噪聲場檢測器,其檢測擴散噪聲的存在。當擴散噪聲場檢測器檢測到擴散噪聲時,自適應(yīng)陰影濾波器的濾波器系數(shù)被主濾波器用于消除主麥克風捕獲的信號中的擴散噪聲。因為自適應(yīng)陰影濾波器的濾波器系數(shù)在僅檢測到擴散噪聲時用于消除,所以避免了對語音信號的消除。
文檔編號G10L21/02GK102859591SQ201080066159
公開日2013年1月2日 申請日期2010年4月12日 優(yōu)先權(quán)日2010年4月12日
發(fā)明者扎拉·葉默赫, 安德爾斯·埃里克松 申請人:瑞典愛立信有限公司