專利名稱:抑制風(fēng)噪聲的系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及聲學(xué),尤其是涉及一個提高處理聲音的感知質(zhì)量的系統(tǒng)。
背景技術(shù):
一些免提通信設(shè)備捕捉、吸取及傳送語音信號。語音信號通過通信介質(zhì)從一個系統(tǒng)傳遞到另一個系統(tǒng)中。包括車輛中所使用的一些系統(tǒng)中,語音信號的清晰度并不依賴于通信系統(tǒng)的質(zhì)量或通信介質(zhì)的質(zhì)量。當(dāng)噪聲出現(xiàn)在聲源或接收器附近時,所導(dǎo)致的失真使語音信號混亂,破壞信息,且在某些情況下,屏蔽了語音信號,致使收聽者識別不出它。
令人厭煩、使人不能集中注意力的或?qū)е滦畔G失的噪聲可能來源于許多聲源。車輛內(nèi)的噪聲可能是由發(fā)動機、道路、輪胎或空氣的流動而產(chǎn)生。在寬頻率范圍內(nèi)可聽到空氣的自然流動或人工流動。振幅和頻率的連續(xù)波動使得克服噪聲變得困難,且降低了語音信號的清晰度。
許多系統(tǒng)試圖消除風(fēng)噪聲的影響。一些系統(tǒng)依賴于遍布內(nèi)部的各種抑制和消減聲音的材料,以確保一個安靜而舒適的環(huán)境。其它系統(tǒng)則試圖平衡因風(fēng)而引起的壓在接收器上的變化的壓力。這些噪聲減壓器可具有多種形式來濾掉所選擇的壓力,這使得對于車輛的許多內(nèi)部很難設(shè)計。一些語音增強系統(tǒng)的另一個問題是在連續(xù)噪聲背景中檢測風(fēng)噪聲的問題。還有,一些語音增強系統(tǒng)的又一個問題是,它們不易適應(yīng)其它對風(fēng)噪聲敏感的通信系統(tǒng)。
因此,需要有這樣一個系統(tǒng),能消除變化頻率范圍內(nèi)的風(fēng)噪聲。
發(fā)明內(nèi)容
語音增強邏輯提高了處理語音的感知質(zhì)量。本系統(tǒng)學(xué)習(xí)、編碼、然后抑制來自于輸入信號的與空氣流動有關(guān)的噪聲。該系統(tǒng)包括一個噪聲檢測器和一個噪聲衰減器。噪聲檢測器通過建模來檢測一個風(fēng)沖擊,然后噪聲衰減器消減這個風(fēng)沖擊。
另一種語音增強邏輯包括時間頻率變換邏輯、背景噪聲估計器、風(fēng)噪聲檢測器和風(fēng)噪聲衰減器。時間頻率變換邏輯將時間變化輸入信號轉(zhuǎn)換成頻域輸出信號。背景噪聲估計器測量伴隨輸入信號的連續(xù)噪聲。風(fēng)噪聲檢測器自動識別及建模一個風(fēng)沖擊,然后由風(fēng)噪聲衰減器對其進行衰減。
對于本領(lǐng)域的技術(shù)人員,通過查看附圖和詳細(xì)描述,本發(fā)明的其它系統(tǒng)、方法、特點和優(yōu)勢將是,或?qū)⒆兊蔑@而易見。所有這些附加系統(tǒng)、方法、特點和優(yōu)勢都要被包含在該說明中,包含在本發(fā)明的范圍內(nèi),并且受所附權(quán)利要求的保護。
參考附圖和描述,可較好地理解本發(fā)明。圖中的各個部分并不一定按照比例,重點放在說明本發(fā)明的原則上。此外,在圖中將相同的參考數(shù)字指定給不同視圖中的相應(yīng)部分。
圖1是語音增強邏輯的部分框圖。
圖2是與頻域內(nèi)的風(fēng)和其它聲源相關(guān)的噪聲。
圖3是與頻域內(nèi)的風(fēng)和其它聲源相關(guān)的噪聲的信噪比。
圖4是圖1中語音增強邏輯的框圖。
圖5是一個與圖1中語音增強邏輯相耦合的預(yù)處理系統(tǒng)。
圖6是一個與圖1中語音增強邏輯相耦合的另一種預(yù)處理系統(tǒng)。
圖7是另一種語音增強系統(tǒng)的框圖。
圖8是與頻域內(nèi)的風(fēng)和其它聲源相關(guān)的噪聲。
圖9是一個屏蔽一部分語音信號的風(fēng)沖擊圖。
圖10是一個處理與重構(gòu)的語音信號圖。
圖11是語音增強的流程圖。
圖12是語音增強的部分順序圖。
圖13是語音增強的部分順序圖。
圖14是車輛內(nèi)的語音增強邏輯的框圖。
圖15是與音頻系統(tǒng)和/或通信系統(tǒng)接口的語音增強邏輯的框圖。
具體實施例方式
語音增強邏輯提高了處理語音的感知質(zhì)量。該邏輯可實時或延遲地自動學(xué)習(xí)和編碼與空氣流動相關(guān)的噪聲的形狀和方式。通過跟蹤所選屬性,該邏輯利用臨時存儲噪聲的所選屬性的有限內(nèi)存,可消除或衰減風(fēng)噪聲。另外,該邏輯還可衰減連續(xù)噪聲和/或“音樂噪聲”、嘰嘰聲、嘎嘎聲、啾啾聲、卡嗒聲、滴答聲、劈啪聲、低頻率樂音,或一些語音增強系統(tǒng)產(chǎn)生的其它人工聲音。
圖1是語音增強邏輯100的部分框圖。該語音增強邏輯包含能在一個或多個處理器以及一個或多個操作系統(tǒng)上運行的硬件或軟件。高度便攜式邏輯包括一個風(fēng)噪聲檢測器102和一個噪聲衰減器104。
在圖1中,風(fēng)噪聲檢測器102可根據(jù)空氣特征識別并建模與風(fēng)流動相關(guān)的噪聲。當(dāng)風(fēng)噪聲在寬頻范圍內(nèi)自然出現(xiàn)或人工產(chǎn)生時,風(fēng)噪聲檢測器102的配置使其檢測并建模人耳察覺到的風(fēng)噪聲。風(fēng)噪聲檢測器接收輸入的聲音在短期頻譜內(nèi)可分為三類大致的范疇(1)清音,表現(xiàn)出包括與風(fēng)相關(guān)的噪聲的類似噪聲的特征,也就是說,它具有某一頻譜形狀,但不具有諧波或共振峰結(jié)構(gòu);(2)全音,表現(xiàn)出規(guī)則諧波結(jié)構(gòu),或在被描述共振峰結(jié)構(gòu)的頻譜包絡(luò)所加權(quán)的基音諧波處達到峰值;和(3)混音,表現(xiàn)出上面兩類的混合,一些部分包含類似噪聲段,其余部分則表現(xiàn)出規(guī)則諧波結(jié)構(gòu)和/或共振峰結(jié)構(gòu)。
無論輸入段多復(fù)雜或多大聲,風(fēng)噪聲檢測器102都可實時或延遲地從剩余信號中分離出類似噪聲段。然后分析分離的類似噪聲段,檢測風(fēng)噪聲的出現(xiàn),而在一些情況下,檢測連續(xù)基礎(chǔ)噪聲的出現(xiàn)。當(dāng)檢測到風(fēng)噪聲時,就建模頻譜,并且把該模型保留在內(nèi)存中。當(dāng)風(fēng)噪聲檢測器102能夠存儲風(fēng)噪聲信號的整個模型時,它也可以將所選擇的屬性存儲在內(nèi)存中。
為了克服風(fēng)噪聲影響,及在一些情況下,為了克服包括環(huán)境噪聲的基礎(chǔ)連續(xù)噪聲,噪聲衰減器104從清音和混音信號中大體去除或衰減風(fēng)噪聲和/或連續(xù)噪聲。語音增強邏輯100包含任何大體去除或衰減風(fēng)噪聲的系統(tǒng)??伤p或去除風(fēng)噪聲的系統(tǒng)的例子包括利用信號和噪聲估計的系統(tǒng),諸如(1)利用噪聲信號的神經(jīng)網(wǎng)絡(luò)映像和對噪聲抑制信號的噪聲估計的系統(tǒng),(2)從噪聲信號中減去噪聲估計的系統(tǒng),(3)利用噪聲信號和噪聲估計從代碼本中選擇噪聲抑制信號的系統(tǒng),(4)任何利用噪聲信號和噪聲估計,基于屏蔽信號的重構(gòu),來創(chuàng)建噪聲抑制信號的系統(tǒng)。這些系統(tǒng)可衰減風(fēng)噪聲,且在一些情況下,可衰減屬于短期頻譜部分的連續(xù)噪聲。噪聲衰減器104還可接口或包括一個可選的去除或衰減人工處理信號的剩余衰減器106。該剩余衰減器106可去除“音樂噪聲”、嘰嘰聲、嘎嘎聲、啾啾聲、卡嗒聲、滴答聲、劈啪聲、低頻率樂音,或其它人工聲音。
圖2示意與三種風(fēng)流相關(guān)的典型噪聲。風(fēng)沖擊202、204和206是風(fēng)擊打檢測器的情況,它們隨著擊打力度和幅度的不同而變化。幅度反映出接收器或檢測器的輸入?yún)^(qū)內(nèi)所受到的氣壓波動之間的力度或強度上的相對差別。風(fēng)沖擊下面的線表示也可被接收器或檢測器感應(yīng)的連續(xù)噪聲208。車輛中的風(fēng)沖擊表示通過窗戶、敞篷車的敞開頂部、進氣孔的自然流動的空氣,或表示由風(fēng)扇或暖氣、排氣扇和/或空調(diào)系統(tǒng)(HVAC)而引起的人工流動的空氣。連續(xù)噪聲可表示環(huán)境噪聲或與發(fā)動機、電力火車、道路、輪胎或其它聲音相關(guān)的噪聲。
在時間和頻譜域中,連續(xù)噪聲208和風(fēng)沖擊202可以是曲線。連續(xù)噪聲和風(fēng)沖擊可能顯現(xiàn)出圖2中所示曲線的形式或特征。然而,當(dāng)風(fēng)沖擊(例如σWB)的信號強度(以分貝為單位)與信噪比(SNR)域內(nèi)連續(xù)噪聲(例如σCN)的信號強度相關(guān)時,風(fēng)沖擊202具有線性函數(shù)的特征,垂直軸對應(yīng)于分貝,水平軸對應(yīng)于頻率。該關(guān)系表達為SNR=σWB-σCN(等式1)任何方法可近似于風(fēng)沖擊的線性。在信噪比域內(nèi),偏移或Y截距302和X截距或支點表示線性模型302的特征??蛇x擇的是,X或Y坐標(biāo)和斜率可建模風(fēng)沖擊。圖3中,線性模型302以負(fù)斜率下降。
圖4是一個可接收或檢測清音、全音或混音輸入信號的風(fēng)噪聲檢測器102實例的框圖。收到的或檢測到的信號以預(yù)定頻率進行數(shù)字化。為了確保一個高質(zhì)量語音,具有任何公共采樣率的模-數(shù)轉(zhuǎn)換器402(ADC)把語音信號轉(zhuǎn)換為脈沖編碼調(diào)制(PCM)信號。平滑窗口404應(yīng)用于數(shù)據(jù)塊,以獲取窗口信號。窗口信號的復(fù)合頻譜可通過快速傅立葉變換(FFT)406的方式獲得,該變換把數(shù)字信號分離成多個頻率箱,每個箱識別小頻率范圍內(nèi)的振幅和相位。然后把每個頻率箱轉(zhuǎn)換為功率頻譜域408和對數(shù)域410,以產(chǎn)生一個風(fēng)沖擊和連續(xù)噪聲估計。當(dāng)聲音的多窗口得到處理時,風(fēng)噪聲檢測器102可導(dǎo)出平均噪聲估計??梢允褂脮r間平滑或加權(quán)平均來估計每個頻率箱的風(fēng)沖擊和連續(xù)噪聲估計。
為了檢測風(fēng)沖擊,可給SNR域中選擇部分的低頻譜擬合一條直線。通過回歸,一條最佳適配線可測量一個給定數(shù)據(jù)塊內(nèi)風(fēng)噪聲的強度。適配線與低頻譜間的高度相關(guān)可識別一個風(fēng)沖擊。無論高度相關(guān)是否存在,它都依賴于處理聲音的期望清晰度和風(fēng)沖擊的頻率和振幅的變化??蛇x擇的是,當(dāng)適配線的偏移或Y截距超過一個預(yù)定閾值(例如,大于3分貝)時,可識別到一個風(fēng)沖擊。
為了限制語音屏蔽,對可疑風(fēng)沖擊信號的線的擬合可用規(guī)則來約束。示例性規(guī)則可阻止風(fēng)沖擊模型中的計算偏移、斜率或坐標(biāo)點超過一個平均值。當(dāng)檢測到一個元音或另一個諧波結(jié)構(gòu)時,另一個規(guī)則可阻止風(fēng)噪聲檢測器102使用計算風(fēng)沖擊校正。諧波可通過其窄帶寬和陡峰值,或結(jié)合語音或語調(diào)檢測器來識別。如果檢測到一個元音或另一個諧波結(jié)構(gòu),風(fēng)噪聲檢測器就限制風(fēng)沖擊校正值為小于或等于平均值的值。一個附加規(guī)則允許平均風(fēng)沖擊模型或其屬性僅在清音段被更新。如果檢測到語音或混音段,平均風(fēng)沖擊模型或其屬性在這個規(guī)則下不被更新。如果沒有檢測到語音,可通過任何方式來更新風(fēng)沖擊模型或每個屬性,如通過加權(quán)平均或漏斗積分器。一些其它規(guī)則也可應(yīng)用于該模型。這些規(guī)則給可疑風(fēng)沖擊提供了極佳線性擬合,而不需要屏蔽語音段。
為了克服風(fēng)噪聲影響,可通過任何方法使用噪聲衰減器104從噪聲頻譜中徹底去除或衰減風(fēng)沖擊。一種方法將風(fēng)沖擊模型添加到記錄或建模連續(xù)噪聲中。在功率頻譜中,然后把建模噪聲從未修改頻譜中減去。如果基礎(chǔ)波峰或波谷902被風(fēng)沖擊202屏蔽,如圖9所示,或被連續(xù)噪聲屏蔽,傳統(tǒng)的或改進的插值法可用于重構(gòu)波峰和/或波谷,如圖10所示。線性或逐步插補器用于重構(gòu)信號的丟失部分。然后使用逆向FFT將信號功率轉(zhuǎn)換為時間域,提供一個重構(gòu)語音信號。
為了最小化“音樂噪聲”、嘰嘰聲、嘎嘎聲、啾啾聲、卡嗒聲、滴答聲、劈啪聲、低頻率樂音,或由一些風(fēng)噪聲衰減器產(chǎn)生的低頻范圍內(nèi)的其它人工聲音,在語音信號轉(zhuǎn)換為時間域之前,可選的剩余衰減器106(圖1中所示)還可調(diào)節(jié)語音信號。剩余衰減器106跟蹤低頻范圍(例如,大約小于400HZ))內(nèi)的功率譜。當(dāng)檢測到信號功率大幅增長時,可通過將低頻范圍內(nèi)的發(fā)送功率限制或衰減到一個預(yù)定或計算閾值來獲得改進。計算閾值等于或基于較早時期的相同低頻范圍的平均頻譜功率。
通過在風(fēng)噪聲檢測器處理輸入信號之前預(yù)調(diào)節(jié)輸入信號,可獲得語音質(zhì)量的進一步提高。一個預(yù)處理系統(tǒng)探索信號到達圖5中所示分開放置的不同檢測器時的滯后時間。如果使用多檢測器或麥克風(fēng)502將聲音轉(zhuǎn)換為電子信號,預(yù)處理系統(tǒng)就可包括自動選擇感應(yīng)最少數(shù)量噪聲的麥克風(fēng)502和信道的控制邏輯504。當(dāng)選擇了另一個麥克風(fēng)502時,電信號在被風(fēng)噪聲檢測器102處理之前與原先產(chǎn)生信號相混合。
可選擇的是,多風(fēng)噪聲檢測器102可以用來分析圖6中所示的每個麥克風(fēng)502的輸入??稍诿總€信道中完成頻譜風(fēng)沖擊估計。一個或多個信道的混合通過在麥克風(fēng)502的輸出之間交換來進行。在順次排列的頻率的基礎(chǔ)上估計并選擇信號,直到達到支點304(如圖3所示)的頻率為止??蛇x擇的是,控制邏輯602通過加權(quán)函數(shù)在特定頻率或頻率范圍內(nèi)混合多個風(fēng)噪聲檢測器102的輸出信號。當(dāng)超過支點的頻率時,進程可繼續(xù)進行或使用標(biāo)準(zhǔn)自適應(yīng)形成方法。
圖7是另一個也能提高處理聲音的感知質(zhì)量的語音增強邏輯700。這一提高可由將時間變化信號數(shù)字化并轉(zhuǎn)換為頻域的時間-頻率變換邏輯702來完成。背景噪聲估計器704測量出現(xiàn)在聲源或接收器附近的連續(xù)或環(huán)境噪聲。背景噪聲估計器704包括一個平均每個頻率箱內(nèi)聲音功率的功率檢測器。為了阻止瞬時變化的有偏噪聲估計,瞬變檢測器706在功率的異?;虿豢深A(yù)測增加時取消噪聲估計過程。圖7中,當(dāng)瞬時背景噪聲B(f,i)超過平均背景噪聲B(f)AVE大于一個選定分貝級“C”時,瞬變檢測器706禁止背景噪聲估計器704。這一關(guān)系可表示為B(f,i)>B(f)AVE+C (等式2)。
為了檢測風(fēng)沖擊,風(fēng)噪聲檢測器708為SNR域內(nèi)頻譜的選定部分?jǐn)M合一條直線。通過回歸,一條最佳適配線可建模風(fēng)噪聲202的強度,如圖8所示。為了限制語音的任何屏蔽,對可疑風(fēng)沖擊線的擬合可由上文描述的規(guī)則來約束。當(dāng)適配線的偏移量或Y軸截距超過一預(yù)定閾值時或當(dāng)擬合線和與風(fēng)沖擊相關(guān)的噪聲之間存在一個高度相關(guān)時,就可識別出風(fēng)沖擊。無論高度相關(guān)是否存在,都依賴于處理聲音的期望清晰度及風(fēng)沖擊的頻率和振幅的變化。
可選擇的是,可通過分析顯示在頻譜儀上的輸入信號的時間變化頻譜特征,來識別風(fēng)沖擊。頻譜儀可產(chǎn)生一個二維圖形,被稱作頻譜圖,其垂直軸對應(yīng)頻率,水平軸對應(yīng)時間。
信號鑒別器710實時或延遲地標(biāo)記頻譜中的語音和噪聲。可使用任何方法辨別語音和噪聲。圖7中,語音信號的識別可通過(1)其頻帶的窄帶寬或波峰;(2)諧波相關(guān)的諧振結(jié)構(gòu);(3)與共振峰頻率相對應(yīng)的諧振或?qū)挷ǚ澹?4)隨時間相對緩慢變化的特征;(5)它們的持續(xù)時間;和當(dāng)使用多檢測器或麥克風(fēng)時,(6)檢測器或麥克風(fēng)的輸出信號的關(guān)聯(lián)。
為了克服噪聲的影響,可通過任何方法使用風(fēng)噪聲衰減器712衰減或從噪聲中徹底去除風(fēng)沖擊。一種方法將大體線性風(fēng)沖擊模型添加到記錄或建模連續(xù)噪聲中。然后在功率頻譜中,通過上文所述的方法從未修改的頻譜中去除建模噪聲。如果基礎(chǔ)波峰或波谷902被風(fēng)沖擊202屏蔽,如圖9所示,或被連續(xù)噪聲屏蔽,就使用傳統(tǒng)的或改進的插值法重構(gòu)波峰和/或波谷,如圖10所示。線性或逐步插補器用于重構(gòu)信號的丟失部分。然后利用時間序列合成器將信號功率轉(zhuǎn)換為時間域,提供一個重構(gòu)語音信號。
為了最小化“音樂噪聲”、嘰嘰聲、嘎嘎聲、啾啾聲、卡嗒聲、滴答聲、劈啪聲、低頻率樂音,或由一些風(fēng)噪聲衰減器產(chǎn)生的低頻范圍內(nèi)的其它人工聲音,還可使用一個替代的剩余衰減器714。該剩余衰減器714跟蹤低頻范圍內(nèi)的功率頻譜。當(dāng)檢測到信號功率的大幅度增加時,通過將低頻范圍內(nèi)的發(fā)送功率限制在一個預(yù)定或計算閾值,來獲得改進。計算閾值等于或基于較早時期的相同低頻范圍的平均頻譜功率。
圖11是語音增強的流程圖,去除一些風(fēng)沖擊和連續(xù)噪聲以提高處理語音的感知質(zhì)量。在動作1102,以預(yù)定頻率對收到的或檢測到的信號進行數(shù)字化。為確保好的語音質(zhì)量,ADC把語音信號轉(zhuǎn)換為PCM信號。在動作1104,通過FFT的方式可獲得窗口信號的復(fù)合頻譜,該FFT將數(shù)字信號分離到各個頻率箱中,每個箱識別小頻率范圍的振幅和相位。
在動作1106,檢測連續(xù)或環(huán)境噪聲。背景噪聲估計包括每個頻率箱中聲音功率的平均值。為了防止瞬間的有偏噪聲估計,在動作1108,在功率異?;虿豢深A(yù)測的上升時終止噪聲估計進程。當(dāng)瞬時背景噪聲超過平均背景噪聲大于一個預(yù)定分貝級時,瞬變檢測動作1108取消背景噪聲估計。
在動作1110,當(dāng)偏移量超過預(yù)定閾值(例如,閾值大于3分貝)或當(dāng)最佳擬合線與低頻頻譜間的高度相關(guān)退出時,可檢測到風(fēng)沖擊。可選擇的是,通過分析輸入信號的時間變化頻譜特征,來識別風(fēng)沖擊。當(dāng)使用直線擬合檢測方法時,可疑風(fēng)沖擊信號的擬合線受一些可選動作的約束。示例可選動作阻止風(fēng)沖擊模型中的計算偏移、斜率或坐標(biāo)點超過一個平均值。當(dāng)檢測到一個元音或另一個諧振結(jié)構(gòu)時,另一可選動作阻止風(fēng)噪聲檢測法使用計算風(fēng)沖擊校正。如果檢測到元音或另一個諧振結(jié)構(gòu)時,風(fēng)噪聲檢測法將風(fēng)沖擊校正值限定到小于或等于平均值。一個附加可選動作允許平均風(fēng)沖擊模型或?qū)傩詢H在清音段被更新。如果檢測到語音或混音段,則在這一動作下不更新平均風(fēng)沖擊模型或?qū)傩?。如果沒有檢測到語音時,則可通過如加權(quán)平均或漏斗積分器等許多方式對風(fēng)沖擊模型或每個屬性進行更新。許多其它可選動作也可應(yīng)用于該模型。
在動作1112,信號分析可鑒別或標(biāo)記來自類似噪聲段的語音信號??赏ㄟ^以下方法進行語音信號的識別,例如,(1)其頻帶的窄帶寬或波峰;(2)諧波相關(guān)的諧振結(jié)構(gòu);(3)與共振峰頻率相對應(yīng)的諧波;(4)隨時間相對緩慢變化的特征;(5)它們的持續(xù)時間;和當(dāng)使用多檢測器或麥克風(fēng)時,(6)檢測器或麥克風(fēng)的輸出信號的關(guān)聯(lián)。
為了克服風(fēng)噪聲的影響,利用任一動作從噪聲頻譜中徹底去除或衰減風(fēng)噪聲。一個示例動作1114將大體線性風(fēng)沖擊模型添加到記錄或建模連續(xù)噪聲中。然后在功率頻譜中,由上文所述的方法和系統(tǒng)從未修改頻譜中徹底去除建模噪聲。如果基礎(chǔ)波峰或波谷902被風(fēng)沖擊202屏蔽,如圖9所示,或被連續(xù)噪聲屏蔽,就在動作1116使用傳統(tǒng)的或改進的插值法重構(gòu)波峰和/波谷。然后在動作1120使用時間序列合成將信號功率轉(zhuǎn)換成時間域,提供一個重構(gòu)語音信號。
為了最小化“音樂噪聲”、嘰嘰聲、嘎嘎聲、啾啾聲、卡嗒聲、滴答聲、劈啪聲、低頻率樂音,或由一些風(fēng)噪聲衰減器產(chǎn)生的低頻范圍內(nèi)的其它人工聲音,在將信號轉(zhuǎn)化回時間域之前,也可執(zhí)行剩余衰減方法。一可選的剩余衰減方法1118跟蹤低頻范圍內(nèi)的功率頻譜。當(dāng)檢測到信號功率的大幅度上升時,可通過將低頻范圍的發(fā)送功率限制到一個預(yù)定或計算閾值,來獲得改進。計算閾值等于或基于較早時期的相同低頻范圍的平均頻譜功率。
圖12和圖13是語音增強的部分序列圖。如圖11中所示的方法一樣,在信號承載介質(zhì)(諸如存儲器的計算機可讀介質(zhì))中,對序列圖進行編碼,在諸如一個或多個集成電路內(nèi)對其進行編程,或由控制器或計算機進行處理。如果利用軟件執(zhí)行這些方法,該軟件就駐留在常駐或接口到風(fēng)噪聲檢測器102的存儲器、通信接口、或其它所有類型的接口到或常駐在語音增強邏輯100或700的非易失性或易失性存儲器中。存儲器包括執(zhí)行邏輯功能的可執(zhí)行指令的有序列表。邏輯功能可通過數(shù)字電路、源代碼或通過模擬電子、音頻或視頻信號的模擬源來實現(xiàn)。軟件可以包含在任何計算機可讀或信號承載介質(zhì)中,該介質(zhì)被指令可執(zhí)行系統(tǒng)、儀器或設(shè)備使用或與其連接。這樣的系統(tǒng)包括基于計算機的系統(tǒng)、包含處理器的系統(tǒng)、或從可執(zhí)行指令的指令可執(zhí)行系統(tǒng)、儀器或設(shè)備有選擇地讀取指令的其它系統(tǒng)。
一個“計算機可讀介質(zhì)、“機器可讀介質(zhì)、“傳播信號介質(zhì)”和/或“信號承載介質(zhì)”包括許多方式,這些方式包含、存儲、通信、傳播或傳輸指令可執(zhí)行系統(tǒng)、儀器或設(shè)備所使用的與其連接的軟件。機器可讀介質(zhì)可選擇地,是但并不局限于,電子、磁性、光學(xué)、電磁、紅外或半導(dǎo)體系統(tǒng)、儀器、設(shè)備或傳播介質(zhì)。機器可讀介質(zhì)的非窮盡列舉表的實例包括具有一根或多根導(dǎo)線的電連接的“電子設(shè)備”、便攜式磁盤或光盤,如隨機存取存儲器“RAM”(電子的)的易失性存儲器、只讀存儲器“ROM”(電子的)、可檫可編程只讀存儲器(EPROM或閃存)(電子的)或光纖(光學(xué)的)。機器可讀介質(zhì)還可包括在其上面打印有軟件的有形介質(zhì),如同軟件作為一個圖像或以另一種格式(例如,通過光掃描)被電子存儲,然后被編譯,并且/或者被解釋或作其它的處理。處理的介質(zhì)然后被存儲在計算機和/或機器存儲器中。
如圖12的第一個序列所示,時間序列信號可由漢寧窗(HanningWindow)進行數(shù)字化并平滑,以提供全音、混音或清音段的準(zhǔn)確估計,窗信號的復(fù)合頻譜通過FFT方式來獲得,F(xiàn)FT把數(shù)字信號分離到各個頻率箱中,各個箱識別小頻率范圍內(nèi)的振幅。
在第二個序列中,清音段的每個頻率箱中的平均聲音功率導(dǎo)出背景噪聲估計。為了阻止有偏噪聲估計,當(dāng)檢測到異?;虿豢深A(yù)測的功率波動時,噪聲估計就不發(fā)生。
在第三個序列中,未修改頻譜由窗口進行數(shù)字化、平滑,并由FFT變換成復(fù)合頻譜。未修改頻譜顯示出包含類似噪聲段的部分以及其它表明規(guī)則諧振結(jié)構(gòu)的部分。
在第四個序列中,聲音段被擬合成分離線,以建模風(fēng)和連續(xù)噪聲的強度。為提供較完整的解釋,示意了清音、全音和混音樣本。每個樣本的頻率箱被轉(zhuǎn)換成功率頻譜域和對數(shù)域,以探索風(fēng)沖擊和連續(xù)噪聲估計。隨著較多窗口的處理,就可以推導(dǎo)出平均風(fēng)噪聲和連續(xù)噪聲估計。
為了檢測風(fēng)沖擊,給SNR域內(nèi)的信號的選定部分?jǐn)M合一條直線。通過回歸,最佳適配線建模每個示例中風(fēng)噪聲的強度。一個最佳適配線與低頻譜之間的高度相關(guān)可識別風(fēng)沖擊。可選擇的是,超過預(yù)定閾值的Y截距也可識別風(fēng)沖擊。為了限制語音的屏蔽,對可疑風(fēng)沖擊信號的線擬合受到上文所述規(guī)則的約束。
為了克服風(fēng)噪聲的影響,可在未更改頻譜中衰減建模噪聲。圖13中,來自清音和混音樣本的風(fēng)沖擊和連續(xù)噪聲的衰減示意在第五個序列中。將信號功率轉(zhuǎn)換為時間域的反向FFT提供重構(gòu)語音信號。
從前面描述很明顯可以看出,上文所述的系統(tǒng)可調(diào)節(jié)僅從一個麥克風(fēng)或檢測器所接收的信號。顯然,許多系統(tǒng)的組合也可用于識別及跟蹤風(fēng)沖擊。除了對可疑風(fēng)沖擊擬合線之外,一個系統(tǒng)可(1)檢測具有大于預(yù)定閾值的SNR的頻譜的波峰;(2)識別寬度大于預(yù)定閾值的波峰;(3)識別缺乏諧波關(guān)系的波峰;(4)把波峰與先前語音頻譜進行比較;(5)在區(qū)分風(fēng)沖擊段、其它類似噪聲段和規(guī)則諧振結(jié)構(gòu)之前,比較從不同麥克風(fēng)檢測到的信號。上文所述的一個或多個系統(tǒng)也可應(yīng)用在可選擇的語音增強邏輯中。
其它可選擇語音增強系統(tǒng)包括上文所述結(jié)構(gòu)和功能的組合。這些語音增強系統(tǒng)由上文所述的或附圖中示意的結(jié)構(gòu)和功能的任意組合構(gòu)成。邏輯可在硬件或軟件中實現(xiàn)。術(shù)語“邏輯”廣義上可包括硬件設(shè)備或電路、軟件或其組合。硬件包括處理器或具有易失性和/或非易失性存儲器的控制器,還可包括通過無線和/或硬件介質(zhì)連接外圍設(shè)備的接口。
語音增強邏輯方便適應(yīng)任何技術(shù)或設(shè)備。如圖14所示的一些語音增強系統(tǒng)或組件接口或耦合車輛,將語音和其它聲音轉(zhuǎn)換為可傳送到遠(yuǎn)方的一種形式的設(shè)備,如圖15所示的有線和無線電話及音頻設(shè)備,以及其它對風(fēng)噪聲敏感的通信系統(tǒng)。
語音增強邏輯提高了處理語音的感知質(zhì)量。邏輯可實時或延遲地自動學(xué)習(xí)和編碼與空氣的流動相關(guān)的噪聲的形狀和形式。通過跟蹤所選擇的屬性,利用臨時或永久存儲風(fēng)噪聲的所選屬性的有限存儲器,邏輯可以消除或衰減風(fēng)噪聲。語音增強邏輯還可消減連續(xù)噪聲和/或嘰嘰聲、嘎嘎聲、啾啾聲、卡嗒聲、滴答聲、劈啪聲、低頻率樂音或其它一些語音增強系統(tǒng)內(nèi)產(chǎn)生的人工聲音,并且在必要時重構(gòu)語音。雖然已經(jīng)描述了本發(fā)明的多種實施例,但對本領(lǐng)域內(nèi)的普通技術(shù)人員來說,很明顯本發(fā)明范圍還可以包括更多實施方案和實例。因此,除了受所附權(quán)利要求及其等同文件的限定之外,本發(fā)明不受任何限制。
權(quán)利要求
1.一種抑制語音或清音信號中風(fēng)噪聲的系統(tǒng),其包括一個噪聲檢測器,它檢測和建模來自輸入信號的風(fēng)沖擊;和一個噪聲衰減器,它與噪聲檢測器電連接,用來在很大程度上去除輸入信號中的風(fēng)沖擊。
2.如權(quán)利要求1所述的風(fēng)噪聲抑制系統(tǒng),其中噪聲檢測器對部分的輸入信號建模一條線。
3.如權(quán)利要求2所述的系統(tǒng),其中配置噪聲檢測器,使其對SNR域中的輸入信號的一部分?jǐn)M合一條線。
4.如權(quán)利要求1所述的系統(tǒng),其中配置噪聲檢測器,使其通過計算信號的偏移量來對風(fēng)沖擊建模。
5.如權(quán)利要求1所述的系統(tǒng),其中配置噪聲檢測器,使其阻止已建模風(fēng)沖擊的屬性超過其各自的平均值。
6.如權(quán)利要求1所述的系統(tǒng),其中配置噪聲檢測器,使其在檢測到元音或諧波類似結(jié)構(gòu)時,限制風(fēng)沖擊的校正。
7.如權(quán)利要求1所述的系統(tǒng),其中配置噪聲檢測器,使其導(dǎo)出一個平均的風(fēng)沖擊模型,當(dāng)檢測到語音或混音信號時,將不更新該平均風(fēng)沖擊模型。
8.如權(quán)利要求1所述的系統(tǒng),其中配置噪聲檢測器,使其導(dǎo)出一個平均的風(fēng)沖擊模型,該模型是通過較早分析的其它建模信號的加權(quán)平均得到的。
9.如權(quán)利要求1所述的系統(tǒng),其中配置噪聲衰減器,使其在很大程度上去除輸入信號中的風(fēng)沖擊和連續(xù)噪聲。
10.如權(quán)利要求1所述的系統(tǒng),還包括一個與噪聲檢測器和噪聲衰減器導(dǎo)電耦合的剩余衰減器,當(dāng)檢測到低頻范圍內(nèi)信號功率的大幅增長時,該剩余衰減器衰減低頻范圍內(nèi)的信號功率。
11.如權(quán)利要求1所述的系統(tǒng),還包括一個與噪聲檢測器導(dǎo)電耦合的輸入設(shè)備,該輸入設(shè)備的配置使得聲波轉(zhuǎn)換為模擬信號。
12.如權(quán)利要求1所述的系統(tǒng),還包括一個與噪聲檢測器耦合的預(yù)處理系統(tǒng),該預(yù)處理系統(tǒng)的配置使其在風(fēng)噪聲檢測器處理輸入信號之前,預(yù)處理該輸入信號。
13.如權(quán)利要求12所述的系統(tǒng),其中預(yù)處理系統(tǒng)包括空間上隔開的第一麥克風(fēng)和第二麥克風(fēng),并且其配置使得可以利用到達不同檢測器的信號的延遲時間。
14.如權(quán)利要求13所述的系統(tǒng),還包括控制邏輯,它自動選擇感應(yīng)輸入信號中最少數(shù)量噪聲的一個麥克風(fēng)和一個聲道。
15.如權(quán)利要求13所述的系統(tǒng),還包括一個與噪聲選擇器和第一麥克風(fēng)耦合的第二噪聲檢測器。
16.一種檢測語音和清音信號中風(fēng)噪聲的系統(tǒng),其包括一個時頻變換邏輯,它將時變輸入信號轉(zhuǎn)換成頻域;一個與時頻變換邏輯耦合的背景噪聲估計器,該背景噪聲估計器的配置使其可以測量出現(xiàn)在接收器附近的連續(xù)噪聲;和一個與背景噪聲估計器耦合的風(fēng)噪聲檢測器,該風(fēng)噪聲檢測器的配置使其可以自動識別和建模與風(fēng)相關(guān)的噪聲。
17.如權(quán)利要求16所述的系統(tǒng),還包括一個瞬變檢測器,其配置使得當(dāng)檢測到瞬變信號時,禁止背景噪聲估計器。
18.如權(quán)利要求16所述的系統(tǒng),其中風(fēng)噪聲檢測器的配置使得導(dǎo)出擬合線與一部分輸入信號之間的關(guān)系。
19.如權(quán)利要求16所述的系統(tǒng),還包括一個與風(fēng)噪聲檢測器耦合的信號鑒別器,該信號鑒別器的配置使其可以標(biāo)記輸入信號的語音和噪聲段。
20.如權(quán)利要求16所述的系統(tǒng),還包括一個與風(fēng)噪聲檢測器耦合的風(fēng)噪聲衰減器,該風(fēng)噪聲衰減器的配置使其可以減少與接收機感應(yīng)到的風(fēng)相關(guān)的噪聲。
21.如權(quán)利要求16所述的系統(tǒng),其中的噪聲衰減器的配置使其在很大程度上去除與輸入信號中的風(fēng)相關(guān)的噪聲。
22.如權(quán)利要求16所述的系統(tǒng),還包括一個與背景噪聲估計器耦合的剩余衰減器,當(dāng)檢測到低頻范圍內(nèi)的信號功率大幅增長時,可使用它衰減低頻范圍內(nèi)的信號功率。
23.一種抑制語音或清音信號中風(fēng)噪聲的系統(tǒng),其包括一個時頻變換邏輯,它將時變輸入信號轉(zhuǎn)換成頻域;一個與時頻變換邏輯耦合的背景噪聲估計器,該背景噪聲估計器的配置使其可以測量出現(xiàn)在接收器附近的連續(xù)噪聲;一個與背景噪聲估計器耦合的風(fēng)噪聲檢測器,該風(fēng)噪聲檢測器的配置使其對一部分輸入信號擬合一條線;和一個與風(fēng)噪聲檢測器方法耦合的風(fēng)衰減器,該風(fēng)衰減器的配置使其可以去除與接收器感應(yīng)到的風(fēng)相關(guān)的噪聲。
24.一種去除輸入信號中的風(fēng)沖擊的方法包括將時變信號轉(zhuǎn)換為復(fù)譜;估計背景噪聲;當(dāng)擬合線與一部分輸入信號之間存在高度相關(guān)性時,檢測風(fēng)沖擊;和衰減輸入信號的風(fēng)沖擊。
25.如權(quán)利要求24所述的方法,其中估計背景噪聲的動作包括,當(dāng)沒有檢測到瞬變時,估計背景噪聲。
26.如權(quán)利要求24所述的方法,其中風(fēng)沖擊信號的去除動作包括,在很大程度上去除輸入信號的風(fēng)沖擊。
27.一種去除輸入信號中風(fēng)沖擊的方法包括將時變信號轉(zhuǎn)換為復(fù)譜;估計背景噪聲;當(dāng)擬合線與一部分輸入信號之間存在高度相關(guān)性時,檢測風(fēng)沖擊;和去除輸入信號的風(fēng)沖擊。
28.一個承載信號的介質(zhì),它具有控制與風(fēng)相關(guān)的噪聲檢測的軟件,其包括一個檢測器,它將聲波轉(zhuǎn)換為電信號;一個頻譜轉(zhuǎn)換邏輯,它將電信號從第一個域轉(zhuǎn)換為第二個域;和一個信號分析邏輯,它建模與風(fēng)相關(guān)的一部分聲波。
29.如權(quán)利要求28所述的承載信號介質(zhì),還包括導(dǎo)出一部分被噪聲屏蔽的語音信號的邏輯。
30.如權(quán)利要求28所述的承載信號介質(zhì),還包括衰減部分聲波的邏輯。
31.如權(quán)利要求28所述的承載信號介質(zhì),還包括衰減器邏輯,其操作可用來限制低頻范圍內(nèi)的功率。
32.如權(quán)利要求28所述的承載信號介質(zhì),還包括噪聲估計邏輯,它測量由檢測器感應(yīng)到的連續(xù)或環(huán)境噪聲。
33.如權(quán)利要求32所述的承載信號介質(zhì),還包括瞬變邏輯,當(dāng)檢測到功率增大時,它禁止估計邏輯。
34.如權(quán)利要求28所述的承載信號介質(zhì),其中信號分析邏輯與音頻系統(tǒng)耦合。
35.如權(quán)利要求28所述的承載信號介質(zhì),其中信號分析邏輯僅建模與風(fēng)相關(guān)的聲波。
全文摘要
一種語音增強邏輯提高了處理語音的感知質(zhì)量。該語音增強系統(tǒng)包括一個噪聲檢測器和一個噪聲衰減器。噪聲檢測器通過風(fēng)沖擊的建模來檢測風(fēng)沖擊和連續(xù)噪聲。噪聲衰減器衰減風(fēng)沖擊,以提高清音、全音或混音段的清晰度。
文檔編號G10L21/02GK1530929SQ20041000456
公開日2004年9月22日 申請日期2004年2月23日 優(yōu)先權(quán)日2003年2月21日
發(fā)明者P·赫瑟林頓, X·李, P·扎卡拉烏斯卡斯, P 赫瑟林頓, 謁箍ㄋ 申請人:哈曼貝克自動系統(tǒng)-威美科公司