專利名稱:自適應(yīng)濾波音頻信號(hào)以增強(qiáng)噪聲環(huán)境條件下語音清晰度的系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
該發(fā)明涉及降噪系統(tǒng),特別涉及一種用于便攜數(shù)字無線電話的自適應(yīng)語音清晰度增強(qiáng)系統(tǒng)。
背景技術(shù):
在美國以及世界其他地區(qū)的商業(yè)運(yùn)做中,蜂窩電話工業(yè)已經(jīng)取得了顯著的進(jìn)展。在主要都市地區(qū),對(duì)蜂窩服務(wù)的需求正在超過現(xiàn)有系統(tǒng)的容量。假設(shè)這種趨勢(shì)繼續(xù)下去,蜂窩無線電通訊將觸及甚至最小的農(nóng)村市場(chǎng)。因此,以合理花費(fèi)保持高質(zhì)量服務(wù)的同時(shí)蜂窩容量必須加大。朝向提高容量的重要一步是蜂窩系統(tǒng)從模擬傳送向數(shù)字傳送的轉(zhuǎn)換。這種轉(zhuǎn)換也是重要的,這是因?yàn)榈谝淮鷤€(gè)人通訊網(wǎng)(PCNs)將可能由使用下一代數(shù)字蜂窩基礎(chǔ)結(jié)構(gòu)的蜂窩載體來提供,其中,第一代個(gè)人通訊網(wǎng)采用了便于攜帶及便于在家中、辦公室、街上、汽車?yán)锏鹊卮螂娫捇蚪与娫挼牡突ㄙM(fèi)、衣袋大小的無繩電話。
數(shù)字通訊系統(tǒng)利用了強(qiáng)有力的數(shù)字信號(hào)處理技術(shù)。數(shù)字信號(hào)處理通常指的是數(shù)字化信號(hào)的數(shù)學(xué)或其他方面的處理。例如,將模擬信號(hào)轉(zhuǎn)換(數(shù)字化)為數(shù)字形式之后,可能利用數(shù)字信號(hào)處理器(DSP)中的簡(jiǎn)單數(shù)學(xué)例程來濾波、放大并衰減該數(shù)字信號(hào)。數(shù)字信號(hào)處理器一般被制造為高速集成電路,使得數(shù)據(jù)處理操作基本上實(shí)時(shí)進(jìn)行。數(shù)字信號(hào)處理器也可以被用來降低數(shù)字化語音的比特傳輸率,其結(jié)果表現(xiàn)為發(fā)送無線電信號(hào)的譜占有率降低以及系統(tǒng)容量擴(kuò)大。例如如果使用14比特線形脈沖碼調(diào)制(PCM)來數(shù)字化語音信號(hào),并以8KHZ的采樣率采樣,會(huì)產(chǎn)生112K比特/秒的串行比特率。此外,通過從數(shù)學(xué)上利用冗余的特性及其它人類語音的可預(yù)測(cè)特性,聲音編碼技術(shù)可以用來將112K比特/秒的串行比特率壓縮到7.95K比特/秒以獲得14∶1的比特傳輸率削減。傳輸率削減意味著更多可得的帶寬。
在美國,被TIA采用用做第二代蜂窩電話系統(tǒng)(i.e.IS-54)的數(shù)字化標(biāo)準(zhǔn)的一種流行的語音壓縮技術(shù)是矢量源碼書激勵(lì)的線形預(yù)測(cè)編碼(VSELP)。不幸的是,當(dāng)包括語音且混有高電平環(huán)境噪聲(尤其是″有色噪聲″)的音頻信號(hào)被利用VSELP編碼/壓縮時(shí),結(jié)果里可能包括部分不希望的音頻信號(hào)特性。例如,如果在噪聲環(huán)境(例如,其中移動(dòng)車輛的車內(nèi))中使用數(shù)字移動(dòng)電話,環(huán)境噪聲和希望的語音都被使用VSELP編碼算法壓縮,并被發(fā)送到基站,在基站中壓縮后的信號(hào)被解碼并被重構(gòu)為可聽的語音。當(dāng)背景噪聲被重構(gòu)為模擬形式時(shí),噪聲的不被希望的可聽失真,以及偶然發(fā)生于語音中的這些情況被引入。這種失真對(duì)于一般聽眾來說是非常討厭的。
這種失真大部分由使用移動(dòng)電話的環(huán)境造成。移動(dòng)電話一般用于車輛內(nèi)部,在那里常常有汽車引擎產(chǎn)生的環(huán)境噪聲及周圍車流造成的噪聲。這種車輛內(nèi)部的環(huán)境噪聲通常集中在低音頻范圍,并且噪聲幅度會(huì)由于車輛的速度和加速以及周圍車流量大小程度這樣的因素而變化。這種低頻噪聲還具有這樣的趨勢(shì)嚴(yán)重降低來自汽車中講話人的語音清晰度。在采用VSELP聲音編碼器的通訊系統(tǒng)中,這種由低頻噪聲造成的語音清晰度的降低可能會(huì)尤其顯著,但是這種現(xiàn)象也可能發(fā)生于不包括VSELP聲音編碼器的通訊系統(tǒng)中。
環(huán)境噪聲對(duì)移動(dòng)電話的影響也可能會(huì)因使用移動(dòng)電話的方式而起作用。尤其是移動(dòng)電話可以用于免提方式,即電話使用者對(duì)著放在托架內(nèi)的移動(dòng)電話講話。這使得移動(dòng)電話使用者的手可以騰出來駕駛,但也增加了使用者講出的話到達(dá)移動(dòng)電話麥克風(fēng)輸入端之前必須走過的距離。這種使用者與移動(dòng)電話之間加大了的距離,加上變化的環(huán)境噪聲,會(huì)導(dǎo)致噪聲成為輸入到移動(dòng)電話的音頻信號(hào)總功率譜能量的一個(gè)顯著部分。
理論上來說,可利用數(shù)字信號(hào)處理器來實(shí)現(xiàn)各種數(shù)字信號(hào)處理算法以濾除VSELP編碼的背景噪聲。然而,這些解決方法常常需要以每秒執(zhí)行幾百萬條指令(MIPS)來計(jì)算的很大的數(shù)字信號(hào)處理開銷,這耗費(fèi)了可貴的處理時(shí)間,內(nèi)存空間及功率耗費(fèi)。然而,在便攜無線電話中,這些信號(hào)處理資源中的每一個(gè)都是有限的。因此,對(duì)于最小化VSLEP編碼的背景噪聲以及其他類型的背景噪聲,簡(jiǎn)單地增加DSP的處理負(fù)擔(dān)并不是一個(gè)最佳解決方案。
發(fā)明概要該發(fā)明給出了一種自適應(yīng)降噪系統(tǒng),該系統(tǒng)在使對(duì)編碼語音質(zhì)量的任何負(fù)面影響最小化及對(duì)數(shù)字信號(hào)處理資源的任何增加消耗最小化的同時(shí),削減了不希望的編碼背景噪聲作用。該發(fā)明的方法和系統(tǒng)增加了數(shù)字化音頻信號(hào)中語音的清晰度,其方法是將數(shù)字化音頻信號(hào)幀通過一個(gè)濾波器電路。該濾波器電路起可調(diào)節(jié)高通濾波器的作用,它濾除一部分低音頻范圍的數(shù)字化信號(hào),通過落在高頻范圍內(nèi)的數(shù)字化信號(hào)部分。因?yàn)檐囕v內(nèi)的噪聲趨于集中在低音頻范圍,并且只有一小部分語音清晰值落在該低頻范圍,因此濾波電路在只濾除掉語音的不重要部分的同時(shí),濾除了數(shù)字化音頻信號(hào)中的大部分噪聲。這使得與除去的語音能量部分相比,相對(duì)更大一部分的噪聲能量被除去。通過自適應(yīng)地調(diào)整并選擇濾波器電路的頻率響應(yīng)曲線,濾除掉的語音量被限制,并對(duì)無線電輸出的語音清晰度具有最小的影響。
濾波器控制電路被用來調(diào)整濾波器電路,使之以某一噪聲估計(jì)值和/或譜包絡(luò)函數(shù)的形式來顯示不同的頻率響應(yīng)曲線,其中的噪聲估計(jì)值和/或譜包絡(luò)對(duì)應(yīng)于音頻信號(hào)中的噪聲。噪聲估計(jì)值和/或譜包絡(luò)在逐幀的基礎(chǔ)上針對(duì)數(shù)字信號(hào)做調(diào)整并以語音檢測(cè)函數(shù)的形式來調(diào)整。如果沒有檢測(cè)到語音,那麼為當(dāng)前幀修正噪聲估計(jì)值和/或譜包絡(luò)。如果檢測(cè)到語音,就不調(diào)整噪聲估計(jì)值和/或譜包絡(luò)。
在第一實(shí)施方案中,濾波器電路針對(duì)數(shù)字化的音頻信號(hào)幀計(jì)算噪聲估計(jì)值。該噪聲估計(jì)值對(duì)應(yīng)于數(shù)字化音頻信號(hào)幀中的背景噪聲量。當(dāng)語音低頻范圍中的背景噪聲對(duì)語音的相對(duì)量增加時(shí),噪聲估計(jì)值增加。當(dāng)語音低頻范圍中的背景噪聲對(duì)語音的相對(duì)量增加時(shí),濾波器控制電路使用噪聲估計(jì)值來調(diào)整濾波器電路以濾除更大部分的低頻范圍語音。當(dāng)不存在背景噪聲時(shí),沒有語音信號(hào)被濾除。當(dāng)存在更高的噪聲電平時(shí),更大部分的噪聲和語音信息被抽取。因?yàn)樵肼曏呄蛴诩性诘皖l范圍內(nèi)并且只有相對(duì)較小部分語音清晰值落在該低頻范圍內(nèi),當(dāng)噪聲估計(jì)值增加時(shí),通過加大正在被濾除的低頻能量部分,音頻信號(hào)的整體清晰度可以被提高。
在第二實(shí)施方案中,一個(gè)修改后的濾波器控制電路被用來調(diào)整濾波器電路,使之以某一噪聲包絡(luò)函數(shù)的形式來顯示出不同的頻率響應(yīng)曲線,其中的噪聲包絡(luò)為音頻信號(hào)中選出頻率范圍上噪聲估計(jì)值的噪聲包絡(luò)。該濾波控制電路包括一個(gè)譜分析器,該分析器以檢測(cè)語音函數(shù)的形式來確定一個(gè)噪聲包絡(luò)估計(jì)值。為當(dāng)前幀確定一個(gè)噪聲包絡(luò)估計(jì)值并將該估計(jì)值與參考噪聲包絡(luò)相比較?;谠摫容^,濾波器電路被自適應(yīng)地調(diào)整用來從當(dāng)前幀中提取不同數(shù)量的低頻能量。
根據(jù)該發(fā)明的自適應(yīng)削減系統(tǒng)可以被很好地應(yīng)用于無線電通訊系統(tǒng),在該無線電通訊系統(tǒng)中,便攜/移動(dòng)無線電收發(fā)器之間及無線電收發(fā)器與固定電話線用戶之間通過RF信道通訊。每一個(gè)收發(fā)器包括一個(gè)天線,一個(gè)用于將通過天線在RF信道上接收到的無線電信號(hào)轉(zhuǎn)換成模擬音頻信號(hào)的接收器,及一個(gè)發(fā)送器。發(fā)送器包括一個(gè)編-解碼器(codec)用來把將要被發(fā)送的模擬音頻信號(hào)數(shù)字化為數(shù)字化語音信息幀,該語音信息既包括語音也包括背景噪聲。數(shù)字信號(hào)處理器在背景噪聲估計(jì)值及當(dāng)前幀中語音檢測(cè)的基礎(chǔ)上處理當(dāng)前幀來最小化背景噪聲。調(diào)制器將處理后的數(shù)字化語音信息幀調(diào)制到RF載波上用于后續(xù)通過天線的發(fā)送。
附圖簡(jiǎn)要描述根據(jù)下面書寫的描述并結(jié)合附圖,對(duì)于該技術(shù)領(lǐng)域的普通技術(shù)人員來說,該發(fā)明的所有特征及優(yōu)點(diǎn)將很容易明白。
圖1是該發(fā)明的一個(gè)通用功能方框圖。
圖2圖解說明了用于蜂窩無線電通訊的美國數(shù)字標(biāo)準(zhǔn)IS-54的幀和位置結(jié)構(gòu);圖3是利用數(shù)字信號(hào)處理器實(shí)現(xiàn)的該發(fā)明第一優(yōu)選實(shí)施方案的方框圖;圖4是該發(fā)明的一個(gè)示范實(shí)施方案的功能方框圖,該實(shí)施方案應(yīng)用于無線電通訊系統(tǒng)中多個(gè)便攜無線電收發(fā)器中一個(gè)。
圖5A和5B為一個(gè)流程圖,它圖解說明了在實(shí)現(xiàn)該發(fā)明第一優(yōu)選實(shí)施方案過程中,數(shù)字信號(hào)處理器執(zhí)行的功能/操作。
圖6A是圖解說明根據(jù)該發(fā)明第一優(yōu)選實(shí)施方案的濾波電路的衰減-頻率特性的第一示例圖。
圖6B是圖解說明根據(jù)該發(fā)明第一優(yōu)選實(shí)施方案的濾波電路的衰減-頻率特性的第二示例圖。
圖7是可被該發(fā)明第一優(yōu)選實(shí)施方案中濾波控制器電路存取的一個(gè)示例查詢表。
圖8A和8B圖解說明了示例輸入音頻信號(hào)的幅度-頻率特性。
圖9A和9B分別圖解說明了圖8A和8B中輸入音頻信號(hào)被該發(fā)明的濾波器電路濾波之后的幅度-頻率特性;圖10是利用數(shù)字信號(hào)處理器實(shí)現(xiàn)的該發(fā)明第二優(yōu)選實(shí)施方案的方框圖;圖11為一個(gè)流程圖,對(duì)應(yīng)于圖5B的流程圖,它圖解說明了在實(shí)現(xiàn)該發(fā)明第二優(yōu)選實(shí)施方案過程中數(shù)字信號(hào)處理器執(zhí)行的功能/操作。
圖12是可被該發(fā)明第二優(yōu)選實(shí)施方案中濾波器控制電路存取的一個(gè)示例查詢表。
附圖詳細(xì)描述在下面的描述中,出于解釋而不是限制的目的,為了給出對(duì)該發(fā)明的全面理解,具體的細(xì)節(jié)如特殊電路、電路元件、技術(shù)、流程圖等等被陳述。然而,該技術(shù)領(lǐng)域的技術(shù)人員會(huì)明白,該發(fā)明可以實(shí)踐于偏離這些具體細(xì)節(jié)的其他實(shí)施方案中。在其他例子中,眾所周知的方法、設(shè)備、和電路的詳細(xì)描述都被略去以便不會(huì)以不必要的細(xì)節(jié)而模糊了對(duì)該發(fā)明的描述。
圖1是根據(jù)該發(fā)明的自適應(yīng)降噪系統(tǒng)100的通用方框圖。自適應(yīng)降噪系統(tǒng)100包括一個(gè)連接到濾波器電路115的濾波器控制電路105。濾波器控制電路105為數(shù)字化音頻信號(hào)的當(dāng)前幀產(chǎn)生一個(gè)濾波器控制信號(hào)。該濾波器控制信號(hào)被輸出到濾波器電路115,濾波器電路115根據(jù)濾波器控制信號(hào)而調(diào)節(jié)以顯示出一個(gè)高通頻率響應(yīng)曲線,該曲線是在濾波器控制信號(hào)的基礎(chǔ)上選擇出的。調(diào)節(jié)后的濾波電路115濾波數(shù)字化音頻信號(hào)的當(dāng)前幀。濾波信號(hào)被聲音編碼器120處理來產(chǎn)生表示數(shù)字化音頻信號(hào)的編碼信號(hào)。
在蜂窩無線電通訊系統(tǒng)中應(yīng)用于便攜/移動(dòng)無線電話收發(fā)器的該發(fā)明的一個(gè)示范方案中,圖2圖解說明了IS-54標(biāo)準(zhǔn)為數(shù)字蜂窩無線電通訊采用的時(shí)分多址存取(TDMA)的幀結(jié)構(gòu)。一″幀″是一個(gè)20毫秒的時(shí)間段,它包括一個(gè)發(fā)送塊TX,一個(gè)接收塊RX及一個(gè)信號(hào)強(qiáng)度測(cè)量塊用于移動(dòng)臺(tái)輔助切換(MAHO)。圖2中表示出的兩個(gè)連續(xù)幀在40毫秒的時(shí)間段內(nèi)被發(fā)送。數(shù)字化的語音和背景噪聲信息如同下面進(jìn)一步描述的,在逐幀的基礎(chǔ)上被處理和濾波。
最好的是,圖1中的濾波器控制電路105,濾波器電路115及聲音編碼器120的功能用一個(gè)高速數(shù)字信號(hào)處理器來實(shí)現(xiàn)。一種適當(dāng)?shù)臄?shù)字信號(hào)處理器是可以從TI公司獲得的TMS320C53 DSP。該TMS320C53 DSP在一個(gè)單集成片上包括一個(gè)16比特微處理器,用于存儲(chǔ)如將要被處理的語音幀這樣的數(shù)據(jù)的片上RAM,用于存儲(chǔ)各種數(shù)據(jù)處理算法的ROM,其中的算法包括VSELP語音壓縮算法,以及下面將要描述的用來完成由濾波器控制電路105和濾波器電路115執(zhí)行的功能塊的其它算法。
該發(fā)明的第一實(shí)施方案在圖3中被表示出。在第一實(shí)施方案中,濾波器電路115以背景噪聲估計(jì)值函數(shù)的形式來調(diào)整。該背景噪聲估計(jì)值由濾波器控制電路來確定。脈沖碼調(diào)制的音頻信息幀被順序存儲(chǔ)在DSP的片上RAM中??梢允褂闷渌臄?shù)字化技術(shù)來數(shù)字化音頻信息。每一個(gè)PCM數(shù)字幀從DSP片上RAM中被取出并被幀能量估計(jì)器210處理,然后暫存在臨時(shí)幀存儲(chǔ)器220中。由幀能量估計(jì)器210確定的當(dāng)前幀的能量被提供給噪聲估計(jì)器230及語音檢測(cè)器240功能塊。當(dāng)幀能量估計(jì)值超過前一噪聲估計(jì)值與一個(gè)語音閾值的和時(shí),語音檢測(cè)器240表示語音存在于當(dāng)前幀中。如果語音檢測(cè)器確定沒有語音存在,那么數(shù)字信號(hào)處理器200以當(dāng)前噪聲估計(jì)值和當(dāng)前幀能量函數(shù)的形式來計(jì)算一個(gè)修正的噪聲估計(jì)值。
修正后的噪聲估計(jì)值被輸出到濾波器選擇器235。濾波器選擇器235基于噪聲估計(jì)值產(chǎn)生一個(gè)濾波器控制信號(hào)。在優(yōu)選實(shí)施方案中,濾波器選擇器235在產(chǎn)生濾波器控制信號(hào)過程中讀取查詢表。查詢表包括一系列的濾波器控制值,每一個(gè)控制值都與一個(gè)噪聲估計(jì)值或噪聲估計(jì)值的范圍相匹配。在修正后噪聲估計(jì)值的基礎(chǔ)上,查詢表中的濾波器控制值被選擇出,該濾波器控制值由一個(gè)濾波器控制信號(hào)表示,該控制信號(hào)為濾波器電路115而輸出到濾波器組265。為了穩(wěn)定該過程,并避免在不同濾波器之間的連續(xù)切換,為新濾波器的選擇設(shè)置了一個(gè)N幀的轉(zhuǎn)換時(shí)間。新濾波器只能每N幀選擇一次,其中N是一個(gè)大于1,并最好大于10的整數(shù)。
濾波器電路115根據(jù)濾波器控制信號(hào)而調(diào)整以顯示出對(duì)應(yīng)于輸入濾波器控制信號(hào)和噪聲估計(jì)值的高通頻率響應(yīng)曲線?,F(xiàn)有技術(shù)中眾所周知的各種不同類型的濾波器電路可以被用來根據(jù)濾波器控制信號(hào)顯示選中的頻率響應(yīng)曲線。這些現(xiàn)有技術(shù)的濾波器包括IIR濾波器,如巴特沃斯,契比雪夫或橢圓濾波器,由于較低的處理要求,也可以使用FIR濾波器,但優(yōu)選IIR濾波器。
濾波后的信號(hào)被聲音編碼器120處理,120被用來壓縮濾波后信號(hào)的比特率。在優(yōu)選實(shí)施方案中,聲音編碼器120使用矢量源碼書激勵(lì)線性預(yù)測(cè)編碼(VSELP)技術(shù)來編碼音頻信號(hào)。其他的聲音編碼技術(shù)和算法也可以被使用,例如碼激勵(lì)線性預(yù)測(cè)(CELP)編碼,殘留脈沖激勵(lì)線性預(yù)測(cè)(RPE-LTP)編碼,改進(jìn)的多帶激勵(lì)(IMBE)編碼。通過在聲音編碼之前根據(jù)該發(fā)明濾波音頻信號(hào)幀,背景噪聲被最小化,該處理基本上削減了當(dāng)語音重構(gòu)時(shí)語音中的任何不希望的噪聲影響。它也防止了語音被″淹沒″在低頻噪聲中。
結(jié)合圖3描述的數(shù)字信號(hào)處理器200可以被用于例如無線電通訊系統(tǒng)中使用的數(shù)字便攜/移動(dòng)無線電話的收發(fā)器這樣的裝置中。圖4圖解說明了一個(gè)這樣的數(shù)字無線電收發(fā)器,它可以用于蜂窩無線電通訊網(wǎng)絡(luò)中。盡管圖4通常描述了包括在無線電收發(fā)器中的基本功能塊,該收發(fā)器的更詳細(xì)的描述可以從以前參考的題為“多模式信號(hào)處理”的美國專利申請(qǐng)序列號(hào)No.07/967,027中得到,該專利以參考文獻(xiàn)的方式在這里被引用。
包括語音和背景噪聲的音頻信號(hào)從麥克風(fēng)400輸入到編-解碼器402,402最好是一個(gè)專用集成電路(ASIC)。在麥克風(fēng)400處檢測(cè)到的帶限音頻信號(hào)被編解碼器402以每秒8000個(gè)樣本的采樣率采樣并被分塊成幀。根據(jù)上述,每個(gè)20毫秒幀包括160個(gè)語音樣本。這些樣本被量化并被轉(zhuǎn)換成例如14比特線性PCM這樣的編碼數(shù)字格式。一旦當(dāng)前幀的數(shù)字化語音的160個(gè)樣本被存儲(chǔ)到發(fā)送DSP200中的片上RAM中,發(fā)送DSP200就象上面結(jié)合圖3描述的一樣,根據(jù)VSEIP算法,執(zhí)行信道編碼功能,幀能量估計(jì),噪聲估計(jì),語音檢測(cè),F(xiàn)FT,濾波功能和數(shù)字語音編碼/壓縮。
監(jiān)測(cè)微處理器432控制著圖4中表示出的收發(fā)器中所有元件的整個(gè)操作。由發(fā)送DSP200產(chǎn)生的濾波后的PCM數(shù)據(jù)流被提供用來正交調(diào)制和發(fā)送。到此為止,基于得自DSP 200的濾波后PCM數(shù)據(jù)流,ASIC門陣列404產(chǎn)生同相(I)信息信道和正交(Q)信息信道。I和Q比特流被相匹配的低通濾波器406和408處理并被傳送到平衡調(diào)制器410中的IQ混合器中。參考震蕩器412和乘法器414給出一個(gè)發(fā)送中間頻率(IF)。I信號(hào)與同相IF混合,Q信號(hào)與正交IF混合(即同相IF被相移器416滯后90度)?;旌系腎和Q信號(hào)被相加,并被“上”轉(zhuǎn)換到由信道合成器430選出的RF信道頻率上,然后通過雙工機(jī)420和天線422在選出的無線電頻率信道上發(fā)送。
在接收邊,通過天線422和雙工機(jī)420接收的信號(hào)被從混合器424中的選中接收信道頻率上向下轉(zhuǎn)換為第一IF頻率,其中的第一IF頻率使用了由信道合成器430在參考震蕩器428的輸出基礎(chǔ)上合成的本地震蕩器信號(hào)。第一IF混合器424的輸出被濾波并且其頻率被向下轉(zhuǎn)換為第二IF,該轉(zhuǎn)換在信道合成器430和解調(diào)器426的另一個(gè)輸出的基礎(chǔ)上進(jìn)行。然后,接收門陣列434將第二IF信號(hào)轉(zhuǎn)換成一系列的相位樣本和一系列的頻率樣本。接收DSP436對(duì)接收到的信號(hào)執(zhí)行解調(diào)、濾波、增益/衰減、信道解碼和語音擴(kuò)張。然后,處理后的語音數(shù)據(jù)被送到編解碼器402并被轉(zhuǎn)換為基帶音頻信號(hào)用于驅(qū)動(dòng)揚(yáng)聲器438。
現(xiàn)在將結(jié)合圖5A、5B中的流程圖描述數(shù)字信號(hào)處理器200為實(shí)現(xiàn)濾波器控制電路105,濾波器電路115和聲音編碼器120的功能而執(zhí)行的操作。幀能量估計(jì)器210確定每一幀音頻信號(hào)的能量。通過計(jì)算一幀中每一個(gè)PCM樣本平方值的和(步驟505),幀能量估計(jì)器210確定當(dāng)前幀的能量。因?yàn)閷?duì)于每秒8000樣本的采樣率來說,每一個(gè)20毫秒長(zhǎng)的幀有160個(gè)樣本,那麼就有160個(gè)PCM樣本平方被相加。按照數(shù)學(xué)方式表達(dá),幀能量估計(jì)根據(jù)下面等式1來確定
為當(dāng)前幀計(jì)算的幀能量值被存儲(chǔ)在DSP200的片上RAM202中(步驟510)。
語音檢測(cè)器240的功能包括從DSP200的片上RAM202中取出一個(gè)由噪聲估計(jì)器230先前確定的噪聲估計(jì)值(步驟515)。當(dāng)然,當(dāng)收發(fā)器最初上電時(shí),沒有噪聲估計(jì)值存在。判斷框520預(yù)計(jì)到這種情況并在步驟525給出一個(gè)噪聲估計(jì)值。為了象下面將要描述的,迫使對(duì)噪聲估計(jì)值的修正,最好安排一個(gè)任意高的值作為噪聲估計(jì)值,例如在正常語音電平之上的20dB。由幀能量估計(jì)器210確定的幀能量被從DSP210的片上RAM202中取出(方框530)。在方框535中確定幀能量估計(jì)值是否超過了檢出的噪聲估計(jì)值加上一個(gè)預(yù)定語音閾值的和,如下面等式2表示的幀能量估計(jì)值>(噪聲估計(jì)值+語音閾值)(等式2)語音閾值可以是一個(gè)固定值,該固定值由經(jīng)驗(yàn)確定大于一般背景噪聲的短時(shí)能量方差,并且可以被設(shè)置為例如9dB。另外,語音閾值可以被自適應(yīng)地修改來反映變化的語音條件,例如,當(dāng)講話者進(jìn)入一個(gè)更嘈雜或更安靜的環(huán)境時(shí)的語音條件。如果幀能量估計(jì)值超過了等式2中的和,那麼在方框570中設(shè)置一個(gè)標(biāo)志位表示語音存在。如果語音檢測(cè)器240檢測(cè)到語音存在,那麼噪聲估計(jì)器230被越過,為以前的數(shù)字化音頻幀計(jì)算的噪聲估計(jì)值被檢索出并被用做當(dāng)前噪聲估計(jì)值。相反的,如果幀能量估計(jì)小于等式2中的和,在方框540將語音標(biāo)志清零。
也可以使用其他檢測(cè)當(dāng)前幀中語音的系統(tǒng)。例如,歐洲電訊標(biāo)準(zhǔn)機(jī)構(gòu)(ETSI)已經(jīng)開發(fā)了一種用于全球定位系統(tǒng)GSM中聲音活動(dòng)檢測(cè)(VAD)的標(biāo)準(zhǔn)。并在ETSI參考文獻(xiàn) RE/SMG-020632P中被描述,該文獻(xiàn)以參考的方式在此引用。
如果語音不存在,噪聲估計(jì)器230中的噪聲估計(jì)值修正例程被執(zhí)行。在沒有語音存在的時(shí)間里,噪聲估計(jì)值實(shí)質(zhì)上是幀能量的一個(gè)在線平均。如上面描述的,如果最初的啟動(dòng)噪聲估計(jì)值被選擇的足夠高,那麼語音沒有被檢測(cè)到,并且語音標(biāo)志被因此清零以迫使對(duì)噪聲估計(jì)值的修正。
在由噪聲估計(jì)器230執(zhí)行的噪聲估計(jì)例程中,在方框545中確定了一個(gè)差值/誤差(Δ),根據(jù)下面等式,該誤差為幀能量估計(jì)器210產(chǎn)生的幀噪聲能量與噪聲估計(jì)器230以前計(jì)算的噪聲估計(jì)值之間的差值Δ=當(dāng)前幀能量-以前噪聲估計(jì)(等式3)判斷框550確定是否Δ超過了0。如果Δ是負(fù)的,如同高噪聲估計(jì)值時(shí)發(fā)生的一樣,那么根據(jù)下面等式噪聲估計(jì)值在方框560中被重新計(jì)算噪聲估計(jì)=以前噪聲估計(jì)+Δ/2(等式4)由于Δ是負(fù)的,這導(dǎo)致噪聲估計(jì)值向下校正。這里選擇了相對(duì)較大的步長(zhǎng)Δ/2來快速校正以降低噪聲電平。然而,如果幀能量超過了噪聲估計(jì)值,給出一個(gè)大于0的Δ,則在方框555中噪聲被根據(jù)下面等式修正噪聲估計(jì)=以前噪聲估計(jì)值+Δ/256(等式5)由于Δ是正的,噪聲估計(jì)值一定會(huì)增加。然而,這里選取了一個(gè)更小的步長(zhǎng)Δ/256(與Δ/2相比)來逐漸加大噪聲估計(jì)值并對(duì)瞬時(shí)噪聲做出實(shí)質(zhì)性的消除。
為當(dāng)前幀計(jì)算的噪聲估計(jì)值被輸出到濾波器選擇器235。在第一優(yōu)選實(shí)施方案中,濾波器選擇器235讀取查詢表并利用當(dāng)前噪聲估計(jì)值來選取一個(gè)濾波器控制值(步驟572)。然后濾波器電路115(步驟574)以選出濾波器控制值函數(shù)的形式調(diào)整來顯示出一個(gè)頻率響應(yīng)曲線,該響應(yīng)曲線意在當(dāng)噪聲估計(jì)值和背景噪聲增加時(shí)加大濾除的噪聲量。然后,存儲(chǔ)在DSP RAM中的PCM樣本通過調(diào)整后的濾波器電路265來濾波PCM樣本以除去噪聲(步驟576)。濾波后的PCM樣本之后被聲音編碼器120處理(步驟578),然后,編碼后的樣本被輸出到RF發(fā)送電路(步驟580)。
圖6A和6B給出了幾個(gè)關(guān)于濾波器電路如何調(diào)整來為輸入到濾波器電路115的不同濾波器控制信號(hào)顯示不同頻率響應(yīng)曲線F1-F4的例子。如圖6A所示,濾波器電路115可以被選擇來顯示一系列不同的頻率響應(yīng)曲線,并且頻率響應(yīng)曲線F1-F4分別具有截止頻率F1c-F4c。在優(yōu)選實(shí)施方案中,濾波器電路115的截止頻率的范圍可以是300HZ到800HZ。當(dāng)噪聲估計(jì)值增加時(shí),濾波器電路115被設(shè)計(jì)為顯示具有更高截止頻率的頻率響應(yīng)曲線。這種更高的截止頻率導(dǎo)致更大部分落在語音低頻范圍內(nèi)的幀能量被濾波器電路115抽取。
同樣的,如圖6B所示,濾波器電路115可以被選擇來顯示一系列的不同頻率響應(yīng)曲線F1-F4,并且每一個(gè)頻率響應(yīng)曲線具有不同的坡度和相同的截止頻率。頻率響應(yīng)曲線F1-F4的截止頻率在上面提及的范圍內(nèi)。當(dāng)噪聲估計(jì)值增加時(shí),濾波器電路115被調(diào)整來顯示具有更陡坡度的頻率響應(yīng)曲線。這種更陡的坡度導(dǎo)致更大部分落在語音更低頻率范圍內(nèi)的幀能量被濾波器電路115抽取。
濾波器電路115以某一噪聲估計(jì)值函數(shù)的形式來濾波當(dāng)前幀,其中的噪聲估計(jì)值是為當(dāng)前幀計(jì)算的。當(dāng)前幀被濾波使得噪聲被削減而通過了語音的主要部分。未被濾除且通過的語音主要部分給出了可識(shí)別的語音輸出,語音信號(hào)質(zhì)量只有很小降低。不同截止頻率和不同坡度的組合可以被用來自適應(yīng)地抽取落在語音低頻范圍內(nèi)的幀能量的選出部分。
圖7描述了由濾波器選擇器235讀取的一個(gè)示例查詢表,以便替濾波器電路115從濾波器響應(yīng)曲線F1-F4中選出一個(gè)。該查詢表包括一系列可能的噪聲估計(jì)值N1-Nn及濾波器控制值F1-Fn,這些值對(duì)應(yīng)于濾波器電路115顯示的可能響應(yīng)曲線。噪聲估計(jì)值N1-Nn中的每一個(gè)可以表示一個(gè)范圍的噪聲估計(jì)值,并且每一個(gè)都與一個(gè)特定的濾波器控制值F1-F4相匹配。濾波器控制電路105產(chǎn)生一個(gè)濾波器控制信號(hào),其方法是計(jì)算一個(gè)噪聲估計(jì)值并從查詢表中檢出與之相關(guān)的濾波器控制值。
圖8A&B和9A&B表示了兩幀音頻信號(hào)的每一幀是如何被自適應(yīng)濾波以給出一個(gè)輸出到RF發(fā)送器的改進(jìn)音頻信號(hào)的。圖8A和8B表示了分別包括語音分量s1,s2和噪聲分量n1,n2的音頻信號(hào)的一個(gè)第一幀和一個(gè)第二幀。如圖所示,兩幀中的噪聲能量n1和n2都集中在低音頻范圍內(nèi)。而語音能量s1和s2卻集中在較高音頻范圍內(nèi)。圖9A給出了濾波后第一幀的噪聲信號(hào)n1和語音信號(hào)s1。圖9B給出了濾波后第二幀的噪聲信號(hào)n2和語音信號(hào)s2。
如同所討論的,自適應(yīng)音頻降噪系統(tǒng)100被設(shè)計(jì)用于計(jì)算第一幀和第二幀之間噪聲電平的差值,其方法是基于當(dāng)前幀的計(jì)算后噪聲估計(jì)值來調(diào)整濾波器控制電路105。例如,濾波器控制電路105計(jì)算出噪聲估計(jì)N1和譜包絡(luò)s1并且為第一幀選出一個(gè)濾波器控制值F1。在優(yōu)選實(shí)施方案中,基于濾波器控制值F1,濾波器電路115被調(diào)整并象圖6A所示的,顯示出一個(gè)具有截止頻率F1c的頻率響應(yīng)曲線。然后,第一幀通過該調(diào)整后的濾波器電路115。濾波器電路115被選中使得大部分的噪聲n1和僅一小部分的語音s1落在頻率響應(yīng)曲線F1的截止頻率F1c之下。這導(dǎo)致噪聲n1被有效的濾除并且只有一部分相對(duì)不重要的語音s1被濾除。濾波后的第一幀音頻信號(hào)表示在圖9A中。
在圖8B中顯示的第二幀中,存在更高的背景噪聲,并假設(shè)語音沒有被檢測(cè)到,那麼濾波器控制電路105會(huì)計(jì)算出一個(gè)更高的噪聲估計(jì)值n2?;谠摳咴肼暪烙?jì)值,為第二幀確定一個(gè)更高的相應(yīng)濾波器控制值F2。在第一優(yōu)選實(shí)施方案中,根據(jù)更高的濾波器控制值F2來調(diào)整濾波器電路115以象圖6A表示的那樣顯示一個(gè)具有更高截止頻率F2c的頻率響應(yīng)曲線。然后,音頻信號(hào)的后續(xù)幀通過了調(diào)整后的濾波器電路115。因?yàn)閷?duì)于后續(xù)幀來說,頻率響應(yīng)曲線F2的截止頻率F2c更高,所以大部分的噪聲n2和語音s2都被濾除了。(但是),語音s2被濾除的部分與該幀包括的清晰度信息相比仍然相對(duì)不顯著,因此這對(duì)語音僅有很小的影響。濾除更大部分的語音s2的缺點(diǎn)被第二幀中噪聲n2去除量增加的優(yōu)點(diǎn)所抵消。被濾除掉的語音譜部分并不顯著作用于語音的清晰度。第二幀中濾波后的音頻信號(hào)在圖9B中表示出。
圖10-12中給出了自適應(yīng)降噪系統(tǒng)100的第二優(yōu)選實(shí)施方案。在第二優(yōu)選實(shí)施方案中,濾波器控制電路105以噪聲包絡(luò)估計(jì)值函數(shù)的形式來調(diào)整濾波器電路115。噪聲包絡(luò)估計(jì)值是針對(duì)每一幀計(jì)算的并與參考噪聲包絡(luò)估計(jì)值比較。基于該比較,濾波器電路115被自適應(yīng)地調(diào)整來從當(dāng)前幀中提取不同數(shù)量的低頻能量。
參考圖10,給出了按照第二優(yōu)選實(shí)施方案配置的DSP 200。如圖所示,除了參考第一優(yōu)選實(shí)施方案描述的幀能量估計(jì)器210,噪聲估計(jì)器230,語音檢測(cè)器240和濾波器選擇器235之外,濾波器控制電路105還包括譜分析器270。如同第一實(shí)施方案所描述的和流程圖5A和5B所表示的,濾波器控制電路105為接收到的幀確定噪聲估計(jì)值并檢測(cè)語音的存在。在為當(dāng)前幀檢測(cè)語音時(shí),譜分析器270修正噪聲包絡(luò)估計(jì)值,并在調(diào)整濾波器電路115中使用該值。
參考圖11,給出了修正噪聲包絡(luò)估計(jì)值和調(diào)整濾波器電路115的步驟。圖11給出了譜分析器270執(zhí)行的步驟,這些步驟在以前第一優(yōu)選實(shí)施方案的流程圖5A和5B中描述的整個(gè)過程中被引用。
如果當(dāng)前幀中沒有檢測(cè)到語音,譜分析器270首先為當(dāng)前幀確定一個(gè)噪聲包絡(luò)(步驟600)。為當(dāng)前幀確定的噪聲包絡(luò)中包括不同頻率(即頻率點(diǎn))上的能量計(jì)算值,這些頻率位于為當(dāng)前幀選出的語音低頻范圍中。在優(yōu)選實(shí)施方案中,選中的頻率范圍大約為300到800HZ。當(dāng)前幀的噪聲包絡(luò)可以通過利用具有N個(gè)頻率點(diǎn)的快速傅立葉變換(FFT)處理當(dāng)前幀來確定。利用FFT處理數(shù)字信號(hào)在現(xiàn)有技術(shù)領(lǐng)域內(nèi)是眾所周知的,其優(yōu)越處在于當(dāng)FFT局限于相對(duì)較少的頻率點(diǎn),例如32點(diǎn)時(shí),它需要很少的處理功率。具有N個(gè)頻率點(diǎn)的FFT在N個(gè)不同的頻率處產(chǎn)生能量計(jì)算。落在選中的頻率范圍內(nèi)的頻率點(diǎn)的能量計(jì)算值形成了當(dāng)前幀的噪聲包絡(luò)。
為了確定當(dāng)前幀的噪聲包絡(luò)估計(jì)值(步驟604),將當(dāng)前幀的噪聲包絡(luò)與為音頻信號(hào)的以前幀而確定的噪聲包絡(luò)估計(jì)值做平均。當(dāng)沒有以前的噪聲包絡(luò)估計(jì)值可以得到時(shí),例如初始化之后,可以使用存儲(chǔ)的初始噪聲包絡(luò)估計(jì)值。噪聲包絡(luò)估計(jì)值包括位于連續(xù)低頻(即,在選中的頻率范圍內(nèi),e1是最高頻率的噪聲能量估計(jì)值而en是最低頻率的噪聲能量估計(jì)值)上的噪聲能量估計(jì)值ei(其中i=1,2…n)。在優(yōu)選實(shí)施方案中,每個(gè)噪聲能量估計(jì)值ei對(duì)應(yīng)于在某一特定頻率上能量計(jì)算值的平均值,該特定頻率是在大量的其中沒有語音被檢測(cè)到的連續(xù)幀上的選中頻率范圍內(nèi)的一個(gè)頻率點(diǎn)。通過使用大量的幀來確定噪聲包絡(luò)估計(jì)值,濾波器電路115在一個(gè)更為漸進(jìn)的基礎(chǔ)上被調(diào)整。在另一實(shí)施方案中,噪聲包絡(luò)估計(jì)值可以等于當(dāng)前幀的噪聲包絡(luò)。
然后,噪聲包絡(luò)估計(jì)值的能量估計(jì)值ei與參考噪聲包絡(luò)相比(步驟604)。參考噪聲包絡(luò)包括參考能量閾值eri(其中i=1,2…n),這些閾值位于對(duì)應(yīng)于噪聲包絡(luò)估計(jì)值的噪聲能量估計(jì)值ei的頻率點(diǎn)上。參考能量閾值eri可以按經(jīng)驗(yàn)確定。按照從最高頻率能量估計(jì)值e1到最低頻率能量估計(jì)值en的順序,噪聲能量估計(jì)值ei被連續(xù)與對(duì)應(yīng)的參考能量閾值eri相比較。
更具體的,噪聲能量估計(jì)e1首先與參考噪聲閾值er1相比較。如果e1大于參考噪聲閾值er1,那麼比較值C1被選中并輸入到濾波器選擇器235。如果噪聲估計(jì)值e1小于參考噪聲閾值er1,那麼噪聲能量估計(jì)值e2(該值為在低于e1的頻率處得到的噪聲能量估計(jì)值)與參考閾值er2相比較。如果噪聲能量估計(jì)值e2大于參考噪聲閾值er2,那麼比較值C2被選中并輸入到濾波器選擇器235。到比較值Ci(其中i=1,2…n)被選中為止,比較過程一直繼續(xù)。
濾波器電路235使用確定的比較值Ci來確定一個(gè)濾波器控制值。該濾波器控制值從例如圖12中給出的查詢表中選擇。查詢表包括一系列的比較值Ci和相應(yīng)的濾波器控制值Fi。濾波器電路115以選中濾波器控制值函數(shù)的形式來調(diào)整。濾波器電路115被調(diào)整來顯示一個(gè)頻率響應(yīng)曲線以便從當(dāng)前幀中提取低頻能量。當(dāng)連續(xù)更高頻率上的噪聲能量估計(jì)值超過他們對(duì)應(yīng)的參考能量閾值時(shí),濾波器電路115被調(diào)整來提取更多的低頻能量。圖6A和6B給出了選中濾波器控制值的示例頻率響應(yīng)曲線。
噪聲包絡(luò)估計(jì)值的使用幫助提高了自適應(yīng)地調(diào)整濾波器電路來提取低頻能量的能力,其所采取方式有助于改善語音總體質(zhì)量。由于汽車環(huán)境不是使用移動(dòng)無線電通訊裝置的唯一環(huán)境。因此,某一環(huán)境中的噪聲包絡(luò)可能傾向于更高頻率。當(dāng)?shù)皖l中的噪聲能量很小時(shí),譜分析器270可以被選擇性地被禁止。而且,當(dāng)噪聲頻率譜的很大一部分位于低頻時(shí),那麼即使某些處理功率被犧牲掉,也要應(yīng)用更陡的濾波坡度。這種額外處理要求仍然是很小的。
根據(jù)上面描述顯而易見,該發(fā)明的自適應(yīng)噪聲濾波系統(tǒng)被簡(jiǎn)單地實(shí)現(xiàn)。并且DSP的計(jì)算量沒有顯著增加。削減噪聲更復(fù)雜的方法,例如″譜削減″要求幾個(gè)涉及計(jì)算的MIPS和存儲(chǔ)數(shù)據(jù)和程序代碼用的大量存儲(chǔ)器。通過比較,該發(fā)明可以通過使用僅僅一小部分″譜削減″算法所要求的MIPS和存儲(chǔ)器而實(shí)現(xiàn),其中的譜削減算法同時(shí)也引入了更多的語音失真。容量降低的存儲(chǔ)器減小了DSP集成電路的大?。唤档偷腗IPS減少了功率消耗。這些特性對(duì)于電池供電的便攜/移動(dòng)無線電話都是很理想的。
參考其優(yōu)選實(shí)施方案,盡管該發(fā)明已經(jīng)被特別表示并描述出,但它不僅限于這些實(shí)施方案。例如,盡管DSP被描述為執(zhí)行幀能量估計(jì)器210,噪聲估計(jì)器230,語音檢測(cè)器240,濾波器選擇器235和濾波器電路265的功能,這些功能可以通過使用其它的數(shù)字和/或模擬元件來實(shí)現(xiàn)。此外,在濾波器電路115以噪聲估計(jì)和噪聲包絡(luò)估計(jì)這兩者函數(shù)的形式來調(diào)整時(shí),自適應(yīng)濾波系統(tǒng)100也可以被實(shí)現(xiàn)。該領(lǐng)域內(nèi)的技術(shù)人員會(huì)明白,在不偏離該發(fā)明思想和范圍的情況下,在形式和細(xì)節(jié)上的各種改變都可以進(jìn)行。
權(quán)利要求
1.一種提高音頻信號(hào)中語音清晰度的方法,包括接收既包括語音信息又包括背景噪聲的數(shù)字化音頻信號(hào)幀;檢測(cè)當(dāng)前幀中是否包括語音信息;以語音檢測(cè)函數(shù)的形式為當(dāng)前幀確定對(duì)應(yīng)于背景噪聲的噪聲估計(jì)值;將對(duì)應(yīng)于噪聲估計(jì)值的濾波器控制信號(hào)輸出到濾波器電路;根據(jù)濾波器控制信號(hào),調(diào)整濾波器電路來為顯示一條用于對(duì)語音濾波器頻率響應(yīng)曲線;及以估計(jì)背景噪聲函數(shù)的形式,將濾波器電路應(yīng)用于當(dāng)前幀并濾波當(dāng)前幀。
2.權(quán)利要求1的方法,其中濾波器電路被調(diào)整來顯示一條高通頻率響應(yīng)曲線來通過落在語音高頻范圍內(nèi)的選出語音部分,并且抽取落在語音低頻范圍的選定語音部分。
3.根據(jù)權(quán)利要求1的方法,其中檢測(cè)當(dāng)前幀中是否包括語音的步驟包括確定當(dāng)前幀的能量并將確定的幀能量與噪聲估計(jì)值和一個(gè)語音閾值的和比較,其中,當(dāng)確定的幀能量超過噪聲估計(jì)值與該語音閾值的和時(shí),語音被檢測(cè)到。
4.根據(jù)權(quán)利要求1的方法,其中噪聲估計(jì)值是為很多接收幀檢測(cè)到的背景噪聲的平均值,這些接收幀都確定不包括語音信息。
5.權(quán)利要求1的方法,其中調(diào)整濾波器電路的步驟還包括當(dāng)噪聲估計(jì)值增加時(shí),調(diào)整濾波器電路使得從當(dāng)前幀中提取更大部分的落在語音低頻范圍的背景噪聲。
6.權(quán)利要求5的方法,其中調(diào)整濾波器電路的步驟還包括當(dāng)計(jì)算后的噪聲估計(jì)值增加時(shí),調(diào)整濾波器電路來顯示具有更高截止頻率的頻率響應(yīng)曲線。
7.權(quán)利要求5的方法,其中調(diào)整濾波器電路的步驟還包括當(dāng)計(jì)算后的噪聲估計(jì)值增加時(shí),調(diào)整濾波器電路來顯示具有更陡坡度的頻率響應(yīng)曲線。
8.權(quán)利要求1的方法,其中濾波器電路被調(diào)整來顯示一個(gè)選中的頻率響應(yīng)曲線,在當(dāng)前幀的噪聲估計(jì)值低于一個(gè)預(yù)定的參考噪聲估計(jì)值時(shí),該曲線基本上通過當(dāng)前幀的所有語音信息。
9.權(quán)利要求1的方法,其中選擇性的調(diào)整濾波器電路的步驟包括調(diào)整一次濾波器最少要經(jīng)過N個(gè)連續(xù)幀,其中N是一個(gè)大于1的整數(shù)。
10.一種用于削減接收到的數(shù)字化音頻信號(hào)幀中噪聲的裝置,其中的數(shù)字化音頻信號(hào)中包括語音和背景噪聲,該裝置包括a)一個(gè)濾波器控制電路,它包括i)用于檢測(cè)數(shù)字化信號(hào)幀中能量值并產(chǎn)生幀能量輸出的能量值檢測(cè)器,其中的幀能量輸出對(duì)應(yīng)于檢測(cè)到的能量值,ii)一個(gè)連接到能量值檢測(cè)器的語音檢測(cè)器,該語音檢測(cè)器用于檢測(cè)數(shù)字化語音幀中是否存在語音,并輸出一個(gè)語音標(biāo)示信號(hào)用來將一個(gè)幀標(biāo)明為包含語音幀或背景噪聲幀,iii)一個(gè)連接到能量值檢測(cè)器和聲音檢測(cè)器的噪聲估計(jì)器,該噪聲估計(jì)器以能量值輸出和語音標(biāo)示信號(hào)函數(shù)的形式來為信號(hào)幀確定噪聲估計(jì)值,iv)用于產(chǎn)生對(duì)應(yīng)于噪聲估計(jì)值的濾波器控制信號(hào)的濾波器選擇器,b)連接到濾波器控制電路的高通濾波器電路,該電路以噪聲估計(jì)值函數(shù)的形式來濾波接收幀。
11.權(quán)利要求10的裝置,其中濾波器電路顯示一個(gè)高通頻率響應(yīng)曲線用來通過落在語音高頻范圍內(nèi)的選出語音部分,并抽取落在語音低頻范圍內(nèi)的選出語音部分。
12.根據(jù)權(quán)利要求10的裝置,其中語音檢測(cè)器檢測(cè)一幀中的語音,其辦法是將確定的幀能量與噪聲估計(jì)值和語音閾值的和相比較,其中當(dāng)確定的幀能量超過噪聲估計(jì)值與語音閾值的和時(shí),語音被檢測(cè)到。
13.根據(jù)權(quán)利要求10的裝置,其中噪聲估計(jì)值對(duì)應(yīng)于為很多被確定不包含語音信息的接收幀檢測(cè)到的背景噪聲的平均值。
14.權(quán)利要求10的裝置,其中濾波器電路被調(diào)整使得當(dāng)噪聲估計(jì)值增加時(shí),從當(dāng)前幀中抽取更大部分的落在語音低頻范圍的背景噪聲。
15.權(quán)利要求14的裝置,其中濾波器電路被調(diào)整使得當(dāng)計(jì)算后的噪聲估計(jì)值增加時(shí),濾波器電路顯示具有更高截止頻率的頻率響應(yīng)曲線。
16.權(quán)利要求14的裝置,其中濾波器電路被調(diào)整使得當(dāng)計(jì)算后的噪聲估計(jì)值增加時(shí),濾波器電路顯示具有更陡坡度的頻率響應(yīng)曲線。
17.權(quán)利要求10的裝置,其中濾波器電路被調(diào)整來顯示一個(gè)選中的頻率響應(yīng)曲線,在當(dāng)前幀的噪聲估計(jì)值低于一個(gè)預(yù)定的參考噪聲估計(jì)值時(shí),該曲線基本上通過當(dāng)前幀的所有語音信息。
18.權(quán)利要求10的裝置,其中調(diào)整一次濾波器最少要經(jīng)過N個(gè)連續(xù)幀,其中N是一個(gè)大于1的整數(shù)。
19.一種無線電通訊系統(tǒng),其中便攜無線電收發(fā)器通過RF信道通訊,每一個(gè)收發(fā)器包括一個(gè)天線;一個(gè)用于將通過天線在RF信道上接收的無線電信號(hào)轉(zhuǎn)換成模擬音頻信號(hào)的接收器;一個(gè)發(fā)送器,包括一個(gè)用于將模擬音頻信號(hào)數(shù)字化為數(shù)字化語音信息幀的編解碼器,數(shù)字化語音信息包括語音和背景噪聲;一個(gè)用于檢測(cè)接收幀中語音并以檢測(cè)語音函數(shù)的形式產(chǎn)生噪聲估計(jì)值的數(shù)字信號(hào)處理器,該處理器還以當(dāng)前幀的計(jì)算后背景噪聲函數(shù)的形式來從當(dāng)前幀中濾除背景噪聲。
20.權(quán)利要求19的裝置,其中背景噪聲被濾除,其辦法是通過落在語音高頻范圍內(nèi)的選中語音部分,并抽取落在語音低頻范圍內(nèi)的選中語音部分。
21.權(quán)利要求20的裝置,其中當(dāng)噪聲估計(jì)值增加時(shí),通過從當(dāng)前幀中抽取更大部分的落在語音低頻范圍的背景噪聲,數(shù)字信號(hào)處理器調(diào)節(jié)性地濾除背景噪聲。
22.一種提高音頻信號(hào)中語音清晰度的方法,包括接收既包括語音信息又包括背景噪聲的數(shù)字化音頻信號(hào)幀;檢測(cè)當(dāng)前幀中是否包括語音信息。以語音檢測(cè)函數(shù)的形式為當(dāng)前幀確定一個(gè)噪聲包絡(luò)估計(jì)值,該噪聲包絡(luò)估計(jì)值包括落在預(yù)定語音頻率范圍內(nèi)的很多頻率上的許多噪聲能量估計(jì)值;將噪聲包絡(luò)估計(jì)值的噪聲能量估計(jì)值與一個(gè)參考噪聲包絡(luò)相比較,該參考噪聲包絡(luò)在對(duì)應(yīng)于噪聲能量估計(jì)值頻率的頻率點(diǎn)上有很多能量閾值;以噪聲包絡(luò)估計(jì)值和參考噪聲包絡(luò)之間比較值函數(shù)的形式產(chǎn)生一個(gè)濾波器控制信號(hào);根據(jù)濾波器控制信號(hào),調(diào)整濾波器電路來顯示一條選出的高通頻率響應(yīng)曲線;及以噪聲包絡(luò)估計(jì)值和參考噪聲包絡(luò)之間比較值函數(shù)的形式,將濾波器電路應(yīng)用于當(dāng)前幀來對(duì)當(dāng)前幀濾波。
23.權(quán)利要求22的方法,其中當(dāng)連續(xù)更高頻率上的噪聲能量估計(jì)值超過了它們?cè)趨⒖荚肼暟j(luò)中對(duì)應(yīng)的能量閾值時(shí),濾波器電路被調(diào)整來抽取更多的低頻能量。
24.權(quán)利要求23的方法,其中調(diào)整濾波器電路的步驟還包括當(dāng)連續(xù)更高頻率上的噪聲能量估計(jì)值超過了它們?cè)趨⒖荚肼暟j(luò)中對(duì)應(yīng)的能量閾值時(shí),調(diào)整濾波器電路來顯示具有更高截止頻率的頻率響應(yīng)曲線。
25.權(quán)利要求22的方法,其中噪聲估計(jì)值是為很多被確定不包括語音信息的接收幀所檢測(cè)到的背景噪聲的平均值。
26.權(quán)利要求22的方法,其中選擇性地調(diào)整濾波器電路的步驟包括調(diào)整一次濾波器最少要經(jīng)過N個(gè)連續(xù)幀,其中N是一個(gè)大于1的整數(shù)。
27.一種用于削減接收到的數(shù)字化音頻信號(hào)幀中噪聲的裝置,其中的數(shù)字化音頻信號(hào)中包括語音和背景噪聲,該裝置包括a)一個(gè)濾波器控制電路,它包括i)用于檢測(cè)數(shù)字化信號(hào)幀中能量值并產(chǎn)生幀能量輸出的能量值檢測(cè)器,其中的幀能量輸出對(duì)應(yīng)于檢測(cè)到的能量值;ii)一個(gè)連接到能量值檢測(cè)器的語音檢測(cè)器,該語音檢測(cè)器用于檢測(cè)數(shù)字化語音幀中是否存在語音,并輸出一個(gè)語音標(biāo)示信號(hào)用來將一個(gè)幀標(biāo)明為包含語音幀或背景噪聲幀;iii)一個(gè)連接到語音檢測(cè)器的譜分析器,該譜分析器以語音檢測(cè)函數(shù)的形式為當(dāng)前幀確定一個(gè)噪聲包絡(luò)估計(jì)值,該噪聲包絡(luò)估計(jì)值包括很多落在預(yù)定語音頻率范圍內(nèi)的頻率點(diǎn)上的噪聲能量估計(jì)值,該譜比較器將噪聲包絡(luò)估計(jì)值的噪聲能量估計(jì)值與一個(gè)參考噪聲包絡(luò)相比,該參考噪聲包絡(luò)在對(duì)應(yīng)于噪聲能量估計(jì)值的頻率上具有很多能量閾值;iv)以噪聲包絡(luò)估計(jì)值與參考噪聲包絡(luò)之間比值函數(shù)的形式來產(chǎn)生濾波器控制信號(hào)的濾波器選擇器。b)連接到濾波器控制電路的高通濾波器電路,該電路以噪聲包絡(luò)估計(jì)值與參考噪聲包絡(luò)之間比較結(jié)果函數(shù)的形式來濾波接收幀。
28.權(quán)利要求27的裝置,其中當(dāng)連續(xù)更高頻率上的噪聲能量估計(jì)值超過了它們?cè)趨⒖荚肼暟j(luò)中對(duì)應(yīng)的能量閾值時(shí),濾波器電路被調(diào)整來提取更多的低頻能量。
29.權(quán)利要求28的裝置,其中調(diào)整濾波器電路的步驟還包括當(dāng)連續(xù)更高頻率上的噪聲能量估計(jì)值超過了它們?cè)趨⒖荚肼暟j(luò)中對(duì)應(yīng)的能量閾值時(shí),調(diào)整濾波器電路來顯示具有更高截止頻率的頻率響應(yīng)曲線。
30.權(quán)利要求27的裝置,其中噪聲估計(jì)值是為很多被確定不包括語音信息的接收幀檢測(cè)到的背景噪聲的平均值。
31.權(quán)利要求27的方法,其中調(diào)整一次濾波器最少要經(jīng)過N個(gè)連續(xù)幀,其中N是一個(gè)大于1的整數(shù)。
32.一種無線電通訊系統(tǒng),其中便攜無線電收發(fā)器通過RF信道通訊,每一個(gè)收發(fā)器包括一個(gè)天線;一個(gè)用于將通過天線在RF信道上接收的無線電信號(hào)轉(zhuǎn)換成模擬音頻信號(hào)的接收器;一個(gè)發(fā)送器,包括一個(gè)用于將模擬音頻信號(hào)數(shù)字化為數(shù)字化語音信息幀的編解碼器,數(shù)字化語音信息包括語音和背景噪聲;一個(gè)用于檢測(cè)接收幀中語音并以檢測(cè)語音函數(shù)的形式來產(chǎn)生噪聲包絡(luò)估計(jì)值的數(shù)字信號(hào)處理器,該處理器還以當(dāng)前幀的計(jì)算后噪聲包絡(luò)估計(jì)值函數(shù)的形式來從當(dāng)前幀中濾除背景噪聲。
全文摘要
一種方法和系統(tǒng)被提供用于自適應(yīng)地削減數(shù)字化音頻信號(hào)幀中的噪聲,其中的數(shù)字化音頻信號(hào)幀中既包括語音又包括背景噪聲。數(shù)字化音頻信號(hào)幀被通過一個(gè)可調(diào)節(jié)的高通濾波器電路來濾除位于數(shù)字化信號(hào)的低頻范圍中的一部分背景噪聲。濾波器電路由一個(gè)適應(yīng)于當(dāng)前幀的濾波器控制電路來調(diào)整,從而顯示出一條選中的頻率響應(yīng)曲線。該濾波器控制電路包括一個(gè)語音檢測(cè)器用于檢測(cè)數(shù)字化音頻信號(hào)幀中是否存在語音。在當(dāng)前幀中沒有檢測(cè)到語音時(shí),濾波器電路被調(diào)整。在第一優(yōu)選實(shí)施方案中,濾波器電路通過計(jì)算對(duì)應(yīng)于背景噪聲的噪聲估計(jì)值來控制濾波器電路,并基于噪聲估計(jì)值來調(diào)整濾波器電路。當(dāng)噪聲估計(jì)值增加時(shí),濾波器電路被調(diào)整來抽取更多數(shù)量的落在語音低頻范圍內(nèi)的能量。在第二優(yōu)選實(shí)施方案中,濾波器電路以噪聲包絡(luò)估計(jì)值函數(shù)的形式而調(diào)整。當(dāng)前幀的噪聲包絡(luò)估計(jì)值以語音檢測(cè)函數(shù)的形式被確定并被拿來與參考噪聲包絡(luò)比較?;谠摫容^,濾波器電路被自適應(yīng)地調(diào)整。
文檔編號(hào)G10L21/0232GK1201547SQ96198008
公開日1998年12月9日 申請(qǐng)日期1996年9月13日 優(yōu)先權(quán)日1995年9月14日
發(fā)明者T·W·索爾維 申請(qǐng)人:艾利森公司