專利名稱:用于抑制尤其在電話中的回聲的裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于為諸如電話之類傳輸音頻信號(hào)(尤其是發(fā)出的語音(uttered speech))的裝置抑制回聲的裝置和相應(yīng)的方法,具有-回聲降低單元,它被安排在用于接收來自遠(yuǎn)端的輸入音頻信號(hào)的輸入信道和用于輸出輸出音頻信號(hào)的輸出信道之間,用于抑制包含在輸出音頻信號(hào)中的回聲信號(hào),-語音活動(dòng)檢測(cè)單元,用于檢測(cè)包含在輸入音頻信號(hào)中的語音信號(hào),和,-控制單元,用于設(shè)置回聲抑制單元對(duì)于回聲抑制的回聲抑制因子。
每個(gè)電話都有揚(yáng)聲器和麥克風(fēng),它們并沒有在聲學(xué)上彼此完全去耦合,因此可能會(huì)引起在遠(yuǎn)端處遠(yuǎn)側(cè)說話者聽見的回聲。尤其在免持裝置的情況下而且在蜂窩電話和無繩電話情況下由于較小的外殼尺寸和說話者的嘴與麥克風(fēng)之間存在相對(duì)大的縫隙,從而這個(gè)問題出現(xiàn)。為了防止這個(gè)所謂的聲學(xué)回聲,因此使用各種方法或者它們的組合。一種衰減以更安靜的話音講話的說話者的半雙工交換機(jī)允許可靠的回聲抑制但是不允許同時(shí)在兩個(gè)方向上的語音(所謂的全雙工)。從麥克風(fēng)信號(hào)中減去回聲信號(hào)的估計(jì)的回聲消除單元允許全雙工通信,但是并不總是能完全地抑制伴隨的回聲。另外一個(gè)可能性是回聲抑制器,它只在必須抑制回聲時(shí)衰減麥克風(fēng)路徑中的輸出信號(hào)。
從WO99/35812 A1中可了解一種在通信系統(tǒng)中用于控制回聲抑制的方法與裝置。在第一實(shí)施例中,如果語音活動(dòng)檢測(cè)器指示來自遠(yuǎn)側(cè)說話者的音頻信號(hào)沒有包含任何語音分量,則聲學(xué)回聲抑制器不活動(dòng)。在另外一個(gè)實(shí)施例中,回聲抑制不是完全不活動(dòng)的,而是被設(shè)置為足以抑制回響的低抑制水平。
因此,在已知系統(tǒng)中,如果來自遠(yuǎn)側(cè)說話者的輸入音頻信號(hào)不包含任何語音信號(hào),則抑制被立即向下切換??墒?,最初,回聲由于回響而可能繼續(xù)“在途中”。遠(yuǎn)側(cè)說話者因此在他自己停止說話之后甚至在所謂的爆破音聲音之后(尤其在聲音“t”、“k”和“p”之后)就可能會(huì)聽到短的回聲。此外,特別是當(dāng)啟動(dòng)該系統(tǒng)時(shí),即在電話對(duì)話開始的時(shí)候,如果(如經(jīng)常的情況那樣)回聲降低單元包括所謂的具有自適應(yīng)FIR濾波(有限沖激響應(yīng))濾波器的回聲消除單元,則另外一個(gè)問題可能出現(xiàn)。在電話對(duì)話開始的時(shí)候,這樣一個(gè)濾波器還不是適配的并且沒有達(dá)到回聲消除。這樣一個(gè)FIR濾波器的回聲降低在開始時(shí)緩慢地增加并且隨著語音的繼續(xù)才能適配。其結(jié)果是在開始的時(shí)候,回聲仍然到達(dá)并且只有在半秒的周期之后回聲抑制才能完全生效。
因此,本發(fā)明的目標(biāo)是提供在音頻傳輸裝置(尤其是電話)中用于有效回聲抑制的裝置和相應(yīng)的方法,打算利用該裝置和方法防止上述問題,并且利用該裝置和方法快速有效地抑制回聲,特別是當(dāng)來自遠(yuǎn)端的輸入音頻信號(hào)不包含任何語音信號(hào)時(shí)。
根據(jù)本發(fā)明用權(quán)利要求1中要求保護(hù)的裝置實(shí)現(xiàn)此目標(biāo),該裝置的特征在于控制單元如此設(shè)計(jì)使得回聲抑制因子從輸入音頻信號(hào)中存在語音信號(hào)時(shí)設(shè)置的高回聲抑制值逐漸地并且連續(xù)地降低到如果語音活動(dòng)檢測(cè)單元檢測(cè)到輸入音頻信號(hào)不包含任何語音信號(hào)時(shí)的低回聲抑制值。
權(quán)利要求11中顯示了用于回聲降低的相應(yīng)方法。權(quán)利要求12中顯示了用于實(shí)現(xiàn)所述方法的計(jì)算機(jī)程序。有利地,本發(fā)明的實(shí)施例在從屬權(quán)利要求中顯示。
本發(fā)明基于這樣一個(gè)發(fā)現(xiàn),即如果輸入音頻信號(hào)不包含語音信號(hào),則回聲抑制因子不應(yīng)該突然被完全向下切換為零或者低值,而是應(yīng)該被逐漸地并且連續(xù)地向下切換,因?yàn)榉駝t就會(huì)如果遠(yuǎn)側(cè)說話者停止說話或者尤其還在所謂的爆破音之后則由于回響會(huì)發(fā)射出回聲。此類煩擾的回聲用根據(jù)本發(fā)明的裝置來阻止,因?yàn)楫?dāng)遠(yuǎn)側(cè)說話者停止說話時(shí)或者在爆破音之后(在爆破音之后短暫停止出現(xiàn)--尤其是在單詞的末尾),回聲抑制因子只是被逐漸地并且不是像已知裝置那樣突然地被減小。在這一點(diǎn)上,從而仍然充分地抑制回聲以確保沒有回響到達(dá)遠(yuǎn)側(cè)說話者。用根據(jù)本發(fā)明的裝置,這導(dǎo)致基本上更舒適的語音傳輸。
根據(jù)優(yōu)選實(shí)施例,從高回聲抑制值到低回聲抑制值的衰退借助指數(shù)函數(shù)來控制。這大致模擬回聲能量真實(shí)的時(shí)間分布(time profile),因?yàn)橐惨阎@在時(shí)間上是按照指數(shù)降低的,并且從而以規(guī)定的倍數(shù)(statedtimes)導(dǎo)致最佳回聲抑制。
以規(guī)定的倍數(shù)控制回聲抑制因子的優(yōu)選函數(shù)在權(quán)利要求3中被顯示。
根據(jù)另外一個(gè)實(shí)施例,回聲抑制因子的向下切換被延遲某一段靜寂時(shí)間,即在這個(gè)靜寂時(shí)間期間仍然設(shè)置高回聲抑制值并且只是從那時(shí)以后降低回聲抑制因子。這也允許有效地抑制回響??墒牵陟o寂時(shí)間期間的此類高回聲抑制不是絕對(duì)需要而只是有助于來自近端(或者來自近側(cè)說話者)的音頻信號(hào)(尤其是語音信號(hào))的不必要的傳輸質(zhì)量減損。
在另外一個(gè)實(shí)施例中,提供另外一個(gè)語音活動(dòng)檢測(cè)單元用于檢測(cè)來自近端的音頻信號(hào)是否包含來自近側(cè)說話者的語音信號(hào)。在這種情況下,如此設(shè)計(jì)控制單元使得當(dāng)語音信號(hào)存在于輸入音頻信號(hào)中和來自近端的音頻信號(hào)中時(shí)設(shè)置中等的回聲抑制值,而只有輸入音頻信號(hào)中不存在語音信號(hào)時(shí)設(shè)置最大回聲抑制值。在第一種情況下,回聲沒有被完全抑制;然而來自近端的語音信號(hào)被聽得清清楚楚地發(fā)射,可選地失真。
在根據(jù)本發(fā)明的裝置中,優(yōu)選地使用回聲降低單元,它包括自適應(yīng)FIR濾波器,用于產(chǎn)生在來自近端的音頻信號(hào)中包含的輸入音頻信號(hào)的回聲估計(jì)。這樣一個(gè)FIR濾波器常常還被使用于回聲消除單元中,它不改變來自近端的信號(hào)。在來自近端的音頻信號(hào)被傳輸給遠(yuǎn)端之前,通常從來自近端的音頻信號(hào)中減去所述估計(jì)。此回聲估計(jì)的功率另外還用作FIR濾波器下游連接的回聲抑制單元的輸入信號(hào)。可是,尤其在通信開始的時(shí)候,即在電話對(duì)話開始的時(shí)候,這樣一個(gè)自適應(yīng)FIR濾波器還不是適配的,并且非常小的回聲功率估計(jì)饋送給回聲抑制單元,這導(dǎo)致非常小的回聲抑制。根據(jù)本發(fā)明,有利實(shí)施例因此規(guī)定在通信開始時(shí)FIR濾波器的系數(shù)被初始化為不等于零的值,以便達(dá)到估計(jì)信號(hào)中的實(shí)際功率,借此在開始階段也達(dá)到足夠的回聲抑制。
根據(jù)基于在那上面的另外一個(gè)實(shí)施例,回聲抑制因子根據(jù)FIR濾波器的最初差適配狀態(tài)而在開始階段被增加,以便補(bǔ)償開始階段中過低的回聲消除。然后,例如借助于定時(shí)裝置,回聲抑制因子只是逐漸地被降低到靜態(tài)(static)高回聲抑制值,此數(shù)值然后在語音信號(hào)包含在輸入音頻信號(hào)中的時(shí)候被保持。定時(shí)裝置例如可以如此設(shè)計(jì)使得在大約0.5到1秒之后(優(yōu)選地在大約0.8秒之后)實(shí)現(xiàn)降低到靜態(tài)高回聲抑制值。用這種方式,在開始階段、即在電話對(duì)話開始的時(shí)候以絕對(duì)的可靠性防止回聲。在這個(gè)時(shí)刻期間,全雙工性能,即遠(yuǎn)側(cè)說話者在遠(yuǎn)側(cè)說話者活動(dòng)時(shí)聽到近側(cè)說話者是否希望中斷他或者近端說話者是否進(jìn)行簡(jiǎn)潔說明的能力實(shí)際上從近端到遠(yuǎn)端說話者被限制??墒?,這通常不是壞處,因?yàn)樵陔娫捄艚虚_頭幾秒中,雙方都說話的情況很少出現(xiàn),因?yàn)槊總€(gè)參與者通常通過說他的名字或問候來開始。
所述回聲抑制值的數(shù)值示例在進(jìn)一步的從屬權(quán)利要求中被顯示。
參考如附圖所示的實(shí)施例示例將進(jìn)一步描述本發(fā)明,但是,本發(fā)明不被限制。附圖中
圖1是根據(jù)本發(fā)明的回聲降低裝置的框圖,圖2示出了用根據(jù)本發(fā)明的裝置實(shí)現(xiàn)的回聲抑制因子和回聲抑制的時(shí)間分布,和圖3是根據(jù)本發(fā)明使用的語音活動(dòng)檢測(cè)單元的框圖。
圖1是根據(jù)本發(fā)明的回聲降低裝置的框圖。在所說明的實(shí)施例中,這被使用在用于傳輸音頻信號(hào)的裝置中,也就是例如在移動(dòng)電話、免持裝置、無線或無繩電話中。輸入信道1上來自遠(yuǎn)端(遠(yuǎn)側(cè)說話者)的輸入音頻信號(hào)A1被轉(zhuǎn)換器2放大、轉(zhuǎn)換成模擬電信號(hào)并在揚(yáng)聲器23處被輸出,該轉(zhuǎn)換器2包括放大器21、數(shù)字/模擬轉(zhuǎn)換器22和揚(yáng)聲器23。來自近端(近側(cè)說話者)的音頻信號(hào)A0(此信號(hào)可能包含語音和噪聲)在回聲降低單元4中的適當(dāng)?shù)幕芈曇种坪筇幚碇笞鳛閭鬏斀o遠(yuǎn)端(遠(yuǎn)側(cè)說話者)的輸出音頻信號(hào)A2在輸出信道5上被輸出之前,該音頻信號(hào)A0被再轉(zhuǎn)換器(reconverter)3轉(zhuǎn)換成數(shù)字電信號(hào)并放大,可選地,它可以和輸入音頻信號(hào)A1的回聲信號(hào)A1′一起進(jìn)行,該再轉(zhuǎn)換器3包括麥克風(fēng)31、模擬/數(shù)字轉(zhuǎn)換器32和放大器33。
根據(jù)本發(fā)明提供的回聲降低單元4包括自適應(yīng)FIR濾波(有限沖激響應(yīng))濾波器40(也被稱為回聲消除單元),該自適應(yīng)FIR濾波濾波器40生成包含在再轉(zhuǎn)換器3的輸出信號(hào)z中的輸入/音頻信號(hào)A1的回聲估計(jì)e。一方面,借助于減法器41從再轉(zhuǎn)換器3的輸出信號(hào)z中減去此估計(jì)信號(hào)e。可是,殘余回聲可能仍然保持在減法器41的輸出信號(hào)r中,一方面,由于FIR濾波器40的失調(diào),另一方面,由于FIR濾波器40只能估計(jì)大約25毫秒的一個(gè)有限回聲持續(xù)時(shí)間。
減法器41的回聲降低了的輸出信號(hào)r然后被饋送給后處理單元42(也稱為回聲抑制單元),該后處理單元42首先借助于尤其是具有128個(gè)點(diǎn)的FFT單元421把信號(hào)r變換到頻域。殘余回聲然后通過衰減具有顯著回聲貢獻(xiàn)的頻率而被抑制。相比之下,來自近端的音頻信號(hào)A0占優(yōu)勢(shì)的頻率被較少衰減。這個(gè)衰減在乘法器422中借助頻率相關(guān)的衰減函數(shù)D來完成,該衰減函數(shù)D借助于衰減計(jì)算單元423而被計(jì)算,優(yōu)選地,該衰減計(jì)算單元423使用最小均方差(MMSE)方法。為此目的,頻率相關(guān)的所估計(jì)的回聲信號(hào)E是必要的,該回聲信號(hào)E借助于以與FFT變換單元421同樣的方式動(dòng)作的FFT變換單元424通過FFT變換從時(shí)間相關(guān)的所估計(jì)的回聲信號(hào)e中被計(jì)算出。因?yàn)闀r(shí)間相關(guān)的所估計(jì)的回聲信號(hào)e只包含早期回聲(例如開頭25毫秒內(nèi)的回聲),所以另外提供回聲混響單元425,其加上稍后回聲的估計(jì),假定回聲能量以指數(shù)降低。
回聲抑制的程度借助回聲抑制因子s來控制,頻率相關(guān)的所估計(jì)的回聲信號(hào)E在乘法器426中與它相乘。語音活動(dòng)檢測(cè)單元427從減法器41的轉(zhuǎn)變成頻域的輸出信號(hào)r和轉(zhuǎn)變成頻域的所估計(jì)的回聲信號(hào)e中檢測(cè)來自近端的音頻信號(hào)A0中是否包含語音信號(hào),把相應(yīng)的信息傳送到控制單元6上。另外,關(guān)于語音信號(hào)是否包含在輸入音頻信號(hào)A1中并且由另外一個(gè)語音活動(dòng)檢測(cè)單元7確定的信息被饋送給控制單元6。正如將在下面解釋的,從這個(gè)信息中,并且可選地,從來自定時(shí)單元8中的另外的時(shí)間信息中,適于每種情形的回聲抑制因子s然后按照根據(jù)本發(fā)明的方法被計(jì)算出。一旦轉(zhuǎn)變成頻域的減法器41的輸出信號(hào)r已經(jīng)乘以相應(yīng)計(jì)算出的衰減D,則它借助于反向FFT變換單元428被變換回到時(shí)域,在此之后,它經(jīng)由輸出信道5作為輸出音頻信號(hào)A2被傳輸給遠(yuǎn)端。
本發(fā)明利用了心理聲學(xué)效果,即人類聽眾感覺不到作為回聲信號(hào)的穩(wěn)定信號(hào)。對(duì)于這一點(diǎn)的一個(gè)淺顯的解釋是從來自遠(yuǎn)端的背景噪聲中而來的“回聲信號(hào)”聽起來像噪聲本身,因?yàn)楫?dāng)從揚(yáng)聲器23反饋到麥克風(fēng)31時(shí)噪聲的頻譜部分通常沒有改變。用這種方式,這樣的“回聲”被背景噪聲遮蓋并且因此聽不見。此外,從來自遠(yuǎn)端的背景噪聲中而來的“回聲”聽起來像來自其它地方(例如來自近端)的噪聲。在遠(yuǎn)端的聽者因此將不會(huì)把這樣一個(gè)“回聲”真正視為回聲,即使他聽得見它。因此,只有背景噪聲被包含在來自遠(yuǎn)端的輸入音頻信號(hào)A1中且位于遠(yuǎn)端的參與者沒有意識(shí)到回聲時(shí)可以極大地降低回聲抑制。
根據(jù)本發(fā)明,在此類情形中控制單元6因此把回聲抑制因子s降低到一個(gè)低值s低。可是,根據(jù)本發(fā)明,這個(gè)降低不是突然完成的,而是逐漸地并且連續(xù)地、尤其是按照回聲能量的下降而完成的。否則,如果在遠(yuǎn)端的說話者要停止說話,則將聽得見回聲中的下降。如上所述,控制單元6使用從語音活動(dòng)檢測(cè)單元427和7中獲得關(guān)于提供給重新處理單元42的信號(hào)r或輸入音頻信號(hào)A1是否包含語音信號(hào)的信息。按照這個(gè)信息,在下列表格中編譯該特性,其中k是幀時(shí)間而α再現(xiàn)了回聲能量中的指數(shù)下降。
通常,同一回聲再現(xiàn)常數(shù)α也被使用于回聲再現(xiàn)單元425中用于回聲估計(jì)。優(yōu)選地,因子α展現(xiàn)了范圍從0.5到0.99的值,優(yōu)選地范圍從0.75到0.85。典型的例如為0.01秒的幀時(shí)間k、α=0.8的值是有利的。通常,因子α也可以被描述為α=10∧(-3*幀時(shí)間/T60),其中T60是典型的房間(例如辦公室、客廳、車)的回響時(shí)間。
當(dāng)輸入音頻信號(hào)沒有語音信號(hào)時(shí),根據(jù)本發(fā)明的控制顯著地改善了從近端到遠(yuǎn)端傳輸?shù)恼Z音的質(zhì)量,來自近端的音頻信號(hào)中語音信號(hào)的存在對(duì)于確定回聲抑制因子沒有任何重要性。因?yàn)榻柚谡Z音活動(dòng)檢測(cè)單元7可以高度可靠地確定在輸入音頻信號(hào)中語音信號(hào)的存在,所以當(dāng)在輸入音頻信號(hào)中沒有語音信號(hào)時(shí),可以為回聲抑制因子設(shè)置相對(duì)小的值,此數(shù)值量例如為0.5或更小,而不必冒錯(cuò)誤地沒有抑制回聲的風(fēng)險(xiǎn),這同樣有助于來自近端的語音信號(hào)的高傳輸質(zhì)量。即使兩個(gè)說話者都同時(shí)說話,來自近端說話者的語音信號(hào)的傳輸也可以改善,因?yàn)榧词乖谒f的詞內(nèi),語音活動(dòng)檢測(cè)單元7也可以在短的停頓期間在來自遠(yuǎn)端的語音中實(shí)現(xiàn)到低回聲抑制因子s低的切換。
向低回聲抑制值s低的向下切換還可以被延遲一段靜寂時(shí)間,可是,這產(chǎn)生不必要高的抑制,因?yàn)樵谡麄€(gè)靜寂時(shí)間(這個(gè)量例如可以是0.4秒)上它是均勻的。因此實(shí)現(xiàn)從高回聲抑制值s高到低回聲抑制值s低的上述指數(shù)性衰減更好。這基本上模擬回聲能量的真實(shí)的時(shí)間分布,因?yàn)檫@也已知是在時(shí)間上按指數(shù)減少的。
當(dāng)使用自適應(yīng)FIR濾波器40(優(yōu)選地,正如使用于目前情況下一樣)時(shí),應(yīng)當(dāng)指出尤其是在通信傳輸開始時(shí),即在電話對(duì)話開始的時(shí)候,F(xiàn)IR濾波器40還不是適配的并因此沒有達(dá)到從信號(hào)r到z的回聲降低。FIR濾波器的回聲降低只是緩慢地增加,如此以致,在開始的時(shí)候如果重新處理裝置42仍然以正常的方式抑制,則回聲仍然通過。這可能甚至?xí)鼔?,因?yàn)橹匦绿幚硌b置42與所估計(jì)的回聲信號(hào)e的功率按比例地抑制回聲。如果FIR濾波器40因此像平常一樣用零系數(shù)初始化,則此功率最初為0并且最早在大約半秒的延遲之后達(dá)到回聲功率的實(shí)際值。
因此,為了消除這個(gè)問題,根據(jù)本發(fā)明通過把FIR濾波器40的系數(shù)初始化為不等于零的值來確保所估計(jì)的回聲信號(hào)e的功率在開始階段期間足夠。例如,可以設(shè)置系數(shù)為1。在此使用的這類回聲降低單元4的情況下,系數(shù)的數(shù)值范圍被限制為-1到+1,以致多個(gè)系數(shù)必須被預(yù)置以便在開始達(dá)到所估計(jì)的回聲信號(hào)e中的實(shí)際功率。必須確保系數(shù)表示寬帶系統(tǒng),以使后處理單元42也可以抑制所有頻率處的回聲。例如,用數(shù)值{1,1,1,1,-1,-1,1,-1}預(yù)置FIR濾波器的八個(gè)連續(xù)系數(shù)是適合的。因此,與預(yù)置單個(gè)系數(shù)比較起來,在所估計(jì)的回聲信號(hào)e開始時(shí),獲得八倍的功率。另外,用這種方式預(yù)置的FIR濾波器以大致相同的方式傳輸所有相關(guān)的頻率。
在根據(jù)本發(fā)明的裝置的優(yōu)選實(shí)施例中,回聲抑制因此在開始時(shí)另外由重新處理裝置42實(shí)現(xiàn)。想法是根據(jù)最初差的FIR適配狀態(tài)增加高回聲抑制值s高。為此目的,例如可以使用所示出的定時(shí)裝置8。低回聲抑制值,即s低被保持,因?yàn)闆]有遠(yuǎn)側(cè)語音,即使在一開始也沒有回聲出現(xiàn)。
圖2示出了回聲抑制因子s的分布,其中高回聲抑制值s高的分布以虛線圖示。在區(qū)域A中,抑制充分大以便補(bǔ)償FIR濾波器太小的回聲消除。在區(qū)域B和C中,由于輸入音頻信號(hào)中缺乏語音,所以沒有FIR適配發(fā)生,這由語音活動(dòng)檢測(cè)單元7的輸出信號(hào)FE-SAD來指示。因此,高回聲抑制值s高在區(qū)域B和C中沒有進(jìn)一步被降低;定時(shí)單元8因此沒有任何進(jìn)一步計(jì)數(shù),其中該定時(shí)單元8可以采用例如起始時(shí)間計(jì)量器的形式。此外,定時(shí)單元8優(yōu)選地被如此設(shè)置以使另外有一個(gè)安全區(qū)域D,因?yàn)檫m配周期可以作為遠(yuǎn)側(cè)語音的函數(shù)變化。從區(qū)域E開始,達(dá)到穩(wěn)定狀態(tài),并且s高=s高,靜態(tài)不變地保持在穩(wěn)定的高回聲抑制值處。
圖2還示出了根據(jù)本發(fā)明在區(qū)域B和C中(即,當(dāng)輸入音頻信號(hào)中沒有語音時(shí))提供的回聲抑制因子s向低回聲抑制值s低按指數(shù)的下降。圖2的底端圖表另外示出了回聲降低ER在時(shí)間上的分布。很清楚,在大約0.8秒的適配時(shí)間之后,可靠地達(dá)到必需的精確度(在這里使用的具有200系數(shù)的FIR濾波器的情況下)。因此,對(duì)于給定的FIR濾波器長(zhǎng)度,收斂時(shí)間已知。在此s<4,重新處理單元42還用最大抑制對(duì)輕微的回聲起作用。在這種情況下,它的特性就像傳輸方向上頻率相關(guān)的半雙工控制、即沒有回聲通過,但是在遠(yuǎn)側(cè)語音期間傳輸方向也被阻塞。當(dāng)s高,初始=10時(shí),這就是區(qū)域A中的情況。在區(qū)域B中,抑制根據(jù)回響按指數(shù)降低,而在區(qū)域C中,當(dāng)s低=0.5時(shí)傳輸方向被接通。從區(qū)域E開始,當(dāng)s高,靜態(tài)=1.5時(shí),只有沒有被FIR濾波器消除的殘余回聲的抑制被獲得,可是,為此目的,傳輸方向從不會(huì)被完全阻塞,即在初始階段之后獲得正常的特性。
根據(jù)本發(fā)明使用的語音活動(dòng)檢測(cè)單元的示例框圖在圖3中被說明。這樣一個(gè)單元可以檢測(cè)具有穩(wěn)定背景噪聲的信號(hào)內(nèi)的語音信號(hào)。在示出的實(shí)施例中,這包括用于確定在短周期上測(cè)量的信號(hào)電平Ls的單元71;用于確定在一個(gè)較長(zhǎng)周期上測(cè)量的輸入信號(hào)I的最低信號(hào)電平Ml的單元72;以及比較器73。這利用了這樣一個(gè)事實(shí)即,與背景噪聲信號(hào)相比,語音信號(hào)展現(xiàn)強(qiáng)時(shí)間相關(guān)的信號(hào)電平。不論何時(shí)在短周期上測(cè)量的信號(hào)電平Ls比在較長(zhǎng)周期(例如2秒)上測(cè)量的最低信號(hào)電平Ml大一個(gè)因子C,例如C=2(對(duì)應(yīng)于6dB),語音活動(dòng)就被檢測(cè)并且隨此信息輸出相應(yīng)的輸出信號(hào)O。
在開始時(shí)從s高到s低的優(yōu)選指數(shù)性衰減以及s高的控制二者一起允許在去掉所有回聲的同時(shí)抑制被保持在最低可能。抑制越低,則在雙方都說話期間全雙工通信越好。全雙工通信在這里是指遠(yuǎn)側(cè)說話者在遠(yuǎn)側(cè)說話者活動(dòng)的同時(shí)聽見近側(cè)說話者是否希望中斷他或者是否要進(jìn)行簡(jiǎn)短的說明。根據(jù)本發(fā)明在一開始時(shí)控制s高的另外一個(gè)優(yōu)點(diǎn)是在電話對(duì)話開始的時(shí)候,以絕對(duì)的可靠性防止回聲。在這個(gè)時(shí)間期間,從近側(cè)到遠(yuǎn)側(cè)說話者的全雙工性能被限制,但是這不是缺點(diǎn),因?yàn)樵陔娫捄艚械拈_頭幾秒雙方都說話很少發(fā)生,而是每個(gè)參與者最初說他的名字或問候。
權(quán)利要求
1.一種用于為傳輸音頻信號(hào)、尤其是發(fā)出的語音的裝置減少回聲的裝置,具有-回聲降低單元(4),被安排在用于接收來自遠(yuǎn)端的輸入音頻信號(hào)(A1)的輸入信道(1)和用于輸出輸出音頻信號(hào)(A2)的輸出信道(5)之間,用于抑制包含在輸出音頻信號(hào)(A2)中的回聲信號(hào),-語音活動(dòng)檢測(cè)單元(7),用于檢測(cè)包含在輸入音頻信號(hào)(A1)中的語音信號(hào),和-控制單元(6),用于設(shè)置回聲降低單元(4)的回聲抑制因子(s)用于進(jìn)行回聲抑制,其特征在于控制單元(6)被如此設(shè)計(jì)使得回聲抑制因子(s)從輸入音頻信號(hào)(A1)中存在語音信號(hào)時(shí)設(shè)置的高回聲抑制值逐漸地并且連續(xù)地降低到如果語音活動(dòng)檢測(cè)單元(7)檢測(cè)到輸入音頻信號(hào)(A1)不包含任何語音信號(hào)時(shí)的低回聲抑制值。
2.如權(quán)利要求1所述的裝置,其特征在于控制單元(6)被如此設(shè)計(jì)以使回聲抑制因子(s)的降低從高回聲抑制值到低回聲抑制值按指數(shù)發(fā)生。
3.如權(quán)利要求2所述的裝置,其特征在于回聲抑制因子(s)的降低按照函數(shù)s[k]=α·s[k-1]+(1-α)·s低發(fā)生,其中s[k]是時(shí)刻k時(shí)的回聲抑制值,α是表示指數(shù)降低特性的因子,而s低是最小回聲抑制值。
4.如權(quán)利要求3所述的裝置,其特征在于最小抑制值s低展現(xiàn)在從0.1到1范圍中的一個(gè)數(shù)值,優(yōu)選地大致為0.5;而表示指數(shù)降低的因子α展現(xiàn)范圍從0.5到0.99的一個(gè)數(shù)值,優(yōu)選地在從0.75到0.85的范圍中。
5.如權(quán)利要求1所述的裝置,其特征在于控制單元(6)被設(shè)計(jì)為把回聲抑制因子(s)從設(shè)置的高回聲抑制值到低回聲抑制值的降低時(shí)間延遲一段靜寂時(shí)間,特別是在從0.1到1秒的范圍中,優(yōu)選地大致為0.4秒。
6.如權(quán)利要求1所述的裝置,其特征在于提供第二語音活動(dòng)檢測(cè)單元(427)用于檢測(cè)包含在饋送給回聲降低單元(4)的回聲降低的音頻信號(hào)(r)中并且來自近端的語音信號(hào),并且控制單元(6)被如此設(shè)計(jì)以使如果輸入音頻信號(hào)包含語音信號(hào)以及回聲降低的音頻信號(hào)(r)不包含來自近端的語音信號(hào)則回聲抑制因子(s)被設(shè)置為高回聲抑制值,并且如果輸入音頻信號(hào)(A1)包含語音信號(hào)而回聲降低的音頻信號(hào)(r)包含來自近端的語音信號(hào)則回聲抑制因子(s)被設(shè)置為位于高和低回聲抑制值之間的中間回聲抑制值。
7.如權(quán)利要求1所述的裝置,其特征在于回聲降低單元(4)包括用于確定所估計(jì)的回聲信號(hào)(e)的自適應(yīng)FIR回聲濾波器(40),并且該自適應(yīng)FIR回聲濾波器(40)的系數(shù)在輸入音頻信號(hào)(A1)的接收開始時(shí)被初始化為不等于零的值。
8.如權(quán)利要求7所述的裝置,其特征在于控制單元(6)被如此設(shè)計(jì)以使在輸入音頻信號(hào)(A1)的接收開始時(shí)回聲抑制因子(s)被設(shè)置為最大開始回聲抑制值,而在語音信號(hào)出現(xiàn)在輸入音頻信號(hào)(A1)中時(shí)然后被連續(xù)地、特別是線性地降低到穩(wěn)定的高回聲抑制值。
9.如權(quán)利要求8所述的裝置,其特征在于用于把回聲抑制因子(s)從最大開始回聲抑制值減少到靜態(tài)高回聲抑制值的時(shí)間周期被如此設(shè)置以使它大致對(duì)應(yīng)于自適應(yīng)FIR回聲濾波器(40)的適配持續(xù)時(shí)間。
10.如權(quán)利要求9所述的裝置,其特征在于最大開始回聲抑制值存在于5和15之間的范圍中,特別是在大致在10附近,并且靜態(tài)高回聲抑制值大致位于從1到2的范圍中,尤其是大致在1.5的范圍中。
11.一種用于在音頻信號(hào)、尤其是發(fā)出的語音的傳輸中減少回聲的方法,該方法具有下列步驟-用于抑制包含在輸出音頻信號(hào)(A2)中的輸入音頻信號(hào)(A1)的回聲信號(hào)(A1)的回聲抑制,-包含在輸入音頻信號(hào)(A1)中的語音信號(hào)的檢測(cè),以及-用于回聲抑制的回聲抑制因子(s)的設(shè)置,其特征在于回聲抑制因子(s)被從語音信號(hào)存在于輸入音頻信號(hào)(A1)中時(shí)設(shè)置的高回聲抑制值逐漸地并且連續(xù)地降低到如果檢測(cè)到輸入音頻信號(hào)(A1)不包含任何語音信號(hào)時(shí)的低回聲抑制值。
12.一個(gè)具有計(jì)算機(jī)編程裝置的計(jì)算機(jī)程序,如果如權(quán)利要求11所述的方法在計(jì)算機(jī)上被執(zhí)行,則所述計(jì)算機(jī)程序用于使計(jì)算機(jī)執(zhí)行該方法的方法步驟。
全文摘要
本發(fā)明涉及一種用于音頻信號(hào)、尤其是發(fā)出語音的傳輸?shù)难b置的抑制裝置,具有回聲降低單元(4),該回聲降低單元(4)被安排在用于接收來自遠(yuǎn)端的輸入音頻信號(hào)(A1)的輸入信道(1)和用于輸出輸出音頻信號(hào)(A2)的輸出信道(5)之間,用于抑制包含在輸出音頻信號(hào)(A2)中的回聲信號(hào);語音活動(dòng)檢測(cè)單元(7),用于檢測(cè)包含在輸入音頻信號(hào)(A1)中的語音信號(hào);和控制單元(6),用于設(shè)置回聲降低單元(4)用于回聲抑制的回聲抑制因子(s)。為了在這樣一個(gè)裝置中改善來自近端的語音信號(hào)的質(zhì)量并且同時(shí)為了有效抑制回聲而同時(shí)還保持最低可能的回聲抑制,根據(jù)本發(fā)明建議以這樣的方式設(shè)計(jì)控制單元(6)以使回聲抑制因子(s)從語音信號(hào)存在于輸入音頻信號(hào)(A1)中時(shí)設(shè)置的高回聲抑制值逐漸并且連續(xù)地降低到如果語音活動(dòng)檢測(cè)單元(7)檢測(cè)到輸入音頻信號(hào)(A1)不包含任何語音信號(hào)時(shí)的低回聲抑制值。
文檔編號(hào)H04M9/08GK1736091SQ200380108442
公開日2006年2月15日 申請(qǐng)日期2003年12月22日 優(yōu)先權(quán)日2003年1月8日
發(fā)明者A·施滕格爾 申請(qǐng)人:皇家飛利浦電子股份有限公司