專(zhuān)利名稱(chēng):回聲處理裝置的制作方法
發(fā)明所屬領(lǐng)域本發(fā)明涉及在聲音通信系統(tǒng)和電視會(huì)議裝置(televisionconference system)等中降低通信線路和揚(yáng)聲器與麥克風(fēng)之間的反射線路產(chǎn)生的包含在發(fā)送聲音信號(hào)中的回聲的回聲處理裝置。
現(xiàn)有技術(shù)一般地,為了電視會(huì)議裝置和汽車(chē)車(chē)內(nèi)的免提通話或?yàn)榱藙h除通信線路中產(chǎn)生的聲響·線路回聲而使用回聲處理裝置(回聲刪除器)。該回聲刪除器具有消除回聲成分的自適應(yīng)濾波器和抑制殘余回聲成分的回聲抑制器,通過(guò)自適應(yīng)濾波器消除回聲成分后,由回聲抑制器抑制處理未消除的回聲成分(殘余回聲成分)的振幅。但是,回聲抑制器還抑制了殘余回聲成分以外的聲響的背景噪音信號(hào),因此通話信號(hào)中的背景噪音產(chǎn)生斷續(xù)感,產(chǎn)生通話品質(zhì)的惡化。這里通過(guò)生成虛擬背景噪音并重疊在輸出信號(hào)上來(lái)減輕斷續(xù)感。
該回聲處理裝置的一例,例如在特開(kāi)2000-224081號(hào)公報(bào)″回聲刪除器裝置″中公開(kāi)。
圖12是表示上述特開(kāi)2000-224081號(hào)公報(bào)公開(kāi)的已有回聲處理裝置結(jié)構(gòu)的框圖。圖12中,100是自適應(yīng)濾波器,120是虛擬背景噪音發(fā)生器,131是AFB(分析濾波器組),132是第一抑制部,133是加法器,134是SFB(合成濾波器組),135是第二抑制部,136是第一電平估計(jì)部,137是第二電平估計(jì)部,138是檢測(cè)部。
接著說(shuō)明動(dòng)作。
自適應(yīng)濾波器100從混入了回聲信號(hào)的輸入信號(hào)S[t]中部分消除回聲,輸出回聲消除后的信號(hào)U[t]。但是,自適應(yīng)濾波器100不能完全消除回聲,因此該回聲消除后的輸入信號(hào)U[t]包含殘余回聲信號(hào)。
AFB131通過(guò)頻帶分割包含殘余回聲信號(hào)的輸入信號(hào)U[t]來(lái)生成各頻帶的輸入信號(hào)U[t,j],將其提供給第一抑制部132和虛擬背景噪音發(fā)生器120。這里,j表示各頻帶的序號(hào)。對(duì)于各頻帶的殘余回聲,第一抑制部132對(duì)殘余回聲信號(hào)施加損耗(Loss1)使其衰減來(lái)抑制并消除回聲信號(hào)。損耗Loss1的計(jì)算方法如下。
首先,比較遠(yuǎn)端說(shuō)話人聲音信號(hào)Rin的平均功率Pow(Rin)和輸入信號(hào)U[t,j]的平均功率Pow(S[j]),如果前者大于后者,則根據(jù)式(1)從現(xiàn)有的損耗Loss1減去μ。
Loss1[j]=Loss1[j]-μ ………….(1)這里,μ是抑制量的節(jié)距值,是常數(shù)。
另一方面,平均功率Pow(Rin)如果小于平均功率Pow(S[j]),則根據(jù)式(2)向現(xiàn)有的損耗Loss1加上μ。
Loss1[j]=Loss1[j]+μ ………….(2)但是,任一情況下,為落入式(3)所示范圍,都調(diào)整損耗Loss1。
Loss(max)≤Loss1[j]≤0(dB) ………….(3)這里,Loss(max)是第一抑制部132可提供的最大損耗量。
通過(guò)反復(fù)以上比較和調(diào)整,使損耗Loss1收斂的同時(shí),可根據(jù)殘余回聲的電平控制損耗Loss1。
該過(guò)程中,殘余回聲信號(hào)由第一抑制部132抑制并消除大部分的回聲信號(hào),但也抑制了重疊在回聲信號(hào)上的聲響的背景噪音信號(hào),這也是通話產(chǎn)生斷續(xù)感的原因。
另一方面,虛擬背景噪音發(fā)生器120估計(jì)由AFB131頻帶分割的信號(hào)U[t,j]的背景噪音的電平,生成和背景噪音電平相同電平的虛擬背景噪音N[t,j]。生成的虛擬背景噪音N[t,j]提供給加法器133,由該加法器133把虛擬背景噪音N[t,j]加到由第一抑制部132將回聲降低的信號(hào)上。此時(shí),相加后的背景噪音電平與虛擬背景噪音電平相同。
加法器133的輸出信號(hào)O[t,j]按每個(gè)頻帶分離,將其提供給SFB134,由SFB134合成并作為輸出信號(hào)O[t]輸出,還輸入到第二抑制部135。
加法器133輸出的各頻帶的輸出信號(hào)O[t,j]的瞬時(shí)電平由第二電平估計(jì)部137測(cè)定。另外,虛擬背景噪音發(fā)生器120輸出的各頻帶的虛擬背景噪音N[t,j]的瞬時(shí)電平由第一電平估計(jì)部136測(cè)定。通過(guò)電平估計(jì)部136,137二者的測(cè)定結(jié)果相比,可判斷近端說(shuō)話人聲音實(shí)際是否存在。
二者的電平估計(jì)部136,137的測(cè)定結(jié)果提供給檢測(cè)部138,基于此檢測(cè)部138進(jìn)行每個(gè)頻帶的有聲、無(wú)聲檢測(cè)(判斷是否實(shí)際存在近端說(shuō)話人的聲音)。另外,合成各頻帶的有聲、無(wú)聲結(jié)果,在1個(gè)以上的頻帶檢測(cè)出有聲時(shí),輸出表示有聲的數(shù)字信號(hào)[1],全部的頻帶檢測(cè)出無(wú)聲時(shí),將表示無(wú)聲的數(shù)字信號(hào)
輸出。
檢測(cè)部138的輸出結(jié)果輸入到第二抑制部135,基于此第二抑制部135決定如下抑制量Loss2,向信號(hào)O[t]提供損耗Loss2并使之衰減。
首先,檢測(cè)部138的檢測(cè)結(jié)果是0(無(wú)聲)時(shí),根據(jù)式(4)向現(xiàn)有的損耗Loss2上加上μ’。
Loss2=Loss2+μ’ ………….(4)這里,μ’是抑制量的節(jié)距值,是絕對(duì)值非常小的正常數(shù)(例如0.1-0.01dB)。
另一方面,檢測(cè)部138的檢測(cè)結(jié)果是1(有聲)時(shí),根據(jù)式(5)使損耗Loss2為0。
Loss2=0(dB)………….(5)從式(4)可知,無(wú)聲的情況下,可分級(jí)增加抑制量并僅抑制背景噪音。相反,在有聲的情況下,從式(5)可知,瞬時(shí)將抑制量(Loss2)設(shè)定為0(dB)來(lái)防止聲音信號(hào)的抑制。
如上所述的已有回聲處理裝置通過(guò)分頻濾波器將回聲消除后的輸入信號(hào)分割為各個(gè)頻帶的時(shí)間信號(hào),估計(jì)背景噪音的各頻帶的電平,生成具有和背景噪音相同振幅頻譜的虛擬背景噪音信號(hào),對(duì)通過(guò)NLP(非線性處理)處理抑制的信號(hào)重疊處理虛擬背景噪音信號(hào),從而減輕背景噪音的斷續(xù)感。
發(fā)明要解決的問(wèn)題但是,已有的回聲處理裝置為上述結(jié)構(gòu),后面混入的虛擬背景噪音通過(guò)對(duì)每個(gè)小頻帶估計(jì)輸入信號(hào)的背景噪音電平得到和輸入信號(hào)的背景噪音相同的振幅頻譜,但其相位頻譜和輸入信號(hào)的相位頻譜不同,具有混合了虛擬背景噪音的最終的輸出信號(hào)依然導(dǎo)致不自然感和不和諧感等的問(wèn)題。
本發(fā)明目的是可根據(jù)要發(fā)送的輸入信號(hào)的頻譜生成自然性高的虛擬背景噪音的回聲處理裝置。
解決問(wèn)題的方案本發(fā)明的回聲處理裝置包括比較混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)和接收的接收輸入信號(hào)的狀態(tài),根據(jù)該比較計(jì)算回聲抑制量的回聲抑制量計(jì)算部;將發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;對(duì)應(yīng)回聲抑制量在振幅頻譜中混合噪音頻譜的混合部;根據(jù)通過(guò)混合部混合了噪音頻譜的振幅頻譜和相位頻譜生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出發(fā)送輸出信號(hào)的頻率·時(shí)間變換部。
本發(fā)明的回聲處理裝置中,混合部具有對(duì)應(yīng)回聲抑制量調(diào)整振幅頻譜的頻譜振幅的振幅調(diào)整部。
本發(fā)明的回聲處理裝置具有頻譜減法部,從振幅頻譜減去噪音頻譜乘以頻譜減算率的頻譜,生成去除噪音振幅頻譜,將去除噪音振幅頻譜作為振幅頻譜提供給混合部。
本發(fā)明的回聲處理裝置包括比較混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)和接收的接收輸入信號(hào)的狀態(tài),根據(jù)該比較計(jì)算回聲抑制量的回聲抑制量計(jì)算部;將發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;在振幅頻譜中混合噪音頻譜的混合部;對(duì)應(yīng)回聲抑制量擾亂(隨機(jī)化)相位頻譜的相位的相位隨機(jī)化部;根據(jù)通過(guò)混合部混合了噪音頻譜的振幅頻譜和相位隨機(jī)化部擾亂了相位的相位頻譜生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出發(fā)送輸出信號(hào)的頻率·時(shí)間變換部。
本發(fā)明的回聲處理裝置中,在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值小的情況下,相位隨機(jī)化部擾亂要發(fā)送的發(fā)送輸入信號(hào)的相位頻譜中高頻區(qū)域的相位,隨著回聲抑制量增大,相位隨機(jī)化部不僅擾亂高頻區(qū)域,還擾亂低頻區(qū)域的相位。
本發(fā)明的回聲處理裝置包括比較混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)和接收的接收輸入信號(hào)的狀態(tài),根據(jù)該比較計(jì)算回聲抑制量的回聲抑制量計(jì)算部;將發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;在振幅頻譜中混合噪音頻譜的混合部;對(duì)應(yīng)回聲抑制量擾亂振幅頻譜的振幅的振幅隨機(jī)化部;根據(jù)通過(guò)振幅隨機(jī)化部擾亂了振幅并且由混合部混合了噪音頻譜的振幅頻譜和相位頻譜生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出發(fā)送輸出信號(hào)的頻率·時(shí)間變換部。
本發(fā)明的回聲處理裝置中,在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值小的情況下,振幅隨機(jī)化部擾亂要發(fā)送的發(fā)送輸入信號(hào)的振幅頻譜中高頻區(qū)域的振幅,隨著回聲抑制量增大,振幅隨機(jī)化部不僅擾亂高頻區(qū)域,還擾亂低頻區(qū)域的振幅。
本發(fā)明的回聲處理裝置包括將混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;對(duì)應(yīng)發(fā)送輸入信號(hào)的背景噪音電平擾亂噪音頻譜的振幅的噪音振幅隨機(jī)化部;將噪音振幅隨機(jī)化部擾亂了振幅的噪音頻譜在振幅頻譜中混合的混合部;根據(jù)通過(guò)混合部混合了噪音頻譜的振幅頻譜和相位頻譜生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出發(fā)送輸出信號(hào)的頻率·時(shí)間變換部。
本發(fā)明的回聲處理裝置中,在要發(fā)送的發(fā)送輸入信號(hào)的背景噪音電平比規(guī)定值小的情況下,噪音振幅隨機(jī)化部擾亂噪音振幅頻譜中高頻區(qū)域的振幅,隨著背景噪音電平增大,噪音振幅隨機(jī)化部不僅擾亂高頻區(qū)域的振幅,還擾亂低頻區(qū)域的振幅。
本發(fā)明的回聲處理裝置中,在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值大的情況下,混合部向振幅頻譜中混合大比例的噪音頻譜,在回聲抑制量比規(guī)定值小的情況下,混合部向振幅頻譜中混合小比例的噪音頻譜。
本發(fā)明的回聲處理裝置中,在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值大的情況下,替代混合部向振幅頻譜中混合噪音頻譜,而用噪音頻譜置換振幅頻譜。
本發(fā)明的回聲處理裝置具有根據(jù)接收的接收輸入信號(hào)和通信路徑傳輸特性或麥克風(fēng)與揚(yáng)聲器之間的聲音傳輸特性、估計(jì)濾波器系數(shù)、生成虛擬回聲信號(hào)的自適應(yīng)濾波器;通過(guò)從混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)減去虛擬回聲信號(hào)來(lái)去除回聲信號(hào)的減法部,在自適應(yīng)濾波器的濾波器系數(shù)收斂之前的時(shí)間里,替代混合部向振幅頻譜混合比其他情況大的比例的噪音頻譜或向振幅頻譜混合噪音頻譜,而用噪音頻譜置換振幅頻譜。
本發(fā)明的回聲處理裝置中,混合部向要發(fā)送的發(fā)送輸入信號(hào)的振幅頻譜中低頻區(qū)域的振幅頻譜成分中混合大比例的噪音頻譜成分,隨著變?yōu)楦哳l區(qū)域,向振幅頻譜成分中混合小比例的噪音頻譜成分。
本發(fā)明的回聲處理裝置還包括隨機(jī)選擇部,噪音頻譜估計(jì)部算出多個(gè)估計(jì)噪音頻譜,隨機(jī)選擇部隨機(jī)選擇其中某一估計(jì)噪音頻譜,作為噪音頻譜輸出。
本發(fā)明的回聲處理裝置還包括隨機(jī)選擇部,噪音頻譜估計(jì)部使用慢的更新速度算出第一估計(jì)噪音頻譜,使用快的更新速度算出第二估計(jì)噪音頻譜,隨機(jī)選擇部隨機(jī)選擇其中某一估計(jì)噪音頻譜,作為噪音頻譜輸出。
本發(fā)明的回聲處理裝置還包括加權(quán)加法器,噪音頻譜估計(jì)部算出多個(gè)估計(jì)噪音頻譜,加權(quán)加法器將進(jìn)行這些多個(gè)估計(jì)噪音頻譜的加權(quán)相加得到的加權(quán)平均噪音頻譜作為噪音頻譜輸出。
本發(fā)明的回聲處理裝置還包括加權(quán)加法器,噪音頻譜估計(jì)部使用慢的更新速度算出第一估計(jì)噪音頻譜,使用快的更新速度算出第二估計(jì)噪音頻譜,加權(quán)加法器將進(jìn)行這些多個(gè)估計(jì)噪音頻譜的加權(quán)相加得到的加權(quán)平均噪音頻譜作為噪音頻譜輸出。
本發(fā)明的回聲處理裝置中,加權(quán)加法器對(duì)噪音頻譜的每個(gè)頻譜成分在一定范圍內(nèi)隨機(jī)設(shè)定加權(quán)加法器的加權(quán)相加中使用的加權(quán)系數(shù)。
附圖的簡(jiǎn)要說(shuō)明圖1是表示本發(fā)明的實(shí)施例1的回聲處理裝置的結(jié)構(gòu)的框圖;圖2是表示圖1所示的回聲處理裝置的混合部的細(xì)節(jié)的框圖;圖3是表示圖2所示的混合部的第一振幅調(diào)整部使用的第一頻率加權(quán)系數(shù)W1[f]與頻率的相關(guān)關(guān)系的圖;圖4是表示圖2所示的混合部的第二振幅調(diào)整部使用的第二頻率加權(quán)系數(shù)W2[f]與頻率的相關(guān)關(guān)系的圖;圖5是為說(shuō)明圖1所示的回聲處理裝置的平滑部使用的三角波形狀的窗口函數(shù)Wines[t]而參照的圖;圖6是表示圖1所示的回聲處理裝置的發(fā)送信號(hào)和接收信號(hào)的狀態(tài)與基于此生成的殘余回聲抑制量以及基于殘余回聲抑制量的該裝置的虛擬背景噪音生成部的動(dòng)作的定時(shí)圖;圖7是表示本發(fā)明的實(shí)施例2的回聲處理裝置的結(jié)構(gòu)的框圖8是表示本發(fā)明的實(shí)施例4的回聲處理裝置的結(jié)構(gòu)的框圖;圖9是表示本發(fā)明的實(shí)施例5的回聲處理裝置的結(jié)構(gòu)的框圖;圖10是表示本發(fā)明的實(shí)施例6的回聲處理裝置的結(jié)構(gòu)的框圖;圖11是表示本發(fā)明的實(shí)施例7的回聲處理裝置的結(jié)構(gòu)的框圖;圖12是表示已有的回聲處理裝置的結(jié)構(gòu)的框圖。
發(fā)明實(shí)施例下面說(shuō)明本發(fā)明的實(shí)施例。
實(shí)施例1圖1是表示本發(fā)明的實(shí)施例1的回聲處理裝置的結(jié)構(gòu)的框圖。圖1中,1是回聲消除部,2是自適應(yīng)濾波器,3是減法器(減算部),4是回聲抑制量計(jì)算部,5是時(shí)間·頻率變換部,6是聲音·噪音判定部,7是噪音頻譜估計(jì)部,8是噪音振幅隨機(jī)化部,9是混合部,10是相位隨機(jī)化部,11是頻率·時(shí)間變換部,12是平滑部,30是虛擬背景噪音生成部,40是麥克風(fēng),41是揚(yáng)聲器,42是發(fā)送電路,43是接收電路,44是分割部。如圖1所示,回聲處理裝置具有回聲消除部1、虛擬背景噪音生成部30、回聲抑制量計(jì)算部4、麥克風(fēng)40、揚(yáng)聲器41、發(fā)送電路42和接收電路43。
圖2是表示圖1所示的混合部9的內(nèi)部結(jié)構(gòu)的框圖,13是第一振幅調(diào)整部,14是第二振幅調(diào)整部,15是加法器,16是選擇部,17是標(biāo)準(zhǔn)化部。
接著說(shuō)明動(dòng)作。
麥克風(fēng)40根據(jù)包含近端說(shuō)話人聲音和背景噪音以及回聲的周?chē)曇舢a(chǎn)生發(fā)送輸入信號(hào)Sd[t],將其提供給回聲消除部1。
接收電路43接收遠(yuǎn)端說(shuō)話人聲音引起的遠(yuǎn)端說(shuō)話人聲音信號(hào)Rin,基于此生成接收輸入信號(hào)Rd[t]。接收輸入信號(hào)Rd[t]提供給揚(yáng)聲器41,基于此揚(yáng)聲器41發(fā)聲。接收輸入信號(hào)Rd[t]還提供給回聲消除部1和回聲抑制量計(jì)算部4。
回聲消除部1具有自適應(yīng)濾波器2、減法器3和分割部44。向回聲消除部1的減法器3提供發(fā)送輸入信號(hào)Sd[t]。減法器3從發(fā)送輸入信號(hào)Sd[t]減去虛擬回聲SE[t],生成部分消除回聲的回聲消除后發(fā)送輸入信號(hào)U[t]并將其輸出。
該回聲消除后發(fā)送輸入信號(hào)U[t]提供給自適應(yīng)濾波器2?;芈曄蟀l(fā)送輸入信號(hào)U[t]由分割部44分割為具有恒定長(zhǎng)度的幀長(zhǎng)(例如20ms)的幀,分割的幀提供給虛擬背景噪音生成部30和回聲抑制量計(jì)算部4。
如上所述,向自適應(yīng)濾波器2提供回聲消除后發(fā)送輸入信號(hào)U[t]和與遠(yuǎn)端說(shuō)話人聲音關(guān)于的接收輸入信號(hào)Rd[t]。自適應(yīng)濾波器2使用接收輸入信號(hào)Rd[t]和回聲消除后發(fā)送輸入信號(hào)U[t]估計(jì)揚(yáng)聲器41和麥克風(fēng)40之間的聲響回響特性或通信線路回響特性,逐一求出濾波器系數(shù)h[n],同時(shí)通過(guò)接收輸入信號(hào)Rd[t]和濾波器系數(shù)h[n]生成虛擬回聲SE[t]。其中,上述濾波器系數(shù)h[n]的估計(jì)不收斂的初始狀態(tài)下,自適應(yīng)濾波器2不生成虛擬回聲SE[t],接通濾波器初始狀態(tài)標(biāo)記EC_init,將其輸出到混合部9。初始狀態(tài)結(jié)束后,自適應(yīng)濾波器2斷開(kāi)濾波器初始狀態(tài)標(biāo)記EC_init。
回聲消除后發(fā)送輸入信號(hào)U[t]中混入回聲中未消除的成分(殘余回聲)?;芈曇种屏坑?jì)算部4求出作為幀分割的回聲消除后發(fā)送輸入信號(hào)U[t]和接收輸入信號(hào)Rd[t]的電平,將其與某閾值分別比較,計(jì)算出殘余回聲抑制量eg(dB)并將其輸出。但是,在初始狀態(tài)下,回聲抑制量計(jì)算部4不計(jì)算殘余回聲抑制量eg,而輸出比24dB大的殘余回聲抑制量eg。
殘余回聲抑制量eg是用于抑制回聲消除后發(fā)送輸入信號(hào)U[t]中的殘余回聲信號(hào)的振幅的信息,其越高,意味著排除殘余回聲的性能越高?;芈曇种屏坑?jì)算部4輸出的殘余回聲抑制量eg例如像表1所示根據(jù)情況(場(chǎng)合)不同。
表1
如表1的情況下,回聲消除后發(fā)送輸入信號(hào)U[t]和接收輸入信號(hào)Rd[t]二者的電平高(超出某閾值)時(shí),是近端說(shuō)話人和遠(yuǎn)端說(shuō)話人二者都說(shuō)話的前言不搭后語(yǔ)狀態(tài)。此時(shí)(情況1),近端說(shuō)話人的裝置的殘余回聲的存在對(duì)遠(yuǎn)端說(shuō)話人不怎么有影響,因此回聲抑制量計(jì)算部4不使殘余回聲抑制量eg為0,而確定為不怎么高的6dB。
另一當(dāng)面,像情況2那樣,回聲消除后發(fā)送輸入信號(hào)U[t]增高而接收輸入信號(hào)Rd[t]降低時(shí),是僅近端說(shuō)話人說(shuō)話的狀態(tài)。此時(shí),殘余回聲的存在幾乎不對(duì)遠(yuǎn)端說(shuō)話人產(chǎn)生影響,因此回聲抑制量計(jì)算部4將殘余回聲抑制量eg確定為0dB。
像情況4那樣,回聲消除后發(fā)送輸入信號(hào)U[t]和接收輸入信號(hào)Rd[t]都低時(shí),是近端說(shuō)話人和遠(yuǎn)端說(shuō)話人都不說(shuō)話的狀態(tài)。此時(shí),殘余回聲的存在不對(duì)會(huì)話造成障礙,因此回聲抑制量計(jì)算部4將殘余回聲抑制量eg確定為0dB。
但是,如表1的情況3那樣,在回聲消除后發(fā)送輸入信號(hào)U[t]低而接收輸入信號(hào)Rd[t]高時(shí),是僅遠(yuǎn)端說(shuō)話人說(shuō)話的狀態(tài),麥克風(fēng)40檢測(cè)到遠(yuǎn)端說(shuō)話人說(shuō)話聲音的回聲,進(jìn)入遠(yuǎn)端說(shuō)話人的耳朵中的可能性高。這種情況下,回聲抑制量計(jì)算部4對(duì)應(yīng)背景噪音的電平在大于12dB小于24dB的范圍內(nèi)決定殘余回聲抑制量eg。即,背景噪音的電平高時(shí)(SN比低),減小殘余回聲抑制量eg,隨著背景噪音的電平降低,增大殘余回聲抑制量eg的值。這是由于隨著背景噪音的電平降低,發(fā)送輸入信號(hào)中的殘余回聲更顯著而需要增大振幅抑制量。相反,背景噪音的電平高時(shí),殘余回聲由背景噪音遮住而變得不明顯,因此不需要增大抑制量。
上述的背景噪音電平的計(jì)算可僅用回聲抑制量計(jì)算部4執(zhí)行。例如,回聲抑制量計(jì)算部4接收回聲消除后發(fā)送輸入信號(hào)U[t]的各幀,并且計(jì)測(cè)其功率,保存當(dāng)前幀以前的過(guò)去50幀的功率計(jì)測(cè)結(jié)果。并且,將過(guò)去的幀中的最低的功率電平作為背景噪音電平。
分割為幀的回聲消除后發(fā)送輸入信號(hào)U[t]也提供給虛擬背景噪音生成部30的時(shí)間·頻率變換部5。時(shí)間·頻率變換部5對(duì)回聲消除后發(fā)送輸入信號(hào)U[t]的各幀進(jìn)行例如256點(diǎn)的FFT(快速傅立葉變換)處理,將回聲消除后發(fā)送輸入信號(hào)U[t]變換為振幅頻譜S[f]和相位頻譜P[f]。振幅頻譜S[f]提供給聲音·噪音判定部6和混合部9,另一方面,相位頻譜P[f]提供給相位隨機(jī)化部10。
聲音·噪音判定部6根據(jù)振幅頻譜S[f]和相位頻譜P[f]判定當(dāng)前幀的回聲消除后發(fā)送輸入信號(hào)U[t]是由有聲(有近端說(shuō)話人的聲音)引起還是幾乎都由背景噪音引起。生成表示該判定結(jié)果的聲音·噪音判定信息VAD,將其提供給噪音頻譜估計(jì)部7。作為該聲音·噪音判定部6的最佳實(shí)施例,例如可舉出在特開(kāi)2000-347688號(hào)公報(bào)(噪音抑制裝置)中公開(kāi)的噪音度判定裝置的噪音度電平(LEVELnoise)如表2所示可與聲音·噪音判定信息VAD對(duì)應(yīng)。
下面說(shuō)明該聲音·噪音判定部6(噪音度判定裝置)的動(dòng)作。上述公報(bào)中提供的低通剩余信號(hào)的自相關(guān)函數(shù)最大值RACmax和低通剩余功率POWres以及幀功率POWfr使用與各個(gè)系數(shù)對(duì)應(yīng)的規(guī)定閾值TH_RACmax.h、TH-RACmax.1、TH_POWres、TH_POWfr如下求出LEVELnoise成分L1、L2、L3。
首先成分L1對(duì)應(yīng)自相關(guān)函數(shù)最大值RACmax的值如下求出。RACmax>TH_RACmax.h時(shí),L1為2。TH_RACmax.h≥RACmax>TH-RACmax.1時(shí),L1為1。TH-RACmax.1≥RACmax時(shí),L1為0。
成分L2對(duì)應(yīng)低通剩余功率POWres的值如下求出。POWres>TH_POWres時(shí),L2為1。此外的情況下,L2為0。
成分L3對(duì)應(yīng)幀功率POWfr的值如下求出。POWfr>TH_POWfr時(shí),L3為1。此外的情況下,L3為0。
LEVELnoise是這些成分L1、L2、L3的總和。即,LEVELnoise=L1+L2+L3。這3個(gè)系數(shù)的計(jì)算方法參考上述公報(bào),說(shuō)明從略。
表2
聲音·噪音判定部6根據(jù)表2對(duì)應(yīng)LEVELnoise輸出聲音·噪音判定信息VAD。向噪音頻譜估計(jì)部7提供聲音·噪音判定部6輸出的聲音·噪音判定信息VAD時(shí),提供振幅頻譜S[f]。聲音·噪音判定信息VAD為0(幾乎是噪音)時(shí),噪音頻譜估計(jì)部7根據(jù)式(6)估計(jì)作為存在于輸入信號(hào)中的背景噪音的平均頻譜的噪音頻譜N[f]。
N[f]=(1-C)·S[f]+C·Nold[f] ……(6)這里,Nold[f]是從過(guò)去判定為噪音的幀估計(jì)的噪音頻譜的平均,存儲(chǔ)在噪音頻譜估計(jì)部7的內(nèi)部存儲(chǔ)器中。C是適當(dāng)確定的常數(shù)(例如0.9),是決定噪音頻譜N[f]的更新速度的系數(shù)。
另一方面,聲音·噪音判定信息VAD為1(有聲)的情況下,噪音頻譜估計(jì)部7根據(jù)式(7)估計(jì)作為存在于輸入信號(hào)中的背景噪音的平均頻譜的噪音頻譜N[f]。即,將過(guò)去的噪音頻譜Nold[f]原樣視為當(dāng)前的噪音頻譜N[f]。
N[f]=Nold[f]……(7)并且,噪音頻譜估計(jì)部7如式(8)所示將存儲(chǔ)在內(nèi)部存儲(chǔ)器上的過(guò)去的噪音頻譜Nold[f]的內(nèi)容置換(更新)為估計(jì)的當(dāng)前幀的噪音頻譜N[f]。
Nold[f]=N[f] ……(8)這樣得到的噪音頻譜N[f]提供給聲音·噪音判定部6和噪音振幅隨機(jī)化部8。
聲音·噪音判定部6如式(8)所示將存儲(chǔ)在內(nèi)部存儲(chǔ)器上的過(guò)去的噪音頻譜Nold[f]的內(nèi)容置換(更新)為估計(jì)的當(dāng)前幀的噪音頻譜N[f]。
噪音振幅隨機(jī)化部8對(duì)虛擬背景噪音添加了與時(shí)間有關(guān)的隨機(jī)性,因此根據(jù)式(9)向噪音頻譜估計(jì)部7輸出的噪音頻譜N[f]的各頻譜成分上乘以規(guī)定小振幅的隨機(jī)增益rand[f],對(duì)應(yīng)各幀得到形狀稍有不同的振幅擾亂了的噪音頻譜Nr[f],將其提供給混合部9。
Nr[f]=rand[f]·N[f]……(9)該計(jì)算針對(duì)噪音頻譜N[f]的各頻譜成分進(jìn)行。即,向從頻率0到fc的各頻譜成分乘以隨機(jī)增益。fc是該回聲處理裝置處理的奈奎斯特頻率。
向混合部9提供時(shí)間·頻率變換部5輸出的振幅頻譜S[f]、噪音振幅隨機(jī)化部8輸出的振幅擾亂了的噪音頻譜Nr[f]、殘余回聲抑制量eg和濾波器初始狀態(tài)標(biāo)記EC_init。混合部9如后述那樣進(jìn)行各種處理,同時(shí)將基于殘余回聲抑制量eg和濾波器初始狀態(tài)標(biāo)記EC_init的振幅頻譜SNo[f]提供給·頻率時(shí)間變換部11。以后使用圖2詳細(xì)說(shuō)明混合部9的動(dòng)作。
圖2的第一振幅調(diào)整部13中提供時(shí)間·頻率變換部5輸出的振幅頻譜S[f]、回聲抑制量計(jì)算部4輸出的殘余回聲抑制量eg,基于此,第一振幅調(diào)整部13進(jìn)行振幅頻譜S[f]的頻譜成分的振幅調(diào)整,尤其是殘余回聲的振幅抑制。
具體說(shuō),第一振幅調(diào)整部13首先根據(jù)式(10)對(duì)殘余回聲抑制量eg使用第一頻率加權(quán)系數(shù)W1[f](dB),進(jìn)行對(duì)應(yīng)頻率的加權(quán),計(jì)算出第一殘余回聲抑制量g1[f]。關(guān)于第一頻率加權(quán)系數(shù)W1[f]后面說(shuō)明。
g1[f]=eg+W1[f](dB)…………(10)接著,第一振幅調(diào)整部13使用式(10)得到的第一殘余回聲抑制量g1[f]根據(jù)式(11)進(jìn)行振幅頻譜S[f]的振幅調(diào)整,輸出振幅調(diào)整了的振幅頻譜Ss[f]。
Ss[f]=10g1[f]/20·S[f]…………(11)這些計(jì)算針對(duì)振幅頻譜S[f]的各頻譜成分進(jìn)行。即,向從頻率0到fc的各頻譜成分采用式(10)和式(11)。
頻率與第一頻率加權(quán)系數(shù)W1[f]的相關(guān)關(guān)系示于圖3。如圖3所示,振幅頻譜S[f]在低頻區(qū)域加權(quán)大(增強(qiáng)振幅抑制),在高頻區(qū)域加權(quán)小(減弱振幅抑制)。殘余回聲信號(hào)的成分主要是聲音信號(hào),低頻區(qū)域中殘余回聲信號(hào)的功率偏移,因此低頻區(qū)域中增大振幅抑制,高頻區(qū)域中減小振幅抑制可不增加高頻區(qū)域的抑制感,而有效地抑制殘余回聲信號(hào)的振幅。
返回圖2,向混合部9的第二振幅調(diào)整部14提供噪音振幅隨機(jī)化部8輸出的振幅擾亂了的噪音頻譜Nr[f]和回聲抑制量計(jì)算部4輸出的殘余回聲抑制量eg,基于此,第二振幅調(diào)整部14進(jìn)行振幅擾亂了的噪音頻譜Nr[f]的頻譜成分的振幅調(diào)整。
具體說(shuō),第二振幅調(diào)整部14首先根據(jù)式(12)對(duì)殘余回聲抑制量eg使用第二頻率加權(quán)系數(shù)W2[f](dB),進(jìn)行對(duì)應(yīng)頻率的加權(quán),計(jì)算出第二殘余回聲抑制量g2[f]。關(guān)于第二頻率加權(quán)系數(shù)W2[f]后面說(shuō)明。
g2[f]=eg+W2[f](dB) …………(12)接著,第二振幅調(diào)整部14使用式(12)得到的第二殘余回聲抑制量g2[f],根據(jù)式(13)進(jìn)行振幅擾亂了的噪音頻譜Nr[f]的振幅調(diào)整,輸出振幅調(diào)整了的噪音頻譜Ns[f]。
Ns[f]=10g2[f]/20·Nr[f]…………(13)第一振幅調(diào)整部13輸出的振幅頻率Ss[f]和第二振幅調(diào)整部14輸出的振幅調(diào)整了的噪音頻譜Ns[f]提供給加法器15。加法器15根據(jù)式(14)進(jìn)行振幅調(diào)整了的振幅頻率Ss[f]和振幅調(diào)整了的噪音頻譜Ns[f]的相加,輸出混合了噪音的振幅頻譜SN[f]。
SN[f]=Ss[f]+Ns[f]………(14)頻率與第二頻率加權(quán)系數(shù)W2[f]的相關(guān)關(guān)系示于圖4。如圖4所示,噪音頻譜Ns[f]在低頻區(qū)域加權(quán)小(減弱噪音頻譜的振幅抑制強(qiáng)度),在高頻區(qū)域加權(quán)大(增強(qiáng)噪音頻譜的振幅抑制強(qiáng)度),增大低頻區(qū)域的虛擬背景噪音的混入量,減小高頻區(qū)域中虛擬背景噪音的混入量。因此,由虛擬背景噪音大大地遮住了低頻區(qū)域中很多的殘余回聲成分,可減輕殘余回聲感。
圖2所示的混合部9的選擇部16中提供殘余回聲抑制量eg的電平和濾波器初始狀態(tài)標(biāo)記EC_init。根據(jù)這些條件,選擇部16如表3所示從根據(jù)情況的端子輸出根據(jù)情況的振幅頻譜SNo[f]。
表3
圖2的選擇部16具有3個(gè)端子16A、16B、16C,對(duì)應(yīng)上述條件從端子16A、16B、16C中選擇輸出信號(hào)的端子,向選擇的端子連接于開(kāi)關(guān)16D。
具體說(shuō),如表3所示,選擇端子16A時(shí),是發(fā)送輸入信號(hào)Sd[t]中沒(méi)有近端說(shuō)話人聲音僅有回聲的狀況(與上述的表1的情況3相當(dāng)),將混合了背景噪音的振幅頻譜SN[f]作為振幅頻譜SNo[f]由選擇部16輸出。
選擇端子16B的情況是濾波器初始狀態(tài)標(biāo)記EC_init接通的狀況,即初始狀態(tài)的情況,自適應(yīng)濾波器2的濾波器系數(shù)h[n]不收斂,因此不輸出混合了振幅調(diào)整了的噪音頻譜Ns[f]的振幅頻譜SN[f],選擇部16將振幅擾亂了的噪音頻譜Nr[f]作為振幅頻譜SNo[f]輸出。該處理相當(dāng)于用振幅擾亂了的噪音頻譜Nr[f]置換振幅頻譜SN[f]。
選擇端子16C的情況是殘余回聲抑制量eg為規(guī)定值(6dB)的狀況。根據(jù)表1,這是發(fā)送輸入信號(hào)Sd[t]中有近端說(shuō)話人聲音,并且接收輸入信號(hào)Rd[t]中有遠(yuǎn)端說(shuō)話人聲音的狀態(tài)(表1的情況1,即前言不搭后語(yǔ)的話(doubletalk)狀態(tài))。此時(shí),選擇部16不進(jìn)行噪音混入,將通過(guò)第一振幅調(diào)整部13的振幅調(diào)整抑制殘余回聲的振幅的振幅頻譜Ss[f]作為振幅頻譜SNo[f]輸出。
其中殘余回聲抑制量eg為0dB的情況下,選擇部16不選擇端子16A、16B、16C中的某一個(gè),不輸出振幅頻譜SNo[f]。這是發(fā)送輸入信號(hào)Sd[t]中有近端說(shuō)話人聲音,而且接收輸入信號(hào)Rd[t]中沒(méi)有遠(yuǎn)端說(shuō)話人聲音的狀態(tài)(表1的情況2)或二者都沒(méi)有聲音的狀況(表1的情況4,即無(wú)輸入狀態(tài))。
標(biāo)準(zhǔn)化部17提供輸入混合部9的原來(lái)的振幅頻譜S[f],選擇部16輸出振幅頻譜SNo[f]時(shí),振幅頻譜SNo[f]也提供給標(biāo)準(zhǔn)化部17。選擇部16不輸出振幅頻譜SNo[f]時(shí)(殘余回聲抑制量eg為0dB的情況下),標(biāo)準(zhǔn)化部17將輸入混合部9的原來(lái)的振幅頻譜S[f]原樣作為振幅頻譜SNo[f]輸出。
另一方面,選擇部16輸出振幅頻譜SNo[f]時(shí),標(biāo)準(zhǔn)化部17進(jìn)行標(biāo)準(zhǔn)化,使應(yīng)從混合部9輸出的振幅頻譜SNo[f]的功率與輸入混合部9的原來(lái)的振幅頻譜S[f]的功率相同。
如上所述,混合部9在發(fā)送輸入信號(hào)Sd[t]中沒(méi)有近端說(shuō)話人聲音僅有回聲的情況下,輸出混合了背景噪音的振幅頻譜。另一方面,在初始狀態(tài)下,輸出振幅擾亂了的噪音頻譜。在前言不搭后語(yǔ)的話(doubletalk)狀態(tài)下,輸出未混入背景噪音的振幅調(diào)整了的振幅頻譜。另外,在僅有近端說(shuō)話人說(shuō)話的狀態(tài)或無(wú)輸入狀態(tài)下,輸出沒(méi)有混入背景噪音并且也沒(méi)有進(jìn)行振幅調(diào)整的振幅頻譜。
返回圖1,相位隨機(jī)化部10中提供時(shí)間·頻率變換部5輸出的相位頻譜P[f]、回聲抑制量計(jì)算部4輸出的殘余回聲抑制量eg。相位隨機(jī)化部10根據(jù)式(15)到式(17)之一對(duì)應(yīng)殘余回聲抑制量eg大小進(jìn)行各幀的相位頻譜P[f]的相位擾亂,輸出相位擾亂了的相位頻譜Pr[f]。
其中,殘余回聲抑制量eg在規(guī)定值(12dB)以下時(shí),即,在前言不搭后語(yǔ)的話(doubletalk)時(shí)或無(wú)輸入狀態(tài)或者僅有近端說(shuō)話人聲音的情況下(與表1的情況1,2,4相當(dāng)),不進(jìn)行相位擾亂。即,Pr[f]=P[f]。這是由于在無(wú)聲音輸入狀態(tài)下沒(méi)有擾亂相位的意思,因?yàn)樵谥辽儆薪苏f(shuō)話人聲音的情況下,擾亂相位會(huì)帶來(lái)使遠(yuǎn)端說(shuō)話人產(chǎn)生不和諧感的結(jié)果。
結(jié)果,相位隨機(jī)化部10擾亂相位是在表1未示出的初始狀態(tài)的情況下或表1的情況3的情況下,即無(wú)近端說(shuō)話人聲音而有遠(yuǎn)端說(shuō)話人的聲音的情況下。相位隨機(jī)化部10對(duì)應(yīng)殘余回聲抑制量eg大小根據(jù)式(15)到式(17)之一求出相位擾亂了的相位頻譜Pr[f]。如上所述,在初始狀態(tài)下,殘余回聲抑制量eg大于24dB。此時(shí),采用式(15)。
Pr[f]=P[f]·sin(π/4*RND(x))…………(15)這里,RND(x)是產(chǎn)生-1.0≤RND(x)<1.0的范圍內(nèi)的相同隨機(jī)數(shù)的函數(shù)。該計(jì)算針對(duì)相位頻譜P[f]的各個(gè)頻譜成分進(jìn)行。具體說(shuō),從頻率fc/2到fc的各個(gè)頻譜成分中采用式(15)。fc是該回聲處理裝置處理的奈奎斯特頻率。
情況3中,來(lái)自回聲抑制量計(jì)算部4的殘余回聲抑制量eg大于12dB小于24dB。在18db<eg≤24dB的情況下,采用式(16)。
Pr[f]=P[f]·sin(π/8*RND(x))…………(16)該計(jì)算針對(duì)相位頻譜P[f]的fc/4到fc各個(gè)頻譜成分進(jìn)行。
另一方面,在12db<eg≤18dB的情況下,采用式(17)。
Pr[f]=P[f]·sin(π/16*RND(x))…………(17)該計(jì)算針對(duì)相位頻譜P[f]的fc/8到fc各個(gè)頻譜成分進(jìn)行。
分別使用式(15)到(17)的閾值不限于24,28,12dB,根據(jù)回聲處理裝置的使用環(huán)境和其他條件可設(shè)定為任意值。
從與表1相關(guān)的上述說(shuō)明可知,殘余回聲抑制量eg大就是說(shuō)應(yīng)抑制的回聲的電平相對(duì)背景噪音大,其結(jié)果是相位頻譜P[f]的成分中占了大部分的回聲信號(hào)。相反,殘余回聲抑制量eg小,則相位頻譜P[f]的成分中背景噪音占了大部分。相位頻譜中混入大量殘余回聲信號(hào)成分損壞虛擬背景噪音的自然性,因此根據(jù)式(15)到(17)對(duì)應(yīng)殘余回聲抑制量eg大小進(jìn)行相位頻譜的相位擾亂,進(jìn)行虛擬背景噪音的隨機(jī)化調(diào)整。其結(jié)果是殘余回聲抑制量eg大時(shí),使虛擬背景噪音的相位頻譜中混入的殘余回聲成分白色化,從而聽(tīng)覺(jué)上減輕殘余回聲。
另一方面殘余回聲抑制量eg小時(shí),相位隨機(jī)化部10不進(jìn)行相位頻譜P[f]的相位擾亂而維持發(fā)送輸入信號(hào)的相位,從而保持虛擬背景噪音的自然性。
如上所述,針對(duì)發(fā)送輸入信號(hào)的振幅頻譜S[f],估計(jì)噪音頻譜N[f],向振幅頻譜S[f]中混入噪音頻譜N[f],但對(duì)相位頻譜P[f]不進(jìn)行噪音混合處理,而原樣輸出。因此,發(fā)送輸入信號(hào)的相位頻譜維持,可生成自然性高的虛擬背景噪音。
頻率·時(shí)間變換部11中提供混合部9輸出的(根據(jù)情況混入虛擬背景噪音)的振幅頻譜SNo[f]和相位隨機(jī)化部10輸出的相位擾亂了的相位頻譜Pr[f]。并且,頻率·時(shí)間變換部11將其從頻率區(qū)域的表現(xiàn)形式的頻譜變換為時(shí)間區(qū)域的表現(xiàn)形式的發(fā)送輸出信號(hào)So[t],并將其輸出。
平滑部12為減輕頻率·時(shí)間變換部11輸出的發(fā)送輸出信號(hào)So[t]的幀之間的不連續(xù)感,使用式(18)和圖5所示的三角波形狀的窗口函數(shù)Wines[t]進(jìn)行發(fā)送輸出信號(hào)So[t]的幀之間的平滑,輸出結(jié)果得到的輸出信號(hào)Sout[t]。
Sout[t]=Wines[t]·Soold[t]+Wines[N-t]·So[t]……………(18)這里,Soold[t]是之前的幀的發(fā)送輸出信號(hào)So[t],N是與幀長(zhǎng)相當(dāng)?shù)牟蓸訒r(shí)間t的最大值。即,采樣時(shí)間從0到N。
圖6是表示要從近端發(fā)送的發(fā)送信號(hào)和從遠(yuǎn)端接收的接收信號(hào)的狀態(tài)以及虛擬背景噪音生成部30相對(duì)殘余回聲抑制量eg的變化的定時(shí)圖。從圖6容易理解與上述動(dòng)作相關(guān)的說(shuō)明。發(fā)送信號(hào)中僅有回聲的情況下,進(jìn)行振幅抑制和噪音混合處理,發(fā)送信號(hào)中包含近端說(shuō)話人聲音和回聲的情況下(前言不搭后語(yǔ)的話(doubletalk)時(shí))僅進(jìn)行振幅抑制。濾波器初始狀態(tài)(濾波器初始狀態(tài)標(biāo)記EC_init為接通時(shí))下,進(jìn)行噪音置換處理。
該實(shí)施例中,僅在濾波器初始狀態(tài)標(biāo)記EC_init為接通時(shí)如表3所示選擇端子16B,從選擇部16輸出的振幅頻譜SNo[f]為Nr[f],即成為振幅擾亂了但振幅未調(diào)整的噪音頻譜Nr[f],其他情況下,也可選擇端子16B。例如,殘余回聲抑制量eg大于規(guī)定值(例如20dB)時(shí),選擇端子16B進(jìn)行噪音置換處理。如上所述,殘余回聲抑制量eg大時(shí),由于背景噪音電平低,發(fā)送輸入信號(hào)中殘余回聲明顯,因此希望增大振幅抑制量。殘余回聲抑制量eg大時(shí),即使有遠(yuǎn)端說(shuō)話人的聲音沒(méi)有近端說(shuō)話人的聲音,也不會(huì)對(duì)會(huì)話造成障礙。
可排除端子16B,替代未作振幅調(diào)整的噪音頻譜Nr[f]而從選擇部16輸出振幅調(diào)整了的噪音頻譜Ns[f]。具體說(shuō),在濾波器初始狀態(tài)標(biāo)記EC_init為接通時(shí)(即初始狀態(tài)下)或殘余回聲抑制量eg大于規(guī)定值(例如20dB)時(shí),從式(12)計(jì)算的第二殘余回聲抑制量g2減去某值(近一步減弱噪音頻譜的振幅抑制),再增加噪音頻譜的混合比例,可更大地混合虛擬背景噪音。
本實(shí)施例的回聲處理裝置包含回聲消除部1,但可構(gòu)成為沒(méi)有回聲消除部1,將發(fā)送輸入信號(hào)sd[t]直接輸入時(shí)間·頻率變換部5中。此時(shí),關(guān)于濾波器初始狀態(tài)標(biāo)記EC_init的處理不由選擇部16進(jìn)行。
如上所述,根據(jù)本實(shí)施例1,對(duì)于發(fā)送輸入信號(hào)的振幅頻譜S[f],估計(jì)噪音頻譜N[f],向振幅頻譜S[f]中混合噪音頻譜N[f],但對(duì)于相位頻譜P[f]不進(jìn)行噪音混合處理而原樣輸出。因此,發(fā)送輸入信號(hào)的相位頻譜維持,可生成自然性高的虛擬背景噪音,得到可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
聲音·噪音判定部6進(jìn)行發(fā)送輸入信號(hào)的聲音·噪音判定,噪音頻譜估計(jì)部7從判斷為噪音的幀估計(jì)噪音頻譜,通過(guò)噪音振幅隨機(jī)化部8進(jìn)行平均化,可生成與時(shí)間·頻率相關(guān)地穩(wěn)定的噪音頻譜。因此,可根據(jù)情況生成適當(dāng)?shù)淖匀恍愿叩奶摂M背景噪音,可提供聽(tīng)覺(jué)上良好的回聲處理裝置。
另外,隨著殘余回聲抑制量eg增大,發(fā)送輸入信號(hào)的相位頻譜的隨機(jī)化程度增大,而且由于相位擾亂的頻率區(qū)域涉及到低頻區(qū)域,發(fā)送輸出信號(hào)So[t]接近白色噪音。其結(jié)果是發(fā)送輸入信號(hào)中殘余的回聲信號(hào)被隨機(jī)化接近背景噪音,從而聽(tīng)覺(jué)上的效果是難以聽(tīng)見(jiàn)回聲。另一方面,殘余回聲抑制量eg小時(shí),不進(jìn)行相位頻譜的相位擾亂,維持發(fā)送輸入信號(hào)的相位,可保持虛擬背景噪音的自然性。
殘余回聲抑制量eg大于規(guī)定的閾值時(shí),替代大量混合噪音頻譜或混入噪音頻譜而將振幅頻譜用噪音頻譜置換,因此回聲消除量不充分的情況下也可消除殘余回聲成分并插入虛擬背景噪音,從而可提供聽(tīng)覺(jué)上良好的回聲處理裝置。
在自適應(yīng)濾波器系數(shù)收斂之前的時(shí)間里,自適應(yīng)濾波器強(qiáng)制地進(jìn)行噪音置換處理為輸出濾波器初始狀態(tài)標(biāo)記EC_init,虛擬背景噪音生成部30進(jìn)行噪音頻譜置換處理,因此替代自適應(yīng)濾波器2,或除此之外消除殘余回聲并插入虛擬背景噪音,從而可提供聽(tīng)覺(jué)上良好的回聲處理裝置。
將向混合部9的發(fā)送輸入信號(hào)的振幅頻譜中混合噪音頻譜的比例調(diào)整為在殘余回聲抑制量eg大時(shí)也增大,在殘余回聲抑制量eg小時(shí)也減小,因此可混入對(duì)應(yīng)殘余回聲電平和發(fā)送·接收輸入信號(hào)的狀態(tài)的虛擬背景噪音,從而可提供聽(tīng)覺(jué)上良好的回聲處理裝置。
由于增大低頻區(qū)域的虛擬背景噪音的混入量并減小低頻區(qū)域的虛擬背景噪音的混入量,從而不增加高頻區(qū)域的噪音感,可有效抑制低頻區(qū)域中功率偏移的殘余回聲信號(hào),可提供聽(tīng)覺(jué)上良好的回聲處理裝置。
實(shí)施例2
上述實(shí)施例1中,由相位隨機(jī)化部10隨機(jī)化發(fā)送輸入信號(hào)的相位頻譜。但是,替代其,像下面說(shuō)明的本發(fā)明的實(shí)施例2一樣,進(jìn)行發(fā)送輸入信號(hào)的振幅頻譜的振幅隨機(jī)化也可實(shí)現(xiàn)同樣效果。
圖7是表示本發(fā)明的實(shí)施例2的回聲處理裝置的結(jié)構(gòu)的框圖。圖中,18表示振幅隨機(jī)化部。與圖1的結(jié)構(gòu)不同的是在該回聲處理裝置中沒(méi)有相位隨機(jī)化部10而設(shè)置振幅隨機(jī)化部18。其他結(jié)構(gòu)與圖1相同,不作詳細(xì)說(shuō)明。
接著說(shuō)明動(dòng)作。
與實(shí)施例1不同,時(shí)間·頻率變換部5輸出的振幅頻譜S[f]并非直接提供給混合部9,而提供給振幅隨機(jī)化部18。向振幅隨機(jī)化部18提供回聲抑制量計(jì)算部4輸出的殘余回聲抑制量eg。振幅隨機(jī)化部18根據(jù)式(19)到式(21)之一對(duì)應(yīng)殘余回聲抑制量eg大小向各幀的振幅頻譜S[f]的振幅成分施加擾亂,輸出振幅擾亂了的振幅頻譜Sr[f]。
但是,在殘余回聲抑制量eg在規(guī)定值(12dB)以下時(shí),即,在前言不搭后語(yǔ)的話(doubletalk)時(shí)或無(wú)輸入狀態(tài)或者僅有近端說(shuō)話人聲音的情況下(與表1的情況1,2,4相當(dāng)),不進(jìn)行振幅擾亂。即,Sr[f]=S[f]。這是由于在無(wú)聲音輸入狀態(tài)下沒(méi)有擾亂振幅的意思,因?yàn)樵谥辽儆薪苏f(shuō)話人聲音的情況下,擾亂振幅會(huì)帶來(lái)使遠(yuǎn)端說(shuō)話人產(chǎn)生不和諧感的結(jié)果。
結(jié)果,振幅隨機(jī)化部18擾亂振幅是在表1未示出的初始狀態(tài)的情況下或表1的情況3的情況下,即無(wú)近端說(shuō)話人聲音而有遠(yuǎn)端說(shuō)話人的聲音的情況下。振幅隨機(jī)化部18對(duì)應(yīng)殘余回聲抑制量eg大小根據(jù)式(19)到式(21)之一求出振幅擾亂了的振幅頻譜Sr[f]。如上所述,在初始狀態(tài)下,殘余回聲抑制量eg大于24dB。此時(shí),采用式(19)。
Sr[f]=S[f]·gr1[f]=S[f]·(1.0+0.25·RND(x))…………(19)這里,gr1[f]是隨機(jī)增益,RND(x)是產(chǎn)生-1.0≤RND(x)<1.0的范圍內(nèi)的相同隨機(jī)數(shù)的函數(shù)。該計(jì)算針對(duì)振幅頻譜S[f]的各個(gè)頻譜成分進(jìn)行。具體說(shuō),從頻率fc/2到fc的各個(gè)頻譜成分中采用式(19)。fc是該回聲處理裝置處理的奈奎斯特頻率。
表1的情況3中,來(lái)自回聲抑制量計(jì)算部4的殘余回聲抑制量eg大于12dB小于24dB。在18db<eg≤24dB的情況下,采用式(20)。
Sr[f]=S[f]·gr2[f]=S[f]·(1.0+0.125·RND(x)) …………(20)該計(jì)算針對(duì)振幅頻譜S[f]的fc·(3/4)到fc各個(gè)頻譜成分進(jìn)行。
另一方面,在12db<eg≤18dB的情況下,采用式(21)。
Sr[f]=S[f]·gr3[f]=S[f]·(1.0+0.0625·RND(x)) ………….(21)該計(jì)算針對(duì)振幅頻譜S[f]的fc·(7/8)到fc各個(gè)頻譜成分進(jìn)行。
從式(19)到(21)可知,殘余回聲抑制量eg小于18dB時(shí),僅隨機(jī)化高頻區(qū)域的頻譜成分,其隨機(jī)化程度小。另一方面,殘余回聲抑制量eg大于18dB時(shí),隨機(jī)化程度大,隨機(jī)化到低頻區(qū)域的頻率范圍。
分別使用式(19)到(21)的閾值不限于24,28,12dB,根據(jù)回聲處理裝置的使用環(huán)境和其他條件可設(shè)定為任意值。
從與表1相關(guān)的上述說(shuō)明可知,殘余回聲抑制量eg大就是說(shuō)應(yīng)抑制的回聲的電平相對(duì)背景噪音大,其結(jié)果是振幅頻譜S[f]的成分中占了大部分的回聲信號(hào)成分。相反,殘余回聲抑制量eg小,則振幅頻譜S[f]的成分中背景噪音占了大部分。振幅頻譜中混入大量殘余回聲信號(hào)成分損壞虛擬背景噪音的自然性,因此根據(jù)式(19)到(21)對(duì)應(yīng)殘余回聲抑制量eg大小進(jìn)行振幅頻譜的振幅擾亂,進(jìn)行虛擬背景噪音的隨機(jī)化調(diào)整。其結(jié)果是殘余回聲抑制量eg大時(shí),使虛擬背景噪音的振幅頻譜中混入的殘余回聲成分白色化,從而聽(tīng)覺(jué)上減輕殘余回聲。
另一方面殘余回聲抑制量eg小時(shí),振幅隨機(jī)化部18不進(jìn)行振幅頻譜S[f]的振幅擾亂而維持發(fā)送輸入信號(hào)的振幅,從而保持虛擬背景噪音的自然性。
向混合部9提供這樣進(jìn)行振幅擾亂了的振幅頻譜S[f]。混合部9中提供從噪音振幅相結(jié)合部8輸出的噪音頻譜Nr[f]和從自適應(yīng)濾波器2輸出的濾波器初始狀態(tài)標(biāo)記EC_init以及從回聲抑制量計(jì)算部4輸出的殘余回聲抑制量eg?;旌喜?的結(jié)構(gòu)和功能與實(shí)施例1的混合部9的結(jié)構(gòu)和功能實(shí)質(zhì)相同。換句話說(shuō),關(guān)于實(shí)施例1的混合部9的說(shuō)明中,將振幅頻譜S[f]替換為振幅擾亂了的振幅頻譜Sr[f],則可理解實(shí)施例2的混合部9的結(jié)構(gòu)和功能。
因此,在混合部9中,發(fā)送輸入信號(hào)Sd[t]中沒(méi)有近端說(shuō)話人聲音僅有回聲的情況下,選擇部16選擇端子16A(參考圖2),將混合了背景噪音的振幅頻譜SN[f]作為振幅頻譜SNo[f]輸出。另一方面,在初始狀態(tài)下,選擇部16選擇端子16B,將振幅擾亂了的噪音頻譜Nr[f]作為振幅頻譜SNo[f]輸出。在前言不搭后語(yǔ)的話(doubletalk)狀態(tài)下,選擇部16選擇端子16C,將未混入背景噪音的振幅調(diào)整了的振幅頻譜Ss[f]作為振幅頻譜SNo[f]輸出。另外,在僅有近端說(shuō)話人說(shuō)話的狀態(tài)或無(wú)輸入狀態(tài)下,將沒(méi)有混入背景噪音并且也沒(méi)有進(jìn)行振幅調(diào)整的振幅擾亂了的振幅頻譜Sr[f]作為振幅頻譜SNo[f]輸出。
這樣從混合部9根據(jù)情況向頻率·時(shí)間變換部11提供混合了噪音的振幅頻譜SNo[f]。與實(shí)施例1不同,本實(shí)施例2中,不設(shè)置相位隨機(jī)化部10(參考圖1)而將時(shí)間·頻率變換部5輸出的相位頻譜P[f]原樣提供給頻率·時(shí)間變換部11。并且,頻率·時(shí)間變換部11將其從頻率區(qū)域的表現(xiàn)形式的頻譜變換為時(shí)間區(qū)域的表現(xiàn)形式的發(fā)送輸出信號(hào)So[t],并將其輸出。
其他結(jié)構(gòu)要素的動(dòng)作與實(shí)施例1相同。
如上所述,根據(jù)本實(shí)施例2,對(duì)于發(fā)送輸入信號(hào)的振幅頻譜S[f],估計(jì)噪音頻譜N[f],向振幅頻譜S[f]中混合噪音頻譜N[f],但對(duì)于相位頻譜P[f]不進(jìn)行噪音混合處理而原樣輸出。因此,發(fā)送輸入信號(hào)的相位頻譜維持,可生成自然性高的虛擬背景噪音,得到可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
聲音·噪音判定部6進(jìn)行發(fā)送輸入信號(hào)的聲音·噪音判定,噪音頻譜估計(jì)部7從判斷為噪音的幀估計(jì)噪音頻譜,通過(guò)噪音振幅隨機(jī)化部8進(jìn)行平均化,可生成與時(shí)間·頻率相關(guān)地穩(wěn)定的噪音頻譜。因此,可根據(jù)情況生成適當(dāng)?shù)淖匀恍愿叩奶摂M背景噪音,可提供聽(tīng)覺(jué)上良好的回聲處理裝置。
另外,隨著殘余回聲抑制量eg增大,發(fā)送輸入信號(hào)的振幅頻譜Sr[f]的隨機(jī)化程度增大,而且由于相位擾亂的頻率區(qū)域涉及到低頻區(qū)域,發(fā)送輸出信號(hào)So[t]接近白色噪音。其結(jié)果是發(fā)送輸入信號(hào)中殘余的回聲信號(hào)被隨機(jī)化接近背景噪音,從而聽(tīng)覺(jué)上的效果是難以聽(tīng)見(jiàn)回聲。另一方面,殘余回聲抑制量eg小時(shí),不進(jìn)行振幅頻譜S[f]的振幅擾亂,可保持虛擬背景噪音的自然性。
實(shí)施例3上述實(shí)施例1和2中,圖2的第一振幅調(diào)整部13的振幅頻譜S[f]或振幅擾亂了的振幅頻譜Sr[f]的振幅抑制以及圖2的第二振幅調(diào)整部14的噪音頻譜N[f]的振幅抑制在全頻帶上進(jìn)行,但是,作為對(duì)其實(shí)施變形的本發(fā)明的實(shí)施例3,例如可對(duì)僅在3kHz以下的中低頻成分中進(jìn)行振幅抑制等部分頻帶進(jìn)行振幅抑制。
通過(guò)在發(fā)送輸入信號(hào)中的中低頻區(qū)域成分中進(jìn)行振幅抑制可不損壞高頻區(qū)域的背景噪音的自然性,有效地振幅抑制由于聲音而在低頻區(qū)域中功率偏移了的殘余回聲,可提供良好的回聲處理裝置。
實(shí)施例4作為實(shí)施例1-3的另外的形式,用噪音振幅隨機(jī)化部8輸出的相同的隨機(jī)數(shù)進(jìn)行振幅擾亂的噪音頻譜Nr[f]中可提供對(duì)應(yīng)背景噪音電平的大小的振幅擾亂。
圖8是表示本發(fā)明的實(shí)施例4的回聲處理裝置的結(jié)構(gòu)的框圖。圖中19表示第二噪音振幅隨機(jī)化部。與圖1的結(jié)構(gòu)相比,作為新的要素,設(shè)置了第二噪音振幅隨機(jī)化部19。其他結(jié)構(gòu)與圖1相同,說(shuō)明從略。
接著說(shuō)明動(dòng)作。
噪音振幅隨機(jī)化部8輸出的振幅擾亂了的噪音頻譜Nr[f]提供給第二噪音振幅隨機(jī)化部19。第二噪音振幅隨機(jī)化部19首先計(jì)測(cè)提供的振幅擾亂了的噪音頻譜Nr[f]的功率Npow(dB)?;蛘?,由于回聲抑制量計(jì)算部4計(jì)算出背景噪音電平,而把計(jì)測(cè)了各幀的功率的計(jì)測(cè)結(jié)果提供給第二噪音振幅隨機(jī)化部19。
第二噪音振幅隨機(jī)化部19根據(jù)功率Npow使用式(22)到式(24)之一擾亂噪音振幅隨機(jī)化部8輸出的用相同隨機(jī)數(shù)進(jìn)行了振幅擾亂的噪音頻譜Nr[f]中的某頻率區(qū)域的振幅,生成噪音頻譜Nr2[f]。功率Npow小于60dB時(shí),采用式(22)。
Nr2[f]=Nr[f]·gr11[f]=Nr[f]·(1.0+0.25·RND(x)) …………(22)這里,gr11[f]是隨機(jī)增益,RND(x)是產(chǎn)生-1.0≤RND(x)<1.0的范圍內(nèi)的相同隨機(jī)數(shù)的函數(shù)。該計(jì)算針對(duì)振幅頻譜S[f]的各個(gè)頻譜成分進(jìn)行。具體說(shuō),從頻率fc/2到fc的各個(gè)頻譜成分中采用式(22)。fc是該回聲處理裝置處理的奈奎斯特頻率。
功率Npow大于40dB小于60dB時(shí),采用式(23)。
Nr2[f]=Nr[f]·gr12[f]
=Nr[f]·(1.0+0.125·RND(x)) …………(23)該計(jì)算針對(duì)振幅頻譜S[f]的fc·(3/4)到fc各個(gè)頻譜成分進(jìn)行。
另一方面,在功率Npow大于30dB小于40dB的情況下,采用式(24)。
Nr2[f]=Nr[f]·gr13[f]=Nr[f]·(1.0+0.0625·RND(x)) …………(24)該計(jì)算從振幅頻譜S[f]的fc·(7/8)到fc各個(gè)頻譜成分進(jìn)行。
從式(22)到(24)可知,噪音頻譜的功率Npow小時(shí),僅隨機(jī)化高頻區(qū)域的頻譜成分,其隨機(jī)化程度小。另一方面,噪音頻譜的功率Npow大時(shí),隨機(jī)化程度大,隨機(jī)化到低頻區(qū)域的頻率范圍。分別使用式(22)到(24)的閾值不限于30,40,60dB,根據(jù)回聲處理裝置的使用環(huán)境和其他條件可設(shè)定為任意值。
隨著背景噪音電平,即噪音頻譜的功率增大,發(fā)送輸入信號(hào)的SN比減小,結(jié)果,聲音·噪音判定部6的聲音·噪音判定惡化(聲音誤判定為噪音的比例增高)。但是,如該實(shí)施例那樣,隨著背景噪音電平增大,噪音頻譜的振幅的隨機(jī)化程度和隨機(jī)化的頻率范圍增大,從而背景噪音接近白色噪音。因此,例如由于聲音·噪音判定部6的誤判定而在噪音頻譜中混入殘余回聲成分的情況下,可使殘余回聲成分白色化。
這樣,從第二噪音振幅隨機(jī)化部19向混合部9提供振幅隨機(jī)化的噪音頻譜Nr2[f]。
如上所述,根據(jù)本實(shí)施例4,對(duì)應(yīng)背景噪音電平,調(diào)整噪音頻譜的振幅的隨機(jī)化程度和隨機(jī)化的頻率范圍,例如在背景噪音大的情況下使背景噪音接近白色噪音,在噪音頻譜中誤混入殘余回聲成分的情況下也得到把殘余回聲成分白色化等的效果。
實(shí)施例5圖9是表示本發(fā)明的實(shí)施例5的回聲處理裝置的結(jié)構(gòu)的框圖。圖中20表示隨機(jī)選擇部。與圖1的結(jié)構(gòu)相比,該回聲處理裝置中替代噪音振幅隨機(jī)化部8而設(shè)置隨機(jī)選擇部20。其他結(jié)構(gòu)與圖1相同,說(shuō)明從略。
接著說(shuō)明動(dòng)作。
該實(shí)施例中,噪音頻譜估計(jì)部7輸出2種的噪音頻譜N1[f]和N2[f]。
噪音頻譜估計(jì)部7中提供聲音·噪音判定部6輸出的聲音·噪音判定信息VAD和振幅頻譜S[f],聲音·噪音判定信息VAD為0(幾乎為噪音)時(shí),噪音頻譜估計(jì)部7根據(jù)式(25)估計(jì)輸入信號(hào)中存在的作為背景噪音的平均頻譜的第一噪音頻譜N1[f]。
N1[f]=(1-C1)·S[f]+C1·N1old[f] ……(25)這里,N1old[f]是從過(guò)去判定為噪音的幀估計(jì)的第一噪音頻譜的平均,存儲(chǔ)在噪音頻譜估計(jì)部7的內(nèi)部存儲(chǔ)器中。C1是適當(dāng)確定的常數(shù)(例如0.9),是決定第一噪音頻譜N1[f]的更新速度的系數(shù)。
另一方面,聲音·噪音判定信息VAD為1(有聲)的情況下,噪音頻譜估計(jì)部7根據(jù)式(26)估計(jì)第一噪音頻譜N1[f]。即,將過(guò)去的第一噪音頻譜N1old[f]原樣視為當(dāng)前的第一噪音頻譜N1[f]。
N1[f]=N1old[f]……(26)并且,噪音頻譜估計(jì)部7如式(27)所示將存儲(chǔ)在內(nèi)部存儲(chǔ)器上的過(guò)去的第一噪音頻譜N1old[f]的內(nèi)容置換(更新)為估計(jì)的當(dāng)前幀的第一噪音頻譜N1[f]。
N1old[f]=N1[f] ……(27)這樣得到的第一噪音頻譜N1[f]提供給聲音·噪音判定部6和隨機(jī)選擇部20。
聲音·噪音判定部6如式(27)所示將存儲(chǔ)在內(nèi)部存儲(chǔ)器上的過(guò)去的第一噪音頻譜N1old[f]的內(nèi)容置換(更新)為估計(jì)的當(dāng)前幀的第一噪音頻譜N1[f]。
噪音頻譜估計(jì)部7除第一噪音頻譜N1[f]外還輸出第二噪音頻譜N2[f]。具體說(shuō),聲音·噪音判定信息VAD為0(幾乎為噪音)時(shí),噪音頻譜估計(jì)部7根據(jù)式(28)估計(jì)第二噪音頻譜N2[f]。
N2[f]=(1-C2)·S[f]+C2·N2old[f]……(28)這里,N2old[f]是從過(guò)去判定為噪音的幀估計(jì)的第二噪音頻譜的平均,存儲(chǔ)在噪音頻譜估計(jì)部7的內(nèi)部存儲(chǔ)器中。C2是適當(dāng)確定的常數(shù)(例如0.8),是決定第二噪音頻譜N2[f]的更新速度的系數(shù)。因此,與第一噪音頻譜N1[f]相比,第二噪音頻譜N2[f]的更新速度快。另外,第二噪音頻譜N2[f]的振幅與第一噪音頻譜N1[f]是不同的。
另一方面,聲音·噪音判定信息VAD為1(有聲)的情況下,噪音頻譜估計(jì)部7根據(jù)式(29)估計(jì)第二噪音頻譜N21[f]。即,將過(guò)去的第二噪音頻譜N2old[f]原樣視為當(dāng)前的第二噪音頻譜N2[f]。
N2[f]=N2old[f]……(29)并且,噪音頻譜估計(jì)部7如式(30)所示將存儲(chǔ)在內(nèi)部存儲(chǔ)器上的過(guò)去的第二噪音頻譜N21old[f]的內(nèi)容置換(更新)為估計(jì)的當(dāng)前幀的第二噪音頻譜N2[f]。
N2old[f]=N2[f] ……(30)這樣得到的第二噪音頻譜N2[f]提供給隨機(jī)選擇部20。
隨機(jī)選擇部20根據(jù)噪音頻譜估計(jì)部7輸出的第一噪音頻譜N1[f]和第二噪音頻譜N2[f]對(duì)每幀決定頻譜形狀不同的(振幅擾亂了的)噪音頻譜Nr[f]并輸出。隨機(jī)選擇部20具有運(yùn)算輸出1的概率為x(%)的隨機(jī)函數(shù)Prob(x)的功能,每次決定噪音頻譜Nr[f]時(shí),隨機(jī)選擇部20執(zhí)行輸出1的概率為50%的隨機(jī)函數(shù)Prob(50),利用其執(zhí)行結(jié)果。
具體說(shuō),如果隨機(jī)函數(shù)Prob(50)執(zhí)行結(jié)果為1,則隨機(jī)選擇部20輸出第一噪音頻譜N1[f]。其他情況下隨機(jī)選擇部20輸出第二噪音頻譜N2[f]。這樣振幅擾亂了的噪音頻譜Nr[f]提供給混合部9。
其他結(jié)構(gòu)要素的動(dòng)作與實(shí)施例1相同。
如上所述,根據(jù)本實(shí)施例5,隨機(jī)從對(duì)每幀用多個(gè)不同更新速度估計(jì)的噪音頻譜N1[f]和N2[f]選擇一個(gè),可求出振幅擾亂了的噪音頻譜Nr[f],可維持噪音頻譜的自然性,還提高與混入振幅頻譜中的噪音頻譜的時(shí)間相關(guān)的隨機(jī)性,從而提高虛擬背景噪音的自然性,得到可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
實(shí)施例6圖10是表示本發(fā)明的實(shí)施例6的回聲處理裝置的結(jié)構(gòu)的框圖。該實(shí)施例6是圖9所示的實(shí)施例5的改良。圖中,21是加權(quán)相加部。與圖9的結(jié)構(gòu)不同,該回聲處理裝置中,沒(méi)有隨機(jī)選擇部20,但設(shè)置了加權(quán)相加部21。其他結(jié)構(gòu)與實(shí)施例9相同,說(shuō)明從略。
加權(quán)相加部21中提供噪音頻譜估計(jì)部7輸出的第一噪音頻譜N1[f]和第二噪音頻譜N2[f]。如關(guān)于實(shí)施例5說(shuō)明的那樣,與第一噪音頻譜N1[f]相比,第二噪音頻譜N2[f]具有高的估計(jì)速度。加權(quán)相加部21對(duì)這些噪音頻譜N1[f]和N2[f]加權(quán)計(jì)算,其結(jié)果是將振幅擾亂了的噪音頻譜Nr[f]輸出。加權(quán)相加部21具有運(yùn)算輸出1的概率為x(%)的隨機(jī)函數(shù)Prob(x)的功能,每次決定噪音頻譜Nr[f]時(shí),加權(quán)相加部21執(zhí)行輸出1的概率為50%的隨機(jī)函數(shù)Prob(50),利用其執(zhí)行結(jié)果。
具體說(shuō),如果隨機(jī)函數(shù)Prob(50)執(zhí)行結(jié)果為1,則在從0到奈奎斯特頻率fc的頻率區(qū)域中采用式(31)。
Nr[f]=C3·N1[f]+(1-C3)·N2[f] …………(31)其中,C3是加權(quán)系數(shù),是通過(guò)式(32)求出的隨機(jī)變量。
C3=0.7+0.1*RND(x)…………(32)這里,RND(x)是產(chǎn)生~1.0≤RND(x)<1.0的范圍內(nèi)的相同隨機(jī)數(shù)的函數(shù)。從式(32)可知,加權(quán)系數(shù)C3在0.6以上0.8以下的范圍內(nèi)變化。其中,第一項(xiàng)的0.7可用其他常數(shù)置換。
另一方面,如果隨機(jī)函數(shù)Prob(50)執(zhí)行結(jié)果不為1,則在從0到奈奎斯特頻率fc的頻率區(qū)域中采用式(33)。
Nr[f]=(1-C3)·N1[f]+C3·N2[f]…………(33)這樣,加權(quán)相加部21輸出對(duì)每個(gè)幀頻譜形狀不同的(振幅擾亂了的)噪音頻譜,即加權(quán)平均噪音頻譜Nr[f]。這樣擾亂了振幅的噪音頻譜Nr[f]提供給混合部9。
其他結(jié)構(gòu)要素的動(dòng)作與實(shí)施例5相同。
如上所述,根據(jù)本實(shí)施例6,通過(guò)多個(gè)不同更新速度的噪音頻譜N1[f]和N2[f]的加權(quán)計(jì)算,計(jì)算振幅頻譜S[f]中混入的噪音頻譜Nr[f],因此保持噪音頻譜Nr[f]的頻率特性(頻譜形狀),還與時(shí)間相關(guān)地可隨機(jī)化噪音頻譜Nr[f]的振幅,從而可得到能提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
另外,通過(guò)噪音頻譜N1[f]和N2[f]的加權(quán)計(jì)算,計(jì)算振幅頻譜S[f]中混入的噪音頻譜Nr[f],保持噪音頻譜Nr[f]的頻率特性(頻譜形狀),與時(shí)間相關(guān)地將頻譜的振幅隨機(jī)化。提高虛擬背景噪聲的自然性,提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
實(shí)施例7圖11是表示本發(fā)明的實(shí)施例7的回聲處理裝置的結(jié)構(gòu)的框圖。該實(shí)施例7是圖1所示的實(shí)施例1的改良。圖中,22是頻譜減法部,31是噪音抑制部。與圖1的結(jié)構(gòu)相比,作為新要素,該回聲處理裝置中,設(shè)置頻譜減法部22。噪音抑制部31具有聲音·噪音判定部6和噪音頻譜估計(jì)部7以及頻譜減法部22。其他結(jié)構(gòu)與實(shí)施例1相同,說(shuō)明從略。
該實(shí)施例7中,用頻率·時(shí)間變換部5將回聲消除后的輸入信號(hào)U[t]變換為振幅頻譜S[f]后,頻譜減法部22使用公知的頻譜相減法對(duì)振幅頻譜S[f]進(jìn)行噪音抑制處理。
接著說(shuō)明動(dòng)作。
回聲消除部1中消除回聲的發(fā)送輸入信號(hào)U[t]輸入到頻率·時(shí)間變換部5,由頻率·時(shí)間變換部5變換為振幅頻譜S[f]和相位頻譜P[f]。聲音·噪音判定部6使用例如上述實(shí)施例1的方法判定當(dāng)前幀的輸入信號(hào)是由聲音引起還是幾乎有背景噪音引起,噪音頻譜估計(jì)部7使用其結(jié)果來(lái)估計(jì)噪音頻譜N[f]。
頻譜減法部22中提供頻率·時(shí)間變換部5輸出的振幅頻譜S[f]和噪音頻譜估計(jì)部7輸出的噪音頻譜N[f]。該頻譜減法部22中預(yù)先輸入某頻譜減算率α(如1.2)和某常數(shù)A[f]。常數(shù)A小于1。頻譜減法部22根據(jù)振幅頻譜S[f]和噪音頻譜N[f]以及頻譜減算率α并根據(jù)式(34)計(jì)算噪音去除振幅頻譜,即頻譜減法結(jié)果S’[f]。
S’[f]=S[f]-α·N[f] ………(34)這樣,從振幅頻譜S[f]減去乘以減算率α的噪音頻譜N[f]進(jìn)行噪音抑制。其中,根據(jù)式(34)的頻譜減法結(jié)果S’[f]為0以下時(shí),廢棄頻譜減法結(jié)果S’[f],再根據(jù)式(35)算出頻譜減法結(jié)果S’[f]。
S’[f]=A[f]·S[f]………(35)這樣得到的頻譜減法結(jié)果S’[f]由頻譜減法部22提供給混合部9?;旌喜?中提供從噪音振幅隨機(jī)化部8輸出的噪音頻譜Nr[f]和從自適應(yīng)濾波器2輸出的濾波器初始狀態(tài)標(biāo)記EC_init以及從回聲抑制量計(jì)算部4輸出的殘余回聲抑制量eg?;旌喜?的結(jié)構(gòu)和功能與實(shí)施例1的混合部9的結(jié)構(gòu)和功能實(shí)質(zhì)相同。換句話說(shuō),關(guān)于實(shí)施例1的混合部9的說(shuō)明中,將振幅頻譜S[f]替換為頻譜減法結(jié)果S’[f],則可理解實(shí)施例7的混合部9的結(jié)構(gòu)和功能。
其他結(jié)構(gòu)要素的動(dòng)作與實(shí)施例1相同。
本實(shí)施例的回聲處理裝置包含回聲消除部1,但可構(gòu)成為沒(méi)有回聲消除部1,將發(fā)送輸入信號(hào)Sd[t]直接輸入時(shí)間·頻率變換部5中。此時(shí),關(guān)于濾波器初始狀態(tài)標(biāo)記EC_init的處理不由選擇部16進(jìn)行。
如上所述,根據(jù)本實(shí)施例7,與頻譜相減法共用該回聲處理裝置的一部分要素,可得到可用簡(jiǎn)單結(jié)構(gòu)實(shí)現(xiàn)噪音抑制和虛擬背景噪音生成等的效果。
實(shí)施例7中,噪音抑制中使用頻譜相減法,但本發(fā)明并不打算限制于此。可利用其他適當(dāng)?shù)脑胍粢种品椒?。其形式也在本發(fā)明的范圍中。例如,噪音抑制部31可執(zhí)行上述的特開(kāi)2000-347688號(hào)公報(bào)″噪音抑制裝置″中使用的組合了頻譜減法和頻譜振幅抑制的噪音抑制方法。
以上參考本發(fā)明的最佳的多個(gè)實(shí)施例詳細(xì)圖示并說(shuō)明了本發(fā)明,但本領(lǐng)域容易可理解在權(quán)利要求記載的本發(fā)明的宗旨和范圍內(nèi),可對(duì)形式和細(xì)節(jié)作各種變更。該變更、替代、修改都包含在本發(fā)明的范圍內(nèi)。例如,上述多個(gè)實(shí)施例可相互組合,這樣的組合也位于本發(fā)明的范圍內(nèi)。
發(fā)明效果如以上所述,根據(jù)本發(fā)明,由于構(gòu)成為包括比較混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)和接收的接收輸入信號(hào)的狀態(tài),根據(jù)該比較計(jì)算回聲抑制量的回聲抑制量計(jì)算部;將發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;對(duì)應(yīng)回聲抑制量在振幅頻譜中混合噪音頻譜的混合部;根據(jù)通過(guò)混合部混合了噪音頻譜的振幅頻譜和相位頻譜生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出發(fā)送輸出信號(hào)的頻率·時(shí)間變換部,雖然向振幅頻譜中混合了噪音頻譜,但對(duì)于相位頻譜,不進(jìn)行噪音混合處理而輸出。因此,發(fā)送輸入信號(hào)的相位頻譜維持,可生成自然性高的虛擬背景噪音?;旌喜扛鶕?jù)發(fā)送輸入信號(hào)和接收輸入信號(hào)的比較并對(duì)應(yīng)回聲抑制量計(jì)算部計(jì)算的回聲抑制量混合噪音頻譜,因此根據(jù)情況可生成適當(dāng)?shù)淖匀恍愿叩奶摂M背景噪音,可提供聽(tīng)覺(jué)上良好的回聲處理裝置。
根據(jù)本發(fā)明,由于構(gòu)成為混合部具有對(duì)應(yīng)回聲抑制量調(diào)整振幅頻譜的頻譜振幅的振幅調(diào)整部,具有有效抑制發(fā)送輸入信號(hào)中的回聲成分的等的效果。而且,與直接校正時(shí)間區(qū)域的表現(xiàn)形式的信號(hào)的情況相比,具有可提高最終發(fā)送信號(hào)的自然性的效果。
根據(jù)本發(fā)明,由于構(gòu)成為具有頻譜減法部,從振幅頻譜減去噪音頻譜乘以頻譜減算率的頻譜,生成去除噪音振幅頻譜,將去除噪音振幅頻譜作為振幅頻譜提供給混合部,因此抑制發(fā)送輸入信號(hào)中的噪音成分后,具有可混合背景噪音等的效果。而且,由頻譜減法部利用作為噪音頻譜估計(jì)部的估計(jì)結(jié)果的噪音頻譜,從而具有可將構(gòu)成要素的數(shù)目增加抑制到最小限度等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為包括比較混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)和接收的接收輸入信號(hào)的狀態(tài),根據(jù)該比較計(jì)算回聲抑制量的回聲抑制量計(jì)算部;將發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;在振幅頻譜中混合噪音頻譜的混合部;對(duì)應(yīng)回聲抑制量擾亂(隨機(jī)化)相位頻譜的相位的相位隨機(jī)化部;根據(jù)通過(guò)混合部混合了噪音頻譜的振幅頻譜和相位隨機(jī)化部擾亂了相位的相位頻譜生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出發(fā)送輸出信號(hào)的頻率·時(shí)間變換部,因此具有在回聲抑制量高時(shí),增大相位頻譜的相位擾亂程度,難以聽(tīng)見(jiàn)回聲,在回聲抑制量低時(shí),減小相位頻譜的相位擾亂程度,可維持聲音的自然性等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值小的情況下,相位隨機(jī)化部擾亂要發(fā)送的發(fā)送輸入信號(hào)的相位頻譜中高頻區(qū)域的相位,隨著回聲抑制量增大,相位隨機(jī)化部不僅擾亂高頻區(qū)域,還擾亂低頻區(qū)域的相位,因此具有在需要時(shí)可有效地抑制遠(yuǎn)端說(shuō)話人的聲音引起的低頻區(qū)域的回聲等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為包括比較混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)和接收的接收輸入信號(hào)的狀態(tài),根據(jù)該比較計(jì)算回聲抑制量的回聲抑制量計(jì)算部;將發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;在振幅頻譜中混合噪音頻譜的混合部;對(duì)應(yīng)回聲抑制量擾亂振幅頻譜的振幅的振幅隨機(jī)化部;根據(jù)通過(guò)振幅隨機(jī)化部擾亂了振幅并且由混合部混合了噪音頻譜的振幅頻譜和相位頻譜生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出發(fā)送輸出信號(hào)的頻率·時(shí)間變換部,因此具有在回聲抑制量高時(shí),增大振幅頻譜的振幅擾亂程度,難以聽(tīng)見(jiàn)回聲,在回聲抑制量低時(shí),減小振幅頻譜的振幅擾亂程度,可維持聲音的自然性等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值小的情況下,振幅隨機(jī)化部擾亂要發(fā)送的發(fā)送輸入信號(hào)的振幅頻譜中高頻區(qū)域的振幅,隨著回聲抑制量增大,振幅隨機(jī)化部不僅擾亂高頻區(qū)域,還擾亂低頻區(qū)域的振幅,因此具有在需要時(shí)可有效地抑制遠(yuǎn)端說(shuō)話人的聲音引起的低頻區(qū)域的回聲等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為包括將混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;對(duì)應(yīng)發(fā)送輸入信號(hào)的背景噪音電平擾亂噪音頻譜的振幅的噪音振幅隨機(jī)化部;將噪音振幅隨機(jī)化部擾亂了振幅的噪音頻譜在振幅頻譜中混合的混合部;根據(jù)通過(guò)混合部混合了噪音頻譜的振幅頻譜和相位頻譜生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出發(fā)送輸出信號(hào)的頻率·時(shí)間變換部,因此在背景噪音電平比規(guī)定值大的情況下,噪音頻譜的振幅的隨機(jī)化程度增大,即便是假設(shè)在噪音頻譜中混入回聲成分的情況下,也有可將回聲成分白色化等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為在要發(fā)送的發(fā)送輸入信號(hào)的背景噪音電平比規(guī)定值小的情況下,噪音振幅隨機(jī)化部擾亂噪音振幅頻譜中高頻區(qū)域的振幅,隨著背景噪音電平增大,噪音振幅隨機(jī)化部不僅擾亂高頻區(qū)域,還擾亂低頻區(qū)域的振幅,因此在背景噪音電平比規(guī)定值大的情況下,隨機(jī)化的頻率范圍到達(dá)低頻區(qū)域并接近白色噪音,從而即便是假設(shè)在噪音頻譜中混入殘余回聲成分的情況下,也有可將殘余回聲成分白色化等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值大的情況下,混合部向振幅頻譜中混合大比例的噪音頻譜,在回聲抑制量比規(guī)定值小的情況下,混合部向振幅頻譜中混合小比例的噪音頻譜,因此可混入對(duì)應(yīng)殘余回聲電平和發(fā)送輸入信號(hào)以及接收輸入信號(hào)的狀態(tài)的虛擬背景噪音,具有可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值大的情況下,替代混合部向振幅頻譜中混合噪音頻譜,而用噪音頻譜置換振幅頻譜,因此即便殘余回聲大的情況下也可刪除殘余回聲成分并插入虛擬背景噪音,從而具有可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為具有根據(jù)接收的接收輸入信號(hào)和通信路徑傳輸特性或麥克風(fēng)與揚(yáng)聲器之間的聲音傳輸特性、估計(jì)濾波器系數(shù)、生成虛擬回聲信號(hào)的自適應(yīng)濾波器;通過(guò)從混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)減去虛擬回聲信號(hào)來(lái)去除回聲信號(hào)的減法部,在自適應(yīng)濾波器的濾波器系數(shù)收斂之前的時(shí)間里,替代混合部向振幅頻譜混合比其他情況大的比例的噪音頻譜或向振幅頻譜混合噪音頻譜,而用噪音頻譜置換振幅頻譜,因此濾波器系數(shù)首先之前的時(shí)間里,替代自適應(yīng)濾波器,混合部可刪除殘余回聲成分并插入虛擬背景噪音,從而具有可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為混合部向要發(fā)送的發(fā)送輸入信號(hào)的振幅頻譜中低頻區(qū)域的振幅頻譜成分中混合大比例的噪音頻譜成分,隨著變?yōu)楦哳l區(qū)域,向振幅頻譜成分中混合小比例的噪音頻譜成分,因此可不增加高頻區(qū)域的噪音感而在低頻區(qū)域抑制功率偏移了的殘余回聲信號(hào),從而具有可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為還包括隨機(jī)選擇部,噪音頻譜估計(jì)部算出多個(gè)估計(jì)噪音頻譜,隨機(jī)選擇部隨機(jī)選擇其中某一估計(jì)噪音頻譜,作為噪音頻譜輸出,因此可維持噪音頻譜的自然性,還提高與混入振幅頻譜中的噪音頻譜的時(shí)間相關(guān)的隨機(jī)性,從而提高虛擬背景噪音的自然性,具有可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為還包括隨機(jī)選擇部,噪音頻譜估計(jì)部使用慢的更新速度算出第一估計(jì)噪音頻譜,使用快的更新速度算出第二估計(jì)噪音頻譜,隨機(jī)選擇部隨機(jī)選擇其中某一估計(jì)噪音頻譜,作為噪音頻譜輸出,因此可維持噪音頻譜的自然性,還提高與混入振幅頻譜中的噪音頻譜的時(shí)間相關(guān)的隨機(jī)性,從而提高虛擬背景噪音的自然性,具有可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為還包括加權(quán)加法器,噪音頻譜估計(jì)部算出多個(gè)估計(jì)噪音頻譜,加權(quán)加法器將進(jìn)行這些多個(gè)估計(jì)噪音頻譜的加權(quán)相加得到的加權(quán)平均噪音頻譜作為噪音頻譜輸出,因此可維持輸出的噪音頻譜的頻率特性(頻譜形狀)的大概形狀,還可與時(shí)間相關(guān)地將噪音頻譜的振幅隨機(jī)化,從而具有可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
根據(jù)本發(fā)明,由于構(gòu)成為還包括加權(quán)加法器,噪音頻譜估計(jì)部使用慢的更新速度算出第一估計(jì)噪音頻譜,使用快的更新速度算出第二估計(jì)噪音頻譜,加權(quán)加法器將進(jìn)行這些多個(gè)估計(jì)噪音頻譜的加權(quán)相加得到的加權(quán)平均噪音頻譜作為噪音頻譜輸出,因此可維持輸出的噪音頻譜的頻率特性(頻譜形狀)的大概形狀,還可與時(shí)間相關(guān)地將噪音頻譜的振幅隨機(jī)化,從而提高虛擬背景噪音的自然性,具有可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
本發(fā)明的回聲處理裝置中,加權(quán)加法器對(duì)噪音頻譜的每個(gè)頻譜成分在一定范圍內(nèi)隨機(jī)設(shè)定加權(quán)加法器的加權(quán)相加中使用的加權(quán)系數(shù),因此可保持噪音頻譜的頻率特性(頻譜形狀)的大概形狀,還與頻率相關(guān)地隨機(jī)化振幅,從而提高虛擬背景噪音的自然性,具有可提供聽(tīng)覺(jué)上良好的回聲處理裝置等的效果。
權(quán)利要求
1.一種回聲處理裝置,包括比較混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)和接收的接收輸入信號(hào)的狀態(tài),根據(jù)該比較計(jì)算回聲抑制量的回聲抑制量計(jì)算部;將上述發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從上述振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;對(duì)應(yīng)上述回聲抑制量在上述振幅頻譜中混合上述噪音頻譜的混合部;根據(jù)通過(guò)上述混合部混合了上述噪音頻譜的振幅頻譜和上述相位頻譜生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出上述發(fā)送輸出信號(hào)的頻率·時(shí)間變換部。
2.根據(jù)權(quán)利要求1所述的回聲處理裝置,其特征在于混合部具有對(duì)應(yīng)回聲抑制量調(diào)整振幅頻譜的頻譜振幅的振幅調(diào)整部。
3.根據(jù)權(quán)利要求1所述的回聲處理裝置,其特征在于具有頻譜減法部,從振幅頻譜減去噪音頻譜乘以頻譜減算率的頻譜,生成去除噪音振幅頻譜,將上述去除噪音振幅頻譜作為振幅頻譜提供給混合部。
4.一種回聲處理裝置,包括比較混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)和接收的接收輸入信號(hào)的狀態(tài),根據(jù)該比較計(jì)算回聲抑制量的回聲抑制量計(jì)算部;將上述發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從上述振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;在上述振幅頻譜中混合上述噪音頻譜的混合部;對(duì)應(yīng)上述回聲抑制量擾亂(隨機(jī)化)上述相位頻譜的相位的相位隨機(jī)化部;根據(jù)通過(guò)上述混合部混合了上述噪音頻譜的振幅頻譜和通過(guò)上述相位隨機(jī)化部根據(jù)擾亂了相位的上述相位頻譜,生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出上述發(fā)送輸出信號(hào)的頻率·時(shí)間變換部。
5.根據(jù)權(quán)利要求4所述的回聲處理裝置,其特征在于在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值小的情況下,相位隨機(jī)化部擾亂要發(fā)送的發(fā)送輸入信號(hào)的相位頻譜中高頻區(qū)域的相位,隨著上述回聲抑制量增大,相位隨機(jī)化部不僅擾亂高頻區(qū)域,還擾亂低頻區(qū)域的相位。
6.一種回聲處理裝置,包括比較混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)和接收的接收輸入信號(hào)的狀態(tài),根據(jù)該比較計(jì)算回聲抑制量的回聲抑制量計(jì)算部;將上述發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從上述振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;在上述振幅頻譜中混合上述噪音頻譜的混合部;對(duì)應(yīng)上述回聲抑制量擾亂上述振幅頻譜的振幅的振幅隨機(jī)化部;根據(jù)通過(guò)上述振幅隨機(jī)化部擾亂了振幅并且由上述混合部混合了上述噪音頻譜的振幅頻譜,并根據(jù)上述相位頻譜,生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出上述發(fā)送輸出信號(hào)的頻率·時(shí)間變換部。
7.根據(jù)權(quán)利要求6所述的回聲處理裝置,其特征在于在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值小的情況下,振幅隨機(jī)化部擾亂要發(fā)送的發(fā)送輸入信號(hào)的振幅頻譜中高頻區(qū)域的振幅,隨著上述回聲抑制量增大,振幅隨機(jī)化部不僅擾亂高頻區(qū)域,還擾亂低頻區(qū)域的振幅。
8.一種回聲處理裝置,包括將混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)從時(shí)間區(qū)域的表現(xiàn)形式變換為頻率區(qū)域的表現(xiàn)形式并生成振幅頻譜和相位頻譜的時(shí)間·頻率變換部;從上述振幅頻譜估計(jì)噪音頻譜的噪音頻譜估計(jì)部;對(duì)應(yīng)上述發(fā)送輸入信號(hào)的背景噪音電平擾亂上述噪音頻譜的振幅的噪音振幅隨機(jī)化部;將上述噪音振幅隨機(jī)化部擾亂了振幅的上述噪音頻譜在上述振幅頻譜中混合的混合部;根據(jù)通過(guò)上述混合部混合了上述噪音頻譜的振幅頻譜和上述相位頻譜生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)并輸出上述發(fā)送輸出信號(hào)的頻率·時(shí)間變換部。
9.根據(jù)權(quán)利要求8所述的回聲處理裝置,其特征在于在要發(fā)送的發(fā)送輸入信號(hào)的背景噪音電平比規(guī)定值小的情況下,噪音振幅隨機(jī)化部擾亂噪音振幅頻譜中高頻區(qū)域的振幅,隨著上述背景噪音電平增大,噪音振幅隨機(jī)化部不僅擾亂高頻區(qū)域,還擾亂低頻區(qū)域的振幅。
10.根據(jù)權(quán)利要求1到9之一所述的回聲處理裝置,其特征在于在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值大的情況下,混合部向振幅頻譜中混合大比例的噪音頻譜,在上述回聲抑制量比規(guī)定值小的情況下,混合部向振幅頻譜中混合小比例的噪音頻譜。
11.根據(jù)權(quán)利要求1到9之一所述的回聲處理裝置,其特征在于在回聲抑制量計(jì)算部算出的回聲抑制量比規(guī)定值大的情況下,替代混合部向振幅頻譜中混合噪音頻譜,而用噪音頻譜置換振幅頻譜。
12.根據(jù)權(quán)利要求1到9之一所述的回聲處理裝置,其特征在于具有根據(jù)接收的接收輸入信號(hào)和通信路徑傳輸特性或麥克風(fēng)與揚(yáng)聲器之間的聲音傳輸特性、估計(jì)濾波器系數(shù)、生成虛擬回聲信號(hào)的自適應(yīng)濾波器;通過(guò)從混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)減去上述虛擬回聲信號(hào)來(lái)去除回聲信號(hào)的減法部,在上述自適應(yīng)濾波器的濾波器系數(shù)收斂之前的時(shí)間里,替代混合部向振幅頻譜混合比其他情況大的比例的噪音頻譜或向振幅頻譜混合噪音頻譜,而用噪音頻譜置換振幅頻譜。
13.根據(jù)權(quán)利要求1到9之一所述的回聲處理裝置,其特征在于混合部向要發(fā)送的發(fā)送輸入信號(hào)的振幅頻譜中低頻區(qū)域的振幅頻譜成分中混合大比例的噪音頻譜成分,隨著變?yōu)楦哳l區(qū)域,向振幅頻譜成分中混合小比例的噪音頻譜成分。
14.根據(jù)權(quán)利要求1到9之一所述的回聲處理裝置,其特征在于還包括隨機(jī)選擇部,噪音頻譜估計(jì)部算出多個(gè)估計(jì)噪音頻譜,上述隨機(jī)選擇部隨機(jī)選擇其中某一估計(jì)噪音頻譜,作為噪音頻譜輸出。
15.根據(jù)權(quán)利要求1到9之一所述的回聲處理裝置,其特征在于還包括隨機(jī)選擇部,噪音頻譜估計(jì)部使用慢的更新速度算出第一估計(jì)噪音頻譜,使用快的更新速度算出第二估計(jì)噪音頻譜,上述隨機(jī)選擇部隨機(jī)選擇其中某一估計(jì)噪音頻譜,作為噪音頻譜輸出。
16.根據(jù)權(quán)利要求1到9之一所述的回聲處理裝置,其特征在于還包括加權(quán)加法器,噪音頻譜估計(jì)部算出多個(gè)估計(jì)噪音頻譜,上述加權(quán)加法器將進(jìn)行這些多個(gè)估計(jì)噪音頻譜的加權(quán)相加得到的加權(quán)平均噪音頻譜作為噪音頻譜輸出。
17.根據(jù)權(quán)利要求16所述的回聲處理裝置,其特征在于還包括加權(quán)加法器,噪音頻譜估計(jì)部使用慢的更新速度算出第一估計(jì)噪音頻譜,使用快的更新速度算出第二估計(jì)噪音頻譜,上述加權(quán)加法器將進(jìn)行這些多個(gè)估計(jì)噪音頻譜的加權(quán)相加得到的加權(quán)平均噪音頻譜作為噪音頻譜輸出。
18.根據(jù)權(quán)利要求16所述的回聲處理裝置,其特征在于上述加權(quán)加法器對(duì)噪音頻譜的每個(gè)頻譜成分在一定范圍內(nèi)隨機(jī)設(shè)定加權(quán)加法器的加權(quán)相加中使用的加權(quán)系數(shù)。
全文摘要
獲得一種回聲處理裝置,可根據(jù)要發(fā)送的輸入信號(hào)的頻譜生成自然性高的虛擬背景噪音。回聲處理裝置包括回聲抑制量計(jì)算部4、時(shí)間·頻率變換部5、噪音頻譜估計(jì)部7、混合部9和頻率·時(shí)間變換部11?;芈曇种屏坑?jì)算部4比較混入了回聲信號(hào)的要發(fā)送的發(fā)送輸入信號(hào)和接收的接收輸入信號(hào)的狀態(tài),根據(jù)該比較計(jì)算回聲抑制量。時(shí)間·頻率變換部5FFT處理發(fā)送輸入信號(hào),生成振幅頻譜和相位頻譜。噪音頻譜估計(jì)部7從振幅頻譜估計(jì)噪音頻譜。混合部9對(duì)應(yīng)回聲抑制量在振幅頻譜中混合噪音頻譜。頻率·時(shí)間變換部11根據(jù)混合了噪音頻譜的振幅頻譜和相位頻譜生成混合了時(shí)間區(qū)域的表現(xiàn)形式的噪音的發(fā)送輸出信號(hào)。
文檔編號(hào)H04M1/60GK1405991SQ02142858
公開(kāi)日2003年3月26日 申請(qǐng)日期2002年9月19日 優(yōu)先權(quán)日2001年9月20日
發(fā)明者古田訓(xùn), 高橋真哉 申請(qǐng)人:三菱電機(jī)株式會(huì)社