本發(fā)明具體涉及一種時頻記憶子帶比例自適應回聲消除方法,屬于電聲自適應回聲消除技術領域。
背景技術:
在免提電話會議或手機通話中,由于通話環(huán)境的原因,經(jīng)常能從揚聲器中聽到自己延遲的聲音,該延遲的聲音稱為回聲。了消除此種回聲,提高通話質量,通常在聲學系統(tǒng)內部安裝回聲消除裝置(acoustic echo canceller,AEC),產生與回聲幅值相同而相位相反的聲學信號,并在聲音接收端將接收信號與此同幅反相位的信號相加,從而消除回聲干擾。
回聲消除的核心問題是回聲信道的跟蹤和回聲的估計,理想情況下當AEC產生的回聲估計值與回聲幅值相同,相位相反時,系統(tǒng)中的回聲可以完全被抑制。目前,回聲信道跟蹤和回聲估計通常采用自適應濾波技術,設計各種濾波器(FIR濾波器、IIR濾波器和子帶濾波器等)對外部回聲信道進行模擬,并采用自適應算法對濾波器的抽頭進行實時的更新。因此,濾波器的自適應更新收斂速率和準確性是影響回聲消除性能的兩個主要因素。濾波器收斂速率過低,回聲估計值跟蹤能力下降,造成抑制性能降低;濾波器估計準確度過低,導致穩(wěn)態(tài)時殘留回聲較大,影響正常的通話。
語音信號是一種非平穩(wěn)信號,它的時頻域特性會隨著時間變化,因此傳統(tǒng)的自適應算法,如最小均方(least mean square,LMS)算法,歸一化最小均方(Normalized least mean square,NLMS)算法在語音信號背景下,其收斂速率和穩(wěn)態(tài)精確性能都受到巨大的限制;另外,回聲消除的另一個特點是其回聲信道的稀疏特性,即回聲信道的能量主要集中在少數(shù)有意義的抽頭權系數(shù)上,大量的抽頭權系數(shù)幅值都接近零,這種稀疏性嚴重的制約了傳統(tǒng)自適應算法的收斂動態(tài)性能,針對以上兩種回波消除特點,通過對現(xiàn)有技術文獻的檢索,目前采用的方法有一下幾種:
參考文獻1:在中國發(fā)明專利申請?zhí)?01510028006.4,名稱為“一種改進的凸組合解相關成比例自適應回聲消除方法”中,其針對回聲信道的稀疏性,采用濾波器的凸組合結構,結合解相關自適應算法和比例自適應算法,有效的緩解了信道稀疏性對算法收斂速率的影響,獲得了較快的收斂速率,低穩(wěn)態(tài)誤差以及較好的抗干擾性能,但是由于需要兩套濾波器的構成凸組合結構,其耗費資源和計算復雜度都較大,算法的特性對于凸組合混合參數(shù)等較為敏感,增加了硬件實現(xiàn)的難度。
參考文獻2:“An improved multiband-structured subband adaptive filter algorithm”(中文名:一種改進的多自帶結構子帶自適應濾波算法Yang,F.,Wu,M.,Ji,P.,Yang,J.,IEEE Signal Process.Lett.,2012,19,(10),pp.647-650)針對回聲信號的非平穩(wěn)特性,采用子帶分割的方法,將信號的頻譜劃分為多個子帶,使得每個子帶信號具有白噪聲的特性,降低了其非平穩(wěn)度,另外,采用仿射投影算法(Affine projection,AP)對每個子帶進行濾波器抽頭權系數(shù)更新,使得整個更新結構具有時頻二維特性,有效的提高了回聲抑制的性能,但是其并沒有考慮是回聲信道的稀疏特性,而且子帶個數(shù)較多的情況會帶來巨大的計算復雜度。
參考文獻3:“An efficient proportionate affine projection algorithm for echo cancellation”(中文名:一有效的回波消除仿射投影算法Paleologu,C.,Ciochina,S.,Benesty,J.IEEE Signal Process.Lett.,2010,17,(2),pp.165–168)針對回聲信號的稀疏特性和回聲的非平穩(wěn)性,采用濾波器抽頭加權系數(shù)比例更新以及在AP算法在時域的白化作用,提高了算法的收斂速率以及回聲的消除性能,但該方法由于未考慮非平穩(wěn)信號的頻域特性,仍存在收斂速率緩慢的問題。
技術實現(xiàn)要素:
本發(fā)明針對上述回聲消除問題,提供了一種時頻記憶子帶比例自適應回聲消除方法。方法具體包括以下步驟:
步驟一
將遠端信號x(n)和近端接收到的包含回聲的信號d(n)輸入至分析濾波器組F0(z),F1(z),…FN-1(z)中,其中n表示時間刻度,F(xiàn)i(z)i=1,2,…N-1表示分析濾波器組的Z域傳遞函數(shù),分析濾波器組包含N個分析濾波器,分析濾波器的長度為M,將信號在頻域上均勻分割為N個等帶寬的子帶遠端信號x0(n),x1(n),…xN-1(n)和N個等帶寬的子帶近端信號d0(n),d1(n),…dN-1(n);
步驟二
遠端子帶信號x0(n),x1(n),…xN-1(n)和近端信號子帶d0(n),d1(n),…dN-1(n)進行降低速率的N倍抽取,得到降速后的子帶信號x0(p),x1(p),…xN-1(p)、d0(p),d1(p),…dN-1(p),其中p表示時間刻度,且p=n/N;
步驟三
按公式一計算p時刻N個子帶回波估值向量,
其中Xi(p)=[xi(p),xi(p-1),…xi(p-D+1)]為第i個輸入子帶矩陣,其維數(shù)為L×D,D是投影階數(shù),xi(p)=[xi(pN),xi(pN-1),…,xi(pN-L+1)]T為濾波器第i個子帶輸入向量,w(p)=[w0(p),w1(p),…wL-1(p)]T為p時刻濾波器抽頭權值向量,其具體數(shù)值由p-1時刻回波消除過程中已知,且在起始0時刻,w(0)=[0,0,…0]T,L為抽頭個數(shù),L=256~1024,T表示共軛轉置運算;
步驟四
按公式二計算第i個子帶的誤差估計向量,
其中ei,D(p)=[ei,0(pN),ei,1(pN-1),…ei,L-1(pN-L+1)]T是維數(shù)為L×1的誤差子帶向量,di,D(p)=[di,0(pN),di,1(pN-1),…di,L-1(pN-L+1)]T表示近端子帶信號向量;
步驟五
按公式三計算第i個子帶比例因子向量,
ci(p)=[ci,0(p),ci,1(p),…ci,L-1(p)]T 公式三
ci,l(p)為ci(p)的第i個元素,
其中ζ取0.5為比例尺度因子,其取值范圍-1<ζ<1,σ=0.001為格式化因子,θi-1,l(p)表示第i-1個子帶信號對第l個權系數(shù)的增量貢獻因子,為比例因子的頻域記憶因子,當i=0時,θi-1,l(p)=0,同時按照上述方法,計算p-1時刻,p-2時刻,……,p-D+1時刻的子帶比例因子向量ci(p-1),ci(p-2),……,ci(p-D+1),D為比例因子的時域記憶刻度;
步驟六
通過子帶輸入信號矩陣和比例因子向量按公式四計算比例輸入矩陣
其中表示向量的hadmard積;
步驟七
按公式五計算第i個子帶權向量增量θi(p)
其中λ=0.001為格式化因子,I為D×D維單位矩陣,λI為對角元素為λ的對角矩陣,其目的是保證計算的穩(wěn)定性,μ=0.1為步長因子,其取值范圍0<μ<2;
步驟八
回到步驟四,根據(jù)步驟四至步驟七計算出所有子帶權向量增量,即θi(p)i=1,2,…N-1;
步驟九
抽頭權值向量按照公式六進行更新,
最終得到p+1時刻的權值向量w(p+1),其維數(shù)為L×1;
步驟十
回到步驟三,計算p+1時刻N個子帶回波估向量,其中Xi(p+1)為p+1時刻濾波器第i個子帶輸入矩陣,其維數(shù)為L×D,w(p+1)為步驟九中計算出的p+1時刻濾波器抽頭權值向量,其維數(shù)為L×1;
步驟十一
按公式七從包含有回波信號的p+1時刻近端輸入di,D(p+1)(i=1,2,…N-1)中減去回波干擾估計值,
其中ei,D(p+1)是干擾消除后的誤差信號,包含近端有用信號和殘留回波,其維數(shù)為L×1,di,D(p+1)=[di,0(pN+1),di,1(pN),…di,L-1(pN-L)]T表示p+1時刻近端子帶信號,其維數(shù)為L×1,
最終完成回波干擾消除。
進一步的,所述步驟一中分析濾波器組中的N個分析濾波器為離散余弦濾波器。
進一步的,所述步驟三中D取值范圍為4-8。
本發(fā)明的有益效果在于:本發(fā)明的時頻記憶子帶比例自適應回聲消除方法及回饋方法,針對回聲信號的非平穩(wěn)特性,在頻域上采用子帶結構,將近端輸入和遠端回聲信號分割為多個子帶,有效的降低了信號的相關性;另一方面,在時域上采取多維投影輸入組成輸入矩陣,參與濾波器抽頭權向量更新運算,起到了時頻二維同時預白化的作用。
針對回聲信道稀疏性的特點,本發(fā)明提出了時頻二維記憶比例自適應方法,在計算比例因子時,考慮了時間記憶性,即時間延遲D和頻域記憶性,即不同子帶的權系數(shù)增量貢獻因子θi,l(p),提高了自適應算法的收斂速率和穩(wěn)態(tài)性能。
本發(fā)明為所有比例自適應回聲消除方法提供了一個統(tǒng)一的構架,即設置不同的參數(shù),就可得到不同的比例自適應方法,如當N=1,說明回聲消除系統(tǒng)中只存在唯一一個個子帶,此方法蛻化為改進的記憶性比例仿射投影(Memory improved Proportionate affine projection algorithm,MIPAPA)自適應方法,從而可根據(jù)實際情況設置不同的參數(shù),選取不同的回聲消除構架和方法。
附圖說明
圖1為實施例中的本發(fā)明方法的子帶結構圖。
圖2為實施例中的本發(fā)明方法的分析濾波器組結構圖。
圖3為實施例中的本發(fā)明方法的稀疏信道示意圖。
圖4為5dB低信噪比環(huán)境下文獻2方法、文獻3方法與本發(fā)明的權系數(shù)歸一化失調曲線比較示意圖。
圖5為20dB高信噪比環(huán)境下文獻2方法、文獻3方法與本發(fā)明的權系數(shù)歸一化失調曲線比較示意圖。
具體實施方式
下面結合附圖對本發(fā)明的具體實施方式進行說明:
本發(fā)明針對回聲消除問題,提供了一種時頻記憶子帶比例自適應回聲消除方法。該發(fā)明一方面針對輸入回聲信號的非平穩(wěn)特性,采用子帶結構,在頻域上對輸入回聲信號進行解相關,采用AP算法從時域上進行預白化,獲得較好的回聲消除性能;另一方面利用帶有時頻記憶的比例因子,抵抗回聲信道的稀疏性,獲得較快的收斂速率。
采用一個仿真實例來驗證本發(fā)明的有益性,并與背景技術中現(xiàn)有文獻2和文獻3的方法作比較。
采用本發(fā)明的技術方案,其子帶結構如圖1所示,使用的分析濾波器組結構如圖2所示。分析濾波器組中的N個分析濾波器為離散余弦濾波器。
回聲信道采用國際電信標準ITU-TG168定義的標準稀疏信道,如圖3所示,信道截取長度L=512。遠端輸入信號x(n)為10階自回歸AR(10)信號,其自回歸系數(shù)為(5.3217,-9.2948,7.0933,-2.8125,2.5805,-2.4230,0.3747,2.2628,-0.3028,1.7444,1.1053),其具有高強度相關特性。信噪比(SNR)設置為5dB或20dB,分別比較各種方法在低信噪比和高信噪比條件下的性能。
在近端按照采樣頻率8k拾取近端的回聲信號d(n),共采樣8000個樣本,其中d(n)同時包含回聲信號,遠端信號x(n)以及噪聲。
仿真實驗中選取的所有參數(shù)如表1所示。
表1
圖4所示為5dB低信噪比環(huán)境下文獻2方法、文獻3方法與本發(fā)明的權系數(shù)歸一化失調曲線比較示意圖,其中,曲線1代表本發(fā)明,曲線2代表文獻2,曲線3代表文獻3,可看出在收斂步長因子一致的情況下,本發(fā)明收斂速率更快,穩(wěn)態(tài)性能更優(yōu)。
圖5所示為20dB高信噪比環(huán)境下文獻2方法、文獻3方法與本發(fā)明的權系數(shù)歸一化失調曲線比較,其中,曲線4代表本發(fā)明,曲線5代表文獻2,曲線6代表文獻3,可看出在高信噪比下,本發(fā)明仍獲得了較快的收斂速率和較好的穩(wěn)態(tài)性能。
可優(yōu)選的改進的技術方案如下:
本發(fā)明不局限于采用上述記憶比例因子,還可以選取以下比例因子改善信道稀疏性
μμ-law比例因子
其中βi,l(p)的計算方式為
βi,l(p)
=max{ρmax[δ,T(|w0(p)|),…,T(|wl-1(p)|),T(|wl(p)|)]}
T(·)函數(shù)定義為
T(|wl(p)|)=ln(1+η|wl(p)|),η=1/ε
其中ρ,δ和ε都為很小的正數(shù),其典型選值為ρ=5/L,δ=0.01,ε根據(jù)環(huán)境噪聲,選取為噪聲的數(shù)量級。
改進型比例因子
其中尺度因子ζ可變,其計算方式為
?!羗ax(R(p))為選值門限,Γ的典型值為0.1。κ1的典型取值范圍為-1~-0.98,κ2的典型取值范圍為0.98~1。向量R(p)計算方式為
R(p)=[r0(p),r1(p),…rL-1(p)]
rl(p)=max{ρmax[|w0(p)|,…,|wL-1(p)|],|wl(p)|}
本發(fā)明根據(jù)子帶個數(shù)N、仿射投影維數(shù)D以及記憶比例因子δi,l(k)的設置,不局限于子帶自適應濾波;當N=1,說明回聲消除系統(tǒng)中只存在唯一一個個子帶,此方法蛻化為改進的記憶性比例仿射投影(Memory improved Proportionate affine projection algorithm,MIPAPA)自適應方法;當D=1,δi,l(k)=0時,說明回聲消除系統(tǒng)中輸入的維數(shù)為1維,此方法可看做改進的子帶比例自適應方法;當D=1,N=1和δi,l(k)=0時,此方法蛻化為改進子帶歸一化最小均方(Improved Proportionate Normalized least mean square,IPNLMS)自適應方法。
以上所述是本發(fā)明的優(yōu)選實施方式,應當指出,對于本技術領域的普通技術人員來說,在不脫離本發(fā)明所述原理的前提下,還可以作出若干改進和潤飾,這些改進和潤飾也應視為本發(fā)明的保護范圍。