] 在現(xiàn)有技術(shù)的某些實施例中,通過在圖4所示結(jié)構(gòu)的基礎(chǔ)上,通過增加一個語音 激活檢測模塊用于控制3個自適應(yīng)濾波器的開啟和更新,如圖5所示,它進(jìn)一步提高了工作 穩(wěn)定性。見文獻(xiàn)[3]。
[0197] 盡管現(xiàn)有技術(shù)有多種CR-ANC的方案被提出,但是ANC的性能有限,因為語音串?dāng)_ 的傳遞途徑是實時發(fā)生改變的,例如當(dāng)說話人或者設(shè)備移動,其傳遞途徑就會發(fā)生變化,若 說話人更迭,則信號也會產(chǎn)生突變。上述CR-ANC方案在實際運作時,有時不能降低串?dāng)_,反 而會引入更大的串?dāng)_,導(dǎo)致ANC的性能急劇下降。
[0198] 因此,現(xiàn)有技術(shù)存在有諸多缺陷,從而導(dǎo)致降噪效果并不理想,而本發(fā)明是針對現(xiàn) 有技術(shù)進(jìn)行的改進(jìn),從而可實現(xiàn)改善語音質(zhì)量的效果。
[0199] 本發(fā)明的技術(shù)方案中提供一種語音降噪方法,如圖6所示,其主旨是,通過一濾波 組件,對一濾波形成的消噪語音信號,以及一濾波形成的參考噪聲信號進(jìn)行頻域轉(zhuǎn)換并濾 波,以濾波輸出、對應(yīng)所述參考噪聲信號的原始噪聲信號、以及對應(yīng)所述消噪語音信號的含 噪語音信號,分別控制形成所述參考噪聲信號的第一抗串?dāng)_濾波單元 gl,以及形成所述消 噪語音信號的第二抗串?dāng)_濾波單元g2進(jìn)行濾波系數(shù)更新。
[0200] 上述技術(shù)方案的主要目的是,通過一濾波組件對一對實施語音降噪的抗串?dāng)_濾波 單元進(jìn)行濾波系數(shù)更新。其中,
[0201] 第一抗串?dāng)_濾波單元gl對含噪語音信號進(jìn)行濾波,以濾除由于串?dāng)_作用進(jìn)入含噪 語音信號的噪音成分,然后通過將濾除噪音成分的語音信號與原始噪聲信號比較,以期獲 得一不含有語音成分的參考噪音信號輸出。
[0202] 第二抗串?dāng)_濾波單元g2對原始噪聲信號進(jìn)行濾波,以濾除由于串?dāng)_作用進(jìn)入原始 噪聲信號的語音成分,然后通過將濾除語音成分的噪音信號與含噪語音信號比較,以期獲 得一不含有噪音成分的消噪語音信號輸出。
[0203] 需要說明的是,上述第一抗串?dāng)_濾波單元與第二抗串?dāng)_濾波單元的具體結(jié)構(gòu)在本 發(fā)明的技術(shù)方案中并不被具體的限定,本領(lǐng)域技術(shù)人員完全可以在不付出創(chuàng)造性勞動的前 提下,以現(xiàn)有的手段,獲得多種可實現(xiàn)上述第一抗串?dāng)_濾波單元與第二抗串?dāng)_濾波單元的 結(jié)構(gòu),因此,不可以下文中為體現(xiàn)上述技術(shù)方案可行性而描述的具體實施例作為對本發(fā)明 保護范圍的限定。
[0204] 濾波組件根據(jù)消噪語音信號,以及參考噪聲信號形成濾波輸出,使濾波組件的濾 波輸出實時的根據(jù)消噪語音信號,以及參考噪聲信號產(chǎn)生變化,從而使第一抗串?dāng)_濾波單 元&與第二抗串?dāng)_濾波單元8 2的濾波系數(shù)可根據(jù)消噪語音信號,以及參考噪聲信號的變化 進(jìn)行更新,從而可實現(xiàn)有效的語音降噪,進(jìn)而提高語音質(zhì)量,同時由于通過一額外的濾波組 件控制第一抗串?dāng)_濾波單元 gl與第二抗串?dāng)_濾波單元g2的濾波系數(shù)進(jìn)行更新,使系統(tǒng)的實 時性要求降低,結(jié)構(gòu)也得到了簡化。
[0205] 于一種較優(yōu)的實施方式中,濾波組件可采用離散傅立葉變換,或離散余弦變換,或 改進(jìn)余弦變換對消噪語音信號進(jìn)行頻域轉(zhuǎn)換得到第一幅度譜;和/或
[0206] 濾波組件可采用離散傅立葉變換,或離散余弦變換,或改進(jìn)余弦變換對參考噪聲 信號進(jìn)行頻域轉(zhuǎn)換得到第二幅度譜。
[0207] 由于離散余弦變換及改進(jìn)余弦變換均為本領(lǐng)域公知的方法,因此不再展開敘述, 以下以離散傅里葉變換來說明上述技術(shù)方案的可行性。
[0208] 于可選的實施方式中,采用離散傅立葉變換得到第一幅度譜的公式為:
[0210] 其中,Eal為第一幅度譜,e Jt)為參考噪聲信號,e為自然對數(shù)的底數(shù),j為虛數(shù)單 位,j = (-l)a5, wana(n)為窗函數(shù),η = 1,2,…M,Μ為頻域分析的時間窗長度。
[0211] 于可選的實施方式中,采用離散傅立葉變換得到第二幅度譜的公式為:
[0213] 其中,Ea2為第二幅度譜,e 2(t)為消噪語音信號,e為自然對數(shù)的底數(shù),j為虛數(shù)單 位,j = (-l)a5, wana(n)為窗函數(shù),η = 1,2,…M,Μ為頻域分析的時間窗長度。
[0214] 在進(jìn)一步的實施方式中,窗函數(shù)wana (η)可采用矩形窗,或者正弦窗,或者漢寧窗, 或者海明窗,或者Tukey窗。由于上述窗函數(shù)均為本領(lǐng)域技術(shù)人員公知的方法,因此不再展 開敘述。
[0215] 在進(jìn)一步的實施方式中,由于Μ的大小對應(yīng)著頻域分析的時間窗長度,并決定頻 域的分辨率,基于頻域分辨率大于100Hz,時間窗小于0. 4秒的要求,因此,Μ的取值范圍可 以是fs/l〇〇/2〈M〈0.4fs,其中f s為采樣頻率。優(yōu)選的,當(dāng)f s= 8000Hz時,可令Μ = 512。
[0216] 于一種較優(yōu)的實施方式中,濾波組件提供一后濾波器,后濾波器為具有Μ點沖激 響應(yīng)的頻域維納濾波器,可通過下式計算頻域維納濾波器的解:
[0218] 其中,G為維納濾波器的解,Psl為消噪語音信號的自功率譜,PnS噪聲的自功率 譜;或者
[0219] 于可選的實施方式中,基于獲取更優(yōu)性能的考慮,Μ點沖激響應(yīng)的頻域維納濾波器 的解也可以通過下式進(jìn)行計算:
[0223] 其中,G為維納濾波器的解,SNR為信噪比,SNRP為先驗信噪比,P sl為消噪語音信 號的自功率譜,匕為噪聲的自功率譜,〇〈(1〈1,優(yōu)選的(1=〇.5。
[0224] 在進(jìn)一步的實施方式中,消噪語音信號的自功率譜Psl通過下式計算:
[0225] Psl[k]t= |Eal[k]t|2,
[0226] 其中,Eal為消噪語音信號經(jīng)頻域轉(zhuǎn)換后獲得的第一幅度譜。
[0227] 噪聲的自功率譜Pn需要通過估計獲得,其估計方法有跟蹤信號頻譜短時最小值, 時間遞歸平均等方法,在進(jìn)一步的實施方式中,可采用G. Doblinger噪聲估計法(見文獻(xiàn) [4])實現(xiàn)噪聲自功率譜Pn&估計,G. Doblinger噪聲估計法為頻譜短時最小值和時間遞歸 平均方法的一種結(jié)合,具體的估計方法見下式:
[0229] 其中,n2, n3為平滑因子,〇〈 n p n2, n3〈i;優(yōu)選的,平滑因子1= 〇. 99, η2= ο. 99, η 3= ο. 8 ;
[0230] Ps為消噪語音信號的自功率譜,或者P s為消噪語音信號的自功率譜與參考噪聲信 號的自功率譜兩者之間的較小值。
[0231] 基于上述實施方式,當(dāng)Ps為消噪語音信號的自功率譜時,P 3可通過下式計算:
[0232] Ps[k]t= |Eal[k]t|2;
[0233] 其中,Eal為消噪語音信號經(jīng)頻域轉(zhuǎn)換后獲得的第一幅度譜。
[0234] 在可選的實施方式中,當(dāng)Ps為消噪語音信號的自功率譜與參考噪聲信號的自功率 譜兩者之間的較小值時,P;^通過下式計算:
[0235] Ps[k]t=min(|Eal[k]t| 2, |Ea2[k]t|2);
[0236] 其中,
[0237] Eal為消噪語音信號經(jīng)頻域轉(zhuǎn)換后獲得的第一幅度譜;
[0238] Ea2為參考噪音信號經(jīng)頻域轉(zhuǎn)換后獲得的第二幅度譜。
[0239] 基于上述技術(shù)方案,在一種可選的實施方式中,可提供一語音激活檢測單元(未 于圖中示出),語音激活檢測單元連接濾波組件;
[0240] 語音激活檢測單元根據(jù)含噪語音信號,或者含噪語音信號和原始噪聲器信號,判 斷是否采集到語音信號,并向濾波組件輸出判斷結(jié)果。
[0241] 進(jìn)一步的,基于語音激活檢測單元的輸出結(jié)果,P;^通過下式計算:
[0243] 其中,VAD為語音激活檢測單元的輸出值,true為采集到語音信號,false為未采 集到語音信號;
[0244] Eal為消噪語音信號經(jīng)頻域轉(zhuǎn)換后獲得的第一幅度譜;
[0245] Ea2為參考噪音信號經(jīng)頻域轉(zhuǎn)換后獲得的第二幅度譜;
[0246] β為控制因子,1〈β〈5,優(yōu)選的,β = 2。
[0247] 于一種優(yōu)選的實施方式中,如圖7所示,濾波組件可提供一第一自適應(yīng)濾波器gl, 及一第二自適應(yīng)濾波器gi ;
[0248] 第一自適應(yīng)濾波器gi.根據(jù)頻域維納濾波器的解G、參考噪聲信號以及含噪語音信 號計算第一抗串?dāng)_濾波單元的濾波系數(shù)更新項.并通過濾波系數(shù)更新項&>更新第一抗 串?dāng)_濾波單元的濾波系數(shù)glit;
[0249] 第二自適應(yīng)濾波器:g2根據(jù)頻域維納濾波器的解G、消噪語音信號以及噪聲信號, 計算第二抗串?dāng)_濾波單元的濾波系數(shù)更新項§&,并采用濾波系數(shù)更新項:更新第二抗串 擾濾波單元的濾波系數(shù)g2it。
[0250] 于一種優(yōu)選的實施方式中,第一抗串?dāng)_濾波單元通過下式更新濾波系數(shù)glit:
[0252] 于進(jìn)一步的實施方式中第二抗串?dāng)_濾波單元通過下式更新濾波系數(shù)g2it:
[0254] 濾波系數(shù)更新項須由自適應(yīng)濾波器計算得到。由于語音能量大的頻段對 應(yīng)著后濾波器G的值較大的頻段,第一抗串?dāng)_濾波單元&及第二抗串?dāng)_濾波單元8 2可以通 過后濾波器G來控制更新權(quán)重,使第一抗串?dāng)_濾波單元gl的濾波系數(shù)更新項提高語音能 量大的頻段的更新權(quán)重,從而使第一抗串?dāng)_濾波單元 gl可有效的濾除含噪語音信號中的噪 音成分;同時使第二抗串?dāng)_濾波單元g2的濾波系數(shù)更新項g 2>i降低語音能量大的頻段的更 新權(quán)重,從而使第二抗串?dāng)_濾波單元&可有效的濾除原始噪聲信號中的語音成分。
[0255] 濾波系數(shù)更新項的算法包括最小均方算法(LMS)、歸一化最小均方算法(NLMS)、 最小二乘算法(RLS)、仿射投影算法(AP)見文獻(xiàn)[5]、快速仿射投影算法(FAP)見文獻(xiàn)[6]、 塊最小均方算法(BLMS)見文獻(xiàn)[7-8]、頻域最小均方算法(FDAF)見文獻(xiàn)[9]、加窗頻域最 小均方算法(WDAF)見文獻(xiàn)[10]等多種,由于上述更新算法均為本領(lǐng)域公知的方法,因此 不再贅述?;陬l域維納濾波器控制便利的考慮,可選擇頻域算法作為濾波系數(shù)更新項的 算法,當(dāng)然也不排除在增加控制元素的基礎(chǔ)上采用其他類型算法作為濾波系數(shù)更新項的算 法。
[0256] 于一種優(yōu)選的實施方式中,第一自適應(yīng)濾波器可通過頻域最小均方算法計算第一 抗串?dāng)_濾波單元的濾波系數(shù)更新項,具體算式如下:
[0257]
[0258] 其中,G1=Ga;
[0259] λ為大于〇的非線性控制因子,優(yōu)選的,λ = 1 ;
[0260] μ為更新步長,且0 < μ < 2, μ取值過大則穩(wěn)定性較差,μ取值過小則更新太 慢,優(yōu)選的,μ = 〇. 5 ;
[0261] ε為防止除零錯誤的微小正數(shù);
[0262] ?為點乘符號;
[0263] 上標(biāo)*為共軛操作;
[0264] 下標(biāo)Ν X Ν表示矩陣為Ν行Ν列;
[0265] 下標(biāo)NX (M-Ν)表示矩陣為Ν行M-Ν列;
[0266] t為含噪語音信號s i⑴的Μ點傅立葉變換;
[0267] E2, t為參考噪聲信號e 2⑴的Μ點傅立葉變換;
[0268] F-為反傅立葉變換矩陣;
[0269] E[|Slitr]為|Slit|2在t時刻的短期數(shù)學(xué)期望。
[0270] 于上述技術(shù)方案基礎(chǔ)上,進(jìn)一步的,Sut通過下式計算:
[0271 ] Sl t= F[s ! (t-M+1), Sj (t~M+2), ···, Sj (t) ]T,
[0272] 其中,上標(biāo)T為轉(zhuǎn)置操作;和/或
[0273] E2,t通過下式計算:
[0274] E2, t= F {[0, 0,…,0] 1XN [e2 (t- (M-N) +1),e2 (t- (M-N) +2),…,e2 (t) ]}τ,
[0275] 其中,上標(biāo)T為轉(zhuǎn)置操作;和/或<