用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法
【專利摘要】本發(fā)明公開一種用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法,包括如下步驟:對(duì)目標(biāo)信號(hào)利用窗函數(shù)分成相互疊加的幀并對(duì)每幀進(jìn)行短時(shí)傅立葉變換,得到目標(biāo)信號(hào)的頻域表示:Y(k,l)=X(k,l)+D(k,l);將所述目標(biāo)信號(hào)根據(jù)語(yǔ)音出現(xiàn)與否劃分為語(yǔ)音出現(xiàn)狀態(tài)H1(k,l)和語(yǔ)音缺失狀態(tài)H0(k,l),并按照如下公式分別估計(jì)噪聲上述方法中,引入了殘差噪聲In(k,l),殘差噪聲In(k,l)的本質(zhì)是在噪聲估計(jì)算法中引入反饋機(jī)制對(duì)估計(jì)的噪聲進(jìn)行自適應(yīng)調(diào)節(jié),因此解決了在語(yǔ)音出現(xiàn)狀態(tài)下的噪聲估計(jì)不準(zhǔn)確的問題。
【專利說(shuō)明】用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音增強(qiáng)處理【技術(shù)領(lǐng)域】,特別是涉及一種用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法。
【背景技術(shù)】
[0002]在語(yǔ)音增強(qiáng)處理的過程中,比較關(guān)鍵的一步就是對(duì)背景噪聲的估計(jì)。噪聲估計(jì)過高,在濾除噪聲時(shí)微弱語(yǔ)音將被去掉,使得經(jīng)過增強(qiáng)處理的語(yǔ)音產(chǎn)生大的失真;而噪聲估計(jì)過低,在濾除噪聲后會(huì)殘留過多的背景噪聲。當(dāng)背景噪聲為平穩(wěn)噪聲時(shí),通過對(duì)靜音段的噪聲功率譜取均值可得噪聲的估計(jì)值。當(dāng)背景噪聲為非平穩(wěn)噪聲時(shí),由于噪聲隨時(shí)間快速變化,噪聲的估計(jì)就比較困難,要克服這個(gè)問題,需要對(duì)噪聲進(jìn)行連續(xù)跟蹤與修正。
[0003]傳統(tǒng)的噪聲估計(jì)法是基于語(yǔ)音活動(dòng)檢測(cè)(Voice Activity Detector, VAD)的噪聲估計(jì)方法。該方法在信噪比較高的情況下可以得到較好的噪聲估計(jì),但是在低信噪比的情況下,對(duì)語(yǔ)音信號(hào)的檢測(cè)變得比較難,VAD的誤檢率很高,噪聲估計(jì)不準(zhǔn)確。
[0004]實(shí)際噪聲通常是非平穩(wěn)的,在語(yǔ)音存在期間噪聲也可能發(fā)生變化,要想取得好的語(yǔ)音增強(qiáng)效果,就必須隨時(shí)跟蹤噪聲的變化,及時(shí)更新噪聲估計(jì)。Doblinger通過比較前幀帶噪語(yǔ)音子帶平滑功率譜最小值和后幀帶噪語(yǔ)音子帶平滑功率譜之間大小,對(duì)帶噪語(yǔ)音子帶平滑功率譜最小值每幀進(jìn)行追蹤和更新,并將其作為估計(jì)的噪聲譜,該噪聲譜估計(jì)方法計(jì)算效率高,能快速適應(yīng)背景噪聲的變化,但它直接把帶噪語(yǔ)音子帶平滑功率譜最小值作為估計(jì)的噪聲譜,使得估計(jì)的噪聲譜準(zhǔn)確度不高,同時(shí)它會(huì)將帶噪語(yǔ)音中語(yǔ)音電平的突然上升當(dāng)作噪聲電平突變的情況來(lái)處理,造成噪聲的過估計(jì)。
[0005]Martin提出了基于最優(yōu)平滑和最小統(tǒng)計(jì)的噪聲估計(jì)算法,它依據(jù)帶噪語(yǔ)音能量可以衰減到噪聲能量級(jí)的思想,通過對(duì)平滑后的帶噪語(yǔ)音的短時(shí)功率譜取最小值來(lái)獲得噪聲功率估計(jì)。然而,該方法在估計(jì)噪聲時(shí),當(dāng)搜索窗較小時(shí)會(huì)削弱語(yǔ)音能量,當(dāng)搜索窗太大時(shí),其噪聲估計(jì)更新較慢難以實(shí)時(shí)估計(jì)噪聲。
[0006]Israel Cohen 提出 了改進(jìn)的最小受控遞歸平均(Improved Minima ControlledRecursive Average, IMCRA)噪聲估計(jì)法,其可以進(jìn)行連續(xù)的噪聲估計(jì)。算法使用一個(gè)時(shí)變頻率依賴的平滑因子對(duì)過去信號(hào)幀的功率譜進(jìn)行平均后估計(jì)噪聲,該平滑因子依據(jù)語(yǔ)音信號(hào)存在概率調(diào)整。語(yǔ)音出現(xiàn)概率的估計(jì)基于高斯統(tǒng)計(jì)模型,但受平滑周期圖的最小值控制控制。該算法包括兩次平滑和最小值跟蹤過程。第一次平滑過程對(duì)每個(gè)頻帶語(yǔ)音出現(xiàn)情況做粗略的估計(jì),然后在第二次平滑過程中通過最小值跟蹤剔除強(qiáng)語(yǔ)音分量,對(duì)噪聲譜進(jìn)行平滑。但是,現(xiàn)有的IMCRA噪聲估計(jì)方法是在語(yǔ)音缺失段對(duì)噪聲進(jìn)行遞歸平滑而在語(yǔ)音段則對(duì)噪聲的估計(jì)保持不變。然而,在實(shí)際情況中,噪聲通常是非平穩(wěn)的,即使在語(yǔ)音信號(hào)存在期間,噪聲也可能會(huì)發(fā)生變化。
【發(fā)明內(nèi)容】
[0007]基于此,有必要提供一種能夠?qū)崟r(shí)跟蹤帶噪語(yǔ)音中的噪聲變化的背景噪聲估計(jì)方法。
[0008]一種語(yǔ)音噪聲估計(jì)方法,包括如下步驟:
[0009]對(duì)目標(biāo)信號(hào)利用窗函數(shù)分成相互疊加的幀并對(duì)每幀進(jìn)行短時(shí)傅立葉變換,得到目標(biāo)信號(hào)的頻域表示:Y(k,l)=X(k, 1)+D(k, I);其中Y(k,I)是帶噪語(yǔ)音信號(hào)進(jìn)行快速傅立葉變換變換后的頻譜,X(k,I)是純語(yǔ)音信號(hào)進(jìn)行快速傅立葉變換變換后的頻譜,D(k,I)是與語(yǔ)音信號(hào)無(wú)關(guān)的加性噪聲進(jìn)行快速傅立葉變換變換后的頻譜4表示頻譜序號(hào),I表示幀序號(hào);
[0010]將所述目標(biāo)信號(hào)根據(jù)語(yǔ)音出現(xiàn)與否劃分為語(yǔ)音出現(xiàn)狀態(tài)H1 (k,I)和語(yǔ)音缺失狀態(tài)Htl (k,I),并按照如下公式估計(jì)噪聲:
【權(quán)利要求】
1.一種用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法,包括如下步驟: 對(duì)目標(biāo)信號(hào)利用窗函數(shù)分成相互疊加的幀并對(duì)每幀進(jìn)行短時(shí)傅立葉變換,得到目標(biāo)信號(hào)的頻域表示:Y(k,l)=X(k, 1)+D(k, I);其中Y(k,I)是帶噪語(yǔ)音信號(hào)進(jìn)行快速傅立葉變換變換后的頻譜,x(k,I)是純語(yǔ)音信號(hào)進(jìn)行快速傅立葉變換后的頻譜,D(k,I)是與語(yǔ)音信號(hào)無(wú)關(guān)的加性噪聲進(jìn)行快速傅立葉變換后的頻譜4表示頻譜序號(hào),I表示幀序號(hào); 將所述目標(biāo)信號(hào)根據(jù)語(yǔ)音出現(xiàn)與否劃分為語(yǔ)音出現(xiàn)狀態(tài)H1 (k,I)和語(yǔ)音缺失狀態(tài)Htl (k,I),并按照如下公式估計(jì)噪聲:
2.根據(jù)權(quán)利要求1所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法,其特征在于,所述短時(shí)傅立葉變換基于假定變換系數(shù)為復(fù)高斯分布的前提下。
3.根據(jù)權(quán)利要求2所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法,其特征在于,進(jìn)一步包括: 利用條件語(yǔ)音出現(xiàn)概率對(duì)噪聲估計(jì)進(jìn)行遞歸平均得到:
4.根據(jù)權(quán)利要求3所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法,其特征在于,進(jìn)一步地,
5.根據(jù)權(quán)利要求3所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法,其特征在于,進(jìn)一步對(duì)噪聲估計(jì)進(jìn)行偏差補(bǔ)償: 其中β為補(bǔ)償因子,其定義為:
6.根據(jù)權(quán)利要求1所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法,其特征在于,進(jìn)一步包括最小受控估計(jì)的步驟,所述最小受控估計(jì)的步驟用于估計(jì)先驗(yàn)語(yǔ)音不存在概率q (k, I),且 P (k, I) +q (k, I) =1。
7.根據(jù)權(quán)利要求1所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法,其特征在于,所述噪聲估計(jì)方法基于采用維納濾波法的語(yǔ)音增強(qiáng)系統(tǒng),所述譜增益函數(shù)G(k,I)為:
8.根據(jù)權(quán)利要求1所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法,其特征在于,所述噪聲估計(jì)方法基于采用譜減法的語(yǔ)音增強(qiáng)系統(tǒng),所述譜增益函數(shù)G (k,I)為:
9.根據(jù)權(quán)利要求1所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法,其特征在于,所述噪聲估計(jì)方法基于采用MMSE-LSA估計(jì)法的語(yǔ)音增強(qiáng)系統(tǒng),所述譜增益函數(shù)G (k,I)為:
【文檔編號(hào)】G10L21/0216GK103559887SQ201310538432
【公開日】2014年2月5日 申請(qǐng)日期:2013年11月4日 優(yōu)先權(quán)日:2013年11月4日
【發(fā)明者】張勇, 劉軼 申請(qǐng)人:深港產(chǎn)學(xué)研基地