用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法

文檔序號(hào)：2826391閱讀：201來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法
【專利摘要】本發(fā)明公開一種用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法，包括如下步驟：對(duì)目標(biāo)信號(hào)利用窗函數(shù)分成相互疊加的幀并對(duì)每幀進(jìn)行短時(shí)傅立葉變換，得到目標(biāo)信號(hào)的頻域表示：Y(k,l)=X(k,l)+D(k,l)；將所述目標(biāo)信號(hào)根據(jù)語(yǔ)音出現(xiàn)與否劃分為語(yǔ)音出現(xiàn)狀態(tài)H1(k,l)和語(yǔ)音缺失狀態(tài)H0(k,l)，并按照如下公式分別估計(jì)噪聲上述方法中，引入了殘差噪聲In(k,l)，殘差噪聲In(k,l)的本質(zhì)是在噪聲估計(jì)算法中引入反饋機(jī)制對(duì)估計(jì)的噪聲進(jìn)行自適應(yīng)調(diào)節(jié)，因此解決了在語(yǔ)音出現(xiàn)狀態(tài)下的噪聲估計(jì)不準(zhǔn)確的問題。
【專利說(shuō)明】用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及語(yǔ)音增強(qiáng)處理【技術(shù)領(lǐng)域】，特別是涉及一種用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法。
【背景技術(shù)】
[0002]在語(yǔ)音增強(qiáng)處理的過程中，比較關(guān)鍵的一步就是對(duì)背景噪聲的估計(jì)。噪聲估計(jì)過高，在濾除噪聲時(shí)微弱語(yǔ)音將被去掉，使得經(jīng)過增強(qiáng)處理的語(yǔ)音產(chǎn)生大的失真；而噪聲估計(jì)過低，在濾除噪聲后會(huì)殘留過多的背景噪聲。當(dāng)背景噪聲為平穩(wěn)噪聲時(shí)，通過對(duì)靜音段的噪聲功率譜取均值可得噪聲的估計(jì)值。當(dāng)背景噪聲為非平穩(wěn)噪聲時(shí)，由于噪聲隨時(shí)間快速變化，噪聲的估計(jì)就比較困難，要克服這個(gè)問題，需要對(duì)噪聲進(jìn)行連續(xù)跟蹤與修正。
[0003]傳統(tǒng)的噪聲估計(jì)法是基于語(yǔ)音活動(dòng)檢測(cè)(Voice Activity Detector, VAD)的噪聲估計(jì)方法。該方法在信噪比較高的情況下可以得到較好的噪聲估計(jì)，但是在低信噪比的情況下，對(duì)語(yǔ)音信號(hào)的檢測(cè)變得比較難，VAD的誤檢率很高，噪聲估計(jì)不準(zhǔn)確。
[0004]實(shí)際噪聲通常是非平穩(wěn)的，在語(yǔ)音存在期間噪聲也可能發(fā)生變化，要想取得好的語(yǔ)音增強(qiáng)效果，就必須隨時(shí)跟蹤噪聲的變化，及時(shí)更新噪聲估計(jì)。Doblinger通過比較前幀帶噪語(yǔ)音子帶平滑功率譜最小值和后幀帶噪語(yǔ)音子帶平滑功率譜之間大小，對(duì)帶噪語(yǔ)音子帶平滑功率譜最小值每幀進(jìn)行追蹤和更新，并將其作為估計(jì)的噪聲譜，該噪聲譜估計(jì)方法計(jì)算效率高，能快速適應(yīng)背景噪聲的變化，但它直接把帶噪語(yǔ)音子帶平滑功率譜最小值作為估計(jì)的噪聲譜，使得估計(jì)的噪聲譜準(zhǔn)確度不高，同時(shí)它會(huì)將帶噪語(yǔ)音中語(yǔ)音電平的突然上升當(dāng)作噪聲電平突變的情況來(lái)處理，造成噪聲的過估計(jì)。
[0005]Martin提出了基于最優(yōu)平滑和最小統(tǒng)計(jì)的噪聲估計(jì)算法，它依據(jù)帶噪語(yǔ)音能量可以衰減到噪聲能量級(jí)的思想，通過對(duì)平滑后的帶噪語(yǔ)音的短時(shí)功率譜取最小值來(lái)獲得噪聲功率估計(jì)。然而，該方法在估計(jì)噪聲時(shí)，當(dāng)搜索窗較小時(shí)會(huì)削弱語(yǔ)音能量，當(dāng)搜索窗太大時(shí)，其噪聲估計(jì)更新較慢難以實(shí)時(shí)估計(jì)噪聲。
[0006]Israel Cohen 提出了改進(jìn)的最小受控遞歸平均(Improved Minima ControlledRecursive Average, IMCRA)噪聲估計(jì)法,其可以進(jìn)行連續(xù)的噪聲估計(jì)。算法使用一個(gè)時(shí)變頻率依賴的平滑因子對(duì)過去信號(hào)幀的功率譜進(jìn)行平均后估計(jì)噪聲，該平滑因子依據(jù)語(yǔ)音信號(hào)存在概率調(diào)整。語(yǔ)音出現(xiàn)概率的估計(jì)基于高斯統(tǒng)計(jì)模型，但受平滑周期圖的最小值控制控制。該算法包括兩次平滑和最小值跟蹤過程。第一次平滑過程對(duì)每個(gè)頻帶語(yǔ)音出現(xiàn)情況做粗略的估計(jì)，然后在第二次平滑過程中通過最小值跟蹤剔除強(qiáng)語(yǔ)音分量，對(duì)噪聲譜進(jìn)行平滑。但是，現(xiàn)有的IMCRA噪聲估計(jì)方法是在語(yǔ)音缺失段對(duì)噪聲進(jìn)行遞歸平滑而在語(yǔ)音段則對(duì)噪聲的估計(jì)保持不變。然而，在實(shí)際情況中，噪聲通常是非平穩(wěn)的，即使在語(yǔ)音信號(hào)存在期間，噪聲也可能會(huì)發(fā)生變化。

【發(fā)明內(nèi)容】

[0007]基于此，有必要提供一種能夠?qū)崟r(shí)跟蹤帶噪語(yǔ)音中的噪聲變化的背景噪聲估計(jì)方法。
[0008]一種語(yǔ)音噪聲估計(jì)方法，包括如下步驟:
[0009]對(duì)目標(biāo)信號(hào)利用窗函數(shù)分成相互疊加的幀并對(duì)每幀進(jìn)行短時(shí)傅立葉變換，得到目標(biāo)信號(hào)的頻域表示:Y(k，l)=X(k, 1)+D(k, I);其中Y(k，I)是帶噪語(yǔ)音信號(hào)進(jìn)行快速傅立葉變換變換后的頻譜，X(k，I)是純語(yǔ)音信號(hào)進(jìn)行快速傅立葉變換變換后的頻譜，D(k，I)是與語(yǔ)音信號(hào)無(wú)關(guān)的加性噪聲進(jìn)行快速傅立葉變換變換后的頻譜4表示頻譜序號(hào)，I表示幀序號(hào);
[0010]將所述目標(biāo)信號(hào)根據(jù)語(yǔ)音出現(xiàn)與否劃分為語(yǔ)音出現(xiàn)狀態(tài)H1 (k，I)和語(yǔ)音缺失狀態(tài)Htl (k，I)，并按照如下公式估計(jì)噪聲:
【權(quán)利要求】
1.一種用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法，包括如下步驟: 對(duì)目標(biāo)信號(hào)利用窗函數(shù)分成相互疊加的幀并對(duì)每幀進(jìn)行短時(shí)傅立葉變換，得到目標(biāo)信號(hào)的頻域表示:Y(k，l)=X(k, 1)+D(k, I);其中Y(k，I)是帶噪語(yǔ)音信號(hào)進(jìn)行快速傅立葉變換變換后的頻譜，x(k，I)是純語(yǔ)音信號(hào)進(jìn)行快速傅立葉變換后的頻譜，D(k，I)是與語(yǔ)音信號(hào)無(wú)關(guān)的加性噪聲進(jìn)行快速傅立葉變換后的頻譜4表示頻譜序號(hào)，I表示幀序號(hào)；將所述目標(biāo)信號(hào)根據(jù)語(yǔ)音出現(xiàn)與否劃分為語(yǔ)音出現(xiàn)狀態(tài)H1 (k，I)和語(yǔ)音缺失狀態(tài)Htl (k，I)，并按照如下公式估計(jì)噪聲:
2.根據(jù)權(quán)利要求1所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法，其特征在于，所述短時(shí)傅立葉變換基于假定變換系數(shù)為復(fù)高斯分布的前提下。
3.根據(jù)權(quán)利要求2所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法，其特征在于，進(jìn)一步包括: 利用條件語(yǔ)音出現(xiàn)概率對(duì)噪聲估計(jì)進(jìn)行遞歸平均得到:
4.根據(jù)權(quán)利要求3所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法，其特征在于，進(jìn)一步地，
5.根據(jù)權(quán)利要求3所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法，其特征在于，進(jìn)一步對(duì)噪聲估計(jì)進(jìn)行偏差補(bǔ)償: 其中β為補(bǔ)償因子，其定義為:
6.根據(jù)權(quán)利要求1所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法，其特征在于，進(jìn)一步包括最小受控估計(jì)的步驟，所述最小受控估計(jì)的步驟用于估計(jì)先驗(yàn)語(yǔ)音不存在概率q (k, I),且 P (k, I) +q (k, I) =1。
7.根據(jù)權(quán)利要求1所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法，其特征在于，所述噪聲估計(jì)方法基于采用維納濾波法的語(yǔ)音增強(qiáng)系統(tǒng)，所述譜增益函數(shù)G(k，I)為:

8.根據(jù)權(quán)利要求1所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法，其特征在于，所述噪聲估計(jì)方法基于采用譜減法的語(yǔ)音增強(qiáng)系統(tǒng)，所述譜增益函數(shù)G (k，I)為:

9.根據(jù)權(quán)利要求1所述的用于語(yǔ)音增強(qiáng)系統(tǒng)的背景噪聲估計(jì)方法，其特征在于，所述噪聲估計(jì)方法基于采用MMSE-LSA估計(jì)法的語(yǔ)音增強(qiáng)系統(tǒng)，所述譜增益函數(shù)G (k，I)為:
【文檔編號(hào)】G10L21/0216GK103559887SQ201310538432
【公開日】2014年2月5日申請(qǐng)日期:2013年11月4日優(yōu)先權(quán)日:2013年11月4日
【發(fā)明者】張勇, 劉軼申請(qǐng)人:深港產(chǎn)學(xué)研基地

完整全部詳細(xì)技術(shù)資料下載