一種用于語音信號增強的譜減法
【技術(shù)領域】
[0001] 本發(fā)明的技術(shù)方案涉及語音增強技術(shù)領域,具體地說是一種用于語音信號增強的 譜減法。
【背景技術(shù)】
[0002] 語音信號無法避免地會受到來自周遭環(huán)境和傳輸媒介帶來的噪聲,通信設備內(nèi)部 的電噪聲,甚至說話人自身的干擾。所以,必須在語音信號應用系統(tǒng)前端加入語音增強環(huán) 節(jié),對信號進行去噪預處理,從而增強系統(tǒng)的抗干擾能力。
[0003] 語音增強技術(shù)是語音信號處理中的核心技術(shù)之一。語音增強,就是通過消除背景 噪聲從而提高信噪比,進而可以提高語音信號的清晰度、可懂度以及舒適度。
[0004] 語音增強的目的是提高語音質(zhì)量,這就需要在降噪和語音失真之間找到一個最好 的權(quán)衡點。許多學者提出了語音增強的方法。EMD算法是把信號分解為基本模式分量之和, 當滿足終止條件時,分解結(jié)束,達到了一定的增強效果。但是由于MF定義十分嚴格,導致 分解次數(shù)增多從而分解復雜度大幅度提升。2013年,HadiVeisi和HosseinSameti將HMM 應用在Mel頻域來增強語音,提出了平行的倒譜和譜模型來改善語音從頻域到Mel頻域引 起的失真,該方法對非平穩(wěn)噪聲干擾下的語音增強效果很好,但是該方法復雜度較高。
[0005] 在語音增強領域,基本譜減法是一經(jīng)典方法,計算量小,容易實現(xiàn)且便于實時處 理?;咀V減法最初由美國學者StevenBoll于提出,主要思想是利用人耳對于信號相位 的不敏感特點,用帶噪語音的相位代替純凈語音相位。通過用帶噪語音信號的頻譜減去噪 聲的頻譜,將兩者相減的結(jié)果當成是增強后的信號頻譜,然后與帶噪語音信號的相位結(jié)合, 最終得到增強后的信號。基本原理如下:
【主權(quán)項】
1. 一種用于語音信號增強的譜減法,其特征在于步驟如下: 第一步,被減項加權(quán)值處理: 在進行噪聲譜相減時,減去eIAn(?)I2, 0 > 1,經(jīng)過如此被減項加權(quán)值處理得到改 進后的譜減法公式如下:
其中,i(w)代表增強后語音信號,Y(?)代表帶噪語音信號,An(?)代表噪聲段的統(tǒng) 計平均值,0代表譜減噪聲系數(shù),0>1 ; 第二步,功率譜修正處理: 結(jié)合功率譜減法中頻譜的平方計算與幅度譜減法中頻譜的一次方計算,將其改進為由 系數(shù)靈活控制的卜r以及I?r/ci,經(jīng)過如此功率譜修正處理得出修正后的功率譜為:
其中,代表增強后語音信號,y(?)代表帶噪語音信號,An(?)代表噪聲段的統(tǒng) 計平均值,a代表譜減功率修正系數(shù); 第三步,得出基于修正參數(shù)的改進譜減法公式: 結(jié)合以上第一步的被減項加權(quán)值處理和第二步的功率譜修正處理方法,得出基于修正 參數(shù)的改進譜減法公式如下:
其中,i(叫代表增強后語音信號,Y(?)代表帶噪語音信號,An(?)代表噪聲段的統(tǒng) 計平均值,a表示譜減功率修正系數(shù),0代表譜減噪聲系數(shù); 第四步,自動控制最優(yōu)參數(shù)選擇: 在不同的帶噪信號輸入信噪比SN&條件下,首先以增強后語音信號的信噪比SNR。為 輸出,以變化的譜減功率修正系數(shù)a和譜減噪聲系數(shù)0為輸入,改變輸入?yún)?shù)值,自動控 制選擇使得輸出達到增強后語音信號的信噪比的最優(yōu)值SNR&時的輸入最優(yōu)參數(shù)為a0口 0B,并且將選擇的最優(yōu)參數(shù)%和0B與此時的帶噪語音輸入信噪比SNRi相匹配,應用時, 則通過計算帶噪信號的輸入信噪比SNRp控制語音增強系統(tǒng)中最優(yōu)參數(shù)a 0 "勺選擇, 自動控制最優(yōu)參數(shù)選擇的系統(tǒng)公式如下:
其中,a,表示最優(yōu)譜減功率修正系數(shù),0B表示最優(yōu)譜減噪聲系數(shù),SNRi表示與最優(yōu)參 數(shù)匹配的輸入信噪比,SNR。表示增強后的輸出信噪比; 第五步,平滑處理: 通過對比原始語音波形,帶噪語音波形以及增強語音波形,發(fā)現(xiàn)增強語音波形雖然已 經(jīng)十分接近純凈語音波形,進一步通過對增強后的語音進行時域內(nèi)的平滑處理,選取五點 三次的平滑處理方法如下: 五點三次平滑處理結(jié)合所求點周圍采樣點的幅度值對所求點幅度進行加權(quán)修正,最終 實現(xiàn)信號波形的平滑去噪,平滑處理公式表示:
式中,y表示平滑處理后數(shù)據(jù),X表示原采樣數(shù)據(jù),m表示數(shù)據(jù)點數(shù),N表示平均的點數(shù),h表不權(quán)值因子,其中加權(quán)平均因子滿足:
五點三次的平滑處理方法是通過運用最小二乘法原理對采樣數(shù)據(jù)進行三次最小二乘 金T市才求碑從不田占二'/A求、、碼、、/土的/入:^finTC?
式中:i= 3,4,…,m-2, 通過上述對增強后的語音進行時域內(nèi)的平滑處理,使得增強后的語音與純凈語音具有 更進一步的相似性; 上述步驟中所用到的硬件設備包括供電設備、麥克風、數(shù)據(jù)采集卡和PC上位機。
2.根據(jù)權(quán)利要求1所述一種用于語音信號增強的譜減法,其特征在于:所述以增強后 語音信號的信噪比SNR。為輸出,以變化的譜減功率修正系數(shù)a和譜減噪聲系數(shù)0為輸入, 改變輸入?yún)?shù)值,自動控制選擇使得輸出達到增強后語音信號的信噪比的最優(yōu)值SNR^t 的輸入最優(yōu)參數(shù)為%和B的過程,是通過繪制輸出信噪比SNR。、譜減功率修正系數(shù)a和 譜減噪聲系數(shù)0的三維曲線圖,從中尋找最大值的坐標值實現(xiàn)的,具體方法如下: 帶噪信輸入信噪比3順1取值范圍-15dB_20dB,當譜減功率修正系數(shù)a和譜減噪聲系 數(shù)0變化時,增強后語音信號的信噪比SNR。隨之變化,其中,x軸、y軸和z軸分別代表譜 減功率修正系數(shù)a、譜減噪聲系數(shù)0以及增強后的輸出信噪比SNR。,由所作的三維曲線圖 可得,當a和0變化時,存在一組a# 0 B,使得SNR。取得最大值SNR&,此€^和0JP 為最優(yōu)參數(shù)。
【專利摘要】本發(fā)明一種用于語音信號增強的譜減法,涉及語音增強技術(shù)領域,步驟是:被減項加權(quán)值處理;功率譜修正處理;得出基于修正參數(shù)的改進譜減法公式;自動控制最優(yōu)參數(shù)選擇;平滑處理。本發(fā)明是一種基于參數(shù)自適應的改進譜減法,克服了采用現(xiàn)有的譜減法增強處理后的信號會殘留比較多的噪聲的缺陷。
【IPC分類】G10L21-02, G10L21-0232
【公開號】CN104810023
【申請?zhí)枴緾N201510268387
【發(fā)明人】孫昊, 齊立萍, 楊鵬, 陳萌, 王碩朋, 王月英
【申請人】河北工業(yè)大學
【公開日】2015年7月29日
【申請日】2015年5月25日