一種用于語音信號增強的譜減法

文檔序號：8488606閱讀：533來源：國知局

一種用于語音信號增強的譜減法
【技術(shù)領域】
[0001] 本發(fā)明的技術(shù)方案涉及語音增強技術(shù)領域，具體地說是一種用于語音信號增強的譜減法。
【背景技術(shù)】
[0002] 語音信號無法避免地會受到來自周遭環(huán)境和傳輸媒介帶來的噪聲，通信設備內(nèi)部的電噪聲，甚至說話人自身的干擾。所以，必須在語音信號應用系統(tǒng)前端加入語音增強環(huán) 節(jié)，對信號進行去噪預處理，從而增強系統(tǒng)的抗干擾能力。
[0003] 語音增強技術(shù)是語音信號處理中的核心技術(shù)之一。語音增強，就是通過消除背景噪聲從而提高信噪比，進而可以提高語音信號的清晰度、可懂度以及舒適度。
[0004] 語音增強的目的是提高語音質(zhì)量，這就需要在降噪和語音失真之間找到一個最好的權(quán)衡點。許多學者提出了語音增強的方法。EMD算法是把信號分解為基本模式分量之和，當滿足終止條件時，分解結(jié)束，達到了一定的增強效果。但是由于MF定義十分嚴格，導致分解次數(shù)增多從而分解復雜度大幅度提升。2013年，HadiVeisi和HosseinSameti將HMM 應用在Mel頻域來增強語音，提出了平行的倒譜和譜模型來改善語音從頻域到Mel頻域引起的失真，該方法對非平穩(wěn)噪聲干擾下的語音增強效果很好，但是該方法復雜度較高。
[0005] 在語音增強領域，基本譜減法是一經(jīng)典方法，計算量小，容易實現(xiàn)且便于實時處理?；咀V減法最初由美國學者StevenBoll于提出，主要思想是利用人耳對于信號相位的不敏感特點，用帶噪語音的相位代替純凈語音相位。通過用帶噪語音信號的頻譜減去噪聲的頻譜，將兩者相減的結(jié)果當成是增強后的信號頻譜，然后與帶噪語音信號的相位結(jié)合，最終得到增強后的信號。基本原理如下：
【主權(quán)項】
1. 一種用于語音信號增強的譜減法，其特征在于步驟如下：第一步，被減項加權(quán)值處理：在進行噪聲譜相減時，減去eIAn(?)I2, 0 > 1，經(jīng)過如此被減項加權(quán)值處理得到改進后的譜減法公式如下：
其中，i(w)代表增強后語音信號，Y(?)代表帶噪語音信號，An(?)代表噪聲段的統(tǒng) 計平均值，0代表譜減噪聲系數(shù)，0>1 ; 第二步，功率譜修正處理：結(jié)合功率譜減法中頻譜的平方計算與幅度譜減法中頻譜的一次方計算，將其改進為由系數(shù)靈活控制的卜r以及I?r/ci，經(jīng)過如此功率譜修正處理得出修正后的功率譜為：
其中，代表增強后語音信號，y(?)代表帶噪語音信號，An(?)代表噪聲段的統(tǒng) 計平均值，a代表譜減功率修正系數(shù)；第三步，得出基于修正參數(shù)的改進譜減法公式：結(jié)合以上第一步的被減項加權(quán)值處理和第二步的功率譜修正處理方法，得出基于修正參數(shù)的改進譜減法公式如下：
其中，i(叫代表增強后語音信號，Y(?)代表帶噪語音信號，An(?)代表噪聲段的統(tǒng) 計平均值，a表示譜減功率修正系數(shù)，0代表譜減噪聲系數(shù)；第四步，自動控制最優(yōu)參數(shù)選擇：在不同的帶噪信號輸入信噪比SN&條件下，首先以增強后語音信號的信噪比SNR。為輸出，以變化的譜減功率修正系數(shù)a和譜減噪聲系數(shù)0為輸入，改變輸入?yún)?shù)值，自動控制選擇使得輸出達到增強后語音信號的信噪比的最優(yōu)值SNR&時的輸入最優(yōu)參數(shù)為a0口 0B，并且將選擇的最優(yōu)參數(shù)％和0B與此時的帶噪語音輸入信噪比SNRi相匹配，應用時，則通過計算帶噪信號的輸入信噪比SNRp控制語音增強系統(tǒng)中最優(yōu)參數(shù)a 0 "勺選擇，自動控制最優(yōu)參數(shù)選擇的系統(tǒng)公式如下：
其中，a,表示最優(yōu)譜減功率修正系數(shù)，0B表示最優(yōu)譜減噪聲系數(shù)，SNRi表示與最優(yōu)參數(shù)匹配的輸入信噪比，SNR。表示增強后的輸出信噪比；第五步，平滑處理：通過對比原始語音波形，帶噪語音波形以及增強語音波形，發(fā)現(xiàn)增強語音波形雖然已經(jīng)十分接近純凈語音波形，進一步通過對增強后的語音進行時域內(nèi)的平滑處理，選取五點三次的平滑處理方法如下：五點三次平滑處理結(jié)合所求點周圍采樣點的幅度值對所求點幅度進行加權(quán)修正，最終實現(xiàn)信號波形的平滑去噪，平滑處理公式表示：
式中，y表示平滑處理后數(shù)據(jù)，X表示原采樣數(shù)據(jù)，m表示數(shù)據(jù)點數(shù)，N表示平均的點數(shù)，h表不權(quán)值因子，其中加權(quán)平均因子滿足：
五點三次的平滑處理方法是通過運用最小二乘法原理對采樣數(shù)據(jù)進行三次最小二乘金T市才求碑從不田占二'/A求、、碼、、/土的/入:^finTC?
式中：i= 3,4，…，m-2，通過上述對增強后的語音進行時域內(nèi)的平滑處理，使得增強后的語音與純凈語音具有更進一步的相似性；上述步驟中所用到的硬件設備包括供電設備、麥克風、數(shù)據(jù)采集卡和PC上位機。
2.根據(jù)權(quán)利要求1所述一種用于語音信號增強的譜減法，其特征在于：所述以增強后語音信號的信噪比SNR。為輸出，以變化的譜減功率修正系數(shù)a和譜減噪聲系數(shù)0為輸入，改變輸入?yún)?shù)值，自動控制選擇使得輸出達到增強后語音信號的信噪比的最優(yōu)值SNR^t 的輸入最優(yōu)參數(shù)為％和B的過程，是通過繪制輸出信噪比SNR。、譜減功率修正系數(shù)a和譜減噪聲系數(shù)0的三維曲線圖，從中尋找最大值的坐標值實現(xiàn)的，具體方法如下：帶噪信輸入信噪比3順1取值范圍-15dB_20dB，當譜減功率修正系數(shù)a和譜減噪聲系數(shù)0變化時，增強后語音信號的信噪比SNR。隨之變化，其中，x軸、y軸和z軸分別代表譜減功率修正系數(shù)a、譜減噪聲系數(shù)0以及增強后的輸出信噪比SNR。，由所作的三維曲線圖可得，當a和0變化時，存在一組a# 0 B，使得SNR。取得最大值SNR&，此€^和0JP 為最優(yōu)參數(shù)。
【專利摘要】本發(fā)明一種用于語音信號增強的譜減法，涉及語音增強技術(shù)領域，步驟是：被減項加權(quán)值處理；功率譜修正處理；得出基于修正參數(shù)的改進譜減法公式；自動控制最優(yōu)參數(shù)選擇；平滑處理。本發(fā)明是一種基于參數(shù)自適應的改進譜減法，克服了采用現(xiàn)有的譜減法增強處理后的信號會殘留比較多的噪聲的缺陷。
【IPC分類】G10L21-02, G10L21-0232
【公開號】CN104810023
【申請?zhí)枴緾N201510268387
【發(fā)明人】孫昊, 齊立萍, 楊鵬, 陳萌, 王碩朋, 王月英
【申請人】河北工業(yè)大學
【公開日】2015年7月29日
【申請日】2015年5月25日

完整全部詳細技術(shù)資料下載