国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于維納濾波的語音混響消減方法

      文檔序號:2830744閱讀:315來源:國知局
      專利名稱:基于維納濾波的語音混響消減方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種語音混響消減方法,特別是一種基于維納濾波的語音混響消 減方法,屬于語音信號處理技術(shù)領(lǐng)域。
      背景技術(shù)
      聲音易受到混響的影響。例如,在房間中,語音信號由墻、天花板或地板反 射,因此房間中存在的麥克風(fēng)將接收到直接信號和通過反射面接收到的間接信號 組合的聲信號。該間接信號被稱為所接收信號的混響部分。在手機(jī)的使用中,當(dāng) 通話環(huán)境比較狹小時,比如在浴室,電梯里,容易產(chǎn)生混響,混響嚴(yán)重時,會導(dǎo) 致說話不清,導(dǎo)致通訊障礙。在許多其它場合,混響往往也帶來干擾,導(dǎo)致聲學(xué) 接收系統(tǒng)性能變差。例如,混響會導(dǎo)致語音識別系統(tǒng)性能顯著下降,在遠(yuǎn)程會議、 振動聲學(xué)、聲納通信和海洋聲學(xué)中,混響也主要帶來負(fù)面影響。當(dāng)混響嚴(yán)重時, 這些系統(tǒng)甚至無法正常發(fā)揮功能。因此,如何減少混響對聲音接收系統(tǒng)的影響是 一個非常重要的課題。
      現(xiàn)有的信號處理系統(tǒng)試圖通過盲反巻積來降低混響。盲反巻積(blind deconvolution)試圖估計房間、辦公室或其它混響信號環(huán)境的傳遞函數(shù)。感知的 信號被用于一個反向濾波器(inverse filter)以估計原始信號。盲反巻積試圖 通過確定的信號環(huán)境傳遞函數(shù),正確地恢復(fù)原始信號。該處理是極其復(fù)雜的,是 高強(qiáng)度的計算技術(shù)。同樣地,它不能適用于如提供了實時響應(yīng)的移動電話的一些 設(shè)備,或不能適用于不能為盲反巻積提供足夠的處理資源的一些設(shè)備。
      已有技術(shù)中,申請?zhí)枮?00510125838.4、名稱為"混響估計和抑制系統(tǒng)"的 發(fā)明專利,提出一種信號處理系統(tǒng)檢測混響,并對混響信號進(jìn)行抑制。它對輸入 信號的頻帶進(jìn)行分析以確定混響特征是否存在。當(dāng)檢測到混響時,便衰減混響頻 帶,以降低或消除混響。申請?zhí)枮?00580024631.6、名稱為"音頻信號去混響" 的發(fā)明專利,提出一種估計聲信號中混響的方法。它首先確定信號的頻譜,通過 提供指示所述信號的混響部分隨時間衰減的第一參數(shù),提供指示所述信號的直接 部分對于混響部分的幅值的第二參數(shù),使用先前幀的頻譜、第一參數(shù)和第二參數(shù) 產(chǎn)生混響信號的估計頻譜。上述兩種發(fā)明專利均是對混響信號的頻譜進(jìn)行分析,
      4確定混響特征,以達(dá)到對混響的消減,在處理、計算的的簡易程度上要好于盲反 巻積去混響,但是從混響消減的效果上來講,僅依靠對混響信號頻譜的分析,去 混響效果仍需進(jìn)一步改善。

      發(fā)明內(nèi)容
      為了克服現(xiàn)有技術(shù)的不足和缺陷,本發(fā)明提供一種語音信號去混響的新方 法,該方法能有效消減房間環(huán)境中產(chǎn)生的混響信號。適用信號包括在封閉浴室、 電梯、大型空曠禮堂等混響環(huán)境下的語音信號,特別適用于移動通訊中的去混響。
      該混響消減方法包括兩次反巻積運(yùn)算,分別求出混響環(huán)境的房間沖擊響應(yīng)和 去混響后的語音信號。不同于盲反巻積,該去混響系統(tǒng)計算強(qiáng)度較低,且有較好 的時效性,故本發(fā)明可被實現(xiàn)為實時信號處理系統(tǒng)或脫機(jī)的系統(tǒng)。
      該混響消減方法是一種基于維納濾波來進(jìn)行語音去混響的新方法。由于每次 在進(jìn)行移動通信時, 一般都會以"喂"或者"hi"、 "hello"開始,因此,便可 以在移動通訊器材中預(yù)存純凈語音信號"喂"、"hi"等,在混響環(huán)境下進(jìn)行通信, 如打手機(jī)時,也以"喂"、"hi"等字開始,這樣便知道"喂"字等的純凈語音信 號和混響語音信號,通過維納濾波反巻積運(yùn)算可得混響環(huán)境的房間沖擊響應(yīng);然 后當(dāng)說話者對著手機(jī)發(fā)出其他聲音時,就已知混響環(huán)境的沖擊響應(yīng)和混響語音信 號,利用已知混響的房間沖擊響應(yīng)信息,經(jīng)過第二次反巻積運(yùn)算就可以獲得去混 響后的語音信號。
      本發(fā)明是通過下述技術(shù)方案實現(xiàn)的,本發(fā)明方法包括輸入處理、混響分析、 混響處理和輸出處理四個步驟,具體說明如下
      1、 輸入處理首先預(yù)存純凈起始語音信號,然后接收混響信號,混響信號 可以是一個麥克風(fēng)輸入信號或表現(xiàn)出聲混響效果的其它輸入信號。在具體實施 中,可采用麥克風(fēng)等語音采集工具采集語音信號。在此歩驟中,輸入處理主要執(zhí) 行預(yù)處理任務(wù),即對該信號采樣、端點(diǎn)檢測和分幀,為后續(xù)分析和處理做準(zhǔn)備。
      2、 混響分析混響分析主要是根據(jù)經(jīng)過預(yù)處理的純凈起始音及其混響信號, 基于維納濾波反巻積算法得出混響環(huán)境的房間沖擊響應(yīng)信息,以維納反濾波因子 的形式輸出到下一步混響處理單元中進(jìn)行濾波去混響,其中每輸入一次純凈起始 音的混響信號就能得到一組維納反濾波因子,當(dāng)對語音質(zhì)量要求較高,或者一組 維納反濾波因子不能達(dá)到去混響要求,即不能獲得足夠多房間沖擊響應(yīng)信息時,可將房間沖擊響應(yīng)信息進(jìn)行整合,信息整合可采用平均或加權(quán)方法。
      3、 混響處理用于消減混響信號中的混響。利用步驟2混響分析中得到的 反濾波因子,對混響信號進(jìn)行濾波得到去混響信號。
      4、 輸出處理輸出處理主要對去混響后的信號進(jìn)行語音重構(gòu)和后處理,如 混響消減信號進(jìn)行數(shù)模轉(zhuǎn)換、信號傳輸,以及記錄去混響評測指標(biāo)。
      本發(fā)明的有益效果本發(fā)明方法的計算強(qiáng)度較低,且混響消減效果較為理想, 這是因為已知純凈起始音和起始音的房間混響,可求得較為完整的房間沖擊響應(yīng) 信息,即維納反濾波因子。另外,由于本方法基于維納濾波,有較快的遞推解法, 故有較好的實時性。整個語音混響消減方法目前可在個人電腦中由計算機(jī)程序?qū)?現(xiàn)。該方法可被實現(xiàn)為執(zhí)行存儲器上存儲指令的一個數(shù)字信號處理器??商幚硇?號的數(shù)字樣本,或可自己將模擬輸入信號數(shù)字化,用于混響消減,使硬件執(zhí)行混 響消減的指令可被存儲在機(jī)器可讀介質(zhì)上,如磁盤,閃存或其它存儲器。


      圖1是本發(fā)明混響消減方法的流程框圖; 圖2是本發(fā)明輸入處理流程框圖; 圖3是本發(fā)明混響分析流程框圖; 圖4是本發(fā)明混響處理和輸出處理流程框圖; 圖5是〃one"語音大型空曠禮堂混響環(huán)境下去混響效果圖
      具體實施例方式
      下面結(jié)合附圖,以大型空曠禮堂為混響環(huán)境,純凈語音信號"hi"為起始音, 對混響信號"one"進(jìn)行去混響,對本發(fā)明的具體實施作進(jìn)一步描述。
      如圖l、圖2、圖3、圖4所示,本發(fā)明去混響方法包括下述四個步驟
      1、輸入處理1:預(yù)存純凈語音信號"hi",然后通過麥克風(fēng)采集語音信號"hi" 的混響信號和語音信號"one"的混響信號。信息采集后即執(zhí)行預(yù)處理,對"hi"、 "one"信號采樣、端點(diǎn)檢測和分幀。
      采樣單元100以選擇的采樣頻率把語音信號"hi"及其混響信號、以及混響 信號"one"的模擬信號通過模數(shù)轉(zhuǎn)換模塊轉(zhuǎn)化為數(shù)字信號。采樣頻率的選擇以 能捕捉足夠多的語音信息為標(biāo)準(zhǔn),對于語音,采樣頻率是8KHz到llKHz或更高。
      端點(diǎn)檢測單元102對數(shù)字形式的語音信號"hi"及其混響信號,以及混響信號"one"進(jìn)行端點(diǎn)檢測,識別每個字節(jié)的起始點(diǎn)位置,排除無語音段,僅保留 包含有語音段信息的單個字節(jié)信號,傳送到字存儲單元104中,分別存放。這是 因為,經(jīng)過研究,排除語音信號的無語音段,而僅對有語音段進(jìn)行分析處理,去 混響效果可以明顯改進(jìn)。該步驟使用計算機(jī)由軟件實現(xiàn)。
      分幀單元112接收來自字存儲單元104中的語音信息,將端點(diǎn)檢測后的語音 信號"hi"及其混響信號,以及混響信號"one"進(jìn)行分幀。幀長大約為20到 30ms,相鄰兩幀起始點(diǎn)之間間隔為10ms,即兩幀之間有10到20ms的交疊。對 于10KHz采樣頻率,30ms的幀長對應(yīng)300點(diǎn),10ms的幀移為100點(diǎn)。分幀時加 漢明窗。
      2、混響分析2:混響分析單元根據(jù)經(jīng)過預(yù)處理的純凈語音信號"hi"和其混 響信號,基于維納濾波算法,即第一次反巻積運(yùn)算214得出混響環(huán)境的房間沖擊 響應(yīng)信息,以維納反濾波因子216的形式儲存,維納反濾波因子216由下式求得
      <formula>formula see original document page 7</formula>
      其中/z,即為維納反濾波因子216, (tn+l)為濾波因子化的長度,上式的左端
      為"hi"混響信號的自相關(guān)函數(shù)^(/)組成的矩陣,稱為托布里茲矩陣。右端rj/)
      為"hi"語音混響信號和純凈信號的互相關(guān)函數(shù)。上式即稱為托布里茲方程212, 有較快遞推解法。
      然后,將維納反濾波因子A, 216輸送到混響處理3進(jìn)行去混響處理。當(dāng)對語 音質(zhì)量要求較高,即單組維納反濾波因子/z,216不能滿足去混響要求時,可多次 輸入"hi"語音的混響信號或其它起始音,諸如"hello"、"喂"的混響信號, 求得多組維納反濾波因子/7,216,然后將維納反濾波因子/z,216傳送至信息整合
      5,對混響環(huán)境的房間沖擊響應(yīng)信息進(jìn)行整合,再將房間沖擊響應(yīng)信息,即維納 反濾波因子Z^ 216傳送到混響處理3進(jìn)行去混響處理。信息整合可采用平均或加
      權(quán)方法。
      3、混響處理3:混響處理3利用混響分析2中得到的維納反濾波因子/2,216對混響信號"one"進(jìn)行濾波,即第二次反巻積運(yùn)算322,濾波時以維納反濾波 因子&216作為濾波器系數(shù),使用濾波程序myfilter函數(shù)濾波,得到去混響信
      號"one"輸入輸出處理單元4然后執(zhí)行后處理。其中濾波程序myfilter函數(shù)是 基于差分方程的遞推解法,參考MATLAB內(nèi)部程序filter函數(shù)編出。
      4、輸出處理4:輸出處理4用于對去混響后的信號"one"進(jìn)行語音重構(gòu)和 后處理。由于經(jīng)過混響處理后的信號是一組組的幀信號,因此需要對語音進(jìn)行重 構(gòu),恢復(fù)原始信號。后處理主要是對混響消減信號的數(shù)模轉(zhuǎn)換或信號傳輸,以及 記錄去混響評測指標(biāo)。
      經(jīng)混響處理3濾波后的語音信號"one"進(jìn)入輸出處理4,經(jīng)語音重構(gòu)402 重構(gòu)語音,主要是幀與幀之間的串接,如果是多字節(jié)語音的去混響,語音重構(gòu) 402還包括字節(jié)與字節(jié)之間的連接。該步驟是分幀和端點(diǎn)檢測的逆運(yùn)算,由計算 機(jī)軟件實現(xiàn)。輸出處理4經(jīng)由信息輸出404進(jìn)入數(shù)模轉(zhuǎn)換模塊傳輸去混響后的語 音信號,并由揚(yáng)聲器或耳機(jī)等發(fā)出去混響后的語音,該步驟可由計算機(jī)實現(xiàn)。評 測單元406中儲存去混響度評測指標(biāo)的一些信息,包括時域信混噪比改善指標(biāo) A5/ A^,線性預(yù)測倒譜系數(shù)距離改善指標(biāo)AIPCC、 MEL頻率倒譜系數(shù)距離改善 指標(biāo)AMFCC,其中AI尸CC、 AMFCC為兩種頻域客觀評測系數(shù),是譜失真測度。 由這些指標(biāo)可以更好的了解語音的去混響效果,指標(biāo)由顯示屏顯示。
      圖5是以"hi"為起始音,"one"為混響信號,在大型空曠禮堂混響情況下 的去混響效果波形圖。
      由圖5可以看出,本方法的混響消減效果較為理想,這是因為已知純凈起始 音和起始音的房間混響,可求得較為完整的房間沖擊響應(yīng)信息,即維納反濾波因 子&216。另外,由于本方法基于維納濾波,有較快的遞推解法,故本方法有較
      好的實時性。
      權(quán)利要求
      1.一種基于維納濾波的語音混響消減方法,其特征在于,該方法包括下述步驟步驟1、輸入處理(1)首先預(yù)存純凈起始語音信號,采集混響信號,通過采樣單元(100)、端點(diǎn)檢測單元(102)、字存儲單元(104)和分幀單元(112)對該信號采樣、端點(diǎn)檢測、存儲和分幀;步驟2、混響分析(2)對經(jīng)過預(yù)處理的純凈起始音及其混響信號,基于維納濾波反卷積,即第一次反卷積運(yùn)算(214)得出混響環(huán)境的房間沖擊響應(yīng)信息,以維納反濾波因子(216)的形式輸出,每輸入一次純凈起始音的混響信號就能得到一組維納反濾波因子(216),房間沖擊響應(yīng)信息通過平均或加權(quán)方法進(jìn)行整合;步驟3、混響處理(3)利用步驟2混響分析中得到的維納反濾波因子(216),進(jìn)行第二次反卷積運(yùn)算(322),通過濾波單元(320)對混響信號進(jìn)行濾波得到去混響信號;步驟4、輸出處理(4)對去混響信號進(jìn)行語音重構(gòu)(402),并進(jìn)行數(shù)模轉(zhuǎn)換、信號傳輸,以及記錄去混響評測指標(biāo)。
      2. 根據(jù)權(quán)利要求1所述的基于維納濾波的語音混響消減方法,其特征是所 述的步驟l中,采樣單元(100)中采樣頻率的選擇以能捕捉足夠多的語音信息 為標(biāo)準(zhǔn),對于語音,采樣頻率在8KHz到llKHz范圍內(nèi)或更高;端點(diǎn)檢測單元(102) 識別每個字節(jié)的起始點(diǎn)位置,排除無語音段,保留包含有語音段信息的單個字節(jié) 信息,并將單個字節(jié)信息送入字存儲單元(104);分幀單元(112)將端點(diǎn)檢測 后的語音信號進(jìn)行分幀,并將子幀信息送入幀存儲單元(204),幀長大約為20 到30ms,相鄰兩幀起始點(diǎn)之間間隔為10ms,即兩幀之間有10到20ms的交疊, 對于lOKHz采樣頻率,30ms的幀長對應(yīng)300點(diǎn),10ms的幀移為100點(diǎn),分幀時 加漢明窗。
      3. 根據(jù)權(quán)利要求1所述的基于維納濾波的語音混響消減方法,其特征是所述 的歩驟2中,維納反濾波因子(216)由托布里茲方程(212)求得。
      4. 根據(jù)權(quán)利要求1所述的基于維納濾波的語音混響消減方法,其特征是所述 的步驟3中,濾波時以維納反濾波因子(216)作為濾波器系數(shù),使用myfilter函數(shù)濾波,其中myfilter函數(shù)是基于差分方程的遞推解法,參考區(qū)TLAB內(nèi)部程 序filter函數(shù)編出。
      5.根據(jù)權(quán)利要求1所述的基于維納濾波的語音混響消減方法,其特征是所述 的步驟4中,語音重構(gòu)(402),主要是幀與幀之間的串接,如果是多字節(jié)語音的 去混響,語音重構(gòu)還包括字節(jié)與字節(jié)之間的連接,該步驟是分幀和端點(diǎn)檢測的逆 運(yùn)算;經(jīng)過數(shù)模轉(zhuǎn)換模塊處理后的語音信號,由揚(yáng)聲器或耳機(jī)傳至人耳;評測單 元(406)對去混響度進(jìn)行評測,評測指標(biāo)包括時域信混噪比改善指標(biāo)AS7 A^, 線性預(yù)測倒譜系數(shù)距離改善指標(biāo)AZPCC、 MEL頻率倒譜系數(shù)距離改善指標(biāo) AMFCC,其中M尸CC、 AMFCC為兩種頻域客觀評測系數(shù),是譜失真測度。
      全文摘要
      基于維納濾波的語音混響消減方法,屬于語音信號處理技術(shù)領(lǐng)域。本發(fā)明方法包括輸入處理、混響分析、混響處理和輸出處理四個步驟,輸入處理是對語音信號進(jìn)行采樣、端點(diǎn)檢測和分幀?;祉懛治鍪菍ζ鹗家艏捌浠祉懶盘栠M(jìn)行第一次反卷積運(yùn)算,得到混響環(huán)境的房間沖擊響應(yīng)信息?;祉懱幚硎腔诜块g沖擊響應(yīng)信息對混響信號進(jìn)行濾波,即第二次反卷積運(yùn)算,得到去混響信號。輸出處理是對去混響信號進(jìn)行語音重構(gòu)并進(jìn)行數(shù)模轉(zhuǎn)換、信號傳輸,以及記錄去混響評測指標(biāo)。本發(fā)明去混響效果良好,計算強(qiáng)度較低,且具有較好的實時性。
      文檔編號G10L21/02GK101315772SQ20081004070
      公開日2008年12月3日 申請日期2008年7月17日 優(yōu)先權(quán)日2008年7月17日
      發(fā)明者張德會, 陳光冶 申請人:上海交通大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1