一種預(yù)回聲控制方法

文檔序號：2830760閱讀：433來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種預(yù)回聲控制方法
技術(shù)領(lǐng)域：
本發(fā)明屬于數(shù)字音頻處理技術(shù)領(lǐng)域，具體涉及一種新的預(yù)回聲控制方法和裝置。
背景技術(shù)：
在音頻編碼技術(shù)中，預(yù)回聲失真一直是一個相當(dāng)棘手的問題，特別當(dāng)比特率較低時，亦即壓縮率比較高時，預(yù)回聲失真將變得更加明顯和嚴(yán)重。預(yù)回聲失真產(chǎn)生的關(guān)鍵原因是時間分辨率的不足造成量化噪聲的時域擴散。特別當(dāng)一個瞬態(tài)信號被分塊變換(或濾波)到頻域進行量化編碼時，由于量化噪聲被擴散到整個變換塊(或濾波器組)范圍上，如果其不能被信號掩蔽，就會出現(xiàn)預(yù)回聲。預(yù)回聲造成信號失真的波形如圖l所示，顯
然從圖中可以看出在突發(fā)信號前出現(xiàn)了明顯的量化噪聲，且人耳對此類失真非常敏感。
除了量化噪聲的強度決定了預(yù)回聲失真影響聲音質(zhì)量以外，人耳的時域掩蔽也對預(yù) 回聲失真影響聲音質(zhì)量起著重要的作用。人耳的時域掩蔽有兩種情況，即前向掩蔽和后
向掩蔽。前向掩蔽的作用時間可達20ms，通常認(rèn)為實際作用時間在0. 5 2ms以內(nèi)有效；后向掩蔽有更長的持續(xù)作用時間，約達到200ms，而通常認(rèn)為實際作用時間在10 50ras 之內(nèi)有效。由于后向掩蔽作用時間較長，量化噪聲一般能夠被很好地掩蔽掉而不影響主觀聲音質(zhì)量，因此在感知編碼器中較少考慮這種情況。相對于后向掩蔽，前向掩蔽能力較弱，就需要仔細地設(shè)計一個合適的量化噪聲的時域特性，使其不超過人耳的預(yù)掩蔽電平，這樣預(yù)回聲失真才不會被人耳檢測到，從而保證透明的編碼聲音質(zhì)量。
為了抑制量化噪聲，在現(xiàn)代主流音頻編碼標(biāo)準(zhǔn)中，幾乎都采用了長短窗切換的方法來處理暫態(tài)信號，即在對暫態(tài)信號進行處理時，使用比較短的變換塊長度，這樣既能提高時間分辨率，又可以抑制頻域量化噪聲在時域的擴散。另外，各標(biāo)準(zhǔn)中又分別采用了其他的措施來改善"預(yù)回聲"現(xiàn)象，比如MPEG-I Layer 3和MPEG-2都采用了碼率控制的方法；MPEG-2 AAC采用了時域噪聲整型和增益控制、AC-3指數(shù)尾數(shù)編碼和聲道耦合等。
在AVS音頻標(biāo)準(zhǔn)中，沒有使用長短窗切換技術(shù)，而是統(tǒng)一使用長窗變換，不同的是，當(dāng)信號為暫態(tài)時，還要對時頻變換后的系數(shù)進行頻域多分辨率分析，即采用混合濾波器組的方法來抑制預(yù)回聲和提高編碼效率。但是這種方法的計算復(fù)雜度和計算精度要求都很高，嚴(yán)重的影響了編解碼器的速度，尤其是影響了解碼器的實時性。
而且目前的主流編碼器在處理暫態(tài)信號時，都是以塊為單位的，而這些方法雖然能夠檢測出信號的瞬態(tài)特性，但是它們都不能準(zhǔn)確定位發(fā)生瞬變的位置和強度，也沒有針對發(fā)生瞬變的位置和瞬變的強度做出相應(yīng)的處理。所以在某些情況下仍然會產(chǎn)生明顯的預(yù)回聲現(xiàn)象。

發(fā)明內(nèi)容
鑒于上述技術(shù)問題，本發(fā)明提出了一種新的預(yù)回聲控制方法，根據(jù)預(yù)回聲產(chǎn)生的基本原理(時域暫態(tài)信號需要高的時間分辨率)，同時利用人耳對高頻信號的細節(jié)并不敏感的特性(因而可以舍棄部分高頻細節(jié)而不被人耳感知)，通過定位時域暫態(tài)信號的瞬變位置，根據(jù)該瞬變的瞬變強度對信號進行時域平坦化，直接針對瞬變位置進行噪聲抑制，從而有效控制預(yù)回聲現(xiàn)象。
本發(fā)明公開了一種預(yù)回聲控制方法，通過檢測暫態(tài)信號中的瞬變位置和瞬變強度對原始信號進行時域平坦化處理，該方法包括以下過程將待編碼音頻幀數(shù)據(jù)劃分為多個數(shù)據(jù)塊；
計算每個數(shù)據(jù)塊的瞬變強度；
將其中瞬變強度超過閾值的數(shù)據(jù)塊標(biāo)記為瞬變數(shù)據(jù)塊；
對瞬變起始數(shù)據(jù)塊，即瞬變起始位置進行標(biāo)記，并根據(jù)人耳的掩蔽效應(yīng)剔除冗余的
瞬變位置；
根據(jù)瞬變強度繪制時域平坦化曲線；如有多個瞬變位置，則合成時域平坦化曲線；
將平坦化曲線與瞬變位置對齊，對改幀信號進行加窗、平坦化處理。所述將待編碼音頻幀數(shù)據(jù)劃分為多個數(shù)據(jù)塊步驟，在AVS音頻編碼標(biāo)準(zhǔn)中，一幀信
號的長度為1024個采樣點，44.1說2采樣時一幀信號的時間為23.22!115，以32個采樣點為
一個數(shù)據(jù)塊，每個數(shù)據(jù)塊大約0.7ms，每幀一共32個數(shù)據(jù)塊。
所述將其中瞬變強度超過閾值的數(shù)據(jù)塊標(biāo)記為瞬變數(shù)據(jù)塊的步驟，還進一步包括
將該幀標(biāo)記為暫態(tài)幀。
所述根據(jù)瞬變強度繪制時域平坦化曲線的步驟，進一步包括以下步驟
根據(jù)前面求得的瞬變強度e("來確定平坦化曲線衰減的最小值Cmin :
當(dāng)<formula>formula see original document page 5</formula>時，Cmm=l/2 當(dāng)<formula>formula see original document page 5</formula>時，Cmm=l/4 當(dāng)<formula>formula see original document page 5</formula>時，Cmin=l/8
當(dāng)16SC("〈32時，C隱-l/16 當(dāng)32SC("時，Cmm=l/32
設(shè)一幀中第k個數(shù)據(jù)塊是第一個瞬變塊，平坦化曲線7")的計算如下少(x) = 1; (x = 0,1,…,32 * (A: _ 1) _ 1)
X力"-l—3^薩(x — 32，_l));0 = 32*("l),32*(A: —1) + 1,...，32*"1) 少(x) = Cmin; (x = 32 * A:， 32 * yt +1,…,1024 _ 1)
平坦化曲線與瞬變位置對齊平坦化曲線從瞬變位置處開始。
與現(xiàn)有的主流編碼器相比，本發(fā)明能夠準(zhǔn)確定位發(fā)生瞬變的位置和強度，針對發(fā)生瞬變的位置和瞬變的強度做出相應(yīng)的處理。這種新的預(yù)回聲控制方法，根據(jù)預(yù)回聲產(chǎn)生的基本原理(時域暫態(tài)信號需要高的時間分辨率)，同時利用人耳對高頻信號的細節(jié)并不敏感的特性(因而可以舍棄部分高頻細節(jié)而不被人耳感知)，通過定位時域暫態(tài)信號的瞬變位置，根據(jù)該瞬變的瞬變強度對信號進行時域平坦化，直接針對瞬變位置進行噪聲抑制，從而有效控制預(yù)回聲現(xiàn)象。

圖l是預(yù)回聲現(xiàn)象；圖2是本發(fā)明流程框圖3是原始響板序列的波形圖4是基于AVS音頻編解碼平臺采用多分辨率分析方法處理后的響板序列的波形圖；圖5是基于AVS音頻編解碼平臺采用新方法處理后的響板序列的波形圖。
具體實施例方式
下面結(jié)合附圖及具體實施例對本發(fā)明的技術(shù)方案做進一步描述
實施方案l:采用AVS音頻編解碼平臺，通過對典型的響板序列(單聲道、44.1kHz 采樣頻率、16比特樣本精度、編碼碼率32kbps/ch)的試驗，對比了本發(fā)明與AVS音頻標(biāo) 準(zhǔn)采用的混合濾波器組的方法對預(yù)回聲失真的控制效果。
本發(fā)明的具體實施方式
舉例說明如下例如，在AVS音頻編碼器中，一幀信號的長
度為1024個采樣點(PCM[i],i = 0, 1, ... 1023;)， 44.1kHz采樣時一幀信號的時間約為 23.22ms，以32個采樣點為一個數(shù)據(jù)塊，即每個數(shù)據(jù)塊大約0.7ms，每幀一共32個數(shù)據(jù)塊。
= (f (;pCW[(/t —l)*32 + /〗)2)"2 設(shè)每個數(shù)據(jù)塊樣點的總功率為P(k)，1^1,2，...32，則 +。。
定義l:每個數(shù)據(jù)塊樣點的功率相對于前一數(shù)據(jù)塊的比值
C(yt)=単);(単-1)! = 0, A: = 2,3,..., 32)
^"一1) 稱為該數(shù)據(jù)塊的瞬變強度。
定義2:瞬變強度e")超過某一閾值^的數(shù)據(jù)塊稱為瞬變塊。
第一步數(shù)據(jù)塊劃分。一幀中的信號按照上面的定義每32個連續(xù)樣點分為一個數(shù)據(jù)塊。
第二步計算并檢測一幀中各數(shù)據(jù)塊的瞬變強度。
依次計算每個數(shù)據(jù)塊的瞬變強度e("，并于閾值^進行比較，當(dāng)""大于K時(這
里取^=2)，則認(rèn)為該數(shù)據(jù)塊為瞬變塊。
第三步將一幀中的所有瞬變塊標(biāo)記為瞬變位置，并將該幀標(biāo)記為暫態(tài)幀。第四步剔除冗余的瞬變位置。
因為信號的前向掩蔽時間一般為20ms，實際作用時間一般考慮在0.5 2ms以內(nèi)有效，所以k二2,3,4三個數(shù)據(jù)塊中，如果發(fā)生瞬變則不用考慮，因為在瞬變位置的前面只有約2ms左右的信號，可以被前向掩蔽效應(yīng)掩蔽。又因為信號的后向掩蔽時間較長，約 200ms，有效時間一般取20ms左右，所以在檢測到第一個瞬變位置后，其余的瞬變位置就可以剔除了。
第五步時域平坦化處理
根據(jù)前面求得的瞬變強度e")來確定平坦化曲線衰減的最小值e皿n 。具體方法如
下
當(dāng)7;〈C("〈4時，Cmm=l/2 當(dāng)4SC(A:)〈8時，Cmm=l/4 當(dāng)8《C("〈16時，C_=l/8 當(dāng)16^C("〈32時，Cmin=l/16
當(dāng)32SC(A)時，Cmin=l/32
平坦化曲線^")的計算如下(設(shè)一幀中第k個數(shù)據(jù)塊是第一個瞬變塊)<formula>formula see original document page 8</formula>使用y(x)對該幀信號加窗，這樣就可以抑制信號瞬變部分的幅度，使信號平坦化。
第六步將瞬變信息，如瞬變幀標(biāo)識、瞬變位置和瞬變強度打包到AVS音頻碼流中。
其他處理與穩(wěn)態(tài)信號相同，解碼端根據(jù)碼流中瞬變信息對解碼得到的信號進行反向操作即可還原原始數(shù)據(jù)。
試驗結(jié)果如圖3-圖5所示。其中，圖3是原始響板序列的波形圖，該波形圖中暫態(tài)現(xiàn) 象明顯，且瞬變信號之前的噪聲很低；圖4是基于AVS音頻編解碼平臺采用多分辨率分析
方法處理后的響板序列的波形圖，從該波形圖可以看出經(jīng)過編/解碼處理的信號保持了較好的時域分辨率，瞬變信號之前的噪聲也得到了抑制，未出現(xiàn)明顯的噪聲；圖5是
基于AVS音頻編解碼平臺釆用本發(fā)明的方法處理后的響板序列的波形圖，從該波形圖可
以看出經(jīng)過編解碼處理的信號也保持了很好的時域分辨率，瞬變信號之前的噪聲也得
到了有效抑制，噪聲明顯低于多分辨率分析方法的結(jié)果。
實施方案2:采用的DolbyAC-3音頻編解碼平臺，對典型的響板序列(單聲道、 44.1kHz采樣頻率、16比特樣本精度、編碼碼率64kbps/ch)的實施方案。
本發(fā)明的具體實施方式
舉例說明如下例如，在AC-3音頻編碼器中，一幀信號的長度為512個采樣點<formula>formula see original document page 8</formula>44.1kHz采樣時一幀信號的時間約為 11.6ms，以32個采樣點為一個數(shù)據(jù)塊，即每個數(shù)據(jù)塊大約0.7ms，每幀一共16個數(shù)據(jù)塊。
設(shè)每個數(shù)據(jù)塊樣點的總功率為<formula>formula see original document page 8</formula>。
定義l:每個數(shù)據(jù)塊樣點的功率相對于前一數(shù)據(jù)塊的比值
C(A:) = ^^^;(尸(A-1)! = 0,4 = 2,3,...,15)稱為該數(shù)據(jù)塊的瞬變強度。単-1)
定義2:瞬變強度C("超過某一閾值K的數(shù)據(jù)塊稱為瞬變塊。
第一步數(shù)據(jù)塊劃分。一幀中的信號按照上面的定義每32個連續(xù)樣點分為一個數(shù)據(jù)塊。
第二步計算并檢測一幀中各數(shù)據(jù)塊的瞬變強度。
依次計算每個數(shù)據(jù)塊的瞬變強度e("，并于閾值^進行比較，當(dāng)e")大于^時(這
里取^^2)，則認(rèn)為該數(shù)據(jù)塊為瞬變塊。
第三步將一幀中的所有瞬變塊標(biāo)記為瞬變位置，并將該幀標(biāo)記為暫態(tài)幀。第四步剔除冗余的瞬變位置。
因為信號的前向掩蔽時間一般為20ms，實際作用時間一般考慮在0.5 2ms以內(nèi)有效，所以k^2,3,4三個數(shù)據(jù)塊中，如果發(fā)生瞬變則不用考慮，因為在瞬變位置的前面只有約2ms左右的信號，可以被前向掩蔽效應(yīng)掩蔽。又因為信號的后向掩蔽時間較長，約 200ms，有效時間一般取20ms左右，所以在檢測到第一個瞬變位置后，其余的瞬變位置就可以剔除了。
第五步時域平坦化處理
根據(jù)前面求得的瞬變強度e("來確定平坦化曲線衰減的最小值e皿。具體方法如
下
<formula>formula see original document page 9</formula>
平坦化曲線^")的計算如下(設(shè)一幀中第k個數(shù)據(jù)塊是第一個瞬變塊)<formula>formula see original document page 9</formula><formula>formula see original document page 9</formula>
使用^oo對該幀信號加窗，這樣就可以抑制信號瞬變部分的幅度，使信號平坦化。
第六步將瞬變信息，如瞬變幀標(biāo)識、瞬變位置和瞬變強度打包到AVS音頻碼流中。其他處理與穩(wěn)態(tài)信號相同，解碼端根據(jù)碼流中瞬變信息對解碼得到的信號進行反向操作即可還原原始數(shù)據(jù)。
權(quán)利要求
1. 一種預(yù)回聲控制方法，通過檢測暫態(tài)信號中的瞬變位置和瞬變強度對原始信號進行時域平坦化處理，該方法包括以下過程將待編碼音頻幀數(shù)據(jù)劃分為多個數(shù)據(jù)塊；計算每個數(shù)據(jù)塊的瞬變強度；將其中瞬變強度超過閾值的數(shù)據(jù)塊標(biāo)記為瞬變數(shù)據(jù)塊；對瞬變起始數(shù)據(jù)塊，即瞬變起始位置進行標(biāo)記，并根據(jù)人耳的掩蔽效應(yīng)剔除冗余的瞬變位置；根據(jù)瞬變強度繪制時域平坦化曲線；如有多個瞬變位置，則合成時域平坦化曲線；將平坦化曲線與瞬變位置對齊，對改幀信號進行加窗、平坦化處理。
2. 如權(quán)利要求1所述的預(yù)回聲控制方法，其特征在于，所述將待編碼音頻幀數(shù)據(jù)劃' 分為多個數(shù)據(jù)塊步驟，在AVS音頻編碼標(biāo)準(zhǔn)中，一幀信號的長度為1024個采樣點， 44.1kHz采樣時一幀信號的時間為23.22ms，以32個采樣點為一個數(shù)據(jù)塊，每個數(shù)據(jù)塊大約0.7ms，每幀一共32個數(shù)據(jù)塊。
3. 如權(quán)利要求l所述的預(yù)回聲控制方法，其特征在于，所述將待編碼音頻幀數(shù)據(jù)劃分為多個數(shù)據(jù)塊步驟，在AC-3音頻編碼器中，一幀信號的長度為512個釆樣點，44.1kHz 采樣時一幀信號的時間約為11.6ms，以32個采樣點為一個數(shù)據(jù)塊即每個數(shù)據(jù)塊大約 0.7ms，每幀一共16個數(shù)據(jù)塊。
4. 如權(quán)利要求l所述的預(yù)回聲控制方法，其特征在于，所述將其中瞬變強度超過閾值的數(shù)據(jù)塊標(biāo)記為瞬變數(shù)據(jù)塊的步驟，還進一步包括以下步驟將該幀標(biāo)記為暫態(tài)幀。
5. 如權(quán)利要求l所述的預(yù)回聲控制方法，其特征在于，所述根據(jù)瞬變強度繪制時域平坦化曲線的步驟，進一步包括以下步驟根據(jù)前面求得的瞬變強度e("來確定平坦化曲線衰減的最小值G皿當(dāng)7;〈C(A:)〈4時，Cmin=l/2 當(dāng)4SC(A:)〈8時，Cmin=l/4 當(dāng)8仰)<16時，Cmin=l/8 當(dāng)16SC("〈32時，Cmin=l/16 當(dāng)32SC("時，Cmm=l/32設(shè)一幀中第k個數(shù)據(jù)塊是第一個瞬變塊，平坦化曲線><^的計算如下_y(x) = 1; 0 = 0,1,…，32 * (A: — 1) — 1) y(;c) = 1 — l^saL(x — 32 * (A: _ l)); (x = 32 * (A: _ 1), 32 * (A: _ 1) +1,…,32 * " 1) y(x) = Cmm; (x = 32 * A:, 32 * A: +1,…，1024 _ 1)平坦化曲線與瞬變位置對齊平坦化曲線從瞬變位置處開始。
全文摘要
本發(fā)明公開了一種預(yù)回聲控制方法，通過檢測暫態(tài)信號中的瞬變位置和瞬變強度對原始信號進行時域平坦化處理，該方法包括以下過程將待編碼音頻幀數(shù)據(jù)劃分為多個數(shù)據(jù)塊；計算每個數(shù)據(jù)塊的瞬變強度；將其中瞬變強度超過閾值的數(shù)據(jù)塊標(biāo)記為瞬變數(shù)據(jù)塊；對瞬變起始數(shù)據(jù)塊，即瞬變起始位置進行標(biāo)記，并根據(jù)人耳的掩蔽效應(yīng)剔除冗余的瞬變位置；根據(jù)瞬變強度繪制時域平坦化曲線；如有多個瞬變位置，則合成時域平坦化曲線；將平坦化曲線與瞬變位置對齊，對改幀信號進行加窗、平坦化處理。本發(fā)明與以往方案相比，直接針對瞬變位置進行噪聲抑制，從而有效控制預(yù)回聲現(xiàn)象。
文檔編號G10L19/00GK101388213SQ20081005374
公開日2009年3月18日申請日期2008年7月3日優(yōu)先權(quán)日2008年7月3日
發(fā)明者濤張, 海李, 楊東明, 偉王申請人:天津大學(xué)

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張濤;王偉;楊東明;李海
技術(shù)所有人：天津大學(xué)
我是此專利的發(fā)明人

上一篇：內(nèi)置鼓墊可調(diào)音量的架子鼓的制作方法
上一篇：薩克斯彎管和喇叭管的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

預(yù)測控制的理論與方法相關(guān)技術(shù)

預(yù)算控制的方法有哪些相關(guān)技術(shù)

預(yù)算控制的方法相關(guān)技術(shù)

預(yù)算控制的程序與方法相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種預(yù)回聲控制方法