国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種預(yù)回聲控制方法

      文檔序號:2830760閱讀:433來源:國知局
      專利名稱:一種預(yù)回聲控制方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于數(shù)字音頻處理技術(shù)領(lǐng)域,具體涉及一種新的預(yù)回聲控制方法和裝置。
      背景技術(shù)
      在音頻編碼技術(shù)中,預(yù)回聲失真一直是一個相當(dāng)棘手的問題,特別當(dāng)比特率較低時, 亦即壓縮率比較高時,預(yù)回聲失真將變得更加明顯和嚴(yán)重。預(yù)回聲失真產(chǎn)生的關(guān)鍵原因 是時間分辨率的不足造成量化噪聲的時域擴散。特別當(dāng)一個瞬態(tài)信號被分塊變換(或 濾波)到頻域進行量化編碼時,由于量化噪聲被擴散到整個變換塊(或濾波器組)范圍上, 如果其不能被信號掩蔽,就會出現(xiàn)預(yù)回聲。預(yù)回聲造成信號失真的波形如圖l所示,顯
      然從圖中可以看出在突發(fā)信號前出現(xiàn)了明顯的量化噪聲,且人耳對此類失真非常敏感。
      除了量化噪聲的強度決定了預(yù)回聲失真影響聲音質(zhì)量以外,人耳的時域掩蔽也對預(yù) 回聲失真影響聲音質(zhì)量起著重要的作用。人耳的時域掩蔽有兩種情況,即前向掩蔽和后
      向掩蔽。前向掩蔽的作用時間可達20ms,通常認(rèn)為實際作用時間在0. 5 2ms以內(nèi)有效; 后向掩蔽有更長的持續(xù)作用時間,約達到200ms,而通常認(rèn)為實際作用時間在10 50ras 之內(nèi)有效。由于后向掩蔽作用時間較長,量化噪聲一般能夠被很好地掩蔽掉而不影響主 觀聲音質(zhì)量,因此在感知編碼器中較少考慮這種情況。相對于后向掩蔽,前向掩蔽能力 較弱,就需要仔細地設(shè)計一個合適的量化噪聲的時域特性,使其不超過人耳的預(yù)掩蔽電 平,這樣預(yù)回聲失真才不會被人耳檢測到,從而保證透明的編碼聲音質(zhì)量。
      為了抑制量化噪聲,在現(xiàn)代主流音頻編碼標(biāo)準(zhǔn)中,幾乎都采用了長短窗切換的方法 來處理暫態(tài)信號,即在對暫態(tài)信號進行處理時,使用比較短的變換塊長度,這樣既能提 高時間分辨率,又可以抑制頻域量化噪聲在時域的擴散。另外,各標(biāo)準(zhǔn)中又分別采用了 其他的措施來改善"預(yù)回聲"現(xiàn)象,比如MPEG-I Layer 3和MPEG-2都采用了碼率控制 的方法;MPEG-2 AAC采用了時域噪聲整型和增益控制、AC-3指數(shù)尾數(shù)編碼和聲道耦合 等。
      在AVS音頻標(biāo)準(zhǔn)中,沒有使用長短窗切換技術(shù),而是統(tǒng)一使用長窗變換,不同的是, 當(dāng)信號為暫態(tài)時,還要對時頻變換后的系數(shù)進行頻域多分辨率分析,即采用混合濾波器 組的方法來抑制預(yù)回聲和提高編碼效率。但是這種方法的計算復(fù)雜度和計算精度要求都 很高,嚴(yán)重的影響了編解碼器的速度,尤其是影響了解碼器的實時性。
      而且目前的主流編碼器在處理暫態(tài)信號時,都是以塊為單位的,而這些方法雖然能 夠檢測出信號的瞬態(tài)特性,但是它們都不能準(zhǔn)確定位發(fā)生瞬變的位置和強度,也沒有針 對發(fā)生瞬變的位置和瞬變的強度做出相應(yīng)的處理。所以在某些情況下仍然會產(chǎn)生明顯的 預(yù)回聲現(xiàn)象。

      發(fā)明內(nèi)容
      鑒于上述技術(shù)問題,本發(fā)明提出了一種新的預(yù)回聲控制方法,根據(jù)預(yù)回聲產(chǎn)生的基 本原理(時域暫態(tài)信號需要高的時間分辨率),同時利用人耳對高頻信號的細節(jié)并不敏 感的特性(因而可以舍棄部分高頻細節(jié)而不被人耳感知),通過定位時域暫態(tài)信號的瞬 變位置,根據(jù)該瞬變的瞬變強度對信號進行時域平坦化,直接針對瞬變位置進行噪聲抑 制,從而有效控制預(yù)回聲現(xiàn)象。
      本發(fā)明公開了一種預(yù)回聲控制方法,通過檢測暫態(tài)信號中的瞬變位置和瞬變強度對 原始信號進行時域平坦化處理,該方法包括以下過程 將待編碼音頻幀數(shù)據(jù)劃分為多個數(shù)據(jù)塊;
      計算每個數(shù)據(jù)塊的瞬變強度;
      將其中瞬變強度超過閾值的數(shù)據(jù)塊標(biāo)記為瞬變數(shù)據(jù)塊;
      對瞬變起始數(shù)據(jù)塊,即瞬變起始位置進行標(biāo)記,并根據(jù)人耳的掩蔽效應(yīng)剔除冗余的
      瞬變位置;
      根據(jù)瞬變強度繪制時域平坦化曲線; 如有多個瞬變位置,則合成時域平坦化曲線;
      將平坦化曲線與瞬變位置對齊,對改幀信號進行加窗、平坦化處理。 所述將待編碼音頻幀數(shù)據(jù)劃分為多個數(shù)據(jù)塊步驟,在AVS音頻編碼標(biāo)準(zhǔn)中, 一幀信
      號的長度為1024個采樣點,44.1說2采樣時一幀信號的時間為23.22!115,以32個采樣點為
      一個數(shù)據(jù)塊,每個數(shù)據(jù)塊大約0.7ms,每幀一共32個數(shù)據(jù)塊。
      所述將其中瞬變強度超過閾值的數(shù)據(jù)塊標(biāo)記為瞬變數(shù)據(jù)塊的步驟,還進一步包括
      將該幀標(biāo)記為暫態(tài)幀。
      所述根據(jù)瞬變強度繪制時域平坦化曲線的步驟,進一步包括以下步驟
      根據(jù)前面求得的瞬變強度e("來確定平坦化曲線衰減的最小值Cmin :
      當(dāng)<formula>formula see original document page 5</formula>時,Cmm=l/2 當(dāng)<formula>formula see original document page 5</formula>時,Cmm=l/4 當(dāng)<formula>formula see original document page 5</formula>時,Cmin=l/8
      當(dāng)16SC("〈32時,C隱-l/16 當(dāng)32SC("時,Cmm=l/32
      設(shè)一幀中第k個數(shù)據(jù)塊是第一個瞬變塊,平坦化曲線7")的計算如下 少(x) = 1; (x = 0,1,…,32 * (A: _ 1) _ 1)
      X力"-l—3^薩(x — 32,_l));0 = 32*("l),32*(A: —1) + 1,...,32*"1) 少(x) = Cmin; (x = 32 * A:, 32 * yt +1,…,1024 _ 1)
      平坦化曲線與瞬變位置對齊平坦化曲線從瞬變位置處開始。
      與現(xiàn)有的主流編碼器相比,本發(fā)明能夠準(zhǔn)確定位發(fā)生瞬變的位置和強度,針對發(fā)生 瞬變的位置和瞬變的強度做出相應(yīng)的處理。這種新的預(yù)回聲控制方法,根據(jù)預(yù)回聲產(chǎn)生 的基本原理(時域暫態(tài)信號需要高的時間分辨率),同時利用人耳對高頻信號的細節(jié)并 不敏感的特性(因而可以舍棄部分高頻細節(jié)而不被人耳感知),通過定位時域暫態(tài)信號 的瞬變位置,根據(jù)該瞬變的瞬變強度對信號進行時域平坦化,直接針對瞬變位置進行噪 聲抑制,從而有效控制預(yù)回聲現(xiàn)象。


      圖l是預(yù)回聲現(xiàn)象; 圖2是本發(fā)明流程框圖3是原始響板序列的波形圖4是基于AVS音頻編解碼平臺采用多分辨率分析方法處理后的響板序列的波形圖; 圖5是基于AVS音頻編解碼平臺采用新方法處理后的響板序列的波形圖。
      具體實施例方式
      下面結(jié)合附圖及具體實施例對本發(fā)明的技術(shù)方案做進一步描述
      實施方案l:采用AVS音頻編解碼平臺,通過對典型的響板序列(單聲道、44.1kHz 采樣頻率、16比特樣本精度、編碼碼率32kbps/ch)的試驗,對比了本發(fā)明與AVS音頻標(biāo) 準(zhǔn)采用的混合濾波器組的方法對預(yù)回聲失真的控制效果。
      本發(fā)明的具體實施方式
      舉例說明如下例如,在AVS音頻編碼器中, 一幀信號的長
      度為1024個采樣點(PCM[i],i = 0, 1, ... 1023;), 44.1kHz采樣時一幀信號的時間約為 23.22ms,以32個采樣點為一個數(shù)據(jù)塊,即每個數(shù)據(jù)塊大約0.7ms,每幀一共32個數(shù)據(jù)塊。
      = (f (;pCW[(/t —l)*32 + /〗)2)"2 設(shè)每個數(shù)據(jù)塊樣點的總功率為P(k),1^1,2,...32,則 +。 。
      定義l:每個數(shù)據(jù)塊樣點的功率相對于前一數(shù)據(jù)塊的比值
      C(yt)=単);(単-1)! = 0, A: = 2,3,..., 32)
      ^"一1) 稱為該數(shù)據(jù)塊的瞬變強度。
      定義2:瞬變強度e")超過某一閾值^的數(shù)據(jù)塊稱為瞬變塊。
      第一步數(shù)據(jù)塊劃分。 一幀中的信號按照上面的定義每32個連續(xù)樣點分為一個數(shù)據(jù)塊。
      第二步計算并檢測一幀中各數(shù)據(jù)塊的瞬變強度。
      依次計算每個數(shù)據(jù)塊的瞬變強度e(",并于閾值^進行比較,當(dāng)""大于K時(這
      里取^=2),則認(rèn)為該數(shù)據(jù)塊為瞬變塊。
      第三步將一幀中的所有瞬變塊標(biāo)記為瞬變位置,并將該幀標(biāo)記為暫態(tài)幀。 第四步剔除冗余的瞬變位置。
      因為信號的前向掩蔽時間 一般為20ms,實際作用時間一般考慮在0.5 2ms以內(nèi)有 效,所以k二2,3,4三個數(shù)據(jù)塊中,如果發(fā)生瞬變則不用考慮,因為在瞬變位置的前面只 有約2ms左右的信號,可以被前向掩蔽效應(yīng)掩蔽。又因為信號的后向掩蔽時間較長,約 200ms,有效時間一般取20ms左右,所以在檢測到第一個瞬變位置后,其余的瞬變位置 就可以剔除了。
      第五步時域平坦化處理
      根據(jù)前面求得的瞬變強度e")來確定平坦化曲線衰減的最小值e皿n 。具體方法如

      當(dāng)7;〈C("〈4時,Cmm=l/2 當(dāng)4SC(A:)〈8時,Cmm=l/4 當(dāng)8《C("〈16時,C_=l/8 當(dāng)16^C("〈32時,Cmin=l/16
      當(dāng)32SC(A)時,Cmin=l/32
      平坦化曲線^")的計算如下(設(shè)一幀中第k個數(shù)據(jù)塊是第一個瞬變塊)<formula>formula see original document page 8</formula>使用y(x)對該幀信號加窗,這樣就可以抑制信號瞬變部分的幅度,使信號平坦化。
      第六步將瞬變信息,如瞬變幀標(biāo)識、瞬變位置和瞬變強度打包到AVS音頻碼流中。
      其他處理與穩(wěn)態(tài)信號相同,解碼端根據(jù)碼流中瞬變信息對解碼得到的信號進行反向 操作即可還原原始數(shù)據(jù)。
      試驗結(jié)果如圖3-圖5所示。其中,圖3是原始響板序列的波形圖,該波形圖中暫態(tài)現(xiàn) 象明顯,且瞬變信號之前的噪聲很低;圖4是基于AVS音頻編解碼平臺采用多分辨率分析
      方法處理后的響板序列的波形圖,從該波形圖可以看出經(jīng)過編/解碼處理的信號保持 了較好的時域分辨率,瞬變信號之前的噪聲也得到了抑制,未出現(xiàn)明顯的噪聲;圖5是
      基于AVS音頻編解碼平臺釆用本發(fā)明的方法處理后的響板序列的波形圖,從該波形圖可
      以看出經(jīng)過編解碼處理的信號也保持了很好的時域分辨率,瞬變信號之前的噪聲也得
      到了有效抑制,噪聲明顯低于多分辨率分析方法的結(jié)果。
      實施方案2:采用的DolbyAC-3音頻編解碼平臺,對典型的響板序列(單聲道、 44.1kHz采樣頻率、16比特樣本精度、編碼碼率64kbps/ch)的實施方案。
      本發(fā)明的具體實施方式
      舉例說明如下例如,在AC-3音頻編碼器中, 一幀信號的 長度為512個采樣點<formula>formula see original document page 8</formula>44.1kHz采樣時一幀信號的時間約為 11.6ms,以32個采樣點為一個數(shù)據(jù)塊,即每個數(shù)據(jù)塊大約0.7ms,每幀一共16個數(shù)據(jù)塊。
      設(shè)每個數(shù)據(jù)塊樣點的總功率為<formula>formula see original document page 8</formula>。
      定義l:每個數(shù)據(jù)塊樣點的功率相對于前一數(shù)據(jù)塊的比值
      C(A:) = ^^^;(尸(A-1)! = 0,4 = 2,3,...,15)稱為該數(shù)據(jù)塊的瞬變強度。 単-1)
      定義2:瞬變強度C("超過某一閾值K的數(shù)據(jù)塊稱為瞬變塊。
      第一步數(shù)據(jù)塊劃分。 一幀中的信號按照上面的定義每32個連續(xù)樣點分為一個數(shù)據(jù)塊。
      第二步計算并檢測一幀中各數(shù)據(jù)塊的瞬變強度。
      依次計算每個數(shù)據(jù)塊的瞬變強度e(",并于閾值^進行比較,當(dāng)e")大于^時(這
      里取^^2),則認(rèn)為該數(shù)據(jù)塊為瞬變塊。
      第三步將一幀中的所有瞬變塊標(biāo)記為瞬變位置,并將該幀標(biāo)記為暫態(tài)幀。 第四步剔除冗余的瞬變位置。
      因為信號的前向掩蔽時間一般為20ms,實際作用時間一般考慮在0.5 2ms以內(nèi)有 效,所以k^2,3,4三個數(shù)據(jù)塊中,如果發(fā)生瞬變則不用考慮,因為在瞬變位置的前面只 有約2ms左右的信號,可以被前向掩蔽效應(yīng)掩蔽。又因為信號的后向掩蔽時間較長,約 200ms,有效時間一般取20ms左右,所以在檢測到第一個瞬變位置后,其余的瞬變位置 就可以剔除了。
      第五步時域平坦化處理
      根據(jù)前面求得的瞬變強度e("來確定平坦化曲線衰減的最小值e皿。具體方法如

      <formula>formula see original document page 9</formula>
      平坦化曲線^")的計算如下(設(shè)一幀中第k個數(shù)據(jù)塊是第一個瞬變塊)<formula>formula see original document page 9</formula><formula>formula see original document page 9</formula>
      使用^oo對該幀信號加窗,這樣就可以抑制信號瞬變部分的幅度,使信號平坦化。
      第六步將瞬變信息,如瞬變幀標(biāo)識、瞬變位置和瞬變強度打包到AVS音頻碼流中。 其他處理與穩(wěn)態(tài)信號相同,解碼端根據(jù)碼流中瞬變信息對解碼得到的信號進行反向 操作即可還原原始數(shù)據(jù)。
      權(quán)利要求
      1. 一種預(yù)回聲控制方法,通過檢測暫態(tài)信號中的瞬變位置和瞬變強度對原始信號進行時域平坦化處理,該方法包括以下過程將待編碼音頻幀數(shù)據(jù)劃分為多個數(shù)據(jù)塊;計算每個數(shù)據(jù)塊的瞬變強度;將其中瞬變強度超過閾值的數(shù)據(jù)塊標(biāo)記為瞬變數(shù)據(jù)塊;對瞬變起始數(shù)據(jù)塊,即瞬變起始位置進行標(biāo)記,并根據(jù)人耳的掩蔽效應(yīng)剔除冗余的瞬變位置;根據(jù)瞬變強度繪制時域平坦化曲線;如有多個瞬變位置,則合成時域平坦化曲線;將平坦化曲線與瞬變位置對齊,對改幀信號進行加窗、平坦化處理。
      2. 如權(quán)利要求1所述的預(yù)回聲控制方法,其特征在于,所述將待編碼音頻幀數(shù)據(jù)劃' 分為多個數(shù)據(jù)塊步驟,在AVS音頻編碼標(biāo)準(zhǔn)中, 一幀信號的長度為1024個采樣點, 44.1kHz采樣時一幀信號的時間為23.22ms,以32個采樣點為一個數(shù)據(jù)塊,每個數(shù)據(jù)塊大 約0.7ms,每幀一共32個數(shù)據(jù)塊。
      3. 如權(quán)利要求l所述的預(yù)回聲控制方法,其特征在于,所述將待編碼音頻幀數(shù)據(jù)劃 分為多個數(shù)據(jù)塊步驟,在AC-3音頻編碼器中, 一幀信號的長度為512個釆樣點,44.1kHz 采樣時一幀信號的時間約為11.6ms,以32個采樣點為一個數(shù)據(jù)塊即每個數(shù)據(jù)塊大約 0.7ms,每幀一共16個數(shù)據(jù)塊。
      4. 如權(quán)利要求l所述的預(yù)回聲控制方法,其特征在于,所述將其中瞬變強度超過閾 值的數(shù)據(jù)塊標(biāo)記為瞬變數(shù)據(jù)塊的步驟,還進一步包括以下步驟將該幀標(biāo)記為暫態(tài)幀。
      5. 如權(quán)利要求l所述的預(yù)回聲控制方法,其特征在于,所述根據(jù)瞬變強度繪制時域平坦化曲線的步驟,進一步包括以下步驟根據(jù)前面求得的瞬變強度e("來確定平坦化曲線衰減的最小值G皿當(dāng)7;〈C(A:)〈4時,Cmin=l/2 當(dāng)4SC(A:)〈8時,Cmin=l/4 當(dāng)8仰)<16時,Cmin=l/8 當(dāng)16SC("〈32時,Cmin=l/16 當(dāng)32SC("時,Cmm=l/32設(shè)一幀中第k個數(shù)據(jù)塊是第一個瞬變塊,平坦化曲線><^的計算如下_y(x) = 1; 0 = 0,1,…,32 * (A: — 1) — 1) y(;c) = 1 — l^saL(x — 32 * (A: _ l)); (x = 32 * (A: _ 1), 32 * (A: _ 1) +1,…,32 * " 1) y(x) = Cmm; (x = 32 * A:, 32 * A: +1,…,1024 _ 1)平坦化曲線與瞬變位置對齊平坦化曲線從瞬變位置處開始。
      全文摘要
      本發(fā)明公開了一種預(yù)回聲控制方法,通過檢測暫態(tài)信號中的瞬變位置和瞬變強度對原始信號進行時域平坦化處理,該方法包括以下過程將待編碼音頻幀數(shù)據(jù)劃分為多個數(shù)據(jù)塊;計算每個數(shù)據(jù)塊的瞬變強度;將其中瞬變強度超過閾值的數(shù)據(jù)塊標(biāo)記為瞬變數(shù)據(jù)塊;對瞬變起始數(shù)據(jù)塊,即瞬變起始位置進行標(biāo)記,并根據(jù)人耳的掩蔽效應(yīng)剔除冗余的瞬變位置;根據(jù)瞬變強度繪制時域平坦化曲線;如有多個瞬變位置,則合成時域平坦化曲線;將平坦化曲線與瞬變位置對齊,對改幀信號進行加窗、平坦化處理。本發(fā)明與以往方案相比,直接針對瞬變位置進行噪聲抑制,從而有效控制預(yù)回聲現(xiàn)象。
      文檔編號G10L19/00GK101388213SQ20081005374
      公開日2009年3月18日 申請日期2008年7月3日 優(yōu)先權(quán)日2008年7月3日
      發(fā)明者濤 張, 海 李, 楊東明, 偉 王 申請人:天津大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1