頻域中基于cpl進行編碼的低頻增強的制作方法

文檔序號：9402045閱讀：406來源：國知局

頻域中基于cpl進行編碼的低頻增強的制作方法
【專利說明】頻域中基于CPL進行編碼的低頻增強
[0001] 眾所周知，非語音信號例如音樂聲音在處理上會比人類聲帶聲音更復雜，從而占用更寬的頻帶。現(xiàn)有技術(shù)中最新的音頻編碼系統(tǒng)諸如AMR-WB+[3]和xHE-AAC[4]為音樂及其它一般非語音信號提供了變換編碼工具。此工具通常被稱為變換碼激勵（TCX，transform coded excitation)并且是基于在頻域內(nèi)被量化且被熵編碼的線性預測編碼（LPC，linear predictive coding)殘差的稱為激發(fā)的傳輸原理。然而，由于在LPC級中使用的有限階的預測器，在譯碼信號中，尤其在人類聽覺極其靈敏的低頻處的譯碼信號中，會出現(xiàn)偽影。為此，在[1-3]中介紹低頻增強及還原（de-emphasis)方案。
[0002] 所述現(xiàn)有技術(shù)的適應性低頻增強（ALFE，adaptive low-frequency emphasis)方案將低頻譜線在編碼器中進行量化之前對其進行放大。具體而言，低頻線被分組為頻帶，計算每一頻帶的能量，并且找到局部能量最大的頻帶?；谀芰孔畲蟮闹岛臀恢?，使最大能量頻帶以下的頻帶被增大，以使得這些頻帶在后續(xù)量化中更精確地被量化。
[0003] 低頻還原--被執(zhí)行以使ALFE在對應的譯碼器中逆變（invert)--在概念上極其類似。如在編碼器中所進行的，建立低頻頻帶并且確定具有最大能量的頻帶。與在編碼器中不同的是，現(xiàn)在使能量高峰以下的頻帶衰減。此過程大致恢復初始頻譜的線能量。
[0004] 值得注意的是，在現(xiàn)有技術(shù)中，在編碼器中頻帶能量計算是在量化之前執(zhí)行，即，在輸入頻譜上執(zhí)行，然而在譯碼器中該頻帶能量計算是在經(jīng)逆變量化的線上執(zhí)行，即，在譯碼頻譜上執(zhí)行。盡管量化運算可被設計成使得頻譜能量保持為平均值，但是對于單個頻譜線無法保證保持精確的能量。因此，無法使ALFE理想地逆變。此外，在現(xiàn)有技術(shù)ALFE的優(yōu) 選實現(xiàn)方式中，在編碼器和譯碼器中都需要平方根運算。期望避免這種相對復雜的運算。
[0005] 本發(fā)明的目標在于提供用于音頻信號處理的改進理念。更具體地，本發(fā)明的目標在于提供用于適應性低頻增強和還原的改進理念。本發(fā)明的目標通過根據(jù)權(quán)利要求1的音頻編碼器、根據(jù)權(quán)利要求11的音頻譯碼器，通過根據(jù)權(quán)利要求21的系統(tǒng)，通過根據(jù)權(quán)利要求22和23的方法且通過根據(jù)權(quán)利要求24的計算機程序來達到。
[0006] 在一個方面中，本發(fā)明提供了一種音頻編碼器，其用于對非語音音頻信號進行編碼以便依據(jù)該非語音音頻信號產(chǎn)生比特流，該音頻編碼器包含：
[0007] 線性預測編碼濾波器和時間-頻率轉(zhuǎn)換器的組合，該線性預測編碼濾波器具有多個線性預測編碼系數(shù)，其中該組合被配置成基于該音頻信號的幀并且基于該線性預測編碼系數(shù)將該音頻信號的幀進行濾波并且轉(zhuǎn)換進頻域，以便輸出頻譜；
[0008] 低頻增強器，其被配置成基于該頻譜來計算經(jīng)處理的頻譜，其中該經(jīng)處理的頻譜中的表示比參考頻譜線更低的頻率的頻譜線被增強；以及
[0009] 控制裝置，其被配置成根據(jù)該線性預測編碼濾波器的線性預測編碼系數(shù)來控制由該低頻增強器進行的對該經(jīng)處理的頻譜的計算。
[0010] 線性預測編碼濾波器（LPC濾波器）是使用線性預測模型的信息的在音頻信號處理和語音處理中使用的用于表示壓縮形式的聲音的成幀數(shù)字信號的頻譜包絡的工具。
[0011] 時間-頻率轉(zhuǎn)換器是用于尤其將成幀的數(shù)字信號從時域轉(zhuǎn)換進頻域以便估計信號的頻譜的工具。時間-頻率轉(zhuǎn)換器可使用改進型離散余弦變換（MDCT，modified discrete cosine transform)，該改進型離散余弦變換是基于第四型離散余弦變換（DCT-IV)的重疊變換，具有重疊的附加性質(zhì)：該改進型離散余弦變換被設計成對較大數(shù)據(jù)集的連續(xù)幀執(zhí)行變換，其中后續(xù)幀重疊使得一個幀的后半部分與下一個幀的前半部分重合。除DCT的能量聚集品質(zhì)之外，此重疊還使得MDCT對于信號壓縮應用尤其具有吸引力，這是因為該重疊有助于避免源于幀邊界的偽影。
[0012] 低頻增強器被配置成基于頻譜來計算經(jīng)處理的頻譜，其中經(jīng)處理的頻譜中的表示比參考頻譜線更低的頻率的頻譜線被增強，使得僅經(jīng)處理的頻譜中所包含的低頻被增強。該參考頻譜線可基于經(jīng)驗實驗來預定義。
[0013] 控制裝置被配置成根據(jù)該線性預測編碼濾波器的線性預測編碼系數(shù)來控制由該低頻增強器進行的對經(jīng)處理的頻譜的計算。因此，根據(jù)本發(fā)明的編碼器不需要為了低頻增強目的而分析音頻信號的頻譜。此外，因為相同的線性預測編碼系數(shù)可在編碼器中并且在后續(xù)譯碼器中使用，所以適應性低頻增強是完全可逆的，而與頻譜量化無關(guān)，只要線性預測編碼系數(shù)在由編碼器或由任何其它裝置產(chǎn)生的比特流中傳輸至譯碼器即可。一般而言，線性預測編碼系數(shù)無論如何必須在比特流中傳輸，以達到通過相應譯碼器從比特流重建音頻輸出信號的目的。因此，比特流的比特率將不會通過如本文所述的低頻增強而增加。
[0014] 本文所述的適應性低頻增強系統(tǒng)可以在能夠基于每一幀在時域編碼與MDCT域編碼之間切換的xHE-AAC[4]的低延遲變體、LD-USAC(EVS)的TCX核心編碼器中實現(xiàn)。
[0015] 根據(jù)本發(fā)明的優(yōu)選實施例，該音頻信號的幀輸入至該線性預測編碼濾波器，其中經(jīng)濾波的幀由該線性預測編碼濾波器輸出，并且其中該時間-頻率轉(zhuǎn)換器被配置成基于該經(jīng)濾波的幀來估計該頻譜。因此，線性預測編碼濾波器可在時域中操作，以音頻信號作為其輸入。
[0016] 根據(jù)本發(fā)明的優(yōu)選實施例，該音頻信號的幀輸入至該時間-頻率轉(zhuǎn)換器，其中經(jīng) 轉(zhuǎn)換的幀由該時間-頻率轉(zhuǎn)換器輸出，且其中該線性預測編碼濾波器被配置成基于該經(jīng)轉(zhuǎn) 換的幀來估計該頻譜。可選地，但與發(fā)明的編碼器的具有低頻增強器的第一實施例等效地，編碼器可基于借助于頻域噪聲整型（FDNS，frequency-domain noise shaping)產(chǎn)生的幀的頻譜來計算經(jīng)處理的頻譜，如例如在[5]中所公開的。更具體地，此處修改工具次序：時間-頻率轉(zhuǎn)換器諸如上面所提及的時間-頻率轉(zhuǎn)換器可被配置成基于音頻信號的幀來估計經(jīng)轉(zhuǎn)換的幀，并且線性預測編碼濾波器被配置成基于經(jīng)轉(zhuǎn)換的幀來估計音頻頻譜，該經(jīng)轉(zhuǎn) 換的幀由時間-頻率轉(zhuǎn)換器輸出。因此，線性預測編碼濾波器可在頻域（而非時域）中操作，以經(jīng)轉(zhuǎn)換的幀作為其輸入，其中經(jīng)由乘以線性預測編碼系數(shù)的頻譜表示來應用線性預測編碼濾波器。
[0017] 對于本領(lǐng)域的技術(shù)人員明顯的是，可以實現(xiàn)這兩種方法--在時域中的線性濾波之后進行時間-頻率轉(zhuǎn)換與在時間-頻率轉(zhuǎn)換之后進行在頻域中的經(jīng)由頻譜加權(quán)的線性濾波，使得該兩種方法是等效的。
[0018] 根據(jù)本發(fā)明的優(yōu)選實施例，該音頻編碼器包含：量化裝置，其被配置成基于該經(jīng)處理的頻譜產(chǎn)生量化頻譜；以及比特流產(chǎn)生器，其被配置成將該量化頻譜和線性預測編碼系數(shù)嵌入該比特流中。量化在數(shù)字信號處理中是將一大組輸入值映射至（可計數(shù)的）較小組例如將值舍位至某個精度單位的處理。執(zhí)行量化的裝置或算法函數(shù)被稱為量化裝置。比特流產(chǎn)生器可以是能夠?qū)碜圆煌吹臄?shù)字數(shù)據(jù)嵌入整體的比特流中的任何裝置。通過這些特征，可容易地產(chǎn)生使用適應性低頻增強產(chǎn)生的比特流，其中通過后續(xù)譯碼器僅使用比特流中所包含的信息，適應性低頻增強是完全可逆的。
[0019] 在本發(fā)明的優(yōu)選實施例中，該控制裝置包括：頻譜分析儀，其被配置成估計線性預測編碼系數(shù)的頻譜表示；最小-最大分析儀，其被配置成估計在另一參考頻譜線以下的該頻譜表示的最小值和該頻譜表示的最大值；以及增強因子計算器，其被配置成基于該最小值并且基于該最大值來計算頻譜線增強因子，該頻譜線增強因子用于計算該經(jīng)處理的頻譜中的表示比該參考頻譜線更低的頻率的頻譜線，其中經(jīng)處理的頻譜的頻譜線是通過將頻譜線增強因子施加于該經(jīng)濾波的幀的頻譜的頻譜線來增強。頻譜分析儀可以是如上所述的時間-頻率轉(zhuǎn)換器。頻譜表示是線性預測編碼濾波器的轉(zhuǎn)移函數(shù)，并且可以是但不必一定是與如以上所述用于FDNS的頻譜表示相同的頻譜表示。頻譜表示可根據(jù)線性預測編碼系數(shù) 的奇數(shù)離散傅立葉變換（ODFT，odd discrete Fourier transform)來計算。在xHE-AAC和 LD-USAC中，轉(zhuǎn)移函數(shù)可通過覆蓋整個頻譜表示的32個或64個MDCT域增益來近似。
[0020] 在本發(fā)明的優(yōu)選實施例中，增強因子計算器系進行配置的方式為在從該參考頻譜線至表示頻譜的最低頻率的頻譜線的方向上頻譜線增強因子增大。這意味著表示最低頻率的頻譜線被放大得最多，而與參考頻譜線相鄰的頻譜線被放大得最少。參考頻譜線和表示比參考頻譜線更高的頻率的頻譜線根本不增強。這樣降低了計算復雜性而未聽聞任何缺點。
[0021] 在本發(fā)明的優(yōu)選實施例中，該增強因子計算器包括第一級，該第一級被配置成根據(jù)第一公式γ = (a ^minAiax) e來計算基礎(chǔ)增強因子，其中，α為第一預設值，α>1，β 為第二預設值，〇〈β <l，min為該頻譜表示的最小值，max為該頻譜表示的最大值，且γ為該基礎(chǔ)增強因子，并且其中該增強因子計算器包括第二級，該第二級被配置成根據(jù)第二公式E1= γ 1來計算頻譜線增強因子，其中i'為要增強的頻譜線的數(shù)目，i為相應頻譜線的索引，該索引隨著該頻譜線的頻率而增大，從i = 〇至i' -1，γ為該基礎(chǔ)增強因子且ε i 為索引為i的該頻譜線增強因子?；A(chǔ)增強因子以容易的方式通過第一公式根據(jù)最小值與最大值的比率來計算?；A(chǔ)增強因子用作所有頻譜線增強因子的計算的基礎(chǔ)，其中第二公式確保在從參考頻譜線至表示頻譜的最低頻率的頻譜線的方向上頻譜線增強因子增大。與現(xiàn)有技術(shù)解決方案相比，所提出的解決方案不需要對每一頻譜帶進行平方根或類似的復雜運算。僅需要2個除法算子和2個冪算子，其中一個算子在編碼器側(cè)，一個算子在譯碼器側(cè)。
[0022] 在本發(fā)明的優(yōu)選實施例中，該第一預設值小于42且大于22,具體地小于38且大于 26,更具體地小于34且大于30。上述區(qū)間是基于經(jīng)驗實驗。當?shù)谝活A設值設定為32時可達到最佳結(jié)果。
[0023] 在本發(fā)明的優(yōu)選實施例中，該第二預設值是根據(jù)公式β = 1ΛΘ ·Γ)來確定，其中i'為正被增強的頻譜線的數(shù)目，Θ為介于3與5之間的因子，具體地，介于3, 4與4, 6之間的因子，更具體地，介于3, 8與4, 2之間的因子。這些區(qū)間也是基于經(jīng)驗實驗。已發(fā)現(xiàn)，當?shù)诙A設值設定為4時可達到最佳結(jié)果。
[0024] 在本發(fā)明的優(yōu)選實施例中，該參考頻譜線表示介于600Hz與1000Hz之間的頻率，具體地，介于700Hz與900Hz之間的頻率，更具體地，介于750Hz與850Hz之間的頻率。這些憑經(jīng)驗找到的區(qū)間確保充分的低頻增強和系統(tǒng)的低計算復雜性。這些區(qū)間尤其確保在密集占用的頻譜中以足夠的精確度對較低頻率線進行編碼。在優(yōu)選實施例中，參考頻譜線表示800Hz，其中32個頻譜線被增強。
[0025] 在本發(fā)明的優(yōu)選實施例中，該另一參考頻譜線表示與該參考頻譜線相同的頻率或比該參考頻譜線更高的頻率。這些特征確保了在相關(guān)頻率范圍中進行對最小值和最大值的估計。
[0026] 在本發(fā)明的優(yōu)選實施例中，該控制裝置進行配置的方式為僅在該最大值小于該最小值乘以該第一預設值α時經(jīng)處理的頻譜中的表示比該參考頻率更低的頻率的頻譜線被增強。這些特征確保了低頻增強僅在需要時執(zhí)行，使得可使編碼器的工作負載最小化并且在頻譜量化期間不會將比特浪費在感覺上不重要的區(qū)域上。
[0027] 在一個方面中，本發(fā)明提供了一種音頻譯碼器，其用于基于非語音音頻信號來對比特流進行譯碼，以便依據(jù)該比特流產(chǎn)生經(jīng)譯碼的非語音音頻輸出信號，尤其用于對根據(jù) 本發(fā)明的音頻編碼器所產(chǎn)生的比特流進行譯碼，該比特流包含量化頻譜和多個線性預測編碼系數(shù)，該音頻譯碼器包括：
[0028] 比特流接收器，其被配置成從該比特流提取該量化頻譜和線性預測編碼系數(shù)；
[0029] 解量化裝置，其被配置成基于該量化頻譜產(chǎn)生解量化頻譜；
[0030] 低頻還原器，其被配置成基于該解量化頻譜來計算經(jīng)逆處理的頻譜，

完整全部詳細技術(shù)資料下載

當前第1頁1 2 3 4 5 6

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：斯特凡·德勒;伯恩哈德·格里爾;克里斯蒂安·黑爾姆里希;尼古勞斯·雷特爾巴赫;
技術(shù)所有人：弗勞恩霍夫應用研究促進協(xié)會;
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

頻域圖像增強相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

頻域中基于cpl進行編碼的低頻增強的制作方法