低復(fù)雜度音調(diào)自適應(yīng)音頻信號(hào)量化的制作方法

文檔序號(hào)：9383156閱讀：626來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

低復(fù)雜度音調(diào)自適應(yīng)音頻信號(hào)量化的制作方法
【專利說明】低復(fù)雜度音調(diào)自適應(yīng)音頻信號(hào)量化
[0001] 本發(fā)明涉及數(shù)字音頻信號(hào)處理。更具體地，本發(fā)明涉及音頻信號(hào)量化。
[0002] 在極低比特率變換編碼中，每幀的位的數(shù)目通常不足以避免解碼的信號(hào)中的偽影。特別是，由于變換線（頻點(diǎn)（bin))在某一頻率處逐幀被"打開及關(guān)閉"，即量化為零或未量化為零，音樂噪聲可以出現(xiàn)在固定音樂或噪聲頻譜中。這樣的編碼方法不僅給予解碼的信號(hào)區(qū)與原始信號(hào)相比更加具有音調(diào)性的特性（因此術(shù)語為音樂噪聲），而且其相對(duì)于未編碼所述頻譜區(qū)根本沒有產(chǎn)生顯著的優(yōu)點(diǎn)，并且反而應(yīng)用了類似于在xHE_AAC[4]中使用的TCX或FD編碼系統(tǒng)中的噪聲填充算法的頻點(diǎn)替換技術(shù)。事實(shí)上，傾向于音樂編碼噪聲的區(qū)域的顯式但非充分編碼需要在變換編碼器的熵編碼階段中的位，其在聲音上較好地耗費(fèi)在其它頻譜區(qū)中，特別是在人類聽覺系統(tǒng)靈敏的低頻率處。
[0003] 減少音樂噪聲在低比特率音頻編碼中出現(xiàn)的一個(gè)方法是，修改將輸入頻譜線映射至量化索引的量化器的行為，使得該量化器適于瞬時(shí)輸入信號(hào)特性和量化頻譜的位消耗。更準(zhǔn)確地，信號(hào)自適應(yīng)地改變了在量化期間使用的死區(qū)。已公開了若干方法[5、6及其中的參考]。在[5]中，對(duì)將要編碼的整個(gè)頻譜執(zhí)行量化器適應(yīng)。因此，已適應(yīng)的量化器對(duì)于給定幀的所有頻點(diǎn)行為相同。此外，在最佳死區(qū) 2_的量化的情況下，邊信息的2個(gè)位必須被傳輸至解碼器，表示比特率及向后兼容懲罰。在[6]中，基于每頻率頻帶對(duì)量化器進(jìn)行調(diào) 適，但每頻帶進(jìn)行兩個(gè)量化嘗試，并且（根據(jù)某一決策）僅將較佳的嘗試用于傳輸。這是復(fù) 雜的。
[0004] 本發(fā)明的目的在于提供音頻信號(hào)處理的改進(jìn)概念。更具體的，本發(fā)明的目的在于提供自適應(yīng)音頻信號(hào)量化的改進(jìn)概念。本發(fā)明的目的通過根據(jù)權(quán)利要求1的音頻編碼器、通過根據(jù)權(quán)利要求15的系統(tǒng)、通過根據(jù)權(quán)利要16的方法并且通過根據(jù)權(quán)利要17的計(jì)算機(jī) 程序來實(shí)現(xiàn)。
[0005] 在一個(gè)方面中，本發(fā)明提供一種音頻編碼器，用于對(duì)音頻信號(hào)進(jìn)行編碼，以便從中產(chǎn)生編碼信號(hào)，該音頻編碼器包括：
[0006] 幀裝置，其被配置成從該音頻信號(hào)提取幀；
[0007] 量化器，其被配置成將從該音頻信號(hào)的幀得到的頻譜信號(hào)的頻譜線映射至量化索弓丨；其中，該量化器具有死區(qū)，在該死區(qū)中頻譜線被映射至量化索引零；以及
[0008] 控制裝置，其被配置成修改死區(qū)；
[0009] 其中，該控制裝置包括音調(diào)計(jì)算裝置，其被配置成計(jì)算用于至少一個(gè)頻譜線或用于至少一組頻譜線的至少一個(gè)音調(diào)指示值，
[0010] 其中，該控制裝置被配置成取決于各個(gè)音調(diào)指示值來修改用于至少一個(gè)頻譜線或至少一組頻譜線的該死區(qū)。
[0011] 幀裝置可以被配置成通過將窗口函數(shù)應(yīng)用至音頻信號(hào)來從音頻信號(hào)提取幀。在信號(hào)處理中，窗口函數(shù)（也稱為切趾函數(shù)或漸變函數(shù)）為在某些選定的區(qū)間以外為零值的數(shù) 學(xué)函數(shù)。通過將窗口函數(shù)應(yīng)用至信號(hào)，可以將信號(hào)分解為短片段，其通常被稱為幀。
[0012] 在數(shù)字音頻信號(hào)處理中，量化是將一大組輸入值映射至（可計(jì)數(shù)的）較小組（如將值舍位至某些精度的單位）的過程。執(zhí)行量化的裝置或算法函數(shù)被稱為量化器。
[0013] 根據(jù)本發(fā)明，針對(duì)音頻信號(hào)的幀計(jì)算頻譜信號(hào)。頻譜信號(hào)可以包含音頻信號(hào)的幀中的每一個(gè)的頻譜，該音頻信號(hào)為時(shí)域信號(hào)，其中每一個(gè)頻譜為頻域中的幀的一個(gè)的表示。頻率譜可以經(jīng)由信號(hào)的數(shù)學(xué)變換來產(chǎn)生，并且結(jié)果值通常呈現(xiàn)為振幅對(duì)比于頻率。
[0014] 死區(qū)為在量化期間使用的區(qū)域，其中頻譜線（頻點(diǎn)）或多組頻譜線（頻帶）被映射至零。死區(qū)具有通常在零振幅處的下限，以及可以針對(duì)對(duì)不同頻譜線或多組頻譜線而變化的上限。
[0015] 根據(jù)本發(fā)明，死區(qū)可以通過控制裝置進(jìn)行修改。控制裝置包括音調(diào)計(jì)算裝置，其被配置成計(jì)算用于至少一個(gè)頻譜線或用于至少一組頻譜線的至少一個(gè)音調(diào)指示值。
[0016] 術(shù)語"音調(diào)"指頻譜信號(hào)的音調(diào)特性。一般而言，在頻譜主要包括周期分量的情況下可以說音調(diào)高，其意指幀的頻譜包括主峰值。音調(diào)特性的相反特性為噪聲特性。在后者情況下，幀的頻譜更平坦。
[0017] 此外，控制裝置被配置成取決于各個(gè)音調(diào)指示值來修改用于該至少一個(gè)頻譜線或該至少一組頻譜線的死區(qū)。
[0018] 本發(fā)明揭示了具有信號(hào)自適應(yīng)死區(qū)的量化方案，該信號(hào)自適應(yīng)死區(qū)
[0019] ?不需要任何邊信息，允許其在現(xiàn)有介質(zhì)編解碼器中的使用，
[0020] ?在量化之前決定每頻點(diǎn)或頻帶使用哪一個(gè)死區(qū)，節(jié)約復(fù)雜度，
[0021] ?可以基于頻帶頻率和/或信號(hào)音調(diào)來確定每頻點(diǎn)或每頻帶死區(qū)。
[0022] 本發(fā)明可以應(yīng)用于現(xiàn)有編碼結(jié)構(gòu)中，因?yàn)閮H改變編碼器中的信號(hào)量化器；對(duì)應(yīng)的解碼器將仍能夠讀取從編碼信號(hào)產(chǎn)生的（未改變的）比特流，并且對(duì)輸出進(jìn)行解碼。與[6] 及其參考不同，在量化前之前選擇用于每組頻譜線或用于每個(gè)頻譜線的死區(qū)，所以每組頻譜線或每個(gè)頻譜線僅一個(gè)量化運(yùn)算是必要的。最后，量化器決策不限于在兩個(gè)可能的死區(qū) 值之間進(jìn)行選取，而是在值的整個(gè)范圍進(jìn)行選取。下文詳述決策。以上概術(shù)的音調(diào)自適應(yīng) 量化方案可以在LD-USAC編碼器的變換編碼激勵(lì)（TCX)路徑中實(shí)施，該LD-USAC編碼器為 xHE-AAC[4]的低延遲變體。
[0023] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，控制裝置被配置成用以下方式來修改死區(qū)DZ :在頻譜線中的一個(gè)處的死區(qū)大于在具有較大音調(diào)的頻譜線中的一個(gè)處的死區(qū)，或者在多組頻譜線中的一組處的死區(qū)大于在具有較大音調(diào)的多組頻譜線中的一組處的死區(qū)。通過這些特征，非音調(diào)頻譜區(qū)將傾向于被量化為零，其意指可以減少數(shù)據(jù)的量。
[0024] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，控制裝置包括功率頻譜計(jì)算裝置，其被配置成計(jì)算音頻信號(hào)的幀的功率頻譜，其中該功率頻譜包括頻譜線或多組頻譜線的功率值，其中，音調(diào) 計(jì)算裝置被配置成取決于功率頻譜來計(jì)算至少一個(gè)音調(diào)指示值。通過基于功率頻譜來計(jì)算音調(diào)指示值，計(jì)算復(fù)雜度保持相當(dāng)?shù)汀?br>[0025] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，用于頻譜線中的一個(gè)的音調(diào)指示值基于用于各個(gè)頻譜線的功率值與功率頻譜的各個(gè)頻譜線周圍的預(yù)定數(shù)目的功率值之和的比較，或者其中，用于多組頻譜線中的一組的音調(diào)指示值基于用于各個(gè)組的頻譜線的功率值與功率頻譜的各個(gè)組的頻譜線周圍的預(yù)定數(shù)目的功率值之和的比較。通過對(duì)功率值與其相鄰功率值進(jìn)行比較，可以容易地識(shí)別功率頻譜的峰值區(qū)域或平坦區(qū)域，以使得可以以容易的方式計(jì)算音調(diào)指示值。
[0026] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，用于頻譜線中的一個(gè)的音調(diào)指示值基于音頻信號(hào)的在先幀的頻譜線的音調(diào)指示值，或者其中，用于多組頻譜線中的一組的音調(diào)指示值基于用于音頻信號(hào)的在先幀的該組頻譜線的音調(diào)指示值。通過這些特征，將以平滑的方式隨著時(shí) 間推移對(duì)死區(qū)進(jìn)行修改。
[0027] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，通過以下公式計(jì)算該音調(diào)指示值：
[0028]
[0029] 兵干，1 73指不談苜頻1目虧的狩疋Ψ貝的系引，k 73指不狩疋頻諧線的系引，為第 i幀的第k頻譜線的功率值，或者其中，通過以下公式計(jì)算該音調(diào)指示值：
[0030]
[0031] 其中，i為指示音頻信號(hào)的特定幀的索引，m為指示頻譜線的特定組的索引，Pniil為第i幀的頻譜線的第m組頻譜線的功率值。如將從公式中注意到的那樣，根據(jù)作為當(dāng)前幀的第i幀并且根據(jù)作為在先幀的第i-Ι幀的功率值來計(jì)算音調(diào)指示值?？梢酝ㄟ^省略對(duì)第 i-Ι幀的依賴性來改變公式。此處，第k功率值的7個(gè)左側(cè)和7個(gè)右側(cè)相鄰功率值之和被計(jì) 算并且除以各個(gè)功率值。使用這個(gè)公式，低音調(diào)指示值指示高音調(diào)。
[0032] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，音頻編碼器包括起始頻率計(jì)算裝置，其被配置成計(jì) 算用于修改該死區(qū)的起始頻率，其中，僅針對(duì)表示高于或等于起始頻率的頻率的頻譜線對(duì) 死區(qū)進(jìn)行修改。這意指死區(qū)對(duì)于低頻率是固定的，并且對(duì)于較高頻率是可變的。這些特征導(dǎo)致較好的音頻質(zhì)量，因?yàn)槿祟惵犛X系統(tǒng)在低頻率處更為靈敏。
[0033] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，起始頻率計(jì)算裝置被配置成基于音頻信號(hào)的樣本率和/或基于針對(duì)從編碼信號(hào)產(chǎn)生的比特流預(yù)見的最大比特率來計(jì)算起始頻率。通過這些特征將可以對(duì)音頻質(zhì)量進(jìn)行優(yōu)化。
[0034] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，音頻編碼器包括：修改離散余弦變換計(jì)算裝置，其被配置成根據(jù)音頻信號(hào)的幀來計(jì)算修改的離散余弦變換；以及修改離散正弦變換計(jì)算裝置，其被配置成根據(jù)音頻信號(hào)的幀來計(jì)算修改的離散正弦變換，其中，功率頻譜計(jì)算裝置被配置成基于修改的離散余弦變換和基于修改的離散正弦變換來計(jì)算功率頻譜。不管怎樣，為了對(duì)音頻信號(hào)進(jìn)行編碼的目的，必須計(jì)算修改的離散余弦變換。因此，只是為了音調(diào)自適應(yīng) 量化的目的，必須另外計(jì)算修改的離散正弦變換。從而，可以降低復(fù)雜度。然而，可以使用如離散傅里葉變換或奇數(shù)離散傅立葉變換的其它變換。
[0035] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，功率頻譜計(jì)算裝置被配置成根據(jù)公式Pk, i = (MDCT k, J^(MDSTu)2來計(jì)算功率值，其中i為指示音頻信號(hào)的特定幀的索引，k為指示特定頻譜線的索引，MDCI mS在該第i幀的第k頻譜線處的修改的離散余弦變換的值，MDSTkil為在該第i幀的第k頻譜線處的修改的離散正弦變換的值，以及P kil為該第i幀的第k頻譜線的功率值。以上公式允許以容易的方式計(jì)算功率值。
[0036] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，音頻編碼器包括頻譜信號(hào)計(jì)算裝置，其被配置成產(chǎn) 生頻譜信號(hào)，其中，頻譜信號(hào)計(jì)算裝置包括振幅設(shè)定裝置，其被配置成以補(bǔ)償由于對(duì)死區(qū)的修改造成的能量損失的方式來設(shè)置頻譜信號(hào)的頻譜線的振幅。通過這些特征，可以以能量保持的方式進(jìn)行量化。
[0037] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，振幅設(shè)定裝置被配置成取決于各個(gè)頻譜線處的死區(qū) 的修改來設(shè)置頻譜信號(hào)的振幅。例如，可出于這個(gè)目的對(duì)被擴(kuò)大死區(qū)的頻譜線進(jìn)行輕微放大。
[0038] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，頻譜信號(hào)計(jì)算裝置包括標(biāo)準(zhǔn)化裝置。通過這個(gè)特征，可以以容易的方式進(jìn)行后續(xù)量化步驟。
[0039] 根據(jù)本發(fā)明的優(yōu)選實(shí)施方式，將通過修改離散余弦變換

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2 3 4

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：馬丁·迪策爾;紀(jì)堯姆·富克斯;克里斯蒂安·黑爾姆里希;戈蘭·馬爾科維奇;
技術(shù)所有人：弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì);
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

自適應(yīng)量化相關(guān)技術(shù)

音頻量化位數(shù)相關(guān)技術(shù)

等量化音頻相關(guān)技術(shù)

會(huì)聲會(huì)影等量化音頻相關(guān)技術(shù)

音頻量化相關(guān)技術(shù)

音頻量化比特率相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

低復(fù)雜度音調(diào)自適應(yīng)音頻信號(hào)量化的制作方法