對(duì)源音頻信號(hào)進(jìn)行編碼的方法和相應(yīng)的編碼設(shè)備、解碼方法和設(shè)備、信號(hào)、計(jì)算機(jī)程序產(chǎn)品的制作方法

文檔序號(hào)：2830467閱讀：328來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：對(duì)源音頻信號(hào)進(jìn)行編碼的方法和相應(yīng)的編碼設(shè)備、解碼方法和設(shè)備、信號(hào)、計(jì)算機(jī)程序產(chǎn)品的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及對(duì)諸如音樂之類的音頻數(shù)字信號(hào)或數(shù)字化語(yǔ)音信號(hào) 進(jìn)行編碼和解碼的纟支術(shù)領(lǐng)域。
具體地說(shuō)，本發(fā)明涉及在實(shí)現(xiàn)感知編碼(perceptual encoding ) 中量化音頻信號(hào)的譜系數(shù)的技術(shù)。
本發(fā)明特別(但不只是)可應(yīng)用于在MPEG音頻標(biāo)準(zhǔn)(ISO/1EC 14496-3 )的環(huán)境內(nèi)所提出的使用可擴(kuò)縮數(shù)據(jù)編碼/解碼型系統(tǒng)對(duì)音頻數(shù)字?jǐn)?shù)據(jù)進(jìn)行分級(jí)編碼(hierarchical encoding )的系統(tǒng)。
一般地說(shuō)，本發(fā)明可以應(yīng)用于對(duì)聲音和音樂進(jìn)行高效量化以便存儲(chǔ)、壓縮和通過傳輸信道(例如，無(wú)線或有線信道)傳輸聲音和音樂的技術(shù)領(lǐng)域。
背景技術(shù)：
1傳輸掩蔽曲線的感知編碼 1.1音頻壓縮和量化
音頻壓縮往往基于人耳的一定聽覺能力。對(duì)音頻信號(hào)的編碼和量化往往要考慮這個(gè)特性。在這種情況下所用的術(shù)語(yǔ)是"感知編碼"，或者遵從人耳心理聽覺模型的編碼。
人耳不能區(qū)分一個(gè)信號(hào)在鄰近頻率和在有限時(shí)隙內(nèi)發(fā)送的兩個(gè) 分量。這個(gè)性質(zhì)稱為聽覺掩蔽(auditory masking)。此外，耳朵具有聽覺門限(hearing threshold)，在安靜的環(huán)境內(nèi)，將感覺不到所發(fā) 送的低于聽覺門限的聲音。這個(gè)門限的值隨聲波頻率改變。
在壓縮和/或傳輸音頻數(shù)字信號(hào)中，可以想到的是，確定量化比特?cái)?shù)，以量化形成信號(hào)的頻鐠分量，不會(huì)引入過多的量化噪聲而損害到編碼后信號(hào)的質(zhì)量。目標(biāo)通常是減少量化比特?cái)?shù)量以得到對(duì)信號(hào)的高效壓縮。因此，必須做的是找到聲音質(zhì)量與信號(hào)壓縮程度之間的折衷。
所以，在經(jīng)典的現(xiàn)有技術(shù)中，量化原理使用了人耳引起的掩蔽門限和掩蔽性質(zhì)，以確定注入音頻信號(hào)而在信號(hào)再現(xiàn)時(shí)耳朵感覺不到(即不會(huì)引入任何過分失真)的可接受的最大量化噪聲量。
1.2感知音頻變換編碼
音頻變換編碼的詳細(xì)說(shuō)明可參見Jayant、 Johnson和Safranek 的"基于人類感知的方法的信號(hào)壓縮"("Signal Compression Based on Method of Human Perception", Proc.OfIEEE， Vol.81, No. 10， pp. 1385-1422, October 1993 )。
這種技術(shù)使用了圖1所例示的人耳頻率掩蔽模型，圖中示出了音頻信號(hào)頻率與人耳掩蔽門限之間的關(guān)系的例子。X軸10表示頻率f (Hz) ， Y軸ll表示聲強(qiáng)I (dB)。人耳將信號(hào)x(t)的頻譜在頻域內(nèi)
按Bark刻度分解成一些關(guān)鍵頻帶(critical band) 120、 121、 122、 123。信號(hào)i(f)的關(guān)鍵頻帶n 120具有能量En,在頻帶n內(nèi)和在鄰近
的關(guān)鍵頻帶122和123處產(chǎn)生掩蔽13。所關(guān)聯(lián)的掩蔽門限13與"掩蔽" 分量120的能量En成正比，而隨關(guān)鍵頻帶低于和高于關(guān)鍵頻帶n遞減。
分量122和123在圖l這個(gè)例子中受到掩蔽。此外，分量121由于低于絕對(duì)聽覺門限14也受到掩蔽。于是，通過將絕對(duì)聽覺門限14 和與音頻信號(hào);r(f)的以關(guān)鍵頻帶分析的各個(gè)分量關(guān)聯(lián)的掩蔽門限組合
在一起，就可以得到總的掩蔽曲線。這個(gè)掩蔽曲線表示可以在信號(hào)編碼時(shí)疊加到信號(hào)上而人耳感覺不到的最大量化噪聲的譜密度。于是，在量化從源音頻信號(hào)頻率變換得到的i瞽系數(shù)期間，就可形成量化間隔分布(quantization interval profile ),不很嚴(yán)格地也可稱為注入噪聲分布。
圖2為例示經(jīng)典的感知編碼器的原理的流程圖。時(shí)間源音頻信號(hào)x(t)由時(shí)間-頻率變換單元20變換到頻域。于是，得到由鐠系數(shù)J^形
成的信號(hào)的頻語(yǔ)。該頻鐠由心理聽覺模型21分析，該模型根據(jù)絕對(duì)聽覺門限和信號(hào)的每個(gè)頻語(yǔ)分量的掩蔽門限確定信號(hào)的總掩蔽曲線C。所得到的掩蔽曲線可用來(lái)得出可以注入的量化噪聲量，從而確定用來(lái) 量化鐠系數(shù)或樣本的比特?cái)?shù)。確定比特?cái)?shù)這個(gè)步驟由給出每個(gè)鐠系數(shù) X,i的量化間隔分布A^的二進(jìn)制分配單元22執(zhí)行。二進(jìn)制分配單元通
過用掩蔽曲線C所給出的成形限制修改量化間隔設(shè)法達(dá)到目標(biāo)比特率。量化間隔由二進(jìn)制分配單元22以比例因子F的形式編碼，再
在比特流T內(nèi)作為輔助信息發(fā)送。
量化單元23接收到鐠系數(shù)X^和所確定的量化間隔^后給出經(jīng)量
化的系數(shù)1 。
最后，編碼和比特流形成單元24將經(jīng)量化的譜系數(shù)1 和比例因
子F集中在一起進(jìn)行編碼，形成含有經(jīng)編碼的源音頻信號(hào)的有效負(fù)栽數(shù)據(jù)和表示比例因子的數(shù)據(jù)的比特流。 2掩蔽曲線的分級(jí)構(gòu)建
下面說(shuō)明在音頻數(shù)字?jǐn)?shù)據(jù)分級(jí)編碼環(huán)境內(nèi)現(xiàn)有技術(shù)的缺點(diǎn)。然而，本發(fā)明可以應(yīng)用于根據(jù)人耳心理聽覺模型實(shí)現(xiàn)量化的各種音頻數(shù) 字信號(hào)編碼器。這些編碼器不一定是分級(jí)的。
分級(jí)編碼需要將一些編碼級(jí)級(jí)聯(lián)起來(lái)。第一級(jí)產(chǎn)生比特率最低的編碼版本，而隨后的這些級(jí)提供逐級(jí)增大比特率的相繼改善。在音頻信號(hào)編碼的特定情況下，這些改善級(jí)傳統(tǒng)上基于如在以上這節(jié)中所說(shuō) 明的感知變換編碼。
然而，這種分級(jí)感知變換編碼的一個(gè)缺點(diǎn)是必須從最前面的一級(jí) 或者說(shuō)初級(jí)就發(fā)送所得到的比例因子。這些比例因子與有效負(fù)載數(shù)據(jù) 相比占用了分配給低比特率級(jí)的一大部分比特率。
為了克服這個(gè)缺點(diǎn)以節(jié)約對(duì)注入量化噪聲分布(即比例因子)的傳輸，J. Li在"采用隱含聽覺掩蔽的嵌入式音頻編碼(EAC)" ("Embedded Audio Coding ( EAC )With Implicit AuditoryMasking", ACM Multimedia 2002 )中業(yè)已提出一種稱為"隱含，，技術(shù) 的掩蔽技術(shù)。這種技術(shù)有賴于分級(jí)結(jié)構(gòu)的編碼/解碼系統(tǒng)，在每個(gè)改善級(jí)用掩蔽曲線的近似值對(duì)掩蔽曲線進(jìn)行遞推估計(jì)，使掩蔽曲線逐級(jí)細(xì) 化。
因此，在分級(jí)編碼的每個(gè)級(jí)利用在前一級(jí)所量化的變換系數(shù)重復(fù) 更新掩蔽曲線。
由于對(duì)掩蔽曲線的估計(jì)基于時(shí)間-頻率變換的系數(shù)的量化值，因此能在編碼器和解碼器處同樣執(zhí)行，這具有避免向解碼器傳輸量化間隔分布或量化噪聲的優(yōu)點(diǎn)。
3現(xiàn)有技術(shù)的缺點(diǎn)
即使基于分級(jí)編碼的隱含掩蔽技術(shù)避免了傳輸掩蔽曲線因此與經(jīng)典的需發(fā)送量化間隔分布的感知編碼相比在比特率上有所得益，但本發(fā)明的發(fā)明者注意到它還具有一些缺點(diǎn)。
確實(shí)，在編碼器和解碼器內(nèi)同時(shí)實(shí)現(xiàn)的掩蔽模型一定是閉環(huán)的 (closed-ended),因此可以不用精確地適合信號(hào)的特性。例如，無(wú)論需編碼的頻語(yǔ)分量有沒有音調(diào)特性都使用單個(gè)掩蔽因子。
此外，掩蔽曲線是在信號(hào)是標(biāo)準(zhǔn)(standing)信號(hào)的假設(shè)下計(jì)算的，不能適當(dāng)?shù)貞?yīng)用于瞬變部分和聲沖擊。
此外，由于掩蔽曲線是在每一級(jí)從前一級(jí)所量化的系數(shù)或系數(shù)殘差得出，因此第一級(jí)的掩蔽曲線由于某些部分的頻鐠還沒有編碼所以是不完全的。這個(gè)不完全的曲線不一定表示所考慮的這個(gè)分級(jí)編碼級(jí) 的量化間隔分布的最佳形狀。

發(fā)明內(nèi)容
本發(fā)明提出了一種對(duì)源音頻信號(hào)進(jìn)行編碼的方法，這種方法包括下列步驟
按照至少兩個(gè)不同的編碼技術(shù)對(duì)表示源音頻信號(hào)的至少一個(gè)變換的系數(shù)的量化分布進(jìn)行編碼，給出表示量化分布的至少兩個(gè)數(shù)據(jù)組；按照基于分別從所述數(shù)據(jù)組重建的信號(hào)的失真的度量和基于對(duì)所述數(shù)據(jù)組進(jìn)行編碼所需的比特率的選擇準(zhǔn)則，選擇表示量
化分布的所述數(shù)據(jù)組中的一個(gè)數(shù)據(jù)組；以及
發(fā)送和/或存儲(chǔ)表示所選擇的量化分布的所述數(shù)據(jù)組和表示相應(yīng)的編碼技術(shù)的指示符。
因此，本發(fā)明所依賴的是一種新穎的、創(chuàng)造性的對(duì)源音頻信號(hào)的系數(shù)進(jìn)行編碼的途徑，這種途徑可以降低分配給傳輸量化間隔的比特率，同時(shí)還將注入量化噪聲分布保持成盡可能接近從對(duì)信號(hào)的完整知識(shí)計(jì)算得出的掩蔽曲線所給定的分布。
本發(fā)明提出在計(jì)算量化間隔分布的不同可行模式之間進(jìn)行選擇。因此，可以在若干量化間隔分布或注入噪聲分布的模板之間進(jìn)行選擇。這個(gè)選擇由指示符，例如包含在由編碼器形成的發(fā)送給音頻信號(hào)再現(xiàn) 系統(tǒng)即解碼器的比特流內(nèi)的信號(hào)，報(bào)告。
選種準(zhǔn)則可以主要考慮每個(gè)量化分布的效率和對(duì)相應(yīng)數(shù)據(jù)組進(jìn) 行編碼所需的比特率。
因此，在傳送表示信號(hào)的數(shù)據(jù)所需的比特率與影響信號(hào)的失真之
間得到折衷。
量化于是得到優(yōu)化。同時(shí)，使得發(fā)送不直接提供音頻信號(hào)本身的表示量化間隔分布的信息的數(shù)據(jù)所需的比特率最小。
也就是說(shuō)，在解碼器處，量化模式的選擇通過將根據(jù)需編碼的音頻信號(hào)估計(jì)的基準(zhǔn)掩蔽曲線與分別與各個(gè)量化模式關(guān)聯(lián)的噪聲分布相比較來(lái)實(shí)現(xiàn)。
與現(xiàn)有技術(shù)相比，本發(fā)明的技術(shù)改善了壓縮效率，因此提供了更好的感知質(zhì)量。
對(duì)于編碼技術(shù)中至少第一編碼技術(shù)來(lái)說(shuō)，數(shù)據(jù)組可以與量化分布的參數(shù)表示相應(yīng)。
也就是說(shuō)，在所提出的量化經(jīng)變換的音頻信號(hào)的系數(shù)的這些技術(shù) 中，有以參數(shù)表示量化分布的可能性。
在一個(gè)特定實(shí)施例中，參數(shù)表示由至少一個(gè)由斜率和初始值表征的直線段形成。
第二編碼技術(shù)可以給出恒定的量化分布。
這種編碼模式因此提出根據(jù)信噪比(SNR)而不是根據(jù)信號(hào)的掩蔽曲線對(duì)量化間隔分布編碼。
按照第三有益編碼技術(shù)，量化分布與絕對(duì)聽覺門限相應(yīng)。
也就是說(shuō)，表示量化分布的數(shù)據(jù)組可以是空的，編碼器不用向解碼器發(fā)送任何量化分布數(shù)據(jù)。絕對(duì)聽覺門限對(duì)于解碼器來(lái)說(shuō)是已知的。
按照第四編碼技術(shù)，表示量化分布的數(shù)據(jù)組可以包括所有所實(shí)施的量化間隔。
這種第四編碼技術(shù)對(duì)應(yīng)于量化間隔分布根據(jù)只有編碼器知道的信號(hào)的掩蔽曲線確定、完全發(fā)送給解碼器的情況。所需的比特率高，但信號(hào)的再現(xiàn)質(zhì)量最佳。
在一個(gè)特定實(shí)施例中，編碼實(shí)現(xiàn)分級(jí)處理，給出包括一個(gè)初級(jí)和至少一個(gè)細(xì)化級(jí)的至少兩個(gè)分級(jí)編碼級(jí)，所述細(xì)化級(jí)包括對(duì)初級(jí)或前一細(xì)化級(jí)的細(xì)化信息。
在這種情況下，采用第五編碼技術(shù)，表示量化分布的數(shù)據(jù)組在給定細(xì)化級(jí)通過考慮前一分級(jí)編碼級(jí)所構(gòu)建的數(shù)據(jù)得出。
因此本發(fā)明可以高效地應(yīng)用于分級(jí)編碼，提出按照在每個(gè)分級(jí)編碼級(jí)細(xì)化量化間隔分布的技術(shù)對(duì)量化間隔分布進(jìn)行編碼。
選擇步驟可以在每個(gè)分級(jí)編碼級(jí)執(zhí)行。
如果編碼方法給出一些系數(shù)幀，可以為每個(gè)幀執(zhí)行選擇步驟。因此，不僅可以為每個(gè)處理幀執(zhí)行信號(hào)傳送，而且在對(duì)數(shù)據(jù)分級(jí)
編碼的特定應(yīng)用中可以為每個(gè)細(xì)化級(jí)執(zhí)行信號(hào)傳送。
在其他情況下，編碼可以對(duì)包括一些具有預(yù)定或可變長(zhǎng)度的幀的組執(zhí)行。還可以規(guī)定，只要沒有發(fā)送新的指示符，當(dāng)前分布保持不變。
本發(fā)明還涉及包括實(shí)現(xiàn)這樣的方法的裝置的對(duì)源音頻信號(hào)進(jìn)行編碼的設(shè)備。
本發(fā)明還涉及實(shí)現(xiàn)如以上所說(shuō)明的編碼方法的計(jì)算機(jī)程序產(chǎn)品。本發(fā)明還涉及表示源音頻信號(hào)的包括表示量化分布的數(shù)據(jù)的經(jīng)編碼信號(hào)。這樣的信號(hào)主要包括
表示在編碼時(shí)根據(jù)選擇準(zhǔn)則從至少兩個(gè)可用技術(shù)中選出的
一個(gè)對(duì)所實(shí)現(xiàn)的量化分布進(jìn)行編碼的技術(shù)的指示符，所述選擇準(zhǔn) 則基于分別從按照所述技術(shù)編碼的量化分布重建的信號(hào)的失真的度量和基于按照所述技術(shù)對(duì)量化分布進(jìn)行編碼所需的比特率；以及
表示相應(yīng)量化分布的數(shù)據(jù)組。
這樣的信號(hào)可以主要包括關(guān)于通過分級(jí)處理得到的包括一個(gè)初級(jí)和至少一個(gè)細(xì)化級(jí)的至少兩個(gè)分級(jí)編碼級(jí)的數(shù)據(jù)，所述細(xì)化級(jí)包括對(duì)初級(jí)或前一細(xì)化級(jí)的細(xì)化信息；以及表示每級(jí)的編碼技術(shù)的指示符。
在將本發(fā)明的信號(hào)組織在一些相繼的系數(shù)的幀中時(shí)，信號(hào)可以包括表示用于每個(gè)幀的編碼技術(shù)的指示符。
本發(fā)明還涉及對(duì)這樣的信號(hào)進(jìn)行解碼的方法。這種方法主要包括下列步驟
從經(jīng)編碼信號(hào)提取
表示在編碼時(shí)根據(jù)選擇準(zhǔn)則從至少兩個(gè)可用技術(shù)中選出的一個(gè)對(duì)所實(shí)現(xiàn)的量化分布進(jìn)行編碼的技術(shù)的指示符，所述選擇準(zhǔn)則基于分別從按照所述技術(shù)編碼的量化分布重建的信號(hào)的失真的度量和基于按照所述技術(shù)對(duì)量化分布進(jìn)行編碼所需的比特率，以及
表示所述相應(yīng)量化分布的數(shù)據(jù)組；以及根據(jù)所述數(shù)據(jù)組和由所述指示符標(biāo)明的編碼技術(shù)重建所述重建的量化分布。
這種類型的解碼方法還包括考慮所重建的量化分布構(gòu)建表示源音頻信號(hào)的重建音頻信號(hào)的步驟。
對(duì)于這些編碼技術(shù)中至少第一編碼技術(shù)，數(shù)據(jù)組可以與量化分布的參數(shù)表示相應(yīng)，而重建步驟給出以至少一個(gè)直線段的形式重建的量化分布。
對(duì)于這些編碼技術(shù)中的至少第二編碼技術(shù)，數(shù)據(jù)組可以是空的，而重建步驟給出恒定的量化分布。
對(duì)于這些編碼技術(shù)中的至少第三編碼技術(shù)，數(shù)據(jù)組可以是空的，而量化分布與絕對(duì)聽覺門限相應(yīng)。
對(duì)于這些編碼技術(shù)中的至少第四編碼技術(shù)，數(shù)據(jù)組可以包括在以上所說(shuō)明的編碼方法期間所實(shí)施的所有量化間隔，而構(gòu)建步驟給出呈現(xiàn)為在編碼方法期間實(shí)施的一組量化間隔形式的量化值。
在一個(gè)特定實(shí)施例中，解碼方法可以實(shí)現(xiàn)分級(jí)處理，給出包括一個(gè)初級(jí)和至少一個(gè)細(xì)化級(jí)的至少兩個(gè)分級(jí)編碼級(jí)，所述細(xì)化級(jí)包括對(duì) 初級(jí)或前一細(xì)化級(jí)的細(xì)化信息。
對(duì)于這些編碼技術(shù)中的至少第五編碼技術(shù)，重建步驟在給定細(xì)化級(jí)給出考慮前一分級(jí)編碼級(jí)所構(gòu)建的數(shù)據(jù)而得到的量化分布。
本發(fā)明還涉及對(duì)表示源音頻信號(hào)的經(jīng)編碼信號(hào)進(jìn)行解碼的設(shè)備，包括實(shí)現(xiàn)以上所說(shuō)明的解碼方法的裝置。
本發(fā)明還涉及實(shí)現(xiàn)如以上所說(shuō)明的解碼方法的計(jì)算機(jī)程序產(chǎn)品。

說(shuō)明中和從附圖中可以看到本發(fā)明的實(shí)施例的其他特征和優(yōu)點(diǎn)，在這
些附圖中
圖l例示了頻率掩蔽門限；
圖2為按照現(xiàn)有技術(shù)實(shí)現(xiàn)的感知變換編碼的簡(jiǎn)化流程圖3例示了按照本發(fā)明的信號(hào)的一個(gè)例子
圖4為按照本發(fā)明的編碼方法的簡(jiǎn)化流程圖5為按照本發(fā)明的解碼方法的簡(jiǎn)化流程圖；以及
圖6A和6B示意性地例示了實(shí)現(xiàn)本發(fā)明的編碼設(shè)備和解碼設(shè)備。
具體實(shí)施方式
1編碼器結(jié)構(gòu)
下面將對(duì)本發(fā)明在分級(jí)編碼的具體應(yīng)用中的實(shí)施例進(jìn)行說(shuō)明。可以回想一下，在這種方案中，分級(jí)編碼在需編碼的源音頻信號(hào)的時(shí)間-
頻率變換(例如，經(jīng)修改的離散余弦變換MDCT)的輸出端確立了級(jí) 聯(lián)的感知量化間隔。
下面將參考圖4對(duì)按照本發(fā)明的這個(gè)實(shí)施例的編碼器進(jìn)行說(shuō)明。源音頻信號(hào)X(t)被直接或間接地變換到頻域。確實(shí)，任選地，可以首
先在編碼步驟40將信號(hào)X(O編碼。這種類型的步驟由"核心"編碼器實(shí)
現(xiàn)。在這種情況下，第一編碼步驟與第一分級(jí)編碼級(jí)即初始級(jí)相應(yīng)。這種類型的"核心，，編碼器可以實(shí)現(xiàn)編碼步驟401和本地解碼步驟402。于是，它給出表示以最低精細(xì)度的編碼的音頻信號(hào)的數(shù)據(jù)的第一比特流46?？梢栽O(shè)想用各種編碼技術(shù)來(lái)得到這個(gè)低比特率級(jí)，例如用參量編碼方案，諸如在B. den Brinker、 E.和W. Schuijers Oomen的"高質(zhì) 量音頻參量編碼，，("Parametric coding for high quality audio", in Proc. 112th AES Convention, Munich, Germany, 2002 )中所揭示的正弦編碼，在M. Schroeder和B. Atal的"碼激線性預(yù)測(cè)(CELP):極低比特率的高質(zhì)量語(yǔ)音，，("Code-excited linear prediction ( CELP): high quality speech at very low bit rates", in Proc. IEEE Int. Conf. Acoust, Speech Signal Processing, Tampa, pp. 937-940 1985 )中所揭示的 CELP型分析-綜合編碼。
將經(jīng)本地解碼器402解碼的樣本與X(t)的實(shí)際值相減(步驟403 )，
得到時(shí)域內(nèi)的殘差信號(hào)r(t)。
然后，在步驟41，將低比特率編碼器40 (或者說(shuō)"核心"編碼器) 輸出的這個(gè)殘差信號(hào)從時(shí)間空間變換到頻率空間。得到頻域內(nèi)的鐠系數(shù)《^。這些系數(shù)表示"核心"編碼器40給出的第一分級(jí)編碼級(jí)的各個(gè) 關(guān)鍵頻帶A的殘差。
下一個(gè)編碼級(jí)42含有對(duì)殘差fff編碼的步驟421，它與負(fù)責(zé)確定第一細(xì)化級(jí)的第一掩蔽曲線的心理聽覺模型的實(shí)現(xiàn)422相關(guān)聯(lián)。于是，在編碼步驟421的輸出端得到經(jīng)量化的殘差系數(shù)殺，，再將它從來(lái)自核心編碼步驟40的原始系數(shù)ff^中減去(步驟423)。在下一級(jí)43的編碼步驟431得到新的系數(shù)R『并對(duì)其進(jìn)行量化和編碼。在這里也實(shí)
施心理聽覺模型43 ，根據(jù)先前量化的殘差的系數(shù)裔f更新掩蔽門限。
簡(jiǎn)明地說(shuō)，基本編碼步驟40 ("核心，，編碼器)可以在一個(gè)終端處傳輸音頻信號(hào)的一個(gè)低比特率版本和對(duì)這個(gè)版本解碼。在變換域內(nèi)對(duì) 殘差進(jìn)行量化的后繼級(jí)42 、 43構(gòu)成了一些能構(gòu)建一個(gè)從低比特率級(jí)到所希望的最大比特率的分級(jí)比特流的改善級(jí)。
按照本發(fā)明，如圖4所示，指示符llf③、一2)分別與相應(yīng)量化級(jí)
的編碼級(jí)的心理聽覺模型422、 432關(guān)聯(lián)。這個(gè)指示符的值對(duì)于每個(gè)量化級(jí)來(lái)說(shuō)是特定的，控制對(duì)量化間隔分布的計(jì)算的模式。它作為經(jīng)量化的鐠系數(shù)的442、452的幀的標(biāo)題441和451安置在每個(gè)經(jīng)改善的編碼級(jí)42、 43所形成的所關(guān)聯(lián)的比特流44、 45內(nèi)。
圖3例示了按照這種編碼技術(shù)得到的信號(hào)的結(jié)構(gòu)的例子。信號(hào)組織成一系列各包括標(biāo)題32和數(shù)據(jù)字段33的數(shù)據(jù)塊或數(shù)據(jù)幀31。一個(gè) 數(shù)據(jù)塊例如與一個(gè)預(yù)定時(shí)隙的一個(gè)分級(jí)編碼級(jí)的數(shù)據(jù)(包含在數(shù)據(jù)段 33內(nèi)的)相應(yīng)。標(biāo)題32可以包括一些有助于傳信、解碼等的信息片。按照本發(fā)明，它至少包括信息V。
2解碼器結(jié)構(gòu)
下面將參考圖5說(shuō)明在對(duì)圖3的信號(hào)進(jìn)行分級(jí)解碼的情況下按照本發(fā)明實(shí)現(xiàn)的解碼方法。
以與參考圖4給出的編碼方法類似的方式，解碼包括若干解碼細(xì) 化級(jí)50、 51、 52。
第一解碼步驟501接收含有表示第一級(jí)在第一編碼步驟期間確定的發(fā)送給解碼器的指示符,W的數(shù)據(jù)530的比特流53。這個(gè)比特流還
含有表示音頻信號(hào)的i普系數(shù)的數(shù)據(jù)531。
按照所接收的這些經(jīng)量化的系數(shù)或經(jīng)量化的系數(shù)殘差和爭(zhēng)①的
值，在第一級(jí)502實(shí)施心理聽覺模型，以確定掩蔽曲線的第一估計(jì)，從而確定量化間隔分布，供在解碼方法的這一級(jí)處的解碼器用來(lái)處理可得到的譜系數(shù)殘差。
所得到的每個(gè)關(guān)鍵頻帶A:的鐠系數(shù)殘差fi^使得在步驟512可以
沐
更新下一級(jí)51的心理聽覺模型，于是細(xì)化掩蔽曲線，從而細(xì)化量化間隔分布。因此，這個(gè)細(xì)化考慮了級(jí)2的包含在相應(yīng)編碼器所發(fā)送的比特流54的標(biāo)題540內(nèi)的指示符爭(zhēng)(2)的值、前一級(jí)的量化殘差和與包含
在比特流54內(nèi)的與級(jí)2有關(guān)的經(jīng)量化的數(shù)據(jù)541。
在第二解碼級(jí)51的輸出端得到經(jīng)量化的殘差貧f。殘差提f與前
一級(jí)的殘差ff相加(56)，此外還注入下一級(jí)52，類似，級(jí)52改善
從解碼步驟51和在步驟522的心理聽覺模型的實(shí)現(xiàn)得到的鐠系數(shù)和量化間隔分布的精度。這一級(jí)還接收編碼器發(fā)送的含有指示符^切的值
55和經(jīng)量化的頻"^普551的比特流55。
所得到的經(jīng)量化的殘差K，與殘差ff相加，諸如此類遞推。
總而言之，心理聽覺模型隨著系數(shù)被相繼的細(xì)化級(jí)解碼而更新。讀出編碼器所發(fā)送的指示符^，每個(gè)量化級(jí)就可以重建噪聲分布(或量化分布)。
說(shuō)是共同的對(duì):、理聽覺模型和;瞽系數(shù)i化模型進(jìn)行更新的步驟。然后，
詳細(xì)說(shuō)明確定編碼時(shí)所執(zhí)行的指示符^的值的步驟，再說(shuō)明在解碼器內(nèi)重建量化間隔的步驟。 3心理聽覺模型更新
可以回想一下，心理聽覺模型考慮了音頻信號(hào)被人耳分解成的子頻帶，因此利用心理聽覺信息可以確定掩蔽門限。這些門限用來(lái)確定鐠系數(shù)的量化間隔。
在本發(fā)明中，心理聽覺模型更新掩蔽曲線的步驟(在編碼方法的步驟422、 432和在解碼方法的步驟502、 512、 522實(shí)現(xiàn))在選擇量化間隔分布上無(wú)論指示符v的值如何都保持不變。
相反，心理聽覺模型使用所更新的掩蔽曲線的方式卻由指示符^ 的值而定，以確定為量化鐠系數(shù)(或在前一細(xì)化級(jí)所確定的殘差系數(shù))所需的量化間隔分布。
在每個(gè)量化級(jí)l (在分級(jí)編碼-解碼系統(tǒng)的這個(gè)具體應(yīng)用中)，心
理聽覺模型使用所估計(jì)的音頻信號(hào)x(O的頻譜實(shí)f ，其中A表示時(shí)間-
頻率變換的頻率附標(biāo)。這個(gè)頻鐠在第一量化細(xì)化級(jí)用在核心編碼器所實(shí)現(xiàn)的編碼步驟的輸出端可得到的數(shù)據(jù)初始化。在隨后的量化級(jí)，根據(jù)在前一細(xì)化級(jí)的輸出端的所量化的殘差系數(shù)殺『"按照式zf =
X—"+ff""， fc-0,一,AT —i更新頻鐠ff，其中7V為變換在頻域內(nèi)
的長(zhǎng)度。
通過將頻鐠ff與心理聽覺模型所得到的掩蔽模式進(jìn)行巻積，就
可以重建與信號(hào)x(t)關(guān)聯(lián)的掩蔽門限。
于是，得到在量化步驟f所估計(jì)的掩蔽曲線翁p，作為與信號(hào)x(t)
關(guān)聯(lián)的掩蔽門限和絕對(duì)聽覺曲線中最大的那個(gè)值。
此外，編碼和解碼步驟各包括在首次根據(jù)核心編碼器發(fā)送的數(shù)據(jù)
實(shí)施心理聽覺模型(編碼方法的步驟422和解碼方法的步驟502)期間對(duì)心理聽覺^^莫型初始化的步驟。
可以根據(jù)所實(shí)現(xiàn)的核心編碼器的類型設(shè)想若干方案，在附錄中揭示了其中的一些例子。
4量化鐠系數(shù)
在精確說(shuō)明確定決定對(duì)量化分布的選擇的指示符^的最佳值的技術(shù)前，首先詳細(xì)說(shuō)明本發(fā)明的在得知量化間隔分布后計(jì)算需分配給量化音頻信號(hào)的各個(gè)i普系數(shù)的比特?cái)?shù)的方式。
4.1 二進(jìn)制分配
在這里所說(shuō)明的是量化定律2的一般情況，例如可以與將值四舍五入為最接近的整數(shù)相應(yīng)。輸入量化級(jí)!的殘差系數(shù)fif的經(jīng)量化值段f
按照下式根據(jù)量化間隔分布Af得出<formula>formula see original document page 17</formula> 對(duì)于化0//^61"( 1) s If s fe0//set(w + 1)
其中rq，是有整數(shù)值的系數(shù)，而W ;/se"n)為關(guān)鍵頻帶"的起始頻率附標(biāo)。
這部分的系數(shù)A相當(dāng)于可以調(diào)整與由4 給出的分布并行注入的
量化噪聲電平的恒定增益。
在第一途徑中，增益^由分配環(huán)路確定，以便達(dá)到分配給各個(gè)量
化級(jí)!的目標(biāo)比特率。然后，增益好f在量化級(jí)的輸出端的比特流內(nèi)發(fā)送
給解碼器。
在第二途徑中，增益^只是細(xì)化級(jí)〖的函數(shù)，而這個(gè)函數(shù)對(duì)于解
碼器來(lái)說(shuō)是已知的。
4.2量化間隔分布
于是，本發(fā)明的編碼和解碼方法建議根據(jù)在若干編碼技術(shù)或分布
計(jì)算模式之間的選擇確定量化間隔分布A^。該選擇由在比特流內(nèi)發(fā)送
的指示符y的值表示。根據(jù)這個(gè)指示符的值，或者全部發(fā)送或者部分發(fā)送甚至完全不發(fā)送量化間隔分布。在這種情況下，量化間隔分布在解碼器內(nèi)估計(jì)。
量化級(jí)f所用的量化間隔分布A^根據(jù)本級(jí)可得到的掩蔽曲線和
根據(jù)輸入端的指示符^(|〗計(jì)算。
在一個(gè)具體實(shí)施例中，指示符0(。編碼成3個(gè)比特，以表示5種
不同的對(duì)量化間隔分布編碼的技術(shù)。
對(duì)于指示符0"》的值=0的情況，不使用心理聽覺模型所估計(jì)的
掩蔽曲線，量化間隔分布是均勻的，遵從式A^-cte。也就是說(shuō)，在信噪比(SNR)意義上進(jìn)行量化。
對(duì)于指示符0(/)的值=1的情況，量化間隔分布只根據(jù)絕對(duì)聽覺門
限按照式4j = Qfc給出，其中Qic為絕對(duì)聽覺門限。
在這種情況下，編碼器不向解碼器發(fā)送任何量化間隔的信息。對(duì)于指示符#*》的值=2的情況，是在級(jí)f用心理聽覺模型估計(jì)的掩
蔽曲線Mf按照式zlP = g:,;—1詹f給出量化間隔分布。可以注意到的是，這種模式只是在音頻信號(hào)編碼-解碼系統(tǒng)內(nèi)實(shí)現(xiàn)分級(jí)構(gòu)建掩蔽曲線的特定應(yīng)用中才是可行的。
對(duì)于指示符*《|)的值=3的情況，量化間隔的分布根據(jù)可參量化和
解碼器已知的原型曲線給出。按照一個(gè)特定而非排它的應(yīng)用，這個(gè)原型對(duì)于各個(gè)關(guān)鍵頻帶w是以dB計(jì)的仿射直線，斜率為《?？梢詫? (>)
寫成to忍20^(ff))-on + K，其中K為常數(shù)。
通過與編碼器根據(jù)對(duì)需編碼的信號(hào)的鐠分析計(jì)算得出的基準(zhǔn)掩蔽曲線相關(guān)，選擇斜率《的值。然后，將它的量化值泛發(fā)送給解碼器，
用來(lái)按照式A^ 二 Dja)給出量化間隔分布。
最后，對(duì)于指示符一《1)的值=4的情況，將編碼步驟所確定的量化
間隔分布Af完全發(fā)送給解碼器。這些間隔值例如從編碼器根據(jù)需編碼的源音頻信號(hào)計(jì)算得出的基準(zhǔn)掩蔽曲線Mfc得出。于是，就有
—厶ft;&0/y腳乖》 ,° 5確定指示符^的值
本發(fā)明提出了一種明智地選擇指示符的值從而也就是選擇需用來(lái)對(duì)音頻信號(hào)編碼和解碼的量化間隔分布的具體技術(shù)。在每個(gè)量化級(jí),
(在分級(jí)編碼的情況下)的編碼步驟都進(jìn)行這種選擇。
確實(shí)，眾所周知，在給定的量化級(jí)，就在需編碼的信號(hào)與所重建的信號(hào)之間所感知的失真來(lái)說(shuō)最佳的量化間隔分布可以通過計(jì)算基于心理聽覺模型和由式4" = 4:):—1《給出的基準(zhǔn)掩蔽曲線得
到。選擇指示符^的值在于在就所感知的失真來(lái)說(shuō)量化間隔分布的優(yōu) 化與使分配給發(fā)送量化間隔分布的比特率最小之間尋求最有效的折衷。
為了得到這種類型的折衷引入成本函數(shù)
c"(，) = rf(J，，),jJP(f = 4)) + 0(一)
其中，爭(zhēng)=0,1,2,3,4。
這個(gè)函數(shù)用來(lái)考慮對(duì)量化間隔分布編碼的各種技術(shù)的效率。第一項(xiàng) 》(#),4^沐=4))為與指示符^的每個(gè)所考慮的值
(爭(zhēng)- 0,i,2，3,4)關(guān)聯(lián)的量化間隔分布與最佳分布(與指示符^的值
=4關(guān)聯(lián)，相當(dāng)于基準(zhǔn)掩蔽曲線的傳輸)之間的距離的度量。可以測(cè) 量這個(gè)距離，作為以比特計(jì)的與使用"亞最佳"掩蔽分布關(guān)聯(lián)的過分成本。這個(gè)成本函數(shù)按照下式計(jì)算
rf(^)(牲4，沙二4))
其中& = 沐)，而g2 - (爭(zhēng)=4)。
增益^與G2之比可用來(lái)對(duì)量化間隔分布相互標(biāo)準(zhǔn)化。
第二項(xiàng)fif，)表示與量化間隔分布A，沐)的發(fā)送關(guān)聯(lián)的以比特計(jì)
的過分成本。也就是說(shuō)，它表示必須發(fā)送給解碼器以便重建量化間隔的附加比特?cái)?shù)(除了對(duì)指示符^編碼的以外)。也就是說(shuō)
對(duì)于# = 0,1,2 (分別與在解碼步驟期間所重新評(píng)估的對(duì)恒
定量化、絕對(duì)聽覺門限和掩蔽曲線編碼的技術(shù)相應(yīng))的情況，〔爭(zhēng))
在一 =3時(shí)(與對(duì)量化間隔分布進(jìn)行參量編碼的技術(shù)相應(yīng))，
為零;沒(釣表示對(duì)a編碼的比特?cái)?shù)；以及
在# = 4時(shí)(與編碼器將量化間隔完全發(fā)送給解碼器相應(yīng))，
e(爭(zhēng))為根據(jù)基準(zhǔn)曲線給出的量化間隔a^進(jìn)行編碼的比特?cái)?shù)。 6解碼方法期間量化間隔的重建
量化間隔分布的重建在量化級(jí)/根據(jù)解碼器所發(fā)送的數(shù)據(jù)執(zhí)行。
無(wú)論選來(lái)對(duì)量化間隔編碼的是什么技術(shù)，即無(wú)論指示符# 的值是什么，解碼器首先對(duì)作為接收到的比特流的每個(gè)幀的標(biāo)題所給出的
這個(gè)指示符的值進(jìn)行解碼，再讀出調(diào)整增益IN的值。然后，按照指示符的值區(qū)別對(duì)待，情況如下
如果i^④-4，解碼器讀出全部的量化間隔4f;
如果#力=3，讀出ft，再在解碼器按照先前所引入的式子 = Dn(a)計(jì)算量化間隔分布；如果iM')-2，解碼器根據(jù)在這級(jí)f重建的掩蔽曲線Mf按照
先前所引入的式子A，二 1份^計(jì)算量化間隔的分布
(遞推構(gòu)建)；
如果一W-l,解碼器按照先前所引入的基于絕對(duì)聽覺門限
的式子4f 1^計(jì)算量化間隔分布以及
如果爭(zhēng)《 = 0，解碼器按照先前所引入的式子Af = cte計(jì)算量化間隔分布。
一旦在解碼步驟計(jì)算出這些量化間隔、解碼出在比特流內(nèi)發(fā)送的先前引入的系數(shù)rgf (相對(duì)頻鐠系數(shù)的有效負(fù)栽數(shù)據(jù)或它們的殘差值)，就可以按照在相對(duì)于二進(jìn)制分配的本說(shuō)明書第5.1節(jié)中所引入的式子得到級(jí) 的殘差系數(shù)的量化值t，。
7實(shí)現(xiàn)設(shè)備本發(fā)明的方法可以用結(jié)構(gòu)如圖6A所示的編碼設(shè)備實(shí)現(xiàn)。這樣的設(shè)備包括存儲(chǔ)器M 600、配有例如微處理器和由計(jì)算機(jī)程序Pg 602驅(qū)動(dòng)的處理單元601。初始化時(shí)，計(jì)算才幾程序602的代碼指令例如裝入RAM后由處理單元601的處理器執(zhí)行。輸入時(shí)，處理單元601接收需編碼的源音頻信號(hào)603。處理單元601的微處理器nP按照程序Pg 602的指令實(shí)現(xiàn)以上所說(shuō)明的編碼方法。處理單元601輸出比特流604，它包括表示經(jīng)編碼的源音頻信號(hào)的經(jīng)專門量化的數(shù)據(jù)、表示量化間隔分布的數(shù)據(jù)和表示指示符v的數(shù)據(jù)。
本發(fā)明還提出了一種按照本發(fā)明的對(duì)表示源音頻信號(hào)的編碼的信號(hào)進(jìn)行解碼的設(shè)備，圖6B示意性地例示了這種設(shè)備的原理性結(jié)構(gòu)。這種設(shè)備包括存儲(chǔ)器M 610，和配有例如微處理器并由計(jì)算機(jī)程序Pg 612驅(qū)動(dòng)的處理單元611。初始化時(shí)，計(jì)算機(jī)程序612的代碼指令例如裝入RAM后由處理單元611的處理器執(zhí)行。輸入時(shí)，處理單元611 接收比特流613,它包括表示經(jīng)編碼的源音頻信號(hào)的數(shù)據(jù)、表示量化間隔分布的數(shù)據(jù)和表示指示符^的數(shù)據(jù)。處理單元601的微處理器nP 按照程序Pg612的指令實(shí)現(xiàn)解碼方法，給出所重建的音頻信號(hào)612。附錄
心理聽覺模型可以以若干方式初始化，這取決于在初級(jí)編碼步驟所實(shí)現(xiàn)的"核心"編碼器。
1根據(jù)正弦編碼器發(fā)送的參數(shù)初始化
正弦編碼器將音頻信號(hào)模型化為具有時(shí)變頻率和振幅的一系列正弦波之和。頻率和振幅的量化值發(fā)送給解碼器。從這些值，可以構(gòu)
建信號(hào)的正弦分量的頻鐠f f 。
2根據(jù)CELP編碼器發(fā)送的參數(shù)初始化
根據(jù)由CELP (碼激線性預(yù)測(cè))編碼器量化和發(fā)送的LPC (線性預(yù)測(cè)編碼)系數(shù)汰《，可以按照下式得出包絡(luò)頻鐠
1 — V戶 -f — 喊、
1 — iLm=l arn. g尤P 、—』 ^~ J
其中，7V為變換的長(zhǎng)度，而P為由CELP編碼器發(fā)送的LPC系數(shù)的個(gè)數(shù)。
3根據(jù)在核心編碼器輸出端解碼的信號(hào)初始化
初始頻譜f f》可以簡(jiǎn)單地根據(jù)對(duì)在核心編碼器輸出端解碼的信號(hào)
的短期i普分析進(jìn)行估計(jì)。
還可以i殳想將這些初始化方法組合在一起。例如，可以通過將按照上式給出的LPC包絡(luò)頻譜相加、從根據(jù)CELP編碼器編碼的殘差估計(jì)的短期頻語(yǔ)得出初始頻譜f ，。
權(quán)利要求
1. 一種對(duì)源音頻信號(hào)進(jìn)行編碼的方法，其特征在于包括下列步驟按照至少兩個(gè)不同的編碼技術(shù)對(duì)表示所述源音頻信號(hào)的至少一個(gè)變換的系數(shù)的量化分布進(jìn)行編碼，給出表示量化分布的至少兩個(gè)數(shù)據(jù)組；按照基于分別從所述數(shù)據(jù)組重建的信號(hào)的失真的度量和基于對(duì)所述數(shù)據(jù)組進(jìn)行編碼所需的比特率的選擇準(zhǔn)則，選擇表示量化分布的所述數(shù)據(jù)組中的一個(gè)數(shù)據(jù)組；以及發(fā)送和/或存儲(chǔ)表示所選擇的量化分布的所述數(shù)據(jù)組和表示相應(yīng)的編碼技術(shù)的指示符。
2. 按照權(quán)利要求1所述的編碼方法，其特征在于對(duì)于至少所述編碼技術(shù)中的第一編碼技術(shù)，所述數(shù)據(jù)組與所述量化分布的參數(shù)表示相應(yīng)。
3. 按照權(quán)利要求2所述的編碼方法，其特征在于所述參數(shù)表示由至少一段由斜率和原點(diǎn)值表征的直線形成。
4. 按照權(quán)利要求1至3中任一項(xiàng)所述的編碼方法，其特征在于所述編碼技術(shù)中的第二編碼技術(shù)給出恒定的量化分布。
5. 按照權(quán)利要求1至4中任一項(xiàng)所述的編碼方法，其特征在于按照第三編碼技術(shù)，所述量化分布與絕對(duì)聽覺門限相應(yīng)。
6. 按照權(quán)利要求1至5中任一項(xiàng)所述的編碼方法，其特征在于按照第四編碼技術(shù)，所述表示量化分布的數(shù)據(jù)組包括所有所實(shí)施的量化間隔。
7. 按照權(quán)利要求1至6中任一項(xiàng)所述的編碼方法，其特征在于所述編碼實(shí)現(xiàn)分級(jí)處理，給出包括一個(gè)初級(jí)和至少一個(gè)細(xì)化級(jí)的至少兩個(gè)分級(jí)編碼級(jí)，所述細(xì)化級(jí)包括對(duì)所述初級(jí)或前一細(xì)化級(jí)的細(xì)化信命
8. 按照權(quán)利要求7所述的編碼方法，其特征在于按照第五編碼技術(shù)，表示量化分布的所述數(shù)據(jù)組在給定細(xì)化級(jí)通過考慮前一分級(jí) 編碼級(jí)所構(gòu)建的數(shù)據(jù)得出。
9. 按照權(quán)利要求7和8中任一項(xiàng)所述的編碼方法，其特征在于所述選擇步驟在每個(gè)分級(jí)編碼級(jí)執(zhí)行。
10. 按照權(quán)利要求1至9中任一項(xiàng)所述的編碼方法，其特征在于所述方法給出一些系數(shù)幀，為每個(gè)幀執(zhí)行所述選擇步驟。
11. 一種對(duì)源音頻信號(hào)進(jìn)行編碼的設(shè)備，其特征在于包括按照至少兩個(gè)不同的編碼技術(shù)對(duì)表示所述源音頻信號(hào)的至少一個(gè)變換的系數(shù)的量化分布進(jìn)行編碼、給出表示量化分布的至少兩個(gè)數(shù) 據(jù)組的裝置；按照基于分別從所述數(shù)據(jù)組重建的信號(hào)的失真的度量和基于對(duì) 所述數(shù)據(jù)組進(jìn)行編碼所需的比特率的選擇準(zhǔn)則選擇表示量化分布的所述數(shù)據(jù)組中的一個(gè)數(shù)據(jù)組的裝置；以及發(fā)送和/或存儲(chǔ)表示所選擇的量化分布的所述數(shù)據(jù)組和表示相應(yīng) 的編碼技術(shù)的指示符的裝置。
12. —種可從通信網(wǎng)絡(luò)下載和/或存儲(chǔ)在計(jì)算機(jī)可讀載體內(nèi)和/或可由微處理器執(zhí)行的計(jì)算機(jī)程序產(chǎn)品，其特征在于包括實(shí)現(xiàn)按照權(quán)利要求1至10中任一項(xiàng)所述的編碼方法的程序代碼指令。
13. —種表示源音頻信號(hào)的經(jīng)編碼的信號(hào)，包括表示量化分布的數(shù)據(jù)，其特征在于包括表示在編碼時(shí)根據(jù)選擇準(zhǔn)則從至少兩個(gè)可用技術(shù)中選出的一個(gè) 對(duì)所實(shí)現(xiàn)的量化分布進(jìn)行編碼的技術(shù)的指示符，所述選擇準(zhǔn)則基于分別從按照所述技術(shù)編碼的量化分布重建的信號(hào)的失真的度量和基于按照所述技術(shù)對(duì)量化分布進(jìn)行編碼所需的比特率；以及表示相應(yīng)量化分布的數(shù)據(jù)組。
14. 按照權(quán)利要求13所述的信號(hào)，其特征在于包括關(guān)于通過分級(jí)處理得到的包括一個(gè)初級(jí)和至少一個(gè)細(xì)化級(jí)的至少兩個(gè)分級(jí)的數(shù) 據(jù)，所述細(xì)化級(jí)包括對(duì)所述初級(jí)或前一細(xì)化級(jí)的細(xì)化信息；以及表示每個(gè)所述級(jí)的編碼技術(shù)的指示符。
15. 按照權(quán)利要求13和14中任一項(xiàng)所述的信號(hào)，其特征在于所述信號(hào)被組織在一些相繼的系數(shù)的幀中，所述信號(hào)包括表示用于每個(gè)所述幀的編碼技術(shù)的指示符。
16. —種對(duì)表示源音頻信號(hào)的包括表示量化分布的數(shù)據(jù)的經(jīng)編碼信號(hào)進(jìn)行解碼的方法，其特征在于包括下列步驟從所述經(jīng)編碼信號(hào)提取表示在編碼時(shí)根據(jù)選擇準(zhǔn)則從至少兩個(gè)可用技術(shù)中選出的一個(gè)對(duì)所實(shí)現(xiàn)的量化分布進(jìn)行編碼的技術(shù)的指示符，所述選擇準(zhǔn) 則基于分別從按照所述技術(shù)編碼的量化分布重建的信號(hào)的失真的度量和基于按照所述技術(shù)對(duì)量化分布進(jìn)行編碼所需的比特率，以及表示所述相應(yīng)量化分布的數(shù)據(jù)組；以及根據(jù)所述數(shù)據(jù)組和由所述指示符標(biāo)明的編碼技術(shù)重建所述重建的量化分布。
17. 按照權(quán)利要求16所述的解碼方法，其特征在于包括考慮所述重建的量化分布構(gòu)建表示所述源音頻信號(hào)的重建音頻信號(hào)的步驟。
18. —種對(duì)表示源音頻信號(hào)的包括表示量化分布的數(shù)據(jù)的經(jīng)編碼信號(hào)進(jìn)行解碼的設(shè)備，其特征在于包括從所述經(jīng)編碼信號(hào)提取下列各項(xiàng)的裝置表示在編碼時(shí)根據(jù)選擇準(zhǔn)則從至少兩個(gè)可用技術(shù)中選出的一個(gè)對(duì)所實(shí)現(xiàn)的量化分布進(jìn)行編碼的技術(shù)的指示符，所述選擇準(zhǔn) 則基于分別從按照所述技術(shù)編碼的量化分布重建的信號(hào)的失真的度量和基于按照所述技術(shù)對(duì)量化分布進(jìn)行編碼所需的比特率，以及表示所迷相應(yīng)量化分布的數(shù)據(jù)組；以及根據(jù)所述數(shù)據(jù)組和由所述指示符標(biāo)明的編碼技術(shù)重建所述重建的量化分布的裝置。
19. 一種可從通信網(wǎng)絡(luò)下載和/或存儲(chǔ)在計(jì)算機(jī)可讀載體內(nèi)和/或可由微處理器執(zhí)行的計(jì)算機(jī)程序產(chǎn)品，其特征在于包括實(shí)現(xiàn)按照權(quán)利要求16至17中任一項(xiàng)所述的解碼方法的程序代碼指令。
全文摘要
本發(fā)明涉及對(duì)源音頻信號(hào)進(jìn)行編碼的方法。按照本發(fā)明，這種方法包括下列步驟按照至少兩種不同的編碼技術(shù)對(duì)表示源音頻信號(hào)的至少一個(gè)變換的系數(shù)的量化分布進(jìn)行編碼，給出至少兩個(gè)表示一個(gè)量化分布的數(shù)據(jù)組；根據(jù)預(yù)定選擇準(zhǔn)則選擇表示量化分布的所述數(shù)據(jù)組中的一個(gè)數(shù)據(jù)組；以及發(fā)送和/或存儲(chǔ)表示所選擇的量化分布的數(shù)據(jù)組和表示相應(yīng)編碼技術(shù)的指示符。
文檔編號(hào)G10L19/035GK101432804SQ200780015598
公開日2009年5月13日申請(qǐng)日期2007年3月12日優(yōu)先權(quán)日2006年3月13日
發(fā)明者C·沃, P·科郎, P·菲利普申請(qǐng)人:法國(guó)電信公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：P.菲利普;C.沃;P.科郎
技術(shù)所有人：法國(guó)電信公司
我是此專利的發(fā)明人

上一篇：使用有損編碼的數(shù)據(jù)流和無(wú)損擴(kuò)展數(shù)據(jù)流對(duì)源信號(hào)進(jìn)行無(wú)損編碼的方法以及設(shè)備的制作方法
上一篇：用于盲源分離(bss)的增強(qiáng)技術(shù)的制作方法

相關(guān)技術(shù)

用于盲源分離(bss)的增強(qiáng)...
用于影劇內(nèi)容的可更換水印的制...
采用再混音能力增強(qiáng)音頻的制作...
基于高斯混合模型的變換中的軟...
利用主動(dòng)降噪的頭戴式耳機(jī)的通...
主動(dòng)型噪聲控制裝置的制作方法
能動(dòng)型噪音降低系統(tǒng)的制作方法
在用于諧波和基調(diào)分析的音頻頻...
用來(lái)修正音頻信號(hào)的方法和系統(tǒng)...
用于產(chǎn)生環(huán)境信號(hào)的設(shè)備和方法

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

1

精彩留言，會(huì)給你點(diǎn)贊！

音頻信號(hào)源相關(guān)技術(shù)
揚(yáng)聲器的制造方法
無(wú)線聲音傳輸系統(tǒng)和方法
一種實(shí)現(xiàn)一鍵控制的電視節(jié)目多模式審片方法
用于產(chǎn)生具有強(qiáng)化的空間效應(yīng)的聲音信號(hào)的方法及設(shè)備的制作方法
數(shù)字調(diào)頻廣播發(fā)射機(jī)的制作方法
數(shù)字混音器和用于這種數(shù)字混音器的顯示控制方法
音頻源中的限定鈴音段的制作方法
用于監(jiān)視來(lái)自各種源的音頻/視覺內(nèi)容的方法及裝置的制作方法
機(jī)動(dòng)車中的揚(yáng)聲器裝置的制作方法
輸入裝置
音頻信號(hào)源設(shè)計(jì)相關(guān)技術(shù)
音頻信號(hào)源的制作方法
音頻信號(hào)源的制作方法
用于音頻視頻放大器的信號(hào)源自動(dòng)選擇方法和裝置的制作方法
用于收聽音頻音樂源和/或免提電話功能的具有非適應(yīng)型的主動(dòng)噪聲控制的音頻耳機(jī)的制作方法
基于時(shí)頻參數(shù)標(biāo)準(zhǔn)信號(hào)源方式的信號(hào)檢測(cè)設(shè)備校準(zhǔn)方法
對(duì)音頻信號(hào)的編碼速率進(jìn)行源控的方法和系統(tǒng)的制作方法
對(duì)源音頻信號(hào)進(jìn)行編碼的方法和相應(yīng)的編碼設(shè)備、解碼方法和設(shè)備、信號(hào)、計(jì)算機(jī)程序產(chǎn)品的制作方法
音頻源位置估計(jì)的制作方法
一種無(wú)參考源的mp3音頻清晰度客觀評(píng)價(jià)方法
用于對(duì)音頻場(chǎng)景中聲源的廣度進(jìn)行編碼和解碼的方法
音頻編碼相關(guān)技術(shù)
一種音頻數(shù)據(jù)解碼的控制方法及移動(dòng)終端與制造工藝
音頻信號(hào)分類和編碼的制造方法與工藝
基于CUDA顯卡編碼的無(wú)線視頻傳輸系統(tǒng)及其傳輸方法與制造工藝
一種音頻信號(hào)的時(shí)域包絡(luò)處理方法及裝置、編碼器與制造工藝
一種基于字典分類的音頻匹配追蹤裝置及其追蹤方法與制造工藝
數(shù)字音頻編碼中碼率分配的方法和裝置與制造工藝
AAC數(shù)字音頻解碼處理板卡的制造方法與工藝
一種基于4g移動(dòng)網(wǎng)絡(luò)的車載對(duì)講系統(tǒng)的制作方法
一種wifi無(wú)損音樂播放器的制造方法
一種基于gprs網(wǎng)絡(luò)的便攜式環(huán)衛(wèi)卡片終端系統(tǒng)的制作方法
音頻編解碼芯片相關(guān)技術(shù)
用于對(duì)分割塊進(jìn)行編碼的視頻編碼方法、用于對(duì)分割塊進(jìn)行解碼的視頻解碼方法以及用 ...的制作方法
基于fpga的svac視頻編解碼芯片驗(yàn)證裝置及方法
對(duì)音頻/語(yǔ)音信號(hào)進(jìn)行編碼和解碼的方法和設(shè)備的制造方法
通過繼承運(yùn)動(dòng)向量場(chǎng)進(jìn)行視頻編碼和解碼的制作方法
一種網(wǎng)絡(luò)編碼tcp解碼方法及裝置的制造方法
解碼裝置、攝像系統(tǒng)、解碼方法、編解碼方法以及解碼程序的制作方法
一種智能手機(jī)原生dsd音頻解碼方法、系統(tǒng)及智能手機(jī)的制作方法
基于gps/bd定位的車載自動(dòng)報(bào)站裝置的制造方法
一種多路音頻解碼系統(tǒng)的制作方法
音頻的屏幕相對(duì)呈現(xiàn)和用于這樣的呈現(xiàn)的音頻的編碼和解碼的制作方法
音頻編碼器相關(guān)技術(shù)
用于編碼音頻信號(hào)的編碼器、音頻發(fā)送系統(tǒng)和用于確定校正值的方法
用于對(duì)降混合矩陣進(jìn)行解碼及編碼的方法、用于呈現(xiàn)音頻內(nèi)容的方法、用于降混合矩陣的 ...的制作方法
用于編碼音頻信號(hào)的編碼器、音頻發(fā)送系統(tǒng)和用于確定校正值的方法
用于對(duì)降混合矩陣進(jìn)行解碼及編碼的方法、用于呈現(xiàn)音頻內(nèi)容的方法、用于降混合矩陣的 ...的制作方法
音頻編碼器和解碼器的制造方法
聯(lián)合聲道間和聲道內(nèi)預(yù)測(cè)的立體聲誤碼隱藏方法及系統(tǒng)的制作方法
基于qmf的處理數(shù)據(jù)的時(shí)間對(duì)齊的制作方法
針對(duì)音頻聲道及音頻對(duì)象的音頻編碼及解碼的概念的制作方法
根據(jù)室內(nèi)脈沖響應(yīng)處理音頻信號(hào)的方法、信號(hào)處理單元、音頻編碼器、音頻解碼器及立體 ...的制作方法
將第一和第二輸入聲道映射至至少一個(gè)輸出聲道的裝置，方法和計(jì)算機(jī)程序的制作方法
音視頻編碼相關(guān)技術(shù)
一種hevc 4k音視頻編碼器的制造方法
一種行車記錄儀的制作方法
高可靠性音視頻同軸線的制作方法
高速動(dòng)車組車輛電視功能的調(diào)試系統(tǒng)的制作方法
一種推車式音視頻支架的制作方法
推車式音視頻支架的制作方法
用于編碼音頻信號(hào)的編碼器、音頻發(fā)送系統(tǒng)和用于確定校正值的方法
基于Web的音頻通信質(zhì)量改進(jìn)方法
一種視頻監(jiān)控的方法及系統(tǒng)的制作方法
用于編碼音頻信號(hào)的編碼器、音頻發(fā)送系統(tǒng)和用于確定校正值的方法

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

對(duì)源音頻信號(hào)進(jìn)行編碼的方法和相應(yīng)的編碼設(shè)備、解碼方法和設(shè)備、信號(hào)、計(jì)算機(jī)程序產(chǎn)品的制作方法

對(duì)源音頻信號(hào)進(jìn)行編碼的方法和相應(yīng)的編碼設(shè)備、解碼方法和設(shè)備、信號(hào)、計(jì)算機(jī)程序產(chǎn)品的制作方法