專利名稱:使用有損編碼的數(shù)據(jù)流和無損擴展數(shù)據(jù)流對源信號進行無損編碼的方法以及設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及使用有損編碼(encode)的數(shù)據(jù)流和無損擴展數(shù)據(jù)流 對源信號進行無損編碼的方法以及設(shè)備,其中所述有損編碼的數(shù)據(jù)流 和無損擴展數(shù)據(jù)流一起形成所述源信號的無損編碼的數(shù)據(jù)流。
背景技術(shù):
對照有損音頻編碼技術(shù)(如mp3、 AAC等),無損壓縮算法能夠僅 采用原始音頻信號的冗余以減小數(shù)據(jù)率。如現(xiàn)有技術(shù)的有損音頻編解 碼器中的心理聲學(xué)模型所標(biāo)識的,這不可能依靠不相關(guān)性 (irrelevancy)。因此,所有無損音頻編碼方案的公共技術(shù)原理是應(yīng)用 濾波器或變換進行去相關(guān)(例如預(yù)測濾波器或頻率變換),然后以無損 方式對變換后的信號進行編碼。編碼后的比特流包括變換或濾波器 的參數(shù),以及變換后的信號的無損表示。
例如,參見Makhoul, "Linear prediction: A tutorial review", Proceedings of the IEEE, Vol.63, pp.561-580, 1975, T. Painter, A. Spanias: "Perceptual coding of digital audio", Proceedings of the IEEE, Vol.88, No.4, pp.451—513, 2000, 以及M. Hans, R.W, Schafer, "Lossless compression of digital audio", IEEE Signal Processing Magazine, July 2001, pp.21-32。
在圖8和圖9中描述了基于有損的無損編碼的基本原理。在圖8左 側(cè)的編碼部分,PCM音頻輸入信號SpcM通過有損編碼器81至有損解碼 器82,并且作為有損比特流至解碼部分(右側(cè))的有損解碼器85。有 損編碼和解碼用于對信號進行去相關(guān)。在減法器83中將解碼器82的輸 出信號從輸入信號SpcM中去除,得到的差信號通過無損編碼器84,作 為至無損解碼器87的擴展比特流。86將解碼器85和87的輸出信號結(jié)合,以重新得到原始信號Spc:m。
在EP-B-0756386和US-B-6498811中針對音頻編碼公開了該基本 原理,還在P. Craven, M. Gerzon, "Lossless Coding for Audio Discs", J. Audio Eng. Soc., Vol.44, No.9, September 1996中以及在L Koller, Th. Sporer, K.H. Brandenburg, "Robust Coding of High Quality Audio Signals", AES 103rd Convention, Pr印rint 4621, August 1997中論述了該 基本原理。
在圖9中的有損編碼器中,PCM音頻輸入信號SpcM通過分析濾波 器組91以及子帶(sub-band)采樣的量化92,至編碼和比特流打包 (packing) 93。由接收信號SpcM并從分析濾波器組91接收相應(yīng)信息的 感知模型計算器94來控制量化。
在解碼器側(cè),解碼的有損比特流進入用于對比特流進行解包的裝 置95,裝置95之后跟著用于對子帶采樣進行解碼的裝置96以及輸出解
碼后的有損PCM信號SDee的合成濾波器組97。
在標(biāo)準(zhǔn)ISO/IEC 11172-3 (MPEG-1 Audio)中詳細(xì)描述了針對有損 編碼和解碼的示例。
在現(xiàn)有技術(shù)中,根據(jù)以下3個基本信號處理構(gòu)思之一進行無損音
頻編碼
a) 使用線性預(yù)測技術(shù)進行時域去相關(guān);
b) 使用可逆整數(shù)分析-合成濾波器組進行頻域無損編碼;
c) 對有損基本層編解碼器的殘余(誤差信號)進行無損編碼。
發(fā)明內(nèi)容
本發(fā)明將要解決的問題是提供分級的無損音頻編碼和解碼,所述 無損音頻編碼和解碼是建立在嵌入的有損音頻編解碼器之上的,并且 與依靠現(xiàn)有技術(shù)的基于有損的無損音頻編碼方案相比提供了更好的效 率(也就是壓縮比)。通過權(quán)利要求1至3和7至9中公開的方法解決 了該問題。在權(quán)利要求4至6和10至12中分別公開了應(yīng)用這些方法 的設(shè)備。
本發(fā)明在有損編碼之上使用數(shù)學(xué)上的無損編碼和解碼。數(shù)學(xué)上無損音頻壓縮是指在解碼器輸出處采用對原始PCM采樣的比特精確再
現(xiàn)的音頻編碼。對于某些實施例,假設(shè)使用諸如MDCT之類的頻率變
換或類似的濾波器組在變換域進行有損編碼。作為示例,在描述中自
始至終將mp3標(biāo)準(zhǔn)(ISO/IEC 11172-3 Layer 3)用于有損基本層,然 而也能夠以類似的方式與其它有損編碼方案(例如AAC、 MPEG-4
音頻) 一起應(yīng)用本發(fā)明。
傳輸或記錄的編碼比特流包括2部分有損音頻編解碼器的嵌入 的比特流,以及針對一個或幾個附加層的擴展數(shù)據(jù),用以得到無損(也 就是比特精確的)原始PCM采樣或中間質(zhì)量。
本發(fā)明基本上按照以上所列構(gòu)思的版本c)。然而,本發(fā)明實施例 還應(yīng)用來自構(gòu)思a)和b)的特征,也就是對幾個現(xiàn)有技術(shù)無損音頻編 碼方案的技術(shù)的協(xié)同結(jié)合(synergistic combination)。
本發(fā)明使用頻域去相關(guān)、時域去相關(guān)、或其結(jié)合,以為高效無損 編碼準(zhǔn)備基本層有損音頻編解碼器的殘余信號(誤差信號)。提出的去 相關(guān)技術(shù)使用從有損解碼器提取的輔助信息。因此,防止了對比特流 中多余信息的傳輸,并且改進了總壓縮比。
除了改進了壓縮比以外,本發(fā)明的一些實施例提供了采用(在有 損編解碼器與數(shù)學(xué)上無損質(zhì)量所限定的范圍內(nèi)的) 一個或幾個中間質(zhì) 量的音頻信號。此外,本發(fā)明允許使用簡單的比特丟棄技術(shù)除去(strip)
嵌入的有損比特流。
本發(fā)明的3個基本實施例在域方面有所不同,其中,以協(xié)同的方 式在時域中、頻域、或時域和頻域中進行對有損基本層編解碼器的殘 余信號的去相關(guān)。與現(xiàn)有技術(shù)對比,所有實施例使用從有損基本層編 解碼器的解碼器得到的信息,以控制去相關(guān)和無損編碼過程??蛇x地, 實施例中的一些還使用來自有損基本層編解碼器的編碼器的信息。采 用來自有損基本層編解碼器的輔助信息可以減少總比特流中的冗余, 從而改進基于有損的無損編解碼器的編碼效率。
在所有實施例中,能夠從比特流中提取具有不同質(zhì)量級別的音頻 信號的至少2個不同變體。這些變體包括由嵌入的有損編碼流方案 表示的信號,以及對原始PCM采樣的無損解碼。在一些實施例中(參見凝鍵去教關(guān)以及凝鍵,好凝^游去裙關(guān)部分),可以對具有中間質(zhì)量 的音頻信號的一個或幾個另外的變體進行解碼。
在原理上,本發(fā)明的編碼方法適于使用有損編碼的數(shù)據(jù)流和無損 擴展數(shù)據(jù)流對源信號進行無損編碼,所述有損編碼的數(shù)據(jù)流和無損擴 展數(shù)據(jù)流一起形成所述源信號的無損編碼的數(shù)據(jù)流,所述方法包括步 驟
-對所述源信號進行有損編碼,其中所述有損編碼提供所述有損 編碼的數(shù)據(jù)流;
-對所述有損編碼的數(shù)據(jù)進行有損解碼,從而重建解碼的信號, 以及提供用于控制時域預(yù)測濾波器的輔助信息;
-形成所述源信號的相應(yīng)延遲的版本與所述解碼的信號之間的差 信號,
-使用從所述輔助信息得到的濾波器系數(shù)對所述差信號進行預(yù)測 濾波,以在時域?qū)λ霾钚盘柕倪B續(xù)值進行去相關(guān);
-對所述去相關(guān)的差信號進行無損編碼,以提供所述無損擴展數(shù) 據(jù)流;
-將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流組合,以形成 所述無損編碼的數(shù)據(jù)流, 或包括步驟
-對所述源信號進行有損編碼,其中所述有損編碼提供所述有損 編碼的數(shù)據(jù)流;
-根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損編碼 接收的相應(yīng)的尚未量化的系數(shù)來計算頻譜白化數(shù)據(jù),所述頻譜白化數(shù) 據(jù)表示對原始系數(shù)的更精細(xì)量化,由此對所述計算進行控制,以使得 量化誤差的功率對于所有頻率本質(zhì)上恒定;
-使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行有損解碼, 從而重建解碼的信號;
-形成所述源信號的相應(yīng)延遲的版本與所述解碼的信號之間的差 信號;
-對所述差信號進行無損編碼以提供所述無損擴展數(shù)據(jù)流;-將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻譜白 化數(shù)據(jù)組合,以形成所述無損編碼的數(shù)據(jù)流, 或包括步驟
-對所述源信號進行有損編碼,其中所述有損編碼提供所述有損 編碼的數(shù)據(jù)流,
-根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損編碼 接收的相應(yīng)的尚未量化的系數(shù),來計算頻譜白化數(shù)據(jù),所述頻譜白化 數(shù)據(jù)表示對原始系數(shù)的更精細(xì)量化,由此對所述計算進行控制,以使 得量化誤差的功率對于所有頻率本質(zhì)上恒定;
-使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行有損解碼, 從而重建解碼的信號,以及提供用于控制時域預(yù)測濾波器的輔助信息;
-形成所述源信號的相應(yīng)延遲的版本與所述解碼的信號之間的差 信號;
-使用從所述輔助信息得到的濾波器系數(shù)對所述差信號進行預(yù)測 濾波,以在時域中對所述差信號的連續(xù)值進行去相關(guān);
-對所述去相關(guān)的差信號進行無損編碼,以提供所述無損擴展數(shù) 據(jù)流;
-將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻譜白 化數(shù)據(jù)組合,以形成所述無損編碼的數(shù)據(jù)流。
原理上,本發(fā)明的解碼方法適于對從有損編碼的數(shù)據(jù)流和無損擴
展數(shù)據(jù)流得到的無損編碼的源信號數(shù)據(jù)流進行解碼,所述有損編碼的
數(shù)據(jù)流和無損擴展數(shù)據(jù)流一起形成所述源信號的無損編碼的數(shù)據(jù)流, 其巾
對所述源信號進行有損編碼,所述有損編碼提供所述有損編碼的 數(shù)據(jù)流;
對所述有損編碼的數(shù)據(jù)進行相應(yīng)的有損解碼,從而重建標(biāo)準(zhǔn)解碼
的信號,并且提供用于控制時域預(yù)測濾波器的輔助信息;
形成所述源信號的相應(yīng)延遲的版本與所述解碼的信號之間的差 樣馬.
使用從所述輔助信息得到的濾波器系數(shù)對所述差信號進行預(yù)測濾波,以在時域?qū)λ霾钚盘柕倪B續(xù)值進行去相關(guān);
對所述去相關(guān)的差信號進行無損編碼,以提供所述無損擴展數(shù)據(jù)
流;
將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流組合,以形成所 述無損編碼的數(shù)據(jù)流,
所述方法包括步驟
-對所述無損編碼的源信號數(shù)據(jù)流進行解復(fù)用,以提供所述無損 擴展數(shù)據(jù)流以及所述有損編碼的數(shù)據(jù)流;
-對所述有損編碼的數(shù)據(jù)流進行有損解碼,從而重建有損解碼的 信號并且提供用于控制時域預(yù)測濾波器的所述輔助信息;
-對所述無損擴展數(shù)據(jù)流進行解碼,以提供所述去相關(guān)的差信號;
-使用從所述輔助信息得到的濾波器系數(shù)對所述去相關(guān)的差信號 的連續(xù)值進行逆去相關(guān)濾波;
-將所述去相關(guān)濾波的差信號與所述有損編碼的信號組合,以重 建所述源信號,
或其中
對所述源信號進行有損編碼,其中所述有損編碼提供所述有損編
碼的數(shù)據(jù)流;
根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損編碼 接收的相應(yīng)的尚未量化的系數(shù),來計算頻譜白化數(shù)據(jù),所述頻譜白化 數(shù)據(jù)表示對原始系數(shù)的更精細(xì)量化, 由此對所述計算進行控制,以使 得量化誤差的功率對于所有頻率本質(zhì)上恒定;
使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行有損解碼,從 而重建解碼的信號;
形成所述源信號的相應(yīng)延遲的版本與所述解碼的信號之間的差 信號;
對所述差信號進行無損編碼以提供所述無損擴展數(shù)據(jù)流; 將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻譜白 化數(shù)據(jù)組合,以形成所述無損編碼的數(shù)據(jù)流, 所述方法包括步驟-對所述無損編碼的源信號數(shù)據(jù)流進行解復(fù)用,以提供所述無損 擴展數(shù)據(jù)流以及所述有損編碼的數(shù)據(jù)流;
-使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)流進行有損解 碼,從而重建有損解碼的信號;
-對所述無損擴展數(shù)據(jù)流進行解碼,以提供所述差信號;
-將所述差信號與所述有損解碼的信號組合,以重建所述源信號,
或其中
對所述源信號進行有損編碼,其中所述有損編碼提供所述有損編
碼的數(shù)據(jù)流;
根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損編碼 接收的相應(yīng)的尚未量化的系數(shù),來計算頻譜白化數(shù)據(jù),所述頻譜白化 數(shù)據(jù)表示對原始系數(shù)的更精細(xì)量化,由此對所述計算進行控制,以使 得量化誤差的功率對于所有頻率本質(zhì)上恒定;
使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行有損解碼,從 而重建解碼的信號,以及提供用于控制時域預(yù)測濾波器的輔助信息;
形成所述源信號的相應(yīng)延遲的版本與所述解碼的信號之間的差 信號;
使用從所述輔助信息得到的濾波器系數(shù)對所述差信號進行預(yù)測 濾波,以在時域中對所述差信號的連續(xù)值進行去相關(guān);
對所述去相關(guān)的差信號進行無損編碼以提供所述無損擴展數(shù)據(jù)
流;
將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻譜白 化數(shù)據(jù)組合,以形成所述無損編碼的數(shù)據(jù)流, 所述方法包括步驟
-對所述無損編碼的源信號數(shù)據(jù)流進行解復(fù)用,以提供所述無損 擴展數(shù)據(jù)流以及所述有損編碼的數(shù)據(jù)流;
-使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)流進行有損解 碼,從而重建有損解碼的信號,以及提供用于控制時域預(yù)測濾波器的 所述輔助信息;
-對所述無損擴展數(shù)據(jù)流進行解碼,以提供所述去相關(guān)的差信號;-使用從所述輔助信息得到的濾波器系數(shù)對所述去相關(guān)的差信號 的連續(xù)值進行逆去相關(guān)濾波;
-將所述去相關(guān)濾波的差信號與所述有損解碼的信號組合,以重 建所述源信號。
本發(fā)明的設(shè)備實施相應(yīng)的本發(fā)明的方法的功能。
在各個從屬權(quán)利要求中公開了本發(fā)明的有利附加實施例。
參考附圖描述了本發(fā)明的示例實施例,附圖中
圖l示出了基于有損的無損編碼器的方框圖或信號流圖,其中使 用時域線性預(yù)測對殘余信號進行去相關(guān);
圖2示出了基于有損的無損解碼器的方框圖或信號流圖,其中使 用時域線性預(yù)測對殘余信號進行去相關(guān);
圖3示出了基于有損的無損編碼器的方框圖或信號流圖,其中在
頻域中對殘余信號進行去相關(guān);
圖4示出了基于有損的無損解碼器的方框圖或信號流圖,其中在
頻域中對殘余信號進行去相關(guān);
圖5示出了現(xiàn)有的ISO/IEC 11172-3 Layer III編碼器的方框圖6示出了基于有損的無損編碼器的方框圖或信號流圖,其中在 頻域和時域?qū)堄嘈盘栠M行去相關(guān);
圖7示出了基于有損的無損解編碼器的方框圖或信號流圖,其中
在頻域和時域?qū)堄嘈盘栠M行去相關(guān);
圖8示出了現(xiàn)有的基于有損的無損編碼器和解碼器的基本方框
圖9示出了現(xiàn)有的有損編碼器和解碼器的一般方框圖。
具體實施例方式
,去被
該實施例使用現(xiàn)有的殘余編碼原理。在圖l中描述的編碼中,編 碼以有損編碼器步驟或階段101開始,產(chǎn)生傳遞至MUX塊109的有損比特流111。相應(yīng)的有損解碼器102生成解碼的音頻信號112以及將要用于 對時域線性預(yù)測濾波器進行控制的一些輔助信息115。例如,該輔助信 息115包括一組參數(shù),所述參數(shù)描述了有損編解碼器101/102的誤差(也 就是在減法器104中形成的(有損)解碼的音頻信號112與適當(dāng)延遲的 原始信號PCM采樣113之間的差)(也就是殘余信號114)的頻譜包絡(luò)。 延遲103對由有損編碼器101和有損解碼器102的鏈(chain)所引起的 任何算法延遲進行補償。輔助信息還能夠包括以下之一或更多個塊 大小、窗函數(shù)、截止頻率、比特分配。
從有損解碼器102提取的輔助信息115 (以及可能的信號114,特別 地,在有損編碼器101僅對部分音頻信號頻率范圍進行編碼的情況下, 或為了利于在步驟/階段105中更精確地確定濾波器系數(shù),還有信號114) 用于濾波器適配塊105中,以確定將要應(yīng)用到線性預(yù)測濾波器106中的一 組最佳濾波器系數(shù)118。預(yù)測濾波和減法107的目的是生成具有平坦(也 就是"白色")頻譜的去相關(guān)的輸出信號102。優(yōu)選地,對白信號進行去 相關(guān),相應(yīng)的連續(xù)時域采樣或值呈現(xiàn)最低可能功率和熵。因此,對信號 更好的去相關(guān)導(dǎo)致具有更低平均數(shù)據(jù)率的無損編碼。與現(xiàn)有的基于有損 的無損方式相比,本發(fā)明可以進行非常好的去相關(guān),而不需要傳輸與預(yù) 測濾波器設(shè)置有關(guān)的大量信息。在數(shù)據(jù)率方面,相應(yīng)的信息流116總是 比未采用來自有損解碼器的輔助信息115的系統(tǒng)低。最后,將要傳輸以 用于在解碼側(cè)適配預(yù)測濾波器系數(shù)的額外信息116可以是0。也就是,所
提出的方法的編碼效率總是比類似的基于有損的無損音頻編碼方法好。 通常,可以采用來自有損解碼器的任何有用信息(參數(shù)、信號等), 以改進對預(yù)測濾波器和有損編碼器的適配。
為了可操作,將以平臺無關(guān)的方式實現(xiàn)有損解碼器102、時域線 性預(yù)測濾波器106、延遲補償103、減法點104和107、以及可以在有損 解碼器塊102中選擇地實現(xiàn)的任何內(nèi)插功能性。也就是,對于所有目標(biāo) 平臺,需要具有整數(shù)精度的定點實現(xiàn)(fixed-point implementation)來
生成可比特精確再現(xiàn)的結(jié)果。
將預(yù)測誤差信號120饋送至無損編碼塊108,無損編碼塊108生成 編碼的比特流121。有利地,因為能夠假設(shè)預(yù)測誤差信號120是去相關(guān)的(白色的),所以在無損編碼器108中可以使用簡單的無記憶熵編碼 (例如Rice編碼)??梢岳脤⒁跒V波器適配塊105的濾波器適配期 間得到的附加輔助信息117可選地支持無損編碼。例如,可以提供殘余 信號120的估計功率,作為輔助信息117,其是現(xiàn)有技術(shù)預(yù)測濾波器適 配方法的副產(chǎn)物。復(fù)用器109將部分比特流111、 116以及121組合以形 成輸出比特流信號122,并且可以針對輸出比特流122生成不同文件格 式或比特流格式。
術(shù)語"有損解碼器"是指對有損編碼的比特流進行精確解碼,也就 是有損編碼器的逆操作。
在圖2的解碼中,由解復(fù)用器201將進入的總比特流122分成子比 特流。有損解碼器202生成有損解碼的時間信號218以及輔助信息212, 其中將所述有損解碼器202實現(xiàn)為以平臺無關(guān)方式精確地生成與解碼 器102相同的輸出。根據(jù)該輔助信息以及任何比特流分量210 (與圖l 中的信號116相對應(yīng)),可以正如在相應(yīng)編碼塊105中一樣,在濾波器適 配塊203中執(zhí)行濾波器適配。解復(fù)用器201還將有損擴展比特流211提供 給無損解碼器204,所述無損解碼器204的輸出饋送至包括加法器205 和由塊212提供的濾波器系數(shù)214控制的預(yù)測濾波器206在內(nèi)的逆去相 關(guān)濾波器,從而生成有損編解碼器誤差信號114的比特精確的復(fù)制217。 該誤差信號與來自解碼器202的解碼信號218的相加207產(chǎn)生原始PCM 采樣SpcM。濾波器系數(shù)214與濾波器系數(shù)118相同。元件202、 204、 205、 206以及207的操作與相應(yīng)元件102、 108、 107、 106以及104的操作相同。
f敘雄
可以以不同方式來應(yīng)用該基本處理。
代替圖1中包括塊106和107在內(nèi)的前向反饋線性預(yù)測濾波器結(jié) 構(gòu),可以使用時域線性預(yù)測濾波器的其它變體。例如,后向預(yù)測或后 向預(yù)測與上述前向預(yù)測的結(jié)合。另一選項是除了這些短期預(yù)測技術(shù)以 外,使用長期預(yù)測濾波器。
從濾波器適配塊105/203提取的附加輔助信息117/213可用于控制 無損編碼/解碼塊108/204。例如,如公共濾波器適配技術(shù)所估計的, 預(yù)測殘余的標(biāo)準(zhǔn)偏差可用于對無損編碼進行參數(shù)化(例如選擇Huffman表格)。在圖1和2中針對信號117/213的虛線示出了該選項。 可以將提出的實施例應(yīng)用在各種編解碼器上,對于所述各種編解
碼器,可以根據(jù)解碼器處可用的參數(shù)組來確定或估計誤差信號的功率
譜。因此,能夠?qū)⒃摲旨壍木幗獯a器處理應(yīng)用到大范圍的音頻和語音
編解碼器。
示艦觀
假設(shè)有損基本層(base-layer)編解碼器遵從mp3標(biāo)準(zhǔn),則可以根 據(jù)縮放因子組,確定時域線性預(yù)測濾波器的最佳系數(shù)。在mp3編解碼 器中,縮放因子描述了將要應(yīng)用于對MDCT系數(shù)進行編碼的量化步長。 也就是,可以根據(jù)每一信號幀(微粒(granule))的縮放因子組得到 誤差信號功率譜的包絡(luò)。
令5W^指示在功率譜域表示的、針對第/個MDCT系數(shù)的縮放因 子。然后,可以通過逆離散傅里葉變換(IDFT)來確定自相關(guān)系數(shù) <^W = IDFT{See(/)}。對Levinson-Durbin算法(上面引用的Makhoul)的
應(yīng)用將生成將要在p階線性預(yù)測濾波器106/206中應(yīng)用的最佳濾波器系 數(shù)118/214的期望組"""1…^。針對音頻信號的每一幀(微粒)重復(fù)
該過程。除了濾波器系數(shù)組A, / = 1..^以外,Levi腦n-Durbin算法生成
預(yù)測誤差信號120/215的期望變體。該變體是對預(yù)測殘余的隨后無損編 碼108加以控制的重要信息。
如果mp3編碼器從比特分配中排除特定頻率范圍(例如低數(shù)據(jù)率 處的高頻率),或使用先進的編碼工具,則應(yīng)用更復(fù)雜的方案。此外, 在特定頻率范圍中,誤差信號的功率譜的估計&/"可能不具有將用于 濾波器適配的期望精度。則將通過檢查誤差信號114獲得附加信息。這
可以在時域和頻域執(zhí)行。 繊去被
在該實施例中,在有損編解碼器的變換域中執(zhí)行對殘余的去相 關(guān)。然而,仍然在時域執(zhí)行實際的無損編碼。因此,該方法不同于現(xiàn) 有的基于有損的無損方案以及基于變換的無損編碼方法。提出的實施 例結(jié)合了變換域去相關(guān)與基于時域的無損編碼方式的優(yōu)點。在圖3描述的編碼中,在使用適配的或固定的比特分配對變換參 數(shù)進行量化之前,有損編碼器301使用對原始信號SpcM(或其子帶信號) 的某一變換。在不喪失一般性的情況下,以下假設(shè)有損編碼器是基于
頻率變換的。在有損編碼器301生成了組合比特流317的嵌入的后向兼 容的有損信號部分309之后,應(yīng)用"頻譜白化"塊302,所述"頻譜白化" 塊302的目的是在變換域中確定有損編碼器301的誤差信號,以及對 這些誤差系數(shù)執(zhí)行附加量化,以針對將要編碼的擴展數(shù)據(jù)信號的連續(xù) 值的大小實現(xiàn)頻譜平坦(也就是"白色")的誤差基底。通常有損音頻 編解碼器應(yīng)用復(fù)雜的噪聲整形技術(shù)以獲得誤差頻譜,所述誤差頻譜遵 從于人耳的非白色掩蔽閾值。頻譜白化塊至少需要原始變換系數(shù)310 以及作為輸入信號包含在比特流中的量化的變換系數(shù)309。通過在頻域 內(nèi)將誤差量化,能夠?qū)崿F(xiàn)這樣的白化。頻域中原始變換系數(shù)310與量化 的變換系數(shù)309之間的差信號是時域中差信號314的反映(mirror)或 映像(image )。
將有損編碼器的輸出比特流309和來自頻譜白化塊302的附加信 息311饋送至擴展的有損和白化解碼器塊303中,以及饋送至復(fù)用器 307。將得到的時域信號312從原始信號SpcM的適當(dāng)延遲的版本313中減 去(補償有損編解碼器的任何延遲),生成殘余信號314。由于頻譜白 化過程,使得該殘余信號具有平坦頻譜,也就是在連續(xù)的采樣間存在 可忽略的相關(guān)。可以將殘余信號直接饋送至無損編碼器306中,無損編 碼器306輸出無損擴展流316。可選地,可以使用來自有損&白化解碼 器303的輔助信息(參見以上給出的示例;對于誤差信號的平均功率是 尤其有利的)315來控制無損編碼器306。
為了可操作,以平臺無關(guān)的方式實現(xiàn)有損&白化解碼器303、減法
器305、以及可以在有損解碼器塊內(nèi)選擇地實現(xiàn)的任何內(nèi)插功能性。也
就是,對于所有目標(biāo)平臺,需要具有整數(shù)精度的定點實現(xiàn),來生成可
比特精確地再現(xiàn)的結(jié)果。
復(fù)用器307將部分比特流309、 311以及316組合以形成輸出比特流
信號317,并且可以生成不同文件格式或比特流格式。
在圖4所示的解碼中,將接收的比特流317解復(fù)用401并且分成獨立的信號層406、 407以及40S。將嵌入的有損比特流406和頻譜白化比 特流407饋送至有損和白化解碼器402。得到的時域信號是編碼中中間 質(zhì)量信號312的比特精確的復(fù)制。無損解碼器403從比特流408以及選擇 地從有損和白化解碼器(輔助信息410)獲得輸入,以生成殘余信號411。 通過將中間質(zhì)量信號409加上無損解碼的殘余信號411,獲得最終輸出
伯號SpcM。
元件402、 403以及404的操作與相應(yīng)元件303、 306以及305的相同。
#敘廁
對于通過為頻譜白化分配更多或更少量的比特來控制殘余信號 的功率,存在幾種可能性。 一個選項是,通過在頻譜白化塊302中改變 量化的量以及允許對時域無損編碼306的固定設(shè)置,將殘余信號的恒定 功率作為目標(biāo)。另一選項是,允許時域殘余信號的可變功率電平(power level
通過采用有損編碼器301生成的部分比特流以及頻譜白化塊302, 特制的(tailored)解碼器可以生成具有中間質(zhì)量的輸出信號,所述中 間質(zhì)量在嵌入的有損編解碼器的質(zhì)量和對原始PCM采樣的數(shù)學(xué)上無
損解碼的質(zhì)量之間。該中間質(zhì)量依賴于殘余信號的功率,其中采用先 前段落中描述的方式之一來控制所述殘余信號。這樣的解碼器可以不 包括無損解碼器403和加法器404,并且將不處理比特流316/408。
為了支持多于l個的中間質(zhì)量信號的產(chǎn)生,頻譜白化信息311的分 層組織是有可能的。這樣,可以指定這樣的編解碼器所述編解碼器 在由有損編解碼器(最低質(zhì)量)和原始PCM采樣(最高質(zhì)量)所限定 的范圍內(nèi)具有任意數(shù)目的中間質(zhì)量級別??梢越M織不同的質(zhì)量級別, 以便提供可縮放的比特流。
示樹實嚴(yán)夠
本發(fā)明的示例實施例基于mp3標(biāo)準(zhǔn)。在圖5中示出了符合mp3的編 碼器的方框圖。在圖3的內(nèi)容中,圖5的mp3編碼器(可能除了MUX507, 取決于文件格式的比特流)是有損編碼器塊301的一部分。
原始輸入信號SpcM通過多相濾波器組&抽取器(dedmator) 503、 分割&MDCT504以及比特分配和量化器505,至復(fù)用器507。輸入信號SpcM還通過FFT階段或步驟501至心理聲學(xué)分析502,所述心理聲學(xué)分 析502控制步驟/階段504和量化505中的分割(或加窗(windowing))。 比特分配和量化器505還提供輔助信息515,所述輔助信息515通過輔助 信息編碼器506至復(fù)用器507,復(fù)用器507輸出信號517。
分別地,令x指示來自塊504的輸出矢量513的(也就是在針對mp3 的MDCT域中的)、獨立卻任意的原始變換系數(shù),令;指示由比特流514 表示和指示的相同系數(shù)的量化版本,它是輸出信號517或309的一部分。 除了比特流309/517以外,MDCT系數(shù)513的原始矢量被傳遞給頻譜白 化塊302上。因此,信號310包括信號513以及可選地來自mp3編碼器的 附加有用輔助信息。在頻譜白化塊302中,為了獲得白誤差基底,也就 是頻譜平坦(白)誤差頻譜e-" "2(e),利用第二量化器對mp3編解 碼器的誤差^x-;進行量化。因此,應(yīng)該對將要在頻譜白化塊中應(yīng)用 的比特分配進行控制,使得滿足條件E"")2^常量,其中E是期望值。
對于頻譜白化量化器,可以使用己知的量化技術(shù),例如熵編碼之 后的標(biāo)量(scalar)或柵格(lattice)量化,或優(yōu)化的(訓(xùn)練過的)固 定熵標(biāo)量或矢量量化。如果不依賴于頻譜系數(shù)的原始mp3量化器的參 數(shù)值而選擇并且優(yōu)化了頻譜白化量化器,則可以期望最好的結(jié)果。也 就是,頻譜白化量化器應(yīng)該是條件量化器。
凝鍵f/7好凝^游去游關(guān)
該實施例結(jié)合了好i《去/^關(guān)和^#去/#關(guān)部分中所描述的特征。 將去相關(guān)分成分別在頻域和時域操作的2個子系統(tǒng)。
在圖6描述的編碼中,在利用適配或固定的比特分配對變換系數(shù) 進行量化之前,有損編碼器601使用對原始信號SpcM (或其子帶信號) 的某一變換。在不失一般性的情況下,以下假設(shè)編碼器601使用頻率變 換。在生成了組合比特流625的嵌入的后向兼容的有損信號部分612之 后,應(yīng)用頻譜白化塊602,目的是為了在變換域內(nèi)確定編碼器601的誤 差信號,以及對這些誤差系數(shù)執(zhí)行附加量化,以針對將要編碼的擴展 數(shù)據(jù)信號的連續(xù)值,實現(xiàn)在頻譜方面比有損解碼器的輸入誤差頻譜的 基底更平坦或白的誤差基底。頻譜白化塊至少需要原始變換系數(shù)613 和量化的變換系數(shù)612,作為輸入信號。將有損編碼器的輸出比特流612和來自頻譜白化塊602的相應(yīng)附 加信息614饋送至有損和白化解碼器塊603以及饋送至復(fù)用器610。將其 得到的時域輸出信號615從原始信號SpcM的適當(dāng)延遲版本616中減去 605,生成殘余信號617。
在預(yù)測濾波器607中將在殘余信號617的連續(xù)采樣間仍然保持的 弱相關(guān)性去除。在濾波器適配塊606中使用從有損和白化解碼器塊603 提取的輔助信息(參見以上給出的示例,例如誤差頻譜的包絡(luò))618, 以確定將要應(yīng)用在濾波器607中的一組最佳濾波器系數(shù)621。預(yù)測濾波 和減法608的目的是生成具有平坦或白頻譜的完全去相關(guān)的輸出信號
623。 該殘余信號通過無損編碼器609,無損編碼器609輸出無損擴展流
624。 可選地,可以使用來自濾波器適配塊606的輔助信息(參見以上 給出的示例,例如信號功率)來自控制編碼器609??蛇x地,將與預(yù)測 濾波器設(shè)置有關(guān)的、來自塊606的信息發(fā)送至復(fù)用器610。在數(shù)據(jù)率方 面,相應(yīng)的信息流619總是比未采用輔助信息618的系統(tǒng)低。
復(fù)用器610將部分比特流612、 614、 619以及624組合以形成輸出 信號625,并且可以生成不同的文件格式或比特流格式。
在圖7描述的解碼中,由解復(fù)用器701將接收的比特流625分成獨 立的信號層709、 710、 711以及712。將嵌入的有損比特流709和頻譜白 化比特流710都饋送至有損和白化解碼器702。所述有損和白化解碼器 702的有損或中間質(zhì)量時域輸出信號719是編碼中有損或中間質(zhì)量信號 615的比特精確的復(fù)制。
解碼器702還將輔助信息713提供給濾波器適配塊703。根據(jù)該輔 助信息以及任何比特流分量711 (與圖6中的信號619相對應(yīng)),正如在 相應(yīng)編碼塊606中一樣,執(zhí)行濾波器適配。
無損解碼器704從無損擴展流712以及可選地從濾波器適配塊703 輸出的輔助信息715 (與圖6的輔助信息620相對應(yīng))得到輸入,以生成 (部分地)去相關(guān)的殘余信號717 (與圖6中的信號623相對應(yīng))。將所 述信號饋送至包括加法器705以及由塊703提供的濾波器系數(shù)714控制 的預(yù)測濾波器706在內(nèi)的逆去相關(guān)濾波器,從而生成殘余信號617的比 特精確的復(fù)制718。通過在加法器707中將有損解碼的信號719與無損解碼的殘余信號718組合,得到最后輸出信號SpcM。濾波器系數(shù)714與濾
波器系數(shù)621相同。元件702、 704、 705、 706以及707的操作與相應(yīng)元 件603、 609、 608、 607以及605的操作相同。
盡管這些塊的功能和操作基本上分別遵從圖1和3、或圖2和4所描 述的操作,然而在控制方式以及將要在頻域和時域應(yīng)用的去相關(guān)的量 方面存在不同。
控制頻域與時域去相關(guān)之間的平衡的一個策略是,對比特流的有 損部分和頻譜白化部分的總數(shù)據(jù)率加以限制。如果存在比特流的這兩 個分量的數(shù)據(jù)率的固定上限,則頻譜白化僅能夠執(zhí)行誤差信號的去相 關(guān)任務(wù)的特定部分。也就是,時域殘余信號617將仍然呈現(xiàn)一定的相關(guān) 性。如在/^教去/《關(guān)部分中描述的,通過使用線性預(yù)測濾波器、采用 從有損&白化解碼器得到的信息,由下游的時域去相關(guān)去除剩余的相 關(guān)性。
另一策略是,僅使用頻域去相關(guān)從殘余信號中去除長期相關(guān)性, 也就是與殘余信號的音調(diào)(tonal)分量相對應(yīng)的、在頻域中較窄(或 "尖(peaky)")的信號的相關(guān)特性。隨后,優(yōu)化由線性預(yù)測濾波執(zhí)行 的時域去相關(guān),并且使用所述所述時域去相關(guān)從殘余信號中去除剩余 的短期相關(guān)性。從而有利地,這兩個去相關(guān)技術(shù)都用在了它們最好的 操作點上。因此,這種處理可以以低計算復(fù)雜度實現(xiàn)非常高效的編碼。
,被蕭
通過為頻譜白化分配更多或更少量的比特來控制殘余信號的功 率存在幾種可能。 一個選項是,通過改變頻譜白化塊602中的量化的量 以及通過允許對時域無損編碼609的固定設(shè)置(setup),將殘余信號的 恒定功率作為目標(biāo)。另一選項是,允許時域殘余信號的可變功率電平。
通過采用有損編碼器601和頻譜白化塊602生成的部分比特流進 行,定制的解碼器可以生成具有中間質(zhì)量的輸出信號,所述中間質(zhì)量 在嵌入的有損編解碼器的質(zhì)量和對原始PCM采樣的數(shù)學(xué)上無損解碼 的質(zhì)量之間。該中間質(zhì)量取決于由先前段落中描述的方式之一控制的 殘余信號的功率。這樣的解碼器可以不包括無損解碼器704、濾波器適 配塊703、預(yù)測濾波器706以及加法器705和707。
權(quán)利要求
1、一種使用有損編碼的數(shù)據(jù)流(111)和無損擴展數(shù)據(jù)流(121)對源信號(SPCM)進行無損編碼的方法,所述有損編碼的數(shù)據(jù)流(111)和無損擴展數(shù)據(jù)流(121)一起形成所述源信號的無損編碼的數(shù)據(jù)流(122),所述方法包括步驟-對所述源信號進行有損編碼(101),其中所述有損編碼提供所述有損編碼的數(shù)據(jù)流(111),其特征在于-對所述有損編碼的數(shù)據(jù)進行有損解碼(102),從而重建解碼的信號(112),以及提供用于控制時域預(yù)測濾波器的輔助信息(115);-形成所述源信號的相應(yīng)延遲(103)的版本與所述解碼的信號(112)之間的差信號(114),-使用從所述輔助信息得到(105)的濾波器系數(shù)(118)對所述差信號進行預(yù)測濾波(106,107),以在時域?qū)λ霾钚盘柕倪B續(xù)值進行去相關(guān);-對所述去相關(guān)的差信號(120)進行無損編碼(108),以提供所述無損擴展數(shù)據(jù)流(121);-將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流組合(109),以形成所述無損編碼的數(shù)據(jù)流(122)。
2、 一種使用有損編碼的數(shù)據(jù)流(309)和無損擴展數(shù)據(jù)流(316) 對源信號(SPCM)進行無損編碼的方法,所述有損編碼的數(shù)據(jù)流(309) 和無損擴展數(shù)據(jù)流(316) —起形成所述源信號的無損編碼的數(shù)據(jù)流 (317),所述方法包括步驟-對所述源信號進行有損編碼(301),其中所述有損編碼提供所 述有損編碼的數(shù)據(jù)流(309),其特征在于-根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損編碼 接收的相應(yīng)的尚未量化的系數(shù),來計算(302)頻譜白化數(shù)據(jù)(311), 所述頻譜白化數(shù)據(jù)表示對原始系數(shù)的更精細(xì)量化,由此對所述計算進行控制,以使得量化誤差的功率對于所有頻率本質(zhì)上恒定;-使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行有損解碼(303),從而重建解碼的信號(312);-形成(305)所述源信號(SpcM)的相應(yīng)延遲(304)的版本與 所述解碼的信號(312)之間的差信號(314);-對所述差信號進行無損編碼(306)以提供所述無損擴展數(shù)據(jù)流 (316);-將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻譜白 化數(shù)據(jù)(311)組合(307),以形成所述無損編碼的數(shù)據(jù)流(317)。
3、 一種使用有損編碼的數(shù)據(jù)流(612)和無損擴展數(shù)據(jù)流(624) 對源信號(SpcM)進行無損編碼的方法,所述有損編碼后的數(shù)據(jù)流(612) 和無損擴展數(shù)據(jù)流(624) —起形成所述源信號的無損編碼的數(shù)據(jù)流 (625),所述方法包括步驟-對所述源信號進行有損編碼(601),其中所述有損編碼提供所 述有損編碼的數(shù)據(jù)流(612),其特征在于-根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損編碼 接收的相應(yīng)的尚未量化的系數(shù),來計算(602)頻譜白化數(shù)據(jù)(614), 所述頻譜白化數(shù)據(jù)表示對原始系數(shù)的更精細(xì)量化,由此對所述計算進 行控制,以使得量化誤差的功率對于所有頻率本質(zhì)上恒定;-使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行有損解碼 (603),從而重建解碼的信號(615),以及提供用于控制時域預(yù)測濾 波器的輔助信息(618);-形成(605)所述源信號(Spew)的相應(yīng)延遲(604)的版本與 所述解碼的信號(615)之間的差信號(617);-使用從所述輔助信息得到(606)的濾波器系數(shù)(621)對所述 差信號進行預(yù)測濾波(607, 608),以在時域中對所述差信號的連續(xù)值 進行去相關(guān);-對所述去相關(guān)的差信號(623)進行無損編碼(609)以提供所 述無損擴展數(shù)據(jù)流(624);-將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻譜白化數(shù)據(jù)(614)組合(610),以形成所述無損編碼的數(shù)據(jù)流(625)。
4、 一種使用有損編碼的數(shù)據(jù)流(111)和無損擴展數(shù)據(jù)流(121)對源信號(SpcM)進行無損編碼的設(shè)備,所述有損編碼的數(shù)據(jù)流(111)和無損擴展數(shù)據(jù)流(121) —起形成所述源信號的無損編碼的數(shù)據(jù)流 (122),所述設(shè)備包括-適于對所述源信號進行有損編碼的裝置(101),其中所述有損 編碼提供所述有損編碼的數(shù)據(jù)流(111),其特征在于-適于對所述有損編碼的數(shù)據(jù)進行有損解碼從而重建解碼的信號(112)以及提供用于控制時域預(yù)測濾波器的輔助信息(115)的裝置(102);-適于形成所述源信號的相應(yīng)延遲的版本與所述解碼的信號(112)之間的差信號(114)的裝置(104, 103),-適于使用從所述輔助信息得到的濾波器系數(shù)(118)對所述差信 號進行預(yù)測濾波以在時域?qū)λ霾钚盘柕倪B續(xù)值進行去相關(guān)的裝置 (105, 106, 107);-適于對所述去相關(guān)的差信號(120)進行無損編碼以提供所述無 損擴展數(shù)據(jù)流(121)的裝置(108);-適于將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流組合以形 成所述無損編碼的數(shù)據(jù)流(122)的裝置(109)。
5、 一種使用有損編碼的數(shù)據(jù)流(309)和無損擴展數(shù)據(jù)流(316) 對源信號(SPCM)迸行無損編碼的設(shè)備,所述有損編碼的數(shù)據(jù)流(309) 和無損擴展數(shù)據(jù)流(316) —起形成所述源信號的無損編碼的數(shù)據(jù)流(317),所述設(shè)備包括-適于對所述源信號進行有損編碼的裝置(301),其中所述有損 編碼提供所述有損編碼的數(shù)據(jù)流(309), 其特征在于-適于根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損 編碼接收的相應(yīng)的尚未量化的系數(shù),來計算頻譜白化數(shù)據(jù)(311),其中所述頻譜白化數(shù)據(jù)表示對原始系數(shù)的更精細(xì)量化,由此對所述計算 進行控制,以使得量化誤差的功率對于所有頻率本質(zhì)上恒定的裝置 (302);-適于使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行有損解碼從而重建解碼的信號(312)的裝置(303);-適于形成所述源信號(SPCM)的相應(yīng)延遲的版本與所述解碼的 信號(312)之間的差信號(314)的裝置(305, 304);-適于對所述差信號進行無損編碼以提供所述無損擴展數(shù)據(jù)流 (316)的裝置(306);-適于將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻 譜白化數(shù)據(jù)(311)組合以形成所述無損編碼的數(shù)據(jù)流(317)的裝置 (307)。
6、 一種使用有損編碼的數(shù)據(jù)流(612)和無損擴展數(shù)據(jù)流(624) 對源信號(SPCM)進行無損編碼的方法,所述有損編碼的數(shù)據(jù)流(612) 和無損擴展數(shù)據(jù)流(624) —起形成所述源信號的無損編碼的數(shù)據(jù)流 (625),所述設(shè)備包括-適于對所述源信號進行有損編碼的裝置(601),其中所述有損 編碼提供所述有損編碼的數(shù)據(jù)流(612),其特征在于-適于根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損 編碼接收的相應(yīng)的尚未量化的系數(shù),來計算頻譜白化數(shù)據(jù)(614),其 中所述頻譜白化數(shù)據(jù)表示對原始系數(shù)的更精細(xì)量化,由此對所述計算 進行控制,以使得量化誤差的功率對于所有頻率本質(zhì)上恒定的裝置 (602);-適于使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行有損解 碼從而重建解碼的信號(615),以及提供用于控制時域預(yù)測濾波器的 輔助信息(618)的裝置(603);-適于形成所述源信號(SPCM)的相應(yīng)延遲的版本與所述解碼的 信號(615)之間的差信號(617)的裝置(605, 604);-適于使用從所述輔助信息得到的濾波器系數(shù)(621)對所述差信號進行預(yù)測濾波以在時域中對所述差信號的連續(xù)值進行去相關(guān)的裝置(606, 607, 608);-適于對所述去相關(guān)的差信號(623)進行無損編碼以提供所述無 損擴展數(shù)據(jù)流(624)的裝置(609);-將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻譜白 化數(shù)據(jù)(614)組合以形成所述無損編碼的數(shù)據(jù)流(625)的裝置(610)。
7、 一種對從有損編碼的數(shù)據(jù)流(111)和無損擴展數(shù)據(jù)流(121) 得到的無損編碼的源信號(SpcM)數(shù)據(jù)流進行解碼的方法,所述有損 編碼的數(shù)據(jù)流(111)和無損擴展數(shù)據(jù)流(121) —起形成所述源信號 的無損編碼的數(shù)據(jù)流(122),其中對所述源信號進行了有損編碼(101),所述有損編碼提供所述有 損編碼的數(shù)據(jù)流(111);對所述有損編碼的數(shù)據(jù)進行了相應(yīng)的有損解碼(102),從而重建 標(biāo)準(zhǔn)解碼的信號(SDee)并且提供用于控制時域預(yù)測濾波器的輔助信息(115);形成了 (104)所述源信號的相應(yīng)延遲(103)的版本與所述解碼 的信號(112)之間的差信號(114);使用從所述輔助信息得到(105)的濾波器系數(shù)(118)對所述差 信號進行了預(yù)測濾波(106, 107),以在時域?qū)λ霾钚盘柕倪B續(xù)值進 行去相關(guān);對所述去相關(guān)的差信號(120)進行了無損編碼(108),以提供 所述無損擴展數(shù)據(jù)流(121);將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流組合(109),以 形成所述無損編碼的數(shù)據(jù)流(122),所述方法包括步驟-對所述無損編碼的源信號數(shù)據(jù)流(122)進行解復(fù)用(201),以 提供所述無損擴展數(shù)據(jù)流(211)以及所述有損編碼的數(shù)據(jù)流(209);-對所述有損編碼的數(shù)據(jù)流進行有損解碼(202),從而重建有損 解碼的信號(218)并且提供用于控制時域預(yù)測濾波器的所述輔助信息 (212);-對所述無損擴展數(shù)據(jù)流進行解碼(204),以提供所述去相關(guān)的 差信號(215);-使用從所述輔助信息(212)得到(203)的濾波器系數(shù)(214) 對所述去相關(guān)的差信號的連續(xù)值進行逆去相關(guān)濾波(205, 206);-將所述去相關(guān)濾波的差信號(217)與所述有損解碼的信號(218) 組合(207),以重建所述源信號(SpcM)。
8、 一種對從有損編碼的數(shù)據(jù)流(309)和無損擴展數(shù)據(jù)流(316)得到的無損編碼的源信號(SpcM)數(shù)據(jù)流進行解碼的方法,所述有損編碼的數(shù)據(jù)流(309)和無損擴展數(shù)據(jù)流(316) —起形成所述源信號 的無損編碼的數(shù)據(jù)流(317),其中對所述源信號進行了有損編碼(301),其中所述有損編碼提供所 述有損編碼的數(shù)據(jù)流(309),根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損編碼 接收的相應(yīng)的尚未量化的系數(shù),計算了(302)表示頻譜白化數(shù)據(jù)(311),所述頻譜白化數(shù)據(jù)對原始系數(shù)的更精細(xì)量化,由此對所述計算進行了 控制以使得量化誤差的功率對于所有頻率本質(zhì)上恒定;使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行了有損解碼 (303),從而重建了解碼的信號(312);形成了 (305)所述源信號(SpcM)的相應(yīng)延遲(304)的版本與 所述解碼的信號(312)之間的差信號(314);對所述差信號進行了無損編碼(306)以提供所述無損擴展數(shù)據(jù) 流(316);將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻譜白 化數(shù)據(jù)(3U)組合(307),以形成所述無損編碼后的數(shù)據(jù)流(317), 所述方法包括步驟-對所述無損編碼的源信號數(shù)據(jù)流(317)進行解復(fù)用(401),以 提供所述無損擴展數(shù)據(jù)流(408)以及所述有損編碼的數(shù)據(jù)流(406);-使用所述頻譜白化數(shù)據(jù)(407)對所述有損編碼的數(shù)據(jù)流進行有 損解碼(402),從而重建有損解碼的信號(409);-對所述無損擴展數(shù)據(jù)流進行解碼(403),以提供所述差信號(411);-將所述差信號(411)與所述有損解碼的信號(409)組合(404),以重建所述源信號(Spcm)。
9、 一種對從有損編碼的數(shù)據(jù)流(612)和無損擴展數(shù)據(jù)流(624) 得到的無損編碼的源信號(SPCM)數(shù)據(jù)流進行解碼的方法,所述有損 編碼的數(shù)據(jù)流(612)和無損擴展數(shù)據(jù)流(624) —起形成所述源信號 的無損編碼的數(shù)據(jù)流(625),其中對所述源信號進行了有損編碼(601),其中所述有損編碼提供所 述有損編碼的數(shù)據(jù)流(612),根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損編碼 接收的相應(yīng)的尚未量化的系數(shù),計算了 (602)頻譜白化數(shù)據(jù)(614), 所述頻譜白化數(shù)據(jù)表示對原始系數(shù)的更精細(xì)量化,由此對所述計算進 行了控制,以使得量化誤差的功率對于所有頻率本質(zhì)上恒定;使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行了有損解碼 (603),從而重建了解碼的信號(615)以及提供了用于控制時域預(yù)測 濾波器的輔助信息(618);形成了 (605)所述源信號(SpcM)的相應(yīng)延遲(604)的版本與 所述解碼的信號(615)之間的差信號(617);使用從所述輔助信息得到(606)的濾波器系數(shù)(621)對所述差 信號進行了預(yù)測濾波(607, 608),以在時域中對所述差信號的連續(xù)值 進行去相關(guān);對所述去相關(guān)的差信號(623)進行了無損編碼(609)以提供所 述無損擴展數(shù)據(jù)流(624);將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻譜白 化數(shù)據(jù)(614)組合(610),以形成所述無損編碼的數(shù)據(jù)流(625),所述方法包括步驟-對所述無損編碼的源信號數(shù)據(jù)流(625)進行解復(fù)用(701),以 提供所述無損擴展數(shù)據(jù)流(712)以及所述有損編碼的數(shù)據(jù)流(709);-使用所述頻譜白化數(shù)據(jù)(710)對所述有損編碼的數(shù)據(jù)流進行有 損解碼(702),從而重建有損解碼的信號(719),以及提供用于控制時域預(yù)測濾波器的所述輔助信息(713);-對所述無損擴展數(shù)據(jù)流進行解碼(704),以提供所述去相關(guān)的 差信號(717);-使用從所述輔助信息(713)得到(703)的濾波器系數(shù)(714) 對所述去相關(guān)的差信號的連續(xù)值進行逆去相關(guān)濾波(705, 706);-將所述去相關(guān)濾波的差信號(718)與所述有損解碼的信號(719) 組合(707),以重建所述源信號(SpcM)。
10、 一種對從有損編碼的數(shù)據(jù)流(111)和無損擴展數(shù)據(jù)流(121)得到的無損編碼的源信號(SpcM)數(shù)據(jù)流進行解碼的設(shè)備,所述有損 編碼的數(shù)據(jù)流(111)和無損擴展數(shù)據(jù)流(121) —起形成所述源信號 的無損編碼的數(shù)據(jù)流(122),其中對所述源信號進行了有損編碼(101),所述有損編碼提供所述有 損編碼的數(shù)據(jù)流(111);對所述有損編碼的數(shù)據(jù)進行了相應(yīng)的有損解碼(102),從而重建 標(biāo)準(zhǔn)解碼的信號(SDee),并且提供用于控制時域預(yù)測濾波器的輔助信 息(115);形成了 (104)所述源信號的相應(yīng)延遲(103)的版本與所述解碼 的信號(112)之間的差信號(114);使用從所述輔助信息得到(105)的濾波器系數(shù)(118)對所述差 信號進行了預(yù)測濾波(106, 107),以在時域?qū)λ霾钚盘柕倪B續(xù)值進 行去相關(guān);對所述去相關(guān)的差信號(120)進行了無損編碼(108),以提供 所述無損擴展數(shù)據(jù)流(121);將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流組合(109),以 形成所述無損編碼的數(shù)據(jù)流(122),所述設(shè)備包括-適于對所述無損編碼的源信號數(shù)據(jù)流(122)進行解復(fù)用以提供 所述無損擴展數(shù)據(jù)流(211)以及所述有損編碼的數(shù)據(jù)流(209)的裝 置(201);-適于對所述有損編碼的數(shù)據(jù)流進行有損解碼從而重建有損解碼的信號(218)并且提供用于控制時域預(yù)測濾波器的所述輔助信息(212)的裝置(202);-適于對所述無損擴展數(shù)據(jù)流進行解碼以提供所述去相關(guān)的差信號(215)的裝置(204);-適于使用從所述輔助信息(212)得到(203)的濾波器系數(shù)(214) 對所述去相關(guān)的差信號的連續(xù)值進行逆去相關(guān)濾波的裝置(205,206);-適于將所述去相關(guān)濾波的差信號(217)與所述有損解碼的信號 (218)組合以重建所述源信號"km)的裝置(207)。
11、 一種對從有損編碼的數(shù)據(jù)流(309)和無損擴展數(shù)據(jù)流(316) 得到的無損編碼的源信號(SPCM)數(shù)據(jù)流進行解碼的設(shè)備,所述有損 編碼的數(shù)據(jù)流(309)和無損擴展數(shù)據(jù)流(316) —起形成所述源信號 的無損編碼的數(shù)據(jù)流(317),其中對所述源信號進行了有損編碼(301),其中所述有損編碼提供所 述有損編碼的數(shù)據(jù)流(309);根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損編碼 接收的相應(yīng)的尚未量化的系數(shù),計算了 (302)頻譜白化數(shù)據(jù)(311), 所述頻譜白化數(shù)據(jù)表示對原始系數(shù)的更精細(xì)量化,由此對所述計算進 行了控制,以使得量化誤差的功率對于所有頻率本質(zhì)上恒定;使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行了有損解碼 (303),從而重建了解碼的信號(312);形成了 (305)所述源信號(SpcM)的相應(yīng)延遲(304)的版本與 所述解碼的信號(312)之間的差信號(314);對所述差信號進行了無損編碼(306)以提供所述無損擴展數(shù)據(jù) 流(316);將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻譜白 化數(shù)據(jù)(3U)組合(307),以形成所述無損編碼的數(shù)據(jù)流(317), 所述設(shè)備包括-適于對所述無損編碼的源信號數(shù)據(jù)流(317)進行解復(fù)用以提供 所述無損擴展數(shù)據(jù)流(408)以及所述有損編碼的數(shù)據(jù)流(406)的裝 置(401);-適于使用所述頻譜白化數(shù)據(jù)(407)對所述有損編碼的數(shù)據(jù)流進行有損解碼從而重建有損解碼的信號(409)的裝置(402);-適于對所述無損擴展數(shù)據(jù)流進行解碼以提供所述差信號(411) 的裝置(403);-適于將所述差信號(411)與所述有損解碼的信號(409)組合 以重建所述源信號(SPCM)的裝置(404)。
12、 一種對從有損編碼的數(shù)據(jù)流(612)和無損擴展數(shù)據(jù)流(624) 得到的無損編碼的源信號(SpcM)數(shù)據(jù)流進行解碼的設(shè)備,所述有損 編碼的數(shù)據(jù)流(612)和無損擴展數(shù)據(jù)流(624) —起形成所述源信號 的無損編碼的數(shù)據(jù)流(625),其中對所述源信號進行了有損編碼(601),其中所述有損編碼提供所 述有損編碼的數(shù)據(jù)流(612),根據(jù)所述有損編碼的數(shù)據(jù)流的量化的系數(shù)以及從所述有損編碼 接收的相應(yīng)的尚未量化的系數(shù),計算了 (602)頻譜白化數(shù)據(jù)(614), 所述頻譜白化數(shù)據(jù)表示對原始系數(shù)的更精細(xì)量化,由此對所述計算進 行了控制,以使得量化誤差的功率對于所有頻率本質(zhì)上恒定;使用所述頻譜白化數(shù)據(jù)對所述有損編碼的數(shù)據(jù)進行了有損解碼 (603),從而重建解碼的信號(615),以及提供了用于控制時域預(yù)測 濾波器的輔助信息(618);形成了 (605)所述源信號(SPCM)的相應(yīng)延遲(604)的版本與 所述解碼的信號(615)之間的差信號(617);使用從所述輔助信息得到(606)的濾波器系數(shù)(621)對所述差 信號進行了預(yù)測濾波(607, 608),以在時域中對所述差信號的連續(xù)值 進行去相關(guān);對所述去相關(guān)的差信號(623)進行了無損編碼(609)以提供所 述無損擴展數(shù)據(jù)流(624);將所述無損擴展數(shù)據(jù)流與所述有損編碼的數(shù)據(jù)流和所述頻譜白 化數(shù)據(jù)(614)組合(610),以形成所述無損編碼的數(shù)據(jù)流(625),所述設(shè)備包括-適于對所述無損編碼的源信號數(shù)據(jù)流(625)進行解復(fù)用以提供所述無損擴展數(shù)據(jù)流(712)以及所述有損編碼的數(shù)據(jù)流(709)的裝置(701);-適于使用所述頻譜白化數(shù)據(jù)(710)對所述有損編碼的數(shù)據(jù)流進 行有損解碼從而重建有損解碼的信號(719)以及提供用于控制時域預(yù) 測濾波器的所述輔助信息(713)的裝置(702);-適于對所述無損擴展數(shù)據(jù)流進行解碼以提供所述去相關(guān)的差信 號(717)的裝置(704);-適于使用從所述輔助信息(713)得到(703)的濾波器系數(shù)(714) 對所述去相關(guān)的差信號的連續(xù)值進行逆去相關(guān)濾波的裝置(705,706);-將所述去相關(guān)濾波的差信號(718)與所述有損解碼的信號(719) 組合以重建所述源信號(SpcM)的裝置(707)。
13、 根據(jù)權(quán)利要求l、 3、 7和9之一的方法,或根據(jù)權(quán)利要求4、 6、 10和12之一的設(shè)備,其中,從所述輔助信息(115, 618)得到預(yù)測濾 波器設(shè)置數(shù)據(jù)(116, 619),并且所述預(yù)測濾波器設(shè)置數(shù)據(jù)(116, 619) 包含在所述無損編碼的數(shù)據(jù)流(122, 625)中,或從所述無損編碼的 數(shù)據(jù)流(122, 625)得到輔助信息預(yù)測濾波器設(shè)置數(shù)據(jù)(210, 711) 并且所述輔助信息預(yù)測濾波器設(shè)置數(shù)據(jù)(210, 711)用于產(chǎn)生(203, 703)所述預(yù)測濾波器系數(shù)(214, 714)。
14、 根據(jù)權(quán)利要求l、 3、 7、 9和13之一的方法,或根據(jù)權(quán)利要求 4、 6、 10、 12和13之一的設(shè)備,其中,預(yù)測殘余的標(biāo)準(zhǔn)偏差(117, 213; 620, 715)分別用于將所述無損編碼(108, 609)參數(shù)化或用于控制 所述無損解碼(204, 704)。
15、 根據(jù)權(quán)利要求2或8的方法,或根據(jù)權(quán)利要求5或11的設(shè)備, 其中,來自所述有損解碼器(303, 402)的輔助信息(315, 410)分 別用于控制所述無損編碼(306)或所述無損解碼(403)。
16、 根據(jù)權(quán)利要求8或9的方法,或根據(jù)權(quán)利要求11或12的設(shè)備, 其中,不對所述無損擴展數(shù)據(jù)流(408, 712)進行評估,并且所述頻 譜白化數(shù)據(jù)(407, 710)與所述有損編碼的數(shù)據(jù)流(406, 709) —起 用于對具有比所述源信號的質(zhì)量低的中間質(zhì)量的輸出信號進行解碼(頓,702)。
17、 一種存儲介質(zhì),例如光盤上的存儲介質(zhì),包含或存儲或在其上記錄有根據(jù)權(quán)利要求1至3和13至15之一的方法編碼的數(shù)字信號。
全文摘要
在基于有損的無損編碼中,PCM音頻信號通過有損編碼器(101)至無損解碼器(102)。有損編碼器提供有損比特流(111)。有損解碼器還提供用于控制(105)預(yù)測濾波器(106)的系數(shù)(118)的輔助信息(115),所述預(yù)測濾波器(106)對PCM信號與有損解碼器輸出之間的差信號(104)進行去相關(guān)。對去相關(guān)的差信號進行無損編碼(108),提供擴展比特流(121)。代替時域中的去相關(guān)或除此之外,可使用頻譜白化在頻域中去相關(guān)。有損編碼的比特流與無損編碼的擴展比特流一起形成無損編碼的比特流。本發(fā)明通過擴展以利于增強有損感知音頻編碼/解碼,其中所述擴展使得在數(shù)學(xué)上能夠精確再現(xiàn)原始波形,并且為在解碼器處重建中間質(zhì)量音頻信號提供附加數(shù)據(jù)。無損擴展可用于將廣泛使用的mp3編碼/解碼擴展為無損編碼/解碼和高質(zhì)量mp3編碼/解碼。
文檔編號G10L19/04GK101432802SQ200780015604
公開日2009年5月13日 申請日期2007年4月18日 優(yōu)先權(quán)日2006年5月5日
發(fā)明者奧利弗·烏伯特, 弗洛里安·凱勒, 彼得·杰克斯, 斯文·科登, 約翰尼斯·伯姆 申請人:湯姆森許可貿(mào)易公司