對表示時域數(shù)據(jù)流的數(shù)據(jù)段進行編碼和解碼的編碼器、解碼器以及方法

文檔序號：2830595閱讀：230來源：國知局

專利名稱：對表示時域數(shù)據(jù)流的數(shù)據(jù)段進行編碼和解碼的編碼器、解碼器以及方法
技術(shù)領域：
本發(fā)明屬于編碼領域，其中，例如在視頻以及音頻編碼中，針對編碼速率來使用將被編碼的數(shù)據(jù)的不同特性。
背景技術(shù)：
當前技術(shù)的編碼策略可以利用將被編碼的數(shù)據(jù)流的特性。例如，在音頻編碼中，使用感知模型對原始數(shù)據(jù)進行壓縮，而在重新播放時幾乎不會有顯著的質(zhì)量降低和降級?，F(xiàn)代的感知音頻編碼方案，例如
MPEG 2/4 AAC (MPEG=Moving Pictures Expert Group,運動圖像專家組；AAC=Advanced Audio Coding,高級音頻編碼)，參見Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding, International Standard 13818-7, ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group, 1997，可以使用濾波器組，例如修正離散余弦變換(Modified Discrete Cosine Transform, MDCT)，以便在頻域中表示音頻信號。
在頻域中，可以依據(jù)感知模型來進行頻率系數(shù)的量化。對于一般類型的音頻信號(例如音樂)，這樣的編碼器可以提供優(yōu)越的感知音頻質(zhì)量。另一方面，現(xiàn)代的語音編碼器，例如ACELP (ACELP=Algebraic Code Excited Linear Prediction,代數(shù)碼激發(fā)線性預測)，使用一種預測的方式，并且利用此種方式可以在時域中表示音頻/語音信號。這樣的語音編碼器可以對人類語音產(chǎn)生過程(即，人類聲道)的特征進行建模，從而以較低的比特率即可達到優(yōu)越的語音信號性能。反之，對于以低比特率編碼的語音，感知音頻編碼器無法達到語音編碼器所提供的性能水平，并且使用語音編碼器來表示一般的音頻信號/音樂會造成顯著的質(zhì)量減損。
7傳統(tǒng)的構(gòu)思提供一種分層組合，在所述分層組合中所有的局部編碼器始終是活動的(即，時域和頻域編碼器)，通過將這些局部編碼器對于一個給定的處理過的時間幀所作的貢獻相組合，計算出最終的輸
出信號。分層編碼的一般示例是MPEG-4可縮放語音/音頻編碼，具有作為基本層的語音編碼器以及基于濾波器組的增強層，參見Bemhard Grill， Karlheinz Brandenburg, "A Two-or Three Stage Bit-Rate Scalable Audio Coding System,", Preprint Number 4132， 99th Convention of the AES (1995年9月)。
傳統(tǒng)的頻域編碼器可以利用MDCT濾波器組。因為MDCT優(yōu)秀的
性質(zhì)，其已經(jīng)成為用于傳統(tǒng)感知音頻編碼器的最具優(yōu)勢的濾波器組。舉例而言，MDCT可以在處理塊之間提供平滑的交叉衰落(crossfade)。
例如，即使由于譜系數(shù)的量化使得在每一個處理塊中的信號皆以不同的方式改變，然而因為加窗的重疊/加法(windowed overlap/add )操作，所以不會產(chǎn)生因為從一個塊到另一個塊的突然轉(zhuǎn)變而造成的分塊偽跡 (blocking artifact)。 MDCT使用時域混迭消除(time-domain aliasing cancellation, TDAC)的構(gòu)思。
MDCT是一種以IV型離散余弦變換為基礎的傅立葉相關變換，具有重迭的附加性質(zhì)。MDCT被設計為用于在較大數(shù)據(jù)集合的連續(xù)塊中執(zhí)行，其中隨后的塊互相重疊，使得一個塊的后半部與下一個塊的前半部重合。除了DCT的能量壓縮(energy-compaction)質(zhì)量之外，這種重疊使得MDCT對于信號壓縮應用是特別有吸引力的，因為這種重疊有助于避免源于塊邊界的所述偽跡。作為重迭變換(lapped transform), MDCT與其它傅立葉相關的變換相比的些許不同之處在于，MDCT的輸出的數(shù)目僅有輸入的數(shù)目的一半，而非與輸入的數(shù)目相同。具體地，將2N個實數(shù)轉(zhuǎn)換成N個實數(shù)，其中N是正整數(shù)。
逆MDCT也稱為IMDCT。因為輸入與輸出的數(shù)目不相同，在乍看之下MDCT似乎是不可逆的。然而，通過將隨后重疊塊的重疊IMDCT 相加，實現(xiàn)了完美的可逆性，這使得消除誤差并恢復原始數(shù)據(jù)(即，實現(xiàn)TDAC)。
于是，濾波器組輸出處譜值的數(shù)目等于該濾波器組輸入處時域輸入值的數(shù)目，這也稱作臨界采樣(critical sampling)。
MDCT濾波器組提供了高頻率選擇性，并且能夠得到高編碼增益。通過使用時域混迭消除技術(shù)，可以實現(xiàn)塊和臨界采樣的重疊性質(zhì)，參見J. Princen， A. Bradley, "Analysis/Synthesis Filter Band Design Based on Time Domain Aliasing Cancellation,", IEEE Trans. ASSP, ASSP-34(5): 1153-1161, 1986。圖4說明了MDCT的這些效應。圖4示出了MDCT輸入信號，以沿著上面的時間軸400的脈沖來表示。然后利用兩個連續(xù)的加窗和MDCT塊對輸入信號400進行轉(zhuǎn)換，其中在圖4中輸入信號400 的下方示出了窗410。在圖4中以時間線420和425顯示了經(jīng)過后向變換之后獨立的、加窗的信號。
在逆MDCT之后，第一塊產(chǎn)生具有正號的混迭分量420，第二塊產(chǎn) 生具有相同大小并且具有負號的混迭分量425。如在圖4的底部的最終輸出430處所顯示的，在兩個輸出信號420與425相加之后這兩個混迭分量互相抵消。
在"擴展適應性多速率寬帶(AMR-WB+)編解碼器"，3GPP TS 26.290V6.3.0 ， 2005-06技術(shù)規(guī)范中，詳細說明了 AMR-WB+ (AMR-WB=Adaptive Multi-Rate Wideband，適應性多速率寬帶)編解碼器。依據(jù)第5.2節(jié)，AMR-WB+編解碼器核心的編碼算法基于混合 ACELP/TCX (TCX=Transform Coded Excitation,變換編碼激發(fā))模型。對于輸入信號的每一個塊，編碼器可以在開回路或者閉回路模式下決定哪一種編碼模式，艮卩，ACELP或者TCX，是最佳的。ACELP是時域預測編碼器，最適于語音和瞬態(tài)信號。AMR-WB編碼器用于ACELP 模式中。備選地，TCX模型是基于變換的編碼器，并且更適于典型的音樂采樣。
具體地，AMR-WB+針對變換編碼模式TCX使用離散傅立葉變換 (DFT)。為了允許相鄰塊之間的平滑轉(zhuǎn)變，使用加窗和重疊。這種加窗和重疊對于不同的編碼模式(TCX/ACELP)之間的轉(zhuǎn)變以及對于連續(xù)的TCX幀之間的轉(zhuǎn)變而言都是必要的。因此，DFT與加窗和重疊一起表示并未經(jīng)過臨界采樣的濾波器組。濾波器組產(chǎn)生比新的輸入采樣的數(shù)目更多的頻率值，參見在3GPP TS 26.290V6.3.0 (3GPP=ThirdGeneration Partnership Project ，第三代伙伴計戈!j ， TS=Technical Specification,技術(shù)規(guī)范)中的圖4。每一個TCX幀使用1/8幀長度的重疊，所述幀長度系等于新的輸入采樣的數(shù)目。因此，該DFT的對應長度是9/8幀長度。
考慮在TCX中非臨界采樣的DFT濾波器組，S卩，在濾波器組輸出處譜值的數(shù)目大于在該濾波器組輸入處時域輸入值的數(shù)目，這種頻域編碼模式與諸如AAC (AAC=Advanced Audio Coding,高級音頻編碼) 等使用MDCT (臨界采樣的重迭變換)的音頻編解碼器不同。
在Fielder, Louis D.; Todd, Craig C., "The Design of a Video Friendly Audio Coding System for Distributing Applications,", Paper Number 17-008， The AES 17th International Conference: High-Qqality Audio Coding (1999年8月)，以及Fielder, Louis D.; Davidson, Grant A.， "Audio Coding Tools for Digital Television Distribution,", Preprint Number 5104, 108th Convention of the AES (2000年1月)中，描述了杜比E (Dolby E)編解碼器。杜比E編解碼器使用MDCT濾波器組。在這種編碼的設計中，特別關注在編碼域中直接執(zhí)行編輯的可能性。為了達成這個目標，使用特殊的無混迭窗。在這些窗的邊界，不同信號部分的平滑交叉衰落或接合是可能的。在前文中所參考的文件中概括出，例如參見"The Design of a Video Friendly Audio Coding System for Distribution Applications，"第三節(jié)，僅簡單地使用會引入時域混迭的一般MDCT窗是不可能實現(xiàn)這一點的。然而，其中也指出，為了消除混迭，所需要的代價是變換系數(shù)的數(shù)目增加，這個結(jié)果指出所得到的濾波器組將不再具有臨界采樣的性質(zhì)。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種更高效的編碼和解碼數(shù)據(jù)段的構(gòu)思。利用根據(jù)權(quán)利要求l所述的用于解碼的設備、根據(jù)權(quán)利要求22所述的用于解碼的方法、根據(jù)權(quán)利要求24所述的用于產(chǎn)生已編碼數(shù)據(jù)流的設備、以及根據(jù)權(quán)利要求35所述的用于產(chǎn)生已編碼數(shù)據(jù)流的方法，實現(xiàn)了這一目的。本發(fā)明基于以下成果通過使用時域和頻域編碼器的組合，以及相應地時域和頻域解碼器的組合，可以實現(xiàn)更高效的編碼和解碼。通過在解碼器中將時域數(shù)據(jù)轉(zhuǎn)換至頻域，以及通過將得到的轉(zhuǎn)換后的頻域數(shù)據(jù)與接收到的已經(jīng)解碼頻域數(shù)據(jù)相組合，可以以有效地對抗時間混迭問題。通過使施加到數(shù)據(jù)段的重疊窗的重疊區(qū)域適于編碼領域的變化，可以減少開銷。當使用時域編碼時，以及相應地從時域編碼切換或者切換至時域編碼時，采用具有較小重疊區(qū)域的窗可以是有利的。
本發(fā)明的實施例可以提供一種通用的音頻編碼和解碼構(gòu)思，對于例如語音信號和音樂信號這兩種類型的輸入信號可以實現(xiàn)更高的性能。實施例可以很好地利用將多種編碼方式(如，時域和頻域編碼構(gòu) 思)相組合的優(yōu)點。實施例可以有效地將基于濾波器組的和基于時域為的編碼構(gòu)思組合成單個方案。實施例可以得到一種組合的編解碼器，可以例如在用于音樂類音頻內(nèi)容的音頻編解碼器與用于語音類內(nèi)容的語音編解碼器之間進行切換，實施例可以頻繁地使用這種切換機制，特別是對于混合的內(nèi)容。
本發(fā)明的實施例可以提供不出現(xiàn)切換偽跡的優(yōu)點。在實施例中，對于切換過程，可以使附加傳輸數(shù)據(jù)或者附加編碼采樣的量最小化，以避免在該操作階段降低效率。由此，局部編碼器的切換式組合的構(gòu) 思與所有局部編碼器始終是活動的分層組合是不同的。

圖la示出了用于解碼的設備的實施例；
圖lb示出了用于解碼的設備的另一實施例；
圖lc示出了用于解碼的設備的另一實施例；
圖ld示出了用于解碼的設備的另一實施例；
圖le示出了用于解碼的設備的另一實施例；
圖lf示出了用于解碼的設備的另一實施例；圖2a示出了用于編碼的設備的實施例；圖2b示出了用于編碼的設備的另一實施例；圖2c示出了用于編碼的設備的另一實施例；圖3a說明了在一個窗的持續(xù)時間內(nèi)在頻域和時域編碼之間進行切換時的重疊區(qū)域；
圖3b說明了在兩個窗的持續(xù)時間內(nèi)在頻域編碼和時域編碼之間
進行切換時的重疊區(qū)域；
圖3c說明了具有不同的重疊區(qū)域的多個窗；圖3d說明了在實施例中對具有不同重疊區(qū)域的窗的使用；以及圖4示出了使用MDCT時的時域混迭消除。
具體實施例方式
在下文中將參考附圖來詳細描述本發(fā)明的實施例。圖la示出了用于對表示時域數(shù)據(jù)流的數(shù)據(jù)段進行解碼的設備 100，數(shù)據(jù)段是在時域中或者在頻域中編碼的，在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時域數(shù)據(jù)采樣塊的連續(xù)數(shù)據(jù)塊。例如，所述數(shù) 據(jù)流可以與音頻流相對應，其中這些數(shù)據(jù)塊當中的一些數(shù)據(jù)塊在時域中編碼，而其他數(shù)據(jù)塊在頻域中編碼。在頻域中編碼的數(shù)據(jù)塊或者數(shù) 據(jù)段可以表示重疊數(shù)據(jù)塊的時域數(shù)據(jù)采樣。
設備100包括時域解碼器110，用于對在時域中編碼的數(shù)據(jù)段進行解碼。此外，設備100包括處理器120，用于處理在頻域中編碼的數(shù)據(jù) 段以及時域解碼器110的輸出數(shù)據(jù)，以獲得重疊的時域數(shù)據(jù)塊。此外，設備100包括重疊/加法組合器130，用于將重疊的時域數(shù)據(jù)塊相組合，
以獲者時域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
圖lb示出了設備100的另一個實施例。在實施例中，處理器120可以包括頻域解碼器122，用于對在頻域中編碼的數(shù)據(jù)段進行解碼，以獲得頻域數(shù)據(jù)段。此外，在實施例中，處理器120可以包括時域至頻域轉(zhuǎn) 換器124，用于對時域解碼器110的輸出數(shù)據(jù)進行轉(zhuǎn)換，以獲得轉(zhuǎn)換后的頻域數(shù)據(jù)段。
此外，在實施例中，處理器120可以包括頻域組合器126，用于將頻域段以及轉(zhuǎn)換后的頻域數(shù)據(jù)段相組合，以獲得頻域數(shù)據(jù)流。處理器 120還可以包括頻域至時域轉(zhuǎn)換器128，用于將頻域數(shù)據(jù)流轉(zhuǎn)換成重疊的時域數(shù)據(jù)塊，然后可以由重疊/加法組合器130來組合這些重疊的時
12實施例可以在不作任何修改的情況下，尤其是在不放棄任何臨界
采樣性質(zhì)的情況下，使用MDCT濾波器組，如同例如在MPEG-4 AAC 中所使用的。實施例可以提供最佳的編碼效率。實施例可以實現(xiàn)平滑的轉(zhuǎn)變，轉(zhuǎn)變至與已建立的MDCT窗兼容的時域編解碼器，同時并不引入額外的切換偽跡并且僅帶來最小的開銷。
實施例可以在濾波器組中保持時域混迭，并且刻意地將對應的時域混迭引入由時域編解碼器編碼的信號部分中。因此，所得到的時域混迭分量可以互相抵消，所采用的方式與它們針對MDCT譜的兩個連
續(xù)幀所采用的方式相同。
圖lc說明了設備100的另一實施例，依據(jù)圖lc，頻域解碼器122可以包括重新量化級122a。此外，時域至頻域轉(zhuǎn)換器124可以包括余弦調(diào) 制濾波器組(cosine modulated filterbank)、擴展重迭變換(extended lapped transform).低延遲濾波器組或者多相濾波器組。圖lc所示的實施例說明時域至頻域轉(zhuǎn)換器124可以包括MDCT 124a。
此外，圖lc描述了頻域組合器126可以包括加法器126a。如圖lc 所示，頻域至時域轉(zhuǎn)換器128可以分別包括余弦調(diào)制濾波器組以及逆 MDCT 128a。可以利用編碼器來產(chǎn)生包括時域編碼和頻域編碼的數(shù)據(jù) 段在內(nèi)的數(shù)據(jù)流，該編碼器將在下文中更詳細地描述。通過利用頻域編碼器對輸入信號的一些部分進行編碼，以及利用時域編碼器對一些輸入信號的部分進行編碼，可以實現(xiàn)在頻域編碼與時域編碼之間的切換。圖lc所示的設備100的實施例說明了對應的用于解碼的設備100的
原理結(jié)構(gòu)。在其它的實施例中，重新量化122a以及逆修正離散余弦變換128a可以代表頻域解碼器。
如圖lc所示，對于由時域解碼器110所接管的信號部分，可以利用前向MDCT 124a對時域解碼器110的時域輸出進行變換。時域解碼器可以利用預測濾波器對時域編碼的數(shù)據(jù)進行解碼。此處，在MDCT 124a的輸入會引入一些重疊，且從而會引入一些開銷。在下文中，將描述可以減小或者最小化這種開銷的一些實施例。
理論上，圖lc中所示的實施例還包括操作模式，在所述操作模式
13下兩個編解碼器可以并行地操作。在實施例中，處理器120可以適于處
理在時域以及在頻域中并行編碼的數(shù)據(jù)段。以此方式，信號可以部分在頻域中編碼，部分在時域中編碼，類似于分層編碼方式。所得到的
信號之后在頻域中加在一起，比較頻域組合器126a。然而，實施例可以執(zhí)行專門在兩個編解碼器之間進行切換的操作模式，并且優(yōu)選地僅具有最小數(shù)目的采樣，其中這兩個編解碼器都是活動的，以獲得最佳的可能效率。
在圖lc中，時域解碼器110的輸出由MDCT 124a來轉(zhuǎn)換，接著再由IMDCT128a來轉(zhuǎn)換。在另一個實施例中，這兩個步驟可以有利地組合成單個步驟，以降低復雜度。圖ld說明了設備100的一個實施例，以說明此種方法。圖ld所示的設備100說明處理器120可以包括計算器 129，用于依據(jù)時域解碼器110的輸出數(shù)據(jù)計算重疊的時域數(shù)據(jù)塊。處理器120或者計算器129可以適于依據(jù)時域解碼器110的輸出數(shù)據(jù)，再現(xiàn) 頻域至時域轉(zhuǎn)換器128的性質(zhì)以及相應地重疊性質(zhì)，即，處理器120或者計算器129可以再現(xiàn)時域數(shù)據(jù)塊的重疊特性，該重疊特性類似于由頻域至時域轉(zhuǎn)換器128所產(chǎn)生的的重疊特性。此外，處理器120或者計算器129可以適于依據(jù)時域解碼器110的輸出數(shù)據(jù)再現(xiàn)時域混迭，該時域混迭類似于由頻域至時域轉(zhuǎn)換器128所引入的時域混迭。
之后，頻域至時域轉(zhuǎn)換器128可以適于將頻域解碼器122所提供的頻域數(shù)據(jù)段轉(zhuǎn)換成重疊的時域數(shù)據(jù)塊。重疊/加法組合器130可以適于組合由頻域至時域轉(zhuǎn)換器128以及計算器129所提供的數(shù)據(jù)塊，以獲得
時域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
如在圖le的實施例中所說明的，計算器129可以包括時域混迭級
129a。時域混迭級129a可以適于對時域解碼器的輸出數(shù)據(jù)進行時間混迭，以獲得重疊的時域數(shù)據(jù)塊。
對于時域編碼數(shù)據(jù)，MDCT和IMDCT的組合可以使實施例中的過程在結(jié)構(gòu)以及計算復雜度方面都更為簡化，因為在這些實施例中僅剩下時域混迭(time-domain aliasing, TDA)過程。這個高效的過程可以基于許多觀察。對2N個采樣的輸入段進行加窗的(windowed)MDCT
可以分成三個步驟。第一，將輸入信號乘以分析窗。
第二，然后將得到的結(jié)果從2N個采樣折迭(fold down)成N個采樣。對于MDCT，該過程意味著將采樣的時間反轉(zhuǎn)順序的第一個四分之一與釆樣的第二個四分之一組合(即，后者減去前者)，以及將采樣的第四個四分之一與采樣的時間反轉(zhuǎn)順序的第三個四分之一組合(即，相加)。在信號的修改過的第二和第三個四分之一中，所得到的結(jié)果是經(jīng)過時間混迭的、下采樣后的信號，包括N個采樣。
第三，然后使用正交DCT式變換對下采樣后的信號進行轉(zhuǎn)換，其中所述正交DCT式變換將N個輸入映射到N個輸出采樣，以形成最終的 MDCT輸出。
對N個譜釆樣的輸入序列進行加窗的IMDCT重建同樣也可以分成三個步驟。
第一，使用正交逆DCT式變換對N個譜采樣的輸入序列進行轉(zhuǎn)換，所述正交逆DCT式變換將N個輸入映射到N個輸出采樣。
第二，將得到的結(jié)果從N個采樣展開成2N個采樣，這是通過以下方式來實現(xiàn)的將逆DCT變換后的值寫入2N個采樣輸出緩沖區(qū)的第二和第三個四分之一，并且分別以第二個四分之一的時間反轉(zhuǎn)且反相后的版本填充第一個四分之一，以及以第三個四分之一的時間反轉(zhuǎn)的版本填充第四個四分之一。
第三，將得到的2N個采樣乘以合成窗，以形成加窗的IMDCT輸
出。 .
因此，在實施例中，利用由加窗的MDCT的第一和第二步驟，以及加窗的IMDCT的第二和第三步驟所構(gòu)成的序列，可以高效地執(zhí)行加窗的MDCT與加窗的IMDCT的級聯(lián)(concatenation^在實施例中可以完全省略的MDCT的第三步驟以及IMDCT的第一步驟，因為它們是相對于彼此逆運算且從而互相抵銷。其余的步驟可以僅在時域中執(zhí)行，因此使用此種方式的實施例在計算復雜度上可以實質(zhì)上很低。
對于由MDCT以及相繼的IMDCT組成的一個塊，MDCT的第二和第三步驟以及IMDCT的第二和第三步驟可以寫成與下列的稀疏 2Nx2N矩陣相乘。1 一l o ...... 0
一l 1 o ...... 0
0 ...... 0 1 1
o ...... 0 1 1
換句話說，計算器129可以適于將時域解碼器110的輸出分割成包括2N個連續(xù)采樣的計算器區(qū)段(calculator segment),依據(jù)分析窗函數(shù) 對這2N個采樣施加權(quán)重，從第二N/2個采樣中減去反轉(zhuǎn)順序的第一N/2 個采樣，將反轉(zhuǎn)順序的最后N/2個采樣加至第三N/2個采樣中，使第二和第三N/2個采樣反相，以第二N/2個采樣的時間反轉(zhuǎn)且反相后的版本取代第一N/2個采樣，以第三N/2個采樣的時間反轉(zhuǎn)的版本取代第四N/2 個采樣，以及依據(jù)合成窗函數(shù)對2N個采樣施加權(quán)重。
在其它的實施例中，重疊/加法組合器130可以適于依據(jù)合成窗函數(shù)，對頻域至時域轉(zhuǎn)換器128所提供的重疊時域數(shù)據(jù)塊施加權(quán)重。此外，重疊/加法組合器130可以適于依據(jù)以下合成窗函數(shù)來施加權(quán)重該合
成窗函數(shù)與連續(xù)重疊時域數(shù)據(jù)塊的重疊區(qū)域的大小相適應。
計算器129可以適于依據(jù)分析窗函數(shù)對2N個采樣施加權(quán)重，該分
析窗函數(shù)與連續(xù)重疊時域數(shù)據(jù)塊的重疊區(qū)域的大小相適應，該計算器還可以適于依據(jù)合成窗函數(shù)對2N個采樣施加權(quán)重，該合成窗函數(shù)與重
疊區(qū)域的大小相適應。
在實施例中，在頻域中編碼的兩個連續(xù)時域數(shù)據(jù)塊的重疊區(qū)域的大小，可以大于一個塊在頻域中編碼而另一個塊在時域中編碼的兩個連續(xù)時域數(shù)據(jù)塊的重疊區(qū)域的大小。
在實施例中，數(shù)據(jù)塊的大小可以與重疊區(qū)域的大小相適應。在實施例中，可以高效實現(xiàn)組合的MDCT/IMDCT過程，即，包括分析加窗、折迭與展開、以及合成加窗在內(nèi)的塊TDA。此外，在實施例中，可以
在實際實現(xiàn)中將這些步驟當中的一些步驟部分地或者完全地相組合。如圖lf所示的設備100的另一個實施例說明了，設備100可以進一步包括針對處理器120和重疊/加法組合器130的旁路140，旁路140適于在時域中編碼的數(shù)據(jù)段中沒有出現(xiàn)重疊的連續(xù)時域數(shù)據(jù)塊時，繞過處理器120和重疊/加法組合器130。如果多個數(shù)據(jù)段是在時域中編碼的，即并不需要轉(zhuǎn)換至頻域以解碼連續(xù)的數(shù)據(jù)段，則可以在沒有任何重疊的情況之下傳輸這些數(shù)據(jù)段。對于這些情況，圖lf中所示的實施例可以繞過處理器120和重疊/加法組合器130。在實施例中，可以依據(jù)AAC
規(guī)范來確定塊的重疊。
圖2a示出了設備200的實施例，設備200用于依據(jù)時域數(shù)據(jù)流來產(chǎn)
生己編碼的數(shù)據(jù)流，該時域數(shù)據(jù)流具有信號采樣。該時域數(shù)據(jù)流可以例如對應于音頻信號，所述音頻信號包括語音片段以及音樂片段或者同時包括這兩者。設備200包括區(qū)段處理器210，用于從數(shù)據(jù)流提供數(shù) 據(jù)段，兩個連續(xù)的數(shù)據(jù)段具有第一或者第二重疊區(qū)域，第二重疊區(qū)域小于第一重疊區(qū)域。設備200還包括時域編碼器220，用于編碼在時域中的數(shù)據(jù)段；以及頻域編碼器230，用于依據(jù)第一或者第二窗函數(shù)對時域數(shù)據(jù)流的采樣施加權(quán)重以獲得加窗的數(shù)據(jù)段，以及用于在頻域中對加窗的窗數(shù)據(jù)段進行編碼，其中所述第一和第二窗函數(shù)適于第一和第二重疊區(qū)域。
此外，設備200包括時域數(shù)據(jù)分析器240，用于確定與數(shù)據(jù)段相關聯(lián)的傳輸指示；以及控制器250，用于控制該設備，使得對于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將時域編碼器220的輸出數(shù)據(jù)包含于已編碼的數(shù) 據(jù)流中，對于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段，將頻域編碼器230的輸出數(shù) 據(jù)包含于已編碼的數(shù)據(jù)流中。
在實施例中，時域數(shù)據(jù)分析器240可以適于從時域數(shù)據(jù)流中，或者從區(qū)段處理器210所提供的數(shù)據(jù)段中，確定轉(zhuǎn)變指示。在圖2b中示出了這些實施例。在圖2b中說明，時域數(shù)據(jù)分析器240可以耦合至區(qū)段處理器210的輸入，以從時域數(shù)據(jù)流中確定轉(zhuǎn)變指示。在另一實施例中，時域數(shù)據(jù)分析器240可以耦合至區(qū)段處理器210的輸出，以從數(shù)據(jù)段中確定轉(zhuǎn)變指示。在實施例中，時域數(shù)據(jù)分析器240可以直接耦合至區(qū)段處理器210，以從該區(qū)段處理器直接地提供的數(shù)據(jù)中確定轉(zhuǎn)變指示。這些實施例在圖2b中以虛線表示。
17在實施例中，時域數(shù)據(jù)分析器240可以適于確定轉(zhuǎn)變度量 (transition measure),所述轉(zhuǎn)變度量基于在時域數(shù)據(jù)流或者數(shù)據(jù)段中的瞬時性(transience)的水平，其中轉(zhuǎn)變指示器可以指示瞬時性的水平是否超過預定的閾值。
圖2c示出了設備200的另一個實施例。在圖2c所示的實施例中，區(qū) 段處理器210可以適于提供具有第一和第二重疊區(qū)域的數(shù)據(jù)段，時域編碼器220可以適于對所有數(shù)據(jù)段進行編碼，頻域編碼器230可以適于對所有加窗的數(shù)據(jù)段進行編碼，以及控制器250可以適于控制時域編碼器 220以及頻域編碼器220以及該頻域編碼器230，使得對于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將時域編碼器220的輸出數(shù)據(jù)包含于已編碼的數(shù)據(jù)流中，以及對于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段，將頻域編碼器230的輸出數(shù) 據(jù)包含于已編碼的數(shù)據(jù)流中。在其它的實施例中，可以將時域編碼器 220和頻域編碼器230兩者的輸出數(shù)據(jù)都包含于己編碼的數(shù)據(jù)流中。轉(zhuǎn) 變指示器可以指示，數(shù)據(jù)段是與語音信號還是與音樂信號相關聯(lián)或有關。在實施例中，頻域編碼器230可以用于更類似于音樂的數(shù)據(jù)段，時域編碼器220可以用于更類似于語音的數(shù)據(jù)段。在實施例中，可以使用并行編碼，例如對于具有背景音樂的類似語音的音頻信號。
在圖2c所示的實施例中，對于控制器250控制設備200內(nèi)的多個組件，可以想到多種可能性。在圖2c中以虛線來表示不同的可能性。舉例而言，控制器250可以耦合至時域編碼器220和頻域編碼器230，以選
擇哪個編碼器應該依據(jù)該轉(zhuǎn)變指示來產(chǎn)生己編碼的輸出。在另一實施例中，控制器250可以對時域編碼器220和頻域編碼器230的輸出處的開
關加以控制。
在這樣的實施例中，時域編碼器220和頻域編碼器230皆可以對所有數(shù)據(jù)段進行編碼，控制器250可以適于依據(jù)編碼效率以及相應地 (respectively)轉(zhuǎn)變指示-，經(jīng)由所述耦合至編碼器輸出的幵關來選擇
應當將哪個已編碼的數(shù)據(jù)段包含于已編碼的數(shù)據(jù)流中。在其它的實施例中，控制器250可以適于控制區(qū)段處理器210向時域編碼器220或者頻域編碼器230提供數(shù)據(jù)段。控制器250也可以控制區(qū)段處理器210，以為數(shù)據(jù)段設置重疊區(qū)域。在其它的實施例中，控制器250還可以適于控制
18在區(qū)段處理器210與時域編碼器220之間，以及相應地與頻域編碼器230 之間的開關?？刂破?50接著可以影響該開關，以將數(shù)據(jù)段傳遞至這兩個解碼器之一，以及相應地傳遞至兩者。控制器250還可以適于設置針對頻域編碼器230的加窗函數(shù)以及重疊區(qū)域和編碼策略。
此外，在實施例中，頻域編碼器230可以適于依據(jù)AAC規(guī)范來施加窗函數(shù)的權(quán)重。頻域編碼器230可以適于將加窗的數(shù)據(jù)段轉(zhuǎn)換至頻域，以獲得頻域數(shù)據(jù)段。此外，頻域編碼器230可以適于對頻域數(shù)據(jù)段進行量化，頻域編碼器230還可以適于依據(jù)感知模型來評估頻域數(shù)據(jù) 段。
頻域編碼器230可以適于使用余弦調(diào)制濾波器組、擴展重迭變換、低延遲濾波器組或者多相濾波器組來獲得頻域數(shù)據(jù)段。
頻域編碼器230可以適于使用MDCT來獲得頻域數(shù)據(jù)段。時域編碼器220可以適于使用預測模型來編碼數(shù)據(jù)段。
在實施例中，頻域編碼器230中的MDCT操作于所謂的長塊模式下，即，用于編碼非瞬時輸入信號的常規(guī)操作模式，對照AAC規(guī)范，切換過程所引入的開銷可能很高。這對于以下情況也成立只有一個幀(即，N個釆樣的長度/幀速率(framing rate))應當使用時域編碼器 220而非頻域編碼器230來編碼。
然后可能必須利用時域編碼器220對MDCT的所有輸入值進行編碼，即，在頻域解碼器110的輸出處2N個采樣是可用的。因此會引入N 個附加采樣的開銷。圖3a至3d圖說明了一些可以想到的區(qū)段重疊區(qū)域，以及相應地可應用的加窗函數(shù)。可能必須利用時域編碼器220對2N個采樣進行編碼，以取代一塊(one block of)頻域編碼數(shù)據(jù)。圖3a示出了示例，其中使用實線來表示頻域編碼的數(shù)據(jù)塊，使用虛線來表示時域編碼的數(shù)據(jù)。在加窗函數(shù)下面描述了可以在頻域中編碼(實線方塊) 或者在時域中編碼(虛線方塊)的數(shù)據(jù)段。在圖3b至圖3d中也將參考這種表示。
圖3a示出了以下情況在這種情況下，在頻域中編碼數(shù)據(jù)，所述數(shù)據(jù)被在時域中編碼的一個數(shù)據(jù)段所中斷，并且在其之后的數(shù)據(jù)段再次地在頻域中編碼。為了提供對于消除由頻域編碼器230所引起的時域混迭所需要的時域數(shù)據(jù)，在從頻域切換至時域時需要重疊的區(qū)段大小
的一半，這對于從時域切換回頻域時也同樣成立。假設短3a中時域編碼數(shù)據(jù)段的大小為2N，那么該時域編碼數(shù)據(jù)段在其開始和結(jié)尾處與頻域編碼數(shù)據(jù)有著N/2個采樣的重疊。
如果可以使用時域編碼器220對多于一個的后續(xù)幀進行編碼，則對于時域編碼部分的開銷維持在N個采樣。如圖3b所示，在時域中對兩個連續(xù)的幀進行編碼，并且在時域編碼部分的開始和結(jié)尾處的重疊區(qū)域具有與先前參考圖3a所解釋的相同的重疊。圖3b示出了在以時域編碼器220來編碼兩個幀的情況下的重疊結(jié)構(gòu)。在此情況中，必須利用時域編碼器220對3N個采樣進行編碼。
例如，在實施例中，可以依據(jù)在AAC中所使用的結(jié)構(gòu)通過使用窗切換來減小這種開銷。圖3c示出了如在AAC中所使用的，由長窗、開始窗、短窗以及停止窗所組成的序列。從圖3c可以看出，窗大小、數(shù) 據(jù)段大小、以及從而的重疊區(qū)域大小隨著不同的窗而不同。圖3c所示的序列是上述序列的示例。
實施例不應該局限于AAC窗大小的窗，然而，實施例可以利用具有不同重疊區(qū)域的窗以及不同持續(xù)時間的窗。在實施例中，可以使用減小的重疊來轉(zhuǎn)變至短窗或者從短窗轉(zhuǎn)變，例如在下述文獻中所公開的Bemd Edler， "Codierung von Audiosignalen mit iiberlappender Transformation und adaptiven Fensterfunktionen，，, Frequenz， Vol. 43， No. 9, p. 252-256, September 1989，以及Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding, International Standard 13818-7， ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group, 1997，這可以用在一些實施例中，以減小轉(zhuǎn)變至時域編碼區(qū)域或者從時域編碼區(qū)域轉(zhuǎn)變所需要的開銷，如在圖3d中所說明的。圖3d說明了四個數(shù)據(jù)段，其中前兩個以及最后一數(shù)據(jù)段是在頻域中編碼的，而第三個區(qū)段是在時域中編碼的。當從頻域切換至時域時，使用具有減小的重疊大小的不同窗，由此減小了開銷。
在實施例中，可以根據(jù)與AAC中所使用的完全相同的開始窗和停止窗來實現(xiàn)轉(zhuǎn)變。用于轉(zhuǎn)變至時域編碼區(qū)域或者從時域編碼區(qū)域轉(zhuǎn)變的、對應的窗是僅具有小區(qū)域重疊的窗。因此，開銷，即，由于切換過程而導致的要額外傳送的值的數(shù)目可以實質(zhì)上減少。
一般而言，對
于具有N。v,個采樣的窗重疊的每個轉(zhuǎn)變來說，開銷可以是N。v,/2。因此，如AAC—樣，N。v尸1024的常規(guī)完全重疊窗的轉(zhuǎn)變，對于左側(cè)(即，淡入窗)會帶來1024/2=512個釆樣的開銷，對于右側(cè)(即，該淡出窗) 會帶來1024/2=512個采樣的開銷，轉(zhuǎn)變所造成的總開銷是1024^N)個采樣。選擇減小的重疊窗，例如N。v產(chǎn)128的AAC短塊窗，僅會造成128 個采樣的總開銷。
實施例可以在頻域編碼器230中使用濾波器組，例如，廣為使用的MDCT濾波器組；然而，其它實施例也可以與基于其它余弦調(diào)制濾波器組的頻域編解碼器一起使用。這可以包括MDCT的衍生物 (derivates)，例如，擴展重迭變換、或者低延遲濾波器組以及例如在 MPEG-l-Layer-l/2/3音頻編解碼器中所使用的多相濾波器組。在實施例中，前向/后向濾波器組操作的高效實現(xiàn)可以考慮在濾波器組中使用的特定類型窗以及折迭/展開過程。對于每種類型的調(diào)制濾波器組，可以通過預處理步驟以及用于調(diào)制的塊變換(即，DCT式或者DFT)，來高效地實現(xiàn)分析級。在實施例中，可以使用對應的逆變換以及后處理步驟來實現(xiàn)對應的合成級。在實施例中，也可以針對時域編碼信號部分僅使用預處理和后處理步驟。
本發(fā)明的實施例所提供的優(yōu)點是，可以實現(xiàn)更佳的編碼效率，這是因為，可以在時域編碼器220和頻域編碼器230之間進行切換，這僅
帶來非常低的開銷。在實施例中，僅在后續(xù)時域編碼的信號部分中可以完全省略重疊。設備100的實施例使得可以對己編碼的數(shù)據(jù)流進行對
應的解碼。
由此實施例提供了以下優(yōu)點例如，可以針對音頻信號的相同質(zhì) 量實現(xiàn)較低的編碼速率，以及相應地可以以相同的編碼速率來實現(xiàn)較高的質(zhì)量，這是因為，各個編碼器可以適于音頻信號中的瞬時性。
依據(jù)本發(fā)明方法的特定實現(xiàn)需求，可以以硬件、軟件或者其組合來實現(xiàn)本發(fā)明的方法。可以使用數(shù)字儲存介質(zhì)來執(zhí)行所述實現(xiàn)，所述數(shù)字存儲介質(zhì)具體為盤、DVD或CD，其上存儲有電可讀控制信號，所述電可讀控制信號與可編程計算機系統(tǒng)協(xié)作以使本發(fā)明的方法可以執(zhí)行。因此，一般來說發(fā)明的實施例是在機器可讀載體上存儲有計算機程序代碼的計算機程序產(chǎn)品，所述程序代碼用于當所述計算機程序產(chǎn)品運行于計算機上時執(zhí)行本發(fā)明的方法。換句話說，發(fā)明方法的實施例因此是具有程序代碼的計算機程序，所述程序代碼用于當計算機程序碼運行于計算機上時執(zhí)行本發(fā)明的方法當中的至少一個方法。
參考列表
100用于解碼的設備
110時域解碼器
120處理器
122頻域解碼器
122a重新量化
124時域至頻域轉(zhuǎn)換器
124a修正離散余弦變換
126頻域組合器
126a加法器
128頻域至時域轉(zhuǎn)換器
128a逆修正離散余弦變換
129計算器
129a時域混迭級
130重疊/加法組合器
200用于編碼的設備
210區(qū)段處理器
220時域編碼器
230頻域編碼器
240時域數(shù)據(jù)分析器
250控制器
400修正離散余弦變換輸入 410窗420逆修正離散余弦變換輸出第一窗
425逆修正離散余弦變換輸出第二窗 430最終輸出
權(quán)利要求
1.一種用于對表示時域數(shù)據(jù)流的數(shù)據(jù)段進行解碼的設備，數(shù)據(jù)段是在時域中或者在頻域中編碼的，在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時域數(shù)據(jù)采樣塊的連續(xù)數(shù)據(jù)塊，該設備包括時域解碼器，用于對在時域中編碼的數(shù)據(jù)段進行解碼；處理器，用于對在頻域中編碼的數(shù)據(jù)段以及時域解碼器的輸出數(shù)據(jù)進行處理，以獲得重疊的時域數(shù)據(jù)塊；以及重疊/加法組合器，用于將重疊的時域數(shù)據(jù)塊相組合，以獲得時域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
2.根據(jù)權(quán)利要求l所述的設備，其中，所述處理器包括頻域解碼器，用于對在頻域中編碼的數(shù)據(jù)段進行解碼，以獲得頻域數(shù)據(jù)段。
3.根據(jù)權(quán)利要求l所述的設備，其中，所述處理器適于并行地處理在時域中以及在頻域中編碼的數(shù)據(jù)段。
4. 根據(jù)權(quán)利要求2所述的設備，其中，所述處理器包括時域至頻域轉(zhuǎn)換器，用于對時域解碼器的輸出數(shù)據(jù)進行轉(zhuǎn)換，以獲得轉(zhuǎn)換后的頻域數(shù)據(jù)段。
5. 根據(jù)權(quán)利要求4所述的設備，其中，所述處理器包括頻域組合器，用于將頻域數(shù)據(jù)段以及轉(zhuǎn)換后的頻域數(shù)據(jù)段相組合，以獲得頻域數(shù)據(jù)流。
6. 根據(jù)權(quán)利要求5所述的設備，其中，所述處理器包括頻域至時域轉(zhuǎn)換器，用于將頻域數(shù)據(jù)流轉(zhuǎn)換成重疊的時域數(shù)據(jù)塊。
7. 根據(jù)權(quán)利要求2所述的設備，其中，所述頻域解碼器還包括重新量化級。
8. 根據(jù)權(quán)利要求4所述的設備，其中，所述時域至頻域轉(zhuǎn)換器包括余弦調(diào)制濾波器組、擴展重迭變換、低延遲濾波器組、多相濾波器組或者修正離散余弦變換。
9. 根據(jù)權(quán)利要求5所述的設備，其中，所述頻域組合器包括加法器o
10. 根據(jù)權(quán)利要求6所述的設備，其中，所述頻域至時域轉(zhuǎn)換器包括余弦調(diào)制濾波器組或者逆修正離散余弦變換。
11. 根據(jù)權(quán)利要求l所述的設備，其中，所述時域解碼器適于使用預測濾波器對在時域中編碼的數(shù)據(jù)段進行解碼。
12. 根據(jù)權(quán)利要求l所述的設備，其中，所述處理器包括計算器，用于依據(jù)時域解碼器的輸出數(shù)據(jù)來計算重疊的時域數(shù)據(jù)塊。
13. 根據(jù)權(quán)利要求12所述的設備，其中，所述計算器適于依據(jù)時域解碼器的輸出數(shù)據(jù)來再現(xiàn)頻域至時域轉(zhuǎn)換器的重疊性質(zhì)。
14. 根據(jù)權(quán)利要求13所述的設備，其中，所述計算器適于依據(jù)時域解碼器的輸出數(shù)據(jù)來再現(xiàn)頻域至時域轉(zhuǎn)換器的時域混迭特性。
15. 根據(jù)權(quán)利要求6所述的設備，其中，所述頻域至時域轉(zhuǎn)換器適于將頻域解碼器所提供的頻域數(shù)據(jù)段轉(zhuǎn)換成重疊的時域數(shù)據(jù)塊。
16. 根據(jù)權(quán)利要求15所述的設備，其中，所述重疊/加法組合器適于將頻域至時域轉(zhuǎn)換器和計算器所提供的、重疊的時域數(shù)據(jù)塊相組合，以獲得時域數(shù)據(jù)流的己解碼數(shù)據(jù)段。
17. 根據(jù)權(quán)利要求8所述的設備，其中，所述計算器包括時域混迭級，用于對時域解碼器的輸出數(shù)據(jù)進行時間混迭，以獲得重疊的時域數(shù)據(jù)塊。
18. 根據(jù)權(quán)利要求12所述的設備，其中，所述計算器適于將時域解碼器的輸出分割成包括2N個連續(xù)采樣的計算器區(qū)段，依據(jù)分析窗函數(shù)對2N個采樣施加權(quán)重，從第二N/2個采樣中減去反轉(zhuǎn)順序的第一N/2個采樣，將反轉(zhuǎn)順序的最后N/2個采樣加到第三N/2個采樣中，使第二N/2個釆樣以及第三N/2個采樣反相，將第一N/2個采樣替換成第二N/2個采樣經(jīng)過時間反轉(zhuǎn)并且反相后的版本，將第四N/2個采樣替換成第三N/2個采樣的時間反轉(zhuǎn)版本，以及依據(jù)合成窗函數(shù)對2/N個采樣施加權(quán)重。
19. 根據(jù)權(quán)利要求6所述的設備，其中，所述重疊/加法組合器適于依據(jù)合成窗函數(shù)對頻域至時域轉(zhuǎn)換器所提供的重疊的時域數(shù)據(jù)塊施加權(quán)重。
20. 根據(jù)權(quán)利要求19所述的設備，其中，所述重疊/加法組合器適于依據(jù)合成窗函數(shù)來施加權(quán)重，所述合成窗函數(shù)與連續(xù)重疊時域數(shù)據(jù) 塊的重疊區(qū)域的大小相適應。
21. 根據(jù)權(quán)利要求20所述的設備，其中，所述計算器適于依據(jù)分析窗函數(shù)對2N個采樣施加權(quán)重，所述分析窗函數(shù)與連續(xù)重疊時域數(shù)據(jù) 塊的重疊區(qū)域的大小相適應，以及，其中所述計算器系可適于依據(jù)合成窗函數(shù)對2N個采樣施加權(quán)重，所述合成窗函數(shù)與重疊區(qū)域的大小相適應。
22. 根據(jù)權(quán)利要求l所述的設備，其中，在頻域中編碼的兩個連續(xù) 時域數(shù)據(jù)塊的重疊區(qū)域的大小大于一個數(shù)據(jù)塊在頻域中編碼并且另一個數(shù)據(jù)塊在時域中編碼的兩個連續(xù)時域數(shù)據(jù)塊的重疊區(qū)域的大小。
23. 根據(jù)權(quán)利要求l所述的設備，其中，數(shù)據(jù)塊的重疊區(qū)域是依據(jù) AAC規(guī)范來確定的。
24. 根據(jù)權(quán)利要求l所述的設備，還包括針對處理器和重疊/加法組合器的旁路，該旁路適于在時域中編碼的數(shù)據(jù)段中沒有出現(xiàn)重疊的連續(xù)時域數(shù)據(jù)塊時，繞過處理器和重疊/加法組合器。
25. —種對表示時域數(shù)據(jù)流的數(shù)據(jù)段進行解碼的方法，數(shù)據(jù)段是在時域中或者在頻域中編碼的，在頻域中編碼的數(shù)據(jù)段具有表示連續(xù) 且重疊的時域數(shù)據(jù)采樣塊的連續(xù)數(shù)據(jù)塊，該方法包括步驟對在時域中編碼的數(shù)據(jù)段進行解碼；對在頻域中編碼的數(shù)據(jù)段以及時域解碼器的輸出數(shù)據(jù)進行處理，以獲得重疊的時域數(shù)據(jù)塊；以及將重疊的時域數(shù)據(jù)塊相組合，以獲得時域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
26. —種具有程序代碼的計算機程序，所述程序代碼用于在運行于計算機上時執(zhí)行根據(jù)權(quán)利要求25所述的方法。
27. —種用于依據(jù)時域數(shù)據(jù)流來產(chǎn)生已編碼數(shù)據(jù)流的設備，所述時域數(shù)據(jù)流具有信號的采樣，該設備包括區(qū)段處理器，用于從數(shù)據(jù)流提供數(shù)據(jù)段，兩個連續(xù)的數(shù)據(jù)段具有第一重疊區(qū)域和第二重疊區(qū)域，第二重疊區(qū)域小于第一重疊區(qū)域；時域編碼器，用于在時域中對加窗的數(shù)據(jù)段進行編碼；頻域編碼器，用于依據(jù)第一加窗函數(shù)或者第二加窗函數(shù)對時域數(shù) 據(jù)流的采樣施加權(quán)重，以獲得加窗的數(shù)據(jù)段，所述第一加窗函數(shù)和第二加窗函數(shù)適于第一重疊區(qū)域和第二重疊區(qū)域，所述頻域編碼器適于在頻域中對加窗的數(shù)據(jù)段進行編碼；時域數(shù)據(jù)分析器，用于確定與數(shù)據(jù)段有關的轉(zhuǎn)變指示；以及控制器，用于控制該設備，使得對于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將時域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中，以及對于具有第二轉(zhuǎn)變指示的數(shù)據(jù)段，將頻域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中。
28. 根據(jù)權(quán)利要求27所述的設備，其中，所述時域數(shù)據(jù)分析器適于從時域數(shù)據(jù)流、數(shù)據(jù)段中或者從區(qū)段處理器直接提供的數(shù)據(jù)中，判確定轉(zhuǎn)變指示。
29. 根據(jù)權(quán)利要求27所述的設備，其中，所述時域數(shù)據(jù)分析器適于確定轉(zhuǎn)變度量，所述轉(zhuǎn)變度量基于在時域數(shù)據(jù)流或者數(shù)據(jù)段中的瞬時性的水平，以及，其中轉(zhuǎn)變指示器指示瞬時性的水平是否超過預定的閾值。
30. 根據(jù)權(quán)利要求27所述的設備，其中，所述區(qū)段處理器適于提供具有第一重疊區(qū)域和第二重疊區(qū)域的數(shù)據(jù)段，時域編碼器適于對數(shù)據(jù)段進行編碼，頻域編碼器適于對加窗的數(shù)據(jù)段進行編碼，以及控制器適于控制時域編碼器以及該頻域編碼器，使得對于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將時域編碼器的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中，以及對于具有第二轉(zhuǎn)變指示的、加窗的數(shù)據(jù)段，將頻域編碼器的輸出數(shù)據(jù)包含于己編碼數(shù)據(jù)流中。
31. 根據(jù)權(quán)利要求27所述的設備，其中，所述控制器適于控制區(qū)段處理器將數(shù)據(jù)段提供給時域編碼器或者頻域編碼器。
32. 根據(jù)權(quán)利要求27所述的設備，其中，所述頻域編碼器適于依據(jù)AAC規(guī)范來施加窗函數(shù)的權(quán)重。
33. 根據(jù)權(quán)利要求27所述的設備，其中，所述頻域編碼器適于將加窗的數(shù)據(jù)段轉(zhuǎn)換至頻域，以獲得頻域數(shù)據(jù)段。
34. 根據(jù)權(quán)利要求33所述的設備，其中，所述頻域編碼器適于對頻域數(shù)據(jù)段進行量化。
35. 根據(jù)權(quán)利要求34所述的設備，其中，所述頻域編碼器適于依據(jù)感知模型來評估頻域數(shù)據(jù)段。
36. 根據(jù)權(quán)利要求35所述的設備，其中，所述頻域編碼器適于使用余弦調(diào)制濾波器組、擴展重迭變換、低延遲濾波器組或者多相濾波器組來獲得頻域數(shù)據(jù)段。
37. 根據(jù)權(quán)利要求33所述的設備，其中，所述頻域編碼器適于使用修正離散余弦變換來獲得頻域數(shù)據(jù)段。
38. 根據(jù)權(quán)利要求27所述的設備，其中，所述時域編碼器適于使用預測濾波器，以對數(shù)據(jù)段進行編碼。
39. —種依據(jù)時域數(shù)據(jù)流來產(chǎn)生已編碼數(shù)據(jù)流的方法，所述時域數(shù)據(jù)流具有信號的采樣，該方法包括步驟從數(shù)據(jù)流提供數(shù)據(jù)段，兩個連續(xù)的數(shù)據(jù)段具有第一重疊區(qū)域和第二重疊區(qū)域，第二重疊區(qū)域小于第一重疊區(qū)域；確定與數(shù)據(jù)段相關聯(lián)的轉(zhuǎn)變指示；在時域中對數(shù)據(jù)段進行編碼，和/或依據(jù)第一加窗函數(shù)或者第二加窗函數(shù)對時域數(shù)據(jù)流的采樣施加權(quán)重以獲得加窗的數(shù)據(jù)段，以及在頻域中對加窗的數(shù)據(jù)段進行編碼，所述第一加窗函數(shù)和第二加窗函數(shù)適于第一重疊區(qū)域和第二重疊區(qū)域；以及控制，使得對于具有第一轉(zhuǎn)變指示的數(shù)據(jù)段，將在時域中編碼的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中，以及對于具有第二轉(zhuǎn)變指示的數(shù)據(jù) 段，將在頻域中編碼的輸出數(shù)據(jù)包含于已編碼數(shù)據(jù)流中。
40. —種具有種程序代碼的計算機程序，所述程序代碼用于在運行于計算機上時執(zhí)行根據(jù)權(quán)利要求39所述的方法。
全文摘要
一種用于對表示時域數(shù)據(jù)流的數(shù)據(jù)段進行解碼的設備，數(shù)據(jù)段是在時域中或者在頻域中編碼的，在頻域中編碼的數(shù)據(jù)段具有表示連續(xù)且重疊的時域數(shù)據(jù)采樣塊連續(xù)數(shù)據(jù)塊。設備包括時域解碼器，用于對在時域中編碼的數(shù)據(jù)段進行解碼；以及處理器，用于對在頻域中編碼的數(shù)據(jù)段以及時域解碼器的輸出數(shù)據(jù)進行處理，以獲得重疊的時域數(shù)據(jù)塊。該設備還包括重疊/加法組合器，用于將重疊的時域數(shù)據(jù)塊相組合，以獲得時域數(shù)據(jù)流的已解碼數(shù)據(jù)段。
文檔編號G10L19/02GK101589623SQ200780046188
公開日2009年11月25日申請日期2007年12月7日優(yōu)先權(quán)日2006年12月12日
發(fā)明者于爾根·赫勒, 尼古拉斯·里特爾博謝, 拉爾夫·蓋格爾, 斯特凡·蓋爾斯貝格, 橫谷義一, 馬克斯·諾伊恩多夫申請人:弗勞恩霍夫應用研究促進協(xié)會

完整全部詳細技術(shù)資料下載