專利名稱::音頻解碼的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及用于對音頻信號進(jìn)行解碼的系統(tǒng)、方法和技術(shù),該音頻信號諸如是通過通信聲道接收的或者從存儲設(shè)備讀取的數(shù)字音頻信號。
背景技術(shù):
:存在各種不同的用于對音頻信號進(jìn)行編碼然后解碼的技術(shù)。然而,不斷地希望其性能、質(zhì)量和效率能夠改進(jìn)。
發(fā)明內(nèi)容除了其它技術(shù),本發(fā)明通過提供解碼系統(tǒng)、方法和技術(shù)來解決此需求,其中,通過把碼本應(yīng)用到指定的量化標(biāo)號范圍(在某些情況下甚至跨越量化單元的邊界),并且通過基于比特流內(nèi)的窗信息來識別要在單個(gè)音頻數(shù)據(jù)幀中應(yīng)用的一序列不同的窗,來從比特流獲取音頻數(shù)據(jù)。因此,在一個(gè)典型實(shí)施例中,本發(fā)明涉及用于對基于幀的比特流中的音頻信號進(jìn)行解碼的系統(tǒng)、方法和技術(shù)。每個(gè)幀包括與該幀有關(guān)的處理信息以及表示該幀中音頻數(shù)據(jù)的熵編碼量化標(biāo)號。該處理信息包括(i)熵碼本標(biāo)號,(ii)用于指定碼本將要被應(yīng)用于的熵編碼量化標(biāo)號范圍的碼本應(yīng)用信息,以及(iii)窗信息。通過將所確定的碼本應(yīng)用于對應(yīng)的熵編碼量化標(biāo)號范圍,解碼熵編碼量化標(biāo)號。然后通過對所解碼的量化標(biāo)號進(jìn)行反量化,生成子帶采樣,并且基于窗信息,確定在單個(gè)音頻數(shù)據(jù)幀中所應(yīng)用了的一序列不同的窗函數(shù)。通過對子帶采樣進(jìn)行逆變換,并且使用由窗信息所指示的多個(gè)不同窗函數(shù),來獲得時(shí)域音頻數(shù)據(jù)。根據(jù)前述的配置,通常有可能獲得更高的效率,并且同時(shí)提供對原始音頻數(shù)據(jù)的更良好再現(xiàn)。前述的概述僅僅是為了提供本發(fā)明的特定方面的簡要描述。通過參考權(quán)利要求和以下關(guān)于優(yōu)選實(shí)施例的詳細(xì)描述,并結(jié)合附圖,可以獲得關(guān)于本發(fā)明的更完整的理解。圖1是根據(jù)本發(fā)明的典型實(shí)施例,示出了解碼器可能用到的各種示例性環(huán)境的框圖。圖2A-B根據(jù)本發(fā)明的典型實(shí)施例,分別示出了用單個(gè)長數(shù)據(jù)塊來覆蓋一個(gè)幀以及用多個(gè)短數(shù)據(jù)塊來覆蓋一個(gè)幀的用法。[10]圖3A-C示出了根據(jù)本發(fā)明的典型實(shí)施例的瞬變幀的不同的實(shí)例。[ll]圖4是根據(jù)本發(fā)明的典型實(shí)施例的音頻信號解碼系統(tǒng)10的框圖。具體實(shí)施方式[12]本發(fā)明涉及用于,例如在從存儲設(shè)備獲得了或者通過通信聲道接收了音頻信號后,對音頻信號進(jìn)行解碼的系統(tǒng)、方法和技術(shù)。可以使用本發(fā)明的應(yīng)用包括,但不限于數(shù)字音頻廣播、數(shù)字電視(衛(wèi)星、地面和/或有線廣播)、家庭影院、數(shù)字影院、鐳射視頻碟片播放器、英特網(wǎng)上的內(nèi)容流以及個(gè)人音頻播放器。例如,可以結(jié)合'364申請的方法和技術(shù),來使用本發(fā)明的音頻解碼系統(tǒng)、方法和技術(shù)。[13]圖1示出了可以使用根據(jù)本發(fā)明的解碼器100的某些示例性的通用環(huán)境。一般而言,根據(jù)本發(fā)明的解碼器ioo接收基于幀的比特流20作為輸入,并且,對于每個(gè)幀,該比特流20包括該幀中的實(shí)際音頻數(shù)據(jù)(典型地,熵編碼量化標(biāo)號)以及各種處理信息(例如,包括控制、格式化和/或輔助信息)。通常經(jīng)由硬線連接或者經(jīng)由可斷開的連接器,把比特流20輸入到解碼器100。[14]如上所示,比特流20可以源于各種不同源中的任意一個(gè)。該源包括例如,通過天線32接收的數(shù)字射頻(或其它電磁)傳輸,并將其在解調(diào)器34中轉(zhuǎn)換成比特流20;存儲設(shè)備36(例如半導(dǎo)體、磁或光存儲設(shè)備),通過讀卡器38從存儲設(shè)備36獲得比特流20;電纜連接42,解調(diào)器44從電纜連接42得到比特流20;直接提供比特流的電纜連接48。例如,可以用'346申請中所述的任何技術(shù)來生成了比特流20。如所示,在本發(fā)明的特定實(shí)施例中,比特流20本身可能得自其它信號,例如,復(fù)用比特流,如那些根據(jù)MPEG2系統(tǒng)協(xié)議復(fù)用的比特流,其中音頻比特流與各種格式的視頻比特流、其它格式的音頻比特流、以及元數(shù)據(jù)復(fù)用在一起;或者用表示音頻數(shù)據(jù)比特的冗余編碼的、交織的和/或收縮的符號來調(diào)制(使用任意已知的技術(shù))的接收射頻信號。[15]如'346申請中所詳述,在本發(fā)明的優(yōu)選實(shí)施例中,已經(jīng)把比特流20中的音頻數(shù)據(jù)變換成了子帶采樣(優(yōu)選使用統(tǒng)一的基于正弦的變換技術(shù)),進(jìn)行了量化并且隨后進(jìn)行了熵編碼。在優(yōu)選實(shí)施例中,使用改進(jìn)型離散余弦變換(MDCT)對音頻信號進(jìn)行了變換,并且對其進(jìn)行了量化,然后使用恰當(dāng)?shù)幕舴蚵幋a對其進(jìn)行了熵編碼。然而在可替換的實(shí)施例中,可以改為使用其它的變換和/霍熵編碼技術(shù),并且以下討論中所涉及的MDCT或霍夫曼應(yīng)理解為僅是示例性的。此處把音頻數(shù)據(jù)稱為脈沖編碼調(diào)制(PCM)采樣或音頻采樣,因?yàn)樽儞Q優(yōu)選是統(tǒng)一的,所以采樣數(shù)量在時(shí)域中和在變換域中是相同的。[16]同樣,盡管此處所述的音頻數(shù)據(jù)以及許多控制、格式和輔助信息都已被執(zhí)行霍夫曼編碼,但是應(yīng)該明白的是,這些編碼通常是選擇性的,并且優(yōu)選實(shí)施例中僅為了使用該編碼來減少數(shù)據(jù)大小。對于使用了霍夫曼編碼的情況,解碼器IO優(yōu)選存儲與編碼器所使用的碼本相同的碼本。"60申請中描述了優(yōu)選的霍夫曼碼本,其中"碼"是十進(jìn)制格式的霍夫曼碼,"比特增量"是與前一行上的碼相比,當(dāng)前碼所需的額外比特(十進(jìn)制格式)數(shù)量,并且"標(biāo)號"是十進(jìn)制格式的未編碼值。[17]在優(yōu)選實(shí)施例中,輸入音頻數(shù)據(jù)是基于幀的,其中每個(gè)幀定義了特定的時(shí)間間隔,并且包括在該時(shí)間間隔中多個(gè)音頻聲道的采樣。優(yōu)選地,每個(gè)這種幀具有從相對小的幀大小集合中選擇的固定采樣數(shù)量,其中任意特定時(shí)間間隔的所選幀大小取決于,例如,采樣速率和幀間所能容忍的延遲量。更優(yōu)選地,每個(gè)幀包括128、256、512或1024個(gè)采樣,其中優(yōu)選更長的幀,除非降低延遲非常重要。在以下討論的大多實(shí)例中,假設(shè)每個(gè)幀由1024個(gè)采樣構(gòu)成。然而,不能將這種實(shí)例當(dāng)作是限制性的。[18]為了處理(首先是MDCT或其它變換處理),把幀分割成多個(gè)更小的、優(yōu)選是大小相等的塊(有時(shí)稱為"初級塊",以便將其與典型地更長的MDCT或其它變換塊進(jìn)行區(qū)別)。圖2A和2B中示出了此分割。在圖2A中,通過單個(gè)初級塊51(例如包括1024個(gè)音頻數(shù)據(jù)采樣)來覆蓋整個(gè)幀50。在圖2B中,用八個(gè)連續(xù)的初級塊52一59(例如每個(gè)塊包括128個(gè)音頻數(shù)據(jù)采樣)來覆蓋幀50。[19]可以把每個(gè)采樣幀歸類為瞬變幀(即包括信號瞬變的幀)或準(zhǔn)靜態(tài)幀(即不包括瞬變的幀)。就這點(diǎn)而言,優(yōu)選把信號瞬變定義為信號能量的突然迅速的上升(沖擊)或下降。瞬變信號僅稀疏地發(fā)生,并且為了本發(fā)明的目的,假設(shè)在每個(gè)幀中最多發(fā)生兩個(gè)瞬變信號。[20]此處所用的術(shù)語"瞬變分段"指其信號具有相同或相似統(tǒng)計(jì)特性的整個(gè)幀或幀的一個(gè)分段。因此,準(zhǔn)靜態(tài)幀通常由單個(gè)瞬變分段構(gòu)成,而瞬變幀通常由兩個(gè)或三個(gè)瞬變分段構(gòu)成。例如,如果在幀中僅發(fā)生了沖擊或下降,那么瞬變幀通常會(huì)具有兩個(gè)瞬變分段:一個(gè)覆蓋了該幀在沖擊或下降之前的部分,另一個(gè)覆蓋了該幀在沖擊或下降之后的部分。如果在瞬變幀中沖擊和下降都發(fā)生了,那么通常將會(huì)存在三個(gè)瞬變分段,每個(gè)分段各自覆蓋由沖擊和下降所分割的幀的部分。[21]圖3A—C示出了這些可能性,其中每個(gè)圖示出了被分割成八個(gè)大小相等的初級塊61—68的單個(gè)采樣幀60。在圖3A中,瞬變信號70在第二個(gè)塊62中發(fā)生,因此具有兩個(gè)瞬變分段,一個(gè)由塊61單獨(dú)構(gòu)成,并且另一個(gè)由塊62—68構(gòu)成。在圖3B中,瞬變信號71在塊64中發(fā)生,并且另一個(gè)瞬變信號72在塊66中發(fā)生,因此具有三個(gè)瞬變分段,一個(gè)由塊61—63構(gòu)成,一個(gè)由塊64—65構(gòu)成并且最后一個(gè)由塊66_68構(gòu)成。在圖3C中,瞬變信號73發(fā)生在塊68中,因此具有兩個(gè)瞬變分段,一個(gè)由塊61—67構(gòu)成,另一個(gè)由塊68單獨(dú)構(gòu)成。[22]圖4是根據(jù)本發(fā)明的典型實(shí)施例的音頻信號解碼系統(tǒng)100的框圖,其中,實(shí)心箭頭指示音頻數(shù)據(jù)流,虛線箭頭指示控制、格式和/或輔助信息流,并且虛線框指示出在本實(shí)施例中只有當(dāng)比特流20中的對應(yīng)控制數(shù)據(jù)指明時(shí)才例示的組件,以下將詳細(xì)描述。如下所述,在典型的子實(shí)施例中,圖4中所示的各個(gè)部分、模塊或組件可以完全用計(jì)算機(jī)可執(zhí)行代碼來實(shí)現(xiàn)。然而,在可替換的實(shí)施例中,可以用此處所述的任何其它方法來實(shí)現(xiàn)任意或全部這些部分或組件。[23]最初將比特流20輸入到解復(fù)用器115,其把比特流20分割成數(shù)據(jù)幀,并且對每個(gè)幀中的數(shù)據(jù)進(jìn)行拆包,以便分離處理信息和音頻信號信息。就第一個(gè)任務(wù)而言,優(yōu)選將比特流20中的數(shù)據(jù)解釋為幀序列,其中每個(gè)新幀以相同的"同步字"(優(yōu)選是0x7FFF)開始。根據(jù)本發(fā)明的典型實(shí)施例,(760申請(以引用的方式并入本文)中描述了用于執(zhí)行這些功能的計(jì)算機(jī)程序列表,其包括例如此處所模塊,以及這些列出的模塊所調(diào)用或參考的其它模塊或?qū)λ鼈兊拿枋?。[24]每個(gè)數(shù)據(jù)幀的結(jié)構(gòu)優(yōu)選如下:幀頭同步碼字(優(yōu)選是,0x7FFF)音頻信號的描述,例如采樣速率、標(biāo)準(zhǔn)聲道的數(shù)量、低頻效果(LFE)聲道的數(shù)量等等標(biāo)準(zhǔn)聲道1到64所有標(biāo)準(zhǔn)聲道的音頻數(shù)據(jù)(在本實(shí)施例中多達(dá)64個(gè)這種聲道)LEF聲道0至U3所有LFE聲道的音頻數(shù)據(jù)(在本實(shí)施例中多達(dá)3個(gè)這種聲道)錯(cuò)誤檢測當(dāng)前音頻數(shù)據(jù)幀的錯(cuò)誤檢測碼。當(dāng)檢測到錯(cuò)誤時(shí),運(yùn)行錯(cuò)誤處理程序。輔助數(shù)據(jù)時(shí)間碼和/或任何其它用戶定義的信息頭"(曰息[25]幀頭中優(yōu)選包括單比特字段""Frm/^"&rrj;/^",用于指示幀的兩個(gè)可能的不同類型之一,通用幀(例如通過nFrmHeaderType=0來指示)或擴(kuò)展幀(例如通過nFrmHeaderType二l來指示)。位于該標(biāo)志位之后的比特組成了剩下的頭信息。在優(yōu)選實(shí)施例中,根據(jù)該幀是被指定為通用還是擴(kuò)展格式,將該信息總結(jié)如下,<table>tableseeoriginaldocumentpage13</column></row><table>因此,例如,如果nFrmHeaderType指示通用幀頭,那么把nFrmHeaderType之后前10個(gè)比特解釋為nNumWord(下面定義),把接下來的3個(gè)比特解釋為nNumNormalCh(下面定義),等等。然而,如果nFrmHeaderType指示擴(kuò)展幀頭,那么把nFrmHeaderType之后前13個(gè)比特解釋為nNumWord,把接下來的6個(gè)比特解釋為nNumNormalCh,等等。以下討論將解釋在本發(fā)明的本實(shí)施例中所用的各種頭字段。[26]字段指示在當(dāng)前幀(32比特碼字)中從同步碼字(其第一個(gè)比特)的開始到該當(dāng)前幀的錯(cuò)誤檢測字的結(jié)束的音頻數(shù)據(jù)長度。[27]字段"MMw2祝ocybPwi^m"指示對應(yīng)于當(dāng)前音頻數(shù)據(jù)幀的短窗改進(jìn)型離散余弦變換(MDCT)塊的數(shù)量。在本發(fā)明的優(yōu)選實(shí)施例中,一個(gè)短窗MDCT塊包括128個(gè)初級音頻數(shù)據(jù)采樣(優(yōu)選是熵編碼的量化的子帶采樣),因此對應(yīng)于音頻數(shù)據(jù)幀的初級音頻數(shù)據(jù)采樣數(shù)量是128XnNumBlocksPerFrm。[28]注意到,為了避免邊界效應(yīng),MDCT塊優(yōu)選大于初級塊,并且更優(yōu)選是初級塊大小的兩倍。因此,如果短初級塊由128個(gè)音頻數(shù)據(jù)采樣構(gòu)成,那么短MDCT塊優(yōu)選由256個(gè)采樣構(gòu)成,并且如果長初級塊由1024個(gè)音頻數(shù)據(jù)采樣構(gòu)成,那么長MDCT塊優(yōu)選由2048個(gè)采樣構(gòu)成。更優(yōu)選地,每個(gè)初級塊由新的(后來的)音頻數(shù)據(jù)采樣構(gòu)成。[29]字段""&w^/W^/^fec"指示用于音頻信號的采樣頻率的標(biāo)號。以下表格中示出了標(biāo)號集合和對應(yīng)的采樣頻率的實(shí)例<table>tableseeoriginaldocumentpage14</column></row><table>[30]字段"w7Vww7Voma/C7z"指示標(biāo)準(zhǔn)聲道的數(shù)量。通過幀頭類型來確定表示此字段的比特?cái)?shù)量。在本實(shí)施例中,如果nFrmHeaderType指示了通用幀頭,那么使用3個(gè)比特,并且標(biāo)準(zhǔn)聲道的數(shù)量可以在1到8之間變化。另一方面,如果nFrmHeaderType指示了擴(kuò)展幀頭,那么使用6個(gè)比特,并且標(biāo)準(zhǔn)聲道的數(shù)量可以在1到64之間變化。[31]字段"wA^m丄/eC/z"指示LFE聲道的數(shù)量。在本實(shí)施例中,如果nFrmHeaderType指示了通用幀頭,那么使用1個(gè)比特,并且標(biāo)準(zhǔn)聲道的數(shù)量可以在0到1之間變化。另一方面,如果nFrmHeaderType指示了擴(kuò)展幀頭,那么使用2個(gè)比特,并且標(biāo)準(zhǔn)聲道的數(shù)量可以在0到3之間變化。[32]字段"MtaC/zC/g"指示在當(dāng)前幀的末端是否存在任何輔助信息,例如,保護(hù)額外的信道配置信息。優(yōu)選地,用bAuxChCfg^0表示否,用bAuxChCfg二l表示是。[33]字段"6t/^^mZ)^指示是否已對當(dāng)前幀應(yīng)用了和/差編碼。優(yōu)選僅在通用幀頭中顯示此字段,并且不在擴(kuò)展幀頭中顯示此字段。優(yōu)選地,用bUseSumDiff二O表示否,bUseSumDiff=1表示是。[34]字段"Z)"^7/C"指示是否已對當(dāng)前幀應(yīng)用了聯(lián)合強(qiáng)度編碼。同樣優(yōu)選僅在通用幀頭中顯示此字段,并且不在擴(kuò)展幀頭中顯示此字段。優(yōu)選地,用bUseJIC二O表示否,bUseJIC=l表示是。[35]如果已對當(dāng)前幀應(yīng)用了聯(lián)合強(qiáng)度編碼,字段指示聯(lián)合強(qiáng)度編碼的開始臨界頻帶。同樣優(yōu)選僅在通用幀頭中顯示此字段,并且不在擴(kuò)展幀頭中顯示此字段。[36]如上所述,頭中的所有數(shù)據(jù)都是處理信息。以下將顯而易見,一些聲道專用數(shù)據(jù)也是處理數(shù)據(jù),盡管絕大部分這種數(shù)據(jù)是音頻數(shù)據(jù)采樣。聲道數(shù)據(jù)結(jié)構(gòu)[37]在優(yōu)選實(shí)施例中,每個(gè)標(biāo)準(zhǔn)聲道的通用數(shù)據(jù)結(jié)構(gòu)如下:<table>tableseeoriginaldocumentpage15</column></row><table><table>tableseeoriginaldocumentpage16</column></row><table>然而,在特定實(shí)施例中,并不是所用標(biāo)準(zhǔn)聲道都包含窗序列信息。如果沒有把窗序列信息提供給一個(gè)或多個(gè)聲道,優(yōu)選從提供給聲道o(ChO)的窗序列信息中拷貝此數(shù)據(jù)組,盡管在其它實(shí)施例中可以從任何其它指定聲道中拷貝該信息。[38]在優(yōu)選實(shí)施例中,每個(gè)LFC聲道的通用數(shù)據(jù)格式如下霍夫曼碼本標(biāo)號和應(yīng)用范圍碼本數(shù)量指示碼本的數(shù)量應(yīng)用范圍每個(gè)霍夫曼碼本的應(yīng)用范圍碼本標(biāo)號每個(gè)霍夫曼碼本的碼本標(biāo)號子帶采樣量化標(biāo)號所有子帶采樣的量化標(biāo)號量化步長標(biāo)號每個(gè)量化單元的量化步長標(biāo)號[39]如上所示,窗序列信息(僅提供給標(biāo)準(zhǔn)聲道)優(yōu)選包括MDCT窗函數(shù)標(biāo)號。在本實(shí)施例中,把該標(biāo)號指定為"w附"33^e0^re^",并且具有以下的值和意義<table>tableseeoriginaldocumentpage17</column></row><table>當(dāng)nWinTypeCurrent=0、1、2、3、4、5、6、7或8時(shí),指示長MDCT窗函數(shù),并且把此單個(gè)長窗函數(shù)用于整個(gè)幀。nWinTypeCurrent的其它值(nWinTypeCurrent=9、10、11或12)指示短MDCT窗函數(shù)。對于后面的情況,當(dāng)前幀由nNumBlockPerFrm(例如多達(dá)8個(gè))個(gè)短MDCT組成,并且nWinTypeCurrent僅指示這些nNumBlockPerFrm個(gè)短MDCT的第一個(gè)和最后一個(gè)窗函數(shù)。結(jié)合'917申請中所詳述的完全重構(gòu)要求,優(yōu)選通過瞬變出現(xiàn)的位置,來確定在該幀中的其它短窗函數(shù)。在任意情況下,接收數(shù)據(jù)優(yōu)選包括足以完全確定編碼器端所使用的整個(gè)窗序列的窗信息。[40]就這點(diǎn)而言,在本實(shí)施例中,字段"nNumCluster"指示當(dāng)前幀中瞬變分段的數(shù)量。當(dāng)窗函數(shù)標(biāo)號nWinTypeCurrent指示出在當(dāng)前幀(nWinTypeCurrent二O、1、2、3、4、5、6、7或8)中應(yīng)用了長窗函數(shù)時(shí),那么當(dāng)前幀是準(zhǔn)靜態(tài)的,因此瞬變分段的數(shù)量隱含為1,并且nNumCluster不需要出現(xiàn)在比特流中(因此優(yōu)選不對其進(jìn)行傳輸)。[41]另一方面,在優(yōu)選實(shí)施例中,當(dāng)指示了短窗函數(shù)時(shí),把2個(gè)比特分配給nNumCluster,并且其值在0—2之間變化,分別對應(yīng)于1—3個(gè)瞬變分段。注意到,即使在準(zhǔn)靜態(tài)幀(例如單個(gè)瞬變分段)中也可以使用短窗函數(shù)。例如,當(dāng)編碼器想要實(shí)現(xiàn)低的編碼延遲時(shí),可以發(fā)生這種情況。在此低延遲模式中,一幀中的音頻數(shù)據(jù)采樣數(shù)量可以小于1024(g卩,長初級塊的長度)。例如,編碼器可能己選擇為在一幀中只包括256個(gè)PCM采樣,在此情況下,用幀中的兩個(gè)短塊(每個(gè)包括128個(gè)PCM采樣,由256采樣MDCT塊所覆蓋)來覆蓋那些采樣,意味著該解碼器也應(yīng)用了兩個(gè)短窗。此模式的優(yōu)勢是在本實(shí)例中把正比于緩沖器大小(如果其它條件相同)的編碼延遲降低了例如4倍(1024/256=4)。[42]如果當(dāng)前幀是瞬變幀(即包括至少一部分瞬變信號,從而nNumCluster指示多于一個(gè)瞬變分段),那么在接收數(shù)據(jù)中優(yōu)選包括字段"a"7Vww祝ocfo尸wFwiPerC/MWw/""C7wW^/",并且通過每個(gè)瞬變分段nCluster占用的短MDCT塊的數(shù)量來指示該瞬變分段nCluster的長度。優(yōu)選地,(例如使用"60申請的表B.28中的HuffDec1—7xl)對每個(gè)這種字進(jìn)行了霍夫曼編碼,并且因此,可以對每個(gè)瞬變分段長度解碼,以重構(gòu)瞬變分段的位置。[43]另一方面,如果當(dāng)前幀是準(zhǔn)靜態(tài)幀(不管是具有單個(gè)長窗函數(shù)還是固定數(shù)量的短窗函數(shù)),優(yōu)選不把a(bǔ)nNumBlocksPerFrmPerCluster[nCluster]顯示在比特流中(即,不發(fā)送該信息),因?yàn)樵撍沧兎侄伍L度是隱含的,g卩,幀中的單個(gè)長塊具有長窗函數(shù)(例如2048個(gè)MDCT采樣),或者幀中的所有塊具有多個(gè)(例如多達(dá)8個(gè))短窗函數(shù)(例如每個(gè)包括256個(gè)MDCT采樣)。[44]如上所示,當(dāng)通過單個(gè)長塊來覆蓋幀時(shí),通過nWinTypeCurrent來指定該單個(gè)塊。然而,當(dāng)通過多個(gè)短塊來覆蓋幀時(shí),此情形通常是更加復(fù)雜一點(diǎn)。額外復(fù)雜度的原因是,由于完全重構(gòu)要求,當(dāng)前塊的窗函數(shù)取決于緊鄰的之前和之后塊中所使用的窗函數(shù)。因此在本發(fā)明的當(dāng)前實(shí)施例中,為了當(dāng)指示了短塊時(shí)確定合適的窗序列,而執(zhí)行額外的處理。以下結(jié)合模塊134的討論來詳細(xì)描述此額外處理。[45]復(fù)用器115還提取霍夫曼碼本標(biāo)號和應(yīng)用范圍信息。以下描述該信息和對其的處理。[46]—旦如上所述對幀數(shù)據(jù)進(jìn)行了拆包,就獲得變換系數(shù),并以適當(dāng)順序?qū)ζ溥M(jìn)行排列,并且隨后執(zhí)行逆變換處理,以生成原始時(shí)域數(shù)據(jù)。以下參考圖4,更加詳細(xì)地描述了這些通用步驟。系數(shù)獲取[47]參考圖4,在模塊118中,基于解復(fù)用器15中提取的對應(yīng)信息,選擇恰當(dāng)?shù)拇a本和應(yīng)用范圍。更具體地,以上參考的霍夫曼碼本標(biāo)號和應(yīng)用范圍信息優(yōu)選包括以下字段。[48]字段"a"i/57VwwSa"^/""C7"We^/"指示在瞬變分段nCluster中的碼本數(shù)量。字段"mwi/5"5a^/^/ge/""C/wWe^/"wB朋t/j^4"指示在瞬變分段nCluster中碼本分段nBand(即,霍夫曼碼本的應(yīng)用范圍)的長度(就量化標(biāo)號而言);每一個(gè)這種值本身優(yōu)選是被霍夫曼編碼的,其中模塊18使用HuffDec2—64x1(如'760申請中所述),對準(zhǔn)靜態(tài)幀的值進(jìn)行解碼,并且使用HuffDec3—32x1(同樣如"60申請中所述)對瞬變幀的值進(jìn)行解碼。字段"m"http://57"wC/Mter_//""^wW指示在瞬變分段nCluster中的碼本分段nBand的霍夫曼碼本標(biāo)號;每一個(gè)這種值本身優(yōu)選是被霍夫曼編碼的,其中使用"60申請中的HuffDec4—18x1,對準(zhǔn)靜態(tài)幀的值進(jìn)行解碼,以及使用'760申請中的HuffDec5J8xl,對瞬變幀的值進(jìn)行解碼。[49]然后基于如下的已解碼mnHS[nCluster][nBand]碼本標(biāo)號,獲得用于對實(shí)際的子帶采樣量化標(biāo)號進(jìn)行解碼的碼本<table>tableseeoriginaldocumentpage19</column></row><table>其中,維數(shù)指示由單個(gè)霍夫曼碼來編碼的量化標(biāo)號的數(shù)量,并且所參考的霍夫曼解碼表優(yōu)選如'760申請中所指定的。[50]注意到,在本實(shí)施例中,指定了每個(gè)碼本應(yīng)用范圍(即每個(gè)碼本分段)的長度。每個(gè)碼本分段可以跨越邊界幾個(gè)或多個(gè)量化單元。同樣,有可能通過其它方式來指定碼本分段,例如,通過指定每個(gè)碼本應(yīng)用范圍的開始點(diǎn)。然而,如果指定了該長度(而不是開始點(diǎn)),通常有可能用更少的比特總數(shù)來編碼。[51]在任意情況下,接收信息優(yōu)選唯一地識別每個(gè)碼本要應(yīng)用于的應(yīng)用范圍,并且解碼器100使用此信息來對實(shí)際量化標(biāo)號進(jìn)行解碼。此方法與常規(guī)方法有重大的不同,在常規(guī)方法中把碼本分配給每個(gè)量化單元,從而常規(guī)方法中沒有發(fā)送應(yīng)用范圍。然而,如'760申請中所詳述,通常,通過靈活地指定應(yīng)用范圍所獲得的額外效率,更多地補(bǔ)償了上述額外開銷。[52]在模塊120中,通過把模塊118中所識別的碼本應(yīng)用于對應(yīng)的量化標(biāo)號應(yīng)用范圍,對由解復(fù)用器15所提取的量化標(biāo)號進(jìn)行解碼。其結(jié)果是完全解碼的量化標(biāo)號集合。[53]在模塊122中,對量化單元數(shù)量進(jìn)行重構(gòu)。就這點(diǎn)而言,優(yōu)選通過由頻域中的臨界頻帶和時(shí)域中的瞬變分段所界定的量化標(biāo)號矩形,來定義每個(gè)"量化單元"。在此矩形中的所有量化標(biāo)號都屬于相同量化單元。優(yōu)選基于由解復(fù)用器115所提取的瞬變分段信息,按照上述方式,來識別瞬變分段。"臨界頻帶"是指人耳的頻率分辯率,即帶寬4A在該帶寬內(nèi),人耳不能分辨出不同的頻率。帶寬^/優(yōu)選隨著頻率/的增加而增加,其中/和4/^之間近似指數(shù)關(guān)系。每個(gè)臨界頻帶可以表示為濾波器組的多個(gè)鄰近子帶采樣。"60申請的表B.2到B.27描述了用于短窗和長窗以及用于不同采樣速率的優(yōu)選臨界頻帶。換句話說,對于每個(gè)MDCT塊大小和采樣速率,預(yù)先確定臨界頻帶的邊界,其中編碼器和解碼器使用相同的臨界頻帶。根據(jù)前述信息,重構(gòu)量化單元的數(shù)量,如下"C6=0,沐秘ef拜CM"cfee/"C,W<慮ox飾j++,'其中a"7/57VMmBa"A/""C7wW^/是瞬變分段nCluster的碼本數(shù)量,mwi^Sawffidge/""C/aste^7/w5aw^/是瞬變分段nCluster的碼本nBand的碼本應(yīng)用范圍的上邊界,p"C5五^e/"Wa"J/是臨界頻帶nBand的上邊界,并且a"ikfo^4"/""C/wWer/是瞬變分段nCluster的量化單元的數(shù)量。[54]在反量化模塊124中,從比特流20中解碼出適用于每個(gè)量化單元的量化步長的大小,并且使用此步長根據(jù)從解碼模塊120所接收的量化標(biāo)號重構(gòu)子帶采樣。在優(yōu)選實(shí)施例中,"mw0Step/"<iex/""C/MWer7/""B<3"<^"指示出量化單元(nCluster、nBand)的量化步長標(biāo)號,并且如'760申請中所述,對于準(zhǔn)靜態(tài)幀,用霍夫曼碼本HuffDec6—116x1來對m"g5fe//"ifec/""C7wWe^7/"wS""^進(jìn)行解碼,對應(yīng)瞬變幀,用霍夫曼碼本Huffl)ec7J16xl來對其進(jìn)行一[55]—旦識別出量化步長,優(yōu)選如下獲得每個(gè)子帶采樣值(假設(shè)在編碼器使用線形量化)f帶if存量眾,長X量/A^號。在本發(fā)明的可替換的實(shí)施例中,使用非線形的量化技術(shù)。[56]優(yōu)選僅在通過bUseJIC值指定的情況下,才在模塊128中執(zhí)行聯(lián)合強(qiáng)度解碼。如果執(zhí)行,聯(lián)合強(qiáng)度解碼器128從源聲道中拷貝子帶采樣,然后將它們乘以比例因子,以重構(gòu)聯(lián)合聲道的子帶采樣,即,凝會(huì)聲遭if存二"夠茵fX潔聲遭f,。在一個(gè)典型實(shí)施例中,源聲道是前左聲道,并且每個(gè)其它標(biāo)準(zhǔn)聲道都被編碼成聯(lián)合聲道。優(yōu)選地,相同量化單元中的所有子帶采樣具有相同的比例因子。[57]優(yōu)選僅在通過bUseSumDiff指定的情況下,才在模塊130中執(zhí)行和/差解碼。如果執(zhí)行,優(yōu)選如下執(zhí)行左/右聲道中子帶采樣的重構(gòu)左聲遭=,聲遣+差聲邀以及右聲遭遭_差聲遣。[58]如<346申請中所述,在編碼器的優(yōu)選實(shí)施例中,在稱為交織的過程中,對當(dāng)前聲道的當(dāng)前幀的子帶采樣進(jìn)行重新排列,以便把對應(yīng)于相同子帶的相同瞬變分段中的采樣集合在一起。因此,在解交織模塊132中,把子帶采樣重新排列回它們的自然順序。一種用于執(zhí)行這種重新排列的技術(shù)如下"胸0:awC7w他r胸0/"C7w^/7,.,fh=0;,j<128,'/2十"^/《十=wiV"抝J/0cAxPerFr附,'其中nNumCluster是瞬變分段的數(shù)量,anNumBlocksFRmPerCluster[nCluster]是瞬變分段nCluster的瞬變分段長度,nClusterBinO[nCluster]是瞬變分段nCluster的第一個(gè)子帶采樣位置,affiinINterleaved[q提按照交織順序排列的子帶采樣的隊(duì)列,并且affiinNatuml[p]是按照自然順序排列的子帶采樣的隊(duì)列。[59]因此,根據(jù)由解交織模塊132所執(zhí)行的處理,每個(gè)聲道的每個(gè)幀的子帶采樣都以它們的自然順序來輸出。變換到基于時(shí)間的采樣[60]在模塊134,識別(在編碼器端)對于當(dāng)前數(shù)據(jù)幀的變換塊所使用的窗函數(shù)序列。如上所示,在本實(shí)施例中,在編碼器端使用了MDCT變換。然而,在其它實(shí)施例中,可能使用了其它類型的變換(優(yōu)選是統(tǒng)一的并且基于正弦的),并且本發(fā)明的解碼器100可以完全適應(yīng)。在本發(fā)明中,如上所示,對于長變換塊幀,所接收的字段nWinTypeCurrent對用于整個(gè)幀的單個(gè)長窗函數(shù)進(jìn)行識別。因此,在此實(shí)施例中,對于長變換塊幀,在模塊134無須執(zhí)行額外處理。[61]另一方面,對于短變換塊幀,當(dāng)前實(shí)施例中的字段nWinTypeCurrent僅指示了用于第一個(gè)和最后一個(gè)變換塊的窗函數(shù)。因此,優(yōu)選對短變換塊幀執(zhí)行以下處理。[62]當(dāng)在該幀中使用短塊時(shí),所接收的nWinTypeCurrent的值優(yōu)選指示出當(dāng)前幀的第一個(gè)塊和下一幀的第一個(gè)塊是否包含瞬變信號。此信息,與瞬變分段的位置(從接收的瞬變分段長度來識別)和完全重構(gòu)要求一起,允許解碼器100確定把哪個(gè)窗函數(shù)用到該幀的每個(gè)塊中。[63]由于在優(yōu)選實(shí)施例中,把WIN_SHORT—BRIEF2BRIEF窗函數(shù)用于具有瞬變的塊,可以使用以下命名法來傳遞此信息。WIN—SHORT—Cwre"f2Sw&,其中,Cwre"f(SHORT二否,BRIEF=是)對當(dāng)前幀的第一個(gè)塊中是否存在瞬變進(jìn)行識別,并且(SHORT二否,BRIEF二是)對當(dāng)下一幀的第一個(gè)塊中是否存在瞬變進(jìn)行識別。例如WIN_SHORTJBRIEF2BRIEF指示出當(dāng)前幀的第一個(gè)塊中以及下一幀的第一個(gè)塊中存在瞬變,并且WIN_SHORT_BRIEF2SHORT指示出當(dāng)前幀的第一個(gè)塊中存在瞬變并且下一幀的第一個(gè)塊中不存在瞬變。[64]因此,Cwr^^有助于確定在該幀的第一個(gè)塊中的窗函數(shù)(通過指示出該幀的第一個(gè)塊是否包括瞬變信號),并且5*"^有助于對該幀的最后一個(gè)塊的窗函數(shù)進(jìn)行識別(通過指示出下一幀的第一個(gè)塊是否包括瞬變信號)。尤其,如果Current是SHORT,第一個(gè)塊的窗函數(shù)應(yīng)該是WIN一SHORT一Last2SHORT,其中經(jīng)由完全重構(gòu)特性通過上一幀的最后一個(gè)窗函數(shù)來確定"Last"。另一方面,如果Current是BRIEF,第一個(gè)塊的窗函數(shù)應(yīng)該是WIN—SHORT—Last2BRIEF,其中同樣經(jīng)由完全重構(gòu)特性通過上一幀的最后一個(gè)窗函數(shù)來確定Last。對于該幀的最后一個(gè)塊,如果其包含瞬變,其窗函數(shù)應(yīng)該是WIN—SHORT_BRIEF2BRIEF。當(dāng)此塊中沒有瞬變時(shí),如果Subs是SHORT,該幀的最后一個(gè)塊的窗函數(shù)應(yīng)該是WIN—SHORT—Last2SHORT,其中經(jīng)由完全重構(gòu)特性通過該幀的倒數(shù)第二個(gè)幀的窗函數(shù)來確定Last。另一方面,如果Subs是BRIEF,該幀的最后一個(gè)塊的窗函數(shù)應(yīng)該是WIN—SHORT—Last2BRIEF,其中同樣經(jīng)由完全重構(gòu)特性通過該幀的倒數(shù)第二個(gè)塊的窗函數(shù)來確定Last。最后,可以經(jīng)由完全重構(gòu)特性,通過(多個(gè))瞬變位置來確定該幀中其余塊的窗函數(shù),其中通過瞬變分段的開始指示該瞬變位置。'917申請給出了這種做法的詳細(xì)過程。[65]在模塊136中,對于當(dāng)前幀的每個(gè)變換塊,使用由模塊134針對該塊所識別的窗函數(shù),對子帶采樣進(jìn)行逆變換,以恢復(fù)原始數(shù)據(jù)值(受到了在編碼過程中所引入的任何量化噪聲和其它數(shù)值不精確性的影響)。[66]模塊136的輸出是對輸入到編碼器的PCM采樣的重構(gòu)序列。系統(tǒng)環(huán)境[67]—般來說,除了特別說明,此處所述的所有系統(tǒng)、方法和技術(shù)都可以用一個(gè)或者多個(gè)可編程通用計(jì)算設(shè)備來實(shí)現(xiàn)。這種設(shè)備典型地包括,例如,經(jīng)由諸如公共總線彼此互連的以下組件中的至少一些組件一個(gè)或多個(gè)中央處理單元(CPU);只讀存儲器(ROM);隨機(jī)存儲器(RAM);用于與其它設(shè)備進(jìn)行接口的輸入/輸出軟件和電路(例如,用硬線連接,例如串口,并口,USB連接或火線連接,或者使用諸如藍(lán)牙或802.11協(xié)議的無線連接);用來連接到一個(gè)或多個(gè)網(wǎng)絡(luò)的軟件和電路(例如,用諸如以太網(wǎng)卡或無線協(xié)議,例如碼分多址(CDMA)、全球移動(dòng)通信系統(tǒng)(GSM)、藍(lán)牙、802.11協(xié)議或其它基于小區(qū)的或不基于小區(qū)的系統(tǒng)的硬線連接),其中在本發(fā)明的多個(gè)實(shí)施例中,該一個(gè)或多個(gè)網(wǎng)絡(luò)連接到因特網(wǎng)或其它網(wǎng)絡(luò);顯示器(例如陰極射線顯示器、液晶顯示器、有機(jī)發(fā)光顯示器、聚合發(fā)光顯示器或者任何其它薄膜顯示器);其它輸出設(shè)備(例如一個(gè)或多個(gè)揚(yáng)聲器、耳機(jī)設(shè)備和打印機(jī));一個(gè)或多個(gè)輸入設(shè)備(例如鼠標(biāo)、觸摸板、寫字板、觸摸感應(yīng)顯示器或其它定點(diǎn)設(shè)備、鍵盤、小鍵盤、麥克風(fēng)和掃描儀);大容量存儲單元(例如硬盤驅(qū)動(dòng)器);實(shí)時(shí)時(shí)鐘;可擦除存儲讀/寫設(shè)備(例如用于從RAM,磁盤、磁帶、光磁盤、光盤等等讀出或向它們寫入);調(diào)制解調(diào)器(例如用于發(fā)送傳真或用于經(jīng)由撥號連接來連接到因特網(wǎng)或其它計(jì)算機(jī)網(wǎng)絡(luò))。在操作中,用于執(zhí)行上述方法和功能的處理步驟,通過通用計(jì)算機(jī)來執(zhí)行時(shí),典型地將最初存儲在大容量存儲器(例如硬盤)中,并下載到RAM中,然后通過RAM之外的CPU來執(zhí)行。然而,在一些情況下,最初將處理步驟存儲在RAM或ROM中。[68]可以從各種提供商獲得用于實(shí)現(xiàn)本發(fā)明的合適設(shè)備。在各個(gè)實(shí)施例中,根據(jù)任務(wù)的大小和復(fù)雜性來使用不同類型的設(shè)備。合適的設(shè)備包括大型計(jì)算機(jī)、多處理器計(jì)算機(jī)、工作站、個(gè)人計(jì)算機(jī)、甚至諸如PDA、無線電話或任何其它工具或設(shè)備的更小的計(jì)算機(jī),無論獨(dú)立的、硬連接到網(wǎng)絡(luò)或無線連接到網(wǎng)絡(luò)。[69]此外,盡管以上描述了通用可編程設(shè)備,在可替換的實(shí)施例中,可以替代(或額外)使用一個(gè)或多個(gè)專用處理器或計(jì)算機(jī)??偟膩碚f,應(yīng)該注意到的是,除非明確說明,上述的任何功能都可以用軟件、硬件、固件或它們的任意合并來實(shí)現(xiàn),其中基于已知的工程折衷來選擇特定的實(shí)現(xiàn)。更具體地,本領(lǐng)域的技術(shù)人員很容易理解,當(dāng)用固定的、預(yù)定的或邏輯方式來實(shí)現(xiàn)上述功能時(shí),可以通過編程(例如軟件或固件)、邏輯組件(硬件)的恰當(dāng)排列或這兩個(gè)的任意合并來完成。[70]應(yīng)該注意到的是,本發(fā)明還涉及機(jī)器可讀介質(zhì),可以在其上存儲用于執(zhí)行本發(fā)明的方法和功能的程序指令。這種介質(zhì)包括,例如,磁盤、磁帶、諸如CDROM和DVDROM的光可讀介質(zhì)、或者諸如PCMCIA卡的半導(dǎo)體存儲器、各種類型的存儲卡、USB存儲設(shè)備等等。在每種情況下,介質(zhì)可以是便攜物的形式,例如微型磁盤驅(qū)動(dòng)器或小磁盤、磁盤、磁帶、盤式磁帶、卡、棒等等,或者可以是相對較大的或不可移動(dòng)的物體的形式,例如提供在計(jì)算機(jī)或其它設(shè)備中的硬盤驅(qū)動(dòng)器、ROM或RAM。[71]前述的描述主要強(qiáng)調(diào)了電子計(jì)算機(jī)和設(shè)備。然而,應(yīng)該明白的是,任何其它計(jì)算或其它類型的設(shè)備可以替換使用,例如利用了電子,光,生物和化學(xué)處理的任意合并的設(shè)備。額外考慮前述實(shí)施例涉及音頻數(shù)據(jù)的處理。然而,需要明白的是,可以結(jié)合對于其它類型數(shù)據(jù)的處理來使用本發(fā)明的技術(shù),例如視頻數(shù)據(jù)、傳感數(shù)據(jù)(例如地震、氣象、輻射)、經(jīng)濟(jì)學(xué)數(shù)據(jù)或者其它可觀察的或可測量的數(shù)據(jù)。[73]以上描述了本發(fā)明的各種不同的實(shí)施例,其中所述的每個(gè)實(shí)施例包括了特定的特征。然而,本領(lǐng)域的技術(shù)人員將會(huì)明白,所述的與任何單個(gè)實(shí)施例有關(guān)的特征并不限于該實(shí)施例,而是還可以包括在和/或以各種組合方式安排在任何其它實(shí)施例中。[74]同樣,在上述討論中,有時(shí)將功能歸因于特定的模塊或組件。然而,可以根據(jù)需要,在不同的模塊或組件中對功能進(jìn)行重新分配,在一些情況下,完全消除了對特定組件或模塊的需要,和/或需要添加新的組件件或模塊。本領(lǐng)域的技術(shù)人員將會(huì)明白,參考本發(fā)明的特定實(shí)施例,優(yōu)選地根據(jù)己知的工程折衷來精確地分配功能。[75]因此,盡管本發(fā)明詳細(xì)描述了示例性實(shí)施例和附圖,對于本領(lǐng)域的技術(shù)人員來說,在不脫離本發(fā)明的精神和范圍的前提下,顯然可以對本發(fā)明做出各種改變和修改。因此,本發(fā)明并不限于附圖和上述描述中所述的精確的實(shí)施例。而是,旨在把不脫離本發(fā)明實(shí)質(zhì)的所有這種變形看作在本發(fā)明的范圍之內(nèi),其中本發(fā)明的范圍僅由所附權(quán)利要求來限定。權(quán)利要求1、一種用于對音頻信號進(jìn)行解碼的方法,包括(a)獲得包括多個(gè)幀的比特流,每個(gè)幀包括與該幀有關(guān)的處理信息以及表示該幀中音頻數(shù)據(jù)的熵編碼量化標(biāo)號,所述處理信息包括(i)多個(gè)碼本標(biāo)號,每個(gè)碼本標(biāo)號識別一個(gè)碼本,(ii)碼本應(yīng)用信息,用于指定要應(yīng)用碼本的熵編碼量化標(biāo)號范圍,以及(iii)窗信息;(b)通過將由碼本標(biāo)號所識別的碼本應(yīng)用到由碼本應(yīng)用信息所指定的熵編碼量化標(biāo)號范圍,對熵編碼量化標(biāo)號進(jìn)行解碼;(c)通過對所解碼的量化標(biāo)號進(jìn)行反量化,生成子帶采樣;(d)基于窗信息,識別出在單個(gè)音頻數(shù)據(jù)幀中所應(yīng)用的一序列多個(gè)不同窗函數(shù);以及(e)通過對子帶采樣進(jìn)行逆變換,并且在所述單個(gè)音頻數(shù)據(jù)幀中使用由窗信息所指示的所述多個(gè)不同窗函數(shù),來獲得時(shí)域音頻數(shù)據(jù)。2、如權(quán)利要求l所述的方法,其中,至少一個(gè)熵編碼量化標(biāo)號范圍跨越了量化單元的邊界,量化單元是由通過頻域中的臨界頻帶和時(shí)域中的瞬變分段所界定的量化標(biāo)號矩形來定義的。3、如權(quán)利要求l所述的方法,其中,碼本應(yīng)用信息針對由碼本標(biāo)號所識別的每個(gè)碼本,識別一個(gè)熵編碼量化標(biāo)號范圍。4、如權(quán)利要求l所述的方法,其中,碼本應(yīng)用信息針對由碼本標(biāo)號所識別的每個(gè)碼本,指定熵編碼量化標(biāo)號長度。5、如權(quán)利要求l所述的方法,其中,窗信息指示在幀中瞬變的位置,并且其中,在步驟(d)基于與瞬變的位置有關(guān)的預(yù)定規(guī)則,識別出所述一序列多個(gè)不同窗函數(shù)。6、如權(quán)利要求5所述的方法,其中,所述預(yù)定規(guī)則指定在包括瞬變的任意變換塊中使用了特定窗函數(shù)。7、如權(quán)利要求6所述的方法,其中,所述預(yù)定規(guī)則還符合完全重構(gòu)要求。8,如權(quán)利要求5所述的方法,其中,所述特定窗函數(shù)比所述單個(gè)音頻數(shù)據(jù)幀中的所述多個(gè)不同窗函數(shù)中的其它窗函數(shù)窄。9、如權(quán)利要求5所述的方法,其中,所述特定窗函數(shù)是對稱的,并且僅占其整個(gè)變換塊的中央部分,在其變換塊的各端具有多個(gè)0值。10、如權(quán)利要求l所述的方法,其中,(0所述多個(gè)碼本標(biāo)號、(ii)所述碼本應(yīng)用信息以及(iii)所述窗信息都是經(jīng)過熵編碼的。11、一種存儲用于對音頻信號進(jìn)行解碼的計(jì)算機(jī)可執(zhí)行處理步驟的計(jì)算機(jī)可讀介質(zhì),所述處理步驟包括以下步驟(a)獲得包括多個(gè)幀的比特流,每個(gè)幀包括與該幀有關(guān)的處理信息以及表示該幀中音頻數(shù)據(jù)的熵編碼量化標(biāo)號,所述處理信息包括(i)多個(gè)碼本標(biāo)號,每個(gè)碼本標(biāo)號識別一個(gè)碼本,(ii)碼本應(yīng)用信息,用于指定要應(yīng)用碼本的熵編碼量化標(biāo)號范圍,以及(iii)窗信息;(b)通過將由碼本標(biāo)號所識別的碼本應(yīng)用到由碼本應(yīng)用信息所指定的熵編碼量化標(biāo)號范圍,對熵編碼量化標(biāo)號進(jìn)行解碼;(c)通過對所解碼的量化標(biāo)號進(jìn)行反量化,生成子帶采樣;(d)基于窗信息,識別出在單個(gè)音頻數(shù)據(jù)幀中所應(yīng)用的一序列多個(gè)不同窗函數(shù);以及(e)通過對子帶采樣進(jìn)行逆變換,并且在所述單個(gè)音頻數(shù)據(jù)幀中使用由窗信息所指示的所述多個(gè)不同窗函數(shù),來獲得時(shí)域音頻數(shù)據(jù)。12、如權(quán)利要求ll所述的計(jì)算機(jī)可讀介質(zhì),其中,至少一個(gè)熵編碼量化標(biāo)號范圍跨越了量化單元的邊界,量化單元是由通過頻域中的臨界頻帶和時(shí)域中的瞬變分段所界定的量化標(biāo)號矩形來定義的。13、如權(quán)利要求ll所述的計(jì)算機(jī)可讀介質(zhì),其中,窗信息指示在幀中瞬變的位置,并且其中,在步驟(d)基于與瞬變的位置有關(guān)的預(yù)定規(guī)則,識別出所述一序列多個(gè)不同窗函數(shù),其中,所述預(yù)定規(guī)則指定在包括瞬變的任意變換塊中使用了特定窗函數(shù),并且其中,所述預(yù)定規(guī)則還符合完全重構(gòu)要求。14、如權(quán)利要求ll所述的計(jì)算機(jī)可讀介質(zhì),其中,所述特定窗函數(shù)是對稱的,并且僅占其整個(gè)變換塊的中央部分,在其變換塊的各端具有多個(gè)0值。15、如權(quán)利要求11所述的計(jì)算機(jī)可讀介質(zhì),其中,(i)所述多個(gè)碼本標(biāo)號、(ii)所述碼本應(yīng)用信息以及(iii)所述窗信息都是經(jīng)過熵編碼的。16、一種用于對音頻信號進(jìn)行解碼的設(shè)備,包括a)比特流獲得裝置,獲得包括多個(gè)幀的比特流,每個(gè)幀包括與該幀有關(guān)的處理信息以及表示該幀中音頻數(shù)據(jù)的熵編碼量化標(biāo)號,所述處理信息包括(i)多個(gè)碼本標(biāo)號,每個(gè)碼本標(biāo)號識別一個(gè)碼本,(ii)碼本應(yīng)用信息,用于指定要應(yīng)用碼本的熵編碼量化標(biāo)號范圍,以及(iii)窗信息;(b)解碼裝置,通過將由碼本標(biāo)號所識別的碼本應(yīng)用到由碼本應(yīng)用信息所指定的熵編碼量化標(biāo)號范圍,對熵編碼量化標(biāo)號進(jìn)行解碼;(c)子帶采樣生成裝置,通過對所解碼的量化標(biāo)號進(jìn)行反量化,生成子帶采樣;(d)窗函數(shù)識別裝置,基于窗信息,識別出在單個(gè)音頻數(shù)據(jù)幀中所應(yīng)用的一序列多個(gè)不同窗函數(shù);以及(e)時(shí)域音頻數(shù)據(jù)獲得裝置,通過對子帶采樣進(jìn)行逆變換,并且在所述單個(gè)音頻數(shù)據(jù)幀中使用由窗信息所指示的所述多個(gè)不同窗函數(shù),來獲得時(shí)域音頻數(shù)據(jù)。17、如權(quán)利要求16所述的設(shè)備,其中,至少一個(gè)熵編碼量化標(biāo)號范圍跨越了量化單元的邊界,量化單元是由通過頻域中的臨界頻帶和時(shí)域中的瞬變分段所界定的量化標(biāo)號矩形來定義的。18、如權(quán)利要求16所述的設(shè)備,其中,窗信息指示在幀中瞬變的位置,并且其中,在步驟(d)基于與瞬變的位置有關(guān)的預(yù)定規(guī)則,識別出所述一序列多個(gè)不同窗信息,其中,所述預(yù)定規(guī)則指定在包括瞬變的任意變換塊中使用了特定窗函數(shù),并且其中,所述預(yù)定規(guī)則還符合完全重構(gòu)要求。19、如權(quán)利要求16所述的設(shè)備,其中,所述特定窗函數(shù)是對稱的,并且僅占其整個(gè)變換塊的中央部分,在其變換塊的各端具有多個(gè)0值。20、如權(quán)利要求16所述的設(shè)備,其中,(i)所述多個(gè)碼本標(biāo)號、(ii)所述碼本應(yīng)用信息以及(iii)所述窗信息都是經(jīng)過熵編碼的。全文摘要提供了對來自基于幀的比特流的音頻信號進(jìn)行解碼的系統(tǒng)、方法和技術(shù),及其它。每個(gè)幀包括與該幀有關(guān)的處理信息以及表示該幀中音頻數(shù)據(jù)的熵編碼量化標(biāo)號。所述處理信息包括(i)多個(gè)碼本標(biāo)號,(ii)碼本應(yīng)用信息,用于指定要將碼本應(yīng)用到的熵編碼量化標(biāo)號范圍,以及(iii)窗信息。通過將所識別的碼本應(yīng)用到對應(yīng)的熵編碼量化標(biāo)號范圍,對熵編碼量化標(biāo)號進(jìn)行解碼。通過對所解碼的量化標(biāo)號進(jìn)行反量化,生成子帶采樣?;诖靶畔?,識別出在單個(gè)音頻數(shù)據(jù)幀中所應(yīng)用的一序列多個(gè)不同窗函數(shù)。通過對子帶采樣進(jìn)行逆變換,并且使用由窗信息所指示的所述多個(gè)不同窗函數(shù),來獲得時(shí)域音頻數(shù)據(jù)。文檔編號H03M7/40GK101127212SQ20071014166公開日2008年2月20日申請日期2007年8月17日優(yōu)先權(quán)日2006年8月18日發(fā)明者游余立申請人:廣州廣晟數(shù)碼技術(shù)有限公司