專(zhuān)利名稱(chēng):使用時(shí)間頻率相關(guān)編碼和/或解碼數(shù)字音頻的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種數(shù)字音頻編碼和/或解碼方法以及執(zhí)行所述方法的裝置,具體而言,本發(fā)明涉及用于通過(guò)使用音頻信號(hào)的時(shí)頻相關(guān)來(lái)改善現(xiàn)有技術(shù)的編碼和解碼裝置的音頻編碼和/或解碼方法及其裝置。
背景技術(shù):
音頻編碼器和解碼器、即音頻編碼解碼器被廣泛地使用,因?yàn)樗鼈兪沟糜脩?hù)能夠以較低的比特率通過(guò)因特網(wǎng)來(lái)發(fā)送音樂(lè)文件。在音頻編碼解碼器中,用于通過(guò)因特網(wǎng)共享音樂(lè)文件和在便攜音頻播放器中播放音樂(lè)文件的MP3編碼解碼器已經(jīng)變得標(biāo)準(zhǔn)。在因特網(wǎng)上可以獲得的MP3音樂(lè)文件和共享MP3音樂(lè)文件的用戶(hù)的數(shù)量以指數(shù)增長(zhǎng)。
在音頻編碼領(lǐng)域中,已經(jīng)進(jìn)行了大量的研究和開(kāi)發(fā),以便實(shí)現(xiàn)可以以低比特率壓縮音頻信號(hào)并且同時(shí)保持原始的聲音質(zhì)量的音頻編碼解碼器。這些音頻編碼解碼器包括運(yùn)動(dòng)圖像專(zhuān)家組(MPEG)-1層3、MPEG-2先進(jìn)音頻編碼(AAC)、MPEG-4和窗口媒體音頻(WMA)。
圖1是現(xiàn)有技術(shù)的MPEG音頻編碼裝置的方框圖。在此,將作為示例來(lái)說(shuō)明MPEG-1層3音頻編碼器、即MP3音頻編碼器。
MP3音頻編碼器包括濾波器組110、快速傅立葉變換(FFT)單元120、音質(zhì)模型單元130、修改的離散余弦變換(MDCT)單元140和量化和霍夫曼編碼單元150。
濾波器組110將輸入的時(shí)間域音頻信號(hào)劃分為32個(gè)頻域副帶,以便去除音頻信號(hào)的統(tǒng)計(jì)冗余。
FFT單元120將輸入的音頻信號(hào)轉(zhuǎn)換為頻域頻譜,并且將所述頻譜輸出到音質(zhì)模型單元130。
為了使用從FFT單元120輸出的頻譜去除由人的聽(tīng)覺(jué)的特性導(dǎo)致的知覺(jué)冗余(perceptual redundancy),音質(zhì)模型單元130確定對(duì)于每個(gè)副帶的掩蔽門(mén)限(masking threshold),它是人不能感知到的噪音水平,即信號(hào)對(duì)掩蔽的比(SMR)。在音質(zhì)模型單元130中確定的SMR值被輸入到量化和霍夫曼編碼單元150。
而且,音質(zhì)模型單元130通過(guò)計(jì)算感知能量(perceptual energy)來(lái)確定是否切換一個(gè)窗口,并且向MDCT單元140輸出窗口轉(zhuǎn)換信息。
為了提高頻率分辨率,MDCT單元140使用從音質(zhì)模型單元130輸入的窗口切換信息將在濾波器組110中被劃分的副帶劃分為更細(xì)的頻帶。
根據(jù)從MDCT單元140輸入的SMR值,量化和霍夫曼編碼單元150通過(guò)執(zhí)行用于去除感知冗余的比特分配和用于音頻信號(hào)編碼的量化來(lái)處理在MDCT變換后從MDCT單元140輸入的頻域數(shù)據(jù)。
圖1所示的使用音質(zhì)模型的音頻編碼方法被公開(kāi)在美國(guó)專(zhuān)利第6,092,041中。因?yàn)橹T如圖1所示的MP3編碼器的音頻編碼解碼器以低比特率來(lái)執(zhí)行編碼和解碼,因此降低了輸出音頻質(zhì)量。
發(fā)明內(nèi)容
本發(fā)明提供了一種音頻編碼方法和裝置,通過(guò)它改善現(xiàn)有技術(shù)編碼裝置的性能以便以較低的比特率來(lái)提供較好的聲音質(zhì)量。
本發(fā)明也提供了一種音頻解碼方法和裝置,通過(guò)它改善現(xiàn)有技術(shù)解碼裝置的性能以便以較低的比特率來(lái)提供較好的聲音質(zhì)量。
按照本發(fā)明的一個(gè)方面,提供了一種數(shù)字音頻信號(hào)編碼方法,包括(a)根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表;(b)根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊,并且產(chǎn)生關(guān)于所述最接近相鄰塊的信息;(c)產(chǎn)生包括所產(chǎn)生的關(guān)于最接近相鄰塊的信息的比特流。
按照本發(fā)明的另一個(gè)方面,提供了一種數(shù)字音頻信號(hào)編碼方法,包括(a)根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表;(b)根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊;(c)根據(jù)被搜索的最近相鄰塊來(lái)確定是否當(dāng)前被編碼的塊是冗余塊;(d)根據(jù)在步驟(c)確定的結(jié)果來(lái)產(chǎn)生輸出比特流。
按照本發(fā)明的另一個(gè)方面,提供了一種數(shù)字音頻信號(hào)編碼裝置,包括時(shí)頻帶表產(chǎn)生單元,它根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表;最近相鄰塊搜索和最接近相鄰塊信息產(chǎn)生單元,它根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊,并且產(chǎn)生關(guān)于所述最接近相鄰塊的信息;比特流封裝單元,它產(chǎn)生包括所產(chǎn)生的關(guān)于最接近相鄰塊的信息的比特流。
按照本發(fā)明的另一個(gè)方面,提供了一種數(shù)字音頻信號(hào)編碼裝置,包括時(shí)頻帶表產(chǎn)生單元,它根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表;最近相鄰塊搜索單元,它根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊;冗余塊判定單元,它根據(jù)最近相鄰塊來(lái)確定是否當(dāng)前被編碼的塊是冗余塊;比特流產(chǎn)生單元,它根據(jù)在在冗余塊判定單元中確定的結(jié)果來(lái)產(chǎn)生輸出比特流。
按照本發(fā)明的另一個(gè)方面,提供了一種解碼方法,用于解碼包含關(guān)于音頻信號(hào)的預(yù)定區(qū)域的附加信息的音頻信號(hào),包括(a)從輸入的音頻比特流解碼不包括在預(yù)定區(qū)域中的塊;(b)根據(jù)解碼的塊數(shù)據(jù)來(lái)產(chǎn)生與所述預(yù)定區(qū)域?qū)?yīng)的時(shí)頻帶表;(c)根據(jù)關(guān)于音頻信號(hào)的所述預(yù)定區(qū)域的附加信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建在所述預(yù)定區(qū)域中包括的當(dāng)前塊。
按照本發(fā)明的另一個(gè)方面,提供了一種用于解碼數(shù)字音頻信號(hào)的解碼方法,包括(a)從輸入的音頻比特流提取最接近相鄰塊信息;(b)根據(jù)輸入的音頻比特流來(lái)產(chǎn)生時(shí)頻帶表;(c)根據(jù)所提取的最近相鄰塊信息來(lái)確定是否當(dāng)前被解碼的塊是冗余塊;(d)如果當(dāng)前被解碼的塊是冗余塊,則根據(jù)所提取的最近相鄰塊信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建冗余塊。
所述方法也可以包括使用重建的冗余塊來(lái)重建與輸入的音頻比特流相對(duì)應(yīng)的整個(gè)頻譜。
按照本發(fā)明的一個(gè)方面,提供了一種解碼裝置,用于解碼包含關(guān)于音頻信號(hào)的預(yù)定區(qū)域的附加信息的音頻信號(hào),包括解碼單元,它從輸入的音頻比特流解碼不包括在預(yù)定區(qū)域中的塊;后處理單元,它根據(jù)解碼的塊數(shù)據(jù)來(lái)產(chǎn)生與所述預(yù)定區(qū)域?qū)?yīng)的時(shí)頻帶表,并且根據(jù)關(guān)于音頻信號(hào)的所述預(yù)定區(qū)域的附加信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建在所述預(yù)定區(qū)域中包括的當(dāng)前塊。
按照本發(fā)明的另一個(gè)方面,提供了一種用于解碼數(shù)字音頻信號(hào)的解碼裝置,包括最近相鄰塊信息提取單元,它從輸入的音頻比特流提取最接近相鄰塊信息;時(shí)頻帶表產(chǎn)生單元,它根據(jù)輸入的音頻比特流來(lái)產(chǎn)生時(shí)頻帶表;冗余塊重建單元,它根據(jù)所提取的最近相鄰塊信息來(lái)確定是否當(dāng)前被解碼的塊是冗余塊,并且如果當(dāng)前被解碼的塊是冗余塊,則冗余塊重建單元根據(jù)所提取的最近相鄰塊信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建冗余塊。
通過(guò)參照附圖詳細(xì)說(shuō)明本發(fā)明的示范實(shí)施例,本發(fā)明的上述目的和優(yōu)點(diǎn)將會(huì)變得更加清楚,其中圖1是現(xiàn)有技術(shù)的MPEG音頻編碼裝置的方框圖;圖2是用于說(shuō)明譜帶復(fù)制方法的圖;圖3是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的編碼裝置的圖表;圖4是示出在本發(fā)明中使用的時(shí)頻帶表的圖表;圖5是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的由編碼方法執(zhí)行的步驟的流程圖;圖6是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的編碼裝置的圖表;圖7是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的由編碼方法執(zhí)行的本發(fā)明的流程圖;圖8是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的解碼裝置的圖表;圖9是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的由解碼方法執(zhí)行的步驟的流程圖;圖10是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的解碼裝置的圖表;圖11是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的由解碼方法執(zhí)行的步驟的流程圖。
具體實(shí)施例方式
語(yǔ)音編碼解碼器和視頻編碼解碼器使用在信號(hào)采樣之間的時(shí)間相關(guān)以便壓縮數(shù)據(jù)。語(yǔ)音編碼解碼器使用線(xiàn)性預(yù)測(cè)系數(shù)方法來(lái)執(zhí)行壓縮。同時(shí),視頻編碼解碼器使用運(yùn)動(dòng)測(cè)量來(lái)執(zhí)行時(shí)間相關(guān)。
一般,使用時(shí)間相關(guān)來(lái)壓縮數(shù)據(jù)不適合于音頻編碼解碼器,因?yàn)橐纛l信號(hào)的特性是動(dòng)態(tài)的,并且具有較少的時(shí)間相關(guān)。但是,在頻率變換域中,每個(gè)副帶數(shù)據(jù)信號(hào)與在時(shí)間域中的那些相比較實(shí)質(zhì)上是靜態(tài)的。因此,在頻率變換域中使用利用在幀之間的相關(guān)的線(xiàn)性預(yù)測(cè)方法。
例如,為了獲得較好的壓縮比,MPEG-2 AAC對(duì)于每個(gè)變換系數(shù)執(zhí)行線(xiàn)性預(yù)測(cè)。而且,為了去除長(zhǎng)期的周期性,MPEG-4 AAC使用與線(xiàn)性預(yù)測(cè)方法類(lèi)似的長(zhǎng)期預(yù)測(cè)器。
參見(jiàn)圖2,現(xiàn)在說(shuō)明利用頻譜系數(shù)的類(lèi)似性的譜帶復(fù)制(SBR)方法。
SBR方法通過(guò)提高(increasing)在給定比特率的音頻帶或通過(guò)改善在給定的質(zhì)量水平的編碼效率來(lái)改善在地比特率的音頻和語(yǔ)音編碼解碼器的性能。
按照?qǐng)D2所示的SBR方法,編碼器不編碼頻譜的高頻部分,而僅僅編碼低頻部分,然后發(fā)送信號(hào),然后,當(dāng)解碼信號(hào)時(shí),根據(jù)低頻部分的頻譜來(lái)重建未發(fā)送的高頻部分。
例如,在現(xiàn)有技術(shù)的編碼方法中,使用SBR方法的MP3編碼器編碼音樂(lè)信號(hào)的從0到8kHz部分。其中,僅僅編碼從0到8kHz部分的MP3文件可以由現(xiàn)有技術(shù)解碼器來(lái)解碼。因此,SBR方法與現(xiàn)有技術(shù)的MP3兼容。在SBR方法中,為了重建高頻部分,即從8kHz到16kHz的部分,使用頻譜的諧波結(jié)構(gòu),并且使用從0到8kHz的解碼的信號(hào)。
當(dāng)使用SBR方法時(shí),由使用現(xiàn)有技術(shù)感知編碼方法的編碼解碼器以低比特率提供的窄音頻帶寬可以被擴(kuò)展,以便可以提供模擬FM音頻帶寬或更大。而且,SBR方法改善窄帶語(yǔ)音編碼解碼器的性能,并且例如有可能提供具有在多語(yǔ)言廣播中使用的12kHz音頻帶寬的專(zhuān)用語(yǔ)音信道。
雖然在編碼器中部分地處理用于指導(dǎo)解碼處理的附加編碼器信息,但是SBR方法的多數(shù)步驟在解碼器中執(zhí)行。
從技術(shù)的角度來(lái)看,SBR是用于在音頻壓縮算法中有效地編碼高頻信號(hào)的方法。采用SBR方法的編碼裝置僅僅發(fā)送頻譜的低頻部分。在SBR解碼器中的解碼處理中產(chǎn)生被省略的高頻部分。取代發(fā)送高頻部分,采用SBR方法的解碼器分析由編碼器發(fā)送的低頻部分的頻譜,并且重建高頻部分。
為了保證高頻部分的精確重建,一些指導(dǎo)信息作為以低數(shù)據(jù)率編碼的比特流被發(fā)送。結(jié)果,SBR方法使得音頻信號(hào)的整個(gè)頻帶能夠以很低的數(shù)據(jù)率被編碼,并且同時(shí)與現(xiàn)有技術(shù)的MP3編碼器相比較提供了大大改善的壓縮效率。
因此,LPC算法使用時(shí)間相關(guān),而SBR算法使用信號(hào)的頻率相關(guān)。
根據(jù)本發(fā)明的算法同時(shí)使用音頻信號(hào)的時(shí)間和頻率相關(guān)性。參見(jiàn)圖3-11,現(xiàn)在說(shuō)明根據(jù)本發(fā)明的示范實(shí)施例。
圖3是本發(fā)明的一個(gè)示范實(shí)施例的圖表。
參見(jiàn)圖3和4,現(xiàn)在說(shuō)明按照本發(fā)明的一個(gè)示范實(shí)施例的音頻編碼方法。
根據(jù)本發(fā)明的的編碼裝置包括編碼單元310、時(shí)間幀帶復(fù)制(TFBR)單元320和比特流封裝單元330。
編碼單元310執(zhí)行與現(xiàn)有技術(shù)的音頻編碼器、即圖1所示的音頻編碼器類(lèi)似的功能。于是,省略對(duì)于編碼單元310的功能的詳細(xì)說(shuō)明。雖然圖1所示的音頻編碼器用于本實(shí)施例中,但是也可以使用其它的音頻編碼器。
TFBR單元320包括時(shí)頻帶表產(chǎn)生單元322和最近相鄰塊搜索和最近相鄰塊信息產(chǎn)生單元324。
時(shí)頻帶表產(chǎn)生單元322將在編碼單元310中MDCT變換的數(shù)據(jù)信號(hào)劃分為在每個(gè)幀中的N個(gè)頻率塊,以便產(chǎn)生圖4所示的時(shí)頻索引組合、即時(shí)頻(TF)帶表。
雖然在本實(shí)施例中MDCT變換被用作時(shí)頻變換方法,但是也可以使用其它的時(shí)頻變換方法。
在本實(shí)施例中,在編碼單元310的MDCT單元將音頻信號(hào)劃分為多個(gè)頻帶之后,每個(gè)頻帶具有多個(gè)頻譜系數(shù)。雖然在本實(shí)施例中使用具有相同寬度的頻帶,但是也可以使用具有不同寬度的頻帶。
在圖4中,i是幀索引,并且i=0,1,2,...,j-1,j,j+1,...,N是幀的頻率塊索引。在此,i表示其中執(zhí)行編碼的一個(gè)當(dāng)前幀,i-1和i+1分別表示前一個(gè)幀和下一個(gè)幀。同時(shí),j表示其中執(zhí)行編碼的頻帶,j=0指示在一個(gè)幀中的第一頻帶,j也表示當(dāng)前期望被編碼的塊的頻帶。而且,j-1指示前一個(gè)頻帶。
例如,圖4的B(i,j)指示對(duì)應(yīng)于在第i個(gè)幀中的第j個(gè)頻帶的塊,并且在每個(gè)塊B(i,j)中的頻譜系數(shù)的數(shù)量是相同的。
現(xiàn)在更詳細(xì)地說(shuō)明圖4所示的使用TF帶表的TFBR方法。
根據(jù)本發(fā)明的TFBR方法使用在幀之間的時(shí)間相關(guān)和在頻帶之間的頻譜類(lèi)似性。而且,本發(fā)明使用這樣的事實(shí),即塊B(i,j)具有與在先面的塊中的一個(gè)塊的值類(lèi)似的值。這是基于下面的事實(shí)。
1.在一個(gè)信號(hào)中的高頻部分的頻譜和低頻部分的頻譜具有固有的類(lèi)似性。
2.雖然每個(gè)幀的整個(gè)頻譜是不同的,但是當(dāng)前幀的頻譜的部分與前一個(gè)幀的頻譜的部分類(lèi)似。
通過(guò)使用下面的方程1,最近相鄰塊搜索和最近相鄰塊信息產(chǎn)生單元324從在先的塊中搜索一個(gè)與當(dāng)前塊的區(qū)別最少的塊。在此,在先的塊不僅包括在當(dāng)前幀中的j個(gè)在先的塊,而且包括預(yù)定數(shù)量的在先的幀的塊。
D(i,j)={|B(i,j),Ck*B(m,n)|} (1)其中,B(m,n)表示第m個(gè)幀的第n個(gè)塊。
在此,如果第m個(gè)幀是當(dāng)前幀,則m=i,并且n=0,1,...,j-1。如果第m個(gè)幀是在先的幀,則m=i-1,i-2、i-M+1,并且n=0,1,...,N-1。Ck是一組加權(quán)系數(shù),并且k=0,1,...,K-1。
最近相鄰塊搜索和最近相鄰塊信息產(chǎn)生單元324確定是否當(dāng)前被編碼的塊B(i,j)被包括在高頻帶中。如果當(dāng)前塊B(i,j)被包括在高頻帶中,即如果j等于或大于預(yù)定的頻率jTH,則獲得最小化在B(i,j)和CkB(m,n)之間的差的m、n和k值。最小化D(i,j)的m、n和k值被分別指定為mmin、nmin和kmin。所確定的mmin、nmin被稱(chēng)為與當(dāng)前塊B(i,j)區(qū)別最少的塊的索引。
在本實(shí)施例中根據(jù)是否當(dāng)前塊B(i,j)的頻帶等于或大于門(mén)限頻率jTH、即是否在高頻帶中包括當(dāng)前塊B(i,j)來(lái)確定是否搜索最接近相鄰塊。但是,也可以根據(jù)是否在任意的頻帶和時(shí)間域中包括當(dāng)前塊來(lái)確定是否搜索最接近相鄰塊。
在方程1中使用的函數(shù)|x,y|是距離函數(shù)。在本實(shí)施例中,按照下面的方程2,所述函數(shù)表示歐幾里得距離函數(shù)。但是,有可能選擇性地使用使用加權(quán)的歐幾里得距離函數(shù)的最近相鄰分類(lèi)方法。
|x,y|=Σi=1n(xi-yi)2---(2)]]>方程2考慮了n維特征空間,并且示出在兩個(gè)點(diǎn)x=(x1,x2,x3,...,xn)和y=(y1,y2,y3,...,yn)之間的幾何距離。
最近相鄰塊搜索和最近相鄰塊信息產(chǎn)生單元324使用下面的方程3來(lái)在先一個(gè)幀的塊和當(dāng)前幀的在先的塊中搜索具有最小距離的塊。由最近相鄰塊信息產(chǎn)生單元324確定的最近相鄰塊被稱(chēng)為Bmin(mmin,nmin)。
方程1的D(i,j)是在第i、j個(gè)塊和最接近第i、j個(gè)塊的塊之間的歐幾里得距離,即在B(i,j)和Bmin(mmin,nmin)之間的歐幾里得距離。
在下面的方程3中展示了在由方程1獲得的D(i,j)值中具有最小值的Dmin(i,j)。
Dmin(i,j)=|B(i,j),Ckmin*B(mmin,nmin)|(3)比特流封裝單元330向解碼器輸出包含最接近相鄰塊的索引信息mmin,nmin和kmin的比特流,即TFBR比特流,而非塊B(i,j)的頻譜信息。在此,僅僅與小于jTH的頻帶對(duì)應(yīng)的音頻信號(hào)的一部分被編碼,并且被包括在輸出的比特流中,并且等于或大于jTH的部分不包括在比特流中。
當(dāng)在搜索最接近相鄰塊中不使用比例系數(shù)時(shí),僅僅包括索引信息mmin和nmin。
在本實(shí)施例中,在MPEG比特流中,最接近相鄰塊索引信息被包括在被稱(chēng)為輔助數(shù)據(jù)1的字段中。但是所述信息也可以選擇性地被包括在除了比特流之外的字段中。
而且,雖然在本實(shí)施例中搜索最接近相鄰塊的目標(biāo)是在先的塊,也有可能選擇性地對(duì)后面的塊搜索最接近相鄰塊。
圖5是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的音頻編碼方法的流程圖。
在步驟510中,音頻信號(hào)被輸入,并且對(duì)于輸入的時(shí)間域音頻信號(hào)執(zhí)行在現(xiàn)有技術(shù)的音頻編碼步驟中執(zhí)行的MDCT。
在步驟520中,在步驟510中進(jìn)行MDCT的數(shù)據(jù)信號(hào)被劃分為在每個(gè)幀中的N個(gè)頻率塊,并且產(chǎn)生圖4所示的時(shí)頻索引組合,即時(shí)頻帶表。雖然在本實(shí)施例中MDCT變換被用作時(shí)頻帶變換方法,但是也可以選擇性地使用其它時(shí)頻變換方法。
在步驟530中,確定當(dāng)前塊B(i,j)的頻率是否等于或大于門(mén)限頻率jTH。門(mén)限頻率jTH是用于從高頻部分區(qū)分低頻部分的門(mén)限頻率值。如果當(dāng)前塊被包括在高頻帶,則執(zhí)行步驟540,如果它包括在低頻帶中,則執(zhí)行步驟550。
雖然在本實(shí)施例中確定當(dāng)前塊B(i,j)是否被包括在高頻帶中,也可以確定是否所述塊被包括在任意的頻帶和時(shí)間域中。
在步驟540中,根據(jù)在步驟520中產(chǎn)生的時(shí)頻帶表,在當(dāng)前塊的在先塊中搜索最接近當(dāng)前塊B(i,j)的塊B(mmin,nmin),并且產(chǎn)生關(guān)于最接近相鄰塊B(mmin,nmin)的最接近相鄰塊信息。最接近相鄰塊信息包括B(mmin,nmin)的索引信息mmin,nmin。選擇性地,當(dāng)在搜索最接近的塊中使用比例系數(shù)時(shí),最接近相鄰塊信息包括比例系數(shù)kmin。
在步驟550中,在低頻帶中包括的當(dāng)前塊被編碼。
在步驟560中,一個(gè)比特流、即TFBR比特流被產(chǎn)生和輸出,所述TFBR比特流包括最接近相鄰塊信息,即最接近相鄰塊的索引信息mmin、nmin和kmin,它被產(chǎn)生來(lái)取代在步驟540中的高頻帶數(shù)據(jù)和在步驟550中編碼的當(dāng)前塊數(shù)據(jù)。
圖6是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的音頻編碼裝置的圖表。
參見(jiàn)圖6和4,現(xiàn)在說(shuō)明按照本發(fā)明的一個(gè)示范實(shí)施例的音頻編碼裝置。
根據(jù)本發(fā)明的音頻編碼裝置包括編碼單元610、TFBR單元620和比特流封裝單元630。
TFBR單元620包括TF帶表產(chǎn)生單元622、最接近相鄰塊搜索單元624和冗余塊判定單元626。
因?yàn)榫幋a單元610、TF帶表產(chǎn)生單元622、最接近相鄰塊搜索單元624和比特流封裝單元630執(zhí)行與圖3中的對(duì)應(yīng)模塊的那些相同的功能,因此將省略其詳細(xì)的說(shuō)明。
根據(jù)在最接近相鄰塊搜索單元624中發(fā)現(xiàn)的最接近相鄰塊B(mmin,nmin),冗余塊判定單元626確定當(dāng)前塊B(i,j)是否是冗余塊。
方程1的D(i,j)表示在當(dāng)前塊和最接近當(dāng)前塊的塊之間的歐幾里得距離,即在B(i,j)和Bmin(mmin,nmin)之間的歐幾里得距離。
在下面的方程3中展示了具有由方程1獲得的D(i,j)值中的最小值的Dmin(i,j)。
Dmin(i,j)=|B(i,j),Ckmin*B(mmin,nmin)|(3)如果Dmin(i,j)小于門(mén)限Tj,則冗余塊判定單元626確定當(dāng)前塊B(i,j)是冗余塊,并且向比特流封裝單元630發(fā)送在最接近相鄰塊搜索單元624中確定的最接近相鄰塊的索引信息mmin,nmin和kmin。在此,門(mén)限Tj是在頻帶j中的門(mén)限,并且是實(shí)驗(yàn)確定的值。在本實(shí)施例中,在MPEG比特流中,在輔助數(shù)據(jù)1字段中包括最接近相鄰塊索引信息。但是,所述信息也可以選擇性地被包括在除了所述比特流之外的字段中。
比特流封裝單元630使用由冗余塊判定單元626發(fā)送的最接近相鄰塊索引信息來(lái)向解碼器輸出包含最接近相鄰塊索引信息mmin、nmin和kmin的比特流、即TFBR比特流,以取代關(guān)于當(dāng)前塊B(i,j)的頻譜信息。
圖7是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的由音頻編碼方法執(zhí)行的步驟的流程圖。
在步驟710中,對(duì)于輸入的時(shí)間域音頻信號(hào)執(zhí)行諸如在現(xiàn)有技術(shù)音頻編碼步驟中執(zhí)行的MDCT的時(shí)頻變換。
在步驟720中,在步驟710中被MDCT變換的數(shù)據(jù)信號(hào)被劃分為在每個(gè)幀中的N個(gè)頻率塊,并且產(chǎn)生圖4所示的時(shí)頻索引組合、即時(shí)頻帶表。雖然在本實(shí)施例中MDCT變換被用作時(shí)頻帶變換方法,但是也可以選擇性地使用其它的時(shí)頻變換方法。
在步驟730中,根據(jù)在步驟720中產(chǎn)生的TF帶表,搜索當(dāng)前塊的在先塊,并且確定最接近當(dāng)前塊B(i,j)的塊(mmin,nmin)。
在步驟740中,通過(guò)比較Dmin(i,j)和門(mén)限Tj,確定當(dāng)前塊是否是冗余塊,其中,所述Dmin(i,j)是在當(dāng)前塊B(i,j)和最接近相鄰塊B(mmin,nmin)之間的、由方程3獲得的距離。如果Dmin(i,j)小于門(mén)限Tj,則執(zhí)行步驟750。如果Dmin(i,j)大于門(mén)限Tj,則執(zhí)行步驟760。
在步驟750中,確定當(dāng)前塊是否是冗余塊,并且產(chǎn)生最接近相鄰塊信息。而且,包含最接近相鄰塊的索引信息mmin和nmin的比特流、即TFBR比特流而不是當(dāng)前塊B(i,j)的頻譜信息被產(chǎn)生和輸出。選擇性地,當(dāng)在搜索最接近相鄰塊中使用比例系數(shù)時(shí),最接近相鄰塊信息包括比例系數(shù)kmin。
在步驟760中,確定當(dāng)前塊是正常塊,并且其中插入當(dāng)前塊數(shù)據(jù)的比特流被產(chǎn)生和輸出。
圖8是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的音頻解碼裝置的圖表。
圖8所示的音頻解碼裝置800包括比特流去封裝單元810和TFBR解碼器820。TFBR解碼器820包括解碼單元822和冗余塊重建單元824。
比特流去封裝單元810從輸入的TFBR比特流提取TFBR參數(shù)。被提取的TFBR參數(shù)被輸入到冗余塊重建單元824,并且剩余的數(shù)據(jù)被輸入到解碼單元822。
如果當(dāng)前塊B(i,j)是通常(normal)的塊,則解碼單元822執(zhí)行通常的音頻解碼處理。因?yàn)樾纬山獯a單元822的模塊執(zhí)行與普通解碼器的那些相同的功能,因此將省略其詳細(xì)說(shuō)明。
根據(jù)被解碼的通常塊數(shù)據(jù)和從冗余塊重建單元824輸入的冗余塊數(shù)據(jù),解碼單元822產(chǎn)生如圖4所示的TF帶表。
利用從比特流去封裝單元810輸入的TFBR參數(shù),即基于冗余塊的最接近相鄰塊的索引mmin和nmin產(chǎn)生的TF帶表,冗余塊重建單元824大致地重建冗余塊。如果當(dāng)TFBR編碼器單元產(chǎn)生TFBR參數(shù)時(shí)使用比例系數(shù)kmin,則當(dāng)重建冗余塊時(shí)根據(jù)比例系數(shù)kmin來(lái)調(diào)整最接近相鄰塊的比例。
如果所述冗余塊的最接近相鄰塊、即期望被引用以便大致地重建所述冗余塊的最接近相鄰塊是一個(gè)冗余塊,則由最接近相鄰塊引用的塊被用于重建所述冗余塊。
在冗余塊重建單元824中被大致重建的冗余塊數(shù)據(jù)被輸入到解碼單元822。
利用從冗余塊重建單元824輸入的冗余塊數(shù)據(jù),解碼單元822重建整個(gè)頻譜,并且產(chǎn)生輸出音頻信號(hào)。利用輸入的冗余塊數(shù)據(jù),解碼單元822更新TF帶表,并且當(dāng)重建下一個(gè)冗余塊數(shù)據(jù)時(shí)使用所述表。
圖9是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的由解碼方法執(zhí)行的步驟的流程圖。
在步驟910,從編碼器發(fā)送的TFBR比特流被去封裝,并且提取TFBR參數(shù)。
在步驟920,根據(jù)所提取的TFBR參數(shù),確定當(dāng)前期望被解碼的塊B(i,j)是否是一個(gè)冗余塊。在本實(shí)施例中,如果與當(dāng)前塊B(i,j)對(duì)應(yīng)的TFBR參數(shù)存在,則確定當(dāng)前塊B(i,j)是冗余塊。如果確定當(dāng)前塊是冗余塊,則執(zhí)行步驟930,如果當(dāng)前塊不是冗余塊,則執(zhí)行步驟940。
在步驟930,根據(jù)TFBR參數(shù),即冗余塊的最接近相鄰塊的索引mmin和nmin,重建冗余塊。而且,如果在TFBR參數(shù)中包括比例系數(shù)kmin,則根據(jù)比例系數(shù)kmin來(lái)調(diào)整最接近相鄰塊的比例。
在步驟940,確定當(dāng)前塊B(i,j)是通常的塊并且執(zhí)行解碼。而且,在步驟940,根據(jù)在步驟930重建的冗余塊數(shù)據(jù)和解碼的塊數(shù)據(jù),產(chǎn)生圖4所示的TF帶表。
在步驟950,根據(jù)在步驟940解碼的通常塊數(shù)據(jù)和在步驟930重建的冗余塊數(shù)據(jù),重建頻譜,并且根據(jù)所述頻譜來(lái)產(chǎn)生輸出音頻信號(hào)。
圖10是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的解碼裝置的圖表。
圖10所示的音頻解碼裝置1000包括比特流去封裝單元1010、解碼單元1020和后處理單元1030。
比特流去封裝單元1010接收在圖3的比特流封裝單元330中產(chǎn)生的TFBR比特流,并且從所述比特流提取TFBR參數(shù)。被提取的TFBR參數(shù)被輸入到后處理單元1030。
解碼單元1020解碼對(duì)應(yīng)于由諸如MP3編碼器的一般音頻編碼器發(fā)送的低頻部分的比特流,并且將此發(fā)送到后處理單元1030。
根據(jù)從解碼單元1020輸入的解碼的低頻部分?jǐn)?shù)據(jù),后處理單元1030產(chǎn)生圖4所示的TF帶表,并且根據(jù)從比特流去封裝單元1010輸入的TFBR參數(shù)mmin和nmin,重建與高頻部分對(duì)應(yīng)的數(shù)據(jù)塊。在此,如果在TFBR參數(shù)中包括比例系數(shù)kmin,則根據(jù)比例系數(shù)kmin來(lái)調(diào)整比例。
而且,根據(jù)重建的高頻塊數(shù)據(jù),更新先前產(chǎn)生的TF帶表。當(dāng)重建下一個(gè)高頻部分塊時(shí)使用被更新的TF帶表。
結(jié)果,因?yàn)門(mén)FBR參數(shù)mmin、nmin和kmin與原始?jí)K信息的尺寸相比較具有小得多的尺寸,因此使用很小數(shù)量附加比特。于是,在保持現(xiàn)有的發(fā)送比特率的同時(shí),可以有效地改善聲音質(zhì)量。
在本實(shí)施例中,示出當(dāng)不發(fā)送高頻部分?jǐn)?shù)據(jù)時(shí),使用TFBR參數(shù)來(lái)恢復(fù)高頻部分?jǐn)?shù)據(jù)。然而,本發(fā)明也可以被選擇性地應(yīng)用到任意的頻帶和不發(fā)送的幀上。
圖11是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的由解碼方法執(zhí)行的步驟的流程圖。
在步驟1110,TFBR比特流被去封裝,并且提取TFBR參數(shù)。
在步驟1120,輸入的低頻帶塊數(shù)據(jù)被解碼,并且產(chǎn)生與低頻部分對(duì)應(yīng)的頻譜。在本實(shí)施例中,假定輸入的比特流僅僅包括低頻帶數(shù)據(jù)。但是,本發(fā)明也可以被選擇性地應(yīng)用于包含任何其它頻帶的數(shù)據(jù)的比特流上。
在步驟1130,根據(jù)在步驟1120中解碼的低頻部分?jǐn)?shù)據(jù),產(chǎn)生如圖4所示的TF帶表,并且根據(jù)在步驟1110中提取的TFBR參數(shù)mmin和nmin以及在步驟1120中解碼的低頻塊,重建對(duì)應(yīng)于高頻部分的數(shù)據(jù)塊。在此,如果在輸入的TFBR參數(shù)中包括比例系數(shù)kmin,則根據(jù)比例系數(shù)kmin調(diào)整所述比例。
在步驟1140,通過(guò)使用在步驟1120中解碼的低頻部分的塊和在步驟1130中重建的高頻部分的塊,重建整個(gè)頻譜。而且,根據(jù)重建的高頻部分塊數(shù)據(jù),更新TF帶表。當(dāng)重建下一個(gè)高頻部分塊時(shí)使用被更新的TF帶表。
本發(fā)明不限于上述的示范實(shí)施例,顯然本領(lǐng)域內(nèi)的技術(shù)人員可以在本發(fā)明的精神和范圍內(nèi)進(jìn)行改變和修改。具體上,本發(fā)明不僅可以被應(yīng)用于MPEG-1層3,而且可以被應(yīng)用于所有的音頻編碼裝置和方法,諸如MPEG-2AAC、MPEG-4和WMA上。
本發(fā)明可以在計(jì)算機(jī)可讀記錄介質(zhì)上以由計(jì)算機(jī)可以讀取的代碼來(lái)實(shí)現(xiàn),。所述計(jì)算機(jī)可讀記錄介質(zhì)包括所有種類(lèi)的存儲(chǔ)了計(jì)算機(jī)可讀數(shù)據(jù)的記錄裝置。計(jì)算機(jī)可讀記錄媒體包括存儲(chǔ)媒體,諸如磁存儲(chǔ)媒體(例如ROM、軟盤(pán)、硬盤(pán)等)、光可讀媒體(例如CD-ROM、DVD等)和載波(例如通過(guò)因特網(wǎng)發(fā)送)。而且,計(jì)算機(jī)可讀記錄媒體可以被散布在通過(guò)網(wǎng)絡(luò)連接的計(jì)算機(jī)系統(tǒng)上,并且可以以分布的方式來(lái)存儲(chǔ)和執(zhí)行計(jì)算機(jī)可讀代碼。
通過(guò)使用上述的根據(jù)本發(fā)明的先進(jìn)編碼和解碼方法和裝置,與現(xiàn)有技術(shù)的音頻編碼解碼器相比較,可以降低傳輸比特率而不降低聲音質(zhì)量,并且可以改善聲音質(zhì)量而不提高傳輸比特率。
權(quán)利要求
1.一種數(shù)字音頻信號(hào)編碼方法,包括(a)根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表;(b)根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊,并且產(chǎn)生關(guān)于所述最接近相鄰塊的信息;(c)產(chǎn)生包括所產(chǎn)生的關(guān)于最接近相鄰塊的信息的比特流。
2.如權(quán)利要求1所述的方法,其中,在步驟(b)當(dāng)前被編碼的塊的頻率等于或大于門(mén)限頻率,并且在步驟(c)中產(chǎn)生的比特流包括關(guān)于低于門(mén)限頻率的頻帶中包括的塊的塊信息以及在等于或高于門(mén)限頻率的頻帶中包括的塊的最接近相鄰塊信息。
3.如權(quán)利要求1所述的方法,其中,所述最接近相鄰塊信息是在時(shí)頻帶表中被搜索的最接近相鄰塊的索引信息。
4.如權(quán)利要求1所述的方法,其中,在步驟(b)中最接近相鄰塊的搜索范圍包括在當(dāng)前被編碼的塊之前的塊。
5.如權(quán)利要求1所述的方法,其中,在步驟(b)中,根據(jù)在當(dāng)前塊和目標(biāo)塊之間的歐幾里得距離來(lái)確定最接近相鄰塊。
6.如權(quán)利要求1所述的方法,其中,最接近相鄰塊信息包括比例系數(shù)信息。
7.一種數(shù)字音頻信號(hào)編碼方法,包括(a)根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表;(b)根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊;(c)根據(jù)被搜索的最近相鄰塊來(lái)確定當(dāng)前被編碼的塊是否是冗余塊;(d)根據(jù)在步驟(c)確定的結(jié)果來(lái)產(chǎn)生輸出比特流。
8.如權(quán)利要求7所述的方法,其中,如果在步驟(c)確定當(dāng)前被編碼的塊是冗余塊,則在步驟(c)中產(chǎn)生的比特流包括關(guān)于在步驟(b)中被搜索的最接近相鄰塊的最接近相鄰塊信息,而不是當(dāng)前塊信息。
9.如權(quán)利要求8所述的方法,其中,最接近相鄰塊信息是最接近相鄰塊的索引信息,它在時(shí)頻帶表中被搜索。
10.如權(quán)利要求7所述的方法,其中,如果在步驟(c)確定當(dāng)前被編碼的塊不是冗余塊,則在步驟(d)產(chǎn)生的比特流包括當(dāng)前塊信息。
11.如權(quán)利要求7所述的方法,其中,在步驟(b)中最接近相鄰塊的搜索范圍包括在當(dāng)前被編碼的塊之前的塊。
12.如權(quán)利要求7所述的方法,其中,在步驟(b)中,根據(jù)在當(dāng)前塊和目標(biāo)塊之間的歐幾里得距離來(lái)確定最接近相鄰塊。
13.如權(quán)利要求7所述的方法,其中,最接近相鄰塊信息包括比例系數(shù)信息。
14.一種數(shù)字音頻信號(hào)編碼裝置,包括時(shí)頻帶表產(chǎn)生單元,它根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表;最近相鄰塊搜索和最接近相鄰塊信息產(chǎn)生單元,它根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊,并且產(chǎn)生關(guān)于所述最接近相鄰塊的信息;比特流封裝單元,它產(chǎn)生包含所產(chǎn)生的關(guān)于最接近相鄰塊的信息的比特流。
15.如權(quán)利要求14所述的裝置,其中,當(dāng)前被編碼的塊的頻率等于或大于門(mén)限頻率,并且比特流封裝單元產(chǎn)生包括關(guān)于低于門(mén)限頻率的頻帶中包括的塊的塊信息以及在等于或高于門(mén)限頻率的頻帶中包括的塊的最接近相鄰塊信息。
16.如權(quán)利要求14所述的裝置,其中,最接近相鄰塊信息是最接近相鄰塊的索引信息,它在時(shí)頻帶表中被搜索。
17.一種數(shù)字音頻信號(hào)編碼裝置,包括時(shí)頻帶表產(chǎn)生單元,它根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表;最近相鄰塊搜索單元,它根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊;冗余塊判定單元,它根據(jù)最近相鄰塊來(lái)確定當(dāng)前被編碼的塊是否是冗余塊;比特流產(chǎn)生單元,它根據(jù)在冗余塊判定單元中確定的結(jié)果來(lái)產(chǎn)生輸出比特流。
18.如權(quán)利要求17所述的裝置,其中,如果冗余塊判定單元確定當(dāng)前被編碼的塊是冗余塊,則比特流產(chǎn)生單元在輸出比特流中包括關(guān)于在最接近相鄰塊搜索單元中被搜索的最接近相鄰塊的信息,而非當(dāng)前塊信息。
19.如權(quán)利要求17所述的裝置,其中,如果冗余判定單元確定當(dāng)前被編碼的塊不是冗余塊,則比特流產(chǎn)生單元在輸出比特流中包括當(dāng)前塊信息。
20.如權(quán)利要求18所述的裝置,其中,最接近相鄰塊信息是最接近相鄰塊的索引信息,它在時(shí)頻帶表中被搜索。
21.一種解碼方法,用于解碼包含關(guān)于音頻信號(hào)的預(yù)定區(qū)域的附加信息的音頻信號(hào),包括(a)從輸入的音頻比特流解碼不包括在預(yù)定區(qū)域中的塊;(b)根據(jù)解碼的塊數(shù)據(jù)來(lái)產(chǎn)生與所述預(yù)定區(qū)域?qū)?yīng)的時(shí)頻帶表;(c)根據(jù)關(guān)于音頻信號(hào)的所述預(yù)定區(qū)域的附加信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建在所述預(yù)定區(qū)域中包括的當(dāng)前塊。
22.如權(quán)利要求21所述的方法,其中,附加信息包括關(guān)于在預(yù)定區(qū)域中的當(dāng)前塊的最接近相鄰塊的索引信息。
23.如權(quán)利要求21所述的方法,其中,預(yù)定區(qū)域是高頻區(qū)域。
24.如權(quán)利要求21所述的方法,其中,在步驟(b)產(chǎn)生的時(shí)頻帶表被在步驟(c)中重建的當(dāng)前塊更新。
25.如權(quán)利要求21所述的方法,其中,附加信息包括比例系數(shù)信息。
26.一種用于解碼數(shù)字音頻信號(hào)的解碼方法,包括(a)從輸入的音頻比特流提取最接近相鄰塊信息;(b)根據(jù)輸入的音頻比特流來(lái)產(chǎn)生時(shí)頻帶表;(c)根據(jù)所提取的最近相鄰塊信息來(lái)確定當(dāng)前被解碼的塊是否是冗余塊;(d)如果當(dāng)前被解碼的塊是冗余塊,則根據(jù)所提取的最近相鄰塊信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建冗余塊。
27.如權(quán)利要求26所述的方法,還包括使用重建的冗余塊來(lái)重建與輸入的音頻比特流對(duì)應(yīng)的整個(gè)頻譜。
28.如權(quán)利要求27所述的方法,其中,步驟(c)還包括根據(jù)重建的冗余塊來(lái)更新時(shí)頻帶表。
29.如權(quán)利要求27所述的方法,其中,最接近相鄰塊信息包括比例系數(shù)信息。
30.一種解碼裝置,用于解碼包含關(guān)于音頻信號(hào)的預(yù)定區(qū)域的附加信息的音頻信號(hào),包括解碼單元,它從輸入的音頻比特流解碼不包括在預(yù)定區(qū)域中的塊;后處理單元,它根據(jù)解碼的塊數(shù)據(jù)來(lái)產(chǎn)生與所述預(yù)定區(qū)域?qū)?yīng)的時(shí)頻帶表,并且根據(jù)關(guān)于音頻信號(hào)的所述預(yù)定區(qū)域的附加信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建在所述預(yù)定區(qū)域中包括的當(dāng)前塊。
31.如權(quán)利要求30所述的裝置,其中,附加信息包括關(guān)于在預(yù)定區(qū)域中當(dāng)前塊的最接近相鄰塊的索引信息。
32.如權(quán)利要求30所述的裝置,其中,預(yù)定區(qū)域是高頻區(qū)域。
33.如權(quán)利要求30所述的裝置,其中,所產(chǎn)生的時(shí)頻帶表被重建的當(dāng)前塊更新。
34.一種用于解碼數(shù)字音頻信號(hào)的解碼裝置,包括最近相鄰塊信息提取單元,它從輸入的音頻比特流提取最接近相鄰塊信息;時(shí)頻帶表產(chǎn)生單元,它根據(jù)輸入的音頻比特流來(lái)產(chǎn)生時(shí)頻帶表;冗余塊重建單元,它根據(jù)所提取的最近相鄰塊信息來(lái)確定當(dāng)前被解碼的塊是否是冗余塊,并且如果當(dāng)前被解碼的塊是冗余塊,則冗余塊重建單元根據(jù)所提取的最近相鄰塊信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建冗余塊。
35.如權(quán)利要求34所述的裝置,其中,冗余塊重建單元使用重建的冗余塊來(lái)重建與輸入的音頻比特流對(duì)應(yīng)的整個(gè)頻譜。
36.如權(quán)利要求35所述的裝置,其中,時(shí)頻帶表產(chǎn)生單元根據(jù)重建冗余塊來(lái)更新時(shí)頻帶表。
全文摘要
本發(fā)明提供了一種先進(jìn)數(shù)字音頻編碼和/或解碼方法和裝置。所述數(shù)字音頻編碼方法涉及(a)根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表;(b)根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊,并且產(chǎn)生關(guān)于被搜索的最接近相鄰塊信息;(c)產(chǎn)生包含所產(chǎn)生的關(guān)于最接近相鄰塊信息的比特流。
文檔編號(hào)G10L21/00GK1510661SQ20031012371
公開(kāi)日2004年7月7日 申請(qǐng)日期2003年12月23日 優(yōu)先權(quán)日2002年12月23日
發(fā)明者馬修·馬努, 張基錫, 馬修 馬努 申請(qǐng)人:三星電子株式會(huì)社