使用時(shí)間頻率相關(guān)編碼和/或解碼數(shù)字音頻的方法及裝置的制作方法

文檔序號(hào)：2821230閱讀：301來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng)：使用時(shí)間頻率相關(guān)編碼和/或解碼數(shù)字音頻的方法及裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種數(shù)字音頻編碼和/或解碼方法以及執(zhí)行所述方法的裝置，具體而言，本發(fā)明涉及用于通過(guò)使用音頻信號(hào)的時(shí)頻相關(guān)來(lái)改善現(xiàn)有技術(shù)的編碼和解碼裝置的音頻編碼和/或解碼方法及其裝置。
背景技術(shù)：
音頻編碼器和解碼器、即音頻編碼解碼器被廣泛地使用，因?yàn)樗鼈兪沟糜脩?hù)能夠以較低的比特率通過(guò)因特網(wǎng)來(lái)發(fā)送音樂(lè)文件。在音頻編碼解碼器中，用于通過(guò)因特網(wǎng)共享音樂(lè)文件和在便攜音頻播放器中播放音樂(lè)文件的MP3編碼解碼器已經(jīng)變得標(biāo)準(zhǔn)。在因特網(wǎng)上可以獲得的MP3音樂(lè)文件和共享MP3音樂(lè)文件的用戶(hù)的數(shù)量以指數(shù)增長(zhǎng)。
在音頻編碼領(lǐng)域中，已經(jīng)進(jìn)行了大量的研究和開(kāi)發(fā)，以便實(shí)現(xiàn)可以以低比特率壓縮音頻信號(hào)并且同時(shí)保持原始的聲音質(zhì)量的音頻編碼解碼器。這些音頻編碼解碼器包括運(yùn)動(dòng)圖像專(zhuān)家組(MPEG)-1層3、MPEG-2先進(jìn)音頻編碼(AAC)、MPEG-4和窗口媒體音頻(WMA)。
圖1是現(xiàn)有技術(shù)的MPEG音頻編碼裝置的方框圖。在此，將作為示例來(lái)說(shuō)明MPEG-1層3音頻編碼器、即MP3音頻編碼器。
MP3音頻編碼器包括濾波器組110、快速傅立葉變換(FFT)單元120、音質(zhì)模型單元130、修改的離散余弦變換(MDCT)單元140和量化和霍夫曼編碼單元150。
濾波器組110將輸入的時(shí)間域音頻信號(hào)劃分為32個(gè)頻域副帶，以便去除音頻信號(hào)的統(tǒng)計(jì)冗余。
FFT單元120將輸入的音頻信號(hào)轉(zhuǎn)換為頻域頻譜，并且將所述頻譜輸出到音質(zhì)模型單元130。
為了使用從FFT單元120輸出的頻譜去除由人的聽(tīng)覺(jué)的特性導(dǎo)致的知覺(jué)冗余(perceptual redundancy)，音質(zhì)模型單元130確定對(duì)于每個(gè)副帶的掩蔽門(mén)限(masking threshold)，它是人不能感知到的噪音水平，即信號(hào)對(duì)掩蔽的比(SMR)。在音質(zhì)模型單元130中確定的SMR值被輸入到量化和霍夫曼編碼單元150。
而且，音質(zhì)模型單元130通過(guò)計(jì)算感知能量(perceptual energy)來(lái)確定是否切換一個(gè)窗口，并且向MDCT單元140輸出窗口轉(zhuǎn)換信息。
為了提高頻率分辨率，MDCT單元140使用從音質(zhì)模型單元130輸入的窗口切換信息將在濾波器組110中被劃分的副帶劃分為更細(xì)的頻帶。
根據(jù)從MDCT單元140輸入的SMR值，量化和霍夫曼編碼單元150通過(guò)執(zhí)行用于去除感知冗余的比特分配和用于音頻信號(hào)編碼的量化來(lái)處理在MDCT變換后從MDCT單元140輸入的頻域數(shù)據(jù)。
圖1所示的使用音質(zhì)模型的音頻編碼方法被公開(kāi)在美國(guó)專(zhuān)利第6,092,041中。因?yàn)橹T如圖1所示的MP3編碼器的音頻編碼解碼器以低比特率來(lái)執(zhí)行編碼和解碼，因此降低了輸出音頻質(zhì)量。

發(fā)明內(nèi)容
本發(fā)明提供了一種音頻編碼方法和裝置，通過(guò)它改善現(xiàn)有技術(shù)編碼裝置的性能以便以較低的比特率來(lái)提供較好的聲音質(zhì)量。
本發(fā)明也提供了一種音頻解碼方法和裝置，通過(guò)它改善現(xiàn)有技術(shù)解碼裝置的性能以便以較低的比特率來(lái)提供較好的聲音質(zhì)量。
按照本發(fā)明的一個(gè)方面，提供了一種數(shù)字音頻信號(hào)編碼方法，包括(a)根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表；(b)根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊，并且產(chǎn)生關(guān)于所述最接近相鄰塊的信息；(c)產(chǎn)生包括所產(chǎn)生的關(guān)于最接近相鄰塊的信息的比特流。
按照本發(fā)明的另一個(gè)方面，提供了一種數(shù)字音頻信號(hào)編碼方法，包括(a)根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表；(b)根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊；(c)根據(jù)被搜索的最近相鄰塊來(lái)確定是否當(dāng)前被編碼的塊是冗余塊；(d)根據(jù)在步驟(c)確定的結(jié)果來(lái)產(chǎn)生輸出比特流。
按照本發(fā)明的另一個(gè)方面，提供了一種數(shù)字音頻信號(hào)編碼裝置，包括時(shí)頻帶表產(chǎn)生單元，它根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表；最近相鄰塊搜索和最接近相鄰塊信息產(chǎn)生單元，它根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊，并且產(chǎn)生關(guān)于所述最接近相鄰塊的信息；比特流封裝單元，它產(chǎn)生包括所產(chǎn)生的關(guān)于最接近相鄰塊的信息的比特流。
按照本發(fā)明的另一個(gè)方面，提供了一種數(shù)字音頻信號(hào)編碼裝置，包括時(shí)頻帶表產(chǎn)生單元，它根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表；最近相鄰塊搜索單元，它根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊；冗余塊判定單元，它根據(jù)最近相鄰塊來(lái)確定是否當(dāng)前被編碼的塊是冗余塊；比特流產(chǎn)生單元，它根據(jù)在在冗余塊判定單元中確定的結(jié)果來(lái)產(chǎn)生輸出比特流。
按照本發(fā)明的另一個(gè)方面，提供了一種解碼方法，用于解碼包含關(guān)于音頻信號(hào)的預(yù)定區(qū)域的附加信息的音頻信號(hào)，包括(a)從輸入的音頻比特流解碼不包括在預(yù)定區(qū)域中的塊；(b)根據(jù)解碼的塊數(shù)據(jù)來(lái)產(chǎn)生與所述預(yù)定區(qū)域?qū)?yīng)的時(shí)頻帶表；(c)根據(jù)關(guān)于音頻信號(hào)的所述預(yù)定區(qū)域的附加信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建在所述預(yù)定區(qū)域中包括的當(dāng)前塊。
按照本發(fā)明的另一個(gè)方面，提供了一種用于解碼數(shù)字音頻信號(hào)的解碼方法，包括(a)從輸入的音頻比特流提取最接近相鄰塊信息；(b)根據(jù)輸入的音頻比特流來(lái)產(chǎn)生時(shí)頻帶表；(c)根據(jù)所提取的最近相鄰塊信息來(lái)確定是否當(dāng)前被解碼的塊是冗余塊；(d)如果當(dāng)前被解碼的塊是冗余塊，則根據(jù)所提取的最近相鄰塊信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建冗余塊。
所述方法也可以包括使用重建的冗余塊來(lái)重建與輸入的音頻比特流相對(duì)應(yīng)的整個(gè)頻譜。
按照本發(fā)明的一個(gè)方面，提供了一種解碼裝置，用于解碼包含關(guān)于音頻信號(hào)的預(yù)定區(qū)域的附加信息的音頻信號(hào)，包括解碼單元，它從輸入的音頻比特流解碼不包括在預(yù)定區(qū)域中的塊；后處理單元，它根據(jù)解碼的塊數(shù)據(jù)來(lái)產(chǎn)生與所述預(yù)定區(qū)域?qū)?yīng)的時(shí)頻帶表，并且根據(jù)關(guān)于音頻信號(hào)的所述預(yù)定區(qū)域的附加信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建在所述預(yù)定區(qū)域中包括的當(dāng)前塊。
按照本發(fā)明的另一個(gè)方面，提供了一種用于解碼數(shù)字音頻信號(hào)的解碼裝置，包括最近相鄰塊信息提取單元，它從輸入的音頻比特流提取最接近相鄰塊信息；時(shí)頻帶表產(chǎn)生單元，它根據(jù)輸入的音頻比特流來(lái)產(chǎn)生時(shí)頻帶表；冗余塊重建單元，它根據(jù)所提取的最近相鄰塊信息來(lái)確定是否當(dāng)前被解碼的塊是冗余塊，并且如果當(dāng)前被解碼的塊是冗余塊，則冗余塊重建單元根據(jù)所提取的最近相鄰塊信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建冗余塊。

通過(guò)參照附圖詳細(xì)說(shuō)明本發(fā)明的示范實(shí)施例，本發(fā)明的上述目的和優(yōu)點(diǎn)將會(huì)變得更加清楚，其中圖1是現(xiàn)有技術(shù)的MPEG音頻編碼裝置的方框圖；圖2是用于說(shuō)明譜帶復(fù)制方法的圖；圖3是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的編碼裝置的圖表；圖4是示出在本發(fā)明中使用的時(shí)頻帶表的圖表；圖5是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的由編碼方法執(zhí)行的步驟的流程圖；圖6是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的編碼裝置的圖表；圖7是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的由編碼方法執(zhí)行的本發(fā)明的流程圖；圖8是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的解碼裝置的圖表；圖9是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的由解碼方法執(zhí)行的步驟的流程圖；圖10是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的解碼裝置的圖表；圖11是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的由解碼方法執(zhí)行的步驟的流程圖。
具體實(shí)施例方式
語(yǔ)音編碼解碼器和視頻編碼解碼器使用在信號(hào)采樣之間的時(shí)間相關(guān)以便壓縮數(shù)據(jù)。語(yǔ)音編碼解碼器使用線(xiàn)性預(yù)測(cè)系數(shù)方法來(lái)執(zhí)行壓縮。同時(shí)，視頻編碼解碼器使用運(yùn)動(dòng)測(cè)量來(lái)執(zhí)行時(shí)間相關(guān)。
一般，使用時(shí)間相關(guān)來(lái)壓縮數(shù)據(jù)不適合于音頻編碼解碼器，因?yàn)橐纛l信號(hào)的特性是動(dòng)態(tài)的，并且具有較少的時(shí)間相關(guān)。但是，在頻率變換域中，每個(gè)副帶數(shù)據(jù)信號(hào)與在時(shí)間域中的那些相比較實(shí)質(zhì)上是靜態(tài)的。因此，在頻率變換域中使用利用在幀之間的相關(guān)的線(xiàn)性預(yù)測(cè)方法。
例如，為了獲得較好的壓縮比，MPEG-2 AAC對(duì)于每個(gè)變換系數(shù)執(zhí)行線(xiàn)性預(yù)測(cè)。而且，為了去除長(zhǎng)期的周期性，MPEG-4 AAC使用與線(xiàn)性預(yù)測(cè)方法類(lèi)似的長(zhǎng)期預(yù)測(cè)器。
參見(jiàn)圖2，現(xiàn)在說(shuō)明利用頻譜系數(shù)的類(lèi)似性的譜帶復(fù)制(SBR)方法。
SBR方法通過(guò)提高(increasing)在給定比特率的音頻帶或通過(guò)改善在給定的質(zhì)量水平的編碼效率來(lái)改善在地比特率的音頻和語(yǔ)音編碼解碼器的性能。
按照?qǐng)D2所示的SBR方法，編碼器不編碼頻譜的高頻部分，而僅僅編碼低頻部分，然后發(fā)送信號(hào)，然后，當(dāng)解碼信號(hào)時(shí)，根據(jù)低頻部分的頻譜來(lái)重建未發(fā)送的高頻部分。
例如，在現(xiàn)有技術(shù)的編碼方法中，使用SBR方法的MP3編碼器編碼音樂(lè)信號(hào)的從0到8kHz部分。其中，僅僅編碼從0到8kHz部分的MP3文件可以由現(xiàn)有技術(shù)解碼器來(lái)解碼。因此，SBR方法與現(xiàn)有技術(shù)的MP3兼容。在SBR方法中，為了重建高頻部分，即從8kHz到16kHz的部分，使用頻譜的諧波結(jié)構(gòu)，并且使用從0到8kHz的解碼的信號(hào)。
當(dāng)使用SBR方法時(shí)，由使用現(xiàn)有技術(shù)感知編碼方法的編碼解碼器以低比特率提供的窄音頻帶寬可以被擴(kuò)展，以便可以提供模擬FM音頻帶寬或更大。而且，SBR方法改善窄帶語(yǔ)音編碼解碼器的性能，并且例如有可能提供具有在多語(yǔ)言廣播中使用的12kHz音頻帶寬的專(zhuān)用語(yǔ)音信道。
雖然在編碼器中部分地處理用于指導(dǎo)解碼處理的附加編碼器信息，但是SBR方法的多數(shù)步驟在解碼器中執(zhí)行。
從技術(shù)的角度來(lái)看，SBR是用于在音頻壓縮算法中有效地編碼高頻信號(hào)的方法。采用SBR方法的編碼裝置僅僅發(fā)送頻譜的低頻部分。在SBR解碼器中的解碼處理中產(chǎn)生被省略的高頻部分。取代發(fā)送高頻部分，采用SBR方法的解碼器分析由編碼器發(fā)送的低頻部分的頻譜，并且重建高頻部分。
為了保證高頻部分的精確重建，一些指導(dǎo)信息作為以低數(shù)據(jù)率編碼的比特流被發(fā)送。結(jié)果，SBR方法使得音頻信號(hào)的整個(gè)頻帶能夠以很低的數(shù)據(jù)率被編碼，并且同時(shí)與現(xiàn)有技術(shù)的MP3編碼器相比較提供了大大改善的壓縮效率。
因此，LPC算法使用時(shí)間相關(guān)，而SBR算法使用信號(hào)的頻率相關(guān)。
根據(jù)本發(fā)明的算法同時(shí)使用音頻信號(hào)的時(shí)間和頻率相關(guān)性。參見(jiàn)圖3-11，現(xiàn)在說(shuō)明根據(jù)本發(fā)明的示范實(shí)施例。
圖3是本發(fā)明的一個(gè)示范實(shí)施例的圖表。
參見(jiàn)圖3和4，現(xiàn)在說(shuō)明按照本發(fā)明的一個(gè)示范實(shí)施例的音頻編碼方法。
根據(jù)本發(fā)明的的編碼裝置包括編碼單元310、時(shí)間幀帶復(fù)制(TFBR)單元320和比特流封裝單元330。
編碼單元310執(zhí)行與現(xiàn)有技術(shù)的音頻編碼器、即圖1所示的音頻編碼器類(lèi)似的功能。于是，省略對(duì)于編碼單元310的功能的詳細(xì)說(shuō)明。雖然圖1所示的音頻編碼器用于本實(shí)施例中，但是也可以使用其它的音頻編碼器。
TFBR單元320包括時(shí)頻帶表產(chǎn)生單元322和最近相鄰塊搜索和最近相鄰塊信息產(chǎn)生單元324。
時(shí)頻帶表產(chǎn)生單元322將在編碼單元310中MDCT變換的數(shù)據(jù)信號(hào)劃分為在每個(gè)幀中的N個(gè)頻率塊，以便產(chǎn)生圖4所示的時(shí)頻索引組合、即時(shí)頻(TF)帶表。
雖然在本實(shí)施例中MDCT變換被用作時(shí)頻變換方法，但是也可以使用其它的時(shí)頻變換方法。
在本實(shí)施例中，在編碼單元310的MDCT單元將音頻信號(hào)劃分為多個(gè)頻帶之后，每個(gè)頻帶具有多個(gè)頻譜系數(shù)。雖然在本實(shí)施例中使用具有相同寬度的頻帶，但是也可以使用具有不同寬度的頻帶。
在圖4中，i是幀索引，并且i＝0，1，2，...，j-1，j，j+1，...，N是幀的頻率塊索引。在此，i表示其中執(zhí)行編碼的一個(gè)當(dāng)前幀，i-1和i+1分別表示前一個(gè)幀和下一個(gè)幀。同時(shí)，j表示其中執(zhí)行編碼的頻帶，j＝0指示在一個(gè)幀中的第一頻帶，j也表示當(dāng)前期望被編碼的塊的頻帶。而且，j-1指示前一個(gè)頻帶。
例如，圖4的B(i，j)指示對(duì)應(yīng)于在第i個(gè)幀中的第j個(gè)頻帶的塊，并且在每個(gè)塊B(i，j)中的頻譜系數(shù)的數(shù)量是相同的。
現(xiàn)在更詳細(xì)地說(shuō)明圖4所示的使用TF帶表的TFBR方法。
根據(jù)本發(fā)明的TFBR方法使用在幀之間的時(shí)間相關(guān)和在頻帶之間的頻譜類(lèi)似性。而且，本發(fā)明使用這樣的事實(shí)，即塊B(i，j)具有與在先面的塊中的一個(gè)塊的值類(lèi)似的值。這是基于下面的事實(shí)。
1.在一個(gè)信號(hào)中的高頻部分的頻譜和低頻部分的頻譜具有固有的類(lèi)似性。
2.雖然每個(gè)幀的整個(gè)頻譜是不同的，但是當(dāng)前幀的頻譜的部分與前一個(gè)幀的頻譜的部分類(lèi)似。
通過(guò)使用下面的方程1，最近相鄰塊搜索和最近相鄰塊信息產(chǎn)生單元324從在先的塊中搜索一個(gè)與當(dāng)前塊的區(qū)別最少的塊。在此，在先的塊不僅包括在當(dāng)前幀中的j個(gè)在先的塊，而且包括預(yù)定數(shù)量的在先的幀的塊。
D(i，j)＝{|B(i，j)，Ck*B(m，n)|} (1)其中，B(m，n)表示第m個(gè)幀的第n個(gè)塊。
在此，如果第m個(gè)幀是當(dāng)前幀，則m＝i，并且n＝0，1，...，j-1。如果第m個(gè)幀是在先的幀，則m＝i-1，i-2、i-M+1，并且n＝0，1，...，N-1。Ck是一組加權(quán)系數(shù)，并且k＝0，1，...，K-1。
最近相鄰塊搜索和最近相鄰塊信息產(chǎn)生單元324確定是否當(dāng)前被編碼的塊B(i，j)被包括在高頻帶中。如果當(dāng)前塊B(i，j)被包括在高頻帶中，即如果j等于或大于預(yù)定的頻率jTH，則獲得最小化在B(i，j)和CkB(m，n)之間的差的m、n和k值。最小化D(i，j)的m、n和k值被分別指定為mmin、nmin和kmin。所確定的mmin、nmin被稱(chēng)為與當(dāng)前塊B(i，j)區(qū)別最少的塊的索引。
在本實(shí)施例中根據(jù)是否當(dāng)前塊B(i，j)的頻帶等于或大于門(mén)限頻率jTH、即是否在高頻帶中包括當(dāng)前塊B(i，j)來(lái)確定是否搜索最接近相鄰塊。但是，也可以根據(jù)是否在任意的頻帶和時(shí)間域中包括當(dāng)前塊來(lái)確定是否搜索最接近相鄰塊。
在方程1中使用的函數(shù)|x，y|是距離函數(shù)。在本實(shí)施例中，按照下面的方程2，所述函數(shù)表示歐幾里得距離函數(shù)。但是，有可能選擇性地使用使用加權(quán)的歐幾里得距離函數(shù)的最近相鄰分類(lèi)方法。
|x,y|=Σi=1n(xi-yi)2---(2)]]>方程2考慮了n維特征空間，并且示出在兩個(gè)點(diǎn)x＝(x1，x2，x3，...，xn)和y＝(y1，y2，y3，...，yn)之間的幾何距離。
最近相鄰塊搜索和最近相鄰塊信息產(chǎn)生單元324使用下面的方程3來(lái)在先一個(gè)幀的塊和當(dāng)前幀的在先的塊中搜索具有最小距離的塊。由最近相鄰塊信息產(chǎn)生單元324確定的最近相鄰塊被稱(chēng)為Bmin(mmin，nmin)。
方程1的D(i，j)是在第i、j個(gè)塊和最接近第i、j個(gè)塊的塊之間的歐幾里得距離，即在B(i，j)和Bmin(mmin，nmin)之間的歐幾里得距離。
在下面的方程3中展示了在由方程1獲得的D(i，j)值中具有最小值的Dmin(i，j)。
Dmin(i，j)＝|B(i，j)，Ckmin*B(mmin，nmin)|(3)比特流封裝單元330向解碼器輸出包含最接近相鄰塊的索引信息mmin，nmin和kmin的比特流，即TFBR比特流，而非塊B(i，j)的頻譜信息。在此，僅僅與小于jTH的頻帶對(duì)應(yīng)的音頻信號(hào)的一部分被編碼，并且被包括在輸出的比特流中，并且等于或大于jTH的部分不包括在比特流中。
當(dāng)在搜索最接近相鄰塊中不使用比例系數(shù)時(shí)，僅僅包括索引信息mmin和nmin。
在本實(shí)施例中，在MPEG比特流中，最接近相鄰塊索引信息被包括在被稱(chēng)為輔助數(shù)據(jù)1的字段中。但是所述信息也可以選擇性地被包括在除了比特流之外的字段中。
而且，雖然在本實(shí)施例中搜索最接近相鄰塊的目標(biāo)是在先的塊，也有可能選擇性地對(duì)后面的塊搜索最接近相鄰塊。
圖5是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的音頻編碼方法的流程圖。
在步驟510中，音頻信號(hào)被輸入，并且對(duì)于輸入的時(shí)間域音頻信號(hào)執(zhí)行在現(xiàn)有技術(shù)的音頻編碼步驟中執(zhí)行的MDCT。
在步驟520中，在步驟510中進(jìn)行MDCT的數(shù)據(jù)信號(hào)被劃分為在每個(gè)幀中的N個(gè)頻率塊，并且產(chǎn)生圖4所示的時(shí)頻索引組合，即時(shí)頻帶表。雖然在本實(shí)施例中MDCT變換被用作時(shí)頻帶變換方法，但是也可以選擇性地使用其它時(shí)頻變換方法。
在步驟530中，確定當(dāng)前塊B(i，j)的頻率是否等于或大于門(mén)限頻率jTH。門(mén)限頻率jTH是用于從高頻部分區(qū)分低頻部分的門(mén)限頻率值。如果當(dāng)前塊被包括在高頻帶，則執(zhí)行步驟540，如果它包括在低頻帶中，則執(zhí)行步驟550。
雖然在本實(shí)施例中確定當(dāng)前塊B(i，j)是否被包括在高頻帶中，也可以確定是否所述塊被包括在任意的頻帶和時(shí)間域中。
在步驟540中，根據(jù)在步驟520中產(chǎn)生的時(shí)頻帶表，在當(dāng)前塊的在先塊中搜索最接近當(dāng)前塊B(i，j)的塊B(mmin，nmin)，并且產(chǎn)生關(guān)于最接近相鄰塊B(mmin，nmin)的最接近相鄰塊信息。最接近相鄰塊信息包括B(mmin，nmin)的索引信息mmin，nmin。選擇性地，當(dāng)在搜索最接近的塊中使用比例系數(shù)時(shí)，最接近相鄰塊信息包括比例系數(shù)kmin。
在步驟550中，在低頻帶中包括的當(dāng)前塊被編碼。
在步驟560中，一個(gè)比特流、即TFBR比特流被產(chǎn)生和輸出，所述TFBR比特流包括最接近相鄰塊信息，即最接近相鄰塊的索引信息mmin、nmin和kmin，它被產(chǎn)生來(lái)取代在步驟540中的高頻帶數(shù)據(jù)和在步驟550中編碼的當(dāng)前塊數(shù)據(jù)。
圖6是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的音頻編碼裝置的圖表。
參見(jiàn)圖6和4，現(xiàn)在說(shuō)明按照本發(fā)明的一個(gè)示范實(shí)施例的音頻編碼裝置。
根據(jù)本發(fā)明的音頻編碼裝置包括編碼單元610、TFBR單元620和比特流封裝單元630。
TFBR單元620包括TF帶表產(chǎn)生單元622、最接近相鄰塊搜索單元624和冗余塊判定單元626。
因?yàn)榫幋a單元610、TF帶表產(chǎn)生單元622、最接近相鄰塊搜索單元624和比特流封裝單元630執(zhí)行與圖3中的對(duì)應(yīng)模塊的那些相同的功能，因此將省略其詳細(xì)的說(shuō)明。
根據(jù)在最接近相鄰塊搜索單元624中發(fā)現(xiàn)的最接近相鄰塊B(mmin，nmin)，冗余塊判定單元626確定當(dāng)前塊B(i，j)是否是冗余塊。
方程1的D(i，j)表示在當(dāng)前塊和最接近當(dāng)前塊的塊之間的歐幾里得距離，即在B(i，j)和Bmin(mmin，nmin)之間的歐幾里得距離。
在下面的方程3中展示了具有由方程1獲得的D(i，j)值中的最小值的Dmin(i，j)。
Dmin(i，j)＝|B(i，j)，Ckmin*B(mmin，nmin)|(3)如果Dmin(i，j)小于門(mén)限Tj，則冗余塊判定單元626確定當(dāng)前塊B(i，j)是冗余塊，并且向比特流封裝單元630發(fā)送在最接近相鄰塊搜索單元624中確定的最接近相鄰塊的索引信息mmin，nmin和kmin。在此，門(mén)限Tj是在頻帶j中的門(mén)限，并且是實(shí)驗(yàn)確定的值。在本實(shí)施例中，在MPEG比特流中，在輔助數(shù)據(jù)1字段中包括最接近相鄰塊索引信息。但是，所述信息也可以選擇性地被包括在除了所述比特流之外的字段中。
比特流封裝單元630使用由冗余塊判定單元626發(fā)送的最接近相鄰塊索引信息來(lái)向解碼器輸出包含最接近相鄰塊索引信息mmin、nmin和kmin的比特流、即TFBR比特流，以取代關(guān)于當(dāng)前塊B(i，j)的頻譜信息。
圖7是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的由音頻編碼方法執(zhí)行的步驟的流程圖。
在步驟710中，對(duì)于輸入的時(shí)間域音頻信號(hào)執(zhí)行諸如在現(xiàn)有技術(shù)音頻編碼步驟中執(zhí)行的MDCT的時(shí)頻變換。
在步驟720中，在步驟710中被MDCT變換的數(shù)據(jù)信號(hào)被劃分為在每個(gè)幀中的N個(gè)頻率塊，并且產(chǎn)生圖4所示的時(shí)頻索引組合、即時(shí)頻帶表。雖然在本實(shí)施例中MDCT變換被用作時(shí)頻帶變換方法，但是也可以選擇性地使用其它的時(shí)頻變換方法。
在步驟730中，根據(jù)在步驟720中產(chǎn)生的TF帶表，搜索當(dāng)前塊的在先塊，并且確定最接近當(dāng)前塊B(i，j)的塊(mmin，nmin)。
在步驟740中，通過(guò)比較Dmin(i，j)和門(mén)限Tj，確定當(dāng)前塊是否是冗余塊，其中，所述Dmin(i，j)是在當(dāng)前塊B(i，j)和最接近相鄰塊B(mmin，nmin)之間的、由方程3獲得的距離。如果Dmin(i，j)小于門(mén)限Tj，則執(zhí)行步驟750。如果Dmin(i，j)大于門(mén)限Tj，則執(zhí)行步驟760。
在步驟750中，確定當(dāng)前塊是否是冗余塊，并且產(chǎn)生最接近相鄰塊信息。而且，包含最接近相鄰塊的索引信息mmin和nmin的比特流、即TFBR比特流而不是當(dāng)前塊B(i，j)的頻譜信息被產(chǎn)生和輸出。選擇性地，當(dāng)在搜索最接近相鄰塊中使用比例系數(shù)時(shí)，最接近相鄰塊信息包括比例系數(shù)kmin。
在步驟760中，確定當(dāng)前塊是正常塊，并且其中插入當(dāng)前塊數(shù)據(jù)的比特流被產(chǎn)生和輸出。
圖8是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的音頻解碼裝置的圖表。
圖8所示的音頻解碼裝置800包括比特流去封裝單元810和TFBR解碼器820。TFBR解碼器820包括解碼單元822和冗余塊重建單元824。
比特流去封裝單元810從輸入的TFBR比特流提取TFBR參數(shù)。被提取的TFBR參數(shù)被輸入到冗余塊重建單元824，并且剩余的數(shù)據(jù)被輸入到解碼單元822。
如果當(dāng)前塊B(i，j)是通常(normal)的塊，則解碼單元822執(zhí)行通常的音頻解碼處理。因?yàn)樾纬山獯a單元822的模塊執(zhí)行與普通解碼器的那些相同的功能，因此將省略其詳細(xì)說(shuō)明。
根據(jù)被解碼的通常塊數(shù)據(jù)和從冗余塊重建單元824輸入的冗余塊數(shù)據(jù)，解碼單元822產(chǎn)生如圖4所示的TF帶表。
利用從比特流去封裝單元810輸入的TFBR參數(shù)，即基于冗余塊的最接近相鄰塊的索引mmin和nmin產(chǎn)生的TF帶表，冗余塊重建單元824大致地重建冗余塊。如果當(dāng)TFBR編碼器單元產(chǎn)生TFBR參數(shù)時(shí)使用比例系數(shù)kmin，則當(dāng)重建冗余塊時(shí)根據(jù)比例系數(shù)kmin來(lái)調(diào)整最接近相鄰塊的比例。
如果所述冗余塊的最接近相鄰塊、即期望被引用以便大致地重建所述冗余塊的最接近相鄰塊是一個(gè)冗余塊，則由最接近相鄰塊引用的塊被用于重建所述冗余塊。
在冗余塊重建單元824中被大致重建的冗余塊數(shù)據(jù)被輸入到解碼單元822。
利用從冗余塊重建單元824輸入的冗余塊數(shù)據(jù)，解碼單元822重建整個(gè)頻譜，并且產(chǎn)生輸出音頻信號(hào)。利用輸入的冗余塊數(shù)據(jù)，解碼單元822更新TF帶表，并且當(dāng)重建下一個(gè)冗余塊數(shù)據(jù)時(shí)使用所述表。
圖9是根據(jù)本發(fā)明的一個(gè)示范實(shí)施例的由解碼方法執(zhí)行的步驟的流程圖。
在步驟910，從編碼器發(fā)送的TFBR比特流被去封裝，并且提取TFBR參數(shù)。
在步驟920，根據(jù)所提取的TFBR參數(shù)，確定當(dāng)前期望被解碼的塊B(i，j)是否是一個(gè)冗余塊。在本實(shí)施例中，如果與當(dāng)前塊B(i，j)對(duì)應(yīng)的TFBR參數(shù)存在，則確定當(dāng)前塊B(i，j)是冗余塊。如果確定當(dāng)前塊是冗余塊，則執(zhí)行步驟930，如果當(dāng)前塊不是冗余塊，則執(zhí)行步驟940。
在步驟930，根據(jù)TFBR參數(shù)，即冗余塊的最接近相鄰塊的索引mmin和nmin，重建冗余塊。而且，如果在TFBR參數(shù)中包括比例系數(shù)kmin，則根據(jù)比例系數(shù)kmin來(lái)調(diào)整最接近相鄰塊的比例。
在步驟940，確定當(dāng)前塊B(i，j)是通常的塊并且執(zhí)行解碼。而且，在步驟940，根據(jù)在步驟930重建的冗余塊數(shù)據(jù)和解碼的塊數(shù)據(jù)，產(chǎn)生圖4所示的TF帶表。
在步驟950，根據(jù)在步驟940解碼的通常塊數(shù)據(jù)和在步驟930重建的冗余塊數(shù)據(jù)，重建頻譜，并且根據(jù)所述頻譜來(lái)產(chǎn)生輸出音頻信號(hào)。
圖10是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的解碼裝置的圖表。
圖10所示的音頻解碼裝置1000包括比特流去封裝單元1010、解碼單元1020和后處理單元1030。
比特流去封裝單元1010接收在圖3的比特流封裝單元330中產(chǎn)生的TFBR比特流，并且從所述比特流提取TFBR參數(shù)。被提取的TFBR參數(shù)被輸入到后處理單元1030。
解碼單元1020解碼對(duì)應(yīng)于由諸如MP3編碼器的一般音頻編碼器發(fā)送的低頻部分的比特流，并且將此發(fā)送到后處理單元1030。
根據(jù)從解碼單元1020輸入的解碼的低頻部分?jǐn)?shù)據(jù)，后處理單元1030產(chǎn)生圖4所示的TF帶表，并且根據(jù)從比特流去封裝單元1010輸入的TFBR參數(shù)mmin和nmin，重建與高頻部分對(duì)應(yīng)的數(shù)據(jù)塊。在此，如果在TFBR參數(shù)中包括比例系數(shù)kmin，則根據(jù)比例系數(shù)kmin來(lái)調(diào)整比例。
而且，根據(jù)重建的高頻塊數(shù)據(jù)，更新先前產(chǎn)生的TF帶表。當(dāng)重建下一個(gè)高頻部分塊時(shí)使用被更新的TF帶表。
結(jié)果，因?yàn)門(mén)FBR參數(shù)mmin、nmin和kmin與原始?jí)K信息的尺寸相比較具有小得多的尺寸，因此使用很小數(shù)量附加比特。于是，在保持現(xiàn)有的發(fā)送比特率的同時(shí)，可以有效地改善聲音質(zhì)量。
在本實(shí)施例中，示出當(dāng)不發(fā)送高頻部分?jǐn)?shù)據(jù)時(shí)，使用TFBR參數(shù)來(lái)恢復(fù)高頻部分?jǐn)?shù)據(jù)。然而，本發(fā)明也可以被選擇性地應(yīng)用到任意的頻帶和不發(fā)送的幀上。
圖11是根據(jù)本發(fā)明的另一個(gè)示范實(shí)施例的由解碼方法執(zhí)行的步驟的流程圖。
在步驟1110，TFBR比特流被去封裝，并且提取TFBR參數(shù)。
在步驟1120，輸入的低頻帶塊數(shù)據(jù)被解碼，并且產(chǎn)生與低頻部分對(duì)應(yīng)的頻譜。在本實(shí)施例中，假定輸入的比特流僅僅包括低頻帶數(shù)據(jù)。但是，本發(fā)明也可以被選擇性地應(yīng)用于包含任何其它頻帶的數(shù)據(jù)的比特流上。
在步驟1130，根據(jù)在步驟1120中解碼的低頻部分?jǐn)?shù)據(jù)，產(chǎn)生如圖4所示的TF帶表，并且根據(jù)在步驟1110中提取的TFBR參數(shù)mmin和nmin以及在步驟1120中解碼的低頻塊，重建對(duì)應(yīng)于高頻部分的數(shù)據(jù)塊。在此，如果在輸入的TFBR參數(shù)中包括比例系數(shù)kmin，則根據(jù)比例系數(shù)kmin調(diào)整所述比例。
在步驟1140，通過(guò)使用在步驟1120中解碼的低頻部分的塊和在步驟1130中重建的高頻部分的塊，重建整個(gè)頻譜。而且，根據(jù)重建的高頻部分塊數(shù)據(jù)，更新TF帶表。當(dāng)重建下一個(gè)高頻部分塊時(shí)使用被更新的TF帶表。
本發(fā)明不限于上述的示范實(shí)施例，顯然本領(lǐng)域內(nèi)的技術(shù)人員可以在本發(fā)明的精神和范圍內(nèi)進(jìn)行改變和修改。具體上，本發(fā)明不僅可以被應(yīng)用于MPEG-1層3，而且可以被應(yīng)用于所有的音頻編碼裝置和方法，諸如MPEG-2AAC、MPEG-4和WMA上。
本發(fā)明可以在計(jì)算機(jī)可讀記錄介質(zhì)上以由計(jì)算機(jī)可以讀取的代碼來(lái)實(shí)現(xiàn)，。所述計(jì)算機(jī)可讀記錄介質(zhì)包括所有種類(lèi)的存儲(chǔ)了計(jì)算機(jī)可讀數(shù)據(jù)的記錄裝置。計(jì)算機(jī)可讀記錄媒體包括存儲(chǔ)媒體，諸如磁存儲(chǔ)媒體(例如ROM、軟盤(pán)、硬盤(pán)等)、光可讀媒體(例如CD-ROM、DVD等)和載波(例如通過(guò)因特網(wǎng)發(fā)送)。而且，計(jì)算機(jī)可讀記錄媒體可以被散布在通過(guò)網(wǎng)絡(luò)連接的計(jì)算機(jī)系統(tǒng)上，并且可以以分布的方式來(lái)存儲(chǔ)和執(zhí)行計(jì)算機(jī)可讀代碼。
通過(guò)使用上述的根據(jù)本發(fā)明的先進(jìn)編碼和解碼方法和裝置，與現(xiàn)有技術(shù)的音頻編碼解碼器相比較，可以降低傳輸比特率而不降低聲音質(zhì)量，并且可以改善聲音質(zhì)量而不提高傳輸比特率。
權(quán)利要求
1.一種數(shù)字音頻信號(hào)編碼方法，包括(a)根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表；(b)根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊，并且產(chǎn)生關(guān)于所述最接近相鄰塊的信息；(c)產(chǎn)生包括所產(chǎn)生的關(guān)于最接近相鄰塊的信息的比特流。
2.如權(quán)利要求1所述的方法，其中，在步驟(b)當(dāng)前被編碼的塊的頻率等于或大于門(mén)限頻率，并且在步驟(c)中產(chǎn)生的比特流包括關(guān)于低于門(mén)限頻率的頻帶中包括的塊的塊信息以及在等于或高于門(mén)限頻率的頻帶中包括的塊的最接近相鄰塊信息。
3.如權(quán)利要求1所述的方法，其中，所述最接近相鄰塊信息是在時(shí)頻帶表中被搜索的最接近相鄰塊的索引信息。
4.如權(quán)利要求1所述的方法，其中，在步驟(b)中最接近相鄰塊的搜索范圍包括在當(dāng)前被編碼的塊之前的塊。
5.如權(quán)利要求1所述的方法，其中，在步驟(b)中，根據(jù)在當(dāng)前塊和目標(biāo)塊之間的歐幾里得距離來(lái)確定最接近相鄰塊。
6.如權(quán)利要求1所述的方法，其中，最接近相鄰塊信息包括比例系數(shù)信息。
7.一種數(shù)字音頻信號(hào)編碼方法，包括(a)根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表；(b)根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊；(c)根據(jù)被搜索的最近相鄰塊來(lái)確定當(dāng)前被編碼的塊是否是冗余塊；(d)根據(jù)在步驟(c)確定的結(jié)果來(lái)產(chǎn)生輸出比特流。
8.如權(quán)利要求7所述的方法，其中，如果在步驟(c)確定當(dāng)前被編碼的塊是冗余塊，則在步驟(c)中產(chǎn)生的比特流包括關(guān)于在步驟(b)中被搜索的最接近相鄰塊的最接近相鄰塊信息，而不是當(dāng)前塊信息。
9.如權(quán)利要求8所述的方法，其中，最接近相鄰塊信息是最接近相鄰塊的索引信息，它在時(shí)頻帶表中被搜索。
10.如權(quán)利要求7所述的方法，其中，如果在步驟(c)確定當(dāng)前被編碼的塊不是冗余塊，則在步驟(d)產(chǎn)生的比特流包括當(dāng)前塊信息。
11.如權(quán)利要求7所述的方法，其中，在步驟(b)中最接近相鄰塊的搜索范圍包括在當(dāng)前被編碼的塊之前的塊。
12.如權(quán)利要求7所述的方法，其中，在步驟(b)中，根據(jù)在當(dāng)前塊和目標(biāo)塊之間的歐幾里得距離來(lái)確定最接近相鄰塊。
13.如權(quán)利要求7所述的方法，其中，最接近相鄰塊信息包括比例系數(shù)信息。
14.一種數(shù)字音頻信號(hào)編碼裝置，包括時(shí)頻帶表產(chǎn)生單元，它根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表；最近相鄰塊搜索和最接近相鄰塊信息產(chǎn)生單元，它根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊，并且產(chǎn)生關(guān)于所述最接近相鄰塊的信息；比特流封裝單元，它產(chǎn)生包含所產(chǎn)生的關(guān)于最接近相鄰塊的信息的比特流。
15.如權(quán)利要求14所述的裝置，其中，當(dāng)前被編碼的塊的頻率等于或大于門(mén)限頻率，并且比特流封裝單元產(chǎn)生包括關(guān)于低于門(mén)限頻率的頻帶中包括的塊的塊信息以及在等于或高于門(mén)限頻率的頻帶中包括的塊的最接近相鄰塊信息。
16.如權(quán)利要求14所述的裝置，其中，最接近相鄰塊信息是最接近相鄰塊的索引信息，它在時(shí)頻帶表中被搜索。
17.一種數(shù)字音頻信號(hào)編碼裝置，包括時(shí)頻帶表產(chǎn)生單元，它根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表；最近相鄰塊搜索單元，它根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊；冗余塊判定單元，它根據(jù)最近相鄰塊來(lái)確定當(dāng)前被編碼的塊是否是冗余塊；比特流產(chǎn)生單元，它根據(jù)在冗余塊判定單元中確定的結(jié)果來(lái)產(chǎn)生輸出比特流。
18.如權(quán)利要求17所述的裝置，其中，如果冗余塊判定單元確定當(dāng)前被編碼的塊是冗余塊，則比特流產(chǎn)生單元在輸出比特流中包括關(guān)于在最接近相鄰塊搜索單元中被搜索的最接近相鄰塊的信息，而非當(dāng)前塊信息。
19.如權(quán)利要求17所述的裝置，其中，如果冗余判定單元確定當(dāng)前被編碼的塊不是冗余塊，則比特流產(chǎn)生單元在輸出比特流中包括當(dāng)前塊信息。
20.如權(quán)利要求18所述的裝置，其中，最接近相鄰塊信息是最接近相鄰塊的索引信息，它在時(shí)頻帶表中被搜索。
21.一種解碼方法，用于解碼包含關(guān)于音頻信號(hào)的預(yù)定區(qū)域的附加信息的音頻信號(hào)，包括(a)從輸入的音頻比特流解碼不包括在預(yù)定區(qū)域中的塊；(b)根據(jù)解碼的塊數(shù)據(jù)來(lái)產(chǎn)生與所述預(yù)定區(qū)域?qū)?yīng)的時(shí)頻帶表；(c)根據(jù)關(guān)于音頻信號(hào)的所述預(yù)定區(qū)域的附加信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建在所述預(yù)定區(qū)域中包括的當(dāng)前塊。
22.如權(quán)利要求21所述的方法，其中，附加信息包括關(guān)于在預(yù)定區(qū)域中的當(dāng)前塊的最接近相鄰塊的索引信息。
23.如權(quán)利要求21所述的方法，其中，預(yù)定區(qū)域是高頻區(qū)域。
24.如權(quán)利要求21所述的方法，其中，在步驟(b)產(chǎn)生的時(shí)頻帶表被在步驟(c)中重建的當(dāng)前塊更新。
25.如權(quán)利要求21所述的方法，其中，附加信息包括比例系數(shù)信息。
26.一種用于解碼數(shù)字音頻信號(hào)的解碼方法，包括(a)從輸入的音頻比特流提取最接近相鄰塊信息；(b)根據(jù)輸入的音頻比特流來(lái)產(chǎn)生時(shí)頻帶表；(c)根據(jù)所提取的最近相鄰塊信息來(lái)確定當(dāng)前被解碼的塊是否是冗余塊；(d)如果當(dāng)前被解碼的塊是冗余塊，則根據(jù)所提取的最近相鄰塊信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建冗余塊。
27.如權(quán)利要求26所述的方法，還包括使用重建的冗余塊來(lái)重建與輸入的音頻比特流對(duì)應(yīng)的整個(gè)頻譜。
28.如權(quán)利要求27所述的方法，其中，步驟(c)還包括根據(jù)重建的冗余塊來(lái)更新時(shí)頻帶表。
29.如權(quán)利要求27所述的方法，其中，最接近相鄰塊信息包括比例系數(shù)信息。
30.一種解碼裝置，用于解碼包含關(guān)于音頻信號(hào)的預(yù)定區(qū)域的附加信息的音頻信號(hào)，包括解碼單元，它從輸入的音頻比特流解碼不包括在預(yù)定區(qū)域中的塊；后處理單元，它根據(jù)解碼的塊數(shù)據(jù)來(lái)產(chǎn)生與所述預(yù)定區(qū)域?qū)?yīng)的時(shí)頻帶表，并且根據(jù)關(guān)于音頻信號(hào)的所述預(yù)定區(qū)域的附加信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建在所述預(yù)定區(qū)域中包括的當(dāng)前塊。
31.如權(quán)利要求30所述的裝置，其中，附加信息包括關(guān)于在預(yù)定區(qū)域中當(dāng)前塊的最接近相鄰塊的索引信息。
32.如權(quán)利要求30所述的裝置，其中，預(yù)定區(qū)域是高頻區(qū)域。
33.如權(quán)利要求30所述的裝置，其中，所產(chǎn)生的時(shí)頻帶表被重建的當(dāng)前塊更新。
34.一種用于解碼數(shù)字音頻信號(hào)的解碼裝置，包括最近相鄰塊信息提取單元，它從輸入的音頻比特流提取最接近相鄰塊信息；時(shí)頻帶表產(chǎn)生單元，它根據(jù)輸入的音頻比特流來(lái)產(chǎn)生時(shí)頻帶表；冗余塊重建單元，它根據(jù)所提取的最近相鄰塊信息來(lái)確定當(dāng)前被解碼的塊是否是冗余塊，并且如果當(dāng)前被解碼的塊是冗余塊，則冗余塊重建單元根據(jù)所提取的最近相鄰塊信息、通過(guò)使用所產(chǎn)生的時(shí)頻帶表來(lái)重建冗余塊。
35.如權(quán)利要求34所述的裝置，其中，冗余塊重建單元使用重建的冗余塊來(lái)重建與輸入的音頻比特流對(duì)應(yīng)的整個(gè)頻譜。
36.如權(quán)利要求35所述的裝置，其中，時(shí)頻帶表產(chǎn)生單元根據(jù)重建冗余塊來(lái)更新時(shí)頻帶表。
全文摘要
本發(fā)明提供了一種先進(jìn)數(shù)字音頻編碼和/或解碼方法和裝置。所述數(shù)字音頻編碼方法涉及(a)根據(jù)輸入音頻信號(hào)來(lái)產(chǎn)生時(shí)頻帶表；(b)根據(jù)所產(chǎn)生的時(shí)頻帶表來(lái)搜索當(dāng)前被編碼的塊的最接近相鄰塊，并且產(chǎn)生關(guān)于被搜索的最接近相鄰塊信息；(c)產(chǎn)生包含所產(chǎn)生的關(guān)于最接近相鄰塊信息的比特流。
文檔編號(hào)G10L21/00GK1510661SQ20031012371
公開(kāi)日2004年7月7日申請(qǐng)日期2003年12月23日優(yōu)先權(quán)日2002年12月23日
發(fā)明者馬修·馬努, 張基錫, 馬修馬努申請(qǐng)人:三星電子株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：馬修·馬努、張基錫
技術(shù)所有人：三星電子株式會(huì)社
我是此專(zhuān)利的發(fā)明人

上一篇：用于雙語(yǔ)連接語(yǔ)音合成的聲單元的制作方法
上一篇：一種無(wú)源電弦樂(lè)器的制作方法

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

數(shù)字音頻解碼器相關(guān)技術(shù)

數(shù)字音頻解碼芯片相關(guān)技術(shù)

杜比數(shù)字音頻解碼相關(guān)技術(shù)

發(fā)燒數(shù)字音頻解碼器相關(guān)技術(shù)

數(shù)字音頻編碼器相關(guān)技術(shù)

數(shù)字音頻編碼相關(guān)技術(shù)

頻率編碼相關(guān)技術(shù)

頻率編碼和相位編碼相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

使用時(shí)間頻率相關(guān)編碼和/或解碼數(shù)字音頻的方法及裝置的制作方法