專利名稱:采用帶寬擴(kuò)展技術(shù)編碼和/或解碼音頻數(shù)據(jù)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻數(shù)據(jù)的編碼和解碼,尤其涉及采用帶寬擴(kuò)展技術(shù)編碼和/或解碼音頻數(shù)據(jù)的方法和裝置。
背景技術(shù):
隨著數(shù)字信號處理技術(shù)發(fā)展,音頻信號主要作為數(shù)字?jǐn)?shù)據(jù)存儲并播放。數(shù)字音頻存儲器和/或播放設(shè)備采樣并量化模擬音頻信號,將模擬音頻信號變換成作為數(shù)字信號的脈沖編碼調(diào)制(PCM)音頻數(shù)據(jù),并將脈沖編碼調(diào)制(PCM)音頻數(shù)據(jù)存儲在諸如壓縮光盤(CD)、數(shù)字通用光盤(DVD)或類似物的信息存儲介質(zhì)上,這樣,當(dāng)用戶想聽PCM音頻數(shù)據(jù)時可播放信息存儲介質(zhì)上的數(shù)據(jù)。相對于慢轉(zhuǎn)密紋(LP)唱片、磁帶或類似物所采用的模擬音頻信號存儲和/或再現(xiàn)方法,數(shù)字音頻信號存儲和/或再現(xiàn)方法大大提高了音質(zhì)且顯著減少了由于長期存放所導(dǎo)致的音質(zhì)惡化。然而,大量數(shù)字?jǐn)?shù)據(jù)有時也產(chǎn)生存儲和傳輸?shù)膯栴}。
為解決以上問題,大量用于減少數(shù)字音頻數(shù)據(jù)量的壓縮技術(shù)得以使用。由國際標(biāo)準(zhǔn)化組織(ISO)起草的運(yùn)動圖像專家組音頻標(biāo)準(zhǔn)或道爾比降噪聲系統(tǒng)的AC-2/AC-3技術(shù)采取利用一音質(zhì)模型減少數(shù)據(jù)量的方法,有效減少了與信號特征無關(guān)的數(shù)據(jù)量。也就是說,MPEG音頻標(biāo)準(zhǔn)和AC-2/AC-3技術(shù)只在64Kbps-384Kbps的比特率上,即現(xiàn)有數(shù)字編碼技術(shù)的1/6-1/8,提供與CD幾乎相同的音質(zhì)。
然而,以上所有技術(shù)都遵從在固定比特率的最佳狀態(tài)下檢測、量化和編碼數(shù)字?jǐn)?shù)據(jù)的方法。因此,當(dāng)經(jīng)由網(wǎng)絡(luò)傳輸數(shù)字?jǐn)?shù)據(jù)時,由于網(wǎng)絡(luò)條件限制導(dǎo)致傳輸帶寬減小。然后,網(wǎng)絡(luò)斷開且網(wǎng)絡(luò)服務(wù)停止。也就是說,當(dāng)數(shù)字?jǐn)?shù)據(jù)被變換成較小比特流從而適合存儲容量受限的移動設(shè)備時,可執(zhí)行重編碼以減少數(shù)據(jù)量。為此,需要相當(dāng)多的計算。
因此,本申請人于1997年11月19日向韓國知識產(chǎn)權(quán)局提交了申請?zhí)枮?7-61298的韓國專利申請“能利用比特切割算術(shù)編碼(BSAC)技術(shù)控制比特率的音頻編碼和/或解碼方法和裝置”,此申請已于2002年4月17日授權(quán),韓國專利登記號為261253。依據(jù)BSAC技術(shù),已以高比特率編碼的比特流,可被變換成具有低比特率的比特流。由于可只采用一部分比特流進(jìn)行重構(gòu),即使網(wǎng)絡(luò)過載、解碼器性能不好或用戶要求低比特率,也能只利用一部分比特流向用戶提供適中音質(zhì)服務(wù)(即使解碼器性能與低比特率同樣惡化)。然而,在低比特率,解碼器性能也不可避免地要降低。
然而,BSAC技術(shù)利用改進(jìn)的離散余弦變換(MDCT)變換音頻信號,這嚴(yán)重降低了較低層產(chǎn)生的聲音質(zhì)量。由于MDCT的頻率分辨率為常數(shù),考慮到音質(zhì)模型,人耳不敏感部分的頻率分辨率變得很高。因此,依據(jù)MDCT,從增強(qiáng)層到較低層時聲音質(zhì)量變差。
發(fā)明內(nèi)容
本發(fā)明提供了能控制音頻數(shù)據(jù)比特率的音頻數(shù)據(jù)編碼和/或解碼方法和裝置,即使只利用部分比特流執(zhí)行恢復(fù),也能再現(xiàn)高質(zhì)量聲音。
本發(fā)明還提供了音頻數(shù)據(jù)編碼和/或解碼方法和裝置,能控制比特流使得可從一較低層產(chǎn)生高質(zhì)量聲音。
依據(jù)本發(fā)明的一方面,提供了一種編碼音頻數(shù)據(jù)的方法。此方法包括帶寬擴(kuò)展編碼音頻數(shù)據(jù),輸出帶寬受限的音頻數(shù)據(jù),并產(chǎn)生帶寬擴(kuò)展信息;將所述帶寬受限的音頻數(shù)據(jù)算術(shù)編碼為具有一基層和至少一增強(qiáng)層的分層結(jié)構(gòu)從而控制比特率;并多路復(fù)用該算術(shù)編碼帶寬受限的音頻數(shù)據(jù)和帶寬擴(kuò)展信息。
所述算術(shù)編碼包括差分編碼對應(yīng)于基層的輔助信息;比特分割編碼對應(yīng)于基層的多個量化采樣值;并為下一增強(qiáng)層重復(fù)差分編碼和比特分割編碼直到多個預(yù)定層完成編碼。
所述算術(shù)編碼包括差分編碼對應(yīng)于基層的包含比例因子信息和編碼模型信息的輔助信息;參考編碼模型信息,比特分割編碼對應(yīng)于基層的多個量化采樣值;并為下一增強(qiáng)層重復(fù)差分編碼和比特分割編碼直到多個預(yù)定層完成編碼。
量化采樣值最好通過音頻數(shù)據(jù)的偽子波變換獲得。
已編碼帶寬受限的音頻數(shù)據(jù)和帶寬擴(kuò)展信息按以下順序多路復(fù)用,定位對應(yīng)于基層的一部分已編碼帶寬受限的音頻數(shù)據(jù),定位帶寬擴(kuò)展信息,并定位對應(yīng)于其余增強(qiáng)層的部分已編碼帶寬受限的音頻數(shù)據(jù)。
可選地,已編碼帶寬受限的音頻數(shù)據(jù)和帶寬擴(kuò)展信息按以下順序多路復(fù)用,定位帶寬擴(kuò)展信息,定位對應(yīng)于基層的一部分已編碼帶寬受限的音頻數(shù)據(jù),并定位對應(yīng)于其余增強(qiáng)層的部分已編碼帶寬受限的音頻數(shù)據(jù)。
根據(jù)本發(fā)明的另一方面,提供了一種解碼音頻數(shù)據(jù)的方法。此方法包括多路分解一輸入音頻比特流并采樣帶寬受限的音頻數(shù)據(jù),此數(shù)據(jù)被編碼為包括一基層和至少一增強(qiáng)層以及帶寬擴(kuò)展信息的分層結(jié)構(gòu);算術(shù)解碼至少一部分對應(yīng)于基層的帶寬受限的音頻數(shù)據(jù);基于帶寬受限的音頻數(shù)據(jù)的已解碼部分并參考帶寬擴(kuò)展信息,產(chǎn)生處于至少一部分未被帶寬受限的音頻數(shù)據(jù)的已解碼部分覆蓋的頻帶內(nèi)的音頻數(shù)據(jù),然后將所產(chǎn)生的音頻數(shù)據(jù)補(bǔ)入帶寬受限的音頻數(shù)據(jù)的已解碼部分。
產(chǎn)生在所述頻帶部分的音頻數(shù)據(jù),從而到達(dá)帶寬受限的音頻數(shù)據(jù)已解碼部分的邊界。產(chǎn)生在所述頻帶部分的音頻數(shù)據(jù),從而到達(dá)用于偽子波變換的濾波器組的邊界。假如音頻數(shù)據(jù)未到達(dá)用于偽子波變換的濾波器組的邊界,則插入帶寬受限的音頻數(shù)據(jù)已解碼部分與所產(chǎn)生的音頻數(shù)據(jù)的重疊部分。
所述輸入音頻比特流按以下順序多路分解從輸入音頻比特流采樣對應(yīng)于基層的數(shù)據(jù),從輸入音頻比特流采樣帶寬擴(kuò)展信息,并從輸入音頻比特流采樣對應(yīng)于其余增強(qiáng)層的數(shù)據(jù)。
可選地,所述輸入音頻比特流按以下順序多路分解從輸入音頻比特流采樣帶寬擴(kuò)展信息,從輸入音頻比特流采樣對應(yīng)于基層的數(shù)據(jù),并從輸入音頻比特流采樣對應(yīng)于其余增強(qiáng)層的數(shù)據(jù)。
所述算術(shù)解碼包括差分解碼對應(yīng)于基層的輔助信息;比特分割解碼對應(yīng)于基層的多個量化采樣值;并為下一增強(qiáng)層重復(fù)差分解碼和比特分割解碼直到多個預(yù)定層完成解碼。
所述算術(shù)解碼包括差分解碼對應(yīng)于基層的包含比例因子信息和編碼模型信息的輔助信息;參考編碼模型信息,比特分割解碼對應(yīng)于基層的多個量化采樣值;并為下一增強(qiáng)層重復(fù)差分解碼和比特分割解碼直到多個預(yù)定層完成解碼。
根據(jù)本發(fā)明的再一個方面,提供了一種編碼音頻數(shù)據(jù)的裝置。此裝置包括一帶寬擴(kuò)展編碼器,用于帶寬擴(kuò)展編碼音頻數(shù)據(jù)、輸出帶寬受限的音頻數(shù)據(jù)并產(chǎn)生帶寬擴(kuò)展信息;一細(xì)??缮炜s編碼器,用于將所述帶寬受限的音頻數(shù)據(jù)算術(shù)編碼為包括一基層和至少一增強(qiáng)層的分層結(jié)構(gòu)從而控制比特率;以及一多路復(fù)用器,用于多路復(fù)用所述算術(shù)編碼帶寬受限的音頻數(shù)據(jù)和帶寬擴(kuò)展信息。
所述細(xì)??缮炜s編碼器差分編碼對應(yīng)于基層的輔助信息,比特分割編碼對應(yīng)于基層的多個量化采樣值,并比特分割編碼對應(yīng)于下一增強(qiáng)層的輔助信息和多個量化采樣值直到多個預(yù)定層完成編碼。
所述細(xì)??缮炜s編碼器差分編碼對應(yīng)于基層的包含比例因子信息和編碼模型信息的輔助信息,參考編碼模型信息,比特分割編碼對應(yīng)于基層的多個量化采樣值,編碼對應(yīng)于下一增強(qiáng)層的包含比例因子信息和編碼模型信息的輔助信息直到多個預(yù)定層完成編碼,并比特分割編碼對應(yīng)于下一增強(qiáng)層的多個量化采樣值。所述細(xì)粒可伸縮編碼器最好通過偽子波變換音頻數(shù)據(jù)獲得量化采樣值。
所述多路復(fù)用器按以下順序多路復(fù)用已編碼帶寬受限的音頻數(shù)據(jù)和帶寬擴(kuò)展信息定位一部分對應(yīng)于基層的已編碼帶寬受限的音頻數(shù)據(jù),定位帶寬擴(kuò)展信息,并定位對應(yīng)于其余增強(qiáng)層的部分已編碼帶寬受限的音頻數(shù)據(jù)。
根據(jù)本發(fā)明的又一個方面,提供了一種用于解碼音頻數(shù)據(jù)的裝置。此裝置包括一多路分解器,多路分解一輸入音頻比特流并采樣被編碼成具有一基層和至少一增強(qiáng)層以及帶寬擴(kuò)展信息的分層結(jié)構(gòu)的帶寬受限的音頻數(shù)據(jù);一細(xì)??缮炜s算術(shù)解碼器,解碼對應(yīng)于基層的至少一部分帶寬受限的音頻數(shù)據(jù);和一帶寬擴(kuò)展解碼器,基于帶寬受限的音頻數(shù)據(jù)的已解碼部分并參考帶寬擴(kuò)展信息,產(chǎn)生處于至少一部分未被帶寬受限的音頻數(shù)據(jù)的已解碼部分覆蓋的頻帶內(nèi)的音頻數(shù)據(jù),然后將所產(chǎn)生的音頻數(shù)據(jù)補(bǔ)入帶寬受限的音頻數(shù)據(jù)的已解碼部分。
所述細(xì)??缮炜s哈夫曼解碼器差分解碼對應(yīng)于基層的輔助信息,比特分割解碼對應(yīng)于基層的多個量化采樣值,并解碼對應(yīng)于下一增強(qiáng)層的輔助信息直到多個預(yù)定層完全解碼,并比特分割解碼對應(yīng)于下一增強(qiáng)層的多個量化采樣值。
所述多路分解器按以下順序多路分解所述輸入音頻比特流從輸入音頻比特流采樣對應(yīng)于基層的數(shù)據(jù),從輸入音頻比特流采樣帶寬擴(kuò)展信息,并從輸入音頻比特流采樣對應(yīng)于其余增強(qiáng)層的數(shù)據(jù)??蛇x地,所述多路分解器可按以下順序多路分解輸入音頻比特流從輸入音頻比特流采樣帶寬擴(kuò)展信息,從輸入音頻比特流采樣對應(yīng)于基層的數(shù)據(jù),并從輸入音頻比特流采樣對應(yīng)于其余增強(qiáng)層的數(shù)據(jù)。
通過參照附圖詳細(xì)描述本發(fā)明的典型實施例,本發(fā)明的特征及其它優(yōu)點(diǎn)將更加顯而易見,其中圖1為根據(jù)本發(fā)明的一編碼裝置的方框圖;圖2為圖1所示的編碼裝置的詳細(xì)方框圖;圖3為根據(jù)本發(fā)明的一解碼裝置的方框圖;圖4為圖3所示的解碼裝置的詳細(xì)方框圖;圖5示出了從一細(xì)??缮炜s(FGS)編碼器2輸出的比特流的結(jié)構(gòu);圖6示出了圖5所示的輔助信息的詳細(xì)結(jié)構(gòu);圖7示出了從多路復(fù)用器3輸出或輸入到多路分解器7的比特流的結(jié)構(gòu);圖8是用于解釋根據(jù)本發(fā)明的編碼和解碼裝置執(zhí)行的算術(shù)編碼和解碼方法的示意圖;圖9是用于更詳細(xì)地解釋由帶寬擴(kuò)展(BWE)解碼器9執(zhí)行的帶寬擴(kuò)展解碼的示意圖;圖10是用于說明根據(jù)本發(fā)明的一編碼方法的流程圖;圖11是用于說明根據(jù)本發(fā)明的一解碼方法的流程圖。
具體實施例方式
以下將參照附圖對本發(fā)明的優(yōu)選實施例進(jìn)行詳細(xì)描述。
圖1是根據(jù)本發(fā)明的一編碼裝置的方框圖。如圖1,該編碼裝置,接收并編碼PCM音頻數(shù)據(jù),并將PCM音頻數(shù)據(jù)作為音頻比特流輸出,該編碼裝置包括一帶寬擴(kuò)展(BWE)編碼器1,一細(xì)??缮炜s(FGS)編碼器2和一多路復(fù)用器3。
所述BWE編碼器1,BWE編碼PCM音頻信號、輸出帶寬受限的音頻數(shù)據(jù)并產(chǎn)生BWE信息。BWE編碼涉及用于接收音頻數(shù)據(jù)、分割高頻帶內(nèi)的一部分音頻數(shù)據(jù),并產(chǎn)生恢復(fù)音頻數(shù)據(jù)的分割部分所必須的輔助信息的技術(shù)。在此,音頻數(shù)據(jù)的其余部分被稱為“帶寬受限的音頻數(shù)據(jù)”且輔助信息被稱為“BWE信息”。BWE技術(shù)的一個例子為編碼技術(shù)發(fā)展而來的光譜帶復(fù)制(SBR)技術(shù)。SBR技術(shù)的詳細(xì)內(nèi)容在2002年5月10-13日的第112屆音頻工程協(xié)會會議上的“會議論文5560”中公開。
FGS編碼器2將帶寬受限的音頻數(shù)據(jù)編碼成具有一基層和至少一增強(qiáng)層的分層結(jié)構(gòu)從而控制比特率。FGS編碼涉及用于將數(shù)據(jù)編碼成多層結(jié)構(gòu)從而控制比特率,即提供FGS的技術(shù)。申請?zhí)枮?7-61298的韓國專利申請公開的BSAC技術(shù)為FGS編碼的一個實例。也就是說,F(xiàn)GS編碼器2差分編碼對應(yīng)于基層的輔助信息,比特分割編碼對應(yīng)于基層的多個量化采樣值,差分編碼對應(yīng)于下一增強(qiáng)層的輔助信息直到多個預(yù)定層完成編碼,并且比特分割編碼對應(yīng)于下一增強(qiáng)層的多個量化采樣值。在此,所述輔助信息包含比例因子信息和編碼模型信息,并且通過變換和量化輸入音頻數(shù)據(jù)獲得量化采樣值。以下將詳細(xì)說明所述輔助信息和量化采樣值。
多路復(fù)用器3多路復(fù)用由FGS編碼器2編碼產(chǎn)生的帶寬受限PMC音頻數(shù)據(jù)和由BWE編碼器1產(chǎn)生的BWE信息。
圖2為圖1所示的編碼裝置的詳細(xì)方框圖。如圖2,所述編碼裝置包括一BWE編碼器1、一FGS編碼器2和一多路復(fù)用器3。與圖1中執(zhí)行相同功能的塊采用相同的附圖標(biāo)記,在此不再贅述。
具體地,F(xiàn)GS編碼器2包括一偽子波變換(PWT)單元21、一音質(zhì)單元22和一量化單元23以及一FGS算術(shù)編碼單元24。
PWT單元21接收時域內(nèi)的PCM音頻數(shù)據(jù),并參照由音質(zhì)單元22提供的音質(zhì)模型信息將該P(yáng)CM音頻數(shù)據(jù)偽子波變換為頻域內(nèi)的音頻信號。能被人感知的音頻信號特性,以下被稱為感知音頻信號,在時域內(nèi)沒有太大的不同。相反,考慮音質(zhì)模型,頻域內(nèi)的感知和非感知音頻信號的特性很不相同。因此,通過給每個頻帶分配不同數(shù)量的比特可提高壓縮效率。僅由于低頻帶內(nèi)高頻分辨率所產(chǎn)生的輕微頻率畸變,MDCT會產(chǎn)生感知噪音。相對于MDCT,由于具有適中的時間/頻率分辨率,PWT即使從具有較低頻帶的較低層也可提供穩(wěn)定的聲音質(zhì)量。
音質(zhì)單元22向PWT單元21提供諸如處理(attack)檢測信息之類的關(guān)于音質(zhì)模型的信息,將由PWT單元21變換的音頻信號打包為子頻帶音頻信號,利用子頻帶信號間相互作用所產(chǎn)生的掩蔽效應(yīng)為每個子頻帶計算掩蔽閾值,并將掩蔽閾值提供給量化單元23。所述掩蔽閾值表示由于音頻信號間的相互作用人們不能感知的音頻信號的最大功率。在本實施例中,音質(zhì)單元22利用立體聲掩蔽水平降低(Binaural Masking Level Depression)(BMLD)計算用于立體聲部分的掩蔽閾值和類似值。
量化單元23基于對應(yīng)的比例因子信息標(biāo)量量化每個子頻帶音頻信號以將每個子頻帶的量化噪音能量減少到低于音質(zhì)單元22提供的掩蔽閾值,然后輸出量化采樣值,這樣人們能聽到子頻帶音頻信號但感覺不到其中的噪音。也就是說,量化單元23按噪音掩蔽率(NMR)量化子頻帶音頻信號,NMR表示每個子頻帶所產(chǎn)生的噪音與音質(zhì)單元22所計算的掩蔽閾值的比例,在全帶寬為OdB或更少。OdB或更少的NMR表示人們不能聽到量化噪音。
FGS算術(shù)編碼單元24將量化采樣值和屬于每層的輔助信息編碼為分層結(jié)構(gòu)。所述輔助信息包含對應(yīng)于每層的比例頻帶信息、編碼頻帶信息、比例因子信息和編碼模型信息。比例頻帶信息和編碼頻帶信息可打包為構(gòu)成音頻比特流的每一幀的標(biāo)頭信息,然后被傳送到解碼裝置??蛇x地,所述比例頻帶信息和編碼頻帶信息可被編碼并被打包為對應(yīng)于每層的輔助信息,然后被傳送到解碼裝置。而且,由于比例頻帶信息和編碼頻帶信息已經(jīng)存儲在解碼裝置中,比例頻帶信號和編碼頻帶信息可不必傳送至所述解碼裝置。
更詳細(xì)地,F(xiàn)GS算術(shù)編碼單元24差分編碼對應(yīng)于第一層的包含比例因子信息和編碼模型信息的輔助信息,同時參考編碼模型信息比特分割編碼量化對應(yīng)于第一層的采樣值。比特分割編碼表示在上述BSAC中使用的編碼,順序無損編碼最高有效比特、次有效比特……和最低有效比特。第二層與第一層采用相同處理。也就是說,多個預(yù)定層逐層順序編碼。第一層被稱為基層,其余層被稱為增強(qiáng)層。后面將對分層結(jié)構(gòu)進(jìn)行更詳細(xì)描述。
比例頻帶信息對于依賴音頻信號的頻率特性正確執(zhí)行量化是必須的,且當(dāng)頻域被分為多個頻帶且每個頻帶被分配了一正確比例因子時,比例頻帶信息通知對應(yīng)的比例頻帶的每一層。因此,每層屬于至少一個比例頻帶。每個比例頻帶被分配一個比例因子。編碼頻帶信息對于依賴音頻信號的頻率特性正確執(zhí)行編碼是必須的,且當(dāng)頻域被分為多個頻帶且每個頻帶被分配了一正確編碼模型時,編碼頻帶信息通知對應(yīng)的編碼頻帶的每一層。通過測試正確劃分比例頻帶和編碼頻帶,且隨后確定對應(yīng)的比例因子和編碼模型。
多路復(fù)用器3按以下順序多路復(fù)用已編碼帶寬受限的音頻數(shù)據(jù)和BWE信息定位對應(yīng)于基層的已編碼量化采樣值數(shù)據(jù),定位BWE信息,并定位對應(yīng)于其余增強(qiáng)層的已編碼量化采樣值數(shù)據(jù)。多路復(fù)用器3或者按以下順序多路復(fù)用已編碼帶寬受限的音頻數(shù)據(jù)和BWE信息定位BWE信息,定位對應(yīng)于基層的已編碼量化采樣值數(shù)據(jù),并定位對應(yīng)于其余增強(qiáng)層的已編碼量化采樣值數(shù)據(jù)。
圖3為根據(jù)本發(fā)明的一解碼裝置的方框圖。如圖3,該解碼裝置,接收并解碼音頻比特流,然后輸出音頻數(shù)據(jù),該解碼裝置包括一多路分解器7、一FGS解碼器8和一BWE解碼器9。
多路分解器7將一輸入音頻比特流多路分解為采樣帶寬受限的音頻數(shù)據(jù),該采樣帶寬受限的音頻數(shù)據(jù)已被編碼成具有基層和至少一增強(qiáng)層及其中的BWE信息的分層結(jié)構(gòu)。在此,帶寬受限的音頻數(shù)據(jù)和BWE信息與參照圖1所述的相同。FGS解碼器8算術(shù)解碼對應(yīng)于基層的至少一部分帶寬受限的音頻數(shù)據(jù)。執(zhí)行解碼的層與網(wǎng)絡(luò)狀態(tài)、用戶選擇之類相關(guān)。
基于由FGS解碼器8算術(shù)解碼的帶寬受限的音頻數(shù)據(jù)部分并參考由多路分解器7采樣的BWE信息,BWE解碼器9產(chǎn)生處于至少一部分未被由FGS解碼器8算術(shù)解碼的帶寬受限的音頻數(shù)據(jù)覆蓋的頻帶內(nèi)的音頻數(shù)據(jù),然后將所產(chǎn)生的音頻數(shù)據(jù)補(bǔ)入已被FGS解碼器8算術(shù)解碼的帶寬受限的音頻數(shù)據(jù)。
由于本發(fā)明采用PWT,BWE解碼器9經(jīng)歷以下過程。當(dāng)采用PWT執(zhí)行解碼時,通過在確定帶寬受限的音頻數(shù)據(jù)過程中確定頻域內(nèi)的最后點(diǎn)來選擇分割頻率。由于在高頻部分的頻率分辨率低,PWT不能象MDCT那樣根據(jù)所確定的最后點(diǎn)精確限制帶寬。在解碼過程中,BWE解碼器8將由FGS解碼器9所產(chǎn)生的核心部分安排到頻域中,確認(rèn)該核心部分的頻率帶寬,并將BWE部分修改和解碼為適合的頻率帶寬。
例如,讓我們假設(shè)以64kbps的比特率編碼的16層比特流中只有8層重構(gòu),對應(yīng)第8層的頻率為8.5kHZ。在此情況下,BWE解碼器8不得不在8.5kHZ-15kHZ或更寬頻率范圍內(nèi)重構(gòu)數(shù)據(jù)。由于正交鏡象濾波器(QMF)的特性,BWE解碼器8可在正交鏡象濾波信道帶寬的基礎(chǔ)上調(diào)整頻率帶寬。當(dāng)QMF的第n個頻率帶寬為8.3kHZ,在8.3-8.5kHZ的頻率帶寬范圍內(nèi)的頻率分量被包含在核心部分或BWE部分。因此,核心部分或BWE部分必須正確處理。
第一種處理核心部分和BWE部分的方法,是從核心部分刪除8.3-8.5kHZ頻率帶寬范圍內(nèi)的頻率分量。在此方法中,考慮到BWE部分的帶寬信息,F(xiàn)GS解碼器9執(zhí)行解碼。第二種方法是利用BWE解碼器8中使用的QMF過濾核心部分的數(shù)據(jù),通過內(nèi)插生成QMF數(shù)據(jù),并反向正交鏡象濾波QMF數(shù)據(jù)從而重構(gòu)核心部分的數(shù)據(jù)。
如上所述,即使FGS解碼器8解碼的音頻數(shù)據(jù)只有基帶音頻數(shù)據(jù),BWE解碼器9創(chuàng)建遺漏頻帶音頻數(shù)據(jù)并將其補(bǔ)入基帶音頻數(shù)據(jù)。因此,可提高解碼音頻數(shù)據(jù)質(zhì)量。
圖4為圖3所示的解碼裝置的詳細(xì)方框圖。如圖4,該解碼裝置包括一多路分解器7、一FGS解碼器8和一BWE解碼器9。與圖3中執(zhí)行相同功能的塊采用的相同附圖標(biāo)記,在此不再贅述。
具體地,為控制比特率,F(xiàn)GS解碼器8執(zhí)行解碼直到目標(biāo)層,此目標(biāo)層由網(wǎng)絡(luò)狀態(tài)、解碼裝置性能、用戶選擇等確定。FGS解碼器8包括一FGS算術(shù)解碼單元81、一反量化單元82和一PWT反變換單元83。FGS算術(shù)解碼單元81執(zhí)行解碼直到音頻比特流的目標(biāo)層。更詳細(xì)地,基于通過解碼包含對應(yīng)于每層的比例因子信息和編碼模型信息的輔助信息所獲得的編碼模型信息,F(xiàn)GS算術(shù)解碼單元81算術(shù)解碼對應(yīng)于每層的已編碼量化采樣值從而獲得量化采樣值。以下將詳細(xì)解釋獲得量化采樣值的處理。
比例頻帶信息和編碼頻帶信息可從音頻比特流的標(biāo)頭信息或解碼每層的輔助信息中獲得??蛇x地,所述解碼裝置可預(yù)先存儲比例頻帶信息和編碼頻帶信息。
反量化單元82基于對應(yīng)于每層的比例因子信息反量化并重構(gòu)每層的量化采樣值。PWT反變換單元83頻率/時間映射已重構(gòu)采樣值,將所映射的采樣值反向偽子波變換為時域PCM音頻數(shù)據(jù),并輸出該時域PCM音頻數(shù)據(jù)。
BWE解碼器9包括一變換單元91、一高頻產(chǎn)生單元92、一調(diào)整單元93和一合成單元94。變換單元91將從PWT反變換單元83輸出的時域PCM音頻數(shù)據(jù)變換為頻域數(shù)據(jù)。頻域數(shù)據(jù)被稱為低頻部分。高頻產(chǎn)生單元92創(chuàng)建頻域數(shù)據(jù)未覆蓋的部分,即,通過參考BWE信息復(fù)制低頻部分然后將所復(fù)制的低頻部分補(bǔ)入頻域數(shù)據(jù)、即原始低頻部分中而得到的高頻部分。調(diào)整單元93采用包含在BWE信息中的包封信息來調(diào)整由高頻產(chǎn)生單元92所產(chǎn)生的高頻部分的水平。從編碼點(diǎn)傳送的包封信息,表示對應(yīng)于在BWE編碼過程中由編碼點(diǎn)所分割的高頻部分的音頻數(shù)據(jù)的包封信息。合成單元94合成從變換單元91輸出的低頻部分和從調(diào)整單元93輸出的高頻部分,然后輸出PCM音頻數(shù)據(jù)。
如上所述,盡管FGS解碼器8只解碼基帶音頻數(shù)據(jù),BWE解碼器9重構(gòu)遺漏頻帶音頻數(shù)據(jù)并將遺漏頻帶音頻數(shù)據(jù)補(bǔ)入基帶音頻數(shù)據(jù)中。因此,提高了基帶音頻數(shù)據(jù)質(zhì)量。
圖5表示從FGS編碼器2輸出的比特流結(jié)構(gòu)。如圖5,通過映射量化采樣值和輔助信息到細(xì)??缮炜s(FGS)的分層結(jié)構(gòu)中,F(xiàn)GS編碼器2將比特流幀編碼。也就是說,此幀具有分層結(jié)構(gòu),其中較低層的比特流被包括在增強(qiáng)層的比特流中。每層必須的輔助信息逐層編碼。
標(biāo)頭信息所存儲在的標(biāo)頭區(qū)域處于比特流的開始部分,第零層信息被打包,而處于增強(qiáng)層的第一至第N層的信息依次被打包?;鶎臃秶菑臉?biāo)頭區(qū)域至第零層信息,第一層范圍是從標(biāo)頭區(qū)域至第一層信息,并且第二層范圍是從標(biāo)頭區(qū)域至第二層信息。同樣,最高增強(qiáng)層范圍是從標(biāo)頭區(qū)域至第N層信息,即從基層至第N層。輔助信息和已編碼數(shù)據(jù)均被作為每層信息存儲。例如,輔助信息2和已編碼量化采樣值被作為第二層信息存儲。這里,N為大于或等于“1”的自然數(shù)。
圖6示出了圖5所示的輔助信息的詳細(xì)結(jié)構(gòu)。如圖6,輔助信息和已編碼量化采樣值均被作為任意層信息存儲。在當(dāng)前實施例中,由于量化采樣值已被算術(shù)編碼,輔助信息包含算術(shù)編碼模型信息、比例因子信息、信道輔助信息以及其他輔助信息。算術(shù)編碼模型信息涉及用于編碼或解碼包含在相應(yīng)層的量化采樣值的算術(shù)編碼模型的索引信息。比例因子信息通知相應(yīng)層適合量化或反量化包含在相應(yīng)層的音頻數(shù)據(jù)的量化步驟大小。信道輔助信息涉及諸如中/邊(M/S)立體聲的與信道相關(guān)的信息。其他輔助信息為表示是否采用M/S立體聲的標(biāo)識信息。
在本實施例中,編碼裝置的FGS編碼器2差分編碼包括算術(shù)編碼模型信息和比例因子信息的輔助信息。由于每個比例頻帶具有一比例因子,為編碼比例因子,首先算術(shù)編碼屬于比例頻帶的比例因子中最小的比例因子,然后算術(shù)編碼在最小比例因子和其他比例因子之間的差值。在對應(yīng)于每個編碼頻帶所允許的比特范圍內(nèi)的一算術(shù)編碼模型和信息被根據(jù)編碼量化步驟大小的方法來編碼,即差分編碼。
在本實施例中,解碼裝置的FGS解碼器8算術(shù)解碼包括算術(shù)編碼模型信息和比例因子信息的輔助信息。由于每個比例頻帶具有一比例因子,為解碼比例因子,首先算術(shù)解碼屬于比例頻帶的比例因子中最小的比例因子,然后算術(shù)解碼在最小比例因子和其他比例因子之間的差值。在對應(yīng)于每個編碼頻帶所允許的比特范圍內(nèi)的一算術(shù)編碼模型和信息以與比例因子相同的方式被算術(shù)解碼。
圖7示出了多路復(fù)用器3輸出或輸入到多路分解器7的比特流的結(jié)構(gòu)。如圖7,第零層,即FGS編碼器2所編碼的基層,位于比特流的開始部分,BWE信息在第零層之后,而增強(qiáng)層,即第一層、第二層……和第N層,在BWE信息之后。盡管解碼點(diǎn)只接收或解碼基層,解碼點(diǎn)能基于基層的已解碼音頻數(shù)據(jù)并參考BWE信息創(chuàng)建遺漏層音頻數(shù)據(jù)。
圖8是用于解釋根據(jù)本發(fā)明的編碼和解碼裝置執(zhí)行的算術(shù)編碼和解碼方法的示意圖。如圖8,點(diǎn)陣矩形框表示構(gòu)成量化采樣值的頻譜線,其中A表示用于形成層之間的邊界的線,B表示用于分割頻譜線的邊界線從而對應(yīng)PWT樹結(jié)構(gòu)的終端結(jié)點(diǎn)。
根據(jù)本發(fā)明用在編碼和/或解碼方法中的PWT和/或反PWT采用樹結(jié)構(gòu)執(zhí)行頻率變換和/或頻率反變換,從而將頻率表示為更接近于對應(yīng)人耳的濾波器組的狀態(tài)。所述樹結(jié)構(gòu)的最后結(jié)點(diǎn)分別對應(yīng)算術(shù)編碼比例頻帶。因此,每個最后結(jié)點(diǎn)都對應(yīng)一個比例因子。
作為傳送算術(shù)編碼所必須的算術(shù)編碼模型信息的單元的編碼頻帶可以考慮編碼效率而決定。例如,讓我們假設(shè)最后結(jié)點(diǎn)具有相同的比例頻帶和編碼頻帶。如圖8所示,層和最后結(jié)點(diǎn)被映射。由于對應(yīng)最后結(jié)點(diǎn)的數(shù)據(jù)存在于相同頻帶的時域內(nèi),在分割層的過程中不劃分對應(yīng)最后結(jié)點(diǎn)的數(shù)據(jù)。
固定第零層從而對頻帶a執(zhí)行編碼,固定第一層從而對頻帶b執(zhí)行編碼,固定第二層從而對頻帶c執(zhí)行編碼,固定第三層從而對頻帶d執(zhí)行編碼,固定第四層從而對頻帶e執(zhí)行編碼,固定第五層從而對頻帶f執(zhí)行編碼,固定第六層從而對頻帶g執(zhí)行編碼,以及固定第七層從而對頻帶h執(zhí)行編碼。
首先,采用對應(yīng)的編碼模型在允許的比特范圍內(nèi)算術(shù)編碼對應(yīng)第零層的量化采樣值。第零層的輔助信息被算術(shù)編碼。當(dāng)比特分割編碼第零層的量化采樣值時計算比特量。假如比特量超過所允許的比特范圍時,停止第零層的編碼,然后開始第一層的算術(shù)編碼。當(dāng)?shù)谝缓偷诙釉试S的比特范圍具有附加的比特部分,對未編碼的第零層的量化采樣值進(jìn)行編碼。
利用對應(yīng)于第一層的編碼模型來編碼對應(yīng)第一層的量化采樣值。算術(shù)編碼第一層的輔助信息。在編碼第一層的所有量化采樣值之后,第一層所允許的比特范圍具有附加比特部分的情況下,對未編碼的第零層的量化采樣值進(jìn)行編碼直到到達(dá)所允許的比特范圍。當(dāng)?shù)竭_(dá)所允許的比特范圍時,停止第一層的編碼,然后開始第二層的編碼。執(zhí)行此處理直到第七層,從而完成第七層的編碼。
如果每層的所有量化采樣值不考慮所允許的比特范圍來進(jìn)行編碼,即,即使已編碼比特量超過所允許的比特范圍也對每層的所有量化采樣值進(jìn)行編碼,則可以使用一部分下一層所允許的比特范圍。這樣,屬于下一層的量化采樣值可以不被編碼。因此,假如執(zhí)行比特率可伸縮編碼,即,只對較低層而不是對所有層執(zhí)行解碼,則不對在預(yù)定頻率內(nèi)的量化采樣值解碼。因此,已解碼量化采樣值在頻帶下上下變化,導(dǎo)致多鳥效應(yīng)(birdy effect),惡化了聲音質(zhì)量。
由于當(dāng)執(zhí)行與編碼處理反向的處理時解碼處理依據(jù)所允許的比特范圍計算比特量,可檢測開始解碼預(yù)定層的時間點(diǎn)。
從“msb”方向到“l(fā)sb”方向?qū)︻l譜線執(zhí)行編碼。這里,在用于波形變換的樹結(jié)構(gòu)的最后結(jié)點(diǎn),相同比特平面上的數(shù)據(jù)比特必須一起編碼。例如,當(dāng)最后結(jié)點(diǎn)具有以下量化采樣值時,000000001010101101011111110000000000000000001100110000000110基于MDCT,量化采樣值被分組為五個4×4比特平面且從左至右從上至下執(zhí)行編碼。然而,基于PWT,所有量化采樣值被作為一個比特平面且基于N比特從最高有效比特至最低有效比特從較低頻率至較高頻率執(zhí)行編碼。最高有效比特“00000000101010110101”基于N比特從左至右編碼,后續(xù)比特“11111100000000000000”被基于N比特從左至右編碼,而且最不重要比特“00001100110000000110”基于N比特編碼。此處,N為大于或等于“1”的整數(shù)。尤其,假如N為1,則執(zhí)行二進(jìn)制編碼。由于算術(shù)編碼可將比特分配到十進(jìn)制位置,例如0.001比特,當(dāng)編碼一比特時,可只利用少量比特編碼大量信息。也就是說,編碼效率相當(dāng)高。哈夫曼編碼,另一種無損編碼,要求每個碼元至少一比特,因此算術(shù)編碼具有較差的編碼效率。
圖9是用于解釋由BWE解碼器9執(zhí)行的BWE解碼的示意圖。如圖9,條紋部分表示被FGS解碼器8解碼的數(shù)據(jù),點(diǎn)陣部分表示BWE解碼器9創(chuàng)建的數(shù)據(jù)。當(dāng)在采樣頻率Fs的1/4部分的所有數(shù)據(jù)屬于基層時,圖9(a)示出了一解碼結(jié)點(diǎn)只解碼基帶數(shù)據(jù)的情況,圖10(b)、(c)和(d)示出了FGS解碼器8解碼對應(yīng)于基帶和至少一增強(qiáng)層的數(shù)據(jù)的情況。也就是說,F(xiàn)GS解碼器8能解碼數(shù)據(jù)從而控制比特率,而BWE解碼器9能創(chuàng)建FGS解碼器8不能解碼的遺漏頻帶數(shù)據(jù)。
基于上述結(jié)構(gòu)將說明根據(jù)本發(fā)明優(yōu)選實施例的編碼和解碼方法。
圖10是用于說明根據(jù)本發(fā)明的一編碼方法的流程圖。如圖10,在步驟1001,一編碼裝置BWE編碼音頻數(shù)據(jù),輸出帶寬受限的音頻數(shù)據(jù),并產(chǎn)生對應(yīng)于基層的BWE信息?;鶎拥腂WE信息對于利用解碼結(jié)點(diǎn)基于屬于基層的音頻數(shù)據(jù)創(chuàng)建遺漏頻帶音頻數(shù)據(jù)是必須的,并且包括包封信息。所述編碼裝置將帶寬受限的音頻數(shù)據(jù)編碼為具有基層和至少一增強(qiáng)層的分層結(jié)構(gòu)從而控制比特率。更詳細(xì)地,在步驟1002,編碼裝置逐層偽子波變換帶寬受限的音頻數(shù)據(jù),在步驟1003,量化帶寬受限的音頻數(shù)據(jù),并且在步驟1004,哈夫曼編碼帶寬受限的音頻數(shù)據(jù)并將帶寬受限的音頻數(shù)據(jù)打包成分層結(jié)構(gòu)從而控制比特率。在步驟1005,該編碼裝置多路復(fù)用帶寬受限的音頻數(shù)據(jù)和BWE信息,然后輸出音頻比特流。更詳細(xì)地,編碼裝置按以下順序多路復(fù)用已編碼帶寬受限的音頻數(shù)據(jù)和BWE信息定位對應(yīng)于基層的一部分已編碼帶寬受限的音頻數(shù)據(jù),定位BWE信息,并定位對應(yīng)于其余增強(qiáng)層的部分已編碼帶寬受限數(shù)據(jù)?;蛘甙匆韵马樞蚨嗦窂?fù)用定位BWE信息,定位對應(yīng)于基層的一部分已編碼帶寬受限的音頻數(shù)據(jù),并定位對應(yīng)于其余增強(qiáng)層的部分已編碼帶寬受限數(shù)據(jù)。
圖11是用于說明根據(jù)本發(fā)明的一解碼方法的流程圖。參考圖11,在步驟1101,該解碼裝置多路分解一輸入音頻比特流并采樣帶寬受限的音頻數(shù)據(jù),該帶寬受限的音頻數(shù)據(jù)已被編碼成具有一基層和至少一增強(qiáng)層以及BWE信息的分層結(jié)構(gòu)。也就是說,解碼裝置按以下順序多路分解輸入音頻比特流它采樣來自輸入音頻比特流中對應(yīng)于基層的數(shù)據(jù)、BWE信息和對應(yīng)于其余增強(qiáng)層的數(shù)據(jù),它或者采樣來自輸入音頻比特流中的BWE信息、對應(yīng)于基層的數(shù)據(jù)和對應(yīng)于其余增強(qiáng)層的數(shù)據(jù)。然后,該解碼裝置解碼至少一部分對應(yīng)于基層的帶寬受限的音頻數(shù)據(jù)從而控制比特率。更詳細(xì)地,在步驟1102,解碼裝置執(zhí)行算術(shù)解碼直到目標(biāo)層,在步驟1103反量化,以及在步驟1104偽子波變換從而獲得PCM音頻數(shù)據(jù)。在步驟1105,基于步驟1104所獲得的PCM音頻數(shù)據(jù)并參考BWE信息,解碼裝置創(chuàng)建處于至少一部分未被在步驟1104所獲得的PCM音頻數(shù)據(jù)覆蓋的頻帶內(nèi)的PCM音頻數(shù)據(jù),然后將所創(chuàng)建的PCM音頻數(shù)據(jù)補(bǔ)入在步驟1104所獲得的PCM音頻數(shù)據(jù)中。
如上所述,本發(fā)明提供了一種比特可伸縮編碼和解碼方法及裝置,只需恢復(fù)部分比特流便可獲得高質(zhì)量的聲音。
基于算術(shù)編碼利用少量數(shù)據(jù)可提供高FGS,并且基于PWT,頻率分辨率可與人耳傳送功能相同。因此,基于PWT編碼比現(xiàn)有基于MDCT編碼的時域/頻域分辨率更好。因而,可從較低層產(chǎn)生高質(zhì)量聲音。
雖然參考典型實施例已對本發(fā)明進(jìn)行了詳述,很明顯,本領(lǐng)域普通技術(shù)人員在不脫離所附權(quán)利要求所限定的本發(fā)明的精神和范圍的情況下可以對本發(fā)明的形式和細(xì)節(jié)作各種改變。
權(quán)利要求
1.一種編碼音頻數(shù)據(jù)的方法,該方法包括對音頻數(shù)據(jù)進(jìn)行帶寬擴(kuò)展編碼、輸出帶寬受限的音頻數(shù)據(jù)、并產(chǎn)生帶寬擴(kuò)展信息;將帶寬受限的音頻數(shù)據(jù)算術(shù)編碼為具有一個基層和至少一個增強(qiáng)層的分層結(jié)構(gòu),從而控制比特率;對所述算術(shù)編碼帶寬受限的音頻數(shù)據(jù)和帶寬擴(kuò)展信息進(jìn)行多路復(fù)用。
2.根據(jù)權(quán)利要求1所述的方法,其中算術(shù)編碼包括差分編碼對應(yīng)于基層的輔助信息;比特分割編碼對應(yīng)于基層的多個量化采樣值;并為下一增強(qiáng)層重復(fù)差分編碼和比特分割編碼直到多個預(yù)定層完成編碼。
3.根據(jù)權(quán)利要求1所述的方法,其中算術(shù)編碼包括差分編碼對應(yīng)于基層的包含比例因子信息和編碼模型信息的輔助信息;參考編碼模型信息,比特分割編碼對應(yīng)于基層的多個量化采樣值;為下一增強(qiáng)層重復(fù)差分編碼和比特分割編碼直到多個預(yù)定層完成編碼。
4.根據(jù)權(quán)利要求2或3所述的方法,其中量化采樣值通過音頻數(shù)據(jù)的偽子波變換獲得。
5.根據(jù)權(quán)利要求1所述的方法,其中已編碼帶寬受限的音頻數(shù)據(jù)和帶寬擴(kuò)展信息按以下順序多路復(fù)用定位對應(yīng)于基層的一部分已編碼帶寬受限的音頻數(shù)據(jù),定位帶寬擴(kuò)展信息,并定位對應(yīng)于其余增強(qiáng)層的部分已編碼帶寬受限數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的方法,其中已編碼帶寬受限的音頻數(shù)據(jù)和帶寬擴(kuò)展信息按以下順序多路復(fù)用定位帶寬擴(kuò)展信息,定位對應(yīng)于基層的一部分已編碼帶寬受限的音頻數(shù)據(jù),并定位對應(yīng)于其余增強(qiáng)層的部分已編碼帶寬受限數(shù)據(jù)。
7.一種解碼音頻數(shù)據(jù)的方法,該方法包括對一個輸入音頻比特流進(jìn)行多路分解并對帶寬受限的音頻數(shù)據(jù)以及帶寬擴(kuò)展信息進(jìn)行采樣,該帶寬受限的音頻數(shù)據(jù)被編碼為包括一個基層和至少一個增強(qiáng)層的分層結(jié)構(gòu);算術(shù)解碼至少一部分對應(yīng)于所述基層的帶寬受限的音頻數(shù)據(jù);根據(jù)帶寬受限的音頻數(shù)據(jù)的已解碼部分并參考帶寬擴(kuò)展信息,產(chǎn)生處于未被帶寬受限的音頻數(shù)據(jù)的已解碼部分覆蓋的頻帶的至少一部分之內(nèi)的音頻數(shù)據(jù),然后將所產(chǎn)生的音頻數(shù)據(jù)補(bǔ)入帶寬受限的音頻數(shù)據(jù)的已解碼部分。
8.根據(jù)權(quán)利要求7所述的方法,其中產(chǎn)生在此部分頻帶內(nèi)的音頻數(shù)據(jù)從而到達(dá)帶寬受限的音頻數(shù)據(jù)已編碼部分的邊界。
9.根據(jù)權(quán)利要求8所述的方法,其中產(chǎn)生在此部分頻帶的音頻數(shù)據(jù),從而到達(dá)用于偽子波變換的濾波器組的邊界。
10.根據(jù)權(quán)利要求8所述的方法,其中假如音頻數(shù)據(jù)未到達(dá)用于偽子波變換的濾波器組的邊界,則插入帶寬受限音頻信號已解碼部分與所產(chǎn)生音頻數(shù)據(jù)的重疊部分。
11.根據(jù)權(quán)利要求7所述的方法,其中輸入音頻比特流按以下順序多路分解從輸入音頻比特流采樣對應(yīng)于基層的數(shù)據(jù),從輸入音頻比特流采樣帶寬擴(kuò)展信息,并從輸入音頻比特流采樣對應(yīng)于其余增強(qiáng)層的數(shù)據(jù)。
12.根據(jù)權(quán)利要求7所述的方法,其中輸入音頻比特流按以下順序多路分解從輸入音頻比特流采樣帶寬擴(kuò)展信息,從輸入音頻比特流采樣對應(yīng)于基層的數(shù)據(jù),并從輸入音頻比特流采樣對應(yīng)于其余增強(qiáng)層的數(shù)據(jù)。
13.根據(jù)權(quán)利要求7所述的方法,其中算術(shù)解碼包括差分解碼對應(yīng)于基層的輔助信息;比特分割解碼對應(yīng)于基層的多個量化采樣值;為下一增強(qiáng)層重復(fù)差分解碼和比特分割解碼直到多個預(yù)定層完成解碼。
14.根據(jù)權(quán)利要求7所述的方法,其中算術(shù)解碼包括差分解碼對應(yīng)于基層的包括比例因子信息和編碼模型信息的輔助信息;參考編碼模型信息,比特分割解碼對應(yīng)于基層的多個量化采樣值;并為下一增強(qiáng)層重復(fù)差分解碼和比特分割解碼直到多個預(yù)定層完成解碼。
15.一種編碼音頻數(shù)據(jù)的裝置,此裝置包括一帶寬擴(kuò)展編碼器,用于帶寬擴(kuò)展編碼音頻數(shù)據(jù)、輸出帶寬受限的音頻數(shù)據(jù)并產(chǎn)生帶寬擴(kuò)展信息;一細(xì)??缮炜s編碼器,用于將帶寬受限的音頻數(shù)據(jù)編碼為包括一基層和至少一增強(qiáng)層的分層結(jié)構(gòu)從而控制比特率;一多路復(fù)用器,用于對算術(shù)編碼帶寬受限的音頻數(shù)據(jù)和帶寬擴(kuò)展信息進(jìn)行多路復(fù)用。
16.根據(jù)權(quán)利要求15所述的裝置,其中細(xì)粒可伸縮編碼器差分編碼對應(yīng)于基層的輔助信息,比特分割編碼對應(yīng)于基層的多個量化采樣值,并比特分割編碼對應(yīng)于下一增強(qiáng)層的輔助信息和多個量化采樣值直到多個預(yù)定層完成編碼。
17.根據(jù)權(quán)利要求15所述的裝置,其中細(xì)??缮炜s編碼器差分編碼對應(yīng)于基層的包含比例因子信息和編碼模型信息的輔助信息,參考編碼模型信息比特分割編碼對應(yīng)于基層的多個量化采樣值,編碼對應(yīng)于下一增強(qiáng)層包含比例因子信息和編碼模型信息的輔助信息直到多個預(yù)定層完成編碼,并比特分割編碼對應(yīng)于下一增強(qiáng)層的輔助信息和多個量化采樣值。
18.根據(jù)權(quán)利要求15所述的裝置,其中細(xì)??缮炜s編碼器通過偽子波變換音頻數(shù)據(jù)獲得量化采樣值。
19.根據(jù)權(quán)利要求15所述的裝置,其中多路復(fù)用器按以下順序多路復(fù)用已編碼帶寬受限的音頻數(shù)據(jù)和帶寬擴(kuò)展信息定位一部分對應(yīng)于基層的已編碼帶寬受限的音頻數(shù)據(jù),定位帶寬擴(kuò)展信息,并定位對應(yīng)于其余增強(qiáng)層的部分已編碼帶寬受限數(shù)據(jù)。
20.一種用于解碼音頻數(shù)據(jù)的裝置,此裝置包括一多路分解器,用于對一個輸入音頻比特流進(jìn)行多路分解并對被編碼成具有一基層和至少一增強(qiáng)層的分層結(jié)構(gòu)的帶寬受限的音頻數(shù)據(jù)以及帶寬擴(kuò)展信息進(jìn)行采樣;一細(xì)??缮炜s算術(shù)解碼器,用于對對應(yīng)于基層的至少一部分帶寬受限的音頻數(shù)據(jù)進(jìn)行解碼;一帶寬擴(kuò)展解碼器,用于根據(jù)帶寬受限的音頻數(shù)據(jù)的已解碼部分并參考帶寬擴(kuò)展信息,產(chǎn)生處于至少一部分未被帶寬受限的音頻數(shù)據(jù)的已解碼部分覆蓋的頻帶內(nèi)的音頻數(shù)據(jù),然后將所產(chǎn)生的音頻數(shù)據(jù)補(bǔ)入帶寬受限的音頻數(shù)據(jù)的已解碼部分。
21.根據(jù)權(quán)利要求20所述的裝置,其中細(xì)??缮炜s哈夫曼解碼器差分解碼對應(yīng)于基層的輔助信息,比特分割解碼對應(yīng)于基層的多個量化采樣值,并解碼對應(yīng)于下一增強(qiáng)層的輔助信息直到多個預(yù)定層完全解碼,并比特分割解碼對應(yīng)于下一增強(qiáng)層的多個量化采樣值。
22.根據(jù)權(quán)利要求20所述的裝置,其中多路分解器按以下順序多路分解輸入音頻比特流從輸入音頻比特流采樣對應(yīng)于基層的數(shù)據(jù),從輸入音頻比特流采樣帶寬擴(kuò)展信息,并從輸入音頻比特流采樣對應(yīng)于其余增強(qiáng)層的數(shù)據(jù)。
23.根據(jù)權(quán)利要求20所述的裝置,其中多路分解器可按以下順序多路分解輸入音頻比特流從輸入音頻比特流采樣帶寬擴(kuò)展信息,從輸入音頻比特流采樣對應(yīng)于基層的數(shù)據(jù),并從輸入音頻比特流采樣對應(yīng)于其余增強(qiáng)層的數(shù)據(jù)。
全文摘要
本發(fā)明提供了利用帶寬擴(kuò)展技術(shù)編碼和解碼音頻數(shù)據(jù)的方法和裝置。此方法包括帶寬擴(kuò)展編碼音頻數(shù)據(jù),輸出帶寬受限的音頻數(shù)據(jù),并產(chǎn)生帶寬擴(kuò)展信息;將帶寬受限的音頻數(shù)據(jù)算術(shù)編碼為具有一基層和至少一增強(qiáng)層的分層結(jié)構(gòu)從而控制比特率;并多路復(fù)用算術(shù)編碼帶寬受限的音頻數(shù)據(jù)和帶寬擴(kuò)展信息。
文檔編號G10L19/00GK1532808SQ03165020
公開日2004年9月29日 申請日期2003年9月17日 優(yōu)先權(quán)日2003年3月22日
發(fā)明者金重會, 金尚煜 申請人:三星電子株式會社