專利名稱:編碼設(shè)備和解碼設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種編碼設(shè)備,該編碼設(shè)備通過對信號進(jìn)行編碼而壓縮數(shù)據(jù),該信號是使用一種諸如正交變換的方法,以較少量的被編碼的比特流把時間域中的音頻信號(例如聲音或音樂信號)變換成頻率域中的音頻信號獲得的。另外,本發(fā)明還涉及一種解碼設(shè)備,這種解碼設(shè)備接收到被編碼數(shù)據(jù)流后解壓縮數(shù)據(jù)。
背景技術(shù):
到目前為止,人們已經(jīng)開發(fā)了許多對音頻信號進(jìn)行編碼和解碼的方法。特別是,最近,作為一種用于高效再現(xiàn)高質(zhì)量聲音的編碼方法,ISO/IEC中的國際標(biāo)準(zhǔn)化的IS13818-7已普遍得以公認(rèn),并受到高度重視。這一編碼方法被稱為AAC(高級音頻編碼)。最近幾年中,AAC適用于被稱為MPEG4的標(biāo)準(zhǔn),而且還開發(fā)出了一種被稱為MPEG4-AAC的系統(tǒng),這一系統(tǒng)具有添加于IS13818-7中的某些擴(kuò)展的功能。MPEG4-AAC的信息部分中描述了編碼規(guī)程的一個例子。
以下參照圖1解釋了使用傳統(tǒng)方法的音頻編碼設(shè)備。圖1是一個結(jié)構(gòu)框圖,描述了傳統(tǒng)編碼設(shè)備100的結(jié)構(gòu)。編碼設(shè)備100包括一個頻譜放大單元101、一個頻譜量化單元102、一個霍夫曼(Huffman)編碼單元103、以及一個被編碼數(shù)據(jù)流傳送單元104。通過以一個固定頻率對模擬音頻信號取樣獲得時間域中的音頻離散信號流,將音頻離散信號流按一個固定的時間間隔劃分成固定數(shù)量的采樣,并經(jīng)由一個未在這里加以描述的時間-頻率變換單元將它們變換成頻率域中的數(shù)據(jù),然后,作為向編碼設(shè)備100的輸入信號將它們發(fā)送到頻譜放大單元101。頻譜放大單元101對每一預(yù)定頻帶以一個確定的增益放大包括在預(yù)定頻帶中的頻譜。頻譜量化單元102使用一個預(yù)定的轉(zhuǎn)換表達(dá)式量化被放大的頻譜。在ACC方法的情況中,通過把使用浮點(diǎn)表示的頻譜數(shù)據(jù)四舍五入為一個整數(shù)值,進(jìn)行量化?;舴蚵幋a單元103根據(jù)霍夫曼編碼對某些段組中的被量化的頻譜數(shù)據(jù)進(jìn)行編碼,并對頻譜放大單元101中每一預(yù)定頻帶中的增益和指定用于根據(jù)霍夫曼編碼進(jìn)行量化的一個轉(zhuǎn)換表達(dá)式的數(shù)據(jù)進(jìn)行編碼,然后把它們的代碼發(fā)送到被編碼數(shù)據(jù)流傳送單元104。經(jīng)由一個傳輸通道或一個記錄介質(zhì),把根據(jù)霍夫曼編碼加以編碼的被編碼數(shù)據(jù)流從被編碼數(shù)據(jù)流傳送單元104傳送到一個解碼設(shè)備,并通過解碼設(shè)備將其重新構(gòu)造成時間域中的一個音頻信號。傳統(tǒng)的編碼設(shè)備按以上所描述的過程加以運(yùn)作。
在傳統(tǒng)編碼設(shè)備100中,對數(shù)據(jù)量的壓縮能力依賴于霍夫曼編碼單元103的性能。因此,當(dāng)以高壓縮率,即使用少量的數(shù)據(jù),進(jìn)行編碼時,必須充分地減小頻譜放大單元101中的增益,并對頻譜量化單元102所獲得的被量化的頻譜流進(jìn)行編碼,使得霍夫曼編碼單元103中數(shù)據(jù)規(guī)模變得更小。然而,如果根據(jù)這一方法進(jìn)行編碼以減小數(shù)據(jù)量,那么用于再現(xiàn)聲音和音樂的帶寬變窄。因此,不可否認(rèn),當(dāng)聽聲音時,聲音將是不清楚的。因此,不可能維持聲音質(zhì)量。這是一個問題。
本發(fā)明的目的是,根據(jù)以上所提到的問題,提供一種能夠以高壓縮率對音頻信號進(jìn)行編碼的編碼設(shè)備,以及一種可以對被編碼音頻信號進(jìn)行解碼、并可再現(xiàn)寬帶頻譜數(shù)據(jù)和寬帶音頻信號的解碼設(shè)備。
發(fā)明內(nèi)容
為了解決以上所提到的問題,根據(jù)本發(fā)明的編碼設(shè)備是一種對輸入信號進(jìn)行編碼的編碼設(shè)備,包括一個時間-頻率變換單元,用于把一個時間域中的輸入信號變換成包括一個較低頻譜的頻譜;一個頻帶擴(kuò)展單元,用于產(chǎn)生擴(kuò)展數(shù)據(jù),該擴(kuò)展數(shù)據(jù)以一個高于該較低頻譜的較高頻率指定一個較高頻譜;以及一個編碼單元,用于對較低頻譜和擴(kuò)展數(shù)據(jù)進(jìn)行編碼,并輸出被編碼的較低頻譜和擴(kuò)展數(shù)據(jù),其中,頻帶擴(kuò)展單元產(chǎn)生一個第一參數(shù)和一個第二參數(shù)作為擴(kuò)展數(shù)據(jù),第一參數(shù)從形成較低頻譜的多個部分頻譜中指定一個部分頻譜,該部分頻譜將被復(fù)制為較高頻譜,第二參數(shù)指定被復(fù)制之后該部分頻譜的增益。
如以上所描述的,本發(fā)明的編碼設(shè)備使得以低比特率在一個寬頻帶中提供音頻編碼數(shù)據(jù)流成為可能。對于低頻分量,本發(fā)明的編碼設(shè)備使用一種壓縮技術(shù),例如霍夫曼編碼方法,對其頻譜進(jìn)行編碼。另一方面,對于高頻分量,它不對其頻譜進(jìn)行編碼,而主要僅對用于復(fù)制替代較高頻譜的較低頻譜的數(shù)據(jù)進(jìn)行編碼。因此,具有的效果是可以減少代表較高頻率分量的被編碼數(shù)據(jù)流所占用的數(shù)據(jù)量。
另外,本發(fā)明的解碼設(shè)備是一種對被編碼信號進(jìn)行解碼的解碼設(shè)備,其中,被編碼信號包括一個較低頻譜和擴(kuò)展數(shù)據(jù),擴(kuò)展數(shù)據(jù)包括一個第一參數(shù)和一個第二參數(shù),它們以一個高于該較低頻譜的較高頻率指定一個較高頻譜,該解碼設(shè)備包括一個解碼單元,用于通過對被編碼信號進(jìn)行解碼,產(chǎn)生較低頻譜和擴(kuò)展數(shù)據(jù);一個頻帶擴(kuò)展單元,用于由該較低頻譜、第一參數(shù)和第二參數(shù),產(chǎn)生較高頻譜;以及一個頻率-時間變換單元,用于把一個通過組合所產(chǎn)生的較高頻譜和較低頻譜所獲得的頻譜變換成時間域中的信號,該頻帶擴(kuò)展單元復(fù)制一個部分頻譜,該部分頻譜是從形成該較低頻譜的多個部分頻譜中通過第一參數(shù)所指定的,該頻帶擴(kuò)展單元根據(jù)第二參數(shù)、確定在被復(fù)制之后該部分頻譜的增益,并產(chǎn)生所獲得的部分頻譜作為較高頻譜。
根據(jù)本發(fā)明的解碼設(shè)備,由于通過添加一些控制,例如對較低頻率分量的復(fù)制的增益調(diào)整,產(chǎn)生較高頻率分量,所以具有的效果是能夠以少量數(shù)據(jù)從被編碼數(shù)據(jù)流再現(xiàn)寬帶聲音。
另外,頻帶擴(kuò)展單元還可以向所產(chǎn)生的較高頻譜添加一個噪音頻譜,而且頻率-時間變換單元還可以把通過組合較高頻譜與所添加的噪音頻譜所獲得的頻譜和較低頻譜變換成時間域中的信號。
根據(jù)本發(fā)明的解碼設(shè)備,由于通過把噪音頻譜添加到較高頻譜上,在所復(fù)制的較低頻率分量上執(zhí)行增益調(diào)整,所以具有的效果是能夠拓寬頻帶而不過多提高較高頻譜的音調(diào)。
附圖簡述通過以下結(jié)合附圖對本發(fā)明的描述,本發(fā)明的這些和其它目的、優(yōu)點(diǎn)以及特性將變得十分明顯。這些
了本發(fā)明的一個具體的實(shí)施例。在這些附圖中圖1是一個結(jié)構(gòu)圖,說明了傳統(tǒng)編碼設(shè)備的結(jié)構(gòu)。
圖2是一個結(jié)構(gòu)圖,說明了根據(jù)本發(fā)明第一實(shí)施例的編碼設(shè)備的結(jié)構(gòu)。
圖3A示出由MDCT單元輸出的一系列MDCT系數(shù)的示意圖。
圖3B示出圖3A中所示的MDCT系數(shù)中的第0個~第(maxline-1)個MDCT系數(shù)的示意圖。
圖3C示出如何在圖2中所示的一個BWE編碼單元中產(chǎn)生被擴(kuò)展的音頻編碼數(shù)據(jù)流的一個例子的示意圖。
圖4A是一個波形圖,示出原聲的一系列MDCT系數(shù)。
圖4B是一個波形圖,示出由BWE編碼單元通過替代所產(chǎn)生的一系列MDCT系數(shù)。
圖4C是一個波形圖,示出當(dāng)在圖4B中所示的一系列MDCT系數(shù)上給出增益控制時所產(chǎn)生的一系列MDCT系數(shù)。
圖5A示出通常的音頻編碼比特流的一個例子的示意圖。
圖5B示出根據(jù)本實(shí)施例的編碼設(shè)備所輸出的音頻編碼比特流的一個例子的示意圖。
圖5C示出一個被擴(kuò)展的音頻編碼數(shù)據(jù)流的一個例子的示意圖,該數(shù)據(jù)流被描述在圖5B中所示的被擴(kuò)展的音頻編碼數(shù)據(jù)流部分中。
圖6是一個結(jié)構(gòu)框圖,示出對從圖2中所示編碼設(shè)備所輸出的音頻編碼比特流進(jìn)行解碼的解碼設(shè)備的結(jié)構(gòu)。
圖7示出在第二實(shí)施例的BWE編碼單元中如何產(chǎn)生被擴(kuò)展的頻譜數(shù)據(jù)的示意圖。
圖8A示出以與第二實(shí)施例相同的方式所劃分的較低和較高子頻帶的示意圖。
圖8B示出較低子頻帶A中的一系列MDCT系數(shù)的一個例子的示意圖。
圖8C示出通過反轉(zhuǎn)較低子頻帶A中MDCT系數(shù)的順序所獲得的一個子頻帶As中的一系列MDCT系數(shù)的一個例子的示意圖。
圖8D示出通過反轉(zhuǎn)較低子頻帶A中MDCT系數(shù)的符號所獲得的一個子頻帶Ar的示意圖。
圖9A示出對一個較高子頻帶h0所指定的較低子頻帶A中的MDCT系數(shù)的一個例子的示意圖。
圖9B示出與由噪音產(chǎn)生單元所產(chǎn)生的較低子頻帶A中MDCT系數(shù)個數(shù)相同的MDCT系數(shù)的一個例子的示意圖。
圖9C說明了替代較高子頻帶h0的MDCT系數(shù)的一個例子的示意圖,這些MDCT系數(shù)是使用圖9A中所示較低子頻帶A中的MDCT系數(shù)、以及圖9B中所示噪音產(chǎn)生單元所產(chǎn)生的MDCT系數(shù)產(chǎn)生的。
圖10A是在時刻t0時一個幀中的MDCT系數(shù)的示意圖。
圖10B是在時刻t1時下一個幀中的MDCT系數(shù)的示意圖。
圖10C是在時刻t2時再下一個幀中的MDCT系數(shù)的示意圖。
圖11A是在時刻t0時一個幀中的MDCT系數(shù)的示意圖。
圖11B是在時刻t1時下一個幀中的MDCT系數(shù)的示意圖。
圖11C是在時刻t2時再下一個幀中的MDCT系數(shù)的示意圖。
圖12示出一個解碼設(shè)備的結(jié)構(gòu)框圖,該解碼設(shè)備由使用一個QMF濾波器所編碼的一個音頻編碼比特流對寬帶時間-頻率信號進(jìn)行解碼。
圖13是時間-頻率信號的一個例子的示意圖,這些信號由第六實(shí)施例的解碼設(shè)備進(jìn)行解碼。
實(shí)現(xiàn)本發(fā)明的最佳方式以下是參照附圖(圖2~圖13)對根據(jù)本發(fā)明實(shí)施例的編碼設(shè)備和解碼設(shè)備的說明。
(第一實(shí)施例)首先說明編碼設(shè)備。圖2是一個結(jié)構(gòu)框圖,說明了根據(jù)本發(fā)明第一實(shí)施例的編碼設(shè)備200的結(jié)構(gòu)。編碼設(shè)備200是這樣一種設(shè)備它把較低頻帶頻譜劃分成一個固定頻率帶寬中的若干子頻帶,并輸出一個音頻編碼比特流,該音頻編碼比特流具有用于指定將被復(fù)制于包括在其中的較高頻帶的子頻帶的數(shù)據(jù)。編碼設(shè)備200包括一個預(yù)處理單元201、一個MDCT單元202、一個量化單元203、一個BWE編碼單元204、以及一個被編碼數(shù)據(jù)流產(chǎn)生單元205??紤]到由于在編碼和/或解碼時的量化失真所導(dǎo)致的聲音質(zhì)量方面的變化,預(yù)處理單元201判斷是否輸入音頻信號應(yīng)該被量化在每幀小于2048個采樣(SHORT窗口)中,其給時間分辨率以較高優(yōu)先級,或是輸入音頻信號應(yīng)該照原樣被量化在每2048個采樣中(LONG窗口)。MDCT單元202使用修改的離散余弦變換(MDCT)變換從預(yù)處理單元201輸出的時間域中的音頻離散信號流,并輸出頻率域中的頻譜。量化單元203量化從MDCT單元202輸出的頻譜的較低頻帶,使用霍夫曼編碼對其進(jìn)行編碼,然后將其輸出。BWE編碼單元204接收到MDCT單元202所獲得的一個MDCT系數(shù)后,把出自所接收頻譜中的較低頻帶頻譜劃分成具有一個固定頻率帶寬的若干個子頻帶,并基于從MDCT單元202輸出的較高頻帶頻譜、指定將被復(fù)制到替代較高頻帶頻譜的較高頻帶的較低子頻帶。BWE編碼單元204產(chǎn)生被擴(kuò)展的頻譜數(shù)據(jù)(其指示對每一較高子頻帶所指定的較低子頻帶);如果需要的話,量化所產(chǎn)生的被擴(kuò)展頻譜數(shù)據(jù),并使用霍夫曼編碼對其進(jìn)行編碼,以輸出被擴(kuò)展的音頻編碼數(shù)據(jù)流。被編碼數(shù)據(jù)流產(chǎn)生單元205分別把從量化單元203輸出的較低頻帶音頻編碼數(shù)據(jù)流和從BWE編碼單元204輸出的被擴(kuò)展音頻編碼數(shù)據(jù)流記錄在根據(jù)ACC標(biāo)準(zhǔn)定義的音頻編碼比特流的音頻編碼數(shù)據(jù)流部分和被擴(kuò)展音頻編碼數(shù)據(jù)流部分中,并把它們向外部輸出。
下面將解釋上述構(gòu)造的編碼設(shè)備200的操作。首先,例如,一個音頻離散信號流被輸入到預(yù)處理單元201,每幀中包括2048個采樣,該音頻離散信號流是以一采樣頻率(例如44.1kHz)采樣的。一幀中的音頻信號不局限于2048個采樣,但為了便于對下面將加以描述的解碼設(shè)備的解釋,以下的解釋將以2048個采樣的情況為例。預(yù)處理單元20 1根據(jù)所輸入的音頻信號判斷應(yīng)該在一個LONG窗口中或是在一個SHORT窗口中對所輸入的音頻信號進(jìn)行編碼。以下將描述預(yù)處理單元201判定應(yīng)在一個LONG窗口中對音頻信號進(jìn)行編碼時的情況。
把從預(yù)處理單元201輸出的音頻離散信號流從時間域中的離散信號以固定的間隔變換成頻譜數(shù)據(jù),然后將其輸出。當(dāng)時間-頻率變換時,MDCT是公共的。作為間隔,可以使用128、256、512、1024、以及2048個采樣中的任何一個。在MDCT中,時間域中離散信號的采樣的個數(shù)可以與所變換的頻譜數(shù)據(jù)的采樣的個數(shù)相同。MDCT對本領(lǐng)域技術(shù)人員是公知的。此處,將根據(jù)這樣的假設(shè)進(jìn)行解釋把從預(yù)處理單元201輸出的2048個采樣的音頻信號輸入到MDCT單元202,并對它們進(jìn)行MDCT。另外,MDCT單元202還對它們使用過去的幀(2048個采樣)和新輸入的幀(2048個采樣)執(zhí)行MDCT,并輸出2048個采樣的MDCT系數(shù)。MDCT通常由表達(dá)式1等給出。
表達(dá)式1Xi,k=2Σn=0N-1Zi,ncos(2πN(n+n0)(k+12))]]>Zi,n開窗的輸入音頻信號n采樣指針kMDCT系數(shù)的指針i幀數(shù)N窗口長度n0=(N/2+1)/2總體上講,在編碼過程中,如上所獲得的頻譜數(shù)據(jù)由相應(yīng)于數(shù)據(jù)壓縮的完全可逆的或不可逆的代碼(例如霍夫曼編碼)加以表示,以產(chǎn)生被編碼數(shù)據(jù)流。此處,把第0個~第1023個較低頻帶MDCT系數(shù),即按照從較低頻率分量到較高頻率分量的頻率順序排列的2048個采樣的MDCT系數(shù)的一半,輸入到量化單元203。量化單元203使用一種量化方法,例如ACC,量化所輸入的MDCT系數(shù),并產(chǎn)生較低頻帶音頻編碼數(shù)據(jù)流。通常,在如AAC這樣的量化方法中,不定義將被量化的MDCT系數(shù)的個數(shù)。因此,量化單元203可以量化所有被輸入的較低頻帶MDCT系數(shù)(1024個系數(shù))或它們中的一部分。此處,量化單元203量化MDCT系數(shù)中的第0~第“maxline-1”的“maxline”個系數(shù),并對它們進(jìn)行編碼。此處,“maxline”是將由傳統(tǒng)編碼設(shè)備量化和編碼的MDCT系數(shù)的頻率上限。與此同時,所有從MDCT單元202輸出的MDCT系數(shù)(2048個系數(shù))被輸入到BWE編碼單元204。
現(xiàn)在,將參照圖3A~3C更詳細(xì)地解釋圖2A中所示的BWE編碼單元204中的用于產(chǎn)生被擴(kuò)展音頻編碼數(shù)據(jù)流的處理過程。圖3A說明了MDCT單元202所輸出的一系列MDCT系數(shù)。圖3B說明了圖3A中所示的MDCT系數(shù)中、由量化單元203加以編碼的第0個~第(maxline-1)個MDCT系數(shù)。圖3C說明了如何在圖2中所示的BWE編碼單元中產(chǎn)生一個被擴(kuò)展音頻編碼數(shù)據(jù)流的一個例子。在圖3A~3C中,水平軸表示頻率,并從較低到較高頻率把數(shù)字0~2047賦予MDCT系數(shù)??v軸表示MDCT系數(shù)的值。在這些圖中,由沿頻率方向的連續(xù)的波形代表頻譜。然而,它們不是連續(xù)的波形,而是離散的頻譜。如圖3A中所示,從MDCT單元202輸出的2048個MDCT系數(shù)可以代表以最大帶寬在取樣頻率的頻帶之一半寬度中、在一個固定時間周期內(nèi)采樣的原聲。一般情況下,在傳統(tǒng)編碼設(shè)備中,通常的情況是,僅對圖3A中所示MDCT系數(shù)中的對于聽覺是重要的(例如最高達(dá)”maxline”)較低頻帶MDCT系數(shù)被量化和編碼,并被傳輸?shù)浇獯a設(shè)備上。因此,BWE編碼單元204產(chǎn)生被擴(kuò)展頻譜數(shù)據(jù),其代表替代圖3A中所示較高頻帶MDCT系數(shù)本身的“maxline”或“maxline”以上的較高頻帶MDCT系數(shù)。換句話說,BWE編碼單元204目的在于對第(maxline)個~第(targetline-1)個MDCT系數(shù)進(jìn)行編碼,如圖3C中所示,因?yàn)榱炕瘑卧?03預(yù)先對第0個~第(maxline-1)個系數(shù)進(jìn)行了編碼。
首先,BWE編碼單元204假設(shè)了其中數(shù)據(jù)應(yīng)被再現(xiàn)為解碼設(shè)備中的音頻信號的較高頻帶中的范圍(具體來說,從”maxline”到“targetline”的頻率范圍),并把這一假設(shè)的范圍劃分成具有一個固定頻率帶寬的若干子頻帶。其次,BWE編碼單元204劃分所有或部分較低頻帶,包括所輸入的MDCT系數(shù)中的第0個~第(maxline-1)個MDCT系數(shù),并指定可以替代包括第(maxline)個~第2047個MDCT系數(shù)的相應(yīng)較高子頻帶的較低子頻帶。作為可以替代每一較高子頻帶的較低子頻帶,指定其能量與較高子頻帶的能量之差為最小的較低子頻帶?;蛘?,也可以指定這樣的較低子頻帶其中,其絕對值為峰值的MDCT系數(shù)的頻率域中的位置最接近于較高頻帶MDCT系數(shù)的位置。
在圖3C中所示的BWE編碼單元204的情況中,假設(shè)在代表MDCT系數(shù)的數(shù)字的“startline”、“targetline”、“endline”以及“sbw”之間存在著下列關(guān)系(表達(dá)式2)。
表達(dá)式2endline=maxline-shiftlenstartline=endline-W·sbwtargetline=maxline+V·sbwW例如為4V例如為8此處,“shiftlen”可以為一個預(yù)定的值,也可以依據(jù)所輸入的MDCT系數(shù)來計(jì)算,并且可以在BWE編碼單元204中對表示該值的數(shù)據(jù)進(jìn)行編碼。
圖3C描述了這樣一種情況把較高頻帶劃分成8個子頻帶,即MDCT系數(shù)h0~h7,分別具有包括“sbw”個MDCT系數(shù)采樣的頻率寬度,較低頻帶可以具有4個MDCT系數(shù)子頻帶A、B、C以及D,分別具有“sbw”個采樣。在這一情況中,為了方便起見,把“startline”和“endline”之間的范圍劃分成4個子頻帶,并且把“maxline”和“targetline”之間的范圍劃分成8個子頻帶,但不總是把子頻帶的個數(shù)和一個子頻帶中采樣的個數(shù)限制為這樣的值。BWE編碼單元204指定具有頻率寬度“sbw”的較低子頻帶A、B、C以及D,并對它們進(jìn)行編碼,這些較低子頻帶替代具有相同的頻率寬度”sbw”的較高子頻帶h0~h7中MDCT系數(shù)。此處,“替代”意味著把所獲得MDCT系數(shù)的一部分,在這一情況中為較低子頻帶A~D的MDCT系數(shù),復(fù)制為較高子頻帶h0~h7中的MDCT系數(shù)。這一替代可以包括在所替代的MDCT系數(shù)上進(jìn)行增益控制時的情況。
在BWE編碼單元204的情況中,對于每個較高子頻帶h0~h7,表示替代較高子頻帶的較低子頻帶所要求的數(shù)據(jù)量最多為2個比特,因?yàn)樗鼭M足了針對每一較高子頻帶可以指定4個較低子頻帶A~D中之一的需求。如以上所描述的,BWE編碼單元204對指示哪一個較低子頻帶A~D替代較高子頻帶h0~h7的被擴(kuò)展頻譜數(shù)據(jù)進(jìn)行編碼,并用較低子頻帶的被編碼數(shù)據(jù)流產(chǎn)生被擴(kuò)展的音頻編碼數(shù)據(jù)流。
而且,BWE編碼單元204還調(diào)整所產(chǎn)生的被擴(kuò)展音頻編碼數(shù)據(jù)流的振幅。
圖4A是一個波形圖,說明了一個原聲的一系列MDCT系數(shù)。圖4B是一個波形圖,說明了由BWE編碼單元204通過替代所產(chǎn)生的一系列MDCT系數(shù)。圖4C是一個波形圖,說明了當(dāng)在圖4B中所示的一系列MDCT系數(shù)上給予增益控制時所產(chǎn)生的一系列MDCT系數(shù)。如圖4A中所示,BWE編碼單元204把從“maxline”到“targetline”的較高頻帶MDCT系數(shù)劃分為多個頻帶,并編碼每一頻帶的增益數(shù)據(jù)。從“maxline”到“targetline”的頻帶可以被劃分,以便采用與圖3中所示的較高子頻帶h0~h7相同的方法或其它的方法編碼增益數(shù)據(jù)。此處,將參照圖4解釋使用相同劃分方法的情況。
包含在較高子頻帶h0中的原聲的MDCT系數(shù)為x(0),x(1),……,x(sbw-1),如圖4A中所示;通過替代所獲得的較高子頻帶h0中的MDCT系數(shù)為r(0),r(1),……,r(sbw-1),如圖4B中所示;以及在圖4C中的子頻帶h0中的MDCT系數(shù)為y(0),y(1),……,y(sbw-1)。根據(jù)下列表達(dá)式3,為數(shù)組x、r以及y獲得增益g0,然后對其進(jìn)行編碼。
表達(dá)式3g0=Σx·xΣr·r]]>對于較高子頻帶h1~h7,按與以上相同的方式計(jì)算增益數(shù)據(jù)和對其進(jìn)行編碼。也使用預(yù)定義數(shù)量的比特把這些增益數(shù)據(jù)g0~g7編碼于被擴(kuò)展音頻編碼數(shù)據(jù)流中。
在從編碼設(shè)備200所輸出的音頻編碼比特流中,對如上編碼的被擴(kuò)展音頻編碼數(shù)據(jù)流進(jìn)行描述,如圖5中示意性說明的。圖5A說明了通常的音頻編碼比特流的一個例子。圖5B說明了根據(jù)本實(shí)施例的編碼設(shè)備200所輸出的一個音頻編碼比特流的一個例子。圖5C說明了圖5B中所示的被擴(kuò)展音頻編碼數(shù)據(jù)流中所描述的一個被擴(kuò)展音頻編碼數(shù)據(jù)流的一個例子。如圖5A中所示,當(dāng)在流1中的每一個幀中形成音頻編碼比特流時,編碼設(shè)備200采用每一幀的一部分(例如一個陰影區(qū))作為流2中的一個被擴(kuò)展音頻編碼數(shù)據(jù)流部分,如圖5B中所示。這一被擴(kuò)展音頻編碼數(shù)據(jù)流部分是MPEG-2AAC和MPEG-4 AAC中所描述的“data stream element”的區(qū)域。這一“data stream element”是一個備用區(qū)域,用于描述當(dāng)擴(kuò)展傳統(tǒng)編碼系統(tǒng)的功能時用于擴(kuò)展的數(shù)據(jù),并不被傳統(tǒng)解碼設(shè)備視為一個音頻編碼數(shù)據(jù)流,即使在其中記錄了任何種類的數(shù)據(jù)。另外,“data stream element”還是一個用于填充無意義數(shù)據(jù)(例如“0”)、以便保持音頻編碼數(shù)據(jù)長度相同的區(qū)域,例如,MPEG-2 AAC和MPEG-4 AAC中的Fill Element(填充元素)的一個區(qū)域。通過在音頻編碼比特流中的這一區(qū)域中描述被擴(kuò)展音頻編碼數(shù)據(jù)流,當(dāng)再現(xiàn)被擴(kuò)展音頻編碼數(shù)據(jù)流為音頻信號時,不會出現(xiàn)噪音,即使本發(fā)明的音頻編碼比特流被傳統(tǒng)解碼設(shè)備解碼時,所以可以再現(xiàn)具有與傳統(tǒng)設(shè)備相同帶寬的音頻信號。
另外,如圖5C中所示,在被擴(kuò)展音頻編碼數(shù)據(jù)流中,描述了一個指示是否使用以與最后幀中被擴(kuò)展音頻編碼數(shù)據(jù)流相同的方法劃分的較低子頻帶A~D的項(xiàng)目、以及指示相應(yīng)的較高子頻帶h0~h7的MDCT系數(shù)的若干項(xiàng)目。在指示相應(yīng)的較高子頻帶h0~h7的MDCT系數(shù)的項(xiàng)目中,描述了指示所指定的較低子頻帶A~D的數(shù)據(jù)和它們的增益數(shù)據(jù)。在指示是否使用與最后幀中被擴(kuò)展音頻編碼數(shù)據(jù)流相同的較低子頻帶A~D的項(xiàng)目中,當(dāng)使用按與最后幀相同的方式加以劃分的較低子頻帶之一替代較高子頻帶h0~h7的MDCT系數(shù)時,“1”被描述,否則,即當(dāng)使用按與最后幀不同的一個新方法加以劃分的較低子頻帶A~D之一替代它們時,“0”被描述。在那些指示所指定的A~D中的較低子頻帶的項(xiàng)目中,描述了指定4個較低子頻帶A~D之一的2個比特的數(shù)據(jù)。另外,例如增益數(shù)據(jù)被描述在4個比特中。這樣做,當(dāng)由按與最后幀相同的方式劃分的較低子頻帶A~D替代較高子頻帶h0~h7時,1+8×(2+4)=49個比特的被擴(kuò)展音頻編碼數(shù)據(jù)流可表示一個幀的較高頻帶MDCT系數(shù)。另外,在使用與最后幀相同的較低子頻帶A~D的幀中,可以僅由例如指示值“1”的1個比特表示被擴(kuò)展音頻編碼數(shù)據(jù)流。
因此,當(dāng)把根據(jù)本發(fā)明的編碼設(shè)備200的音頻信號編碼方法應(yīng)用于傳統(tǒng)編碼方法時,可以使用具有少量數(shù)據(jù)的被擴(kuò)展音頻編碼數(shù)據(jù)流表示較高頻帶,并在較高頻帶中再現(xiàn)具有優(yōu)質(zhì)聲音的寬帶音頻聲音。
以下將解釋解碼設(shè)備。
在解碼過程中,對一個輸入音頻編碼數(shù)據(jù)流進(jìn)行解碼,以獲得頻譜數(shù)據(jù),把頻率域中的頻譜變換成時間域中的數(shù)據(jù),從而再現(xiàn)時間域中的音頻信號。
圖6是一個結(jié)構(gòu)框圖,說明了對從圖2中所示的編碼設(shè)備200所輸出的音頻編碼數(shù)據(jù)流進(jìn)行解碼的一個解碼設(shè)備600的結(jié)構(gòu)。解碼設(shè)備600是這樣的一個解碼設(shè)備它對包括被擴(kuò)展音頻編碼數(shù)據(jù)流的音頻編碼比特流進(jìn)行解碼,并輸出寬帶頻譜數(shù)據(jù)。它包括一個被編碼數(shù)據(jù)流劃分單元601、一個去量化單元602、一個IMDCT(反向修改的離散余弦變換)單元603、一個噪音產(chǎn)生單元604、一個BWE解碼單元605、以及一個被擴(kuò)展IMDCT單元606。被編碼數(shù)據(jù)流劃分單元601把所輸入的音頻編碼比特流劃分成代表較低頻帶的音頻編碼數(shù)據(jù)流和代表較高頻帶的被擴(kuò)展音頻編碼數(shù)據(jù)流,并把所劃分的音頻編碼數(shù)據(jù)流和被擴(kuò)展音頻編碼數(shù)據(jù)流分別輸出到去量化單元602和BWE解碼單元605。去量化單元602對從音頻編碼比特流劃分的音頻編碼數(shù)據(jù)流進(jìn)行去量化,并輸出較低頻帶MDCT系數(shù)。需要加以注意的是,去量化單元602既可以接收音頻編碼數(shù)據(jù)流,也可以接收被擴(kuò)展音頻編碼數(shù)據(jù)流。另外,去量化單元602使用根據(jù)ACC方法的去量化,重新構(gòu)造MDCT系數(shù),如果其在量化單元203中被用作一種量化方法。因此,去量化單元602重新構(gòu)造和輸出第0個~第(maxline-1)個較低頻帶MDCT系數(shù)。
IMDCT單元603使用IMDCT,根據(jù)從去量化單元602輸出的較低頻帶MDCT系數(shù)進(jìn)行頻率-時間變換,并輸出時間域中的較低頻帶音頻信號。具體來說,當(dāng)IMDCT單元603接收從去量化單元602所輸出的較低頻帶MDCT系數(shù)時,獲得1024個采樣的音頻輸出用于每一幀。此處,IMDCT單元603執(zhí)行1024個采樣的IMDCT運(yùn)算。IMDCT運(yùn)算的表達(dá)式通常由下面的表達(dá)式4給出。
表達(dá)式4Xi,n=2NΣk=0N/2-1spec[i][k]cos((n+n0)(k+12))]]>n采樣指針i窗口指針kMDCT系數(shù)的指針N窗口長度n0=(N/2+1)/2另一方面,由被編碼數(shù)據(jù)流劃分單元601從音頻編碼比特流所劃分的被擴(kuò)展音頻編碼數(shù)據(jù)流被輸出到BWE解碼單元605。另外,從去量化單元602輸出的第0個~第(maxline-1)個較低頻帶MDCT系數(shù)和來自噪音產(chǎn)生單元604的輸出被輸入到BWE解碼單元605。以下將詳細(xì)解釋BWE解碼單元605的操作。BWE解碼單元605基于通過對所劃分的被擴(kuò)展音頻編碼數(shù)據(jù)流進(jìn)行解碼獲得的被擴(kuò)展頻譜數(shù)據(jù)、對第(maxline)個~第2047個較高頻帶MDCT系數(shù)進(jìn)行解碼和去量化,并通過把由去量化單元602獲得的第0個~第(maxline-1)個較低頻帶MDCT系數(shù)添加到第(maxline)個~第2047個較高頻帶MDCT系數(shù)上,輸出第0個~第2047個寬帶MDCT系數(shù)。被擴(kuò)展IMDCT單元606對兩倍于IMDCT單元603所執(zhí)行的采樣的采樣進(jìn)行IMDCT運(yùn)算,然后,獲得2048個采樣的寬帶輸出音頻信號用于每幀。
以下將更詳細(xì)地解釋BWE解碼單元605的操作。BWE解碼單元605使用由去量化單元602獲得的第0個~第(maxline-1)個MDCT系數(shù)和被擴(kuò)展音頻編碼數(shù)據(jù)流、重新構(gòu)造第(maxline)個~第(targetline)個MDCT系數(shù)?!皊tartline”、“endline”、“maxline”、“targetline”、“sbw”以及“shiftlen”均為與在編碼設(shè)備200端上由BWE編碼單元204所使用的值相同的值。如圖5C中所示,指示替代較高子頻帶h0~h7中的MDCT系數(shù)的較低子頻帶A~D的數(shù)據(jù)被編碼在被擴(kuò)展音頻編碼數(shù)據(jù)流中。因此,基于該數(shù)據(jù),較高子頻帶h0~h7中的MDCT系數(shù)分別由較低子頻帶A~D中所指定的MDCT系數(shù)加以替代。
因此,BWE解碼單元605獲得了第0個~第(targetline)個MDCT系數(shù)。而且,BWE解碼單元605還基于被擴(kuò)展音頻編碼數(shù)據(jù)流中的增益數(shù)據(jù)執(zhí)行增益控制。如圖4B中所示,BWE解碼單元605產(chǎn)生一系列MDCT系數(shù),這些MDCT系數(shù)被從“maxline”到“targetline”的相應(yīng)的較高子頻帶h0~h7中的較低子頻帶A~D所替代。而且,當(dāng)較高子頻帶h0中的替代MDCT系數(shù)為r(0),r(1),……,r(sbw-1)以及從被擴(kuò)展音頻編碼數(shù)據(jù)流中所獲得的增益數(shù)據(jù)是用于較高子頻帶h0的g0時,BWE解碼單元605可以根據(jù)下列關(guān)系表達(dá)式5獲得一系列增益控制的MDCT系數(shù),如圖4C中所示。具體來說,當(dāng)用于較高子頻帶h0的MDCT系數(shù)為y(0),y(1),……,y(sbw-1)時,增益控制的第i個MDCT系數(shù)y(i)的值由下列表達(dá)式5加以表示。
表達(dá)式5yi=g0·ri按同樣的方式,通過用相應(yīng)的較高子頻帶g1~g7的增益數(shù)據(jù)乘以替代MDCT系數(shù),較高子頻帶h1~h7可以獲得增益控制的MDCT系數(shù)。而且,噪音產(chǎn)生單元604產(chǎn)生白噪音、粉紅噪音或是全部或部分較低頻帶MDCT系數(shù)的隨機(jī)組合的噪音,并把所產(chǎn)生的噪音添加到增益控制的MDCT系數(shù)。這時,可以將所添加的噪音的能量、以及與從較低頻帶所復(fù)制的頻譜相組合的頻譜校正成由表達(dá)式5所代表的頻譜的能量。
在第一實(shí)施例中,已經(jīng)描述了關(guān)于增益數(shù)據(jù)的編碼,該增益數(shù)據(jù)將被根據(jù)表達(dá)式5而增多到替代的MDCT系數(shù)。然而,可以對不是相對增益值而是絕對值的增益數(shù)據(jù)(例如MDCT系數(shù)的能量或平均振幅)進(jìn)行編碼或解碼。
使用如上所構(gòu)造的BWE解碼單元605,可以再現(xiàn)具有優(yōu)質(zhì)聲音、特別是在較高頻帶中的優(yōu)質(zhì)聲音的寬帶音頻信號,即使是使用由少量數(shù)據(jù)所代表的被擴(kuò)展音頻編碼數(shù)據(jù)流。
盡管已經(jīng)描述了根據(jù)AAC方法的編碼設(shè)備200和解碼設(shè)備600,但本發(fā)明的編碼設(shè)備和解碼設(shè)備不局限于此方法,也可以使用任何其它的編碼方法。
另外,在編碼設(shè)備200中,第0個~第2047個MDCT系數(shù)被從MDCT單元202輸出到BWE編碼單元204。然而,BWE編碼單元204還可以接收包括量化失真的MDCT系數(shù),這些包括量化失真的MDCT系數(shù)是通過對那些由量化單元203所量化的MDCT系數(shù)進(jìn)行去量化獲得的。另外,BWE編碼單元204還可以接收這樣的MDCT系數(shù)即分別通過為第0個~第(maxline-1)個較低子頻帶對來自量化單元203的輸出進(jìn)行去量化、以及為第(maxline)個~第(targetline-1)個較高子頻帶對來自MDCT單元202的輸出進(jìn)行去量化獲得的MDCT系數(shù)。
在第一實(shí)施例中,已經(jīng)描述了被擴(kuò)展頻譜數(shù)據(jù)被量化,并視情況對其進(jìn)行編碼。然而,由一個可變長度編碼(例如由霍夫曼編碼)所代表的將被編碼數(shù)據(jù)(被擴(kuò)展頻譜數(shù)據(jù))當(dāng)然也可以被用作被擴(kuò)展音頻編碼數(shù)據(jù)流。響應(yīng)此編碼,解碼設(shè)備不需要對被擴(kuò)展音頻編碼數(shù)據(jù)流去量化,但可以對可變長度編碼(例如由霍夫曼編碼)進(jìn)行解碼。
另外,在第一實(shí)施例中,已經(jīng)描述了本發(fā)明的編碼和解碼方法被應(yīng)用于MPEG-2 AAC和MPEG-4 AAC時的情況。然而,本發(fā)明并不局限于這樣的情況,也可以被應(yīng)用于其它的編碼方法,例如MPEG-1 Audio和MPEG-2 Audio。當(dāng)使用MPEG-1 Audio和MPEG-2 Audio時,被擴(kuò)展音頻編碼數(shù)據(jù)流被應(yīng)用于這些標(biāo)準(zhǔn)中所描述的“ancillary_data”。
在第一實(shí)施例中已經(jīng)描述了通過在所輸入的音頻信號上進(jìn)行時間-頻率變換所獲得的頻譜(MDCT系數(shù))的一個范圍內(nèi)、由較低子頻帶中的頻譜替代較高子頻帶。然而,本發(fā)明并不局限于這一點(diǎn),較高子頻帶可以被替代,直到超過由時間-頻率變換所輸出的頻譜的頻率上限的范圍。在這一情況中,基于代表原聲的較高頻帶頻譜(MDCT系數(shù))不能指定用于替代的較低子頻帶。
(第二實(shí)施例)本發(fā)明的第二實(shí)施例在以下方面不同于第一實(shí)施例。即,在第一實(shí)施例中的BWE編碼單元204把從“startline”到“endline”的一系列較低頻帶MDCT系數(shù)劃分成4個子頻帶A~D,而在第二實(shí)施例中的BWE編碼單元把從“startline”到“endline”的同樣帶寬劃分成7個子頻帶A~G,其中某些部分是重疊的。第二實(shí)施例中的編碼設(shè)備和解碼設(shè)備具有與第一實(shí)施例中的編碼設(shè)備200和解碼設(shè)備600基本相同的結(jié)構(gòu),與第一實(shí)施例的不同之處僅為在編碼設(shè)備中BWE編碼單元701所進(jìn)行的處理和在解碼設(shè)備中的BWE解碼單元702。因此,在第二實(shí)施例中,將僅使用修改的參考編號解釋BWE編碼單元701和BWE解碼單元702,把相同的參考編號賦予在第一實(shí)施例的編碼設(shè)備200和解碼設(shè)備600中已經(jīng)解釋過的其它構(gòu)成部分,并將省略對于這些構(gòu)成部分的解釋。另外,在以下的實(shí)施例中,將僅描述不同于以上解釋的內(nèi)容,省略相同的內(nèi)容。
以下將參照圖7對第二實(shí)施例中的BWE編碼單元701進(jìn)行解釋。圖7是在第二實(shí)施例的BWE編碼單元701中如何產(chǎn)生被擴(kuò)展頻譜數(shù)據(jù)的示意圖。在該圖中,較低子頻帶E、F和G是通過把以與第一實(shí)施例中的方式相同的方式加以劃分的較低子頻帶A、B、C和D中的較低子頻帶A、B和C在較高頻率方向位移sbw/2獲得的子頻帶。此處,較低子頻帶A、B和C在較高頻率方向被位移了sbw/2,但把頻帶劃分成子頻帶的方法(其中某些部分是相重疊的)、用于位移子頻帶的頻率寬度、所劃分的子頻帶的個數(shù)等不總局限于以上所描述的情況。BWE編碼單元701產(chǎn)生指定替代較高子頻帶h0~h7中每一個較高子頻帶的7個較低子頻帶A~G之一的數(shù)據(jù),并且對該數(shù)據(jù)進(jìn)行編碼。
另一方面,第二實(shí)施例的解碼設(shè)備還接收由第二實(shí)施例的編碼設(shè)備(它包括BWE編碼單元701而不是編碼設(shè)備200中的BWE編碼單元204)所編碼的被擴(kuò)展音頻編碼數(shù)據(jù)流,對指定用于替代較高子頻帶h0~h7的較低子頻帶A~G中的MDCT系數(shù)的數(shù)據(jù)進(jìn)行解碼,并用較低子頻帶A~G中的MDCT系數(shù)替代較高子頻帶h0~h7中的MDCT系數(shù)。
例如,假設(shè)由3個比特的編碼數(shù)據(jù)代表較低子頻帶A~G中的任何一個。當(dāng)作為編碼數(shù)據(jù)的整數(shù)“0”~“6”分別代表較低子頻帶A~G時,如果創(chuàng)建了由值“7”所代表的編碼數(shù)據(jù),那么解碼設(shè)備可以使用A~G中任何一個執(zhí)行不做替代的控制。此處,已經(jīng)描述了把3個比特的數(shù)據(jù)用作編碼數(shù)據(jù)以及編碼數(shù)據(jù)的值為“7”時的情況,但編碼數(shù)據(jù)的比特個數(shù)以及編碼數(shù)據(jù)的值可以為其它值。
在第一實(shí)施例中所使用的增益控制與/或噪音添加也以同樣的方式用在第二實(shí)施例中。當(dāng)使用按以上描述所構(gòu)造的編碼設(shè)備和解碼設(shè)備時,可以使用被擴(kuò)展音頻編碼數(shù)據(jù)流獲得寬帶再現(xiàn)的聲音,而需要大量數(shù)據(jù)。
(第三實(shí)施例)第三實(shí)施例在以下方面不同于第二實(shí)施例。即,在第二實(shí)施例中,BWE編碼單元701把從“startline”到“endline”的一系列較低頻帶MDCT系數(shù)劃分成7個子頻帶A~G,其中某些部分是重疊的,而在第三實(shí)施例中的BWE編碼單元把從“startline”到“endline”的同樣的帶寬劃分成7個子頻帶A~G,并按相反的順序定義了較低子頻帶中的MDCT系數(shù)以及其正號和符號被反轉(zhuǎn)的較低頻帶中的MDCT系數(shù)。
第三實(shí)施例不同于第一和第二實(shí)施例中的編碼設(shè)備200和解碼設(shè)備600的構(gòu)成部分僅在于編碼設(shè)備中的BWE編碼單元801和解碼設(shè)備中的BWE解碼單元802。以下將參照圖8解釋第三實(shí)施例中的BWE編碼單元。
圖8A~8D說明了第三實(shí)施例中的BWE編碼單元801如何產(chǎn)生被擴(kuò)展頻譜數(shù)據(jù)。圖8A說明了以與第二實(shí)施例相同的方式被劃分的較低和較高子頻帶。圖8B說明了較低子頻帶A中一系列MDCT系數(shù)的一個例子。圖8C說明了通過反轉(zhuǎn)較低子頻帶A中MDCT系數(shù)的順序所獲得的子頻帶As中的一系列MDCT系數(shù)的一個例子。圖8D說明了通過反轉(zhuǎn)較低子頻帶A中MDCT系數(shù)的符號所獲得的一個子頻帶Ar。例如,較低子頻帶A中的MDCT系數(shù)由(p0,p1,……,pN)加以表示。在這一情況中,例如,P0代表子頻帶A中的第0個MDCT系數(shù)的值。通過在頻率方向反轉(zhuǎn)子頻帶A中的MDCT系數(shù)的順序所獲得的子頻帶As中的MDCT系數(shù)為(pN,p(n-1),……,p0)。通過反轉(zhuǎn)較低子頻帶A中MDCT系數(shù)的符號所獲得的子頻帶Ar中的MDCT系數(shù)由(-p0,-p1,……,-pN)加以表示。不僅對于子頻帶A,而且也對子頻帶B~G,定義了其順序被反轉(zhuǎn)的子頻帶Bs~Gs和其符號被反轉(zhuǎn)的子頻帶Br~Gr。
如以上所描述的,第三實(shí)施例中的BWE編碼單元801指定了一個子頻帶,用于替代較高子頻帶h0~h7中的每一個,即7個子頻帶A~G、通過反轉(zhuǎn)較低頻帶A~G中的7個MDCT系數(shù)的順序或符號所獲得的7個較低子頻帶Bs~Gs或7個較低子頻帶Br~Gr中的任何一個。BWE編碼單元801使用所指定的較低子頻帶、對用于代表較高頻帶MDCT系數(shù)的數(shù)據(jù)進(jìn)行編碼,并產(chǎn)生被擴(kuò)展音頻編碼數(shù)據(jù)流,如圖5C中所示。在這一情況中,BWE編碼單元801為每一個較高子頻帶編碼以下數(shù)據(jù)指定替代較高頻帶MDCT系數(shù)的較低子頻帶的數(shù)據(jù)、指示是否要反轉(zhuǎn)所指定的較低子頻帶中MDCT系數(shù)的順序的數(shù)據(jù)、以及指示是否要反轉(zhuǎn)所指定的較低子頻帶中MDCT系數(shù)的正號和負(fù)號的數(shù)據(jù),作為擴(kuò)展的頻譜數(shù)據(jù)。
另一方面,如上所述,第三實(shí)施例中的解碼設(shè)備接收由第三實(shí)施例中的編碼設(shè)備所編碼的被擴(kuò)展音頻編碼數(shù)據(jù)流,并對被擴(kuò)展頻譜數(shù)據(jù)進(jìn)行解碼,該被擴(kuò)展頻譜數(shù)據(jù)指示較低子頻帶A~G中的哪一個MDCT系數(shù)替代較高子頻帶h0~h7中的每一個、是否要反轉(zhuǎn)MDCT系數(shù)的順序、是否要反轉(zhuǎn)MDCT系數(shù)的正號及負(fù)號。接下來,根據(jù)所解碼的被擴(kuò)展頻譜數(shù)據(jù),解碼設(shè)備通過反轉(zhuǎn)所指定的較低子頻帶A~G中MDCT系數(shù)的順序或符號,產(chǎn)生較高子頻帶h0~h7中的MDCT系數(shù)。
另外,第三實(shí)施例不僅包括較低子頻帶中MDCT系數(shù)的順序和正負(fù)號的擴(kuò)展,而且還包括較低子頻帶中通過濾波處理的MDCT系數(shù)的替代。需要加以注意的是,例如,濾波處理意味著IIR濾波、FIR濾波等,將省略對它們的解釋,因?yàn)閷τ诒绢I(lǐng)域技術(shù)人員來說,這些技術(shù)是他們十分熟悉的。在這一濾波處理中,如果在編碼設(shè)備端將濾波系數(shù)編碼于被擴(kuò)展音頻編碼數(shù)據(jù)流中,那么在解碼設(shè)備端上,對所指定的較低子頻帶中的MDCT系數(shù)執(zhí)行被解碼濾波系數(shù)所指示的IIR濾波或FIR濾波,而且較高子頻帶可以由濾波處理的MDCT系數(shù)來替代。需要加以注意的是,在第三實(shí)施例中能夠以同樣的方式使用第一實(shí)施例中所使用的增益控制。當(dāng)使用如上所結(jié)構(gòu)的編碼設(shè)備和解碼設(shè)備時,可使用數(shù)據(jù)量不大的被擴(kuò)展音頻編碼數(shù)據(jù)流獲得寬帶再現(xiàn)的聲音。
(第四實(shí)施例)第四實(shí)施例在以下方面不同于第三實(shí)施例。即,第四實(shí)施例中的解碼設(shè)備并不僅使用所指定的較低子頻帶A~G中的MDCT系數(shù)替代較高子頻帶h0~h7中的MDCT系數(shù),而是除了所指定的較低子頻帶A~G中的MDCT系數(shù)外,還使用噪音產(chǎn)生單元所產(chǎn)生的MDCT系數(shù)替代它們。因此,在結(jié)構(gòu)方面,第四實(shí)施例中解碼設(shè)備不同于第一實(shí)施例中解碼設(shè)備600的構(gòu)成部分僅在于噪音產(chǎn)生單元901和BWE解碼單元902。例如,對于第四實(shí)施例中解碼設(shè)備中的被擴(kuò)展音頻編碼數(shù)據(jù)流的解碼過程,以下將參照圖9A~C解釋由較低子頻帶A替代將進(jìn)行BWE解碼的較高子頻帶h0的情況。圖9A說明了為較高子頻帶h0所指定的較低子頻帶A中MDCT系數(shù)的一個例子。圖9B說明了與由噪音產(chǎn)生單元901所產(chǎn)生的較低子頻帶A中MDCT系數(shù)個數(shù)相同的MDCT系數(shù)的示例的示意圖。圖9C說明了替代較高子頻帶h0的MDCT系數(shù)的一個例子,這些MDCT系數(shù)是使用圖9A中所示較低子頻帶A中的MDCT系數(shù)、以及圖9B中所示噪音產(chǎn)生單元901所產(chǎn)生的MDCT系數(shù)所產(chǎn)生的。此處,較低子頻帶A中的MDCT系數(shù)將為A=(p0,p1,……,pN)。在噪音產(chǎn)生單元901中獲得與較低子頻帶A中相同個數(shù)的噪音信號MDCT系數(shù),M=(n0,n1,……,nN)。BWE解碼單元902使用加權(quán)因子α、β,調(diào)整較低子頻帶A中的MDCT系數(shù)A和噪音信號MDCT系數(shù)M,并產(chǎn)生替代較高子頻帶h0中的MDCT系數(shù)的替代MDCT系數(shù)A′。由下列表達(dá)式6代表替代MDCT系數(shù)A′。
表達(dá)式6A′=α(p0,p1,…,pN)+β(n0,n1,…,nN)
在第四實(shí)施例中的解碼設(shè)備中,加權(quán)因子α,β可以是預(yù)定的值,也可以是通過把指示加權(quán)因子α,β的值的控制數(shù)據(jù)編碼于編碼設(shè)備中的被擴(kuò)展音頻編碼數(shù)據(jù)流中、并在解碼設(shè)備中對這些值進(jìn)行解碼所獲得的值。
此處,BWE解碼單元902所輸出的子頻帶h0已被描述為一個示例,但對于其它較高子頻帶h1~h7也進(jìn)行相同的處理。另外,較低子頻帶A以被描述為將被替代的較低子頻帶的一個例子,但由去量化單元所獲得的任何其它較低子頻帶以及針對它們的處理也是相同的。關(guān)于加權(quán)因子α、β,它們可以采用的值使得一個為“0”,另一個為“1”,或者可以采用的值使得“α+β”為1。當(dāng)α=0時,計(jì)算較高子頻帶中MDCT系數(shù)的能量與噪音數(shù)據(jù)的MDCT系數(shù)的能量之比率,并把所獲得的能量之比率編碼于被擴(kuò)展音頻編碼數(shù)據(jù)流中,作為噪音信息的MDCT系數(shù)的增益數(shù)據(jù)。而且,也可以對代表加權(quán)因子α和β之間的一個比率的值進(jìn)行編碼。另外,當(dāng)由BWE解碼單元902所復(fù)制的一個較低子頻帶中的所有MDCT系數(shù)為“0”時,可以執(zhí)行控制以便設(shè)置β的值為“1”而與α的值無關(guān)??梢詫υ胍舢a(chǎn)生單元901加以構(gòu)造,以便將一個準(zhǔn)備好的表保存在其自身中,并輸出表中的值作為噪音信號MDCT系數(shù),或?yàn)槊恳粠瑒?chuàng)建由時間域中的噪音信號的MDCT所獲得的噪音信號MDCT系數(shù),或執(zhí)行對時間域中噪音信號的增益控制,并使用全部或一部分由增益控制的噪音信號的MDCT所獲得的MDCT系數(shù)、輸出噪音信號MDCT系數(shù)。
特別是,當(dāng)使用通過在時間域中對時間域中噪音信號進(jìn)行增益控制并在它們之上執(zhí)行MDCT所獲得的MDCT系數(shù)時,可以期望有抑制被再現(xiàn)聲音的前回聲的效果。在這一情況中,第四實(shí)施例中的編碼設(shè)備預(yù)先對用于控制時間域中噪音信號增益的增益控制數(shù)據(jù)進(jìn)行編碼,而且解碼設(shè)備可以對增益控制數(shù)據(jù)進(jìn)行解碼,并使用它。如果使用如上所述構(gòu)造的解碼設(shè)備,則可以期望實(shí)現(xiàn)寬帶再現(xiàn)的效果,而無需使用噪音信號MDCT系數(shù)過高地提高音調(diào),即使較低子頻帶的MDCT系數(shù)不能充分地代表要被BWE解碼的較高子頻帶中的MDCT系數(shù)。
(第五實(shí)施例)第五實(shí)施例與第四實(shí)施例的不同之處在于擴(kuò)展了功能,以致于可以把多個時間幀作為一個單元加以控制。以下將參照圖10A~C和圖11A~C對第五實(shí)施例中編碼設(shè)備和解碼設(shè)備中的BWE編碼單元1001和BWE解碼單元1002的操作加以解釋。
圖10A說明在時刻t0時一個幀中的MDCT系數(shù)。圖10B說明了時刻t1時下一個幀中的MDCT系數(shù)。圖10C說明了時刻t2時再下一個幀中的MDCT系數(shù)。時刻t0、t1和t2是連續(xù)的時刻,而且它們是與這些幀同步的時刻。在第一至第四實(shí)施例中,分別在t0、t1和t2時刻產(chǎn)生被擴(kuò)展音頻編碼數(shù)據(jù)流,但第五實(shí)施例的編碼設(shè)備產(chǎn)生對多個連續(xù)幀是公用的被擴(kuò)展音頻編碼數(shù)據(jù)流。盡管這些圖中描述了3個連續(xù)幀,但也可以采用任何數(shù)量的連續(xù)幀。在第一實(shí)施例的圖5C中,被擴(kuò)展音頻編碼數(shù)據(jù)流的頂部具有指示是否使用按與最后幀中被擴(kuò)展音頻編碼數(shù)據(jù)流相同的方式劃分的較低子頻帶A~D的項(xiàng)目。第五實(shí)施例的BEW編碼單元1001也以同樣的方式在每一個幀中的被擴(kuò)展音頻編碼數(shù)據(jù)流的頂部提供了指示是否使用與最后幀中被擴(kuò)展音頻編碼數(shù)據(jù)流相同的被擴(kuò)展音頻編碼數(shù)據(jù)流的項(xiàng)目。以下將解釋這樣的一種情況例如,使用在時刻t0時每一幀中的被擴(kuò)展音頻編碼數(shù)據(jù)流對在時刻t0、t1和t2時每一個幀中的較高子頻帶進(jìn)行解碼。
第五實(shí)施例的解碼設(shè)備接收為多個連續(xù)幀的共同使用而產(chǎn)生的被擴(kuò)展音頻編碼數(shù)據(jù)流,并執(zhí)行對每一個幀的BWE解碼。例如,當(dāng)時刻t0時的幀中的較高子頻帶h0由同一時刻t0時的幀中的較低子頻帶C加以替代時,BWE解碼單元1002也使用時刻t1的較低子頻帶C對時刻t1時的幀中的較高子頻帶h0進(jìn)行解碼,而且還使用時刻t2的較低子頻帶C以同樣的方式對時刻t2的幀中的較高子頻帶h0進(jìn)行解碼。對于其它較高子頻帶h1~h7,BWE解碼單元1002進(jìn)行相同的處理。如果使用如上所構(gòu)造的編碼設(shè)備和解碼設(shè)備,那么對于使用相同被擴(kuò)展音頻編碼數(shù)據(jù)流的多個幀,可以整體減小由被擴(kuò)展音頻編碼數(shù)據(jù)流所占據(jù)的音頻編碼比特流的區(qū)域,因而可以實(shí)現(xiàn)更有效的編碼和解碼。
以下,將參照圖11A~11C解釋第五實(shí)施例的編碼設(shè)備和解碼設(shè)備的另一個例子。這一例子不同于以上所提到的例子之處在于,BWE編碼單元1101在對多個連續(xù)幀使用相同的被擴(kuò)展音頻編碼數(shù)據(jù)流所解碼的較高頻帶MDCT系數(shù)上,對用于給予增益控制的增益數(shù)據(jù)進(jìn)行編碼,其中對每一幀具有不同的增益。圖11A~C還示出在時刻t0、t1和t2時多個連續(xù)幀中的MDCT系數(shù)的示意圖,正如圖10A~C。第五實(shí)施例的另一個編碼設(shè)備對于被擴(kuò)展音頻編碼數(shù)據(jù)流、產(chǎn)生在多個幀中被BWE解碼的較高頻帶MDCT系數(shù)的增益的相對值。例如,對于時刻t0、t1和t2的幀,將被BWE解碼的帶寬(從“maxline”到“targetline”的較高頻帶)中MDCT系數(shù)的平均振幅為G0、G1和G2。
首先,從時刻t0、t1和t2的幀中確定一個參照幀??梢园褧r刻t0的第一幀預(yù)定為一個參照幀,或者把給出最大平均振幅的幀預(yù)定為一個參照幀,并且可以把指示給出最大平均振幅的幀的位置的數(shù)據(jù)獨(dú)立地編碼于被擴(kuò)展音頻編碼數(shù)據(jù)流中。此處,假設(shè)時刻t0的幀中的平均振幅G0為其中使用相同被擴(kuò)展音頻編碼數(shù)據(jù)流對較高頻帶MDCT系數(shù)進(jìn)行解碼的連續(xù)幀中的最大平均振幅。在這一情況中,由G1/G0代表時刻t1的幀中的較高頻帶中的平均振幅,用于時刻t0的參照幀,并且由G2/G0代表時刻t2的幀中的較高頻帶中的平均振幅,用于時刻t0的參照幀。BWE編碼單元1101量化較高頻帶中的這些平均振幅的相對值G1/G0、G2/G0,以把它們編碼于被擴(kuò)展音頻編碼數(shù)據(jù)流中。
另一方面,在第五實(shí)施例的另一個解碼設(shè)備中,BWE解碼單元1102接收被擴(kuò)展音頻編碼數(shù)據(jù)流,從被擴(kuò)展音頻編碼數(shù)據(jù)流中指定一個參照幀,以對其進(jìn)行解碼或?qū)σ粋€預(yù)定的幀進(jìn)行解碼,并對參照幀的平均振幅值進(jìn)行解碼。而且,BWE解碼單元1102還對相對于將被BWE解碼的較高頻帶MDCT系數(shù)的參照幀的平均振幅值進(jìn)行解碼,并在根據(jù)共用的被擴(kuò)展音頻編碼數(shù)據(jù)流所解碼的每幀中的較高頻帶MDCT系數(shù)上執(zhí)行增益控制。如以上所描述的,根據(jù)圖11A~C中所示的BWE解碼單元1102,很容易校正使用公用被擴(kuò)展音頻編碼數(shù)據(jù)流所解碼的多個幀中的MDCT系數(shù)的平均振幅。因此,可以使用少量數(shù)據(jù)對音頻編碼數(shù)據(jù)流進(jìn)行編碼和解碼,所述音頻編碼數(shù)據(jù)流可以被再現(xiàn)成對原聲保真的寬帶音頻信號。
(第六實(shí)施例)第六實(shí)施例與第五實(shí)施例的不同之處在于,第五實(shí)施例的編碼設(shè)備和解碼設(shè)備把一個時間域中的音頻信號變換和反變換成一個代表頻譜的時間變化的時間-頻率信號。例如,對于以44.1kHz采樣頻率采樣的音頻信號的一幀,大約每0.73毫秒(msec)從1024個采樣中對每一連續(xù)的32個采樣進(jìn)行頻率變換,并獲得分別由32個采樣組成的頻譜。對1024個采樣的每一幀,獲得具有一個大約0.73毫秒時間差的32個頻譜。這些頻譜分別代表對32個采樣的從0kHz到最大22.05kHz的再現(xiàn)帶寬。通過從這些頻譜中組合時間方向上相同頻率的頻譜數(shù)據(jù)的值所獲得的波形是來自QMF濾波器的輸出的時間-頻率信號。例如,本實(shí)施例的編碼設(shè)備以與傳統(tǒng)編碼設(shè)備相同的方式,從是QMF濾波器的輸出的時間-頻率信號中對第0個~第15個時間-頻率信號進(jìn)行量化和可變長度編碼。另一方面,對于第16~第31個較高頻帶時間-頻率信號,編碼設(shè)備指定將替代第16~第31個信號中每一信號的第0個~第15個信號之一,并產(chǎn)生被擴(kuò)展時間-頻率信號,包括指示第0個~第15個較低頻帶時間-頻率信號的被指定的一個的數(shù)據(jù)、和用于調(diào)整所指定的較低頻帶時間-頻率信號的振幅的增益數(shù)據(jù)。當(dāng)依據(jù)一個參數(shù)進(jìn)行濾波處理或使用一個具有不同特性的濾波器時,在被擴(kuò)展時間-頻率信號中預(yù)先描述一個用于指定處理細(xì)節(jié)或?yàn)V波器的特性的參數(shù)。接下來,編碼設(shè)備描述通過量化較低頻帶時間-頻率信號和對較低頻帶時間-頻率信號進(jìn)行可變長度編碼獲得的較低頻帶音頻編碼數(shù)據(jù)流、以及通過對音頻編碼比特流中的被擴(kuò)展時間-頻率信號進(jìn)行可變長度編碼獲得的較高頻帶編碼數(shù)據(jù)流,以輸出它們。
圖12是一個結(jié)構(gòu)框圖,說明了解碼設(shè)備1200的結(jié)構(gòu),解碼設(shè)備1200對來自使用一個QMF濾波器所編碼的音頻編碼比特流的寬帶時間-頻率信號進(jìn)行解碼。解碼設(shè)備1200是一種解碼設(shè)備,它對所輸入音頻編碼比特流中的寬帶時間-頻率信號進(jìn)行解碼,其中所輸入音頻編碼比特流由通過對代表較高頻帶時間-頻率信號的被擴(kuò)展時間-頻率信號進(jìn)行可變長度編碼獲得的編碼數(shù)據(jù)流、以及通過量化較低頻帶時間-頻率信號和對其進(jìn)行編碼獲得的編碼數(shù)據(jù)流組成。解碼設(shè)備1200包括一個核心解碼單元1201、一個被擴(kuò)展解碼單元1202、以及一個頻譜添加單元1203。核心解碼單元1201對所輸入音頻編碼比特流進(jìn)行解碼,并將其劃分成被量化的較低頻帶時間-頻率信號和代表較高頻帶時間-頻率信號的被擴(kuò)展時間-頻率信號。核心解碼單元1201還對從音頻編碼比特流劃分的較低頻帶時間-頻率信號去量化,并將其輸出到頻譜添加單元1203。頻譜添加單元1203添加核心解碼單元1201所解碼和去量化的時間-頻率信號、以及核心解心解碼單元1201所解碼和去量化的時間-頻率信號、以及核心解碼單元1202所產(chǎn)生的較高頻帶時間-頻率信號,并輸出整個再現(xiàn)帶寬(例如0kHz~22.05kHz)中的時間-頻率信號。由一個QMF反向變換濾波器,把所輸出的這些時間-頻率信號變換成時間域中的音頻信號,以下將對其加以描述但并未在圖中加以顯示,例如,還由一個以下所描述的揚(yáng)聲器將其進(jìn)一步轉(zhuǎn)換成聽得見的聲音,例如話音和音樂。
被擴(kuò)展解碼單元1202是一個處理單元,它接收由核心解碼單元1201所解碼的較低頻帶時間-頻率信號和被擴(kuò)展時間-頻率信號;基于所劃分的被擴(kuò)展時間-頻率信號,指定替代較高頻帶時間-頻率信號的較低頻帶時間-頻率信號,以在較高頻帶中復(fù)制它們,并調(diào)整它們的振幅,以產(chǎn)生較高頻帶時間-頻率信號。被擴(kuò)展解碼單元1202還包括一個替代控制單元1204和一個增益調(diào)整單元1205。例如,替代控制單元1204根據(jù)所解碼的被擴(kuò)展時間-頻率信號,指定替代第16個較高頻帶時間-頻率信號的第0個~第15個較低頻帶時間-頻率信號之一,并復(fù)制所指定的較低頻帶時間-頻率信號,作為第16個較高頻帶時間-頻率信號。增益調(diào)整單元1205根據(jù)被擴(kuò)展時間-頻率信號中所描述的增益數(shù)據(jù),把被復(fù)制為第16個較高頻帶時間-頻率信號的較低頻帶時間-頻率信號加以放大,并調(diào)整振幅。被擴(kuò)展解碼單元1202還通過替代控制單元1204和增益調(diào)整單元1205、對第17個~第31個較高頻帶時間-頻率信號中每一個執(zhí)行上述處理。當(dāng)用于指定第0個~第15個較低頻帶時間-頻率信號之一的4個比特、以及用于調(diào)整所復(fù)制的較低頻帶時間-頻率信號的振幅的增益數(shù)據(jù)的4個比特被使用時,則最多可以使用(4+4)×32=256個比特代表第16個~第3 1個較高頻帶時間-頻率信號。
圖13描述了由第六實(shí)施例的解碼設(shè)備1200解碼的時間-頻率信號的一個例子。例如,當(dāng)由Bk=(pk(t0),pk(t1),……,pk(t31))(k是一個0≤k≤15的整數(shù))代表第k個較低頻帶時間-頻率信號的頻譜時,在由第六實(shí)施例的圖中未加顯示的編碼設(shè)備所產(chǎn)生的音頻編碼比特流中描述被量化和被編碼的第0個~第15個較低頻帶時間-頻率信號B0~B15,如圖13中所示。另一方面,關(guān)于第16個~第31個較高頻帶時間-頻率信號B16~B31,描述了指定分別替代第16個~第31個較高頻帶時間-頻率信號的第0個~第15個較低頻帶時間-頻率信號B0~B15之一的數(shù)據(jù)、以及用于調(diào)整在較高頻帶中所復(fù)制的相應(yīng)較低頻帶時間-頻率信號的振幅的增益數(shù)據(jù)。例如,為了表示第16個較高頻帶時間-頻率信號B16,在被擴(kuò)展時間-頻率信號中描述了指示替代第16個較高頻帶時間-頻率信號B16的第10個較低頻帶時間-頻率信號B10的數(shù)據(jù)、以及用于調(diào)整在較高頻帶中被復(fù)制作為第16個較高頻帶時間-頻率信號B16的較低頻帶時間-頻率信號B10的振幅的增益數(shù)據(jù)G0。因此,由核心解碼單元1201解碼和去量化的第10個較低頻帶時間-頻率信號B10被復(fù)制在較高頻帶中,作為第16個較高頻帶時間-頻率信號B16,并由在增益數(shù)據(jù)G0中所指示的一個增益對其加以放大,然后產(chǎn)生第16個較高頻帶時間-頻率信號B16。對于第17個較高頻帶時間-頻率信號B17,進(jìn)行同樣的處理。通過替代控制單元1204,將在被擴(kuò)展時間-頻率信號中所描述的第11個較低頻帶時間-頻率信號B11復(fù)制成第17個較高頻帶時間-頻率信號B17,由增益數(shù)據(jù)G1中所指示的一個增益對其加以放大,并產(chǎn)生第17個較高頻帶時間-頻率信號B17。對于第18個~第31個較高頻帶時間-頻率信號B18~B31,重復(fù)同樣的處理,從而可以獲得所有較高頻帶時間-頻率信號。
如以上所描述的,根據(jù)第六實(shí)施例,通過把本發(fā)明的替代(即由較低頻帶時間-頻率信號對較高頻帶時間-頻率信號的替代)施加于作為QMF濾波器的輸出的時間-頻率信號,編碼設(shè)備通過增加較少量的數(shù)據(jù),可以對寬帶音頻時間-頻率信號進(jìn)行編碼,而解碼設(shè)備能夠?qū)梢栽谳^高頻帶中被再現(xiàn)為優(yōu)質(zhì)聲音的音頻信號進(jìn)行解碼。夠?qū)梢栽谳^高頻帶中被再現(xiàn)為優(yōu)質(zhì)聲音的音頻信號進(jìn)行解碼。
在第六實(shí)施例中,已經(jīng)解釋了相應(yīng)的較低頻帶時間-頻率信號替代相應(yīng)的較高頻帶時間-頻率信號,然而本發(fā)明并不局限于此??梢园褜ζ湓O(shè)計(jì)而使得能夠把較低頻帶和較高頻帶劃分成多個組(例如8組),其中包括相同數(shù)量(例如4個)的時間-頻率信號,從而較低頻帶中的所述組之一中的時間-頻率信號替代較高頻帶中的每一組。另外,通過把所產(chǎn)生的噪音(由32個頻譜值組成)添加在其上,可以調(diào)整較高頻帶中所復(fù)制的較低頻帶時間-頻率信號的振幅。而且,還根據(jù)這樣的假設(shè)解釋了第六實(shí)施例采樣頻率為44.1kHz一幀由1024個采樣組成;包含在一個時間-頻率信號中的采樣的個數(shù)為22;以及包含在一幀中的時間-頻率信號的個數(shù)為32,然而本發(fā)明并不局限于此。采樣頻率和包含在一幀中的采樣的個數(shù)也可以為任何其它值。
工業(yè)上的應(yīng)用根據(jù)本發(fā)明的編碼設(shè)備可用作設(shè)置在衛(wèi)星廣播站(包括BS和CS)中的音頻編碼設(shè)備、用于內(nèi)容發(fā)布服務(wù)器的音頻編碼設(shè)備(該服務(wù)器經(jīng)由一通信網(wǎng)絡(luò)、例如因特網(wǎng)發(fā)布內(nèi)容)、以及一個由通用計(jì)算機(jī)所執(zhí)行的用于對音頻信號進(jìn)行編碼的程序。
另外,根據(jù)本發(fā)明的解碼設(shè)備不僅可以用作包括在家庭應(yīng)用的STB(機(jī)頂盒)中的音頻解碼設(shè)備,而且還可以用作由通用計(jì)算機(jī)所執(zhí)行的用于對音頻信號進(jìn)行解碼的程序;一個包括在STB或通用計(jì)算機(jī)中的僅用于對音頻信號進(jìn)行解碼的電路板或LSI(大規(guī)模集成電路)、以及被插入在STB或通用計(jì)算機(jī)中的IC卡。
權(quán)利要求
1.一種對輸入信號進(jìn)行編碼的編碼設(shè)備,包括一個時間-頻率變換單元,用于將時間域中的輸入信號變換成包括較低頻譜的頻譜;一個頻帶擴(kuò)展單元,用于產(chǎn)生擴(kuò)展數(shù)據(jù),該擴(kuò)展數(shù)據(jù)以高于該較低頻譜的一較高頻率指定一較高頻譜;以及一個編碼單元,用于對該較低頻譜和該擴(kuò)展數(shù)據(jù)進(jìn)行編碼,并輸出被編碼的較低頻譜和擴(kuò)展數(shù)據(jù),其中,該頻帶擴(kuò)展單元產(chǎn)生第一參數(shù)和第二參數(shù)作為擴(kuò)展數(shù)據(jù),第一參數(shù)從形成該較低頻譜的多個部分頻譜中指定一個部分頻譜,該部分頻譜將被復(fù)制為較高頻譜,第二參數(shù)指定被復(fù)制之后該部分頻譜的增益。
2.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,形成該較低頻譜的多個部分頻譜中至少兩個頻譜具有若干個互相重疊的頻帶部分。
3.根據(jù)權(quán)利要求2的編碼設(shè)備,其中,通過分別把具有一個重疊頻帶的兩個頻帶劃分成多個頻帶,獲得形成該較低頻譜的多個部分頻譜。
4.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,由多個部分頻譜形成該較高頻譜,以及該頻帶擴(kuò)展單元為形成該較高頻譜的多個部分頻譜中每一個部分頻譜產(chǎn)生第一參數(shù)和第二參數(shù)。
5.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該頻帶擴(kuò)展單元還產(chǎn)生一個第三參數(shù)作為擴(kuò)展數(shù)據(jù),第三參數(shù)從形成該較低頻譜的多個部分頻譜中指定包括最低頻率分量的一個部分頻譜的頻率位置。
6.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該頻帶擴(kuò)展單元還產(chǎn)生一個第四參數(shù)作為擴(kuò)展數(shù)據(jù),第四參數(shù)從形成該較低頻譜的多個部分頻譜中指定包括最高頻率分量的一個部分頻譜的頻率位置。
7.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該頻帶擴(kuò)展單元還產(chǎn)生一個第五參數(shù)作為擴(kuò)展數(shù)據(jù),第五參數(shù)指定當(dāng)被復(fù)制時在該部分頻譜上所執(zhí)行的一個濾波處理。
8.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該頻帶擴(kuò)展單元還產(chǎn)生一個第六參數(shù)作為擴(kuò)展數(shù)據(jù),第六參數(shù)指示是否該較高頻譜是其相位被反轉(zhuǎn)的將被復(fù)制的部分頻譜、或是其相位未被反轉(zhuǎn)的將被復(fù)制的部分頻譜。
9.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該頻帶擴(kuò)展單元還產(chǎn)生一個第七參數(shù)作為擴(kuò)展數(shù)據(jù),第七參數(shù)指示是否該較高頻譜是在一個頻率域中將被復(fù)制和被反轉(zhuǎn)的部分頻譜、或是在該頻率域中將被復(fù)制和未被反轉(zhuǎn)的部分頻譜。
10.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該第一參數(shù)包括指示形成該較低頻譜的多個部分頻譜之任何一個部分頻譜未被用作將被復(fù)制的頻譜的數(shù)據(jù)。
11.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該第二參數(shù)是將被復(fù)制的部分頻譜的增益所乘的一個系數(shù)。
12.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該第二參數(shù)是在被復(fù)制之后該部分頻譜的增益的絕對值。
13.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該頻帶擴(kuò)展單元還產(chǎn)生一個第八參數(shù)作為擴(kuò)展數(shù)據(jù),第八參數(shù)指定一個噪音頻譜的能量,該噪音頻譜被添加到由第一參數(shù)和第二參數(shù)所指定的較高頻譜。
14.根據(jù)權(quán)利要求13的編碼設(shè)備,其中,該第八參數(shù)是該噪音頻譜與該較高頻譜的一個能量比。
15.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該編碼設(shè)備對于每一固定數(shù)量的時間幀重復(fù)編碼該輸入信號,以及該頻帶擴(kuò)展單元為多個連續(xù)的時間幀產(chǎn)生第二參數(shù),第二參數(shù)指定在被復(fù)制之后該部分頻譜的增益。
16.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該編碼設(shè)備對于每一固定數(shù)量的時間幀重復(fù)編碼該輸入信號,以及該頻帶擴(kuò)展單元還產(chǎn)生一個第九參數(shù)作為擴(kuò)展數(shù)據(jù),第九參數(shù)從多個連續(xù)的時間幀中指定其中較高頻譜的增益為最大的一個時間幀,并在不同于其中增益為最大的該時間幀的一個時間幀內(nèi)產(chǎn)生第二參數(shù),作為由對該最大值的一個相對值所表示的一個值。
17.根據(jù)權(quán)利要求1的編碼設(shè)備,其中,該編碼設(shè)備根據(jù)霍夫曼編碼對全部或一部分該較低頻譜和該擴(kuò)展數(shù)據(jù)進(jìn)行編碼。
18.一種對被編碼信號進(jìn)行解碼的解碼設(shè)備,其中,被編碼信號包括一個較低頻譜和擴(kuò)展數(shù)據(jù),該擴(kuò)展數(shù)據(jù)包括第一參數(shù)和第二參數(shù),它們以高于該較低頻譜的較高頻率指定一個較高頻譜,該解碼設(shè)備包括一個解碼單元,用于通過對被編碼信號進(jìn)行解碼,產(chǎn)生較低頻譜和擴(kuò)展數(shù)據(jù);一個頻帶擴(kuò)展單元,用于由該較低頻譜、第一參數(shù)和第二參數(shù)產(chǎn)生該較高頻譜;以及一個頻率-時間變換單元,用于將一個頻譜變換成時間域中的信號,該頻譜是通過組合所產(chǎn)生的較高頻譜和該較低頻譜所獲得的,以及該頻帶擴(kuò)展單元復(fù)制一個部分頻譜,該部分頻譜是通過第一參數(shù)從形成該較低頻譜的多個部分頻譜中指定的,該頻帶擴(kuò)展單元根據(jù)第二參數(shù)確定在被復(fù)制之后該部分頻譜的增益,并產(chǎn)生所獲得的部分頻譜作為較高頻譜。
19.根據(jù)權(quán)利要求18的解碼設(shè)備,其中,該擴(kuò)展數(shù)據(jù)包括一個第三參數(shù),以及該頻帶擴(kuò)展單元在將被復(fù)制的部分頻譜上執(zhí)行由第三參數(shù)所指定的一個濾波處理,并在執(zhí)行濾波處理之后產(chǎn)生該部分頻譜作為較高頻譜。
20.根據(jù)權(quán)利要求18的解碼設(shè)備,其中,該擴(kuò)展數(shù)據(jù)包括一個第四參數(shù),以及根據(jù)第四參數(shù),該頻帶擴(kuò)展單元產(chǎn)生其相位被反轉(zhuǎn)的將被復(fù)制的部分頻譜、或?qū)⒈粡?fù)制的部分頻譜本身,作為較高頻譜。
21.根據(jù)權(quán)利要求18的解碼設(shè)備,其中,該擴(kuò)展數(shù)據(jù)包括一個第五參數(shù),以及根據(jù)第五參數(shù),該頻帶擴(kuò)展單元產(chǎn)生在頻率域中將被復(fù)制和被反轉(zhuǎn)的部分頻譜、或?qū)⒈粡?fù)制的部分頻譜本身,作為較高頻譜。
22.根據(jù)權(quán)利要求18的解碼設(shè)備,其中,該頻帶擴(kuò)展單元向所產(chǎn)生的較高頻譜添加一個噪音頻譜,以及該頻率-時間變換單元將通過組合該較高頻譜與被添加的噪音頻譜而獲得的一頻譜和該較低頻譜變換成時間域中的信號。
23.根據(jù)權(quán)利要求22的解碼設(shè)備,其中,該擴(kuò)展數(shù)據(jù)包括一個第六參數(shù),以及該頻帶擴(kuò)展單元向所產(chǎn)生的較高頻譜添加一個具有由第六參數(shù)所指定的能量的噪音頻譜。
24.根據(jù)權(quán)利要求23的解碼設(shè)備,其中,該第六參數(shù)是該噪音頻譜與該較高頻譜的能量比,以及該頻帶擴(kuò)展單元向所述較高頻譜添加一個噪音頻譜,該噪音頻譜具有通過把所產(chǎn)生的較高頻譜的能量乘以由第六參數(shù)所指示的該能量比而獲得的能量。
25.根據(jù)權(quán)利要求22的解碼設(shè)備,還包括一個噪音頻譜產(chǎn)生單元,用于產(chǎn)生通過對時間域中的噪音信號執(zhí)行時間-頻率變換所獲得的噪音頻譜,其中,該頻帶擴(kuò)展單元把該噪音頻譜產(chǎn)生單元所產(chǎn)生的噪音頻譜添加于該較高頻譜。
26.根據(jù)權(quán)利要求25的解碼設(shè)備,其中,該噪音頻譜產(chǎn)生單元具有一個存儲表,該存儲表預(yù)先存儲該噪音頻譜的數(shù)據(jù),并且通過讀出存儲在該存儲表中的數(shù)據(jù)產(chǎn)生該噪音頻譜。
27.根據(jù)權(quán)利要求18的解碼設(shè)備,其中,當(dāng)形成所產(chǎn)生的較高頻譜的所有頻譜數(shù)據(jù)的值為0、以及由第二參數(shù)所確定的較高頻譜一個絕對增益的值不為0時,該頻帶擴(kuò)展單元使用一個準(zhǔn)備好的噪音頻譜產(chǎn)生較高頻譜。
28.根據(jù)權(quán)利要求18的解碼設(shè)備,其中,該被編碼信號包括通過對于每一固定數(shù)量的時間幀編碼輸入信號所獲得的較低頻譜和擴(kuò)展數(shù)據(jù),第二參數(shù)是一個公共參數(shù),該參數(shù)對于多個連續(xù)的時間幀指定在被復(fù)制后的部分頻譜的增益,以及該頻帶擴(kuò)展單元根據(jù)第二參數(shù),對于多個連續(xù)的時間幀確定被復(fù)制后的部分頻譜的增益。
29.根據(jù)權(quán)利要求18的解碼設(shè)備,其中,被編碼信號包括通過對于每一固定數(shù)量的時間幀編碼輸入信號所獲得的較低頻譜和擴(kuò)展數(shù)據(jù),該擴(kuò)展數(shù)據(jù)包括一個第七參數(shù),第七參數(shù)從多個連續(xù)的時間幀中指定其中較高頻譜的增益為最大的一個時間幀,在不同于其中增益為最大的該時間幀的一個時間幀內(nèi)的第二參數(shù)是相對于該最大值的一個相對值所代表的值,以及該頻帶擴(kuò)展單元從多個連續(xù)的時間幀中確定在不同于第七參數(shù)所指示的時間幀的時間幀內(nèi)的較高頻譜的增益,以作為通過把由第七參數(shù)所指示的時間幀中的較高頻譜的增益乘以第二參數(shù)所指示的相對值所獲得的一個增益。
30.根據(jù)權(quán)利要求18的解碼設(shè)備,其中,該解碼單元根據(jù)霍夫曼解碼,通過對全部或一部分被編碼信號進(jìn)行解碼,產(chǎn)生該較低頻譜和擴(kuò)展數(shù)據(jù)。
31.一種對輸入信號進(jìn)行編碼的編碼方法,包括一個時間-頻率變換步驟,用于把時間域中的輸入信號變換成包括較低頻譜的頻譜;一個頻帶擴(kuò)展步驟,用于產(chǎn)生擴(kuò)展數(shù)據(jù),該擴(kuò)展數(shù)據(jù)以高于該較低頻譜的較高頻率指定一個較高頻譜;以及一個編碼步驟,用于對該較低頻譜和該擴(kuò)展數(shù)據(jù)進(jìn)行編碼,并輸出被編碼的較低頻譜和擴(kuò)展數(shù)據(jù),其中在該頻帶擴(kuò)展步驟中,產(chǎn)生一個第一參數(shù)和一個第二參數(shù)作為擴(kuò)展數(shù)據(jù),第一參數(shù)從形成該較低頻譜的多個部分頻譜中指定一個部分頻譜,該部分頻譜將被復(fù)制為較高頻譜,第二參數(shù)指定被復(fù)制之后該部分頻譜的增益。
32.一種對被編碼信號進(jìn)行解碼的解碼方法,其中,被編碼信號包括一個較低頻譜和擴(kuò)展數(shù)據(jù),該擴(kuò)展數(shù)據(jù)包括一個第一參數(shù)和一個第二參數(shù),它們以高于該較低頻譜的較高頻率指定一個較高頻譜,該解碼方法包括一個解碼步驟,用于通過對該被編碼信號進(jìn)行解碼,產(chǎn)生較低頻譜和擴(kuò)展數(shù)據(jù);一個頻帶擴(kuò)展步驟,用于由該較低頻譜、第一參數(shù)和第二參數(shù)產(chǎn)生較高頻譜;以及一個頻率-時間變換步驟,將通過組合所產(chǎn)生的較高頻譜和該較低頻譜所獲得的一個頻譜變換成時間域中的信號,以及在該頻帶擴(kuò)展步驟中,從形成該較低頻譜的多個部分頻譜通過第一參數(shù)所指定的一個部分頻譜被復(fù)制,利用第二參數(shù)確定被復(fù)制后的該部分頻譜的增益,并產(chǎn)生所獲得的部分頻譜作為較高頻譜。
33.一種對輸入信號進(jìn)行解碼的程序,包括一個頻率-時間變換步驟,用于把時間域中的輸入信號變換成包括較低頻譜的頻譜;一個頻帶擴(kuò)展步驟,用于產(chǎn)生擴(kuò)展數(shù)據(jù),該擴(kuò)展數(shù)據(jù)以高于該較低頻譜的一個較高頻率指定一個較高頻譜;以及一個編碼步驟,用于對該較低頻譜和擴(kuò)展數(shù)據(jù)進(jìn)行編碼,并輸出被編碼的較低頻譜和擴(kuò)展數(shù)據(jù)。其中,在該頻帶擴(kuò)展步驟中,產(chǎn)生一個第一參數(shù)和一個第二參數(shù)作為擴(kuò)展數(shù)據(jù),第一參數(shù)從形成該較低頻譜的多個部分頻譜中指定一個部分頻譜,該部分頻譜將被復(fù)制為較高頻譜,第二參數(shù)指定被復(fù)制之后該部分頻譜的增益。
34.一種對被編碼信號進(jìn)行解碼的程序,其中,該被編碼信號包括一個較低頻譜和擴(kuò)展數(shù)據(jù),該擴(kuò)展數(shù)據(jù)包括一個第一參數(shù)和一個第二參數(shù),它們以高于該較低頻譜的較高頻率指定一個較高頻譜,該程序包括一個解碼步驟,用于通過對該被編碼信號進(jìn)行解碼,產(chǎn)生較低頻譜和擴(kuò)展數(shù)據(jù);一個頻帶擴(kuò)展步驟,用于由該較低頻譜、第一參數(shù)和第二參數(shù)產(chǎn)生較高頻譜;以及一個頻率-時間變換步驟,用于把通過組合所產(chǎn)生的較高頻譜和較低頻譜所獲得的頻譜變換成時間域中的信號,以及在該頻帶擴(kuò)展步驟中,從形成該較低頻譜的多個部分頻譜中通過第一參數(shù)所指定的一個部分頻譜被復(fù)制,由第二參數(shù)確定被復(fù)制后該部分頻譜的增益,并產(chǎn)生所獲得的部分頻譜作為較高頻譜。
35.一種計(jì)算機(jī)可讀的記錄介質(zhì),其上記錄被編碼信號,其中,被編碼信號包括一個較低頻譜和擴(kuò)展數(shù)據(jù),該擴(kuò)展數(shù)據(jù)包括一個第一參數(shù)和一個第二參數(shù),它們以高于該較低頻譜的較高頻率指定一個較高頻譜,第一參數(shù)是從形成該較低頻譜的多個部分頻譜中指定一個部分頻譜的參數(shù),該部分頻譜將被復(fù)制為較高頻譜,第二參數(shù)是指定被復(fù)制之后該部分頻譜的增益的參數(shù)。
36.根據(jù)權(quán)利要求35的記錄介質(zhì),其中,在形成該較低頻譜的多個部分頻譜中的至少兩個頻譜具有互相重疊的頻帶部分。
37.根據(jù)權(quán)利要求35的記錄介質(zhì),其中,該擴(kuò)展數(shù)據(jù)包括一個第三參數(shù),第三參數(shù)從形成該較低頻譜的多個部分頻譜中指定一個包括最低頻率分量的部分頻譜的頻率位置。
38.根據(jù)權(quán)利要求35的記錄介質(zhì),其中,該擴(kuò)展數(shù)據(jù)包括一個第四參數(shù),第四參數(shù)從形成該較低頻譜的多個部分頻譜中指定一個包括最高頻率分量的部分頻譜的頻率位置。
39.根據(jù)權(quán)利要求35的記錄介質(zhì),其中,該擴(kuò)展數(shù)據(jù)包括一個第五參數(shù),第五參數(shù)指定一個當(dāng)被復(fù)制時在部分頻譜上所執(zhí)行的一個濾波處理。
40.根據(jù)權(quán)利要求35的記錄介質(zhì),其中,該擴(kuò)展數(shù)據(jù)包括一個第六參數(shù),第六參數(shù)指示是否較高頻譜將是其相位要被反轉(zhuǎn)的將被復(fù)制的部分頻譜、或是其相位未被反轉(zhuǎn)的將被復(fù)制的部分頻譜。
41.根據(jù)權(quán)利要求35的記錄介質(zhì),其中,該擴(kuò)展數(shù)據(jù)包括一個第七參數(shù),第七參數(shù)指示是否較高頻譜將是一個頻率域中被反轉(zhuǎn)和將被復(fù)制的部分頻譜、或是該頻率域中將被復(fù)制和未被反轉(zhuǎn)的部分頻譜。
42.根據(jù)權(quán)利要求35的記錄介質(zhì),其中,第一參數(shù)包括指示形成該較低頻譜的多個部分頻譜中任何一個頻譜未被用作一個將被復(fù)制的頻譜的數(shù)據(jù)。
43.根據(jù)權(quán)利要求35的記錄介質(zhì),其中,該擴(kuò)展數(shù)據(jù)包括一個第八參數(shù),第八參數(shù)指定要被添加到由第一參數(shù)和第二參數(shù)所指定的較高頻譜的一個噪音頻譜的能量。
全文摘要
一種編碼設(shè)備(200),包括MDCT單元(202),該單元把時間域中的輸入信號變換成包括一個較低頻譜的頻譜;BWE編碼單元(204),該單元產(chǎn)生擴(kuò)展數(shù)據(jù),該擴(kuò)展數(shù)據(jù)以高于較低頻譜的較高頻率指定一個較高頻譜;以及被編碼數(shù)據(jù)流產(chǎn)生單元(205),該單元進(jìn)行編碼以輸出由MDCT單元(202)獲得的較低頻譜和BWE編碼單元(204)獲得的擴(kuò)展數(shù)據(jù)。BWE編碼單元(204)產(chǎn)生作為擴(kuò)展數(shù)據(jù)的(i)第一參數(shù),從形成MDCT單元(202)獲得的較低頻譜的多個較低子頻帶中指定將被復(fù)制的一個較低子頻帶作為較高頻譜;以及(ii)第二參數(shù),指定被復(fù)制之后該較低子頻帶的增益。
文檔編號G10L21/02GK1527995SQ0281103
公開日2004年9月8日 申請日期2002年11月7日 優(yōu)先權(quán)日2001年11月14日
發(fā)明者津島峰生, 則松武志, 西尾孝祐, 田中也, , 也, 志 申請人:松下電器產(chǎn)業(yè)株式會社