專利名稱:數(shù)字聲頻信號(hào)低比特率編譯碼器、和編譯碼方法及其編碼記錄媒體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于多聲道系統(tǒng)中壓縮編碼聲頻信號(hào)的低比特率編碼器和低比特率編碼方法,用于對(duì)壓縮編碼信號(hào)進(jìn)行譯碼的低比特率譯碼器和低比特率譯碼方法,以及使用這種編碼器/編碼方法將編碼的信號(hào)記錄在其上的記錄媒體,上述裝置或方法可以用于電影膠片放映系統(tǒng)以及立體聲或多聲道音響系統(tǒng),例如磁帶錄像機(jī)或視盤放像機(jī)等。
現(xiàn)有技術(shù)中已經(jīng)公知了各種用于聲頻或話音等信號(hào)的實(shí)用編碼技術(shù)和裝置。
作為實(shí)用編碼技術(shù)的實(shí)例,有一種分組頻帶分段系統(tǒng),即所謂變換編碼,用于將例如每個(gè)時(shí)間單位的時(shí)間區(qū)段中的聲頻等信號(hào)分組,以便將每組的根據(jù)時(shí)基的信號(hào)變換成根據(jù)頻基的信號(hào)(正交變換),然后將其分成多個(gè)頻帶中的信號(hào)分量,并將每個(gè)相應(yīng)頻帶的那些信號(hào)分量進(jìn)行編碼。
另外,還可以例舉出分頻段編碼(SBC)技術(shù),這是一種非分組頻帶分段系統(tǒng),在該系統(tǒng)中時(shí)間區(qū)段中的聲頻等信號(hào)被分成多個(gè)頻帶中的信號(hào)分量,無需按每個(gè)單位時(shí)間將其分組,然后將信號(hào)分量進(jìn)行編碼。
此外,也已經(jīng)提出了將上述分頻段編碼與變換編碼相結(jié)合的實(shí)用編碼技術(shù)和裝置。在這種情況下,例如使用分頻段編碼將輸入信號(hào)分成多個(gè)頻帶中的信號(hào)分量,然后將每個(gè)相應(yīng)頻帶的信號(hào)正交地變換成頻段中的信號(hào),以便實(shí)現(xiàn)將這些頻段中的正交變換的信號(hào)分量進(jìn)行編碼。
這里作為用于上述這分頻段編碼中頻帶劃分的濾波器,可以例舉出QMF濾波器(正交鏡像濾波器)。在例如如下的文獻(xiàn)中已經(jīng)說明了這種濾波器,“Digital coding of speech in subbands”R.E.Crochiere,Bell Syst.Tech.J.,SS卷,1976年第8期。該QMF濾波器用于將頻帶平分成相等帶寬的頻段。該濾波器的特征在于在以后的處理階段中合成上述被分段的頻帶時(shí)不會(huì)產(chǎn)生所謂的混疊。
另外,文獻(xiàn)“Polyphase Quadrature filters-A new subband coding technique”Joseph H.Rothweiler ICASP 83,BOSTON,說明了相等帶寬的濾波器分段技術(shù)。該多相正交濾波器的特征在于分段可以在將信號(hào)分成多個(gè)相等帶寬的頻帶中的信號(hào)分量時(shí)進(jìn)行。
此外作為上述的正交變換處理,還有例如按預(yù)定的單位時(shí)間(幀)將輸入聲頻信號(hào)分成組的正交變換系統(tǒng),以便執(zhí)行快速傅里葉變換(FFT)、離散余弦變換(DCT)或改進(jìn)型DCT變換(MDCT)等變換,每個(gè)相應(yīng)的組從而將根據(jù)時(shí)基的信號(hào)變換成根據(jù)頻基的信號(hào)。
在如下的文獻(xiàn)中說明了這種MDCT,“SUbband/Transform Coding Using Filter Bank Designs Based on Time Domain Aliasing Cancellation”J.P.Princen A.B. Bradley,Univ.of Surrey Royal Melbourne Inst.of Tech.ICASSP 1987。
另外作為對(duì)分入各頻帶的相應(yīng)頻率分量編碼(量化)的情況下的頻分寬度,有一種頻帶劃分考慮了例如人的聽覺特性。即,有按帶寬將聲頻信號(hào)分成多個(gè)(例如25個(gè))頻帶中的信號(hào)分量的實(shí)例,根據(jù)頻率編移至較高頻帶側(cè)而使得該帶寬變得較寬,上述頻帶一般稱為臨界頻帶。
此外在上述時(shí)間將每個(gè)相應(yīng)頻帶的數(shù)據(jù)進(jìn)行編碼時(shí),按照每個(gè)相應(yīng)頻帶的預(yù)定比特分配或每個(gè)相應(yīng)頻帶的自適應(yīng)比特分配進(jìn)行編碼。
例如,在按照上述比特分配對(duì)進(jìn)行MDCT處理之后得到的系數(shù)數(shù)據(jù)進(jìn)行編碼時(shí),就按照相對(duì)于由MDCT處理每個(gè)相應(yīng)組得到的每個(gè)相應(yīng)頻帶的MDCT系數(shù)數(shù)據(jù)的自適應(yīng)分配比特?cái)?shù)量,進(jìn)行編碼。
作為比特分配技術(shù)和裝置,下述的兩種技術(shù)和裝置是公知的。
例如在文獻(xiàn)“Adaptive Transform Coding of Speech Signals”中(IEEE Transactions of Acounstics,Speech,and Signal Processing,ASSP-25卷,1977年8月第4期)根據(jù)每個(gè)相應(yīng)頻帶的信號(hào)量值進(jìn)行比特分配的。
此外例如在文獻(xiàn)“The critical band coder-digital encoding of the perceptual requirement of the auditory System”(M.A.Kransner MIT,ICASSP 1980)中,給出了利用聽覺掩蔽使每個(gè)頻帶得到所需的信噪比,以便進(jìn)行固定比特分配的技術(shù)和裝置。
同時(shí)例如上述的利用分頻段編碼等方法用于聲頻信號(hào)的實(shí)用壓縮編碼系統(tǒng)中,利用人的聽覺特性壓縮聲頻數(shù)據(jù),以便使其數(shù)據(jù)量變成僅約1/5,現(xiàn)在已經(jīng)得到實(shí)施了。
應(yīng)當(dāng)指出,有一種系統(tǒng)稱為ATRAC(自適應(yīng)變換聲學(xué)編碼,SONY公司的商業(yè)名稱)用于例如MD(小型盤,SONY公司的商業(yè)名稱)作為壓縮聲頻數(shù)據(jù)的實(shí)用編碼系統(tǒng),以便使數(shù)據(jù)量變成大約1/5。
然而在利用人的聽覺特性的實(shí)用編碼系統(tǒng)中,有如下的情況,通過對(duì)話音信號(hào)壓縮編碼得到的樂器或人的噪音等,在之后對(duì)該編碼的信號(hào)進(jìn)行譯碼時(shí)可能與原始聲音相比會(huì)產(chǎn)生變化,盡管這種現(xiàn)象僅在較小的程度上發(fā)生。特別是在利用聽覺特性用于記錄媒體的記錄格式的上述實(shí)用編碼系統(tǒng)情況下,要求原始聲音的高保真度地重放,也就要求實(shí)現(xiàn)較高的音質(zhì)。
相反,上述實(shí)用編碼系統(tǒng)(ATRAC系統(tǒng)等)的用于壓縮聲頻信號(hào),并使其信號(hào)(數(shù)據(jù))量變成大約1/5的格式已經(jīng)實(shí)施了,而且采用這種格式的硬件是非常普及的。
因此,進(jìn)行與該格式不具有兼容性的改變或擴(kuò)展,不僅對(duì)已經(jīng)采用該格式的制造商(生產(chǎn)商)不利,而且對(duì)普通用戶也不利。
由于這種原因,因此希望基于裝置在編碼或譯碼中得到高的音質(zhì),而不要改變?cè)摳袷奖旧怼?br>
除了上述實(shí)現(xiàn)高音質(zhì)的方法之外,還要將線性PCM(脈沖編碼調(diào)制)聲音混入普通的壓縮數(shù)據(jù)。然而因?yàn)閷?shí)用編碼系統(tǒng)的壓縮數(shù)據(jù)與線性數(shù)據(jù)在幀長(zhǎng)和每幀的時(shí)間長(zhǎng)度上是不同的,所以難于在重放時(shí)實(shí)現(xiàn)同步。因此,在相同的時(shí)間使用兩種格式的這些數(shù)據(jù)是非常困難的。
此外,不僅在普通聲頻設(shè)備的情況下,而且在例如電影膠片放映系統(tǒng)、高清晰度電視以及立體聲或多聲道音響系統(tǒng),例如磁帶錄像機(jī)或視盤放像機(jī)等的情況下,都可能處理4至8個(gè)聲道的多聲道聲頻信號(hào)。因此在這種情況下,也希望進(jìn)行有效地編碼,以便降低比特率。
特別是在電影膠片上,有例如記錄著8個(gè)聲道的數(shù)字聲頻信號(hào)的實(shí)例,即左聲道、左中聲道、中央聲道、右中聲道、右聲道、環(huán)繞左聲道、環(huán)繞右聲道和次低音揚(yáng)聲器聲道。在這種情況下,就需要上述的有效編碼,以便降低比特率。
也就是說,在電影膠片上難于確保能夠容納8個(gè)聲道抽樣頻率為44.1KHz(4赫)和16比特的線性量化聲數(shù)據(jù)的區(qū)域,而這種線性量化聲頻數(shù)據(jù)是用在所謂CD(光盤)等上的。因此,需要對(duì)聲頻數(shù)據(jù)進(jìn)行壓縮。
應(yīng)當(dāng)指出,記錄在電影膠片上8個(gè)聲道數(shù)據(jù)的各聲道分別對(duì)應(yīng)左揚(yáng)聲器、左中揚(yáng)聲器、中央揚(yáng)聲器、右中揚(yáng)聲器、右揚(yáng)聲器、環(huán)繞左揚(yáng)聲器、環(huán)繞右揚(yáng)聲器和次低音揚(yáng)聲器,它仍被置放在屏幕側(cè),在那里通過放映機(jī)電影膠片上圖像記錄區(qū)域?qū)⒅胤诺膱D像放映出來。
中央揚(yáng)聲器置放在屏幕側(cè)的中央,用于通過中央聲道的聲頻數(shù)據(jù)輸出重放的聲音。該中央揚(yáng)聲器輸出最重要的重放聲音,例如演員的話音等。
次低音揚(yáng)聲器用于通過次低音揚(yáng)聲器聲道的聲頻數(shù)據(jù)輸出重放的聲音。該次低音揚(yáng)聲器有效地輸出與其說是低頻帶的聲音不如說是感覺像是振動(dòng)的聲音,例如爆炸聲,因此常常有效地用于爆炸的場(chǎng)面。
左揚(yáng)聲器和右揚(yáng)聲器分別置放在屏幕的左側(cè)和右側(cè),用于分別輸出通過左聲道聲頻數(shù)據(jù)的重放聲音和通過右聲道聲頻數(shù)據(jù)的重放聲音。該左和右揚(yáng)聲器具有立體聲的音響效果。
左中揚(yáng)聲器置放在左揚(yáng)聲器與中央揚(yáng)聲器之間,而右中揚(yáng)聲器置放在中央揚(yáng)聲器與右揚(yáng)聲器之間。左中揚(yáng)聲器輸出通過左中聲道聲頻數(shù)據(jù)的重放聲音,而右中揚(yáng)聲器輸出通過右中聲道聲頻數(shù)據(jù)的重放聲音。該左中和右中揚(yáng)聲器分別對(duì)左和右揚(yáng)聲器起輔助作用。
特別是在具有大屏幕和大量觀眾的電影院中,存在著根據(jù)座位位置聲像定位變得不穩(wěn)定的缺點(diǎn)。然而增加上述的左中和右中揚(yáng)聲器,從而具有形成聲像的更為實(shí)際的定位的效果。
另外,環(huán)繞左和右揚(yáng)聲器置放于環(huán)繞觀眾座位的位置。該環(huán)繞左和右揚(yáng)聲器用于分別輸出通過環(huán)繞左聲道聲頻數(shù)據(jù)的重放聲音和通過環(huán)繞右聲道聲頻數(shù)據(jù)的重放聲音,并且具有產(chǎn)生由鼓掌聲或歡呼聲環(huán)繞的混響或效果的作用。因此能夠以多達(dá)三維的方式形成聲像。
此外,因?yàn)椴僮鞯韧ǔ0l(fā)生在電影膠片媒體的表面,所以如果在其上記錄有數(shù)字?jǐn)?shù)據(jù),則在該處會(huì)造成大得的數(shù)據(jù)丟失。從實(shí)用觀點(diǎn)來看,不可能使用這種記錄系統(tǒng)。因此糾錯(cuò)碼的性能是非常重要的。
因此對(duì)于數(shù)據(jù)壓縮,必須將壓縮處理進(jìn)行到這種程度,即通過將用于糾錯(cuò)碼的比特考慮在內(nèi),才可以在膠片的記錄區(qū)域中進(jìn)行記錄。
由于上述因素,作為如上所述的壓縮8個(gè)聲道數(shù)字聲頻信號(hào)的壓縮方法,采用了實(shí)用的編碼系統(tǒng)(例如ATRAC系統(tǒng)),通過如上所述考慮人的聽覺特性,進(jìn)行最佳比特分配,以便獲得能與CD相比的聲音質(zhì)量。
然而與上述情況相似,采用這種實(shí)用編碼系統(tǒng),一般樂器聲或人的噪音等與原媽聲音相比有變化,盡管這種現(xiàn)象僅是在很小的程度上發(fā)生。因此,在采用上述系統(tǒng)的情況下,在要求具有與原始聲音的保真度的重放記錄格式方面,需要采取能實(shí)現(xiàn)較高聲音質(zhì)量的各種措施。
除了上述實(shí)用編碼系統(tǒng)用作電影膠片上的多聲道記錄格式之外,在其他系統(tǒng)的情況下,也總是存在上述問題,因此從確保記錄區(qū)域的觀點(diǎn)來看,還采用了不可逆壓縮系統(tǒng)。
此外,在如上所述實(shí)現(xiàn)對(duì)多聲道聲頻信號(hào)實(shí)用編碼的系統(tǒng)中,相應(yīng)聲道的數(shù)據(jù)被獨(dú)立地進(jìn)行壓縮處理。
因此,即使在例如某一聲道處于非噪聲的狀態(tài),固定比特(字節(jié))的分配量還是被分配給該聲道。
將固定比特分配量給予上述處于非噪音狀態(tài)的聲道是冗余的。
另外因?yàn)閷?duì)于低電平信號(hào)的聲道與高電平信號(hào)的聲道,比特分配量都是相同的,所以如果估算整個(gè)相應(yīng)的各聲道的比特分配量,就存在冗余的比特。
特別是考慮到對(duì)于每個(gè)相應(yīng)聲道比特分配量都是固定的情況,上述的冗余問題變得更突出了。
綜上所述,本發(fā)明的目的在于提供一種能夠消除多聲道系統(tǒng)壓縮編碼中比特分配量冗余,并且能夠?qū)崿F(xiàn)較高質(zhì)量壓縮編碼的編碼器和編碼方法,與其相對(duì)應(yīng)的譯碼器和譯碼方法,以及將壓縮編碼的信號(hào)記錄在其上的記錄媒體。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明提供了一種低比特率編碼器,用于利用聲頻信號(hào)和人的聽覺的特性,對(duì)多聲道的數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼,該編碼器包括能量檢測(cè)裝置,用于檢測(cè)相應(yīng)聲道每個(gè)數(shù)字聲頻信號(hào)的數(shù)字聲頻信號(hào)能量;比特分配量確定裝置,用于根據(jù)檢測(cè)的結(jié)果,對(duì)相應(yīng)聲道確定比特分配量;壓縮編碼裝置,用于根據(jù)按照確定的比特分配量而分配給每個(gè)相應(yīng)聲道的比特分配量,對(duì)數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼;以及多路復(fù)用裝置,用于多路復(fù)用每個(gè)相應(yīng)聲道的壓縮編碼信號(hào)。比特分配量確定裝置用于確定相應(yīng)比特分配量,以便使數(shù)字聲頻信號(hào)的能量與比特分配量之間的關(guān)系具有非線性特性,致使根據(jù)數(shù)字聲頻信號(hào)能量的增大,比特分配量整體上是增加的。另外相對(duì)于時(shí)間區(qū)段中的抽樣和多聲道聲頻信號(hào)頻率區(qū)段的抽樣,在聲道之間進(jìn)行可變的比特分配。
在根據(jù)本發(fā)明第一實(shí)施例的低比特率編碼器中,能量檢測(cè)裝置是幅度信息檢測(cè)裝置,用于在進(jìn)行壓縮編碼之前,檢測(cè)相應(yīng)聲道數(shù)字聲頻信號(hào)的幅度信息。另外,根據(jù)關(guān)于幅度信息的次方的變化,比特分配量確定裝置確定對(duì)于相應(yīng)聲道的比特分配量。
在這種情況下,通過預(yù)定的變換公式,比特分配量確定裝置根據(jù)聽覺特性計(jì)算(確定)相對(duì)于相應(yīng)聲道幅值信息峰值的比特分配量,從而根據(jù)變換結(jié)果,確定要分配給相應(yīng)聲道的比特量。
另外,比特分配量確定裝置分別確定由預(yù)定的變換公式要分配給相應(yīng)聲道的比特量的估算量,以便與相應(yīng)估算量成比例地分配相應(yīng)聲道的比特分配量,從而使所有聲道的比特分配量是固定的。
另一方面,根據(jù)本發(fā)明第一實(shí)施例的低比特率譯碼器包括譯碼裝置,用于對(duì)由第一實(shí)施例低比特率編碼器編碼的相應(yīng)聲道信號(hào)進(jìn)行譯碼。
另外,在根據(jù)本發(fā)明第二實(shí)施例的低比特率編碼器中,能量檢測(cè)裝置是用于檢測(cè)對(duì)于相應(yīng)聲道信號(hào)關(guān)于預(yù)定的換算因數(shù)[時(shí)間與頻率二維面積的歸一化值(成組浮動(dòng)單元)]的變化,并且比特分配量確定裝置用于按照換算因數(shù)的變化進(jìn)行聲道之間的可變比特分配。
此外在第二實(shí)施例的低比特率編碼器中,通過預(yù)定的變換公式,比特分配量確定裝置根據(jù)人的聽覺特性計(jì)算(確定)相對(duì)于關(guān)于相應(yīng)聲道換算因數(shù)總計(jì)次方的變化的比特分配量,以便根據(jù)變換結(jié)果,確定要分配給相應(yīng)聲道的比特量。
另外,比特分配量確定裝置分別計(jì)算(確定)由預(yù)定的變換公式要分配給相應(yīng)聲道的比特量的估算量,以便與相應(yīng)估算量成比例地分配相應(yīng)聲道的比特分配量,從而使所有聲道的總比特分配量是固定的。
此外,根據(jù)本發(fā)明第二實(shí)施例的低比特率譯碼器包括譯碼裝置,用于對(duì)由第二實(shí)施例低比特率編碼器編碼的相應(yīng)聲道信號(hào)進(jìn)行譯碼。
根據(jù)本發(fā)明,在對(duì)多聲道聲頻信號(hào)進(jìn)行壓縮編碼中,因?yàn)椴捎昧烁鶕?jù)關(guān)于相應(yīng)聲道的能量次方的變化的方法,確定相應(yīng)聲道的比特分配量,從而進(jìn)行壓縮編碼,所以能夠?qū)τ谙鄳?yīng)聲道進(jìn)行與信息量相對(duì)應(yīng)的比特分配。
此外根據(jù)本發(fā)明,在對(duì)多聲道聲頻信號(hào)進(jìn)行壓縮編碼中,在相應(yīng)聲道中使能量與比特分配量的關(guān)系是非線性的,以便根據(jù)比特分配量進(jìn)行壓縮編碼。因此,能夠?qū)τ谙鄳?yīng)聲道進(jìn)行與信息量相對(duì)應(yīng)的比特分配。
圖1是以方框形式示出的電路圖,示出了根據(jù)本發(fā)明第一實(shí)施例的低比特率編碼器的結(jié)構(gòu)略圖。
圖2是以方框形式示出的電路圖,示出了根據(jù)本發(fā)明第一和第二實(shí)施例的低比特率編碼器的結(jié)構(gòu)略圖。
圖3是以方框形式示出的電路圖,用于示出ATRAC系統(tǒng)的低比特率編碼器和根據(jù)本發(fā)明實(shí)施例的低比特率編碼器中的比特分配。
圖4是用于示出聲幀中數(shù)據(jù)記錄狀態(tài)的圖。
圖5是用于示出第一實(shí)施例中比特分配量的曲線圖。
圖6是用于示出第一實(shí)施例中確定比特分配量的操作的流程圖。
圖7是以方框形式示出的電路圖,示出了根據(jù)本發(fā)明第二實(shí)施例的低比特率編碼器的結(jié)構(gòu)略圖。
圖8是用于示出第二實(shí)施例中比特分配量的曲線圖。
圖9是用于示出第二實(shí)施例中確定比特分配量的操作的流程圖。
下面將參考
本發(fā)明的優(yōu)選實(shí)施例。
在圖1和2中示出了根據(jù)本發(fā)明第一實(shí)施例的主要結(jié)構(gòu)。圖1中示出了第一實(shí)施例的低比特率編碼器的結(jié)構(gòu),圖2中示出了第一實(shí)施例的低比特率譯碼器的結(jié)構(gòu)。
首先說明圖1中所示的編碼器的結(jié)構(gòu)。
通過與相應(yīng)聲道對(duì)應(yīng)的輸入端201-20n和傳輸路徑11~1n,將多聲道(Ch1、ch2…chn)的聲頻信號(hào)發(fā)送到與相應(yīng)聲道對(duì)應(yīng)的抽和量化元件1001~100n。在上述抽樣和量化元件1001~100n中,將相應(yīng)聲道的聲頻信號(hào)變換為量化信號(hào)。通過相應(yīng)的傳輸線21~2n,將來自上述抽樣和量化元件1001~100n的量化信號(hào)發(fā)送到幅度信息檢測(cè)電路200和延遲線3001~300n。
從相應(yīng)聲道的量化信號(hào)中,幅度信息檢測(cè)電路200檢測(cè)幅度信息。也就是說,該幅度信息檢測(cè)電路200檢測(cè)與聲頻信號(hào)抽樣(下稱時(shí)間組)數(shù)相對(duì)應(yīng)的每個(gè)周期的幅度信息峰值,下面還將說明在某個(gè)時(shí)刻通過編碼元件4001~400n處理聲頻信號(hào)的抽樣,通過與相應(yīng)聲道相對(duì)應(yīng)的傳輸線41~4n,將上述峰值發(fā)送(傳送)到比特分配確定電路500。應(yīng)當(dāng)指出,該幅度信息檢測(cè)電路200可以具有通過來自傳輸線11~1n的信號(hào)檢測(cè)幅度信息的結(jié)構(gòu)。
通過變換,以下面說明的方式由每個(gè)相應(yīng)聲道的峰值,比特分配確定500確定每個(gè)相應(yīng)聲道的比特分配量,通過傳輸線51~5n,將上述比特分配量發(fā)送(傳送)到相應(yīng)的編碼元件4001~400n。
通過變換,以下面將要說明的方式由每個(gè)相應(yīng)聲道的峰值,比特分配確定電路500確定每個(gè)相應(yīng)聲道的比特分配量,通過傳輸線51~5n,將上述比特分配量發(fā)送(傳送)到相應(yīng)的編碼元件4001~400n。
另外,延遲線3001~300n延遲通過傳輸線21~2n按時(shí)間組已經(jīng)接收的信號(hào),通過相應(yīng)的傳輸線31~3n,將上述被延遲的信號(hào)發(fā)送(傳送)到相應(yīng)的編碼元件4001~400n。
相應(yīng)的編碼元件4001~400n進(jìn)行每個(gè)時(shí)間組的壓縮操作。在這時(shí)通過傳輸線51~5n接收的比特分配量反映通過傳輸線31~3n接收的信號(hào)峰值。相應(yīng)的編碼元件4001~400n壓縮已經(jīng)通過傳輸線31~3n接收的信號(hào),以便使其比特分配量等于已經(jīng)通過傳輸線51~5n接收的比特分配量,通過相應(yīng)的傳輸線61~6n,將上述被壓縮的信號(hào)發(fā)送(傳送)到格式化裝置600。
根據(jù)預(yù)定的格式,格式化裝置600對(duì)已經(jīng)通過傳輸線61~6n接收的每個(gè)聲道的壓縮信號(hào)進(jìn)行糾錯(cuò)處理,將其組成比特流,用于傳輸或記錄在記錄媒體上。通過傳輸線7從輸出端21輸出上述比特流。
另外例如通過激光記錄裝置26,將上述比特流寫入電影膠片27上的預(yù)定區(qū)域28。在圖中標(biāo)號(hào)29指示適配的孔洞,以使用于膠片進(jìn)給的放映機(jī)鏈輪(圖中未示出)與其嚙合。記錄區(qū)域28例如可以設(shè)在孔洞29之間。
下面參考圖2說明該實(shí)施例的低比特率譯碼器的結(jié)構(gòu)。
由圖1的編碼器(低比特率編碼器)組成的比特流被傳輸或記錄在記錄媒體上。通過預(yù)定的重放裝置(圖中未示出),將上述記錄的比特流送到輸入端22,然后從該輸入端22通過傳輸線8發(fā)送到解格式化裝置700。
根據(jù)預(yù)定格式,該解格式化裝置700將已經(jīng)通過傳輸線8發(fā)送的數(shù)據(jù)流分解成每個(gè)相應(yīng)聲道的壓縮信號(hào)。通過與相應(yīng)聲道對(duì)應(yīng)的傳輸線91~9n,將每個(gè)相應(yīng)聲道分解的壓縮信號(hào)發(fā)送到與每個(gè)相應(yīng)聲道相對(duì)應(yīng)設(shè)置的譯碼元件8001~800n。
相應(yīng)的譯碼元件8001~800n擴(kuò)展通過相應(yīng)傳輸線91~9n發(fā)送的壓縮信號(hào),然后將其通過對(duì)應(yīng)的各傳輸線101~10n發(fā)送到D/A(數(shù)字/模擬)變換器9001~900n。
相應(yīng)的D/A變換器9001~900n將通過相應(yīng)的傳輸線101~10n發(fā)送的擴(kuò)展信號(hào)(數(shù)字信號(hào))變換成模擬信號(hào)。通過對(duì)應(yīng)的傳輸線111~11n和輸出端231~23n,將以模擬形式形成的上述信號(hào)輸出,作為相應(yīng)聲道Ch1~Chn的譯碼信號(hào)。
如上所述的實(shí)施例的低比特率編碼器中采用的壓縮編碼技術(shù)可以用于能變化比特率的所有編碼器。這里舉例說明了以固定比特率,利用上述人的聽覺特性,用于壓縮立體聲2聲道聲頻信號(hào)的壓縮編碼技術(shù),以使其信號(hào)量等于大約1/5(例如用于所謂MD(小型盤)的ATRAC系統(tǒng)),下面將說明用于使以固定比特率壓縮能夠成為以可變比特率壓縮的該實(shí)施例的壓縮編碼方法。
在圖3中示出了將所謂ATRAC系統(tǒng)用于其上的編碼器結(jié)構(gòu)。應(yīng)當(dāng)指出,從圖3的頻帶分段濾波器401到再量化器406、格式化裝置407的部分與圖1的相應(yīng)聲道編碼元件4001~400n相對(duì)應(yīng)。
在圖3中,通過輸入端24傳送到的抽樣和量化聲頻信號(hào)首先被分成三個(gè)頻帶的信號(hào)(信號(hào)分量)0~5.5KHz低頻帶中的信號(hào)分量、5.5KHz~11KHz中頻帶中的信號(hào)分量以及高于11KHz(11KHz~22KHz)高頻帶的信號(hào)分量。
在三個(gè)頻帶的信號(hào)中,來自頻帶分段濾波器401的低頻帶中的信號(hào)被發(fā)送到MDCT電路402L,以便執(zhí)行MDCT(改進(jìn)型離散余弦變換)操作,中頻帶中的信號(hào)被發(fā)送到MDCT電路402M,以便同樣地執(zhí)行MDCT操作,高頻帶中的信號(hào)被發(fā)送到MDCT電路402H,以便也同樣地執(zhí)行MDCT操作。在上述MDCT電路402L~402H中,那些信號(hào)被分別分解成頻率分量。
與此同時(shí),對(duì)于每個(gè)相應(yīng)頻帶在進(jìn)行MDCT處理時(shí)的時(shí)間組長(zhǎng)度是可變的。在信號(hào)突然變化的部分,時(shí)間組長(zhǎng)度就縮短,從而提高時(shí)間分辨率。相反在信號(hào)處于穩(wěn)定狀態(tài)的部分,時(shí)間組長(zhǎng)度就延長(zhǎng),以便控制信號(hào)分量和量化噪聲的有效傳輸。
上述時(shí)間組長(zhǎng)度是在組長(zhǎng)估算元件403中預(yù)先確定的。也就是說,來自頻帶分段濾波器401的三個(gè)頻帶中的信號(hào)也被發(fā)送到組長(zhǎng)估算元件403。上述組長(zhǎng)估算元件403確定MDCT的時(shí)間組長(zhǎng)度,并將指示確定的時(shí)間組長(zhǎng)度的信息發(fā)送到MDCT電路402L~402H。
在MDCT處理的兩種時(shí)間組長(zhǎng)度之中,采用長(zhǎng)時(shí)間組長(zhǎng)度的模式稱為長(zhǎng)模式,具有11.6毫秒(ms)的時(shí)間組長(zhǎng)度。另一方面,采用較短時(shí)間組長(zhǎng)的模式稱為短模式,在較高頻帶(高于11KHz)具有1.45ms的時(shí)間組長(zhǎng)度,而在較低頻帶(低于5.5KHz)與在中頻帶(5.5KHz至11KHz)具有2.9ms的時(shí)間組長(zhǎng)度,這樣就提高了時(shí)間分辨率。
以這種方式被分解成時(shí)間和頻率二維區(qū)域(下稱成組浮動(dòng)單元)中的信號(hào)分量的聲頻信號(hào),在整個(gè)低頻帶、中頻帶和高頻帶中被分成52個(gè)成組浮動(dòng)單元,并且在每個(gè)單元中被歸一化(進(jìn)行換算因數(shù)的確定)。
利用人的聽覺特性,比特分配元件405分析組成對(duì)應(yīng)聲頻信號(hào)的分量。該分析結(jié)果被發(fā)送到再量化器406,來自歸一化電路404L~404H的每個(gè)相應(yīng)單元的信號(hào)也加到再量化器406。
根據(jù)分析結(jié)果,再量化器406確定每個(gè)單元編碼的準(zhǔn)確度,也就是說進(jìn)行字長(zhǎng)的確定,以便得到參數(shù)和進(jìn)行再量化。
最后按照預(yù)定的格式,格式化器407多路復(fù)用每個(gè)相應(yīng)單元的相應(yīng)參數(shù)信息和再量化的頻譜信號(hào),從而形成比特流。該格式化器407的輸出信號(hào)從輸出端25輸出。
在聲幀的每個(gè)單元中進(jìn)行上述的編碼操作。
圖4中示出了聲幀40中的數(shù)據(jù)記錄狀態(tài)。
在圖4中一個(gè)聲幀包括212比特。在該聲幀中,512個(gè)抽樣并且對(duì)應(yīng)一個(gè)聲道的聲頻重放數(shù)據(jù)在44.1KHz的抽樣率上被壓縮編碼。
212比特的聲幀數(shù)據(jù)包括組長(zhǎng)模式41、子信息量42、字長(zhǎng)數(shù)據(jù)43、換算因數(shù)數(shù)據(jù)44、頻譜數(shù)據(jù)45、冗余換算因數(shù)數(shù)據(jù)46、冗余字長(zhǎng)數(shù)據(jù)47、下部分子信息量48和下部分組長(zhǎng)模式49。
在212比特的數(shù)據(jù)中,包括用于糾錯(cuò)的雙寫部分。也就是說該部分包括冗余換算因數(shù)數(shù)據(jù)46、冗余字長(zhǎng)數(shù)據(jù)47、下部分子信息量48和下部分組長(zhǎng)模式49。
在該實(shí)施中,212比特中的186比特對(duì)應(yīng)除去雙寫部分之外的部分,并且以基本比特率來表示,成為等于128千比特/秒(KbPS)。
組長(zhǎng)模式是用于記錄圖3組長(zhǎng)估算元件403的估算結(jié)果的數(shù)據(jù),其內(nèi)容如表1中所示。
表1 從以上表1中可以看出,當(dāng)組長(zhǎng)應(yīng)用模式為長(zhǎng)模式時(shí),要進(jìn)行變換處理的信號(hào)分別在低頻帶和中頻帶中通過MDCT操作,被分解成128個(gè)頻率分量,而在高頻帶中被分解成256個(gè)頻率分量。
另一方面,當(dāng)組長(zhǎng)應(yīng)用模式為短模式時(shí),要進(jìn)行變換處理的信號(hào)分別在低頻帶、中頻帶和高頻帶中被分解成32個(gè)頻率分量。
另外,量1、量2和量3這三個(gè)信息被記錄在子信息量42中。量1指示字長(zhǎng)和記錄的換算因數(shù)的數(shù)量,量2指示雙寫的字長(zhǎng)的數(shù)量,量3指示雙寫的換算因數(shù)的數(shù)量。其內(nèi)容如表2中所示。
表2量1量2量3 字長(zhǎng)指當(dāng)(每個(gè)信號(hào))相應(yīng)單元被再量化時(shí)的字長(zhǎng)。其內(nèi)容如表3中所示。
表3
換算因數(shù)指示當(dāng)(每個(gè)信號(hào))相應(yīng)單元被歸一化理的值。其內(nèi)容如表4中所示。
表4A
表4B
表4C 同時(shí),上述圖3中的比特分配元件405考慮人的聽覺特性確定字長(zhǎng)值,以使一個(gè)聲幀的比特量在再量化中等于212比特。通過使212比特的值成為可變,能夠構(gòu)成可變長(zhǎng)度的編碼器。
也就是說,如果采用下述結(jié)構(gòu),即根據(jù)本發(fā)明實(shí)施例構(gòu)成低比特率編碼器的圖1中比特分配確定電路500的輸出連接到圖3的比特分配元件405,就能夠構(gòu)成可變長(zhǎng)度的編碼器。
下面將參考圖5中的曲線和圖6中的流程圖,說明以上述方式連接到圖3比特分配元件405的圖1比特分配確定電路500的操作。
首先,當(dāng)在圖6的步驟S61中啟動(dòng)處理操作時(shí),在步驟S62中,比特分配確定電路500檢測(cè)每個(gè)相應(yīng)聲道的峰值。通常峰值與相應(yīng)聲道中步頻信號(hào)的能量對(duì)應(yīng)。
然后在步驟S63中,計(jì)算與確定的峰值相對(duì)應(yīng)的比特分配量。對(duì)于上述計(jì)算,采用制成表的峰值/比特分配量對(duì)應(yīng)曲線。
圖5中的曲線是相對(duì)于峰值變換比特分配量的曲線。應(yīng)當(dāng)指出,圖5中所示的比特分配量變換曲線是在所謂ATRAC系統(tǒng)用作編碼系統(tǒng)情況下的曲線。
在圖5中,橫坐標(biāo)表示輸入信號(hào)的峰值,能夠取的最大值被歸一化成1。
另外縱坐標(biāo)表示比特分配量,并且最大分配量被設(shè)定為186字節(jié)。該值等于所謂MD(小型盤)裝置中ATRAC系統(tǒng)一個(gè)聲幀的信息量。
通過利用各種聲頻信號(hào)進(jìn)行試驗(yàn),確定圖5中所示的變換曲線。
在圖5中,比特分配量的整體趨勢(shì)如下,即比特分配量隨著峰值的增大而增加,但是當(dāng)峰值大于2的負(fù)3次方時(shí),比特分配量朝減少的方向變化。
上述曲線是根據(jù)試驗(yàn)結(jié)果作出的,因?yàn)楫?dāng)信號(hào)電平足夠大(顯著大)時(shí),量化噪聲通過再量化被信號(hào)電平掩蔽,所以即使再量化噪聲的注入量增大,也很難聽到聲音。
另一方面在圖5中,在信號(hào)電平足夠小(顯著小)的情況下,例如峰值小于2的負(fù)12次方,就使比特分配量成為固定的(均勻比特分配)。這是因?qū)τ贏TRAC系統(tǒng)的相應(yīng)參數(shù)信息(圖4中所示的字長(zhǎng)數(shù)據(jù)或換算因數(shù)數(shù)據(jù)等),所需的比特量是大致固定的,因此必須在某個(gè)程度上確保比特量。
另外,因?yàn)楫?dāng)電平降低時(shí),就能夠聽到隨機(jī)噪聲(寫噪聲),并且信號(hào)具有頻率分量在整個(gè)頻帶上不均勻分布的趨勢(shì),所以盡管電平較小也需要大的比特量。
如上所述原因?qū)е卤忍胤峙淞颗c峰值之間的關(guān)系成為非線性的(大致呈S形的曲線)。也就是說,除非考慮了聽覺特性,比特分配量與峰值之間的關(guān)系是成比例的關(guān)系。然而在本發(fā)明中采用了一種方案,在該方案中保持每個(gè)相應(yīng)聲道的最低比特量,在電平大于某一預(yù)定電平的情況下,比特分配量減少。
在步驟S64中,對(duì)整個(gè)比特量是否是固定的進(jìn)行判斷。當(dāng)在上述步驟S64中判斷需要使所有聲道的總比特分配量成為固定的時(shí),處理操作進(jìn)行到步驟S65。在上述變換完成之后,下面將進(jìn)行公式(1)的計(jì)算,以便算出每個(gè)相應(yīng)聲道的極限比特分配量。
也就是說,當(dāng)假設(shè)n聲道系統(tǒng)中每一個(gè)聲幀的總比特分配量為G,通過變換的比特分配量為Ci(i=1、2、……n),分配給每個(gè)聲道的極限比特分配量Si如下式所示Si=G*Ci/(C1+C2+……Cn)……(1)在步驟S65中的處理之后,或者在步驟S64中判斷整個(gè)比特量不是固定的之后,處理操作進(jìn)行到步驟S66,結(jié)束該處理。
使圖1的格式化裝置600和圖2的解格式化裝置700與上述ATRAC系統(tǒng)對(duì)應(yīng),其操作在下面進(jìn)行說明。
圖1的格式化裝置600按聲道的順序,安排由每一個(gè)聲幀相應(yīng)聲道編碼元件4001~400n按照如圖4中所示格式發(fā)送的數(shù)據(jù),以便將其作為數(shù)據(jù)流傳送。也就是說,上述格式化裝置600用作多路復(fù)用器。
另外,圖2的解格式化裝置700用作多路分解器,以便分解每個(gè)相應(yīng)聲道在格式化裝置600多路復(fù)用的數(shù)據(jù),將其發(fā)送(傳送)到相應(yīng)的譯碼元件8001~800n。
如上所述,按照根據(jù)本發(fā)明第一實(shí)施例的裝置(編碼器/譯碼器),在壓縮具有多聲道的聲頻數(shù)據(jù)時(shí),通過關(guān)于相應(yīng)聲道幅值信息時(shí)間的變化,確定相應(yīng)聲道的比特分配量,以便對(duì)聲頻數(shù)據(jù)進(jìn)行編碼。因此,能夠?qū)τ谙鄳?yīng)聲道進(jìn)行與信息量相對(duì)應(yīng)的比特分配。從而能夠進(jìn)行更有效的編碼。
也就是說,能夠?qū)崿F(xiàn)較高的音質(zhì),或?qū)崿F(xiàn)所有聲道總計(jì)上的低比特率。應(yīng)當(dāng)指出,雖然根據(jù)記錄的媒體舉例說明了希望固定長(zhǎng)度的情況,但是能夠以使所有聲道的總比特分配量成為大致固定的方式,在第一實(shí)施例的裝置中進(jìn)行編碼。
下面說明本發(fā)明的第二實(shí)施例。
圖7中示出了第二實(shí)施例低比特率編碼器的結(jié)構(gòu)。
在圖7中,通過與相應(yīng)聲道對(duì)應(yīng)的輸入端301~30n和傳輸線1011~101n,將多聲道(Ch1、Ch2、Chn)的聲頻信號(hào)發(fā)送到與相應(yīng)聲道對(duì)應(yīng)的抽樣和量化元件1201~120n。在上述抽樣和量化元件1201~120n中,相應(yīng)聲道的聲頻信號(hào)被變換成量化信號(hào)。來自相應(yīng)抽樣和量化元件1201~120n的上述量化信號(hào),通過傳輸線1021~102n被發(fā)送到相應(yīng)編碼元件2101~210n。
在相應(yīng)編碼元件2101~210n中,相應(yīng)聲道的聲頻信號(hào)被分成時(shí)間和頻率二維區(qū)域(成組浮動(dòng)單元)中的信號(hào),以便利用每個(gè)成組浮動(dòng)單元的換算因數(shù),使屬于成組浮動(dòng)單元的信號(hào)分量歸一化。通過傳輸線1031~103n,將確定的相應(yīng)成組浮動(dòng)單元的換算因數(shù)發(fā)送到比特分配確定電路310。
該比特分配確定電路310確定通過傳輸線1031~103n接收的換算因數(shù)的每個(gè)相應(yīng)聲道的總和,以便由該總和按照下面將要說明的變換公式(變換曲線),計(jì)算(確定)相應(yīng)聲道的比特分配量,并將比特分配量通過傳輸線1041~104n發(fā)送(傳送)到編碼元件2101~210n。
因此根據(jù)比特分配量,相應(yīng)編碼元件2101~210n對(duì)來自傳輸線1021~102n的信號(hào)進(jìn)行再量化,并將再量化的,即壓縮的信號(hào)通過傳輸線1051~105n發(fā)送(傳送)到格式化裝置410。
格式化裝置410將通過多聲道傳輸線1051~105n接收的壓縮信號(hào)組成比特流,用于按照預(yù)定的格式傳輸或記錄在記錄媒體上。上述比特流通過傳輸線106從輸出端31輸出。
另外通過例如激光記錄裝置26,將上述比特流寫入電影膠片27上的預(yù)定記錄區(qū)域28中。
應(yīng)當(dāng)指出,因?yàn)榈诙?shí)施例中低比特率譯碼器的基本結(jié)構(gòu)與圖2中的結(jié)構(gòu)相似,所以省略了詳細(xì)的說明。
下面將參考圖2簡(jiǎn)要地說明該譯碼器。按照預(yù)定的格式,第二實(shí)施例低比特率譯碼器的解格式化裝置700也將來自第二實(shí)施例低比特率編碼器的比特流分解成每個(gè)相應(yīng)聲道的壓縮信號(hào)。
在與每個(gè)相應(yīng)聲道對(duì)應(yīng)設(shè)置的譯碼元件,8001~800n中,擴(kuò)展每個(gè)相應(yīng)聲道分解了的壓縮信號(hào),然后在D/A(數(shù)字/模擬)變換器9001~900n中,將其變換成模擬信號(hào)。上述模擬信號(hào)作為相應(yīng)聲道Ch1~Chn的譯碼信號(hào)輸出。
用于第二實(shí)施例低比特率編碼器中的壓縮編碼技術(shù)可以用于所有采用換算因數(shù)進(jìn)行壓縮編碼的系統(tǒng)中。
也就是說,當(dāng)采用了與第二實(shí)施例中同樣的結(jié)構(gòu)時(shí),即圖7比特分配確定電路310的輸出連接到圖3的比特分配元件405,就能夠構(gòu)成可變長(zhǎng)度編碼器。
下面參考圖8中的曲線和圖9中的流程圖,說明連接到圖3比特分配元件405的圖7比特分配確定電路310的詳細(xì)操作。
首先,當(dāng)在圖9的步驟S91中開始處理操作時(shí),在步驟S92中,比特分配確定電路310由來自編碼元件2101~210n的換算因數(shù),計(jì)算每個(gè)相應(yīng)聲道換算因數(shù)的總和。
在后面的步驟S93中,由確定的相應(yīng)聲道換算因數(shù)總和計(jì)算每個(gè)相應(yīng)聲道的比特分配量。
這里,換算因數(shù)是如上所述包含在52個(gè)成組浮動(dòng)單元中已經(jīng)歸一化頻率分量的值。通常,采用一種在對(duì)應(yīng)成組浮動(dòng)單元中確定頻率分量絕對(duì)值的方法,以便從表4所示的值中選擇那些絕對(duì)值中最小的一個(gè)值,而不是最大值。
也就是說,考慮了換算因數(shù)指示成組浮動(dòng)單元中數(shù)據(jù)的典型特征,即能量。因此,考慮了如果確定了換算因數(shù)之和,就能夠估算整個(gè)信息量。
圖8中示出了圖7比特分配確定電路310中相對(duì)于換算因數(shù)之和的比特分配量。
同樣在圖8中與第一實(shí)施例相同,采用ATRAC系統(tǒng)作為編碼系統(tǒng)。在圖8中,與圖5相似縱坐標(biāo)表示比特分配量(最大分配量為186字節(jié)),而橫坐標(biāo)表示換算因數(shù)之和。
與第一實(shí)施例的圖5相似,通過利用各種聲頻信號(hào)進(jìn)行試驗(yàn),確定圖8中所示的變換曲線。
作為整體趨勢(shì)是根據(jù)換算因數(shù)之和的值增大,比特分配量也增加。
然而在圖8中,當(dāng)換算因數(shù)之和的值大于大約7000時(shí),比特分配量朝減少方向變化。這是根據(jù)如下的試驗(yàn)結(jié)果因?yàn)樵诒忍胤峙淞可闲盘?hào)電平相對(duì)較大,這種情況下?lián)Q算因數(shù)之和的值就顯著地較大(信號(hào)電平足夠大),并且通過再量化的量化噪聲被信號(hào)電平掩蔽,所以即使再量化噪聲的注入量增加,也難于聽到信號(hào)。
另一方面,當(dāng)換算因數(shù)之和的值小于1.5時(shí)(在信號(hào)電平足夠小的情況下),比特分配量是固定的,其原因是因?yàn)橛糜贏TRAC系統(tǒng)相應(yīng)參數(shù)信息(圖4中所示的字長(zhǎng)數(shù)據(jù)或換算因數(shù)數(shù)據(jù)等)所需的比特量是大致固定的,所以必須確保上述比特量。
同樣在該實(shí)例中,比特分配量換算因數(shù)總和之間的關(guān)系呈現(xiàn)大致為S形曲線的非線性特性。
還是在第二實(shí)施例步驟S94中,進(jìn)行整個(gè)比特量是否是固定的判斷。當(dāng)在上述步驟S94中判斷出必須使所有聲道的總比特分配量成為固定的,該處理操作就進(jìn)行到步驟S95。在上述變換完成之后,進(jìn)行公式(1)的計(jì)算,以便算出每個(gè)相應(yīng)聲道的極限比特分配量。
在步驟S95中的處理之后,或者在步驟S94中判斷整個(gè)比特量不是固定的,該處理操作進(jìn)行到步驟S96。
還是在第二實(shí)施例中,圖7的模式化裝置410按聲道的順序,安排由每一個(gè)聲幀相應(yīng)聲道的編碼元件2101~210n以圖4中所示的形式發(fā)送的數(shù)據(jù),以便將其作為比特流傳送。也就是說,上述格式化裝置410用作多路復(fù)用器。
另外,第二實(shí)施例低比特率譯碼器中的解格式化裝置也用作多路分解器,以便分解每個(gè)相應(yīng)聲道在格式化裝置410中多路復(fù)用的數(shù)據(jù),并將其發(fā)送(傳送)到相應(yīng)的譯碼元件。
如上所述根據(jù)第二實(shí)施例的裝置(編碼器/譯碼器),在壓縮具有多聲道的聲頻數(shù)據(jù)時(shí)采用了一種方法,即通過關(guān)于相應(yīng)聲道換算因數(shù)總和的次方的變化,確定相應(yīng)聲道的比特分配量,以便將聲頻數(shù)據(jù)編碼。因此,能夠?qū)ο鄳?yīng)聲道實(shí)現(xiàn)與信息量相對(duì)應(yīng)的比特分配,從而能夠進(jìn)行更有效的編碼。
通過在編碼中的上述改進(jìn),能夠?qū)崿F(xiàn)較高的音質(zhì)或較低的比特率。也就是說,同樣在該實(shí)施例的第二裝置中,能夠在整個(gè)聲道上總體上實(shí)現(xiàn)較低的比特率或較高的音質(zhì)。在這種情況下,能夠進(jìn)行編碼使所有聲道的總比特分配量大致固定。
在上述本發(fā)明的第一和第二實(shí)施例中,舉出了以電影膠片作為記錄媒體的例子進(jìn)行了說明,然而作為記錄媒體,并不僅限于能夠使用電影膠片,而且還包括各種未脫離本發(fā)明主題范圍的能夠使用的媒體。例如可以使用光盤和磁帶等。
在本發(fā)明中,因?yàn)橥ㄟ^能量,例如幅度信息,或者關(guān)于相應(yīng)聲道換算因數(shù)總和的次方的變化,確定相應(yīng)聲道的比特分配量,所以對(duì)于相應(yīng)聲道能夠?qū)崿F(xiàn)與信息量相對(duì)應(yīng)的比特分配。因此,能夠進(jìn)行更有效的編碼,從而能夠?qū)崿F(xiàn)低比特率的高音質(zhì)。
此外,本發(fā)明中多聲道系統(tǒng)的聲頻信號(hào)涉及至少2個(gè)聲道,在聲道數(shù)量為5個(gè)或5個(gè)以上聲道,例如電影的聲跡的情況下,本發(fā)明就能具有期望的更顯著的效果。
權(quán)利要求
1.一種低比特率編碼器,適用于利用聲頻信號(hào)和人的聽覺特性,對(duì)多聲道的數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼,該編碼器包括能量檢測(cè)裝置,用于檢測(cè)相應(yīng)聲道每個(gè)數(shù)字聲頻信號(hào)的數(shù)字聲頻信號(hào)能量;比特分配量確定裝置,用于根據(jù)檢測(cè)的結(jié)果,對(duì)相應(yīng)聲道確定比特分配量;壓縮編碼裝置,用于根據(jù)按照確定的比特分配量而分配給相應(yīng)聲道的比特分配量,對(duì)數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼;以及多路復(fù)用裝置,用于多路復(fù)用每個(gè)相應(yīng)聲道的壓縮編碼信號(hào);比特分配量確定裝置,用于確定比特分配量,以便使數(shù)字聲頻信號(hào)的能量與比特分配量之間的關(guān)系具有非線性特性,致使根據(jù)數(shù)字聲頻信號(hào)能量的增大,比特分配量整體上是增加的。
2.如權(quán)利要求1中所述的低比特率編碼器,其特征在于比特分配量確定裝置的非線性特性為近似于大致S形曲線的特性。
3.如權(quán)利要求1中所述的低比特率編碼器,其特征在于當(dāng)數(shù)字聲頻信號(hào)的能量足夠小時(shí),比特分配量確定裝置的非線性特性具有均勻比特分配特性。
4.如權(quán)利要求1中所述的低比特率編碼器,其特征在于比特分配量確定裝置的非線性特性具有這樣一種特性,即當(dāng)數(shù)字聲頻信號(hào)的能量足夠大時(shí),比特分配量減少。
5.如權(quán)利要求1中所述的低比特率編碼器,其特征在于比特分配量確定裝置確定每個(gè)相應(yīng)聲道所需比特量的估算量,以便每單位時(shí)間從所有聲道整體上與相應(yīng)估算量成比例地分配比特量,從而確定相應(yīng)聲道的比特分配量。
6.如權(quán)利要求1中所述的低比特率編碼器,其特征在于數(shù)字聲頻信號(hào)的能量是指數(shù)字聲頻信號(hào)的幅度特性。
7.如權(quán)利要求1中所述的低比特率編碼器,其特征在于幅度特性是指峰值。
8.如權(quán)利要求1中所述的低比特率編碼器,其特征在于數(shù)字聲頻信號(hào)的能量是指換算因數(shù)。
9.一種記錄媒體,在其上通過低比特率編碼器記錄了多路復(fù)用的壓縮編碼信號(hào),該低比特率編碼器適用于利用聲頻信號(hào)和人的聽覺特性,對(duì)多聲道的數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼,該低比特率編碼器包括能量檢測(cè)裝置,用于檢測(cè)相應(yīng)聲道每個(gè)數(shù)字聲頻信號(hào)的數(shù)字聲頻信號(hào)能量;比特分配量確定裝置,用于根據(jù)檢測(cè)的結(jié)果,對(duì)相應(yīng)聲道確定比特分配量;壓縮編碼裝置,用于根據(jù)按照確定的比特分配量而分配給每個(gè)相應(yīng)聲道的比特分配量,對(duì)數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼;以及多路復(fù)用裝置,用于多路復(fù)用每上相應(yīng)聲道的壓縮編碼信號(hào);比特分配量確定裝置,用于確定比特分配量,以便使數(shù)字聲頻信號(hào)的能量與比特分配量之間的關(guān)系具有非線性特性,致使根據(jù)數(shù)字聲頻信號(hào)能量的增大,比特分配量整體上是增加的。
10.一種低比特率編碼方法,利用聲頻信號(hào)和人的聽覺特性,對(duì)多聲道的數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼,該方法包括以下步驟檢測(cè)相應(yīng)聲道每個(gè)數(shù)字聲頻信號(hào)的數(shù)字聲頻信號(hào)能量;根據(jù)檢測(cè)的結(jié)果,對(duì)相應(yīng)聲道確定比特分配量;根據(jù)按照確定的比特分配量而分配給每個(gè)相應(yīng)聲道的比特分配量,對(duì)數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼;以及多路復(fù)用每個(gè)相應(yīng)聲道的壓縮編碼信號(hào);在比特分配量確定步驟中確定比特分配量,以便使數(shù)字聲頻信號(hào)的能量與比特分配量之間的關(guān)系具有非線性特性,致使根據(jù)數(shù)字聲頻信號(hào)能量的增大,比特分配量整體上是增加的。
11.如權(quán)利要求10中所述的低比特率編碼方法,其特征在于非線性特性為近似于大致S形曲線的特性。
12.如權(quán)利要求10中所述的低比特率編碼方法,其特征在于當(dāng)數(shù)字聲頻信號(hào)的能量足夠小時(shí),非線性特性具有均勻比特分配特性。
13.如權(quán)利要求10中所述的低比特率編碼方法,其特征在于非線性特性具有這樣一種特性,致使當(dāng)數(shù)字聲頻信號(hào)的能量足夠大時(shí),比特分配量減少。
14.一種低比特率譯碼器,包括用于對(duì)來自通過低比特率編碼器多路復(fù)用的壓縮編碼信號(hào)產(chǎn)生的相應(yīng)聲道信號(hào)進(jìn)行譯碼的譯碼裝置,該低比特率編碼器適用于利用聲頻信號(hào)和人的聽覺特性,對(duì)多聲道的數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼,該低比特率編碼器包括能量檢測(cè)裝置,用于檢測(cè)相應(yīng)聲道每個(gè)數(shù)字聲頻信號(hào)的數(shù)字聲頻信號(hào)能量;比特分配量確定裝置,用于根據(jù)檢測(cè)的結(jié)果,對(duì)相應(yīng)聲道確定比特分配量;壓縮編碼裝置,用于根據(jù)按照確定的比特分配量而分配給每個(gè)相應(yīng)聲道的比特分配量,對(duì)數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼;以及多路復(fù)用裝置,用于多路復(fù)用每個(gè)相應(yīng)聲道的壓縮編碼信號(hào);比特分配量確定裝置,用于確定比特分配量,以便使數(shù)字聲頻信號(hào)的能量與比特分配量之間的關(guān)系具有非線性特性,致使根據(jù)數(shù)字聲頻信號(hào)能量的增大,比特分配量整體上是增加的。
15.一種低比特率譯碼器,包括用于對(duì)來自記錄媒體的相應(yīng)聲道信號(hào)進(jìn)行譯碼的譯碼裝置,通過上述權(quán)利要求1至5中任何一項(xiàng)權(quán)利要求中所述的低比特率編碼器以及上述權(quán)利要求10至13中任何一項(xiàng)權(quán)利要求中所述的低比特率編碼方法,在該記錄媒體上記錄了多路復(fù)用的壓縮編碼信號(hào)。
16.一種低比特率譯碼方法,包括對(duì)來自記錄媒體的相應(yīng)聲道信號(hào)進(jìn)行譯碼的步驟,通過利用聲頻信號(hào)和人的聽覺特性,對(duì)多聲道數(shù)字頻信號(hào)進(jìn)行壓縮編碼的低比特率編碼方法,在該記錄媒體上記錄了多路復(fù)用的壓縮編碼信號(hào),該低比特率編碼方法包括以下步驟檢測(cè)相應(yīng)聲道每個(gè)數(shù)字聲頻信號(hào)的數(shù)字聲頻信號(hào)能量;根據(jù)檢測(cè)的結(jié)果,對(duì)相應(yīng)聲道確定比特分配量;根據(jù)按照確定的比特分配量而分配給每個(gè)相應(yīng)聲道的比特分配量,對(duì)數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼;以及多路復(fù)用每個(gè)相應(yīng)聲道的壓縮編碼信號(hào);在比特分配量確定步驟中確定比特分配量,以便使數(shù)字聲頻信號(hào)的能量與比特分配量之間的關(guān)系具有非線性特性,致使根據(jù)數(shù)字聲頻信號(hào)能量的增大,比特分配量整體上是增加的。
全文摘要
低比特率編碼器包括能量檢測(cè)部件,用于檢測(cè)相應(yīng)聲道每個(gè)數(shù)字聲頻信號(hào)和數(shù)字聲頻信號(hào)能量;比特分配量確定部件,用于根據(jù)檢測(cè)的結(jié)果,對(duì)相應(yīng)聲道確定比特分配量;壓縮編碼部件,用于根據(jù)按照確定的比特分配量而分配給每個(gè)相應(yīng)聲道的比特分配量,對(duì)數(shù)字聲頻信號(hào)進(jìn)行壓縮編碼;以及多路復(fù)用部件,用于多路復(fù)用每個(gè)相應(yīng)聲道的壓縮編碼信號(hào);比特分配量確定部件,用于確定比特分配量。
文檔編號(hào)H04B1/66GK1106967SQ94118669
公開日1995年8月16日 申請(qǐng)日期1994年10月26日 優(yōu)先權(quán)日1993年10月26日
發(fā)明者宮森慎二, 上野正俊 申請(qǐng)人:索尼公司