兼容多通道編碼/解碼的制作方法

文檔序號(hào)：7608397閱讀：266來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：兼容多通道編碼/解碼的制作方法
技術(shù)領(lǐng)域：
本發(fā)明有關(guān)一種用于處理一種多通道聲音信號(hào)的方法和裝置，尤其是有關(guān)一種使用立體聲兼容的方法處理一多通道聲音信號(hào)的方法和裝置。
背景技術(shù)：
近年來(lái)，多通道聲音重制技術(shù)變得越來(lái)越重要，這可能是因?yàn)槁曇魤嚎s/編碼技術(shù)，如公知的mp3技術(shù)，使得經(jīng)由網(wǎng)際網(wǎng)絡(luò)或其它具有限制頻寬的傳輸散布音訊記錄變得可行。mp3編碼技術(shù)變得如此有名，乃是因?yàn)槠湓试S所有的音訊記錄以立體聲方式散布，亦即，該音訊記錄的數(shù)字表示方式包含一個(gè)第一或左立體聲通道以及一個(gè)第二或右立體聲通道。
然而，傳統(tǒng)的二聲道聲音系統(tǒng)有個(gè)基本的缺點(diǎn)，因此，便發(fā)展出環(huán)繞聲音技術(shù)。一個(gè)受歡迎的多通道環(huán)繞表現(xiàn)方式，除了兩個(gè)立體聲通道L和R之外，還包含一個(gè)額外的中間通道C和兩個(gè)環(huán)繞通道Ls、Rs。此種參考聲音是亦視為三/二立體聲，亦即，三個(gè)前通道及兩個(gè)環(huán)繞通道，一般來(lái)說(shuō)，便需要五個(gè)傳輸通道。在錄音環(huán)境中，至少需要分別在五個(gè)不同的位置上放置五個(gè)喇叭，以便從五個(gè)放置適當(dāng)?shù)臄U(kuò)音器獲取在一特定距離的最佳化甜蜜點(diǎn)。
在此領(lǐng)域中，已經(jīng)有數(shù)種已知的技術(shù)，用于減少多通道聲音信號(hào)傳輸所需要的數(shù)據(jù)量，這類技術(shù)便稱為接合立體聲技術(shù)。到目前為止，請(qǐng)參考圖10，其所示為一接合立體裝置60，此裝置可為一個(gè)實(shí)施，例如強(qiáng)度立體聲編碼(intensity stereo，IS)或立體信號(hào)編碼(Binaural Cue Coding，BCC)技術(shù)的裝置。這類裝置通常在輸入端接受至少兩個(gè)通道(CH1、CH2、CH3、...、CHn)，且輸出一個(gè)單一的載波通道和參數(shù)數(shù)據(jù)，該參數(shù)數(shù)據(jù)是定義為，在一解碼器中，可計(jì)算出原始通道(CH1、CH2、CH3、...、CHn)的近似值。
通常，該載波通道將包含子頻帶樣本、頻譜系數(shù)、時(shí)間域樣本等等，其相對(duì)之下提供基本信號(hào)較佳的表現(xiàn)，然而，該參數(shù)數(shù)據(jù)并未包含頻譜系數(shù)樣本，但是包含控制參數(shù)，以控制特定的重建算法，如由乘法、時(shí)間位移、頻率位移所進(jìn)行的加權(quán)等。因此，參數(shù)數(shù)據(jù)僅包含相對(duì)之下較粗糙的信號(hào)表示或相關(guān)通道表示。就數(shù)據(jù)而言，載波通道所需要的數(shù)據(jù)量會(huì)落在60-70kbits/s的范圍內(nèi)，而一通道的參數(shù)端信息所需要的數(shù)據(jù)量則在1.5-2.5kbits/s范圍內(nèi)。一個(gè)參數(shù)數(shù)據(jù)的知名例子便是尺度因子(scale factor)、立體聲編碼信息、或是立體信號(hào)編碼參數(shù)，其將于下文中描述。
強(qiáng)度立體聲編碼是于AES預(yù)行刊物3799的「強(qiáng)度立體聲編碼」中描述，由J.Herre，K.H.Brandenburg，D.Lederer于1994年二月在阿姆斯特丹發(fā)表。強(qiáng)度立體聲編碼的概念是基于兩個(gè)立體聲音通道的數(shù)據(jù)上進(jìn)行主軸變換，如果大多數(shù)的數(shù)據(jù)點(diǎn)壓縮在第一主要軸的附近，則可在編碼之前通過(guò)使用一特定角度對(duì)兩個(gè)信號(hào)進(jìn)行旋轉(zhuǎn)達(dá)到編碼增益。然而，對(duì)真實(shí)的立體聲制造技術(shù)來(lái)說(shuō)，情況并非如此。因此，此技術(shù)便通過(guò)在該位串流傳輸中將第二正交組成排除而修正，也因此，同一個(gè)傳輸信號(hào)的左右兩通道的重建信號(hào)會(huì)由不同的權(quán)值和尺度所組成。即便如此，該重建信號(hào)在振幅上是相異的，但相對(duì)于其相位信息而言卻是相同的，然而，兩個(gè)原始聲音通道的能量-時(shí)間封裝則通過(guò)所選的尺度運(yùn)算保留，其典型地以頻率選擇方式運(yùn)作。此是順應(yīng)人類在高頻率的知覺(jué)，其中，支配的空間信號(hào)是由能量封裝所決定。
除此之外，在特定的實(shí)施方式中，該傳輸信號(hào)，亦即該載波通道，是由左通道和右通道的信號(hào)總和產(chǎn)生，而不旋轉(zhuǎn)兩個(gè)部份。除此之外，此程序，亦即產(chǎn)生用于執(zhí)行尺度運(yùn)算的立體聲編碼參數(shù)，是由頻率選擇所執(zhí)行，亦即對(duì)每個(gè)尺度因子頻帶來(lái)說(shuō)皆獨(dú)立，亦即編碼器頻率分割。較佳地，兩個(gè)通道是組合以形成一個(gè)組合或是「載波」通道，且除了該組合通道之外，該立體聲編碼信息是根據(jù)該第一通道的能量、該第二通道的能量、或是該組合或通道的能量所決定。
該BCC技術(shù)是于AES預(yù)行刊物5574的「用于立體聲和多通道聲音壓縮的立體信號(hào)編碼」中描述，由C.Faller，F(xiàn).Baumgarte于2002年五月在慕尼黑發(fā)表。在BCC編碼中，是使用一種以DFT為基礎(chǔ)的變換，將一數(shù)量的聲音輸入通道轉(zhuǎn)換成一頻譜表示法，所產(chǎn)生的均質(zhì)頻譜是分成不互相重疊的分割，每一個(gè)分割都具有一個(gè)索引。每個(gè)分割具有一個(gè)頻寬，其正比于等價(jià)長(zhǎng)方形頻寬(equivalentrectangular bandwidth，ERB)，且針對(duì)每該幀k的每該分割估測(cè)內(nèi)通道等級(jí)差(ICLD)及內(nèi)通道時(shí)間差(ICTD)。該ICLD及ICTD是量子化并編碼產(chǎn)生一個(gè)BCC位串流，該內(nèi)通道等級(jí)差及內(nèi)通道時(shí)間差是針對(duì)每該通道相對(duì)于一參考通道所給予，接著，該參數(shù)便根據(jù)前述的函式計(jì)算，其是根據(jù)欲處理的信號(hào)的特定分割計(jì)算。
在解碼器端，該解碼器接收一單聲道信號(hào)及BCC位串流，該單聲道信號(hào)是轉(zhuǎn)換成頻率域并輸入至空間合成區(qū)塊，其亦接收解碼的ICLD及ICTD值。在該空間合成區(qū)塊中，該BCC參數(shù)(ICLD及ICTD)值是用于執(zhí)行單聲道信號(hào)的加權(quán)運(yùn)算，以便合成多通道信號(hào)，在頻率/時(shí)間轉(zhuǎn)換之后，其是代表原始多通道聲音信號(hào)的重建。
在BCC的例子中，該接合立體聲模塊60是運(yùn)作以輸出該通道端信息，使得該參數(shù)通道數(shù)據(jù)可量子化并將ICLD及ICTD參數(shù)編碼，其中，該原始通道其中之一是用于作為參考通道以編碼該通道端信息。
通常，該載波通道是關(guān)聯(lián)原始通道總和的形式。
自然地，上述技術(shù)僅提供解碼器單聲道的表現(xiàn)，其僅能處理該載波通道，但其能處理參數(shù)數(shù)據(jù)，以產(chǎn)生一個(gè)以上的輸入通道的一個(gè)或多個(gè)逼近。
為了以一種兼容的方式傳輸五個(gè)通道，亦即，以一種串流格式方式傳輸，其亦為一般的立體聲解碼器所了解，所謂的矩陣技術(shù)已經(jīng)在由G.Theile及G.Stoll于1992年10月，在舊金山所發(fā)表的AES預(yù)行刊物3403中的「音樂(lè)環(huán)繞一個(gè)兼容于ISO 11172-3的通用多通道編碼系統(tǒng)」描述。五個(gè)輸入通道L、R、C、Ls和Rs輸入至矩陣裝置以執(zhí)行矩陣化運(yùn)算，以便由該五個(gè)輸入通道計(jì)算基本或兼容的立體聲通道Lo、Ro。這些基本的立體聲通道Lo/Ro是以下列方程式計(jì)算Lo＝L+xC+yLsRo＝R+xC+yRs其中，x和y是常數(shù)，而除了基本立體聲層之外，其是包含該基本立體聲信號(hào)Lo/Ro的編碼版本，其它三個(gè)通道C、Ls、Rs便視為在延伸層中傳輸。至于位串流方面，此Lo/Ro基本立體聲層包含一表頭、如尺度因子的信息、以及子頻帶樣本。該多通道延伸層，亦即中央通道及兩個(gè)環(huán)繞通道是包含于多通道延伸層，其亦稱為輔助數(shù)據(jù)域位。
在解碼端，是執(zhí)行一個(gè)反矩陣化運(yùn)算，一便形成該五個(gè)通道中的左通道和右通道的重建，該五個(gè)通道是使用基本立體聲通道Lo、Ro、以及三個(gè)額外的通道表現(xiàn)。除此之外，三個(gè)額外的通道是由輔助信息中解碼，以便獲得一個(gè)解碼過(guò)的原始多通道聲音信號(hào)的五通道或環(huán)繞表現(xiàn)。
另一個(gè)多通道編碼的方式是由B.Grill、J.Herre、K.H.Brandenburg、E.Eberlein、J.Koller、J.Mueller于1994年二月于阿姆斯特丹在AES預(yù)行刊物3865中所發(fā)表，其是于「改進(jìn)MPEG-2聲音多通道編碼」中描述，其中，為了與之前的技術(shù)兼容，便需要考慮到與之前兼容的模式。至此，便使用兼容矩陣以便由原始五個(gè)輸入通道獲得兩個(gè)所謂的下行混合(downmix)通道Lc、Rc，除此之外，還可動(dòng)態(tài)地選擇三個(gè)輔助通道傳輸以作為輔助數(shù)據(jù)。
為了發(fā)展立體聲的不相關(guān)性，便在通道群組上使用接合立體聲技術(shù)，例如，再三個(gè)前置通道上使用，亦即，對(duì)左通道、右通道和中央通道使用。至此，這三個(gè)通道是組合在一起以獲得一個(gè)組合通道，此組合通道是量子化并封裝成一個(gè)位串流，接著，該組合通道是與對(duì)應(yīng)的接合立體聲信息一起輸入至一接合立體聲解碼模塊中，以便獲得接合立體聲解碼通道，亦即，一個(gè)接合立體聲解碼左通道、一個(gè)接合立體聲解碼右通道、以及一個(gè)接合立體聲解碼中央通道。這些接合立體聲解碼通道會(huì)與左環(huán)繞通道和右環(huán)繞通道一起輸入至一個(gè)兼容矩陣區(qū)塊，以便形成該第一和第二下行混合通道Lc、Rc，接著，兩個(gè)下行通道的量子化結(jié)果及該組合通道的量子化結(jié)果便會(huì)與接合立體聲編碼信息一起封裝成位串流。
因此，使用強(qiáng)度立體聲編碼，獨(dú)立的原始通道信號(hào)群組是于一個(gè)單一部份的「載波」數(shù)據(jù)內(nèi)傳輸，該解碼器接著將相關(guān)信號(hào)重建為相同的數(shù)據(jù)，其是根據(jù)他們的原始能量-時(shí)間封裝重新度量，最終，該傳輸通道的一個(gè)線性組合便會(huì)得到一個(gè)結(jié)果，其是與原始的下行混合大不相同，任何根據(jù)強(qiáng)度立體聲編碼概念的接合立體聲編碼技術(shù)都會(huì)有這個(gè)問(wèn)題。對(duì)于提供與下行混合通道兼容的編碼系統(tǒng)而言，便可導(dǎo)出一個(gè)直接的結(jié)果使用上文所描述的反矩陣技術(shù)重建，會(huì)有因不完美重建所造成的失真現(xiàn)象。使用所謂的接合立體聲預(yù)失真機(jī)制，其中，該左、右、以及中央通道的接合立體聲編碼是于編碼的矩陣化運(yùn)算前執(zhí)行，便可避免這個(gè)問(wèn)題。依此方式，重建的反矩陣機(jī)制僅會(huì)有少數(shù)的失真，這是因?yàn)樵诰幋a器端，接合立體聲解碼信號(hào)便已經(jīng)用于產(chǎn)生該下行混合通道的緣故，因此，該不完美的重建程序便會(huì)移到兼容的下行矩陣通道Lc及Rc，而在該處，其更可能可由該聲音信號(hào)本身屏蔽掉。
盡管此種系統(tǒng)已經(jīng)因?yàn)樵诮獯a器端的反矩陣化運(yùn)算而只有少數(shù)的失真，不過(guò)，其還是有一些缺點(diǎn)存在。其中一個(gè)便是，該立體聲兼容下行混合通道Lc和Rc并非由原始通道而來(lái)，而是由原始通道的強(qiáng)度立體聲編碼/解碼結(jié)果而來(lái)，因此，由于強(qiáng)度立體聲編碼系統(tǒng)所造成的數(shù)據(jù)損失便會(huì)包含在該兼容下行混合通道中。因此，一個(gè)專門對(duì)兼容通道解碼而非對(duì)增強(qiáng)的強(qiáng)度立體聲編碼通道解碼的立體聲解碼器，便會(huì)提供一個(gè)輸出信號(hào)，其是由包含在數(shù)據(jù)損失中的強(qiáng)度立體聲所影響。
除此之外，一個(gè)全額外通道必須在兩個(gè)下行混合通道之間傳輸，此通道是組合通道，其是由該左通道、右通道、以及中央通道的接合立體聲編碼所形成。除此之外，由該組合通道重建該原始通道L、R、C的該強(qiáng)度立體聲信息，亦必須傳輸至解碼器。在解碼器端，執(zhí)行一個(gè)反矩陣，亦即，一個(gè)反矩陣化運(yùn)算，以便得到來(lái)自兩個(gè)下行混合通道的環(huán)繞通道。除此之外，該原始左、右、以及中央通道是使用傳輸組合通道和傳輸接合立體聲參數(shù)進(jìn)行接合立體聲解碼逼近。值得注意的是，該原始左、右、以及中央通道是由該組合通道的接合立體聲解碼所得。

發(fā)明內(nèi)容
本發(fā)明的目的在于提供一個(gè)有效位和降低失真處理或多通道聲音信號(hào)反處理概念。
根據(jù)本發(fā)明的第一個(gè)樣態(tài)，此目的可通過(guò)一個(gè)用于處理多通道聲音信號(hào)的裝置達(dá)成，該多通道聲音信號(hào)具有至少三個(gè)原始通道，該裝置包含用于提供一第一下行混合通道及一第二下行混合通道的提供裝置，該第一和第二下行混合通道是由該原始通道而得；用于計(jì)算該原始信號(hào)的一選擇原始通道的通道端信息的計(jì)算裝置，該計(jì)算裝置是運(yùn)作以便在當(dāng)使用該通道端信息加權(quán)時(shí)，計(jì)算該通道端信息，如一下行混合通道或是包含該第一和第二下行混合通道的一組合下行混合通道，而產(chǎn)生該選擇原始通道的一近似結(jié)果；以及用于產(chǎn)生輸出數(shù)據(jù)的一產(chǎn)生裝置，該輸出數(shù)據(jù)包含該通道端信息、該第一下行混合通道或是來(lái)自該第一下行混合通道的一信號(hào)、以及該第二下行混合通道或是來(lái)自該第二下行混合通道的一信號(hào)。
根據(jù)本發(fā)明的第二個(gè)樣態(tài)，此目的是通過(guò)一種處理多通道聲音信號(hào)的方法所達(dá)成，該多通道聲音信號(hào)具有至少三個(gè)原始通道，該方法的步驟包含提供一第一下行混合通道以及一第二下行混合通道，該第一和第二下行混合通道是得自該原始通道；當(dāng)使用該通道端信息加權(quán)時(shí)，計(jì)算該原始通道的一選擇原始通道的通道端信息，如一下行混合通道或是包含該第一和第二下行混合通道的一組合下行混合通道，而產(chǎn)生該選擇原始通道的一近似結(jié)果；以及產(chǎn)生輸出數(shù)據(jù)，該輸出數(shù)據(jù)包含該通道端信息、該第一下行混合通道或是來(lái)自該第一下行混合通道的一信號(hào)、以及該第二下行混合通道或是來(lái)自該第二下行混合通道的一信號(hào)。
根據(jù)本發(fā)明的第三個(gè)樣態(tài)，此目的可通過(guò)一種輸入數(shù)據(jù)的反處理裝置達(dá)成，該輸入數(shù)據(jù)包含通道端信息、該第一下行混合通道或是來(lái)自該第一下行混合通道的一信號(hào)、以及該第二下行混合通道或是來(lái)自該第二下行混合通道的一信號(hào)，其中，該第一下行混合信號(hào)及該第二下行混合信號(hào)是得自一多通道聲音信號(hào)的至少三原始通道，以及其中，當(dāng)使用該通道端信息加權(quán)時(shí)，便計(jì)算通道端信息，如一下行混合通道或是包含該第一和第二下行混合通道的一組合下行混合通道，而產(chǎn)生該選擇原始通道的一近似結(jié)果，該裝置包含一輸入數(shù)據(jù)讀取器，用于讀取該輸入數(shù)據(jù)，以獲得該第一下行混合通道或是得自該第一下行混合通道的一信號(hào)、以及該第二下行混合通道或是得自該第二下行混合通道的一信號(hào)、以及該通道端信息；以及一通道重建器，用于重建該選擇原始通道的近似結(jié)果，其是使用該通道端信息、以及該下行混合通道、或是該組合下行混合通道，以獲得該選擇原始通道的該近似結(jié)果。
根據(jù)本發(fā)明的第四個(gè)樣態(tài)，此目的可通過(guò)一種輸入數(shù)據(jù)的反處理方式達(dá)成，該輸入數(shù)據(jù)包含通道端信息、該第一下行混合通道或是得自該第一下行混合通道的一信號(hào)、以及第二下行混合通道或是得自該第二下行混合通道的一信號(hào)，其中，該第一下行混合信號(hào)及該第二下行混合信號(hào)是得自一多通道聲音信號(hào)的至少三原始通道，以及其中，當(dāng)使用該通道端信息加權(quán)時(shí)，便計(jì)算通道端信息，如一下行混合通道或是包含該第一和第二下行混合通道的一組合下行混合通道，而產(chǎn)生該選擇原始通道的一近似結(jié)果，該方法的步驟是包含讀取該輸入數(shù)據(jù)，以獲得該第一下行混合通道或是得自該第一下行混合通道的一信號(hào)、以及該第二下行混合通道或是得自該第二下行混合通道的一信號(hào)、以及該通道端信息；重建該選擇原始信號(hào)的近似結(jié)果，其是使用該通道端信息、以及該下行混合通道、或是該組合下行混合通道，以獲得該選擇原始通道的該近似結(jié)果。
根據(jù)本發(fā)明的第五個(gè)樣態(tài)和第六個(gè)樣態(tài)，此目的可通過(guò)一種包含該處理方法或是反處理方法的計(jì)算機(jī)程序所達(dá)成。
本發(fā)明是基于，當(dāng)兩個(gè)下行混合通道較佳地表現(xiàn)左和右立體聲通道時(shí)，將所獲得的多通道聲音信號(hào)的一有效和降低失真的編碼封裝成輸出數(shù)據(jù)。
較佳地，可獲得一個(gè)以上的原始通道的參數(shù)通道端信息，其是相關(guān)于該下行混合通道之一，而非一個(gè)如同先前技術(shù)的額外的「組合」接合立體聲通道。這表示參數(shù)通道端信息是于，舉例來(lái)說(shuō)，一解碼器端計(jì)算。一通道重建器是使用該通道端信息及該下行混合通道其中之一、或是該下行混合通道的一組合，以便重進(jìn)該原始聲音通道的近似結(jié)果，其中，該通道端信息是被分派至該原始聲音通道。
本發(fā)明概念的優(yōu)勢(shì)在于，其提供一個(gè)有效位的多通道延伸方式，使得一多通道聲音信號(hào)可于一解碼器上播放。
此外，本發(fā)明概念與先前標(biāo)準(zhǔn)兼容，這是因?yàn)橐粋€(gè)較低尺度的解碼器，其是僅能用于處理二聲道，可簡(jiǎn)單地忽延伸信息，亦即，該通道端信息。該較低尺度解碼器僅能播放兩個(gè)下行混合通道以獲得該原始多通道聲音信號(hào)的立體聲表現(xiàn)。然而，一個(gè)較高尺度解碼器，其是可供多通道運(yùn)作，可使用該傳輸通道端信息，以重建出該原始通道的近似結(jié)果。
與先前技術(shù)相比，本發(fā)明的優(yōu)勢(shì)在于，其是有效位，這是因?yàn)樵谠摰谝缓偷诙滦谢旌贤ǖ繪c、Rc之間不需要額外的載波通道，反之，該通道端信息是與一個(gè)或兩個(gè)下行混合通道相關(guān)這表示該下行混合通道本身是作為載波通道用，其中，該通道端信息是組合以重建一原始聲音通道。這表示該通道端信息較佳地是參數(shù)端信息，亦即，不包含在任何子頻帶樣本或是頻譜系數(shù)中的信息，反之，該參數(shù)端信息是用于加權(quán)(時(shí)間及/或空間)該個(gè)別下行混合通道或是該個(gè)別混合通道的組合，以獲得一選擇原始通道的一重建結(jié)果。
在本發(fā)明的一較佳實(shí)施例中，可得到一個(gè)根據(jù)兼容立體聲信號(hào)的多通道信號(hào)兼容編碼法。較佳地，該兼容立體聲信號(hào)(下行混合信號(hào))是使用該多通道聲音信號(hào)的原始通道的矩陣產(chǎn)生。
較佳地，一選擇原始通道的通道端信息是根據(jù)接合立體聲技術(shù)獲得，如強(qiáng)度立體聲編碼或是立體聲信息編碼，因此，在該解碼器端，并不需要進(jìn)行反矩陣化運(yùn)算。與反矩陣有關(guān)的問(wèn)題，亦即，在反矩陣化運(yùn)算中，關(guān)于量子化噪聲分布的特定失真便可避免。這是由于該解碼器使用一個(gè)通道重建器，其是重建一個(gè)原始信號(hào)，其通過(guò)使用該下行混合通道或是該下行混合通道和該傳輸通道端信息的組合進(jìn)行重建信號(hào)。
較佳地，本發(fā)明的概念可用于具有五個(gè)通道的多通道聲音信號(hào)，這五個(gè)通道是左通道L、右通道R、中央通道C、左環(huán)繞通道Ls、以及右環(huán)繞通道Rs。較佳地，下行混合通道是立體聲兼容下行通道Ls和Rs，其提供原始多通道聲音信號(hào)的立體聲表現(xiàn)。
根據(jù)本發(fā)明的一較佳實(shí)施例，對(duì)每個(gè)原始通道而言，通道端信息是于一編碼器端計(jì)算并封裝入輸出數(shù)據(jù)。原始左通道的通道端信息是使用左下行混合通道而得，原始左環(huán)繞通道的通道端信息是使用左下行混合通道而得，原始右通道的通道端信息是使用右下行混合通道而得，原始右環(huán)繞通道的通道端信息是使用右下行混合通道而得。
根據(jù)本發(fā)明的較佳實(shí)施例，原始中央通道的通道信息是使用該第一下行混合通道及該第二下行混合通道而得，亦即，使用該兩個(gè)下行混合通道的組合而得。較佳地，此組合是總和。
因此，該分組，亦即，通道端信息和載波信號(hào)之間的關(guān)系，亦即，該使用下行混合通道以提供一選擇原始通道的通道端信息，對(duì)最佳化品質(zhì)來(lái)說(shuō)，是選擇特定下行混合通道，其包含該個(gè)別原始多通道信號(hào)的最高可能關(guān)聯(lián)量，其是使用通道端信息表現(xiàn)。對(duì)于一接合立體聲載波信號(hào)而言，便會(huì)使用該第一和該第二下行混合通道。較佳地，亦可使用該第一和第二下行混合通道的總和，自然地，該第一和第二下行混合通道總和可用于計(jì)算每該原始通道的通道端信息。然而，較佳地，該下行混合通道的總和是用于計(jì)算在一環(huán)繞環(huán)境中，該原始中央通道的通道端信息，如五通道環(huán)繞、七通道環(huán)繞、5.1環(huán)繞或是7.1環(huán)繞。使用該第一和第二下行混合通道的總和尤其具有優(yōu)勢(shì)，因?yàn)椴恍枰獔?zhí)行額外的傳輸負(fù)擔(dān)，這是因?yàn)閮蓚€(gè)下行混合通道是于該解碼器中出現(xiàn)，使得可輕易地對(duì)這些下行混合通道加總，而不需要任何額外的傳輸位。
較佳地，形成該多通道延伸的該通道端信息是以一種兼容方式輸入至該輸出數(shù)據(jù)位串流，使得一較低尺度解碼器可簡(jiǎn)單地忽略該多通道延伸數(shù)據(jù)且僅提供該多通道聲音信號(hào)的立體表現(xiàn)，不過(guò)，一個(gè)高尺度編碼器不僅使用兩個(gè)下行混合通道，還利用該通道端信息以重建該原始聲音信號(hào)的完整多通道表現(xiàn)。
本發(fā)明的一解碼器是如下運(yùn)作。首先，將兩個(gè)下行混合通道解碼，并讀取該選擇原始通道的通道端信息。接著，該通道端信息及該下行混合通道是用于重建該原始通道的近似結(jié)果。至此，較佳地，不需要執(zhí)行任何反矩陣化運(yùn)算，這表示，在此實(shí)施例中，舉例來(lái)說(shuō)，每該五原始輸入通道是使用五組不同的通道端信息進(jìn)行重建。在解碼器中，執(zhí)行與在編碼器中相同的分組，以便計(jì)算該重建的通道近似結(jié)果。在一個(gè)五通道的環(huán)境中，此表示，對(duì)重建該原始左通道而言，會(huì)使用到該左下行混合通道及該左通道的通道端信息。為了重建該原始右通道，便會(huì)使用到該右下行混合通道及該右通道的通道端信息。為了重建該原始中央通道，便會(huì)使用到由該第一下行混合、該第二下行混合通道、以及該中央通道端信息所形成的一組合通道。
自然地，亦可能重新播放該第一和第二下行混合通道以作為左和右通道，使得僅有三組(而不是五組)通道端信息參數(shù)傳輸。然而，這只有在某些情況下才會(huì)合理，那便是對(duì)品質(zhì)無(wú)較嚴(yán)苛的規(guī)則下才可行。這是因?yàn)?，一般?lái)說(shuō)，左下行混合通道和右下行混合通道與原始左通道或原始右通道不同，只有在使用者不能負(fù)擔(dān)傳輸每該原始通道的通道端信息時(shí)，此種處理方式才有優(yōu)勢(shì)。

通過(guò)下文中一較佳實(shí)施例的描述、所給予的范例，并參照對(duì)應(yīng)的附圖，本發(fā)明可獲得更詳細(xì)地了解，其中圖1所示為根據(jù)本發(fā)明的編碼器的較佳實(shí)施例；圖2所示為根據(jù)本發(fā)明的解碼器的較佳實(shí)施例；圖3A所示為一較佳實(shí)施裝置的方塊圖，該裝置是用于計(jì)算以獲得頻率選擇調(diào)端信息；圖3B所示為實(shí)施接合立體聲處理的計(jì)算器的較佳實(shí)施例，該接合立體聲處理可為強(qiáng)度立體聲編碼或是立體聲信號(hào)編碼；圖4所示為另一個(gè)用于計(jì)算通道端信息的裝置的較佳實(shí)施例，其中，該通道端信息是增益因子；圖5所示為實(shí)施解碼器的較佳實(shí)施例，其是當(dāng)該編碼器如圖4實(shí)施時(shí)；圖6所示為用于提供下行混合通道的裝置的較佳實(shí)施方式；圖7所示為原始和下行混合通道分組方式，用于計(jì)算個(gè)別原始通道的通道端信息；圖8所示為根據(jù)本發(fā)明的編碼器的另一較佳實(shí)施例；圖9所示為根據(jù)本發(fā)明的解碼器的另一較佳實(shí)施例；圖10所示為根據(jù)先前技術(shù)的接合立體聲編碼器。
具體實(shí)施例方式
圖1所示為一種用于處理一個(gè)多通道聲音信號(hào)10的裝置，其具有至少三個(gè)原始通道，如R、L以及C，較佳地，原始聲音信號(hào)具有三個(gè)以上的通道，如在環(huán)繞環(huán)境中的五個(gè)通道，其是如圖1所示。五個(gè)通道是左通道L、右通道R、中央通道C、左環(huán)繞通道Ls、以及右環(huán)繞通道Rs。本發(fā)明的裝置包含提供裝置12，用于提供一個(gè)第一下行混合通道Lc以及一個(gè)第二下行混合通道Rc，該第一和第二下行混合通道可由原始通道獲得。為了由該原始通道獲得該下行混合通道，有數(shù)種可行的方式。一個(gè)方式便是通過(guò)使用圖6的矩陣化運(yùn)算對(duì)原始通道矩陣化，以便獲得該下行混合通道Lc和Rc，此矩陣化運(yùn)算是于時(shí)間域中執(zhí)行。
選擇該矩陣參數(shù)a、b、c，使得其低于或等于1，較佳地，a及b是等于0.7或0.5，而較佳地選擇總加權(quán)參數(shù)t，可避免該通道縮減。
或者，如圖1所示，該下行混合通道Lc及Rc亦可由外部提供，當(dāng)該下行混合通道Lc及Rc為「手動(dòng)混合(hand mixing)」運(yùn)算時(shí)，便可達(dá)成。依此方式，一聲音引擎自身將該下行混合頻混合，而不是通過(guò)使用自動(dòng)混合矩陣化運(yùn)算，該聲音引擎執(zhí)行產(chǎn)生混合，以便獲取最佳化下行混合Lc和Rc，其是給予該原始多通道聲音信號(hào)可能最佳的立體聲表現(xiàn)。
在由外部提供下行混合通道的例子中，提供裝置并不執(zhí)行矩陣化運(yùn)算，而是單純地將外部所提供的下行混合通道轉(zhuǎn)送至接續(xù)的計(jì)算裝置14。
該計(jì)算裝置14是運(yùn)作以分別計(jì)算所選擇的原始通道(例如L、Ls、R、或Rs)的該通道端信息(例如li、lsi、ri、或rsi)，該計(jì)算裝置14是運(yùn)作以計(jì)算該通道端信息，使得當(dāng)使用該通道端信息加權(quán)時(shí)，一下行混合通道可產(chǎn)生該所選原始通道的近似結(jié)果。
或者或是此外，用于計(jì)算該通道端信息的計(jì)算裝置還運(yùn)作以計(jì)算一選擇原始通道的通道端信息，使得在使用該計(jì)算通道端信息加權(quán)時(shí)，包含該第一和第二下行混合通道的一組合下行混合通道可產(chǎn)生該所選原始通道的近似結(jié)果。為了在附圖中展示此特征，因此便在圖中增加一加法器14a以及一組合通道端信息計(jì)算器14b。
對(duì)于熟悉本技術(shù)的人士而言，很清楚地，這些組件并不需要以分開組件實(shí)施，反之，方塊14、14a、及14b的所有功能皆可以一特定處理器執(zhí)行，其可為一般化功能的處理器或是任何用于執(zhí)行所需功能的其它裝置。
此外，在此必須注意的是，為子頻帶樣本或是頻率域值的通道信號(hào)是以大寫字母指示，與通道本身相反，通道端信息則是以小寫字母表示，因此，該通道端信息ci是原始中央通道C的通道端信息。
由一聲音編碼器16所產(chǎn)生的通道端信息及該下行混合通道Lc和Rc，或是編碼版本Lc’及Rc’，是輸入至一輸出數(shù)據(jù)格式器18。一般來(lái)說(shuō)，該輸出數(shù)據(jù)格式器18是用于作為產(chǎn)生輸出數(shù)據(jù)的裝置，該輸出數(shù)據(jù)包含至少下列其中之一的該通道端信息一原始通道、該第一下行混合通道或是來(lái)自該第一下行混合通道(例如其編碼版本)的一信號(hào)、以及該第二下行混合通道或是來(lái)自該第二下行混合通道(例如其編碼版本)的一信號(hào)。
該輸出數(shù)據(jù)或是輸出位串流20接著可傳輸至一位串流解碼器，或是可儲(chǔ)存或是分散。較佳地，該輸出位串流20是一兼容位串流，其亦可由不具有多通道延伸功能的較低尺度解碼器所讀取，此類較低尺度解碼器，如大多數(shù)現(xiàn)存的mp3解碼器，將簡(jiǎn)單地略去該多通道延伸數(shù)據(jù)，亦即，該通道端信息，其將僅解碼該第一和第二下行混合通道以便產(chǎn)生一立體聲輸出。較高尺度解碼器，如多通道解碼器，將讀取該通道端信息，且將產(chǎn)生該原始聲音通道的一近似結(jié)果，以便可獲得多通道聲音表現(xiàn)。
圖8所示為本發(fā)明在五通道環(huán)繞/mp3環(huán)境中的較佳實(shí)施例。在此，其較佳地是將該環(huán)繞增強(qiáng)數(shù)據(jù)寫入在標(biāo)準(zhǔn)化mp3位串流語(yǔ)法的該輔助數(shù)據(jù)域位中，以便可獲得一個(gè)「mp3環(huán)繞」位串流。
圖2所示為本發(fā)明的解碼器，其是運(yùn)作以作為在輸入數(shù)據(jù)端口22所接收的輸入數(shù)據(jù)的反處理裝置。于該輸出數(shù)據(jù)端口22所接收的數(shù)據(jù)是與圖1中的該輸出數(shù)據(jù)端口20輸出的相同數(shù)據(jù)?；蛘撸跀?shù)據(jù)輸入端口22所接收的數(shù)據(jù)亦可使用該編碼器由該原始數(shù)據(jù)產(chǎn)生而獲得。
該解碼器輸入數(shù)據(jù)是輸入至一數(shù)據(jù)串流讀取器24，用于讀取該輸入數(shù)據(jù)，以便最終獲得該通道端信息26及該左下行混合通道28和該右下行混合通道30。在輸入數(shù)據(jù)包含該下行混合通道的編碼版本的案例中，其對(duì)應(yīng)圖1所示的該聲音編碼器16的案例，該數(shù)據(jù)串流讀取器24亦包含一聲音解碼器，其是對(duì)應(yīng)用于編碼該下行混合通道的聲音編碼器。在此案例中，該聲音解碼器，其是該數(shù)據(jù)串流讀取器24的一部份，是運(yùn)作以產(chǎn)生該第一下行混合通道Lc及該第二下行混合通道Rc，或者，更精確地說(shuō)，這些通道的解碼版本。為了方便說(shuō)明，信號(hào)和其解碼版本之間是僅在明白標(biāo)示時(shí)才有區(qū)別。
由該數(shù)據(jù)串流讀取器24所輸出的該通道端信息26及該左和右下行混合通道28和30，是輸入至一多通道重建器32，用于提供該原始聲音信號(hào)的一重建版本34，其可由多通道播放器36播放。在多通道重建器于頻率域運(yùn)作的案例中，該多通道播放器36將接收頻率域輸入數(shù)據(jù)，其必須以特定方式解碼，如在播放前轉(zhuǎn)換成時(shí)間域。至此，該多通道播放器36亦可包含解碼功能。
在此，值得注意的是，一個(gè)較低尺度的解碼器將僅具有該數(shù)據(jù)串流讀取器24，其是僅輸出該左和右下行混合通道28和30至一立體聲輸出38。然而，本發(fā)明的增強(qiáng)解碼器將擷取該通道端信息26，并使用這些通道端信息和下行混合通道28和30，以使用該多通道重建器32重建該原始通道的重建版本34。
圖3A所示為本發(fā)明計(jì)算器14的較佳實(shí)施例，其是用于計(jì)算該通道端信息，其中，一方面一聲音編碼器，而另一方面該通道端信息計(jì)算器，是于與多通道信號(hào)的表現(xiàn)相同的頻譜上運(yùn)作。然而，圖1顯示了另一種方式，其中，一方面一聲音編碼器，而另一方面該通道端信息計(jì)算器，是于與多通道信號(hào)的表現(xiàn)不同的頻譜上運(yùn)作。當(dāng)計(jì)算資源不如聲音品質(zhì)重要時(shí)，圖1方式較佳，因?yàn)闉V波儲(chǔ)會(huì)個(gè)別對(duì)聲音編碼最佳化，且可使用通道端信息，然而，當(dāng)考慮到計(jì)算資源時(shí)，圖3A的方式較佳，因?yàn)榻M件共享資源的關(guān)系，此方式僅需較少的計(jì)算功率。
圖3A所示的裝置是運(yùn)作以接收兩個(gè)通道A、B。圖3A所示的裝置是運(yùn)作以計(jì)算通道B的通道端信息，以便該所選原始通道B的通道端信息，通道B的一重建版本可由該通道信號(hào)A計(jì)算。此外，圖3A所示的裝置是運(yùn)作以形成頻率域通道端信息，如加權(quán)參數(shù)(例如通過(guò)如在BCC編碼中的乘法和時(shí)間處理)頻譜值或是子頻帶樣本。至此，本發(fā)明的計(jì)算器包含窗口和時(shí)間/頻率轉(zhuǎn)換裝置140a，以便在一輸出140b獲得通道A的頻率表現(xiàn)，或是在一輸出140c獲得通道B的頻率域表現(xiàn)。
在該較佳實(shí)施例中，該端信息決定(由該端信息決定裝置140f)是使用量子化頻譜值執(zhí)行，接著，亦使用一量子化器140d，其較佳地控使用一心理聲學(xué)的模型控制，其是具有一心理聲學(xué)模型控制輸入140e。除此之外，當(dāng)該端信息決定裝置140c使用該通道A的非量子化表現(xiàn)時(shí)，亦可不需要一量子化器來(lái)決定通道B的通道端信息。
在通道B的通道端信息由該通道A的頻率域表現(xiàn)和該通道B的頻率域表現(xiàn)計(jì)算的案例中，該窗口和時(shí)間/頻率轉(zhuǎn)換裝置140a可與用于以濾波儲(chǔ)為基礎(chǔ)的聲音編碼器中相同。在此案例中，當(dāng)考慮AAC(ISO/IEC 13818-3)時(shí)，裝置140a是以具有50％重疊及增加功能的MDCT濾波儲(chǔ)實(shí)施(MDCT＝修正離散余弦變換)。
在此案例中，該量子化器140d是一迭代量子化器，如同當(dāng)mp3或AAC產(chǎn)生編碼聲音信號(hào)時(shí)所使用。通道A的頻率域表現(xiàn)，其較佳地是已經(jīng)量子化，接著并可直接用于使用一熵編碼器140g的熵編碼，其可為一個(gè)以霍夫曼(Huffman)為基礎(chǔ)的編碼器或是實(shí)施計(jì)算編碼(arithmetic)的熵編碼器。
當(dāng)與圖1比較時(shí)，圖3A的裝置輸出是一原始通道(對(duì)應(yīng)在裝置140f的輸出的B的端信息)的端信息li，通道A的熵編碼位串流對(duì)應(yīng)圖1的方塊16的輸出的編碼左下行戶合通道Lc’。由圖3A可清楚地知道，組件14(圖1)，亦即，用于計(jì)算該通道端信息的計(jì)算裝置，以及該聲音編碼器(圖1)，可以分離的裝置實(shí)施，或是可以共享版本的方式實(shí)施，使得兩個(gè)裝置可以共享數(shù)個(gè)組件，如MDCT濾波儲(chǔ)140a、量子化器140e、以及該熵編碼器140g。自然地，萬(wàn)一需要不同變換方式以決定該通道端信息，該編碼器16及該計(jì)算器14(圖1)將以不同裝置實(shí)施，以便兩個(gè)組件不會(huì)共享該濾波儲(chǔ)。
一般來(lái)說(shuō)，用于計(jì)算該端信息的決定器(或是計(jì)算器14)，可實(shí)施為一接合立體聲組件，如同圖3B所示，其是根據(jù)任何接合立體聲技術(shù)運(yùn)作，如強(qiáng)度立體聲編碼或是立體聲信號(hào)編碼技術(shù)。
相對(duì)于現(xiàn)有的強(qiáng)度立體聲編碼器，本發(fā)明的決定裝置140f并不需要計(jì)算組合通道。該「組合通道」或是載波通道已經(jīng)存在，且是該左兼容下行混合通道Lc、或是該右兼容下行混合通道Rc、或是這些下行混合通道的組合版本，如Lc+Rc。因此，本發(fā)明裝置140f僅需要計(jì)算衡量個(gè)別下行混合通道的衡量信息，以便當(dāng)該下行混合通道使用該衡量信息或該強(qiáng)度導(dǎo)向信息加權(quán)時(shí)，獲得該個(gè)別所選原始通道的能量/時(shí)間封裝。
因此，在圖3B中的該接合立體聲組件140f，是說(shuō)明其作為一輸入接收該「組合」通道A，其是該第一或第二下行混合通道或是該下行混合通道的組合，以及該原始所選通道。自然地，此組件輸出該「組合」通道A及該接合立體聲參數(shù)作為通道端信息，以便使用該組合通道A及該接合立體聲參數(shù)來(lái)計(jì)算該原始所選通道B的一近似結(jié)果。
或者，該接合立體聲組件140f可實(shí)施以執(zhí)行立體聲信號(hào)編碼。
在BCC的案例中，該接合立體聲組件140f是運(yùn)作以輸出該通道端信息，以便量子化該通道端信息并編碼ICLD和ICTD參數(shù)，其中該所選原始通道是作為確實(shí)預(yù)處理的通道，同時(shí)用于計(jì)算該端信息的該個(gè)別下行混合通道，如該第一、第二或是該第一和第二下行混合通道的一組合，是用于作為BCC編碼/解碼技術(shù)中的參考通道。
請(qǐng)參照?qǐng)D4，所示為一個(gè)簡(jiǎn)單的能量導(dǎo)向?qū)嵤┙M件140f。該裝置包含一頻率帶選擇器44，用于由通道A選擇一頻率帶及通道B的一對(duì)應(yīng)頻率帶。接著，在兩個(gè)頻率帶中，由一能量計(jì)算器42為每該分支計(jì)算能量，該能量計(jì)算器的詳細(xì)實(shí)施將端視方塊40的輸出信號(hào)是否為子頻帶信號(hào)或是頻率系數(shù)。在其它的實(shí)施方式，其中，尺度因子帶的尺度因子被計(jì)算，可使用該第一和第二通道A、B的尺度因子作為能量值EA以及EB，或是至少作為該能量的估測(cè)值。在一增益因子計(jì)算裝置44中，該所選頻率帶的一增益因子ga是根據(jù)一特定法則決定，如圖4的方塊44中所說(shuō)明的增益決定法則。在此，該增益因子ga可直接地用于加權(quán)時(shí)間域樣本或是稍后將在圖5所描述的頻率系數(shù)。至此，該增益因子gB，其是對(duì)所選頻率帶有效，是用于作為視為該所選原始通道的該通道B的通道端信息，此所選原始通道B將不需要傳輸至解碼器，但將由如同圖1中的計(jì)算器14所計(jì)算的參數(shù)通道端信息所表現(xiàn)。
在此，值得注意的是，并不需要傳輸增益值作為通道端信息，傳輸關(guān)于該所選原始通道的決定能量的頻率相依值便足夠。接著，該解碼器必須計(jì)算該下行混合通道及該增益因子的確實(shí)能量，其是根據(jù)該通道B的下行混合通道能量及傳輸能量。
圖5所示為一個(gè)可能的解碼器實(shí)施方式，其是設(shè)定連接以變換為基礎(chǔ)的知覺(jué)聲音編碼器。與圖2相比，該熵解碼器及反轉(zhuǎn)量子化50(圖5)的功能將包含于圖2中的方塊24中。然而，該頻率/時(shí)間轉(zhuǎn)換組件52a、52b(圖5)的功能，將實(shí)施于圖2的組件36中，圖5的組件50接收該第一或第二下行混合信號(hào)Lc′或Rc′的編碼版本，在該組件50的輸出上，便有該第一和該第二下行混合通道的至少部份編碼版本，其接著將稱為通道A。通道A是輸入至一頻率帶選擇器54，用于由通道A選擇一特定頻率帶，此所選頻率帶是使用一乘法器56加權(quán)，用于進(jìn)行乘法運(yùn)算的該乘法器56接收一特定增益因子gB，其是分派給該由該頻率帶選擇器54所選擇的所選頻率帶，其是對(duì)應(yīng)圖4在編碼器端的該頻率帶選擇器40。在頻率時(shí)間轉(zhuǎn)換器52a的輸出端，便有通道A的頻率A表現(xiàn)及其它頻帶。在乘法器56的輸出，及尤其在該頻率/時(shí)間轉(zhuǎn)換裝置52b的輸入，將會(huì)有通道B的頻率域表現(xiàn)。因此，在組件52a的輸出，將會(huì)有通道A的時(shí)間域表現(xiàn)，同時(shí)，在組件52b的輸出，會(huì)有重建通道B的時(shí)間域表現(xiàn)。
值得注意的是，根據(jù)該特定實(shí)施，該解碼下行混合通道Lc或Rc并未于多通道增強(qiáng)解碼器中播放，在多通道增強(qiáng)解碼器中，該解碼下行混合通道僅用于重建該原始通道，該解碼下行混合通道是僅在較低尺度立體聲解碼器中播放。
至此，請(qǐng)參照?qǐng)D9，其所示為本發(fā)明在環(huán)繞/mp3環(huán)境中的較佳實(shí)施例。一mp3增強(qiáng)環(huán)繞位串流是輸入至一標(biāo)準(zhǔn)mp3解碼器24，其輸出該原始下行混合通道的解碼版本，此下行混合通道接著可直接地以較低階的解碼器回放?；蛘?，這兩個(gè)通道是輸入至較高等的接合立體聲解碼裝置32，其亦接收該多通道延伸數(shù)據(jù)，其較佳地是輸入至在mp3位串流的輔助數(shù)據(jù)域位。
接著，請(qǐng)參照?qǐng)D7，所示為該所選原始通道及個(gè)別下行混合通道或是組合下行混合通道的分組。在此，圖7的右邊字段是對(duì)應(yīng)圖3A、圖3B、圖4、圖5的通道A，同時(shí)，在中央的字段對(duì)應(yīng)這些圖的通道B。在圖7的左邊字段中，這些個(gè)別通道端信息是清楚地描述，根據(jù)圖7的表，該左通道L的該通道端信息li是使用左下行混合通道Lc計(jì)算，該左環(huán)繞通道端信息lsi是由該原始所選左環(huán)繞通道Ls決定，且該左下行混合通道Lc是載波。該右通道R的該通道端信息ri是使用右下行混合通道Rc計(jì)算，此外，該右環(huán)繞通道Rs的通道端信息是使用該該右下行混合通道Lc作為載波所決定。最后，該中央通道C的該中央端通道信息ci是使用該組合下行混合通道決定，其是由該第一和第二下行混合通道的組合獲得，其可輕易地在編碼器和解碼器中計(jì)算，且并不需要傳輸額外的位。
自然地，舉例來(lái)說(shuō)，亦可根據(jù)一組合下行混合通道或是甚至一下行混合通道，計(jì)算該中央通道的通道端信息，其是由該第一和第二下行混合通道的加權(quán)加法所獲得，如0.7 Lc及0.3 Rc，只要該加權(quán)參數(shù)可由加碼器獲知或是傳輸該加權(quán)參數(shù)。然而，對(duì)大多數(shù)的應(yīng)用而言，其較佳地僅由該組合下行混合通道獲得該中央通道的通道端信息，亦即，該第一和第二下行混合通道的一組合獲得。
為了展示本發(fā)明節(jié)省位的潛力，因此給予下列的典型例子。在五通道聲音信號(hào)方面，一個(gè)一般的編碼器，每通道需要64kbit/s的位率，五個(gè)通道總共需要320kbits/s。該左和右立體聲信號(hào)需要128kbits/s的位率，一個(gè)通道的通道端信息約介于1.5和2kbits/s之間。因此，在此案例中，每該五通道的通道端信息是被傳輸，此額外數(shù)據(jù)僅需增加7.5至10kbits/s，因此，本發(fā)明概念使得五個(gè)通道傳輸使用138kbits/s的位率(與320(！)kbits/s相比)，而仍具有很好的品質(zhì)，因?yàn)樵摻獯a器并未使用有問(wèn)題的反矩陣運(yùn)算。更重要的可能是，本發(fā)明的概念完全跟以前的技術(shù)兼容，因?yàn)槊吭摤F(xiàn)存的mp3播放器可回放該第一下行混合通道及該第二下行混合通道，以產(chǎn)生一個(gè)傳統(tǒng)的立體聲輸出。
根據(jù)應(yīng)用環(huán)境，本發(fā)明處理或反處理的方法可用于硬件或是軟件，該實(shí)施可為數(shù)字儲(chǔ)存媒體，如具有電子可讀控制信號(hào)的光盤或是CD，其可與可程序化的計(jì)算機(jī)系統(tǒng)合作，以便本發(fā)明用于處理或反處理的方法可執(zhí)行。一般來(lái)說(shuō)，本發(fā)明因此亦可與具有儲(chǔ)存于一機(jī)器可讀載體織程序代碼的計(jì)算機(jī)程序產(chǎn)品相關(guān)，當(dāng)該計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上執(zhí)行時(shí)，該程序代碼是適用于執(zhí)行本發(fā)明。換句話說(shuō)，當(dāng)該計(jì)算機(jī)程序在計(jì)算機(jī)上執(zhí)行時(shí)，本發(fā)明因此亦與用于執(zhí)行本發(fā)明的程序代碼相關(guān)。
盡管本發(fā)明的特征和組件皆于實(shí)施例中以特定組合方式所描述，但實(shí)施例中每一特征或組件能獨(dú)自使用，而不需與較佳實(shí)施方式的其它特征或組件組合，或是與/不與本發(fā)明的其它特征和組件做不同的組合。盡管本發(fā)明已經(jīng)通過(guò)較佳實(shí)施例描述，其它不脫離本發(fā)明權(quán)利要求的變型，對(duì)熟悉本技術(shù)的人士來(lái)說(shuō)還是顯而易見的。
權(quán)利要求
1.一種用于處理一多通道聲音信號(hào)的裝置，該多通道聲音信號(hào)具有至少三個(gè)原始通道，其包含一提供裝置(12)，用于提供一第一下行混合通道及一第二下行混合通道，該第一和該第二下行混合通道由該原始通道而得；一計(jì)算裝置(14)，用于計(jì)算該原始信號(hào)的一個(gè)所選原始通道的通道端信息，該計(jì)算裝置是運(yùn)作以計(jì)算該通道端信息，使得當(dāng)使用該通道端信息加權(quán)時(shí)，包含該第一和該第二下行混合通道的一下行混合通道或是一組合下行混合通道可產(chǎn)生該所選原始通道的一近似結(jié)果；一產(chǎn)生裝置(18)，用于產(chǎn)生輸出數(shù)據(jù)，該輸出數(shù)據(jù)包含該通道端信息。
2.如權(quán)利要求1所述的裝置，其特征在于該產(chǎn)生裝置(18)是運(yùn)作以產(chǎn)生該輸出數(shù)據(jù)，使得該輸出數(shù)據(jù)還包含該第一下行混合通道或是來(lái)自該第一下行混合通道的一信號(hào)、以及該第二下行混合通道或是來(lái)自該第二下行混合通道的一信號(hào)。
3.如權(quán)利要求1或2所述的裝置，其特征在于該計(jì)算裝置(14)是運(yùn)作以決定該通道端信息，該通道端信息作為不包含時(shí)間域樣本或頻譜值的參數(shù)數(shù)據(jù)。
4.如權(quán)利要求1至3中任一所述的裝置，其特征在于該計(jì)算裝置(14)是運(yùn)作以執(zhí)行接合立體聲編碼，使用下行混合通道作為其一載波通道，且使用該所選原始通道作為一輸入通道以產(chǎn)生接合立體聲參數(shù)以作為該所選原始通道的通道端信息。
5.如權(quán)利要求3所述的裝置，其特征在于該計(jì)算裝置(14)是運(yùn)作以執(zhí)行強(qiáng)度立體聲編碼或是立體聲信號(hào)編碼，使得該通道端信息代表該所選原始通道的一能量分布或是立體聲信號(hào)參數(shù)，其中一下行混合信號(hào)或是一組合下行混合信號(hào)可作為一載波通道。
6.如權(quán)利要求1至5中任一所述的裝置，其特征在于該多通道聲音信號(hào)包含一左通道、一左環(huán)繞通道、一右通道、以及一右環(huán)繞通道；其中該提供裝置(12)是運(yùn)作以提供該第一下行混合通道作為一左下行混合通道，且提供該第二下行混合通道作為一右下行混合通道，形成該左和該右下行混合通道，使得當(dāng)播放時(shí)，該多通道聲音信號(hào)為一立體聲表現(xiàn)，以及；其中該計(jì)算裝置(14)是運(yùn)作以使用該左下行混合通道計(jì)算該左通道的通道端信息，以作為該所選原始通道；使用該右下行混合通道計(jì)算該右通道的通道端信息，以作為該所選原始通道；使用該左下行混合通道計(jì)算該左環(huán)繞通道的通道端信息，以作為該所選原始通道；使用該右下行混合通道計(jì)算該右環(huán)繞通道的通道端信息，以作為該所選原始通道。
7.如權(quán)利要求1至6中任一所述的裝置，其特征在于該原始通道包含一中央通道；其還包含一組合器(14a)，用于組合該第一下行混合通道及該第二下行混合通道，以獲得該組合下行混合通道；以及其中計(jì)算該中央通道作為該所選原始通道的通道端信息的計(jì)算裝置，是運(yùn)作以計(jì)算(14b)該通道端信息，使得當(dāng)使用該通道端信息加權(quán)時(shí)，該組合下行混合通道可產(chǎn)生該原始中央通道的一近似結(jié)果。
8.如權(quán)利要求1至7中任一所述的裝置，其特征在于該提供裝置(12)是運(yùn)作以使用該第一下行混合通道的一第一預(yù)設(shè)線性加權(quán)組合，及使用該第二下行混合通道的一第二預(yù)設(shè)線性加權(quán)組合，獲得該第一下行混合通道及該第二下行混合通道。
9.如權(quán)利要求7所述的裝置，其特征在于該第一預(yù)設(shè)線性加權(quán)組合定義如下Lc＝t·(L+a·Ls+b·C)；或是其中該第二線性加權(quán)組合定義如下Rc＝t·(R+a·Rs+b·C)，其中Lc為該左下行混合通道，Rc為該第二下行混合通道，t、a、以及b為小于1的加權(quán)因子，L為一原始左通道，C為一原始中央通道，R為一原始右通道，Ls為一原始左環(huán)繞通道，以及Rs為一原始右環(huán)繞通道。
10.如權(quán)利要求1至9中任一所述的裝置，其特征在于該提供裝置(12)是運(yùn)作以接收外部提供的第一和第二下行混合通道。
11.如權(quán)利要求1至10中任一所述的裝置，其特征在于該第一下行混合通道及該第二下行混合通道為組合通道，其為該原始通道以不同程度組合，其中，該計(jì)算裝置為了計(jì)算該通道端信息，是運(yùn)作以使用該下行混合通道之間的下行混合通道，當(dāng)與其它下行混合通道相比，其對(duì)該所選原始通道具有較強(qiáng)的影響。
12.如權(quán)利要求1至11中任一所述的裝置，其特征在于該產(chǎn)生裝置(18)是運(yùn)作以形成該輸出數(shù)據(jù)，使得該輸出數(shù)據(jù)與由一低階解碼器所使用的輸出數(shù)據(jù)語(yǔ)言兼容，以處理該第一下行混合通道或是來(lái)自該第一下行混合通道的一信號(hào)、或是該第二下行混合通道或來(lái)自該第二下行混合通道的一信號(hào)，以獲得該多通道聲音信號(hào)的一解碼立體聲表現(xiàn)。
13.如權(quán)利要求12所述的裝置，其特征在于該輸出數(shù)據(jù)語(yǔ)言為結(jié)構(gòu)化，使其包含一特殊數(shù)據(jù)域位，其由一低階解碼器忽略，以及其中該產(chǎn)生裝置是運(yùn)作以將該通道端信息插入該特殊數(shù)據(jù)域位。
14.如權(quán)利要求13所述的裝置，其特征在于該語(yǔ)言為mp3語(yǔ)言，且該特殊數(shù)據(jù)域位為一輔助數(shù)據(jù)域位。
15.如權(quán)利要求12至14中任一所述的裝置，其特征在于該產(chǎn)生裝置(18)是運(yùn)作以將該通道端信息插入該輸出數(shù)據(jù)，使得該通道端信息僅由一高階解碼器使用，而由該低階解碼器所忽略。
16.如權(quán)利要求2至15中任一所述的裝置，其特征在于該裝置還包含一編碼器(16)，用于編碼該第一下行混合通道，以獲得來(lái)自該第一下混通道的該信號(hào)，或是用于編碼該第二下行混合通道，以獲得來(lái)自該第二下行混合通道的該信號(hào)。
17.如權(quán)利要求16所述的裝置，其特征在于該編碼器(16)為一知覺(jué)編碼器，其包含一轉(zhuǎn)換裝置，用于將預(yù)編碼的一信號(hào)轉(zhuǎn)換成一知覺(jué)表現(xiàn)；一量子化裝置，用于使用一生理聲學(xué)模型量子化該知覺(jué)表現(xiàn)；以及一熵編碼裝置，用于編碼一量子化知覺(jué)表現(xiàn)，以獲得一熵編碼量子化知覺(jué)表現(xiàn)，作為得自該第一下行混合通道的該信號(hào)，或是得自該第二下行混合通道的該信號(hào)。
18.如權(quán)利要求17所述的裝置，其特征在于該知覺(jué)編碼器(16)為根據(jù)MPEG-1/2層III(mp3)或MPEG-2/4高等聲音編碼(ACC)的一編碼器。
19.如權(quán)利要求1至18中任一所述的裝置，其特征在于該計(jì)算裝置(14)是運(yùn)作以計(jì)算該下行混合通道或是該組合下行混合通道的下行混合能量值；計(jì)算該所選原始通道的一原始能量值；以及計(jì)算一增益因子作為該通道端信息，該增益因子得自該下行混合能量值及該原始能量值。
20.如權(quán)利要求1至19中任一所述的裝置，其特征在于該計(jì)算裝置(14)是運(yùn)作以計(jì)算頻率相依通道端信息參數(shù)，使得對(duì)多個(gè)頻率帶來(lái)說(shuō)，可獲得多個(gè)不同通道端信息參數(shù)。
21.一種用于處理多通道聲音信號(hào)的方法，該多通道聲音信號(hào)具有至少三個(gè)原始通道，其步驟包含提供(12)一第一下行混合通道及一第二下行混合通道，該第一和該第二下行混合通道由該原始通道而得；計(jì)算(14)該原始信號(hào)的一所選原始通道的通道端信息，使得當(dāng)使用該通道端信息加權(quán)時(shí)，包含該第一和該第二下行混合通道的一下行混合頻號(hào)或是一組合下行混合通道，可產(chǎn)生該所選原始通道的一近似結(jié)果；產(chǎn)生(18)輸出數(shù)據(jù)，該輸出數(shù)據(jù)包含該通道端信息。
22.一種用于反處理輸入數(shù)據(jù)的裝置，該輸入數(shù)據(jù)包含通道端信息、一第一下行混合通道或是來(lái)自該第一下行混合通道的一信號(hào)、以及一第二下行混合通道或是來(lái)自該第二下行混合通道的一信號(hào)，其中該第一下行混合通道及該第二下行混合通道來(lái)自一多通道聲音信號(hào)的至少三個(gè)原始通道，以及其中計(jì)算該通道端信息，使得當(dāng)使用該通道端信息加權(quán)時(shí)，包含該第一下行混合通道及該第二下行混合通道的一下行混合通道或是一組合下行混合通道，可產(chǎn)生該所選原始通道的一近似結(jié)果，該裝置包含一輸入數(shù)據(jù)讀取器(24)，用于讀取該輸入數(shù)據(jù)，以獲得該第一下行混合通道或是來(lái)自該第一下行混合通道的一信號(hào)、以及該第二下行混合通道或是來(lái)自該第二下行混合通道的一信號(hào)、以及該通道端信息；以及一通道重建器(32)，用于重建該所選原始通道的該近似結(jié)果，其使用該通道端信息及該下行混合通道或該組合下行混合通道，以獲得該所選原始通道的該近似結(jié)果。
23.如權(quán)利要求22所述的裝置，其特征在于還包含一知覺(jué)解碼器(24)，用于解碼來(lái)自該第一下行混合通道的一信號(hào)，以獲得該第一下行混合通道的該解碼版本，以及用于解碼來(lái)自該第二下行混合通道的該信號(hào)，以獲得該第二下行混合通道的一解碼版本。
24.如權(quán)利要求22至23所述的裝置，其特征在于還包含一組合器，用于組合該第一下行混合通道及該第二下行混合通道，以獲得該組合下行混合通道。
25.如權(quán)利要求22至24中任一所述的裝置，其特征在于該原始信號(hào)包含一左通道、一左環(huán)繞通道、一右通道、一右環(huán)繞通道、以及一中央通道；其中，該第一下行混合通道及該第二下行混合通道分別為一左下行混合通道及一右下行混合通道；以及其中，該輸入數(shù)據(jù)包含該左通道、該左環(huán)繞通道、該右通道、該右環(huán)繞通道、以及該中央通道中至少其中三個(gè)的通道端信息；其中，該通道重建器(32)是運(yùn)作以使用該左通道及該左下行混合通道的通道端信息，重建該左通道的一近似結(jié)果；使用該左環(huán)繞通道及該左下行混合通道的通道端信息，重建該左環(huán)繞通道的一近似結(jié)果；使用該右通道及該右下行混合通道的通道端信息，重建該右通道的一近似結(jié)果；使用該右環(huán)繞通道及該右下行混合通道的通道端信息，重建該右環(huán)繞通道的一近似結(jié)果。
26.如權(quán)利要求22至25中任一所述的裝置，其特征在于該通道重建器是運(yùn)作以使用該中央通道及該組合下行混合通道的通道端信息，重建該中央通道的一近似果。
27.一種用于反處理輸入數(shù)據(jù)的方法，該輸入數(shù)據(jù)包含通道端信息、一第一下行混合通道或是來(lái)自該第一下行混合通道的一信號(hào)、以及一第二下行混合通道或是來(lái)自該第二下行混合通道的一信號(hào)，其中該第一下行混合通道及該第二下行混合通道來(lái)自一多通道聲音信號(hào)的至少三個(gè)原始通道，以及其中，計(jì)算該通道端信息，使得當(dāng)使用該通道端信息加權(quán)時(shí)，包含該第一下行混合通道及該第二下行混合通道的一下行混合通道或是一組合下行混合通道，可產(chǎn)生該所選原始通道的一近似結(jié)果，其步驟包含讀取(24)該輸入數(shù)據(jù)，以獲得該第一下行混合通道或是來(lái)自該第一下行混合通道的一信號(hào)、以及該第二下行混合通道或是來(lái)自該第二下行混合通道的一信號(hào)、以及該通道端信息；以及重建(32)該所選原始通道的該近似結(jié)果，其使用該通道端信息及該下行混合通道或該組合下行混合通道，以獲得該所選原始通道的該近似結(jié)果。
28.一種具有一程序代碼的計(jì)算機(jī)程序，其特征在于該程序代碼用于執(zhí)行根據(jù)權(quán)利要求21或27中任一所述的方法。
全文摘要
在處理一個(gè)具有至少三個(gè)原始通道的多通道聲音信號(hào)中，提供一第一下行混合通道及一第二下行混合通道(12)，其來(lái)自該原始通道。對(duì)該原始通道的一所選原始通道而言，計(jì)算該通道端信息(14)，使得當(dāng)使用該通道端信息加權(quán)時(shí)，包含該第一和該第二下行混合通道的一下行混合通道或是一組合下行混合通道，可產(chǎn)生該所選原始通道的一近似結(jié)果。該通道端信息及該第一和該第二下行混合通道形成輸出數(shù)據(jù)(20)，以傳輸至一解碼器，其中，在一低階解碼器的情形中，僅解碼該第一和第二下行混合通道，或是在一高階解碼器的情形中，根據(jù)該下行混合通道及該通道端信息，提供一個(gè)完整的多通道聲音信號(hào)。因?yàn)樵撏ǖ蓝诵畔H占有少量的位，且因?yàn)樵摻獯a器并不需要反矩陣化，因此，對(duì)立體聲播放器而言，可獲得一個(gè)有效率且高品質(zhì)的多通道延伸并增強(qiáng)多通道播放器。
文檔編號(hào)H04S3/02GK1864436SQ200480028776
公開日2006年11月15日申請(qǐng)日期2004年9月30日優(yōu)先權(quán)日2003年10月2日
發(fā)明者約爾根·赫瑞, 約翰內(nèi)斯·希勒佩特, 史蒂芬·蓋爾斯貝爾格爾, 安德魯·霍爾茨爾, 克勞斯·史賓格爾申請(qǐng)人:德商弗朗霍夫應(yīng)用研究促進(jìn)學(xué)會(huì)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：約爾根.赫瑞;約翰內(nèi)斯.希勒佩特;史蒂芬.蓋爾斯貝爾格爾;安德魯.霍爾茨爾;克勞斯.史賓格爾
技術(shù)所有人：德商弗朗霍夫應(yīng)用研究促進(jìn)學(xué)會(huì)
我是此專利的發(fā)明人

上一篇：傳輸格式組合的信令方法
上一篇：用于多視圖視頻編碼的基于語(yǔ)義的運(yùn)動(dòng)估計(jì)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

多通道催化劑評(píng)價(jià)裝置相關(guān)技術(shù)

客車通道引道測(cè)量裝置相關(guān)技術(shù)

通道切換裝置相關(guān)技術(shù)

雙機(jī)雙通道切換裝置相關(guān)技術(shù)

多通道聲發(fā)射裝置相關(guān)技術(shù)

雙通道高低溫循環(huán)裝置相關(guān)技術(shù)

多通道灌流裝置相關(guān)技術(shù)

解碼通道相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

兼容多通道編碼/解碼的制作方法