国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      帶有壓縮側(cè)面信息的多聲道分級(jí)音頻編碼的制作方法

      文檔序號(hào):7635422閱讀:249來(lái)源:國(guó)知局
      專(zhuān)利名稱:帶有壓縮側(cè)面信息的多聲道分級(jí)音頻編碼的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及多聲道音頻處理,具體地涉及壓縮參數(shù)化側(cè)面信息的產(chǎn)生和使用,來(lái)描述多聲道音頻信號(hào)的空間特性。
      背景技術(shù)
      近來(lái),多聲道音頻再現(xiàn)技術(shù)變得越來(lái)越重要。這可能是因?yàn)槭聦?shí)上,音頻壓縮/編碼技術(shù)例如著名的mp3技術(shù)使得通過(guò)因特網(wǎng)或其它帶寬有限的傳輸信道來(lái)傳送音頻記錄成為可能。mp3編碼技術(shù)已經(jīng)非常有名,因?yàn)槭聦?shí)上它提供了將所有的記錄以立體聲格式,即以音頻記錄的數(shù)字表示(包括第一或左立體聲聲道和第二或右立體聲聲道)進(jìn)行傳送的可能。
      然而,傳統(tǒng)的雙聲道聲音系統(tǒng)有根本的缺點(diǎn)。所以發(fā)展了環(huán)繞技術(shù)。一種推薦的多聲道環(huán)繞表示格式除了兩個(gè)立體聲聲道L和R之外,還包括,另外的中聲道C和兩個(gè)環(huán)繞聲道Ls和Rs。這個(gè)參考聲音格式也被稱作三/二立體聲,表示三個(gè)前置聲道和兩個(gè)環(huán)繞聲道。在回放環(huán)境中,需要分布在五個(gè)合適位置的至少五個(gè)揚(yáng)聲器來(lái)獲得距五個(gè)合適放置的揚(yáng)聲器適當(dāng)距離的最適宜、令人滿足的地點(diǎn)。
      最近的多聲道音頻信號(hào)的參數(shù)化編碼(參數(shù)化立體聲(PS),“空間音頻編碼”,“雙聲道提示編碼”(BCC)等)的方法通過(guò)縮混信號(hào)(可以是單聲道或由若干個(gè)聲道組成)和參數(shù)化側(cè)面信息(“空間提示”)來(lái)表示多聲道音頻信號(hào),描述所感覺(jué)的空間聲音舞臺(tái)(sound stage)。在下面的段落中將簡(jiǎn)要回顧這些不同的方法和技術(shù)。
      對(duì)一種相關(guān)的技術(shù),即大家所知的參數(shù)化立體聲,在J.Breebaart,S.van de Par,A.Kohlrausch,E.Schuijers,″High-Quality ParametricSpatial Audio Coding at Low Bitrates″,AES 116th Convention,Berlin,Preprint 6072,May 2004,以及E.Schuijers,J.Breebaart,H.Purnhagen,J.Engdegard,″Low Complexity Parametric Stereo Coding″,AES 116thConvention,Berlin,Preprint 6073,May 2004中進(jìn)行了描述。
      在本技術(shù)領(lǐng)域有若干知名的技術(shù)來(lái)減少傳輸多聲道音頻信號(hào)所需的數(shù)據(jù)量。為此,參考了圖11,該圖顯示了聯(lián)合立體聲設(shè)備60。該設(shè)備可以是實(shí)現(xiàn)強(qiáng)度立體聲(IS)或雙聲道提示編碼(BCC)的設(shè)備。這樣的設(shè)備一般接收至少兩個(gè)聲道(CH1,CH2,…CHn)作為輸入,并輸出單載波聲道和參數(shù)數(shù)據(jù)。對(duì)參數(shù)數(shù)據(jù)定義,使得能夠在解碼器中計(jì)算出原始聲道(CH1,CH2,…CHn)的近似。
      通常,載波聲道包括子帶樣本、頻譜系數(shù)、時(shí)域樣本等,這些將給出底層信號(hào)比較精確的表示,而參數(shù)數(shù)據(jù)不包括頻譜系數(shù)的這些樣本,但包括了用于控制特定重建算法如乘法加權(quán)、時(shí)移、頻移、相移等的控制參數(shù)。因此,參數(shù)數(shù)據(jù)只包括信號(hào)或者相關(guān)聲道比較粗糙的表示。從數(shù)字的角度講,在MPEG編碼方案中載波聲道所需的數(shù)據(jù)量在60-70kbit/s的范圍,而在5.1聲道信號(hào)中參數(shù)化側(cè)面信息所需的數(shù)據(jù)量在10kbit/s左右的范圍。參數(shù)數(shù)據(jù)的一個(gè)例子就是著名的縮放因子,強(qiáng)度立體聲信息或雙聲道提示參數(shù),將在下文中對(duì)它們進(jìn)行描述。
      例如BCC技術(shù)在AES會(huì)議文章5574″Binaural Cue Coding appliedto Stereo and Multi-Channel Audio Compression″,C.Faller,F(xiàn).Baumgarte,May 2002,Munich,在IEEE WASPAA文章″Efficientrepresentation of spatial audio using perceptual parametrization″,October 2001,Mohonk,NY,和2篇由C.Faller和F.Baumgarte撰寫(xiě)的ICASSP文章″Estimation of auditory spatial cues for binaural cuecoding″,以及″Binaural cue codinga novel and efficient representationof spatial audio″,Orlando,F(xiàn)L,May 2002中都有描述。
      在BCC編碼中,使用基于DFT(離散傅立葉變換)的變換和重疊窗口,將許多音頻輸入聲道轉(zhuǎn)換成頻譜表示。得到的頻譜被分割成不重疊的分段。每個(gè)分段的帶寬和等效矩形帶寬(ERB)成比例。對(duì)每個(gè)分段估算聲道間幅度差(ICLD)和聲道間時(shí)間差(ICTD)。對(duì)每個(gè)聲道通常給出關(guān)于參考聲道的聲道間幅度差I(lǐng)CLD和聲道間時(shí)間差I(lǐng)CTD,并對(duì)它們進(jìn)行量化。最終根據(jù)指定的公式(編碼)計(jì)算出傳輸參數(shù),該公式依賴于待處理信號(hào)的特定分段。
      在解碼器一側(cè),解碼器接收單聲道信號(hào)和BCC比特流。單聲道信號(hào)被變換到頻域,并被輸入到空間合成塊中,空間合成塊還接收解碼的ICLD和ICTD值。在空間合成塊中,使用BCC參數(shù)(ICLD和ICTD)值執(zhí)行單聲道信號(hào)的加權(quán)操作,來(lái)合成多聲道信號(hào)。多聲道信號(hào)在進(jìn)行了頻率/時(shí)間轉(zhuǎn)換后,表示了原始多聲道音頻信號(hào)的重建。
      在BCC的例子中,聯(lián)合立體聲模塊60可操作來(lái)輸出聲道側(cè)面信息,使得參數(shù)聲道數(shù)據(jù)被量化和編碼,產(chǎn)生ICLD或ICTD參數(shù),其中原始聲道之一在進(jìn)行聲道側(cè)面信息編碼時(shí),被用作參考聲道。
      通常,載波聲道由參與的原始聲道的和來(lái)形成。
      所以,上述技術(shù)另外還為回放設(shè)備提供了合適的單聲道表示,其中該回放設(shè)備只能處理載波聲道,而不能處理參數(shù)數(shù)據(jù)來(lái)產(chǎn)生多于一個(gè)輸入聲道的一個(gè)或多個(gè)近似。
      在美國(guó)專(zhuān)利申請(qǐng)公開(kāi)US 2003,0219130 A1,2003/0026441 A1和2003/0035553 A1中,對(duì)作為雙聲道提示編碼(BCC)而知名的音頻編碼技術(shù)也進(jìn)行了充分的描述。另外還可以參考“Binaural Cue Coding.Part IISchemes and Applications”,C.Faller &amp; F.Baumgarte,IEEETrans.on Audio and Speech Proc.,Vol.11,No.6,Nov.2003和“Binaural cue coding applied to audio compression with flexiblerendering”,C.Faller &amp; F.Baumgarte,AES 113thConvention,LosAngeles,October 2002。引用的由Faller和Baumgarte作為作者的與BCC技術(shù)相關(guān)的美國(guó)專(zhuān)利申請(qǐng)公開(kāi)和兩篇技術(shù)出版物在此通過(guò)引用全面并入本申請(qǐng)。
      盡管ICLD和ICTD參數(shù)表示了最重要的音源定位參數(shù),但是運(yùn)用這些參數(shù)的空間表示限制了可以達(dá)到的最高質(zhì)量。為了克服這一限制,進(jìn)而能夠?qū)崿F(xiàn)高質(zhì)量的參數(shù)編碼,參數(shù)立體聲(在J.Breebaart,S.van de Par,A.Kohlrausch,E.Schuijers(2005)“Parametric coding ofstereo audio”,Eurasip J.Applied Signal Proc.9,1305-1322中有描述)應(yīng)用了三種類(lèi)型的空間參數(shù),它們被稱作聲道間強(qiáng)度差(IIDs)、聲道間相位差(IPDs)、聲道間相干度(IC)。擴(kuò)展的空間參數(shù)集和相干參數(shù)使得聲音舞臺(tái)中感覺(jué)的空間“擴(kuò)散”或空間“壓縮”的參數(shù)化,成為可能。
      下面,對(duì)一個(gè)用于多聲道音頻編碼的典型的普通BCC方案,參考圖12-14進(jìn)行了詳細(xì)的闡述。圖9顯示了用于多聲道音頻信號(hào)編碼/傳輸?shù)钠胀p聲道提示編碼方案。BCC編碼器112的輸入110處的多聲道音頻輸入信號(hào)在縮混塊114中被縮混。在當(dāng)前的例子中,輸入110處的原始多聲道信號(hào)是5聲道環(huán)繞信號(hào),有前置左聲道、前置右聲道、左環(huán)繞聲道、右環(huán)繞聲道和中聲道。在本發(fā)明的優(yōu)選實(shí)施例中,縮混塊114通過(guò)這5個(gè)聲道簡(jiǎn)單加和成一個(gè)單聲道信號(hào),而產(chǎn)生加和信號(hào)。在本技術(shù)領(lǐng)域已知的其它縮混方案,使用多聲道輸入信號(hào),可以獲得含有單聲道的縮混信號(hào)。這個(gè)單聲道在加和信號(hào)線115輸出。由BCC分析塊116獲得的側(cè)面信息在側(cè)面信息線117輸出。在BCC分析塊中,聲道間幅度差(ICLD)和聲道間時(shí)間差(ICTD)按上文已概述的方式計(jì)算。BCC分析塊116形成也用來(lái)計(jì)算聲道間相關(guān)度值(ICC值)。加和信號(hào)和側(cè)面信息優(yōu)選地以量化和編碼的形式傳輸?shù)紹CC解碼器120。BCC解碼器將傳輸?shù)募雍托盘?hào)分解到多個(gè)子帶上,并應(yīng)用縮放、延時(shí)和其它處理來(lái)產(chǎn)生輸出多聲道音頻信號(hào)的子帶。執(zhí)行該處理使得輸出121處的重建多聲道信號(hào)的ICLD、ICTD和ICC參數(shù)(提示)和BCC編碼器112的輸入110處各自的原始多聲道信號(hào)的提示相似。為此,BCC解碼器120包括BCC合成塊122和側(cè)面信息處理塊123。
      下面,參考圖13解釋BCC合成塊122的內(nèi)部結(jié)構(gòu)。將線115上的加和信號(hào)輸入到時(shí)間/頻率轉(zhuǎn)換單元或者濾波器組FB 125。在塊125的輸出端,呈現(xiàn)N個(gè)子帶信號(hào),或者,在極端的例子中,當(dāng)音頻濾波器組125執(zhí)行1∶1的變換也就是從N個(gè)時(shí)域樣本(關(guān)鍵子采樣)中產(chǎn)生N個(gè)頻譜系數(shù)時(shí),呈現(xiàn)一組頻譜系數(shù)。
      BCC合成塊122還包括延時(shí)級(jí)126、幅度修正級(jí)127、相關(guān)度處理級(jí)128和反濾波器組級(jí)IFB 129。在級(jí)129的輸出,含有例如在5聲道環(huán)繞系統(tǒng)中的5個(gè)聲道的重建多聲道音頻信號(hào),如圖12所圖示,被輸出到一組揚(yáng)聲器124。
      如圖13所示,輸入信號(hào)s(n)通過(guò)部件125被轉(zhuǎn)換到頻域或?yàn)V波器組域。對(duì)部件125輸出的信號(hào)做乘法,以獲得同一信號(hào)的若干版本,如分支節(jié)點(diǎn)130所圖示。原始信號(hào)的版本數(shù)量和待重建的輸出信號(hào)的輸出聲道數(shù)量相等。一般說(shuō)來(lái),節(jié)點(diǎn)130的原始信號(hào)的每個(gè)版本受到特定延時(shí)d1,d2,...,di,...,dN。延時(shí)參數(shù)由圖12中的側(cè)面信息處理塊123計(jì)算出,并從聲道間時(shí)間差中導(dǎo)出,其中聲道間時(shí)間差由BCC分析塊116確定。
      乘法參數(shù)a1,a2,...,ai,...,aN也是同樣的,它們基于聲道間幅度差,由側(cè)面信息處理模塊123計(jì)算出,其中聲道間幅度差由BCC分析塊116計(jì)算出。
      由BCC分析塊116計(jì)算出的ICC參數(shù)用來(lái)控制塊128的功能,以使得塊128的輸出端獲得延時(shí)信號(hào)和幅度處理后的信號(hào)之間的某種相關(guān)性。這里還需要注意的是,級(jí)126、127、128的排序可能和圖13中所示的情況不同。
      需要認(rèn)識(shí)到,在音頻信號(hào)的按幀處理中,BCC分析也是按幀執(zhí)行,也就是,隨時(shí)間變化,且也按頻率進(jìn)行。這表示,對(duì)每個(gè)頻帶,BCC參數(shù)都是單獨(dú)獲得的。這還表示,如果音頻濾波器組125將輸入信號(hào)分解成例如32個(gè)帶通信號(hào),BCC分析塊將針對(duì)32個(gè)頻帶中的每個(gè)頻帶獲得一組BCC參數(shù)。自然的,圖12中的BCC合成塊122基于例子中的32個(gè)頻帶,執(zhí)行重建。其中,圖13詳細(xì)圖示了BCC合成塊122。
      下面,參考圖14,顯示了確定特定BCC參數(shù)的設(shè)置。通常,在任意的聲道對(duì)之間都可以定義ICLD、ICTD和ICC參數(shù)。這里將概述的一種方法,由參考聲道和每一個(gè)其它聲道之間的ICLD和ICTD參數(shù)組成。這在圖14A中圖示。
      ICC參數(shù)可以用不同的方法定義。最通常的是,在編碼器中估計(jì)所有可能的聲道對(duì)之間的ICC參數(shù),如圖14B所示。在這種情況下,解碼器將合成ICC,使得在所有可能的聲道對(duì)之間,它和原始多聲道信號(hào)中的參數(shù)大致相同。但是,建議每次僅估算最強(qiáng)的兩個(gè)聲道之間的ICC參數(shù)。該方案在圖14C中圖示,其中顯示了一個(gè)例子,在一個(gè)時(shí)刻,估算聲道1和2之間的ICC參數(shù),而在另一時(shí)刻,計(jì)算聲道1和5之間的ICC參數(shù)。然后解碼器在解碼器中將最強(qiáng)聲道之間的聲道間相關(guān)度合成,并對(duì)剩下的聲道對(duì)的聲道間相關(guān)度的計(jì)算和合成,應(yīng)用一些啟發(fā)式規(guī)則。
      關(guān)于例如基于傳輸ICLD參數(shù)的乘法參數(shù)a1,...,aN的計(jì)算,參考上文引用的AES會(huì)議文章5574。ICLD參數(shù)表示原始多聲道信號(hào)的能量分布。不失一般性,圖14A中顯示有四個(gè)ICLD參數(shù),該參數(shù)顯示了前置左聲道和所有其它聲道之間的能量差。在側(cè)面信息處理塊123中,乘法系數(shù)a1,...,aN從ICLD參數(shù)中導(dǎo)出,使得所有重建輸出聲道的總能量和傳輸?shù)募雍托盘?hào)的能量相同(或成比例)。確定這些參數(shù)的簡(jiǎn)單方法是一個(gè)2級(jí)過(guò)程,其中,在第一級(jí)中,左前聲道的乘法因子設(shè)置為1,而圖14A中的其它聲道的乘法因子從傳輸?shù)腎CLD值中確定。然后,在第二級(jí),計(jì)算出所有五個(gè)聲道的能量,并和傳輸?shù)募雍托盘?hào)的能量比較。然后,用一個(gè)比例縮小因子來(lái)比例縮小所有聲道,該比例縮小因子對(duì)所有聲道是相同的,其中比例縮小因子的選擇使得比例縮小后的所有重建輸出聲道的總能量和傳輸?shù)募雍托盘?hào)的能量相等。
      自然也有其它計(jì)算乘法因子的方法,它們不依靠2級(jí)過(guò)程,而只需要一1級(jí)過(guò)程。
      關(guān)于延時(shí)參數(shù),要注意的是,當(dāng)左前聲道的延時(shí)參數(shù)d1被設(shè)為0時(shí),可以直接使用從BCC編碼器傳輸過(guò)來(lái)的延時(shí)參數(shù)ICTD。這里不需要重新縮放比例,因?yàn)檠訒r(shí)不改變信號(hào)的能量。
      正如上文關(guān)于圖14的概述,可以對(duì)五個(gè)聲道的每一個(gè)聲道,計(jì)算和傳輸參數(shù)側(cè)面信息,也就是聲道間幅度差(ICLD)、聲道間時(shí)間差(ICTD)或聲道間相關(guān)度參數(shù)(ICC)。這表示,一般對(duì)五聲道信號(hào)傳輸四組聲道間幅度差。對(duì)聲道間時(shí)間差來(lái)說(shuō)也是一樣的。關(guān)于聲道間相關(guān)度參數(shù),只傳輸例如兩組參數(shù)就足夠了。
      正如上文關(guān)于圖13的概述,對(duì)信號(hào)的一幀或一個(gè)時(shí)間段部分,沒(méi)有單一的幅度差參數(shù)、時(shí)間差參數(shù)或相關(guān)度參數(shù)。而是,為若干不同的頻帶確定這些參數(shù),使得獲得了頻率相關(guān)的參數(shù)。因?yàn)閮?yōu)選地使用例如32個(gè)頻率聲道,也就是為BCC分析和BCC合成使用含有32個(gè)頻帶的濾波器組,所以參數(shù)可以擁有相當(dāng)多的數(shù)據(jù)。盡管相比于其它多聲道傳輸,該參數(shù)表示導(dǎo)致相當(dāng)?shù)偷臄?shù)據(jù)率,但是對(duì)于進(jìn)一步降低用來(lái)表示含有多于兩個(gè)聲道的信號(hào)例如多聲道環(huán)繞信號(hào)所必需的數(shù)據(jù)率,存在一種持續(xù)的需求。
      使用若干現(xiàn)有的模塊,可以方便的實(shí)現(xiàn)多聲道音頻信號(hào)的編碼,其中這些模塊執(zhí)行到單個(gè)單聲道的參數(shù)立體聲編碼。國(guó)際專(zhuān)利申請(qǐng)WO2004008805 A1講授了參數(shù)立體聲編碼器是如何在分級(jí)結(jié)構(gòu)中排序的,使得給定數(shù)目的輸入音頻聲道隨后被縮混到單個(gè)單聲道。描述縮混單聲道空間特性的參數(shù)側(cè)面信息,最終由在隨后的迭代縮混過(guò)程中產(chǎn)生的所有參數(shù)信息組成。這表示,例如如果在建立最后的單聲道信號(hào)中涉及到三個(gè)立體聲到單聲道縮混過(guò)程,那么建立多聲道音頻信號(hào)參數(shù)表示的最終參數(shù)集包括三組在每個(gè)立體聲到單聲道縮混過(guò)程中導(dǎo)出的參數(shù)。
      在圖15中顯示了分級(jí)縮混編碼器,來(lái)更具體的解釋現(xiàn)有技術(shù)的方法。圖15顯示了六個(gè)原始音頻聲道200a到200f,它們被變換成單一的單聲道音頻聲道202和參數(shù)側(cè)面信息。因此,這六個(gè)原始音頻聲道200a到200f必須從時(shí)域變換到頻域,這通過(guò)變換單元204來(lái)執(zhí)行,將音頻聲道200a到200f變換到頻域中相應(yīng)的聲道206a到206f。按照分級(jí)的方法,聲道206a到206f以成對(duì)的方式被縮混到三個(gè)單聲道L,R和C中(分別是208a,208b和208c)。在對(duì)這三對(duì)聲道縮混的過(guò)程中,為每個(gè)聲道對(duì)導(dǎo)出一個(gè)參數(shù)集,來(lái)描述原始立體聲聲道信號(hào)的空間特性,其中每個(gè)聲道對(duì)被縮混成一單聲道信號(hào)。所以,在這第一縮混步驟中,產(chǎn)生了三個(gè)參數(shù)集210a到210c來(lái)保留信號(hào)206a到206f的空間信息。
      在下一步的分級(jí)縮混中,將聲道208a到208b縮混到聲道212(LR),產(chǎn)生參數(shù)集210d(參數(shù)集4)。為了最終得到僅有的單一單聲道,對(duì)聲道208c和212的縮混是必需的,從而產(chǎn)生聲道214(M)。這產(chǎn)生第五參數(shù)集210e(參數(shù)集5)。最后,將縮混單聲道音頻信號(hào)214逆變換到時(shí)域,來(lái)導(dǎo)出能被標(biāo)準(zhǔn)設(shè)備播放的音頻信號(hào)202。
      如上所述,根據(jù)現(xiàn)有技術(shù)的一種縮混音頻信號(hào)202的參數(shù)表示,由所有的參數(shù)集210a到210e組成,這表示如果想從單聲道音頻信號(hào)202中重建原始多聲道音頻信號(hào)(聲道200a到200f),需要所有的參數(shù)集210a到210e,來(lái)作為單聲道縮混信號(hào)202的側(cè)面信息。
      美國(guó)專(zhuān)利申請(qǐng)11/032,689(從這里只稱作為“現(xiàn)有技術(shù)提示組合”)描述了這樣一種方法,用于將若干提示值組合為單個(gè)傳輸值來(lái)在非分級(jí)編碼方案中保存?zhèn)让嫘畔?。為此,首先將所有的聲道縮混,然后組合提示碼來(lái)形成傳輸提示值(可能是一單一值),該組合依賴于預(yù)定義的數(shù)學(xué)方程,在方程中,從輸入信號(hào)直接導(dǎo)出的空間參數(shù),被作為變量代入。
      用于對(duì)兩(“立體聲”)或多(“多聲道”)音頻輸入聲道進(jìn)行參數(shù)編碼的現(xiàn)有技術(shù),從輸入信號(hào)中直接導(dǎo)出空間參數(shù)。這些參數(shù)的例子有聲道間幅度差(ICLD)或聲道間強(qiáng)度差(IID)、聲道間時(shí)間延時(shí)(ICTD)或聲道間相位差(IPD)、以及聲道間相關(guān)/相干度(ICC),對(duì)它們中的每一個(gè)都以頻率選擇性的方式傳輸,也就是以每個(gè)頻帶傳輸。在現(xiàn)有技術(shù)提示組合的申請(qǐng)中,講授了可以將若干提示值組合成單一值,從編碼器一側(cè)傳輸?shù)浇獯a器一側(cè)。解碼過(guò)程使用傳輸?shù)膯我恢刀皇窃紗为?dú)傳輸?shù)奶崾局?,?lái)重建多聲道輸出信號(hào)。在優(yōu)選的實(shí)施例中,該方案被應(yīng)用到ICC參數(shù)上。已經(jīng)表明,該方案在保留信號(hào)主體的空間質(zhì)量的同時(shí),相當(dāng)程度的減少了提示側(cè)面信息的大小。但是,不清楚它如何使用到分級(jí)編碼方案中。
      關(guān)于現(xiàn)有技術(shù)提示組合的專(zhuān)利申請(qǐng)通過(guò)基于兩個(gè)傳輸縮混聲道的系統(tǒng)的例子,詳述了發(fā)明的原理。在提出的方法中,參考圖15,Lf/Lr和Rf/Rr聲道對(duì)的ICC值被組合成單一的傳輸ICC參數(shù)。在將前置左聲道Lf和后置左聲道Lr縮混到聲道L以及將前置右聲道Rf和后置右聲道Rr縮混到聲道R的過(guò)程中,得到了兩個(gè)組合的ICC值。因此,這兩個(gè)組合的ICC值最后被組合成單一的傳輸ICC參數(shù),都載有關(guān)于原始聲道前/后相關(guān)度的信息,并且這兩個(gè)ICC值的組合通常將保留這些信息的大部分。如果必須將L和R聲道進(jìn)一步縮混到單一單聲道,就得到第三個(gè)ICC值,載有關(guān)于縮混聲道L和R的左/右相關(guān)度的信息。根據(jù)現(xiàn)有技術(shù)的提示組合,必須通過(guò)應(yīng)用給定的函數(shù)將三個(gè)ICC值變換成一個(gè)傳輸ICC參數(shù),從而將三個(gè)ICC值組合。
      問(wèn)題是前/后信息和左/右混在一起,這對(duì)原始多聲道音頻信號(hào)的再現(xiàn)是不利的。在美國(guó)申請(qǐng)11/032,689中,通過(guò)傳輸兩個(gè)縮混聲道,即L聲道和R聲道,以及另外傳輸一個(gè)單一ICC值來(lái)避免這個(gè)問(wèn)題,其中L和R聲道擁有左/右信息,單一ICC值擁有前/后信息。這樣以增加了相當(dāng)?shù)臄?shù)據(jù)率為代價(jià),保留了原始聲道的空間特性。數(shù)據(jù)率的增加是由于要傳輸額外的全部縮混聲道。

      發(fā)明內(nèi)容
      本發(fā)明的目的是提供一種改進(jìn)的思想,在分級(jí)編碼方案的背景下來(lái)產(chǎn)生和使用帶有壓縮側(cè)面信息的多聲道音頻信號(hào)參數(shù)表示根據(jù)本發(fā)明的第一個(gè)方面,該目的是通過(guò)產(chǎn)生音頻信號(hào)參數(shù)表示的編碼器來(lái)實(shí)現(xiàn)的,其中該音頻信號(hào)至少在相對(duì)于收聽(tīng)位置的左側(cè)有兩個(gè)原始左聲道,在相對(duì)于收聽(tīng)位置的右側(cè)有兩個(gè)原始右聲道。編碼器包括發(fā)生器,用于產(chǎn)生參數(shù)信息,所述發(fā)生器可操作來(lái)分別處理若干聲道對(duì),以導(dǎo)出所處理聲道對(duì)的幅度信息,并且導(dǎo)出包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的聲道對(duì)的相干信息;和供給器,通過(guò)選擇聲道對(duì)的幅度信息以及使用相干信息確定左/右相干量度,來(lái)提供參數(shù)表示。
      根據(jù)本發(fā)明的第二個(gè)方面,該目的是通過(guò)處理原始音頻信號(hào)參數(shù)表示的解碼器來(lái)實(shí)現(xiàn)的,原始音頻信號(hào)至少在相對(duì)于收聽(tīng)位置的左側(cè)有兩個(gè)原始左聲道,在相對(duì)于收聽(tīng)位置的右側(cè)有兩個(gè)原始右聲道,解碼器包括接收器,用于提供音頻信號(hào)的參數(shù)表示,所述接收器可操作來(lái)提供聲道對(duì)的幅度信息,并提供含有左聲道和右聲道的聲道對(duì)的左/右相干量度,左/右相干量度表示包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的至少一個(gè)聲道對(duì)之間的相干信息;以及處理器,用于為聲道對(duì)提供參數(shù)信息,所述處理器可操作來(lái)從參數(shù)表示中選擇幅度信息,以及使用左/右相干量度導(dǎo)出至少一個(gè)聲道對(duì)的相干信息,其中所述至少一個(gè)聲道對(duì)包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道。
      根據(jù)本發(fā)明的第三個(gè)方面,該目的是通過(guò)用來(lái)產(chǎn)生音頻信號(hào)參數(shù)表示的方法來(lái)實(shí)現(xiàn)的。
      根據(jù)本發(fā)明的第四個(gè)方面,該目的是通過(guò)在計(jì)算機(jī)上運(yùn)行時(shí)實(shí)現(xiàn)上述方法的計(jì)算機(jī)程序來(lái)實(shí)現(xiàn)的。
      根據(jù)本發(fā)明的第五個(gè)方面,該目的是通過(guò)處理原始音頻信號(hào)參數(shù)表示的方法來(lái)實(shí)現(xiàn)的。
      根據(jù)本發(fā)明的第六個(gè)方面,該目的是通過(guò)在計(jì)算機(jī)上運(yùn)行時(shí)實(shí)現(xiàn)上述方法的計(jì)算機(jī)程序來(lái)實(shí)現(xiàn)的。
      根據(jù)本發(fā)明的第七個(gè)方面,該目的是通過(guò)由建立音頻信號(hào)的參數(shù)表示而產(chǎn)生的編碼音頻數(shù)據(jù)來(lái)實(shí)現(xiàn)的,該音頻信號(hào)至少在相對(duì)于收聽(tīng)位置的左側(cè)有至少兩個(gè)原始左聲道,在相對(duì)于收聽(tīng)位置的右側(cè)有兩個(gè)原始右聲道,其中參數(shù)表示包括聲道對(duì)的幅度差以及從包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的聲道對(duì)的相干信息中導(dǎo)出的左/右相干量度。
      本發(fā)明基于這樣的發(fā)現(xiàn),即當(dāng)在分級(jí)編碼過(guò)程中,僅針對(duì)包括只含有相對(duì)于收聽(tīng)位置左側(cè)的信息的第一聲道和只含有來(lái)自相對(duì)于收聽(tīng)位置右側(cè)的信息的第二聲道的聲道對(duì)導(dǎo)出描述第一和第二聲道間相干性的相干信息時(shí),多聲道音頻信號(hào)的參數(shù)表示使用壓縮側(cè)面信息很好地描述了音頻信號(hào)的空間特性。當(dāng)在分級(jí)過(guò)程中原始音頻信號(hào)的多個(gè)音頻聲道優(yōu)選地被迭代縮混到一單聲道時(shí),就獲得了在編碼過(guò)程中只涉及某種聲道對(duì)的步驟選擇相關(guān)的側(cè)面信息參數(shù)的機(jī)會(huì),這種聲道對(duì)具有盡可能好的描述原始音頻信號(hào)空間特性所需的希望信息。這允許根據(jù)這些選出的參數(shù)或這些參數(shù)的組合來(lái)建立原始音頻信號(hào)的參數(shù)表示,來(lái)使側(cè)面信息大小的顯著減少成為可能,其中這些選出的參數(shù)或參數(shù)的組合擁有縮混信號(hào)的空間信息。
      提出的思想使得組合提示值來(lái)減小縮混音頻信號(hào)的側(cè)面信息率成為可能,甚至是在只有單一(單聲道)傳輸聲道可用的情況下。發(fā)明的思想甚至使編碼器的不同分級(jí)拓?fù)涑蔀榭赡?。這里清楚地闡明了合適的單一ICC值是如何導(dǎo)出的,它可以用在使用分級(jí)編碼/解碼方法來(lái)忠實(shí)重現(xiàn)原始聲音圖像的空間音頻解碼器中。
      本發(fā)明的一實(shí)施例實(shí)現(xiàn)了分級(jí)編碼結(jié)構(gòu),該結(jié)構(gòu)將5.1聲道音頻信號(hào)的左前和左后音頻聲道組合成左主聲道,同時(shí)將右前和右后音頻聲道組合成右主聲道。分別組合左邊的聲道和右邊的聲道,重要的左/右相干信息大體上被保留下來(lái),并且根據(jù)發(fā)明在第二編碼步驟中導(dǎo)出,其中左主聲道和右主聲道被縮混到立體聲主聲道。在該縮混過(guò)程中,為整個(gè)系統(tǒng)導(dǎo)出了ICC參數(shù),因?yàn)樵揑CC參數(shù)將是和左/右相干最精確類(lèi)似的ICC參數(shù)。在本發(fā)明的這個(gè)實(shí)施例中,通過(guò)合適的方式簡(jiǎn)易安排分級(jí)編碼步驟,獲得描述六個(gè)音頻聲道中最重要的左/右相干度的ICC參數(shù),而不是通過(guò)應(yīng)用一些人工函數(shù)到描述任意聲道對(duì)的一組ICC參數(shù)上(如在現(xiàn)有技術(shù)中的情況那樣)。
      在所描述的本發(fā)明實(shí)施例的修改中,將5.1音頻信號(hào)的中聲道和低頻聲道縮混到中主聲道,該聲道擁有主要的關(guān)于中聲道的信息,因?yàn)榈皖l聲道只含有如此低頻的信號(hào),使得人們幾乎無(wú)法定位信號(hào)的原本。另外通過(guò)描述中主聲道的參數(shù)控制如上文所述導(dǎo)出的ICC值是有利的。這可以通過(guò)例如用能量信息對(duì)ICC值加權(quán)來(lái)完成,其中能量信息描述了相對(duì)于立體聲主聲道有多少能量是通過(guò)中主聲道傳輸?shù)摹?br> 在本發(fā)明的另一實(shí)施例中,執(zhí)行分級(jí)編碼過(guò)程,使得在第一步驟中將5.1音頻信號(hào)的左前和右前聲道縮混到前置主聲道,而將左后和右后聲道縮混到后置主聲道。因此,在每個(gè)縮混過(guò)程中,有ICC值產(chǎn)生,包含關(guān)于左/右相干的重要信息。然后組合和傳輸?shù)腎CC參數(shù)從兩個(gè)單獨(dú)的ICC值的組合中導(dǎo)出,一種導(dǎo)出傳輸ICC參數(shù)的有利方法是使用聲道的幅度參數(shù)作為權(quán)值,建立ICC值的加權(quán)和。
      在本發(fā)明的一個(gè)修改中,將中聲道和低頻聲道縮混到中主聲道,然后將中主聲道和前主聲道縮混到立體聲主聲道。在后一個(gè)縮混過(guò)程中,收到了中聲道和立體聲聲道之間的相關(guān)度,于是就把中聲道對(duì)前置音頻信號(hào)的貢獻(xiàn)考慮進(jìn)來(lái)了,其中中聲道和立體聲聲道之間的相關(guān)度被用來(lái)控制或修正傳輸?shù)腎CC參數(shù)。先前描述的系統(tǒng)的主要優(yōu)點(diǎn)是,能夠建立相干信息使得主要由對(duì)音頻信號(hào)做出最多貢獻(xiàn)的聲道來(lái)定義傳輸?shù)腎CC值。通常這些聲道是前置聲道,但是在例如音樂(lè)會(huì)的多聲道表示中,鼓掌聽(tīng)眾的信號(hào)主要通過(guò)使用后置聲道的ICC值來(lái)強(qiáng)調(diào)。另一個(gè)優(yōu)點(diǎn)是前置和后置聲道之間的加權(quán)可以動(dòng)態(tài)變化,這依賴于多聲道音頻信號(hào)的空間特性。
      在本發(fā)明的一個(gè)實(shí)施例中,本發(fā)明的分級(jí)解碼器可操作來(lái)接收比現(xiàn)有解碼步驟數(shù)所需要的少的ICC參數(shù)。解碼器可操作來(lái)從接收的ICC參數(shù)中導(dǎo)出每個(gè)解碼步驟所需的ICC參數(shù)。
      使用基于接收的ICC參數(shù)和接收的ICLD值的導(dǎo)出值或者是使用預(yù)先定義的數(shù)值來(lái)代替,導(dǎo)出另外的ICC參數(shù),從而可以實(shí)現(xiàn)上述方法。
      但是,在優(yōu)選的實(shí)施例中,解碼器可操作來(lái)為每個(gè)單獨(dú)的解碼步驟使用單一的傳輸ICC參數(shù)。這是很有利的,因?yàn)樵诎l(fā)明的思想中,最重要的相關(guān),即左/右相關(guān)在傳輸?shù)腎CC參數(shù)中得到保留。這種情形,聽(tīng)眾將感受到和原始信號(hào)有非常好的類(lèi)似的信號(hào)再現(xiàn)。要記住ICC參數(shù)定義了重建信號(hào)的感知廣度。如果解碼器要修改傳輸后的傳輸ICC參數(shù),則對(duì)于分級(jí)再現(xiàn)中的左/右和前/后相關(guān)度,描述重建信號(hào)感知廣度的ICC參數(shù)將會(huì)變得相當(dāng)不同。這將是最不利的,因?yàn)槁?tīng)眾移動(dòng)或轉(zhuǎn)動(dòng)他的頭部,就會(huì)感受到感知度變得更寬或更窄的信號(hào),這當(dāng)然是最令人煩惱的。通過(guò)將單一的接收ICC參數(shù)分配到分級(jí)解碼器的解碼單元中來(lái)避免這個(gè)問(wèn)題。
      在另一個(gè)優(yōu)選的實(shí)施例中,本發(fā)明的解碼器可操作來(lái)接收一組完全I(xiàn)CC值或者作為選擇的單一ICC值,其中解碼器通過(guò)接收比特流中的策略標(biāo)志來(lái)識(shí)別要應(yīng)用的解碼策略。這個(gè)后向兼容的解碼器在現(xiàn)有技術(shù)環(huán)境中也是有效的,它對(duì)傳輸一組完全I(xiàn)CC數(shù)據(jù)的現(xiàn)有技術(shù)信號(hào)進(jìn)行解碼。


      隨后參考附圖描述本發(fā)明優(yōu)選的實(shí)施例,其中圖1顯示了本發(fā)明的分級(jí)音頻編碼器實(shí)施例的方框圖;圖2顯示了本發(fā)明的音頻編碼器的實(shí)施例;圖2a顯示了本發(fā)明的音頻解碼器的ICC參數(shù)的可能控制方案;圖3a,b顯示了側(cè)聲道信息的圖形表示;
      圖4顯示了本發(fā)明的音頻編碼器的第二實(shí)施例;圖5顯示了本發(fā)明的音頻解碼器的優(yōu)選實(shí)施例的方框圖;圖6顯示了本發(fā)明的音頻解碼器的實(shí)施例;圖7顯示了本發(fā)明的音頻解碼器的另一實(shí)施例;圖8顯示了本發(fā)明的發(fā)射器或音頻記錄器;圖9顯示了本發(fā)明的接收器或音頻播放器;圖10顯示了本發(fā)明的傳輸系統(tǒng);圖11顯示了現(xiàn)有技術(shù)的聯(lián)合立體聲編碼器;圖12顯示了現(xiàn)有技術(shù)BCC編碼器/解碼器鏈的方框圖表示;圖13顯示了BCC合成塊現(xiàn)有技術(shù)實(shí)現(xiàn)的方框圖;圖14顯示了確定BCC參數(shù)的方案的表示;以及圖15顯示了現(xiàn)有技術(shù)分級(jí)編碼器。
      具體實(shí)施例方式
      圖1顯示了本發(fā)明的用于產(chǎn)生音頻信號(hào)的參數(shù)表示的編碼器的方框圖。圖1顯示了用于相繼將音頻聲道組合,并產(chǎn)生描述組合成單一聲道的聲道對(duì)空間特性的空間參數(shù)的發(fā)生器220。圖1還顯示了供給器222,通過(guò)選擇聲道對(duì)之間的幅度差信息和使用發(fā)生器220產(chǎn)生的相干信息確定左/右相干量度,提供多聲道音頻信號(hào)的參數(shù)表示。
      為了演示分級(jí)多聲道音頻編碼的發(fā)明思想的原理,圖1顯示的情形中,四個(gè)原始音頻聲道224a到224d被迭代組合,形成單一聲道226。原始音頻聲道224a和224b分別表示原始四聲道音頻信號(hào)的左前和左后聲道,聲道224c和224d分別表示右前和右后聲道。不失一般性,各種空間參數(shù)中只有兩個(gè)參數(shù)在圖1中顯示(ICLD和ICC)。根據(jù)該發(fā)明,發(fā)生器220將音頻聲道224a到224d以這樣的方式組合,使得在組合過(guò)程中導(dǎo)出載有重要的左/右相干信息的ICC參數(shù)。
      在第一步驟中,只含有左側(cè)信息的聲道224a和224b被組合成左主聲道228a(L),而只含有右側(cè)信息的兩個(gè)聲道224c和224d被組合成右主聲道228b(R)。在組合的過(guò)程中,發(fā)生器產(chǎn)生兩個(gè)ICLD參數(shù)230a和230b,兩者都是含有關(guān)于組合到單一聲道的兩個(gè)原始聲道的幅度差信息的空間參數(shù)。發(fā)生器還產(chǎn)生兩個(gè)ICC參數(shù)232a和232b,描述組合到單一聲道的兩個(gè)聲道之間的相關(guān)度。ICLD和ICC參數(shù)230a、230b、232a和232b被傳遞到供給器222。
      在分級(jí)產(chǎn)生過(guò)程的下一個(gè)步驟中,左主聲道228a和右主聲道228b組合到作為結(jié)果的音頻聲道226,其中發(fā)生器提供ICLD參數(shù)234和ICC參數(shù)236,它們都被傳輸?shù)焦┙o器222。重要的是要注意到,在這個(gè)組合步驟中產(chǎn)生的ICC參數(shù)236主要表示由音頻聲道224a到224d表示的原始四聲道音頻信號(hào)的重要左/右相干信息。
      因此,供給器222從可獲得的空間參數(shù)230a、b,232a、b,234和236中建立了參數(shù)表示238,參數(shù)表示由參數(shù)230a、230b、234和236組成。
      圖2顯示了本發(fā)明的音頻編碼器的優(yōu)選實(shí)施例,該編碼器將5.1多聲道信號(hào)編碼到單一單聲道信號(hào)。
      圖2顯示了變換單元240a到240c,五個(gè)2到1縮混器242a到242e,參數(shù)組合單元244和逆變換單元246。原始5.1聲道音頻信號(hào)由左前聲道248a、左后聲道248b、右前聲道248c、右后聲道248d、中聲道248e以及低頻聲道248f給出。重要的是要注意到,原始聲道以這種方式分組使得只含有左側(cè)信息的聲道248a和248b形成一個(gè)聲道對(duì),只含有右側(cè)信息的聲道248c和248d形成另一個(gè)聲道對(duì),而中聲道248e和248f形成第三聲道對(duì)。
      變換單元240a到240c將聲道248a到248f從時(shí)域轉(zhuǎn)換到頻率子帶域上它們的頻譜表示250a到250f。在第一分級(jí)編碼步驟252中,將左聲道250a和250b編碼到左主聲道254a,將右聲道250c和250d編碼到右主聲道254b,并將中聲道250e和低頻聲道250f編碼到中主聲道256。在該第一分級(jí)編碼步驟252中,三個(gè)涉及的2到1編碼器242a到242c產(chǎn)生縮混聲道254a、254b和256,另外還有重要空間參數(shù)集260a、260b和260c,其中參數(shù)集260a(參數(shù)集1)描述聲道250a和250b之間的空間信息,參數(shù)集260b(參數(shù)集2)描述聲道250c和250d之間的空間關(guān)系,而參數(shù)集260c(參數(shù)集3)描述聲道250e和250f之間的空間關(guān)系。
      在第二分級(jí)步驟262中,將左主聲道254a和右主聲道254b縮混到立體聲主聲道264,產(chǎn)生空間參數(shù)集266(參數(shù)集4),其中該參數(shù)集266的ICC參數(shù)包含重要左/右相關(guān)信息。為了從參數(shù)集266中建立組合的ICC值,可以通過(guò)數(shù)據(jù)連接268將參數(shù)集266傳遞到參數(shù)組合單元244。在分第三級(jí)編碼步驟272中,將立體聲主聲道264和中主聲道256組合來(lái)形成單聲道結(jié)果聲道274??梢酝ㄟ^(guò)數(shù)據(jù)連接278將該縮混過(guò)程中導(dǎo)出的參數(shù)集276傳遞到參數(shù)組合單元244。最后,通過(guò)逆變換單元246將結(jié)果聲道274變換到時(shí)域,來(lái)建立單聲道縮混音頻信號(hào)280,該信號(hào)是由音頻聲道248a到248f表示的原始5.1聲道信號(hào)的最終單聲道表示。
      為了從單聲道縮混音頻聲道280中重建原始5.1聲道音頻信號(hào),另外需要5.1聲道音頻信號(hào)的參數(shù)表示。對(duì)于圖2中所示的樹(shù)狀結(jié)構(gòu),可以看到,左前和左后聲道被組合成L信號(hào)254a。類(lèi)似的,右前和右后聲道被組合成R信號(hào)254b。隨后完成L和R信號(hào)的組合,這將遞送參數(shù)集4(266)。在這個(gè)分級(jí)結(jié)構(gòu)的情況下,導(dǎo)出組合ICC值的簡(jiǎn)單方法是選擇參數(shù)集4的ICC值,并將其作為組合ICC值,然后它被參數(shù)組合單元244合并到5.1聲道信號(hào)的參數(shù)表示中。更復(fù)雜的方法還可以考慮中聲道的影響(例如通過(guò)使用來(lái)自參數(shù)集5的參數(shù)),如圖2a所示。
      作為一個(gè)示例,從參數(shù)集5中,含在LR(264)聲道和C聲道(256)中的能量的能量比E(LR)/E(C)可以用來(lái)控制ICC值。如果大部分能量來(lái)自LR通道,傳輸?shù)腎CC值會(huì)變得和參數(shù)集4中的ICC值ICC(LR)接近。如果大部分能量來(lái)自C通道256,傳輸?shù)腎CC值會(huì)隨著變得接近1,如圖2a所示。該圖顯示了兩種可能的方法來(lái)實(shí)現(xiàn)ICC參數(shù)的控制,或者通過(guò)當(dāng)能量比與給定閾值286相交時(shí)在兩個(gè)極值之間轉(zhuǎn)換(控制函數(shù)288a),或者通過(guò)兩個(gè)極值之間的平滑過(guò)渡(控制函數(shù)288b)。
      圖3a和3b顯示了從使用現(xiàn)有技術(shù)(圖3a)的分級(jí)編碼器結(jié)構(gòu)和使用了本發(fā)明的音頻編碼思想(圖3b)的分級(jí)編碼器結(jié)構(gòu)中遞送的5.1音頻聲道可能的參數(shù)表示的對(duì)比。
      圖3a顯示了單一時(shí)間幀以及離散的頻率區(qū)間的參數(shù)表示,正如現(xiàn)有技術(shù)所提供的那樣。圖2中每個(gè)2到1編碼器242a到242e遞送一對(duì)ICLD和ICC參數(shù),參數(shù)對(duì)的起源在圖3a中顯示。按照現(xiàn)有技術(shù)的方法,由2到1解碼器242a到242e提供的所有的參數(shù)集必須和縮混單聲道音頻信號(hào)280一起作為側(cè)面信息傳輸來(lái)重建5.1聲道音頻信號(hào)。
      圖3b顯示了按照本發(fā)明的思想導(dǎo)出的參數(shù)。每個(gè)2到1編碼器242a到242e只直接貢獻(xiàn)一個(gè)參數(shù),即ICLD參數(shù)。單一的傳輸ICC參數(shù)ICCC由參數(shù)組合單元244導(dǎo)出,而不是直接由2到1編碼器242a到242e提供。正如圖3a和3b中清晰可見(jiàn),相比于現(xiàn)有技術(shù),本發(fā)明的分級(jí)編碼器思想能大大減少側(cè)面信息的數(shù)據(jù)量。
      圖4顯示了當(dāng)前發(fā)明的另一個(gè)優(yōu)選實(shí)施例,允許在分級(jí)編碼過(guò)程中將5.1聲道音頻信號(hào)編碼成單聲道音頻信號(hào),并提供壓縮的側(cè)面信息。因?yàn)樵碛布Y(jié)構(gòu)和圖2中描述的一樣,兩圖中相同的項(xiàng)目被標(biāo)上相同的數(shù)字。不同是由于輸入聲道248a到248f的不同分組,并因此順序,即單一聲道被縮混到單聲道274的順序和圖2中的縮混順序不同。因此,只有與圖2中描述不同的方面,對(duì)理解圖4中所示當(dāng)前發(fā)明的實(shí)施例至關(guān)重要,在下文中將對(duì)其進(jìn)行描述。
      左前聲道248a和右前聲道248c合成一組來(lái)形成一個(gè)聲道對(duì),中聲道248e和低頻聲道248f形成另一個(gè)輸入聲道對(duì),而5.1音頻信號(hào)的第三輸入聲道對(duì)通過(guò)左后聲道248b和右后聲道248d形成。
      在第一分級(jí)編碼步驟252中,將左前聲道250a和右前聲道250c縮混到前置主聲道290(F),將中聲道250e和低頻聲道250f縮混到中主聲道292(C),并將左后聲道250b和右后聲道250d縮混到后置主聲道294(S)。參數(shù)集300a(參數(shù)集1)描述前置主聲道290,參數(shù)集300b(參數(shù)集2)描述中主聲道292,且參數(shù)集300c(參數(shù)集3)描述后置主聲道294。
      重要的是要注意到,參數(shù)集300a和參數(shù)集300c擁有描述原始聲道248a到248f之間的重要左/右相關(guān)度的信息。因此,對(duì)于參數(shù)組合單元244來(lái)說(shuō),通過(guò)數(shù)據(jù)鏈接302a和302b,參數(shù)集300a和參數(shù)集300c是可獲得的。
      在第二編碼步驟262中,將前置主聲道290和中主聲道292縮混到純前置聲道304,產(chǎn)生參數(shù)集300d(參數(shù)集4)。對(duì)于參數(shù)組合單元244來(lái)說(shuō),通過(guò)數(shù)據(jù)鏈接306,參數(shù)集300d也是可獲得的。
      在第三分級(jí)編碼步驟272中,將純前置聲道304和后置主聲道294一起縮混到結(jié)果聲道274(M),然后它由逆變換單元246變換到時(shí)域,來(lái)形成最終的單聲道縮混音頻聲道280。參數(shù)集300e(參數(shù)集5)來(lái)源于純前置聲道304和后置主聲道294的縮混,對(duì)于參數(shù)組合單元244來(lái)說(shuō),通過(guò)數(shù)據(jù)鏈接310,參數(shù)集300e也是可獲得的。
      圖4中的樹(shù)狀結(jié)構(gòu)首先分別對(duì)前和后執(zhí)行左聲道和右聲道的組合。于是,在參數(shù)集1和3(300a,300c)中存在基本的左/右相關(guān)/相干度。組合的ICC值可由參數(shù)組合單元244通過(guò)在參數(shù)集1和3的ICC值之間建立加權(quán)平均來(lái)建立。這表示,將更重的權(quán)重賦給更強(qiáng)的聲道對(duì)(Lf/Rf對(duì)Lr/Rr)。可以通過(guò)導(dǎo)出組合的ICC值ICCC來(lái)達(dá)到相同目標(biāo),其中ICCC建立如下的加權(quán)和ICCC=(A*ICC1+B*ICC2)/(A+B)其中A表示和ICC1對(duì)應(yīng)的聲道對(duì)中的能量,而B(niǎo)表示和ICC2對(duì)應(yīng)的聲道對(duì)中的能量。
      在另一可供選擇的實(shí)施例中,更復(fù)雜的方法還考慮中聲道的影響(例如通過(guò)考慮參數(shù)集4的參數(shù))。
      圖5顯示了本發(fā)明的解碼器,用于處理接收到的作為原始四聲道音頻信號(hào)參數(shù)表示的壓縮側(cè)面信息。圖5包括用來(lái)提供四聲道音頻信號(hào)的壓縮參數(shù)表示的接收器310和用來(lái)處理壓縮參數(shù)表示從而提供四聲道音頻信號(hào)完全參數(shù)表示的處理器312,使得從接收的單聲道音頻信號(hào)中重建四聲道音頻信號(hào)成為可能。
      接收器310接收空間參數(shù)ICLD(B)314,ICLD(F)316,ICLD(R)318和ICC320。提供的參數(shù)表示,由參數(shù)314到320組成,描述了原始音頻聲道324a到324d的空間特性。
      作為第一上混步驟,處理器312提供描述第一聲道對(duì)326a的空間參數(shù)和描述第二聲道對(duì)326b的空間參數(shù),其中第一聲道對(duì)326a是兩個(gè)聲道324a和324b(Rf和Lf)的組合,第二聲道對(duì)326b是兩個(gè)聲道324c和324d(Rr和Lr)的組合。為了實(shí)現(xiàn)以上目標(biāo),需要聲道對(duì)的幅度差314。因?yàn)槁暤缹?duì)326a和326b都含有一個(gè)左聲道和一個(gè)右聲道,聲道對(duì)之間的差異主要描述了前/后相關(guān)度。因此,接收的ICC參數(shù)320載有關(guān)于左/右相干度的主要信息,由處理器312提供該ICC參數(shù)320,使得左/右相干度信息被優(yōu)選地用于為聲道對(duì)326a和326b提供單獨(dú)的ICC參數(shù)。
      在下一個(gè)步驟中,處理器312提供合適的空間參數(shù),以能夠從聲道326a中重建單一音頻聲道324a和324b,從聲道326b中重建聲道324c和324d。為了實(shí)現(xiàn)以上目標(biāo),處理器312提供幅度差316和318,并且處理器312必須為兩個(gè)聲道對(duì)提供合適的ICC值,因?yàn)槁暤缹?duì)326a和326b中的每個(gè)聲道對(duì)含有重要的左/右相干信息。
      在一示例中,處理器312可以簡(jiǎn)單提供組合的接收ICC值320,來(lái)上混聲道對(duì)326a和326b。作為選擇,接收的組合ICC值320可被加權(quán)來(lái)為兩個(gè)聲道對(duì)導(dǎo)出單獨(dú)的ICC值,例如權(quán)重基于兩個(gè)聲道對(duì)的幅度差314。
      在本發(fā)明的優(yōu)選實(shí)施例中,處理器為每個(gè)單一上混步驟提供接收的ICC參數(shù)320,來(lái)避免在重現(xiàn)聲道324a到324d的過(guò)程中額外的人工合成音的引入。
      圖6顯示了并入了根據(jù)目前發(fā)明的分級(jí)解碼程序的解碼器的優(yōu)選實(shí)施例,用于使用原始5.1音頻信號(hào)的壓縮參數(shù)表示,來(lái)將單聲道音頻信號(hào)解碼到5.1多聲道音頻信號(hào)。
      圖6顯示了變換單元350、參數(shù)處理單元352、五個(gè)1到2解碼器354a到354e、以及三個(gè)逆變換單元356a到356c。
      需要注意的是,根據(jù)圖6,本發(fā)明的解碼器的實(shí)施例是圖2中描述的編碼器的相對(duì)物,并被設(shè)計(jì)成接收單聲道縮混音頻聲道358,該聲道最終將上混到由音頻聲道360a(lf)、360b(lr)、360c(rf)、360d(rr)、360e(co)和360a(lfe)組成的5.1音頻信號(hào)。通過(guò)使用變換單元350,將縮混聲道358(m)接收并將其從時(shí)域變換到頻域而成為它的頻率表示362。參數(shù)處理單元352與縮混聲道358并行接收組合且壓縮的空間參數(shù)集364。
      在分級(jí)解碼過(guò)程的第一步驟363中,將單聲道縮混聲道362上混到立體聲主聲道364(LR)和中主聲道366(C)。
      在分級(jí)解碼過(guò)程的第二步驟368中,將立體聲主聲道364上混到左主聲道370(L)和右主聲道372(R)。
      在解碼過(guò)程的第三步驟中,將左主聲道370上混到左前聲道374a和左后聲道374b,將右主聲道372上混到右前聲道374c和右后聲道374d,并且將中主聲道366上混到中聲道374e和低頻聲道374f。
      最后,通過(guò)逆變換單元356a到356c,將六個(gè)單一音頻聲道374a到374f變換到它們?cè)跁r(shí)域上的表示,于是建立重建的5.1音頻信號(hào),該信號(hào)含有六個(gè)音頻聲道360a到360f。為了保留5.1音頻信號(hào)的原始空間特性,參數(shù)處理單元352,特別是參數(shù)處理單元提供單獨(dú)的參數(shù)集380a到380e的方式,是至關(guān)重要的。
      接收的組合ICC參數(shù)描述了原始六聲道音頻信號(hào)的重要左/右相干度。因此,參數(shù)處理單元352建立參數(shù)集4(380d)的ICC值,使得它和原始接收并在參數(shù)集364中傳輸?shù)目臻g數(shù)值的左/右相關(guān)信息類(lèi)似。在最簡(jiǎn)單的可能實(shí)現(xiàn)中,參數(shù)處理單元352簡(jiǎn)單使用接收的組合ICC參數(shù)。
      根據(jù)當(dāng)前發(fā)明的解碼器的另一個(gè)優(yōu)選實(shí)施例在圖7中顯示,圖7中的解碼器是圖4中編碼器的相對(duì)物。
      由于圖7中的編碼器包括與圖6中解碼器相同的功能塊,下文的討論限制在分級(jí)解碼過(guò)程和圖6中過(guò)程不同的步驟上。這主要是由于事實(shí)上,單聲道信號(hào)362以不同的順序和不同的聲道組合被上混,因?yàn)樵?.1音頻信號(hào)已進(jìn)行的縮混和圖6中接收的縮混信號(hào)不同。
      在分級(jí)解碼過(guò)程的第一步驟363中,將單聲道信號(hào)362上混到后置主聲道400(S)和純前置聲道402(CF)。
      在第二步驟368中,將純前置聲道402上混到前置主聲道404和中主聲道406。
      在第三解碼步驟372中,將前置主聲道上混到左前聲道374a和右前聲道374c,將中主聲道406上混到中聲道374e和低頻聲道374f,并且將后置主聲道400上混到左后聲道374b和右后聲道374d。最后,將六個(gè)音頻聲道374a到374f從頻域變換到它們的時(shí)域表示360a到360f,建立重建的5.1音頻信號(hào)。
      為了保留原始5.1信號(hào)的空間特性(已經(jīng)由編碼器編碼成為側(cè)面信息),參數(shù)處理單元352為1到2解碼器354a到354e提供參數(shù)集410a到410e。因?yàn)樵诘谌齻€(gè)上混過(guò)程372中需要重要的左/右相關(guān)信息來(lái)建立Lf、Rf、Lr和Rr聲道,在簡(jiǎn)單通過(guò)傳輸?shù)腎CC參數(shù)來(lái)建立參數(shù)集410a和410c的最簡(jiǎn)單的實(shí)現(xiàn)中,參數(shù)處理單元352可提供參數(shù)集410a和410c中合適的ICC值。在一個(gè)可能的選擇中,可通過(guò)應(yīng)用合適的加權(quán)函數(shù)到接收的ICC參數(shù)上,將接收的ICC參數(shù)變換成參數(shù)集410a和410c的單獨(dú)的參數(shù),其中它們的權(quán)重例如依賴于前置主聲道404和后置主聲道400中傳輸?shù)哪芰?。在一個(gè)更復(fù)雜的實(shí)現(xiàn)中,參數(shù)處理單元352也可以考慮中聲道信息,來(lái)為參數(shù)集5和參數(shù)集4(410a,410b)提供單獨(dú)的ICC值。
      圖8顯示了本發(fā)明的音頻發(fā)射器或者記錄器500,其具備編碼器220、輸入接口502和輸出接口504。
      可以在發(fā)射器/記錄器550的輸入接口502提供音頻信號(hào)。使用本發(fā)明的編碼器220在發(fā)射器/記錄器中對(duì)該音頻信號(hào)編碼,并且在發(fā)射器/記錄器500的輸出接口504輸出編碼表示。然后該編碼表示可能被傳輸或者存儲(chǔ)在存儲(chǔ)介質(zhì)中。
      圖9顯示了本發(fā)明的接收器或音頻播放器520,其具備本發(fā)明的解碼器312、比特流輸入522以及音頻輸出524。
      可以在本發(fā)明的接收器/音頻播放器520的輸入522處輸入比特流。然后使用解碼器312對(duì)比特流解碼,并在本發(fā)明的接收器/音頻播放器520的輸出524處輸出或播放解碼信號(hào)。
      圖10顯示了由本發(fā)明的發(fā)射器500和本發(fā)明的接收器520組成的傳輸系統(tǒng)。
      對(duì)發(fā)射器500的輸入接口502處輸入的音頻信號(hào)編碼,并將其從發(fā)射器500的輸出504傳送到接收器520的輸入522。接收器將音頻信號(hào)解碼,并在輸出524回放或輸出該音頻信號(hào)。
      所討論的本發(fā)明的編碼器示例將多聲道音頻信號(hào)縮混到單聲道音頻信號(hào)。當(dāng)然另一可供選擇的可能是將多聲道信號(hào)縮混到立體聲信號(hào),它對(duì)于圖2和4中討論的實(shí)施例而言,意味著分級(jí)編碼過(guò)程中的一個(gè)步驟可以忽略。所有其它數(shù)目的結(jié)果聲道也是可能的。
      提出的用來(lái)分級(jí)對(duì)多聲道音頻信息進(jìn)行編碼或解碼的方法主要通過(guò)將多個(gè)ICC值組合成一單一的傳輸ICC值從而減小側(cè)面信息來(lái)描述,其中多聲道音頻信息提供/使用音頻信號(hào)空間特性的壓縮參數(shù)表示。這里要注意的是,描述的發(fā)明決不局限于只使用一個(gè)組合的ICC值。相反,可以產(chǎn)生例如兩個(gè)組合的數(shù)值,一個(gè)描述重要的左/右相關(guān)度,另一個(gè)描述前/后相關(guān)度。
      在例如圖2中所示的當(dāng)前發(fā)明的實(shí)施例中,這可以很方便的實(shí)現(xiàn),其中一方面左前聲道250a和左后聲道250b被組合成左主聲道254a,而右前聲道250c和右后聲道250d被組合成后主聲道254b。因此這兩個(gè)編碼步驟產(chǎn)生出關(guān)于原始音頻信號(hào)前后相關(guān)度的信息,能夠被很容易的處理來(lái)提供擁有前/后相關(guān)信息的額外ICC值。
      此外,在當(dāng)前發(fā)明的優(yōu)選修改中,使編碼/解碼過(guò)程能夠使用現(xiàn)有技術(shù)單獨(dú)傳輸?shù)膮?shù)以及依賴于從編碼器發(fā)送到解碼器的側(cè)面信息而使用組合的傳輸參數(shù)是有利的。這樣的系統(tǒng)能夠有利的實(shí)現(xiàn)更高的表示精確度(使用現(xiàn)有技術(shù)單獨(dú)傳輸?shù)膮?shù))以及作為選擇的低側(cè)面信息比特率(使用組合的參數(shù))。
      典型說(shuō)來(lái),設(shè)置的選擇是由使用者依賴應(yīng)用要求而做出的,例如能夠被使用的傳輸系統(tǒng)容納的側(cè)面信息量。這允許使用相同的統(tǒng)一編碼器/解碼器體系結(jié)構(gòu),同時(shí)能夠在一個(gè)寬的側(cè)面信息比特率/精度平衡范圍內(nèi)運(yùn)行。這是一項(xiàng)重要的性能,來(lái)覆蓋一寬范圍的具有不同要求和傳輸能力的可能應(yīng)用。
      在這個(gè)有利的實(shí)施例的另一個(gè)修改中,運(yùn)行模式的選擇也可由編碼器自動(dòng)做出,編碼器分析例如使用組合傳輸模式的情況下解碼值同理想結(jié)果的偏差。如果沒(méi)有發(fā)現(xiàn)重大偏差,就使用組合參數(shù)傳輸。解碼器甚至能夠根據(jù)對(duì)所提供的側(cè)面信息的分析,自己確定哪個(gè)模式適合使用。例如,如果只提供了一個(gè)空間參數(shù),解碼器將自動(dòng)切換到使用組合傳輸參數(shù)的解碼模式。
      在當(dāng)前發(fā)明的另一個(gè)有利的修改中,編碼器/解碼器自動(dòng)從使用組合傳輸參數(shù)的模式切換到使用單獨(dú)傳輸參數(shù)的模式,以保證音頻重現(xiàn)質(zhì)量和想得到的低側(cè)面信息比特率之間可能的最好折衷。
      正如能從圖2、4、6和7中描述的編碼器/解碼器優(yōu)選的實(shí)施例中所看到的,這些單元使用相同的功能塊。因此,另一個(gè)優(yōu)選實(shí)施例在一個(gè)框架中建立了使用相同硬件的編碼器和解碼器。
      在當(dāng)前發(fā)明的另一可供選擇的實(shí)施例中,通過(guò)將不同聲道分組到一起成為聲道對(duì),在不同編碼方案之間動(dòng)態(tài)切換是可能的,使得動(dòng)態(tài)使用為給定的多聲道音頻信號(hào)提供最好可能音質(zhì)的編碼方案成為可能。
      不需要將單聲道縮混聲道和多聲道音頻信號(hào)的參數(shù)表示一起傳輸。只傳輸參數(shù)表示也是可能的,使得已經(jīng)擁有多聲道音頻信號(hào)的單聲道縮混作為例如記錄的聽(tīng)眾,能使用現(xiàn)有的多聲道設(shè)備和參數(shù)側(cè)面信息重現(xiàn)多聲道信號(hào)。
      作為總結(jié),本發(fā)明允許從已知的現(xiàn)有技術(shù)參數(shù)中有利的確定這些組合參數(shù)。在分級(jí)編碼器/解碼器結(jié)構(gòu)中應(yīng)用組合參數(shù)的發(fā)明思想,能將多聲道音頻信號(hào)縮混到基于單聲道的參數(shù)表示,獲得低側(cè)面信息速率(比特率削減)下的原始信號(hào)的精確參數(shù)化。
      本發(fā)明的目的之一是編碼器以減少必須傳輸?shù)膮?shù)數(shù)目為目的,組合特定的參數(shù)。然后,解碼器從已經(jīng)傳輸?shù)膮?shù)中導(dǎo)出丟失的參數(shù),而不是使用默認(rèn)參數(shù)值,使用默認(rèn)參數(shù)正是在例如圖15中所示的現(xiàn)有技術(shù)的系統(tǒng)中的情形。
      再次回顧使用現(xiàn)有技術(shù)的分級(jí)參數(shù)多聲道音頻編碼器的實(shí)施例,如圖15中的示例,此優(yōu)點(diǎn)變得很明顯。那里,將輸入信號(hào)(Lf、Rf、Lr、Rr、C和LFE,分別對(duì)應(yīng)左前、右前、左后、右后、中和低頻加強(qiáng)聲道)分割并變換到頻域來(lái)獲得需要的時(shí)間/頻率片。隨后將得到的信號(hào)以成對(duì)的方式組合。例如,組合信號(hào)Lf和Lr形成信號(hào)“L”。生成對(duì)應(yīng)的空間參數(shù)集(1)來(lái)模擬信號(hào)Lf和Lr之間的空間特性(即由IID、ICC、IPD中的一個(gè)或多個(gè)組成)。在根據(jù)圖15中所示現(xiàn)有技術(shù)的實(shí)施例中,重復(fù)該過(guò)程直到獲得了單一輸出聲道(M),該輸出聲道還伴隨有五個(gè)參數(shù)集?,F(xiàn)有技術(shù)分級(jí)編碼技術(shù)的應(yīng)用將意味著所有參數(shù)集的傳輸。
      但是需要注意的是,不是所有參數(shù)集都必須含有針對(duì)所有可能空間參數(shù)的數(shù)值。例如,圖15中參數(shù)集1由IID和ICC參數(shù)組成,而參數(shù)集3可能只由IDD參數(shù)組成。如果沒(méi)有為特定的集傳輸特定的參數(shù),現(xiàn)有技術(shù)分級(jí)解碼器將對(duì)這些參數(shù)應(yīng)用默認(rèn)值(例如ICC=+1,IPD=0,等等)。所以,每個(gè)參數(shù)集只表示特定的信號(hào)組合而不描述剩下的聲道對(duì)的空間特性。
      關(guān)于信號(hào)空間特性的知識(shí)的丟失,即沒(méi)有傳輸參數(shù),使用本發(fā)明的思想可以避免以上問(wèn)題,其中編碼器組合特定的參數(shù),使得原始信號(hào)最重要的空間特性得到保留。
      例如當(dāng)把ICC參數(shù)組合成單一值時(shí),在解碼器中可使用組合的參數(shù)作為所有單獨(dú)參數(shù)的替代參數(shù)(或者可以從傳輸?shù)膮?shù)中導(dǎo)出解碼器中使用的單獨(dú)參數(shù))。一個(gè)重要特征就是,編碼器參數(shù)組合過(guò)程的執(zhí)行使得原始多聲道信號(hào)的聲音圖像在解碼器重建后得到盡可能接近的保留。傳輸ICC參數(shù),這表示原始音場(chǎng)的寬度(解相關(guān))必須得到保持。
      這里還要注意的是,最重要的ICC值在左/右軸線之間,因?yàn)橥ǔB?tīng)眾向前面對(duì)收聽(tīng)裝置。將此考慮進(jìn)來(lái)將有利于建立分級(jí)編碼結(jié)構(gòu),使得在迭代編碼過(guò)程中獲得音頻信號(hào)合適的參數(shù)表示,其中得到的組合ICC值主要表示左/右解相關(guān)。在討論當(dāng)前發(fā)明的優(yōu)選實(shí)施例時(shí)將對(duì)其進(jìn)行更具體的解釋。
      本發(fā)明的編碼/解碼方案依靠下面兩個(gè)措施使用空間音頻系統(tǒng)的分級(jí)結(jié)構(gòu),允許減少?gòu)木幋a器傳輸?shù)浇獯a器的參數(shù)數(shù)目●組合單獨(dú)編碼器參數(shù)來(lái)形成組合參數(shù),將其傳輸?shù)浇獯a器來(lái)代替單獨(dú)的參數(shù)。執(zhí)行參數(shù)組合使得信號(hào)的聲音圖像(包括L/R相關(guān)度/相干度)盡可能得到保留。
      ●在解碼器中使用傳輸?shù)慕M合參數(shù)來(lái)代替若干傳輸?shù)膯为?dú)參數(shù)(或者從組合參數(shù)中導(dǎo)出實(shí)際使用的參數(shù))。
      依據(jù)發(fā)明方法的特定實(shí)現(xiàn)要求,該發(fā)明方法可以在軟件或者硬件中實(shí)現(xiàn)。實(shí)現(xiàn)方式可以是使用數(shù)字存儲(chǔ)介質(zhì),特別是其上存儲(chǔ)了可被電方式讀出的控制信號(hào)的磁盤(pán)、DVD或者CD,存儲(chǔ)介質(zhì)與可編程計(jì)算機(jī)系統(tǒng)協(xié)作,使得本發(fā)明的方法得以執(zhí)行。一般來(lái)說(shuō),本發(fā)明也可以是計(jì)算機(jī)程序產(chǎn)品,具有存儲(chǔ)于機(jī)器可讀的載體上的程序代碼,當(dāng)計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí),程序代碼可執(zhí)行本發(fā)明的方法。換句話說(shuō),本發(fā)明的方法是計(jì)算機(jī)程序,該程序含有在計(jì)算機(jī)上運(yùn)行時(shí)來(lái)執(zhí)行至少1種本發(fā)明的方法的程序代碼。
      雖然上述內(nèi)容通過(guò)參考其具體實(shí)施例,已得到具體的展示和描述,但是本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,在不背離本發(fā)明的精神和范圍的前提下,可以在形式和細(xì)節(jié)上做出各種其它的修改。將認(rèn)識(shí)到,在不背離這里公開(kāi)的和所附權(quán)利要求包括的比較概括的思想的前提下,可以做出適應(yīng)不同實(shí)施例的各種修改。
      權(quán)利要求
      1.一種編碼器,用于產(chǎn)生至少在相對(duì)于收聽(tīng)位置的左側(cè)有兩個(gè)原始左聲道、在相對(duì)于收聽(tīng)位置的右側(cè)有兩個(gè)原始右聲道的音頻信號(hào)的參數(shù)表示,所述編碼器包括發(fā)生器,用于產(chǎn)生參數(shù)信息,所述發(fā)生器可操作來(lái)分別處理若干聲道對(duì),以導(dǎo)出所處理聲道對(duì)的幅度信息,并且導(dǎo)出包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的聲道對(duì)的相干信息;和供給器,通過(guò)選擇聲道對(duì)的幅度信息以及使用相干信息確定左/右相干量度,來(lái)提供參數(shù)表示,其中將所述左/右相干量度引入到輸出數(shù)據(jù)流中。
      2.根據(jù)權(quán)利要求1所述的編碼器,其中,發(fā)生器可操作來(lái)處理左前聲道lf和左后聲道lr以導(dǎo)出lf/lr幅度信息,其中左前聲道lf和左后聲道lr的組合形成左主聲道LM,處理右前聲道rf和右后聲道rr以導(dǎo)出rf/rr幅度信息,其中右前聲道rf和右后聲道rr的組合形成右主聲道RM;以及處理左主聲道LM和右主聲道RM以導(dǎo)出lm/rm幅度信息并導(dǎo)出相干信息,其中左主聲道LM和右主聲道RM的組合形成立體聲主聲道SM。
      3.根據(jù)權(quán)利要求2所述的編碼器,其中,發(fā)生器可操作來(lái)處理中聲道ce和低頻聲道lo以導(dǎo)出ce/lo幅度信息,其中中聲道ce和低頻聲道lo的組合形成中主聲道CM。
      4.根據(jù)權(quán)利要求3所述的編碼器,其中,發(fā)生器可操作來(lái)處理立體聲主聲道SM和中主聲道CM以導(dǎo)出sm/cm幅度信息,其中立體聲主聲道SM和中主聲道CM的組合形成縮混聲道;并且供給器可操作來(lái)使用相干信息和sm/cm幅度信息以確定左/右相干量度。
      5.根據(jù)權(quán)利要求4所述的編碼器,其中,供給器可操作來(lái)依靠sm/cm幅度信息,計(jì)算左/右相干量度,使得相比于sm/cm幅度信息指示能量更多地處于中主聲道CM中的情況,在sm/cm幅度信息指示立體聲主聲道SM中的能量比中主聲道CM中的能量多的情況中,左/右相干量度更接近相干信息,其中在能量更多地處于中主聲道CM中的情況下,左/右相干量度更接近1。
      6.根據(jù)權(quán)利要求4所述的編碼器,其中,供給器可操作來(lái)依靠sm/cm幅度信息,計(jì)算左/右相干量度,使得在sm/cm幅度信息指示立體聲主聲道SM中能量和中主聲道CM中能量的比值超過(guò)預(yù)定值時(shí),左/右相干量度被設(shè)為相干信息,而在立體聲主聲道SM中能量和中主聲道CM中能量的比值小于或等于所述預(yù)定值時(shí),左/右相干量度設(shè)成1。
      7.根據(jù)權(quán)利要求1所述的編碼器,其中,供給器可操作來(lái)提供參數(shù)表示,使得左/右相干量度是參數(shù)表示中音頻信號(hào)的僅有的相干信息。
      8.根據(jù)權(quán)利要求1所述的編碼器,其中,發(fā)生器可操作來(lái)處理左前聲道lf和右前聲道rf以導(dǎo)出lf/rf幅度信息和第一相干信息,其中左前聲道lf和右前聲道rf的組合形成前置主聲道FM,并處理左后聲道lr和右后聲道rr以導(dǎo)出lr/rr幅度信息和第二相干信息,其中左后聲道lr和右后聲道rr的組合形成后置主聲道RM;以及供給器可操作來(lái)確定組合第一相干信息和第二相干信息的左/右相干量度。
      9.根據(jù)權(quán)利要求8所述的編碼器,其中,供給器可操作來(lái)基于第一和第二相干信息的加權(quán)和,確定左/右相干量度,其中使用前置主聲道FM的幅度信息和后置主聲道RM的幅度信作為權(quán)重。
      10.根據(jù)權(quán)利要求8所述的編碼器,其中,發(fā)生器可操作來(lái)處理中聲道ce和低頻聲道lo以導(dǎo)出ce/lo幅度信息,其中中聲道ce和低頻聲道lo的組合形成中主聲道CM。
      11.根據(jù)權(quán)利要求10所述的編碼器,其中,發(fā)生器可操作來(lái)處理前置主聲道FM和中主聲道CM以導(dǎo)出fm/cm幅度信息,其中前置主聲道FM和中主聲道CM的組合形成純前置聲道PF;并且供給器可操作來(lái)另外使用fm/cm幅度信息,組合第一和第二相干信息,確定左/右相干量度。
      12.根據(jù)權(quán)利要求11所述的編碼器,其中,發(fā)生器可操作來(lái)處理純前置聲道PF和后置主聲道RM以導(dǎo)出pf/rm幅度信息,其中純前置聲道PF和后置主聲道RM的組合形成縮混聲道。
      13.根據(jù)權(quán)利要求1所述的編碼器,其中,發(fā)生器可操作來(lái)處理給定長(zhǎng)度的離散時(shí)間幀中的聲道對(duì)。
      14.根據(jù)權(quán)利要求1所述的編碼器,其中,發(fā)生器可操作來(lái)處理給定帶寬的離散頻率區(qū)間中的聲道對(duì)。
      15.根據(jù)權(quán)利要求1所述的編碼器,其中,發(fā)生器可操作來(lái)導(dǎo)出包括只含有來(lái)自相對(duì)于收聽(tīng)位置前側(cè)的信息的第一聲道和只含有來(lái)自相對(duì)于收聽(tīng)位置后側(cè)的信息的第二聲道的聲道對(duì)的附加相干信息;以及供給器可操作來(lái)使用附加相干信息,提供確定前/后相干量度的參數(shù)表示。
      16.一種解碼器,用于處理原始音頻信號(hào)的參數(shù)表示,所述原始音頻信號(hào)在相對(duì)于收聽(tīng)位置的左側(cè)至少有兩個(gè)原始左聲道,在相對(duì)于收聽(tīng)位置的右側(cè)至少有兩個(gè)原始右聲道,所述解碼器包括接收器,用于提供音頻信號(hào)的參數(shù)表示,所述接收器可操作來(lái)提供聲道對(duì)的幅度信息,并提供含有左聲道和右聲道的聲道對(duì)的左/右相干量度,左/右相干量度表示包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的至少一個(gè)聲道對(duì)之間的相干信息;以及處理器,用于為聲道對(duì)提供參數(shù)信息,所述處理器可操作來(lái)從參數(shù)表示中選擇幅度信息,以及使用左/右相干量度導(dǎo)出至少一個(gè)聲道對(duì)的相干信息,其中所述至少一個(gè)聲道對(duì)包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道。
      17.根據(jù)權(quán)利要求16所述的解碼器,其中,接收器可操作來(lái)提供原始左前聲道lf和原始左后聲道lr組成的聲道對(duì)的lf/lr幅度信息,其中原始左前聲道lf和原始左后聲道lr的組合形成左主聲道LM;提供原始右前聲道rf和原始右后聲道rr組成的聲道對(duì)的rf/rr幅度信息,其中原始右前聲道rf和原始右后聲道rr的組合形成右主聲道RM;提供左主聲道LM和右主聲道RM組成的聲道對(duì)的lm/rm幅度信息,其中左主聲道LM和右主聲道RM的組合形成立體聲主聲道SM;并且處理器可操作來(lái)使用左/右相干量度,提供左主聲道LM和右主聲道RM的相干信息;解碼器還包括上混器,所述上混器具有第一1到2上混器,用于通過(guò)使用lm/rm幅度信息和左/右相干量度,從立體聲主聲道SM中產(chǎn)生左主聲道LM和右主聲道RM;第二1到2上混器,用于通過(guò)使用lf/lr幅度信息和預(yù)定的相干信息,從左主聲道LM中產(chǎn)生原始左前聲道lf和原始左后聲道lr;以及第三1到2上混器,用于通過(guò)使用rf/rr幅度信息和預(yù)定的相干信息,從右主聲道RM中產(chǎn)生原始右前聲道rf和原始右后聲道rr。
      18.根據(jù)權(quán)利要求17所述的解碼器,其中,接收器可操作來(lái)提供原始中聲道ce和原始低頻聲道lo組成的聲道對(duì)的ce/lo幅度信息,其中原始中聲道ce和原始低頻聲道lo的組合形成中主聲道CM;以及上混器還包括第四1到2上混器,用于通過(guò)使用ce/lo幅度信息和預(yù)定的相干信息,從中主聲道CM中產(chǎn)生原始中聲道ce和原始低頻聲道lo。
      19.根據(jù)權(quán)利要求18所述的解碼器,其中,接收器可操作來(lái)提供立體聲主聲道SM和中主聲道CM組成的聲道對(duì)的sm/cm幅度信息,其中立體聲主聲道SM和中主聲道CM的組合形成縮混聲道;以及上混器還包括第五1到2上混器,用于通過(guò)使用sm/cm幅度信息和預(yù)定的相干信息,從縮混聲道中產(chǎn)生立體聲主聲道SM和中主聲道CM。
      20.根據(jù)權(quán)利要求16所述的解碼器,其中,接收器可操作來(lái)提供原始左前聲道lf和原始右前聲道rf組成的聲道對(duì)的lf/rf幅度信息,其中原始左前聲道lf和原始右前聲道rf的組合形成前置主聲道FM;提供原始左后聲道lr和原始右后聲道rr組成的聲道對(duì)的lr/rr幅度信息,其中原始左后聲道lr和原始右后聲道rr的組合形成后置主聲道RM;并且處理器可操作來(lái)使用左/右相干量度,提供原始左前聲道lf和原始右前聲道rf的第一相干信息,并提供原始左后聲道lr和原始右后聲道rr的第二相干信息;解碼器還包括一個(gè)上混器,所述上混器具有第一1到2上混器,用于通過(guò)使用lf/rf幅度信息和左/右相干量度,從前置主聲道FM中產(chǎn)生原始左前聲道lf和原始右前聲道rf;第二1到2上混器,用于通過(guò)使用lr/rr幅度信息和左/右相干量度,從后置主聲道RM中產(chǎn)生原始左后聲道lr和原始右后聲道rr。
      21.根據(jù)權(quán)利要求20所述的解碼器,其中,接收器可操作來(lái)提供原始中聲道ce和原始低頻聲道lo組成的聲道對(duì)的ce/lo幅度信息,其中原始中聲道ce和原始低頻聲道lo的組合形成中主聲道CM;并且上混器還包括第三1到2上混器,用于通過(guò)使用ce/lo幅度信息和預(yù)定的相干信息,從中主聲道CM中產(chǎn)生原始中聲道ce和原始低頻聲道lo。
      22.根據(jù)權(quán)利要求21所述的解碼器,其中,接收器可操作來(lái)提供前置主聲道FM和中主聲道CM組成的聲道對(duì)的fm/cm幅度信息,其中前置主聲道FM和中主聲道CM的組合形成純前置聲道PF;并且上混器還包括第四1到2上混器,用于通過(guò)使用fm/cm幅度信息和預(yù)定的相干信息,從純前置聲道PF中產(chǎn)生前置主聲道FM和中主聲道CM。
      23.根據(jù)權(quán)利要求22所述的解碼器,其中,接收器可操作來(lái)提供純前置聲道PF和后置主聲道RM組成的聲道對(duì)的pf/rm幅度信息,其中純前置聲道PF和后置主聲道RM的組合形成縮混聲道;并且上混器還包括第五1到2上混器,用于通過(guò)使用pf/rm幅度信息和預(yù)定的相干信息,從縮混聲道中產(chǎn)生純前置聲道PF和后置主聲道RM。
      24.根據(jù)權(quán)利要求16所述的解碼器,其中,接收器可操作來(lái)提供包括只含有來(lái)自相對(duì)于收聽(tīng)位置前側(cè)的信息的第一聲道和只含有來(lái)自相對(duì)于收聽(tīng)位置后側(cè)的信息的第二聲道的聲道對(duì)的附加前/后相干量度;并且處理器可操作來(lái)使用前/后相干量度提供至少一個(gè)聲道對(duì)的相干信息,所述至少一個(gè)聲道對(duì)包括只含有來(lái)自前側(cè)的信息的第一聲道和只含有來(lái)自后側(cè)的信息的第二聲道。
      25.根據(jù)權(quán)利要求16所述的解碼器,其中,處理器可操作來(lái)通過(guò)分配接收的左/右相干度作為相干量度,導(dǎo)出所有聲道對(duì)的相干量度。
      26.根據(jù)權(quán)利要求16所述的解碼器,其中,接收器可操作來(lái)在第一模式下運(yùn)行,提供聲道對(duì)的幅度信息,并提供含有左聲道和右聲道的聲道對(duì)的左/右相干量度,所述左/右相干量度表示包括只含有來(lái)自相對(duì)于收聽(tīng)位置左側(cè)的信息的第一聲道和只含有來(lái)自相對(duì)于收聽(tīng)位置右側(cè)的信息的第二聲道的至少一個(gè)聲道對(duì)之間的相干信息;或者在第二模式下運(yùn)行,提供聲道對(duì)的幅度信息,并提供相同聲道對(duì)的相干信息;并且處理器可操作來(lái)為聲道對(duì)提供參數(shù)信息,在第一模式下,處理器可操作來(lái)從參數(shù)表示中選擇幅度信息,并使用左/右相干量度導(dǎo)出至少一個(gè)聲道對(duì)的相干信息,所述至少一個(gè)聲道對(duì)包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道;或者在第二模式下,處理器可操作來(lái)從參數(shù)表示中選擇幅度信息,并從參數(shù)表示中選擇相干信息。
      27.根據(jù)權(quán)利要求26所述的解碼器,其中,接收器還包括模式接收器,用于使用接收的模式信息來(lái)選擇運(yùn)行模式,所述模式信息表示要使用的第一或第二模式。
      28.根據(jù)權(quán)利要求16所述的解碼器,其中,接收器可操作來(lái)提供左/右相干量度作為原始信號(hào)僅有的相干信息。
      29.一種方法,用于產(chǎn)生相對(duì)于收聽(tīng)位置有至少兩個(gè)原始左聲道、相對(duì)于收聽(tīng)位置有至少兩個(gè)原始右聲道的音頻信號(hào)的參數(shù)表示,該方法包括通過(guò)分別處理若干聲道對(duì)以導(dǎo)出所處理聲道對(duì)的幅度信息,以及通過(guò)導(dǎo)出包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的聲道對(duì)的相干信息,來(lái)產(chǎn)生參數(shù)信息,以及通過(guò)選擇聲道對(duì)的幅度信息以及使用相干信息確定左/右相干量度并將左/右相干量度引入到輸出數(shù)據(jù)流中,來(lái)提供參數(shù)表示。
      30.一種方法,用于處理原始音頻信號(hào)的參數(shù)表示,所述原始音頻信號(hào)在相對(duì)于收聽(tīng)位置的左側(cè)至少有兩個(gè)原始左聲道,在相對(duì)于收聽(tīng)位置的右側(cè)至少有兩個(gè)原始右聲道,該方法包括通過(guò)提供聲道對(duì)的幅度信息以及通過(guò)提供含有左聲道和右聲道的聲道對(duì)的左/右相干量度,來(lái)提供音頻信號(hào)的參數(shù)表示,左/右相干量度表示包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的至少一個(gè)聲道對(duì)之間的相干信息;以及通過(guò)從參數(shù)表示中選擇幅度信息以及通過(guò)使用左/右相干量度導(dǎo)出至少一個(gè)聲道對(duì)的相干信息,來(lái)提供聲道對(duì)的參數(shù)信息,所述至少一個(gè)聲道對(duì)包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道。
      31.一種帶有側(cè)面信息的編碼音頻數(shù)據(jù),側(cè)面信息包括至少在相對(duì)于收聽(tīng)位置的左側(cè)有兩個(gè)原始左聲道、在相對(duì)于收聽(tīng)位置的右側(cè)有兩個(gè)原始右聲道的音頻信號(hào)的參數(shù)表示,其中參數(shù)表示包括聲道對(duì)的幅度差以及從包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的聲道對(duì)的相干信息中導(dǎo)出的左/右相干量度,所述參數(shù)表示不包括相對(duì)于收聽(tīng)位置同側(cè)的原始聲道之間的相干量度。
      32.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),上面存儲(chǔ)有帶有側(cè)面信息的編碼音頻數(shù)據(jù),側(cè)面信息包括至少在相對(duì)于收聽(tīng)位置的左側(cè)有兩個(gè)原始左聲道、在相對(duì)于收聽(tīng)位置的右側(cè)有兩個(gè)原始右聲道的音頻信號(hào)的參數(shù)表示,其中參數(shù)表示包括聲道對(duì)的幅度差以及從包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的聲道對(duì)的相干信息中導(dǎo)出的左/右相干量度,所述參數(shù)表示不包括相對(duì)于收聽(tīng)位置同側(cè)的原始聲道之間的相干量度。
      33.一種帶有解碼器的接收器或音頻播放器,所述解碼器用于處理原始音頻信號(hào)的參數(shù)表示,原始音頻信號(hào)在相對(duì)于收聽(tīng)位置的左側(cè)至少有兩個(gè)原始左聲道,在相對(duì)于收聽(tīng)位置的右側(cè)至少有兩個(gè)原始右聲道,包括接收器,用于提供音頻信號(hào)的參數(shù)表示,所述接收器可操作來(lái)提供聲道對(duì)的幅度信息,并提供含有左聲道和右聲道的聲道對(duì)的左/右相干量度,左/右相干量度表示包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的至少一個(gè)聲道對(duì)之間的相干信息;以及處理器,用于為聲道對(duì)提供參數(shù)信息,所述處理器可操作來(lái)從參數(shù)表示中選擇幅度信息,以及使用左/右相干量度導(dǎo)出至少一個(gè)聲道對(duì)的相干信息,其中所述至少一個(gè)聲道對(duì)包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道。
      34.一種帶有編碼器的發(fā)射器或音頻記錄器,所述編碼器用于產(chǎn)生至少在相對(duì)于收聽(tīng)位置的左側(cè)有兩個(gè)原始左聲道、在相對(duì)于收聽(tīng)位置的右側(cè)有兩個(gè)原始右聲道的音頻信號(hào)的參數(shù)表示,包括發(fā)生器,用于產(chǎn)生參數(shù)信息,所述發(fā)生器可操作來(lái)分別處理若干聲道對(duì),以導(dǎo)出所處理聲道對(duì)的幅度信息,并且導(dǎo)出包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的聲道對(duì)的相干信息;以及供給器,通過(guò)選擇聲道對(duì)的幅度信息以及使用相干信息確定左/右相干量度,來(lái)提供參數(shù)表示,其中將所述左/右相干量度引入到輸出數(shù)據(jù)流中。
      35.一種接收或音頻播放的方法,該方法具有用于處理原始音頻信號(hào)的參數(shù)表示的方法,所述原始音頻信號(hào)在相對(duì)于收聽(tīng)位置的左側(cè)至少有兩個(gè)原始左聲道,在相對(duì)于收聽(tīng)位置的右側(cè)至少有兩個(gè)原始右聲道,該方法包括通過(guò)提供聲道對(duì)的幅度信息以及通過(guò)提供含有左聲道和右聲道的聲道對(duì)的左/右相干量度,來(lái)提供音頻信號(hào)的參數(shù)表示,左/右相干量度表示包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的至少一個(gè)聲道對(duì)之間的相干信息;以及通過(guò)從參數(shù)表示中選擇幅度信息以及通過(guò)使用左/右相干量度導(dǎo)出至少一個(gè)聲道對(duì)的相干信息,來(lái)提供聲道對(duì)的參數(shù)信息,所述至少一個(gè)聲道對(duì)包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道。
      36.一種發(fā)送或音頻記錄的方法,該方法具有用于產(chǎn)生相對(duì)于收聽(tīng)位置有至少兩個(gè)原始左聲道、相對(duì)于收聽(tīng)位置有至少兩個(gè)原始右聲道的音頻信號(hào)的參數(shù)表示的方法,該方法包括通過(guò)分別處理若干聲道對(duì)以導(dǎo)出所處理聲道對(duì)的幅度信息,以及通過(guò)導(dǎo)出包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的聲道對(duì)的相干信息,來(lái)產(chǎn)生參數(shù)信息,以及通過(guò)選擇聲道對(duì)的幅度信息以及使用相干信息確定左/右相干量度并將左/右相干量度引入到輸出數(shù)據(jù)流中,來(lái)提供參數(shù)表示。
      37.一種帶有發(fā)射器和接收器的傳輸系統(tǒng),所述發(fā)射器具有編碼器,用于產(chǎn)生至少在相對(duì)于收聽(tīng)位置的左側(cè)有兩個(gè)原始左聲道、在相對(duì)于收聽(tīng)位置的右側(cè)有兩個(gè)原始右聲道的音頻信號(hào)的參數(shù)表示,包括發(fā)生器,用于產(chǎn)生參數(shù)信息,所述發(fā)生器可操作來(lái)分別處理若干聲道對(duì),以導(dǎo)出所處理聲道對(duì)的幅度信息,并且導(dǎo)出包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的聲道對(duì)的相干信息;以及供給器,通過(guò)選擇聲道對(duì)的幅度信息以及使用相干信息確定左/右相干量度,來(lái)提供參數(shù)表示,其中將所述左/右相干量度引入到輸出數(shù)據(jù)流中;以及所述接收器具有解碼器,該解碼器用于處理原始音頻信號(hào)的參數(shù)表示,原始音頻信號(hào)在相對(duì)于收聽(tīng)位置的左側(cè)至少有兩個(gè)原始左聲道,在相對(duì)于收聽(tīng)位置的右側(cè)至少有兩個(gè)原始右聲道,包括接收器,用于提供音頻信號(hào)的參數(shù)表示,所述接收器可操作來(lái)提供聲道對(duì)的幅度信息,并提供含有左聲道和右聲道的聲道對(duì)的左/右相干量度,左/右相干量度表示包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的至少一個(gè)聲道對(duì)之間的相干信息;以及處理器,用于為聲道對(duì)提供參數(shù)信息,所述處理器可操作來(lái)從參數(shù)表示中選擇幅度信息,以及使用左/右相干量度導(dǎo)出至少一個(gè)聲道對(duì)的相干信息,其中所述至少一個(gè)聲道對(duì)包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道。
      38.一種發(fā)送和接收的方法,發(fā)射的方法中有一種方法用于產(chǎn)生相對(duì)于收聽(tīng)位置有至少兩個(gè)原始左聲道、相對(duì)于收聽(tīng)位置有至少兩個(gè)原始右聲道的音頻信號(hào)的參數(shù)表示,該方法包括通過(guò)分別處理若干聲道對(duì)以導(dǎo)出所處理聲道對(duì)的幅度信息,以及通過(guò)導(dǎo)出包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的聲道對(duì)的相干信息,來(lái)產(chǎn)生參數(shù)信息,以及通過(guò)選擇聲道對(duì)的幅度信息以及使用相干信息確定左/右相干量度并將左/右相干量度引入到輸出數(shù)據(jù)流中,來(lái)提供參數(shù)表示;以及接收的方法中有一種方法用于處理原始音頻信號(hào)的參數(shù)表示,所述原始音頻信號(hào)在相對(duì)于收聽(tīng)位置的左側(cè)至少有兩個(gè)原始左聲道,在相對(duì)于收聽(tīng)位置的右側(cè)至少有兩個(gè)原始右聲道,該方法包括通過(guò)提供聲道對(duì)的幅度信息以及通過(guò)提供含有左聲道和右聲道的聲道對(duì)的左/右相干量度,來(lái)提供音頻信號(hào)的參數(shù)表示,左/右相干量度表示包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道的至少一個(gè)聲道對(duì)之間的相干信息;以及通過(guò)從參數(shù)表示中選擇幅度信息以及通過(guò)使用左/右相干量度導(dǎo)出至少一個(gè)聲道對(duì)的相干信息,來(lái)提供聲道對(duì)的參數(shù)信息,所述至少一個(gè)聲道對(duì)包括只含有來(lái)自左側(cè)的信息的第一聲道和只含有來(lái)自右側(cè)的信息的第二聲道。
      39.一種具有程序代碼的計(jì)算機(jī),當(dāng)運(yùn)行計(jì)算機(jī)時(shí),執(zhí)行方法權(quán)利要求29、30、35、36或38中的任意一個(gè)。
      全文摘要
      當(dāng)在分級(jí)編碼過(guò)程中,僅針對(duì)包括只含有相對(duì)于收聽(tīng)位置左側(cè)的信息的第一聲道和只含有來(lái)自相對(duì)于收聽(tīng)位置右側(cè)的信息的第二聲道的聲道對(duì)導(dǎo)出描述第一和第二聲道間相干性的相干信息時(shí),多聲道音頻信號(hào)的參數(shù)表示使用壓縮側(cè)面信息很好地描述了音頻信號(hào)的空間特性。當(dāng)在分級(jí)過(guò)程中原始音頻信號(hào)的多個(gè)音頻聲道優(yōu)選地被迭代縮混到一單聲道時(shí),可以從只涉及某種聲道對(duì)的編碼步驟選擇相關(guān)的參數(shù),這種聲道對(duì)具有描述多聲道音頻信號(hào)空間特性所需的信息。
      文檔編號(hào)H04S3/00GK101031959SQ200680000417
      公開(kāi)日2007年9月5日 申請(qǐng)日期2006年2月1日 優(yōu)先權(quán)日2005年4月15日
      發(fā)明者安德烈亞斯·赫爾策, 于爾根·赫勒, 約納斯·勒登, ??啤づ蠊? 克里斯托弗·薛林, 約納斯·恩德加德, 耶羅恩·布里巴特, 埃里克·舒約斯, 維爾納·烏姆恩, 拉斯·維爾莫斯 申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì), 科丁技術(shù)公司, 皇家飛利浦電子股份有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1