国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      產(chǎn)生多通道輸出信號的裝置和方法

      文檔序號:2829169閱讀:208來源:國知局
      專利名稱:產(chǎn)生多通道輸出信號的裝置和方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及多通道解碼,具體地,涉及多通道解碼,其中存在至少兩個傳輸通道,即多通道解碼是立體聲兼容的。
      背景技術(shù)
      近來,多通道音頻再現(xiàn)技術(shù)正變得越來越重要。這也許是因為諸如熟知的mp3技術(shù)之類的音頻壓縮/編碼技術(shù)可以通過因特網(wǎng)或其它具有有限帶寬的傳輸信道,來分發(fā)音頻記錄。由于mp3編碼技術(shù)可以以立體聲格式,即包括第一或左立體聲通道和第二或右立體聲通道的音頻記錄的數(shù)字表達(dá),來分發(fā)所有記錄,所以mp3編碼技術(shù)變得如此出名。
      然而,傳統(tǒng)的雙通道音響系統(tǒng)具有基本的缺陷。因此,開發(fā)出環(huán)繞技術(shù)。除了兩個立體聲通道L和R之外,所推薦的多通道環(huán)繞表達(dá)還包括附加的中央通道C和兩個環(huán)繞通道Ls、Rs。這個基準(zhǔn)聲音格式也被稱為三/二立體聲,表示三個前部通道和兩個環(huán)繞通道。通常,需要五個傳輸通道。在回放環(huán)境中,需要在相應(yīng)五個不同位置處的至少五個揚(yáng)聲器,以在離五個放置好的擴(kuò)音器特定距離處獲得最佳效果。
      現(xiàn)有領(lǐng)域中已知多種技術(shù),用于減少多通道音頻信號的傳輸所需的數(shù)據(jù)量。這些技術(shù)被稱為聯(lián)合立體聲技術(shù)。為此,參考圖10,圖10示出了聯(lián)合立體聲設(shè)備60。該設(shè)備可以是實現(xiàn)例如強(qiáng)度立體聲(IS)或技術(shù)心理聲學(xué)編碼(BCC)的設(shè)備。這種設(shè)備通常接收至少兩個通道(CH1、CH2、...CHn)作為輸入,并輸出單個載波通道和參數(shù)數(shù)據(jù)。定義參數(shù)數(shù)據(jù),以便在解碼器中可以計算原始通道(CH1、CH2、...CHn)的近似。
      通常,載波通道包括子帶采樣、頻譜系數(shù)、時域采樣等,提供了底層信號的比較細(xì)致的表達(dá),但是參數(shù)數(shù)據(jù)不包括這種頻譜系數(shù)的采樣,而是包括控制參數(shù),以控制某種重構(gòu)算法,例如通過乘法的加權(quán)、時移、頻移、...。因此,參數(shù)數(shù)據(jù)僅包括信號或有關(guān)通道的比較粗略的表達(dá)。以數(shù)量為例,載波通道所需的數(shù)據(jù)量在60-70kbit/s的范圍內(nèi),而一個通道的參數(shù)輔助信息所需的數(shù)據(jù)量在1.5-2.5kbit/s的范圍內(nèi)。參數(shù)數(shù)據(jù)的一個示例是公知的縮放因子、下面將描述的強(qiáng)度立體聲信息或技術(shù)心理聲學(xué)參數(shù)。
      在AES preprint 3799,″Intensity Stereo Coding″,J.Herre,K.H.Brandenburg,D.Lederer,F(xiàn)ebruary 1994,Amsterdam中描述了強(qiáng)度立體聲編碼。通常,強(qiáng)度立體聲的概念是基于要應(yīng)用于立體聲音頻通道的數(shù)據(jù)的主軸變換的。如果大部分?jǐn)?shù)據(jù)點集中在第一主軸附近,則可以通過在編碼之前使兩個信號轉(zhuǎn)動特定角度,來實現(xiàn)編碼增益。然而,對于實際的立體聲再現(xiàn)技術(shù),并不能總是這樣。因此,通過使第二正交分量不在比特流中傳輸,來修改該技術(shù)。因此,左和右通道的重構(gòu)信號包括同一傳輸信號的不同加權(quán)或縮放的版本。然而,重構(gòu)信號的幅度不同,但是其相位信息是相同的。然而,通過選擇性縮放操作,保留了兩個原始音頻通道的能量-時間包絡(luò),其中選擇性縮放操作通常以頻率選擇性方式操作。這符合人類對高頻聲音的感知,在高頻,由能量包絡(luò)確定主要的空間方位信息。
      此外,實際上,從左通道和右通道的和信號中,而不是轉(zhuǎn)動兩個分量,來產(chǎn)生傳輸?shù)男盘枺摧d波通道。此外,頻率選擇性地來執(zhí)行該處理,即,與每個縮放因子的波段(即編碼器的頻率分割)無關(guān)地,產(chǎn)生用于執(zhí)行縮放操作的強(qiáng)度立體聲參數(shù)。優(yōu)選地,組合兩個通道,以形成組合的或“載波”通道,并且除了組合的通道之外,基于第一通道的能量、第二通道的能量或者組合通道的能量,來確定強(qiáng)度立體聲信息。
      在AES convention paper 5574,″Binaural cue coding applied tostereo and multi-channel audio compression″,C.Faller,F(xiàn).Baumgarte,May 2002,Munich中描述了BCC技術(shù)。在BCC編碼中,使用具有重疊窗的基于DFT的變換,將多個音頻輸入通道轉(zhuǎn)換為頻譜表達(dá)。將產(chǎn)生的均勻頻譜劃分為每個均具有索引的非重疊分割。每個分割具有與等價矩形帶寬(ERB)成比例的帶寬。在每幀k內(nèi),針對每個分割,估計通道間幅度差(ICLD)和通道間時間差(ICTD)。量化和編碼ICLD和ICTD,產(chǎn)生BCC比特流。相對于基準(zhǔn)通道,對于每個通道,給定通道間幅度差和通道間時間差。然后,根據(jù)指定的公式,計算參數(shù),所述公式取決于要處理的信號的某些分割。
      在解碼器一側(cè),解碼器接收單聲道信號和BCC比特流。將單聲道信號變換為頻域,并輸入到空間合成塊,空間合成塊還接收解碼的ICLD和ICTD值。在空間合成塊中,使用BCC參數(shù)(ICLD和ICTD)值來執(zhí)行單聲道信號的加權(quán)操作,以便合成多通道信號,在頻率/時間轉(zhuǎn)換之后,所述多通道信號表示原始多通道音頻信號的重構(gòu)。
      在BCC的情況下,聯(lián)合立體聲模塊60操作用于輸出通道輔助信息,使得參數(shù)通道數(shù)據(jù)是量化且編碼的ICLD或ICTD參數(shù),其中,原始通道之一用作編碼通道輔助信息的基準(zhǔn)通道。
      通常,載波通道由參與的原始通道之和形成。
      當(dāng)然,上述技術(shù)僅給解碼器提供了單聲道表達(dá),解碼器只能處理載波通道,而不能夠處理參數(shù)數(shù)據(jù),以產(chǎn)生多于一個輸入通道的一個或多個近似。
      在美國專利申請公開US2003,0219130 A1、2003/0026441 A1和2003/0035553 A1中詳細(xì)描述了公知為技術(shù)心理聲學(xué)編碼(BCC)的音頻編碼技術(shù)。還可以參考“Binaural Cue Coding.Part IISchemes andApplications”,C.Faller and F.Baumgarte,IEEE Trans.On Audio andSpeech Proc.,Vol.11,No.6,Nov.1993。將所引用美國專利申請公開和作者為Faller和Baumgarte的有關(guān)BCC技術(shù)的兩個所引用技術(shù)公開的全部內(nèi)容合并在此以作參考。
      下面,參考圖11至13,來詳細(xì)描述用于多通道音頻編碼的典型通用的BCC方案。圖11示出了用于多通道音頻信號的編碼/傳輸?shù)倪@樣一種通用技術(shù)心理聲學(xué)編碼方案。在下混塊114中將BCC編碼器112的輸入110處的多通道音頻輸入信號下混。在本示例中,輸入110處的原始多通道信號是5通道的環(huán)繞信號,具有左前通道、右前通道、左環(huán)繞通道、右環(huán)繞通道和中央通道。例如,下混塊114通過將這五個通道簡單相加為單聲道信號,來產(chǎn)生和信號。在使用多通道輸入信號的技術(shù)中已知其它的下混方案,可以獲得具有單個通道的下混信號。該單個通道在和信號線路115處輸出。由BCC分析塊116獲得的輔助信息在輔助信息線路117處輸出。在BCC分析塊中,如上所述來計算通道間幅度差(ICLD)和通道間時間差(ICTD)。近來,BCC分析塊116已經(jīng)增強(qiáng)為還能夠計算通道間相關(guān)性值(ICC值)。優(yōu)選地以量化和編碼形式,將和信號以及輔助信息發(fā)送到BCC解碼器120。BCC解碼器將發(fā)送的和信號分解為多個子帶,并應(yīng)用縮放、延遲和其它處理,以產(chǎn)生輸出多通道音頻信號的子帶。執(zhí)行該處理,使得輸出121處重構(gòu)多通道信號的ICLD、ICTD和ICC參數(shù)(方位信息)與在輸入110處進(jìn)入BCC編碼器112的原始多通道信號的相應(yīng)方位信息類似。為此,BCC解碼器120包括BCC合成塊122和輔助信息處理塊123。
      下面,參考圖12來解釋BCC合成塊122的內(nèi)部組成。線路115上的和信號輸入時間/頻率轉(zhuǎn)換單元或濾波器組FB 125。在塊125的輸出處,存在N個子帶信號,在極限情況下,當(dāng)音頻濾波器組125執(zhí)行1∶1變換,即從N個時域采樣中產(chǎn)生N個頻譜系數(shù)的變換時,存在頻譜系數(shù)塊。
      BCC合成塊122還包括延遲級126、幅度修改級127、相關(guān)性處理級128以及逆濾波器組級IFB 129。在級129的輸出處,可以將在5通道環(huán)繞系統(tǒng)的情況下具有5個通道的重構(gòu)多通道音頻信號輸出到如圖11所示的一組擴(kuò)音器124。
      如圖12所示,通過元件125,將輸入信號s(n)轉(zhuǎn)換為頻域或濾波器組域。使元件125輸出的信號倍增,使得如乘法節(jié)點130所示,獲得同一信號的多個版本。原始信號的版本數(shù)目與要重構(gòu)的輸出信號中輸出通道的數(shù)目相等。通常,節(jié)點130處的原始信號的每個版本經(jīng)過特定延遲d1、d2、...、di、...、dN。由圖11中的輔助信息處理塊123計算延遲參數(shù),并且從BCC分析塊116所確定的通道間時間差中推導(dǎo)出。
      對于乘法參數(shù)a1、a2、...、ai、...、aN同樣如此。由輔助信息處理塊123根據(jù)BCC分析塊116所計算出的通道間幅度差,來計算a1、a2、...、ai、...、aN。
      BCC分析塊116所計算的ICC參數(shù)用于控制塊128的功能,使得在塊128的輸出處獲得經(jīng)過延遲和幅度處理的信號之間的某種相關(guān)性。這里要注意,級126、127、128之間的順序可以與圖12所示的不同。
      這里要注意,在音頻信號的幀方式處理中,以幀方式執(zhí)行BCC分析,即時間變化地、且以頻率方式,來執(zhí)行BCC分析。這意味著,對于每個頻譜波段,獲得BCC參數(shù)。這意味著,在音頻濾波器組125將輸入信號分解為例如32帶通信號的情況下,BCC分析塊獲得例如32波段的一組BCC參數(shù)。當(dāng)然,在圖12中詳細(xì)示出的圖11的BCC分析塊122執(zhí)行重構(gòu),在示例中,該重構(gòu)同樣基于32波段。
      下面,參考圖13,圖13示出了確定某些BCC參數(shù)的設(shè)置。通常,可以在通道對之間定義ICLD、ICTD和ICC參數(shù)。然而,優(yōu)選地,在基準(zhǔn)通道和每個其它通道之間確定ICLD和ICTD參數(shù)。這在圖13A中示出了。
      可以以不同方式定義ICC參數(shù)。最一般地,可以在編碼器中估計如圖13B所示的所有可能的通道對之間的ICC參數(shù)。在這種情況下,解碼器可以合成ICC,使得ICC與所有可能通道對之間的原始多通道信號近似相同。然而,建議每一次僅估計最強(qiáng)的兩個通道之間的 ICC參數(shù)。圖13C示出了該方案的一個示例,其中,一次估計了通道1和2之間的ICC參數(shù),而另一次,計算了通道1和5之間的ICC參數(shù)。解碼器則合成解碼器中最強(qiáng)通道之間的通道間相關(guān)性,并應(yīng)用一些啟發(fā)式規(guī)則來計算和合成剩下的通道對的通道間相干性。
      例如,關(guān)于基于傳輸?shù)腎CLD參數(shù)的乘法參數(shù)a1、aN的計算,參考上述AES會議文章5574。ICLD參數(shù)表示原始多通道信號中的能量分布。不失一般性,圖13A示出了表示所有其它通道與左前通道之間的能量差的四個ICLD參數(shù)。在輔助信息處理塊123中,從ICLD參數(shù)中推導(dǎo)出乘法參數(shù)a1、...、aN,使得所有重構(gòu)的輸出通道總能量與傳輸?shù)暮托盘柕哪芰肯嗤?或成比例)。確定這些參數(shù)的一種簡單方式是2階段過程,其中,在第一階段,將左前通道的乘法因子設(shè)置為1(unity),而圖13A中其它通道的乘法因子設(shè)置為傳輸?shù)腎CLD值。然后,在第二階段,計算所有五個通道的能量,并將其與傳輸?shù)暮托盘柕哪芰肯啾容^。然后,使用對于所有通道都相等的縮減因子,將所有通道縮減,其中,選擇縮減因子,使得在縮減之后所有的重構(gòu)輸出通道的總能量與傳輸?shù)暮托盘柕目偰芰肯嗟取?br> 當(dāng)然,存在其它計算乘法因子的方法,這些方法并不依賴于2階段過程,而可以只需要1階段過程。
      關(guān)于延遲參數(shù),要注意,當(dāng)左前通道的延遲參數(shù)d1被設(shè)置為零時,可以直接使用BCC編碼器發(fā)送的延遲參數(shù)ICTD。由于延遲并不改變信號的能量,所以這里不必進(jìn)行縮放。
      關(guān)于BCC編碼器發(fā)送到BCC解碼器的通道間相干性度量ICC,要注意,可以通過修改乘法因子a1、...、aN,例如將所有子帶的加權(quán)因子與范圍[20log10(-6)和20log10(6)]的隨機(jī)數(shù)相乘,來進(jìn)行相干性操作。優(yōu)選地,選擇偽隨機(jī)序列,使得對于所有的臨界波段,方差近似恒定,并且在每個臨界波段內(nèi)平均為零。將相同序列應(yīng)用于每個不同幀的光譜系數(shù)。因此,通過修改偽隨機(jī)序列的方差,來控制聽覺圖像寬度。較大的方差產(chǎn)生較大的圖像寬度??梢栽趯挾葹榕R界波段的各個波段內(nèi)執(zhí)行方差修改。這使得在聽覺場景中同時存在多個對象,每個對象具有不同的圖像寬度。偽隨機(jī)序列的適當(dāng)幅度分布是在對數(shù)標(biāo)度上的均勻分布,如美國專利申請2003-0219130 A1中所述的。然而,所有的BCC合成處理涉及單個輸入通道,如圖11所示的BCC編碼器發(fā)送到BCC解碼器的和信號。
      為了以兼容的方式,即以比特流格式(對于標(biāo)準(zhǔn)的立體聲解碼器而言也是可以理解的),來傳輸五個通道,使用在″MUSICAM surrounda universal multi-channel coding system compatible with ISO 11172-3″,G.Theile and G.Stoll,AES preprint 3403,October 1992,San Francisco中描述的所謂矩陣化法。將五個輸入通道L、R、C、Ls和Rs饋入執(zhí)行矩陣化操作的矩陣化設(shè)備,來根據(jù)五個輸入通道計算基本或兼容的立體聲通道Lo、Ro。具體地,如下來計算這些基本立體聲通道Lo/RoLo=L+xC+yLsRo=R+xC+yRsx和y是常數(shù)。其它三個通道C、Ls、Rs就像它們在擴(kuò)展層中一樣傳輸,除了基本立體聲層,擴(kuò)展層還包括基本立體聲信號Lo/Ro的編碼版本。關(guān)于比特流,該Lo/Ro基本立體聲層包括諸如縮放因子和子帶采樣之類的報頭信息。多通道擴(kuò)展層,即中央通道和兩個環(huán)繞通道,包括在多通道擴(kuò)展字段中,多通道擴(kuò)展字段也被稱為輔助數(shù)據(jù)字段。
      在解碼器一側(cè),執(zhí)行逆矩陣化操作,以便使用基本立體聲通道Lo、Ro和三個附加通道來形成五通道表達(dá)中的左和右通道的重構(gòu)。此外,根據(jù)輔助信息來解碼三個附加通道,以獲得原始多通道音頻信號的解碼五通道或環(huán)繞表達(dá)。
      在公開″Improved MPEG-2 audio multi-channel encoding″,B.Grill,J.Herre,K.H.Brandenburg,E.Eberlein,J.Koller,J.Mueller,AESpreprint 3865,F(xiàn)ebruary 1994,Amsterdam中描述了多通道編碼的另一方法,其中,為了獲得后向兼容,考慮后向兼容模式。為此,使用兼容矩陣,從原始五個輸入通道中獲得兩個所謂的下混通道Lc、Rc。此外,可以動態(tài)地選擇作為輔助數(shù)據(jù)傳輸?shù)娜齻€輔助通道。
      為了采用立體聲不相干性,將聯(lián)合立體聲技術(shù)應(yīng)用于通道組,例如左通道、右通道和中央通道的三個前面通道。為此,組合這三個通道以獲得組合的通道。將該組合通道量化并封裝到比特流中。然后,將該組合通道與相應(yīng)的聯(lián)合立體聲信息一起輸入到聯(lián)合立體聲解碼模塊,以獲得聯(lián)合立體聲解碼通道,即聯(lián)合立體聲解碼左通道、聯(lián)合立體聲解碼右通道和聯(lián)合立體聲解碼中央通道。這些聯(lián)合立體聲解碼通道與左環(huán)繞通道和右環(huán)繞通道一起輸入到兼容矩陣塊,以形成第一和第二下混通道Lc、Rc。然后,將兩個下混通道的量化版本和組合通道的量化版本與聯(lián)合立體聲編碼參數(shù)一起封裝到比特流中。
      因此,使用強(qiáng)度立體聲編碼,在“載波”數(shù)據(jù)的單個部分中傳輸一組獨立原始通道信號。解碼器然后根據(jù)所包括信號的原始能量-時間包絡(luò)再次縮放,將其重構(gòu)為相等數(shù)據(jù)。因此,傳輸?shù)耐ǖ赖木€性組合將導(dǎo)致與原始下混截然不同的結(jié)果。這發(fā)生在基于強(qiáng)度立體聲概念的任何一種聯(lián)合立體聲編碼中。對于提供可兼容下混通道的編碼系統(tǒng),存在直接結(jié)果如上述公開所示通過解矩陣進(jìn)行的重構(gòu)具有由不完善的重構(gòu)引起的偽像(artifact)。使用所謂的聯(lián)合立體聲預(yù)失真方案,其中在編碼器中的矩陣化之前執(zhí)行左、右和中央通道的聯(lián)合立體聲編碼,以消除該問題。按照這種方式,由于在編碼器一側(cè),聯(lián)合立體聲信號用于產(chǎn)生下混通道,所以重構(gòu)的解矩陣方案引入了很少的偽像。因此,將不完善的重構(gòu)過程移到了兼容下混通道Lc和Rc,在此,很可能由音頻信號本身掩蓋不完善的重構(gòu)過程。
      盡管這種系統(tǒng)由于解碼器一側(cè)的解矩陣而產(chǎn)生了很少的偽像,然而,它具有一些缺陷。一個缺陷在于,不是從原始通道,而是從原始通道的強(qiáng)度立體聲編碼/解碼版本中,推導(dǎo)出立體聲兼容的下混通道Lc和Rc。因此,在兼容下混通道中包括由于強(qiáng)度立體聲編碼系統(tǒng)而引起的數(shù)據(jù)丟失。因此,僅對兼容通道而不對增強(qiáng)強(qiáng)度立體聲編碼通道進(jìn)行解碼的唯立體聲(stereo-only)解碼器提供受到包括數(shù)據(jù)丟失的強(qiáng)度立體聲所影響的輸出信號。
      此外,除了兩個下混通道之外,還必須傳輸完整的附加通道。該通道是組合通道,組合通道是由左通道、右通道和中央通道的聯(lián)合立體聲編碼形成的。此外,必須將用于根據(jù)組合通道來重構(gòu)原始通道L、R、C的強(qiáng)度立體聲信息發(fā)送到解碼器。在解碼器處,執(zhí)行逆矩陣化,即解矩陣操作,以從兩個下混通道中推導(dǎo)出環(huán)繞通道。此外,使用傳輸?shù)慕M合通道和傳輸?shù)穆?lián)合立體聲參數(shù),通過聯(lián)合立體聲解碼,來近似原始的左、右和中央通道。注意,通過組合通道的聯(lián)合立體聲解碼,推導(dǎo)出原始的左、右和中央通道。
      圖11所示的BCC方案的改進(jìn)是具有至少兩個音頻傳輸通道的BCC方案,從而可以實現(xiàn)立體聲兼容處理。在編碼器中,將C輸入通道下混到E傳輸音頻通道。估計特定輸入通道對之間的ICTD、ICLD和ICC方位信息,作為頻率和時間的函數(shù)。將估計的方位信息作為輔助信息發(fā)送到解碼器。具有C輸入通道和E傳輸通道的BCC方案表示為C-2-E BCC。
      一般而言,BCC處理是傳輸?shù)耐ǖ赖念l率選擇性的時變后處理。下面,根據(jù)隱式理解,將不引入頻率波段索引。而是,假設(shè)如xn、sn、yn、an等的變量是維度(1,f)的矢量,其中f表示頻率波段的編號。
      在C.Faller and F.Baumgarte,″Binaural Cue Coding applied tostereo and multi-channel audio compression,″in Preprint 112thConv.Aud.Engl.Soc.,May 2002、F.Baumgarte and C.Faller,″Binaural Cue Coding-Part IPsychoacoustic fundamentals and design principles,″IEEE Trans.On Speech and Audio Proc.,vol.11,no.6,Nov.2003以及C.Faller and F.Baumgarte,″Binaural Cue Coding-Part II;Schemes and applications,″IEEE Trans.On Speech and Audio Proc.,vol.11,no.6,Nov.2003中描述了所謂的常規(guī)BCC方案。這里,將圖11所示的單個傳輸?shù)囊纛l通道作為用于立體聲或多通道音頻回放的已有單聲道系統(tǒng)的后向兼容擴(kuò)展。由于傳輸?shù)膯蝹€音頻通道是有效的單聲道信號,所以它適用于由傳統(tǒng)的接收機(jī)來回放。
      然而,多數(shù)安裝的音頻廣播基礎(chǔ)設(shè)施(模擬和數(shù)字收音機(jī)、電視等)和音頻存儲系統(tǒng)(塑料盤、壓縮磁帶、壓縮盤、VHS視頻、MP3聲音存儲器等)是基于雙通道立體聲的。另一方面,符合5.1標(biāo)準(zhǔn)(Rec.ITU-R BS.775,Multi-Channel Stereophonic Sound System with orwithout Accompanying Picture,ITU,1993,http://www.itu.org)的“家庭影院系統(tǒng)”越來越普及。因此,如在J.Herre,C.Faller,C.Ertel,J.Hilpert,A.Hoelzer,and C.Spenger,″MP3 SurroundEfficient and compatiblecoding of multi-channel audio,″in Preprint 116thConv.Aud.Eng.Soc.,May 2004中描述,具有兩個傳輸通道的BCC尤其專注于擴(kuò)展現(xiàn)有多通道環(huán)繞的立體聲系統(tǒng)。在這點上,參考2004年1月20日遞交的美國序列號10/762,100的美國專利申請″Apparatus and method for constructing amulti-channel output signal or for generating a downmix signal″。
      在模擬域中,例如“Dolby Surround”、“Dolby Pro Logic”和“DolbyPro Logic II”(J.Hull,″Surround sound past,present,and future,″Techn.Rep.,Dolby Laboratories,1999,www.dolby.com/tech/;R.Dressler,″Dolby Surround Prologic II Decoder-Principles of operation,″TechnRep.,Dolby Laboratories,2000,www.dolby.com/tech/)的矩陣化算法已經(jīng)普及多年。這種算法應(yīng)用“矩陣化”,以將5.1音頻通道映射到立體聲兼容通道對。然而,與在J.Herre,C.Faller,C.Ertel,J.Hilpert,A.Hoelzer,and C.Spenger,″MP3 SurroundEfficient and compatible coding ofmulti-channel audio,″in Preprint 116thConv.Aud.Eng.Soc.,May 2004中所述的離散音頻通道相比,矩陣化算法僅提供明顯減少的靈活性和質(zhì)量。如果在混合5.1環(huán)繞的音頻信號的情況下考慮了矩陣化算法的限制,則如J.Hilson,″Mixing with Dolby Pro Logic II Technology,″Tech.Rep.,Dolby Laboratories,2004,www.dolby.com/tech/PLII.Mixing.JimHilson.html中所述,可以減少一些這種不完善的效果。
      C-to-2 BCC可以看作具有與具有附加輔助信息的矩陣化算法類似功能的方案。然而,更一般化地,它支持從任意數(shù)目的原始通道映射到任意數(shù)目的傳輸通道。C-to-E BCC是針對數(shù)字域的,并且其低比特率附加輔助信息通??梢砸院笙蚣嫒莸姆绞桨ㄔ谝延袛?shù)據(jù)傳輸中。這意味著,傳統(tǒng)接收機(jī)將忽略附加的輔助信息,并直接回放2個傳輸通道,如在J.Herre,C.Faller,C.Ertel,J.Hilpert,A.Hoelzer,and C.Spenger,″MP3 SurroundEfficient and compatible coding ofmulti-channel audio,″in Preprint 116thConv.Aud.Eng.Soc.,May 2004中所述。長遠(yuǎn)目標(biāo)是實現(xiàn)與所有原始音頻通道的離散傳輸類似的音頻質(zhì)量,即明顯比傳統(tǒng)矩陣化算法要好的質(zhì)量。
      下面,參考圖6a,以說明傳統(tǒng)編碼器下混操作,根據(jù)五個輸入通道,即左通道L或x1、右通道R或x2、中央通道C或x3、左環(huán)繞通道sL或x4以及右環(huán)繞通道sR或x5,來產(chǎn)生兩個傳輸通道。圖6a示意地示出了下混情況。顯而易見的有,使用左通道x1、中央通道x3和左環(huán)繞通道x4形成第一傳輸通道y1。此外,從圖6a可見,使用右通道x2、中央通道x3和右環(huán)繞通道x5形成右傳輸通道y2。
      圖6c示出了通常優(yōu)選的下混規(guī)則或下混矩陣。顯而易見的有,中央通道x3由加權(quán)因子1/加權(quán),這意味著中央通道x3的能量的第一一半進(jìn)入左傳輸通道或第一傳輸通道Lt,而中央通道的能量的第二一半引入第二傳輸通道或右傳輸通道Rt。因此,下混將輸入通道映射到傳輸通道。下混通常由(m,n)矩陣描述,用于將n個輸入樣本映射到m個輸出樣本。該矩陣的項是在求和以形成相關(guān)輸出通道之前應(yīng)用于相應(yīng)通道的權(quán)重。
      存在不同的下混方法,這些下混方法可以在ITU推薦(Rec.ITU-RBS.775,Multi-Channel Stereophonic Sound System with or withoutAccompanying Picture,ITU,1993,http://www.itu.org)中找到。此外,關(guān)于不同的下混方法,參考J.Herre,C.Faller,C.Ertel,J.Hilpert,A.Hoelzer,and C.Spenger,″MP3 SurroundEfficient and compatiblecoding of multi-channel audio,″in Preprint 116thConv.Aud.Eng.Soc.,May 2004,Section 4.2??梢栽跁r域或頻域執(zhí)行下混。它可以是以信號自適應(yīng)方式時變的,或頻率(波段)相關(guān)的。圖6a的右邊矩陣示出了通道分配,并給出如下 因此,對于5-to-2 BCC的重要情況,根據(jù)右、右后和中央,計算出一個傳輸通道,并根據(jù)左、左后和中央計算出另一個傳輸通道,與圖6c中所示的下面的下混矩陣相對應(yīng)。
      D52=101210011201]]>在該下混矩陣中,可以選擇加權(quán)因子,使得每列中值的平方和是1,每個輸入信號的功率均勻地分布在下混的信號中。當(dāng)然,也可以使用其它的下混方案。
      具體地,參考圖6b或7b,圖6b或7b示出了編碼器下混方案的具體實施方式
      。示出了一個子帶的處理。在每個子帶中,控制縮放因子e1和e2,以使下混信號中的信號分量的響度“相等”。在這種情況下,在頻域執(zhí)行下混,變量n(圖7b)表示頻域子帶時間索引,k是變換的時域信號塊的索引。具體地,注意,加權(quán)設(shè)備對中央通道進(jìn)行加權(quán),然后中央通道的加權(quán)版本由各個求和設(shè)備引入左傳輸通道和右傳輸通道。
      參考圖7a、7b和7c,示出解碼器中相應(yīng)的上混操作。在解碼器中,必須計算上混,將傳輸通道映射到輸出通道。上混由(i,j)矩陣(i行,j列)描述,用于將i個傳輸樣本映射到j(luò)個輸出樣本。再次,該矩陣的項是在求和以形成相關(guān)輸出通道之前應(yīng)用于相應(yīng)通道的權(quán)重??梢栽跁r域或頻域執(zhí)行上混。此外,上混可以是以信號自適應(yīng)方式時變的,或者頻率(波段)相關(guān)的。與下混矩陣相反,因為在BCC處理中要進(jìn)一步修改這些上混的通道,所以矩陣項的絕對值并不表示輸出通道的最終權(quán)重。具體地,使用如ICLD等的空間方位信息所提供的信息,來進(jìn)行修改。在本示例中,所有的項設(shè)置為0或1。
      圖7a示出了5揚(yáng)聲器環(huán)繞系統(tǒng)的上混情況。除了每個揚(yáng)聲器之外,還示出了用于BCC合成的基本通道。具體地,關(guān)于左環(huán)繞輸出通道,使用第一傳輸通道y1。對于左通道一樣。該通道用作基本通道,也稱為“左傳輸通道”。
      關(guān)于右輸出通道和右環(huán)繞輸出通道,還使用相同的通道,即第二或右傳輸通道y2。關(guān)于中央通道,要注意,根據(jù)圖7c所示的上混矩陣,即通過對兩個傳輸通道求和,來形成用于BCC中央通道合成的基本通道。
      圖7b示出了給出兩個傳輸通道、產(chǎn)生5通道輸出信號的過程。這里,在頻域進(jìn)行上混,其中變量n表示頻域子帶時間索引,k是轉(zhuǎn)換的時域信號塊的索引。這里要注意,在使用相同基本通道的通道對之間,即分別在左和左后之間、以及在右和右后之間,應(yīng)用ICTD和ICC合成。圖7b中A表示的兩個塊包括用于2通道ICC合成的方案。
      在編碼器處估計的、用于計算解碼器輸出信號合成的所有參數(shù)所需的輔助信息包括下面的方位信息ΔL12、ΔL13、ΔL14、ΔL15、τ14、τ25、c14和c25(ΔLij是通道i和j之間的幅度差,τij是通道i和j之間的時間差,cij是通道i和j之間的相關(guān)性系數(shù))。這里要注意,也可以使用其它幅度差。存在在解碼器處有足夠信息(即縮放因子、延遲等)可用于計算BCC合成的要求。
      下面,參考圖7d,來進(jìn)一步示出每個通道的幅度修改(即ai的計算)和隨后的整體歸一化(圖7b中未示出)。優(yōu)選地,通道間幅度差ΔLi作為輔助信息發(fā)送,即作為ICLD來發(fā)送。對于通道信號,必須使用基準(zhǔn)通道Fref和要計算的通道(即Fi)之間的指數(shù)關(guān)系。這在圖7d的頂部示出了。
      圖7b中未示出的是隨后的或最后的整體歸一化,可以在相關(guān)塊A之前或在相關(guān)塊A之后進(jìn)行該歸一化。當(dāng)相關(guān)塊影響由ai加權(quán)的通道的能量時,整體歸一化應(yīng)該在相關(guān)塊A之后進(jìn)行。為了確保所有輸出通道的能量與所有的傳輸通道的能量相等,如圖7d所示地對基準(zhǔn)通道進(jìn)行縮放。優(yōu)選地,基準(zhǔn)通道是平方傳輸通道之和的根。
      下面,描述與這些下混/上混方案相關(guān)聯(lián)的問題。當(dāng)考慮圖6和圖7所示的5-to-2 BCC方案時,下面的問題將變得顯而易見。
      原始中央通道被引入兩個傳輸通道,因此,還被引入重構(gòu)的左和右輸出通道。
      此外,在該方案中,共同的中央組成在兩個重構(gòu)的輸出通道中具有相同的幅度。
      此外,在解碼期間,原始中央信號由從傳輸?shù)淖蠛陀彝ǖ乐型茖?dǎo)出的中央信號替代,因此不能與重構(gòu)的左和右通道獨立(即非相關(guān))。
      這個效果對所感知的以所有音頻通道之間的高度非相關(guān)性(即,低相關(guān)性)為特征的非常寬的聲音圖像的信號的聲音質(zhì)量有不利的影響。這種信號的示例是當(dāng)使用具有足夠?qū)挼拈g距以產(chǎn)生原始多通道信號的不同麥克風(fēng)時歡呼聽眾的聲音。對于這種信號,解碼聲音的聲音圖像變窄,并且其自然寬度減小。

      發(fā)明內(nèi)容
      本發(fā)明的目的是提供一種高質(zhì)量多通道重構(gòu)概念,該概念產(chǎn)生具有改進(jìn)聲音感知的多通道輸出信號。
      根據(jù)本發(fā)明的第一方面,該目的是由一種使用E個傳輸通道,并使用與輸入通道相關(guān)的參數(shù)輔助信息,產(chǎn)生具有K個輸出通道的多通道輸出信號的裝置來實現(xiàn)的,該多通道輸出信號與具有C個輸入通道的多通道輸入信號相對應(yīng),所述E個傳輸通道表示以C個輸入通道作為輸入的下混操作的結(jié)果,其中E≥2,C>E,并且C≥K>1,并且,下混操作有效地在第一傳輸通道和第二傳輸通道中引入了第一輸入通道,還在第一傳輸通道中引入了第二輸入通道,所述裝置包括抵消通道計算器,用于使用與包括在第一傳輸通道、第二傳輸通道中的第一輸入通道相關(guān)的信息或參數(shù)輔助信息,來計算抵消通道;合并器,用于將抵消通道和第一傳輸通道或其處理版本合并,以獲得第二基本通道,與第一輸入通道對第一傳輸通道的影響相比,第二基本通道中第一輸入通道的影響減??;以及通道重構(gòu)器,用于使用第二基本通道和與第二輸入通道相關(guān)的參數(shù)輔助信息,來重構(gòu)與第二輸入通道相對應(yīng)的第二輸出通道,并使用不同于第二基本通道的第一基本通道和與第一輸入通道相關(guān)的參數(shù)輔助信息,來重構(gòu)與第一輸入通道相對應(yīng)的第一輸出通道,第一基本通道與第二基本通道的不同之處在于與第二基本通道相比,第一通道的影響更高。
      根據(jù)本發(fā)明的第二方面,該目的是由一種使用E個傳輸通道,并使用與輸入通道相關(guān)的參數(shù)輔助信息,產(chǎn)生具有K個輸出通道的多通道輸出信號的方法來實現(xiàn)的,該多通道輸出信號與具有C個輸入通道的多通道輸入信號相對應(yīng),所述E個傳輸通道表示以C個輸入通道作為輸入的下混操作的結(jié)果,其中E≥2,C>E,并且C≥K>1,并且,下混操作有效地在第一傳輸通道和第二傳輸通道中引入了第一輸入通道,還在第一傳輸通道中引入了第二輸入通道,所述方法包括使用與包括在第一傳輸通道、第二傳輸通道中的第一輸入通道相關(guān)的信息或參數(shù)輔助信息,來計算抵消通道;將抵消通道和第一傳輸通道或其處理版本合并,以獲得第二基本通道,與第一輸入通道對第一傳輸通道的影響相比,第二基本通道中第一輸入通道的影響減??;以及使用第二基本通道和與第二輸入通道相關(guān)的參數(shù)輔助信息,來重構(gòu)與第二輸入通道相對應(yīng)的第二輸出通道,并使用不同于第二基本通道的第一基本通道和與第一輸入通道相關(guān)的參數(shù)輔助信息,來重構(gòu)與第一輸入通道相對應(yīng)的第一輸出通道,第一基本通道與第二基本通道的不同之處在于與第二基本通道相比,第一通道的影響更高。
      根據(jù)本發(fā)明的第三方面,該目的是由具有程序代碼的計算機(jī)程序來實現(xiàn)的,當(dāng)在計算機(jī)上運(yùn)行所述程序時,所述程序代碼執(zhí)行產(chǎn)生多通道輸出信號的方法。
      這里要注意,優(yōu)選地,K與C相等。然而,還可以重構(gòu)更少的輸出通道,例如三個輸出通道L、R、C,而不重構(gòu)Ls和Rs。在這種情況下,K(=3)個輸出通道與原始C(=5)個中的三個輸入通道L、R、C相對應(yīng)。
      本發(fā)明是基于以下發(fā)現(xiàn)的為了改進(jìn)多通道輸出信號的聲音質(zhì)量,通過合并傳輸通道和在接收機(jī)或解碼器一端計算的抵消通道,來計算某個基本通道。計算抵消通道,使得通過合并抵消通道和傳輸通道而獲得的修改基本通道所具有的中央通道的影響減小,所述中央通道即引入兩個傳輸通道的通道。換句話說,與不計算這種抵消通道并且不將抵消通道合并到傳輸通道的情況相比,中央通道的影響減小,即引入兩個傳輸通道的通道(在執(zhí)行下混和隨后的上混操作時不可避免地發(fā)生)的影響減小。
      與現(xiàn)有技術(shù)相反,例如,并不將左傳輸通道簡單地用作用于重構(gòu)左或左環(huán)繞通道的基本通道。與之相反,通過與抵消通道合并,來修改左傳輸通道,使得在用于重構(gòu)左或右輸出通道的基本通道中原始中央通道的影響減小,甚至完全抵消。
      本發(fā)明中,在解碼器處,使用已經(jīng)在解碼器或多通道輸出發(fā)生器處出現(xiàn)的與原始中央通道有關(guān)的信息,來計算抵消通道。與中央通道有關(guān)的信息包括在左傳輸通道、右傳輸通道和參數(shù)輔助信息中,例如包括在中央通道的幅度差、時間差或相關(guān)性參數(shù)中。取決于某些實施例,可以將所有這些信息用于獲得高質(zhì)量的中央通道抵消。然而,在其它更低級的實施例中,僅使用與中央輸入通道有關(guān)的這些信息中的一部分。該信息可以是左傳輸通道、右傳輸通道或參數(shù)輔助信息。此外,還可以使用在編碼器中估計并發(fā)送到解碼器的信息。
      因此,在5-to-2情況下,不直接將左傳輸通道或右傳輸通道用于左和右重構(gòu),而是通過與抵消通道合并來修改,以獲得修改的基本通道,修改的基本通道不同于相應(yīng)的傳輸通道。優(yōu)選地,還將取決于在編碼器處執(zhí)行以產(chǎn)生傳輸通道的下混操作的附加加權(quán)因子包括在抵消通道計算機(jī)中。在5-to-2情況下,計算至少兩個抵消通道,從而每個傳輸通道可以與指定的抵消通道合并,以分別獲得用于重構(gòu)左和左環(huán)繞輸出通道以及右和右環(huán)繞輸出通道的修改的基本通道。
      本發(fā)明可以并入多個系統(tǒng)或應(yīng)用程序,所述系統(tǒng)包括例如數(shù)字視頻播放器、數(shù)字音頻播放器、計算機(jī)、衛(wèi)星接收機(jī)、電纜接收機(jī)、地面廣播接收機(jī)和家庭娛樂系統(tǒng)。


      下面,通過參考附圖來描述本發(fā)明的優(yōu)選實施例,附圖中圖1是產(chǎn)生傳輸通道和與輸入通道有關(guān)的參數(shù)輔助信息的多通道編碼器的方框圖;圖2是根據(jù)本發(fā)明的用于產(chǎn)生多通道輸出信號的優(yōu)選裝置的示意方框圖;圖3是根據(jù)本發(fā)明第一實施例的本發(fā)明裝置的示意圖;圖4是圖3的優(yōu)選實施例的電路實現(xiàn);圖5a是根據(jù)本發(fā)明第二實施例的本發(fā)明裝置的方框圖;圖5b是圖5a所示的動態(tài)上混的數(shù)學(xué)表達(dá);圖6a是用于示出下混操作的總圖;圖6b是用于實現(xiàn)圖6a的下混操作的電路圖;圖6c是下混操作的數(shù)學(xué)表達(dá);圖7a是在立體聲兼容情況下用于指示用于上混的基本通道的示意圖;圖7b是在立體聲兼容情況下用于實現(xiàn)多通道重構(gòu)的電路圖;圖7c是在圖7b中使用的上混矩陣的數(shù)學(xué)表達(dá);圖7d是每個通道的幅度修改以及隨后的整體歸一化的數(shù)學(xué)表達(dá);圖8示出了編碼器;圖9示出了解碼器;圖10示出了現(xiàn)有技術(shù)的聯(lián)合立體聲編碼器;圖11是現(xiàn)有技術(shù)的BCC編碼器/解碼器系統(tǒng)的方框圖表示;圖12是圖11的BCC合成塊的現(xiàn)有技術(shù)的實現(xiàn)的方框圖;以及圖13是用于確定ICLD、ICTD和ICC參數(shù)的公知方案的表示。
      具體實施例方式
      在給出優(yōu)選實施例的詳細(xì)描述之前,總括地描述本發(fā)明的問題和解決該問題的解決方案。用于改進(jìn)重構(gòu)輸出通道的聽覺空間圖像的本發(fā)明技術(shù)適用于在C-to-E參數(shù)多通道系統(tǒng)中將輸入通道混入多于一個傳輸通道的所有情況。優(yōu)選實施例是在技術(shù)心理聲學(xué)編碼(BCC)系統(tǒng)中的本發(fā)明的實現(xiàn)。為了簡化討論,但是不喪失一般性,針對以后向兼容方式來編碼/解碼5.1環(huán)繞信號的BCC方案的特定情況,來描述本發(fā)明的技術(shù)。
      上述聽覺圖像寬度減小的問題多數(shù)發(fā)生在包含來自不同方向的獨立快速重復(fù)瞬變的音頻信號中,例如在任意一種現(xiàn)場錄音中的聽眾的歡呼信號。盡管原理上可以通過使用ICLD合成的更高時間分辨率來解決圖像寬度減小的問題,但是這會導(dǎo)致增加的輔助信息速率,并且還需要改變所使用的分析/合成濾波器組的窗的大小。這里要注意,由于時間分辨率的增加自動地意味著頻率分辨率的減小,這還可能導(dǎo)致對音調(diào)分量的負(fù)面影響。
      然而,本發(fā)明是一種簡單的概念,沒有這些缺點,并且目的在于減小輔助通道中中央通道信號分量的影響。
      如結(jié)合圖7a-7d所討論的,5-to-2 BCC的五個重構(gòu)輸出通道的基本通道是S1~(k)=y1~(k)=x1~(k)+x3~(k)/2+x4~(k)]]>s2~(k)=y2~(k)=x2~(k)+x3~(k)/2+x5~(k)]]>s3~(k)=y1~(k)+y2~(k)=x1~(k)+x2~(k)+2x3~(k)+x4~(k)+x5~(k)]]>s4~(k)=s1~(k)]]>s5~(k)=s2~(k)]]>注意,原始中央通道信號分量x3在中央基本通道子帶s3(因子1/)中表現(xiàn)出3dB的放大,并且在剩下(輔助通道)基本通道子帶中表現(xiàn)出3dB的衰減。
      根據(jù)本發(fā)明,為了進(jìn)一步減小輔助基本通道子帶中中央通道信號分量的影響,如圖2所示,應(yīng)用下面的一般概念。
      優(yōu)選地,通過將最終解碼的中央通道信號縮放為由相應(yīng)幅度信息(例如BCC情況下的ICLD值)描述的希望目標(biāo)幅度,來計算最終解碼的中央通道信號的估計。優(yōu)選地,在譜域計算該解碼中央信號,以便節(jié)省計算,即不應(yīng)用合成濾波器組的處理。
      此外,可以加權(quán)與抵消通道相對應(yīng)的該中央解碼信號或中央重構(gòu)信號,然后合并到其它輸出通道的兩個基本通道信號中。優(yōu)選地,該合并是減法。然而,當(dāng)加權(quán)因子具有不同的符號時,加法也會導(dǎo)致在用于重構(gòu)左或右輸出通道的基本通道中中央通道的影響的減小。該處理會形成用于重構(gòu)左和左環(huán)繞或者用于重構(gòu)右或右環(huán)繞的修改的基本通道。優(yōu)選地,-3dB的加權(quán)因子是優(yōu)選的,但是任意其它的值也是可以的。
      代替在圖7b中使用的原始傳輸基本通道信號,將修改的基本通道信號用于計算其它輸出通道(即除了中央通道之外的通道)的解碼輸出通道。
      下面,參考圖2來討論本發(fā)明概念的方框圖。圖2示出了用于產(chǎn)生具有K個輸出通道的多通道輸出信號的裝置,該多通道輸出信號與具有C個輸入通道的多通道輸入信號相對應(yīng),使用E個傳輸通道(所述E個傳輸通道表示以C個輸入通道作為輸入的下混操作的結(jié)果),并使用與輸入通道相關(guān)的參數(shù)輔助信息,其中C≥2,C>E,并且C≥K>1。并且,下混操作有效地在第一傳輸通道和第二傳輸通道中引入了第一輸入通道。本發(fā)明的裝置包括抵消通道計算器20,用于計算輸入合并器22的至少一個抵消通道21,合并器22在第二輸入23處直接接收第一傳輸通道或接收第一傳輸通道的處理版本。通過處理器24來執(zhí)行對第一傳輸通道的處理以獲得第一傳輸通道的處理版本,在一些實施例中,處理器24可以出現(xiàn),但是通常情況下,處理器24是可選的。合并器操作用于獲得輸入通道重構(gòu)器26的第二基本通道25。
      通道重構(gòu)器使用第二基本通道25和在另一輸入27處輸入通道重構(gòu)器26的與原始左輸入通道有關(guān)的參數(shù)輔助信息,來產(chǎn)生第二輸出通道。在通道重構(gòu)器的輸出處,獲得第二輸出通道28,第二輸出通道28可能是重構(gòu)的左輸出通道,而在圖7b的場景中,左輸出通道是由基本通道產(chǎn)生的,與圖7b的情況相比,原始輸入中央通道的影響較小或完全抵消。
      盡管如圖7b所示所產(chǎn)生的左輸出通道包括如上所述的特定影響,在如圖2所示所產(chǎn)生的第二基本通道中,由于抵消通道和第一傳輸通道或處理的第一傳輸通道的合并,這種特定的影響減小了。
      如圖2所示,抵消通道計算機(jī)20使用解碼器處可用的與原始中央通道有關(guān)的信息,即用于產(chǎn)生多通道輸出信號的信息,來計算抵消通道。該信息包括與第一輸入通道30有關(guān)的參數(shù)輔助信息,或者包括第一傳輸通道31(由于下混操作還包括與中央通道有關(guān)的一些信息),或者包括第二傳輸通道32(由于下混操作還包括與中央通道有關(guān)的信息)。優(yōu)選地,將所有這些信息用于中央通道的最佳重構(gòu)以獲得抵消通道21。
      下面將參考圖3和4來描述這種最佳實施例。與圖2相反,圖3示出了圖2的2折(2-fold)設(shè)備,即用于抵消左基本通道s1中以及右基本通道s2中中央通道的影響的設(shè)備。圖2的抵消通道計算器20包括中央通道重構(gòu)設(shè)備20a和加權(quán)設(shè)備20b,以在加權(quán)設(shè)備的輸出處獲得抵消通道21。圖2中的合并器22是簡單的減法器,操作用于從第一傳輸通道21中減去抵消通道21以獲得用于重構(gòu)第二輸出通道(例如左輸出通道)以及可選的左環(huán)繞輸出通道的第二基本通道25(就圖2而言)??梢栽谥醒胪ǖ乐貥?gòu)設(shè)備20a的輸出處獲得重構(gòu)的中央通道x3(k)。
      圖4示出了實現(xiàn)為電路圖的優(yōu)選實施例,其使用參考圖3所討論的技術(shù)。此外,圖4示出了最適用于并入直接頻率選擇性BCC重構(gòu)設(shè)備的頻率選擇性處理。
      通過在求和器40中對兩個傳輸通道求和,來進(jìn)行中央通道重構(gòu)26。然后,將通道幅度差的參數(shù)輔助信息或者如在圖7d中所討論的從通道間幅度差推導(dǎo)出的因子a3用于產(chǎn)生在圖2中在第一基本通道輸入29處輸入通道重構(gòu)器26的第一基本通道的修改版本(就圖2而言)??梢詫⒃诔朔ㄆ?1的輸出處的重構(gòu)中央通道用于中央通道輸出重構(gòu)(在圖7d中描述的通用歸一化之后)。
      為了確認(rèn)在用于左和右重構(gòu)的基本通道中中央通道的影響,應(yīng)用在圖4中由乘法器42示出的加權(quán)因子1/。然后,將重構(gòu)且再次加權(quán)的中央通道反饋到與圖2中合并器22相對應(yīng)的求和器43a和43b。
      因此,第二基本通道s1或s4(或者s2或s3)與傳輸通道y1的不同在于與圖7b中的情況相比,中央通道的影響減小了。
      產(chǎn)生的基本通道子帶以數(shù)學(xué)表達(dá)給出如下
      s1~(k)=y1~(k)-a3(k)(y~1(k)+y2~(k))/2]]>s2~(k)=y2~(k)-a3(k)(y1~(k)+y2~(k))/2]]>s3~(k)=y1~(k)+y2~(k)]]>s4~(k)=s1~(k)]]>s5~(k)=s2~(k)]]>因此,圖4的設(shè)備提供了從輔助通道的基本通道減去中央通道子帶估計以便提高通道之間的獨立性,從而提供重構(gòu)的輸出多通道信號的更好的空間寬度。
      根據(jù)下面將參考圖5a和圖5b描述的本發(fā)明另一實施例,確定與在圖3中計算的抵消通道不同的抵消通道。與圖3/圖4實施例相反,用于計算第二基本通道s1(k)的抵消通道21不是從第一傳輸通道以及第二傳輸通道中推導(dǎo)出的,而是使用在圖5a中由乘法設(shè)備51示出的特定加權(quán)因子x_lr,僅從第二傳輸通道y2(k)中推導(dǎo)出的。因此,圖5a中的抵消通道21與圖3中的抵消通道不同,但是也有助于減小中央通道對用于重構(gòu)第二輸出通道(即左輸出通道x1(k))的基本通道s1(k)的影響。
      在圖5a的實施例中,還示出了處理器24的優(yōu)選實施例。具體地,處理器24實現(xiàn)為另一乘法設(shè)備52,其通過乘法因子(1-x_lr)來應(yīng)用乘法。優(yōu)選地,如圖1a所示,處理器24應(yīng)用于第一傳輸通道的乘法因子取決于乘法因子51,乘法因子51用于與第二傳輸通道相乘以獲得抵消通道21。最后,將合并器22的輸入23處的第一傳輸通道的處理版本用于合并,所述合并包括從第一傳輸通道的處理版本中減去抵消通道21。所有這些再次產(chǎn)生第二基本通道25,該第二基本通道25具有原始中央輸入通道的減小的或完全抵消的影響。
      如圖5a所示,重復(fù)相同的過程,以在右/右環(huán)繞重構(gòu)設(shè)備的輸入處獲得第三基本通道s2(k)。然而,如圖5a所示,通過將第二傳輸通道y(k)的處理版本與另一抵消通道53合并而獲得第三基本通道s2(k),所述另一抵消通道53是通過在具有乘法因子x_r1的乘法設(shè)備54中的乘法、從第一傳輸通道y1(k)中推導(dǎo)出的,x_r1可以與設(shè)備51的x_lr相等,但是也可以與之不同。如圖5a所示處理第二傳輸通道的處理器是乘法設(shè)備55。在圖5a中,由參考數(shù)字56表示用于將第二抵消通道53和第二傳輸通道y2(k)的處理版本合并的合并器。圖2的抵消通道計算器還包括用于計算抵消系數(shù)的設(shè)備,在圖5a中由參考數(shù)字57表示該設(shè)備。設(shè)備57操作用于獲得如通道間幅度差等的與原始或輸入中央通道有關(guān)的參數(shù)輔助信息。圖3中的設(shè)備20a也是一樣的,但是中央通道重構(gòu)設(shè)備20a還包括用于接收如幅度值或通道間幅度差等的參數(shù)輔助信息的輸入。
      下面的方程s1~(k)=y1~(k)-a3(k)(y1~(k)+y2~(k))/2=(1-a32)y1~(k)-a32y2~(k)]]>s2~(k)=y2~(k)-a3(k)(y1~(k)+y2~(k))/2=(1-a32)y2~(k)-a32y1~(k)]]>Xlr=Xrl=a32]]>示出了圖5a的實施例的數(shù)學(xué)描述,并在其右側(cè),一方面示出了抵消通道計算器中的抵消處理,另一方面還示出了處理器(圖2中的21、24)。在此所示的該特定實施例中,因子x_lr和x_rl彼此相等。
      以上實施例清楚地顯示出,本發(fā)明包括重構(gòu)基本通道由左和右傳輸通道的信號自適應(yīng)線性合并組成的結(jié)構(gòu)。圖5a中示出了這種拓?fù)浣Y(jié)構(gòu)。
      從不同角度看,本發(fā)明的設(shè)備還可以理解為動態(tài)上混過程,其中針對每個子帶和每個時刻k使用不同上混矩陣。圖5b示出了這種動態(tài)上混矩陣。注意,對于每個子帶,即對于圖4中濾波器組設(shè)備的每個輸出,存在這樣的上混矩陣U。關(guān)于時間相關(guān)的方式,注意,圖5b包括時間索引k。當(dāng)具有針對每個時間索引的幅度信息時,上混矩陣將在每個時刻之間不同。然而,當(dāng)將相同的幅度信息a3用于由輸入濾波器組FB變換為頻率表達(dá)的整個值塊時,則對于例如1024或2048個采樣值的整個塊,將出現(xiàn)一個值a3。在這種情況下,上混矩陣將沿時間方向在不同塊之間改變,而不是在不同值之間改變。然而,存在用于平滑參數(shù)幅度值的技術(shù),使得可以在特定頻率波段中的上混期間獲得不同幅度的修改因子a3。
      一般而言,還可以使用不同的計算輸出中央通道的因子和“動態(tài)上混”的因子,這產(chǎn)生作為上述a3的縮放版本的因子a3。
      在優(yōu)選實施例中,通過輔助信息從編碼器至解碼器的確切傳輸,自適應(yīng)地控制中央分量抵消的加權(quán)強(qiáng)度。在這種情況下,圖2所示的抵消通道計算器20還包括控制輸入,所述控制輸入接收計算用于指示左和中央通道或者右和中央通道之間的直接相互關(guān)聯(lián)的顯式控制信號。在這點上,該控制信號將不同于中央通道和左通道之間的幅度差,因為這些幅度差與一種虛擬基準(zhǔn)通道相關(guān),該虛擬基準(zhǔn)通道可以是第一傳輸通道中的能量和和第二傳輸通道中的能量和,如圖7d頂部所示。
      這種控制參數(shù)例如可以指示中央通道低于閾值,且正在逼進(jìn)0,而在左或右通道中存在高于閾值的信號。在這種情況下,抵消通道計算器對于相應(yīng)控制信號的足夠反應(yīng)是關(guān)閉通道抵消,并應(yīng)用如圖7b所示的正常上混方案,以避免輸入中不存在的中央通道的“過抵消”。關(guān)于這一點,這是如上所述的控制加權(quán)強(qiáng)度的一種極端情況。
      優(yōu)選地,從圖4可知,并不執(zhí)行時間延遲處理操作用于計算重構(gòu)中央通道。這在不必考慮任何時間延遲的反饋工作中是有利的。然而,當(dāng)原始中央通道用作用于計算時間差di的基準(zhǔn)通道時,這可以不損失質(zhì)量地獲得。對于任何相關(guān)性度量也是如此。優(yōu)選地,不執(zhí)行任何相關(guān)性處理用于重構(gòu)中央通道。取決于相關(guān)性計算的類型,當(dāng)原始中央通道用作任何相關(guān)性參數(shù)的基準(zhǔn)時,這可以不損失質(zhì)量地獲得。
      注意,本發(fā)明不取決于特定下混方案。這意味著可以使用自動下混或者由音響工程師執(zhí)行的手動下混方案。甚至可以使用自動產(chǎn)生的參數(shù)信息以及手動產(chǎn)生的下混通道。
      取決于應(yīng)用環(huán)境,本發(fā)明的構(gòu)成或產(chǎn)生方法可以以硬件或軟件實現(xiàn)。實現(xiàn)方式可以是數(shù)字存儲介質(zhì),例如具有電可讀控制信號的盤或CD,這種介質(zhì)可以與可編程計算機(jī)系統(tǒng)協(xié)作,以便可以執(zhí)行本發(fā)明的方法。因此,一般而言,本發(fā)明還涉及一種計算機(jī)程序產(chǎn)品,具有存儲在機(jī)器可讀載體上的程序代碼,當(dāng)計算機(jī)程序產(chǎn)品在計算機(jī)上運(yùn)行時,該程序代碼適用于執(zhí)行本發(fā)明的方法。因此,換言之,本發(fā)明還涉及一種具有程序代碼的計算機(jī)程序,當(dāng)計算機(jī)程序在計算機(jī)上運(yùn)行時,所述程序代碼用于執(zhí)行這些方法。
      本發(fā)明可以與多種不同的應(yīng)用程序或系統(tǒng)結(jié)合或與之合并,這些系統(tǒng)包括電視系統(tǒng)或電子音樂分發(fā)系統(tǒng)、廣播、流和/或接收系統(tǒng)。這些系統(tǒng)包括用于通過例如地面、衛(wèi)星、電纜、互聯(lián)網(wǎng)、內(nèi)聯(lián)網(wǎng)或物理介質(zhì)(例如壓縮盤、數(shù)字多媒體盤、半導(dǎo)體芯片、硬盤驅(qū)動器、存儲卡等)的解碼/編碼傳輸?shù)南到y(tǒng)。本發(fā)明還可以在游戲系統(tǒng)中采用,所述游戲系統(tǒng)包括例如交互式軟件產(chǎn)品,意欲與想要娛樂(動作、角色扮演、戰(zhàn)略、冒險、模仿、競賽、運(yùn)動、娛樂廳、紙牌和棋盤游戲)和/或想要在多個機(jī)器、平臺或媒介上發(fā)布的教育的用戶進(jìn)行交互。此外,本發(fā)明可以并入音頻播放器或CD-ROM/DVD系統(tǒng)。本發(fā)明還可以并入包括數(shù)字解碼能力的PC軟件應(yīng)用程序(例如播放器、解碼器)和包括數(shù)字編碼能力的軟件應(yīng)用程序(例如編碼器、ripper、記錄器和點播機(jī))。
      權(quán)利要求
      1.一種裝置,用于使用E個傳輸通道,并使用與輸入通道相關(guān)的參數(shù)信息,產(chǎn)生具有K個輸出通道的多通道輸出信號,該多通道輸出信號與具有C個輸入通道的多通道輸入信號相對應(yīng),所述E個傳輸通道表示以C個輸入通道作為輸入的下混操作的結(jié)果,其中E≥2,C>E,并且C≥K>1,并且,下混操作有效地在第一傳輸通道和第二傳輸通道中引入了第一輸入通道,還在第一傳輸通道中引入了第二輸入通道,所述裝置包括抵消通道計算器(20),用于使用與包括在第一傳輸通道、第二傳輸通道中的第一輸入通道相關(guān)的信息或參數(shù)信息,來計算抵消通道(21);合并器(23),用于將抵消通道(21)和第一傳輸通道(23)或其處理版本合并,以獲得第二基本通道(25),與第一輸入通道對第一傳輸通道的影響相比,第二基本通道中第一輸入通道的影響減?。灰约巴ǖ乐貥?gòu)器(26),用于使用第二基本通道和與第二輸入通道相關(guān)的參數(shù)信息,來重構(gòu)與第二輸入通道相對應(yīng)的第二輸出通道,并使用不同于第二基本通道的第一基本通道和與第一輸入通道相關(guān)的參數(shù)信息,來重構(gòu)與第一輸入通道相對應(yīng)的第一輸出通道,第一基本通道與第二基本通道的不同之處在于與第二基本通道相比,第一通道的影響更高。
      2.根據(jù)權(quán)利要求1所述的裝置,其中,合并器(22)操作用于從第一傳輸通道或其處理版本減去抵消通道。
      3.根據(jù)權(quán)利要求1或2所述的裝置,其中,抵消通道計算器(20)操作用于使用第一傳輸通道和第二傳輸通道,來計算第一輸入通道的估計,以獲得抵消通道(21)。
      4.根據(jù)權(quán)利要求1至3之一所述的裝置,其中,參數(shù)信息包括第一輸入通道和基準(zhǔn)通道之間的差值參數(shù),并且抵消通道計算器(20)操作用于計算第一傳輸通道和第二傳輸通道之和,并且使用所述差值參數(shù)來加權(quán)所述和。
      5.根據(jù)權(quán)利要求1至4之一所述的裝置,其中,下混操作使得第一輸入通道在縮放了下混因子之后被引入第一傳輸通道,并且抵消通道計算器(20)操作用于使用縮放因子來縮放第一和第二傳輸通道之和,其中所述縮放因子取決于所述下混因子。
      6.根據(jù)權(quán)利要求5所述的裝置,其中,加權(quán)因子等于下混因子。
      7.根據(jù)權(quán)利要求1至6之一所述的裝置,其中,抵消通道計算器(20)操作用于確定第一和第二傳輸通道之和,以獲得第一基本通道。
      8.根據(jù)權(quán)利要求1至7之一所述的裝置,還包括處理器(24),處理器(24)操作用于通過使用第一加權(quán)因子來加權(quán),以處理第一傳輸通道,并且抵消通道計算器(20)操作用于使用第二加權(quán)因子來加權(quán)第二傳輸通道。
      9.根據(jù)權(quán)利要求8所述的裝置,其中,參數(shù)信息包括第一輸入通道和基準(zhǔn)通道之間的差值參數(shù),并且抵消通道計算器(20)操作用于根據(jù)差值參數(shù)來確定第二加權(quán)因子。
      10.根據(jù)權(quán)利要求8或9所述的裝置,其中,第一加權(quán)因子等于(1-h),其中h是實數(shù)值,并且第二加權(quán)因子等于h。
      11.根據(jù)權(quán)利要求10所述的裝置,其中,參數(shù)信息包括幅度差值,并且h是從參數(shù)幅度差值推導(dǎo)出的。
      12.根據(jù)權(quán)利要求11所述的裝置,其中,h等于從除以基于下混操作的因子的幅度差中推導(dǎo)出的值。
      13.根據(jù)權(quán)利要求10所述的裝置,其中,參數(shù)信息包括第一通道和基準(zhǔn)通道之間的幅度差,并且h等于1√2×10L/20,其中L是幅度差。
      14.根據(jù)權(quán)利要求1至13之一所述的裝置,其中,參數(shù)信息還包括基于第一輸入通道和第二輸入通道之間的關(guān)系的控制信號,以及抵消通道計算器(20)由所述控制信號控制,以主動地增加或減少抵消通道的能量,或者甚至使抵消通道計算完全失效。
      15.根據(jù)權(quán)利要求1至14之一所述的裝置,其中,下混操作還操作用于將第三輸入通道引入第二傳輸通道,所述裝置還包括另一合并器,用于將抵消通道和第二傳輸通道或其處理版本合并以獲得第三基本通道,與第一輸入通道對第二傳輸通道的影響相比,第三基本通道中第一輸入通道的影響減??;以及通道重構(gòu)器,用于使用第三基本通道和與第三輸入通道相關(guān)的參數(shù)信息,來重構(gòu)與第三輸入通道相對應(yīng)的第三輸出通道。
      16.根據(jù)權(quán)利要求1至15之一所述的裝置,其中,參數(shù)信息包括通道間幅度差、通道間時間差、通道間相位差或通道間相關(guān)性值,以及通道重構(gòu)器(26)操作用于對基本通道應(yīng)用上述組參數(shù)中的任意一個,來獲得粗略的輸出通道。
      17.根據(jù)權(quán)利要求16所述的裝置,其中,通道重構(gòu)器(26)操作用于縮放粗略的輸出通道,使得最終重構(gòu)的輸出通道中的總能量與E個傳輸通道的總能量相等。
      18.根據(jù)權(quán)利要求1至17之一所述的裝置,其中,以波段方式給出參數(shù)信息,并且抵消通道計算器(20)、合并器(22)和通道重構(gòu)器(26)操作用于使用以波段方式給出的參數(shù)信息,來處理多個波段,以及所述裝置還包括時間/頻率轉(zhuǎn)換單元(IFB),用于將傳輸通道轉(zhuǎn)換為具有頻率波段的頻率表達(dá);以及頻率/時間轉(zhuǎn)換單元,用于將重構(gòu)的頻率波段轉(zhuǎn)換為時域。
      19.根據(jù)權(quán)利要求1至18之一所述的裝置,還包括選自以下組中的系統(tǒng)數(shù)字視頻播放器、數(shù)字音頻播放器、計算機(jī)、衛(wèi)星接收機(jī)、電纜接收機(jī)、地面廣播接收機(jī)和家庭娛樂系統(tǒng);以及所述系統(tǒng)包括通道計算器、合并器和通道重構(gòu)器。
      20.一種方法,使用E個傳輸通道,并使用與輸入通道相關(guān)的參數(shù)信息,產(chǎn)生具有K個輸出通道的多通道輸出信號,該多通道輸出信號與具有C個輸入通道的多通道輸入信號相對應(yīng),所述E個傳輸通道表示以C個輸入通道作為輸入的下混操作的結(jié)果,其中E≥2,C>E,并且C≥K>1,并且,下混操作有效地在第一傳輸通道和第二傳輸通道中引入了第一輸入通道,還在第一傳輸通道中引入了第二輸入通道,所述方法包括使用與包括在第一傳輸通道、第二傳輸通道中的第一輸入通道相關(guān)的信息或參數(shù)信息,來計算(20)抵消通道;將抵消通道和第一傳輸通道或其處理版本合并(22),以獲得第二基本通道,與第一輸入通道對第一傳輸通道的影響相比,第二基本通道中第一輸入通道的影響減??;以及使用第二基本通道和與第二輸入通道相關(guān)的參數(shù)信息,來重構(gòu)(26)與第二輸入通道相對應(yīng)的第二輸出通道,并使用不同于第二基本通道的第一基本通道和與第一輸入通道相關(guān)的參數(shù)信息,來重構(gòu)與第一輸入通道相對應(yīng)的第一輸出通道,第一基本通道與第二基本通道的不同之處在于與第二基本通道相比,第一通道的影響更高。
      21.一種具有程序代碼的計算機(jī)程序,當(dāng)在計算機(jī)上運(yùn)行所述程序時,所述程序代碼實現(xiàn)一種方法,所述方法使用E個傳輸通道,并使用與輸入通道相關(guān)的參數(shù)信息,產(chǎn)生具有K個輸出通道的多通道輸出信號,該多通道輸出信號與具有C個輸入通道的多通道輸入信號相對應(yīng),所述E個傳輸通道表示以C個輸入通道作為輸入的下混操作的結(jié)果,其中E≥2,C>E,并且C≥K>1,并且,下混操作有效地在第一傳輸通道和第二傳輸通道中引入了第一輸入通道,還在第一傳輸通道中引入了第二輸入通道,所述方法包括使用與包括在第一傳輸通道、第二傳輸通道中的第一輸入通道相關(guān)的信息或參數(shù)信息,來計算(20)抵消通道;將抵消通道和第一傳輸通道或其處理版本合并(22),以獲得第二基本通道,與第一輸入通道對第一傳輸通道的影響相比,第二基本通道中第一輸入通道的影響減小;以及使用第二基本通道和與第二輸入通道相關(guān)的參數(shù)信息,來重構(gòu)(26)與第二輸入通道相對應(yīng)的第二輸出通道,并使用不同于第二基本通道的第一基本通道和與第一輸入通道相關(guān)的參數(shù)信息,來重構(gòu)與第一輸入通道相對應(yīng)的第一輸出通道,第一基本通道與第二基本通道的不同之處在于與第二基本通道相比,第一通道的影響更高。
      全文摘要
      一種產(chǎn)生多通道輸出信號的裝置,執(zhí)行中央通道抵消,以獲得改進(jìn)的用于重構(gòu)左側(cè)輸出通道或右側(cè)輸出通道的基本通道。具體地,該裝置包括抵消通道計算器(20),用于使用與在解碼器處可用的原始中央通道相關(guān)的信息來計算抵消通道。該設(shè)備還包括合并器(22),用于將傳輸通道與抵消通道合并。最后,該裝置包括重構(gòu)器(26),用于產(chǎn)生多通道輸出信號。由于中央通道抵消,通道重構(gòu)器(26)不僅使用不同基本通道來重構(gòu)中央通道,還使用與傳輸通道不同的基本通道來重構(gòu)左和右輸出通道,所述左和右輸出通道具有原始中央通道的減小或甚至完全抵消的影響。
      文檔編號G10L19/00GK1985303SQ200580023131
      公開日2007年6月20日 申請日期2005年5月12日 優(yōu)先權(quán)日2004年7月9日
      發(fā)明者于爾根·赫勒, 克里斯托弗·法勒, 薩沙·迪施, 約翰內(nèi)斯·希爾珀特 申請人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會, 杰爾系統(tǒng)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1