專利名稱:能量保留多通道音頻編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻編碼方法和相應的音頻解碼方法,以及音頻編碼器和相應的音頻解碼器。
背景技術(shù):
對提供基于分組交換網(wǎng)絡的電信服務的需求正在顯著地增加,且該需求在當今比以往任何時候都更強。同時,在要發(fā)送的媒體內(nèi)容中存在日益增長的多樣性,包括不同的帶寬、單聲道和立體聲聲音以及語音和音樂信號。多個標準化組織付出大量努力來定義靈活和有效的用于向用戶傳輸混合內(nèi)容的解決方案。顯著地,兩個主要的挑戰(zhàn)依然等待著解決方案。首先,所部署的網(wǎng)絡技術(shù)和用戶設(shè)備的多樣性暗示著由于傳輸網(wǎng)絡的不同屬性,因此向不同用戶提供的相同設(shè)備可能具有不同的用戶感知質(zhì)量。其次,通信設(shè)備必須適應廣泛的媒體內(nèi)容。當前,語音和音樂發(fā)送依然屬于不同的范式(paradigm),且對于可以向所有類型音頻信號提供良好質(zhì)量的服務,存在要填補的差距。當今,可擴縮的音視頻以及通常的媒體內(nèi)容編解碼是可用的,實際上,MPEG的早期設(shè)計指南從開始就是可擴縮的。然而,盡管這些編解碼由于它們的功能而具有吸引力,它們?nèi)鄙僭诘捅忍芈氏逻\行的效率,這與當前的大量市場的無線設(shè)備不相符。隨著無線通信的更高滲透,需要更復雜的可擴縮編解碼。已經(jīng)認識到了該事實,且預期新的編解碼將要在不遠的將來出現(xiàn)。盡管對自適應服務和可擴縮編解碼付出了巨大努力,可擴縮服務將不會出現(xiàn),除非對傳輸問題給予更多的關(guān)注。因此,除了有效的編解碼之外,必須將恰當?shù)木W(wǎng)絡架構(gòu)和傳輸框架認為是完全利用服務傳輸中的可擴縮性的使能技術(shù)?;旧?,可以考慮三種場景 在端點處的自適應。即,如果必須選擇較低的發(fā)送速率,則通知發(fā)送方,且其執(zhí)行擴縮或編解碼改變。 在中間網(wǎng)關(guān)處的自適應。如果網(wǎng)絡的一部分變得阻塞,或具有不同的服務能力, 如圖1所示的專用網(wǎng)絡實體執(zhí)行服務的譯碼。在可擴縮編解碼的情況下,這可以簡單如丟棄或截斷媒體幀一樣。 網(wǎng)絡中的自適應。如果路由器或無線接口變得阻塞,則就在發(fā)生問題的地方通過丟棄或截斷分組來執(zhí)行自適應。這是瞬變問題所需的解決方案,例如對無線鏈路的嚴重業(yè)務脈沖或通道質(zhì)量變化的處理。以下,給出了根據(jù)現(xiàn)有技術(shù)的語音和音頻的可擴縮編解碼的概覽。還給出對立體聲編碼概念的總體背景??蓴U縮咅頻編碼非會話,流傳輸/下載總體上,當前的音頻研究趨勢是提高低比特率的壓縮率(提供以321APS以下比特率的足夠良好的立體聲質(zhì)量)。最近的低比特率音頻提高是對MPEG中的參數(shù)化立體聲(PS) 工具開發(fā)的定案,對3GPP中的混合CELP/和變換編解碼擴展AMR-WB (稱為AMW-WB+)的標準化。還存在正在進行的對空間音頻編碼(環(huán)繞立體聲/5.1內(nèi)容)的MPEG標準化活動, 其中已經(jīng)選擇了第一參考模型(RMO) [4]0與可擴縮音頻編碼相關(guān)的,MPEG中的近期標準化成就已經(jīng)導致了對無損擴展工具的可擴縮MPEG4-SLS。MPEG4-SLS 一直向核心AAC/BSAC提供了漸進的增強,直至具有低至 0. 4kbps粒度步長的無損。依然需要定義SLS的音頻對象類型(AOT)。在MPEG中,在2005 年1月還發(fā)布了針對信息的呼叫(CfI) [1],其目標是可擴縮語音和音頻編碼領(lǐng)域,在CfI中解決的主要問題是可擴縮性、在內(nèi)容類型間(例如語音和音樂)一致的性能以及在低比特率(<MlibpS)的編碼質(zhì)量。之后,放棄了可擴縮部分,現(xiàn)在工作的目標是以各種比特率運行的不具有嵌入式可擴縮性的編解碼。語音編碼(會話單聲道)概要在一般語音壓縮中,最近的標準化成就是對3GPP2/VMR-WB編解碼的擴展,以支持最大比特率8. 55kbps的操作。在ITU-T中,先前已經(jīng)用以24、32和481cbpS提供操作的超寬帶(14kHz音頻帶寬,32kHz采樣)能力的兩種新的模式來更新了多速率G. 722. 1音頻/ 視頻會議編解碼。其它的標準化成就的目標是添加將帶寬擴展到48kHz全頻帶編碼的附加模式。最終結(jié)果是新的獨立編解碼G. 719,其提供了從32到USlAps的具有161ApS步長的低復雜度全頻帶編碼。關(guān)于可擴縮會話語音編碼,主要的標準化成就發(fā)生在ITU-T中(工作組3,研究組 16)。在2006年5月,對G. 729的可擴縮擴展進行了標準化,稱作G. 729. 1。該擴展可從8 至321ibps以21ibps的粒度步長自121ibps進行擴縮。G. 729. 1的主要目標應用是在共享和帶寬有限的xDSL-鏈路上的會話語音,即該擴縮有可能發(fā)生在將VoIP分組通過特定受控語音通道(Vc)進行傳遞的數(shù)字住宅網(wǎng)關(guān)中。ITU-T最近(2008年9月)還批準了對完全新的可擴縮會話編解碼G. 718的建議。該編解碼包括8. Okbps的核心速率和321ibps的最大速率,同時擴縮步長是12. 0,16. 0以及24. Okbps0 G. 718核心是從VMR-WB繼承的WB語音編解碼,但是也通過上采樣至核心采樣率處理NB輸入信號。當前在ITU-T(工作組3,研究組 16,問題23)正在標準化將帶來超寬帶和立體聲能力(32kHz采樣/1個通道)的G. 718和 G. 729. 1編解碼的聯(lián)合擴展。在2008年7月認證周期結(jié)束。SNR可擴縮性SNR可擴縮性的原理是隨著比特或?qū)拥臄?shù)目的增加而增加SNR。兩個先前提到的語音編解碼G. 729. 1和G. 718具有該特征。一般地,這通過對來自先前層的編碼殘余進行逐步重新編碼來實現(xiàn)。由于可以通過簡單地丟棄上層以對較低的比特率解碼,因此該嵌入式分層結(jié)構(gòu)是有吸引力的。然而,當考慮到較高比特率時該嵌入式分層可能不是最優(yōu)的,且分層編解碼通常比相同比特率的固定比特率編解碼表現(xiàn)更糟。此處可以提到的其它編解碼是 SNR 可擴縮 MPEG4-CELP 和 G. 727 (嵌入式 ADPCM)。帶寬可擴縮性還存在可以隨著比特數(shù)量的增加而增加帶寬的編解碼,例如G722(子頻帶 ADPCM),還有G. 729. 1和G. 718。G. 729. 1以針對比特率8和12kbps的級聯(lián)式CELP編解碼進行操作,但是使用帶寬擴展以Hbps提供WB信號,以填充從4kHz到7kHz的范圍。帶寬擴展一般通過頻譜折疊或其它映射來創(chuàng)建來自較低頻帶的激勵信號,用頻譜包絡對其進一步進行增益調(diào)整和成形,以仿真較高端的頻譜。盡管該解決方案可能聽起來很好,擴展的頻譜在MSE方面一般不與輸入信號匹配。對于同樣SNR可擴縮的編解碼,一般用在較高層編碼的內(nèi)容來替代以較低比特率使用的帶寬擴展。針對G. 729. 1,是用以子帶為基礎(chǔ)的編碼頻譜來逐步替代頻譜的情況。G. 718展示了相同的特征,并針對速率8、12和ieicbps使用從 6. 4kHz到7. OkHz的帶寬擴展。對于速率M和321cbpS,禁用帶寬擴展,并用編碼頻譜來替代帶寬擴展。除了作為SNR可擴展之外,MPEG4-CELP針對8和16kHz采樣的輸入信號,指定了帶寬可擴縮編碼系統(tǒng)。音頻可擴縮性基本上,可以通過以下方式來實現(xiàn)音頻可擴縮性 改變信號的量化,即類似SNR的可擴縮性。 擴展或收緊信號的帶寬。 放棄音頻通道(例如由1個通道構(gòu)成的單聲道,2個通道構(gòu)成的立體聲,5個通道構(gòu)成的環(huán)繞立體聲)_(空間可擴縮性)。當前可用的、細粒度的可擴縮音頻編解碼是AAC_BSAC(高級音頻編碼-比特片算術(shù)編碼)。它可以同時用于音頻和語音編碼,還允許小增量的比特率可擴縮性。它產(chǎn)生比特流,甚至如果該比特流的特定部分丟失,也可以對該比特流解碼。存在對可用于流解碼所需的數(shù)據(jù)量的最小要求。將其稱作基礎(chǔ)層。剩余的比特組對應于質(zhì)量增強,因此將它們稱為增強層。針對音頻信號,AAC-BSAC支持針對音頻信號的大約lKbit/s/ 通道或更小的增強層?!盀榱双@得這種細粒度可擴縮性,對量化的譜數(shù)據(jù)應用比特切片(bit-slicing)方案。首先將量化的譜值分組為頻帶,這些組中的每一個都包含二進制表示的量化譜值。然后,根據(jù)組中比特的重要性和譜內(nèi)容以片來處理組中的比特。因此,首先處理組中的量化值的所有最高有效位(MSB),且在給定片中從較低到較高頻率處理比特。然后使用二進制算術(shù)編碼方案對這些比特片編碼,以獲得具有最小冗余的熵編碼。” [1]“在解碼器使用增加數(shù)目的增強層的情況下,提供更多的最低有效位(LSB)信息對量化譜數(shù)據(jù)精細化。同時,在較高頻帶中提供譜數(shù)據(jù)的比特片增加了音頻帶寬。這樣,可實現(xiàn)準連續(xù)的可擴縮性?!?[1]換言之,可以在二維空間中實現(xiàn)可擴縮性??梢酝ㄟ^發(fā)送更多的LSB來增強對應于特定信號帶寬的質(zhì)量,或可以通過向接收器提供更更多的比特片來擴展信號的帶寬。此外,通過調(diào)整可用于解碼的通道數(shù)目,可擴縮性的第三維度是可用的。例如,可以將環(huán)繞立體聲音頻(5個通道)縮至立體聲O個通道),另一方面,可以將立體聲O個通道)縮至單聲道(1個通道),如果例如傳輸條件使得這種情況是必要的話。立體聲編碼或多通道編碼在圖2中示意性地示出了使用多通道(即,至少兩個輸入通道)編碼和解碼的音頻發(fā)送系統(tǒng)的一般示例。整體系統(tǒng)基本上包括發(fā)送側(cè)的多通道音頻編碼器100和發(fā)送模塊 10,以及包括接收側(cè)的接收模塊20和多通道音頻解碼器200。如圖3所示,對音頻信號的立體聲或多通道編碼的最簡單方式是將不同通道的信號分別編碼為單個和獨立的信號。然而這意味著,不移除在多個通道中的冗余,且比特率要求將與通道數(shù)目成正比。
在立體聲FM音頻傳送中使用的并確保與傳統(tǒng)單聲道無線接收機兼容的另一種基本方式是傳送兩個所涉及的通道的和信號(單聲道)和差信號(側(cè))。現(xiàn)有技術(shù)水平音頻編解碼,如MPEG-1/2層III和MPEG-2/4 AAC利用所謂的聯(lián)合立體聲編碼。根據(jù)該技術(shù),聯(lián)合地處理而非分別和單獨地處理不同通道的信號。兩種最常使用的聯(lián)合立體聲編碼技術(shù)是“Mid/Side” (M/S)立體聲和強度立體聲編碼,一般將其應用于要編碼的立體聲或多通道信號的子帶上。M/S立體聲編碼在以下方面類似于在立體聲FM無線電中所述的步驟對通道子帶的和與差信號進行編碼并傳送,從而利用了通道子帶之間的冗余。在例如J. D. Johnson的美國專利No. 5285498中描述了基于M/S立體聲編碼的編碼器的結(jié)構(gòu)和操作。另一方面,強度立體聲能夠利用立體聲的不相干性(irrelevancy)。強度立體聲發(fā)送(不同子帶的)通道的聯(lián)合強度以及一些位置信息,這些位置信息指示了如何在通道上分布該強度。強度立體聲確實僅提供通道的頻譜幅度信息,同時不傳送相位信息。鑒于此, 且由于時域通道間信息(更具體地,通道間時間差)具有主要心理聲學相干性,特別是在較低的頻率上,因此強度立體聲僅可以在高于例如2kHz的高頻率處使用。在例如R. Veldhuis 等人的歐洲專利0497413中描述了強度立體聲編碼方法。在例如 C. Faller 等人的會議論文"Binaural cue coding applied to stereo and multi-channel audio compression" ,112th AES convention, May 2002, Munich (Germany)中描述了最近開發(fā)的立體聲編碼方法。該方法是參數(shù)化多通道音頻編碼
方法。這種參數(shù)化技術(shù)的基本原理是在編碼側(cè),將來自N個通道cl、c2.....cN的輸入信
號結(jié)合為一個單聲道信號m。使用任何常規(guī)單聲道音頻編解碼對單聲道信號進行音頻編碼。 同時,從描述多通道圖像的通道信號中導出參數(shù)。對參數(shù)編碼,并將其與音頻比特流一起傳送至解碼器。解碼器首先對單聲道信號m’解碼,然后基于多通道圖像的參數(shù)化描述來重新產(chǎn)生通道信號cl,、c2,.....cN,。雙耳線索編碼(binaural cue coding) (BCC[2])方法的原理是其傳送編碼的單聲道信號和所謂的BCC參數(shù)。BCC參數(shù)包括針對原始多通道輸入信號的子帶的編碼通道間電平差和通道間時間差。解碼器通過基于BCC參數(shù)來應用對單聲道信號的逐子帶的電平和相位調(diào)整,重新產(chǎn)生不同的通道信號。相對于例如M/S或強度立體聲的優(yōu)點是以低很多的比特率來傳送包括時域通道間信息的立體聲信息。在C. E. Holt等人的美國專利No. 5,434,948中描述的另一種技術(shù)使用了對單聲道信號和側(cè)信息編碼的相同原理。在該情況下,側(cè)信息由預測器濾波器和可選的殘余信號構(gòu)成。當應用于單聲道信號時,由LMS算法估計出的預測器濾波器允許對多通道音頻信號的預測。利用該技術(shù),能夠?qū)崿F(xiàn)對多通道音頻源的非常低比特率的編碼,然而,代價是質(zhì)量的下降。圖4示出了參數(shù)化立體聲編碼的基本原理,其顯示了立體聲編解碼的布局,包括縮混模塊120、核心單聲道編解碼130、230、比特流復用器/解復用器150、250以及參數(shù)化立體聲側(cè)信息編碼器/解碼器140、對0??s混將多通道(在該情況下是立體聲)信號變換為單聲道信號。參數(shù)化立體聲編解碼的目的是給定重構(gòu)的單聲道信號和附加的立體聲參數(shù),在解碼器處再現(xiàn)立體聲信號。在國際專利申請公開號WO 2006/091139中,描述了一種用于多通道編碼的自適
13應比特分配技術(shù)。該技術(shù)利用至少兩個編碼器,其中第二編碼器是多級編碼器。基于多通道音頻信號特性,在第二多級編碼器的不同級中自適應地分配編碼比特。在[3]中解釋了 MPEG參數(shù)化立體聲中使用的下混頻技術(shù)。此處,用擴縮因子來補償縮混步驟中的來自通道消除的潛在能量損失。MPEG環(huán)繞立體聲[4] [5]將音頻編碼分為兩部分一個預測性/參數(shù)化部分稱作干分量以及非可預測/擴散部分稱作濕分量。使用通道預測從已經(jīng)分別編碼和解碼的縮混信號中獲得干分量。濕分量可以是以下三項之一從預測和去相關(guān)濾波器中產(chǎn)生的合成擴散聲音信號、預測部分的增益調(diào)整版本或簡單地是編碼的預測殘余。
發(fā)明內(nèi)容
盡管已經(jīng)在音頻編解碼領(lǐng)域中做出了很多進步,依然需要提高的音頻編解碼技術(shù)?!隳康氖翘峁└倪M的音頻編碼和/或解碼技術(shù)。特定目的是提供改進的音頻編碼方法。特定目的是還提供改進的音頻解碼方法。另一個特定目的是提供改進的音頻編碼器設(shè)備。另一個特定目的是提供改進的音頻解碼器設(shè)備。由所附專利權(quán)利要求限定的本發(fā)明來滿足這些和其它目的。在第一方面,提供了一種基于對具有至少兩個通道的多通道音頻信號的音頻輸入通道組的信號表示進行操作的整體編碼過程的音頻編碼方法。根據(jù)所述音頻編碼方法,執(zhí)行第一編碼過程,用于對所述音頻輸入通道組的包括縮混信號的第一信號表示進行編碼。 執(zhí)行與所述第一編碼過程相關(guān)的本地合成,以產(chǎn)生包括所述第一編碼過程的編碼誤差的表示在內(nèi)的本地解碼的縮混信號。使用至少所述本地解碼的縮混信號作為輸入,執(zhí)行第二編碼過程,用于對所述音頻輸入通道組的第二表示進行編碼。估計所述音頻輸入通道的輸入通道能量,以及基于所述音頻輸入通道的估計出的輸入通道能量,產(chǎn)生所述音頻輸入通道的至少一個能量表示。然后對所產(chǎn)生的能量表示進行編碼。通過至少包括所述第二編碼過程在內(nèi)的所述編碼過程中的至少一個,產(chǎn)生殘余誤差信號,以及在第三編碼過程中執(zhí)行對所述殘余誤差信號的殘余編碼。這樣,可以以輸出通道和輸入通道在能量和/或質(zhì)量方面相匹配的可能性,實現(xiàn)對音頻輸入的有效整體編碼。還提供了一種對具有至少兩個通道的多通道音頻信號的音頻輸入通道組的信號表示進行操作的相應的音頻編碼器設(shè)備?;旧?,所述音頻編碼器設(shè)備包括第一編碼器,用于在第一編碼過程中對所述音頻輸入通道組的包括縮混信號的第一表示進行編碼;本地合成器,用于執(zhí)行與所述第一編碼過程相關(guān)的本地合成,以產(chǎn)生包括所述第一編碼過程的編碼誤差的表示在內(nèi)的本地解碼的縮混信號;以及第二編碼器,用于使用至少所述本地解碼的縮混信號作為輸入,在第二編碼過程中對所述音頻輸入通道組的第二表示編碼。所述音頻編碼器設(shè)備還包括能量估計器,用于估計所述音頻輸入通道的輸入通道能量;能量表示產(chǎn)生器,用于基于所述音頻輸入通道的估計出的輸入通道能量,產(chǎn)生所述音頻輸入通道的至少一個能量表示;以及能量表示編碼器,用于對所述能量表示進行編碼。所述音頻編碼器設(shè)備還包括殘余產(chǎn)生器,用于通過至少包括所述第二編碼過程在內(nèi)的所述編碼過程中的至少一個,產(chǎn)生殘余誤差信號;以及殘余編碼器,用于在第三編碼過程中執(zhí)行對所述殘余誤差信號的殘余進行編碼。在第二方面,提供了一種基于對呼入比特流進行操作以重構(gòu)具有至少兩個通道的多通道音頻信號的整體解碼過程的音頻解碼方法。根據(jù)所述音頻解碼方法,執(zhí)行第一解碼過程,用于基于所述呼入比特流的第一部分,產(chǎn)生包括解碼的縮混信號的至少一個第一解碼通道表示。執(zhí)行第二解碼過程,以基于所述解碼的縮混信號的估計能量以及表示音頻輸入信道的至少一個能量表示的所述呼入比特流的第二部分,產(chǎn)生至少一個第二解碼通道表示?;谒鼋獯a的縮混信號的估計能量和表示音頻輸入通道的至少一個能量表示的所述呼入比特流的所述第二部分,估計音頻輸入通道的輸入通道能量。在第三解碼過程中,基于表示殘余誤差信號信息的所述呼入比特流的第三部分,執(zhí)行殘余解碼,以產(chǎn)生殘余誤差信號。將所述殘余誤差信號和來自至少包括所述第二解碼過程的所述第一和第二解碼過程中的至少一個解碼過程的解碼通道表示進行組合,以及至少部分地基于估計出的輸入通道能量來執(zhí)行通道能量補償,以產(chǎn)生所述多通道音頻信號。這樣,可以有效地重構(gòu)多通道音頻信號,使得輸出通道在能量和/或質(zhì)量方面接近于輸入通道。還提供了一種對呼入比特流進行操作以重構(gòu)具有至少兩個通道的多通道音頻信號的相應的一種音頻解碼器設(shè)備?;旧希鲆纛l解碼器設(shè)備包括第一解碼器,用于基于所述呼入比特流的第一部分,產(chǎn)生包括解碼的縮混信號的至少一個第一解碼通道表示; 以及第二解碼器,用于基于所述解碼的縮混信號的估計能量以及表示音頻輸入通道的至少一個能量表示的所述呼入比特流的第二部分,產(chǎn)生至少一個第二解碼通道表示。所述音頻解碼器設(shè)備還包括估計器,用于基于所述解碼的縮混信號的估計能量和表示音頻輸入通道的至少一個能量表示的所述呼入比特流的所述第二部分,估計音頻輸入通道的輸入通道能量。所述音頻解碼器設(shè)備還包括殘余解碼器,用于在第三解碼過程中,基于所述呼入比特流的表示殘余誤差信號信息的第三部分,執(zhí)行殘余解碼以產(chǎn)生殘余誤差信號。所述音頻解碼器設(shè)備還包括裝置,用于將所述殘余誤差信號和來自至少包括所述第二解碼過程的所述第一和第二解碼過程中的至少一個解碼過程的解碼通道表示進行組合,以及用于至少部分地基于估計出的輸入通道能量來執(zhí)行通道能量補償,以產(chǎn)生所述多通道音頻信號。當閱讀本發(fā)明實施例的以下描述時,將會理解本發(fā)明提供的其它優(yōu)點。
結(jié)合附圖,通過以下描述將最佳地理解本發(fā)明及其其它目的和優(yōu)點,其中圖1示出了用于媒體自適應的專用網(wǎng)絡實體的示例。圖2是示出了使用多通道編碼和解碼的音頻傳送系統(tǒng)的一般示例的示意框圖。圖3是示出了如何將不同通道的信號分別編碼為單個和獨立信號的示意圖。圖4是示出了參數(shù)化立體聲編碼的基本原理的示意框圖。圖5是使用參數(shù)化預測和預測/參數(shù)化殘余編碼方案的一般立體聲編碼器的示意框圖。圖6是通道電平差(CLD)和通道電平和(CLS)之間的依賴性的散布圖。
圖7以流程圖的形式示出了本發(fā)明的編碼器操作的示例。該概覽對于實施例A、B 和C是有效的。圖8是描述了實施例A的解碼器中的立體聲合成鏈的示例的流程圖。圖9A是描述了實施例A的編碼器和解碼器的操作的示例的示意框圖。圖9B示出了對于實施例B有效的編碼器和解碼器的操作的示例。圖9C示出了對于實施例C有效的編碼器和解碼器的操作的示例。圖10示出了對于實施例B和C有效的解碼器立體聲合成鏈的示例。圖11是示出了通道預測因子(篩選(panning)因子)相對于歸一化的互相關(guān)系數(shù)如何變化的圖。圖12以投票的柱狀圖的形式示出了來自對本發(fā)明的AB測試評估的結(jié)果。圖13以流程圖形式示出了多通道編碼器的整個編碼器操作的示例。圖14示出了編碼器和解碼器過程的可能的多通道實施例,其中,在多通道預測之前執(zhí)行對接收信號的能量測量。圖15是示出了當在多通道預測之前估計解碼信號分量的能量時,整體解碼器操作的示例的流程圖。圖16示出了編碼器和解碼器過程的可能的多通道實施例,其中,在多通道預測之后執(zhí)行對接收信號的能量測量。圖17是示出了當在多通道預測之后估計解碼信號分量的能量時,整體解碼器操作的示例的流程圖。圖18是示出了用于音頻編碼的方法的示例的示意流程圖。圖19是示出了用于音頻解碼的方法的示例的示意流程圖。圖20是示出了音頻編碼器設(shè)備的示例的示意框圖。圖21是示出了音頻解碼器設(shè)備的示例的示意框圖。
具體實施例方式本發(fā)明一般涉及音頻應用中的多通道(即,至少兩個通道)編碼/解碼技術(shù),并且具體地涉及音頻傳送系統(tǒng)和/或音頻存儲中的立體聲編碼/解碼??赡艿囊纛l應用的示例包括電話會議系統(tǒng)、移動通信系統(tǒng)中的立體聲音頻傳送、用于提供音頻服務的各種系統(tǒng)、以及多通道家庭影院系統(tǒng)。本發(fā)明可以例如具體地應用于未來的標準中,如ITU-T WP3/SG16/Q23 SffB/ G. 729. 1和G. 718的立體聲擴展,但是當然不限于這些標準。以對多通道和立體聲編解碼技術(shù)的一些概念的概覽開始將是有益的。在例如立體聲編解碼中,一般在多級中執(zhí)行立體聲編碼和解碼。圖5中示出了該過程的概覽。首先,從左和右通道L、R中形成縮混單聲道信號M。將單聲道信號饋送至單聲道編碼器,從該單聲道編碼器中提取本地合成眾。使用信號M、々以及[L R]T,參數(shù)化立
體聲編碼器產(chǎn)生輸入信號的第一近似[Z Af在第一級中,計算預測殘余,并對其編碼,以
提供進一步的增強。通道縮混L ε JT來獲得最優(yōu)預測。這可以通過使縮混的標準方式是簡單地將信號相加在一起
權(quán)利要求
1.一種基于對具有至少兩個通道的多通道音頻信號的音頻輸入通道組的信號表示進行操作的整體編碼過程的音頻編碼方法,其中,所述音頻編碼方法包括以下步驟-執(zhí)行(Si)第一編碼過程,用于對所述音頻輸入通道組的包括縮混信號的第一信號表示進行編碼;-執(zhí)行(S》與所述第一編碼過程相關(guān)的本地合成,以產(chǎn)生包括所述第一編碼過程的編碼誤差的表示在內(nèi)的本地解碼的縮混信號;-至少使用所述本地解碼的縮混信號作為輸入,執(zhí)行(S3)第二編碼過程,用于對所述音頻輸入通道組的第二表示進行編碼;-估計(S4)所述音頻輸入通道的輸入通道能量;-基于所述音頻輸入通道的估計出的輸入通道能量,產(chǎn)生(SO所述音頻輸入通道的至少一個能量表示;-對所述至少一個能量表示進行編碼(S6);以及-通過至少包括所述第二編碼過程在內(nèi)的所述編碼過程中的至少一個,產(chǎn)生(S7)殘余誤差信號;-在第三編碼過程中執(zhí)行(S8)對所述殘余誤差信號的殘余編碼。
2.根據(jù)權(quán)利要求1所述的音頻編碼方法,其中,所述至少一個能量表示使解碼側(cè)的輸出通道的能量能夠與估計出的輸入通道能量相匹配。
3.根據(jù)權(quán)利要求2所述的音頻編碼方法,其中,所述至少一個能量表示使輸出通道和輸入通道在能量和質(zhì)量方面能夠匹配。
4.根據(jù)權(quán)利要求1所述的音頻編碼方法,其中,在所述第二編碼過程中執(zhí)行產(chǎn)生至少一個能量表示和對所述至少一個能量表示進行編碼的所述步驟(S5、S6)。
5.根據(jù)權(quán)利要求4所述的音頻編碼方法,其中,針對至少一個頻帶中的多個幀中的每一個幀,執(zhí)行產(chǎn)生至少一個能量表示和對所述至少一個能量表示進行編碼的所述步驟(S5、 S6)。
6.根據(jù)權(quán)利要求1所述的音頻編碼方法,其中,所述第一編碼過程是縮混編碼過程,所述第二編碼過程基于用于產(chǎn)生至少一個預測通道的通道預測,以及產(chǎn)生殘余誤差信號的所述步驟(S7)包括產(chǎn)生殘余預測誤差信號的步驟。
7.根據(jù)權(quán)利要求6所述的音頻編碼方法,其中,在所述第二編碼過程中將所估計出的輸入通道能量和所述通道預測的預測參數(shù)進行聯(lián)合表示和編碼。
8.根據(jù)權(quán)利要求6所述的音頻編碼方法,其中,產(chǎn)生至少一個能量表示的所述步驟 (S5)包括以下步驟-確定通道能量電平差; -確定通道能量電平和;以及-基于所述通道能量電平和以及來自與所述第一編碼過程相關(guān)的所述本地合成的所述本地解碼的縮混信號的能量,確定delta能量度量,其中,對所述至少一個能量表示進行編碼的所述步驟(S6)包括以下步驟 -對所述通道能量電平差進行量化;以及 -對所述delta能量度量進行量化。
9.根據(jù)權(quán)利要求8所述的音頻編碼方法,其中,所述通道預測基于未量化的通道預測參數(shù)。
10.根據(jù)權(quán)利要求6所述的音頻編碼方法,其中,產(chǎn)生至少一個能量表示的所述步驟 (S5)包括以下步驟-確定通道能量電平差; -確定通道能量電平和;-基于所述通道能量電平和以及來自與所述第一編碼過程相關(guān)的所述本地合成的所述本地解碼的縮混信號的能量,確定delta能量度量,-基于所述delta能量度量以及由所述本地解碼的縮混信號的能量所歸一化的預測通道的能量,確定歸一化能量補償參數(shù);其中,對所述至少一個能量表示進行編碼的所述步驟(S6)包括以下步驟 -對所述通道能量電平差進行量化;以及 -對所述歸一化能量補償參數(shù)進行量化。
11.根據(jù)權(quán)利要求10所述的音頻編碼方法,其中,所述通道預測基于從量化的通道能量電平差導出的量化通道預測參數(shù)。
12.根據(jù)權(quán)利要求6所述的音頻編碼方法,其中,產(chǎn)生至少一個能量表示的所述步驟 (S5)包括以下步驟-確定通道能量電平差;以及 -確定能量歸一化輸入通道互相關(guān)參數(shù);其中,對所述至少一個能量表示進行編碼的所述步驟(S6)包括以下步驟 -對所述通道能量電平差進行量化;以及 -對所述能量歸一化輸入通道互相關(guān)參數(shù)進行量化。
13.根據(jù)權(quán)利要求12所述的音頻編碼方法,其中,所述通道預測基于從量化的通道能量電平差和量化的能量歸一化輸入通道互相關(guān)參數(shù)導出的量化通道預測參數(shù)。
14.一種對具有至少兩個通道的多通道音頻信號的音頻輸入通道組的信號表示進行操作的音頻編碼器設(shè)備(100),其中,所述音頻編碼器設(shè)備(100)包括-第一編碼器(130),用于在第一編碼過程中對所述音頻輸入通道組的包括縮混信號的第一表示進行編碼;-本地合成器(132),用于執(zhí)行與所述第一編碼過程相關(guān)的本地合成,以產(chǎn)生包括所述第一編碼過程的編碼誤差的表示在內(nèi)的本地解碼的縮混信號;-第二編碼器(140),用于至少使用所述本地解碼的縮混信號作為輸入,在第二編碼過程中對所述音頻輸入通道組的第二表示進行編碼;-能量估計器(142),用于估計所述音頻輸入通道的輸入通道能量; -能量表示產(chǎn)生器(144),用于基于所述音頻輸入通道的估計出的輸入通道能量,產(chǎn)生所述音頻輸入通道的至少一個能量表示;-能量表示編碼器(146),用于對所述至少一個能量表示進行編碼; -殘余產(chǎn)生器(15 ,用于通過至少包括所述第二編碼過程在內(nèi)的所述編碼過程中的至少一個,產(chǎn)生殘余誤差信號;以及-殘余編碼器(160),用于在第三編碼過程中執(zhí)行對所述殘余誤差信號的殘余編碼。
15.根據(jù)權(quán)利要求14所述的音頻編碼器設(shè)備,其中,所述能量表示產(chǎn)生器(144)被配置為產(chǎn)生至少一個能量表示,以使解碼側(cè)的輸出通道的能量能夠與估計出的輸入通道能量相匹配。
16.根據(jù)權(quán)利要求15所述的音頻編碼器設(shè)備,其中,所述能量表示產(chǎn)生器(144)被配置為產(chǎn)生至少一個能量表示,以使輸出通道和輸入通道在能量和質(zhì)量方面能夠匹配。
17.根據(jù)權(quán)利要求14所述的音頻編碼器設(shè)備,其中,在所述第二編碼器(140)中實現(xiàn)所述能量表示產(chǎn)生器(144)和所述能量表示編碼器(146)。
18.根據(jù)權(quán)利要求17所述的音頻編碼器設(shè)備,其中,所述能量表示產(chǎn)生器(144)和所述能量表示編碼器(146)被配置為針對至少一個頻帶中的多個幀中的每一個幀,產(chǎn)生并編碼所述至少一個能量表示。
19.根據(jù)權(quán)利要求14所述的音頻編碼器設(shè)備,其中,所述第一編碼器(130)是縮混編碼器,所述第二編碼器(140)是被配置為基于通道預測進行操作以產(chǎn)生至少一個預測通道的參數(shù)化編碼器,以及所述殘余產(chǎn)生器(15 被配置為產(chǎn)生殘余預測誤差信號。
20.根據(jù)權(quán)利要求19所述的音頻編碼器設(shè)備,其中,所述第二編碼器(140)被配置為對所估計出的輸入通道能量和所述通道預測的預測參數(shù)進行聯(lián)合表示和編碼。
21.根據(jù)權(quán)利要求19所述的音頻編碼器設(shè)備,其中,所述能量表示產(chǎn)生器(144)包括 -確定器,用于確定通道能量電平差;-確定器,用于確定通道能量電平和;以及-確定器,用于基于所述通道能量電平和以及來自與所述第一編碼過程相關(guān)的所述本地合成的所述本地解碼的縮混信號的能量,確定delta能量度量, 其中,所述能量表示編碼器(146)包括 -量化器,用于對所述通道能量電平差進行量化;以及 -量化器,用于對所述delta能量度量進行量化。
22.根據(jù)權(quán)利要求21所述的音頻編碼器設(shè)備,其中,所述第二編碼器(140)被配置為基于未量化的通道預測參數(shù)來執(zhí)行通道預測。
23.根據(jù)權(quán)利要求19所述的音頻編碼器設(shè)備,其中,所述能量表示產(chǎn)生器(144)包括 -確定器,用于確定通道能量電平差;-確定器,用于確定通道能量電平和;-確定器,用于基于所述通道能量電平和以及來自與所述第一編碼過程相關(guān)的所述本地合成的所述本地解碼的縮混信號的能量,確定delta能量度量,-確定器,用于基于所述delta能量度量以及由所述本地解碼的縮混信號的能量所歸一化的預測通道的能量,確定歸一化能量補償參數(shù); 其中,所述能量表示編碼器(146)包括 -量化器,用于對所述通道能量電平差進行量化;以及 -量化器,用于對所述歸一化能量補償參數(shù)進行量化。
24.根據(jù)權(quán)利要求23所述的音頻編碼器設(shè)備,其中,所述第二編碼器(140)被配置為基于從量化的通道能量電平差導出的量化通道預測參數(shù)來執(zhí)行通道預測。
25.根據(jù)權(quán)利要求19所述的音頻編碼器設(shè)備,其中,所述能量表示產(chǎn)生器(144)包括 -確定器,用于確定通道能量電平差;以及-確定器,用于確定能量歸一化輸入通道互相關(guān)參數(shù);其中,所述能量表示編碼器(146)包括-量化器,用于對所述通道能量電平差進行量化;以及-量化器,用于對所述能量歸一化輸入通道互相關(guān)參數(shù)進行量化。
26.根據(jù)權(quán)利要求25所述的音頻編碼器設(shè)備,其中,所述第二編碼器(140)被配置為基于從量化的通道能量電平差和量化的能量歸一化輸入通道互相關(guān)參數(shù)導出的量化通道預測參數(shù)來執(zhí)行通道預測。
27.一種基于對呼入比特流進行操作以重構(gòu)具有至少兩個通道的多通道音頻信號的整體解碼過程的音頻解碼方法,其中,所述方法包括以下步驟-執(zhí)行(Sll)第一解碼過程,以基于所述呼入比特流的第一部分,產(chǎn)生包括解碼縮混信號的至少一個第一解碼通道表示;-執(zhí)行(Si》第二解碼過程,以基于所述解碼縮混信號的估計能量以及表示音頻輸入通道的至少一個能量表示的所述呼入比特流的第二部分,產(chǎn)生至少一個第二解碼通道表示;-基于所述解碼的縮混信號的估計能量和表示音頻輸入通道的至少一個能量表示的所述呼入比特流的所述第二部分,估計(SU)音頻輸入通道的輸入通道能量;-在第三解碼過程中,基于表示殘余誤差信號信息的所述呼入比特流的第三部分,執(zhí)行 (S14)殘余解碼以產(chǎn)生殘余誤差信號;-將所述殘余誤差信號和來自至少包括所述第二解碼過程的所述第一和第二解碼過程中的至少一個解碼過程的解碼通道表示進行組合,以及至少部分地基于估計出的輸入通道能量來執(zhí)行通道能量補償,以產(chǎn)生所述多通道音頻信號(S15)。
28.根據(jù)權(quán)利要求27所述的音頻解碼方法,其中,執(zhí)行所述能量補償,以將所述多通道音頻信號的輸出通道的能量與估計出的輸入通道能量進行匹配。
29.根據(jù)權(quán)利要求觀所述的音頻解碼方法,其中,將所述多通道音頻信號的輸出通道與編碼側(cè)的相應輸入通道在能量和質(zhì)量方面相匹配,其中,用比較低質(zhì)量信號的比例大的比例來表示較高質(zhì)量信號,以提高所述輸出通道的整體質(zhì)量。
30.根據(jù)權(quán)利要求27所述的音頻解碼方法,其中,當產(chǎn)生至少一個第二解碼通道表示時,將所述通道能量補償集成到所述第二解碼過程中。
31.根據(jù)權(quán)利要求30所述的音頻解碼方法,其中,估計所述解碼縮混信號的能量和所述殘余誤差信號的能量,以及所述第二解碼過程基于所述解碼縮混信號的能量和所述殘余誤差信號的能量。
32.根據(jù)權(quán)利要求27所述的音頻解碼方法,其中,在組合所述殘余誤差信號和解碼通道表示之后,執(zhí)行所述通道能量補償。
33.根據(jù)權(quán)利要求32所述的音頻解碼方法,其中,將殘余誤差信號與來自所述第一和第二解碼過程中至少一個的解碼通道表示組合為多通道合成,且估計組合后的多通道合成的能量,以及基于組合后的多通道合成的估計能量和估計出的輸入通道能量來執(zhí)行所述通道能量補償。
34.根據(jù)權(quán)利要求27所述的音頻解碼方法,其中,執(zhí)行第二解碼過程以產(chǎn)生至少一個第二解碼通道表示的所述步驟(Si》包括合成預測通道的步驟,以及執(zhí)行殘余解碼的所述步驟(S14)包括產(chǎn)生殘余預測誤差信號的步驟。
35.根據(jù)權(quán)利要求34所述的音頻解碼方法,其中,執(zhí)行第二解碼過程以產(chǎn)生至少一個第二解碼通道表示的所述步驟(Si》包括以下步驟-從所述呼入比特流的所述第二部分中導出所述音頻輸入通道的所述至少一個能量表示;-至少部分地基于所述至少一個能量表示,估計通道預測參數(shù);以及 -基于解碼的縮混信號和估計出的通道預測參數(shù),合成預測通道。
36.根據(jù)權(quán)利要求35所述的音頻解碼方法,其中,導出所述至少一個能量表示的所述步驟包括從所述呼入比特流的所述第二部分中導出通道能量電平差和delta能量度量的步驟;以及其中,基于所述解碼縮混信號的估計能量、所述通道能量電平差以及delta能量度量, 執(zhí)行估計輸入通道能量的所述步驟;基于估計出的輸入通道能量、所述解碼縮混信號的估計能量以及所述殘余誤差信號的估計能量,執(zhí)行估計通道預測參數(shù)的所述步驟。
37.根據(jù)權(quán)利要求35所述的音頻解碼方法,其中,導出所述至少一個能量表示的所述步驟包括從所述呼入比特流的所述第二部分中導出通道能量電平差和歸一化能量補償參數(shù)的步驟;以及其中,基于所述解碼縮混信號的估計能量、所述通道能量電平差以及所述歸一化能量補償參數(shù),執(zhí)行估計輸入通道能量的所述步驟;基于所述通道能量電平差,執(zhí)行估計通道預測參數(shù)的所述步驟; 合成預測通道的所述步驟基于解碼縮混信號和估計出的通道預測參數(shù); 組合所述殘余誤差信號和解碼通道表示的所述步驟包括將所述殘余誤差信號和所述合成預測通道組合為組合后的多通道合成的步驟;其中,在所述組合步驟之后,通過以下步驟執(zhí)行所述通道能量補償 -估計所述組合后的多通道合成的能量;-基于估計出的輸入通道能量和所述組合后的多通道合成的估計能量,確定能量修正因子;-對所述組合后的多通道合成應用所述能量修正因子,以產(chǎn)生所述多通道音頻信號。
38.根據(jù)權(quán)利要求35所述的音頻解碼方法,其中,導出所述至少一個能量表示的所述步驟包括從所述呼入比特流的所述第二部分中導出通道能量電平差和能量歸一化輸入通道互相關(guān)參數(shù)的步驟;以及其中,基于所述解碼縮混信號的估計能量、所述通道能量電平差以及所述能量歸一化輸入通道互相關(guān)參數(shù),執(zhí)行估計輸入通道能量的所述步驟;基于所述通道能量電平差和所述能量歸一化輸入通道互相關(guān)參數(shù),執(zhí)行估計通道預測參數(shù)的所述步驟;合成預測通道的所述步驟基于解碼縮混信號和估計出的通道預測參數(shù); 組合所述殘余誤差信號和解碼通道表示的所述步驟包括將所述殘余誤差信號和所述合成預測通道組合為組合后的多通道合成的步驟;其中,在所述組合步驟之后,通過以下步驟執(zhí)行所述通道能量補償 -估計所述組合后的多通道合成的能量;-基于估計出的輸入通道能量和所述組合后的多通道合成的估計能量,確定能量修正因子;-對所述組合后的多通道合成應用所述能量修正因子,以產(chǎn)生所述多通道音頻信號。
39.一種對呼入比特流進行操作以重構(gòu)具有至少兩個通道的多通道音頻信號的音頻解碼器設(shè)備000),其中,所述音頻解碼器設(shè)備(200)包括-第一解碼器030),用于基于所述呼入比特流的第一部分,產(chǎn)生包括解碼縮混信號的至少一個第一解碼通道表示;-第二解碼器040),用于基于所述解碼縮混信號的估計能量以及表示音頻輸入通道的至少一個能量表示的所述呼入比特流的第二部分,產(chǎn)生至少一個第二解碼通道表示;-估計器042),用于基于所述解碼縮混信號的估計能量和表示音頻輸入通道的至少一個能量表示的所述呼入比特流的所述第二部分,估計音頻輸入通道的輸入通道能量;-殘余解碼器060),用于在第三解碼過程中,基于表示殘余誤差信號信息的所述呼入比特流的第三部分,執(zhí)行殘余解碼,以產(chǎn)生殘余誤差信號;以及-裝置(270),用于將所述殘余誤差信號和來自至少包括所述第二解碼過程的所述第一和第二解碼過程中的至少一個解碼過程的解碼通道表示進行組合,以及用于至少部分地基于估計出的輸入通道能量來執(zhí)行通道能量補償,以產(chǎn)生所述多通道音頻信號。
40.根據(jù)權(quán)利要求39所述的音頻解碼器設(shè)備,其中,用于組合和執(zhí)行通道能量補償?shù)乃鲅b置(270)被配置為將所述多通道音頻信號的輸出通道的能量與估計出的輸入通道能量相匹配。
41.根據(jù)權(quán)利要求40所述的音頻解碼器設(shè)備,其中,用于組合和執(zhí)行通道能量補償?shù)乃鲅b置(270)被配置為將所述多通道音頻信號的輸出通道與編碼側(cè)的相應輸入通道在能量和質(zhì)量方面進行匹配,其中,用于組合和執(zhí)行通道能量補償?shù)乃鲅b置(270)被配置為用比較低質(zhì)量信號的比例大的比例來表示較高質(zhì)量信號,以提高所述輸出通道的整體質(zhì)量。
42.根據(jù)權(quán)利要求39所述的音頻解碼器設(shè)備,其中,將所述通道能量補償集成到所述第二解碼器O40)中。
43.根據(jù)權(quán)利要求42所述的音頻解碼器設(shè)備,其中,所述音頻解碼器設(shè)備(200)包括 用于估計所述解碼縮混信號的能量和所述殘余誤差信號的能量的裝置,以及所述第二解碼器(MO)被配置為基于所述解碼縮混信號的能量和所述殘余誤差信號的能量進行操作。
44.根據(jù)權(quán)利要求39所述的音頻解碼器設(shè)備,其中,用于組合和執(zhí)行通道能量補償?shù)乃鲅b置(270)包括組合器,用于將所述殘余誤差信號和解碼通道表示組合為組合后的多通道合成;以及通道能量補償器,用于對所述組合后的多通道合成應用所述通道能量補償以產(chǎn)生所述多通道音頻信號。
45.根據(jù)權(quán)利要求44所述的音頻解碼器設(shè)備,其中,所述音頻解碼器設(shè)備(200)包括 用于估計組合后的多通道合成的能量的估計器,以及所述通道能量補償器被配置為基于組合后的多通道合成的估計能量和估計出的輸入通道能量來應用所述通道能量補償。
46.根據(jù)權(quán)利要求39所述的音頻解碼器設(shè)備,其中,所述第一解碼器(230)是縮混解碼器,所述第二解碼器(MO)是被配置為用于合成預測通道的參數(shù)化解碼器,以及所述殘余解碼器Q60)被配置為用于產(chǎn)生殘余預測誤差信號。
47.根據(jù)權(quán)利要求46所述的音頻解碼器設(shè)備,其中,所述第二解碼器(MO)包括-導出器041),用于從所述呼入比特流的所述第二部分中導出所述音頻輸入通道的所述至少一個能量表示;-估計器,用于至少部分地基于所述至少一個能量表示,估計通道預測參數(shù);以及-合成器,用于基于解碼縮混信號和估計出的通道預測參數(shù),合成預測通道。
48.根據(jù)權(quán)利要求47所述的音頻解碼器設(shè)備,其中,所述導出器被配置為從所述呼入比特流的所述第二部分中導出通道能量電平差和delta能量度量;以及其中,用于估計輸入通道能量的所述估計器( 被配置為基于所述解碼縮混信號的估計能量、所述通道能量電平差以及delta能量度量,估計輸入通道能量;用于估計通道預測參數(shù)的所述估計器被配置為基于估計出的輸入通道能量、所述解碼縮混信號的估計能量以及所述殘余誤差信號的估計能量,估計通道預測參數(shù)。
49.根據(jù)權(quán)利要求47所述的音頻解碼器設(shè)備,其中,所述導出器被配置為從所述呼入比特流的所述第二部分中導出通道能量電平差和歸一化能量補償參數(shù);以及其中,用于估計輸入通道能量的所述估計器( 被配置為基于所述解碼縮混信號的估計能量、所述通道能量電平差以及所述歸一化能量補償參數(shù),估計輸入通道能量;用于估計通道預測參數(shù)的所述估計器被配置為基于所述通道能量電平差,估計通道預測參數(shù);用于合成預測通道的所述合成器被配置為基于解碼縮混信號和估計出的通道預測參數(shù),合成預測通道;用于組合和執(zhí)行通道能量補償?shù)乃鲅b置(270)包括用于將所述殘余誤差信號和所述合成預測通道組合為組合后的多通道合成的組合器,以及包括以下各項的通道能量補償器-估計器,用于估計所述組合后的多通道合成的能量;-確定器,用于基于估計出的輸入通道能量和所述組合后的多通道合成的估計能量,確定能量修正因子;-能量修正器,用于對所述組合后的多通道合成應用所述能量修正因子,以產(chǎn)生所述多通道音頻信號。
50.根據(jù)權(quán)利要求47所述的音頻解碼器設(shè)備,其中,所述導出器被配置為從所述呼入比特流的所述第二部分中導出通道能量電平差和能量歸一化輸入通道互相關(guān)參數(shù);以及其中,用于估計輸入通道能量的所述估計器(M2)被配置為基于所述解碼縮混信號的估計能量、所述通道能量電平差以及所述能量歸一化輸入通道互相關(guān)參數(shù),估計輸入通道能量;用于估計通道預測參數(shù)的所述估計器被配置為基于所述通道能量電平差和所述能量歸一化輸入通道互相關(guān)參數(shù),估計通道預測參數(shù);用于合成預測通道的所述合成器被配置為基于解碼縮混信號和估計出的通道預測參數(shù),合成預測通道;用于組合和執(zhí)行通道能量補償?shù)乃鲅b置(270)包括用于將所述殘余誤差信號和所述合成預測通道組合為組合后的多通道合成的組合器,以及包括以下各項的通道能量補償器-估計器,用于估計所述組合后的多通道合成的能量;-確定器,用于基于估計出的輸入通道能量和所述組合后的多通道合成的估計能量,確定能量修正因子;-能量修正器,用于對所述組合后的多通道合成應用所述能量修正因子,以產(chǎn)生所述多通道音頻信號。
全文摘要
本發(fā)明涉及音頻編碼和/或解碼技術(shù)的技術(shù)領(lǐng)域,并從而涉及整體編碼過程及相關(guān)聯(lián)的解碼步驟。編碼步驟涉及對音頻輸入通道組的信號表示進行操作的至少兩個信號編碼過程(S1-S3),以及涉及殘余編碼(S7-S8)。本發(fā)明還涉及對音頻輸入通道的能量進行估計和編碼的專用過程(S4-S6)。每個編碼過程與對應的解碼過程相關(guān)聯(lián)。在整體解碼過程中,優(yōu)選地將來自每個編碼過程的解碼信號進行組合,使得輸出通道在能量和/或質(zhì)量方面接近輸入通道。一般地,組合步驟還適應于一個或多個信號表示的部分或全部的可能丟失,使得用解碼器手上的信號對能量和質(zhì)量進行優(yōu)化。這樣,提高了輸出通道的整體質(zhì)量。
文檔編號G10L19/00GK102177542SQ200980140139
公開日2011年9月7日 申請日期2009年9月25日 優(yōu)先權(quán)日2008年10月10日
發(fā)明者安尼斯·泰力布, 艾力克·諾維爾, 馬丁·紹爾斯戴德 申請人:艾利森電話股份有限公司