專利名稱:方法、裝置、編碼器設(shè)備、譯碼器設(shè)備和音頻系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于處理從一個(gè)編碼器得到的立體聲信號(hào)的方法和裝置,該編碼器把N通道音頻信號(hào)編碼成空間參數(shù)和一個(gè)包括第一與第二立體聲信號(hào)的立體聲下混合信號(hào)。本發(fā)明還涉及包括這樣的編碼器和這樣的裝置的編碼器設(shè)備。
本發(fā)明還涉及用于處理通過這樣的方法得到的立體聲下混合信號(hào)的方法和裝置,和用于處理從編碼器得到的立體聲信號(hào)的裝置。本發(fā)明還涉及包括這樣的用于處理立體聲下混合的信號(hào)的裝置。
本發(fā)明還涉及包括這樣的編碼器設(shè)備和這樣的譯碼器設(shè)備的音頻系統(tǒng)。
很長時(shí)間以來,例如在家庭環(huán)境中音樂的立體聲重現(xiàn)一直很流行。在1970年代,進(jìn)行了家庭音樂設(shè)備的某些四通道實(shí)驗(yàn)。
在諸如電影院那樣的較大的大廳內(nèi),聲音的多通道重現(xiàn)存在了很長時(shí)間。Dolby Digital(杜比數(shù)字)和其它系統(tǒng)被開發(fā)用于在大廳中提供逼真的和感人的聲音重現(xiàn)。
這樣的多通道系統(tǒng)被引入到家庭影院,并且引起廣泛的興趣。因此,具有五個(gè)全范圍通道和一個(gè)部分范圍通道或低頻效果(LFE)通道的系統(tǒng),被稱為5.1系統(tǒng),在現(xiàn)今的市場上是很流行的。也存在其它的系統(tǒng),諸如2.1、4.1、7.1和甚至8.1系統(tǒng)。
隨著SACD和DVD的引入,多通道音頻重現(xiàn)具備了基礎(chǔ)。許多消費(fèi)者已經(jīng)有可能在他們的家中進(jìn)行多通道重放,而多通道源材料正變得很流行。然而,許多人仍舊只有2通道重現(xiàn)系統(tǒng),以及傳輸通常是經(jīng)由2通道進(jìn)行的。為此,例如像Dolby Surround(杜比環(huán)繞聲)那樣的矩陣運(yùn)算技術(shù)被開發(fā),使得有可能經(jīng)由2通道進(jìn)行多通道傳輸。所傳送的信號(hào)可以通過2通道重現(xiàn)系統(tǒng)直接被重放。當(dāng)可得到適當(dāng)?shù)淖g碼器時(shí),多通道重放是可能的。熟知的用于這一用途的譯碼器是DolbyPro Logic(I和II),(Kenneth Gundry,“A new active matrix decoder forsurround sound”(環(huán)繞聲用的新型有源矩陣譯碼器),見于Proc.AES19th International Conference on Surround Sound,June 2001)和CircleSurround(I和II),(美國專利No.6,198,8275-2-5矩陣系統(tǒng))。
因?yàn)槎嗤ǖ啦牧系脑黾拥牧餍行?,多通道材料的有效的編碼變得越來越重要。矩陣運(yùn)算減少了對傳輸所需的音頻通道數(shù),從而減小所需帶寬或比特率。矩陣技術(shù)的額外的優(yōu)點(diǎn)在于,它與立體聲重現(xiàn)系統(tǒng)是后向兼容的。為了進(jìn)一步減小比特率,可以應(yīng)用傳統(tǒng)的音頻編碼器來對矩陣運(yùn)算的立體聲信號(hào)編碼。
減小比特率的另一個(gè)可能性是對未經(jīng)過矩陣運(yùn)算的所有各個(gè)通道編碼。這個(gè)方法導(dǎo)致較高的比特率,因?yàn)楸仨殞ξ鍌€(gè)通道編碼而不是兩個(gè)通道,但空間重建比起通過應(yīng)用矩陣運(yùn)算更接近于原始的聲音。
在原理上,矩陣運(yùn)算過程是有損運(yùn)算。所以,僅根據(jù)2通道混合重建成完美的5通道通常是不可能的。這個(gè)特性限制了5通道重建的最大感覺質(zhì)量。
最近,開發(fā)了一種把多通道音頻編碼為2通道立體聲音頻信號(hào)和少量空間參數(shù)或編碼器信息參數(shù)P的系統(tǒng)。因此,這個(gè)系統(tǒng)對立體聲重現(xiàn)是后向兼容的。所傳送的空間參數(shù)或編碼器信息參數(shù)P確定了譯碼器應(yīng)當(dāng)如何根據(jù)可得到的二通道立體聲下混合信號(hào)來重建五通道。由于上混合過程由所傳送的參數(shù)所控制,5通道重建的感覺質(zhì)量與沒有控制參數(shù)的上混合算法(例如,Dolby Pro Logic)相比得到了很大的改進(jìn)。
總之,三種不同的方法可用來根據(jù)提供的二通道混合生成5通道重建1)盲重建。這個(gè)試圖僅僅根據(jù)信號(hào)特性來估計(jì)上混合矩陣,而不用任何提供的信息。
2)矩陣運(yùn)算技術(shù),例如Dolby Pro Logic。通過應(yīng)用某個(gè)下混合矩陣,由于由所應(yīng)用的下混合矩陣確定的某些信號(hào)特性,從2到5通道的重建可被改進(jìn)。
3)參數(shù)控制的上混合。在這個(gè)方法中,編碼器信息參數(shù)P典型地被存儲(chǔ)在比特流的附屬部分,保證與通常的重放系統(tǒng)的后向兼容性。然而,這些系統(tǒng)通常是不與矩陣運(yùn)算系統(tǒng)后向兼容的。
把上述的方法2和3組合成單個(gè)系統(tǒng)可能是有趣的。取決于可得到的譯碼器,這保證最高質(zhì)量。對于具有諸如Dolby Pro Logic或CircleSurround的矩陣環(huán)繞譯碼器的消費(fèi)者,重建是按照矩陣運(yùn)算過程得到的。如果得到這樣的譯碼器,它能夠解譯傳送的參數(shù),則可以得到更高質(zhì)量的重建。不具有矩陣環(huán)繞聲譯碼器或能夠解譯空間參數(shù)的譯碼器的消費(fèi)者仍然可以享受立體聲后向兼容性。然而,組合方法2和3的一個(gè)問題是,實(shí)際傳送的立體聲下混合將被修改。這對使用空間參數(shù)的5通道重建又可能具有有害的影響。
本發(fā)明的目的是提供一種允許把參數(shù)化多通道音頻編碼與矩陣運(yùn)算編碼技術(shù)相組合的方法,利用該方法可以實(shí)現(xiàn)完全質(zhì)量的多通道重建而與可得到的譯碼器無關(guān)。
按照本發(fā)明,這個(gè)目的是通過一種處理從編碼器得到的立體聲信號(hào)的方法而達(dá)到的,該編碼器把N通道音頻信號(hào)編碼成空間參數(shù)和一個(gè)包括第一與第二立體聲信號(hào)的立體聲下混合信號(hào),該方法包括以下步驟把第一與第三信號(hào)相加以得到第一輸出信號(hào),其中所述第一信號(hào)包括由第一復(fù)數(shù)函數(shù)修改的所述第一立體聲信號(hào),和其中所述第三信號(hào)包括由第三復(fù)數(shù)函數(shù)修改的所述第二立體聲信號(hào);以及把第二與第四信號(hào)相加以得到第二輸出信號(hào),其中所述第四信號(hào)包括由第四復(fù)數(shù)函數(shù)修改的所述第二立體聲信號(hào),和其中所述第二信號(hào)包括由第二復(fù)數(shù)函數(shù)修改的所述第一立體聲信號(hào);其中所述復(fù)數(shù)函數(shù)是所述空間參數(shù)的函數(shù),并且被選擇成使得在第一信號(hào)與第二信號(hào)之間的差值的能量值大于或等于第一與第二信號(hào)的總和的能量值,并使得在第四信號(hào)與第三信號(hào)之間的差值的能量值大于或等于第四與第三信號(hào)的總和的能量值。因此,使得能在譯碼器中進(jìn)行前/后操控。
這些差信號(hào)與和信號(hào)的能量值可以是基于2-模方(2-norm)(即,遍及多個(gè)樣本的平方和)或這些信號(hào)的絕對值。另外,這里可以應(yīng)用其它傳統(tǒng)的能量測量值。
在本發(fā)明的實(shí)施例中,N通道音頻信號(hào)包括前通道信號(hào)和后通道信號(hào),以及所述空間參數(shù)包括在立體聲下混合中的后通道相對于這里的前通道的貢獻(xiàn)的相對貢獻(xiàn)的度量。這是因?yàn)檫x擇后通道貢獻(xiàn)是必須的。
所述第二復(fù)數(shù)函數(shù)的幅度可以小于所述第一復(fù)數(shù)函數(shù)的幅度,以使得能進(jìn)行左/右后操控,和/或所述第三復(fù)數(shù)函數(shù)的幅度小于所述第四復(fù)數(shù)函數(shù)的幅度。
第二復(fù)數(shù)函數(shù)和/或第三復(fù)數(shù)函數(shù)可以包括基本上等于正或負(fù)90度的相移,以防止信號(hào)與前通道貢獻(xiàn)抵銷。
在本發(fā)明的另一個(gè)實(shí)施例中,所述第一函數(shù)包括第一與第二函數(shù)部分,其中當(dāng)所述空間參數(shù)表明在所述第一立體聲信號(hào)中的后通道的貢獻(xiàn)比起前通道的貢獻(xiàn)增加時(shí),所述第二函數(shù)部分的輸出增加,以及所述第二函數(shù)部分包括基本上等于正或負(fù)90度的相移。這是為了防止信號(hào)與前通道相抵銷。另外,所述第四函數(shù)可包括第三與第四函數(shù)部分,其中當(dāng)所述空間參數(shù)表明在所述第二立體聲信號(hào)中的后通道的貢獻(xiàn)比起前通道的貢獻(xiàn)增加時(shí),所述第四函數(shù)部分的輸出增加,以及所述第四函數(shù)部分包括基本上等于正或負(fù)90度的相移。
第一函數(shù)部分與所述第四函數(shù)部分相比較時(shí)可以具有相反的正負(fù)號(hào)。第二函數(shù)部分與所述第三函數(shù)部分相比較時(shí)可以具有相反的正負(fù)號(hào)。第二函數(shù)部分與第四函數(shù)部分可以具有相同的正負(fù)號(hào),以及第三函數(shù)部分與第二函數(shù)部分可以具有相同的正負(fù)號(hào)。
本發(fā)明的另一方面,提供了用于按照上述的方法處理立體聲信號(hào)的裝置,以及一個(gè)包括這樣的裝置的編碼器。
本發(fā)明的另一方面,提供了用于處理包括第一與第二立體聲信號(hào)的立體聲下混合信號(hào)的方法,該方法包括按照上述的方法顛倒進(jìn)行處理操作的步驟。
本發(fā)明的另一方面,提供了用于按照上述的處理立體聲下混合信號(hào)的方法處理立體聲下混合信號(hào)的裝置,以及包括這樣的裝置的編碼器。
本發(fā)明的再一個(gè)方面,提供了包括這樣的編碼器設(shè)備和這樣的譯碼器設(shè)備的音頻系統(tǒng)。
通過參照本發(fā)明的實(shí)施例和附圖作出的本發(fā)明的以下的詳細(xì)說明將明白本發(fā)明的另外的目的、特性和優(yōu)點(diǎn),其中
圖1是按照本發(fā)明的、包括后處理和逆后處理的編碼器/譯碼器的音頻系統(tǒng)的框圖。
圖2是按照本發(fā)明的、用于處理立體聲信號(hào)的裝置的實(shí)施例的框圖。
圖3是顯示本發(fā)明的進(jìn)一步的細(xì)節(jié)的、類似于圖2的詳細(xì)框圖。
圖4是顯示本發(fā)明的再進(jìn)一步的細(xì)節(jié)的、類似于圖3的詳細(xì)框圖。
圖5是顯示本發(fā)明的另外進(jìn)一步的細(xì)節(jié)的、類似于圖3的詳細(xì)框圖。
圖6是按照本發(fā)明的、用于處理立體聲下混合信號(hào)的裝置的實(shí)施例的框圖。
本發(fā)明方法能夠使得矩陣譯碼成為可能,而不惡化參數(shù)化多通道重建。這是可能的,因?yàn)樵谙禄旌虾笤诰幋a器中應(yīng)用矩陣運(yùn)算技術(shù),這與通常在下混合以前完成矩陣運(yùn)算相反。下混合的矩陣運(yùn)算由空間參數(shù)控制。
如果所應(yīng)用的矩陣是可逆的,則譯碼器可以根據(jù)所傳送的編碼器信息參數(shù)P取消該矩陣運(yùn)算。
傳統(tǒng)上,矩陣運(yùn)算是施加到原始的N通道輸入信號(hào)上的。然而,這個(gè)方法在這里是不適用的,因?yàn)閷τ贜通道正確重建所必須的對這種矩陣運(yùn)算的求逆通常是不可能的,因?yàn)樵谧g碼器處可供使用的只有2個(gè)通道。因此,本發(fā)明的一個(gè)特點(diǎn)是用二通道混合的參數(shù)控制的修改方案來替代通常被施加到5通道混合的矩陣運(yùn)算技術(shù)。
圖1是引用本發(fā)明的編碼器/譯碼器的音頻系統(tǒng)的框圖。在音頻系統(tǒng)1中,N通道音頻信號(hào)被提供給編碼器2。編碼器2把N通道音頻信號(hào)變換為立體聲通道信號(hào)L0和R0以及編碼器信息參數(shù)P,譯碼器3通過該編碼器信息參數(shù)P可以對信息譯碼和近似地重建原先的N通道信號(hào)以供譯碼器3輸出。N通道信號(hào)可以是用于5.1系統(tǒng)的信號(hào),包括中心通道、兩個(gè)前通道、兩個(gè)環(huán)繞通道和低頻效果(LFE)通道。
傳統(tǒng)上,編碼的立體聲通道信號(hào)L0和R0以及編碼器信息參數(shù)P以適當(dāng)?shù)姆绞剑T如CD、DVD、廣播、激光光盤、DBS、數(shù)字電纜、互聯(lián)網(wǎng)或任何其它傳輸或分發(fā)系統(tǒng),傳送或分發(fā)給用戶,如用圖1的圓圈4表示的。由于傳送或分發(fā)的是左和右立體聲信號(hào)L0和R0,系統(tǒng)1與大量只能重現(xiàn)立體聲信號(hào)的接收設(shè)備是兼容的。如果接收設(shè)備包括參數(shù)化多通道譯碼器,則譯碼器可以根據(jù)在立體聲通道L0和R0中的信息和編碼器信息參數(shù)P來提供它們的估值而對N通道信號(hào)譯碼。
現(xiàn)在,假設(shè)一個(gè)N通道音頻信號(hào),N是大于2的整數(shù),以及其中z1[n],z2[n],...,zN[n]描述N通道的離散時(shí)域波形。這N個(gè)信號(hào)通過使用通常的分段方式、優(yōu)選地使用重疊分析窗口而被分段。隨后,每個(gè)分段通過使用復(fù)數(shù)變換(例如,F(xiàn)FT)而被變換成頻域。然而,復(fù)數(shù)濾波器組結(jié)構(gòu)也可以適用于得到時(shí)間/頻率片(tile)。這個(gè)過程導(dǎo)致輸入信號(hào)的經(jīng)分段的子頻帶表示,被表示為Z1[k],Z2[k],...,ZN[k],其中k表示頻率下標(biāo)。
從這N個(gè)通道,產(chǎn)生2個(gè)下混合通道,即L0[k]和R0[k]。每個(gè)下混合通道是N個(gè)輸入信號(hào)的線性組合L0[k]=Σi=1NαiZi[k]]]>R0[k]=Σi=1NβiZi[k]]]>參數(shù)αi和βi被選擇成使得由L0[k]和R0[k]組成的立體聲信號(hào)具有良好的立體聲形像。
后處理器5可以對于最終得到的立體聲信號(hào)進(jìn)行處理,以使得它主要影響在立體聲混合中特定的通道i的貢獻(xiàn)。作為處理,可以選擇特定的矩陣運(yùn)算技術(shù)。這導(dǎo)致左和右矩陣可兼容的信號(hào)L0w[k]和R0w[k]。這些信號(hào)連同空間參數(shù)一起,被傳送到譯碼器,如圖1的圓圈6顯示的。用于處理從編碼器得到的立體聲信號(hào)的裝置包括后處理器5。按照本發(fā)明的編碼器設(shè)備包括編碼器2和后處理器5。
后處理的信號(hào)L0w和R0w可被提供到傳統(tǒng)的立體聲接收機(jī)(未示出),以用于重放。替換地,后處理的信號(hào)L0w和R0w可被提供到矩陣譯碼器(未示出),例如Dolby Pro Logic譯碼器或Circle Surround譯碼器。再一個(gè)可能性是把后處理的信號(hào)L0w和R0w提供到逆后處理器7,以用于取消后處理器5的處理。最終得到的信號(hào)L0和R0可以由后處理器7提供給多通道譯碼器3。用于處理立體聲下混合信號(hào)的譯碼器包括逆后處理器7。按照本發(fā)明的譯碼器設(shè)備包括譯碼器3和逆后處理器7。
在譯碼器3中,N通道信號(hào)被重建為如下Z^i[k]=C1,Z,L0[k]+C2,Z,R0[k],]]>其中 是Zi[k]的估值。濾波器C1,zi和C2,zi優(yōu)選地與時(shí)間和頻率有關(guān),它們的轉(zhuǎn)移函數(shù)是根據(jù)傳送的編碼器信息參數(shù)P而推導(dǎo)的。
圖2顯示這個(gè)后處理塊5可以如何被實(shí)施,以使得矩陣譯碼成為可能。左輸入信號(hào)L0[k]由第一復(fù)數(shù)函數(shù)g1修改,這導(dǎo)致第一信號(hào)L0wL[k],它被饋送到左輸出L0w[k]。左輸入信號(hào)L0[k]還由第二復(fù)數(shù)函數(shù)g2修改,這導(dǎo)致第二信號(hào)R0wL[k],它被饋送到右輸出R0w[k]。函數(shù)g1和g2被選擇成使得差值信號(hào)L0wL-R0wL具有等于或大于和值信號(hào)L0wL+R0wL的能量。這是因?yàn)樵诰仃囎g碼中,和值信號(hào)與差值信號(hào)的比值用來執(zhí)行前/后向控制。當(dāng)差值信號(hào)變?yōu)楦髸r(shí),更多的輸入信號(hào)被控制到后向。因?yàn)檫@樣,當(dāng)在L0[k]中左后方的貢獻(xiàn)增加時(shí),R0wL[k]必須增加。這個(gè)控制過程由作為空間參數(shù)P的函數(shù)的函數(shù)g1和g2完成。這些函數(shù)被選擇成使得當(dāng)在L0[k]中左后方的貢獻(xiàn)增加時(shí),左輸入通道的處理量增加。
g2的幅度優(yōu)選地小于g1的幅度。這允許在譯碼器中進(jìn)行左/右后通道控制。
右輸入信號(hào)R0[k]由第四函數(shù)g4修改,這導(dǎo)致第四信號(hào)R0wR[k],它被饋送到右輸出R0w[k]。右輸入信號(hào)R0[k]還由第三函數(shù)g3修改,這導(dǎo)致第三信號(hào)L0wR[k],它被饋送到左輸出L0w[k]。函數(shù)g3和g4被選擇成使得當(dāng)在R0[k]中的右后方的貢獻(xiàn)增加時(shí),右輸入通道的處理量增加,以及還使得從R0wR中減去L0wR比起它們的相加導(dǎo)致更大的信號(hào)。
g3的幅度優(yōu)選地小于g4的幅度。這允許在譯碼器中進(jìn)行左/右后通道控制。
輸出可以藉助于以下的矩陣描述[L0wR0w]=H[L0R0]=g1g3g2g4L0R0]]>參數(shù)化多通道編碼器在下面描述。應(yīng)用了以下的公式L0[k]=L[k]+Cs[k]R0[k]=R[k]+Cs[k]其中Cs[k]是在把LFE通道和中心通道組合后得出的單聲道信號(hào)。以下的公式對于L[k]和R[k]都成立
L[k]=(c1c2)Lf[k]Ls[k]]]>R[k]=(c3c4)Rf[k]Rs[k]]]>其中Lf是左前通道,Ls是左環(huán)繞聲通道,Rf是右前通道,Rs是右環(huán)繞聲通道。常數(shù)c1到c4控制下混合過程,以及可以是復(fù)數(shù)值和/或與時(shí)間和頻率有關(guān)。對于(c1,c3=sqrt(2);c2,c4=1)得到ITU-方式下混合。
在譯碼器中,執(zhí)行以下的重建L^[k]=βL0[k]+(γ-1)R0[k]]]>R^[k]=(β-1)L0[k]+γR0[k]]]>C^[k]=(1-β)L0[k]+(1-γ)R0[k]]]>其中 是L[k]的估值, 是R[k]的估值以及 是C[k]的估值。參數(shù)β和γ在編碼器中被確定,以及被傳送到譯碼器,即,它們是編碼器信息參數(shù)P的子集。另外,信息信號(hào)P可包括在相應(yīng)的前通道與環(huán)繞通道之間的(相對)信號(hào)電平,即分別是在Lf,Ls與Rf,Rs之間的通道間強(qiáng)度差值(IID)。對于描述在Lf與Ls之間的能量比值的IIDL的一個(gè)方便的表示式被給出為IIDL=ΣkLf[k]Lf*[k]ΣkLs[k]Ls*[k]]]>當(dāng)這些參數(shù)被使用時(shí),圖2上的方案可以用圖3上的方案替代。為了處理左通道L0[k],僅僅需要確定在左輸入通道中前后貢獻(xiàn)的參數(shù),它們是參數(shù)IIDL和β。為了處理右輸入通道,僅僅需要參數(shù)IIDR和γ。函數(shù)g2現(xiàn)在可以用函數(shù)g3替代,但正負(fù)號(hào)相反。
在圖4上,函數(shù)g1和g4都被分割成兩個(gè)并行的函數(shù)部分。函數(shù)g1被分割成g11和g12。函數(shù)g4被分割成g11和-g12。函數(shù)部分g12和函數(shù)g1的輸出信號(hào)是后通道的貢獻(xiàn)。函數(shù)部分g12和函數(shù)g3在一個(gè)輸出中需要以相同的正負(fù)號(hào)相加,以避免信號(hào)抵銷,以及在不同的輸出中以有相反的正負(fù)號(hào)。
函數(shù)部分g12和函數(shù)g3都包含正或負(fù)90度的相移。這是為了避免前通道貢獻(xiàn)的抵銷(函數(shù)部分g11的輸出)。
圖5給出這個(gè)方塊的更詳細(xì)的說明。參數(shù)wl確定L0[k]的處理量以及參數(shù)wr確定R0[k]的處理量。當(dāng)wl等于0時(shí),L0[k]不用處理,以及當(dāng)wl等于1時(shí),L0[k]有最大的處理。同樣的情形對于wr相對于R0[k]也成立。
以下的歸一化的公式對于后處理參數(shù)wl和wr成立wl=f1(p)wr=fr(p)方塊Φ-90是執(zhí)行90度移相的全通濾波器。圖5上的方塊G1和G2是增益。最終得到的輸出是L0wR0w=HL0R0]]>,其中,H=1-wl+wlΦ-90wrΦ-90G2-wlΦ-90G11-wr-wrΦ-90]]>其中G1=f1(wl,wr)G2=f2(wl,wr)所以函數(shù)g1,...,g4用更具體的函數(shù)替代g1=1-wl+wlΦ-90g2=-wlΦ-90G1g3=wrΦ-90G2g4=1-wr=wrΦ-90矩陣H的逆矩陣被給出為(如果det(H)≠0)
H-1=11-wl-wr+wlwr+(wl-wr)Φ-90+(G1G2-1)wlwrΦ-1801-wr-wrΦ-90-wrΦ-90G2wlΦ-90G11-wl+wlΦ-90]]>因此,在矩陣H中使用適當(dāng)?shù)暮瘮?shù)允許矩陣運(yùn)算處理過程被顛倒。
該顛倒可以在譯碼器中完成而不必傳送附加的信息,因?yàn)閰?shù)wl和wr可以根據(jù)傳送的參數(shù)來計(jì)算。因此,原先的立體聲信號(hào)將可重新得到,這對于多通道混合的參數(shù)譯碼是必須的。
如果增益G1和G2是在各環(huán)繞聲道之間的通道間強(qiáng)度差值(IID)的函數(shù),則可以得到更好的結(jié)果。在這種情形下,這個(gè)IID也必須被傳送到譯碼器。
在給定上述的參數(shù)說明后,以下的函數(shù)用于后處理運(yùn)算wl=f1(αl)f2(β)wr=f3(αr)f4(γ)這里,f1,...,f4可以是任意函數(shù)。例如f1(IID)=f3(IID)=IID1+IDD]]> 全通濾波器Φ-90可以通過在(復(fù)數(shù)值)頻域中執(zhí)行與復(fù)數(shù)算子j(j2=-1)的乘法而有效地實(shí)現(xiàn)。對于增益G1和G2,wl和wr的函數(shù)可被取為如在Circle Surround中完成的那樣,但一個(gè)其值為1/的常數(shù)也是適用的。這導(dǎo)致矩陣H=1-wl+wlj122wrj-122wlj1-wr-wrj]]>這個(gè)矩陣的行列式等于
det(H)=(1-wl-wr+32wlwr)+j(wl-wr)]]>當(dāng)wl=wr時(shí),這個(gè)行列式的虛部將只等于零。在這種情形下,對于該行列式下式成立det(H)=1-2wl+32wl2]]>這個(gè)函數(shù)對于wl=2/3具有det(H)=1/3的最小值。
因此,對于wl=wr,這個(gè)矩陣是可逆的。所以,對于增益G1=G2=1/,矩陣H總是可逆的,與wl和wr無關(guān)。
圖6是逆后處理器7的實(shí)施例的框圖。像后處理那樣,求逆可以通過對每個(gè)頻段進(jìn)行矩陣乘法而完成L0R0=H-1L0wR0w=k1k3k2k4L0wR0w]]>其中k1=1g1g4-g2g3g4]]>k2=-1g1g4-g2g3g2]]>k3=-1g1g4-g2g3g3]]>k4=1g1g4-g2g3g1]]>因此,當(dāng)可以在譯碼器中確定g1,...,g4時(shí),就可以確定函數(shù)k1,...,k4。函數(shù)k1,...,k4。是參數(shù)組P的函數(shù),如函數(shù)g1,...,g4那樣。因此為了求逆,需要知道函數(shù)g1,...,g4和參數(shù)組P。
當(dāng)矩陣H的行列式不等于零時(shí),即det(H)=g1g4-g2g3≠0矩陣H可以求逆。
這可以通過適當(dāng)?shù)剡x擇函數(shù)g1,...,g4而達(dá)到。
本發(fā)明的另一個(gè)應(yīng)用是僅僅在譯碼器側(cè)對立體聲信號(hào)執(zhí)行后處理操作(即,在編碼器側(cè)不進(jìn)行后處理)。使用這種方法,譯碼器可以從未增強(qiáng)的立體聲信號(hào)生成增強(qiáng)的立體聲信號(hào)。僅僅在譯碼器側(cè)的這個(gè)后處理操作還可以在編碼器中多通道信號(hào)被譯碼成單個(gè)(單聲道)信號(hào)和相關(guān)的空間參數(shù)的情形下被精心完成。在譯碼器中,單聲道信號(hào)首先可以(通過使用空間參數(shù))被變換成立體聲信號(hào),此后,這個(gè)立體聲信號(hào)可以如上所述進(jìn)行后處理。替換地,單聲道信號(hào)可以由多通道譯碼器被直接譯碼。
應(yīng)當(dāng)指出,動(dòng)詞“包括”和它的派生物的使用不排除其它單元或步驟,以及不定冠詞“一個(gè)”的使用不排除多個(gè)單元或步驟。而且,在權(quán)利要求中的標(biāo)號(hào)并不被看作為限制權(quán)利要求的范圍。
本發(fā)明是參照具體的實(shí)施例描述的。然而,本發(fā)明并不限于所描述的各種實(shí)施例,但可以以不同的方式被修改和組合,正如閱讀本技術(shù)說明書的本領(lǐng)域技術(shù)人員看到的。
權(quán)利要求
1.一種對從編碼器得到的立體聲信號(hào)進(jìn)行處理的方法,該編碼器把N通道音頻信號(hào)編碼成空間參數(shù)(P)和一個(gè)包括第一與第二立體聲信號(hào)(L0,R0)的立體聲下混合信號(hào),該方法包括以下步驟把第一與第三信號(hào)相加以得到第一輸出信號(hào)(L0w),其中所述第一信號(hào)(L0wL)包括由第一復(fù)數(shù)函數(shù)(g1)修改的所述第一立體聲信號(hào)(L0),和其中所述第三信號(hào)(L0wR)包括由第三復(fù)數(shù)函數(shù)(g3)修改的所述第二立體聲信號(hào)(R0);以及把第二與第四信號(hào)相加以得到第二輸出信號(hào)(R0w),其中所述第四信號(hào)(R0wL)包括由第四復(fù)數(shù)函數(shù)(g4)修改的所述第二立體聲信號(hào)(R0),和其中所述第二信號(hào)(R0wL)包括由第二復(fù)數(shù)函數(shù)(g2)修改的所述第一立體聲信號(hào)(L0);其中所述復(fù)數(shù)函數(shù)(g1,g2,g3,g4)是所述空間參數(shù)(P)的函數(shù),它們被選擇成使得在第一信號(hào)與第二信號(hào)之間的差值(L0wL-R0wL)的能量值大于或等于第一與第二信號(hào)的總和(L0wL+R0wL)的能量值,以及以使得在第四信號(hào)與第三信號(hào)之間的差值(R0wR-L0wR)的能量值大于或等于第四與第三信號(hào)的總和(R0wR+L0wR)的能量值。
2.權(quán)利要求1的方法,其中N通道音頻信號(hào)包括前通道信號(hào)和后通道信號(hào),以及其中所述空間參數(shù)(P)包括包括在立體聲下混合(L0,R0)中的后通道相對于這里的前通道的貢獻(xiàn)的相對貢獻(xiàn)的度量。
3.權(quán)利要求1或2的方法,其中所述第二復(fù)數(shù)函數(shù)(g2)的幅度小于所述第一復(fù)數(shù)函數(shù)(g1)的幅度,和/或所述第三復(fù)數(shù)函數(shù)(g3)的幅度小于所述第四復(fù)數(shù)函數(shù)(g4)的幅度。
4.權(quán)利要求1,2或3的方法,其中所述第二復(fù)數(shù)函數(shù)(g2)和/或所述第三復(fù)數(shù)函數(shù)(g3)包括一個(gè)基本上等于正或負(fù)90度的相移。
5.前述權(quán)利要求的任一項(xiàng)的方法,其中所述第一函數(shù)(g1)包括第一與第二函數(shù)部分(g11L;g12L),其中當(dāng)所述空間參數(shù)(P)表明在所述第一立體聲信號(hào)(L0)中的后通道的貢獻(xiàn)比起在所述第一立體聲信號(hào)(L0)中前通道的貢獻(xiàn)增加時(shí),所述第二函數(shù)部分(g12L)的輸出增加,以及所述第二函數(shù)部分(g12L)包括一個(gè)基本上等于正或負(fù)90度的相移。
6.權(quán)利要求5的方法,其中所述第四函數(shù)(g4)包括第三與第四函數(shù)部分(g11R;g12R),其中當(dāng)所述空間參數(shù)(P)表明在所述第二立體聲信號(hào)(R0)中的后通道的貢獻(xiàn)比起在所述第二立體聲信號(hào)(R0)中前通道的貢獻(xiàn)增加時(shí),所述第四函數(shù)部分(g12R)的輸出增加,以及所述第四函數(shù)部分(g12R)包括一個(gè)基本上等于正或負(fù)90度的相移。
7.權(quán)利要求6的方法,其中所述第一函數(shù)部分(g12L)具有與所述第四函數(shù)部分(g12R)相比較為相反的正負(fù)號(hào)。
8.權(quán)利要求6的方法,其中所述第二函數(shù)(g2)具有與所述第三函數(shù)(g3)相比較為相反的正負(fù)號(hào)。
9.權(quán)利要求7或8的方法,其中所述第二函數(shù)(g2)與所述第四函數(shù)部分(g12R)具有相同的正負(fù)號(hào),以及所述第三函數(shù)(g3)與所述第二函數(shù)部分(g12L)具有相同的正負(fù)號(hào)。
10.一種用于處理從編碼器得到的立體聲信號(hào)的裝置(5),該編碼器把N通道音頻信號(hào)編碼成空間參數(shù)(P)和一個(gè)包括第一與第二立體聲信號(hào)(L0,R0)的立體聲下混合信號(hào),該裝置包括第一加法裝置,用于把第一與第三信號(hào)相加以得到第一輸出信號(hào)(L0w),其中所述第一信號(hào)(L0wL)包括由第一復(fù)數(shù)函數(shù)(g1)修改的所述第一立體聲信號(hào)(L0),和其中所述第三信號(hào)(L0wR)包括由第三復(fù)數(shù)函數(shù)(g3)修改的所述第二立體聲信號(hào)(R0);以及第二加法裝置,用于把第二與第四信號(hào)相加以得到第二輸出信號(hào)(R0w),其中所述第四信號(hào)(R0wL)包括由第四復(fù)數(shù)函數(shù)(g4)修改的所述第二立體聲信號(hào)(R0),和其中所述第二信號(hào)(R0wL)包括由第二復(fù)數(shù)函數(shù)(g2)修改的所述第一立體聲信號(hào)(L0);其中所述復(fù)數(shù)函數(shù)(g1,g2,g3,g4)是所述空間參數(shù)(P)的函數(shù),它們使得在第一信號(hào)與第二信號(hào)之間的差值(L0wL-R0wL)的能量值大于或等于第一與第二信號(hào)的總和(L0wL+R0wL)的能量值,以及以使得在第四信號(hào)與第三信號(hào)之間的差值(R0wR-L0wR)的能量值大于或等于第四與第三信號(hào)的總和(R0wR+L0wR)的能量值。
11.編碼器設(shè)備,包括編碼器(2),用于把N通道音頻信號(hào)編碼成空間參數(shù)(P)和一個(gè)包括第一與第二立體聲信號(hào)(L0,R0)的立體聲下混合信號(hào),以及如在權(quán)利要求10中要求的用于處理立體聲下混合信號(hào)的裝置(5)。
12.一種處理包括第一與第二立體聲信號(hào)(L0w,R0w)的立體聲下混合信號(hào)的方法,該方法包括顛倒按照權(quán)利要求1到9的任一項(xiàng)的方法的處理操作的步驟。
13.一種處理包括第一與第二立體聲信號(hào)(L0w,R0w)的立體聲下混合信號(hào)的裝置(7),該裝置包括用于顛倒按照權(quán)利要求1到9的任一項(xiàng)的方法的處理操作的裝置。
14.譯碼器設(shè)備,包括如在權(quán)利要求13中要求的用于處理包括第一與第二立體聲信號(hào)(L0w,R0w)的立體聲下混合信號(hào)的裝置(7),以及譯碼器,用于把所處理的立體聲信號(hào)(L0,R0)譯碼成N通道音頻信號(hào)。
15.包括如在權(quán)利要求11中要求的編碼器設(shè)備與如在權(quán)利要求14中要求的譯碼器設(shè)備的音頻系統(tǒng)。
全文摘要
描述了一種用于處理從編碼器得到的立體聲信號(hào)的方法和裝置,該編碼器把N通道音頻信號(hào)編碼成空間參數(shù)(P)和包括第一與第二立體聲信號(hào)(L
文檔編號(hào)G10L19/00GK1985544SQ200580023855
公開日2007年6月20日 申請日期2005年7月7日 優(yōu)先權(quán)日2004年7月14日
發(fā)明者M·W·范盧恩, D·J·布里巴爾特, G·H·霍索, E·G·P·舒伊杰斯, H·普恩哈根, K·J·羅登 申請人:皇家飛利浦電子股份有限公司, 編碼技術(shù)股份有限公司