專(zhuān)利名稱(chēng):立體聲信號(hào)的編碼、解碼方法和裝置及其傳輸設(shè)備的制作方法
本發(fā)明涉及包括至少第一和第二信號(hào)部分的多通道信號(hào)的編碼。更特別的,本發(fā)明涉及多聲道音頻信號(hào)例如立體聲信號(hào)的編碼。
立體聲音頻信號(hào)包括來(lái)自立體聲信號(hào)源(例如分離的麥克風(fēng))的左(L)信號(hào)部分和右(R)信號(hào)部分。音頻信號(hào)編碼的目的是減少立體聲信號(hào)的比特率,例如為了實(shí)現(xiàn)聲音信號(hào)通過(guò)通信網(wǎng)絡(luò)(例如因特網(wǎng)、調(diào)制解調(diào)器和模擬電話線、移動(dòng)信道或者其他無(wú)線網(wǎng)絡(luò)等等)的高效傳輸,以及在智能卡或者其他具有有限存儲(chǔ)容量的存儲(chǔ)介質(zhì)上存儲(chǔ)立體聲信號(hào)。
美國(guó)專(zhuān)利6121904披露了一種用于壓縮數(shù)字音頻信號(hào)的壓縮器,其包括相應(yīng)于左右立體聲通道的預(yù)測(cè)器。用于左聲道的預(yù)測(cè)器接收左音頻信號(hào)的當(dāng)前和在先采樣以及右音頻信號(hào)的當(dāng)前和在先采樣,并且產(chǎn)生左信號(hào)的下一個(gè)預(yù)測(cè)采樣。類(lèi)似地,用于右聲道的預(yù)測(cè)器接收右音頻信號(hào)的當(dāng)前和在先采樣以及左音頻信號(hào)的當(dāng)前和在先采樣,并且產(chǎn)生右信號(hào)的下一個(gè)預(yù)測(cè)采樣。
本發(fā)明的目的是提供一種以低比特率編碼多通道信號(hào)的方法和裝置。
通過(guò)一種包括至少第一信號(hào)部分和第二信號(hào)部分的多通道信號(hào)的編碼方法來(lái)達(dá)到以上和其他目的,本方法包括步驟—確定一預(yù)測(cè)濾波器的一組濾波參數(shù),從而預(yù)測(cè)濾波器接收到第一信號(hào)部分作為輸入時(shí)提供第二信號(hào)部分的估計(jì);和—將多通道信號(hào)表示成第一信號(hào)部分和這組濾波參數(shù)。
從而,通過(guò)以第一信號(hào)部分和一組濾波參數(shù)來(lái)編碼多通道信號(hào),就用了僅比一個(gè)單獨(dú)通道例如單通道略高的比特率對(duì)多通道信號(hào)編碼。所得到的編碼信號(hào)可以存儲(chǔ)和/或傳送到一個(gè)接收器。本發(fā)明所基于的是認(rèn)為,對(duì)于許多多通道信號(hào)來(lái)說(shuō),一個(gè)信號(hào)部分可以通過(guò)自適應(yīng)濾波處理從多通道信號(hào)的至少一個(gè)其他通道來(lái)預(yù)測(cè)。因此,當(dāng)所確定的濾波參數(shù)被傳輸?shù)浇獯a器時(shí),就可以在第一信號(hào)部分和該濾波參數(shù)的基礎(chǔ)上恢復(fù)該多通道信號(hào),并且解碼器可以對(duì)第二信號(hào)部分建模。
術(shù)語(yǔ)多通道信號(hào)包括任何具有兩個(gè)或更多相關(guān)信號(hào)部分的信號(hào)。這種信號(hào)的例子包括例如立體聲信號(hào)或相似信號(hào)的多聲道音頻信號(hào),其包括相同音頻表示的同步記錄。根據(jù)本發(fā)明的一些實(shí)施例,多通道信號(hào)包括一個(gè)多通道聲源信號(hào)的變換信號(hào)部分,例如將L和R立體聲信號(hào)變換成一組更適于根據(jù)本發(fā)明依據(jù)另一個(gè)信號(hào)部分對(duì)一個(gè)信號(hào)部分建模的變換信號(hào)而產(chǎn)生的變換立體聲信號(hào)部分。多通道信號(hào)的進(jìn)一步示例包括從數(shù)字通用光碟(DVD)或超級(jí)音頻光碟等中接收的信號(hào)。
在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,確定一組濾波器參數(shù)的步驟包括確定濾波器參數(shù)的步驟從而使第二信號(hào)部分和估計(jì)的信號(hào)部分的差小于一個(gè)預(yù)定值。當(dāng)建模信號(hào)和第二信號(hào)部分之間的差比較小時(shí),建模信號(hào)提供第二信號(hào)部分的較好估計(jì)。因此,提供了對(duì)于質(zhì)量的度量,以便建模第二信號(hào)部分,從而保證根據(jù)本發(fā)明的編碼處理提供最小的質(zhì)量降低,例如該信號(hào)的立體聲音頻信號(hào)最小可聞失真。
根據(jù)本發(fā)明一個(gè)進(jìn)一步的優(yōu)選實(shí)施例,將多通道信號(hào)表示成第一信號(hào)部分和一組濾波參數(shù)的步驟進(jìn)一步包括如果所述差不小于所述預(yù)定值,則將多通道信號(hào)表示成第一信號(hào)部分、該組濾波參數(shù)和一個(gè)表示第二信號(hào)部分和估計(jì)信號(hào)部分之差的誤差信號(hào)的步驟。
因此,如果濾波步驟提供的估計(jì)信號(hào)沒(méi)有很好的建模第二信號(hào)部分,編碼信號(hào)中就包含誤差信號(hào)以便為解碼器提供額外的信息。解碼器可以綜合預(yù)測(cè)信號(hào)和接收到的誤差信號(hào),從而得到第二信號(hào)部分的一個(gè)較好近似。用于傳輸誤差信號(hào)的比特率可以變化,例如根據(jù)通信連接在給定時(shí)間的可用帶寬而變化。因而,本發(fā)明的優(yōu)勢(shì)在于提供了在用于傳輸信號(hào)的比特率和接收器中的信號(hào)質(zhì)量之間進(jìn)行折衷的可能。因此提供一種完美降低的技術(shù),例如通過(guò)自適應(yīng)地增加或減少誤差信號(hào)所用的比特率。
在本發(fā)明的另一優(yōu)選實(shí)施例中,該方法進(jìn)一步包括將多通道源信號(hào)的至少第一源信號(hào)部分和第二源信號(hào)部分變換成第一和第二信號(hào)部分的步驟。因此第一和第二信號(hào)部分分別是第一和第二源信號(hào)部分的組合,從而提供更適于將第二信號(hào)部分預(yù)測(cè)為相應(yīng)的源信號(hào)的預(yù)測(cè)濾波器的輸入信號(hào)。變換的例子包括第一和第二源信號(hào)的線性組合,例如在立體聲音頻信號(hào)的情況下L+R和L-R的組合。進(jìn)一步的例子包括信號(hào)空間的旋轉(zhuǎn)和其他變換。該變換可以通過(guò)固定的或自適應(yīng)的變換參數(shù)來(lái)參數(shù)化,即它們可以根據(jù)源信號(hào)的屬性進(jìn)行調(diào)整。
在本發(fā)明的一個(gè)進(jìn)一步的實(shí)施例中,—所述第一信號(hào)部分是包括多個(gè)源信號(hào)部分的多通道源信號(hào)的主成分信號(hào),而第二信號(hào)部分是相應(yīng)的殘余信號(hào);—該方法進(jìn)一步包括通過(guò)預(yù)定變換將至少第一和第二源信號(hào)變換成包含大部分信號(hào)能量的主成分信號(hào)和比主成分信號(hào)包含更少能量的至少一個(gè)殘余信號(hào),通過(guò)至少一個(gè)變換參數(shù)對(duì)預(yù)定變換進(jìn)行參數(shù)化;和—將多通道信號(hào)表示成第一信號(hào)部分和該組濾波參數(shù)的步驟進(jìn)一步包括將多通道信號(hào)表示成主成分信號(hào)、該組濾波參數(shù)和變換參數(shù)的步驟。
因此,根據(jù)本實(shí)施例,多通道信號(hào)通過(guò)主信號(hào)、變換參數(shù)和用于由接收器對(duì)小殘余信號(hào)建模的一組濾波參數(shù)表示,從而提高了多通道信號(hào)的編碼效率。本實(shí)施例所基于的是,對(duì)于許多多通道信號(hào)(例如在音樂(lè)音頻信號(hào)和語(yǔ)音信號(hào)的情況下),殘余信號(hào)可以作為主信號(hào)的濾波版本而被準(zhǔn)確估計(jì)。因而本實(shí)施例的優(yōu)勢(shì)在于提供一種保持較高質(zhì)量的特別高效的編碼方法。
優(yōu)選的,可以連續(xù)追蹤最優(yōu)的變換參數(shù),從而保證即便輸入信號(hào)的特征發(fā)生改變,例如在音頻信號(hào)的例子中由于聲源的移動(dòng)或者環(huán)境聲學(xué)特性的變化產(chǎn)生的輸入信號(hào)的特征改變,仍然能夠保持變換是最優(yōu)。
當(dāng)預(yù)定變換是旋轉(zhuǎn)并且變換參數(shù)對(duì)應(yīng)于一個(gè)旋轉(zhuǎn)角度時(shí),僅基于一個(gè)單一參數(shù)(旋轉(zhuǎn)角度)來(lái)提供一個(gè)簡(jiǎn)單的變換。通過(guò)調(diào)整該角度使得信號(hào)部分即立體聲信號(hào)的L和R信號(hào)部分旋轉(zhuǎn)成主成分信號(hào)和殘余信號(hào),這樣在保持高質(zhì)量信號(hào)的同時(shí)提供了一種有效編碼。
本發(fā)明的優(yōu)點(diǎn)在于提供一種高效的比特率利用,即一個(gè)對(duì)于給定聲音質(zhì)量使用低速率的編碼方案。這個(gè)根據(jù)本發(fā)明的編碼方案可以用于不顯著降低聲音質(zhì)量地降低比特率,在提高聲音質(zhì)量的同時(shí)保持比特率,或者兩者的結(jié)合。
在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,確定一組濾波參數(shù)的步驟進(jìn)一步包括確定至少一個(gè)用于縮放對(duì)于第二信號(hào)部分的估計(jì)的縮放參數(shù)(β1,β2)的步驟,以便于增加第二信號(hào)部分和的估計(jì)第二信號(hào)部分之間的相關(guān)度量。因而優(yōu)化了估計(jì)和信號(hào)之間的相似性度量,從而提高了編碼信號(hào)的質(zhì)量。
本發(fā)明進(jìn)一步涉及一種解碼多通道信號(hào)信息的方法,該方法包括步驟—接收第一信號(hào)部分和一組濾波參數(shù);—利用相應(yīng)于所接收的濾波參數(shù)組的預(yù)測(cè)濾波器來(lái)估計(jì)第二信號(hào)部分,預(yù)測(cè)濾波器接收所接收的第一信號(hào)部分作為輸入。
本發(fā)明可以通過(guò)不同的方式來(lái)實(shí)現(xiàn),包括上述的方法以及下列的,編碼和解碼多通道信號(hào)的裝置,分別地可以是數(shù)據(jù)信號(hào),和進(jìn)一步的產(chǎn)品設(shè)備,每個(gè)都具有所述與第一種提及的方法有關(guān)的一個(gè)或多個(gè)好處和優(yōu)點(diǎn),以及每個(gè)都具有和所述與第一種提及的方法有關(guān)的優(yōu)選實(shí)施例相應(yīng)的一個(gè)或多個(gè)優(yōu)選實(shí)施例,并且記載在從屬權(quán)利要求
。
要注意的是,上面和以下所述的方法的特征可以用軟件來(lái)實(shí)現(xiàn)并且在數(shù)據(jù)處理系統(tǒng)或者其他通過(guò)計(jì)算機(jī)可執(zhí)行指令的執(zhí)行來(lái)激發(fā)的處理設(shè)備中執(zhí)行。這些指令可以以程序代碼方式從存儲(chǔ)介質(zhì)或者通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)從另一臺(tái)計(jì)算機(jī)載入例如RAM的存儲(chǔ)器中??蛇x地,所述特征可以通過(guò)硬連線電路代替軟件或與軟件相結(jié)合來(lái)實(shí)現(xiàn)。
本發(fā)明進(jìn)一步涉及一種用于編碼包括至少第一信號(hào)部分和第二信號(hào)部分的多通道信號(hào)的裝置,該裝置包括—用于估計(jì)第二信號(hào)部分的預(yù)測(cè)濾波器,該預(yù)測(cè)濾波器對(duì)應(yīng)于一組濾波參數(shù)并且接收第一信號(hào)部分作為輸入;和—用于將多通道信號(hào)表示成第一信號(hào)部分和該組濾波參數(shù)的處理設(shè)備。
本發(fā)明進(jìn)一步涉及一種用于解碼對(duì)應(yīng)至少兩個(gè)信號(hào)部分的多通道信號(hào)的裝置,該裝置包括—用于接收多通道信號(hào)的第一信號(hào)部分和一組濾波參數(shù)的接收設(shè)備;—用于估計(jì)多通道信號(hào)的第二信號(hào)部分的預(yù)測(cè)濾波器,預(yù)測(cè)濾波器接收所接收的該組濾波參數(shù)和所接收的第一信號(hào)部分作為輸入。
上述裝置可以是任何包括計(jì)算機(jī)的電子設(shè)備的一部分,例如固定和便攜式PC,固定和便攜式無(wú)線電通訊設(shè)備,和其他手持或便攜式裝置例如移動(dòng)電話,呼機(jī),音頻播放器,多媒體播放機(jī),發(fā)報(bào)機(jī)即電子組織器,智能電話,個(gè)人數(shù)字助理(PDA),掌上電腦等等。
術(shù)語(yǔ)處理設(shè)備包括通用或特殊用途的可編程微處理器,數(shù)字信號(hào)處理器(DSP),專(zhuān)用集成電路(ASIC),可編程邏輯陣列(PLA),現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA),特定用途的電子電路等,或者它們的組合。上面的第一和第二處理設(shè)備可以是分離的處理設(shè)備或者它們也可以包括在一個(gè)處理設(shè)備中。
術(shù)語(yǔ)接收設(shè)備包含適于能夠例如通過(guò)有線或無(wú)線數(shù)據(jù)鏈路進(jìn)行數(shù)據(jù)傳輸?shù)碾娐泛?或裝置。這種接收設(shè)備的例子包括網(wǎng)絡(luò)接口,網(wǎng)卡,無(wú)線電接收器,用于其他合適的電磁信號(hào),例如通過(guò)IrDa端口的紅外線接收器,基于無(wú)線電的通信,例如通過(guò)藍(lán)牙收發(fā)信機(jī),等等。這種接收設(shè)備進(jìn)一步的例子包括線纜調(diào)制解調(diào)器,電話調(diào)制解調(diào)器,綜合服務(wù)數(shù)字網(wǎng)(ISDN)適配器,數(shù)字用戶線路(DSL)適配器,衛(wèi)星收發(fā)機(jī),以太網(wǎng)適配器等等。
術(shù)語(yǔ)接收設(shè)備進(jìn)一步包括其他用于接收數(shù)字信號(hào)例如存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的數(shù)字信號(hào)的輸入電路/裝置。這種接收設(shè)備的例子包括軟盤(pán)驅(qū)動(dòng)器,光盤(pán)驅(qū)動(dòng)器,DVD驅(qū)動(dòng)器,或其他任何合適的盤(pán)驅(qū)動(dòng)器、存儲(chǔ)卡適配器、智能卡適配器等。
本發(fā)明進(jìn)一步涉及一種包含多通道信號(hào)信息的數(shù)字信號(hào),該數(shù)字信號(hào)由上下文所述的方法生成。該信號(hào)可以具體化為一種載波中的數(shù)字信號(hào),例如由如上下文所述的通信設(shè)備傳輸?shù)臄?shù)字信號(hào)。
本發(fā)明進(jìn)一步涉及一種包括由上下文所述方法生成的表示多通道信號(hào)信息的數(shù)字記錄的計(jì)算機(jī)可讀介質(zhì)。術(shù)語(yǔ)計(jì)算機(jī)可讀介質(zhì)包括磁帶,光盤(pán),數(shù)字視頻光盤(pán)(DVD),壓縮光盤(pán)(CD或CD-ROM),小型盤(pán),硬盤(pán),軟盤(pán),鐵電存儲(chǔ)器,電可擦除可編程只讀存儲(chǔ)器(EEPROM),閃存,EPROM,只讀存儲(chǔ)器(ROM),靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM),同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(SDRAM),鐵磁存儲(chǔ)器,光學(xué)存儲(chǔ)器,電荷耦合裝置,智能卡,PCMCIA卡等。
本發(fā)明進(jìn)一步涉及一種傳輸多通道信號(hào)的裝置,該裝置包括如上下文所述編碼多通道信號(hào)的設(shè)備。
根據(jù)參照實(shí)施例和參照附圖的說(shuō)明,本發(fā)明的這些和其他方面會(huì)更明白,其中;
圖1顯示了根據(jù)本發(fā)明的實(shí)施例用于傳輸立體聲信號(hào)的系統(tǒng)的示意圖;圖2顯示了根據(jù)本發(fā)明的第一實(shí)施例用于編碼多通道信號(hào)的裝置的示意圖;圖3顯示了根據(jù)本發(fā)明的第一實(shí)施例用于解碼多通道信號(hào)的裝置的示意圖;圖4顯示了根據(jù)本發(fā)明的第二實(shí)施例用于編碼立體聲信號(hào)的裝置的示意圖;圖5說(shuō)明了根據(jù)本發(fā)明的實(shí)施例的信號(hào)變換的確定;圖6顯示了根據(jù)本發(fā)明的第二實(shí)施例用于解碼立體聲信號(hào)的裝置的示意圖;圖7a-c顯示了用在本發(fā)明的實(shí)施例中的濾波電路的示例的示意圖;圖8顯示了根據(jù)本發(fā)明的第三實(shí)施例用于編碼立體聲信號(hào)的裝置的示意圖;圖9顯示了根據(jù)本發(fā)明的第四實(shí)施例用于編碼立體聲信號(hào)的裝置的示意圖;圖10顯示了根據(jù)本發(fā)明的第四實(shí)施例用于解碼立體聲信號(hào)的裝置的示意圖;圖11顯示了根據(jù)本發(fā)明的第五實(shí)施例用于編碼多通道信號(hào)的裝置的示意圖;和圖12顯示了本發(fā)明的實(shí)施例使用的減法電路的示意圖。
圖1顯示了根據(jù)本發(fā)明的實(shí)施例用于傳輸立體聲信號(hào)的系統(tǒng)的示意圖。此系統(tǒng)包括用于生成編碼立體聲信號(hào)的編碼裝置101和用于將接收到的編碼信號(hào)解碼成立體聲L信號(hào)和立體聲R信號(hào)部分的解碼裝置105。編碼裝置101和解碼裝置105中的每一個(gè)都可以是任何電子設(shè)備或這種設(shè)備的一部分。這里術(shù)語(yǔ)電子設(shè)備包括計(jì)算機(jī),例如固定和便攜式PC,固定和便攜式無(wú)線電通訊設(shè)備,和其他手持或便攜式裝置例如移動(dòng)電話,呼機(jī),音頻播放器,多媒體播放機(jī),發(fā)報(bào)機(jī)即電子組織器,智能電話,個(gè)人數(shù)字助理(PDA),掌上電腦等等。要注意的是編碼裝置101和解碼裝置105可以組合在一個(gè)電子設(shè)備中,其中立體聲信號(hào)存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中用于以后再現(xiàn)。
編碼裝置101包括用于根據(jù)本發(fā)明編碼立體聲信號(hào)的編碼器102,立體聲信號(hào)包含L信號(hào)部分和R信號(hào)部分。編碼器接收L和R信號(hào)部分并生成編碼信號(hào)T。立體聲信號(hào)L和R可以來(lái)自一組麥克風(fēng),例如通過(guò)進(jìn)一步的電子設(shè)備如混頻裝置等。該信號(hào)可以進(jìn)一步作為其他立體聲播放機(jī)的輸出、無(wú)線廣播的無(wú)線電信號(hào)或通過(guò)任何其他合適的方式而被接收。以下將說(shuō)明根據(jù)本發(fā)明的這種編碼器的優(yōu)選實(shí)施例。根據(jù)一個(gè)實(shí)施例,編碼器102連接到發(fā)射機(jī)103,以便通過(guò)信道109將編碼信號(hào)T發(fā)射到解碼裝置105。發(fā)射機(jī)103可以包括適于例如通過(guò)有線或無(wú)線數(shù)據(jù)鏈路109進(jìn)行數(shù)據(jù)傳輸?shù)碾娐?。這種發(fā)射機(jī)的例子包括網(wǎng)絡(luò)接口,網(wǎng)卡,無(wú)線電發(fā)射機(jī),用于其他合適的電磁信號(hào)的發(fā)射機(jī)例如通過(guò)IrDa端口發(fā)射紅外線的LED,基于無(wú)線電的通信,例如通過(guò)藍(lán)牙收發(fā)信機(jī),等等。合適的發(fā)射機(jī)的進(jìn)一步的例子包括線纜調(diào)制解調(diào)器,電話調(diào)制解調(diào)器,綜合服務(wù)數(shù)字網(wǎng)(ISDN)適配器,數(shù)字用戶線路(DSL)適配器,衛(wèi)星收發(fā)機(jī),以太網(wǎng)適配器等等。相應(yīng)地,信道109可以是任何合適的有線或無(wú)線數(shù)據(jù)鏈路,例如基于分組的通信網(wǎng)絡(luò)如因特網(wǎng)或其他的TCP/IP網(wǎng)絡(luò),短距離通信線路如紅外線路、藍(lán)牙連接或其他基于無(wú)線電的線路。這種信道的進(jìn)一步的例子包括計(jì)算機(jī)網(wǎng)絡(luò)和無(wú)線通信網(wǎng)絡(luò),例如蜂窩數(shù)字分組數(shù)據(jù)(CDPD)網(wǎng)絡(luò),全球移動(dòng)系統(tǒng)(GSM)網(wǎng)絡(luò),碼分多址(CDMA)網(wǎng)絡(luò),時(shí)分多址網(wǎng)絡(luò)(TDMA),通用分組無(wú)線電服務(wù)(GPRS)網(wǎng)絡(luò),第三代網(wǎng)絡(luò)如UMTS網(wǎng)絡(luò),等等??蛇x的或者另外的,編碼裝置可以包括一個(gè)或多個(gè)其他接口104,用于將編碼立體聲信號(hào)T傳輸?shù)浇獯a裝置105。這種接口的例子包括用于存儲(chǔ)數(shù)據(jù)到計(jì)算機(jī)可讀介質(zhì)110的盤(pán)驅(qū)動(dòng)器,例如軟盤(pán)驅(qū)動(dòng)器,讀/寫(xiě)CD-ROM驅(qū)動(dòng)器,DVD驅(qū)動(dòng)器等。其他例子包括存儲(chǔ)卡插槽,磁卡讀/寫(xiě)器,訪問(wèn)智能卡的接口等。相應(yīng)地,解碼裝置105包括對(duì)應(yīng)的用于接收由發(fā)射機(jī)發(fā)射的信號(hào)的接收器108和/或用于通過(guò)接口104和計(jì)算機(jī)可讀介質(zhì)110接收編碼立體聲信號(hào)的其他接口106。解碼裝置進(jìn)一步包括接收所接收信號(hào)T和將其解碼成相應(yīng)的立體聲部分L’和R’的解碼器107。下面將對(duì)根據(jù)本發(fā)明的這種解碼器的優(yōu)選實(shí)施例加以說(shuō)明。解碼的信號(hào)L’和R’隨后可以被提供給立體聲播放器,用于通過(guò)一組揚(yáng)聲器、耳機(jī)等來(lái)再現(xiàn)。
圖2顯示了根據(jù)本發(fā)明的第一實(shí)施例用于編碼多通道信號(hào)的裝置的示意圖。根據(jù)本實(shí)施例,多通道信號(hào)包括兩部分S1和S2。該裝置包括接收信號(hào)部分S1作為輸入并生成濾波信號(hào)_2的自適應(yīng)濾波器201。自適應(yīng)濾波器的濾波參數(shù)Fp是通過(guò)例如根據(jù)由減法電路203生成的表示S2和_2之間差別的誤差信號(hào)e控制自適應(yīng)濾波器201來(lái)選擇的,以使得濾波信號(hào)_2近似第二信號(hào)部分S2。濾波器201可以是本領(lǐng)域公知的任何合適的濾波器。這種濾波器的例子包括有限脈沖響應(yīng)(FIR)濾波器或無(wú)線脈沖響應(yīng)(IIR)濾波器,自適應(yīng)或者固定的,具有固定的或者遞歸追蹤的截?cái)囝l率和幅度,等等。該濾波器可以是任何階的,優(yōu)選的小于10。濾波器的類(lèi)型可以是巴特沃思,切比雪夫,或者其他任何適當(dāng)類(lèi)型的濾波器。在音頻信號(hào)的例子中,這種自適應(yīng)濾波器的例子包括由回波消除領(lǐng)域得知的自適應(yīng)濾波器,或者例如從MPEG編碼所知的基于人的聽(tīng)覺(jué)系統(tǒng)的心理聲學(xué)模型的濾波器,從而減少濾波器參數(shù)的數(shù)量。根據(jù)另一實(shí)施例,濾波器可以進(jìn)一步簡(jiǎn)化,例如通過(guò)一個(gè)使用5個(gè)雙二階濾波器的10階濾波器和一個(gè)人工混響單元。在本實(shí)施例中,在編碼一側(cè)配置濾波器和決定混響時(shí)間。這些參數(shù)緩慢地改變,從而減少它們?cè)趥鬏斨兴璧谋忍芈省?br>所得的濾波器參數(shù)Fp被提供給編碼器205,例如提供哈夫曼編碼或者其他任何合適的編碼方案的編碼器,從而生成編碼的濾波參數(shù)Fpe。編碼的濾波參數(shù)Fpe被提供給組合器電路204。該裝置進(jìn)一步包括執(zhí)行信號(hào)部分S1的適當(dāng)編碼的編碼器202。例如在音頻信號(hào)的情況下,信號(hào)S1可以根據(jù)MPEG例如MPEGI層3(MP3),根據(jù)正弦編碼(SSC),或者基于子帶、參數(shù)的或變換方案的音頻編碼方案,或者其他任何合適的方案或其組合來(lái)編碼。所得的編碼信號(hào)S1,e與濾波器參數(shù)Fp一起提供給組合器電路204。組合器電路204執(zhí)行成幀、比特率分配和無(wú)損編碼,以得到要傳輸?shù)慕M合信號(hào)T。
圖3顯示了根據(jù)本發(fā)明的第一實(shí)施例用于解碼多通道信號(hào)的裝置的示意圖。本裝置接收編碼的多通道信號(hào)T,例如來(lái)自根據(jù)結(jié)合圖2所述的實(shí)施例的編碼器。本裝置包括用于從組合信號(hào)T中提取編碼信號(hào)S1,e和編碼的濾波器參數(shù)Fpe的電路301,即電路301執(zhí)行圖2的組合器204的逆運(yùn)算。濾波器參數(shù)通過(guò)解碼器303來(lái)解碼,其相應(yīng)于圖2中的編碼器205對(duì)濾波器參數(shù)的編碼。提取的信號(hào)S1,e被提供給解碼器302,以相應(yīng)于圖2中編碼器202所執(zhí)行的編碼執(zhí)行音頻解碼,并生成解碼的第一信號(hào)部分信號(hào)S1’。信號(hào)S1’和解碼的濾波參數(shù)Fp一起被提供給濾波器303。濾波器304生成相應(yīng)的估計(jì)的第二信號(hào)部分_2’。因此,圖2的解碼器生成相應(yīng)于所接收第一信號(hào)部分和估計(jì)的第二信號(hào)部分_2’的輸出。
圖4顯示了根據(jù)本發(fā)明的第二實(shí)施例用于編碼立體聲信號(hào)的裝置102的示意圖。本裝置包括用于執(zhí)行立體聲信號(hào)在L-R空間的α度的旋轉(zhuǎn)的電路401,根據(jù)變換
y=Lcosα+Rsinα=wLL+wRRr=-Lsinα+Rcosα=-wRL+wLR, (1)生成旋轉(zhuǎn)信號(hào)部分y和r,其中使用wL=cosα和wR=sinα作為加權(quán)因子。
根據(jù)本實(shí)施例,確定角度α,以使其與高信號(hào)方差的方向?qū)?yīng)。最大信號(hào)方差的方向即主要部分可以通過(guò)主成分分析進(jìn)行估計(jì),從而使旋轉(zhuǎn)的y部分對(duì)應(yīng)包含大部分信號(hào)能量的主成分信號(hào)而r是殘余信號(hào)。相應(yīng)地,圖4的裝置包括確定角度α或者可選地確定加權(quán)因子wL和wR的電路400。
參照?qǐng)D5,根據(jù)一個(gè)優(yōu)選實(shí)施例,上述加權(quán)因子wL和wR根據(jù)以下算法確定首先,對(duì)輸入的立體聲信號(hào)L和R進(jìn)行修正和低通濾波,以分別產(chǎn)生L和R的包絡(luò)信號(hào)p(k)和q(k),其中p(k)和q(k)被適當(dāng)?shù)夭蓸硬⑶矣胟表示采樣索引。這樣,矢量x(k)=(p(k),q(k))就表示輸入的信號(hào)矢量??蛇x地,可以直接使用信號(hào)L和R,即不經(jīng)過(guò)濾波,或者可以使用L和R的其他濾波版本,例如高通濾波信號(hào)L和R。在圖5中用圓圈顯示了多個(gè)信號(hào)點(diǎn)。作為舉例,顯示了信號(hào)點(diǎn)x(k)及其相應(yīng)部分p(k)和q(k)。根據(jù)本發(fā)明,在信號(hào)矢量的主成分方向上旋轉(zhuǎn)信號(hào)。在圖5的示例中,這對(duì)應(yīng)于y方向,其中α是y方向和p方向之間的夾角。加權(quán)因子w=(wL,wR)表示主成分的方向,而x(k)的旋轉(zhuǎn)部分分別用y(k)和r(k)來(lái)表示。
主成分可以通過(guò)本領(lǐng)域已知的任何合適的方法確定。在一個(gè)特別有利的實(shí)施例中,使用了利用Oja規(guī)則(參見(jiàn)例如S.Haykin“Neural Networks”,PrenticeHall,N.J.,1999)的迭代方法。根據(jù)本實(shí)施例,加權(quán)因子w根據(jù)以下等式迭代估計(jì)w(k)=w(k-1)+μ[x(k-1)-w(k-1)y(k-1)], (2)其中w(k)=(wL(k),wR(k))對(duì)應(yīng)于在時(shí)間k的估計(jì)。以上迭代可以例如用一組小的隨機(jī)權(quán)值w(0)初始化,或者通過(guò)其他適當(dāng)?shù)姆绞?。以上估?jì)的加權(quán)矢量可以用來(lái)根據(jù)y(k)=wT(k)x(k)計(jì)算旋轉(zhuǎn)信號(hào)??蛇x地,等式(2)的迭代可以基于塊執(zhí)行,例如對(duì)于一個(gè)N個(gè)采樣的塊,其中N依賴(lài)于特定實(shí)現(xiàn),例如N=512,1024,2048等。在本實(shí)施例中,用于塊的估計(jì)加權(quán)因子w(N)可以根據(jù)y(k)=wT(N)x(k)用于該塊的所有采樣的變換。
等式(2)中的因子μ對(duì)應(yīng)于追蹤算法的時(shí)間標(biāo)度。如果μ=0,加權(quán)因子以及角度α保持不變,而對(duì)于較大的μ它們變化得很快。作為舉例,對(duì)于一個(gè)2048采樣的塊,μ可以選擇為10-3數(shù)量級(jí),以用于44.1kHz的采樣速率。
上述迭代算法的優(yōu)勢(shì)在于它是線性的,即它不需要計(jì)算任何三角函數(shù)、平方根等。上述迭代算法的進(jìn)一步的優(yōu)勢(shì)在于它獲得了一個(gè)歸一化的加權(quán)因子w,因?yàn)榈仁?2)中的-μw(k-1)y(k-1)項(xiàng)對(duì)應(yīng)于一個(gè)使較大權(quán)值衰減的加權(quán)衰減項(xiàng),而+μx(k-1)項(xiàng)在主成分方向上驅(qū)動(dòng)加權(quán)因子。進(jìn)一步要注意的是,在當(dāng)前實(shí)施例中,由于x(k)是包絡(luò)信號(hào),wL,wR∈[0,1],即加權(quán)因子w存在于圖5中的第一象限,從而保證了μ是正值。本發(fā)明的進(jìn)一步優(yōu)勢(shì)在于,它能夠傳遞wL和wR之一,而根據(jù)wR=1-(wL)2]]>來(lái)確定另一個(gè)因子。可選地,可以傳遞角度α。
再參照?qǐng)D4,電路400輸出確定的角度α或者可選的,加權(quán)因子wL和wR的一個(gè)或全部。將角度信息提供給生成旋轉(zhuǎn)信號(hào)部分y和r的旋轉(zhuǎn)電路401??梢岳斫?,電路400和401可以組合成一個(gè)執(zhí)行等式(2)的迭代運(yùn)算和根據(jù)等式(1)的y和r的計(jì)算的單個(gè)電路。
根據(jù)本發(fā)明的這一實(shí)施例,認(rèn)為殘余信號(hào)r可以作為主信號(hào)y的濾波版本來(lái)估計(jì)。在沒(méi)有例如由于反射等形成的聲學(xué)失真的情況下,在通過(guò)兩個(gè)麥克風(fēng)記錄的一個(gè)音頻源的聲學(xué)記錄中,主信號(hào)y對(duì)應(yīng)于音頻源而殘余信號(hào)基本為零。例如,立體聲信號(hào)L和R可以表示為L(zhǎng)=M+S和R=M-S,其中M對(duì)應(yīng)于一個(gè)中間或中央信號(hào),S對(duì)應(yīng)于立體聲或邊信號(hào)(side signal)。在對(duì)固定聲源進(jìn)行聲學(xué)記錄的情形,例如一個(gè)由兩個(gè)麥克風(fēng)記錄的講話者,L和R信號(hào)基本相同,如果講話者恰好位于麥克風(fēng)之間并且假定沒(méi)有例如反射等聲學(xué)失真。因此,在這種情況下S基本為零或者至少很小,并且根據(jù)本實(shí)施例的編碼方案基本上輸出對(duì)應(yīng)L+R的y和對(duì)應(yīng)L-R的為零或者很小的r;這對(duì)應(yīng)于α=45度。如果講話者不是恰好位于麥克風(fēng)之間即是不對(duì)稱(chēng)的,但是仍假定沒(méi)有反射或其他失真,那么根據(jù)本發(fā)明的旋轉(zhuǎn)信號(hào)y仍然對(duì)應(yīng)于講話者而殘余信號(hào)r基本為零。不過(guò)這種情況下角度α不再是45度。
在更實(shí)際的情形中會(huì)存在失真,例如由于信號(hào)在房間的墻上和講話者的頭上和身上的反射等。這些效果影響了殘余信號(hào)r。因此,當(dāng)通過(guò)濾波器估計(jì)殘余信號(hào)時(shí),濾波器實(shí)際上是對(duì)房間聲學(xué)特性等建模。對(duì)于一個(gè)古典管弦樂(lè)隊(duì)情形是相似的,而對(duì)于現(xiàn)代流行音樂(lè)情形就有了一些不同。在這種情形下,音響工程師經(jīng)常使用人工混響、效果箱等將多個(gè)通道混合成兩通道。在這種情形,濾波器對(duì)由混合處理引進(jìn)的聲學(xué)效果建模。
于是,仍然參照?qǐng)D4,本裝置進(jìn)—步包括接收主信號(hào)y作為輸入并產(chǎn)生濾波信號(hào)
的自適應(yīng)濾波器201。自適應(yīng)濾波器的濾波參數(shù)Fp是通過(guò)例如根據(jù)由減法電路203生成的表示r和
之間差別的誤差信號(hào)e控制自適應(yīng)濾波器201來(lái)選擇的,以使得濾波信號(hào)
近似殘余信號(hào)r。將所得的濾波參數(shù)Fp提供給例如提供哈夫曼編碼或其他任何合適的編碼方案的編碼器205,以生成編碼濾波參數(shù)Fpe。將編碼濾波參數(shù)Fpe提供給組合電路204。濾波器201可以是本領(lǐng)域公知的任何合適的濾波器。這種濾波器的例子包括有限脈沖響應(yīng)(FIR)濾波器或無(wú)限脈沖響應(yīng)(IIR)濾波器,自適應(yīng)或者固定的,具有固定的或者遞歸追蹤的截?cái)囝l率和幅度,等等。該濾波器可以是任何階的,優(yōu)選的小于10。濾波器類(lèi)型可以是巴特沃思,切比雪夫,或者其他任何適當(dāng)類(lèi)型的濾波器。本裝置進(jìn)一步包括結(jié)合圖2所述的用于編碼主信號(hào)的編碼器202,從而得到編碼的主信號(hào)ye與濾波參數(shù)Fp和角度信息α一起被提供給組合電路204。如結(jié)合圖2所述,組合電路204執(zhí)行成幀、比特率分配和無(wú)損編碼,以得到要傳輸?shù)慕M合信號(hào)T,其包括編碼的主成分信號(hào)ye、濾波參數(shù)Fp和角度信息α。在一個(gè)實(shí)施例中,角度α或者可選的,wL和/或wR可以作為在信號(hào)幀、信號(hào)塊等之前傳輸?shù)氖撞康囊徊糠诌M(jìn)行傳輸。
根據(jù)本發(fā)明,由于對(duì)變換角度α進(jìn)行追蹤以便使主成分信號(hào)包含信號(hào)能量的大部分,從而分配給y和r信號(hào)的比特率也可以選擇為不相同,從而優(yōu)化編碼效率。如上所述,在沒(méi)有聲學(xué)失真的情況下,在通過(guò)兩個(gè)麥克風(fēng)記錄的一個(gè)音頻源的聲學(xué)記錄中,主信號(hào)y對(duì)應(yīng)于音頻源而殘余信號(hào)基本為零。在本例中,角度α對(duì)應(yīng)聲源相對(duì)于麥克風(fēng)的位置。如果聲源移動(dòng)了,例如從左向右,根據(jù)本發(fā)明的方法仍然得到一個(gè)對(duì)應(yīng)于聲源的主成分信號(hào)y和小的殘余信號(hào)r,理想情況下r=0。在這種情形,α從0(最左)變化到90度(最右)。上面的例子說(shuō)明了追蹤角度α的優(yōu)點(diǎn)。因此本發(fā)明的優(yōu)點(diǎn)在于實(shí)現(xiàn)立體聲信號(hào)的高效編碼。
根據(jù)本發(fā)明的這個(gè)實(shí)施例,分配給濾波參數(shù)Fp的比特率可以顯著小于主信號(hào)y所需的比特率,例如在一個(gè)實(shí)施例中,用于濾波參數(shù)Fp的比特率可以平均小于用于y的比特率的10%。因而,本發(fā)明的優(yōu)勢(shì)在于它減少了傳輸立體聲信號(hào)所需的比特率。根據(jù)本發(fā)明的總比特率僅比用于一個(gè)單通道的略高。然而,要注意的是,該速率在記錄中會(huì)變化。例如,在幾乎沒(méi)有失真和固定聲源的情形下,該速率可以變得更小。但在例如L和R信號(hào)瞬間獨(dú)立時(shí)也會(huì)變大。
圖6顯示了根據(jù)本發(fā)明的第二實(shí)施例,用于解碼立體聲信號(hào)的裝置107的示意圖。本裝置接收例如來(lái)自根據(jù)結(jié)合圖4所述實(shí)施例的編碼器的編碼立體聲信號(hào)T。本裝置包括用于從組合信號(hào)T中提取編曙信號(hào)ye、編碼濾波參數(shù)Fpe和角度信息α的電路301,即電路301執(zhí)行圖4中組合器204的逆運(yùn)算。將提取的信號(hào)ye提供給解碼器302,用于相應(yīng)于圖4中編碼器202執(zhí)行的編碼來(lái)執(zhí)行音頻解碼,以生成解碼主成分信號(hào)y’。編碼濾波器參數(shù)Fpe通過(guò)解碼器303相應(yīng)于圖4中的編碼器205對(duì)濾波器參數(shù)的編碼來(lái)進(jìn)行解碼。信號(hào)y’和解碼的濾波參數(shù)Fp一起被提供給濾波器304。濾波器304生成相應(yīng)的估計(jì)殘余信號(hào) 。所接收的主成分信號(hào)y’、估計(jì)殘余信號(hào)
和所接收的角度信息α被提供給旋轉(zhuǎn)電路601,其將信號(hào)y’、
旋轉(zhuǎn)回原始的L和R部分的方向,從而得到接收的信號(hào)L’和R’。
在結(jié)合圖4和6所述的實(shí)施例中,濾波器201和304可以是瞬時(shí)或時(shí)域中的標(biāo)準(zhǔn)自適應(yīng)濾波器(例如參見(jiàn)“Adaptive Filter Theory”,by S.Haykin,PrenticeHall,2001),例如回波消除領(lǐng)域公知的自適應(yīng)濾波器。其他例子的濾波器包括具有固定或自適應(yīng)的截?cái)囝l率和幅度的固定的FIR或IIP濾波器??蛇x地,濾波器可以是基于人的聽(tīng)覺(jué)系統(tǒng)的心理聲學(xué)模型或者其他合適的濾波器,例如使用5個(gè)雙二階濾波器的10階濾波器和人工混響單元,如結(jié)合圖2所述。
圖7a-c顯示了用在本發(fā)明的實(shí)施例中的濾波電路的示例的示意圖。
在圖7a的例子中,濾波器201包括濾波器701和混響濾波器702的組合。例如,濾波器701可以是瞬時(shí)或時(shí)域中的標(biāo)準(zhǔn)自適應(yīng)濾波器,具有固定或自適應(yīng)的截?cái)囝l率和幅度的固定的FIR或IIP,濾波器等,例如高通濾波器。根據(jù)本實(shí)施例,濾波器701的濾波參數(shù)和混響濾波器702的濾波參數(shù)(例如用T60表示的混響時(shí)間),者酢為濾波參數(shù)Fp而被傳輸?shù)浇獯a器。
在圖7b的例子中,除了濾波器701和702之外,又增加了兩個(gè)控制電路703-704。增加控制電路703是為了保證殘余信號(hào)r的平均功率和混響器702的輸出的平均功率大致相同,例如通過(guò)用參數(shù)β1,與混響器702的輸出相乘。第二控制電路704用β2與混響器的縮放后的輸出相乘。因子β2可以在從-3dB至+6dB的范圍內(nèi)選擇并且通過(guò)使r和
之間的互相關(guān)ρ盡可能高來(lái)確定,即,使信號(hào)r和
盡可能地相似。因而,圖7b的濾波裝置進(jìn)—步包括用于確定互相關(guān)ρ的電路705。濾波裝置進(jìn)一步包括乘法器706,用于產(chǎn)生乘積β=β1·β2,并輸出上述乘積以作為濾波參數(shù)Fp的一部分。因此,β1是例如通過(guò)比較r和
的絕對(duì)均值來(lái)自動(dòng)控制的增益,而β2是例如通過(guò)利用互相關(guān)系數(shù)ρ來(lái)自動(dòng)控制的另一個(gè)增益。第一個(gè)增益目的是為了保證r的能量被保持,即,使接收器中預(yù)測(cè)信號(hào) 的能量對(duì)應(yīng)于r的能量。第二個(gè)增益是為了保證r和
很好地相關(guān)。
在一個(gè)實(shí)施例中,混響器702和濾波器701可以被固定,即不根據(jù)濾波參數(shù)Fp進(jìn)行調(diào)整。進(jìn)一步地,β2可以被固定,從而使緩慢變化的參數(shù)β1作為惟一需要調(diào)整和傳輸?shù)淖赃m應(yīng)參數(shù)。因此,提供了一個(gè)特別簡(jiǎn)單的濾波裝置。本實(shí)施例的優(yōu)點(diǎn)在于它僅需要大約原始立體聲比特率的一半來(lái)傳輸立體聲信號(hào)。要注意的是可以使用上述實(shí)施例的進(jìn)一步的改變。例如,在一個(gè)實(shí)施例中濾波器701可以省略。
另外,對(duì)于相關(guān)ρ,可選的或者附加的,可以使用其他的相關(guān)性度量來(lái)保證原始信號(hào)和經(jīng)過(guò)編解碼后的信號(hào)的高度相似。例如,在一個(gè)實(shí)施例中可以用兩個(gè)相關(guān)器來(lái)代替相關(guān)器705。一個(gè)相關(guān)器可以計(jì)算輸入信號(hào)L和R之間的互相關(guān)ρLR,另外,第二個(gè)相關(guān)器可以計(jì)算編一解碼器產(chǎn)生的輸出L’和R’之間的互相關(guān)ρ’LR,即根據(jù)本實(shí)施例,編碼器進(jìn)一步包括用于確定信號(hào)L’和R’的解碼電路。本實(shí)施例使用差ερ=ρLR-ρ’LR來(lái)控制β2從而使ερ最小。這在圖7c中說(shuō)明,其中用接收L和R以及L’和R’作為輸入并產(chǎn)生表示差ερ的信號(hào)作為輸出的電路707來(lái)代替圖7b的相關(guān)器。電路707的輸出ερ控制電路704來(lái)對(duì)估計(jì)的殘余
進(jìn)行縮放從而使ερ最小化。在一個(gè)實(shí)施例中,電路707的輸入被高通濾波例如在250Hz,從而使低頻率對(duì)于ερ的影響降低。在如圖7b的實(shí)施例中,本實(shí)施例的優(yōu)點(diǎn)在于所得立體聲映象和編解碼之前的原始立體聲映象之間的相關(guān)性非常高。
圖8顯示了根據(jù)本發(fā)明的第三實(shí)施例用于編碼立體聲信號(hào)的裝置的示意圖。本裝置是結(jié)合圖4所述的實(shí)施例的變形,包括用于執(zhí)行立體聲信號(hào)L和R的旋轉(zhuǎn)的電路401,用于確定旋轉(zhuǎn)角度的電路400,自適應(yīng)濾波器201,減法電路203,編碼器202,編碼器205,和組合電路204,如結(jié)合圖4所述。根據(jù)本實(shí)施例,主成分信號(hào)y沒(méi)有被直接提供給濾波器201。替代地,本裝置進(jìn)一步包括如結(jié)合圖6所述的解碼器302。解碼器302接收由編碼器202生成的編碼主成分信號(hào)ye并產(chǎn)生解碼的主信號(hào)y’,后者被提供給濾波器201。本實(shí)施例的優(yōu)點(diǎn)在于減少了由信號(hào)y的編碼和解碼而引入的編碼誤差的影響。由于解碼器302實(shí)際上不是編碼器202的完全的逆,即E E-1≠1,因而這些編碼誤差使得解碼信號(hào)y’與原始信號(hào)y略有不同。因此,通過(guò)在解碼器應(yīng)用信號(hào)y的編碼和解碼,濾波器201的輸入y’對(duì)應(yīng)于在接收器提供給濾波器304(圖6)的輸入y’,從而改善了在接收器處殘余信號(hào)的
的預(yù)測(cè)結(jié)果。因而,根據(jù)本實(shí)施例的編碼器可以與根據(jù)圖6的實(shí)施例的解碼器結(jié)合使用。
圖9顯示了根據(jù)本發(fā)明的第四實(shí)施例用于編碼立體聲信號(hào)的裝置的示意圖。本裝置是結(jié)合圖4所述的實(shí)施例的變形,包括用于執(zhí)行立體聲信號(hào)L和R的旋轉(zhuǎn)的電路401,用于確定旋轉(zhuǎn)角度的電路400,自適應(yīng)濾波器201,減法電路203,編碼器202,編碼器205,和組合電路204,如結(jié)合圖4所述。根據(jù)本實(shí)施例,主成分信號(hào)y不直接提供給濾波器201。替代地,本裝置進(jìn)一步包括乘法電路901,使用常數(shù)γ和從電路401接收的殘余信號(hào)r相乘,和加法電路902,用于為主成分信號(hào)y加上縮放后的殘余信號(hào),從而生成信號(hào)y+γr提供給濾波器201。這里,γ是一個(gè)小的正值,例如為10-2數(shù)量級(jí)。在一個(gè)實(shí)施例中,對(duì)常數(shù)γ進(jìn)行自適應(yīng)追蹤。本實(shí)施例的優(yōu)點(diǎn)在于可以在通過(guò)濾波器201對(duì)殘余信號(hào)
的建模中利用在信號(hào)y的頻譜中基本不存在而存在于r的頻譜中的頻率,從而改善了編碼信號(hào)的質(zhì)量。根據(jù)本實(shí)施例,信號(hào)y+γr被提供給編碼器202,生成傳送到接收器的解碼的主信號(hào)ye。另外,根據(jù)本實(shí)施例,常數(shù)γ被提供給組合器204并傳輸?shù)浇邮掌鳌?br>圖10顯示了根據(jù)本發(fā)明的第四實(shí)施例用于解碼立體聲信號(hào)的裝置的示意圖,即適于解碼從圖9的編碼器接收的信號(hào)。本裝置包括用于從組合信號(hào)T中提取接收信息的電路301,解碼器302,解碼器303,濾波器304和如結(jié)合圖6所述的旋轉(zhuǎn)電路601。根據(jù)本實(shí)施例,電路301進(jìn)一步從組合信號(hào)T中提取常數(shù)γ,并且本裝置進(jìn)一步包括用接收的常數(shù)γ與濾波器304產(chǎn)生的預(yù)測(cè)殘余信號(hào)
相乘的乘法電路1001。本裝置進(jìn)一步包括用于從解碼的主信號(hào)y’中減去所得縮放后的預(yù)測(cè)殘余信號(hào)γ
的電路1002。
圖11顯示了根據(jù)本發(fā)明的第五實(shí)施例用于編碼多通道信號(hào)的裝置的示意圖。本裝置接收包括n個(gè)通道S1,…,Sn的多通道信號(hào)。本裝置包括用于執(zhí)行信號(hào)部分S1,…,Sn的主成分分析的主成分分析器1100,并得到用于將輸入信號(hào)變換成主成分信號(hào)y和n-1個(gè)殘余信號(hào)r1,r2,…,rn-1的加權(quán)矢量w=(w1,…,wn)。本裝置進(jìn)一步包括變換電路1101,接收輸入信號(hào)部分S1,…,Sn和確定的加權(quán)矢量w并根據(jù)以上變換產(chǎn)生信號(hào)y和r1,r2,…,rn-1。主成分信號(hào)y被提供給一組自適應(yīng)濾波器201,每個(gè)預(yù)測(cè)殘余信號(hào)r1,r2,…,rn-1之一,如結(jié)合圖4所述,得到相應(yīng)的濾波參數(shù)Fp1,…,F(xiàn)p(n-1),后者被提供給相應(yīng)的編碼器205以及隨后提供給組合器204。在相應(yīng)的解碼器(未示出),相應(yīng)的濾波器被用于基于濾波參數(shù)生成殘余信號(hào)的估計(jì)
如結(jié)合圖6所述。本裝置進(jìn)—步包括編碼器202,用于編碼主成分信號(hào)y,得到提供給組合器204的編碼信號(hào)ye。
可以理解,根據(jù)一個(gè)實(shí)施例,只有殘余信號(hào)的一個(gè)子集例如r1,r2,…,rk,k<n-1,可以被傳送到接收器或者提供給相應(yīng)的濾波器,從而減少了需要的比特率而保留了大部分信號(hào)質(zhì)量。
圖12顯示了本發(fā)明的實(shí)施例使用的減法電路的示意圖。在以上實(shí)施例中,通過(guò)比較目標(biāo)信號(hào)和估計(jì)信號(hào)來(lái)確定濾波參數(shù),即通過(guò)例如由減法電路203生成的表示r和
之間差別的誤差信號(hào)e??梢岳斫?,減法電路可以生成r和
之間差別的不同度量,例如可以在時(shí)域或者頻域確定差別。參照?qǐng)D12,電路203可以包括用于例如通過(guò)執(zhí)行快速傅里葉變換(FFT)將信號(hào)r和
分別變換到頻域的電路1201。所得的頻率部分可以進(jìn)一步地分別通過(guò)電路1204處理。例如不同的頻率可以不同地加權(quán),優(yōu)選地根據(jù)人的聽(tīng)覺(jué)系統(tǒng)的特性,從而對(duì)可聽(tīng)頻率范圍內(nèi)的差別被更重地加權(quán)。通過(guò)電路1204的進(jìn)一步處理的其他例子包括對(duì)預(yù)定頻率部分的平均、計(jì)算復(fù)雜頻率部分的幅度、濾波部分的聚類(lèi)(cluster)等。例如在一個(gè)優(yōu)選實(shí)施例中,在頻域的減法之前執(zhí)行聚類(lèi)。此聚類(lèi)可以通過(guò)濾波器組來(lái)執(zhí)行,例如用線性或?qū)?shù)子帶寬。可選地,可以使用所謂的等效矩形帶寬(ERB)(例見(jiàn)“An introduction to the Psychology of Hearing”,by BrianMoore,Academic Press,London,1997)執(zhí)行聚類(lèi)。等效矩形帶寬技術(shù)對(duì)相應(yīng)于人的聽(tīng)覺(jué)濾波器的頻帶進(jìn)行聚類(lèi),例如所謂的關(guān)鍵頻帶。根據(jù)本實(shí)施例,作為中心頻率的函數(shù)的ERB的對(duì)應(yīng)值f(以kHz為單位)可以根據(jù)ERB=24.7(4.37f+1)來(lái)計(jì)算。仍然參照?qǐng)D12,電路203進(jìn)一步包括用于減去已處理頻率部分的減法電路1203??蛇x地,由電路1201生成的變換信號(hào)不經(jīng)過(guò)進(jìn)一步處理就直接提供給減法電路1204。由減法電路1204產(chǎn)生的差信污被提供給變換電路1202,用于將誤差信號(hào)變換回時(shí)域,例如通過(guò)執(zhí)行逆快速傅里葉變換(IFFT)。可選地,可以直接使用頻域的差信號(hào)。
可以理解的,普通技術(shù)人員可以例如通過(guò)添加或減少特征,或者通過(guò)結(jié)合上述實(shí)施例的特征來(lái)修改上述實(shí)施例。例如,可以理解,圖8和9的實(shí)施例中介紹的特征也可以結(jié)合在圖11的實(shí)施例中。作為另一個(gè)例子,用來(lái)描述圖4的實(shí)施例中的估計(jì)殘余信號(hào)的質(zhì)量的誤差信號(hào)e可以與一個(gè)表示最大可接受誤差的誤差閾值比較。如果誤差不可接受,誤差信號(hào)可以在適當(dāng)?shù)鼐幋a后和信號(hào)T一起,與線性預(yù)測(cè)編碼(LPC)領(lǐng)域中使用的方法相似地傳輸。
進(jìn)一步要注意的是,本發(fā)明不限于立體聲信號(hào),而是也可以應(yīng)用于其他具有兩個(gè)或更多輸入通道的多通道輸入信號(hào)。這種多通道信號(hào)的例子包括從數(shù)字通用光碟(DVD)或超級(jí)音頻光碟等中接收的信號(hào)。在這種更通用的情形,主成分信號(hào)y和一個(gè)或更多的殘余信號(hào)r仍可以根據(jù)本發(fā)明生成。傳輸?shù)臍堄嘈盘?hào)的數(shù)目依賴(lài)于通道的數(shù)目和所希望的比特率,因?yàn)榭梢月匀ポ^高階殘余而不會(huì)顯著降低信號(hào)質(zhì)量。
一般地,本發(fā)明的優(yōu)點(diǎn)在于比特率分配可以自適應(yīng)地改變,從而可以實(shí)現(xiàn)完美的降低。例如,如果信道在瞬間只允許傳輸一個(gè)減少的比特率,例如由于增加的網(wǎng)絡(luò)通信量、噪聲等,就可以降低傳輸信號(hào)的比特率而不會(huì)顯著降低信號(hào)的可察覺(jué)的質(zhì)量。例如,在上面討論的固定聲源的情形,可以用接近2的因子來(lái)降低比特率而不會(huì)顯著降低信號(hào)質(zhì)量,與傳輸一個(gè)單一通道而不是兩通道相比。
要注意的是,上述裝置可以實(shí)現(xiàn)為通用或特殊用途的可編程微處理器,數(shù)字信號(hào)處理器(DSP),專(zhuān)用集成電路(ASIC),可編程邏輯陣列(PLA),現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA),特定用途的電子電路等,或者它們的組合。
應(yīng)該注意的是,上述實(shí)施例說(shuō)明而不是限制本發(fā)明,并且本領(lǐng)域普通人員能夠設(shè)計(jì)出許多替換實(shí)施例而不會(huì)脫離附加權(quán)利要求
的范圍。在權(quán)利要求
中,任何括號(hào)之間的參考標(biāo)記都不應(yīng)解釋為對(duì)權(quán)利要求
的限制。詞匯“包括”不排除未列在權(quán)利要求
中之外的其他元件或步驟的存在。本發(fā)明能夠通過(guò)包括多個(gè)不同元件的硬件和通過(guò)一適當(dāng)編程計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在一個(gè)列舉了多個(gè)設(shè)備的裝置權(quán)利要求
中,這些設(shè)備中的一些能夠通過(guò)同一個(gè)硬件單元來(lái)實(shí)現(xiàn)。在互不相同的從屬權(quán)利要求
中引用某些措施并不表示不能有利地使用這些措施的組合。
權(quán)利要求
1.一種編碼包括至少第一信號(hào)部分和第二信號(hào)部分的多通道信號(hào)的方法,本方法包括步驟—確定一預(yù)測(cè)濾波器的一組濾波參數(shù),從而預(yù)測(cè)濾波器在接收到第一信號(hào)部分作為輸入時(shí)提供第二信號(hào)部分的估計(jì);其中—所述第一信號(hào)部分是包括多個(gè)源信號(hào)部分的源多通道信號(hào)的主成分信號(hào),而所述第二信號(hào)部分是一個(gè)相應(yīng)的殘余信號(hào);以及該方法還包括步驟—通過(guò)預(yù)定變換將至少第一和第二源信號(hào)部分變換為包括大部分信號(hào)能量的主成分信號(hào)以及比主成分信號(hào)包含更少能量的至少該殘余信號(hào),通過(guò)至少一個(gè)變換參數(shù)來(lái)參數(shù)化所述預(yù)定變換;以及將多通道信號(hào)表示成第一信號(hào)部分和該組濾波參數(shù)的步驟還包括將多通道信號(hào)表示為主成分信號(hào)、該組濾波參數(shù)以及變換參數(shù)。
2.根據(jù)權(quán)利要求
1的方法,其中確定該組濾波參數(shù)的步驟包括以下步驟確定濾波參數(shù)以使得第二信號(hào)部分和估計(jì)信號(hào)部分的差小于一個(gè)預(yù)定值。
3.根據(jù)權(quán)利要求
2的方法,其中將多通道信號(hào)表示成第一信號(hào)部分和該組濾波參數(shù)的步驟進(jìn)一步包括以下步驟如果所述差不小于所述預(yù)定值,則將多通道信號(hào)表示成第一信號(hào)部分、該組濾波參數(shù)以及表示第二信號(hào)部分與估計(jì)信號(hào)部分的差的誤差信號(hào)。
4.根據(jù)權(quán)利要求
1-3中的任何一個(gè)的方法,其特征在于第一信號(hào)部分對(duì)應(yīng)于第一信號(hào)能量,而第二信號(hào)部分對(duì)應(yīng)于小于第一信號(hào)能量的第二信號(hào)能量。
5.根據(jù)權(quán)利要求
1的方法,其中該方法進(jìn)一步包括將多通道源信號(hào)的至少第一源信號(hào)部分和第二源信號(hào)部分變換成第一和第二信號(hào)部分的步驟。
6.根據(jù)權(quán)利要求
5的方法,其中多通道源信號(hào)包括具有左和右信號(hào)部分的立體聲信號(hào)。
7.根據(jù)權(quán)利要求
1的方法,其中預(yù)定變換是一個(gè)旋轉(zhuǎn),而變換參數(shù)對(duì)應(yīng)于旋轉(zhuǎn)角度。
8.根據(jù)權(quán)利要求
1的方法,其中確定一組濾波參數(shù)的步驟進(jìn)一步包括以下步驟確定至少一個(gè)用于縮放第二信號(hào)部分的估計(jì)的縮放參數(shù),從而增加第二信號(hào)部分和第二信號(hào)部分的估計(jì)之間的相關(guān)性度量。
9.一種解碼多通道信號(hào)信息的方法,該方法包括步驟—接收第一信號(hào)部分和一組濾波參數(shù);—利用相應(yīng)于所接收的該組濾波參數(shù)的預(yù)測(cè)濾波器來(lái)估計(jì)第二信號(hào)部分,預(yù)測(cè)濾波器接收所接收的第一信號(hào)部分作為輸入;其中—接收第一信號(hào)部分的步驟進(jìn)一步包括接收變換參數(shù)的步驟,第一信號(hào)部分對(duì)應(yīng)于多通道源信號(hào)的至少第一和第二源信號(hào)部分的預(yù)定變換的結(jié)果,至少通過(guò)該變換參數(shù)對(duì)預(yù)定變換進(jìn)行參數(shù)化;以及—該方法進(jìn)一步包括通過(guò)逆變換接收的第一信號(hào)部分和估計(jì)的第二信號(hào)部分而產(chǎn)生第一和第二解碼信號(hào)部分的步驟。
10.一種用于編碼包括至少第一信號(hào)部分和第二信號(hào)部分的多通道信號(hào)的裝置,該裝置包括—用于估計(jì)第二信號(hào)部分的預(yù)測(cè)濾波器,所述預(yù)測(cè)濾波器對(duì)應(yīng)于一組濾波參數(shù)并且接收第一信號(hào)部分作為輸入;其中—所述第一信號(hào)部分是包括多個(gè)源信號(hào)部分的源多通道信號(hào)的主成分信號(hào)而第二信號(hào)部分是相應(yīng)的殘余信號(hào);以及該裝置還包括用于通過(guò)預(yù)定變換將至少第一和第二源信號(hào)部分變換成包括大部分信號(hào)能量的主成分信號(hào)和比該主成分信號(hào)包括更少能量的至少一個(gè)殘余信號(hào)的設(shè)備;以及—用于將多通道信號(hào)表示為主成分信號(hào)、該組濾波參數(shù)以及變換參數(shù)的處理設(shè)備。
11.一種用于解碼對(duì)應(yīng)于至少兩個(gè)信號(hào)部分的多通道信號(hào)的裝置,該裝置包括—用于接收多通道信號(hào)的第一信號(hào)部分和一組濾波參數(shù)的接收設(shè)備;—用于估計(jì)多通道信號(hào)的第二信號(hào)部分的預(yù)測(cè)濾波器,預(yù)測(cè)濾波器接收所接收的這組濾波參數(shù)和所接收的第一信號(hào)部分作為輸入;其中—接收設(shè)備被用于接收變換參數(shù),該第一信號(hào)部分對(duì)應(yīng)于源多通道信號(hào)的至少第一和第二源信號(hào)部分的預(yù)定變換的結(jié)果,通過(guò)至少該變換參數(shù)對(duì)預(yù)定變換進(jìn)行參數(shù)化;以及—該裝置還包括通過(guò)逆變換所接收的第一信號(hào)部分和所估計(jì)的第二信號(hào)部分來(lái)產(chǎn)生第一和第二解碼信號(hào)部分的設(shè)備。
12.一種用于傳輸多通道信號(hào)的設(shè)備,這種設(shè)備包括一種用于編碼包括至少第一信號(hào)部分和第二信號(hào)部分的多通道信號(hào)的裝置,該裝置包括—用于估計(jì)第二信號(hào)部分的預(yù)測(cè)濾波器,所述預(yù)測(cè)濾波器對(duì)應(yīng)于一組濾波參數(shù)并且接收第一信號(hào)部分作為輸入;其中—所述第一信號(hào)部分是包括多個(gè)源信號(hào)部分的源多通道信號(hào)的主成分信號(hào),而第二信號(hào)部分是相應(yīng)的殘余信號(hào);以及該設(shè)備還包括通過(guò)預(yù)定變換將至少第一和第二源信號(hào)部分變換成包括大部分信號(hào)能量的主成分信號(hào)以及比該主成分信號(hào)包含更少能量的至少該殘余信號(hào)的設(shè)備,通過(guò)至少一個(gè)變換參數(shù)來(lái)參數(shù)化所述預(yù)定變換;以及—用于將多通道信號(hào)表示成主成分信號(hào)、該組濾波參數(shù)以及變換參數(shù)的處理設(shè)備。
專(zhuān)利摘要
所公開(kāi)的是一種編碼至少包括第一信號(hào)部分(y)和第二信號(hào)部分(r)的多通道信號(hào)的方法。本方法包括確定預(yù)測(cè)濾波器(201)的一組濾波參數(shù)(F
文檔編號(hào)G10L25/12GKCN1311426SQ03807982
公開(kāi)日2007年4月18日 申請(qǐng)日期2003年3月20日
發(fā)明者R·M·阿爾特斯, R·艾旺 申請(qǐng)人:皇家飛利浦電子股份有限公司導(dǎo)出引文BiBTeX, EndNote, RefMan