立體聲信號(hào)的編碼、解碼方法和裝置及其傳輸設(shè)備的制作方法

文檔序號(hào)：72298閱讀：368來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專(zhuān)利名稱(chēng):立體聲信號(hào)的編碼、解碼方法和裝置及其傳輸設(shè)備的制作方法
本發(fā)明涉及包括至少第一和第二信號(hào)部分的多通道信號(hào)的編碼。更特別的，本發(fā)明涉及多聲道音頻信號(hào)例如立體聲信號(hào)的編碼。
立體聲音頻信號(hào)包括來(lái)自立體聲信號(hào)源(例如分離的麥克風(fēng))的左(L)信號(hào)部分和右(R)信號(hào)部分。音頻信號(hào)編碼的目的是減少立體聲信號(hào)的比特率，例如為了實(shí)現(xiàn)聲音信號(hào)通過(guò)通信網(wǎng)絡(luò)(例如因特網(wǎng)、調(diào)制解調(diào)器和模擬電話線、移動(dòng)信道或者其他無(wú)線網(wǎng)絡(luò)等等)的高效傳輸，以及在智能卡或者其他具有有限存儲(chǔ)容量的存儲(chǔ)介質(zhì)上存儲(chǔ)立體聲信號(hào)。
美國(guó)專(zhuān)利6121904披露了一種用于壓縮數(shù)字音頻信號(hào)的壓縮器，其包括相應(yīng)于左右立體聲通道的預(yù)測(cè)器。用于左聲道的預(yù)測(cè)器接收左音頻信號(hào)的當(dāng)前和在先采樣以及右音頻信號(hào)的當(dāng)前和在先采樣，并且產(chǎn)生左信號(hào)的下一個(gè)預(yù)測(cè)采樣。類(lèi)似地，用于右聲道的預(yù)測(cè)器接收右音頻信號(hào)的當(dāng)前和在先采樣以及左音頻信號(hào)的當(dāng)前和在先采樣，并且產(chǎn)生右信號(hào)的下一個(gè)預(yù)測(cè)采樣。
本發(fā)明的目的是提供一種以低比特率編碼多通道信號(hào)的方法和裝置。
通過(guò)一種包括至少第一信號(hào)部分和第二信號(hào)部分的多通道信號(hào)的編碼方法來(lái)達(dá)到以上和其他目的，本方法包括步驟—確定一預(yù)測(cè)濾波器的一組濾波參數(shù)，從而預(yù)測(cè)濾波器接收到第一信號(hào)部分作為輸入時(shí)提供第二信號(hào)部分的估計(jì)；和—將多通道信號(hào)表示成第一信號(hào)部分和這組濾波參數(shù)。
從而，通過(guò)以第一信號(hào)部分和一組濾波參數(shù)來(lái)編碼多通道信號(hào)，就用了僅比一個(gè)單獨(dú)通道例如單通道略高的比特率對(duì)多通道信號(hào)編碼。所得到的編碼信號(hào)可以存儲(chǔ)和/或傳送到一個(gè)接收器。本發(fā)明所基于的是認(rèn)為，對(duì)于許多多通道信號(hào)來(lái)說(shuō)，一個(gè)信號(hào)部分可以通過(guò)自適應(yīng)濾波處理從多通道信號(hào)的至少一個(gè)其他通道來(lái)預(yù)測(cè)。因此，當(dāng)所確定的濾波參數(shù)被傳輸?shù)浇獯a器時(shí)，就可以在第一信號(hào)部分和該濾波參數(shù)的基礎(chǔ)上恢復(fù)該多通道信號(hào)，并且解碼器可以對(duì)第二信號(hào)部分建模。
術(shù)語(yǔ)多通道信號(hào)包括任何具有兩個(gè)或更多相關(guān)信號(hào)部分的信號(hào)。這種信號(hào)的例子包括例如立體聲信號(hào)或相似信號(hào)的多聲道音頻信號(hào)，其包括相同音頻表示的同步記錄。根據(jù)本發(fā)明的一些實(shí)施例，多通道信號(hào)包括一個(gè)多通道聲源信號(hào)的變換信號(hào)部分，例如將L和R立體聲信號(hào)變換成一組更適于根據(jù)本發(fā)明依據(jù)另一個(gè)信號(hào)部分對(duì)一個(gè)信號(hào)部分建模的變換信號(hào)而產(chǎn)生的變換立體聲信號(hào)部分。多通道信號(hào)的進(jìn)一步示例包括從數(shù)字通用光碟(DVD)或超級(jí)音頻光碟等中接收的信號(hào)。
在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中，確定一組濾波器參數(shù)的步驟包括確定濾波器參數(shù)的步驟從而使第二信號(hào)部分和估計(jì)的信號(hào)部分的差小于一個(gè)預(yù)定值。當(dāng)建模信號(hào)和第二信號(hào)部分之間的差比較小時(shí)，建模信號(hào)提供第二信號(hào)部分的較好估計(jì)。因此，提供了對(duì)于質(zhì)量的度量，以便建模第二信號(hào)部分，從而保證根據(jù)本發(fā)明的編碼處理提供最小的質(zhì)量降低，例如該信號(hào)的立體聲音頻信號(hào)最小可聞失真。
根據(jù)本發(fā)明一個(gè)進(jìn)一步的優(yōu)選實(shí)施例，將多通道信號(hào)表示成第一信號(hào)部分和一組濾波參數(shù)的步驟進(jìn)一步包括如果所述差不小于所述預(yù)定值，則將多通道信號(hào)表示成第一信號(hào)部分、該組濾波參數(shù)和一個(gè)表示第二信號(hào)部分和估計(jì)信號(hào)部分之差的誤差信號(hào)的步驟。
因此，如果濾波步驟提供的估計(jì)信號(hào)沒(méi)有很好的建模第二信號(hào)部分，編碼信號(hào)中就包含誤差信號(hào)以便為解碼器提供額外的信息。解碼器可以綜合預(yù)測(cè)信號(hào)和接收到的誤差信號(hào)，從而得到第二信號(hào)部分的一個(gè)較好近似。用于傳輸誤差信號(hào)的比特率可以變化，例如根據(jù)通信連接在給定時(shí)間的可用帶寬而變化。因而，本發(fā)明的優(yōu)勢(shì)在于提供了在用于傳輸信號(hào)的比特率和接收器中的信號(hào)質(zhì)量之間進(jìn)行折衷的可能。因此提供一種完美降低的技術(shù)，例如通過(guò)自適應(yīng)地增加或減少誤差信號(hào)所用的比特率。
在本發(fā)明的另一優(yōu)選實(shí)施例中，該方法進(jìn)一步包括將多通道源信號(hào)的至少第一源信號(hào)部分和第二源信號(hào)部分變換成第一和第二信號(hào)部分的步驟。因此第一和第二信號(hào)部分分別是第一和第二源信號(hào)部分的組合，從而提供更適于將第二信號(hào)部分預(yù)測(cè)為相應(yīng)的源信號(hào)的預(yù)測(cè)濾波器的輸入信號(hào)。變換的例子包括第一和第二源信號(hào)的線性組合，例如在立體聲音頻信號(hào)的情況下L+R和L-R的組合。進(jìn)一步的例子包括信號(hào)空間的旋轉(zhuǎn)和其他變換。該變換可以通過(guò)固定的或自適應(yīng)的變換參數(shù)來(lái)參數(shù)化，即它們可以根據(jù)源信號(hào)的屬性進(jìn)行調(diào)整。
在本發(fā)明的一個(gè)進(jìn)一步的實(shí)施例中，—所述第一信號(hào)部分是包括多個(gè)源信號(hào)部分的多通道源信號(hào)的主成分信號(hào)，而第二信號(hào)部分是相應(yīng)的殘余信號(hào)；—該方法進(jìn)一步包括通過(guò)預(yù)定變換將至少第一和第二源信號(hào)變換成包含大部分信號(hào)能量的主成分信號(hào)和比主成分信號(hào)包含更少能量的至少一個(gè)殘余信號(hào)，通過(guò)至少一個(gè)變換參數(shù)對(duì)預(yù)定變換進(jìn)行參數(shù)化；和—將多通道信號(hào)表示成第一信號(hào)部分和該組濾波參數(shù)的步驟進(jìn)一步包括將多通道信號(hào)表示成主成分信號(hào)、該組濾波參數(shù)和變換參數(shù)的步驟。
因此，根據(jù)本實(shí)施例，多通道信號(hào)通過(guò)主信號(hào)、變換參數(shù)和用于由接收器對(duì)小殘余信號(hào)建模的一組濾波參數(shù)表示，從而提高了多通道信號(hào)的編碼效率。本實(shí)施例所基于的是，對(duì)于許多多通道信號(hào)(例如在音樂(lè)音頻信號(hào)和語(yǔ)音信號(hào)的情況下)，殘余信號(hào)可以作為主信號(hào)的濾波版本而被準(zhǔn)確估計(jì)。因而本實(shí)施例的優(yōu)勢(shì)在于提供一種保持較高質(zhì)量的特別高效的編碼方法。
優(yōu)選的，可以連續(xù)追蹤最優(yōu)的變換參數(shù)，從而保證即便輸入信號(hào)的特征發(fā)生改變，例如在音頻信號(hào)的例子中由于聲源的移動(dòng)或者環(huán)境聲學(xué)特性的變化產(chǎn)生的輸入信號(hào)的特征改變，仍然能夠保持變換是最優(yōu)。
當(dāng)預(yù)定變換是旋轉(zhuǎn)并且變換參數(shù)對(duì)應(yīng)于一個(gè)旋轉(zhuǎn)角度時(shí)，僅基于一個(gè)單一參數(shù)(旋轉(zhuǎn)角度)來(lái)提供一個(gè)簡(jiǎn)單的變換。通過(guò)調(diào)整該角度使得信號(hào)部分即立體聲信號(hào)的L和R信號(hào)部分旋轉(zhuǎn)成主成分信號(hào)和殘余信號(hào)，這樣在保持高質(zhì)量信號(hào)的同時(shí)提供了一種有效編碼。
本發(fā)明的優(yōu)點(diǎn)在于提供一種高效的比特率利用，即一個(gè)對(duì)于給定聲音質(zhì)量使用低速率的編碼方案。這個(gè)根據(jù)本發(fā)明的編碼方案可以用于不顯著降低聲音質(zhì)量地降低比特率，在提高聲音質(zhì)量的同時(shí)保持比特率，或者兩者的結(jié)合。
在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中，確定一組濾波參數(shù)的步驟進(jìn)一步包括確定至少一個(gè)用于縮放對(duì)于第二信號(hào)部分的估計(jì)的縮放參數(shù)(β1，β2)的步驟，以便于增加第二信號(hào)部分和的估計(jì)第二信號(hào)部分之間的相關(guān)度量。因而優(yōu)化了估計(jì)和信號(hào)之間的相似性度量，從而提高了編碼信號(hào)的質(zhì)量。
本發(fā)明進(jìn)一步涉及一種解碼多通道信號(hào)信息的方法，該方法包括步驟—接收第一信號(hào)部分和一組濾波參數(shù)；—利用相應(yīng)于所接收的濾波參數(shù)組的預(yù)測(cè)濾波器來(lái)估計(jì)第二信號(hào)部分，預(yù)測(cè)濾波器接收所接收的第一信號(hào)部分作為輸入。
本發(fā)明可以通過(guò)不同的方式來(lái)實(shí)現(xiàn)，包括上述的方法以及下列的，編碼和解碼多通道信號(hào)的裝置，分別地可以是數(shù)據(jù)信號(hào)，和進(jìn)一步的產(chǎn)品設(shè)備，每個(gè)都具有所述與第一種提及的方法有關(guān)的一個(gè)或多個(gè)好處和優(yōu)點(diǎn)，以及每個(gè)都具有和所述與第一種提及的方法有關(guān)的優(yōu)選實(shí)施例相應(yīng)的一個(gè)或多個(gè)優(yōu)選實(shí)施例，并且記載在從屬權(quán)利要求
。
要注意的是，上面和以下所述的方法的特征可以用軟件來(lái)實(shí)現(xiàn)并且在數(shù)據(jù)處理系統(tǒng)或者其他通過(guò)計(jì)算機(jī)可執(zhí)行指令的執(zhí)行來(lái)激發(fā)的處理設(shè)備中執(zhí)行。這些指令可以以程序代碼方式從存儲(chǔ)介質(zhì)或者通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)從另一臺(tái)計(jì)算機(jī)載入例如RAM的存儲(chǔ)器中?？蛇x地，所述特征可以通過(guò)硬連線電路代替軟件或與軟件相結(jié)合來(lái)實(shí)現(xiàn)。
本發(fā)明進(jìn)一步涉及一種用于編碼包括至少第一信號(hào)部分和第二信號(hào)部分的多通道信號(hào)的裝置，該裝置包括—用于估計(jì)第二信號(hào)部分的預(yù)測(cè)濾波器，該預(yù)測(cè)濾波器對(duì)應(yīng)于一組濾波參數(shù)并且接收第一信號(hào)部分作為輸入；和—用于將多通道信號(hào)表示成第一信號(hào)部分和該組濾波參數(shù)的處理設(shè)備。
本發(fā)明進(jìn)一步涉及一種用于解碼對(duì)應(yīng)至少兩個(gè)信號(hào)部分的多通道信號(hào)的裝置，該裝置包括—用于接收多通道信號(hào)的第一信號(hào)部分和一組濾波參數(shù)的接收設(shè)備；—用于估計(jì)多通道信號(hào)的第二信號(hào)部分的預(yù)測(cè)濾波器，預(yù)測(cè)濾波器接收所接收的該組濾波參數(shù)和所接收的第一信號(hào)部分作為輸入。
上述裝置可以是任何包括計(jì)算機(jī)的電子設(shè)備的一部分，例如固定和便攜式PC，固定和便攜式無(wú)線電通訊設(shè)備，和其他手持或便攜式裝置例如移動(dòng)電話，呼機(jī)，音頻播放器，多媒體播放機(jī)，發(fā)報(bào)機(jī)即電子組織器，智能電話，個(gè)人數(shù)字助理(PDA)，掌上電腦等等。
術(shù)語(yǔ)處理設(shè)備包括通用或特殊用途的可編程微處理器，數(shù)字信號(hào)處理器(DSP)，專(zhuān)用集成電路(ASIC)，可編程邏輯陣列(PLA)，現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)，特定用途的電子電路等，或者它們的組合。上面的第一和第二處理設(shè)備可以是分離的處理設(shè)備或者它們也可以包括在一個(gè)處理設(shè)備中。
術(shù)語(yǔ)接收設(shè)備包含適于能夠例如通過(guò)有線或無(wú)線數(shù)據(jù)鏈路進(jìn)行數(shù)據(jù)傳輸?shù)碾娐泛?或裝置。這種接收設(shè)備的例子包括網(wǎng)絡(luò)接口，網(wǎng)卡，無(wú)線電接收器，用于其他合適的電磁信號(hào)，例如通過(guò)IrDa端口的紅外線接收器，基于無(wú)線電的通信，例如通過(guò)藍(lán)牙收發(fā)信機(jī)，等等。這種接收設(shè)備進(jìn)一步的例子包括線纜調(diào)制解調(diào)器，電話調(diào)制解調(diào)器，綜合服務(wù)數(shù)字網(wǎng)(ISDN)適配器，數(shù)字用戶線路(DSL)適配器，衛(wèi)星收發(fā)機(jī)，以太網(wǎng)適配器等等。
術(shù)語(yǔ)接收設(shè)備進(jìn)一步包括其他用于接收數(shù)字信號(hào)例如存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的數(shù)字信號(hào)的輸入電路/裝置。這種接收設(shè)備的例子包括軟盤(pán)驅(qū)動(dòng)器，光盤(pán)驅(qū)動(dòng)器，DVD驅(qū)動(dòng)器，或其他任何合適的盤(pán)驅(qū)動(dòng)器、存儲(chǔ)卡適配器、智能卡適配器等。
本發(fā)明進(jìn)一步涉及一種包含多通道信號(hào)信息的數(shù)字信號(hào)，該數(shù)字信號(hào)由上下文所述的方法生成。該信號(hào)可以具體化為一種載波中的數(shù)字信號(hào)，例如由如上下文所述的通信設(shè)備傳輸?shù)臄?shù)字信號(hào)。
本發(fā)明進(jìn)一步涉及一種包括由上下文所述方法生成的表示多通道信號(hào)信息的數(shù)字記錄的計(jì)算機(jī)可讀介質(zhì)。術(shù)語(yǔ)計(jì)算機(jī)可讀介質(zhì)包括磁帶，光盤(pán)，數(shù)字視頻光盤(pán)(DVD)，壓縮光盤(pán)(CD或CD-ROM)，小型盤(pán)，硬盤(pán)，軟盤(pán)，鐵電存儲(chǔ)器，電可擦除可編程只讀存儲(chǔ)器(EEPROM)，閃存，EPROM，只讀存儲(chǔ)器(ROM)，靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)，動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)，同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(SDRAM)，鐵磁存儲(chǔ)器，光學(xué)存儲(chǔ)器，電荷耦合裝置，智能卡，PCMCIA卡等。
本發(fā)明進(jìn)一步涉及一種傳輸多通道信號(hào)的裝置，該裝置包括如上下文所述編碼多通道信號(hào)的設(shè)備。
根據(jù)參照實(shí)施例和參照附圖的說(shuō)明，本發(fā)明的這些和其他方面會(huì)更明白，其中；
圖1顯示了根據(jù)本發(fā)明的實(shí)施例用于傳輸立體聲信號(hào)的系統(tǒng)的示意圖；圖2顯示了根據(jù)本發(fā)明的第一實(shí)施例用于編碼多通道信號(hào)的裝置的示意圖；圖3顯示了根據(jù)本發(fā)明的第一實(shí)施例用于解碼多通道信號(hào)的裝置的示意圖；圖4顯示了根據(jù)本發(fā)明的第二實(shí)施例用于編碼立體聲信號(hào)的裝置的示意圖；圖5說(shuō)明了根據(jù)本發(fā)明的實(shí)施例的信號(hào)變換的確定；圖6顯示了根據(jù)本發(fā)明的第二實(shí)施例用于解碼立體聲信號(hào)的裝置的示意圖；圖7a-c顯示了用在本發(fā)明的實(shí)施例中的濾波電路的示例的示意圖；圖8顯示了根據(jù)本發(fā)明的第三實(shí)施例用于編碼立體聲信號(hào)的裝置的示意圖；圖9顯示了根據(jù)本發(fā)明的第四實(shí)施例用于編碼立體聲信號(hào)的裝置的示意圖；圖10顯示了根據(jù)本發(fā)明的第四實(shí)施例用于解碼立體聲信號(hào)的裝置的示意圖；圖11顯示了根據(jù)本發(fā)明的第五實(shí)施例用于編碼多通道信號(hào)的裝置的示意圖；和圖12顯示了本發(fā)明的實(shí)施例使用的減法電路的示意圖。
圖1顯示了根據(jù)本發(fā)明的實(shí)施例用于傳輸立體聲信號(hào)的系統(tǒng)的示意圖。此系統(tǒng)包括用于生成編碼立體聲信號(hào)的編碼裝置101和用于將接收到的編碼信號(hào)解碼成立體聲L信號(hào)和立體聲R信號(hào)部分的解碼裝置105。編碼裝置101和解碼裝置105中的每一個(gè)都可以是任何電子設(shè)備或這種設(shè)備的一部分。這里術(shù)語(yǔ)電子設(shè)備包括計(jì)算機(jī)，例如固定和便攜式PC，固定和便攜式無(wú)線電通訊設(shè)備，和其他手持或便攜式裝置例如移動(dòng)電話，呼機(jī)，音頻播放器，多媒體播放機(jī)，發(fā)報(bào)機(jī)即電子組織器，智能電話，個(gè)人數(shù)字助理(PDA)，掌上電腦等等。要注意的是編碼裝置101和解碼裝置105可以組合在一個(gè)電子設(shè)備中，其中立體聲信號(hào)存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中用于以后再現(xiàn)。
編碼裝置101包括用于根據(jù)本發(fā)明編碼立體聲信號(hào)的編碼器102，立體聲信號(hào)包含L信號(hào)部分和R信號(hào)部分。編碼器接收L和R信號(hào)部分并生成編碼信號(hào)T。立體聲信號(hào)L和R可以來(lái)自一組麥克風(fēng)，例如通過(guò)進(jìn)一步的電子設(shè)備如混頻裝置等。該信號(hào)可以進(jìn)一步作為其他立體聲播放機(jī)的輸出、無(wú)線廣播的無(wú)線電信號(hào)或通過(guò)任何其他合適的方式而被接收。以下將說(shuō)明根據(jù)本發(fā)明的這種編碼器的優(yōu)選實(shí)施例。根據(jù)一個(gè)實(shí)施例，編碼器102連接到發(fā)射機(jī)103，以便通過(guò)信道109將編碼信號(hào)T發(fā)射到解碼裝置105。發(fā)射機(jī)103可以包括適于例如通過(guò)有線或無(wú)線數(shù)據(jù)鏈路109進(jìn)行數(shù)據(jù)傳輸?shù)碾娐?。這種發(fā)射機(jī)的例子包括網(wǎng)絡(luò)接口，網(wǎng)卡，無(wú)線電發(fā)射機(jī)，用于其他合適的電磁信號(hào)的發(fā)射機(jī)例如通過(guò)IrDa端口發(fā)射紅外線的LED，基于無(wú)線電的通信，例如通過(guò)藍(lán)牙收發(fā)信機(jī)，等等。合適的發(fā)射機(jī)的進(jìn)一步的例子包括線纜調(diào)制解調(diào)器，電話調(diào)制解調(diào)器，綜合服務(wù)數(shù)字網(wǎng)(ISDN)適配器，數(shù)字用戶線路(DSL)適配器，衛(wèi)星收發(fā)機(jī)，以太網(wǎng)適配器等等。相應(yīng)地，信道109可以是任何合適的有線或無(wú)線數(shù)據(jù)鏈路，例如基于分組的通信網(wǎng)絡(luò)如因特網(wǎng)或其他的TCP/IP網(wǎng)絡(luò)，短距離通信線路如紅外線路、藍(lán)牙連接或其他基于無(wú)線電的線路。這種信道的進(jìn)一步的例子包括計(jì)算機(jī)網(wǎng)絡(luò)和無(wú)線通信網(wǎng)絡(luò)，例如蜂窩數(shù)字分組數(shù)據(jù)(CDPD)網(wǎng)絡(luò)，全球移動(dòng)系統(tǒng)(GSM)網(wǎng)絡(luò)，碼分多址(CDMA)網(wǎng)絡(luò)，時(shí)分多址網(wǎng)絡(luò)(TDMA)，通用分組無(wú)線電服務(wù)(GPRS)網(wǎng)絡(luò)，第三代網(wǎng)絡(luò)如UMTS網(wǎng)絡(luò)，等等?？蛇x的或者另外的，編碼裝置可以包括一個(gè)或多個(gè)其他接口104，用于將編碼立體聲信號(hào)T傳輸?shù)浇獯a裝置105。這種接口的例子包括用于存儲(chǔ)數(shù)據(jù)到計(jì)算機(jī)可讀介質(zhì)110的盤(pán)驅(qū)動(dòng)器，例如軟盤(pán)驅(qū)動(dòng)器，讀/寫(xiě)CD-ROM驅(qū)動(dòng)器，DVD驅(qū)動(dòng)器等。其他例子包括存儲(chǔ)卡插槽，磁卡讀/寫(xiě)器，訪問(wèn)智能卡的接口等。相應(yīng)地，解碼裝置105包括對(duì)應(yīng)的用于接收由發(fā)射機(jī)發(fā)射的信號(hào)的接收器108和/或用于通過(guò)接口104和計(jì)算機(jī)可讀介質(zhì)110接收編碼立體聲信號(hào)的其他接口106。解碼裝置進(jìn)一步包括接收所接收信號(hào)T和將其解碼成相應(yīng)的立體聲部分L’和R’的解碼器107。下面將對(duì)根據(jù)本發(fā)明的這種解碼器的優(yōu)選實(shí)施例加以說(shuō)明。解碼的信號(hào)L’和R’隨后可以被提供給立體聲播放器，用于通過(guò)一組揚(yáng)聲器、耳機(jī)等來(lái)再現(xiàn)。
圖2顯示了根據(jù)本發(fā)明的第一實(shí)施例用于編碼多通道信號(hào)的裝置的示意圖。根據(jù)本實(shí)施例，多通道信號(hào)包括兩部分S1和S2。該裝置包括接收信號(hào)部分S1作為輸入并生成濾波信號(hào)_2的自適應(yīng)濾波器201。自適應(yīng)濾波器的濾波參數(shù)Fp是通過(guò)例如根據(jù)由減法電路203生成的表示S2和_2之間差別的誤差信號(hào)e控制自適應(yīng)濾波器201來(lái)選擇的，以使得濾波信號(hào)_2近似第二信號(hào)部分S2。濾波器201可以是本領(lǐng)域公知的任何合適的濾波器。這種濾波器的例子包括有限脈沖響應(yīng)(FIR)濾波器或無(wú)線脈沖響應(yīng)(IIR)濾波器，自適應(yīng)或者固定的，具有固定的或者遞歸追蹤的截?cái)囝l率和幅度，等等。該濾波器可以是任何階的，優(yōu)選的小于10。濾波器的類(lèi)型可以是巴特沃思，切比雪夫，或者其他任何適當(dāng)類(lèi)型的濾波器。在音頻信號(hào)的例子中，這種自適應(yīng)濾波器的例子包括由回波消除領(lǐng)域得知的自適應(yīng)濾波器，或者例如從MPEG編碼所知的基于人的聽(tīng)覺(jué)系統(tǒng)的心理聲學(xué)模型的濾波器，從而減少濾波器參數(shù)的數(shù)量。根據(jù)另一實(shí)施例，濾波器可以進(jìn)一步簡(jiǎn)化，例如通過(guò)一個(gè)使用5個(gè)雙二階濾波器的10階濾波器和一個(gè)人工混響單元。在本實(shí)施例中，在編碼一側(cè)配置濾波器和決定混響時(shí)間。這些參數(shù)緩慢地改變，從而減少它們?cè)趥鬏斨兴璧谋忍芈省?br>所得的濾波器參數(shù)Fp被提供給編碼器205，例如提供哈夫曼編碼或者其他任何合適的編碼方案的編碼器，從而生成編碼的濾波參數(shù)Fpe。編碼的濾波參數(shù)Fpe被提供給組合器電路204。該裝置進(jìn)一步包括執(zhí)行信號(hào)部分S1的適當(dāng)編碼的編碼器202。例如在音頻信號(hào)的情況下，信號(hào)S1可以根據(jù)MPEG例如MPEGI層3(MP3)，根據(jù)正弦編碼(SSC)，或者基于子帶、參數(shù)的或變換方案的音頻編碼方案，或者其他任何合適的方案或其組合來(lái)編碼。所得的編碼信號(hào)S1，e與濾波器參數(shù)Fp一起提供給組合器電路204。組合器電路204執(zhí)行成幀、比特率分配和無(wú)損編碼，以得到要傳輸?shù)慕M合信號(hào)T。
圖3顯示了根據(jù)本發(fā)明的第一實(shí)施例用于解碼多通道信號(hào)的裝置的示意圖。本裝置接收編碼的多通道信號(hào)T，例如來(lái)自根據(jù)結(jié)合圖2所述的實(shí)施例的編碼器。本裝置包括用于從組合信號(hào)T中提取編碼信號(hào)S1，e和編碼的濾波器參數(shù)Fpe的電路301，即電路301執(zhí)行圖2的組合器204的逆運(yùn)算。濾波器參數(shù)通過(guò)解碼器303來(lái)解碼，其相應(yīng)于圖2中的編碼器205對(duì)濾波器參數(shù)的編碼。提取的信號(hào)S1，e被提供給解碼器302，以相應(yīng)于圖2中編碼器202所執(zhí)行的編碼執(zhí)行音頻解碼，并生成解碼的第一信號(hào)部分信號(hào)S1’。信號(hào)S1’和解碼的濾波參數(shù)Fp一起被提供給濾波器303。濾波器304生成相應(yīng)的估計(jì)的第二信號(hào)部分_2’。因此，圖2的解碼器生成相應(yīng)于所接收第一信號(hào)部分和估計(jì)的第二信號(hào)部分_2’的輸出。
圖4顯示了根據(jù)本發(fā)明的第二實(shí)施例用于編碼立體聲信號(hào)的裝置102的示意圖。本裝置包括用于執(zhí)行立體聲信號(hào)在L-R空間的α度的旋轉(zhuǎn)的電路401，根據(jù)變換
y＝Lcosα+Rsinα＝wLL+wRRr＝-Lsinα+Rcosα＝-wRL+wLR， (1)生成旋轉(zhuǎn)信號(hào)部分y和r，其中使用wL＝cosα和wR＝sinα作為加權(quán)因子。
根據(jù)本實(shí)施例，確定角度α，以使其與高信號(hào)方差的方向?qū)?yīng)。最大信號(hào)方差的方向即主要部分可以通過(guò)主成分分析進(jìn)行估計(jì)，從而使旋轉(zhuǎn)的y部分對(duì)應(yīng)包含大部分信號(hào)能量的主成分信號(hào)而r是殘余信號(hào)。相應(yīng)地，圖4的裝置包括確定角度α或者可選地確定加權(quán)因子wL和wR的電路400。
參照?qǐng)D5，根據(jù)一個(gè)優(yōu)選實(shí)施例，上述加權(quán)因子wL和wR根據(jù)以下算法確定首先，對(duì)輸入的立體聲信號(hào)L和R進(jìn)行修正和低通濾波，以分別產(chǎn)生L和R的包絡(luò)信號(hào)p(k)和q(k)，其中p(k)和q(k)被適當(dāng)?shù)夭蓸硬⑶矣胟表示采樣索引。這樣，矢量x(k)＝(p(k)，q(k))就表示輸入的信號(hào)矢量?？蛇x地，可以直接使用信號(hào)L和R，即不經(jīng)過(guò)濾波，或者可以使用L和R的其他濾波版本，例如高通濾波信號(hào)L和R。在圖5中用圓圈顯示了多個(gè)信號(hào)點(diǎn)。作為舉例，顯示了信號(hào)點(diǎn)x(k)及其相應(yīng)部分p(k)和q(k)。根據(jù)本發(fā)明，在信號(hào)矢量的主成分方向上旋轉(zhuǎn)信號(hào)。在圖5的示例中，這對(duì)應(yīng)于y方向，其中α是y方向和p方向之間的夾角。加權(quán)因子w＝(wL，wR)表示主成分的方向，而x(k)的旋轉(zhuǎn)部分分別用y(k)和r(k)來(lái)表示。
主成分可以通過(guò)本領(lǐng)域已知的任何合適的方法確定。在一個(gè)特別有利的實(shí)施例中，使用了利用Oja規(guī)則(參見(jiàn)例如S.Haykin“Neural Networks”，PrenticeHall，N.J.，1999)的迭代方法。根據(jù)本實(shí)施例，加權(quán)因子w根據(jù)以下等式迭代估計(jì)w(k)＝w(k-1)+μ[x(k-1)-w(k-1)y(k-1)]， (2)其中w(k)＝(wL(k)，wR(k))對(duì)應(yīng)于在時(shí)間k的估計(jì)。以上迭代可以例如用一組小的隨機(jī)權(quán)值w(0)初始化，或者通過(guò)其他適當(dāng)?shù)姆绞?。以上估?jì)的加權(quán)矢量可以用來(lái)根據(jù)y(k)＝wT(k)x(k)計(jì)算旋轉(zhuǎn)信號(hào)?？蛇x地，等式(2)的迭代可以基于塊執(zhí)行，例如對(duì)于一個(gè)N個(gè)采樣的塊，其中N依賴(lài)于特定實(shí)現(xiàn)，例如N＝512，1024，2048等。在本實(shí)施例中，用于塊的估計(jì)加權(quán)因子w(N)可以根據(jù)y(k)＝wT(N)x(k)用于該塊的所有采樣的變換。
等式(2)中的因子μ對(duì)應(yīng)于追蹤算法的時(shí)間標(biāo)度。如果μ＝0，加權(quán)因子以及角度α保持不變，而對(duì)于較大的μ它們變化得很快。作為舉例，對(duì)于一個(gè)2048采樣的塊，μ可以選擇為10-3數(shù)量級(jí)，以用于44.1kHz的采樣速率。
上述迭代算法的優(yōu)勢(shì)在于它是線性的，即它不需要計(jì)算任何三角函數(shù)、平方根等。上述迭代算法的進(jìn)一步的優(yōu)勢(shì)在于它獲得了一個(gè)歸一化的加權(quán)因子w，因?yàn)榈仁?2)中的-μw(k-1)y(k-1)項(xiàng)對(duì)應(yīng)于一個(gè)使較大權(quán)值衰減的加權(quán)衰減項(xiàng)，而+μx(k-1)項(xiàng)在主成分方向上驅(qū)動(dòng)加權(quán)因子。進(jìn)一步要注意的是，在當(dāng)前實(shí)施例中，由于x(k)是包絡(luò)信號(hào)，wL，wR∈[0，1]，即加權(quán)因子w存在于圖5中的第一象限，從而保證了μ是正值。本發(fā)明的進(jìn)一步優(yōu)勢(shì)在于，它能夠傳遞wL和wR之一，而根據(jù)wR=1-(wL)2]]>來(lái)確定另一個(gè)因子。可選地，可以傳遞角度α。
再參照?qǐng)D4，電路400輸出確定的角度α或者可選的，加權(quán)因子wL和wR的一個(gè)或全部。將角度信息提供給生成旋轉(zhuǎn)信號(hào)部分y和r的旋轉(zhuǎn)電路401?？梢岳斫?，電路400和401可以組合成一個(gè)執(zhí)行等式(2)的迭代運(yùn)算和根據(jù)等式(1)的y和r的計(jì)算的單個(gè)電路。
根據(jù)本發(fā)明的這一實(shí)施例，認(rèn)為殘余信號(hào)r可以作為主信號(hào)y的濾波版本來(lái)估計(jì)。在沒(méi)有例如由于反射等形成的聲學(xué)失真的情況下，在通過(guò)兩個(gè)麥克風(fēng)記錄的一個(gè)音頻源的聲學(xué)記錄中，主信號(hào)y對(duì)應(yīng)于音頻源而殘余信號(hào)基本為零。例如，立體聲信號(hào)L和R可以表示為L(zhǎng)＝M+S和R＝M-S，其中M對(duì)應(yīng)于一個(gè)中間或中央信號(hào)，S對(duì)應(yīng)于立體聲或邊信號(hào)(side signal)。在對(duì)固定聲源進(jìn)行聲學(xué)記錄的情形，例如一個(gè)由兩個(gè)麥克風(fēng)記錄的講話者，L和R信號(hào)基本相同，如果講話者恰好位于麥克風(fēng)之間并且假定沒(méi)有例如反射等聲學(xué)失真。因此，在這種情況下S基本為零或者至少很小，并且根據(jù)本實(shí)施例的編碼方案基本上輸出對(duì)應(yīng)L+R的y和對(duì)應(yīng)L-R的為零或者很小的r；這對(duì)應(yīng)于α＝45度。如果講話者不是恰好位于麥克風(fēng)之間即是不對(duì)稱(chēng)的，但是仍假定沒(méi)有反射或其他失真，那么根據(jù)本發(fā)明的旋轉(zhuǎn)信號(hào)y仍然對(duì)應(yīng)于講話者而殘余信號(hào)r基本為零。不過(guò)這種情況下角度α不再是45度。
在更實(shí)際的情形中會(huì)存在失真，例如由于信號(hào)在房間的墻上和講話者的頭上和身上的反射等。這些效果影響了殘余信號(hào)r。因此，當(dāng)通過(guò)濾波器估計(jì)殘余信號(hào)時(shí)，濾波器實(shí)際上是對(duì)房間聲學(xué)特性等建模。對(duì)于一個(gè)古典管弦樂(lè)隊(duì)情形是相似的，而對(duì)于現(xiàn)代流行音樂(lè)情形就有了一些不同。在這種情形下，音響工程師經(jīng)常使用人工混響、效果箱等將多個(gè)通道混合成兩通道。在這種情形，濾波器對(duì)由混合處理引進(jìn)的聲學(xué)效果建模。
于是，仍然參照?qǐng)D4，本裝置進(jìn)—步包括接收主信號(hào)y作為輸入并產(chǎn)生濾波信號(hào)
的自適應(yīng)濾波器201。自適應(yīng)濾波器的濾波參數(shù)Fp是通過(guò)例如根據(jù)由減法電路203生成的表示r和
之間差別的誤差信號(hào)e控制自適應(yīng)濾波器201來(lái)選擇的，以使得濾波信號(hào)
近似殘余信號(hào)r。將所得的濾波參數(shù)Fp提供給例如提供哈夫曼編碼或其他任何合適的編碼方案的編碼器205，以生成編碼濾波參數(shù)Fpe。將編碼濾波參數(shù)Fpe提供給組合電路204。濾波器201可以是本領(lǐng)域公知的任何合適的濾波器。這種濾波器的例子包括有限脈沖響應(yīng)(FIR)濾波器或無(wú)限脈沖響應(yīng)(IIR)濾波器，自適應(yīng)或者固定的，具有固定的或者遞歸追蹤的截?cái)囝l率和幅度，等等。該濾波器可以是任何階的，優(yōu)選的小于10。濾波器類(lèi)型可以是巴特沃思，切比雪夫，或者其他任何適當(dāng)類(lèi)型的濾波器。本裝置進(jìn)一步包括結(jié)合圖2所述的用于編碼主信號(hào)的編碼器202，從而得到編碼的主信號(hào)ye與濾波參數(shù)Fp和角度信息α一起被提供給組合電路204。如結(jié)合圖2所述，組合電路204執(zhí)行成幀、比特率分配和無(wú)損編碼，以得到要傳輸?shù)慕M合信號(hào)T，其包括編碼的主成分信號(hào)ye、濾波參數(shù)Fp和角度信息α。在一個(gè)實(shí)施例中，角度α或者可選的，wL和/或wR可以作為在信號(hào)幀、信號(hào)塊等之前傳輸?shù)氖撞康囊徊糠诌M(jìn)行傳輸。
根據(jù)本發(fā)明，由于對(duì)變換角度α進(jìn)行追蹤以便使主成分信號(hào)包含信號(hào)能量的大部分，從而分配給y和r信號(hào)的比特率也可以選擇為不相同，從而優(yōu)化編碼效率。如上所述，在沒(méi)有聲學(xué)失真的情況下，在通過(guò)兩個(gè)麥克風(fēng)記錄的一個(gè)音頻源的聲學(xué)記錄中，主信號(hào)y對(duì)應(yīng)于音頻源而殘余信號(hào)基本為零。在本例中，角度α對(duì)應(yīng)聲源相對(duì)于麥克風(fēng)的位置。如果聲源移動(dòng)了，例如從左向右，根據(jù)本發(fā)明的方法仍然得到一個(gè)對(duì)應(yīng)于聲源的主成分信號(hào)y和小的殘余信號(hào)r，理想情況下r＝0。在這種情形，α從0(最左)變化到90度(最右)。上面的例子說(shuō)明了追蹤角度α的優(yōu)點(diǎn)。因此本發(fā)明的優(yōu)點(diǎn)在于實(shí)現(xiàn)立體聲信號(hào)的高效編碼。
根據(jù)本發(fā)明的這個(gè)實(shí)施例，分配給濾波參數(shù)Fp的比特率可以顯著小于主信號(hào)y所需的比特率，例如在一個(gè)實(shí)施例中，用于濾波參數(shù)Fp的比特率可以平均小于用于y的比特率的10％。因而，本發(fā)明的優(yōu)勢(shì)在于它減少了傳輸立體聲信號(hào)所需的比特率。根據(jù)本發(fā)明的總比特率僅比用于一個(gè)單通道的略高。然而，要注意的是，該速率在記錄中會(huì)變化。例如，在幾乎沒(méi)有失真和固定聲源的情形下，該速率可以變得更小。但在例如L和R信號(hào)瞬間獨(dú)立時(shí)也會(huì)變大。
圖6顯示了根據(jù)本發(fā)明的第二實(shí)施例，用于解碼立體聲信號(hào)的裝置107的示意圖。本裝置接收例如來(lái)自根據(jù)結(jié)合圖4所述實(shí)施例的編碼器的編碼立體聲信號(hào)T。本裝置包括用于從組合信號(hào)T中提取編曙信號(hào)ye、編碼濾波參數(shù)Fpe和角度信息α的電路301，即電路301執(zhí)行圖4中組合器204的逆運(yùn)算。將提取的信號(hào)ye提供給解碼器302，用于相應(yīng)于圖4中編碼器202執(zhí)行的編碼來(lái)執(zhí)行音頻解碼，以生成解碼主成分信號(hào)y’。編碼濾波器參數(shù)Fpe通過(guò)解碼器303相應(yīng)于圖4中的編碼器205對(duì)濾波器參數(shù)的編碼來(lái)進(jìn)行解碼。信號(hào)y’和解碼的濾波參數(shù)Fp一起被提供給濾波器304。濾波器304生成相應(yīng)的估計(jì)殘余信號(hào) 。所接收的主成分信號(hào)y’、估計(jì)殘余信號(hào)
和所接收的角度信息α被提供給旋轉(zhuǎn)電路601，其將信號(hào)y’、
旋轉(zhuǎn)回原始的L和R部分的方向，從而得到接收的信號(hào)L’和R’。
在結(jié)合圖4和6所述的實(shí)施例中，濾波器201和304可以是瞬時(shí)或時(shí)域中的標(biāo)準(zhǔn)自適應(yīng)濾波器(例如參見(jiàn)“Adaptive Filter Theory”，by S.Haykin，PrenticeHall，2001)，例如回波消除領(lǐng)域公知的自適應(yīng)濾波器。其他例子的濾波器包括具有固定或自適應(yīng)的截?cái)囝l率和幅度的固定的FIR或IIP濾波器?？蛇x地，濾波器可以是基于人的聽(tīng)覺(jué)系統(tǒng)的心理聲學(xué)模型或者其他合適的濾波器，例如使用5個(gè)雙二階濾波器的10階濾波器和人工混響單元，如結(jié)合圖2所述。
圖7a-c顯示了用在本發(fā)明的實(shí)施例中的濾波電路的示例的示意圖。
在圖7a的例子中，濾波器201包括濾波器701和混響濾波器702的組合。例如，濾波器701可以是瞬時(shí)或時(shí)域中的標(biāo)準(zhǔn)自適應(yīng)濾波器，具有固定或自適應(yīng)的截?cái)囝l率和幅度的固定的FIR或IIP,濾波器等，例如高通濾波器。根據(jù)本實(shí)施例，濾波器701的濾波參數(shù)和混響濾波器702的濾波參數(shù)(例如用T60表示的混響時(shí)間)，者酢為濾波參數(shù)Fp而被傳輸?shù)浇獯a器。
在圖7b的例子中，除了濾波器701和702之外，又增加了兩個(gè)控制電路703-704。增加控制電路703是為了保證殘余信號(hào)r的平均功率和混響器702的輸出的平均功率大致相同，例如通過(guò)用參數(shù)β1，與混響器702的輸出相乘。第二控制電路704用β2與混響器的縮放后的輸出相乘。因子β2可以在從-3dB至+6dB的范圍內(nèi)選擇并且通過(guò)使r和
之間的互相關(guān)ρ盡可能高來(lái)確定，即，使信號(hào)r和
盡可能地相似。因而，圖7b的濾波裝置進(jìn)—步包括用于確定互相關(guān)ρ的電路705。濾波裝置進(jìn)一步包括乘法器706，用于產(chǎn)生乘積β＝β1·β2，并輸出上述乘積以作為濾波參數(shù)Fp的一部分。因此，β1是例如通過(guò)比較r和
的絕對(duì)均值來(lái)自動(dòng)控制的增益，而β2是例如通過(guò)利用互相關(guān)系數(shù)ρ來(lái)自動(dòng)控制的另一個(gè)增益。第一個(gè)增益目的是為了保證r的能量被保持，即，使接收器中預(yù)測(cè)信號(hào) 的能量對(duì)應(yīng)于r的能量。第二個(gè)增益是為了保證r和
很好地相關(guān)。
在一個(gè)實(shí)施例中，混響器702和濾波器701可以被固定，即不根據(jù)濾波參數(shù)Fp進(jìn)行調(diào)整。進(jìn)一步地，β2可以被固定，從而使緩慢變化的參數(shù)β1作為惟一需要調(diào)整和傳輸?shù)淖赃m應(yīng)參數(shù)。因此，提供了一個(gè)特別簡(jiǎn)單的濾波裝置。本實(shí)施例的優(yōu)點(diǎn)在于它僅需要大約原始立體聲比特率的一半來(lái)傳輸立體聲信號(hào)。要注意的是可以使用上述實(shí)施例的進(jìn)一步的改變。例如，在一個(gè)實(shí)施例中濾波器701可以省略。
另外，對(duì)于相關(guān)ρ，可選的或者附加的，可以使用其他的相關(guān)性度量來(lái)保證原始信號(hào)和經(jīng)過(guò)編解碼后的信號(hào)的高度相似。例如，在一個(gè)實(shí)施例中可以用兩個(gè)相關(guān)器來(lái)代替相關(guān)器705。一個(gè)相關(guān)器可以計(jì)算輸入信號(hào)L和R之間的互相關(guān)ρLR，另外，第二個(gè)相關(guān)器可以計(jì)算編一解碼器產(chǎn)生的輸出L’和R’之間的互相關(guān)ρ’LR，即根據(jù)本實(shí)施例，編碼器進(jìn)一步包括用于確定信號(hào)L’和R’的解碼電路。本實(shí)施例使用差ερ＝ρLR-ρ’LR來(lái)控制β2從而使ερ最小。這在圖7c中說(shuō)明，其中用接收L和R以及L’和R’作為輸入并產(chǎn)生表示差ερ的信號(hào)作為輸出的電路707來(lái)代替圖7b的相關(guān)器。電路707的輸出ερ控制電路704來(lái)對(duì)估計(jì)的殘余
進(jìn)行縮放從而使ερ最小化。在一個(gè)實(shí)施例中，電路707的輸入被高通濾波例如在250Hz，從而使低頻率對(duì)于ερ的影響降低。在如圖7b的實(shí)施例中，本實(shí)施例的優(yōu)點(diǎn)在于所得立體聲映象和編解碼之前的原始立體聲映象之間的相關(guān)性非常高。
圖8顯示了根據(jù)本發(fā)明的第三實(shí)施例用于編碼立體聲信號(hào)的裝置的示意圖。本裝置是結(jié)合圖4所述的實(shí)施例的變形，包括用于執(zhí)行立體聲信號(hào)L和R的旋轉(zhuǎn)的電路401，用于確定旋轉(zhuǎn)角度的電路400，自適應(yīng)濾波器201，減法電路203，編碼器202，編碼器205，和組合電路204，如結(jié)合圖4所述。根據(jù)本實(shí)施例，主成分信號(hào)y沒(méi)有被直接提供給濾波器201。替代地，本裝置進(jìn)一步包括如結(jié)合圖6所述的解碼器302。解碼器302接收由編碼器202生成的編碼主成分信號(hào)ye并產(chǎn)生解碼的主信號(hào)y’，后者被提供給濾波器201。本實(shí)施例的優(yōu)點(diǎn)在于減少了由信號(hào)y的編碼和解碼而引入的編碼誤差的影響。由于解碼器302實(shí)際上不是編碼器202的完全的逆，即E E-1≠1，因而這些編碼誤差使得解碼信號(hào)y’與原始信號(hào)y略有不同。因此，通過(guò)在解碼器應(yīng)用信號(hào)y的編碼和解碼，濾波器201的輸入y’對(duì)應(yīng)于在接收器提供給濾波器304(圖6)的輸入y’，從而改善了在接收器處殘余信號(hào)的
的預(yù)測(cè)結(jié)果。因而，根據(jù)本實(shí)施例的編碼器可以與根據(jù)圖6的實(shí)施例的解碼器結(jié)合使用。
圖9顯示了根據(jù)本發(fā)明的第四實(shí)施例用于編碼立體聲信號(hào)的裝置的示意圖。本裝置是結(jié)合圖4所述的實(shí)施例的變形，包括用于執(zhí)行立體聲信號(hào)L和R的旋轉(zhuǎn)的電路401，用于確定旋轉(zhuǎn)角度的電路400，自適應(yīng)濾波器201，減法電路203，編碼器202，編碼器205，和組合電路204，如結(jié)合圖4所述。根據(jù)本實(shí)施例，主成分信號(hào)y不直接提供給濾波器201。替代地，本裝置進(jìn)一步包括乘法電路901，使用常數(shù)γ和從電路401接收的殘余信號(hào)r相乘，和加法電路902，用于為主成分信號(hào)y加上縮放后的殘余信號(hào)，從而生成信號(hào)y+γr提供給濾波器201。這里，γ是一個(gè)小的正值，例如為10-2數(shù)量級(jí)。在一個(gè)實(shí)施例中，對(duì)常數(shù)γ進(jìn)行自適應(yīng)追蹤。本實(shí)施例的優(yōu)點(diǎn)在于可以在通過(guò)濾波器201對(duì)殘余信號(hào)
的建模中利用在信號(hào)y的頻譜中基本不存在而存在于r的頻譜中的頻率，從而改善了編碼信號(hào)的質(zhì)量。根據(jù)本實(shí)施例，信號(hào)y+γr被提供給編碼器202，生成傳送到接收器的解碼的主信號(hào)ye。另外，根據(jù)本實(shí)施例，常數(shù)γ被提供給組合器204并傳輸?shù)浇邮掌鳌?br>圖10顯示了根據(jù)本發(fā)明的第四實(shí)施例用于解碼立體聲信號(hào)的裝置的示意圖，即適于解碼從圖9的編碼器接收的信號(hào)。本裝置包括用于從組合信號(hào)T中提取接收信息的電路301，解碼器302，解碼器303，濾波器304和如結(jié)合圖6所述的旋轉(zhuǎn)電路601。根據(jù)本實(shí)施例，電路301進(jìn)一步從組合信號(hào)T中提取常數(shù)γ，并且本裝置進(jìn)一步包括用接收的常數(shù)γ與濾波器304產(chǎn)生的預(yù)測(cè)殘余信號(hào)
相乘的乘法電路1001。本裝置進(jìn)一步包括用于從解碼的主信號(hào)y’中減去所得縮放后的預(yù)測(cè)殘余信號(hào)γ
的電路1002。
圖11顯示了根據(jù)本發(fā)明的第五實(shí)施例用于編碼多通道信號(hào)的裝置的示意圖。本裝置接收包括n個(gè)通道S1，…，Sn的多通道信號(hào)。本裝置包括用于執(zhí)行信號(hào)部分S1，…，Sn的主成分分析的主成分分析器1100，并得到用于將輸入信號(hào)變換成主成分信號(hào)y和n-1個(gè)殘余信號(hào)r1，r2，…，rn-1的加權(quán)矢量w＝(w1，…，wn)。本裝置進(jìn)一步包括變換電路1101，接收輸入信號(hào)部分S1，…，Sn和確定的加權(quán)矢量w并根據(jù)以上變換產(chǎn)生信號(hào)y和r1，r2，…，rn-1。主成分信號(hào)y被提供給一組自適應(yīng)濾波器201，每個(gè)預(yù)測(cè)殘余信號(hào)r1，r2，…，rn-1之一，如結(jié)合圖4所述，得到相應(yīng)的濾波參數(shù)Fp1，…，F(xiàn)p(n-1)，后者被提供給相應(yīng)的編碼器205以及隨后提供給組合器204。在相應(yīng)的解碼器(未示出)，相應(yīng)的濾波器被用于基于濾波參數(shù)生成殘余信號(hào)的估計(jì)
如結(jié)合圖6所述。本裝置進(jìn)—步包括編碼器202，用于編碼主成分信號(hào)y，得到提供給組合器204的編碼信號(hào)ye。
可以理解，根據(jù)一個(gè)實(shí)施例，只有殘余信號(hào)的一個(gè)子集例如r1，r2，…，rk，k＜n-1，可以被傳送到接收器或者提供給相應(yīng)的濾波器，從而減少了需要的比特率而保留了大部分信號(hào)質(zhì)量。
圖12顯示了本發(fā)明的實(shí)施例使用的減法電路的示意圖。在以上實(shí)施例中，通過(guò)比較目標(biāo)信號(hào)和估計(jì)信號(hào)來(lái)確定濾波參數(shù)，即通過(guò)例如由減法電路203生成的表示r和
之間差別的誤差信號(hào)e?？梢岳斫?，減法電路可以生成r和
之間差別的不同度量，例如可以在時(shí)域或者頻域確定差別。參照?qǐng)D12，電路203可以包括用于例如通過(guò)執(zhí)行快速傅里葉變換(FFT)將信號(hào)r和
分別變換到頻域的電路1201。所得的頻率部分可以進(jìn)一步地分別通過(guò)電路1204處理。例如不同的頻率可以不同地加權(quán)，優(yōu)選地根據(jù)人的聽(tīng)覺(jué)系統(tǒng)的特性，從而對(duì)可聽(tīng)頻率范圍內(nèi)的差別被更重地加權(quán)。通過(guò)電路1204的進(jìn)一步處理的其他例子包括對(duì)預(yù)定頻率部分的平均、計(jì)算復(fù)雜頻率部分的幅度、濾波部分的聚類(lèi)(cluster)等。例如在一個(gè)優(yōu)選實(shí)施例中，在頻域的減法之前執(zhí)行聚類(lèi)。此聚類(lèi)可以通過(guò)濾波器組來(lái)執(zhí)行，例如用線性或?qū)?shù)子帶寬。可選地，可以使用所謂的等效矩形帶寬(ERB)(例見(jiàn)“An introduction to the Psychology of Hearing”，by BrianMoore，Academic Press，London，1997)執(zhí)行聚類(lèi)。等效矩形帶寬技術(shù)對(duì)相應(yīng)于人的聽(tīng)覺(jué)濾波器的頻帶進(jìn)行聚類(lèi)，例如所謂的關(guān)鍵頻帶。根據(jù)本實(shí)施例，作為中心頻率的函數(shù)的ERB的對(duì)應(yīng)值f(以kHz為單位)可以根據(jù)ERB＝24.7(4.37f+1)來(lái)計(jì)算。仍然參照?qǐng)D12，電路203進(jìn)一步包括用于減去已處理頻率部分的減法電路1203?？蛇x地，由電路1201生成的變換信號(hào)不經(jīng)過(guò)進(jìn)一步處理就直接提供給減法電路1204。由減法電路1204產(chǎn)生的差信污被提供給變換電路1202，用于將誤差信號(hào)變換回時(shí)域，例如通過(guò)執(zhí)行逆快速傅里葉變換(IFFT)。可選地，可以直接使用頻域的差信號(hào)。
可以理解的，普通技術(shù)人員可以例如通過(guò)添加或減少特征，或者通過(guò)結(jié)合上述實(shí)施例的特征來(lái)修改上述實(shí)施例。例如，可以理解，圖8和9的實(shí)施例中介紹的特征也可以結(jié)合在圖11的實(shí)施例中。作為另一個(gè)例子，用來(lái)描述圖4的實(shí)施例中的估計(jì)殘余信號(hào)的質(zhì)量的誤差信號(hào)e可以與一個(gè)表示最大可接受誤差的誤差閾值比較。如果誤差不可接受，誤差信號(hào)可以在適當(dāng)?shù)鼐幋a后和信號(hào)T一起，與線性預(yù)測(cè)編碼(LPC)領(lǐng)域中使用的方法相似地傳輸。
進(jìn)一步要注意的是，本發(fā)明不限于立體聲信號(hào)，而是也可以應(yīng)用于其他具有兩個(gè)或更多輸入通道的多通道輸入信號(hào)。這種多通道信號(hào)的例子包括從數(shù)字通用光碟(DVD)或超級(jí)音頻光碟等中接收的信號(hào)。在這種更通用的情形，主成分信號(hào)y和一個(gè)或更多的殘余信號(hào)r仍可以根據(jù)本發(fā)明生成。傳輸?shù)臍堄嘈盘?hào)的數(shù)目依賴(lài)于通道的數(shù)目和所希望的比特率，因?yàn)榭梢月匀ポ^高階殘余而不會(huì)顯著降低信號(hào)質(zhì)量。
一般地，本發(fā)明的優(yōu)點(diǎn)在于比特率分配可以自適應(yīng)地改變，從而可以實(shí)現(xiàn)完美的降低。例如，如果信道在瞬間只允許傳輸一個(gè)減少的比特率，例如由于增加的網(wǎng)絡(luò)通信量、噪聲等，就可以降低傳輸信號(hào)的比特率而不會(huì)顯著降低信號(hào)的可察覺(jué)的質(zhì)量。例如，在上面討論的固定聲源的情形，可以用接近2的因子來(lái)降低比特率而不會(huì)顯著降低信號(hào)質(zhì)量，與傳輸一個(gè)單一通道而不是兩通道相比。
要注意的是，上述裝置可以實(shí)現(xiàn)為通用或特殊用途的可編程微處理器，數(shù)字信號(hào)處理器(DSP)，專(zhuān)用集成電路(ASIC)，可編程邏輯陣列(PLA)，現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)，特定用途的電子電路等，或者它們的組合。
應(yīng)該注意的是，上述實(shí)施例說(shuō)明而不是限制本發(fā)明，并且本領(lǐng)域普通人員能夠設(shè)計(jì)出許多替換實(shí)施例而不會(huì)脫離附加權(quán)利要求
的范圍。在權(quán)利要求
中，任何括號(hào)之間的參考標(biāo)記都不應(yīng)解釋為對(duì)權(quán)利要求
的限制。詞匯“包括”不排除未列在權(quán)利要求
中之外的其他元件或步驟的存在。本發(fā)明能夠通過(guò)包括多個(gè)不同元件的硬件和通過(guò)一適當(dāng)編程計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在一個(gè)列舉了多個(gè)設(shè)備的裝置權(quán)利要求
中，這些設(shè)備中的一些能夠通過(guò)同一個(gè)硬件單元來(lái)實(shí)現(xiàn)。在互不相同的從屬權(quán)利要求
中引用某些措施并不表示不能有利地使用這些措施的組合。
權(quán)利要求
1.一種編碼包括至少第一信號(hào)部分和第二信號(hào)部分的多通道信號(hào)的方法，本方法包括步驟—確定一預(yù)測(cè)濾波器的一組濾波參數(shù)，從而預(yù)測(cè)濾波器在接收到第一信號(hào)部分作為輸入時(shí)提供第二信號(hào)部分的估計(jì)；其中—所述第一信號(hào)部分是包括多個(gè)源信號(hào)部分的源多通道信號(hào)的主成分信號(hào)，而所述第二信號(hào)部分是一個(gè)相應(yīng)的殘余信號(hào)；以及該方法還包括步驟—通過(guò)預(yù)定變換將至少第一和第二源信號(hào)部分變換為包括大部分信號(hào)能量的主成分信號(hào)以及比主成分信號(hào)包含更少能量的至少該殘余信號(hào)，通過(guò)至少一個(gè)變換參數(shù)來(lái)參數(shù)化所述預(yù)定變換；以及將多通道信號(hào)表示成第一信號(hào)部分和該組濾波參數(shù)的步驟還包括將多通道信號(hào)表示為主成分信號(hào)、該組濾波參數(shù)以及變換參數(shù)。
2.根據(jù)權(quán)利要求
1的方法，其中確定該組濾波參數(shù)的步驟包括以下步驟確定濾波參數(shù)以使得第二信號(hào)部分和估計(jì)信號(hào)部分的差小于一個(gè)預(yù)定值。
3.根據(jù)權(quán)利要求
2的方法，其中將多通道信號(hào)表示成第一信號(hào)部分和該組濾波參數(shù)的步驟進(jìn)一步包括以下步驟如果所述差不小于所述預(yù)定值，則將多通道信號(hào)表示成第一信號(hào)部分、該組濾波參數(shù)以及表示第二信號(hào)部分與估計(jì)信號(hào)部分的差的誤差信號(hào)。
4.根據(jù)權(quán)利要求
1-3中的任何一個(gè)的方法，其特征在于第一信號(hào)部分對(duì)應(yīng)于第一信號(hào)能量，而第二信號(hào)部分對(duì)應(yīng)于小于第一信號(hào)能量的第二信號(hào)能量。
5.根據(jù)權(quán)利要求
1的方法，其中該方法進(jìn)一步包括將多通道源信號(hào)的至少第一源信號(hào)部分和第二源信號(hào)部分變換成第一和第二信號(hào)部分的步驟。
6.根據(jù)權(quán)利要求
5的方法，其中多通道源信號(hào)包括具有左和右信號(hào)部分的立體聲信號(hào)。
7.根據(jù)權(quán)利要求
1的方法，其中預(yù)定變換是一個(gè)旋轉(zhuǎn)，而變換參數(shù)對(duì)應(yīng)于旋轉(zhuǎn)角度。
8.根據(jù)權(quán)利要求
1的方法，其中確定一組濾波參數(shù)的步驟進(jìn)一步包括以下步驟確定至少一個(gè)用于縮放第二信號(hào)部分的估計(jì)的縮放參數(shù)，從而增加第二信號(hào)部分和第二信號(hào)部分的估計(jì)之間的相關(guān)性度量。
9.一種解碼多通道信號(hào)信息的方法，該方法包括步驟—接收第一信號(hào)部分和一組濾波參數(shù)；—利用相應(yīng)于所接收的該組濾波參數(shù)的預(yù)測(cè)濾波器來(lái)估計(jì)第二信號(hào)部分，預(yù)測(cè)濾波器接收所接收的第一信號(hào)部分作為輸入；其中—接收第一信號(hào)部分的步驟進(jìn)一步包括接收變換參數(shù)的步驟，第一信號(hào)部分對(duì)應(yīng)于多通道源信號(hào)的至少第一和第二源信號(hào)部分的預(yù)定變換的結(jié)果，至少通過(guò)該變換參數(shù)對(duì)預(yù)定變換進(jìn)行參數(shù)化；以及—該方法進(jìn)一步包括通過(guò)逆變換接收的第一信號(hào)部分和估計(jì)的第二信號(hào)部分而產(chǎn)生第一和第二解碼信號(hào)部分的步驟。
10.一種用于編碼包括至少第一信號(hào)部分和第二信號(hào)部分的多通道信號(hào)的裝置，該裝置包括—用于估計(jì)第二信號(hào)部分的預(yù)測(cè)濾波器，所述預(yù)測(cè)濾波器對(duì)應(yīng)于一組濾波參數(shù)并且接收第一信號(hào)部分作為輸入；其中—所述第一信號(hào)部分是包括多個(gè)源信號(hào)部分的源多通道信號(hào)的主成分信號(hào)而第二信號(hào)部分是相應(yīng)的殘余信號(hào)；以及該裝置還包括用于通過(guò)預(yù)定變換將至少第一和第二源信號(hào)部分變換成包括大部分信號(hào)能量的主成分信號(hào)和比該主成分信號(hào)包括更少能量的至少一個(gè)殘余信號(hào)的設(shè)備；以及—用于將多通道信號(hào)表示為主成分信號(hào)、該組濾波參數(shù)以及變換參數(shù)的處理設(shè)備。
11.一種用于解碼對(duì)應(yīng)于至少兩個(gè)信號(hào)部分的多通道信號(hào)的裝置，該裝置包括—用于接收多通道信號(hào)的第一信號(hào)部分和一組濾波參數(shù)的接收設(shè)備；—用于估計(jì)多通道信號(hào)的第二信號(hào)部分的預(yù)測(cè)濾波器，預(yù)測(cè)濾波器接收所接收的這組濾波參數(shù)和所接收的第一信號(hào)部分作為輸入；其中—接收設(shè)備被用于接收變換參數(shù)，該第一信號(hào)部分對(duì)應(yīng)于源多通道信號(hào)的至少第一和第二源信號(hào)部分的預(yù)定變換的結(jié)果，通過(guò)至少該變換參數(shù)對(duì)預(yù)定變換進(jìn)行參數(shù)化；以及—該裝置還包括通過(guò)逆變換所接收的第一信號(hào)部分和所估計(jì)的第二信號(hào)部分來(lái)產(chǎn)生第一和第二解碼信號(hào)部分的設(shè)備。
12.一種用于傳輸多通道信號(hào)的設(shè)備，這種設(shè)備包括一種用于編碼包括至少第一信號(hào)部分和第二信號(hào)部分的多通道信號(hào)的裝置，該裝置包括—用于估計(jì)第二信號(hào)部分的預(yù)測(cè)濾波器，所述預(yù)測(cè)濾波器對(duì)應(yīng)于一組濾波參數(shù)并且接收第一信號(hào)部分作為輸入；其中—所述第一信號(hào)部分是包括多個(gè)源信號(hào)部分的源多通道信號(hào)的主成分信號(hào)，而第二信號(hào)部分是相應(yīng)的殘余信號(hào)；以及該設(shè)備還包括通過(guò)預(yù)定變換將至少第一和第二源信號(hào)部分變換成包括大部分信號(hào)能量的主成分信號(hào)以及比該主成分信號(hào)包含更少能量的至少該殘余信號(hào)的設(shè)備，通過(guò)至少一個(gè)變換參數(shù)來(lái)參數(shù)化所述預(yù)定變換；以及—用于將多通道信號(hào)表示成主成分信號(hào)、該組濾波參數(shù)以及變換參數(shù)的處理設(shè)備。
專(zhuān)利摘要
所公開(kāi)的是一種編碼至少包括第一信號(hào)部分(y)和第二信號(hào)部分(r)的多通道信號(hào)的方法。本方法包括確定預(yù)測(cè)濾波器(201)的一組濾波參數(shù)(F
文檔編號(hào)G10L25/12GKCN1311426SQ03807982
公開(kāi)日2007年4月18日申請(qǐng)日期2003年3月20日
發(fā)明者R·M·阿爾特斯, R·艾旺申請(qǐng)人:皇家飛利浦電子股份有限公司導(dǎo)出引文BiBTeX, EndNote, RefMan

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：R.M.阿爾特斯;R.艾旺
技術(shù)所有人：皇家飛利浦電子股份有限公司
我是此專(zhuān)利的發(fā)明人