專利名稱:音頻編碼的制作方法
音頻編碼本發(fā)明涉及音頻編碼。本發(fā)明尤其涉及用于將音頻輸入信號(hào)轉(zhuǎn)換成雙耳聲(binaural)輸出信號(hào)的設(shè)備和方法,其中該輸入信號(hào)包括至少一 個(gè)音頻聲道和表示附加聲道的參數(shù)。記錄并再現(xiàn)雙耳聲音頻信號(hào),也就是包含人耳所敏感的特定方向性 信息的音頻信號(hào),是眾所周知的。雙耳聲記錄通常利用安裝在假人頭部 中的兩個(gè)麥克風(fēng)來進(jìn)行,使得所記錄的聲音對(duì)應(yīng)于人耳捕捉到的聲音, 并包括由于頭部和耳朵形狀所造成的任何影響。雙耳聲記錄與立體聲 (即立體音響)記錄的區(qū)別在于,再現(xiàn)雙耳聲記錄需要頭戴式耳機(jī) (headset),而立體聲記錄是為揚(yáng)聲器再現(xiàn)而給出。雖然雙耳聲記錄允 許只利用兩個(gè)聲道來再現(xiàn)所有的空間信息,立體聲記錄不能提供同樣的 空間感知。常規(guī)的雙聲道(立體音響)或多聲道(例如5.1)記錄可通過利用 一組感知轉(zhuǎn)移函數(shù)對(duì)每個(gè)常規(guī)信號(hào)進(jìn)行巻積而被變換為雙耳聲記錄。這 些感知轉(zhuǎn)移函數(shù)對(duì)人的頭部以及可能的其他部位對(duì)信號(hào)的影響進(jìn)行建 模。 一 類眾所周知的感知轉(zhuǎn)移函數(shù)是所謂的頭部相關(guān)轉(zhuǎn)移函數(shù) (Head-Related Transfer Function, HRTF )。 一種可替換的感知轉(zhuǎn)移函數(shù) 類型是雙耳聲房間沖激響應(yīng)(BRIR),其還考慮到由房間墻壁、天花板 和地4反所造成的反射。在多聲道信號(hào)的情況下,利用一組感知函數(shù)將信號(hào)變換為雙耳聲記 錄信號(hào),通常意味著將感知函數(shù)與所有聲道的信號(hào)進(jìn)行巻積。由于通常 的巻積對(duì)計(jì)算是有較高要求的,因此信號(hào)和HRTF通常被變換到頻(傅 立葉)域,在頻域中利用對(duì)計(jì)算的要求少得多的乘法來代替巻積。通過用更少數(shù)量的聲道和指示原始聲道之間關(guān)系的參數(shù)表示原始 數(shù)量的聲道,來減少要發(fā)送或存儲(chǔ)的音頻聲道數(shù)量也是眾所周知的。一 組立體聲信號(hào)由此可以用單個(gè)(單聲)聲道加上多個(gè)相關(guān)聯(lián)的空間參數(shù) 來表示,而一組5.1信號(hào)可以用兩個(gè)聲道和一組相關(guān)耳關(guān)的空間參數(shù)來表 示,或者甚至用單個(gè)聲道加上相關(guān)聯(lián)的空間參數(shù)來表示。這種在空間編 碼器中對(duì)多個(gè)音頻聲道進(jìn)行的"下混合(downmixing)",和相應(yīng)的在空間編碼器中對(duì)音頻信號(hào)的"上混合(upmixing),,,通常在變換域或 子帶域中執(zhí)行,例如在QMF (正交鏡像濾波器)域中執(zhí)行。當(dāng)下混合的輸入聲道要被轉(zhuǎn)換為雙耳聲輸出聲道時(shí),現(xiàn)有技術(shù)中的 方法是首先利用空間解碼器對(duì)輸入聲道進(jìn)行上混合,產(chǎn)生上混合后的中 間聲道,然后將這些上混合后的中間聲道轉(zhuǎn)換為雙耳聲聲道。這個(gè)過程 通常產(chǎn)生五個(gè)或六個(gè)中間聲道,然后這些中間聲道必須減少為兩個(gè)雙耳 聲聲道。先擴(kuò)充聲道數(shù)量然后再減少聲道數(shù)量的做法明顯是不高效的, 并且增加了計(jì)算復(fù)雜度。另外,將打算用于多聲道揚(yáng)聲器再現(xiàn)的五個(gè)或 六個(gè)中間聲道減少為打算用于雙耳聲再現(xiàn)的僅僅兩個(gè)聲道,不可避免地 引入人工噪聲并因此降低聲音質(zhì)量。上面提到的QMF域與頻率(傅立葉)域相似但不相同。如果空間 解碼器是要產(chǎn)生雙耳聲輸出信號(hào),則下混合后的音頻信號(hào)首先必須被變 換到QMF域以用于上混合,然后被逆QMF變換以產(chǎn)生時(shí)域中間信號(hào), 接下來被變換到頻域用于與(經(jīng)過傅立葉變換的)HRTF相乘,最后被 逆變換以產(chǎn)生時(shí)域輸出信號(hào)。將會(huì)明白,由于必須連續(xù)進(jìn)行幾個(gè)變換, 這個(gè)過程不是高效的。該現(xiàn)有技術(shù)方法中所涉及的計(jì)算量將會(huì)使得很難設(shè)計(jì)出能夠由下 混合后的音頻信號(hào)產(chǎn)生雙耳聲輸出信號(hào)的手持消費(fèi)設(shè)備,諸如便攜式 MP3播放器。即使這種設(shè)備能夠?qū)崿F(xiàn),由于所需要的計(jì)算負(fù)擔(dān),其電池 壽命也會(huì)非常短。本發(fā)明的目的是克服現(xiàn)有技術(shù)的這些以及其它問題,并提供能夠從 一組下混合后的音頻聲道產(chǎn)生一對(duì)雙耳聲輸出聲道的空間解碼器單元, 其中所述一組下混合后的音頻聲道由一個(gè)或更多音頻輸入聲道和相關(guān) 聯(lián)的空間參數(shù)組來表示,該解碼器具有提高的效率。因此,本發(fā)明提供利用空間參數(shù)和一個(gè)或更多音頻輸入聲道,產(chǎn)生 一對(duì)雙耳聲輸出聲道的空間解碼器單元,該設(shè)備包括利用參數(shù)化感知轉(zhuǎn) 移函數(shù),將空間參數(shù)轉(zhuǎn)換為雙耳聲參數(shù)的參數(shù)轉(zhuǎn)換單元,和利用雙耳聲 參數(shù)和音頻聲道合成一對(duì)雙耳聲聲道的空間合成單元。通過將空間參數(shù)轉(zhuǎn)換為雙耳聲參數(shù),空間合成單元能夠直接合成一 對(duì)雙耳聲聲道,而不需要附加的雙耳聲合成單元。由于不產(chǎn)生多余的中間信號(hào),計(jì)算上的要求降低,同時(shí)也基本消除了人工噪聲的引入。在本發(fā)明的空間解碼器單元中,可以在例如QMF域的變換域中執(zhí)行雙耳聲聲道的合成,而無需變換到頻域以及接下來逆變換到時(shí)域的附 加步驟。由于可以省略兩個(gè)變換步驟,因此計(jì)算量和存儲(chǔ)需求都大大降 低。因此本發(fā)明的空間解碼器單元能夠相對(duì)容易地在便攜式消費(fèi)設(shè)備中實(shí)現(xiàn)。并且,在本發(fā)明的空間解碼器單元中,雙耳聲聲道直接從下混合后 的聲道產(chǎn)生,每個(gè)雙耳聲聲道包括用于利用頭戴式耳機(jī)或相似設(shè)備進(jìn)行 雙耳聲再現(xiàn)的雙耳聲信號(hào)。參數(shù)轉(zhuǎn)換單元導(dǎo)出雙耳聲參數(shù),其用于從空 間(即上混合)參數(shù)產(chǎn)生雙耳聲聲道。這種雙耳聲參數(shù)的導(dǎo)出涉及參數(shù)化感知轉(zhuǎn)移函數(shù),諸如HRTF (頭部相關(guān)轉(zhuǎn)移函數(shù))和/或雙耳聲房間沖 激響應(yīng)(BRIR)。因此根據(jù)本發(fā)明,感知轉(zhuǎn)移函數(shù)的處理在參數(shù)域中進(jìn) 行,而在現(xiàn)有技術(shù)中,該處理在時(shí)域或頻域中進(jìn)行。由于參數(shù)域中的分 辨率通常低于時(shí)域或頻域中的分辨率,這將會(huì)使得計(jì)算復(fù)雜度進(jìn)一步降低。優(yōu)選地,參數(shù)轉(zhuǎn)換單元被配置為,為了確定雙耳聲參數(shù),在參數(shù)域 中將輸入(下混合)音頻聲道對(duì)雙耳聲聲道將會(huì)做出的所有感知轉(zhuǎn)移函 數(shù)貢獻(xiàn)進(jìn)行組合。換句話說,空間參數(shù)和參數(shù)化感知轉(zhuǎn)移函數(shù)以這樣的現(xiàn)^技術(shù)中獲得的:耳,輸出信號(hào)相似的統(tǒng)計(jì)特性的k耳J輸L信號(hào)。、 在優(yōu)選實(shí)施例中,本發(fā)明的空間解碼器單元進(jìn)一步包括一個(gè)或更多 用于將音頻輸入聲道變換為變換后的音頻輸入聲道的變換單元,和一對(duì) 用于將合成后的雙耳聲聲道逆變換為一對(duì)雙耳聲輸出聲道的逆變換單 元,其中空間合成單元被配置為工作在變換域或子帶域中,優(yōu)選地是在 QMF域中。本發(fā)明的空間解碼器單元可包括兩個(gè)變換單元,參數(shù)轉(zhuǎn)換單元被配 置為采用只涉及三個(gè)聲道的感知轉(zhuǎn)移函數(shù)參數(shù),這三個(gè)聲道中的兩個(gè)合 并了合成的前后聲道的貢獻(xiàn)。在該實(shí)施例中,參數(shù)轉(zhuǎn)換單元可被配置為 處理聲道電平(例如CLD )、聲道相干性(例如ICC )、聲道預(yù)測(cè)(例 如CPC )和/或相4立(例如IPD )參l史。在可替換實(shí)施例中,本發(fā)明的空間解碼器單元可只包括單個(gè)變換單 元,并進(jìn)一步包括去相關(guān)單元,用于對(duì)單個(gè)變換單元輸出的變換后的單 個(gè)聲道進(jìn)行去相關(guān)。在該實(shí)施例中,參數(shù)轉(zhuǎn)換單元可被配置為處理聲道 電平(例如CLD )、聲道相干性(例如ICC )和/或相位(例如IPD )參 數(shù)。本發(fā)明的空間解碼器單元可附加地包括立體聲混響單元。該立體聲混響單元可被配置為工作在時(shí)域或變換域或子帶(例如QMF)域中。本發(fā)明還提供用于從輸入比特流產(chǎn)生 一對(duì)雙耳聲輸出聲道的空間 解碼器設(shè)備,該設(shè)備包括將輸入比特流多路分解為至少一個(gè)下混合聲道 和信號(hào)參數(shù)的多路分解器單元、解碼至少 一 個(gè)下混合聲道的下混合解碼 器單元,和利用空間參數(shù)和至少一個(gè)下混合聲道產(chǎn)生一對(duì)雙耳聲輸出聲 道的空間解碼器單元,其中空間解碼器單元包括利用參數(shù)化感知轉(zhuǎn)移函 數(shù)將空間參數(shù)轉(zhuǎn)換為雙耳聲參數(shù)的參數(shù)轉(zhuǎn)換單元,和利用雙耳聲參數(shù)和 至少 一個(gè)下混合聲道合成一對(duì)雙耳聲聲道的空間合成單元。另外,本發(fā)明提供包括如上定義的空間解碼器單元和/或空間解碼器 設(shè)備的消費(fèi)設(shè)備和音頻系統(tǒng)。本發(fā)明進(jìn)一步提供利用空間參數(shù)和一個(gè)或 更多音頻輸入聲道來產(chǎn)生 一對(duì)雙耳聲輸出聲道的方法,該方法包括如下 步驟利用參數(shù)化感知轉(zhuǎn)移函數(shù)將空間參數(shù)轉(zhuǎn)換為雙耳聲參數(shù),利用雙 耳聲參數(shù)和音頻聲道合成 一對(duì)雙耳聲聲道。根據(jù)本發(fā)明方法的進(jìn)一 步的方面將通過下面的描述而變得明顯。本發(fā)明附加地提供執(zhí)行如上定義的方法的計(jì)算機(jī)程序產(chǎn)品。計(jì)算機(jī) 程序產(chǎn)品可包括存儲(chǔ)在諸如CD或DVD之類數(shù)據(jù)載體上的一組計(jì)算機(jī) 可執(zhí)行指令。允許可編程計(jì)算機(jī)執(zhí)行如上定義的方法的該組計(jì)算機(jī)可執(zhí) 行指令還可以例如通過互聯(lián)網(wǎng)而/人遠(yuǎn)程服務(wù)器上下載得到。下面結(jié)合附圖中所示的示例性實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步的解 釋,其中
圖1示意性地示出了根據(jù)現(xiàn)有技術(shù)的頭部相關(guān)轉(zhuǎn)移函數(shù)的應(yīng)用。圖2示意性地示出了根據(jù)現(xiàn)有技術(shù)的空間音頻編碼器設(shè)備。圖3示意性地示出了根據(jù)現(xiàn)有技術(shù),耦合到雙耳聲合成設(shè)備的空間音頻解碼器設(shè)備。圖4示意性地示出了根據(jù)現(xiàn)有技術(shù)的空間音頻解碼器單元。圖5示意性地示出了根據(jù)本發(fā)明的空間音頻解碼器單元。圖6示意性地示出了根據(jù)本發(fā)明的空間音頻解碼器設(shè)備。圖7示意性地示出了圖5的空間音頻解碼器單元,其提供有變換域〉'昆響單元。圖8示意性地示出了圖5的空間音頻解碼器單元,其提供有時(shí)域混 響單元。圖9示意性地示出了根據(jù)本發(fā)明,提供有空間音頻解碼設(shè)備的消費(fèi)設(shè)備。圖1示意性地示出了根據(jù)現(xiàn)有技術(shù),諸如頭部相關(guān)轉(zhuǎn)移函數(shù)的感知轉(zhuǎn)移函數(shù)的應(yīng)用。所示雙耳聲合成設(shè)備3包括六個(gè)HRTF單元31,每個(gè) 都包含用于輸入聲道和輸出聲道特定組合的轉(zhuǎn)移函數(shù)。在所示例子中, 有三個(gè)音頻輸入聲道chl、 ch2和ch3,其對(duì)應(yīng)于聲道l(左)、c(中) 和r (右)。第一聲道chl被饋送到分別包含HRTF(1,L)和HRTF(1,R) 的兩個(gè)HRTF單元31。在該例子中,HRTF(1,L)是確定第一聲道對(duì)左雙 耳聲信號(hào)的貢獻(xiàn)的頭部相關(guān)轉(zhuǎn)移函數(shù)。本領(lǐng)域技術(shù)人員將會(huì)知道,可通過進(jìn)行常規(guī)(立體聲)記錄和雙耳 聲記錄,并導(dǎo)出表示雙耳聲記錄相對(duì)于常規(guī)記錄的形狀的轉(zhuǎn)移函數(shù)來確 定HRTF。雙耳聲記錄是利用安裝在假人頭部的兩個(gè)麥克風(fēng)來做出,使 得所記錄的聲音對(duì)應(yīng)于人耳捕捉的聲音,并包括由于頭部和耳朵形狀、 甚至是頭發(fā)和肩膀的存在所造成的任何影響。如果HRTF處理發(fā)生在時(shí)域,將HRTF與聲道(時(shí)域)音頻信號(hào)進(jìn) 行巻積。然而通常,HRTF被變換到頻域,然后將作為結(jié)果得到的轉(zhuǎn)移 函數(shù)和音頻信號(hào)頻譜相乘(圖1未示出傅立葉變換單元和逆傅立葉變換 單元)。涉及重疊時(shí)間幀的適當(dāng)?shù)闹丿B相加(OLA)技術(shù)可^L用于適應(yīng) 長度大于快速傅立葉變換(FFT)幀的HRTF。在由適當(dāng)?shù)腍RTF單元31進(jìn)行HRTF處理之后,作為結(jié)果得到的 左和右信號(hào)被各自的加法器32相加,生成(時(shí)域)左雙耳聲信號(hào)lb和 右雙耳聲信號(hào)rb。圖1中示例性現(xiàn)有技術(shù)的雙耳聲合成設(shè)備3具有三個(gè)輸入聲道。當(dāng) 今的音頻系統(tǒng)通常具有五個(gè)或六個(gè)聲道,正如所謂的5.1系統(tǒng)中的情況。 然而,為了減少要被發(fā)送和/或存儲(chǔ)的數(shù)據(jù)量,通常將多個(gè)音頻聲道減少 ("下混合,,)到一個(gè)或兩個(gè)聲道。指示原始聲道特性和相互關(guān)系的多 個(gè)信號(hào)參數(shù)允許將一個(gè)或兩個(gè)聲道擴(kuò)充("上混合,,)到原始數(shù)量的聲道。根據(jù)現(xiàn)有技術(shù)的示例性空間編碼器設(shè)備1被示意性地示于圖2??臻g編碼器設(shè)備1包括空間編碼(SE )單元11 、下混合編碼(DE ) 單元12和多路復(fù)用器(Mux) 13。空間編碼單元11接收五個(gè)音頻輸入 聲道If (左前)、lr (左后)、rf (右前)、rr (右后)和c (中間)。 空間編碼單元11下混合五個(gè)輸入聲道,產(chǎn)生兩個(gè)聲道l(左)和r(右),以及信號(hào)參數(shù)sp (注意,空間編碼單元11可產(chǎn)生單個(gè)聲道而代替兩個(gè)聲道l和r)。在所示實(shí)施例中,其中五個(gè)聲道被下混合為兩個(gè)聲道(所 謂的5_2-5配置),信號(hào)參數(shù)sp例如包括參數(shù)描述CPd用于2到3轉(zhuǎn)換的預(yù)測(cè)/能量參數(shù)CPC2用于2到3轉(zhuǎn)換的預(yù)測(cè)/能量參數(shù)CIXh左前對(duì)左后的電平差CLDr右前^t右后的電平差I(lǐng)Cd左前對(duì)左后的相關(guān)性ICCr右前對(duì)右后的相關(guān)性ICCf用于2到3轉(zhuǎn)換的相關(guān)性參數(shù)CLDlfe中對(duì)lfe (如果適用的話)的電平差注意,"左,,是可選的低頻(超低音喇叭)聲道,并且"后"聲道 也可稱之為"環(huán)繞"聲道。由空間編碼單元11產(chǎn)生的兩個(gè)下混合聲道1和r祐匸饋送到下混合編 碼(DE)單元12,其通常使用旨在減少數(shù)據(jù)量的一類編碼。這樣編碼 后的下混合聲道1和r以及信號(hào)參數(shù)sp被多路復(fù)用單元13進(jìn)行多路復(fù) 用,以產(chǎn)生輸出比特流bs。在可替換實(shí)施例(未示出)中,五個(gè)(或六個(gè))聲道被下混合為單 個(gè)(單聲)聲道(所謂的5-1-5配置),且信號(hào)參數(shù)sp可例如包括參數(shù)描述前7于后的電平差CLDfc前對(duì)中的電平差CLDf左前,寸右前的電平差CLDs左后對(duì)右后的電平差I(lǐng)CCfs前對(duì)后的相關(guān)性ICCfc前對(duì)中的相關(guān)性ICCf左前對(duì)右前的相關(guān)性ICCs左后對(duì)右后的相關(guān)性CLDlfe中對(duì)lfe (如果適用的話)的電平差在該可替換實(shí)施例中,編碼后的下混合聲道S以及信號(hào)參數(shù)sp也被 多路復(fù)用器單元13進(jìn)行多路復(fù)用,產(chǎn)生輸出比特流bs。如果該比特流bs要被用于產(chǎn)生一對(duì)雙耳聲聲道,則現(xiàn)有技術(shù)的方法將會(huì)首先對(duì)兩個(gè)下混合聲道l和r (或者可替換地,單個(gè)下混合聲道) 進(jìn)行上混合,產(chǎn)生五個(gè)或六個(gè)原始聲道,然后將這五個(gè)或六個(gè)原始聲道 轉(zhuǎn)換為兩個(gè)雙耳聲聲道。該現(xiàn)有技術(shù)方法的例子示于圖3。根據(jù)現(xiàn)有技術(shù)的空間解碼器設(shè)備2,包括多路分解器(Demux)單元 21,、下混合解碼單元22,和空間解碼器單元23,。雙耳聲合成設(shè)備3被 耦合到空間解碼器設(shè)備2,的空間解碼器單元23,。多路分解器單元21,接收可以與圖2的比特流bs相同的比特流bs, 并輸出信號(hào)參數(shù)sp和兩個(gè)編碼的下混合聲道。信號(hào)參數(shù)sp被發(fā)送到空 間解碼器單元23,,而編碼的下混合聲道首先由下混合解碼單元22,進(jìn)行 解碼,產(chǎn)生解碼的下混合聲道l和r??臻g解碼器單元23,本質(zhì)上執(zhí)行圖 2中空間編碼單元11的逆操作,并輸出五個(gè)音頻聲道。這五個(gè)音頻聲道 被饋送到雙耳聲合成設(shè)備3,其可以具有與圖1的設(shè)備3相似的結(jié)構(gòu), 但是還具有附加的HRTF單元31,以便適應(yīng)所有五個(gè)聲道。正如圖1中 的例子,雙耳聲合成設(shè)備3輸出兩個(gè)雙耳聲聲道lb(左雙耳聲)和rb(右 雙耳聲)?,F(xiàn)有技術(shù)的空間解碼器單元23,的示例性結(jié)構(gòu)被示于圖4。圖4的單 元23,包括二到三上混合單元230,、三個(gè)空間合成(SS)單元232,和三 個(gè)去相關(guān)(D)單元239,。 二到三上混合單元230,接收下混合聲道1和 r和信號(hào)參數(shù)sp,并產(chǎn)生三個(gè)聲道l、 r和ce。這些聲道的每一個(gè)都被饋 送到去相關(guān)單元239,,其產(chǎn)生各自聲道的去相關(guān)后版本。聲道1、 r和 ce的每一個(gè),其各自的去相關(guān)版本和相關(guān)聯(lián)的信號(hào)參數(shù)sp被饋送到各 自的空間合成(或上混合)單元232,。接收聲道l的空間合成單元232' 例如輸出輸出聲道lf (左前)和lr (左后)??臻g合成單元232,通常實(shí) 施矩陣乘法,矩陣參數(shù)由信號(hào)參數(shù)sp確定。注意,在圖4的例子中,產(chǎn)生六個(gè)輸出聲道。在一些實(shí)施例中,第 三去相關(guān)單元239,和第三空間合成單元232,可以省略,由此只產(chǎn)生五個(gè) 輸出聲道。然而,在所有實(shí)施例中,現(xiàn)有技術(shù)的空間合成單元23,將產(chǎn) 生多于兩個(gè)的輸出聲道。進(jìn)一步注意,為了解釋清楚,任何(QMF)變 換單元和逆(QMF)變換單元已經(jīng)從圖4的僅僅示意性的例子中省略。在實(shí)際的實(shí)施例中,空間解碼將會(huì)在諸如QMF域的變換域中執(zhí)行。圖3中的配置是不高效的??臻g解碼器設(shè)備2,將兩個(gè)下混合聲道U 和r)轉(zhuǎn)換為五個(gè)上混合后的(中間)聲道,而雙耳聲合成設(shè)備3則將 五個(gè)上混合后的聲道減少為兩個(gè)雙耳聲聲道。另外,空間解碼器單元23, 中的上混合通常是在諸如QMF (正交鏡像濾波)域的子帶域中執(zhí)行。然 而,雙耳聲合成設(shè)備3通常在頻率(也就是傅立葉變換)域中處理信號(hào)。 由于這兩個(gè)域不同,空間解碼器設(shè)備2,首先將下混合聲道的信號(hào)變換到 QMF域,處理變換后的信號(hào),然后將上混合后的信號(hào)變換回時(shí)域。接下 來,雙耳聲合成設(shè)備3將所有(本例子中的五個(gè))這些上混合后的信號(hào) 變換到頻域,處理變換后的信號(hào),然后將雙耳聲信號(hào)變換回時(shí)域。將會(huì) 清楚,所涉及的計(jì)算工作量相當(dāng)大,希望進(jìn)行更高效的信號(hào)處理,特別 是當(dāng)該處理在手持設(shè)備中執(zhí)行時(shí)。本發(fā)明通過將雙耳聲合成設(shè)備集成在空間解碼器設(shè)備中,并在參數(shù) 中有效地執(zhí)行雙耳聲處理來提供高效得多的處理。根據(jù)本發(fā)明,空間解 碼器單元的僅僅示例性的實(shí)施例被示意性地示于圖5,而根據(jù)本發(fā)明組 合的空間和雙耳聲解碼器設(shè)備(為了簡便稱作空間解碼器設(shè)備)被示于 圖6。僅借助非限制性例子示于圖5中的獨(dú)創(chuàng)性空間解碼器單元23包括 變換單元231、空間合成(SS )單元232、逆變換單元233、參數(shù)轉(zhuǎn)換(PC ) 單元234和存儲(chǔ)(Mem)單元235。在圖5的示例性實(shí)施例中,空間解 碼器單元23包括兩個(gè)變換單元231,但是在可替換性實(shí)施例中只有單個(gè) 變換單元231 (如圖6中所示)或者兩個(gè)以上的變換單元231可以出現(xiàn), 這取決于下混合聲道的數(shù)量。變換單元231的每一個(gè)都分別接收下混合聲道l和r(還參見圖3)。 每個(gè)變換單元231被配置為將各個(gè)聲道(的信號(hào))變換到適當(dāng)?shù)淖儞Q或 子帶域,在當(dāng)前例子中是QMF域。QMF變換后的聲道L和R被饋送到 空間合成單元232,其優(yōu)選地對(duì)聲道L和R的信號(hào)執(zhí)行矩陣操作,從而 產(chǎn)生變換域雙耳聲聲道Lb和Rb。逆變換單元233 4丸行逆變換,在本例 子中是逆QMF變換,從而產(chǎn)生雙耳聲時(shí)域聲道lb和rb??臻g合成單元232可以與圖4中現(xiàn)有4支術(shù)的空間合成單元232,相似 或相同。然而,該單元使用的參數(shù)與現(xiàn)有技術(shù)中使用的參數(shù)不同。更特將常規(guī)的空間參數(shù)sp轉(zhuǎn)換為雙耳聲參數(shù)bp。這些HRTF參數(shù)hp可包括每個(gè)頻帶對(duì)于左轉(zhuǎn)移函數(shù)的平均電平,其中所述左轉(zhuǎn)移函數(shù)是方位 角(水平面中的角)、仰角(垂直平面中的角)和距離的函數(shù),每個(gè)頻帶對(duì)于右轉(zhuǎn)移函數(shù)的平均電平,其中所述右轉(zhuǎn)移函數(shù)是方位 角、仰角和距離的函數(shù),和每個(gè)頻帶的平均相位或時(shí)間差,其是方位角、仰角和距離的函數(shù)。另外,也可包括如下參數(shù)每個(gè)HRTF頻帶左和右轉(zhuǎn)移函數(shù)的相干性測(cè)度,其是方位角、仰角 和距離的函數(shù),和/或?qū)τ谧蠛陀肄D(zhuǎn)移函數(shù)的絕對(duì)相位和/或時(shí)間參數(shù),其是方位角、仰角 和距離的函數(shù)。所使用的實(shí)際HRTF參數(shù)將依賴于特定的實(shí)施例??臻g合成單元232可利用如下公式來確定雙耳聲聲道Lb和Rb:=仏歌m](1)其中索引k代表QMF混合(頻)帶索引,索引m代表QMF (時(shí)) 隙索引。矩陣Hk的參數(shù)hy由雙耳聲參數(shù)(圖5中的bp)確定。如索引 k所指示,矩陣Hk可取決于QMF混合帶。在第一實(shí)施例中,參數(shù)轉(zhuǎn)換 單元(圖5中的234)產(chǎn)生雙耳聲參數(shù),該參數(shù)然后被空間合成單元2;32 轉(zhuǎn)換為矩陣參數(shù)hy。在第二實(shí)施例中,矩陣參數(shù)hij與參數(shù)轉(zhuǎn)換單元(圖 5中的234)產(chǎn)生的雙耳聲參數(shù)相同,并且可由空間合成單元232在不 轉(zhuǎn)換的情況下直接應(yīng)用。在兩個(gè)下混合聲道(5-2-5配置)的情況下,矩陣Hk的參數(shù) 可以 以如下方式確定。在現(xiàn)有技術(shù)中,圖4中的空間解碼器單元,2到3解 碼器單元230,將兩個(gè)(輸入)下混合聲道l和r轉(zhuǎn)換為三個(gè)(輸出)聲 道l、 r和ce(將會(huì)明白,輸出聲道1和r通常將不會(huì)與輸入聲道1和r 相同,為此輸入聲道在下面的討-論中將用lo和ro標(biāo)注。根據(jù)本發(fā)明的另一個(gè)方面,參數(shù)轉(zhuǎn)換單元(圖5和6中的234)被 配置為利用只考慮三個(gè)聲道(例如1、 r和c)貢獻(xiàn)的感知轉(zhuǎn)移函數(shù)參數(shù), 這三個(gè)聲道中的兩個(gè)(例如1和r )包括復(fù)合的各個(gè)前(lf,rf)和后(lr,rr ) 聲道。也就是說,各個(gè)前和后聲道被分組到一起以改善效率??梢杂萌缦碌木仃嚥僮鱽砻枋龆饺匣旌蠁卧?30,的操作<formula>formula see original document page 13</formula>矩陣項(xiàng)目my依賴于空間參數(shù)。空間參數(shù)與矩陣項(xiàng)目的關(guān)系與5.1 MPEG環(huán)繞解碼器中的相同。對(duì)三個(gè)所得到信號(hào)1、 r和c的每一個(gè)來說, 對(duì)應(yīng)于這些聲源期望的(感知的)位置的感知轉(zhuǎn)移函數(shù)(本例子中是 HRTF)參數(shù)的效果被確定。對(duì)中心聲道(c)來說,聲源位置的空間參 數(shù)可以直接應(yīng)用,得到用于中心的兩個(gè)輸出信號(hào)1b(c)和rB(c):諷<formula>formula see original document page 13</formula>(3)從方程(3)可以看出,HRTF參數(shù)處理包括將信號(hào)與對(duì)應(yīng)于中心聲 道聲源位置的平均功率電平Pi和Pr相乘,而相位差對(duì)稱分布。該處理對(duì) 每個(gè)QMF帶獨(dú)立進(jìn)行, 一方面利用從HRTF參數(shù)到QMF濾波器組的映 射,另一方面利用從空間參數(shù)到QMF帶的映射。對(duì)于左(1)聲道來說,利用權(quán)重Wlf和Wrf,將來自左前和左后聲道的HRTF參數(shù)組合為單個(gè)貢獻(xiàn)。得到的復(fù)合參數(shù)在統(tǒng)計(jì)意義上模擬前聲 道和后聲道的影響。使用如下方程來生成用于左聲道的雙耳聲輸出對(duì) (lb,rb):<formula>formula see original document page 13</formula>和 權(quán)重wif和Wrf依賴于1到2單元對(duì)于lf和lr的CLD參數(shù):<formula>formula see original document page 14</formula>(8)以相似的方式,根據(jù)如下方程獲得用于右聲道的雙耳聲輸出<formula>formula see original document page 14</formula>(9),<formula>formula see original document page 14</formula> (10)(11)(12)<formula>formula see original document page 14</formula>注意到,在兩種情況下,相位修改項(xiàng)被應(yīng)用到對(duì)側(cè)耳(contra-lateral ear)。并且,由于人的聽覺系統(tǒng)對(duì)于頻率在大約2kHz以上的雙耳聲相 位非常不敏感,因此相位修改項(xiàng)只需要應(yīng)用在低頻區(qū)域。因此對(duì)于剩余 的頻率范圍來說,實(shí)值的處理就足夠了 (假設(shè)實(shí)值m^)。進(jìn)一步注意到,上述方程假設(shè)對(duì)lf和lr的(HRTF)濾波信號(hào)進(jìn)行 非相干相加。 一種可能的擴(kuò)展可以也將發(fā)送的lf和lr (以及l(fā)f和rr)的 信道間相干(ICC)參數(shù)包括在方程中,以考慮前/后相關(guān)性。上述所有的處理步驟可以在參數(shù)域中進(jìn)行組合,從而得到單個(gè)信號(hào)域2x2矩陣/in -/^//'(O + ^/f'OO + ^/^c) (15a) A12 =wl2W,(/) + W22//,(r) + w32//,(C) (15b) &『,//r(/) + w2l//r(r) + w3,/fr(c) (15c) =ml2Wr(/) + w22//rO) + /M32//r(c) (15d).從上面;f艮清楚地看出,本發(fā)明本質(zhì)上在參數(shù)域中處理雙耳聲(也就 是HRTF)信息,來代替現(xiàn)有技術(shù)中在頻域或時(shí)域中處理。以這種方式, 可以很大程度地節(jié)省計(jì)算量。根據(jù)本發(fā)明,僅僅以非限制性例子示于圖6中的空間解碼器設(shè)備2 包括多路分解(Demux)單元21、下混合解碼單元22和空間/雙耳聲解 碼器單元23。多路分解器單元21和下混合解碼單元22可以與圖3所示 現(xiàn)有技術(shù)的多路分解器單元21,和下混合解碼單元22,相似。除了下混合 聲道和相關(guān)聯(lián)變換單元的數(shù)目不同之外,圖6的空間解碼器單元23與 圖5的空間解碼器單元23相同。由于圖6的空間解碼器設(shè)備被配置為 用于單個(gè)下混合聲道s,因此只提供單個(gè)變換單元231,而去相關(guān)(D) 單元239已經(jīng)被相加用于產(chǎn)生(變換域)下混合信號(hào)S去相關(guān)后的版本 D。由于與單個(gè)下混合聲道s相關(guān)聯(lián)的信號(hào)參數(shù)sp通常不同于那些與兩 個(gè)下混合聲道相關(guān)聯(lián)的信號(hào)參數(shù),因此由參數(shù)轉(zhuǎn)換單元234產(chǎn)生的雙耳 聲參數(shù)bp通常與圖5所示實(shí)施例中的參數(shù)不同。在圖6的配置中,雙耳聲解碼器的輸入包括伴隨有空間參數(shù)sp的 單聲輸入信號(hào)s。雙耳聲合成單元生成立體聲輸出信號(hào),該信號(hào)的統(tǒng)計(jì) 特性接近于對(duì)原始5.1輸入進(jìn)行HRTF處理將會(huì)得到的統(tǒng)計(jì)特性,可以 用如下方程描述/b + + + (16)給定描述聲道lf、 rf、 lr、 rr和c統(tǒng)計(jì)特性和相互關(guān)系的空間參數(shù)和 HRTF沖激響應(yīng)的參數(shù),還可以估計(jì)出雙耳聲輸出對(duì)lb、 fb的統(tǒng)計(jì)特性 (也就是雙耳聲參數(shù)的近似值)。更特殊地,可以估計(jì)(每個(gè)聲道的) 平均能量、平均相位差和相干性,接下來通過去相關(guān)和對(duì)單聲輸入信號(hào) 矩陣運(yùn)算來恢復(fù)(re-instate)。雙耳聲參數(shù)包括兩個(gè)雙耳聲輸出聲道中每一個(gè)的(相對(duì))電平變化(并因此定義聲道電平差參數(shù))、(平均)相位差和相干性測(cè)度(每個(gè)變換域時(shí)間/頻率片(tile))。第一步,利用發(fā)送的CLD參數(shù)來計(jì)算五個(gè)(或六個(gè))聲道(5.1) 信號(hào)的相對(duì)功率(相對(duì)于單聲輸入信號(hào)的功率)。左前聲道的相對(duì)功率 由如下方程給出< "(CLD,)(CLD,c)r,(CLD,) (18), 其中r,(CLD):o固。 (19),禾:口"CLD)" + ;, (20).相似地,其它聲道的相對(duì)功率由如下方程給出a》"(CLDf>,(CLDf>2(CLDf) (21a)c^"(CLD》2(CLDfc) (21b)a,〗"2(CLD),(CLDs) (21c)a: "2(CLDfty2(CLD8) (21d)然后,可以計(jì)算左雙耳聲輸出聲道(相對(duì)于單聲輸入聲道)的相對(duì) 功率a£2的期望值、右雙耳聲輸出聲道的相對(duì)功率o"〗的期望值和叉乘 丄。凡*的期望值。然后由如下方程給出雙耳聲輸出(ICCB)的相干性ICCS =(22)且平均相位角(IPDB)由如下方程給出 =arg(〈"; ;〉) (23) 雙耳聲輸出的聲道電平差(CLDB)由如下方程給出<formula>formula see original document page 17</formula>(24)最后,與單聲輸入相比較的雙耳聲輸出的總(線性)增益&由如下 方程給出(25)對(duì)雙耳聲矩陣中的IPDb、 CLDb、 ICCB和&參數(shù)恢復(fù)所需的矩陣系 數(shù)簡單地由常規(guī)的參數(shù)立體聲解碼器獲得,用總增益&進(jìn)行擴(kuò)展<formula>formula see original document page 17</formula>其中<formula>formula see original document page 17</formula>本發(fā)明的空間解碼器單元進(jìn)一步的實(shí)施例可包含混響單元。已經(jīng)發(fā) 現(xiàn),當(dāng)產(chǎn)生雙耳聲聲音時(shí),加入混響可改善感知的距離。為此,圖7的 空間解碼器單元23被提供有立體聲混響單元237,該立體聲混響單元 237與空間合成單元232并聯(lián)連接。圖7的立體聲混響單元237接收QMF 變換域單個(gè)下混合信號(hào)S并輸出兩個(gè)混響信號(hào),其通過加法單元238而 被加入到變換域雙耳聲信號(hào)(圖6中的聲道Lb和Lr)。然后,組合后 的信號(hào)在輸出前由逆變換單元233進(jìn)行逆變換。在圖8的實(shí)施例中,立體聲混響單元237:f皮配置為產(chǎn)生時(shí)域中的混響并接收時(shí)域單個(gè)下混合信號(hào)s。立體聲混響單元237輸出時(shí)域混響信 號(hào),其由加法單元238加入到雙耳聲聲道lb和rb的時(shí)域信號(hào)。任何一 個(gè)實(shí)施例都提供了適當(dāng)?shù)幕祉憽1景l(fā)明另外提供了消費(fèi)設(shè)備,諸如手持消費(fèi)設(shè)備,以及包括如上定 義的空間解碼器單元或空間解碼器設(shè)備的音頻系統(tǒng)。手持消費(fèi)設(shè)備可以 由MP3播放器或相似設(shè)備構(gòu)成。消費(fèi)設(shè)備示意性地示于圖9。消費(fèi)設(shè)備 50被顯示為包括根據(jù)本發(fā)明的空間解碼器設(shè)備2 (參見圖6)。本發(fā)明基于如下見識(shí),即通過根據(jù)雙耳聲信息修改空間參數(shù),可大 大降低組合的空間解碼器設(shè)備和雙耳聲合成設(shè)備的計(jì)算復(fù)雜度。這就使 得空間解碼器設(shè)備能夠在同 一個(gè)信號(hào)處理操作中高效地執(zhí)行空間解碼 和感知轉(zhuǎn)移函數(shù)處理,而避免引入任何的人工噪聲。注意到,該文獻(xiàn)中使用的任何術(shù)語都不應(yīng)解釋為限制本發(fā)明的范 圍。實(shí)際上,詞語"包括"和"包含,,不意味著排除沒有特別指出的任 意元件。單個(gè)(電路)元件可以用多個(gè)(電路)元件或它們的等價(jià)物來 替代。本領(lǐng)域技術(shù)人員將會(huì)明白,本發(fā)明不限于上述實(shí)施例,可以在不脫 離如所附權(quán)利要求所定義發(fā)明范圍的情況下做出很多修改和添加。
權(quán)利要求
1.一種空間解碼器單元(23),其利用空間參數(shù)(sp)和一個(gè)或更多音頻輸入聲道(s;l,r)來產(chǎn)生一對(duì)雙耳聲輸出聲道(lb,rb),該設(shè)備包括-參數(shù)轉(zhuǎn)換單元(234),其利用參數(shù)化感知轉(zhuǎn)移函數(shù)(hp)將空間參數(shù)(sp)轉(zhuǎn)換為雙耳聲參數(shù)(bp);和-空間合成單元(232),其利用雙耳聲參數(shù)(bp)和音頻聲道(L,R)來合成一對(duì)雙耳聲聲道(Lb,Rb)。
2. 根據(jù)權(quán)利要求1的空間解碼器單元,其中參數(shù)轉(zhuǎn)換單元(234) 被配置為,為了確定雙耳聲參數(shù),在參數(shù)域中將音頻輸入聲道對(duì)雙耳聲 聲道將會(huì)做出的所有感知轉(zhuǎn)移函數(shù)貢獻(xiàn)進(jìn)行組合。
3. 根據(jù)權(quán)利要求1的空間解碼器單元,進(jìn)一步包括- 一個(gè)或更多變換單元(231 ),其將音頻輸入聲道(s;l,r)變換為 變換后的音頻輸入聲道(S;L,R),和——對(duì)逆變換單元(233 ),其將合成后的雙耳聲聲道(BL,BR)逆 變換為一對(duì)雙耳聲輸出聲道(lb,rb),其中空間合成單元(232 )被配 置為在變換域或子帶域,優(yōu)選地在QMF域中工作。
4. 根據(jù)權(quán)利要求1的空間解碼器單元,包括單個(gè)變換單元(231 ), 并進(jìn)一步包括去相關(guān)單元(239),該去相關(guān)單元(239)對(duì)單個(gè)變換單 元(231)所輸出的變換后的單個(gè)聲道(S)進(jìn)行去相關(guān)。
5. 根據(jù)權(quán)利要求4的空間解碼器單元,其中參數(shù)轉(zhuǎn)換單元(234) 被配置為處理聲道電平(CLD)、聲道相干性(ICC)和/或相位(IPD) 參數(shù)。
6. 根據(jù)權(quán)利要求1的空間解碼器單元,包括兩個(gè)變換單元(231 ), 其中參數(shù)轉(zhuǎn)換單元(234)被配置為利用只涉及三個(gè)聲道(l,r,c)的感知 轉(zhuǎn)移函數(shù)參數(shù),這三個(gè)聲道中的兩個(gè)(l,r)包括復(fù)合的前(lf,rf)和后(lr,rr)聲道的貢獻(xiàn)。
7. 根據(jù)權(quán)利要求6的空間解碼器單元,其中參數(shù)轉(zhuǎn)換單元被配置用 于處理聲道電平(例如CLD )、聲道相干性(例如ICC )、聲道預(yù)測(cè)(例 如CPC )和/或相位(例如IPD )參數(shù)。
8. 根據(jù)權(quán)利要求1的空間解碼器單元,進(jìn)一步包括被配置為工作在 時(shí)域中的立體聲混響單元(237)。
9. 根據(jù)權(quán)利要求1的空間解碼器單元,進(jìn)一步包括被配置為工作在變換域或子帶域,諸如QMF域中的立體聲混響單元(237)。
10. —種空間解碼器設(shè)備(2),其從輸入比特流(bs)產(chǎn)生一對(duì)雙 耳聲輸出聲道(lb,rb),該設(shè)備包括-多路分解器單元(21),其將輸入比特流多路分解為至少一個(gè)下 混合聲道和信號(hào)參數(shù)(sp),-下混合解碼器單元(22),其對(duì)至少一個(gè)下混合聲道進(jìn)行解碼,和-空間解碼器單元(23),其利用空間參數(shù)(sp)和至少一個(gè)下混 合聲道產(chǎn)生一對(duì)雙耳聲輸出聲道(lb,rb),其中空間解碼器單元(23) 包括-參數(shù)轉(zhuǎn)換單元(234),其利用參數(shù)化感知轉(zhuǎn)移函數(shù)(hp)將空間 參數(shù)(sp)轉(zhuǎn)換為雙耳聲參數(shù)(bp),和-空間合成單元(232 ),其利用雙耳聲參數(shù)(bp)和至少一個(gè)下混 合聲道,合成一對(duì)雙耳聲聲道(Lb,Rb)。
11. 根據(jù)權(quán)利要求10的設(shè)備,其中空間解碼器單元(23)包括混響 單元(237)。
12. —種音頻系統(tǒng),包括根據(jù)權(quán)利要求1的空間解碼器單元(23) 和/或根據(jù)權(quán)利要求10的空間解碼器設(shè)備(2)。
13. —種消費(fèi)設(shè)備,包括根據(jù)權(quán)利要求1的空間解碼器單元(23) 和/或根據(jù)權(quán)利要求10的空間解碼器設(shè)備(2 )。
14. 一種利用空間參數(shù)(sp)和一個(gè)或更多音頻輸入聲道(s;l,r)來 產(chǎn)生一對(duì)雙耳聲輸出聲道(lb,rb)的方法,該方法包括如下步驟-利用參數(shù)化感知轉(zhuǎn)移函數(shù)(hp),將空間參數(shù)(sp)轉(zhuǎn)換為雙耳 聲參數(shù)(bp);-利用雙耳聲參數(shù)(bp)和音頻聲道(M,N;L,R)合成一對(duì)雙耳聲 聲道(BL,BR )。
15. —種用于執(zhí)行根據(jù)權(quán)利要求14所述方法的計(jì)算機(jī)程序產(chǎn)品。
全文摘要
空間解碼器單元(23),其被配置為將一個(gè)或更多音頻聲道(s,l,r)變換為一對(duì)雙耳聲輸出聲道(lb,rb)。該設(shè)備包括參數(shù)轉(zhuǎn)換單元(234),其將空間參數(shù)(sp)轉(zhuǎn)換為包含雙耳聲信息的雙耳聲參數(shù)(bp)。該設(shè)備另外還包括空間合成單元(232),其利用雙耳聲參數(shù)(bp)而將音頻聲道(L,R)變換為一對(duì)雙耳聲信號(hào)(Lb,Rb)??臻g合成單元(232)優(yōu)選地工作在變換域,諸如QMF域中。
文檔編號(hào)H04S3/00GK101263742SQ200680033690
公開日2008年9月10日 申請(qǐng)日期2006年8月31日 優(yōu)先權(quán)日2005年9月13日
發(fā)明者D·J·布里巴特 申請(qǐng)人:皇家飛利浦電子股份有限公司