專利名稱:立體聲編碼方法及其裝置、立體聲解碼方法及其裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及編解碼技術(shù),具體涉及立體聲編碼方法及裝置、立體聲解碼方法及其裝置。
背景技術(shù):
在低碼率的聲音編解碼應(yīng)用中,為了盡量減少傳輸數(shù)據(jù)量,提高低碼率條件下的傳輸效率,可以只傳輸單聲道信號。但是,單聲道信號給聽者的感覺是從頭部內(nèi)產(chǎn)生聲音,如果收聽時間較長則會產(chǎn)生不舒服的感覺,因此希望能在低碼率條件下引入立體聲的效果。其中,低碼率是指單位時間內(nèi)傳輸較少的比特位。
目前的立體聲編解碼方案有純粹的后處理方案、和差立體聲方案和擴(kuò)展的寬帶自適應(yīng)多速率(AMR-WB+,Extended AdaptiveMulti-Rate-Wideband)立體聲編解碼方案。
其中,單純的后處理方案是在解碼器端向所接收的單聲道信號中添加一個延時信號,從而構(gòu)建出雙聲道立體聲信號,以建立立體聲感覺。這種方法的優(yōu)點是只需傳輸單聲道信號,占用碼率空間小。但是,后處理方案不能區(qū)分原始信號是單聲道信號還是立體聲信號,即使原始信號為單純的單聲道信號,也將被盲目的轉(zhuǎn)換成立體聲信號,此時,聽者會感覺到不舒服,而且這種情況經(jīng)常發(fā)生在語音信號的錄音中。此外,這種后處理的方案僅能建立類似立體聲的感覺,并不能準(zhǔn)確恢復(fù)出原始信號聲像的位置。
和差立體聲方案利用原始信號左右聲道的相關(guān)性,分別對左右聲道的和信號和差信號進(jìn)行波形編碼,其中,
為左聲道信號,
為右聲道信號,
為和信號,
為差信號;
和
都是具有長度和方向的向量。但是,和差立體聲方案需要傳輸和信號和差信號,因此在低碼率編碼應(yīng)用中需占用較多的碼率空間,因此傳輸效率不高。只有原始信號左右聲道極其相似的情況下,差信號所需比特數(shù)才有所減少,此時才能體現(xiàn)出高效率。而在很多情況下,例如左右聲道分別錄制不同的樂器,或者左右聲道聲像較偏、左右聲道信號能量相差很大的情況下,這種同時傳輸差信號的處理就無法在低碼率的條件下達(dá)到較好的效果。因此,和差立體聲方案在低碼率的條件下并不能達(dá)到較好的效果。
擴(kuò)展的寬帶自適應(yīng)多速率(AMR-WB+,Extended AdaptiveMulti-Rate-Wideband)立體聲編解碼方案,是目前較為有效的立體聲編碼技術(shù)。但是,該方案中的立體聲編碼技術(shù)采用時域濾波方法實現(xiàn),其分辨率不高,解碼后生成的立體聲聲音質(zhì)量也比較低,不能更好的接近原始立體聲。
因此,研究一種低碼率下對立體聲的高質(zhì)量編碼是亟待解決的問題。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供了一種立體聲編碼方法,能夠?qū)崿F(xiàn)低碼率下對立體聲的高質(zhì)量編碼。
該方法包括 A、編碼端提取表征立體聲中第一聲道頻譜與第二聲道頻譜的能量比的第一立體聲參數(shù),表征第一聲道和第二聲道的加權(quán)差頻譜與加權(quán)和頻譜能量比的第二立體聲參數(shù),并獲取第一聲道和第二聲道的加權(quán)和頻譜; 其中,所述加權(quán)的權(quán)值為所述第一立體聲參數(shù);所述第一聲道和第二聲道分別為所述立體聲中左聲道和右聲道中的一個和另一個; B、對所述加權(quán)和頻譜、第一立體聲參數(shù)和第二立體聲參數(shù)進(jìn)行編碼,向解碼端發(fā)送。
本發(fā)明還提供了一種立體聲解碼方法,能夠?qū)崿F(xiàn)低碼率下對立體聲的高質(zhì)量編碼。
該方法包括 A、解碼端接收立體聲第一聲道與第二聲道的加權(quán)和頻譜,以及第一立體聲參數(shù)和第二立體聲參數(shù);所述第一立體聲參數(shù)表征第一聲道頻譜和第二聲道頻譜的能量比,所述第二立體聲參數(shù)表征第一聲道和第二聲道的加權(quán)差頻譜與加權(quán)和頻譜的能量比; 其中,所述加權(quán)的權(quán)值為所述第一立體聲參數(shù);所述第一聲道和第二聲道分別為所述立體聲中左聲道和右聲道中的一個和另一個; B、利用加權(quán)和頻譜與采用第二立體聲參數(shù)進(jìn)行縮放的縮放后加權(quán)差頻譜具有等幅垂直的特點,計算加權(quán)差頻譜; C、根據(jù)所述加權(quán)和頻譜、加權(quán)差頻譜以及第一立體聲參數(shù),恢復(fù)第一聲道頻譜和第二聲道頻譜。
本發(fā)明還提供了一種立體聲編碼裝置,能夠?qū)崿F(xiàn)低碼率下對立體聲的高質(zhì)量編碼。
該裝置包括第一參數(shù)提取單元、第二參數(shù)提取單元、加權(quán)單元和發(fā)送單元; 所述第一參數(shù)提取單元,用于提取表征立體聲第一聲道頻譜和第二聲道頻譜的能量比的第一立體聲參數(shù);所述第一聲道和第二聲道分別為所述立體聲中左聲道和右聲道中的一個和另一個; 所述加權(quán)單元,用于獲取每個頻點上第一聲道和第二聲道的加權(quán)和頻譜,所述加權(quán)的權(quán)值為所述第一立體聲參數(shù); 所述第二參數(shù)提取單元,用于提取表征第一聲道和第二聲道加權(quán)差頻譜與所述加權(quán)和頻譜之間能量比的第二立體聲參數(shù); 所述發(fā)送單元,用于向解碼端發(fā)送從第一參數(shù)提取單元獲取的第一立體聲參數(shù)、從第二參數(shù)提取單元獲取的第二立體聲參數(shù)和從加權(quán)單元獲取的加權(quán)和頻譜。
本發(fā)明還提供了一種立體聲解碼裝置,能夠?qū)崿F(xiàn)低碼率下對立體聲的高質(zhì)量編碼。
該裝置包括接收單元、中間參數(shù)求取單元和恢復(fù)單元; 所述接收單元,用于接收立體聲第一聲道與第二聲道的加權(quán)和頻譜,以及第一立體聲參數(shù)和第二立體聲參數(shù);所述第一立體聲參數(shù)表征第一聲道頻譜和第二聲道頻譜之間的能量比,所述第二立體聲參數(shù)表征第一聲道和第二聲道的加權(quán)差頻譜和加權(quán)和頻譜的能量比;所述加權(quán)的權(quán)值為第一立體聲參數(shù); 其中,所述加權(quán)的權(quán)值為第一立體聲參數(shù);所述第一聲道和第二聲道分別為所述立體聲中左聲道和右聲道中的一個和另一個; 所述中間參數(shù)求取單元,用于利用加權(quán)和頻譜與采用第二立體聲參數(shù)進(jìn)行縮放的縮放后加權(quán)差頻譜具有等幅垂直的特點,計算加權(quán)差頻譜; 所述恢復(fù)單元,用于根據(jù)所述加權(quán)和頻譜、加權(quán)差頻譜以及第一立體聲參數(shù),恢復(fù)第一聲道頻譜和第二聲道頻譜。
根據(jù)以上技術(shù)方案可見,本發(fā)明采用頻域編碼方法實現(xiàn),其分辨率較高,解碼后生成的立體聲聲音質(zhì)量也相對較高,能夠較好的接近原始立體聲,提高了立體聲編解碼質(zhì)量。而且,經(jīng)編碼,只需傳輸加權(quán)和聲道頻譜以及兩個立體聲參數(shù),有效地提高了低碼率條件下的傳輸效率。
在解碼端,利用左右聲道的加權(quán)和以及加權(quán)差近似垂直這一隱含參數(shù),得到加權(quán)差,并采用加權(quán)和、加權(quán)差以及作為加權(quán)權(quán)值的第一立體聲參數(shù)恢復(fù)得到左右聲道頻譜,整個恢復(fù)過程沒有進(jìn)行正弦、余弦等角度計算,因此大大降低了解碼端的解碼復(fù)雜度,從而減小了解碼時間。
較佳地,當(dāng)根據(jù)最小均方差準(zhǔn)則對加權(quán)和以及兩個立體聲參數(shù)的求取進(jìn)行優(yōu)化后,令加權(quán)和以及兩個立體聲參數(shù)的取值能夠使得左右聲道均方差之和最小,則,恢復(fù)出的立體聲解碼信號更加接近原始信號,進(jìn)一步提高了立體聲編解碼質(zhì)量。
圖1為本發(fā)明實施例中立體聲編碼方法的流程圖。
圖2為本發(fā)明實施例中立體聲編碼模式模型圖。
圖3為本發(fā)明實施例中立體聲解碼方法的流程圖。
圖4為本發(fā)明實施例中立體聲編碼裝置的結(jié)構(gòu)示意圖。
圖5為本發(fā)明實施例中立體聲解碼裝置的結(jié)構(gòu)示意圖。
具體實施例方式 本發(fā)明實施例所提供的立體聲編解碼方案屬于參數(shù)立體聲方案,其基本思想為編碼端提取表征立體聲信號特征的立體聲參數(shù),只傳輸左右聲道的加權(quán)和頻譜以及所提取的參數(shù),從而減少所傳輸數(shù)據(jù)數(shù)量,以達(dá)到低碼率條件下較好的傳輸效率。所提取的立體聲參數(shù)分別是表征左右聲道能量比的第一立體聲參數(shù),和表征左右聲道加權(quán)差和加權(quán)和能量比的第二立體聲參數(shù)。
加權(quán)和頻譜的求取方式是將左右聲道中的第二聲道頻譜進(jìn)行長度縮放,使得縮放后第二聲道頻譜與未縮放的第一聲道頻譜能量相等,然后將未縮放第一聲道頻譜和縮放后第二聲道頻譜進(jìn)行向量相加,得到的加權(quán)和頻譜。
加權(quán)差頻譜是將上述未縮放第一聲道頻譜和縮放后第二聲道頻譜相減得到的。
由于未縮放第一聲道和縮放后的第二聲道能量相等,因此加權(quán)和頻譜與加權(quán)差頻譜之間的角度關(guān)系是垂直的。那么當(dāng)通過第二立體聲參數(shù)對加權(quán)差進(jìn)行縮放,就可以得到縮放后的加權(quán)差頻譜,該縮放后的加權(quán)差頻譜與加權(quán)和頻譜垂直且等長。
那么,在解碼端,當(dāng)接收到加權(quán)和頻譜時,能夠獲取其等幅垂直的縮放后加權(quán)差頻譜,然后利用第二立體聲參數(shù)進(jìn)行縮放,得到原始的加權(quán)差頻譜。然后利用加權(quán)和頻譜以及加權(quán)差頻譜,得到左聲道和縮放后的右聲道,最后利用第一立體聲參數(shù)對縮放后的右聲道進(jìn)行縮放,從而獲得原始右聲道頻譜。
從以上所述可以看到,本發(fā)明解碼端恢復(fù)立體聲所利用的數(shù)據(jù)不僅包括所傳輸?shù)募訖?quán)和頻譜以及兩個立體聲參數(shù),還包括加權(quán)和頻譜與縮放后的加權(quán)差頻譜具有等幅垂直這一特點,實際上這一特點是解碼時所利用的必不可少的隱性參數(shù)。該隱性參數(shù)不必在碼流中傳輸,減少了傳輸碼流的比特數(shù),提高了低碼流下的傳輸效率,而且,利用該隱性參數(shù)只需將加權(quán)和頻譜進(jìn)行等幅垂直的變換處理,而頻譜信號是由實部和虛部組成的,所謂等幅垂直處理就是對加權(quán)和的虛部取負(fù),然后將實部數(shù)值和取負(fù)后的虛部數(shù)值進(jìn)行實虛部的調(diào)換,得到縮放后的加權(quán)差頻譜。然后再利用第一立體聲參數(shù)和第二立體聲參數(shù)進(jìn)行乘除運算,得到第一聲道頻譜和第二聲道頻譜。整個計算過程無需任何的角度計算,降低了解碼復(fù)雜度,從而減少了解碼端的解碼時間。
下面,結(jié)合附圖并舉實施例,對本發(fā)明進(jìn)行詳細(xì)描述。
圖1為本發(fā)明實施例中立體聲編碼方法的流程圖。該實施例以第一聲道為左聲道,第二聲道為右聲道為例,進(jìn)行描述。如圖1所示,該方法包括以下步驟 步驟100分別對立體聲的左聲道信號和右聲道信道進(jìn)行離散傅立葉變換(DFT)變換,得到DFT變換域上的左聲道頻譜和右聲道頻譜。
步驟101分別將立體聲的左聲道頻譜和右聲道頻譜劃分為K個子頻帶,K為正整數(shù)。
在DFT變換域上,各子頻帶內(nèi)的左聲道頻譜
和右聲道頻譜
都是頻譜向量,具有實部和虛部。子頻帶內(nèi)的
和
的表達(dá)式為 其中,xl和yl分別為左聲道頻譜的實部和虛部,xr和yr分別為右聲道頻譜的實部和虛部,k為子頻帶標(biāo)號,i為子頻帶內(nèi)的頻率點標(biāo)號。以下描述中涉及到
就表示
表示
步驟102分別在每個子頻帶k內(nèi),提取各子頻帶中表征左聲道頻譜和右聲道頻譜能量比的第一立體聲參數(shù)
k=1、2......K。
本步驟中,第一立體聲參數(shù)為左聲道頻譜的能量與右聲道頻譜的能量之間的比值,其計算方法可以采用以下公式 其中,EL(k)和ER(k)分別為子頻帶k的左聲道能量和右聲道能量。子頻帶k內(nèi)的聲道能量是對該子頻帶聲道向量取模的平方。計算聲道能量的方式為已知技術(shù)手段,這里就不再詳述。
步驟103采用第一立體聲參數(shù)
作為右聲道頻譜的縮放比,計算縮放后右聲道頻譜
,使得縮放后右聲道頻譜
與未縮放的左聲道頻譜
的能量相等。
本步驟中,縮放后的右聲道頻譜
采用如下公式計算 參見圖2示出的本發(fā)明實施例中立體聲編碼模式模型圖,圖中的向量
和
分別表示左聲道頻譜和右聲道頻譜,采用
對
進(jìn)行縮放后,得到與
方向相同,與
長度相同的
。從物理意義上講,圖2中的
與
能量相等。
步驟104對于子頻帶k內(nèi)的每個頻率點i,計算該頻率點的加權(quán)和頻譜
和加權(quán)差頻譜
。其中,所謂加權(quán)是指對右聲道
加權(quán),加權(quán)權(quán)值為
或者說,本步驟是求取
和
的和頻譜與差頻譜。
需要說明的是,每個頻率點i都具有其對應(yīng)的
和
,但是,處于同一子頻帶的頻率點共用相同的
和gd(k)。對
和
這些向量進(jìn)行運算時,是對每一個頻率點i分別進(jìn)行運算。以下就不再重復(fù)說明。
本步驟中,加權(quán)和頻譜
以及加權(quán)差頻譜
的計算方法可以采用如下公式 從以上公式(5)和(6)可以看出,解碼端可以根據(jù)
gr(k)和
恢復(fù)出
和
那么如何得到
就是一個關(guān)鍵問題。
如圖2所示,經(jīng)步驟103的縮放后,左聲道頻譜
的能量與縮放后右聲道頻譜
的能量近似相等,根據(jù)
和
獲得的加權(quán)和頻譜
和加權(quán)差頻譜
也近似垂直,但是長度并不相等。那么如何在解碼端根據(jù)
以及垂直關(guān)系得到
呢?從圖2中可以看到,如果根據(jù)
計算其等幅垂直的正交頻譜
,那么將
乘以一個長度系數(shù),就可以得到
以下步驟105就是計算這個長度系數(shù),即第二立體聲參數(shù)gd(k)的具體方式。
步驟105產(chǎn)生與加權(quán)和頻譜
等幅垂直的正交頻譜
,即縮放后加權(quán)差頻譜,提取表征加權(quán)差頻譜
和正交頻譜
之間能量比的第二立體聲參數(shù)gd(k)。
較佳地,在本步驟中,由于
與
等幅,因此二者能量相等。而且考慮到在編碼端求取出來的正交頻譜
并實質(zhì)上的作用,因此本步驟可以直接求取加權(quán)差頻譜
和加權(quán)和頻譜
的能量比,作為gd(k)。gd(k)的計算方法可以采用以下公式 從公式(7)中可以看出,該公式根據(jù)
與
能量相等,即ED=EM,得到,然后將公式(6)代入該表達(dá)式,得到公式(7)的計算聲道能量的方式為已知技術(shù)手段,這里就不再詳述。
本步驟中得到的gd(k)反映了
與
的長度比,因此,解碼端就可以將gd(k)作為正交頻譜
的縮放比從而計算
,計算
的公式為 步驟106對加權(quán)和頻譜
進(jìn)行波形編碼,對
和gd(k)進(jìn)行量化編碼,將編碼結(jié)果輸出到發(fā)給解碼端的比特流中。當(dāng)然,也可以直接傳輸gr(k)。
至此,本流程結(jié)束。
需要說明的是,以上求取
gr(k)和gd(k)都是在各子頻帶內(nèi)完成的。每個子頻帶都具有對應(yīng)的
gr(k)和gd(k)。在恢復(fù)時,也是采用各子頻帶對應(yīng)的
gr(k)和gd(k)恢復(fù)得到各子頻帶的左右聲道頻譜,經(jīng)逆DFT變換后,求出合成立體聲信號。
以下圖3示出的流程就是本發(fā)明實施例中立體聲解碼方法的流程圖。如圖3所示,該方法包括以下步驟 步驟301將從碼流中獲取的數(shù)據(jù)進(jìn)行逆量化解碼后,得到加權(quán)和頻譜
以及每個子頻帶的
和gd(k)。當(dāng)然如果編碼端傳輸?shù)氖莋r(k),解碼端只需要對其進(jìn)行倒數(shù)運算,即可得到第一立體聲參數(shù)
傳輸gr(k)還是
是由編碼端和解碼端預(yù)先約定的。
步驟302利用加權(quán)和頻譜
與采用gd(k)作為縮放比的縮放后加權(quán)差頻譜
之間具有等幅垂直這一特點,計算加權(quán)差頻譜
本步驟中,計算
的過程具體包括以下步驟 a1、產(chǎn)生與加權(quán)和頻譜
等幅垂直的正交頻譜
及采用gd(k)作為縮放比的縮放后加權(quán)差頻譜; 若, 則, 其中,xm和ym分別為加權(quán)和頻譜的實部和虛部; b1、根據(jù)公式(8),利用得到的gd(k)將正交頻譜
進(jìn)行縮放,得到加權(quán)差頻譜
步驟303根據(jù)加權(quán)和頻譜
加權(quán)差頻譜
以及作為加權(quán)權(quán)值的第一立體聲參數(shù)gr(k),恢復(fù)左聲道頻譜
和右聲道頻譜
本步驟中,具體恢復(fù)過程包括以下步驟 a2、根據(jù)公式(6)中將
和
相加,得到左聲道頻譜
b2、根據(jù)公式(5)中利用
和
得到縮放后的右聲道頻譜
c2、根據(jù)公式(4)中利用gr(k)對
進(jìn)行縮放,得到原始右聲道頻譜
在實際恢復(fù)過程中,步驟302和303可以簡化為如下兩個步驟 步驟一、根據(jù)公式(9)和(10)產(chǎn)生與加權(quán)和頻譜
等幅垂直的正交頻譜
步驟二、利用如下公式(11)和(12)獲得
和
經(jīng)過以上步驟的執(zhí)行,可以得到各子頻帶的
和
和
就合成了立體聲信號的頻譜。
步驟304對立體聲信號的頻譜進(jìn)行逆DFT變換,得到合成的立體聲信號。
至此,本流程結(jié)束。
從以上實施例中的編碼方法和解碼方法來看,本發(fā)明采用頻域編碼方法實現(xiàn)立體聲的編解碼,其分辨率較高,解碼后生成的立體聲聲音質(zhì)量也相對較高,能夠較好的接近原始立體聲,提高了立體聲編解碼質(zhì)量。而且,經(jīng)本發(fā)明實施例中的編碼,只需要傳輸加權(quán)和聲道頻譜以及兩個立體聲參數(shù),有效地提高了低碼率條件下的傳輸效率。
在解碼端,利用左右聲道的加權(quán)和以及加權(quán)差近似垂直這一隱含參數(shù),得到加權(quán)差,并采用加權(quán)和、加權(quán)差以及作為加權(quán)參數(shù)的第一立體聲參數(shù)恢復(fù)得到左右聲道頻譜,整個恢復(fù)過程沒有進(jìn)行正弦、余弦等角度計算,因此大大降低了解碼端的解碼復(fù)雜度,從而減小了解碼時間。
為了能夠進(jìn)一步提高立體聲編解碼質(zhì)量,令恢復(fù)的立體聲解碼信號更加接近原始信號,減少恢復(fù)信號與原始信號之間的誤差,本發(fā)明在上述實施例的基礎(chǔ)上,根據(jù)最小均方差準(zhǔn)則對
gr(k)和gd(k)的求取進(jìn)行優(yōu)化,令優(yōu)化后的
gr(k)和gd(k)的取值能夠使得左右聲道均方差之和最小。
優(yōu)選地,為了體現(xiàn)誤差在左右聲道的分配程度,在計算左右聲道均方差之和時,進(jìn)行加權(quán)處理,使得
gr(k)和gd(k)的取值能夠令左右聲道均方差的加權(quán)和最小。
本發(fā)明實施例仍以第一聲道為左聲道,第二聲道為右聲道為例,對
gr(k)和gd(k)的優(yōu)化過程進(jìn)行詳細(xì)描述,其優(yōu)化流程如下 首先,建立求取子頻帶k內(nèi)左右聲道均方差加權(quán)和的表達(dá)式 其中,i∈band(k)是指i取子頻帶k內(nèi)的頻率點;εl(k)為左聲道均方差之和,εr(k)右聲道均方差之和,
為解碼端接收到的左聲道頻譜,
為解碼端編碼前的原始左聲道頻譜,
為解碼端接收到的右聲道頻譜,
為解碼端編碼前的原始右聲道頻譜;g(k)為重要度因子,反映了編碼誤差在左右聲道的分配程度。在實際應(yīng)用中,g(k)可以為常數(shù)1,也可以為左右聲道信號的能量比。當(dāng)g(k)為能量比時,右聲道能量越弱,g(k)的值越大;右聲道能量越強,g(k)的值越小。
表達(dá)式(13)中的
和
為解碼端接收到的左右聲道頻譜,因此將解碼端用于恢復(fù)左右聲道頻譜的公式(11)和(12)代入表達(dá)式(13),并采用表達(dá)式表示表達(dá)式(13)中
和
得到如下變形后的左右聲道均方差加權(quán)和的表達(dá)式(14) (14) 其中,xl、yl、xr、yr、xm和ym的意義已經(jīng)在前面進(jìn)行了注釋。
第二步,為了使ε(k)的取值最小,對于每一個頻率點i都要滿足加權(quán)均方差ε(k)最小,因此對于加權(quán)和頻譜
每個頻率點來說都需要滿足和 那么,本步驟中分別對xm和ym求偏導(dǎo),得到 i∈band(k) (15) 通過表達(dá)式(15)求得的xm和ym就是令ε(k)取值最小的xm和ym。
第三步,將表達(dá)式(15)代入公式(14),得到
信號取值最優(yōu)后的ε(k)的表達(dá)式 其中, 第四步,求優(yōu)化后的gd(k)。
對表達(dá)式(16)求gd(k)的偏導(dǎo),由可以得到 最后,求優(yōu)化后的gr(k)。
對表達(dá)式(16)求gr(k)的偏導(dǎo),由可以得到 其中, 那么,編碼端進(jìn)行編碼的步驟就可以為分別采用公式(17)和(18)計算gr(k)和gd(k),再將得到的gr(k)和gd(k),以及重要度因子g(k)代入表達(dá)式(15),求出每個頻率點i上的加權(quán)和頻譜
然后將求得的數(shù)據(jù)
gr(k)和gd(k)進(jìn)行編碼并發(fā)給解碼端。
無論編碼端采用圖1的流程求取
和gd(k),或是采用優(yōu)化后的表達(dá)式(15)、(17)和(18)計算
gr(k)和gd(k),在解碼端,都是采用圖3示出的流程恢復(fù)
和
如果不考慮編碼誤差在左右聲道的分配程度,將公式表達(dá)式(15)、(17)和(18)中的g(k)取1即可。
需要說明的是,以上實施例都是以第一聲道為左聲道,第二聲道為右聲道為例進(jìn)行描述??梢岳斫?,如果第一聲道為右聲道,第二聲道為左聲道,仍可以根據(jù)本發(fā)明原理得到一套編碼公式和解碼公式。編解碼原理本質(zhì)上是一樣的,只是推導(dǎo)出來的公式可能在形式上有所區(qū)別。
而且,以上實施例只對DFT變換后的左右聲道頻譜進(jìn)行子帶劃分和立體聲參數(shù)的計算,實際上該方法還適用于進(jìn)行其它類型時頻轉(zhuǎn)換后的左右聲道頻譜。此外,還可以對立體聲信號的左、右聲道分別進(jìn)行子帶分解,得到左、右聲道的低頻子帶域信號,然后對左、右聲道的低頻子帶域信號進(jìn)行預(yù)測分析和時頻變換,以獲取左、右聲道的低頻子帶域激勵譜,此時將左、右聲道的激勵譜作為左、右聲道頻譜,并采用本發(fā)明實施例的立體聲編解碼方法進(jìn)行編解碼處理。
此外,以上實施例中劃分子帶的原因是各個頻帶的特征不同,編碼階段得到的立體聲參數(shù)也不同,因為為了在解碼端更好的恢復(fù)立體聲,在編碼時進(jìn)行子帶劃分,并針對每個子帶進(jìn)行加權(quán)和以及立體聲參數(shù)的求取。
為了實現(xiàn)以上立體聲編解碼方法,本發(fā)明還提供了立體聲編碼裝置和解碼裝置。
圖4為本發(fā)明實施例中立體聲編碼裝置的結(jié)構(gòu)示意圖。如圖4所示,該立體聲編碼裝置400包括子帶劃分單元410、第一參數(shù)提取單元420、第二參數(shù)提取單元430、加權(quán)單元440和發(fā)送單元450; 所述子帶劃分單元410,用于分別將立體聲的第一聲道和第二聲道頻譜劃分為K個子頻帶,K為正整數(shù);其中,第一聲道和第二聲道為所述立體聲中左聲道和右聲道中的一個和另一個;本實施例以第一聲道為左聲道,第二聲道為右聲道為例。當(dāng)然,為了獲取頻譜,本單元還需要在子帶劃分之前對立體聲的左聲道信號和右聲道信道進(jìn)行DFT,得到DFT變換域上的左聲道頻譜和右聲道頻譜,然后再進(jìn)行子帶劃分處理。
第一參數(shù)提取單元420,用于在每個子頻帶k內(nèi),分別提取表征左聲道頻譜和右聲道頻譜能量比的第一立體聲參數(shù)
k=1、2...K。
該第一參數(shù)提取單元420在提取
時,可以直接將第一聲道頻譜的能量與第二聲道頻譜的能量之間的比值作為
的值;或者,利用優(yōu)化過的gr(k)表達(dá)式(18)計算gr(k)的值,使得
的值不僅表征第一聲道和第二聲道的能量比,而且能夠令左右聲道的均方差加權(quán)和最小。
加權(quán)單元440,用于采用接收的
作為權(quán)值,獲取左右聲道的加權(quán)和頻譜
。在計算
時,為了獲得最優(yōu)的
,可以利用優(yōu)化過的
表達(dá)式(15)計算各頻點i的
。在計算過程中需要代入gd(k)和gr(k)的值,這些值可以從第一參數(shù)提取單元420和第二參數(shù)提取單元430中獲取。
第二參數(shù)提取單元430,用于在每個子頻帶k內(nèi),分別提取表征
和
之間能量比的第二立體聲參數(shù)gd(k)?;蛘?,利用優(yōu)化過的gd(k)表達(dá)式(17)計算gd(k)的值,使得gd(k)的值不僅表征左右聲道加權(quán)差和加權(quán)和的能量比,而且能夠令左右聲道的均方差加權(quán)和最小。
發(fā)送單元450,用于向解碼端發(fā)送從加權(quán)單元440獲取的
、從第一參數(shù)提取單元420獲取的
或gr(k),以及從第二參數(shù)提取單元430獲取的gd(k)。
圖5為本發(fā)明實施例中立體聲解碼裝置的結(jié)構(gòu)示意圖。如圖5所示,該裝置500包括接收單元510、中間參數(shù)求取單元520以及恢復(fù)單元530。
其中,接收單元510,用于接收左右聲道的加權(quán)和頻譜
,以及
和gd(k);其中,
表征左右聲道頻譜的能量比,gd(k)表征左右聲道的加權(quán)差頻譜和加權(quán)和頻譜的能量比;其中,加權(quán)差以及加權(quán)和的加權(quán)權(quán)值為
中間參數(shù)求取單元520,用于利用加權(quán)和頻譜
與采用gd(k)作為縮放比的縮放后加權(quán)差頻譜具有等幅垂直的特點,計算加權(quán)差頻譜
。該中間參數(shù)求取單元520具體包括正交模塊和縮放模塊,其中正交模塊產(chǎn)生與
等幅垂直的正交頻譜
,作為縮放后加權(quán)差頻譜;縮放模塊根據(jù)
與
方向相同且長度之比為gd(k)的特點,利用gd(k)將
進(jìn)行縮放,得到
恢復(fù)單元530,用于根據(jù)所接收的
以及從中間參數(shù)求取單元520獲得的
恢復(fù)左、右聲道頻譜。該恢復(fù)單元530具體包括左聲道恢復(fù)模塊和右聲道恢復(fù)模塊,其中左聲道恢復(fù)模塊,將
與
相加,得到;
右聲道恢復(fù)模塊,利用
和
得到縮放后右聲道頻譜,即
,然后采用
對
進(jìn)行縮放,得到
在實際中,中間參數(shù)求取單元520可以只求取正交頻譜
,然后由縮放模塊將
和gd(k)輸出給恢復(fù)單元530即可?;謴?fù)單元530中的左聲道恢復(fù)模塊存儲公式(11),即右聲道恢復(fù)模塊存儲公式(12),即那么左聲道恢復(fù)模塊和右聲道恢復(fù)模塊只需要獲取相應(yīng)參數(shù)并代入公式計算就可以了。
由以上所述可以看出,本發(fā)明所提供的立體聲編解碼方法,能實現(xiàn)低碼率下對立體聲的高質(zhì)量編碼。解碼過程也無需任何的角度計算,降低了解碼復(fù)雜度,從而減少了解碼端的解碼時間。當(dāng)采用優(yōu)化公式進(jìn)行編碼運算時,還能夠進(jìn)一步提高編解碼質(zhì)量。
綜上所述,以上僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種立體聲編碼方法,其特征在于,該方法包括
A、編碼端提取表征立體聲中第一聲道頻譜與第二聲道頻譜的能量比的第一立體聲參數(shù),表征第一聲道和第二聲道的加權(quán)差頻譜與加權(quán)和頻譜能量比的第二立體聲參數(shù),并獲取第一聲道和第二聲道的加權(quán)和頻譜;
其中,所述加權(quán)的權(quán)值為所述第一立體聲參數(shù);所述第一聲道和第二聲道分別為所述立體聲中左聲道和右聲道中的一個和另一個;
B、對所述加權(quán)和頻譜、第一立體聲參數(shù)和第二立體聲參數(shù)進(jìn)行編碼,向解碼端發(fā)送。
2、如權(quán)利要求1所述的方法,其特征在于,步驟A之前進(jìn)一步包括
A0、分別將立體聲的第一聲道頻譜和第二聲道頻譜劃分為K個子頻帶,K為正整數(shù);
所述步驟A為分別提取各子頻帶k內(nèi)的第一立體聲參數(shù)和第二立體聲參數(shù),以及以第一立體聲參數(shù)為加權(quán)權(quán)值的加權(quán)和頻譜;k=1、2...K;
所述步驟B為對所述各子頻帶的加權(quán)和頻譜、第一立體聲參數(shù)和第二立體聲參數(shù)進(jìn)行編碼,向解碼端發(fā)送。
3、如權(quán)利要求1或2所述的方法,其特征在于,所述第一立體聲參數(shù)為第一聲道頻譜的能量值與第二聲道頻譜的能量值之間的比值;
所述第二立體聲參數(shù)為加權(quán)差頻譜的能量值與加權(quán)和頻譜的能量值之間的比值。
4、如權(quán)利要求2所述的方法,其特征在于,所述第一立體聲參數(shù)、第二立體聲參數(shù)和加權(quán)和頻譜都是根據(jù)令第一聲道的均方差與第二聲道的均方差的加權(quán)和最小準(zhǔn)則獲取的。
5、如權(quán)利要求4所述的方法,其特征在于,所述第一聲道為左聲道,所述第二聲道為右聲道;
所述第二立體聲參數(shù)gd(k)采用公式計算;
所述第一立體聲參數(shù)
利用如下公式計算
所述加權(quán)和頻譜為其實部xm和虛部ym采用如下公式計算
其中,
g(k)為計算均方差加權(quán)和的權(quán)值;xl和yl分別為左聲道頻譜的實部和虛部,xr和yr分別為右聲道頻譜的實部和虛部,i為子頻帶k內(nèi)的頻率點標(biāo)號,i∈band(k)表示i取子頻帶k內(nèi)的頻率點。
6、如權(quán)利要求5所述的方法,其特征在于,所述g(k)取1。
7、如權(quán)利要求5所述的方法,其特征在于,所述g(k)為表征編碼誤差在第一聲道和第二聲道分配程度的重要度因子。
8、如權(quán)利要求7所述的方法,其特征在于,所述重要度因子為第一聲道頻譜與第二聲道頻譜的能量比。
9、一種立體聲解碼方法,其特征在于,該方法包括
A、解碼端接收立體聲第一聲道與第二聲道的加權(quán)和頻譜,以及第一立體聲參數(shù)和第二立體聲參數(shù);所述第一立體聲參數(shù)表征第一聲道頻譜和第二聲道頻譜的能量比,所述第二立體聲參數(shù)表征第一聲道和第二聲道的加權(quán)差頻譜與加權(quán)和頻譜的能量比;
其中,所述加權(quán)的權(quán)值為所述第一立體聲參數(shù);所述第一聲道和第二聲道分別為所述立體聲中左聲道和右聲道中的一個和另一個;
B、利用加權(quán)和頻譜與采用第二立體聲參數(shù)進(jìn)行縮放的縮放后加權(quán)差頻譜具有等幅垂直的特點,計算加權(quán)差頻譜;
C、根據(jù)所述加權(quán)和頻譜、加權(quán)差頻譜以及第一立體聲參數(shù),恢復(fù)第一聲道頻譜和第二聲道頻譜。
10、如權(quán)利要求9所述的方法,其特征在于,所述步驟A接收的所述加權(quán)和頻譜、第一立體聲參數(shù)和第二立體聲參數(shù)是各子頻帶的加權(quán)和頻譜、第一立體聲參數(shù)和第二立體聲參數(shù);
所述步驟B為利用各子頻帶對應(yīng)的加權(quán)和頻譜與采用第二立體聲參數(shù)進(jìn)行縮放的縮放后加權(quán)差頻譜具有等幅垂直的特點,分別計算各子頻帶的加權(quán)差頻譜;
所述步驟C為根據(jù)各子頻帶對應(yīng)的所述加權(quán)和頻譜、加權(quán)差頻譜以及第一立體聲參數(shù),恢復(fù)各子頻帶的第一聲道頻譜和第二聲道頻譜。
11、如權(quán)利要求9所述的方法,其特征在于,所述步驟B包括
b1、產(chǎn)生與所述加權(quán)和頻譜等幅垂直的正交頻譜,作為縮放后加權(quán)差頻譜;
b2、利用所述第二立體聲參數(shù)對所述縮放后加權(quán)差頻譜進(jìn)行縮放,得到加權(quán)差頻譜。
12、如權(quán)利要求9所述的方法,其特征在于,所述步驟C包括
c1、將所述加權(quán)和頻譜與所述加權(quán)差頻譜相加,得到左聲道頻譜;
c2、根據(jù)加權(quán)和頻譜和左聲道頻譜,得到縮放后右聲道頻譜;
c3、利用所述第一立體聲參數(shù)對得到的縮放后右聲道頻譜進(jìn)行縮放,得到右聲道頻譜。
13、一種立體聲編碼裝置,其特征在于,該裝置包括第一參數(shù)提取單元、第二參數(shù)提取單元、加權(quán)單元和發(fā)送單元;
所述第一參數(shù)提取單元,用于提取表征立體聲第一聲道頻譜和第二聲道頻譜的能量比的第一立體聲參數(shù);所述第一聲道和第二聲道分別為所述立體聲中左聲道和右聲道中的一個和另一個;
所述加權(quán)單元,用于獲取每個頻點上第一聲道和第二聲道的加權(quán)和頻譜,所述加權(quán)的權(quán)值為所述第一立體聲參數(shù);
所述第二參數(shù)提取單元,用于提取表征第一聲道和第二聲道加權(quán)差頻譜與所述加權(quán)和頻譜之間能量比的第二立體聲參數(shù);
所述發(fā)送單元,用于向解碼端發(fā)送從第一參數(shù)提取單元獲取的第一立體聲參數(shù)、從第二參數(shù)提取單元獲取的第二立體聲參數(shù)和從加權(quán)單元獲取的加權(quán)和頻譜。
14、如權(quán)利要求13所述的編碼裝置,其特征在于,該編碼裝置進(jìn)一步包括子帶劃分單元,用于分別將立體聲的第一聲道頻譜和第二聲道頻譜劃分為K個子頻帶,K為正整數(shù);
所述第一參數(shù)提取單元、第二參數(shù)提取單元和加權(quán)單元分別對各子頻帶執(zhí)行自身處理功能。
15、如權(quán)利要求13所述的編碼裝置,其特征在于,所述第一參數(shù)提取單元將所述第一聲道頻譜的能量值與所述第二聲道頻譜的能量值之間的比值作為第一立體聲參數(shù);
所述第二參數(shù)提取單元將所述加權(quán)差頻譜的能量值與所述加權(quán)和頻譜的能量值之間的比值作為第二立體聲參數(shù)。
16、如權(quán)利要求13所述的編碼裝置,其特征在于,所述第一參數(shù)提取單元進(jìn)一步用于,根據(jù)令第一聲道的均方差與第二聲道的均方差的加權(quán)和最小準(zhǔn)則獲取所述第一立體聲參數(shù);
所述第二參數(shù)提取單元進(jìn)一步用于,根據(jù)令第一聲道的均方差與第二聲道的均方差加權(quán)和最小的準(zhǔn)則獲取所述第二立體聲參數(shù);
所述加權(quán)單元進(jìn)一步用于,根據(jù)第一聲道的均方差與第二聲道的均方差加權(quán)和最小準(zhǔn)則獲取所述加權(quán)和頻譜。
17、一種立體聲解碼裝置,其特征在于,該裝置包括接收單元、中間參數(shù)求取單元和恢復(fù)單元;
所述接收單元,用于接收立體聲第一聲道與第二聲道的加權(quán)和頻譜,以及第一立體聲參數(shù)和第二立體聲參數(shù);所述第一立體聲參數(shù)表征第一聲道頻譜和第二聲道頻譜之間的能量比,所述第二立體聲參數(shù)表征第一聲道和第二聲道的加權(quán)差頻譜和加權(quán)和頻譜的能量比;所述加權(quán)的權(quán)值為第一立體聲參數(shù);
其中,所述加權(quán)的權(quán)值為第一立體聲參數(shù);所述第一聲道和第二聲道分別為所述立體聲中左聲道和右聲道中的一個和另一個;
所述中間參數(shù)求取單元,用于利用加權(quán)和頻譜與采用第二立體聲參數(shù)進(jìn)行縮放的縮放后加權(quán)差頻譜具有等幅垂直的特點,計算加權(quán)差頻譜;
所述恢復(fù)單元,用于根據(jù)所述加權(quán)和頻譜、加權(quán)差頻譜以及第一立體聲參數(shù),恢復(fù)第一聲道頻譜和第二聲道頻譜。
18,如權(quán)利要求17所述的解碼裝置,其特征在于,所述接收單元接收的所述加權(quán)和頻譜、第一立體聲參數(shù)和第二立體聲參數(shù)是各子頻帶的加權(quán)和頻譜、第一立體聲參數(shù)和第二立體聲參數(shù);
中間參數(shù)求取單元和恢復(fù)單元分別對各子頻帶執(zhí)行自身處理功能。
19、如權(quán)利要求17所述的解碼裝置,其特征在于,所述中間參數(shù)求取單元包括正交模塊和縮放模塊;
所述正交模塊,用于產(chǎn)生與所述加權(quán)和頻譜等幅垂直的正交頻譜,作為縮放后加權(quán)差頻譜;
所述縮放模塊,用于利用所述第二立體聲參數(shù)對所述縮放后加權(quán)差頻譜進(jìn)行縮放,得到加權(quán)差頻譜。
20、如權(quán)利要求19所述的解碼裝置,其特征在于,所述恢復(fù)單元包括左聲道恢復(fù)模塊和右聲道恢復(fù)模塊;
所述左聲道恢復(fù)模塊,用于將所述加權(quán)和頻譜與所述加權(quán)差頻譜相加,得到左聲道頻譜;
所述右聲道恢復(fù)模塊,用于根據(jù)加權(quán)和頻譜和左聲道頻譜,得到縮放后的右聲道頻譜,利用所述第一立體聲參數(shù)對得到的縮放后右聲道頻譜進(jìn)行縮放,得到右聲道頻譜。
全文摘要
本發(fā)明公開了一種立體聲編碼方法,該方法包括提取表征立體聲中第一聲道頻譜與第二聲道頻譜的能量比的第一立體聲參數(shù),表征第一聲道和第二聲道的加權(quán)差頻譜與加權(quán)和頻譜能量比的第二立體聲參數(shù),并獲取第一聲道和第二聲道的加權(quán)和頻譜;其中,所述加權(quán)的權(quán)值為所述第一立體聲參數(shù);所述第一聲道和第二聲道分別為所述立體聲中左聲道和右聲道中的一個和另一個;對所述加權(quán)和頻譜、第一立體聲參數(shù)和第二立體聲參數(shù)進(jìn)行編碼,向解碼端發(fā)送。本發(fā)明還公開了一種針對于該編碼方法的解碼方法,以及一種立體聲編碼裝置和一種立體聲解碼裝置。使用本發(fā)明能夠?qū)崿F(xiàn)低碼率下對立體聲的高質(zhì)量編碼。解碼過程也無需任何的角度計算,降低了解碼復(fù)雜度。
文檔編號H04B1/66GK101604524SQ20081011475
公開日2009年12月16日 申請日期2008年6月11日 優(yōu)先權(quán)日2008年6月11日
發(fā)明者徐恒宇, 靚 李, 潘興德 申請人:北京天籟傳音數(shù)字技術(shù)有限公司