專利名稱:立體聲音響信號(hào)編碼裝置、立體聲音響信號(hào)解碼裝置及它們的編解碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及立體聲音響信號(hào)編碼裝置、立體聲音響信號(hào)解碼裝置及它們的方法。
背景技術(shù):
隨著全球性的寬帶化進(jìn)程,用戶對(duì)通信系統(tǒng)的期待也由單純的明了性提高到立體聲感或自然性,提供立體聲音響信號(hào)已成為趨勢(shì)。其結(jié)果,期望用于存儲(chǔ)和發(fā)送立體聲音響信號(hào)的有效的編碼方式。作為立體聲編碼方式,例如存在多種如AMR-WB+(Extended adaptive multi-rate-Wideband:擴(kuò)散自適應(yīng)多速率寬帶編碼)那樣,采用“中-側(cè)(Mid-Side)(和差)”(以下記為“M/S”),利用立體聲信號(hào)所包含的立體聲的冗余性的立體聲編碼(例如, 非專利文獻(xiàn)1)。在M/S立體聲編碼中,多數(shù)情況下,由于兩個(gè)聲道的相關(guān)性相當(dāng)高,因此計(jì)算兩個(gè)信號(hào)(左聲道信號(hào)與右聲道信號(hào))的和與差。其結(jié)果,兩個(gè)信號(hào)的冗余性被去除,隨后對(duì)和 (單聲道或中)信號(hào)及差(副或側(cè))信號(hào)進(jìn)行編碼。由此,對(duì)于信號(hào)能量大的單聲道信號(hào), 能夠比信號(hào)能量小的副信號(hào)分配(相對(duì))更多的比特,能夠?qū)崿F(xiàn)高質(zhì)量的立體聲音響信號(hào)。利用立體聲音響信號(hào)的冗余性的M/S方法中的問(wèn)題在于,在兩個(gè)分量的相位錯(cuò)開(kāi) (一者對(duì)于另一者時(shí)間性地延遲)的情況下,M/S編碼的優(yōu)點(diǎn)消失。在實(shí)際的音頻信號(hào)中, 由于頻繁地發(fā)生時(shí)間延遲,因此這是根本性的問(wèn)題。另外,聽(tīng)到立體聲信號(hào)時(shí)感覺(jué)到的立體感大多是基于(尤其是在低頻率的)左聲道信號(hào)與右聲道信號(hào)之間的時(shí)間差。為了解決該問(wèn)題,在非專利文獻(xiàn)2中提出基于使相位匹配(time-aligned)的信號(hào)分量的自適應(yīng)M/S立體聲編碼方法。
圖1是表示用于立體聲信號(hào)的基于自適應(yīng)M/S立體聲編碼方法的原理的編碼裝置的結(jié)構(gòu)的方框圖。在圖1所示的編碼裝置的編碼處理中,時(shí)間延遲估計(jì)單元101如式(1)那樣使用時(shí)域互相關(guān)方法(time domain cross correlation technique)估計(jì)與立體聲信號(hào)的左聲道L (η)和右聲道R(η)之間的時(shí)間延遲對(duì)應(yīng)的時(shí)間延遲D。
N-1-τ
(YjL(H)Rin + ^)2=——^- and D=~Clr(t)(1)
(Σ ζ2⑷)*(Σ尺2(”+偽
η=0η=0在式(ι)中,[a,b]為規(guī)定的范圍,N為幀大小。時(shí)間延遲編碼單元105將時(shí)間延遲D進(jìn)行編碼,復(fù)用單元106將編碼參數(shù)復(fù)用而形成比特流(bit stream)。接下來(lái),時(shí)間調(diào)整單元102根據(jù)時(shí)間延遲D調(diào)整(aligned)右聲道信號(hào)R(n)。將調(diào)整了的右聲道信號(hào)表示為Ra (η)。
對(duì)于調(diào)整了的信號(hào)分量,如式(2)那樣進(jìn)行下混頻,求單聲道信號(hào)M(n)與副信號(hào) S (η)。
權(quán)利要求
1.立體聲音響信號(hào)編碼裝置,包括峰值追蹤單元,通過(guò)將右聲道信號(hào)和左聲道信號(hào)的幀分割為多個(gè)子幀,檢測(cè)分割出的所述子幀的波形的峰值,并且比較檢測(cè)到的所述峰值的位置,從而估計(jì)所述右聲道信號(hào)和所述左聲道信號(hào)的各幀的幀時(shí)間延遲;時(shí)間調(diào)整單元,基于所述幀時(shí)間延遲,進(jìn)行所述右聲道信號(hào)和所述左聲道信號(hào)中的任何一方的時(shí)間調(diào)整;以及編碼單元,將所述右聲道信號(hào)和所述左聲道信號(hào)中的任何另一方、時(shí)間調(diào)整了的所述右聲道信號(hào)和所述左聲道信號(hào)中的任何一方、以及所述幀時(shí)間延遲進(jìn)行編碼。
2.如權(quán)利要求1所述的立體聲音響信號(hào)編碼裝置,所述峰值追蹤單元求所述子幀的子幀時(shí)間延遲,并且在各幀中,在所述幀時(shí)間延遲與所述子幀時(shí)間延遲之差為規(guī)定的值以上的所述子幀的數(shù)為閾值以上的情況下,使估計(jì)出的所述幀時(shí)間延遲無(wú)效。
3.如權(quán)利要求1所述的立體聲音響信號(hào)編碼裝置,所述峰值追蹤單元去除所述峰值的值小于閾值的所述子幀的所述峰值,估計(jì)所述幀時(shí)間延遲。
4.如權(quán)利要求1所述的立體聲音響信號(hào)編碼裝置,還包括時(shí)間延遲估計(jì)單元,通過(guò)與在所述峰值追蹤單元中估計(jì)出的所述幀時(shí)間延遲不同的方法,估計(jì)所述幀的時(shí)間延遲,所述峰值追蹤單元求所述子幀的子幀時(shí)間延遲,并且在各幀中,在所述時(shí)間延遲估計(jì)單元中估計(jì)出的時(shí)間延遲與所述子幀時(shí)間延遲之差為規(guī)定的值以上的所述子幀的數(shù)低于閾值的情況下,輸出在所述時(shí)間延遲估計(jì)單元中估計(jì)出的時(shí)間延遲以取代所述幀時(shí)間延遲。
5.如權(quán)利要求1所述的立體聲音響信號(hào)編碼裝置,所述時(shí)間調(diào)整單元基于所述幀時(shí)間延遲進(jìn)行所述右聲道信號(hào)和所述左聲道信號(hào)雙方的時(shí)間調(diào)整,所述編碼單元將時(shí)間調(diào)整了的所述左聲道信號(hào)和所述右聲道信號(hào)以及所述幀時(shí)間延遲進(jìn)行編碼。
6.立體聲音響信號(hào)解碼裝置,包括分離單元,通過(guò)將右聲道信號(hào)和左聲道信號(hào)的幀分割為多個(gè)子幀,檢測(cè)分割出的所述子幀的波形的峰值,并且比較檢測(cè)到的所述峰值的位置,從而估計(jì)所述右聲道信號(hào)和所述左聲道信號(hào)的各幀的幀時(shí)間延遲,并基于所述幀時(shí)間延遲,進(jìn)行所述右聲道信號(hào)和所述左聲道信號(hào)中的任何一方的時(shí)間調(diào)整,并且將對(duì)所述右聲道信號(hào)和所述左聲道信號(hào)中的任何另一方、時(shí)間調(diào)整了的所述右聲道信號(hào)和所述左聲道信號(hào)中的任何一方以及所述幀時(shí)間延遲進(jìn)行了編碼和復(fù)用所得的比特流,分離為所述右聲道信號(hào)、所述左聲道信號(hào)和所述幀時(shí)間延遲;解碼單元,將分離出的所述右聲道信號(hào)、所述左聲道信號(hào)和所述幀時(shí)間延遲進(jìn)行解碼;以及時(shí)間復(fù)原單元,基于分離出的所述幀時(shí)間延遲,將所述右聲道信號(hào)復(fù)原為進(jìn)行所述時(shí)間調(diào)整之前的時(shí)間。
7.立體聲音響信號(hào)編碼方法,包括以下步驟通過(guò)將右聲道信號(hào)和左聲道信號(hào)的幀分割為多個(gè)子幀,檢測(cè)分割出的所述子幀的波形的峰值,并且比較檢測(cè)到的所述峰值的位置,從而估計(jì)所述右聲道信號(hào)和所述左聲道信號(hào)的各幀的幀時(shí)間延遲;基于所述幀時(shí)間延遲,進(jìn)行所述右聲道信號(hào)和所述左聲道信號(hào)中的任何一方的時(shí)間調(diào)整;以及將所述右聲道信號(hào)和所述左聲道信號(hào)中的任何另一方、時(shí)間調(diào)整了的所述右聲道信號(hào)和所述左聲道信號(hào)中的任何一方以及所述幀時(shí)間延遲進(jìn)行編碼。
8.立體聲音響信號(hào)解碼方法,包括以下步驟通過(guò)將右聲道信號(hào)和左聲道信號(hào)的幀分割為多個(gè)子幀,檢測(cè)分割出的所述子幀的波形的峰值,并且比較檢測(cè)到的所述峰值的位置,從而估計(jì)所述右聲道信號(hào)和所述左聲道信號(hào)的各幀的幀時(shí)間延遲,并基于所述幀時(shí)間延遲,進(jìn)行所述右聲道信號(hào)和所述左聲道信號(hào)中的任何一方的時(shí)間調(diào)整,并且將對(duì)所述右聲道信號(hào)和所述左聲道信號(hào)中的任何另一方、時(shí)間調(diào)整了的所述右聲道信號(hào)和所述左聲道信號(hào)中的任何一方以及所述幀時(shí)間延遲進(jìn)行了編碼和復(fù)用所得的比特流,分離為所述右聲道信號(hào)、所述左聲道信號(hào)和所述幀時(shí)間延遲; 將分離出的所述右聲道信號(hào)、所述左聲道信號(hào)和所述幀時(shí)間延遲進(jìn)行解碼;以及基于分離出的所述幀時(shí)間延遲,將所述右聲道信號(hào)復(fù)原為進(jìn)行所述時(shí)間調(diào)整之前的時(shí)間。
全文摘要
公開(kāi)了即使在存在多個(gè)聲源的情況下也能夠防止信號(hào)的質(zhì)量劣化的立體聲音響信號(hào)編碼裝置。該裝置中,峰值追蹤單元(401)通過(guò)將右聲道信號(hào)和左聲道信號(hào)的幀分割為多個(gè)子幀,檢測(cè)分割出的子幀的波形的峰值,并且比較檢測(cè)到的峰值的位置,從而估計(jì)右聲道信號(hào)和左聲道信號(hào)的各幀的幀時(shí)間延遲D。時(shí)間調(diào)整單元(402)基于幀時(shí)間延遲D進(jìn)行右聲道信號(hào)的時(shí)間調(diào)整。使用時(shí)間調(diào)整后的右聲道信號(hào)和左聲道信號(hào)進(jìn)行下混頻處理,生成單聲道信號(hào)和副信號(hào)。單聲道編碼單元(403)將單聲道信號(hào)進(jìn)行編碼。副信號(hào)編碼單元(404)將副信號(hào)進(jìn)行編碼。時(shí)間延遲編碼單元(405)將幀時(shí)間延遲D進(jìn)行編碼。
文檔編號(hào)H04S1/00GK102292767SQ20108000490
公開(kāi)日2011年12月21日 申請(qǐng)日期2010年1月21日 優(yōu)先權(quán)日2009年1月22日
發(fā)明者劉宗憲, 張國(guó)成 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社