專利名稱:一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法,尤其是適合于包含多種編碼速率的音頻編碼器,屬于音頻編碼領(lǐng)域
背景技術(shù):
變速率的音頻編碼技術(shù)是根據(jù)輸入音頻信號(hào)的統(tǒng)計(jì)特性,或者通信鏈路質(zhì)量,或者網(wǎng)絡(luò)用戶的需求來控制信息傳輸速率,從而降低傳輸?shù)钠骄a率,提高傳輸效率,它相對(duì)于傳統(tǒng)的固定速率編碼方法能夠更好的節(jié)省信道帶寬,受到研究者的廣泛重視。一般而言, 變速率的語音編碼算法可以分為信源控制的或信道控制的兩大類,后者可以是信道或網(wǎng)絡(luò)控制編碼速率可變,通常是根據(jù)外部控制信號(hào)從一種速率切換為預(yù)定速率集合中的另一種速率,如AMR自適應(yīng)多速率語音編碼,也可以是可分級(jí)的編解碼方式。信源控制的變速率編碼方法則是根據(jù)輸入信號(hào)的特性來動(dòng)態(tài)的分配編碼比特或采用不同的編碼模式,其編碼器的目的是為了確保輸出信號(hào)質(zhì)量的同時(shí)給每幀音頻信號(hào)分配盡可能少的比特,如3GPP2標(biāo)準(zhǔn)中提出的SMV可選模式聲碼器。目前變速率編碼的方法大多用于基于線性預(yù)測(cè)和碼本激勵(lì)的語音編碼器,例如我國(guó)專利申請(qǐng)?zhí)枮?00810210215(
公開日2009年03月18日)和申請(qǐng)專利號(hào)為 200710153938 (
公開日2009年02月04日)的發(fā)明專利提出了根據(jù)合成數(shù)字話音幀的話音激活檢測(cè)結(jié)果或者清濁音檢測(cè)結(jié)果來確定編碼速率的變速率碼激勵(lì)線性預(yù)測(cè)編碼器和編碼方法。后期產(chǎn)生了多模式變速率方法,它是針對(duì)不同特性的輸入信號(hào)幀設(shè)計(jì)最佳的編碼模式和分配最低的編碼速率,并使編碼器能夠保持較好的解碼聲音質(zhì)量。通常有兩種技術(shù)可以實(shí)現(xiàn)多模式變速率,一種是閉環(huán)方式,一種是開環(huán)方式。前者基于某種失真準(zhǔn)則通過閉環(huán)搜索判斷哪種模式最適合當(dāng)前幀編碼,當(dāng)選擇合適的失真準(zhǔn)則時(shí)能夠使得語音幀和編碼模式達(dá)到最佳匹配,后者通?;谡Z音幀分類的方式,對(duì)不同類的語音幀采用不同的編碼模式或編碼速率,以達(dá)到編碼比特有效分配的效果。開環(huán)方式的復(fù)雜度較低,但需要魯棒性較高的語音幀分類算法,閉環(huán)的計(jì)算復(fù)雜度較高,但編碼模式匹配效果較好。VAD話音激活檢測(cè)技術(shù)是變速率語音編碼器中常用的方法,它通過降低語音靜默段的量化編碼比特從而大大降低整體編碼速率,但在音樂信號(hào)的編碼中并不適用,音樂信號(hào)不像語音信號(hào)在通話過程中存在50%左右的靜默段,可以利用VAD技術(shù)來降低靜默段的編碼速率。3GPP2標(biāo)準(zhǔn)中提出的EVRC增強(qiáng)型可變速率編碼器和SMV可選模式聲碼器都是基于語音幀分類的方式來確定每幀的量化編碼方式和編碼速率,從而達(dá)到整體編碼速率的降低。而3GPP 標(biāo)準(zhǔn)中的 AMR-NB (TS 26. 090)、AMR-ffB (TS 26. 190)則是根據(jù)信道傳輸?shù)膼毫忧闆r來從預(yù)定的多種速率中選擇合適的編碼速率傳輸窄帶或?qū)拵дZ音,AMR-WB+(TS 26. 290)則是一種在AMR-WB基礎(chǔ)上發(fā)展的自適應(yīng)多速率的語音和音樂混合編碼方法,在編碼之前首先確定編碼速率,對(duì)于每幀音頻信號(hào)再選擇合適的ACELP (代數(shù)碼本激勵(lì))或 TCX (Transform Coded Excitation)變換碼激勵(lì)編碼模式,ACELP傾向于編碼語音幀,TCX 傾向于編碼音頻幀,對(duì)于每幀輸入音頻信號(hào),從26種ACELP/TCX組合編碼模式中選擇最佳的編碼模式。我國(guó)AVS數(shù)字音視頻編碼標(biāo)準(zhǔn)工作組提出的AVS-PlO是多速率的移動(dòng)語音和音頻混合的編解碼器,與AMR-WB+的編解碼原理相似,其核心模塊的編碼方式有所不同, AVS-PlO核心模塊采用ACELP/TVC (Transform Vector Coding,變換域矢量編碼),兩者的單聲道編碼速率都有8種速率,立體聲編碼速率都有16種速率,兩者均是信道控制的變速率編碼,而沒有采用信源控制變速率編碼方法,尤其對(duì)音樂信號(hào)未有合適的源控變速率方式
發(fā)明內(nèi)容
本發(fā)明的目的是為了進(jìn)一步提高多速率音頻編碼器的編碼效率,壓縮編碼帶寬, 利用閉環(huán)源控變速率的方式降低某些音頻幀的編碼速率,通過設(shè)計(jì)合適的閉環(huán)選擇準(zhǔn)則從而達(dá)到整體的平均編碼速率的降低。為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是首先對(duì)每幀音頻信號(hào)在高速率下進(jìn)行編解碼,將該速率下各種編碼模式的編碼輸入信號(hào)和解碼輸出信號(hào)通過感知加權(quán)濾波器后計(jì)算平均分段信噪比,并選出使感知加權(quán)平均分段信噪比最大的編碼模式,然后在臨近高速率的低編碼速率下選出使編碼輸入信號(hào)和解碼輸出信號(hào)的感知加權(quán)平均分段信噪比最大的編碼模式,最后分別對(duì)于高、低速率下選出來的編碼模式,計(jì)算編碼輸入信號(hào)和解碼輸出信號(hào)平均分段信噪比,如果低速率編碼模式下的平均分段信噪比相比高速率編碼模式下的偏大,則切換到低速率編碼模式,反之則切換到高速率編碼模式。本發(fā)明所用到的技術(shù)方案中涉及到的感知加權(quán)濾波器的表達(dá)式為
P
權(quán)利要求
1.一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法,設(shè)置一個(gè)預(yù)先設(shè)定的編碼速率集合和一個(gè)預(yù)先設(shè)定的編碼模式集合,該編碼速率集合涉及一組從高到低的不同編碼速率,且至少包含兩種編碼速率,該編碼模式集合涉一組不同的音頻信號(hào)編碼模式,且至少包含兩種編碼模式,每幀音頻信號(hào)將從由高速率到低速率的編碼模式集合中根據(jù)解碼輸出信號(hào)相對(duì)于編碼輸入信號(hào)和的失真大小選擇最佳編碼模式和編碼速率;其特征在于,本發(fā)明是通過如下步驟實(shí)現(xiàn)的對(duì)于待處理的每幀音頻信號(hào)(1)從編碼速率集合(Ri,i = 1,...,M,M是編碼速率的個(gè)數(shù))中選定一種編碼速率 Rh(h > 1),在該編碼速率下對(duì)于編碼模式集合(O” i = 1,...,N,N是編碼模式的個(gè)數(shù))中的每種編碼模式,對(duì)該幀音頻信號(hào)分別進(jìn)行編解碼;(2)分別將步驟(1)中每種編碼模式下得到的編碼輸入信號(hào)和解碼輸出信號(hào)通過感知加權(quán)濾波器得到加權(quán)輸入信號(hào)和加權(quán)輸出信號(hào);(3)分別計(jì)算步驟(2)中每個(gè)編碼模式下得到的加權(quán)輸入信號(hào)和加權(quán)輸出信號(hào)的平均分段信噪比,選出使平均分段信噪比最大的編碼模式,記為Oh ;(4)在步驟(3)中選出來的高速率編碼模式Oh下,計(jì)算編碼輸入信號(hào)和解碼輸出信號(hào)的平均分段信噪比,記為SH;(5)采用比編碼速率Rh低一級(jí)的相鄰編碼速率R1G=h-l)對(duì)該幀音頻信號(hào)進(jìn)行編解碼,并在每種編碼模式下,將編碼輸入信號(hào)和解碼輸出信號(hào)分別通過感知加權(quán)濾波器后計(jì)算平均分段信噪比,選出使平均分段信噪比最大的編碼模式,記為;(6)在步驟(5)中選出來的低速率編碼模式下,計(jì)算編碼輸入信號(hào)和解碼輸出信號(hào)的平均分段信噪比,記為(7)對(duì)上述步驟中選出來的高速率編碼模式Oh下的Sh和低速率編碼模式下的&判斷大小,如果& > Sh,則從高速率編碼模式Oh切換到低速率編碼模式(\,反之則從低速率編碼模式切換到高速率編碼模式0H。
2.如權(quán)利要求1所述的一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法,其特征在于步驟(2)中所述的感知加權(quán)濾波器的表達(dá)式為P
3.如權(quán)利要求1所述的一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法,其特征在于輸出信號(hào)釾“)相對(duì)于輸入信號(hào)χ (η)的平均分段信噪比的計(jì)算過程為a.將一幀信號(hào)劃分為Nsf個(gè)子幀,計(jì)算每個(gè)子幀的分段信噪比
全文摘要
本發(fā)明涉及一種相鄰高低速率編碼模式間切換的變速率音頻編碼方法,屬于音頻編碼領(lǐng)域,特別是適合用于多速率的音頻編碼器。其技術(shù)特點(diǎn)是首先對(duì)每幀音頻信號(hào)在高速率下進(jìn)行編解碼,將該速率下各種編碼模式的編碼輸入信號(hào)和解碼輸出信號(hào)通過感知加權(quán)濾波器后計(jì)算平均分段信噪比,并選出使感知加權(quán)平均分段信噪比最大的編碼模式,然后在臨近高速率的低編碼速率下選出使編碼輸入信號(hào)和解碼輸出信號(hào)的感知加權(quán)平均分段信噪比最大的編碼模式,最后分別對(duì)于高、低速率下選出來的編碼模式,計(jì)算編碼輸入信號(hào)和解碼輸出信號(hào)平均分段信噪比,如果低速率編碼模式下的平均分段信噪比相比高速率編碼模式下的偏大,則切換到低速率編碼模式,反之則切換到高速率編碼模式。本發(fā)明的方法對(duì)每幀音頻信號(hào)根據(jù)輸出信號(hào)相對(duì)輸入信號(hào)的失真大小,在相鄰的高低編碼速率下的各編碼模式間切換,從而在保持良好編碼質(zhì)量的同時(shí),降低音頻信號(hào)的平均編碼速率,從而提高多速率音頻編碼器的編碼效率。
文檔編號(hào)G10L19/12GK102254562SQ201110180050
公開日2011年11月23日 申請(qǐng)日期2011年6月29日 優(yōu)先權(quán)日2011年6月29日
發(fā)明者孟凱, 楊果, 王晶, 趙勝輝 申請(qǐng)人:北京理工大學(xué)