用于選擇第一編碼算法與第二編碼算法中的一個(gè)的裝置及方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及音頻編碼,更具體地,涉及切換式音頻編碼,其中對(duì)于音頻信號(hào)的不同部分,使用不同編碼算法產(chǎn)生經(jīng)編碼信號(hào)。
【背景技術(shù)】
[0002]已知判定用于音頻信號(hào)的不同部分的不同編碼算法的切換式音頻編碼器。大體而言,切換式音頻編碼器提供在兩個(gè)不同模式(即,算法,諸如ACELP (代數(shù)碼激勵(lì)線性預(yù)測(Algebraic Code Excited Linear Predict1n ;ACELP))及TCX(變換編碼激勵(lì)(TransformCoded Excitat1n ;TCX)))之間進(jìn)行切換。
[0003]MPEG USAC (MPEG 統(tǒng)一語音音頻編碼(Unified Speech Aud1 Coding ;USAC))的LPD模式基于該兩個(gè)不同模式ACELP及TCX。ACELP為語音狀及瞬態(tài)狀信號(hào)提供較好質(zhì)量。TCX為音樂狀及噪聲狀信號(hào)提供較好質(zhì)量。編碼器逐幀地決定使用哪種模式。編碼器所作出的決定對(duì)于編解碼器質(zhì)量至關(guān)重要。單一的錯(cuò)誤決定可產(chǎn)生大量偽像,尤其在低比特率的情況下。
[0004]用于決定使用哪種模式的最直接方法為封閉回路模式選擇,亦即執(zhí)行兩種模式的完整編碼/解碼,接著基于音頻信號(hào)及經(jīng)編碼/經(jīng)解碼音頻信號(hào)計(jì)算用于兩種模式的選擇準(zhǔn)則(例如,區(qū)段性SNR),且最后基于選擇準(zhǔn)則選擇模式。此方法大體上產(chǎn)生穩(wěn)定且穩(wěn)固的決定。然而,其亦要求大量復(fù)雜性,因?yàn)楸仨氃诿恳粠庍\(yùn)行兩種模式。
[0005]為減少復(fù)雜性,替代性方法為開放回路模式選擇。開放回路選擇由并不執(zhí)行兩種模式的完整編碼/解碼,但代替地使用通過低復(fù)雜性所計(jì)算的選擇準(zhǔn)則而選擇一模式組成。接著,通過最不復(fù)雜模式(通常為TCX)的復(fù)雜性減去計(jì)算選擇準(zhǔn)則所需的復(fù)雜性而減少最差狀況復(fù)雜性。通常節(jié)約大量復(fù)雜性,此情況使得當(dāng)編解碼器最差狀況復(fù)雜性受到約束時(shí),此種方法是有吸引力的。
[0006]AMR-WB+標(biāo)準(zhǔn)(國際標(biāo)準(zhǔn)3GPP TS 26.290 V6.1.0 2004-12中所定義)包括用于在80ms幀中,在ACELP/TCX20/TCX40/TCX80的所有組合之間決定的開放回路模式選擇。其描述于3GPP TS 26.290的章節(jié)5.2.4中。其亦描述于「用于行動(dòng)、多媒體的較不復(fù)雜音頻編碼(Low Complex Aud1 Encoding for Mobile, Multimedia),VTC 2006,Makinen 等人」的會(huì)議文件中,及追溯至此會(huì)議文件的作者的US7,747,430 B2及US 7,739,120 B2。
[0007]US7, 747, 430 B2揭示基于長期預(yù)測參數(shù)的分析的開放回路模式選擇。US7,739,120 B2揭示基于信號(hào)特性的開放回路模式選擇,該信號(hào)特性指示音頻信號(hào)的各自區(qū)段中的音頻內(nèi)容的類型,其中,若此選擇并不可行,則進(jìn)一步基于統(tǒng)計(jì)評(píng)價(jià)進(jìn)行用于各自相鄰區(qū)段的選擇。
[0008]可以兩個(gè)主要步驟描述AMR-WB+的開放回路模式選擇。在第一主要步驟中,對(duì)音頻信號(hào)進(jìn)行若干特征計(jì)算,諸如能量位準(zhǔn)的標(biāo)準(zhǔn)偏差、低頻/高頻能量比例、總能量、ISP(導(dǎo)抗譜對(duì)(immittance spectral pair ;ISP))距離、音調(diào)滯后及增益、頻譜傾斜。接著,使用簡單的基于臨限分類器,將此等特征用于在ACELP與TCX之間作出選擇。若在第一主要步驟中選擇TCX,則第二主要步驟以封閉回路方式在TCX20/TCX40/TCX80的可能組合之間決定。
[0009]WO 2012/110448 Al揭示用于基于音頻信號(hào)的瞬態(tài)偵測結(jié)果及質(zhì)量結(jié)果,在具有不同特性的兩個(gè)編碼算法之間作出決定的方法。另外,揭示應(yīng)用磁滯,其中磁滯依賴于過去所作出的選擇,亦即對(duì)音頻信號(hào)的較早部分所作出的選擇。
[0010]在“用于行動(dòng)、多媒體的較不復(fù)雜音頻編碼(Low Complex Aud1 Encoding forMobile, Multimedia),VTC 2006,Makinen等人”的會(huì)議文件中,對(duì)AMR-WB+的封閉回路及開放回路模式選擇進(jìn)行比較。主觀收聽測試指示開放回路模式選擇執(zhí)行顯著較差于封閉回路模式選擇。但亦展示,開放回路模式選擇減少40%的最差狀況復(fù)雜性。
【發(fā)明內(nèi)容】
[0011]本發(fā)明的目標(biāo)在于提供一種允許在一第一編碼算法與具有良好效能及減少的復(fù)雜性的一第二編碼算法之間作出選擇的經(jīng)改良方法。
[0012]由如權(quán)利要求1的裝置、如權(quán)利要求20的方法及如權(quán)利要求37的計(jì)算機(jī)程序?qū)崿F(xiàn)此目標(biāo)。
[0013]本發(fā)明的實(shí)施例提供一種用以選擇具有一第一特性的一第一編碼算法及具有一第二特性的一第二編碼算法中的一個(gè)的裝置,該算法用于編碼一音頻信號(hào)的一部分,以獲得該音頻信號(hào)的該部分的一經(jīng)編碼版本,該裝置包含:
[0014]—第一估計(jì)器,其用于在實(shí)際上并不使用該第一編碼算法編碼及解碼該音頻信號(hào)的該部分的情況下,估計(jì)該音頻信號(hào)的該部分的一第一質(zhì)量測量,該第一質(zhì)量測量與該第一編碼算法相關(guān)聯(lián);
[0015]—第二估計(jì)器,其用于在實(shí)際上并不使用該第二編碼算法編碼及解碼該音頻信號(hào)的該部分的情況下,估計(jì)該音頻信號(hào)的該部分的一第二質(zhì)量測量,該第二質(zhì)量測量與該第二編碼算法相關(guān)聯(lián);以及
[0016]—控制器,其用于基于該第一質(zhì)量測量與該第二質(zhì)量測量之間的一比較,選擇該第一編碼算法或該第二編碼算法。
[0017]本發(fā)明的實(shí)施例提供一種用以選擇具有一第一特性的一第一編碼算法及具有一第二特性的一第二編碼算法中的一個(gè)的方法,該算法用于編碼一音頻信號(hào)的一部分,以獲得該音頻信號(hào)的該部分的一經(jīng)編碼版本,該方法包含:
[0018]在實(shí)際上并不使用該第一編碼算法編碼及解碼該音頻信號(hào)的該部分的情況下,估計(jì)該音頻信號(hào)的該部分的一第一質(zhì)量測量,該第一質(zhì)量測量與該第一編碼算法相關(guān)聯(lián);
[0019]在實(shí)際上并不使用該第二編碼算法編碼及解碼該音頻信號(hào)的該部分的情況下,估計(jì)該音頻信號(hào)的該部分的一第二質(zhì)量測量,該第二質(zhì)量測量與該第二編碼算法相關(guān)聯(lián);及
[0020]基于該第一質(zhì)量測量與該第二質(zhì)量測量之間的一比較,選擇該第一編碼算法或該第二編碼算法。
[0021]本發(fā)明的實(shí)施例基于如下認(rèn)識(shí):可通過估計(jì)第一編碼算法及第二編碼算法中的每一個(gè)的一質(zhì)量測量,并基于該第一質(zhì)量測量與該第二質(zhì)量測量之間的一比較選擇該編碼算法中的一個(gè),而實(shí)施具有改良的效能的一開放回路選擇。估計(jì)該質(zhì)量測量,亦即實(shí)際上并不編碼及解碼該音頻信號(hào)以獲得該質(zhì)量測量。因此,可通過減少的復(fù)雜性而獲得該質(zhì)量測量。接著,可使用該估計(jì)質(zhì)量測量執(zhí)行與一封閉回路模式選擇類似的模式選擇。
[0022]在本發(fā)明的實(shí)施例中,實(shí)施首先通過較低的復(fù)雜性估計(jì)ACELP及TCX的區(qū)段性SNR的一開放回路模式選擇。且接著,類似于在一封閉回路模式選擇中,使用此等估計(jì)區(qū)段性SNR值執(zhí)行該模式選擇。
[0023]本發(fā)明的實(shí)施例并不類似于AMR-WB+的該開放回路模式選擇中所進(jìn)行地利用一經(jīng)典的特征+分類器方法。但代替地,本發(fā)明的實(shí)施例試圖估計(jì)每一模式的一質(zhì)量測量,并選擇給出最佳質(zhì)量的該模式。
【附圖說明】
[0024]現(xiàn)將參考隨附圖進(jìn)一步詳細(xì)地描述本發(fā)明的實(shí)施例,其中:
[0025]圖1示出用以選擇第一編碼算法與第二編碼算法中的一個(gè)的裝置的實(shí)施例的示意圖;
[0026]圖2示出用于編碼音頻信號(hào)的裝置的實(shí)施例的示意圖;
[0027]圖3示出用以選擇第一編碼算法與第二編碼算法中的一個(gè)的裝置的實(shí)施例的示意圖;
[0028]圖4a和圖4b可能表示SNR及區(qū)段性SNR。
【具體實(shí)施方式】
[0029]在以下描述中,通過相同參考記號(hào)參考不同圖式中的類似組件/步驟。應(yīng)注意,在圖式中,已省略理解本發(fā)明并不必要的特征(諸如,信號(hào)連接及類似者)。
[0030]圖1展示用以選擇第一編碼算法(諸如,TCX算法)與第二編碼算法(諸如,ACELP算法)中的一個(gè)的裝置10,如用于編碼音頻信號(hào)的一部分的編碼器。裝置10包含用于估計(jì)信號(hào)部分的第一質(zhì)量測量的第一估計(jì)器12。第一質(zhì)量測量與第一編碼算法相關(guān)聯(lián)。換言的,第一估計(jì)器12估計(jì)若使用第一編碼算法編碼并解碼,音頻信號(hào)的部分將具有的第一質(zhì)量測量,而實(shí)際上并不使用第一編碼算法編碼及解碼音頻信號(hào)的部分。裝置10包含用于估計(jì)信號(hào)部分的第二質(zhì)量測量的第二估計(jì)器14。第二質(zhì)量測量與第二編碼算法相關(guān)聯(lián)。換言的,第二估計(jì)器14估計(jì)若使用第二編碼算法編碼并解碼,音頻信號(hào)的部分將具有的第二質(zhì)量測量,而實(shí)際上并不使用第二編碼算法編碼及解碼音頻信號(hào)的部分。此外,裝置10包含用以基于第一質(zhì)量測量與第二質(zhì)量測量之間的比較,選擇第一編碼算法或第二編碼算法的控制器16??刂破骺砂?