計器12、預(yù)處理單元22及編碼器平臺26、28兩者。預(yù)處理單元22以習(xí)知方式處理輸入音頻信號,以導(dǎo)出LPC系數(shù)及加權(quán)LPC系數(shù)42,并通過加權(quán)LPC系數(shù)42濾波音頻信號40以獲得加權(quán)音頻信號44。預(yù)處理單元22輸出加權(quán)LPC系數(shù)42、加權(quán)音頻信號44及音調(diào)滯后的集合48。如熟習(xí)此項技術(shù)者所理解,可將加權(quán)LPC系數(shù)42及加權(quán)音頻信號44分段化為幀或子幀。可通過以適當(dāng)方式開窗口音頻信號而獲得分段。
[0054]在本發(fā)明的實施例中,可使用經(jīng)量化LPC系數(shù)或經(jīng)量化加權(quán)LPC系數(shù)。因此,應(yīng)理解,術(shù)語「LPC系數(shù)」亦意欲涵蓋「經(jīng)量化LPC系數(shù)」,且術(shù)語「加權(quán)LPC系數(shù)」亦意欲涵蓋「加權(quán)經(jīng)量化系數(shù)」。就此而言,值得注意的是,USAC的TCX算法使用經(jīng)量化加權(quán)LPC系數(shù)以塑形MCDT頻譜。
[0055]第一估計器12接收音頻信號40、加權(quán)LPC系數(shù)42及加權(quán)音頻信號44,基于上述各者估計第一品質(zhì)測量46,并將第一質(zhì)量測量輸出至控制器16。第二估計器16接收加權(quán)音頻信號44及音調(diào)滯后的集合48,基于上述兩者估計第二質(zhì)量測量50,并將第二質(zhì)量測量50輸出至控制器16。如熟習(xí)此項技術(shù)者所已知,已在先前模塊(亦即,預(yù)處理單元22)中計算出加權(quán)LPC系數(shù)42、加權(quán)音頻信號44及音調(diào)滯后的集合48,且因此,上述各者無需成本而可用。
[0056]控制器基于所接收質(zhì)量測量的比較,作出TCX算法抑或ACELP算法的選擇決定。如上文所指示,控制器可在決定使用哪種算法時使用磁滯機制。圖2中借助于由控制器16所輸出的控制信號52控制的切換器24,示意性地展示選擇第一編碼器平臺26抑或第二編碼器平臺28??刂菩盘?2指示待使用第一編碼器平臺26抑或第二編碼器平臺28?;诳刂菩盘?2,由圖2中的箭頭54所示意性地指示,且至少包括LPC系數(shù)、加權(quán)LPC系數(shù)、音頻信號、加權(quán)音頻信號、音調(diào)滯后的集合的所要求信號應(yīng)用于第一編碼器平臺26抑或第二編碼器平臺28。所選擇的編碼器平臺應(yīng)用相關(guān)聯(lián)編碼算法,并將經(jīng)編碼表示56或58輸出至輸出接口 30。輸出接口 30可被配置為輸出經(jīng)編碼音頻信號,其可包含經(jīng)編碼表示56或58、LPC系數(shù)或加權(quán)LPC系數(shù)、用于所選擇編碼算法的參數(shù)及關(guān)于所選擇編碼算法的信息(以及其他數(shù)據(jù))。
[0057]現(xiàn)參看圖3描述用于估計第一及第二質(zhì)量測量的具體實施例,其中第一及第二質(zhì)量測量為加權(quán)信號域中的區(qū)段性SNR。圖3以逐步驟地展示各自估計的流程圖的形式展示第一估計器12及第二估計器14及其功能性。
[0058]TCX岡段件SNR的估計
[0059]第一(TCX)估計器將音頻信號40 (輸入信號)、加權(quán)LPC系數(shù)42及加權(quán)音頻信號44接收為輸入。
[0060]在步驟100中,對音頻信號40進行開窗口。可通過1ms低重迭正弦窗口發(fā)生開窗口。當(dāng)過去幀為ACELP時,區(qū)塊大小可增加5ms,窗口的左側(cè)可以是矩形,且可自經(jīng)開窗輸入信號移除ACELP合成濾波器的經(jīng)開窗零脈沖回應(yīng)。此情況類似于TCX算法中所進行的內(nèi)容。自步驟100輸出表示音頻信號的一部分的音頻信號40的幀。
[0061 ] 在步驟102中,通過MDCT (修改離散余弦變換)變換經(jīng)開窗音頻信號(亦即,所得幀)。在步驟104中,通過用加權(quán)LPC系數(shù)塑形MDCT頻譜而執(zhí)行頻譜塑形。
[0062]在步驟106中,估計全局增益G,使得當(dāng)通過熵編碼器(例如,算術(shù)編碼器)編碼時,通過增益G所量化的加權(quán)頻譜將產(chǎn)生給定目標R。使用術(shù)語「全局增益」,這是由于一增益是針對整個幀而判定。
[0063]現(xiàn)解釋全局增益估計的實施的實例。應(yīng)注意,此全局增益估計適合于TCX編碼算法使用具有算術(shù)編碼器的標量量化器的實施例。在MPEG USAC標準中假定具有算術(shù)編碼器的此標量量化器。
[0064]初始化
[0065]首先,通過如下各者初始化用于增益估計的變量:
[0066]1.將 en[i]設(shè)定為=9.0+10.0*logl0(c[4*i+0]+c[4*i+l]+c[4*i+2]+c[4*i+3]),
[0067]其中0〈 = i〈L/4,c□為用以量化的系數(shù)的向量,且L為c[]的長度。
[0068]2.將fac設(shè)定為=128,將偏移設(shè)定為=fac,且將目標設(shè)定為=任何值(例如,1000)
[0069]佚代
[0070]接著,將操作的以下區(qū)塊執(zhí)行NITER次(例如,在此處,NITER = 10)。
[0071]1.fac = fac/2
[0072]2.偏移=偏移-fac
[0073]3.ener = O
[0074]4.對于每一 i (其中0〈 = i〈L/4),進行如下操作:
[0075]若en [i]-偏移 >3.0,則 ener = ener+en [i]-偏移
[0076]5.若ener>目標,則偏移=偏移+fac
[0077]迭代的結(jié)果為偏移值。迭代之后,將全局增益估計為G = 10~ (偏移/20)。
[0078]取決于所使用的量化器及熵編碼器,估計全局增益的特定方式可發(fā)生變化。在MPEG USAC標準中假定具有算術(shù)編碼器的標量量化器。其他TCX方法可使用不同的量化器,且熟習(xí)此項技術(shù)者應(yīng)理解如何針對此等不同量化器而估計全局增益。舉例來說,AMR-WB+標準假定使用RE8晶格量化器。對于此量化器,全局增益的估計可經(jīng)估計為如3GPP TS 26.290V6.1.0 2004-12的34頁上的5.3.5.7章中所描述,其中假定固定的目標比特率。
[0079]在于步驟106中估計全局增益之后,步驟108中發(fā)生失真估計。更特定而言,基于估計全局增益近似量化器失真。在本實施例中,假定使用均勻標量量化器。因此,通過單一公式D = G*G/12判定量化器失真,其中D表示所判定量化器失真且G表示估計全局增益。此情況對應(yīng)于均勻標量量化器失真的高速率近似。
[0080]基于所判定量化器失真,在步驟110中執(zhí)行區(qū)段性SNR計算。將幀的每一子幀中的SNR計算為子幀中的加權(quán)音頻信號能量與失真D (假定為常數(shù))的比。舉例來說,將幀分成四個連續(xù)子幀(參見圖4)。接著,區(qū)段性SNR為四個子幀的SNR的平均,且可以dB進行指示。
[0081]此方法允許估計當(dāng)實際上使用TCX算法編碼及解碼主題幀時將獲得的第一區(qū)段性SNR,然而并不必實際上編碼及解碼音頻信號,且因此,該方法具有大量減少的復(fù)雜性及減少的計算時間。
[0082]ACELP岡段件SNR的估計
[0083]第二估計器14接收預(yù)處理單元22中已計算出的加權(quán)音頻信號44及音調(diào)滯后的集合48。
[0084]如步驟112中所展示,在每一子幀中,通過簡單地使用加權(quán)音頻信號及音調(diào)滯后T而近似自適應(yīng)碼本。通過如下公式近似自適應(yīng)碼本
[0085]xw (η-Τ),η = 0,…,N
[0086]其中xw為加權(quán)音頻信號,T為對應(yīng)子幀的音調(diào)滯后,且N為子幀長度。因此,通過使用由T轉(zhuǎn)換至過去的子幀的版本而近似自適應(yīng)碼本。因此,在本發(fā)明的實施例中,以極簡單的方式近似自適應(yīng)碼本。
[0087]在步驟114中,判定每一子幀的自適應(yīng)碼本增益。更特定而言,在每一子幀中,估計碼本增益G,使得其最小化加權(quán)音頻信號與所近似自適應(yīng)碼本之間的誤差??赏ㄟ^簡單地比較每一樣本的兩信號之間的差異并發(fā)現(xiàn)增益而進行此操作,使得此等差異的和最小。
[0088]在步驟116中,判定每一子幀的自適應(yīng)碼本失真。在每一子幀中,由自適應(yīng)碼本所引入的失真D僅為由增益G按比例調(diào)整的加權(quán)音頻信號與所近似自適應(yīng)碼本之間的誤差的會ti。
[0089]可在可選步驟118中調(diào)整步驟116中所判定的失真,以便考慮創(chuàng)新碼本??蓪⒂糜贏CELP算法的創(chuàng)新碼本的失真簡單地估計為常數(shù)值。在本發(fā)明的所描述實施例中,簡單地假定創(chuàng)新碼本將失真D減少常數(shù)因子。因此,可在步驟118中將步驟116中所獲得的每一子幀的失真乘以常數(shù)因子,諸如O至I的級別的常數(shù)因子(諸如,0.055)。
[0090]在步驟120中,發(fā)生區(qū)段性SNR的計算。在每一子幀中,將SNR計算為加權(quán)音頻信號能量與失真D的比。接著,區(qū)段性SNR為四個子幀的SNR的平均值,且可以dB進行指示。
[0091]此方法允許估計當(dāng)實際上使用ACELP算法編碼及解碼主題幀時將獲得的第二SNR,然而并不必實際上編碼及解碼音頻信號,且因此,該方法具有大量減少的復(fù)雜性及減少的計算時間。
[0092]第一及第二估計器12及14將估計區(qū)段性SNR 46,50輸出至控制器16,且控制器16基于估計區(qū)段性SNR 46、50,作出待對音頻信號的相關(guān)聯(lián)部分使用哪種算法的決定??刂破骺梢暻闆r使用磁滯機制,以便作出較穩(wěn)定的決定。舉例來說,可通過略微不同的