音頻信號解碼器中改進(jìn)的頻帶擴(kuò)展的制作方法
【專利摘要】本發(fā)明涉及一種用于在解碼過程中或改進(jìn)過程中擴(kuò)展音頻信號的頻帶的方法,該方法包括獲得在被稱為低頻帶的第一頻帶中解碼的信號的步驟。該方法為使得其包括以下步驟:從來自該低頻帶信號的信號中提取(E402)音調(diào)分量和環(huán)境信號;使用多個能量水平控制因子通過自適應(yīng)混合對這些音調(diào)分量和該環(huán)境信號進(jìn)行組合(E403)以獲得被稱為組合信號的音頻信號;在高于該第一頻帶的至少一個第二頻帶上在該提取步驟之前對該低頻帶解碼信號或在該組合步驟之后對該組合信號進(jìn)行擴(kuò)展(E401a)。本發(fā)明還涉及一種實(shí)現(xiàn)所描述的方法的頻帶擴(kuò)展裝置,并且涉及一種包括這種類型的裝置的解碼器。
【專利說明】
音頻信號解碼器中改進(jìn)的頻帶擴(kuò)展
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及為了對音頻信號(如語音、音樂或其他此類信號)進(jìn)行傳輸或存儲而對 其進(jìn)行編碼/解碼和處理的領(lǐng)域。
[0002] 更具體地,本發(fā)明涉及一種在解碼器或處理器中產(chǎn)生音頻信號增強(qiáng)的頻帶擴(kuò)展方 法和裝置。
【背景技術(shù)】
[0003] 存在許多技術(shù)用于壓縮(有損耗)音頻信號(如語音或音樂)。
[0004]通常將用于對話式應(yīng)用的常規(guī)編碼方法分類為:波形編碼("脈沖編碼調(diào)制" PCM、 "自適應(yīng)差分脈沖編碼調(diào)制" ADPCM、變換編碼等);參數(shù)編碼("線性預(yù)測編碼" LPC、正弦編碼 等);以及通過"合分量析(analysis by synthesis)"對參數(shù)進(jìn)行量化的參數(shù)混合編碼,其 中,CELP( "碼激勵線性預(yù)測")編碼是最著名的示例。
[0005] 對于非對話式應(yīng)用,(單)音頻信號編碼的現(xiàn)有技術(shù)由通過變換或以子頻帶進(jìn)行的 感知編碼與通過頻帶復(fù)制(光譜頻帶復(fù)制SBR)進(jìn)行的對高頻的參數(shù)編碼所組成。
[0006] 可以在以下這些著作中找到對常規(guī)語音和音頻編碼方法的回顧:W.B.克萊因 (W.B.Kleijn)和K.K?帕利埃爾(K.K.Paliwal)(編輯),《語音編碼與合成》(Speech Coding and Synthesis),愛思唯爾出版社,1995 ;M?博瑟(M.Bosi)、R.E?高德博格(R.E.Goldberg), 《數(shù)字音頻編碼和標(biāo)準(zhǔn)介紹》(Introduction to Digital Audio Coding and Standards), 斯普林格出版社,2002;J?貝尼斯提(J.Benesty)、M.M?松迪(M.M.Sondhi)、Y ?黃(Y.Huang) (編輯),《語音處理手冊》(Handbook of Speech Processing),斯普林格出版社,2008。
[0007] 在此,更具體地關(guān)注3GPP標(biāo)準(zhǔn)化AMR-WB( "寬帶自適應(yīng)多速率")編解碼器(編碼器 和解碼器),該編解碼器在16kHz的輸入/輸出頻率上進(jìn)行操作并且其中信號被分成兩個子 頻帶:低頻帶(OkHz-6.4kHz)和高頻帶(6.4kHz-7kHz),該低頻帶以12.8kHz進(jìn)行采樣并且由 CELP模型進(jìn)行編碼,而該高頻帶取決于當(dāng)前幀的模式在有附加信息或者沒有附加信息的情 況下通過"頻帶擴(kuò)展"(或者"帶寬擴(kuò)展" BWE)參數(shù)化地進(jìn)行重建。在此,可以注意到的是,在 7kHz上對AMR-WB編解碼器的編碼頻帶的限制實(shí)質(zhì)上與以下事實(shí)相關(guān)聯(lián):根據(jù)在標(biāo)準(zhǔn)ITU-T P.341中所定義的頻率掩模并且更具體地通過使用在標(biāo)準(zhǔn)ITU-T G. 191中所定義的截?cái)?7kHz以上的頻率的所謂"P341"濾波器(此濾波器遵循在P.341中所定義的掩模)在進(jìn)行標(biāo)準(zhǔn) 化(ETSI/3GPP,然后ITU-T)時近似估算在寬帶終端的傳輸過程中的頻率響應(yīng)。然而,理論 上,眾所周知的是,以16kHz采樣的信號可以具有所限定的從0Hz到8000Hz的音頻頻帶;因 此,AMR-WB編解碼器通過與8kHz的理論帶寬進(jìn)行比較來引入對高頻帶的限制。
[0008] 在2001年,主要針對關(guān)于GSM(2G)和UMTS(3G)的電路模式(CS)電話技術(shù)應(yīng)用對 3GPP AMR-WB語音編解碼器進(jìn)行了標(biāo)準(zhǔn)化。還在2003年由ITU-T以建議G. 722.2 "使用自適應(yīng) 多速率寬帶(AMR-WB)以大約16kbit/s進(jìn)行寬帶編碼語音"的形式對這種相同的編解碼器進(jìn) 行了標(biāo)準(zhǔn)化。
[0009] 它包括從6.6kbit/s到23.85kbit/s的九種比特率(稱為模式),并且包括多種連續(xù) 傳輸機(jī)制(DTX,"不連續(xù)傳輸")以及多種丟失幀校正機(jī)制("幀擦除隱藏"FEC,有時也稱為 "包丟失隱藏" PLC),這些連續(xù)傳輸機(jī)制具有語音活動檢測(VAD)以及來自靜音描述幀(SID, "靜音插入描述符")的舒適噪音生成(CNG)。
[001 0] 在此不再重復(fù)AMR-WB編碼和解碼算法的細(xì)節(jié)。可以在以下文獻(xiàn)中找到對這種編解 碼的詳細(xì)說明:3GPP規(guī)范(TS 26.190、26.191、26.192、26.193、26.194、26.204) ;ITU-T-G.722.2(以及相應(yīng)的附件和附錄);B.貝塞特(B.Bessette)等人的題為《自適應(yīng)多速率寬帶 語音編解碼器(AMR_WB)》( "The adaptive multirate wideband speech codec(AMR-WB)") 的文章,IEEE語音和音頻處理會刊,第10卷,第8期,2002年,620-636頁;以及相關(guān)聯(lián)的3GPP 標(biāo)準(zhǔn)和ITU-T標(biāo)準(zhǔn)的源代碼。
[0011] AMR-WB編解碼器中的頻帶擴(kuò)展原理是相當(dāng)基礎(chǔ)的。實(shí)際上,高頻帶(6.4kHz-7kHz) 是通過時間(以每子幀增益的形式應(yīng)用的)和頻率(通過應(yīng)用線性預(yù)測合成濾波器或"線性 預(yù)測編碼" LPC)包絡(luò)對白噪聲進(jìn)行整形而生成的。在圖1中展示了這種頻帶擴(kuò)展技術(shù)。
[0012]由線性同余生成器針對每5ms子幀以16kHz生成白噪聲UHBi(n),n = 0,…,79(框 100)。通過對每個子幀應(yīng)用增益而及時地形成此噪聲uHB1(n);此操作被分解為兩個處理步 驟(框102、106 或 109):
[0013] ?計(jì)算第一因子(框101)以將白噪聲uHB1(n)設(shè)置(框102)在與在低頻帶中以 12.8kHz解碼的激勵u (n),n = 0,…,63,的電平類似的電平處:
[0015]在此可以注意到的是,在不對多個采樣頻率(12.8kHz或16kHz)的差異進(jìn)行補(bǔ)償?shù)?情況下,通過對具有不同尺寸的塊(針對u(n)為64并且針對uHB1(n)為80)進(jìn)行比較來完成對 能量的歸一化。
[0016] ?然后,獲得高頻帶中的激勵(框106或109),形式如下:
[0017] ?冊(》)=#拙《冊2〇)
[0018]其中,增益么^是根據(jù)比特率以不同的方式獲得的。如果當(dāng)前幀的比特率〈 23.85kbit/s,那么增益也^被估算為"盲式(blind)"(也就是說,沒有附加信息);在這種情 況下,框103通過具有400Hz的截止頻率的高通濾波器對在低頻帶中所解碼的信號進(jìn)行濾波 來獲得信號~….63-一此高通濾波器消除了非常低頻率的可以使在框104中所 作出的估算發(fā)生偏移的影響一一然后,通過歸一化的自相關(guān)(框104)來計(jì)算信號%(?)的被 表示為etm的"傾斜度(tilt)"(頻譜斜率指示符):
[0020] 并且最終,用以下形式來計(jì)算!皿:
[0021 ] =wspgiT+(l-;rSP)g fiG
[0022]其中,gSP=l-etiit是應(yīng)用于有效語音(SP)幀的增益,gBG=1.25g SP是應(yīng)用于與背景 (BG)噪聲相關(guān)聯(lián)的無效語音幀的增益,并且WSP是取決于語音活動檢測(VAD)的加權(quán)函數(shù)。應(yīng) 理解的是,對傾斜度(etm)的估算使得有可能根據(jù)信號的頻譜性質(zhì)對高頻帶的電平進(jìn)行適 配;當(dāng)CELP解碼信號的頻譜斜率為使得在頻率增加時平均能量減少時(語音信號的情況,其 中,etiit接近于1,因此,gsp= 1-etiit被由此減?。?,這種估算尤其重要。還應(yīng)注意的是,AMR-WB解碼中的因子是有界的,在區(qū)間[0.1,1.0]內(nèi)取值。實(shí)際上,對于其頻譜在高頻率下具 有更多能量的信號(e tllt接近于_l,gSP接近于2),增益通常被低估。
[0023] 以23.85kbit/s,校正信息項(xiàng)由AMR-WB編碼器所傳輸并且被解碼(框107、框108)以 便改進(jìn)針對每個子幀所估算的增益(每5毫秒4比特或0.8kbit/s)。
[0024]然后,通過具有傳遞函數(shù)l/AHB(z)并且以16kHz的采樣頻率進(jìn)行操作的LPC合成濾 波器來對人工激勵uHB(n)進(jìn)行濾波(框111)。這種濾波器的構(gòu)造取決于當(dāng)前幀的比特率:
[0025] ?以6.6kbit/s,通過按照因子y =0.9對階數(shù)為20的LPC濾波器l/iexi(〇進(jìn)行加權(quán) 來獲得濾波器1/Ahb(z),這對在低頻帶中(以12.8紐2)所解碼的階數(shù)為16的1^(:濾波器1/_)(::) 進(jìn)行"外插"一一在標(biāo)準(zhǔn)G.722.2第6.3.2.1節(jié)中描述了在ISF(導(dǎo)抗頻譜頻率)參數(shù)領(lǐng)域中進(jìn) 行的外插的細(xì)節(jié)。在這種情況下,
[0026] \! Am{z) = \! Aext{z! y)
[0027] ?以比特率>6.6kbit/s,濾波器l/AHB(z)的階數(shù)為16,并且簡單對應(yīng)于:
[0028] \IAHB(z) = \!A{Zly)
[0029] 其中,丫 =0.6。應(yīng)注意的是,在這種情況下,在16kHz上使用濾波器這導(dǎo) 致此濾波器的頻率響應(yīng)從[0kHz,6.4kHz ]擴(kuò)展(通過比例變換)至[0kHz,8kHz ]。
[0030] 結(jié)果SHB(n)最終由FIR("有限脈沖響應(yīng)")類型的帶通濾波器(框112)處理以僅保留 6kHz-7kHz的頻帶;以23.85kbit/s,同樣為FIR類型的低通濾波器(框113)被添加到處理過 程中以進(jìn)一步衰減7kH以上的頻率。高頻(HF)合成最終被添加(框130)到通過框120至框123 所獲得的低頻(LF)合成中并且被以16kHz進(jìn)行重采樣(框123)。從而,即使在AMR-WB編解碼 器中高頻帶理論上從6.4kHz擴(kuò)展至7kHz,HF合成在與LF合成相加之前而是被包含在6kHz-7kHz頻帶中。
[0031] 可以對AMR-WB編解碼器的頻帶擴(kuò)展技術(shù)的許多缺點(diǎn)進(jìn)行標(biāo)識:
[0032] ?高頻帶中的信號是成形的白噪聲(針對每子幀通過時間增益、通過l/AHB(z)濾波 和帶通濾波形成),這不是在6.4_7kHz頻帶中的信號的良好的一般模型。例如,存在非常諧 調(diào)的音樂信號,針對這些音樂信號,6.4-7kHz頻頻帶包含正弦分量(或音調(diào))并且沒有噪聲 (或極少噪聲);針對這些信號,AMR-WB編解碼器的頻帶擴(kuò)展大大降低了質(zhì)量。
[0033] ?在7kHz上的低通濾波器(框113)在低頻帶與高頻帶之間引入了幾乎lms的偏移, 這可能會通過以23.85kbit/s對這兩個頻帶稍微進(jìn)行去同步而降低某些信號的質(zhì)量一一這 種去同步還會在將比特率從23.85kbit/s切換至其他模式時帶來多種問題。
[0034] ?對每個子幀的增益(框101、框103至框105)的估算不是最佳的。部分地,它是基 于對不同頻率上的信號之間的每子幀"絕對"能量所進(jìn)行的均衡(框101) :16kHz上的人工激 勵(白噪聲)以及12.8kHz上的信號(經(jīng)解碼的ACELP激勵)。具體地,可注意到的是,這種方法 隱含地引起了對高頻帶激勵的衰減(按照比例12.8/16 = 0.8進(jìn)行);實(shí)際上,還將注意的是, 在AMR-WB編解碼器中未對高頻帶進(jìn)行去加重,這隱含地引起了相對接近于0.6的放大(這對 應(yīng)于1/( 1-0.68z'在6400Hz處的頻率響應(yīng)的值)。實(shí)際上,因子1/0.8與0.6得到了近似補(bǔ) 償。
[0035] ?關(guān)于語音,記錄于36??報告了1? 26.976中的36??41?-18編解碼器特征化測試已 經(jīng)示出以23.85kbit/s的模式具有與在23.05kbit/s上的模式相比不是很好的質(zhì)量,其質(zhì)量 實(shí)際上類似于以15.85kbit/s的模式的質(zhì)量。這具體地示出了必須非常謹(jǐn)慎地控制人工HF 信號的電平,因?yàn)橘|(zhì)量在23.85kbit/s上降低,而每幀4比特被認(rèn)為是有可能使得最接近于 原始高頻的能量。
[0036] ?將經(jīng)編碼的頻帶限制到7kHz是應(yīng)用聲學(xué)終端的傳輸響應(yīng)的嚴(yán)格模型(ITU-T G. 191標(biāo)準(zhǔn)中的濾波器P. 341)引起的?,F(xiàn)在,針對16kHz的采樣頻率,在7-8kHz頻帶中的頻率 (特別是針對音樂信號)保持為重要的以確保良好的品質(zhì)水平。
[0037] AMR-WB解碼算法已經(jīng)隨著在2008年標(biāo)準(zhǔn)化的可擴(kuò)展ITU-TG.718編解碼器的發(fā)展 被部分地改進(jìn)。
[0038] ITU-T G. 718標(biāo)準(zhǔn)包括所謂的可互操作模式,針對該可互操作模式,核心編碼在 12.65吐^/8與6.722.2以1?-18)編碼是可兼容的;此外,6.718解碼器具有能夠以41?-18編 解碼器的所有可能的比特率(從6.6kbit/s至23.85kbit/s)解碼AMR-WB/G. 722.2比特流的 具體特征。
[0039]圖2展示了在低延遲模式(G.718-LD)下的G. 718可互操作解碼器。以下是由在 G. 718解碼器中的AMR-WB比特流解碼功能提供的改進(jìn)項(xiàng)列表,當(dāng)需要時參照圖1:
[0040] 頻帶擴(kuò)展(例如在建議G.718的第7.13.1條中描述的,框206)與AMR-WB解碼器的頻 帶擴(kuò)展完全相同,除了6-7kHz帶通濾波器與l/A HB(z)合成濾波器(框111和框112)的順序相 反。此外,在23.85kbit/s下,由AMR-WB編碼器每子幀傳輸?shù)?比特未用在可互操作的G.718 解碼器中;以23.85kbit/s的高頻(HF)合成因此完全等同于23.05kbit/s,這避免了在 23.85kb i t/s下的AMR-WB解碼品質(zhì)的已知問題。更不用說,不使用7kHz低頻帶濾波器(框 113),并且23.85kbit/s模式的特定解碼被省略(框107至框109)。
[0041] 通過框208中的"噪聲門"(通過降低電平來"增強(qiáng)"靜音的品質(zhì))、高通濾波(框 209)、框210的使在低頻下的交叉諧波噪聲衰減的低頻后置濾波器(稱作"低音后置濾波 器")以及在框211中利用飽和控制(利用增益控制或AGC)轉(zhuǎn)換成16位整數(shù)在G.718中實(shí)現(xiàn)以 16kHz對合成進(jìn)行后處理(參見G. 718第7.14條)。
[0042]然而,在AMR-WB和/或G.718(可互操作模式)編解碼器中的頻帶擴(kuò)展仍然受限于多 個方面。
[0043]具體地,通過成形的白噪聲高頻合成(通過LPC源-濾波器類型的時間方法)是在高 于6.4kHz的頻帶中的信號的非常有限的模型。
[0044] 僅6.4_7kHz頻帶是人工重新合成的,而實(shí)際上更寬的頻帶(高達(dá)8kHz)理論上有可 能處于16kHz的采樣頻率,這使得如果信號不被在ITU-T的軟件工具庫(標(biāo)準(zhǔn)G. 191)中定義 的P.341類型(50-7000HZ)的濾波器預(yù)先處理則可以潛在地增強(qiáng)信號的品質(zhì)。
[0045]因此,需要改進(jìn)在AMR-WB型編解碼器或此編碼器的可互操作版本中的頻帶擴(kuò)展或 者更一般地改進(jìn)音頻信號的頻帶擴(kuò)展,具體地以便改進(jìn)頻帶擴(kuò)展的頻率含量。
【發(fā)明內(nèi)容】
[0046] 本發(fā)明改善了這種狀況。
[0047] 本發(fā)明針對此目的提出一種用于在解碼過程中或改進(jìn)過程中擴(kuò)展音頻信號的頻 帶的方法,該方法包括獲得在被稱為低頻帶的第一頻帶中解碼的信號的步驟。該方法如此 使得其包括以下步驟:
[0048] -從由該經(jīng)解碼的低頻帶信號產(chǎn)生的信號中提取音調(diào)分量和環(huán)境信號;
[0049] -使用多個能量水平控制因子通過自適應(yīng)混合對這些音調(diào)分量和該環(huán)境信號進(jìn)行 組合以獲得被稱為組合信號的音頻信號;
[0050] -在高于該第一頻帶的至少一個第二頻帶上,在該提取步驟之前對該低頻帶解碼 信號或在該組合步驟之后對該組合信號進(jìn)行擴(kuò)展。
[0051 ]應(yīng)注意的是,"頻帶擴(kuò)展"隨后將在廣泛意義上被采用并且將不僅包括在高頻率下 擴(kuò)展子頻帶的情況而且包括替代被設(shè)置為零的子頻帶的情況(在變換編碼中的"噪聲填充" 類型)。
[0052] 因此,在同一時間通過將從由低頻帶的解碼產(chǎn)生的信號中提取的音調(diào)分量和環(huán)境 信號考慮在內(nèi),相比于使用人工噪聲,有可能利用適合于信號的性質(zhì)的信號模型執(zhí)行頻帶 擴(kuò)展。頻帶擴(kuò)展的品質(zhì)因此被改進(jìn)并且特別是針對某些類型的信號(如音樂信號)。
[0053] 實(shí)際上,在低頻帶中解碼的信號包括與聲音環(huán)境對應(yīng)的部分,該部分可以用這種 方式被轉(zhuǎn)位成高頻,使得將諧波分量與現(xiàn)有的環(huán)境進(jìn)行混合使有可能確保一致的重建高頻 帶。
[0054]將注意的是,即使本發(fā)明是以在可互操作AMR-WB編碼的背景下提高頻帶擴(kuò)展的品 質(zhì)為動機(jī),但不同的實(shí)施例適用于音頻信號的頻帶擴(kuò)展的更一般的情況,特別是在增強(qiáng)裝 置對音頻信號執(zhí)行分析以提取頻帶擴(kuò)展所需的參數(shù)時。
[0055] 以下提及的不同的具體實(shí)施例可以被單獨(dú)地或彼此組合地添加至以上所定義的 擴(kuò)展方法的步驟中。
[0056] 在一個實(shí)施例中,頻帶擴(kuò)展是在激勵域中執(zhí)行的并且經(jīng)解碼的低頻帶信號是低頻 帶解碼激勵信號。
[0057] 這個實(shí)施例的優(yōu)點(diǎn)是在激勵域中,不加窗(或等效地具有幀長度的隱式矩形窗)的 變換是有可能的。在這種情況下,然后沒有偽像(塊效應(yīng))可被聽到。
[0058] 在第一實(shí)施例中,所述對這些音調(diào)分量和該環(huán)境信號的提取是根據(jù)以下步驟執(zhí)行 的:
[0059] -在頻域中檢測該經(jīng)解碼的或經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號的主音調(diào)分量;
[0060] -通過提取這些主音調(diào)分量計(jì)算殘差信號以獲得該環(huán)境信號。
[0061 ]此實(shí)施例允許精確地檢測這些音調(diào)分量。
[0062] 在具有低復(fù)雜度的第二實(shí)施例中,所述對這些音調(diào)分量和該環(huán)境信號的提取是根 據(jù)以下步驟執(zhí)行的:
[0063] -通過計(jì)算該經(jīng)解碼的或經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號的頻譜的平均值獲得該環(huán) 境信號;
[0064] -通過從該經(jīng)解碼的或經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號中減去所計(jì)算的環(huán)境信號來 獲得這些音調(diào)分量。
[0065] 在組合步驟的一個實(shí)施例中,根據(jù)該經(jīng)解碼的或經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號與 這些音調(diào)分量的總能量計(jì)算用于該自適應(yīng)混合的能量水平控制因子。
[0066] 此控制因子的應(yīng)用允許組合步驟來適配信號的特點(diǎn)以優(yōu)化環(huán)境信號在該混合物 中的相對比例。能量水平因此受到控制從而避免可聽偽像。
[0067] 在優(yōu)選實(shí)施例中,該經(jīng)解碼的低頻帶信號經(jīng)歷變換步驟或基于濾波器組的子頻帶 分解步驟,該提取步驟和該組合步驟然后在該頻率或子頻帶域中執(zhí)行。
[0068] 在頻域中實(shí)現(xiàn)頻帶擴(kuò)展使得有可能獲得使用時間方法不可獲得的頻率分析的細(xì) 度,并且使得有可能還使頻率分辨率足以檢測這些音調(diào)分量。
[0069] 在詳細(xì)的實(shí)施例中,經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號是根據(jù)以下方程獲得的: 0 k ~ 0,* ? *. 199
[0070] U二 < UA = 200,….,239 U\k f start hand - 240) k - 240, -*-,319
[0071] 其中,k是樣本索引,U(k)是在變換步驟之后獲得的信號的頻譜,UHB1(k)是該經(jīng)擴(kuò) 展的信號的頻譜,且Start_band是預(yù)定義的變量。
[0072] 因此,此函數(shù)包括通過將樣本添加到此信號的頻譜中對信號進(jìn)行重采樣。然而,擴(kuò) 展信號的其他方式是可能的,例如通過子頻帶處理的平移。
[0073] 本發(fā)明還設(shè)想了一種用于擴(kuò)展音頻信號的頻帶的裝置,該信號已經(jīng)在被稱為低頻 帶的第一頻帶中被解碼。該裝置如此使得其包括:
[0074] -用于基于由該經(jīng)解碼的低頻帶信號產(chǎn)生的信號提取音調(diào)分量和環(huán)境信號的模 塊;
[0075] -用于使用多個能量水平控制因子通過自適應(yīng)混合對這些音調(diào)分量和該環(huán)境信號 進(jìn)行組合以獲得被稱為組合信號的音頻信號的模塊;
[0076] -用于擴(kuò)展到高于該第一頻帶的至少一個第二頻帶上、并且在該提取模塊之前在 該低頻帶解碼信號上或在該組合模塊之后在該組合信號上實(shí)現(xiàn)的模塊。
[0077] 這種裝置展現(xiàn)了與其所實(shí)現(xiàn)的前述方法相同的優(yōu)點(diǎn)。
[0078] 本發(fā)明的目標(biāo)在于一種包括所述裝置的解碼器。
[0079]本發(fā)明的目標(biāo)在于一種包括代碼指令的計(jì)算機(jī)程序,當(dāng)由處理器執(zhí)行這些指令 時,這些代碼指令用于實(shí)現(xiàn)所述的頻帶擴(kuò)展方法的步驟。
[0080] 最后,本發(fā)明涉及一種存儲介質(zhì),該存儲介質(zhì)可由處理器讀取、合并或不合并在頻 帶擴(kuò)展裝置中、可能是可移除的、存儲用于實(shí)現(xiàn)先前所描述的頻帶擴(kuò)展方法的計(jì)算機(jī)程序。
【附圖說明】
[0081] 通過閱讀以下僅作為非限制性示例給出并且參照這些附圖所作出的描述,本發(fā)明 的其他特征和優(yōu)點(diǎn)將變得更清晰明顯,其中:
[0082] -圖1展示了實(shí)現(xiàn)現(xiàn)有技術(shù)的頻帶擴(kuò)展步驟并且如之前所述的AMR-WB類型的解碼 器的一部分;
[0083]-圖2展示了根據(jù)現(xiàn)有技術(shù)并且如先前所描述的一種16kHz G.718-LD可互操作類 型的解碼器;
[0084] -圖3展示了根據(jù)本發(fā)明的實(shí)施例的一種可與AMR-WB編碼互操作的、合并頻帶擴(kuò)展 裝置的解碼器;
[0085] -圖4以流程圖的形式展示了根據(jù)本發(fā)明的實(shí)施例的頻帶擴(kuò)展方法的主要步驟;
[0086] -圖5展示了根據(jù)本發(fā)明的整合到解碼器中的頻帶擴(kuò)展裝置在頻域中的實(shí)施例;并 且
[0087] -圖6展示了根據(jù)本發(fā)明的頻帶擴(kuò)展裝置的硬件實(shí)現(xiàn)。
【具體實(shí)施方式】
[0088] 圖3展示了可與AMR-WB/G. 722.2標(biāo)準(zhǔn)相容的示例性解碼器,在該標(biāo)準(zhǔn)中,存在與在 G.718中介紹的并且參照圖2描述的后處理類似的后處理以及根據(jù)本發(fā)明的擴(kuò)展方法的、由 框309所展示的頻帶擴(kuò)展裝置實(shí)現(xiàn)的改進(jìn)的頻帶擴(kuò)展。
[0089] 不像以16kHz輸出采樣頻率進(jìn)行操作的AMR-WB解碼和以8kHz或16kHz操作的G. 718 解碼器,在此考慮可以通過使用€8 = 8紐2、16紐2、32紐2或48紐2的頻率的輸出(合成)信號 進(jìn)行操作的解碼器。注意到,在此假設(shè)的是,已經(jīng)根據(jù)AMR-WB算法執(zhí)行編碼,其中,12.8kHz 的內(nèi)部頻率用于低頻帶CELP編碼,并且在23.85kbi t/s下,子幀增益編碼的頻率為16kHz,但 是AMR-WB編碼器的可互操作的變體也是可能的;雖然本發(fā)明在此是在解碼層級上進(jìn)行描述 的,但在此假設(shè)的是,編碼還可以用€8 = 81^、161^、321^或481^頻率的輸入信號進(jìn)行操 作,并且根據(jù)fs的值對編碼實(shí)現(xiàn)超出本
【發(fā)明內(nèi)容】
的合適的重采樣操作??梢宰⒁獾?,當(dāng)在解 碼器f s = 8kHz時,在與AMR-WB相容的解碼的情況下,不需要擴(kuò)展OkHz-6.4kHz低頻帶,因?yàn)?以頻率fs重建的音頻帶被限制于0Hz-4000Hz。
[0090] 在圖3中,CELP解碼(低頻LF)如在AMR-WB和G .718中那樣仍然以12.8kHz的內(nèi)部頻 率進(jìn)行操作,而作為本發(fā)明主題的頻帶擴(kuò)展(高頻HF)以16kHz的頻率進(jìn)行操作,并且在合適 的重采樣(框307和框311)之后以頻率fs將LF合成與HF合成進(jìn)行組合(框312)。在本發(fā)明的 變體中,可以在已經(jīng)對從12.8kHz到16kHz的低頻帶進(jìn)行重采樣之后、以頻率fs對組合信號 進(jìn)行重采樣之前以16kHz將低頻帶與高頻帶進(jìn)行組合。
[0091] 根據(jù)圖3的解碼取決于與所接收到的當(dāng)前幀相關(guān)聯(lián)的AMR-WB模式(或比特率)。作 為指示并且在不影響框309的情況下,在低頻帶中對CELP部分進(jìn)行解碼包括以下步驟: [0092] ?在正確接收到幀的情況下(bfi=0,其中,bfi是"壞幀指示符",對于所接收到的 幀的值為〇并且對于丟失幀的值為1),對這些編碼的參數(shù)進(jìn)行解復(fù)用(框300);
[0093] ?如在標(biāo)準(zhǔn)G.722.2的條款6.1中所描述的,通過內(nèi)插以及轉(zhuǎn)換成LPC系數(shù)對ISF參 數(shù)進(jìn)行解碼(框301);
[0094] ?通過用于以12.8kHz在每個長度為64的子幀中重建激勵(exc或u'(n))的自適應(yīng) 和固定部分對CELP激勵進(jìn)行解碼(框302):
[0095] u\n)?g} v(a)4-g.cin) ^ n = 63
[0096] 通過遵循G. 718第7.1.2.1條的符號,就CELP解碼而言,其中,v (n)和c (n)分別是自 適應(yīng)詞典和固定詞典的碼字,并且^和4是相關(guān)聯(lián)的解碼增益。在下一個子幀的自適應(yīng)詞 典中使用此激勵u'(n);然后,對該激勵進(jìn)行后處理,并且,按照G.718,將激勵u'(n)(也被表 示為exc)與其經(jīng)修改的后處理版本u(n)(也被表示為exc2)區(qū)別開來,該后處理版本充當(dāng)在 框303中的合成濾波器的輸入。在可實(shí)現(xiàn)用于本發(fā)明的變體中,在不影響根據(jù)本發(fā)明 的頻帶擴(kuò)展方法的性質(zhì)的情況下,可以對應(yīng)用于激勵的后處理操作進(jìn)行修改(例如,可以增 強(qiáng)相分散),或者可以對這些后處理操作進(jìn)行擴(kuò)展(例如,可以實(shí)現(xiàn)交叉諧波噪聲的降低);
[0097] ?通過1/i⑵進(jìn)行合成濾波(框303),其中,解碼的LPC濾波器i(z)具有為16的階 數(shù);
[0098] ?如果fs = 8kHz,則根據(jù)G. 718的條款7.3進(jìn)行窄帶后處理(框304);
[0099] ?通過濾波器l/(l-0.68z-4來進(jìn)行去加重(框305);
[0100] ?如在G. 718第7.14.1.1條中所描述的對低頻率進(jìn)行后處理(框306)。這種處理引 入了延遲,在對高頻帶(>6.4kHz)的解碼過程中將該延遲考慮在內(nèi);
[0101] ?以輸出頻率fs對12.8kHz的內(nèi)部頻率進(jìn)行重采樣(框307)。許多實(shí)施例是可能 的。在不失一般性的情況下,通過示例的方式在此考慮:如果fs = 8kHz或16kHz,則在此重復(fù) G. 718第7.6條中所描述的重采樣,并且如果fs = 32kHz或48kHz,則使用多個附加有限脈沖 響應(yīng)(FIR)濾波器;
[0102] ?如在G.718第7.14.3條中所描述的優(yōu)先執(zhí)行的"噪聲門"參數(shù)計(jì)算(框308)。
[0103]在可實(shí)現(xiàn)用于本發(fā)明的變體中,在不影響頻帶擴(kuò)展的性質(zhì)的情況下,可以對應(yīng)用 于激勵的后處理操作進(jìn)行修改(例如,可以增強(qiáng)相分散),或者可以對這些后處理操作進(jìn)行 擴(kuò)展(例如,可以實(shí)現(xiàn)對交叉諧波噪聲的降低)。當(dāng)在3GPP AMR-WB標(biāo)準(zhǔn)中提供信息的當(dāng)前幀 丟失(bf i = 1)時,我們在此不描述低頻帶解碼的情況;一般地,無論處理AMR-WB解碼器還是 依賴于源-濾波器模型的通用解碼器,其通常涉及最佳估算LPC激勵和LPC合成濾波器的系 數(shù)以重構(gòu)丟失的信號同時保持源-濾波器模型。當(dāng)bfi = l時,在此考慮頻帶擴(kuò)展(框309)可 以像在bfi = 0且比特率<23.85kbit/s的情況一樣操作;因此,在不失一般性的情況下,本發(fā) 明的描述隨后將假定bfi = 0。
[0104] 可以注意的是,對框306、框308、框314的使用是可選的。
[0105] 還將注意的是,上述對低頻帶的解碼采取具有在6.6kbit/s與23.85kbit/s之間的 比特率的所謂"有效"當(dāng)前幀。實(shí)際上,當(dāng)激活DTX模式時,某些幀可以被編碼成"無效的",并 且在這種情況下,有可能傳輸靜止描述符(在35個比特上)或者什么都不傳輸。具體而言,回 想起,AMR-WB編碼器的SID幀描述了若干參數(shù):在8個幀上取平均的多個ISF參數(shù)、在8個幀上 的平均能量、非平穩(wěn)噪聲的重建的"抖動標(biāo)記"。在所有情況下,對于針對當(dāng)前幀進(jìn)行激勵或 LPC濾波器的重建,在解碼器中存在與針對有效幀相同的解碼模式,這使得有可能將本發(fā)明 甚至應(yīng)用到無效幀中。同樣的情況適用于對"丟失幀"的解碼(或FEC、PLC),其中,LPC模型被 應(yīng)用。
[0106] 此示例性解碼器在激勵域內(nèi)操作并且因此包括解碼低頻帶激勵信號的步驟。在本 發(fā)明含義內(nèi)的頻帶擴(kuò)展裝置和頻帶擴(kuò)展方法還在與激勵域不同的域內(nèi)操作并且具體地使 用低頻帶解碼直接信號或由感知濾波器加權(quán)的信號操作。
[0107] 不像AMR-WB或G. 718解碼,所描述的解碼器使得有可能將經(jīng)解碼的低頻帶(50HZ-6400Hz,將解碼器上的50Hz高通濾波考慮在內(nèi),一般情況下為0Hz-6400Hz)擴(kuò)展至經(jīng)擴(kuò)展的 頻帶,該經(jīng)擴(kuò)展的頻帶的寬度根據(jù)在當(dāng)前幀中所實(shí)現(xiàn)的模式大致從50Hz-6900Hz至50Hz-7700Hz范圍內(nèi)變化。從而,其有可能指0Hz至6400Hz的第一頻帶以及6400Hz至8000Hz的第二 頻帶。實(shí)際上,在有利實(shí)施例中,針對高頻率并且在從5000Hz至8000Hz的頻帶中的頻域內(nèi)生 成的激勵允許寬度為6000Hz至6900Hz或至7700Hz的帶通濾波,其斜率在被拒的上頻帶中不 是太陡。
[0108]在表示根據(jù)本發(fā)明的并且在一個實(shí)施例中在圖5中詳細(xì)描述的頻帶擴(kuò)展裝置的框 309中產(chǎn)生高頻帶合成部分。
[0109] 為了對準(zhǔn)經(jīng)解碼的低頻帶和高頻帶,引入延遲(框310)以使框306和框309的輸出 同步并且從16kHz到頻率fs(框311的輸出)對以16kHz合成的高頻帶進(jìn)行重采樣。將必須根 據(jù)所實(shí)現(xiàn)的處理操作針對其他情況(fs = 32,48kHz)對延遲T的值進(jìn)行適配。將回想起,當(dāng)fs = 8kHz時,不必應(yīng)用框309至框311,因?yàn)樵诮獯a器的輸出端處的信號的頻帶被限制于0Hz-4000Hz。
[0110]將注意,根據(jù)第一實(shí)施例在框309中實(shí)現(xiàn)的本發(fā)明的擴(kuò)展方法相對于以12.8kHz重 建的低頻帶優(yōu)選地不引入任何附加的延遲;然而,在本發(fā)明的變體中(例如,通過重疊的時 間/頻率變換),將能夠引入延遲。從而,通常,將需要根據(jù)具體的實(shí)現(xiàn)方式必須調(diào)整框310中 的T值。例如,在低頻后處理(框306)不被使用的情況中,針對fs = 16kHz有待引入的延遲可 以固定為T = 15。
[0111] 然后,在框312中對低頻帶和高頻帶進(jìn)行組合(相加),并且所獲得的合成由2階的 (IIR類型的)50Hz高通濾波進(jìn)行后處理,該濾波的系數(shù)取決于頻率fs(框313),并且以類似 于G.718的方式通過可選地應(yīng)用"噪聲門"來進(jìn)行輸出后處理(框314)。
[0112] 由根據(jù)圖5的解碼器的實(shí)施例的框309展示的根據(jù)本發(fā)明的頻帶擴(kuò)展裝置實(shí)現(xiàn)了 現(xiàn)在參照圖4描述的頻帶擴(kuò)展方法(在廣泛的含義上)。
[0113] 此擴(kuò)展裝置還可以獨(dú)立于解碼器,并且可以實(shí)現(xiàn)在圖4中描述的、用于通過分析音 頻信號以從其中提取例如激勵和LPC濾波器來對存儲至或傳輸至該裝置的現(xiàn)有音頻信號進(jìn) 行頻帶擴(kuò)展的方法。
[0114] 此裝置接收在被稱為低頻帶u(n)的第一頻帶中解碼的信號作為輸入,這可以是在 激勵域或在那個信號的域中。在此處描述的實(shí)施例中,通過時間頻率變換或?yàn)V波器組實(shí)現(xiàn) 的子頻帶分解步驟(E401b)應(yīng)用于低頻帶解碼信號以獲得低頻帶解碼信號的頻譜U(k)從而 在頻域中實(shí)現(xiàn)。
[0115] 在高于第一頻帶的第二頻帶中擴(kuò)展低頻帶解碼信號以獲得經(jīng)擴(kuò)展的低頻帶解碼 信號UHB1(k)的步驟E401a可以在分析步驟(分解成子頻帶)之前或之后在此低頻帶解碼信號 上執(zhí)行。此擴(kuò)展步驟可以包括在同一個時間的重采樣步驟和擴(kuò)展步驟或者根據(jù)在輸入端獲 得信號僅包括頻率平移或換位步驟。將注意的是,在變體中,將能夠在圖4中描述的處理結(jié) 束時(也就是說,在組合信號上)執(zhí)行步驟E401a,然后在擴(kuò)展之前主要在低頻帶信號上執(zhí)行 此處理,結(jié)果是等效的。
[0116] 隨后在參照圖5的實(shí)施例中詳細(xì)描述這個步驟。
[0117] 所述提取環(huán)境信號(UHBA(k))和音調(diào)分量(y(k))的步驟E402是基于經(jīng)解碼的低頻 帶信號(U(k))或經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號(U HB1(k))執(zhí)行的。環(huán)境在此被定義為殘差信 號,該殘差信號是通過從現(xiàn)有信號中刪除主要的(或主)諧波(或音調(diào)分量)獲得的。
[0118]在大多數(shù)寬帶信號中(以16kHz采樣),高頻帶(>6kHz)包含環(huán)境信息,該環(huán)境信息 通常類似于存在于低頻帶中的環(huán)境信息。
[0119] 所述提取音調(diào)分量和環(huán)境信號的步驟例如包括以下步驟:
[0120] -在頻域中檢測該經(jīng)解碼的(或經(jīng)解碼且經(jīng)擴(kuò)展的)低頻帶信號的主音調(diào)分量;并 且
[0121] -通過提取這些主音調(diào)分量計(jì)算殘差信號以獲得該環(huán)境信號。
[0122] 這個步驟還可以是通過以下各項(xiàng)獲得的:
[0123] -通過計(jì)算該經(jīng)解碼的(或經(jīng)解碼且經(jīng)擴(kuò)展的)低頻帶信號的平均值獲得該環(huán)境信 號;并且
[0124] -通過從該經(jīng)解碼的或經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號中減去所計(jì)算的環(huán)境信號獲 得這些音調(diào)分量。
[0125] 然后,在步驟E403中在能量水平控制因子的幫助下以自適應(yīng)的方式對音調(diào)分量和 環(huán)境信號進(jìn)行組合以獲得所謂的組合信號(U HB2(k))。如果還未在經(jīng)解碼的低頻帶信號上執(zhí) 行擴(kuò)展步驟E401a,則然后可以實(shí)現(xiàn)該步驟。
[0126] 因此,組合這兩種類型的信號使得有可能獲得組合信號,該組合信號具有更適合 于某些類型的信號(如音樂信號以及在頻率內(nèi)容中和在對應(yīng)于包括第一頻帶和第二頻帶的 整個頻帶的經(jīng)擴(kuò)展的頻帶中更豐富的信號)的特點(diǎn)。
[0127] 根據(jù)該方法的頻帶擴(kuò)展相對于在AMR-WB標(biāo)準(zhǔn)中描述的擴(kuò)展改善了這種類型的信 號的品質(zhì)。
[0128] 使用環(huán)境信號與音調(diào)分量的組合使得有可能豐富此擴(kuò)展信號以便對其進(jìn)行渲染 從而更接近真實(shí)信號而非人工信號的特點(diǎn)。
[0129] 隨后將參照圖5詳細(xì)地描述這個組合步驟。
[0130]在E404b執(zhí)行對應(yīng)于在401b的分析的合成步驟從而將信號恢復(fù)至?xí)r域。
[0131] 以可選的方式,在合成步驟之前和/或之后通過應(yīng)用增益和/或通過適當(dāng)?shù)臑V波可 以在E404a執(zhí)行高頻帶信號的能量水平調(diào)整步驟。將在圖5描述的實(shí)施例中針對框501至框 507更詳細(xì)地解釋這個步驟。
[0132] 在示例性實(shí)施例中,現(xiàn)在參照圖5描述頻帶擴(kuò)展裝置500,該圖在同一時間展示了 此裝置還有適合于利用AMR-WB編碼在可互操作類型的解碼器中實(shí)現(xiàn)的處理模塊。此裝置 500實(shí)現(xiàn)了先前參照圖4描述的頻帶擴(kuò)展方法。
[0133] 因此,處理框510接收經(jīng)解碼的低頻帶信號(u(n))。在具體實(shí)施例中,頻帶擴(kuò)展使 用12.8kHz的解碼激勵(exc2或u (n))作為圖3的框302的輸出。
[0134] 此信號被子頻帶分解模塊510(該子頻帶分解模塊實(shí)現(xiàn)圖4的步驟E401b)分解成頻 率子頻帶,該子頻帶分解模塊通常執(zhí)行變換或應(yīng)用濾波器組以獲得分解成信號u(n)的子頻 帶U(k)。
[0135] 在具體實(shí)施例中,DCT-IV("離散余弦變換"--IV型)(框510)型變換應(yīng)用于20ms (256個樣本)的當(dāng)前幀(未加窗),這相當(dāng)于根據(jù)以下公式直接變換u(n),其中,n = 0,…, 255:
[0137] 其中,N=256且 k = 0,.",255。
[0138] 當(dāng)在激勵域而非信號域中執(zhí)行處理時,一種無加窗(或等效地具有幀長度的隱式 矩形窗)的變換是有可能的。在這種情況下,沒有偽像(塊效應(yīng))是可聽見的,由此構(gòu)成本發(fā) 明的這個實(shí)施例的顯著優(yōu)點(diǎn)。
[0139] 在本實(shí)施例中,DCT-IV變換是根據(jù)在D.M?張(01.21^1^)、11.1'.李(11.1'.1^)的文章 《低復(fù)雜性變換--演進(jìn)型DCT》(A Low Complexity Transform-Evolved DCT),IEEE第14 屆計(jì)算科學(xué)與工程(CSE)國際會議,2011年8月,144-149頁中所描述的所謂"演進(jìn)型DCT (EDCT)"算法通過FFT實(shí)現(xiàn)的,并且是在標(biāo)準(zhǔn)ITU-T G. 718附件B和G. 729.1附件E中實(shí)現(xiàn)的。
[0140] 在本發(fā)明的變體中,并且不失一般性地,將能夠以具有相同長度且在激勵域或在 信號域中的其他短期時間頻率變換來替代DCT-IV變換,如FFT("快速傅里葉變換")或者 DCT-II("離散余弦變換"一一類型II)。可替代地,將有可能以具有重疊相加并且具有比當(dāng) 前幀的長度更長的長度的窗口的變換來替代幀上的DCT-IV,例如,通過使用MDCT( "經(jīng)修改 的離散余弦變換")。在這種情況下,將必須根據(jù)由于通過此變換進(jìn)行的分析/合成所導(dǎo)致的 附加延遲來適當(dāng)?shù)卣{(diào)整(減小)在圖3的框310中的延遲T。
[0141] 在另一個實(shí)施例中,通過應(yīng)用例如PQMF(偽QMF)型實(shí)數(shù)或復(fù)數(shù)濾波器組執(zhí)行子頻 帶分解。針對某些濾波器組,在給定幀中針對每個子頻帶,獲得的不是頻譜值而是與子頻帶 相關(guān)聯(lián)的一系列時間值;在這種情況下,可以通過執(zhí)行例如每個子頻帶的變換并且通過在 絕對值域中計(jì)算環(huán)境信號來應(yīng)用本發(fā)明中有利的實(shí)施例,音調(diào)分量仍然是通過信號(以絕 對值計(jì))與環(huán)境信號之間的差異獲得的。在復(fù)數(shù)濾波器組的情況下,樣本的復(fù)數(shù)模量將取代 絕對值。
[0142] 在其他實(shí)施例中,本發(fā)明將被應(yīng)用于使用兩個子頻帶的系統(tǒng),低頻帶通過變換或 通過濾波器組被分析。
[0143] 在DCT的情況中,覆蓋頻帶0Hz-6400Hz的256個樣本(以12.8詘2)的0(:1'頻譜1](1〇然 后被擴(kuò)展(框511)成覆蓋頻帶0Hz-8000Hz的320個樣本(以16kHz)的頻譜,形式如下: '0 A- -(),? ,199
[0144] Vim(k) = YJ(k) /t= 200, ??,239 U(k -f start _hand -240) k = 240,?,319
[0145] 其中,優(yōu)先取start_band = 160〇
[0146] 框511實(shí)現(xiàn)圖4的步驟E401a,也就是說,實(shí)現(xiàn)低頻帶解碼信號的擴(kuò)展。此步驟還可 以包括通過向頻譜添加1 /4的樣本(k = 240,…,319)來在頻域中執(zhí)行從12.8kHz到16kHz的 重采樣,16與12.8的比值為5/4。
[0147] 在對應(yīng)于范圍從索引200至239的樣本的頻帶中,原始頻譜被保留,以能夠在此頻 帶中向其應(yīng)用高通濾波器的漸進(jìn)式衰減響應(yīng)并且還不向?qū)⒌皖l合成添加至高頻合成的步 驟中引入可聽缺陷。
[0148] 將注意的是,在此實(shí)施例中,生成過采樣的或經(jīng)擴(kuò)展的頻譜是在從5kHz至8kHz范 圍上的頻帶(因此包括高于第一頻帶(0kHz-6.4kHz)的第二頻帶(6.4kHz-8kHz))中執(zhí)行的。
[0149] 從而,至少在第二頻帶上而且還在第一頻帶的一部分上執(zhí)行經(jīng)解碼的低頻帶信號 的擴(kuò)展。
[0150]顯然,定義這些頻帶的值可以根據(jù)本發(fā)明所應(yīng)用于其中的解碼器或處理裝置而不 同。
[0151] 此外,因?yàn)閁HBi(k)的前200個樣本被設(shè)為零,框511在0Hz-5000Hz頻帶中執(zhí)行隱式 高通濾波。如稍后所解釋的,還可以通過在5000Hz-6400Hz頻帶中索引為k = 200,…,255的 頻譜值的漸進(jìn)式衰減的一部分來補(bǔ)足此高通濾波;這種漸進(jìn)式衰減是在框501中實(shí)現(xiàn)的,但 可以在框501外部被單獨(dú)地執(zhí)行。等效地,并且在本發(fā)明的變體中,將因此能夠在單個步驟 中執(zhí)行實(shí)現(xiàn)在索引為k = 0,…,199的系數(shù)被設(shè)為零的多個框中進(jìn)行的高通濾波、衰減在變 換域中的系數(shù)k = 200,…,255。
[0152] 在本示例性實(shí)施例中并且根據(jù)UHB1(k)的定義,將注意的是,UHB1(k)的5000Hz-6000Hz頻帶(其對應(yīng)于索引k = 200,.",239)是從U(k)的5000Hz-6000Hz頻帶復(fù)制過來的。這 種方式使得有可能在對HF合成與LF合成進(jìn)行相加時將原始頻譜保持在此頻帶中并且避免 在5000Hz-6000Hz頻帶中引入失真--具體地,在此頻帶中信號的相(隱含地表示在DCT-IV 域中)被保留。
[0153] 在此,因?yàn)閟tart_band的值被優(yōu)先設(shè)置為160,所以通過復(fù)制U(k)的4000Hz-6000Hz 頻帶來定義 Umi(k)的 6000Hz-8000Hz 頻帶。
[0154] 在實(shí)施例的變體中,在不改變本發(fā)明的性質(zhì)的情況下,將能夠使start_band的值 圍繞值160為自適應(yīng)的。在此不對start_band值的自適應(yīng)細(xì)節(jié)進(jìn)行描述,因?yàn)樗鼈兂隽吮?發(fā)明的框架但是不改變其范圍。
[0155] 在大多數(shù)寬帶信號中(以16kHz采樣的),高頻帶(>6kHz)包含環(huán)境信息,該環(huán)境信 息本質(zhì)上類似于存在于低頻帶中的環(huán)境信息。環(huán)境在此被定義為殘差信號,該殘差信號是 通過從現(xiàn)有信號中刪除主要的(或主)諧波獲得的。在6000Hz-8000Hz頻帶中的調(diào)諧性水平 通常與低頻帶的調(diào)諧性水平相關(guān)聯(lián)。
[0156] 這種經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號被提供作為擴(kuò)展裝置500的輸入并且具體地作 為模塊512的輸入。因此,用于提取音調(diào)分量和環(huán)境信號的框512在頻域中實(shí)現(xiàn)了圖4的步驟 E402。因此針對第二頻帶(所謂的高頻)獲得環(huán)境信號(UHBA(k),其中,k = 240,…,319) (80個 樣本),以便隨后在組合框513中以自適應(yīng)的方式將其與所提取的音調(diào)分量y(k)進(jìn)行組合。
[0157] 在具體實(shí)施例中,提取這些音調(diào)分量和該環(huán)境信號(在6000-8000HZ頻帶中)是根 據(jù)以下操作執(zhí)行的:
[0158] ?計(jì)算經(jīng)擴(kuò)展的解碼低頻帶信號的總能量enerm: 319
[0159] enerm = + s A--240
[0160] 其中,e=0.1(此值可以是不同的,舉例來講,其在此是固定的)。
[0161] ?(逐頻譜線地)計(jì)算在此對應(yīng)于頻譜的平均水平lev(i)的環(huán)境(以絕對值計(jì))并 且(在高頻頻譜中)計(jì)算主音調(diào)分量的能量enert_i
[0162] 其中,i = 0...L-l,此平均值是通過以下等式獲得的:
[0164] 這對應(yīng)于平均水平(以絕對值)并因此代表了頻譜包絡(luò)的類別。在此實(shí)施例中,L = 80且表示頻譜的長度并且從0至L-1的索引i對應(yīng)于從240至319的索引j+240,即,從6kHz至 8kHz的頻譜。
[0165] 通常,fb(i) = i-7且fn(i) = i+7,然而,前7個索引和后7個索引(i = 0,…,6和i = L-7,…,L-1)需要特殊的處理并且不失一般性地我們?nèi)缓蠖x:
[0166] fb(i) = 0且fn(i) = i+7,其中,i = 0,…,6
[0167] fb(i) = i_7且fn(i) = L_1,其中,i = L_7,???,L_1
[0168] 在本發(fā)明的變體中,平均值| UHB1 (j+240) |,j = fb(i),. . .,fn(i)可以由在相同值 集上的中間值替換,即,
[0169] lev(i)=medianj=fb(i),...,fn(i)( |Uhbi( j+240) | )此變體具有比滑動平均值更復(fù)雜 (在計(jì)算量方面)的缺點(diǎn)。在其他變體中,非均勻加權(quán)可以應(yīng)用于這些平均項(xiàng),或者中值濾波 可以例如用"層疊濾波器"類型的其他非線性濾波器替換。
[0170]還計(jì)算殘差信號:
[0171 ] y(i) = | Uhbi(i+240) | -lev(i), i = 0, . . . ,L~1
[0172] 如果值y(i)在給定的頻譜線i處為正(y(i)>0),則該殘差信號(大致)對應(yīng)于音調(diào) 分量。
[0173] 此計(jì)算因此涉及隱式檢測音調(diào)分量。在代表自適應(yīng)閾值的中間項(xiàng)y(i)的幫助下, 這些音調(diào)分量因此被隱式檢測到。檢測條件為y(i)>〇。在本發(fā)明的變體中,可以例如通過根 據(jù)信號的局部包絡(luò)定義自適應(yīng)閾值或以形式y(tǒng) (i) > lev( i )+xdB,其中,x具有預(yù)定義的值(例 如,x = 10dB)來改變此條件。
[0174]主音調(diào)分量的能量是由以下方程式定義的:
[0175] 徵Z KL.7|y(i:)i>0
[0176] 當(dāng)然可以設(shè)想用于提取環(huán)境信號的其他方案。例如,此環(huán)境信號可以是從低頻率 信號或可選地另一個頻帶(或若干頻帶)中提取的。
[0177] 音調(diào)尖峰或音調(diào)分量的檢測可以以不同方式完成。
[0178] 還可以在經(jīng)解碼的但未經(jīng)擴(kuò)展的激勵上(也就是說,在頻譜擴(kuò)展或平移步驟之前, 也就是說,例如在低頻率信號的一部分上而不是直接在高頻率信號上)完成此環(huán)境信號的 提取。
[0179] 在變體實(shí)施例,提取這些音調(diào)分量和該環(huán)境信號是按不同的順序并且根據(jù)以下步 驟執(zhí)行的:
[0180] -在頻域中檢測該經(jīng)解碼的或經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號的主音調(diào)分量;
[0181] -通過提取這些主音調(diào)分量計(jì)算殘差信號以獲得該環(huán)境信號。
[0182] 此變體可以例如以如下方式執(zhí)行:尖峰(或音調(diào)分量)在幅度為| Uhbi(i+240) |的頻 譜中在索引為i的頻譜線處被檢測到,前提是滿足以下標(biāo)準(zhǔn):
[0183] |UHBi(i+240) |>|UHBi(i+240-l) | 且 |UHBi(i+240) |>|UHBi(i+240+l) |,
[0184] 其中,i = 0, ...,L_1。一旦在索引為i的頻譜線處檢測到尖峰,就應(yīng)用正弦模型來 估算與此尖峰相關(guān)聯(lián)的音調(diào)分量的幅度、頻率以及可選地相位參數(shù)。在此不介紹此估算的 細(xì)節(jié),但是頻率估算通??梢砸笤?個點(diǎn)上的拋物線插值以便定位拋物線逼近3個幅度點(diǎn) |Uhbi(i+240) | (表不為dB)的最大值,幅度估算是通過這種相同的插值法獲得的。因?yàn)樵诖?使用的變換域(DCT-IV)并未使得有可能直接獲得相位,所以在一個實(shí)施例中將有可能忽略 此項(xiàng),但是在變體中將有可能應(yīng)用DST型正交變換來估算相位項(xiàng)。y(i)的初始值被設(shè)置為 零,其中,i = 0,. . .,L-1。估算每個音調(diào)分量的正弦參數(shù)(頻率、幅度以及可選地相位),然后 根據(jù)估算的正弦參數(shù)將項(xiàng)y(i)計(jì)算為被轉(zhuǎn)換到DCT-IV±或(或者在使用某個其他子頻帶分解 時的其他域)中的純正弦曲線的預(yù)定義的原型(頻譜)之和。最后,絕對值應(yīng)用于項(xiàng)y(i)以將 幅值譜域表達(dá)為絕對值。
[0185] 用于確定音調(diào)分量的其他方案是有可能的,例如,還將有可能通過|UHB1(i+240) 的局部最大值(檢測到的尖峰)的樣條插值計(jì)算信號的包絡(luò)env(i),以將此包絡(luò)降低某個dB 級別以便檢測作為超過此包絡(luò)的尖峰并將y(i)定義為
[0186] y(i) =max( | Uhbi(i+240) | -env(i) ,0)
[0187] 在這個變體中,環(huán)境因此是通過下方程獲得的:
[0188] lev(i) = |Uhbi(i+240) |-y(i),i = 0,... ,L~1
[0189] 在本發(fā)明的其他變體中,在不改變本發(fā)明的原理的情況下,頻譜值的絕對值將例 如被頻譜的平方值替換;在這種情況下,為了返回至信號域,平方根將是必要的,這執(zhí)行起 來會更復(fù)雜。
[0190] 組合模塊513通過環(huán)境信號與音調(diào)分量的自適應(yīng)混合執(zhí)行組合步驟。因此,環(huán)境水 平控制因子F是由以下方程定義的:
[0192] 0是因子,在下文給出了其示例性計(jì)算。
[0193] 為了獲得經(jīng)擴(kuò)展的信號,我們首先獲得絕對值形式的組合信號,其中,i = 0...L-1:
[0195] 針對其應(yīng)用符號UHBi(k):
[0196] y"(i) = sgn(UHBi(i+240)) .y,(i)
[0197] 其中,函數(shù)sgn(.)給出符號: ,f 1 A->()
[0198] sgn(.x)二-【
[0199] 根據(jù)定義,因子r>l。音調(diào)分量、由頻譜線根據(jù)條件y(i)>〇檢測的頻譜線被減小因 子r ;平均水平被放大因子i/r倍。
[0200] 在自適應(yīng)混合框513中,根據(jù)經(jīng)解碼的(或經(jīng)解碼且經(jīng)擴(kuò)展的)低頻帶信號與音調(diào) 分量的總能量計(jì)算能量水平控制因子。
[0201] 在自適應(yīng)混合的優(yōu)選實(shí)施例中,按以下方式執(zhí)行能量調(diào)整:
[0202] UHB2(k) =fac.y"(k_240),k = 240,…,319
[0203] UHB2(k)是頻帶擴(kuò)展組合信號。
[0204] 調(diào)整因子是由以下方程定義的:
[0206]其中,Y使得有可能避免過高估算能量。在示例性實(shí)施例中,計(jì)算0以便在信號的 連續(xù)頻帶中相對于音調(diào)分量的能量保持相同水平的環(huán)境信號。計(jì)算以下三個頻帶中的音調(diào) 分量的能量:2000-4000Hz、4000-6000HZ 和6000-8000HZ,其中,
[0207] ^\;4= X ^ 人-eN(糾,154
[0208] I
[0209] ^:4-6 ~ X ^ ' (^) A^N(240,31^i
[0210] 其中,
[0212] 并且其中,N(lu,k2)是索引k的集合,針對該集合,索引k的系數(shù)被分類為與音調(diào)分 量相關(guān)聯(lián)。此集合可以例如是通過檢查U'(k)中的滿足|U'(k)|>lev(k)的局部尖峰而獲得 的,或者lev(k)逐頻譜線地被計(jì)算為頻譜的平均水平。
[0213] 可以注意的是,用于計(jì)算音調(diào)分量的能量的其他方案是有可能的,例如通過在所 考慮的頻帶上取頻譜的中值。
[0214] 我們以這種方式固定0,從而使得在4kHz-6kHz頻帶與6kHz-8kHz頻帶中的音調(diào)分 量能量之比與在2kHz-4kHz頻帶與4kHz-6kHz頻帶中的音調(diào)分量能量之比相同:
[0216] 其中
[0218] 并且max(.,.)是給出兩個參數(shù)的最大值的函數(shù)。
[0219] 在本發(fā)明的變體中,計(jì)算0可以由其他方案替代。例如,在一個變體中,將有可能提 取(計(jì)算)表征低頻帶信號的不同參數(shù)(或"特征"),包括與在AMR-WB編解碼器中所計(jì)算的參 數(shù)相類似的"傾斜度"參數(shù),并且將通過將其值限制在〇與1之間基于這些不同的參數(shù)根據(jù)線 性回歸來估算因子0。例如,將能夠通過在學(xué)習(xí)的基礎(chǔ)中得出原始高頻帶來估算因子0從而 以監(jiān)督的方式來估算線性回歸。將注意的是,計(jì)算邱勺方式并不限制本發(fā)明的性質(zhì)。
[0220] 然后,可以通過考慮以下事實(shí)使用參數(shù)0來計(jì)算y :信號與環(huán)境信號一起被添加至 給定的頻帶中通常被感知為強(qiáng)于在同一頻帶中具有相同能量的諧波信號。如果將a定義為 添加至諧波信號中的環(huán)境信號的量:
[0221] & = U
[0222] 將有可能將y計(jì)算為a的減函數(shù),例如,= A - 、b= 1. l、a=l .2和y被限制為 從0.3到1。再次,在本發(fā)明的框架內(nèi),a和Y的其他定義是有可能的。
[0223]在頻帶擴(kuò)展裝置500的輸出處,框501在具體實(shí)施例中以可選的方式在頻域中執(zhí)行 應(yīng)用帶通濾波器頻率響應(yīng)和去加重(或解加重)濾波的雙操作。
[0224] 在本發(fā)明的變體中,在框502之后(甚至在框510之前),將能夠在時域中執(zhí)行去加 重濾波。然而,在這種情況下,在框501中所執(zhí)行的帶通濾波可以留下某些非常低電平的低 頻分量,這些低頻分量通過去加重而被放大,這可以以一種輕微可感知的方式來修改經(jīng)解 碼的低頻帶。出于這種原因,在此優(yōu)選在頻域中執(zhí)行去加重。在優(yōu)選實(shí)施例中,索引為k = 0,…,199的這些系數(shù)被設(shè)為零,因此,去加重被限制在更高階的系數(shù)中。
[0225] 根據(jù)以下方程,首先對激勵進(jìn)行去加重: 0 k =0,???, 199
[0226] Um2 Gdeemph(k - 200)Umz(k) k = 200,? ? ?,255 G^npl,(55)UHB2(k) (二 256,…,319
[0227] 其中,Gdee_h(k)是濾波器l/(l-0.68廠4在受限的離散頻帶之上的頻率響應(yīng)。通過 將DCT-IV的離散(奇數(shù))頻率考慮在內(nèi),Gd ee?Ph(k)在此被定義為:
[0229]其中,
[0231]在使用除了DCT-IV之外的變換的情況下,將能夠?qū)?k的定義進(jìn)行調(diào)整(例如,針對 偶數(shù)頻率)。
[0232] 應(yīng)注意的是,去加重被應(yīng)用于兩個階段中:針對對應(yīng)于5000Hz_6400Hz頻帶的k = 200,…,255,其中,如在12.8kHz上那樣應(yīng)用響應(yīng)1/(1-0.68z-4 ;以及針對對應(yīng)于6400Hz-8000Hz頻帶的k = 256,…,319,其中,該響應(yīng)從這里的16kHz擴(kuò)展至在6.4kHz-8kHz頻帶中的 常數(shù)值。
[0233] 可以注意的是,在AMR-WB編解碼器中,未對HF合成進(jìn)彳丁去加重。
[0234] 在這里所呈現(xiàn)的實(shí)施例中,相反地,對高頻信號進(jìn)行去加重以便在退出圖3的框 305之后將其恢復(fù)至與低頻信號(OkHz-6.4kHz)相一致的域中。這對于對HF合成的能量進(jìn)行 估算以及調(diào)整來說是很重要的。
[0235] 在本實(shí)施例的一個變體中,為了減小復(fù)雜度,將有可能通過取例如Gdee_h(k) = 0.6 來將Gdeemph(k)設(shè)為與k無關(guān)的常數(shù)值,該常數(shù)值近似地對應(yīng)于在以上所描述的實(shí)施例的條 件中Gdeem Ph(k)對于k = 200,…,319的平均值。
[0236] 在解碼器的實(shí)施例的另一個變體中,在逆DCT之后將能夠在時域中以一種等效的 方式執(zhí)行去加重。
[0237] 除了去加重,帶通濾波與兩個單獨(dú)的部分一起被應(yīng)用:其一,固定的高通部分;其 二,自適應(yīng)的(比特率的函數(shù))低通部分。
[0238] 這種濾波是在頻域中執(zhí)行的。
[0239] 在優(yōu)選實(shí)施例中,在頻域中按照下式計(jì)算低通濾波器部分響應(yīng):
[0241] 其中,NiP = 60(在 6.6kbit/s上)、40(在 8.85kbit/s上)和20(在比特率 >8.85bit/s 上)。
[0242] 然后,以以下形式應(yīng)用帶通濾波器: 0 /,:=(), ???,199 G,Jk-2Q0)Uu;ik) /?:二? 200,…,255 服,W Uimi \k) k = 25D9-N、 Glp(k-320- Nlp)UHB2 \k) k = 320-Nlp,---,3\9 [0244]例如,在以下的表1中給出對Ghp(k),k = 0,…,55的定義。
[0247] 表 1
[0248] 將注意的是,在本發(fā)明的變體中,將能夠在保持漸進(jìn)式衰減的同時修改GhP (k)的 值。類似地,在不改變此濾波步驟的原理的情況下,將能夠用不同的值或者頻率支持來對具 有可變帶寬的低通濾波器G lp(k)進(jìn)行調(diào)整。
[0249] 還將注意的是,將能夠通過定義組合了高通濾波與低通濾波的單個濾波步驟來適 配帶通濾波。
[0250] 在另一個實(shí)施例中,在逆DCT步驟之后,將能夠根據(jù)比特率用不同的濾波系數(shù)在時 域中以等效的方式執(zhí)行帶通濾波(如在圖1的框112中那樣)。然而,將注意的是,有利的是在 頻域中直接執(zhí)行此步驟,因?yàn)樵摓V波是在LPC激勵域中執(zhí)行的,并且因此在此域中循環(huán)卷積 和邊緣效應(yīng)的問題是非常有限的。
[0251] 逆變換框502對320個樣本執(zhí)行逆DCT以找到以16kHz采樣的高頻信號。除了變換長 度是320而不是256,該逆變換框的實(shí)現(xiàn)方式與框510完全一樣(因?yàn)镈CT-IV是歸一化正交 的),并且得到下式:
[0253]其中,N16k = 320且 k = 0,.",319。
[0254]在框510不是DCT而是某個其他變換或變?yōu)樽宇l帶的分解的情況下,框502執(zhí)行與 在框510中執(zhí)行的分析相對應(yīng)的合成。
[0255]然后,以可選的方式按照80個樣本的每子幀定義的增益對以16kHz采樣的信號進(jìn) 行縮放(框504)。
[0256]在優(yōu)選實(shí)施例中,首先通過子幀的能量比來計(jì)算每子幀增益gHBi(m)(框503),從而 使得在當(dāng)前幀的索弓|m = 0、l、2或3的每子幀中:
[0262] 其中,e=0.01。每子幀增益gHB1(m)可以寫成以下形式:
[0264] 該等式表明,確保在信號uhb中的每子幀能量與每幀能量之比與在信號u(n)中的比 值相同。
[0265] 框504根據(jù)以下方程執(zhí)行對組合信號的縮放(包括在圖4的步驟E404a中):
[0266] uhb'(n)=gHBi(m)UHB(n),n = 80m,.",80(m+l)_l
[0267] 將注意的是,對框503的實(shí)現(xiàn)不同于對圖1的框101的實(shí)現(xiàn),因?yàn)槌俗訋哪芰克?平還將當(dāng)前幀的能量水平考慮在內(nèi)。這使得有可能得到每個子幀能量關(guān)于每幀能量之比。 因此,對低頻帶與高頻帶之間的能量比(或相對能量)而不是絕對能量進(jìn)行比較。
[0268] 從而,此縮放步驟使得有可能通過與在低頻帶中相同的方式在高頻帶中保持子幀 與幀之間的能量比。
[0269] 在一種可選的方式,框506然后根據(jù)以下方程執(zhí)行對信號的縮放(包括在圖4的步 驟E404a中):
[0270] uhb"(n)=gHB2(m)UHB,(n),n = 80m,.-.,80(m+l)_l
[0271] 其中,增益8冊2(111)是通過執(zhí)行41?-18編解碼器的框103、104和105從框505中獲得 的(框103的輸入是在低頻帶中解碼的激勵u(n))???05和框506對于在此根據(jù)信號的傾斜 度調(diào)整LPC合成濾波器的水平(框507)是有用的。在不改變本發(fā)明的性質(zhì)的情況下,用于計(jì) 算增益g HB2(m)的其他方案是有可能的。
[0272] 最后,通過濾波模塊507對信號UHB'(n)或uHB"(n)進(jìn)行濾波,在此可以通過看作傳 遞函數(shù)1/ ^(z/;z)(其中,在6.6kbit/s下y =0.9,并且在其他比特率下y =0.6)來進(jìn)行,由 此將濾波器的階數(shù)限制為16階。
[0273] 在一個變體中,將能夠以與針對AMR-WB解碼器的圖1的框111所描述相同的方式來 執(zhí)行此濾波,但是濾波器的階數(shù)在6.6比特率上變?yōu)?0階,這不會顯著地改變合成信號的質(zhì) 量。在另一個變體中,在已經(jīng)計(jì)算了在框507中所實(shí)現(xiàn)的濾波器的頻率響應(yīng)之后,將有可能 在頻域中執(zhí)行LPC合成濾波。
[0274] 在本發(fā)明的變體實(shí)施例中,對低頻帶(OkHz-6.4kHz)的編碼將能夠由CELP編碼器 而不是在AMR-WB中所使用的編碼器替代,如,例如,在G.718中在8kbit/s處的CELP編碼器。 不失一般性地,可以使用其他寬帶編碼器或在16kHz以上的頻率上進(jìn)行操作的編碼器,其 中,對低頻帶的編碼以在12.8kHz上的內(nèi)部頻率進(jìn)行操作。此外,當(dāng)?shù)皖l編碼器以低于原始 信號或重建信號的采樣頻率進(jìn)行操作時,本發(fā)明可以顯著地適應(yīng)于除12.8kHz之外的采樣 頻率。當(dāng)?shù)皖l帶解碼不使用線性預(yù)測時,不存在有待擴(kuò)展的激勵信號,在這種情況下,將有 可能對在當(dāng)前幀中重建的信號進(jìn)行LPC分析,并且將計(jì)算LPC激勵以便能夠應(yīng)用本發(fā)明。
[0275] 最終,在本發(fā)明的另一個變體中,在對長度320進(jìn)行變換(例如,DCT-IV)之前,例如 通過在從12.8kHz至16kHz上進(jìn)行線性內(nèi)插或三次"樣條"插值來對激勵或低頻帶信號(u (n))進(jìn)行重采樣。此變體具有更復(fù)雜的缺陷,因?yàn)殡S后在更長的長度上計(jì)算激勵或信號的 變換(DCT-IV)并且該重采樣不是在變換域中執(zhí)行的。
[0276] 此外,在本發(fā)明的變體中,估算增益(6冊^冊1(111)、8冊2(1]1)、8圓、...)所必需的所有 計(jì)算都將能夠在對數(shù)域中執(zhí)行。
[0277] 圖6表示根據(jù)本發(fā)明的頻帶擴(kuò)展裝置600的示例性物理實(shí)施例。后者可以形成音頻 信號解碼器的集成部分或者接收經(jīng)解碼或未經(jīng)解碼的音頻信號的設(shè)備項(xiàng)的集成部分。
[0278] 這種類型的裝置包括與存儲器框BM協(xié)同操作的處理器PR0C,該儲存框包括存儲設(shè) 備和/或工作存儲器MEM。
[0279] 這種裝置包括輸入模塊E,該輸入模塊能夠接收在被稱為低頻帶的第一頻帶中的 被恢復(fù)至頻域(U(k))的經(jīng)解碼的或所提取的音頻信號。這種裝置包括輸出模塊S,該輸出模 塊能夠?qū)⒃诘诙l帶(U HB2(k))中的擴(kuò)展信號傳輸至例如圖5的濾波模塊501。
[0280] 存儲器框可以有利地包括計(jì)算機(jī)程序,該計(jì)算機(jī)程序包括用于實(shí)現(xiàn)在本發(fā)明含義 內(nèi)的頻帶擴(kuò)展方法的步驟的多條代碼指令,當(dāng)這些代碼指令由處理器PR0C執(zhí)行時,并且具 體地實(shí)現(xiàn)以下步驟:從由經(jīng)解碼的低頻帶信號產(chǎn)生的信號(U(k))中提取(E402)音調(diào)分量和 環(huán)境信號、使用能量水平控制因子通過自適應(yīng)混合對音調(diào)分量(y(k))和環(huán)境信號(U HBA(k)) 進(jìn)行組合(E403)以獲得被稱為組合信號的音頻信號(UHB2(k))、在高于第一頻帶的至少一個 第二頻帶上在提取步驟之前對低頻帶解碼信號或在組合步驟之后對組合信號進(jìn)行擴(kuò)展 (E401a)〇
[0281] 通常,圖4的描述重復(fù)了這種計(jì)算機(jī)程序的算法的這些步驟。計(jì)算機(jī)程序還可以被 存儲在存儲介質(zhì)上,其可以由裝置的讀取器進(jìn)行讀取或者可以被下載到其存儲空間中。
[0282] 通常,存儲器MEM存儲實(shí)現(xiàn)該方法所必需的所有數(shù)據(jù)。
[0283] 在一個可能的實(shí)施例中,因此描述的裝置還可以包括除了根據(jù)本發(fā)明的頻帶擴(kuò)展 功能之外的低頻帶解碼功能以及例如在圖5和圖3中描述的其他處理功能。
【主權(quán)項(xiàng)】
1. 一種用于在解碼過程或改進(jìn)過程中擴(kuò)展音頻信號的頻帶的方法,該方法包括獲得在 被稱為低頻帶的第一頻帶中解碼的信號的步驟,該方法的特征在于其包括以下步驟: -從由該經(jīng)解碼的低頻帶信號產(chǎn)生的信號中提取(E402)音調(diào)分量和環(huán)境信號; -使用多個能量水平控制因子通過自適應(yīng)混合對這些音調(diào)分量和該環(huán)境信號進(jìn)行組合 (E403)以獲得被稱為組合信號的音頻信號; -在高于該第一頻帶的至少一個第二頻帶上在該提取步驟之前對該低頻帶解碼信號或 在該組合步驟之后對該組合信號進(jìn)行擴(kuò)展(E401a)。2. 如權(quán)利要求1所述的方法,其特征在于,該經(jīng)解碼的低頻帶信號是低頻帶解碼激勵信 號。3. 如權(quán)利要求1或2之一所述的方法,其特征在于,所述對這些音調(diào)分量和該環(huán)境信號 的提取是根據(jù)以下步驟執(zhí)行的: -在頻域中檢測該經(jīng)解碼的或經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號的主音調(diào)分量; -通過提取這些主音調(diào)分量計(jì)算殘差信號以獲得該環(huán)境信號。4. 如權(quán)利要求1或2之一所述的方法,其特征在于,所述對這些音調(diào)分量和該環(huán)境信號 的提取是根據(jù)以下步驟執(zhí)行的: -通過計(jì)算該經(jīng)解碼的或經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號的頻譜的平均值獲得該環(huán)境信 號; -通過從該經(jīng)解碼的或經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶信號中減去所計(jì)算的環(huán)境信號來獲得 這些音調(diào)分量。5. 如權(quán)利要求1所述的方法,其特征在于,根據(jù)該經(jīng)解碼的或經(jīng)解碼且經(jīng)擴(kuò)展的低頻帶 信號與這些音調(diào)分量的總能量計(jì)算用于該自適應(yīng)混合的能量水平控制因子。6. 如以上權(quán)利要求之一所述的方法,其特征在于,該經(jīng)解碼的低頻帶信號經(jīng)歷變換步 驟或基于濾波器組的子頻帶分解步驟,該提取步驟和該組合步驟然后在該頻域或子頻帶域 中執(zhí)行。7. 如以上權(quán)利要求之一所述的方法,其特征在于,所述擴(kuò)展該經(jīng)解碼的低頻帶信號的 步驟是根據(jù)以下方程執(zhí)行的:其中,k是樣本的索引,U(k)是在變換步驟之后獲得的該經(jīng)解碼的低頻帶信號的頻譜, Uhbi (k)是該經(jīng)擴(kuò)展的信號的頻譜,且s tart_band是預(yù)定義的變量。8. -種用于擴(kuò)展音頻信號的頻帶的裝置,該信號已經(jīng)在被稱為低頻帶的第一頻帶中被 解碼,該裝置的特征在于其包括: 用于基于由該經(jīng)解碼的低頻帶信號產(chǎn)生的信號來提取音調(diào)分量和環(huán)境信號的模塊 (512); 用于使用多個能量水平控制因子通過自適應(yīng)混合對這些音調(diào)分量和該環(huán)境信號進(jìn)行 組合以獲得被稱為組合信號的音頻信號的模塊(513); 用于擴(kuò)展到高于該第一頻帶的至少一個第二頻帶上、并且在該提取模塊之前在該低頻 帶解碼信號上或在該組合模塊之后在該組合信號上實(shí)現(xiàn)的模塊(511)。9. 一種音頻信號解碼器,其特征在于,該音頻信號解碼器包括如權(quán)利要求8所述的頻帶 擴(kuò)展裝置。10. -種包括代碼指令的計(jì)算機(jī)程序,當(dāng)這些指令由處理器執(zhí)行時,這些指令用于實(shí)現(xiàn) 如權(quán)利要求1至7之一所述的頻帶擴(kuò)展方法的步驟。11. 一種能夠由頻帶擴(kuò)展裝置讀取的存儲介質(zhì),在該存儲介質(zhì)上存儲有包括多條代碼 指令的計(jì)算機(jī)程序,這些代碼指令用于執(zhí)行如權(quán)利要求1至7之一所述的頻帶擴(kuò)展方法的步 驟。
【文檔編號】G10L21/038GK105960675SQ201580007250
【公開日】2016年9月21日
【申請日】2015年2月4日
【發(fā)明人】M.卡尼烏斯卡, S.拉戈
【申請人】奧蘭治