一種語(yǔ)音線性預(yù)測(cè)編碼模型的缺失值非線性估算方法
【專利摘要】本發(fā)明實(shí)施例公開了一種語(yǔ)音線性預(yù)測(cè)編碼模型的缺失值非線性估算方法。該方法包括如下步驟:線譜頻率參數(shù)變換步驟:將語(yǔ)音線性編碼預(yù)測(cè)模型的線譜頻率參數(shù)通過線性變換轉(zhuǎn)化為線譜頻率參數(shù)差值;訓(xùn)練模型步驟;傳輸過程中丟失部分和收到部分概率分布計(jì)算步驟;最小均方誤差最優(yōu)化估計(jì)步驟。利用本發(fā)明實(shí)施例,能夠在分組傳輸丟包的情況下,可靠的實(shí)現(xiàn)線性預(yù)測(cè)模型的最優(yōu)估計(jì),降低傳輸損失,提高語(yǔ)音質(zhì)量,具有很大的實(shí)用價(jià)值。
【專利說(shuō)明】一種語(yǔ)音線性預(yù)測(cè)編碼模型的缺失值非線性估算方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及在分組網(wǎng)絡(luò)中,語(yǔ)音傳輸過程中包丟失的處理問題,著重描述了一種基于變換的線譜頻率參數(shù)和狄利克雷混合模型的非線性最優(yōu)化估計(jì)方法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的深入發(fā)展,語(yǔ)音通信技術(shù)得到了長(zhǎng)足的進(jìn)步,傳輸?shù)恼Z(yǔ)音信號(hào)已經(jīng)由窄帶信號(hào)傳播演進(jìn)到了寬帶信號(hào)傳播。伴隨著多媒體應(yīng)用的不斷開發(fā)與推廣,人們對(duì)于在語(yǔ)音通信技術(shù)中語(yǔ)音傳輸質(zhì)量和實(shí)時(shí)性的要求越來(lái)越高,因此,研究高效可靠的語(yǔ)音通信算法,具有迫切的社會(huì)需求。
[0003]語(yǔ)音通信中要解決的首要問題是語(yǔ)音的編碼。經(jīng)過數(shù)十年的發(fā)展,語(yǔ)音編碼技術(shù)大致可以分為三種方式:波形編碼技術(shù)、基于參數(shù)模型的編碼技術(shù)和混合編碼技術(shù)。波形編碼技術(shù)針對(duì)語(yǔ)音波形直接進(jìn)行量化和傳輸,不基于聲學(xué)模型?;趨?shù)模型的編碼技術(shù)將語(yǔ)音通過線性預(yù)測(cè)模型分析后,分別傳輸線性預(yù)測(cè)模型,邊信息和語(yǔ)音能量信息?;旌暇幋a技術(shù)是上述兩者的結(jié)合。
[0004]在語(yǔ)音編碼中,基于參數(shù)模型的編碼被廣泛應(yīng)用,其核心在于如何有效可靠的實(shí)現(xiàn)線性預(yù)測(cè)模型的量化和編碼。在語(yǔ)音線性預(yù)測(cè)編碼模型的研究中,一般把線性預(yù)測(cè)編碼參數(shù)轉(zhuǎn)化為線譜頻率參數(shù),這種表示方法較其他參數(shù)表示方法更為穩(wěn)定高效,原因在于其頻譜敏感區(qū)域的分布較為平均。
[0005]在分組網(wǎng)絡(luò)中傳輸語(yǔ)音時(shí),語(yǔ)音恢復(fù)的質(zhì)量很大程度上取決于網(wǎng)絡(luò)的狀況。在分組網(wǎng)絡(luò)傳輸?shù)哪J较拢绻軌驈囊阎畔⒐烙?jì)出延遲或丟失的分組,可以有效地回復(fù)出語(yǔ)音信號(hào),并且避免額外的延遲,從而提高語(yǔ)音質(zhì)量,改善用戶的體驗(yàn)。傳統(tǒng)的缺失的和接收到的線譜頻率元素間的聯(lián)合分布主要由高斯混合模型進(jìn)行建模,通過高斯混合模型來(lái)模擬接收到部分和丟失部分的聯(lián)合分布,從而最優(yōu)估計(jì)出丟失的包的信息。最新的研究表明,對(duì)于線性預(yù)測(cè)模型的編碼可以通過量化線譜頻率參數(shù)差值來(lái)實(shí)現(xiàn),此方法比傳統(tǒng)的基于高斯混合模型的線譜頻率參數(shù)量化更為有效。在傳輸線譜頻率差值的時(shí)候,傳統(tǒng)的高斯混合模型無(wú)法很好地模擬數(shù)據(jù)的分布,也就不能實(shí)現(xiàn)最優(yōu)的預(yù)測(cè)。因此,針對(duì)線譜頻率差值設(shè)計(jì)相應(yīng)的統(tǒng)計(jì)模型并由此模型來(lái)最優(yōu)估計(jì)分組傳輸中丟失的包就顯得尤為重要。
【發(fā)明內(nèi)容】
[0006]針對(duì)現(xiàn)有語(yǔ)音傳輸過程中的丟包問題,本發(fā)明的目的是提供一種非線性最優(yōu)化算法來(lái)估計(jì)所丟失的內(nèi)容,最大限度恢復(fù)傳輸?shù)恼Z(yǔ)音質(zhì)量。
[0007]為達(dá)到上述目的,本發(fā)明提出的非線性最優(yōu)化缺失值估計(jì)方法包括下列步驟:
[0008]線譜頻率參數(shù)變換步驟:將語(yǔ)音線性編碼預(yù)測(cè)模型的線譜頻率參數(shù)通過線性變換轉(zhuǎn)化為線譜頻率參數(shù)差值;
[0009]訓(xùn)練模型步驟:在發(fā)送端,使用狄利克雷混合模型(DMM-Dirichlet mixturemodel)模擬線譜頻率參數(shù)差值的分布,采用期望最大化算法訓(xùn)練DMM中的各個(gè)參數(shù);[0010]傳輸過程中丟失部分和收到部分概率分布計(jì)算步驟:根據(jù)線譜頻率參數(shù)差值滿足狄利克雷分布(Dirichlet distribution)的假設(shè),把線譜頻率參數(shù)差值分成丟失部分和收到部分,分別歸一化后得到相應(yīng)的狄利克雷分布;
[0011]最小均方誤差最優(yōu)化估計(jì)步驟:按照最小均方誤差標(biāo)準(zhǔn),得到缺失值的最優(yōu)估計(jì)。
[0012]線譜頻率參數(shù)變換步驟中,利用線譜頻率參數(shù)的①非負(fù)特性,②有序特性和③有界特性將其變換為線性譜參數(shù)差值A(chǔ)LSF,此差值的特征為:①分布在(0,1)開區(qū)間內(nèi),②加和為I ;此步驟具體過程如下:
[0013]1)K維線譜頻率參數(shù)表示為s = [S1, S2,…,sK]T,滿足O < S1 < S2 <,…,sK< π ;
[0014]2)變換后的K+1維線譜頻率參數(shù)差值A(chǔ)LSF為
【權(quán)利要求】
1.一種語(yǔ)音線性預(yù)測(cè)模型的非線性最優(yōu)化丟包估計(jì)方法,其特征在于,包括以下步驟: 線譜頻率參數(shù)變換步驟:將語(yǔ)音線性編碼預(yù)測(cè)模型的線譜頻率參數(shù)通過線性變換轉(zhuǎn)化為線譜頻率參數(shù)差值; 訓(xùn)練模型步驟:在發(fā)送端,使用狄利克雷混合模型(DMM-Dirichlet mixture model)模擬線譜頻率參數(shù)差值的分布,采用期望最大化算法訓(xùn)練的DMM中的各個(gè)參數(shù); 傳輸過程中丟失部分和收到部分概率分布計(jì)算步驟:根據(jù)線譜頻率參數(shù)差值滿足狄利克雷分布(Dirichlet distribution)的假設(shè),把線譜頻率參數(shù)差值分成丟失部分和收到部分,分別歸一化后得到相應(yīng)的狄里特雷分布; 最小均方誤差最優(yōu)化估計(jì)步驟:按照最小均方誤差標(biāo)準(zhǔn),得到缺失值的最優(yōu)估計(jì)。
2.如權(quán)利要求1所述的方法,其特征在于,線譜頻率參數(shù)變換步驟中,利用線譜頻率參數(shù)的①非負(fù)特性,②有序特性和③有界特性將其變換為線性譜參數(shù)差值A(chǔ)LSF,此差值的特征為:①分布在(0,I)開區(qū)間內(nèi),②加和為I ;此步驟具體過程如下: 1)K 維線譜頻率參數(shù)表示為 s = [S1, S2, , sK]T,滿足 O < S1 < S2 <,..., sK < π ; 2)變換后的Κ+1維線譜頻率參數(shù)差值A(chǔ)LSF為5= 1;,?,...,?;,其中.V, in1=1
3.如權(quán)利要求2所述的方法,其特征在于,訓(xùn)練模型步驟中,傳輸之前,假設(shè)權(quán)利要求2中算得的?滿足狄利克雷分布,在發(fā)送端訓(xùn)練模型,得到條件概率分布中的混合分量參數(shù) 可表示為:
4.如權(quán)利要求3所述的方法,其特征在于,計(jì)算傳輸過程中丟失部分和收到部分概率分布步驟,假設(shè)、滿足狄利克雷分布,它在傳輸后可以分為兩部分:丟失部分Sw和收到部分可以通過兩者的相關(guān)特性估計(jì)其中的丟失部分;由于狄利克雷向量^是中性向量(neutral vector),將f和f分別歸一化后可計(jì)算得到它們的邊緣概率分布,其過程如下: 1)輸入:將上一步驟中得到的ALSF參數(shù)分成丟失部分和收到部分,即
5.如權(quán)利要求4所述的方法,其特征在于,最小均方誤差最優(yōu)化估計(jì)步驟:根據(jù)最小均方誤差準(zhǔn)則,丟失部分的最佳估計(jì),是歸一化丟失部分的均值與(1-Sk)相乘得到的結(jié)果,即丟失部分在已知收到部分基礎(chǔ)上的條件均值。計(jì)算結(jié)果如下式:
【文檔編號(hào)】G10L25/69GK103824561SQ201410054042
【公開日】2014年5月28日 申請(qǐng)日期:2014年2月18日 優(yōu)先權(quán)日:2014年2月18日
【發(fā)明者】馬占宇, 齊峰, 司中威, 郭軍, 張洪剛 申請(qǐng)人:北京郵電大學(xué)