一種語(yǔ)音線性預(yù)測(cè)編碼模型的缺失值非線性估算方法

文檔序號(hào)：2827281閱讀：262來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種語(yǔ)音線性預(yù)測(cè)編碼模型的缺失值非線性估算方法
【專利摘要】本發(fā)明實(shí)施例公開了一種語(yǔ)音線性預(yù)測(cè)編碼模型的缺失值非線性估算方法。該方法包括如下步驟：線譜頻率參數(shù)變換步驟：將語(yǔ)音線性編碼預(yù)測(cè)模型的線譜頻率參數(shù)通過線性變換轉(zhuǎn)化為線譜頻率參數(shù)差值；訓(xùn)練模型步驟；傳輸過程中丟失部分和收到部分概率分布計(jì)算步驟；最小均方誤差最優(yōu)化估計(jì)步驟。利用本發(fā)明實(shí)施例，能夠在分組傳輸丟包的情況下，可靠的實(shí)現(xiàn)線性預(yù)測(cè)模型的最優(yōu)估計(jì)，降低傳輸損失，提高語(yǔ)音質(zhì)量，具有很大的實(shí)用價(jià)值。
【專利說(shuō)明】一種語(yǔ)音線性預(yù)測(cè)編碼模型的缺失值非線性估算方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及在分組網(wǎng)絡(luò)中，語(yǔ)音傳輸過程中包丟失的處理問題，著重描述了一種基于變換的線譜頻率參數(shù)和狄利克雷混合模型的非線性最優(yōu)化估計(jì)方法。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的深入發(fā)展，語(yǔ)音通信技術(shù)得到了長(zhǎng)足的進(jìn)步，傳輸?shù)恼Z(yǔ)音信號(hào)已經(jīng)由窄帶信號(hào)傳播演進(jìn)到了寬帶信號(hào)傳播。伴隨著多媒體應(yīng)用的不斷開發(fā)與推廣，人們對(duì)于在語(yǔ)音通信技術(shù)中語(yǔ)音傳輸質(zhì)量和實(shí)時(shí)性的要求越來(lái)越高，因此，研究高效可靠的語(yǔ)音通信算法，具有迫切的社會(huì)需求。
[0003]語(yǔ)音通信中要解決的首要問題是語(yǔ)音的編碼。經(jīng)過數(shù)十年的發(fā)展，語(yǔ)音編碼技術(shù)大致可以分為三種方式:波形編碼技術(shù)、基于參數(shù)模型的編碼技術(shù)和混合編碼技術(shù)。波形編碼技術(shù)針對(duì)語(yǔ)音波形直接進(jìn)行量化和傳輸，不基于聲學(xué)模型?；趨?shù)模型的編碼技術(shù)將語(yǔ)音通過線性預(yù)測(cè)模型分析后，分別傳輸線性預(yù)測(cè)模型，邊信息和語(yǔ)音能量信息?；旌暇幋a技術(shù)是上述兩者的結(jié)合。
[0004]在語(yǔ)音編碼中，基于參數(shù)模型的編碼被廣泛應(yīng)用，其核心在于如何有效可靠的實(shí)現(xiàn)線性預(yù)測(cè)模型的量化和編碼。在語(yǔ)音線性預(yù)測(cè)編碼模型的研究中，一般把線性預(yù)測(cè)編碼參數(shù)轉(zhuǎn)化為線譜頻率參數(shù)，這種表示方法較其他參數(shù)表示方法更為穩(wěn)定高效，原因在于其頻譜敏感區(qū)域的分布較為平均。
[0005]在分組網(wǎng)絡(luò)中傳輸語(yǔ)音時(shí)，語(yǔ)音恢復(fù)的質(zhì)量很大程度上取決于網(wǎng)絡(luò)的狀況。在分組網(wǎng)絡(luò)傳輸?shù)哪Ｊ较拢绻軌驈囊阎畔⒐烙?jì)出延遲或丟失的分組，可以有效地回復(fù)出語(yǔ)音信號(hào)，并且避免額外的延遲，從而提高語(yǔ)音質(zhì)量，改善用戶的體驗(yàn)。傳統(tǒng)的缺失的和接收到的線譜頻率元素間的聯(lián)合分布主要由高斯混合模型進(jìn)行建模，通過高斯混合模型來(lái)模擬接收到部分和丟失部分的聯(lián)合分布，從而最優(yōu)估計(jì)出丟失的包的信息。最新的研究表明，對(duì)于線性預(yù)測(cè)模型的編碼可以通過量化線譜頻率參數(shù)差值來(lái)實(shí)現(xiàn)，此方法比傳統(tǒng)的基于高斯混合模型的線譜頻率參數(shù)量化更為有效。在傳輸線譜頻率差值的時(shí)候，傳統(tǒng)的高斯混合模型無(wú)法很好地模擬數(shù)據(jù)的分布，也就不能實(shí)現(xiàn)最優(yōu)的預(yù)測(cè)。因此，針對(duì)線譜頻率差值設(shè)計(jì)相應(yīng)的統(tǒng)計(jì)模型并由此模型來(lái)最優(yōu)估計(jì)分組傳輸中丟失的包就顯得尤為重要。

【發(fā)明內(nèi)容】

[0006]針對(duì)現(xiàn)有語(yǔ)音傳輸過程中的丟包問題，本發(fā)明的目的是提供一種非線性最優(yōu)化算法來(lái)估計(jì)所丟失的內(nèi)容，最大限度恢復(fù)傳輸?shù)恼Z(yǔ)音質(zhì)量。
[0007]為達(dá)到上述目的，本發(fā)明提出的非線性最優(yōu)化缺失值估計(jì)方法包括下列步驟:
[0008]線譜頻率參數(shù)變換步驟:將語(yǔ)音線性編碼預(yù)測(cè)模型的線譜頻率參數(shù)通過線性變換轉(zhuǎn)化為線譜頻率參數(shù)差值；
[0009]訓(xùn)練模型步驟:在發(fā)送端，使用狄利克雷混合模型(DMM-Dirichlet mixturemodel)模擬線譜頻率參數(shù)差值的分布，采用期望最大化算法訓(xùn)練DMM中的各個(gè)參數(shù)；[0010]傳輸過程中丟失部分和收到部分概率分布計(jì)算步驟:根據(jù)線譜頻率參數(shù)差值滿足狄利克雷分布(Dirichlet distribution)的假設(shè),把線譜頻率參數(shù)差值分成丟失部分和收到部分，分別歸一化后得到相應(yīng)的狄利克雷分布；
[0011]最小均方誤差最優(yōu)化估計(jì)步驟:按照最小均方誤差標(biāo)準(zhǔn)，得到缺失值的最優(yōu)估計(jì)。
[0012]線譜頻率參數(shù)變換步驟中，利用線譜頻率參數(shù)的①非負(fù)特性，②有序特性和③有界特性將其變換為線性譜參數(shù)差值A(chǔ)LSF，此差值的特征為:①分布在(0，1)開區(qū)間內(nèi)，②加和為I ;此步驟具體過程如下:
[0013]1)K維線譜頻率參數(shù)表示為s = [S1, S2,…，sK]T,滿足O < S1 < S2 <，…，sK< π ；
[0014]2)變換后的K+1維線譜頻率參數(shù)差值A(chǔ)LSF為
【權(quán)利要求】
1.一種語(yǔ)音線性預(yù)測(cè)模型的非線性最優(yōu)化丟包估計(jì)方法，其特征在于，包括以下步驟: 線譜頻率參數(shù)變換步驟:將語(yǔ)音線性編碼預(yù)測(cè)模型的線譜頻率參數(shù)通過線性變換轉(zhuǎn)化為線譜頻率參數(shù)差值；訓(xùn)練模型步驟:在發(fā)送端，使用狄利克雷混合模型(DMM-Dirichlet mixture model)模擬線譜頻率參數(shù)差值的分布，采用期望最大化算法訓(xùn)練的DMM中的各個(gè)參數(shù)；傳輸過程中丟失部分和收到部分概率分布計(jì)算步驟:根據(jù)線譜頻率參數(shù)差值滿足狄利克雷分布(Dirichlet distribution)的假設(shè),把線譜頻率參數(shù)差值分成丟失部分和收到部分，分別歸一化后得到相應(yīng)的狄里特雷分布；最小均方誤差最優(yōu)化估計(jì)步驟:按照最小均方誤差標(biāo)準(zhǔn)，得到缺失值的最優(yōu)估計(jì)。
2.如權(quán)利要求1所述的方法，其特征在于，線譜頻率參數(shù)變換步驟中，利用線譜頻率參數(shù)的①非負(fù)特性，②有序特性和③有界特性將其變換為線性譜參數(shù)差值A(chǔ)LSF，此差值的特征為:①分布在(0，I)開區(qū)間內(nèi)，②加和為I ;此步驟具體過程如下: 1)K 維線譜頻率參數(shù)表示為 s = [S1, S2, , sK]T,滿足 O < S1 < S2 <,..., sK < π ； 2)變換后的Κ+1維線譜頻率參數(shù)差值A(chǔ)LSF為5= 1;,?,...,?;,其中.V, in1=1
3.如權(quán)利要求2所述的方法，其特征在于，訓(xùn)練模型步驟中，傳輸之前，假設(shè)權(quán)利要求2中算得的?滿足狄利克雷分布，在發(fā)送端訓(xùn)練模型，得到條件概率分布中的混合分量參數(shù) 可表示為:
4.如權(quán)利要求3所述的方法，其特征在于，計(jì)算傳輸過程中丟失部分和收到部分概率分布步驟，假設(shè)、滿足狄利克雷分布，它在傳輸后可以分為兩部分:丟失部分Sw和收到部分可以通過兩者的相關(guān)特性估計(jì)其中的丟失部分；由于狄利克雷向量^是中性向量(neutral vector),將f和f分別歸一化后可計(jì)算得到它們的邊緣概率分布,其過程如下: 1)輸入:將上一步驟中得到的ALSF參數(shù)分成丟失部分和收到部分，即
5.如權(quán)利要求4所述的方法，其特征在于，最小均方誤差最優(yōu)化估計(jì)步驟:根據(jù)最小均方誤差準(zhǔn)則，丟失部分的最佳估計(jì)，是歸一化丟失部分的均值與(1-Sk)相乘得到的結(jié)果，即丟失部分在已知收到部分基礎(chǔ)上的條件均值。計(jì)算結(jié)果如下式:
【文檔編號(hào)】G10L25/69GK103824561SQ201410054042
【公開日】2014年5月28日申請(qǐng)日期:2014年2月18日優(yōu)先權(quán)日:2014年2月18日
【發(fā)明者】馬占宇, 齊峰, 司中威, 郭軍, 張洪剛申請(qǐng)人:北京郵電大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：馬占宇;齊峰;司中威;郭軍;張洪剛
技術(shù)所有人：北京郵電大學(xué)
我是此專利的發(fā)明人

上一篇：一種解析波形的方法和裝置制造方法
上一篇：一種石墨烯宏觀材料的應(yīng)用方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

語(yǔ)音信號(hào)線性預(yù)測(cè)分析相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種語(yǔ)音線性預(yù)測(cè)編碼模型的缺失值非線性估算方法