一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法

文檔序號：2833376閱讀：325來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法，屬于語音編碼技術(shù)領(lǐng)域。
背景技術(shù)：
基本的語音通信過程如說明書附圖I所示，對語音編解碼器的要求是在保證語音質(zhì)量的前提下，編碼碼流的比特率越低越好。采用矢量量化技術(shù)、線性預(yù)測分析技術(shù)和數(shù)據(jù)插值技術(shù)的編解碼器能夠很好地滿足這個(gè)要求。在基于上述技術(shù)的語音編解碼器中，線性預(yù)測系數(shù)的編解碼過程為在編碼端，用萊文森-德賓算法算法求解線性預(yù)測系數(shù)，并轉(zhuǎn)化為相應(yīng)的線譜頻率參數(shù)，用存儲在本地的碼本對線譜頻率參數(shù)進(jìn)行矢量量化，得到碼本的索引號。這些索引號會和其它語音編碼參數(shù)一起被打包成比特流，通過通信網(wǎng)絡(luò)傳送到輸出端。在解碼端，根據(jù)從編碼器傳送的索引號解碼出線譜頻率參數(shù)，并轉(zhuǎn)化為對應(yīng)的線性預(yù)測系數(shù)，最后根據(jù)線性預(yù)測系數(shù)及其它編碼參數(shù)合成出語音，整個(gè)過程的原理如說明書附圖2所示。矢量量化是一種高效的數(shù)據(jù)壓縮方法，如說明書附圖3所示，它是將若干個(gè)標(biāo)量數(shù)據(jù)組構(gòu)成一個(gè)矢量，然后在矢量空間中進(jìn)行整體量化。對I個(gè)N維編碼端待量化矢量X，從N維碼本矢量集Y= {y (I)，y (2)，. . .，y (L)}中選擇與x最匹配的矢量y (i)，在信道中只需傳輸y(i)在碼本Y中的索引號i即可。在解碼端，根據(jù)索引號i即可找到對應(yīng)矢量y(i)，并作為解碼結(jié)果輸出。碼本的設(shè)計(jì)可使用LBG算法。為了降低矢量量化所需的碼本體積，分裂式矢量量化技術(shù)應(yīng)運(yùn)而生。分裂式矢量量化技術(shù)是比較適合于高階線譜頻率參數(shù)量化的一種方法，分裂矢量量化的過程如圖4所示。分裂式矢量量化是指將待量化矢量分為幾個(gè)低維子矢量，每個(gè)子矢量分別使用不同的碼本量化。計(jì)算出信號線譜頻率參數(shù)后，將線譜頻率參數(shù)分為T個(gè)子矢量Isftl, Isf1,.. .，Isf^1，每一部分分別使用不同的碼本作矢量量化，得到索引號0，1，…，T-1，由這T個(gè)索引號聯(lián)合表示LSF參數(shù)。同理，在解碼端由這T個(gè)索引號恢復(fù)T個(gè)子矢量Isftl, Isf1,.. .，IsfV1，再合并出完整LSF參數(shù)，并進(jìn)一步計(jì)算線性預(yù)測系數(shù)。說明書附圖4中的矢量量化在編碼端表示碼本搜索，在解碼端表示碼本提取。同傳統(tǒng)的矢量量化技術(shù)相比，分裂式矢量量化所需的碼本體積大大減小。但其還存在兩個(gè)問題第一，從高階線性預(yù)測系數(shù)直接計(jì)算高階線譜頻率參數(shù)，運(yùn)算量很大，運(yùn)算量與線性預(yù)測系數(shù)個(gè)數(shù)的平方成正比；第二，針對T個(gè)子矢量，需要分別設(shè)計(jì)T組碼本，因此高階線譜頻率參數(shù)所需要的碼本總量仍然很大。在語音信號分析中，常把語音x(n)看作是一個(gè)時(shí)間序列模型的輸出，x(n)可表示為
Mx(n) + 工a(i)x[n - i) = < (/ )
；=1其中，M為線性預(yù)測分析階數(shù)。a(i)，i = 1,2,…，M為模型參數(shù)，也稱線性預(yù)測系數(shù)。e(n)為激勵信號。x(n)也可以等效為e(n)經(jīng)過一個(gè)全極點(diǎn)濾波器(也稱合成濾波器)H(z)的輸出，H(z)可表示為
Hi-) = I =-—-
_7]稱)I+!>(/)-
i=l其中，A(z)稱為預(yù)測誤差濾波器。給定輸入語音信號(或其自相關(guān)函數(shù))，系數(shù)a(i)可以由萊文森-德賓(Levinson-Durbin)算法求出；實(shí)際應(yīng)用當(dāng)中，除了使用線性預(yù)測系數(shù)表征聲道模型外，還常使用反射系數(shù)k(i)和線譜頻率(線譜頻率)參數(shù)lsf(i)，使用lsf(i)生成H(Z)時(shí)，和k(i) 一樣容易保證H(Z)的穩(wěn)定性，且lsf(i)量化特性和內(nèi)插特性均優(yōu)于k(i)，使得產(chǎn)生相同質(zhì)量的合成語音所需的編碼碼率得以降低，因此，目前對線性預(yù)測參數(shù)的矢量量化通常在線譜頻率域上進(jìn)行。這三種參數(shù)之間的關(guān)系如下
(I)已知線性預(yù)測系數(shù)a(i)，求反射系數(shù)k(i)的遞推方法為k (m) =-a (m, m)，a (m-1, i) = [a (m, i) +k (m) a (m, m - i) ] / [I - k (i)]。其中，m是階數(shù)，m = M，M-1，. . .，I。a(m，i)是m階的第i個(gè)線性預(yù)測系數(shù)。k(m)是第m個(gè)反射系數(shù)。(2)已知反射系數(shù)k(i)，求線性預(yù)測系數(shù)a(i)的遞推方法為a(m，m)=k(m)，a (m, i) = [a (m - I, i) +k (m) a (m - I, m - i)],其中，m是階數(shù)，m=l, 2, . . .，M。a(m, i)是m階的第i個(gè)線性預(yù)測系數(shù)，i =I, 2, , m-lo k(m)是第m個(gè)反射系數(shù)。(3)已知線性預(yù)測系數(shù)a⑴，求線譜頻率參數(shù)Isf⑴的方法為使用線性預(yù)測系數(shù)a(i)可以構(gòu)建兩個(gè)多項(xiàng)式P(Z)和Q(Z)；P (z) =A (z)+z-(M+1)A (z-1)，Q (z) =A (z) -z_(m+1)A (z_1)。方程P (z)=0與Q (z)=0在余弦域的根lspP(i)與lspQ (i)稱為線譜對系數(shù)，求解線譜頻率參數(shù)的數(shù)值方法有許多種，如代數(shù)式方程求根法和DFT方法等?？梢宰C明，當(dāng)A(Z)的零點(diǎn)都位于單位圓內(nèi)時(shí)，多項(xiàng)式P (z)和Q(Z)具有如下性質(zhì)P(Z)和Q(Z)的零點(diǎn)都位于單位圓上，P(Z)和Q(Z)的零點(diǎn)沿著單位圓上隨著《的增加交替出現(xiàn)，若除去P(z)的I和Q(Z)的- I這兩個(gè)零點(diǎn)，P(Z)和Q(Z)還各有M個(gè)零點(diǎn)。當(dāng)A(Z)滿足最小相位特性時(shí)，可以由線性預(yù)測系數(shù)唯一確定線譜頻率參數(shù)。由lspP(i)、lspQ(i)計(jì)算反余弦即可得到Isfp⑴、Isf0⑴。lsfp(i) =arccos [lspP (i)],lsfQ(i) =arccos [lspQ (i)]。(4)已知線譜頻率參數(shù)Isf (i)，求線性預(yù)測系數(shù)a (i)的方法為使用線譜頻率參數(shù)Isfp(i) Isf0(i)可以計(jì)算lsfP(i)、lsfQ(i),即lspp(i) =cos [lsfp (i)],lspQ(i) =cos [lsfQ (i)]。使用LSP參數(shù)lSpP(i)lSpQ(i)可以構(gòu)建兩個(gè)多項(xiàng)式P(z)和Q(Z)P (z) = (l+z_1) II (I-Ispp ⑴ Z-1),
Q (z) = (l-z_1) n (l-lspQ ⑴ z-1)。其中，n表示連乘。A(Z)可以用多項(xiàng)式P(Z)和Q(Z)表示為A (Z) = [P(z)+Q (Z)]/2。
對音頻信號進(jìn)行線性預(yù)測分析時(shí)，分析精度與線性預(yù)測的階數(shù)直接相關(guān)。對語音信號來說，10階線性預(yù)測分析就足夠合成出高質(zhì)量的語音。對音樂或具有復(fù)雜背景聲的信號，則需要提高線性預(yù)測分析階數(shù)以獲得更多的頻譜細(xì)節(jié)。但是高階線性預(yù)測分析也帶來了另外一些問題。在編碼時(shí)，線性預(yù)測系數(shù)在傳輸之前要先經(jīng)過量化，以降低數(shù)碼率。線譜頻率(線譜頻率)具有良好的內(nèi)插特性和抗量化誤差能力，矢量量化通常在線譜頻率域進(jìn)行。但隨著線性預(yù)測階數(shù)增加，現(xiàn)有語音編碼器均使用代數(shù)式方程求根法由線性預(yù)測系數(shù)a(i)求解線譜頻率參數(shù)lsf(i)，從線性預(yù)測系數(shù)計(jì)算線譜頻率參數(shù)所需的運(yùn)算量與線性預(yù)測系數(shù)個(gè)數(shù)的平方成正比；同時(shí)，即使采用分裂矢量量化技術(shù)，對高階線譜頻率矢量量化所需的碼本體積也很大，故高階線性預(yù)測分析在低碼率、高質(zhì)量語音編碼器中的應(yīng)用非常困難?？s略語和關(guān)鍵術(shù)語定義VQ :Vector Quantization,矢量量化。線性預(yù)測LinearPrediction,線性預(yù)測。線性預(yù)測系數(shù)Linear Prediction Coefficient,線性預(yù)測系數(shù)。Levinson算法也稱為Levinson-Durbin算法,萊文森-德賓算法,是一種基于自相關(guān)函數(shù)計(jì)算線性預(yù)測系數(shù)的方法。LSP Linear Spectrum Pair,線譜對。LSF Linear Spectrumfrequency,線譜頻率。

發(fā)明內(nèi)容
為了克服上述的不足，本發(fā)明的目的在于提供一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法，其能夠應(yīng)用于低碼率、高質(zhì)量語音編解碼器中，能夠減少對高階線譜頻率矢量量化所需的碼本體積和計(jì)算量。本發(fā)明采取的技術(shù)方案分如下，分編碼和解碼兩步驟I、一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法；分編碼和解碼兩步驟，第一步編碼，編碼按照以下步驟進(jìn)行(I)使用萊文森-德賓算法進(jìn)行高階線性預(yù)測分析得到R個(gè)線性預(yù)測系數(shù)a(i)并且R=dM;可由已知R個(gè)線性預(yù)測系數(shù)a(i)得到R個(gè)反射系數(shù)k(i) (i = 1，2，…，R);所述已知R個(gè)線性預(yù)測系數(shù)a(i)，求R個(gè)反射系數(shù)k(i)的遞推方法為k (m) =-a (m, m)，a (m-1, i) = [a (m, i) +k (m) a (m, m_i) ] / [l~k (i)]，其中，m是階數(shù)，m = R，R_1，…，I ；a(m, i)是進(jìn)行m階線性預(yù)測時(shí)的第i個(gè)線性預(yù)測系數(shù)，k(m)是第m個(gè)反射系數(shù)；所述R、M、d均為正整數(shù)，R范圍為10 100，M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ；(2)反射系數(shù)k分組器將R個(gè)反射系數(shù)k(i) (i = 1，2，...，10分為(1組，每組包含相鄰M個(gè)反射系數(shù)k(i) (i = I, 2, . . . , M);所述的第j組的第i個(gè)系數(shù)k(j, i)與k(i)的關(guān)系表示為 k(j，i)=k(jM+i) (j=0, I,..., d-1 ；i = 1，2，...，10;所述1 1、(1均為正整數(shù)，所述M范圍為8 16，R、M、d須滿足關(guān)系R=dM;(3)對每組M階反射系數(shù)k(j，i)，經(jīng)過k —a轉(zhuǎn)化器計(jì)算出對應(yīng)的M階線性預(yù)測系數(shù)a(j，i) (j=0, I, ...，d -l ;i = 1，2，...，M);所述R、M、d均為正整數(shù)，所述M范圍為8 16，R、M、d須滿足關(guān)系R=dM，R范圍為10 100 ；所述已知反射系數(shù)k(i)，求線性預(yù)測系數(shù)a(i)的遞推方法為a(m，m)=k(m),a (m, i) = [a (m-1, i) +k (m) a (m - I, m - i)],其中，m是階數(shù)，m=l，2,...,M；a(m, i)是m階線性預(yù)測時(shí)的第i個(gè)線性預(yù)測系數(shù)，
i= I, 2, . . . , m-1 ；k(m)是第m個(gè)反射系數(shù)；(4)對每組已知M個(gè)線性預(yù)測系數(shù)a(j，i)經(jīng)過a — Isf轉(zhuǎn)化器計(jì)算出對應(yīng)的線譜頻率參數(shù) Isf (j，i) (j=0, l，...，d-l ;i = 1，2，...，M);所述 M 范圍為 8 16，d 為正整數(shù)，R、M、d須滿足關(guān)系R=dM，所述R、M、d均為正整數(shù)；所述已知線性預(yù)測系數(shù)a(i)，求線譜頻率參數(shù)lsf(i)的方法為使用線性預(yù)測系數(shù)a(i)可以構(gòu)建兩個(gè)多項(xiàng)式P(Z)和Q(Z)；P(z)=A(z)+z_(m+1)A(z_1),Q (z) =A (z) _z-(m+1)A (z-1)；
M所述+二一，M是線性預(yù)測階數(shù)，z代表Z變換域的自變量；方程P(Z)=O 與 Q(Z)=O 在余弦域的根分別為 lspp(i)與 lspQ(i)，i=l, 2,. . . ,M+1,稱lspP(i)與lspQ(i)為線譜對系數(shù)，當(dāng)A(Z)的零點(diǎn)都位于單位圓內(nèi)時(shí)，P(z)和Q(Z)的零點(diǎn)都位于單位圓上，P(Z)和Q(Z)的零點(diǎn)沿著單位圓上隨著《的增加交替出現(xiàn)，若除去I和- I這兩個(gè)零點(diǎn)，P (z)和Q(Z)各有M個(gè)零點(diǎn)，當(dāng)A(Z)滿足最小相位特性時(shí)，可以由線性預(yù)測系數(shù)a(i)唯一確定線譜頻率參數(shù)lspP(i)與lspQ(i), i = I, 2, . . . , M/2 ;由Ispp⑴、lspQ(i)計(jì)算反余弦即可得到lsfP(i)、lsfQ(i)；lsfp(i) =arccos [lspP (i)],lsfQ(i) =arccos [lspQ (i)]；lsfp(i)、lsfQ(i)交錯排列Isf(2i)=lsfP(i),Isf(2i+l) =lsfQ(i)；可得lsf(i);(5)矢量量化器使用相同的量化碼本對d組線譜頻率參數(shù)分別作矢量量化得到d個(gè)索引號，索引號和其它編碼參數(shù)一起被打包成比特流進(jìn)入通信網(wǎng)絡(luò)并被傳送到輸出端；第二步解碼，解碼按照以下步驟進(jìn)行(I)根據(jù)通信網(wǎng)絡(luò)接收的d個(gè)索引號可以恢復(fù)d組線譜頻率參數(shù)Isf (j，i)(j=0, I,...,d-1 ；i = 1，2，...，M)，對d組線譜頻率參數(shù)使用Isf— a轉(zhuǎn)化器計(jì)算對應(yīng)的M階線性預(yù)測系數(shù)a(j，i) (j=0, I, . ..,d-1 ；i = 1,2,所述M范圍為8 16，R范圍為10 100，R、M、d滿足關(guān)系R=dM ;所述R、M、d均為正整數(shù)；所述已知線譜頻率參數(shù)Isf (i)，使用Isf — a轉(zhuǎn)化器計(jì)算對應(yīng)的M階線性預(yù)測系數(shù)a(i)的方法為將偶數(shù)序號的lsf(i)參數(shù)定義為lSfP(i)，奇數(shù)序號的lsf(i)參數(shù)定義為Isf0Q),lsfp(i) =Isf (2i),lsfQ(i) =Isf(2i+l)；其中，i=l, 2，，M/2 ;對線譜頻率參數(shù)Isfp⑴、lsfQ(i)取余弦可以計(jì)算LSP參數(shù)lspP(i)、lspQ(i),即 lspp(i) =cos [lsfp (i)],lspQ(i)=cos[lsfQ(i)]；使用LSP參數(shù)lspP(i)、lspQ(i)可以構(gòu)建兩個(gè)多項(xiàng)式P (z)和Q(Z)P(Z) =(1 + 2-1 )|"|[1 — Ilspr (、/):-1 + z-2]，
U/2Q(Z) ={l-z-l)\{[l-2lspQ{i)z-1 +Z-2]。
仁I其中，n表示連乘，Z代表Z變換域的自變量，M是線性預(yù)測階數(shù)代表系數(shù)a(i)的數(shù)目；多項(xiàng)式A (Z)可以用多項(xiàng)式P (Z)和Q (Z)表示為A (Z) = [P(z)+Q (Z)]/2。
M根據(jù)表達(dá)式= I + [ ainz"，按照z-i系數(shù)對應(yīng)相等的原則，即可確定出
/=1
a(i)的值，(2)對d組M階線性預(yù)測系數(shù)a (j，i)使用a — k轉(zhuǎn)化器計(jì)算對應(yīng)的M階反射系數(shù)k(j, i) (j=0, I,..., d-1 ；i = 1,2,.. ，M)，R、M、d 須滿足關(guān)系 R=dM;R 范圍為 10 100 ;所述M范圍為8 16，R范圍為10 100，R、M、d滿足關(guān)系R=dM ;所述R、M、d均為正整數(shù)；所述已知線性預(yù)測系數(shù)a (i)，使用a — k轉(zhuǎn)化器求反射系數(shù)k(i)的遞推方法為k (m) =-a (m, m)，a (m-1, i) = [a (m, i) +k (m) a (m, m_i) ] / [l~k (i)]，其中，m是階數(shù)，m = M，M-l，…，I ;a(m，i)是m階的第i個(gè)線性預(yù)測系數(shù)，k(m)是第m個(gè)反射系數(shù)；所述M范圍為8 16，R范圍為10 100，R、M、d滿足關(guān)系R=dM ；所述R、M、d均為正整數(shù)；(3)對d組反射系數(shù)k(j，i) (j=0, I, ...,d-1)使用反射系數(shù)組合器按順序組成R階反射系數(shù) k(jM+i)=k(j，i) (j=0,= 1，2，...，M);所述 M 范圍為 8 16，R 范圍為10 100，R、M、d滿足關(guān)系R=dM，所述R、M、d均為正整數(shù)；(4)對R階反射系數(shù)k(i)使用k —a轉(zhuǎn)化器轉(zhuǎn)換為R階線性預(yù)測系數(shù)a(i)(i=l, 2，…，R) :R范圍為10 100，R、M、d滿足關(guān)系R=dM，M范圍為8 16，所述R、M、d均為正整數(shù)；所述已知R階反射系數(shù)k⑴，使用k — a轉(zhuǎn)化器求R階線性預(yù)測系數(shù)a⑴的遞推方法為a (m, m) =k (m)，a (m, i) = [a (m - I, i) +k (m) a (m - I, m - i)],其中，m是階數(shù)，m=l, 2, . . . , R ；a(m, i)是m階的第i個(gè)線性預(yù)測系數(shù)，i =1，2，. . .，m - 1，k(m)是第m個(gè)反射系數(shù)，R范圍為10 100，R、M、d滿足關(guān)系R=dM，M范圍為8 16，所述R、M、d均為正整數(shù)；·
本發(fā)明的有益效果如下(I)顯著降低使用高階線性預(yù)測系數(shù)的語音編碼器的運(yùn)算量。將高階線性預(yù)測系數(shù)分解為多組低階線性預(yù)測系數(shù)，然后再計(jì)算對應(yīng)的線譜頻率參數(shù)。計(jì)算多組低階線譜頻率參數(shù)所需的運(yùn)算量要小于直接計(jì)算高階線譜頻率所需的運(yùn)算量。(2)減少矢量量化所用碼本的體積，進(jìn)而減少碼本的存儲量。將反射系數(shù)劃分為多個(gè)子組，然后將各子組的反射系數(shù)轉(zhuǎn)化為線譜頻率參數(shù)后分別予以矢量量化。各子組的線譜頻率參數(shù)都分布在(0，Ji)區(qū)間內(nèi)，因此可以使用相同的碼本做矢量量化，減少了總的碼本矢量的個(gè)數(shù)，從而節(jié)省了碼本存儲空間。(3)本發(fā)明適合應(yīng)用到變碼率分級語音編碼算法中。各個(gè)子組根據(jù)反射系數(shù)劃分，而各個(gè)反射系數(shù)是與線性預(yù)測階數(shù)無關(guān)的?；诖?，在傳輸碼流時(shí)，根據(jù)信道帶寬情況，可以首先傳送低階線性預(yù)測分析得到的反射系數(shù)生成的線譜頻率系數(shù)索引；若信道帶寬允許，再傳輸更高階數(shù)的反射系數(shù)生成的線譜頻率系數(shù)索引。

圖I為語首通/[目過程不意圖；圖2為現(xiàn)有的基于線譜頻率參數(shù)和矢量量化技術(shù)的語音編碼器即語音編解碼器中LP系數(shù)編碼工作過程示意圖；圖3為矢量量化原理圖；圖4為分裂式矢量量化原理圖；圖5為本發(fā)明技術(shù)原理框圖。
具體實(shí)施例方式基本的語音通信過程如說明書附圖I所示，原始的語音信號經(jīng)過發(fā)送端語音編碼器后變成碼流，碼流經(jīng)過信道傳輸?shù)浇邮斩说恼Z音解碼器后恢復(fù)出原始的語音信號?，F(xiàn)有的基于線譜頻率參數(shù)和矢量量化技術(shù)的語音編碼器如說明書附圖2所示，原始的待編碼語音信號LP分析模塊后，得到LP系數(shù)；LP系數(shù)經(jīng)過LSF計(jì)算模塊后，得到LSF系數(shù)；LSF系數(shù)經(jīng)過矢量量化模塊后，得到碼本索引參數(shù)；碼本索引參數(shù)經(jīng)過通信信道被傳輸?shù)浇邮斩?。接收端解碼過程與編碼過程相反，接收的經(jīng)過逆矢量量化模塊后，得到LSF系數(shù)；LSF系數(shù)經(jīng)過LP系數(shù)計(jì)算模塊后，得到LP系數(shù)；LP系數(shù)即被用于合成語音模塊中來合成語音信號。實(shí)用的語音編碼器的編碼參數(shù)除了 LSF碼本索引參數(shù)外，還包括如基音周期、固定碼本索引等，但這些參數(shù)的處理與本發(fā)明關(guān)聯(lián)不大，故此處沒有贅述。矢量量化原理圖如說明書附圖3所示，待量化的矢量通入碼書搜索器，碼書搜索器搜索編碼器碼本中與待量化的矢量最接近的碼字，并將該碼字索引經(jīng)過通信信道傳輸?shù)浇邮斩恕＝邮斩私獯a過程與編碼過程相反，碼書提取器根據(jù)接收的索引，從解碼器碼本得到解碼輸出矢量。分裂式矢量量化原理圖如說明書附圖4所示，LP系數(shù)LSF計(jì)算模塊得到LSF系數(shù)，該LSF系數(shù)矢量被簡單分割一系列長度較小的矢量。而后分別進(jìn)行矢量量化得到多個(gè)索引值，這些索引值經(jīng)數(shù)據(jù)打包，經(jīng)過通信信道傳輸?shù)浇邮斩?。接收端解碼過程與編碼過程相反，數(shù)據(jù)先經(jīng)過拆包模塊得到多個(gè)索引值，每個(gè)索引值經(jīng)過反量化得到一系列長度較小的矢量，這些長度較小的矢量被LSF組合模塊組合為LSF系數(shù)矢量，進(jìn)而經(jīng)過LP恢復(fù)模塊恢復(fù)出LP系數(shù)用于合成語音。本發(fā)明采取的技術(shù)方案分兩步驟I.編碼技術(shù)方案(I)使用萊文森-德賓算法進(jìn)行高階線性預(yù)測分析，得到R個(gè)線性預(yù)測系數(shù)a (i)。適當(dāng)選取R，使之滿足R=dM。圖5中，a —k轉(zhuǎn)化器使用背景技術(shù)中提及的方法，可由R個(gè) a(i)得到 R 個(gè)反射系數(shù) k(i), i = 1，2, ，R。在編碼技術(shù)方案中涉及的變量R、M、d的取值范圍均相同，R、M、d均為正整數(shù)，R范圍為10 100，M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ；已知線性預(yù)測系數(shù)a (i)，求反射系數(shù)k(i)的遞推方法為k (m) =-a (m, m),a (m-1, i) = [a (m, i) +k (m) a (m, m_i) ] / [1-k (i)]。其中，m是階數(shù)，m = M，M-1，. . .，I。a (m，i)是m階的第i個(gè)線性預(yù)測系數(shù)。k(m)是第m個(gè)反射系數(shù)。(2)如圖5所示，反射系數(shù)k分組器將R個(gè)反射系數(shù)分為d組，每組包含相鄰M個(gè)反射系數(shù)。例如，第j組的第i個(gè)系數(shù)k(j，i)與k(i)的關(guān)系可以表示為k (j，i)=k(jM+i)，j=0, I, . . . , d-1, i = 1,2,...,M。(3)對每組M階反射系數(shù)，圖5中k —a轉(zhuǎn)化器使用背景技術(shù)中提及的方法計(jì)算出對應(yīng)的 M 階線性預(yù)測系數(shù) a (j，i)，j=0, 1，，d-1，i = 1，2，，M。(4)對每組M個(gè)線性預(yù)測系數(shù)，圖5中a— Isf轉(zhuǎn)化器使用背景技術(shù)中提及的方法計(jì)算出對應(yīng)的線譜頻率參數(shù)Isf (j, i), j=0, I,. . . , d-l,i = I, 2,. . . ,Mo由于這些組的線譜頻率參數(shù)都分布在(0，Ji)區(qū)間，分布情況類似，因此可用相同的碼本量化它們。(5)矢量量化器矢量量化使用相同的量化碼本對d組線譜頻率參數(shù)分別作矢量量化，得到d個(gè)索引號。這些索引號會進(jìn)入通信網(wǎng)絡(luò)，并被傳送到輸出端。2.解碼技術(shù)方案；(I)根據(jù)通信網(wǎng)絡(luò)接收的d個(gè)索引號可以恢復(fù)d組線譜頻率參數(shù)Isf (j，i)，j=0, I,. . .，d-1, i = 1，2,. . .，M。對d組線譜頻率參數(shù)。對d組M階線譜頻率參數(shù),使用圖5中Isf — a轉(zhuǎn)化器計(jì)算對應(yīng)的M階線性預(yù)測系數(shù)a (j, i), j=0, I,. . .，d_l, i = 1，2,. . .，M。在解碼技術(shù)方案中涉及的變量R、M、d的取值范圍均相同，R、M、d均為正整數(shù)，R范圍為10 100，M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ；(2)對d組M階線性預(yù)測系數(shù)a (j, i)，使用圖5中a — k轉(zhuǎn)化器計(jì)算對應(yīng)的M階反射系數(shù) k(j, i)，j=0, I, . . . , d-1, i = I, 2, . . . , Mo(3)對d組反射系數(shù)k (j，i)，j=0，I，. . .，d-1。使用圖5中反射系數(shù)組合器按順序組成 R 階反射系數(shù) k(jM+i)=k(j, i), j=0, I, . . . , d_l, i = 1，2, · · ·，Μ。(4)對R階反射系數(shù)k(i)，圖5中k — a轉(zhuǎn)化器使用背景技術(shù)中提及的方法轉(zhuǎn)換為R階線性預(yù)測系數(shù)a (i)，i = 1，2，...，R。以R=50、M = 10、d = 5為例，在線性預(yù)測系數(shù)編碼輸出50bit的情況下，運(yùn)算量、
碼本體積等的情況如下。
權(quán)利要求
1. 一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法，其特征在于分編碼和解碼兩步驟，第一步編碼，編碼按照以下步驟進(jìn)行 (1)使用萊文森-德賓算法進(jìn)行高階線性預(yù)測分析得到R個(gè)線性預(yù)測系數(shù)a(i)并且R=dM ;可由已知R個(gè)線性預(yù)測系數(shù)a(i)得到R個(gè)反射系數(shù)k(i) (i = I, 2, . . . , R)；所述已知R個(gè)線性預(yù)測系數(shù)a(i)，求R個(gè)反射系數(shù)k(i)的遞推方法為k(m)=-a(m，m)， a (m-1, i) = [a (m, i) +k (m) a (m, m - i) ] / [I - k (i)]，其中，m是階數(shù)，m = R，R-l，…，l;a(m，i)是進(jìn)行m階線性預(yù)測時(shí)的第i個(gè)線性預(yù)測系數(shù)，km)是第m個(gè)反射系數(shù)；所述R、M、d均為正整數(shù)，R范圍為10 100，M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ; (2)反射系數(shù)k分組器將R個(gè)反射系數(shù)k(i)(i = 1，2，...，R)分為d組，每組包含相鄰M個(gè)反射系數(shù)k(i) (i = I, 2,, M);所述的第j組的第i個(gè)系數(shù)k(j, i)與k(i)的關(guān)系表示為 k(j，i)=k(jM+i) (j=0, ；i = 1，2，...，10;所述1 ^、(1均為正整數(shù)，1 范圍為10 100，M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ； (3)對每組M階反射系數(shù)k(j，i)，經(jīng)過k— a轉(zhuǎn)化器計(jì)算出對應(yīng)的M階線性預(yù)測系數(shù)a(j, i) (j=0, 1，，d-l ;i = 1，2，，M);所述 R、M、d 均為正整數(shù)，R 范圍為 10 100，M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM; 所述已知反射系數(shù)k(i)，求線性預(yù)測系數(shù)a(i)的遞推方法為 a (m, m) =k (m)， a (m, i) = [a (m-1, i) +k (m) a (m - I, m - i)], 其中，m是階數(shù)，m=l, 2，. . .，M ;a (m，i)是m階線性預(yù)測時(shí)的第i個(gè)線性預(yù)測系數(shù)，i =I, 2, . . . , m - I ；k(m)是第m個(gè)反射系數(shù)； (4)對每組已知M個(gè)線性預(yù)測系數(shù)a(j, i)經(jīng)過a — Isf轉(zhuǎn)化器計(jì)算出對應(yīng)的線譜頻率參數(shù) Isf (j，i) (j=0, ；i = 1,2,...,M);所述 R、M、d 均為正整數(shù)，R 范圍為 10 .100，M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ；所述已知線性預(yù)測系數(shù)a(i)，求線譜頻率參數(shù)lsf(i)的方法為使用線性預(yù)測系數(shù)a(i)可以構(gòu)建兩個(gè)多項(xiàng)式P(Z)和Q(Z)；P(z)=A(z)+z^(m+1)A(z^), Q(Z)=A(Z) -z；所述
全文摘要
本發(fā)明公開了一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法，其能夠應(yīng)用于低碼率、高質(zhì)量語音編解碼器中，能夠減少對高階線譜頻率矢量量化所需的碼本體積和計(jì)算量。
文檔編號G10L19/04GK102867516SQ20121033461
公開日2013年1月9日申請日期2012年9月10日優(yōu)先權(quán)日2012年9月10日
發(fā)明者殷福亮, 陳喆, 汪林, 張旭申請人:大連理工大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：殷福亮;陳喆;汪林;張旭
技術(shù)所有人：大連理工大學(xué)
我是此專利的發(fā)明人

上一篇：一種多音混音音樂盒的制作方法
上一篇：人機(jī)互動的歌曲演唱系統(tǒng)、方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

高階線性微分方程相關(guān)技術(shù)

高階非線性系統(tǒng)相關(guān)技術(shù)

線性相關(guān)系數(shù)相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法