專利名稱:一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法,屬于語音編碼技術(shù)領(lǐng)域。
背景技術(shù):
基本的語音通信過程如說明書附圖I所示,對語音編解碼器的要求是在保證語音質(zhì)量的前提下,編碼碼流的比特率越低越好。采用矢量量化技術(shù)、線性預(yù)測分析技術(shù)和數(shù)據(jù)插值技術(shù)的編解碼器能夠很好地滿足這個(gè)要求。在基于上述技術(shù)的語音編解碼器中,線性預(yù)測系數(shù)的編解碼過程為在編碼端,用萊文森-德賓算法算法求解線性預(yù)測系數(shù),并轉(zhuǎn)化為相應(yīng)的線譜頻率參數(shù),用存儲在本地的碼本對線譜頻率參數(shù)進(jìn)行矢量量化,得到碼本的索引號。這些索引號會和其它語音編碼參數(shù)一起被打包成比特流,通過通信網(wǎng)絡(luò)傳送到 輸出端。在解碼端,根據(jù)從編碼器傳送的索引號解碼出線譜頻率參數(shù),并轉(zhuǎn)化為對應(yīng)的線性預(yù)測系數(shù),最后根據(jù)線性預(yù)測系數(shù)及其它編碼參數(shù)合成出語音,整個(gè)過程的原理如說明書附圖2所示。矢量量化是一種高效的數(shù)據(jù)壓縮方法,如說明書附圖3所示,它是將若干個(gè)標(biāo)量數(shù)據(jù)組構(gòu)成一個(gè)矢量,然后在矢量空間中進(jìn)行整體量化。對I個(gè)N維編碼端待量化矢量X,從N維碼本矢量集Y= {y (I),y (2),. . .,y (L)}中選擇與x最匹配的矢量y (i),在信道中只需傳輸y(i)在碼本Y中的索引號i即可。在解碼端,根據(jù)索引號i即可找到對應(yīng)矢量y(i),并作為解碼結(jié)果輸出。碼本的設(shè)計(jì)可使用LBG算法。為了降低矢量量化所需的碼本體積,分裂式矢量量化技術(shù)應(yīng)運(yùn)而生。分裂式矢量量化技術(shù)是比較適合于高階線譜頻率參數(shù)量化的一種方法,分裂矢量量化的過程如圖4所示。分裂式矢量量化是指將待量化矢量分為幾個(gè)低維子矢量,每個(gè)子矢量分別使用不同的碼本量化。計(jì)算出信號線譜頻率參數(shù)后,將線譜頻率參數(shù)分為T個(gè)子矢量Isftl, Isf1,.. .,Isf^1,每一部分分別使用不同的碼本作矢量量化,得到索引號0,1,…,T-1,由這T個(gè)索引號聯(lián)合表示LSF參數(shù)。同理,在解碼端由這T個(gè)索引號恢復(fù)T個(gè)子矢量Isftl, Isf1,.. .,IsfV1,再合并出完整LSF參數(shù),并進(jìn)一步計(jì)算線性預(yù)測系數(shù)。說明書附圖4中的矢量量化在編碼端表示碼本搜索,在解碼端表示碼本提取。同傳統(tǒng)的矢量量化技術(shù)相比,分裂式矢量量化所需的碼本體積大大減小。但其還存在兩個(gè)問題第一,從高階線性預(yù)測系數(shù)直接計(jì)算高階線譜頻率參數(shù),運(yùn)算量很大,運(yùn)算量與線性預(yù)測系數(shù)個(gè)數(shù)的平方成正比;第二,針對T個(gè)子矢量,需要分別設(shè)計(jì)T組碼本,因此高階線譜頻率參數(shù)所需要的碼本總量仍然很大。在語音信號分析中,常把語音x(n)看作是一個(gè)時(shí)間序列模型的輸出,x(n)可表示為
Mx(n) + 工a(i)x[n - i) = < (/ )
;=1其中,M為線性預(yù)測分析階數(shù)。a(i),i = 1,2,…,M為模型參數(shù),也稱線性預(yù)測系數(shù)。e(n)為激勵信號。x(n)也可以等效為e(n)經(jīng)過一個(gè)全極點(diǎn)濾波器(也稱合成濾波器)H(z)的輸出,H(z)可表示為
Hi-) = I =-—-
_7]稱)I+!>(/)-
i=l其中,A(z)稱為預(yù)測誤差濾波器。給定輸入語音信號(或其自相關(guān)函數(shù)),系數(shù)a(i)可以由萊文森-德賓(Levinson-Durbin)算法求出;實(shí)際應(yīng)用當(dāng)中,除了使用線性預(yù)測系數(shù)表征聲道模型外,還常使用反射系數(shù)k(i)和線譜頻率(線譜頻率)參數(shù)lsf(i),使用lsf(i)生成H(Z)時(shí),和k(i) 一樣容易保證H(Z)的穩(wěn)定性,且lsf(i)量化特性和內(nèi)插特性均優(yōu)于k(i),使得產(chǎn)生相同質(zhì)量的合成語音所需的編碼碼率得以降低,因此,目前對線性預(yù)測參數(shù)的矢量量化通常在線譜頻率域上進(jìn)行。這三種參數(shù)之間的關(guān)系如下
(I)已知線性預(yù)測系數(shù)a(i),求反射系數(shù)k(i)的遞推方法為k (m) =-a (m, m),a (m-1, i) = [a (m, i) +k (m) a (m, m - i) ] / [I - k (i)]。其中,m是階數(shù),m = M,M-1,. . .,I。a(m,i)是m階的第i個(gè)線性預(yù)測系數(shù)。k(m)是第m個(gè)反射系數(shù)。(2)已知反射系數(shù)k(i),求線性預(yù)測系數(shù)a(i)的遞推方法為a(m,m)=k(m),a (m, i) = [a (m - I, i) +k (m) a (m - I, m - i)],其中,m是階數(shù),m=l, 2, . . .,M。a(m, i)是m階的第i個(gè)線性預(yù)測系數(shù),i =I, 2, , m-lo k(m)是第m個(gè)反射系數(shù)。(3)已知線性預(yù)測系數(shù)a⑴,求線譜頻率參數(shù)Isf⑴的方法為使用線性預(yù)測系數(shù)a(i)可以構(gòu)建兩個(gè)多項(xiàng)式P(Z)和Q(Z);P (z) =A (z)+z-(M+1)A (z-1),Q (z) =A (z) -z_(m+1)A (z_1)。方程P (z)=0與Q (z)=0在余弦域的根lspP(i)與lspQ (i)稱為線譜對系數(shù),求解線譜頻率參數(shù)的數(shù)值方法有許多種,如代數(shù)式方程求根法和DFT方法等??梢宰C明,當(dāng)A(Z)的零點(diǎn)都位于單位圓內(nèi)時(shí),多項(xiàng)式P (z)和Q(Z)具有如下性質(zhì)P(Z)和Q(Z)的零點(diǎn)都位于單位圓上,P(Z)和Q(Z)的零點(diǎn)沿著單位圓上隨著《的增加交替出現(xiàn),若除去P(z)的I和Q(Z)的- I這兩個(gè)零點(diǎn),P(Z)和Q(Z)還各有M個(gè)零點(diǎn)。當(dāng)A(Z)滿足最小相位特性時(shí),可以由線性預(yù)測系數(shù)唯一確定線譜頻率參數(shù)。由lspP(i)、lspQ(i)計(jì)算反余弦即可得到Isfp⑴、Isf0⑴。lsfp(i) =arccos [lspP (i)],lsfQ(i) =arccos [lspQ (i)]。(4)已知線譜頻率參數(shù)Isf (i),求線性預(yù)測系數(shù)a (i)的方法為使用線譜頻率參數(shù)Isfp(i) Isf0(i)可以計(jì)算lsfP(i)、lsfQ(i),即lspp(i) =cos [lsfp (i)],lspQ(i) =cos [lsfQ (i)]。使用LSP參數(shù)lSpP(i)lSpQ(i)可以構(gòu)建兩個(gè)多項(xiàng)式P(z)和Q(Z)P (z) = (l+z_1) II (I-Ispp ⑴ Z-1),
Q (z) = (l-z_1) n (l-lspQ ⑴ z-1)。其中,n表示連乘。A(Z)可以用多項(xiàng)式P(Z)和Q(Z)表示為A (Z) = [P(z)+Q (Z)]/2。
對音頻信號進(jìn)行線性預(yù)測分析時(shí),分析精度與線性預(yù)測的階數(shù)直接相關(guān)。對語音信號來說,10階線性預(yù)測分析就足夠合成出高質(zhì)量的語音。對音樂或具有復(fù)雜背景聲的信號,則需要提高線性預(yù)測分析階數(shù)以獲得更多的頻譜細(xì)節(jié)。但是高階線性預(yù)測分析也帶來了另外一些問題。在編碼時(shí),線性預(yù)測系數(shù)在傳輸之前要先經(jīng)過量化,以降低數(shù)碼率。線譜頻率(線譜頻率)具有良好的內(nèi)插特性和抗量化誤差能力,矢量量化通常在線譜頻率域進(jìn)行。但隨著線性預(yù)測階數(shù)增加,現(xiàn)有語音編碼器均使用代數(shù)式方程求根法由線性預(yù)測系數(shù)a(i)求解線譜頻率參數(shù)lsf(i),從線性預(yù)測系數(shù)計(jì)算線譜頻率參數(shù)所需的運(yùn)算量與線性預(yù)測系數(shù)個(gè)數(shù)的平方成正比;同時(shí),即使采用分裂矢量量化技術(shù),對高階線譜頻率矢量量化所需的碼本體積也很大,故高階線性預(yù)測分析在低碼率、高質(zhì)量語音編碼器中的應(yīng)用非常困難??s略語和關(guān)鍵術(shù)語定義VQ :Vector Quantization,矢量量化。線性預(yù)測LinearPrediction,線性預(yù)測。線性預(yù)測系數(shù)Linear Prediction Coefficient,線性預(yù)測系數(shù)。Levinson算法也稱為Levinson-Durbin算法,萊文森-德賓算法,是一種基于自相關(guān)函數(shù)計(jì)算線性預(yù)測系數(shù)的方法。LSP Linear Spectrum Pair,線譜對。LSF Linear Spectrumfrequency,線譜頻率。
發(fā)明內(nèi)容
為了克服上述的不足,本發(fā)明的目的在于提供一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法,其能夠應(yīng)用于低碼率、高質(zhì)量語音編解碼器中,能夠減少對高階線譜頻率矢量量化所需的碼本體積和計(jì)算量。本發(fā)明采取的技術(shù)方案分如下,分編碼和解碼兩步驟I、一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法;分編碼和解碼兩步驟,第一步編碼,編碼按照以下步驟進(jìn)行(I)使用萊文森-德賓算法進(jìn)行高階線性預(yù)測分析得到R個(gè)線性預(yù)測系數(shù)a(i)并且R=dM;可由已知R個(gè)線性預(yù)測系數(shù)a(i)得到R個(gè)反射系數(shù)k(i) (i = 1,2,…,R);所述已知R個(gè)線性預(yù)測系數(shù)a(i),求R個(gè)反射系數(shù)k(i)的遞推方法為k (m) =-a (m, m),a (m-1, i) = [a (m, i) +k (m) a (m, m_i) ] / [l~k (i)],其中,m是階數(shù),m = R,R_1,…,I ;a(m, i)是進(jìn)行m階線性預(yù)測時(shí)的第i個(gè)線性預(yù)測系數(shù),k(m)是第m個(gè)反射系數(shù);所述R、M、d均為正整數(shù),R范圍為10 100,M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ;(2)反射系數(shù)k分組器將R個(gè)反射系數(shù)k(i) (i = 1,2,...,10分為(1組,每組包含相鄰M個(gè)反射系數(shù)k(i) (i = I, 2, . . . , M);所述的第j組的第i個(gè)系數(shù)k(j, i)與k(i)的關(guān)系表示為 k(j,i)=k(jM+i) (j=0, I,..., d-1 ;i = 1,2,...,10;所述1 1、(1均為正整數(shù),所述M范圍為8 16,R、M、d須滿足關(guān)系R=dM;(3)對每組M階反射系數(shù)k(j,i),經(jīng)過k —a轉(zhuǎn)化器計(jì)算出對應(yīng)的M階線性預(yù)測系數(shù)a(j,i) (j=0, I, ...,d -l ;i = 1,2,...,M);所述R、M、d均為正整數(shù),所述M范圍為8 16,R、M、d須滿足關(guān)系R=dM,R范圍為10 100 ;所述已知反射系數(shù)k(i),求線性預(yù)測系數(shù)a(i)的遞推方法為a(m,m)=k(m),a (m, i) = [a (m-1, i) +k (m) a (m - I, m - i)],其中,m是階數(shù),m=l,2,...,M;a(m, i)是m階線性預(yù)測時(shí)的第i個(gè)線性預(yù)測系數(shù),
i= I, 2, . . . , m-1 ;k(m)是第m個(gè)反射系數(shù);(4)對每組已知M個(gè)線性預(yù)測系數(shù)a(j,i)經(jīng)過a — Isf轉(zhuǎn)化器計(jì)算出對應(yīng)的線譜頻率參數(shù) Isf (j,i) (j=0, l,...,d-l ;i = 1,2,...,M);所述 M 范圍為 8 16,d 為正整數(shù),R、M、d須滿足關(guān)系R=dM,所述R、M、d均為正整數(shù);所述已知線性預(yù)測系數(shù)a(i),求線譜頻率參數(shù)lsf(i)的方法為使用線性預(yù)測系數(shù)a(i)可以構(gòu)建兩個(gè)多項(xiàng)式P(Z)和Q(Z);P(z)=A(z)+z_(m+1)A(z_1),Q (z) =A (z) _z-(m+1)A (z-1);
M所述+二一,M是線性預(yù)測階數(shù),z代表Z變換域的自變量;方程P(Z)=O 與 Q(Z)=O 在余弦域的根分別為 lspp(i)與 lspQ(i),i=l, 2,. . . ,M+1,稱lspP(i)與lspQ(i)為線譜對系數(shù),當(dāng)A(Z)的零點(diǎn)都位于單位圓內(nèi)時(shí),P(z)和Q(Z)的零點(diǎn)都位于單位圓上,P(Z)和Q(Z)的零點(diǎn)沿著單位圓上隨著《的增加交替出現(xiàn),若除去I和- I這兩個(gè)零點(diǎn),P (z)和Q(Z)各有M個(gè)零點(diǎn),當(dāng)A(Z)滿足最小相位特性時(shí),可以由線性預(yù)測系數(shù)a(i)唯一確定線譜頻率參數(shù)lspP(i)與lspQ(i), i = I, 2, . . . , M/2 ;由Ispp⑴、lspQ(i)計(jì)算反余弦即可得到lsfP(i)、lsfQ(i);lsfp(i) =arccos [lspP (i)],lsfQ(i) =arccos [lspQ (i)];lsfp(i)、lsfQ(i)交錯排列Isf(2i)=lsfP(i),Isf(2i+l) =lsfQ(i);可得lsf(i);(5)矢量量化器使用相同的量化碼本對d組線譜頻率參數(shù)分別作矢量量化得到d個(gè)索引號,索引號和其它編碼參數(shù)一起被打包成比特流進(jìn)入通信網(wǎng)絡(luò)并被傳送到輸出端;第二步解碼,解碼按照以下步驟進(jìn)行(I)根據(jù)通信網(wǎng)絡(luò)接收的d個(gè)索引號可以恢復(fù)d組線譜頻率參數(shù)Isf (j,i)(j=0, I,...,d-1 ;i = 1,2,...,M),對d組線譜頻率參數(shù)使用Isf— a轉(zhuǎn)化器計(jì)算對應(yīng)的M階線性預(yù)測系數(shù)a(j,i) (j=0, I, . ..,d-1 ;i = 1,2,所述M范圍為8 16,R范圍為10 100,R、M、d滿足關(guān)系R=dM ;所述R、M、d均為正整數(shù);所述已知線譜頻率參數(shù)Isf (i),使用Isf — a轉(zhuǎn)化器計(jì)算對應(yīng)的M階線性預(yù)測系數(shù)a(i)的方法為將偶數(shù)序號的lsf(i)參數(shù)定義為lSfP(i),奇數(shù)序號的lsf(i)參數(shù)定義為Isf0Q),lsfp(i) =Isf (2i),lsfQ(i) =Isf(2i+l);其中,i=l, 2, ,M/2 ;對線譜頻率參數(shù)Isfp⑴、lsfQ(i)取余弦可以計(jì)算LSP參數(shù)lspP(i)、lspQ(i),即 lspp(i) =cos [lsfp (i)],lspQ(i)=cos[lsfQ(i)];使用LSP參數(shù)lspP(i)、lspQ(i)可以構(gòu)建兩個(gè)多項(xiàng)式P (z)和Q(Z)P(Z) =(1 + 2-1 )|"|[1 — Ilspr (、/):-1 + z-2],
U/2Q(Z) ={l-z-l)\{[l-2lspQ{i)z-1 +Z-2]。
仁I其中,n表示連乘,Z代表Z變換域的自變量,M是線性預(yù)測階數(shù)代表系數(shù)a(i)的數(shù)目;多項(xiàng)式A (Z)可以用多項(xiàng)式P (Z)和Q (Z)表示為A (Z) = [P(z)+Q (Z)]/2。
M根據(jù)表達(dá)式= I + [ ainz",按照z-i系數(shù)對應(yīng)相等的原則,即可確定出
/=1
a(i)的值,(2)對d組M階線性預(yù)測系數(shù)a (j,i)使用a — k轉(zhuǎn)化器計(jì)算對應(yīng)的M階反射系數(shù)k(j, i) (j=0, I,..., d-1 ;i = 1,2,.. ,M),R、M、d 須滿足關(guān)系 R=dM;R 范圍為 10 100 ;所述M范圍為8 16,R范圍為10 100,R、M、d滿足關(guān)系R=dM ;所述R、M、d均為正整數(shù);所述已知線性預(yù)測系數(shù)a (i),使用a — k轉(zhuǎn)化器求反射系數(shù)k(i)的遞推方法為k (m) =-a (m, m),a (m-1, i) = [a (m, i) +k (m) a (m, m_i) ] / [l~k (i)],其中,m是階數(shù),m = M,M-l,…,I ;a(m,i)是m階的第i個(gè)線性預(yù)測系數(shù),k(m)是第m個(gè)反射系數(shù);所述M范圍為8 16,R范圍為10 100,R、M、d滿足關(guān)系R=dM ;所述R、M、d均為正整數(shù);(3)對d組反射系數(shù)k(j,i) (j=0, I, ...,d-1)使用反射系數(shù)組合器按順序組成R階反射系數(shù) k(jM+i)=k(j,i) (j=0,= 1,2,...,M);所述 M 范圍為 8 16,R 范圍為10 100,R、M、d滿足關(guān)系R=dM,所述R、M、d均為正整數(shù);(4)對R階反射系數(shù)k(i)使用k —a轉(zhuǎn)化器轉(zhuǎn)換為R階線性預(yù)測系數(shù)a(i)(i=l, 2,…,R) :R范圍為10 100,R、M、d滿足關(guān)系R=dM,M范圍為8 16,所述R、M、d均為正整數(shù);所述已知R階反射系數(shù)k⑴,使用k — a轉(zhuǎn)化器求R階線性預(yù)測系數(shù)a⑴的遞推方法為a (m, m) =k (m),a (m, i) = [a (m - I, i) +k (m) a (m - I, m - i)],其中,m是階數(shù),m=l, 2, . . . , R ;a(m, i)是m階的第i個(gè)線性預(yù)測系數(shù),i =1,2,. . .,m - 1,k(m)是第m個(gè)反射系數(shù),R范圍為10 100,R、M、d滿足關(guān)系R=dM,M范圍為8 16,所述R、M、d均為正整數(shù);·
本發(fā)明的有益效果如下(I)顯著降低使用高階線性預(yù)測系數(shù)的語音編碼器的運(yùn)算量。將高階線性預(yù)測系數(shù)分解為多組低階線性預(yù)測系數(shù),然后再計(jì)算對應(yīng)的線譜頻率參數(shù)。計(jì)算多組低階線譜頻率參數(shù)所需的運(yùn)算量要小于直接計(jì)算高階線譜頻率所需的運(yùn)算量。(2)減少矢量量化所用碼本的體積,進(jìn)而減少碼本的存儲量。將反射系數(shù)劃分為多個(gè)子組,然后將各子組的反射系數(shù)轉(zhuǎn)化為線譜頻率參數(shù)后分別予以矢量量化。各子組的線譜頻率參數(shù)都分布在(0,Ji)區(qū)間內(nèi),因此可以使用相同的碼本做矢量量化,減少了總的碼本矢量的個(gè)數(shù),從而節(jié)省了碼本存儲空間。(3)本發(fā)明適合應(yīng)用到變碼率分級語音編碼算法中。各個(gè)子組根據(jù)反射系數(shù)劃分,而各個(gè)反射系數(shù)是與線性預(yù)測階數(shù)無關(guān)的?;诖?,在傳輸碼流時(shí),根據(jù)信道帶寬情況,可以首先傳送低階線性預(yù)測分析得到的反射系數(shù)生成的線譜頻率系數(shù)索引;若信道帶寬允許,再傳輸更高階數(shù)的反射系數(shù)生成的線譜頻率系數(shù)索引。
圖I為語首通/[目過程不意圖;圖2為現(xiàn)有的基于線譜頻率參數(shù)和矢量量化技術(shù)的語音編碼器即語音編解碼器中LP系數(shù)編碼工作過程示意圖;圖3為矢量量化原理圖;圖4為分裂式矢量量化原理圖;圖5為本發(fā)明技術(shù)原理框圖。
具體實(shí)施例方式基本的語音通信過程如說明書附圖I所示,原始的語音信號經(jīng)過發(fā)送端語音編碼器后變成碼流,碼流經(jīng)過信道傳輸?shù)浇邮斩说恼Z音解碼器后恢復(fù)出原始的語音信號?,F(xiàn)有的基于線譜頻率參數(shù)和矢量量化技術(shù)的語音編碼器如說明書附圖2所示,原始的待編碼語音信號LP分析模塊后,得到LP系數(shù);LP系數(shù)經(jīng)過LSF計(jì)算模塊后,得到LSF系數(shù);LSF系數(shù)經(jīng)過矢量量化模塊后,得到碼本索引參數(shù);碼本索引參數(shù)經(jīng)過通信信道被傳輸?shù)浇邮斩?。接收端解碼過程與編碼過程相反,接收的經(jīng)過逆矢量量化模塊后,得到LSF系數(shù);LSF系數(shù)經(jīng)過LP系數(shù)計(jì)算模塊后,得到LP系數(shù);LP系數(shù)即被用于合成語音模塊中來合成語音信號。實(shí)用的語音編碼器的編碼參數(shù)除了 LSF碼本索引參數(shù)外,還包括如基音周期、固定碼本索引等,但這些參數(shù)的處理與本發(fā)明關(guān)聯(lián)不大,故此處沒有贅述。矢量量化原理圖如說明書附圖3所示,待量化的矢量通入碼書搜索器,碼書搜索器搜索編碼器碼本中與待量化的矢量最接近的碼字,并將該碼字索引經(jīng)過通信信道傳輸?shù)浇邮斩恕=邮斩私獯a過程與編碼過程相反,碼書提取器根據(jù)接收的索引,從解碼器碼本得到解碼輸出矢量。分裂式矢量量化原理圖如說明書附圖4所示,LP系數(shù)LSF計(jì)算模塊得到LSF系數(shù),該LSF系數(shù)矢量被簡單分割一系列長度較小的矢量。而后分別進(jìn)行矢量量化得到多個(gè)索引值,這些索引值經(jīng)數(shù)據(jù)打包,經(jīng)過通信信道傳輸?shù)浇邮斩?。接收端解碼過程與編碼過程相反,數(shù)據(jù)先經(jīng)過拆包模塊得到多個(gè)索引值,每個(gè)索引值經(jīng)過反量化得到一系列長度較小的矢量,這些長度較小的矢量被LSF組合模塊組合為LSF系數(shù)矢量,進(jìn)而經(jīng)過LP恢復(fù)模塊恢復(fù)出LP系數(shù)用于合成語音。本發(fā)明采取的技術(shù)方案分兩步驟I.編碼技術(shù)方案(I)使用萊文森-德賓算法進(jìn)行高階線性預(yù)測分析,得到R個(gè)線性預(yù)測系數(shù)a (i)。適當(dāng)選取R,使之滿足R=dM。圖5中,a —k轉(zhuǎn)化器使用背景技術(shù)中提及的方法,可由R個(gè) a(i)得到 R 個(gè)反射系數(shù) k(i), i = 1,2, ,R。在編碼技術(shù)方案中涉及的變量R、M、d的取值范圍均相同,R、M、d均為正整數(shù),R范圍為10 100,M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ;已知線性預(yù)測系數(shù)a (i),求反射系數(shù)k(i)的遞推方法為k (m) =-a (m, m),a (m-1, i) = [a (m, i) +k (m) a (m, m_i) ] / [1-k (i)]。其中,m是階數(shù),m = M,M-1,. . .,I。a (m,i)是m階的第i個(gè)線性預(yù)測系數(shù)。k(m)是第m個(gè)反射系數(shù)。(2)如圖5所示,反射系數(shù)k分組器將R個(gè)反射系數(shù)分為d組,每組包含相鄰M個(gè)反射系數(shù)。例如,第j組的第i個(gè)系數(shù)k(j,i)與k(i)的關(guān)系可以表示為k (j,i)=k(jM+i),j=0, I, . . . , d-1, i = 1,2,...,M。(3)對每組M階反射系數(shù),圖5中k —a轉(zhuǎn)化器使用背景技術(shù)中提及的方法計(jì)算出對應(yīng)的 M 階線性預(yù)測系數(shù) a (j,i),j=0, 1, ,d-1,i = 1,2, ,M。(4)對每組M個(gè)線性預(yù)測系數(shù),圖5中a— Isf轉(zhuǎn)化器使用背景技術(shù)中提及的方法計(jì)算出對應(yīng)的線譜頻率參數(shù)Isf (j, i), j=0, I,. . . , d-l,i = I, 2,. . . ,Mo由于這些組的線譜頻率參數(shù)都分布在(0,Ji)區(qū)間,分布情況類似,因此可用相同的碼本量化它們。(5)矢量量化器矢量量化使用相同的量化碼本對d組線譜頻率參數(shù)分別作矢量量化,得到d個(gè)索引號。這些索引號會進(jìn)入通信網(wǎng)絡(luò),并被傳送到輸出端。2.解碼技術(shù)方案;(I)根據(jù)通信網(wǎng)絡(luò)接收的d個(gè)索引號可以恢復(fù)d組線譜頻率參數(shù)Isf (j,i),j=0, I,. . .,d-1, i = 1,2,. . .,M。對d組線譜頻率參數(shù)。對d組M階線譜頻率參數(shù),使用圖5中Isf — a轉(zhuǎn)化器計(jì)算對應(yīng)的M階線性預(yù)測系數(shù)a (j, i), j=0, I,. . .,d_l, i = 1,2,. . .,M。在解碼技術(shù)方案中涉及的變量R、M、d的取值范圍均相同,R、M、d均為正整數(shù),R范圍為10 100,M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ;(2)對d組M階線性預(yù)測系數(shù)a (j, i),使用圖5中a — k轉(zhuǎn)化器計(jì)算對應(yīng)的M階反射系數(shù) k(j, i),j=0, I, . . . , d-1, i = I, 2, . . . , Mo(3)對d組反射系數(shù)k (j,i),j=0,I,. . .,d-1。使用圖5中反射系數(shù)組合器按順序組成 R 階反射系數(shù) k(jM+i)=k(j, i), j=0, I, . . . , d_l, i = 1,2, · · ·,Μ。(4)對R階反射系數(shù)k(i),圖5中k — a轉(zhuǎn)化器使用背景技術(shù)中提及的方法轉(zhuǎn)換為R階線性預(yù)測系數(shù)a (i),i = 1,2,...,R。以R=50、M = 10、d = 5為例,在線性預(yù)測系數(shù)編碼輸出50bit的情況下,運(yùn)算量、
碼本體積等的情況如下。
權(quán)利要求
1. 一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法,其特征在于分編碼和解碼兩步驟, 第一步編碼, 編碼按照以下步驟進(jìn)行 (1)使用萊文森-德賓算法進(jìn)行高階線性預(yù)測分析得到R個(gè)線性預(yù)測系數(shù)a(i)并且R=dM ;可由已知R個(gè)線性預(yù)測系數(shù)a(i)得到R個(gè)反射系數(shù)k(i) (i = I, 2, . . . , R); 所述已知R個(gè)線性預(yù)測系數(shù)a(i),求R個(gè)反射系數(shù)k(i)的遞推方法為k(m)=-a(m,m), a (m-1, i) = [a (m, i) +k (m) a (m, m - i) ] / [I - k (i)], 其中,m是階數(shù),m = R,R-l,…,l;a(m,i)是進(jìn)行m階線性預(yù)測時(shí)的第i個(gè)線性預(yù)測系數(shù),km)是第m個(gè)反射系數(shù); 所述R、M、d均為正整數(shù),R范圍為10 100,M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ; (2)反射系數(shù)k分組器將R個(gè)反射系數(shù)k(i)(i = 1,2,...,R)分為d組,每組包含相鄰M個(gè)反射系數(shù)k(i) (i = I, 2,, M);所述的第j組的第i個(gè)系數(shù)k(j, i)與k(i)的關(guān)系表示為 k(j,i)=k(jM+i) (j=0, ;i = 1,2,...,10;所述1 ^、(1均為正整數(shù),1 范圍為10 100,M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ; (3)對每組M階反射系數(shù)k(j,i),經(jīng)過k— a轉(zhuǎn)化器計(jì)算出對應(yīng)的M階線性預(yù)測系數(shù)a(j, i) (j=0, 1, ,d-l ;i = 1,2, ,M);所述 R、M、d 均為正整數(shù),R 范圍為 10 100,M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM; 所述已知反射系數(shù)k(i),求線性預(yù)測系數(shù)a(i)的遞推方法為 a (m, m) =k (m), a (m, i) = [a (m-1, i) +k (m) a (m - I, m - i)], 其中,m是階數(shù),m=l, 2,. . .,M ;a (m,i)是m階線性預(yù)測時(shí)的第i個(gè)線性預(yù)測系數(shù),i =I, 2, . . . , m - I ;k(m)是第m個(gè)反射系數(shù); (4)對每組已知M個(gè)線性預(yù)測系數(shù)a(j, i)經(jīng)過a — Isf轉(zhuǎn)化器計(jì)算出對應(yīng)的線譜頻率參數(shù) Isf (j,i) (j=0, ;i = 1,2,...,M);所述 R、M、d 均為正整數(shù),R 范圍為 10 .100,M范圍為8 16 ;R、M、d須滿足關(guān)系R=dM ; 所述已知線性預(yù)測系數(shù)a(i),求線譜頻率參數(shù)lsf(i)的方法為 使用線性預(yù)測系數(shù)a(i)可以構(gòu)建兩個(gè)多項(xiàng)式P(Z)和Q(Z);P(z)=A(z)+z^(m+1)A(z^), Q(Z)=A(Z) -z; 所述
全文摘要
本發(fā)明公開了一種采用高階線性預(yù)測系數(shù)分組矢量量化的語音編解方法,其能夠應(yīng)用于低碼率、高質(zhì)量語音編解碼器中,能夠減少對高階線譜頻率矢量量化所需的碼本體積和計(jì)算量。
文檔編號G10L19/04GK102867516SQ20121033461
公開日2013年1月9日 申請日期2012年9月10日 優(yōu)先權(quán)日2012年9月10日
發(fā)明者殷福亮, 陳喆, 汪林, 張旭 申請人:大連理工大學(xué)