国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于語音編碼的方法和設備的制作方法

      文檔序號:2833530閱讀:472來源:國知局
      專利名稱:用于語音編碼的方法和設備的制作方法
      技術領域
      本發(fā)明一般涉及信號壓縮系統(tǒng),更具體涉及用于語音編碼的方法和設備。
      背景技術
      低速編碼應用,諸如數(shù)字語音,通常采用諸如線性預測編碼(LPC)的技術來對短時語音信號的頻譜建模。采用LPC技術的編碼系統(tǒng)提供了預測殘差信號來校正短時模型的特性。一種這樣的語音系統(tǒng)是稱為碼激勵線性預測(CELP)的語音編碼系統(tǒng),其以低碼率提供了高質量的合成語音,其中的低碼率也就是4.8到9.6kbps的碼率。這類語音編碼也被稱為矢量激勵線性預測或隨機編碼,用于許多語音通信和語音合成應用中。CELP還特別適用于很關注語音質量、數(shù)據(jù)率、大小和成本的數(shù)字語音加密和數(shù)字無線電話通信系統(tǒng)。
      實現(xiàn)LPC編碼技術的CELP語音編碼器通常采用長時(基音)和短時(共振峰)預測器,對輸入語音信號的特性進行建模并且結合到一組時變線性濾波器中。濾波器的激勵信號或碼矢量是從存儲的碼矢量碼本中選取的。對于每個語音幀,語音編碼器將碼矢量應用于濾波器以生成重構的語音信號,并且將原始輸入語音信號與重構信號進行比較來創(chuàng)建差信號。隨后通過使差信號通過具有基于人類聽覺的響應的感覺加權濾波器來對差信號進行加權。通過選擇產生具有最小能量(差值)的加權差信號的一個或多個碼矢量來為當前幀確定優(yōu)化激勵信號。通常,將幀分成兩個或者更多的相鄰的子幀。通常每幀確定一次短時預測器參數(shù),通過在當前幀和前一幀的短時預測器參數(shù)之間插值來在每個子幀進行更新。通常對于每一子幀確定激勵信號參數(shù)。
      例如,圖1是現(xiàn)有技術的CELP編碼器100的框圖。在CELP編碼器100中,將輸入信號s(n)施加到線性預測(LP)分析器101,其中使用線性編碼來估計短時譜包絡。生成的譜系數(shù)(或者線性預測(LP)系數(shù))由傳輸函數(shù)A(z)表示。將譜系數(shù)施加于LP量化器102,量化譜系數(shù)以產生適用于復用器109的量化后的譜系數(shù)Aq。隨后將量化譜系數(shù)Aq傳輸?shù)綇陀闷?09,復用器根據(jù)量化頻譜系數(shù)和一組與激勵矢量有關的參數(shù)L,βi’s,I和γ產生編碼碼流,其中這組與激勵矢量有關的參數(shù)是通過方差最小化/參數(shù)量化模塊108確定的。結果,對于每個語音塊,產生了對應的一組與激勵矢量有關的參數(shù),其包括多抽頭(multi-tap)長時預測器(LTP)參數(shù)(滯后L和多抽頭預測器系數(shù)βi’s),以及固定碼本參數(shù)(索引I和縮放因子γ)。
      量化譜參數(shù)還本地傳送到具有對應的傳輸函數(shù)1/Aq(z)的LP合成濾波器105。LP合成濾波器105還接收組合激勵信號ex(n)并根據(jù)量化譜系數(shù)Aq和組合激勵信號ex(n)產生對輸入信號的估計 。組合激勵信號ex(n)如下產生。固定碼本(FCB)碼矢量或激勵矢量 基于固定碼本索引參數(shù)I而選擇白固定碼本(FCB)103。FCB碼矢量 隨后根據(jù)增益參數(shù)γ進行縮放,將縮放后的固定碼本碼矢量傳送到多抽頭長時預測器(LTP)濾波器104。多抽頭LTP濾波器104具有對應的傳輸函數(shù)1(1-&Sigma;i=-K1K2&beta;iz-L+i),K1&GreaterEqual;0,K2&GreaterEqual;0,K=1+K1+K2---(1)]]>其中,K是LTP濾波器階數(shù)(通常在1到3之間,包含1、3),βi’s和L是與激勵矢量有關的參數(shù),通過方差最小/參數(shù)量化模塊108傳送到濾波器。在上面的LTP濾波器傳輸函數(shù)的定義中,L是以采樣數(shù)目表示的延遲的整數(shù)值。LTP濾波器傳輸函數(shù)的這種形式在下述論文中有描述Bishnu S.Atal,“Predictive Coding of Speech at Low BitRates,”IEEE Transactions on Communications,VOL.COM-30,NO.4,April 1982,pp.600-614(以下稱為Atal)以及Ravi P.Ramachandran andPeter Kabal,“Pitch Prediction Filters in Speech Coding,”IEEETransactions on Acoustics,Speech,and Signal Processing,VOL.37,NO.4,April 1989,pp.467-478(以下稱為Ramachandran et.al.)。濾波器104對從FCB 103接收的縮放固定碼本碼矢量進行濾波,產生組合激勵信號ex(n)并將激勵信號傳送到LP合成濾波器105。
      LP合成濾波器105將輸入信號估計 傳送到組合器106。組合器106還接收輸入信號s(n)并用輸入信號s(n)減去輸入信號估計 輸入信號s(n)和輸入信號估計 之差施加到感覺差加權濾波器107,該濾波器根據(jù) 與s(n)之差以及加權函數(shù)W(z)產生感覺加權的差信號e(n)。隨后將感覺加權的差信號e(n)傳送到方差最小/參數(shù)量化模塊108。方差最小/參數(shù)量化模塊108使用差信號e(n)來確定差值E(通常,E=&Sigma;ne2(n)]]>),以及優(yōu)化的一組與激勵矢量有關的參數(shù)L,βi’s,I和γ,以根據(jù)最小化的E產生輸入信號s(n)的最佳估計 。量化LP系數(shù)和優(yōu)化的一組參數(shù)L,βi’s,I和γ隨后通過通信信道傳送到接收通信設備,在接收通信設備,語音合成器使用LP系數(shù)和與激勵矢量有關的參數(shù)來重構輸入語音信號的估計 ??商鎿Q的使用包括有效存儲到電子或電機設備,諸如計算機硬盤。
      在諸如編碼器100的CELP編碼器中,用于生成CELP編碼器組合激勵信號ex(n)的合成函數(shù)由下面的廣義差分方程給出ex(n)=&gamma;c~I(n)+&Sigma;i=-K1K2&beta;iex(n-L+i),n=0,...,N-1,K1&GreaterEqual;0,K2&GreaterEqual;0---(1a)]]>其中,ex(n)是子幀的合成組合激勵信號, 是碼矢量或激勵矢量,選擇自碼本,諸如FCB 103,I是索引參數(shù)或碼字,指定所選的碼矢量,γ是用于縮放碼矢量的增益,ex(n-L+i)是相對于當前子幀的第(n+i)個采樣延遲L(整數(shù)分解)個采樣的合成組合激勵信號(對于濁音語音,L通常與基音周期有關),βi’s是長時預測器(LTP)濾波器系數(shù),N是子幀中的采樣數(shù)。當n-L+i<0時,ex(n-L+i)包含過去合成激勵的歷史,構造為如式(1a)所示。也就是說,對于n-L+i<0,表達式“ex(n-L+i)”對應于在當前子幀之前構建的激勵采樣,該激勵采樣已經根據(jù)LTP濾波器傳輸函數(shù)延遲且縮放,其中傳輸函數(shù)為11-&Sigma;i=-K1K2&beta;iz-L+i,K1&GreaterEqual;0,K2&GreaterEqual;0,K=1+K1+K2---(2)]]>諸如編碼器100的典型CELP語音編碼器的任務在于選擇指定合成激勵的參數(shù),也就是編碼器100中的參數(shù)L,βi’s,I,γ,給出ex(n),0≤n<N以及所確定的短時線性預測器(LP)濾波器105的系數(shù),由此,當合成激勵序列ex(n),0≤n<N通過LP濾波器105濾波時,得到的合成語音信號 非常接近于(根據(jù)所采用的失真標準)要對該子幀編碼的輸入語音信號s(n)。
      當LTP濾波器階數(shù)K>1,式(1)中所定義的LTP濾波器是多抽頭濾波器。所述的常規(guī)整數(shù)采樣分解延遲多抽頭濾波器尋求將給定采樣預測為K個通常相鄰的延遲采樣的加權和,其中延遲限于期望的基音周期值的范圍內(通常8kHz信號采樣率為20到147個采樣之間)。整數(shù)采樣分解延遲(L)多抽頭LTP濾波器能夠隱式地對非整數(shù)值延遲建模,同時提供頻譜整形(Atal,Ramachandran et.al.)。多抽頭LTP濾波器除了L之外,需要K個獨特βi系數(shù)的量化。如果K=1,一階LTP濾波器結果只需要一個β0系數(shù)的量化和L。但是,一階LTP濾波器使用整數(shù)采樣分解延遲L,不能夠隱式地對非整數(shù)延遲值建模,不同于舍入到最近的整數(shù)或非整數(shù)延遲的整倍數(shù)。也不會提供頻譜整形。然而,考慮到許多低碼率語音編碼器實現(xiàn),通常已使用一階LTP濾波器實現(xiàn),因為只有兩個參數(shù)L和β需要量化。
      引入一階LTP濾波器,使用子采樣分解延遲,顯著提高了LTP濾波器設計的前沿技術。該項技術在下述文獻中有記載發(fā)明人Ira A.Gerson和Mark A.Jasiuk、題為“Digital Speech Coder Having ImprovedSub-sample Resolution Long-Term Predictor,”的美國專利5,359,696(下文稱為Gerson et.al.),以及教科書章節(jié)Peter Kroon和Bishnu S.Atal,“OnImproving the Performance of Pitch Predictors in Speech CodingSystems,”Advances in Speech Coding,Kluwer Academic Publishers,1991,Chapter 30,pp.321-327(下文稱為Kroon et.al)。使用這樣的技術,延遲值顯式地表示以子采樣分解,在此重新定義為 延遲 的采樣可以通過使用插值濾波器而獲得。為了計算具有不同小數(shù)部分的 值延遲的采樣,插值濾波器相位提供了最接近所需小數(shù)部分的表示,可以選擇來通過使用對應于所選插值濾波器相位的插值濾波器系數(shù)進行濾波而生成子采樣分解延遲采樣。這樣的一階LTP濾波器明顯使用了子采樣分解延遲,能夠以子采樣分解提供預測采樣,但是缺乏提供頻譜整形的能力。但是,已經看到(Kroon et.al.)一階LTP濾波器通過子采樣分解延遲可以比常規(guī)整數(shù)采樣分解延遲多抽頭LTP濾波器更加有效地去除長時信號相關。由于是一階LTP濾波器,只需要將兩個參數(shù)從編碼器傳送到解碼器β和 從而提高了相對于整數(shù)分解延遲多抽頭LTP濾波器的量化效率,因為整數(shù)分解延遲多抽頭LTP濾波器需要量化L和K個唯一的βi系數(shù)。因此,LTP濾波器的一階子采樣分解形式在當前CELP型語音編碼算法中得到了最廣泛應用。LTP濾波器傳輸函數(shù)由下式給出11-&beta;z-L^---(3)]]>也給出了對應的差分方程ex(n)=&gamma;c~I(n)+&beta;ex(n-L^),0&le;n&lt;N---(4)]]>在式(3)和(4)中隱式地使用了插值濾波器來通過子采樣分解延遲 計算所指向的采樣。
      圖2顯示了多抽頭LTP(圖1所示)與具有子采樣分解的LTP之間的固有差,如上所述。在編碼器200中,LTP 204只需要來自差最小化/參數(shù)量化模塊208的兩個參數(shù)(β, 隨后將參數(shù) β,I,γ,傳送到復用器109。
      注意,在關于LTP濾波器的描述中,給出了LTP濾波器傳輸函數(shù)的廣義形式。ex(n)對于n<0的值包含LTP濾波器狀態(tài)。對于有必要訪問n(n≥0)采樣的L或 值,當評估式(1)或(4)中的ex(n)時,通常使用稱為虛擬碼本或自適應碼本(ACB)的LTP濾波器的簡化和非等價形式,這將在后面進行詳細地描述。這項技術記載于發(fā)明人為Richard H.Ketchum,Willem B.Kleijn,Daniel J.Krasinski,題為“CodeExcited Linear Predictive Vocoder Using Virtual Searching”的美國專利4,910,781(下文稱為Ketchum et.al.)。術語“LTP濾波器”,嚴格地說,指的是式(1a)或(4)的直接實現(xiàn),但是如此處所使用的,也可以指LTP濾波器的ACB實現(xiàn)。在這個差別對于描述現(xiàn)有技術和本發(fā)明來說十分重要的情況下,將明顯地加以區(qū)分。
      ACB實現(xiàn)的圖形表示如圖3所示。當子采樣分解濾波器延遲 值大于子幀長度N時,圖2和3通常是等價的。在此情形下,ACB存儲器310和LTP濾波器204存儲器基本上包含相同的數(shù)據(jù)。但是,當濾波器延遲小于子幀長度時,縮放的FCB激勵和LTP濾波器存儲器通過LTP存儲器204再循環(huán),并且通過β系數(shù)進行遞歸縮放迭代。在ACB實現(xiàn)310中,ACB矢量使用單位增益長時濾波器進行循環(huán),形式上為ex(n)=ex(n-L^),0&le;n&lt;N---(4a)]]>然后使c0(n)=ex(n),0≤n<N,隨后通過單一、非遞歸情況的β系數(shù)進行縮放。
      考慮到討論過的實現(xiàn)LTP濾波器的兩種方法,即整數(shù)分解延遲多抽頭LTP濾波器和一階子采樣分解延遲LTP濾波器,每種方法都能夠直接實現(xiàn)(100,200)或者通過ACB方法(300)實現(xiàn),可詳細說明如下常規(guī)多抽頭預測器同時執(zhí)行兩個任務頻譜整形和通過生成預測采樣作為預測用采樣的加權和來進行非整數(shù)延遲的隱式建模(Atal et.al.和Ramachandran et.al.)。在常規(guī)多抽頭LTP濾波器中,兩個任務——頻譜整形和非整數(shù)延遲的隱式建模不會有效地在一起建模。例如,三階多抽頭LTP濾波器,如果不需要對給定子幀的頻譜整形,將通過非整數(shù)分解隱式地對延遲建模。但是,這樣一個濾波器的階數(shù)不足以高到能提供高質量內插采樣值。
      另一方面,一階子采樣分解LTP濾波器可以顯式地使用延遲的小數(shù)部分來選擇任意階插值濾波器的相位,并因此非常高質量。該方法中子采樣分解延遲被明顯地定義和使用,提供了表示插值濾波器系數(shù)的非常有效方法。這些系數(shù)不需要顯式地進行量化和傳輸,而是可以從接收的延遲中推導出來,其中所說的延遲是通過子采樣分解表示的。盡管這樣的濾波器不能夠引入頻譜整形,對于濁音(準周期性)語音來說,可以發(fā)現(xiàn)通過子采樣分解定義的延遲的效果比引入頻譜整形的能力更加重要(Kroon et.al.)。這就是通過子采樣分解延遲的一階LTP濾波器比常規(guī)多抽頭LTP濾波器更有效、更廣泛用于許多業(yè)界標準的原因。
      盡管子采樣分解一階LTP濾波器為LTP濾波器提供了非常有效的模型,希望提供一種機制來進行頻譜整形,這是子采樣分解一階LTP濾波器所缺乏的特性。語音信號諧波結構傾向于弱化高頻。這個效應對于寬帶語音編碼系統(tǒng)來說變得愈加顯著,而其特征就在于增加了信號帶寬(相對于窄帶信號)。在寬帶語音編碼系統(tǒng)中,信號帶寬可以達到8kHz(16kHz采樣率),而窄帶語音編碼系統(tǒng)只能達到最大4kHz(8kHz采樣率)。一種增加頻譜整形的方法記載于發(fā)明人為BrunoBessette,Redwan Salami,Roch Lefebvre,題為“Pitch Search in CodingWideband Signals”的專利WO 00/25298(下文稱為Bessette et.al.)。該方法如圖4所描繪的,規(guī)定提供至少兩個頻譜整形濾波器(420)以供選擇(其中的一個具有單位傳輸函數(shù)),并且需要通過評估頻譜整形濾波器對LTP矢量進行顯式濾波。還描述了該方法的可替換的實現(xiàn),由此提供了至少兩種不同的插值濾波器,每一種都具有不同的頻譜整形。在這兩種實現(xiàn)的任何一種中,濾波后的LTP矢量用于生成失真度量,其被結合LTP濾波器參數(shù)來評估(408)選擇使用這至少兩個頻譜整形濾波器中的哪個(421)。盡管這項技術提供了改變頻譜整形的方法,但其需要在計算對應于LTP矢量和頻譜整形濾波器組合的失真度量之前顯式地生成頻譜整形后的LTP矢量。如果提供了一大組的頻譜整形濾波器以供選擇的話,由于濾波操作的原因,可能會導致可估計的復雜度增加。而且,與所選濾波器有關的信息,諸如索引m,需要進行量化并從編碼器(通過復用器109)傳送到解碼器。
      因此,需要一種用于語音編碼的方法和設備,其能夠有效對非整數(shù)延遲值建模且能夠提供頻譜整形。


      圖1是使用整數(shù)采樣分解延遲多抽頭LTP濾波器的現(xiàn)有技術的碼激勵線性預測(CELP)編碼器的框圖。
      圖2是使用子采樣分解一階LTP濾波器的現(xiàn)有技術的碼激勵線性預測(CELP)編碼器的框圖。
      圖3是使用子采樣分解一階LTP濾波器(實現(xiàn)為虛擬碼本)的現(xiàn)有技術的碼激勵線性預測(CELP)編碼器的框圖。
      圖4是使用子采樣分解一階LTP濾波器(實現(xiàn)為虛擬碼本)和頻譜整形濾波器的現(xiàn)有技術的碼激勵線性預測(CELP)編碼器的框圖。
      圖5是根據(jù)本發(fā)明實施例(非約束子采樣分解多抽頭LTP濾波器)的碼激勵線性預測(CELP)編碼器的框圖。
      圖6是根據(jù)本發(fā)明實施例(非約束子采樣分解多抽頭LTP濾波器,實現(xiàn)為虛擬碼本)的碼激勵線性預測(CELP)編碼器的框圖。
      圖7是根據(jù)本發(fā)明另一實施例(子采樣分解多抽頭LTP濾波器的對稱實現(xiàn))的碼激勵線性預測(CELP)編碼器的框圖。
      圖8是用于編碼器中的本發(fā)明的信號流程和處理模塊的框圖(子采樣分解多抽頭LTP濾波器和子采樣分解多抽頭LTP濾波器的對稱實現(xiàn))。
      圖9是根據(jù)本發(fā)明實施例的圖8的CELP編碼器在對信號編碼過程中所執(zhí)行的步驟的邏輯流程圖。
      具體實施例方式
      為了解決上述需要,這里提供了一種用于在語音編碼系統(tǒng)中預測的方法和設備。使用子采樣分解延遲的一階LTP濾波器的方法,擴展到多抽頭LTP濾波器,或者從另一優(yōu)勢角度來看,常規(guī)整數(shù)采樣分解多抽頭LTP濾波器擴展到了使用子采樣分解延遲。這個新穎的多抽頭LTP濾波器方程提供了相對于現(xiàn)有技術LTP濾波器配置的多種優(yōu)點。限定具有子采樣分解的滯后,使得有可能在插值濾波器所使用的過采樣因子的分解的限制內顯式地對具有小數(shù)分量的延遲值建模。這樣的多抽頭LTP濾波器的系數(shù)(βi’s)因此不用對具有小數(shù)分量的延遲的效應進行建模。由此,其主要功能是通過對呈現(xiàn)出的周期性程度建模并且通過進行頻譜整形來最大化LTP濾波器的預測增益。這與常規(guī)整數(shù)采樣分解多抽頭LTP濾波器形成對比,常規(guī)整數(shù)采樣分解多抽頭LTP濾波器使用單一、低效率的模型來處理對非整數(shù)值延遲和頻譜整形都建模的有時的沖突任務。比較新LTP濾波器與一階子采樣分解LTP濾波器,新方法在將一階子采樣分解LTP濾波器擴展到多抽頭LTP濾波器方面,增加了對頻譜整形建模的能力。
      對于某些語音編碼器應用,可能希望對LTP矢量進行頻譜整形。例如,新的LTP方程提供了用于表示子采樣分解延遲和頻譜整形的非常有效的模型,可用于在給定碼率改進語音質量。對于具有寬帶信號輸入的語音編碼器來說,提供頻譜整形的能力具有額外的重要性,因為信號中的諧波結構傾向于減弱高頻,其減弱程度各子幀都不相同。現(xiàn)有技術中將頻譜整形加入到一階子采樣分解LTP濾波器的方法(Bessette,et.al.)是將頻譜整形濾波器施加到LTP濾波器的輸出,提供至少兩個整形濾波器以供選擇。頻譜整形的LTP矢量隨后被用于生成失真度量,評估該失真度量以確定要使用的頻譜整形濾波器。
      圖5顯示了LTP濾波器配置,提供了一種用于表示子采樣分解延遲和頻譜整形的更靈活的模型。濾波器配置提供了一種用于計算或選擇這樣的濾波器的參數(shù)的方法,而不用明顯地執(zhí)行頻譜整形濾波操作。本發(fā)明的這個方面使得可以非常有效地計算濾波器參數(shù)βi’s,其體現(xiàn)了有關優(yōu)化頻譜整形的信息,或者從提供的一組βi系數(shù)值(或βi矢量)中選擇多抽頭濾波器系數(shù)βi’s。LTP濾波器504的廣義傳輸函數(shù)為11-&Sigma;i=-K1K2&beta;iz-L^+i,K1&GreaterEqual;0,K2&GreaterEqual;0,K1+K2>0,K=1+K1+K2---(5)]]>上述濾波器的階數(shù)是K,其中選擇K>1,導致多抽頭LTP濾波器。延遲 是通過子采樣分解進行定義的,對于具有小數(shù)部分的延遲值 是用插值濾波器來計算子采樣分解延遲采樣,如Gerson et.al.和Kroon et.al所述。系數(shù)(βi’s)不用對具有小數(shù)分量的延遲效應進行建模,可以計算或選擇以通過呈現(xiàn)出的周期性程度建模或者通過同時加以頻譜整形來最大化LTP濾波器的預測增益。這是新LTP濾波器配置和Bessette et.al.之間的另一個區(qū)別。系數(shù)(βi’s)隱式體現(xiàn)了頻譜整形特性;也就是說,不需要專用的一組頻譜整形濾波器以供選擇,通過濾波器選擇決策然后量化并從編碼器傳送到解碼器。例如,如果完成了βi系數(shù)的矢量量化且βi矢量量化表包含J種可能的βi矢量供選擇,這樣的表可能隱式地包含J種不同的頻譜整形特性,每個βi矢量一個。而且,不需要進行頻譜整形濾波來計算對應于要評估的βi矢量的失真度量(在508中),如將要解釋的。在本發(fā)明另一實施例中,LTP濾波器系數(shù)可以通過要求LTP濾波器的多個抽頭對稱從而完全防止對非整數(shù)延遲建模的嘗試。對稱濾波器需要對于所有有效索引值i,β-i=βi;也就是說,對于K1≤i≤K2,其中K1=K2且K為奇數(shù)。這樣的配置對于量化效率和降低計算復雜度來說是有利的。
      結合圖6-9說明可以更全面地描述本發(fā)明。圖6是根據(jù)本發(fā)明實施例的CELP型語音編碼器600的框圖。很顯然,LTP濾波器604包括多抽頭LTP濾波器604,包括碼本310、K激勵矢量生成器(620)、縮放單元(621)以及加法器612。
      編碼器600實現(xiàn)在處理器中,諸如一個或多個微處理器、微控制器、數(shù)字信號處理器(DSP)、其組合或者本領域普通技術人員已知的其他這樣的設備,其可以與一個或多個相關存儲設備通信,存儲設備諸如隨機存取存儲器(RAM)、動態(tài)隨機存取存儲器(DRAM)和/或只讀存儲器(ROM)或其等價物,用來儲存數(shù)據(jù)、碼本、以及可由處理器執(zhí)行的程序。
      新多抽頭LTP濾波器的傳輸函數(shù)(式5)重寫如下P(z)=11-&Sigma;i=-k1K2&beta;iz-L^+i,K1&GreaterEqual;0,K2&GreaterEqual;0,K1+K2>0,K=1+K1+K2---(6)]]>對應的用于創(chuàng)建組合合成激勵ex(n)的CELP廣義差分方程為ex(n)=&gamma;c~I(n)+&Sigma;i=-K`K2&beta;iex(n-L^+i),0&le;n&lt;N,where---(7)]]>K1≥0,K2≥0,K1+K2>0,K=1+K1+K2在優(yōu)選實施例中,對于需要訪問到ex(n-L^+i)((n-L^+i)&GreaterEqual;0)]]>的 的值,使用自適應碼本(ACB)技術來減低復雜度。如較早前討論的,該技術是LTP濾波器的簡化和非等價實現(xiàn),并且記載于Ketchum et.al.中。該簡化包括使當前子幀的ex(n)的采樣;即0≤n<N,取決于ex(n)的采樣,定義n<0,并且因此獨立于當前子幀的ex(n)的采樣定義,0≤n<N。使用這樣的技術,ACB矢量定義如下ex(n)=ex(n-L^),0&le;n&lt;N---(8)]]>對于具有小數(shù)分量的 值,使用插值濾波器來計算延遲采樣。與Ketchum et.al.中給出的ACB的原始定義不同,需要在子幀的第N個采樣之外計算ex(n)的K2個額外采樣ex(n)=ex(n-L^),N&le;n&lt;N+K2---(9)]]>使用式(8-9)中生成的ex(n)的采樣,定義新的信號ci(n)ci(n)=ex(n+i),0≤n<N,-K1≤i≤K2(10)組合合成子幀激勵現(xiàn)在可以使用式(8-10)的結果表示為ex(n)=&gamma;c~I(n)+&Sigma;i=-K1K2&beta;ici(n),0&le;n&lt;N,-K1&le;i&lt;K2---(11)]]>語音編碼器的任務是選擇LTP濾波器參數(shù) 和βi’s以及激勵碼本索引I和碼矢量增益γ,從而最小化輸入語音s(n)和編碼語音 之間的感覺加權差能量。
      重寫式(11)得到ex(n)=&Sigma;j=0K&lambda;jc&OverBar;j(n),0&le;n&lt;N,]]>其中 (12)c&OverBar;j(n)=c-K1+j(n).0&le;j&lt;Kc~I(n),j=K,0&le;n&lt;N---(13)]]>&lambda;j=&beta;-K1+j,0&le;j&lt;K&gamma;,j=K---(14)]]>讓感覺加權合成濾波器濾波后的ex(n)為ex&prime;(n)=&Sigma;j=0K&lambda;jc&OverBar;j&prime;(n),0&le;n&lt;N---(15)]]>
      cj′(n)是通過感覺加權合成濾波器H(z)=W(z)/Aq(z)濾波后的cj(n)。而且,讓p(n)為通過感覺加權濾波器W(z)的輸入語音s(n)。隨后,每采樣的感覺加權差e(n)為e(n)=p(n)-ex&prime;(n)=p(n)-&Sigma;j=0K&lambda;jc&OverBar;j&prime;(n),0&le;n&lt;N---(16)]]>給出子幀加權差能量值EE=&Sigma;n=0N-1e2(n)=&Sigma;n=0N-1[p(n)-ex&prime;(n)]2=&Sigma;n=0N-1[p(n)-&Sigma;j=0K&lambda;jc&OverBar;j&prime;(n)]2---(17)]]>并且可以擴展為E=&Sigma;n=0N-1[p2(n)-2&Sigma;j=0K&lambda;jp(n)c&OverBar;j&prime;(n)+2&Sigma;i=0K-1&Sigma;j=i+1K&lambda;i&lambda;jc&OverBar;i&prime;(n)c&OverBar;i&prime;(n)c&OverBar;j&prime;(n)+&Sigma;j=0K&lambda;j2c&OverBar;j&prime;2(n)]---(18)]]>將求和 移動到式(18)的括號中,得到E=&Sigma;n=0N-1p2(n)-2&Sigma;j=0K&lambda;j&Sigma;n=0N-1p(n)c&OverBar;j&prime;(n)+2&Sigma;i=0K-1&Sigma;j=i+1K&lambda;i&lambda;j&Sigma;n=0N-1c&OverBar;i&prime;(n)c&OverBar;j&prime;(n)+&Sigma;j=0K&lambda;j2&Sigma;n=0N-1c&OverBar;j&prime;2(n)---(19)]]>很明顯,式(19)可以等價地表示為下面幾項(i)βi,-K1≤i≤K2和γ,或者等價為(λ0,λ1,…,λK),(ii)濾波構成矢量c0′(n)到cK′(n)之間的互相關,即(Rcc(i,j)),(iii)感覺加權目標矢量p(n)和每個濾波構成矢量之間的互相關,即(Rpc(i)),和(iv)子幀的加權目標矢量p(n)中的能量,即(Rpp)。
      上面列出的相關可以用下面的公式來表示
      Rpp=&Sigma;n=0N-1p2(n)---(20)]]>Rpc(i)=&Sigma;n=0N-1p(n)c&OverBar;i&prime;(n),0&le;i&le;K---(21)]]>Rcc(i,j)=&Sigma;n=0N-1c&OverBar;i&prime;(n)c&OverBar;j&prime;(n),0&le;i&le;K,i&le;j&le;K---(22)]]>Rcc(j,i)=Rcc(i,j),0≤i<K,i<j≤K (23)以式(20)-(23)和增益矢量λj,0≤j≤K的形式重寫式(19),則生成下面的關于子幀的感覺加權差能量值E的公式E=Rpp-2&Sigma;j=0K&lambda;jRpc(j)+2&Sigma;i=0K-1&Sigma;j=i+1K&lambda;i&lambda;jRcc(i,j)+&Sigma;j=0K&lambda;j2Rcc(j,j)---(24)]]>解聯(lián)合優(yōu)化的一組與激勵矢量有關的增益項λj,0≤j≤K包括對于每個λj,0≤j≤K取E的偏微分,將每個得到的偏微分方程設為等于0,然后解得到的K+1個聯(lián)立線性方程的系統(tǒng),即,解下面的一組聯(lián)立線性方程&PartialD;E&PartialD;&lambda;j=0,0&le;j&le;K---(25)]]>評估式(25)中給出的K+1個方程,得到K+1個聯(lián)立線性方程的系統(tǒng)。聯(lián)合優(yōu)化增益或縮放因子(λ0,λ1,…,λK)的矢量的解可以通過解下面的方程而獲得Rcc(0,0)Rcc(0,1)&CenterDot;&CenterDot;&CenterDot;Rcc(0,K)Rcc(1,0)Rcc(1,1)&CenterDot;&CenterDot;&CenterDot;Rcc(1,K)&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;Rcc(K,0)Rcc(K,1)&CenterDot;&CenterDot;&CenterDot;Rcc(K,K)&lambda;0&lambda;1&CenterDot;&lambda;K=Rpc(0)Rpc(1)&CenterDot;Rpc(K)---(26)]]>本領域普通技術人員應該認識到,解方程(26)不需要編碼器600實時執(zhí)行。編碼器600可以脫機地解方程(26),作為訓練和獲取儲存在各個增益信息表626中的增益矢量(λ0,λ1,…,λK)的一部分。每個增益信息表626可包括一個或多個表,儲存增益信息,其包括在各個差最小化單元/電路608中,或者可以由各個差最小化單元/電路608所引,并且隨后用于量化和聯(lián)合優(yōu)化與激勵矢量有關的增益項(λ0,λ1,…,λK)。注意,式(11)中定義的組合合成激勵ex(n)所需的增益項βi’s和γ(并且重寫如下)ex(n)=&gamma;c~1(n)+&Sigma;i=-K1K2&beta;ici(n),0&le;n&lt;N,-K1&le;i&le;K2,K=1+K1+K2---(27)]]>可以使用式(14)中指定的變量映射來獲得,如下&beta;i=&lambda;K1+i,-K1&le;i&le;K2]]>γ=λk(28)給定由此獲得的每個增益信息表626,編碼器600、尤其是差最小化單元608的任務就是使用增益信息表626選擇增益矢量,即(λ0,λ1,…,λK),從而在評估的增益信息表上最小化如式(24)所表示的子幀的感覺加權差能量E。為了幫助選擇生成感覺加權差矢量的最小能量的(λ0,λ1,…,λK)矢量,式(24)中包括表達為E的表示中的λi,0≤i≤K的每一項可以對于每一(λ0,λ1,…,λK)矢量進行預計算,并儲存在各個增益信息表626中,其中每一增益信息626包括查找表。
      一旦根據(jù)增益信息表626確定了增益矢量,所選(λ0,λ1,…,λK)的每個元素都可以通過用式(24)的預計算的項(對應于所選增益矢量)的第一(K+1)的對應元素(也就是 乘以值“-0.5”。這使得有可能儲存預計算的差項(由此降低評估E所需的計算量),并消除在量化表中顯式儲存實際(λ0,λ1,…,λK)矢量的需要。由于相關Rpp、Rpc和Rcc是通過如上所述的生成芍cj′(n),0≤j≤K的分解步驟顯式地從增益項(λ0,λ1,…,λK)去耦的,相關Rpp、Rpc和Rcc可以每子幀只計算一次。而且,對Rpp的計算可以一起忽略,因為對于給定子幀,相關Rpp是一個常量,在式(24)中有或沒有相關Rpp的結果,都將選擇相同的增益矢量,即(λ0,λ1,…,λK)。
      當如上所述預計算式(24)的項時,對式(24)的評估可以有效地通過每個評估的增益矢量使用 次乘累加(MAC)操作來實現(xiàn)。本領域普通技術人員將認識到,盡管這里為了說明的目的描述了差最小化單元608的特定增益矢量量化器,即增益信息表626的特定格式,但所概述的方法適用于其他量化增益信息的方法,例如標量量化、矢量量化、或者矢量量化和標量量化技術的組合,包括無記憶和/或預測技術。本領域公知,使用標量量化或矢量量化技術將包括將增益信息儲存到增益信息表626中,其可用于確定增益矢量。
      因此,在編碼器600操作過程中,差加權濾波器107輸出加權差信號e(n)到差最小化電路608,電路608輸出多抽頭濾波器系數(shù)和所選的LTP濾波器延遲 來最小化加權差值。如上所討論的,濾波器延遲包括子采樣分解值。提供多抽頭LTP濾波器604來接收濾波器系數(shù)和基音延遲以及固定碼本激勵,并根據(jù)濾波器延遲和多抽頭濾波器系數(shù)輸出組合合成激勵信號。
      在圖6和圖7(下面描述)中,多抽頭LTP濾波器604、704包括自適應碼本,接收濾波器延遲并輸出自適應碼本矢量。矢量生成器620、720生成時移/組合自適應碼本矢量。提供多個縮放單元621、721,每個單元用來接收時移自適應碼本矢量并輸出多個縮放的時移碼本矢量。注意,時移自適應碼本矢量之一的時移值有可能為0,對應于沒有時移。最終,求和電路612接收縮放的時移碼本矢量以及所選擇的縮放FCB激勵矢量,并輸出組合合成激勵信號,作為縮放時移碼本矢量和所選擇的縮放FCB激勵矢量的和。
      現(xiàn)在描述本發(fā)明的另一實施例,如圖7所示。如前所述,多抽頭LTP濾波器的系數(shù)βi使用子采樣分解延遲 不用對LTP濾波器延遲 的非整數(shù)值建模,因為具有小數(shù)分量的 值對小數(shù)延遲的采樣建模是使用差值濾波器顯式地完成的;例如,如Gerson et.al.和Kroon et.al.所教導的。盡管如此,即使使用延遲的子采樣分解值,表示 的分解通常限于諸如插值濾波器所使用的最大過采樣因子設計選擇和用于表示離散值 的量化器的分解。計算或選擇語音編碼器增益從而最小化式(24)的子幀加權差能量E的過程采用了K個βi系數(shù)中固有的K種自由度來補償差異。通常,這是個正效應。但是,如果用于量化語音編碼增益的比特分配有限,則可能有利的是,重新定義子采樣分解延遲多抽頭LTP濾波器(或其ACB實現(xiàn)),從而從多抽頭濾波器抽頭βi中去除了補償由于用所選(有限)分解表示 所引起的失真的建模能力。這樣的方程減少了βi系數(shù)的變化,使得βi’s更順從于隨后的量化。在此情況中,βi系數(shù)的建模彈性限于表示呈現(xiàn)的周期性的程度以及對頻譜整形建?!@都是尋求最小化式(24)的E的副產品。
      使子采樣分解多抽頭LTP濾波器為奇階數(shù),也就是要求階數(shù)K為奇數(shù),并且使濾波器對稱,也就是具有這樣的性質β-i=βi,K1=K2,K1≤i≤K2,這使得LTP濾波器704滿足上述設計目標。注意,對稱濾波器可以是偶階數(shù)的,但是在優(yōu)選實施例中選擇為奇數(shù)。式(6)的LTP濾波器傳輸函數(shù)版本被修改為對應于奇、對稱濾波器,如下所示P(z)=11-&beta;0z-L^-&Sigma;i=1K&prime;&beta;i(z-L^-i+z-L^+i),K&prime;&GreaterEqual;1,K=1+2K&prime;---(6a)]]>現(xiàn)在通過ACB碼本實現(xiàn)來描述優(yōu)選實施例的濾波器。根據(jù)式(8),重新寫下ACB矢量定義ex(n)=ex(n-L^),0&le;n&lt;N---(29)]]>對于具有小數(shù)分量的 值,使用插值濾波器來計算延遲采樣。定義新變量K′,其中K′=K1=K2。接下來,在子幀的第N個采樣之外將ex(n)擴展K′個采樣ex(n)=ex(n-L^),N&le;n&lt;N+K&prime;,K&prime;&GreaterEqual;1---(30)]]>對稱濾波器的階數(shù)為K=1+2K′ (31)在優(yōu)選實施例中,K′=1。由于β-i=βi,很方便地考慮只有唯一的βi值;也就是將βi系數(shù)的索引以0≤i≤K′代替-K′≤i≤K′。這可以如下所示地完成。使用式(30-31)中生成的采樣ex(n),現(xiàn)在定義新的信號vi(n)vi(n)=ex(n),i=0[ex(n-i)+ex(n+i)],1&le;i&le;K&prime;,0&le;n&lt;N---(32)]]>組合合成子幀激勵ex(n)隨后可以使用式(30-32)的結果表示為ex(n)=&gamma;c~I(n)+&Sigma;i=0K&prime;&beta;ivi(n),0&le;n&lt;N---(33)]]>語音編碼器的任務是選擇LTP濾波器參數(shù) 和βi系數(shù)以及激勵碼本索引I和碼矢量增益γ,從而最小化語音s(n)和編碼語音 之間的子幀加權差能量。
      重寫式(33)得到ex(n)=&Sigma;j=0K&prime;+1&lambda;jc&OverBar;j(n),0&le;n&lt;N,where---(34)]]>c&OverBar;j(n)=vj(n),0&le;j&le;K&prime;c~I(n),j=K&prime;+1,0&le;n&lt;N---(35)]]>&lambda;j=&beta;j,0&le;j&le;K&prime;&gamma;,j=K&prime;+1---(36)]]>讓感覺加權合成濾波器所濾波后的ex(n)為ex&prime;(n)=&Sigma;j=0K&prime;+1&lambda;jc&OverBar;j&prime;(n),0&le;n&lt;N---(37)]]>
      cj′(n)是cj(n)在被感覺加權合成濾波器H(z)=W(z)/Aq(z)濾波后的版本。如前,讓p(n)為經過感覺加權濾波器W(z)濾波的輸入語音s(n)。則每采樣的感覺加權差e(n)為e(n)=p(n)-ex&prime;(n)=p(n)-&Sigma;j=0K&prime;+1&lambda;jc&OverBar;j&prime;(n),0&le;n&lt;N.---(38)]]>給出子幀加權差能量E為E=&Sigma;n=0N-1e2(n)=&Sigma;n=0N-1[p(n)-ex&prime;(n)]2=&Sigma;n=0N-1[p(n)-&Sigma;j=0K&prime;+1&lambda;jc&OverBar;j&prime;(n)]2---(39)]]>其類似于式(17)。在經過相同的分析和如同式(18-26)的推導之后,我們得到下面的表達式E=Rpp-2&Sigma;j=0K&prime;+1&lambda;jRpc(j)+2&Sigma;i=0K&prime;&Sigma;j=i+1K&prime;+1&lambda;i&lambda;jRcc(i,j)+&Sigma;j=0K&prime;+1&lambda;j2Rcc(j,j)---(46)]]>其導出了下面的聯(lián)立方程組Rcc(0,0)Rcc(0,1)&CenterDot;&CenterDot;&CenterDot;Rcc(0,K&prime;+1)Rcc(1,0)Rcc(1,1)&CenterDot;&CenterDot;&CenterDot;Rcc(1,K&prime;+1)&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;Rcc(K&prime;+1,0)Rcc(K&prime;+1,1)&CenterDot;&CenterDot;&CenterDot;Rcc(K&prime;+1,K&prime;+1)&lambda;0&lambda;1&CenterDot;&lambda;K&prime;+1=Rpc(0)Rpc(1)&CenterDot;Rpc(K&prime;+1)---(48)]]>如前,本領域普通技術人員應該認識到,解方程(48)不需要編碼器700實時執(zhí)行。編碼器700可以脫機地解方程(48),作為訓練和獲得儲存在各個增益信息表726中的增益矢量(λ0,λ1,…,λK′+1)的一部分。增益信息表726可包括一個或多個表,儲存增益信息,其包括在各個差最小化單元708中,或者可以由各個差最小化單元708所引,并且隨后用于量化和聯(lián)合優(yōu)化與激勵矢量有關的增益項(λ0,λ1,…,λK′+1)。
      在本發(fā)明優(yōu)選實施例的迄今為止的描述中,多抽頭LTP濾波器抽頭的間隔都給定為1個采樣。在本發(fā)明的另一實施例中,多抽頭濾波器抽頭之間的間隔可以不是一個采樣。也就是說,可以是一個小數(shù)的采樣或者可以是一個具有整數(shù)和小數(shù)部分的值。本發(fā)明的這個實施例可以通過修改式(6)而如下說明P(z)=11-&Sigma;i=-K1K2&beta;iz-L^+i&Delta;,K1&GreaterEqual;0,K2&GreaterEqual;0,K1+K2>0,K=1+K2,&Delta;&NotEqual;1---(6b)]]>注意,式(6a)可以類似地修改為P(z)=11-&beta;0z-L^-&Sigma;i=1K&prime;&beta;i(z-L^-i&Delta;+z-L^+i&Delta;),K&prime;&GreaterEqual;1,K+1+2K&prime;,&Delta;&NotEqual;1---(6c)]]>Δ值依賴于所使用的插值濾波器的解析度。如果插值濾波器的最大解析度相對于信號s(n)的采樣頻率為 采樣,則Δ可以選擇為 這里l≥1。還要注意,盡管式(6b)和(6c)所示的濾波器抽頭間隔是一致的,但也可以實現(xiàn)不一致的抽頭間隔。而且,對于Δ<1的值要注意,濾波器階數(shù)K可能需要增加,這是相對于抽頭的單采樣間隔情況而言的。
      為了降低在編碼器700中與選擇激勵參數(shù) βi’s,I和γ有關的計算復雜度,可以首先選擇LTP濾波器參數(shù) βi’s,假定固定碼本零貢獻。這導致式(46)的修改版本的子幀加權差,其修改包括從E中消除了與固定碼本矢量有關的項,生成簡化加權差表達E=Rpp-2&Sigma;j=0K&prime;&lambda;jRpc(j)+2&Sigma;i=0K&prime;-1&Sigma;j=i+1K&prime;&lambda;i&lambda;jRcc(i,j)+&Sigma;j=0K&prime;&lambda;j2Rcc(j,j)---(51)]]>計算一組(λ0,λ1,…,λK′)增益,得到式(51)中的最小化E,包括解K′+1個聯(lián)立線性方程,如下
      Rcc(0,0)Rcc(0,1)&CenterDot;&CenterDot;&CenterDot;Rcc(0,K&prime;)Rcc(1,0)Rcc(1,1)&CenterDot;&CenterDot;&CenterDot;Rcc(1,K&prime;)&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;&CenterDot;Rcc(K&prime;,0)Rcc(K&prime;,1)&CenterDot;&CenterDot;&CenterDot;Rcc(K&prime;,K&prime;)&lambda;0&lambda;1&CenterDot;&lambda;K&prime;=Rpc(0)Rpc(1)&CenterDot;Rpc(K&prime;)---(52)]]>另外,根據(jù)所使用的搜索方法,可搜索一個或多個量化表來尋找最小化式(51)中的E的(λ0,λ1,…,λK′)矢量。在此情況下,LTP濾波器系數(shù)可以得到量化,而不用考慮FCB矢量貢獻。但是,在優(yōu)選實施例中,(λ0,λ1,…,λK′+1)的量化矢量的選擇是由對式(46)的評估引導的,對應于對所有(K′+2)個編碼器增益的聯(lián)合優(yōu)化。在這兩種情況的任何一種中,加權目標信號p(n)可以修改為為固定碼本搜索給出加權目標信號Pfcb(n),包括從p(n)中刪除感覺加權LTP濾波器貢獻,使用(λ0,λ1,…,λK′)增益,該增益是假定從FCB得到零貢獻而計算出來的(或者從量化表中選擇出來的)pfcb(n)=p(n)-&Sigma;j=0K&prime;&lambda;jc&OverBar;j&prime;(n),0&le;n&le;N---(53)]]>隨后搜索FCB的索引i,其最小化了子幀加權差能量Efcb,i,用所采用的方法來搜索Efcb,i=&Sigma;n=0N-1(pfcb(n)-&gamma;ic~i&prime;&prime;(n))2---(54)]]>在上面的表達式中,i是評估的FCB矢量的索引, 是零狀態(tài)加權合成濾波器濾波后的第i個FCB碼矢量,γi是對應于 的優(yōu)化縮放因子。提取的索引i變?yōu)镮,即對應于所選FCB矢量的碼字。
      另外,F(xiàn)CB搜索可以假定中間LTP濾波器矢量為“浮點(floating)”而進行實現(xiàn)。該技術記載于發(fā)明人為Ira A.Gerson、題為“Digital SpeechCoder with Vector Excitation Source Having Improved Speech Quality”的專利WO9101545A1中,該專利公開了用于搜索FCB碼本的方法,由此對于每個評估的候選FCB矢量,假定該矢量和中間LTP濾波器矢量的一組聯(lián)合優(yōu)化的增益。LTP矢量在下面的意義上是“中間”假定沒有FCB貢獻而選擇其參數(shù),并進行修正。例如,一旦完成對索引I的FCB搜索,所有增益隨后都可以再次優(yōu)化,或者重新計算(例如,通過解方程(48)),或者從量化表中選擇(例如,使用式(46)作為選擇標準)。定義加權合成濾波器所濾波的中間LTP濾波器矢量為c&OverBar;ltp&prime;(n)=&Sigma;j=0K&prime;&lambda;jc&OverBar;j&prime;(n)---(55)]]>對應于采用聯(lián)合優(yōu)化增益的FCB搜索的加權差表達式由下式給出Efcb,i=&Sigma;n=0N-1(pfcb(n)-&chi;ic&OverBar;ltp&prime;(n)-&gamma;ic~i&prime;(n))2---(56)]]>對于每個評估的 采用聯(lián)合優(yōu)化參數(shù)χi和γi。最小化式(56)的索引i,變成了所選FCB的碼字I。另外,可以使用式(56)的修改形式,由此對于每個評估FCB矢量,所有(K′+2)個縮放因子都進行聯(lián)合優(yōu)化,如下所示Efcb,i=&Sigma;n=0N-1(pfcb(n)-&Sigma;j=0K&prime;&lambda;j,ic&OverBar;j&prime;(n)-&gamma;ic~i&prime;(n))2---(57)]]>也就是說,對于評估的第i個FCB矢量,采用了一組聯(lián)合優(yōu)化的增益參數(shù)(λ0,i,…,λK′,i,γi)。
      對于這兩種FCB搜索方法中的任何一種,即(i)通過從中刪除中間LTP矢量的貢獻而為FCB搜索重新定義目標矢量,或(ii)采用聯(lián)合優(yōu)化增益實現(xiàn)FCB搜索,從量化效率的優(yōu)勢角度來看,有利之處在于約束了中間LTP矢量的增益。例如,如果已知βi系數(shù)的量化值受到設備限制而不能超過預定幅度,可以在計算時類似地約束中間LTP濾波器系數(shù)。
      實施例之一對LTP濾波器系數(shù)進行下面的約束來獲得中間濾波后的LTP矢量cltp′(n)。首先,我們假設LTP濾波器系數(shù)是對稱的,即β-i=βi,并且假設對于i>1,LTP濾波器系數(shù)為0。而且我們還假設中間濾波后的LTP矢量的形式為c&OverBar;ltp&prime;(n)=&theta;(&alpha;c&OverBar;0&prime;(n)+1-&alpha;2c&OverBar;1&prime;(n))0.5&le;&alpha;&le;1.0---(58)]]>上面的約束確保了整形濾波器特性實際上是低通。注意,式55中的λ’s現(xiàn)在為β0=θα,&beta;1=&theta;1-&alpha;2.]]>現(xiàn)在選擇整個LTP增益值(θ)和低通整形系數(shù)(α)來最小化加權差能量值E=&Sigma;n(p(n)-c&OverBar;ltp&prime;(n))2---(59)]]>關于θ設置式59的偏微分,得到&theta;=&alpha;Rpc(0)+1-&alpha;2Rpc(1)&alpha;2Rcc(0,0)+&alpha;(1-&alpha;)Rcc(1,0)+(1-&alpha;2)2Rcc(1,1)---(60)]]>替換式(59)中的θ值,可以看出,最大化下面的表達式將會得到最小化的E值。
      (&alpha;Rpc(0)+1-&alpha;2Rpc(1))2&alpha;2Rcc(0,0)+&alpha;(1-&alpha;)Rcc(1,0)+(1-&alpha;2)2Rcc(1,1)---(61)]]>定義&alpha;1=Rcc(0,0)+Rcc(1,1)4-Rcc(1,0)]]>&alpha;2=Rcc(1,0)-Rcc(1,1)2]]>&alpha;3=Rcc(1,1)4]]>&alpha;4=Rpc(0)-Rpc(1)2]]>&alpha;5=Rpc(1)2]]>
      現(xiàn)在,式(61)中的表達式變?yōu)?&alpha;4&alpha;+&alpha;5)2&alpha;1&alpha;2+&alpha;2&alpha;+&alpha;3---(62)]]>再次使關于α的偏微分方程(62)等于0,得到&alpha;=&alpha;2&alpha;5-2&alpha;4&alpha;3&alpha;2&alpha;4-2&alpha;1&alpha;5---(63)]]>這最大化了式(62)中的表達式。由此獲得的參數(shù)α范圍在1.0和0.5之間,以保證低通頻譜整形特性。全部LTP增益值θ可以通過式60而獲得并且直接施加用于上述的FCB搜索方法(i),或者可以根據(jù)上述的FCB搜索方法(ii)進行聯(lián)合優(yōu)化(即,允許“浮點”)。而且,對α進行不同的約束將允許其他整形特性,諸如高通或凹槽(notch),這對本領域技術人員來說是顯而易見的。對更高階多抽頭濾波器的類似約束也是本領域技術人員顯而易見的,可以包括帶通整形特性。
      盡管迄今為止討論了許多的實施例,圖8描繪了一種廣義設備,包括本發(fā)明的最佳模式,而圖9是顯示相應操作的流程圖。如圖8所示,子幀分解延遲值 用作自適應碼本(310)和移位器/組合器(820)的輸入,以產生多個移位/組合的自適應碼本矢量,如式(8-10、13)及式(29-32、35)所述。如前所述,本發(fā)明可包括自適應碼本或長時預測器濾波器,并且可以包括或者可以不包括FCB分量。此外,采用加權合成濾波器W(z)/Aq(z)(830),其來自于對加權差矢量e(n)的代數(shù)運算,如式(16)的相關文本所述。本領域技術人員可以認識到,加權合成濾波器(830)可施加到矢量ci(n)或等價地施加到c(n),或者可以合并作為自適應碼本(310)的一部分。濾波后的自適應碼本矢量cj′(n)(901)和目標矢量p(n)(903)都可基于對輸入信號s(n)的感覺加權(通過感覺加權濾波器(832)進行濾波),然后呈現(xiàn)給相關生成器(833),相關生成器(833)輸出在式(20-23)中定義的多個相關項(905),用于輸入差最小化單元(808)?;谶@多個相關項,評估感覺加權差值E,而不需要顯式的濾波操作,從而產生多個多抽頭濾波器系數(shù)βi(907)。根據(jù)實施例,差值E可以在式(24、46、51)中通過利用增益表626中的值而評估,如對于編碼器(600、700)所述,或者可以直接通過一組聯(lián)立線性方程(26、48、52、63)而解出。在任何一種情況下,為符號上表示的方便,多抽頭濾波器系數(shù)βi交叉引到一般形式的系數(shù)λi(式(14、28)),即合并固定碼本的貢獻而不損失其一般性。
      盡管已經通過結合特定實施例具體地顯示和描述了本發(fā)明,本領域技術人員應該理解,可以作出各種形式和細節(jié)上的改變,而不會偏離本發(fā)明的精神和范圍。例如,本發(fā)明是使用加權濾波器W(z)進行描述的。但盡管根據(jù)“基于人類聽覺的響應”而陳述了加權濾波器W(z)的具體特性,對于本發(fā)明來說,假定W(z)可以是任意的。在極端情況中,W(z)可以具有單位增益?zhèn)鬏敽瘮?shù)W(z)=1,或者W(z)可以是LP合成濾波器的反函數(shù)W(z)=Aq(z),導致在殘留域中對差的評估。因此,本領域技術人員將認識到,對W(z)的選擇是與本發(fā)明沒有任何邏輯關系的。
      而且,根據(jù)廣義CELP框架描述了本發(fā)明,其中所呈現(xiàn)的體系結構簡化到允許盡可能對本發(fā)明描述簡潔。但是,在采用優(yōu)化了的本發(fā)明的體系結構方面還有許多其他的變化,例如,減少處理復雜度和/或使用本發(fā)明范圍外的技術來改進性能。一種這樣的技術可能使用疊加的原理來更改框圖,使得加權濾波器W(z)分解為零狀態(tài)和零輸入響應部分,并且組合以其他濾波操作來減少加權差計算的復雜度。另外一種這樣的復雜度降低技術可能包括進行開環(huán)基音搜索以獲得 的中間值,從而使得差最小化單元508、608、708在最終(閉環(huán))優(yōu)化階段不需要測試所有可能的 值。
      注意,本領域技術人員已知存在有多種FCB類型,而且有各種各樣的有效的FCB搜索技術。由于所使用的FCB的具體類型與本發(fā)明關系不大,因此簡單假定FCB碼本搜索生成FCB索引I,其導致了Efcb,i的最小化,進行所采用的搜索策略。此外,盡管是通過實現(xiàn)為自適應碼本的多抽頭LTP濾波器來描述本發(fā)明的,但本發(fā)明可以等價地實現(xiàn)于直接實現(xiàn)多抽頭LTP濾波器的情況。這樣的改變都在所附權利要求的范圍內。
      權利要求
      1.一種用于編碼語音的方法,該方法包括如下步驟基于子采樣分解延遲值、自適應碼本和加權合成濾波器,生成多個加權自適應碼本矢量(c0′(n)...cK-1′(n));接收輸入信號s(n);基于輸入信號生成目標矢量p(n);基于目標矢量p(n)和多個加權自適應碼本矢量(c0′(n)...cK-1′(n)),生成多個相關項(Rcc(i,j),Rpc(i));和基于多個相關項(Rcc(i,j),Rpc(i)),生成多個多抽頭長時預測器濾波器系數(shù)(βi’s)。
      2.權利要求1中所述的方法,其中,基于輸入信號s(n)生成目標矢量p(n)的步驟包括通過對輸入信號s(n)進行感覺加權而生成目標矢量p(n)的步驟。
      3.權利要求1中所述的方法,其中,生成多個多抽頭長時預測器濾波器系數(shù)的步驟包括生成多個對稱多抽頭長時預測器濾波器系數(shù)的步驟。
      4.權利要求1中所述的方法,其中,生成多個多抽頭長時預測器濾波器系數(shù)的步驟包括根據(jù)差最小化標準解聯(lián)立線性方程組。
      5.權利要求1中所述的方法,其中,生成多個多抽頭長時預測器濾波器系數(shù)的步驟包括根據(jù)差最小化標準從表中選擇一組多抽頭濾波器系數(shù)的步驟。
      6.權利要求1中所述的方法,其中,生成多個多抽頭長時預測器濾波器系數(shù)的步驟包括生成多個約束了值的范圍的多抽頭長時預測器濾波器系數(shù)。
      7.權利要求3中所述的方法,其中,生成多個多抽頭長時預測器濾波器系數(shù)的步驟包括生成多個約束為β0=αθ和&beta;1=(1-&alpha;)&theta;2]]>的多抽頭長時預測器濾波器系數(shù),其中α是整形系數(shù)。
      8.權利要求7所述的方法,其中α約束為預定范圍。
      9.一種設備,包括基于子采樣分解延遲值、自適應碼本和加權合成濾波器,生成多個加權自適應碼本矢量(c0′(n)...cK-1′(n))的裝置;接收輸入信號s(n)的裝置;基于輸入信號s(n)生成目標矢量p(n)的裝置;基于目標矢量p(n)和多個加權自適應碼本矢量(c0′(n)...cK-1′(n)),生成多個相關項(Rcc(i,j),Rpc(i))的裝置;和基于多個相關項(Rcc(i,j),Rpc(i)),生成多個多抽頭長時預測器濾波器系數(shù)(βi’s)的裝置。
      10.一種設備,包括多個加權自適應碼本矢量(c0′(n)...cK-1′(n)),基于子采樣分解延遲值、自適應碼本和加權合成濾波器;感覺差加權濾波器,接收輸入信號s(n)并至少基于s(n)輸出目標矢量p(n);相關生成器,接收加權自適應碼本矢量(c0′(n)...cK-1′(n))和目標矢量p(n),基于目標矢量p(n)和加權自適應碼本矢量(c0′(n)...cK-1′(n))輸出多個相關項(Rcc(i,j),Rpc(i));和差最小化電路,接收相關項(Rcc(i,j),Rpc(i)),基于多個相關項(Rcc(i,j),Rpc(i))輸出多個多抽頭長時預測器濾波器系數(shù)(βi’s)。
      全文摘要
      一種方法(圖9)和設備(500,600),用于語音編碼系統(tǒng)中的預測,使用子采樣分解延遲,將一階長時預測器(LTP)濾波器擴展到多抽頭LTP濾波器(504,604)。從另一角度來看,將常規(guī)整數(shù)采樣分解多抽頭LTP濾波器擴展為使用子采樣分解延遲。這樣的多抽頭LTP濾波器提供了相對現(xiàn)有技術的多種優(yōu)勢。具體地說,定義具有子采樣分解的滯后,使得有可能顯式地對具有小數(shù)分量的延遲值建模,其處于插值濾波器所采用的過采樣因子的分解的限度內。多抽頭LTP濾波器的系數(shù)(β
      文檔編號G10L19/04GK1751338SQ200480004518
      公開日2006年3月22日 申請日期2004年12月17日 優(yōu)先權日2003年12月19日
      發(fā)明者馬克·A·加休科, 坦卡西·V·拉瑪巴德蘭, 烏達·米塔爾, 詹姆斯·P·阿什利, 邁克爾·J·麥克勞克林 申請人:摩托羅拉公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1