形函數70與 LPC模型42的乘積72更接近地近似于頻譜40的實際形狀。
[0055] 在將概率分布估計器14的LTP功能與感知域的使用組合的情況下,概率分布估計 器14可如圖6中所示的進行操作。操作模式在很大程度上與圖4中所示的操作模式一致。 艮P,界定線性預測合成濾波器1/A(z)的LPC系數經歷LPC至頻譜權重轉換60和62, S卩,一 次為直接經歷LPC至頻譜權重轉換60,而另一次在經感知加權64之后經歷LPC至頻譜權 重轉換62。所得比例因子做除法66運算,并且使用乘法器47使所得商q k與LTP梳形函數 70相乘,LTP梳形函數70的參數LTP增益和LTP滯后是由概率分布估計器14來適當地確 定且被插入數據流22中以在供解碼側訪問。所得乘積l k ? qk(其中l(wèi)k指在頻譜分量k處 的LTP梳形函數)接著經歷概率分布參數求導68,從而產生概率分布參數Ji k。請注意,在 對解碼側的以下描述中,關于解碼器側的概率分布估計的功能尤其參考圖6。就此而言,請 注意,在編碼器側,通過最佳化而確定的LTP參數是一樣的且被插入數據流22中,而在解碼 側僅需從數據流讀取該LTP參數。
[0056] 在關于圖1至圖6描述了基于線性預測的音頻編碼器的各種實施例之后,以下描 述貫注于解碼側。圖7示出了基于線性預測的音頻解碼器100的實施例。該音頻解碼器包 括概率分布估計器102和熵解碼與解量化級104?;诰€性預測的音頻解碼器能夠訪問數 據流22,同時將概率分布估計器102配置成根據在數據流22中包含的線性預測系數信息針 對多個頻譜分量k中的每一個來確定概率分布估計28,將熵解碼與解量化級104配置成使 用由概率分布估計器22針對多個頻譜分量k中的每一個確定的概率分布估計來對形成數 據流22的頻譜26進行熵解碼與解量化。即,概率分布估計器102和熵解碼與解量化級104 均能夠訪問數據流22,且概率分布估計器102使其輸出端連接至熵解碼與解量化級104的 輸入端。在熵解碼與解量化級104的輸出端獲得頻譜26。
[0057] 應注意,由熵解碼與解量化級104輸出的頻譜當然可經歷取決于應用的另一處 理。然而,解碼器100的輸出并不一定是為了(例如)使用揚聲器再生的在時域中被編碼 進數據流22中的音頻信號。相反,基于線性預測的音頻解碼器100可與(例如)會議系統 的混頻器、多信道或多對象解碼器等的輸入端連接,并且此連接可在頻譜域中。或者,該頻 譜或其某一處理后版本可通過頻譜分解轉換(例如,如下文進一步描述的使用重迭/相加 過程的逆變換)來經歷頻譜至時間轉換。
[0058] 由于概率分布估計器102能夠與編碼側的概率分布估計器14訪問相同的LPC信 息,所以概率分布估計器102與編碼側的對應估計器進行相同操作,不同的處在于(例如) : 在編碼側對額外LTP參數的確定,將該確定的結果經由數據流22用信號告知解碼側。將熵 解碼與解量化級104配置成在對頻譜62的頻譜值(諸如,來自數據流22的量值水平)進 行熵解碼時使用概率分布估計,且針對所有頻譜分量對這些頻譜值進行同等地解量化以便 獲得頻譜26。關于用于實現熵編碼的各種可能性,參考與熵編碼相關的以上陳述。此外,在 相對于在編碼側使用的方向的逆方向上應用相同量化規(guī)則,使得關于熵編碼與量化的上述 所有替代方案和細節(jié)還應相應地適用于解碼器實施例。即,例如,可將熵解碼與解量化級配 置成使用恒定量化步長對量值水平進行解量化,且可使用(例如)算術解碼。
[0059] 如上文所指出的,頻譜26可表示變換編碼激勵,并且圖8相應地示出了基于線性 預測的音頻解碼器可附加地包括濾波器106,該濾波器106也能夠訪問LPC信息及數據流 22,且連接至熵解碼與解量化級104的輸出端以便接收頻譜26且在其輸出端輸出濾波后的 /重構后的音頻信號的頻譜。具體地,將濾波器106配置成根據傳遞函數來對該頻譜26塑 形,該傳遞函數取決于由該線性預測系數信息界定的線性預測合成濾波器。為了更精確,濾 波器106可通過比例因子確定器34與頻譜塑形器38的級聯來實現,其中頻譜塑形器38從 級104接收頻譜26且輸出濾波后信號,即重構的音頻信號。唯一差異在于,在濾波器106 內執(zhí)行的按比例調整將正好與由編碼側的頻譜塑形器38執(zhí)行的按比例調整反向,S卩,編碼 側的頻譜塑形器38使用比例因子來執(zhí)行(例如)乘法,而在濾波器106中將執(zhí)行除以比例 因子,反之亦然。
[0060] 圖9中示出了濾波器106的環(huán)境,其示出了圖8的濾波器106的實施例。正如所 見到的,濾波器108可包括比例因子確定器110和頻譜塑形器112,比例因子確定器110如 (例如)圖2的比例因子確定器34 -樣操作,頻譜塑形器112如上文概述的相對于頻譜塑 形器38反向地將比例因子確定器110的比例因子應用于傳入的頻譜。
[0061] 圖9例示了濾波器106可例示性地進一步包括逆變換器114、重迭加法器116以及 去加強濾波器118。后面的組件114至118可按其被提及的次序而依序連接至頻譜塑形器 112的輸出端,其中根據另一替代方案,可省略去加強濾波器118或重迭/加法器116和去 加強濾波器118兩者。
[0062] 去加強濾波器118執(zhí)行圖1中的濾波器24的預加強濾波的反向操作,并且在逆變 換器114內使用的逆變換為臨界采樣重疊變換的情況下,重迭/加法器116可(如此項技 術中已知)導致混疊消除。例如,逆變換器114可使以時間速率從頻譜塑形器112接收的 每一頻譜26經歷逆變換以便獲得窗化部分,時間速率為在數據流22內對這些頻譜進行編 碼的時間速率,這些窗化部分繼而由重迭/加法器116重迭相加以產生時域信號版本。正 如預加強濾波器24,去加強濾波器118可被實現為FIR濾波器。
[0063] 在關于附圖描述了本申請的實施例后,在下文提供對本申請的實施例更數學的描 述,之后,該描述接著在圖10和圖11的對應描述中結束。具體地,在下文描述的實施例中, 假設使用頻譜的頻譜值的一元二進制(其中對所得區(qū)間序列????(bin sequence)的區(qū) 間進行二進制算術編碼)來對頻譜進行編碼。
[0064] 具體地,在下文描述的例示性細節(jié)中(應理解的是該例示性細節(jié)可轉移至上述實 施例),已例示性地決定:當幀長度(即,在數據流22內對頻譜26進行更新的頻譜速率)為 256個采樣時,在64個頻帶中計算包絡30的結構;并且當幀長度為320個采樣時,在80個 頻帶中計算包絡30的結構。若LPC模型為A(z),則經加權的LPC為(例如)AUz),其中 Y =0.92,并且濾波器24的相關聯預加強項例如為(1-0. 68廠其中可根據應用改變常 數。包絡30和感知域因此為
【主權項】
1. 一種基于線性預測的音頻解碼器,包括: 概率分布估計器(102),所述概率分布估計器被配置成針對多個頻譜分量中的每個頻 譜分量根據數據流(22)中所包含的線性預測系數信息來確定概率分布估計(28),其中,音 頻信號被編碼進所述數據流中;W及 賭解碼與解量化級(104),所述賭解碼與解量化級被配置成使用針對所述多個頻譜分 量中的每個頻譜分量確定的概率分布估計對來自所述數據流(22)的所述多個頻譜分量所 構成的頻譜(26)進行賭解碼與解量化。
2. 根據權利要求1所述的基于線性預測的音頻解碼器,還包括: 濾波器,所述濾波器被配置成根據傳遞函數來對所述頻譜(26)塑形,所述傳遞函數取 決于由所述線性預測系數信息界定的線性預測合成濾波器。
3. 根據權利要求1或2所述的基于線性預測的音頻解碼器,還包括: 比例因子確定器(110),所述比例因子確定器被配置成基于所述線性預測系數信息來 確定比例因子;W及 頻譜塑形器(112),所述頻譜塑形器被配置成通過使用所述比例因子按比例調整所述 頻譜來對所述頻譜進行頻譜塑形, 其中,所述比例因子確定器被配置成確定所述比例因子,使得所述比例因子表示取決 于由所述線性預測系數信息界定的線性預測合成濾波器的傳遞函數。
4. 根據權利要求2或3所述的基于線性預測的音頻解碼器,其中, 所述傳遞函數對由所述線性預測系數信息界定的所述線性預測合成濾波器的相依性 使得所述傳遞函數被感知加權。
5. 根據權利要求2至4中任一項所述的基于線性預測的音頻解碼器,其中, 所述傳遞函數對由所述線性預測界定的所述線性預測合成濾波器1/A(z)的相依性使 得所述傳遞函數為傳遞函數1/A化? Z),其中,k為常數。
6. 根據權利要求2至5中的任一項所述的基于線性預測的音頻解碼器,其中,所述概率 分布估計器被配置成針對所述多個頻譜分量中的每個頻譜分量來確定概率分布參數,使得 所述概率分布參數在頻譜上遵循一個函數,所述函數取決于所述線性預測合成濾波器的傳 遞函數與所述線性預測合成濾波器的感知加權修改的傳遞函數的倒數的乘積,其中,對于 所述多個頻譜分量中的每個頻譜分量,所述概率分布估計是通過相應頻譜分量的概率分布 參數來參數化的可參數化函數。
7. 根據權利要求2至5中的任一項所述的基于線性預測的音頻解碼器,其中,所述概率 分布估計器被配置成根據所述數據流中所包含的長期預測參數來確定頻譜精細結構,并且 針對所述多個頻譜分量中的每個頻譜分量來確定概率分布參數,使得所述概率分布參數在 頻譜上遵循一個函數,所述函數W乘法方式取決于所述頻譜精細結構,其中,對于所述多個 頻譜分量中的每個頻譜分量,所述概率分布估計是通過相應頻譜分量的概率分布參數來參 數化的可參數化函數。
8. 根據權利要求7所述的基于線性預測的音頻解碼器,其中,所述概率分布估計器被 配置成使得所述頻譜精細結構是通過所述長期