本發(fā)明涉及語音及音頻編碼,尤其涉及用于處理音頻信號(對于其,輸入和輸出取樣率從先前幀變化至當前幀)的音頻編碼裝置以及音頻解碼裝置。本發(fā)明還涉及操作此類裝置的方法以及執(zhí)行此方法的計算機程序。
背景技術:
語音及音頻編碼能夠得到具有多節(jié)奏(multi-cadence)的輸入及輸出的好處,并且得到能夠立即地且無縫地將一個取樣率切換至另一取樣率。傳統(tǒng)的語音及音頻編碼器對于確定的輸出比特率使用單取樣率并且在不徹底重設系統(tǒng)時無法對其進行改變。這隨后在通信中以及在解碼信號中造成不連續(xù)。
另一方面,通過選擇通常取決于源和信道條件的多個優(yōu)化參數(shù),適應性取樣率以及比特率允許較高質量。隨后,重要的是當改變輸入/輸出信號的取樣率時實現(xiàn)無縫過渡。
此外,重要的是對于此過渡限制復雜度增加。現(xiàn)代語音及音頻編解碼器,如將至的跨LTE網(wǎng)絡的3GPP EVS,將需要能夠開發(fā)此功能。
高效的語音及音頻編碼器需要能夠從時域至另一者改變其取樣率以更好地適合于源與信道條件。取樣率的改變對于連續(xù)線性濾波器尤其是個問題,其僅可以在它們的過去狀態(tài)顯示與當前時間區(qū)間相同的取樣率用以濾波時應用。
更特別地,預測性編碼隨著時間和幀在編碼器及解碼器處維持不同的存儲器狀態(tài)。在碼激勵線性預測(CELP,code-excited linear prediction)中,這些存儲器通常是線性預測編碼(LPC)合成濾波器存儲器、去加重濾波器存儲器以及適應性碼本。直接的方案是當取樣率改變發(fā)生時重設全部存儲器。這在解碼信號中造成非常惱人的不連續(xù)?;謴涂赡苁欠浅>们曳浅C黠@的。
圖1示出根據(jù)現(xiàn)有技術的第一音頻解碼器裝置。使用此音頻解碼器裝置,當來源于非預測性編碼方案時,無縫地切換至預測性編碼是可能的。此可以通過對用于維持預測性編碼器所需的濾波器狀態(tài)的非預測性編碼器的解碼輸出的反向濾波來進行。例如,在AMR-WB+及USAC中進行,用于從基于變換的編碼器、TCX切換至語音編碼器、ACELP。然而,在此兩種編碼器中,取樣率是相同的。反向濾波可直接用在TCX的解碼的音頻信號上。此外,在USAC及AMR-WB+中的TCX傳送并利用也被反向濾波所需的LPC系數(shù)。LPC解碼的系數(shù)在反向濾波計算中被簡單地再使用。值得注意的是,如果使用相同的濾波器和相同的取樣率在兩個預測性編碼器之間切換,則不需要反向濾波。
圖2示出根據(jù)現(xiàn)有技術的第二音頻解碼器裝置。在兩個編碼器具有不同取樣率的情況下,或在相同的預測性編碼器中但使用不同取樣率切換的情況下,如圖1所示的先前音頻幀的反向濾波不再足夠。直接的方案是將過去解碼的輸出再取樣為新的取樣率并且然后通過反向濾波計算存儲器狀態(tài)。如果一些濾波器系數(shù)是取樣率依賴的,如針對LPC合成濾波器的情況,則需要進行再取樣的過去信號的額外分析。為了以新的取樣率fs_2得到LPC系數(shù),重新計算自相關函數(shù)且對再取樣的過去解碼的樣本使用列文遜-杜賓算法(Levinson-Durbin algorithm)。此方案是計算苛刻的并且難以在實際實施中使用。
技術實現(xiàn)要素:
待解決的問題在于提供用于在音頻處理裝置處切換取樣率的改進概念。
在第一方面中,通過用于對比特流進行解碼的音頻解碼器裝置解決問題,其中音頻解碼器裝置包括:
預測性解碼器,用于從比特流產生解碼的音頻幀,其中預測性解碼器包括用于從比特流產生用于解碼的音頻幀的一個或多個音頻參數(shù)的參數(shù)解碼器,并且其中預測性解碼器包括用于通過合成用于解碼的音頻幀的一個或多個音頻參數(shù)而產生解碼的音頻幀的合成濾波器裝置;
存儲器裝置,包括一個或多個存儲器,其中每個存儲器用于存儲用于解碼的音頻幀的存儲器狀態(tài),其中一個或多個存儲器的用于解碼的音頻幀的存儲器狀態(tài)被合成濾波器裝置用來合成用于解碼的音頻幀的一個或多個音頻參數(shù);以及
存儲器狀態(tài)再取樣裝置,用于通過針對所述存儲器中的一個或多個再取樣用來合成用于先前解碼的音頻幀的一個或多個音頻參數(shù)的先前存儲器狀態(tài),為所述存儲器中的一個或多個確定用來合成用于解碼的音頻幀的一個或多個音頻參數(shù)的存儲器狀態(tài),解碼的音頻幀具有取樣率,先前解碼的音頻幀具有不同于解碼的音頻幀的取樣率的先前取樣率;并用于將用于所述存儲器中的一個或多個的用來合成用于解碼的音頻幀的一個或多個音頻參數(shù)的存儲器狀態(tài)存儲于各個存儲器中。
術語“解碼的音頻幀”指當前正在處理的音頻幀,而術語“先前解碼的音頻幀”指在當前正在處理的音頻幀之前被處理的音頻幀。
本發(fā)明允許預測性編碼方案切換其內部取樣率(intern sampling rate),而無需再取樣整個緩沖區(qū),用以重新計算其濾波器的狀態(tài)。通過直接僅對必要的存儲器狀態(tài)再取樣,可維持低復雜度,而無縫過渡仍是可能的。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器包括用于存儲適應性碼本存儲器狀態(tài)的適應性碼本存儲器,該適應性碼本存儲器狀態(tài)用來確定用于解碼的音頻幀的一個或多個激發(fā)參數(shù);其中,存儲器狀態(tài)再取樣裝置用于通過再取樣用來確定用于先前解碼的音頻幀的一個或多個激發(fā)參數(shù)的先前適應性碼本狀態(tài),確定用來確定用于解碼的音頻幀的一個或多個激發(fā)參數(shù)的適應性碼本狀態(tài),以及存儲器狀態(tài)再取樣裝置用于將用來確定用于解碼的音頻幀的一個或多個激發(fā)參數(shù)的適應性碼本狀態(tài)存儲于適應性碼本存儲器中。
例如,適應性碼本存儲器狀態(tài)用于CELP裝置中。
為了能夠再取樣存儲器,在不同取樣率下的存儲器大小必須關于其覆蓋的時間持續(xù)而相同。換言之,如果濾波器在取樣率fs_2下具有M階,在先前取樣率fs_1下更新的存儲器應覆蓋至少M*(fs_1)/(fs_2)個樣本。
由于在適應性碼本的情況下存儲器通常與取樣率成比例,不論取樣率如何其都覆蓋解碼的殘余信號的大約最后20ms,無需進行額外的存儲器管理。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器包括用于存儲合成濾波器存儲器狀態(tài)的合成濾波器存儲器,合成濾波器存儲器狀態(tài)用來確定用于解碼的音頻幀的一個或多個合成濾波器參數(shù);其中,存儲器狀態(tài)再取樣裝置用于通過再取樣用來確定用于先前解碼的音頻幀的一個或多個合成濾波器參數(shù)的先前合成存儲器狀態(tài),確定用來確定用于解碼的音頻幀的一個或多個合成濾波器參數(shù)的合成存儲器狀態(tài),以及存儲器狀態(tài)再取樣裝置用于將用來確定用于解碼的音頻幀的一個或多個合成濾波器參數(shù)的合成存儲器狀態(tài)存儲于合成濾波器存儲器中。
合成濾波器存儲器狀態(tài)可以是LPC合成濾波器狀態(tài),其可例如在CELP裝置中使用。
如果不論取樣率如何存儲器的階數(shù)都不與取樣率成比例或者甚至是常數(shù),則需要進行額外的存儲器管理,以能夠覆蓋盡可能的最大持續(xù)時間。例如,AMR-WB+的LPC合成狀態(tài)階數(shù)總是16。在12.8kHz的最小取樣率下,其覆蓋1.25ms,而其在48kHz下僅表示0.33ms。為了能夠在介于12.8kHz與48kHz之間的任何取樣率下再取樣緩沖區(qū),LPC合成濾波器狀態(tài)的存儲器必須從16個樣本擴展至60個樣本,其在48kHz下表示1.25ms。
存儲器再取樣隨后可由以下偽碼描述:
mem_syn_r_size_old=(int)(1.25*fs_1/1000);
mem_syn_r_size_new=(int)(1.25*fs_2/1000);
mem_syn_r+L_SYN_MEM-mem_syn_r_size_new=
resamp(mem_syn_r+L_SYN_MEM-mem_syn_r_size_old,
mem_syn_r_size_old,mem_syn_r_size_new);
其中resamp(X,I,L)輸出從1到L個樣本再取樣的輸入緩沖區(qū)X,L_SYN_MEM是存儲器可覆蓋的樣本的最大大小。在本例中其對于fs_2<=48kHz等于60個樣本。在任何取樣率下,需要使用最后L_SYN_MEM個輸出樣本來更新mem_syn_r。
For(i=0;i<L_SYM_MEM;i++)
mem_syn_r[i]=y(tǒng)[L_frame-L_SYN_MEM+i];
其中y[]是LPC合成濾波器的輸出,以及L_frame是在當前取樣率下的幀的大小。
然而,將通過使用從mem_syn_r[L_SYN_MEM-M]到mem_syn_r[L_SYN_MEM-1]的狀態(tài)執(zhí)行合成濾波器。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器再取樣裝置以此方式配置:相同的合成濾波器參數(shù)被用于解碼的音頻幀的多個子幀。
最后幀的LPC系數(shù)通常用于以5ms的時間粒度對當前LPC系數(shù)進行內插。如果取樣率變化,則無法進行內插。如果重新計算LPC,可以使用新計算的LPC系數(shù)進行內插。在本發(fā)明中,不能直接進行內插。在一個實施例中,在取樣率切換之后,LPC系數(shù)未被內插于第一幀中。對全部5ms的子幀,使用系數(shù)的相同集合。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器再取樣裝置以此方式配置:通過將用于先前解碼的音頻幀的合成濾波器存儲器狀態(tài)變換至功率譜以及通過再取樣功率譜,進行先前合成濾波器存儲器狀態(tài)的再取樣。
在此實施例中,如果最后的編碼器也是預測性編碼器或如果最后的編碼器也傳送LPC的集合,如TCX,可在新的取樣率fs_2下估計LPC系數(shù),而無需重進行整個LP分析。在取樣率fs_1下的舊的LPC系數(shù)被變換至被再取樣的功率譜。然后對從再取樣的功率譜中推論出的自相關使用列文遜-杜賓算法。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器包括用于存儲去加重存儲器狀態(tài)的去加重存儲器,去加重存儲器狀態(tài)用來確定用于解碼的音頻幀的一個或多個去加重參數(shù);其中,存儲器狀態(tài)再取樣裝置用于通過再取樣用來確定用于先前解碼的音頻幀的一個或多個去加重參數(shù)的先前去加重存儲器狀態(tài),確定用來確定用于解碼的音頻幀的一個或多個去加重參數(shù)的去加重存儲器狀態(tài),以及存儲器狀態(tài)再取樣裝置用于將用來確定用于解碼的音頻幀的一個或多個去加重參數(shù)的去加重存儲器狀態(tài)存儲于去加重存儲器中。
例如,去加重存儲器狀態(tài)也用在CELP中。
去加重通常具有1的固定階數(shù),其在12.8kHz下表示0.078lms。此持續(xù)時間在48kHz下被3.75個樣本覆蓋。隨后,如果采用上述方法,需要4個樣本的存儲器緩沖區(qū)。可選地,可通過繞過再取樣狀態(tài)使用近似法。可看到非常粗糙的再取樣,其包括保持最后的輸出樣本,不論取樣率差異如何。此近似在大部分時間是足夠的并且可出于低復雜度原因而被使用。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器以此方式配置:用于解碼的音頻幀的所存儲的樣本的數(shù)量與解碼的音頻幀的取樣率成比例。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器再取樣裝置以此方式配置:通過線性內插進行再取樣。
再取樣函數(shù)resamp()可以使用任何類型的再取樣方法實現(xiàn)。在時域中,傳統(tǒng)LP濾波器以及抽取/過取樣(decimation/oversampling)是常見的。在優(yōu)選的實施例中,可采用簡單線性內插,關于質量其足以用于再取樣濾波器存儲器。其允許節(jié)省甚至更多的復雜度。也可以在頻域中進行再取樣。在最后的方案中,由于存儲器僅是濾波器的起始狀態(tài),不需要注意塊效應(block artefacts)。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器狀態(tài)再取樣裝置用于從存儲器裝置檢索用于所述存儲器中的一個或多個的先前存儲器狀態(tài)。
當以不同的內部取樣率使用相同編碼方案時,可使用本發(fā)明。例如,當信道的可用帶寬受限時針對低比特率以12.8kHz的內部取樣率使用CELP以及當信道條件較好時針對較高比特率切換至16kHz的內部取樣率使用CELP時,可以是此情況。
根據(jù)本發(fā)明的優(yōu)選的實施例,音頻解碼器裝置包括反向濾波裝置,反向濾波裝置用于在先前取樣率下的先前解碼的音頻幀的反向濾波,以確定所述存儲器中的一個或多個的先前存儲器狀態(tài),其中存儲器狀態(tài)再取樣裝置用于從反向濾波裝置檢索用于所述存儲器中的一個或多個的先前存儲器狀態(tài)。
這些特征允許針對此種情況實施本發(fā)明,其中由非預測性解碼器處理先前音頻幀。
在本發(fā)明實施例中,不在反向濾波之前使用再取樣,而是直接再取樣存儲器狀態(tài)自身。如果處理先前音頻幀的在先解碼器是預測性解碼器如CELP,由于先前存儲器狀態(tài)總是維持于先前取樣率下,則不需要且可繞過反向解碼。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器狀態(tài)再取樣裝置用于從另一音頻處理裝置檢索用于所述存儲器中的一個或多個的先前存儲器狀態(tài)。
另一音頻處理裝置可以例如是另一音頻解碼器裝置或用于噪聲生成裝置的房間。
當使用傳統(tǒng)CELP在12.8kHz下編碼活躍幀時以及當使用16kHz噪聲生成器(CNG)建模不活躍部分時,可在DTX模式下使用本發(fā)明。
例如,當結合在不同取樣率下運行的TCX及ACELP時可使用本發(fā)明。
在本發(fā)明另一方面中,通過用于操作用于對比特流進行解碼的音頻解碼器裝置的方法解決問題,該方法包括以下步驟:
使用預測性解碼器從比特流產生解碼的音頻幀,其中預測性解碼器包括用于從比特流產生用于解碼的音頻幀的一個或多個音頻參數(shù)的參數(shù)解碼器,以及其中預測性解碼器包括用于通過合成用于解碼的音頻幀的一個或多個音頻參數(shù)而產生解碼的音頻幀的合成濾波器裝置;
提供包括一個或多個存儲器的存儲器裝置,其中每個存儲器用于存儲用于解碼的音頻幀的存儲器狀態(tài),其中一個或多個存儲器的用于解碼的音頻幀的存儲器狀態(tài)被合成濾波器裝置用來合成用于解碼的音頻幀的一個或多個音頻參數(shù);
通過針對所述存儲器中的一個或多個再取樣用來合成用于先前解碼的音頻幀的一個或多個音頻參數(shù)的先前存儲器狀態(tài),為所述存儲器中的一個或多個確定用來合成用于解碼的音頻幀的一個或多個音頻參數(shù)的存儲器狀態(tài),解碼的音頻幀具有取樣率,先前解碼的音頻幀具有與解碼的音頻幀的取樣率不同的先前取樣率;以及
將用于所述存儲器中的一個或多個的用來合成用于解碼的音頻幀的一個或多個音頻參數(shù)的存儲器狀態(tài)存儲于各個存儲器中。
本發(fā)明的另一方面中,通過計算機程序解決問題,當在處理器上運行時,計算機程序執(zhí)行根據(jù)本發(fā)明的方法。
在本發(fā)明提供的方面中,通過用于對成幀的音頻信號進行編碼的音頻編碼器裝置解決問題,其中音頻編碼器裝置包括:
預測性編碼器,用于從成幀的音頻信號產生編碼的音頻幀,其中預測性編碼器包括用于從成幀的音頻信號產生用于編碼的音頻幀的一個或多個音頻參數(shù)的參數(shù)分析器,以及其中預測性編碼器包括用于通過合成用于解碼的音頻幀的一個或多個音頻參數(shù)而產生解碼的音頻幀的合成濾波器裝置,其中用于解碼的音頻幀的一個或多個音頻參數(shù)是用于編碼的音頻幀的一個或多個音頻參數(shù);
存儲器裝置,包括一個或多個存儲器,其中每個存儲器用于存儲用于解碼的音頻幀的存儲器狀態(tài),其中一個或多個存儲器的用于解碼的音頻幀的存儲器狀態(tài)被合成濾波器裝置用來合成用于解碼的音頻幀的一個或多個音頻參數(shù);以及
存儲器狀態(tài)再取樣裝置,用于通過針對所述存儲器中的一個或多個再取樣用來合成用于先前解碼的音頻幀的一個或多個音頻參數(shù)的先前存儲器狀態(tài),為所述存儲器中的一個或多個確定用來合成用于解碼的音頻幀的一個或多個音頻參數(shù)的存儲器狀態(tài),解碼的音頻幀具有取樣率,先前解碼的音頻幀具有與解碼的音頻幀的取樣率不同的先前取樣率,以及存儲器狀態(tài)再取樣裝置用于將用于所述存儲器中的一個或多個的用來合成用于解碼的音頻幀的一個或多個音頻參數(shù)的存儲器狀態(tài)存儲于各個存儲器中。
本發(fā)明主要關注音頻解碼器裝置。然而,其也可以用在音頻編碼器裝置處。的確,CELP是基于綜合分析(Analysis-by-Synthesis)原則,其中在編碼器側進行本地解碼。為此,如針對解碼器所描述的相同原則可在編碼器側使用。此外,在切換編碼的情況下,例如ACELP/TCX,基于變換的編碼器可能需要在下一幀中編碼切換的情況下甚至在編碼器側也能夠更新語音編碼器的存儲器。為此,在基于變換的編碼器中使用本地解碼器,以用于更新CELP的存儲器狀態(tài)。這可以是,基于變換的編碼器在與CELP不同的取樣率下運行,并且隨后可在這種情況下使用本發(fā)明。
應理解的是,音頻編碼器裝置的合成濾波器裝置、存儲器裝置、存儲器狀態(tài)再取樣裝置以及反向濾波裝置等效于前述音頻解碼器裝置的合成濾波器裝置、存儲器裝置、存儲器狀態(tài)再取樣裝置以及反向濾波裝置。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器包括用于存儲適應性碼本狀態(tài)的適應性碼本存儲器,適應性碼本狀態(tài)用來確定用于解碼的音頻幀的一個或多個激發(fā)參數(shù);其中,存儲器狀態(tài)再取樣裝置用于通過再取樣用來確定用于先前解碼的音頻幀的一個或多個激發(fā)參數(shù)的先前適應性碼本狀態(tài),確定用來確定用于解碼的音頻幀的一個或多個激發(fā)參數(shù)的適應性碼本狀態(tài),以及存儲器狀態(tài)再取樣裝置用于將用來確定用于解碼的音頻幀的一個或多個激發(fā)參數(shù)的適應性碼本狀態(tài)存儲于適應性碼本存儲器中。
根據(jù)本發(fā)明的優(yōu)選的實施例,其中一個或多個存儲器包括用于存儲合成濾波器存儲器狀態(tài)的合成濾波器存儲器,合成濾波器存儲器狀態(tài)用來確定用于解碼的音頻幀的一個或多個合成濾波器參數(shù);其中,存儲器狀態(tài)再取樣裝置用于通過再取樣用來確定用于先前解碼的音頻幀的一個或多個合成濾波器參數(shù)的先前合成存儲器狀態(tài),確定用來確定用于解碼的音頻幀的一個或多個合成濾波器參數(shù)的合成存儲器狀態(tài),以及存儲器狀態(tài)再取樣裝置用于將用來確定用于解碼的音頻幀的一個或多個合成濾波器參數(shù)的合成存儲器狀態(tài)存儲于合成濾波器存儲器中。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器狀態(tài)再取樣裝置以此方式配置:相同的合成濾波器參數(shù)被用于解碼的音頻幀的多個子幀。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器再取樣裝置以此方式配置:通過將用于先前解碼的音頻幀的先前合成濾波器存儲器狀態(tài)變換至功率譜以及通過再取樣功率譜,進行先前合成濾波器存儲器狀態(tài)的再取樣。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器包括用于存儲去加重存儲器狀態(tài)的去加重存儲器,去加重存儲器狀態(tài)用來確定用于解碼的音頻幀的一個或多個去加重參數(shù);其中,存儲器狀態(tài)再取樣裝置用于通過再取樣用來確定用于先前解碼的音頻幀的一個或多個去加重參數(shù)的先前去加重存儲器狀態(tài),確定用來確定用于解碼的音頻幀的一個或多個去加重參數(shù)的去加重存儲器狀態(tài),以及存儲器狀態(tài)再取樣裝置用于將用來確定用于解碼的音頻幀的一個或多個去加重參數(shù)的去加重存儲器狀態(tài)存儲于去加重存儲器中。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器以此方式配置:用于解碼的音頻幀的所存儲的樣本的數(shù)量與解碼的音頻幀的取樣率成比例。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器再取樣裝置以此方式配置:通過線性內插進行再取樣。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器狀態(tài)再取樣裝置用于從存儲器裝置檢索用于所述存儲器中的一個或多個的先前存儲器狀態(tài)。
根據(jù)本發(fā)明的優(yōu)選的實施例,音頻編碼器裝置包括反向濾波裝置,其用于先前解碼的音頻幀的反向濾波,以確定用于所述存儲器中的一個或多個的先前存儲器狀態(tài);其中存儲器狀態(tài)再取樣裝置用于從反向濾波裝置檢索用于所述存儲器中的一個或多個的先前存儲器狀態(tài)。
根據(jù)本發(fā)明的優(yōu)選的實施例的音頻編碼器裝置,其中存儲器狀態(tài)再取樣裝置用于從另一音頻編碼器裝置檢索用于所述存儲器中的一個或多個的先前存儲器狀態(tài)。
在本發(fā)明另一方面中,通過用于操作用于對成幀的音頻信號進行編碼的音頻編碼器裝置的方法解決問題,該方法包括以下步驟:
使用預測性編碼器從成幀的音頻信號產生編碼的音頻幀,其中預測性編碼器包括用于從成幀的音頻信號產生用于編碼的音頻幀的一個或多個音頻參數(shù)的參數(shù)分析器,其中預測性編碼器包括用于通過合成用于解碼的音頻幀的一個或多個音頻參數(shù)而產生解碼的音頻幀的合成濾波器裝置,其中用于解碼的音頻幀的一個或多個音頻參數(shù)是用于編碼的音頻幀的一個或多個音頻參數(shù);
提供包括一個或多個存儲器的存儲器裝置,其中每個存儲器用于存儲用于解碼的音頻幀的存儲器狀態(tài),其中一個或多個存儲器的用于解碼的音頻幀的存儲器狀態(tài)被合成濾波器裝置用來合成用于解碼的音頻幀的一個或多個音頻參數(shù);
通過針對所述存儲器中的一個或多個再取樣用來合成用于先前解碼的音頻幀的一個或多個音頻參數(shù)的先前存儲器狀態(tài),為所述存儲器中的一個或多個確認用來合成用于解碼的音頻幀的一個或多個音頻參數(shù)的存儲器狀態(tài),解碼的音頻幀具有取樣率,先前解碼的音頻幀具有與解碼的音頻幀的取樣率不同的先前取樣率;以及
將用于所述存儲器中的一個或多個的用來合成用于解碼的音頻幀的一個或多個音頻參數(shù)的存儲器狀態(tài)存儲于各個存儲器中。
根據(jù)本發(fā)明的另一方面,通過計算機程序解決問題,當在處理器上運行時,計算機程序執(zhí)行根據(jù)本發(fā)明的方法。
附圖說明
本發(fā)明的優(yōu)選的實施例將隨后參考附圖進行討論,其中:
圖1在示意圖中示出根據(jù)現(xiàn)有技術的音頻解碼器裝置的實施例;
圖2在示意圖中示出根據(jù)現(xiàn)有技術的音頻解碼器裝置的第二實施例;
圖3在示意圖中示出根據(jù)本發(fā)明的音頻解碼器裝置的第一實施例;
圖4在示意圖中示出根據(jù)本發(fā)明的音頻解碼器裝置的第一實施例的更多細節(jié);
圖5在示意圖中示出根據(jù)本發(fā)明的音頻解碼器裝置的第二實施例;
圖6在示意圖中示出根據(jù)本發(fā)明的音頻解碼器裝置的第二實施例的更多細節(jié);
圖7在示意圖中示出根據(jù)本發(fā)明的音頻解碼器裝置的第三實施例;以及
圖8在示意圖中示出根據(jù)本發(fā)明的音頻編碼器裝置的實施例。
具體實施方式
圖1在示意圖中示出根據(jù)現(xiàn)有技術的音頻解碼器裝置的實施例。
根據(jù)現(xiàn)有技術的音頻解碼器裝置1包括:
預測性解碼器2,用于從比特流BS產生解碼的音頻幀AF,其中預測性解碼器2包括用于從比特流BS產生用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP的參數(shù)解碼器3,并且其中預測性解碼器2包括用于通過合成用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP而產生解碼的音頻幀AF的合成濾波器裝置4;
存儲器裝置5,包括一個或多個存儲器6,其中存儲器6中的每個用于存儲用于解碼的音頻幀AF的存儲器狀態(tài)MS,其中一個或多個存儲器6的用于解碼的音頻幀AF的存儲器狀態(tài)MS被合成濾波器裝置4用來合成用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP;以及
反向濾波裝置7,用于具有與解碼的音頻幀AF相同的取樣率SR的先前解碼的音頻幀PAF的反向濾波。
為了合成音頻參數(shù)AP,合成濾波器4向存儲器6發(fā)送詢問信號IS,其中詢問信號IS取決于一個或多個音頻參數(shù)AP。存儲器6回復響應信號RS,其取決于詢問信號IS以及用于解碼的音頻幀AF的存儲器狀態(tài)MS。
現(xiàn)有技術音頻解碼器裝置的此實施例允許從非預測性音頻解碼器裝置切換至如圖1所示的預測性解碼器裝置1。然而,其仍需要非預測性音頻解碼器裝置與預測性解碼器裝置1使用相同的取樣率SR。
圖2在示意圖中示出根據(jù)現(xiàn)有技術的音頻解碼器裝置1的第二實施例。除了圖1所示的音頻解碼器裝置1的特征之外,圖2所示的音頻解碼器裝置1包括音頻幀再取樣裝置8,其用于再取樣具有先前取樣率PSR的先前音頻幀PAF,以產生具有取樣率SR的先前音頻幀PAF,取樣率SR是音頻幀AF的取樣率SR。
然后,通過參數(shù)分析器9分析具有取樣率SR的先前音頻幀PAF,參數(shù)分析器9用于確定用于具有取樣率SR的先前音頻幀PAF的LPC系數(shù)LPCC。然后,LPC系數(shù)LPCC被反向濾波裝置7用于具有取樣率SR的先前音頻幀PAF的反向濾波,以確定用于解碼的音頻幀AF的存儲器狀態(tài)MS。
此方案是計算苛刻的且難以在實際實施中使用。
圖3在示意圖中示出根據(jù)本發(fā)明的音頻解碼器裝置的第一實施例。
音頻解碼器裝置1包括:
預測性解碼器2,用于從比特流BS產生解碼的音頻幀AF,其中預測性解碼器2包括用于從比特流BS產生用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP的參數(shù)解碼器3,并且其中預測性解碼器2包括用于通過合成用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP而產生解碼的音頻幀AF的合成濾波器裝置4;
存儲器裝置5,包括一個或多個存儲器6,其中存儲器6中的每個用于存儲用于解碼的音頻幀AF的存儲器狀態(tài)MS,其中一個或多個存儲器6的用于解碼的音頻幀AF的存儲器狀態(tài)MS被合成濾波器裝置4用來合成用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP;以及
存儲器狀態(tài)再取樣裝置10,用于通過針對所述存儲器6中的一個或多個再取樣用來合成用于先前解碼的音頻幀PAF的一個或多個音頻參數(shù)的先前存儲器狀態(tài)PMS,為所述存儲器6中的一個或多個確定用來合成用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP的存儲器狀態(tài)MS,解碼的音頻幀AF具有取樣率SR,先前解碼的音頻幀PAF具有與解碼的音頻幀AF的取樣率SR不同的先前取樣率PSR;并用于將用于所述存儲器6中的一個或多個的用來合成用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP的存儲器狀態(tài)MS存儲于各個存儲器中。
為了合成音頻參數(shù)AP,合成濾波器4向存儲器6發(fā)送詢問信號IS,其中詢問信號IS取決于一個或多個音頻參數(shù)AP。存儲器6回復響應信號RS,其取決于詢問信號IS以及用于解碼的音頻幀AF的存儲器狀態(tài)MS。
術語“解碼的音頻幀AF”指當前正在處理的音頻幀,而術語“先前解碼的音頻幀PAF”指在當前正在處理的音頻幀之前被處理的音頻幀。
本發(fā)明允許預測性編碼方案切換其內部取樣率,而無需再取樣整個緩沖區(qū),以重新計算其濾波器的狀態(tài)。通過直接僅對必要的存儲器狀態(tài)MS再取樣,可維持低復雜度,而無縫過渡仍是可能的。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器狀態(tài)再取樣裝置10用于從存儲器裝置5檢索用于所述存儲器6中的一個或多個的先前存儲器狀態(tài)PMS;PAMS,PSMS,PDMS。
當以不同的內部取樣率PSR、SR使用相同的編碼方案時,可使用本發(fā)明。例如,當信道的可用帶寬受限時針對低比特率以12.8kHz的內部取樣率PSR以及當信道條件較好時針對較高比特率切換至16kHz的內部取樣率SR使用CELP時,可以是此情況。
圖4在示意圖中示出根據(jù)本發(fā)明的音頻解碼器裝置的第一實施例的更多細節(jié)。如圖4所示,存儲器裝置5包括第一存儲器6a,其是適應性碼本6a、第二存儲器6b,其是合成濾波器存儲器6b、以及第三存儲器6c,其是去加重存儲器6c。
音頻參數(shù)AP被提供至激發(fā)模塊11,激發(fā)模塊11產生由延遲插入器12延遲的輸出信號OS,該輸出信號OS被發(fā)送至適應性碼本存儲器6a作為詢問信號ISa。適應性碼本存儲器6a輸出響應信號RSa,其含有被提供至激發(fā)模塊11的一個或多個激發(fā)參數(shù)EP。
激發(fā)模塊11的輸出信號OS被進一步提供至合成濾波器模塊13,濾波器模塊13輸出輸出信號OS1。輸出信號OS1被延遲插入器14延遲并被發(fā)送至合成濾波器存儲器6b作為詢問信號ISb。合成濾波器存儲器13輸出響應信號RSb,其含有被提供至合成濾波器存儲器13的一個或多個合成參數(shù)SP。
合成濾波器模塊13的輸出信號OS1被進一步提供至去加重模塊15,去加重模塊15輸出在取樣率SR下的解碼的音頻幀AF。音頻幀AF被延遲插入器16延遲并提供至去加重存儲器6c作為詢問信號ISc。去加重存儲器6c輸出響應信號RSc,其含有被提供至去加重模塊15的一個或多個去加重參數(shù)DP。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器6a、6b、6c包括用于存儲適應性碼本存儲器狀態(tài)AMS的適應性碼本存儲器6a,適應性碼本存儲器狀態(tài)AMS用于確定用于解碼的音頻幀AF的一個或多個激發(fā)參數(shù)EP;其中,存儲器狀態(tài)再取樣裝置10用于通過再取樣用來確定用于先前解碼的音頻幀PAF的一個或多個激發(fā)參數(shù)的先前適應性碼本存儲器狀態(tài)PAMS,確定用來確定用于解碼的音頻幀AF的一個或多個激發(fā)參數(shù)EP的適應性碼本存儲器狀態(tài)AMS;并用于將用來確定用于解碼的音頻幀AF的一個或多個激發(fā)參數(shù)EP的適應性碼本存儲器狀態(tài)AMS存儲于適應性碼本存儲器6a中。
例如,適應性碼本存儲器狀態(tài)AMS用在CELP裝置中。
為了能夠再取樣存儲器6a、6b、6c,在不同取樣率SR、PSR下的存儲器大小需要關于其覆蓋的時間持續(xù)而相同。換言之,如果濾波器在取樣率SR下具有M階,在先前取樣率PSR下更新的存儲器應覆蓋至少M*(PSR)/(SR)個樣本。
在適應性碼本的情況下,由于存儲器6a通常與取樣率SR成比例,其不論取樣率如何都覆蓋解碼的殘余信號的大約最后20ms,則不需要進行額外的存儲器管理。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器6a、6b、6c包括用于存儲用于確定用于解碼的音頻幀AF的一個或多個合成濾波器參數(shù)SP的合成濾波器存儲器狀態(tài)SMS的合成濾波器存儲器6b,其中存儲器狀態(tài)再取樣裝置1用于通過再取樣用來確定用于先前解碼的音頻幀PAF的一個或多個合成濾波器參數(shù)的先前合成存儲器狀態(tài)PSMS,確定用來確定用于解碼的音頻幀AF的一個或多個合成濾波器參數(shù)SP的合成濾波器存儲器狀態(tài)SMS,并用于將用來確定用于解碼的音頻幀AF的一個或多個合成濾波器參數(shù)SP的合成存儲器狀態(tài)SMS存儲于合成濾波器存儲器6b中。
合成濾波器存儲器狀態(tài)SMS可以是LPC合成濾波器狀態(tài),其可例如在CELP裝置中使用。
如果不論取樣率如何存儲器的階數(shù)都不與取樣率SR成比例或者甚至是常數(shù),則需要進行額外的存儲器管理,以能夠覆蓋盡可能的最大持續(xù)時間。例如,AMR-WB+的LPC合成狀態(tài)階數(shù)總是16。在12.8kHz的最小取樣率下,其覆蓋1.25ms,而其在48kHz下僅表示0.33ms。為了能夠在介于12.8kHz與48kHz之間的任何取樣率下再取樣緩沖區(qū),LPC合成濾波器狀態(tài)的存儲器需要從16個樣本擴展至60個樣本,這在48kHz下表示1.25ms。
存儲器再取樣隨后可由以下偽碼描述:
mem_syn_r_size_old=(int)(1.25*PSR/1000);
mem_syn_r_size_new=(int)(1.25*SR/1000);
mem_syn_r+L_SYN_MEM-mem_syn_r_size_new=
resamp(mem_syn_r+L_SYN_MEM-mem_syn_r_size_old,
mem_syn_r_size_old,mem_syn_r_size_new);
其中resamp(X,I,L)輸出從1到L個樣本再取樣的輸入緩沖區(qū)X,L_SYN_MEM是存儲器可覆蓋的樣本的最大大小。在本例中其對于SR<=48kHz.等于60個樣本。在任何取樣率下,需要使用最后L_SYN_MEM個輸出樣本來更新mem_syn_r。
For(i=0;i<L_SYM_MEM;i++)
mem_syn_r[i]=y(tǒng)[L_frame-L_SYN_MEM+i];
其中y[]是LPC合成濾波器的輸出,以及L_frame是在當前取樣率下的幀的大小。
然而,將通過使用從mem_syn_r[L_SYN_MEM-M]到mem_syr_r[L_SYN_MEM-1]的狀態(tài)執(zhí)行合成濾波器。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器再取樣裝置10以此方式配置:相同的合成濾波器參數(shù)SP被用于解碼的音頻幀AF的多個子幀。
最后幀PAF的LPC系數(shù)通常用于以5ms的時間粒度對當前LPC系數(shù)進行內插。如果取樣率從PSR變?yōu)镾R,則無法進行內插。如果重新計算LPC,可以使用新計算的LPC系數(shù)進行內插。在本發(fā)明中,不能直接進行內插。在一個實施例中,當取樣率切換之后,LPC系數(shù)未被內插于第一幀AF中。對全部5ms的子幀,使用系數(shù)的相同集合。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器再取樣裝置10以此方式配置:通過將用于先前解碼的音頻幀PAF的先前合成濾波器存儲器狀態(tài)PSMS變換至功率譜以及通過再取樣功率譜,進行先前合成濾波器存儲器狀態(tài)PSMS的再取樣。
在此實施例中,如果最后的編碼器也是預測性編碼器或如果最后的編碼器也傳送LPC的集合,如TCX,可在新的取樣率RS下估計LPC系數(shù),而無需重進行整個LP分析。在取樣率PSR下的舊的LPC系數(shù)被變換至被再取樣的功率譜。然后對從再取樣的功率譜中推論出的自相關使用列文遜-杜賓算法。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器6a、6b、6c包括用于存儲去加重存儲器狀態(tài)DMS的去加重存儲器6c,去加重存儲器狀態(tài)DMS用于確定用于解碼的音頻幀AF的一個或多個去加重參數(shù)DP;其中,存儲器狀態(tài)再取樣裝置10用于通過再取樣用來確定用于先前解碼的音頻幀PAF的一個或多個去加重參數(shù)的先前去加重存儲器狀態(tài)PDMS,確定用來確定用于解碼的音頻幀AF的一個或多個去加重參數(shù)DP的去加重存儲器狀態(tài)DMS,并用于將用來確定用于解碼的音頻幀AF的一個或多個去加重參數(shù)DP的去加重存儲器狀態(tài)DMS存儲于去加重存儲器6c中。
去加重存儲器狀態(tài)例如也用在CELP中。
去加重通常具有1的固定階數(shù),其在12.8kHz下表示0.0781ms。此持續(xù)時間在48kHz下被3.75個樣本覆蓋。隨后,如果采用上述方法,需要4個樣本的存儲器緩沖區(qū)。可選地,可通過繞過再取樣狀態(tài)使用近似法??煽吹椒浅4植诘脑偃?,其包括保持最后的輸出樣本,不論取樣率差異如何。此近似大部分時間是足夠的并且出于低復雜度原因可被使用。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器6;6a,6b,6c以此方式配置:用于解碼的音頻幀AF的所存儲的樣本的數(shù)量與解碼的音頻幀AF的取樣率SR成比例。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器狀態(tài)再取樣裝置10以此方式配置:通過線性內插進行再取樣。
再取樣函數(shù)resamp()可以使用任何類型的再取樣方法實現(xiàn)。在時域中,傳統(tǒng)LP濾波器以及抽取/過取樣是常見的。在優(yōu)選的實施例中,可采用簡單線性內插,關于質量其足以用于再取樣濾波器存儲器。其允許節(jié)省甚至更多的復雜度。也可以在頻域中進行再取樣。在最后的方案中,由于存儲器僅是濾波器的起始狀態(tài),不需要注意塊效應。
圖5在示意圖中示出根據(jù)本發(fā)明的音頻解碼器裝置的第二實施例。
根據(jù)本發(fā)明的優(yōu)選的實施例,音頻解碼器裝置1包括反向濾波裝置17,其用于先前取樣率PSR下的先前解碼的音頻幀PAF的反向濾波,以確定所述存儲器6;6a,6b,6c中的一個或多個的先前存儲器狀態(tài)PMS;PAMS,PSMS,PDMS;其中存儲器狀態(tài)再取樣裝置用于從反向濾波裝置檢索用于所述存儲器中的一個或多個的先前存儲器狀態(tài)。
這些特征允許針對此情況實施本發(fā)明,其中由非預測性解碼器處理先前音頻幀PAF。
在本發(fā)明實施例中,在反向濾波之前不使用再取樣,而是直接再取樣存儲器狀態(tài)MS自身。如果處理先前音頻幀PAF的在先解碼器是預測性解碼器如CELP,由于先前存儲器狀態(tài)PMS總是維持于先前取樣率PSR下,則不需要且可繞過反向解碼。
圖6在示意圖中示出根據(jù)本發(fā)明的音頻解碼器裝置的第二實施例的更多細節(jié)。
如圖6所示,反向濾波裝置17包括預加重模塊18、延遲插入器19、預加重存儲器20、分析濾波器模塊21、另一延遲插入器22、分析濾波器存儲器23、另一延遲插入器24、以及適應性碼本存儲器25。
先前取樣率PSR下的先前解碼的音頻幀PAF被提供至預加重模塊18以及延遲插入器19,從其中被提供至預加重存儲器20。然后,先前取樣率下的如此建立的先前去加重存儲器狀態(tài)PDMS被傳送至存儲器狀態(tài)再取樣裝置10以及預加重模塊18。
預加重模塊18的輸出信號被提供至分析濾波器模塊21以及延遲插入器22,從其中被設置至分析濾波器存儲器23。通過如此做法,先前取樣率PSR下的先前合成存儲器狀態(tài)PSMS被建立。然后,先前合成存儲器狀態(tài)PSMS被傳送至存儲器狀態(tài)再取樣裝置10以及分析濾波器模塊21。
此外,分析濾波器模塊21的輸出信號被設置至延遲插入器24并進入適應性碼本存儲器25。由此,先前取樣率PSR下的先前適應性碼本存儲器狀態(tài)PAMS可被建立,然后,先前適應性碼本存儲器狀態(tài)PAMS可被傳送至存儲器狀態(tài)再取樣裝置10。
圖7在示意圖中示出根據(jù)本發(fā)明的音頻解碼器裝置的第三實施例。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器狀態(tài)再取樣裝置10用于從另一音頻處理裝置26檢索用于所述存儲器6中的一個或多個的先前存儲器狀態(tài)PMS;PAMS,PSMS,PDMS。
另一音頻處理裝置26可以例如是另一音頻解碼器裝置26或用于噪聲生成裝置的房間。
當使用傳統(tǒng)CELP在12.8kHz下編碼活躍幀時以及當使用16kHz噪聲生成器(CNG)建模不活躍部分時,可在DTX模式中使用本發(fā)明。
例如,當結合在不同取樣率下運行的TCX及ACELP時可使用本發(fā)明。
圖8在示意圖中示出根據(jù)本發(fā)明的音頻編碼器裝置的實施例。
音頻編碼器裝置用于對成幀的音頻信號FAS進行編碼。音頻編碼器裝置27包括:
預測性編碼器28,用于從成幀的音頻信號FAS產生編碼的音頻幀EAF,其中預測性編碼器28包括用于從成幀的音頻信號FAS產生用于編碼的音頻幀EAV的一個或多個音頻參數(shù)AP的參數(shù)分析器29,并且其中預測性編碼器28包括用于通過合成用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP而產生解碼的音頻幀AF的合成濾波器裝置4,其中用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP是用于編碼的音頻幀EAV的一個或多個音頻參數(shù)AP;
存儲器裝置5,包括一個或多個存儲器6,其中存儲器6中的每個用于存儲用于解碼的音頻幀AF的存儲器狀態(tài)MS,其中一個或多個存儲器6的用于解碼的音頻幀AF的存儲器狀態(tài)MS被合成濾波器裝置4用來合成用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP;以及
存儲器狀態(tài)再取樣裝置10,用于通過針對所述存儲器6中的一個或多個再取樣用來合成用于先前解碼的音頻幀PAF的一個或多個音頻參數(shù)的先前存儲器狀態(tài)PMS,為所述存儲器6中的一個或多個確定用來合成用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP的存儲器狀態(tài)MS,解碼的音頻幀AF具有取樣率SR,先前解碼的音頻幀PAF具有與解碼的音頻幀AF的取樣率SR不同的先前取樣率PSR,并用于將用于所述存儲器6中的一個或多個的用來合成用于解碼的音頻幀AF的一個或多個音頻參數(shù)AP的存儲器狀態(tài)MS存儲于各個存儲器6中。
本發(fā)明主要關注音頻解碼器裝置1。然而,其也可以用在音頻編碼器裝置27處。的確,CELP是基于綜合分析(Analysis-by-Synthesis)原則,其中在編碼器側進行本地解碼。為此,如針對解碼器所描述的相同原則可在編碼器側使用。此外,在切換編碼的情況下,例如ACELP/TCX,基于變換的編碼器可能需要在下一幀中編碼切換的情況下甚至在編碼器側也能夠更新語音編碼器的存儲器。為此,在基于變換的編碼器中使用本地解碼器,以用于更新CELP的存儲器狀態(tài)。這可以是,基于變換的編碼器在與CELP不同的取樣率下運行,并且隨后可在這種情況下使用本發(fā)明。
為了合成音頻參數(shù)AP,合成濾波器4將詢問信號IS發(fā)送至存儲器6,其中詢問信號IS取決于一個或多個音頻參數(shù)AP。存儲器6回復響應信號RS,其取決于詢問信號IS以及用于解碼的音頻幀AF的存儲器狀態(tài)MS。
應理解的是,音頻編碼器裝置27的合成濾波器裝置4、存儲器裝置5、存儲器狀態(tài)再取樣裝置10以及反向濾波裝置17等效于前述音頻解碼器裝置1的合成濾波器裝置4、存儲器裝置5、存儲器狀態(tài)再取樣裝置10以及反向濾波裝置17。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器狀態(tài)再取樣裝置10用于從存儲器裝置5檢索用于所述存儲器6中的一個或多個的先前存儲器狀態(tài)PMS。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器6a、6b、6c包括用于存儲適應性碼本狀態(tài)AMS的適應性碼本存儲器6a,適應性碼本狀態(tài)AMS用來確定用于解碼的音頻幀AF的一個或多個激發(fā)參數(shù)EP;其中,存儲器狀態(tài)再取樣裝置10用于通過再取樣用來確定用于先前解碼的音頻幀PAF的一個或多個激發(fā)參數(shù)EP的先前適應性碼本存儲器狀態(tài)PAMS,確定用來確定用于解碼的音頻幀AF的一個或多個激發(fā)參數(shù)EP的適應性碼本狀態(tài)AMS,并且用于將用來確定用于解碼的音頻幀AF的一個或多個激發(fā)參數(shù)EP的適應性碼本存儲器狀態(tài)AMS存儲于適應性碼本存儲器6a中。參見圖4及前述與圖4相關的說明。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器6a、6b、6c包括用于存儲用來確定用于解碼的音頻幀AF的一個或多個合成濾波器參數(shù)SP的合成濾波器存儲器狀態(tài)SMS的合成濾波器存儲器6b;其中,存儲器狀態(tài)再取樣裝置10用于通過再取樣用來確定用于先前解碼的音頻幀PAF的一個或多個合成濾波器參數(shù)的先前合成存儲器狀態(tài)PSMS,確定用來確定用于解碼的音頻幀AF的一個或多個合成濾波器參數(shù)SP的合成存儲器狀態(tài)SMS,并用于將用來確定用于解碼的音頻幀AF的一個或多個合成濾波參數(shù)SP的合成存儲器狀態(tài)SMS存儲于合成濾波器存儲器6b中。參見圖4及前述與圖4相關的說明。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器狀態(tài)再取樣裝置10以此方式配置:相同的合成濾波器參數(shù)SP被用于解碼的音頻幀AF的多個子幀。參見圖4及與前述圖4相關的說明。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器再取樣裝置10以此方式配置:通過將用于先前解碼的音頻幀PAF的先前合成濾波器存儲器狀態(tài)PSMS變換至功率譜以及通過再取樣功率譜,進行先前合成濾波器存儲器狀態(tài)PSMS的再取樣。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器6;6a,6b,6c包括用于存儲去加重存儲器狀態(tài)DMS的去加重存儲器6c,去加重存儲器狀態(tài)DMS用來確定用于解碼的音頻幀AF的一個或多個去加重參數(shù)DP;其中,存儲器狀態(tài)再取樣裝置10用于通過再取樣用來確定用于先前解碼的音頻幀PAF的一個或多個去加重參數(shù)的先前去加重存儲器狀態(tài)PDMS,確定用來確定用于解碼的音頻幀AF的一個或多個去加重參數(shù)DP的去加重存儲器狀態(tài)DMS,并用于將用來確定用于解碼的音頻幀AF的一個或多個去加重參數(shù)DP的去加重存儲器狀態(tài)DMS存儲于去加重存儲器6c中。參見圖4及前述與圖4相關的說明。
根據(jù)本發(fā)明的優(yōu)選的實施例,一個或多個存儲器6a,6b,6c以此方式配置:用于解碼的音頻幀AF的所存儲的樣本的數(shù)量與解碼的音頻幀的取樣率SR成比例。參見圖4及前述與圖4相關的說明。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器再取樣裝置10以此方式配置:通過線性內插進行再取樣。參見圖4及前述與圖4相關的說明。
根據(jù)本發(fā)明的優(yōu)選的實施例,音頻編碼器裝置27包括反向濾波裝置17,其用于先前解碼的音頻幀PAF的反向濾波,以確定用于所述存儲器6中的一個或多個的先前存儲器狀態(tài)PMS,其中存儲器狀態(tài)再取樣裝置10用于從反向濾波裝置17檢索用于所述存儲器6中的一個或多個的先前存儲器狀態(tài)PMS。參見圖5及前述與圖5相關的說明。
關于反向濾波裝置17的細節(jié),參見圖6及前述與圖6相關的說明。
根據(jù)本發(fā)明的優(yōu)選的實施例,存儲器狀態(tài)再取樣裝置10用于從另一音頻處理裝置檢索用于所述存儲器6;6a,6b,6c中的一個或多個的先前存儲器狀態(tài)PMS;PAMS,PSMS,PDMS。參見圖7及前述與圖7相關的說明。
關于所述實施例的解碼器以及編碼器以及方法,以下被提及:
雖然已經(jīng)在裝置的上下文中描述一些方面,顯而易見的是,這些方面也代表對應方法的描述,其中模塊或裝置對應于方法步驟或方法步驟的特征。類似地,在方法步驟的上下文中描述的方面也代表對應裝置的對應模塊或項或特征的描述。
根據(jù)某些實施需求,可以以硬件或軟件實施本發(fā)明的實施例??墒褂镁哂信c可編程計算機系統(tǒng)協(xié)作(或能夠協(xié)作)的電子可讀控制信號存儲于其上的數(shù)字存儲介質例如軟盤、DVD、CD、ROM、PROM、EPROM、EEPROM或閃存,執(zhí)行此實施,從而執(zhí)行各個方法。
根據(jù)本發(fā)明的一些實施例包括具有能夠與可編程計算機系統(tǒng)協(xié)作的電子可讀控制信號的數(shù)據(jù)載體,從而執(zhí)行在此描述的方法的一個。
一般地,本發(fā)明的實施例可作為具有程序代碼的計算機程序產品被實施,當計算機程序產品在計算機上運行時,可操作程序代碼用于執(zhí)行方法的一個。程序代碼可例如被存儲于機器可讀載體上。
其他實施例包括用于執(zhí)行在此描述的方法的一個的計算機程序,計算機程序被存儲于機器可讀載體或非瞬時存儲介質上。
換言之,本發(fā)明方法的實施例因而是具有程序代碼的計算機程序,當計算機程序在計算機上運行時,程序代碼用于執(zhí)行在此描述的方法的一個。
本發(fā)明方法的另一實施例因而是數(shù)據(jù)載體(或數(shù)字存儲介質、或計算機可讀介質),其包括記錄于其上的用于執(zhí)行在此描述的方法的一個的計算機程序。
本發(fā)明方法的另一實施例因而是表示用于執(zhí)行在此描述的方法的一個的計算機程序的數(shù)據(jù)流或信號序列。此數(shù)據(jù)流或信號序列可以例如被配置為經(jīng)由數(shù)據(jù)通信連接例如因特網(wǎng)來傳輸。
另一實施例包括處理構件,例如,計算機或可編程邏輯設備,用于或適于執(zhí)行在此描述的方法的一個。
另一實施例包括具有安裝在其上的計算機程序的計算機,計算機程序用于執(zhí)行在此描述的方法的一個。
在一些實施例中,可編程邏輯設備(例如,現(xiàn)場可編程邏輯門陣列)可以被用于執(zhí)行在此所述方法的一些或全部功能。在一些實施例中,現(xiàn)場可編程邏輯門陣列可與微處理器協(xié)作,以執(zhí)行在此所述方法的一個。一般地,可通過任意硬件裝置有利地執(zhí)行方法。
雖然本發(fā)明已關于多個實施例進行論述,存在落入本發(fā)明的范圍的修改、變形及等效。應注意的是,實施本發(fā)明的方法及組成有許多可選方式,因此以下所附權利要求應被理解為包括如落入本發(fā)明的真正精神及范圍的所有此類修改、變形及等效。
附圖標記:
1:音頻解碼器裝置
2:預測性解碼器
3:參數(shù)解碼器
4:合成濾波器裝置
5:存儲器裝置
6:存儲器
7:反向濾波裝置
8:音頻幀再取樣裝置
9:參數(shù)分析器
10:存儲器狀態(tài)再取樣裝置
11:激發(fā)模塊
12:延遲插入器
13:合成濾波器模塊
14:延遲插入器
15:去加重模塊
16:延遲插入器
17:反向濾波裝置
18:預加重模塊
19:延遲插入器
20:預加重存儲器
21:分析濾波器模塊
22:延遲插入器
23:分析濾波器存儲器
24:延遲插入器
25:適應性碼本存儲器
26:另一解碼器
27:音頻編碼器裝置
28:預測性編碼器
29:參數(shù)分析器
BS:比特流
AF:解碼的音頻幀
AP:音頻參數(shù)
MS:用于音頻幀的存儲器狀態(tài)
SR:取樣率
PAF:先前解碼的音頻幀
IS:詢問信號
RS:響應信號
PSR:先前取樣率
LPCC:線性預測編碼系數(shù)
PMS:先前存儲器狀態(tài)
AMS:適應性碼本存儲器狀態(tài)
EP:激發(fā)參數(shù)
PAMS:先前適應性碼本存儲器狀態(tài)
OS:激發(fā)模塊的輸出信號
SMS:合成濾波器存儲器狀態(tài)
SP:合成濾波器參數(shù)
PSMS:先前合成濾波器存儲器狀態(tài)
OS1:合成濾波器的輸出信號
DMS:去加重存儲器狀態(tài)
DP:去加重參數(shù)
PDMS:先前去加重存儲器狀態(tài)
FAS:成幀的音頻信號
EAF:編碼的音頻幀