專利名稱:音頻編碼裝置、方法和程序以及音頻解碼裝置、方法和程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及經(jīng)由IP網(wǎng)和移動(dòng)通信網(wǎng)傳輸包含對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編碼而得到的音頻碼的音頻分組時(shí)的錯(cuò)誤掩藏,更具體而言,涉及用于實(shí)現(xiàn)錯(cuò)誤掩藏的音頻編碼裝置、音頻編碼方法和音頻編碼程序以及音頻解碼裝置、音頻解碼方法和音頻解碼程序。
背景技術(shù):
在IP網(wǎng)和移動(dòng)通信中傳輸音頻/聲音信號(hào)(以下稱作“音頻信號(hào)”)時(shí),對(duì)音頻信號(hào)進(jìn)行編碼而以較小的比特?cái)?shù)來(lái)表現(xiàn)并分割為音頻分組,經(jīng)由通信網(wǎng)傳輸該音頻分組。通過(guò)通信網(wǎng)接收到的音頻分組在接收側(cè)的服務(wù)器、MCU、終端等中被解碼,從而得到解碼音頻信號(hào)。在通過(guò)通信網(wǎng)傳輸音頻分組時(shí),由于通信網(wǎng)的擁擠狀態(tài)等,可能會(huì)產(chǎn)生丟失一部分音頻分組或在寫入到音頻分組中的一部分信息中產(chǎn)生錯(cuò)誤的現(xiàn)象(所謂的分組丟失)。在這種情況下,無(wú)法在接收側(cè)對(duì)音頻分組進(jìn)行正確解碼,因此不能得到期望的解碼音頻信號(hào)。此外,由于與產(chǎn)生分組丟失的音頻分組對(duì)應(yīng)的解碼音頻信號(hào)被感知為噪音,因此顯著損壞對(duì)收聽(tīng)的人賦予的主觀品質(zhì)。 為了消除上述那樣的不良情況,存在“接收側(cè)中的掩藏技術(shù)”和“發(fā)送側(cè)中的掩藏技術(shù)”,作為對(duì)由于分組丟失而丟失的部分的音頻聲音信號(hào)進(jìn)行插值的分組丟失掩藏技術(shù)。在其中的“接收側(cè)中的掩藏技術(shù)”中,例如非專利文獻(xiàn)I的技術(shù)那樣,通過(guò)在以音調(diào)(pitch)為單位復(fù)制了之前正常接收到的分組所包含的解碼音頻信號(hào)后,乘以預(yù)先確定的衰減系數(shù),生成與分組丟失的部分對(duì)應(yīng)的音頻信號(hào)。但是,“接收側(cè)中的掩藏技術(shù)”以分組丟失的部分的音頻性質(zhì)與分組丟失緊之前的音頻相似為前提,因此在分組丟失的部分與丟失緊之前的音頻具有不同性質(zhì)的情況、和功率急劇變化的情況下不能充分發(fā)揮掩藏效果。此外,在“接收側(cè)中的掩藏技術(shù)”中存在專利文獻(xiàn)I的技術(shù)作為更高級(jí)的技術(shù)。在該專利文獻(xiàn)I的技術(shù)中,復(fù)制之前正常接收到的分組所包含的解碼音頻來(lái)生成掩藏信號(hào),但以下方法與上述非專利文獻(xiàn)I的技術(shù)不同:通過(guò)乘以根據(jù)復(fù)制源的音頻性質(zhì)(功率譜的形狀)而發(fā)生變化的衰減系數(shù),進(jìn)行異常聲音少且高音質(zhì)的掩藏信號(hào)的整形。另一方面,存在專利文獻(xiàn)2的技術(shù)和專利文獻(xiàn)3的技術(shù)作為“發(fā)送側(cè)中的掩藏技術(shù)”。在其中的專利文獻(xiàn)2的技術(shù)中,將之前正常接收到的分組所包含的音頻信號(hào)蓄積到緩沖器中,并且將表示在丟失分組時(shí)從緩沖器的哪個(gè)位置復(fù)制音頻信號(hào)的位置信息編碼為輔助信息并進(jìn)行傳輸。并 且 ,除了位置信息以外,還在輔助信息中包含表示分組丟失部分是否為無(wú)聲區(qū)間這樣的振幅信息,由此防止在產(chǎn)生了分組丟失的部分本來(lái)是無(wú)聲區(qū)間的情況下混入不必要的聲音的情況。此外,在專利文獻(xiàn)3的技術(shù)中,解碼裝置具有:掩藏分組丟失的第一掩藏裝置;根據(jù)輔助信息修正第一掩藏裝置輸出的第一掩藏信號(hào)的第二掩藏裝置;以及對(duì)輔助信息進(jìn)行解碼的輔助信息解碼裝置。在第一掩藏裝置中不能充分發(fā)揮掩藏效果的情況下,第二掩藏裝置使用輔助信息解碼裝置生成的輔助信息來(lái)修正第一掩藏信號(hào),生成第二掩藏信號(hào)。作為輔助信息,利用功率譜包絡(luò)、根據(jù)相鄰的幀的功率譜包絡(luò)預(yù)測(cè)的值和對(duì)輸入功率譜包絡(luò)的誤差進(jìn)行編碼得到的值。第二掩藏裝置在具有能夠用作輔助信息的功率譜包絡(luò)的頻域中對(duì)第一掩藏信號(hào)乘以增益,生成比第一掩藏信號(hào)精度更高的第二掩藏信號(hào)。
現(xiàn)有技術(shù)文獻(xiàn)專利文獻(xiàn)專利文獻(xiàn)1:日本再公表特許W02007/000988號(hào)公報(bào)專利文獻(xiàn)2:日本特開(kāi)2003 - 316670號(hào)公報(bào)專利文獻(xiàn)3:日本特開(kāi)2008 - 111991號(hào)公報(bào)非專利文獻(xiàn)非專利文獻(xiàn)1:1TU — TG.71 IAppendixI
發(fā)明內(nèi)容
發(fā)明所要解決的課題但是,專利文獻(xiàn)I的技術(shù)是根據(jù)之前正常接收到的解碼信號(hào),通過(guò)預(yù)測(cè)生成掩藏信號(hào)的方法,因此難以根據(jù)之前的信號(hào)高精度地生成例如響板的拍打聲那樣具有與預(yù)測(cè)結(jié)果偏離較大的功率變化的掩藏信號(hào)。此外,專利文獻(xiàn)2的技術(shù)在發(fā)送側(cè)生成與無(wú)聲區(qū)間相關(guān)的振幅信息,防止在分組丟失的部分為無(wú)聲區(qū)間的情況下生成掩藏信號(hào),但對(duì)于上述的響板的拍打聲那樣的伴隨突發(fā)的功率變化的聲音不具有足夠的掩藏效果。此外,專利文獻(xiàn)3的技術(shù)是在以幀為單位進(jìn)行時(shí)頻變換后進(jìn)行頻域中的處理的方法,因此處理的單位是幀單位,難以處理幀內(nèi)的急劇的功率變化。此外,以之前的信號(hào)和分組丟失的信號(hào)的相關(guān)性高為前提對(duì)分組丟失部分的解碼音頻進(jìn)行高精度化,因此在功率急劇變化的部分產(chǎn)生分組丟失的情況下,信號(hào)的相關(guān)性變低,因此功率譜包絡(luò)的預(yù)測(cè)誤差變大,所以難以利用較少的比特?cái)?shù)來(lái)進(jìn)行編碼,難以生成高精度的解碼音頻。如上所述,在現(xiàn)有技術(shù)中,具有如下問(wèn)題:對(duì)拍手和響板的拍打聲那樣的伴隨有在時(shí)間上較快的功率變化的信號(hào)(以下稱作“瞬態(tài)信號(hào)”)不具有足夠的錯(cuò)誤掩藏效果。即,在接收側(cè),要根據(jù)通過(guò)解碼由緊之前正常接收到的音頻分組而得到的解碼信號(hào),正確預(yù)測(cè)在音頻信號(hào)中的哪個(gè)時(shí)刻產(chǎn)生瞬態(tài)信號(hào)是極為困難的。本發(fā)明的目的在于解決上述問(wèn)題,給出能夠高精度地掩藏難以根據(jù)前后信號(hào)來(lái)預(yù)測(cè)的瞬態(tài)信號(hào)中的分組丟失的錯(cuò)誤掩藏技術(shù)。用于解決課題的手段本發(fā)明的一個(gè)方面涉及音頻解碼,能夠包含以下的音頻解碼裝置、音頻解碼方法和音頻解碼程序。本發(fā)明的一個(gè)方面的音頻解碼裝置根據(jù)包含音頻碼和輔助信息碼的音頻分組對(duì)音頻碼進(jìn)行解碼,所述輔助信息碼被用于解碼音頻碼時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān),該音頻解碼裝置的特征在于,具有:錯(cuò)誤/丟失檢測(cè)部,其檢測(cè)音頻分組中的分組錯(cuò)誤或分組丟失,并輸出表示檢測(cè)結(jié)果的錯(cuò)誤標(biāo)志;音頻解碼部,其對(duì)音頻分組所包含的音頻碼進(jìn)行解碼來(lái)求出解碼信號(hào);輔助信息解碼部,其對(duì)音頻分組所包含的輔助信息碼進(jìn)行解碼來(lái)求出輔助信息;第一掩藏信號(hào)生成部,其在所述錯(cuò)誤標(biāo)志表示音頻分組的異常的情況下,根據(jù)已經(jīng)求出的解碼信號(hào),生成用于掩藏分組丟失的第一掩藏信號(hào);以及掩藏信號(hào)修正部,其根據(jù)所述輔助信息,修正第一掩藏信號(hào)。本發(fā)明的一個(gè)方面的音頻解碼方法由音頻解碼裝置執(zhí)行,該音頻解碼裝置根據(jù)包含音頻碼和輔助信息碼的音頻分組對(duì)音頻碼進(jìn)行解碼,所述輔助信息碼被用于解碼音頻碼時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān),該音頻解碼方法的特征在于,具有:錯(cuò)誤/丟失檢測(cè)步驟,檢測(cè)音頻分組中的分組錯(cuò)誤或分組丟失,并輸出表示檢測(cè)結(jié)果的錯(cuò)誤標(biāo)志;音頻解碼步驟,對(duì)音頻分組所包含的音頻碼進(jìn)行解碼來(lái)求出解碼信號(hào);輔助信息解碼步驟,對(duì)音頻分組所包含的輔助信息碼進(jìn)行解碼來(lái)求出輔助信息;第一掩藏信號(hào)生成步驟,在所述錯(cuò)誤標(biāo)志表示音頻分組的異常的情況下,根據(jù)已經(jīng)求出的解碼信號(hào),生成用于掩藏分組丟失的第一掩藏信號(hào);以及掩藏信號(hào)修正步驟,根據(jù)所述輔助信息,修正第一掩藏信號(hào)。本發(fā)明的一個(gè)方面的音頻解碼程序的特征在于,使計(jì)算機(jī)作為如下各部發(fā)揮功能:錯(cuò)誤/丟失檢測(cè)部,其檢測(cè)包含音頻碼和輔助信息碼的音頻分組中的分組錯(cuò)誤或分組丟失,并輸出表示檢測(cè)結(jié)果的錯(cuò)誤標(biāo)志,所述輔助信息碼被用于解碼音頻碼時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān);音頻解碼部,其對(duì)音頻分組所包含的音頻碼進(jìn)行解碼來(lái)求出解碼信號(hào);輔助信息解碼部,其對(duì)音頻分組所包含的輔助信息碼進(jìn)行解碼來(lái)求出輔助信息; 第一掩藏信號(hào)生成部,其在所述錯(cuò)誤標(biāo)志表示音頻分組的異常的情況下,根據(jù)已經(jīng)求出的解碼信號(hào),生成用于掩藏分組丟失的第一掩藏信號(hào);以及掩藏信號(hào)修正部,其根據(jù)所述輔助信息,修正第一掩藏信號(hào)。在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息碼中,包含有對(duì)多個(gè)比I幀短的子幀的功率進(jìn)行函數(shù)近似后的參數(shù)。例如,與功率的時(shí)間變化相關(guān)的輔助信息碼可以是對(duì)將編碼對(duì)象的幀分割為多個(gè)子幀并按照每個(gè)子幀計(jì)算出的功率進(jìn)行最佳直線近似的預(yù)測(cè)系數(shù),可以是對(duì)按照所述每個(gè)子幀計(jì)算出的功率進(jìn)行直線近似時(shí)的預(yù)測(cè)系數(shù)和截距,可以是使用任意函數(shù)進(jìn)行近似時(shí)的參數(shù),可以是預(yù)定的碼本所存儲(chǔ)的候選矢量中的、對(duì)按照每個(gè)子幀計(jì)算出的功率進(jìn)行最佳近似的候選矢量的索引,還可以是其他針對(duì)事先假定的模型確定的參數(shù)。此外,與功率的時(shí)間變化相關(guān)的輔助信息可以是對(duì)使用將編碼對(duì)象的幀分割為I個(gè)以上的子幀并按照每個(gè)子幀計(jì)算出的功率進(jìn)行預(yù)測(cè)時(shí)的預(yù)測(cè)系數(shù)和對(duì)預(yù)測(cè)誤差序列進(jìn)行編碼后的信息。另外,輔助信息的編碼方法沒(méi)有特別限定。在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息碼中,包含有與對(duì)多個(gè)比I幀短的子幀的功率進(jìn)行矢量量化而得到的矢量相關(guān)的信息。在一個(gè)實(shí)施方式中,輔助信息解碼部可以對(duì)與音頻信號(hào)相關(guān)的輔助信息碼進(jìn)行解碼,所述音頻信號(hào)是與所述音頻解碼部進(jìn)行解碼的音頻碼所對(duì)應(yīng)的幀的I個(gè)以上的之前或I個(gè)以上的之后的幀相當(dāng)?shù)臅r(shí)間區(qū)間所包含的音頻信號(hào)。另外,可以按照頻域中的每個(gè)子帶計(jì)算與上述功率的時(shí)間變化相關(guān)的輔助信息。S卩,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下參數(shù),該參數(shù)按照將整個(gè)頻帶分割為多個(gè)的每個(gè)子帶對(duì)按照每個(gè)子帶計(jì)算出的多個(gè)比I幀短的子幀的功率進(jìn)行了函數(shù)近似。
此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有與如下矢量相關(guān)的信息,該矢量按照將整個(gè)頻帶分割為多個(gè)的每個(gè)子帶對(duì)按照每個(gè)子帶計(jì)算出的多個(gè)比I幀短的子幀的功率進(jìn)行矢量量化而得到。此外,在一個(gè)實(shí)施方式中,掩藏信號(hào)修正部可以按照將整個(gè)頻帶分割為多個(gè)的每個(gè)子帶修正第一掩藏信號(hào)。即使在如上所述那樣使用每個(gè)子帶的輔助信息的情況下,輔助信息解碼部也可以對(duì)與音頻信號(hào)相關(guān)的輔助信息碼進(jìn)行解碼,所述音頻信號(hào)是與所述音頻解碼部進(jìn)行解碼的音頻碼所對(duì)應(yīng)的幀的I個(gè)以上的之前或I個(gè)以上的之后的幀相當(dāng)?shù)臅r(shí)間區(qū)間所包含的音頻信號(hào)。另外,對(duì)音頻碼進(jìn)行解碼而得到的信號(hào)可以是通過(guò)MDCT (Modified DiscreteCosine Transform:改良的離散余弦變換)或 QMF (Quadrature Mirror Filter:正交鏡象濾波器)變換到頻域的信號(hào),為了分組丟失掩藏而根據(jù)之前的解碼信號(hào)生成的第一掩藏信號(hào)可以通過(guò)上述變換被變換到頻域。此外,第一掩藏系數(shù)可以通過(guò)重復(fù)對(duì)之前正常接收到的音頻碼進(jìn)行解碼而得到的解碼信號(hào)而得到,可以用音調(diào)單位重復(fù)得到,還可以通過(guò)預(yù)測(cè)生成。在本發(fā)明的一個(gè)方面(與音頻解碼相關(guān)的方面)涉及的一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有功率急劇變化的位置;以及功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息;以及功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息;功率急劇變化的位置;以及功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。此時(shí),在與功率的時(shí)間變化相關(guān)的輔助信息中,可以還包含有對(duì)功率的變化進(jìn)行矢量量化后的信息。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有功率急劇變化的子幀所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋腎個(gè)以上的子帶的功率進(jìn)行量化后的值。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息;以及功率急劇變化的子幀所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋腎個(gè)以上的子帶的功率進(jìn)行量化后的值。此外,在一個(gè) 實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有功率急劇變化的位置;以及功率急劇變化的子幀所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋腎個(gè)以上的子帶的功率進(jìn)行量化后的值。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息;功率急劇變化的位置;以及功率急劇變化的子幀所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋腎個(gè)以上的子帶的功率進(jìn)行量化后的值。此時(shí),在與功率的時(shí)間變化相關(guān)的輔助信息中,可以還包含有對(duì)功率急劇變化的子幀所包含的I個(gè)以上的子帶的功率變化進(jìn)行矢量量化后的信息。此外,在一個(gè)實(shí)施方式中,輔助信息解碼部可以將輔助信息設(shè)為兩個(gè)以上的集合分別進(jìn)行解碼。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有與關(guān)于將整個(gè)頻帶分割為多個(gè)的子帶中的一部分子帶計(jì)算出的、多個(gè)比I幀短的子幀的功率相關(guān)的信息。此外,在一個(gè)實(shí)施方式中,輔助信息解碼部可以在與功率急劇變化的子幀所包含的I個(gè)以上的子帶相關(guān)的功率的量化中,對(duì)包含有如下信息的輔助信息進(jìn)行解碼,所述信息是對(duì)上述I個(gè)以上的子帶所包含的I個(gè)以上的子帶即核心子帶的功率、以及核心子帶的功率與核心子帶以外的子帶的功率的差分進(jìn)行量化后的信息。此時(shí),在與功率的時(shí)間變化相關(guān)的輔助信息中,可以還包含對(duì)功率急劇變化的子幀之后的功率變化進(jìn)行量化后的信肩、O此外,在一個(gè)實(shí)施方式中,輔助信息解碼部可以對(duì)根據(jù)表示有無(wú)功率的急劇變化的指示信息而以不同的長(zhǎng)度進(jìn)行編碼的輔助信息進(jìn)行解碼。另外,作為其他實(shí)施方式,為了分組丟失掩藏而根據(jù)之前的解碼信號(hào)生成的第一掩藏信號(hào)例如可以通過(guò)TS26.402的第5.2節(jié)所示的已有的標(biāo)準(zhǔn)技術(shù)生成,還可以通過(guò)不是標(biāo)準(zhǔn)技術(shù)的其他掩藏信號(hào)生成技術(shù)生成。本發(fā)明的其他方面涉及音頻編碼,能夠包含以下的音頻編碼裝置、音頻編碼方法和音頻編碼程序。
本發(fā)明的其他方面的音頻編碼裝置對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編碼,該音頻編碼裝置的特征在于,具有:音頻編碼部,其對(duì)音頻信號(hào)進(jìn)行編碼;以及輔助信息編碼部,其估計(jì)輔助信息并進(jìn)行編碼,該輔助信息被用于解碼音頻信號(hào)時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān)。本發(fā)明的其他方面的音頻編碼方法通過(guò)對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編碼的音頻編碼裝置執(zhí)行,該音頻編碼方法的特征在于,具有:音頻編碼步驟,對(duì)音頻信號(hào)進(jìn)行編碼;以及輔助信息編碼步驟,估計(jì)輔助信息并進(jìn)行編碼,該輔助信息被用于解碼音頻信號(hào)時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān)。本發(fā)明的其他方面的音頻編碼程序的特征在于,使計(jì)算機(jī)作為如下部件發(fā)揮功能:音頻編碼部,其對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編碼;以及輔助信息編碼部,其估計(jì)輔助信息并進(jìn)行編碼,該輔助信息被用于解碼音頻信號(hào)時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān)。在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有對(duì)多個(gè)比I幀短的子幀的功率進(jìn)行函數(shù)近似后的參數(shù)。在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有與對(duì)多個(gè)比I幀短的子幀的功率進(jìn)行矢量量化而得到的矢量相關(guān)的信息。在一個(gè)實(shí)施方式中,輔助信息編碼部可以關(guān)于與所述音頻編碼部進(jìn)行編碼的幀的I個(gè)以上的之前或I個(gè)以上的之后的幀相當(dāng)?shù)臅r(shí)間區(qū)間所包含的音頻信號(hào),估計(jì)所述輔助
信息并進(jìn)行編碼。在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下參數(shù),該參數(shù)按照將整個(gè)頻帶分割為多個(gè)的每個(gè)子帶對(duì)按照每個(gè)子帶計(jì)算出的多個(gè)比I幀短的子幀的功率進(jìn)行了函數(shù)近似。在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有與如下矢量相關(guān)的信息,該矢量對(duì)按照將整個(gè)頻帶分割為多個(gè)的每個(gè)子帶計(jì)算出的多個(gè)比I幀短的子幀的功率進(jìn)行矢量量化而得到。即使在如上所述那樣使用每個(gè)子帶的輔助信息的情況下,輔助信息編碼部也可以關(guān)于與音頻編碼部進(jìn)行編碼的幀的I個(gè)以上的之前或I個(gè)以上的之后的幀相當(dāng)?shù)臅r(shí)間區(qū)間所包含的音頻信號(hào),估計(jì)所述輔助信息并進(jìn)行編碼。
在一個(gè)實(shí)施方式中,輔助信息編碼部可以將輔助信息設(shè)為兩個(gè)以上的集合分別進(jìn)行編碼。另外,作為一例,輔助信息編碼部可以在對(duì)輔助信息進(jìn)行標(biāo)量量化后進(jìn)行編碼,可以在進(jìn)行矢量量化后進(jìn)行編碼,還可以使用事先準(zhǔn)備的碼本直接對(duì)輔助信息進(jìn)行編碼。此處的編碼方法沒(méi)有特別限定。此外,輔助信息編碼部可以在蓄積所需樣本數(shù)量的音頻信號(hào)后,將I幀分割為多個(gè)子幀來(lái)計(jì)算按照每個(gè)子幀計(jì)算出的功率,并設(shè)為輔助信息。輔助信息可以是對(duì)按照上述每個(gè)子幀計(jì)算出的功率進(jìn)行最佳直線近似的預(yù)測(cè)系數(shù),可以是對(duì)按照每個(gè)子幀計(jì)算出的功率進(jìn)行直線近似時(shí)的預(yù)測(cè)系數(shù)和截距,可以是使用任意函數(shù)進(jìn)行近似時(shí)的參數(shù),可以是預(yù)定的碼本所存儲(chǔ)的候選矢量中的、對(duì)按照每個(gè)子幀計(jì)算出的功率進(jìn)行最佳近似的候選矢量的索引,還可以是其他針對(duì)事先假定的模型確定的參數(shù)。另外,編碼的方法使用在上述輔助信息解碼部中使用的方法所對(duì)應(yīng)的編碼方法。在本發(fā)明的其他方面(與音頻編碼相關(guān)的方面)涉及的一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有功率急劇變化的位置;以及功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息;以及功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息;功率急劇變化的位置;以及功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。此時(shí),在與功率的時(shí)間變化相關(guān)的輔助信息中,可以還包含有對(duì)功率的變化進(jìn)行矢量量化后的信息。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有功率急劇變化的子幀所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋腎個(gè)以上的子帶的功率進(jìn)行量化后的值。
此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息;以及功率急劇變化的子幀所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋腎個(gè)以上的子帶的功率進(jìn)行量化后的值。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有功率急劇變化的位置;以及功率急劇變化的子幀所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋腎個(gè)以上的子帶的功率進(jìn)行量化后的值。此外,在一個(gè)實(shí)施方式中,可以在與功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息;功率急劇變化的位置;以及功率急劇變化的子幀所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋腎個(gè)以上的子帶的功率進(jìn)行量化后的值。此時(shí),在與功率的時(shí)間變化相關(guān)的輔助信息中,可以還包含有對(duì)功率急劇變化的子幀所包含的I個(gè)以上的子帶的功率變化進(jìn)行矢量量化后的信息。此外,在一個(gè)實(shí)施方式中,可以包含有與關(guān)于將整個(gè)頻帶分割為多個(gè)的子帶中的I個(gè)以上的子帶求出的、多個(gè)比I幀短的子幀的功率相關(guān)的信息。此外,在一個(gè)實(shí)施方式中,這些輔助信息與將整個(gè)頻帶分割為多個(gè)的子帶中的I個(gè)以上的子帶相關(guān)。另外,編碼的方法使用在上述輔助信息解碼部中使用的方法所對(duì)應(yīng)的編碼方法。此外,在一個(gè)實(shí)施方式中,輔助信息編碼部可以在與功率急劇變化的子幀所包含的I個(gè)以上的子帶相關(guān)的功率的量化中,對(duì)上述I個(gè)以上的子帶所包含的I個(gè)以上的子帶即核心子帶的功率、以及核心子帶的功率與核心子帶以外的子帶的功率的差分進(jìn)行量化。此時(shí),在與功率的時(shí)間變化相關(guān)的輔助信息中,可以還包含對(duì)功率急劇變化的子幀之后的功率變化進(jìn)行量化后的信息。此外,在一個(gè)實(shí)施方式中,輔助信息編碼部可以根據(jù)表示有無(wú)功率的急劇變化的指示信息,以不同的長(zhǎng)度對(duì)輔助信息進(jìn)行編碼。發(fā)明的效果本發(fā)明通過(guò)以上所述的方法,能夠送出與功率急劇變化的部分相關(guān)的信息,因此能夠針對(duì)在現(xiàn)有技術(shù)中難以實(shí)現(xiàn)分組丟失掩藏的伴隨有功率的急劇的時(shí)間變化的信號(hào)(瞬態(tài)信號(hào))實(shí)現(xiàn)高精度的分組丟失掩藏。
圖1是示出發(fā)明的一個(gè)實(shí)施方式中的系統(tǒng)環(huán)境的圖。圖2是第1、第2、第3、第6實(shí)施方式中的編碼部的結(jié)構(gòu)圖。圖3是圖2的編碼部的處理的流程圖。圖4是第I實(shí)施方式等中的輔助信息編碼部的結(jié)構(gòu)圖。圖5是示出作為音頻編碼對(duì)象的信號(hào)和作為輔助信息編碼對(duì)象的信號(hào)之間的時(shí)間關(guān)系以及比特流的結(jié)構(gòu)例的圖。圖6是第1、第2、第3、第5、第6實(shí)施方式中的解碼部的結(jié)構(gòu)圖。
圖7是圖6的解碼部的處理的流程圖。圖8是示出掩藏信號(hào)修正部的處理的一例的流程圖。圖9是示出輔助信息編碼部的結(jié)構(gòu)的一例的圖。
圖10是第4、第5實(shí)施方式中的編碼部的結(jié)構(gòu)圖。圖11是示出第一掩藏信號(hào)生成部的結(jié)構(gòu)的一例的圖。圖12是示出掩藏信號(hào)修正部的處理的一例的流程圖。圖13是第4實(shí)施方式中的解碼部的結(jié)構(gòu)圖。圖14是示出第6實(shí)施方式中的作為音頻編碼對(duì)象的信號(hào)和作為輔助信息編碼對(duì)象的信號(hào)之間的時(shí)間關(guān)系以及比特流的結(jié)構(gòu)例的圖。圖15是計(jì)算機(jī)的硬件結(jié)構(gòu)圖。圖16是計(jì)算機(jī)的外觀圖。
圖17是示出音頻編碼程序的結(jié)構(gòu)的圖。圖18是示出音頻解碼程序的結(jié)構(gòu)的圖。圖19是示出解碼部的其他結(jié)構(gòu)例的圖。圖20是第7實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。圖21是圖20的輔助信息編碼部的處理的流程圖。圖22是第7、第11實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。圖23是圖22的輔助信息解碼部的處理的流程圖。圖24是第7、第8實(shí)施方式中的掩藏信號(hào)修正部的結(jié)構(gòu)圖。圖25是第7實(shí)施方式的掩藏信號(hào)修正部的處理的流程圖。圖26是第8實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。圖27是圖26的輔助信息編碼部的處理的流程圖。圖28是示出第8實(shí)施方式中的輔助信息編碼部的變形例的結(jié)構(gòu)圖。圖29是圖28的輔助信息編碼部的處理的流程圖。圖30是第8實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。圖31是圖30的輔助信息解碼部的處理的流程圖。圖32是第8實(shí)施方式的掩藏信號(hào)修正部的處理的流程圖。圖33是第10實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。圖34是圖33的輔助信息編碼部的處理的流程圖。圖35是第10實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。圖36是圖35的輔助信息解碼部的處理的流程圖。圖37是第10實(shí)施方式中的掩藏信號(hào)修正部的處理的流程圖。圖38是第11實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。圖39是圖38的輔助信息編碼部的處理的流程圖。圖40是第11實(shí)施方式中的輔助信息解碼部的處理的流程圖。圖41是示出瞬態(tài)檢測(cè)部的輸出內(nèi)容的圖。圖42是示出瞬態(tài)位置信息的標(biāo)量量化方法的例子的圖。圖43是第12實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。圖44是第12實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。圖45是第13實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。圖46是第13實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。圖47是第14實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。
圖48是第14實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。圖49是第15實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。圖50是第15實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。
具體實(shí)施例方式以下,使用
本發(fā)明的各種實(shí)施方式。[第1實(shí)施方式]首先,使用圖1說(shuō)明本發(fā)明假定的系統(tǒng)環(huán)境。如圖1所示,通過(guò)麥克風(fēng)等傳感器得到的音頻信號(hào)用數(shù)字形式來(lái)表現(xiàn),并被輸入到編碼部I。每當(dāng)所確定的樣本數(shù)量的音頻信號(hào)被蓄積預(yù)定量到內(nèi)置的緩沖器中時(shí),編碼部I對(duì)緩沖器內(nèi)的數(shù)字信號(hào)進(jìn)行編碼。將上述預(yù)定量的、即蓄積的樣本數(shù)量稱作幀長(zhǎng)度,將蓄積在緩沖器中的數(shù)字信號(hào)的集合稱作幀。例如,在以32kHz的采樣頻率進(jìn)行收音時(shí)設(shè)為了20ms的幀長(zhǎng)度的情況下,將640樣本的數(shù)字信號(hào)蓄積到緩沖器中。另外,緩沖器的長(zhǎng)度可以長(zhǎng)于I幀。例如,在將緩沖器的長(zhǎng)度設(shè)為2幀的情況下,如果僅在最初等待將2幀的數(shù)字信號(hào)蓄積到緩沖器中后再開(kāi)始編碼,則能夠?qū)⒆鳛榫幋a對(duì)象的幀的下一幀數(shù)字信號(hào)用于輔助信息的估計(jì)。作為進(jìn)行編碼的時(shí)刻,可以以幀長(zhǎng)度為單位進(jìn)行編碼,也可以使幀之間具有一定長(zhǎng)度的重疊來(lái)進(jìn)行編碼。編碼采用3GPP enhanced aacPlus或G.718等的音頻編碼。關(guān)于音頻編碼的方法,可以使用任何方法。此外,為了輔助信息計(jì)算而使用蓄積在緩沖器中的音頻聲音信號(hào)計(jì)算輔助信息,進(jìn)行編碼并傳輸(輔助信息碼)。輔助信息碼可以與音頻碼利用同一個(gè)分組來(lái)傳輸,也可以用與包含音頻碼的分組不同的分組來(lái)傳輸。之后將對(duì)編碼部I的動(dòng)作的詳細(xì)情況進(jìn)行敘述。
分組構(gòu)成部2在由編碼部I得到的音頻碼中附加RTP頭等通信所需的信息,生成音頻分組。通過(guò)網(wǎng)絡(luò)將所生成的音頻分組送出到接收側(cè)。分組分離部3將通過(guò)網(wǎng)絡(luò)接收到的音頻分組分離為分組頭信息和除此以外的部分(音頻碼和輔助信息碼,以下稱作“比特流”),并將比特流輸出到解碼部4。解碼部4進(jìn)行正常接收到的音頻分組中所包含的音頻碼的解碼,另一方面,在接收到的音頻分組中檢測(cè)到異常(分組錯(cuò)誤或分組丟失)的情況下進(jìn)行分組丟失掩藏。關(guān)于解碼部4的詳細(xì)動(dòng)作,將在以下的實(shí)施方式中敘述。從解碼部4輸出的解碼音頻被送出至音頻的緩沖器等中并通過(guò)揚(yáng)聲器等進(jìn)行再現(xiàn),或者被蓄積到存儲(chǔ)器或硬盤等記錄介質(zhì)中。以上敘述的圖1的整體結(jié)構(gòu)在后述的第2 第6實(shí)施方式中也同樣如此,因此在第2 第6實(shí)施方式中省略對(duì)整體結(jié)構(gòu)的重復(fù)說(shuō)明。另外,作為第I實(shí)施方式的特征部分,以下對(duì)編碼部I和解碼部4進(jìn)行詳細(xì)說(shuō)明。在第I實(shí)施方式中,說(shuō)明使用對(duì)多個(gè)比I幀短的子幀的功率進(jìn)行函數(shù)近似而得到的參數(shù)作為與功率的時(shí)間變化相關(guān)的輔助信息的例子。(編碼部I的結(jié)構(gòu)和動(dòng)作)如圖2所示,編碼部I具有:對(duì)音頻信號(hào)進(jìn)行編碼的音頻編碼部11 ;輔助信息編碼部12,其估計(jì)輔助信息并進(jìn)行編碼,該輔助信息用于在解碼音頻信號(hào)時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān);以及碼復(fù)用部13,其對(duì)在輔助信息編碼部12的編碼中得到的輔助信息碼和在音頻編碼部11的編碼中得到的音頻碼進(jìn)行復(fù)用并作為比特流輸出。如圖4所示,其中的輔助信息編碼部12具有將后述的子幀功率計(jì)算部121、衰減系數(shù)估計(jì)部122和衰減系數(shù)量化部123。以下,使用圖3對(duì)編碼部I的動(dòng)作進(jìn)行說(shuō)明。音頻編碼部11蓄積預(yù)先確定的時(shí)間量的輸入音頻,并對(duì)所蓄積的輸入音頻中的作為編碼對(duì)象的部分進(jìn)行編碼(圖3的步驟S1101)。編碼例如可以使用在文獻(xiàn)「3GPPTS26.401 “Enhanced aacPlus general audio codec General description,,」中規(guī)定的3GPP enhanced aacPlus、或在文獻(xiàn)「Recommedation ITU — T G.718“Frame error robustnarrow — band and wideband embedded variable bit — rate coding of speech andaudio from8 一 32kbit/s”」中規(guī)定的G.718等音頻編碼,也可以使用其他編碼方法。輔助信息編碼部12中的子幀功率計(jì)算部121蓄積預(yù)先確定的時(shí)間量的輸入音頻,并針對(duì)所蓄積的輸入音頻中的作為編碼對(duì)象的部分s (0)、s (I)、…、s (T — I)的預(yù)先確定的幀數(shù)(在本實(shí)施方式中為d幀)的之后的音頻信號(hào)s (dT)、s (1+dT)、…、s ((d+1)T 一 I)計(jì)算子幀功率序列(圖3的步驟S1211)。此處,將I幀所包含的樣本數(shù)設(shè)為T。如果設(shè)預(yù)測(cè)對(duì)象信號(hào)為下式(1),則子幀I (OSKL — I)的功率P (I)通過(guò)下式(2)求出。式1
權(quán)利要求
1.一種音頻編碼裝置,其對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編碼,其中,該音頻編碼裝置具有: 音頻編碼部,其對(duì)音頻信號(hào)進(jìn)行編碼;以及 輔助信息編碼部,其估計(jì)輔助信息并對(duì)其進(jìn)行編碼,該輔助信息被用于解碼音頻信號(hào)時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān)。
2.根據(jù)權(quán)利要求1所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有對(duì)多個(gè)比I幀短的子幀的功率進(jìn)行函數(shù)近似而得到的參數(shù)。
3.根據(jù)權(quán)利要求1所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有與對(duì)多個(gè)比I幀短的子幀的功率進(jìn)行矢量量化而得到的矢量相關(guān)的信息。
4.根據(jù)權(quán)利要求1所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下參數(shù):該參數(shù)是按照將整個(gè)頻帶分割為多個(gè)后的每個(gè)子帶對(duì)按照每個(gè)子帶計(jì)算出的多個(gè)比I幀短的子幀的功率進(jìn)行了函數(shù)近似而得到的。
5.根據(jù)權(quán)利要求1所述的音頻 編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有與如下矢量相關(guān)的信息:該矢量是對(duì)按照將整個(gè)頻帶分割為多個(gè)后的每個(gè)子帶計(jì)算出的多個(gè)比I幀短的子幀的功率進(jìn)行矢量量化而得到的。
6.根據(jù)權(quán)利要求1 5中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 所述輔助信息編碼部對(duì)于與所述音頻編碼部進(jìn)行編碼的幀的I個(gè)以上的之前或I個(gè)以上的之后的幀相當(dāng)?shù)臅r(shí)間區(qū)間中所包含的音頻信號(hào),估計(jì)所述輔助信息并進(jìn)行編碼。
7.根據(jù)權(quán)利要求6所述的音頻編碼裝置,其特征在于, 所述輔助信息編碼部將所述輔助信息作為兩個(gè)以上的集合分別進(jìn)行編碼。
8.一種音頻解碼裝置,其根據(jù)包含音頻碼和輔助信息碼的音頻分組對(duì)音頻碼進(jìn)行解碼,所述輔助信息碼被用于解碼音頻碼時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān),其中,該音頻解碼裝置具有: 錯(cuò)誤/丟失檢測(cè)部,其檢測(cè)音頻分組中的分組錯(cuò)誤或分組丟失,并輸出表示檢測(cè)結(jié)果的錯(cuò)誤標(biāo)志; 音頻解碼部,其對(duì)音頻分組中包含的音頻碼進(jìn)行解碼來(lái)求出解碼信號(hào); 輔助信息解碼部,其對(duì)音頻分組中包含的輔助信息碼進(jìn)行解碼來(lái)求出輔助信息; 第一掩藏信號(hào)生成部,其在所述錯(cuò)誤標(biāo)志表示音頻分組的異常的情況下,根據(jù)已經(jīng)求出的解碼信號(hào),生成用于掩藏分組丟失的第一掩藏信號(hào);以及 掩藏信號(hào)修正部,其根據(jù)所述輔助信息,修正第一掩藏信號(hào)。
9.根據(jù)權(quán)利要求8所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息碼中,包含有對(duì)多個(gè)比I幀短的子幀的功率進(jìn)行函數(shù)近似而得到的參數(shù)。
10.根據(jù)權(quán)利要求8所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息碼中,包含有與對(duì)多個(gè)比I幀短的子幀的功率進(jìn)行矢量量化而得到的矢量相關(guān)的信息。
11.根據(jù)權(quán)利要求8所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下參數(shù):該參數(shù)是按照將整個(gè)頻帶分割為多個(gè)后的每個(gè)子帶對(duì)按照每個(gè)子帶計(jì)算出的多個(gè)比I幀短的子幀的功率進(jìn)行了函數(shù)近似而得到的。
12.根據(jù)權(quán)利要求8所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有與如下矢量相關(guān)的信息:該矢量是按照將整個(gè)頻帶分割為多個(gè)后的每個(gè)子帶對(duì)按照每個(gè)子帶計(jì)算出的多個(gè)比I幀短的子幀的功率進(jìn)行矢量量化而得到的。
13.根據(jù)權(quán)利要求8所述的音頻解碼裝置,其特征在于, 所述掩藏信號(hào)修正部按照將整個(gè)頻帶分割為多個(gè)后的每個(gè)子帶來(lái)修正第一掩藏信號(hào)。
14.根據(jù)權(quán)利要求8 13中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 所述輔助信息解碼部對(duì)與如下的音頻信號(hào)相關(guān)的輔助信息碼進(jìn)行解碼,該音頻信號(hào)是與所述音頻解碼部進(jìn)行解碼的音頻碼所對(duì)應(yīng)的幀的I個(gè)以上的之前或I個(gè)以上的之后的幀相當(dāng)?shù)臅r(shí)間區(qū)間中包含的音頻信號(hào)。
15.一種由音頻編碼裝置執(zhí)行的音頻編碼方法,該音頻編碼裝置對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編碼,其中,該音頻編碼方法具有: 音頻編碼步驟,對(duì)音頻信號(hào)進(jìn)行編碼;以及 輔助信息編碼步驟,估計(jì)輔助信息并對(duì)其進(jìn)行編碼,該輔助信息被用于解碼音頻信號(hào)時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān)。
16.一種由音頻解碼裝置執(zhí)行的音頻解碼方法,該音頻解碼裝置根據(jù)包含音頻碼和輔助信息碼的音頻分組對(duì)音頻碼進(jìn)行解碼,所述輔助信息碼被用于解碼音頻碼時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān),其中,該音頻解碼方法具有: 錯(cuò)誤/丟失檢測(cè)步驟,檢測(cè)音頻分組中的分組錯(cuò)誤或分組丟失,并輸出表示檢測(cè)結(jié)果的錯(cuò)誤標(biāo)志; 音頻解碼步驟,對(duì)音頻分組中包含的音頻碼進(jìn)行解碼來(lái)求出解碼信號(hào); 輔助信息解碼步驟,對(duì)音頻分組中包含的輔助信息碼進(jìn)行解碼來(lái)求出輔助信息; 第一掩藏信號(hào)生成步驟,在所述錯(cuò)誤標(biāo)志表示音頻分組的異常的情況下,根據(jù)已經(jīng)求出的解碼信號(hào),生成用于掩藏分組丟失的第一掩藏信號(hào);以及 掩藏信號(hào)修正步驟,根據(jù)所述輔助信息,修正第一掩藏信號(hào)。
17.一種音頻編碼程序,其中,該音頻編碼程序使計(jì)算機(jī)作為以下各部發(fā)揮功能: 音頻編碼部,其對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編碼;以及 輔助信息編碼部,其估計(jì)輔助信息并對(duì)其進(jìn)行編碼,該輔助信息被用于解碼音頻信號(hào)時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān)。
18.一種音頻解碼程序,其中,該音頻解碼程序使計(jì)算機(jī)作為以下各部發(fā)揮功能: 錯(cuò)誤/丟失檢測(cè)部,其檢測(cè)包含音頻碼和輔助信息碼的音頻分組中的分組錯(cuò)誤或分組丟失,并輸出表示檢測(cè)結(jié)果的錯(cuò)誤標(biāo)志,所述輔助信息碼被用于解碼音頻碼時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān); 音頻解碼部,其對(duì)音頻分組中包含的音頻碼進(jìn)行解碼來(lái)求出解碼信號(hào);輔助信息解碼部,其對(duì)音頻分組中包含的輔助信息碼進(jìn)行解碼來(lái)求出輔助信息;第一掩藏信號(hào)生成部,其在所述錯(cuò)誤標(biāo)志表示音頻分組的異常的情況下,根據(jù)已經(jīng)求出的解碼信號(hào),生成用于掩藏分組丟失的第一掩藏信號(hào);以及掩藏信號(hào)修正部,其根據(jù)所述輔助信息,修正第一掩藏信號(hào)。
19.根據(jù)權(quán)利要求1 7中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息。
20.根據(jù)權(quán)利要求1 7中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 功率急劇變化的位置;以及 功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。
21.根據(jù)權(quán)利要求1 7中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 表示有無(wú)功率的急劇變化的指示信息; 功率急劇變化的位置;以及 功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。
22.根據(jù)權(quán)利要求21所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,還包含有對(duì)功率的變化進(jìn)行矢量量化后的信息。
23.根據(jù)權(quán)利要求1 7中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 表示有無(wú)功率的急劇變化的指示信息; 功率急劇變化的位置;以及 功率急劇變化的子幀中所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋兴腎個(gè)以上的子帶的功率進(jìn)行量化后的值。
24.根據(jù)權(quán)利要求23所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,還包含有對(duì)功率急劇變化的子幀中所包含的I個(gè)以上的子帶的功率變化進(jìn)行矢量量化后的信息。
25.根據(jù)權(quán)利要求8 14中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有表示有無(wú)功率的急劇變化的指示信息。
26.根據(jù)權(quán)利要求8 14中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 功率急劇變化的位置;以及 功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。
27.根據(jù)權(quán)利要求8 14中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 表示有無(wú)功率的急劇變化的指示信息; 功率急劇變化的位置; 以及功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。
28.根據(jù)權(quán)利要求27所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,還包含有對(duì)功率的變化進(jìn)行矢量量化后的信息。
29.根據(jù)權(quán)利要求8 14中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 表示有無(wú)功率的急劇變化的指示信息; 功率急劇變化的位置;以及 功率急劇變化的子幀中所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋兴腎個(gè)以上的子帶的功率進(jìn)行量化后的值。
30.根據(jù)權(quán)利要求29所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,還包含有對(duì)功率急劇變化的子幀中所包含的I個(gè)以上的子帶的功率變化進(jìn)行矢量量化后的信息。
31.根據(jù)權(quán)利要求8 14以及25 30中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 所述輔助信息解碼部 將所述輔助信息作為兩個(gè)以上的集合分別進(jìn)行解碼。
32.根據(jù)權(quán)利要求1 7中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。
33.根據(jù)權(quán)利要求1 7中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 表示有無(wú)功率的急劇變化的指示信息;以及 功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。
34.根據(jù)權(quán)利要求1 7中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 功率急劇變化的子幀中所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋兴腎個(gè)以上的子帶的功率進(jìn)行量化后的值。
35.根據(jù)權(quán)利要求1 7中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 表示有無(wú)功率的急劇變化的指示信息;以及 功率急劇變化的子幀中所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋兴腎個(gè)以上的子帶的功率進(jìn)行量化后的值。
36.根據(jù)權(quán)利要求1 7中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 功率急劇變化的位置;以及 功率急劇變化的子幀中所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋兴腎個(gè)以上的子帶的功率進(jìn)行量化后的值。
37.根據(jù)權(quán)利要求34 36中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 所述輔助信息編碼部在與所述功率急劇變化的子幀中所包含的I個(gè)以上的子帶相關(guān)的功率的量化中,對(duì)作為在所述I個(gè)以上的子帶中所包含的I個(gè)以上的子帶的核心子帶的功率、以及核心子帶的功率與核心子帶以外的子帶的功率之間的差分進(jìn)行量化。
38.根據(jù)權(quán)利要求37所述的音頻編碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有對(duì)功率急劇變化的子幀之后的功率變化進(jìn)行量化后的信息。
39.根據(jù)權(quán)利要求19、21 24、33、35中的任意一項(xiàng)所述的音頻編碼裝置,其特征在于, 所述輔助信息編碼部根據(jù)表示有無(wú)功率的急劇變化的指示信息,以不同的長(zhǎng)度對(duì)所述輔助信息進(jìn)行編碼。
40.根據(jù)權(quán)利要求8 14中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。
41.根據(jù)權(quán)利要求8 14中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 表示有無(wú)功率的急劇變化的指示信息;以及 功率急劇變化的子幀的功率、或?qū)β始眲∽兓淖訋墓β蔬M(jìn)行量化后的值。
42.根據(jù)權(quán)利要求8 14中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息:` 功率急劇變化的子幀中所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋兴腎個(gè)以上的子帶的功率進(jìn)行量化后的值。
43.根據(jù)權(quán)利要求8 14中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 表示有無(wú)功率的急劇變化的指示信息;以及 功率急劇變化的子幀中所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋兴腎個(gè)以上的子帶的功率進(jìn)行量化后的值。
44.根據(jù)權(quán)利要求8 14中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有如下信息: 功率急劇變化的位置;以及 功率急劇變化的子幀中所包含的I個(gè)以上的子帶的功率、或?qū)β始眲∽兓淖訋兴腎個(gè)以上的子帶的功率進(jìn)行量化后的值。
45.根據(jù)權(quán)利要求42 44中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 所述輔助信息解碼部對(duì)包含有如下信息的所述輔助信息進(jìn)行解碼:該信息是在與所述功率急劇變化的子幀中所包含的I個(gè)以上的子帶相關(guān)的功率的量化中,對(duì)作為在所述I個(gè)以上的子帶中所包含的I個(gè)以上的子帶的核心子帶的功率、以及核心子帶的功率與核心子帶以外的子帶的功率之間的差分進(jìn)行量化后的信息。
46.根據(jù)權(quán)利要求45所述的音頻解碼裝置,其特征在于, 在與所述功率的時(shí)間變化相關(guān)的輔助信息中,包含有對(duì)功率急劇變化的子幀之后的功率變化進(jìn)行量化后的信息。
47.根據(jù)權(quán)利要求25、27 30、41、43中的任意一項(xiàng)所述的音頻解碼裝置,其特征在于, 所述輔助信息解碼部對(duì)根據(jù)表示有無(wú)功率的急劇變化的指示信息而以不同的長(zhǎng)度進(jìn)行了編碼的所述輔助信 息進(jìn)行解碼。
全文摘要
對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編碼的編碼部具有音頻編碼部,其對(duì)音頻信號(hào)進(jìn)行編碼;以及輔助信息編碼部,其估計(jì)輔助信息并進(jìn)行編碼,該輔助信息被用于解碼音頻信號(hào)時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān)。在與上述功率的時(shí)間變化相關(guān)的輔助信息中,可以包含有對(duì)多個(gè)比1幀短的子幀的功率進(jìn)行函數(shù)近似而得到的參數(shù),還可以包含有與對(duì)多個(gè)比1幀短的子幀的功率進(jìn)行矢量量化而得到的矢量相關(guān)的信息。
文檔編號(hào)G10L19/005GK103229234SQ20118005612
公開(kāi)日2013年7月31日 申請(qǐng)日期2011年11月4日 優(yōu)先權(quán)日2010年11月22日
發(fā)明者堤公孝, 菊入圭 申請(qǐng)人:株式會(huì)社Ntt都科摩