音頻編碼裝置、方法以及音頻解碼裝置、方法
【專利說(shuō)明】
[0001] 本發(fā)明專利申請(qǐng)是發(fā)明名稱為"音頻編碼裝置、方法和程序以及音頻解碼裝置、方 法和程序"、申請(qǐng)日為2011年11月4日、國(guó)際申請(qǐng)?zhí)枮?PCT/JP2011/075489"、國(guó)家申請(qǐng)?zhí)?為"201180056122. 7"的發(fā)明專利申請(qǐng)的分案申請(qǐng)。
技術(shù)領(lǐng)域
[0002] 本發(fā)明涉及經(jīng)由IP網(wǎng)和移動(dòng)通信網(wǎng)傳輸包含對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編 碼而得到的音頻碼的音頻分組時(shí)的錯(cuò)誤掩藏,更具體而言,涉及用于實(shí)現(xiàn)錯(cuò)誤掩藏的音頻 編碼裝置、音頻編碼方法和音頻編碼程序以及音頻解碼裝置、音頻解碼方法和音頻解碼程 序。
【背景技術(shù)】
[0003]在IP網(wǎng)和移動(dòng)通信中傳輸音頻/聲音信號(hào)(以下稱作"音頻信號(hào)")時(shí),對(duì)音頻信 號(hào)進(jìn)行編碼而以較小的比特?cái)?shù)來(lái)表現(xiàn)并分割為音頻分組,經(jīng)由通信網(wǎng)傳輸該音頻分組。通 過(guò)通信網(wǎng)接收到的音頻分組在接收側(cè)的服務(wù)器、MCU、終端等中被解碼,從而得到解碼音頻 信號(hào)。
[0004]在通過(guò)通信網(wǎng)傳輸音頻分組時(shí),由于通信網(wǎng)的擁擠狀態(tài)等,可能會(huì)產(chǎn)生丟失一部 分音頻分組或在寫入到音頻分組中的一部分信息中產(chǎn)生錯(cuò)誤的現(xiàn)象(所謂的分組丟失)。 在這種情況下,無(wú)法在接收側(cè)對(duì)音頻分組進(jìn)行正確解碼,因此不能得到期望的解碼音頻信 號(hào)。此外,由于與產(chǎn)生分組丟失的音頻分組對(duì)應(yīng)的解碼音頻信號(hào)被感知為噪音,因此顯著損 壞對(duì)收聽(tīng)的人賦予的主觀品質(zhì)。
[0005]為了消除上述那樣的不良情況,存在"接收側(cè)中的掩藏技術(shù)"和"發(fā)送側(cè)中的掩藏 技術(shù)",作為對(duì)由于分組丟失而丟失的部分的音頻聲音信號(hào)進(jìn)行插值的分組丟失掩藏技術(shù)。
[0006]在其中的"接收側(cè)中的掩藏技術(shù)"中,例如非專利文獻(xiàn)1的技術(shù)那樣,通過(guò)在以音 調(diào)(pitch)為單位復(fù)制了之前正常接收到的分組所包含的解碼音頻信號(hào)后,乘以預(yù)先確定 的衰減系數(shù),生成與分組丟失的部分對(duì)應(yīng)的音頻信號(hào)。但是,"接收側(cè)中的掩藏技術(shù)"以分組 丟失的部分的音頻性質(zhì)與分組丟失緊之前的音頻相似為前提,因此在分組丟失的部分與丟 失緊之前的音頻具有不同性質(zhì)的情況、和功率急劇變化的情況下不能充分發(fā)揮掩藏效果。
[0007]此外,在"接收側(cè)中的掩藏技術(shù)"中存在專利文獻(xiàn)1的技術(shù)作為更高級(jí)的技術(shù)。在 該專利文獻(xiàn)1的技術(shù)中,復(fù)制之前正常接收到的分組所包含的解碼音頻來(lái)生成掩藏信號(hào), 但以下方法與上述非專利文獻(xiàn)1的技術(shù)不同:通過(guò)乘以根據(jù)復(fù)制源的音頻性質(zhì)(功率譜的 形狀)而發(fā)生變化的衰減系數(shù),進(jìn)行異常聲音少且高音質(zhì)的掩藏信號(hào)的整形。
[0008]另一方面,存在專利文獻(xiàn)2的技術(shù)和專利文獻(xiàn)3的技術(shù)作為"發(fā)送側(cè)中的掩藏技 術(shù)"。
[0009]在其中的專利文獻(xiàn)2的技術(shù)中,將之前正常接收到的分組所包含的音頻信號(hào)蓄積 到緩沖器中,并且將表示在丟失分組時(shí)從緩沖器的哪個(gè)位置復(fù)制音頻信號(hào)的位置信息編碼 為輔助信息并進(jìn)行傳輸。并且,除了位置信息以外,還在輔助信息中包含表示分組丟失部分 是否為無(wú)聲區(qū)間這樣的振幅信息,由此防止在產(chǎn)生了分組丟失的部分本來(lái)是無(wú)聲區(qū)間的情 況下混入不必要的聲音的情況。
[0010] 此外,在專利文獻(xiàn)3的技術(shù)中,解碼裝置具有:掩藏分組丟失的第一掩藏裝置;根 據(jù)輔助信息修正第一掩藏裝置輸出的第一掩藏信號(hào)的第二掩藏裝置;以及對(duì)輔助信息進(jìn)行 解碼的輔助信息解碼裝置。在第一掩藏裝置中不能充分發(fā)揮掩藏效果的情況下,第二掩藏 裝置使用輔助信息解碼裝置生成的輔助信息來(lái)修正第一掩藏信號(hào),生成第二掩藏信號(hào)。作 為輔助信息,利用功率譜包絡(luò)、根據(jù)相鄰的幀的功率譜包絡(luò)預(yù)測(cè)的值和對(duì)輸入功率譜包絡(luò) 的誤差進(jìn)行編碼得到的值。第二掩藏裝置在具有能夠用作輔助信息的功率譜包絡(luò)的頻域中 對(duì)第一掩藏信號(hào)乘以增益,生成比第一掩藏信號(hào)精度更高的第二掩藏信號(hào)。
[0011] 現(xiàn)有技術(shù)文獻(xiàn)
[0012] 專利文獻(xiàn)
[0013] 專利文獻(xiàn)1 :日本再公表特許W02007/000988號(hào)公報(bào)
[0014] 專利文獻(xiàn)2 :日本特開(kāi)2003 - 316670號(hào)公報(bào)
[0015] 專利文獻(xiàn)3 :日本特開(kāi)2008 - 111991號(hào)公報(bào)
[0016] 非專利文獻(xiàn)
[0017]非專利文獻(xiàn) 1 :ITU - TG. 711AppendixI
【發(fā)明內(nèi)容】
[0018] 發(fā)明要解決的課題
[0019] 但是,專利文獻(xiàn)1的技術(shù)是根據(jù)之前正常接收到的解碼信號(hào),通過(guò)預(yù)測(cè)生成掩藏 信號(hào)的方法,因此難以根據(jù)之前的信號(hào)高精度地生成例如響板的拍打聲那樣具有與預(yù)測(cè)結(jié) 果偏離較大的功率變化的掩藏信號(hào)。
[0020] 此外,專利文獻(xiàn)2的技術(shù)在發(fā)送側(cè)生成與無(wú)聲區(qū)間相關(guān)的振幅信息,防止在分組 丟失的部分為無(wú)聲區(qū)間的情況下生成掩藏信號(hào),但對(duì)于上述的響板的拍打聲那樣的伴隨突 發(fā)的功率變化的聲音不具有足夠的掩藏效果。
[0021] 此外,專利文獻(xiàn)3的技術(shù)是在以幀為單位進(jìn)行時(shí)頻變換后進(jìn)行頻域中的處理的方 法,因此處理的單位是幀單位,難以處理幀內(nèi)的急劇的功率變化。此外,以之前的信號(hào)和分 組丟失的信號(hào)的相關(guān)性高為前提對(duì)分組丟失部分的解碼音頻進(jìn)行高精度化,因此在功率急 劇變化的部分產(chǎn)生分組丟失的情況下,信號(hào)的相關(guān)性變低,因此功率譜包絡(luò)的預(yù)測(cè)誤差變 大,所以難以利用較少的比特?cái)?shù)來(lái)進(jìn)行編碼,難以生成高精度的解碼音頻。
[0022] 如上所述,在現(xiàn)有技術(shù)中,具有如下問(wèn)題:對(duì)拍手和響板的拍打聲那樣的伴隨有在 時(shí)間上較快的功率變化的信號(hào)(以下稱作"瞬態(tài)信號(hào)")不具有足夠的錯(cuò)誤掩藏效果。即, 在接收側(cè),要根據(jù)通過(guò)解碼由緊之前正常接收到的音頻分組而得到的解碼信號(hào),正確預(yù)測(cè) 在音頻信號(hào)中的哪個(gè)時(shí)刻產(chǎn)生瞬態(tài)信號(hào)是極為困難的。
[0023] 本發(fā)明的目的在于解決上述問(wèn)題,給出能夠高精度地掩藏難以根據(jù)前后信號(hào)來(lái)預(yù) 測(cè)的瞬態(tài)信號(hào)中的分組丟失的錯(cuò)誤掩藏技術(shù)。
[0024]用于解決課題的手段
[0025] 本發(fā)明的一個(gè)方面的音頻編碼裝置,其對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編碼,其 中,該音頻編碼裝置具有:音頻編碼部,其對(duì)音頻信號(hào)進(jìn)行編碼;以及輔助信息編碼部,其 估計(jì)輔助信息并對(duì)其進(jìn)行編碼,該輔助信息被用于解碼音頻信號(hào)時(shí)的分組丟失的掩藏,并 與音頻信號(hào)的功率的時(shí)間變化相關(guān),所述輔助信息編碼部作為所述輔助信息,估計(jì)與功率 的變化相關(guān)的標(biāo)志和量化瞬態(tài)功率并對(duì)其進(jìn)行編碼。
[0026] 也可以是,所述輔助信息僅包含所述標(biāo)志和所述量化瞬態(tài)功率。
[0027] 此外,本發(fā)明的另一個(gè)方面的音頻編碼裝置,其對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行 編碼,其中,該音頻編碼裝置具有:音頻編碼部,其對(duì)音頻信號(hào)進(jìn)行編碼;以及輔助信息編 碼部,其估計(jì)輔助信息并對(duì)其進(jìn)行編碼,該輔助信息被用于解碼音頻信號(hào)時(shí)的分組丟失的 掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān),所述輔助信息編碼部作為所述輔助信息,估計(jì) 與功率的變化相關(guān)的標(biāo)志并對(duì)其進(jìn)行編碼,在所述標(biāo)志為規(guī)定的模式的情況下,作為所述 輔助信息,還估計(jì)量化瞬態(tài)功率并對(duì)其進(jìn)行編碼,在所述標(biāo)志不為規(guī)定的模式的情況下,作 為所述輔助信息,不包含量化瞬態(tài)功率。
[0028] 本發(fā)明的一個(gè)方面的音頻解碼裝置,其根據(jù)包含音頻碼和輔助信息碼的音頻分組 對(duì)音頻碼進(jìn)行解碼,所述輔助信息碼被用于解碼音頻碼時(shí)的分組丟失的掩藏,并與音頻信 號(hào)的功率的時(shí)間變化相關(guān),其中,該音頻解碼裝置具有:錯(cuò)誤/丟失檢測(cè)部,其檢測(cè)音頻分 組中的分組錯(cuò)誤或分組丟失,并輸出表示檢測(cè)結(jié)果的錯(cuò)誤標(biāo)志;音頻解碼部,其對(duì)音頻分組 中包含的音頻碼進(jìn)行解碼來(lái)求出解碼信號(hào);輔助信息解碼部,其對(duì)音頻分組中包含的輔助 信息碼進(jìn)行解碼來(lái)求出輔助信息;第一掩藏信號(hào)生成部,其在所述錯(cuò)誤標(biāo)志表示音頻分組 的異常的情況下,根據(jù)已經(jīng)求出的解碼信號(hào),生成用于掩藏分組丟失的第一掩藏信號(hào);以及 掩藏信號(hào)修正部,其根據(jù)所述輔助信息,修正第一掩藏信號(hào),所述輔助信息解碼部對(duì)所述輔 助信息碼中包含的與功率的變化相關(guān)的標(biāo)志和量化瞬態(tài)功率進(jìn)行解碼,作為輔助信息求出 所述標(biāo)志和所述量化瞬態(tài)功率。
[0029] 也可以是,所述輔助信息僅包含所述標(biāo)志和所述量化瞬態(tài)功率。
[0030] 此外,本發(fā)明的另一個(gè)方面的音頻解碼裝置,其根據(jù)包含音頻碼和輔助信息碼的 音頻分組對(duì)音頻碼進(jìn)行解碼,所述輔助信息碼被用于解碼音頻碼時(shí)的分組丟失的掩藏,并 與音頻信號(hào)的功率的時(shí)間變化相關(guān),其中,該音頻解碼裝置具有:錯(cuò)誤/丟失檢測(cè)部,其檢 測(cè)音頻分組中的分組錯(cuò)誤或分組丟失,并輸出表示檢測(cè)結(jié)果的錯(cuò)誤標(biāo)志;音頻解碼部,其對(duì) 音頻分組中包含的音頻碼進(jìn)行解碼來(lái)求出解碼信號(hào);輔助信息解碼部,其對(duì)音頻分組中包 含的輔助信息碼進(jìn)行解碼來(lái)求出輔助信息;第一掩藏信號(hào)生成部,其在所述錯(cuò)誤標(biāo)志表示 音頻分組的異常的情況下,根據(jù)已經(jīng)求出的解碼信號(hào),生成用于掩藏分組丟失的第一掩藏 信號(hào);以及掩藏信號(hào)修正部,其根據(jù)所述輔助信息,修正第一掩藏信號(hào),所述輔助信息解碼 部對(duì)所述輔助信息碼中包含的與功率的變化相關(guān)的標(biāo)志進(jìn)行解碼,在所述標(biāo)志為規(guī)定的模 式的情況下,還對(duì)所述輔助信息碼中包含的量化瞬態(tài)功率進(jìn)行解碼,作為輔助信息求出所 述標(biāo)志和所述量化瞬態(tài)功率,在所述標(biāo)志不為規(guī)定的模式的情況下,作為所述輔助信息,不 包含量化瞬態(tài)功率。
[0031] 本發(fā)明的一個(gè)方面的由音頻編碼裝置執(zhí)行的音頻編碼方法,該音頻編碼裝置對(duì)由 多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編碼,其中,該音頻編碼方法具有:音頻編碼步驟,對(duì)音頻信號(hào) 進(jìn)行編碼;以及輔助信息編碼步驟,估計(jì)輔助信息并對(duì)其進(jìn)行編碼,該輔助信息被用于解碼 音頻信號(hào)時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān),在所述輔助信息編 碼步驟中,所述音頻編碼裝置作為所述輔助信息,估計(jì)與功率的變化相關(guān)的標(biāo)志和量化瞬 態(tài)功率并對(duì)其進(jìn)行編碼。
[0032] 此外,本發(fā)明的另一個(gè)方面的由音頻編碼裝置執(zhí)行的音頻編碼方法,該音頻編碼 裝置對(duì)由多個(gè)幀構(gòu)成的音頻信號(hào)進(jìn)行編碼,其中,該音頻編碼方法具有:音頻編碼步驟,對(duì) 音頻信號(hào)進(jìn)行編碼;以及輔助信息編碼步驟,估計(jì)輔助信息并對(duì)其進(jìn)行編碼,該輔助信息被 用于解碼音頻信號(hào)時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān),在所述輔 助信息編碼步驟中,所述音頻編碼裝置作為所述輔助信息,估計(jì)與功率的變化相關(guān)的標(biāo)志 并對(duì)其進(jìn)行編碼,在所述標(biāo)志為規(guī)定的模式的情況下,作為所述輔助信息,還估計(jì)量化瞬態(tài) 功率并對(duì)其進(jìn)行編碼,在所述標(biāo)志不為規(guī)定的模式的情況下,作為所述輔助信息,不包含量 化瞬態(tài)功率。
[0033] 本發(fā)明的一個(gè)方面的由音頻解碼裝置執(zhí)行的音頻解碼方法,該音頻解碼裝置根據(jù) 包含音頻碼和輔助信息碼的音頻分組對(duì)音頻碼進(jìn)行解碼,所述輔助信息碼被用于解碼音頻 碼時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān),其中,該音頻解碼方法具 有:錯(cuò)誤/丟失檢測(cè)步驟,檢測(cè)音頻分組中的分組錯(cuò)誤或分組丟失,并輸出表示檢測(cè)結(jié)果的 錯(cuò)誤標(biāo)志;音頻解碼步驟,對(duì)音頻分組中包含的音頻碼進(jìn)行解碼來(lái)求出解碼信號(hào);輔助信 息解碼步驟,對(duì)音頻分組中包含的輔助信息碼進(jìn)行解碼來(lái)求出輔助信息;第一掩藏信號(hào)生 成步驟,其在所述錯(cuò)誤標(biāo)志表示音頻分組的異常的情況下,根據(jù)已經(jīng)求出的解碼信號(hào),生成 用于掩藏分組丟失的第一掩藏信號(hào);以及掩藏信號(hào)修正步驟,根據(jù)所述輔助信息,修正第一 掩藏信號(hào),在所述輔助信息解碼步驟中,所述音頻解碼裝置對(duì)所述輔助信息碼中包含的與 功率的變化相關(guān)的標(biāo)志和量化瞬態(tài)功率進(jìn)行解碼,作為輔助信息求出所述標(biāo)志和所述量化 瞬態(tài)功率。
[0034]此外,本發(fā)明的另一個(gè)方面的由音頻解碼裝置執(zhí)行的音頻解碼方法,該音頻解碼 裝置根據(jù)包含音頻碼和輔助信息碼的音頻分組對(duì)音頻碼進(jìn)行解碼,所述輔助信息碼被用于 解碼音頻碼時(shí)的分組丟失的掩藏,并與音頻信號(hào)的功率的時(shí)間變化相關(guān),其中,該音頻解碼 方法具有:錯(cuò)誤/丟失檢測(cè)步驟,檢測(cè)音頻分組中的分組錯(cuò)誤或分組丟失,并輸出表示檢測(cè) 結(jié)果的錯(cuò)誤標(biāo)志;音頻解碼步驟,對(duì)音頻分組中包含的音頻碼進(jìn)行解碼來(lái)求出解碼信號(hào); 輔助信息解碼步驟,對(duì)音頻分組中包含的輔助信息碼進(jìn)行解碼來(lái)求出輔助信息;第一掩藏 信號(hào)生成步驟,在所述錯(cuò)誤標(biāo)志表示音頻分組的異常的情況下,根據(jù)已經(jīng)求出的解碼信號(hào), 生成用于掩藏分組丟失的第一掩藏信號(hào);以及掩藏信號(hào)修正步驟,根據(jù)所述輔助信息,修 正第一掩藏信號(hào),在所述輔助信息解碼步驟中,所述音頻解碼裝置對(duì)所述輔助信息碼中包 含的與功率的變化相關(guān)的標(biāo)志進(jìn)行解碼,在所述標(biāo)志為規(guī)定的模式的情況下,還對(duì)所述輔 助信息碼中包含的量化瞬態(tài)功率進(jìn)行解碼,作為輔助信息求出所述標(biāo)志和所述量化瞬態(tài)功 率,在所述標(biāo)志不為規(guī)定的模式的情況下,作為所述輔助信息,不包含量化瞬態(tài)功率。
[0035] 發(fā)明效果
[0036] 本發(fā)明通過(guò)以上所述的方法,能夠送出與功率急劇變化的部分相關(guān)的信息,因此 能夠針對(duì)在現(xiàn)有技術(shù)中難以實(shí)現(xiàn)分組丟失掩藏的伴隨有功率的急劇的時(shí)間變化的信號(hào) (瞬態(tài)信號(hào))實(shí)現(xiàn)高精度的分組丟失掩藏。
【附圖說(shuō)明】
[0037] 圖1是示出發(fā)明的一個(gè)實(shí)施方式中的系統(tǒng)環(huán)境的圖。
[0038] 圖2是第1、第2、第3、第6實(shí)施方式中的編碼部的結(jié)構(gòu)圖。
[0039] 圖3是圖2的編碼部的處理的流程圖。
[0040] 圖4是第1實(shí)施方式等中的輔助信息編碼部的結(jié)構(gòu)圖。
[0041] 圖5是示出作為音頻編碼對(duì)象的信號(hào)和作為輔助信息編碼對(duì)象的信號(hào)之間的時(shí) 間關(guān)系以及比特流的結(jié)構(gòu)例的圖。
[0042] 圖6是第1、第2、第3、第5、第6實(shí)施方式中的解碼部的結(jié)構(gòu)圖。
[0043] 圖7是圖6的解碼部的處理的流程圖。
[0044] 圖8是示出掩藏信號(hào)修正部的處理的一例的流程圖。
[0045] 圖9是示出輔助信息編碼部的結(jié)構(gòu)的一例的圖。
[0046] 圖10是第4、第5實(shí)施方式中的編碼部的結(jié)構(gòu)圖。
[0047] 圖11是示出第一掩藏信號(hào)生成部的結(jié)構(gòu)的一例的圖。
[0048] 圖12是示出掩藏信號(hào)修正部的處理的一例的流程圖。
[0049] 圖13是第4實(shí)施方式中的解碼部的結(jié)構(gòu)圖。
[0050] 圖14是示出第6實(shí)施方式中的作為音頻編碼對(duì)象的信號(hào)和作為輔助信息編碼對(duì) 象的信號(hào)之間的時(shí)間關(guān)系以及比特流的結(jié)構(gòu)例的圖。
[0051] 圖15是計(jì)算機(jī)的硬件結(jié)構(gòu)圖。
[0052] 圖16是計(jì)算機(jī)的外觀圖。
[0053] 圖17是示出音頻編碼程序的結(jié)構(gòu)的圖。
[0054] 圖18是示出音頻解碼程序的結(jié)構(gòu)的圖。
[0055] 圖19是示出解碼部的其他結(jié)構(gòu)例的圖。
[0056] 圖20是第7實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。
[0057] 圖21是圖20的輔助信息編碼部的處理的流程圖。
[0058] 圖22是第7、第11實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。
[0059] 圖23是圖22的輔助信息解碼部的處理的流程圖。
[0060] 圖24是第7、第8實(shí)施方式中的掩藏信號(hào)修正部的結(jié)構(gòu)圖。
[0061] 圖25是第7實(shí)施方式的掩藏信號(hào)修正部的處理的流程圖。
[0062] 圖26是第8實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。
[0063] 圖27是圖26的輔助信息編碼部的處理的流程圖。
[0064] 圖28是示出第8實(shí)施方式中的輔助信息編碼部的變形例的結(jié)構(gòu)圖。
[0065] 圖29是圖28的輔助信息編碼部的處理的流程圖。
[0066] 圖30是第8實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。
[0067] 圖31是圖30的輔助信息解碼部的處理的流程圖。
[0068] 圖32是第8實(shí)施方式的掩藏信號(hào)修正部的處理的流程圖。
[0069]圖33是第10實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。
[0070]圖34是圖33的輔助信息編碼部的處理的流程圖。
[0071]圖35是第10實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。
[0072] 圖36是圖35的輔助信息解碼部的處理的流程圖。
[0073] 圖37是第10實(shí)施方式中的掩藏信號(hào)修正部的處理的流程圖。
[0074] 圖38是第11實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。
[0075] 圖39是圖38的輔助信息編碼部的處理的流程圖。
[0076] 圖40是第11實(shí)施方式中的輔助信息解碼部的處理的流程圖。
[0077] 圖41是示出瞬態(tài)檢測(cè)部的輸出內(nèi)容的圖。
[0078] 圖42是示出瞬態(tài)位置信息的標(biāo)量量化方法的例子的圖。
[0079] 圖43是第12實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。
[0080] 圖44是第12實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。
[0081] 圖45是第13實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。
[0082] 圖46是第13實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。
[0083] 圖47是第14實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。
[0084] 圖48是第14實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。
[0085] 圖49是第15實(shí)施方式中的輔助信息編碼部的結(jié)構(gòu)圖。
[0086] 圖50是第15實(shí)施方式中的輔助信息解碼部的結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0087] 以下,使用【附圖說(shuō)明】本發(fā)明的各種實(shí)施方式。
[0088][第1實(shí)施方式]
[0089]首先,使用圖1說(shuō)明本發(fā)明假定的系統(tǒng)環(huán)境。如圖1所示,通過(guò)麥克風(fēng)等傳感器得 到的音頻信號(hào)用數(shù)字形式來(lái)表現(xiàn),并被輸入到編碼部1。
[0090] 每當(dāng)所確定的樣本數(shù)量的音頻信號(hào)被蓄積預(yù)定量到內(nèi)置的緩沖器中時(shí),編碼部1 對(duì)緩沖器內(nèi)的數(shù)字信號(hào)進(jìn)行編碼。將上述預(yù)定量的、即蓄積的樣本數(shù)量稱作幀長(zhǎng)度,將蓄 積在緩沖器中的數(shù)字信號(hào)的集合稱作幀。例如,在以32kHz的采樣頻率進(jìn)行收音時(shí)設(shè)為了 20ms的幀長(zhǎng)度的情況下,將640樣本的數(shù)字信號(hào)蓄積到緩沖器中。另外,緩沖器的長(zhǎng)度可以 長(zhǎng)于1幀。例如,在將緩沖器的長(zhǎng)度設(shè)為2幀的情況下,如果僅在最初等待將2幀的數(shù)字信 號(hào)蓄積到緩沖器中后再開(kāi)始編碼,則能夠?qū)⒆鳛榫幋a對(duì)象的幀的下一幀數(shù)字信號(hào)用于輔助 信息的估計(jì)。作為進(jìn)行編碼的時(shí)刻,可以以幀長(zhǎng)度為單位進(jìn)行編碼,也可以使幀之間具有一 定長(zhǎng)度的重疊來(lái)進(jìn)行編碼。編碼采用3GPP enhanced aacPlus或G. 718等的音頻編碼。關(guān) 于音頻編碼的方法,可以使用任何方法。此外,為了輔助信息計(jì)算而使用蓄積在緩沖器中的 音頻聲音信號(hào)計(jì)算輔助信息,進(jìn)行編碼并傳輸(輔助信息碼)。輔助信息碼可以與音頻碼利 用同一個(gè)分組來(lái)傳輸,也可以用與包含音頻碼的分組不同的分組來(lái)傳輸。之后將對(duì)編碼部 1的動(dòng)作的詳細(xì)情況進(jìn)行敘述。
[0091]分組構(gòu)成部2在由編碼部1得到的音頻碼中附加RTP頭等通信所需的信息,生成 音頻分組。通過(guò)網(wǎng)絡(luò)將所生成的音頻分組送出到接收側(cè)。
[0092] 分組分離部3將通過(guò)網(wǎng)絡(luò)接收到的音頻分組分