語音編碼裝置和語音編碼方法

文檔序號(hào)：2829178閱讀：229來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：語音編碼裝置和語音編碼方法
技術(shù)領(lǐng)域：
本發(fā)明涉及語音編碼裝置及語音編碼方法。
背景技術(shù)：
用低比特率壓縮語音信號(hào)或音頻信號(hào)的語音編碼技術(shù)，對(duì)于有效利用通信系統(tǒng)的傳輸路徑容量來說非常重要。作為語音編碼技術(shù)的主要應(yīng)用環(huán)境，近年來以VoIP(Voice over IP)網(wǎng)絡(luò)、移動(dòng)電話網(wǎng)等為代表的通信系統(tǒng)備受矚目。VoIP是利用使用了IP(Internet Protocol)的分組通信網(wǎng)，將語音信號(hào)的編碼代碼存儲(chǔ)在分組中，并與通信對(duì)方進(jìn)行分組交換的語音通信技術(shù)。
但是，為在語音通信系統(tǒng)中和通信對(duì)方進(jìn)行語音通信，必須在本身持有的通信終端裝置對(duì)通信對(duì)方持有的通信終端裝置生成的編碼代碼進(jìn)行正確的解釋和解碼處理。因此，一旦決定了語音通信系統(tǒng)的編解碼的規(guī)格后，要改變?cè)撘?guī)格并不容易。這是因?yàn)槿绻淖兙幗獯a的規(guī)格，就必須改變編碼裝置和解碼裝置雙方的功能。因此，在考慮使編碼裝置具有一些新的擴(kuò)展功能，并將有關(guān)該擴(kuò)展功能的信息一起發(fā)送時(shí)，因?yàn)橐脖仨殞?duì)語音通信系統(tǒng)的編解碼的規(guī)格本身進(jìn)行修改，而導(dǎo)致成本的大幅增加。
專利文獻(xiàn)1或非專利文獻(xiàn)1公開了利用密寫技術(shù)(steganographictechnology)將附加信息嵌入編碼代碼的語音編碼方法。例如，從人的聽覺上來說，即使編碼代碼的最低位比特有稍微改變也完全分辨不出來。因此，為在發(fā)送裝置附加新的信息，在聽覺上不會(huì)產(chǎn)生問題的語音數(shù)據(jù)的最低位比特嵌入表示附加信息的比特，并傳輸該數(shù)據(jù)。根據(jù)該技術(shù)，使編碼裝置具有一些擴(kuò)展功能，使有關(guān)該擴(kuò)展功能的信息作為擴(kuò)展碼并嵌入原本的編碼代碼進(jìn)行傳輸，在解碼裝置不會(huì)產(chǎn)生不能解碼的問題。換言之，不用說對(duì)應(yīng)擴(kuò)展功能的解碼裝置，在沒有對(duì)應(yīng)擴(kuò)展功能的解碼裝置也能夠解釋該編碼代碼并生成解碼信號(hào)。
例如，在上述專利文獻(xiàn)1中，作為有關(guān)上述擴(kuò)展功能的信息，嵌入了為適用抑制分組丟失等的音質(zhì)惡化的補(bǔ)償技術(shù)的信息，而在上述的非專利文獻(xiàn)1中，嵌入了用于將窄帶信號(hào)擴(kuò)展為寬帶信號(hào)的信息。
特開2003-316670號(hào)公報(bào)[非專利文獻(xiàn)1]青木著「ステガノグラフイを用いた VoIPにおける音聲の広帶域化に関する一検討」信學(xué)技報(bào)SP2003-72，pp.49-52發(fā)明內(nèi)容發(fā)明需要解決的問題一般說來，在量化像語音信號(hào)那樣時(shí)間上相關(guān)的某一信號(hào)時(shí)，從過去的樣本的振幅值預(yù)測(cè)編碼對(duì)象的樣本的振幅值，使用除去時(shí)間冗長(zhǎng)后進(jìn)行編碼的預(yù)測(cè)編碼較能實(shí)現(xiàn)低比特率化。這里的預(yù)測(cè)具體是指對(duì)過去的樣本的振幅值乘以特定的系數(shù)來估計(jì)編碼對(duì)象的樣本的振幅值。然后，對(duì)從編碼對(duì)象的樣本的振幅值減去預(yù)測(cè)值的殘差進(jìn)行量化的話，與直接對(duì)編碼對(duì)象的樣本的振幅值進(jìn)行量化的情況相比，能夠以較少的代碼量進(jìn)行編碼，能夠?qū)崿F(xiàn)低比特率化。作為與過去的樣本的振幅值相乘的系數(shù)，例如有LPC(Liner PredictiveCoding)系數(shù)。
然而，例如在上述的專利文獻(xiàn)1和非專利文獻(xiàn)1的任何一個(gè)中，所使用的編解碼是ITU-T建議的G.711方案。該G.711方案是直接量化樣本的振幅值的編碼方式，不進(jìn)行上述的預(yù)測(cè)編碼。因此，考慮到密寫技術(shù)和預(yù)測(cè)編碼的組合時(shí)，會(huì)產(chǎn)生以下的問題。
在語音編碼裝置中，預(yù)測(cè)編碼是編碼處理的一環(huán)，在編碼單元內(nèi)部執(zhí)行。并且，對(duì)由編碼單元生成的編碼代碼嵌入擴(kuò)展碼，并從語音編碼裝置輸出。另一方面，在語音解碼裝置中，對(duì)已嵌入擴(kuò)展碼的編碼代碼進(jìn)行預(yù)測(cè)編碼，語音信號(hào)被解碼。換言之，預(yù)測(cè)編碼的對(duì)象在語音編碼裝置中是嵌入擴(kuò)展碼之前的代碼，而在語音解碼裝置中是嵌入擴(kuò)展碼之后的代碼。因此，在語音編碼裝置內(nèi)的預(yù)測(cè)單元的內(nèi)部狀態(tài)與在語音解碼裝置內(nèi)的預(yù)測(cè)單元的內(nèi)部狀態(tài)相背離，對(duì)解碼信號(hào)產(chǎn)生質(zhì)量惡化。這是在組合密寫技術(shù)和預(yù)測(cè)編碼時(shí)產(chǎn)生的特有的問題。
因此，本發(fā)明的目的在于提供一種即使將密寫技術(shù)和預(yù)測(cè)編碼組合應(yīng)用，也不會(huì)產(chǎn)生解碼信號(hào)的質(zhì)量惡化的語音編碼裝置和語音編碼方法。
解決該問題的方案本發(fā)明的語音編碼裝置采用的結(jié)構(gòu)包括編碼單元，通過預(yù)測(cè)編碼由語音信號(hào)生成代碼；嵌入單元，在所述代碼中嵌入附加信息；預(yù)測(cè)解碼單元，進(jìn)行與所述編碼單元的預(yù)測(cè)編碼對(duì)應(yīng)的解碼；以及同步單元，使在所述編碼單元的預(yù)測(cè)編碼中所使用的參數(shù)與在所述預(yù)測(cè)解碼單元的解碼中所使用的參數(shù)同步。
發(fā)明的有益效果根據(jù)本發(fā)明，即使將密寫技術(shù)和預(yù)測(cè)編碼組合應(yīng)用于語音編碼，也能夠防止解碼信號(hào)的質(zhì)量惡化。

圖1是表示實(shí)施方式1的分組發(fā)送裝置的主要結(jié)構(gòu)的方框圖。
圖2是表示實(shí)施方式1的編碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
圖3是表示實(shí)施方式1的比特嵌入單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
圖4是表示從實(shí)施方式1的比特嵌入單元輸入/輸出的信號(hào)的比特結(jié)構(gòu)的一例的圖。
圖5是表示實(shí)施方式1的同步信息生成單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
圖6A是表示實(shí)施方式1的語音解碼裝置的結(jié)構(gòu)例的方框圖。
圖6B是表示實(shí)施方式1的語音解碼裝置的結(jié)構(gòu)例的方框圖。
圖7是表示實(shí)施方式2的編碼單元的主要結(jié)構(gòu)的方框圖。
圖8是表示實(shí)施方式2的同步信息生成單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
圖9是表示實(shí)施方式3的語音編碼裝置的主要結(jié)構(gòu)的方框圖。
圖10是表示實(shí)施方式3的再編碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
圖11是用于說明實(shí)施方式3的量化單元的再?zèng)Q定處理的概要的圖。
圖12是表示使用CELP方式時(shí)的實(shí)施方式3的再編碼單元的結(jié)構(gòu)方框圖。
圖13是表示實(shí)施方式3的語音編碼裝置的變化形式的結(jié)構(gòu)的方框圖。
具體實(shí)施例方式
以下，參照附圖詳細(xì)說明本發(fā)明的實(shí)施方式。
(實(shí)施方式1)圖1是表示裝載了本發(fā)明的實(shí)施方式1的語音編碼裝置100的分組發(fā)送裝置的主要結(jié)構(gòu)的方框圖。
在本實(shí)施方式中，以語音編碼裝置100進(jìn)行基于ADPCM(AdaptiveDifferential Pulse Code Modulation)方式的語音編碼的情況為例進(jìn)行說明。ADPCM方式通過在預(yù)測(cè)單元和自適應(yīng)單元實(shí)現(xiàn)使用后方預(yù)測(cè)的自適應(yīng)化來提高編碼效率。例如，作為ITU-T標(biāo)準(zhǔn)規(guī)格的G.726方式雖然是以ADPCM方式為基礎(chǔ)的語音編碼方法，但能夠以16～40kbit/s編碼窄帶信號(hào)，實(shí)現(xiàn)比不使用預(yù)測(cè)的G.711更低的比特率化。此外，G.722方式也同樣是以ADPCM方式為基礎(chǔ)的編碼方式，能夠以48～64kbit/s的比特率編碼寬帶信號(hào)。
本實(shí)施方式的分組發(fā)送裝置包括A/D變換單元101、編碼單元102、功能擴(kuò)展編碼單元103、比特嵌入單元104、分組單元105、以及同步信息生成單元106，各個(gè)單元進(jìn)行以下的動(dòng)作。
A/D變換單元101將輸入語音信號(hào)數(shù)字化，將數(shù)字語音信號(hào)X輸出到編碼單元102和功能擴(kuò)展編碼單元103。編碼單元102決定編碼代碼I，該編碼代碼I使數(shù)字語音信號(hào)X與在解碼裝置生成的解碼信號(hào)之間的量化失真成為最小或是使從人的聽覺上難以察覺失真，然后輸出到比特嵌入單元104。
另一方面，功能擴(kuò)展編碼單元103生成語音編碼裝置100的功能擴(kuò)展所需的信息的編碼代碼J，并輸出到比特嵌入單元104。作為功能擴(kuò)展，例如將頻帶從窄帶(0.3～3.4kHz頻帶，即一般電話線路所使用的信號(hào)頻帶)擴(kuò)展為寬帶(0.05～7kHz頻帶，通過使用這個(gè)頻帶，與窄帶的情況相比更加自然且明確度變高)，或是在解碼裝置丟失(lost)當(dāng)前幀時(shí)通過利用下一個(gè)幀來進(jìn)行差錯(cuò)補(bǔ)償，并生成能夠?qū)①|(zhì)量惡化抑制到最小限度的補(bǔ)償信息。
比特嵌入單元104在從編碼單元102獲得的編碼代碼I的一部分的比特中嵌入從功能擴(kuò)展編碼單元103獲得的編碼代碼J的信息，將作為其結(jié)果而獲得的編碼代碼I’輸出到分組單元105。分組單元105將編碼代碼I’分組，例如，如果是VoIP的話，將分組通過IP網(wǎng)絡(luò)發(fā)送到通信對(duì)方。同步信息生成單元106基于被嵌入比特后的編碼代碼I’生成后述的同步信息，并輸出到編碼單元102。編碼單元102基于該同步信息更新內(nèi)部狀態(tài)等，進(jìn)行下一個(gè)數(shù)字語音信號(hào)X的編碼。
另外，I和I’的比特率相同。假設(shè)編碼單元102采用G.726方式，將擴(kuò)展碼J嵌入編碼代碼I的LSB(Least Significant Bit；最低位比特)，則能夠以比特率8kbit/s嵌入擴(kuò)展碼J。
將本實(shí)施方式的語音編碼處理的步驟整理如下。
首先，同步信息生成單元106向編碼單元102提供預(yù)測(cè)單元132的內(nèi)部狀態(tài)、預(yù)測(cè)單元132所使用的預(yù)測(cè)系數(shù)、以及在自適應(yīng)單元133使用的一樣本之前的量化碼。然后，在編碼單元102進(jìn)行編碼處理，在功能擴(kuò)展編碼單元103進(jìn)行有關(guān)擴(kuò)展功能的信息的編碼。然后，在比特嵌入單元104生成編碼代碼I’，在將此輸出的同時(shí)提供給同步信息生成單元106。同步信息生成單元106使用編碼代碼I’進(jìn)行預(yù)測(cè)單元132的內(nèi)部狀態(tài)、在預(yù)測(cè)單元132使用的預(yù)測(cè)系數(shù)、以及在自適應(yīng)單元133使用的一樣本之前的量化碼的更新，將該結(jié)果提供給編碼單元102，編碼單元102準(zhǔn)備下一個(gè)輸入數(shù)字信號(hào)X。
圖2是表示編碼單元102內(nèi)部的主要結(jié)構(gòu)的方框圖。
更新單元111由圖1所示的同步信息生成單元106提供同步信息。更新單元111基于該同步信息更新在預(yù)測(cè)單元115使用的預(yù)測(cè)系數(shù)、預(yù)測(cè)單元115的內(nèi)部狀態(tài)、以及在自適應(yīng)單元113使用的一樣本之前的量化碼。編碼單元102的之后的處理是使用經(jīng)過更新的自適應(yīng)單元113以及預(yù)測(cè)單元115進(jìn)行。
數(shù)字語音信號(hào)X被提供給編碼單元102并被輸入到減法單元116。減法單元116從數(shù)字語音信號(hào)X減去預(yù)測(cè)單元115的輸出，將該誤差信號(hào)提供給量化單元112。量化單元112以在自適應(yīng)單元113使用一樣本之前的量化碼決定的量化步長(zhǎng)對(duì)誤差信號(hào)進(jìn)行量化，在輸出該編碼代碼I的同時(shí)提供給自適應(yīng)單元113以及反量化單元114。反量化單元114基于從自適應(yīng)單元113提供的量化步長(zhǎng)對(duì)量化后的誤差信號(hào)進(jìn)行解碼，將該信號(hào)提供給預(yù)測(cè)單元115。自適應(yīng)單元113基于表示一樣本(sample)之前的量化碼的誤差信號(hào)的振幅值，在振幅值大時(shí)擴(kuò)大量化步長(zhǎng)，在振幅值小時(shí)縮小量化步長(zhǎng)。預(yù)測(cè)單元115使用量化后的誤差信號(hào)以及輸入信號(hào)的預(yù)測(cè)值基于下式(1)進(jìn)行預(yù)測(cè)。
y(n)=u(n)-Σi=1La(i)·y(n-i)-Σi=1Mb(i)·u(n-i)···(1)]]>其中，y(n)表示第n樣本的輸入信號(hào)的預(yù)測(cè)值，u(n)表示第n樣本樣本的量化后的誤差信號(hào)，a(i)表示AR預(yù)測(cè)系數(shù)，b(i)表示MA預(yù)測(cè)系數(shù)，L和M分別表示AR預(yù)測(cè)次數(shù)和MA預(yù)測(cè)次數(shù)。然后，a(i)和b(i)通過使用后方預(yù)測(cè)的自適應(yīng)化被逐次更新。
圖3是表示比特嵌入單元104內(nèi)部的主要結(jié)構(gòu)的方框圖。
比特屏蔽單元121將輸入的編碼代碼I的事先決定的比特位置屏蔽，使該位置的比特的值總是為0。嵌入單元122在被屏蔽的編碼代碼的該比特位置嵌入擴(kuò)展碼J的信息，以擴(kuò)展碼J置換該位置的比特的值，并將嵌入后的編碼代碼I’輸出。
圖4是表示從比特嵌入單元104輸入/輸出的信號(hào)的比特結(jié)構(gòu)的一例的圖。另外，MSB是Most Significant Bit(最高位比特)的簡(jiǎn)寫。
這里，以對(duì)4比特的編碼代碼(4字符)I嵌入4比特的擴(kuò)展碼J并作為編碼代碼I’輸出的情況為例進(jìn)行說明。另外，嵌入擴(kuò)展碼的比特位置為L(zhǎng)SB。編碼代碼I在比特屏蔽單元121被施以「Itmp＝I&(OxE)」的處理，成為Itmp。該Itmp在嵌入單元122被施以「I’＝Itmp|J」的處理，成為編碼代碼I’。另外，在這些處理中，「&」表示邏輯“與”，「|」表示邏輯和。在此例中，8kHz樣本數(shù)據(jù)的處理時(shí)，比特率成為32kbit/s，能夠嵌入比特率8kbit/s的附加信息。
另外，這里每一樣本以4比特編碼并將擴(kuò)展碼嵌入LSB的情況為例進(jìn)行說明，但不限于此。例如，如果每隔一樣本嵌入擴(kuò)展碼，能夠嵌入比特率4kbit/s的附加信息。并且，如果在低位2比特嵌入擴(kuò)展碼，附加信息用比特率成為16kbit/s。這樣，能夠以較高的自由度設(shè)定附加信息的比特率。此外，也能夠根據(jù)輸入的語音信號(hào)的性質(zhì)使嵌入比特?cái)?shù)自適應(yīng)地改變。此時(shí)，將嵌入了若干比特的信息另外通知給解碼裝置。
圖5是表示同步信息生成單元106內(nèi)部的主要結(jié)構(gòu)的方框圖。同步信息生成單元106使用作為比特嵌入單元104的輸出的編碼代碼I’如下地進(jìn)行解碼處理。
首先，使用自適應(yīng)單元133提供的量化步長(zhǎng)信息，在反量化單元131解碼量化后的殘差信號(hào)并將其提供給預(yù)測(cè)單元132。在預(yù)測(cè)單元132中，基于上述式(1)，使用量化后的殘差信號(hào)以及預(yù)測(cè)單元132的上一次的處理中輸出的信號(hào)，更新由式(1)表示的內(nèi)部狀態(tài)和預(yù)測(cè)系數(shù)。自適應(yīng)單元133基于誤差信號(hào)的振幅值，在振幅值大時(shí)擴(kuò)大量化步長(zhǎng)，在振幅值小時(shí)縮小量化步長(zhǎng)。在經(jīng)過這一連串的處理之后，提取單元134提取預(yù)測(cè)單元132的內(nèi)部狀態(tài)、在預(yù)測(cè)單元132使用的預(yù)測(cè)系數(shù)、以及在自適應(yīng)單元133使用的一樣本之前的量化碼作為同步信息輸出。
同步信息生成單元106的基本動(dòng)作是，使用編碼代碼I’在語音編碼裝置100內(nèi)模擬地進(jìn)行存在于語音解碼裝置內(nèi)的解碼單元，即與編碼單元102對(duì)應(yīng)的解碼單元的處理，使作為其結(jié)果而獲得的有關(guān)預(yù)測(cè)編碼的參數(shù)(在預(yù)測(cè)單元132使用的預(yù)測(cè)系數(shù)、預(yù)測(cè)單元132的內(nèi)部狀態(tài)、以及在自適應(yīng)單元133使用的一樣本之前的量化碼)反映在編碼單元102的預(yù)測(cè)編碼(自適應(yīng)單元113和預(yù)測(cè)單元115的處理)中。換言之，由于同步信息生成單元106對(duì)編碼單元102內(nèi)的自適應(yīng)單元113以及預(yù)測(cè)單元115通知基于編碼代碼I’生成的有關(guān)預(yù)測(cè)編碼的參數(shù)作為同步信息，能夠使在語音解碼裝置內(nèi)的預(yù)測(cè)單元使用的預(yù)測(cè)系數(shù)、該預(yù)測(cè)單元的內(nèi)部狀態(tài)、以及在語音解碼裝置內(nèi)的自適應(yīng)單元使用的一樣本之前的量化碼與在編碼單元102內(nèi)的預(yù)測(cè)單元115使用的預(yù)測(cè)系數(shù)、預(yù)測(cè)單元115的內(nèi)部狀態(tài)、以及在自適應(yīng)單元113使用的一樣本之前的量化碼同步。換言之，在語音編碼裝置100和與其對(duì)應(yīng)的語音解碼裝置的雙方基于相同的編碼代碼I’求有關(guān)預(yù)測(cè)編碼的參數(shù)。通過采用這樣的結(jié)構(gòu)，能夠防止在語音解碼裝置獲得的解碼信號(hào)的音質(zhì)惡化。
這樣，根據(jù)本實(shí)施方式，由于使用嵌入了擴(kuò)展碼的比特之后的代碼來更新在編碼單元內(nèi)的預(yù)測(cè)單元使用的有關(guān)預(yù)測(cè)編碼的參數(shù)，能夠使在語音編碼裝置內(nèi)的預(yù)測(cè)單元使用的參數(shù)與在語音解碼裝置內(nèi)的預(yù)測(cè)單元使用的參數(shù)同步，從而能夠防止解碼信號(hào)的音質(zhì)惡化。
另外，在上述的結(jié)構(gòu)中，在使用ADPCM方式的編碼方法的情況，比特嵌入單元104在編碼代碼的LSB中嵌入附加信息的一部分或全部。
另外，在本實(shí)施方式中，雖然以在分組發(fā)送裝置安裝語音編碼裝置100的情況為例進(jìn)行了說明，但語音編碼裝置100也可以裝載在非分組通信型的移動(dòng)電話機(jī)上。此時(shí)，由于使用線路交換型的通信網(wǎng)絡(luò)來取代分組通信，設(shè)置復(fù)用單元以取代分組單元105。
另外，與語音編碼裝置100對(duì)應(yīng)的語音解碼裝置，即將從語音編碼裝置100輸出的編碼分組解碼的語音解碼裝置不必對(duì)應(yīng)功能擴(kuò)展。
再有，在對(duì)編碼代碼以外的例如通信系統(tǒng)的控制信息進(jìn)行通信時(shí)(發(fā)信號(hào)時(shí))，通過進(jìn)一步具有對(duì)作為通信對(duì)方的通信終端裝置傳達(dá)嵌入附加信息的位置或嵌入量的功能，能夠獲得下述的效果。
例如，在語音編碼裝置中，也可以判斷通信對(duì)方的通信終端裝置所處的狀況(易于/難于產(chǎn)生傳輸差錯(cuò))，在發(fā)信號(hào)時(shí)決定嵌入位置。由此能夠改善傳輸?shù)目瑰e(cuò)能力。
此外，例如也可以在自身終端設(shè)定擴(kuò)展功能的編碼代碼的大小。由此，自身終端的用戶能夠選擇附加功能的程度。例如，能夠從7kHz、10kHz、15kHz的任意一個(gè)選擇擴(kuò)展頻帶的帶寬。
圖6A和圖6B是表示與語音編碼裝置100對(duì)應(yīng)的語音解碼裝置的結(jié)構(gòu)例的方框圖。圖6A表示不對(duì)應(yīng)功能擴(kuò)展的語音解碼裝置150的例子，圖6B表示對(duì)應(yīng)功能擴(kuò)展的語音解碼裝置160的例子。另外，對(duì)于相同的構(gòu)成要素賦予相同的標(biāo)號(hào)，并省略其說明。
在語音解碼裝置150中，分組分離單元151從接收到的分組分離出編碼代碼I’。解碼單元152進(jìn)行該編碼代碼I’的解碼處理。D/A變換單元153將作為其結(jié)果而獲得的解碼信號(hào)X’變換為模擬信號(hào)，并輸出解碼語音信號(hào)。另一方面，在語音解碼裝置160中，比特提取單元161從分組分離單元151輸出的編碼代碼I’提取擴(kuò)展碼的比特J。功能擴(kuò)展解碼單元162解碼提取出的比特J并獲得有關(guān)擴(kuò)展功能的信息后，輸出到解碼單元163。解碼單元163基于從功能擴(kuò)展解碼單元162輸出的信息一面使用擴(kuò)展功能，一面解碼從比特提取單元161輸出的編碼代碼I’(與從分組分離單元151輸出的編碼代碼相同)。這樣，輸入解碼單元152、163的編碼代碼都是I’，兩者的不同在于是對(duì)編碼代碼I’使用擴(kuò)展功能進(jìn)行解碼，還是不使用擴(kuò)展功能進(jìn)行編碼。此時(shí)，在語音解碼裝置160獲得的語音信號(hào)和在語音解碼裝置150獲得的語音信號(hào)都是在LSB的信息產(chǎn)生傳輸路徑差錯(cuò)的狀態(tài)。因此，雖然該LSB的接收錯(cuò)誤使解碼信號(hào)產(chǎn)生音質(zhì)惡化，但該音質(zhì)惡化的程度小。
(實(shí)施方式2)本發(fā)明的實(shí)施方式2的語音編碼裝置進(jìn)行使用CELP方式的語音編碼。作為CELP的代表例，有G.729和AMR、AMR-WB等。另外，該語音編碼裝置具有與實(shí)施方式1所示的語音編碼裝置100相同的基本結(jié)構(gòu)，因此省略相同部分的說明。
圖7是表示根據(jù)本實(shí)施方式的語音編碼裝置內(nèi)部的編碼單元201的主要結(jié)構(gòu)的方框圖。
自適應(yīng)碼本219和有關(guān)聽覺加權(quán)合成濾波器215的內(nèi)部狀態(tài)的信息被提供給更新單元211。更新單元211基于該信息更新自適應(yīng)碼本219和聽覺加權(quán)合成濾波器215的內(nèi)部狀態(tài)。
輸入編碼單元201的語音信號(hào)在LPC分析單元212求LPC系數(shù)。該LPC系數(shù)提供給聽覺加權(quán)濾波器216和聽覺加權(quán)合成濾波器215用來提高聽覺上的質(zhì)量。并且，LPC系數(shù)還提供給LPC量化單元213，LPC量化單元213將LPC系數(shù)變換為適合于量化的諸如LSP系數(shù)等的參數(shù)，再進(jìn)行量化。由該量化所得的索引被提供給復(fù)用單元225和LPC解碼單元214。LPC解碼單元214根據(jù)編碼代碼計(jì)算出量化后的LSP系數(shù)，并變換成LPC系數(shù)。如此，得到量化后的LPC系數(shù)。這個(gè)量化后的LPC系數(shù)被提供給聽覺加權(quán)合成濾波器215，并用于自適應(yīng)碼本219和噪聲碼本220。
聽覺加權(quán)濾波器216，根據(jù)LPC分析單元212所求得的LPC系數(shù)對(duì)輸入語音信號(hào)進(jìn)行加權(quán)。這是為了調(diào)整頻譜的形狀，使量化失真的頻譜被輸入信號(hào)的頻譜包絡(luò)所屏蔽。
下面，對(duì)自適應(yīng)向量、自適應(yīng)向量增益、噪聲向量、噪聲向量增益的搜索方法給予說明。
自適應(yīng)碼本219，將過去生成的驅(qū)動(dòng)聲源信號(hào)作為內(nèi)部狀態(tài)保持著，能夠以所要求的音調(diào)周期重復(fù)此內(nèi)部狀態(tài)而生成自適應(yīng)向量。音調(diào)周期的優(yōu)選取值范圍為60Hz～400Hz之間。另外，噪聲碼本220將預(yù)先保存在存儲(chǔ)區(qū)域的噪聲向量，或像代數(shù)(algebraic)結(jié)構(gòu)一樣不具有存儲(chǔ)區(qū)域而是依據(jù)規(guī)則生成的向量作為噪聲向量輸出。增益碼本223輸出將與自適應(yīng)向量相乘的自適應(yīng)向量增益以及將與噪聲向量相乘的噪聲向量增益，乘法器221和222將各個(gè)增益乘以各自的向量。
加法器224將被乘以了自適應(yīng)向量增益的自適應(yīng)向量和被乘以了噪聲向量增益的噪聲向量相加而生成驅(qū)動(dòng)聲源信號(hào)，并提供給聽覺加權(quán)合成濾波器215。在聽覺加權(quán)合成濾波器215中，有驅(qū)動(dòng)聲源信號(hào)通過，并生成聽覺加權(quán)合成信號(hào)，提供給減法器217。減法器217從聽覺加權(quán)輸入信號(hào)中減去聽覺加權(quán)合成信號(hào)，并將經(jīng)過減法運(yùn)算的信號(hào)提供給搜索單元218。搜索單元218有效地搜索出由經(jīng)過減法運(yùn)算的信號(hào)所定義的失真為最小的自適應(yīng)向量、自適應(yīng)向量增益、噪聲向量、以及噪聲向量增益的組合，將這些編碼代碼送給復(fù)用單元225。
搜索單元218決定以下面的式(2)或式(3)定義的失真為最小的索引i、j、m或是索引i、j、m、n，并將這些送給復(fù)用單元225。
E=Σk=1NL(t(k)-βm·pi(k)-γmej(k))2···(2)]]>E=Σk=1NL(t(k)-βm·pi(k)-γnej(k))2···(3)]]>其中，t(k)表示聽覺加權(quán)輸入信號(hào)，pi(k)表示使第i個(gè)自適應(yīng)向量通過聽覺加權(quán)合成濾波器而獲得的信號(hào)，ej(k)表示使第j個(gè)噪聲向量通過聽覺加權(quán)合成濾波器而獲得的信號(hào)，β和γ分別表示自適應(yīng)向量增益和噪聲向量增益。增益碼本在式(2)和式(3)的結(jié)構(gòu)不同，在式(2)的情況中，增益碼本被表示為具有自適應(yīng)向量增益βm和噪聲向量增益γm作為元素的向量，用于確定向量的索引m被決定。在式(3)的情況中，增益碼本分別獨(dú)立具有自適應(yīng)向量增益βm和噪聲向量增益γn，各自的索引m和n被獨(dú)立決定。
決定了所有的索引之后，復(fù)用單元225將索引復(fù)用為一而生成編碼代碼并輸出。
圖8是表示本實(shí)施方式的同步信息生成單元206內(nèi)部主要結(jié)構(gòu)的方框圖。
同步信息生成單元206的基本動(dòng)作與在實(shí)施方式1所示的同步信息生成單元106相同。換言之，使用編碼代碼I’在語音編碼裝置內(nèi)模擬地進(jìn)行存在于語音解碼裝置內(nèi)的解碼單元的處理，將作為其結(jié)果而獲得的自適應(yīng)碼本和(聽覺加權(quán))合成濾波器的內(nèi)部狀態(tài)反映在編碼單元201內(nèi)的自適應(yīng)碼本219和聽覺加權(quán)合成濾波器215。由此能夠防止解碼信號(hào)的質(zhì)量惡化。
分離單元231從輸入的編碼代碼I’中分離出編碼代碼，并分別提供給自適應(yīng)碼本233、噪聲碼本234、增益碼本235、以及LPC解碼單元232。LPC解碼單元232利用被提供的編碼代碼解碼LPC系數(shù)，并提供給合成濾波器239。
自適應(yīng)碼本233、噪聲碼本234、以及增益碼本235利用編碼代碼分別解碼自適應(yīng)向量q(k)、噪聲向量c(k)、自適應(yīng)向量增益βq、以及噪聲向量增益γq。乘法器236將自適應(yīng)向量和自適應(yīng)向量增益相乘，乘法器237將噪聲向量和噪聲向量增益相乘，加法器238將乘法運(yùn)算后的信號(hào)相加而生成驅(qū)動(dòng)聲源信號(hào)。將驅(qū)動(dòng)聲源信號(hào)表示為ex(k)，可根據(jù)下面的式(4)求驅(qū)動(dòng)聲源信號(hào)ex(k)。
ex(k)＝βq·q(k)+γq·c(k) …(4)接著，在合成濾波器239利用被解碼的LPC系數(shù)和驅(qū)動(dòng)聲源信號(hào)ex(k)，按照下面的式(5)生成合成信號(hào)syn(k)。
syn(k)=ex(k)+Σi=1NPαq(i)·syn(k-i)···(5)]]>其中，αq(i)表示解碼的LPC系數(shù)，NP表示LPC系數(shù)的次數(shù)。然后，使用驅(qū)動(dòng)聲源信號(hào)ex(k)更新自適應(yīng)碼本233的內(nèi)部狀態(tài)。
在經(jīng)過這一連串的處理之后，提取單元240提取自適應(yīng)碼本233和合成濾波器239的內(nèi)部狀態(tài)并輸出。
如上述，根據(jù)本實(shí)施方式，在使用CELP方式進(jìn)行語音編碼時(shí)，將附加信息的一部分或全部嵌入表示CELP的激勵(lì)聲源的代碼。由此能夠獲得與實(shí)施方式1相同的效果。
然而，這里雖然以使用自適應(yīng)碼本219和聽覺加權(quán)合成濾波器215的內(nèi)部狀態(tài)的情況進(jìn)行說明，在其他的處理，例如對(duì)LPC解碼、噪聲碼本、增益碼本等也使用預(yù)測(cè)時(shí)，對(duì)用于上述預(yù)測(cè)的內(nèi)部狀態(tài)和預(yù)測(cè)系數(shù)也進(jìn)行相同的處理。
(實(shí)施方式3)圖9是表示根據(jù)本發(fā)明的實(shí)施方式3的語音編碼裝置300的主要結(jié)構(gòu)的方框圖。此外，該語音編碼裝置300具有與實(shí)施方式1所示的語音編碼裝置100相同的基本結(jié)構(gòu)。對(duì)相同的構(gòu)成要素賦予相同的標(biāo)號(hào)，并省略其說明。這里，以使用ADPCM方式進(jìn)行語音編碼的情況為例進(jìn)行說明。
本實(shí)施方式的特征在于，在比特嵌入單元104提供的編碼代碼I’中，直接保持相當(dāng)于功能擴(kuò)展編碼單元103的擴(kuò)展碼J的信息，并設(shè)定不變更該信息的限制，在這種限制下，再編碼單元301對(duì)編碼代碼I’再度進(jìn)行編碼處理，決定最終的編碼代碼I”。
輸入數(shù)字信號(hào)X和作為比特嵌入單元104的輸出的編碼代碼I’被提供給再編碼單元301。再編碼單元301將比特嵌入單元104提供的編碼代碼I’再度編碼。但對(duì)于編碼代碼I’中相當(dāng)于擴(kuò)展碼J的信息，將其排除在編碼對(duì)象之外以防止其改變。然后，將獲得的最終的編碼代碼I”輸出。由此，能夠保持功能擴(kuò)展編碼單元103的編碼代碼J的信息，同時(shí)生成最適宜的編碼代碼。再有，通過將此時(shí)在預(yù)測(cè)單元使用的預(yù)測(cè)系數(shù)和預(yù)測(cè)單元的內(nèi)部狀態(tài)以及在自適應(yīng)單元使用的一樣本之前的量化碼提供給編碼單元102，能夠與以編碼代碼I”進(jìn)行解碼處理的語音解碼裝置(未圖示)的預(yù)測(cè)單元使用的預(yù)測(cè)系數(shù)和預(yù)測(cè)單元的內(nèi)部狀態(tài)以及在自適應(yīng)單元使用的一樣本之前的量化碼取得同步，從而能夠防止解碼信號(hào)的音質(zhì)惡化。
圖10是表示上述再編碼單元301內(nèi)部的主要結(jié)構(gòu)的方框圖。此外，除了量化單元311和內(nèi)部狀態(tài)提取單元312之外，再編碼單元301具有與在實(shí)施方式1表示的編碼單元102(參照?qǐng)D2)相同的結(jié)構(gòu)，故省略其說明。
將在比特嵌入單元104生成的編碼代碼I’提供給量化單元311。量化單元311使編碼代碼I’中的被嵌入的功能擴(kuò)展編碼單元103的編碼代碼J的信息維持原樣，并對(duì)其他的編碼代碼進(jìn)行再?zèng)Q定。
圖11是用于說明量化單元311的再?zèng)Q定處理的概要的圖。這里，以下述情況為例進(jìn)行說明，即，功能擴(kuò)展編碼單元103的編碼代碼J為{0，1，1，0}，編碼代碼為4比特，并在其LSB嵌入了編碼代碼J的情況。
此時(shí)，量化單元311變得在LSB被固定在編碼代碼J的狀態(tài)下，進(jìn)行對(duì)目標(biāo)的殘差信號(hào)失真成為最小的量化值的編碼代碼的再?zèng)Q定。因此，功能擴(kuò)展編碼單元103的編碼代碼J為0時(shí)，量化單元311可取的量化值的編碼代碼為0x0，0x2，0x4，0x6，0x8，0xA，0xB，0xC，0xD的8種。并且，在J＝1時(shí)，量化單元311可取的量化值的編碼代碼為0x1，0x3，0x5，0x7，0x9，0xB，0xD，0xF的8種。
如上述，在輸出再?zèng)Q定的編碼代碼I”的同時(shí)，通過內(nèi)部狀態(tài)提取單元312輸出預(yù)測(cè)單元115的內(nèi)部狀態(tài)、在預(yù)測(cè)單元115使用的預(yù)測(cè)系數(shù)、以及在自適應(yīng)單元113使用的一樣本之前的量化碼。將這些信息提供給編碼單元102，并為下一個(gè)輸入X進(jìn)行準(zhǔn)備。
將本實(shí)施方式的編碼處理的步驟整理如下。
首先在編碼單元102進(jìn)行編碼處理，接著在比特嵌入單元104將由功能擴(kuò)展編碼單元103提供的編碼代碼J嵌入由編碼單元102獲得的編碼代碼I，生成編碼代碼I’。將該編碼代碼I’提供給再編碼單元301。再編碼單元301基于保持編碼代碼J的限制而再?zèng)Q定編碼代碼，生成編碼代碼I”。最后，在輸出編碼代碼I”的同時(shí)，將在再編碼單元301內(nèi)的預(yù)測(cè)單元使用的預(yù)測(cè)系數(shù)、該預(yù)測(cè)單元的內(nèi)部狀態(tài)、以及由再編碼單元301內(nèi)的自適應(yīng)單元所使用的一樣本之前的量化碼提供給編碼單元102，并為下一個(gè)輸出X進(jìn)行準(zhǔn)備。
這樣，根據(jù)本實(shí)施方式，能夠在編碼單元的預(yù)測(cè)單元使用的參數(shù)與在解碼單元的預(yù)測(cè)單元使用的參數(shù)之間取得同步，防止音質(zhì)惡化的發(fā)生。再有，由于在基于比特嵌入信息的限制的基礎(chǔ)上再度決定編碼參數(shù)，能夠?qū)⒁虮忍厍度胨鸬膼夯种频阶钚∠薅取?br> 另外，在本實(shí)施方式中，雖然以使用ADPCM方式的語音編碼的情況為例進(jìn)行說明，但也可以是CELP方式。
圖12是表示使用CELP方式的情況的再編碼單元301的結(jié)構(gòu)的方框圖。此外，除了噪聲碼本321和內(nèi)部狀態(tài)提取單元322之外，再編碼單元301具有與在實(shí)施方式2表示的編碼單元201(參照?qǐng)D7)相同的結(jié)構(gòu)，故省略其說明。
將在比特嵌入單元104生成的編碼代碼I’提供給噪聲碼本321。噪聲碼本321使編碼代碼I’中的被嵌入的編碼代碼J的信息維持原樣，并對(duì)其他的編碼代碼進(jìn)行再?zèng)Q定。假設(shè)以8比特表示噪聲碼本321的索引，擴(kuò)展功能編碼單元102的信息{0}被嵌入該LSB時(shí)，在以偶數(shù)表示索引的候選{2n；n＝0～127}中進(jìn)行噪聲碼本321的搜索。噪聲碼本321通過搜索決定其中使失真最小的候選并輸出該索引。同樣地，以8比特表示噪聲碼本321的索引，擴(kuò)展功能編碼單元102的信息{1}被嵌入該LSB時(shí)，在以奇數(shù)表示索引的候選{2n+1；n＝0～127}中進(jìn)行噪聲碼本321的搜索。
再編碼單元301輸出以上述方式再度決定的編碼代碼I”，同時(shí)通過內(nèi)部狀態(tài)提取單元322輸出自適應(yīng)碼本219、聽覺加權(quán)濾波器216、以及聽覺加權(quán)合成濾波器215的內(nèi)部狀態(tài)。將這些信息提供給編碼單元102。
上述說明是將擴(kuò)展功能的信息嵌入在噪聲碼本321的一部分索引中的情況的說明。此時(shí)，再編碼單元301不需要進(jìn)行LPC系數(shù)的計(jì)算以及編碼、自適應(yīng)碼本的搜索。其理由是，需要再編碼的是噪聲碼本，在其前級(jí)處理的部分與在編碼單元102的結(jié)果相同。因此，只要直接利用在編碼單元102獲得的結(jié)果即可。
另外，這里雖然說明了有關(guān)將擴(kuò)展功能的信息嵌入噪聲向量的索引的一部分的情況，但不限于此，也能夠?qū)U(kuò)展功能的信息嵌入在例如LPC系數(shù)、自適應(yīng)碼本、增益碼本的索引中。此時(shí)的動(dòng)作原理與對(duì)上述噪聲碼本321的說明相同，其特征在于，在保持?jǐn)U展功能的信息的限制之下再度決定使失真變得最小時(shí)的索引。
然而，這里雖然以使用自適應(yīng)碼本219和聽覺加權(quán)合成濾波器215的內(nèi)部狀態(tài)的情況進(jìn)行說明，在其他的處理，例如對(duì)LPC解碼、噪聲碼本、增益碼本等也使用預(yù)測(cè)時(shí)，對(duì)用于上述預(yù)測(cè)的內(nèi)部狀態(tài)和預(yù)測(cè)系數(shù)也進(jìn)行相同的處理。
圖13是表示語音編碼裝置300的變化的結(jié)構(gòu)的方框圖。
圖9所示的語音編碼裝置300的結(jié)構(gòu)是，功能擴(kuò)展編碼單元103的處理結(jié)果依賴于編碼單元102的處理結(jié)果而改變。這里，使結(jié)構(gòu)為能夠與編碼單元102的處理結(jié)果獨(dú)立地進(jìn)行功能擴(kuò)展編碼單元103的處理。
上述結(jié)構(gòu)例如可適用于下述情況將輸入語音信號(hào)頻帶分割為兩個(gè)頻帶(例如0-4kHz和4-8kHz)，獨(dú)立地在編碼單元102編碼0-4kHz頻帶并在功能擴(kuò)展編碼單元103編碼4-8kHz頻帶的情況。此時(shí)，功能擴(kuò)展編碼單元103的編碼處理可不依賴于編碼單元102的處理結(jié)果加以實(shí)施。
編碼處理的步驟說明如下首先在功能擴(kuò)展編碼單元103進(jìn)行編碼處理，生成擴(kuò)展碼J。將該擴(kuò)展碼J提供給編碼處理限制單元331。以嵌入擴(kuò)展碼J為前提，將不改變有關(guān)該代碼J的信息的限制信息提供給編碼處理限制單元331。因此，編碼單元102在此限制下進(jìn)行編碼處理，決定最終的編碼代碼I’。根據(jù)這個(gè)結(jié)構(gòu)，變得不需要再編碼單元301，能夠以較少的運(yùn)算量實(shí)現(xiàn)實(shí)施方式3的語音編碼。
以上，對(duì)本發(fā)明的各個(gè)實(shí)施方式進(jìn)行了說明。
本發(fā)明的語音編碼裝置不限于上述實(shí)施方式1～3，可進(jìn)行各種變更加以實(shí)施。
本發(fā)明的語音編碼裝置可以裝載在移動(dòng)通信系統(tǒng)中的通信終端裝置或基站裝置中。據(jù)此，可以提供具有上述作用和效果的通信終端裝置和基站裝置。
再有，這里以用硬件構(gòu)成本發(fā)明的情況為例進(jìn)行了說明，但本發(fā)明也能夠以軟件實(shí)現(xiàn)。比如，通過編程語言記述本發(fā)明的語音編碼方法的算法，并在存儲(chǔ)器中保存該程序并通過信息處理裝置來實(shí)行，從而能夠?qū)崿F(xiàn)與本發(fā)明的語音編碼裝置相同的功能。
再有，上述各實(shí)施方式的說明中的各功能塊可實(shí)現(xiàn)為一般作為集成電路的LSI。這些塊既可是每個(gè)塊分別集成到一個(gè)芯片，或者可以是部分或所有塊集成到一個(gè)芯片。
這里，雖然稱作LSI，但根據(jù)集成度的不同每個(gè)功能塊也可以稱為IC(集成電路)、系統(tǒng)LSI(系統(tǒng)大規(guī)模集成電路)、超LSI(超大規(guī)模集成電路)、極大LSI(極大規(guī)模集成電路)。
另外，實(shí)現(xiàn)集成電路化的方法不僅限于LSI，也可使用專用電路或通用處理器來實(shí)現(xiàn)。制造LSI后，也可以利用能夠編程的FPGA(Field ProgrammableGate Array，現(xiàn)場(chǎng)可編程門陣列)，或可以利用將LSI內(nèi)部的電路塊連接或設(shè)定重新配置的可重配置處理器(Reconfigurable Processor)。
再有，如果隨著半導(dǎo)體技術(shù)的進(jìn)步或者其他技術(shù)的派生，出現(xiàn)了替換LSI集成電路的技術(shù)，當(dāng)然，也可以利用該技術(shù)來實(shí)現(xiàn)功能塊的集成化。并且存在著適用生物技術(shù)的可能性。
本說明書基于2004年7月20日申請(qǐng)的日本專利申請(qǐng)?zhí)卦傅?004-211589號(hào)。該全部?jī)?nèi)容包含于此。
工業(yè)實(shí)用性本發(fā)明的語音編碼裝置和語音編碼方法適合于VoIP網(wǎng)絡(luò)、移動(dòng)電話網(wǎng)等用途。
權(quán)利要求
1.一種語音編碼裝置，包括編碼單元，通過預(yù)測(cè)編碼而由語音信號(hào)生成代碼；嵌入單元，將附加信息嵌入在所述代碼中；預(yù)測(cè)解碼單元，使用被嵌入了所述附加信息的代碼進(jìn)行與所述編碼單元的預(yù)測(cè)編碼對(duì)應(yīng)的解碼；以及同步單元，使在所述編碼單元的預(yù)測(cè)編碼中所使用的參數(shù)與在所述預(yù)測(cè)解碼單元的解碼中所使用的參數(shù)同步。
2.如權(quán)利要求1所述的語音編碼裝置，其中所述編碼單元使用ADPCM(Adaptive Differential Pulse Code Modulation)方式生成所述代碼，所述嵌入單元將所述附加信息嵌入在所述代碼的LSB(Least SignificantBit)中。
3.如權(quán)利要求1所述語音編碼裝置，其中所述編碼單元通過CELP方式生成所述代碼，所述嵌入單元將所述附加信息嵌入在所述代碼內(nèi)表示CELP方式的激勵(lì)聲源的代碼中。
4.如權(quán)利要求1所述的語音編碼裝置，其中所述嵌入單元根據(jù)所述語音信號(hào)的性質(zhì)使嵌入的所述附加信息的比特?cái)?shù)改變，并將該比特?cái)?shù)通知給語音解碼裝置。
5.如權(quán)利要求1所述的語音編碼裝置，其中還包括指定單元，從預(yù)定的選項(xiàng)中指定所述附加信息的比特?cái)?shù)。
6.一種通信終端裝置，包括如權(quán)利要求1所述的語音編碼裝置。
7.如權(quán)利要求6所述的通信終端裝置，其中還包括發(fā)送單元，信號(hào)傳輸所述嵌入單元嵌入附加信息的位置以及所述附加信息的比特?cái)?shù)。
8.如權(quán)利要求7所述的通信終端裝置，其中所述嵌入單元根據(jù)通信對(duì)方的通信終端裝置的接收狀況來決定用于嵌入所述附加信息的位置。
9.一種基站裝置，包括如權(quán)利要求1所述的語音編碼裝置。
10.如權(quán)利要求9的基站裝置，還包括發(fā)送單元，信號(hào)傳輸所述嵌入單元嵌入附加信息的位置以及所述附加信息的比特?cái)?shù)。
11.如權(quán)利要求10所述的基站裝置，其中所述嵌入單元根據(jù)通信對(duì)方的通信終端裝置的接收狀況來決定用于嵌入所述附加信息的位置。
12.一種語音編碼方法，包括編碼步驟，通過預(yù)測(cè)編碼由語音信號(hào)生成代碼；嵌入步驟，將附加信息嵌入在所述代碼中；預(yù)測(cè)解碼步驟，使用被嵌入了所述附加信息的代碼，進(jìn)行與所述編碼步驟的預(yù)測(cè)編碼對(duì)應(yīng)的解碼；以及同步步驟，使在所述編碼步驟的預(yù)測(cè)編碼中所使用的參數(shù)與在所述預(yù)測(cè)解碼步驟的解碼中所使用的參數(shù)同步。
全文摘要
公開了即使將密寫技術(shù)和預(yù)測(cè)編碼組合應(yīng)用于語音編碼，也能夠不產(chǎn)生解碼信號(hào)的質(zhì)量惡化的語音編碼裝置。在該裝置中，編碼單元(102)將編碼代碼(I)輸出到比特嵌入單元(104)。功能擴(kuò)展編碼單元(103)生成語音編碼裝置(100)的功能擴(kuò)展所需的信息的編碼代碼(J)，并輸出到比特嵌入單元(104)。比特嵌入單元(104)將編碼代碼(J)的信息嵌入在編碼代碼(I)的一部分的比特中，并輸出所獲得的編碼代碼I’。同步信息生成單元(106)基于被嵌入了比特后的編碼代碼I’生成同步信息，并輸出到編碼單元(102)。編碼單元(102)基于該同步信息更新內(nèi)部狀態(tài)等，進(jìn)行下一個(gè)數(shù)字語音信號(hào)(X)的編碼。
文檔編號(hào)G10L19/04GK1989546SQ20058002462
公開日2007年6月27日申請(qǐng)日期2005年7月14日優(yōu)先權(quán)日2004年7月20日
發(fā)明者押切正浩申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載