国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      語音編碼裝置和語音編碼方法

      文檔序號(hào):2829178閱讀:229來源:國(guó)知局
      專利名稱:語音編碼裝置和語音編碼方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及語音編碼裝置及語音編碼方法。
      背景技術(shù)
      用低比特率壓縮語音信號(hào)或音頻信號(hào)的語音編碼技術(shù),對(duì)于有效利用通信系統(tǒng)的傳輸路徑容量來說非常重要。作為語音編碼技術(shù)的主要應(yīng)用環(huán)境,近年來以VoIP(Voice over IP)網(wǎng)絡(luò)、移動(dòng)電話網(wǎng)等為代表的通信系統(tǒng)備受矚目。VoIP是利用使用了IP(Internet Protocol)的分組通信網(wǎng),將語音信號(hào)的編碼代碼存儲(chǔ)在分組中,并與通信對(duì)方進(jìn)行分組交換的語音通信技術(shù)。
      但是,為在語音通信系統(tǒng)中和通信對(duì)方進(jìn)行語音通信,必須在本身持有的通信終端裝置對(duì)通信對(duì)方持有的通信終端裝置生成的編碼代碼進(jìn)行正確的解釋和解碼處理。因此,一旦決定了語音通信系統(tǒng)的編解碼的規(guī)格后,要改變?cè)撘?guī)格并不容易。這是因?yàn)槿绻淖兙幗獯a的規(guī)格,就必須改變編碼裝置和解碼裝置雙方的功能。因此,在考慮使編碼裝置具有一些新的擴(kuò)展功能,并將有關(guān)該擴(kuò)展功能的信息一起發(fā)送時(shí),因?yàn)橐脖仨殞?duì)語音通信系統(tǒng)的編解碼的規(guī)格本身進(jìn)行修改,而導(dǎo)致成本的大幅增加。
      專利文獻(xiàn)1或非專利文獻(xiàn)1公開了利用密寫技術(shù)(steganographictechnology)將附加信息嵌入編碼代碼的語音編碼方法。例如,從人的聽覺上來說,即使編碼代碼的最低位比特有稍微改變也完全分辨不出來。因此,為在發(fā)送裝置附加新的信息,在聽覺上不會(huì)產(chǎn)生問題的語音數(shù)據(jù)的最低位比特嵌入表示附加信息的比特,并傳輸該數(shù)據(jù)。根據(jù)該技術(shù),使編碼裝置具有一些擴(kuò)展功能,使有關(guān)該擴(kuò)展功能的信息作為擴(kuò)展碼并嵌入原本的編碼代碼進(jìn)行傳輸,在解碼裝置不會(huì)產(chǎn)生不能解碼的問題。換言之,不用說對(duì)應(yīng)擴(kuò)展功能的解碼裝置,在沒有對(duì)應(yīng)擴(kuò)展功能的解碼裝置也能夠解釋該編碼代碼并生成解碼信號(hào)。
      例如,在上述專利文獻(xiàn)1中,作為有關(guān)上述擴(kuò)展功能的信息,嵌入了為適用抑制分組丟失等的音質(zhì)惡化的補(bǔ)償技術(shù)的信息,而在上述的非專利文獻(xiàn)1中,嵌入了用于將窄帶信號(hào)擴(kuò)展為寬帶信號(hào)的信息。
      特開2003-316670號(hào)公報(bào)[非專利文獻(xiàn)1]青木著「ステガノグラフイを用いた VoIPにおける音聲の広帶域化に関する一検討」信學(xué)技報(bào)SP2003-72,pp.49-52發(fā)明內(nèi)容發(fā)明需要解決的問題一般說來,在量化像語音信號(hào)那樣時(shí)間上相關(guān)的某一信號(hào)時(shí),從過去的樣本的振幅值預(yù)測(cè)編碼對(duì)象的樣本的振幅值,使用除去時(shí)間冗長(zhǎng)后進(jìn)行編碼的預(yù)測(cè)編碼較能實(shí)現(xiàn)低比特率化。這里的預(yù)測(cè)具體是指對(duì)過去的樣本的振幅值乘以特定的系數(shù)來估計(jì)編碼對(duì)象的樣本的振幅值。然后,對(duì)從編碼對(duì)象的樣本的振幅值減去預(yù)測(cè)值的殘差進(jìn)行量化的話,與直接對(duì)編碼對(duì)象的樣本的振幅值進(jìn)行量化的情況相比,能夠以較少的代碼量進(jìn)行編碼,能夠?qū)崿F(xiàn)低比特率化。作為與過去的樣本的振幅值相乘的系數(shù),例如有LPC(Liner PredictiveCoding)系數(shù)。
      然而,例如在上述的專利文獻(xiàn)1和非專利文獻(xiàn)1的任何一個(gè)中,所使用的編解碼是ITU-T建議的G.711方案。該G.711方案是直接量化樣本的振幅值的編碼方式,不進(jìn)行上述的預(yù)測(cè)編碼。因此,考慮到密寫技術(shù)和預(yù)測(cè)編碼的組合時(shí),會(huì)產(chǎn)生以下的問題。
      在語音編碼裝置中,預(yù)測(cè)編碼是編碼處理的一環(huán),在編碼單元內(nèi)部執(zhí)行。并且,對(duì)由編碼單元生成的編碼代碼嵌入擴(kuò)展碼,并從語音編碼裝置輸出。另一方面,在語音解碼裝置中,對(duì)已嵌入擴(kuò)展碼的編碼代碼進(jìn)行預(yù)測(cè)編碼,語音信號(hào)被解碼。換言之,預(yù)測(cè)編碼的對(duì)象在語音編碼裝置中是嵌入擴(kuò)展碼之前的代碼,而在語音解碼裝置中是嵌入擴(kuò)展碼之后的代碼。因此,在語音編碼裝置內(nèi)的預(yù)測(cè)單元的內(nèi)部狀態(tài)與在語音解碼裝置內(nèi)的預(yù)測(cè)單元的內(nèi)部狀態(tài)相背離,對(duì)解碼信號(hào)產(chǎn)生質(zhì)量惡化。這是在組合密寫技術(shù)和預(yù)測(cè)編碼時(shí)產(chǎn)生的特有的問題。
      因此,本發(fā)明的目的在于提供一種即使將密寫技術(shù)和預(yù)測(cè)編碼組合應(yīng)用,也不會(huì)產(chǎn)生解碼信號(hào)的質(zhì)量惡化的語音編碼裝置和語音編碼方法。
      解決該問題的方案本發(fā)明的語音編碼裝置采用的結(jié)構(gòu)包括編碼單元,通過預(yù)測(cè)編碼由語音信號(hào)生成代碼;嵌入單元,在所述代碼中嵌入附加信息;預(yù)測(cè)解碼單元,進(jìn)行與所述編碼單元的預(yù)測(cè)編碼對(duì)應(yīng)的解碼;以及同步單元,使在所述編碼單元的預(yù)測(cè)編碼中所使用的參數(shù)與在所述預(yù)測(cè)解碼單元的解碼中所使用的參數(shù)同步。
      發(fā)明的有益效果根據(jù)本發(fā)明,即使將密寫技術(shù)和預(yù)測(cè)編碼組合應(yīng)用于語音編碼,也能夠防止解碼信號(hào)的質(zhì)量惡化。


      圖1是表示實(shí)施方式1的分組發(fā)送裝置的主要結(jié)構(gòu)的方框圖。
      圖2是表示實(shí)施方式1的編碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
      圖3是表示實(shí)施方式1的比特嵌入單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
      圖4是表示從實(shí)施方式1的比特嵌入單元輸入/輸出的信號(hào)的比特結(jié)構(gòu)的一例的圖。
      圖5是表示實(shí)施方式1的同步信息生成單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
      圖6A是表示實(shí)施方式1的語音解碼裝置的結(jié)構(gòu)例的方框圖。
      圖6B是表示實(shí)施方式1的語音解碼裝置的結(jié)構(gòu)例的方框圖。
      圖7是表示實(shí)施方式2的編碼單元的主要結(jié)構(gòu)的方框圖。
      圖8是表示實(shí)施方式2的同步信息生成單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
      圖9是表示實(shí)施方式3的語音編碼裝置的主要結(jié)構(gòu)的方框圖。
      圖10是表示實(shí)施方式3的再編碼單元內(nèi)部的主要結(jié)構(gòu)的方框圖。
      圖11是用于說明實(shí)施方式3的量化單元的再?zèng)Q定處理的概要的圖。
      圖12是表示使用CELP方式時(shí)的實(shí)施方式3的再編碼單元的結(jié)構(gòu)方框圖。
      圖13是表示實(shí)施方式3的語音編碼裝置的變化形式的結(jié)構(gòu)的方框圖。
      具體實(shí)施例方式
      以下,參照附圖詳細(xì)說明本發(fā)明的實(shí)施方式。
      (實(shí)施方式1)圖1是表示裝載了本發(fā)明的實(shí)施方式1的語音編碼裝置100的分組發(fā)送裝置的主要結(jié)構(gòu)的方框圖。
      在本實(shí)施方式中,以語音編碼裝置100進(jìn)行基于ADPCM(AdaptiveDifferential Pulse Code Modulation)方式的語音編碼的情況為例進(jìn)行說明。ADPCM方式通過在預(yù)測(cè)單元和自適應(yīng)單元實(shí)現(xiàn)使用后方預(yù)測(cè)的自適應(yīng)化來提高編碼效率。例如,作為ITU-T標(biāo)準(zhǔn)規(guī)格的G.726方式雖然是以ADPCM方式為基礎(chǔ)的語音編碼方法,但能夠以16~40kbit/s編碼窄帶信號(hào),實(shí)現(xiàn)比不使用預(yù)測(cè)的G.711更低的比特率化。此外,G.722方式也同樣是以ADPCM方式為基礎(chǔ)的編碼方式,能夠以48~64kbit/s的比特率編碼寬帶信號(hào)。
      本實(shí)施方式的分組發(fā)送裝置包括A/D變換單元101、編碼單元102、功能擴(kuò)展編碼單元103、比特嵌入單元104、分組單元105、以及同步信息生成單元106,各個(gè)單元進(jìn)行以下的動(dòng)作。
      A/D變換單元101將輸入語音信號(hào)數(shù)字化,將數(shù)字語音信號(hào)X輸出到編碼單元102和功能擴(kuò)展編碼單元103。編碼單元102決定編碼代碼I,該編碼代碼I使數(shù)字語音信號(hào)X與在解碼裝置生成的解碼信號(hào)之間的量化失真成為最小或是使從人的聽覺上難以察覺失真,然后輸出到比特嵌入單元104。
      另一方面,功能擴(kuò)展編碼單元103生成語音編碼裝置100的功能擴(kuò)展所需的信息的編碼代碼J,并輸出到比特嵌入單元104。作為功能擴(kuò)展,例如將頻帶從窄帶(0.3~3.4kHz頻帶,即一般電話線路所使用的信號(hào)頻帶)擴(kuò)展為寬帶(0.05~7kHz頻帶,通過使用這個(gè)頻帶,與窄帶的情況相比更加自然且明確度變高),或是在解碼裝置丟失(lost)當(dāng)前幀時(shí)通過利用下一個(gè)幀來進(jìn)行差錯(cuò)補(bǔ)償,并生成能夠?qū)①|(zhì)量惡化抑制到最小限度的補(bǔ)償信息。
      比特嵌入單元104在從編碼單元102獲得的編碼代碼I的一部分的比特中嵌入從功能擴(kuò)展編碼單元103獲得的編碼代碼J的信息,將作為其結(jié)果而獲得的編碼代碼I’輸出到分組單元105。分組單元105將編碼代碼I’分組,例如,如果是VoIP的話,將分組通過IP網(wǎng)絡(luò)發(fā)送到通信對(duì)方。同步信息生成單元106基于被嵌入比特后的編碼代碼I’生成后述的同步信息,并輸出到編碼單元102。編碼單元102基于該同步信息更新內(nèi)部狀態(tài)等,進(jìn)行下一個(gè)數(shù)字語音信號(hào)X的編碼。
      另外,I和I’的比特率相同。假設(shè)編碼單元102采用G.726方式,將擴(kuò)展碼J嵌入編碼代碼I的LSB(Least Significant Bit;最低位比特),則能夠以比特率8kbit/s嵌入擴(kuò)展碼J。
      將本實(shí)施方式的語音編碼處理的步驟整理如下。
      首先,同步信息生成單元106向編碼單元102提供預(yù)測(cè)單元132的內(nèi)部狀態(tài)、預(yù)測(cè)單元132所使用的預(yù)測(cè)系數(shù)、以及在自適應(yīng)單元133使用的一樣本之前的量化碼。然后,在編碼單元102進(jìn)行編碼處理,在功能擴(kuò)展編碼單元103進(jìn)行有關(guān)擴(kuò)展功能的信息的編碼。然后,在比特嵌入單元104生成編碼代碼I’,在將此輸出的同時(shí)提供給同步信息生成單元106。同步信息生成單元106使用編碼代碼I’進(jìn)行預(yù)測(cè)單元132的內(nèi)部狀態(tài)、在預(yù)測(cè)單元132使用的預(yù)測(cè)系數(shù)、以及在自適應(yīng)單元133使用的一樣本之前的量化碼的更新,將該結(jié)果提供給編碼單元102,編碼單元102準(zhǔn)備下一個(gè)輸入數(shù)字信號(hào)X。
      圖2是表示編碼單元102內(nèi)部的主要結(jié)構(gòu)的方框圖。
      更新單元111由圖1所示的同步信息生成單元106提供同步信息。更新單元111基于該同步信息更新在預(yù)測(cè)單元115使用的預(yù)測(cè)系數(shù)、預(yù)測(cè)單元115的內(nèi)部狀態(tài)、以及在自適應(yīng)單元113使用的一樣本之前的量化碼。編碼單元102的之后的處理是使用經(jīng)過更新的自適應(yīng)單元113以及預(yù)測(cè)單元115進(jìn)行。
      數(shù)字語音信號(hào)X被提供給編碼單元102并被輸入到減法單元116。減法單元116從數(shù)字語音信號(hào)X減去預(yù)測(cè)單元115的輸出,將該誤差信號(hào)提供給量化單元112。量化單元112以在自適應(yīng)單元113使用一樣本之前的量化碼決定的量化步長(zhǎng)對(duì)誤差信號(hào)進(jìn)行量化,在輸出該編碼代碼I的同時(shí)提供給自適應(yīng)單元113以及反量化單元114。反量化單元114基于從自適應(yīng)單元113提供的量化步長(zhǎng)對(duì)量化后的誤差信號(hào)進(jìn)行解碼,將該信號(hào)提供給預(yù)測(cè)單元115。自適應(yīng)單元113基于表示一樣本(sample)之前的量化碼的誤差信號(hào)的振幅值,在振幅值大時(shí)擴(kuò)大量化步長(zhǎng),在振幅值小時(shí)縮小量化步長(zhǎng)。預(yù)測(cè)單元115使用量化后的誤差信號(hào)以及輸入信號(hào)的預(yù)測(cè)值基于下式(1)進(jìn)行預(yù)測(cè)。
      y(n)=u(n)-&Sigma;i=1La(i)&CenterDot;y(n-i)-&Sigma;i=1Mb(i)&CenterDot;u(n-i)&CenterDot;&CenterDot;&CenterDot;(1)]]>其中,y(n)表示第n樣本的輸入信號(hào)的預(yù)測(cè)值,u(n)表示第n樣本樣本的量化后的誤差信號(hào),a(i)表示AR預(yù)測(cè)系數(shù),b(i)表示MA預(yù)測(cè)系數(shù),L和M分別表示AR預(yù)測(cè)次數(shù)和MA預(yù)測(cè)次數(shù)。然后,a(i)和b(i)通過使用后方預(yù)測(cè)的自適應(yīng)化被逐次更新。
      圖3是表示比特嵌入單元104內(nèi)部的主要結(jié)構(gòu)的方框圖。
      比特屏蔽單元121將輸入的編碼代碼I的事先決定的比特位置屏蔽,使該位置的比特的值總是為0。嵌入單元122在被屏蔽的編碼代碼的該比特位置嵌入擴(kuò)展碼J的信息,以擴(kuò)展碼J置換該位置的比特的值,并將嵌入后的編碼代碼I’輸出。
      圖4是表示從比特嵌入單元104輸入/輸出的信號(hào)的比特結(jié)構(gòu)的一例的圖。另外,MSB是Most Significant Bit(最高位比特)的簡(jiǎn)寫。
      這里,以對(duì)4比特的編碼代碼(4字符)I嵌入4比特的擴(kuò)展碼J并作為編碼代碼I’輸出的情況為例進(jìn)行說明。另外,嵌入擴(kuò)展碼的比特位置為L(zhǎng)SB。編碼代碼I在比特屏蔽單元121被施以「Itmp=I&amp;(OxE)」的處理,成為Itmp。該Itmp在嵌入單元122被施以「I’=Itmp|J」的處理,成為編碼代碼I’。另外,在這些處理中,「&amp;」表示邏輯“與”,「|」表示邏輯和。在此例中,8kHz樣本數(shù)據(jù)的處理時(shí),比特率成為32kbit/s,能夠嵌入比特率8kbit/s的附加信息。
      另外,這里每一樣本以4比特編碼并將擴(kuò)展碼嵌入LSB的情況為例進(jìn)行說明,但不限于此。例如,如果每隔一樣本嵌入擴(kuò)展碼,能夠嵌入比特率4kbit/s的附加信息。并且,如果在低位2比特嵌入擴(kuò)展碼,附加信息用比特率成為16kbit/s。這樣,能夠以較高的自由度設(shè)定附加信息的比特率。此外,也能夠根據(jù)輸入的語音信號(hào)的性質(zhì)使嵌入比特?cái)?shù)自適應(yīng)地改變。此時(shí),將嵌入了若干比特的信息另外通知給解碼裝置。
      圖5是表示同步信息生成單元106內(nèi)部的主要結(jié)構(gòu)的方框圖。同步信息生成單元106使用作為比特嵌入單元104的輸出的編碼代碼I’如下地進(jìn)行解碼處理。
      首先,使用自適應(yīng)單元133提供的量化步長(zhǎng)信息,在反量化單元131解碼量化后的殘差信號(hào)并將其提供給預(yù)測(cè)單元132。在預(yù)測(cè)單元132中,基于上述式(1),使用量化后的殘差信號(hào)以及預(yù)測(cè)單元132的上一次的處理中輸出的信號(hào),更新由式(1)表示的內(nèi)部狀態(tài)和預(yù)測(cè)系數(shù)。自適應(yīng)單元133基于誤差信號(hào)的振幅值,在振幅值大時(shí)擴(kuò)大量化步長(zhǎng),在振幅值小時(shí)縮小量化步長(zhǎng)。在經(jīng)過這一連串的處理之后,提取單元134提取預(yù)測(cè)單元132的內(nèi)部狀態(tài)、在預(yù)測(cè)單元132使用的預(yù)測(cè)系數(shù)、以及在自適應(yīng)單元133使用的一樣本之前的量化碼作為同步信息輸出。
      同步信息生成單元106的基本動(dòng)作是,使用編碼代碼I’在語音編碼裝置100內(nèi)模擬地進(jìn)行存在于語音解碼裝置內(nèi)的解碼單元,即與編碼單元102對(duì)應(yīng)的解碼單元的處理,使作為其結(jié)果而獲得的有關(guān)預(yù)測(cè)編碼的參數(shù)(在預(yù)測(cè)單元132使用的預(yù)測(cè)系數(shù)、預(yù)測(cè)單元132的內(nèi)部狀態(tài)、以及在自適應(yīng)單元133使用的一樣本之前的量化碼)反映在編碼單元102的預(yù)測(cè)編碼(自適應(yīng)單元113和預(yù)測(cè)單元115的處理)中。換言之,由于同步信息生成單元106對(duì)編碼單元102內(nèi)的自適應(yīng)單元113以及預(yù)測(cè)單元115通知基于編碼代碼I’生成的有關(guān)預(yù)測(cè)編碼的參數(shù)作為同步信息,能夠使在語音解碼裝置內(nèi)的預(yù)測(cè)單元使用的預(yù)測(cè)系數(shù)、該預(yù)測(cè)單元的內(nèi)部狀態(tài)、以及在語音解碼裝置內(nèi)的自適應(yīng)單元使用的一樣本之前的量化碼與在編碼單元102內(nèi)的預(yù)測(cè)單元115使用的預(yù)測(cè)系數(shù)、預(yù)測(cè)單元115的內(nèi)部狀態(tài)、以及在自適應(yīng)單元113使用的一樣本之前的量化碼同步。換言之,在語音編碼裝置100和與其對(duì)應(yīng)的語音解碼裝置的雙方基于相同的編碼代碼I’求有關(guān)預(yù)測(cè)編碼的參數(shù)。通過采用這樣的結(jié)構(gòu),能夠防止在語音解碼裝置獲得的解碼信號(hào)的音質(zhì)惡化。
      這樣,根據(jù)本實(shí)施方式,由于使用嵌入了擴(kuò)展碼的比特之后的代碼來更新在編碼單元內(nèi)的預(yù)測(cè)單元使用的有關(guān)預(yù)測(cè)編碼的參數(shù),能夠使在語音編碼裝置內(nèi)的預(yù)測(cè)單元使用的參數(shù)與在語音解碼裝置內(nèi)的預(yù)測(cè)單元使用的參數(shù)同步,從而能夠防止解碼信號(hào)的音質(zhì)惡化。
      另外,在上述的結(jié)構(gòu)中,在使用ADPCM方式的編碼方法的情況,比特嵌入單元104在編碼代碼的LSB中嵌入附加信息的一部分或全部。
      另外,在本實(shí)施方式中,雖然以在分組發(fā)送裝置安裝語音編碼裝置100的情況為例進(jìn)行了說明,但語音編碼裝置100也可以裝載在非分組通信型的移動(dòng)電話機(jī)上。此時(shí),由于使用線路交換型的通信網(wǎng)絡(luò)來取代分組通信,設(shè)置復(fù)用單元以取代分組單元105。
      另外,與語音編碼裝置100對(duì)應(yīng)的語音解碼裝置,即將從語音編碼裝置100輸出的編碼分組解碼的語音解碼裝置不必對(duì)應(yīng)功能擴(kuò)展。
      再有,在對(duì)編碼代碼以外的例如通信系統(tǒng)的控制信息進(jìn)行通信時(shí)(發(fā)信號(hào)時(shí)),通過進(jìn)一步具有對(duì)作為通信對(duì)方的通信終端裝置傳達(dá)嵌入附加信息的位置或嵌入量的功能,能夠獲得下述的效果。
      例如,在語音編碼裝置中,也可以判斷通信對(duì)方的通信終端裝置所處的狀況(易于/難于產(chǎn)生傳輸差錯(cuò)),在發(fā)信號(hào)時(shí)決定嵌入位置。由此能夠改善傳輸?shù)目瑰e(cuò)能力。
      此外,例如也可以在自身終端設(shè)定擴(kuò)展功能的編碼代碼的大小。由此,自身終端的用戶能夠選擇附加功能的程度。例如,能夠從7kHz、10kHz、15kHz的任意一個(gè)選擇擴(kuò)展頻帶的帶寬。
      圖6A和圖6B是表示與語音編碼裝置100對(duì)應(yīng)的語音解碼裝置的結(jié)構(gòu)例的方框圖。圖6A表示不對(duì)應(yīng)功能擴(kuò)展的語音解碼裝置150的例子,圖6B表示對(duì)應(yīng)功能擴(kuò)展的語音解碼裝置160的例子。另外,對(duì)于相同的構(gòu)成要素賦予相同的標(biāo)號(hào),并省略其說明。
      在語音解碼裝置150中,分組分離單元151從接收到的分組分離出編碼代碼I’。解碼單元152進(jìn)行該編碼代碼I’的解碼處理。D/A變換單元153將作為其結(jié)果而獲得的解碼信號(hào)X’變換為模擬信號(hào),并輸出解碼語音信號(hào)。另一方面,在語音解碼裝置160中,比特提取單元161從分組分離單元151輸出的編碼代碼I’提取擴(kuò)展碼的比特J。功能擴(kuò)展解碼單元162解碼提取出的比特J并獲得有關(guān)擴(kuò)展功能的信息后,輸出到解碼單元163。解碼單元163基于從功能擴(kuò)展解碼單元162輸出的信息一面使用擴(kuò)展功能,一面解碼從比特提取單元161輸出的編碼代碼I’(與從分組分離單元151輸出的編碼代碼相同)。這樣,輸入解碼單元152、163的編碼代碼都是I’,兩者的不同在于是對(duì)編碼代碼I’使用擴(kuò)展功能進(jìn)行解碼,還是不使用擴(kuò)展功能進(jìn)行編碼。此時(shí),在語音解碼裝置160獲得的語音信號(hào)和在語音解碼裝置150獲得的語音信號(hào)都是在LSB的信息產(chǎn)生傳輸路徑差錯(cuò)的狀態(tài)。因此,雖然該LSB的接收錯(cuò)誤使解碼信號(hào)產(chǎn)生音質(zhì)惡化,但該音質(zhì)惡化的程度小。
      (實(shí)施方式2)本發(fā)明的實(shí)施方式2的語音編碼裝置進(jìn)行使用CELP方式的語音編碼。作為CELP的代表例,有G.729和AMR、AMR-WB等。另外,該語音編碼裝置具有與實(shí)施方式1所示的語音編碼裝置100相同的基本結(jié)構(gòu),因此省略相同部分的說明。
      圖7是表示根據(jù)本實(shí)施方式的語音編碼裝置內(nèi)部的編碼單元201的主要結(jié)構(gòu)的方框圖。
      自適應(yīng)碼本219和有關(guān)聽覺加權(quán)合成濾波器215的內(nèi)部狀態(tài)的信息被提供給更新單元211。更新單元211基于該信息更新自適應(yīng)碼本219和聽覺加權(quán)合成濾波器215的內(nèi)部狀態(tài)。
      輸入編碼單元201的語音信號(hào)在LPC分析單元212求LPC系數(shù)。該LPC系數(shù)提供給聽覺加權(quán)濾波器216和聽覺加權(quán)合成濾波器215用來提高聽覺上的質(zhì)量。并且,LPC系數(shù)還提供給LPC量化單元213,LPC量化單元213將LPC系數(shù)變換為適合于量化的諸如LSP系數(shù)等的參數(shù),再進(jìn)行量化。由該量化所得的索引被提供給復(fù)用單元225和LPC解碼單元214。LPC解碼單元214根據(jù)編碼代碼計(jì)算出量化后的LSP系數(shù),并變換成LPC系數(shù)。如此,得到量化后的LPC系數(shù)。這個(gè)量化后的LPC系數(shù)被提供給聽覺加權(quán)合成濾波器215,并用于自適應(yīng)碼本219和噪聲碼本220。
      聽覺加權(quán)濾波器216,根據(jù)LPC分析單元212所求得的LPC系數(shù)對(duì)輸入語音信號(hào)進(jìn)行加權(quán)。這是為了調(diào)整頻譜的形狀,使量化失真的頻譜被輸入信號(hào)的頻譜包絡(luò)所屏蔽。
      下面,對(duì)自適應(yīng)向量、自適應(yīng)向量增益、噪聲向量、噪聲向量增益的搜索方法給予說明。
      自適應(yīng)碼本219,將過去生成的驅(qū)動(dòng)聲源信號(hào)作為內(nèi)部狀態(tài)保持著,能夠以所要求的音調(diào)周期重復(fù)此內(nèi)部狀態(tài)而生成自適應(yīng)向量。音調(diào)周期的優(yōu)選取值范圍為60Hz~400Hz之間。另外,噪聲碼本220將預(yù)先保存在存儲(chǔ)區(qū)域的噪聲向量,或像代數(shù)(algebraic)結(jié)構(gòu)一樣不具有存儲(chǔ)區(qū)域而是依據(jù)規(guī)則生成的向量作為噪聲向量輸出。增益碼本223輸出將與自適應(yīng)向量相乘的自適應(yīng)向量增益以及將與噪聲向量相乘的噪聲向量增益,乘法器221和222將各個(gè)增益乘以各自的向量。
      加法器224將被乘以了自適應(yīng)向量增益的自適應(yīng)向量和被乘以了噪聲向量增益的噪聲向量相加而生成驅(qū)動(dòng)聲源信號(hào),并提供給聽覺加權(quán)合成濾波器215。在聽覺加權(quán)合成濾波器215中,有驅(qū)動(dòng)聲源信號(hào)通過,并生成聽覺加權(quán)合成信號(hào),提供給減法器217。減法器217從聽覺加權(quán)輸入信號(hào)中減去聽覺加權(quán)合成信號(hào),并將經(jīng)過減法運(yùn)算的信號(hào)提供給搜索單元218。搜索單元218有效地搜索出由經(jīng)過減法運(yùn)算的信號(hào)所定義的失真為最小的自適應(yīng)向量、自適應(yīng)向量增益、噪聲向量、以及噪聲向量增益的組合,將這些編碼代碼送給復(fù)用單元225。
      搜索單元218決定以下面的式(2)或式(3)定義的失真為最小的索引i、j、m或是索引i、j、m、n,并將這些送給復(fù)用單元225。
      E=&Sigma;k=1NL(t(k)-&beta;m&CenterDot;pi(k)-&gamma;mej(k))2&CenterDot;&CenterDot;&CenterDot;(2)]]>E=&Sigma;k=1NL(t(k)-&beta;m&CenterDot;pi(k)-&gamma;nej(k))2&CenterDot;&CenterDot;&CenterDot;(3)]]>其中,t(k)表示聽覺加權(quán)輸入信號(hào),pi(k)表示使第i個(gè)自適應(yīng)向量通過聽覺加權(quán)合成濾波器而獲得的信號(hào),ej(k)表示使第j個(gè)噪聲向量通過聽覺加權(quán)合成濾波器而獲得的信號(hào),β和γ分別表示自適應(yīng)向量增益和噪聲向量增益。增益碼本在式(2)和式(3)的結(jié)構(gòu)不同,在式(2)的情況中,增益碼本被表示為具有自適應(yīng)向量增益βm和噪聲向量增益γm作為元素的向量,用于確定向量的索引m被決定。在式(3)的情況中,增益碼本分別獨(dú)立具有自適應(yīng)向量增益βm和噪聲向量增益γn,各自的索引m和n被獨(dú)立決定。
      決定了所有的索引之后,復(fù)用單元225將索引復(fù)用為一而生成編碼代碼并輸出。
      圖8是表示本實(shí)施方式的同步信息生成單元206內(nèi)部主要結(jié)構(gòu)的方框圖。
      同步信息生成單元206的基本動(dòng)作與在實(shí)施方式1所示的同步信息生成單元106相同。換言之,使用編碼代碼I’在語音編碼裝置內(nèi)模擬地進(jìn)行存在于語音解碼裝置內(nèi)的解碼單元的處理,將作為其結(jié)果而獲得的自適應(yīng)碼本和(聽覺加權(quán))合成濾波器的內(nèi)部狀態(tài)反映在編碼單元201內(nèi)的自適應(yīng)碼本219和聽覺加權(quán)合成濾波器215。由此能夠防止解碼信號(hào)的質(zhì)量惡化。
      分離單元231從輸入的編碼代碼I’中分離出編碼代碼,并分別提供給自適應(yīng)碼本233、噪聲碼本234、增益碼本235、以及LPC解碼單元232。LPC解碼單元232利用被提供的編碼代碼解碼LPC系數(shù),并提供給合成濾波器239。
      自適應(yīng)碼本233、噪聲碼本234、以及增益碼本235利用編碼代碼分別解碼自適應(yīng)向量q(k)、噪聲向量c(k)、自適應(yīng)向量增益βq、以及噪聲向量增益γq。乘法器236將自適應(yīng)向量和自適應(yīng)向量增益相乘,乘法器237將噪聲向量和噪聲向量增益相乘,加法器238將乘法運(yùn)算后的信號(hào)相加而生成驅(qū)動(dòng)聲源信號(hào)。將驅(qū)動(dòng)聲源信號(hào)表示為ex(k),可根據(jù)下面的式(4)求驅(qū)動(dòng)聲源信號(hào)ex(k)。
      ex(k)=βq·q(k)+γq·c(k) …(4)接著,在合成濾波器239利用被解碼的LPC系數(shù)和驅(qū)動(dòng)聲源信號(hào)ex(k),按照下面的式(5)生成合成信號(hào)syn(k)。
      syn(k)=ex(k)+&Sigma;i=1NP&alpha;q(i)&CenterDot;syn(k-i)&CenterDot;&CenterDot;&CenterDot;(5)]]>其中,αq(i)表示解碼的LPC系數(shù),NP表示LPC系數(shù)的次數(shù)。然后,使用驅(qū)動(dòng)聲源信號(hào)ex(k)更新自適應(yīng)碼本233的內(nèi)部狀態(tài)。
      在經(jīng)過這一連串的處理之后,提取單元240提取自適應(yīng)碼本233和合成濾波器239的內(nèi)部狀態(tài)并輸出。
      如上述,根據(jù)本實(shí)施方式,在使用CELP方式進(jìn)行語音編碼時(shí),將附加信息的一部分或全部嵌入表示CELP的激勵(lì)聲源的代碼。由此能夠獲得與實(shí)施方式1相同的效果。
      然而,這里雖然以使用自適應(yīng)碼本219和聽覺加權(quán)合成濾波器215的內(nèi)部狀態(tài)的情況進(jìn)行說明,在其他的處理,例如對(duì)LPC解碼、噪聲碼本、增益碼本等也使用預(yù)測(cè)時(shí),對(duì)用于上述預(yù)測(cè)的內(nèi)部狀態(tài)和預(yù)測(cè)系數(shù)也進(jìn)行相同的處理。
      (實(shí)施方式3)圖9是表示根據(jù)本發(fā)明的實(shí)施方式3的語音編碼裝置300的主要結(jié)構(gòu)的方框圖。此外,該語音編碼裝置300具有與實(shí)施方式1所示的語音編碼裝置100相同的基本結(jié)構(gòu)。對(duì)相同的構(gòu)成要素賦予相同的標(biāo)號(hào),并省略其說明。這里,以使用ADPCM方式進(jìn)行語音編碼的情況為例進(jìn)行說明。
      本實(shí)施方式的特征在于,在比特嵌入單元104提供的編碼代碼I’中,直接保持相當(dāng)于功能擴(kuò)展編碼單元103的擴(kuò)展碼J的信息,并設(shè)定不變更該信息的限制,在這種限制下,再編碼單元301對(duì)編碼代碼I’再度進(jìn)行編碼處理,決定最終的編碼代碼I”。
      輸入數(shù)字信號(hào)X和作為比特嵌入單元104的輸出的編碼代碼I’被提供給再編碼單元301。再編碼單元301將比特嵌入單元104提供的編碼代碼I’再度編碼。但對(duì)于編碼代碼I’中相當(dāng)于擴(kuò)展碼J的信息,將其排除在編碼對(duì)象之外以防止其改變。然后,將獲得的最終的編碼代碼I”輸出。由此,能夠保持功能擴(kuò)展編碼單元103的編碼代碼J的信息,同時(shí)生成最適宜的編碼代碼。再有,通過將此時(shí)在預(yù)測(cè)單元使用的預(yù)測(cè)系數(shù)和預(yù)測(cè)單元的內(nèi)部狀態(tài)以及在自適應(yīng)單元使用的一樣本之前的量化碼提供給編碼單元102,能夠與以編碼代碼I”進(jìn)行解碼處理的語音解碼裝置(未圖示)的預(yù)測(cè)單元使用的預(yù)測(cè)系數(shù)和預(yù)測(cè)單元的內(nèi)部狀態(tài)以及在自適應(yīng)單元使用的一樣本之前的量化碼取得同步,從而能夠防止解碼信號(hào)的音質(zhì)惡化。
      圖10是表示上述再編碼單元301內(nèi)部的主要結(jié)構(gòu)的方框圖。此外,除了量化單元311和內(nèi)部狀態(tài)提取單元312之外,再編碼單元301具有與在實(shí)施方式1表示的編碼單元102(參照?qǐng)D2)相同的結(jié)構(gòu),故省略其說明。
      將在比特嵌入單元104生成的編碼代碼I’提供給量化單元311。量化單元311使編碼代碼I’中的被嵌入的功能擴(kuò)展編碼單元103的編碼代碼J的信息維持原樣,并對(duì)其他的編碼代碼進(jìn)行再?zèng)Q定。
      圖11是用于說明量化單元311的再?zèng)Q定處理的概要的圖。這里,以下述情況為例進(jìn)行說明,即,功能擴(kuò)展編碼單元103的編碼代碼J為{0,1,1,0},編碼代碼為4比特,并在其LSB嵌入了編碼代碼J的情況。
      此時(shí),量化單元311變得在LSB被固定在編碼代碼J的狀態(tài)下,進(jìn)行對(duì)目標(biāo)的殘差信號(hào)失真成為最小的量化值的編碼代碼的再?zèng)Q定。因此,功能擴(kuò)展編碼單元103的編碼代碼J為0時(shí),量化單元311可取的量化值的編碼代碼為0x0,0x2,0x4,0x6,0x8,0xA,0xB,0xC,0xD的8種。并且,在J=1時(shí),量化單元311可取的量化值的編碼代碼為0x1,0x3,0x5,0x7,0x9,0xB,0xD,0xF的8種。
      如上述,在輸出再?zèng)Q定的編碼代碼I”的同時(shí),通過內(nèi)部狀態(tài)提取單元312輸出預(yù)測(cè)單元115的內(nèi)部狀態(tài)、在預(yù)測(cè)單元115使用的預(yù)測(cè)系數(shù)、以及在自適應(yīng)單元113使用的一樣本之前的量化碼。將這些信息提供給編碼單元102,并為下一個(gè)輸入X進(jìn)行準(zhǔn)備。
      將本實(shí)施方式的編碼處理的步驟整理如下。
      首先在編碼單元102進(jìn)行編碼處理,接著在比特嵌入單元104將由功能擴(kuò)展編碼單元103提供的編碼代碼J嵌入由編碼單元102獲得的編碼代碼I,生成編碼代碼I’。將該編碼代碼I’提供給再編碼單元301。再編碼單元301基于保持編碼代碼J的限制而再?zèng)Q定編碼代碼,生成編碼代碼I”。最后,在輸出編碼代碼I”的同時(shí),將在再編碼單元301內(nèi)的預(yù)測(cè)單元使用的預(yù)測(cè)系數(shù)、該預(yù)測(cè)單元的內(nèi)部狀態(tài)、以及由再編碼單元301內(nèi)的自適應(yīng)單元所使用的一樣本之前的量化碼提供給編碼單元102,并為下一個(gè)輸出X進(jìn)行準(zhǔn)備。
      這樣,根據(jù)本實(shí)施方式,能夠在編碼單元的預(yù)測(cè)單元使用的參數(shù)與在解碼單元的預(yù)測(cè)單元使用的參數(shù)之間取得同步,防止音質(zhì)惡化的發(fā)生。再有,由于在基于比特嵌入信息的限制的基礎(chǔ)上再度決定編碼參數(shù),能夠?qū)⒁虮忍厍度胨鸬膼夯种频阶钚∠薅取?br> 另外,在本實(shí)施方式中,雖然以使用ADPCM方式的語音編碼的情況為例進(jìn)行說明,但也可以是CELP方式。
      圖12是表示使用CELP方式的情況的再編碼單元301的結(jié)構(gòu)的方框圖。此外,除了噪聲碼本321和內(nèi)部狀態(tài)提取單元322之外,再編碼單元301具有與在實(shí)施方式2表示的編碼單元201(參照?qǐng)D7)相同的結(jié)構(gòu),故省略其說明。
      將在比特嵌入單元104生成的編碼代碼I’提供給噪聲碼本321。噪聲碼本321使編碼代碼I’中的被嵌入的編碼代碼J的信息維持原樣,并對(duì)其他的編碼代碼進(jìn)行再?zèng)Q定。假設(shè)以8比特表示噪聲碼本321的索引,擴(kuò)展功能編碼單元102的信息{0}被嵌入該LSB時(shí),在以偶數(shù)表示索引的候選{2n;n=0~127}中進(jìn)行噪聲碼本321的搜索。噪聲碼本321通過搜索決定其中使失真最小的候選并輸出該索引。同樣地,以8比特表示噪聲碼本321的索引,擴(kuò)展功能編碼單元102的信息{1}被嵌入該LSB時(shí),在以奇數(shù)表示索引的候選{2n+1;n=0~127}中進(jìn)行噪聲碼本321的搜索。
      再編碼單元301輸出以上述方式再度決定的編碼代碼I”,同時(shí)通過內(nèi)部狀態(tài)提取單元322輸出自適應(yīng)碼本219、聽覺加權(quán)濾波器216、以及聽覺加權(quán)合成濾波器215的內(nèi)部狀態(tài)。將這些信息提供給編碼單元102。
      上述說明是將擴(kuò)展功能的信息嵌入在噪聲碼本321的一部分索引中的情況的說明。此時(shí),再編碼單元301不需要進(jìn)行LPC系數(shù)的計(jì)算以及編碼、自適應(yīng)碼本的搜索。其理由是,需要再編碼的是噪聲碼本,在其前級(jí)處理的部分與在編碼單元102的結(jié)果相同。因此,只要直接利用在編碼單元102獲得的結(jié)果即可。
      另外,這里雖然說明了有關(guān)將擴(kuò)展功能的信息嵌入噪聲向量的索引的一部分的情況,但不限于此,也能夠?qū)U(kuò)展功能的信息嵌入在例如LPC系數(shù)、自適應(yīng)碼本、增益碼本的索引中。此時(shí)的動(dòng)作原理與對(duì)上述噪聲碼本321的說明相同,其特征在于,在保持?jǐn)U展功能的信息的限制之下再度決定使失真變得最小時(shí)的索引。
      然而,這里雖然以使用自適應(yīng)碼本219和聽覺加權(quán)合成濾波器215的內(nèi)部狀態(tài)的情況進(jìn)行說明,在其他的處理,例如對(duì)LPC解碼、噪聲碼本、增益碼本等也使用預(yù)測(cè)時(shí),對(duì)用于上述預(yù)測(cè)的內(nèi)部狀態(tài)和預(yù)測(cè)系數(shù)也進(jìn)行相同的處理。
      圖13是表示語音編碼裝置300的變化的結(jié)構(gòu)的方框圖。
      圖9所示的語音編碼裝置300的結(jié)構(gòu)是,功能擴(kuò)展編碼單元103的處理結(jié)果依賴于編碼單元102的處理結(jié)果而改變。這里,使結(jié)構(gòu)為能夠與編碼單元102的處理結(jié)果獨(dú)立地進(jìn)行功能擴(kuò)展編碼單元103的處理。
      上述結(jié)構(gòu)例如可適用于下述情況將輸入語音信號(hào)頻帶分割為兩個(gè)頻帶(例如0-4kHz和4-8kHz),獨(dú)立地在編碼單元102編碼0-4kHz頻帶并在功能擴(kuò)展編碼單元103編碼4-8kHz頻帶的情況。此時(shí),功能擴(kuò)展編碼單元103的編碼處理可不依賴于編碼單元102的處理結(jié)果加以實(shí)施。
      編碼處理的步驟說明如下首先在功能擴(kuò)展編碼單元103進(jìn)行編碼處理,生成擴(kuò)展碼J。將該擴(kuò)展碼J提供給編碼處理限制單元331。以嵌入擴(kuò)展碼J為前提,將不改變有關(guān)該代碼J的信息的限制信息提供給編碼處理限制單元331。因此,編碼單元102在此限制下進(jìn)行編碼處理,決定最終的編碼代碼I’。根據(jù)這個(gè)結(jié)構(gòu),變得不需要再編碼單元301,能夠以較少的運(yùn)算量實(shí)現(xiàn)實(shí)施方式3的語音編碼。
      以上,對(duì)本發(fā)明的各個(gè)實(shí)施方式進(jìn)行了說明。
      本發(fā)明的語音編碼裝置不限于上述實(shí)施方式1~3,可進(jìn)行各種變更加以實(shí)施。
      本發(fā)明的語音編碼裝置可以裝載在移動(dòng)通信系統(tǒng)中的通信終端裝置或基站裝置中。據(jù)此,可以提供具有上述作用和效果的通信終端裝置和基站裝置。
      再有,這里以用硬件構(gòu)成本發(fā)明的情況為例進(jìn)行了說明,但本發(fā)明也能夠以軟件實(shí)現(xiàn)。比如,通過編程語言記述本發(fā)明的語音編碼方法的算法,并在存儲(chǔ)器中保存該程序并通過信息處理裝置來實(shí)行,從而能夠?qū)崿F(xiàn)與本發(fā)明的語音編碼裝置相同的功能。
      再有,上述各實(shí)施方式的說明中的各功能塊可實(shí)現(xiàn)為一般作為集成電路的LSI。這些塊既可是每個(gè)塊分別集成到一個(gè)芯片,或者可以是部分或所有塊集成到一個(gè)芯片。
      這里,雖然稱作LSI,但根據(jù)集成度的不同每個(gè)功能塊也可以稱為IC(集成電路)、系統(tǒng)LSI(系統(tǒng)大規(guī)模集成電路)、超LSI(超大規(guī)模集成電路)、極大LSI(極大規(guī)模集成電路)。
      另外,實(shí)現(xiàn)集成電路化的方法不僅限于LSI,也可使用專用電路或通用處理器來實(shí)現(xiàn)。制造LSI后,也可以利用能夠編程的FPGA(Field ProgrammableGate Array,現(xiàn)場(chǎng)可編程門陣列),或可以利用將LSI內(nèi)部的電路塊連接或設(shè)定重新配置的可重配置處理器(Reconfigurable Processor)。
      再有,如果隨著半導(dǎo)體技術(shù)的進(jìn)步或者其他技術(shù)的派生,出現(xiàn)了替換LSI集成電路的技術(shù),當(dāng)然,也可以利用該技術(shù)來實(shí)現(xiàn)功能塊的集成化。并且存在著適用生物技術(shù)的可能性。
      本說明書基于2004年7月20日申請(qǐng)的日本專利申請(qǐng)?zhí)卦傅?004-211589號(hào)。該全部?jī)?nèi)容包含于此。
      工業(yè)實(shí)用性本發(fā)明的語音編碼裝置和語音編碼方法適合于VoIP網(wǎng)絡(luò)、移動(dòng)電話網(wǎng)等用途。
      權(quán)利要求
      1.一種語音編碼裝置,包括編碼單元,通過預(yù)測(cè)編碼而由語音信號(hào)生成代碼;嵌入單元,將附加信息嵌入在所述代碼中;預(yù)測(cè)解碼單元,使用被嵌入了所述附加信息的代碼進(jìn)行與所述編碼單元的預(yù)測(cè)編碼對(duì)應(yīng)的解碼;以及同步單元,使在所述編碼單元的預(yù)測(cè)編碼中所使用的參數(shù)與在所述預(yù)測(cè)解碼單元的解碼中所使用的參數(shù)同步。
      2.如權(quán)利要求1所述的語音編碼裝置,其中所述編碼單元使用ADPCM(Adaptive Differential Pulse Code Modulation)方式生成所述代碼,所述嵌入單元將所述附加信息嵌入在所述代碼的LSB(Least SignificantBit)中。
      3.如權(quán)利要求1所述語音編碼裝置,其中所述編碼單元通過CELP方式生成所述代碼,所述嵌入單元將所述附加信息嵌入在所述代碼內(nèi)表示CELP方式的激勵(lì)聲源的代碼中。
      4.如權(quán)利要求1所述的語音編碼裝置,其中所述嵌入單元根據(jù)所述語音信號(hào)的性質(zhì)使嵌入的所述附加信息的比特?cái)?shù)改變,并將該比特?cái)?shù)通知給語音解碼裝置。
      5.如權(quán)利要求1所述的語音編碼裝置,其中還包括指定單元,從預(yù)定的選項(xiàng)中指定所述附加信息的比特?cái)?shù)。
      6.一種通信終端裝置,包括如權(quán)利要求1所述的語音編碼裝置。
      7.如權(quán)利要求6所述的通信終端裝置,其中還包括發(fā)送單元,信號(hào)傳輸所述嵌入單元嵌入附加信息的位置以及所述附加信息的比特?cái)?shù)。
      8.如權(quán)利要求7所述的通信終端裝置,其中所述嵌入單元根據(jù)通信對(duì)方的通信終端裝置的接收狀況來決定用于嵌入所述附加信息的位置。
      9.一種基站裝置,包括如權(quán)利要求1所述的語音編碼裝置。
      10.如權(quán)利要求9的基站裝置,還包括發(fā)送單元,信號(hào)傳輸所述嵌入單元嵌入附加信息的位置以及所述附加信息的比特?cái)?shù)。
      11.如權(quán)利要求10所述的基站裝置,其中所述嵌入單元根據(jù)通信對(duì)方的通信終端裝置的接收狀況來決定用于嵌入所述附加信息的位置。
      12.一種語音編碼方法,包括編碼步驟,通過預(yù)測(cè)編碼由語音信號(hào)生成代碼;嵌入步驟,將附加信息嵌入在所述代碼中;預(yù)測(cè)解碼步驟,使用被嵌入了所述附加信息的代碼,進(jìn)行與所述編碼步驟的預(yù)測(cè)編碼對(duì)應(yīng)的解碼;以及同步步驟,使在所述編碼步驟的預(yù)測(cè)編碼中所使用的參數(shù)與在所述預(yù)測(cè)解碼步驟的解碼中所使用的參數(shù)同步。
      全文摘要
      公開了即使將密寫技術(shù)和預(yù)測(cè)編碼組合應(yīng)用于語音編碼,也能夠不產(chǎn)生解碼信號(hào)的質(zhì)量惡化的語音編碼裝置。在該裝置中,編碼單元(102)將編碼代碼(I)輸出到比特嵌入單元(104)。功能擴(kuò)展編碼單元(103)生成語音編碼裝置(100)的功能擴(kuò)展所需的信息的編碼代碼(J),并輸出到比特嵌入單元(104)。比特嵌入單元(104)將編碼代碼(J)的信息嵌入在編碼代碼(I)的一部分的比特中,并輸出所獲得的編碼代碼I’。同步信息生成單元(106)基于被嵌入了比特后的編碼代碼I’生成同步信息,并輸出到編碼單元(102)。編碼單元(102)基于該同步信息更新內(nèi)部狀態(tài)等,進(jìn)行下一個(gè)數(shù)字語音信號(hào)(X)的編碼。
      文檔編號(hào)G10L19/04GK1989546SQ20058002462
      公開日2007年6月27日 申請(qǐng)日期2005年7月14日 優(yōu)先權(quán)日2004年7月20日
      發(fā)明者押切正浩 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1