国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      復(fù)制語言信號、解碼語音、合成語音的方法和裝置的制作方法

      文檔序號:2819989閱讀:242來源:國知局
      專利名稱:復(fù)制語言信號、解碼語音、合成語音的方法和裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及的是以一受控速度復(fù)制語音信號的方法和裝置,解碼語音信號的方法和裝置和合成語音信號的方法和裝置,其中音調(diào)變換可以由簡化的結(jié)構(gòu)實(shí)現(xiàn)。本發(fā)明還涉及發(fā)射和接收音調(diào)變換的語音信號的便攜式無線電終端設(shè)備。
      迄今為止已知各種編碼音頻信號(包括語音和聲學(xué)信號)的編碼方法,它們使用這些信號在時(shí)域和在頻域的統(tǒng)計(jì)特性和人耳的心理聲學(xué)特征壓縮信號。這些編碼方法可以粗略地分為時(shí)域編碼、頻域編碼和分析/合成編碼。
      語音信號高效編碼的例子包括正弦分析編碼,例如諧波編碼、多頻帶激勵(lì)(MBE)編碼、子頻帶編碼(SBC)、線性預(yù)測編碼(LPC)、離散余弦變換(DCT)、修改DCT(MDCT)和快速富里葉變換(FFT)。
      同時(shí),通過時(shí)軸處理的高效語音編碼方法,像典型的碼激勵(lì)線性預(yù)測(CELP)編碼,在快速時(shí)軸變換(修改)上遇到困難,因?yàn)樵诮獯a操作后需要執(zhí)行大量的處理操作。此外,由于速度控制是在解碼后在時(shí)域執(zhí)行,因此該方法不能用于位速率變換。
      另一方面,如果打算解碼用上述編碼方法編碼的語音信號,常常希望只改變語音的音調(diào)而不改變其音素。然而,使用通常的語音解碼方法,解碼的語音必須使用音調(diào)控制變換音調(diào),使結(jié)構(gòu)變得復(fù)雜,同時(shí)增加成本。
      因此,本發(fā)明的一個(gè)目的是提供復(fù)制語音信號的一種方法和裝置,其中可以使速度在寬的范圍內(nèi)控制到一個(gè)希望的速率得到高的聲音質(zhì)量而不改變音素或音調(diào)。
      本發(fā)明的另一目的是提供解碼語音信號的方法和裝置和合成語音的方法和裝置,其中可以使用簡化的結(jié)構(gòu)實(shí)現(xiàn)音調(diào)變換或音調(diào)控制。
      本發(fā)明的再一目的是提供發(fā)射和接收語音信號的便攜式無線電終端設(shè)備,其中可以使用一個(gè)簡化的結(jié)構(gòu)發(fā)射和接收音調(diào)變換的或音調(diào)受控的語音信號。
      使用按照本發(fā)明的語音信號復(fù)制方法,輸入語音信號在時(shí)軸上根據(jù)預(yù)先設(shè)定的編碼單元切分來產(chǎn)生編碼的參數(shù),將其插值,為希望的時(shí)間點(diǎn)產(chǎn)生修改的已編碼參數(shù),并根據(jù)這些修改的已編碼參數(shù)復(fù)制語音信號。
      使用按照本發(fā)明的語音信號復(fù)制裝置,輸入語音信號在時(shí)軸上根據(jù)預(yù)先設(shè)定的編碼單元切分來產(chǎn)生編碼的參數(shù),將其插值,為希望的時(shí)間點(diǎn)產(chǎn)生修改的已編碼參數(shù),然后根據(jù)這些修改的已編碼參數(shù)復(fù)制語音信號。
      使用該語音信號復(fù)制方法,用不同于編碼的塊長,使用根據(jù)預(yù)先設(shè)定的塊作為單元在時(shí)軸切分輸入語音信號而得到的編碼的參數(shù),并根據(jù)編碼塊編碼切分的語音信號復(fù)制語音。
      使用根據(jù)本發(fā)明的語音解碼方法和裝置,變換在輸入編碼語音數(shù)據(jù)的諧波的一個(gè)預(yù)先設(shè)定的頻帶內(nèi)的基本頻率和數(shù)目,并插值說明在每一輸入諧波中譜分量振幅的數(shù)據(jù)數(shù)目來修改音調(diào)。
      編碼時(shí)使用大小變換修改音調(diào)頻率,其中把諧波數(shù)設(shè)定為一個(gè)預(yù)先設(shè)定值。
      在這種情況下,語音壓縮解碼器可以同時(shí)用作文本語音合成的語音合成器。對于日常語音發(fā)聲,通過壓縮和擴(kuò)展得到清晰的回放語音,而對于特殊的語音合成,使用文本合成或按照預(yù)定的規(guī)則合成來構(gòu)成高效語音輸出系統(tǒng)。
      使用根據(jù)本發(fā)明的語音信號復(fù)制方法和裝置,輸入語音信號在時(shí)軸上根據(jù)預(yù)先設(shè)定的編碼單元切分,并根據(jù)該編碼單元編碼以便尋找已編碼參數(shù),然后將其插值,為希望的時(shí)間點(diǎn)尋找修改的已編碼參數(shù)。然后根據(jù)修改的已編碼參數(shù)復(fù)制該語音信號,從而在寬的范圍內(nèi)容易地實(shí)現(xiàn)速度控制,不改變音素或音調(diào)而具有高品質(zhì)。
      使用根據(jù)本發(fā)明的語音信號復(fù)制方法和裝置,用不同于編碼的塊長,使用根據(jù)預(yù)先設(shè)定的塊作為單元在時(shí)軸切分輸入語音信號而得到的已編碼參數(shù),和根據(jù)該編碼塊編碼切分的語音信號來復(fù)制語音。結(jié)果是,在寬的范圍內(nèi)容易地實(shí)現(xiàn)速度控制,不改變音素或音調(diào)而具有高品質(zhì)。
      使用根據(jù)本發(fā)明的語音解碼方法和裝置,變換在輸入編碼語音數(shù)據(jù)的諧波中一個(gè)預(yù)先設(shè)定的頻帶內(nèi)的基本頻率和數(shù)目,并插值說明在每一輸入諧波中譜分量振幅的數(shù)據(jù)數(shù)來修改音調(diào)。結(jié)果是,可以使用一個(gè)簡化的結(jié)構(gòu)改變音調(diào)為一個(gè)希望的值。
      在這種情況下,語音壓縮解碼器可以同時(shí)用作文本語音合成的語音合成器。對于日常語音發(fā)聲,通過壓縮和擴(kuò)展得到清晰的回放語音,而對于特殊的語音合成,使用文本合成或按照預(yù)先規(guī)定的規(guī)則合成來構(gòu)成高效語音輸出系統(tǒng)。
      使用便攜無線電終端設(shè)備,可以用一個(gè)簡化的結(jié)構(gòu)發(fā)射和接收音調(diào)變換到音調(diào)受控的語音信號。


      圖1是表示語音信號復(fù)制方法和實(shí)現(xiàn)按照本發(fā)明的語音信號復(fù)制方法的一個(gè)語音信號復(fù)制裝置的基本結(jié)構(gòu)的框圖;圖2是表示圖1所示的語音信號復(fù)制裝置的編碼單元的原理框圖;圖3是表示編碼單元的詳細(xì)結(jié)構(gòu)的框圖;圖4是表示圖1所示的語音信號復(fù)制裝置的解碼單元的原理框圖;圖5是表示該解碼單元的詳細(xì)結(jié)構(gòu)的框圖;圖6是說明為計(jì)算解碼單元修改的編碼參數(shù)的單元的操作流程圖;圖7原理說明由修改的編碼參數(shù)計(jì)算單元在時(shí)軸上得到的修改的編碼參數(shù);圖8是說明由修改的編碼參數(shù)計(jì)算單元執(zhí)行的詳細(xì)的插值操作的流程圖;圖9A到9D說明插值操作;圖10A到10C說明由修改的編碼參數(shù)計(jì)算單元執(zhí)行的典型操作;圖11A到11C說明由修改的編碼參數(shù)計(jì)算單元執(zhí)行的其它典型操作;圖12說明在使禎長變化而由解碼單元快速控制速度的情況下的一個(gè)操作;圖13說明在使禎長變化而由解碼單元慢速控制速度的情況下的一個(gè)操作;圖14是表示解碼單元另一詳細(xì)結(jié)構(gòu)的框圖;圖15是表示語音合成設(shè)備應(yīng)用實(shí)例的框圖;圖16是表示文本語音合成裝置應(yīng)用實(shí)例的框圖;圖17是表示應(yīng)用編碼單元的一個(gè)便攜式終端的發(fā)射器結(jié)構(gòu)的框圖;圖18是表示應(yīng)用編碼單元的一個(gè)便攜式終端的接收器結(jié)構(gòu)的框圖。
      參考附圖,下面敘述根據(jù)本發(fā)明的最佳實(shí)施例的語音信號復(fù)制方法和裝置。本實(shí)施例是關(guān)于根據(jù)編碼參數(shù)復(fù)制語音信號的語音信號復(fù)制裝置1,這些編碼參數(shù)是在時(shí)軸上根據(jù)預(yù)先規(guī)定的禎數(shù)作為編碼單元切分輸入語音信號,并將該切分的輸入語音信號編碼而得到的,如圖1所示。
      語音信號復(fù)制裝置1包括根據(jù)作為單元的禎而編碼在輸入端子101進(jìn)入的語音信號的編碼單元2,它輸出例如線性預(yù)測編碼(LPC)參數(shù)、線譜對(LSP)參數(shù)、音調(diào)、濁音(V)/清音(UV)或譜振幅Am等已編碼參數(shù),和包括通過時(shí)軸壓縮為修改編碼參數(shù)的輸出時(shí)期的時(shí)期修改單元3。語音信號復(fù)制裝置還包括解碼單元4,其插值在由時(shí)期修改單元3為希望的時(shí)間點(diǎn)尋找修改的已編碼參數(shù)而修改的時(shí)期中輸出的已編碼參數(shù),并根據(jù)修改的已編碼參數(shù)合成語音信號以便在輸出端子201輸出合成的語音信號。
      參考圖2和圖3解釋編碼單元2。編碼單元2根據(jù)鑒別結(jié)果判定輸入語音信號是濁音信號還是清音信號,并對判定為濁音的信號部分執(zhí)行正弦合成編碼,而對判定為清音的信號部分通過使用綜合分析方法進(jìn)行的最優(yōu)矢量的閉環(huán)檢索執(zhí)行矢量量化。也就是說,編碼單元2包括第一編碼單元110,它為尋找輸入語音信號的短期預(yù)測殘數(shù),例如線性預(yù)測編碼(LPC)殘數(shù),執(zhí)行正弦分析編碼,例如諧波編碼,編碼單元2還包括第二編碼單元120,其通過傳輸輸入語音信號的相位分量執(zhí)行波形編碼。第一編碼單元110和第二編碼單元120分別用于編碼濁音(V)部分和清音(UV)部分。
      在圖2的實(shí)施例中,供給輸入端子101的語音信號送往第一編碼單元110的逆LPC濾波器111和LPC分析量化單元113。從LPC分析/量化單元113或所謂的α參數(shù)得到的LPC系數(shù)送往逆LPC濾波器111以通過該逆LPC濾波器111取出輸入語音信號的線性預(yù)測殘數(shù)(LPC殘數(shù))。從LPC分析/量化單元113取出線性譜對的量化輸出,其在后面敘述,并送往輸出端子102。從逆LPC濾波器111來的LPC殘數(shù)送往正弦分析編碼單元114,正弦分析編碼單元114由濁音(V)/清音(UV)鑒別單元115執(zhí)行音調(diào)檢測、譜包線振幅計(jì)算和V/UV。從正弦分析編碼單元114來的譜包線振幅數(shù)據(jù)送往矢量量化單元116。從矢量量化單元116來的碼表指數(shù)作為譜包線的矢量量化輸出經(jīng)由開關(guān)117送往輸出端子103,而正弦分析編碼單元114的輸出通過開關(guān)118送往輸出端子104。從濁音/清音鑒別單元115來的濁音/清音鑒別輸出送往輸出端子105和開關(guān)117和118作為開關(guān)控制信號。對于濁音(V)信號,選擇指數(shù)和音調(diào)以便在輸出端子103、104取出。對在矢量量化器116的矢量量化,為插值在頻率軸上有效頻帶塊的振幅數(shù)據(jù)從在該塊中最后一個(gè)振幅數(shù)據(jù)直到塊中第一振幅數(shù)據(jù)的一個(gè)適當(dāng)數(shù)目的啞數(shù)據(jù),或延伸塊中最后數(shù)據(jù)和第一數(shù)據(jù)的啞數(shù)據(jù)附在該塊的尾端和前端,以增大數(shù)據(jù)數(shù)目到NF。然后通過頻帶限制型Os元組采樣,例如8元組過采樣,尋找振幅數(shù)據(jù)的Os元組數(shù)。振幅數(shù)據(jù)的Os元組數(shù)((mMx+1)X數(shù)據(jù)的Os數(shù))通過線性插值進(jìn)一步擴(kuò)展到一個(gè)更大的數(shù)N,M例如21048。這一NM數(shù)數(shù)據(jù)通過大量抽殺,變換為預(yù)先規(guī)定的數(shù)M(例如44),然后在該預(yù)先規(guī)定的數(shù)目的數(shù)據(jù)上執(zhí)行矢量量化。
      在本實(shí)施例中,第二編碼單元120有一個(gè)碼激勵(lì)的線性預(yù)測(CELP)編碼配置并通過使用綜合分析方法的閉環(huán)檢索在時(shí)域波形上執(zhí)行矢量量化。具體地說,噪聲碼表121的輸出由加權(quán)合成濾波器122合成產(chǎn)生一個(gè)加權(quán)合成的語音,送往減法器123,這里尋找加權(quán)合成語音和供給輸入端子101、繼而由感性加權(quán)濾波器125處理的語音之間的誤差。距離計(jì)算電路124計(jì)算距離,并在噪聲碼表121中檢索使誤差最小的矢量。這一CELP編碼用于編碼上述清音部分,從噪聲碼表121來的作為UV數(shù)據(jù)的碼表指數(shù)通過開關(guān)127在輸出端子107取出,開關(guān)107在從濁音/清音鑒別單元115的濁音/清音鑒別結(jié)果指示一個(gè)清音(UV)聲音時(shí)打開。
      參考圖3,現(xiàn)在解釋圖1所示的語音信號編碼器的更詳細(xì)的結(jié)構(gòu)。在圖3中,相似于圖1中所示的元部件用同樣的參考數(shù)字表示。
      在圖3所示的語音信號編碼器2中,供給輸入端子101的語音信號由高通濾波器109濾波,以濾除不需要的范圍的信號,然后供給LPC分析/量化單元113的LPC分析電路132和逆LPC濾波器111。LPC分析/量化單元113的LPC分析電路132應(yīng)用一個(gè)哈明(Hamming)窗,其輸入信號波形的長度以256個(gè)樣本為一塊,并通過自相關(guān)方法尋找線性預(yù)測系數(shù),亦即所謂的α參數(shù)。作為數(shù)據(jù)輸出單元的禎區(qū)間設(shè)定為大約160個(gè)樣本。如果采樣頻率fs例如是8kHz的話,則一禎的區(qū)間是20毫秒或160個(gè)樣本。
      從LPC分析電路132得到的α參數(shù)送往α-LSP變換電路133變換為線性譜對(LSP)參數(shù)。它把α參數(shù)作為直接型濾波器系數(shù)變換為例如10,也就是說,5對LSP參數(shù)。這種變換例如可以用牛頓-拉普森(Newton-Rhapson)方法實(shí)現(xiàn)。把α參數(shù)變換成LSP參數(shù)的理由是LSP參數(shù)在插值特征上高于α參數(shù)。
      從α-LSP變換電路133來的LSP參數(shù)由LSP量化器134矩陣量化或矢量量化。有可能在矢量量化或收集多禎到一起之前取禎對禎的差別執(zhí)行矩陣量化。在現(xiàn)在的例子中,每20毫秒計(jì)算的LSP參數(shù)以每禎20毫秒矢量量化。
      在端子102取出量化器134的量化輸出,亦即LSP量化的索引數(shù)據(jù)到解碼單元103,而量化了的LSP矢量送往一個(gè)LSP插值電路136。
      LSP插值電路136插值每20毫秒或40毫秒量化的LSP矢量,以提供一個(gè)8元組速率。也就是說,LSP矢量每2.5毫秒更新。理由是,如果殘數(shù)波形通過諧波編碼/解碼方法用分析/合成處理,則合成波形的包線線描述一個(gè)極度平靜的波形,以致,如果LPC系數(shù)每20毫秒突然改變,則可能產(chǎn)生一個(gè)外部噪聲。也就是說,如果LPC系數(shù)每2.5毫秒逐漸改變有可能阻止產(chǎn)生這樣的外部噪聲。
      對于使用每過2.5毫秒產(chǎn)生的插值的LSP矢量的輸入語音的逆濾波,LSP參數(shù)由一個(gè)LSP到α的變換電路137變換為作為例如10階直接型濾波器的系數(shù)的α參數(shù)。LSP到α的變換電路137的輸出送往LPC逆濾波器電路111,然后它執(zhí)行逆濾波,以產(chǎn)生一個(gè)使用α參數(shù)每2.5毫秒更新的平滑輸出。逆LPC濾波器111的輸出送往正弦分析編碼單元114,例如一個(gè)諧波編碼電路的正交變換電路145,例如一個(gè)DCT電路。
      從LPC分析/量化單元113的LPC分析電路132來的α參數(shù)送往一個(gè)感性加權(quán)濾波器計(jì)算電路139,這里尋找感性加權(quán)數(shù)據(jù)。這些加權(quán)數(shù)據(jù)送往第二編碼單元120的感性加權(quán)矢量量化器116,感性加權(quán)濾波器125和感性加權(quán)的合成濾波器122。
      諧波編碼電路的正弦分析編碼單元114用諧波編碼方法分析逆LPC濾波器111的輸出。亦即,執(zhí)行音調(diào)檢測,代表諧波的振幅Am的計(jì)算和濁音(V)/清音(UV)辨別,以及用大小變換維持由音調(diào)改變的代表諧波的振幅(Am)后包線的數(shù)目。
      在圖3所示的正弦分析編碼電路114的例子中,使用平常的諧波編碼。特別在多頻帶激勵(lì)(MBE)編碼中,提取模型時(shí)假定濁音部分和清音部分在同一時(shí)間點(diǎn)(在同一塊或禎)出現(xiàn)在頻域或頻帶中。在其它諧波編碼技術(shù)中,唯一判別在一塊或一禎中的語音是否是濁音或清音。在下面的敘述中,如果整個(gè)頻帶是UV,則判定一個(gè)給定禎為UV,只要涉及到MBE編碼的話。
      圖3的正弦分析編碼單元141的開環(huán)音調(diào)檢索單元141和過零計(jì)數(shù)器142由分別由從輸入端子101來的輸入語音信號和從高通濾波器(HPF)109來的信號供給。正弦分析編碼單元114的正交變換電路145由從逆LPC濾波器111來的LPC殘數(shù)或線性預(yù)測殘數(shù)供給。開環(huán)音調(diào)檢索單元141取輸入信號的LPC殘數(shù)通過開環(huán)檢索執(zhí)行相對粗音調(diào)檢索。提取的粗音調(diào)數(shù)據(jù)由閉環(huán)檢索送往細(xì)音調(diào)檢索單元146,其在后面敘述。從開環(huán)音調(diào)檢索單元141,通過正規(guī)化LPC殘數(shù)的自相關(guān)的最大值與粗音調(diào)數(shù)據(jù)得到的正規(guī)化自相關(guān)的最大值r(p)連同粗音調(diào)數(shù)據(jù)取出,以便送往濁音/清音鑒別單元115。
      正交變換電路145執(zhí)行正交變換,例如離散富里葉變換(DFT),為變換時(shí)間軸上的LPC殘數(shù)為頻率軸上的譜振幅數(shù)據(jù)。正交變換電路145的輸出送往細(xì)音調(diào)檢索單元146和譜評測單元148來評估譜振幅或包線。
      細(xì)音調(diào)檢索單元146用由開環(huán)音調(diào)檢索單元141提取的相對粗音調(diào)數(shù)據(jù)和由正交變換電路145得到的頻域數(shù)據(jù)供給。細(xì)音調(diào)檢索單元146圍繞粗音調(diào)數(shù)據(jù)為中心以0.2到0.5的速率以±幾個(gè)樣本擺動(dòng)音調(diào)數(shù)據(jù),以便最終達(dá)到具有最優(yōu)十進(jìn)數(shù)點(diǎn)(浮點(diǎn))的細(xì)音調(diào)數(shù)據(jù)的值。使用綜合分析方法作為選擇音調(diào)的細(xì)檢索技術(shù)使得功率譜接近于原來信號的功率譜。從閉環(huán)細(xì)音調(diào)檢索單元146來的音調(diào)數(shù)據(jù)通過開關(guān)118送往輸出端子104。
      在譜評測單元148中,根據(jù)譜振幅和作為LPC殘數(shù)的正交變換輸出評估每一諧波的振幅和作為這些諧波的和的譜包絡(luò)線并送往細(xì)音調(diào)檢索單元146、濁音/清音鑒別單元115和感性加權(quán)矢量量化單元116。
      濁音/清音鑒別單元115根據(jù)正交變換電路145的輸出、從細(xì)音調(diào)檢索單元146來的最優(yōu)音調(diào)、從譜評測單元148來的譜振幅數(shù)據(jù)、從開環(huán)音調(diào)檢索單元141來的正規(guī)化自相關(guān)的最大值r(p)和從過零計(jì)數(shù)器來的過零計(jì)數(shù)值鑒別一禎的濁音/清音。另外,對于MBE,也可以利用基于頻帶的濁音/清音鑒別的邊界位置為濁音/清音鑒別的條件。濁音/清音鑒別單元115的鑒別輸出在輸出端子105取出。
      把一些數(shù)據(jù)變化單元(執(zhí)行一種采樣速率變換的一個(gè)單元)供給譜評測單元148的輸出單元或矢量量化單元116的輸入單元??紤]到在頻率軸上分解的頻帶數(shù)和數(shù)據(jù)數(shù)目與音調(diào)不同這一事實(shí),使用數(shù)據(jù)數(shù)目變換單元設(shè)定一個(gè)包線的振幅數(shù)據(jù)。也就是說,如果有效頻帶到3400千赫,則根據(jù)音調(diào)可以分解該有效頻帶為8到63個(gè)頻帶。從頻帶到頻帶得到的振幅數(shù)據(jù)|Am|的mMX+1的數(shù)目在8到63的范圍內(nèi)變化。于是數(shù)據(jù)數(shù)目變換單元119變換變化的數(shù)目mMX+1的振幅數(shù)據(jù)為數(shù)據(jù)的一個(gè)預(yù)先設(shè)定數(shù)M,例如44個(gè)數(shù)據(jù)。
      從數(shù)據(jù)數(shù)目變換單元供給到譜評測單元148的輸出單元或矢量量化單元116的輸入的預(yù)先設(shè)定數(shù)M,比如44,個(gè)振幅數(shù)據(jù)或包線數(shù)據(jù)根據(jù)預(yù)先設(shè)定數(shù),比如44,收集為單元,并由感性加權(quán)濾波器計(jì)算單元139矢量量化。從矢量量化器116來的包線指數(shù)在輸出端子103經(jīng)由開關(guān)117取出。在對加權(quán)的矢量量化之前,建議為由預(yù)先設(shè)定數(shù)目的數(shù)據(jù)組成的矢量使用合適的泄漏系數(shù)取禎間差。下面說明第二編碼單元120。第二編碼單元120具有碼激勵(lì)線性預(yù)測(CELP)編碼結(jié)構(gòu),并特別用于輸入語音信號的清音部分編碼。在為清音部分的CELP編碼結(jié)構(gòu)中,相應(yīng)于清音部分的LPC殘數(shù)的噪聲輸出為噪聲碼表亦即所謂的隨機(jī)碼表121的代表輸出通過增益電路126送往感性加權(quán)的濾波器122。從輸入端子101經(jīng)由高通濾波器(HPF)109提供并由感性加權(quán)濾波器125感性加權(quán)的語音信號供給減法器123,在這里得到感性加權(quán)的語音信號與從合成濾波器122來的信號之間的差或誤差。這一誤差供給距離計(jì)算電路124以找出距離,并由噪聲碼表121檢索使誤差最小的代表值矢量。上述即是使用閉環(huán)檢索接著使用綜合分析方法的時(shí)域波形矢量量化的總結(jié)。
      作為從第二編碼器120來的使用CELP編碼結(jié)構(gòu)的清音(UV)部分的數(shù)據(jù),從噪聲碼表121來的碼表的形狀指數(shù)、從增益電路126碼表來的增益指數(shù)被取出。作為從噪聲碼表121來的UV數(shù)據(jù)的形狀指數(shù)通過開關(guān)127s送往輸出端子107s,而作為增益電路126的UV數(shù)據(jù)的增益指數(shù)通過開關(guān)127g送往輸出端子107g。
      根據(jù)從V/UV鑒別單元115得到的V/UV鑒別結(jié)果打開或關(guān)閉這些開關(guān)127s、127g和開關(guān)117、118。具體地說,要傳輸?shù)恼Z音信號禎的V/UV鑒別結(jié)果指示為濁音(V)時(shí),打開開關(guān)117、118;而如果要傳輸?shù)恼Z音信號禎為清音(UV)時(shí),打開開關(guān)127s、127g。
      由編碼單元2輸出的編碼參數(shù)供給時(shí)期修改單元3。時(shí)期修改單元3通過時(shí)間軸的壓縮/擴(kuò)展修改輸出時(shí)期。在由時(shí)期修改單元3修改的時(shí)期中輸出的編碼的參數(shù)送往解碼單元4。
      解碼單元4包括一個(gè)為插值編碼參數(shù)的參數(shù)修改單元5,其由時(shí)期修改單元3沿時(shí)間軸使用示例的方法壓縮,產(chǎn)生與預(yù)先設(shè)定的禎的時(shí)間點(diǎn)關(guān)聯(lián)的修改過的編碼參數(shù),還包括一個(gè)為根據(jù)修改的編碼參數(shù)合成濁音信號部分和清音信號部分的語音合成單元6。
      參考圖4和圖5說明解碼單元4。在圖4中,碼表指數(shù)數(shù)據(jù),作為從時(shí)期修改單元3來的線性譜對(LSPs)的量化輸出數(shù)據(jù)供給輸入端子202。時(shí)期修改單元3的輸出,也就是說指數(shù)數(shù)據(jù),作為量化包絡(luò)線數(shù)據(jù)、音調(diào)數(shù)據(jù)和V/UV鑒別輸出數(shù)據(jù)分別供給輸入端子203、204和205。從時(shí)期修改單元3來的指數(shù)數(shù)據(jù)作為清音部分的數(shù)據(jù)還供給輸入端子207。
      從輸入端子203來的指數(shù)數(shù)據(jù)作為量化了的包絡(luò)線輸出送往逆矢量量化器212矢量量化以尋找LPC殘數(shù)的譜包絡(luò)線。在送往濁音合成單元211之前,LPC殘數(shù)的譜包絡(luò)線在靠近圖4產(chǎn)用箭頭P1指示的點(diǎn)臨時(shí)取出,由參數(shù)處理器5進(jìn)行參數(shù)修改,其在后面說明。然后指數(shù)數(shù)據(jù)送往濁音合成單元211。
      濁音合成單元211使用正弦合成方法合成濁音信號部分的LPC殘數(shù)。音調(diào)和V/UV鑒別數(shù)據(jù)分別進(jìn)入輸入端子204、205,并在圖4中的點(diǎn)P2和P3處臨時(shí)取出,由參數(shù)修改單元5修改參數(shù),其類似地供給濁音合成單元211。從濁音合成單元211來的濁音的參數(shù)送往LPC合成濾波器214。
      從輸入端子207來的UV數(shù)據(jù)的指數(shù)數(shù)據(jù)送往清音合成單元220。UV數(shù)據(jù)的指數(shù)數(shù)據(jù)由濁音合成單元220參考噪聲碼表變?yōu)榍逡舨糠值腖PC殘數(shù)。UV數(shù)據(jù)的指數(shù)數(shù)據(jù)從清音合成單元220臨時(shí)取出,由在圖4中的點(diǎn)P4指示的參數(shù)修改單元5修改參數(shù)。這樣用參數(shù)修改處理的LPC殘數(shù)也送往LPC合成濾波器214。
      LPC合成濾波器214在濁音信號部分的LPC殘數(shù)上和在清音信號部分的LPC殘數(shù)上執(zhí)行獨(dú)立的合成??蛇x的另外方案為可以在濁音信號部分的LPC殘數(shù)和清音信號部分的LPC殘數(shù)加在一起之上執(zhí)行LPC合成。
      從輸入端子202來的LSP指數(shù)數(shù)據(jù)送往LPC參數(shù)再生單元213。雖然LPC的α參數(shù)最終由LPC參數(shù)再生單元213產(chǎn)生,但是LSP的逆矢量量化的數(shù)據(jù)由箭頭P5指示的參數(shù)修改單元5部分地取出進(jìn)行參數(shù)修改。
      用參數(shù)修改如此處理的去量化數(shù)據(jù)返回到這一LPC參數(shù)再生單元213進(jìn)行LPC插值。然后去量化數(shù)據(jù)轉(zhuǎn)變?yōu)長PC的α參數(shù)供給LPC合成濾波器214。由LPC合成通過LPC合成濾波器214得到的語音信號在輸出端子201取出。圖4中所示的語音合成單元6接收修改的已編碼參數(shù),由參數(shù)修改單元5如上所述計(jì)算,而輸出合成的語音。語音合成單元的實(shí)際結(jié)構(gòu)示于圖5,其中相應(yīng)于圖4所示的元部件由同樣的數(shù)字表示。
      參考圖5,進(jìn)入輸入端子202的LSP指數(shù)數(shù)據(jù)送往LPC參數(shù)再生單元213的LSPs的逆矢量量化器231,以便逆矢量量化為LSPs(線性譜對),其供給參數(shù)修改單元5。
      從輸入端子來的譜包絡(luò)線Am的矢量量化指數(shù)數(shù)據(jù)送往逆矢量量化器212進(jìn)行逆矢量量化并轉(zhuǎn)變?yōu)樽V包線數(shù)據(jù)送往參數(shù)修改單元5。
      從輸入端子204、205來的音調(diào)數(shù)據(jù)和濁音/清音鑒別數(shù)據(jù)也送往參數(shù)修改單元5。
      從圖3的輸出端子107s和107g通過時(shí)期修改單元3供給圖5的輸入端子207s和207g作為UV數(shù)據(jù)的形狀指數(shù)數(shù)據(jù)和增益指數(shù)數(shù)據(jù)。然后形狀指數(shù)數(shù)據(jù)和增益指數(shù)數(shù)據(jù)供給清音合成單元220從端子207s來的形狀指數(shù)數(shù)據(jù)和從端子207g來的增益指數(shù)數(shù)據(jù)分別供給清音合成單元220的噪聲碼表221和增益電路222。從噪聲碼表221讀出的代表值輸出是相應(yīng)于清音的LPC殘數(shù)的噪聲信號分量,并成為增益電路222的預(yù)先設(shè)定增益的振幅。結(jié)果信號供給參數(shù)修改單元5。
      參數(shù)修改單元5插值由編碼單元2輸出并使其輸出時(shí)期由時(shí)期修改單元3修改的已編碼參數(shù),以產(chǎn)生修改的已編碼參數(shù),供給語音合成單元6。參數(shù)修改單元3修改已編碼參數(shù)的速度。這消除了解碼器輸出后的速度修改操作,并允許語音信號再生設(shè)備1以與類似算法不同的固定速率處理。
      參考圖6和圖8的流圖,解釋時(shí)期修改單元3和參數(shù)修改單元5。
      在圖6的步驟S1時(shí)期修改單元3接收編碼參數(shù),例如LSPs、音調(diào)、濁音/清音(V/UV)、譜包絡(luò)線Am和LPC殘數(shù)。LSPs、音調(diào)、(V/UV)、Am和LPC殘數(shù)分別表示為Lsp[n][p]、Peh[n]、VUV[n]/am[n][k]和res[n][i][j]。
      最終由參數(shù)修改單元5計(jì)算的修改的編碼參數(shù)表示為mod-lsp[m][p]、mod-Pah[m]、mod-UVv[m]、mod-am[m][k]和mod-res[m][i][j],其中k和p分別表示諧波數(shù)和LSP的階數(shù)。每一個(gè)n和m分別表示相應(yīng)于時(shí)間軸變換前和后的時(shí)域指數(shù)數(shù)據(jù)的禎數(shù)。同時(shí),每一個(gè)n和m表示具有間隔為20毫秒的禎的指數(shù),而i和j分別表示子禎數(shù)和采樣。
      然后時(shí)期修改單元3分別設(shè)定代表原始時(shí)間區(qū)間的禎數(shù)為N1,代表修改以后的時(shí)間區(qū)間的禎數(shù)為N2,如步驟S2所示。然后時(shí)期修改單元進(jìn)行語音N1到語音N2的時(shí)間軸壓縮,如步驟S3所示。也就是說,在時(shí)期修改單元3的時(shí)間軸壓縮比率是spd=N2/N1,限制條件為0≤n<N1和0≤m<N2。
      然后參數(shù)修改單元5設(shè)定相應(yīng)于禎數(shù),依次相應(yīng)于時(shí)間軸修改后的時(shí)間軸的指數(shù)m為2。
      然后參數(shù)修改單元5找兩個(gè)禎fr0和fr1和在兩禎fr0和fr1之間的左差和右差以及比率m/spd。
      如果參數(shù)lsp、Pah、UVv、am和res表示為*,則*[m]可以由生成公式mod-*[m]=*[m/spd]其中0≤m<N。然而,由于m/spd不是一個(gè)整數(shù),所以在m/spd處的修改的已編碼參數(shù)從下列兩禎fro=Lm/spd和fr1=fr0+1的插值產(chǎn)生。
      在幀fr0,即m/spd和幀fr1之間,圖7所示的關(guān)系式,即左=m/spd-fr0右=fr1-m/spd成立。
      對在圖7中的m/spd的已編碼參數(shù),亦即修改的已編碼參數(shù)可以由內(nèi)插找到,如步驟36所示。
      可以簡單地通過線性插值找到修改的編碼參數(shù)mod-*[m]=*[fr0]×右+*[fr1]×左然而,對于在兩禎fr0和fr1之間的插值,如果兩禎不同于V/UV,也就是說,如果其中之一是V,而另一個(gè)是UV,則不能使用上面的一般的公式。因此,參數(shù)修改單元5改變該方法,根據(jù)兩禎fr0和fr1的濁音(V)和清音(UV)特征來尋找編碼參數(shù),其在圖8的步驟11等指出。
      首先,如步驟11所示,確定兩禎fr0和fr1的濁音(V)和清音(UV)特征。如果發(fā)現(xiàn)這兩禎fr0和fr1都是濁音(V)處理轉(zhuǎn)移到步驟S12,這里所有的參數(shù)都線性插值,并由下式表示mod-Pah[m]=Pah[fr0]×右+Pah[fr1]×左mod-am[m][k]=am[fr0][k]×右+am[fr1][k]×左式中0≤k<1,L是諧波的最大可能數(shù)。對于am[fr1][k],0插在無諧波的位置。如果諧波數(shù)在禎fr0和fr1之間不同,則凡在空的位置均插入0。另一方案為,在通過解碼器側(cè)一些數(shù)據(jù)轉(zhuǎn)換器之前,可能使用一個(gè)固定的數(shù),例如0≤k<L,這里L(fēng)=43。
      mod-lsp[m][p]=lsp[fr0][p]×右+lsp[fr1][p]×左式中0≤p<P,其中P表示LSP的階數(shù),通常為10。
      mod-VUv[m]=1在V/UV鑒別中,1和0分別表示濁音(V)和清音(UV)。
      如果在步驟S11,判定兩禎fr0和fr1均不是濁音(V),則在步驟S13判定兩禎fr0和fr1是否都是清音(UV)。如果在步驟S13的判定結(jié)果為是,也就是說,如果兩禎都是清音,則插值單元5以m/spd作為中心和以pch作為最大值在res的前和后切分80個(gè)樣本,如步驟S14所示。
      結(jié)果是,如果在步驟S14左<右,則以m/spd為中心在res的前和后切分80個(gè)樣本,并插入res的模中,如圖9A所示。也就是說,對于(j=0;j<FRM×(1/2-m/spd+fr0);j++{mod res[m][o][j]=res[fr0[o][j+(m/spd-fr0)×FRM];}對于(=FRM×(1/2-m/spd+fr0);j<FRM/2;j++{mod res[m][o][j]=res[m][o][j]=res[fr0[l][j-FRM×(1/2-m/spd+fr0)];};對于(j=0;j<FRM×(1/2-m/spd+fr0);j++){mod res[m][l][j]=res[fr0[l][j+m/spd-fr0)×FRM];};對于(j=FRM×(1/2-m/spd+fr0);j=FRM/2;j++{mod res[m][l][j]=res[fr0[o][j+FRM×(1/2-m/spd+Fr0)];};式中FRM例如取160。
      另一方面,如果在步驟S14,左≥右,則插值單元5以m/spd為中心在res的前和后切分80個(gè)樣本,以產(chǎn)生mod_res,如圖9B所示。
      如果在步驟S13條件不滿足,處理轉(zhuǎn)移到步驟S15,這里判定禎fr0是否是濁音(V)和禎fr1是否是清音(UV),如果判定的結(jié)果為是,也就是說,如果禎fr0是濁音(V)和禎fr1是清音(UV),處理轉(zhuǎn)移到步驟S16。如果判定結(jié)果為否,也就是說,如果禎fr0是清音(UV),禎fr1是濁音(V),處理轉(zhuǎn)移到步驟S17。
      在步驟S15等的向下處理中,兩禎fr0和fr1不同于濁音/清音,也就是說濁音(V)和清音(UV)。這考慮了下述事實(shí),如果在不同于V/UV的兩禎之間插值參數(shù)的話,則插值結(jié)果沒有意義。
      在步驟S16,比較左尺寸(=m/spd-fr0)和右尺寸(=fr1-m/spd)以判定禎fr0是否接近m/spd。
      如果禎fr0接近m/spd,使用禎fr0的參數(shù)設(shè)定修改的已編碼參數(shù),使得mod-Pah[m]=Pah[fr0]mod-am[m][k]=am[fr0][n],其中0≤K≤L;mod-lsp[m][p]=lsp[fr0][p],其中0≤p≤I;mod-UVv[m]=l如步驟S18所示。
      如果在步驟S16的判定結(jié)果為否,即左≥右,使得禎fr1更接近,則處理轉(zhuǎn)移到步驟S19使音調(diào)最大。同時(shí),直接使用禎fr1的res如圖9C所示,并設(shè)定為mod-res。亦即mod-res[m][i][j]=resfr1[i][j]。理由是,對于濁音禎fr0不傳輸LPC殘數(shù)res。
      在步驟S17,根據(jù)在步驟S15給出的判定,即兩禎fr0和fr1分別為清音(UV)和濁音(V),給出類似于步驟S16的判定。也就是說,比較左大小(=m/spd-fr0)和右大小(=fr1-m/spd)以便判定fr0是否接近m/spd。
      如果禎fr0接近m/spd,處理轉(zhuǎn)移到步驟S18使音調(diào)最大。同時(shí),直接使用禎fr0的res并設(shè)定為模res。也就是說mod-res[m][i][j]=resfr0[i][j]理由是,對于濁音禎fr1,不傳輸LPC殘數(shù)res。
      如果在步驟S17的判定結(jié)果為否,左≥右,因此禎fr0接近m/spd,處理前進(jìn)到步驟S21,并使用禎fr1的參數(shù)設(shè)定修改的已編碼參數(shù),使得
      mod-Pah[m]=Pah[fr1]mod-am[m][k]=am[fr1][n],其中0≤K≤L;mod-lsp[m][p]=lsp[fr1][p],其中0≤p≤I;mod-VUV[m]=l以這種方式,插值單元5根據(jù)兩禎fr0和fr1的濁音/清音特征在圖6的步驟S6(更詳細(xì)地示于圖8)提供不同的插值操作。在步驟S6的插值結(jié)束后,處理轉(zhuǎn)移到步驟S7使m增量。步驟S5和S6的操作重復(fù),直到m的值等于N2。
      參考圖10集中解釋時(shí)期修改單元3和參數(shù)修改單元5的操作。參考圖10,由編碼單元2每20毫秒提取編碼參數(shù)的時(shí)期通過時(shí)期修改單元5執(zhí)行的時(shí)間軸壓縮修改為15毫秒,如圖10A所示。在響應(yīng)兩禎fr0和fr1的V/UV狀態(tài)執(zhí)行的插值操作中,參數(shù)修改單元每20毫秒計(jì)算修改的已編碼參數(shù),如圖10C所示。
      時(shí)期修改單元3和參數(shù)修改單元5的操作順序可以倒過來,也就是說首先對在圖11A中所示的已編碼參數(shù)進(jìn)行如圖11B中的插值,接著如圖11C進(jìn)行壓縮以計(jì)算修改的已編碼參數(shù)。
      返回到圖5,LSP上的數(shù)據(jù)的修改的已編碼參數(shù)lsp[m][p]由參數(shù)計(jì)算單元5計(jì)算,送往LSP插值電路232v、232u進(jìn)行LSP插值。結(jié)果數(shù)據(jù)由LSP到α變換電路234v、234u變換為用于線性預(yù)測編碼(LPC)的α參數(shù),送往LPC合成濾波器214。LSP插值插電路232v和LSP到α變換電路234v用于濁音(V)信號部分,而LSP插值電路234u和LSP到α變換電路234u用于清音(UV)信號部分。LPC合成濾波器214由一個(gè)用于濁音部分的LPC合成濾波器236和一個(gè)用于清音部分的LPC合成濾波器237組成。也就是說,LPC系數(shù)的插值對于濁音部分和清音部分獨(dú)立地進(jìn)行,以防止在具有完全不同特征的插值時(shí)在從濁音部分到清音部分的過渡區(qū)域或在從濁音部分到清音部分的過渡區(qū)域可能產(chǎn)生的不良影響。
      由參數(shù)修改單元5找到的譜包線數(shù)據(jù)上的修改的已編碼參數(shù)modam[m][k],送往濁音合成單元211的正弦合成電路215。由參數(shù)修改單元5計(jì)算的音調(diào)mod-pch[m]上的修改的已編碼參數(shù)和在V/UV判定數(shù)據(jù)上的修改的已編碼參數(shù)mod-UVv[m]也供給濁音合成單元211。相應(yīng)于圖3的LPC逆濾波器111的輸出的LPC殘數(shù)數(shù)據(jù)從正弦合成電路215取出送往加法器218。
      由參數(shù)修改單元5找到的譜包線數(shù)據(jù)上的修改的已編碼參數(shù)mod-am[m][k]、音調(diào)上的修改的已編碼參數(shù)起mod-Pch[m]和濁音/清音判定數(shù)據(jù)上的修改的已編碼參數(shù)mod-UVv[m]送往噪聲合成電路216為濁音(V)部分進(jìn)行噪聲相加。噪聲合成電路216的輸出通過加權(quán)疊加電路217送往加法器218。特別地說,考慮了來自已編碼語音數(shù)據(jù)的參數(shù)的噪聲,例如音調(diào)譜包線振幅、在禎或殘數(shù)信號級中的最大振幅,加在LPC合成濾波器輸入的LPC殘數(shù)信號的濁音部分,它是激勵(lì)信號,考慮到如果對LPC合成濾波器的濁音的輸入,它是激勵(lì)信號,是由正弦合成產(chǎn)生的話,則在低音調(diào)聲音中,例如男人的語音,產(chǎn)生“窒息的”感覺,而在聲音質(zhì)量在V和UV部分之間迅速改變時(shí),就會產(chǎn)生不自然的感覺。
      加法器218的和輸出送往用于濁音的合成濾波器236,在這里由LPC合成產(chǎn)生時(shí)間波形數(shù)據(jù)。另外,結(jié)果時(shí)間波形數(shù)據(jù)由一個(gè)后濾波器238v濾波,然后供給加法器239。
      注意如前所述,LPC合成濾波器214分為為V用的合成濾波器236和為UV用的合成濾波器237。如果合成濾波器不按這種方式分開,亦即如果在V和UV信號部分之間不加區(qū)別連續(xù)地每20個(gè)樣本或每2.5毫秒對LSPs進(jìn)行插值的話,則在V到UV和UV到V的過渡部分完全不同的特征的LSPs插值,于是產(chǎn)生外部聲音。為防止這種不良的效應(yīng),分開LPC合成濾波器為V的濾波器和為UV的濾波器以便獨(dú)立地對V和UV插值LPC系數(shù)。
      由參數(shù)修改單元5計(jì)算的LPC殘數(shù)上的修改的編碼參數(shù)mod-res[m][i][j]送往窗口電路223以便用濁音部分平滑連接部分。
      窗電路223的輸出送往LPC合成濾波器214的為UV的合成濾波器237作為清音合成單元220的輸出。合成濾波器237執(zhí)行數(shù)據(jù)的LPC合成,為清音部分提供時(shí)間波形,其由為清音的后濾波器238u濾波,然后供給加法器239。
      加法器239把從為濁音的后濾波器238v來的濁音部分的時(shí)間波形加到從為清音部分的后濾波器238u來的清音部分的時(shí)間波形數(shù)據(jù)上并把結(jié)果數(shù)據(jù)在輸出端子201上輸出。
      使用現(xiàn)在的語音信號再生設(shè)備1,代替固有矩陣*[^],其中0≤n<N1,以這種方式解碼一個(gè)修改的已編碼參數(shù)矩陣mod-*[m],式中0≤m<N2,。解碼時(shí)期的禎區(qū)間可以固定為例如通常的20毫秒。在這種情況下,時(shí)間軸壓縮和因而得到的再生率的加速可能在N2<N1下實(shí)現(xiàn),而時(shí)間軸的擴(kuò)展和因而得到的再生率的減速可能在N2>N1下實(shí)現(xiàn)。
      使用本系統(tǒng),最終得到的參數(shù)串放在一個(gè)固有間隔為20毫秒的矩陣中供解碼,以便可以容易地實(shí)現(xiàn)最優(yōu)加速。此外,加速和減速的實(shí)現(xiàn)使用同一處理操作不需任何區(qū)別。其結(jié)果是,可以以兩倍于實(shí)時(shí)速度的速度復(fù)制固態(tài)紀(jì)錄的內(nèi)容。由于不管增加的放音速度音調(diào)和音素保持不變,所以可以容易地辨別紀(jì)錄的內(nèi)容而不管以顯著增加的放音速度復(fù)制。
      如果N2<N1,也就是說如果放音速度降低,則由于在清音的場合復(fù)數(shù)參數(shù)mod_res從同一LPC殘數(shù)res產(chǎn)生,所以放出的聲音可能不自然。在這種情況下,在參數(shù)mod-res上可以加一個(gè)適當(dāng)數(shù)量的噪聲以消除這種不自然到一定程度。也可以應(yīng)用適當(dāng)產(chǎn)生的高斯噪聲或從碼表中隨機(jī)選擇的激勵(lì)矢量代替參數(shù)mod-res而不用加噪聲。
      使用上述語音信號復(fù)制設(shè)備1,從編碼單元2來的編碼參數(shù)的輸出時(shí)期的時(shí)間軸由時(shí)期修改單元3為加速復(fù)制速度而壓縮。不過,禎長度可以由解碼單元4改變以控制復(fù)制速度。
      在這種情況下,由于禎長度是可變的,而禎數(shù)目n在解碼單元4的參數(shù)修改單元5產(chǎn)生參數(shù)前和后不變。
      參數(shù)修改單元5還分別修改參數(shù),lsp[n][p]和UVv[m]為mod-lsp[n][p]和mod-UVv[n]而不管所涉及的禎是濁音還是清音。
      如果mod-UVv[m]是1,也就是說如果所涉及的禎是濁音(V),則參數(shù)Pch[n]和am[n][k]分別修改為mod-Pch[n]和mod-am[n][k]。
      如果mod-UVv[m]是0,也就是說如果所涉及的禎是清音(V),則參數(shù)res[n][i][j]修改為mod-res[n][i][j]。
      參數(shù)修改單元5直接修改lsp[n][p]、Pch[n]、UVv[n]和am[n][k]為mod-lsp[n][p]、mod-Pch[n]、mod-UVv[m]和mod-am[n][k]。不過參數(shù)修改單元根據(jù)速度spd改變殘數(shù)信號mod-res[n][i][j]。
      如果速度spd<1.0,也就是說,如果速度較快,則原始信號的殘數(shù)信號在中間部分切分,如圖12所示。如果原始禎長度是OrgFrmL,則從原始禎長度res[n][j]切下(OrgFrmL-FrmL)/2≤j≤(OrgFrmL+frmL)/2給mod-res[n][j]。從原始禎的前端切分也是可以的。
      如果速度spd>1.0,也就是說,如果速度比較慢,則使用原始禎而對任何短缺的部分使用加有噪聲分量的原始禎。也可以使用加有適當(dāng)產(chǎn)生的噪聲的解碼激勵(lì)矢量。可以產(chǎn)生高斯噪聲并用作激勵(lì)矢量以減少由同樣波形的禎的連續(xù)而產(chǎn)生的不相容的感覺。上面的噪聲分量也可以加在原始禎的兩端。
      于是,在速度信號復(fù)制設(shè)備1配置為通過改變禎的長度而改變速度控制的場合,速度合成單元6構(gòu)造和設(shè)計(jì)為使LSP插值單元232v和232u、正弦合成單元215和窗單元223執(zhí)行不同的操作來通過時(shí)間軸壓縮控制速度。
      如果所涉及的禎是濁音禎(V),則LSP插值單元232v尋找滿足關(guān)系frmL/P≤20的最小整數(shù)p。如果所涉及的禎是清音禎(UV),則LSP插值單元232u尋找滿足關(guān)系frml/P≤80的最小整數(shù)p。為LSP插值的子禎的范圍subl[i][j]由下式確定nint(frmL/p×i)≤j≤nint(frmL/P×(j+1),其中0≤i≤p-1在上式中,nint(x)是一個(gè)函數(shù),它通過圓整十分位而返回一個(gè)最接近x的整數(shù)。對于濁音和清音兩者,如果frmL小于20或80,則p=1。
      例如,對于第i個(gè)子禎,由于該子禎的中心是frmL×(2i+1)/2p,LSPs以frmL×(2p-2i-1)/(20frmL×(2i+1)/2p的速率插值,如同在我們的待審日本專利申請6-198451中公開的。
      另一方案為,子禎數(shù)目可以固定,而每一子禎的LSPs可以以同一速率在任何時(shí)間插值。正弦合成單元223修改窗長度以與禎長度frmL匹配。
      使用上述語音信號復(fù)制設(shè)備1,對于輸出時(shí)期在時(shí)間軸上被壓縮的已編碼參數(shù),使用時(shí)期修改單元3和參數(shù)修改單元5修改,以改變復(fù)制速度而不改變音調(diào)和音素。不過也可以省略時(shí)期修改單元3而由編碼單元2通過在圖14中所示解碼單元8的一些數(shù)據(jù)變換單元270處理這些已編碼數(shù)據(jù),改變音調(diào)而不改變音素。在圖14中,用同樣的數(shù)字指示相應(yīng)于圖4所示的元部件。
      解碼單元8所基于的基本概念是在一個(gè)預(yù)先設(shè)定的頻帶中變換從編碼單元2來的編碼語音數(shù)據(jù)的諧波的基本頻率和振幅數(shù)據(jù)的數(shù)目,它使用作為數(shù)據(jù)變換設(shè)備的一定數(shù)目的數(shù)據(jù)變換單元270執(zhí)行只變換音調(diào)而不改變音素的操作。數(shù)據(jù)數(shù)目變換單元270通過修改說明在每一輸入諧波中的譜分量大小的數(shù)據(jù)數(shù)目改變音調(diào)。
      參考圖14,相應(yīng)于圖2和圖3的輸出端子102的輸出的一個(gè)LSPs的矢量量化輸出,或碼表指數(shù),供給輸入端子202。
      LSP指數(shù)數(shù)據(jù)送往LPC參數(shù)復(fù)制單元213的逆矢量量化器231為逆矢量量化為線性譜對(LSPs)。LSPs送往LSP插值電路232、233進(jìn)行插值,然后供給LSP到α變換電路234、235以變換為線性預(yù)測碼的α參數(shù)。這些α參數(shù)送往LPC合成濾波器214。LSP插值電路232和α變換電路234用于濁音(V)信號部分,而LSP插值電路233和LSp到α變換電路235用于清音(UV)信號部分。LPC合成濾波器214由用于濁音部分的一個(gè)LPC合成濾波器236和用于清音部分的一個(gè)LPC合成濾波器237組成。也就是說,LPC系數(shù)插值對濁音部分和清音部分獨(dú)立地執(zhí)行,以防止在插值從濁音部分到清音部分的過渡區(qū)域和從清音部分到濁音部分的過渡區(qū)域完全不同特征的LSPs可能引起的不良影響。
      在圖14的輸入端子203上供有相應(yīng)于在圖2和圖3所示的編碼器的端子103的輸出的譜包線Am的加權(quán)矢量量化代碼指數(shù)數(shù)據(jù)。在輸入端子205供有從圖2和圖3的端子105來的濁音/清音判定數(shù)據(jù)。
      從輸入端子203來的譜包絡(luò)線Am的矢量量化指數(shù)數(shù)據(jù)送往逆矢量量化器進(jìn)行逆矢量量化。逆矢量量化的包絡(luò)線的振幅數(shù)據(jù)的數(shù)目固定為一個(gè)預(yù)先設(shè)定的值例如44。基本上,變換數(shù)據(jù)數(shù)目為給出相應(yīng)于音調(diào)數(shù)據(jù)的諧波數(shù)目。如果希望改變音調(diào),例如在本實(shí)施例中這樣,從逆矢量量化器212來的包絡(luò)線數(shù)據(jù)送往數(shù)據(jù)數(shù)目變換單元270為例如通過插值改變振幅數(shù)據(jù)的數(shù)目,取決于希望的音調(diào)值。
      數(shù)據(jù)數(shù)目變換單元270還由從輸入端子204來的音調(diào)數(shù)據(jù)供給使得在編碼時(shí)期的音調(diào)改變?yōu)橐粋€(gè)希望的音調(diào)輸出。振幅數(shù)據(jù)和修改的音調(diào)數(shù)據(jù)送往濁音合成電路211的正弦合成電路215。供給合成電路215的振幅數(shù)據(jù)的數(shù)目相應(yīng)于從數(shù)據(jù)數(shù)目變換單元270來的LPC殘數(shù)的譜包絡(luò)線的修改后的音調(diào)。
      有多種插值方法用于使用數(shù)據(jù)數(shù)目變換單元270來改變LPC殘數(shù)的譜包絡(luò)線的振幅數(shù)據(jù)數(shù)目。例如,為插值在頻率軸上有效頻帶塊的振幅數(shù)據(jù)從在該塊中最后一個(gè)振幅數(shù)據(jù)直到塊中第一振幅數(shù)據(jù)的一適當(dāng)數(shù)目的啞數(shù)據(jù)或延伸塊中最左端(第一數(shù)據(jù))到最右端(最后數(shù)據(jù))的啞數(shù)據(jù)附在塊中的振幅數(shù)據(jù)上以增大數(shù)據(jù)數(shù)目到NF。然后通過頻帶限制型Os元組過采樣,例如8元組過采樣尋找一個(gè)振幅的Os元組數(shù)。振幅數(shù)據(jù)的Os元組數(shù)((mMx+1)X數(shù)據(jù)的Os數(shù))通過插值進(jìn)一步擴(kuò)展到一個(gè)更大的數(shù)NM,例如2048。這一NM數(shù)目數(shù)據(jù)通過大量抽殺變換為預(yù)先設(shè)定的數(shù)M(例如44),然后對該預(yù)先設(shè)定的數(shù)目的數(shù)據(jù)執(zhí)行矢量量化。
      作為對數(shù)據(jù)數(shù)目變換單元270的操作示例,說明對音調(diào)延遲的頻率為Fo=fs/L的情況,式中fs是采樣頻率,為fs=8千赫芝=8000赫芝。
      在這種情況下,音調(diào)頻率F=8000/L,而有n=L/2的諧波設(shè)定到4000赫茲。在3400Hz的一般語音范圍中,諧波數(shù)目為(L/2)X(3400/4000)。它們在進(jìn)行矢量量化之前由上述數(shù)據(jù)數(shù)目變換或大小變換變換到例如44。如果只是要改變音調(diào),則沒有必要進(jìn)行量化。
      在逆矢量量化后,諧波數(shù)目44可以由數(shù)據(jù)數(shù)目變換單元270通過大小變換改變?yōu)橐粋€(gè)希望的數(shù)目,也就是說變?yōu)橐粋€(gè)希望的音調(diào)頻率Fx。相應(yīng)于音調(diào)頻率Fx(Hz)的音調(diào)延遲Lx為Lx=8000/Fx,這樣,設(shè)定到3400赫芝的諧波的數(shù)目為(Lx/2)×(3400/4000)=(4000/Fx)×(3400/4000)=3400/Fx即3400/Fx。也就是說通過大小變換或在數(shù)據(jù)數(shù)目變換單元270中的數(shù)據(jù)數(shù)目變換執(zhí)行從44到3400/Fx就足夠了。
      如果在執(zhí)行譜數(shù)據(jù)的矢量量化之前的編碼時(shí)期發(fā)現(xiàn)禎與禎的差,則在逆矢量量化后解碼禎與禎的差。然后執(zhí)行數(shù)據(jù)數(shù)目的變換以產(chǎn)生譜包線數(shù)據(jù)。
      正弦合成電路215不只由音調(diào)數(shù)據(jù)和從數(shù)據(jù)數(shù)目變換單元270來的LPC殘數(shù)的譜包線振幅數(shù)據(jù)供給,還由從輸入端子205來的濁音/清音判定數(shù)據(jù)供給,從正弦合成電路215取出LPC殘數(shù)數(shù)據(jù)并送往加法器218。
      從逆矢量量化器212來的包絡(luò)線數(shù)據(jù)、從輸入端子204來的音調(diào)數(shù)據(jù)和從輸入端子205來的濁音/清音判定數(shù)據(jù)送往噪聲加法電路216為濁音(V)部分進(jìn)行噪聲相加。具體地說,考慮了從已編碼語音數(shù)據(jù)來的參數(shù)的噪聲,例如音調(diào)譜包絡(luò)線振幅,禎或殘數(shù)信號級中的最大振幅,加到LPC殘數(shù)信號的濁音部分作為LPC合成濾波器的輸入,它是激勵(lì)信號,考慮到如果對濁音的LPC合成濾波器的輸入,它是激勵(lì)信號,是由正弦合成產(chǎn)生的話,則在低音調(diào)聲音中,例如男人的語音,產(chǎn)生“窒息的”感覺,而在聲音質(zhì)量在V和UV語音部分之間迅速改變時(shí),就會產(chǎn)生不自然的感覺。
      加法器218的和輸出送往為濁音的合成濾波器236,這里由LPC合成產(chǎn)生時(shí)間波形數(shù)據(jù)。另外,結(jié)果時(shí)間波形數(shù)據(jù)為由濁音數(shù)據(jù)的一個(gè)后濾波器238v濾波,然后供給加法器239。
      在圖14的輸入端子207s和207g上供給形狀指數(shù)數(shù)據(jù)和增益指數(shù)數(shù)據(jù)作為通過時(shí)期修改單元3從圖3的輸出端子107s和107g來的UV數(shù)據(jù)。然后形狀指數(shù)數(shù)據(jù)和增益指數(shù)數(shù)據(jù)供給清音合成單元220。從端子207s來的形狀指數(shù)數(shù)據(jù)和從端子207g來的增益指數(shù)數(shù)據(jù)分別供給清音合成單元220的噪聲碼表221和增益電路222。從噪聲碼表221讀出的代表值輸出是相應(yīng)于清音的LPC殘數(shù)的噪聲信號分量而成為增益電路222中一個(gè)預(yù)先設(shè)定的增益的振幅。預(yù)先設(shè)定的增益振幅的代表值輸出送往窗電路223以平滑到濁音信號部分的連接部分。
      窗電路223的輸出作為清音合成單元220的輸出送往LPC合成濾波器214的為清音(UV)部分的合成濾波器237。窗電路223的輸出由合成濾波器237用LPV合成處理而給出清音信號部分的時(shí)域波形信號,然后由為清音部分的后濾波器238u濾波再供給加法器239。
      加法器239把從為濁音的后濾波器238v來的濁音信號部分的時(shí)域波形信號加到從為清音信號部分的后濾波器238u來的清音信號部分的時(shí)域波形數(shù)據(jù)上。結(jié)果和信號在輸出端子201上輸出。
      從上面可以看到,通過改變諧波的數(shù)目而不改變譜包線的形狀可以改變音調(diào)而不改變語音的音素。于是,如果一個(gè)語音模式的已編碼數(shù)據(jù),亦即編碼位流可用的話,則可以為合成有選擇地改變音調(diào)。
      參考圖15,由圖2和圖3的編碼器編碼而獲得的已編碼數(shù)據(jù)的編碼位流通過編碼數(shù)據(jù)輸出單元301輸出。在這些數(shù)據(jù)中,至少音調(diào)數(shù)據(jù)和譜包線數(shù)據(jù)通過數(shù)據(jù)變換單元302送往波形合成單元303。與音調(diào)變換無關(guān)的數(shù)據(jù),例如濁音/清音(V/UV)判定數(shù)據(jù)直接送往波形合成單元303。
      波形合成單元303根據(jù)譜包線數(shù)據(jù)或音調(diào)數(shù)據(jù)合成語音波形。自然,在圖4和圖5所示的合成設(shè)備的場合下,LSP數(shù)據(jù)和CELP數(shù)據(jù)也從輸出單元301中取出而如上述供給。
      在圖15的配置中,至少音調(diào)數(shù)據(jù)和譜包線數(shù)據(jù)根據(jù)希望的音調(diào)由數(shù)據(jù)變換單元302如上所述變換,然后供給波形合成單元303,在這里從變換的數(shù)據(jù)合成語音波形。于是,音調(diào)改變而音素未變的語音信號可以在輸出端子304取出。
      上述技術(shù)可以應(yīng)用于由規(guī)則或文本的語音的合成。
      圖16表示本發(fā)明應(yīng)用到語音文字合成的一個(gè)例子。在本實(shí)施例中,上述用于壓縮語音編碼的解碼器可以同時(shí)用作文字語音合成器。在圖16的例子中,語音數(shù)據(jù)的再生聯(lián)合使用。
      在圖16中,語音規(guī)則合成器和帶上述為修改音調(diào)的數(shù)據(jù)變換的語音合成器結(jié)合在一個(gè)按照規(guī)則的語音合成單元300中。從文字分析單元310來的數(shù)據(jù)供給按照規(guī)則的語音合成單元300,從它輸出具有希望音調(diào)的合成語音并送往轉(zhuǎn)換開關(guān)330的一個(gè)固定觸點(diǎn)a。語音復(fù)制單元320讀出偶而壓縮的語音數(shù)據(jù)并存儲在例如只讀存儲器的存儲器中并為擴(kuò)展而解碼這些數(shù)據(jù)。解碼的數(shù)據(jù)送往轉(zhuǎn)換開關(guān)330的另一固定觸點(diǎn)b。一個(gè)合成語音信號和復(fù)制語音信號由轉(zhuǎn)換開關(guān)330選擇并在輸出端子340上輸出。
      圖16所示設(shè)備用于例如車輛導(dǎo)行系統(tǒng)。在這種場合下,從語音再生器320來的高質(zhì)量高清晰度的復(fù)制語音可用于日常語音,例如提供指示的“請向右轉(zhuǎn)”,而從按照規(guī)則的語音合成生成器300來的合成語音可以用于特殊指示物的語音,例如建筑物或地界,它數(shù)量大,不能作為語音信息存儲在只讀存儲器中。
      本發(fā)明有另外的優(yōu)點(diǎn),即同樣的硬件可以用于計(jì)算機(jī)語音合成器300和語音復(fù)制器320。
      本發(fā)明不限于上述實(shí)施例。例如,上述作為硬件敘述的圖1和圖3的語音分析側(cè)(編碼器)或在圖14中的語音合成一側(cè)(解碼器)的構(gòu)建可以通過使用例如數(shù)字信號處理器(DSP)的一個(gè)軟件程序?qū)崿F(xiàn)。多個(gè)禎的數(shù)據(jù)可以一起處理并由矩陣量化而代替矢量量化。本發(fā)明也可以應(yīng)用于大量語音分析/合成方法。本發(fā)明也不限于傳輸或紀(jì)錄/復(fù)制而可能應(yīng)用于各種用途,例如音調(diào)轉(zhuǎn)換速度或速率變換按照規(guī)則的語音合成或噪聲抑制。
      上述信號編碼和信號解碼設(shè)備可以用作示于圖14中的用于例如便攜式通信終端或便攜電話機(jī)中的語音編碼器。
      圖17表示使用在圖2和圖3中所示配置的語音編碼單元160的便攜式終端的發(fā)送一側(cè)。由受話器161接收的語音信號由放大器162放大并由模/數(shù)(A/D)轉(zhuǎn)換器163變換為數(shù)字信號,其送往在圖1和圖3中所示配置的語音編碼單元160。從換/數(shù)變換器163來的數(shù)字信號供給輸入端子101。語音編碼單元160執(zhí)行編碼,其已結(jié)合圖1和圖3敘述。圖1和圖2的輸出端子的輸出信號作為語音編碼單元160的輸出信號送往發(fā)送頻道編碼單元164,它隨之對供給的信號執(zhí)行頻道編碼。發(fā)送頻道編碼單元164的輸出信號送往調(diào)制電路165進(jìn)行調(diào)制,然后通過數(shù)/模變換器166和一個(gè)RF放大器167供給天線168。
      圖18表示使用在圖5和圖14中所示配置的語音解碼單元260的便攜式終端的接收一側(cè)。由圖18的天線261接收的語音信號由RF放大器262放大并通過模/數(shù)變換器263送往解調(diào)電路264,解調(diào)的信號從這里送往發(fā)送頻道解碼單元265。解碼單元265的輸出信號供給在圖5和圖14中所示配置的語音解碼單元260。語音解碼單元260解碼這一信號,其已結(jié)合圖5和圖14敘述。在圖2和圖4的輸出端子201上的輸出信號作為語音解碼單元260的信號送往數(shù)/模(D/A)變換器266。從模/數(shù)變換器266來的模擬語音信號送往揚(yáng)聲器268。
      權(quán)利要求
      1.一種根據(jù)已編碼參數(shù)復(fù)制語音信號的方法,這些已編碼參數(shù)是根據(jù)預(yù)先設(shè)定的編碼單元在時(shí)間軸上切分輸入語音信號和編碼切分的輸入語音信號而得到的,其特征在于包括插值所述已編碼參數(shù)為希望的時(shí)間點(diǎn)尋找修改的已編碼參數(shù)和根據(jù)修改的已編碼參數(shù)復(fù)制該語音信號。
      2.按照權(quán)利要求1所述的方法,其中所述已編碼參數(shù)是就諧波編碼得到的。
      3.按照權(quán)利要求1所述的方法,其中,判定所述輸入語音信號是濁音還是清音信號,并根據(jù)判定結(jié)果,判定為濁音的輸入語音信號部分由正弦合成編碼器編碼,而判定為清音的輸入語音信號部分使用綜合分析方法閉環(huán)檢索最優(yōu)矢量由矢量量化器量化。
      4.按照權(quán)利要求1所述的方法,其中進(jìn)一步包括擴(kuò)展從一個(gè)編碼單元到另一個(gè)編碼單元得到的已編碼參數(shù)的時(shí)間軸為修改所述已編碼參數(shù)的時(shí)期的時(shí)期修改步驟,插值修改的參數(shù)以尋找與相應(yīng)于所述編碼單元的時(shí)間點(diǎn)相關(guān)的修改的已編碼參數(shù)的插值步驟,根據(jù)所述修改的已編碼參數(shù)合成所述濁音和清音部分的語音合成步驟。
      5.按照權(quán)利要求1所述的方法,其中,一個(gè)噪聲分量在合成所述清音部分的時(shí)間加在一個(gè)激勵(lì)信號上,所述噪聲分量由所述激勵(lì)信號代替或使用從碼表中隨機(jī)選擇的一個(gè)激勵(lì)矢量。
      6.一種根據(jù)已編碼參數(shù)復(fù)制語音信號的裝置,這些已編碼參數(shù)是根據(jù)預(yù)先設(shè)定的編碼單元在時(shí)間軸上切分輸入語音信號和編碼被切分的輸入語音信號而得到的,其特征在于插值所述已編碼參數(shù)為希望的時(shí)間點(diǎn)尋找修改的已編碼參數(shù)和根據(jù)修改的已編碼參數(shù)復(fù)制該語音信號。
      7.按照權(quán)利要求6所述的裝置,其中,所述已編碼參數(shù)是就諧波編碼得到的。
      8.按照權(quán)利要求6所述的裝置,其中,判定所述輸入語音信號是濁音還是清音信號,并根據(jù)判定結(jié)果,判定為濁音的輸入語音信號部分由正弦合成編碼器編碼,而判定為清音的輸入語音信號部分使用綜合分析方法閉環(huán)檢索最優(yōu)矢量由矢量量化器量化。
      9.按照權(quán)利要求6所述的裝置,其中進(jìn)一步包括擴(kuò)展從一個(gè)編碼單元到另一個(gè)編碼單元得到的已編碼參數(shù)的時(shí)間軸為修改所述已編碼參數(shù)的時(shí)期的時(shí)期修改步驟,插值修改的參數(shù)以尋找與相應(yīng)于所述編碼單元的時(shí)間點(diǎn)相關(guān)的修改的已編碼參數(shù)的插值步驟,根據(jù)所述修改的已編碼參數(shù)合成所述濁音和清音部分的語音合成步驟。
      10.按照權(quán)利要求6所述的裝置,其中,一個(gè)噪聲分量在合成所述清音部分的時(shí)間加在一個(gè)激勵(lì)信號上,所述噪聲分量由所述激勵(lì)信號代替或使用從碼表中隨機(jī)選擇的一個(gè)激勵(lì)矢量。
      11.一種根據(jù)已編碼參數(shù)復(fù)制語音信號的方法,這些已編碼參數(shù)是根據(jù)預(yù)先設(shè)定的塊在時(shí)間軸上切分輸入語音信號和編碼被切分的輸入語音信號而得到的,其特征在于,使用所述編碼參數(shù)和與在這些時(shí)間不同長度的塊復(fù)制該語音。
      12.按照權(quán)利要求11所述的方法,其中,所述已編碼參數(shù)是通過諧波編碼或LPC殘數(shù)的諧波編碼的第一步驟和波形編碼的第二步驟找到的。
      13.按照權(quán)利要求11所述的方法,其中,判定所述輸入語音信號是濁音還是清音信號,并根據(jù)判定結(jié)果,判定為濁音的輸入語音信號部分由諧波編碼方法或LPC殘數(shù)的諧波編碼方法編碼,而判定為清音的輸入語音信號部分使用綜合分析方法的LPC殘數(shù)的時(shí)間波形的矢量量化方法量化。
      14.按照權(quán)利要求12所述的方法,其中,代表一個(gè)譜包線的LSPs的插值的子禎長度響應(yīng)由一個(gè)解碼器指定的復(fù)制速度修改。
      15.按照權(quán)利要求11所述的方法,其中,為清音信號部分的激勵(lì)信號長度以這樣的方式修改,即如果長度減小,則使用固有激勵(lì)信號,如果長度短缺,則用一個(gè)噪聲分量加在固有激勵(lì)信號上,使用一個(gè)噪聲分量或從一個(gè)激勵(lì)信號碼表隨機(jī)選擇的激勵(lì)矢量。
      16.按照一種語音解碼方法,包括變換輸入已編碼語音數(shù)據(jù)的基本頻率和在預(yù)先設(shè)定的頻帶內(nèi)的諧波數(shù)的步驟,為修改合成的語音的音調(diào),插值和修改說明在每一個(gè)輸入諧波中的譜分量大小的數(shù)據(jù)數(shù)目的步驟。
      17.權(quán)利要求16所述的方法,其中,使用一個(gè)頻帶限制型過采樣濾波器執(zhí)行所述插值。
      18.一種語音解碼裝置,其特征在于包括變換輸入已編碼語音數(shù)據(jù)的基本頻率和在預(yù)先設(shè)定的頻帶內(nèi)的諧波數(shù)的設(shè)備,為修改合成的語音的音調(diào),插值和修改說明在每一個(gè)輸入諧波中的譜分量大小的數(shù)據(jù)數(shù)目的設(shè)備。
      19.按照權(quán)利要求18所述的裝置,其中,使用一個(gè)頻帶限制型過采樣濾波器執(zhí)行所述插值。
      20.一種語音合成方法,其特征在于包括按照一個(gè)預(yù)先設(shè)定的為輸出諧波的振幅數(shù)據(jù)的規(guī)則合成常規(guī)語音的常規(guī)語音合成步驟,變換輸入數(shù)據(jù)的諧波的基本頻率和在一個(gè)預(yù)先設(shè)定的頻帶內(nèi)的振幅數(shù)目的數(shù)據(jù)數(shù)目變換步驟,為修改合成語音的音調(diào),插值說明在每一個(gè)輸入諧波中的譜分量的大小的數(shù)據(jù)的步驟。
      21.按照權(quán)利要求20所述的語音合成方法,其中,使用一個(gè)頻帶限制型過采樣濾波器執(zhí)行所述插值。
      22.一種語音合成裝置,其特征在于包括按照一個(gè)為輸出諧波的振幅數(shù)據(jù)的文本合成常規(guī)語音的常規(guī)語音合成裝置,變換輸入數(shù)據(jù)的諧波的基本頻率和在一個(gè)預(yù)先設(shè)定的頻帶內(nèi)的振幅數(shù)目的數(shù)據(jù)數(shù)目變換裝置,為修改合成合成語音的音調(diào),插值說明在每一個(gè)諧波中的譜分量的大小的數(shù)據(jù)的裝置。
      23.按照權(quán)利要求22所述的語音合成裝置,其中,使用一個(gè)頻帶限制型過采樣濾波器執(zhí)行所述插值。
      24.一種便攜無線電終端設(shè)備,其特征在于包括放大接收信號的放大器設(shè)備,為A/D變換繼之解調(diào)所述放大的信號的解調(diào)設(shè)備;為頻道編碼所述解調(diào)的信號的發(fā)送路徑解碼設(shè)備,為語音編碼所述發(fā)送路徑解碼設(shè)備的輸出的語音解碼設(shè)備,為產(chǎn)生模擬語音信號,為D/A變換從所述語音解碼設(shè)備來的解碼的語音信號的D/A變換設(shè)備。
      25.按照權(quán)利要求24所述的便攜無線電終端設(shè)備,其中,語音解碼設(shè)備包括變換輸入數(shù)據(jù)的諧波的基本頻率和在一個(gè)預(yù)先設(shè)定的頻帶內(nèi)的振幅數(shù)目的數(shù)據(jù)數(shù)目變換設(shè)備;為修改合成語音的音調(diào),插值說明在每一個(gè)輸入諧波中的譜分量大小的數(shù)據(jù)的設(shè)備。
      全文摘要
      一種以控制的速度復(fù)制語音的方法,其編碼單元鑒別輸入語音信號是濁音還是清音信號。依鑒別結(jié)果,編碼單元對判定為濁音的信號部分執(zhí)行正弦合成和編碼,對判定為清音的信號部分由對最優(yōu)矢量的檢索使用綜合分析方法執(zhí)行矢量量化、解碼單元產(chǎn)生與對應(yīng)于預(yù)先設(shè)定禎的不同時(shí)間點(diǎn)相關(guān)的修改的已編碼參數(shù)。語音合成單元合成濁音部分和清音部分。用編碼的數(shù)據(jù)輸出單元輸出編碼的位流或編碼的數(shù)據(jù)。波形合成單元合成語音波形。
      文檔編號G10L21/04GK1152776SQ9612190
      公開日1997年6月25日 申請日期1996年10月26日 優(yōu)先權(quán)日1995年10月26日
      發(fā)明者飯島和幸, 西口正之, 松本淳, 大森士郎 申請人:索尼公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1