国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      語速變換方法及其裝置的制作方法

      文檔序號:7579418閱讀:220來源:國知局
      專利名稱:語速變換方法及其裝置的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及用于電視機、收音機、磁帶錄音機、磁帶錄像機或磁盤錄象機等各種影像機器、音響機器、醫(yī)療機器中所用的語速變換方法及其裝置,特別涉及對發(fā)話者的聲音進(jìn)行加工,能夠得到適合于受聽者聽覺能力的聲音速度的語速變換方法及其裝置。
      背景技術(shù)
      通常,例如將一方(發(fā)話者)的話讓另一方(受聽者)聽到的情況下,由于年齡或其它障礙,當(dāng)受聽者的聲音識別臨界速度(能準(zhǔn)確地識別聲音的最大語速)等的聽覺能力降低時,該受聽者不容易識別用通常速度或用快速發(fā)出的聲音。這時,通常是采用助聽器來彌補受聽者的聽覺能力。
      但是現(xiàn)有技術(shù)中,為聽覺能力降低者或聽力障礙者設(shè)計的助聽器,僅僅是通過頻率特性的改善及接收能的控制等來輔助聽覺系統(tǒng)的外耳、中耳的傳遞特性。其主要的問題是,不能彌補因聽覺中樞的退化而引起的聲音識別能力的降低。
      針對該問題,最近提出了一種語速控制型的助聽裝置,該助聽裝置對發(fā)話者的聲音進(jìn)行加工,幾乎實時地使聲音速度適合于受聽者的聽覺能力,以達(dá)到助聽目的。
      該語速控制型的助聽裝置中,對發(fā)話者的聲音在時間上進(jìn)行拉長處理,把該拉長處理得到的聲音逐次地蓄存到輸出緩沖存儲器內(nèi),然后輸出,使發(fā)話者的語速變化(變慢),以彌補受聽者聽覺能力的降低。
      但是,上述現(xiàn)有的語速控制型助聽器,存在以下問題。
      首先,現(xiàn)有的語速控制型助聽器,如上所述,由于是對輸入的聲音數(shù)據(jù)進(jìn)行拉長處理后,把該拉長處理得到的聲音逐次蓄存到輸出緩沖存儲器內(nèi),然后輸出,所以,例如,在受聽過程中希望語速更緩慢一些時或希望回到原來狀態(tài)時,在把蓄存在輸出緩沖存儲器內(nèi)的聲音數(shù)據(jù)全部輸出完之前,不能使語速回到原來狀態(tài)。
      因此,在受聽過程中使語速回到原來狀態(tài)時,從現(xiàn)在的語速到回到原來狀態(tài)之間,產(chǎn)生相當(dāng)長的時間延遲。
      另外,上述現(xiàn)有的語速控制型助聽器,不僅用于上述聽覺能力降低的受聽者,而且也用于具有通常聽覺能力的受聽者、例如聽取外國語的情況下,為了加強聽力,使語速變化(變慢)。但是在該情況下,與上述同樣地,在受聽過程中變更語速時,也產(chǎn)生時間延遲的問題。
      本發(fā)明是鑒于上述問題而作出的,其目的在于提供一種語速變換方法及其裝置。本發(fā)明的語速變換方法及裝置,能相應(yīng)于受聽者的操作,使輸出聲音的語瞬時跟上。由此大幅度提高受聽者的使用便利性。

      發(fā)明內(nèi)容
      概要為了實現(xiàn)上述目的,權(quán)利要求1記載的語速變換方法,其特征在于,對輸入的聲音數(shù)據(jù),進(jìn)行其屬性的分析處理;根據(jù)該分析處理得到的信息,將上述聲音數(shù)據(jù)分割為具有預(yù)定時間寬的塊單位;將上述塊單位作為塊聲音數(shù)據(jù)蓄存;為了實現(xiàn)上述聲音數(shù)據(jù)的時間上的拉長,把在相鄰塊聲音數(shù)據(jù)間應(yīng)置換或插入的連續(xù)數(shù)據(jù),在每塊單位中生成并蓄存;生成塊連接順序,該塊連接順序用于生成與受聽者的操作而生出的任意聲音速度對應(yīng)的輸出聲音數(shù)據(jù);按照該連接順序,依次地連接已分割為塊單位并蓄存的塊聲音數(shù)據(jù)和連接數(shù)據(jù),生成輸出數(shù)據(jù)。
      這樣,可相應(yīng)于受聽者的操作,使輸出聲音的語速瞬時地跟上,從而大幅度提高受聽方的使用便利性。
      權(quán)利要求2記載的發(fā)明,是在權(quán)利要求1記載的語速變換方法中,其特征在于,對于每一塊,使用在預(yù)定長時間內(nèi)具有預(yù)定線的2個窗,對該塊開始部分的聲音數(shù)據(jù)和其后塊的開始部分的聲音數(shù)據(jù),分別進(jìn)行屏蔽后,重復(fù)相加其后塊的開始部分和該塊的開始部分,生成上述連接數(shù)據(jù)。
      另外,為了實現(xiàn)上述目的,權(quán)利要求3記載的語速變換裝置,其特征在于,備有分析處理部、塊數(shù)據(jù)分割部、塊數(shù)據(jù)蓄存部、連接數(shù)據(jù)生成部、連接數(shù)據(jù)蓄存部、連接順序生成部和聲音數(shù)據(jù)連接部;上述分析處理部,對輸入的聲音數(shù)據(jù)進(jìn)行其屬性的分析處理;上述塊數(shù)據(jù)分割部,根據(jù)該分析處理部的分析結(jié)果,將聲音數(shù)據(jù)分割為具有預(yù)定時間寬的塊單位;上述塊數(shù)據(jù)蓄存部,把由該塊數(shù)據(jù)分割部分割的數(shù)據(jù)作為塊聲音數(shù)據(jù)蓄存;上述連接數(shù)據(jù)生成部,使用由上述塊數(shù)據(jù)分割部得到的各塊聲音數(shù)據(jù),生成在相鄰塊聲音數(shù)據(jù)間可置換或可插入的連接數(shù)據(jù);上述連接數(shù)據(jù)蓄存部,蓄存由該連接數(shù)據(jù)生成部生成的連接數(shù)據(jù);上述連接順序生成部,根據(jù)與所設(shè)定聲音速度對應(yīng)的條件,生成上述塊聲音數(shù)據(jù)和上述連接數(shù)據(jù)的連接順序;上述聲音數(shù)據(jù)連接部,根據(jù)該連接順序生成部得到的連接順序,依次連接蓄存在塊數(shù)據(jù)蓄存部內(nèi)的塊聲音數(shù)據(jù)和蓄存在連接數(shù)據(jù)蓄存部內(nèi)的連接數(shù)據(jù),生成一連串的聲音數(shù)據(jù)。
      權(quán)利要求4記載的發(fā)明,是在權(quán)利要求3所述的語速變換裝置中,其特征在于,上述連接數(shù)據(jù)生成部,對于每一塊,使用在預(yù)定長時間內(nèi)具有預(yù)定線的2個窗,對該塊開始部分的聲音數(shù)據(jù)和其后塊的開始部分的聲音數(shù)據(jù),分別進(jìn)行屏蔽后,重復(fù)相加其后塊的開始部分和該塊的開始部分,生成上述連接數(shù)據(jù)。
      權(quán)利要求5記載的發(fā)明,是在權(quán)利要求3所述的語速變換裝置中,其特征在于,上述連接順序生成部,備有可改寫存儲器和連接順序決定處理部;上述可改寫存儲器用于存儲每個屬性的時間拉長倍率;上述連接順序決定處理部,以預(yù)定的時間間隔,讀出存儲在上述可改寫存儲器內(nèi)的各屬性的時間拉長倍率,同時,根據(jù)這些拉長倍率、塊數(shù)據(jù)蓄存部輸出的塊長和聲音數(shù)據(jù)連接部輸出的已連接信息,即時生成上述塊聲音數(shù)據(jù)和上述連接數(shù)據(jù)的連接順序。
      這樣,可按照受聽者的操作,即時地使輸出聲音的語速跟上,大幅度提高受聽方的使用便利性。
      附圖簡單說明

      圖1是表示本發(fā)明中的語速變換裝置實施例的框圖。
      圖2是表示由圖1中所示連接數(shù)據(jù)生成部進(jìn)行的連接數(shù)據(jù)生成過程例的模式圖。
      圖3是表示由圖1所示連接順序生成部進(jìn)行的連接順序生成過程的模式圖。
      實施例圖1是表示本發(fā)明中的語速變換裝置的實施例的框圖。
      該圖所示的語速變換裝置1,備有A/D轉(zhuǎn)換部2、分析處理部3、塊數(shù)據(jù)分割部4、塊數(shù)據(jù)蓄存部5、連接數(shù)據(jù)生成部6、連接數(shù)據(jù)蓄存部7、連接順序生成部8、聲音數(shù)據(jù)連接部9和D/A轉(zhuǎn)換部10。A/D轉(zhuǎn)換部2將輸入的聲音信號轉(zhuǎn)換為數(shù)字的聲音數(shù)據(jù)。分析處理部3分析聲音數(shù)據(jù)的屬性。塊數(shù)據(jù)分割部4把聲音數(shù)據(jù)分割成塊單位,以生成塊聲音數(shù)據(jù)。塊數(shù)據(jù)蓄存部5蓄存塊聲音數(shù)據(jù)。連接數(shù)據(jù)生成部6生成連接塊聲音數(shù)據(jù)所需的連接數(shù)據(jù)。連接數(shù)據(jù)蓄存部7蓄存連接數(shù)據(jù)。連接順序生成部8生成塊聲音數(shù)據(jù)和連接數(shù)據(jù)的連接順序。聲音連接部9根據(jù)該連接順序,將各塊聲音數(shù)據(jù)和各連接數(shù)據(jù)連接起來,生成一連串的聲音數(shù)據(jù)。D/A變換部10將該一連串的聲音數(shù)據(jù)變換為聲音信號。
      該語速變換裝置1,對發(fā)話者輸入的聲音數(shù)據(jù),對其屬性進(jìn)行分析處理,根據(jù)該分析處理得到的分析信息,將聲音數(shù)據(jù)分割成具有一定時間寬的塊單位并蓄存起來,同時,為了實現(xiàn)聲音數(shù)據(jù)的時間上的拉長,對每一塊單位生成在相鄰塊聲音數(shù)據(jù)間應(yīng)置換或插入的聲音數(shù)據(jù)并蓄存起來。另外,生成塊連接順序(該塊連接順序用于生成與受聽者操作的任意聲音速度對應(yīng)的輸出聲音數(shù)據(jù)),按照該塊連接順序,依次連接已分割成塊單位并蓄存著的聲音數(shù)據(jù)(塊聲音數(shù)據(jù))和已蓄存著的連接部的置換·插入聲音數(shù)據(jù)(連接數(shù)據(jù)),通過生成輸出聲音數(shù)據(jù),與受聽者的操作相應(yīng)地,可以使輸出聲音的語速瞬時地跟上。
      A/D轉(zhuǎn)換部2備有A/D轉(zhuǎn)換電路和FIFO存儲器。A/D轉(zhuǎn)換電路以預(yù)定的取樣率(例如32kHz)對輸入的聲音信號取樣后,進(jìn)行A/D轉(zhuǎn)換。FIFO存儲器取入并存儲從A/D轉(zhuǎn)換電路輸出的數(shù)字的聲音數(shù)據(jù),同時,以FIFO形式輸出。A/D轉(zhuǎn)換部2取入由輸入端子輸入的發(fā)話者的聲音信號、例如由擴(kuò)音器、電視機、收音機或其它影像機器、音響機器等的摸擬聲音輸出端子輸出的聲音信號,經(jīng)A/D轉(zhuǎn)換后,把這樣得到的聲音數(shù)據(jù)一邊緩沖存儲,一邊供給分析處理部3和塊數(shù)據(jù)分割部4。
      分析處理部3依次進(jìn)行輸入處理、減量處理、屬性分析處理和塊長決定處理,把這樣得到的分割信息(每個有聲音、無聲音、無音塊的長度)供給塊數(shù)據(jù)分割部4。上述的輸入處理,是取入A/D轉(zhuǎn)換部2輸出的聲音數(shù)據(jù)。上述減量處理,是把由輸入處理得到的聲音數(shù)據(jù)的取樣率降至4kHz,使以后的處理量減少。上述的屬性分析處理,是對由A/D轉(zhuǎn)換部2輸出的聲音數(shù)據(jù)和上述減量處理得到的聲音數(shù)據(jù)進(jìn)行分析,區(qū)分為有聲音、無聲音、無音。上述塊長決定處理,是對由該屬性分析得到的有聲音、無聲音、無音進(jìn)行自相關(guān)分析,檢測其周期性,根據(jù)該檢測結(jié)果,決定分割聲音數(shù)據(jù)所需的塊長(該塊長是防止因塊單位的反復(fù)而引起的聲音高度的變化、例如是防止低聲等所需的塊長)。
      上述屬性分析處理中,對于從A/D轉(zhuǎn)換部2輸出的聲音數(shù)據(jù),使用30ms前后的窗寬,計算數(shù)據(jù)的平方和,以5ms前后的間隔,算出聲音數(shù)據(jù)的功率值P,同時,將該功率值P與預(yù)先設(shè)定的閾值Pmin比較,把滿足“P<Pmin”的部分,判斷為無音區(qū)間,把“Pmin≤P”的部分,判斷為有聲音區(qū)間、無聲音區(qū)間。然后,對從A/D轉(zhuǎn)換部2輸出的聲音數(shù)據(jù),進(jìn)行零交叉分析和進(jìn)行對上述減量處理得到的聲音數(shù)據(jù)的自相關(guān)分析等,根據(jù)這些分析結(jié)果和功率值P,從聲音數(shù)據(jù)中,判斷滿足“Pmin≤P”的部分是伴隨聲帶振動的聲音區(qū)間(有聲音區(qū)間)還是不伴隨聲帶振動的聲音區(qū)間(無聲音區(qū)間)。另外,作為從A/D變換部2輸出的聲音數(shù)據(jù)的各屬性,雖然也考慮是雜音或音樂等背景音這樣的屬性,但通常要準(zhǔn)確地自動判斷雜音、背景音信號與聲音信號是困難的,所以,也將雜音、背景音分成有聲音、無聲音、無音中的任一類。
      在上述的塊長決定處理中,對于由上述屬性分析處理判斷為有聲音區(qū)間的聲音數(shù)據(jù),在有聲音的音高(pitch)周期分布的1.25ms~28.0ms的大范圍內(nèi),進(jìn)行長短不同的窗寬的自相關(guān)分析,檢測出盡量準(zhǔn)確的音高周期(聲帶的振動周期即音高周期),根據(jù)該檢測結(jié)果決定塊長,將各音高周期作為各塊長。另外,對于由上述屬性分析處理判斷為無聲音區(qū)間、無音區(qū)間的區(qū)間,檢測出10ms以內(nèi)的周期性,根據(jù)該檢測結(jié)果決定塊長,將這些有聲音區(qū)間、無聲音區(qū)間、無音區(qū)間的各塊長作為分割信息,供給塊數(shù)據(jù)分割部4。
      塊數(shù)據(jù)分割部4,根據(jù)從分析處理部3輸出的分割信息所示的有聲音區(qū)間的塊長、無聲音區(qū)間的塊長、無音區(qū)間的塊長,分割由A/D轉(zhuǎn)換部2輸出的聲音數(shù)據(jù),把由該分割處理得到的塊單位聲音數(shù)據(jù)(塊聲音數(shù)據(jù))和該聲音數(shù)據(jù)的塊長,供給塊數(shù)據(jù)蓄存部5和連接數(shù)據(jù)生成部6。
      塊數(shù)據(jù)蓄存部5備有環(huán)形緩沖存儲器,取入從塊數(shù)據(jù)分割部4輸出的塊聲音數(shù)據(jù)(塊單位的聲音數(shù)據(jù))和該聲音數(shù)據(jù)的塊長,一邊將它們暫時存儲在該環(huán)形緩沖存儲器內(nèi),一邊適當(dāng)?shù)刈x出暫時存儲著的各塊長,將其供給連接順序生成部8,同時適當(dāng)讀出暫時存儲著的塊聲音數(shù)據(jù),將其供給聲音數(shù)據(jù)連接部9。
      連續(xù)數(shù)據(jù)生成部6,取入從塊數(shù)據(jù)分割部4輸出的塊聲音數(shù)據(jù),對每個塊,如圖2所示地,使用在時間長d(ms)間呈直線變化的A窗、B窗,對該塊開始部分的聲音數(shù)據(jù)和其后塊的開始部分的聲音數(shù)據(jù)進(jìn)行屏蔽后,重復(fù)相加后塊的開始部分和該塊的開始部分,生成時間長為d(ms)的連接數(shù)據(jù),將其供給連接數(shù)據(jù)蓄積部7。作為時間長d,可以選擇〔0.5(ms)〕~〔該塊或其后塊的塊長之中短的一方〕的值,但是,如果選擇短的一方,則連續(xù)數(shù)據(jù)蓄存部7的緩沖存儲器的容量可需要得小一些連續(xù)數(shù)據(jù)蓄存部7,備有環(huán)形緩沖存儲器,取入從連接數(shù)據(jù)生成部6輸出的連接數(shù)據(jù),一邊將其暫時存儲到上述環(huán)形緩沖存儲器內(nèi),一邊適當(dāng)?shù)刈x出暫時存儲著的各連接數(shù)據(jù),將其供給聲音數(shù)據(jù)連接部9。
      連接順序生成部8,備有可改寫存儲器和連接順序決定處理部??筛膶懘鎯ζ鞔鎯τ墒苈犝卟僮鞯臄?shù)字音量器等數(shù)字設(shè)定器而輸入的每個屬性的時間拉長倍率。連接順序決定處理部以預(yù)定的時間間隔、例如100ms左右的時間間隔,讀出存儲在可改寫存儲器內(nèi)的各屬性的時間拉長倍率,同時,根據(jù)這些各拉長倍率、從塊數(shù)據(jù)蓄存部5輸出的各塊長和從聲音數(shù)據(jù)連接部9輸出的已連接信息,即時生成各塊單位的聲音數(shù)據(jù)和各塊單位的連接數(shù)據(jù)之間的連接順序(為實現(xiàn)受聽者設(shè)定的希望語速所需的連接順序)。
      在有聲音區(qū)間、無聲音區(qū)間、無音區(qū)間依次交替出現(xiàn)的聲音信號輸入的狀態(tài)下,如圖3所示,由聲音數(shù)據(jù)連接部9輸出的已連接信息,檢測出塊聲音數(shù)據(jù)的屬性已轉(zhuǎn)換時,或者,即使相同屬性的塊聲音數(shù)據(jù)持續(xù)連接著,當(dāng)檢測出從上述可改寫存儲器讀出的上述塊聲音數(shù)據(jù)的拉長倍率已變更時,判斷為連接順序的生成工序開始條件已具備,這時的時刻被設(shè)定為時刻T0。
      然后,把該時刻T0作為開始時刻,設(shè)從塊數(shù)據(jù)蓄存部5已對聲音數(shù)據(jù)連接部9輸出的、語速變更前的塊聲音數(shù)據(jù)的塊長全部加算起來的總和為“Si”,設(shè)已連接的塊聲音數(shù)據(jù)的塊全長全部加算起來的總和為“So”,設(shè)目的拉長倍率為“r”(r≥1.0),設(shè)最后連接的塊聲音數(shù)據(jù)的塊長為“L”,在下式條件成立的時間內(nèi)L/2<r·Si-So…(1)從連接數(shù)據(jù)蓄存部7輸出的連接數(shù)據(jù)中,把對應(yīng)于最后連接的塊的連接數(shù)據(jù)置換·插入后,在最后被連接的塊中,把用于生成連接數(shù)據(jù)部分后面的部分,再次反復(fù)連接上。生成表示依次連接該塊后面剩余塊的連接順序,將其供給聲音數(shù)據(jù)連接部9。
      這樣,在圖3所示例中,在依次連接了塊(1)到塊(8)的時刻,滿足(1)式所示條件,所以,與塊(8)對應(yīng)的連接數(shù)據(jù)被置換·插入在該塊(8)后面,該塊(8)之中、用于生成連接數(shù)據(jù)部分后面的部分被反復(fù)連接。另外,該圖3所示例中,塊(4)已經(jīng)被反復(fù)連接一次。
      聲音數(shù)據(jù)連接部9,把已經(jīng)連接的塊聲音數(shù)據(jù)等的連接內(nèi)容作為已連接信息,一邊供給連接順序生成部8,一邊根據(jù)連接順序生成部8輸出的連接順序,將塊數(shù)據(jù)蓄存部5輸出的塊聲音數(shù)據(jù)和連接數(shù)據(jù)蓄存部7輸出的塊聲音數(shù)據(jù)連接起來,生成一連串的聲音數(shù)據(jù)。這樣,得到的一連串的聲音數(shù)據(jù)一邊被緩沖存儲,一邊供給D/A轉(zhuǎn)換部10。
      D/A轉(zhuǎn)換部10,備有存儲器和D/A轉(zhuǎn)換電路,存儲器存儲聲音數(shù)據(jù),并以FIFO的形式輸出。D/A變換電路以預(yù)定的取樣率(例如32kHz)從上述存儲器中讀出聲音數(shù)據(jù),將其作D/A轉(zhuǎn)換,成為聲音信號。D/A轉(zhuǎn)換部10讀入聲音數(shù)據(jù)連接部9輸出的一連串聲音數(shù)據(jù),一邊將其緩沖儲存,一邊進(jìn)行D/A轉(zhuǎn)換,把這樣得到的聲音信號從輸出端子輸出。
      這樣,本實施例中,根據(jù)語速變換控制信息(該語速變換控制信息表示與受聽者的操作相應(yīng)的任意語速),一邊控制預(yù)先蓄存著的塊聲音數(shù)據(jù)和連接數(shù)據(jù)的順序,一邊形成輸出聲音,所以,在受聽者用手動操作使語速變化時,也能即時輸出所需語速的聲音,這樣,在中途改變語速時,也不會使受聽方感覺到時間延遲。
      因此,只要將本發(fā)明的語速變換裝置1用于電視機、收音機、磁帶錄音機、磁帶錄象機、磁盤錄象機等的影像機器、音響機器、醫(yī)療機器等上,對發(fā)話者的聲音進(jìn)行加工,使聲音速度適合于受聽者的聽覺能力,就可以按照受聽者的操作,即時地變化輸出聲音的語速。
      另外,上述實施例中,在連接數(shù)據(jù)生成部6,是使用圖2所示的直線變化的A窗、B窗,對各塊聲音數(shù)據(jù)的開始部分進(jìn)行屏蔽的。但是也可使用余弦曲線等的窗,對各塊聲音數(shù)據(jù)的開始部分進(jìn)行屏蔽。另外,如果連接數(shù)據(jù)蓄存部7的緩沖存儲容量足夠大,則屏蔽不僅對塊聲音數(shù)據(jù)的開始部分,也可以對塊全長進(jìn)行。
      上述實施例中,在連接順序生成部8,僅反復(fù)一次圖3所示的塊聲音數(shù)據(jù)(4)、(8)的連接數(shù)據(jù)和該塊聲音數(shù)據(jù)的后半部分,但是當(dāng)拉長倍率“r”為“r>2”時,也可以反復(fù)2次以上同一個塊聲音數(shù)據(jù)。
      如上所述,根據(jù)本發(fā)明,能按照受聽者的操作,使輸出聲音的語速瞬間跟上,這樣,大幅度提高受聽者的使用便利性。
      權(quán)利要求
      1.語速變換方法,其特征在于,對輸入的聲音數(shù)據(jù),進(jìn)行其屬性的分析處理;根據(jù)該分析處理得到的信息,將上述聲音數(shù)據(jù)分割為具有預(yù)定時間寬的塊單位;將上述塊單位作為塊聲音數(shù)據(jù)蓄存;為了實現(xiàn)上述聲音數(shù)據(jù)的時間上的拉長,把在相鄰塊聲音數(shù)據(jù)間應(yīng)置換或插入的連續(xù)數(shù)據(jù),在每塊中生成并蓄存;生成塊連接順序,該塊連接順序用于生成與受聽者的操作而生出的任意聲音速度對應(yīng)的輸出聲音數(shù)據(jù);按照該連接順序,依次地連接已分割為塊單位并蓄存的塊聲音數(shù)據(jù)和連接數(shù)據(jù),生成輸出數(shù)據(jù)。
      2.如權(quán)利要求1所述的語速變換方法,其特征在于,對于每一塊,使用在預(yù)定長時間內(nèi)具有預(yù)定線的2個窗,對該塊開始部分的聲音數(shù)據(jù)和其后塊的開始部分的聲音數(shù)據(jù),分別進(jìn)行屏蔽后,重復(fù)相加其后塊的開始部分和該塊的開始部分,生成上述連接數(shù)據(jù)。
      3.語速變換裝置,其特征在于,備有分析處理部、塊數(shù)據(jù)分割部、塊數(shù)據(jù)蓄積部、連續(xù)數(shù)據(jù)生成部、連續(xù)數(shù)據(jù)蓄存部、連接順序生成部和聲音數(shù)據(jù)連接部;上述分析處理部,對輸入的聲音數(shù)據(jù)進(jìn)行其屬性的分析處理;上述塊數(shù)據(jù)分割部,根據(jù)該分析處理部的分析結(jié)果,將聲音數(shù)據(jù)分割為具有預(yù)定時間寬的塊單位;上述塊數(shù)據(jù)蓄存部,把由該塊數(shù)據(jù)分割部分割的數(shù)據(jù)作為塊聲音數(shù)據(jù)蓄存;上述連接數(shù)據(jù)生成部,使用由上述塊數(shù)據(jù)分割部得到的各塊聲音數(shù)據(jù),生成在相鄰塊聲音數(shù)據(jù)間可置換或可插入的連接數(shù)據(jù);上述連接數(shù)據(jù)蓄存部,蓄存由該連接數(shù)據(jù)生成部生成的連接數(shù)據(jù);上述連接順序生成部,根據(jù)與所設(shè)定聲音速度對應(yīng)的條件,生成上述塊聲音數(shù)據(jù)和上述連接數(shù)據(jù)的連接順序;上述聲音數(shù)據(jù)連接部,根據(jù)該連接順序生成部得到的連接順序,依次連接蓄存在塊數(shù)據(jù)蓄存部內(nèi)的塊聲音數(shù)據(jù)和蓄存在連接數(shù)據(jù)蓄存部內(nèi)的連接數(shù)據(jù),生成一連串的聲音數(shù)據(jù)。
      4.如權(quán)利要求3所述的語速變換裝置,其特征在于,上述連續(xù)數(shù)據(jù)生成部,對于每一塊,使用在預(yù)定長時間內(nèi)具有預(yù)定線的2個窗,對該塊開始部分的聲音數(shù)據(jù)和其后塊的開始部分的聲音數(shù)據(jù),分別進(jìn)行屏蔽后,重復(fù)相加其后塊的開始部分和該塊的開始部分,生成上述連接數(shù)據(jù)。
      5.如權(quán)利要求3所述的語速變換裝置,其特征在于,上述連接順序生成部,備有可改寫存儲器和連接順序決定處理部;上述可改寫存儲部用于存儲每個屬性的時間拉長倍率;上述連接順序決定處理部,以預(yù)定的時間間隔,讀出存儲在上述可換寫存儲器內(nèi)的各屬性的時間拉長倍率,同時,根據(jù)這些拉長倍率、塊數(shù)據(jù)蓄存部輸出的塊長和聲音數(shù)據(jù)連接部輸出的已連接信息,即時生成上述塊聲音數(shù)據(jù)和上述連接數(shù)據(jù)之間的連接順序。
      全文摘要
      本發(fā)明提供的語速變換方法及裝置,對輸入的聲音數(shù)據(jù),由分析處理部(3)進(jìn)行其屬性的分析處理。塊數(shù)據(jù)分割部(4)根據(jù)分析處理部(3)的分析結(jié)果,把聲音數(shù)據(jù)分割成具有預(yù)定時間寬的塊單位,生成塊聲音數(shù)據(jù)后,蓄存在塊數(shù)據(jù)蓄積部(5)內(nèi)。連續(xù)數(shù)據(jù)生成部(6)使用各塊聲音數(shù)據(jù),生成連接數(shù)據(jù),將其蓄積在連接數(shù)據(jù)蓄存部(7)內(nèi)。同時,根據(jù)與所設(shè)定聲音速度對應(yīng)的條件,連接順序生成部(8)生成各塊聲音數(shù)據(jù)和各連接數(shù)據(jù)的連接順序。聲音數(shù)據(jù)連接部(9)根據(jù)該連接順序,依次連接蓄存在塊數(shù)據(jù)蓄存部(5)內(nèi)的塊聲音數(shù)據(jù)和蓄存在連接數(shù)據(jù)蓄存部(7)內(nèi)的連接數(shù)據(jù),生成一連串的聲音數(shù)據(jù)。
      文檔編號H04R25/00GK1219264SQ98800250
      公開日1999年6月9日 申請日期1998年3月13日 優(yōu)先權(quán)日1997年3月14日
      發(fā)明者都木徹, 清山信正, 今井篤, 安藤彰男 申請人:日本放送協(xié)會
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1