国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于diva神經(jīng)網(wǎng)絡(luò)模型的語(yǔ)音生成方法

      文檔序號(hào):6372767閱讀:455來(lái)源:國(guó)知局
      專利名稱:一種基于diva神經(jīng)網(wǎng)絡(luò)模型的語(yǔ)音生成方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種語(yǔ)音生成方法,特別是一種基于DIVA神經(jīng)網(wǎng)絡(luò)模型的語(yǔ)音生成方法。
      背景技術(shù)
      隨著人工智能的發(fā)展,人們對(duì)這個(gè)領(lǐng)域的研究不斷深入。對(duì)類(lèi)似真人發(fā)音的語(yǔ)音生成和獲取的控制,是機(jī)器人發(fā)音系統(tǒng)急需解決的問(wèn)題。語(yǔ)音生成與獲取是一個(gè)涉及大腦諸多部位復(fù)雜的認(rèn)知過(guò)程,這個(gè)過(guò)程包括一種從依照句法和語(yǔ)法 組織句子或短語(yǔ)的表述一直延伸到音素產(chǎn)生的分層結(jié)構(gòu),需要根據(jù)發(fā)聲時(shí)大腦中各種感官和運(yùn)動(dòng)區(qū)域的交互作用建立相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型。目前 DIVA (Directions Into Velocities of Articulators)模型就是一種關(guān)于語(yǔ)音生成與獲取后描述相關(guān)處理過(guò)程的數(shù)學(xué)模型,主要被用來(lái)仿真和描述有關(guān)大腦中涉及語(yǔ)音生成和語(yǔ)音理解區(qū)域的相關(guān)功能。也可以說(shuō)它是一種為了生成單詞、音節(jié)或者音素,而用來(lái)控制模擬聲道運(yùn)動(dòng)的自適應(yīng)神經(jīng)網(wǎng)絡(luò)模型。在當(dāng)今真正具有生物學(xué)意義的語(yǔ)音生成和獲取的神經(jīng)網(wǎng)絡(luò)模型中,DIVA模型的定義和測(cè)試相對(duì)而言是最徹底的,并且是唯一一種應(yīng)用偽逆控制方案的模型。人們對(duì)于人類(lèi)語(yǔ)言能力的統(tǒng)一計(jì)算模型的需求推動(dòng)著DIVA模型的發(fā)展。這個(gè)模型自從由MIT大學(xué)語(yǔ)音實(shí)驗(yàn)室的Guentherl994年首次提出以來(lái),近些年來(lái)不斷地被更新、完善和改進(jìn)。DIVA系統(tǒng)由語(yǔ)音通道模塊、耳蝸模塊、聽(tīng)覺(jué)皮層模型模塊、聽(tīng)覺(jué)皮層類(lèi)別感知模塊、語(yǔ)音細(xì)胞集模塊、運(yùn)動(dòng)皮層模塊、聲道模塊、體覺(jué)皮質(zhì)模塊、感覺(jué)模塊和感覺(jué)通道模塊組成。通過(guò)對(duì)DIVA模型的分析,我們可以發(fā)現(xiàn)其聽(tīng)覺(jué)皮層類(lèi)別感知模塊中所使用的分類(lèi)方法是RBF。而RBF神經(jīng)網(wǎng)絡(luò)對(duì)樣本的依賴性很大,對(duì)于某一具體的研究問(wèn)題,如何確定合適的隱含層節(jié)點(diǎn)數(shù),目前尚無(wú)通用有效的算法或者定理。人們更多的是憑借經(jīng)驗(yàn),反復(fù)試驗(yàn)來(lái)確定網(wǎng)絡(luò)的規(guī)模,這種試湊的方法非常繁瑣,不易找到合適的結(jié)構(gòu)。網(wǎng)絡(luò)隱含層的節(jié)點(diǎn)數(shù)對(duì)網(wǎng)絡(luò)的收斂速度、精度及泛化能力都有很大的影響。隱含層節(jié)點(diǎn)過(guò)多,雖可以完成訓(xùn)練,但會(huì)影響收斂速度,而且有可能出現(xiàn)過(guò)學(xué)習(xí);而隱含層節(jié)點(diǎn)過(guò)少,網(wǎng)絡(luò)不能充分學(xué)習(xí),達(dá)不到訓(xùn)練精度的要求。此外,RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練的時(shí)間也不夠快。

      發(fā)明內(nèi)容
      本發(fā)明的目的在于提供一種發(fā)音精度高、學(xué)習(xí)速度快的基于DIVA神經(jīng)網(wǎng)絡(luò)模型的語(yǔ)音生成方法。實(shí)現(xiàn)本發(fā)明目的的技術(shù)解決方案為一種基于DIVA神經(jīng)網(wǎng)絡(luò)模型的語(yǔ)音生成方法,包括語(yǔ)音樣本提取、語(yǔ)音樣本分類(lèi)與學(xué)習(xí)、語(yǔ)音輸出和修正輸出語(yǔ)音,所述語(yǔ)音樣本分類(lèi)與學(xué)習(xí)采用自適應(yīng)生長(zhǎng)型神經(jīng)網(wǎng)絡(luò)(AGNN)實(shí)現(xiàn)對(duì)語(yǔ)音樣本的分類(lèi)學(xué)習(xí),具體為步驟一、將提取的語(yǔ)音共振峰頻率通過(guò)雅克比行列式轉(zhuǎn)換為矩陣形式,該矩陣的特征向量的維數(shù)即輸入層候選神經(jīng)元的數(shù)目m ;計(jì)算輸入層候選神經(jīng)元的適應(yīng)度函數(shù)值并按適應(yīng)度函數(shù)值遞增的順序排列候選神經(jīng)元,輸入層候選神經(jīng)元適應(yīng)度函數(shù)值的列表相應(yīng)
      的為S= {Sn ≤Si2 ≤...≤SiJ ,并按相應(yīng)的順序?qū)⒑蜻x神經(jīng)元放在列表X中,X= (X1,. . . ,Xm),
      所述適應(yīng)度函數(shù)計(jì)算公式為
      權(quán)利要求
      1.一種基于DIVA神經(jīng)網(wǎng)絡(luò)模型的語(yǔ)音生成方法,包括語(yǔ)音樣本提取、語(yǔ)音樣本分類(lèi)與學(xué)習(xí)、語(yǔ)音輸出和修正輸出語(yǔ)音,其特征在于,所述語(yǔ)音樣本分類(lèi)與學(xué)習(xí)采用自適應(yīng)生長(zhǎng)型神經(jīng)網(wǎng)絡(luò)(AGNN)實(shí)現(xiàn)對(duì)語(yǔ)音樣本的分類(lèi)學(xué)習(xí),具體為 步驟一、將提取的語(yǔ)音共振峰頻率通過(guò)雅克比行列式轉(zhuǎn)換為矩陣形式,該矩陣的特征向量的維數(shù)即輸入層候選神經(jīng)元的數(shù)目m ;計(jì)算輸入層候選神經(jīng)元的適應(yīng)度函數(shù)值并按適應(yīng)度函數(shù)值遞增的順序排列候選神經(jīng)元,輸入層候選神經(jīng)元適應(yīng)度函數(shù)值的列表相應(yīng)的為S= {Sn ≤ Si2 ≤…≤SiJ ,并按相應(yīng)的順序?qū)⒑蜻x神經(jīng)元放在列表X中,X= (X1,…,Xm),所述適應(yīng)度函數(shù)計(jì)算公式為
      2.根據(jù)權(quán)利要求I所述的基于DIVA神經(jīng)網(wǎng)絡(luò)模型的語(yǔ)音生成方法,其特征在于 步驟六中訓(xùn)練此隱層候選神經(jīng)元并計(jì)算它的適應(yīng)度函數(shù)值C;,具體為 (1)將語(yǔ)音共振峰頻率歸一化所形成的數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,這里劃分的訓(xùn)練集和驗(yàn)證集的樣本數(shù)目分別為nA,nB,劃分依據(jù)為nA=nB ;(2)根據(jù)劃分后的三個(gè)集合,利用下述公式計(jì)算隱層候選神經(jīng)元的適應(yīng)度函數(shù)值C;,
      3.根據(jù)權(quán)利要求I所述的基于DIVA神經(jīng)網(wǎng)絡(luò)模型的語(yǔ)音生成方法,其特征在于 所述步驟八中根據(jù)輸出層的輸出數(shù)值來(lái)確定音素,具體為所述輸出層的輸出數(shù)值為O至I區(qū)間的數(shù)值,并根據(jù)DIVA神經(jīng)網(wǎng)絡(luò)模型中每個(gè)音素所對(duì)應(yīng)的范圍值來(lái)確定AGNN神經(jīng)網(wǎng)絡(luò)輸出數(shù)值所對(duì)應(yīng)的音素。
      全文摘要
      本發(fā)明公開(kāi)了一種基于DIVA神經(jīng)網(wǎng)絡(luò)模型的語(yǔ)音生產(chǎn)方法,包括語(yǔ)音樣本提取、語(yǔ)音樣本分類(lèi)與學(xué)習(xí)、語(yǔ)音輸出和修正輸出語(yǔ)音,所述語(yǔ)音樣本分類(lèi)與學(xué)習(xí)采用自適應(yīng)生長(zhǎng)型神經(jīng)網(wǎng)絡(luò)(AGNN)實(shí)現(xiàn)對(duì)語(yǔ)音樣本的分類(lèi)學(xué)習(xí),利用獲取的語(yǔ)音共振峰頻率來(lái)進(jìn)一步計(jì)算輸入層候選神經(jīng)元的數(shù)目,再根據(jù)輸入層候選神經(jīng)元來(lái)確定隱層神經(jīng)元,最終獲得AGNN的輸出值,并根據(jù)輸出值來(lái)確定音素,采用上述結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練精度高且學(xué)習(xí)速度快。
      文檔編號(hào)G06N3/08GK102789594SQ201210219670
      公開(kāi)日2012年11月21日 申請(qǐng)日期2012年6月28日 優(yōu)先權(quán)日2012年6月28日
      發(fā)明者劉欣, 張少白, 徐磊 申請(qǐng)人:南京郵電大學(xué)
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1