国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      聲音檢索裝置以及聲音檢索方法_6

      文檔序號(hào):9929566閱讀:來(lái)源:國(guó)知局
      用,由此能夠作為本發(fā)明的聲音檢索裝置發(fā)揮功能。另外,能夠使用聲音檢索裝置實(shí)施本發(fā)明的聲音檢索方法。
      [0145]另外,這樣的程序的應(yīng)用方法是任意的。除了能夠在例如計(jì)算機(jī)可讀取的記錄介質(zhì)(CD-ROM(Compact Disc Read-Only Memory光盤只讀存儲(chǔ)器)、DVD(Digital VersatileDisc數(shù)字多功能光盤)、MD(Magneto Optical disc磁光盤)等)中存儲(chǔ)程序來(lái)應(yīng)用外,也能夠在因特網(wǎng)等網(wǎng)絡(luò)上的存儲(chǔ)裝置中存儲(chǔ)程序,通過(guò)下載該程序來(lái)應(yīng)用。
      [0146]以上,說(shuō)明了本發(fā)明的優(yōu)選實(shí)施方式,不過(guò)本發(fā)明不限定于特定的實(shí)施方式,本發(fā)明包括專利請(qǐng)求范圍所記載的發(fā)明及其均等的范圍。
      【主權(quán)項(xiàng)】
      1.一種聲音檢索裝置,該聲音檢索裝置特征在于,具備: 記錄單元,其記錄檢索對(duì)象的聲音信號(hào); 時(shí)間長(zhǎng)度取得單元,其從存儲(chǔ)有與音素相關(guān)的持續(xù)時(shí)間長(zhǎng)度數(shù)據(jù)的數(shù)據(jù)庫(kù)取得檢索字符串的音素串中包括的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度; 語(yǔ)速信息取得單元,其取得由用戶指定的與語(yǔ)速相關(guān)的信息; 時(shí)間長(zhǎng)度變更單元,其根據(jù)上述語(yǔ)速信息取得單元取得的與語(yǔ)速相關(guān)的信息,變更上述時(shí)間長(zhǎng)度取得單元取得的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度; 時(shí)間長(zhǎng)度導(dǎo)出單元,其根據(jù)由上述時(shí)間長(zhǎng)度變更單元變更的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度,導(dǎo)出與上述檢索字符串對(duì)應(yīng)的聲音發(fā)聲時(shí)間長(zhǎng)度; 區(qū)間指定單元,其在上述檢索對(duì)象的聲音信號(hào)的時(shí)間長(zhǎng)度中指定多個(gè)上述時(shí)間長(zhǎng)度導(dǎo)出單元導(dǎo)出的發(fā)聲時(shí)間長(zhǎng)度的區(qū)間作為似然取得區(qū)間; 似然取得單元,其取得似然,該似然表示上述區(qū)間指定單元指定的似然取得區(qū)間是發(fā)出與上述檢索字符串對(duì)應(yīng)的聲音的區(qū)間的似然度;以及 確定單元,其根據(jù)上述似然取得單元針對(duì)由上述區(qū)間指定單元指定的似然取得區(qū)間分別取得的似然,確定從檢索對(duì)象的聲音信號(hào)中推定發(fā)出了與上述檢索字符串對(duì)應(yīng)的聲音的推定區(qū)間。2.根據(jù)權(quán)利要求1所述的聲音檢索裝置,其特征在于, 上述時(shí)間長(zhǎng)度變更單元通過(guò)個(gè)別決定的變更率來(lái)變更上述時(shí)間長(zhǎng)度取得單元取得的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度中母音音素的持續(xù)時(shí)間長(zhǎng)度和子音音素的持續(xù)時(shí)間長(zhǎng)度。3.根據(jù)權(quán)利要求1或2所述的聲音檢索裝置,其特征在于, 上述時(shí)間長(zhǎng)度變更單元通過(guò)比子音音素的持續(xù)時(shí)間長(zhǎng)度的變更率大的變更率來(lái)變更上述時(shí)間長(zhǎng)度取得單元取得的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度中母音音素的持續(xù)時(shí)間長(zhǎng)度。4.根據(jù)權(quán)利要求1所述的聲音檢索裝置,其特征在于, 上述時(shí)間長(zhǎng)度變更單元只變更上述時(shí)間長(zhǎng)度取得單元取得的母音和子音的音素的持續(xù)時(shí)間長(zhǎng)度中母音音素的持續(xù)時(shí)間長(zhǎng)度。5.根據(jù)權(quán)利要求1?4中的任意一項(xiàng)所述的聲音檢索裝置,其特征在于, 上述時(shí)間長(zhǎng)度取得單元按照各個(gè)音素的每個(gè)狀態(tài)取得上述變換單元變換的音素串中包括的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度, 上述時(shí)間長(zhǎng)度變更單元通過(guò)按照每個(gè)狀態(tài)決定的變更率來(lái)變更上述時(shí)間長(zhǎng)度取得單元按照各個(gè)音素的每個(gè)狀態(tài)取得的持續(xù)時(shí)間長(zhǎng)度。6.根據(jù)權(quán)利要求5所述的聲音檢索裝置,其特征在于, 上述時(shí)間長(zhǎng)度變更單元通過(guò)比不包括音素的發(fā)聲開始時(shí)或發(fā)聲結(jié)束時(shí)的狀態(tài)的持續(xù)時(shí)間長(zhǎng)度的變更率小的變更率來(lái)變更各個(gè)音素狀態(tài)中包括音素的發(fā)聲開始時(shí)或發(fā)聲結(jié)束時(shí)的狀態(tài)的持續(xù)時(shí)間長(zhǎng)度。7.根據(jù)權(quán)利要求1?5中的任意一項(xiàng)所述的聲音檢索裝置,其特征在于, 該聲音檢索裝置還具備: 特征量計(jì)算單元,其按照比較聲音信號(hào)和音素模型的區(qū)間即每幀來(lái)計(jì)算上述區(qū)間指定單元指定的似然取得區(qū)間的上述檢索對(duì)象的聲音信號(hào)的特征量;和 輸出概率取得單元,其按照每個(gè)幀取得從上述音素串中包括的各個(gè)音素輸出上述檢索對(duì)象的聲音信號(hào)的特征量的輸出概率, 上述似然取得單元將按照上述區(qū)間指定單元指定的似然取得區(qū)間中包括的每個(gè)幀所取得的輸出概率的對(duì)數(shù)的值相加,取得該似然取得區(qū)間的上述似然。8.根據(jù)權(quán)利要求7所述的聲音檢索裝置,其特征在于, 上述變換單元將不依存于相鄰的音素的聲學(xué)模型的音素進(jìn)行排列,并將上述檢索字符串變換為上述音素串, 上述似然取得單元根據(jù)上述音素串,取得上述區(qū)間指定單元指定的似然取得區(qū)間的上述似然, 上述聲音檢索裝置還具備: 選擇單元,其根據(jù)上述似然取得單元取得的似然,從上述指定的多個(gè)似然取得區(qū)間中選擇上述推定區(qū)間的候補(bǔ); 第二變換單元,其將依存于相鄰的音素的第二聲學(xué)模型的音素進(jìn)行排列,并將上述檢索字符串變換為第二音素串;以及 第二似然取得單元,其根據(jù)上述第二音素串,針對(duì)由上述選擇單元選擇的多個(gè)候補(bǔ)分別取得第二似然,該第二似然表示由上述選擇單元選擇為上述推定區(qū)間的候補(bǔ)的區(qū)間是發(fā)出與上述檢索字符串對(duì)應(yīng)的聲音的區(qū)間的似然度, 上述確定單元根據(jù)上述第二似然取得單元取得的第二似然,從上述選擇單元選擇出的多個(gè)候補(bǔ)中確定上述推定區(qū)間。9.根據(jù)權(quán)利要求8所述的聲音檢索裝置,其特征在于, 上述選擇單元按照每個(gè)預(yù)定的選擇時(shí)間長(zhǎng)度,從上述區(qū)間指定單元指定的似然取得區(qū)間中逐個(gè)選擇在從該預(yù)定的選擇時(shí)間長(zhǎng)度的區(qū)間中開始的似然取得區(qū)間中上述似然最大的似然取得區(qū)間,從而選擇上述推定區(qū)間的多個(gè)候補(bǔ)。10.—種聲音檢索方法,其是具有記錄檢索對(duì)象的聲音信號(hào)的存儲(chǔ)器的聲音檢索裝置的聲音檢索方法,該聲音檢索方法的特征在于,包括: 變換步驟,將檢索字符串變換為音素串; 時(shí)間長(zhǎng)度取得步驟,從存儲(chǔ)有與音素相關(guān)的持續(xù)時(shí)間長(zhǎng)度數(shù)據(jù)的數(shù)據(jù)庫(kù)取得由上述變換步驟進(jìn)行變換的音素串中包括的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度; 語(yǔ)速信息取得步驟,取得由用戶指定的與語(yǔ)速相關(guān)的信息; 時(shí)間長(zhǎng)度變更步驟,根據(jù)上述語(yǔ)速信息取得步驟取得的與語(yǔ)速相關(guān)的信息,變更上述時(shí)間長(zhǎng)度取得步驟取得的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度; 時(shí)間長(zhǎng)度導(dǎo)出步驟,根據(jù)由上述時(shí)間長(zhǎng)度變更步驟進(jìn)行變更的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度,導(dǎo)出與上述檢索字符串對(duì)應(yīng)的聲音的發(fā)聲時(shí)間長(zhǎng)度; 區(qū)間指定步驟,在上述檢索對(duì)象的聲音信號(hào)的時(shí)間長(zhǎng)度中指定多個(gè)上述時(shí)間長(zhǎng)度導(dǎo)出步驟導(dǎo)出的發(fā)聲時(shí)間長(zhǎng)度的區(qū)間作為似然取得區(qū)間; 似然取得步驟,取得似然,該似然表示上述區(qū)間指定步驟指定的似然取得區(qū)間是發(fā)出與上述檢索字符串對(duì)應(yīng)的聲音的區(qū)間的似然度;以及 確定步驟,根據(jù)上述似然取得步驟針對(duì)由上述區(qū)間指定步驟指定的似然取得區(qū)間分別取得的似然,確定從檢索對(duì)象的聲音信號(hào)中推定發(fā)出了與上述檢索字符串對(duì)應(yīng)的聲音的推定區(qū)間。11.根據(jù)權(quán)利要求10所述的聲音檢索方法,其特征在于, 上述時(shí)間長(zhǎng)度變更步驟通過(guò)個(gè)別決定的變更率來(lái)變更上述時(shí)間長(zhǎng)度取得步驟取得的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度中母音音素的持續(xù)時(shí)間長(zhǎng)度和子音音素的持續(xù)時(shí)間長(zhǎng)度。12.根據(jù)權(quán)利要求10或11所述的聲音檢索方法,其特征在于, 上述時(shí)間長(zhǎng)度變更步驟通過(guò)比子音音素的持續(xù)時(shí)間長(zhǎng)度的變更率大的變更率來(lái)變更上述時(shí)間長(zhǎng)度取得步驟取得的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度中母音音素的持續(xù)時(shí)間長(zhǎng)度。13.根據(jù)權(quán)利要求1O所述的聲音檢索方法,其特征在于, 上述時(shí)間長(zhǎng)度變更步驟只變更上述時(shí)間長(zhǎng)度取得步驟取得的母音和子音音素的持續(xù)時(shí)間長(zhǎng)度中母音音素的持續(xù)時(shí)間長(zhǎng)度。14.根據(jù)權(quán)利要求10?13中的任意一項(xiàng)所述的聲音檢索方法,其特征在于, 上述時(shí)間長(zhǎng)度取得步驟按照各個(gè)音素的每個(gè)狀態(tài)取得由上述變換步驟變換的音素串中包括的各個(gè)音素的持續(xù)時(shí)間長(zhǎng)度, 上述時(shí)間長(zhǎng)度變更步驟通過(guò)按照每個(gè)狀態(tài)決定的變更率來(lái)變更上述時(shí)間長(zhǎng)度取得步驟按照各個(gè)音素的每個(gè)狀態(tài)取得的持續(xù)時(shí)間長(zhǎng)度。15.根據(jù)權(quán)利要求14所述的聲音檢索方法,其特征在于, 上述時(shí)間長(zhǎng)度變更步驟通過(guò)比不包括音素的發(fā)聲開始時(shí)或發(fā)聲結(jié)束時(shí)的狀態(tài)的持續(xù)時(shí)間長(zhǎng)度的變更率小的變更率來(lái)變更各個(gè)音素狀態(tài)中包括音素的發(fā)聲開始時(shí)或發(fā)聲結(jié)束時(shí)的狀態(tài)的持續(xù)時(shí)間長(zhǎng)度。16.根據(jù)權(quán)利要求10?14中的任意一項(xiàng)所述的聲音檢索方法,其特征在于, 該聲音檢索方法還包括: 特征量計(jì)算步驟,其按照比較聲音信號(hào)和音素模型的區(qū)間即每幀來(lái)計(jì)算上述區(qū)間指定步驟指定的似然取得區(qū)間的上述檢索對(duì)象的聲音信號(hào)的特征量;和 輸出概率取得步驟,其按照每幀取得從上述音素串中包括的各個(gè)音素輸出上述檢索對(duì)象的聲音信號(hào)的特征量的輸出概率, 上述似然取得步驟將按照上述區(qū)間指定步驟指定的似然取得區(qū)間中包括的每個(gè)幀所取得的輸出概率的對(duì)數(shù)的值相加,取得該似然取得區(qū)間的上述似然。17.根據(jù)權(quán)利要求16所述的聲音檢索方法,其特征在于, 上述變換步驟將不依存于相鄰的音素的聲學(xué)模型的音素進(jìn)行排列,并將上述檢索字符串變換為上述音素串, 上述似然取得步驟根據(jù)上述音素串,取得上述區(qū)間指定步驟指定的似然取得區(qū)間的上述似然, 上述聲音檢索方法還包括: 選擇步驟,其根據(jù)上述似然取得步驟取得的似然,從上述指定的多個(gè)似然取得區(qū)間中選擇上述推定區(qū)間的候補(bǔ); 第二變換步驟,其將依存于相鄰的音素的第二聲學(xué)模型的音素進(jìn)行排列,并將上述檢索字符串變換為第二音素串;以及 第二似然取得步驟,其根據(jù)上述第二音素串,針對(duì)由上述選擇步驟選擇的多個(gè)候補(bǔ)分別取得第二似然,該第二似然表示由上述選擇步驟選擇為上述推定區(qū)間的候補(bǔ)的區(qū)間是發(fā)出與上述檢索字符串對(duì)應(yīng)的聲音的區(qū)間的似然度, 上述確定步驟根據(jù)上述第二似然取得步驟取得的第二似然,從上述選擇步驟選擇出的多個(gè)候補(bǔ)中確定上述推定區(qū)間。18.根據(jù)權(quán)利要求17所述的聲音檢索方法,其特征在于, 上述選擇步驟按照每個(gè)預(yù)定的選擇時(shí)間長(zhǎng)度,從上述區(qū)間指定步驟指定的似然取得區(qū)間中逐個(gè)選擇在從該預(yù)定的選擇時(shí)間長(zhǎng)度的區(qū)間中開始的似然取得區(qū)間中上述似然最大的似然取得區(qū)間,從而選擇上述推定區(qū)間的多個(gè)候補(bǔ)。
      【專利摘要】本發(fā)明涉及一種聲音檢索裝置以及聲音檢索方法。變換部(112)將檢索字符串變換為音素串。語(yǔ)速信息取得部(114)取得與檢索對(duì)象的聲音信號(hào)的語(yǔ)速對(duì)應(yīng)的語(yǔ)速信息。時(shí)間長(zhǎng)度變更部(115)根據(jù)語(yǔ)速信息變更音素的平均持續(xù)時(shí)間長(zhǎng)度。時(shí)間長(zhǎng)度導(dǎo)出部(116)使用變更后的持續(xù)時(shí)間長(zhǎng)度,導(dǎo)出與檢索字符串對(duì)應(yīng)的聲音的發(fā)聲時(shí)間長(zhǎng)度。區(qū)間指定部(117)指定多個(gè)檢索對(duì)象的聲音信號(hào)的似然取得區(qū)間。似然取得部(121)取得表示似然取得區(qū)間是發(fā)出與檢索字符串對(duì)應(yīng)的聲音的區(qū)間的似然度的似然。確定部(127)根據(jù)對(duì)于選擇出的似然取得區(qū)間分別取得的似然,確定從檢索對(duì)象的聲音信號(hào)中推定發(fā)出了與檢索字符串對(duì)應(yīng)的聲音的推定區(qū)間。
      【IPC分類】G06F17/30, G10L25/54
      【公開號(hào)】CN105718503
      【申請(qǐng)?zhí)枴緾N201510972004
      【發(fā)明人】富田寬基
      【申請(qǐng)人】卡西歐計(jì)算機(jī)株式會(huì)社
      【公開日】2016年6月29日
      【申請(qǐng)日】2015年12月22日
      【公告號(hào)】US20160180834
      當(dāng)前第6頁(yè)1 2 3 4 5 6 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1