国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于識(shí)別語(yǔ)音的預(yù)處理裝置及其方法

      文檔序號(hào):8340788閱讀:398來(lái)源:國(guó)知局
      用于識(shí)別語(yǔ)音的預(yù)處理裝置及其方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及一種用于識(shí)別語(yǔ)音的預(yù)處理裝置及其方法,尤其涉及識(shí)別語(yǔ)音時(shí)考慮用戶的聲響預(yù)處理語(yǔ)音信號(hào),使得末端靜音區(qū)間(Trailing Silence)保持一定,以提高語(yǔ)音識(shí)別性能的用于識(shí)別語(yǔ)音的預(yù)處理裝置及其方法。
      【背景技術(shù)】
      [0002]現(xiàn)在隨著電子裝置的智能化發(fā)展,越來(lái)越多地通過(guò)語(yǔ)音對(duì)裝置進(jìn)行控制。
      [0003]為了控制上述利用語(yǔ)音的裝置,需要識(shí)別語(yǔ)音并理解語(yǔ)言,因此對(duì)語(yǔ)音識(shí)別傳感器或語(yǔ)音識(shí)別裝置的研究增多。
      [0004]例如,現(xiàn)在隨著出臺(tái)關(guān)于禁止車輛行駛過(guò)程中收看數(shù)字多媒體廣播(DMB)或操作導(dǎo)航儀的道路交通法修正案,對(duì)導(dǎo)航儀的語(yǔ)音識(shí)別功能的關(guān)注度進(jìn)一步上升。
      [0005]識(shí)別語(yǔ)音需大量消耗裝置資源(即CPU或存儲(chǔ)器資源)。從而如導(dǎo)航儀等資源并不充分的便攜裝置,為了盡可能降低裝置的資源消耗,并且為了確保正確的信號(hào)處理,需要進(jìn)行處理使得能夠準(zhǔn)確地檢測(cè)到可能的語(yǔ)音輸入?yún)^(qū)間。
      [0006]現(xiàn)有語(yǔ)音識(shí)別裝置(或者語(yǔ)音識(shí)別引擎)為能夠準(zhǔn)確地檢測(cè)到上述語(yǔ)音識(shí)別區(qū)間而采用的一種處理方法是包含末端靜音(Trailing Silence)區(qū)間的方法。
      [0007]在此,所述末端靜音區(qū)間指輸出用于告知用戶開(kāi)始輸入用于識(shí)別的語(yǔ)音的開(kāi)始音(例如:嘟嘟(BEEP)音)至實(shí)際輸入語(yǔ)音信號(hào)的時(shí)間,或者音節(jié)與音節(jié)之間的無(wú)音區(qū)間。
      [0008]例如,啟動(dòng)語(yǔ)音識(shí)別時(shí),當(dāng)用戶為了正常的信號(hào)處理而按語(yǔ)音識(shí)別裝置(例:導(dǎo)航儀)的語(yǔ)音識(shí)別啟動(dòng)鍵時(shí),所述語(yǔ)音識(shí)別裝置輸出語(yǔ)音識(shí)別開(kāi)始音(例:嘟嘟(BEEP)音)。因此,用戶聽(tīng)到所述開(kāi)始音后輸入語(yǔ)音(或是語(yǔ)音命令),所述語(yǔ)音識(shí)別裝置處理所述開(kāi)始音輸出后輸入的語(yǔ)音信號(hào),以分析語(yǔ)音(或是語(yǔ)音命令)。
      [0009]所以,利用如上述方式(即,輸出開(kāi)始音后輸入語(yǔ)音的方式)執(zhí)行語(yǔ)音識(shí)別時(shí),若如圖1中的(b)所示地在所述開(kāi)始音輸出之前先輸入語(yǔ)音,或者如圖1中的(C)所示地在輸出所述開(kāi)始音后經(jīng)過(guò)特定時(shí)間時(shí)輸入語(yǔ)音,那么所述語(yǔ)音識(shí)別裝置不能正確執(zhí)行信號(hào)處理,無(wú)法準(zhǔn)確地識(shí)別語(yǔ)音。即有語(yǔ)音識(shí)別率降低的問(wèn)題。
      [0010]換言之,利用如上所述的方式(即,輸出開(kāi)始音后輸入語(yǔ)音的方式)執(zhí)行語(yǔ)音識(shí)別時(shí),如圖1中的(a)所示,需要根據(jù)所述語(yǔ)音識(shí)別裝置輸入包含適當(dāng)長(zhǎng)度的末端靜音區(qū)間的語(yǔ)音信號(hào)。但是當(dāng)所述末端靜音區(qū)間因用戶的聲響而變長(zhǎng)或變短時(shí),與包括適當(dāng)長(zhǎng)度的末端靜音區(qū)間的情況相比,具有語(yǔ)音識(shí)別率降低的問(wèn)題。
      [0011]本發(fā)明的【背景技術(shù)】公開(kāi)在韓國(guó)授權(quán)專利10-0714721號(hào)(授權(quán)日:2007年04月27
      日,語(yǔ)音區(qū)間檢測(cè)方法及其裝置)。

      【發(fā)明內(nèi)容】

      [0012]技術(shù)問(wèn)題
      [0013]本發(fā)明為了解決上述問(wèn)題,目的在于提供一種識(shí)別語(yǔ)音時(shí)考慮用戶的聲響預(yù)處理語(yǔ)音信號(hào),使得末端靜音(Trailing Silence)區(qū)間保持一定,以提高語(yǔ)音識(shí)別性能的用于識(shí)別語(yǔ)音的預(yù)處理裝置及其方法。
      [0014]技術(shù)方案
      [0015]根據(jù)本發(fā)明的一個(gè)側(cè)面,本發(fā)明提供一種用于識(shí)別語(yǔ)音的預(yù)處理裝置,其包括:末端靜音區(qū)間檢測(cè)部,其用于檢測(cè)包含在語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度;基準(zhǔn)末端靜音區(qū)間存儲(chǔ)部,其用于存儲(chǔ)基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度;以及末端靜音區(qū)間調(diào)整部,其用于按照所述基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度調(diào)整包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度。
      [0016]本發(fā)明的特征在于,所述末端靜音區(qū)間是輸出語(yǔ)音識(shí)別開(kāi)始音后,從通過(guò)語(yǔ)音輸入構(gòu)件輸入的語(yǔ)音信號(hào)中輸入有實(shí)際用戶的語(yǔ)音的時(shí)間的無(wú)音區(qū)間。
      [0017]本發(fā)明的另一特征在于,所述末端靜音區(qū)間調(diào)整部在從所述語(yǔ)音信號(hào)中檢測(cè)到的末端靜音區(qū)間的長(zhǎng)度短于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度時(shí),通過(guò)延長(zhǎng)所述語(yǔ)音信號(hào)的末端靜音區(qū)間的長(zhǎng)度,以調(diào)整成基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。
      [0018]本發(fā)明的又一特征在于,所述末端靜音區(qū)間調(diào)整部在從所述語(yǔ)音信號(hào)中檢測(cè)到的末端靜音區(qū)間的長(zhǎng)度長(zhǎng)于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度時(shí),通過(guò)縮短所述語(yǔ)音信號(hào)的末端靜音區(qū)間的長(zhǎng)度,以調(diào)整成基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。
      [0019]本發(fā)明的又一特征在于,所述末端靜音區(qū)間調(diào)整部在調(diào)整所述末端靜音區(qū)間時(shí),通過(guò)添加或刪除所述語(yǔ)音信號(hào)開(kāi)始的初始部分的區(qū)間進(jìn)行調(diào)整。
      [0020]根據(jù)本發(fā)明的另一側(cè)面,本發(fā)明提供一種用于識(shí)別語(yǔ)音的預(yù)處理方法,其特征在于,包括:接收語(yǔ)音信號(hào)的步驟;檢測(cè)包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的步驟;以及按照預(yù)先設(shè)定的基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度調(diào)整包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的步驟。
      [0021]本發(fā)明的另一特征在于,所述調(diào)整包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的步驟具體是,在從所述語(yǔ)音信號(hào)中檢測(cè)到的末端靜音區(qū)間的長(zhǎng)度短于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度時(shí),通過(guò)延長(zhǎng)所述語(yǔ)音信號(hào)的末端靜音區(qū)間的長(zhǎng)度,以調(diào)整成基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。
      [0022]本發(fā)明的又一特征在于,所述調(diào)整包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的步驟具體是,在從所述語(yǔ)音信號(hào)檢測(cè)到的末端靜音區(qū)間的長(zhǎng)度長(zhǎng)于基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度時(shí),通過(guò)縮短所述語(yǔ)音信號(hào)的末端靜音區(qū)間的長(zhǎng)度,以調(diào)整成基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度。
      [0023]本發(fā)明的又一特征在于,所述調(diào)整包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度的步驟具體是,在調(diào)整所述末端靜音區(qū)間時(shí),通過(guò)添加或刪除所述語(yǔ)音信號(hào)開(kāi)始的初始部分的區(qū)間進(jìn)行調(diào)整。
      [0024]本發(fā)明的特征在于,所述末端靜音區(qū)間是輸出語(yǔ)音識(shí)別開(kāi)始音后,至通過(guò)語(yǔ)音輸入構(gòu)件輸入的語(yǔ)音信號(hào)中輸入有實(shí)際用戶的語(yǔ)音的時(shí)間的無(wú)音區(qū)間。
      [0025]技術(shù)效果
      [0026]根據(jù)本發(fā)明,在識(shí)別語(yǔ)音時(shí)考慮用戶的聲響預(yù)處理語(yǔ)音信號(hào),使得末端靜音區(qū)間保持一定,從而提高語(yǔ)音識(shí)別性能。
      【附圖說(shuō)明】
      [0027]圖1為說(shuō)明現(xiàn)有語(yǔ)音識(shí)別裝置中包含在接收到的語(yǔ)音信號(hào)中的末端靜音區(qū)間的長(zhǎng)度所對(duì)應(yīng)的語(yǔ)音識(shí)別率的示意圖;
      [0028]圖2為顯示本發(fā)明的一個(gè)實(shí)施例的語(yǔ)音識(shí)別裝置的大致構(gòu)成的示意圖;
      [0029]圖3為說(shuō)明本發(fā)明的一個(gè)實(shí)施例的用于識(shí)別語(yǔ)音的預(yù)處理方法的流程圖;
      [0030]圖4為上述圖3中說(shuō)明末端靜音區(qū)間的調(diào)整方法的語(yǔ)音信號(hào)的示意圖;
      [0031]圖5為顯示本發(fā)明的一個(gè)實(shí)施例的調(diào)整包含在語(yǔ)音信號(hào)中的末端靜音區(qū)間長(zhǎng)度的情況和沒(méi)有調(diào)整時(shí)的情況的語(yǔ)音識(shí)別率比較表格。
      [0032]附圖標(biāo)記說(shuō)明
      [0033]MIC:語(yǔ)音輸入部110:模數(shù)轉(zhuǎn)換部(AD轉(zhuǎn)換部)
      [0034]120:末端靜音區(qū)間預(yù)處理部 121:末端靜音區(qū)間檢測(cè)部
      [0035]122:末端靜音區(qū)間調(diào)整部 123:基準(zhǔn)末端靜音區(qū)間存儲(chǔ)部
      [0036]130:信號(hào)預(yù)處理部140:語(yǔ)音識(shí)別部
      【具體實(shí)施方式】
      [0037]以下,參考【附圖說(shuō)明】本發(fā)明的用于識(shí)別語(yǔ)音的預(yù)處理裝置及其方法的一個(gè)實(shí)施例。
      [0038]此過(guò)程中,附圖所示的線條的寬度或構(gòu)成要素的大小等,為了說(shuō)明的明確性和便利性有可能放大顯示。另外,后述的用語(yǔ)是考慮到本發(fā)明的功能而定義的用語(yǔ),根據(jù)使用者、運(yùn)營(yíng)者的意圖和慣例可有所不同。所以對(duì)這些用語(yǔ)的定義應(yīng)以本說(shuō)明書(shū)全篇內(nèi)容為準(zhǔn)。
      [0039]圖2為顯示本發(fā)明的一個(gè)實(shí)施例的語(yǔ)音識(shí)別裝置的大致構(gòu)成的示意圖。
      [0040]如圖2所示,本發(fā)明的一個(gè)實(shí)施例的語(yǔ)音識(shí)別裝置包括語(yǔ)音輸入部MIC、模數(shù)轉(zhuǎn)換部(AD轉(zhuǎn)換部)110、末端靜音區(qū)間預(yù)處理部120、信號(hào)預(yù)處理部130以及語(yǔ)音識(shí)別部140。
      [0041]所述語(yǔ)音輸入部MIC是用于接收用戶的語(yǔ)音的構(gòu)成要素,例如相當(dāng)于麥克風(fēng)。
      [0042]所述模數(shù)轉(zhuǎn)換部110將從所述語(yǔ)音輸入部MIC輸出的用戶語(yǔ)音信號(hào)轉(zhuǎn)換為易于處理的數(shù)字信號(hào)。
      [0043]所述末端靜音區(qū)間預(yù)處理部120包括:檢測(cè)包含在所述語(yǔ)音信號(hào)中的末端靜音區(qū)間(時(shí)間)的長(zhǎng)度的末端靜音區(qū)間檢測(cè)部121,存儲(chǔ)基準(zhǔn)末端靜音區(qū)間(時(shí)間)長(zhǎng)度的基準(zhǔn)末端靜音區(qū)間存儲(chǔ)部123,按照所述基準(zhǔn)末端靜音區(qū)間的長(zhǎng)度調(diào)整包含
      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1