国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種農(nóng)產(chǎn)品市場要素信息采集的魯棒性語音識(shí)別方法

      文檔序號(hào):2827753閱讀:198來源:國知局
      一種農(nóng)產(chǎn)品市場要素信息采集的魯棒性語音識(shí)別方法
      【專利摘要】本發(fā)明涉及語音識(shí)別【技術(shù)領(lǐng)域】,特別是關(guān)于一種農(nóng)產(chǎn)品市場要素信息采集的魯棒性語音識(shí)別方法,包括采集初始語音信號(hào),利用最小均方誤差(MMSE)譜減算法對(duì)所述初始語音信號(hào)進(jìn)行去噪,得到近似純凈語音信號(hào),提取所述近似純凈語音信號(hào)的特征值,對(duì)所述特征值進(jìn)行倒譜均值方差歸一化(CMVN)補(bǔ)償,根據(jù)該補(bǔ)償后的語音特征向量訓(xùn)練隱馬爾可夫模型(HMM)。通過上述的方法,面向非特定人的中等詞匯量的連續(xù)語音識(shí)別系統(tǒng),所采用的算法簡單,易于實(shí)現(xiàn),計(jì)算量小。
      【專利說明】一種農(nóng)產(chǎn)品市場要素信息采集的魯棒性語音識(shí)別方法

      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明涉及語音識(shí)別【技術(shù)領(lǐng)域】,特別是關(guān)于一種農(nóng)產(chǎn)品市場要素信息采集的魯棒 性語音識(shí)別方法。

      【背景技術(shù)】
      [0002] 農(nóng)產(chǎn)品市場信息關(guān)系到農(nóng)業(yè)和社會(huì)穩(wěn)定,是保證經(jīng)濟(jì)穩(wěn)定健康發(fā)展的基礎(chǔ)。針對(duì) 農(nóng)產(chǎn)品市場信息的重要性,國家相關(guān)的部門和地方政府也紛紛建立了各種形式的農(nóng)產(chǎn)品市 場信息采集平臺(tái),信息的采集方式往往利用傳統(tǒng)的人工抄錄再進(jìn)行二次錄入計(jì)算機(jī)、電話 報(bào)價(jià)或郵件匯總等方式來完成,但此類信息采集方法重復(fù)勞動(dòng)較多,效率不高,且時(shí)效性較 差。為此,很多機(jī)構(gòu)和科研人員紛紛提出了信息采集的方法,開發(fā)了各種便攜式的信息采 集設(shè)備。這些方式有自身的優(yōu)點(diǎn)和便捷之處,提高了工作效率,但也存在不少問題。一般來 說,便攜式設(shè)備的屏幕和按健都較小,而農(nóng)產(chǎn)品市場信息采集的工作場所往往是在室外,容 易受到強(qiáng)烈光線、雨霧冰雪、惡劣天氣、野外環(huán)境等條件的限制,給操作帶來了不便;另一方 面,從人機(jī)交互的角度考慮,現(xiàn)有的信息采集設(shè)備主要依靠雙手和視覺的配合來完成操作, 但對(duì)需要人工干預(yù)的情況下進(jìn)行的信息采集,因其大部分是在生產(chǎn)過程、操作同時(shí)進(jìn)行的, 傳統(tǒng)的設(shè)備必然導(dǎo)致操作人員暫時(shí)中斷當(dāng)前的工作轉(zhuǎn)而進(jìn)行信息的采集,這樣就會(huì)導(dǎo)致勞 動(dòng)生產(chǎn)效率的降低。此外,傳統(tǒng)的信息采集設(shè)備因操作界面和提示信息的復(fù)雜等因素,對(duì)操 作人員的知識(shí)水平和認(rèn)知能力都具有較高的要求。
      [0003] 近年來,隨著語音識(shí)別(Speech Recognition)技術(shù)的迅速發(fā)展,基于語音交互界 面的設(shè)備也在諸多行業(yè)開始應(yīng)用。語音識(shí)別可以將語音轉(zhuǎn)換為文本的形式,進(jìn)而進(jìn)行各種 形式的處理和應(yīng)用。從人機(jī)交互的角度看,語音交互界面是最佳的便攜式設(shè)備的人機(jī)交互 接口。經(jīng)過幾十年的研究,語音識(shí)別有了長足的發(fā)展。在相對(duì)安靜的環(huán)境中,語音識(shí)別能 取得非常好的識(shí)別結(jié)果。但在噪聲環(huán)境下,現(xiàn)有的面向非特定人的語音識(shí)別系統(tǒng)因受到噪 聲的污染,其識(shí)別性能則會(huì)急劇下降,尤其是在低信噪比的情況下,識(shí)別性能更為糟糕。一 方面,造成這種低識(shí)別率的原因是識(shí)別環(huán)境與訓(xùn)練環(huán)境的不匹配,這種不匹配是造成識(shí)別 性能下降的主要原因。噪聲魯棒性語音識(shí)別的研究目標(biāo)就是消除或盡量減少這種不匹配現(xiàn) 象,提高識(shí)別性能。另一方面,農(nóng)產(chǎn)品市場信息采集的作業(yè)環(huán)境非常復(fù)雜,如大型農(nóng)產(chǎn)品批 發(fā)市場、社區(qū)農(nóng)貿(mào)市場、超市、農(nóng)產(chǎn)品加工車間等,其所處的環(huán)境噪聲包括人群噪聲、汽車噪 聲、工廠機(jī)器噪聲等,給語音識(shí)別帶了較大的影響。而目前缺乏專門的面向農(nóng)產(chǎn)品市場信息 采集領(lǐng)域的專用識(shí)別引擎,通用領(lǐng)域的語音識(shí)別系統(tǒng)往往是大詞匯量連續(xù)語音識(shí)別,在該 環(huán)境下表現(xiàn)不佳。


      【發(fā)明內(nèi)容】

      [0004] 為了解決現(xiàn)有技術(shù)中針對(duì)于農(nóng)產(chǎn)品市場信息采集終端不能語音識(shí)別的問題,提出 了一種農(nóng)產(chǎn)品市場要素信息采集的魯棒性語音識(shí)別方法,通過譜減算法和CMVN相結(jié)合的 方式實(shí)現(xiàn)了在我國農(nóng)貿(mào)市場高效率的語音識(shí)別。
      [0005] 本發(fā)明實(shí)施例提供了一種農(nóng)產(chǎn)品市場要素信息采集的魯棒性語音識(shí)別方法,包 括,
      [0006] 步驟101,采集初始語音信號(hào);
      [0007] 步驟102,利用譜減算法對(duì)所述初始語音信號(hào)進(jìn)行去噪,得到近似純凈語音信號(hào);
      [0008] 步驟103,提取所述近似純凈語音信號(hào)的特征值;
      [0009] 步驟104,對(duì)所述特征值進(jìn)行倒譜均值方差歸一化補(bǔ)償;
      [0010] 步驟105,根據(jù)該補(bǔ)償后的語音特征向量訓(xùn)練隱馬爾可夫模型。
      [0011] 根據(jù)本發(fā)明實(shí)施例所述的一種高魯棒性語音識(shí)別方法的一個(gè)進(jìn)一步的方面,在所 述對(duì)所述特征值進(jìn)行倒譜均值方差歸一化補(bǔ)償之后還包括,對(duì)待識(shí)別語音信號(hào)進(jìn)行所述步 驟101-步驟104,將得到補(bǔ)償后的待識(shí)別語音特征向量輸入所述隱馬爾可夫模型進(jìn)行識(shí) 另IJ,輸出識(shí)別結(jié)果。
      [0012] 根據(jù)本發(fā)明實(shí)施例所述的一種高魯棒性語音識(shí)別方法的再一個(gè)進(jìn)一步的方面,在 所述利用譜減算法對(duì)所述初始語音信號(hào)進(jìn)行去噪中進(jìn)一步包括,利用如下公式對(duì)初始語音 信號(hào)進(jìn)行譜減算法:
      [0013]

      【權(quán)利要求】
      1. 一種農(nóng)產(chǎn)品市場要素信息采集的魯棒性語音識(shí)別方法,其特征在于包括, 步驟101,采集初始語音信號(hào); 步驟102,利用譜減算法對(duì)所述初始語音信號(hào)進(jìn)行去噪,得到近似純凈語音信號(hào); 步驟103,提取所述近似純凈語音信號(hào)的特征值; 步驟104,對(duì)所述特征值進(jìn)行倒譜均值方差歸一化補(bǔ)償; 步驟105,根據(jù)該補(bǔ)償后的語音特征向量訓(xùn)練隱馬爾可夫模型。
      2. 根據(jù)權(quán)利要求1所述的一種農(nóng)產(chǎn)品市場要素信息采集的魯棒性語音識(shí)別方法,其特 征在于,在所述對(duì)所述特征值進(jìn)行倒譜均值方差歸一化補(bǔ)償之后還包括,對(duì)待識(shí)別語音信 號(hào)進(jìn)行所述步驟101-步驟104,將得到補(bǔ)償后的待識(shí)別語音特征向量輸入所述隱馬爾可夫 模型進(jìn)行識(shí)別,輸出識(shí)別結(jié)果。
      3. 根據(jù)權(quán)利要求1所述的一種農(nóng)產(chǎn)品市場要素信息采集的魯棒性語音識(shí)別方法,其特 征在于,在所述利用譜減算法對(duì)所述初始語音信號(hào)進(jìn)行去噪中進(jìn)一步包括,利用如下公式 對(duì)初始語音信號(hào)進(jìn)行譜減算法:
      其中,Υρ(ω)和αρ(ω)是最優(yōu)減法參數(shù),p為 冪指數(shù),|Υ(ω) |ρ是帶噪語音信號(hào)譜,6(_為無語音段求得的噪聲信號(hào),是估計(jì)的 噪聲譜,|Χρ(ω) ^是采用理想的譜減模型條件下的近似純凈語音譜,是估計(jì)的近似 純凈語音譜; 參數(shù)Υρ(ω)
      和αρ(ω)通過最小化頻譜的均方誤差得到: 初始語音信號(hào)|Υ(ω)|ρ* |Χρ(ω)|ρ和噪聲譜的和,對(duì)某一常數(shù)ρ成立: |Υ(ω) |ρ = |Χρ(ω) |P+|D(?) |ρ,其中,|D(c〇) |ρ是理想中噪聲譜的真實(shí)值; 通過計(jì)算譜誤差ep (ω)的最小化均方值Ε [ {ep (ω)}2],得到如下的最優(yōu)減法參數(shù):
      其中,ξ (ω)對(duì)應(yīng)于信號(hào)能量和噪聲能量的比值,稱為先驗(yàn)SNR,通過
      十算得到,其中Π 為平滑常數(shù),, 2是 上一分析幀中求得的近似純凈語音的功率譜,|Υ(ω) |2是初始語音信號(hào)的功率譜,|i)(幼|2 是估計(jì)的噪聲功率譜。
      4. 根據(jù)權(quán)利要求3所述的一種高魯棒性語音識(shí)別方法,其特征在于,所述η為0.98。
      5. 根據(jù)權(quán)利要求1所述的一種高魯棒性語音識(shí)別方法,其特征在于,對(duì)所述特征值進(jìn) 行倒譜均值方差歸一化補(bǔ)償進(jìn)一步包括,對(duì)第t幀特征值進(jìn)行倒譜均值歸一化: An 并進(jìn)行倒譜方差歸一化:
      其中,〇t為第t幀的特征值,μ t為第t幀的均值,σ t為第t幀的方差。
      6.根據(jù)權(quán)利要求5所述的一種高魯棒性語音識(shí)別方法,其特征在于,所述特征值的序 列為0 = {Oi, 02,…,Ot_N,…,Oh, ot, ot+1,…,Ot+N,…,οτ},T為所述序列的長度,采用了分段 特征向量歸一化方法,第t幀的均值和方差表示為:
      其中,N為以t為中心點(diǎn)的分段長度半徑,取20?40之間。
      【文檔編號(hào)】G10L15/14GK104157294SQ201410429563
      【公開日】2014年11月19日 申請(qǐng)日期:2014年8月27日 優(yōu)先權(quán)日:2014年8月27日
      【發(fā)明者】諸葉平, 許金普 申請(qǐng)人:中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1