国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種融合用戶反饋的漢語語音識別方法及系統(tǒng)的制作方法

      文檔序號:8224539閱讀:369來源:國知局
      一種融合用戶反饋的漢語語音識別方法及系統(tǒng)的制作方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及語音識別技術(shù)領(lǐng)域,特別涉及一種融合用戶反饋的漢語語音識別方法及系統(tǒng)。
      【背景技術(shù)】
      [0002]近年來,計算機自動語音識別技術(shù)取得了長足的進展,涌現(xiàn)出了一批代表性的應(yīng)用,但是,由于當(dāng)前語音識別技術(shù)自身的限制,識別錯誤仍然不可避免,而很多情況下少數(shù)幾個錯字就能改變整個句子的語義,因而大大影響了用戶的體驗和對語音識別技術(shù)的熱
      1同O
      [0003]為解決當(dāng)前語音識別技術(shù)與實際應(yīng)用需求之間的矛盾,一些研宄者將語音識別和人機交互技術(shù)相結(jié)合,提出了融合用戶反饋的語音識別錯誤修正方法,其主要特點是提供便捷的交互界面輔助用戶對識別結(jié)果進行反饋和修正,以得到高準(zhǔn)確率的識別文本。這些反饋方式包括結(jié)合鍵盤輸入、語音重新輸入(re-speaking)、手寫輸入等的多通道輸入和候選選擇。近年來,以詞為單位的候選選擇受到了研宄者的重視,該方式下系統(tǒng)不僅顯示每句話的識別結(jié)果,而且為識別結(jié)果中的每個詞同時提供多個候選,當(dāng)?shù)谝缓蜻x識別錯誤時,用戶可通過選擇其它候選詞來糾正識別錯誤,這種方法可將相當(dāng)一部分錯誤修正工作以點擊或觸摸的形式實現(xiàn),用戶界面友好、操作效率較高,但是,當(dāng)識別錯誤較多時,用戶需要查看各候選列并進行選擇,還需要采用鍵盤等設(shè)備輸入不在候選列表中的字詞,人工操作負擔(dān)仍然相對較重,因此,提高語音識別結(jié)果的正確率,減少所需的修正操作,特別是鍵盤輸入操作,仍然是當(dāng)前研宄的重點,而在提高語音識別正確率方面,除了提高通用識別引擎的性能外,針對用戶正在輸入的語音,自動學(xué)習(xí)用戶反饋中的包含的隱含信息,快速調(diào)整識別結(jié)果,對于提高識別性能、提升用戶體驗,也具有重要作用。

      【發(fā)明內(nèi)容】

      [0004]針對現(xiàn)有技術(shù)的不足,本發(fā)明提出一種融合用戶反饋的漢語語音識別方法及系統(tǒng)。
      [0005]本發(fā)明提出一種融合用戶反饋的漢語語音識別方法,包括:
      [0006]步驟1,獲取輸入語音,根據(jù)所述輸入語音,生成詞網(wǎng)格,并將所述詞網(wǎng)格轉(zhuǎn)換為字的候選列表;
      [0007]步驟2,獲取用戶對所述候選列表中的所述用戶反饋,所述用戶反饋包括:所述用戶選擇所述候選列表中與所述輸入語音相對應(yīng)的正確字,或輸入與所述輸入語音相對應(yīng)的所述正確字;
      [0008]步驟3,,將所述正確字以及所述正確字對應(yīng)的候選列之前的各候選列的第一個候選字作為已確定文字,并以所述已確定文字為約束和指導(dǎo),調(diào)整未確定文字對應(yīng)的所述候選列表,生成新的候選列表;
      [0009]步驟4,重復(fù)所述步驟2、3,直到正確識別所述輸入語音或所述用戶輸入新輸入語音,以完成語音識別。
      [0010]所述的融合用戶反饋的漢語語音識別方法,所述步驟3包括:
      [0011]步驟31,對于所述已確定文字,創(chuàng)建只包括正確字/詞的精簡詞網(wǎng)格;
      [0012]步驟32,將未確定文字對應(yīng)的所述候選列表進行詞網(wǎng)格擴充,生成與未確定文字對應(yīng)的所述候選列表中候選列中字/詞發(fā)音相近的字/詞,并創(chuàng)建對應(yīng)的詞網(wǎng)格節(jié)點;
      [0013]步驟33,將所述精簡詞網(wǎng)格與所述用戶反饋前的所述詞網(wǎng)格中對應(yīng)未確定文字的部分相連,并將所述詞網(wǎng)格節(jié)點加入所述詞網(wǎng)格,生成新詞網(wǎng)格;
      [0014]步驟34,對所述新詞網(wǎng)格進行概率重估,計算所述新詞網(wǎng)格中各路徑的概率;
      [0015]步驟35,根據(jù)所述新詞網(wǎng)格與所述概率,生成新候選列表。
      [0016]所述的融合用戶反饋的漢語語音識別方法,所述步驟31包括:將所述已確定文字切分為新詞,為每個新詞建立詞網(wǎng)格節(jié)點,并在相鄰新詞之間創(chuàng)建弧進行連接。
      [0017]所述的融合用戶反饋的漢語語音識別方法,所述步驟32包括:生成所述用戶反饋的候選列的下一候選列中的候選字的混淆音字;生成第一候選字與所述正確字相同,第二候選字與所述下一候選列中的候選字發(fā)音相近的混淆音詞。
      [0018]本發(fā)明還提出一種融合用戶反饋的漢語語音識別系統(tǒng),包括:
      [0019]自動語音識別模塊,用于獲取輸入語音,根據(jù)所述輸入語音,生成詞網(wǎng)格,并將所述詞網(wǎng)格轉(zhuǎn)換為字的候選列表;
      [0020]獲取用戶反饋模塊,用于獲取用戶對所述候選列表中的所述用戶反饋,所述用戶反饋包括:所述用戶選擇所述候選列表中與所述輸入語音相對應(yīng)的正確字,或輸入與所述輸入語音相對應(yīng)的所述正確字;
      [0021]調(diào)整候選列表模塊,用于將所述正確字以及所述正確字對應(yīng)的候選列之前的各候選列的第一個候選字作為已確定文字,并以所述已確定文字為約束和指導(dǎo),調(diào)整未確定文字對應(yīng)的所述候選列表,生成新的候選列表;
      [0022]識別模塊,用于重復(fù)運行所述獲取用戶反饋模塊、所述調(diào)整候選列表模塊,直到正確識別所述輸入語音或所述用戶輸入新輸入語音,以完成語音識別。
      [0023]所述的融合用戶反饋的漢語語音識別系統(tǒng),所述調(diào)整候選列表模塊包括:精簡模塊,用于對于所述已確定文字,創(chuàng)建只包括正確字/詞的精簡詞網(wǎng)格;
      [0024]擴充模塊,用于將未確定文字對應(yīng)的所述候選列表進行詞網(wǎng)格擴充,生成與未確定文字對應(yīng)的所述候選列表中候選列中字/詞發(fā)音相近的字/詞,并創(chuàng)建對應(yīng)的詞網(wǎng)格節(jié)占.V,
      [0025]詞網(wǎng)格連接模塊,用于將所述精簡詞網(wǎng)格與所述用戶反饋前的所述詞網(wǎng)格中對應(yīng)未確定文字的部分相連,并將所述詞網(wǎng)格節(jié)點加入所述詞網(wǎng)格,生成新詞網(wǎng)格;
      [0026]詞網(wǎng)格重估模塊,對所述新詞網(wǎng)格進行概率重估,計算所述新詞網(wǎng)格中各路徑的概率;
      [0027]新候選列表生成模塊,根據(jù)所述新詞網(wǎng)格與所述概率,生成新候選列表。
      [0028]所述的融合用戶反饋的漢語語音識別系統(tǒng),所述精簡模塊包括,用于將所述已確定文字切分為新詞,為每個新詞建立詞網(wǎng)格節(jié)點,并在相鄰新詞之間創(chuàng)建弧進行連接。
      [0029]所述的融合用戶反饋的漢語語音識別系統(tǒng),所述擴充模塊包括:用于生成所述用戶反饋的候選列的下一候選列中的候選字的混淆音字;生成第一候選字與所述正確字相同,第二候選字與所述下一候選列中的候選字發(fā)音相近的混淆音詞。
      [0030]由以上方案可知,本發(fā)明的優(yōu)點在于:
      [0031]本發(fā)明不同于已有的融合用戶反饋的語音識別系統(tǒng)只能被動地接收用戶修正,本發(fā)明提供的融合用戶反饋的漢語語音識別方法及系統(tǒng),可以利用用戶反饋的信息動態(tài)調(diào)整候選列表,使得每當(dāng)用戶反饋后,都能自動提高后續(xù)候選列表的準(zhǔn)確率,從而可以減少用戶的修正操作,從而節(jié)省人力。
      【附圖說明】
      [0032]圖1為融合用戶反饋的漢語語音識別方法的流程和步驟圖;
      [0033]圖2為詞網(wǎng)格示例圖;
      [0034]圖3為候選列表不例圖;
      [0035]圖4為顯示候選列表和獲取用戶反饋的界面圖;
      [0036]圖5為基于用戶反饋的候選列表動態(tài)調(diào)整示例圖;
      [0037]圖6為基于詞網(wǎng)格增減和重估的候選列表調(diào)整方法的流程和步驟圖;
      [0038]圖7為精簡詞網(wǎng)格不例圖;
      [0039]圖8為詞網(wǎng)格連接示例圖。
      【具體實施方式】
      [0040]本發(fā)明的目的是解決上述現(xiàn)有的融入用戶反饋的語音識別系統(tǒng)只能被動接收用戶修正,需要耗費大量的人力才能得到正確語音識別結(jié)果,無法利用用戶反饋提高候選列表的準(zhǔn)確率的問題。本發(fā)明提供了一種融合用戶反饋的漢語語音識別方法和系統(tǒng)。該方法和系統(tǒng)將語音識別結(jié)果表示為以漢字為單位的候選列表顯示在屏幕上,然后接收用戶以候選選擇和輸入方式進行的修正反饋操作,每次反饋后,自動調(diào)整候選列表,以提高用戶尚未反饋的候選列表的正確率。
      [0041]如圖1所示,以下為本發(fā)明的流程和步驟:
      [0042]步驟I,采用自動語音識別模塊,對輸入語音進行自動識別。對于每一句語音,保存其中間識別結(jié)果N-best詞網(wǎng)格,并將詞網(wǎng)格轉(zhuǎn)換為以漢字為單位的候選列表,顯示在屏幕上。詞網(wǎng)格(word lattice)是語音識別領(lǐng)域常用的數(shù)據(jù)結(jié)構(gòu),也稱為詞圖,本質(zhì)上是一個有向無環(huán)圖,詞網(wǎng)格中的每個結(jié)點對應(yīng)一個詞,每條弧為從一個結(jié)點指向另一個結(jié)點的有向連接。如果詞網(wǎng)格中存在從結(jié)點NI到結(jié)點N2的弧,則稱NI為N2的前驅(qū)結(jié)點,N2為NI的后繼結(jié)點,語音識別本質(zhì)上是在詞網(wǎng)格上尋找一條概率最高的路徑的過程,N-best詞網(wǎng)格為概率最高的前N條識別結(jié)果對應(yīng)的結(jié)點和弧構(gòu)成的詞網(wǎng)格;所述候選列表包含若干列,每列中的字為具有競爭關(guān)系的候選字,所有列的第一個字組成的句子為語音識別系統(tǒng)的默認識別結(jié)果。漢字候選列表的生成可采用當(dāng)前已有方法,如采用專利ZL201010269306.9( —種交互式語音識別系統(tǒng)和方法)中的“候選生成與錯誤修正模塊”從詞網(wǎng)格生成候選列表;
      [0043]步驟2,對于當(dāng)前顯示的漢字候選列表,采用用戶反饋獲取界面獲取用戶反饋,所述用戶反饋獲取界面可支持的反饋方式包括:
      [0044]候選
      當(dāng)前第1頁1 2 3 4 5 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1