国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      具有同時文本編輯的語音識別方法和系統(tǒng)的制作方法

      文檔序號:9872437閱讀:741來源:國知局
      具有同時文本編輯的語音識別方法和系統(tǒng)的制作方法
      【技術領域】
      [0001]本發(fā)明一般地涉及用于將語音(S卩,所聽寫的詞匯)轉換成書面文本的方法和系統(tǒng)。在這樣的方法或系統(tǒng)中使用的工具一般地被稱作聽寫工具。本發(fā)明尤其關系到在將語音轉換成文本的同時允許編輯文本的更加用戶友好的方法和系統(tǒng)。
      【背景技術】
      [0002]在廣泛的各種應用中使用將語音或所聽寫的詞匯轉換成書面文本的聽寫工具。一個示例是醫(yī)學報告的創(chuàng)建。這樣的報告的作者,例如放射線學者、心臟病學者、技術人員等,使用語音識別以采用預定義的格式和文本填寫醫(yī)學報告中的某些字段。用戶聽寫詞匯,通過話音識別引擎識別這些詞匯并將它們轉換成被插入到所選擇的字段中的文本。
      [0003]現(xiàn)存的聽寫工具代表性地具有其中語音被記錄并被轉換成文本的記錄模式,以及其中可以編輯書面文本的編輯模式。如果用戶期望操作文本,例如選擇文本的一部分、刪除詞匯、重新聽寫在句子中的一組詞匯等,那么必須停止記錄模式,必須開始編輯模式,必須在編輯模式中執(zhí)行文本操作,并且一旦完成文本編輯就必須重新開始記錄模式。必須多次點擊允許重新開始記錄模式的記錄按鈕,尤其是當需要多次文本操作時,作為這樣的結果,現(xiàn)存的聽寫工具被認知為非用戶友好的。
      [0004]歐洲專利申請EP2261 893在段落
      [0003]中承認到,現(xiàn)存聽寫系統(tǒng)的模式行為是低效率的,因為詞匯的改正需要來自用戶的太多的動作或點擊。EP2 261 893因此描述了一種用于將音頻轉換成文本的系統(tǒng),其具有其中對語音排隊的被稱作聽寫模式的記錄模式,其中在回放語音的同時顯示文本使用戶能夠回顧文本的同時再現(xiàn)模式,以及其中用戶可以改正文本中的詞匯的編輯模式。在EP2 261 893中,通過使實現(xiàn)在同時再現(xiàn)模式期間的編輯文本改進了系統(tǒng)的模式行為。然而用戶仍不得不在每次期望文本操作時中斷聽寫模式。這使報告創(chuàng)建減度。
      [0005]本發(fā)明的目的是公開解決了此處上面辨別的現(xiàn)有技術解決方案的缺點的用于從所輸入的語音生成書面文本的方法和系統(tǒng)。更特別地,其目的在于定義一種增加用戶友好度并基本上加速通過話音識別的報告創(chuàng)建的方法和系統(tǒng)。

      【發(fā)明內容】

      [0006]根據(jù)本發(fā)明,通過由權利要求1限定的用于從音頻輸入生成并編輯文本的方法來實現(xiàn)上面限定的目的,該方法包括:
      -將來自用戶的語音排隊在音頻隊列中;
      -通過語音識別將被存儲在所述音頻隊列中的語音轉換成文本;
      -向所述用戶顯示所述文本;
      -將文本編輯事件排隊在所述音頻隊列中;
      -即刻向所述用戶顯示由所述文本編輯事件導致的改變;
      -當轉換在所述音頻隊列中排隊在所述文本編輯事件之前的所有語音時,停止所述語首識別;
      -在將來自所述用戶的另外的語音排隊在所述音頻隊列中的同時處理所述文本編輯事件并編輯所述文本;以及
      -當已經(jīng)處理了所述文本編輯事件時恢復所述語音識別。
      [0007]因此,本發(fā)明使用戶能夠在他/她處于語音記錄模式的同時編輯文本。當在音頻隊列中記錄另外的語音的同時,用戶可以將光標重新放置在所顯示的文本中,選擇所顯示的文本的部分,刪除所顯示的文本的部分,重新聽寫所選擇的文本部分等。語音將持續(xù)地被記錄在音頻隊列中,同時使由編輯事件導致的文本操作在所顯示的文本中即刻可見。例如在重新放置光標的情況中,光標已經(jīng)可見地被移動到在所顯示的文本中的新的位置,而仍正被轉換成文本的所聽寫的語音被添加到先前的位置。在文本編輯事件之前聽寫并記錄的所有語音一被轉換成所顯示的書面文本,就處理所排隊的文本編輯事件。作為其的結果,將向語音識別引擎通知關于在文本中由文本編輯事件導致的改變。在處理文本編輯事件的同時聽寫的另外的語音在此期間被記錄在音頻隊列中。只要正在處理文本編輯事件就停止語音識別,并且一處理了文本編輯事件就自動地再次恢復語音識別。
      [0008]根據(jù)本發(fā)明的方法顯著地提高了聽寫工具的用戶友好度,因為用戶不再必須在記錄模式和編輯模式之間切換。從而避免了過多的按鈕點擊或其它手動的模式切換指令。用戶開始記錄一次并停止記錄一次。在這之間,針對文本操作僅需要按鈕點擊、按鍵、鼠標點擊、或屏幕觸摸,而不切換模式。由于用戶可以在聽寫另外的詞匯的同時編輯或改正他的報告,因此本發(fā)明還顯著地加速報告創(chuàng)建。
      [0009]根據(jù)依照本發(fā)明的方法的可選方面,文本編輯事件包括話音命令。
      [0010]的確,可以通過按鈕點擊、按鍵、鼠標點擊、屏幕觸摸或通過使用其它外圍設備來鍵入文本編輯事件。然而替換地,可以通過話音命令在被轉換成文本的所聽寫的詞匯之間輸入文本編輯事件。當語音識別引擎識別這樣的話音命令時,將話音命令排隊到音頻隊列中,然而即刻顯示由話音命令導致的改變。音頻隊列中在話音命令之前記錄的所有語音一被轉換成所顯示的文本,就處理話音命令并向語音識別引擎通知由話音命令導致的改變。在處理話音命令期間,停止語音識別。
      [0011 ]根據(jù)依照本發(fā)明的方法的進一步可選的方面,文本編輯事件包括以下中的一個或多個:
      -在所述文本中的導航指令;
      -針對所述文本的一部分的選擇和編輯指令;
      -針對所述文本的部分的選擇和格式化指令;
      -針對所述文本的部分的選擇和刪除指令;
      -針對來自下拉列表的字段值的選擇指令;
      -用于將預定義的文本部分插入到所述文本中的指令;以及 -針對已經(jīng)被選擇的所述文本的部分的取消選擇指令。
      [0012]除了如由權利要求1限定的方法之外,本發(fā)明還涉及用于從音頻輸入生成和編輯文本的對應的系統(tǒng),該系統(tǒng)包括:
      -音頻隊列,被配置成存儲來自用戶的語音;
      -語音識別引擎,被配置成將被存儲在所述音頻隊列中的語音轉換成文本; -用戶視圖引擎和顯示器,用于向所述用戶顯示所述文本;以及 -事件處理器,用于處理由所述用戶輸入的文本編輯事件,
      其中
      -所述音頻隊列被適配成對所述文本編輯事件排隊;
      -所述用戶視圖引擎和顯示器被適配成即刻向所述用戶顯示由所述文本編輯事件導致的改變;
      -所述事件處理器被適配成當轉換在所述音頻隊列中排隊在所述文本編輯事件之前的所有語音時停止由所述語音識別引擎的語音識別;
      -所述事件處理器還被配置成在將來自所述用戶的另外的語音存儲在所述音頻隊列中的同時處理所述文本編輯事件并編輯所述文本;以及
      -所述事件處理器被適配成當已經(jīng)處理了所述文本編輯事件時恢復由所述語音識別引擎的語音識別。
      【附圖說明】
      [0013]圖1圖解在本發(fā)明的實施例中的語音識別引擎和用戶視圖引擎之間的通信流程;
      圖2是根據(jù)本發(fā)明的用于從音頻輸入生成并編輯文本的系統(tǒng)的實施例的功能性框圖;
      以及
      圖3A-3G圖解在本發(fā)明的實施例中的用戶視圖和語音配置引擎視圖的演進。
      【具體實施方式】
      [0014]本發(fā)明通過將在文本中的每個用戶編輯動作排隊到音頻隊列中使聽寫工具的用戶能夠同時地記錄語音和編輯所顯示的文本。使由在文本中的編輯動作導致的改變即刻對用戶可見,
      當前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1