国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種語音辨識(shí)系統(tǒng)的制作方法

      文檔序號(hào):2837179閱讀:441來源:國知局
      專利名稱:一種語音辨識(shí)系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及語音辨識(shí)領(lǐng)域,特別涉及一種供使用者選取指令以更正語音辨 識(shí)錯(cuò)誤,或調(diào)整語音辨識(shí)系統(tǒng)。
      背景技術(shù)
      在現(xiàn)今許多電子裝置的使用方面,語音辨識(shí)技術(shù)的發(fā)展為使用者提供更為 便捷的路徑。無論桌上型電腦、筆記型電腦、手機(jī)或個(gè)人數(shù)位助理器或其它電 子裝置,其輸入都必須依賴視覺與肢體的合作,以達(dá)到操控的目的。舉例而言, 當(dāng)使用者操控電腦時(shí),則必須借助鍵盤、鼠標(biāo)或其它附屬控制裝置的協(xié)助,以 完成指令的輸入?;蚴褂糜|碰式熒幕以簡化輸入程序,然而,由于熒幕顯示面 積有限,且仍需使用手指進(jìn)行操作,仍無法達(dá)到最大便利性。上述問題對(duì)于一 般人而言或許僅造成不便,況且對(duì)于肢體障礙,患有神經(jīng)肌肉疾病甚或失去視 覺的使用者而言,將使其難以操作上述電子裝載。而語音辨識(shí)技術(shù)正可解決此 等問題。
      語音辨識(shí)的應(yīng)用方面,使用者僅需借助音訊輸入裝置,例如麥克風(fēng),將其 語音輸入供語音辨識(shí)系統(tǒng)辨識(shí),而后輸出欲輸入語音相對(duì)應(yīng)的文字,或進(jìn)一步 根據(jù)所得的語音辨識(shí)結(jié)果直接進(jìn)行指令操作。
      在使用者辨識(shí)系統(tǒng)時(shí),如上所述,使用者必須經(jīng)由一音訊輸入裝置將聲音 輸入并錄制,然后開始辨識(shí)過程。在錄音以及辨識(shí)過程中,存有許多因素將影 響最終語音辨識(shí)的結(jié)果,例如所使用的音訊輸入裝置種類,錄音的環(huán)境、與音訊輸入裝置的距離等。因此,對(duì)于錄音以及辨識(shí)過程的監(jiān)控,實(shí)有其需要。對(duì) 此,習(xí)知技術(shù)或使用不同圖象來分別顯示錄音狀態(tài)以及辨識(shí)狀態(tài),或利用一圖 像的變化以顯示錄音或辨識(shí)狀態(tài)。然而,在顯示狀態(tài)的同時(shí),無法反映出錄音 或辨識(shí)結(jié)果品質(zhì)的優(yōu)劣或錄音過程是否成功。
      此外,對(duì)于語音辨識(shí)的結(jié)果,習(xí)知技術(shù)或有提供若干可根據(jù)辨識(shí)結(jié)果所做 的調(diào)整功能,然而大半僅需針對(duì)整體語音辨識(shí)結(jié)果所設(shè),因此往往無法僅針對(duì) 該語音辨識(shí)結(jié)果中的某部分進(jìn)行調(diào)整,以回饋進(jìn)而銳化語音辨識(shí)系統(tǒng)的功能, 使其能更符合個(gè)別使用者的需求。例如個(gè)別使用者在某些字或詞的發(fā)音有其 特殊的腔調(diào),若無法針對(duì)該等字、詞的語音辨識(shí)結(jié)果進(jìn)行回饋、調(diào)整,則勢必 將無法提供適合個(gè)別使用者的語音辨識(shí)系統(tǒng),進(jìn)而大幅減弱其實(shí)際運(yùn)用的效能。

      發(fā)明內(nèi)容
      本發(fā)明要解決的技術(shù)問題在于提供一種語音辨識(shí)系統(tǒng),本發(fā)明能有效反映 錄音或辨識(shí)結(jié)果品質(zhì)的優(yōu)劣或錄音過程是否成功,能針對(duì)該語音辨識(shí)結(jié)果中的 某部分進(jìn)行調(diào)整,以回饋進(jìn)而銳化語音辨識(shí)系統(tǒng),且更符合個(gè)別使用者的需求。
      本發(fā)明還提供一種具備錯(cuò)誤更正回饋調(diào)整機(jī)制之語音辨識(shí)系統(tǒng), 以提供使用者可有效的更正語音辨識(shí)錯(cuò)誤,或可回饋調(diào)整語音辨識(shí)系 統(tǒng)。
      本發(fā)明的技術(shù)方案通過以下方式實(shí)現(xiàn) 一種語音辨識(shí)系統(tǒng),包括至少一語 音辨識(shí)引擎以及一顯示裝置,且于該顯示裝置上設(shè)有訊號(hào)指示界面,是用波 形代表使用者輸入的語音訊號(hào),并顯示錄音狀態(tài)、語音辨識(shí)進(jìn)行中狀態(tài)以及語 音辨識(shí)完成狀態(tài);文字輸出界面,用于顯示語音辨識(shí)的文字結(jié)果,且該文字結(jié) 果包括至少一個(gè)詞單元。在本發(fā)明所提供的系統(tǒng)中,所述訊號(hào)指示界面上所顯示的錄音狀態(tài)、語音 辨識(shí)進(jìn)行中狀態(tài)以及語音辨識(shí)完成狀態(tài)的波形分別以不同顏色顯示。
      在本發(fā)明所提供的系統(tǒng)中,所述文字輸出界面上語音辨識(shí)的文字結(jié)果的每 一個(gè)詞單元,是分別以不同顏色代表每一個(gè)詞單元的語音辨識(shí)品質(zhì)。
      在本發(fā)明所提供的系統(tǒng)中,所述每一個(gè)詞單元是以綠色、黃色或紅色顯示 其中綠色表示有良好的語音辨識(shí)品質(zhì);黃色代表警告有不良的語音辨識(shí)品質(zhì); 紅色代表具有很差的語音辨識(shí)品質(zhì),需要嚴(yán)格檢視并更正之。
      在本發(fā)明所提供的系統(tǒng)中,所述每一個(gè)詞單元是與回饋調(diào)整選項(xiàng)組相連接;
      該選項(xiàng)組包含至少一個(gè)回饋調(diào)整選項(xiàng),供使用者選取以更正語音辨識(shí)的錯(cuò)誤, 或回饋調(diào)整語音辨識(shí)系統(tǒng)。
      在本發(fā)明所提供的系統(tǒng)中,所述與該顯示裝置上的一鼠標(biāo)光標(biāo)移動(dòng)至欲回 饋調(diào)整之詞單元上,或經(jīng)由觸控筆或鼠標(biāo)按壓點(diǎn)擊,而將該回饋調(diào)整選項(xiàng)組顯 示于該顯示裝置上。
      在本發(fā)明所提供的系統(tǒng)中,所述與該詞單元相連接的回饋調(diào)整選項(xiàng)組所包 含的回饋調(diào)整選項(xiàng)是"列出下一筆候選詞"、"依據(jù)語音相似度優(yōu)先列出語音辨 識(shí)候選詞"、"依據(jù)詞相連優(yōu)先列出候選詞"、"列出全部近似辨識(shí)結(jié)果"、"改為 手寫輸入"、"改為鍵盤輸入"或以上任意組合。
      在本發(fā)明所提供的系統(tǒng)中,所述訊號(hào)指示界面上語音辨識(shí)完成狀態(tài)的波形 還包括至少一個(gè)波形單元,每一波形單元是與文字輸出界面所顯示語音辨識(shí)結(jié) 果的一個(gè)詞單元相對(duì)應(yīng),且彼此是以相互對(duì)齊的方式排列,并以相同的顏色來
      表示該詞單元的語音辨識(shí)品質(zhì)。
      在本發(fā)明所提供的系統(tǒng)中,所述訊號(hào)指示界面上的波形單元是與回饋調(diào)整
      選項(xiàng)組相連接;該選項(xiàng)組包含至少一個(gè)回饋調(diào)整選項(xiàng),供使用者重聽錄音,更正錄音,更正語音辨識(shí)的錯(cuò)誤,或回饋調(diào)整語音辨識(shí)系統(tǒng)。
      在本發(fā)明所提供的系統(tǒng)中,所述使用者是通過將顯示在該顯示裝置上之一 的鼠標(biāo)光標(biāo)移動(dòng)至欲回饋調(diào)整之波形單元上,或經(jīng)由觸控筆或鼠標(biāo)按壓點(diǎn)擊, 而將該回饋調(diào)整選項(xiàng)組顯示于該顯示裝置上。
      在本發(fā)明所提供的系統(tǒng)中,所述回饋調(diào)整選項(xiàng)組所包含的回饋調(diào)整選項(xiàng)包 括"播放"、"重錄"、"納入訓(xùn)練"、"改為手寫輸入"、"改為鍵盤輸入"或以 上任意組合。
      在本發(fā)明所提供的系統(tǒng)中,所述系統(tǒng)是具有顯示裝置,或可連接其他顯示 裝置,或在遙控器上具有顯示裝置的桌上型電腦、筆記型電腦、家用多媒體系 統(tǒng)、電視、DVD、影音系統(tǒng)、手機(jī)或個(gè)人數(shù)位助理器。
      在本發(fā)明所提供的系統(tǒng)中,所述詞單元是詞,次詞或是片語。
      本發(fā)明相對(duì)與現(xiàn)有技術(shù)具有以下優(yōu)點(diǎn)
      1、 通過本發(fā)明所提供的利用波形代表使用者語音訊號(hào)的語音辨識(shí)系統(tǒng),使 用者可即時(shí)判斷錄音過程是否成功以及所輸入語音訊號(hào)的品質(zhì)。
      2、 通過本發(fā)明所提供的變化波形顏色的語音辨識(shí)系統(tǒng),使用者得以便利地 監(jiān)控語音處理的速度以及語音辨識(shí)結(jié)果的品質(zhì)。
      3、 通過本發(fā)明所提供的一種語音辨識(shí)系統(tǒng),使用者得以詞為單元針對(duì)所輸 入的語音訊號(hào)以及語音辨識(shí)結(jié)果的文字進(jìn)行錯(cuò)誤更正或系統(tǒng)的回饋調(diào)整,從而 便利的完成文字輸入工作,或持續(xù)改善該語音辨識(shí)系統(tǒng)的效能。


      圖l是本發(fā)明語音辨識(shí)系統(tǒng)的示意圖2是本發(fā)明語音辨識(shí)系統(tǒng)第一實(shí)施例的示意圖; 圖3是本發(fā)明語音辨識(shí)系統(tǒng)第一實(shí)施例的另一示意圖;圖4是本發(fā)明語音辨識(shí)系統(tǒng)第一實(shí)施例的另一示意圖; 圖5是本發(fā)明語音辨識(shí)系統(tǒng)第一實(shí)施例的使用狀態(tài)圖; 圖6是本發(fā)明語音辨識(shí)系統(tǒng)第一實(shí)施例的另一使用狀態(tài)圖。
      具體實(shí)施例方式
      下面結(jié)合實(shí)施例及附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)的描述。 實(shí)施例
      如圖1所示,本發(fā)明語音辨識(shí)系統(tǒng)包括至少一語音辨識(shí)引擎10以及一顯示
      裝置20,且于該顯示裝置20上設(shè)有訊號(hào)指示界面30以及文字輸出界面40。其 中,該訊號(hào)指示界面30是用波形32代表使用者輸入的語音訊號(hào),并顯示錄音 狀態(tài)以及語音辨識(shí)狀態(tài)。而該文字輸出界面40,則是用于顯示語音辨識(shí)結(jié)果的 文字42,而該文字結(jié)果包括至少一個(gè)詞單元。顯示于訊號(hào)指示界面30上的波形 32是用于顯示使用者輸入的語音訊號(hào),而顯示于文字輸出界面40上的文字42 則為上述語音訊號(hào)辨識(shí)后所得的結(jié)果。
      此外,本發(fā)明語音辨識(shí)系統(tǒng)的顯示裝置20可以是桌上型電腦、筆記型電腦、 家用多媒體系統(tǒng)、電視、DVD、影音系統(tǒng)、手機(jī)或個(gè)人數(shù)位助理器的顯示熒 幕,或遙控器上的顯示熒幕。
      如圖2所示,在錄音過程時(shí),使用者經(jīng)由一音訊輸入裝置(未顯示于圖中, 例如一麥克風(fēng))輸入語音于語音辨識(shí)系統(tǒng)內(nèi),其輸入的語音訊號(hào)將以波形32顯 示于訊號(hào)指示界面30上。波形使用具有兩個(gè)優(yōu)勢其一,使用者在錄音過程可 通過觀察波形的變化而獲知是否已成功地將其語音訊號(hào)輸入。在錄音過程可能 由于某些原因使得使用者的語音訊號(hào)實(shí)際上并未順利輸入,例如語音訊號(hào)輸入 裝置未啟動(dòng),語音訊號(hào)輸入裝置與設(shè)有語音辨識(shí)系統(tǒng)的電子裝置接觸不良等原 因。此時(shí),使用者可通過觀察波形的變化,而作出即時(shí)反映,以避免時(shí)間的不必要浪費(fèi)。其二,根據(jù)波形的形狀,使用者可即時(shí)大略判別語音訊號(hào)的輸入品 質(zhì),從而作出適當(dāng)?shù)恼{(diào)整。舉例而言,環(huán)境雜訊的干擾,所使用語音輸入裝置 的靈敏度甚或使用者使用語音輸入裝置的方式等都可能影響輸入語音訊號(hào)的品 質(zhì),若能于錄音階段即掌握并排除某些潛在影響語音訊號(hào)輸入品質(zhì)的因素,而 能輸入較佳的語音訊號(hào),其對(duì)于之后的語音辨識(shí)過程將有不可忽視的幫助。
      如上所述,本發(fā)明的該訊號(hào)指示界面30是通過波形32顯示錄音狀態(tài)以及 語音辨識(shí)狀態(tài);其中,語音辨識(shí)狀態(tài)更包括語音辨識(shí)進(jìn)行中狀態(tài)以及語音辨識(shí)
      完成狀態(tài)。此外,代表錄音狀態(tài)、語音辨識(shí)進(jìn)行中狀態(tài)以及語音辨識(shí)完成狀態(tài) 的波形是分別以不同顏色表示,從而便于使用者從視覺上即可分辨當(dāng)下的處理 狀態(tài)、語音辨識(shí)品質(zhì)或語音辨識(shí)的速度。
      當(dāng)使用者所輸入的語音訊號(hào)正在進(jìn)行辨識(shí)中時(shí),上述在訊號(hào)指示界面30中 的訊號(hào)波形32,將改以不同顏色顯示出已經(jīng)處理的訊號(hào)波形,以標(biāo)示出語音辨 識(shí)進(jìn)程。換言之,在開始時(shí),使用者輸入的語音訊號(hào)以錄音狀態(tài)的顏色顯示; 語音辨識(shí)程序開始后,處理過的語音訊號(hào)就改以語音辨識(shí)進(jìn)行中狀態(tài)的顏色顯 示;等到全部輸入的語音辨識(shí)完成之后,就改以語音辨識(shí)完成狀態(tài)的顏色顯示; 某些詞單元是良好辨識(shí)品質(zhì)的顏色,某些詞單元是不良辨識(shí)品質(zhì)的顏色,以及 某些詞單元是很差辨識(shí)品質(zhì)的顏色。
      如圖3所示,其中實(shí)線波形321是已完成語音辨識(shí)過程,而虛線的波形322 則尚未完成語音辨識(shí)過程。當(dāng)語音辨識(shí)完成之后,所有波形將全部改為新顏色, 顯示語音辨識(shí)已經(jīng)處理完成。
      當(dāng)使用者將語音訊號(hào)輸入且所輸入的語音訊號(hào)完成辨識(shí)后,辨識(shí)結(jié)果的最 佳后選詞單元420將逐一顯示于上述的文字輸出界面40上。如圖4所示,使用 者所輸入的語音訊號(hào)以波形32顯示,其中該波形32可進(jìn)一歩區(qū)分為至少一個(gè)波形單元320,每一波形單元320是相對(duì)應(yīng)于辨識(shí)結(jié)果中一詞單元420,兩者的 對(duì)應(yīng)關(guān)系將調(diào)整到上下位置相互對(duì)齊的方式相對(duì)應(yīng)。在本實(shí)施例中,每一波形 單元320是相對(duì)應(yīng)于一辨識(shí)結(jié)果的詞單元420。由第4圖可知,使用者輸入"今 日天氣如何"的語音訊號(hào),其所顯示的文字結(jié)果即為"今日天氣如何";而對(duì)應(yīng) 于波形單元320的輸入語音訊號(hào),即可能為辨識(shí)結(jié)果中"今日"的詞單元420。 兩者位置上下相互對(duì)齊,且以相同顏色代表其辨識(shí)品質(zhì)。
      該語音辨識(shí)系統(tǒng)作為語音理解用時(shí),訊號(hào)指示界面30仍舊,如圖4所示, 而文字輸出界面40則會(huì)輸出語音理解的結(jié)果;并且,文字輸出界面40還是可 以包含語音辨識(shí)結(jié)果文字,或是先將其隱藏起來,等使用者選擇要顯示之后才 顯示出來。
      如圖4所示,語音辨識(shí)完成之后,其訊號(hào)和文字顯示是"今日"、"天氣"、 "如何"等以詞單元為單位的對(duì)齊段落,其中每個(gè)詞單元都以一種顏色顯示, 以代表該詞單元的語音辨識(shí)結(jié)果的品質(zhì)。在本實(shí)施例中,每一個(gè)詞單元是以綠 色、黃色或紅色顯示其中綠色表示該文字具有良好的語音辨識(shí)品質(zhì);黃色代 表警告該文字有不良的語音辨識(shí)品質(zhì);紅色代表該文字具有很差的語音辨識(shí)品 質(zhì),最好需要嚴(yán)格檢視并更正的語音辨識(shí)結(jié)果。由此,可便于使用者直接從視 覺上即可分辨出各詞單元的語音辨識(shí)結(jié)果品種的優(yōu)劣,以方便進(jìn)行適當(dāng)?shù)腻e(cuò)誤 更正和回饋調(diào)整系統(tǒng)的處理。
      此外,上述每一個(gè)波形單元320是與回饋調(diào)整選項(xiàng)組相連接;該選項(xiàng)組包 含至少一個(gè)選項(xiàng),供使用者重聽錄音,更正錄音,更正語音辨識(shí)的錯(cuò)誤,或回 饋調(diào)整語音辨識(shí)系統(tǒng)。如圖5所示,每個(gè)波形單元320是與第一回饋調(diào)整選項(xiàng) 組50相連接,該第一回饋調(diào)整選項(xiàng)組50包括至少一個(gè)回饋調(diào)整選項(xiàng)52;在本 實(shí)施例中,該第一回饋調(diào)整選項(xiàng)組50是包括"播放"、"重錄"、"納入訓(xùn)練"、"改為手寫輸入"、"改為鍵盤輸入"等回饋調(diào)整選項(xiàng)52。當(dāng)語音辨識(shí)完成后,使用
      者可通過將顯示于該顯示裝置20上的一鼠標(biāo)光標(biāo)22移動(dòng)至所欲回饋調(diào)整的波 形單元320上,自動(dòng)或經(jīng)由鼠標(biāo)或觸控筆點(diǎn)擊,則可將與該波形單元320相連 接的第一回饋調(diào)整選項(xiàng)組50顯示于該顯示裝置20上。由此,使用者需要選取 所需的回饋調(diào)整選項(xiàng)52,以更正語音辨識(shí)結(jié)果,或回饋調(diào)整語音辨識(shí)系統(tǒng)。
      當(dāng)使用者發(fā)現(xiàn)波形有異,即可選取"播放"選項(xiàng)52以播放該語音音訊,確 定是否有雜訊干擾;或于語音辨識(shí)的文字結(jié)果具有相當(dāng)程度的偏差時(shí),則可借 助該"播放"選項(xiàng)52重聽之前輸入的語音訊號(hào),進(jìn)而找出原因所在,例如發(fā)音 的偏差。若確有問題,即可選取"重錄"選項(xiàng)52以重新輸入語音訊號(hào)。若其語 音辨識(shí)的文字輸出結(jié)果的偏差是起因于本身的發(fā)音習(xí)慣問題,則可選取"納入 訓(xùn)練"選項(xiàng)52,由此銳化調(diào)整語音便士系統(tǒng)以符合該使用者的需求。在該語音辨 識(shí)系統(tǒng)調(diào)整到能夠清楚辨識(shí)出該詞之前,使用者可以決定改變輸入模式,例如 選取"改為手寫輸入"或『改為鍵盤輸入",通過將語音輸入模式切換到手寫或 鍵盤輸入模式,以完成輸入的目的。
      上述文字顯示結(jié)果中的每個(gè)詞單元420也與回饋調(diào)整選項(xiàng)組相連接;該選 項(xiàng)組包含至少一個(gè)回饋調(diào)整選項(xiàng)組相連接,供使用者選取,以更正語音辨識(shí)的 錯(cuò)誤,或回饋調(diào)整語音辨識(shí)系統(tǒng)。如圖6所示,其中每個(gè)詞420是與第二回饋 調(diào)整選項(xiàng)組60相連接,該第二回饋調(diào)整選項(xiàng)組60包括至少一個(gè)回饋調(diào)整選項(xiàng) 62。在本實(shí)施例中,該第二選項(xiàng)組60是包括"列出下一筆語音辨識(shí)候選詞"、"依 語音相似度優(yōu)先列出語音辨識(shí)候選詞"、"依詞相連性優(yōu)先列出候選詞"、"列出 全部候選詞"、"改為手寫輸入"以及"改為鍵盤輸入"等回饋調(diào)整選項(xiàng)62。在語 音辨識(shí)完成后,使用者可通過將該鼠標(biāo)光標(biāo)22移動(dòng)至所欲回饋調(diào)整的詞單元420 上,自動(dòng)或經(jīng)由鼠標(biāo)或觸控筆點(diǎn)擊,則可將與該詞單元420相連接的第二回饋調(diào)整選項(xiàng)組60顯示在該顯示裝置20上。由此,使用者可通過選取所需的回饋
      調(diào)整選項(xiàng)62,而對(duì)語音辨識(shí)結(jié)果進(jìn)行回饋調(diào)整。
      由于發(fā)音問題,根據(jù)使用者所輸入的語音訊號(hào)所獲得的語音辨識(shí)文字結(jié)果
      可能大相徑庭。如圖6所示,使用者所朗讀的語音為『我要吃飯",隨著發(fā)音習(xí)
      慣不同,辨識(shí)所得的結(jié)果也可能隨之不同。而根據(jù)使用者所輸入的語音訊號(hào), 本發(fā)明的視覺回饋系統(tǒng)是根據(jù)使用者相對(duì)于該輸入的語音訊號(hào)的復(fù)數(shù)個(gè)語音辨
      識(shí)近似結(jié)果,供其選取。而近似結(jié)果則可經(jīng)由選取上述第二回饋調(diào)整選項(xiàng)組60
      的不同回饋條這個(gè)內(nèi)選項(xiàng)62來決定。例如通過選取"下一筆候選詞"的選項(xiàng)
      62,使用者可獲得下一筆候選詞;通過選取『語音相似度的優(yōu)先"的選項(xiàng)62,使 用者可獲得語音上最為近似的結(jié)果;通過選取"詞相連性優(yōu)先"的選項(xiàng)62,使用 者可獲得根據(jù)前后詞的相連關(guān)系找出最為可能的候選詞;或通過選取"列出全 部候選詞"的選項(xiàng)62,使用者可列出所有的語音辨識(shí)候選詞?;蛘?,使用者也可 以在此處選用其他的輸入模式,例如選取"改為手寫輸入"或"改為鍵盤輸入", 通過將語音輸入模式切換至手寫或鍵盤輸入模式,以完成輸入的目的。
      上述實(shí)施例為本發(fā)明較佳的實(shí)施方式,但本發(fā)明的實(shí)施方式并不受所述實(shí) 施例的限制,其他的任何未背離本發(fā)明的精神實(shí)質(zhì)與原理下所作的改變、修飾、 替代、組合、簡化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護(hù)范圍之內(nèi)。
      權(quán)利要求
      1、一種語音辨識(shí)系統(tǒng),包括至少一語音辨識(shí)引擎以及一顯示裝置,且于該顯示裝置上設(shè)有訊號(hào)指示界面,是用波形代表使用者輸入的語音訊號(hào),并顯示錄音狀態(tài)、語音辨識(shí)進(jìn)行中狀態(tài)以及語音辨識(shí)完成狀態(tài);文字輸出界面,用于顯示語音辨識(shí)的文字結(jié)果,且該文字結(jié)果包括至少一個(gè)詞單元。
      2、 如權(quán)利要求1所述的語音辨識(shí)系統(tǒng),其特征在于,所述訊號(hào)指示界面 上所顯示的錄音狀態(tài)、語音辨識(shí)進(jìn)行中狀態(tài)以及語音辨識(shí)完成狀態(tài)的波形分別 以不同顏色顯示。
      3、 如權(quán)利要求l所述的語音辨識(shí)系統(tǒng),其特征在于,所述文字輸出界面 上語音辨識(shí)的文字結(jié)果的每一個(gè)詞單元,是分別以不同顏色代表每一個(gè)詞單元 的語音辨識(shí)品質(zhì)。
      4、 如權(quán)利要求3所述的語音辨識(shí)系統(tǒng),其特征在于,所述每一個(gè)詞單元 是以綠色、黃色或紅色顯示其中綠色表示有良好的語音辨識(shí)品質(zhì);黃色代表 警告有不良的語音辨識(shí)品質(zhì);紅色代表具有很差的語音辨識(shí)品質(zhì),需要嚴(yán)格檢 視并更正之。
      5、 如權(quán)利要求3所述的語音辨識(shí)系統(tǒng),其特征在于,所述每一個(gè)詞單元 是與回饋調(diào)整選項(xiàng)組相連接;該選項(xiàng)組包含至少一個(gè)回饋調(diào)整選項(xiàng),供使用者 選取以更正語音辨識(shí)的錯(cuò)誤,或回饋調(diào)整語音辨識(shí)系統(tǒng)。
      6、 如權(quán)利要求5所述的語音辨識(shí)系統(tǒng),其特征在于,所述使用者是通過 將顯示與該顯示裝置上的一鼠標(biāo)光標(biāo)移動(dòng)至欲回饋調(diào)整之詞單元上,或經(jīng)由觸控筆或鼠標(biāo)按壓點(diǎn)擊,而將該回饋調(diào)整選項(xiàng)組顯示于該顯示裝置上。
      7、 如權(quán)利要求5所述的語音辨識(shí)系統(tǒng),其特征在于,所述與該詞單元相連接的回饋調(diào)整選項(xiàng)組所包含的回饋調(diào)整選項(xiàng)是"列出下一筆候選詞"、"依據(jù) 語音相似度優(yōu)先列出語音辨識(shí)候選詞"、"依據(jù)詞相連優(yōu)先列出候選詞"、"列出全部近似辨識(shí)結(jié)果"、"改為手寫輸入"、"改為鍵盤輸入"或以上任意組合。
      8、 如權(quán)利要求3或權(quán)利要求4任一項(xiàng)所述的語音辨識(shí)系統(tǒng),其特征在于, 所述訊號(hào)指示界面上語音辨識(shí)完成狀態(tài)的波形還包括至少一個(gè)波形單元,每一 波形單元是與文字輸出界面所顯示語音辨識(shí)結(jié)果的一個(gè)詞單元相對(duì)應(yīng),且彼此 是以相互對(duì)齊的方式排列,并以相同的顏色來表示該詞單元的語音辨識(shí)品質(zhì)。
      9、 如權(quán)利要求8所述的語音辨識(shí)系統(tǒng),其特征在于,所述訊號(hào)指示界面 上的波形單元是與回饋調(diào)整選項(xiàng)組相連接;該選項(xiàng)組包含至少一個(gè)回饋調(diào)整選 項(xiàng),供使用者重聽錄音,更正錄音,更正語音辨識(shí)的錯(cuò)誤,或回饋調(diào)整語音辨 識(shí)系統(tǒng)。
      10、如權(quán)利要求9所述的語音辨識(shí)系統(tǒng),其特征在于,所述使用者是通 過將顯示在該顯示裝置上之一的鼠標(biāo)光標(biāo)移動(dòng)至欲回饋調(diào)整之波形單元上,或 經(jīng)由觸控筆或鼠標(biāo)按壓點(diǎn)擊,而將該回饋調(diào)整選項(xiàng)組顯示于該顯示裝置上。
      11、如權(quán)利要求9所述的語音辨識(shí)系統(tǒng),其特征在于,所述回饋l周整選項(xiàng) 組所包含的回饋調(diào)整選項(xiàng)包括"播放"、"重錄"、"納入訓(xùn)練"、"改為手寫輸入"、 "改為鍵盤輸入"或以上任意組合。
      12、如權(quán)利要求1所述的語音辨識(shí)系統(tǒng),其特征在于,所述系統(tǒng)是具有 顯示裝置,或可連接其他顯示裝置,或在遙控器上具有顯示裝置的桌上型電腦、 筆記型電腦、家用多媒體系統(tǒng)、電視、DVD、影音系統(tǒng)、手機(jī)或個(gè)人數(shù)位助 理器。
      13、如權(quán)利要求1所述的語音辨識(shí)系統(tǒng),其特征在于,所述詞單元是詞, 次詞或是片語。
      全文摘要
      一種語音辨識(shí)系統(tǒng),包括至少一語音辨識(shí)引擎以及一顯示裝置,且于該顯示裝置上設(shè)有一訊號(hào)指示界面以及一文字輸出界面。其中,該訊號(hào)指示界面是借助波形以顯示一錄音狀態(tài)、一語音辨識(shí)進(jìn)行中狀態(tài)、或一完成語音辨識(shí)的狀態(tài)。而該文字輸出界面,用于顯示語音辨識(shí)的文字結(jié)果。其中,于訊號(hào)指示界面上每個(gè)波形單元以及于文字輸出界面上每一個(gè)詞單元?jiǎng)t分別與一組回饋調(diào)整選項(xiàng)組相連接,供使用者選取指令,用以修正錯(cuò)誤的辨識(shí)結(jié)果以及調(diào)整語音辨識(shí)系統(tǒng)。本發(fā)明適用于桌上型計(jì)算機(jī)、筆記型計(jì)算機(jī)、家用多媒體系統(tǒng)、電視、DVD、影音系統(tǒng)、手機(jī)或個(gè)人數(shù)字助理等有圖形顯示接口的電子裝置之語音辨識(shí)系統(tǒng)。
      文檔編號(hào)G10L15/00GK101452700SQ200710077498
      公開日2009年6月10日 申請(qǐng)日期2007年11月30日 優(yōu)先權(quán)日2007年11月30日
      發(fā)明者王瑞璋 申請(qǐng)人:王瑞璋;王中平
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1