專利名稱:漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,適用于在使用語(yǔ)音識(shí)別技術(shù)的小鍵盤設(shè)備(如手機(jī)、固定電話、個(gè)人數(shù)字助理(Personal DigitalAssistant,簡(jiǎn)稱PDA)、電子辭典)和各類嵌入式系統(tǒng)中,進(jìn)行有限的詞或短語(yǔ)識(shí)別時(shí)管理語(yǔ)音識(shí)別詞庫(kù)詞條的方法。
語(yǔ)音識(shí)別作為IT領(lǐng)域深層次發(fā)展的戰(zhàn)略性和基礎(chǔ)性技術(shù),可以應(yīng)用于任何需要人機(jī)交互的產(chǎn)品,它將改變?nèi)祟愂褂面I盤、鼠標(biāo)等使用計(jì)算機(jī)的方式,特別是滿足各種移動(dòng)終端如手機(jī)、掌上電腦因其移動(dòng)性、手持化而產(chǎn)生的新的交互方式的需求。各種形態(tài)的嵌入式的計(jì)算設(shè)備也將借助這一技術(shù)改變單一界面,以更豐富友好和人性化的方式出現(xiàn)。
但是,在手機(jī)、掌上電腦等小鍵盤設(shè)備上使用語(yǔ)音識(shí)別技術(shù),進(jìn)行命令詞識(shí)別和短語(yǔ)識(shí)別(可以統(tǒng)稱為孤立詞識(shí)別)時(shí),常常會(huì)遇到添加新詞條或修改舊詞條等問題。這就關(guān)系到進(jìn)行系統(tǒng)內(nèi)部的語(yǔ)音識(shí)別詞庫(kù)管理。如何方便快捷全面的實(shí)現(xiàn)語(yǔ)音識(shí)別詞庫(kù)管理,是語(yǔ)音識(shí)別應(yīng)用上的一個(gè)難題。
現(xiàn)有技術(shù)對(duì)于上述問題的解決方案是當(dāng)用戶需要加入新詞時(shí),需要反復(fù)錄入該詞的語(yǔ)音樣本并進(jìn)行訓(xùn)練達(dá)到對(duì)新詞條的添加和舊詞條的修改。但是這種方法最終只能實(shí)現(xiàn)對(duì)特定人識(shí)別,不具有廣泛應(yīng)用的價(jià)值。另外一些系統(tǒng)對(duì)數(shù)據(jù)的更新,則需要得到產(chǎn)品生產(chǎn)方的幫助,才能使加入的詞可以支持非特定人識(shí)別。
在語(yǔ)音識(shí)別系統(tǒng)中,用戶輸入語(yǔ)音希望得到與之對(duì)應(yīng)的正確文字;但是,參看表1,由于識(shí)別方面的原因,實(shí)際得到的識(shí)別結(jié)果通常不是最終的文字,而是與識(shí)別系統(tǒng)中模型相對(duì)應(yīng)的一些識(shí)別基元或基元編號(hào)信息,例如音節(jié),半音節(jié)(聲/韻母),音素和語(yǔ)音狀態(tài)等。
表1
因此,如果將所述的識(shí)別基元和要識(shí)別的文字相對(duì)應(yīng),則在識(shí)別過程中僅需查找到該識(shí)別基元對(duì)應(yīng)的文字,再經(jīng)過確認(rèn)就可以快捷地通過語(yǔ)音方式輸入漢字。為此需要建立具有上述識(shí)別基元和對(duì)應(yīng)文字的漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)詞表,并對(duì)該表進(jìn)行語(yǔ)句添加、修改、刪除等處理。
本發(fā)明的另一目的在于提供一種修改漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)詞表的方法,特別適用于在具有精簡(jiǎn)鍵盤設(shè)備上利用語(yǔ)音輸入的方式,管理語(yǔ)音識(shí)別詞庫(kù)中的詞條,提高在具有精簡(jiǎn)鍵盤設(shè)備上加入、讀取、修改、刪除漢字的效率。
本發(fā)明的目的是這樣實(shí)現(xiàn)的一種漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法;將詞語(yǔ)與由識(shí)別基元組成的該詞語(yǔ)的識(shí)別基元序列進(jìn)行匹配,然后添加到語(yǔ)音識(shí)別詞庫(kù)之中。
上述的方法具體可以為有拼音指導(dǎo)的處理過程,具體的步驟為步驟10通過語(yǔ)音或者拼音方法輸入一個(gè)詞語(yǔ)及其發(fā)音;步驟11記錄該詞語(yǔ)和它所對(duì)應(yīng)的拼音;步驟12如果詞語(yǔ)輸入沒有結(jié)束,則執(zhí)行步驟10;步驟13將該詞語(yǔ)的拼音序列轉(zhuǎn)換為識(shí)別基元序列;步驟14如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則結(jié)束;步驟15將該詞語(yǔ)的字序列和識(shí)別基元序列一同添加到語(yǔ)音識(shí)別詞庫(kù)之中。
上述的方法具體也可以為無拼音指導(dǎo)的處理過程,具體的步驟為步驟20輸入一個(gè)詞語(yǔ)的漢字序列;步驟21如果輸入者不對(duì)該詞語(yǔ)進(jìn)行識(shí)別確認(rèn),則執(zhí)行步驟23;步驟22根據(jù)輸入者的選擇對(duì)所有可能的識(shí)別基元序列進(jìn)行處理,結(jié)束;步驟23自動(dòng)逐個(gè)處理所有可能的識(shí)別基元序列,結(jié)束。
上述的步驟22具體為步驟220找到該詞語(yǔ)字序列所有可能的識(shí)別基元序列,并將第一個(gè)識(shí)別基元序列作為當(dāng)前處理的識(shí)別基元序列;步驟221如果輸入者不選擇保留,則執(zhí)行步驟224;步驟222如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則執(zhí)行步驟224;步驟223將該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列添加到語(yǔ)音識(shí)別詞庫(kù)之中;步驟224如果沒有需要處理的識(shí)別基元序列,則結(jié)束;步驟225將下一個(gè)要處理的識(shí)別基元序列作為當(dāng)前處理的識(shí)別基元序列,執(zhí)行步驟221。
該圖所述的步驟22具體為步驟220’找到該詞語(yǔ)字序列所有可能的拼音序列,并將第一個(gè)拼音序列作為當(dāng)前處理的拼音序列;步驟221’如果輸入者不選擇保留,則執(zhí)行步驟225’;步驟222’將該詞語(yǔ)的拼音序列轉(zhuǎn)換為識(shí)別基元序列;步驟223’如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則執(zhí)行步驟225’;步驟224’將該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列添加到語(yǔ)音識(shí)別詞庫(kù)之中;步驟225’如果沒有需要處理的拼音序列,則結(jié)束;步驟226’將下一個(gè)要處理的拼音序列作為當(dāng)前處理的拼音序列,執(zhí)行步驟221’。
上述的步驟23具體為步驟230列出該詞語(yǔ)字序列的所有可能的識(shí)別基元序列,并將第一個(gè)識(shí)別基元序列作為當(dāng)前要處理的識(shí)別基元序列;步驟231如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則執(zhí)行步驟233;步驟232將該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列添加到語(yǔ)音識(shí)別詞庫(kù)之中;步驟233如果沒有需要處理的識(shí)別基元序列,則結(jié)束;步驟234將下一個(gè)要處理的識(shí)別基元序列作為當(dāng)前處理的識(shí)別基元序列,執(zhí)行步驟231。
修改詞庫(kù)中已有詞語(yǔ)的具體過程為步驟30從語(yǔ)音識(shí)別詞庫(kù)中找到要修改的詞語(yǔ);步驟31顯示該詞語(yǔ)的字序列;步驟32顯示該詞語(yǔ)字序列對(duì)應(yīng)的識(shí)別基元序列;步驟33如果不修改該詞語(yǔ),則結(jié)束;步驟34修改該詞語(yǔ)的字序列并修改對(duì)應(yīng)的識(shí)別基元序列;步驟35將修改后的該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列重新存入語(yǔ)音識(shí)別詞庫(kù)。
修改詞庫(kù)中已有詞語(yǔ)的過程也可以為步驟30’從語(yǔ)音識(shí)別詞庫(kù)中找到要修改的詞語(yǔ);步驟31’顯示該詞語(yǔ)的字序列;步驟32’將識(shí)別基元序列轉(zhuǎn)換為拼音序列;步驟33’顯示該詞語(yǔ)對(duì)應(yīng)的拼音序列;步驟34’如果不修改該詞語(yǔ),則結(jié)束;步驟35’修改該詞語(yǔ)的字序列和對(duì)應(yīng)的拼音序列;步驟36’將該拼音序列轉(zhuǎn)換為識(shí)別基元序列;步驟37’將修改后的該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列重新存入語(yǔ)音識(shí)別詞庫(kù)。
刪除語(yǔ)音識(shí)別詞庫(kù)中已有詞語(yǔ)的過程具體為步驟40從語(yǔ)音識(shí)別詞庫(kù)中找到要?jiǎng)h除的詞語(yǔ);步驟41顯示該詞語(yǔ)的字序列;步驟42顯示該詞語(yǔ)字序列對(duì)應(yīng)的識(shí)別基元序列;步驟43如果不刪除該詞語(yǔ),則結(jié)束;步驟44從語(yǔ)音識(shí)別詞庫(kù)中刪除該詞語(yǔ)的字序列及識(shí)別基元序列。
刪除語(yǔ)音識(shí)別詞庫(kù)中已有詞語(yǔ)的過程也可以為步驟40’從語(yǔ)音識(shí)別詞庫(kù)中找到要?jiǎng)h除的詞語(yǔ);步驟41’顯示該詞語(yǔ)的字序列;步驟42’將該詞語(yǔ)對(duì)應(yīng)的識(shí)別基元序列轉(zhuǎn)換為拼音序列;步驟43’顯示該詞語(yǔ)字序列對(duì)應(yīng)的拼音序列;步驟43’如果不刪除該詞語(yǔ),則結(jié)束;步驟44’從語(yǔ)音識(shí)別詞庫(kù)中刪除該詞語(yǔ)的字序列及對(duì)應(yīng)的拼音序列。
上述的拼音序列轉(zhuǎn)換為識(shí)別基元序列的具體步驟為
步驟101將拼音序列中的第一個(gè)拼音作為當(dāng)前轉(zhuǎn)換的拼音,并清空識(shí)別基元序列;步驟102在拼音到識(shí)別基元詞典中查找該拼音;步驟103如果沒有找到該拼音,進(jìn)行錯(cuò)誤處理,執(zhí)行步驟105;步驟104將該拼音對(duì)應(yīng)的識(shí)別基元添加到識(shí)別基元序列之中;步驟105如果所有的拼音均轉(zhuǎn)換完畢,將拼音序列中下一個(gè)拼音作為當(dāng)前轉(zhuǎn)換的拼音,執(zhí)行步驟102;步驟106結(jié)束。
上述的識(shí)別基元序列轉(zhuǎn)換為拼音序列的步驟具體為步驟201將識(shí)別基元序列中的第一個(gè)識(shí)別基元作為當(dāng)前轉(zhuǎn)換的識(shí)別基元,并清空拼音序列;步驟202在識(shí)別基元到拼音詞典中查找該識(shí)別基元;步驟203如果沒有找到該識(shí)別基元,進(jìn)行錯(cuò)誤處理,執(zhí)行步驟205;步驟204將該識(shí)別基元對(duì)應(yīng)的拼音添加到拼音序列之中;步驟205如果所有的識(shí)別基元均轉(zhuǎn)換完畢,將識(shí)別基元序列中下一個(gè)識(shí)別基元作為當(dāng)前轉(zhuǎn)換的識(shí)別基元,執(zhí)行步驟202;步驟206結(jié)束。
上述的識(shí)別基元序列包括一個(gè)或一個(gè)以上的識(shí)別基元,并且,所述的識(shí)別基元也可以為識(shí)別基元編號(hào),該識(shí)別基元與識(shí)別基元編號(hào)一一對(duì)應(yīng)。
本發(fā)明的方法克服了現(xiàn)有技術(shù)的不足,即在加入新詞條時(shí),只需一次輸入,無需訓(xùn)練,就可以方便地使用,適用于非特定人識(shí)別,具有語(yǔ)音的快捷、人性化的優(yōu)點(diǎn);同時(shí),本發(fā)明特別適用于在具有精簡(jiǎn)鍵盤設(shè)備上利用語(yǔ)音輸入的方式,管理語(yǔ)音識(shí)別詞庫(kù)中的詞條,提高了在具有精簡(jiǎn)鍵盤設(shè)備上加入、讀取、修改、刪除漢字的效率。
圖2為本發(fā)明中另一種實(shí)現(xiàn)詞語(yǔ)添加的流程圖。
圖3為本發(fā)明中又一種實(shí)現(xiàn)詞語(yǔ)添加的流程圖。
圖4為本發(fā)明中一種詞語(yǔ)修改的流程圖。
圖5為本發(fā)明中另一種詞語(yǔ)修改的流程圖。
圖6為本發(fā)明中一種詞語(yǔ)刪除的流程圖。
圖7為本發(fā)明中另一種詞語(yǔ)刪除的流程圖。
圖8為本發(fā)明中拼音序列轉(zhuǎn)換為識(shí)別基元序列的流程圖。
圖9為本發(fā)明中識(shí)別基元序列轉(zhuǎn)換為拼音序列的流程圖。
參見
圖1,其為本發(fā)明中一種實(shí)現(xiàn)詞語(yǔ)添加的具體方法流程圖。具體的步驟包括步驟10通過語(yǔ)音或者拼音方法輸入一個(gè)詞語(yǔ)及其發(fā)音;步驟11記錄該詞語(yǔ)和它所對(duì)應(yīng)的拼音;步驟12如果詞語(yǔ)輸入沒有結(jié)束,則執(zhí)行步驟10;步驟13將該詞語(yǔ)的拼音序列轉(zhuǎn)換為識(shí)別基元序列;步驟14如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則結(jié)束;步驟15將該詞語(yǔ)的字序列和識(shí)別基元序列一同添加到語(yǔ)音識(shí)別詞庫(kù)之中。
參見圖2,其為本發(fā)明中另一種實(shí)現(xiàn)詞語(yǔ)添加的具體方法流程圖。具體的步驟包括步驟20’輸入一個(gè)詞語(yǔ)的漢字序列;步驟21’如果輸入者不對(duì)該詞語(yǔ)進(jìn)行識(shí)別確認(rèn),則執(zhí)行步驟28’;
步驟22’找到該詞語(yǔ)字序列所有可能的識(shí)別基元序列,并將第一個(gè)識(shí)別基元序列作為當(dāng)前處理的識(shí)別基元序列;步驟23’如果輸入者不選擇保留,則執(zhí)行步驟26’;步驟24’如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則執(zhí)行步驟26’;步驟25’將該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列添加到語(yǔ)音識(shí)別詞庫(kù)之中;步驟26’如果沒有需要處理的拼音序列,則結(jié)束;步驟27’將下一個(gè)要處理的拼音序列作為當(dāng)前處理的拼音序列,執(zhí)行步驟23’;步驟28’列出該詞語(yǔ)字序列的所有可能的識(shí)別基元序列,并將第一個(gè)識(shí)別基元序列作為當(dāng)前要處理的識(shí)別基元序列;步驟29’如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則執(zhí)行步驟2B’;步驟2A’將該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列添加到語(yǔ)音識(shí)別詞庫(kù)之中;步驟2B’如果沒有需要處理的識(shí)別基元序列,則結(jié)束;步驟2C’將下一個(gè)要處理的識(shí)別基元序列作為當(dāng)前處理的拼音序列,執(zhí)行步驟29’。
參見圖3,其為本發(fā)明中又一種實(shí)現(xiàn)詞語(yǔ)添加的具體方法流程圖。具體的步驟包括步驟20”輸入一個(gè)詞語(yǔ)的漢字序列;步驟21”如果輸入者不對(duì)該詞語(yǔ)進(jìn)行識(shí)別確認(rèn),則執(zhí)行步驟29”;步驟22”找到該詞語(yǔ)字序列所有可能的拼音序列,并將第一個(gè)拼音序列作為當(dāng)前處理的拼音序列;步驟23”如果輸入者不選擇保留,則執(zhí)行步驟27”;步驟24”將該拼音序列轉(zhuǎn)換為識(shí)別基元序列;步驟25”如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則執(zhí)行步驟27”;
步驟26”將該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列添加到語(yǔ)音識(shí)別詞庫(kù)之中;步驟27”如果沒有需要處理的拼音序列,則結(jié)束;步驟28”將下一個(gè)要處理的拼音序列作為當(dāng)前處理的拼音序列,執(zhí)行步驟23”;步驟29”列出該詞語(yǔ)字序列的所有可能的識(shí)別基元序列,并將第一個(gè)識(shí)別基元序列作為當(dāng)前要處理的識(shí)別基元序列;步驟2A”如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則執(zhí)行步驟2C”;步驟2B”將該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列添加到語(yǔ)音識(shí)別詞庫(kù)之中;步驟2C”如果沒有需要處理的識(shí)別基元序列,則結(jié)束;步驟2D”將下一個(gè)要處理的識(shí)別基元序列作為當(dāng)前處理的拼音序列,執(zhí)行步驟2A”。
當(dāng)修改語(yǔ)音識(shí)別詞庫(kù)中已有詞語(yǔ)時(shí),可以通過如下的流程實(shí)現(xiàn)參見圖4修改詞庫(kù)中已有詞語(yǔ)的一個(gè)具體的過程為步驟31A取詞表的詞條總數(shù);步驟32A取第一詞條;步驟33A顯示其漢字序列;步驟34A顯示識(shí)別基元序列;步驟35A如果不修改該條目,執(zhí)行步驟39A;步驟36A修改詞的字序列;步驟37A修改詞的識(shí)別基元序列;步驟38A重新存入語(yǔ)音識(shí)別詞庫(kù);步驟39A如果當(dāng)前詞條序號(hào)達(dá)到總詞條數(shù),結(jié)束;步驟3AA取下一詞條,執(zhí)行步驟33A。
參見圖5修改詞庫(kù)中已有詞語(yǔ)的另一種較佳的過程也可以為步驟31B取詞表的詞條總數(shù);步驟32B取第一詞條;步驟33B顯示其漢字序列;步驟34B將識(shí)別基元序列轉(zhuǎn)換為拼音序列;步驟35B顯示拼音序列;步驟36B如果不修改該條目,執(zhí)行步驟3BB;步驟37B修改詞的字序列;步驟38B修改詞的拼音序列;步驟39B將拼音序列轉(zhuǎn)換為識(shí)別基元序列;步驟3AB重新存入語(yǔ)音識(shí)別詞庫(kù);步驟3BB如果當(dāng)前詞條序號(hào)達(dá)到總詞條數(shù),結(jié)束;步驟3CB取下一詞條,執(zhí)行步驟33。
參見圖6,當(dāng)刪除語(yǔ)音識(shí)別詞庫(kù)中已有詞語(yǔ)時(shí),可以通過如下的流程實(shí)現(xiàn)步驟41A取詞表的詞條總數(shù);步驟42A取第一詞條;步驟43A顯示其漢字序列;步驟44A顯示識(shí)別基元拼音序列;步驟45A如果不刪除該條目,執(zhí)行步驟47A;步驟46A刪除該詞條;步驟47A如果當(dāng)前詞條序號(hào)達(dá)到總詞條數(shù),結(jié)束;步驟48A取下一詞條,執(zhí)行步驟43A。
參見圖7,當(dāng)刪除語(yǔ)音識(shí)別詞庫(kù)中已有詞語(yǔ)時(shí),可以通過如下另一較佳的流程實(shí)現(xiàn)步驟41B取詞表的詞條總數(shù);
步驟42B取第一詞條;步驟43B顯示其漢字序列;步驟44B將識(shí)別基元序列轉(zhuǎn)換為拼音序列;步驟45B顯示拼音序列;步驟46B如果不刪除該條目,執(zhí)行步驟48B;步驟47B刪除該詞條;步驟48B如果當(dāng)前詞條序號(hào)達(dá)到總詞條數(shù),結(jié)束;步驟49B取下一詞條,執(zhí)行步驟43B。
本發(fā)明中,詞語(yǔ)在語(yǔ)音識(shí)別詞庫(kù)中的存儲(chǔ)格式可以有兩種;一種是以詞的字序列和詞的識(shí)別基元序列格式存儲(chǔ)(參看表1)。另一種是以詞語(yǔ)的字序列和序列格式存儲(chǔ)(參看表2),其中詞的識(shí)別基元編號(hào)與識(shí)別基元對(duì)應(yīng)關(guān)系可以通過查表得到(參看表3)。
表2
參見表1、3、4中的識(shí)別基元都是以半音節(jié)(聲/韻母)為例。通過檢索拼音和識(shí)別基元的對(duì)應(yīng)表,就可以實(shí)現(xiàn)詞語(yǔ)到識(shí)別基元的轉(zhuǎn)換。例如“我們”一詞的拼音是“wo men”,其中拼音“wo”的識(shí)別基元是“-uu-uo-”,拼音“men”的識(shí)別基元是“-m-en”,因此以第一種格式存儲(chǔ),“我們”的識(shí)別基元序列是“-uu-uo-m-en-”。以第二種格式存儲(chǔ),由識(shí)別基元與其編號(hào)對(duì)應(yīng)表,得到“我們”的識(shí)別基元編號(hào)序列是“-6-3-2-8-”。
表3
表4 拼音與識(shí)別基元的對(duì)照表
參見圖8,上述的各實(shí)施例中,將詞語(yǔ)的拼音序列轉(zhuǎn)換為識(shí)別基元序列的具體方法是步驟101’初始化,取拼音序列中的音節(jié)數(shù),清空目標(biāo)識(shí)別基元序列;步驟102’取拼音序列中的第一個(gè)拼音;步驟103’取拼音到基本識(shí)別基元辭典中的條目總數(shù);步驟104’取拼音到基本識(shí)別基元辭典中第一個(gè)條目的拼音;步驟105’目標(biāo)拼音與該條目中的拼音如果相同,將該條目中的識(shí)別基元加入目標(biāo)識(shí)別基元序列;執(zhí)行步驟108’;步驟106’如果當(dāng)前條目序號(hào)沒有達(dá)到拼音到基本識(shí)別基元辭典條目數(shù),則取拼音到基本識(shí)別基元辭典中下一個(gè)條目的拼音,執(zhí)行步驟105’;
步驟107’出錯(cuò)處理;步驟108’如果當(dāng)前拼音序號(hào)達(dá)到拼音序列總數(shù),則輸出目標(biāo)識(shí)別基元序列;結(jié)束;步驟109’取拼音序列中下一個(gè)拼音,執(zhí)行步驟103’。
在上述的各實(shí)施例中將識(shí)別基元序列轉(zhuǎn)換為拼音序列的方法,具體的實(shí)現(xiàn)參見圖9步驟201’取拼音序列中的音節(jié)數(shù),清空目標(biāo)識(shí)別基元序列步驟202’取拼音序列中的第一個(gè)拼音步驟203’取拼音到基本識(shí)別基元辭典中的條目總數(shù)步驟204’取拼音到基本識(shí)別基元辭典中第一個(gè)條目的拼音步驟205’如果該目標(biāo)拼音與該條目中的拼音相同,將該條目中的識(shí)別基元加入目標(biāo)識(shí)別基元序列,執(zhí)行步驟208’;步驟206’如果當(dāng)前條目序號(hào)未達(dá)到拼音到基本識(shí)別基元辭典條目數(shù),取辭典中下一個(gè)條目的拼音,執(zhí)行步驟205’;步驟207’出錯(cuò)處理;步驟208’如果當(dāng)前拼音序號(hào)未達(dá)到拼音序列總數(shù),取拼音序列中下一個(gè)拼音,執(zhí)行步驟203’;步驟209’輸出目標(biāo)識(shí)別基元序列,結(jié)束。
最后應(yīng)說明的是以上實(shí)施例僅用以說明本發(fā)明而并非限制本發(fā)明所描述的技術(shù)方案;因此,盡管本說明書參照上述的各個(gè)實(shí)施例對(duì)本發(fā)明已進(jìn)行了詳細(xì)的說明,但是,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,仍然可以對(duì)本發(fā)明進(jìn)行修改或者等同地替換;而一切不脫離本發(fā)明的精神和范圍的技術(shù)方案及其改進(jìn),其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
權(quán)利要求
1.一種漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于將詞語(yǔ)與由識(shí)別基元組成的該詞語(yǔ)的識(shí)別基元序列進(jìn)行匹配,然后添加到語(yǔ)音識(shí)別詞庫(kù)之中。
2.根據(jù)權(quán)利要求1所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于上述的方法為有拼音指導(dǎo)的處理過程,具體的步驟如下步驟10通過語(yǔ)音或者拼音方法輸入一個(gè)詞語(yǔ)及其發(fā)音;步驟11記錄該詞語(yǔ)和它所對(duì)應(yīng)的拼音;步驟12如果詞語(yǔ)輸入沒有結(jié)束,則執(zhí)行步驟10;步驟13將該詞語(yǔ)的拼音序列轉(zhuǎn)換為識(shí)別基元序列;步驟14如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則結(jié)束;步驟15將該詞語(yǔ)的字序列和識(shí)別基元序列一同添加到語(yǔ)音識(shí)別詞庫(kù)之中。
3.根據(jù)權(quán)利要求1所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于上述的方法也可以為無拼音指導(dǎo)的處理過程,具體的步驟如下步驟20輸入一個(gè)詞語(yǔ)的漢字序列;步驟21如果輸入者不對(duì)該詞語(yǔ)進(jìn)行識(shí)別確認(rèn),則執(zhí)行步驟23;步驟22根據(jù)輸入者的選擇對(duì)所有可能的識(shí)別基元序列進(jìn)行處理,結(jié)束;步驟23自動(dòng)逐個(gè)處理所有可能的識(shí)別基元序列,結(jié)束。
4.根據(jù)權(quán)利要求3所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于所述的步驟22具體為步驟220找到該詞語(yǔ)字序列所有可能的識(shí)別基元序列,并將第一個(gè)識(shí)別基元序列作為當(dāng)前處理的識(shí)別基元序列;步驟221如果輸入者不選擇保留,則執(zhí)行步驟224;步驟222如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則執(zhí)行步驟224;步驟223將該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列添加到語(yǔ)音識(shí)別詞庫(kù)之中;步驟224如果沒有需要處理的識(shí)別基元序列,則結(jié)束;步驟225將下一個(gè)要處理的識(shí)別基元序列作為當(dāng)前處理的識(shí)別基元序列,執(zhí)行步驟221。
5.根據(jù)權(quán)利要求3所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于所述的步驟22具體為步驟220’找到該詞語(yǔ)字序列所有可能的拼音序列,并將第一個(gè)拼音序列作為當(dāng)前處理的拼音序列;步驟221’如果輸入者不選擇保留,則執(zhí)行步驟225’;步驟222’將該詞語(yǔ)的拼音序列轉(zhuǎn)換為識(shí)別基元序列;步驟223’如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則執(zhí)行步驟225’;步驟224’將該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列添加到語(yǔ)音識(shí)別詞庫(kù)之中;步驟225’如果沒有需要處理的拼音序列,則結(jié)束;步驟226’將下一個(gè)要處理的拼音序列作為當(dāng)前處理的拼音序列,執(zhí)行步驟221’。
6.根據(jù)權(quán)利要求3所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于所述的步驟23具體為步驟230列出該詞語(yǔ)字序列的所有可能的識(shí)別基元序列,并將第一個(gè)識(shí)別基元序列作為當(dāng)前要處理的識(shí)別基元序列;步驟231如果語(yǔ)音識(shí)別詞庫(kù)中已經(jīng)存在該詞語(yǔ),則執(zhí)行步驟233;步驟232將該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列添加到語(yǔ)音識(shí)別詞庫(kù)之中;步驟233如果沒有需要處理的識(shí)別基元序列,則結(jié)束;步驟234將下一個(gè)要處理的識(shí)別基元序列作為當(dāng)前處理的識(shí)別基元序列,執(zhí)行步驟231。
7.根據(jù)權(quán)利要求1所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于該方法還進(jìn)一步包括修改詞庫(kù)中已有詞語(yǔ)的方法,該修改過程具體為步驟30從語(yǔ)音識(shí)別詞庫(kù)中找到要修改的詞語(yǔ);步驟31顯示該詞語(yǔ)的字序列;步驟32顯示該詞語(yǔ)字序列對(duì)應(yīng)的識(shí)別基元序列;步驟33如果不修改該詞語(yǔ),則結(jié)束;步驟34修改該詞語(yǔ)的字序列并修改對(duì)應(yīng)的識(shí)別基元序列;步驟35將修改后的該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列重新存入語(yǔ)音識(shí)別詞庫(kù)。
8.根據(jù)權(quán)利要求1所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于該方法還進(jìn)一步包括修改詞庫(kù)中已有詞語(yǔ)的方法,該修改過程具體為步驟30’從語(yǔ)音識(shí)別詞庫(kù)中找到要修改的詞語(yǔ);步驟31’顯示該詞語(yǔ)的字序列;步驟32’將識(shí)別基元序列轉(zhuǎn)換為拼音序列;步驟33’顯示該詞語(yǔ)對(duì)應(yīng)的拼音序列;步驟34’如果不修改該詞語(yǔ),則結(jié)束;步驟35’修改該詞語(yǔ)的字序列和對(duì)應(yīng)的拼音序列;步驟36’將該拼音序列轉(zhuǎn)換為識(shí)別基元序列;步驟37’將修改后的該詞語(yǔ)的字序列和相應(yīng)的識(shí)別基元序列重新存入語(yǔ)音識(shí)別詞庫(kù)。
9.根據(jù)權(quán)利要求1所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于該方法還進(jìn)一步包括刪除語(yǔ)音識(shí)別詞庫(kù)中已有詞語(yǔ)的方法,該刪除的過程具體為步驟40從語(yǔ)音識(shí)別詞庫(kù)中找到要?jiǎng)h除的詞語(yǔ);步驟41顯示該詞語(yǔ)的字序列;步驟42顯示該詞語(yǔ)字序列對(duì)應(yīng)的識(shí)別基元序列;步驟43如果不刪除該詞語(yǔ),則結(jié)束;步驟44從語(yǔ)音識(shí)別詞庫(kù)中刪除該詞語(yǔ)的字序列及識(shí)別基元序列。
10.根據(jù)權(quán)利要求1所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于該方法還進(jìn)一步包括刪除語(yǔ)音識(shí)別詞庫(kù)中已有詞語(yǔ)的方法,該刪除的過程具體為步驟40’從語(yǔ)音識(shí)別詞庫(kù)中找到要?jiǎng)h除的詞語(yǔ);步驟41’顯示該詞語(yǔ)的字序列;步驟42’將該詞語(yǔ)對(duì)應(yīng)的識(shí)別基元序列轉(zhuǎn)換為拼音序列;步驟43’顯示該詞語(yǔ)字序列對(duì)應(yīng)的拼音序列;步驟44’如果不刪除該詞語(yǔ),則結(jié)束;步驟45’從語(yǔ)音識(shí)別詞庫(kù)中刪除該詞語(yǔ)的字序列及對(duì)應(yīng)的拼音序列。
11.根據(jù)權(quán)利要求2或5或8所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于所述的拼音序列轉(zhuǎn)換為識(shí)別基元序列的具體方法為步驟101將拼音序列中的第一個(gè)拼音作為當(dāng)前轉(zhuǎn)換的拼音,并清空識(shí)別基元序列;步驟102在拼音到識(shí)別基元詞典中查找該拼音;步驟103如果沒有找到該拼音,進(jìn)行錯(cuò)誤處理,執(zhí)行步驟105;步驟104將該拼音對(duì)應(yīng)的識(shí)別基元添加到識(shí)別基元序列之中;步驟105如果所有的拼音均轉(zhuǎn)換完畢,將拼音序列中下一個(gè)拼音作為當(dāng)前轉(zhuǎn)換的拼音,執(zhí)行步驟102;步驟106結(jié)束。
12.根據(jù)權(quán)利要求8或10所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于所述的識(shí)別基元序列轉(zhuǎn)換為拼音序列,具體為步驟201將識(shí)別基元序列中的第一個(gè)識(shí)別基元作為當(dāng)前轉(zhuǎn)換的識(shí)別基元,并清空拼音序列;步驟202在識(shí)別基元到拼音詞典中查找該識(shí)別基元;步驟203如果沒有找到該識(shí)別基元,進(jìn)行錯(cuò)誤處理,執(zhí)行步驟205;步驟204將該識(shí)別基元對(duì)應(yīng)的拼音添加到拼音序列之中;步驟205如果所有的識(shí)別基元均轉(zhuǎn)換完畢,將識(shí)別基元序列中下一個(gè)識(shí)別基元作為當(dāng)前轉(zhuǎn)換的識(shí)別基元,執(zhí)行步驟202;步驟206結(jié)束。
13.根據(jù)權(quán)利要求1-10所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于所述的識(shí)別基元序列包括一個(gè)或一個(gè)以上的識(shí)別基元。
14.根據(jù)權(quán)利要求13所述的漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,其特征在于所述的識(shí)別基元可以為識(shí)別基元編號(hào),該識(shí)別基元與識(shí)別基元編號(hào)一一對(duì)應(yīng)。
全文摘要
一種漢語(yǔ)語(yǔ)音識(shí)別詞庫(kù)的處理方法,它將詞語(yǔ)與由識(shí)別基元組成的該詞語(yǔ)的識(shí)別基元序列進(jìn)行匹配后添加到語(yǔ)音識(shí)別詞庫(kù)之中;并且具體包括有拼音指導(dǎo)下的添加和沒有拼音指導(dǎo)下的添加方法;此外,還進(jìn)一步包括修改、刪除該語(yǔ)音識(shí)別詞庫(kù)中詞語(yǔ)的方法;本發(fā)明克服了現(xiàn)有技術(shù)的不足,即在加入新詞條時(shí),只需一次輸入,無需訓(xùn)練,就可以方便地使用,適用于非特定人識(shí)別,具有語(yǔ)音的快捷、人性化的優(yōu)點(diǎn);同時(shí),本發(fā)明還適用于在具有精簡(jiǎn)鍵盤設(shè)備上利用語(yǔ)音輸入的方式,有利于管理語(yǔ)音識(shí)別詞庫(kù)中的詞條,提高了在具有精簡(jiǎn)鍵盤設(shè)備上加入、讀取、修改、刪除漢字的效率。
文檔編號(hào)G06F9/00GK1399191SQ0213060
公開日2003年2月26日 申請(qǐng)日期2002年9月9日 優(yōu)先權(quán)日2002年9月9日
發(fā)明者張向東, 李全在, 侯震, 柴云霞 申請(qǐng)人:北京南山高科技有限公司