專利名稱::一種手寫字符預(yù)測(cè)識(shí)別的方法和裝置的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明主要涉及手寫字符識(shí)別,具體來(lái)說(shuō),涉及一種利用預(yù)測(cè)的方式來(lái)進(jìn)行手寫字符識(shí)別的方法和裝置。
背景技術(shù):
:近年來(lái),利用數(shù)字化設(shè)備進(jìn)行手寫字符的輸入已經(jīng)十分普及,這些數(shù)字化設(shè)備包括具有觸摸屏或手寫板/手寫筆等輸入裝置的計(jì)算機(jī)、Tablet-PC、PDA、手機(jī)等。與之相應(yīng)的手寫識(shí)別技術(shù)是手寫輸入方法的核心技術(shù)之一。手寫輸入方法給人們輸入字符帶來(lái)了極大的方便,尤其是對(duì)于那些無(wú)法配備大鍵盤的設(shè)備,如手機(jī)、Tablet-PC、PDA,更是如此。另一方面,手寫輸入方法也給那些不太會(huì)或不方便使用鍵盤進(jìn)行文字輸入的人們,如老人、不會(huì)使用傳統(tǒng)輸入法的人,提供了一種快捷而有效的文字輸入方式。手寫輸入字符的過(guò)程一般是:用戶在數(shù)字化設(shè)備上手寫需要輸入的字符,然后手寫字符識(shí)別器對(duì)用戶所寫的字符筆跡點(diǎn)進(jìn)行識(shí)別,最后將識(shí)別結(jié)果,即多個(gè)候選字符顯示在屏幕上供用戶選擇。目前,移動(dòng)終端(如手機(jī))的手寫輸入方法主要有兩種風(fēng)格的輸入一是單字輸入,即只有一個(gè)手寫區(qū)域,每次寫入一個(gè)字符;二是多字輸入,即有多個(gè)手寫區(qū)域或以全屏的方式輸入,每次可連續(xù)輸入多個(gè)字符。采用單字輸入的方式一般基于以下兩個(gè)原因一是手機(jī)的顯示屏較小,顯示和輸入(觸摸屏輸入)面積較??;二是從鍵盤以手指方式輸入,難于定位多個(gè)輸入?yún)^(qū)域。采用單字輸入方式時(shí),系統(tǒng)必須通過(guò)設(shè)定一個(gè)抬筆等待時(shí)間來(lái)確定用戶是否已完成一個(gè)字符的輸入,等待時(shí)間通常為0.5秒左右。即,從用戶寫完一個(gè)筆劃開(kāi)始計(jì)時(shí),如果等待時(shí)間到而用戶沒(méi)有再寫另一個(gè)筆劃,則認(rèn)為用戶己完成當(dāng)前字符的輸入,系統(tǒng)開(kāi)始識(shí)別。顯然,這個(gè)等待時(shí)間大大影響了手寫輸入的速度。另外,不管是采用單字輸入方式還是多字輸入方式,系統(tǒng)一般都是在用戶寫完所有筆劃時(shí),才開(kāi)始進(jìn)行識(shí)別,這也在一定程度影響了用戶的輸入速度,尤其是在一個(gè)字符筆劃較多的情況下。為了解決以上問(wèn)題,有人提出了一種每寫入一個(gè)筆劃就進(jìn)行一次識(shí)別的方法,這種方法從一定程度上解決了等待時(shí)間的問(wèn)題。然而,每寫入一個(gè)筆劃就進(jìn)行一次識(shí)別的方法也存在以下的缺點(diǎn)要求系統(tǒng)有足夠快的識(shí)別速度,即,在用戶寫入下一個(gè)筆劃前必須完成前面已寫入筆劃的識(shí)別;往往還需要用戶把一個(gè)字符的所有筆劃都輸入完成后,方能得到正確的識(shí)別結(jié)果。
發(fā)明內(nèi)容在下面的描述中將部分地闡明本發(fā)明另外的方面和/或優(yōu)點(diǎn),通過(guò)描述,其會(huì)變得更加清楚,或者通過(guò)實(shí)施本發(fā)明可以了解。根據(jù)本發(fā)明的一方面,提供了一種利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的方法,所述方法包括以下步驟a)用戶手寫輸入字符的一定數(shù)量的筆跡點(diǎn);b)手寫字符識(shí)別器對(duì)所述字符已寫入的筆跡點(diǎn)進(jìn)行識(shí)別,得到相應(yīng)的一組識(shí)別結(jié)果;c)利用得到的識(shí)別結(jié)果信息以及包括在信息預(yù)測(cè)字符庫(kù)中的多個(gè)預(yù)測(cè)字符集進(jìn)行預(yù)測(cè)識(shí)別,得到一組候選字符,并顯示所述候選字符,其中,所述信息預(yù)測(cè)字符庫(kù)包含用戶所用語(yǔ)言中的部分或全部字符,并且所述多個(gè)預(yù)測(cè)字符集中的每一個(gè)預(yù)測(cè)字符集包含與上下文關(guān)系信息、字符結(jié)構(gòu)信息和字符部分筆跡點(diǎn)的識(shí)別結(jié)果信息之一對(duì)應(yīng)關(guān)聯(lián)的多個(gè)預(yù)測(cè)字符。根據(jù)本發(fā)明的另一方面,提供了種利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的裝置,所述裝置包括手寫輸入模塊,接收用戶輸入的手寫字符,并產(chǎn)生手寫字符的筆跡點(diǎn);手寫字符識(shí)別器,對(duì)從手寫輸入模塊產(chǎn)生的手寫字符的筆跡點(diǎn)進(jìn)行識(shí)別,得到相應(yīng)的一組識(shí)別結(jié)果,并輸出每個(gè)識(shí)別結(jié)果的相似值,所述相似值表示識(shí)別結(jié)果與手寫字符的筆跡點(diǎn)的相似程度;信息預(yù)測(cè)字符庫(kù),包含用戶所用語(yǔ)言中部分或全部字符,并且包括多個(gè)預(yù)測(cè)字符集,所述多個(gè)預(yù)測(cè)字符集中的每個(gè)預(yù)測(cè)字符集包含與上下文關(guān)系信息、字符結(jié)構(gòu)信息和字符部分筆跡點(diǎn)的識(shí)別結(jié)果信息之一對(duì)應(yīng)關(guān)聯(lián)的多個(gè)預(yù)測(cè)字符;預(yù)測(cè)識(shí)別模塊,利用識(shí)別結(jié)果信息以及所述多個(gè)預(yù)測(cè)字符集進(jìn)行預(yù)測(cè)識(shí)別,得到一組候選字符;顯示模塊,顯示預(yù)測(cè)識(shí)別模塊識(shí)別得到的候選字符。通過(guò)下面結(jié)合附圖對(duì)實(shí)施例進(jìn)行的描述,本發(fā)明的這些和/或其他方面和優(yōu)點(diǎn)將會(huì)變得清楚和更易于理解,其中圖1是根據(jù)本發(fā)明實(shí)施例的利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的裝置的框圖;圖2是根據(jù)本發(fā)明實(shí)施例的預(yù)測(cè)字符庫(kù)的示意圖;圖3是根據(jù)本發(fā)明實(shí)施例的利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的方法的流程圖;圖4是可應(yīng)用根據(jù)本發(fā)明的手寫字符識(shí)別的方法和裝置的物理平臺(tái)的示例。具體實(shí)施方式現(xiàn)在對(duì)本發(fā)明實(shí)施例進(jìn)行詳細(xì)的描述,其示例表示在附圖中,其中,相同的標(biāo)號(hào)始終表示相同部件。下面通過(guò)參照附圖對(duì)實(shí)施例進(jìn)行描述以解釋本發(fā)明。圖1是根據(jù)本發(fā)明實(shí)施例的利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的裝置的框圖。參考圖1,根據(jù)本發(fā)明實(shí)施例的利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的裝置包括手寫輸入模塊100、手寫字符識(shí)別器110、預(yù)測(cè)字符庫(kù)120、預(yù)測(cè)識(shí)別模塊130和顯示模塊140。手寫輸入模塊100指的是用于收集用戶手寫字符筆跡等相關(guān)信息的裝置,例如電子寫字板/手寫筆、觸摸屏等。當(dāng)用戶用手寫筆或手指在這些裝置上手寫輸入字符時(shí),手寫輸入模塊IOO就能得到所輸入的字符的筆跡點(diǎn)坐標(biāo)、壓力和時(shí)間參數(shù)等信息,其中,所述字符的筆跡點(diǎn)可以是通過(guò)一定時(shí)間間隔采樣獲得的筆跡點(diǎn),一個(gè)或多個(gè)筆劃所包含的筆跡點(diǎn),或者事先設(shè)定點(diǎn)數(shù)的筆跡點(diǎn)。這些信息被發(fā)送到手寫字符識(shí)別器IIO來(lái)進(jìn)行處理和識(shí)別。手寫字符識(shí)別器IIO是用來(lái)識(shí)別手寫字符的裝置,它從手寫輸入模塊100接收用戶輸入的字符的筆跡點(diǎn)坐標(biāo)等信息,輸出多個(gè)識(shí)別結(jié)果候選字符。這些輸出的候選字符一般已按其與該手寫字符相似程度進(jìn)行了排序,越相似的排在越前面。手寫字符識(shí)別器110除了可以輸出識(shí)別結(jié)果候選字符外,還同時(shí)輸出每個(gè)候選字符的距離值。距離值就是表示識(shí)別結(jié)果候選字符與該手寫字符相似程度的數(shù)值——相似值。相似值越小,表示候選字符與該手寫字符越相似。例如,當(dāng)用戶在手寫輸入模塊100上手寫輸入字符"字"時(shí),手寫字符識(shí)別器110輸出的IO個(gè)可能的識(shí)別結(jié)果候選字符為"字宇享子家守孚學(xué)孛宗",同時(shí)輸出IO個(gè)對(duì)應(yīng)的相似值6324、9915、10527、10597、11008、11111、11263、11392、11421、11460。預(yù)測(cè)字符庫(kù)120是指通過(guò)利用輸入的字符的一些特定信息,來(lái)預(yù)測(cè)與該字符相關(guān)聯(lián)的字符集的字符庫(kù)。字符集包含與輸入的字符的一些特定信息相關(guān)聯(lián)的多個(gè)字符。參考圖2,預(yù)測(cè)字符庫(kù)120至少可分為聯(lián)想預(yù)測(cè)字符庫(kù)121、筆劃預(yù)測(cè)字符庫(kù)122、部首預(yù)測(cè)字符庫(kù)123和局部預(yù)測(cè)字符庫(kù)124。聯(lián)想預(yù)測(cè)字符庫(kù)121是指能夠根據(jù)用戶已經(jīng)輸入的一個(gè)字符,輸出與該符相關(guān)聯(lián)的預(yù)測(cè)字符集的字符庫(kù)。聯(lián)想預(yù)測(cè)字符庫(kù)121包含用戶所用語(yǔ)言中部分或全部字符,且每一個(gè)字符都關(guān)聯(lián)了一組與該字符具有上下文關(guān)系的字符,所述的一組字符構(gòu)成聯(lián)想預(yù)測(cè)字符集。這里使用的上下文關(guān)系包括詞語(yǔ)關(guān)系、成語(yǔ)關(guān)系、單詞/拼音文字的構(gòu)成關(guān)系、以及用戶曾經(jīng)輸入過(guò)的字符的前后相鄰關(guān)系等。聯(lián)想預(yù)測(cè)字符庫(kù)121可以利用用戶曾經(jīng)輸入過(guò)的字符的前后相鄰關(guān)系來(lái)不斷更新修正。作為示例,表1給出了一個(gè)中文聯(lián)想預(yù)測(cè)字符庫(kù)。表l中文聯(lián)想預(yù)測(cè)字符庫(kù)(按部首排序)<table>tableseeoriginaldocumentpage8</column></row><table>6二十個(gè)年月峽百國(guó)次日世角天大通位五軍分萬(wàn)代千尺更兩點(diǎn)不人姑八等7上海來(lái)去面帝下一學(xué)述升午前班山人課有車半次不看臺(tái)層馬門大發(fā)將好8下來(lái)去午面子降手人一不崗車山馬列大班文回之樓頭雨次令臺(tái)地有半水9丌的一不是了我人在有這來(lái)他中大上個(gè)國(guó)說(shuō)也子到你們?yōu)榈赖刂畷r(shí)那就10不是知能過(guò)可會(huì)得同要到敢好出了見(jiàn)再少在住用如僅斷想多愿必管成一11與其國(guó)世人此會(huì)眾日否共生自民市去的一不是了我在有這來(lái)他中大上個(gè)12丐的一不是了我人在有這來(lái)他中大上個(gè)國(guó)說(shuō)也子到你們?yōu)榈赖刂畷r(shí)那就13丑陋惡聞的一不是了我人在有這來(lái)他中大上個(gè)國(guó)說(shuō)也子到你們?yōu)榈赖刂?4專業(yè)家門制政欄利題輯心注用科程員著訪機(jī)的一不是了我人在有這來(lái)他15且慢不說(shuō)看的一是了我人在有這來(lái)他中大上個(gè)國(guó)也子到你們?yōu)榈赖刂畷r(shí)16丕的一不是了我人在有這來(lái)他中大上個(gè)國(guó)說(shuō)也子到你們?yōu)榈赖刂畷r(shí)那就17世界紀(jì)上間人俗事代面尊道交襲家故態(tài)子的一不是了我在有這來(lái)他中大18丘的一不是了我人在有這來(lái)他中大上個(gè)國(guó)說(shuō)也子到你們?yōu)榈赖刂畷r(shí)那就.,嗎!的一不是了我人在有這來(lái)他中大上個(gè)國(guó)說(shuō)也子到你們?yōu)榈赖刂畷r(shí)■<■.■■>■,由表1可以看出,每個(gè)字符都關(guān)聯(lián)了一個(gè)由幾十個(gè)(表1中為30個(gè))字符組成的聯(lián)想預(yù)測(cè)字符集。表1中序號(hào)5的字符"丈",與聯(lián)想預(yù)測(cè)字符集中的前3個(gè)字符分別組成詞語(yǔ)關(guān)系,即"丈夫"、"丈人"、"丈量",而與其余的27個(gè)字符并不組成詞語(yǔ)。這27個(gè)字符是漢字中使用頻率極高的字,用來(lái)將聯(lián)想預(yù)測(cè)字符集中字符的數(shù)量補(bǔ)足。這是因?yàn)樵贈(zèng)]有其它能跟在"丈"后面組成詞語(yǔ)的字符。表1中序號(hào)9的字符"丌",因?yàn)闆](méi)有能跟在它后面組成詞語(yǔ)的字符,所以所有關(guān)聯(lián)的字符都是使用頻率高的漢字。另外,對(duì)于在手機(jī)上的應(yīng)用,聯(lián)想預(yù)測(cè)字符庫(kù)121可以直接從T9輸入法的語(yǔ)言庫(kù)中取得。筆劃預(yù)測(cè)字符庫(kù)122是指能夠根據(jù)用戶已經(jīng)輸入的一個(gè)或多個(gè)筆劃及其先后次序,輸出與其相關(guān)聯(lián)的預(yù)測(cè)字符集的字符庫(kù)。也就是說(shuō),給定一個(gè)或多個(gè)筆劃,預(yù)測(cè)字符庫(kù)可以給出開(kāi)始筆劃與這一個(gè)或多個(gè)筆劃相同的所有字符。中文系統(tǒng)種使用的筆劃可分為橫、豎、撇、捺、折等5種。作為示例,表2給出了一個(gè)中文筆劃預(yù)測(cè)字符庫(kù)。由表2可以看出,每一組有次序的筆劃都關(guān)聯(lián)了一個(gè)由多個(gè)字符組成的預(yù)測(cè)字符集。表2<table>tableseeoriginaldocumentpage10</column></row><table>易號(hào)園具顯睡暗味......■■部首預(yù)測(cè)字符庫(kù)123是指能夠根據(jù)用戶已經(jīng)輸入的字符部首(即,字根,是字符的一部分),輸出以此部首為開(kāi)始的預(yù)測(cè)字符集的字符庫(kù)。例如,用戶輸入部首"w,則對(duì)應(yīng)的預(yù)測(cè)字符集為"藝艾節(jié)共芍芒芝蕓芽......"。作為示例,表3給出了一個(gè)中文部首預(yù)測(cè)字符庫(kù)。由表3可以看出,每一個(gè)部首都關(guān)聯(lián)了一個(gè)由多個(gè)字符組成的預(yù)測(cè)字符集。表3中文部首預(yù)測(cè)字符庫(kù)<table>tableseeoriginaldocumentpage11</column></row><table><table>tableseeoriginaldocumentpage12</column></row><table>局部預(yù)測(cè)字符庫(kù)124是指能夠根據(jù)用戶已經(jīng)輸入的字符的一部分(可能是一些筆劃,也可能是部首和筆劃的組合),輸出與這些已輸入部分相似的預(yù)測(cè)字符集的字符庫(kù)。例如,用戶手寫輸入l^,則對(duì)應(yīng)的預(yù)測(cè)字符集為"國(guó)團(tuán)同因曰困囝目閏圓"。一般地,聯(lián)想預(yù)測(cè)字符庫(kù)121、筆劃預(yù)測(cè)字符庫(kù)122和部首預(yù)測(cè)字符庫(kù)123是預(yù)先建立的,而局部預(yù)測(cè)字符庫(kù)124則是由字符識(shí)別器110根據(jù)對(duì)手寫輸入字符的識(shí)別而實(shí)時(shí)給出的。另外,本發(fā)明適用于多種語(yǔ)言字符的識(shí)別,如中文、數(shù)字、英文、日文、韓文等。對(duì)應(yīng)的預(yù)測(cè)字符庫(kù)也會(huì)有多種,如中文預(yù)測(cè)字符庫(kù)、英文預(yù)測(cè)字符庫(kù)、日文預(yù)測(cè)字符庫(kù)、韓文預(yù)測(cè)字符庫(kù)等。預(yù)測(cè)字符庫(kù)120包含用戶所用語(yǔ)言中的部分或全部字符。預(yù)測(cè)識(shí)別模塊130接收從手寫字符識(shí)別器110輸出的多個(gè)識(shí)別結(jié)果候選字符以及從預(yù)測(cè)字符庫(kù)120輸出的預(yù)測(cè)字符集,對(duì)當(dāng)前輸入的筆跡點(diǎn)進(jìn)行預(yù)測(cè)識(shí)別。具體而言,就是利用用戶已輸入的前一個(gè)字符,以及當(dāng)前輸入的部分筆跡點(diǎn),根據(jù)與當(dāng)前輸入筆跡點(diǎn)的識(shí)別結(jié)果,即筆劃、部首或局部識(shí)別結(jié)果對(duì)應(yīng)的預(yù)測(cè)字符集,預(yù)測(cè)當(dāng)前用戶所輸入的筆跡點(diǎn)可能是什么字符,并以候選結(jié)果的方式輸出。然后,預(yù)測(cè)識(shí)別模塊130輸出預(yù)測(cè)識(shí)別得到的識(shí)別結(jié)果候選字符。顯示模塊140用來(lái)顯示預(yù)測(cè)識(shí)別模塊130輸出的識(shí)別結(jié)果候選字符,以提供給用戶進(jìn)行選擇。下面將參照?qǐng)D3來(lái)描述根據(jù)本發(fā)明實(shí)施例的利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的方法。圖3是根據(jù)本發(fā)明實(shí)施例的利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的方法的流程圖。參考圖3,在步驟301,用戶在手寫輸入模塊100上手寫輸入字符的筆跡點(diǎn)。在步驟302,從上一次的識(shí)別開(kāi)始計(jì)算,如果用戶輸入的筆跡點(diǎn)達(dá)到一定的數(shù)量,則進(jìn)行步驟303,否則返回步驟301。例如,可以設(shè)定用戶每寫一個(gè)筆劃,系統(tǒng)就識(shí)別一次。在步驟303,手寫字符識(shí)別器110對(duì)用戶已輸入的部分或全部筆跡點(diǎn)進(jìn)行識(shí)別,并輸出多個(gè)識(shí)別結(jié)果候選字符以及每個(gè)候選字符對(duì)應(yīng)的相似值。在步驟304,從步驟303的識(shí)別結(jié)果中獲取當(dāng)前輸入的筆劃、部首,同時(shí)獲取當(dāng)前字符的局部識(shí)別結(jié)果(即所有已輸入筆跡點(diǎn)所對(duì)應(yīng)的識(shí)別結(jié)果)以及上一個(gè)已輸入的字符。在步驟305,從己建立的預(yù)測(cè)字符庫(kù)中取出與識(shí)別得到的筆劃、部首以及上一個(gè)已輸入字符對(duì)應(yīng)的預(yù)測(cè)字符集。在步驟306,預(yù)測(cè)識(shí)別模塊130進(jìn)行預(yù)測(cè)識(shí)別,得到當(dāng)前已輸入的筆跡點(diǎn)的優(yōu)選識(shí)別結(jié)果候選字符。預(yù)測(cè)識(shí)別的方法將在下面進(jìn)一步詳細(xì)說(shuō)明。在步驟307,顯示模塊140將當(dāng)前識(shí)別結(jié)果候選字符顯示給用戶,以便用戶進(jìn)行選擇。在步驟308,如果用戶從當(dāng)前的候選字符中找到并選擇所需的字符,則完成該字符的輸入,進(jìn)行步驟311;否則進(jìn)行步驟309。在步驟309,如果系統(tǒng)設(shè)定的抬筆等待時(shí)間到達(dá),則表明用戶已寫完當(dāng)前字符的所有筆跡,進(jìn)行步驟310;否則,表明用戶還沒(méi)有寫完當(dāng)前字符,則返回步驟301以允許用戶繼續(xù)手寫輸入字符。其中,在步驟310,系統(tǒng)可獲得當(dāng)前字符的所有完整筆跡,進(jìn)行一般的手寫識(shí)別過(guò)程。在步驟311,如果用戶還需要手寫輸入下一個(gè)字符,則返回步驟301;否則,輸入過(guò)程結(jié)束。下面具體介紹根據(jù)本發(fā)明的對(duì)筆劃和部首的識(shí)別方法以及預(yù)測(cè)識(shí)別方法。在步驟303中,對(duì)橫、豎、撇、捺、折5個(gè)筆劃的識(shí)別方法如下所述將用戶每一次落筆和抬筆之間的筆跡點(diǎn)輸入到字符識(shí)別器110進(jìn)行識(shí)別,如果首選識(shí)別結(jié)果為這5個(gè)筆劃之一并且首選識(shí)別結(jié)果對(duì)應(yīng)的相似值小于某一閾值Tl(相似值越小,表示識(shí)別結(jié)果的可信度越高),則認(rèn)為當(dāng)前輸入的筆跡點(diǎn)為首選識(shí)別結(jié)果對(duì)應(yīng)的筆劃。對(duì)部首的識(shí)別方法如下所述將用戶已輸入的所有筆跡點(diǎn)輸入到字符識(shí)別器110進(jìn)行識(shí)別,如果首選識(shí)別結(jié)果為部首之一并且首選識(shí)別結(jié)果對(duì)應(yīng)的相似值小于某一閾值T1(相似值越小,表示候選字符的可信度越高),則認(rèn)為當(dāng)前輸入的筆跡點(diǎn)為首選識(shí)別結(jié)果對(duì)應(yīng)的部首。步驟306中采用的一種優(yōu)選的預(yù)測(cè)識(shí)別方法描述如下。即,在步驟305中取出的筆劃預(yù)測(cè)字符集為A,部首預(yù)測(cè)字符集為B,聯(lián)想預(yù)測(cè)字符集為C,步驟304中的局部識(shí)別候選結(jié)果對(duì)應(yīng)的字符集為D。如果沒(méi)有識(shí)別出來(lái)筆劃,則A為空,沒(méi)有識(shí)別出來(lái)部首,則B為空,上一個(gè)字符不存在,則C為空,對(duì)當(dāng)前所有己寫入的筆跡點(diǎn)識(shí)別后,沒(méi)有識(shí)別候選結(jié)果,則D為空。同時(shí)定義有序候選集E、F、G。這樣,預(yù)測(cè)識(shí)別的方法可以描述為1.如果A和B都為空,則E為空;2.如果A非空,B為空,則E二A;3.如果A空,B非空,貝ijE二B;4.如果A和B都非空,且有交集,則E二B,且E中的排序以交集為優(yōu)先;5.如果A和B都非空,且無(wú)交集,則E二B6.如果E和C都為空,則F為空;7.如果E非空,C為空,則F二E;8.如果E空,C非空,則F二C;9.如果E和C都非空,且有交集,則F二E,且F中的排序以交集為優(yōu)先;10.如果E和C都非空,且無(wú)交集,則F二E;11.如果F和D都為空,則G為空;12.如果F非空,D為空,則G二F;13.如果F空,D非空,則G二D;14.如果F和D都非空,且有交集,則G二F,且G中的排序以交集為優(yōu)先;15.如果F和D都非空,且無(wú)交集,則G二F;16.輸出預(yù)測(cè)識(shí)別結(jié)果G。下面以用戶輸入"識(shí)別"中的"別"字為例來(lái)詳細(xì)描述識(shí)別過(guò)程。假設(shè)此前,"識(shí)"字已輸入完畢。詳細(xì)的識(shí)別步驟如下。第l步用戶在手寫輸入模塊100上手寫輸入第一筆'。第2步當(dāng)前為一個(gè)筆劃(一個(gè)落筆和抬筆),進(jìn)行步驟303。第3步手寫字符識(shí)別器110對(duì)'進(jìn)行識(shí)別,得到首選識(shí)別結(jié)果為豎"1",且相似值二3200。第4步相似值3200小于設(shè)定的閾值T1=5000,即識(shí)別結(jié)果為筆劃豎"l",局部識(shí)別結(jié)果為"|,lli卜!vwr",而局部識(shí)別結(jié)果無(wú)對(duì)應(yīng)部首。第5步從已建立的預(yù)測(cè)字符庫(kù)中取出"I"對(duì)應(yīng)的預(yù)測(cè)字符集"是中上國(guó)時(shí)里小日只見(jiàn)當(dāng)回同此些明點(diǎn)因最聽(tīng)四口內(nèi)別水……",上一個(gè)己輸入字符"識(shí)"對(duì)應(yīng)的聯(lián)想預(yù)測(cè)字符集為"別字得見(jiàn)破到分形界之……",此時(shí)局部識(shí)別結(jié)果為"|'11i卜!vwr"。第6步進(jìn)行預(yù)測(cè)識(shí)別,當(dāng)前已輸入筆跡點(diǎn)的優(yōu)選識(shí)別結(jié)果候選字符為"別是中上國(guó)時(shí)里小日只見(jiàn)當(dāng)回同此些明點(diǎn)因最聽(tīng)四口內(nèi)水……。第7步通過(guò)顯示模塊140將以上識(shí)別結(jié)果候選字符顯示給用戶以便用戶進(jìn)行選擇。第8步用戶未從候選字符中選擇,而是繼續(xù)寫第2筆%"(注:用戶已可在這一步得到正確的識(shí)別結(jié)果)。第9步手寫字符識(shí)別器110對(duì)第2筆2進(jìn)行識(shí)別,得到首選識(shí)別結(jié)果為折""",且相似值二3556,并且手寫字符識(shí)別器110對(duì)已輸入的筆跡點(diǎn)進(jìn)行識(shí)別,得到局部識(shí)別結(jié)果為"口日幾R(shí)2曰Z江區(qū)P",且首選識(shí)別結(jié)果"口"的相似值=2011。第10步首選識(shí)別結(jié)果折"^"相似值3556小于設(shè)定的閾值Tl=5000,因此第2筆的識(shí)別結(jié)果為筆劃折""",同時(shí)首選識(shí)別結(jié)果"口"的相似值2011小于設(shè)定閾值T2二5000,因此已輸入部分為部首"口"。第ll步從已建立的預(yù)測(cè)字符庫(kù)中取出前2筆為"I""對(duì)應(yīng)的預(yù)測(cè)字符集"口日是中國(guó)時(shí)目里田月曰且旦眶盱睛盯旰旱旺晴睹睦瞌眶瞄昧瞟具睞……",部首"口"對(duì)應(yīng)的預(yù)測(cè)字符集"口中號(hào)叮卟只叭史兄嘰叱嘆叼別叫……",以及上一個(gè)已輸入字符"識(shí)"對(duì)應(yīng)的聯(lián)想預(yù)測(cè)字符集"別字得見(jiàn)破到分形界之……",此時(shí)局部識(shí)別結(jié)果為"口日幾R(shí)2曰Z江區(qū)P";第12步進(jìn)行預(yù)測(cè)識(shí)別,當(dāng)前已輸入筆跡點(diǎn)的優(yōu)選識(shí)別結(jié)果候選字符為"別見(jiàn)界口中號(hào)叮卟只叭史兄嘰叱嘆叼叫……。第13步通過(guò)顯示模塊140將以上識(shí)別結(jié)果候選字符顯示給用戶以便用戶進(jìn)行選擇。第14步用戶未從候選字符中選擇,而是繼續(xù)寫第3筆^1(注用戶已可在這一步得到正確的識(shí)別結(jié)果)。第15步手寫字符識(shí)別器110對(duì)第3筆^進(jìn)行識(shí)別,識(shí)別結(jié)果無(wú)筆劃,并且手寫字符識(shí)別器iio對(duì)已輸入的筆跡點(diǎn)》進(jìn)行識(shí)別,得到局部識(shí)別結(jié)果為"別勛剮簡(jiǎn)前剁鈞勖引列",而局部識(shí)別結(jié)果無(wú)對(duì)應(yīng)部首。第16步從已建立的預(yù)測(cè)字符庫(kù)中取出前兩筆為"I,"對(duì)應(yīng)的預(yù)測(cè)字符集"口日是中國(guó)時(shí)目里田月曰且旦眶盱睛盯旰旱旺晴睹睦瞌眶瞄昧瞟具睞……",部首"口"對(duì)應(yīng)的預(yù)測(cè)字符集"口中號(hào)叮卟只叭史兄嘰叱嘆叼別叫……",以及上一個(gè)已輸入字符"識(shí)"對(duì)應(yīng)的聯(lián)想預(yù)測(cè)字符集"別字得見(jiàn)破到分形界之……",此時(shí)局部識(shí)別結(jié)果為"別勛剮簡(jiǎn)前剁鈞勖引列"。第17步進(jìn)行預(yù)測(cè)識(shí)別,當(dāng)前已輸入筆跡點(diǎn)的優(yōu)選識(shí)別結(jié)果候選字符為"別勛剮口中號(hào)叮B卜只叭史兄嘰叱嘆叼叫……。第18步通過(guò)顯示模塊140將以上識(shí)別結(jié)果候選字符顯示給用戶以便用戶進(jìn)行選擇。第19步用戶未從候選字符中選擇,而是繼續(xù)寫最后1筆^1(注用戶己可在這一步得到正確的識(shí)別結(jié)果)。第20步由于寫上一筆時(shí),識(shí)別結(jié)果中沒(méi)有筆劃和部首,所以在本步中不再識(shí)別筆劃和部首,手寫字符識(shí)別器HO僅對(duì)已輸入的筆跡點(diǎn)'^進(jìn)行識(shí)別,局部識(shí)別結(jié)果為"別剮判冽荊列剡釗削剁"。第21步從已建立的預(yù)測(cè)字符庫(kù)中取出前兩筆為"I""對(duì)應(yīng)的預(yù)測(cè)字符集"口日是中國(guó)時(shí)目里田月曰且旦眶盱睛盯旰旱旺晴睹睦瞌眶瞄昧瞟具睞……",取出部首"口"對(duì)應(yīng)的預(yù)測(cè)字符集"口中號(hào)叮卟只叭史兄嘰叱嘆叼別叫……",以及上一個(gè)已輸入字符"識(shí)"對(duì)應(yīng)的聯(lián)想預(yù)測(cè)字符集"別字得見(jiàn)破到分形界之……",此時(shí)局部識(shí)別結(jié)果"別剮判冽荊列剡釗削剁"。第22步進(jìn)行預(yù)測(cè)識(shí)別,當(dāng)前已輸入筆跡點(diǎn)的優(yōu)選識(shí)別結(jié)果候選字符為"別剮口中號(hào)叮卟只叭史兄嘰叱嘆叼叫……。第23步通過(guò)顯示模塊140將以上識(shí)別結(jié)果候選字符顯示給用戶以便用戶進(jìn)行選擇。第24步用戶未從候選字符中選擇,而是等候預(yù)定的等待時(shí)間(即系統(tǒng)設(shè)定的一個(gè)字寫完的等待時(shí)間)的到達(dá)(注用戶已可在這一步得到正確的識(shí)別結(jié)果)。第25步當(dāng)預(yù)定的等待時(shí)間過(guò)去之后,手寫字符歸.識(shí)別器110對(duì)已輸入的筆跡點(diǎn)力'"進(jìn)行一般的識(shí)別,得到識(shí)別結(jié)果為"別剮判冽荊列剡釗削剁"。第26步,用戶選擇第一個(gè)候選"別",完成此字輸入。從以上步驟也可以看到,應(yīng)用根據(jù)本發(fā)明的利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的方法,用戶可以在第8步得到所需輸入的"別"字。而根據(jù)一般的識(shí)別方法,則需要到第26步用戶方能得到所需輸入的"別"字。根據(jù)本發(fā)明的利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的方法和裝置具有很好的擴(kuò)展性和易用性,適合于Tablet-PC、PDA和手寫手機(jī)等設(shè)備使用,尤其適合于手機(jī)這種計(jì)算能力弱、存儲(chǔ)空間有限的終端。根據(jù)本發(fā)明的利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的方法和裝置可以廣泛應(yīng)用于各種能夠進(jìn)行手寫輸入的移動(dòng)終端設(shè)備,也可以應(yīng)用于有外接錄入設(shè)備的有計(jì)算能力的設(shè)備,諸如圖4中的PC系統(tǒng)400、PDA401、手機(jī)402以及平板計(jì)算機(jī)403等。通過(guò)使用根據(jù)本發(fā)明的利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的方法和裝置,當(dāng)用戶進(jìn)行手寫輸入時(shí),只要輸入一個(gè)字符的部分就能立即得到該字符的正確識(shí)別結(jié)果,從而可以進(jìn)行選擇完成該字符的輸入。因此無(wú)需等到系統(tǒng)設(shè)定的等待時(shí)間之后才開(kāi)始識(shí)別字符,從而加快了手寫輸入的速度。雖然已經(jīng)參照本發(fā)明的示例性實(shí)施例具體顯示和描述了本發(fā)明,但是本領(lǐng)域普通技術(shù)人員應(yīng)該理解,在不脫離由權(quán)利要求限定的本發(fā)明的精神和范圍的情況下,可以在形式和細(xì)節(jié)上對(duì)這些實(shí)施例進(jìn)行各種變動(dòng)。權(quán)利要求1.一種利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的方法,所述方法包括以下步驟a)用戶手寫輸入字符的一定數(shù)量的筆跡點(diǎn);b)手寫字符識(shí)別器對(duì)所述字符已寫入的筆跡點(diǎn)進(jìn)行識(shí)別,得到相應(yīng)的一組識(shí)別結(jié)果;c)利用得到的識(shí)別結(jié)果信息以及包括在信息預(yù)測(cè)字符庫(kù)中的多個(gè)預(yù)測(cè)字符集進(jìn)行預(yù)測(cè)識(shí)別,得到一組候選字符,并顯示所述候選字符,其中,所述信息預(yù)測(cè)字符庫(kù)包含用戶所用語(yǔ)言中的部分或全部字符,并且所述多個(gè)預(yù)測(cè)字符集中的每一個(gè)預(yù)測(cè)字符集包含與上下文關(guān)系信息、字符結(jié)構(gòu)信息和字符部分筆跡點(diǎn)的識(shí)別結(jié)果信息之一對(duì)應(yīng)關(guān)聯(lián)的多個(gè)預(yù)測(cè)字符。2、如權(quán)利要求1所述的手寫字符識(shí)別的方法,還包括以下步驟d)如果所述字符的輸入尚未完畢,則允許用戶繼續(xù)手寫輸入所述字符的一定數(shù)量的筆跡點(diǎn);e)如果所述字符的輸入已經(jīng)完畢,則在預(yù)定的等待時(shí)間之后,手寫字符識(shí)別器對(duì)所有屬于所述字符的筆跡點(diǎn)進(jìn)行識(shí)別,得到一組候選字符并顯示所述候選字符。3、如權(quán)利要求1所述的手寫字符識(shí)別的方法,其中,所述字符結(jié)構(gòu)信息包括字符筆劃及其次序信息和字符部首信息。4、如權(quán)利要求1所述的手寫字符識(shí)別的方法,其中,所述多個(gè)預(yù)測(cè)字符集分為基于字符結(jié)構(gòu)信息的預(yù)測(cè)字符集、基于對(duì)字符部分筆跡點(diǎn)的識(shí)別結(jié)果信息得到的預(yù)測(cè)字符集和基于字符的上下文關(guān)系信息的預(yù)測(cè)字符集。5、如權(quán)利要求4所述的手寫字符識(shí)別的方法,其中,所述基于字符結(jié)構(gòu)信息的預(yù)測(cè)字符集分為基于輸入的字符筆劃及其次序的筆劃預(yù)測(cè)字符集以及基于字符部首的部首預(yù)測(cè)字符集。6、如權(quán)利要求5所述的手寫字符識(shí)別的方法,其中,所述筆劃在中文系統(tǒng)中分為橫、豎、撇、捺、折等5種。7、如權(quán)利要求4所述的手寫字符識(shí)別的方法,其中,所述上下文關(guān)系包括詞語(yǔ)關(guān)系、成語(yǔ)關(guān)系、單詞/拼音文字的構(gòu)成關(guān)系、以及用戶曾經(jīng)輸入過(guò)的字符的前后相鄰關(guān)系。8、如權(quán)利要求1所述的手寫字符識(shí)別的方法,其中,所述字符的筆跡點(diǎn)是根據(jù)以下方式得到的筆跡點(diǎn)中的一種,即通過(guò)一定時(shí)間間隔采樣獲得的筆跡點(diǎn);一個(gè)或多個(gè)筆劃所包含的筆跡點(diǎn);事先設(shè)定點(diǎn)數(shù)的筆跡點(diǎn)。9、如權(quán)利要求1所述的手寫字符識(shí)別的方法,其中,在所述預(yù)測(cè)識(shí)別的步驟中,將多個(gè)預(yù)測(cè)字符集中都存在的字符作為所述一組候選字符中的首選字符進(jìn)行顯示。10、一種利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的裝置,所述裝置包括手寫輸入模塊,接收用戶輸入的手寫字符,并產(chǎn)生手寫字符的筆跡點(diǎn);手寫字符識(shí)別器,對(duì)從手寫輸入模塊產(chǎn)生的手寫字符的筆跡點(diǎn)進(jìn)行識(shí)別,得到相應(yīng)的一組識(shí)別結(jié)果,并輸出每個(gè)識(shí)別結(jié)果的相似值,所述相似值表示識(shí)別結(jié)果與手寫字符的筆跡點(diǎn)的相似程度;信息預(yù)測(cè)字符庫(kù),包含用戶所用語(yǔ)言中部分或全部字符,并且包括多個(gè)預(yù)測(cè)字符集,所述多個(gè)預(yù)測(cè)字符集中的每個(gè)預(yù)測(cè)字符集包含與上下文關(guān)系信息、字符結(jié)構(gòu)信息和字符部分筆跡點(diǎn)的識(shí)別結(jié)果信息之一對(duì)應(yīng)關(guān)聯(lián)的多個(gè)預(yù)測(cè)字符;預(yù)測(cè)識(shí)別模塊,利用識(shí)別結(jié)果信息以及所述多個(gè)預(yù)測(cè)字符集進(jìn)行預(yù)測(cè)識(shí)別,得到一組候選字符;顯示模塊,顯示預(yù)測(cè)識(shí)別模塊識(shí)別得到的候選字符。11.如權(quán)利要求IO所述的手寫字符識(shí)別的裝置,其中,所述字符結(jié)構(gòu)信息包括字符筆劃及其次序信息和字符部首信息。12、如權(quán)利要求10所述的手寫字符識(shí)別的裝置,其中,如果用戶輸入的手寫字符尚未書寫完畢,則手寫輸入模塊繼續(xù)接收所述手寫字符,并產(chǎn)生相應(yīng)的筆跡點(diǎn)。13、如權(quán)利要求10所述的手寫字符識(shí)別的裝置,其中,如果用戶完成所述手寫字符的輸入,則在預(yù)定的等待時(shí)間之后,手寫字符識(shí)別器對(duì)所有屬于所述手寫字符的筆跡點(diǎn)進(jìn)行識(shí)別,得到一組候選字符。14、如權(quán)利要求10所述的手寫字符識(shí)別的裝置,其中,所述多個(gè)預(yù)測(cè)字符集分為基于字符結(jié)構(gòu)信息的預(yù)測(cè)字符集、基于對(duì)字符部分筆跡點(diǎn)的識(shí)別結(jié)果信息得到的預(yù)測(cè)字符集和基于字符的上下文關(guān)系信息的預(yù)測(cè)字符集。15、如權(quán)利要求14所述的手寫字符識(shí)別的裝置,其中,所述基于字符結(jié)構(gòu)信息的預(yù)測(cè)字符集分為基于輸入的字符筆劃及其次序的筆劃預(yù)測(cè)字符集以及基于字符部首的部首預(yù)測(cè)字符集。16、如權(quán)利要求15所述的手寫字符識(shí)別的裝置,其中,所述筆劃在中文系統(tǒng)中分為橫、豎、撇、捺、折等5種。17、如權(quán)利要求14所述的手寫字符識(shí)別的裝置,其中,所述上下文關(guān)系包括詞語(yǔ)關(guān)系、成語(yǔ)關(guān)系、單詞/拼音文字的構(gòu)成關(guān)系、以及用戶曾經(jīng)輸入過(guò)的字符的前后相鄰關(guān)系。18、如權(quán)利要求10所述的手寫字符識(shí)別的裝置,其中,所述手寫字符的筆跡點(diǎn)是根據(jù)以下方式產(chǎn)生的筆跡點(diǎn)中的一種,即通過(guò)一定時(shí)間間隔采樣獲得的筆跡點(diǎn);一個(gè)或多個(gè)筆劃所包含的筆跡點(diǎn);事先設(shè)定點(diǎn)數(shù)的筆跡點(diǎn)。19、如權(quán)利要求10所述的手寫字符識(shí)別的裝置,其中,預(yù)測(cè)識(shí)別模塊將多個(gè)預(yù)測(cè)字符集中都存在的字符確定為所述一組候選字符中的首選字符。全文摘要本發(fā)明提供了一種利用預(yù)測(cè)的方式進(jìn)行手寫字符識(shí)別的方法和裝置。所述方法包括以下步驟用戶手寫輸入字符的一定數(shù)量的筆跡點(diǎn);手寫字符識(shí)別器對(duì)所述字符已寫入的筆跡點(diǎn)進(jìn)行識(shí)別,得到相應(yīng)的一組識(shí)別結(jié)果;利用得到的識(shí)別結(jié)果信息以及包括在信息預(yù)測(cè)字符庫(kù)中的多個(gè)預(yù)測(cè)字符集進(jìn)行預(yù)測(cè)識(shí)別,得到一組候選字符,并顯示所述候選字符,其中,所述信息預(yù)測(cè)字符庫(kù)包含用戶所用語(yǔ)言中的部分或全部字符,并且所述多個(gè)預(yù)測(cè)字符集中的每一個(gè)預(yù)測(cè)字符集包含與上下文關(guān)系信息、字符結(jié)構(gòu)信息和字符部分筆跡點(diǎn)的識(shí)別結(jié)果信息之一對(duì)應(yīng)關(guān)聯(lián)的多個(gè)預(yù)測(cè)字符。通過(guò)所述方法和裝置,無(wú)需等到預(yù)定的等待時(shí)間之后才開(kāi)始識(shí)別字符,從而加快了手寫輸入的速度。文檔編號(hào)G06F3/048GK101276249SQ20071009621公開(kāi)日2008年10月1日申請(qǐng)日期2007年3月30日優(yōu)先權(quán)日2007年3月30日發(fā)明者炎王,羅恒亮,胡洪濤,陳又新申請(qǐng)人:北京三星通信技術(shù)研究有限公司;三星電子株式會(huì)社