專利名稱:手寫識(shí)別方法及系統(tǒng)的制作方法
手寫識(shí)別方法及系統(tǒng)
技術(shù)領(lǐng)域:
本發(fā)明涉及手寫識(shí)別技術(shù),特別是涉及一種手寫識(shí)別方法及系統(tǒng)。背景技術(shù):
傳統(tǒng)的詞組手寫識(shí)別分為單字輸入識(shí)別和詞組連續(xù)輸入識(shí)別。單字輸入識(shí)別是指用手指或觸筆書寫一個(gè)完整的文字軌跡后,停頓一定的時(shí)間間隔,若該時(shí)間間隔超時(shí),則書寫完成,接著進(jìn)行軌跡識(shí)別,在選擇正確的識(shí)別候選結(jié)果后,再繼續(xù)進(jìn)行后續(xù)的書寫。該單字輸入識(shí)別可以應(yīng)用于全屏手寫或指定區(qū)域內(nèi)的書寫。例如,若用戶想輸入詞組“我們”,則用戶先書寫“我”這個(gè)字的軌跡后,停頓一定的時(shí)間間隔,對(duì)“我”進(jìn)行識(shí)別后,再繼續(xù)書寫 “們”,如此反復(fù)。直至結(jié)束。詞組連續(xù)輸入識(shí)別則是通過手指或觸筆連續(xù)書寫一個(gè)詞組,中間不做大的停頓, 直至輸入完畢后其停頓時(shí)間超時(shí),結(jié)束輸入。例如,若用戶想輸入“我們”其輸入過程要求用戶不可以把要書寫的詞組重疊起來,所以詞組的連續(xù)輸入要求屏幕中的輸入?yún)^(qū)域比較大, 易受到屏幕大小的限制。
發(fā)明內(nèi)容基于此,有必要提供一種可識(shí)別相互疊加的筆畫的手寫識(shí)別方法。一種手寫識(shí)別方法,包括如下步驟建立字庫,并對(duì)所述字庫中的詞組和組成所述詞組的單字分別提取詞組比對(duì)特征集和單字比對(duì)特征集;接收筆跡數(shù)據(jù);接收完畢時(shí),根據(jù)所述詞組比對(duì)特征集以及所述詞組中每一單字的單字比對(duì)特征集,切分并識(shí)別所述筆跡數(shù)據(jù)。優(yōu)選地,所述詞組比對(duì)特征集包括預(yù)設(shè)個(gè)數(shù)的詞組比對(duì)特征值,所述單字比對(duì)特征集包括了與所述詞組比對(duì)特征值個(gè)數(shù)相同的單字比對(duì)特征值。優(yōu)選地,所述接收筆跡數(shù)據(jù)的步驟是采集、存儲(chǔ)并顯示筆跡數(shù)據(jù);在所述筆跡數(shù)據(jù)的接收停頓時(shí),建立分隔標(biāo)志,計(jì)時(shí)得到停頓時(shí)間并判斷是否超時(shí),若所述停頓時(shí)間超時(shí),則結(jié)束所述筆跡數(shù)據(jù)接收,反之,則繼續(xù)采集筆跡數(shù)據(jù)。優(yōu)選地,所述接收完畢時(shí),根據(jù)所述詞組比對(duì)特征集以及所述詞組中每一單字的單字比對(duì)特征集,切分并識(shí)別所述筆跡數(shù)據(jù)的步驟是根據(jù)所述分隔標(biāo)志,對(duì)筆跡數(shù)據(jù)進(jìn)行預(yù)設(shè)次數(shù)的試切分,得到預(yù)設(shè)次數(shù)的試切分中小于預(yù)設(shè)識(shí)別閾值的綜合識(shí)別距離;將所述綜合識(shí)別距離排序,按從小到大的順序取預(yù)設(shè)數(shù)量的綜合識(shí)別距離;根據(jù)所述綜合識(shí)別距離,顯示與所述綜合識(shí)別距離相對(duì)應(yīng)的候選詞組。優(yōu)選地,所述試切分的步驟具體是根據(jù)所述分隔標(biāo)志的建立時(shí)間,選取切分點(diǎn), 對(duì)疊加的筆跡數(shù)據(jù)進(jìn)行切分得到組成用戶輸入的詞組的每一單字的筆跡數(shù)據(jù);對(duì)每一單字的筆跡數(shù)據(jù)和詞組的筆跡數(shù)據(jù)分別提取單字識(shí)別特征集和詞組識(shí)別特征集,并將每一單字識(shí)別特征集與所述字庫詞組中所有單字比對(duì)特征集逐一比對(duì)得到所述字庫中單字與單字最相似的最小識(shí)別距離,將所述詞組識(shí)別特征集與所述字庫中每一詞組比對(duì)特征集比對(duì),得到字庫中詞組與詞組最相似的最小識(shí)別距離,根據(jù)所述單字的最小識(shí)別距離和詞組的最小識(shí)別距離計(jì)算得到綜合識(shí)別距離。優(yōu)選地,所述詞組識(shí)別特征集包括了與所述詞組比對(duì)特征值個(gè)數(shù)相同并一一對(duì)應(yīng)的詞組識(shí)別特征值,所述單字識(shí)別特征集包括了與所述單字比對(duì)特征值個(gè)數(shù)相同并相對(duì)應(yīng)的單字識(shí)別特征值。此外,還有必要提供一種可識(shí)別相互疊加的筆畫的手寫識(shí)別系統(tǒng)。一種手寫識(shí)別系統(tǒng),至少包括特征提取裝置,用于建立字庫,并對(duì)所述字庫中的詞組和組成該詞組的單字分別提取詞組比對(duì)特征集和單字比對(duì)特征集;接收裝置,用于接收筆跡數(shù)據(jù);識(shí)別裝置,接收完畢時(shí),根據(jù)所述詞組比對(duì)特征集以及所述詞組中每一單字的單字比對(duì)特征集,切分并識(shí)別所述筆跡數(shù)據(jù)。優(yōu)選地,所述特征提取裝置所提取的詞組比對(duì)特征集包括預(yù)設(shè)個(gè)數(shù)的詞組比對(duì)特征值,所述單字比對(duì)特征集包括了與所述詞組比對(duì)特征值個(gè)數(shù)相同的單字比對(duì)特征值。優(yōu)選地,所述接收裝置包括輸入模塊,用于采集、存儲(chǔ)并顯示所述筆跡數(shù)據(jù);處理模塊,用于在筆跡數(shù)據(jù)的接收停頓時(shí),建立分隔標(biāo)志,計(jì)時(shí)得到停頓時(shí)間并判斷是否超時(shí),若停頓時(shí)間超時(shí),則筆跡數(shù)據(jù)接收完畢,反之則繼續(xù)采集筆跡數(shù)據(jù)。優(yōu)選地,所述識(shí)別裝置包括切分模塊,用于根據(jù)所述分隔標(biāo)志,對(duì)所述筆跡數(shù)據(jù)進(jìn)行預(yù)設(shè)次數(shù)的試切分,得到用戶所輸入詞組的單字;比對(duì)模塊,用于分別提取詞組以及組成該詞組的單字的識(shí)別特征集,并與字庫中的詞組比對(duì)特征集及組成該詞組的單字的單字比對(duì)特征集比對(duì),分別得到與字庫中詞組與最相似的詞組最小識(shí)別距離和與字庫中單字最相似的單字最小識(shí)別距離,并根據(jù)所述詞組最小識(shí)別距離和單字最小識(shí)別距離得到小于預(yù)設(shè)識(shí)別閾值的綜合識(shí)別距離;排序模塊,用于將所述綜合識(shí)別距離排序,按從小到大的順序取預(yù)設(shè)數(shù)量的綜合識(shí)別距離;顯示模塊,用于取與所述綜合識(shí)別距離相對(duì)應(yīng)的詞組作為候選結(jié)果并顯示。優(yōu)選地,所述切分模塊根據(jù)在所述停頓時(shí)間中建立的分隔標(biāo)志的建立時(shí)間,選取切分點(diǎn),對(duì)疊加的筆跡數(shù)據(jù)進(jìn)行切分得到每一單字的筆跡數(shù)據(jù)。優(yōu)選地,所述比對(duì)模塊所提取的詞組識(shí)別特征集包括了與所述詞組比對(duì)特征值個(gè)數(shù)相同并一一對(duì)應(yīng)的詞組識(shí)別特征值,所述單字識(shí)別特征集包括了與所述單字比對(duì)特征值個(gè)數(shù)相同并相對(duì)應(yīng)的單字識(shí)別特征值。上述手寫識(shí)別方法及系統(tǒng)通過對(duì)用戶手寫輸入的筆跡數(shù)據(jù)中疊加的筆跡數(shù)據(jù)進(jìn)行切分,并與字庫中單字和詞組的比對(duì)特征集一一比對(duì),以識(shí)別用戶所輸入的詞組,實(shí)現(xiàn)了筆畫相互疊加的詞組的識(shí)別,從而使得手寫輸入不再受到屏幕大小的限制,連續(xù)疊加書寫, 提高了用戶手寫的輸入效率。上述手寫識(shí)別方法及系統(tǒng)通過對(duì)輸入的詞組提取多個(gè)識(shí)別特征值,對(duì)字庫中的詞組提取多個(gè)比對(duì)特征值,從多方面獲取詞組的特征,并與字庫中的詞組進(jìn)行比對(duì),有效地提高了手寫識(shí)別的準(zhǔn)確性以及識(shí)別速度。
圖1為一實(shí)施例中手寫識(shí)別方法的流程圖;圖2為一實(shí)施例中接收筆跡數(shù)據(jù)的流程圖3為一實(shí)施例中切分并識(shí)別筆跡數(shù)據(jù)的流程圖;圖4為一實(shí)施例中手寫識(shí)別系統(tǒng)的結(jié)構(gòu)圖;圖5為一實(shí)施例中接收裝置的詳細(xì)模塊圖;圖6為一實(shí)施例中識(shí)別裝置的詳細(xì)模塊圖;圖7為一實(shí)施例中疊加輸入詞組的屏幕示意圖;圖8為一實(shí)施例中識(shí)別結(jié)果的屏幕示意圖。
具體實(shí)施方式圖1示出了本發(fā)明中手寫識(shí)別的方法流程,包括如下步驟在步驟SlO中,建立字庫,并對(duì)字庫中的詞組和組成該詞組的單字分別提取詞組比對(duì)特征集和單字比對(duì)特征集。一實(shí)施例中,在手寫識(shí)別的初始過程中,根據(jù)需要,導(dǎo)入詞組和組成詞組的單字,建立字庫,并對(duì)該字庫中的詞組一一提取詞組比對(duì)特征集,對(duì)組成該詞組的單字一一提取單字比對(duì)特征集,從而方便在后續(xù)的識(shí)別過程中不再需要重新建立字庫,而通過字庫中的詞組比對(duì)特征集和單字比對(duì)特征集中記錄的詞組比對(duì)特征值和單字比對(duì)特征值來識(shí)別筆跡數(shù)據(jù),還原用戶輸入的所有文字,有效地提高了手寫識(shí)別的速度。詞組比對(duì)特征集包括了預(yù)設(shè)個(gè)數(shù)的詞組比對(duì)特征值,多個(gè)詞組比對(duì)特征值分別記錄了相對(duì)應(yīng)詞組中的不同特征。單字比對(duì)特征集包括了與該詞組比對(duì)特征值個(gè)數(shù)相同的單字比對(duì)特征值,多個(gè)單字比對(duì)特征值分別記錄了相對(duì)應(yīng)單字中的不同特征。在步驟S20中,接收筆跡數(shù)據(jù)。一實(shí)施方式中,接收用戶所輸入的筆跡數(shù)據(jù),以便于對(duì)筆跡數(shù)據(jù)進(jìn)行進(jìn)一步的處理。如圖2所示,一實(shí)施例中,步驟S20的具體過程是在步驟S202中,采集、存儲(chǔ)并顯示筆跡數(shù)據(jù)。一實(shí)施例中,采集用戶所輸入的筆跡數(shù)據(jù),存儲(chǔ)并向用戶展示手寫的文字軌跡,該文字軌跡是筆畫相互疊加的詞組。在步驟S204中,在筆跡數(shù)據(jù)的接收停頓時(shí),建立分隔標(biāo)志,計(jì)時(shí)得到停頓時(shí)間并判斷是否超時(shí),若停頓時(shí)間超時(shí),則結(jié)束筆跡數(shù)據(jù)的接收,反之,則返回步驟S202。一實(shí)施例中,用戶手寫輸入詞組,在一筆畫書寫完畢時(shí),產(chǎn)生抬筆的動(dòng)作,因此輸入的筆畫之間會(huì)產(chǎn)生停頓,此時(shí)建立分隔標(biāo)志,并開始計(jì)時(shí),在下一筆畫開始輸入時(shí)停止計(jì)時(shí),得到停頓時(shí)間, 并通過該停頓時(shí)間獲知是否已經(jīng)超時(shí),若停頓時(shí)間沒有超時(shí),則返回步驟S202中繼續(xù)采集數(shù)據(jù)。通過分隔標(biāo)志及停頓時(shí)間,可以獲知每一筆畫所輸入的時(shí)間先后順序。在步驟S30中,接收完畢時(shí),根據(jù)詞組比對(duì)特征集以及該詞組中每一單字的單字比對(duì)特征集,切分并識(shí)別筆跡數(shù)據(jù)。一實(shí)施例中,用戶的一次手寫輸入完畢后,切分該詞組的手寫軌跡,以還原組成該詞組的每一個(gè)單字,并分別對(duì)該詞組中的每一單字及詞組分別提取單字識(shí)別特征集和詞組識(shí)別特征集。詞組識(shí)別特征集包括了與詞組比對(duì)特征值個(gè)數(shù)相同并一一對(duì)應(yīng)的詞組識(shí)別特征值,即每一詞組識(shí)別特征值與字庫中詞組的詞組比對(duì)特征值相對(duì)應(yīng),以便于進(jìn)行比較,而得到識(shí)別結(jié)果。詞組中每一單字的單字識(shí)別特征集包括了與單字比對(duì)特征值個(gè)數(shù)相同并相對(duì)應(yīng)的單字識(shí)別特征值,即每一單字識(shí)別特征值與單字比對(duì)特征值相對(duì)應(yīng)。如圖3所示,一實(shí)施例中,步驟S30的具體過程是在步驟S301中,根據(jù)分隔標(biāo)志,對(duì)筆跡數(shù)據(jù)進(jìn)行預(yù)設(shè)次數(shù)的試切分,得到預(yù)設(shè)次
6數(shù)的試切分中小于預(yù)設(shè)識(shí)別閾值的綜合識(shí)別距離。一實(shí)施例中,試切分的步驟具體是首先,根據(jù)分隔標(biāo)志的建立時(shí)間,選取切分點(diǎn),對(duì)疊加的筆跡數(shù)據(jù)進(jìn)行切分得到組成用戶輸入詞組的每一單字的筆跡數(shù)據(jù);然后,對(duì)每一單字的筆跡數(shù)據(jù)和詞組的筆跡數(shù)據(jù)分別提取單字識(shí)別特征集和詞組識(shí)別特征集,并將每一單字識(shí)別特征集與字庫詞組中所有單字比對(duì)特征集逐一比對(duì)得到字庫中單字與該單字最相似的單字最小識(shí)別距離,將詞組識(shí)別特征集與字庫中每一詞組比對(duì)特征集比對(duì)得到字庫中詞組與該詞組最相似的詞組最小識(shí)別距離,根據(jù)所有單字最小識(shí)別距離和詞組最小識(shí)別距離綜合考慮,計(jì)算得到綜合識(shí)別距離。具體地, 對(duì)手寫筆跡疊加的詞組手寫識(shí)別而言,通過每一單字的最小識(shí)別距離和詞組最小識(shí)別距離來綜合考慮手寫輸入的詞組與字庫中的詞組的相似程度,以便于在本次預(yù)切分中找到最相似的候選詞組。在步驟S302中,將綜合識(shí)別距離排序,按從小到大的順序取預(yù)設(shè)數(shù)量的綜合識(shí)別距離。一實(shí)施例中,綜合識(shí)別距離越小,則該綜合識(shí)別距離所對(duì)應(yīng)的詞組與用戶手寫輸入的詞組越相似。在步驟S303中,根據(jù)綜合識(shí)別距離,顯示與該綜合識(shí)別距離相對(duì)應(yīng)的候選詞組。 一實(shí)施例中,根據(jù)按由小到大的順序所取得的綜合識(shí)別距離,在字庫中獲取與該綜合識(shí)別距離相對(duì)應(yīng)的候選詞組,并顯示,以供用戶選擇。圖4示出了一實(shí)施例中手寫識(shí)別系統(tǒng)的詳細(xì)結(jié)構(gòu),該實(shí)施例中,手寫識(shí)別系統(tǒng)包括特征提取裝置10、接收裝置20以及識(shí)別裝置30,其中特征提取裝置10,用于建立字庫,并對(duì)字庫中的詞組和組成該詞組的單字分別提取詞組比對(duì)特征集和單字比對(duì)特征集。一實(shí)施例中,該特征提取裝置10根據(jù)需要,在進(jìn)行用戶的手寫識(shí)別之前導(dǎo)入詞組和組成該詞組的單字,建立手寫識(shí)別系統(tǒng)中的字庫,并對(duì)該字庫中的詞組一一提取詞組比對(duì)特征集,對(duì)組成該詞組的單字一一提取單字比對(duì)特征集, 從而方便在后續(xù)的識(shí)別過程中通過詞組比對(duì)特征集和單字比對(duì)特征集中記錄的詞組比對(duì)特征值和單字比對(duì)特征值來識(shí)別筆跡數(shù)據(jù),還原用戶輸入的所有文字,而不需要再次從外部導(dǎo)入詞組和組成該詞組的單字。如前所述,詞組比對(duì)特征集和單字比對(duì)特征集分別包括了個(gè)數(shù)相同的多個(gè)詞組比對(duì)特征值和多個(gè)單字比對(duì)特征值。 接收裝置20,用于接收筆跡數(shù)據(jù)。識(shí)別裝置30,用于接收完畢時(shí),根據(jù)詞組比對(duì)特征集以及該詞組中每一單字的單字比對(duì)特征集,切分并識(shí)別筆跡數(shù)據(jù)。一實(shí)施方式中,用戶的一次手寫輸入完畢以后,識(shí)別裝置30接收完畢時(shí),根據(jù)詞組比對(duì)特征集以及該詞組中每一單字的單字比對(duì)特征集,切分并識(shí)別筆跡數(shù)據(jù)。如前所述,詞組識(shí)別特征集包括了與詞組比對(duì)特征值個(gè)數(shù)相同并一一對(duì)應(yīng)的詞組識(shí)別特征值。詞組中每一單字的單字識(shí)別特征集包括了與單字比對(duì)特征值個(gè)數(shù)相同并相對(duì)應(yīng)的單字識(shí)別特征值。圖5示出了一實(shí)施例中接收裝置的詳細(xì)模塊,該實(shí)施例中,接收裝置20包括輸入模塊202及處理模塊204,其中輸入模塊202,用于采集、存儲(chǔ)并顯示筆跡數(shù)據(jù)。一實(shí)施例中,輸入模塊202采集用戶輸入的筆跡數(shù)據(jù),存儲(chǔ)并顯示于屏幕上。處理模塊204,用于在筆跡數(shù)據(jù)的接收停頓時(shí),建立分隔標(biāo)志,并計(jì)時(shí)得到停頓時(shí)間,若停頓時(shí)間超時(shí),則筆跡數(shù)據(jù)接收完畢,反之,則繼續(xù)采集筆跡數(shù)據(jù)。一實(shí)施例中,隨著每一筆畫的完成,在書寫下一筆畫之前,用戶會(huì)產(chǎn)生抬起的動(dòng)作,產(chǎn)生停頓,此時(shí)處理模塊 204建立分隔標(biāo)志,并開始計(jì)時(shí),從而得到停頓時(shí)間。處理模塊204通過分隔標(biāo)志得到屬于同一筆畫的筆跡數(shù)據(jù),并通過相關(guān)聯(lián)的停頓時(shí)間獲知時(shí)間先后順序,以便于手寫文字的還原。處理模塊204對(duì)停頓時(shí)間進(jìn)行判斷是否超時(shí),若停頓時(shí)間已超時(shí),則輸入結(jié)束,反之,則繼續(xù)采集筆跡數(shù)據(jù)。圖6示出了一實(shí)施例中識(shí)別裝置的詳細(xì)模塊,該實(shí)施例中,識(shí)別裝置30包括切分模塊301、比對(duì)模塊302、排序模塊303以及顯示模塊304,其中切分模塊301,用于根據(jù)分隔標(biāo)志,對(duì)筆跡數(shù)據(jù)進(jìn)行預(yù)設(shè)次數(shù)的試切分,得到組成用戶所輸入詞組的單字。具體地,切分模塊根據(jù)在書寫停頓時(shí)建立的分隔標(biāo)志的建立時(shí)間, 選取切分點(diǎn),對(duì)疊加的筆跡數(shù)據(jù)進(jìn)行切分得到每一單字的筆跡數(shù)據(jù)。比對(duì)模塊302,用于分別提取詞組以及組成該詞組的單字的識(shí)別特征集,并與字庫中的詞組比對(duì)特征集及組成該詞組的單字的單字比對(duì)特征集比對(duì),分別得到與字庫中詞組與最相似的詞組最小識(shí)別距離和與字庫中單字最相似的單字最小識(shí)別距離,并所述詞組最小識(shí)別距離和單字最小識(shí)別距離得到小于預(yù)設(shè)識(shí)別閾值的綜合識(shí)別距離。一實(shí)施例中,比對(duì)模塊302對(duì)每一詞組以及組成該詞組的單字分別提取識(shí)別特征集,并將每一單字的識(shí)別特征集與字庫詞組中所有單字的比對(duì)特征集逐一比對(duì)得到相應(yīng)的與字庫中單字最相似的單字最小識(shí)別距離,將詞組的識(shí)別特征集與字庫中詞組的比對(duì)特征集比對(duì)得到相應(yīng)的與字庫中詞組與最相似詞組最小識(shí)別距離,根據(jù)所有單字最小識(shí)別距離和詞組最小識(shí)別距離得到綜合識(shí)別距離,該綜合識(shí)別距離必須小于預(yù)設(shè)識(shí)別閾值,若某一次的試切分中,綜合識(shí)別距離大于預(yù)設(shè)識(shí)別閾值,則該次試切分不理想,排除該次切分。該綜合識(shí)別距離的計(jì)算方式可以是對(duì)所有單字最小識(shí)別距離和詞組最小識(shí)別距離進(jìn)行加權(quán)平均,但并不僅限于此。如前所述,比對(duì)模塊302通過每一單字最小識(shí)別距離和詞組最小識(shí)別距離來綜合考慮手寫輸入的詞組與字庫中的詞組的相似程度,以便在預(yù)切分中得到最相似的候選詞組。排序模塊303,用于將綜合識(shí)別距離排序,按從小到大的順序取預(yù)設(shè)數(shù)量的綜合識(shí)別距離。一實(shí)施例中,綜合識(shí)別距離的大小表現(xiàn)了該綜合識(shí)別距離所對(duì)應(yīng)的詞組與用戶所手寫輸入的詞組的相似程度,綜合識(shí)別距離越小,則越相似。顯示模塊304,用于取與綜合識(shí)別距離相對(duì)應(yīng)的詞組作為候選結(jié)果并顯示。該候選結(jié)果為與用戶手寫輸入的詞組最相似的詞組,用戶可以通過對(duì)顯示于屏幕中的候選結(jié)果的選擇得到正確的輸入結(jié)果。下面結(jié)合一個(gè)詳細(xì)的實(shí)施例來闡述手寫識(shí)別方法及系統(tǒng)的應(yīng)用過程,該實(shí)施例中,如圖7、8所示,在手寫屏幕中,用戶疊加地輸入詞組“我們”,接收裝置20的輸入模塊202 接收筆跡數(shù)據(jù),存儲(chǔ)并顯示于屏幕上。在輸入過程中,每一筆畫完成后,在書寫下一筆畫之前,用戶會(huì)產(chǎn)生抬起的動(dòng)作,產(chǎn)生了停頓,此時(shí)處理模塊204建立分隔標(biāo)志,并開始計(jì)時(shí),從而得到停頓時(shí)間,并判斷該停頓時(shí)間是否超時(shí),若停頓時(shí)間已超時(shí),則手寫輸入結(jié)束,反之, 則繼續(xù)采集筆跡數(shù)據(jù)。在筆跡數(shù)據(jù)接收完畢時(shí),切分該筆跡數(shù)據(jù),即根據(jù)分隔標(biāo)志,選取切分點(diǎn),對(duì)筆跡數(shù)據(jù)進(jìn)行預(yù)設(shè)次數(shù)的試切分。對(duì)每次試切分得到的單字提取單字識(shí)別特征集, 對(duì)詞組“我們”提取詞組識(shí)別特征集,并與字詞中的詞組比對(duì)特征集及組成該詞組的單字比對(duì)特征集比對(duì),得到綜合識(shí)別距離。若該綜合識(shí)別距離小于預(yù)設(shè)識(shí)別閾值,則該次試切分為理想的切分,反之,則該次試切分不理想,排除該次切分。排序模塊303將綜合識(shí)別距離排序,并按照從小到大的順序取得一定數(shù)量的綜合識(shí)別距離,從而獲取與該綜合識(shí)別距離相對(duì)應(yīng)的詞組作為候選結(jié)果并顯示于屏幕中,此時(shí),用戶在屏幕中選擇最佳的候選結(jié)果。上述手寫識(shí)別方法及系統(tǒng)通過對(duì)用戶手寫輸入的筆跡數(shù)據(jù)中疊加的筆跡數(shù)據(jù)進(jìn)行切分,并與字庫中單字和詞組的比對(duì)特征集一一比對(duì),以識(shí)別用戶所輸入的詞組,實(shí)現(xiàn)了筆畫相互疊加的詞組的識(shí)別,從而使得手寫輸入不再受到屏幕大小的限制,連續(xù)疊加書寫, 提高了用戶手寫的輸入效率。上述手寫識(shí)別方法及系統(tǒng)通過對(duì)輸入的詞組提取多個(gè)識(shí)別特征值,對(duì)字庫中的詞組提取多個(gè)比對(duì)特征值,從多方面獲取詞組的特征,并與字庫中的詞組進(jìn)行比對(duì),有效地提高了手寫識(shí)別的準(zhǔn)確性以及識(shí)別速度。以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。
權(quán)利要求
1.一種手寫識(shí)別方法,包括如下步驟建立字庫,并對(duì)所述字庫中的詞組和組成所述詞組的單字分別提取詞組比對(duì)特征集和單字比對(duì)特征集;接收筆跡數(shù)據(jù);接收完畢時(shí),根據(jù)所述詞組比對(duì)特征集以及所述詞組中每一單字的單字比對(duì)特征集, 切分并識(shí)別所述筆跡數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的手寫識(shí)別方法,其特征在于,所述詞組比對(duì)特征集包括預(yù)設(shè)個(gè)數(shù)的詞組比對(duì)特征值,所述單字比對(duì)特征集包括了與所述詞組比對(duì)特征值個(gè)數(shù)相同的單字比對(duì)特征值。
3.根據(jù)權(quán)利要求1所述的手寫識(shí)別方法,其特征在于,所述接收筆跡數(shù)據(jù)的步驟是采集、存儲(chǔ)并顯示筆跡數(shù)據(jù);在所述筆跡數(shù)據(jù)的接收停頓時(shí),建立分隔標(biāo)志,計(jì)時(shí)得到停頓時(shí)間并判斷是否超時(shí),若所述停頓時(shí)間超時(shí),則結(jié)束所述筆跡數(shù)據(jù)接收,反之,則繼續(xù)采集筆跡數(shù)據(jù)。
4.根據(jù)權(quán)利要求3所述的手寫識(shí)別方法,其特征在于,所述接收完畢時(shí),根據(jù)所述詞組比對(duì)特征集以及所述詞組中每一單字的單字比對(duì)特征集,切分并識(shí)別所述筆跡數(shù)據(jù)的步驟是根據(jù)所述分隔標(biāo)志,對(duì)筆跡數(shù)據(jù)進(jìn)行預(yù)設(shè)次數(shù)的試切分,得到預(yù)設(shè)次數(shù)的試切分中小于預(yù)設(shè)識(shí)別閾值的綜合識(shí)別距離;將所述綜合識(shí)別距離排序,按從小到大的順序取預(yù)設(shè)數(shù)量的綜合識(shí)別距離;根據(jù)所述綜合識(shí)別距離,顯示與所述綜合識(shí)別距離相對(duì)應(yīng)的候選詞組。
5.根據(jù)權(quán)利要求4所述的手寫識(shí)別方法,其特征在于,所述試切分的步驟具體是根據(jù)所述分隔標(biāo)志的建立時(shí)間,選取切分點(diǎn),對(duì)疊加的筆跡數(shù)據(jù)進(jìn)行切分得到組成用戶輸入的詞組的每一單字的筆跡數(shù)據(jù);對(duì)每一單字的筆跡數(shù)據(jù)和詞組的筆跡數(shù)據(jù)分別提取單字識(shí)別特征集和詞組識(shí)別特征集,并將每一單字識(shí)別特征集與所述字庫詞組中所有單字比對(duì)特征集逐一比對(duì)得到單字最小識(shí)別距離,將所述詞組識(shí)別特征集與所述字庫中每一詞組比對(duì)特征集比對(duì),得到詞組最小識(shí)別距離,根據(jù)所述單字的最小識(shí)別距離和詞組的最小識(shí)別距離計(jì)算得到綜合識(shí)別距1 O
6.根據(jù)權(quán)利要求5所述的手寫識(shí)別方法,其特征在于,所述詞組識(shí)別特征集包括了與所述詞組比對(duì)特征值個(gè)數(shù)相同并一一對(duì)應(yīng)的詞組識(shí)別特征值,所述單字識(shí)別特征集包括了與所述單字比對(duì)特征值個(gè)數(shù)相同并相對(duì)應(yīng)的單字識(shí)別特征值。
7.一種手寫識(shí)別系統(tǒng),其特征在于,至少包括特征提取裝置,用于建立字庫,并對(duì)所述字庫中的詞組和組成該詞組的單字分別提取詞組比對(duì)特征集和單字比對(duì)特征集;接收裝置,用于接收筆跡數(shù)據(jù);識(shí)別裝置,接收完畢時(shí),根據(jù)所述詞組比對(duì)特征集以及所述詞組中每一單字的單字比對(duì)特征集,切分并識(shí)別所述筆跡數(shù)據(jù)。
8.根據(jù)權(quán)利要求7所述的手寫識(shí)別系統(tǒng),其特征在于,所述特征提取裝置所提取的詞組比對(duì)特征集包括預(yù)設(shè)個(gè)數(shù)的詞組比對(duì)特征值,所述單字比對(duì)特征集包括了與所述詞組比對(duì)特征值個(gè)數(shù)相同的單字比對(duì)特征值。
9.根據(jù)權(quán)利要求7所述的手寫識(shí)別系統(tǒng),其特征在于,所述接收裝置包括輸入模塊,用于采集、存儲(chǔ)并顯示所述筆跡數(shù)據(jù);處理模塊,用于在筆跡數(shù)據(jù)的接收停頓時(shí),建立分隔標(biāo)志,計(jì)時(shí)得到停頓時(shí)間并判斷是否超時(shí),若停頓時(shí)間超時(shí),則筆跡數(shù)據(jù)接收完畢,反之則繼續(xù)采集筆跡數(shù)據(jù)。
10.根據(jù)權(quán)利要求9所述的手寫識(shí)別系統(tǒng),其特征在于,所述識(shí)別裝置包括切分模塊,用于根據(jù)所述分隔標(biāo)志,對(duì)所述筆跡數(shù)據(jù)進(jìn)行預(yù)設(shè)次數(shù)的試切分,得到用戶所輸入詞組的單字;比對(duì)模塊,用于分別提取詞組以及組成該詞組的單字的識(shí)別特征集,并與字庫中的詞組比對(duì)特征集及組成該詞組的單字的單字比對(duì)特征集比對(duì),分別得到詞組最小識(shí)別距離和單字最小識(shí)別距離,并根據(jù)所述詞組最小識(shí)別距離和單字最小識(shí)別距離得到小于預(yù)設(shè)識(shí)別閾值的綜合識(shí)別距離;排序模塊,用于將所述綜合識(shí)別距離排序,按從小到大的順序取預(yù)設(shè)數(shù)量的綜合識(shí)別距離;顯示模塊,用于取與所述綜合識(shí)別距離相對(duì)應(yīng)的詞組作為候選結(jié)果并顯示。
11.根據(jù)權(quán)利要求10所述的手寫識(shí)別系統(tǒng),其特征在于,所述切分模塊根據(jù)在所述停頓時(shí)間中建立的分隔標(biāo)志的建立時(shí)間,選取切分點(diǎn),對(duì)疊加的筆跡數(shù)據(jù)進(jìn)行切分得到每一單字的筆跡數(shù)據(jù)。
12.根據(jù)權(quán)利要求10所述的手寫識(shí)別系統(tǒng),其特征在于,所述比對(duì)模塊所提取的詞組識(shí)別特征集包括了與所述詞組比對(duì)特征值個(gè)數(shù)相同并一一對(duì)應(yīng)的詞組識(shí)別特征值,所述單字識(shí)別特征集包括了與所述單字比對(duì)特征值個(gè)數(shù)相同并相對(duì)應(yīng)的單字識(shí)別特征值。
全文摘要
一種手寫識(shí)別方法,包括如下步驟建立字庫,并對(duì)所述字庫中的詞組和組成所述詞組的單字分別提取詞組比對(duì)特征集和單字比對(duì)特征集;接收筆跡數(shù)據(jù);接收完畢時(shí),根據(jù)所述詞組比對(duì)特征集以及所述詞組中每一單字的單字比對(duì)特征集,切分并識(shí)別所述筆跡數(shù)據(jù)。上述手寫識(shí)別方法通過對(duì)用戶手寫輸入的筆跡數(shù)據(jù)中疊加的筆跡數(shù)據(jù)進(jìn)行切分,并與字庫中單字和詞組的比對(duì)特征集一一比對(duì),以識(shí)別用戶所輸入的詞組,實(shí)現(xiàn)了筆畫相互疊加的詞組的識(shí)別,從而使得手寫輸入不再受到屏幕大小的限制,連續(xù)疊加書寫,提高了用戶手寫的輸入效率。
文檔編號(hào)G06K9/62GK102375989SQ20101024794
公開日2012年3月14日 申請(qǐng)日期2010年8月6日 優(yōu)先權(quán)日2010年8月6日
發(fā)明者張靖, 陳波 申請(qǐng)人:騰訊科技(深圳)有限公司