專利名稱:手寫識(shí)別的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及手寫識(shí)別處理。本發(fā)明特別適用于(但不必限制于)識(shí)別手寫的表意字符。
背景技術(shù):
幾十年來(lái),印刷文本的計(jì)算機(jī)識(shí)別一直面臨著煩惱的技術(shù)難題。許多光學(xué)字符識(shí)別(OCR)技術(shù)只是在最近才得到了改進(jìn),能夠高準(zhǔn)確度地識(shí)別掃描的文本文獻(xiàn)。但是這樣的OCR技術(shù)一般僅能夠轉(zhuǎn)換打字機(jī)或電子打印機(jī)打印的文本。手寫字符的計(jì)算機(jī)識(shí)別仍舊是非常困難的技術(shù)挑戰(zhàn)。
用于識(shí)別手寫字符的現(xiàn)有方法通常包括高分辨率的模板,除了書寫文本的兩個(gè)物理維度之外,其還捕捉與書寫文本操作相關(guān)的時(shí)間維度。通常使用電子圖形輸入板來(lái)創(chuàng)建這樣的模板,當(dāng)筆、觸針或手指接觸輸入板時(shí),輸入板會(huì)記錄下文本的筆劃。隨后,通過(guò)使用各種模式識(shí)別技術(shù),將對(duì)應(yīng)于輸入手寫字符的方向特征向量與模型字符的模板進(jìn)行匹配。模型字符的模板包括來(lái)自每個(gè)字符的大量輸入樣本的方向特征向量的統(tǒng)計(jì)平均值。理想情況下,使用這樣的電子圖形輸入板的書寫者能夠看到他或她所寫的東西(諸如通過(guò)使用圖形用戶界面上的電子“墨水”),因此書寫者可以控制文本的清晰度。
但是,諸如移動(dòng)電話和個(gè)人數(shù)字助理(PDA)的某些手持設(shè)備包括很小的觸摸板,用戶必須在其上一個(gè)疊一個(gè)的書寫字符,而不能接收到任何的反饋,例如接收不到來(lái)自圖形用戶界面、顯示出設(shè)備怎樣轉(zhuǎn)換該手寫輸入的反饋。因此,這是在“盲”寫字符。不出意外的話,寫在這樣的觸摸板上的字符很容易包括大量字符形狀上的失真,尤其是對(duì)于更復(fù)雜的表意字符,諸如許多漢語(yǔ)和日語(yǔ)字符。因此,寫在這樣的觸摸板上的字符的準(zhǔn)確電子識(shí)別就尤其困難了。
因此,需要一種用于手寫識(shí)別的改進(jìn)方法和系統(tǒng),其能夠克服大量的字符形狀失真(諸如由于在觸摸板上盲寫而造成的失真),并且能夠識(shí)別所需的手寫字符。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)方面,本發(fā)明是一種手寫識(shí)別的方法,其包括如下步驟接收書寫在電子設(shè)備的用戶接口上的手寫輸入字符的表示;從所述輸入字符中提取方向特征向量;從所述輸入字符中提取筆劃段特征向量;以及通過(guò)將所述方向特征向量和所述筆劃段特征向量與模型字符進(jìn)行對(duì)比從而確定匹配的候選字符。
該方法還可包括通過(guò)進(jìn)行平滑、噪聲刪除以及大小歸一化處理來(lái)對(duì)所述手寫輸入字符進(jìn)行預(yù)處理的步驟。
該方法還可包括對(duì)所述手寫輸入字符預(yù)分類的步驟。
該方法還可包括通過(guò)僅將所述方向特征向量與所述模型字符對(duì)比從而提供一個(gè)短的候選字符列表及其相應(yīng)的第一置信分?jǐn)?shù)(vi2)的步驟。
確定匹配的候選字符的步驟可包括將所述短的候選字符列表及其相應(yīng)的第一置信分?jǐn)?shù)(vi2)與所述筆劃段特征向量進(jìn)行對(duì)比的步驟。
該方法可進(jìn)一步包括計(jì)算所述手寫輸入字符的無(wú)序函數(shù)D(S)的步驟。
可以根據(jù)下述公式來(lái)計(jì)算無(wú)序函數(shù)D(S)
D(S)=Σ1≤i<j≤nd(si,sj),]]>式中 式中si=(xi,yi)且sj=(xj,yj),其中si和sj是兩個(gè)手寫筆劃的起始點(diǎn)。
將所述短的候選字符列表及其相應(yīng)的第一置信分?jǐn)?shù)(vi2)與所述筆劃段特征向量進(jìn)行對(duì)比的步驟可包括提供相應(yīng)的第二置信分?jǐn)?shù)(vi3),并根據(jù)下述公式將所述第一置信分?jǐn)?shù)(vi2)與所述第二置信分?jǐn)?shù)(vi3)合并vi=θ2·vi2+θ3·vi3,]]>式中θ2+θ3=1,且θ2和θ3是根據(jù)經(jīng)驗(yàn)確定的。
θ2和θ3可以根據(jù)是否D(S)<T(S)而變化,其中T(S)是經(jīng)驗(yàn)確定的筆劃數(shù)決定的門限,而D(S)是根據(jù)下述公式計(jì)算的無(wú)序函數(shù)D(S)=Σ1≤i<j≤nd(si,sj),]]>式中 式中si=(xi,yi)且sj=(xj,yj),其中si和sj是兩個(gè)手寫筆劃的起始點(diǎn)。
匹配的候選字符可以是具有最大vi值的字符。
根據(jù)本發(fā)明的另一方面,本發(fā)明是一種用于手寫識(shí)別的系統(tǒng),其包括微處理器;與所述微處理器有效相連的只讀存儲(chǔ)器(ROM);與所述微處理器有效相連的可編程存儲(chǔ)器;以及與所述微處理器有效相連的輸入板;所述微處理器有效地執(zhí)行存儲(chǔ)在所述ROM中的代碼,以接收書寫在所述輸入板上的手寫輸入字符的表示,從所述輸入字符中提取方向特征向量,從所述輸入字符中提取筆劃段特征向量,通過(guò)將所述方向特征向量和所述筆劃段特征向量與儲(chǔ)存在所述可編程存儲(chǔ)器中的模型字符進(jìn)行對(duì)比來(lái)確定匹配的候選字符。
通過(guò)進(jìn)行平滑、噪聲刪除和大小歸一化處理,微處理器可進(jìn)一步有效地對(duì)所述手寫輸入字符進(jìn)行預(yù)處理。
微處理器可進(jìn)一步有效地對(duì)所述手寫輸入字符進(jìn)行預(yù)分類。
通過(guò)僅僅將所述方向特征向量與所述模型字符進(jìn)行對(duì)比,微處理器可進(jìn)一步有效地提供一個(gè)短的候選字符列表及其相應(yīng)的第一置信分?jǐn)?shù)(vi2)。
微處理器可進(jìn)一步有效地將所述短的候選字符列表及其相應(yīng)的第一置信分?jǐn)?shù)(vi2)與所述筆劃段特征向量進(jìn)行對(duì)比。
在本說(shuō)明書及權(quán)利要求書中,術(shù)語(yǔ)“包括(comprises、comprising)”或類似的術(shù)語(yǔ)意指非排他性的包含,因此,包括一系列組件的方法或裝置不僅僅包括這些已示出的組件,還可很好地包括那些沒(méi)有明確列出的其它組件。
為了使本發(fā)明易于理解并付諸實(shí)施,現(xiàn)在將結(jié)合附圖所示對(duì)優(yōu)選實(shí)施例做引用,其中相似的標(biāo)號(hào)代表相似的組件,在附圖中圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例、圖示說(shuō)明了確定最好地匹配一個(gè)手寫輸入字符的表示的匹配模型字符候選的手寫識(shí)別方法的流程圖;圖2是漢字字符的筆劃段特征的示意圖;圖3是根據(jù)標(biāo)準(zhǔn)筆劃規(guī)則書寫的漢字字符的一個(gè)實(shí)例;圖4是根據(jù)本發(fā)明、圖示說(shuō)明了產(chǎn)生第二組置信分?jǐn)?shù)的匹配過(guò)程的示意圖;
圖5是根據(jù)本發(fā)明的實(shí)施例,圖示說(shuō)明了確定權(quán)重因子θ2和θ3的方法的流程圖;圖6是圖示說(shuō)明了包含有可在其上書寫手寫字符的表示的輸入板的移動(dòng)電話示意圖。
具體實(shí)施例方式
參看圖1,該流程圖根據(jù)本發(fā)明的一個(gè)實(shí)施例、圖示說(shuō)明了確定匹配模型字符候選的手寫識(shí)別方法100,該匹配模型字符候選最好地匹配了手寫輸入字符的表示。方法100始于步驟105,在這里接收手寫輸入字符的表示。在步驟110對(duì)輸入字符進(jìn)行預(yù)處理,在步驟115計(jì)算用于創(chuàng)建輸入字符、與筆劃順序有關(guān)的無(wú)序函數(shù)D(S)。在步驟120,對(duì)輸入字符進(jìn)行預(yù)分類,以創(chuàng)建匹配候選字符的第一短列表。然后在步驟125從輸入字符中提取出方向特征向量。在步驟130,將方向特征向量與對(duì)應(yīng)于匹配候選字符的第一短列表的模型字符進(jìn)行對(duì)比,以創(chuàng)建匹配候選字符的第二短列表以及相關(guān)的第一置信分?jǐn)?shù)(vi2)。在步驟135,從輸入字符中提取出筆劃段特征向量。然后在步驟140將筆劃段特征向量與匹配候選字符的第二短列表進(jìn)行對(duì)比,以創(chuàng)建第二組置信分?jǐn)?shù)(vi3)。最后,在步驟145,通過(guò)確定一個(gè)匹配候選字符來(lái)識(shí)別手寫輸入字符。通過(guò)將第一置信分?jǐn)?shù)(vi2)和第二置信分?jǐn)?shù)(vi3)進(jìn)行合并來(lái)確定匹配候選字符。
下面提供方法100的進(jìn)一步的細(xì)節(jié)??梢詫⒎椒?00結(jié)合進(jìn)諸如個(gè)人數(shù)字助理(PDA)和移動(dòng)電話的手持電子設(shè)備中,以提供手寫識(shí)別功能。在步驟105,可以在電子設(shè)備的用戶接口上書寫手寫輸入字符的表示。在步驟110,預(yù)處理可以對(duì)輸入字符進(jìn)行平滑、噪聲消除以及大小歸一化。在后面的說(shuō)明書中將描述無(wú)序函數(shù)D(S)。在步驟120,通過(guò)將字符集中的所有字符首先分組到(例如)幾百個(gè)每個(gè)都包含數(shù)十個(gè)字符的小組中,從而對(duì)輸入字符進(jìn)行預(yù)分類。對(duì)于某些語(yǔ)言,諸如漢語(yǔ),字符集中可能有超過(guò)一萬(wàn)個(gè)字符。然后,訓(xùn)練模型字符以代表每個(gè)組,然后將輸入字符與每個(gè)模型字符進(jìn)行對(duì)比。然后,由對(duì)應(yīng)于最佳匹配的組中的字符組成候選字符的第一短列表。
在步驟125,通過(guò)本領(lǐng)域所公知的方法,方法100從輸入字符中提取出方向特征向量。例如,在預(yù)處理步驟110首先使數(shù)字化的輸入字符的像素適于N*N的柵格并歸一化,從而使得輸入字符的大小與用于創(chuàng)建模型字符方向特征向量的模型字符的大小相同。然后,將N*N柵格的每個(gè)元素細(xì)分成甚至更細(xì)的網(wǎng)格,然后分析以提取方向特征向量。方向特征向量的一個(gè)例子是8維方向特征向量。8維方向特征向量的每個(gè)維度對(duì)應(yīng)于用于創(chuàng)建輸入字符的一個(gè)筆劃方向。通過(guò)將圓周劃分成45度的等分,可以創(chuàng)建八個(gè)筆劃方向。本領(lǐng)域技術(shù)人員將認(rèn)識(shí)到,根據(jù)本發(fā)明,方向特征向量也可以使用更多或者更少的維度。然后,根據(jù)元素內(nèi)實(shí)際筆劃方向的最佳匹配,給包含了來(lái)自手寫筆劃的像素的網(wǎng)格的每個(gè)元素分配八個(gè)維度之一。然后將網(wǎng)格元素的方向維度求和,以創(chuàng)建方向特征向量。8維方向特征向量定義為V={v1,v2,v3,v4,v5,v6,v7,v8},其中,vi的值是網(wǎng)格中第i個(gè)方向維度的計(jì)數(shù),式中(1≤i≤8)。然后,將N*N柵格每個(gè)元素內(nèi)的8維方向特征向量進(jìn)行平均。最后,得到整個(gè)輸入字符的8*N*N維的方向特征向量。
模型字符特征向量包括來(lái)自每個(gè)字符的多個(gè)輸入樣本的特征向量的統(tǒng)計(jì)平均值。模型字符特征向量包括字符集中所有字符的特征向量。
接下來(lái),方法100在步驟130繼續(xù),在這里將方向特征向量與模型字符特征向量進(jìn)行對(duì)比,以創(chuàng)建候選字符的第二短列表。候選字符的第二短列表是候選字符的第一短列表的子集。然后,基于輸入字符的方向特征向量與候選字符的方向特征向量之間距離的最佳匹配比較,將置信分?jǐn)?shù)(vi2)分配給第二短列表上的候選字符。向量之間的距離例如可以是基于歐氏距離(Euclidean distance)或城市街區(qū)距離(city block distance)的。
然后,方法100在步驟135繼續(xù),在這里從輸入字符中提取出筆劃段特征向量。通過(guò)使用輸入字符的第三維度(時(shí)間維度)來(lái)得到筆劃段特征向量。參看圖2,圖示說(shuō)明了漢字字符的筆劃段特征。輸入字符的本地最大方向角變化之間的書寫筆劃段定義了筆劃段特征。然后得到每段的二維向量(dx,dy),其中dx和dy是段的起始和結(jié)束點(diǎn)之間的坐標(biāo)距離。根據(jù)輸入字符的復(fù)雜度,用于定義輸入字符的筆劃段特征向量的數(shù)目也會(huì)變化。
筆劃段特征向量用于確定是否以類似于預(yù)測(cè)的方式書寫輸入字符。例如,漢字字符具有標(biāo)準(zhǔn)筆劃順序,通常在連筆書寫字符時(shí)會(huì)遵守筆劃的順序。當(dāng)書寫漢字字符時(shí),標(biāo)準(zhǔn)筆劃順序通常遵循下面的規(guī)則1)先左后右;2)先上后下。參看圖3,示出了根據(jù)上面的標(biāo)準(zhǔn)筆劃規(guī)則書寫的漢字字符的一個(gè)例子。如圖3中所示,標(biāo)準(zhǔn)筆劃順序是“s1,s2,s3,s4”,其中每一筆中的黑點(diǎn)表示筆劃的起始點(diǎn)。注意到,s2在s1的下面,s3在s2的右面,s4在s3的下面、s3的右面。
在步驟140,方法100繼續(xù),在這里將從輸入字符得到的上述筆劃段特征向量與匹配候選字符的第二短列進(jìn)行對(duì)比,以創(chuàng)建第二組置信分?jǐn)?shù)(vi3)。參看圖4,圖示說(shuō)明了產(chǎn)生第二組置信分?jǐn)?shù)(vi3)的對(duì)比過(guò)程的示意圖。將對(duì)應(yīng)于匹配候選字符的第二短列的筆劃的筆劃段模型序列與輸入字符的筆劃段特征向量進(jìn)行對(duì)比。筆劃段模型序列包括概率分布函數(shù)(PDF),諸如高斯混合PDF(Gaussian mixture PDF)。來(lái)自輸入字符的特征向量的數(shù)目可與來(lái)自匹配候選字符的筆劃段模型的數(shù)目不一致。因此使用動(dòng)態(tài)規(guī)劃(DP)來(lái)將模型序列與輸入字符進(jìn)行對(duì)比。計(jì)算置信分?jǐn)?shù)(vi3)作為每個(gè)對(duì)比的一個(gè)量度。在DP處理期間,筆劃段特征向量與分段模型之間的置信分?jǐn)?shù)被確定為特征向量與分段模型匹配的似然度。
最后,在步驟145,方法100通過(guò)將第一置信分?jǐn)?shù)(vi2)和第二置信分?jǐn)?shù)(vi3)合并來(lái)確定最佳匹配候選字符,從而識(shí)別輸入手寫字符。根據(jù)下面的公式合并兩組置信分?jǐn)?shù)vi=θ2·vi2+θ3·vi3,]]>式中θ2+θ3=1。
選取與最大值vi相匹配的候選字符作為最佳匹配候選字符。θ2和θ3是用于確定哪組置信分?jǐn)?shù)(vi2還是vi3)更可能給出準(zhǔn)確識(shí)別結(jié)果的權(quán)重因子。
參看圖5,圖示說(shuō)明了確定θ2和θ3的值的方法500的流程圖。首先,在步驟505,方法500確定輸入字符是以連筆書寫的還是使用多個(gè)單獨(dú)筆劃書寫的。連筆書寫的輸入字符最有可能符合標(biāo)準(zhǔn)筆劃順序;因此,如果以連筆書寫輸入字符的話,方法500會(huì)立即輸出值θ2=a1和θ3=a2,其中a1和a2是通過(guò)將測(cè)試輸入字符與模型候選字符進(jìn)行比較而根據(jù)經(jīng)驗(yàn)確定的。另外,如果在步驟505確定輸入字符是使用多個(gè)單獨(dú)筆劃書寫的,則方法500繼續(xù)到步驟510,在這里計(jì)算無(wú)序函數(shù)D(S)。無(wú)序函數(shù)D(S)是輸入字符的筆劃順序與標(biāo)準(zhǔn)筆劃順序一致程度的量度。例如,在本發(fā)明的實(shí)施例中,對(duì)于漢語(yǔ)來(lái)說(shuō),D(S)可以如下所述地進(jìn)行計(jì)算。
首先,定義d(si,sj),其描述了兩筆劃之間的關(guān)系,其中si=(xi,yi)和sj=(xj,yj)是兩筆劃的起始點(diǎn)坐標(biāo)。然后按照下面的公式定義d(si,sj) (公式2)注意到,公式2符合如上結(jié)合圖3所解釋的限定漢語(yǔ)標(biāo)準(zhǔn)筆劃順序的規(guī)則。將公式2應(yīng)用于圖3所示的漢語(yǔ)字符,可得到d(s1,s2)=1,d(s1,s3)=0,d(s1,s4)=0,d(s2,s3)=1,d(s2,s4)=0,d(s3,s4)=0。
無(wú)序函數(shù)定義了輸入字符的所有筆劃之間的關(guān)系。假設(shè)S=s1s2...sn是一組筆劃序列,那么D(S)可以被定義為D(S)=Σ1≤i<j≤nd(si,sj).]]>(公式3)例如,重新參看圖3中所述的漢語(yǔ)字符,如果該字符是按照其標(biāo)準(zhǔn)順序書寫的,即S=s1s2s3s4,那么使用公式2和3可以計(jì)算得到D(S)=2。如果字符是按照相反順序書寫的,即S=s4s3s2s1,那么可以計(jì)算出D(S)=10。表1給出了按照其它用于創(chuàng)建漢語(yǔ)字符“天(Tian(1))”的筆劃順序的D(S)的其它值的例子。
表1
一般來(lái)說(shuō),根據(jù)標(biāo)準(zhǔn)筆劃順序書寫的輸入字符將具有較小的D(S)值,而以非標(biāo)準(zhǔn)順序書寫的字符將具有較大的D(S)值。
再次參看圖5,在計(jì)算無(wú)序函數(shù)D(S)之后,方法500繼續(xù)到步驟515,在這里將D(S)的值與門限值T(S)進(jìn)行比較。T(S)是基于根據(jù)不同的筆劃順序書寫的模型字符的樣本而根據(jù)經(jīng)驗(yàn)確定的。例如,再次參看圖3,四筆劃字符的門限可被設(shè)置為T=4,由此筆劃序列s1s2s3s4和s2s1s3s4就可以被接受作為標(biāo)準(zhǔn)順序序列,其它的序列則被視為非標(biāo)準(zhǔn)順序。
如果D(S)<T(S),這意味著輸入字符可能是按照標(biāo)準(zhǔn)順序書寫的,那么方法500就會(huì)再次輸出值θ2=a1和θ3=a2。但是,如果D(S)>T(S),這意味著輸入字符不可能是按照標(biāo)準(zhǔn)順序書寫的,那么方法500就會(huì)輸出另一組值θ2=b1和θ3=b2。
參看圖6,以諸如可用于實(shí)現(xiàn)本發(fā)明的上述方法的移動(dòng)電話601的形式圖示說(shuō)明了電子設(shè)備或系統(tǒng)的示意圖。電話601包括連接并與處理器603通信的射頻通信單元602。用戶接口(在本實(shí)施例中,形式上是顯示屏605、鍵區(qū)606和輸入板619)也連接并與處理器603通信。如本領(lǐng)域技術(shù)人員所顯而易見(jiàn)的,當(dāng)顯示屏是觸摸屏?xí)r,輸入板619可以是顯示屏605的一部分。
處理器603包括具有相關(guān)聯(lián)的只讀存儲(chǔ)器(ROM)612的編碼器/解碼器611,ROM 612用于儲(chǔ)存由移動(dòng)電話601發(fā)送或接收的編解碼語(yǔ)音或其它信號(hào)的數(shù)據(jù)。處理器603還包括微處理器613,微處理器613通過(guò)通用數(shù)據(jù)和地址總線617連接到編碼器/解碼器611及其相關(guān)聯(lián)的只讀存儲(chǔ)器(ROM)614、隨機(jī)存取存儲(chǔ)器(RAM)604、靜態(tài)可編程存儲(chǔ)器616和可拆卸SIM模塊618。其中,靜態(tài)可編程存儲(chǔ)器616和SIM模塊618都可以存儲(chǔ)模型字符特征向量和使用輸入板619輸入的輸入字符的表示以及其它信息。
射頻通信單元602是具有公用天線607的合并的接收器和發(fā)射器。通信單元602具有通過(guò)射頻放大器609連接到天線607的收發(fā)器608。收發(fā)器608還連接到合并的調(diào)制器/解調(diào)器610,合并的調(diào)制器/解調(diào)器610將通信單元602連接到處理器603。
微處理器613具有用于連接到例如鍵區(qū)606、屏幕605和輸入板619的端口。只讀存儲(chǔ)器614儲(chǔ)存用于對(duì)如上所述的例如使用筆、觸針或手指在輸入板上書寫的手寫字符的表示進(jìn)行手寫識(shí)別的代碼。
因此,電話601的用戶可以在輸入板619上書寫一個(gè)或多個(gè)字符,電話601將把這些字符都儲(chǔ)存在隨機(jī)存取存儲(chǔ)器(RAM)604、靜態(tài)可編程存儲(chǔ)器616和/或可拆卸SIM模塊618中。然后,電話601的用戶可以發(fā)布命令(例如使用鍵區(qū)606),要求識(shí)別使用輸入板619輸入的手寫字符。
識(shí)別手寫字符的命令可以由微處理器613進(jìn)行處理。通過(guò)使用ROM 612中儲(chǔ)存的代碼,微處理器613隨后將執(zhí)行如上所述的本發(fā)明的方法,通過(guò)將方向特征向量和筆劃段特征向量與模型字符進(jìn)行對(duì)比來(lái)為每個(gè)輸入字符確定匹配候選字符。根據(jù)特殊系統(tǒng)的要求,微處理器613隨后可基于識(shí)別的輸入字符執(zhí)行進(jìn)一步的命令。這樣的進(jìn)一步的命令包括例如發(fā)送包含識(shí)別的輸入字符的下一條消息或者將包含識(shí)別的輸入字符的信息到地址簿中。
因此,本發(fā)明是用于識(shí)別書寫在電子設(shè)備的用戶接口上的手寫字符的改進(jìn)方法和系統(tǒng)。本發(fā)明對(duì)于識(shí)別諸如漢語(yǔ)或日語(yǔ)字符等表意字符尤其有效,這些表意字符中含有許多通常根據(jù)標(biāo)準(zhǔn)順序而書寫的筆劃。通過(guò)分析與輸入字符相關(guān)聯(lián)的筆劃段特征向量和方向特征向量,本發(fā)明增加了正確識(shí)別輸入字符的可能性。
上面的詳細(xì)描述僅僅是提供了優(yōu)選的示范實(shí)施例,而并不想限制本發(fā)明的范圍、適用性或配置。對(duì)該優(yōu)選示范實(shí)施例的詳細(xì)描述給本領(lǐng)域技術(shù)人員提供了使本發(fā)明的優(yōu)選示范實(shí)施例能夠付諸實(shí)施的描述。應(yīng)該理解,在不背離所附權(quán)利要求中所闡述的本發(fā)明的精神和范圍的前提下,可以對(duì)組件和步驟的功能和結(jié)構(gòu)做出各種改變。
權(quán)利要求
1.一種手寫識(shí)別的方法,其包括接收書寫在電子設(shè)備的用戶接口上的手寫輸入字符的表示;從所述輸入字符中提取方向特征向量;從所述輸入字符中提取筆劃段特征向量;和通過(guò)將所述方向特征向量和所述筆劃段特征向量與模型字符進(jìn)行對(duì)比從而確定匹配的候選字符。
2.如權(quán)利要求1所述的方法,其進(jìn)一步包括通過(guò)進(jìn)行平滑、噪聲刪除以及大小歸一化處理來(lái)對(duì)所述手寫輸入字符進(jìn)行預(yù)處理的步驟。
3.如權(quán)利要求1所述的方法,其進(jìn)一步包括對(duì)所述手寫輸入字符進(jìn)行預(yù)分類的步驟。
4.如權(quán)利要求1所述的方法,其進(jìn)一步包括僅將所述方向特征向量與所述模型字符對(duì)比從而提供一個(gè)短的候選字符列表及其相應(yīng)的第一置信分?jǐn)?shù)(vi2)的步驟。
5.如權(quán)利要求4所述的方法,其中所述確定匹配的候選字符的步驟包括將所述短的候選字符列表及其相應(yīng)的第一置信分?jǐn)?shù)(vi2)與所述筆劃段特征向量進(jìn)行對(duì)比的步驟。
6.如權(quán)利要求1所述的方法,其進(jìn)一步包括計(jì)算所述手寫輸入字符的無(wú)序函數(shù)D(S)的步驟。
7.如權(quán)利要求6所述的方法,其中,根據(jù)下述公式來(lái)計(jì)算所述的無(wú)序函數(shù)D(S)D(S)=Σ1≤i≤j≤nd(si,sj),]]>式中 式中si=(xi,yi)且sj=(xj,yj),其中si和sj是兩個(gè)手寫筆劃的起始點(diǎn)。
8.如權(quán)利要求5所述的方法,其中所述將所述短的候選字符列表及其相應(yīng)的第一置信分?jǐn)?shù)(vi2)與所述筆劃段特征向量進(jìn)行對(duì)比的步驟可包括提供相應(yīng)的第二置信分?jǐn)?shù)(vi3);和根據(jù)下述公式將所述第一置信分?jǐn)?shù)(vi2)與所述第二置信分?jǐn)?shù)(vi3)合并vi=θ2·vi2+θ3·vi3,]]>式中θ2+θ3=1,且θ2和θ3是根據(jù)經(jīng)驗(yàn)確定的。
9.如權(quán)利要求8所述的方法,其中θ2和θ3根據(jù)是否D(S)<T(S)而變化,其中,T(S)是經(jīng)驗(yàn)確定的筆劃數(shù)決定的門限,而D(S)是根據(jù)下述公式計(jì)算的無(wú)序函數(shù)D(S)=Σ1≤i≤j≤nd(si,sj),]]>式中 式中si=(xi,yi)且sj=(xj,yj),其中si和sj是兩個(gè)手寫筆劃的起始點(diǎn)。
10.如權(quán)利要求9所述的方法,其中所述匹配的候選字符是具有最大vi值的字符。
11.一種用于手寫識(shí)別的系統(tǒng),其包括微處理器;與所述微處理器可操作地相連的只讀存儲(chǔ)器(ROM);與所述微處理器可操作地相連的可編程存儲(chǔ)器;和與所述微處理器可操作地相連的輸入板;所述微處理器可操作地執(zhí)行存儲(chǔ)在所述ROM中的代碼,以接收書寫在所述輸入板上的手寫輸入字符的表示,從所述輸入字符中提取方向特征向量,從所述輸入字符中提取筆劃段特征向量,通過(guò)將所述方向特征向量和所述筆劃段特征向量與儲(chǔ)存在所述可編程存儲(chǔ)器中的模型字符進(jìn)行對(duì)比來(lái)確定匹配的候選字符。
12.如權(quán)利要求11所述的系統(tǒng),其中,所述處理器通過(guò)進(jìn)行平滑、噪聲刪除和大小歸一化處理,進(jìn)一步可操作地對(duì)所述手寫輸入字符進(jìn)行預(yù)處理。
13.如權(quán)利要求11所述的系統(tǒng),其中,所述微處理器進(jìn)一步可操作地對(duì)所述手寫輸入字符進(jìn)行預(yù)分類。
14.如權(quán)利要求11所述的系統(tǒng),其中,所述微處理器通過(guò)僅僅將所述方向特征向量與所述模型字符進(jìn)行對(duì)比,進(jìn)一步可操作地提供一個(gè)短的候選字符列表及其相應(yīng)的第一置信分?jǐn)?shù)(vi2)。
15.如權(quán)利要求14所述的系統(tǒng),其中,所述微處理器進(jìn)一步可操作地將所述短的候選字符列表及其相應(yīng)的第一置信分?jǐn)?shù)(vi2)與所述筆劃段特征向量進(jìn)行對(duì)比。
全文摘要
本發(fā)明公開一種手寫識(shí)別的方法和系統(tǒng),其對(duì)于識(shí)別包含多個(gè)筆劃的表意字符尤其有效,這些筆劃通常是根據(jù)標(biāo)準(zhǔn)順序書寫的。該方法包括接收書寫在電子設(shè)備的用戶接口上的手寫輸入字符的表示的步驟(步驟105)。然后從所述輸入字符中提取方向特征向量和筆劃段特征向量(步驟125和135)。最后,通過(guò)將所述方向特征向量和所述筆劃段特征向量與模型字符進(jìn)行對(duì)比從而確定匹配的候選字符(步驟145)。
文檔編號(hào)G06K9/80GK1619583SQ200310116550
公開日2005年5月25日 申請(qǐng)日期2003年11月20日 優(yōu)先權(quán)日2003年11月20日
發(fā)明者鎮(zhèn)立新, 葛勇, 黃建成 申請(qǐng)人:摩托羅拉公司