国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      對(duì)手寫字符進(jìn)行解碼的設(shè)備及方法

      文檔序號(hào):6429501閱讀:160來源:國知局
      專利名稱:對(duì)手寫字符進(jìn)行解碼的設(shè)備及方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種將輸入到計(jì)算機(jī)或者其它處理設(shè)備中的手寫字符進(jìn)行釋義和解碼的方法,尤指一種筆跡識(shí)別的方法,該方法是將個(gè)體字符分解成一個(gè)或者多個(gè)原始的子筆劃。
      背景技術(shù)
      本說明書中提到任何現(xiàn)有技術(shù)不是也不應(yīng)被認(rèn)為是,這些現(xiàn)有技術(shù)構(gòu)成了公知知識(shí)的一部分的一種承認(rèn)或者是任何形式的建議。
      現(xiàn)有技術(shù)處理設(shè)備,例如手持計(jì)算機(jī),用來對(duì)通過手寫數(shù)據(jù)輸入的用戶指令進(jìn)行解碼。其它設(shè)備要求用戶使用偽手寫體的格式輸入數(shù)據(jù)。掌上電腦就是一例,它使用的專用輸入格式是涂鴉。按照該輸入格式,用戶在觸摸屏上按預(yù)定動(dòng)作移動(dòng)塑料觸筆將數(shù)據(jù)輸入手持計(jì)算機(jī),在觸摸屏上,每一個(gè)字符有一個(gè)“筆劃”,在大多數(shù)情況下,與一個(gè)實(shí)際的字符相象。
      這些系統(tǒng)的優(yōu)點(diǎn)是可攜帶設(shè)備很小,但正因?yàn)樵O(shè)備太小而不具備一個(gè)可用大小的鍵盤,為了輸入數(shù)據(jù),需要用戶學(xué)習(xí)人造“語言”。
      由于用戶的字體是千差萬別的,因而能夠自動(dòng)識(shí)別不同用戶的字體是很困難的。這就限制了安裝在計(jì)算機(jī)設(shè)備上的手寫識(shí)別系統(tǒng)在商業(yè)上的應(yīng)用。因此,就迫切需要一種系統(tǒng),能夠識(shí)別不同用戶的字體而不必強(qiáng)迫用戶必須按照設(shè)備能識(shí)別的字體來書寫才能被系統(tǒng)識(shí)別。
      大多數(shù)字符識(shí)別系統(tǒng)都是將一輸入信號(hào)進(jìn)行某種分割來辨認(rèn)數(shù)據(jù)的基本元素,以減小輸入噪聲電平。分區(qū)也能縮減特征提取期間使用的信息量,能通過模式識(shí)別技術(shù)來處理輸入信號(hào)的抽象特征。
      在手寫識(shí)別系統(tǒng)的預(yù)處理階段,將每一個(gè)輸入的字符分成多個(gè)子筆劃元素。然后把多個(gè)子筆劃元素輸入到特征提取模塊或者直接用于模式分類。在草書或者連筆體的識(shí)別系統(tǒng)中,單個(gè)筆劃可能表示不止一個(gè)字母,因而分割是用于識(shí)別潛在的字母分割點(diǎn)。
      本研究組織已經(jīng)提出了一些分區(qū)技術(shù),包括基于人體運(yùn)動(dòng)神經(jīng)系統(tǒng)特征的一些簡單方法。例如,在曲率最大點(diǎn)、關(guān)鍵點(diǎn)和速率極值點(diǎn)或者這些技術(shù)的組合(例如,尋找曲率最大點(diǎn)和速率最小點(diǎn)一致的點(diǎn))進(jìn)行分區(qū)。在其它的研究中還提供了使用彈道姿態(tài)的檢測技術(shù),使用獨(dú)立組件分析筆劃,在筆劃分割中使用了常規(guī)性和奇異性的概念。
      上述過程使用筆跡生成作為分割的基礎(chǔ),其它技術(shù)是基于感知過程。可視解碼字母的關(guān)鍵在于感知筆劃的局部關(guān)聯(lián)位置,因而,位置極值點(diǎn)在對(duì)字母形狀的識(shí)別起到很重要的作用。基于分割標(biāo)準(zhǔn)的感知包括x軸方向上的極值點(diǎn)(X-extrema)和y軸方向上的極值點(diǎn)(Y-extrema)、尖端(cusps)和筆劃間的交點(diǎn)。
      筆劃分割在某種程度上能提高手寫識(shí)別系統(tǒng)的準(zhǔn)確度,然而也是識(shí)別錯(cuò)誤產(chǎn)生的一個(gè)主要根源。當(dāng)選擇分割點(diǎn)時(shí),大多數(shù)基于動(dòng)作筆劃分割算法都設(shè)有數(shù)字門限值,這會(huì)導(dǎo)致結(jié)構(gòu)不嚴(yán)禁的字分裂出的筆劃不一致。圖2b)表示的是對(duì)寫的很糟糕的字母a的不正確的分割。
      在此例中,使用筆劃分割技術(shù)把連體的字母a以較直的線性莖(stem)分開,莖頂部的曲率極值點(diǎn)作為一個(gè)分割點(diǎn)。圖2a)顯示的是正確的分割點(diǎn)(由叉號(hào)表示的)。然而,在圖2b)中的環(huán)形體中有一個(gè)曲率極值點(diǎn),缺少了標(biāo)識(shí)字母莖起點(diǎn)的期望尖端,導(dǎo)致對(duì)筆劃的不正確分割。
      速度也可以用來分割,既然手寫是由一系列的彈道性的動(dòng)作產(chǎn)生的(也就是說從起點(diǎn)到頂點(diǎn)是一個(gè)加速的過程,然后在目標(biāo)點(diǎn)減速)。高速度的分割通常是徑直的,而低速通常在曲率極值點(diǎn)上。然而,速度也要取決于門限值的問題,另外,用戶在寫一筆劃時(shí)可能會(huì)有停頓,這就會(huì)產(chǎn)生無效的分割點(diǎn)。如圖3所示,字母a的采樣點(diǎn)是由方塊表示的。采樣點(diǎn)之間的距離可以推斷出下筆的速度(假設(shè)采樣速率是恒定的),因此距離大表示速度快,兩個(gè)采樣點(diǎn)離的越近表示下筆速度越慢。例如在莖頂部的低速(和高曲率)區(qū)域可以被看作是莖頂部尖點(diǎn)的采樣的聚合,在莖底部的小勾處也是如此。然而,還有另一個(gè)低速區(qū)域(在圓形區(qū)域左側(cè)),是作者在下筆時(shí)猶豫而產(chǎn)生的。因此如果字母a寫的清晰規(guī)范,基于速度的分割就會(huì)有不一致的結(jié)果。
      感知(perceptual)分區(qū)技術(shù),例如把Y-extrema作為分割點(diǎn),通常不需要考慮門限值的問題,不需要一個(gè)數(shù)值來判斷一分割點(diǎn)是否是一個(gè)局部極值點(diǎn)。然而,這些技術(shù)都會(huì)出現(xiàn)不一致的分割。在圖4a)中,字母a的分割,如圖中叉號(hào)所示,位于起筆附近的縱向最高點(diǎn)(Y-extremum)。然而第二個(gè)字母a,如圖4b)所示,與第一個(gè)字母是一樣的,在這個(gè)位置上就不是縱向最高點(diǎn),筆劃趨于平行。
      大多數(shù)其它的分割算法都受此問題困擾,尤其是對(duì)于書寫極不規(guī)范的字母更是如此。由于筆劃分割不易實(shí)現(xiàn)且易出錯(cuò),很多系統(tǒng)都不采用筆劃分割,直接對(duì)用戶原始寫的沒有經(jīng)過分割的筆劃進(jìn)行處理。那些采用筆劃分割的系統(tǒng)通常采用一些彈性匹配過程來消減不一致的分割。
      香港大學(xué)計(jì)算機(jī)科學(xué)系于1998年3月在技術(shù)報(bào)告HKUST-CS98-07的“Elastic Structural Matching For Recognizing Online HandwrittenAlphanumeric Characters”一文中公開了利用曲線極值點(diǎn)將筆劃分成多個(gè)線性分割區(qū)的方法。然而,他們還注明“如果書寫很不規(guī)范,一個(gè)平滑的筆劃有可能被分成多個(gè)部分”,這就會(huì)導(dǎo)致不正確的分割。為了解決這個(gè)問題,他們使用了一些規(guī)則用來檢測無效的分割,把不正確的分割區(qū)重新組合成一筆。
      世界科技出版公司于1999年出版的被編入機(jī)器感知及人工智能叢書的《手寫體識(shí)別的進(jìn)展》(Advances In Handwriting Recognition)一書中,其34卷第153-162頁的“Handwritten word Recognition-TheApproach Proved By Practice”一文中,公開了一種商用光學(xué)讀檢驗(yàn)系統(tǒng),利用在垂直速度上的過零點(diǎn)來對(duì)手寫連筆字進(jìn)行分割。然后,將分割后的子筆劃與彈性匹配識(shí)別器中的基本元素集進(jìn)行匹配。
      世界科技出版公司于1999年出版的被編入機(jī)器感知及人工智能叢書的《手寫體識(shí)別的進(jìn)展》(Advances In Handwriting Recognition)一書中,其34卷第225-234頁的“Global Methods forStroke-Segmentation”一文公開了基于等價(jià)曲線擬合將離線圖像進(jìn)行筆劃分割。在這種方法中,使用立方b-splines首先用曲線來擬合在曲線極值點(diǎn)的分割。
      1993年10月13-16日,在NC的達(dá)累姆的《關(guān)于模糊理論和技術(shù)的第二屆國際會(huì)議記錄》(Proceedings of the 2thInternationalConference on Fuzzy Theory and Technology)的“A Fuzzy OnlineHandwriting Recognition SystemFOHRES,”一文中,使用模糊邏輯來表示筆速和方向,用一組語言變量形成的模糊邏輯規(guī)則集來進(jìn)行筆劃分割。分割后的筆劃作為模糊特征提取的初值。
      1997年8月18-20日,在德國烏爾姆舉行的第四屆國際文檔分析與識(shí)別會(huì)議(4thInternational Conference Document Analysis andRecognition,ICDAR)上,在“Recognizing Letters in OnlineHandwriting Using Hierarchical Fuzzy Inference”一文中提出了一種將在水平正切方向上的尖和點(diǎn)分成部分筆劃集(Pstrokes,Partialstrokes)的筆劃分割方法。該算法使用角平滑系統(tǒng)(而不是通常使用的點(diǎn)位置平滑)不會(huì)扭曲筆軌跡中不連慣的部分(例如,尖部)。
      世界科技出版公司于1996年9月2-5日在英國的科爾徹斯特出版的《手寫體識(shí)別的進(jìn)展》(Advances In Handwriting Recognition)一書的第169-176頁的“Detection Of Extreme Points of OnlineHandwritten Scripts”一文中公開了一個(gè)魯棒的局部曲線極值點(diǎn)檢測算法,該算法是基于手寫識(shí)別的字母對(duì)數(shù)正態(tài)理論,在1995年的《兩年一次的第七屆國際書法協(xié)會(huì)記錄》(Proceedings of the 7thBiennialConference of the International Graphonomics Society)的126-127頁的“A Delta Lognormal Model for Handwriting Generation,”一文中也公開了此算法,把筆劃分割成原始的成分,使用角信號(hào)密度和一階交叉點(diǎn)進(jìn)行相加。
      1997年8月18-20日,在德國烏爾姆舉行的第四屆國際文檔分析與識(shí)別會(huì)議(4thInternational Conference Document Analysis andRecognition,ICDAR)上,“Perceptual Model of Handwriting DrawingApplication to the Handwriting Segmentation Problem”一文提出了基于檢測感知定位點(diǎn)集來進(jìn)行建模和分割的方法?;旧希钦摇盀?zāi)難”點(diǎn),這些點(diǎn)被定義成不連慣點(diǎn),如提筆、急轉(zhuǎn),尖端,和“感性的(perceptual)”點(diǎn),包括拐點(diǎn),X軸和Y軸方向的極值點(diǎn),和筆劃的交叉點(diǎn)。
      美國專利6,275,611公開了一種字符識(shí)別系統(tǒng),該系統(tǒng)包括在“局部角變化最大且超過設(shè)置的門限值”,對(duì)這些點(diǎn)進(jìn)行筆劃分區(qū)。也可參見2001年8月14日的“Handwriting Recognition Device,Method andAlphabet,With Strokes Grouped Into Stroke Sub-Structures”一文。美國專利5,740,273公開了該分割算法的全文。同樣地,美國專利5,889,889公開了把筆劃分割應(yīng)用到手寫字符識(shí)別器中,用來檢測一些通過該規(guī)則被標(biāo)識(shí)的被認(rèn)為是方向突然變化的點(diǎn),提筆產(chǎn)生的點(diǎn)就是如此。在美國專利6,044,174中,在以參數(shù)形式的手寫輸入系統(tǒng)中用到了同樣的分割過程,該系統(tǒng)用來在“角和尖部,在此位置上方向會(huì)突然變化”進(jìn)行壓縮、重構(gòu)和分割筆劃。
      在美國專利6,137,908中描述的過程是識(shí)別Y-extrema,作為識(shí)別筆劃的預(yù)處理過程。在這些極值點(diǎn)之間的點(diǎn)也要被提取出來,以“幀(frame)”的形式存儲(chǔ),為識(shí)別系統(tǒng)所使用。
      同樣地,美國專利5,610,996公開了一種使用一系列弧(arcs)作為識(shí)別初值(primitives),“弧的起點(diǎn)和終點(diǎn)在Y-extrema間”在該文件中還公開了另一種分割模式,如X-extrema和X-Y extrema的組合。
      美國專利4,024,500公開了一種使用X-Y extrema把連筆字分成字符(而不是彈道的原始元素)。
      美國專利5,854,855提出了使用速度輪廓來對(duì)筆劃進(jìn)行分割,并“在手寫輸入中將每一筆的邊界與所選擇的最小速度結(jié)合起來”。
      美國專利5,577,135公開了在Y-extrema將筆劃分割,會(huì)產(chǎn)生一系列的提筆和下筆的筆劃,這些筆劃被使用在隱藏Markov模型(HMM)識(shí)別系統(tǒng)中。在美國專利5,878,164中公開了另一種HMM識(shí)別系統(tǒng),根據(jù)預(yù)定義的邊界條件(如提筆或者尖端)將筆劃分成字母或者初始元素。
      每一個(gè)現(xiàn)有技術(shù)都試圖介紹一種新技術(shù),用來解決識(shí)別手寫輸入文本的問題。每一種技術(shù)可能會(huì)有一些改進(jìn),但是都沒有提供一個(gè)魯棒的系統(tǒng)能夠解決上述描述的所有問題。

      發(fā)明內(nèi)容
      廣義地講,本發(fā)明提供了一種書寫字符識(shí)別方法,包括將一輸入字符順序地與一系列存儲(chǔ)的字符模型之一進(jìn)行比較,比較步驟進(jìn)一步包括下列步驟依照與當(dāng)前字符模型相關(guān)的分割模式,將該輸入字符分成一個(gè)或者多個(gè)分割區(qū);依據(jù)與當(dāng)前字符模型相關(guān)的分割模型,評(píng)估所述一個(gè)或者多個(gè)分割區(qū),評(píng)估會(huì)生成一個(gè)分值,該分值用來衡量與分割模型的一致性程度;對(duì)于一系列字符模型中的多個(gè)模型重復(fù)所述比較步驟;選擇分值最高的字符模型,將該輸入字符作為與該字符模型最相關(guān)的字符。
      更可取的是,識(shí)別的字符是一個(gè)字母、數(shù)字或者標(biāo)點(diǎn)符號(hào)。
      更可取的是,執(zhí)行將輸入字符分解成一個(gè)或者多個(gè)分割區(qū)步驟,每一個(gè)分割區(qū)最小長度,據(jù)下列公式得出lmin=&lambda;&Sigma;i=2n||pi-pi-1||]]>其中l(wèi)min=分區(qū)的最小長度pi=點(diǎn)i的坐標(biāo)值n=在一筆劃中的點(diǎn)數(shù)λ=最小門限值更可取的是,如果依據(jù)與目前字符模型相關(guān)的分割模式不能將該輸入字符分割,那么目前字符模型就不能與該輸入字符匹配。
      更好地,評(píng)估過程得到的分值接近理想狀態(tài)。
      更好地,評(píng)估過程使用了模糊邏輯規(guī)則。
      更好地,每一個(gè)字模型與多個(gè)分割模式有關(guān),分割模式能夠識(shí)別一個(gè)字符的不同書寫形式。
      更好地,用于將輸入字符分解成一個(gè)或者多個(gè)分割區(qū)的不同的規(guī)則可以根據(jù)不同字符模型而變化。
      本發(fā)明也提供了一個(gè)裝置,該裝置包括一個(gè)輸入界面,用于響應(yīng)觸筆的移動(dòng)并隨即產(chǎn)生一個(gè)輸入刺激(stimulus);一個(gè)存儲(chǔ)器;一個(gè)處理器,用于接收所述輸入刺激和處理所述輸入刺激,所述處理器能夠適于執(zhí)行本發(fā)明所述的方法。
      本發(fā)明公開了手寫字符識(shí)別的筆劃分割過程。依據(jù)評(píng)估過的模型改變分割算法會(huì)產(chǎn)生用于特征提取和分類的筆劃元素的一致而魯棒的集合。也描述了此分割過程的一個(gè)模糊邏輯分類器的例子。


      通過下列描述使本發(fā)明是顯而易見的,僅通過舉例的方式,這些具體例子是優(yōu)選的但不限于這些具體例子,下述是對(duì)附圖進(jìn)行說明,其中圖1是本發(fā)明一個(gè)實(shí)施例,圖中有一個(gè)處理系統(tǒng),該處理系統(tǒng)用來接收用戶輸入,根據(jù)本發(fā)明后面的實(shí)施例還能處理用戶輸入;圖2a)和2b)是一個(gè)書寫規(guī)范的字母a和書寫不規(guī)范的字母a;圖3表示如何將速度分割用于釋譯字母“a”,和與此相關(guān)的其它問題;圖4a)和4b)是使用y軸極值來對(duì)字母“a”進(jìn)行解碼的問題的例子示意圖;圖5表示的是字母“a”的分割圖;圖6表示的是字母“b”的分割圖;圖7表示的是字母“B”的分割圖;
      圖8a)、8b)和8c)分別表示字母“B”的三種不同的分割圖;圖9表示的是字母“E”的分割圖;圖10表示的是基于線性定位度的模糊分組成員;圖11a)-d)表示的是使用在字符識(shí)別中的同類筆劃元素的選擇。
      具體實(shí)施例方式
      為了更好地理解本發(fā)明的主題,通過以下的適于書面描述的方式和附加的權(quán)利要求方式來闡述本發(fā)明。
      下面的例子對(duì)本發(fā)明實(shí)施的更詳細(xì)的描述。這些例子僅僅是為了舉例,并不限制本發(fā)明。
      本發(fā)明提供了一種手寫字符識(shí)別的方法。同時(shí)也提供了一個(gè)實(shí)施該方法的設(shè)備。在附圖中,列舉了本發(fā)明的特征,用數(shù)字編號(hào)來標(biāo)識(shí)不同的部分。
      本發(fā)明具體實(shí)施例中描述的方法可以使用圖1中的處理系統(tǒng)來實(shí)現(xiàn)。
      尤其是,處理系統(tǒng)10通常包括至少一個(gè)處理器20,一個(gè)存儲(chǔ)器21,一個(gè)輸入設(shè)備22,如圖形輸入板和/或觸摸屏,輸出設(shè)備23,如顯示器,這些設(shè)備通過如圖1中所示的總線24連接在一起。圖中還有一個(gè)外部接口25,用于將處理系統(tǒng)10與存儲(chǔ)介質(zhì)11(如數(shù)據(jù)庫)相連,另外,還需要一個(gè)觸筆,用戶可以通過觸筆將輸入文本輸入到處理系統(tǒng)10。
      使用過程中,處理系統(tǒng)10能將模型和規(guī)則數(shù)據(jù)存放在數(shù)據(jù)庫11中,并能對(duì)數(shù)據(jù)庫11進(jìn)行檢索。處理器能夠通過接收經(jīng)輸入設(shè)備22輸入的手寫數(shù)據(jù),處理手寫數(shù)據(jù)并將其與存儲(chǔ)在存儲(chǔ)介質(zhì)上的數(shù)據(jù)進(jìn)行比較。這些依次使得處理系統(tǒng)能夠識(shí)別手寫文本中的字符。因此,可以將處理系統(tǒng)10理解成是任意形式的處理系統(tǒng),如計(jì)算機(jī),便攜機(jī)、服務(wù)器、專用硬件以及類似物。
      現(xiàn)在詳細(xì)描述一下處理系統(tǒng)10的操作。
      在此描述一個(gè)用于手寫字符識(shí)別的筆劃分割的特定模型方案,包括特定模型算法的例子。也給出了優(yōu)化該過程的技術(shù)。
      很顯然,就現(xiàn)有技術(shù)而言,上面描述的筆劃分割方法不能總是產(chǎn)生一致而連續(xù)的分割點(diǎn),這是由于手寫輸入中末端的易變性。問題部分是由于字母識(shí)別是一個(gè)獨(dú)立操作的分割過程。這就意味著不利的位置會(huì)產(chǎn)生不正確的結(jié)果,而且這些分割不成功之處在于在分類器中還很難檢測和校正,分類器是試圖將單一的字符與分割區(qū)聯(lián)系起來。
      由于筆跡的模糊不清性,根據(jù)上下文,一個(gè)圖形符號(hào)可能會(huì)表示不同的意思;例如,基于句法或者語義上的信息(如字典或者字符語法)對(duì)模糊不清的字母的解釋是不同的。同樣地,包括單個(gè)字母的單個(gè)筆劃和子筆劃需要用上下文來解釋,以確保能夠正確理解其含義。
      本發(fā)明具體實(shí)施例中使用了特定模型筆劃分割法,延遲對(duì)手寫筆劃的分割,與分類過程融合。這樣就會(huì)導(dǎo)致更多的在分割過程中使用的字母模型所期望的有關(guān)分割點(diǎn)的類型的信息。對(duì)筆劃進(jìn)行分割的度量單位是基于,當(dāng)前字符的預(yù)期結(jié)構(gòu),當(dāng)前字符是從要識(shí)別的字符序列中的一個(gè),因而不需要單獨(dú)的全局分割過程。
      每一個(gè)字母原型(prototype),手寫體或者字符模型與輸入進(jìn)行比較,輸入的筆劃將會(huì)被分割,根據(jù)任何可識(shí)別關(guān)鍵點(diǎn)的技術(shù),就能將筆劃分割成更加一致的筆劃元素(primitives)。另外,為一特定字母模型找到期望的分割點(diǎn)的分割過程如果處理失敗,就意味著不需要再對(duì)此模型進(jìn)行分析,能夠有效地挑選與一般輸入的結(jié)構(gòu)不匹配的模型。
      在實(shí)踐中,用戶使用觸筆輸入一字符,處理器是通過執(zhí)行程序來實(shí)現(xiàn)本發(fā)明的實(shí)施例的,首先檢驗(yàn)輸入是否是字母“a”,試圖按照字母“a”對(duì)輸入進(jìn)行分區(qū)。然后繼續(xù)檢驗(yàn)輸入是否是其它可能的數(shù)據(jù)實(shí)體,例如,′b′-′z′,對(duì)每一個(gè)嘗試進(jìn)行評(píng)分。通過這種方法,可得到與輸入字母最接近的匹配的模型。在后面會(huì)介紹一個(gè)適合的評(píng)分模式。
      考慮到每一個(gè)字母可能有多種不同的書寫方式,所以每一個(gè)字母可以有多個(gè)模型。例如,有些人可能將字母“z”寫得側(cè)看起來象大寫的字母“N”,而有些人寫得看起來象數(shù)字“3”。
      需要注意的是,每一個(gè)字母模型都需要一個(gè)分割過程來處理,一些模型使用相同或者相似的分割點(diǎn),意味著可以將這些點(diǎn)存儲(chǔ)起來用以減少經(jīng)常的分割處理過程。例如,字母“y”和“g”都有相似的尾部分割區(qū),這些相似的尾部分割區(qū)就可以如上所述被儲(chǔ)存起來。
      識(shí)別初始是進(jìn)行一些簡單的預(yù)處理,除掉信號(hào)的噪聲。包括采樣點(diǎn)平滑技術(shù)(如果采樣過程有噪聲的話),移去筆劃起點(diǎn)和終點(diǎn)之間的鉤狀(hooks),否則會(huì)使識(shí)別過程混亂。使采樣點(diǎn)符合規(guī)范,可通過移去重復(fù)的點(diǎn)或者重新采樣的點(diǎn),使采樣點(diǎn)間的距離最小。
      筆跡分類器中定義的每一個(gè)字母模型定義了一個(gè)分割過程,該過程在輸入筆劃時(shí)執(zhí)行。分割能產(chǎn)生分割點(diǎn)集,用來把一筆劃分成一系列的子筆劃。該算法一次適用一個(gè)筆劃。為了避免筆劃產(chǎn)生的分割區(qū)過小而在結(jié)構(gòu)上無關(guān),需基于筆劃全長來計(jì)算子筆劃間的最小距離lmin=&lambda;&Sigma;i=2n||pi-pi-1||]]>其中
      pi=點(diǎn)i的坐標(biāo)值n=筆劃中點(diǎn)的個(gè)數(shù)λ=最小長度門限值(通常設(shè)為.05)分割對(duì)采樣點(diǎn)進(jìn)行算法疊代直到標(biāo)識(shí)一個(gè)在當(dāng)前字母模型中定義的潛在分割點(diǎn)。如果找不到正確的點(diǎn),算法返回一個(gè)失敗,表明輸入與所期望的字母模型不一致。否則,如果通過分割筆劃而得到筆劃的兩個(gè)子筆劃比lmin大,就在該點(diǎn)分割該筆劃,繼續(xù)處理該筆劃剩余部分。如果每一個(gè)子筆劃都小于lmin,就忽略該分割點(diǎn),繼續(xù)處理。當(dāng)所有分割點(diǎn)都正確標(biāo)識(shí)好后,過程結(jié)束,表明識(shí)別器分割成功。
      值得注意的是,字母模型可以使用手寫字母預(yù)期結(jié)構(gòu)表明的任意分割技術(shù),一些模型可能不需要任何的筆劃分割。例如,簡單的模型‘c’和‘o’可以與輸入直接匹配,不需要試圖把筆劃化簡成子筆劃。通常,通過這些單一的彈道姿態(tài)不能導(dǎo)出任何信息,通過與未分割的筆劃進(jìn)行匹配,能避免由傳統(tǒng)分割技術(shù)產(chǎn)生的問題(例如,由于作者的風(fēng)格,平滑速度曲率輪廓能夠在任意點(diǎn)進(jìn)行分割)。
      下面的這些例子列舉了各種模型的分割過程。如圖5所示,關(guān)鍵點(diǎn)30和關(guān)鍵點(diǎn)32用于為一筆寫成的手寫體字母‘a(chǎn)’的分割。
      假設(shè)模型期望在字母莖32的頂部對(duì)筆劃進(jìn)行分割,分割算法先搜索第一個(gè)Y軸方向上的最低點(diǎn)30,然后試圖找到Y(jié)軸方向上的最高點(diǎn)。如果找到了Y軸方向上的最高點(diǎn)32,就把該點(diǎn)標(biāo)記為一個(gè)分割點(diǎn)。值得注意的是,Y軸方向上的最低點(diǎn)30不是用來分割的,只是確保能正確地找到Y(jié)軸方向上的最高點(diǎn)32。沒有最初的搜索Y軸方向上的最低點(diǎn)30,就有可能使找到的Y軸方向上的最高點(diǎn)不正確(如圖4b)所示)。另外值得注意的一點(diǎn)是,此過程能夠使上述有關(guān)圖1到圖3中的所有例子找到正確的分割點(diǎn)。
      一個(gè)反例,用戶輸入一個(gè)手寫‘c’,與上述定義的‘a(chǎn)’的模型匹配,雖然找到了Y軸方向上的最低點(diǎn),可是也找不到隨后的Y軸方向上的最高點(diǎn)。終點(diǎn)將不會(huì)與分割點(diǎn)匹配。因而,分割過程失敗,表明輸入不與通常的模型結(jié)構(gòu)匹配,就將模型從潛在的匹配列表中移出。
      而上述分割過程在很多字母模型上都工作良好,其它的模型將需要不同的算法。一個(gè)簡單的例子,圖6表示字母模型‘b’的分割。
      對(duì)這一筆寫成的手寫的字母‘b’進(jìn)行分割,找到第一個(gè)Y軸方向上的最低點(diǎn)40,將其作為分割點(diǎn),產(chǎn)生一筆垂直筆劃,剩下部分的形狀是‘o’。圖7中給出了一個(gè)更加復(fù)雜的分割過程。
      圖7中是一筆寫成的字母‘B’的筆劃模型,第一個(gè)分割點(diǎn)是第一個(gè)Y軸方向上的最低點(diǎn)50。隨后,找到Y(jié)軸方向上的最高點(diǎn)52,然后是一個(gè)Y軸方向上的最低點(diǎn)54,作為第二個(gè)分割點(diǎn)。圖8示出分割后的字母。
      最初垂直的線性子筆劃如圖8a)所示,接著是曲線‘p’子筆劃如圖8b)所示,后面是“側(cè)著的-u”字筆劃如圖8c)所示。此分割方法是魯棒的,能隨著曲率和速度的變化而變化,對(duì)各種不同的字體產(chǎn)生一致的分割。另一方面,現(xiàn)有技術(shù)中的全局分割過程使手寫字母產(chǎn)生不一致的分割,如前述一例,依賴于曲率和下筆的一致性速度。
      使用X軸和Y軸方向上的極值點(diǎn)并不能將所有的字母模型一致地分割。例如,圖9中的經(jīng)過兩筆寫成的字母‘E’。
      使用X軸最低點(diǎn)檢測分割點(diǎn)60和分割點(diǎn)62是無效的,尤其對(duì)于有某些旋轉(zhuǎn)或者棱角的字母,使用Y軸最低點(diǎn)也不一定能產(chǎn)生正確的分割區(qū)。對(duì)于這種手寫字,在第一筆中最大的角度變化的兩個(gè)點(diǎn)用來分割。值得注意的是,不需要使用角度門限值來找這些點(diǎn),因通過對(duì)每一個(gè)點(diǎn)的曲率值進(jìn)行排序就能很容易地找到曲線中的兩個(gè)最高點(diǎn)??赡苓€有更復(fù)雜的處理;例如,確保分割點(diǎn)能夠產(chǎn)生等長度的子筆劃。總的來說,為了確保得到正確的分割點(diǎn),也存在基于輸入筆劃的結(jié)果特征的任意復(fù)雜的特定模型分割法。
      上述對(duì)于字母“a”的分割過程對(duì)于所有的在尖端后是一個(gè)曲線區(qū)域、隨后是一個(gè)向下的筆劃(如,‘d’,‘g’,‘u’,‘y’等的手寫體)的字母模型都適用。總之,當(dāng)與相似的結(jié)構(gòu)模型進(jìn)行匹配時(shí),用到存儲(chǔ)的子筆劃。進(jìn)一步地,在分類前將子筆劃轉(zhuǎn)化成特征表示,將特征向量存儲(chǔ)起來以防止重復(fù)的特征提取。
      一些筆劃分割技術(shù)需要子筆劃的距離和曲率信息。為了避免每次都重新計(jì)算這些值,可以在使用筆劃分割時(shí),需要?jiǎng)?chuàng)建一個(gè)輔助數(shù)據(jù)結(jié)構(gòu),用來存儲(chǔ)筆劃中每一點(diǎn)的距離和曲率的值。
      下面舉例描述在手寫字符識(shí)別中如何使用特定模型筆劃分割?;谀:壿嫹诸惼鞯睦樱夹g(shù)人員很顯然能夠?qū)⒋思夹g(shù)與能夠使用筆劃分割的分類器模型結(jié)合起來,該過程很容易合并到結(jié)構(gòu)化的(如彈性匹配)和統(tǒng)計(jì)的分類器中。
      一種對(duì)手寫字符的不精確度和字體變化進(jìn)行建模的方法是使用模糊邏輯,可以定義一個(gè)不很精確的規(guī)則集。模糊邏輯分類器通過為模糊模型分配一個(gè)輸入信號(hào)成員度,依靠特征與模型中的模糊規(guī)則的匹配程度。在1998年的關(guān)于圖案識(shí)別的國際會(huì)議(International Conference onPattern Recognition,ICPR’98)上提出的第1121-1123頁的″A New FuzzyGeometric Representation for On-Line Isolated CharacterRecognition″一文;和1997年出版的《圖案識(shí)別》一書的第30卷第10期第1591-1604頁的“Fuzzy Feature Description of HandwritingPatterns”一文進(jìn)一步描述了用于手寫字符識(shí)別適宜的模糊邏輯分類器。
      舉例來說,定義直線的模糊邏輯規(guī)則可能包括下列集合垂直線(VL),水平線(HL),正斜線(PS)和負(fù)斜線(NS)。顯然,大多數(shù)線不會(huì)與預(yù)定集合完全匹配,通常對(duì)于這些集合來說都有一個(gè)成員度(degree ofmembership)。因此,模糊邏輯定義了一個(gè)邏輯集的概念,而集成員是連續(xù)的而不是離散的。圖10列舉了一個(gè)直線的組成員函數(shù)集,是標(biāo)準(zhǔn)化定義(以度定義)。
      圖10顯示了一系列象鐘擺似曲線。例如,標(biāo)號(hào)為VL的曲線,表示垂直線,定義一個(gè)線集,當(dāng)與一個(gè)選中的水平線比較時(shí),角度變化的范圍從略低于45°到略高于135°,接近90°的權(quán)值高。相似的曲線如水平線(HL),正斜線(PS)和負(fù)斜線(NS)。
      本例中模糊邏輯分類器由定義各個(gè)字母模型的規(guī)則集構(gòu)成。根據(jù)這些規(guī)則將筆劃和子筆劃與同類的筆劃形狀進(jìn)行比較。規(guī)則還包括相關(guān)的位置信息用來區(qū)分具有相似字母。使用的語言元素包括如圖11a)中的象‘o’的曲線(OC),圖11b)中的象‘c’的曲線(CC),如11c)圖中的象‘d’的曲線(DC),和圖中的相對(duì)于右側(cè)的垂直曲線(RVC)。
      對(duì)每一個(gè)子筆劃,基于對(duì)筆劃結(jié)構(gòu)的簡單分析,計(jì)算其在這些初始值集中的成員度,使用下列信息絕對(duì)筆劃曲線,就筆劃邊界框而論的起點(diǎn)和終點(diǎn)的位置,起點(diǎn)和終點(diǎn)間線的方向。
      位置初值是左(LEFT)、右(RIGHT)、頂(TOP)、中(CENTRE)和底(BOTTOM),用來表示在字母邊界框中筆劃的位置,也使用上述的直線初值(VL,HL,PS,NS)。一些典型的規(guī)則為規(guī)則‘a(chǎn)’(OC|CC) &amp; LEFT &amp; CENTRE,(VL|RVC) &amp; RIGHT規(guī)則‘b’VL &amp; LEFT,(OC|DC) &amp; RIGHT &amp; BOTTOM
      規(guī)則‘c’CC規(guī)則‘d’(OC|CC) &amp; LEFT &amp; BOTTOM,VL &amp; RIGHT上述規(guī)則中,符號(hào)‘|’表示模糊或(OR),符號(hào)‘&amp;’表示模糊與(AND),圓括號(hào)表示的邏輯優(yōu)先級(jí)最高,逗號(hào)表示使用模糊AND的子筆劃組成(例如,逗號(hào)左邊的表達(dá)式使用第一子筆劃評(píng)估,右邊的表達(dá)式使用第二子筆劃評(píng)估,使用模糊AND將結(jié)果合并。
      舉例來說,第一規(guī)則如下字母“a”是一個(gè)象‘o’的曲線或者左邊象‘c’的曲線且重心在字母的垂直方向,有一個(gè)垂直線或者相對(duì)于右側(cè)的垂直曲線,定位在字母的右側(cè)。
      這些規(guī)則描述了每一個(gè)字母模型的初值是如何組成的,不能表示筆劃是如何被分解為初值的。每一個(gè)規(guī)則與一個(gè)特定模型分割規(guī)則聯(lián)合,在規(guī)則被評(píng)估之前,使用的特定模型分割規(guī)則來將輸入筆劃進(jìn)行分割。
      規(guī)則規(guī)則‘a(chǎn)’MINY→MAXY規(guī)則‘b’MINY規(guī)則‘c’規(guī)則‘d’MAXY→MINY···規(guī)則‘k’MINY,MAXY,MINX
      ···MAXY表示查找下一個(gè)Y軸方向上的最高點(diǎn)。MINY表示查找下一個(gè)Y軸方向上的最低點(diǎn)。符號(hào)“→”表示先發(fā)現(xiàn)的是在左邊定義的點(diǎn),但是不用來分割;確保后續(xù)點(diǎn)能正確定位。值得注意的是,模型‘c’的分類僅需要單個(gè)筆劃,因此不需要進(jìn)行分割。包括多個(gè)分割點(diǎn)的一個(gè)規(guī)則的例子中的模型‘k’,順序出現(xiàn)。
      一旦使用特定模型規(guī)則進(jìn)行筆劃分割,子筆劃通過在同源筆劃類中的成員度進(jìn)行分類。這些成員值用來評(píng)估結(jié)構(gòu)規(guī)則,用來表示輸入與字母模型的匹配程度。每一個(gè)字母模型同樣被評(píng)估,輸入根據(jù)具有最高模糊成員值的模型進(jìn)行分類。
      總之,按照每一個(gè)規(guī)則對(duì)每一個(gè)輸入進(jìn)行測試,每一個(gè)規(guī)則進(jìn)一步地定義了所采用的分割方法,輸入字符與被測試的字符是一樣的。如果對(duì)于一個(gè)特殊字符模型不能使用分,因?yàn)閷?duì)于規(guī)則,輸入字符與被測試字符不一致,那么在分類階段就會(huì)是零分或者很低分值。
      廣義上說,在應(yīng)用的說明書中引用或者表示的本發(fā)明包括部分、元素和特征,逐個(gè)地或者全體地,兩個(gè)或者多個(gè)所述部分、元素或者特征的一些或者所有組合,在此提到的特定數(shù)字在與本發(fā)明相關(guān)的領(lǐng)域是已知的,這些已知知識(shí)與本發(fā)明是融為一體的即使是分別提出的。
      盡管上面對(duì)優(yōu)選實(shí)施方式進(jìn)行了詳細(xì)地描述,但本領(lǐng)域的普通技術(shù)人員仍然可以在不脫離下述請(qǐng)求保護(hù)的本發(fā)明范圍的情況下,做出各種改變、替換和更改。
      權(quán)利要求
      1.一種對(duì)書寫字符進(jìn)行識(shí)別的方法,包括將給定的輸入字符順序地與一系列存儲(chǔ)的字符模型之一進(jìn)行比較,比較步驟進(jìn)一步包括以下步驟根據(jù)與當(dāng)前字符模型相關(guān)的分割模式,將給定的輸入字符分割成一個(gè)或者多個(gè)分割區(qū);根據(jù)與當(dāng)前字符模型相關(guān)的分區(qū)模型,評(píng)估所述一個(gè)或者多個(gè)分割區(qū),以產(chǎn)生一個(gè)用來表示與所述模型一致性程度的分值;對(duì)一系列字符模型中的多個(gè)字符模型重復(fù)所述比較步驟;和選出分值最高的字符模型,并對(duì)輸入字符進(jìn)行分類,分為與所述字符模型相關(guān)的字符。
      2.如權(quán)利要求1所述的方法,其特征在于,用于識(shí)別的字符是字母、數(shù)字或者標(biāo)點(diǎn)符號(hào)。
      3.如權(quán)利要求1或2所述的方法,其特征在于,進(jìn)行將輸入字符分割為一個(gè)或者多個(gè)分割區(qū)的步驟,以便每個(gè)分割區(qū)最小長度由下列公式得出lmin=&lambda;&Sigma;i=2n||pi-pi-1||]]>其中l(wèi)min=分割區(qū)最小長度pi=點(diǎn)i的坐標(biāo)n=筆劃中點(diǎn)的個(gè)數(shù)λ=最小長度門限值
      4.如前述任何一項(xiàng)權(quán)利要求所述的方法,其特征在于,若根據(jù)與當(dāng)前字符模型相關(guān)的分割模式不能將所述輸入字符進(jìn)行分割,就認(rèn)為當(dāng)前字符模型與所述給定的輸入字符不匹配。
      5.如前述任何一項(xiàng)權(quán)利要求所述的方法,其特征在于,所述評(píng)估過程得到的分值接近理想值。
      6.如權(quán)利要求5所述的方法,其特征在于,所述評(píng)估過程使用模糊邏輯規(guī)則。
      7.如前述任何一項(xiàng)權(quán)利要求所述的方法,其特征在于,每一個(gè)字符模型可與多個(gè)分割模式相關(guān),以識(shí)別同一個(gè)字符的不同形式。
      8.如前述任何一項(xiàng)權(quán)利要求所述的方法,其特征在于,將輸入字符分解成一個(gè)或者多個(gè)分割區(qū)所遵循的不同規(guī)則可隨不同的字符模型而變化。
      9.一種對(duì)手寫字符進(jìn)行識(shí)別的裝置,包括輸入界面,用來響應(yīng)觸筆的移動(dòng)以產(chǎn)生輸入刺激;存儲(chǔ)器;處理器,用于接收并處理所述輸入刺激,所述處理器適用于權(quán)利要求1到8任何一項(xiàng)所述的方法。
      全文摘要
      本發(fā)明公開一種能夠識(shí)別手寫字符的方法,包括以下步驟比較步驟,將某一輸入的字符依次與一系列的存儲(chǔ)字符模型中的一個(gè)進(jìn)行比較。所述比較步驟進(jìn)一步包括以下步驟分割步驟,根據(jù)字符模型的分割模式,將某一個(gè)輸入字符分解成一個(gè)或者多個(gè)部分;評(píng)估步驟,根據(jù)這一個(gè)或者多個(gè)部分與字符模型中的對(duì)應(yīng)部分的分割模型,對(duì)這一個(gè)或者多個(gè)部分進(jìn)行評(píng)估,產(chǎn)生一個(gè)分值,該分值表示這一個(gè)或者多個(gè)部分與分割模型的一致性程度;針對(duì)一系列字符模型中的多個(gè)字母模型重復(fù)所述比較步驟;選擇分值最高的字符模型,并把輸入字符作為與該字符模型最相關(guān)的字符。
      文檔編號(hào)G06K9/22GK1571979SQ02820474
      公開日2005年1月26日 申請(qǐng)日期2002年10月15日 優(yōu)先權(quán)日2001年10月15日
      發(fā)明者喬納森·利·納珀 申請(qǐng)人:西爾弗布魯克研究有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1