国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      字符識別的制作方法

      文檔序號:6429500閱讀:163來源:國知局
      專利名稱:字符識別的制作方法
      技術領域
      本發(fā)明涉及到一種修改分類系統(tǒng)的方法和裝置。特別地,這種修改可以用來允許一個獨立的用戶分類系統(tǒng)被修改成一個非獨立的用戶分類系統(tǒng)。
      背景技術
      本說明書中所引用到的現(xiàn)有技術不是,也不應該被當作一個公知或任何形式上的現(xiàn)有技術組成公知知識部分的建議。
      手寫體識別系統(tǒng)通常被分成非獨立書寫者,意味著他們被訓練來識別單獨用戶的特別手寫風格,或者是獨立的書寫者,意味著他們被訓練了可以識別任何用戶的書寫。由于非獨立書寫系統(tǒng)(writer-dependent)只需仿效單獨書寫者的風格,所以非獨立書寫系統(tǒng)通??梢援a生比獨立書寫系統(tǒng)要準確得多的識別(對于特別用戶)。
      然而,他們通常要求用戶要輸入大量的訓練信息來允許發(fā)生用戶-特別訓練。相反地,獨立書寫者系統(tǒng)并不要求用戶—特別訓練,因為他們通常是通過來自大量用戶的訓練數(shù)據(jù)文集發(fā)展來的。由于這些系統(tǒng)必須要迎合廣泛的擊鍵上風格迥異和字母信息,他們更傾向于在字符類別之間造成混淆。
      書寫者適應化就是將一獨立書寫者識別系統(tǒng)轉換成一使用用戶提供數(shù)據(jù)的非獨立書寫者系統(tǒng)的過程。適應性系統(tǒng)更具有吸引力,因為他們并不要求用戶執(zhí)行冗長輸入訓練數(shù)據(jù)的過程,而且隨著時間的推移,可以達到非獨立書寫者系統(tǒng)的精確識別。除此之外,他們可以適應用戶書寫風格隨時間發(fā)生的變化。
      在自適應性系統(tǒng)發(fā)展過程中的一個困難就是要確保產生的適應性會改進識別作用。如果實施得不仔細,比如說,通過對被不正確地標記或者是應用了一個壞格式或模糊模式的原型進行概括,適應性過程將會降低特別用戶的總識別率。因此,很多的自適應性系統(tǒng)就要求從書寫者那得到執(zhí)行適應性修改的指導,通過與用戶之間的互相作用來確保用于進行適應性修改的數(shù)據(jù)是很好組成且被正確標記的。關于這一點的實施例在美國專利5,917,924,美國專利5,754,686,美國專利5,544,260,and美國專利5,550,930中有所描述。通過與用戶的相互作用來確保改編(adaptation)中使用的數(shù)據(jù)的格式合格且被正確標記。
      既然這可以減少衰減的適應性修改的發(fā)生,就要求用戶陷入大量可能冗長而乏味的操作中。
      適應性分類機必須要使用一定種類的學習過程來允許該系統(tǒng)接收用戶特別風格。監(jiān)督學習就是一個基于對一系列樣品進行正確標記基礎之上對分類機的行為進行修改的過程(也就是說要提供每一個樣品正確的類別)。然而,這個信息如果沒有與用戶介入的話是無法用在適應性系統(tǒng)中的,因為唯一可得到的標記信息就是分類機本身的產物?;蛘邿o監(jiān)督學習技術(也可以稱為“自組織學習”)并不要求為學習過程的標記樣品,所以在正確的結果未知之處,可以適用于適應性系統(tǒng)。
      競爭性學習是一個無監(jiān)督學習過程,該過程要求一個系統(tǒng)的元素在活動過程中相互之間進行競爭,正如C.von der Malsburg 1973年在《Kybernetik》的1485-100“Self-Organisation of OrientationSensitive Cells in the Striate Cortex”中所列舉的方向敏感神經細胞的自組織學習那樣。同樣地,K.Fukushima 1975年在《BiologicalCybernetics》的20121-136“Cognitrona Self-OrganisingMultilayered Neural Network”中也描述了多重神經網絡的自組織稱做認知機。有一些為競爭性學習技術解釋理由的神經生物學,如在“J.Ambros-Ingerson、R.Granger,和G.Lynch所著的刊于《Science》1990年第247第1344-1348頁的“Simulation of Paleocortex PerformsHierarchical Clustering”中所描述的那樣。
      這里將對關于技術說明的實施例進行進一步地描述。
      V.Vuori、J.Laaksonen、E.Oja和J.Kangas在IEEE ComputerSociety于美國加利福尼亞州的洛杉磯舉行的ICDAR′99的《Proceedingsof the Fifth International Conference on Document Analysis andRecognition》中的“On-line Adaptation In Recognition of HandwrittenAlphanumeric Characters”一文中描述了一個用于手寫字母數(shù)字字符的用戶-特別適應性系統(tǒng),該系統(tǒng)包括各種由三個類別的組合。這包括增加基于一個K-NN搜索之上的原型,惰性化其出現(xiàn)總是壞處多于好處的原型,以及基于“學習-矢量-數(shù)字轉換”對原型的再成型,該“學習-矢量-數(shù)字轉換”在T.Kohonen著,Springer-Verlag 1997年出版的《Volume 30of Springer Series in Information Sciences》中的《Self OrganisingMaps》中有所描述。
      該分類機是基于簡單的“壓縮最近鄰居”原則之上,同時在訓練期間應用半自動原型-聚類算法以壓縮原型。使用各種點到點、點到線和區(qū)域度量的“動力時間-變形(Time-Warping)”被用于計算在輸入和原型之間的相似度量。原型撤消的方法使用監(jiān)督學習(“user-reportedmisclassifications are used to revise the system”在“J.Laaksonen、V.Vuori、E.Oja和J.Kangas”著的“Adaptation of Prototype SetsIn On-line Recognition Of Isolated Handwritten Latin Characters”中有所描述。該系統(tǒng)也由分類間混淆而不是特別的基于分類的書寫變體辨別所促進來做出決定。該方法也是基于二元判定之上的,該二元判定有著“從一系列活躍原型上移開”的混淆性原型。
      1993年7月4-7日巴黎的《Proceedings of the Sixth InternationalConference on Handwriting and Drawing》中第19-21頁的Telecom部分,L.Schomaker、H.Teulings、E.Helsper和C.Abbink提出“Adaptive Recognition Of Online,Cursive Handwriting”,以及L.Schomaker、H.Teulings、G.Abbink和E.Helsper所著并由由美國桑尼布法羅CEDAR組織于1993年5月25-27日出版發(fā)行的IWFHR III中提供了驗證的文章,即“Adaptive Recognition of On-lineConnected-cursive Script for use in Pen-based Notebook Computers”,其中描述了一種基于使用科候能自組織地圖(Kohonen Self OrganisingMap(SOM))的原型擊鍵群束基礎上的草寫體識別系統(tǒng)。所描述的過程,使用一個獨立書寫者擊鍵-過度網絡,用于對輸入的書寫進行識別。
      如果任何上述識別機輸出的前二十個字被發(fā)現(xiàn)是如字典所定義那樣有效,在擊鍵-轉移網絡中的值是“直到,或者目標字在字符輸出表上部,或者實現(xiàn)了最多次數(shù)的重復的情況下,一較小的協(xié)調性增益”。適應性系統(tǒng)包括在擊鍵-轉移網絡中的個體擊鍵解釋的用戶-特別概率。
      1998年L.Heutte、T.Paquet、A.Nosary和C.Hernoux在IEEEComputer Society的《Proceedings of the Fifth InternationalConference on Document Analysis and Recognition》中的“DefiningWriter’s Invariants To Adapt the Recognition Task”中使用形態(tài)學書寫者-特別不變式來改進非在線字符識別(OCR)的識別系統(tǒng)。該技術要求探測和集中書寫者-特別變異,該變異將會用于將上下文的知識結合在一起來消除識別過程中引起的歧義。
      多個方法已經被提出,這些方法使用適應性技術來進行分類機的訓練,比如1998年8月,在S.Connell和A.Jain著的,澳大利亞布里斯班的《Proceedings of the 14th International Conference on PatternRecognition》中,第182-184頁的“Learning Prototypes For On-LineHandwritten Digits”,和G.Hinton、C.Williams和M.Revow所寫的“Adaptive elastic models for character recognition”,以及加州圣馬刁的摩根·考夫曼在其所寫的《Advances in Neural InformationProcessing Systems 4》有所描述。
      同理,S.Connell和A.K.Jain在1999年9月,印度班格洛爾的《Proc.5th International Conference on Document Analysis andRecognition》的第434-437頁的“Writer Adaptation of OnlineHandwritten Models”中描述了一種書寫者適應性修改,該適應性修改旨在基于對詞素識別基礎之上的、且在獨立書寫者模式之內建立一個用戶-特別書寫風格,同時使用該非獨立書寫者模式來再訓練他們的分類機。由于該方法基于訓練隱藏馬克夫模式(Hidden Markov Model(HMM),該改編技術可以被推測只為每一個書寫者實施一次(歸因于巨大的經常性要求再訓練HMM系統(tǒng))。沒有這樣的技術試圖基于用戶輸入執(zhí)行持續(xù)的用戶-特別適應性修改。
      美國專利6,038,343描述了一種將產生書寫者-特別特征向量與一個獨立用戶“普遍識別字典”相結合來改進識別結果的方法。他們使用統(tǒng)計回歸(statistical regression)“為來自輸入字符中特征向量的每個多種選擇的目錄預測書寫者-特別特征向量”。該方法通過將他們與書寫者-特別特征向量相結合,來“糾正”獨立書寫者的特征向量,而該書寫者-特別特征向量被再生地用于為未來用戶輸入向量特征預確定字符。
      美國專利5,917,924使用一適應性權重來修改原型的可能性,該原型在識別過程中作為潛在的匹配對象,并且“僅僅使得權重值在改編模式中變得多樣化”。也就是說,該方法僅根據(jù)用戶的相互作用決定的結果使得原型的權重值(weighting values)發(fā)生變化。
      美國專利5,754,686描述了一種方法,該方法使用了一用戶-特別字典來存儲非獨立書寫者模式?!叭绻R別的可靠性低的話,就要用到警告。作為對警告的反應,用戶或者是操作者能夠決定是否該字符模式應該在用戶字典上進行登記。該模式將被自動評估,評估是為了判斷是否適合被包括在用戶字典中(據(jù)推測使用一個有著現(xiàn)存原型的模糊度量(metric),但是并沒有就如何將用戶-特別字典原型在識別期間與現(xiàn)有獨立書寫者模式相結合提出權利要求。
      美國專利6,256,410描述了一個標準系統(tǒng),該標準系統(tǒng)用于訓練一非獨立書寫者HMM的分類機,用戶-特別訓練數(shù)據(jù)分割使用獨立書寫者模式,同時一系列的字符-基礎模式將會被重復地用訓練數(shù)據(jù)進行訓練。
      美國專利5,319,721描述了一種方法,該方法用于在一個非獨立書寫者系列中逐步形成一系列的獨立用戶原型。如果輸入的擊鍵數(shù)據(jù)使得一個原型與一特定臨界點以內的相匹配,則用戶數(shù)據(jù)與現(xiàn)有的原型相結合,以產生一個非獨立書寫者原型和“一個或更多的與輸入符號有相同標記的起始原型符號“被刪除。如果擊鍵數(shù)據(jù)并不與現(xiàn)有的原型相匹配,一個新的原型就被產生了,再次,一個或多個的同一標記的原型被刪除。
      美國專利5,544,260中描述了一種“使用在為了修改字符原型的錯誤糾正期間提供的信息”,也就是說,使用由用戶所做來更新被錯誤識別的原型的糾錯擊鍵,美國專利5,550,930描述了一種存儲識別結果的方法,并應用戶的請求演示該結果,同時允許該用戶選擇輸入和相應的用于分類訓練的符號。
      美國專利5,285,505描述了一種方法,該方法用于通過強調對于區(qū)別很關鍵字符部分和在字符之間相似的再強調部分“產生字符原型以改進相似形狀字符的識別正確性”。該方法被明確地限定于解決兩個類別的模糊不清,諸如“g”/“y”和“A”/“H”的混淆。

      發(fā)明內容
      在本發(fā)明的第一廣度內,提供了一種手寫字符分類的分類系統(tǒng)修改方法,因此使得分類系統(tǒng)的用戶獨立,分類系統(tǒng)包括多個書寫變體,每一個書寫變體代表了一種各字母的各自風格,所述方法包括a)獲得至少一個手寫字符;b)選擇一個書寫變體代表字符;c)按照選擇修改一個或多個書寫變體。
      通常地,所述方法包括修改書寫變體以反映所選擇的與用戶使用的各自字母風格相對應的書寫變體。
      分類系統(tǒng)包括若干個類別,每一類別代表了一個單獨字母并包括一個或多個書寫邊體,所述方法包括a)選擇一個類別代表字符以因此確定字符代表的字母;以及,b)在各自類別中修改一個或多個書寫邊體。
      每一個書寫變體包括一個或多個原型,每一個原型代表了在各書寫變體的多樣性,所述方法包括a)至少原型中的一些,根據(jù)字符的相似性和各原型確定一個選擇值(value);并且,b)根據(jù)確定的選擇值(value)選擇單獨的一原型。
      所述方法包括根據(jù)選擇的原型選擇類別。
      所述方法包括根據(jù)選擇的原型選擇書寫變體。
      每個原型通常以一個原型向量代表,每一原型向量由多個值(value)組成,每個值定量各原型的獨立特征,在這種情況下,所述確定一選擇值的方法通常包括以下步驟a)確定一個代表字符的特征向量,所述特征向量由多個值所組成,每個值定量各原型的獨立特征;并且,
      b)確定一個代表特征向量和各原型向量之間距離的距離值。
      每一原型包括一個關聯(lián)權重,所述方法通常包括a)根據(jù)權重選擇書寫變體;b)通過修改一個或多個書寫變體的權重來修改書寫變體。
      或者,所述方法可以涉及簡單移動用戶不使用的書寫變體,盡管可以這樣理解,即這樣通常會有較少的正確率。
      通常根據(jù)距離值和各書寫變體相關的權重確定選擇值。
      所述方法通常包括修改權重,至少包括被選擇原型的書寫變體的權重。
      所述方法通常包括選擇具有最低選擇值的原型。
      所述方法修改的權重至少包括下列的至少一個a)為包括被選擇原型的書寫變體降低權重;以及b)為一個或更多的不包括被選擇原型的書寫變體增加權重。
      所述方法通常包括通過預確定量增加或減少書寫變體的權重。
      或者該方法包括a)為每一個要修改的書寫變體選擇一個參考原型;b)為每一個參考原型確定距離值;c)確定一個確定的距離值的平均值;d)根據(jù)各參考原型的距離值和平均距離值修改每一個書寫變體的權重。
      參考原型是對各書寫變體具有最低距離值的原型。
      所述方法使用處理系統(tǒng)來實施,處理系統(tǒng)包括a)一個存儲代表書寫變體的書寫變體數(shù)據(jù)的存儲器;b)一個處理器,所述處理器用于i)獲得手寫字符
      ii)選擇書寫變體;iii)修改一個或更多的書寫變體。
      本發(fā)明的第二廣度內提供了一種裝置,用于修改類別系統(tǒng)以修改書手寫字符因此使得分類系統(tǒng)用戶變得依賴的裝置,所述裝置包括a)一個存儲代表一定數(shù)量書寫變體的書寫變體數(shù)據(jù)的存儲器,每一個書寫變體代表了各個字母的各自風格;b)一個處理器,所述處理器用于i)獲得至少一個手寫字符;ii)選擇一個代表字符的書寫變體;iii)修改書寫變體數(shù)據(jù),因此根據(jù)選擇修改一個或多個書寫變體。
      在此情況中,書寫變體數(shù)據(jù)包括一個與每個書寫變體相關的權重,處理器用于通過修改權重修改書寫變體數(shù)據(jù)。
      所述存儲器用于存儲類別數(shù)據(jù),類別數(shù)據(jù)代表了多個類別,每個類別代表了一個單獨的字母且包括了一個或多個書寫變體。
      存儲器可用于存儲代表原型的原型數(shù)據(jù),每個書寫變體包含了一個或多個原型,每個原型代表了各書寫變體中的多樣性。
      處理器更可以用于執(zhí)行本發(fā)明中所有第一廣度的方法。
      在本發(fā)明第三廣度中提供了一種使用一用戶非獨立分類系統(tǒng)修改手寫字符的方法,所述分類系統(tǒng)包括多個書寫變體,每一個書寫變體代表了各字母的各風格,和各代表用戶依賴性的權重,每個書寫變體包括一個或多個原型,每個原型代表了各書寫變體中的多樣性,所述方法包括a)獲得至少一個手寫字符;b)為至少一些原型,根據(jù)字符的相似性和各原型以確定一個選擇值,書寫變體的權重包括各原型;c)根據(jù)確定的選擇值選擇一單獨的原型;
      d)根據(jù)被選擇的原型分類字符。
      每個以原型向量代表的原型,每個原型向量由多個值組成,每個值定量各原型的各向量,在這種情況下,確定選擇值的方法通常包括a)確定一個特征向量代表字符,所述特征向量由多個值組成,每一個值定量字符的各特征;b)確定一個代表特征向量與各原型向量之間距離的距離值;c)根據(jù)確定的距離值和與各書寫變體相關的權重確定選擇值。
      分類系統(tǒng)包括多個類別,每個類別代表了各字母并包括一個或多個書寫變體,所述方法包括根據(jù)被選擇原型選擇類別以確定由字符代表的字母。
      通常地,根據(jù)本發(fā)明第一廣度中的方法對類別系統(tǒng)進行修改。
      所述方法包括使用一個處理系統(tǒng),處理系統(tǒng)包括a)存儲器用于存儲i)代表書寫變體和相關權重的書寫變體數(shù)據(jù);ii)代表原型的原型數(shù)據(jù);以及b)處理器,處理器用于i)獲得手寫字符;ii)確定選擇值;iii)選擇原型;iv)分類字符。
      本發(fā)明的第四廣度提供了一種使用一用戶非獨立性分類系統(tǒng)分類手寫字符的裝置,所述裝置包括a)存儲器用于存儲i)書寫變體數(shù)據(jù),代表了多個書寫變體,每個書寫變體代表了各字母的各風格,一個與各書寫變體相關的權重,權重代表了書寫變體的用戶非獨立性;ii)原型數(shù)據(jù)代表了一個或多個原型,每個原型代表了各書寫變體中的多樣性;b)處理器,處理器用于i)獲得至少一個手寫字符;ii)為至少一個原型,根據(jù)字符的相似性和各原型確定一個選擇值,書寫變體的權重包括了各原型;iii)根據(jù)被確定的選擇值選擇單獨的一原型;iv)根據(jù)被選擇的原型選擇分類字符。
      在這種情況下,所述存儲器用于存儲代表一定數(shù)量類別的類別數(shù)據(jù),每個類別代表單獨的字母并包括一個或更多的書寫變體。
      處理器因此可以被用于執(zhí)行本發(fā)明的第三廣度的方法。


      通過下面對優(yōu)選但不是僅有實施例的描述,本發(fā)明將會變得非常明顯,說明將會結合附圖來進行,包括附圖1是一個適于執(zhí)行本發(fā)明的一實施例的處理系統(tǒng);附圖2是字母”a”的兩個靜態(tài)書寫變體的實施例;附圖3是字母“a”的兩個動態(tài)書寫變體的實施例;附圖4是字母“a”和字母“d”的兩個相似書寫體實施例;附圖5是一個分類系統(tǒng)機構實施例的圖表;附圖6是一個在分類機決定區(qū)域修改書寫變體全中的實施例的原理圖。
      具體實施例方式
      下面的文字用來描述與所寫說明書和附加權利要求書相適應的描述,目的在于提供一種對本發(fā)明主題更準確的理解。
      現(xiàn)在根據(jù)附圖1來描述一種適于實施本發(fā)明的裝置,該附圖中顯示了一種適于執(zhí)行書寫識別的處理系統(tǒng)10。
      特別地,處理系統(tǒng)10通常包括至少20個處理器,一個存儲器21,一個輸入裝置22,諸如一個圖形輸入板和/或鍵盤,一個如圖顯示的通過總線24與輸入裝置22相聯(lián)的輸出裝置23,諸如顯示器。如圖顯示,還提供了一個外部界面25,以將處理系統(tǒng)與存儲器11相聯(lián),諸如數(shù)據(jù)庫。
      在使用過程中,處理系統(tǒng)被吸收來接收并譯解使用預見的分類系統(tǒng)的書寫文字字符。最初的該分類系統(tǒng)是用戶獨立,然而,處理系統(tǒng)10也被用來修改系統(tǒng),因此使得該系統(tǒng)用戶成為非獨立的,從而增加了字符識別的正確性。
      從這點上,處理系統(tǒng)10可以是任何形式的處理系統(tǒng),比如計算機,筆記本電腦,服務器,專門的硬件,或者其他相同的硬件,這些相同的硬件可以通過執(zhí)行適當?shù)貞么鎯υ陂W存單元21中的應用軟件,被典型地用來執(zhí)行這些技術。
      為了實現(xiàn)這一點,處理系統(tǒng)10實施了一個分類系統(tǒng),該分類系統(tǒng)使用書寫變體來修改字母的各自風格。然后處理系統(tǒng)使用特別書寫者所使用的字母書寫變體的適應性學習。
      字母書寫變體(Letter allographs)仿效單獨字符分類在書面上的迥異風格。也就是,它們代表了一個字符可以被描畫的不同方式。書寫變體可以被定義的,靜態(tài)的,意味著字符的總形狀將一個書寫變體區(qū)別于另一個。字母“a”的靜態(tài)書寫變體實施例如附圖2所示。
      書寫變體也可以是動態(tài)的,書寫變體可能看起來是相似的,但是在動態(tài)擊鍵信息上是不同的(也就是,構成字母的擊鍵次序或方向)。字母“a”的動態(tài)書寫變體實施例在附圖3中有所顯示。特別地,在這個實施例中,這兩個字母有著相似的形狀,但是在版本1中用單個的擊鍵進行描繪,而版本2中是用兩個擊鍵進行描繪。由于書寫變體能夠有一個動態(tài)的和靜態(tài)的意義,所以,對于書寫變體-基礎是有可能適于在在線或離線的狀態(tài)下進行工作。
      獨立書寫者系統(tǒng)必須仿效所有它也許會遇到的可能的書寫變體。然而,用戶在書寫的時候通常對每個字母使用各自的書寫變體。因此,某特別用戶每一次將通常地以相同的風格書寫給定的字母。
      所以,獨立書寫系統(tǒng)將會包括大量的、用戶所不要求的用于識別的書寫變體。這些多余的書寫變體將會降低系統(tǒng)的識別正確率,因為它們可與一個用戶真正使用的不同類中的書寫變體相類似。
      如附圖4中所示實施例。特別地,所有左邊的書寫變體代表了字母“a”,而右邊的書寫變體代表了字母“d”。很清楚地,在這兩個書寫變體之間還有大量的相似之處,帶有明顯的不正確識別的可能性。
      這里顯示的字母“a”書寫變體極少地用于手寫體中,而且在絕大多數(shù)的書寫風格中也不需要用到。獨立書寫系統(tǒng)需要支持這個書寫變體,然而,由于少數(shù)的書寫者會使用這個風格,但是通過允許這個書寫變體,對字母不正確的識別可能性增加了。
      因而,特定人通常不以這樣相似的方式書寫字母“a”和“d”是比較好的,在附圖4中所顯示的兩個書寫變體未必在一個非獨立用戶識別系統(tǒng)中都被要求。
      所以,處理系統(tǒng)適于學習書寫者所使用的書寫變體,并允許同一字母的其他書寫變體被忽視,因此為各自的書寫者改進字符識別。這因此允許處理系統(tǒng)能夠以更高識別正確率支持廣泛范圍內的書寫風格。
      在使用過程中,處理系統(tǒng)10因而可以接收字符,并將所接收的字符、字母以及存儲在數(shù)據(jù)庫11中的書寫變體進行比較。這就允許處理器來確定與字符所對應的字母和書寫變體。
      這通常可以通過比較字符與存儲在數(shù)據(jù)庫11中的原型來實現(xiàn)。該原型以單獨的書寫變體和字母進行組合。通常地,在書寫變體與原型之間相似之處用語選擇原型,該原型大部分的情況下與字符相匹配,因此允許字符被賦值于各字母或書寫變體群組。
      特別地,這通??梢酝ㄟ^根據(jù)特征向量定義字符來實現(xiàn)。在這種情況下,特征向量包括代表字母不同特征的值。原型被作為特征向量進行存儲,允許特征向量和原型之間的距離在特征空間內被測量,因此允許確定最相近的原型。
      然后處理器可以根據(jù)所選擇的字母修改書寫變體,因此表明了該書寫變體是各用戶使用的書寫變體。這通??梢酝ㄟ^在每個書寫變體上的賦予加權值來實現(xiàn),同時處理器)可以用來修改書寫變體的加權值。因此比如,用戶所使用的書寫變體的加權值是可以與其他書寫變體的加權值一起增加或減少的。
      現(xiàn)在對這些技術進行更為詳細的描述。
      特別地,下面是對用于手寫字符書寫變體的競爭性學習算法的說明。在本實施例中,將根據(jù)一個簡單的樣板-匹配分類來對該技術進行描述(特別地,一個歐幾里得-距離的最近-鄰居分類機)。然而,本領域的技術人員將會了解到該過程能夠被用于任何可支持將類別再分成基類的分類機,以及這些基類的隨后的權重。
      除此之外,權重更新過程在度量上是獨立的(metric dependent)而僅僅依賴于一些原型相似性的一些數(shù)字指標。因此,該技術可以應用在距度量上,比如歐幾里得-距離,動力時間-變形,等等)。
      在初始階段,處理器20將會收到輸入的代表考慮中字符的符號。這通常從輸入裝置22中接收到,但是也可以從數(shù)據(jù)庫的字符中檢索到。在任何情況下,處理器20通過給輸入的信號繪圖來執(zhí)行圖案的分類,該輸入信號將會被再處理以便執(zhí)行一些類型的正常化,而變成多重尺寸的特征空間。該處理器因此分配數(shù)值以量化各預先確定的字母的特征,諸如字母的權重,寬度,擊鍵的數(shù)據(jù),最大的擊鍵的長度,或者其他的。繪圖用于產生一個特征向量。
      然后,處理器20應用該特征向量于一系列的分類模式來確定哪個類別是最有可能產生了給定的特征。
      樣板-匹配分類器通過存儲類別的原型樣品(原型)來工作,并通過使用一些相似的度量將輸入特征與原型進行比較的方式,執(zhí)行分類。與輸入特征向量最相近似的原型類別被假定為輸入圖案的類別。比如說,一個簡單的歐幾里得-距離最近鄰居的分類器僅僅存儲一系列訓練樣品的特征向量,并且利用與輸入特征向量之間有著最小的歐幾里得-距離的訓練圖案特征向量,來對輸入圖案進行標記。
      非獨立書寫者的書寫變體訓練的時候會發(fā)生,獨立書寫者分類器必須要包括每一個原型的書寫變體信息。這就意味著每一個訓練樣本都要用類別和書寫變體進行標記。為了標記書寫變體,存在多個半自動的過程。比如說,L.Vuurpijl和L.Schomaker所著的“Finding StructureIn DiversityA Hierachical Clustering Method For theCategorization of Allographs In Handwriting,”,在1997年8月的ICDAR第387到393頁的IEEE標準中描述了成團分級群聚的方法,該方法幫助選擇和為各字母類別的書寫變體進行標記。
      通常地,分類系統(tǒng)的結構如附圖5中所顯示的那樣。因此,一個單獨的分類機將通常包括很多的字母。在這一點上,可以這樣理解,單詞的字母將會包括任意的字母數(shù)字字符、標點符號,或者是表意符號。那么,每一個書寫變體將包括一個或多個的原型,每一個都代表了各個書寫變體的不同。因此,比如說,原型將會被用于解釋尺寸形狀,角度和其他方面的變化。
      因此,對于同一類別中的很多原型,有可能被識別成相同的書寫變體,并且,書寫變體仿效特別字母的特別書寫風格,鑒于每個原型代表了那種書寫風格的例子。比如,在一個最近-鄰居分類機,通常使很多原型來代表同一個類別,這些原型之間有所區(qū)別,同時這些原型仿效在同一類別內特征的多樣性(比如翻譯,旋轉,切斷等等。)相似地,同一書寫變體的很多原型可以仿效該書寫變體書寫中的多樣化。因此,分類機支持很多的字母類別,一個類別支持很多的書寫變體,而一個書寫變體可以支持很多的原型。
      在這個過程中,通過計算每一個原型向量之間的距離和在特征空間之間輸入特征向量來進行分類。這個距離代表了特征向量和原型向量之間的相似性,因此也代表了字符和各原型之間的相似性。然后處理器20根據(jù)最小的距離確定原型的類別為輸入數(shù)據(jù)的標志。因此,處理器20通過最小距離值確定與特征向量相分離的原型向量,并利用這點來確定字符所代表的字母。
      為了支持書寫者-特別的書寫變體的確定,每一個原型的距離值與權重因子相乘,該權重因子取決于它的書寫變體類別。因此,具有很高權重的書寫變體更不可能相匹配,因為較高的權重將會增加距離度量,因此減少權重而增加書寫變體相匹配的可能性將,增加了權重而減少了匹配的可能性。
      初始地,對于相同的無-零值(比如例1)所有書寫變體的權重都是被預設的表明了沒有書寫者-特別參考對于一個書寫變體是給定的。在這一點上,分類的系統(tǒng)是獨立的。
      加上權重,該距離值是為了歐幾里得-距離最近一鄰居分類機而計算的,該計算列舉如下
      &delta;(x)=argmini=1n(Di(x))]]>Di(x)=Wi×‖x-yi‖其中,yi就是原型i的特征向量。
      Wi就是原型i.的共有的書寫變體權重pi∈(Rd,Ω),x就是輸入特征向量,這樣x∈Rd,δ(x)is就是分類機的決策函數(shù),這樣δ(x)Rd→ΩΩ就是類別,這樣Ω={ω1,...,ωn}{p1,...,pm}就是原型。
      權重被確定用來影響用戶所使用的書寫變體。因此,處理器20進行權重改編來修改書寫變體的權重,并且給書寫變體以參考,以使得書寫者更可以使用它。
      因此,為一個輸入的信號選擇一個最匹配的原型顯示了書寫者使用了原型的書寫變體。通常地,在一個簡單的方法中,處理器20通過減少包括通過少量η(學習速率)選擇的匹配原型的書寫變體的權重來改變權重。相似地,處理器20以一個相似的總量增加在各個類別中剩余的書寫變體的權重。在非匹配類別中的書寫變體權重是不被修改的。
      因此,對于匹配類別中每一個書寫變體iWi=Wi-η如果i=c=Wi+η否則其中,c就是匹配原型的書寫變體數(shù)量,并且η就是學習速率參數(shù)。
      可以這樣理解,即分類機將不可能總是與正確的類別相匹配。
      一個例子,一個壞格式的“a”可能與“d”相匹配,這樣會導致對減少的權重進行更新,該權重是書寫者可能不使用的、“d”的書寫變體的權重。然而,隨后書寫者所使用的“d”書寫變體的正確匹配將會增加未使用的書寫變體權重并且減少正確性的書寫變體。
      隨后權重的修改應該緩慢,以避免不正確的分類給不正確的書寫變體以太多的權重。然而,學習速率越高,則將會發(fā)生改編更迅速,結果是更高的識別準確性。因此就有必要來為學習速率的大小找到一個平衡。
      可以這樣理解,這可以通過使得該學習速率的大小對于用戶可調來實施。因此,一般地被存儲在數(shù)據(jù)庫11中的學習參數(shù)η可以被用戶調節(jié),以允許學習速率可以被調節(jié)。這就允許用戶建立一個希望的學習水平,而這樣的學習水平如果有太多的不正確發(fā)生的時候是可以被降低的。
      確保權重不是太大或太小也是比較恰當?shù)?。如果一個書寫權重太小,那么那個書寫變體(因此有可能是類別)的判定邊界就可能侵占一個周邊的類別,而這可能會引發(fā)分類機做出不正確的類別確定。因此,如果該權重增加太多,特征向量未必會比與其中包括的原型相匹配。在該實施例中,這將會導致整個的書寫變體被匹配程序排除在外,盡管這些有被偶爾使用的機會。
      通常地,如果修改會推動上述的權重在上升臨界點之上,或者在降低臨界點之下,則通常為權重提供較高或較低的臨界點,使得該權重是被掌控在臨界點上的。再次,如果需要的話,可以做準備以允許用戶調節(jié)臨界點。
      確保權重不要太大,如果用戶在以后的日子里改變了他們的寫作風格,允許書寫變體優(yōu)先增加。
      分類機決定區(qū)域上的書寫變體的權重修改的效果在附圖6中有所顯示。特別地,當類別3中的權重增加了,則這將會推動初始判定邊界5(實線部分)靠近類別4,從而形成了一個新的判定邊界6(虛線部分),這就使得類別3和類別4的匹配具有更高的可能性。
      上述簡單權重修改過程可以承受一系列的問題。
      特別地,一系列的書寫變體可能會幾乎完全匹配(也就是,在特征向量和不同的書寫變體距離之間只有很小的區(qū)別),表明沒有強有力證據(jù)證明使用書寫變體而不用其他的。相反地,在書寫變體痕跡上有很大的區(qū)別,表明了一個書寫變體風格優(yōu)先于另一個。
      在第一種情況下,權重更新應該小,反映出缺乏對正確的書寫變體識別的信任。比較起來,在第二種情況下,權重更新應該大,以確保書寫變體可以被迅速識別和再優(yōu)先考慮。
      因此,權重應該將書寫變體群的最小距離進行比較(也就是,每一個書寫變體的最匹配原型的距離),以及成比例地更新這些值的權重。以這種方式,書寫變體被制作來跟另一個進行競爭,因為每一個書寫變體距離結果都對剩余書寫變體的權重修改有影響。
      為了實施這種權重更新,處理器20首先確定包括字符的類別。這是通過如上述將處理器20設置于與字符最相似的原型之上來實現(xiàn)的。一旦這實現(xiàn)了,處理器20將執(zhí)行為該類別中每一個書寫變體群確定最小距離的操作。這通過為每一個書寫變體確定特征向量和最近似原型向量之間的距離來實現(xiàn)。
      處理器20隨后就將確定類別中書寫變體的最小距離意義平均數(shù),并且使用這個來更新每一個權重。特別地,為特定書寫變體所做的權重修改是基于書寫變體最小距離之間以及平均數(shù)距離之間的區(qū)別之上的。為了確保很大的距離不會對平均數(shù)產生很大的變化所有的距離將會被轉換成一個指數(shù)的格式,格式列舉如下對于每一個匹配的類別中書寫變體iMi=argminjn(Dj)]]>
      Ei=e-Mi]]>E&OverBar;=&Sigma;inEin]]>wi=wi+η×(E-Ei),其中,η是學習率參數(shù)。
      使用該程序,具有低于平均距離的最小距離的書寫變體將會有更大的Ei值(因為當x→∞時,e0=1和1im e-x→0),導致書寫變體權重的消極更新,因為平均數(shù)將會小于Ei.。Ei.高于平均數(shù)距離越大,權重更新將會越大。
      因此,匹配很差的書寫變體將會隨著權重增值進行更新,該更新增值取決于與平均數(shù)相比較Ei有多小。進一步地,模糊結果(最小書寫變體距離沒有很重大的不同)將會產生非常小的權重更新,因為所有的距離將不會離平均數(shù)太遠。
      上述的程序是自動的,因此不要求用戶的介入。特別地,因為該過程是不受控制的,在做出不正確判定的情況下,無法得到來自用戶或另一個來源的反饋,以達到正確的字符識別。
      然而,如果可得到輸入信號的識別額外信息(比如,上下文一語言(contextual-language)模式),在權重的適應性修改過程中可支持一些監(jiān)督(supervision)。在這種情況下,權重更新會延遲直至所有的識別程序都被執(zhí)行了,最后的結果將可以被用于修改或驗證分類機的非最終相似性度量(similarity metrics)。
      比如說,權重更新將只在分類機判定與識別機產生的最后判定相匹配的時候被執(zhí)行。因此如果分類機選擇了字母“d”做為最可能的匹配,但是后來處理概括了字母真正的是“a”,那么權重更新將不會發(fā)生。
      或者,大多數(shù)的識別機系統(tǒng)為字母選擇產生某些種類的置信水平,而這可以與權重更新過程合成一體,這樣就會使得更新與對字母正確和明確識別的信任水平成比例。
      而且,用戶需要提供反饋,如果處理器20確定了錯誤的字母用戶可以將一個正確字母的標示,允許處理器20相應地來調整書寫變體的權重。
      相應地,上述的過程提供了字母書寫變體的競爭性學習過程。這個適應性的學習過程能夠通過最小化特別用戶不使用的字母書寫變體識別的可能性來提高手寫字符識別系統(tǒng)的正確率。
      比較適當?shù)氖?,在上述的硬件實施中,權重被存儲在?shù)據(jù)庫11中。相應地,可以根據(jù)用戶辨別機來存儲權重。這就允許不同的系列的權重與不同的用戶被存儲。依次地,這允許處理系統(tǒng)10被用來為一定數(shù)量不同的用戶分類書寫。在這樣的情況下,每次來自不同用戶的書寫被分析,辨別機被用來為字符的辨別和隨后的權重修改選擇合適的權重。
      依次允許一個單獨的中心處理器10被選擇來辨別從一定數(shù)量用戶的書寫。這可以使用,比如在計算機網絡上、基本環(huán)境,比如互聯(lián)網,從而允許一個單獨的處理系統(tǒng)通過一個網址或其他的來分析不同用戶遞交的書寫。
      本發(fā)明也可以說廣泛地涉及到包括部分、元素和特征,或者在本申請文件的說明書中所單獨地或集體地引用或顯示的特征,在任何或者所述兩個或更多部分、元素或特征的組合,以及這里提及的本領域中與本發(fā)明有關的已知等同的特別完整物,盡管是分別提出的,但仍然可以被認為是等同的。
      盡管已經詳細描述了優(yōu)選實施例,但需要理解的是,對于熟悉本領域的人員而言,可在不背離本發(fā)明上文和下文權利要求中所主張保護范圍內進行各種變化、替代以及修改。
      因此比如,代替修改書寫變體的權重,該方法可以解決簡單地將用戶不使用的書寫變體移走。這可能在個案分析基礎上,因此在使用一個使用過的書寫變體被確定后,所有其他的將被從類別中排除。或者,這可以跟權重修改相結合,也就是,如果書寫變體的權重被修改得超過預期數(shù)目,書寫變體將被從分類系統(tǒng)上移走。
      權利要求
      1.一種對手寫字符進行分類使得分類系統(tǒng)的用戶獨立的的分類系統(tǒng)的修改方法,所述分類系統(tǒng)包括多個書寫變體,每一個書寫變體代表一種各字母的各自風格,所述方法包括a)獲得至少一個手寫字符;b)選擇一個代表所述字符的書寫變體;c)按照選擇修改一個或多個所述書寫變體。
      2.如權利要求1所述的方法,包括修改書寫變體以反映所選擇的與用戶使用的各自字母風格相對應的書寫變體。
      3.如權利要求1或2所述的方法,所述分類系統(tǒng)包括多個類別,每一個類別代表一個單獨字母并包括一個或多個書寫變體,所述方法包括a)選擇一個代表所述字符的類別,以確定所述字符代表的字母;以及,b)在各自類別中修改一個或多個書寫變體。
      4.如權利要求1或3所述的方法,每一個書寫變體包括一個或多個原型,每一個原型代表在各書寫變體的多樣性,所述方法包括a)對至少原型中的一些,根據(jù)字符的相似性和各原型確定一個選擇值;以及b)根據(jù)確定的選擇值選擇單獨的一個原型。
      5.如權利要求4所述的方法,包括根據(jù)選擇的原型選擇類別。
      6.如權利要求4或5所述的方法,包括根據(jù)選擇的原型選擇書寫變體。
      7.如權利要求4到6的任何一項所述的方法,每個原型表示為一個原型向量,每一個原型向量由多個值組成,每個值定量各原型的各特征,確定選擇值的方法包括a)確定一個代表字符的特征向量,所述特征向量由多個值組成,每個值定量各字符的各特征;以及b)確定一個代表特征向量和各原型向量之間距離的距離值。
      8.如權利要求1到7的任何一項所述的方法,每一個書寫變體都包括關聯(lián)權重,所述方法包括a)根據(jù)權重選擇書寫變體;以及b)通過修改一個或多個書寫變體的權重來修改書寫變體。
      9.如權利要求7和8所述的方法,根據(jù)距離值和與各書寫變體相關的權重確定選擇值。
      10.如權利要求8或9所述的方法,包括修改至少包括被選擇原型的書寫變體的權重。
      11.如權利要求8到10的任何一項所述的方法,包括選擇具有最低選擇值的原型。
      12.如權利要求8到11的任何一項所述的方法,所述修改權重的方法包括下列的至少一個a)為包括被選擇原型的書寫變體降低權重;以及b)為一個或多個不包括被選擇原型的書寫變體增加權重。
      13.如權利要求12所述的方法,包括通過預定量增加和/或減少書寫變體的權重。
      14.當權利要求12從屬于權利要求7時,如權利要求12所述的方法,包括a)為每一個要修改的書寫變體選擇一個參考原型;b)為每一個參考原型確定距離值;c)確定所述確定距離值的平均值;d)根據(jù)各參考原型的距離值和平均距離值修改每一個書寫變體的權重。
      15.如權利要求14所述的方法,所述參考原型是對各書寫變體具有最低距離值的原型。
      16.如權利要求1到14的任何一項所述的方法,通過使用處理系統(tǒng)來實施,所述處理系統(tǒng)包括a)存儲器,存儲代表書寫變體的書寫變體數(shù)據(jù)b)處理器,用于I)獲得手寫字符;II)選擇書寫變體;以及III)修改一個或多個書寫變體。
      17.一種用于修改類別系統(tǒng)以對書手寫字符進行分類以使分類系統(tǒng)用戶變得非獨立的裝置,包括a)存儲器,存儲代表多個書寫變體的書寫變體數(shù)據(jù),每一個書寫變體代表各個字母的各自風格;以及b)處理器,用于i)獲得至少一個手寫字符;ii)選擇一個代表所述字符的書寫變體;iii)修改書寫變體數(shù)據(jù),以根據(jù)選擇來修改一個或多個書寫變體。
      18.如權利要求17所述的裝置,所述書寫變體數(shù)據(jù)包括與每個書寫變體相關的權重,所述處理器用于通過修改權重修改書寫變體數(shù)據(jù)。
      19.如權利要求17或18所述的裝置,所述存儲器用于存儲類別數(shù)據(jù),所述類別數(shù)據(jù)代表多個類別,每個類別代表一個單獨的字母且包括了一個或多個書寫變體。
      20.如權利要求17到19的任何一項所述的裝置,所述存儲器用于存儲代表原型的原型數(shù)據(jù),每一個書寫變體包括一個或多個原型,每一個原型代表各書寫變體的變化。
      21.如權利要求17到20的任何一項所述的裝置,所述處理器用于執(zhí)行權利要求1到16的任何一項所述的方法。
      22.一種使用一個用戶非獨立分類系統(tǒng)對手寫字符進行分類的方法,所述分類系統(tǒng)包括多個書寫變體,每一個書寫變體代表各字母的風格,且具有代表用戶依賴性的權重,每個書寫變體包括一個或多個原型,每個原型代表各書寫變體中的變化,所述方法包括a)獲得至少一個手寫字符;b)為至少一些原型,根據(jù)字符的相似性和各原型確定一個選擇值,書寫變體的權重包括各原型;c)根據(jù)所述確定的選擇值選擇一單獨的原型;以及d)根據(jù)所述選擇的原型對所述字符進行分類。
      23.如權利要求22所述的方法,每個原型表示為一個原型向量,每一個原型向量由多個值組成,每個值定量各原型的各特征,確定選擇值的方法包括a)確定一個代表字符的特征向量,所述特征向量由多個值組成,每個值定量各字符的各特征;以及b)確定一個代表特征向量和各原型向量之間距離的距離值;c)根據(jù)確定的距離值和與各書寫變體相關的權重確定選擇值。
      24.如權利要求22或23所述的方法,所述分類系統(tǒng)包括多個類別,每個類別代表各字母且包括一個或多個書寫變體,所述方法包括根據(jù)選擇的原型選擇類別以確定由字符代表的字母。
      25.如權利要求22到24的任何一項所述的方法,根據(jù)權利要求1到15的任何一項所述的方法對類別系統(tǒng)進行修改。
      26.如權利要求22到25的任何一項所述的方法,包括使用處理系統(tǒng),所述處理系統(tǒng)包括a)存儲器,用于存儲i)代表書寫變體和相關權重的書寫變體數(shù)據(jù);以及ii)代表原型的原型數(shù)據(jù);以及b)處理器,用于i)獲得手寫字符;ii)確定選擇值;iii)選擇原型;以及iv)對字符進行分類。
      27.一種使用用戶非獨立性分類系統(tǒng)對手寫字符進行的裝置,包括a)存儲器,用于存儲i)代表多個書寫變體的書寫變體數(shù)據(jù),每個書寫變體代表各字母的各風格和一個與各書寫變體相關的權重,所述權重代表書寫變體的用戶非獨立性;以及ii)原型數(shù)據(jù)代表一個或多個原型,每個原型代表各書寫變體中的變化;b)處理器,用于i)獲得至少一個手寫字符;ii)對至少一些原型,根據(jù)字符的相似性和各原型確定一個選擇值,所述書寫變體的權重包括各原型;iii)根據(jù)所述確定的選擇值選擇單獨的一個原型;iv)根據(jù)所述選擇的原型選擇對字符進行分類。
      28.如權利要求27所述的裝置,所述存儲器用于存儲代表多個類別的類別數(shù)據(jù),每個類別代表單獨的字母且包括一個或多個書寫變體。
      29.如權利要求27或28所述的裝置,所述處理器用于執(zhí)行權利要求22到26的任何一項所述的方法。
      全文摘要
      本發(fā)明提供了一種修改分類系統(tǒng)(scheme)來分類手寫字符以使得分類系統(tǒng)用戶非獨立的方法。所述分類系統(tǒng)包括了多個書寫變體,每一書寫變體代表了各字母的各自風格。所述方法包括獲得至少一手寫字符,隨后選擇一代表了字符的書寫變體。隨后根據(jù)選擇修改一個或多個書寫變體,從而反映與用戶使用的字母風格相對應的事實和書寫變體。
      文檔編號G06K9/68GK1571977SQ02820473
      公開日2005年1月26日 申請日期2002年10月15日 優(yōu)先權日2001年10月15日
      發(fā)明者喬納森·利·納珀 申請人:西爾弗布魯克研究有限公司
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1