專利名稱:字符識別方法
本發(fā)明是關(guān)于字符識別方法以及關(guān)于適用于字符識別方法、圖形識別方法的合適的圖形的連續(xù)性判別方法。
日文的平假名、片假名、數(shù)字、羅馬字母等的字符識別雖然比較容易,但是由于漢字的筆劃數(shù)較多,而且種類也多,所以與前者的字符相比,其識別就困難得多了。
作為包括漢字在內(nèi)的字符的識別方法,有先取字符的大的特征作為大致分類,然后將大致分類的字符再進(jìn)一步細(xì)致分類,從而進(jìn)行目的字符的識別。而作為這種字符識別的大致分類的方法,可以舉出的一個例子是,由本申請人申請的在本申請的申請日尚未公開的專利申請昭61-28490號里所記述的方法。該方法是對新提出的每1個字符的輸入文字圖形,測出與該輸入文字圖形的外接框相接的部分的形狀,然后對所檢測出的形狀進(jìn)行編碼,根據(jù)所編碼的數(shù)據(jù)來進(jìn)行輸入文字圖形的識別。然而,本發(fā)明則是關(guān)于后者的進(jìn)一步細(xì)致分類的方法,作為這種細(xì)分類法的原來的例子有圖形匹配法。
而字符識別是采用圖形讀出器等把印刷在紙上的文字變換成雙值信號,并對此進(jìn)行識別處理的,可是由于圖形讀出器的黑點(diǎn)補(bǔ)償?shù)臍埩粽`差與光學(xué)式MTF(modulation transfer function調(diào)制傳遞函數(shù))的影響,甚大的相關(guān)雜音就會與雙值信號相重疊,這就使字符識別變得更加困難。
進(jìn)而,在該雙值信號里還會附加如下的變形、失真。
(1)線寬度變動a.因圖形讀出器內(nèi)的限制電平的變動而引起的,
b.因字型、字體的差異而引起的。
(2)相位變動a.因字型、字體的差異而引起的,b.因印刷介質(zhì)的反射導(dǎo)致失真、光學(xué)系統(tǒng)的失真而引起的。
(3)字形傾斜變動a.由在前處理部的旋轉(zhuǎn)補(bǔ)正剩余誤差而造成的,b.由植字后的鉛字塌邊而引起。
而作為原來的字符識別的圖形匹配法,雖然具有難于受大分類法的外接框的設(shè)定誤差的影響的優(yōu)點(diǎn),但另一方面,作為前處理需要把輸入字符的規(guī)格正規(guī)化,這時就會產(chǎn)生插補(bǔ)而引起人為的舍入誤差。
鑒于上述存在的這個問題,本發(fā)明的目的在于提供難于受線寬度變動、相位變動及字形傾斜變動影響的字符識別方法。
在字符識別方法和圖形識別方法中,有時需要將線段與點(diǎn)以及點(diǎn)狀的雜音加以區(qū)別以進(jìn)行識別,因此,本發(fā)明的目的還在于提供一種容易識別線段圖形的圖形連續(xù)性判別方法。
本發(fā)明的第1個字符識別方法,其特征是,在對輸入字符數(shù)據(jù)及參照字符數(shù)據(jù)中的一方進(jìn)行細(xì)線條處理的同時,而另一方則原封不動,然后分別存儲在輸入字符存儲器Mi及參照字符存儲器Mr里,在相互略為正交的雙向,分別掃描讀出輸入字符存儲器Mi及參照字符存儲器Mr的各個對應(yīng)部分,判斷有無包含關(guān)系,具有包含關(guān)系時,原則上消去輸入字符存儲器Mi及參照字符存儲器Mr的對應(yīng)部分的數(shù)據(jù)。
本發(fā)明的第2個字符識別方法,其特征是,在對輸入字符數(shù)據(jù)及參照字符數(shù)據(jù)中的一方進(jìn)行細(xì)線條處理的同時,把另一方面保持原樣不動,然后分別存儲輸入字符存儲器Mi及參照字符存儲器Mr里,在相互略為正交的雙向,分別掃描讀出輸入字符存儲器Mi及參照字符存儲器Mr的各個對應(yīng)部分,判斷其有無包含關(guān)系,在具有包含關(guān)系的時候,原則上消去輸入字符存儲器及參照字符存儲器的對應(yīng)部分的數(shù)據(jù),然后再把剩余在輸入字符存儲器Mi及參照字符Mr的數(shù)據(jù)分別積累在相互略為正交方向的軸線上。
本發(fā)明的第3個字符識別方法,其特征是,在把輸入字符數(shù)據(jù)及參照字符數(shù)據(jù)中的一方進(jìn)行細(xì)線條處理的同時,而另一方則保持原封不動,并且對此進(jìn)行處理,把該原封不動的字符數(shù)據(jù)中的特定字符的識別的容許部分除掉,然后分別存入輸入字符存儲器Mi及參照字符存儲器Mr,在相互略為正交的雙向分別掃描讀出輸入字符存儲器Mi及參照字符存儲器Mr的各對應(yīng)部分,并判斷其有無包含關(guān)系,在具有包含關(guān)系的時候,原則上消去輸入字符存儲器Mi及參照字符存儲器Mr的對應(yīng)部分的數(shù)據(jù),同時,在保持原封不動的字符的兩端部包含有另一方已作線條處理的字符的點(diǎn),而在其內(nèi)側(cè)不包含有2個以上的連接點(diǎn)時,消去輸入字符存儲器及參照字符存儲器的對應(yīng)部分的數(shù)據(jù)。
本發(fā)明的第4個字符識別方法,其特征是,在對輸入字符數(shù)據(jù)及參照數(shù)據(jù)中的一方面進(jìn)行細(xì)線條件處理的同時,而其它一方照樣保持原封不動,然后分別存入輸入字符存儲器Mi及參照文字存儲器Mr,在相互略為正交的雙向分別掃描讀出輸入字符存儲器Mi及參照字符存儲器Mr的各個對應(yīng)部分,并判斷其有無包含關(guān)系,在具有包含關(guān)系時,原則上消去輸入字符存儲器Mi及參照字符存儲器Mr的對應(yīng)部分的數(shù)據(jù),以及與該掃描線旁邊的掃描線的包含部相對應(yīng)的非包含部的數(shù)據(jù)。
根據(jù)本發(fā)明的第1個方法,是在相互略為正交的雙向分別掃描讀出輸入字符存儲器Mi及參照字符存儲器Mr的各對應(yīng)部分,并判斷其有無包含關(guān)系,在具有包含關(guān)系的時候,原則上消去輸入字符存儲器Mi及參照字符存儲器Mr的對應(yīng)部分的數(shù)據(jù)。
根據(jù)本發(fā)明的第2個方法,是在相互略為正交的雙向分別掃描讀出輸入字符存儲器Mi及參照字符存儲器Mr的各對應(yīng)部分,并判斷其有無包含關(guān)系,在具有包含關(guān)系的時候,原則上消去輸入字符存儲器及參照字符存儲器的對應(yīng)部分的數(shù)據(jù),并把輸入字符存儲器Mi及參照字符存儲器Mr剩余的數(shù)據(jù)分別積累在相互略為正交方向的軸線上。
根據(jù)本發(fā)明的第3個方法,是在相互略為正交的雙向掃描讀出輸入字符存儲器Mi及參照字符存儲器Mr的各個對應(yīng)部分,并判斷其有無包含關(guān)系,在具有包含關(guān)系的時候,原則上消去輸入字符存儲器及參照字符存儲器的對應(yīng)部分的數(shù)據(jù),在保持原樣的字符的兩端部包含有另一方作細(xì)線條處理過的字符的點(diǎn),而在其內(nèi)側(cè)不包含2個以上連續(xù)點(diǎn)的時候,把輸入字符存儲器及參照字符存儲器的對應(yīng)部分的數(shù)據(jù)消掉。
根據(jù)本發(fā)明的第4個方法,是在相互略為正交雙向分別掃描讀出輸入字符存儲器Mi及參照字符存儲器Mr的各個對應(yīng)部分,并判斷其有無包含關(guān)系,在具有包含關(guān)系的時候,原則上消去輸入輸入字符存儲器Mi及參照字符存儲器Mr的對應(yīng)部分的數(shù)據(jù)及與其掃描線附近的掃描線的包含部分相對應(yīng)的非包含部分的數(shù)據(jù)。
以下,參照附圖就本發(fā)明的字符識別方法及其的各種電路進(jìn)行說明。
如圖4A所示,對輸入字符進(jìn)行細(xì)條處理。這是通過對輸入字符的電氣處理來進(jìn)行的。尚有,輸入字符及參照字符的數(shù)據(jù)是作為數(shù)字信號存儲在后述的各個不同的存儲器里,但其存儲狀態(tài)則分別形成點(diǎn)“1”的排列及分散。還有,在對輸入字符進(jìn)行細(xì)線條件處理的時候,橫向成分即使在其四周有雜音而紊亂,也要作細(xì)線條點(diǎn)序列處理,使之至少有2個以上的連續(xù)點(diǎn)序列。參照字符則如圖4B那樣保持原封不動。
作為識別對象的輸入字符,包括有片假名,平假名,漢字,外文字,數(shù)字,符號等。另外,在以下的說明里,雖然是以把輸入字符作細(xì)線條處理,而把參考字符保持原樣之情形來進(jìn)行說明的,但是反過來,把輸入字符保持原封不動,而把參考字符作細(xì)線條處理也是可以的。
以下,參照圖1的線路方塊圖對經(jīng)過細(xì)線條處理的輸入字符與參照字符相對的包含關(guān)系的檢查法及檢查電路進(jìn)行說明。圖1里,Mi是一個存儲經(jīng)過細(xì)線條處理過的輸入字符的數(shù)據(jù)的存儲器,Mr是1個存儲參照字符(由幾種字型組成的)的數(shù)據(jù)的存儲器,這些地址是1比1對應(yīng)的。要輸入端T1輸入的輸入字符數(shù)據(jù),通過多路轉(zhuǎn)換器Mxi→移位寄存器SRi存入輸入字符存儲器Mi。同樣,來自輸入端T2的參考字符數(shù)據(jù)則通過多路轉(zhuǎn)換器MXr→移位寄存器SRi,存入?yún)⒖甲址鎯ζ鱉r。在兩個存儲器Mi、Mr的各個地址里,可在輸入字符的點(diǎn)序列及參照字符的字符領(lǐng)域的部分存入“1”。因而在其以外之部分的地址,所存儲的內(nèi)容則是“0”。
SLi、SLr是選擇器,它是用來轉(zhuǎn)換分別存儲在存儲器Mi、Mr里的字符的數(shù)據(jù)的,例如對各個字符的水平方向H及垂直方向V進(jìn)行直線掃描而讀出的數(shù)據(jù)。
DC是對兩個選擇器SLi、SLr的輸出(與存儲器Mi、Mr的對應(yīng)地址相同掃描方向的讀出輸出)的包含關(guān)系進(jìn)行判斷的判斷電路。當(dāng)判斷兩個輸出具有包含關(guān)系的時候,原則上分別通過多路轉(zhuǎn)換器Mxi、Mxr及移位寄存器SRi、SRr,將“0”存入兩個存儲器Mi、Mr的獲得了“1”的地址,以消去該“1”。T3、T4是由選擇器SLi、SLr的輸出一方導(dǎo)出的輸出端。
也就是說,在圖1的檢查電路里,對于分別存儲在輸入字符存儲器Mi及參照字符存儲器Mr里的輸入字符數(shù)據(jù)及參照字符數(shù)據(jù),首先分別以對水平方向H作直線掃描及對垂直方向V作表面掃描的方式同時讀出(第1次掃描讀出),然后以分別對垂直方向V作直線掃描同時對水平方向H作表面掃描的方式同時讀出(第2次掃描讀出),而分別通過判斷電路DC,來判斷存儲器Mi、Mr的對應(yīng)地址的數(shù)據(jù)的包含關(guān)系,如具有包含關(guān)系的話,就在兩個存儲器Mi、Mr的本來為“1”的兩個地址上存入“0”。還有,這種掃描的順序也可以是與上述的順序相反。而且在兩個存儲器Mi、Mr的各地址剩余的數(shù)據(jù)“1”則變?yōu)橄嗷ゲ痪哂邪P(guān)系的部分。
還有,對存儲在存儲器Mi、Mr的輸入字符及參照字符數(shù)據(jù)進(jìn)行掃描讀出的速度,是與這些字符的矩形的外接框的尺寸成反比。這樣一來,就消除了作為原來的字符識別法的圖形匹配法之缺點(diǎn),即由于規(guī)格化而引起舍入誤差的影響。
有關(guān)該輸入字符及參照字符的包含關(guān)系的判斷原則如上所述,而與此相對,則設(shè)有如下特別規(guī)則。
(特別規(guī)則1)在對各存儲器Mi、Mr的水平方向X作直線掃描讀出(第1次掃描讀出時,參照字符的字符領(lǐng)域(數(shù)據(jù)“1”的部分)的寬度W未滿某值Th1,而其中含有有輸入字符的點(diǎn)(數(shù)據(jù)“1”的部分),當(dāng)不包括2個以上相連續(xù)的點(diǎn)的時侯,則存入器Mi、Mr的對應(yīng)地址“0”。
現(xiàn)參照圖5對此進(jìn)行說明,圖5的A、B及C是表示在各個寬度W(<Th1)的參照字符領(lǐng)域內(nèi),各輸入字符的點(diǎn)分別是1個、2個但中間空隔開1個、以及2個并且是相連續(xù)的情形,該圖的A、B之情形是在兩個存儲器Mi、Mr的對應(yīng)地址存入“0”而該圖C的情形則不存入。
這個特別規(guī)則1的意義如下,所謂的如圖5C那樣,經(jīng)過細(xì)線條處理的輸入字符在水平方向X上有2個以上相連續(xù),就意味著該部分是輸入字符的水平至平緩傾斜的部分,因而就會很自然地作為下一步垂直方向Y的直線掃描讀出(第2次掃描讀出)的比較對象而保留在存儲器里。
(特別規(guī)則2)在對各存儲器Mi、Mr的水平方向作直線掃描讀出(圖1的掃描讀出)時,參照字符的字符領(lǐng)域(數(shù)據(jù)“1”的部分)的寬度W達(dá)到某值Th1以上時,則根據(jù)下述的特別規(guī)則2-1至2-3進(jìn)行處理。
(特別規(guī)則2-1)
從參照字符的字符領(lǐng)域的兩端部至未滿某值Th2的寬度E1、E2的部分(兩端部分)含有輸入字符的點(diǎn),而在其內(nèi)側(cè)沒有包含2個以上相連的點(diǎn)時候,在兩個存儲器Mi、Mr的對應(yīng)地址存入“0”(參照圖6A)。
特別規(guī)則2-1是根據(jù)以下的理由設(shè)定的。輸入字符的細(xì)微的圖形,由于圖象掃描器的特性關(guān)系,有時也會走樣而不能讀取,但有些字符盡管如此有時也是可以很容易地進(jìn)行識別。也就是說,這意味有些字符,即使不對某部分進(jìn)行嚴(yán)密的識別,也可以對字符整體進(jìn)行識別。因此,在參照字符里,設(shè)置可以不必那么嚴(yán)密地進(jìn)行字符識別的容許范圍,就能提高字符的識別效率。而為此最簡便的方法是把參照字符的容許部分作涂抹處理。該方法以圖7的“復(fù)”字作為例子,其所示的是原來的字符及涂抹過的字符。
圖8是以“日”字為例,把原來的輸入字符與經(jīng)過細(xì)線條處理的輸入字符對照表示。圖8A是表示原來的輸入字符走樣的情形。
根據(jù)該特別規(guī)則2-1,可以知道在任何情況下都能夠在直線掃描讀出時順利地在存儲器存入“0”。
(特別規(guī)則2-2)在由參照字符的字符領(lǐng)域的兩端到未滿某值Th2的寬度E1、E2的部分(兩端部分)里,完全不包含輸入字符的點(diǎn),而且在其內(nèi)側(cè)的寬度E3的部分里也不包含2個以上連續(xù)的輸入字符的點(diǎn)的時候,只在輸入字符存儲器Mi的地址里存入“0”(參照圖6B)。
特別規(guī)則2-2是用來防止由于輸入字符的不需要的點(diǎn)序列參照字符的字符領(lǐng)域的數(shù)據(jù)被大幅度地消去的現(xiàn)象。
(特別規(guī)則2-3)在參照字符的字符領(lǐng)域內(nèi),輸入字符的點(diǎn)有2個以上相連續(xù)的時候,在存儲器Mi、Mr兩邊都不進(jìn)行存儲(參照圖6C)。
(特別規(guī)則3)
輸入字符的點(diǎn)序列及參照字符之間沒有對應(yīng)關(guān)系的時候,在存儲器Mi、Mr兩邊都不進(jìn)行存儲。
(特別規(guī)則4)在上述特別規(guī)則1~3里,當(dāng)必須比較的字符是特殊符號等的時候,恐怕有判斷錯誤的情況,所以把與經(jīng)細(xì)線條處理的輸入字符的點(diǎn)相對的原來輸入字符(圖9A)的各部的水平方向的寬度H(圖9B),以及各部的垂直方向的寬V(圖9C)也都存儲入存儲器(未有圖示)里。在進(jìn)行存儲器Mi的水平掃描讀出時,讀出輸入字符的各部的水平方向?qū)挾菻的數(shù)據(jù),而在進(jìn)行存儲器Mr的垂直掃描讀出時,則讀出輸入字符的各部的垂直方向?qū)挾萔的數(shù)據(jù),與對應(yīng)參照字符的各部的水平方向的寬度及垂直方向的寬度相比較,不一致的話則立個標(biāo)記。
也就是只對特別規(guī)則1~3的包含關(guān)系進(jìn)行檢驗(yàn),輸入字符為如圖10A所示的寬度較寬的圓圈的情形,把它作細(xì)線條處理后就變?yōu)閳D10B所示的樣子,而只對參照字符即圖10C的黑圓球與圖10D的圓圈的包含關(guān)系進(jìn)行檢驗(yàn),則不能對該輸入字符進(jìn)行識別。象這種情形因?yàn)樵谝话愕淖址锸遣粫l(fā)生的,所以在這種情況時就不須存儲寬度H、V。
還有,經(jīng)細(xì)線條處理的輸入字符是由水平重心Hg、垂直重心Vg的點(diǎn)序列混合構(gòu)成的,而取該輸入字符的對應(yīng)寬H1、V1的總和,并除以Hg、Vg各自的點(diǎn)序列數(shù),檢查該2個值是否略為相等,并且接近某個標(biāo)準(zhǔn)值,就能判斷該字體是否為粗體字。
還有,只按照上述的特別規(guī)則,會產(chǎn)生端點(diǎn)部的字符的線段的長度差異,或者消除在角隅部的數(shù)據(jù)“1”不凈而導(dǎo)致的誤差。這些各種情況一重復(fù),輸入字符就變得難于識別,所以要盡可能把地址存儲器的數(shù)據(jù)“1”消除干凈。
也就是說,輸入字符及參照字符是如圖11A所示那樣為矩形框狀的情形,把輸入字符作如虛線所示的細(xì)線條處理之后,遵照上述特別規(guī)則把它與參照字符相比較,并把各存儲器的數(shù)據(jù)“1”消去時,輸入字符及參照字符的四個角隅的斜線部分就成了消除不凈而成為剩余的部分。然而,這也就成為與通過對存儲器的水平方向作掃描讀出來消去字符數(shù)據(jù)之后,在對圖11B所示的垂直方向作掃描讀出以消去字符數(shù)據(jù)的階段所示產(chǎn)生的輸入字符及參照字符的線段長度差異導(dǎo)致端點(diǎn)部的誤差的共同的問題。
因而,在向存儲器存入“0”的順序中,就要加做如下操作。即是如圖1所示,把來自選擇器SLr、SLi的參照字符數(shù)據(jù)及輸入字符數(shù)據(jù),分別供給級聯(lián)移位寄存器SR1~SR3、SR4~SR6,并分別延遲3個掃描線量,然后把該延遲輸出供給“與”門Gr、Gi就能對如圖11B所示的參照字符存儲器Mr、輸入字符存儲器Mi的內(nèi)容進(jìn)行垂直掃描讀出并判斷其包含關(guān)系,當(dāng)判斷在該α范圍里有包含關(guān)系時,就在各存儲器的對應(yīng)部存入“0”,而在該兩端沒有包含關(guān)系的部分β、γ,也要上溯2線,或到2線后再把“0”存入各存儲器的對應(yīng)部。
以下,參照圖1-圖3對考慮了上述的特別規(guī)則的包含關(guān)系檢查電路進(jìn)行說明。
首先,就判斷電路DC的判斷進(jìn)行說明。對來自選擇器SLr的參照字符數(shù)據(jù)的字符領(lǐng)域的寬度進(jìn)行測定。判斷在該字符領(lǐng)域中是否有經(jīng)細(xì)線條處理的輸入字符的點(diǎn),以及進(jìn)入該字符領(lǐng)域的兩端部的輸入字符的點(diǎn)的位置。還有判斷來自選擇器SLi的經(jīng)細(xì)線條處理的輸入字符的數(shù)據(jù)的點(diǎn)是否2個以上相連續(xù)。
來自判斷電路DC下輸出端i的數(shù)據(jù)“0”通過“與”門Gi→多路轉(zhuǎn)換器Mxr→移位寄存器SRi供給輸入字符存儲器Mi,再存入對應(yīng)地址。
來自判斷電路DC的輸出端r的數(shù)據(jù)“0”是通過“與”門Gr→多路轉(zhuǎn)換器Mxi→移位寄存器SRr供給參照字符存儲器Mr,再存入對應(yīng)地址。
SR1~SR3接收來自選擇器SLr的輸入字符數(shù)據(jù),并基于此把用于端點(diǎn)處理的門信號供給“與”門Gr的級聯(lián)移位寄存器,作為整體而構(gòu)成3個掃描線量的延遲線。
SR4~SR6接收來自選擇器SLi的輸入字符數(shù)據(jù),并基于此把用于端點(diǎn)處理的門信號供給“與”門Gi的級聯(lián)移位寄存器,作為整體而構(gòu)成3個掃描量的延遲線。
該判斷電路DC的構(gòu)成如圖2所示。CNT1及CNT2是計數(shù)器。來自選擇器SLr的參照字符數(shù)據(jù)則被供給計數(shù)器CNT1的計數(shù)啟動輸入端及存入輸入端。在該計數(shù)器CNT1的時鐘輸入端則供給時鐘信號。而在計數(shù)器CNT2的計數(shù)啟動輸入端及歸零輸入端,則供給來自選擇器SLi的參照字符數(shù)據(jù)。還有,在計數(shù)器CNT2的存入輸入端則供給由反相器IV1作過倒相的來自選擇器SLi的輸入字符數(shù)據(jù)。在該計數(shù)器CNT2的時鐘輸入端則供給時鐘信號。
計數(shù)器CNT1對參照字符的字符領(lǐng)域的寬度W1(參照圖12)進(jìn)行計測。計數(shù)器CNT2對參照字符的字符領(lǐng)域的開始之后到經(jīng)細(xì)線條處理的輸入字符的最初的點(diǎn)到來為止的寬度W2(參照圖12),以及從它最后的點(diǎn)到字符領(lǐng)域的終結(jié)為止的寬度W3(參照圖12)進(jìn)行計測。
Ma~Me是存儲器。其中存儲器Ma~Mc分別是存儲上述寬W1~W3的數(shù)據(jù)的存儲器。Md是存儲經(jīng)細(xì)線條處理的輸入字符數(shù)據(jù)的點(diǎn)包含在參照字符數(shù)據(jù)的字符領(lǐng)域里的情形P(而P=“1”)的存儲器。Me是存儲經(jīng)細(xì)線條測量的輸入字符的點(diǎn)為2個以上相連續(xù)的情形Q(而Q=“1”)的存儲器。
計數(shù)器CNT1的輸出供給存儲器Ma,而計數(shù)器CNT2的輸出則供給存儲器Mb、Mc。F1、F2是觸發(fā)電路,觸發(fā)電路F1的同相輸出供給存儲器Md,觸發(fā)電路F2的同相輸出則供給存儲器Me。
來自選擇器SLr的參照字符數(shù)據(jù)通過反相器IV2而被倒相,再供給存儲器Ma、Mc~Me的時鐘輸入端。來自選擇器SLr的參照字符數(shù)據(jù)供給“與非”門G1及觸發(fā)電路F2的歸零輸入端。來自選擇器SLr及SLi的字符數(shù)據(jù)供給“與”門G2。而該“與”門G2的輸出通過反相器IV3倒相后供給觸發(fā)電路F1的預(yù)置輸入端。進(jìn)而,該觸發(fā)電路F1的倒相輸出則供給“與非”門G1。而且“與非”G1的輸出供給存儲器Mb的時鐘輸入端?!芭c”門G2的輸出供給“與非”門G3及觸發(fā)電路F3的D輸入端。還有,在觸發(fā)電路F3的時鐘輸入端供給時鐘脈沖。觸發(fā)電路F3的同相輸出供給“與非”門G3。而該“與非”門G3的輸出供給觸發(fā)電路F2的預(yù)置輸入端。觸發(fā)電路F2的D輸入端接地,而在它的時鐘輸入端則供給反相器IV2的輸出。
在存儲器Ma~Me里,存儲圖13的No.1、No.2、No.3、……No.i的各參照字符的每個字符領(lǐng)域的寬度W1、W2、W3以及包含關(guān)系P、輸入字符的點(diǎn)序列的連續(xù)性Q,這再作為地址供給表格用ROM TB1,在表格用ROM TB1里,以圖14所示的判定標(biāo)準(zhǔn),發(fā)出在存儲器Mr、Mi的地址里是否存入“0”的判斷輸出。
在圖14,X、Y、Z是與上述的寬度W1、W2、W3相對應(yīng),其相關(guān)系如下W1>Th1,X=1W1≤Th1,X=0W2<Th2,Y=1W2≥Th2,Y=0W3<Th2,Z=1W3≥Th2,Z=0而且,有無向存儲器Mr、Mi存入“0”的判斷標(biāo)準(zhǔn)如圖14所示,以下是對此所作的說明。
1)W1≤Th1時
A)在參照字符的字符領(lǐng)域里,如果沒有經(jīng)細(xì)線條處理的輸入字符的連續(xù)的點(diǎn),就在存儲器Mr、Mi的對應(yīng)地址存入“0”。
B)在參照字符的字符領(lǐng)域里,如果有經(jīng)細(xì)線條處理的輸入字符的連續(xù)的點(diǎn),就不向存儲器Mr、Mi存入。
2)W1>Th1時A)在參照字符的字符領(lǐng)域里,沒有經(jīng)細(xì)線條處理的輸入字符的連續(xù)的點(diǎn)時,a)如在參照字符的字符領(lǐng)域里的兩端部,有輸入字符的點(diǎn),就在存儲器Mr、Mi的對應(yīng)地址里存入“0”。
b)如在參照字符的字符領(lǐng)域里的兩端部,沒有輸入字符的點(diǎn),就不向存儲器Mr、Mi存入。
B)在參照字符的字符領(lǐng)域里,如果有經(jīng)細(xì)線條處理的輸入字符的連續(xù)點(diǎn),就不向存儲器Mr、Mi存入。
以下就端點(diǎn)處理的電路參照圖3進(jìn)行說明。來自表格用ROM TB1的2位的輸出,被供給級聯(lián)移位寄存器DR1~DR5的初級的移位寄存器DR。這些各個來自移位寄存器DR1~DR5的2位的輸出,被供給用于端點(diǎn)處理的表格用ROM TB2。而且,來自表格用ROM TB2的輸出端r、i的輸出被供給圖1的“與”門Gr、Gi。還有,在圖1及圖3里,選擇器SLr、SLi的輸出通過3級的級聯(lián)移位寄存器SR1~SR3以及SR4~SR6,分別供給“與”門Gr、Gi,以便上溯2線來分別進(jìn)行消去處理。而且這些由“與”門Gr、Gi得到的數(shù)據(jù)“0”分別被供給多路轉(zhuǎn)換器MXr、MXi,然后分別通過移位寄存器SRr、SRi存入存儲器Mr、Mi的對應(yīng)地址。
以下對控制選擇表格用ROM TB2的移位寄存器DR1~DR5的判斷結(jié)果的邏輯進(jìn)行說明。對于移位寄存器SR3的內(nèi)容,移位寄存器DR3的內(nèi)容發(fā)揮主要的作用,而移位寄存器DR1、DR2以及DR4、DR5的內(nèi)容則發(fā)揮輔助的作用。移位寄存器DR3的判斷結(jié)果在輸入字符存儲器Mi及參照字符存儲器Mr雙方存入“0”,而在輸入字符存儲器Mi存入“0”,并在參照字符存儲器Mr不存入“0”的時候,移位存儲器DR3的內(nèi)容并不受其它的移位寄存器DR1、DR2及DR4、DR5的內(nèi)容所影響,只在移位寄存器DR3的判斷結(jié)果可向存儲器存入“0”適,才會受其它的移位寄存器DR1、DR2及DR4、DR5的內(nèi)容所影響。
消去處理后的殘留誤差評價法(Ⅰ)求根據(jù)上述消去法消掉數(shù)據(jù)“1”的輸入及在參照字符存儲器Mi、Mr剩余下數(shù)據(jù)“1”的周圍分布,其代表例于圖15A~D表示。這是將各個存儲器的各地址之內(nèi)容(“1”或“0”)在X或Y軸上積分并顯示。即,該圖A及B是表示在存儲器殘存有不一致線段的數(shù)據(jù)。該圖C是端點(diǎn)的誤差偶然連續(xù)出現(xiàn)在Y投影里而混淆判斷的例子。還有,該圖D是經(jīng)細(xì)線條處理輸入字符與參照字符完全一致的例子。
于是,輸入這種根據(jù)周圍分布的檢查以及在參照字符存儲器Mi、Mr進(jìn)行實(shí)施,如果兩個存儲器的周圍分布的結(jié)果都是呈圖15C、D所示的樣子的話,就判斷為輸入字符及參照字符是相互一致的。但這時則需要進(jìn)行檢查,看X投影及Y投影的局部積分值是否相等。
消去處理后殘留誤差評價法(Ⅱ)根據(jù)以上述消去法消去數(shù)據(jù)“1”的輸入及殘留在參照字符存儲器Mi、Mr的數(shù)據(jù)“1”來檢查有沒有構(gòu)成文字的一部分的規(guī)定值以上之長度的線段。據(jù)此,例如輸入字符為“木”的情形,則通過檢查與作為參照字符的“木”、“本”的異同來進(jìn)行輸入字符的識別。
圖16是判識殘存在存儲器Mr、Mi的數(shù)據(jù)“1”的連續(xù)性的電路,以下對此進(jìn)行說明。該判識電路對于存儲器Mr、Mi可以采取同樣的構(gòu)成。首先,來自選擇器SLr或SLi的經(jīng)細(xì)線條測量的參照字符或輸入字符的殘差數(shù)據(jù)從輸入端(1)供給移位寄存器(2),檢查電路(4)、“與”門(5),及加法電路(6)。移位寄存器(2)存儲存儲器Mr或Mi的水平方向的1掃描線量的數(shù)據(jù)。移位寄存器(2)的輸出供給觸發(fā)電路(3)。而把來自輸入端部(1)的現(xiàn)時的數(shù)據(jù)(圖17的q′=“1”)和來自移位寄存器(2)及觸發(fā)電路(3)的1線前的數(shù)據(jù)q及其前后數(shù)據(jù)p、r(圖17)供給檢查電路(4)進(jìn)行比較。而且在該檢查電路(4)里,對現(xiàn)時的線 與1線前的線的數(shù)據(jù)的垂直方向的連續(xù)性及傾斜方向的連續(xù)性進(jìn)行檢查。
在加法電路(6)里,把“與”門(5)的輸出與來自輸入端(1)的現(xiàn)時的數(shù)據(jù)相加,其相加的輸出則供給存儲器(8)存入。存儲器(8)的讀出輸出供給閂鎖電路(9)。而且由存儲器(8)及閂鎖電路(9)讀出的水平方向的掃描線上相鄰數(shù)據(jù)D、Q、R(分別可取0、1、2、3……的值)則供給選擇器(7)。根據(jù)檢查電路(4)的輸出來進(jìn)行選擇。而通過該選擇器(7)選擇過的數(shù)據(jù)則與來自上述輸入端(1)的現(xiàn)時的數(shù)據(jù)一道供給“與”門(5)。尚有,該存儲器(8)是存儲1個字符的經(jīng)細(xì)線條處理的輸入字符及參照字符的數(shù)據(jù)的存儲器。
于是,在存儲器Mi或Mr的最初的水平方向掃描線上的數(shù)據(jù),通過選擇器SLi或SLr供給輸入端(1)的情形下,該數(shù)據(jù)為“1”時,1就被存入存儲器(8)的字符對應(yīng)部。而且,在下一步的水平掃描線及其以后的掃描線上的數(shù)據(jù)供給輸入端(1)時,在檢查電路(4)里,圖17所示的某數(shù)據(jù)q′為“1”的情形時,則在檢查電路(4)進(jìn)行檢查看在其之前1線的數(shù)據(jù)q及其前后數(shù)據(jù)P、R是“1”還是“0”,而選擇器(7)則相應(yīng)地進(jìn)行控制。
也就是q=“1”的時侯,選擇器件(7)所選擇的Q通過“與”門(5)被供給加法電路(6),與來自輸入端(1)的數(shù)據(jù)q相加,然后記錄在存儲器(8)的字符對應(yīng)部。
還有,p、q=“1”時,選擇器(7)所選擇的P,通過“與”門(5)供給加法電路(6)進(jìn)行相加,然后記錄在存儲器(8)的字符對應(yīng)部。
此外,在p、q、r=“1”時,選擇器(7)所選擇的R,通過“與”門(5)供給加法電路(6)進(jìn)行相加,然后記錄在存儲器(8)的字符對應(yīng)部。
如此,在存儲器(8)里,如圖18所示,就可存入與構(gòu)成殘存在存儲器Mi或Mr的“1”的數(shù)據(jù)的線段的部分相對應(yīng)的1、2、3、4……。
而且,該存儲器(8)的內(nèi)容(把它作為A)被供給電平比較器(11),與其臨界值B進(jìn)行比較,當(dāng)A>B時,就得到輸出“1”,通過“或”門(13)供給觸發(fā)電路(14)的D輸入端。在該觸發(fā)電路(14)的時鐘輸入端則供給時鐘信號。而且,該觸發(fā)電路(14)的倒相輸出供給其它的觸發(fā)電路(15)的置位輸入端。還有,在觸發(fā)電路(15)的復(fù)位輸入端供給始值信號。而且在比較器(11)里,每當(dāng)變成A>B,就從觸發(fā)電路(15)輸出標(biāo)志。
(10)是檢測供給輸入端(1)的現(xiàn)時數(shù)據(jù)的水平方向的線段的計數(shù)器。來自輸入端(1)的現(xiàn)時數(shù)據(jù)則供給計數(shù)器(10)的啟動輸入端及為零輸入端。還有,在計數(shù)器的時鐘輸入端則供給時鐘信號。計數(shù)器(10)在來自輸入端(1)的數(shù)據(jù)為“1”時,就對該“1”進(jìn)行計數(shù),來自輸入端(1)的數(shù)據(jù)為“0”時則歸零。
于是,該計數(shù)器(10)的計數(shù)輸出(把其作為A′)被供給電平比較器(12)與臨界值B′作比較。在A′>B′時,得到輸出“1”,再通過“或”門(13)供給觸發(fā)電路(14)的D輸入端。而且在比較器(12)里,每當(dāng)形成A′>B′,就會從觸發(fā)電路(15)輸出標(biāo)志。
這樣,采用這種連續(xù)性的判識電路,就能夠根據(jù)殘存在經(jīng)過消去處理的存儲器Mi、Mr里的數(shù)據(jù)來對線段(規(guī)定長度以上的線段)的數(shù)據(jù)作點(diǎn)與點(diǎn)狀的雜音的區(qū)別判識。
根據(jù)上述本發(fā)明的第1個方法,就能獲得不易受線寬變動、相位變動以及字形的傾斜變動影響而能識別字符的字符識別方法。
根據(jù)上述本發(fā)明的第2個方法,就能獲得不易受線寬變動、相位變動以及字形的傾斜變動影響,并能進(jìn)一步準(zhǔn)確識別字符的字符識別方法。
根據(jù)上述本發(fā)明的第3個方法,就能獲得不易受線寬變動、相位變動以及字形的傾斜變動的影響,并能提高字符的一些易于破壞部分的字符識別率而進(jìn)行識別字符的字符識別方法。
根據(jù)上述本發(fā)明的第4個方法,就能獲得不易線寬變動、相位變動以及字形的傾斜變動的影響,并且能提高字符的端點(diǎn)部的識別率而進(jìn)行識別字符的字符識別方法。
根據(jù)上述的本發(fā)明,可獲得能容易識別線段圖形的圖形的連續(xù)性判別方法。
圖1至圖18是有關(guān)本發(fā)明的附圖。圖1是表示包含關(guān)系的檢查電路的方塊線路圖,圖2是表示包含關(guān)系的檢查電路的判斷電路的方塊線路圖,圖3是表示檢查電路的部分方塊線路圖,圖4是輸入字符及參照字符的說明圖,圖5及圖6分別是包含關(guān)系的說明圖,圖7是參照字符的涂抹的說明圖,圖8是輸入字符損壞的說明圖,圖9是輸入字符的寬度數(shù)據(jù)的說明圖,圖10是特殊記號的識別的說明圖,圖11是端點(diǎn)處理的說明圖,圖12是包含關(guān)系的說明圖,圖13是表示存儲器的存儲內(nèi)容的圖,圖14是表示表格用ROM的說明圖,圖15是積累的說明圖,圖16是表示連續(xù)性的判識電路的方塊線路圖,圖17及圖18是各自的線段的連續(xù)性的說明圖。
Mi、Mr分別是輸入字符及參照字符存儲器,DC是包含關(guān)系判斷電路。
權(quán)利要求
1.一種字符識別方法,其特征是,把輸入字符數(shù)據(jù)及參照字符數(shù)據(jù)中的一邊作細(xì)線條測量的同時,另一邊則保持原樣不動,然后分別存儲在輸入字符存儲器及參照字符存儲器,在相互略為正交雙向上分別掃描讀出該輸入字符存儲器及參照字符存儲器的各對應(yīng)部分,并判斷有無包含關(guān)系,在具有包含關(guān)系時,原則上消去上述輸入字符存儲器及參照字符存儲器的對應(yīng)部分的數(shù)據(jù)。
2.一種字符識別方法,其特征是,把輸入字符數(shù)據(jù)及參照字符數(shù)據(jù)中的一邊作細(xì)線條處理的同時,另一邊則保持原樣不動,然后分別存儲在輸入字符存儲器及參照字符存儲器,在相互略為正交雙向上分別掃描讀出該輸入字符存儲器及參照字符存儲器的各對應(yīng)部分,并判斷有無包含關(guān)系,在具有包含關(guān)系時,原則上消去上述輸入字符存儲器及參照字符存儲器的對應(yīng)部分的數(shù)據(jù),并在上述相互略為正交方向的軸線上分別積累殘存在上述輸入字符存儲器及參照字符存儲器的數(shù)據(jù)。
3.一種字符識別方法,其特征是,把輸入字符數(shù)據(jù)及參照字符數(shù)據(jù)中的一邊作細(xì)線條處理的同時,另一邊保持原樣不動,而且將保持原樣不動的字符數(shù)據(jù)中的特定字符的識別容許部分作涂抹處理,然后分別存儲在輸入字符存儲器及參照字符存儲器,在相互略為正交的雙向上分別掃描讀出該輸入字符存儲器及參照字符存儲器的各對應(yīng)部分,并判斷有無包含關(guān)系,在具有包含關(guān)系時,原則上消去上述輸入字符存儲器及參照字符存儲器的對應(yīng)部分的數(shù)據(jù),同時在保持原樣不動的字符的兩端部,含有另一邊經(jīng)細(xì)線條處理的字符的點(diǎn),而在其內(nèi)側(cè)沒有包含2個以上相連續(xù)的點(diǎn)的時候,消去上述輸入字符存儲器及參照字符存儲器的對應(yīng)部分的數(shù)據(jù)。
4.一種字符識別方法,其特征是,在對輸入字符數(shù)據(jù)及參照字符數(shù)據(jù)中的一邊作細(xì)線條處理的同時,另一邊則保持原樣不動,然后分別存儲在輸入字符存儲器及參照字符存儲器,在相互略為正交的雙向上,分別掃描讀出該輸入字符存儲器及參照字符存儲器的各對應(yīng)部分,并判斷有無包含關(guān)系,在具有包含關(guān)系時,原則上消去上述輸入字符存儲器及參照字符存儲器的對應(yīng)部分的數(shù)據(jù),及與該掃描線包含部相對應(yīng)的非包含部的數(shù)據(jù)。
5.一種圖形的連續(xù)性的判別方法,其特征是,掃描讀出被存儲于第1存儲器的圖形數(shù)據(jù),將現(xiàn)在的點(diǎn)數(shù)據(jù)與先前的掃描線的數(shù)據(jù)相比較,如果在該先前的掃描線上有接近于現(xiàn)在的點(diǎn)數(shù)據(jù)的點(diǎn)數(shù)據(jù)時,就在上述先前的掃描線的接近點(diǎn)數(shù)據(jù)的數(shù)值N加1,并將它存儲在與上述第1存儲器相對應(yīng)的第2存儲器的現(xiàn)在點(diǎn)數(shù)據(jù)的位置上,并將從上述第2存儲器被讀出的數(shù)值與基準(zhǔn)值進(jìn)行比較。
專利摘要
本發(fā)明是關(guān)于字符的識別方法,該方法將輸入字符數(shù)據(jù)及參照字符數(shù)據(jù)的一方作細(xì)線條處理,而另一方則保持原樣不變,然后分別存儲在輸入字符存儲器及參照字符存儲器中,在相互略為正交的雙向上,分別掃描讀出輸入字符存儲器及參照字符器的各對應(yīng)部分,并判斷其有無包含關(guān)系,在具有包含關(guān)系時,原則上將輸入字符及參照字符的對應(yīng)部分的數(shù)據(jù)消去,從而提供不易受線寬變動、相位變動及字體的傾斜變動的影響的字符識別方法。
文檔編號G06K9/62GK87105302SQ87105302
公開日1988年2月10日 申請日期1987年7月29日
發(fā)明者山本嘉一 申請人:索尼公司導(dǎo)出引文BiBTeX, EndNote, RefMan