專利名稱:字符的識別方法
一般地講,本發(fā)明涉及一圖形的識別方法和系統(tǒng),特別而言,是涉及一種將未知的輸入字符同已寄存好的已知字符進(jìn)行比較而對字符進(jìn)行識別的方法和系統(tǒng)。更準(zhǔn)確地說,本發(fā)明涉及一種適用于字符識別方法和系統(tǒng)的字符細(xì)分方法。進(jìn)一步而言,本發(fā)明涉及一種使用多層定向碼直方圖技術(shù)的字符識別方法。
包括將一字符圖形細(xì)分成多元格網(wǎng)區(qū)域的步驟和將每一格網(wǎng)區(qū)域中的字符圖形的特征量集中處理的步驟的一字符識別方法已公知。然而,在將字符圖形細(xì)分成格網(wǎng)區(qū)域的細(xì)分點(diǎn)的情況中,容易將字符畸變,以使得利用固定的細(xì)分點(diǎn)對于如同手寫的中文字符進(jìn)行識別的識別率趨于嚴(yán)重地變劣。為防止這種由字符圖形畸變而引起的字符識別率的劣變,已經(jīng)提出過使用可變細(xì)分點(diǎn)的字符圖形的細(xì)分方法,例如日本已轉(zhuǎn)讓于本申請的受讓人的第59-202823申請,根據(jù)這種使用可變細(xì)分點(diǎn)的方法,用以細(xì)分一字符圖形成為格網(wǎng)區(qū)的細(xì)分點(diǎn)被可變地確定,以使預(yù)定的字符圖形的特征量在細(xì)分格網(wǎng)中等同分布。
進(jìn)一步,另一指定給本申請的受讓人的日本專利申請59-202825,在該申請中公開了一種采用如同可變圖形細(xì)分方法和對每一細(xì)分格網(wǎng)區(qū)域的字符圖形的特征量進(jìn)行集合處理而進(jìn)行字符識別的方法。利用這種可變字符圖形細(xì)分方法,與固定細(xì)分方法相比較,其字符識別率受到字符圖形變化的影響較小,以此而獲得對于手寫或相類似字符識別率的提高。然而,使用上述的字符識別方法,相鄰近的細(xì)分格網(wǎng)區(qū)不相互重疊,或即使相互重疊,其重疊寬度保持恒定。結(jié)果是,基于一字符圖形畸變的方式與程度,會出現(xiàn)這樣的情況,由于字符圖形畸變引起的特征量的起伏不能被充分吸收。
根據(jù)本發(fā)明的一個方面,提供了一個用以細(xì)分一個圖形的方法,在其中,用于確定一個字符圖形的字符區(qū)域首先被細(xì)分為第一多元子區(qū)域,以使預(yù)定的特征量在子區(qū)域中實(shí)際相等地分布,并且至少有一些第一多元子區(qū)域相結(jié)合而將第一多元子區(qū)域轉(zhuǎn)化成第二多元格網(wǎng)區(qū)域,從而將字符區(qū)細(xì)分成格網(wǎng)區(qū)域。當(dāng)將至少一些子區(qū)域結(jié)合時,首先考慮的是將兩個或更多的相鄰子區(qū)域結(jié)合成為一個格網(wǎng)區(qū)。此外,至少一些格網(wǎng)區(qū)具有一重疊部分,該重疊部分、是由結(jié)合在兩個與共用子區(qū)相鄰的子區(qū)域中的共用子區(qū)域而確定的。
根據(jù)本發(fā)明的另一方面,提供了一個用于字符識別方法中的字符圖形細(xì)分方法。它包括步驟有,對于確定一個字符區(qū)中的字符圖形的輪廓象素指定一多元預(yù)定定向碼;細(xì)分字符區(qū)成為第一多元子區(qū)域,以便使指定的方向碼在第一多元子區(qū)域中實(shí)際均勻地分布;根據(jù)一預(yù)定的方式,至少對一些所說的第一多元子區(qū)域進(jìn)行結(jié)合,而將第一多元子區(qū)域轉(zhuǎn)變成為第二多元格網(wǎng)區(qū)域。最好是,在數(shù)目上第一多元子區(qū)域大于第二多元格網(wǎng)區(qū)域。在本發(fā)明這方面的優(yōu)選實(shí)施例中,字符識別的方法使用了所謂多元定向碼直方圖的方法。
因此,本發(fā)明的一個基本目的是克服上述現(xiàn)有技術(shù)缺點(diǎn),并提供一改進(jìn)的字符圖形細(xì)分方法。
本發(fā)明的進(jìn)一步目的是提供一個使用了一改進(jìn)了的字符圖形細(xì)分方法的字符識別方法和系統(tǒng)。
本發(fā)明的更進(jìn)一步目的是提供了一改進(jìn)的字符圖形細(xì)分方法和系統(tǒng),它適合于處理變形的字符,例如手寫字符。
本發(fā)明更進(jìn)一步的目的是提供了一個改進(jìn)了的字符識別方法和系統(tǒng),它受由于字符圖形畸變的不利影響最小。
本發(fā)明的進(jìn)一步目的是提供一改進(jìn)的字符圖形細(xì)分方法,當(dāng)使在一字符識別系統(tǒng)中時,能夠保持高的識別率而同被處理的字符圖形的條件無關(guān)。
本發(fā)明的其它目的,優(yōu)點(diǎn)及新穎特征,將由參考附圖所作的下述詳細(xì)描述而變得明顯。
附圖的簡介圖1a和1b是說明,展示如何根據(jù)本發(fā)明的實(shí)施例將一字符區(qū)域首先細(xì)分成子區(qū)域,然后將其轉(zhuǎn)變成格網(wǎng)區(qū)域;
圖2是一方塊圖,表示依照本發(fā)明的實(shí)施例而構(gòu)成的字符圖形細(xì)分系統(tǒng)去完成如圖1a和1b所說明的字符細(xì)分過程;
圖3a是一個表示如何將圖3a(1)和圖3a(2)結(jié)合的說明;
圖3a(1),3a(2)和3b確定了一個流程圖,表示了一個用于完成在圖1a和圖1b中所闡明的字符圖形細(xì)分方法的步驟順序;
圖4是一個表示根據(jù)本發(fā)明的另一實(shí)施例字符圖形細(xì)分方法的說明;
圖5是一個表示如何將圖5a和圖5b結(jié)合的說明;
圖5a和圖5b,當(dāng)如圖5所表明被結(jié)合時,確定一個流程圖,表示一個用以完成如圖4中所闡明的字符圖形細(xì)分方法的步驟順序;
圖6是一個方塊圖,表示一個依據(jù)本發(fā)明的又一實(shí)施例而構(gòu)成的光學(xué)字符識別系統(tǒng);
圖7a至圖7f確定了一個流程圖,表明一個執(zhí)行如圖6所示的系統(tǒng)中的特征提取單元15的步驟順序;
圖8是一個圖示說明,表明一個表格,它定義了一個多元方向碼和與它相聯(lián)系的適于圖6所示系統(tǒng)中使用的利用中心象素作為重要象素的象素圖形。
圖9是用于解釋圖6中所示的系統(tǒng)所采用的字符細(xì)分方法的說明。
對于實(shí)施例的描述首先應(yīng)該注意,本說明書中所談“字符”一詞的含意,包括了與之相類似的一類術(shù)語,例如“字母”,“符號”,“數(shù)字”。
先參見圖2,其中以方框圖形式給出了一個按照本發(fā)明的實(shí)施例而構(gòu)成的字符圖形細(xì)分系統(tǒng)。如所示的那樣,本字符圖形細(xì)分系統(tǒng)包括一個微處理器1和一個用于存貯程序及數(shù)據(jù)的存貯器2,該存貯器是經(jīng)總線3與微處理器I相聯(lián)的,在系統(tǒng)中還提供有字符圖形輸入單元8,它是與總線3相聯(lián)的。因而,一個由輸入單元8輸入的字符圖形存貯在經(jīng)由微處理器確定在存貯器2中的字符緩沖存貯器4中。微處理器1進(jìn)行一定向碼的指定工作,以便對一字符線的輪廓象素指定為預(yù)定的8種不同的定向碼,其中的字符線根據(jù)預(yù)定的方式確定字符圖形,而且,具有確定其輪廓的定向碼的字符圖形貯存在字符緩沖存貯器4中。一個關(guān)于這種定向碼和對一個字符圖形的輪廓象素指定這種定向碼的步驟的有關(guān)例子,將在以后介紹。在這種情況下,加有定向碼的全部數(shù)字ITOTAL被計數(shù),而且將此數(shù)存貯在存貯器2的特定地址。存貯器2中也定有一子區(qū)表5,一分配表6和一格網(wǎng)區(qū)表7。
根據(jù)圖1a和圖1b,依本發(fā)明實(shí)施例的一字符圖形細(xì)分過程被描述如下。首先,對于一字符圖形的輪廓(在此假設(shè)一個在行方向上有64個象素,在列方向上有64個象素的圖形)被指定一如上所表示的多元預(yù)定定向碼(特征量),并將其存貯在緩沖寄存器4中。然后,將字符圖形在橫向上及縱向上都劃分成5個部分,使字符圖形細(xì)分成一多元子區(qū)域,以便指定的定向碼在細(xì)分的子區(qū)域中的分布是均勻的。更特殊地,字符圖形被分成5個水平部份,以使每一水平部份包含有由對ITOTAL5等分而決定的指定的定向碼的數(shù)目,相類似地,字符圖形也被分成五個垂直部分,以使每一個垂直部分在實(shí)際上具有相同的定向碼數(shù)。
在圖1b中,IT(2)至IT(5)表示沿水平軸將字符圖形細(xì)分成5個水平部分的座標(biāo)位置,JT(2)至JT(5)表明沿垂直軸將字符圖形細(xì)分成5個垂直部份的座標(biāo)軸位置。以這樣的方式,即,將字符圖形分成5個水平部分及5個垂直部分,得到了第一多元子區(qū)域A至Y(5乘5=25),如圖16中所示。應(yīng)當(dāng)注意,連同其他細(xì)分點(diǎn)的座標(biāo)存貯在子區(qū)域表5中的式子IT(1)=ST(1)=1和IT(6)=JT(6)=64。
然而,根據(jù)存貯在分配表6中的分配指示信息,被指示的子區(qū)被分配到每一格網(wǎng)區(qū),而后按一指明的方式將子區(qū)域結(jié)合,以便將第一多元子區(qū)轉(zhuǎn)變成為一第二多元格網(wǎng)區(qū)(本例中為4×4),它在數(shù)值上是比第一多元子區(qū)要小。換句話說,至少有一部分子區(qū)域被結(jié)合成一定的格網(wǎng)區(qū),由此而形成復(fù)蓋全字符圖形面的第二多元格網(wǎng)區(qū)域。由于分配指示信息內(nèi)容是相應(yīng)于存貯于分配表6中的數(shù)據(jù)的,因而在所說明的實(shí)施例中,如同圖1a所示出的那樣,其字符圖形是最終被分為第二多元格網(wǎng)區(qū)域1至16的。
結(jié)合兩個或更多的子區(qū)域的集合而形成一個格網(wǎng)區(qū)是依照下列的構(gòu)思模式而進(jìn)行的。在水平方向上從左開始進(jìn)行細(xì)分的η1(=1)水平細(xì)分(即子區(qū)域A,F(xiàn),K,P和U)被轉(zhuǎn)變成第一合成水平細(xì)分,座標(biāo)對IT(1)和IT(2)被存入格網(wǎng)區(qū)表7中。從細(xì)分位置座標(biāo)n12開始的水平細(xì)分n2被轉(zhuǎn)變成第二合成水平細(xì)分,其細(xì)分位置座標(biāo)n12是在細(xì)分位置座標(biāo)IT(2)以前(或以左)的。由于η12=0,η2=2,此處子區(qū)域B,G,L,Q,V,C,H,M,R和W被合成,與第一組水平細(xì)分不重疊的第二組水平細(xì)分。并且,座標(biāo)對IT(2)和IT(4)被存入格網(wǎng)區(qū)表7。而后,從細(xì)分位置座標(biāo)η23始的水平細(xì)分η3被轉(zhuǎn)變成第三合成水平細(xì)分,其中細(xì)分位置座標(biāo)η23是在細(xì)分位置座標(biāo)IT(4)之前(或以左)的。由于η23=1,η3=2,此處子區(qū)域C,H,M,R,W,D,I,N,S和X被合成為同第二組水平細(xì)分相重疊的第三組水平細(xì)分。并且,座標(biāo)對IT(3)和IT(5)被存入格網(wǎng)區(qū)表7中。相類似地,包含E,J,O,T和Y的水平細(xì)分被轉(zhuǎn)變成第四組合成細(xì)分,以使座標(biāo)對IT(2)和IT(6)被存入格網(wǎng)表7中。
相類似地,結(jié)合或合并對于垂直細(xì)分也是同樣進(jìn)行的,其結(jié)果是座標(biāo)對JT(1)和JT(2),JT(2)和JT(4),JT(3)和JT(5),JT(5)和JT(6)分別被貯存在格網(wǎng)區(qū)表7中,以這樣的方式,如圖1a所示出的格網(wǎng)區(qū)域1-16的細(xì)分位置信息被貯存于格網(wǎng)區(qū)表7中,就是說,子區(qū)域A是分配到格網(wǎng)區(qū)1,而子區(qū)域B和C是分配到格網(wǎng)區(qū)域2,子區(qū)域C和B(D?譯者)是分配到格網(wǎng)區(qū)域3的。子區(qū)域C對于格網(wǎng)區(qū)域2與3是共用的,因此,它在這兩個相鄰的格網(wǎng)區(qū)域2與3中,確定了一個重疊部分。以相類同的方式,子區(qū)域F與K被分配到格網(wǎng)區(qū)域5而子區(qū)域K與P被分配到格網(wǎng)區(qū)域9,以使在垂直方向上作為兩個相鄰格網(wǎng)區(qū)域的5與9之間,由子區(qū)域K構(gòu)成一個重疊部分。另一方面,子區(qū)域G,L,H和M被分配給格網(wǎng)區(qū)域6,而子區(qū)域H,M,I和N被分配給格網(wǎng)區(qū)域7;而子區(qū)域L,Q,M和R被分配給格網(wǎng)區(qū)10,子區(qū)域M,R,N和S被分配給格網(wǎng)區(qū)域11。換句話說,子區(qū)域M被共同分配給了四個相鄰的格網(wǎng)區(qū)域6,7,10和11,因而確定了這四個相鄰格網(wǎng)區(qū)域的重疊部分。
以此種方式,從子區(qū)域形成了格網(wǎng)區(qū)域,亦即,這一形成是經(jīng)細(xì)分字符圖形以使預(yù)定的特征量(此例中是定向碼)在子區(qū)域中實(shí)際是均勻公布的;并經(jīng)至少是部分地結(jié)合或合并兩個或更多的子區(qū)域而實(shí)現(xiàn)的。并且,處于兩個或更多的鄰近格網(wǎng)區(qū)域那一重疊部分也被定為一個子區(qū)域。因此,既便是對同一字符而言,這種特殊的結(jié)合方式是與依賴于畸變的方式和/或程度是不同的。結(jié)果是,與那種相鄰格網(wǎng)區(qū)域中無重疊部分,或相鄰格網(wǎng)區(qū)域的重疊寬度恒定的現(xiàn)有技術(shù)相比,本發(fā)明能適應(yīng)更大范圍的字符圖形的畸變,而使得字符圖形的特征提取穩(wěn)定地進(jìn)行而不受其畸變的影響。應(yīng)當(dāng)注意的是,在上述實(shí)施例中,定向碼已經(jīng)被用作特征量;然而,在考慮一特殊字符的識別所用的算法時本發(fā)明的這種字符細(xì)分方法也可選用其它各種形式的特征量,例如,黑色象素數(shù)目。
接下來,特別參考圖2及圖3a(1)、3a(2)和3b,對依據(jù)本發(fā)明一實(shí)施例的字符圖形細(xì)分過程作更為具體的描述。
圖3的流程圖中,步驟100至116是對應(yīng)于細(xì)分一個字符圖形成為第一多元子區(qū)域的步驟順序。一旦將一多元予定的定向碼指定到一字符圖形的輪廓象素過程完成(并計算指定碼的ITOTAL的數(shù)值),微處理器1便沿步驟100開始處理。首先,在步驟100,一個計數(shù)器I(一個微處理器1的內(nèi)部寄存器或存貯器2的特定地址)被清除,而且該計數(shù)器在下一步驟101增加1。而后檢查一下計數(shù)器I的計數(shù)值是否為5(在水平及垂直方向上的細(xì)分?jǐn)?shù)),如果不是的話,則進(jìn)行步驟103。在步驟103,要計算(ITOTALXI)/5的值,并將其結(jié)果以地址ITO(I)存入存貯器2中。由步驟101至103的循環(huán)要重復(fù)到條件I=5成立為止。
在此,存貯在地址ITO(I)的值表示從字符圖形的左邊(或右邊)到水平方向(或垂直方向)上的第一組細(xì)分的右邊(或下邊)所包含的定向碼的數(shù)目。一旦實(shí)現(xiàn)條件I=5,則進(jìn)行在104開始的步驟。在步驟104,寄存器IT1和JT1(微處理器1的內(nèi)部寄存器或存貯器2的特定地址)被清除。在步驟105,條件IT(1)=JT1=1被寫入子區(qū)域表5中,而后在步驟106,條件IT(6)=JT6=64(字符大小)被寫入子區(qū)域表5中。在步驟107,數(shù)字“2”被置于計數(shù)器I與J(微處理器1的內(nèi)部寄存器或存貯器2的特定地址),并且,計數(shù)器K(微處理器1的內(nèi)部寄存器或存貯器2的特定地址)被清除。通過107至116的步驟,在水平和垂直方向上的細(xì)分位置座標(biāo)被確定。在步驟108,計數(shù)器K增值1并在下一步驟109檢測其值是否已經(jīng)達(dá)到值“64”。
如果計數(shù)器K的值還未達(dá)到64,則進(jìn)行步驟110。在步驟110,具有字符緩沖存貯器4的水平座標(biāo)K的垂直方向上的一行被掃描,而后將位于此行的定向碼的數(shù)值LINE(1,K)加到寄存器IT1的值上,并再次將該結(jié)果置于寄存器IT1。具有垂直座標(biāo)K水平方向上的一行被掃描,由此而得到的定向碼數(shù)值LINE(2,K)隨即加至寄存器JT1的值上,并將該結(jié)果再置于寄存器JT1。在下一步驟111,寄存器IT1的值與存貯在存貯器2的地址為ITO(I)的數(shù)值進(jìn)行比較,若前者大于后者,則進(jìn)入下一步驟112,在此步驟,計數(shù)器K的值作為水平方向上細(xì)分位置座標(biāo)IT(1)被寫入子區(qū)域表5,并且,計數(shù)器I在步驟113增值,隨后進(jìn)行步驟114。如果在步驟111決定的結(jié)果是IT(1)等于或小于ITO(1),則步驟112及113被跳過。
在步驟114,寄存器JT1的值與處在地址ITO(J)的值相比較,如果前者大于后者,則進(jìn)入下一步驟115,在此步驟,計數(shù)器K的數(shù)值作為在垂直方向上的細(xì)分位置座標(biāo)JT(J)被寫入子區(qū)域表5中。此后進(jìn)行步驟116,在此步驟中計數(shù)器J被增值,隨后返回步驟108。用這種方式,當(dāng)字符圖形已被水平和垂直方向上細(xì)分成5個部分時,計數(shù)器K的數(shù)值達(dá)“64”,故從步驟109執(zhí)行到步驟117。
步驟117至124確定了一個用以將存貯在分配表6中的內(nèi)容進(jìn)行一些子區(qū)域的結(jié)合來轉(zhuǎn)換第一多元子區(qū)域成為第二多元格網(wǎng)區(qū)域的過程,如同前文中參照圖1a和圖1b所介紹的那樣,就是說在此過程中,格網(wǎng)區(qū)域細(xì)分位置的信息,即在水平和垂直方向上轉(zhuǎn)變或合并細(xì)分的細(xì)分位置座標(biāo)從子區(qū)域表5中讀出,并寫入格網(wǎng)區(qū)域表7中。
在另一個結(jié)構(gòu)中,分配表6可以存貯于一個只讀存貯器或稱ROM中,然而,如果分配表6如上述實(shí)施例那樣是存貯于一個RAM中,那么,子區(qū)域結(jié)合或合并的規(guī)則可僅僅依靠調(diào)整其存貯于其中的內(nèi)容而輕易地改變,例如,當(dāng)使用的是RAM時,其分配表6可相應(yīng)于一種字符或一族字符的種類而被再寫入。
現(xiàn)在描述本發(fā)明的另一個實(shí)施例。在上述實(shí)施例中,結(jié)合或合并子區(qū)域是根據(jù)分配表6的內(nèi)容而進(jìn)行的。另一方面,在本實(shí)施例中,結(jié)合或合并子區(qū)域是依據(jù)由特定方程而決定的規(guī)則來進(jìn)行,而并不使用分配表。
圖5a和圖5b表示一個流程圖,它表明了一個依據(jù)本發(fā)明第二實(shí)施例將字符圖形細(xì)分成為格網(wǎng)區(qū)域所確定的過程步驟順序,然而,應(yīng)當(dāng)注意,本流程圖中的步驟200包含有相應(yīng)于圖3所示的步驟100至116的一組相同的步驟。此外,步驟209對應(yīng)著一個用于執(zhí)行對每一格網(wǎng)區(qū)域的字符圖形提取特征過程的步驟。例如被公開的定向碼的直方圖信息,如同已經(jīng)轉(zhuǎn)讓給本申請受讓人的日本第59-202825號專利申請。還應(yīng)當(dāng)注意,第二實(shí)施例的過程可用如圖2所示的系統(tǒng)來執(zhí)行。
參考圖5a和5b,格網(wǎng)區(qū)域的細(xì)分過程介紹如下。當(dāng)在步驟200細(xì)分一個字符圖形成為5×5的子區(qū)域以后,一個結(jié)合或合并子區(qū)域的過程即開始。在步驟201,用以記水平方向的細(xì)分?jǐn)?shù)計數(shù)器N被清除,而后,在步驟202,計數(shù)器N被增值1。接著,在步驟203,計數(shù)器N的值與在垂直方向上格網(wǎng)區(qū)細(xì)分的數(shù)值Imes相比較。如果N是等于或小于Imes,則執(zhí)行步驟204,在此步驟中,相對于Iwx(N-1)+1的水平細(xì)分位置座標(biāo)(由子區(qū)域細(xì)分過程而定的座標(biāo))被置于寄存器IP1。此外,相對于Iwx×N+2的水平細(xì)分位置座標(biāo)(由子區(qū)域細(xì)分過程而定的座標(biāo))被置于寄存器IP2。
此處,Iw=(Idev+Imes-1)/Imes-1,Idev是在水平和垂直方向上子區(qū)域細(xì)分?jǐn)?shù),然而,它的選擇須符合關(guān)系式Idev=C×Imes+1(C=1,2,3,……)。
而后進(jìn)行步驟205,在此步驟中,用以記垂直方向的細(xì)分?jǐn)?shù)的計數(shù)器M被清除。在步驟206計數(shù)器M被增值1,在步驟207計數(shù)器M的值Imes比較。如果M是等于或小于Imes)則到步驟208在步驟208,對應(yīng)于IW×(m-1)+1的水平細(xì)分位置座標(biāo)(由子區(qū)域細(xì)分過程而定的座標(biāo))被置于寄存器JP1中。此外,對應(yīng)于IW×M+2的水平細(xì)分位置座標(biāo)(由子區(qū)域細(xì)分過程而定的座標(biāo))被置于寄存器LP2中。借助于此,確定一格網(wǎng)區(qū)域,而且它的起始點(diǎn)座標(biāo)(格網(wǎng)區(qū)的左上角)是由寄取器IP1和JP1的內(nèi)容確定的,而它的終點(diǎn)座標(biāo)(格網(wǎng)區(qū)的右下角)是由寄存器IP2和JP2確定的。對于按這樣方式而決定的單一格網(wǎng)區(qū),一個定向碼的直方圖在步驟209中形成。一經(jīng)完成步驟209,便返回步驟209,以便決定處在同一水平位置的下一個格網(wǎng)區(qū)域。當(dāng)所有的處于同一水平位置格網(wǎng)區(qū)域的確定完成時形成一方向直方圖,則在步驟207中滿足M大于Imes的條件,故返回步驟202,隨之開始一個過程去確定在水平方向上移動了一個位置的格網(wǎng)區(qū)域。一完成所有的格網(wǎng)區(qū)域的確定,由于在步驟203中,滿足N大于Imes的條件,本過程便終了。
應(yīng)當(dāng)注意,其流程的構(gòu)成可以僅進(jìn)行格網(wǎng)的細(xì)分過程而當(dāng)省去用以形成一定向直方圖的步驟209,在第二個實(shí)施例中,具有Idev=5和Imes=2(因此Iw=2)的格網(wǎng)細(xì)分結(jié)果在圖4中做了說明,其中虛線表明子區(qū)域的分界線,而實(shí)線表明通過于一部分地結(jié)合或合并子區(qū)域而形成的格網(wǎng)區(qū)域的分界線。也是在此實(shí)施例中,由于格網(wǎng)區(qū)域細(xì)分的方式和一些格網(wǎng)區(qū)域重疊部分是隨著一個字符圖形的畸變的方式或程度而變化的,所以一字符圖形的畸變被充分地吸收,而且一字符圖形的特殊提取可以永久穩(wěn)定地進(jìn)行,由此,如同前述的實(shí)施例那樣,有助于對于一種無論有無畸變的字符保持高的字符識別率。
現(xiàn)在來參看圖6,這是以框圖形式表示的按本發(fā)明的另一個實(shí)施例所構(gòu)成的光字符識別系統(tǒng)。如圖所示,本系統(tǒng)包含一個掃描器11,用來光學(xué)地讀出原始圖象,從而將一個光圖象信息轉(zhuǎn)換為電的二進(jìn)制圖象信號,該信號被輸入到字符分段單元12,在此把各個字符圖形從二進(jìn)制圖象信號中分離出來。然后,將這種已分段的各個字符圖形輸送到消除噪音成分的噪音消除單元13。接著,字符圖形輸送到標(biāo)準(zhǔn)化單元14,再輸送到特征提取單元15。在特征提取單元15中,從這樣輸入的字符圖形提取特征的過程是按照所謂的多層定向碼直方圖方法來完成的。如此提取的特征向量加到匹配單元16,在此單元執(zhí)行對這樣提供的特征向量與作為已知字符圖形而存貯在信息庫17中的特征向量間的距離計算,從而,向輸出單元18提供一個具有最小計算距離的已知字符編碼。
在特征提取單元15所執(zhí)行的流程將特別參照表示該流程的步驟的順序流程圖Ta-Tf在下文中進(jìn)行詳細(xì)描述。要注意的是特征提取單元15可能具有由微處理機(jī),存貯器及其類似裝置構(gòu)成的硬件結(jié)構(gòu),微處理機(jī)按照存貯在存貯器中的預(yù)定程序提取預(yù)定的流程。還應(yīng)注意的是后文敘述中將提到的計數(shù)器,特征位及圖表等項目可能被補(bǔ)充為存貯器的特定地址或存貯區(qū)域。
在特征提取單元15中的流程,通??梢苑譃橐粋€指定多個預(yù)定的定向碼的子流程,恰如圖8中所示的確定字符圖形(存貯在存貯器中的特殊區(qū)域內(nèi))的字符輪廓線的白象素;一個用于把指定的定向碼(被指定為確定字符輪廓線的白象素)分類到不同層的子流程;一個把字符圖形細(xì)分為格網(wǎng)區(qū)域的子流程以及一個用于把每個格網(wǎng)區(qū)域的每一層形成一個定向碼直方圖的子流程?,F(xiàn)在,參看圖7a~7f來詳細(xì)敘述這些子流程中的每一個。
在步驟300,定向碼數(shù)字計數(shù)器ITOTAL及地址計數(shù)器J都置“O”,那么,一個實(shí)際的流程是在步驟302開始。首先,來敘述指定子流程的定向碼。按照這個指定子流程的定向碼,輸入的字符圖形在水平方向上被從左至右掃描,在此期間對基于排列在重要的白象素的上下左右的一組四象素圖確定的地址值的定向碼表進(jìn)行存取,并從表中讀出的地址碼被寫入指定的定向碼的與重要象素對應(yīng)的存貯器上圖形存貯區(qū)域的地址內(nèi)。亦即在步驟302,用于標(biāo)示垂直方向上的字符圖形的掃描地址的地址計數(shù)器J加1而在步驟304,地址計數(shù)器J的計數(shù)與垂直方向的字符圖形的尺寸,J的尺寸進(jìn)行比較,如果J等于或小于J尺寸,由于這表示在掃描的中途,流程繼續(xù)進(jìn)到步驟306,在此步驟層分類計數(shù)器I計數(shù)器和與后文所述的層分類有關(guān)的相反方向的層分類計數(shù)器I計數(shù)1都置“O”。
然后,流程進(jìn)入步驟308,在此,用于標(biāo)示水平方向掃描地址的計數(shù)器I置“O”,在其后的步驟310中計數(shù)器I加1。在步驟312,計數(shù)器I和水平方向上的字符圖形I尺寸進(jìn)行比較,如果I大于I尺寸,那么,由于這表示通用地址J的掃描行的掃描完成了,流程在完成作為后文所述的層分類子流程的程序11后回到步驟302,從而進(jìn)到下一掃描行的掃描。在步驟312,如果I被確定為等于或小于I尺寸,則就要檢查輸入的字符圖形的地址(I,J)的數(shù)據(jù)圖象(I,J)是否為“O”,如果不是O,由于其象素為黑象素(數(shù)據(jù)為“1”),流程就進(jìn)入步驟320,此處,編碼9作為數(shù)據(jù)Imag-code(I,J)被寫入與所指定的定向碼中的字符圖形相應(yīng)存貯區(qū)內(nèi)的對應(yīng)地址;如果Image(I,J)的數(shù)據(jù)為“0”(白象素),那么流程進(jìn)入步驟316,此處在重要象素的周圍的右象素(A),上象素(B),左象素(C)及下象素(D)的數(shù)據(jù)從輸入的字符圖形存貯區(qū)域中讀出,以此對IV=A+2B+C+8D計算。
此后,流程進(jìn)入下一步驟318,此處,定向碼圖表中的存貯區(qū)數(shù)據(jù)碼-tb1(IV)作為地址信息與IV同時讀出,而該數(shù)據(jù)(定向碼)作為數(shù)據(jù)碼tb1被寫入指定的定向碼中的字符圖形存貯區(qū)的對應(yīng)地址內(nèi),然后,流程在完成作為層分類的程序10后回至步驟310。此后,對下一個掃描行進(jìn)行掃描。在整個的水平掃描完成時,步驟304的條件得到滿足,故結(jié)束方向流程,而進(jìn)行作為層分類流程的程序1。
應(yīng)注意的是在圖8中示出了十個不同的定向碼及其有關(guān)的象素圖形。如圖所示,每個有關(guān)的象素圖形都由5個象素組成,即包括有一個重要象素的中心象素,一對上下象素及一對左右象素。在圖8的圖表中表示了位于每個圖形中心的重要象素是一個白象素,而且該重要象素與沿字符圖形輪廓定位的每個白象素進(jìn)行比較,并且通過與圖8中的圖表內(nèi)的象素圖形進(jìn)行比較后,對每個白色輪廓象素指定對應(yīng)的定向碼,應(yīng)注意的是有效的定向碼是從1到8。
現(xiàn)在,將對層分類流程進(jìn)行詳細(xì)描述,按照該層分類流程的原理,指定定向碼的字符圖形先被從上到下垂直地進(jìn)行掃描,接著再被從左至右進(jìn)行水平掃描,然后從相反的方向再進(jìn)一步掃描。在每一條掃描行中,在一個或多個白色象素(O)之后出現(xiàn)的定向碼被檢測出來。如果這樣檢出的定向碼是在掃描行中檢出的第一個定向碼的話,那么它就被分類到第一層中;另一方面,如果檢出的方向碼是在掃描行中檢出的第二個方向碼,那么它就被分入第二層,用這種方法沿一條掃描行檢出的所有的方向碼都依照沿一條掃描行檢測的次序被分類到不同的層上。這種層分類方法公開在申請?zhí)枮?9-22822的日本專利申請中,它一直被限定為該申請以及結(jié)合的申請受讓人的專有權(quán)。然而,應(yīng)注意的是,本發(fā)明的實(shí)施例與上述提到的專利申請中公開的層分類規(guī)則系統(tǒng)稍有差別。因為,在本實(shí)施例中,定向碼的種類或類型是用于分類至各層的,以此,提高了層分類流程的效率。另外還要注意的是,在本發(fā)明的實(shí)施例中,對于檢出的定向碼的分類只有兩層。
在步驟318之后調(diào)用程序10,在程序10的第一步驟330處,指定了定向碼的字符圖形存貯區(qū)中的數(shù)據(jù)Img-code(I,J)傳送到寄存器IH。然后,在下一步驟332,檢測在寄存器IH中的數(shù)據(jù)是否為“1”到“8”的有效的定向碼。如果不是一個有效的定向碼(即碼為“0”或“9”),那么,流程就回到步驟310。相反,如果是一個有效的定向碼,那么流程就進(jìn)入步驟334以將計數(shù)器ITOTAL增加“1”,之后流程進(jìn)入步驟336,在此,在水平方向上的水平定向碼數(shù)列計數(shù)器LINE(1,I)和垂直定向碼數(shù)列LINE(2,J)都增加“1”,然后,流程進(jìn)入步驟338以檢測其定向碼(IH)的種類。如果定向碼為“2”或“4”,那么流程進(jìn)到返回步驟。另一方面,如果定向碼為“1”、“5”、或“8”,則流程進(jìn)入步驟340,此處層分類計數(shù)器Icount加1,然后在下一步驟342,檢測計數(shù)計的數(shù)是否等于或小于“2”,如果不是等于或小于“2”,則流程立即返回到主程序(因為在本實(shí)施例中,進(jìn)行層分類一直進(jìn)行到第二層),如果等于或小于“2”,則流程進(jìn)入步驟344,以便將1寫入由層分類計數(shù)器Icount表示的層的層分類特征位Layer-flg(I,J,Icount)中,然后,流程進(jìn)入返回步驟。
如果從寄存器IH讀出的定向碼是“3”,“6”,或“7”,則流程就進(jìn)入步驟346,結(jié)果,用于從上至下的垂直掃描和從右至左的水平掃描的反向?qū)臃诸愑嫈?shù)器Icount1就加1,那么,在下一步驟348,層特征位堆棧Istack(1)的內(nèi)容就被寫入反向?qū)犹卣魑欢褩stock(2),然后,流程進(jìn)入步驟350,此處地址計數(shù)器I的數(shù)值被寫入層特征位堆棧Istock(1)中,則流程進(jìn)入返回步驟。每次定向碼指定流程完成一個掃描行時,都要進(jìn)入程序11。在該程序中,在步驟352檢測反向?qū)臃诸愑嫈?shù)器Icount1的數(shù)值,如果該數(shù)值為“0”,則流程立即進(jìn)入返回步驟。然而,如果該數(shù)值等于或大于“2”,那么在步驟354,就在與正常方向?qū)臃诸愄卣魑欢褩stock(1)相對應(yīng)的第二層特征位Layer-flg(Istock(2)J,2)中置入“1”,此后流程進(jìn)入返回步驟。如果反向?qū)臃诸愑嫈?shù)器Icount1的數(shù)值為1,則流程就跳過步驟354而進(jìn)入356,再進(jìn)入返回步驟。
以此方法,執(zhí)行在水平方向掃描的層分類流程。而在垂直方向掃描的層分類流程是通過程序1完成的。在程序1中,地址計數(shù)器I在步驟360中置“0”后,實(shí)際的層分類流程就起動了。亦即在步驟362,地址計數(shù)器I加1,然后其余數(shù)值與字符圖形在水平方向上的尺寸Isize進(jìn)行比較,如果I大于Isize,則流程就被確定,且進(jìn)入用于格網(wǎng)區(qū)域子部分和直方圖結(jié)構(gòu)的程序2;相反,如果I不大于Isize,流程進(jìn)入步驟366,此處,用于從上至下(正向)掃描方向的層分類計數(shù)器Icount和用于從下至上(反向)掃描方向的層分類計數(shù)器Icount1都置“0”。
在步驟370,地址計數(shù)器J置“0”,而在下一步驟370,地址計數(shù)器加1。在步驟372,地址計數(shù)器J的值與垂直方向的字符圖形的垂直尺寸Jsize進(jìn)行比較,如果J等于或小于Jsize,那么在指定的定向碼字符圖形存貯區(qū)域中的存貯數(shù)據(jù)Img-Code(I,J)被讀出以輸入到寄存器IH。在步驟376,檢測寄存器IH的數(shù)據(jù)(定向碼)的種類。如果該數(shù)據(jù)為“0”,“1”,“3”,或“9”則流程回到步驟370。另一方面,如果該數(shù)據(jù)是“4”,“7”,或“8”,則流程進(jìn)入378,結(jié)果層分類計數(shù)器Icount加“1”,然后,在下一個步驟380,檢測該計數(shù)器的數(shù)值是否等于或小于“2”。如果不等于或小于“2”,則流程回到步驟370(因為在實(shí)施例中執(zhí)行層分類到第二層),相反,如果等于或小于“2”,則流程進(jìn)入步驟380,在此“1”被寫入由層分類計數(shù)器Icount表示的層分類特征位Layer-flg(I,J,Icount)中,此后,流程回到步驟370。
如果從寄存器IH中讀出的定向碼為“2”,“5”或“6”,則流程進(jìn)入步驟384,此處,反向?qū)臃诸愑嫈?shù)器Icount1加“1”。然后,在下一步驟386,層特征位堆棧Istack(1)的內(nèi)容被寫入反向?qū)犹卣魑欢褩stock(2)。然后,流程進(jìn)入步驟388,此處,地址寄存器I的值被寫入層特征位堆棧Istack(1)中,而此后,流程回到步驟370。當(dāng)每次在垂直方向上的一個掃描行的層分類流程完成時,步驟372的條件得到滿足,故流程進(jìn)入步驟390,在步驟390,檢測反向?qū)臃诸愑嫈?shù)器Icount1的計數(shù),如果該計數(shù)為“0”,則流程立即返回步驟362,從而執(zhí)行下一個掃描行的流程。另一方面,如果計數(shù)器等于或大于“2”,則流程進(jìn)入步驟392,此處,“1”放在與反向?qū)犹卣魑欢褩stack(2)之值相對應(yīng)的第二層的層分類特征位Layer-flg(Istack(2),j,2)中。然后,在步驟394,在與正向?qū)犹卣魑欢褩stock(1)之值相對應(yīng)的第一層的層分類特征位Layer-flg(Istack(1)j,1)中放入“1”。此后,流程回到步驟362。如果反向?qū)臃诸愑嫈?shù)器Icount1之值為“1”,則跳過步驟392而進(jìn)入步驟394,然后回到步驟362。
用此方法,執(zhí)行對于在垂直方向掃描的層分類流程。該流程完成時,步驟364的條件得到滿足,結(jié)果流程進(jìn)入用于格網(wǎng)區(qū)域子部分和矩形結(jié)構(gòu)的程序2。程序2的步驟402至434確定了用于把字符圖形細(xì)分為多個子區(qū)域的子部分流程。這樣,指定的定向碼實(shí)質(zhì)上就均勻地分布于子區(qū)域中。圖9是用于解釋將字符圖形細(xì)分為第一多元子區(qū)域和組合的子部分流程或按預(yù)定的規(guī)則至少將某些子區(qū)域組合的辦法把第一多元子區(qū)域轉(zhuǎn)換為第二多元格網(wǎng)區(qū)域的組合流程的說明圖。
首先,將把字符圖形水平地和垂直地分成子區(qū)域的子部分Idev數(shù)值以及垂直方向和水平方向下的格網(wǎng)部分Imes的數(shù)值在步驟400中確定。在本實(shí)施例中,由于Idev=5,字符區(qū)域就分成為5×5=25個子區(qū)域,另外,由于Imes=2,子區(qū)域就部分地組合而確定為2×2=4個格網(wǎng)區(qū)域。應(yīng)注意的是,字符圖形設(shè)定為具有64×64個象素的模式。
在步驟402,計數(shù)器I清“0”,然后,在下一步驟404,計數(shù)器I加“1”,之后,就要檢測計數(shù)器I的計數(shù)是否等于Idev(在水平方向和垂直方向的子部分值),如果不等于,則流程進(jìn)入408。在步驟408對(ITOTAL×I)/Idev進(jìn)行計算,并將計算值寫入寄存器ITO(1)。此處,ITOTAL(定向碼數(shù)值計數(shù)器ITOTAL的計數(shù))表示被指定到該流程上的字符圖形的定向碼的總數(shù)值。在達(dá)到I=Idev=5的條件之前包括步驟404至408的環(huán)路一直重復(fù)著。此處,寄存器ITO(I)之值表示出定向碼的數(shù)值,該定向碼是包含于字符圖形的左邊(或右邊)及第I個子部分區(qū)域在水平方向上(或垂直方向上)的右邊(或下邊)之間的。
如果達(dá)到I=5的條件,則起動步驟410。在步驟410,寄存器IT1和JT1都清“0”。在下一步驟412,寄存器IT(1)和JT(1)都置“1”,然后,在步驟414,寄存器IT(6)和JT(6)輸入“64”(字符尺寸),然后,在步驟416計數(shù)器I和J輸入“2”,而計數(shù)器K清“0”。從步驟416至步驟434,對用于在水平方向和垂直方向上將字符圖形細(xì)分為第一多元子區(qū)域的字符圖形細(xì)分位置座標(biāo)進(jìn)行確定。在步驟418,計數(shù)器K加“1”,而在下一步驟420檢測計數(shù)器K的計數(shù)是否已達(dá)到了數(shù)值64。如果K還未達(dá)到數(shù)值64,則流程進(jìn)入步驟422。在步驟422指定了方向碼的字符圖形就被沿著一條水平座標(biāo)等于K的垂直直線進(jìn)行掃描,由此在該垂直掃描線上的定向碼Line(1,K)的數(shù)值被加至寄存器IT1的值中,并將所加之值輸入寄存器IT1內(nèi)。另外,字符圖形也被沿著一條垂直座標(biāo)等于K的水平線進(jìn)行掃描,由此,在該水平掃描線上的定向碼Line(2,K)的數(shù)值被加至寄存器JT1的值內(nèi),且將所加之值輸入寄存器JT1。
在下一步驟424,寄存器IT1之值與寄存器ITO(I)之值進(jìn)行比較,若前者大于后者,流程進(jìn)入步驟426,此處,計數(shù)器K的值輸入到用作在水平方向上細(xì)分位置座標(biāo)的寄存器IT(1)中。然后,在步驟428,計數(shù)器I增值,接著進(jìn)入步驟430。在步驟424,如果IT1等于或小于ITO(I)這一條件不滿足,就跳過步驟426和428。在步驟430,寄存器JT1的值與寄存器IJO(J)之值進(jìn)行比較,如果前者大于后者,流程就進(jìn)入步驟432,在此,計數(shù)器K的計數(shù)輸入到用于在垂直方向上的細(xì)分位置座標(biāo)的寄存器JT(J)內(nèi)。然后進(jìn)入步驟432,在此計數(shù)器J增值,之后回到步驟418。
用這種方法,在由寄存器IT(2)至IT(5)所表示的位置上沿水平方向把字符圖形分為五個垂直部分,進(jìn)而在由寄存器JT(2)至JT(5)所表示的位置上沿垂直方向再分成五個水平部分。結(jié)果,字符圖形首先被分成了如圖9中點(diǎn)線所示的A至Y的第一多元(在本例中為5×5=25)子區(qū)域。當(dāng)將此細(xì)分成子區(qū)域的過程完成時,自計數(shù)器K的計數(shù)達(dá)到64時,流程就從步驟420進(jìn)入步驟436。步驟436至450確定了一個按照預(yù)定規(guī)則積分或至少組合某些子區(qū)域的流程,從而將第一多元子區(qū)域轉(zhuǎn)換成第二多元(本例中為2×2=4)格網(wǎng)區(qū)域。
在步驟436,水平細(xì)分(或稱子部分)量計數(shù)器N清“0”,而流程進(jìn)入步驟438,在此計數(shù)器N加“1”。在步驟440,計數(shù)器N的計數(shù)與水平或垂直格網(wǎng)區(qū)域細(xì)分量Imes(在本例中為2)進(jìn)行比較,結(jié)果是,如果發(fā)現(xiàn)N等于或小于Imes,流程就進(jìn)入步驟424,在此,對應(yīng)于IW×(N-1)+1的水平細(xì)分座標(biāo)(即由對子區(qū)域細(xì)分流程決定的座標(biāo))輸入寄存器IP1。另外,對應(yīng)于IW×N+2的水平細(xì)分位置座標(biāo)(即由對子區(qū)域的細(xì)分流程決定的座標(biāo))輸入到寄存器IP2。此處,應(yīng)注意的是IW=(Idew+Imes-1)/Imes-1。還應(yīng)注意的是要使選擇滿足Idev=C×Imes+1(C=1,2,3……)的條件。
然后,在步驟444,用于垂直方向上的分度值的計數(shù)器M清“0”。在步驟446,計數(shù)器M加“1”,然后在步驟448,計數(shù)器M的計數(shù)與Imes進(jìn)行比較。如果M等于或小于Imes,那么流程就進(jìn)入步驟450,在此,對應(yīng)于IW×(M-1)+1的垂直分度位置座標(biāo)(即由對子區(qū)域細(xì)分流程決定的座標(biāo))輸入寄存器JP1。另外,對應(yīng)于IW×M+2的水平分度位置座標(biāo)(即由對子區(qū)域細(xì)分流程決定的座標(biāo))輸入到寄存器JP2,結(jié)果,就確定了一個格網(wǎng)區(qū)域,而且,它的始點(diǎn)座標(biāo)(即如此決定的格網(wǎng)區(qū)域的左上角)是由寄存器IP1和JP1的內(nèi)容來確定的,而它的終點(diǎn)座標(biāo)(即如此確定的格網(wǎng)區(qū)域的右下角)就由寄存器IP2和JP2予以確定。
對于如此確定的單一格網(wǎng)區(qū)域,定向碼的直方圖就由程序4形成。當(dāng)該流程完成時,流程返回步驟446,然后對在相同水平位置上的下一個格網(wǎng)區(qū)域進(jìn)行確定。當(dāng)在相同水平位置上的所有格網(wǎng)區(qū)域的確定和定向碼直方圖結(jié)構(gòu)的形成完成時,在步驟448滿足M大于Imes的條件,則流程回到步驟438,從而對在水平方向上移動了一個格網(wǎng)區(qū)域的另一個格網(wǎng)進(jìn)行確定的流程進(jìn)行啟動,當(dāng)所有的格網(wǎng)區(qū)域的確定完成時,在步驟440N大于Imes的條件得到滿足,故流程終止。
按此方法,子區(qū)域被組合或部分地結(jié)合成如圖9實(shí)線所示的2×2格網(wǎng)區(qū)域。即,字符圖形終究被分成為2×2格網(wǎng)區(qū)域。從圖9可見,子區(qū)域A,B,C,F(xiàn),G,H,K,L和M被組合成格網(wǎng)區(qū)域1;子區(qū)域C,D,E,H,I,J,M,N和O結(jié)合為格網(wǎng)區(qū)域2,子區(qū)域K,L,M,P,Q,R,U,V和W組合成格網(wǎng)區(qū)域3,而子區(qū)域M,N,O,R,S,T,W,X和Y組合成格網(wǎng)區(qū)域4。而且,在兩個相鄰的格網(wǎng)區(qū)域之間的公共子區(qū)域確定一個重疊部分,在已說明的實(shí)施例中重疊部位由子區(qū)域C,H,M,R,W,K,L,N和O確定。
按此方法,至少將某些細(xì)分的字符圖形確定的子區(qū)域適當(dāng)?shù)亟Y(jié)合,形成了格網(wǎng)區(qū)域,這樣,指定的定向碼(特征參數(shù))就均勻地分布于子區(qū)域內(nèi)。格網(wǎng)區(qū)域的疊加部分也由那些經(jīng)選擇的子區(qū)域組成,而其變化依賴于字符圖形畸變的方式和程度。結(jié)果,作為與無疊加部分的情況和有疊加部分的情況的比較,由字符圖形畸變的方式和程度的變動可以被可靠地吸收,從而能穩(wěn)定地處理字符圖形的特征參數(shù)。
所謂的多層定向直方圖法對克服字符圖形失真有實(shí)質(zhì)效果,并能獲得對失真的字符的具有最小程序庫容量的高識別率。例如,手寫漢字。然而,按照本實(shí)施例,由于字符圖形被最后分為如上所述的格網(wǎng)區(qū)域,特征參數(shù)的處理就穩(wěn)定了,從而進(jìn)一步增強(qiáng)了對字符畸變的操作效能。這樣,如在本實(shí)施例中,既使是在第二層的特征提取仍可達(dá)到一個高的識別率,因此,程序庫容量可以進(jìn)一步降低。
依照程序4的定向碼直方圖的結(jié)構(gòu)處理將在下文詳述。在該程序4中,對重要的格網(wǎng)區(qū)域掃描,通過對每個格網(wǎng)區(qū)域,每個定向碼和每一層的一個矩形圖計數(shù)器增值的辦法,將已經(jīng)確立的第一層或第二層的層分類特征位的象素定向碼形成重要的格網(wǎng)區(qū)域的層分類定向碼直方圖。
首先,在步驟460,寄存器JP1之值,(即重要格網(wǎng)區(qū)域的左上角的垂直座標(biāo))置入寄存器J。然后,在步驟464,寄存器JP2之值(即重要格網(wǎng)區(qū)域的右下角的垂直座標(biāo))與寄存器J之值進(jìn)行比較,如果J等于或小于JP2,則進(jìn)入步驟466,在步驟466,寄存器JP1之值(即重要格網(wǎng)區(qū)域的左上角的水平座標(biāo))輸入到寄存器I。隨后在步驟468,寄存器IP之值(即重要格網(wǎng)區(qū)域的右下角的水平座標(biāo))與寄存器I之值比較。如果I等于或小于IP2,則進(jìn)入步驟470,在步驟470,檢測第一層的層分類特征位Layer-flg(I,J,1)是否置“1”,如果置“1”,由于寄存器I和J確定的象素所指定的定向碼屬于第一層,則執(zhí)行步驟472。另一方面,若未置“1”,則跳過步驟472而進(jìn)到步驟474。
在步驟472,在存貯器上確定特殊地址的每個格網(wǎng)區(qū)域和每個定向碼的第一層直方圖計數(shù)器IHIST(IDP1)增值,此時IIPO1是直方圖計數(shù)器的識別數(shù)字(與某地址對應(yīng))它由下式確定IDP1=32(M-1)+8(N-1)+1H此處,M為前述的計數(shù)器之值,即水平方向格網(wǎng)區(qū)域數(shù),而N是前述的計數(shù)器N之值,即垂直方向上的格網(wǎng)區(qū)域數(shù)。另外,IH為前述的寄存器IH的一個數(shù)據(jù),即定向碼。在步驟274檢測第二層的層分類特征位Layer-flg(I,J,2)是否被置入?如果置入了,由于寄存器I和J的標(biāo)示的象素定向碼屬于第二層,則執(zhí)行步驟276,反之,如果未置入,則跳過步驟476而進(jìn)入步驟478。
在步驟476,與重要的格網(wǎng)區(qū)域相對應(yīng)的每個定向碼的第二層直方圖計數(shù)器IHIST(IDP2)增值。此處,直方圖計數(shù)器的識別數(shù)IDP2(與某地址對應(yīng))由下式確定,IDP2=128+32(M-1)+8(N-1)+IH隨后,在步驟478,寄存器I增值以將掃描位置往下移動一個步驟,然后回到步驟468。
當(dāng)時這個重要格網(wǎng)區(qū)域的下端的處理完成時,滿足了步驟468的條件,故進(jìn)到步驟480。在步驟480,寄存器J增值以將掃描位置在水平方向上移動一個象素。然后回到步驟464。當(dāng)對整個重要的格網(wǎng)區(qū)域的處理完成時,滿足了步驟464的條件,故流程移出程序4并回到用于格網(wǎng)區(qū)域的確定的程序3的步驟446,用該方法,對于每個格網(wǎng)區(qū)域都形成了用于第一層和第二層中的每一個方向碼直方圖。
現(xiàn)在,利用如此獲得的層分類定向碼直方圖作為分量,輸入字符圖形的特征向量被提取并隨后加到匹配單元16,在匹配單元16中,實(shí)現(xiàn)與存貯在程序庫17中的數(shù)據(jù)匹配。例如通過計算輸入字符圖形和每個存貯在每層中的程序庫中已存貯的已知字符圖形之間的距離實(shí)現(xiàn)匹配。然后,存貯在程序庫中的某個具有最小計算距離的已知字符圖形的編碼就加到輸出單元18以作為對輸入字符圖形的識別結(jié)果。
利用所謂的多層定向碼直方圖方法的本發(fā)明的這方面的另一個實(shí)施例將予以敘述。例如,作為另一個實(shí)施例,在將第一多元子區(qū)域轉(zhuǎn)換為第二多元格網(wǎng)區(qū)域時,可以按照一個由參數(shù)確定的規(guī)則來執(zhí)行。即,假設(shè)將字符圖形在水平或垂直方向進(jìn)行細(xì)分的細(xì)分?jǐn)?shù)以及將字符圖形在水平或垂直方向上分為格網(wǎng)區(qū)域分度的字分別為5和2,則分別給定如下的參數(shù)以確定一個集合規(guī)則
n1=m1=1n12=m12=0n2=m2=2n23=m23=1n3=m3=2n34=m34=0n4=m4=1還假設(shè)字符圖形已被細(xì)分成了如圖9的點(diǎn)線所示的子區(qū)域。
在這種情況下,子區(qū)域的集合或結(jié)合過程將以如下方法的定測執(zhí)行。來自字符圖形左邊的水平細(xì)分區(qū)域(子區(qū)域A,F(xiàn),K,P和U)的n1(=1)數(shù)值作為第一水平集合細(xì)分區(qū)域,將座標(biāo)對IT(1)和IT(2)寫入格網(wǎng)區(qū)域圖表中。然后,來自利用細(xì)分區(qū)域n12值的細(xì)分位置座標(biāo)IT(2)之前的細(xì)分位置座標(biāo)的水平細(xì)分區(qū)域的數(shù)值n2作為第二水平集合的細(xì)分區(qū)域。此處,n12=0,n2=2,故子區(qū)域B,G,L,Q,V,C,H,M,R和W被確定為第二水平集合細(xì)分區(qū)域。這些區(qū)域并未與第一區(qū)域重疊。而座標(biāo)對IT(2)和IT(4)被寫入格網(wǎng)區(qū)域圖表之中。
然后,來自利用細(xì)分區(qū)域n23數(shù)的細(xì)分位置座標(biāo)IT(4)之前的細(xì)分位置座標(biāo)的水平細(xì)分區(qū)域的數(shù)字n3作為第三水平集合細(xì)分區(qū)域。此處n23=1,n3=2,故子區(qū)域C,H,M,R,W,D,I,N,S和X就確定為第三水平集合細(xì)分區(qū)域,它們與第二水平細(xì)分區(qū)域相重疊。座標(biāo)對IT(3)和IT(5)就寫入了格網(wǎng)區(qū)域圖表中。類似地,余下的子區(qū)域E,J,O,T和Y被確定為第四水平集合細(xì)分區(qū)域,座標(biāo)對IT(2)和IT(6)寫入了格網(wǎng)區(qū)域圖表中。
在垂直方向上執(zhí)行一個類似的集合操作,這樣,座標(biāo)對JT(1)和JT(2),JT(2)和JT(4),JT(3)和JT(5),JT(5)和JT(6)分別寫入了格網(wǎng)區(qū)域圖表中。用這種方法,格網(wǎng)區(qū)域1至10的細(xì)分位置信息提被送給了格網(wǎng)區(qū)域圖表,以這些信息為基礎(chǔ),子區(qū)域被適當(dāng)?shù)丶希辽偈遣糠值卮_定了如圖9中實(shí)線所示的格網(wǎng)區(qū)域1至4。用這種方法,在由這些參數(shù)確定集合規(guī)則時,就能對集合成每個格網(wǎng)區(qū)域的子區(qū)域數(shù)值和確定兩個相鄰格網(wǎng)區(qū)域之間的重疊部分的子區(qū)域的數(shù)值進(jìn)行優(yōu)良的控制。另外,也能對每個字符種類指定其集合規(guī)則。
應(yīng)該注意的是,在上述實(shí)施例中,特征提取一直執(zhí)行到第二層上,然而,總地說來,其構(gòu)成可以進(jìn)行特征提取到第N層,此處N為正整數(shù)。在這種情況下,其構(gòu)成可以確定作為對每個字符所計算的匹配距離的層數(shù)。另外,它也可以構(gòu)成從第一層至第M層的每一層提取特征,和從第(M+1)層至第N層的各層中提取特征。還應(yīng)注意的是匹配計算可以在按標(biāo)準(zhǔn)偏移或變化的幅度的順序重新排列所提取的特征向量之后進(jìn)行。
以上提供本發(fā)明優(yōu)選實(shí)施例的全面和完整的公開發(fā)明,可以不背離本發(fā)明的實(shí)質(zhì)精神和范圍而使用各種改型,其它結(jié)構(gòu)和等效發(fā)明,因而,以上敘述和圖形不應(yīng)構(gòu)成對由附屬權(quán)利要求
確定的本發(fā)明的范圍的限制。
權(quán)利要求
1.一字符圖形的細(xì)分方法包含的步驟有將一字符圖形細(xì)分為第一多元子區(qū)域;通過合并至少某些所說的子區(qū)域,將所說的第一多元子區(qū)域轉(zhuǎn)變?yōu)榈诙嘣窬W(wǎng)區(qū)域,從而,將一字符圖形最終細(xì)分成為所說的第二多元格網(wǎng)區(qū)域。
2.如權(quán)利要求
1所述的方法,其中所說的第二多元格網(wǎng)區(qū)域在數(shù)目上少于第一多元子區(qū)域。
3.如權(quán)利要求
2所述的方法,其中所說的字符圖形具有按予定規(guī)則被指定到確定所說的字符圖形輪廓象素的一個多元予定特征量,每個特征量對應(yīng)一個所說的輪廓象素。
4.如權(quán)利要求
3所述的方法,其中所說的細(xì)分步驟的完成是使所說的予定特征量實(shí)質(zhì)上在所說的整個子區(qū)域上均勻分布。
5.如權(quán)利要求
4所述的方法,其中所說的予定特征量是定向碼,而每一定向碼都有一個隨圍繞在重要象素四周的予定數(shù)目的周圍象素的排列而定的獨(dú)特碼。
6.如權(quán)利要求
5所述的方法,其中所說的每個定向碼都對應(yīng)著一種包括有一個重要象素的五個象素的特定排列,一對“上”和“下”象素分別置于重要象素的上部和下部,一對“左”和“右”象素分別置于重要象素的左邊和右邊。
7.如權(quán)利要求
1所述的方法,其中所說的第二多元格網(wǎng)區(qū)域中的至少兩個相鄰區(qū)域有一共同的重疊部分。
8.如權(quán)利要求
7所述的方法,其中所說的重疊部分是由一個或多個所說的第一多元子區(qū)域所確定的。
9.如權(quán)利要求
1所述的方法,其中所說的字符圖形位于一個字符幀內(nèi),該字符幀是由間隔開第一予定距離的第一對平行水平線和間隔開第二予定距離的第二對平行垂直線確定的,其中所說的第一多元子區(qū)域是由第三多元水平線和第四多元垂直線確定的,第三多元水平線位于所說的第一對平行水平線之間且與之平行,第四多元垂直線位于所說的第二對平行垂直線之間且與之平行,以使所說的每個第一多元子區(qū)域具有矩形或正方形的形狀。
10.一字符圖形的識別方法包含的步驟有將一原始圖象進(jìn)行光學(xué)地讀出以產(chǎn)生一圖象信號;從所說的圖象信號產(chǎn)生一個獨(dú)特的輸入字符圖形;從所說的輸入字符圖形提取一予定的特征向量,該提取步驟包括有將所說的輸入字符圖形細(xì)分成第一多元子區(qū)域,通過至少將某些所說的第一多元子區(qū)域合并成為一個或多個格網(wǎng)區(qū)域而將所說的第一多元子區(qū)域轉(zhuǎn)變成為第二多元格網(wǎng)區(qū)域,對于各個格網(wǎng)區(qū)域形成一個特征直方圖以確定所說的輸入字符圖形的特征向量;將所說的輸入字符圖形的特征向量與存貯于程序庫中的已知字符圖形的特征向量相比較,由此從所說的多元已知字符圖形中選擇出與輸入字符圖形最為接近的一個,從而確定所說的輸入字符圖形的標(biāo)識。
11.如權(quán)利要求
10所述的方法,其中所說的提取步驟還包括對每個確定輸入圖形輪廓的象素指定一個多元予定定向碼,將所說的字符圖形細(xì)分為所說的第一多元子區(qū)域,以使所指定的定向碼實(shí)質(zhì)上均勻地分布在所說的第一多元子區(qū)域上。
12.如權(quán)利要求
11所述的方法,其中所述的每個多元定向碼與包括一個重要中心象素的予定數(shù)量象素的特定排列相對應(yīng),第一對“上”“下”象素分別位于所說的重要中心象素的上部和下部,第二對“左”“右”象素分別位于所說的重要中心象素的左邊和右邊。
13.如權(quán)利要求
11所述的方法,其中所說的提取步驟還包括利用掃描具有將所說的字符圖形細(xì)分為第一多元子區(qū)域之前被指定到輪廓象素的定向碼的字符圖形的方法,將所說的指定的定向碼分類成一予定的層數(shù)。
14.如權(quán)利要求
13所述的方法,其中所說的字符圖形的掃描首先是在第一直線方向進(jìn)行,然后在與第一直線垂直的第二直線方向上,此后再沿第一直線和第二直線的相反方向,從而在每一掃描期間檢測出的定向碼按照對每一層的檢測順序被分類到予定的層數(shù)上。
15.如權(quán)利要求
10所述的方法,其中所說的第二多元格網(wǎng)區(qū)域中的至少兩個相鄰區(qū)域有一個由選定的一個或多個第一多元子區(qū)域確定的共同重疊區(qū)域。
專利摘要
一種字符識別方法包括有對每個確定字符圖形輪廓的象素指定一多元預(yù)定定向碼的步驟。而后,已經(jīng)指定有定向碼字符圖形被細(xì)分成多元格網(wǎng)區(qū)域,在該情況中,按照本發(fā)明,字符圖形并不直接細(xì)分成格網(wǎng)區(qū)域,而是將字符圖形先細(xì)分成第一多元子區(qū)域,然后再將第一多元子區(qū)域中至少部分區(qū)域結(jié)合,將第一多元子區(qū)域轉(zhuǎn)變成數(shù)目上少于第一多元子區(qū)域的第二多元子區(qū)域。這種字符圖形的兩步細(xì)分過程在吸收如手寫字符的字符圖形變形所引起的波動是先進(jìn)的。
文檔編號G06K9/48GK87105416SQ87105416
公開日1988年1月20日 申請日期1987年7月3日
發(fā)明者立川道義 申請人:株式會社理光導(dǎo)出引文BiBTeX, EndNote, RefMan