專利名稱:模式識別系統(tǒng)的制作方法
本發(fā)明涉及一種用來識別在兩維平面上定義的模式的模式識別系統(tǒng)和方法,本發(fā)明特別涉及一種利用與模式有關(guān)的特征向量來識別諸如字符模式或語音模式等模式的系統(tǒng)和方法。更確切地說,本發(fā)明涉及一種特別適于識別手寫字符的模式識別方法和系統(tǒng)。
日本專利申請59-202822和58-202825中披露了一種采用多層方向直方圖的模式識別方法。上述兩個(gè)申請轉(zhuǎn)讓給本申請的受讓人,因而上述兩個(gè)申請被作為參考。根據(jù)這個(gè)采用了多層方向直方圖的模式識別方法,首先,多個(gè)予定方向碼被指定為周邊象素,沿著一個(gè)模式(例如字符模式)的輪廓而安置。然后,該模式的方向碼從環(huán)繞字符模式的幀圖象的一邊向另一邊掃描,從而檢測出一個(gè)在一個(gè)或多個(gè)白象素(背景)之后出現(xiàn)的方向碼,這個(gè)被檢測出的方向碼根據(jù)沿掃描線的狀態(tài)等級而被劃分到多個(gè)予定層的一層。然后,對于該模式幀圖象內(nèi)每一個(gè)細(xì)分的區(qū)域,至到予定層的每一層相對于方向碼組成一個(gè)直方圖;因而,具有這種直方圖的向量被作為分量(各特征的總數(shù))而被用作為一個(gè)模式的特征向量。
例如,可以訂出8種不同類型的予定的方向碼,一個(gè)模式的幀圖象可以被細(xì)分為4×4個(gè)格網(wǎng)區(qū)域。在這種情況下,如果方向碼被分到第一和第二層,那么特征向量的維數(shù)是256(=4×4×2×8)。
考慮一個(gè)庫(也就是已知模式特征向量的集合),從多個(gè)模式中析取每一種模式的相同的特征向量,將它們的平均值作為庫的特征向量或參考模式而寄存在庫中。
應(yīng)注意的是細(xì)分一個(gè)模式幀圖象的區(qū)域的方法將不僅限于上述申請所披露的內(nèi)容。例如,同上述申請所披露的模式識別方法相似,可以采用一種方法,在這種方法中,一個(gè)模式的區(qū)域被細(xì)分成使得方向碼均勻地分布的格網(wǎng)區(qū)域,按照予定的參量這些被細(xì)分的格網(wǎng)區(qū)域部分地重合,因而細(xì)分的數(shù)目減至最少。一種帶有這種細(xì)分方法的多層方向直方圖的模式識別方法已由這項(xiàng)申請的申請人提出。
在這樣一種采用多層方向直方圖的模式識別系統(tǒng)中,為了辨認(rèn)出一個(gè)未知的輸入模式,要計(jì)算從未知模式中析取的特征向量和庫(參考)模式的特征向量之間的匹配距離。在這種情況下,如果特征向量的維的數(shù)目或量級變大,那么計(jì)算距離的數(shù)量也變得很大,因而匹配計(jì)算過程需要很長的時(shí)間。
本發(fā)明的主要目的是要避免上述現(xiàn)有技術(shù)存在的缺點(diǎn),以提供一種改進(jìn)的模式識別方法和系統(tǒng)。
本發(fā)明的另一個(gè)目的是提供一種采用多層方向直方圖來識別一種模式(例如字符模式)的改進(jìn)的方法和系統(tǒng)。
本發(fā)明的進(jìn)一步的目的是提供一種改進(jìn)的方法和系統(tǒng),以高速和高識別率來識別一種模式。
本發(fā)明的進(jìn)一步目的是提供一種改進(jìn)的模式識別方法和系統(tǒng),能夠有效地執(zhí)行匹配計(jì)算。
本發(fā)明的進(jìn)一步目的是提供一種改進(jìn)的模式識別方法和系統(tǒng),以適于使用機(jī)器來識別手寫字符、字母和符號。
本發(fā)明的進(jìn)一步目的是提供一種改進(jìn)的模式識別方法和系統(tǒng),可以減少用于存貯已知字符的參考數(shù)據(jù)所需的庫的容量。
本發(fā)明的其它優(yōu)點(diǎn)和新的特征將在下面結(jié)合附圖對本發(fā)明進(jìn)行詳細(xì)說明時(shí)可以體現(xiàn)出來。
圖1是根據(jù)本發(fā)明的一個(gè)實(shí)施例而給出的一種模式識別系統(tǒng)的方框圖;
圖2a至2c表示當(dāng)圖1所示的系統(tǒng)工作在記錄方式時(shí),庫形成過程的各步驟順序的流程圖;
圖3表示當(dāng)圖1所示的系統(tǒng)工作在識別方式時(shí),模式識別過程的各步驟順序的流程圖;
圖4是根據(jù)本發(fā)明的另一個(gè)實(shí)施例的一個(gè)模式識別過程的各步驟順序的流程圖;
圖5是根據(jù)本發(fā)明的又一個(gè)實(shí)施例的一個(gè)模式識別過程的各步驟順序的流程圖;
圖6是一幅用來說明在多層方向直方圖方法中被采用的特征向量的性質(zhì)的圖表;
圖7是根據(jù)本發(fā)明的另一個(gè)實(shí)施例而給出的一種模式識別系統(tǒng)的方框圖;
圖8表示圖7所示的系統(tǒng)所進(jìn)行的匹配過程的各步驟順序的流程圖;
圖9是根據(jù)本發(fā)明的另一實(shí)施例的匹配過程的各步驟順序的流程圖;
圖10a和圖10b是用來說明特征向量重新排列的圖;
圖11是根據(jù)本發(fā)明的一個(gè)實(shí)施例而設(shè)計(jì)的一種字符識別方法的各步驟順序的流程圖;
圖12是根據(jù)本發(fā)明另一個(gè)實(shí)施例而設(shè)計(jì)的一種光字符識別系統(tǒng)的功能方框圖;
圖13用來說明在本發(fā)明的模式識別方法和系統(tǒng)中適用的多個(gè)予置方向碼;
圖14示出了一個(gè)字符模式的例子;
圖15示出了當(dāng)圖13所示的方向碼作為周邊象素沿圖14所示的字符模式的輪廓而排列的結(jié)果;
圖16可用于說明垂直于圖14所示的字符模式進(jìn)行光掃描以確定一個(gè)字符模式周邊的方法;
圖17a到圖17c給出了對圖15所示的字符模式掃描后得到的周邊圖表;
圖18表示圖18a(1)和圖18a(2)是如何聯(lián)接的;
圖18a(1),18a(2),和18b一起表示周邊測定過程的各步驟順序的流程圖;
圖19a到19c是對于圖15所示的字符模式的格網(wǎng)區(qū)域所得到的有意義的分層象素的方向碼的直方圖;
圖20表示圖20a和20b是如何聯(lián)接的;
圖20a和20b表示按圖20所示聯(lián)接時(shí),一種直方圖形成過程各步驟順序的流程圖;
圖21是細(xì)分方法#1的各步驟順序的流程圖;
圖22a和22b表示用細(xì)分方法#1分割的結(jié)果;
圖23a和23b用來說明當(dāng)使用固定分割點(diǎn)進(jìn)行格網(wǎng)細(xì)分時(shí)碰到的問題;
圖24是細(xì)分方法#2的各步驟順序的流程圖;
圖25a和25b表示對用細(xì)分方法#1和細(xì)分方法#2所得的結(jié)果進(jìn)行的比較;
圖26是細(xì)分方法#3的各步驟順序的流程圖;和圖27a和27b表示對用細(xì)分方法#2和細(xì)分方法#3所得的結(jié)果進(jìn)行的比較。
根據(jù)本發(fā)明的第一種觀點(diǎn),當(dāng)一種模式用光學(xué)方法讀出時(shí),則形成多層方向直方圖並且析取特征量。然后,在存入庫中作為參考模式或者與存貯在庫中的一個(gè)參考模式相比較之前,重新排列特征向量的各個(gè)分量。在多層方向直方圖方法中,特征向量所包含的一些分量對模式識別很有利,一些分量則對模式識別影響不大。為了更詳細(xì)地說明,我們來研究一個(gè)兩維的特征向量。當(dāng)庫(參考)數(shù)據(jù)由具有二維的多層方向直方圖方法形成時(shí),在日語中,“字符識別”四個(gè)日語漢字的特征向量,可用圖6中的g1,g2,g3,g4來表示。在這個(gè)例子中,從圖中可以看到,這些特征向量在水平方向都有一個(gè)第一分量A,它的方差或者規(guī)范偏差要比垂直方向的第二分量B大。換句話說,在用以對一個(gè)未知模式進(jìn)行識別時(shí),特征向量的分量A比分量B有較高的識別能力。
注意特征向量的這樣一種性能,如果按照這種模式識別特性從高端進(jìn)行匹配距離的計(jì)算,這些參考模式在對這些相對高的維計(jì)算匹配距離的階段沒有可能成為候選模式,因而排除用于模式識別的可能性。為了鑒別一個(gè)輸入的未知模式,可以成為候選模式的參考模式的數(shù)目在識別操作的初期階段可能會明顯地減少,不必對所有的參考模式,對特征向量的每維都進(jìn)行匹配距離的計(jì)算。重要的是,即使各維的分量的次序重新排列,由多層方向直方圖所得到的特征向量仍具有可保持該模式的特征的特性。
根據(jù)本發(fā)明的這個(gè)觀點(diǎn),其焦點(diǎn)集中在上述的特性里,首先,依照多層方向直方圖方法得到所有模式種類的暫時(shí)的或臨時(shí)的庫模式的特征向量,然后,根據(jù)規(guī)范偏差或方差的維的次序,使特征向量的分量重新排列以規(guī)定新的向量,這些新向量被存貯起來作為重新規(guī)定的庫的特征向量或庫中的參考模式。並且,根據(jù)本發(fā)明的這個(gè)觀點(diǎn)進(jìn)行的模式識別,是用多層方向直方圖的方法從一個(gè)輸入的未知模式來析取特征向量,根據(jù)規(guī)范偏差或方差的次序使析取的特征向量的各分量重新排列形成一個(gè)重新規(guī)定的特征向量,實(shí)現(xiàn)重新規(guī)定的特征向量和存貯在庫中的每個(gè)模式種類的庫模式的特征向量之間的匹配,從最高維降至第N維以計(jì)算匹配距離,這個(gè)計(jì)算出的匹配距離同相應(yīng)的所涉及的模式種類的閾值相比較,以確定是否匹配。根據(jù)這個(gè)比較結(jié)果來確定所涉及的模式種類的匹配是中止還是對模式種類用較低的維進(jìn)行進(jìn)一步的匹配操作。
閾值與計(jì)算的匹配距離相比較是用下面的方法來判別的。對于每種模式種類,特征向量是用多層方向直方圖方法從每一個(gè)模式中析取的,然后產(chǎn)生重新規(guī)定的特征向量,這些特征向量具有按照規(guī)范偏差或方差的各維的次序被析取的特征向量被重新排列的分量。然后,在重新規(guī)定的特征向量和一個(gè)庫中的特征向量或存貯在一個(gè)庫中的相同模式種類的參考向量之間,一個(gè)匹配距離的規(guī)范偏差或方差,從最高維數(shù)降至第N維來計(jì)算。然后,各種模式的每一個(gè)閾值是由計(jì)算出的規(guī)范偏差或方差來確定。
根據(jù)模式識別方法和系統(tǒng),根據(jù)本發(fā)明的這個(gè)觀點(diǎn),在輸入的未知模式和庫模式或參考模式之間的匹配過程中,庫模式或參考模式不可能成為判定輸入的未知模式的候選模式時(shí),匹配過程在初期階段便中止,以便提高匹配效率和加快模式識別速度。另外,為了檢測匹配的中止,對于每一個(gè)模式種類都分別設(shè)置了閾值,與庫或參考模式匹配的錯(cuò)誤的中斷,也不影響候選模式的出現(xiàn),因此,使用多層方向直方圖方法的模式識別過程的實(shí)質(zhì)性優(yōu)點(diǎn)不會損失,同時(shí)會帶來高的識別率。
現(xiàn)在參見圖1,圖1示出了根據(jù)本發(fā)明的一個(gè)實(shí)施例而設(shè)計(jì)的模式識別系統(tǒng)的功能方框圖,它特別適用于使用機(jī)器來識別諸如手寫日語漢字或漢字之類的手寫字符,作為識別的目標(biāo)模式。如已表明的,模式識別系統(tǒng)包括一個(gè)從原文用光來讀取字符模式,並且提供字符模式信息讀到予處理部件12去的讀部件10,例如在予處理部件12里,各個(gè)字符模式被分別細(xì)分,每一個(gè)被細(xì)分的字符模式都被規(guī)范化。于是,一個(gè)被予處理了的字符模式從予處理部件12一個(gè)一個(gè)地送至特征析取部件14。在特征析取部件14中,字符模式由多層方向直方圖方法來進(jìn)行處理,以便析取特征向量。
圖1中所示的字符識別系統(tǒng)有兩種工作方式,也就是(1)用以形成庫或者參考模式的記錄方式和(2)利用與存貯在庫中的已知的參考模式進(jìn)行比較,以識別輸入的未知模式的識別方式。首先,將由圖2a到圖2c所示的流程圖來說明記錄方式工作過程,用于形成存貯在庫中的庫或者參考模式的各步驟。
對于一個(gè)特定的字符種類,多個(gè)(M)字符模式被字符讀部件10一個(gè)接一個(gè)的由光讀取(步58)。這個(gè)字符模式的讀出服從于予處理部件12執(zhí)行的予處理過程(步52),然后,這種被予處理過的字符模式被饋送到特征析取部件14,在部件14中,一個(gè)特征向量(也即一個(gè)具有256維的向量)用多層方向直方圖方法被析取(步54)。這種被析取的特征向量通過重新排列部件16被送至庫形成部件20。用這個(gè)庫形成部件20得到一個(gè)從M個(gè)輸入字符模式中析取的特征向量的平均向量(步56)。這個(gè)平均向量暫時(shí)寄存在庫22中,作為這個(gè)字符種類的暫時(shí)庫模式的特征向量(步58)。在庫形成部件20中,檢驗(yàn)這個(gè)過程是否執(zhí)行到最后的字符種類(步60),如果檢驗(yàn)發(fā)現(xiàn)還有一個(gè)字符種類要處理,那么它將要返回到第50步對下一個(gè)字符種類進(jìn)行類似的處理。
直到所有的字符種類都處理完畢,則進(jìn)入重新排列表形成部件26,在這里對于暫時(shí)存貯在庫22中的暫時(shí)庫模式的所有特征向量的每一維計(jì)算出規(guī)范偏差或方差(步62)。之后,按每維所具有規(guī)范偏差或方差的大小順序?qū)υ继卣飨蛄恐匦屡帕?,形成一個(gè)重新排列表並且將這個(gè)重新排列表存貯在重新排列表部件18中(步64)。直到這一步,規(guī)定了一個(gè)重新排列表,從這之后,開始庫形成的有效的過程。
對于一個(gè)特殊的字符種類K,多個(gè)(M)字符模式由模式讀部件10按順序用光讀出(步66)。這些讀出的字符模式被予處理部件進(jìn)行處理(步68)然后送至特征析取部件14,在部件14里特征向量用多層方向直方圖方法被析取(步70)。這種被析取的特征向量的各分量根據(jù)存貯在重新排列表部件18中的重新排列表並由重新排列部件16以各維所具有的較大的規(guī)范偏差或方差的順序來重新排列(步72)。這些M個(gè)特征向量連同它們的分量被重新排列后提供給庫形成部件20,並且它們的平均向量被寄存在庫20中,作為字符種類K的庫或參考模式的完整的特征向量(步74)。在庫形成部件20中,檢驗(yàn)庫形成處理過程是否對所有的字符種類(K種類)都進(jìn)行了處理,如果還有一個(gè)字符種類要處理,那么從第66步開始對剩下的字符種類執(zhí)行類似的處理。直至完成對所有字符種類的處理,則庫本身構(gòu)成的過程宣告終止,但是,現(xiàn)在要執(zhí)行對閾值檢測步驟。
在閾值測定過程中,輸入相同的多個(gè)(M)字符模式,這些字符模式被用來組成每個(gè)字符種類的庫(步78),接著進(jìn)行予處理(步80),應(yīng)用多層方向直方圖方法來析取特征向量(步82)。在重新排列部件16中,根據(jù)重新排列表對M個(gè)字符模式的各分量進(jìn)行重新排列(步84),然后送至匹配部件24。之后,閾值測定是在匹配部件24和閾值測定部件28之間共同執(zhí)行的。也就是說,每個(gè)被重新排列的特征向量和字符種類K的庫模式的特征向量之間的匹配距離是從最高維降到第N維來計(jì)算的,根據(jù)這種計(jì)算的匹配距離,在閾值測定部件28,從最高維降到第N維來計(jì)算匹配距離的規(guī)范偏差(步86)。所計(jì)算的規(guī)范偏差被寄存在閾值表部件30中,作為用于特殊字符種類K的一個(gè)閾值(步88)。同樣,其它字符種類的閾值也被測定並也存貯在閾值表部件30中。如果確定每個(gè)字符種類的閾值都已測定並已被存貯(步80),那么記錄方式的操作則可終止。
下面將說明如圖1所示的模式識別系統(tǒng)的有關(guān)識別方式的操作。圖3給出了這種識別工作方式的各步驟順序圖。如圖3所示,一個(gè)未知的字符模式用模式讀部件10輸入作為一個(gè)被識別的目標(biāo)(步100),之后由予處理部件進(jìn)行予處理(步102),一個(gè)特征向量(例如256維的向量)由具有本申請的多層方向直方圖方法的特征析取部件14來析取(步104)。然后,其特征向量的各分量由重新排列部件16根據(jù)重新排列表來重新排列,被重新排列的特征向量Yn接著被送至匹配部件24(步106)。在匹配部件24中,字符種類K的庫模式的特征向量FKn和未知模式的特征向量Yn之間的匹配距離d是從最高維降到第N維計(jì)算的(步108)。這個(gè)被計(jì)算出的匹配距離d與寄存在閾值表部件30中的相應(yīng)的字符種類K的閾值ThK相比較(步110)。
比較結(jié)果,如果出現(xiàn)d比ThK大的情況,那么未知模式的字符種類就不可能是現(xiàn)行的字符K,于是在第116步立即中止與庫模式的匹配過程。相反,如果出現(xiàn)d等于或小于ThK的情況,那么現(xiàn)行的字符種類有可能是未知字符模式的字符種類,于是要執(zhí)行更進(jìn)一步的匹配過程。也就是在這種情況,一個(gè)完整的匹配距離D是對所有維來計(jì)算的(步112)。距離D與現(xiàn)行的候選距離相比較,具有較小距離的候選距離則被重新規(guī)定為一個(gè)新的候選距離(步114),然后進(jìn)行到第116步。在第116步里,如果判定還有一個(gè)字符種類要進(jìn)行匹配,那么對下一個(gè)字符種類則進(jìn)行包括第108步等步驟的匹配處理過程。如果已對全部字符種類都進(jìn)行了匹配處理,那么在第116步將結(jié)束這個(gè)循環(huán),並且最后剩下的候選字符種類的字符碼作為識別的結(jié)果而輸出。至此,一個(gè)未知字符模式的識別過程就完成了。
當(dāng)用手寫的時(shí)候,字符會出現(xiàn)畸變的情況。為了處理這種情況,要考慮制定各種可能修改的字符,並且用這些字符組成參考模式存貯在庫中。甚至在這種情況,手寫字符模式和庫模式之間的匹配率視模式識別系統(tǒng)的用戶而變。另外,甚至對相同的用戶,當(dāng)該用戶多次使用該字符識別系統(tǒng)時(shí),與庫中參考模式的匹配率也要提高。在這種情況下,為了測定是否執(zhí)行進(jìn)一步或繼續(xù)匹配操作,如果閾值可以變化,那么它是可取的。也就是,在用戶與庫有很好的匹配率或者一個(gè)熟練的用戶使用該系統(tǒng)的情況下,測定的閾值最好是規(guī)定的較低,以減少執(zhí)行進(jìn)一步匹配的次數(shù),因而能提高識別速度而不降低識別率。
下面將介紹本發(fā)明的這一觀點(diǎn)的另一個(gè)實(shí)施例,在這個(gè)實(shí)施例中允許修正這樣的一個(gè)閾值。因?yàn)檫@個(gè)實(shí)施例的功能與前面所介紹的實(shí)施例相似,所以這個(gè)實(shí)施例的方框圖略去不畫,而為了說明這個(gè)實(shí)施例將利用圖1所示的方框圖。在這個(gè)實(shí)施例中,記錄(庫形成)方式與前述的實(shí)施例相似,也要構(gòu)成一個(gè)重新排列表和一個(gè)庫。但是,與上述的實(shí)施例不同的是,為了確定對每一個(gè)字符種類是否進(jìn)行進(jìn)一步的匹配而規(guī)定了多個(gè)閾值。
參考圖2的流程圖並結(jié)合上述的實(shí)施例來介紹這個(gè)觀點(diǎn),如果在第88步里測定的閾值標(biāo)為ThK,在本實(shí)施例中,用閾值檢測部件28測定值ThK/1,ThK/2,…,ThK/L(L是一個(gè)正整數(shù))作為字符種類K的閾值ThK(1),ThK(2),…,ThK(L),並將它們寄存在閾值表部件30中。圖4的流程圖給出了在實(shí)施識別工作方式期間的各步驟順序。下面將參照圖4介紹本實(shí)施例的模式識別方式的操作。
在本實(shí)施例中,用戶水平UL(=1,2,3,…L)是一個(gè)用于選擇閾值的參量,並置于起始步200。這個(gè)用戶水平可由模式識別系統(tǒng)的用戶來指定。從第202步到第210步的過程與圖3的第100步到第108步的過程相同。另外,從第214步到220步的過程與圖3的第112到118步的過程相同。第212步是為了根據(jù)從最高維降到第N維的匹配距離來測定是否要進(jìn)一步匹配,這一步相應(yīng)于圖3的第110步。在本實(shí)施例中,對于字符種類K從閾值Th(1)到Th(L)多個(gè)閾值中選擇閾值Th(UL)作為測定的閾值,這個(gè)閾值相當(dāng)于用戶水平UL的閾值。
就是說,在用戶熟悉本實(shí)施例模式識別系統(tǒng)的情況下,如果用戶水平置為高(L最大),則為了檢測選擇較低閾值(Th(L)在最小值),結(jié)果是降低了進(jìn)一步匹配(步214),因而得到高的匹配率並提高了字符識別速度。相反,在用戶不熟悉或用戶與庫匹配率較低的情況下,如果選定低的用戶水平(L最小),則為了檢測,選擇較大的閾值(ThK(L)為最大值),使得進(jìn)一步處理過程的次數(shù)增加,因而識別速度降低,識別率提高。
上面的介紹表明,識別率的不同取決于用戶也取決于字符種類的不同。當(dāng)使用一個(gè)具有一定傾向的模式作為庫組成模式的情況下,則更為突出。在庫形成過程期間,在有許多字符種類的日文漢字和漢字情況下來檢驗(yàn)是困難的。本發(fā)明的這一觀點(diǎn)的進(jìn)一步的實(shí)施例是為了避免隨著字符種類而識別率發(fā)生波動的問題。這個(gè)進(jìn)一步的實(shí)施例也有與第一個(gè)實(shí)施例相同功能的結(jié)構(gòu)。另外,庫形成方式的處理過程與第二個(gè)實(shí)施例相同,因而對每個(gè)字符種類要測定Th(1)到Th(L)的多個(gè)閾值。
圖5示出了第三個(gè)實(shí)施例模式識別方式的操作的各步驟順序的流程圖。圖5中的第300步至第308步的過程與圖4的第202步至210步的過程相同。圖5中的第314步至320步的過程與圖4中的第214步至第220步的處理過程相同。在第310步,對于每字符種類設(shè)置了電平LV,作為用來選擇閾值的參量V。例如,在模式識別系統(tǒng)工作期間,對于一個(gè)特殊字符種類K,這個(gè)電平LV(K)是由存入的拒絕/識別比PK來給定的,這個(gè)PK的值是被一個(gè)常數(shù)來除的。第312步相應(yīng)于圖4的第212步,在這里,從字符種類K的ThK(1)到Th(L)的多個(gè)閾值中選擇一個(gè)相應(yīng)于參量V的單個(gè)閾值ThK(V),並與距離d相比較以確定是否進(jìn)行更進(jìn)一步的處理(步314)。
要指出的是,本發(fā)明的這一觀點(diǎn)的第四個(gè)實(shí)施例可以由本發(fā)明的這一觀點(diǎn)的第二和第三個(gè)實(shí)施例結(jié)合起來確定,第四個(gè)實(shí)施例將參照圖5所示的流程圖予以介紹。在第四個(gè)實(shí)施例中,在第300步之前增加了一步用來設(shè)置用戶水平(相應(yīng)于圖4中的第200步)。另外,在第310步,字符種類K的電平LV(K)和用戶水平UL之間的和作為參量V。在第312,為了檢測使用了相應(yīng)于參量V的閾值ThK(V)。這部分和前面介紹的各個(gè)實(shí)施例依然是相同的。在第四個(gè)實(shí)施例中,避免了由于用戶和/或字符種類而引起的波動,並且利用最佳的閾值來確定是否進(jìn)行進(jìn)一步的匹配,這就使第四實(shí)施例兼有第二和第三實(shí)施例二者的優(yōu)點(diǎn)。
現(xiàn)在來介紹本發(fā)明的另一個(gè)觀點(diǎn)。匹配是在被識別的未知模式和庫模式之間來比較,計(jì)算在未知的特征向量的相應(yīng)維度的分量和庫模式之間的距離或相似的程度,測定一個(gè)具有最小距離之和或最大的相似之和的庫模式作為識別的結(jié)果。按照本發(fā)明的第二種觀點(diǎn),在一個(gè)庫的形成中,對于一個(gè)庫模式的特征向量的每一維計(jì)算一個(gè)規(guī)范偏差或方差,並且每個(gè)庫模式的特征向量的各個(gè)分量按從較大的規(guī)范偏差或方差到較小的規(guī)范偏差或方差的順序重新排列,重新排列的特征向量被寄存在庫中。
我們假定一個(gè)庫模式的特征向量是由多層方向直方圖法形成並具有如圖10a所示的分量,並還假定每一維都有計(jì)算的規(guī)范偏差或方差,對于完整的庫模式各維按從高到低的順序X4,X1,X7,X5,X2,X3,X6等排列。然后,特征向量的各維X1,X2,X3等的各個(gè)分量按圖10b所示重新排列並被存貯在庫中。也就是重新排列后,原始特征向量的X4維的分量變成了新特征向量的最高Y1維分量,原始特征向量的最高X1維分量變成新特征向量的第二最高位Y2維分量。因此,從被識別的未知模式析取一個(gè)特征向量的各分量按照庫模式的特征向量的分量重新排列的次序而被重新排列。之后,為了在未知模式和庫模式之間對較高的維進(jìn)行匹配,同庫模式的特征向量的相應(yīng)維的分量的距離或相似程度被優(yōu)先計(jì)算。根據(jù)本發(fā)明的第二種觀點(diǎn),在這種方法中庫模式和未知模式之間的匹配是有效地利用一個(gè)有優(yōu)先模式識別能力的高的特征向量的分量,從而來識別未知模式。
參照圖7,圖7根據(jù)本發(fā)明的一個(gè)實(shí)施例簡要地示出了一個(gè)字符模式識別系統(tǒng)結(jié)構(gòu)的方框圖。圖7所示的系統(tǒng)包括有一個(gè)庫410,這個(gè)庫存貯了由多層方向直方圖法組成的參考字符模式特征向量的集合,如前面所述的每個(gè)特征向量的分量是按具有較大規(guī)范偏差到較小規(guī)范偏差的各維的順序重新排列的。這里,存貯在庫中的多個(gè)參考模式(K)之間的一個(gè)庫模式K的n維的分量gkn的規(guī)范偏差σn可按下面的公式來計(jì)算。
其中g(shù)nn維的平均數(shù)。
當(dāng)然,可以用方差來代替規(guī)范偏差,上述公式是規(guī)范偏差的平方根,用來按從較大方差到較小方差的各維的順序重新排列一個(gè)特征向量的各個(gè)分量。
圖7的系統(tǒng)還包括一個(gè)重新排列表412,它是在庫形成期間形成的。在前面所述的重新排列之前和之后,在重新排列表412中寄存了一個(gè)相應(yīng)的庫模式的特征向量分量的表。這個(gè)系統(tǒng)還包括一個(gè)模式讀部件414,它用光讀取原件上的字符模式並將字符模式信息供給予處理部件416。在予處理部件416中,從讀部件414提供的字符模式被分成單獨(dú)字符模式,然后進(jìn)行規(guī)范化,被予處理的字符模式被一個(gè)字符一個(gè)字符地送到特征析取部件418。在特征析取部件418中,一個(gè)輸入字符模式(在下文也還標(biāo)為未知模式)遵循多層方向直方圖法,而從該未知模式析取特征向量。然后,這個(gè)被析取的特征向量被送至重新排列部件420。
在重新排列部件420中,借助于重新排列表412,從未知模式析取的特征向量的各個(gè)分量以和庫模式的特征向量的各分量相同維的順序來重新排列,重新排列后的特征向量輸入到匹配部件422中。在匹配部件422中,對于較高的維優(yōu)先計(jì)算庫模式的特征向量和重新排列后的未知模式的特征向量之間的距離以進(jìn)行未知向量同每個(gè)庫模式的匹配,從而鑒別未知模式。在這個(gè)系統(tǒng)中還提供了一個(gè)輸出部件424,它輸出匹配部件422中所確定的識別的結(jié)果。
匹配部件422的處理過程將參照圖8的流程圖介紹。當(dāng)重新排列后的未知模式的特征向量輸入匹配部件422時(shí),庫模式的編號K置“1”(步500)並進(jìn)行庫模式和未知模式之間的匹配。首先,從最高維到第N維來計(jì)算庫模式的特征向量的各個(gè)分量fkn(n維)和未知模式的特征向量的各分量Yn之間的各個(gè)距離之和dk(步502)。然后這個(gè)距離之和dk與閾值Th相比較(步504)。如果比較結(jié)果出現(xiàn)dk大于Th的情況,則此時(shí)匹配中斷並結(jié)止,因?yàn)楝F(xiàn)行的庫模式?jīng)]有成為候選模式的機(jī)遇,于是庫模式編號K遞增之后,處理程序返回到步502(步506)。
如果在步504得到dk等于或大于Th的情況,則進(jìn)行進(jìn)一步的匹配操作,因?yàn)楝F(xiàn)行庫模式可以成為用于鑒別的候選模式。進(jìn)一步匹配操作是從緊接的維到第N維直到最低維(這里是第256維)(步508)計(jì)算庫模式和未知模式之間的距離DK的匹配操作。然后,未知模式和候選模式的每一個(gè)之間的距離與這個(gè)重新得到的距離比較,並得到一個(gè)候選模式的予定數(shù)字被作為較小距離的順序排列(步510)。然后程序經(jīng)步506返回到步502,直到完成最后的庫模式的匹配,在步507得到K等于或大于MAX的情況,于是輸出一個(gè)候選模式(字符)的代碼(步512),因而完成了未知模式的匹配操作。
在本實(shí)施例的這種方法中,首先對具備高的模式識別能力的較高的維進(jìn)行計(jì)算,然后這個(gè)計(jì)算出的距離同一個(gè)閾值相比較,以排除那些沒有可能成為未知模式的候選模式的庫模式,因此僅僅允許對那些可以成為未知模式的候選模式的庫模式的所有的維進(jìn)行距離計(jì)算。換句話說,庫模式的分類由從最高維到第N維的較高維的匹配來進(jìn)行的,因而某些沒有機(jī)會成為候選模式的庫模式被排除掉,消除了不必要的距離計(jì)算。利用這種結(jié)構(gòu),距離計(jì)算的總數(shù)被有效地減少,使得識別速度和識別率有明顯地改善。
現(xiàn)在來介紹本發(fā)明的第二種觀點(diǎn)的第二個(gè)實(shí)施例。這個(gè)實(shí)施例總的功能結(jié)構(gòu)和上述的第一個(gè)實(shí)施例相同,僅僅有部分的匹配過程的方法不同。因此,參照圖9所示的流程圖僅僅介紹匹配部件422的操作。當(dāng)未知模式的特征向量重新排列后被送到匹配部件422時(shí),庫模式的K編號置為“1”(步600)並進(jìn)行庫模式和未知模式間的匹配操作。首先,從最高維到第N維計(jì)算庫模式的特征向量的分量fkn和未知模式的特征向量Yn之間的距離總和dk1(步602)。然后,這個(gè)距離總和dk1與閾值Th1比較(步604)。如果比較結(jié)果表明dk1大于Th1,則匹配操作立即中止,因?yàn)楝F(xiàn)行庫模式不可能成為候選模式(字符),因此在步606中庫模式的編號K遞增之后,程序返回到步602。也就是說,庫模式的分類是基于從最高維到第N1維的計(jì)算,對于這些由于分類的結(jié)果而被排除庫模式不進(jìn)行進(jìn)一步的匹配操作。
如果在步604中得到的條件是dk1等于或小于Th1,則降到第N2維(這里N2是比N1大的維數(shù))來計(jì)算距離的總和dk2(步608)。dk2與閾值Th2比較(步610),如果得到dk2大于Th2的情況,則現(xiàn)行庫模式從候選模式中消去,程序經(jīng)步606返回到步602。也就是,庫模式的中間分類的進(jìn)行是基于被計(jì)算的距離降至第N2維,對于那些從候選模式中被排除掉的庫模式不進(jìn)行進(jìn)一步的匹配。另一方面,為了保留庫模式,另一個(gè)距離總和dk3是在較高維降到N3維(這里N3的維數(shù)比N2大)計(jì)算的(步612),並且所計(jì)算出的距離總和dk3與閾值Th3進(jìn)行比較(步614)。如果比較結(jié)果產(chǎn)生了dk3大于Th3的情況,則現(xiàn)行庫模式被排除掉,因?yàn)樗鼪]有可能成為候選模式,程序經(jīng)步606返回到步602。
于是在這些分類操作之后,剩余庫模式就有可能成為候選模式,因此,對這些剩余庫模式的每一個(gè)都計(jì)算出各維距離的總和DK(步616),然后轉(zhuǎn)到與圖8中步510相同的步618。在對最后一個(gè)庫模式的匹配操作完成之后,在步607中檢測出結(jié)束條件,因此輸出候選模式(字符)的代碼,從而完成對未識別模式的匹配操作。
根據(jù)這個(gè)具體的實(shí)施例方案,用上述方法通過逐步增加用于距離計(jì)算的維數(shù),在三個(gè)步中逐步縮減用于未識別模式的候選模式,并在每個(gè)縮減步中排除那些不可能成為候選模式的庫模式。借此,僅對這些作為上述三步縮減處理的結(jié)果而剩余的庫模式進(jìn)行全部的匹配操作。因此,距離計(jì)算量大大減少,從而識別速度顯著提高,識別率也提高了。值得注意的是在未識別模式和庫模式之間的匹配操作中使用的是距離,然而還可以使用相似的程度來代替距離。
現(xiàn)在來說明本發(fā)明的另一個(gè)目的。一般地說,在字符識別中,當(dāng)要處理的字符種類數(shù)量增加時(shí),識別率就會降低。為了解決這個(gè)問題,現(xiàn)有技術(shù)提出增加特征向量的維數(shù),并使用復(fù)雜的算法,但是這種現(xiàn)有技術(shù)的方法會產(chǎn)生如庫容量增加和識別速度降低的缺點(diǎn)。此外,在處理手寫字符的情況下還存在得到的識別率不能滿足需要的問題。
作為字符識別方法的一種類型,有一種方法包括根據(jù)予定的算法對字符圖象的特定段賦值予定特征的步驟和匯集通過細(xì)分字符圖象所限定的每個(gè)格網(wǎng)區(qū)域特征的步驟。在《OKI ELECTRICS RE-SEARCH AND DEVELOPMENT》,1983年12月121 Vol 50 No3第77頁至第82頁上公開了用于限定格網(wǎng)區(qū)域的細(xì)分方法。在該方法中,對利用字符圖象周邊分布重心的每個(gè)字符使用了包括(1)細(xì)分定點(diǎn)的方法。(2)細(xì)分可變定點(diǎn)的方法。在用于識別如手寫字符等具有較大變形的字符時(shí),方法(2)在穩(wěn)定特征方面具有優(yōu)點(diǎn)。但因?yàn)樵摲椒ɡ弥苓叿植嫉闹匦模杂糜诖_定細(xì)分格網(wǎng)點(diǎn)的計(jì)算量非常大,這就會降低處理速度。另一方面,在方法(1)中,盡管不需要很多的計(jì)算,但是對于如手寫字符等變形的字符來說,細(xì)分就變得不夠恰當(dāng),因此使這種方法不可能恰當(dāng)?shù)匚鋈∽址靥卣?。這個(gè)問題不僅對于如手寫日文漢字字符等具有較大變形的復(fù)雜字符存在,而且對于如手寫假名字符也存在。例如,鑒別假名字符“Wu”和假名字符“Wa”的關(guān)鍵在于頂部是否有額外的一豎筆劃,並且重要的是匯集該額外筆劃的信息。如果在這種情況下使用定點(diǎn)細(xì)分方法,該額外筆劃有時(shí)處于特定的格網(wǎng)區(qū)域中,有時(shí)因微小的變形不處在特定的格網(wǎng)區(qū)域中,以致匯集的信息變得不穩(wěn)定,因此會導(dǎo)致錯(cuò)誤識別。
本發(fā)明的這一目的特別是針對解決上述的問題,並提供一種能以高速和高比率對任何字符進(jìn)行字符識別的字符識別方法和系統(tǒng)。為此目的,本發(fā)明提供一種包括如下步驟的模式識別方法(a)對字符模式的黑色輪廓象素賦值方向代碼;
(b)從一邊沿垂直該邊的方向掃描該字符模式,從而檢測出第N個(gè)周邊象素,該象素就是從白到黑的第N個(gè)變化點(diǎn);
(c)對于字符模式的每個(gè)細(xì)分的區(qū)域,形成第N個(gè)周邊象素的方向代碼的直方圖;
(d)利用第N個(gè)周邊象素的方向代碼直方圖為特征,進(jìn)行與庫之間的匹配操作。
根據(jù)本發(fā)明的這個(gè)目的,還提供了一種包括如下步驟的模式識別方法(a)從一幀圖象的每條邊沿垂直于該邊的方向環(huán)繞字符圖象對該字符圖象進(jìn)行掃描,并根據(jù)沿掃描線出現(xiàn)的順序,在特征的信息變化到每層中的一層處對有意義的象素進(jìn)行分類;
(b)當(dāng)利用一個(gè)細(xì)分方向作為輔助掃描方向?qū)υ撟址麍D象進(jìn)行光柵掃描時(shí),對有意義的象素進(jìn)行計(jì)數(shù),根據(jù)這種計(jì)數(shù)值確定細(xì)分點(diǎn),并且利用這些確定的細(xì)分點(diǎn)把字符圖象細(xì)分成網(wǎng)格區(qū)域;
(c)對于每一個(gè)格網(wǎng)區(qū)域形成被分類成多層的重要象素的直方圖;
(d)利用該直方圖與庫進(jìn)行匹配操作。
在這里,“特征”這個(gè)術(shù)語表示一種參數(shù),該參數(shù)與字符模式本身密切相關(guān),並為每個(gè)象素或每個(gè)區(qū)域(對相鄰象素的匯集)提供參考數(shù),例如字符模式的灰度(諸如在二進(jìn)制模式下的白與黑)。此外,“特征信息變化點(diǎn)”這個(gè)術(shù)語表示一個(gè)灰度(特征)變化的點(diǎn),例如在字符模式的背景部份(在二進(jìn)制模式情況下白色部份)和字符部份(在二進(jìn)制模式情況下黑色部份)之間的邊界,或者賦值給該字符模式的方向代碼(特征)變化的那個(gè)點(diǎn)。
參看圖12,該圖以方框圖的形式表示了根據(jù)本發(fā)明第三個(gè)目的的一個(gè)實(shí)施方案構(gòu)成的光字符識別系統(tǒng)。如圖所示,有一個(gè)用于在原文上用光讀字符圖象以產(chǎn)生圖象信號的掃描器721。該圖象信號接著送入字符析取部件722,在字符析取部件里,從輸入圖象信號中分離出單獨(dú)的字符圖象信號。分離出的單獨(dú)字符圖象送入噪聲消除部件723,在噪聲消除部件里從字符圖象中消除噪聲部份。然后,該字符圖象通過規(guī)格化部件724被規(guī)格化,並被存貯到字符存貯器725中。在圖12的系統(tǒng)中有一個(gè)特征析取部件726,該特征析取部件處理具有從中析取特征的輸入字符圖象,并且有一個(gè)通過特征析取部件726進(jìn)行存取操作的工作存貯器727。匹配部件728用于在通過特征析取部件726析取的輸入字符圖象特征和每個(gè)庫或存貯在庫存貯器729中的每個(gè)參考字符的特征之間進(jìn)行匹配操作。還有一個(gè)輸出部件730用于輸出通過匹配部件728進(jìn)行匹配操作的結(jié)果。
現(xiàn)在特別參看圖11中所示的流程圖對特征析取部件726中的處理操作進(jìn)行說明。特征析取部件726從字符存貯器725中讀字符圖象,並且對該字符圖象賦值多個(gè)如圖13中所示的予定方向代碼。例如在圖14中所示的日文漢字字符(漢字)的字符圖象情況下,如圖15中所示對沿該字符圖象輪廓存在的黑色象素賦值方向代碼。然后如圖16中箭頭所示,在特征析取部件726中對該字符圖象光柵掃描四次,每次掃描都從四個(gè)邊之一到其對比沿與開始邊垂直的方向限定字符結(jié)構(gòu)。在圖示的實(shí)施例方案中,第一次光柵掃描是沿從上邊到下邊的主掃描方向進(jìn)行的,接著第二次光柵掃描是沿著從左邊到右邊的主掃描方向進(jìn)行的,第三次掃描是沿著從下邊到上邊的主掃描方向進(jìn)行,第四次掃描是沿著從右邊到左邊的主掃描方向進(jìn)行的。
在光柵掃描期間沿著每條掃描線,在從白到黑的第N個(gè)變化點(diǎn)上檢測出第N個(gè)周邊象素,這里的N是一個(gè)正整數(shù)。也就是說,沿著第一次光柵掃描的掃描線,遇到的第一個(gè)黑象素限定第一個(gè)周邊象素,在第一個(gè)黑象素后面的一個(gè)以上白象素之后出現(xiàn)的在后黑象素限定第二個(gè)周邊象素,在第二個(gè)黑象素后面的一個(gè)以上白象素之后出現(xiàn)的下一個(gè)在后黑象素限定第三個(gè)周邊象素。換句話說,在本實(shí)施例方案中,這種第N個(gè)周邊象素,即沿掃描線從白到黑變化的輪廓象素,用作特征信息變化的有意義的象素。如下所述,作為有意義象素的特征使用的是對其賦值的方向代碼。根據(jù)用這種方法檢測的第N個(gè)周邊象素,特征析取部件726把“1”寫入工作存貯器727中配置的第N個(gè)周邊表里的對應(yīng)象素位置上,在圖17a至圖17c中示出了對圖14的字符圖象使用這種處理所得到的結(jié)果,這些圖分別明確表示出第一、第二和第三個(gè)周邊表。
圖18a(1)、圖18a(2)和圖18b示出了這種周邊確定處理操作的流程圖。下面將對這種處理的每一步進(jìn)行說明。首先,光柵掃描的編號JJ被復(fù)位(步801)。對JJ加“1”(步802)和對JJ進(jìn)行檢查(步803)。如果JJ等于1或2,即在進(jìn)行從上到下的第一次光柵掃描或從左到右的第二次光柵掃描的情況下,就轉(zhuǎn)到步804,在步804中ISTART IEND,JSTART和JEND分別置入寄存器IS、IE、JS和JE中,並在寄存器STEP中置“1”(圖18a(1)的右上方示出了矩形幀圖象每個(gè)角的I和J地址)。在JJ等于3或4的情況下,即在進(jìn)行從下到上的第三次光柵掃描或從右到左的第四次光柵掃描的情況下,就轉(zhuǎn)到步805,在步805中,ISTART、IEND、JEND和JSTART分別置入IS、IE、JS和JE中,并在STEP中置“-1”。如果JJ大于4,因?yàn)榈谒拇喂鈻艗呙枰呀?jīng)完成,所以該處理就結(jié)束了。
在步804或步805之后,從IS中減“1”得到的值被置入地址計(jì)數(shù)器I(步806),從而啟動光柵掃描。對I加“1”(步807),并檢查I是否已經(jīng)增加到IE+1(步808)。如果該判別的結(jié)果是肯定的,則返回到步802。另一方面,如果該判別的結(jié)果是否定的,那么標(biāo)記IFLG和計(jì)數(shù)器ICouNT就都被復(fù)位(步809)。接著把從JS的值中減去STEP的值所得到的值置入地址計(jì)數(shù)器J(步810)。然后把STEP的值加到J中(步811),并且檢查J的值是否等于JE+STEP(步812),如果結(jié)果是肯定的,就返回到807,如果結(jié)果是否定的,就轉(zhuǎn)到步813。
在步813中,如果判定JJ等于1或3,就把I的值置入地址寄存器I1,並把J的值置入地址寄存器J1(步814)。如果判定JJ等于2或4,就把J的值置入I1,並把I的值置入J1(步815)。然后從字符存貯器725讀出在字符圖象地址(I1、J1)的象素?cái)?shù)據(jù)IDATA(I1、J1),並檢查該數(shù)據(jù)是否等于“0”(白)(步816)。如果事實(shí)上該數(shù)據(jù)等于“0”(白),標(biāo)記IFLG就復(fù)位(步817),並返回到步811。在該數(shù)據(jù)等于“1”(黑)的情況下,接著檢查IFLG是否等于“1”(步818)。如果事實(shí)上IFLG等于“1”,那末該象素是緊跟在先置象素之后的黑象素,而不是周邊象素,因此不進(jìn)行寫入周邊表的操作,並且返回到步811。另一方面,如果IFLG等于“0”,那么該象素是周邊象素,在步819中,IFLG被置“1”,並對ICouNT加“1”(指示上述的周邊順序N的計(jì)數(shù)器)。接著,“1”被寫入具有由ICouNT值指示的周邊順序的周邊表上的地址(I1、J1)上(步820)。然后返回到步811。
如圖11所示,根據(jù)上述周邊表的完成,特征析取部件726把字符圖象細(xì)分成格網(wǎng)區(qū)域,並且對于每個(gè)格網(wǎng)區(qū)域的周邊象素的各個(gè)順序形成方向代碼特征的直方圖(周邊象素就是根據(jù)周邊順序被分類成多層的有意義的象素)。因?yàn)橄旅嬉獙Ω窬W(wǎng)細(xì)分進(jìn)行詳述,所以在這里假設(shè)如圖17a至圖17c所示把字符圖象細(xì)分成3×3個(gè)格網(wǎng)區(qū)域,每個(gè)格網(wǎng)區(qū)域有8×8個(gè)象素,並且格網(wǎng)區(qū)域彼此互不重疊。
特征析取部件726用光柵掃描在工作存貯器727中形成的每個(gè)周邊表,並且讀出對應(yīng)寫入“1”的地址上象素的方向代碼(用方向代碼賦值的字符圖象被存貯在工作存貯器727中),因此,對每個(gè)周邊順序形成作為方向代碼的函數(shù)的一個(gè)直方圖。在圖14中所示的字符模式情況下,圖19a表示對左上角格網(wǎng)區(qū)域(1、1)第一順序周邊形成的直方圖。圖19b和19c分別表示對于第二順序周邊和第三順序周邊的同樣的直方圖。
現(xiàn)在特別參看圖20a和20b中所示的流程圖,對形成這種直方圖的方法進(jìn)行說明。首先,把需要形成直方圖的周邊的順序編號N置入寄存器IConuT(步901),接著把從地址ISTART(參看圖18a)減去“1”得到的值置入地址記數(shù)器I(步902),對I加“1”(步903),並在步904中檢查I的值是否大于地址IEND(參看圖18a的右上方)。如果這個(gè)判別的結(jié)果是肯定的,那么,對當(dāng)前順序周邊形成的直方圖就完成了。另一方面,如果判別的結(jié)果是否定的,就把從地址JSTART(參看圖18a的右上方)減“1”得到的值置入地址記數(shù)器J(步905)。然后對J加“1”(步906),並且檢查J的值是否大于地址JEND(參看圖18a的右上方)。如果這個(gè)判別是肯定的,因?yàn)樗硎疽粭l線的掃描已經(jīng)完成,所以就返回到步903。另一方面,如果判別的結(jié)果是否定的,具有由ICoUNT的值指示的順序編號的周邊表中地址(I、J)上的數(shù)據(jù)被讀出,並被置入寄存器IP,用方向代碼賦值的字符圖象中的地址(I、J)上的數(shù)據(jù)被讀出,並被置入寄存器IV(步908)。然后檢查IP是否等于“1”(步909),如果結(jié)果是否定的,就返回到步906。另一方面,如果結(jié)果是肯定的,就檢查IV的值是否在“1”到“8”之間,即它是否是方向代碼(步910)。如果結(jié)果是否定的,就返回到步906,另一方面,如果結(jié)果是肯定的,就檢查在地址(I、J)上的象素所位于的格網(wǎng)(IMES,JMES)(步911)。接著對計(jì)數(shù)器IHIST(IMES、JMES、IV)加“1”,該計(jì)數(shù)器與格網(wǎng)(IMES、JMES)中的方向代碼IV相對應(yīng),然后返回到步906。
用這種方法在計(jì)數(shù)器IHIST中得到一個(gè)直方圖。對于特定順序周邊的直方圖的形成處理一完成,ICoUNT就又被更新,重復(fù)進(jìn)行對于下一個(gè)順序周邊的相同直方圖的形成處理。這樣得到的直方圖就用作輸入字符圖象的特征。
在形成庫的情況下,特征析取部件726產(chǎn)生用于多個(gè)字符模式的直方圖,這些直方圖例如通過取其平均值的方法被寫入庫存貯器729。在進(jìn)行字符識別的情況下,這樣得到的直方圖提供給匹配部件728,在那里進(jìn)行與庫之間指定的匹配操作。在匹配部件728中,存貯在庫存貯器728中的庫與通過特征析取部件726形成的直方圖相比較(例如根據(jù)歐幾里得距離,主分量等),從而確定具有最小距離的字符。應(yīng)當(dāng)注意有幾種匹配方法,下面將對這幾種匹配方法進(jìn)行說明。
匹配方法1字符識別率的變化由于其復(fù)雜性取決于用于識別的周邊順序。因此,予先對每個(gè)字符確定了用于匹配的周邊的最大順序,並且通過對每個(gè)字符選擇最大順序進(jìn)行匹配操作。
匹配方法2對周邊的多個(gè)順序都計(jì)算距離,並且把具有最小距離總和的一個(gè)選擇出來作為識別的結(jié)果。例如,在具有第一順序至第四順序的組合周邊的情況下,分別通過d1、d2、d3和d4指出了周邊各個(gè)順序方向代碼的直方圖與庫之間的距離,對于每一類都能得到d=d1+d2+d3+d4,從而把d值最小的那類選擇出來作為識別的結(jié)果。
匹配方法3在進(jìn)行與上述匹配方法2相似的匹配操作中,把具有順序n以上的周邊的直方圖都用作一個(gè)周邊的方向代碼的直方圖。例如在匹配方法2中,在使用第一至第四順序的周邊的情況下,進(jìn)行字符識別時(shí),把第五、第六、第七…等順序的周邊的直方圖都包含在第四順序周邊的直方圖內(nèi)。
根據(jù)這些利用直方圖的匹配方法,可以通過具有相對較小容量的庫以較高識別率識別手寫日文漢字字符。
下面將對幾種格網(wǎng)細(xì)分方法進(jìn)行說明。在本實(shí)施方案中,可以利用下述任何一種方法進(jìn)行細(xì)分成格網(wǎng)區(qū)域的操作。
細(xì)分方法1對于已經(jīng)賦值方向代碼的字符圖象,通過圖21所示的處理流程圖確定沿x方向的細(xì)分點(diǎn),沿x方向把字符圖象細(xì)分成N個(gè)區(qū)域。通過相同的處理也可以確定沿y方向的細(xì)分點(diǎn),沿y方向把字符圖象也細(xì)分成N個(gè)區(qū)域。因此,其結(jié)果是把字符圖象細(xì)分成N×N個(gè)格網(wǎng)區(qū)域。
首先說明沿x方向的細(xì)分。通過掃描字符圖象確定有意義象素的總數(shù)PE(步1021)(在本實(shí)施例方案的格網(wǎng)區(qū)域細(xì)分處理中,把所有已經(jīng)賦值方向代碼的黑輪廓象素都作為有意義象素處理)。作為用于細(xì)分點(diǎn)檢測的掃描準(zhǔn)備操作,在細(xì)分編號計(jì)數(shù)器n中置“1”,把沿x方向指示地址的計(jì)數(shù)器x復(fù)位(步1022)。從這時(shí)開始直到n達(dá)到細(xì)分編號N(在本實(shí)施方案中是“3”)為止,每當(dāng)x地址加“1”時(shí),就進(jìn)行該字符圖象的y方向掃描(以y方向作為主掃描方向的光柵掃描),從而檢測出細(xì)分點(diǎn)。換句話說,對x加“1”(步1024),由x指示的一條線沿y方向被掃描,對從第一條線到當(dāng)前線結(jié)束之間的特征象素的數(shù)量Px進(jìn)行計(jì)數(shù)(步1025)。然后檢查Px是否等于或大于(PE/N)×n(步1026),如果結(jié)果是否定的,就返回到步1024進(jìn)行下一條線的掃描。另一方面,如果步1026中判別的結(jié)果是肯定的,就轉(zhuǎn)到步1027。在步1027中檢測出當(dāng)前的x的值作為第n個(gè)格網(wǎng)區(qū)域結(jié)束點(diǎn)的x地址(該區(qū)域中的右邊細(xì)分點(diǎn))。此外,檢測出從x的值中減去T(相鄰細(xì)分區(qū)域之間的重疊量)得到的值作為下一個(gè)格網(wǎng)區(qū)域開始點(diǎn)的x地址(左邊的細(xì)分點(diǎn))。
第一個(gè)格網(wǎng)區(qū)域的開始點(diǎn)對應(yīng)字符幀圖象的左邊(x=1),而最后一個(gè)格網(wǎng)區(qū)域的結(jié)束點(diǎn)對應(yīng)字符幀圖象的右邊(x=32,因?yàn)樵诒緦?shí)施方案中假定字符圖象有32×32個(gè)象素)。然后,對n加“1”(步1028),並且重復(fù)從步1023開始的處理。直到達(dá)到n=N和滿足步1023的條件以前,重復(fù)地進(jìn)行這種處理。
沿y方向細(xì)分點(diǎn)的檢測以相同的方法進(jìn)行。但是因?yàn)橐呀?jīng)得到有意義的象素總數(shù)PE,所以該步不再重復(fù)。此外,當(dāng)y地址加“1”時(shí),沿x方向進(jìn)行用于檢測細(xì)分點(diǎn)的掃描,在有意義的象素Py(相當(dāng)于上述的Px)等于(PE/N)×n處的y地址被檢測出來作為第n個(gè)格網(wǎng)區(qū)域結(jié)束的y地址(下邊的細(xì)分點(diǎn)),而從該y地址中減去T得到的地址被檢測出來作為下一個(gè)格網(wǎng)區(qū)域開始點(diǎn)的y地址(上邊的細(xì)分點(diǎn))。第一個(gè)格網(wǎng)區(qū)域的開始點(diǎn)對應(yīng)字符幀圖象的上邊(y=1),而最后一個(gè)格網(wǎng)區(qū)域的結(jié)束點(diǎn)對應(yīng)字符幀圖象的下邊(y=32)。
利用這樣得到的細(xì)分點(diǎn),字符圖象沿x和y兩個(gè)方向都被細(xì)分成N個(gè)區(qū)域,因此字符圖象被細(xì)分成N×N個(gè)格網(wǎng)區(qū)域。根據(jù)這種格網(wǎng)細(xì)分方法,日文假名字符“Wu”的字符圖象可以被細(xì)分成如圖22a和圖22b所示的格網(wǎng)區(qū)域。在這兩種情況下,重疊量T都被假設(shè)為“0”。在圖22a和圖22b兩種情況下,字符圖象的左上角格網(wǎng)區(qū)域中都有中上方一豎筆劃的信息。
另一方面,如果使用定細(xì)分點(diǎn),圖22a和圖22b中的字符圖象分別被細(xì)分成例如圖23a和圖23b所示的格網(wǎng)區(qū)域。在圖23b的情況下,在左上角格網(wǎng)區(qū)域中有中上方一豎筆劃的信息,而在圖23a的情況下,在左上角格網(wǎng)區(qū)域中沒有這種信息。用這種方法,即使用定細(xì)分點(diǎn)的方法,日字假名字符“Wu”的中上方一豎筆劃有時(shí)出現(xiàn)在一個(gè)特定的格網(wǎng)區(qū)域中,有時(shí)又不出現(xiàn)在該特定的格網(wǎng)區(qū)域中,而這個(gè)一豎筆劃是構(gòu)成該字符的重要部份。這樣就會使數(shù)據(jù)產(chǎn)生不穩(wěn)定,因此不可能穩(wěn)定地析取特征,從而導(dǎo)致識別率的降低和錯(cuò)誤識別的增加。這種問題可以通過使用上述的細(xì)分方法1得到解決。
細(xì)分方法2用與上述細(xì)分方法1中相同的方法,沿y方向把字符圖象細(xì)分成N個(gè)區(qū)域。然后進(jìn)行沿x方向的細(xì)分,下面參看圖24所示的流程圖對這個(gè)處理進(jìn)行說明。
首先把“1”置入細(xì)分編號計(jì)數(shù)器n,並把指示沿x方向地址的計(jì)數(shù)器x清零(步1131)。在步1132中檢查n是否等于或小于N(在本實(shí)施方案中N=3),如果結(jié)果是否定的,細(xì)分處理就完成了。如果步1132中判別的結(jié)果是肯定的,那么,在步1133,1134和1135中分別進(jìn)行如下操作當(dāng)x地址加“1”時(shí),進(jìn)行沿y方向的掃描,對在每個(gè)y方向細(xì)分區(qū)域i中的有意義的象素?cái)?shù)進(jìn)行計(jì)數(shù),對于被計(jì)數(shù)的Xx(yis-yie)區(qū)域象素?cái)?shù)Pix進(jìn)行檢查,判別Pix是否等于或大于(PE/N×N)×n。這里yis和yie分別表示y方向細(xì)分區(qū)域i的開始點(diǎn)和結(jié)束點(diǎn)的地址。
如果步1135中判別的結(jié)果是肯定的,x(x地址)的當(dāng)前值就被檢測出來作為第n個(gè)x方向細(xì)分區(qū)域的結(jié)束點(diǎn),並且檢測出x-T(T區(qū)域重疊量)作為下一個(gè)細(xì)分區(qū)域的開始點(diǎn)(步1136)。然后對n加“1”(步1137),接著返回到步1132。利用這樣得到的沿x方向的細(xì)分點(diǎn),沿x方向字符圖象被細(xì)分成N個(gè)區(qū)域,因此,字符圖象被細(xì)分成總數(shù)為N×N個(gè)格網(wǎng)區(qū)域。
在日文假名漢字中,“nu”和“Su”在形狀上非常相似,這兩個(gè)假名字符間維一的區(qū)別在于是否有從左上方到右下方的中間斜筆劃,因此該筆劃的信息在區(qū)別“nu”和“Su”時(shí)是非常重要的。當(dāng)“nu”的字符圖象用細(xì)分方法1細(xì)分成3×3個(gè)格網(wǎng)區(qū)域時(shí)就得到如圖25a所示的結(jié)果。當(dāng)觀察細(xì)分的字符圖象左中部格網(wǎng)區(qū)域(1、2)時(shí),可以看見該中間斜筆劃的信息出現(xiàn)得非常少。另一方面,當(dāng)“nu”的字符圖象用細(xì)分方法2同樣的被細(xì)分時(shí),就能得到圖25b所示的結(jié)果。需要指明的是在圖25b中,為了簡明起見僅表示了被細(xì)分的y方向中部區(qū)域。此外還假設(shè)了T=0這個(gè)條件。當(dāng)觀察細(xì)分區(qū)域(1、2)時(shí),可以看見出現(xiàn)了足夠的有關(guān)該中間斜筆劃的信息。利用這種方法,即根據(jù)細(xì)分方法2,可以克服細(xì)分方法1的缺點(diǎn)。
在上面的說明中,用細(xì)分方法1進(jìn)行了y方向的細(xì)分,但是細(xì)分處理可以由如下步驟構(gòu)成首先進(jìn)行沿x方向的細(xì)分,然后對每個(gè)已沿x方向細(xì)分的區(qū)域用與圖24流程圖中所示的相同處理進(jìn)行沿y方向的細(xì)分。
細(xì)分方法3
在細(xì)分方法2中T不等于0的情況下,或者沿x或y方向在細(xì)分點(diǎn)處有意義象素密集的情況下,細(xì)分可能變得不夠精確。為了解決這個(gè)問題,根據(jù)本細(xì)分方法,先用細(xì)分方法1沿x(或y)方向進(jìn)行細(xì)分,然后進(jìn)行如下步驟的處理對細(xì)分區(qū)域i中的有意義象素?cái)?shù)PEi進(jìn)行計(jì)數(shù),用PEi/N代替細(xì)分方法2中的PE/N2沿細(xì)分區(qū)域i的y(或x)方向進(jìn)行細(xì)分。
參看圖26所示的流程圖,下面將說明用細(xì)分方法1沿x方向進(jìn)行的細(xì)分和之后對每個(gè)細(xì)分區(qū)域沿y方向進(jìn)行的進(jìn)一步細(xì)分。首先通過對字符圖象掃描,確定每個(gè)細(xì)分區(qū)域i沿x方向的有意義象素?cái)?shù)PEi(步1241)。把“1”置入計(jì)數(shù)器n,然后把y地址的計(jì)數(shù)器y清零(步1242)。檢查n是否等于或小于N(在這里N=5),如果判別的結(jié)果是否定的,該處理就結(jié)束了(步1243)。另一方面,如果結(jié)果是肯定的,則分別在步1244,1245和1246中進(jìn)行如下操作當(dāng)y地址加“1”時(shí),沿x方向進(jìn)行掃描,對每個(gè)x方向細(xì)分區(qū)域i中的有意義象素?cái)?shù)進(jìn)行計(jì)數(shù),從而對在yx(Xis-Xie)區(qū)域中計(jì)數(shù)的象素?cái)?shù)Piy進(jìn)行檢查,判別Piy是否等于或大于(PEi/N)×n。在這里Xis和Xie分別是y方向細(xì)分區(qū)域i的開始點(diǎn)和結(jié)束點(diǎn)的x地址。
如果在步1246中的判別結(jié)果是肯定的,就檢測出y(y地址)的當(dāng)前值作為對于x方向細(xì)分區(qū)域的第n個(gè)y方向細(xì)分區(qū)域的結(jié)束點(diǎn),並且檢測出y-T(T區(qū)域重疊量)作為下一個(gè)細(xì)分區(qū)域的開始點(diǎn)(步1247)。然后對n加“1”(步1248),並返回到步1243。利用這樣得到的沿y方向的細(xì)分點(diǎn),x方向細(xì)分區(qū)域沿y方向被細(xì)分成N個(gè)區(qū)域,因此整個(gè)字符圖象被細(xì)分成總數(shù)為N×N個(gè)格網(wǎng)區(qū)域。
用細(xì)分方法2在T=1的情況下細(xì)分假名字符“nu”的字符圖象時(shí),得到如圖27a所示的結(jié)果。另一方面,用細(xì)分方法3在T=1的情況下細(xì)分同一個(gè)字符圖象時(shí),得到如圖27b所示的結(jié)果。在這兩種情況下,都是先進(jìn)行y方向細(xì)分,然后再進(jìn)行x方向細(xì)分。此外在這兩個(gè)圖中,為了簡明起見僅表示了對于y方向中部細(xì)分區(qū)域的x方向細(xì)分的結(jié)果。觀察圖27a和圖27b中的格網(wǎng)區(qū)域(1、2),可以看見恰當(dāng)?shù)爻霈F(xiàn)了中間斜筆劃的信息。使用這種方法,即使在設(shè)定的T不等于0的情況下或者在細(xì)分點(diǎn)處有意義象素密集的情況下,用細(xì)分方法3始終都能得到恰當(dāng)?shù)募?xì)分。
如上所述,根據(jù)本發(fā)明的這一目的,用于格網(wǎng)細(xì)分的細(xì)分點(diǎn)可以按照字符圖象的變形進(jìn)行適當(dāng)調(diào)整,因此,即使對于具有形狀上變形的字符,如手寫日文漢字字符和假名字符,也能恰當(dāng)和高速地進(jìn)行字符識別。此外,本發(fā)明的這個(gè)目的對于確定細(xì)分點(diǎn)來講并不涉及任何復(fù)雜的運(yùn)算,因此整個(gè)處理是非??斓摹?br>雖然上述說明對本發(fā)明的最佳實(shí)施方案提供了充分而完整的公開,但是無需脫離本發(fā)明的實(shí)質(zhì)和保護(hù)范圍就可以采用各種改進(jìn)、其它可能的設(shè)計(jì)和等同方案。因此上述說明和附圖不應(yīng)構(gòu)成對由申請待批的權(quán)利要求
所限定的本發(fā)明保護(hù)范圍的限制。
權(quán)利要求
1.一種使用存貯多個(gè)參考模式的庫的模式識別方法,參考模式具有其分量接維的數(shù)值順序重新排列的特征向量,本方法包括步驟輸入要識別的未識別模式;從上述未識別模式中析取特征向量;以與上述庫中存貯的參考模式的維的相同數(shù)值順序,重新排列上述未識別模式的析取特征的分量;把上述未識別模式的予定的較高維分量與每個(gè)上述參考模式的予定的較高維分量進(jìn)行匹配,從而確定上述未識別模式和每個(gè)上述參考模式之間的距離或相似程度。
2.根據(jù)權(quán)利要求
1所述的方法,其中,根據(jù)對予定的較高維匹配的結(jié)果,確定是否要進(jìn)行對剩余維的進(jìn)一步匹配。
3.根據(jù)權(quán)利要求
1所述的方法,其中由模式的分量所具有的標(biāo)準(zhǔn)偏差或方差的數(shù)量來確定維的數(shù)量。
4.一種模式識別方法,包括步驟讀多個(gè)選擇的模式種類,以便提供多個(gè)假定模式,每個(gè)假定模式具有由多個(gè)分量構(gòu)成的特征向量;根據(jù)維的予定數(shù)值順序重新排列每個(gè)假定模式特征向量的分量,從而形成和存貯參考模式,每個(gè)參考模式具有重新排列分量的特征向量;對每個(gè)上述選擇的模式種類確定一個(gè)閾值;讀未識別模式;從上述未識別模式中析取由多個(gè)分量構(gòu)成的特征向量;以上述維的予定數(shù)值順序重新排列上述析取的特征向量的分量;對于一個(gè)較高維的予定數(shù)值,把上述未識別模式的重新排列的特征向量與每個(gè)上述存貯的參考模式的重新排列的特征向量匹配,以便提供匹配距離;把這樣提供的匹配距離與對應(yīng)的模式種類的閾值相比較;和根據(jù)該比較的結(jié)果確定對于剩余的維是否進(jìn)行與相應(yīng)模式種類的進(jìn)一步匹配。
5.根據(jù)權(quán)利要求
4所述的方法,其中在確定閾值的步驟中,對于每個(gè)上述模式種類都確定多個(gè)閾值,並且選擇上述多個(gè)閾值中的一個(gè)用于確定是否進(jìn)行進(jìn)一步匹配。
6.根據(jù)權(quán)利要求
5所述的方法,其中通過所有上述選擇的模式種類共有的一個(gè)參數(shù)進(jìn)行對閾值的選擇,該閾值用于確定是否進(jìn)行進(jìn)一步匹配。
7.根據(jù)權(quán)利要求
5所述的方法,其中通過每個(gè)上述選擇的模式種類的一個(gè)參數(shù)進(jìn)行對閾值的選擇,該閾值用于確定是否進(jìn)行進(jìn)一步匹配。
8.根據(jù)權(quán)利要求
5所述的方法,其中通過所有上述選擇的模式種類共有的一個(gè)參數(shù)和每個(gè)上述選擇的模式種類的一個(gè)參數(shù)進(jìn)行對閾值的選擇,該閾值用于確定是否進(jìn)行進(jìn)一步匹配。
9.根據(jù)權(quán)利要求
4所述的方法,其中通過限定上述特征向量分量的標(biāo)準(zhǔn)偏差或方差的數(shù)量來確定維的予定數(shù)值順序。
10.一種模式識別方法,包括步驟(a)對字符模式的輪廓黑象素賦值方向代碼;(b)從一邊沿垂直于該邊的方向掃描該字符模式,從而檢測第N個(gè)周邊象素,該象素是從白到黑的第n個(gè)變化點(diǎn);(c)對于該字符模式的每個(gè)細(xì)分區(qū)域,形成第N個(gè)周邊象素的方向代碼的直方圖;和(d)利用該方向代碼直方圖作為特征,與庫進(jìn)行匹配。
11.一種模式識別方法,包括步驟(a)從一幀圖象的每條邊沿垂直于該邊的方向環(huán)繞字符圖象對該字符圖象進(jìn)行掃描,并根據(jù)沿掃描線出現(xiàn)的順序,在特征的信息變化到多層中的一層處對有意義的象素進(jìn)行分類;(b)當(dāng)利用一個(gè)細(xì)分方向作為輔助掃描方向?qū)υ撟址麍D象進(jìn)行光柵掃描時(shí),對有意義的象素進(jìn)行計(jì)數(shù),從而根據(jù)這種計(jì)數(shù)值確定細(xì)分點(diǎn);(c)利用這種確定的細(xì)分點(diǎn)把該字符圖象細(xì)分成格網(wǎng)區(qū)域;(d)對于每個(gè)格網(wǎng)區(qū)域,形成被分類成多層的有意義象素的直方圖;和(e)利用該直方圖與庫進(jìn)行匹配。
專利摘要
提供一種模式匹配方法和系統(tǒng)。讀一個(gè)模式,并析取該模式的包括多個(gè)分量的特征向量。根據(jù)維的數(shù)值順序?qū)@些分量重新排列,該順序是由特征向量各分量的標(biāo)準(zhǔn)偏差或方差的數(shù)值確定的。在未識別模式和每個(gè)存貯的已識別模式之間的匹配中,僅有一個(gè)預(yù)定的較高維的數(shù)值用于初始匹配。根據(jù)本發(fā)明的另一個(gè)目的,對未識別字符模式進(jìn)行掃描以檢測如由白到黑這樣信息變化的象素,并且利用檢測出的象素對每個(gè)格網(wǎng)區(qū)域形成直方圖,然后這樣形成的直方圖用于進(jìn)行與存貯在庫中的參考模式的匹配。
文檔編號G06K9/72GK87104862SQ87104862
公開日1988年1月27日 申請日期1987年6月20日
發(fā)明者立川道義, 佐藤元 申請人:株式會社理光導(dǎo)出引文BiBTeX, EndNote, RefMan