專利名稱:字符串識(shí)別裝置及字符串識(shí)別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于對(duì)由紙、塑料等材質(zhì)形成的介質(zhì)(記錄載體)上的字符串進(jìn)行光學(xué)讀取的字符串識(shí)別裝置及字符串識(shí)別方法。所謂本發(fā)明中的“字符串”,是指多個(gè)字符的排列。在此,“字符”不僅是一般的字母,還包含標(biāo)記字符、圖畫(huà)字符、條形碼、二維代碼、甚至數(shù)字等,只要在介質(zhì)上能辨認(rèn),任何形態(tài)和大小都可以。此外,是鉛字字符還是手寫字符都無(wú)關(guān)緊要。
背景技術(shù):
一直以來(lái),存在用于對(duì)印刷在例如支票等介質(zhì)的表面上的字符串進(jìn)行識(shí)別的字符串識(shí)別方法及其裝置。在這種字符串識(shí)別方法及其裝置中,因手動(dòng)操作而導(dǎo)致介質(zhì)傳送速度變化,在介質(zhì)移動(dòng)方向上產(chǎn)生圖像的失真,這種情況下,有時(shí)會(huì)隨之在與介質(zhì)移動(dòng)方向垂直的方向上也產(chǎn)生圖像失真(例如,字符串有時(shí)會(huì)傾斜、或有起伏)。此外,有時(shí)由于介質(zhì)下邊緣部脫離拍攝裝置(字符識(shí)別裝置)的傳送路面,也會(huì)在與介質(zhì)移動(dòng)方向垂直的方向上產(chǎn)生圖像失真。為了解決這種問(wèn)題,在例如專利文獻(xiàn)1所揭示的字符串識(shí)別方法中,包括第一步驟,該第一步驟在與介質(zhì)上的字符串的方向(是字符的排列方向,稱之為“水平方向”)垂直的方向(稱之為“垂直方向”)上,使像素每次移位一個(gè)或幾個(gè)像素,同時(shí)計(jì)算圖像數(shù)據(jù)朝字符串的方向的投影;以及第二步驟,該第二步驟基于由該第一步驟得到的第一投影數(shù)據(jù),檢測(cè)字符串在垂直方向上的位置,并且,在上述第一步驟中,在字符串的方向上將圖像數(shù)據(jù)分割成規(guī)定數(shù)量的分區(qū)(segment)之后,對(duì)其每一分區(qū)計(jì)算朝水平方向的投影數(shù)據(jù)。即,在為了檢測(cè)字符串在垂直分方向上的位置而需要計(jì)算朝水平方向的投影(第一投影數(shù)據(jù))時(shí),不將像素值的相加范圍設(shè)為沿介質(zhì)的前進(jìn)方向或字符串的方向的總寬度,而是將其劃分成幾等份,將每一分區(qū)的長(zhǎng)度作為相加范圍,分開(kāi)計(jì)算朝水平方向的投影。由此,即使假設(shè)字符串傾斜,也能抑制因其而導(dǎo)致第一投影數(shù)據(jù)變平穩(wěn)的不好影響。其結(jié)果是,即使圖像失真的方向是與字符串的方向垂直的方向,也能防止識(shí)別字符串的精度下降。專利文獻(xiàn)1 日本專利特開(kāi)2007-272348號(hào)公報(bào)
發(fā)明內(nèi)容
然而,在專利文獻(xiàn)1所揭示的字符串識(shí)別方法中,對(duì)于字符串,即使在使用格式與假定格式不同的介質(zhì)時(shí),若對(duì)每一分區(qū)檢測(cè)出的字符串的串?dāng)?shù)與假定格式的行數(shù)條件一致,則也誤判定為原本假定的格式,其結(jié)果是存在無(wú)法進(jìn)行正確的讀取動(dòng)作的問(wèn)題。另外, 所謂該格式,是指記載有字符的區(qū)域的位置和范圍、字符串的數(shù)量和字符數(shù)、字符的大小等。本發(fā)明鑒于上述情況,其目的在于提供一種即使是假定有多種格式的識(shí)別處理系統(tǒng)、也可以正確識(shí)別各種格式的字符串識(shí)別裝置及字符串識(shí)別方法。
為了達(dá)到上述目的,權(quán)利要求1所述的發(fā)明的字符串識(shí)別裝置通過(guò)對(duì)拍攝介質(zhì)上的字符串而得到的圖像數(shù)據(jù)進(jìn)行處理,以識(shí)別所述字符串,其特征在于,包括字符串檢索范圍設(shè)定單元,該字符串檢索范圍設(shè)定單元在所述介質(zhì)上設(shè)定字符串檢索范圍;分區(qū)生成單元,該分區(qū)生成單元在所述字符串的方向上對(duì)所述字符串檢索范圍進(jìn)行分割以生成多個(gè)分區(qū);投影計(jì)算單元,該投影計(jì)算單元對(duì)每一所述分區(qū)計(jì)算所述圖像數(shù)據(jù)朝所述字符串的方向的投影;字符串串?dāng)?shù)計(jì)算單元,該字符串串?dāng)?shù)計(jì)算單元基于所述圖像數(shù)據(jù)的投影,計(jì)算每一所述分區(qū)的字符串串?dāng)?shù);字符串串?dāng)?shù)確定單元,該字符串串?dāng)?shù)確定單元基于每一所述分區(qū)的字符串串?dāng)?shù),確定整個(gè)所述字符串檢索范圍的字符串串?dāng)?shù);字符串有效性驗(yàn)證單元, 該字符串有效性驗(yàn)證單元基于整個(gè)所述字符串檢索范圍的字符串串?dāng)?shù),判定所述字符串是否是規(guī)定的字符串。此外,權(quán)利要求2所述的發(fā)明的特征在于,在權(quán)利要求1所述的結(jié)構(gòu)的基礎(chǔ)上,所述字符串串?dāng)?shù)確定單元基于每一所述分區(qū)的字符串串?dāng)?shù),求出表示規(guī)定的字符串串?dāng)?shù)的所述分區(qū)的數(shù)量的頻數(shù)分布,將表示頻數(shù)為最大值的字符串串?dāng)?shù)確定為整個(gè)所述字符串檢索范圍的字符串串?dāng)?shù)。此外,權(quán)利要求3所述的發(fā)明的特征在于,在權(quán)利要求2所述的結(jié)構(gòu)的基礎(chǔ)上,所述字符串檢索范圍設(shè)定單元在表示所述規(guī)定的字符串串?dāng)?shù)的所述分區(qū)的數(shù)量的頻數(shù)分布不正常的情況下,在所述介質(zhì)上設(shè)定與所述字符串檢索范圍不同的字符串檢索范圍。此外,權(quán)利要求4所述的發(fā)明的特征在于,在權(quán)利要求2所述的結(jié)構(gòu)的基礎(chǔ)上,所述分區(qū)生成單元在表示所述規(guī)定的字符串串?dāng)?shù)的所述分區(qū)的數(shù)量的頻數(shù)分布不正常的情況下,增減字符串檢索范圍的分割數(shù)以生成與所述分區(qū)不同的分區(qū)。此外,權(quán)利要求5所述的發(fā)明的特征在于,在權(quán)利要求1至4的任一項(xiàng)所述的結(jié)構(gòu)的基礎(chǔ)上,所述字符串有效性驗(yàn)證單元對(duì)每一所述分區(qū)求出與所述字符串的方向垂直的方向上的字符串位置,基于這些字符串位置的一次差分,檢測(cè)出所述字符串內(nèi)有無(wú)異常,之后,當(dāng)在所述字符串內(nèi)沒(méi)有檢測(cè)出異常時(shí),判定為所述字符串是規(guī)定的字符串。此外,權(quán)利要求6所述的發(fā)明的特征在于,在權(quán)利要求5所述的結(jié)構(gòu)的基礎(chǔ)上,當(dāng)在所述字符串內(nèi)檢測(cè)出異常時(shí),所述字符串檢索范圍設(shè)定單元在所述介質(zhì)上設(shè)定與所述字符串檢索范圍不同的字符串檢索范圍。此外,權(quán)利要求7所述的發(fā)明的特征在于,在權(quán)利要求5所述的結(jié)構(gòu)的基礎(chǔ)上,所述字符串有效性驗(yàn)證單元在檢測(cè)所述字符串內(nèi)有無(wú)異常時(shí),在每一所述分區(qū)的字符串位置的二次差分的絕對(duì)值的最大值超過(guò)規(guī)定的閾值的情況下,判定為在所述字符串內(nèi)有異常。此外,權(quán)利要求8所述的發(fā)明的特征在于,在權(quán)利要求5所述的結(jié)構(gòu)的基礎(chǔ)上,所述字符串位置是字符串中心位置。此外,權(quán)利要求9所述的發(fā)明的特征在于,在權(quán)利要求1至4的任一項(xiàng)所述的結(jié)構(gòu)的基礎(chǔ)上,所述分區(qū)的生成個(gè)數(shù)是2的η次方(η為正整數(shù))。此外,權(quán)利要求10所述的發(fā)明的字符串識(shí)別方法通過(guò)對(duì)拍攝介質(zhì)上的字符串而得到的圖像數(shù)據(jù)進(jìn)行處理,以識(shí)別所述字符串,其特征在于,包括字符串檢索范圍設(shè)定工序,該字符串檢索范圍設(shè)定工序在所述介質(zhì)上設(shè)定字符串檢索范圍;分區(qū)生成工序,該分區(qū)生成工序在所述字符串的方向上對(duì)字符串檢索范圍進(jìn)行分割以生成多個(gè)分區(qū);投影計(jì)算工序,該投影計(jì)算工序?qū)γ恳凰龇謪^(qū)計(jì)算所述圖像數(shù)據(jù)朝所述字符串的方向的投影;字符串串?dāng)?shù)計(jì)算工序,該字符串串?dāng)?shù)計(jì)算工序基于所述圖像數(shù)據(jù)的投影,計(jì)算每一所述分區(qū)的字符串串?dāng)?shù);字符串串?dāng)?shù)確定工序,該字符串串?dāng)?shù)確定工序基于每一所述分區(qū)的字符串串?dāng)?shù),確定整個(gè)所述字符串檢索范圍的字符串串?dāng)?shù);字符串有效性驗(yàn)證工序,該字符串有效性驗(yàn)證工序基于整個(gè)所述字符串檢索范圍的字符串串?dāng)?shù),判定所述字符串是否是規(guī)定的字符
串ο根據(jù)本發(fā)明所涉及的字符串識(shí)別裝置及字符串識(shí)別方法,即使是假定有多種格式的識(shí)別處理系統(tǒng),也能正確識(shí)別各種格式。此外,根據(jù)本發(fā)明,介質(zhì)上的字符串檢索范圍沿字符串的方向被分割成多個(gè)分區(qū), 基于這些分區(qū)的每一分區(qū)的字符串串?dāng)?shù),確定整個(gè)字符串檢索范圍的字符串串?dāng)?shù),基于該字符串串?dāng)?shù),可以驗(yàn)證字符串的有效性(該字符串是否是規(guī)定的字符串)。
圖1是表示本發(fā)明的實(shí)施方式1所涉及的字符串識(shí)別裝置的電氣結(jié)構(gòu)的框圖。圖2是表示圖1所示的字符串識(shí)別裝置的字符串分離部的框圖。圖3是表示上述實(shí)施方式1所涉及的字符串識(shí)別方法的整個(gè)流程的流程圖。圖4是表示在圖3所示的流程圖中分離字符串的詳細(xì)流程的流程圖。圖5是ID卡的主視圖。圖6是表示拍攝到介質(zhì)上的字符串時(shí)的圖像數(shù)據(jù)的第一示例的圖。圖7是表示將圖6所示的圖像數(shù)據(jù)朝字符串的方向投影時(shí)的水平投影曲線的圖。圖8是表示圖6所示的圖像數(shù)據(jù)中的每一分區(qū)的字符串串?dāng)?shù)的表。圖9是基于圖8所示的字符串串?dāng)?shù)的、表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布表。圖10是表示每一分區(qū)的字符串串?dāng)?shù)的其他示例的表。圖11是基于圖10所示的字符串串?dāng)?shù)的、表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布表。圖12是表示拍攝到介質(zhì)上的字符串時(shí)的圖像數(shù)據(jù)的第二示例的圖。圖13是表示將圖12所示的圖像數(shù)據(jù)朝字符串的方向投影時(shí)的水平投影曲線的圖。圖14是表示圖12所示的圖像數(shù)據(jù)中的每一分區(qū)的字符串串?dāng)?shù)的表。圖15是基于圖14所示的字符串串?dāng)?shù)的、表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布表。圖16是表示圖12所示的圖像數(shù)據(jù)中的字符串中心位置的一次差分的表。圖17是表示圖12所示的圖像數(shù)據(jù)中的字符串中心位置的二次差分的表。圖18是表示在圖3所示的流程圖中分離字符的詳細(xì)流程的流程圖。圖19是表示在表示本發(fā)明的實(shí)施方式2所涉及的字符串識(shí)別方法的整個(gè)流程的流程圖中、分離字符串的詳細(xì)流程的流程圖。
具體實(shí)施例方式下面,說(shuō)明本發(fā)明的實(shí)施方式。
[發(fā)明的實(shí)施方式1]圖1至圖18表示本發(fā)明的實(shí)施方式1。(字符串識(shí)別裝置的結(jié)構(gòu))如圖1所示,本實(shí)施方式1所涉及的字符串識(shí)別裝置1是拍攝作為介質(zhì)的ID卡 (身份證)6(下面稱為“ID卡6”)上的字符記錄區(qū)域60并對(duì)所得到的圖像數(shù)據(jù)進(jìn)行處理、 以識(shí)別在字符記錄區(qū)域60內(nèi)印刷的字符串的裝置,包括數(shù)據(jù)輸入部2、圖像存儲(chǔ)器3、以及數(shù)據(jù)處理部5。數(shù)據(jù)輸入部2拍攝ID卡6上的字符記錄區(qū)域60,轉(zhuǎn)換成多值圖像數(shù)據(jù),并存儲(chǔ)到圖像存儲(chǔ)器3中。在實(shí)施方式1中,如圖1所示,字符串識(shí)別裝置1包括傳送ID卡6的介質(zhì)傳送機(jī)構(gòu)2a、和拍攝ID卡6上的字符記錄區(qū)域60以進(jìn)行讀取的緊貼型一維拍攝元件2b。介質(zhì)傳送機(jī)構(gòu)2a利用未圖示的傳送單元將ID卡6向規(guī)定的傳送方向T(在圖1 中是從左向右)傳送。在實(shí)施方式1中,在介質(zhì)傳送機(jī)構(gòu)2a中形成有傳送導(dǎo)軌2c,ID卡6 的一端(在圖1中為下端)與傳送導(dǎo)軌2c接觸以進(jìn)行傳送。拍攝元件2b是由CXD等構(gòu)成的線型傳感器,在與傳送方向大致正交的方向(ID卡 6的短邊方向)上配置成一列,并且,如圖1所示,形成為比在ID卡6上形成的字符記錄區(qū)域60的短邊方向的寬度要長(zhǎng)。另外,在實(shí)施方式1中,模擬圖像數(shù)據(jù)從拍攝元件2b輸出, 另一方面,在字符串識(shí)別裝置1中連接有未圖示的模擬/數(shù)字轉(zhuǎn)換電路,該模擬/數(shù)字轉(zhuǎn)換電路將該模擬圖像數(shù)據(jù)轉(zhuǎn)換成數(shù)字圖像數(shù)據(jù)。更具體而言,模擬圖像數(shù)據(jù)例如被轉(zhuǎn)換成8 比特的256灰度的多值圖像數(shù)據(jù),并輸出到圖像存儲(chǔ)器3。另外,由于這種模擬/數(shù)字轉(zhuǎn)換電路本身是已知的,因此這里省略其詳細(xì)說(shuō)明。圖像存儲(chǔ)器3具有如下功能將拍攝得到的多值圖像數(shù)據(jù)視為由有限個(gè)像素構(gòu)成的行列,將各像素的像素值即亮度值進(jìn)行存儲(chǔ)并自由讀出。該亮度值以一定范圍的數(shù)值來(lái)表示。具體而言,對(duì)于8比特的256灰度的多值圖像數(shù)據(jù),其亮度值表示作為0到255的整數(shù)值。此外,在本實(shí)施方式1中,將MXN個(gè)像素排列成矩陣狀而構(gòu)成,在MXN個(gè)區(qū)域中存儲(chǔ)整個(gè)字符記錄區(qū)域60的多值圖像數(shù)據(jù)。另外,該圖像存儲(chǔ)器3可以是任何存儲(chǔ)器,只要該存儲(chǔ)器是RAM、SDRAM、DDRSDRAM、RDRAM等可將多值圖像數(shù)據(jù)進(jìn)行存儲(chǔ)并自由讀出的存儲(chǔ)
ο而且,圖像存儲(chǔ)器3還具有將由后述圖像二值化部5a生成的黑白二值圖像數(shù)據(jù)進(jìn)行存儲(chǔ)的功能。如圖1所示,數(shù)據(jù)處理部5包括控制整個(gè)數(shù)據(jù)處理部5的主控制部50、圖像二值化部5a、字符串分離部5b、字符串檢索范圍存放部5c、字符分離部5d、特征提取部5e、特征比較部5f、特征詞典存放部5g、以及字符判定部5h。圖像二值化部5a將存儲(chǔ)在圖像存儲(chǔ)器3中的多值圖像數(shù)據(jù)轉(zhuǎn)換成二值圖像數(shù)據(jù)。 另外,關(guān)于二值化處理,由已知的判別分析法等適當(dāng)?shù)姆椒ㄇ蟪龆祷撝?,將表示多值圖像數(shù)據(jù)的亮度值為相對(duì)較大的值的像素作為白元素,將亮度值成為相對(duì)較小的值的像素作為黑元素,從而轉(zhuǎn)換成黑白的二值圖像數(shù)據(jù)。然后,在將MXN個(gè)像素排列成矩陣狀的MXN 個(gè)區(qū)域中生成整個(gè)字符記錄區(qū)域60的二值圖像數(shù)據(jù)。字符串分離部5b從由圖像二值化部5a得到的二值圖像數(shù)據(jù)中進(jìn)行分離字符串的處理。在本實(shí)施方式中,如圖2所示,字符串分離部5b包括字符串檢索范圍設(shè)定部51、圖像處理區(qū)域設(shè)定部52、分區(qū)生成部53、投影計(jì)算部54、字符串串?dāng)?shù)計(jì)算部55、字符串串?dāng)?shù)確定部56、字符串串?dāng)?shù)正確與否判定部57、差分運(yùn)算部58、以及字符串有效性驗(yàn)證部59。此外, 字符串分離部5b處于主控制部50的控制下。字符串檢索范圍存放部5c根據(jù)該字符串識(shí)別裝置1中對(duì)應(yīng)的各種介質(zhì)(ID卡6 以外、支票、信用卡等)存放有字符串檢索范圍的位置和形狀等信息。例如,在ID卡6中, 如圖5所示,矩形的字符串檢索范圍Al成為下部區(qū)域。此外,上部區(qū)域印刷有臉部照片、姓名、住所等個(gè)人信息。另外,在實(shí)施方式1中,如圖6所示,字符串檢索范圍Al設(shè)定為比圖 1所示的字符記錄區(qū)域60要小的范圍。字符分離部5d進(jìn)行如下處理根據(jù)由字符串分離部5b分離出的字符串的二值圖像數(shù)據(jù),求出例如外接的矩形特征、黑像素的字符串的排列方向和與該排列方向正交的方向的直方圖特征等,推定一個(gè)字符區(qū)域,對(duì)每一字符作為二值圖像數(shù)據(jù)進(jìn)行分離處理。特征提取部5e提取由字符分離部5d分離出的每一字符的二值圖像數(shù)據(jù)的特征矢量。作為提取的字符特征,有字符邊緣的方向特征、字符筆畫(huà)密度特征、結(jié)構(gòu)分析的特征等。 在實(shí)施方式1中,可以采用任意特征提取方法。特征比較部5f在要識(shí)別的一個(gè)字符的二值圖像數(shù)據(jù)的特征矢量和登錄在特征詞典存放部5g中的基準(zhǔn)特征矢量之間進(jìn)行比對(duì),檢查距離值、相似度、或?qū)儆诨鶞?zhǔn)特征矢量的特征分量是否存在于要識(shí)別的一個(gè)字符的二值圖像數(shù)據(jù)的特征矢量中,根據(jù)這樣的檢查,判定對(duì)照程度,并將識(shí)別候補(bǔ)字符輸出。特征詞典存放部5g存放ID卡6中使用的所有字符的基準(zhǔn)特征矢量。字符判定部5h將從特征比較部5f輸出的識(shí)別候補(bǔ)字符作為ID卡6中使用的字符進(jìn)行輸出。(字符串識(shí)別方法的步驟)接下來(lái),基于圖3的流程圖,對(duì)一系列的字符串識(shí)別方法進(jìn)行說(shuō)明。利用具有上述結(jié)構(gòu)的字符串識(shí)別裝置1,在識(shí)別ID卡6上的字符串時(shí),使ID卡6 沿?cái)?shù)據(jù)輸入部2的介質(zhì)傳送機(jī)構(gòu)2a的傳送導(dǎo)軌進(jìn)行傳送,通過(guò)數(shù)據(jù)輸入部2的一維拍攝元件2b,從而可拍攝該ID卡6上的包含印刷有字符串的字符記錄區(qū)域60的表面。由一維拍攝元件2b拍攝光學(xué)圖像,將拍攝得到的模擬圖像信號(hào)進(jìn)行光電轉(zhuǎn)換,在轉(zhuǎn)換成數(shù)字多灰度的、例如8比特的256灰度的多值圖像數(shù)據(jù)之后,存儲(chǔ)到圖像存儲(chǔ)器3中。圖像存儲(chǔ)器3將多值圖像數(shù)據(jù)輸出到數(shù)據(jù)處理部5。數(shù)據(jù)處理部5如下面詳細(xì)闡述的那樣,依次執(zhí)行一系列的字符串識(shí)別處理(圖像二值化處理、字符串分離處理、字符分離處理、特征提取處理、特征比較處理、字符識(shí)別處理)。(圖像二值化處理)首先,在步驟Sl中,圖像二值化部5a進(jìn)行圖像二值化處理。即,圖像二值化部5a 從圖像存儲(chǔ)器3中讀出多值圖像數(shù)據(jù),并將該多值圖像數(shù)據(jù)轉(zhuǎn)換成二值圖像數(shù)據(jù)。轉(zhuǎn)換后的二值圖像數(shù)據(jù)在圖像存儲(chǔ)器3中作為二值圖像數(shù)據(jù)存放在與存放有多值圖像數(shù)據(jù)的存儲(chǔ)區(qū)域不同的存儲(chǔ)區(qū)域。另外,這以后的處理利用該黑白的二值圖像數(shù)據(jù)來(lái)進(jìn)行。(字符串分離處理)在進(jìn)行圖像二值化處理之后,轉(zhuǎn)移至步驟S2,字符串分離部5b進(jìn)行字符串的分離處理。下面,基于圖4所示的流程圖,說(shuō)明該字符串分離處理。
首先,在步驟Sll (字符串檢索范圍設(shè)定工序)中,字符串分離部5b的字符串檢索范圍設(shè)定部51將與ID卡6對(duì)應(yīng)的字符串檢索范圍Al的位置和形狀等信息從字符串檢索范圍存放部5c中讀出。具體而言,如圖6所示,矩形的字符串檢索范圍Al設(shè)定為收縮到形成有兩串字符串的區(qū)域的范圍。然后,在步驟S12(圖像處理區(qū)域設(shè)定工序)中,如圖6所示,字符串分離部5b的圖像處理區(qū)域設(shè)定部52檢測(cè)兩串字符串的左邊緣EL和右邊緣ER,將字符串檢索范圍Al 在字符串的方向上進(jìn)行收縮,以設(shè)定圖像處理區(qū)域(有效區(qū)域)Bi。換言之,圖像處理區(qū)域 (有效區(qū)域)Bl成為與分離出的字符串的左邊緣El及右邊緣ER外接的矩形。另外,圖像處理區(qū)域(有效區(qū)域)Bl是有效地進(jìn)行之后的字符串分離處理到字符識(shí)別處理的處理有效區(qū)域。具體而言,在以二值字符串檢索范圍Al的左上端點(diǎn)PO為起點(diǎn)向右方掃描而得到的垂直投影數(shù)據(jù)中,若各像素列的計(jì)數(shù)值(黑像素的檢測(cè))連續(xù)超過(guò)規(guī)定的閾值一定次數(shù) (例如3次),則將從其最開(kāi)始的部位再向左側(cè)后退幾個(gè)像素的位置作為圖像處理區(qū)域Bl 的左邊緣EL。此外,在以字符串檢索范圍Al的右上端點(diǎn)PE為起點(diǎn)向左方掃描而得到的垂直投影數(shù)據(jù)中,若各像素列的計(jì)數(shù)值連續(xù)超過(guò)規(guī)定的閾值一定次數(shù),則將從其最開(kāi)始的部位向右側(cè)后退幾個(gè)像素的位置作為圖像處理區(qū)域Bl的右邊緣ER。由此,在字符串檢索范圍 Al內(nèi)設(shè)定圖像處理區(qū)域Bi。另外,如圖6所示,圖像處理區(qū)域(有效區(qū)域)Bl在垂直方向上的長(zhǎng)度(寬度)與字符串檢索范圍Al相同。在此,所謂掃描,是指將二值圖像數(shù)據(jù)(以像素為要素的行列/矩陣)的像素每次以一個(gè)或幾個(gè)像素朝行(水平)方向或列(垂直)方向移位,同時(shí)計(jì)算圖像數(shù)據(jù)朝與移位方向垂直的方向的投影。此外,投影計(jì)算是將由二值化轉(zhuǎn)換成“1”或“0”的濃度的像素按照濃度分別進(jìn)行總計(jì)以求出濃度投影(濃度分布圖/直方圖),可以將白或黑的任一種像素作為總計(jì)值來(lái)進(jìn)行計(jì)算。在本實(shí)施方式中,計(jì)算黑像素。接下來(lái),在步驟S13(分區(qū)生成工序)中,如圖6所示,分區(qū)生成部53將圖像處理區(qū)域Bl沿ID卡6上的字符串的排列方向(水平方向)進(jìn)行分割,以生成8個(gè)分區(qū)SE (SEl SE2)。在此,雖然將分區(qū)SE的生成個(gè)數(shù)設(shè)定為8,但也可以是其他個(gè)數(shù)。若分區(qū)SE的生成個(gè)數(shù)是2的η次方(η為正整數(shù)),即是2、4、8、16........則具有易于進(jìn)行后面的處理的優(yōu)
點(diǎn)ο接下來(lái),在步驟S14 (投影計(jì)算工序)中,投影計(jì)算部54對(duì)這些分區(qū)SEl SE8的每一分區(qū),計(jì)算二值圖像數(shù)據(jù)朝ID卡6上的字符串的方向(水平方向)的水平投影。具體而言,使像素朝與字符串的方向正交的方向(垂直方向)移位,同時(shí)對(duì)各像素行的與黑像素相當(dāng)?shù)亩祱D像數(shù)據(jù)“1”的像素?cái)?shù)進(jìn)行總計(jì),生成水平投影直方圖。于是,對(duì)于圖6所示的 8個(gè)分區(qū)SE的配置,得到圖7所示的水平投影曲線。在圖7所示的每一分區(qū)SE中,水平方向的軸表示與黑像素相當(dāng)?shù)亩祱D像數(shù)據(jù) “1”的像素?cái)?shù),各分區(qū)的右端是黑像素?cái)?shù)為0的基準(zhǔn)線,若黑像素增加,則亮度值下降,曲線圖從右向左彎曲。此外,垂直方向的軸表示圖像處理區(qū)域Bl中的上端與下端之間的位置/距離。接下來(lái),在步驟S 15(字符串串?dāng)?shù)計(jì)算工序)中,字符串串?dāng)?shù)計(jì)算部55利用由投影計(jì)算部54生成的每一分區(qū)SE的水平投影曲線,計(jì)算每一分區(qū)SE的字符串的中心位置及串?dāng)?shù)。例如,在圖8所示的表中,示出基于圖7所示的水平投影曲線(二值圖像數(shù)據(jù)的水平投影直方圖)計(jì)算出的結(jié)果、即分區(qū)SEl SE8的每一分區(qū)的兩串字符串的中心位置及串?dāng)?shù)。對(duì)于具體的計(jì)算方法,在圖7所示的SE8中,使投影從起點(diǎn)S(起點(diǎn)S是既定值, 根據(jù)ID卡6來(lái)設(shè)定為適當(dāng)?shù)臄?shù)值)開(kāi)始向下,求出亮度值開(kāi)始下降(低于規(guī)定的閾值) 的點(diǎn)LT1、和輸出重新增加而復(fù)原(超過(guò)規(guī)定的閾值)的點(diǎn)LB1,將它們的中點(diǎn)LC1、即由 (LTl+LBl)/2給出的點(diǎn)作為圖6所示的上側(cè)的字符串中心位置來(lái)進(jìn)行存儲(chǔ)。同樣地,對(duì)于接下來(lái)出現(xiàn)的下側(cè)的字符串,繼續(xù)進(jìn)行求出LT2及LB2的操作直至達(dá)到投影的最終點(diǎn),存儲(chǔ)圖 6所示的下側(cè)的字符串中心位置LC2 = (LT2+LB2)/2。同樣地,在各分區(qū)SEl SE7中,對(duì)字符串中心位置的個(gè)數(shù)進(jìn)行計(jì)數(shù),將該個(gè)數(shù)作為字符串串?dāng)?shù)。在本實(shí)施方式1中,如圖5、6、 7所示,由于在ID卡6上形成有兩串字符串,因此,對(duì)于圖8的示例,在所有的分區(qū)SE中,字符串串?dāng)?shù)成為2。另外,雖然在圖8中,表示LCl的字符串中心位置成為250 253的值,但認(rèn)為這是允許范圍,認(rèn)為是相同的上側(cè)的字符串。同樣地,對(duì)于表示LC2的字符串中心位置的395 400,認(rèn)為是允許范圍,認(rèn)為是相同的下側(cè)的字符串。此外,對(duì)于ID卡6以外的介質(zhì),雖然未圖示,但有時(shí)在字符串檢索范圍內(nèi)形成有一串字符串。這樣,對(duì)于一串字符串的情況,在圖10中示出計(jì)算出字符串串?dāng)?shù)的情形。對(duì)于該圖10的示例,在所有的分區(qū)SEl SE8中,字符串中心位置大致成為416,字符串串?dāng)?shù)成為1。這樣,在本實(shí)施方式1中,由于利用字符串中心位置作為字符串位置,因此,具有簡(jiǎn)化后續(xù)處理工序的優(yōu)點(diǎn)。接下來(lái),在步驟S16 (字符串串?dāng)?shù)確定工序)中,如圖9所示,字符串串?dāng)?shù)確定部56 基于由步驟S15求出的分區(qū)SEl SE8的字符串串?dāng)?shù),生成表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布,基于該頻數(shù)分布來(lái)確定字符串串?dāng)?shù)。例如,對(duì)于圖8的示例,由于在所有的分區(qū)SEl SE8中,字符串串?dāng)?shù)為2,因此, 如圖9所示,字符串串?dāng)?shù)為2的情況的頻數(shù)成為8,其他情況的頻數(shù)成為0。其結(jié)果是,確定 “字符串串?dāng)?shù)為2”,整個(gè)圖像處理區(qū)域Bl的字符串串?dāng)?shù)確定為2。同樣地,對(duì)于圖10的示例,由于在所有的分區(qū)SE中,字符串串?dāng)?shù)為1,因此,如圖 11所示,字符串串?dāng)?shù)為1的情況的頻數(shù)成為8,其他情況的頻數(shù)成為0。其結(jié)果是,確定“字符串串?dāng)?shù)為1”,整個(gè)圖像處理區(qū)域Bl的字符串串?dāng)?shù)確定為1。另外,根據(jù)分區(qū)SE的配置等的影響,每一分區(qū)SE的字符串串?dāng)?shù)有時(shí)可能不全是相同串?dāng)?shù)。特別是,由于兩端的分區(qū)SE(SE1、SE8)在一定程度上包含字符串的左側(cè)或右側(cè)的空白部分,因此,字符串串?dāng)?shù)有時(shí)會(huì)產(chǎn)生誤差。在該情況下,雖然最大頻數(shù)比所生成的分區(qū) SE的數(shù)量即8要小,但允許最大頻數(shù)到7,例如,在圖8所示的示例中,若字符串串?dāng)?shù)為2的情況的頻數(shù)是7,則判定為表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布是正常的。艮口, 即使在兩端的任一端出現(xiàn)端效應(yīng)、從而檢測(cè)出比實(shí)際要少的字符串串?dāng)?shù)的情況下,也視為有效。此時(shí),由于將兩端中任一端的分區(qū)SE去除后的7個(gè)分區(qū)SE是相同的字符串串?dāng)?shù),因此,能判斷為數(shù)值的可靠性較高。接下來(lái),為了排除該介質(zhì)不是規(guī)定格式的ID卡6的情況,在步驟S17 (字符串串?dāng)?shù)正確與否判定工序)中,字符串串?dāng)?shù)正確與否判定部57基于由步驟S13生成的每一分區(qū)SE 的字符串串?dāng)?shù),判定表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布是否正常。在該判定的結(jié)果是基于所生成的每一分區(qū)SE的字符串串?dāng)?shù)、判定為表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布不正常的情況下,判定該介質(zhì)不是ID卡6,轉(zhuǎn)移至步驟S20。另一方面, 在判定為表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布正常的情況下,判定為該介質(zhì)可能是ID卡6,為了確定該介質(zhì)是ID卡6而轉(zhuǎn)移至步驟S18。(使用格式與ID卡6不同的介質(zhì)的情況)在此,即使在基于每一分區(qū)SE的字符串串?dāng)?shù)、判定為表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布正常的情況下,也無(wú)法斷言該介質(zhì)是ID卡6,這是由于該頻數(shù)分布正常不構(gòu)成該介質(zhì)是ID卡6的充分條件。S卩,由于像下面例示地那樣,可假定如下情況即使表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布正常,該介質(zhì)也不是ID卡6。具體而言,考慮使用字符串格式與ID卡6不同的介質(zhì)的情況。例如,所使用的介質(zhì)是圖12那樣的ID卡6以外的介質(zhì)(例如,信用卡、員工證等)的情況。在圖12所示的介質(zhì)中,在字符串檢索范圍B2內(nèi),在范圍B2的大致中央形成有一串字符串,在右側(cè)上端印刷有臉部照片的一部分。設(shè)將這種介質(zhì)輸入到處理系統(tǒng)。于是,字符串分離的處理結(jié)果如圖13 圖15所示。圖13是與圖12所示的8個(gè)分區(qū)SEll SE18的配置相對(duì)應(yīng)的水平投影曲線。水平方向的軸表示像素?cái)?shù),垂直方向的軸表示從圖像處理區(qū)域B2的上端到下端的位置/距離。圖14所示的表表示基于水平投影曲線的計(jì)算結(jié)果、即分區(qū)SEll SE18的每一分區(qū)的一串字符串的中心位置及串?dāng)?shù)。圖15表示基于分區(qū)SEll SE18的每一分區(qū)的字符串串?dāng)?shù)的、表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布。在圖15中,字符串串?dāng)?shù)為2的情況的頻數(shù)成為7,如上所述,滿足7以上這一字符串串?dāng)?shù)確定基準(zhǔn)。因此,看起來(lái)由于字符串串?dāng)?shù)為2,從而介質(zhì)是ID卡6的判別成立。這是由于根據(jù)分區(qū)SE中的字符串以外的圖像數(shù)據(jù)的位置關(guān)系,該圖像數(shù)據(jù)偶然滿足與真正的字符串相同的條件。其結(jié)果是,基于每一分區(qū)SE的字符串串?dāng)?shù),誤判定為表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布正常,無(wú)法判別該介質(zhì)不是ID卡6。因而,為了避免這種誤判定,在步驟S18及步驟S19中,即使在判定為該介質(zhì)可能是ID卡6的情況下,也根據(jù)如下假設(shè)來(lái)檢測(cè)字符串內(nèi)有無(wú)異常若介質(zhì)是ID卡6,則字符串中心位置在相鄰的兩個(gè)分區(qū)SE之間不會(huì)急劇變化。S卩,求出每一分區(qū)SE的字符串中心位置的二次差分,根據(jù)該二次差分,能檢測(cè)字符串內(nèi)有無(wú)異常(步驟S18),判定該字符串是否是ID卡6上的規(guī)定的字符串,即判定該介質(zhì)是否一定是ID卡6 (步驟S19)。下面,具體說(shuō)明這些步驟。在步驟S18 (字符串內(nèi)異常檢測(cè)工序)中,差分運(yùn)算部58對(duì)于各字符串,運(yùn)算圖16 及圖17所示的字符串中心位置的一次差分及二次差分,以作為表示字符串內(nèi)異常的指標(biāo)。 在此,圖16是表示圖12所示的圖像數(shù)據(jù)中的字符串中心位置的一次差分的表,圖17是進(jìn)一步表示其二次差分的表。具體而言,差分運(yùn)算部58首先運(yùn)算在相鄰的兩個(gè)分區(qū)SE之間的字符串中心位置的一次差分。例如,圖14表示圖12所示的圖像數(shù)據(jù)中的每一分區(qū)的字符串串?dāng)?shù)及字符串中心位置,在該圖14的推定為上側(cè)的字符串的數(shù)據(jù)LCll (稱為“上側(cè)的字符串”)中,由于分區(qū)SE13的LCll = 149,其左側(cè)分區(qū)SE12的LCll = 147,因此兩者的差分成為2。同樣地,對(duì)于其他分區(qū)及字符串,也運(yùn)算字符串中心位置的一次差分,生成圖16的表。接下來(lái),利用該一次差分的運(yùn)算結(jié)果,如圖17所示,運(yùn)算每一分區(qū)SE的字符串中心位置的二次差分,生成圖17的表。例如,在圖17中,上側(cè)的串的左起第3個(gè)的二次差分-91是從圖16所示的上側(cè)的字符串的分區(qū)SE15 16的一次差分-19、減去左側(cè)的分區(qū)SE14 15的一次差分 72而得到的差分。接下來(lái),在步驟S19(字符串有效性驗(yàn)證工序)中,確認(rèn)該介質(zhì)是否是ID卡6。具體而言,字符串有效性驗(yàn)證部59對(duì)于各字符串,判定每一分區(qū)SE的字符串中心位置的二次差分的絕對(duì)值的最大值是否超過(guò)規(guī)定的閾值(例如20)。然后,在該二次差分的絕對(duì)值的最大值超過(guò)規(guī)定的閾值的情況下,判定為在字符串內(nèi)有異常,該介質(zhì)上的字符串不是規(guī)定的字符串(該介質(zhì)不是ID卡6)。此外,在其他情況下,判定為在字符串內(nèi)沒(méi)有異常,該介質(zhì)上的字符串是規(guī)定的字符串(該介質(zhì)是ID卡6)。例如,在圖17所示的情況下,上側(cè)的字符串中心位置二次差分從左開(kāi)始成為-2、 72、_91、19、1,每一分區(qū)SE的字符串中心位置的二次差分的絕對(duì)值的最大值為91,由于這與上述閾值20相比為異常大的值,因此,判定為在上側(cè)的字符串內(nèi)有異常。另一方面,下側(cè)的字符串中心位置二次差分從左開(kāi)始成為0、0、0、1、_2,絕對(duì)值的最大值成為2。由于這是比閾值20要小的值,因此,判定為下側(cè)的字符串正常。由此,由于在上側(cè)的字符串內(nèi)有異常,因此,判定為該介質(zhì)不是ID卡6。這樣,通過(guò)步驟S18 (字符串內(nèi)異常檢測(cè)工序)及步驟S19 (字符串有效性驗(yàn)證工序),盡管介質(zhì)不是ID卡6,但即使在偶然生成與真正的字符串相同的條件的情況下,也可以判別該介質(zhì)不是ID卡6。此外,如上所述,由于將ID卡6以外的介質(zhì)上設(shè)定的圖像處理區(qū)域B2分割成多個(gè)分區(qū)SE,之后,利用每一分區(qū)SE的字符串中心位置的二次差分來(lái)檢測(cè)字符串內(nèi)有無(wú)異常, 因此,即使介質(zhì)上的字符串傾斜,也提高了正確讀取字符串的可能性。然后,在步驟S19中的處理結(jié)果判定為該介質(zhì)是ID卡6的情況下,判斷為字符串無(wú)異常,圖4所示的流程圖結(jié)束。另一方面,在判定為該介質(zhì)不是ID卡6的情況下,與在之前的步驟S 17中判定為該介質(zhì)不是ID卡6的情況相同,轉(zhuǎn)移至步驟S20(字符串檢索范圍再設(shè)定工序)。在步驟S20中,字符串分離部5b的字符串檢索范圍設(shè)定部51將與ID卡6所使用的字符串檢索范圍Al不同的其他字符串檢索范圍從字符串檢索范圍存放部5c中讀出,并在保存于圖像存儲(chǔ)器3的二值圖像數(shù)據(jù)上設(shè)定該其他字符串檢索范圍。接下來(lái),在步驟S21 (字符串檢索范圍殘留判定工序)中,數(shù)據(jù)處理部5的主控制部50判定是否殘留有未設(shè)定的字符串檢索范圍,若沒(méi)有殘留未設(shè)定的字符串檢索范圍,則圖4所示的流程圖結(jié)束。另一方面,若殘留有未設(shè)定的字符串檢索范圍,則返回至步驟S12, 重復(fù)上述處理。另外,對(duì)于步驟S20和步驟S21,可以先執(zhí)行S21,或者也可以同時(shí)執(zhí)行兩個(gè)步驟。由此,對(duì)于存放在字符串檢索范圍存放部5c中的所有字符串檢索范圍,依次執(zhí)行字符串分離處理,可以正確識(shí)別所假定的各種格式。在此,若圖4所示的流程圖結(jié)束,則轉(zhuǎn)移至圖3所示的流程圖的步驟S3。(字符分離處理)
下面,基于圖18所示的流程圖,說(shuō)明步驟S3的字符分離處理。首先,在步驟S31 中,字符分離部5d使投影位置朝字符串的方向移位,同時(shí)計(jì)算朝與字符串的方向垂直的方向的垂直投影。具體而言,在圖6所示的圖像處理區(qū)域Bl內(nèi),在一個(gè)字符串、例如上側(cè)的字符串中,對(duì)于與字符串的方向正交的方向(垂直方向)的各像素行的每一行,對(duì)各行的與黑像素相當(dāng)?shù)亩祱D像數(shù)據(jù)“1”的像素?cái)?shù)進(jìn)行計(jì)數(shù)(累計(jì)),生成垂直投影直方圖。接下來(lái),轉(zhuǎn)移至步驟S32,字符分離部5d根據(jù)利用由步驟S31得到的垂直投影數(shù)據(jù)而檢測(cè)出的字符串的兩端之間的像素?cái)?shù),計(jì)算字符行長(zhǎng)度。接下來(lái),轉(zhuǎn)移至步驟S33,字符分離部5d將由步驟S31得到的垂直投影數(shù)據(jù)超過(guò)規(guī)定的閾值的部位檢測(cè)作為構(gòu)成字符串的字符的分離位置。具體而言,由于構(gòu)成字符串的字符與字符之間包含空白部分,因此,通過(guò)將該空白部分的亮度值(在實(shí)施方式1中,與白像素相當(dāng)?shù)亩祱D像數(shù)據(jù)“0”)設(shè)定成為閾值,從而作為字符的分離位置。通過(guò)這種字符分離處理,求出成為識(shí)別對(duì)象的字符的外接矩形區(qū)域、即左右上下的坐標(biāo)值。在此,圖18所示的流程圖結(jié)束。然后,轉(zhuǎn)移至圖3所示的流程圖的步驟S4。(特征提取處理)在進(jìn)行字符分離之后,轉(zhuǎn)移至步驟S4,特征提取部5e進(jìn)行特征提取。即,特征提取部5e將字符的外接矩形區(qū)域分割為nXn個(gè)子區(qū)域。例如,若設(shè)η = 5,則生成25個(gè)子區(qū)域。在各子區(qū)域中,求出黑像素?cái)?shù)在該子區(qū)域內(nèi)的所有像素?cái)?shù)中所占的比例,生成將此作為要素的特征矢量。(特征比較處理)在進(jìn)行特征提取之后,轉(zhuǎn)移至步驟S5,特征比較部5f進(jìn)行特征比較。S卩,特征比較部5f將由步驟S4生成的特征矢量與存放在特征詞典存放部5g中的基準(zhǔn)特征矢量進(jìn)行比較,將相似度(例如歸一化相關(guān)系數(shù))最高的字符設(shè)定為相當(dāng)于該字符的候補(bǔ)字符。(字符識(shí)別處理)在進(jìn)行特征比較之后,轉(zhuǎn)移至步驟S6,字符判定部5h進(jìn)行字符識(shí)別。即,字符判定部5h將由步驟S5設(shè)定的候補(bǔ)字符識(shí)別為在作為介質(zhì)的ID卡6中使用的字符。另外,在相似度超過(guò)固定值的候補(bǔ)字符存在多個(gè)的情況下,在該階段無(wú)法進(jìn)行字符識(shí)別。在該情況下,作為無(wú)法識(shí)別進(jìn)行處理,或者,利用從特征矢量導(dǎo)出的二次特征量,進(jìn)行相似字符的判別。例如,關(guān)注左右線對(duì)稱性、上下線對(duì)稱性、以及點(diǎn)對(duì)稱性這三種對(duì)稱性。對(duì)于左右線對(duì)稱性,將nXn子區(qū)域分成左側(cè)半部和右側(cè)半部這兩個(gè)區(qū)域,構(gòu)成部分特征矢量,檢查它們之間的相似性。此外,對(duì)于上下線對(duì)稱性,將nXn子區(qū)域分成上半部和下半部這兩個(gè)區(qū)域,構(gòu)成部分特征矢量,檢查它們之間的相似性。此外,對(duì)于點(diǎn)對(duì)稱性,也用相同的方法檢查相似性。由于對(duì)于一個(gè)字符能得到三種形狀特征量,因此,根據(jù)這些值的相互關(guān)系,對(duì)應(yīng)相應(yīng)的字符。但是,即使如此,有時(shí)也會(huì)無(wú)法分離。例如,根據(jù)介質(zhì)中使用的字符類型,有時(shí)難以判別“0”(字母的0)和“0”(數(shù)字的零)。在該情況下,例如,通過(guò)檢查字符的高度差異、四角的曲率差異,可以進(jìn)行該判別。
在此,由字符串識(shí)別裝置1進(jìn)行的字符串識(shí)別方法結(jié)束。(實(shí)施方式1的主要效果)像以上說(shuō)明的那樣,在本實(shí)施方式1中,即使是ID卡6等介質(zhì)那樣的、假定有多種格式的識(shí)別處理系統(tǒng),也可以正確識(shí)別各種格式。此外,ID卡6等介質(zhì)上的圖像處理區(qū)域B 1沿字符串的排列方向被分割成多個(gè)分區(qū)SE,基于這些分區(qū)SE的每一分區(qū)的字符串串?dāng)?shù),確定整個(gè)圖像處理區(qū)域Bl的字符串串?dāng)?shù),基于該字符串串?dāng)?shù),能驗(yàn)證字符串的有效性(該字符串是否是規(guī)定的字符串)。[發(fā)明的實(shí)施方式2]圖19表示本發(fā)明的實(shí)施方式2。在上述的實(shí)施方式1中,說(shuō)明了如下情況在圖4所示的流程圖的步驟S17中的判定結(jié)果是基于每一分區(qū)SE的字符串串?dāng)?shù)、判定為表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布不正常(介質(zhì)6不是ID卡6)時(shí),在介質(zhì)6上設(shè)定新的字符串檢索范圍。但是,也可以對(duì)原來(lái)的字符串檢索范圍Al內(nèi)的圖像處理區(qū)域Bl生成新的分區(qū)SE,來(lái)取代設(shè)定新的字符串檢索范圍A2。下面,說(shuō)明生成新的分區(qū)SE的情況。S卩,在本實(shí)施方式2中,如圖19所示,在步驟S17中的判定結(jié)果是基于每一分區(qū) SE的字符串串?dāng)?shù)、判定為表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布不正常時(shí),在步驟S22(分區(qū)重新生成工序)中,字符串分離部5b的分區(qū)生成部53對(duì)圖像處理區(qū)域Bl的分割數(shù)進(jìn)行增減變更。接下來(lái),在步驟S23(分割次數(shù)判定工序)中,字符串分離部5b (數(shù)據(jù)處理部5)的主控制部50判定對(duì)圖像處理區(qū)域Bl的以往的分割數(shù)進(jìn)行增減變更的次數(shù)是否超過(guò)規(guī)定的次數(shù)(例如5次)。其結(jié)果是,若對(duì)圖像處理區(qū)域Bl的分割數(shù)進(jìn)行增減變更的次數(shù)未超過(guò)規(guī)定的次數(shù),則返回至步驟S13,字符串分離部5b的分區(qū)生成部53以由步驟S22進(jìn)行增減變更而得到的分割數(shù)沿介質(zhì)6上的字符串的方向?qū)D像處理區(qū)域Bl進(jìn)行分割,生成多個(gè)(例如16 個(gè))分區(qū)SE。另一方面,若對(duì)圖像處理區(qū)域Bl的分割數(shù)進(jìn)行增減變更的次數(shù)超過(guò)規(guī)定的次數(shù), 則得出如下結(jié)論不管在該圖像處理區(qū)域Bl中再如何進(jìn)一步增減其分割數(shù),基于每一分區(qū) SE的字符串串?dāng)?shù)、判斷為表示規(guī)定的字符串串?dāng)?shù)的分區(qū)的數(shù)量的頻數(shù)分布正常的可能性也很小,轉(zhuǎn)移至步驟S20,字符串分離部5b的字符串檢索范圍設(shè)定部51在保存于圖像存儲(chǔ)器 3的二值圖像數(shù)據(jù)上設(shè)定與字符串檢索范圍Al不同的字符串檢索范圍A2,這之后進(jìn)行與圖 4的實(shí)施方式相同的處理。由此,對(duì)圖像處理區(qū)域Bl執(zhí)行規(guī)定的次數(shù)的分割處理,可以精確地執(zhí)行格式的識(shí)別。另外,其他處理與上述實(shí)施方式1相同,起到與實(shí)施方式1相同的作用效果。[發(fā)明的其他實(shí)施方式]在上述實(shí)施方式1、2中,雖然將根據(jù)ID卡6的格式而設(shè)定的字符串檢索范圍Al進(jìn)一步收縮,設(shè)定有效地進(jìn)行字符串分離以后的處理的圖像處理區(qū)域(有效區(qū)域)Bi,但并不一定要設(shè)定圖像處理區(qū)域Bi,也可以將字符串檢索范圍Al作為圖像處理區(qū)域(有效區(qū)域) 來(lái)進(jìn)行字符串分離以后的處理。即,Sll及S12也可以合并作為一個(gè)工序。
在上述實(shí)施方式1、2中,說(shuō)明了如下情況在確認(rèn)介質(zhì)是否是ID卡6時(shí),利用每一分區(qū)SE的字符串中心位置的二次差分來(lái)判定介質(zhì)上的字符串是否是規(guī)定的字符串。但是,作為表示字符串在與字符串的方向垂直的方向上的位置,不一定需要采用字符串中心位置,也可以例如將由(LT+2LB)/3給出的一個(gè)三等分點(diǎn)作為字符串位置。此外,也可以利用遞歸分析、主分量分析等多變量解析,以代替利用二次差分的方法。此外,在上述實(shí)施方式1、2中,雖然說(shuō)明了將介質(zhì)傳送機(jī)構(gòu)2a和一維拍攝元件2b 進(jìn)行組合而得到的數(shù)據(jù)輸入部2,但不限于此,也可以例如將二維(XD、CMOS成像器等區(qū)域傳感器和被拍攝物體支承機(jī)構(gòu)進(jìn)行組合而構(gòu)成數(shù)據(jù)輸入部2。此外,雖然上述實(shí)施方式1、2的字符串識(shí)別裝置1包括介質(zhì)傳送機(jī)構(gòu)2a,但也可以采用不包括介質(zhì)傳送機(jī)構(gòu)2a而沿傳送導(dǎo)軌2c等的基準(zhǔn)面手動(dòng)傳送介質(zhì)的手動(dòng)式字符串識(shí)別裝置。此外,在上述實(shí)施方式1、2中,雖然說(shuō)明了 ID卡6用的字符串識(shí)別裝置1,但本發(fā)明當(dāng)然也同樣適用于對(duì)記錄在ID卡6以外的介質(zhì)(例如,護(hù)照、支票、信用卡、現(xiàn)金結(jié)算卡、 電子貨幣、駕駛執(zhí)照、健康保險(xiǎn)被保險(xiǎn)證、退休金證件、員工證、會(huì)員證、借書(shū)卡等)上的字符串進(jìn)行識(shí)別的字符串識(shí)別裝置。工業(yè)上的實(shí)用性在對(duì)記錄在ID卡、護(hù)照、支票等各種介質(zhì)上的字符串進(jìn)行讀取時(shí),可采用本發(fā)明所涉及的字符串識(shí)別裝置及字符串識(shí)別方法。標(biāo)號(hào)說(shuō)明1……字符串識(shí)別裝置2……數(shù)據(jù)輸入部2a……介質(zhì)傳送機(jī)構(gòu)2b……一維拍攝元件3……圖像存儲(chǔ)器5……數(shù)據(jù)處理部5a……圖像二值化部5b……字符串分離部5c……字符串檢索范圍存放部5d……字符分離部5e……特征提取部5f……特征比較部5g……特征詞典存放部5h……字符判定部6……作為介質(zhì)的ID卡50……主控制部51……字符串檢索范圍設(shè)定部(字符串檢索范圍設(shè)定單元)52……圖像處理區(qū)域設(shè)定部(圖像處理區(qū)域設(shè)定單元)53……分區(qū)生成部(分區(qū)生成單元)54……投影計(jì)算部(投影計(jì)算單元)
55……字符串串?dāng)?shù)計(jì)算部(字符串串?dāng)?shù)計(jì)算單元)56……字符串串?dāng)?shù)確定部(字符串串?dāng)?shù)確定單元)57……字符串串?dāng)?shù)正確與否判定部58……差分運(yùn)算部59……字符串有效性驗(yàn)證部(字符串有效性驗(yàn)證單元)A……字符串檢索范圍B……圖像處理區(qū)域SE......分區(qū)
權(quán)利要求
1.一種字符串識(shí)別裝置,該字符串識(shí)別裝置通過(guò)對(duì)拍攝介質(zhì)上的字符串而得到的圖像數(shù)據(jù)進(jìn)行處理,以識(shí)別所述字符串,其特征在于,包括字符串檢索范圍設(shè)定單元,該字符串檢索范圍設(shè)定單元在所述介質(zhì)上設(shè)定字符串檢索范圍;分區(qū)生成單元,該分區(qū)生成單元在所述字符串的方向上對(duì)所述字符串檢索范圍進(jìn)行分割以生成多個(gè)分區(qū);投影計(jì)算單元,該投影計(jì)算單元對(duì)每一所述分區(qū)計(jì)算所述圖像數(shù)據(jù)朝所述字符串的方向的投影;字符串串?dāng)?shù)計(jì)算單元,該字符串串?dāng)?shù)計(jì)算單元基于所述圖像數(shù)據(jù)的投影,計(jì)算每一所述分區(qū)的字符串串?dāng)?shù);字符串串?dāng)?shù)確定單元,該字符串串?dāng)?shù)確定單元基于每一所述分區(qū)的字符串串?dāng)?shù),確定整個(gè)所述字符串檢索范圍的字符串串?dāng)?shù);字符串有效性驗(yàn)證單元,該字符串有效性驗(yàn)證單元基于整個(gè)所述字符串檢索范圍的字符串串?dāng)?shù),判定所述字符串是否是規(guī)定的字符串。
2.如權(quán)利要求1所述的字符串識(shí)別裝置,其特征在于,所述字符串串?dāng)?shù)確定單元基于每一所述分區(qū)的字符串串?dāng)?shù),求出表示規(guī)定的字符串串?dāng)?shù)的所述分區(qū)的數(shù)量的頻數(shù)分布,將表示頻數(shù)為最大值的字符串串?dāng)?shù)確定為整個(gè)所述字符串檢索范圍的字符串串?dāng)?shù)。
3.如權(quán)利要求2所述的字符串識(shí)別裝置,其特征在于,所述字符串檢索范圍設(shè)定單元在表示所述規(guī)定的字符串串?dāng)?shù)的所述分區(qū)的數(shù)量的頻數(shù)分布不正常的情況下,在所述介質(zhì)上設(shè)定與所述字符串檢索范圍不同的字符串檢索范圍。
4.如權(quán)利要求2所述的字符串識(shí)別裝置,其特征在于,所述分區(qū)生成單元在表示所述規(guī)定的字符串串?dāng)?shù)的所述分區(qū)的數(shù)量的頻數(shù)分布不正常的情況下,增減所述字符串檢索范圍的分割數(shù)以生成與所述分區(qū)不同的分區(qū)。
5.如權(quán)利要求1至4的任一項(xiàng)所述的字符串識(shí)別裝置,其特征在于,所述字符串有效性驗(yàn)證單元對(duì)每一所述分區(qū)求出與所述字符串的方向垂直的方向上的字符串位置,基于這些字符串位置的一次差分,檢測(cè)出所述字符串內(nèi)有無(wú)異常,之后,當(dāng)在所述字符串內(nèi)沒(méi)有檢測(cè)出異常時(shí),判定為所述字符串是規(guī)定的字符串。
6.如權(quán)利要求5所述的字符串識(shí)別裝置,其特征在于,當(dāng)在所述字符串內(nèi)檢測(cè)出異常時(shí),所述字符串檢索范圍設(shè)定單元在所述介質(zhì)上設(shè)定與所述字符串檢索范圍不同的字符串檢索范圍。
7.如權(quán)利要求5所述的字符串識(shí)別裝置,其特征在于,所述字符串有效性驗(yàn)證單元在檢測(cè)所述字符串內(nèi)有無(wú)異常時(shí),在每一所述分區(qū)的字符串位置的二次差分的絕對(duì)值的最大值超過(guò)規(guī)定的閾值的情況下,判定為在所述字符串內(nèi)有異常。
8.如權(quán)利要求5所述的字符串識(shí)別裝置,其特征在于,所述字符串位置是字符串中心位置。
9.如權(quán)利要求1至4的任一項(xiàng)所述的字符串識(shí)別裝置,其特征在于,所述分區(qū)的生成個(gè)數(shù)是2的η次方(η為正整數(shù))。
10. 一種字符串識(shí)別方法,該字符串識(shí)別方法通過(guò)對(duì)拍攝介質(zhì)上的字符串而得到的圖像數(shù)據(jù)進(jìn)行處理,以識(shí)別所述字符串,其特征在于,包括字符串檢索范圍設(shè)定工序,該字符串檢索范圍設(shè)定工序在所述介質(zhì)上設(shè)定字符串檢索范圍;分區(qū)生成工序,該分區(qū)生成工序在所述字符串的方向上對(duì)所述字符串檢索范圍進(jìn)行分割以生成多個(gè)分區(qū);投影計(jì)算工序,該投影計(jì)算工序?qū)γ恳凰龇謪^(qū)計(jì)算所述圖像數(shù)據(jù)朝所述字符串的方向的投影;字符串串?dāng)?shù)計(jì)算工序,該字符串串?dāng)?shù)計(jì)算工序基于所述圖像數(shù)據(jù)的投影,計(jì)算每一所述分區(qū)的字符串串?dāng)?shù);字符串串?dāng)?shù)確定工序,該字符串串?dāng)?shù)確定工序基于每一所述分區(qū)的字符串串?dāng)?shù),確定整個(gè)所述字符串檢索范圍的字符串串?dāng)?shù);字符串有效性驗(yàn)證工序,該字符串有效性驗(yàn)證工序基于整個(gè)所述字符串檢索范圍的字符串串?dāng)?shù),判定所述字符串是否是規(guī)定的字符串。
全文摘要
在用于對(duì)介質(zhì)上的字符串進(jìn)行讀取的字符串識(shí)別裝置及字符串識(shí)別方法中,即使是假定有多種格式的識(shí)別處理系統(tǒng),也能正確識(shí)別格式。在介質(zhì)上設(shè)定圖像處理區(qū)域(字符串檢索范圍)(S12)。沿字符串的排列方向?qū)D像處理區(qū)域(字符串檢索范圍)進(jìn)行分割,以生成多個(gè)分區(qū)(S13)。對(duì)每一分區(qū)計(jì)算圖像數(shù)據(jù)沿字符串的排列方向的投影(S14)?;趫D像數(shù)據(jù)的投影,計(jì)算每一分區(qū)的字符串串?dāng)?shù)(S15)?;诿恳环謪^(qū)的字符串串?dāng)?shù),確定整個(gè)圖像處理區(qū)域(字符串檢索范圍)的字符串串?dāng)?shù)(S16)?;谡麄€(gè)圖像處理區(qū)域(字符串檢索范圍)的字符串串?dāng)?shù),判定字符串是否是規(guī)定的字符串(S19)。
文檔編號(hào)G06K9/72GK102222241SQ20111011127
公開(kāi)日2011年10月19日 申請(qǐng)日期2011年4月18日 優(yōu)先權(quán)日2010年4月19日
發(fā)明者中村宏 申請(qǐng)人:日本電產(chǎn)三協(xié)株式會(huì)社