專利名稱:一種有限符號(hào)集的局部擇優(yōu)匹配法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種模式識(shí)別方法,具體說(shuō)是一種在計(jì)算機(jī)中對(duì)掃描儀或攝像頭獲取的靜態(tài)圖像按像素塊分割,并提取符號(hào)塊的結(jié)構(gòu)信息,與有限符號(hào)集的特征進(jìn)行匹配的方法。
對(duì)于文字識(shí)別,目前傳統(tǒng)的方法是對(duì)大數(shù)量的字模作廣度優(yōu)先搜索。在這種方法中,先從初始字模開(kāi)始,按規(guī)則G(x)逐步逼近下一個(gè)字模,順序檢查是否出現(xiàn)目標(biāo)字模Sg,在全部范圍中沿廣度進(jìn)行″橫向″掃描,運(yùn)用評(píng)價(jià)函數(shù)E(x)=d(x),得出與字模的相似度。這種方法在字模數(shù)量多的情況下具有實(shí)用性。但是,為了保證匹配速度,其匹配特征太簡(jiǎn)化,有效識(shí)別率不高。
本發(fā)明的目的是提供一種應(yīng)用于需要匹配的符號(hào)數(shù)量有限,但識(shí)別準(zhǔn)確率要求較高、識(shí)別速度較快的方法,從而實(shí)現(xiàn)有限符號(hào)集的快速和準(zhǔn)確識(shí)別的圖象/文本轉(zhuǎn)換。
本發(fā)明所采取的技術(shù)措施是在符號(hào)數(shù)量有限的前提下對(duì)每個(gè)符號(hào)的左上、右上、左下和右下四塊圖象進(jìn)行局部分析,分別找出直線子特征橫、豎、撇、捺和拐角子特征左上勾、右上勾、左下勾、右下勾的數(shù)量、位置和長(zhǎng)度,與標(biāo)準(zhǔn)符號(hào)的相應(yīng)子特征進(jìn)行比較,其中數(shù)量作為主特征,位置和長(zhǎng)度作為輔特征,當(dāng)單從主特征可以把其中一個(gè)符號(hào)辨析出來(lái)時(shí),該符號(hào)只做主特征辨析;兩個(gè)以上的符號(hào)主特征重合時(shí),對(duì)這些符號(hào)加做位置和長(zhǎng)度輔特征辨析;有限集合內(nèi)兩個(gè)符號(hào)相似即其大部分特征相同時(shí),針對(duì)不同的特征加強(qiáng)辨析權(quán)重,用整體和局部最優(yōu)的方法按權(quán)重取相似度的方法搜索出最近似符號(hào)。
本發(fā)明所述的搜索的過(guò)程就是在樣本集空間中找出到最相似目標(biāo)狀態(tài)的路徑集合,從樹(shù)根的一個(gè)初始狀態(tài)開(kāi)始,構(gòu)造一棵為可能解的動(dòng)作序列樹(shù),明顯不匹配的分支被忽略,然后找出與根結(jié)點(diǎn)匹配的所有分支,建立新的狀態(tài)結(jié)點(diǎn),從而生成下一層樹(shù),取上層樹(shù)生成的每一結(jié)點(diǎn),再找出與其匹配的結(jié)點(diǎn)并又生成下一層樹(shù),繼續(xù)此過(guò)程直至匹配目標(biāo)狀態(tài)的構(gòu)型生成為止,最后取加權(quán)重后相似度最高的樣本為最優(yōu)解。
本發(fā)明所述的采用整體和局部最優(yōu)的方法使用函數(shù)來(lái)對(duì)單個(gè)符號(hào)塊特征作出估計(jì),以確定其與樣本的近似程度,該函數(shù)把相似描述映射成成功度并用數(shù)值表示,采用生長(zhǎng)點(diǎn)擴(kuò)張法勾勒出圖象的局部輪廓,把線條單值化,由象素粘連角度判斷橫、豎、撇、捺和四種方向拐角的矢量特征;由象素投影面積得到筆畫(huà)的長(zhǎng)度特征;由象素段的起點(diǎn)和終點(diǎn)得到相對(duì)位置特征。
局部擇優(yōu)匹配法是廣度優(yōu)先匹配法的一種改進(jìn),同時(shí)也是一種層次遞進(jìn)的快速匹配方法。該方法在特征匹配策略中引入了層次結(jié)構(gòu),使匹配過(guò)程的相似函數(shù)E(x)反映下層次信息,當(dāng)上層特征不足以判斷時(shí),選取最有希望逼近目標(biāo)樣本的方向,逐級(jí)沿縱向深度進(jìn)行細(xì)節(jié)匹配,以便加快匹配過(guò)程,提高匹配效率。
本發(fā)明的優(yōu)點(diǎn)是針對(duì)性強(qiáng)、匹配信息量大,配合圖形掃描儀或攝象機(jī)用于防偽稅控發(fā)票符號(hào),現(xiàn)金支票符號(hào),汽車(chē)牌照符號(hào)的識(shí)別等,具有識(shí)別率高,識(shí)別時(shí)間短的特點(diǎn)。
下面結(jié)合實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳述。
首先,對(duì)待識(shí)別對(duì)象的全部集合進(jìn)行分析。分別找出標(biāo)準(zhǔn)樣版左上、右上、左下和右下四部分圖象的直線子特征橫、豎、撇、捺和拐角子特征左上勾、右上勾、左下勾、右下勾的數(shù)量、長(zhǎng)度和相對(duì)位置,建立樣本記錄集。對(duì)于沒(méi)有明顯拐角的曲線,當(dāng)成首尾相連的直線,由于在單字分辨率為24*16象素的樣本中,取四個(gè)象素為直線特征的最小描述,所以曲線被近似為長(zhǎng)度為四的折線段。在特定系統(tǒng)中,例如字符集合只有“6”和“9”,那么只要記錄兩個(gè)字模子特征的數(shù)量就可以完成辯識(shí),但當(dāng)字符集是“6”和“8”,它們的子特征在數(shù)量上相同,就需要增加長(zhǎng)度或位置辨析,特征為完整的數(shù)量、長(zhǎng)度和位置信息。同時(shí)建立單從數(shù)量不能辨析的符號(hào)數(shù)量矩陣E,其中包含候選符號(hào)序列E(x)。再建立符號(hào)子特征權(quán)重表,記錄需要仔細(xì)辨析的各個(gè)符號(hào)的細(xì)節(jié)權(quán)重。在匹配時(shí)權(quán)重值表現(xiàn)了該細(xì)節(jié)相對(duì)于其他細(xì)節(jié)的重要性。本方法是辨析信息不定長(zhǎng)的彈性匹配,這也是符合整體信息快速匹配,容易混淆的符號(hào)再用細(xì)節(jié)區(qū)分的效率原則。
待識(shí)別對(duì)象的預(yù)處理,按實(shí)現(xiàn)順序包括傾斜矯正、去干擾、定位、單符號(hào)切割和尺寸換算。傾斜矯正是根據(jù)圖象中的明顯水平線或垂直線如表格外框的傾斜角度為基準(zhǔn),把圖象逆向旋轉(zhuǎn)該基準(zhǔn)角度實(shí)現(xiàn)的。先在圖象中長(zhǎng)水平或長(zhǎng)垂直線的可能位置用相臨點(diǎn)延伸的方法找到直線,用直線上兩點(diǎn)坐標(biāo)求出傾斜角度a,取圖象左上角0點(diǎn)為初試旋轉(zhuǎn)原點(diǎn),然后每個(gè)象素k(i,j)在X,Y方向上分別平移O_k(i,j)*Sin(a)*tg(a)和-O_k(i,j)sin(a),其中O_k(i,j)為k(i,j)到O點(diǎn)的直線距離,為
,得到矯正后的圖象。
干擾包括網(wǎng)格、離散點(diǎn)、粘連點(diǎn)和成片污跡。本方法先用檢測(cè)相臨點(diǎn),并在有象素的方向上遞歸,找到長(zhǎng)直線,并記錄與該直線相交的所有線段的交點(diǎn)坐標(biāo)。刪去該直線除交點(diǎn)外的所有點(diǎn),實(shí)現(xiàn)去除網(wǎng)格。在這個(gè)步驟中,記錄了圖象所有點(diǎn)的粘連象素?cái)?shù)和該粘連群與其他粘連群的最小距離,判斷粘連數(shù)不大并且距離過(guò)大的粘連群為孤立群,即離散點(diǎn)。附著在符號(hào)上粘連點(diǎn),超出符號(hào)大小邊界的,在符號(hào)分割時(shí)切除,粘連的小塊象素,在對(duì)子特征的大小,方向判斷時(shí),對(duì)識(shí)別結(jié)果幾乎沒(méi)有影響。孤立的成片污跡,根據(jù)粘連數(shù)過(guò)大的特征實(shí)現(xiàn)剔除。覆蓋在符號(hào)上的大片污跡,將對(duì)符號(hào)塊定位和符號(hào)切割產(chǎn)生影響。對(duì)策是利用污跡邊界非直線而符號(hào)塊的邊界特性尖銳的特征,對(duì)符號(hào)塊的上、下、左和右同時(shí)尋找有效邊界,只要有一個(gè)邊界有效,就可以根據(jù)已知的符號(hào)塊大小切割出整個(gè)符號(hào)塊。如果四個(gè)邊界都被污跡覆蓋,意味著這個(gè)符號(hào)塊已經(jīng)被整塊污損,已經(jīng)失去識(shí)別價(jià)值。
單符號(hào)切割的實(shí)現(xiàn)是根據(jù)已知符號(hào)塊中符號(hào)的行數(shù)和列數(shù)并且符號(hào)塊中符號(hào)大小一致,間隔相等的原理,根據(jù)符號(hào)塊邊界進(jìn)行分割。為了適用于識(shí)別對(duì)象大小不一的場(chǎng)合,需要對(duì)待識(shí)別對(duì)象的尺寸進(jìn)行標(biāo)準(zhǔn)換算。先得到符號(hào)與標(biāo)準(zhǔn)模板的比例,在進(jìn)行子特征長(zhǎng)度和相對(duì)位置匹配時(shí),再進(jìn)行相應(yīng)補(bǔ)償。
最后,對(duì)每個(gè)分割出來(lái)的單符號(hào)進(jìn)行線段單值化。這樣可以減小圖象對(duì)比度和識(shí)別對(duì)象油墨濃淡的影響。先對(duì)單符號(hào)的左上、右上、左下和右下四塊圖象區(qū)域逐點(diǎn)掃描,讓象素在單方向生長(zhǎng),記錄粘連象素的坐標(biāo),再分別于水平方向和豎直方向找出線條邊界,生成單值化點(diǎn)的坐標(biāo)((X1+X2)/2,(Y1+Y2)/2)。然后記錄出直線子特征橫、豎、撇、捺和拐角子特征左上勾、右上勾、左下勾、右下勾的數(shù)量、相對(duì)換算長(zhǎng)度和起點(diǎn)終點(diǎn)的相對(duì)換算坐標(biāo)并與標(biāo)準(zhǔn)符號(hào)的相應(yīng)子特征進(jìn)行比較。在實(shí)現(xiàn)時(shí)遵守先從數(shù)量信息進(jìn)行辨別,當(dāng)數(shù)量特征符合“不能從數(shù)量匹配矩陣”E時(shí),再對(duì)該數(shù)量匹配符號(hào)的E(X)候補(bǔ)序列中的每一個(gè)符號(hào)進(jìn)行長(zhǎng)度和位置細(xì)節(jié)匹配。具體的實(shí)現(xiàn)是把識(shí)別對(duì)象和模板的每一個(gè)相應(yīng)子特征的折合坐標(biāo)兩兩相減,取距離最小的兩個(gè)配成子特征對(duì),再把每對(duì)子特征的折合長(zhǎng)度兩兩相減,乘以權(quán)重,得到子特征的“不相似度”。取所有子特征“不相似度”之和為最小的符號(hào)為識(shí)別結(jié)果。并根據(jù)“不相似度”的大小得到該符號(hào)識(shí)別“確信”“可疑”和“失敗”的信息。
關(guān)于本方法在劃分左上、右上、左下和右下四塊圖象時(shí)的邊界問(wèn)題處理。例如“1”,可能這個(gè)豎被劃分為左上和左下,也可能被劃到左下和右下。所以在建模時(shí)對(duì)于在劃分十字線旁邊的每一個(gè)特征的個(gè)數(shù)是兩邊都定為0.5個(gè)。再記錄這些邊界特征的個(gè)數(shù)n。在匹配時(shí)允許有n/2的個(gè)數(shù)偏差,但匹配成功的附加條件是偏差能在對(duì)應(yīng)側(cè)正負(fù)配平。還以“1”為例,其豎線特征的個(gè)數(shù)在左上、右上、左下和右下四個(gè)區(qū)域分別都是0.5。在匹配是如果“1”偏左,那么待匹配對(duì)象的豎線特征的個(gè)數(shù)在左上、右上分別是1,在左下和右下兩個(gè)區(qū)域都為0。特征個(gè)數(shù)允許偏差為n/2=0.5,待測(cè)對(duì)象的四個(gè)區(qū)域豎線個(gè)數(shù)“1、1、0、0”與樣本的四個(gè)區(qū)域豎線個(gè)數(shù)“0.5、0.5、0.5、0.5”不超過(guò)偏差范圍,并且左右總數(shù)能配平,匹配成功。
權(quán)利要求
1.一種有限符號(hào)集的局部擇優(yōu)匹配法,其特征在于在符號(hào)數(shù)量有限的前提下對(duì)每個(gè)符號(hào)的左上、右上、左下和右下四塊圖象進(jìn)行局部分析,分別找出直線子特征橫、豎、撇、捺和拐角子特征左上勾、右上勾、左下勾、右下勾的數(shù)量、位置和長(zhǎng)度,與標(biāo)準(zhǔn)符號(hào)的相應(yīng)子特征進(jìn)行比較,其中數(shù)量作為主特征,位置和長(zhǎng)度作為輔特征,當(dāng)單從主特征可以把其中一個(gè)符號(hào)辨析出來(lái)時(shí),該符號(hào)只做主特征辨析;兩個(gè)以上的符號(hào)主特征重合時(shí),對(duì)這些符號(hào)加做位置和長(zhǎng)度輔特征辨析;有限集合內(nèi)兩個(gè)符號(hào)相似即其大部分特征相同時(shí),針對(duì)不同的特征加強(qiáng)辨析權(quán)重,采用整體和局部最優(yōu)的方法按權(quán)重取相似度的方法搜索出最近似符號(hào)。
2.如權(quán)利要求1所述的有限符號(hào)集的局部擇優(yōu)匹配法,其特征在于所述的搜索的過(guò)程就是在樣本集空間中找出到最相似目標(biāo)狀態(tài)的路徑集合,從樹(shù)根的一個(gè)初始狀態(tài)開(kāi)始,構(gòu)造一棵為可能解的動(dòng)作序列樹(shù),明顯不匹配的分支被忽略,然后找出與根結(jié)點(diǎn)匹配的所有分支,建立新的狀態(tài)結(jié)點(diǎn),從而生成下一層樹(shù),取上層樹(shù)生成的每一結(jié)點(diǎn),再找出與其匹配的結(jié)點(diǎn)并又生成下一層樹(shù),繼續(xù)此過(guò)程直至匹配目標(biāo)狀態(tài)的構(gòu)型生成為止,最后取加權(quán)重后相似度最高的樣本為最優(yōu)解。
3.如權(quán)利要求1所述的有限符號(hào)集的局部擇優(yōu)匹配法,其特征在于所述的采用整體和局部最優(yōu)的方法使用函數(shù)來(lái)對(duì)單個(gè)符號(hào)塊特征作出估計(jì),以確定其與樣本的近似程度,該函數(shù)把相似描述映射成成功度并用數(shù)值表示,采用生長(zhǎng)點(diǎn)擴(kuò)張法勾勒出圖象的局部輪廓,把線條單值化,由象素粘連角度判斷橫、豎、撇、捺和四種方向拐角的矢量特征;由象素投影面積得到筆畫(huà)的長(zhǎng)度特征;由象素段的起點(diǎn)和終點(diǎn)得到相對(duì)位置特征。
全文摘要
本發(fā)明公開(kāi)了一種有限符號(hào)集的局部擇優(yōu)匹配法,在符號(hào)數(shù)量有限的前提下對(duì)每個(gè)符號(hào)的左上、右上、左下和右下四塊圖象進(jìn)行局部分析,分別找出直線子特征橫、豎、撇、捺和拐角子特征左上勾、右上勾、左下勾、右下勾的數(shù)量、位置和長(zhǎng)度,與標(biāo)準(zhǔn)符號(hào)的相應(yīng)子特征進(jìn)行比較。本發(fā)明的優(yōu)點(diǎn)是針對(duì)性強(qiáng)、匹配信息量大,配合圖形掃描儀或攝象機(jī)用于防偽稅控發(fā)票符號(hào),現(xiàn)金支票符號(hào)、汽車(chē)牌照符號(hào)的識(shí)別等,具有識(shí)別率高,識(shí)別時(shí)間短的特點(diǎn)。
文檔編號(hào)G06K9/18GK1252585SQ9911719
公開(kāi)日2000年5月10日 申請(qǐng)日期1999年11月8日 優(yōu)先權(quán)日1999年11月8日
發(fā)明者皮佑國(guó), 胡道明, 吳效明 申請(qǐng)人:廣東省科學(xué)院自動(dòng)化工程研制中心