用于冠字號(hào)識(shí)別的字符污染去除方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于數(shù)字圖像處理領(lǐng)域,尤其涉及一種用于冠字號(hào)識(shí)別的字符污染去除方 法。
【背景技術(shù)】
[0002] 紙幣作為流通幣,在人們的日常生活中起著舉足輕重的作用。在流通過(guò)程中,可能 會(huì)出現(xiàn)不同程度的污染,如紙幣自身的紅色油墨污染,鉛筆的涂寫(xiě),紙幣使用時(shí)間久了開(kāi)始 破舊,紙幣圖像采集過(guò)程中光照不均以及無(wú)法避免的噪聲等各種原因給冠字號(hào)識(shí)別帶來(lái)一 定的困難。
[0003] 紙幣冠字號(hào)識(shí)別要求識(shí)別結(jié)果準(zhǔn)確,為了能有效地對(duì)紙幣冠字號(hào)進(jìn)行識(shí)別,在冠 字號(hào)分割的過(guò)程中,需要利用計(jì)算機(jī)視覺(jué)技術(shù)和圖像處理技術(shù)對(duì)污染的紙幣冠字號(hào)區(qū)域進(jìn) 行處理,有效去除污染,得到可以識(shí)別的冠字號(hào)。
[0004]目前國(guó)內(nèi)外紙幣冠字號(hào)識(shí)別的方法很多,主要是針對(duì)七成新以上的紙幣,沒(méi)有對(duì) 冠字號(hào)污染的紙幣作處理的操作。有的對(duì)冠字號(hào)污染的紙幣處理,但只通過(guò)二值操作以及 中值濾波去噪等簡(jiǎn)單的方法,不能有效的去除污染。目前針對(duì)污染過(guò)的冠字號(hào)紙幣還沒(méi)有 一種行之有效的方法,導(dǎo)致舊的污染紙幣冠字號(hào)識(shí)別率不高,影響程序的可靠性。
【發(fā)明內(nèi)容】
[0005] 針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提供一種用于冠字號(hào)識(shí)別的字符污染去除方法,能 夠有效的去除冠字號(hào)的污染,提高冠字號(hào)的識(shí)別率。
[0006] 本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案如下,用于冠字號(hào)識(shí)別的字符污染去除 方法,包括以下步驟:
[0007] a)在冠字號(hào)所在區(qū)域的圖像I上確定11條分界線,使得相鄰的兩條分界線間有且 僅有單個(gè)冠字號(hào)的圖像;
[0008] b)初步確定相鄰分界線之間的區(qū)域中單個(gè)冠字號(hào)圖像的外接矩形框;
[0009] c)對(duì)單個(gè)冠字號(hào)的高度和寬度分別進(jìn)行異常處理,從而最終確定10個(gè)冠字號(hào)的 外接矩形框。
[0010] 進(jìn)一步的,所述在冠字號(hào)所在區(qū)域的圖像I上確定11條分界線,使得相鄰的兩條 分界線間有且僅有單個(gè)冠字號(hào)的圖像具體包括模板構(gòu)建過(guò)程與實(shí)際計(jì)算過(guò)程,其中模板構(gòu) 建過(guò)程包括如下步驟:
[0011] al)取一張紙幣,使用自適應(yīng)閾值方法,計(jì)算無(wú)污染圖像I的二值圖,其中白色為 前景,黑色為背景;
[0012] a2)計(jì)算二值圖的垂直投影,此垂直投影為一向量,記為pv= [Pl,p2,…pw],其中W 為圖像I的寬度;
[0013] a3)人工判斷圖像I中第一個(gè)冠字號(hào)的最左端離圖像左端的像素距離,記為s,另 外,當(dāng)圖像的分辨率確定后,冠字號(hào)的總像素寬度是確定的,記為1,則抽取向量pv中第S個(gè) 到第 s+1-l 個(gè)元素,記為 pv' = [ps,ps+1,*"ps+11];
[0014] a4)重復(fù)步驟al) _a3),獲得\個(gè)p v',并將np個(gè)p v'求平均,則獲得一個(gè)模板m ;
[0015] a5)在9個(gè)間隔處將數(shù)值最低的位置進(jìn)行標(biāo)記,再加上頭尾兩處,一共可找到11條 分界線,將其橫坐標(biāo)記為:b = [b。,h,…b1Q],其中bQ= 0, b 1Q= 1 ;
[0016] a6)每次取不同的紙幣,重復(fù)步驟al)-a5)nni次,獲得個(gè)不同的模板,記作 (岬,2,…,)和與之對(duì)應(yīng)的不同的分界線,記作汍62;
[0017] 實(shí)際計(jì)算過(guò)程包括如下步驟:
[0018] a7)取一張紙幣,使用自適應(yīng)閾值方法,計(jì)算無(wú)污染圖像I的二值圖,其中白色為 前景,黑色為背景;
[0019] a8)計(jì)算二值圖的垂直投影,此垂直投影為一向量,記為pv= [Pl,p2,…pw],其中W 為圖像I的寬度;
[0020] a9)分別計(jì)算pv與模板的相關(guān)系數(shù),并記錄其結(jié)果為 (^2,"、<^>其中,(;1,1 = 1,一,11|11為一個(gè)長(zhǎng)度為評(píng)-1+1的向量;
[0021] alO)分別尋找(C2,…,q)中的最大值,記為并找到這些最大 值中的最大值,記其對(duì)應(yīng)的下標(biāo)號(hào)為i,則應(yīng)選取的模板為1?,分界線為b1;
[0022] all)查找Cf"在^中的位置,并將其位置記為j,則可知第一條分界線離圖像左端 的距離為j,因此,圖像中真正的分界線為匕+j,從而確定了這11條分界線的位置。
[0023] 進(jìn)一步的,所述步驟b)初步確定相鄰分界線之間的區(qū)域中單個(gè)冠字號(hào)圖像的外 接矩形框,具體包括:
[0024] bl)將11條分界線所隔的10個(gè)區(qū)域編號(hào)為…名:,每個(gè)區(qū)域中都有且僅 有一個(gè)冠字號(hào)圖像的外接矩形框,設(shè)之為?5·.·^,對(duì)于任意<,/= 1,…,10,都有四個(gè)表 征其在圖像中位置的屬性,即(1,r,u,b),分別表示該矩形的左、右、上、下邊到圖像I左、 右、上、下端的距離,初始時(shí)將其設(shè)為-1 ;
[0025] b2)對(duì)于任意民,將其左邊所在的區(qū)域記為礞,其右邊所在的區(qū)域記為<,若 = <,則跳轉(zhuǎn)至b4),否則跳轉(zhuǎn)至b3);
[0026] b3)將&在分界線b i,…A i處分裂,分裂為r-1+l個(gè)區(qū)域/?;,···,_/?廣+1,對(duì)于分裂 而成的任意矩形框,分別執(zhí)行步驟b4)的操作;
[0027] b4)若 < 對(duì)應(yīng)的 < 的(1,r,u,b)都為-1,則將i?f的(1,r,u,b)設(shè)為民的 (1丄1!,13),若<的(l,r,u,b)不為-1,則新的先的(l,r,u,b)值被分別設(shè)為原來(lái)的政和 民中的(l,r,u,b)的較小值;
[0028] b5)最后,查看中的每一個(gè)外接矩形的四個(gè)屬性,看其是否都非-1,若 都非-1,則10個(gè)冠字號(hào)的外界矩形框/廣/匕…/C成功建立,否則說(shuō)明圖像I并非冠字號(hào)圖 像,不予處理。
[0029] 進(jìn)一步的,步驟c)所述對(duì)單個(gè)字符寬度的異常處理采用第一寬度異常處理方法 或第二寬度異常處理方法,對(duì)單個(gè)字符的高度的異常處理采用第一高度異常處理方法或第 二高度異常處理方法。
[0030] 進(jìn)一步的,所述第一高度異常處理方法具體包括如下步驟:
[0031] dl)確定切割范圍:若第1至第4個(gè)字符中的某個(gè)字符超過(guò)其右側(cè)字符的高度,則 說(shuō)明該字符存在污染,第1個(gè)字符可根據(jù)右側(cè)字符來(lái)限定切割范圍,第2至4個(gè)字符可根 據(jù)其左側(cè)與右側(cè)字符的高度來(lái)限定切割范圍,同樣的,若第7至第10個(gè)字符中的某個(gè)字符 超過(guò)其左側(cè)字符的高度,則說(shuō)明該字符存在污染,第10個(gè)字符可根據(jù)左側(cè)字符來(lái)限定切割 范圍,第7至9個(gè)字符可根據(jù)其左側(cè)與右側(cè)字符的高度來(lái)限定切割范圍,對(duì)于中間的兩個(gè)字 符,取第四個(gè)與第七個(gè)字符之和加上5后再除以2取整后的值作為上限,上限減去2作為下 限;
[0032] d2)在切割范圍的行數(shù)內(nèi),計(jì)算各行的代價(jià)函數(shù):
[0033] Breakcost = (out_value-in_value)X (cur_row-least_row+2)/out_num
[0034] 其中,out_value為當(dāng)前行的暗色點(diǎn)(局部閾值)平均灰度,in_value為當(dāng)前行內(nèi) 側(cè)相鄰行的暗色點(diǎn)(局部閾值)平均灰度,cur_row為當(dāng)前去除的行數(shù),least_row為估計(jì) 得到的至少需要去除的行數(shù),〇ut_num為當(dāng)前行暗色點(diǎn)(局部閾值)的個(gè)數(shù);
[0035] d3)比較所有得到的代價(jià)值,從最大的代價(jià)值所對(duì)應(yīng)的行數(shù)開(kāi)始切割字符。
[0036] 進(jìn)一步的,所述第二高度異常處理方法具體包括如下步驟:
[0037] el)當(dāng)紙幣的橫向分辨率和縱向分辨率都確定后,對(duì)于十個(gè)單獨(dú)的字符圖像,設(shè)定 其期望高度h。,…h(huán)9;
[0038] e2)對(duì)于任意第i個(gè)字符圖像,設(shè)投票數(shù)vote_y = 0 ;
[0039] e3)計(jì)算異常字符的垂直中心與10個(gè)字符的平均垂直中心,若異常字符的垂直中 心較平均中心小,則 vote_y: = vote_y+l,否則 vote_y: = vote_y_l ;
[0040] e4)計(jì)算異常字符的垂直中心矩,若字符的垂直中心小于中心矩,則vote_y:= vote_y_l,否則 vote_y: = vote_y+l ;
[0041] e5)計(jì)算最上面一行和最下面一行的黑點(diǎn)的平均灰度,若最下面一行的黑點(diǎn)平均 灰度小于最上面的,則 v〇te_y: = vote_y_l,否則 vote_y: = vote_y+l ;
當(dāng)前第1頁(yè)
1 
2 
3 
4