專利名稱:用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種符號(hào)檢測(cè)方法,尤其是一種用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法,屬于圖像處理的技術(shù)領(lǐng)域。
背景技術(shù):
在各類社會(huì)活動(dòng)中,利用模式識(shí)別技術(shù)對(duì)各種票據(jù)進(jìn)行自動(dòng)分析、驗(yàn)證、檢索和識(shí)另IJ,對(duì)于確保相關(guān)業(yè)務(wù)安全、提高工作效率、增加處理準(zhǔn)確性都具有非常重要的現(xiàn)實(shí)意義。票據(jù)自動(dòng)處理技術(shù)以其較高的學(xué)術(shù)價(jià)值和應(yīng)用價(jià)值近年來受到國內(nèi)外眾多研究機(jī)構(gòu)以及學(xué)者的廣泛重視,該技術(shù)主要包含了兩方面的內(nèi)容,第一,票據(jù)圖像版面的預(yù)處理,它是各類票據(jù)圖像內(nèi)容理解和識(shí)別的前提和基礎(chǔ);第二,對(duì)預(yù)處理后的圖像內(nèi)容進(jìn)行分析和識(shí)別,它是檢驗(yàn)票據(jù)自動(dòng)處理技術(shù)性能好壞的標(biāo)準(zhǔn)。 表格型票據(jù)是一種結(jié)構(gòu)化的特殊文檔,輸入的信息被規(guī)范在預(yù)先印制好的表格框線所指示的區(qū)域內(nèi),這些框線為票據(jù)文檔要素區(qū)域的定位和識(shí)別提供了重要的輔助信息。然而在實(shí)際應(yīng)用中,如何動(dòng)態(tài)檢測(cè)指定區(qū)域內(nèi)容并獲取特殊字符的識(shí)別結(jié)果,是表格型圖像處理工作的難點(diǎn)。實(shí)際票據(jù)圖像的掃描位置、背景、票面受污染程度等情況會(huì)造成許多干擾因素,這對(duì)于票據(jù)系統(tǒng)后期的自動(dòng)識(shí)別處理產(chǎn)生較大的影響,因此準(zhǔn)確可靠的框線檢測(cè)結(jié)果,是票據(jù)處理方法的基礎(chǔ)。票據(jù)圖像的框線檢測(cè)主要用到直線檢測(cè)技術(shù),目前常用的直線檢測(cè)方法主要有基于Hough變換的方法、連通域分析法、矢量化方法以及通過對(duì)筆畫和框線交疊處的局部圖像區(qū)域進(jìn)行分析從而完成框線檢測(cè)等。以上方法具有定義簡(jiǎn)單,物理意義明確,易于檢測(cè)、存儲(chǔ)和處理等優(yōu)點(diǎn),在一定條件下可以快速、準(zhǔn)確地提取直線。然而在上述傳統(tǒng)方法的處理中,部分重要的局部邊緣等細(xì)節(jié)特征難以被有效表達(dá),以致復(fù)雜噪聲背景下的框線檢測(cè)工作時(shí)常失效。
發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有技術(shù)中存在的不足,提供一種用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法,其操作方便,檢測(cè)精度高,具有較好的通用性及魯棒性。按照本發(fā)明提供的技術(shù)方案,一種用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法,包括如下步驟a、獲取票據(jù)文檔的圖像;b、將所述票據(jù)文檔圖像進(jìn)行多尺度脊波變換、閉運(yùn)算及鏈碼跟蹤,以獲得票據(jù)文檔的最大封閉輪廓,并對(duì)所述最大封閉輪廓進(jìn)行標(biāo)記、存儲(chǔ);C、對(duì)上述最大封閉輪廓進(jìn)行基于最優(yōu)軸投影測(cè)度,以確定票據(jù)文檔最大封閉輪廓的傾角;d、根據(jù)上述傾角將票據(jù)文檔的圖像旋轉(zhuǎn)到水平正方位置,并將得到的票據(jù)文檔圖像與所需的票據(jù)模板比對(duì),以分割提取出票據(jù)文檔圖像中打勾定位格區(qū)域;e、對(duì)提取的打勾定位格區(qū)域利用掩膜法進(jìn)行檢測(cè),以確定票據(jù)文檔的定位格是否包含標(biāo)記符號(hào)。所述步驟a中,利用攝像頭拍攝票據(jù)文檔,并以JPG方式存儲(chǔ)票據(jù)文檔圖像。所述步驟b中,包括如下步驟bl、對(duì)票據(jù)文檔圖像進(jìn)行灰度化,并對(duì)灰度化的票據(jù)文檔圖像進(jìn)行反色處理;b2、對(duì)反色后的票據(jù)文檔圖像利用最大類間方差法進(jìn)行二值分割,以形成所需的二值化圖像;b3、對(duì)二值化后的票據(jù)文檔圖像利用有限脊波變換進(jìn)行離散脊波變換,得到稀疏脊波系數(shù),去除系數(shù)幅值較小的區(qū)域,再進(jìn)行離散脊波反變換;
b4、對(duì)上述離散脊波反變換后的圖像進(jìn)行閉運(yùn)算處理;b5、對(duì)上述進(jìn)行閉運(yùn)算處理后的圖像進(jìn)行鏈碼跟蹤,得到票據(jù)文檔圖像的最大封閉輪廓,并對(duì)所述最大封閉輪廓進(jìn)行標(biāo)記、存儲(chǔ)。所述步驟c中,包括如下步驟Cl、最大封閉輪廓線的寬度是Width,輪廓線存儲(chǔ)數(shù)組為BuffX、BuffY,投影后像素計(jì)數(shù)數(shù)組為Projline,投影角度范圍為(-Angle,Angle),并建立正弦和余弦弧度表為SIN_T [i+Angle] = sin (iXO. I XPI/180), C0S_T [i+Angle] = cos (iXO. 1XPI/180),其中,PI為圓周率,i表示投影角,i G (-Angle, Angle);c2、在投影角度(-Angle,Angle)的范圍內(nèi),根據(jù)投影公式C0S_T[i+Angle] XBuffX[i]+SIN_T[i+Angle] XBuffY[i]計(jì)算投影值并記為 Proj_idx,同時(shí)對(duì)計(jì)數(shù)數(shù)組Projline [Pro j_idx]進(jìn)行累加;c3、取投影軸中點(diǎn)Proj_mid,在投影軸中點(diǎn)Projjnid的左側(cè)按自左向右順序,計(jì)算投影軸左側(cè)第一個(gè)不為零的投影值Pro j_Nul lZero_L和左側(cè)最大投影值Pro j_NullZero_LMax ;同理,在投影軸中點(diǎn)Proj_mid的右側(cè)按自右向左順序,計(jì)算右側(cè)第一個(gè)不為零的投影值Proj_NullZero_R及右側(cè)最大投影值Pro j_NullZero_RMax ;c4、當(dāng) Pro j_Nul lZero_L 等于 int (C0S_T [i+Angle] X BuffX [i]+SIN_T[i+Angle] XBuffY[i])時(shí),上述左側(cè)邊界點(diǎn)Proj_NullZero_LMax為最大峰值;同理,當(dāng)Proj_NullZero_R 等于 int(C0S_T[i+Angle]XBuffX[i]+SIN_T[i+Angle]XBuffY[i]))時(shí),上述右側(cè)邊界點(diǎn)Proj_NullZero_RMax為最大峰值;其中int為取整運(yùn)算;根據(jù)左側(cè)邊界點(diǎn)最大峰值Proj_NullZero_LMax、右側(cè)邊界點(diǎn)最大峰值Proj_NullZero_RMax計(jì)算得到跨度值Dl ;c5、將本次投影角度i下最佳邊界點(diǎn)之間的跨度值Dl與前述存儲(chǔ)的跨度值進(jìn)行比較,當(dāng)本次投影角度i下最佳邊界點(diǎn)之間的跨度值Dl最小時(shí),保存所述跨度值,并在投影角度范圍內(nèi)再次進(jìn)行投影,直至投影結(jié)束;c6、投影循環(huán)結(jié)束后,根據(jù)比較結(jié)果得到所需的最佳邊界點(diǎn)之間的跨度值D、角度坐標(biāo)CornerPointX, CornerPointY以及最佳投影角度BestAngle,所述最佳投影角度BestAngle為票據(jù)文檔最大封閉輪廓的傾角。所述步驟d中,包括如下步驟dl、根據(jù)上述傾角將票據(jù)文檔的圖像旋轉(zhuǎn)到水平正方位置,并根據(jù)票據(jù)文檔的最大封閉輪廓及所述最大封閉輪廓對(duì)應(yīng)的角點(diǎn)坐標(biāo)確定所需的票據(jù)模板;d2、根據(jù)票據(jù)模板獲取票據(jù)文檔的框線分布比例,以從票據(jù)文檔中分割出所需的方格區(qū)域;d3、對(duì)上述分割出的方格區(qū)域進(jìn)行垂直方向的Sobel變換,再向垂直方向投影,以去除方格區(qū)域中未包含文字的區(qū)域;d4、提取出票據(jù)文檔圖像中打勾定位格區(qū)域。 所述步驟e包括如下步驟el、對(duì)提取的打勾定位格區(qū)域進(jìn)行閉運(yùn)算;e2、對(duì)上述閉運(yùn)算后的打勾定位格區(qū)域進(jìn)行最大類間方差法閾值分割,生成二值化圖像;e3、對(duì)上述得到的二值化圖像進(jìn)行鏈碼跟蹤,獲得打勾定位格區(qū)域的最大面積輪 廓,并對(duì)所述最大面積輪廓進(jìn)行標(biāo)記、存儲(chǔ);e4、對(duì)上述打勾定位格區(qū)域的最大面積輪廓進(jìn)行空間卷積,并根據(jù)所述卷積值判斷打勾定位格區(qū)域是否存在手寫體標(biāo)記符號(hào)。
"0 0 0 0 0"
'0 110] 0 0 2 0 0所述卷積模板為 p I Ol ^ 0 2 2 0或A=O 2 4 2 O。
A= 020、— 0220 0 0 2 0 0
0I OJ 1_0 I I O」
= sin (i X0. I XPI/180), C0S_T[i+Angle] = cos (i X0. I XPI/180),其中,PI為圓周率,i表示投影角,i G (-Angle,Angle);此處,投影角度范圍為(-Angle,Angle),投影角度范圍可以票據(jù)文檔圖像進(jìn)行確定,一般為(-20°,20° );c2、在投影角度(-Angle,Angle)的范圍內(nèi),根據(jù)投影公式C0S_、T [i+Angle] XBuffX[i]+SIN_T [i+Angle] XBuffY[i]計(jì)算投影值并記為 Proj_idx,同時(shí)對(duì)計(jì)數(shù)數(shù)組Pr0jline[Pix)j_idX]進(jìn)行累加;投影時(shí),投影角度i在投影角度范圍內(nèi)遍歷,投影角度i的遍歷步長(zhǎng)可以根據(jù)需要進(jìn)行設(shè)置,步長(zhǎng)較小時(shí)會(huì)增大計(jì)算量;此處,遍歷是指投影角度i根據(jù)步長(zhǎng)變化時(shí)取遍投影角度范圍(-Angle,Angle)內(nèi)的所有值;c3、取投影軸中點(diǎn)Proj_mid,在投影軸中點(diǎn)Projjnid的左側(cè)按自左向右順序,計(jì)算投影軸左側(cè)第一個(gè)不為零的投影值Pro j_Nul lZero_L和左側(cè)最大投影值Pro j_NullZero_LMax ;同理,在投影軸中點(diǎn)Proj_mid的右側(cè)按自右向左順序,計(jì)算右側(cè)第一個(gè)不為零的投影值Proj_NullZero_R及右側(cè)最大投影值Pro j_NullZero_RMax ;c4、當(dāng) Pro j_Nul lZero_L 等于 int (C0S_T [i+Angle] X BuffX [i]+SIN_T[i+Angle] XBuffY[i])時(shí),上述左側(cè)邊界點(diǎn)Proj_NullZero_LMax為最大峰值;同理,當(dāng)Proj_NullZero_R 等于 int(C0S_T[i+Angle]XBuffX[i]+SIN_T[i+Angle]XBuffY[i]))時(shí),上述右側(cè)邊界點(diǎn)Proj_NullZero_RMax為最大峰值;其中int為取整運(yùn)算;根據(jù)左側(cè)邊界點(diǎn)最大峰值Proj_NullZero_LMax、右側(cè)邊界點(diǎn)最大峰值Proj_NullZero_RMax計(jì)算得到跨度值Dl ; 一般地,跨度值Dl為左側(cè)邊界點(diǎn)最大峰值Proj_NullZero_LMax、右側(cè)邊界點(diǎn)最大峰值Proj_NullZero_RMax之間差值的絕對(duì)值;c5、將本次投影角度i下最佳邊界點(diǎn)之間的跨度值Dl與前述存儲(chǔ)的跨度值進(jìn)行比較,當(dāng)本次投影角度i下最佳邊界點(diǎn)之間的跨度值Dl最小時(shí),保存所述跨度值,并在投影角度范圍內(nèi)再次進(jìn)行投影,直至投影結(jié)束;如圖3和圖4所示為票據(jù)文檔的頂端存在干擾區(qū)域,由于干擾區(qū)域的存在,在計(jì)算寬度時(shí),可能會(huì)存在跨度值Dl與跨度值D2,而跨度值D2明顯存在干擾,因此選擇較小的跨度值Dl能夠較精確得到票據(jù)文檔的寬度值;c6、投影循環(huán)結(jié)束后,根據(jù)比較結(jié)果得到所需的最佳邊界點(diǎn)之間的跨度值D、角度坐標(biāo)CornerPointX, CornerPointY以及最佳投影角度BestAngle,所述最佳投影角度BestAngle為票據(jù)文檔最大封閉輪廓的傾角。d、根據(jù)上述傾角將票據(jù)文檔的圖像旋轉(zhuǎn)到水平正方位置,并將得到的票據(jù)文檔圖像與所需的票據(jù)模板比對(duì),以分割提取出票據(jù)文檔圖像中打勾定位格區(qū)域;圖I中的先驗(yàn)信息包括票據(jù)模板等信息;所述步驟d包括如下步驟dl、根據(jù)上述傾角將票據(jù)文檔的圖像旋轉(zhuǎn)到水平正方位置,并根據(jù)票據(jù)文檔的最大封閉輪廓及所述最大封閉輪廓對(duì)應(yīng)的角點(diǎn)坐標(biāo)確定所需的票據(jù)模板;在實(shí)際運(yùn)用中,可以預(yù)先存儲(chǔ)大量的票據(jù)模板,當(dāng)將待檢測(cè)票據(jù)文檔的最大封閉輪廓、角點(diǎn)坐標(biāo)確定后,就能夠從預(yù)先存儲(chǔ)的票據(jù)模板中找到所需的票據(jù)模板,通過票據(jù)模板能夠提取后續(xù)所需的區(qū)域;d2、根據(jù)票據(jù)模板獲取票據(jù)文檔的框線分布比例,以從票據(jù)文檔中分割出所需的方格區(qū)域;附圖
中的銀行票據(jù)圖像中包含“幣種”的五行方格區(qū)域,在具體應(yīng)用中,根據(jù)票據(jù)模板能獲取相應(yīng)的方格區(qū)域,這些方格區(qū)域包括后續(xù)需要識(shí)別是否包括標(biāo)記符號(hào)的區(qū)域;d3、對(duì)上述分割出的方格區(qū)域進(jìn)行垂直方向的Sobel變換,再向垂直方向投影,以去除方格區(qū)域中未包含文字的區(qū)域;
通過對(duì)Sobel變換以削弱水平框線,再向垂直方向投影,通過投影分析后,判斷所述方格區(qū)域是否包含文字,當(dāng)方格區(qū)域中未包含文字時(shí),此方格區(qū)域勢(shì)必不會(huì)存在標(biāo)記符號(hào),因此將此方格區(qū)域刪除,降低整個(gè)檢測(cè)的計(jì)算量;d4、提取出票據(jù)文檔圖像中打勾定位格區(qū)域。通過上述操作后,提取出的打勾定位格區(qū)域包括打勾子識(shí)別區(qū)域?yàn)槲创蚬醋幼R(shí)別區(qū)域,一般地,在票據(jù)文檔中,在同時(shí)成雙存在兩個(gè)表格區(qū)域,通過在兩個(gè)表格區(qū)域進(jìn)行打標(biāo)記選取相應(yīng)的選項(xiàng),因此,本發(fā)明實(shí)施例提出出的打勾子識(shí)別區(qū)域、未打勾子識(shí)別區(qū)域符號(hào)實(shí)際情況。如圖5所示,圖6中顯示了打勾子識(shí)別區(qū)域,圖7中顯示了未打勾子識(shí)別區(qū)域。e、對(duì)提取的打勾定位格區(qū)域利用掩膜法進(jìn)行檢測(cè),以確定票據(jù)文檔的定位格是否包含標(biāo)記符號(hào)。所述步驟e包括如下步驟el、對(duì)提取的打勾定位格區(qū)域進(jìn)行閉運(yùn)算;當(dāng)進(jìn)行閉運(yùn)算處理后,能消除圖像邊框邊緣斷邊及分支點(diǎn)噪聲干擾;e2、對(duì)上述閉運(yùn)算后的打勾定位格區(qū)域進(jìn)行最大類間方差法閾值分割,生成二值化圖像;對(duì)打勾定位格區(qū)域利用最大類間方差法進(jìn)行閾值分割為圖像處理領(lǐng)域常規(guī)的操作步驟,此處不再詳述。e3、對(duì)上述得到的二值化圖像進(jìn)行鏈碼跟蹤,獲得打勾定位格區(qū)域的最大面積輪廓,并對(duì)所述最大面積輪廓進(jìn)行標(biāo)記、存儲(chǔ);e4、對(duì)上述打勾定位格區(qū)域的最大面積輪廓進(jìn)行空間卷積,并根據(jù)所述卷積值判斷打勾定位格區(qū)域是否存在手寫體標(biāo)記符號(hào)。所述卷積模板與最大面積輪廓進(jìn)行空間卷積時(shí),能增強(qiáng)圖像邊緣以內(nèi)的信號(hào)同時(shí)減弱邊緣信號(hào),當(dāng)卷積后,打勾子識(shí)別區(qū)域的卷積值較大,未打勾子識(shí)別區(qū)域的卷積值較??;當(dāng)打勾定位格區(qū)域分割出兩個(gè)子區(qū)域后,能夠根據(jù)卷積值來判斷相應(yīng)區(qū)域是否存在標(biāo)記符號(hào)。而當(dāng)兩個(gè)子識(shí)別區(qū)域卷積值相同時(shí),一般可以認(rèn)為均不存在打勾區(qū)域,實(shí)際情況中,一般不會(huì)在同一行方格區(qū)域內(nèi)同時(shí)存在兩個(gè)打勾區(qū)域。由于不同人進(jìn)行手寫標(biāo)記時(shí)情況各有不同,本發(fā)明實(shí)施例中通過利用卷積值進(jìn)行判斷具有通用性,符合實(shí)際情況。所述卷
權(quán)利要求
1.一種用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法,其特征是,所述手寫體標(biāo)記符號(hào)檢測(cè)方法包括如下步驟 (a)、獲取票據(jù)文檔的圖像; (b)、將所述票據(jù)文檔圖像進(jìn)行多尺度脊波變換、閉運(yùn)算及鏈碼跟蹤,以獲得票據(jù)文檔的最大封閉輪廓,并對(duì)所述最大封閉輪廓進(jìn)行標(biāo)記、存儲(chǔ); (C)、對(duì)上述最大封閉輪廓進(jìn)行基于最優(yōu)軸投影測(cè)度,以確定票據(jù)文檔最大封閉輪廓的傾角; (d)、根據(jù)上述傾角將票據(jù)文檔的圖像旋轉(zhuǎn)到水平正方位置,并將得到的票據(jù)文檔圖像與所需的票據(jù)模板比對(duì),以分割提取出票據(jù)文檔圖像中打勾定位格區(qū)域; (e)、對(duì)提取的打勾定位格區(qū)域利用掩膜法進(jìn)行檢測(cè),以確定票據(jù)文檔的定位格是否包含標(biāo)記符號(hào)。
2.根據(jù)權(quán)利要求I所述的用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法,其特征是所述步驟(a)中,利用攝像頭拍攝票據(jù)文檔,并以JPG方式存儲(chǔ)票據(jù)文檔圖像。
3.根據(jù)權(quán)利要求I所述的用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法,其特征是,所述步驟(b)中,包括如下步驟 (bl)、對(duì)票據(jù)文檔圖像進(jìn)行灰度化,并對(duì)灰度化的票據(jù)文檔圖像進(jìn)行反色處理; (b2)、對(duì)反色后的票據(jù)文檔圖像利用最大類間方差法進(jìn)行二值分割,以形成所需的二值化圖像; (b3)、對(duì)二值化后的票據(jù)文檔圖像利用有限脊波變換進(jìn)行離散脊波變換,得到稀疏脊波系數(shù),去除系數(shù)幅值較小的區(qū)域,再進(jìn)行離散脊波反變換; (b4 )、對(duì)上述離散脊波反變換后的圖像進(jìn)行閉運(yùn)算處理; (b5)、對(duì)上述進(jìn)行閉運(yùn)算處理后的圖像進(jìn)行鏈碼跟蹤,得到票據(jù)文檔圖像的最大封閉輪廓,并對(duì)所述最大封閉輪廓進(jìn)行標(biāo)記、存儲(chǔ)。
4.根據(jù)權(quán)利要求I所述的用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法,其特征是,所述步驟(c)中,包括如下步驟 (Cl)、最大封閉輪廓線的寬度是Width,輪廓線存儲(chǔ)數(shù)組為BuffX、BuffY,投影后像素計(jì)數(shù)數(shù)組為Projline,投影角度范圍為(-Angle,Angle),并建立正弦和余弦弧度表為SIN_T[i+Angle] = sin (iXO. I XPI/180), C0S_T[i+Angle] = cos (iXO. 1XPI/180),其中,PI為圓周率,i表示投影角,i G (-Angle, Angle); (c2)、在投影角度(-Angle,Angle)的范圍內(nèi),根據(jù)投影公式C0S_T [i+Angle] XBuffX[i]+SIN_T [i+Angle] XBuffY[i]計(jì)算投影值并記為 Proj_idx,同時(shí)對(duì)計(jì)數(shù)數(shù)組Projline [Pro j_idx]進(jìn)行累加; (c3)、取投影軸中點(diǎn)Proj_mid,在投影軸中點(diǎn)Proj_mid的左側(cè)按自左向右順序,計(jì)算投影軸左側(cè)第一個(gè)不為零的投影值Proj_NullZero_L和左側(cè)最大投影值Pro j_NullZero_LMax ;同理,在投影軸中點(diǎn)Projjnid的右側(cè)按自右向左順序,計(jì)算右側(cè)第一個(gè)不為零的投影值 Proj_NullZero_R 及右側(cè)最大投影值 Pro j_NullZero_RMax ; (c4)、當(dāng) Proj_NullZero_L 等于 int(COS_T[i+Angle]XBuffX[i]+SIN_T[i+Angle] XBuffY[i])時(shí),上述左側(cè)邊界點(diǎn)Proj_NullZero_LMax為最大峰值;同理,當(dāng)Proj_NullZero_R 等于 int(COS_T[i+Angle]XBuffX[i]+SIN_T[i+Angle]XBuffY[i]))時(shí),上述右側(cè)邊界點(diǎn)Proj_NullZero_RMax為最大峰值;其中int為取整運(yùn)算;根據(jù)左側(cè)邊界點(diǎn)最大峰值Proj_NullZero_LMax、右側(cè)邊界點(diǎn)最大峰值Proj_NullZero_RMax計(jì)算得到跨度值Dl ; (c5)、將本次投影角度i下最佳邊界點(diǎn)之間的跨度值Dl與前述存儲(chǔ)的跨度值進(jìn)行比較,當(dāng)本次投影角度i下最佳邊界點(diǎn)之間的跨度值Dl最小時(shí),保存所述跨度值,并在投影角度范圍內(nèi)再次進(jìn)行投影,直至投影結(jié)束; (c6)、投影循環(huán)結(jié)束后,根據(jù)比較結(jié)果得到所需的最佳邊界點(diǎn)之間的跨度值D、角度坐標(biāo)CornerPointX, CornerPointY以及最佳投影角度BestAngle,所述最佳投影角度BestAngle為票據(jù)文檔最大封閉輪廓的傾角。
5.根據(jù)權(quán)利要求I所述的用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法,其特征是,所述步驟(d)中,包括如下步驟 (dl)、根據(jù)上述傾角將票據(jù)文檔的圖像旋轉(zhuǎn)到水平正方位置,并根據(jù)票據(jù)文檔的最大封閉輪廓及所述最大封閉輪廓對(duì)應(yīng)的角點(diǎn)坐標(biāo)確定所需的票據(jù)模板; (d2)、根據(jù)票據(jù)模板獲取票據(jù)文檔的框線分布比例,以從票據(jù)文檔中分割出所需的方格區(qū)域; (d3)、對(duì)上述分割出的方格區(qū)域進(jìn)行垂直方向的Sobel變換,再向垂直方向投影,以去除方格區(qū)域中未包含文字的區(qū)域; (d4)、提取出票據(jù)文檔圖像中打勾定位格區(qū)域。
6.根據(jù)權(quán)利要求I所述的用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法,其特征是,所述步驟(e)包括如下步驟 (el)、對(duì)提取的打勾定位格區(qū)域進(jìn)行閉運(yùn)算; (e2)、對(duì)上述閉運(yùn)算后的打勾定位格區(qū)域進(jìn)行最大類間方差法閾值分割,生成二值化圖像; (e3)、對(duì)上述得到的二值化圖像進(jìn)行鏈碼跟蹤,獲得打勾定位格區(qū)域的最大面積輪廓,并對(duì)所述最大面積輪廓進(jìn)行標(biāo)記、存儲(chǔ); (e4)、對(duì)上述打勾定位格區(qū)域的最大面積輪廓進(jìn)行空間卷積,并根據(jù)所述卷積值判斷打勾定位格區(qū)域是否存在手寫體標(biāo)記符號(hào)。
7.根據(jù)權(quán)利要求6所述的用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法,其特征 是,所述卷積模板為 p I Ol _ 0 2 2 0或A=O 2 4 2 O。
全文摘要
本發(fā)明涉及一種用于票據(jù)文檔定位格的手寫體標(biāo)記符號(hào)檢測(cè)方法,其包括如下步驟a、獲取票據(jù)文檔的圖像;b、將所述票據(jù)文檔圖像進(jìn)行多尺度脊波變換、閉運(yùn)算及鏈碼跟蹤,以獲得票據(jù)文檔的最大封閉輪廓,并對(duì)所述最大封閉輪廓進(jìn)行標(biāo)記、存儲(chǔ);c、對(duì)上述最大封閉輪廓進(jìn)行基于最優(yōu)軸投影測(cè)度,以確定票據(jù)文檔最大封閉輪廓的傾角;d、根據(jù)上述傾角將票據(jù)文檔的圖像旋轉(zhuǎn)到水平正方位置,并將得到的票據(jù)文檔圖像與所需的票據(jù)模板比對(duì),以分割提取出票據(jù)文檔圖像中打勾定位格區(qū)域;e、對(duì)提取的打勾定位格區(qū)域利用掩膜法進(jìn)行檢測(cè),以確定票據(jù)文檔的定位格是否包含標(biāo)記符號(hào)。本發(fā)明操作方便,檢測(cè)精度高,具有較好的通用性及魯棒性。
文檔編號(hào)G06K9/20GK102750531SQ201210182820
公開日2012年10月24日 申請(qǐng)日期2012年6月5日 優(yōu)先權(quán)日2012年6月5日
發(fā)明者劉梓, 宋曉寧, 沈志明 申請(qǐng)人:江蘇尚博信息科技有限公司