自適應(yīng)字符切分及提取方法
【專利摘要】自適應(yīng)字符切分及提取方法,首先,將讀入的圖像進(jìn)行傾斜矯正;然后,從中定位出表格左上角的坐標(biāo)(x0,y0),并以此設(shè)置矩形框裁剪出圖像;最后,進(jìn)行單個(gè)字符的切分及提取。本發(fā)明結(jié)合多種二值化圖像的效果,采用基于垂直方向投影和輪廓特征組合下的兩種策略多次自適應(yīng)切分及提取,提高了從圖像中定位出來(lái)的字符串的切分率,并保證了提取出的待識(shí)別數(shù)字正確率在98%~100%。
【專利說(shuō)明】自適應(yīng)字符切分及提取方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于計(jì)算機(jī)數(shù)字圖像處理【技術(shù)領(lǐng)域】,涉及一種綜合使用多知識(shí)決策的自適應(yīng)字符切分及提取方法。
【背景技術(shù)】
[0002]圖像二值化是圖像處理中最常見(jiàn)的處理方法,是進(jìn)行圖像分析、特征提取和模式識(shí)別之前必要的圖像預(yù)處理過(guò)程。盡管到目前為止,二值化閾值的選取方法數(shù)以百計(jì),但仍沒(méi)有一個(gè)通用的方法對(duì)各種各樣的圖像都能達(dá)到最理像的效果。
[0003]OTSU算法,也稱大津法,是全局自適應(yīng)二值化算法的經(jīng)典算法之一,由大津于1979年提出,它是建立在一幅圖像的灰度直方圖基礎(chǔ)上,依據(jù)類間距離極大準(zhǔn)則來(lái)確定區(qū)域分割閾值。適用于目標(biāo)與背景的比例適當(dāng)和信噪比高的情況,分割效果較好。
[0004]簡(jiǎn)單統(tǒng)計(jì)法是Kittlter等人提出的一種基于簡(jiǎn)單圖像像素灰度梯度值與圖像灰度統(tǒng)計(jì)相結(jié)合的閾值選取方法。閾值可以一次計(jì)算得到,從而避免了多次迭代分析圖像灰度直方圖的麻煩,同時(shí)也導(dǎo)致了目標(biāo)與背景的過(guò)度區(qū)域做不到非常精確的分割,但針對(duì)字符而言可以較好的分割出筆畫所在的主要區(qū)域,輪廓的體現(xiàn)較為分明。
[0005]隨著單個(gè)字符識(shí)別技術(shù)趨于成熟,復(fù)雜背景下字符串的切分已經(jīng)成為制約數(shù)字識(shí)別精度的關(guān)鍵。單個(gè)字符中內(nèi)部的間斷、字符間的粘連以及圖像背景噪聲不同程度的污染等,都是造成字符串不能精確切分的主要因素。目前,現(xiàn)已提出的切分方法:基于圖的連通性切分,基于SCP(Significant Contour Point)的數(shù)字切分,垂直方向像素投影,基于 BFA(Background and Foreground Analysis)的數(shù)字切分,上下輪廓(Upper/LowerContour)特征,滴水算法(Drop-Falling),LDP (Limited Dynamic Programming)算法等,其大多是應(yīng)用在曲線切分上,一般情況下都需要人工干預(yù)選取切分線的起始點(diǎn),相比之下,機(jī)打印刷類的字體是垂直的,起始點(diǎn)的確定就意味著切分線的建立,因此,這類字體下的切分難點(diǎn)就在于如何自動(dòng)選取起始點(diǎn)?,F(xiàn)有單一的字符切分算法切分字符的正確率較低,阻礙了字符識(shí)別率的提高。
【發(fā)明內(nèi)容】
[0006]本發(fā)明的目的在于提供一種自適應(yīng)字符切分及提取方法,解決現(xiàn)有技術(shù)存在的識(shí)別數(shù)字正確率低的問(wèn)題。
[0007]本發(fā)明的技術(shù)方案是,自適應(yīng)字符切分及提取方法,首先,將讀入的圖像進(jìn)行傾斜矯正;然后,從中定位出表格左上角的坐標(biāo)(Y0),并以此設(shè)置矩形框裁剪出圖像;最后,進(jìn)行單個(gè)字符的切分及提取。
[0008]本發(fā)明的特點(diǎn)還在于:
[0009]單個(gè)字符的切分及提取方法包括兩種,第一種為:首先,用簡(jiǎn)單統(tǒng)計(jì)法將灰度位圖二值化,并對(duì)二值位圖進(jìn)行邊緣噪聲清理和消除孤立點(diǎn),然后,追蹤上下輪廓特征,分析空白間隔切除不需要的部分,對(duì)保留下來(lái)的部分搜索極值點(diǎn),進(jìn)而取特征點(diǎn)處切分。[0010]具體步驟如下:
[0011]步驟1:讀入原始圖像,裁剪并歸一化左上角位圖;
[0012]步驟2:用最大類間方差算法二值化該灰度圖,進(jìn)行霍夫變換,定位出表格左上角坐標(biāo)(X。,y。)及傾斜角度angle ;
[0013]步驟3:若angle不為0°,旋轉(zhuǎn)angle角度;
[0014]步驟4:以(XtlJtl)為矩形左下角,裁剪出目標(biāo)所在區(qū)域位圖記為image。;
[0015]步驟5:用簡(jiǎn)單統(tǒng)計(jì)法二值化Imagetl記為I1,再消除孤立噪聲點(diǎn),并進(jìn)行邊緣清理;
[0016]步驟6:在I1中用掃描像素的方法定位字符的上下輪廓特征,得到其間隔的離散值 span (I, I1-X),有
[0017]span (I, i) = U (I, i) -D (I, i)
[0018]其中,Ii_x為I1的寬,i初始化為O,上限為I1-X-1,移動(dòng)步長(zhǎng)為1,U(l, Ι^χ)、D(I1I^x)分別記錄上下輪廓的縱坐標(biāo)點(diǎn);自左向右分析span(l,i)空白間隔處縮小目標(biāo)所在區(qū)域范圍,基于灰度位圖1magetl再次切割記為Iimage1 ;
[0019]步驟7:搜索span(l,i)極值點(diǎn),依據(jù)字符粘連處平均高度d從中選取切分點(diǎn),基于Image1裁剪出字符碎片,用最大類間方差算法二值化;
[0020]步驟8:對(duì)字符碎片做輪 廓臨界點(diǎn)裁剪,二次切分自適應(yīng)提取有效字符片位圖。
[0021]單個(gè)字符的切分及提取的第二種方法是:用最大類間方差算法二值化后直接進(jìn)行垂直方向投影,在無(wú)像素累積點(diǎn)處切分,生成日期碎片。
[0022]具體步驟如下:
[0023]步驟1:讀入原始圖像,裁剪并歸一化左上角位圖;
[0024]步驟2:用最大類間方差算法二值化該灰度圖,進(jìn)行霍夫變換,定位出表格左上角坐標(biāo)(X。,y。)及傾斜角度angle ;
[0025]步驟3:若angle不為0°,旋轉(zhuǎn)angle角度;
[0026]步驟4:以(XtlJtl)為矩形左下角,裁剪出目標(biāo)所在區(qū)域位圖記為image。;
[0027]步驟5:最大類間方差法二值化image(l,再消除孤立噪聲點(diǎn),并進(jìn)行邊緣清理;
[0028]步驟6:垂直投影空白處切分字符串,生成字符碎片;
[0029]步驟7:對(duì)字符碎片做輪廓臨界點(diǎn)裁剪,二次切分自適應(yīng)提取有效字符片位圖。
[0030]本發(fā)明具有如下有益效果:本發(fā)明結(jié)合多種二值化圖像的效果,采用基于垂直方向投影和輪廓特征組合下的兩種策略多次自適應(yīng)切分及提取,提高了從圖像中定位出來(lái)的字符串的切分率,并保證了提取出的待識(shí)別數(shù)字正確率在98%~100%。
【專利附圖】
【附圖說(shuō)明】
[0031]圖1是本發(fā)明自適應(yīng)字符切分及提取方法流程圖;
[0032]圖2是本發(fā)明自適應(yīng)字符切分及提取方法定位日期的操作流程圖;
[0033]圖3是本發(fā)明自適應(yīng)字符切分及提取方法實(shí)施例1字符切分流程圖;
[0034]圖4是本發(fā)明自適應(yīng)字符切分及提取方法實(shí)施例2字符切分流程圖;
[0035]圖5是本發(fā)明自適應(yīng)字符切分及提取方法字符提取流程圖;
[0036]圖6為本發(fā)明自適應(yīng)字符切分及提取方法實(shí)施例3的發(fā)票源圖;[0037]圖7為本發(fā)明自適應(yīng)字符切分及提取方法實(shí)施例3的左上角位圖;
[0038]圖8為本發(fā)明自適應(yīng)字符切分及提取方法實(shí)施例3定位的開(kāi)票日期頭位圖;
[0039]圖9為本發(fā)明自適應(yīng)字符切分及提取方法實(shí)施例3定位日期位圖;
[0040]圖10為本發(fā)明自適應(yīng)字符切分及提取方法實(shí)施例3字符碎片位圖;
[0041]圖11為本發(fā)明自適應(yīng)字符切分及提取方法實(shí)施例3字符碎片放大位圖;
[0042]圖12為本發(fā)明自適應(yīng)字符切分及提取方法實(shí)施例3提取數(shù)字片位圖。
【具體實(shí)施方式】
[0043]下面結(jié)合【具體實(shí)施方式】和附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。
[0044]實(shí)施例1,自適應(yīng)字符切分與提取方法,流程參見(jiàn)圖1,具體實(shí)施步驟包括:
[0045]步驟1,讀入原始圖像,裁剪出左上角位圖,從而大大減少后續(xù)操作數(shù)據(jù)量,并按固定比例大小進(jìn)行縮放,類似全局歸一化的效果,記錄此時(shí)高度tv寬度W。。
[0046]步驟2,用最大類間方差算法二值化該灰度圖,進(jìn)行霍夫變換檢測(cè)表格線和傾斜角度,定位出表格左上角及角度的矯正。具體操作如下:以位圖左下角為坐標(biāo)原點(diǎn),將二值圖像素值為O的直角坐標(biāo)系下的坐標(biāo)點(diǎn)(x,y)轉(zhuǎn)換為極角坐標(biāo)下的(r,Θ)并累加個(gè)數(shù)存儲(chǔ)于hough矩陣,方程式為:
[0047]r = X X cos Θ +y X sin Θ
[0048]其中,re (O, (h02+w02)1/2), Θ e (0°, 180°), (r, Θ ) e hough。
[0049]從r = h0-a處開(kāi)始降序搜索hough矩陣中同Cr, Θ )數(shù)量值,搜索到的第個(gè)大于預(yù)設(shè)的門限值b時(shí)設(shè):
[0050]up—dis = r
[0051]angle = θ
[0052]其中,up—dis為表格最上直線距原點(diǎn)的距離,angle為表格傾斜角度,a、b為常量。
[0053]同理,從r = a處升序搜索hough矩陣中同(r, Θ )數(shù)量值,搜索到的第個(gè)大于預(yù)設(shè)的門限值c時(shí)設(shè):
[0054]left_dis = r
[0055]其中,left_dis為表格最左邊直線距原點(diǎn)的距離,c為常量。
[0056]若θ Φ 0,判斷應(yīng)旋轉(zhuǎn)角度angle及表格左上角坐標(biāo)(X(l,%),設(shè)置如下:
[0057]
【權(quán)利要求】
1.自適應(yīng)字符切分及提取方法,其特征在于,首先,將讀入的圖像進(jìn)行傾斜矯正;然后,從中定位出表格左上角的坐標(biāo)(Xtl,K),并以此設(shè)置矩形框裁剪出圖像;最后,進(jìn)行單個(gè)字符的切分及提取。
2.如權(quán)利要求1所述的自適應(yīng)字符切分及提取方法,其特征在于,單個(gè)字符的切分及提取方法為:首先,用簡(jiǎn)單統(tǒng)計(jì)法將灰度位圖二值化,并對(duì)二值位圖進(jìn)行邊緣噪聲清理和消除孤立點(diǎn),然后,追蹤上下輪廓特征,分析空白間隔切除不需要的部分,對(duì)保留下來(lái)的部分搜索極值點(diǎn),進(jìn)而取特征點(diǎn)處切分。
3.如權(quán)利要求2所述的自適應(yīng)字符切分及提取方法,其特征在于,具體步驟如下: 步驟1:讀入原始圖像,裁剪并歸一化左上角位圖; 步驟2:用最大類間方差算法二值化該灰度圖,進(jìn)行霍夫變換,定位出表格左上角坐標(biāo)(x0, y。)及傾斜角度angle ; 步驟3:若angle不為O0,旋轉(zhuǎn)angle角度; 步驟4:以(X(l,y0)為矩形左下角,裁剪出目標(biāo)所在區(qū)域位圖記為image。; 步驟5:用簡(jiǎn)單統(tǒng)計(jì)法二值化Imagetl記為I1,再消除孤立噪聲點(diǎn),并進(jìn)行邊緣清理;步驟6:在I1中用掃描像素的方法定位字符的上下輪廓特征,得到其間隔的離散值span (I, I^x),有
span (I, i) = U (I, i) -D (I, i) 其中,為I1的寬,i初始化為O,上限為Ij-l,移動(dòng)步長(zhǎng)為x)分別記錄上下輪廓的縱坐標(biāo)點(diǎn);自左向右分析span(l,i)空白間隔處縮小目標(biāo)所在區(qū)域范圍,基于灰度位圖1maget l再次切割記為Iimage1 ; 步驟7:搜索span(l,i)極值點(diǎn),依據(jù)字符粘連處平均高度d從中選取切分點(diǎn),基于Image1裁剪出字符碎片,用最大類間方差算法二值化; 步驟8:對(duì)字符碎片做輪廓臨界點(diǎn)裁剪,二次切分自適應(yīng)提取有效字符片位圖。
4.如權(quán)利要求1所述的自適應(yīng)字符切分及提取方法,其特征在于,單個(gè)字符的切分及提取方法為,用最大類間方差算法二值化后直接進(jìn)行垂直方向投影,在無(wú)像素累積點(diǎn)處切分,生成日期碎片。
5.如權(quán)利要求4所述的自適應(yīng)字符切分及提取方法,其特征在于,具體步驟如下: 步驟1:讀入原始圖像,裁剪并歸一化左上角位圖; 步驟2:用最大類間方差算法二值化該灰度圖,進(jìn)行霍夫變換,定位出表格左上角坐標(biāo)(x0, y。)及傾斜角度angle ; 步驟3:若angle不為O0,旋轉(zhuǎn)angle角度; 步驟4:以(X(l,y0)為矩形左下角,裁剪出目標(biāo)所在區(qū)域位圖記為image。; 步驟5:最大類間方差法二值化Imagetl,再消除孤立噪聲點(diǎn),并進(jìn)行邊緣清理; 步驟6:垂直投影空白處切分字符串,生成字符碎片; 步驟7:對(duì)字符碎片做輪廓臨界點(diǎn)裁剪,二次切分自適應(yīng)提取有效字符片位圖。
【文檔編號(hào)】G06K9/34GK103488986SQ201310431987
【公開(kāi)日】2014年1月1日 申請(qǐng)日期:2013年9月18日 優(yōu)先權(quán)日:2013年9月18日
【發(fā)明者】金海燕, 王琰琰, 黑新宏, 王彬, 王磊, 高勇, 王曉帆 申請(qǐng)人:西安理工大學(xué)