一種定位彎曲書面基準(zhǔn)線的方法
【專利說明】
所屬技術(shù)領(lǐng)域
[0001]本發(fā)明屬于數(shù)字圖像處理技術(shù)領(lǐng)域,涉及一種彎曲書面基準(zhǔn)線確定方法。
【背景技術(shù)】
[0002]隨著現(xiàn)代科技的不斷進(jìn)步和發(fā)展,電子產(chǎn)品的大量普及,越來越多的人們選擇在電子平臺進(jìn)行閱讀和學(xué)習(xí)。但是大量的文檔只有紙質(zhì)版,這就需要將大量的紙質(zhì)文檔進(jìn)行電子化。由于數(shù)碼相機(jī)的便攜性、方便性,越來越多的人采用數(shù)碼相機(jī)對文檔進(jìn)行圖像采集。一些文檔由于厚度較大,不能完全的展平,因此采集的圖像,大多會出現(xiàn)類似于柱面中間凸、兩邊凹的現(xiàn)象,后期處理需要根據(jù)彎曲書面圖像的基準(zhǔn)線來計(jì)算書面各部分的曲率和深度信息,然后基于這些信息并利用曲面坐標(biāo)系和平面坐標(biāo)系之間的關(guān)系將彎曲書面展開成平面圖像,這就需要提取書面的基準(zhǔn)線;一些文檔電子化只需要采集文檔的文本部分,去除不包含信息的空白部分和不感興趣的圖像部分,這也需要利用圖像的基準(zhǔn)線信息。基準(zhǔn)線提取的精度、速度,決定著下一步工作進(jìn)行的好壞。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的是提供一種精度高速度快彎曲書面基準(zhǔn)線定位方法,技術(shù)方案如下:
[0004]一種定位彎曲書面基準(zhǔn)線方法,包括下列步驟:
[0005]I)采集彎曲書面的曲面圖像;
[0006]2)對曲面圖像進(jìn)行灰度變換,并進(jìn)行二值化;
[0007]3)根據(jù)圖像的像素大小和經(jīng)驗(yàn)值,刪除二值圖像中面積小于一個(gè)標(biāo)點(diǎn)符號面積的對象,去除噪聲的影響,得到經(jīng)過預(yù)處理后的二值圖像;
[0008]4)設(shè)定一個(gè)矩形,其長度根據(jù)兩個(gè)字體中心之間的水平距離確定,寬度根據(jù)字體高度的1/2確定,利用此矩形對二值圖像進(jìn)行形態(tài)學(xué)的開閉運(yùn)算,將每行文本連成同一連通區(qū)域;
[0009]5)根據(jù)文本行的高度預(yù)設(shè)一個(gè)高度閾值,根據(jù)文本行的長度預(yù)設(shè)一個(gè)長度閾值;
[0010]6)計(jì)算出每個(gè)連通區(qū)域的高度值和寬度值,將高度值大于此高度閾值的連通區(qū)域去除;將長度值短于長度閾值的連通區(qū)域去除,然后刪除面積小于一個(gè)字體面積的對象,最終得到各個(gè)文本行連通區(qū)域。
[0011]7)分別求6)中得到的各個(gè)文本行連通區(qū)域的上邊界和下邊界,然后求出每組上邊界和下邊界對應(yīng)橫坐標(biāo)的中值,經(jīng)過采用三階函數(shù)進(jìn)行曲線擬合,得到彎曲書面的各個(gè)文本行的基準(zhǔn)線。
[0012]本發(fā)明采用矩形結(jié)構(gòu)對圖像進(jìn)行形態(tài)學(xué)的開閉運(yùn)算,求出的文本行連通區(qū)域上下邊界能夠跟文本行的上下邊界緊密貼合,使其連通區(qū)域不受字體內(nèi)部比重的影響,求出的中線具有更高的精度。本方法只采用幾種形態(tài)學(xué)的開閉運(yùn)算和三階曲線擬合運(yùn)算,運(yùn)算簡單,具有更高的速度。
【附圖說明】
[0013]圖1初始圖像。
[0014]圖2形態(tài)學(xué)開閉運(yùn)算后的模糊圖像。
[0015]圖3只含有文本行部分的模糊圖像。
[0016]圖4中線定位結(jié)果的局部放大圖像(文本行中白色線條表示中線)。
[0017]圖5基準(zhǔn)線定位結(jié)果(文本行中黑色線條表示基準(zhǔn)線)。
[0018]圖6基準(zhǔn)線定位結(jié)果的局部放大圖像(文本行中黑色線條表示基準(zhǔn)線)。
[0019]圖7文檔曲面圖像基準(zhǔn)線定位的流程圖。
【具體實(shí)施方式】
[0020]下面結(jié)合附圖和實(shí)施例對本發(fā)明進(jìn)行說明。
[0021]本發(fā)明提供的定位方法,將彎曲書面上每個(gè)字體的邊界框都看作平行四邊形,上邊框和下邊框是平行的,不論書面發(fā)生放大、縮小或者彎曲,上下邊框的中線都可以看作是文本行的中線,因此采用文本行中線來定位基準(zhǔn)線。
[0022]包括下列步驟:
[0023]I)采集彎曲書面的曲面圖像,如圖1所示。
[0024]2)對曲面圖像進(jìn)行灰度變換,并進(jìn)行二值化。然后根據(jù)圖像的像素大小和經(jīng)驗(yàn)值,刪除二值圖像中面積小于一個(gè)標(biāo)點(diǎn)符號面積的對象,去除噪聲的影響,得到經(jīng)過預(yù)處理后的二值圖像。
[0025]3)設(shè)定一個(gè)矩形,其長度根據(jù)兩個(gè)字體中心之間的水平距離確定,寬度根據(jù)字體高度的1/2確定,利用此矩形對圖像進(jìn)行形態(tài)學(xué)的開閉運(yùn)算,將每行文本連成同一連通區(qū)域,如圖2所示。
[0026]4)根據(jù)文本行的高度預(yù)設(shè)一個(gè)高度閾值,大小約為文本行高度的三倍;根據(jù)文本行的長度預(yù)設(shè)一個(gè)長度閾值,大小約為文本行最大長度的3/4 ;
[0027]5)計(jì)算出每個(gè)連通區(qū)域的高度值和寬度值,將高度值大于高度閾值的連通區(qū)域去除,消除書面中高度較高的插圖的影響;將長度值短于長度閾值的連通區(qū)域去除,消除書面中長度較短的文本行的影響;然后刪除面積小于一個(gè)字體面積的對象,最終得到剩下的文本行連通區(qū)域。如圖3所示。
[0028]6)分別求5)中得到的各個(gè)文本行連通區(qū)域的上邊界和下邊界,然后求出每組上邊界和下邊界對應(yīng)橫坐標(biāo)的中值,如圖4所示。對中值采用三階函數(shù)進(jìn)行曲線擬合,得到彎曲書面的各個(gè)文本行的基準(zhǔn)線及其對應(yīng)的方程基準(zhǔn)線方程fn(X) = anx3+bnx2+cnx+dn,X e (0,len),n e (1,N),N為基準(zhǔn)線數(shù)量,Ien曲面圖像的寬度,fn(x)表示基準(zhǔn)線的縱坐標(biāo)值,X表示基準(zhǔn)線的橫坐標(biāo)值,an,bn,cn, dj常數(shù),下標(biāo)η表示不同的基準(zhǔn)線?;鶞?zhǔn)線如圖5和6所示。
[0029]本發(fā)明提出的基于文本行中線定位基準(zhǔn)線的方法,算法不僅定位精度高,而且計(jì)算量小,速度快。通過限制連通區(qū)域的高度值和寬度值來提取文本行區(qū)域,只保留高度小于3倍文本行高度值的連通區(qū)域和寬度值大于書面寬度1/10的連通區(qū)域,實(shí)驗(yàn)結(jié)果如圖3所示,具有較好的提取結(jié)果。
[0030]本發(fā)明中線的定位只需要求出每個(gè)文本行連通區(qū)域的上下邊界,再求出上下邊界的中線即可,計(jì)算量小,同時(shí)利于硬件實(shí)現(xiàn),具有實(shí)際應(yīng)用的價(jià)值。
【主權(quán)項(xiàng)】
1.一種定位彎曲書面基準(zhǔn)線方法,包括下列步驟: 1)采集彎曲書面的曲面圖像; 2)對曲面圖像進(jìn)行灰度變換,并進(jìn)行二值化; 3)根據(jù)圖像的像素大小和經(jīng)驗(yàn)值,刪除二值圖像中面積小于一個(gè)標(biāo)點(diǎn)符號面積的對象,去除噪聲的影響,得到經(jīng)過預(yù)處理后的二值圖像; 4)設(shè)定一個(gè)矩形,其長度根據(jù)兩個(gè)字體中心之間的水平距離確定,寬度根據(jù)字體高度的1/2確定,利用此矩形對二值圖像進(jìn)行形態(tài)學(xué)的開閉運(yùn)算,將每行文本連成同一連通區(qū)域; 5)根據(jù)文本行的高度預(yù)設(shè)一個(gè)高度閾值,根據(jù)文本行的長度預(yù)設(shè)一個(gè)長度閾值; 6)計(jì)算出每個(gè)連通區(qū)域的高度值和寬度值,將高度值大于此高度閾值的連通區(qū)域去除;將長度值短于長度閾值的連通區(qū)域去除,然后刪除面積小于一個(gè)字體面積的對象,最終得到各個(gè)文本行連通區(qū)域。 7)分別求6)中得到的各個(gè)文本行連通區(qū)域的上邊界和下邊界,然后求出每組上邊界和下邊界對應(yīng)橫坐標(biāo)的中值,經(jīng)過采用三階函數(shù)進(jìn)行曲線擬合,得到彎曲書面的各個(gè)文本行的基準(zhǔn)線。
【專利摘要】本發(fā)明涉及一種定位彎曲書面基準(zhǔn)線方法,包括:對曲面圖像進(jìn)行灰度變換,并進(jìn)行二值化;去除噪聲的影響,得到經(jīng)過預(yù)處理后的二值圖像;設(shè)定一個(gè)矩形對二值圖像進(jìn)行形態(tài)學(xué)的開閉運(yùn)算,將每行文本連成同一連通區(qū)域;根據(jù)文本行的高度預(yù)設(shè)一個(gè)高度閾值,根據(jù)文本行的長度預(yù)設(shè)一個(gè)長度閾值;計(jì)算出每個(gè)連通區(qū)域的高度值和寬度值,將高度值大于此高度閾值的連通區(qū)域去除;將長度值短于長度閾值的連通區(qū)域去除,然后刪除面積小于一個(gè)字體面積的對象,最終得到各個(gè)文本行連通區(qū)域;經(jīng)過采用三階函數(shù)進(jìn)行曲線擬合,得到彎曲書面的各個(gè)文本行的基準(zhǔn)線。本發(fā)明具有精度高速度快的優(yōu)點(diǎn)。
【IPC分類】G06T7-00, G06T5-00
【公開號】CN104835119
【申請?zhí)枴緾N201510198135
【發(fā)明人】肖夏, 田健飛
【申請人】天津大學(xué)
【公開日】2015年8月12日
【申請日】2015年4月23日