專利名稱:基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法
技術(shù)領(lǐng)域:
本發(fā)明涉及的是一種文字圖象分割方法,特別是一種基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法。屬于圖象處理領(lǐng)域。
背景技術(shù):
經(jīng)文獻(xiàn)檢索發(fā)現(xiàn),Hua Yang等人在《International Journal of PatternRecognition and Artificial Intelligence》(2000,14(7),963-978.)(《模式識(shí)別和人工智能的國(guó)際期刊》)上發(fā)表的“Extraction of Bibliography Information Basedon Image of Book Cover”(“從圖書(shū)封面的圖象中提取書(shū)目信息”),該文中所提出的方法,先將圖象的RGB(紅、綠、藍(lán))彩色空間轉(zhuǎn)換到HSI(色度、飽和度、強(qiáng)度)的彩色空間,然后進(jìn)行彩色分割和連通域分析,從圖書(shū)封面圖象中分割出文字。
該文涉及的技術(shù)主要存在以下缺陷和不足(1)算法只限于從精裝書(shū)本封面的文字圖象分割;(2)算法執(zhí)行時(shí)間很長(zhǎng),完整執(zhí)行一次算法共大約需要320秒;(3)同一幅圖象中文字尺寸大小不同,文字筆劃寬度差別也不同,run-length的直方圖統(tǒng)計(jì)難以準(zhǔn)確檢測(cè)出文字的筆劃寬度;(4)算法雖然用幾個(gè)實(shí)驗(yàn)驗(yàn)證,但是有待于進(jìn)一步采用書(shū)庫(kù)的圖書(shū)進(jìn)行驗(yàn)證;(5)上述文件中未提及圖象的分辨率,或圖象的大小。在解決以上的問(wèn)題時(shí),主要存在以下困難(1)文字尺寸大小變化范圍很大,最大文字是60×48像素點(diǎn),最小文字10×8像素點(diǎn)。(2)文字顏色的種類繁多,某些文字顏色與背景顏色相近,顏色分割難以有效地進(jìn)行。(3)不同結(jié)構(gòu)特點(diǎn)的文字共存于一幅圖象中,而不同結(jié)構(gòu)的文字筆劃數(shù)目差別很大,如漢字和英文。(4)算法應(yīng)具有較快的速度。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足,提供一種基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,使其能夠從自然場(chǎng)景圖象中,準(zhǔn)確、快速、可靠地分割出目標(biāo)文字圖象。
本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的,本發(fā)明方法如下先將攝像頭拍攝的灰度圖象用Canny算子檢測(cè)邊緣,檢測(cè)相鄰邊緣點(diǎn)的水平方向距離。統(tǒng)計(jì)可能為文字的邊緣點(diǎn)距離,設(shè)定閾值,檢測(cè)出可能的文字圖象行,經(jīng)合并后形成文字圖象行區(qū)域。在各個(gè)文字圖象行區(qū)域內(nèi),統(tǒng)計(jì)各行的邊緣點(diǎn)數(shù)量,求得各區(qū)域相應(yīng)的最小值后進(jìn)行行邊界調(diào)整,檢測(cè)到精確的文字圖象區(qū)域,并計(jì)算各個(gè)行區(qū)域的文字圖象高度。在各個(gè)文字圖象行區(qū)域內(nèi),統(tǒng)計(jì)每一列圖象像素的邊緣點(diǎn)數(shù)量,設(shè)定可能文字圖象列的閾值,據(jù)此檢測(cè)出可能的文字圖象列,可能的文字圖象列合并形成文字圖象列區(qū)域,并進(jìn)行列邊界調(diào)整得到精確的文字圖象列區(qū)域。經(jīng)行和列的位置檢測(cè)后,得到文字圖象的區(qū)域范圍,最終準(zhǔn)確分割出文字圖象。
雖然圖象中的文字顏色,尺寸大小,結(jié)構(gòu)等差別很大,但是屬于同一類的文字具有如下特點(diǎn)(1)文字的尺寸大小一致,相鄰邊緣點(diǎn)的距離近似相等。因此,對(duì)不同文字圖象區(qū)域,分塊進(jìn)行相鄰邊緣點(diǎn)的距離統(tǒng)計(jì)。(2)文字的結(jié)構(gòu)相同。因此,在同一文字圖象區(qū)域內(nèi),每一行的近似相等的相鄰邊緣點(diǎn)距離統(tǒng)計(jì)數(shù)量相接近。(3)文字圖象的紋理特征相同。因此,在同一文字圖象區(qū)域內(nèi),在水平和垂直方向的必然存在相鄰邊緣點(diǎn)距離相等或接近相等的邊緣像素點(diǎn)。(4)根據(jù)上述特點(diǎn),利用相鄰邊緣點(diǎn)距離統(tǒng)計(jì),進(jìn)行文字圖象區(qū)域的檢測(cè)。
以下對(duì)本發(fā)明方法作進(jìn)一步的說(shuō)明,方法步驟如下(1)邊緣檢測(cè)對(duì)數(shù)碼相機(jī)拍攝的灰度圖象采用Canny算子檢測(cè)邊緣。對(duì)于同一幅圖象,梯度閾值可以在一個(gè)比較大的范圍內(nèi),能正確分割出文字圖象。但必須滿足以下兩個(gè)條件首先,必須能檢測(cè)出目標(biāo)文字圖象的邊緣,這限定了梯度閾值的上限;其次,目標(biāo)文字的背景區(qū)域內(nèi)不許檢測(cè)出“假邊緣”或者盡可能少,這粗略地限定了梯度閾值的下限值。通過(guò)實(shí)驗(yàn)分析,設(shè)定一個(gè)較為合理的閾值。在圖書(shū)封面文字圖象分割中,Canny算子邊緣檢測(cè)的梯度閾值范圍優(yōu)選為大于等于0.2,小于等于0.4。
(2)水平方向相鄰邊緣點(diǎn)距離檢測(cè)設(shè)一幅矩陣大小M1×N1數(shù)字圖象為f,f(i,j)為圖像中象元。分割出的文字邊緣圖象表示為集合E,定義函數(shù)s(i,j), 為獲取邊緣點(diǎn)的圖象像素點(diǎn)坐標(biāo)位置,定義函數(shù)P(s),
(i,j)=P(s(i,j)),其中s(i,j)=1 (2)或者分為X列的行位置PY(s),Y行的列位置PX(s)j=PX=i(s(i,j)),其中s(i,j)=1 (3)i=PY=j(luò)(s(i,j)),其中s(i,j)=1 (4)水平方向相鄰邊緣點(diǎn)的距離定義為D(i,j)D(i,j)=PX=i(s(i,j))-PX=i(s(i,k)) (5)且,s,如果k<PX=i(s)<j成立,則s(i,PX=i(s))=0。利用(5)式檢測(cè)水平方向相鄰邊緣點(diǎn)的距離。
(3)相鄰邊緣點(diǎn)距離統(tǒng)計(jì)設(shè)文字圖象區(qū)域的相鄰邊緣點(diǎn)距離范圍為[W1,W2],圖書(shū)封面文字圖象分割中,文字圖象區(qū)域相鄰邊緣點(diǎn)距離的范圍為[3,15]。同一文字圖象區(qū)域內(nèi),文字水平方向相鄰邊緣點(diǎn)距離接近相等,則每行統(tǒng)計(jì)滿足下列條件的相鄰邊緣點(diǎn)距離的數(shù)量。
(i)W1≤D(i,j)≤W2,i∈[1,M1-m0],j∈[1,N1-n0](ii)存在m,n,滿足1≤m≤m0,1≤n≤n0,使得下式成立D(i+m,j+n)∈[D(i,j)-Δ,D(i,j)+Δ]其中,m,n決定鄰域的大小,Δ相鄰邊緣點(diǎn)距離的波動(dòng)。通過(guò)實(shí)驗(yàn)分析,確定上述參數(shù)的大小。
(4)文字圖象行區(qū)域檢測(cè)根據(jù)每一行字符的最少個(gè)數(shù),可以確定相鄰邊緣點(diǎn)距離統(tǒng)計(jì)數(shù)量的閾值T,檢測(cè)文字圖象可能行。相鄰的可能文字圖象行進(jìn)行合并,形成可能的文字圖象區(qū)域。根據(jù)所要檢測(cè)文字的最小高度,設(shè)定閾值H,檢測(cè)得到文字圖象的行區(qū)域。由于距離統(tǒng)計(jì)中,鄰域約束條件的限制,H值可以取比文字實(shí)際高度略小更為合適。根據(jù)分割要求,通過(guò)實(shí)驗(yàn)分析,確定相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的數(shù)量閾值T和文字圖象的高度閾值H。
(5)行區(qū)域邊界調(diào)整在分割出各個(gè)文字圖象行區(qū)域內(nèi),分別統(tǒng)計(jì)每一行的邊緣點(diǎn)數(shù)量。
NY=Σj=1N1s(Y,j)--(6)]]>
在文字圖象區(qū)域內(nèi),邊緣點(diǎn)數(shù)量相對(duì)比較多。在每一個(gè)文字圖象行區(qū)域內(nèi),找出最小的邊緣點(diǎn)數(shù)量統(tǒng)計(jì)值N0b=min(NYb),Y1b≤Y≤Y2b--(7)]]>其中,b表示第b個(gè)文字圖象行區(qū)域,Y1b和Y2b是b文字圖象行區(qū)域的起始行和末尾行。在文字圖象行區(qū)域的上下兩個(gè)邊界附近,統(tǒng)計(jì)各行的邊緣點(diǎn)數(shù)量NY,如果NY≥N0b--(8)]]>則將該行并入b文字圖象區(qū)域內(nèi)。
(6)各行區(qū)域文字圖象高度檢測(cè)經(jīng)行區(qū)域邊界調(diào)整后,檢測(cè)到完整的完整文字圖象行區(qū)域,在各行區(qū)域內(nèi),分別檢測(cè)各文字圖象區(qū)域的高度CHb=Yendb-Ystartb--(9)]]>其中,Yendb和Ystartb分別表示b文字圖象行區(qū)域經(jīng)邊界調(diào)整后的區(qū)域末尾行和起始行。
(7)行區(qū)域內(nèi)列方向邊緣點(diǎn)數(shù)量統(tǒng)計(jì)在分割出的文字行區(qū)域圖象中,統(tǒng)計(jì)每一列的邊緣點(diǎn)數(shù)量,NXb=Σi=YstartbYendbs(i,X)--(10)]]>(8)文字圖象列區(qū)域檢測(cè)設(shè)定文字圖象區(qū)域內(nèi)列邊緣點(diǎn)的數(shù)量閾值TN,其中可能文字圖象列檢測(cè)的邊緣點(diǎn)數(shù)量梯度閾值TN范圍為[3,5]。利用(11)式在文字圖象行區(qū)域內(nèi)檢測(cè)可能的文字圖象列,NXb≥TN--(11)]]>可能的文字圖象列進(jìn)行合并,形成可能的文字列區(qū)域。由于文字圖象大小不同,其字符的間隔也不相同,但是一般印刷體的排版方式中其字符的間隔必然小于字符的高度,則以各文字圖象行區(qū)域中檢測(cè)的字符高度CHb為可能文字圖象列合并的間隔閾值。設(shè)b圖像行區(qū)域內(nèi),兩可能文圖象列的間隔為GX,若GX≤CHb,則合并。合并后,還存在幾個(gè)可能的文字列區(qū)域,從中選出可能文字列最多的區(qū)域?yàn)槲淖至袇^(qū)域。
(9)文字圖象區(qū)域邊界調(diào)整首先,文字圖象的部分筆劃比較簡(jiǎn)單,如“T”水平方向的橫,僅有兩個(gè)邊緣點(diǎn),列方向的邊緣點(diǎn)數(shù)量統(tǒng)計(jì)分割,可能會(huì)使其落在文字圖象區(qū)域的外部,而使字符分割不完整。因此,在文字圖象區(qū)域附近,列邊緣點(diǎn)個(gè)數(shù)大于等于2的則并入文字圖象區(qū)域。
其次,可能文字圖象列的間隔閾值為該區(qū)域的文字圖象高度,這會(huì)使部分靠近文字區(qū)域的非文字圖象目標(biāo)被包含在文字圖象區(qū)域內(nèi)。因此,在列方向的開(kāi)始和末尾進(jìn)行再次分割調(diào)整。在起始和結(jié)尾處,CHb列的范圍內(nèi)可能的文字圖象列數(shù)L必須滿足Lb≥CHb2--(12)]]>(10)文字圖象區(qū)域分割經(jīng)過(guò)邊界調(diào)整后,可以精確地分割出文字圖象。
本發(fā)明避免了顏色分割計(jì)算量大,分割精度低的問(wèn)題,并有效地抑制了復(fù)雜背景的干擾,顯著提高了文字圖象的分割精度和算法執(zhí)行速度。該文字圖象分割方法具有如下優(yōu)點(diǎn)(1)避免彩色圖象的顏色分割和二值化,利用灰度圖象即可實(shí)現(xiàn)。(2)能同時(shí)準(zhǔn)確分割出尺寸大小變化較大的文字,最大的文字尺寸是最小的5倍左右。(3)能準(zhǔn)確分割不同結(jié)構(gòu)的文字圖象,如英文和中文。(4)能從復(fù)雜背景的圖象中分割出文字圖象,本算法能從自然場(chǎng)景和人造場(chǎng)景的背景中分割出文字圖象。(5)算法簡(jiǎn)單,避免了顏色分割、二值化和中英文檢測(cè)等處理步驟,因此運(yùn)行速度快,執(zhí)行時(shí)間少。
圖1本發(fā)明結(jié)構(gòu)示意圖具體實(shí)施方式
如圖1所示,結(jié)合本發(fā)明方法的內(nèi)容提供以下實(shí)施例,具體如下(1)在圖書(shū)封面文字圖象分割中,CCD攝像頭拍攝的灰度圖象,設(shè)置Canny算子的梯度閾值為0.2,檢測(cè)灰度圖象的邊緣。
(2)測(cè)量相鄰邊緣點(diǎn)的水平方向距離。
(3)設(shè)定文字圖象區(qū)域的相鄰邊緣點(diǎn)距離范圍為[3,15],鄰域?yàn)?×3大小的區(qū)域,相鄰邊緣點(diǎn)的距離波動(dòng)范圍為2,統(tǒng)計(jì)可能為文字的邊緣點(diǎn)距離。
(4)設(shè)定可能文字圖象行的相鄰邊緣點(diǎn)距離數(shù)量的閾值T=9,檢測(cè)出可能的文字圖象行,經(jīng)合并后形成文字圖象行區(qū)域。設(shè)定文字圖象行區(qū)域的高度閾值H=6,慮去偽文字圖象行區(qū)域。
(5)在各個(gè)文字圖象行區(qū)域內(nèi),統(tǒng)計(jì)各行的邊緣點(diǎn)數(shù)量,求得各區(qū)域相應(yīng)的最小值后進(jìn)行行邊界調(diào)整,檢測(cè)到精確的文字圖象區(qū)域。
(6)計(jì)算各個(gè)行區(qū)域的文字圖象高度。
(7)在各個(gè)文字圖象行區(qū)域內(nèi),統(tǒng)計(jì)每一列圖象像素的邊緣點(diǎn)數(shù)量。
(8)設(shè)定可能文字圖象列邊緣點(diǎn)數(shù)量的閾值TN=3,據(jù)此檢測(cè)出可能的文字圖象列。以檢測(cè)到的各文字圖象行區(qū)域的高度作為文字列合并的間隔閾值,將可能的文字圖象列合并形成文字圖象列區(qū)域。
(9)根據(jù)文字圖象列區(qū)域附近的文字圖象列邊緣點(diǎn)數(shù)量是否大于2,進(jìn)行列邊界的擴(kuò)展調(diào)整。根據(jù)各文字圖象列區(qū)域的起始和末尾處,可能文字圖象列的數(shù)量大于該文字行區(qū)域高度的一半,進(jìn)行邊界壓縮調(diào)整,這樣就得到了邊界調(diào)整得到精確的文字圖象列區(qū)域。
(10)經(jīng)行和列的位置檢測(cè)后,得到文字圖象的區(qū)域范圍,最終準(zhǔn)確分割出文字圖象。在Pentium IV 1.6GHz CPU,256M RAM的PC機(jī)上的運(yùn)行時(shí)間為3.171秒。
本發(fā)明避免了顏色分割計(jì)算量大,分割精度低的問(wèn)題,并有效地抑制了復(fù)雜背景的干擾,顯著提高了文字圖象的分割精度和算法執(zhí)行速度。
權(quán)利要求
1.一種基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,其特征在于,方法如下先將攝像頭拍攝的灰度圖象用Canny算子檢測(cè)邊緣,檢測(cè)相鄰邊緣點(diǎn)的水平方向距離,統(tǒng)計(jì)可能為文字的邊緣點(diǎn)距離,然后設(shè)定閾值,檢測(cè)出可能的文字圖象行,經(jīng)合并后形成文字圖象行區(qū)域,在各個(gè)文字圖象行區(qū)域內(nèi),統(tǒng)計(jì)各行的邊緣點(diǎn)數(shù)量,求得各區(qū)域相應(yīng)的最小值后進(jìn)行行邊界調(diào)整,檢測(cè)到精確的文字圖象區(qū)域,并計(jì)算各個(gè)行區(qū)域的文字圖象高度,再在各個(gè)文字圖象行區(qū)域內(nèi),統(tǒng)計(jì)每一列圖象像素的邊緣點(diǎn)數(shù)量,設(shè)定可能文字圖象列的閾值,據(jù)此檢測(cè)出可能的文字圖象列,可能的文字圖象列合并形成文字圖象列區(qū)域,并進(jìn)行列邊界調(diào)整得到精確的文字圖象列區(qū)域,經(jīng)行和列的位置檢測(cè)后,得到文字圖象的區(qū)域范圍,最終準(zhǔn)確分割出文字圖象。
2.根據(jù)權(quán)利要求1所述的基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,其特征是,以下對(duì)本發(fā)明的進(jìn)一步的限定,包含以下步驟(1)邊緣檢測(cè),(2)水平方向相鄰邊緣點(diǎn)距離檢測(cè),(3)相鄰邊緣點(diǎn)距離統(tǒng)計(jì),(4)文字圖象行區(qū)域檢測(cè),(5)行區(qū)域邊界調(diào)整,(6)各行區(qū)域文字圖象高度檢測(cè),(7)行區(qū)域內(nèi)列方向邊緣點(diǎn)數(shù)量統(tǒng)計(jì),(8)文字圖象列區(qū)域檢測(cè),(9)文字圖象區(qū)域邊界調(diào)整,(10)文字圖象區(qū)域分割。
3.根據(jù)權(quán)利要求2所述的基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,其特征是,所述的邊緣檢測(cè),具體為對(duì)數(shù)碼相機(jī)拍攝的灰度圖象采用Canny算子檢測(cè)邊緣,對(duì)于同一幅圖象,梯度閾值必須滿足以下兩個(gè)條件首先,必須能檢測(cè)出目標(biāo)文字圖象的邊緣,其次,目標(biāo)文字的背景區(qū)域內(nèi)檢測(cè)出的非文字圖象“假邊緣”最少,在圖書(shū)封面文字圖象分割中,Canny算子邊緣檢測(cè)的梯度閾值范圍優(yōu)選為大于等于0.2,小于等于0.4。
4.根據(jù)權(quán)利要求2所述的基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,其特征是,所述的水平方向相鄰邊緣點(diǎn)距離檢測(cè),具體為設(shè)一幅矩陣大小M1×N1數(shù)字圖象為f,f(i,j)為圖像中象元,分割出的文字邊緣圖象表示為集合E,定義函數(shù)s(i,j), 為獲取邊緣點(diǎn)的圖象像素點(diǎn)坐標(biāo)位置,定義函數(shù)P(s),(i,j)=P(s(i,j)),其中s(i,j)=1 (2)或者分為X列的行位置PY(s),Y行的列位置PX(s)j=PX=i(s(i,j)),其中s(i,j)=1(3)i=PY=j(luò)(s(i,j)),其中s(i,j)=1(4)水平方向相鄰邊緣點(diǎn)的距離定義為D(i,j)D(i,j)=PX=i(s(i,j))-PX=i(s(i,k)) (5)且,S,如果k<PX=i(s)<j成立,則s(i,PX=i(s))=0,利用(5)式檢測(cè)水平方向相鄰邊緣點(diǎn)的距離。
5.根據(jù)權(quán)利要求2所述的基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,其特征是,所述的相鄰邊緣點(diǎn)距離統(tǒng)計(jì),具體為設(shè)文字圖象區(qū)域的相鄰邊緣點(diǎn)距離范圍為[W1,W2],其中圖書(shū)封面文字圖象分割中,文字圖象區(qū)域相鄰邊緣點(diǎn)距離的范圍為[3,15],同一文字圖象區(qū)域內(nèi),文字水平方向相鄰邊緣點(diǎn)距離接近相等,則每行統(tǒng)計(jì)滿足下列條件的相鄰邊緣點(diǎn)距離的數(shù)量,(i)W1≤D(i,j)≤W2,i∈[1,M1-m0],j∈[1,N1-n0](ii)存在m,n,滿足 1≤m≤m0,1≤n≤n0,使得下式成立D(i+m,j+n)∈[D(i,j)-Δ,D(i,j)+Δ]其中,m,n決定鄰域的大小,△相鄰邊緣點(diǎn)距離的波動(dòng),通過(guò)實(shí)驗(yàn)分析,確定上述參數(shù)的大小。
6.根據(jù)權(quán)利要求2所述的基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,其特征是,所述的文字圖象行區(qū)域檢測(cè),具體為根據(jù)每一行字符的最少個(gè)數(shù),確定相鄰邊緣點(diǎn)距離統(tǒng)計(jì)數(shù)量的閾值T,檢測(cè)文字圖象可能行,相鄰的可能文字圖象行進(jìn)行合并,形成可能的文字圖象區(qū)域,根據(jù)所要檢測(cè)文字的最小高度,設(shè)定閾值H,檢測(cè)得到文字圖象的行區(qū)域,根據(jù)分割要求,通過(guò)實(shí)驗(yàn)分析,確定相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的數(shù)量閾值T和文字圖象的高度閾值H。
7.根據(jù)權(quán)利要求2所述的基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,其特征是,所述的行區(qū)域邊界調(diào)整,具體為在分割出各個(gè)文字圖象行區(qū)域內(nèi),分別統(tǒng)計(jì)每一行的邊緣點(diǎn)數(shù)量,NY=Σj=1N1s(Y,j)---(6)]]>在每一個(gè)文字圖象行區(qū)域內(nèi),找出最小的邊緣點(diǎn)數(shù)量統(tǒng)計(jì)值N0b=min(NYb),Y1b≤Y≤Y2b---(7)]]>其中,b表示第b個(gè)文字圖象行區(qū)域,Y1b和Y2b是b文字圖象行區(qū)域的起始行和末尾行,在文字圖象行區(qū)域的上下兩個(gè)邊界附近,統(tǒng)計(jì)各行的邊緣點(diǎn)數(shù)量NY,如果NY≥N0b--(8)]]>則將該行并入b文字圖象區(qū)域內(nèi)。
8.根據(jù)權(quán)利要求2所述的基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,其特征是,所述的各行區(qū)域文字圖象高度檢測(cè),具體為經(jīng)行區(qū)域邊界調(diào)整后,檢測(cè)到完整的完整文字圖象行區(qū)域,在各行區(qū)域內(nèi),分別檢測(cè)各文字圖象區(qū)域的高度CHb=Yendb-Ystartb--(9)]]>其中,Yendb和Ystartb分別表示b文字圖象行區(qū)域經(jīng)邊界調(diào)整后的區(qū)域末尾行和起始行。
9.根據(jù)權(quán)利要求2所述的基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,其特征是,所述的行區(qū)域內(nèi)列方向邊緣點(diǎn)數(shù)量統(tǒng)計(jì),具體為在分割出的文字行區(qū)域圖象中,統(tǒng)計(jì)每一列的邊緣點(diǎn)數(shù)量,NXb=Σi=YstartbYendbS(i,X)--(10)]]>
10.根據(jù)權(quán)利要求2所述的基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,其特征是,所述的文字圖象列區(qū)域檢測(cè),具體為設(shè)定文字圖象區(qū)域內(nèi)列邊緣點(diǎn)的數(shù)量閾值TN,其中可能文字圖象列檢測(cè)的邊緣點(diǎn)數(shù)量梯度閾值TN范圍為[3,5],利用(11)式在文字圖象行區(qū)域內(nèi)檢測(cè)可能的文字圖象列,NXb≥TN--(11)]]>可能的文字圖象列進(jìn)行合并,形成可能的文字列區(qū)域,印刷體的排版方式中其字符的間隔必然小于字符的高度,則以各文字圖象行區(qū)域中檢測(cè)的字符高度CHb為可能文字圖象列合并的間隔閾值,設(shè)b圖像行區(qū)域內(nèi),兩可能文圖象列的間隔為GX,若GX≤CHb,則合并,合并后,還存在幾個(gè)可能的文字列區(qū)域,從中選出可能文字列最多的區(qū)域?yàn)槲淖至袇^(qū)域。
全文摘要
一種基于相鄰邊緣點(diǎn)距離統(tǒng)計(jì)的文字圖象分割方法,屬于圖象處理領(lǐng)域。方法如下先將灰度圖象用Canny算子檢測(cè)邊緣,檢測(cè)相鄰邊緣點(diǎn)的水平方向距離;統(tǒng)計(jì)可能為文字的邊緣點(diǎn)距離,檢測(cè)出可能的文字圖象行,形成文字圖象行區(qū)域;統(tǒng)計(jì)邊緣點(diǎn)數(shù)量,檢測(cè)到精確的文字圖象區(qū)域,并計(jì)算文字圖象高度;統(tǒng)計(jì)圖象像素的邊緣點(diǎn)數(shù)量,設(shè)定可能文字圖象列的閾值,檢測(cè)出可能的文字圖象列,形成文字圖象列區(qū)域,并進(jìn)行列邊界調(diào)整得到精確的文字圖象列區(qū)域;經(jīng)行和列的位置檢測(cè)后,得到文字圖象的區(qū)域范圍,最終準(zhǔn)確分割出文字圖象。本發(fā)明避免了顏色分割計(jì)算量大,分割精度低的問(wèn)題,有效地抑制了復(fù)雜背景的干擾,顯著提高了文字圖象的分割精度和算法執(zhí)行速度。
文檔編號(hào)G06T7/60GK1542697SQ200310108450
公開(kāi)日2004年11月3日 申請(qǐng)日期2003年11月6日 優(yōu)先權(quán)日2003年11月6日
發(fā)明者胡小鋒, 葉慶泰 申請(qǐng)人:上海交通大學(xué)