專利名稱:用于改善文檔圖像二值化性能的去噪聲裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于改善文檔圖像二值化性能的去噪聲裝置和方 法,更具體地說,涉及一種通過基于字符筆畫模型的文檔圖像平滑方法 以及基于字符筆畫寬度估計的二值圖像噪聲去除方法來改善文檔圖像二 值化性能的去噪聲裝置和方法。
背景技術(shù):
文檔圖像的二值化是文檔識別的一個重要步驟。二值化操作的含義 是把通過掃描或拍照得到的數(shù)字化文檔圖像中的像素點分成兩個類別 內(nèi)容和背景。內(nèi)容包括字符、表格邊框等,通常用黑色表示,背景通常 用白色表示。各種二值化算法的原理和性能的評測可以參見M. Sezgin, B. Sanker 在Journal of Electronic Imaging 13(1), 2004的文章"Survey over image thresholding techniques and quantitative performance evaluation "。另夕卜,關(guān) 于文檔圖像的二值化方法也有專利發(fā)表,如美國專利6,438,265, A. Heilper, Y. Navon, E. Walach, "Method of binarization in an optical character recognition system ,,。由于取像手段的不同以及圖像壓縮等原因,文檔圖像的質(zhì)量會有所 下降,這將對二值化的結(jié)果造成很大的影響。為了提高二值化的效果, 提出了很多不同的二值化算法,這些算法在一定程度上能夠有效地抑制 背景噪聲等造成的影響。但是,由于圖像退化的具體原因和程度各不相同,目前的二值化算法仍然不能完全解決問題。 發(fā)明內(nèi)容鑒于現(xiàn)有技術(shù)中存在的問題而提出了本發(fā)明,本發(fā)明的目的在于提供一種能夠改善文檔圖像二值化效果,從而提高字符識別的性能的裝置 和方法。本發(fā)明提出的方法與現(xiàn)有技術(shù)的方法的區(qū)別在于首先,本方法在 二值化操作之前對輸入的灰度圖像進行灰度級別的平滑,以去除噪聲, 而保留筆畫信息。其次,本方法在二值化之后,利用二值化的結(jié)果來分 析筆畫的特征,再進行二值的噪聲去除。根據(jù)本發(fā)明的第一方面,提供了一種用于文檔圖像二值化性能改善 的去噪聲裝置,該去噪聲裝置包括灰度圖像平滑單元,用于基于字符的筆畫方向信息對灰度圖像中的 噪聲點進行平滑,并輸出經(jīng)平滑的灰度圖像;灰度圖像二值化單元,用于對由所述灰度圖像平滑單元輸出的經(jīng)平 滑的灰度圖像進行二值化,并輸出進行了二值化的圖像;二值圖像噪聲去除單元,用于基于字符的筆畫寬度來去除由所述灰 度圖像二值化單元輸出的進行了 二值化的圖像中的噪聲點。根據(jù)本發(fā)明第一方面的用于改善文檔圖像二值化性能的去噪聲裝置,其中,所述灰度圖像平滑單元包括平滑點選擇單元,用于選擇需要進行平滑的像素點作為平滑點; 筆畫方向判斷單元,用于判斷所述平滑點所屬筆畫的方向; 像素點平滑單元,用于利用所述平滑點所屬筆畫的方向上的鄰近像 素點的像素值對所述平滑點進行平滑。根據(jù)本發(fā)明第一方面的用于改善文檔圖像二值化性能的去噪聲裝置,其中,其中,所述二值圖像噪聲去除單元包括筆畫寬度估計單元,用于估計筆畫的寬度,并將所述筆畫的寬度與一閾值進行比較;噪聲點去除循環(huán)次數(shù)計算單元,用于在所述筆畫的寬度大于所述閾 值時,計算需要對筆畫執(zhí)行二值噪聲點去除操作的循環(huán)次數(shù);筆畫二值噪聲點去除單元,用于根據(jù)所述二值噪聲點去除操作的循 環(huán)次數(shù),反復去除筆畫中的噪聲點。根據(jù)本發(fā)明的另一方面,提供了一種用于改善文檔圖像二值化性能的去噪聲方法,該方法包括灰度圖像平滑步驟,用于基于字符的筆畫方向信息對灰度圖像中的 噪聲點進行平滑,并輸出經(jīng)平滑的灰度圖像;灰度圖像二值化步驟,用于對所述經(jīng)平滑的灰度圖像進行二值化, 并輸出進行了二值化的圖像;二值圖像噪聲去除步驟,用于基于字符的筆畫寬度來去除進行了二 值化的圖像中的噪聲點。根據(jù)本發(fā)明的另一方面,提供了一種計算機程序,該計算機程序在 運行時,使計算機執(zhí)行以下步驟灰度圖像平滑步驟,用于基于字符的筆畫方向信息對灰度圖像中的 噪聲點進行平滑,并輸出經(jīng)平滑的灰度圖像;灰度圖像二值化步驟,用于對所述經(jīng)平滑的灰度圖像進行二值化,并輸出進行了二值化的圖像;二值圖像噪聲去除步驟,用于基于字符的筆畫寬度來去除進行了二 值化的圖像中的噪聲點。根據(jù)本發(fā)明的另一方面,提供了一種計算機程序產(chǎn)品,該計算機程 序產(chǎn)品包括計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)中存儲有用于 文檔圖像二值化性能改善的去噪聲程序,該去噪聲程序在執(zhí)行時,使得計算機執(zhí)行以下步驟灰度圖像平滑步驟,用于基于字符的筆畫方向信息對灰度圖像中的噪聲點進行平滑,并輸出經(jīng)平滑的灰度圖像;灰度圖像二值化步驟,用于對所述經(jīng)平滑的灰度圖像進行二值化,并輸出進行了二值化的圖像;二值圖像噪聲去除步驟,用于基于字符的筆畫寬度來去除進行了二 值化的圖像中的噪聲點。根據(jù)本發(fā)明,可以在對文檔圖像進行二值化之前對文檔圖像進行基 于字符筆畫模型的文檔圖像平滑處理,以使文檔圖像的背景噪聲點得到 平滑,并且在對文檔圖像進行二值化之后對文檔圖像進行基于字符筆畫 寬度估計的二值圖像噪聲去除處理,以進一步去除背景噪聲點,本發(fā)明的方法可以與任何現(xiàn)有的二值化方法進行結(jié)合,以進一步改善文檔圖像 二值化后的效果,從而提高字符識別的性能。
所包含的附圖用于提供對本發(fā)明的進一步理解,附圖被并入說明書 并構(gòu)成說明書的一部分,
了本發(fā)明的實施例,并與說明書一起 用于解釋本發(fā)明的原理。在附圖中圖1是示意性地表示根據(jù)本發(fā)明的用于改善文檔圖像二值化性能 的裝置的框圖;圖2是表示根據(jù)本發(fā)明的用于改善文檔圖像二值化性能的裝置的 操作的流程圖;圖3是表示根據(jù)本發(fā)明的筆畫方向判斷方法的示意圖; 圖4是表示根據(jù)本發(fā)明的灰度圖像平滑方法的流程圖; 圖5是表示根據(jù)本發(fā)明的二值圖像噪聲去除方法的流程圖; 圖6是表示筆畫寬度估計方法的示意圖;圖7是表示應用本發(fā)明的方法之前和應用本發(fā)明的方法之后的效果 的比較示例,其中,A是沒有應用本發(fā)明的方法時的二值化結(jié)果,B是 應用了本發(fā)明的灰度圖像平滑方法后的二值化結(jié)果,C是應用了本發(fā)明 的灰度圖像平滑方法和二值圖像噪聲去除方法后的結(jié)果。
具體實施方式
下面將參照附圖詳細說明根據(jù)本發(fā)明的去噪聲裝置和方法的實施例。首先將參照圖1和圖2簡要說明根據(jù)本發(fā)明的去噪聲裝置的總體構(gòu) 成和操作。圖1是示意性地表示根據(jù)本發(fā)明的用于改善文檔圖像二值化 性能的裝置的框圖。圖2是根據(jù)本發(fā)明的用于改善文檔圖像二值化性 能的裝置的操作的流程圖。如圖1所示,根據(jù)本發(fā)明的噪聲點去除裝置300包括灰度圖像平滑 單元302、灰度圖像二值化單元303以及二值圖像噪聲去除單元304。如圖2所示,在進行操作時,向噪聲點去除裝置300輸入灰度文檔圖像(步驟S301),灰度圖像平滑單元302對該灰度文檔圖像進行灰度級 別的平滑處理(步驟S302),從而抵消噪聲對二值化算法的影響。隨后, 灰度圖像二值化單元303將進行了平滑處理的灰度圖像轉(zhuǎn)化為二值化圖 像(步驟S303),在該步驟中可以采用各種現(xiàn)有的二值化算法。對于二值 化圖像中殘留的噪聲,二值圖像噪聲去除單元304進一步進行噪聲的去 除(步驟S304),最后輸出去除了噪聲以后的二值化圖像(步驟S305)。 接下來,將進一步參照圖3到圖5詳細說明根據(jù)本發(fā)明的噪聲點去 除裝置300的各個組成部分的具體結(jié)構(gòu)和操作。圖3是表示根據(jù)本發(fā)明的筆畫方向判斷方法的示意圖。圖4是表示 根據(jù)本發(fā)明的灰度圖像平滑方法的流程圖。圖5是表示根據(jù)本發(fā)明的二 值圖像噪聲去除方法的流程圖。如圖1所示,灰度圖像平滑單元302包括平滑點選擇單元401, 用于選擇需要進行平滑的像素點;筆畫方向判斷單元402,用于判斷像素 點所屬筆畫的方向;以及像素點平滑單元403,用于使用像素點的筆畫方 向信息對像素點進行平滑操作。在本發(fā)明中,并不是所有的像素點都需要進行平滑操作,因為本發(fā) 明的目的是為了消除噪聲,因此只需要對噪聲點進行平滑就可以了。噪 聲點的定位可以通過當前像素點和鄰近像素點的像素值的關(guān)系來確定, 例如,僅對像素值大于或者小于周圍8個像素點(如圖3所示)的像素 值的像素點進行平滑操作。如圖4所示,首先在步驟S401,平滑點選擇單元401對所輸入的灰度文檔圖像中的像素點進行操作,選擇出需要進行平滑的像素點。在該 選擇過程中,通過判斷一個像素點的像素值和周圍像素點的像素值之間 的關(guān)系來確定該像素點是否為需要進行平滑的像素點。具體地說,將一 個像素點的像素值與該像素點周圍的8個像素點的像素值進行比較,如 果該像素點的像素值大于或者小于周圍8個像素點的像素值,則認為該 像素點是需要進行平滑的像素點,并且將該像素點選擇為平滑點。在進行平滑點的選擇以后,對于所選擇的每一個平滑點進行平滑操作。該平滑操作具體分為以下兩個步驟。首先,在步驟S402中,筆畫方向判斷單元402判斷該平滑點所屬的 筆畫方向。圖3示意性地表示了假設(shè)一個像素點是筆畫點時確定其所屬 筆畫的方向的方法??梢酝ㄟ^筆畫模型來確定像素點所屬筆畫的方向。 具體地說,通過判斷一個像素點周圍的4對像素點的像素值和該像素點 的像素值的近似程度來確定筆畫的方向。圖3中示出了筆畫的4個可能 的方向,其中"O"代表當前像素點。假設(shè)當前像素點屬于第i個方向(i=l、 2、 3、 4),則當前像素點的像素值與第i個方向上的2個像素點的像素值 最為接近。分別確定4個方向上的像素點的像素值的平均值與當前像素 點的像素值的差,并且將其中獲得的差最小的方向確定為該像素點對應 的筆畫方向。然后,在步驟S403中,像素點平滑單元403利用筆畫方向信息對該 像素點的像素值進行平滑操作。與普通的圖像平滑算法相比,本發(fā)明提 出的圖像平滑算法利用了字符筆畫的特征,即一個字符筆畫只可能有4 個方向橫(水平方向),豎(垂直方向),撇(右上左下方向),捺(左 上右下方向)。假設(shè)字符筆畫中的像素點的像素值具有一定的一致性(相 似的顏色或者灰度),如果一個像素點屬于某個字符的筆畫,并且已經(jīng)知 道該筆畫的方向,則使用該方向上的與該像素點相鄰的多個像素點的平 均像素值來代替^像素點的像素值。在該平滑處理之前和之后,該像素 點的像素值不會有較大的變化。而如果一個像素點屬于背景,則無論沿 著哪個方向進行平滑處理,由于相鄰的像素點的像素值之間沒有一定的 一致性,所以該像素點的像素值在平滑處理之后會發(fā)生較大變化。由于 在退化的情況下,二值化噪聲往往是由一些比較孤立的、與筆畫像素點 的顏色相近的背景噪聲點所引起的,因此在使用上述方法對文檔圖像進 行平滑的情況下,背景像素點將得到平滑,而筆畫像素點變化不大。這 樣的處理將有助于提高二值化算法的效率,并且改善了二值化算法的效 果。當對每一個平滑點都進行了平滑操作之后,在步驟S404中,輸出平 滑后的灰度文檔圖像。如上所述,在圖4所示的平滑處理之后,在圖2的步驟S302中,灰 度圖像二值化單元303可以采用各種現(xiàn)有的二值化算法對經(jīng)過平滑處理 的灰度文檔圖像進行二值化處理。然后將由灰度圖像二值化單元303輸 出的二值化圖像501輸入給二值圖像噪聲去除單元304。在二值圖像噪聲 去除單元304中對二值化圖像501進行噪聲去除處理。如圖5所示,在步驟S501中,輸入由灰度圖像二值化單元303進行 了二值化處理的二值化圖像501。然后,在步驟S502中,筆畫查找單元 502通過二值圖像的連接組件分析(connected component analysis)找到 所有的筆畫。在以下文獻中對連接組件分析方法進行了詳細的描述岡 薩雷斯,《數(shù)字圖像處理(第二版)》,阮秋琦,阮宇智等譯,電子工業(yè)出 版社,2003年3月第一版,第435頁。接下來,對由筆畫查找單元502找到的每一個筆畫進行如下的操作-筆畫寬度估計單元503對每一個筆畫的寬度進行估計。在筆畫寬度 估計中,如圖6中的(a)所示,對于筆畫中的每一個像素點,沿著水平 H、垂直V以及兩個45度的方向Sl和S2對該筆畫進行掃描,并且分別 對該筆畫在該像素點處沿上述H、 V、 S1和S2四個方向掃描到的像素點 進行計數(shù),作為該筆畫在該像素點處沿上述H、 V、 S1和S2四個方向的 寬度,并且將這些寬度中的最小寬度作為該筆畫在該像素點處的寬度, 在圖6的(a)中所示的示例中,該筆畫在該像素點處的寬度為水平H方 向的寬度。然后,統(tǒng)計該筆畫的所有寬度的值的出現(xiàn)頻率,并且將出現(xiàn) 頻率最大的寬度作為該筆畫的寬度。如果筆畫的寬度大于一個指定的閾值T,則處理進行到步驟S505, 對該筆畫的區(qū)域進行噪聲去除的操作。該閾值T的一個通常的取值是3。 如果筆畫寬度小于該閾值T,則處理返回到步驟S503,繼續(xù)檢查下一個 筆畫(步驟S508)。在噪聲去除的操作中,首先在步驟S505中,通過噪聲去除循環(huán)次數(shù) 計算單元505來計算循環(huán)次數(shù),然后在每一次循環(huán)中(即,每一次執(zhí)行 步驟S506時),筆畫二值噪聲點去除單元506都執(zhí)行除操作。在由灰度圖像二值化單元303進行了二值化處理的二值化圖像501中,很多二值化噪聲都是一些寬度為1個像素的黑像素點,如果估計出 字符的筆畫寬度要遠遠大于1 ,則可以去除那些寬度為1個像素的黑像素。 需要注意的是,不是所有寬度為1個像素點的黑像素都是噪聲點,由于 二值化算法的原因,可能一個寬度為2個像素點的筆畫在中間一些部位 寬度只有1個像素點,如果把所有寬度都為1個像素點的黑像素都去除 將會導致筆畫的斷裂。因此噪聲點的去除釆用循環(huán)的模式進行,在每一 個循環(huán)內(nèi),把所有滿足下面條件的黑像素改為白像素當前黑像素點周圍的黑像素點的個數(shù)小于2。循環(huán)的次數(shù)由筆畫的大小size來決定,筆畫的大小size越大,可能的噪聲點越多,需要的去除操作也就越多。如上所述,所計算的循環(huán)次數(shù)與筆畫的大小size相關(guān),筆畫的大小size越大,循環(huán)次數(shù)越多,筆畫的大小size越小,循環(huán)次數(shù)越少。具體地說,筆畫的大小size可以是筆畫的外接矩形的寬度和高度中的較大者,其中,筆畫的外接矩形的寬度和高度分別被定義為沿外接矩形的寬度和高度方向上的像素數(shù)量,并且循環(huán)次數(shù)由下式確定-N=size / r其中,N為循環(huán)次數(shù),r是一個系數(shù),其通常的取值是IO。在步驟S506中,筆畫二值噪聲點去除單元506對筆畫中的每一個像 素點進行判斷,如果該像素點周圍的黑點(筆畫點)的個數(shù)小于等于1 個,則可以認為該像素點是一個筆畫寬度為1個像素點的筆畫的端點。 因為該筆畫的寬度要遠大于1,因此可以認為寬度為1的筆畫的端點是噪 聲,并且去除該噪聲點(將黑點變?yōu)榘c)。當對所有的筆畫進行了上述操作之后,即去除了所有筆畫的二值噪 聲點以后,在步驟S507中,輸出噪聲去除以后的最終二值文檔圖像507。下面參照圖7說明本發(fā)明的效果。圖7是表示應用本發(fā)明的方法之 前和應用本發(fā)明的方法之后的效果的比較示例,其中,A是沒有應用本 發(fā)明的方法時的二值化結(jié)果,B是應用了本發(fā)明的灰度圖像平滑方法后 的二值化結(jié)果,C是應用了本發(fā)明的灰度圖像平滑方法和二值圖像噪聲 去除方法后的結(jié)果。圖7中的A和B是未經(jīng)過平滑和經(jīng)過平滑的文檔圖像的二值化結(jié)果。 顯然,經(jīng)過平滑以后的文檔圖像二值化的效果會有較大的改善,從圖7中還可以看出,在二值化以后,還會有一些噪聲存在,為了 進一步去除這些噪聲,本發(fā)明進一步利用了筆畫寬度的信息對二值圖像 進行去噪處理。通過二值噪聲點的去除,二值化的效果得到了進一步的 提高,圖7中的C是經(jīng)過二值噪聲點去除以后的二值圖像。以上根據(jù)具體實施例對本發(fā)明的原理進行了詳細說明,但是本發(fā)明 的實現(xiàn)并不限于以上實施例。在以上實施例中,在由灰度圖像平滑單元302的平滑點選擇單元401 進行的平滑點選擇中,選擇像素值大于或者小于周圍8個點的像素值的 像素點作為需要進行平滑的像素點,也就是說,選擇像素值最大和最小 (最亮和最暗)的像素點作為需要進行平滑的像素點。然而,在另一實 施例中,可以通過其他的方法來選擇需要進行平滑的像素點。例如,如 果一個像素點與周圍像素點相比較亮和較暗(或者一個像素點的像素值 與周圍像素點相比處于前N位或者后N位,N為2到4的整數(shù)),則選 擇該像素點作為需要進行平滑的像素點。在以上實施例中,筆畫寬度估計單元503通過在筆畫中的各個像素 點處,沿著水平、垂直以及從右上到左下和從左上到右下的兩個45度方 向?qū)P畫進行掃描,并選擇在該4個方向中的筆畫像素點數(shù)最少的方向 上掃描到的像素點的數(shù)量作為筆畫在該像素點處的寬度,統(tǒng)計各個寬度 的值的出現(xiàn)頻率,并選擇出現(xiàn)頻率最大的寬度作為該筆畫的寬度。然而, 在另一實施例中,還可以通過其他的方法來估計筆畫的寬度。例如,首 先,確定各個筆畫的骨架(參見岡薩雷斯,《數(shù)字圖像處理(第二版)》, 阮秋琦,阮宇智等譯,電子工業(yè)出版社,2003年3月第一版,第440-441 頁),然后,將該筆畫與以該骨架上的各個點為圓心的不同直徑的圓進行 比較,如果一個圓可以被該筆畫完全覆蓋,則筆畫的寬度大于或等于該 圓的直徑,逐步增大圓的直徑,直到該圓不可以被該筆畫完全覆蓋為止, 該筆畫在該點的寬度被確定為可以被該筆畫完全覆蓋的以該點為圓心的 最大圓的直徑,并且統(tǒng)計各個點處的筆畫寬度的值的出現(xiàn)頻率,并將出 現(xiàn)頻率最大的寬度作為該筆畫的寬度。應當理解,本發(fā)明實施例的各個單元可以實現(xiàn)為計算機程序產(chǎn)品,這些計算機程序產(chǎn)品存儲有用于執(zhí)行各個單元的功能的計算機程序。這 些計算機程序產(chǎn)品可以包括計算機可讀存儲介質(zhì)(例如,非易失存儲介 質(zhì))、以及包含在該計算機可讀存儲介質(zhì)中的計算機可讀程序代碼部分 (例如, 一系列計算機指令)。并且可以想到,附圖2、 4和5中的流程圖的每一個步驟以及步驟的 組合都可以通過執(zhí)行指定功能或步驟的基于特殊用途的硬件的計算機系 統(tǒng)、或者特殊用途硬件和計算機指令的組合來實施。本發(fā)明所屬領(lǐng)域的技術(shù)人員根據(jù)以上對本發(fā)明原理的詳細說明,很 容易想到本發(fā)明的多種修改和其它實施例。因此,本發(fā)明不限于所公開 的具體實施例,而是旨在涵蓋落入所附權(quán)利要求范圍內(nèi)的本發(fā)明的所有修改和其它實施例。
權(quán)利要求
1. 一種用于文檔圖像二值化性能改善的去噪聲裝置,該去噪聲裝置包括灰度圖像平滑單元,用于基于字符的筆畫方向信息對灰度圖像中的噪聲點進行平滑,并輸出經(jīng)平滑的灰度圖像;灰度圖像二值化單元,用于對由所述灰度圖像平滑單元輸出的經(jīng)平滑的灰度圖像進行二值化,并輸出進行了二值化的圖像;二值圖像噪聲去除單元,用于基于字符的筆畫寬度來去除由所述灰度圖像二值化單元輸出的進行了二值化的圖像中的噪聲點。
2、 根據(jù)權(quán)利要求1所述的去噪聲裝置,其中,所述灰度圖像平滑單 元包括平滑點選擇單元,用于選擇需要進行平滑的像素點作為平滑點; 筆畫方向判斷單元,用于判斷所述平滑點所屬筆畫的方向; 像素點平滑單元,用于利用所述平滑點所屬筆畫的方向上的鄰近像 素點的像素值對所述平滑點進行平滑。
3、 根據(jù)權(quán)利要求2所述的去噪聲裝置,其中,所述平滑點選擇單元 通過判斷一個像素點的像素值和周圍像素點的像素值之間的關(guān)系來確定 該像素點是否為需要進行平滑的像素點。
4、 根據(jù)權(quán)利要求2所述的去噪聲裝置,其中,所述筆畫方向判斷單 元通過判斷一個像素點周圍的4對像素點的像素值和該像素點的像素值 的近似程度來確定筆畫的方向。
5、 根據(jù)權(quán)利要求1到4中的任意一項所述的去噪聲裝置,其中,所 述二值圖像噪聲去除單元包括筆畫寬度估計單元,用于估計筆畫的寬度,并將所述筆畫的寬度與 一閾值進行比較;噪聲點去除循環(huán)次數(shù)計算單元,用于在所述筆畫的寬度大于所述閾 值時,計算需要對筆畫執(zhí)行二值噪聲點去除操作的循環(huán)次數(shù);筆畫二值噪聲點去除單元,用于根據(jù)所述二值噪聲點去除操作的循環(huán)次數(shù),反復去除筆畫中的噪聲點。
6、 根據(jù)權(quán)利要求5所述的去噪聲裝置,其中,所述筆畫寬度估計單 元通過確定在筆畫中的每一個像素點處,該筆畫沿水平、垂直、以及右上到左下和左上到右下兩個45度方向的寬度中的最小寬度作為該筆畫在 該像素點處的寬度,并統(tǒng)計該筆畫的所有寬度的值的出現(xiàn)頻率,并將出 現(xiàn)頻率最大的寬度作為該筆畫的寬度。
7、 根據(jù)權(quán)利要求5所述的去噪聲裝置,其中,所述筆畫寬度估計單 元通過確定筆畫的骨架,并確定被該筆畫完全覆蓋的以所述骨架中的每 一個點為圓心的最大圓的直徑作為該筆畫在該點處的寬度,并統(tǒng)計該筆 畫的所有寬度的值的出現(xiàn)頻率,并將出現(xiàn)頻率最大的寬度作為該筆畫的 寬度。
8、 根據(jù)權(quán)利要求5所述的去噪聲裝置,其中,所述噪聲點去除循環(huán) 次數(shù)計算單元根據(jù)筆畫的大小來確定循環(huán)次數(shù),其中所述筆畫的大小為 筆畫的外接矩形的寬度和高度中的較大者。
9、 根據(jù)權(quán)利要求5所述的去噪聲裝置,其中,所述筆畫二值噪聲點 去除單元通過判斷像素點是否為寬度為1的筆畫的端點來確定該像素點 是否為噪聲點。
10、 一種用于文檔圖像二值化性能改善的去噪聲方法,該去噪聲方 法包括灰度圖像平滑步驟,用于基于字符的筆畫方向信息對灰度圖像中的 噪聲點進行平滑,并輸出經(jīng)平滑的灰度圖像;灰度圖像二值化步驟,用于對所述經(jīng)平滑的灰度圖像進行二值化, 并輸出進行了二值化的圖像;二值圖像噪聲去除步驟,用于基于字符的筆畫寬度來去除進行了二 值化的圖像中的噪聲點。
11、 根據(jù)權(quán)利要求10所述的去噪聲方法,其中,所述灰度圖像平滑步驟包括平滑點選擇步驟,用于選擇需要進行平滑的像素點作為平滑點; 筆畫方向判斷步驟,用于判斷所述平滑點所屬筆畫的方向;像素點平滑步驟,用于利用所述平滑點所屬筆畫的方向上的鄰近像 素點的像素值對所述平滑點進行平滑。
12、 根據(jù)權(quán)利要求ll所述的去噪聲方法,其中,在所述平滑點選擇 步驟中,通過判斷一個像素點的像素值和周圍像素點的像素值之間的關(guān) 系來確定該像素點是否為需要進行平滑的像素點。
13、 根據(jù)權(quán)利要求11所述的去噪聲方法,其中,在所述筆畫方向判斷步驟中,通過判斷一個像素點周圍的4對像素點的像素值和該像素點的像素值的近似程度來確定筆畫的方向。
14、 根據(jù)權(quán)利要求10到13中的任意一項所述的去噪聲方法,其中,所述二值圖像噪聲去除步驟包括筆畫寬度估計步驟,用于估計筆畫的寬度,并將所述筆畫的寬度與一閾值進行比較;噪聲點去除循環(huán)次數(shù)計算步驟,用于在所述筆畫的寬度大于所述閾 值時,計算需要對筆畫執(zhí)行二值噪聲點去除操作的循環(huán)次數(shù);筆畫二值噪聲點去除步驟,用于根據(jù)所述二值噪聲點去除操作的循 環(huán)次數(shù),反復去除筆畫中的噪聲點。
15、 根據(jù)權(quán)利要求14所述的去噪聲方法,其中,在所述筆畫寬度估 計步驟中,通過確定在筆畫中的每一個像素點處,該筆畫沿水平、垂直、 以及右上到左下和左上到右下兩個45度方向的寬度中的最小寬度作為該 筆畫在該像素點處的寬度,并統(tǒng)計該筆畫的所有寬度的值的出現(xiàn)頻率, 并將出現(xiàn)頻率最大的寬度作為該筆畫的寬度。
16、 根據(jù)權(quán)利要求14所述的去噪聲方法,其中,在所述筆畫寬度估計步驟中,通過確定筆畫的骨架,并確定被該筆畫完全覆蓋的以所述骨 架中的每一個點為圓心的最大圓的直徑作為該筆畫在該點處的寬度,并 統(tǒng)計該筆畫的所有寬度的值的出現(xiàn)頻率,并將出現(xiàn)頻率最大的寬度作為 該筆畫的寬度。
17、 根據(jù)權(quán)利要求14所述的去噪聲方法,其中,在所述噪聲點去除 循環(huán)次數(shù)計算步驟中,根據(jù)筆畫的大小來確定循環(huán)次數(shù),其中所述筆畫 的大小為筆畫的外接矩形的寬度和高度中的較大者。
18、 根據(jù)權(quán)利要求14所述的去噪聲方法,其中,在所述筆畫二值噪 聲點去除步驟中,通過判斷像素點是否為寬度為1的筆畫的端點來確定 該像素點是否為噪聲點。
19、 一種用于文檔圖像二值化性能改善的去噪聲程序,該去噪聲程序在執(zhí)行時,使得計算機執(zhí)行以下步驟灰度圖像平滑步驟,用于基于字符的筆畫方向信息對灰度圖像中的噪聲點進行平滑,并輸出經(jīng)平滑的灰度圖像;灰度圖像二值化步驟,用于對所述經(jīng)平滑的灰度圖像進行二值化, 并輸出進行了二值化的圖像;二值圖像噪聲去除步驟,用于基于字符的筆畫寬度來去除進行了二 值化的圖像中的噪聲點。
20、 一種計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括計算機可讀存儲 介質(zhì),該計算機可讀存儲介質(zhì)中存儲有用于文檔圖像二值化性能改善的 去噪聲程序,該去噪聲程序在執(zhí)行時,使得計算機執(zhí)行以下步驟灰度圖像平滑步驟,用于基于字符的筆畫方向信息對灰度圖像中的 噪聲點進行平滑,并輸出經(jīng)平滑的灰度圖像;灰度圖像二值化步驟,用于對所述經(jīng)平滑的灰度圖像進行二值化, 并輸出進行了二值化的圖像;二值圖像噪聲去除步驟,用于基于字符的筆畫寬度來去除進行了二 值化的圖像中的噪聲點。
全文摘要
本發(fā)明提供了用于改善文檔圖像二值化性能的去噪聲裝置和方法。該去噪聲裝置包括灰度圖像平滑單元,用于基于字符的筆畫方向信息對灰度圖像中的噪聲點進行平滑,并輸出經(jīng)平滑的灰度圖像;灰度圖像二值化單元,用于對由所述灰度圖像平滑單元輸出的經(jīng)平滑的灰度圖像進行二值化,并輸出進行了二值化的圖像;二值圖像噪聲去除單元,用于基于字符的筆畫寬度來去除由所述灰度圖像二值化單元輸出的進行了二值化的圖像中的噪聲點。
文檔編號G06K9/40GK101256630SQ20071007875
公開日2008年9月3日 申請日期2007年2月26日 優(yōu)先權(quán)日2007年2月26日
發(fā)明者堀田悅伸, 俊 孫, 直井聰, 藤本克仁 申請人:富士通株式會社