国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種半色調(diào)文檔圖像的噪聲處理方法

      文檔序號:6481392閱讀:233來源:國知局
      專利名稱:一種半色調(diào)文檔圖像的噪聲處理方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及計算機視覺和圖形、圖像處理領(lǐng)域,特別涉及一種半色調(diào)文檔圖像的噪聲處理方法,可應用于掃描文檔圖像、傳真圖像等各種半色調(diào)文檔圖像的文字去噪和文字提取,可進一步應用于半色調(diào)圖像文檔的文字識別及全文檢索領(lǐng)域。

      背景技術(shù)
      隨著打印機、掃描儀及傳真機的普及,半色調(diào)文檔圖像廣泛地應用于社會生活的各個領(lǐng)域。因此,為了實現(xiàn)半色調(diào)文檔圖像的文字識別及全文檢索,針對半色調(diào)文檔圖像的文字去噪及文字提取技術(shù)顯得非常有必要。一種傳統(tǒng)的方法是對半色調(diào)圖像進行逆半色調(diào)化,將其轉(zhuǎn)化成對應的灰度圖,但是,經(jīng)這種方法處理后,圖像中通常會產(chǎn)生較嚴重的模糊,使得文字部分的細節(jié)丟失,從而降低文字的識別率。另一種傳統(tǒng)方法是對圖像中的半色調(diào)點直接進行處理,可有效地避免產(chǎn)生文字模糊現(xiàn)象,然而,如何在去除半色調(diào)點圖像中的圖像部分、圖形部分的同時,又保證盡量不丟失文字部分的細節(jié),成為該技術(shù)中需要解決的一個關(guān)鍵問題。


      發(fā)明內(nèi)容
      本發(fā)明的目的在于提供一種半色調(diào)文檔圖像的噪聲處理方法,能夠去除半色調(diào)文檔圖像中的背景噪聲,消除文字的毛刺噪聲,保持文字筆畫的完整性以及光順性。
      為了達到上述目的,本發(fā)明采用以下技術(shù)方案予以實現(xiàn)。
      一種半色調(diào)文檔圖像的噪聲處理方法,其特征在于,包括以下步驟 首先,將半色調(diào)文檔圖像分為四類淺色背景和深色文字、淺色背景和淺色文字、深色背景和深色文字、深色背景和淺色文字; 其次,去除半色調(diào)文檔圖像的背景噪聲對于淺色背景和深色文字的半色調(diào)文檔圖像,采用基于連通區(qū)域標記的方法去除背景噪聲;對于淺色背景和淺色文字的半色調(diào)文檔圖像,采用基于高斯平滑濾波的方法去除背景噪聲;對于深色背景和深色文字的半色調(diào)文檔圖像、深色背景和淺色文字的半色調(diào)文檔圖像,采用基于維納濾波的方法去除背景噪聲; 最后,觀察去除背景噪聲的半色調(diào)文檔圖像,構(gòu)造文字的毛刺去除模板和缺陷修復模板,通過模板匹配去除文字毛刺和修復文字缺陷。
      本發(fā)明的進一步改進和特點在于 (1)所述將半色調(diào)文檔圖像分為四類,具體為對半色調(diào)文檔圖像進行高斯平滑濾波,計算高斯平滑濾波后半色調(diào)文檔圖像的Otsu閾值及灰度直方圖,根據(jù)Otsu閾值估計背景的半色調(diào)點密度,根據(jù)灰度直方圖估計文字的半色調(diào)點密度,并根據(jù)背景的半色調(diào)點密度和文字的半色調(diào)點密度,將半色調(diào)文檔圖像分為四類,即淺色背景和深色文字、淺色背景和淺色文字、深色背景和深色文字、深色背景和淺色文字。
      (2)所述文字的毛刺去除模板用表格表示,包括 其中,單元格代表像素,單元格之間的位置關(guān)系代表像素間的位置關(guān)系;單元格中,1表示文字像素,0表示背景像素,①表示需要去除的文字像素,即需要把該像素值由1變?yōu)?;空單元格表示像素值為0或1。
      (3)所述缺陷修復模板用表格表示,包括以下表格
      其中,單元格代表像素,單元格之間的位置關(guān)系代表像素間的位置關(guān)系;單元格中,1表示文字像素,0表示背景像素,

      表示需要修復的文字像素,即需要把該像素值由0變?yōu)?;空單元格表示像素值為0或1。
      本發(fā)明通過將半色調(diào)文檔圖像分成四類別,再對這四個類別自適應地選擇最合適的背景噪聲的去除方法,能在進行半色調(diào)文檔圖像初步去噪的同時,盡可能多的保持文字的細節(jié),然后,通過構(gòu)造的一系列文字的毛刺去除模板和缺陷修復模板,通過模板匹配,對初步去噪的半色調(diào)文檔圖像的文字進行毛刺去除以及缺陷修復,使得進一步對文字的OCR識別變得更加容易。
      本發(fā)明對于基于誤差擴散的半色調(diào)文檔圖像更有效,一方面在于基于誤差擴散的半色調(diào)技術(shù)可以用一個近似的線性模型來模擬,因此維納濾波的方法對于該類半色調(diào)圖像更有效;另一方面在于基于誤差擴散的半色調(diào)技術(shù)上利用半色調(diào)點的密度而非半色調(diào)點的大小來把灰度圖像轉(zhuǎn)化成半色調(diào)圖像的,因此基于聯(lián)通區(qū)域標記的方法對于該類半色調(diào)圖像更有效。



      下面結(jié)合附圖和具體實施方式
      對本發(fā)明做進一步詳細說明。
      圖1是半色調(diào)文檔圖像的噪聲處理方法的總體流程圖。
      圖2是高斯平滑后的半色調(diào)文檔圖像的灰度直方圖,其中,橫坐標為灰度級別,范圍為0-255,縱坐標為直方圖的累計值。
      圖3是基于連通區(qū)域標記的半色調(diào)文檔圖像的背景去噪的流程圖。
      圖4是基于高斯平滑濾波的半色調(diào)文檔圖像的背景去噪的流程圖。
      圖5是基于維納濾波濾波的半色調(diào)文檔圖像的背景去噪的流程圖。
      圖6是半色調(diào)文檔圖像中的背景和文字的顏色深度組合圖,(a)深色背景和深色文字,(b)深色背景和淺色文字,(c)淺色背景和深色文字,(d)淺色背景和淺色文字。
      圖7是對應圖6的背景去噪結(jié)果圖。
      圖8(a)是去除背景噪聲后的半色調(diào)文檔圖像的反色圖(主要包含毛刺),圖8(b)是圖5(a)的局部A的放大(800%)示意圖,圖8(c)是圖8(a)的局部B的放大(800%)示意圖。
      圖9(a)、圖9(b)、圖9(c)分別是的對應圖8(a)、圖8(b)、圖8(c)去除文字噪聲的效果圖。
      圖10(a)是去除背景噪聲后的半色調(diào)文檔圖像的反色放大(300%)圖(既包含毛刺又包含缺陷);圖10(b)是圖10(a)去除文字噪聲的效果圖。

      具體實施例方式 參照圖1,本發(fā)明半色調(diào)文檔圖像的噪聲處理方法,主要包括以下步驟。
      (1)、對半色調(diào)文檔圖像進行高斯平滑濾波,計算高斯平滑濾波后半色調(diào)文檔圖像的Otsu閾值及灰度直方圖,根據(jù)Otsu閾值估計背景的半色調(diào)點密度,根據(jù)灰度直方圖估計文字的半色調(diào)點密度,并根據(jù)背景的半色調(diào)點密度和文字的半色調(diào)點密度,將半色調(diào)文檔圖像分為四類淺色背景和深色文字、淺色背景和淺色文字、深色背景和深色文字、深色背景和淺色文字。
      具體為對半色調(diào)圖像采用5×5(像素)模板的高斯平滑濾波,計算對高斯平滑濾波后的圖像的Otsu閾值及灰度直方圖。
      根據(jù)Otsu閾值估計背景的半色調(diào)點密度,將半色調(diào)文檔圖像按照背景的顏色深度分為深色背景和淺色背景兩類。關(guān)于Otsu閾值以及利用Otsu閾值進行灰度圖像的二值化,參考以下文獻N.Otsu,“A Threshold SelectionMethod from Grey Level Histograms”,IEEE TRANSACTIONS ON SYSTREMS,MAN,AND CYBERNETICS,VOL.SMC-9,NO.1,JANUARY 1979。發(fā)明人通過大量實驗驗證,得到表1所述的背景顏色深度與二值化的Otsu閾值之間的關(guān)系 表1 優(yōu)選的Otsu判斷閾值為105。
      根據(jù)灰度直方圖估計文字的半色調(diào)點密度,將半色調(diào)文檔圖像按照文字的顏色深度分為深色文字和淺色文字兩類。發(fā)明人通過大量實驗驗證,發(fā)現(xiàn)在0-255量值范圍下,灰度判斷值優(yōu)選20,能夠滿足大部分半色調(diào)文檔圖像的分類。高斯平滑濾波后半色調(diào)文檔圖像的灰度直方圖如圖2所示,可以看到其中有兩個顯著的峰值灰度值較小的峰值對應于圖像中的文字部分(即文字峰值),而灰度值較大的峰值對應于圖像的背景部分(背景峰值)。通過計算高斯平滑濾波后半色調(diào)文檔圖像的文字峰值在、灰度級別上的位置,可以得到半色調(diào)圖像的文字的大致顏色深度。
      綜上所述,對于一個具體的半色調(diào)文檔圖像,背景顏色的深淺根據(jù)Otsu閾值來判斷,若Otsu閾值大于105,則認為背景為淺色背景,否則為深色背景;文字顏色的深度根據(jù)灰度直方圖中文字峰值的位置來判斷,若該峰值所對應的灰度值小于20,則認為文字為深色,否則認為文字為淺色。綜合兩個分類方法,將半色調(diào)文檔圖像分為四類淺色背景和深色文字、淺色背景和淺色文字、深色背景和深色文字、深色背景和淺色文字。
      (2)、去除半色調(diào)文檔圖像的背景噪聲對于淺色背景和深色文字的半色調(diào)文檔圖像,采用基于連通區(qū)域標記的方法去除背景噪聲;對于淺色背景和淺色文字的半色調(diào)文檔圖像,采用基于高斯平滑濾波的方法去除背景噪聲;對于深色背景和深色文字的半色調(diào)文檔圖像、深色背景和淺色文字的半色調(diào)文檔圖像,采用基于維納濾波的方法去除背景噪聲。
      參照圖3,對于淺色背景和深色文字的半色調(diào)文檔圖像,采用基于連通區(qū)域標記的方法去除背景噪聲。首先對半色調(diào)文檔圖進行反色處理,并標記連通區(qū)域,然后依次提取并計所有連通區(qū)域的面積。若連通區(qū)域面積大于規(guī)定的閾值(設(shè)為3個像素),則保留該連通區(qū)域,否則去除該連通區(qū)域,最后再對圖像進行反色,即去除了淺色背景和深色文字的半色調(diào)文檔圖像背景噪聲。
      參照圖4,對于淺色背景和淺色文字的半色調(diào)文檔圖像,采用基于高斯平滑濾波的方法去除背景噪聲。首先對半色調(diào)文檔圖像進行5×5(像素)模板的高斯平滑濾波,然后計算Otsu閾值,采用Otsu方法進行圖像二值化,即去除了淺色背景和淺色文字的半色調(diào)文檔圖像的背景噪聲。
      參照圖5,對于深色背景和深色文字的半色調(diào)文檔圖像、深色背景和淺色文字的半色調(diào)文檔圖像,采用基于維納濾波的方法去除背景噪聲。首先對半色調(diào)文檔圖像進行3×3(像素)模板的高斯平滑濾波,然后將該高斯平滑后的圖像作為參考圖,對原來的半色調(diào)文檔圖像進行維納濾波,接著對維納濾波后的圖像再次進行3×3(像素)模板的高斯平滑濾波,最后計算Otsu閾值,通過Otsu方法進行圖像二值化,即去除了深色背景和深色文字的半色調(diào)文檔圖像、深色背景和淺色文字的半色調(diào)文檔圖像的背景噪聲。
      經(jīng)過大量實驗發(fā)現(xiàn)對于深色背景和深色文字,深色背景和淺色文字的半色調(diào)圖像,用基于維納濾波的方法效果較好,對于淺色背景和深色文字的半色調(diào)圖像,用基于連通區(qū)域標記的方法比較合適,而對于淺色背景和淺色文字的半色調(diào)圖像,用基于高斯平滑濾波的方法比較合適。
      參照圖6、7,根據(jù)半色調(diào)文檔圖像背景以及文字的顏色深度,自適應的選擇不同的背景去噪方法,可以看到,半色調(diào)背景噪聲基本上被除掉。
      (3)、觀察去除背景噪聲的半色調(diào)文檔圖像,構(gòu)造文字的毛刺去除模板和缺陷修復模板,通過模板匹配去除文字毛刺和修復文字缺陷。
      a、經(jīng)過仔細觀察和大量的實驗驗證,采用以下優(yōu)選的文字的毛刺去除模板進行模板匹配去除文字毛刺,具有良好的去噪效果,其優(yōu)選的文字的毛刺去除模板用表格表示,包括 其中,單元格代表像素,單元格之間的位置關(guān)系代表像素間的位置關(guān)系;單元格中,1表示文字像素,0表示背景像素,①表示需要去除的文字像素,即需要把該像素值由1變?yōu)?;空單元格表示像素值為0或1,即既可為0也可為1,換言之,可以是文字像素,也可以為背景像素。
      b、經(jīng)過仔細觀察和大量的實驗驗證,采用以下優(yōu)選的文字的缺陷修復模板進行模板匹配修復文字缺陷,具有良好的去噪效果,其優(yōu)選的文字的缺陷修復模板用表格表示,包括以下表格
      其中,單元格代表像素,單元格之間的位置關(guān)系代表像素間的位置關(guān)系;單元格中,1表示文字像素,0表示背景像素,

      表示需要修復的文字像素,即需要把該像素值由0變?yōu)?;空單元格表示像素值為0或1,即既可為0也可為1,換言之,可以是文字像素,也可以為背景像素。
      參照圖8、圖9,對于去除背景噪聲的半色調(diào)文檔圖像,文字周圍存在很多毛刺,而且該圖中的文字本身的筆畫也比較細(最細的筆畫寬度為2個像素),用毛刺去除模板對其進行處理,得到圖6中的去除掉了毛刺的文字,而同時,文字的細節(jié)也盡可能的保留了下來。
      參照圖10(a)、10(b),對于去除背景噪聲的半色調(diào)文檔圖像,文字周圍不僅僅存在很多毛刺,還存在很多殘缺點,用毛刺去除模板以及缺陷修復模板對其進行處理,得到去除毛刺并補全殘缺區(qū)域的文字,文字筆畫變得光順。
      權(quán)利要求
      1、一種半色調(diào)文檔圖像的噪聲處理方法,其特征在于,包括以下步驟
      首先,將半色調(diào)文檔圖像分為四類淺色背景和深色文字、淺色背景和淺色文字、深色背景和深色文字、深色背景和淺色文字;
      其次,去除半色調(diào)文檔圖像的背景噪聲對于淺色背景和深色文字的半色調(diào)文檔圖像,采用基于連通區(qū)域標記的方法去除背景噪聲;對于淺色背景和淺色文字的半色調(diào)文檔圖像,采用基于高斯平滑濾波的方法去除背景噪聲;對于深色背景和深色文字的半色調(diào)文檔圖像、深色背景和淺色文字的半色調(diào)文檔圖像,采用基于維納濾波的方法去除背景噪聲;
      最后,觀察去除背景噪聲的半色調(diào)文檔圖像,構(gòu)造文字的毛刺去除模板和缺陷修復模板,通過模板匹配去除文字毛刺和修復文字缺陷。
      2、根據(jù)權(quán)利要求1所述的一種半色調(diào)文檔圖像的噪聲處理方法,其特征在于,所述將半色調(diào)文檔圖像分為四類,具體為對半色調(diào)文檔圖像進行高斯平滑濾波,計算高斯平滑濾波后半色調(diào)文檔圖像的Otsu閾值及灰度直方圖,根據(jù)Otsu閾值估計背景的半色調(diào)點密度,根據(jù)灰度直方圖估計文字的半色調(diào)點密度,并根據(jù)背景的半色調(diào)點密度和文字的半色調(diào)點密度,將半色調(diào)文檔圖像分為四類,即淺色背景和深色文字、淺色背景和淺色文字、深色背景和深色文字、深色背景和淺色文字。
      3、根據(jù)權(quán)利要求1所述的一種半色調(diào)文檔圖像的噪聲處理方法,其特征在于,所述文字的毛刺去除模板用表格表示,包括
      其中,單元格代表像素,單元格之間的位置關(guān)系代表像素間的位置關(guān)系;單元格中,1表示文字像素,0表示背景像素,①表示需要去除的文字像素,即需要把該像素值由1變?yōu)?;空單元格表示像素值為0或1。
      4、根據(jù)權(quán)利要求1所述的一種半色調(diào)文檔圖像的噪聲處理方法,其特征在于,所述缺陷修復模板用表格表示,包括以下表格
      其中,單元格代表像素,單元格之間的位置關(guān)系代表像素間的位置關(guān)系;單元格中,1表示文字像素,0表示背景像素,
      表示需要修復的文字像素,即需要把該像素值由0變?yōu)?;空單元格表示像素值為0或1。
      全文摘要
      本發(fā)明涉及計算機視覺和圖形、圖像處理領(lǐng)域,公開了一種半色調(diào)文檔圖像的噪聲處理方法。它包括以下步驟首先,將半色調(diào)文檔圖像分為四類;其次,對于淺色背景和深色文字的半色調(diào)文檔圖像,采用基于連通區(qū)域標記的方法去除背景噪聲;對于淺色背景和淺色文字的半色調(diào)文檔圖像,采用基于高斯平滑濾波的方法去除背景噪聲;對于深色背景和深色文字的半色調(diào)文檔圖像、深色背景和淺色文字的半色調(diào)文檔圖像,采用基于維納濾波的方法去除背景噪聲;最后,觀察去除背景噪聲的半色調(diào)文檔圖像,構(gòu)造文字的毛刺去除模板和缺陷修復模板,通過模板匹配去除文字毛刺和修復文字缺陷。
      文檔編號G06K9/40GK101567049SQ200910022698
      公開日2009年10月28日 申請日期2009年5月26日 優(yōu)先權(quán)日2009年5月26日
      發(fā)明者宋永紅, 肖桂林, 孟高峰, 張元林, 雷冬冬 申請人:西安交通大學
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1