一種基于emd的智能文檔圖像塊檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及文檔圖像檢測處理技術(shù),尤其設(shè)及一種基于EMD的智能文檔圖像塊檢 測方法,適用于退化文檔圖像的自適應(yīng)闊值分割。
【背景技術(shù)】
[0002] 技術(shù)詞解釋
[0003] EMD;經(jīng)驗?zāi)B(tài)分解,英文全稱為 Empirical Mode Decomposition。
[0004] 對于從文檔圖像的背景中區(qū)分文字,即將文檔圖像的灰度級圖像轉(zhuǎn)換為二值圖 像,其有巨大的應(yīng)用價值,而在眾多應(yīng)用中,其主要應(yīng)用在光學(xué)字符識別、自動銀行支票處 理、簽名驗證等方面。目前,已提出了許多算法來實現(xiàn)從文檔圖像的背景中區(qū)分文字,但是 由于成像環(huán)境限制,文檔圖像常常被復(fù)雜的背景、非均勻的強(qiáng)度、陰影等該類因素退化,因 此,使得分離文檔圖像中的文字,變得非常困難。
[0005] 而為了解決該些問題,已有許多二值化算法被提出,該些算法主要?dú)w為兩類,其包 括;1、全局闊值分割算法,如Tsai, Johannsan, Kapur等算法,然而,該些方法并不適用于 包含各種背景圖案或背景不均勻的源圖像;2、局部闊值分割算法,如Niblack,Sauvla,B. Goto等算法,雖然其可適用于包含各種背景圖案或背景不均勻的源圖像,但是,在數(shù)據(jù)計算 處理時,針對每個像素都必須估計其闊值,因此,該些方法均需耗費(fèi)過長的處理時間,計算 過程復(fù)雜冗長。而對于所述的文檔圖像二值化,其通常是被廣泛應(yīng)用于便攜式設(shè)備中,但便 攜式設(shè)備的存儲空間和計算能力均有限,因此,上述那些計算復(fù)雜度高、耗時長的局部闊值 分割算法均不能滿足將文檔圖像二值化應(yīng)用于便攜式設(shè)備的要求。
【發(fā)明內(nèi)容】
[0006] 為了解決上述技術(shù)問題,本發(fā)明的目的是提供一種計算簡單、速度快的基于經(jīng)驗 模態(tài)分解的智能文檔圖像塊檢測方法。
[0007] 本發(fā)明所采用的技術(shù)方案是:一種基于EMD的智能文檔圖像塊檢測方法,該方法 包括:
[0008] A、對文檔圖像進(jìn)行灰度變換處理,從而獲得文檔灰度圖像;
[0009] B、計算所述文檔灰度圖像的均值與方差,W及計算所述文檔灰度圖像的水平投影 直方圖;
[0010] C、對計算得出的水平投影直方圖進(jìn)行EMD分解,從而得到多個本征模函數(shù)分量W 及殘差,將得到的最后一個本征模函數(shù)分量和殘差進(jìn)行求和后,將求和結(jié)果作為所述水平 投影直方圖的趨勢線;
[0011] D、計算趨勢線與水平投影直方圖之間交點(diǎn)位置的橫坐標(biāo),然后根據(jù)計算出的多個 橫坐標(biāo),從而計算相鄰交點(diǎn)位置的橫坐標(biāo)之間的間隔寬度;
[0012] E、根據(jù)計算出的間隔寬度,從而進(jìn)行圖像子塊的分割,然后對分割出的多個圖像 子塊進(jìn)行闊值處理后,計算每個圖像子塊的均值與方差;
[0013] F、根據(jù)文檔灰度圖像的均值和方差w及圖像子塊的均值和方差,從而判斷該圖像 子塊是否為背景,然后根據(jù)判斷的結(jié)果進(jìn)行相應(yīng)的處理。
[0014] 進(jìn)一步,對于步驟B中所述計算所述文檔灰度圖像的水平投影直方圖,其所采用 的公式如下所示:
[0015]
[0016] 其中,H(y)表示文檔灰度圖像的水平投影直方圖,f(x,y)表示為文檔灰度圖像的 像素矩陣,M表示為文檔灰度圖像的像素矩陣的行數(shù)。
[0017] 進(jìn)一步,所述步驟C具體包括:
[0018] 對計算得出的水平投影直方圖進(jìn)行EMD分解,分解后所得出的結(jié)果如下公式所 示:
[0019]
[0020] 其中,H表示為文檔灰度圖像的水平投影直方圖,Ci表示為第i個本征模函數(shù)分 量,Tn表不為殘差;
[0021] 將得到的最后一個本征模函數(shù)分量和殘差進(jìn)行求和后,將求和結(jié)果作為所述水平 投影直方圖的趨勢線,所述求和所采用的公式如下所示:
[0022] T =叫+Cn
[002引其中,T表示為趨勢線,句為第N個本征模函數(shù)分量,rW為殘差。
[0024] 進(jìn)一步,所述步驟D包括:
[00巧]D1、計算趨勢線與水平投影直方圖之間交點(diǎn)位置的橫坐標(biāo);
[0026] D2、設(shè)置一數(shù)組,將計算得出的所有橫坐標(biāo)依序存儲于該數(shù)組中,并在該數(shù)組中插 入初始位置和終點(diǎn)位置;
[0027] D3、根據(jù)該數(shù)組,從而計算相鄰交點(diǎn)位置的橫坐標(biāo)之間的間隔寬度。
[0028] 進(jìn)一步,所述步驟E包括:
[0029] E1、將計算出的間隔寬度作為圖像子塊分割窗口的高度和寬度,然后,根據(jù)該圖像 子塊分割窗口進(jìn)行圖像子塊的分割,分割后所得到的圖像子塊的高度和寬度均為上述計算 出的間隔寬度;
[0030] E2、對分割出的多個圖像子塊進(jìn)行闊值處理后,計算每個圖像子塊的均值與方差。
[0031] 進(jìn)一步,所述步驟F具體為:
[0032] 根據(jù)文檔灰度圖像的均值和方差W及圖像子塊的均值和方差,從而判斷該圖像子 塊是否為背景;
[0033] 當(dāng)該圖像子塊的方差小于文檔灰度圖像的方差,且該圖像子塊的均值大于文檔灰 度圖像的均值時,則判斷該圖像子塊為背景;
[0034] 當(dāng)該圖像子塊的方差大于等于文檔灰度圖像的方差,且該圖像子塊的均值小于等 于文檔灰度圖像的均值時,則采用自適應(yīng)闊值算法對該圖像子塊進(jìn)行二值化處理。
[0035] 進(jìn)一步,所述自適應(yīng)闊值算法為0TSU自適應(yīng)闊值算法。
[0036] 本發(fā)明的有益效果是:本發(fā)明的檢測方法不僅能夠適用于被復(fù)雜成像環(huán)境退化的 文檔圖像,而且該檢測方法計算量小,可適用于便攜式設(shè)備。
【附圖說明】
[0037] 下面結(jié)合附圖對本發(fā)明的【具體實施方式】作進(jìn)一步說明:
[0038] 圖1是本發(fā)明一種基于EMD的智能文檔圖像塊檢測方法的步驟流程圖;
[0039] 圖2是本發(fā)明一種基于EMD的智能文檔圖像塊檢測方法的一具體實施例步驟流程 圖;
[0040] 圖3是水平投影直方圖與趨勢線的示意圖。
【具體實施方式】
[00川如圖1所示,一種基于EMD的智能文檔圖像塊檢測方法,該方法包括:
[0042] A、對文檔圖像進(jìn)行灰度變換處理,從而獲得文檔灰度圖像;
[0043] B、計算所述文檔灰度圖像的均值與方差,W及計算所述文檔灰度圖像的水平投影 直方圖;
[0044] C、對計算得出的水平投影直方圖進(jìn)行EMD分解,從而得到多個本征模函數(shù)分量W 及殘差,將得到的最后一個本征模函數(shù)分量和殘差進(jìn)行求和后,將求和結(jié)果作為所述水平 投影直方圖的趨勢線;
[0045] D、計算趨勢線與水平投影直方圖之間交點(diǎn)位置的橫坐標(biāo),然后根據(jù)計算出的多個 橫坐標(biāo),從而計算相鄰交點(diǎn)位置的橫坐標(biāo)之間的間隔寬度;
[0046] E、根據(jù)計算出的間隔寬度,從而進(jìn)行圖像子塊的分割,然后對分割出的多個圖像 子塊進(jìn)行闊值處理后,計算每個圖像子塊的均值與方差;
[0047] F、根據(jù)文檔灰度圖像的均值和方差W及圖像子塊的均值和方差,從而判斷該圖像 子塊是否為背景,然后根據(jù)判斷的結(jié)果進(jìn)行相應(yīng)的處理。
[0048] 進(jìn)一步作為優(yōu)選的實施方式,對于步驟B中所述計算所述文檔灰度圖像的水平投 影直方圖,其所采用的公式如下所示:
[0049]
[0050] 其中,H(y)表示文檔灰度圖像的水平投影直方圖,f(x,y)表示為文檔灰度圖像的 像素矩陣,M表示為文檔灰度圖像的像素矩陣的行數(shù)。
[0051] 進(jìn)一步作為優(yōu)選的實施方式,所述步驟C具體包括:
[0052] 對計算得出的水平投影直方圖進(jìn)行EMD分解,分解后所得出的結(jié)果如下公式所 示:
[0053]
[0054] 其中,H表示為文檔灰度圖像的水平投影直方圖,Ci表示為第i個本征模函數(shù)分 量,Tn表不為殘差;
[0055] 將得到的最后一個本征模函數(shù)分量和殘差進(jìn)行求和后,將求和結(jié)果作為所述水平 投影直方圖的趨勢線,所述求和所采用的公式如下所示:
[0056] T =Tn+Cn
[0057] 其中,T表示為趨勢線,cw為第N個本征模函數(shù)分量,r w為殘差。
[0058] 進(jìn)一步作為優(yōu)選的實施方式,所述步驟D包括:
[0059] D1、計算趨勢線與水平投影直方圖之間交點(diǎn)位置的橫坐標(biāo);
[0060] D2、設(shè)置一數(shù)組,將計算得出的所有橫坐標(biāo)依序存儲于該數(shù)組中,并在該數(shù)組中插 入初始位置和終點(diǎn)位置;
[0061] D3、根據(jù)該數(shù)組,從而計算相鄰交點(diǎn)位置的橫坐標(biāo)之間的間隔寬度。
[0062] 進(jìn)一步作為優(yōu)選的實施方式,所述步驟E包括:
[0063] E1、將計算出的間隔寬度作為圖像子塊分割窗口的高度和寬度,然后,根據(jù)該圖像 子塊分割窗口進(jìn)行圖像子塊的分割,分割后所得到的圖像子塊的高度和寬度均為上述計算 出的間隔寬度;
[0064] E2、對分割出的多個圖像子塊進(jìn)行闊值處理后,計算每個圖像子塊的均值與方差。
[0065] 進(jìn)一步作為優(yōu)選的實施方式,所述步驟F具體為:
[0066] 根據(jù)文檔灰度圖像的均值和方差W及圖像子塊的均值和方差,從而判斷該圖像子 塊是否為背景;
[0067] 當(dāng)該圖像子塊的方差小于文檔灰度圖像的方差,且該圖像子塊的均值大于文檔灰 度圖像的均值時,則判斷該圖像子塊為背景;
[0068] 當(dāng)該圖像子塊的方差大于等于文檔灰度圖像的方差,且該圖像子塊的均值小于等 于文檔灰度圖像的均值時,則采用自適應(yīng)闊值算法對該圖像子塊進(jìn)行二值化處理。然后按 順序存儲圖像子塊的二值化結(jié)果作為整幅圖像,最后整體顯示闊值分割后的結(jié)果。
[0069] 進(jìn)一步作為優(yōu)選的實施方式,所述自適應(yīng)闊值算法為0TSU自適應(yīng)闊值算法。
[0070] 本發(fā)明方法一具體實施例
[0071] 如圖2所示,一種基于EMD的智能文檔圖像塊檢測方法,其具體包括: