一種基于條件隨機(jī)場的古籍掃描圖像背面滲透盲去除方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及一種文本圖像的處理方法,更具體的說是一種基于條件隨機(jī)場的古籍 掃描圖像背面滲透盲去除方法。
【背景技術(shù)】
[0002] 由于古籍文本稀少珍貴,現(xiàn)代的保護(hù)方法往往是把該些古籍?dāng)?shù)字化,W掃描圖像 的方式供研究人員翻閱。由于古籍紙張質(zhì)量或者長時(shí)間保存的問題,許多雙面書寫或印刷 的古籍都發(fā)生了背面滲透的現(xiàn)象,即墨水從紙張的另一面滲出的另一面的現(xiàn)象。該種現(xiàn)象 會(huì)使古籍文本的內(nèi)容難W閱讀,同時(shí),也影響了某些珍貴手稿的視覺美感。
[0003] 為了解決上述問題,現(xiàn)已提出很多背面滲透移除的方法。目前來說,該些方法大 致可分為兩類;盲去除方法和非盲去除方法。非盲去除方法需要一頁古籍準(zhǔn)確對齊的正反 兩面的掃描圖像。由于自動(dòng)配準(zhǔn)正反兩面的圖像依然存在諸多難點(diǎn),因此該類工作通常需 要大量人工來完成。與之相對,盲去除方法只需要紙張的單面圖像,避免了圖像配準(zhǔn)問題。 A.Tonazzini等人提出使用盲源分離技術(shù),將輸入圖像看作前景部分、背面滲透部分和背景 部分的混合信號,并采用獨(dú)立成分分析算法計(jì)算試圖將該=部分恢復(fù)出來。因?yàn)樵摲N方法 需要不同的傳感器捜集到的相同對象的信號,所W此方法需要彩色掃描圖像。在此之外,同 一作者又提出利用馬爾科夫隨機(jī)場和EM算法來解決盲源分離問題。有別于信號分離的想 法,C.Wolf將背面滲透去除看作圖像分割問題,提出基于雙隱藏層的馬爾科夫隨機(jī)場和單 一觀測場方法。該方法通過最大流算法交替更新兩個(gè)馬爾可夫隨機(jī)場的隱含值,直至收斂 到最終的分割結(jié)果。但是該類算法計(jì)算消耗過高,很難滿足一些實(shí)際應(yīng)用要求。
【發(fā)明內(nèi)容】
[0004] 為了解決古籍掃描圖像背面滲透盲去除存在的上述技術(shù)問題,本發(fā)明提供一種基 于條件隨機(jī)場的古籍掃描圖像盲去除方法。本發(fā)明有效的去除文本掃描圖像中的背面滲透 部分,同時(shí)又較好的保證文本前景部分的完整性,提高了文本圖像的可讀性。
[0005] 本發(fā)明解決上述問題的技術(shù)方案包括W下步驟:
[0006] 1)將已知類別標(biāo)簽的掃描圖像分為前景部分、背面滲透部分、背景部分,并建立圖 像前景部分、背面滲透部分、背景部分的條件概率分布模型,得到前景、背面滲透、背景=部 分的逼近函數(shù);
[0007] 2)根據(jù)步驟1)得到的逼近函數(shù),用未知類別標(biāo)簽的文本圖像作為輸入,采用基于 K-means聚類算法得到未知類別標(biāo)簽的文本圖像的前景部分、背面滲透部分、背景部分,并 計(jì)算圖像前景部分、背面滲透部分、背景部分的灰度平均值和方差;
[000引如對輸入圖像建立條件隨機(jī)場模型,并根據(jù)步驟。得到的圖像前景部分、背面滲 透部分、背景部分的灰度平均值和方差對圖像進(jìn)行細(xì)分類,得到背面滲透部分;
[0009] 4)修復(fù)已分類的圖像,去除背面滲透部分,得到最終的無背面滲透部分的圖像。
[0010] 本發(fā)明的技術(shù)效果在于;本發(fā)明將古籍文本圖像分成=個(gè)不同的組成部分,并建 立條件概率分布模型;利用K-means算法初始分類之后,估計(jì)出S種組份的參數(shù);在此基礎(chǔ) 上,建立輸入圖像的條件隨機(jī)場,通過信念傳播算法確定每個(gè)像素對應(yīng)的類別標(biāo)簽;最后采 用隨機(jī)填充算法修復(fù)圖像中的背面滲透區(qū)域,去除圖像中的背面滲透盲。本發(fā)明能有效去 除圖像中的背面滲透部分,較好的保存前景部分,大大提高了圖像的可讀性。
【附圖說明】
[0011] 圖1為本發(fā)明的處理流程圖;
[0012] 圖2為不同分類方法的文本掃描圖像分類結(jié)果比較;左起第一列為原文本圖像, 第二列為K-means聚類算法的結(jié)果,第S列為本發(fā)明基于條件隨機(jī)場方法的結(jié)果。
[0013] 圖3為不同分類方法的前景像素分類準(zhǔn)確率和召回率比較;
[0014] 圖4為不同背面滲透移除方法的文本掃描圖像結(jié)果比較;
[0015] 圖4中左起第一列為原文本圖像,第二列為K-means聚類結(jié)合隨機(jī)填充算法的結(jié) 果,第=列為本發(fā)明的結(jié)果。
【具體實(shí)施方式】
[0016] 圖1為本發(fā)明的處理流程圖。如圖所示,本發(fā)明先建立文本圖像的隨機(jī)概率分布 模型,將圖像分為前景部分,背面滲透部分W及背景部分=個(gè)組成成分,得到=者的灰度直 方圖的逼近函數(shù),并采用K-means算法得到S者的參數(shù)估計(jì),然后建立條件隨機(jī)場模型對 輸入圖像進(jìn)行細(xì)分類,利用置信傳播算法識別背面滲透部分,最后通過隨機(jī)填充算法修復(fù) 圖像,得到最終的無背面滲透部分的文本掃描圖像。
[0017]輸入為帶有背面滲透的灰度古籍圖像,輸出為無背面滲透的灰度古籍圖像。本發(fā) 明的詳細(xì)步驟如下:
[0018] 1.將已知類別標(biāo)簽的掃描圖像分為前景部分、背面滲透部分、背景部分,并建立圖 像=種成分的條件概率分布模型。整幅圖像、前景部分、背面滲透部分和背景部分的灰度直 方圖分別為H,Hfg,Hbt,Hbg。則每種成分條件概率分布如公式(1)、(2)、(3)所示。
【主權(quán)項(xiàng)】
1. 一種基于條件隨機(jī)場的古籍掃描圖像背面滲透盲去除方法,包括以下步驟: 1) 將已知類別標(biāo)簽的掃描圖像分為前景部分、背面滲透部分、背景部分,并建立圖像前 景部分、背面滲透部分、背景部分的條件概率分布模型,得到前景、背面滲透、背景三部分的 逼近函數(shù); 2) 根據(jù)步驟1)得到的逼近函數(shù),用未知類別標(biāo)簽的文本圖像作為輸入,采用基于 K-means聚類算法得到未知類別標(biāo)簽的文本圖像的前景部分、背面滲透部分、背景部分,并 計(jì)算圖像前景部分、背面滲透部分、背景部分的灰度平均值和方差; 3) 對輸入圖像建立條件隨機(jī)場模型,并根據(jù)步驟2)得到的圖像前景部分、背面滲透部 分、背景部分的灰度平均值和方差對圖像進(jìn)行細(xì)分類,得到背面滲透部分; 4) 修復(fù)已分類的圖像,去除背面滲透部分,得到最終的無背面滲透部分的圖像。
2. 根據(jù)權(quán)利要求1所述的基于條件隨機(jī)場的古籍掃描圖像背面滲透盲去除方法,其特 征在于,所述的步驟1)的具體步驟為:采用邏輯函數(shù)來近似前景和背景條件概率分布,其 概率分布如下:
其中s是類別標(biāo)簽,d是灰度值,(U(l,U2)為中心位置因子,(〇 m。2)為形狀因子; 采用高斯函數(shù)近似背面滲透部分的條件概率分布如下:
其中P為幅度因子,^和〇 i分別為中心位置因子和形狀因子。
3. 根據(jù)權(quán)利要求1所述的基于條件隨機(jī)場的古籍掃描圖像背面滲透盲去除方法,其特 征在于,所述的步驟2)的具體步驟為:對于未知類別標(biāo)簽的輸入圖像,將出現(xiàn)次數(shù)最多的 灰度值作為背景組份的平均灰度C 2,并估計(jì)出背景組份的方差如下:
其中N是輸入圖像的像素總數(shù),I {f}為標(biāo)記函數(shù),當(dāng)表達(dá)式f>0時(shí),函數(shù)值為1,否則為 〇, Ij和I k分別表示圖像I中的第j和k個(gè)像素。 根據(jù)估計(jì)出的背景組份的平均灰度和方法,從整個(gè)輸入圖像的直方圖中,減去背景組 份,然后采用大津法根據(jù)剩余的直方圖確定區(qū)分前景組份和背景滲透組份的灰度閾值,并 根據(jù)閾值劃分的結(jié)果來計(jì)算前景組份和背面滲透組份的灰度平均值。
4. 根據(jù)權(quán)利要求1所述的基于條件隨機(jī)場的古籍掃描圖像背面滲透盲去除方法,其特 征在于,所述的步驟3)的具體步驟為:條件隨機(jī)場模型包括一個(gè)隱藏的馬爾科夫隨機(jī)場和 一個(gè)觀察場,觀察節(jié)點(diǎn)的值即為像素灰度值,隱藏的馬爾科夫節(jié)點(diǎn)值為類別標(biāo)簽,利用置信 傳播算法來逼近最優(yōu)解,得到背面滲透區(qū)域。
5. 根據(jù)權(quán)利要求1所述的基于條件隨機(jī)場的古籍掃描圖像背面滲透盲去除方法,其特 征在于,所述的步驟4)的具體步驟為:采用隨機(jī)填充算法,在背面滲透像素鄰域內(nèi)隨機(jī)選 擇一個(gè)背景像素灰度值,取代原灰度值,去除背面滲透區(qū)域。
【專利摘要】本發(fā)明公開了一種基于條件隨機(jī)場的古籍文本圖像背面滲透盲去除方法。它包括以下步驟:先建立文本圖像的隨機(jī)概率分布模型,將圖像分為前景部分,背面滲透部分以及背景部分三個(gè)組成成分,得到三者的灰度直方圖的逼近函數(shù),并采用K-means算法得到三者的參數(shù)估計(jì),然后建立條件隨機(jī)場模型對輸入圖像進(jìn)行細(xì)分類,利用置信傳播算法識別背面滲透部分,最后通過隨機(jī)填充算法修復(fù)圖像,得到最終的無背面滲透部分的文本掃描圖像。本發(fā)明采用條件隨機(jī)場與隨即填充修復(fù)算法相結(jié)合的方法,能夠完善的保留文本圖像的前景部分,并有效地移除背面滲透部分,大大改善文本掃描圖像的視覺效果,解決了歷史文本掃描圖像的顯示和打印等問題,具有很高的實(shí)際應(yīng)用價(jià)值。
【IPC分類】G06T5-00
【公開號】CN104867114
【申請?zhí)枴緾N201510168613
【發(fā)明人】李樹濤, 孫斌, 孫俊
【申請人】湖南大學(xué), 富士通株式會(huì)社
【公開日】2015年8月26日
【申請日】2015年4月13日