一種在數(shù)字文本圖像中消除熒光筆標(biāo)記的方法
【專利摘要】本發(fā)明涉及一種在數(shù)字文本圖像中消除熒光筆標(biāo)記的方法,通過比較分析黑白文字電子文檔的圖像與常用熒光筆標(biāo)記筆跡的RGB顏色模型的三原色成分,選擇像素三個(gè)顏色分量值中的最大分量值作為該像素的灰度值輸出,將熒光筆標(biāo)記過的灰度文本圖像文件轉(zhuǎn)換成消除熒光標(biāo)記的文本圖像文件,得到去除熒光筆記的黑白文本圖像文件,從而快速有效地消除了文檔中的熒光筆標(biāo)記。
【專利說明】一種在數(shù)字文本圖像中消除熒光筆標(biāo)記的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種在數(shù)字文本圖像中消除熒光筆標(biāo)記的方法。
【背景技術(shù)】
[0002]人們?cè)陂喿x紙質(zhì)文本有時(shí)會(huì)用熒光筆涂畫部分文本,以突顯自己認(rèn)為是重要的文 本內(nèi)容,方便以后復(fù)習(xí)或查閱。被熒光筆涂畫的部分文本內(nèi)容對(duì)涂畫者是重要的信息,但是 對(duì)別的閱讀者可能并不重要,突顯的部分文本可能影響別人的正常閱讀,或涂畫者自己也 可能不想留下閱讀痕跡。因此,有時(shí)需要去除文本上留下的熒光突顯痕跡,進(jìn)行文檔修復(fù)。
[0003]消除紙質(zhì)文本上的熒光筆標(biāo)記需要一定的化學(xué)物理過程,要達(dá)到既能去除熒光筆 標(biāo)記,又能留下被熒光筆標(biāo)記覆蓋或突顯的文字,這種文檔恢復(fù)方法并不容易做到。隨著計(jì) 算機(jī)及打印和掃描設(shè)備、智能手機(jī)和數(shù)碼照相的普及,紙質(zhì)文本的數(shù)字化工作也都已經(jīng)大 眾化,比如掃描或拍照文本。數(shù)字化的文檔修復(fù)不再需要化學(xué)物理材料,修復(fù)后的文檔也可 以重新輸出去除熒光筆標(biāo)記痕跡的紙質(zhì)文本。但是直接用彩色掃描儀或彩色相機(jī)拍照,或 用灰度圖像掃描儀掃描被彩色熒光筆標(biāo)記過的文本,熒光筆的標(biāo)記痕跡依然會(huì)存在。經(jīng)過 熒光筆標(biāo)記的文檔一旦被數(shù)字化,可以有多種算法實(shí)現(xiàn)彩色文本圖像的灰度化或脫色,但 灰度化不等于可以消除熒光筆標(biāo)記。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于提供一種在數(shù)字文本圖像中消除熒光筆標(biāo)記的方法,不僅能將 數(shù)字彩色文本圖像灰度化或脫色,可以干凈利索地消除熒光筆標(biāo)記,快速有效地恢復(fù)黑白 文本原貌。
[0005]本發(fā)明一種在數(shù)字文本圖像中消除熒光筆標(biāo)記的方法,具體包括步驟如下:
[0006]步驟1、將帶有熒光筆標(biāo)記的文檔用彩色掃描儀或照相機(jī)進(jìn)行數(shù)字化處理,得到數(shù) 字化彩色圖像文件;
[0007]步驟2、將該數(shù)字化彩色圖像文件用Matlab軟件打開,可看到RGB顏色空間的三維 矩陣f(i,j,k)其中i是矩陣的行,j是矩陣的列,k是矩陣的層,表示顏色的第k分量,其 中k = 1、2、3,分別存放紅R、綠G、藍(lán)B波段的顏色分量值;
[0008]步驟3、針對(duì)所述數(shù)字化彩色圖像中的每個(gè)像素,選擇該像素三個(gè)顏色分量值中的 最大分量值作為該像素灰度值輸出,令像素灰度值g(i,j) = max(f(i, j,l),f(i,j,2), f(i,j,3)),遍歷整個(gè)數(shù)字化彩色圖像的所有像素,將熒光筆標(biāo)記過的灰度文本圖像文件 f(i,j,k)轉(zhuǎn)換成消除熒光標(biāo)記的文本圖像文件g(i,j),其中i是矩陣的行,j是矩陣的列;
[0009]步驟4、得到去除熒光筆記的黑白文本圖像文件g(i,j)。
[0010]本發(fā)明一種在數(shù)字文本圖像中消除熒光筆標(biāo)記的方法,通過比較分析黑白文字電 子文檔的圖像與常用熒光筆標(biāo)記筆跡的RGB顏色模型的三原色成分,選擇像素三個(gè)顏色分 量值中的最大分量值作為該像素的灰度值輸出,將熒光筆標(biāo)記過的灰度文本圖像文件轉(zhuǎn)換 成消除熒光標(biāo)記的文本圖像文件,得到去除熒光筆記的黑白文本圖像文件,從而快速有效地消除了文檔中的熒光筆標(biāo)記。
【具體實(shí)施方式】
[0011]本發(fā)明一種在數(shù)字文本圖像中消除熒光筆標(biāo)記的方法,在帶有熒光筆標(biāo)記的文檔 中消除熒光筆標(biāo)記的具體步驟如下:
[0012]步驟1、將帶有熒光筆標(biāo)記的文檔用彩色掃描儀或照相機(jī)進(jìn)行數(shù)字化處理,得到數(shù) 字化彩色圖像文件;
[0013]步驟2、將該數(shù)字化彩色圖像文件用Matlab軟件打開,可看到RGB顏色空間的三維 矩陣f(i,j,k)其中i是矩陣的行,j是矩陣的列,k是矩陣的層,表示顏色的第k分量,其 中k = 1、2、3,分別存放紅R、綠G、藍(lán)B波段的顏色分量值,比如f(l,2,3)表示該數(shù)字化彩 色圖像的第一行第二列像素的第三個(gè)波段(藍(lán)色分量)的值;
[0014]步驟3、針對(duì)所述數(shù)字化彩色圖像中的每個(gè)像素,選擇該像素三個(gè)顏色分量值中的 最大分量值作為該像素灰度值輸出,令像素灰度值g(i,j) = max(f(i, j,l),f(i,j,2), f(i,j,3)),遍歷整個(gè)數(shù)字化彩色圖像的所有像素,將熒光筆標(biāo)記過的灰度文本圖像文件 f(i,j,k)轉(zhuǎn)換成消除熒光標(biāo)記的文本圖像文件g(i,j),其中i是矩陣的行,j是矩陣的列;
[0015]步驟4、得到去除熒光筆記的黑白文本圖像文件g(i,j)。
[0016]步驟2中不局限Matlab軟件,同類型的軟件應(yīng)屬于本發(fā)明的保護(hù)范圍。
[0017]以上所述,僅是本發(fā)明較佳實(shí)施例而已,并非對(duì)本發(fā)明的技術(shù)范圍作任何限制,故 凡是依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何細(xì)微修改、等同變化與修飾,均仍屬 于本發(fā)明技術(shù)方案的范圍內(nèi)。
【權(quán)利要求】
1.一種在數(shù)字文本圖像中消除熒光筆標(biāo)記的方法,其特征在于包括如下具體步驟: 步驟1、將帶有熒光筆標(biāo)記的文檔用彩色掃描儀或照相機(jī)進(jìn)行數(shù)字化處理,得到數(shù)字化 彩色圖像文件;步驟2、將該數(shù)字化彩色圖像文件用Matlab軟件打開,可看到RGB顏色空間的三維矩 陣f (i,j,k)其中i是矩陣的行,j是矩陣的列,k是矩陣的層,表示顏色的第k分量,其中 k = 1、2、3,分別存放紅R、綠G、藍(lán)B波段的顏色分量值;步驟3、針對(duì)所述數(shù)字化彩色圖像中的每個(gè)像素,選擇該像素三個(gè)顏色分量值中的最大 分量值作為該像素灰度值輸出,令像素灰度值g(i,j) = max(f(i, j,I),f (i,j,2),f (i,j,3)),遍歷整個(gè)數(shù)字化彩色圖像的所有像素,將熒光筆標(biāo)記過的灰度文本圖像文件f (i,j,k) 轉(zhuǎn)換成消除熒光標(biāo)記的文本圖像文件g(i,j),其中i是矩陣的行,j是矩陣的列;步驟4、得到去除熒光筆記的黑白文本圖像文件g(i,j)。
【文檔編號(hào)】G06T7/40GK103440670SQ201310340073
【公開日】2013年12月11日 申請(qǐng)日期:2013年8月6日 優(yōu)先權(quán)日:2013年8月6日
【發(fā)明者】陳鍛生, 吳揚(yáng)揚(yáng) 申請(qǐng)人:華僑大學(xué)