專利名稱:用于提高數(shù)字圖像質(zhì)量的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理應(yīng)用,用于獲得具有用于包括組合文本和圖像文件的改善圖像質(zhì)量的打印機輸出,并且通過一個圖像輸入設(shè)備掃描和輸入,更具體地,涉及一種圖像質(zhì)量增強方法和裝置,其中來自包括組合文本和圖像的文件的圖像區(qū)域和非圖像區(qū)域被精確地相互辨別,并且所辨別區(qū)域被強調(diào)為不同的程度,所以獲得一個在圖像質(zhì)量上得到改善的輸出。
背景技術(shù):
圖1是在美國專利No.4,996,603中公開的一種圖像處理系統(tǒng)的方框圖,此系統(tǒng)是一個用于通過從圖像中分離出文本來處理包括混合文本和圖像的文件的傳統(tǒng)圖像處理系統(tǒng)。
在圖1中,傳統(tǒng)圖像處理系統(tǒng)包括一個字符/照片分離電路1,一個固定限幅處理電路5,用于限幅被一個預(yù)定的固定閾值電平確定為一個字符的象素,和一個半色調(diào)處理電路6,用于半色調(diào)處理確定為圖像的象素。字符/照片分離電路1包括一個連續(xù)黑色檢測電路2,一個連續(xù)灰色檢測電路3,和一個精細(xì)線檢測電路,并且基于具有亮度值大于閾值的連續(xù)象素的數(shù)目,把一個文本從一個圖像中分離開。特性/照片分離電路使用兩個閾值。第一個閾值是一個接近于白色的閾值Th0,和第二個閾值是一個接近于黑色的閾值Th1。閾值Th0是通過連續(xù)灰色檢測電路3來使用。根據(jù)亮度等于或者小于閾值Th0的至少預(yù)定數(shù)目的象素是否連續(xù)出現(xiàn),一個文本從一個圖像中分離開來。閾值Th1是使用在連續(xù)黑色檢測電路2。如果亮度等于或者小于閾值Th1的至少預(yù)定數(shù)目的黑色象素連續(xù)出現(xiàn),他們被分類為連續(xù)黑色粗線。字符或者粗線經(jīng)受固定限幅,因而不管鄰近象素的特性,連續(xù)象素的亮度值被轉(zhuǎn)換為一個全白色或者一個全黑色的統(tǒng)一值。同時,一個圖像區(qū)域經(jīng)受半色調(diào)處理。
利用半色調(diào)處理來在報紙、雜志或者相似物上打印一個黑白圖片。基于半色調(diào)處理,一個用于獲得二進制輸出的輸出裝置,也就是一個僅僅用兩個步驟表達(dá)的輸出,即黑和白,表達(dá)灰度等級圖像。
圖2表示用于獲得五個黑/白灰度等級步長的一個2×2分割區(qū)域和圓點結(jié)構(gòu),以示出半色調(diào)處理的一個實例。比如,一個二進制輸出裝置需要2×2象素塊,以便在從白到黑的范圍內(nèi)創(chuàng)建5個黑/白步長。也就是說,一個n×n二進制象素塊能夠表達(dá)(n2+1)黑/白步長。也就是說,用于填滿n×n方塊的許多技術(shù)被實現(xiàn)為n2+1個模式。
雖然通過把一個文件分塊成預(yù)定的分區(qū)使半色調(diào)技術(shù)實際上退化了分辨率,但是作為一個粗糙圖像處理技術(shù)適合于使用在不能夠輸出真實的高質(zhì)量灰度等級的二進制輸出裝置。然而,通過半色調(diào)處理的灰度等級圖像輸出不是可靠的連續(xù)灰度等級圖像。這些半色調(diào)處理圖像對于人的眼睛可以看作以灰度等級很好表達(dá)的低頻灰度等級圖像,但是它們實際上是高頻被屏蔽圖像。能夠看出來,如果圖2的分開區(qū)域塊聚合在一起,那么它們就會形成一個被屏蔽的圖像。如果通過一個電荷耦合裝置(CCD)對半色調(diào)處理圖像進行掃描,比如,一個600DPI分辨率CCD,或者一個接觸圖像傳感器(CIS),那么一個象素被離散成大約每一個為42.3μm的精細(xì)象素。因此,必須被識別為照片區(qū)域的區(qū)域就會被錯誤地檢測為文本或者細(xì)線。
被屏蔽的半色調(diào)圖像是一個出現(xiàn)在數(shù)據(jù)上的失真,此數(shù)據(jù)是通過對一個照片區(qū)域進行半色調(diào)處理獲得,并且通過把半色調(diào)圖像認(rèn)作原始圖像來掃描半色調(diào)圖像。
當(dāng)這樣的被屏蔽半色調(diào)模式出現(xiàn)時,一個亮象素,也就是一個具有等于或者大于閾值th0的亮度的象素,間歇地出現(xiàn),以致一個被識別為照片的區(qū)域很可能被錯誤地認(rèn)為是一個字符。因此,如果掃描一個半色調(diào)文件,那么一個半色調(diào)照片區(qū)域就會被錯誤地認(rèn)為是一個特性區(qū)域。如果強調(diào)被錯誤認(rèn)為的特性區(qū)域,那么就會獲得一個在再現(xiàn)性方面被大大失真的輸出。
發(fā)明內(nèi)容
為了解決上述和其它問題,本發(fā)明的一個方面是提供一種圖像質(zhì)量增強方法,其中來自包括被混合的文本和圖像的文件的圖像區(qū)域、文本區(qū)域、和包括一個背景的非圖像區(qū)域被精確地相互辨別,并且所辨別區(qū)域被不同的技術(shù)強調(diào)并且被強調(diào)為不同的程度。
本發(fā)明的另一方面是提供一種裝置,用于執(zhí)行圖像質(zhì)量增強方法。
因此,本發(fā)明提供一種數(shù)字圖像質(zhì)量增強方法,其中,對于由具有預(yù)定分辨率的象素組成的圖像數(shù)據(jù),圖像數(shù)據(jù)是通過掃描包括聯(lián)合的背景、文本和圖像的一個原稿而獲得,一個所考慮像素首先被分類為一個文本區(qū)域、一個背景區(qū)域、和一個圖像區(qū)域中的一個。其后,所考慮像素的圖像質(zhì)量被改善為依靠所考慮像素被分類為哪一區(qū)域的不同程度。然后,鄰近所考慮像素的一個象素被設(shè)定為一個新的所考慮像素。新的所考慮像素經(jīng)受如上所述的相同圖像質(zhì)量增強。更具體地,在數(shù)字圖像質(zhì)量增強方法中,首先,所考慮像素的RGB色彩數(shù)據(jù)被轉(zhuǎn)換為具有一個亮度分量和一個飽和度分量的色彩數(shù)據(jù)。然后,所考慮像素通過使用亮度分量和飽和度分量被分類為一個背景象素、一個圖像象素、和一個文本象素中的一個。其后,在所考慮像素之前包括所考慮像素的連續(xù)背景象素或者圖像象素的數(shù)目被存儲為關(guān)于所考慮像素的歷史信息。然后,所考慮像素通過使用所存儲的關(guān)于所考慮像素的歷史信息被標(biāo)記為一個文本區(qū)域、一個背景區(qū)域、和一個圖像區(qū)域中的一個。然后,所考慮像素的圖像質(zhì)量被改善為依靠所標(biāo)記區(qū)域的不同程度。最后,確定關(guān)于所考慮像素是否是一個其圖像質(zhì)量已被改善的最后的象素。如果確定所考慮像素不是最后的象素,那么此方法回到RGB色彩數(shù)據(jù)轉(zhuǎn)換步驟。
優(yōu)選地,數(shù)字圖像質(zhì)量增強方法選擇性地包括執(zhí)行平滑,以便在RGB色彩數(shù)據(jù)轉(zhuǎn)換步驟之后減少亮度分量的高頻率分量。
本發(fā)明也提供了一種數(shù)字圖像質(zhì)量增強設(shè)備,包括一個分類裝置,用于把在圖像數(shù)據(jù)中的所考慮像素分類為一種文本區(qū)域、一種背景區(qū)域、和一種圖像區(qū)域中的任意一個,其中此圖像數(shù)據(jù)是由具有預(yù)定分辨率的象素組成,并通過掃描包括混合背景、文本和圖像的原稿獲得;和一個圖像質(zhì)量增強裝置,用于根據(jù)所考慮像素所屬的區(qū)域提高一個圖像質(zhì)量到不同的程度。在分類裝置中,一個色彩數(shù)據(jù)轉(zhuǎn)換單元把所考慮像素的RGB色彩數(shù)據(jù)轉(zhuǎn)換為具有一個亮度分量和一個飽和度分量的亮度/飽和度數(shù)據(jù)。一個象素分割單元,通過使用亮度/飽和度數(shù)據(jù)把所考慮像素分類為一個背景象素、一個圖像象素、或者一個文本象素,并且分類結(jié)果作為一個象素分割信號輸出。一個歷史信息存儲單元,通過使用象素分割信號計算在所考慮像素之前的連續(xù)背景象素的數(shù)目,并且在相應(yīng)于所考慮像素的一個地址中存儲所計算的象素數(shù)目為背景歷史信息。二者擇一地,歷史信息存儲單元通過使用象素分割信號計算在所考慮像素之前的連續(xù)圖像象素的數(shù)目,并且在相應(yīng)于所考慮像素的一個地址中存儲所計算的象素數(shù)目為圖像歷史信息。一個區(qū)域分割單元,接收來自歷史信息存儲單元的聯(lián)合所考慮像素的背景或者圖像歷史信息,并且把所考慮像素分類為一個文本區(qū)域、一個背景區(qū)域、或者一個圖像區(qū)域。如果所考慮像素被分類為一個文本區(qū)域,區(qū)域分割單元把所考慮像素標(biāo)記為一個文本區(qū)域。如果所考慮像素被分類為一個背景區(qū)域,區(qū)域分割單元把所考慮像素標(biāo)記為一個背景區(qū)域。如果所考慮像素被分類為一個圖像區(qū)域,區(qū)域分割單元把所考慮像素標(biāo)記為一個圖像區(qū)域。
更可取地,數(shù)字圖像質(zhì)量增強裝置選擇地包括一個平滑單元,用于執(zhí)行平滑以便使用低通濾波器來減少亮度飽和度數(shù)據(jù)亮度分量的高頻分量,并且輸出包括一個平滑的亮度分量的新亮度/飽和度數(shù)據(jù)。也是更可取地,象素分割單元,使用從平滑單元輸出的新亮度/飽和度數(shù)據(jù)把所考慮像素分類成一個背景象素、一個圖像象素、或者一個文本象素,并且輸出分類結(jié)果作為一個象素分割信號。
通過結(jié)合其中的附圖詳細(xì)描述優(yōu)選實施例,本發(fā)明的上述和其它方面以及優(yōu)點將會變得更加明顯,其中圖1是用于通過從一個圖像中辨別出一個文本來處理一個包括混合文本和圖像的文件的傳統(tǒng)圖像處理系統(tǒng)的方框圖;圖2表示用于獲得五個黑/白灰度等級步驟的一個2×2分割區(qū)域和圓點結(jié)構(gòu),以致闡明半色調(diào)處理的一個實例;圖3是表明根據(jù)本發(fā)明一個優(yōu)選實施例的一種數(shù)字圖像質(zhì)量增強方法的流程圖;圖4表示一個3×3屏蔽,它是能夠執(zhí)行圖3平滑步驟的低通濾波器的一個實施例;圖5是一個用于解釋圖3象素分割步驟的圖示;圖6解釋用于檢測在圖3區(qū)域分割步驟中的背景特征的一種條件;圖7解釋用于檢測在圖3區(qū)域分割步驟中的圖像特征的一種條件;圖8是表明圖3區(qū)域分割步驟的一個優(yōu)選實施例的流程圖;圖9是根據(jù)本發(fā)明一個優(yōu)選實施例的一種數(shù)字圖像質(zhì)量增強裝置的方框圖。
具體實施例方式
現(xiàn)在將參考附圖來描述根據(jù)本發(fā)明的數(shù)字圖像質(zhì)量增強方法的步驟和根據(jù)本發(fā)明的數(shù)字圖像質(zhì)量增強裝置的結(jié)構(gòu)和操作。
在根據(jù)本發(fā)明的圖像質(zhì)量增強方法中,將要處理通過一個圖像輸入設(shè)備,比如一個掃描儀來掃描具有預(yù)定分辨率的像素圖像而獲得的數(shù)據(jù)。
一種普通的掃描儀包括光源、透鏡、和圖像傳感器。光源反射光到包括混合背景、文本和圖像的原稿。透鏡會聚反射光。圖像傳感器接收會聚光。作為一個電荷耦合器件(CCD)或一個接觸圖像傳感器(CIS)來實現(xiàn)的圖像傳感器是由相隔預(yù)定間隔的電單元組成,并且接收通過與模擬圖像數(shù)據(jù)相對應(yīng)的原稿反射的光,并把所接收的光離散成為具有預(yù)定分辨率的數(shù)字圖像數(shù)據(jù)。此時,被離散數(shù)據(jù)的最小單元是與在圖像傳感器中的每一單元相對應(yīng)的數(shù)據(jù),并且被作為一個象素。
在本發(fā)明中,術(shù)語“所考慮像素”表明一種象素,對此象素執(zhí)行一種根據(jù)本發(fā)明的圖像質(zhì)量增強方法。術(shù)語“所考慮行”表示所考慮像素所屬的一排。基于所考慮像素確定上側(cè)、下側(cè)、右側(cè)和左側(cè)象素。術(shù)語“左側(cè)象素”表示存在于所考慮行中的象素,并且在所考慮像素之前被處理。術(shù)語“右側(cè)象素”表示存在于所考慮行中的象素,并且在所考慮像素之后被處理。術(shù)語“上側(cè)象素”表示存在于在所考慮行之前被立即處理的行中,并且與所考慮像素鄰近。術(shù)語“下側(cè)象素”表示存在于緊接在已經(jīng)被處理線之后的行中,并且與所考慮像素鄰近。
本發(fā)明涉及一種圖像質(zhì)量增強方法,其中,對于由具有預(yù)定分辨率的象素組成、并且通過掃描包括背景、文本和圖像的原稿而獲得的圖像數(shù)據(jù),所考慮像素被指定給在字符區(qū)域中相應(yīng)區(qū)域、一個背景區(qū)域、和一個照片區(qū)域,所考慮像素的圖像質(zhì)量被提高到與被指定區(qū)域相對應(yīng)的程度,在其中執(zhí)行圖像質(zhì)量增強操作的所考慮像素之后的象素被設(shè)置為一個新的所考慮像素,并且新的所考慮像素也經(jīng)過上述圖像質(zhì)量增強操作。
圖3是一個闡明根據(jù)本發(fā)明一個優(yōu)選實施例的數(shù)字圖像質(zhì)量增強方法的流程圖,它包括一個色彩數(shù)據(jù)轉(zhuǎn)換步驟10,一個平滑步驟12,一個象素分割步驟14,一個歷史信息存儲步驟16,一個區(qū)域分割步驟18,一個象素質(zhì)量提高步驟20,和一個確定所考慮像素是否為最末一個的步驟22。
更具體地,在步驟10中,把所考慮像素的RGB色彩數(shù)據(jù)轉(zhuǎn)換成為一個具有亮度分量和飽和度分量的色彩數(shù)據(jù)。
表示色彩的模式在三維坐標(biāo)系統(tǒng)中被表達(dá),并且主要被色彩監(jiān)測器、色彩打印機、動畫圖形、或TV圖像使用。色彩模型包括一個用于色彩監(jiān)測器或色彩電視攝像機的紅/綠/藍(lán)(RGB)模型、一個是用于TV廣播標(biāo)準(zhǔn)的YIQ模式、一個YCbCr模型等等。
RGB色彩模型發(fā)源于一種方式,其中具有攝像機或者掃描儀的圖像傳感器和發(fā)光顯示器操作。為了處理具有灰度為256的色彩圖像,8比特被分配用于在象素中的每一個R、G和B,因此,一個象素需要一個24比特的存儲空間,也就是3字節(jié)。
采用YIQ色彩模型來達(dá)到與用于色彩TV廣播設(shè)備的兼容性。YIQ色彩模型把RGB色彩數(shù)據(jù)分離成為一個亮度分量和一個飽和度分量。代表亮度的AY分量提供被黑色和白色電視所需求的各種視頻信息。代表飽和度的I和Q分量分別表示同相分量和正交分量。從RGB色彩模型到Y(jié)IQ色彩模型的色彩數(shù)據(jù)的轉(zhuǎn)換由方程式1表示Y=0.29900R+0.58700G+0.11400BI=0.59600R-0.27500G-0.32100B...(1)Q=0.21200R-0.52300G+0.31100B國際電信聯(lián)盟無線電通信部門(ITU-R)BT.601已提出YCbCr色彩模型,以便建立數(shù)字視頻分量。YCbCr是把亮度與色彩信息分開的另一個色彩空間。亮度用符號Y表示,并且藍(lán)色信息和紅色信息分別用符號Cb和Cr表示。在把YCbCr色彩模型轉(zhuǎn)化為RGB色彩模型和反過來轉(zhuǎn)化的許多方法中,ITU-R推薦了一種用于圖像壓縮的典型色彩數(shù)據(jù)轉(zhuǎn)換方法,比如JPEG或MPEG,此轉(zhuǎn)換方法表示為方程式2Y=0.29900R+0.58700G+0.11400BCb=-0.16874R-0.33126G+0.50000BCr=0.50000R-0.41869G-0.08131BR=1.00000Y+1.40200CrG=1.00000Y-0.34414Cb-0.71414CrB=1.00000Y+1.77200Cb...(2)在步驟10的一個優(yōu)選實施例中,如果通過使用YCbCr色彩模型對色彩數(shù)據(jù)進行轉(zhuǎn)換,就采用一個Y分量作為一個亮度分量,并且通過使用Cb和Cr分量能夠獲得一個飽和度分量。比如,飽和度分量能夠從Cb的絕對值和Cr的絕對值的總和中獲得。另一方面,飽和度分量能夠從Cb和Cr的均方根中獲得。這兩種情況分別用方程式3和4來表達(dá)飽和度=|Cb|+|Cr| ...(3) 在根據(jù)本發(fā)明的圖像質(zhì)量增強方法中,數(shù)據(jù)平滑步驟12能夠在色彩數(shù)據(jù)轉(zhuǎn)換步驟10之后選擇地執(zhí)行,所以步驟14能夠執(zhí)行更精確的象素分割。在步驟12中,執(zhí)行平滑,以便減少亮度分量中的高頻率分量。
圖4表示一個3×3屏蔽,它是一個能夠執(zhí)行圖3中平滑步驟12的低通濾波器的一個實例。在步驟12的一個實施例中,一個預(yù)定象素塊尺寸的低通濾波器,比如3×3塊執(zhí)行平滑。濾波器表示一個空間濾波器,并且也被稱作為一個屏蔽器。對于當(dāng)掃描原始的半色調(diào)圖像時而獲得的一個被屏蔽的半色調(diào)區(qū)域,當(dāng)在被屏蔽的半色調(diào)區(qū)域中的一個照片區(qū)域被分割時,就會發(fā)生錯誤。一個被錯誤地分割的照片區(qū)域的加強可以產(chǎn)生一個其噪聲分量被扭曲的輸出。低通濾波器把被屏蔽的半色調(diào)區(qū)域轉(zhuǎn)換成具有與一個連續(xù)色度相似色度的區(qū)域,所以能夠減少當(dāng)在區(qū)域分割步驟18中圖像區(qū)域被分割時所產(chǎn)生的錯誤。從圖4能夠看到,當(dāng)位于屏蔽中心的一個象素是一個感興趣的象素,存在于屏蔽中的象素亮度值增加到屏蔽上,并且相應(yīng)地,通過低通濾波器處理的一個響應(yīng)僅僅是存在于屏蔽中的所有象素的平均值。通過低通濾波器的平滑是一種使用在預(yù)先處理步驟中的圖像處理技術(shù),比如,在自圖像抽取一大的對象之前,自該圖像除去小的、精細(xì)部分,把線連接到彎曲線中的小裂縫,或者噪聲消除。使用在平滑步驟12中的低通濾波器塊尺寸不是必須為3×3。由于被屏蔽的半色調(diào)區(qū)域,一個較大的屏蔽塊能夠減少輸出失真,但是通過對高頻分量的過壓縮會使圖像質(zhì)量的清晰度降低。相應(yīng)地,屏蔽塊尺寸依靠分辨率和掃描儀的輸出規(guī)格來決定。
在用于象素分割的步驟14中,所考慮像素通過使用由步驟10和選擇性包括的步驟12而獲得的亮度分量和飽和度分量被分類成背景象素、圖像象素、或者文本象素。
在步驟14的一個優(yōu)選實施例中,使用通過步驟10獲得的,分別用于亮度分量和飽和度分量的一個預(yù)定亮度閾值和一個預(yù)定飽和度閾值,所考慮像素被分割為背景象素、一種圖像象素、或者一種文本象素。優(yōu)選地,使用一個預(yù)定高亮度閾值Th0和一個預(yù)定低亮度閾值Th1,所考慮像素被分割為一種背景象素、一種圖像象素、或者一種文本象素。圖5中表示了分割結(jié)果的一個例子。更特別的,如果所考慮像素的亮度分量大于高亮度閾值Th0,并且飽和度分量小于飽和度閾值Th1,那么所考慮像素就被分割為背景象素。圖5中的象素f對應(yīng)于背景象素。如果所考慮像素的亮度分量大于低亮度閾值Th1,或者所考慮像素的飽和度分量大于飽和度閾值S0,而所考慮像素不被分割為背景象素,所考慮像素被分割為圖像象素。換句話說,如果所考慮像素的亮度分量小于Th0并且大于Th1或者所考慮像素的飽和度分量大于S0,那么所考慮像素就被分割為圖像象素。圖5中的象素a、b、c和e對應(yīng)于圖像象素。如果所考慮像素既不被分割為背景象素,又不被分割為圖像象素,那么所考慮像素就被分割為文本象素。圖5中的象素d對應(yīng)于文本象素。
在用于歷史信息存儲的步驟16中,該步驟是用于區(qū)域分割步驟18的預(yù)先處理步驟,用在步驟18中來用作檢測背景特性和圖像特性的相似類型的連續(xù)象素數(shù)目被儲存為背景歷史信息或圖像歷史信息。在步驟16中,使用通過處理先前象素而獲得并且被存儲的背景象素歷史信息或者圖像象素歷史信息,和在步驟14中的象素分割的結(jié)果,背景象素、圖像象素、和在所考慮像素上方向或左方向的連續(xù)非圖像象素的數(shù)目被更新并且被存儲。
在用于存儲背景歷史信息的步驟16的一個實施例中,當(dāng)在步驟14中所考慮像素被分割為一個背景象素時,在之前連續(xù)并且在所考慮像素上方向包括所考慮像素的背景象素的數(shù)目被存儲為關(guān)于所考慮像素的信息。優(yōu)選地,如果在所考慮像素上方向包括所考慮像素的連續(xù)背景象素的數(shù)目等于或大于一個預(yù)定數(shù)值p,數(shù)值p就被存儲為所考慮像素的圖像歷史信息。更具體地,在分辨率為600dpi(每英寸點)時,數(shù)值p能夠被設(shè)定為10。
在用于存儲背景歷史信息的步驟16的另一個實施例中,當(dāng)在步驟14中所考慮像素被分割為非背景象素時,在所考慮像素左方向連續(xù)的包括所考慮像素的非背景象素的數(shù)目被存儲為所考慮像素的信息。優(yōu)選地,如果在所考慮像素左方向連續(xù)的包括所考慮像素的非背景象素的數(shù)目等于或大于一個預(yù)定數(shù)值r,數(shù)值r就被存儲為所考慮像素的圖像歷史信息。更具體地,在分辨率為600dpi時,數(shù)值r能夠被設(shè)定為200。
在用于區(qū)域分割的步驟18中,通過使用存儲在步驟16中的關(guān)于所考慮像素的歷史信息,所考慮像素被標(biāo)記,以致屬于文本區(qū)域、背景區(qū)域、和圖像區(qū)域中一個。
圖6解釋了在圖3的區(qū)域分割步驟18中的用于檢測背景特征的一種情況,并且圖7解釋了在圖3的區(qū)域分割步驟18中的用于檢測圖像特征的一種情況。
圖8是闡明圖3中區(qū)域分割步驟18的一個優(yōu)選實施例的流程圖。實施例包括步驟180用于背景特征/圖像特征分類,步驟182用于背景標(biāo)記,步驟184用于圖像標(biāo)記。實施例可選擇地包括步驟186至190用于圖像區(qū)域傳播,步驟192用于文本標(biāo)記,和步驟194用于背景/文本標(biāo)記。
在步驟180中,使用關(guān)于存儲在步驟16中的所考慮像素的歷史信息,所考慮像素被分類成連接于連續(xù)背景象素的背景特征象素,或者連接于連續(xù)圖像象素的圖像特征象素。在用于背景特征象素分類的步驟180的一個優(yōu)選實施例中,如果其中在每一個象素中的背景歷史信息的尺寸是一個預(yù)定數(shù)值m或者更大的數(shù)值的n個象素存在于連續(xù)的所考慮像素的左側(cè),那么所考慮像素被分類成為一個背景特征象素。更具體地,在分辨率為600dpi時,m和n能夠被設(shè)定為5。
在用于圖像特征象素分類的步驟180的一個優(yōu)選實施例中,如果其中在每一個象素中的圖像歷史信息的尺寸是一個預(yù)定數(shù)值p或者更大的數(shù)值的q個象素存在于連續(xù)的所考慮像素的左側(cè),那么所考慮像素被分類成為一個圖像特征象素。更具體地,在分辨率為600dpi時,p和q能夠被分別設(shè)定為10和20。在用于圖像特征象素分類的步驟180的另一個優(yōu)選實施例中,如果關(guān)于存在于連續(xù)的所考慮像素左側(cè)的象素的圖像歷史信息的尺寸是一個預(yù)定數(shù)值r或者更大的數(shù)值,那么所考慮像素被分類成為一個圖像特征象素。更具體地,在分辨率為600dpi時,r能夠被分別設(shè)定為200。
現(xiàn)在將參考圖6至7描述使用歷史信息來檢測背景特征/圖像特征的一個過程的實施例。
在區(qū)域分割步驟18中,如果在m×n塊內(nèi)的所有象素是背景象素,那么一個所考慮像素能夠被檢測為一個背景特征。比如在分辨率為600dpi時,m和n能夠被分別設(shè)定為5。如圖6所示,如果包括所考慮像素(k,j)被分類為的背景象素的5個背景象素在所考慮像素的左側(cè)連續(xù),并且5個背景象素列在5行內(nèi)連續(xù),所考慮像素(k,j)被檢測為背景特征。在檢測來自5×5象素塊的背景特征方法的一個優(yōu)選實施例中,能夠檢測出包括所考慮像素的5個背景象素列是否在至少5列內(nèi)連續(xù)。如果在步驟12中,所考慮像素(k,j)被確定為一個背景像素,那么在具有背景歷史信息的象素(k,j)左側(cè)的象素(k-4,j-4)至(k,j-4)中的每一個存儲背景歷史信息,并且象素列(k-4,j)至(k,j)都是背景象素,象素(k,j)被檢測為一背景特征象素。
在步驟18中,如果在一個p×q象素塊內(nèi)的象素,比如在分辨率為600dpi時10×20塊內(nèi)的象素都是在所考慮行連續(xù)的圖像象素或者至少是非背景象素的一個預(yù)定數(shù)值,比如在分辨率為600dpi時的200象素或者更高,那么所考慮像素能夠被檢測為具有圖像特征。
所考慮像素是否被檢測為一個背景特征不是通過檢查關(guān)于在上述定義的m×n塊內(nèi)的象素具有一個黑白比例圖像還是一個色彩比例圖像的數(shù)據(jù)來確定的,而是通過檢查關(guān)于多少個背景象素在所考慮像素上方向連續(xù)以及象素是否在5或者更多列和行連續(xù)的信息來確定。換句話說,所考慮像素之前的象素不需要涉及比例圖像的數(shù)據(jù),而僅僅需要關(guān)于多少個背景象素連續(xù)的信息。因此,背景象素為了存儲背景歷史信息而使用的存儲器是[log2m+1]比特。此時,[]代表一個高斯符號。如果m是5,為了更新所存儲的背景歷史信息,一個背景象素需要3(=log25+1)比特。
現(xiàn)在將參考圖6描述一個實施例,在此實施例中關(guān)于所考慮像素(k,j)的背景歷史信息在步驟16中被存儲。如上所述,一個3-比特的存儲空間被分配給每一個背景象素,以便更新所存儲的歷史信息。當(dāng)在步驟14中一個背景象素第一次出現(xiàn)在象素(k-4,j-4)處,如果象素(k-4,j-4)至(k,j-4)都是背景象素,所存儲的歷史信息隨著分別表示象素(k-4,j-4)至(k,j-4)信息的二進制數(shù)001、010、011、100和101被更新,并且存儲這些二進制數(shù)。同樣地,關(guān)于背景象素(k,j-3)至(k,j)的信息隨著二進制數(shù)101被更新,并且存儲所更新的信息。如果緊接所考慮行的行上的象素(k+1,j-4)是背景象素,那么再次存儲二進制數(shù)101。如果象素(k+1,j-4)不是背景象素,那么存儲二進制數(shù)000。
類似地,需要關(guān)于一個圖像特征的[log2p+1]比特。如果p是10,每一個象素需要4(=log210+1)比特以便更新信息。如果一個圖像象素第一次出現(xiàn)在象素(k-9,j-19)處,并且象素(k-9,j-19)至(k,j-19)都是圖像象素,那么關(guān)于圖像象素的信息分別隨著二進制數(shù)0001至1010被更新,并且存儲這些新的信息。
在一種傳統(tǒng)的圖像處理方法中不包括用于歷史信息存儲的步驟16,8比特被分配給在一個象素中的每一個R、G和B,以便分割用于具有256比例色彩圖像的區(qū)域。因此,每一個象素需要一個24-比特存儲空間,也就是一個3字節(jié)的存儲空間。為了處理一個256比例圖像,一個現(xiàn)有的灰色等級或者色彩圖像分別需要8個黑和白比特或者24RGB色彩比特。同時,根據(jù)本發(fā)明的一種圖像處理方法包括一個歷史信息更新步驟,比如僅僅需要7比特來達(dá)到區(qū)域分割。因此,當(dāng)一個根據(jù)本發(fā)明采用圖像質(zhì)量增強方法的特定用途集成電路(ASIC)被用作一種圖像質(zhì)量增強裝置時,所使用的存儲器的數(shù)量就會顯著減少,因此就限制了制造成本。
回來參見圖8,在步驟182中,在步驟180中被分類成一個背景特征象素的所考慮像素被標(biāo)記為一個背景,以致屬于一個背景區(qū)域。
在步驟184中,在步驟180中被分類成一個圖像特征象素的所考慮像素被標(biāo)記為一個圖像,以致屬于一個圖像區(qū)域。
在圖8中,步驟18的優(yōu)選實施例進一步包括傳播一個圖像區(qū)域的步驟,也就是說,在向左方向上傳播圖像區(qū)域的步驟186,在向右方向上傳播圖像區(qū)域的步驟192,和在向下方向上傳播圖像區(qū)域的步驟188。
在步驟186中,如果在步驟180中,在所考慮行上的所考慮像素已經(jīng)被分類成一個圖像特征象素,那么對把所考慮像素分類成圖像特征象素有貢獻(xiàn)并且存在于所考慮像素左側(cè)的連續(xù)象素被標(biāo)記為圖像區(qū)域,并且圖像區(qū)域被傳播到所考慮行上的左側(cè)象素。
在步驟188中,如果在所考慮行上的所考慮像素在步驟180中被分類成既不是背景特征象素又不是圖像特征象素,那么在所考慮像素上面和在所考慮像素之前線上的象素被標(biāo)記為一個圖像區(qū)域,并且圖像區(qū)域被傳播到所考慮像素下側(cè)的象素。
在執(zhí)行步驟18中是可選擇的文本標(biāo)記步驟190中,當(dāng)所考慮像素在步驟180中被分類成既不是背景特征象素又不是圖像特征象素時,如果所考慮像素上面的象素,也就是說,存在于所考慮行之前線上的象素沒有被標(biāo)記為圖像區(qū)域,那么所考慮像素就被標(biāo)記為文本區(qū)域。換句話說,在步驟190中,如果所考慮像素既不是背景特征象素又不是圖像特征象素,并且沒有被傳播到圖像區(qū)域,那么所考慮像素被標(biāo)記為一個文本。
在步驟192中,如果在所考慮行上的所考慮像素在步驟184中被標(biāo)記為一個圖像,那么存在于所考慮像素右側(cè)上的象素和背景特征象素之前的象素之間的所有右側(cè)象素被標(biāo)記為一個圖像區(qū)域,并且圖像區(qū)域被傳播到所考慮行上的所考慮像素的右側(cè)上。
在步驟18中是可選擇的背景/文本標(biāo)記步驟194中,當(dāng)在所考慮行上的所考慮像素左側(cè)上的一個鄰近象素已經(jīng)被標(biāo)記為一個背景區(qū)域時,如果所考慮像素是一個背景象素,那么所考慮像素就被標(biāo)記為一個背景區(qū)域。在另一方面,如果所考慮像素不是背景象素,那么所考慮像素就被標(biāo)記為一個文本區(qū)域。
返回參見圖3,在步驟20中,根據(jù)在步驟16中所考慮像素是已經(jīng)被標(biāo)記為文本區(qū)域、背景區(qū)域、還是圖像區(qū)域,圖像質(zhì)量被改善到不同的增強程度。在步驟20的一個優(yōu)選實施例中,圖像質(zhì)量增強步驟包括文本增強步驟200和圖像提高步驟210。
在文本增強步驟200中,根據(jù)亮度,在步驟18中被標(biāo)記為文本區(qū)域的所考慮像素的圖像質(zhì)量得到不同的改善。最好,所考慮像素的亮度被分類為基于兩個預(yù)定亮度閾值確定的三個亮度種類。在三個亮度分類中,最亮的象素被白色彩完全充滿。當(dāng)輸出一個彩色256比例圖像,R是由255表示,G是由255表示,和B是由255表示。最暗的象素被黑色完全充滿,并且指定R、G和B為0。具有中間亮度的象素被加強。一個非加強屏蔽能夠被采用以便加強中間亮度象素。優(yōu)選地,通過增加一個強調(diào)系數(shù)到達(dá)不少于一個預(yù)定值來執(zhí)行非加強屏蔽,以便增加邊緣強調(diào)效果。
現(xiàn)在將更詳細(xì)地描述非加強屏蔽。一個高通是通過計算所考慮像素(X)和所考慮像素的低通X的差值來獲得的,如方程式5高通=X-X ...(5)非加強屏蔽表示用于把模糊圖像從原始圖像減去的普通過程。一個更大的強調(diào)系數(shù)引起所增加的邊緣強調(diào)效果。非加強屏蔽過程結(jié)果的一個例子是通過方程式6獲得的X′=X+k·(X-X) ...(6)其中X表示一個中心象素,X表示一個平均象素,k表示一個強調(diào)系數(shù),并且X′表示非加強屏蔽的結(jié)果。也就是說,非加強屏蔽過程的結(jié)果是通過把由一個預(yù)定強調(diào)系數(shù)加權(quán)的高通加到所考慮像素原始圖像上來獲得。
非加強屏蔽的另一個例子是通過方程式7來執(zhí)行的,如在Gonzales &Woods的“數(shù)字圖像處理(Digtal Image Processing)”中所描述的X′=A·X-X=(A-1)·X+(X-X)...(7)其中X表示一個中心象素,X表示一個平均象素,A表示一個放大系數(shù),并且X′表示非加強屏蔽過程的結(jié)果。
當(dāng)一個所打印的圖像被復(fù)制時,這種非加強屏蔽會引起在被屏蔽的半色調(diào)區(qū)域經(jīng)常發(fā)生的嚴(yán)重失真,因為雖然半色調(diào)圖像對于人的眼睛是低頻部分,即,在人眼能識別的分辨率范圍,但是半色調(diào)圖像實際上是表示為高頻模式。結(jié)果,因為加強的特性,一個被屏蔽區(qū)域,即不需要強調(diào)的圖像區(qū)域被嚴(yán)重強調(diào),其中高頻模式被大大加強,以致引起不期望的強調(diào)效果。
在圖像提高步驟210中,在步驟18中被標(biāo)記為一個圖像區(qū)域的所考慮像素的圖像質(zhì)量通過加強所考慮像素,尤其是使用一個非加強屏蔽過程來改善。在用于一個圖像區(qū)域的非加強屏蔽中,更可取的是一個強調(diào)系數(shù)被設(shè)定為不大于一個預(yù)定值,然后被處理,以便當(dāng)強調(diào)系數(shù)被設(shè)定為如上所示的高時,阻止被屏蔽的半色調(diào)區(qū)域的失真。由于通過進一步包括的平滑步驟12以便在步驟14中執(zhí)行的象素分割之前平滑被屏蔽的半色調(diào)模式,使被屏蔽的半色調(diào)區(qū)域的失真部分減少,根據(jù)是否包括平滑步驟12和圖像質(zhì)量增強規(guī)格,強調(diào)系數(shù)的值能夠被適當(dāng)?shù)恼{(diào)整。也就是說,由于當(dāng)進一步包括平滑步驟12時被屏蔽的半色調(diào)區(qū)域的失真能夠減少,強調(diào)系數(shù)能夠被確定為更大。
在最后的步驟22中,確定所考慮像素是否為其圖像質(zhì)量被改善的最后的象素。如果確定所考慮像素不是最后的象素,那么本方法回到步驟10。上述步驟10至20相應(yīng)于用于基于所考慮像素提高圖像質(zhì)量的過程。因此,提供步驟22來執(zhí)行基于所考慮像素的圖像質(zhì)量增強,設(shè)定鄰近象素為一個新的所考慮像素,并且執(zhí)行在新的所考慮像素上的圖像質(zhì)量增強。
圖9是一個根據(jù)本發(fā)明優(yōu)選實施例的數(shù)字圖像質(zhì)量增強裝置的方框圖。裝置包括一個分類裝置300和一個圖像質(zhì)量增強設(shè)備312。分類裝置300包括一個色彩數(shù)據(jù)轉(zhuǎn)換單元302,一個象素分割單元306,一個歷史信息存儲單元308,和一個區(qū)域分割單元310。
分類裝置300把在圖像數(shù)據(jù)中的所考慮像素分類為一種文本區(qū)域、一種背景區(qū)域、或者一種圖像區(qū)域,其中圖像數(shù)據(jù)是由具有預(yù)定分辨率的象素組成,并且圖像數(shù)據(jù)通過掃描包括混合背景、文本和圖像的原稿獲得。
色彩數(shù)據(jù)轉(zhuǎn)換單元302把所考慮像素的RGB色彩數(shù)據(jù)轉(zhuǎn)換為具有一個亮度分量和一個飽和度分量的亮度/飽和度數(shù)據(jù)。
象素分割單元306使用亮度/飽和度數(shù)據(jù)把所考慮像素分類為一個背景象素、一個圖像象素、或者一個文本象素,并且輸出一個象素分割信號。
歷史信息存儲單元308使用象素分割信號計算在所考慮像素之前的連續(xù)背景象素的數(shù)目,并且在相應(yīng)于所考慮像素的一個地址中存儲所計算的象素數(shù)目為背景歷史信息。二者擇一地,歷史信息存儲單元308使用象素分割信號計算在所考慮像素之前的連續(xù)圖像象素的數(shù)目,并且在相應(yīng)于所考慮像素的一個地址中存儲所計算的象素數(shù)目為圖像歷史信息。
區(qū)域分割單元310接收來自歷史信息存儲單元308的聯(lián)合所考慮像素的背景或者圖像歷史信息,并且把所考慮像素分類為一個文本區(qū)域、一個背景區(qū)域、或者一個圖像區(qū)域。如果所考慮像素被分類為一個文本區(qū)域,區(qū)域分割單元310把所考慮像素標(biāo)記為一個文本區(qū)域。如果所考慮像素被分類為一個背景區(qū)域,區(qū)域分割單元310把所考慮像素標(biāo)記為一個背景區(qū)域。如果所考慮像素被分類為一個圖像區(qū)域,區(qū)域分割單元310把所考慮像素標(biāo)記為一個圖像區(qū)域。
圖像質(zhì)量增強設(shè)備312接收來自區(qū)域分割單元310的一個文本標(biāo)記信號、一個背景標(biāo)記信號、或者一個圖像標(biāo)記信號,并且通過把不同程度應(yīng)用到所分類的區(qū)域來改善圖像質(zhì)量。優(yōu)選地,圖像質(zhì)量增強設(shè)備312通過基于一個預(yù)定亮度閾值把感興趣的文本標(biāo)記象素的亮度/飽和度數(shù)據(jù)分類為至少兩個類別來改善圖像質(zhì)量。圖像質(zhì)量增強設(shè)備312使用非加強屏蔽來改善感興趣的圖像標(biāo)記象素的圖像質(zhì)量。
根據(jù)本發(fā)明,平滑單元304在圖像質(zhì)量增強裝置中是可選擇的,它執(zhí)行平滑以便使用低通濾波器來減少亮度/飽和度數(shù)據(jù)亮度分量的高頻分量,并且輸出包括平滑的亮度分量的新亮度/飽和度數(shù)據(jù)。接著,象素分割單元306使用從平滑單元304輸出的新亮度/飽和度數(shù)據(jù)把所考慮像素分類成一個背景象素、一個圖像象素、或者一個文本象素,并且輸出分類結(jié)果作為一個象素分割信號。
如上所示,在根據(jù)本發(fā)明的一個數(shù)字圖像質(zhì)量增強方法和裝置中,使用代表相同類型象素連續(xù)傾向的歷史信息把包括由文本和圖像混合的圖像精確地分成區(qū)域。特別地,由于被屏蔽的半色調(diào),平滑的利用和基于象素分割的平滑單元減少了圖像區(qū)域分割的錯誤。圖像區(qū)域在左、右、和下方向上的傳播阻止了能夠在圖像區(qū)域突然產(chǎn)生的噪聲的加強,或者阻止了包括在圖像中的文本的連續(xù)加強。由于根據(jù)被分類的區(qū)域,加強方法和加強程度被各自細(xì)分,因此能夠獲得優(yōu)良的輸出質(zhì)量。歷史信息的使用減少了被用作區(qū)域分割的存儲器的數(shù)量,因此減少了制造成本。
權(quán)利要求
1.一種數(shù)字圖像質(zhì)量增強方法,其中,對于由具有預(yù)定分辨率的象素組成的圖像數(shù)據(jù),該圖像數(shù)據(jù)是通過掃描包括混合的背景、文本和圖像的原稿而獲得,所考慮像素被分類為文本區(qū)域、背景區(qū)域、和圖像區(qū)域中的一個,根據(jù)所考慮像素被分類為哪一區(qū)域所考慮像素的圖像質(zhì)量被不同程度地改善,然后鄰近所考慮像素的一個象素被設(shè)定為新的所考慮像素,并且新的所考慮像素經(jīng)受如上所述的相同圖像質(zhì)量增強,該方法包括下列步驟(a)把所考慮像素的RGB色彩數(shù)據(jù)轉(zhuǎn)換為具有一個亮度分量和一個飽和度分量的色彩數(shù)據(jù);(b)使用在步驟(a)中獲得的亮度分量和飽和度分量,把所考慮像素分類為一個背景象素、一個圖像象素、和一個文本象素中的任意一個;(c)把在所考慮像素之前包括所考慮像素的連續(xù)背景象素或者圖像象素的數(shù)目存儲為關(guān)于所考慮像素的歷史信息;(d)使用在步驟(c)所存儲的關(guān)于所考慮像素的歷史信息把所考慮像素標(biāo)記為一個文本區(qū)域、一個背景區(qū)域、和一個圖像區(qū)域中的任意一個;(e)依據(jù)在步驟(d)中所指定區(qū)域改善所考慮像素的圖像質(zhì)量為不同程度;和(f)確定關(guān)于所考慮像素是否是一個其圖像質(zhì)量已被改善的最后的象素,并且如果確定所考慮像素不是最后的象素,那么進入步驟(a)。
2.根據(jù)權(quán)利要求1所述的數(shù)字圖像質(zhì)量增強方法,其中,在步驟(a)中,把被掃描RGB色彩數(shù)據(jù)轉(zhuǎn)換為YCbCr色彩數(shù)據(jù),一個Y分量被采用為亮度分量,并且從飽和度分量從Cb和Cr分量獲得。
3.根據(jù)權(quán)利要求2所述的數(shù)字圖像質(zhì)量增強方法,其中飽和度分量是Cb和Cr分量絕對值的和。
4.根據(jù)權(quán)利要求2所述的數(shù)字圖像質(zhì)量增強方法,其中飽和度分量是Cb和Cr分量的均方根(RMS)。
5.根據(jù)權(quán)利要求1所述的數(shù)字圖像質(zhì)量增強方法,其中,在步驟(b)中,通過使用用于亮度分量的預(yù)定亮度閾值和用于飽和度分量的預(yù)定飽和度閾值,把所考慮像素分類為一個背景象素、一個圖像象素、和一個文本象素中的任意一個。
6.根據(jù)權(quán)利要求5所述的數(shù)字圖像質(zhì)量增強方法,其中,在步驟(b)中,通過使用一個高亮度閾值和一個低亮度閾值作為預(yù)定亮度閾值,把所考慮像素分類為一個背景象素、一個圖像象素、和一個文本象素中的任意一個。
7.根據(jù)權(quán)利要求6所述的數(shù)字圖像質(zhì)量增強方法,其中,在步驟(b)中,如果所考慮像素的亮度分量大于高亮度閾值,并且飽和度分量小于飽和度閾值,那么所考慮像素被分類為一個背景象素。
8.根據(jù)權(quán)利要求7所述的數(shù)字圖像質(zhì)量增強方法,其中,當(dāng)在步驟(b)中所考慮像素沒有被分類為背景象素時,如果所考慮像素的亮度分量大于高亮度閾值,或者飽和度分量大于飽和度閾值,那么所考慮像素被分類為一個圖像象素。
9.根據(jù)權(quán)利要求8所述的數(shù)字圖像質(zhì)量增強方法,其中,如果所考慮像素既沒有被分類為背景象素又沒有被分類為圖像象素,那么所考慮像素就被分類為一個文本象素。
10.根據(jù)權(quán)利要求1所述的數(shù)字圖像質(zhì)量增強方法,進一步包括(g)執(zhí)行平滑,以便在步驟(a)之后減少亮度分量的高頻率分量。
11.根據(jù)權(quán)利要求1所述的數(shù)字圖像質(zhì)量增強方法,其中,在步驟(c)中,當(dāng)在步驟(b)中所考慮像素被分類為一個背景象素時,在所考慮像素的上方向連續(xù)的包括所考慮像素的背景像素的數(shù)目被存儲為所考慮像素的背景歷史信息。
12.根據(jù)權(quán)利要求11所述的數(shù)字圖像質(zhì)量增強方法,其中,在步驟(c)中,當(dāng)在步驟(b)中所考慮像素被分類為一個背景象素時,如果在所考慮像素的上方向連續(xù)的包括所考慮像素的背景像素的數(shù)目是一個預(yù)定數(shù)目m或者更大,數(shù)目m被存儲為所考慮像素的背景歷史信息。
13.根據(jù)權(quán)利要求1所述的數(shù)字圖像質(zhì)量增強方法,其中,在步驟(c)中,當(dāng)在步驟(b)中所考慮像素被分類為一個圖像象素時,在所考慮像素的上方向連續(xù)的包括所考慮像素的圖像像素的數(shù)目被存儲為所考慮像素的圖像歷史信息。
14.根據(jù)權(quán)利要求13所述的數(shù)字圖像質(zhì)量增強方法,其中,在步驟(c)中,當(dāng)在步驟(b)中所考慮像素被分類為一個圖像象素時,如果在所考慮像素的上方向連續(xù)的包括所考慮像素的圖像像素的數(shù)目是一個預(yù)定數(shù)目p或者更大,數(shù)目p被存儲為所考慮像素的圖像歷史信息。
15.根據(jù)權(quán)利要求1所述的數(shù)字圖像質(zhì)量增強方法,其中,在步驟(c)中,當(dāng)在步驟(b)中所考慮像素被分類為一個非背景象素時,在所考慮像素的左方向連續(xù)的包括所考慮像素的非背景象素的數(shù)目被存儲為所考慮像素的圖像歷史信息。
16.根據(jù)權(quán)利要求15所述的數(shù)字圖像質(zhì)量增強方法,其中,在步驟(c)中,當(dāng)在步驟(b)中所考慮像素被分類為一個非背景象素時,如果在所考慮像素的左方向連續(xù)的包括所考慮像素的非背景象素的數(shù)目是一個預(yù)定數(shù)目r或者更大,數(shù)目r被存儲為所考慮像素的圖像歷史信息。
17.根據(jù)權(quán)利要求1所述的數(shù)字圖像質(zhì)量增強方法,其中步驟(d)包括(d1)使用關(guān)于存儲在步驟(c)中的所考慮像素的歷史信息,把所考慮像素分類為與連續(xù)背景象素相連接的一個背景特征象素和與連續(xù)圖像象素相連接的一個圖像特征象素中的任意一個;(d2)背景標(biāo)記在步驟(d1)中被分類為背景特征象素的所考慮像素,以致使所考慮像素屬于一個背景區(qū)域;和(d3)圖像標(biāo)記在步驟(d1)中被分類為圖像特征象素的所考慮像素,以致使所考慮像素屬于一個圖像區(qū)域。
18.根據(jù)權(quán)利要求17所述的數(shù)字圖像質(zhì)量增強方法,其中,如果在步驟(d1)中在所考慮行上的所考慮像素已經(jīng)被分類為一個圖像特征象素,那么步驟(d)進一步包括(d4)向所考慮像素左方向傳播圖像標(biāo)記,以致基于所考慮像素已經(jīng)被分類為圖像特征象素,在所考慮像素之前的連續(xù)象素屬于一個圖像區(qū)域。
19.根據(jù)權(quán)利要求17所述的數(shù)字圖像質(zhì)量增強方法,其中,如果在步驟(d1)中所考慮像素被分類為既不是一個背景特征象素又不是一個圖像特征象素,并且在所考慮行上的所考慮像素正上方的象素已經(jīng)被作圖像標(biāo)記,那么步驟(d)進一步包括(d5)向下方向傳播圖像標(biāo)記到所考慮像素之上的象素,以致所考慮像素屬于一個圖像區(qū)域。
20.根據(jù)權(quán)利要求19所述的數(shù)字圖像質(zhì)量增強方法,其中如果在步驟(d1)中所考慮像素被分類為既不是一個背景特征象素又不是一個圖像特征象素,并且在所考慮像素正上方的象素沒有被圖像標(biāo)記,那么步驟(d)進一步包括(d6)文本標(biāo)記所考慮像素,以致所考慮像素屬于一個文本區(qū)域。
21.根據(jù)權(quán)利要求17所述的數(shù)字圖像質(zhì)量增強方法,其中,如果在步驟(d1)中在所考慮行上的所考慮像素已經(jīng)被分類為一個圖像特征象素,那么步驟(d)進一步包括(d7)向所考慮像素右方向傳播圖像標(biāo)記,以致存在于所考慮像素之后并且存在于一個背景特征象素之前的所有象素屬于一個圖像區(qū)域。
22.根據(jù)權(quán)利要求17所述的數(shù)字圖像質(zhì)量增強方法,其中,如果在所考慮行上的所考慮像素之前的象素已經(jīng)被背景標(biāo)記,那么步驟(d)進一步包括(d8)如果所考慮像素是一個背景象素,背景標(biāo)記所考慮像素,以致使所考慮像素屬于一個背景區(qū)域,并且如果所考慮像素不是一個背景象素,文本標(biāo)記所考慮像素,以致使感興趣屬于一個文本區(qū)域。
23.根據(jù)權(quán)利要求17所述的數(shù)字圖像質(zhì)量增強方法,其中在步驟(d1)中,如果一個預(yù)定數(shù)目n的象素,在每一個象素中背景歷史信息的尺寸是一個預(yù)定數(shù)目m或者更大,并且在所考慮像素的左方向連續(xù),那么所考慮像素被分類為一個背景特征象素。
24.根據(jù)權(quán)利要求17所述的數(shù)字圖像質(zhì)量增強方法,其中在步驟(d1)中,如果一個預(yù)定數(shù)目q的象素,在每一個象素中圖像歷史信息的尺寸是一個預(yù)定數(shù)目p或者更大,并且在所考慮像素的左方向連續(xù),那么所考慮像素被分類為一個圖像特征象素。
25.根據(jù)權(quán)利要求17所述的數(shù)字圖像質(zhì)量增強方法,其中在步驟(d1)中,如果所考慮像素具有其尺寸是一個預(yù)定數(shù)目r或者更大的圖像歷史信息,也就是,如果r或者更多個象素沒有被分類為存在于所考慮像素左側(cè)的背景象素,那么所考慮像素被分類為一個圖像特征象素。
26.根據(jù)權(quán)利要求1所述的數(shù)字圖像質(zhì)量增強方法,其中步驟(e)包括以這樣的方式提高圖像質(zhì)量,即根據(jù)在步驟(d)中指定為一個文本區(qū)域的所考慮像素的亮度,應(yīng)用不同的圖像質(zhì)量增強。
27.根據(jù)權(quán)利要求26所述的數(shù)字圖像質(zhì)量增強方法,其中步驟(e)包括基于兩個亮度閾值把所考慮像素的亮度分類為三個亮度組,處理一個最亮象素以便成為全白,處理一個最暗象素以便成為全黑,并且加強一個中間亮度象素。
28.根據(jù)權(quán)利要求27所述的數(shù)字圖像質(zhì)量增強方法,其中通過確定一個強調(diào)系數(shù)為一個預(yù)定值或更大來執(zhí)行用于加強處理的非加強屏蔽,以便增加邊緣強調(diào)效果。
29.根據(jù)權(quán)利要求1所述的數(shù)字圖像質(zhì)量增強方法,其中步驟(e)包括執(zhí)行關(guān)于在步驟(d)中指定為一個圖像區(qū)域的所考慮像素執(zhí)行的非加強屏蔽。
30.根據(jù)權(quán)利要求29所述的數(shù)字圖像質(zhì)量增強方法,其中非加強屏蔽是通過確定強調(diào)系數(shù)為一個預(yù)定值或者更小來執(zhí)行的。
31.一種數(shù)字圖像質(zhì)量增強設(shè)備,包括一個分類裝置,用于把在圖像數(shù)據(jù)中的所考慮像素分類為一種文本區(qū)域、一種背景區(qū)域、和一種圖像區(qū)域中的任意一個,其中此圖像數(shù)據(jù)是由具有預(yù)定分辨率的象素組成,并通過掃描包括混合背景、文本和圖像的原稿獲得;和一個圖像質(zhì)量增強裝置,用于根據(jù)所考慮像素所屬的區(qū)域提高一個圖像質(zhì)量到不同的程度,其中分類裝置包括一個色彩數(shù)據(jù)轉(zhuǎn)換單元,用于把所考慮像素的RGB色彩數(shù)據(jù)轉(zhuǎn)換為具有一個亮度分量和一個飽和度分量的亮度/飽和度數(shù)據(jù);一個象素分割單元,用于通過使用亮度/飽和度數(shù)據(jù)把所考慮像素分類為背景象素、圖像象素、或者文本象素中的任何一種,并且分類結(jié)果作為一個象素分割信號輸出;一個歷史信息存儲單元,用于通過使用象素分割信號計算在所考慮像素之前的連續(xù)背景象素的數(shù)目,并且在相應(yīng)于所考慮像素的一個預(yù)定地址中存儲所計算的象素數(shù)目為背景歷史信息,并且二者擇一地,通過計算在所考慮像素之前的連續(xù)圖像象素的數(shù)目,并且在相應(yīng)于所考慮像素的一個地址中存儲所計算的象素數(shù)目為圖像歷史信息;一個區(qū)域分割單元,用于接收來自歷史信息存儲單元的關(guān)于所考慮像素的背景或者圖像歷史信息,并且利用所接收的背景或者圖像歷史信息,把所考慮像素分類為文本區(qū)域、背景區(qū)域、或者圖像區(qū)域中的任何一種,如果所考慮像素被分類為一個文本區(qū)域,那么標(biāo)記所考慮像素為一個文本區(qū)域,如果所考慮像素被分類為一個背景區(qū)域,那么標(biāo)記所考慮像素為一個背景區(qū)域,并且如果所考慮像素被分類為一個圖像區(qū)域,那么標(biāo)記所考慮像素為一個圖像區(qū)域。
32.根據(jù)權(quán)利要求31所述的數(shù)字圖像質(zhì)量增強設(shè)備,其中圖像質(zhì)量增強設(shè)備通過接收來自區(qū)域分割單元的用于所考慮像素的文本標(biāo)記信號、用于所考慮像素的背景標(biāo)記信號、或者用于所考慮像素的圖像標(biāo)記信號來改善圖像質(zhì)量,并且基于一個預(yù)定亮度閾值,把文本標(biāo)記所考慮像素的亮度/飽和度數(shù)據(jù)分類為至少兩個類別。
33.根據(jù)權(quán)利要求31所述的數(shù)字圖像質(zhì)量增強設(shè)備,其中圖像質(zhì)量增強設(shè)備接收來自區(qū)域分割單元的用于所考慮像素的文本標(biāo)記信號、用于所考慮像素的背景標(biāo)記信號、或者用于所考慮像素的圖像標(biāo)記信號,并且使用非加強屏蔽來改善圖像標(biāo)記的所考慮像素的圖像質(zhì)量。
34.根據(jù)權(quán)利要求31所述的數(shù)字圖像質(zhì)量增強設(shè)備,進一步包括一個平滑單元,用于執(zhí)行平滑以便使用低通濾波器來減少亮度飽和度數(shù)據(jù)的亮度分量的高頻分量,并且輸出包括一個平滑的亮度分量的新亮度/飽和度數(shù)據(jù),其中象素分割單元使用新亮度/飽和度數(shù)據(jù)把所考慮像素分類成一個背景象素、一個圖像象素、或者一個文本象素之一,并且輸出分類結(jié)果作為一個象素分割信號。
全文摘要
本發(fā)明提供一種數(shù)字圖像質(zhì)量增強方法。在由具有預(yù)定分辨率的像素組成的圖像數(shù)據(jù)中,圖像數(shù)據(jù)是通過掃描包括混合的背景、文本和圖像的原稿而獲得,所考慮像素被分類為文本區(qū)域、背景區(qū)域、和圖像區(qū)域中的一個,并且所考慮像素的圖像質(zhì)量被改善為根據(jù)所考慮像素屬于哪一區(qū)域的不同程度。然后,鄰近所考慮像素的一個像素被設(shè)定為一個新的所考慮像素,并且新的所考慮像素經(jīng)受如上所述的相同圖像質(zhì)量增強。此方法包括色彩數(shù)據(jù)轉(zhuǎn)換步驟、像素分割步驟、歷史信息存儲步驟、區(qū)域分割步驟、圖像質(zhì)量增強步驟、和用于確定所考慮像素是否為最后像素的步驟。
文檔編號H04N1/56GK1471302SQ0310344
公開日2004年1月28日 申請日期2003年1月30日 優(yōu)先權(quán)日2002年7月27日
發(fā)明者林圣炫 申請人:三星電子株式會社