專利名稱:圖像壓縮方法及裝置、圖像編碼裝置及圖像編碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對彩色文檔圖像進行壓縮處理的圖像壓縮技術(shù),以及對彩色圖像進行編碼的圖像編碼技術(shù)。
以往作為壓縮彩色圖像的方法有,比如用誤差擴散等壓縮為具有偽灰度的2值圖像的方法、以JPEG方式壓縮的方法、變換成8位調(diào)色板顏色并進行ZIP壓縮或LZW壓縮的方法等(例如參照日本專利申請公開特開2002-077631號公報)。
但是,用偽灰度的2值圖像雖然容量(數(shù)據(jù)量)小,但顏色信息損失掉了。還有,在用JPEG方式進行壓縮的情況下,由于JPEG特有的蚊式噪聲(mosquito noise)而產(chǎn)生壓縮大小和字符品質(zhì)的折衷。
還有,因為彩色文檔圖像的大部分的顏色分布不是離散的而是局部的,變換為調(diào)色板顏色并進行ZIP壓縮或LZW壓縮的方法,在用多位保持該圖像的情況下本來效率就差,因此,對其壓縮后的結(jié)果壓縮效率也當(dāng)然變差。
還有,根據(jù)日本專利中請公開特開2002-077631號公報中所記載的方法,通過基于區(qū)域判定和MMR的2值壓縮和基于ZIP的可逆壓縮與基于JPEG的非可逆壓縮的組合,對通常的字符區(qū)域可以得到高的質(zhì)量,但對于象例如在原稿上進行了手工修正的部分就難以進行區(qū)域判定,就成為JPEG壓縮的對象并產(chǎn)生蚊式噪聲這樣的問題。
本發(fā)明的目的還在于提高壓縮效率、進行再現(xiàn)性好的壓縮。
為了解決上述問題,本發(fā)明提供一種壓縮彩色圖像的圖像壓縮方法,其特征在于,包括以下步驟把上述彩色圖像的各象素變換成對應(yīng)顏色值所賦予的索引,并生成包含每個被索引化的顏色的象素數(shù)的顏色信息和把上述各象素變換成索引后的索引圖像的索引變換步驟;把與上述索引圖像中的預(yù)定的索引對應(yīng)的顏色值設(shè)為上述彩色圖像的背景色的背景色決定步驟;根據(jù)上述顏色信息及上述背景色決定在對每個索引壓縮上述彩色圖像時的順序的順序決定步驟;從上述索引圖像分別對每個索引生成2值圖像的2值圖像生成步驟;依照上述順序壓縮上述2值圖像的壓縮步驟;以及合并包含上述彩色圖像的大小及上述背景顏色的顏色值的背景數(shù)據(jù)和上述每個索引的上述2值圖像的壓縮數(shù)據(jù)生成壓縮圖像數(shù)據(jù)的生成步驟。
此外,本發(fā)明提供一種對圖像進行編碼的圖像編碼裝置,其特征在于,包括對原圖像施加減色處理并生成減色圖像的減色處理裝置;對包含在上述減色圖像中的每個顏色,生成與在上述減色圖像中有顏色的區(qū)域相關(guān)的顏色信息的顏色信息生成裝置;對包含在上述減色圖像中的每個顏色,生成在上述減色圖像中有顏色的區(qū)域的顏色索引圖像的局部圖像生成裝置;在基于上述顏色信息生成裝置的顏色信息中,更新并合并表示較近顏色的顏色信息的第1更新裝置;參照由上述第1更新裝置所更新的顏色信息,更新并合并表示較近亮度色差的顏色信息的第2更新裝置;根據(jù)基于上述第1更新裝置及上述第2更新裝置的合并,求得相應(yīng)的合并目標和合并源的顏色索引圖像邏輯或圖像,進而在生成該邏輯或圖像的2值圖像后進行壓縮,并生成由該壓縮數(shù)據(jù)和由對應(yīng)該壓縮數(shù)據(jù)的上述第2更新裝置所更新的顏色信息構(gòu)成的2值圖像壓縮數(shù)據(jù)的壓縮裝置;以及生成表示包含在象素數(shù)最多的上述區(qū)域的顏色信息中的顏色的數(shù)據(jù),和包含基于上述壓縮裝置的上述2值圖像壓縮數(shù)據(jù)的輸出數(shù)據(jù)的壓縮數(shù)據(jù)生成裝置。
此外,本發(fā)明提供一種對圖像進行編碼的圖像編碼方法,其特征在于,包括以下步驟對原圖像施加減色處理并生成減色圖像的減色處理步驟;對包含在上述減色圖像中的每個顏色,生成與在上述減色圖像中有顏色的區(qū)域相關(guān)的顏色信息的顏色信息生成步驟;對包含在上述減色圖像中的每個顏色,生成在上述減色圖像中有顏色的區(qū)域的顏色索引圖像的局部圖像生成步驟;在基于上述顏色信息生成步驟的顏色信息中,更新并合并表示較近顏色的顏色信息的第1更新步驟;參照在上述第1更新步驟中所更新的顏色信息,更新并合并表示較近亮度色差的顏色信息的第2更新步驟;根據(jù)基于上述第1更新步驟及上述第2更新步驟的合并,求得相應(yīng)的合并目標和合并源的顏色索引圖像邏輯或圖像,進而在生成該邏輯或圖像的2值圖像后進行壓縮,并生成由該壓縮數(shù)據(jù)和由對應(yīng)該壓縮數(shù)據(jù)的上述第2更新步驟中所更新的顏色信息構(gòu)成的2值圖像壓縮數(shù)據(jù)的壓縮步驟;以及生成表示包含在象素數(shù)最多的上述區(qū)域的顏色信息中的顏色的數(shù)據(jù),和包含基于上述壓縮步驟的上述2值圖像壓縮數(shù)據(jù)的輸出數(shù)據(jù)的壓縮數(shù)據(jù)生成步驟。
本發(fā)明的其他特征以及優(yōu)點,通過以附圖為參照的下面的說明將會弄明白。此外,在附圖中,對相同或相似的結(jié)構(gòu)附加相同的參照標號。
附圖包含在說明書中,構(gòu)成其一部分,表示本發(fā)明的實施形式,并與說明書的記述一起用于說明本發(fā)明的原理。
圖1為用于說明壓縮在本發(fā)明的第1壓縮模式中的彩色文檔圖像的壓縮裝置的細節(jié)構(gòu)成的方框圖。
圖2為用于說明在本發(fā)明的第1壓縮模式中的彩色圖像的壓縮處理流程的流程圖。
圖3A~E為表示在第1壓縮模式中的顏色信息排序(sort)單元105中的排序(sorting)權(quán)重系數(shù)的例子的圖。
圖4為用于說明在第1壓縮模式中的壓縮數(shù)據(jù)112的構(gòu)成的圖。
圖5為用于詳細說明如在圖2的壓縮處理中的步驟S204所示的中間色削減單元107的動作步驟的流程圖。
圖6為用于說明圖5中的步驟S503~S505中的處理的細節(jié)的流程圖。
圖7為用于說明構(gòu)成作為本實施形式中的壓縮處理對象的彩色文檔圖像的數(shù)據(jù)的示意圖。
圖8A~C為用于說明前景色圖像和中間色圖像和補全中間色圖像的示意圖。
圖9為用于說明同一實施形式中的補全處理的原理的示意圖。
圖10為用于說明實施在第2壓縮模式中的圖像壓縮方法用的處理及中間圖像的方框圖。
圖11為用于說明在字符區(qū)域檢測單元1104中的字符區(qū)域檢測處理的流程圖。
圖12為用于說明在字符顏色抽取單元1108中的字符顏色抽取處理的流程圖。
圖13為用于說明在第2壓縮模式中的單色抽取處理的流程圖。
圖14為說明在單色抽取處理中的代表值的算出方法的圖。
圖15為說明由掃描器產(chǎn)生的字符部的過渡部分(灰度)的圖。
圖16為用3維直方圖表示由掃描器產(chǎn)生的字符部的過渡部分(灰度)的圖。
圖17A~C為用于說明字符填充處理的概要的圖。
圖18為用于說明字符填充處理的流程圖。
圖19為表示在本發(fā)明的實施形式2中的圖像編碼裝置的功能構(gòu)成和在各單元中所處理的或處理后的數(shù)據(jù)的圖。
圖20為在本發(fā)明的實施形式2中的圖像編碼裝置所進行的圖像編碼處理的流程圖。
(實施形式1)在以下的實施形式中說明例如可裝載在彩色復(fù)印機上的彩色圖像的壓縮技術(shù)。
還有,作為彩色復(fù)印機的功能有比如彩色復(fù)印功能、彩色打印功能及彩色掃描器功能,但本實施形式中說明的壓縮技術(shù)可以適用在其中的彩色復(fù)印功能及彩色掃描器功能上。具體來說,是一種在壓縮通過讀取彩色原稿所得到的彩色圖像數(shù)據(jù)時使用的壓縮技術(shù)。
還有,作為彩色掃描器的功能有例如壓縮通過讀取彩色原稿所得到的彩色圖像數(shù)據(jù)向外部發(fā)送的數(shù)據(jù)發(fā)送功能及壓縮該彩色圖像數(shù)據(jù)并存儲在復(fù)印機內(nèi)部的存儲裝置中的保存功能,是一種可裝載在這兩個功能上的一種壓縮技術(shù)。
在本實施形式中如以下所述那樣具備多個壓縮模式。這些模式根據(jù)成為壓縮對象的彩色圖像(彩色原稿)的內(nèi)容是什么樣的內(nèi)容而被選擇。此選擇既可以是自動的,也可以是用戶手動的。
(第1壓縮模式)首先,作為與第1壓縮模式相關(guān)的實施形式,可以執(zhí)行以下所詳細說明的壓縮方法。此壓縮模式適用于由少的顏色數(shù)構(gòu)成的彩色圖像的壓縮。因此,為了自動選擇此壓縮模式,只要可以判斷彩色圖像的顏色分布或判定字符及照片區(qū)域并根據(jù)其比例進行判斷即可?;蛘?,只要用戶用手動進行選擇即可。
以下參照附圖對第1壓縮模式所實施的構(gòu)成或方法進行詳細說明。
圖7為用于說明構(gòu)成作為本實施形式中的壓縮處理對象的彩色文檔圖像的數(shù)據(jù)的示意圖。如圖7所示,在本實施形式中使用這樣的原稿作為原始的彩色原稿,即在白底上形成有紅字和黑字、還加有用藍色圓珠筆手寫的校正。通過對用掃描器讀入該原稿后的彩色圖像(即原圖像)進行減色處理、同色判定處理、中間色削減處理等把該彩色圖像分割為白色、黑色、紅色、藍色的局部2值圖像。
這里,如果比較被分割后的各顏色的象素數(shù),通常是背景的白色最多,因此,此顏色被判定為背景色。然后,被判定為背景色的白色不作為圖像數(shù)據(jù)保存,其數(shù)據(jù)用原稿的實際大小和顏色值保存,關(guān)于剩下的黑色、紅色、藍色的顏色,如圖7所示那樣對每種顏色分別分割為局部(2值)圖像。這樣,彩色文檔圖像和彩色照片等自然圖像不同,顏色分布是局部的,因此,壓縮效率提高。
這里,圖8A~C為用于說明前景色圖像、中間色圖像和補全中間色圖像的示意圖。即,通過中間色削減處理而沒被削減的局部2值圖像變成圖8B所示那樣,因此,如圖8C所示的補全中間色圖像那樣補全內(nèi)部并減少邊緣量,以提高壓縮效率在圖像展開時按照補全中間色圖像、接著是前景色圖像的順序進行展開。通過這樣處理,用成為上層的前景色圖像蓋寫所補全的部分,就可重現(xiàn)和沒有被補全處理的情形一樣的圖像,而且可以減小壓縮容量。
圖9為用于說明本實施形式中的補全處理的原理的示意圖。在圖9中,在分層表現(xiàn)由“A”圖案的橫線91所示的部分的情況下變成左下圖92那樣。這里,中間色是由具有8個邊緣的圖案表達的,但如果在前景色之前就進行描繪,則即便如右圖那樣進行補全處理,從上面看到的情形也與是否有補全處理無關(guān),看起來都一樣。這里,如果檢查補全處理后的中間色的邊緣數(shù),則會發(fā)現(xiàn)如右下圖93所示那樣是4個,減少為補全處理前的一半。由此,局部2值圖像的冗余性增高,從而提高壓縮效率。
這里,關(guān)于壓縮順序,如果把具有如圖8B所示的中間色圖像那樣的圖案的顏色選為高位,則壓縮容量減小,但實際上檢查圖像的圖案會增大處理的負擔(dān)。通常,在文檔圖像中成為前景色的顏色采用比如白底黑色或藍底黃色等可視性高的顏色,成為問題的中間色是例如白和黑之間的灰色。于是,對被減色后剩余的顏色用亮度和色差等進行排序,以被抽取的背景色為基準決定壓縮順序(蓋寫順序),由此可以得到和檢查圖像的圖案的情形同樣的效果。
圖1為用于說明壓縮在本發(fā)明的第1壓縮模式中的彩色文檔圖像的壓縮裝置的細節(jié)構(gòu)成的方框圖。在圖1中,101為通過例如用掃描器等讀取彩色原稿所得到的原圖像(彩色圖像)。還有,102為減色處理單元,對于被輸入的原圖像101,根據(jù)預(yù)先確定的顏色數(shù)進行單純減色處理,進行索引化。
103為顏色信息,由表示被減色處理單元102所索引化的每種顏色象素數(shù)、顏色重心和顏色分布范圍的數(shù)據(jù)構(gòu)成。104為索引彩色圖像,是用減色處理單元102所減色的圖像的輸出結(jié)果。
105為顏色信息排序單元,通過象素數(shù)對顏色信息103的數(shù)據(jù)進行排序。還有,106為同色合并單元,比較由顏色信息排序單元105所排序的顏色信息103并進行同色判斷,然后進行合并處理并更新顏色信息。
107為中間色削減單元,對顏色信息103附近的顏色信息進行合并處理,削減位于中間色的顏色數(shù)。這里,在經(jīng)處理之后,剩余的顏色信息的最突出的顏色的重心值成為背景色數(shù)據(jù)108。113為壓縮順序決定單元,用亮度對經(jīng)中間色削減單元107削減后的顏色信息進行排序,以背景色的顏色信息為基準決定進行壓縮的順序(蓋寫順序)。
109為2值圖像生成·壓縮單元,依照壓縮順序決定單元113所決定的順序?qū)Τ尘吧獾氖S喔黝伾畔⑸?值圖像并進行壓縮。此時,壓縮順序高的顏色信息的圖像用低順序的圖像數(shù)據(jù)進行補全處理。
110為2值圖像壓縮數(shù)據(jù),是由用2值圖像生成·壓縮單元109生成的數(shù)據(jù)組組成的,各自帶有顏色信息。還有,112為數(shù)據(jù)合并單元,把背景色數(shù)據(jù)108和2值圖像壓縮數(shù)據(jù)110合并,并生成壓縮圖像112。
也就是說,如以下所詳細說明,在本實施形式中對壓縮彩色圖像(特別是彩色文檔圖像)的圖像壓縮方法進行說明。其步驟的特征在于首先,通過減色處理單元102把彩色圖像的各象素變換成對應(yīng)顏色值所賦予的索引,并生成包含每個被索引化的顏色的象素數(shù)的顏色信息103和把各象素變換為索引后的索引圖像(索引彩色圖像104),然后,通過顏色信息排序單元105把與在索引圖像中的預(yù)定的索引對應(yīng)的顏色值設(shè)為彩色圖像的背景色,還有,通過壓縮順序決定單元113,根據(jù)顏色信息及背景色決定在對各索引壓縮彩色圖像時的壓縮順序,還有,通過2值圖像生成·壓縮單元109從索引圖像對各索引生成2值圖像,同時依照壓縮順序壓縮2值圖像,然后,通過數(shù)據(jù)合并單元111合并包含彩色圖像的大小及背景色的顏色值的背景數(shù)據(jù)108和每個索引的2值圖像的壓縮數(shù)據(jù)并生成壓縮圖像數(shù)據(jù)(壓縮數(shù)據(jù)112)。
圖2為用于說明在本發(fā)明的第1壓縮模式中的彩色圖像的壓縮處理流程的流程圖。
首先,當(dāng)作為原圖像101的彩色圖像被輸入時,減色處理單元102按預(yù)先所決定的顏色數(shù)對該原圖像101進行減色處理,并輸出顏色信息103和索引彩色圖像104。這里,在本實施形式中,關(guān)于索引化,其特征在于生成使一個索引與預(yù)定范圍內(nèi)的顏色值相對應(yīng)并使彩色圖像的位數(shù)減少的索引圖像(索引彩色圖像104)。
還有,本實施形式中的減色處理是把全彩色RGB24位數(shù)據(jù)減低成R-G-B分別是2-2-2、3-3-2、3-3-3位等的位數(shù)。此位數(shù)的選擇方法可以根據(jù)用什么程度的精度進行顏色判定來任意選擇。在以下所示的實施形式中,以選擇了2-2-2位的情形為例進行說明。還有,從減色處理單元102輸出的顏色信息103是由所減色的每種顏色的象素數(shù)、顏色重心(顏色的平均值)和表示顏色分布范圍的坐標數(shù)據(jù)構(gòu)成的。
也就是說,在本實施形式中的上述圖像壓縮方法中,上述索引變換處理,其特征在于作為顏色信息,除了計算象素數(shù)之外還計算彩色圖像的被索引化的各顏色的顏色重心和顏色分布范圍。
接著,通過減色處理單元102得到的顏色信息103向顏色信息排序單元105輸入,并根據(jù)賦予與其象素數(shù)和索引序號相應(yīng)的權(quán)重的值進行排序(步驟S202)。
排序基本上是象素數(shù)越多的信息就越使其位于高位,但上述加權(quán)即系數(shù)是按照如下所調(diào)整的值,即在比較了象素數(shù)差不多的顏色信息的情況下,越接近原色的顏色越靠高位。圖3A~E為表示在第1壓縮模式中的顏色信息排序單元105上的排序權(quán)重系數(shù)的例子的圖。如圖3所示,在本實施形式中把系數(shù)0.9~1.2分配給RGB各4灰度級的各個級。此值也可以是任意的,根據(jù)減色處理單元102上的減色數(shù)和顏色的優(yōu)先級改變。
還有,經(jīng)顏色信息排序單元105所排序的顏色信息被輸入到同色合并單元106。在同色合并單元106上分別比較顏色信息的顏色重心的值,在其距離接近的情況下作為同一顏色進行顏色信息的合并(步驟S203)。此處理是把本來是相同顏色但因RGB的某一個值接近于最初減色處理中的閾值而分離為多色的顏色恢復(fù)成一種顏色的處理。被進行合并的顏色信息剩下所排序的高位的顏色信息,各顏色的象素數(shù)、顏色重心及顏色分布范圍的各數(shù)據(jù)被重新計算。
即,與本實施形式相關(guān)的圖像壓縮處理,其特征在于在顏色信息中進行合并顏色重心相近的顏色信息的同色合并處理。還有,該同色合并處理,其特征在于在把相同顏色合并為排序高位的顏色的情況下重新計算所計數(shù)的象素數(shù)、顏色分布范圍及顏色值的重心。同色合并處理其特征還在于根據(jù)把彩色圖像中的各顏色的象素數(shù)與依照顏色空間上的位置預(yù)先所確定的系數(shù)取積后的值進行排序,并以排序順序為基準進行同色判定。
還有,在中間色削減單元107中把由同色合并單元106所更新后的顏色信息的顏色重心的值變換為亮度色差的值,分別比較該值并進行臨近的顏色信息之間的合并處理(步驟S204)。由此,對位于半色調(diào)的顏色數(shù)進行削減。此處理的目的是例如即便原文檔圖像為黑白的原稿,在用掃描器讀入原稿的情況下除掉在背景的白色和字符部的黑色的邊界部分中從白到黑產(chǎn)生的很多的灰度成分。具體來說,使靠近白色的灰色變成白色,使靠近黑色的灰色變成黑色。還有,對其他顏色也同樣處理。這樣,根據(jù)顏色的象素數(shù)和與顏色空間上的位置相對應(yīng)的系數(shù)的積的大小進行排序,在根據(jù)其順序進行同色合并處理及中間色削減處理時因不重新計算顏色重心的值而改善顏色的再現(xiàn)性。
還有,在同色合并單元106中,被削減合并的顏色信息和在步驟S203中的顏色信息的更新一樣被重新計算并更新,但只有顏色重心的值保留原樣不變。這是因為顏色重心的值是最終的顯示色,在合并中間色求取其顏色重心的情況下防止,比如黑色混著灰色變成偏亮的色或白混著灰色變成偏暗的色。所合并的顏色信息的代表色采用排序順序高的顏色信息的顏色重心。這里,在排序中不僅使用象素數(shù)還使用權(quán)重系數(shù),這是因為使彩色文檔原稿中所使用的原色系的顏色優(yōu)先的緣故。
具體來說,與本實施形式相關(guān)的圖像壓縮處理其特征在于,進行合并在顏色信息中亮度色差相近的顏色信息并削減中間色的中間色削減處理。然后,該中間色削減處理其特征在于以排序順序為基準進行中間色的削減。中間色削減處理其特征還在于在把同類色合并為排序高位的顏色的情況下重新計算所計數(shù)的象素數(shù)和顏色分布范圍而僅對顏色重心不重新計算。
然后,把具有經(jīng)中間色削減單元107處理后的結(jié)果的最高位顏色信息的顏色重心的值作為背景色數(shù)據(jù)108輸出(步驟S205)。也就是說,與本實施形式相關(guān)的圖像壓縮處理其特征在于把位于排序最高位的顏色的顏色值的重心的值作為背景色抽取。
還有,對顏色信息進行排序,使用其結(jié)果并以在步驟S205中求得的背景色位基準決定壓縮順序(蓋寫順序)(步驟S206)。例如,在由中間色削減單元107所削減的顏色信息為識別序號為1~5的5色,且背景色的識別序號為4的情況下,當(dāng)用亮度排序后的結(jié)果為2、3、5、1、4時壓縮順序就成為1、5、3、2的順序。還有,在使用了許多輪廓字符的原稿時則成為4、1、5、3、2的順序,壓縮順序設(shè)為1、5、3、2的順序。還有,在如2、3、4、5、1那樣推測為輪廓字符和通常的字符混雜的情況下,為了降低文檔中的被認為使用頻度低的輪廓字符的優(yōu)先度,將壓縮順序設(shè)為5、1、3、2。
然后,用在中間色削減單元107上剩下的顏色信息,壓縮順序決定單元113的結(jié)果和索引彩色圖像104生成各顏色的2值圖像,并用MMR等方法進行壓縮處理(步驟S207)。還有,這里所生成的2值圖像為與顏色信息所保持的顏色分布范圍相應(yīng)的大小,在只存在于原稿的一部分的情況下只對該部分進行壓縮保存。
也就是說,與本實施形式相關(guān)的圖像壓縮方法,在進行背景色決定中把與最大象素數(shù)的索引對應(yīng)的顏色值設(shè)為上述彩色圖像的背景色。而且,其特征在于,不執(zhí)行關(guān)于該索引的壓縮順序(蓋寫順序)的決定、2值圖像的生成及壓縮。
各顏色的2值圖像,比如把索引彩色圖像104的索引序號設(shè)為0~63,當(dāng)索引60和62的顏色信息被合并在索引63上時,則其2值圖像是把索引60和62的數(shù)據(jù)邏輯或后的圖像,并用索引63具有的顏色信息的顏色重心的值描繪。這是各顏色的2值圖像的基本部分,并依照在步驟S206所決定的順序進行補全處理。
在此補全處理中,設(shè)背景色的識別序號為1,其余顏色的順序為2、3、4。識別序號為表示所合并的索引序號的集合的臨時標識符。例如,某8個象素的排列為1、2、3、4、2、3、3、1的情況下,首先看看優(yōu)先順序最高的識別序號2。如果只關(guān)注識別序號2,其位模式為01001000,經(jīng)過補全處理后成為01111000的位模式。還有,關(guān)于識別序號3、4,分別為00100110和00010000。
結(jié)果,所生成的是2值圖像壓縮數(shù)據(jù)110,是由顏色的值、位置和大小及MMR壓縮的數(shù)據(jù)主體組成的各顏色信息數(shù)據(jù)的數(shù)據(jù)組。然后,在數(shù)據(jù)合并單元111上匯總背景色數(shù)據(jù)108和2值圖像壓縮數(shù)據(jù)110生成并輸出壓縮數(shù)據(jù)112(步驟S208)。也就是說,與本實施形式相關(guān)的圖像壓縮處理,其特征在于對2值圖像進行MMR壓縮。
圖4為用于說明在第1壓縮模式中的壓縮數(shù)據(jù)112的構(gòu)成的圖。首先,在首標部分保存有所輸入的文檔圖像(原稿)大小、背景色的顏色值、圖像分辨率等信息。這里,基本上象素數(shù)最多的顏色被選為背景色,因此,在原稿是被打印在紅色等彩色紙上的情況下輸入紅色系的值。但是,通常認為背景大多數(shù)為白色,因此,也可以進行背景色的白色判定,在被判定為白色的情況下略去背景色的值。白色判定為,例如在RGB的各自的值都在一定的值以上,且各自的值之間的差在一定的值以內(nèi)的情況下被視為白色。
還有,如圖4所示,緊接著首標部分的是各顏色的壓縮數(shù)據(jù)。壓縮數(shù)據(jù)是由該顏色的值、該顏色所存在的位置坐標和大小、MMR壓縮的數(shù)據(jù)主體構(gòu)成的。例如,在除背景色之外剩下的顏色數(shù)為N的情況下,就存在與該顏色數(shù)部分相同結(jié)構(gòu)的數(shù)據(jù)。設(shè)此保存順序遵循壓縮順序決定單元113。還有,在被輸入的圖像為白紙等單色原稿的情況下,就不生成此部分數(shù)據(jù)。
還有,在被輸入的圖像為黑白原稿的情況下,彩色壓縮數(shù)據(jù)數(shù)為1,因此,成為與2值圖像的幾乎等價的數(shù)據(jù)量。這里,如果黑色象素只是原稿的一部分,則MMR壓縮數(shù)據(jù)只壓縮該部分因而比通常的MMR壓縮還小。
接著,是關(guān)于把此壓縮數(shù)據(jù)112恢復(fù)成原圖像的方法,可以在用存儲在圖4所示的首標部分中的背景色填滿原稿的整個區(qū)域后,可以依照所保存的順序展開彩色壓縮數(shù)據(jù)的MMR圖像,并以該圖像為掩碼用顏色的值在所存儲的位置上進行蓋寫。這里,保存順序遵循壓縮順序決定單元113的,展開也是依照此順序進行的,因此,不論,在2值圖像生成·壓縮單元109上有沒有補全處理展開的結(jié)果都一樣。這樣,通過按照壓縮順序補全局部2值圖像,來提高壓縮效率。還有,通過以背景色為基準決定壓縮順序,在進行了補全處理的情況下也能夠高速檢查提高壓縮效率的順序。
圖5為用于詳細說明在圖2的壓縮處理中的步驟S204中所示的中間色削減單元107的動作步驟的流程圖。
首先,依照顏色信息的排序順序生成列表(步驟S501)。然后,按照此列表進行中間色的削減處理。接著,把顏色信息的顏色重心的值從RGB變換為YCrCb的亮度色差信號并添加數(shù)據(jù)(步驟S502)。進行向色差的變換是因為適合于合并亮度差相近的同類色而削減中間色的緣故。
在步驟S503、S504、S505中比較被附加在各自的顏色信息上的Y、Cr、Cb的各成分的差是否在各自預(yù)先所確定的閾值以內(nèi),如果是在該條件以內(nèi)則進行顏色信息的合并以削減顏色數(shù)。圖6為用于說明圖5中的步驟S503~S505中的處理的細節(jié)的流程圖。還有,設(shè)圖6所示的流程圖的處理與在步驟S503~S505的處理中只是進行YCrCb的比較的閾值不同。
首先,選擇顏色信息I為從圖5的步驟S501的處理所給予的顏色信息的列表的最高位(步驟S601)。接著,把顏色信息I的YCrCb值儲存為Y′Cr′Cb′(步驟S602)。然后,把該列表最低位的顏色信息選擇為顏色信息J(步驟S603)。
這里,比較顏色信息I、J的Y、Cr、Cb的各自的值,檢查其差是否在圖5的步驟S503~S505的各步驟中所給予的閾值以內(nèi)(步驟S604) 。
其結(jié)果在判斷為在該閾值以內(nèi)的情況下(YES),則轉(zhuǎn)到步驟S606,否則(NO)轉(zhuǎn)到步驟S608。但是,在顏色信息I、J的Cr或Cb值的符號不同的情況下,則檢查顏色信息J的Cr或Cb值的絕對值,如果在預(yù)先所決定的某一定值以上則使此條件不成立。例如,即便顏色信息I、J的Cr值的差是在圖5所示的流程圖中所給予的閾值以內(nèi),在其符號不同的情況下,則把顏色信息J的絕對值和預(yù)先決定的值進行比較,在小的情況下則轉(zhuǎn)到步驟S605,在大的情況下則轉(zhuǎn)到步驟S608。
對Cb的值也進行同樣的處理。這是為了防止在只單純地根據(jù)由圖5的流程所設(shè)定的閾值的大小比較差而進行合并的情況下象淡藍和淡紅色這樣的不同顏色之間的顏色信息被合并。相反,當(dāng)設(shè)定閾值使得象淡藍和淡紅色這樣的不同顏色之間不被合并時,就不能合并象藍色和淡藍色這樣的同類色。
還有,在步驟S606中把顏色信息J的數(shù)據(jù)合并到顏色信息I上。由此,顏色信息I的顏色數(shù)、分布范圍等各數(shù)據(jù)被更新,但顏色重心的值不更新。也可以計算合并后的顏色重心,并使之反映于在步驟S602所存儲的Y′Cr′Cb′上。
接著,從列表中去掉顏色信息J的數(shù)據(jù)(步驟S607)。然后,在步驟S608中檢查位于顏色信息J的列表高一位的顏色信息是否為I。其結(jié)果在不是I(NO)的情況下則轉(zhuǎn)到步驟S609,在是I(YES)則轉(zhuǎn)到步驟S610。
在步驟S609中,把位于比顏色信息J高一位的顏色信息設(shè)定成顏色信息J并返回步驟S604。另一方面,在步驟S610中把存儲的Y′Cr′Cb′的值恢復(fù)成顏色信息I的YCrCb,并把在圖5及圖6所示的流程圖中進行閾值比較的基準值更新為經(jīng)步驟S604~S609所合并的顏色信息本來的顏色重心的值。
在步驟S611中檢查位于比顏色信息I低一位的顏色信息是否為最低位,或是否在步驟S607中從列表上被刪除而不存在,如果存在且不是最低位(NO)則轉(zhuǎn)到步驟S612。然后,在步驟S612中,把位于比顏色信息I低一位的顏色信息設(shè)定為I并返回步驟S602。另一方面,如果在步驟S611中不是上述情形(YES)則結(jié)束處理,把更新后的顏色信息列表返回圖5的流程圖。
在本實施形式中,在由圖6所說明的步驟S503~S505的各步驟中所設(shè)定的閾值,為了合并同類色的目的,亮度Y的閾值與色差CrCb相比設(shè)定得稍微大一些。然后,在步驟S503中閾值設(shè)小些,合并亮度色差的差較小的同類色的顏色信息,隨著成為步驟S504、S505,閾值設(shè)得越大,合并亮度色差的差較大的同類色的顏色信息。在圖6的流程圖中對在步驟S502中附加的作為臨時的顏色重心的YcrCb的值進行重新計算,是為了即使不把步驟S504以后的閾值設(shè)定成太大的值也可以進行顏色的合并。
例如,在最初的步驟S503的處理中設(shè)亮黑色被合并到黑色上。在該情況下作為臨時的顏色重心的YCrCb值往亮黑色的方向移動。在這樣的情況下,與暗灰色之間的距離接近,因此,只要在某種程度上加大在接著的步驟S504以后的閾值就可以在黑色上合并暗灰色。
還有,如步驟S503~S505所示,設(shè)成多級處理是為了可以從顏色相近的進行合并,且可以通過改變此級數(shù)來控制壓縮數(shù)據(jù)112的大小。
還有,由圖4可知,決定壓縮數(shù)據(jù)112的大小的因素之一是彩色壓縮數(shù)據(jù)的數(shù)目。也就是說,只要控制最終剩下的顏色數(shù)就可以控制壓縮數(shù)據(jù)的大小。例如,如果增多顏色數(shù),則可以得到與原彩色圖像相近的品質(zhì),如果減少顏色數(shù),則接近于單純的2值圖像。從而,根據(jù)欲獲得的圖像質(zhì)量和壓縮大小決定此分級數(shù)即可。
隨后,在步驟S506中,把此更新后的顏色信息返回由圖2的流程圖所示的處理并結(jié)束。
也就是說,與本實施形式相關(guān)的圖像壓縮方法其特征在于,在中間色削減處理中具有多個預(yù)先確定的閾值,把顏色值的重心變換成亮度色差信號并根據(jù)排序順序合并削減閾值范圍內(nèi)的顏色。還有,其特征在于對于顏色值的重心,每當(dāng)進行合并削減處理就把變換為亮度色差信號后的值作為臨時的顏色重心進行重新計算。還有,其特征在于多個閾值是根據(jù)壓縮率優(yōu)先還是圖像品質(zhì)優(yōu)先來變更值。
如上所述,大多數(shù)的彩色文檔圖像是在特定的背景色上形成有1色或多色的字符等,鑒于此,在對其進行壓縮時,通過具有每個顏色的局部2值圖像,就可以有效地進行壓縮。還有,通過在中間色削減處理中使用多個閾值,并控制其閾值的數(shù)目和值就可以控制圖像質(zhì)量和大小。
還有,在本壓縮模式中,把構(gòu)成彩色文檔圖像的各象素分類成預(yù)定數(shù)目的限定色之中的某一個,在該限定色之中確定相當(dāng)于背景的顏色,以背景色的亮度值為基準,并根據(jù)其他的各限定色的亮度值把各限定色的蓋寫關(guān)系加上順序,對各限定色生成由與該限定色相當(dāng)?shù)南笏丶捌湎噜彽南笏貥?gòu)成的連接象素群,對于與某限定色A(例如在圖9中相當(dāng)于中間色)相當(dāng)?shù)倪B接象素群,如果在該處所包含的相鄰象素中有,作為蓋寫關(guān)系存在相當(dāng)于比上述限定色A更高位(是在后面被疊加的優(yōu)先關(guān)系,比如,在圖9中相當(dāng)于前景色)的限定色的位置的象素,則把與此相符的相鄰象素置換為上述限定色A,通過采取壓縮在這里得到的連接象素群的步驟,在把背景(例如在圖9中相當(dāng)于背景色)視為在疊加關(guān)系上優(yōu)先度最低進行處理的情況下,大多數(shù)的文檔圖像都可以有效地被壓縮。
(變形例)在上述實施例中,壓縮順序的意思作為執(zhí)行各色的壓縮處理的順序進行了說明。但是,本發(fā)明中的順序的意思并不限于此。例如,也可以認為此順序是蓋寫所解碼的各色的圖像時的順序。
另外,上述實施例,對壓縮和蓋寫順序一致的情形進行了說明。
實際上,各色的“壓縮順序”可以進行變更。原因是在解碼時調(diào)整各色的蓋寫順序即可。但是,在此情況下,由于必須調(diào)整各順序故效率差。
為了執(zhí)行效率好的壓縮,重要的是,至少執(zhí)行對應(yīng)于各色的“蓋寫順序”的壓縮處理(更具體地說,是complementary processing)。
在上述第1壓縮模式的說明中,進行補全處理的只是1次方向(光柵方向),但在采用的2值圖像的壓縮方法能夠通過也進行2次方向的補全有望壓縮大小上的效果的情況下,則也可如此處理。
還有,在上述說明中根據(jù)亮度進行了排序,但也可以根據(jù)背景色和剩余顏色在顏色空間上的距離進行排序。也就是說,在此情況下,其特征在于壓縮順序是以所決定的背景色和剩余顏色在顏色空間上的距離為基準被決定的。
還有,在上述說明中,補全方法是根據(jù)所關(guān)注的顏色的識別序號的空白部分是否被低位的識別序號所填充而進行補全的,但也可以根據(jù)在此之前的象素是否為1而進行補全。
還有,和上述說明一樣,在識別序號為1,其余顏色的順序為2、3、4,并且,8個象素的排列為1、2、3、4、2、3、3、1的情況下,由于識別序號2是在第2象素發(fā)現(xiàn)的故設(shè)為01,下一個為識別序號3前面的象素為1故設(shè)為001,再下一個為識別序號4故同樣設(shè)為0111這樣來進行處理,8個象素的位模式變成01111110。對識別序號3、4,其位模式分別變?yōu)?0110110、00010000。從而,所得到的位模式與上述第1壓縮模式的實施形式不同,但由于邊緣量相同,故可以獲得大致相同的壓縮大小,而且,由于僅逐次查看象素,所以處理負擔(dān)輕,可以實現(xiàn)高速處理。
(第2壓縮模式)接著,作為第2壓縮模式,可以執(zhí)行以下所詳細說明的壓縮方法。此壓縮模式適合于字符和非字符(比如照片圖像)混雜的彩色圖像的壓縮。因此,只要判斷彩色圖像的顏色分布就可以自動選擇此壓縮模式?;蛘?,也可以是用戶用手動進行選擇。
以下對第2壓縮模式所實施的構(gòu)成或方法進行說明。
最初先說明模式所實施的步驟的概要。首先,對成為編碼對象的整個圖像生成亮度直方圖并進行2值化,取出一些字符區(qū)域。其次,對各字符區(qū)域進行字符析取處理,根據(jù)該結(jié)果判斷是否是應(yīng)再次作為字符區(qū)域進行處理的區(qū)域。在該結(jié)果為不是應(yīng)作為字符區(qū)域進行處理的區(qū)域的情況下,則判斷該區(qū)域內(nèi)的對象是不是單色,如果是單色則作為MMR壓縮的對象,如果不是單色則作為JPEG壓縮的對象。
另一方面,在判斷為是應(yīng)作為字符區(qū)域進行處理的圖像的情況下,則通過預(yù)定的減色處理減少構(gòu)成該區(qū)域的顏色。在此減色處理的結(jié)果是成為單色的情況下,則使表示該顏色的調(diào)色板(例如,(R,G,B)=(20,30,40))和2值圖像關(guān)聯(lián)起來作為MMR壓縮的對象。在減色處理的結(jié)果是可以用預(yù)定的顏色數(shù)(比如4色)以下的顏色進行表示的情況下,則對每個字符析取使表示各色的調(diào)色板和表示各色象素位置的多值圖像關(guān)聯(lián)起來作為ZIP壓縮的對象。在不能用預(yù)定的顏色數(shù)表示的情況下,把減色處理前的原圖像作為JPEG壓縮的對象。
圖10為用于說明實施在第2壓縮模式中的圖像壓縮方法用的處理及中間圖像的方框圖。在圖10中,1101為原圖像。1102為輸入原圖像并進行圖像的最優(yōu)2值化的圖像2值化單元。1103為由圖像2值化單元所2值化的完全2值化圖像。1104為輸入完全2值化圖像1103并檢測位置區(qū)域,生成字符區(qū)域坐標1112的字符區(qū)域檢測單元。
1108為輸入字符區(qū)域坐標1112,一邊參照該坐標內(nèi)的原圖像和2值圖像一邊算出2值圖像的黑色部分的原圖像顏色,生成多個調(diào)色板1114,并依此進行原圖像的減色處理的字符顏色抽取單元。
1105為從原圖像中抽取由字符區(qū)域檢測單元1104作為字符所檢測出的區(qū)域,而且是用字符顏色抽取單元1108使字符顏色不到M色的區(qū)域的2值圖像1103的黑色區(qū)域,用其周圍的顏色填充處理,并生成圖像A的字符部填充處理單元。
1106為輸入圖像A,進行縮小生成圖像B的縮小單元。1107為輸入圖像B,進行JPEG壓縮生成壓縮碼X(113)的JPEG壓縮單元。
1109為經(jīng)字符顏色抽取單元1108減色后的多個字符區(qū)域的減色圖像。1110為當(dāng)減色圖像1109為1位時,輸入減色圖像進行MMR壓縮生成多個壓縮碼Y(1115)的MMR壓縮單元。1111為當(dāng)減色圖像1109為2位以上時,輸入減色圖像進行ZIP壓縮生成多個壓縮碼Z(1116)的ZIP壓縮單元。最后用1A所匯總的從1112到1116的數(shù)據(jù)進行合并后其成為壓縮數(shù)據(jù)。
(字符區(qū)域檢測處理)圖11為用于說明在字符區(qū)域檢測單元1104上的字符區(qū)域檢測處理的流程圖。首先,輸入彩色圖像,一邊進行粗化降低分辨率一邊進行亮度變換,生成亮度圖像J(步驟S1301)。例如,當(dāng)原圖像質(zhì)量為RGB24位、300dpi時,在縱向、橫向都對每4個象素依照下式進行運算,Y=0.299R+0.587G+0.114B當(dāng)生成新圖像J時,圖像J就成為Y8位75dpi的圖像。其次,取得亮度數(shù)據(jù)的直方圖,算出2值化閾值T(步驟S1302)。
接著,通過閾值T對亮度圖像J進行2值化,生成2值圖像K(步驟S1303)。還有,對黑色象素的輪廓線進行跟蹤,并把所有的黑色區(qū)域貼上標簽(步驟S1304)。接著,判定黑色區(qū)域中的看起來象是字符的區(qū)域(步驟S1305)。然后,合并從形狀和位置合并而成的區(qū)域(步驟S1306)。
(對于字符區(qū)域的字符顏色抽取處理)圖12為用于說明在字符顏色抽取單元1108中的字符顏色抽取處理的流程圖。還有,盡管這里作為2值圖像利用了完全2值化圖像1103,但并不限于此,例如,也可以只輸入字符區(qū)域的坐標和彩色圖像,利用再次對彩色圖像進行了2值化的結(jié)果,進行代表色運算處理。
圖12的流程圖所示的處理對由字符區(qū)域檢測單元1104判定為字符的所有區(qū)域如以下所示那樣進行。
(步驟S3001再2值化處理)首先,在步驟S3001中進行再2值化的判斷。完全2值化圖像1103并不限于所有的字符區(qū)域被良好地2值化的圖像。2值圖像太濃或太淡都會對結(jié)果的圖像質(zhì)量帶來不良影像,因此,最好對每個字符區(qū)域進行最優(yōu)2值化。
具體來說,在字符區(qū)域檢測單元1104中對被判定為字符的區(qū)域的2值圖像進行掃描,進行與孤立點濾波器的模式匹配。然后,判定在該區(qū)域中是否存在閾值以上的孤立點,如果在閾值以上則取得該區(qū)域的亮度直方圖,算出最優(yōu)閾值并進行再2值化。如果是通常的字符區(qū)域,則通過讓亮度直方圖部分通過就可得到更好的2值圖像,但有比以前還差的結(jié)果的情形(也就是說,再2值化后成為比以前還濃的2值結(jié)果)。
于是,為了防止這樣的現(xiàn)象,設(shè)置在再2值化中輸入在獲得完全2值化圖像時所使用的2值化閾值,并與用于再2值化的閾值進行比較,如果得到比以前還濃的結(jié)果則不進行再2值化等的例外處理。
(步驟S3002字符析取處理)接著,在步驟S3002中生成字符析取信息。在字符析取的處理中,處理內(nèi)容根據(jù)字符區(qū)域是橫寫的還是豎寫的而變化。這個是橫寫還是豎寫的信息是根據(jù)在字符區(qū)域檢測單元1104中黑色團塊的排列來判斷并生成的。如果其結(jié)果是橫寫則首先取得2值圖像的黑色象素在主掃描方向上的投影。然后,在檢測出行的分隔間隙后對各行取得黑色象素在副掃描方向上的投影,得到每一個字符的信息。另一方面,在豎寫的情況下,行析取在副掃描方向上進行,字符析取在主掃描方向上進行。此時,為了還可應(yīng)付稍微的圖像傾斜,可在行方向上進行3段分割以取得行析取的投影。通過這樣的處理可以得到各行的坐標信息及存在于各行上的字符的坐標信息。
另一方面,為了進一步判定在字符區(qū)域檢測單元1104中被判定為字符的區(qū)域內(nèi)的各黑色對象是否為字符,在字符判斷處理(后述的步驟S3003)中利用字符析取信息。具體來說,從1個字符的大小和形狀判定是不是字符。例如,從圖像質(zhì)量和壓縮方面來看,為了變換成單色或多色,不必拘泥“是字符”。作為一個例子,對于以單色呈現(xiàn)的標記等,與用JPEG表達相比,用單色MMR表達的圖像質(zhì)量和壓縮率都更好。但是,由于作為概率的問題,字符以外的區(qū)域大多以灰度呈現(xiàn),因此,判定是不是字符是重要的。
(步驟S3003字符判斷處理)
接著,在步驟S3003中進行字符判斷。這里,輸入字符析取(步驟S3002)中的信息,并對每行計算該行的平均字符大小。此時,當(dāng)忽略極小的字符的信息時則可以得到更好的結(jié)果。還有,比該平均大小大得多的字符矩形就判定為不是字符。還有,不論平均結(jié)果如何,在從縱橫比信息等顯然不是字符的形狀的情況下,則判定為不是字符。
在判定結(jié)果為在該區(qū)域中存在m個字符且判定m個字符都不是字符的情況下,則字符區(qū)域檢測單元1104輸出該區(qū)域為圖像的結(jié)果。
但是,如果在m個字符中有n個字符(m>n,n>=0)不是字符、即留下作為字符的矩形,則從2值圖像上擦去判定為不是字符的黑色對象,輸出此區(qū)域為字符的結(jié)果。
還有,最后考慮到圖像質(zhì)量,在本實施形式中追加如下所示的例外處理。例如,當(dāng)在區(qū)域中存在10個字符時,如果零散地將5個字符作為字符被單色化,余下的作為非字符被進行JPEG壓縮,則得到“不均勻”的圖像,成為外觀不理想的圖像。于是,在此字符判斷處理中,在字符、圖像的判斷頻繁進行切換這樣的情況下,根據(jù)其排列和被判斷為字符的頻度等一致判斷成矩形字符或一致判斷成矩形圖像。
經(jīng)過上述的字符判斷處理,對于被判斷為字符的區(qū)域,處理轉(zhuǎn)到步驟S3004,對于被判斷為非字符的區(qū)域,處理轉(zhuǎn)到步驟S3005。
(步驟S3005單色判斷處理)在步驟S3005中進行單色判斷。通過此處理的區(qū)域是被字符區(qū)域檢測單元1104判斷為字符但經(jīng)字符判斷被判定為非字符的區(qū)域。如前所述,不管是否是字符,只要是由單色所表達的區(qū)域,單色化后進行MMR壓縮,圖像質(zhì)量和壓縮率就都好。于是,對此區(qū)域進行是否為單色的判斷。
作為具體例子,獲取與2值圖像的黑色部分相當(dāng)?shù)牟噬珗D像的象素的RGB各等級的直方圖,如果所有各直方圖的分散值在閾值以下則判定此區(qū)域是單色。如果其結(jié)果為單色則轉(zhuǎn)到步驟S3006的單色抽取處理,如果為多色則返回DOJPEG。
(步驟S3006單色抽取處理)用圖13的流程圖說明步驟S3006中的單色抽取處理。也就是說,圖13為用于說明在第2壓縮模式中的單色抽取處理的流程圖。首先對參照其字符坐標的2值圖像進行細化處理,減少位于在掃描器讀取時的從背景到字符部的變化部的黑色象素,生成新的2值圖像newbi(步驟S1201)。
接著,獲取與newbi的黑色象素對應(yīng)的原圖像的RGB各自值的直方圖(步驟S1202)。當(dāng)然,此處理也可以在YUV等其他的顏色空間上進行。然后算出RGB各自的代表值(步驟S1203)。此代表值,例如取最大的值?;蛘撸部梢詼p少直方圖的階梯數(shù),在粗略的直方圖中得到最大值后,再用由存在于此直方圖中的細的直方圖得到最大值求得代表值。
通過采取后一種方法,可以從圖14所示那樣的直方圖得到真的代表值1401而不會受到噪聲1402的干擾。圖14為說明在單色抽取處理中的代表值的算出方法的圖。作為細的直方圖,比如可以從8位的R數(shù)據(jù)得到如圖14所示那樣的256級的直方圖,但在此情況下,最大值為1402,這并不是真的代表值。于是,把該直方圖分成重疊的64個寬度,從256級的直方圖重新計算8級的直方圖。對此用A到H表示,但A和H只有32寬度。通過重新計算可知代表值存在于G,檢索G內(nèi)的最大值就可以得到1401。通過對所有的字符坐標重復(fù)以上的處理,就對所有的字符坐標逐一地算出代表色。
(步驟S3004減色處理)在步驟S3004中對字符進行減色處理。在減色處理單元1082中,關(guān)于字符部的顏色,即便在原始的原稿是以單色表現(xiàn)的情況下,在進行掃描讀取時,也存在從背景到字符部的顏色過渡部分。
圖15為說明由掃描器產(chǎn)生的字符部的過渡部分(灰度)的圖。在圖15中為簡單起見,只用RGB中的R進行說明,對GB省略。A這樣的字符原本是以R=32等級的單色構(gòu)成的,但當(dāng)通過掃描器讀取時,該數(shù)據(jù)就如放大的象素所示那樣發(fā)生變化。在圖15中,達到原來的亮度級R=32附近的黑色的象素只不過僅有3201、3202、3203這3個,其他的象素都成為背景色(比如白色)和R=32之間的某個等級,結(jié)果表現(xiàn)為有字符過渡部分的灰度。
還有,圖16為用3維直方圖表示由掃描器產(chǎn)生的字符部的過渡部分(灰度)的圖。在圖16中,背景色為3501所示的白色,字符色為3502所示的黑色。此時的過渡部分如3503所示。這里,沒有必要精確地表現(xiàn)本來以單色表現(xiàn)的字符部的因掃描讀取而變化的過渡部分。也就是說,如果僅能夠用其代表色表現(xiàn),則圖像質(zhì)量也好,數(shù)據(jù)量也少。但是,即便進行了2值圖像的細化也難以完全除去這個從背景到字符部的過渡部分的顏色。
于是,利用1個字符多以單色表現(xiàn)的這樣的事實,通過使用字符析取信息把一個字符限定為1種顏色,以改善圖像質(zhì)量、提高壓縮率。但是,如果想要以更高的圖像質(zhì)量壓縮從一開始就是以灰度表現(xiàn)的字符等,只要加上對該字符是不是以多顏色表現(xiàn)的判定等的例外處理即可。也就是說,如果象這樣利用字符析取信息把一個字符限定為1種顏色,則可以除去原本以單色表現(xiàn)的字符圖像的因掃描讀取而作為變化發(fā)生的過渡部分。
(字符部填充處理單元1105)用圖17A~C和圖18說明字符部填充處理單元1105的處理的一例。圖17A~C為用于說明字符填充的概要的圖。還有,圖18為用于說明字符部填充處理流程的處理流程圖。
如圖17A所示,以灰度圖像為背景,作為一例,把在中央附近繪制有ABC這樣的藍色字符的圖像作為原圖像。由此原圖像得到圖17B所示那樣的1個字符區(qū)域的2值圖像。然后,作為字符部填充處理,首先,在步驟S11010中把全圖像分割成比如32×32的區(qū)域(以下稱為部分),并對每個部分進行處理。圖17C表示分成各部分后的樣子。為了簡化說明,在此圖中表示分割成4×5的部分的狀態(tài)。圖17C的各區(qū)域的左上的數(shù)字表示部分號。此區(qū)域分割的個數(shù)表不限于此,也可以是其他的分割數(shù)。
在步驟S11020中判斷是否有未處理的部分,對于未處理的部分,轉(zhuǎn)到步驟S11030并判斷在該部分內(nèi)是否存在字符填充處理對象區(qū)域。還有,即便是被字符區(qū)域檢測單元1104判定為字符區(qū)域的區(qū)域,由字符顏色抽取單元1108返回DOJPEG的區(qū)域也不作為字符部填充處理的對象區(qū)域。
如圖17C所示,在步驟S11030中部分00~04、10、14、20、24、30~35被判斷為不是字符填充處理對象區(qū)域,不執(zhí)行處理就前進到下個部分。對于存在字符填充處理對象區(qū)域的部分(比如部分11),轉(zhuǎn)到步驟S11040并參照對應(yīng)的2值圖像算出與2值圖像的白色部分對應(yīng)的彩色圖像的RGB值(或者也可以是YUV等)的平均值ave color。接著,在步驟S11050中參照對應(yīng)的2值圖像把與黑色象素對應(yīng)的象素的濃度數(shù)據(jù)設(shè)為ave color。對存在字符填充處理對象區(qū)域的部分(在這里指部分12、13、21、22、23)反復(fù)進行以上的處理。這樣,可以在字符存在的部分填充周圍的象素的平均值。
把這樣得到的填充處理圖像在縮小單元1106上縮小。在本實施形式中舉一個單純進行粗化處理的例子。還有,此縮小處理和字符部填充處理的順序也可以倒過來。在該情況下,需要注意2值圖像和彩色圖像的位置偏離。
還有,如有必要則生成匯總了字符區(qū)域坐標1112、調(diào)色板1114、壓縮碼X(1113)、壓縮碼Y(1115)、壓縮碼Z(1116)這5個的格式。
作為匯總5個的格式的一例,可以考慮Adobe(注冊商標)的PDF等。Adobe的PDF是指可以用Adobe無償分發(fā)的稱為AcrobatReader(注冊商標)的應(yīng)用程序顯示的一種格式,可以避免因沒有生成文檔的應(yīng)用程序而在接收方打不開文件等麻煩。作為其他的格式有XML等。XML是指通過網(wǎng)絡(luò)交換或分發(fā)文檔和數(shù)據(jù)的描述語言。
(變形例)在上述第2壓縮模式中,2值圖像是通過單一閾值生成的,但并不限于此,例如,也可以對由字符區(qū)域檢測單元104檢測出的每個字符區(qū)域計算最優(yōu)閾值并生成2值圖像。在該情況下,就不需要在圖12的流程圖中的步驟S3001的再2值化判斷。
還有,在字符部填充處理單元1105、字符顏色抽取單元1108中使用了相同的2值圖像,但并不限于此,也可以分別在字符部填充處理單元1105、字符顏色抽取單元1108內(nèi)部具有最優(yōu)的2值化單元。
如以上所說明,根據(jù)本發(fā)明,就能夠以高的壓縮效率恰當(dāng)?shù)貕嚎s彩色文檔圖像。還有,并不只限于上述彩色文檔的圖像,也可以對應(yīng)字符區(qū)域和非字符區(qū)域混雜的圖像的壓縮。
(實施形式2)下面參照附圖對本發(fā)明的實施形式2進行詳細說明。
圖19為表示在本實施形式中的圖像編碼裝置的功能構(gòu)成和在各單元中所處理的或處理后的數(shù)據(jù)的圖。2101為原圖像。2102為減色處理單元,對原圖像2101進行單純減色處理到預(yù)先所決定的顏色數(shù),并索引化(生成只包含減色后的各顏色的圖像(后述的索引彩色圖像2104),并對各索引彩色圖像附加索引)。2103為顏色信息,由表示用減色處理單元2102所生成的索引彩色圖像包含的顏色(顏色重心)的數(shù)據(jù),表示索引彩色圖像的象素數(shù)的數(shù)據(jù)和表示原圖像中的索引彩色圖像的位置(分布范圍)的數(shù)據(jù)構(gòu)成,由減色處理單元2102對每個索引彩色圖像生成。
還有,分布范圍的數(shù)據(jù)是包含原圖像中的索引彩色圖像的左上角坐標、右下角坐標的數(shù)據(jù)的數(shù)據(jù)。還有,顏色信息2103與對應(yīng)的索引彩色圖像相關(guān)聯(lián)。例如,把與附加在對應(yīng)的索引彩色圖像上的索引相同的索引也附加附在對應(yīng)的彩色圖像上。
2104為索引彩色圖像,如上所述,是只包含在對原圖像進行了減色處理后的結(jié)果的圖像(減色圖像)中所包含的各顏色的圖像。2105為顏色信息排序單元,通過象素數(shù)排序顏色信息2103。2106為同色合并單元,比較由顏色信息排序單元2105所排序的各顏色信息,并根據(jù)條件判斷為同色并進行合并處理,同時對施行了合并處理的顏色信息進行更新。
2107為中間色削減單元,比較被排序的各顏色信息,并根據(jù)條件合并各顏色信息,對位于半色調(diào)的顏色數(shù)進行削減。2108為背景色數(shù)據(jù),為包含在經(jīng)中間色削減單元2107處理后的信息之中的最高位的顏色信息中的顏色重心的數(shù)據(jù)。2109為2值圖像生成·壓縮單元,使用對應(yīng)于每個剩余的各顏色信息(最高位以外的顏色信息)的索引彩色圖像生成2值圖像并對此2值圖像進行壓縮。2110為2值圖像壓縮數(shù)據(jù),是由2值圖像生成·壓縮單元2109生成的數(shù)據(jù)組,分別附加有顏色信息。2111為數(shù)據(jù)合并單元,合并背景色數(shù)據(jù)2108和2值圖像壓縮數(shù)據(jù)2110并生成壓縮圖像2112。
用圖7對具備有上述構(gòu)成的本實施形式中的圖像編碼裝置進行的圖像編碼處理進行簡單說明。如前所述,圖7為表示原圖像和原圖像中各顏色區(qū)域的圖。在作為原圖像的原稿上使用紅字和黑字,并加有用藍色墨水手寫的修改。如果對此彩色圖像實施減色處理,同色判定處理和中間色削減處理,則彩色圖像被分解為白色部分圖像、黑色部分圖像、紅色部分圖像和藍色部分圖像。這里在所分解的各部分圖像中,構(gòu)成圖像的象素數(shù)最多的圖像為白色部分圖像,因此,把此圖像用作背景圖像。實際上白色部分圖像不作為圖像數(shù)據(jù)保持,而作為表示原圖像大小的數(shù)據(jù)和表示顏色值(表示白色的顏色值)的數(shù)據(jù)來保持。還有,關(guān)于黑色部分圖像、紅色部分圖像和藍色部分圖像,對每種顏色生成2值圖像(例如,在紅色部分圖像的情況下,1的部分表示紅色,0的部分為表示背景部分的圖像),進行壓縮,同時附加表示顏色的數(shù)據(jù)。
參照圖20對具備有上述構(gòu)成的實施形式2中的圖像編碼裝置進行的圖像編碼處理進行說明。圖20為在本實施形式2中的圖像編碼裝置進行的圖像編碼處理的流程圖。
當(dāng)作為原圖像2101的彩色圖像被輸入到減色處理單元2102時,在步驟S2201中,減色處理單元2102對原圖像2101進行減色處理到預(yù)先所決定的顏色數(shù),生成并輸出上述顏色信息2103和索引彩色圖像2104。在減色處理中,把全彩色RGB 24bit(由R、G、B各24位表達)的數(shù)據(jù)減低為2-2-2、3-3-2、3-3-3 bit等位數(shù)。此位數(shù)的選擇方法是根據(jù)想要用什么程度的精度進行顏色判定所選擇的。在以下的說明中以2-2-2位(由R、G、B各2位表達)的情形為例進行說明,但以下的說明并不限于此。如上所述,由此減色處理單元2102所輸出的顏色信息2103如上所述由表示索引彩色圖像所包含的顏色(顏色重心)的數(shù)據(jù),索引彩色圖像的象素數(shù)和表示原圖像中的索引彩色圖像的位置(分布范圍)的數(shù)據(jù)構(gòu)成。
接著,由減色處理單元2102所得到的顏色信息2103向顏色信息排序單元2105輸入,在步驟S2202中,根據(jù)所附加的與其象素數(shù)和索引序號相應(yīng)的權(quán)重的值被排序。排序的結(jié)果為,索引彩色圖像基本上是象素數(shù)越多的顏色位于越高位,但此加權(quán)即系數(shù)是,為使在比較了相同程度的象素數(shù)的顏色信息的情況下,越接近原色的顏色信息越靠高位而預(yù)先所調(diào)整的值。用圖3A~E表示權(quán)重系數(shù)的例子。
圖3A為表示RGB空間的圖,如以上所說明那樣在本實施形式中,減色后的圖像的R、G、B都是用4灰度級表達,因此,在R方向、G方向、B方向上各有4個顏色元素。后述的圖3B、圖3C、圖3D、圖3E所示的加權(quán)矩陣就用于在這些R方向、G方向、B方向上都存在4個的顏色元素。具體來說,各矩陣的各元素是作為對于對應(yīng)的顏色元素的個數(shù)(各色的象素數(shù))的倍率來使用的。
圖3B為表示在包含圖3A中由a所示的直線且與R-B平面平行的平面中,對于各位置的顏色元素的權(quán)重系數(shù)的矩陣的圖,圖3C為表示在包含圖3A中由b所示的直線且與R-B平面平行的平面中,對于各位置的顏色元素的權(quán)重系數(shù)的矩陣的圖,圖3D為表示在包含圖3A中由c所示的直線且與R-B平面平行的平面中,對于各位置的顏色元素的權(quán)重系數(shù)的矩陣的圖,圖3E為表示在包含圖3A中由d所示的直線且與R-B平面平行的平面中,對于各位置的顏色元素的權(quán)重系數(shù)的矩陣的圖。
還有,上述圖中所示的各矩陣的元素的值(0.9~1.2)并不限于此,比如,也可以根據(jù)減色處理單元2102上的減色數(shù)和顏色的優(yōu)先級來改變。
回到圖20,在步驟S2203中,經(jīng)顏色信息排序單元2105所排序的顏色信息被輸入到同色合并單元2106,同色合并單元2106比較各顏色信息的顏色重心的值,在值比較接近(例如,各值的差的絕對值在預(yù)定值以下)的情況下作為同一顏色對相比較的2個顏色信息進行合并。這是把本來是相同顏色但因RGB的某一個值偶爾接近于最初減色處理中的閾值而被分離成多色的顏色恢復(fù)成一個顏色的處理。還有,伴隨此合并處理,重新計算包含在顏色信息中的象素數(shù)、顏色重心及分布范圍。
具體來說,通過把包含在將要合并的各顏色信息中的象素數(shù)相加可以求得合并后的象素數(shù)。還有,通過把包含在將要合并的各顏色信息中的顏色重心相加并除以2可以求得合并后的顏色重心(平均色)。還有,通過在將要合并的各顏色信息中所包含的分布范圍的數(shù)據(jù)中,采用表示最左上角的位置的坐標和表示最右下角的位置的坐標,可以求得合并后的分布范圍。通過以上的處理,可以伴隨顏色信息的合并,對顏色信息進行更新。還有,此顏色信息的更新處理只是一個例子,并不限于此。
接著在步驟S2204中,通過中間色削減單元2107把在含有由同色合并單元2106所更新的顏色信息的所有顏色信息中所包含的顏色重心的值變換為亮度色差的值,進而比較變換后的各亮度色差值,對值較相近的各顏色信息(例如,各值的差的絕對值是預(yù)定值以下的顏色信息)進行合并處理。由此,進行位于半色調(diào)的顏色數(shù)的削減。此處理的目的是,即便原文檔圖像為黑白的原稿,在用掃描器讀入原稿的情況下,除掉在背景的白色和字符部的黑色的邊界部分中產(chǎn)生的從白到黑的許多的灰度成分。使靠近白色的灰色變成白色,使靠近黑色的灰色變成黑色。還有,對其他顏色也同樣進行處理。
還有,在步驟S2204中所進行的合并處理的內(nèi)容與在上述步驟S2203中的處理內(nèi)容相同,但在僅顏色重心的值保留原樣不變這點上不同。這是因為在合并中間色求得其顏色重心的情況下,防止比如黑色混著灰色變成偏亮的色或白混著灰色變成偏暗的色。合并后的顏色信息的代表色采用排序等級高的顏色信息的顏色重心,在排序中不僅使用象素數(shù)還使用權(quán)重系數(shù)是為了使在彩色文檔原稿中所用的原色系的顏色優(yōu)先的緣故。關(guān)于在步驟S2204中的處理的細節(jié)將在后面敘述。
接著,在步驟S2205中,把經(jīng)中間色削減單元2107處理后的結(jié)果中的最高位顏色信息的顏色重心的值作為背景色數(shù)據(jù)2108輸出。接著,在步驟S2206中,2值圖像生成·壓縮單元2109使用最高位以外的顏色信息和索引彩色圖像2104生成各顏色的2值圖像并用MMR等方法進行壓縮處理。這里所生成的2值圖像為與顏色信息所持有的顏色分布范圍相應(yīng)的大小,在只存在于原稿的一部分的情況下只對該部分進行壓縮保存。
作為各顏色的2值圖像,如果把索引彩色圖像2104的索引序號設(shè)為0~63、索引60和62的顏色信息被合并到索引63,則該2值圖像是把索引60和62的數(shù)據(jù)邏輯或之后的圖像,并用索引63的顏色信息的顏色重心的值進行描繪。結(jié)果所生成的是2值圖像壓縮數(shù)據(jù)2110,是由顏色信息和MMR壓縮數(shù)據(jù)構(gòu)成的數(shù)據(jù)組。
然后最后在步驟S2207中,在數(shù)據(jù)合并單元2111上匯總背景色數(shù)據(jù)2108和2值圖像壓縮數(shù)據(jù)2110,生成并輸出壓縮數(shù)據(jù)(輸出)2112。壓縮數(shù)據(jù)2112的構(gòu)成例與上述圖4所示的壓縮數(shù)據(jù)112相同。
關(guān)于把此壓縮數(shù)據(jù)2112解碼成原圖像的方法,可以在用存儲在圖4所示的首標部分上的背景色描繪原稿的整個區(qū)域后,按所保存的順序展開包含在壓縮數(shù)據(jù)中的MMR壓縮數(shù)據(jù),以該圖像為掩碼根據(jù)所存儲的位置、顏色進行蓋寫。
表示在上述步驟S2204中的處理細節(jié)的流程圖與上述圖5所示的流程圖相同,進行同樣的處理。
也就是說,首先,在步驟S501中,按顏色信息的排序順序生成列表,然后,按照此列表對中間色進行削減處理。接著,在步驟S502中,把顏色信息的顏色重心的值從RGB變換為YCrCb的亮度色差數(shù)據(jù),并把此亮度色差數(shù)據(jù)附加到顏色信息。進行向色差的變換是因為適合于合并亮度差相近的同類色以削減中間色的緣故。
步驟S503、步驟S504、步驟S505的任何一個的基本處理內(nèi)容都相同,但處理對象不同。具體來說,分別比較Y、Cr、Cb的各成分的差是否在各自預(yù)先決定好了的閾值以內(nèi),如果是在該條件以內(nèi)則進行顏色信息的合并削減顏色數(shù)。
還有,在步驟S503、步驟S504、步驟S505中進行的處理的流程圖也和圖6所示的流程圖一樣。依照該圖所示的流程圖進行的處理在步驟S503、步驟S504、步驟S505上是通用的,但在步驟S605中的閾值處理中所用的閾值各不相同。
首先,在步驟S601中,把在上述排序結(jié)果中最高位的顏色信息選為顏色信息I。接著,在步驟S602中,把顏色信息I的YCrCb值儲存到變量Y′Cr′Cb′。然后,在步驟S603中,把在上述排序結(jié)果中最低位的顏色信息選擇為顏色信息J。
然后,在步驟S604中,比較顏色信息I、J各自的Y、Cr、Cb,判定各成分的差是否在預(yù)定的閾值(如上所述,與步驟S503、步驟S504、步驟S505的各處理所用的閾值不同)以內(nèi)。
如果在步驟S605中在該閾值以內(nèi)則轉(zhuǎn)到步驟S606,否則轉(zhuǎn)到步驟S608。但是,如果顏色信息I和J的Cr或Cb值的符號不同,則檢查J的Cr或Cb值的絕對值,如果在預(yù)先定好的某一定值以上則要使此條件不成立。例如,即便顏色信息I和J的Cr值的差在閾值以內(nèi),如果其符號不同則把顏色信息J的絕對值和預(yù)先定好的值進行比較,如果較小則把處理轉(zhuǎn)到步驟S605,如果較大則把處理轉(zhuǎn)到步驟S608。對Cb的值也進行同樣的處理。這是為了防止在只單純地根據(jù)在圖5的流程中所設(shè)定的閾值的大小比較差而進行合并的情況下,象淡藍和淡紅色這樣的不同顏色的各顏色信息被合并。相反,如果設(shè)定閾值使得象淡藍和淡紅色這樣的不同顏色之間不被合并,則不能合并象藍色和淡藍色這樣的同類色。
在步驟S606中,把顏色信息J的數(shù)據(jù)合并到顏色信息I上。由此,顏色信息I的顏色數(shù)、分布范圍等各數(shù)據(jù)被更新,但顏色重心的值不更新。取代此處理計算合并后的顏色重心,并把該顏色重心變換為亮度色差數(shù)據(jù),使其反映到上述Y′Cr′Cb′。在步驟S607中,從列表中去掉顏色信息J的數(shù)據(jù)。在步驟S608中檢查位于顏色信息J的列表上高一位的顏色信息是否為I,如果不是顏色信息I則把處理轉(zhuǎn)到步驟S609、如果是顏色信息I則轉(zhuǎn)到步驟S610。
在步驟S609中,把位于比顏色信息J高一位的顏色信息設(shè)定為顏色信息J并把處理返回步驟S604。在步驟S610中把所存儲的Y′Cr′Cb′的值恢復(fù)成顏色信息I的YCrCb。
然后在步驟S611中檢查位于比顏色信息I低一位的顏色信息是否為最低位、或是否在步驟S607中從列表上被刪除而不存在,如果存在且不是最低位則把處理轉(zhuǎn)到步驟S612,把位于比顏色信息I低一位的顏色信息重新設(shè)定為I并把處理返回步驟S602。另一方面,如果在步驟S611中比顏色信息I低一位的顏色信息是最低位、或者在步驟S607中從列表上被刪除而不存在則結(jié)束處理。此外,由上述處理更新后的列表在步驟S205以后,比如在參照最高位的顏色信息時從多個顏色信息之中選擇1個的情況下被使用。
在步驟S605中所用的閾值為了合并同類色的目的,而設(shè)定為亮度Y的閾值與色差CrCb相比稍微大一些。在作為步驟S503中的處理被執(zhí)行的情況下此閾值要小些,按步驟S504、S505的順序使其增大。依照圖6所示的流程圖的處理對在步驟S502中附加的作為臨時的顏色重心的YCrCb值進行重新計算,是為了即使不把步驟S504以后的閾值設(shè)成太大的值也可以進行顏色的合并。
當(dāng)進行說明時,設(shè)在步驟S503的處理中亮黑色被合并到黑色上。在該情況下,作為臨時的顏色重心的YCrCb值向亮黑色的方向移動。在這樣的情況下,與暗灰色之間的距離接近,因此,只要在一定程度上加大在下一個步驟S504以后的閾值就可以在黑色上合并暗灰色。
還有,在步驟S503、步驟S504、步驟S505中進行的處理是為了從相近的顏色中進行合并,通過改變這些處理就可以控制壓縮數(shù)據(jù)2112的大小。如由圖4可知那樣,決定壓縮數(shù)據(jù)2112的大小的因素之一是彩色壓縮數(shù)據(jù)的數(shù)目。也就是說,只要控制最終留下的顏色數(shù)就可以控制壓縮數(shù)據(jù)的大小。如果增多顏色數(shù),則成為與原彩色圖像相近的品質(zhì),如果減少顏色數(shù),則接近于2值圖像。因此,可以根據(jù)想要獲得的圖像質(zhì)量和壓縮大小決定此級數(shù)。
通過以上的說明,在本實施形式中的圖像編碼裝置及圖像編碼方法通過對每個顏色具有2值圖像就可以有效地壓縮大部分的彩色文檔圖像。還有,根據(jù)顏色的象素數(shù)和與顏色空間上的位置相應(yīng)的系數(shù)的積的大小進行排序,同色合并單元2106、中間色削減單元2107根據(jù)該順序進行顏色合并,在中間色削減單元2107上不重新計算顏色重心的值,由此改善顏色的再現(xiàn)性。還有,中間色削減單元2107具有多個閾值,通過控制該閾值的個數(shù)和大小就可以控制圖像質(zhì)量和大小。
根據(jù)以上的說明,本發(fā)明可以提高壓縮效率,同時進行再現(xiàn)性良好的壓縮。
其他實施形式還有,本發(fā)明既適用于由多個機器(例如,主計算機、接口機器、閱讀機、打印機等)構(gòu)成的系統(tǒng),也適用于由一個機器構(gòu)成的裝置(例如復(fù)印機、傳真機等)。
還有,勿庸置疑,本發(fā)明的目的還可以通過如下方法實現(xiàn)把記錄了實現(xiàn)上述實施形式的功能的軟件的程序代碼的記錄介質(zhì)(或存儲介質(zhì))供給系統(tǒng)或裝置,該系統(tǒng)或裝置的計算機(或CPU或MPU)讀出并執(zhí)行被保存在記錄介質(zhì)上的程序代碼。在此情況下,從記錄介質(zhì)讀出的程序代碼本身實現(xiàn)上述實施形式的功能,記錄了該程序代碼的記錄介質(zhì)構(gòu)成本發(fā)明。還有,當(dāng)然不僅包含通過執(zhí)行計算機所讀出的程序代碼,實現(xiàn)上述實施形式的功能的情形,也包括計算機上運行的操作系統(tǒng)(OS)等根據(jù)該程序代碼的指示執(zhí)行實際處理的一部分或全部,通過該處理實現(xiàn)上述實施形式的功能的情形。
還有,當(dāng)然也包括在由記錄介質(zhì)讀出的程序代碼被寫入被插入計算機的功能擴展卡或被連接在計算機上的功能擴展單元上備有的存儲器后,在該功能擴展卡或功能擴展單元上備有的CPU等根據(jù)該程序代碼的指示執(zhí)行實際處理的一部分或全部,通過該處理實現(xiàn)上述實施形式的功能的情形。
在把本發(fā)明應(yīng)用于上述記錄介質(zhì)的情況下,與先前說明的流程圖對應(yīng)的程序代碼被保存在該記錄介質(zhì)上。
本發(fā)明并不限于上述實施形式,可以不脫離本發(fā)明的精神和范圍內(nèi)進行各種變更和修改。因此,為了公開本發(fā)明的范圍,附加以下的權(quán)利要求項。
權(quán)利要求
1.一種壓縮彩色圖像的圖像壓縮方法,其特征在于,包括以下步驟把上述彩色圖像的各象素變換成對應(yīng)顏色值所賦予的索引,并生成包含每個被索引化的顏色的象素數(shù)的顏色信息和把上述各象素變換成索引后的索引圖像的索引變換步驟;把與上述索引圖像中的預(yù)定的索引對應(yīng)的顏色值設(shè)為上述彩色圖像的背景色的背景色決定步驟;根據(jù)上述顏色信息及上述背景色決定在對每個索引壓縮上述彩色圖像時的順序的順序決定步驟;從上述索引圖像分別對每個索引生成2值圖像的2值圖像生成步驟;依照上述順序壓縮上述2值圖像的壓縮步驟;以及合并包含上述彩色圖像的大小及上述背景顏色的顏色值的背景數(shù)據(jù)和上述每個索引的上述2值圖像的壓縮數(shù)據(jù)生成壓縮圖像數(shù)據(jù)的生成步驟。
2.根據(jù)權(quán)利要求1所述的圖像壓縮方法,其特征在于上述背景色決定步驟把與上述最大象素數(shù)的索引對應(yīng)的顏色值設(shè)為上述彩色圖像的背景色,上述順序決定步驟、2值圖像生成步驟及壓縮步驟不執(zhí)行關(guān)于該索引的順序的決定、2值圖像的生成及壓縮。
3.根據(jù)權(quán)利要求1所述的圖像壓縮方法,其特征在于上述索引變換步驟生成使一個索引與預(yù)定范圍內(nèi)的顏色值相對應(yīng)并使上述彩色圖像的位數(shù)減少的索引圖像。
4.根據(jù)權(quán)利要求1所述的圖像壓縮方法,其特征在于上述索引變換步驟,進而把上述彩色圖像被索引化的每個顏色的顏色重心和顏色分布范圍作為上述顏色信息進行計算。
5.根據(jù)權(quán)利要求1所述的圖像壓縮方法,其特征在于還具備有在上述顏色信息中合并上述顏色重心接近的顏色信息的同色合并步驟。
6.根據(jù)權(quán)利要求1所述的圖像壓縮方法,其特征在于還具備有在上述顏色信息中合并亮度色差相互接近的顏色信息并削減中間色的中間色削減步驟。
7.根據(jù)權(quán)利要求5所述的圖像壓縮方法,其特征在于上述同色合并步驟,根據(jù)取上述彩色圖像中的各顏色的象素數(shù)與依照顏色空間上的位置預(yù)先所決定的系數(shù)的積的值進行排序,并以排序順序為基準進行同色判定。
8.根據(jù)權(quán)利要求5所述的圖像壓縮方法,其特征在于上述同色合并步驟,在把相同顏色合并為排序高位的顏色的情況下重新計算已計算的象素數(shù)、顏色分布范圍及顏色值的重心。
9.根據(jù)權(quán)利要求6所述的圖像壓縮方法,其特征在于上述中間色削減步驟,以排序順序為基準進行中間色的削減。
10.根據(jù)權(quán)利要求6所述的圖像壓縮方法,其特征在于上述中間色削減步驟,在把同類色合并為排序高位的顏色的情況下重新計算已計算的象素數(shù)和顏色分布范圍,并且僅不重新計算顏色重心。
11.根據(jù)權(quán)利要求1所述的圖像壓縮方法,其特征在于上述背景色決定步驟,把位于排序最高位的顏色的顏色值的重心作為上述背景色進行抽取。
12.根據(jù)權(quán)利要求7所述的圖像壓縮方法,其特征在于上述中間色削減步驟具有預(yù)先所決定的多個閾值,把顏色值的重心變換為亮度色差信號,并根據(jù)排序順序?qū)﹂撝捣秶鷥?nèi)的顏色進行合并削減。
13.根據(jù)權(quán)利要求12所述的圖像壓縮方法,其特征在于對于上述顏色值的重心,每當(dāng)進行合并削減就把變換成亮度色差信號后的值作為臨時的顏色重心重新進行計算。
14.根據(jù)權(quán)利要求12所述的圖像壓縮方法,其特征在于上述多個閾值是根據(jù)壓縮率優(yōu)先還是圖像品質(zhì)優(yōu)先來變更值。
15.根據(jù)權(quán)利要求1所述的圖像壓縮方法,其特征在于上述壓縮步驟對上述2值圖像進行MMR壓縮。
16.根據(jù)權(quán)利要求1所述的圖像壓縮方法,其特征在于順序的決定以與在上述背景色抽取步驟中所抽取的顏色的顏色空間上的距離為基準來進行。
17.根據(jù)權(quán)利要求1所述的圖像壓縮方法,其特征在于上述圖像壓縮方法可以執(zhí)行基于多個圖像壓縮模式的圖像壓縮;在第1壓縮模式中,對編碼對象的彩色圖像執(zhí)行上述索引變換步驟、上述背景色決定步驟、上述順序決定步驟、上述2值圖像生成步驟、上述壓縮步驟和上述生成步驟;在第2壓縮模式中,對編碼對象的彩色圖像,執(zhí)行識別上述彩色圖像的字符區(qū)域和非字符區(qū)域的區(qū)域識別步驟,用2值圖像用的算法壓縮上述字符區(qū)域的圖像的第2壓縮步驟,用多值圖像用的算法壓縮上述非字符區(qū)域的圖像的第3壓縮步驟。
18.一種壓縮彩色圖像的圖像壓縮方法,其特征在于,包括以下步驟把上述彩色圖像的各象素變換成對應(yīng)顏色值所賦予的索引,并生成包含每個被索引化的顏色的象素數(shù)的顏色信息和把上述各象素變換成索引后的索引圖像的索引變換步驟;把與上述索引圖像中的預(yù)定的索引對應(yīng)的顏色值設(shè)為上述彩色圖像的背景色的背景色決定步驟;根據(jù)上述顏色信息及上述背景色決定索引順序的順序決定步驟;從上述索引圖像分別對每個索引生成2值圖像的2值圖像生成步驟;依照上述索引順序壓縮上述2值圖像的壓縮步驟;以及合并包含上述彩色圖像的大小及上述背景顏色的顏色值的背景數(shù)據(jù)和上述每個索引的上述2值圖像的壓縮數(shù)據(jù)生成壓縮圖像數(shù)據(jù)的生成步驟。
19.一種壓縮彩色圖像的圖像壓縮方法,其特征在于,包括以下步驟把構(gòu)成上述彩色圖像的各象素排序成預(yù)定數(shù)目的限定色之中的某個的排序步驟;確定在上述限定色之中相當(dāng)于背景色的顏色的確定步驟、以上述背景色的亮度值為基準并根據(jù)除了該背景色之外的的限定色的亮度值把各限定色的蓋寫關(guān)系附加順序的順序附加步驟;對各限定色生成由與該限定色相當(dāng)?shù)南笏丶霸撓笏氐泥徑拥南笏貥?gòu)成的連接象素群的生成步驟;對與預(yù)定的限定色相當(dāng)?shù)倪B接象素群,當(dāng)在該連接象素群中所包含的鄰接象素中,根據(jù)上述蓋寫關(guān)系存在相當(dāng)于比上述預(yù)定的限定色更高位的限定色的象素的情況下,把該相鄰象素置換成上述預(yù)定的限定色的置換步驟;以及壓縮在上述置換步驟中所得到的連接象素群的壓縮步驟。
20.一種壓縮彩色圖像的圖像壓縮裝置,其特征在于,包括把上述彩色圖像的各象素變換成對應(yīng)顏色值所賦予的索引,并生成包含每個被索引化的顏色的象素數(shù)的顏色信息和把上述各象素變換成索引后的索引圖像的索引變換裝置;把與上述索引圖像中的預(yù)定的索引對應(yīng)的顏色值設(shè)為上述彩色圖像的背景色的背景色決定裝置;根據(jù)上述顏色信息及上述背景色決定在對每個索引壓縮上述彩色圖像時的順序的順序決定裝置;從上述索引圖像分別對每個索引生成2值圖像的2值圖像生成裝置;依照上述順序壓縮上述2值圖像的壓縮裝置;以及合并包含上述彩色圖像的大小及上述背景顏色的顏色值的背景數(shù)據(jù)和上述每個索引的上述2值圖像的壓縮數(shù)據(jù)生成壓縮圖像數(shù)據(jù)的生成裝置。
21.一種程序,用于使計算機上執(zhí)行以下步驟把上述彩色圖像的各象素變換成對應(yīng)顏色值所賦予的索引,并生成包含每個被索引化的顏色的象素數(shù)的顏色信息和把上述各象素變換成索引后的索引圖像的索引變換步驟;把與上述索引圖像中的預(yù)定的索引對應(yīng)的顏色值設(shè)為上述彩色圖像的背景色的背景色決定步驟;根據(jù)上述顏色信息及上述背景色決定在對每個索引壓縮上述彩色圖像時的順序的順序決定步驟;從上述索引圖像分別對每個索引生成2值圖像的2值圖像生成步驟;依照上述順序壓縮上述2值圖像的壓縮步驟;以及合并包含上述彩色圖像的大小及上述背景顏色的顏色值的背景數(shù)據(jù)和上述每個索引的上述2值圖像的壓縮數(shù)據(jù)生成壓縮圖像數(shù)據(jù)的生成步驟。
22.一種計算機可讀取的記錄介質(zhì),其特征在于保存了權(quán)利要求21所述的程序。
23.一種對圖像進行編碼的圖像編碼裝置,其特征在于,包括對原圖像施加減色處理并生成減色圖像的減色處理裝置;對包含在上述減色圖像中的每個顏色,生成與在上述減色圖像中有顏色的區(qū)域相關(guān)的顏色信息的顏色信息生成裝置;對包含在上述減色圖像中的每個顏色,生成在上述減色圖像中有顏色的區(qū)域的顏色索引圖像的局部圖像生成裝置;在基于上述顏色信息生成裝置的顏色信息中,更新并合并表示較近顏色的顏色信息的第1更新裝置;參照由上述第1更新裝置所更新的顏色信息,更新并合并表示較近亮度色差的顏色信息的第2更新裝置;根據(jù)基于上述第1更新裝置及上述第2更新裝置的合并,求得相應(yīng)的合并目標和合并源的顏色索引圖像邏輯或圖像,進而在生成該邏輯或圖像的2值圖像后進行壓縮,并生成由該壓縮數(shù)據(jù)和由對應(yīng)該壓縮數(shù)據(jù)的上述第2更新裝置所更新的顏色信息構(gòu)成的2值圖像壓縮數(shù)據(jù)的壓縮裝置;以及生成表示包含在象素數(shù)最多的上述區(qū)域的顏色信息中的顏色的數(shù)據(jù),和包含基于上述壓縮裝置的上述2值圖像壓縮數(shù)據(jù)的輸出數(shù)據(jù)的壓縮數(shù)據(jù)生成裝置。
24.根據(jù)權(quán)利要求23所述的圖像編碼裝置,其特征在于上述顏色信息包含表示顏色的數(shù)據(jù),表示構(gòu)成在上述減色圖像中有顏色的區(qū)域的象素數(shù)的數(shù)據(jù)和表示該區(qū)域在上述減色圖像中的位置的數(shù)據(jù)。
25.根據(jù)權(quán)利要求23所述的圖像編碼裝置,其特征在于上述局部圖像生成裝置還對所生成的顏色索引圖像附加索引,還對對應(yīng)的上述顏色信息也附加同樣的索引,并分別使它們相關(guān)聯(lián)。
26.根據(jù)權(quán)利要求24所述的圖像編碼裝置,其特征在于還具備有通過參照對表示包含在上述顏色信息中的象素數(shù)的數(shù)據(jù)進行了進一步調(diào)節(jié)的數(shù)據(jù),來排序上述顏色信息的排序裝置;該排序裝置按照象素數(shù)的多少順序?qū)ι鲜鲱伾畔⑦M行排序。
27.根據(jù)權(quán)利要求24所述的圖像編碼裝置,其特征在于上述第1更新裝置參照表示包含在第1顏色信息中的顏色的數(shù)據(jù)和表示包含在第2顏色信息中的顏色的數(shù)據(jù),在各自的數(shù)據(jù)的差在預(yù)定值以下的情況下,求出各自的顏色的平均色,并把表示包含在上述第1顏色信息中的顏色的數(shù)據(jù)和表示包含在上述第2顏色信息中的顏色的數(shù)據(jù)更新成表示該平均色的數(shù)據(jù)。
28.根據(jù)權(quán)利要求24所述的圖像編碼裝置,其特征在于上述第1更新裝置參照表示包含在第1顏色信息中的顏色的數(shù)據(jù)和表示包含在第2顏色信息中的顏色的數(shù)據(jù),在各自的數(shù)據(jù)的差在預(yù)定值以下的情況下,把表示包含在上述第1顏色信息中的象素數(shù)的數(shù)據(jù)和表示包含在上述第2顏色信息中的象素數(shù)的數(shù)據(jù)相加,并把表示包含在第1顏色信息中的象素數(shù)的數(shù)據(jù)和表示包含在第2顏色信息中的象素數(shù)的數(shù)據(jù)更新成表示上述相加值的數(shù)據(jù)。
29.根據(jù)權(quán)利要求24所述的圖像編碼裝置,其特征在于上述第1更新裝置參照表示包含在第1顏色信息中的顏色的數(shù)據(jù)和表示包含在第2顏色信息中的顏色的數(shù)據(jù),在各自的數(shù)據(jù)的差在預(yù)定值以下的情況下,參照表示包含在上述第1顏色信息中的位置的數(shù)據(jù)和表示包含在上述第2顏色信息中的位置的數(shù)據(jù),確定表示最左上的位置的數(shù)據(jù)和表示最右下的位置的數(shù)據(jù),把表示包含在上述第1顏色信息中的位置的數(shù)據(jù)和表示包含在上述第2顏色信息中的位置的數(shù)據(jù)更新成該所確定的數(shù)據(jù)。
30.根據(jù)權(quán)利要求24所述的圖像編碼裝置,其特征在于上述第2更新裝置還具備有把表示包含在由上述第1更新裝置所更新的顏色信息中的顏色的數(shù)據(jù)變換為亮度色差數(shù)據(jù)的亮度色差數(shù)據(jù)變換裝置。
31.根據(jù)權(quán)利要求23所述的圖像編碼裝置,其特征在于上述壓縮裝置根據(jù)基于上述第1更新裝置及上述第2更新裝置的合并,求得對應(yīng)的合并目標和合并源的顏色索引圖像的邏輯或圖像,生成并壓縮該邏輯或圖像的2值圖像。
32.一種對圖像進行編碼的圖像編碼方法,其特征在于,包括以下步驟對原圖像施加減色處理并生成減色圖像的減色處理步驟;對包含在上述減色圖像中的每個顏色,生成與在上述減色圖像中有顏色的區(qū)域相關(guān)的顏色信息的顏色信息生成步驟;對包含在上述減色圖像中的每個顏色,生成在上述減色圖像中有顏色的區(qū)域的顏色索引圖像的局部圖像生成步驟;在基于上述顏色信息生成步驟的顏色信息中,更新并合并表示較近顏色的顏色信息的第1更新步驟;參照在上述第1更新步驟中所更新的顏色信息,更新并合并表示較近亮度色差的顏色信息的第2更新步驟;根據(jù)基于上述第1更新步驟及上述第2更新步驟的合并,求得相應(yīng)的合并目標和合并源的顏色索引圖像邏輯或圖像,進而在生成該邏輯或圖像的2值圖像后進行壓縮,并生成由該壓縮數(shù)據(jù)和由對應(yīng)該壓縮數(shù)據(jù)的上述第2更新步驟中所更新的顏色信息構(gòu)成的2值圖像壓縮數(shù)據(jù)的壓縮步驟;以及生成表示包含在象素數(shù)最多的上述區(qū)域的顏色信息中的顏色的數(shù)據(jù),和包含基于上述壓縮步驟的上述2值圖像壓縮數(shù)據(jù)的輸出數(shù)據(jù)的壓縮數(shù)據(jù)生成步驟。
33.一種程序,其特征在于通過讀入到信息處理裝置,使該信息處理裝置執(zhí)行權(quán)利要求32所述的圖像編碼方法。
34.一種計算機可讀取的記錄介質(zhì),其特征在于保存了權(quán)利要求33所述的程序。
全文摘要
能夠以高壓縮效率壓縮彩色文檔圖像的圖像壓縮方法、圖像壓縮裝置、圖像編碼裝置及圖像編碼方法。首先,通過減色處理單元(102)把彩色圖像的各象素變換成對應(yīng)顏色值所賦予的索引,生成包含每個被索引化的顏色的象素數(shù)的顏色信息(103)和索引彩色圖像(104)。然后,通過顏色信息排序單元(105)等,例如把與最大象素數(shù)的索引對應(yīng)的顏色值設(shè)為彩色文檔圖像的背景色。接著,通過壓縮順序決定單元(113)決定壓縮順序,通過2值圖像生成·壓縮單元(109)對每個索引生成局部2值圖像,同時按照壓縮順序壓縮2值圖像。然后,通過數(shù)據(jù)合并單元(111)合并背景數(shù)據(jù)(108)和局部2值圖像的壓縮數(shù)據(jù)并生成壓縮數(shù)據(jù)(112)。
文檔編號H04N1/41GK1452388SQ03122140
公開日2003年10月29日 申請日期2003年4月17日 優(yōu)先權(quán)日2002年4月17日
發(fā)明者田中哲臣, 山崎健史 申請人:佳能株式會社