專利名稱:圖像處理裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及壓縮所輸入的多值圖像的圖像處理裝置、對(duì)用該圖像處理裝置生成的壓縮數(shù)據(jù)進(jìn)行解壓縮的圖像處理技術(shù)。
背景技術(shù):
近年來,隨著掃描器的普及,文檔的電子化也不斷發(fā)展。如果以全彩色位圖的形式保存電子化后的文檔,則例如,A4尺寸時(shí),按讀取分辨率300dpi,約是24MB,所需存儲(chǔ)器將非常大。如此大容量的數(shù)據(jù)是不適合附在電子郵件中進(jìn)行發(fā)送的。
因此,通常將全彩色圖像進(jìn)行壓縮,其壓縮方法已知有JPEG。JPEG對(duì)壓縮照片等自然圖像非常有效,但如果對(duì)字符部分進(jìn)行JPEG壓縮,則會(huì)發(fā)生稱為蚊式噪聲的圖像劣化。因此,以往有如下方法將輸入的圖像區(qū)域分割成字符區(qū)域和照片區(qū)域,字符區(qū)域部分在2值化后進(jìn)行MMR壓縮,照片區(qū)域部分進(jìn)行JPEG壓縮,由此也可在保持字符區(qū)域的品質(zhì)的基礎(chǔ)上,用較小的數(shù)據(jù)量來表示全彩色圖像。
該方法的特征為在解壓縮時(shí),2值圖像的白的部分通過使JPEG圖像透明來表示,黑的部分以載有代表色的字符來表示。另外,作為其它的特征是,對(duì)每個(gè)單位字符分配1種顏色。這樣,可以除去原來以單色表示的字符圖像的掃描讀入所引起的不規(guī)則,并且,如果使用于壓縮系統(tǒng),則可以得到高像質(zhì)高壓縮率。
另外,提出有如下方案作為升級(jí)技術(shù),在壓縮時(shí)的JPEG壓縮前,用字符附近的顏色對(duì)字符區(qū)域進(jìn)行填充,由此使壓縮率進(jìn)一步提高。再有,以前也提出,在字符區(qū)域部分,抽取字符代表色的顏色抽取技術(shù)是必不可少的。該顏色抽取技術(shù)是指輸入字符區(qū)域的2值圖像和其字符區(qū)域的坐標(biāo)及彩色圖像,從彩色圖像中抽取字符區(qū)域部分中所希望的顏色。
但是,在以往技術(shù)中,由于不能指定(specify)反轉(zhuǎn)了顏色的反轉(zhuǎn)字符區(qū)域部分,所以存在在反轉(zhuǎn)字符區(qū)域?qū)嵤㎎PEG壓縮,反轉(zhuǎn)字符部分發(fā)生劣化的問題。
近年來,指定反轉(zhuǎn)字符區(qū)域部分的技術(shù)被提出,進(jìn)行反轉(zhuǎn)字符區(qū)域的顏色抽取的技術(shù)成為必需的。這里,如果原樣使用以往的顏色抽取技術(shù),會(huì)存在以下問題,即,將原樣再現(xiàn)(抽取)因掃描器讀入產(chǎn)生的不規(guī)則和壓縮作用而彌散到輸入圖像中的反轉(zhuǎn)字符區(qū)域的顏色。
發(fā)明內(nèi)容
本發(fā)明是鑒于上述問題而完成的,目的在于提供一種圖像處理技術(shù),可以生成良好的復(fù)原圖像,且能進(jìn)行不降低壓縮對(duì)象的圖像品質(zhì)的圖像壓縮。
為了達(dá)到上述目的,本發(fā)明的圖像處理裝置具備以下結(jié)構(gòu)。即,提供一種圖像處理裝置,對(duì)輸入的多值圖像進(jìn)行壓縮,其特征在于,包括2值化裝置,把上述多值圖像2值化;第1區(qū)域指定裝置,指定由上述2值化裝置2值化后的2值圖像中的字符區(qū)域的位置,且判定所指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域;第2區(qū)域指定裝置,指定由上述第1區(qū)域指定裝置指定的字符區(qū)域中的單位字符區(qū)域的位置;縮小裝置,縮小上述多值圖像;代表色抽取裝置,根據(jù)表示由上述第1區(qū)域指定裝置指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域的區(qū)域類別信息,和由上述第2區(qū)域指定裝置指定的單位字符區(qū)域的位置信息,以及上述縮小多值圖像,抽取上述單位字符區(qū)域的代表色;填充裝置,根據(jù)由上述第1區(qū)域指定裝置指定的字符區(qū)域的位置信息,將上述縮小多值圖像的字符區(qū)域內(nèi)的單位字符區(qū)域用其周圍色進(jìn)行填充;第1壓縮裝置,對(duì)由上述填充裝置生成的填充縮小多值圖像進(jìn)行壓縮;第2壓縮裝置,對(duì)與上述第1區(qū)域指定裝置所指定的字符區(qū)域?qū)?yīng)的部分2值圖像進(jìn)行壓縮;輸出裝置,輸出壓縮數(shù)據(jù),該壓縮數(shù)據(jù)包括由上述第1和第2區(qū)域指定裝置指定的位置信息、由上述第1和第2壓縮裝置生成的第1和第2壓縮碼、由上述代表色抽取裝置抽取的單位字符區(qū)域的代表色信息。
另外,上述代表色抽取裝置最好具備平均色計(jì)算裝置,利用由上述第2區(qū)域指定裝置指定的單位字符區(qū)域的位置信息,參照上述縮小多值圖像的顏色信息,計(jì)算出上述單位字符區(qū)域的平均色;第1直方圖生成裝置,根據(jù)上述平均色計(jì)算裝置所生成的單位字符區(qū)域的平均色,生成第1直方圖;抽取裝置,基于上述第1直方圖,抽取成為上述單位字符區(qū)域的代表色的候選色的候選代表色;顏色分配裝置,基于表示上述第1區(qū)域指定裝置所指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域的區(qū)域類別信息,和由上述抽取裝置抽取的候選代表色和上述單位字符區(qū)域的平均色,將上述候選代表色分配給上述單位字符的代表色。
另外,最好是具備第2直方圖生成裝置,上述2值化裝置生成基于上述多值圖像的第2直方圖;2值化閾值計(jì)算裝置,基于上述第2直方圖,計(jì)算出用于對(duì)上述多值圖像進(jìn)行2值化的2值化閾值。
另外,最好是,上述第1區(qū)域指定裝置,把在上述2值圖像中對(duì)取預(yù)定值的像素進(jìn)行輪廓線跟蹤而指定的區(qū)域組,分別指定為字符區(qū)域和自然圖像區(qū)域,且對(duì)于字符區(qū)域指定是否為反轉(zhuǎn)字符區(qū)域,并指定表示上述區(qū)域組的各區(qū)域的位置信息、大小信息和其種類的屬性信息。
另外,最好是,上述第2區(qū)域指定裝置,把由上述第1區(qū)域指定裝置指定的字符區(qū)域中的取預(yù)定值的像素的集合指定為單位字符區(qū)域,并指定上述單位字符區(qū)域的位置信息和大小信息。
另外,最好是,上述平均色計(jì)算裝置利用由上述第2區(qū)域指定裝置所指定的單位字符區(qū)域的位置信息,參照與上述單位字符區(qū)域內(nèi)的取預(yù)定值的像素對(duì)應(yīng)的上述縮小多值圖像的顏色信息,由此計(jì)算出該單位字符區(qū)域的平均色。
另外,最好是,上述第1直方圖生成裝置利用由上述平均色計(jì)算裝置所計(jì)算出的單位字符區(qū)域的平均色,生成由上述單位字符區(qū)域構(gòu)成的字符區(qū)域內(nèi)的色空間直方圖,作為第1直方圖。
另外,上述抽取裝置從上述色空間直方圖中輸出頻率高的顏色分布開始,按順序抽取成為上述單位字符區(qū)域的代表色的候選色的候選代表色。
另外,最好是,上述顏色分配裝置計(jì)算由上述抽取裝置所抽取的候選代表色和上述單位字符區(qū)域的平均色之間的色空間上的距離,當(dāng)該距離在預(yù)定范圍之內(nèi)時(shí),將上述候選代表色作為上述單位字符區(qū)域的代表色來進(jìn)行分配。
另外,最好是,上述顏色分配裝置計(jì)算由上述抽取裝置所抽取的候選代表色和上述單位字符區(qū)域的平均色之間的色空間上的距離,當(dāng)該距離在預(yù)定范圍之內(nèi),且由單位字符區(qū)域構(gòu)成的字符區(qū)域是反轉(zhuǎn)字符區(qū)域時(shí),將預(yù)定色作為上述單位字符區(qū)域的代表色來進(jìn)行分配。
另外,最好是,上述縮小裝置利用分辨率變換參數(shù),通過對(duì)上述多值圖像進(jìn)行分辨率變換而縮小該多值圖像。
另外,最好是,上述填充裝置基于由上述第1區(qū)域指定裝置所指定的字符區(qū)域的位置信息,將與相應(yīng)于由上述縮小裝置所設(shè)定的縮小率的位置相對(duì)應(yīng)的上述縮小多值圖像的字符區(qū)域內(nèi)的單位字符區(qū)域,用其周圍色進(jìn)行填充。
另外,最好是,上述第1壓縮裝置為JPEG壓縮標(biāo)準(zhǔn)。
另外,最好是,上述第2壓縮裝置為MMR壓縮標(biāo)準(zhǔn)。
另外,最好是,還具有對(duì)上述壓縮數(shù)據(jù)進(jìn)行可逆壓縮的第3壓縮裝置。
用于達(dá)到上述目的的本發(fā)明的圖像處理裝置具有以下結(jié)構(gòu)。即,一種對(duì)壓縮數(shù)據(jù)進(jìn)行解壓縮的圖像處理裝置,其特征在于,包括輸入裝置,輸入壓縮數(shù)據(jù),該壓縮數(shù)據(jù)包括對(duì)將多值圖像2值化后的2值圖像中的字符區(qū)域或反轉(zhuǎn)字符區(qū)域進(jìn)行了壓縮的第1壓縮碼;對(duì)縮小多值圖像進(jìn)行壓縮后的第2壓縮碼,該縮小多值圖像是將上述多值圖像的縮小多值圖像的字符區(qū)域或反轉(zhuǎn)字符區(qū)域內(nèi)的單位字符區(qū)域用其周圍色進(jìn)行了填充的圖像;上述字符區(qū)域或反轉(zhuǎn)字符區(qū)域的位置信息;該字符區(qū)域或反轉(zhuǎn)字符區(qū)域內(nèi)的單位字符區(qū)域的代表色信息;第1解壓縮裝置,對(duì)上述壓縮數(shù)據(jù)中的上述第1壓縮碼進(jìn)行解壓縮;第2解壓縮裝置,對(duì)上述壓縮數(shù)據(jù)中的上述第2壓縮碼進(jìn)行解壓縮;放大裝置,對(duì)由上述第2解壓縮裝置解壓縮后的縮小多值圖像進(jìn)行放大;合成裝置,基于上述壓縮數(shù)據(jù)中的上述位置信息和上述代表色,把由上述第1解壓縮裝置解壓縮后的2值圖像和由上述放大裝置放大后的多值圖像進(jìn)行合成。
用于達(dá)到上述目的的本發(fā)明的圖像處理方法具有以下結(jié)構(gòu)。即,一種圖像處理方法,對(duì)輸入的多值圖像進(jìn)行壓縮,其特征在于,包括2值化步驟,把上述多值圖像2值化;第1區(qū)域指定步驟,指定由上述2值化步驟2值化后的2值圖像中的字符區(qū)域的位置,且判定所指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域;第2區(qū)域指定步驟,指定由上述第1區(qū)域指定步驟指定的字符區(qū)域中的單位字符區(qū)域的位置;縮小步驟,縮小上述多值圖像;代表色抽取步驟,根據(jù)表示由上述第1區(qū)域指定步驟指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域的區(qū)域類別信息,和由上述第2區(qū)域指定步驟指定的單位字符區(qū)域的位置信息,以及上述縮小多值圖像,抽取上述單位字符區(qū)域的代表色;填充步驟,根據(jù)由上述第1區(qū)域指定步驟指定的字符區(qū)域的位置信息,將上述縮小多值圖像的字符區(qū)域內(nèi)的單位字符區(qū)域用其周圍色進(jìn)行填充;第1壓縮步驟,對(duì)由上述填充步驟生成的填充縮小多值圖像進(jìn)行壓縮;第2壓縮步驟,對(duì)與上述第1區(qū)域指定步驟所指定的字符區(qū)域?qū)?yīng)的部分2值圖像進(jìn)行壓縮;輸出步驟,輸出壓縮數(shù)據(jù),該壓縮數(shù)據(jù)包括由上述第1和第2區(qū)域指定步驟指定的位置信息、由上述第1和第2壓縮步驟生成的第1和第2壓縮碼、由上述代表色抽取步驟抽取的單位字符區(qū)域的代表色信息。
用于達(dá)到上述目的的本發(fā)明的圖像解壓縮方法具有以下結(jié)構(gòu)。即,一種對(duì)壓縮數(shù)據(jù)進(jìn)行解壓縮的圖像處理方法,其特征在于,包括輸入步驟,輸入壓縮數(shù)據(jù),該壓縮數(shù)據(jù)包括對(duì)將多值圖像2值化后的2值圖像中的字符區(qū)域或反轉(zhuǎn)字符區(qū)域進(jìn)行了壓縮的第1壓縮碼;對(duì)縮小多值圖像進(jìn)行壓縮后的第2壓縮碼,該縮小多值圖像是將上述多值圖像的縮小多值圖像的字符區(qū)域或反轉(zhuǎn)字符區(qū)域內(nèi)的單位字符區(qū)域用其周圍色進(jìn)行了填充的圖像;上述字符區(qū)域或反轉(zhuǎn)字符區(qū)域的位置信息;該字符區(qū)域或反轉(zhuǎn)字符區(qū)域內(nèi)的單位字符區(qū)域的代表色信息;第1解壓縮步驟,對(duì)上述壓縮數(shù)據(jù)中的上述第1壓縮碼進(jìn)行解壓縮;第2解壓縮步驟,對(duì)上述壓縮數(shù)據(jù)中的上述第2壓縮碼進(jìn)行解壓縮;放大步驟,對(duì)由上述第2解壓縮步驟解壓縮后的縮小多值圖像進(jìn)行放大;合成步驟,基于上述壓縮數(shù)據(jù)中的上述位置信息和上述代表色,把由上述第1解壓縮步驟解壓縮后的2值圖像和由上述放大步驟放大后的多值圖像進(jìn)行合成。
本發(fā)明的其它特征和優(yōu)點(diǎn),通過以下的結(jié)合附圖的說明將得以明確。在這些附圖中,相同的參照標(biāo)號(hào)表示相同或相似的部分。
附圖包括在說明書中并構(gòu)成該說明書的一部分,說明附圖本發(fā)明的具體實(shí)施方式
,并與說明書一起解釋本發(fā)明的原理。
圖1是表示本發(fā)明實(shí)施方式的圖像壓縮裝置的概略結(jié)構(gòu)的圖。
圖2是表示本發(fā)明實(shí)施方式的輸入圖像的一例的圖。
圖3是表示本發(fā)明實(shí)施方式的2值化部所執(zhí)行的2值化處理的流程圖。
圖4是表示本發(fā)明實(shí)施方式的輸入圖像的直方圖的一例的圖。
圖5是表示本發(fā)明實(shí)施方式的區(qū)域指定部A所執(zhí)行的處理的流程圖。
圖6是表示本發(fā)明實(shí)施方式的區(qū)域指定部B所執(zhí)行的處理的流程圖。
圖7是表示本發(fā)明實(shí)施方式的2值圖像的一例的圖。
圖8是表示本發(fā)明實(shí)施方式的區(qū)域指定部A的處理結(jié)果的一例的圖。
圖9是表示本發(fā)明實(shí)施方式的區(qū)域指定部B的處理結(jié)果的一例的圖。
圖10是表示本發(fā)明實(shí)施方式的代表色抽取部所執(zhí)行的處理的流程圖。
圖11是表示本發(fā)明實(shí)施方式的代表色抽取處理的詳細(xì)情況的流程圖。
圖12A是表示本發(fā)明實(shí)施方式的步驟S1006的代表色抽取和顏色分配的處理的詳細(xì)情況的流程圖。
圖12B是表示本發(fā)明實(shí)施方式的步驟S1503的詳細(xì)情況的流程圖。
圖13是用于說明本發(fā)明實(shí)施方式的代表色抽取部的處理的圖。
圖14是用于說明本發(fā)明實(shí)施方式的代表色抽取部的處理的圖。
圖15是表示本發(fā)明實(shí)施方式的字符區(qū)域填充部所執(zhí)行的處理的流程圖。
圖16是表示本發(fā)明的實(shí)施方式的圖像解壓縮裝置的概略結(jié)構(gòu)的圖。
具體實(shí)施例方式
下面,用附圖詳細(xì)說明本發(fā)明的實(shí)施方式。
以下說明的實(shí)施方式的圖像壓縮裝置及圖像解壓縮裝置的各構(gòu)成要素的相對(duì)配置、各處理所使用的數(shù)學(xué)公式、數(shù)值等,如果沒有指定的記載,該發(fā)明的范圍不只限于這些。
圖1是表示本發(fā)明實(shí)施方式的圖像壓縮裝置的概略結(jié)構(gòu)的圖。
在圖1中,實(shí)線表示圖像的流向和輸入,虛線表示信息的流向和輸入。
彩色多值圖像的輸入圖像101在2值化部102中進(jìn)行2值化,生成2值圖像103。區(qū)域指定部A104以2值圖像103為輸入,通過例如取預(yù)定值的像素(例如,黑像素)的輪廓線跟蹤等檢測(cè)字符區(qū)域,生成字符區(qū)域坐標(biāo)106。字符區(qū)域坐標(biāo)106是表示字符區(qū)域的位置(坐標(biāo))和大小的信息。并且,通過區(qū)域指定部A104指定字符區(qū)域,顯然也就指定了表示除此之外的照片和插圖等的自然(灰階)圖像的自然圖像區(qū)域的位置和大小。進(jìn)一步說,也另外生成用于指定各區(qū)域的種類的屬性信息(字符和圖像)。
區(qū)域指定部B105,以由2值圖像103和區(qū)域指定部A104所生成的字符區(qū)域坐標(biāo)106為輸入,指定字符區(qū)域內(nèi)的各字符(單位字符區(qū)域)的位置和大小。為了使說明簡(jiǎn)單,在實(shí)施方式1中,使各單位字符區(qū)域的位置和大小的信息也追加到字符區(qū)域坐標(biāo)106中。并且,根據(jù)由區(qū)域指定部A104所生成的字符區(qū)域坐標(biāo)106,生成每個(gè)字符區(qū)域的2值圖像(部分2值圖像107)。并且,多值圖像112通過縮小部113而縮小,生成縮小多值圖像114。
另外,縮小部113根據(jù)所設(shè)定的分辨率變換參數(shù),進(jìn)行多值圖像112的分辨率變換。并且,該分辨率變換參數(shù)可以根據(jù)處理對(duì)象的多值圖像的空間頻率進(jìn)行適當(dāng)?shù)目刂?。例如,多值圖像的高頻成分較小時(shí),可以控制該分辨率變換參數(shù),使得變換成比高頻成分較大時(shí)更低的分辨率。
代表色抽取部110輸入并參照部分2值圖像107和字符區(qū)域坐標(biāo)106以及縮小多值圖像114,使部分2值圖像107的黑色部分與縮小多值圖像114進(jìn)行位置對(duì)應(yīng),并計(jì)算出字符區(qū)域中的各單位字符區(qū)域的各字符代表色111。另外,多值圖像112和輸入圖像101相同。
字符區(qū)域填充部115輸入并參照部分2值圖像107和縮小多值圖像114以及字符區(qū)域坐標(biāo)106,對(duì)縮小多值圖像114上的各字符區(qū)域或每個(gè)單位字符區(qū)域,用其周圍色進(jìn)行全涂處理(置換為周圍色的處理)。
進(jìn)行以上處理之后,部分2值圖像107各自按順序由MMR壓縮部108壓縮成為壓縮碼A109。并且,由字符區(qū)域填充部115填充后的填充縮小多值圖像,由JPEG壓縮部116進(jìn)行JPEG壓縮,成為壓縮碼B117。另外,也可以使用MMR壓縮以外的2值圖像壓縮,如,JBIG壓縮、MR壓縮、MH壓縮等來代替MMR壓縮部108。
這樣生成壓縮數(shù)據(jù)118,該壓縮數(shù)據(jù)118結(jié)合了從各結(jié)構(gòu)要素得到的字符區(qū)域坐標(biāo)106、壓縮碼A109、各字符代表色111、壓縮碼B117的數(shù)據(jù)組。還可以把該壓縮數(shù)據(jù)118進(jìn)行可逆壓縮,成為PDF等。
另外,輸入圖像101中不存在字符區(qū)域時(shí),壓縮數(shù)據(jù)118成為只有壓縮碼B117。
另外,作為實(shí)現(xiàn)圖像壓縮裝置和對(duì)后述的用該圖像壓縮裝置生成的壓縮數(shù)據(jù)進(jìn)行解壓縮的圖像解壓縮裝置的硬件結(jié)構(gòu),例如,可以用個(gè)人計(jì)算機(jī)等的通用計(jì)算機(jī)來實(shí)現(xiàn)。并且,在該通用計(jì)算機(jī)中,作為其標(biāo)準(zhǔn)構(gòu)成要素,具有例如CPU、RAM、ROM、硬盤、外部存儲(chǔ)裝置、網(wǎng)絡(luò)接口、顯示器、鍵盤、鼠標(biāo)等。
另外,這些圖像要素裝置和圖像解壓縮裝置也可以用作為對(duì)這樣的通用計(jì)算機(jī)的擴(kuò)展卡的專用硬件來實(shí)現(xiàn)。
另外,作為安裝這些圖像壓縮裝置和圖像解壓縮裝置的裝置的具體例子,可以舉出如下幾個(gè)具有網(wǎng)絡(luò)通信功能的多功能機(jī)(具有復(fù)印、打印、掃描、傳真功能等的裝置)、彩色掃描器、彩色傳真機(jī)等。
下面,用圖2和圖3說明2值化部102所執(zhí)行的2值化處理。
圖2是表示本發(fā)明實(shí)施方式的輸入圖像的一例的圖。另外,圖3是表示本發(fā)明實(shí)施方式的2值化部所執(zhí)行的2值化處理的流程圖。
在圖2中,輸入圖像201為彩色多值圖像,區(qū)域203的字符是白色,區(qū)域204的字符是黃色,區(qū)域205的字符是藍(lán)色,區(qū)域207的字符是黑色,區(qū)域206的圖像是任意的多色。另外,該輸入圖像201是用掃描器讀取的圖像時(shí),雖然包括其讀取時(shí)的不規(guī)則和JPEG壓縮的劣化,但顯然不包括劣化的圖像也是本實(shí)施方式的對(duì)象。
以下作為例子,假設(shè)是用掃描器讀取輸入圖像101后的RGB數(shù)據(jù)(24比特),首先,在步驟S301中根據(jù)下述變換式進(jìn)行亮度變換,生成亮度圖像。
Y=0.299×R+0.587×G+0.114×B然后,在步驟S302中生成亮度圖像的全部直方圖。這里,圖4是直方圖的例圖。在圖4中,橫軸是Y信號(hào)的亮度級(jí)0-255,縱軸表示其出現(xiàn)的頻率。在圖4中,401是字符或圖像的分布,402是背景信息的分布。
然后,在步驟S303中計(jì)算出最適合的2值化閾值T。但是,這里的2值化閾值T的計(jì)算方法不特別進(jìn)行限定。在圖4中,例如把分布401和分布402的頂點(diǎn)的亮度級(jí)間的中間點(diǎn)403作為2值化閾值T。
最后,在步驟S304中,基于2值化閾值T把亮度圖像2值化。
通過以上處理生成圖1的2值圖像103。并且,將圖2的多值圖像201進(jìn)行2值化后的2值圖像成為如圖7的2值圖像701那樣。
下面,用圖5說明區(qū)域指定部A104所執(zhí)行的處理。
圖5是表示本發(fā)明實(shí)施方式的區(qū)域指定部A104所執(zhí)行的處理的流程圖。
首先,在步驟S501中,參照2值圖像103的黑像素進(jìn)行輪廓線跟蹤。其次,在步驟S502中,對(duì)已被跟蹤的輪廓線內(nèi)再次進(jìn)行跟蹤,根據(jù)其跟蹤結(jié)果,從輪廓線內(nèi)的區(qū)域指定字符區(qū)域和其位置及大小。進(jìn)而,指定已被指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域,并生成表示是否是其反轉(zhuǎn)字符區(qū)域的區(qū)域類別信息,保存在存儲(chǔ)器中。另外,字符區(qū)域以外的區(qū)域指定為自然圖像區(qū)域。
通過以上處理,指定表示字符區(qū)域、反轉(zhuǎn)字符區(qū)域和自然圖像區(qū)域的位置、大小及其區(qū)域種類的屬性。這里,在圖8中表示對(duì)圖7的2值圖像701實(shí)施了區(qū)域指定部A104的處理的結(jié)果。在圖8中,全部共有4個(gè)區(qū)域被指定,801-803是字符區(qū)域,其中,字符區(qū)域801是反轉(zhuǎn)字符區(qū)域,804被指定為自然圖像區(qū)域。
下面,利用圖6說明區(qū)域指定部B105所執(zhí)行的處理。
圖6是表示本發(fā)明實(shí)施方式的區(qū)域指定部B105所執(zhí)行的處理的流程圖。
依次對(duì)由區(qū)域指定部A104指定的字符區(qū)域組、圖8中的字符區(qū)域801-803進(jìn)行用圖6說明的處理。
首先在步驟S601中,判定有無未處理的字符區(qū)域。如果沒有未處理的字符區(qū)域(步驟S601為NO),則結(jié)束處理。另一方面,如果有未處理的字符區(qū)域(步驟S601為YES),則進(jìn)入步驟S602。
其次,在步驟S602中,把2值圖像的取預(yù)定值(黑像素,但對(duì)反轉(zhuǎn)字符區(qū)域時(shí)為白像素)的像素的集合視為單位字符,并指定單位字符區(qū)域的位置。這里,在圖9中表示對(duì)圖8的字符區(qū)域801實(shí)施區(qū)域指定部B105的處理后的結(jié)果。在圖9中指定全部5個(gè)單位字符區(qū)域902-906。以后同樣地,對(duì)圖8的字符區(qū)域802、803也執(zhí)行處理。
像以上那樣,把由區(qū)域指定部A104和區(qū)域指定部B105所指定的字符區(qū)域·單位字符區(qū)域的區(qū)域信息(位置、大小、有無反轉(zhuǎn))作為字符區(qū)域坐標(biāo)106,保存在例如圖像壓縮裝置內(nèi)的存儲(chǔ)器(例如RAM)中。
下面,利用圖10-圖12A及圖12B的流程圖、圖13和圖14的說明圖,對(duì)代表色抽取部110所執(zhí)行的處理進(jìn)行說明。
圖10是表示本發(fā)明實(shí)施方式的代表色抽取部所執(zhí)行的處理的流程圖。
在代表色抽取部110中,如上所述,用字符區(qū)域坐標(biāo)106和部分2值圖像107及縮小多值圖像114作為輸入。部分2值圖像107采用剪切2值圖像103的字符區(qū)域,并保存在另外的工作存儲(chǔ)器等的存儲(chǔ)器中的圖像。縮小多值圖像114是通過縮小部113將多值圖像112進(jìn)行縮小后的圖像,同樣保存在另外的工作存儲(chǔ)器等的存儲(chǔ)器中。
另外,在本實(shí)施方式中,使縮小部113的縮小率為50%來進(jìn)行說明。這種情況下,縮小多值圖像用的工作存儲(chǔ)器與縮小前的多值圖像用的工作存儲(chǔ)器相比,其存儲(chǔ)器容量可減少至1/4。但是,縮小率不限于是50%,可根據(jù)用途和目的設(shè)定任意的縮小率。
在代表色抽取部110中,由于按順序?qū)λ械淖址麉^(qū)域,即所有的部分2值圖像107進(jìn)行處理(在本實(shí)施方式中,字符區(qū)域有圖8中的字符區(qū)域801-803的3個(gè),按照該順序進(jìn)行處理),所以最初在步驟1101中,參照字符區(qū)域坐標(biāo)106,判定有無未處理的字符區(qū)域。如果沒有未處理的字符區(qū)域(步驟S1101為NO),則結(jié)束處理。另一方面,如果有未處理的字符區(qū)域(步驟S1101為YES),則進(jìn)入步驟S1102。
下面,在步驟1102中,參照字符區(qū)域坐標(biāo)106,判定字符區(qū)域是否是反轉(zhuǎn)字符區(qū)域。如果是反轉(zhuǎn)字符區(qū)域(步驟S1102為YES),則進(jìn)入步驟S1103,通過反轉(zhuǎn)處理使該反轉(zhuǎn)字符區(qū)域的顏色反轉(zhuǎn)。即,從白色字符變?yōu)楹谏址?。之后,在代表色抽取?10中執(zhí)行代表色抽取處理(步驟S1104)。
另外,對(duì)于反轉(zhuǎn)字符區(qū)域,執(zhí)行步驟S1103的反轉(zhuǎn)處理的理由是使對(duì)通常的字符區(qū)域?qū)嵤┑拇砩槿√幚砗吞幚項(xiàng)l件共通,在代表色抽取部110中適用共通算法。但是,在代表色抽取部110的處理后,因?yàn)檫€必須返回成原來的反轉(zhuǎn)字符區(qū)域,所以在步驟S1105中,通過再次反轉(zhuǎn)處理,使在步驟S1103中實(shí)施了反轉(zhuǎn)處理的字符區(qū)域的顏色進(jìn)行再次反轉(zhuǎn),即,從黑色字符變?yōu)榘咨址?br>
另一方面,在步驟S1102中,字符區(qū)域不是反轉(zhuǎn)字符區(qū)域時(shí)(步驟S1102為NO),進(jìn)入步驟S1106,用代表色抽取部110執(zhí)行代表色抽取處理。
下面,利用圖11詳細(xì)說明步驟S1104或步驟S1106的代表色抽取處理。
圖11是表示本發(fā)明實(shí)施方式的代表色抽取處理的詳細(xì)情況的流程圖。
另外,如上所述,代表色抽取處理中的處理對(duì)象為通常的字符區(qū)域、反轉(zhuǎn)字符區(qū)域兩者。但是,在對(duì)反轉(zhuǎn)字符區(qū)域的代表色抽取處理中伴隨有后述的特別處理。因此,在本實(shí)施方式中,作為反轉(zhuǎn)字符區(qū)域?yàn)樘幚韺?duì)象時(shí)的處理例,對(duì)圖9的反轉(zhuǎn)字符區(qū)域901的代表色抽取處理進(jìn)行說明。
首先,在步驟S1201中,將字符區(qū)域的代表色數(shù)n設(shè)定為1。這意味著“抽取第1色的顏色”。然后,在步驟S1202,參照字符區(qū)域坐標(biāo)106,并參照位置上與部分2值圖像107的黑像素對(duì)應(yīng)的縮小多值圖像114的顏色(RGB),對(duì)每個(gè)單位字符計(jì)算出RGB的平均色。
其次,在步驟S1203中,將上述所計(jì)算出的各單位字符區(qū)域的RGB的平均色變換成YCbCr那樣的、能用亮度Y和色差CbCr表示的色空間。
另外,色空間也可以是Lab或Yuv等其它的色空間,但這里用YCbCr進(jìn)行說明。并且省略從RGB到Y(jié)CbCr的變換式。
另外,輸入圖像101為JPEG圖像時(shí),具有以下特征,即,不進(jìn)行JPEG解壓縮時(shí)一般所進(jìn)行的YCbCr->RGB變換,而能夠以YCbCr色空間就此輸入。因此,這時(shí),不需要步驟S1203的處理,可實(shí)現(xiàn)更高速的處理。
例如,對(duì)上述圖9的5個(gè)單位字符區(qū)域902-906實(shí)施YCbCr變換后,成為單位字符區(qū)域902(Y1,Cb1,Cr1)單位字符區(qū)域903(Y2,Cb2,Cr2)單位字符區(qū)域904(Y3,Cb3,Cr3)單位字符區(qū)域905(Y4,Cb4,Cr4)單位字符區(qū)域906(Y5,Cb5,Cr5)。
然后,在步驟S1204中,作為步驟S1205的直方圖生成的準(zhǔn)備,進(jìn)行直方圖初始化(直方圖清除)。然后,在步驟S1205中,生成色差Cb,Cr的2維直方圖。將其示于圖13中。圖13的5個(gè)標(biāo)繪點(diǎn)1301-1305分別為標(biāo)繪點(diǎn)1301(Cb1,Cr1)→單位字符區(qū)域902的標(biāo)繪點(diǎn)標(biāo)繪點(diǎn)1302(Cb2,Cr2)→單位字符區(qū)域903的標(biāo)繪點(diǎn)標(biāo)繪點(diǎn)1303(Cb3,Cr3)→單位字符區(qū)域904的標(biāo)繪點(diǎn)標(biāo)繪點(diǎn)1304(Cb4,Cr4)→單位字符區(qū)域905的標(biāo)繪點(diǎn)標(biāo)繪點(diǎn)1305(Cb5,Cr5)→單位字符區(qū)域906的標(biāo)繪點(diǎn)。
另外,標(biāo)繪點(diǎn)1301、1302、1303的集合跟標(biāo)繪點(diǎn)1304、1305的集合之間的距離分開,是因?yàn)楸硎居脠D2的輸入圖像(彩色多值圖像)201的區(qū)域203和區(qū)域204所顯示的顏色的差異。進(jìn)而,標(biāo)繪點(diǎn)1301、1302和1303之間的差,或者標(biāo)繪點(diǎn)1304和1305之間的差表示用掃描器所讀取的輸入圖像的不規(guī)則或者由其后的處理(例如,JPEG壓縮)引起的不規(guī)則。
并且,本來希望字符區(qū)域801中的單位字符區(qū)域內(nèi)、單位字符區(qū)域(反轉(zhuǎn)單位字符區(qū)域)902-904,即標(biāo)繪點(diǎn)1301-1303是白色(Cb,Cr)=(0,0),但是,由于和上述不規(guī)則相同的理由,反轉(zhuǎn)字符區(qū)域的背景部分的顏色影響反轉(zhuǎn)單位字符區(qū)域的字符部分,在遠(yuǎn)離(Cb,Cr)=(0,0)的地方被標(biāo)繪。
另外,在本實(shí)施方式中,為了處理的高速化,在步驟S1205中生成了2維直方圖,但是為了提高精確度,也可生成Y,Cb,Cr的3維直方圖。
返回圖11的說明。
下面,在步驟S1206中,進(jìn)行各單位字符區(qū)域的代表色抽取和顏色分配。關(guān)于該處理的詳細(xì)情況后面再敘述。
然后,在步驟S1207中,判定有無在步驟S1206中未分配顏色的單位字符。如果有未分配的單位字符(步驟S1207為YES),則進(jìn)入到步驟S1208,在代表色數(shù)n上加1,把先前生成的直方圖初始化(步驟S1204),并只對(duì)未分配顏色的單位字符生成直方圖(步驟S1205)。以下,同樣在步驟S1207繼續(xù)處理,直到未分配顏色的單位字符沒有為止。并且,當(dāng)沒有未分配的單位字符時(shí)(步驟S1207為NO),結(jié)束處理。
下面,用圖12A和圖12B對(duì)步驟S1206的各單位字符區(qū)域的代表色抽取和顏色分配的處理的詳細(xì)情況進(jìn)行說明。
圖12A和圖12B是表示本發(fā)明實(shí)施方式的步驟S1206的代表色抽取和顏色分配的處理的詳細(xì)情況的流程圖。
首先,在步驟S1501中,抽取成為單位字符區(qū)域的代表色的候選的候選代表色C’(n)。另外,n是代表色數(shù),和圖11所使用的n相同。另外,候選代表色C’(n)是具有Cb,Cr的信息的構(gòu)造體,將第n個(gè)代表色的Cb表示為C’(n)_b,將第n個(gè)代表色的Cr表示為C’(n)_r。
利用圖14說明具體的候選代表色的抽取方法。
圖14中所示的用虛線圍起的四邊形表示預(yù)先設(shè)定的區(qū),各區(qū)設(shè)定有1個(gè)代表色(Cb,Cr)。區(qū)的大小雖然是任意的,但最好是考慮到精度和處理效率的折中選擇來進(jìn)行設(shè)定。
YcbCr各為8比特時(shí),本實(shí)施方式中把區(qū)的縱橫寬設(shè)定為3比特。但是在圖14中,為了使說明簡(jiǎn)單,將區(qū)放大來進(jìn)行圖示。這里,按Cb-Cr方向掃描各區(qū),取得區(qū)內(nèi)的標(biāo)繪點(diǎn)數(shù)的最大值。這里,由于在1區(qū)得到最大標(biāo)繪點(diǎn)數(shù)3,所以作為候選代表色得到1401(黑三角▲)?;蛘?,也可以從這3個(gè)標(biāo)繪點(diǎn)重新計(jì)算出代表色。
返回圖12A的說明。
接下來,在步驟S1502中判定處理對(duì)象的字符區(qū)域是否是反轉(zhuǎn)字符區(qū)域。如果是反轉(zhuǎn)字符區(qū)域(步驟S1502為YES),則在步驟S1503中進(jìn)行抽取的C’(n)的調(diào)整。該調(diào)整的目的是根據(jù)掃描讀取的不規(guī)則和JPEG壓縮等的劣化,輸入圖像的反轉(zhuǎn)字符區(qū)域的背景色滲入到本來應(yīng)該是白色的字符部分,從而將被誤抽取的代表色作為預(yù)定色(白色)來進(jìn)行修正。
利用圖12B對(duì)該步驟S1503進(jìn)行詳細(xì)說明。
圖12B是表示本發(fā)明實(shí)施方式的步驟S1503的詳細(xì)情況的流程圖。
首先,在步驟S1511中,把WhiteFlag初始設(shè)定為OFF。然后,在步驟S1512中計(jì)算出代表色C’(n)與色空間上的原點(diǎn)(Cb,Cr)=(0,0)的距離Distance_R。然后,在步驟S1513中判定距離Distance_R是否小于等于預(yù)定值value_R。
如果Distance_R比預(yù)定值value_R大(步驟S1513為NO),則結(jié)束處理,并進(jìn)入到步驟S1504。另一方面,如果Distance_R小于等于預(yù)定值value_R(步驟S1513為YES),則將WhiteFlag設(shè)定為ON,進(jìn)入到步驟S1504。
另外,WhiteFlag是用于表示是否把代表色C’(n)設(shè)定為表示預(yù)定色(白色)的(Cb,Cr)=(0,0)的標(biāo)志,是ON時(shí),在后述的步驟S1509中將C’(n)設(shè)定為(Cb,Cr)=(0,0)。
返回圖12A的說明。
另一方面,在步驟S1502中,處理對(duì)象的字符區(qū)域不是反轉(zhuǎn)字符區(qū)域時(shí)(步驟S1502為NO),進(jìn)入步驟S1504,將單位字符數(shù)m設(shè)定為1。然后,在步驟S1505中判定m是否小于等于M。如果小于等于M(步驟S1505為YES),則進(jìn)入到步驟S1506。另一方面,如果比M大(步驟S1505為NO),則結(jié)束處理。
這里,M是處理對(duì)象的字符區(qū)域內(nèi)的單位字符數(shù)(總數(shù)),例如,在圖9的字符區(qū)域801中,M=5。這種情況下,當(dāng)m=1時(shí),步驟S1505的條件為YES,進(jìn)入步驟S1506。并且,當(dāng)m=6時(shí),步驟S1505的條件為NO,跳出步驟S1506的循環(huán)。
在步驟S1506中,判定作為單位字符區(qū)域的平均色的單位字符色C(m)是否未確定。如果不是未確定(步驟S1506為NO),則進(jìn)入步驟S1510。另一方面,如果是未確定(步驟S1506為YES),則進(jìn)入步驟S1507。
這里,單位字符色C(m)是具有Cb,Cr信息的構(gòu)造體,將第m個(gè)單位字符色的Cb表示為C(m)_b,將第m個(gè)代表色Cr表示為C(m)_r。單位字符色C(m)由于開始未被分配值,所以C(m)未確定,進(jìn)入步驟S1507。
然后,在步驟S1507中,計(jì)算候選代表色C’(n)和單位字符色C(m)的色空間上的距離(Distance)。
然后,在步驟S1508中,對(duì)預(yù)先設(shè)定的值value判定是否為Distance≤value。如果不是Distance≤value(步驟S1508為NO),就進(jìn)入步驟S1510。另一方面,如果是Distance≤value(步驟S1508為YES),也就是單位字符色C(m)被視為候選代表色C’(n)的近似色,則進(jìn)入步驟S1509。
在步驟S1509中,把候選代表色C’(n)設(shè)定為單位字符色C(m)(單位字符區(qū)域的代表色)。即,把C’(n)_b代入到C(m)_b中,把C’(n)_r代入到C(m)_r中。并且,在步驟S1510中,給單位字符數(shù)m加1,返回步驟S1505。
另外,步驟S1508中的value是用于判定單位字符色C(m)是否是候選代表色C’(n)的近似色的閾值,可以任意地調(diào)整該值。并且,如上所述,當(dāng)處理對(duì)象的字符區(qū)域是反轉(zhuǎn)字符區(qū)域,且WhiteFlag為ON時(shí),對(duì)C(m)_b和C(m)_r分別代入0。
并且,從2維直方圖計(jì)算出代表色時(shí),由于代表色不具有亮度成分Y,所以需要在字符區(qū)域內(nèi)的具有相同代表色的單位字符間計(jì)算出亮度成分Y。進(jìn)而需要代表色的RGB信息時(shí),進(jìn)行從YcbCr向RGB的色空間變換。
如上所述,用圖10、圖11、圖12A和圖12B所表示的流程圖,特別是利用部分2值圖像107和縮小多值圖像114進(jìn)行各單位字符區(qū)域的代表色抽取和顏色分配。并且,被抽取的代表色作為圖1的各字符代表色111被存儲(chǔ)在壓縮數(shù)據(jù)118中。
下面,利用圖15說明字符區(qū)域填充部115所執(zhí)行的處理。
圖15是表示本發(fā)明實(shí)施方式的字符區(qū)域填充部所執(zhí)行的處理的流程圖。
字符區(qū)域填充部115輸入并參照縮小多值圖像114和部分2值圖像107及字符區(qū)域坐標(biāo)106,用周圍的背景色將相當(dāng)于縮小多值圖像114中的字符的像素進(jìn)行全涂處理。由此,提高后面的JPEG壓縮部116的壓縮率。
首先,在步驟S1701中,為了對(duì)每個(gè)字符區(qū)域進(jìn)行處理,判定有無未處理的字符區(qū)域。如果沒有未處理的字符區(qū)域(步驟S1701為NO),則結(jié)束處理。另一方面,如果有未處理的字符區(qū)域(步驟S1701為YES),就進(jìn)入步驟S1702,通過參照位置上與部分2值圖像107的白像素對(duì)應(yīng)的縮小多值圖像114的顏色,計(jì)算出字符區(qū)域內(nèi)的背景色的平均值。由于部分2值圖像107和縮小多值圖像114的坐標(biāo)對(duì)應(yīng)的方法與在代表色抽取部110中說明的方法相同,所以省略其詳細(xì)說明。
然后,在步驟S1703中,把計(jì)算出的背景色的平均值分配給縮小多值圖像114的字符區(qū)域,也就是說,用計(jì)算出的背景色來把填充縮小多值圖像114的字符區(qū)域或其字符區(qū)域內(nèi)的單位字符區(qū)域。
下面,利用圖16說明對(duì)壓縮數(shù)據(jù)118進(jìn)行解壓縮的圖像解壓縮裝置。
圖16是表示本發(fā)明的實(shí)施方式的圖像解壓縮裝置的概略結(jié)構(gòu)的圖。
MMR解壓縮部1803,輸入壓縮碼A109,進(jìn)行MMR解壓縮處理,生成2值圖像1804。JPEG解壓縮部1809通過輸入壓縮碼B117,進(jìn)行JPEG解壓縮處理,進(jìn)而用放大部1810進(jìn)行放大處理,從而生成多值圖像1811。合成部1805參照字符區(qū)域坐標(biāo)106,把各字符代表色111分配給2值圖像1804中的對(duì)應(yīng)的單位字符區(qū)域的各黑像素,并將該2值圖像顯示在多值圖像1811之上。這時(shí),2值圖像1804的白像素透過多值圖像1811。
這樣,圖16的圖像解壓縮裝置對(duì)由圖1的圖像壓縮裝置生成的壓縮數(shù)據(jù)118進(jìn)行解壓縮,可以生成作為最終的復(fù)原圖像的解壓縮圖像1806。
如以上說明的那樣,根據(jù)本實(shí)施方式,判定字符區(qū)域是否是反轉(zhuǎn)字符區(qū)域,并根據(jù)其判定結(jié)果抽取字符區(qū)域的2值圖像和構(gòu)成其字符區(qū)域的單位字符區(qū)域中的代表色,并進(jìn)行分配,由此可以對(duì)各字符區(qū)域抽取合適的代表色并進(jìn)行分配。
另外,生成每個(gè)該單位字符區(qū)域的代表色作為壓縮數(shù)據(jù)的一部分。并且,對(duì)該壓縮數(shù)據(jù)解壓縮后得到復(fù)原圖像時(shí),利用該代表色再現(xiàn)各字符區(qū)域內(nèi)的各單位字符區(qū)域的顏色。由此,能夠再現(xiàn)維持了輸入圖像的圖像品質(zhì)、特別是反轉(zhuǎn)字符區(qū)域的圖像品質(zhì)的復(fù)原圖像。
另外,關(guān)于字符區(qū)域,取代以往使用的JPEG壓縮,利用MMR壓縮來進(jìn)行壓縮,可以生成更高壓縮的壓縮圖像。
以上說明的實(shí)施方式中的圖像壓縮裝置和圖像解壓縮裝置,可由具有圖像壓縮功能和圖像解壓縮功能的個(gè)人計(jì)算機(jī)等的信息處理裝置來實(shí)現(xiàn)。本發(fā)明還可以作為實(shí)現(xiàn)其功能的算法的方法發(fā)明。并且,由于可以由計(jì)算機(jī)來實(shí)現(xiàn),所以很明顯,本發(fā)明可應(yīng)用于由各自的裝置所執(zhí)行的計(jì)算機(jī)程序,進(jìn)而適用于存儲(chǔ)了該計(jì)算機(jī)程序、計(jì)算機(jī)可讀入的CD-ROM等的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
因此,下面列舉與上述實(shí)施方式相關(guān)的權(quán)利要求。即,圖像壓縮裝置和圖像解壓縮裝置、其方法和程序。
以上詳細(xì)敘述了實(shí)施方式例,但是,本發(fā)明既可以適用于由多個(gè)設(shè)備構(gòu)成的系統(tǒng),也可適用于由一個(gè)設(shè)備構(gòu)成的裝置。
另外,本發(fā)明包括以下情況,即把實(shí)現(xiàn)上述實(shí)施方式的軟件的程序(實(shí)施方式中對(duì)應(yīng)圖示的流程圖的程序)直接或遠(yuǎn)程地提供給系統(tǒng)或裝置,通過該系統(tǒng)或裝置的計(jì)算機(jī)讀出并執(zhí)行該被提供的程序代碼而達(dá)到目的。
因此,為了用計(jì)算機(jī)來實(shí)現(xiàn)本發(fā)明的功能處理,被安裝在該計(jì)算機(jī)中的程序編碼本身就實(shí)現(xiàn)本發(fā)明。也就是說,本發(fā)明也包含用于實(shí)現(xiàn)本發(fā)明的功能處理的計(jì)算機(jī)程序本身。
這種情況下,只要具有程序的功能,不論是對(duì)象代碼、由解釋程序執(zhí)行的程序、提供給OS的腳本數(shù)據(jù)等程序的形態(tài)都可以。
作為用于提供程序的記錄介質(zhì),有軟盤(注冊(cè)商標(biāo))、硬盤、光盤、磁光盤、MO、CD-ROM、CD-R、CD-RW、磁帶、非易失性存儲(chǔ)卡、ROM、DVD、(DVD-ROM、DVD-R)等。
其它,作為程序的提供方法,可以利用客戶端計(jì)算機(jī)的瀏覽器連接到互聯(lián)網(wǎng)的主頁,從該主頁把本發(fā)明的計(jì)算機(jī)程序本身、或被壓縮的含有自動(dòng)安裝功能的文件下載到硬盤等記錄介質(zhì)中。并且,也可通過把構(gòu)成本發(fā)明的程序的程序代碼分割為多個(gè)文件,從不同的主頁下載各自的文件而實(shí)現(xiàn)。也就是說,使多個(gè)用戶下載用于由計(jì)算機(jī)實(shí)現(xiàn)本發(fā)明的功能處理的程序文件的WWW服務(wù)器也包含在本發(fā)明中。
并且,將本發(fā)明的程序加密后存儲(chǔ)到CD-ROM等存儲(chǔ)介質(zhì)中并分發(fā)給用戶,使得對(duì)于清楚預(yù)定條件的用戶,能夠通過互聯(lián)網(wǎng)從主頁上下載解密的密鑰信息,通過使用該密鑰信息執(zhí)行被加密了的程序,使之安裝到計(jì)算機(jī)中,也可實(shí)現(xiàn)。
另外,不僅計(jì)算機(jī)通過執(zhí)行所讀出的程序能實(shí)現(xiàn)上述實(shí)施方式的功能之外,還包括根據(jù)該程序的指示,在計(jì)算機(jī)上運(yùn)行的OS等進(jìn)行實(shí)際處理的一部分或全部,通過其處理實(shí)現(xiàn)上述實(shí)施方式的功能的情況。
另外,從記錄介質(zhì)讀出的程序被寫入到插入在計(jì)算機(jī)的功能擴(kuò)展板或連接計(jì)算機(jī)的功能擴(kuò)展單元中的存儲(chǔ)器中后,根據(jù)該程序的指示,該功能擴(kuò)展板或功能擴(kuò)展單元的CPU等進(jìn)行實(shí)際處理的一部分或全部,通過該處理實(shí)現(xiàn)上述實(shí)施方式的功能的情況也包含在內(nèi)。
本發(fā)明不限于上述具體實(shí)施例,在不脫離本發(fā)明的思想和范圍的情況下可以實(shí)現(xiàn)本發(fā)明的多種改變和修改。因此,為使公眾了解本發(fā)明的范圍,撰寫了下面的權(quán)利要求。
權(quán)利要求
1.一種圖像處理裝置,對(duì)輸入的多值圖像進(jìn)行壓縮,其特征在于,包括2值化裝置,把上述多值圖像2值化;第1區(qū)域指定裝置,用于指定由上述2值化裝置2值化后的2值圖像中的字符區(qū)域的位置,且判定所指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域;第2區(qū)域指定裝置,用于指定由上述第1區(qū)域指定裝置指定的字符區(qū)域中的單位字符區(qū)域的位置;縮小裝置,用于縮小上述多值圖像;代表色抽取裝置,用于根據(jù)表示由上述第1區(qū)域指定裝置指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域的區(qū)域類別信息,和由上述第2區(qū)域指定裝置指定的單位字符區(qū)域的位置信息,以及上述縮小的多值圖像,抽取上述單位字符區(qū)域的代表色;填充裝置,根據(jù)由上述第1區(qū)域指定裝置指定的字符區(qū)域的位置信息,將上述縮小的多值圖像的字符區(qū)域內(nèi)的單位字符區(qū)域用其周圍色進(jìn)行填充;第1壓縮裝置,對(duì)由上述填充裝置生成的填充的縮小多值圖像進(jìn)行壓縮;第2壓縮裝置,對(duì)與上述第1區(qū)域指定裝置所指定的字符區(qū)域?qū)?yīng)的部分2值圖像進(jìn)行壓縮;輸出裝置,輸出壓縮數(shù)據(jù),該壓縮數(shù)據(jù)包括由上述第1和第2區(qū)域指定裝置指定的位置信息、由上述第1和第2壓縮裝置生成的第1和第2壓縮碼、和由上述代表色抽取裝置抽取的單位字符區(qū)域的代表色信息。
2.根據(jù)權(quán)利要求1所述的圖像壓縮裝置,其特征在于,所述代表色抽取裝置包括平均色計(jì)算裝置,用于利用由上述第2區(qū)域指定裝置指定的單位字符區(qū)域的位置信息,參照上述縮小的多值圖像的顏色信息,計(jì)算上述單位字符區(qū)域的平均色;第1直方圖生成裝置,根據(jù)上述平均色計(jì)算裝置所生成的單位字符區(qū)域的平均色,生成第1直方圖;抽取裝置,基于上述第1直方圖,抽取作為上述單位字符區(qū)域的代表色的候選色的候選代表色;顏色分配裝置,基于表示上述第1區(qū)域指定裝置所指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域的區(qū)域類別信息,由上述抽取裝置抽取的候選代表色和上述單位字符區(qū)域的平均色,將上述候選代表色分配給上述單位字符的代表色。
3.根據(jù)權(quán)利要求2所述的圖像壓縮裝置,其特征在于,所述2值化裝置包括第2直方圖生成裝置,用于基于上述多值圖像生成第2直方圖;2值化閾值計(jì)算裝置,用于基于上述第2直方圖,計(jì)算出用于對(duì)上述多值圖像進(jìn)行2值化的2值化閾值。
4.根據(jù)權(quán)利要求1所述的圖像壓縮裝置,其特征在于上述第1區(qū)域指定裝置,把在上述2值圖像中對(duì)取預(yù)定值的像素進(jìn)行輪廓線跟蹤而指定的區(qū)域組,分別指定為字符區(qū)域和自然圖像區(qū)域,且對(duì)于字符區(qū)域指定是否為反轉(zhuǎn)字符區(qū)域,并指定表示上述區(qū)域組的各區(qū)域的位置信息、大小信息和其種類的屬性信息。
5.根據(jù)權(quán)利要求1所述的圖像壓縮裝置,其特征在于上述第2區(qū)域指定裝置,把由上述第1區(qū)域指定裝置指定的字符區(qū)域中的取預(yù)定值的像素的集合指定為單位字符區(qū)域,并指定上述單位字符區(qū)域的位置信息和大小信息。
6.根據(jù)權(quán)利要求2所述的圖像壓縮裝置,其特征在于上述平均色計(jì)算裝置利用由上述第2區(qū)域指定裝置所指定的單位字符區(qū)域的位置信息,參照與上述單位字符區(qū)域內(nèi)的取預(yù)定值的像素對(duì)應(yīng)的上述縮小的多值圖像的顏色信息,計(jì)算出該單位字符區(qū)域的平均色。
7.根據(jù)權(quán)利要求2所述的圖像壓縮裝置,其特征在于上述第1直方圖生成裝置利用由上述平均色計(jì)算裝置所計(jì)算出的單位字符區(qū)域的平均色,生成由上述單位字符區(qū)域構(gòu)成的字符區(qū)域內(nèi)的色空間直方圖,作為第1直方圖。
8.根據(jù)權(quán)利要求7所述的圖像壓縮裝置,其特征在于上述抽取裝置從上述色空間直方圖中輸出頻率高的顏色分布開始,按順序抽取成為上述單位字符區(qū)域的代表色的候選色的候選代表色。
9.根據(jù)權(quán)利要求8所述的圖像壓縮裝置,其特征在于上述顏色分配裝置計(jì)算由上述抽取裝置所抽取的候選代表色和上述單位字符區(qū)域的平均色之間的色空間上的距離,當(dāng)該距離在預(yù)定范圍之內(nèi)時(shí),將上述候選代表色作為上述單位字符區(qū)域的代表色來進(jìn)行分配。
10.根據(jù)權(quán)利要求8所述的圖像壓縮裝置,其特征在于上述顏色分配裝置計(jì)算由上述抽取裝置所抽取的候選代表色和上述單位字符區(qū)域的平均色之間的色空間上的距離,當(dāng)該距離在預(yù)定范圍之內(nèi),且由單位字符區(qū)域構(gòu)成的字符區(qū)域是反轉(zhuǎn)字符區(qū)域時(shí),將預(yù)定色作為上述單位字符區(qū)域的代表色來進(jìn)行分配。
11.根據(jù)權(quán)利要求1所述的圖像壓縮裝置,其特征在于上述縮小裝置通過利用分辨率變換參數(shù)對(duì)上述多值圖像進(jìn)行分辨率變換而縮小該多值圖像。
12.根據(jù)權(quán)利要求1所述的圖像壓縮裝置,其特征在于上述填充裝置基于由上述第1區(qū)域指定裝置所指定的字符區(qū)域的位置信息,將與相應(yīng)于由上述縮小裝置所設(shè)定的縮小率相對(duì)應(yīng)的位置對(duì)應(yīng)的上述縮小的多值圖像的字符區(qū)域內(nèi)的單位字符區(qū)域,用其周圍色進(jìn)行填充。
13.根據(jù)權(quán)利要求1所述的圖像壓縮裝置,其特征在于上述第1壓縮裝置符合JPEG壓縮標(biāo)準(zhǔn)。
14.根據(jù)權(quán)利要求1所述的壓縮圖像裝置,其特征在于上述第2壓縮裝置符合MMR壓縮標(biāo)準(zhǔn)。
15.根據(jù)權(quán)利要求1所述的壓縮圖像裝置,其特征在于還包括對(duì)上述壓縮的數(shù)據(jù)進(jìn)行無損壓縮的第3壓縮裝置。
16.一種對(duì)壓縮數(shù)據(jù)進(jìn)行解壓縮的圖像處理裝置,其特征在于,包括輸入裝置,用于輸入壓縮數(shù)據(jù),該壓縮數(shù)據(jù)包括對(duì)將多值圖像2值化后的2值圖像中的字符區(qū)域或反轉(zhuǎn)字符區(qū)域進(jìn)行壓縮得到的第1壓縮碼;對(duì)縮小的多值圖像進(jìn)行壓縮后得到的第2壓縮碼,該縮小的多值圖像是將上述多值圖像的縮小的多值圖像的字符區(qū)域或反轉(zhuǎn)字符區(qū)域內(nèi)的單位字符區(qū)域用其周圍色進(jìn)行了填充的圖像;上述字符區(qū)域或反轉(zhuǎn)字符區(qū)域的位置信息;該字符區(qū)域或反轉(zhuǎn)字符區(qū)域內(nèi)的單位字符區(qū)域的代表色信息;第1解壓縮裝置,對(duì)上述壓縮數(shù)據(jù)中的上述第1壓縮碼進(jìn)行解壓縮;第2解壓縮裝置,對(duì)上述壓縮數(shù)據(jù)中的上述第2壓縮碼進(jìn)行解壓縮;放大裝置,對(duì)由上述第2解壓縮裝置解壓縮后的縮小的多值圖像進(jìn)行放大;合成裝置,基于上述壓縮數(shù)據(jù)中的上述位置信息和上述代表色,把由上述第1解壓縮裝置解壓縮后的2值圖像和由上述放大裝置放大后的多值圖像進(jìn)行合成。
17.一種圖像處理方法,對(duì)輸入的多值圖像進(jìn)行壓縮,其特征在于,包括2值化步驟,把上述多值圖像2值化;第1區(qū)域指定步驟,指定由上述2值化步驟2值化后的2值圖像中的字符區(qū)域的位置,且判定所指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域;第2區(qū)域指定步驟,指定由上述第1區(qū)域指定步驟指定的字符區(qū)域中的單位字符區(qū)域的位置;縮小步驟,縮小上述多值圖像;代表色抽取步驟,根據(jù)表示由上述第1區(qū)域指定步驟指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域的區(qū)域類別信息,和由上述第2區(qū)域指定步驟指定的單位字符區(qū)域的位置信息,以及上述縮小的多值圖像,抽取上述單位字符區(qū)域的代表色;填充步驟,根據(jù)由上述第1區(qū)域指定步驟指定的字符區(qū)域的位置信息,將上述縮小的多值圖像的字符區(qū)域內(nèi)的單位字符區(qū)域用其周圍色進(jìn)行填充;第1壓縮步驟,對(duì)由上述填充步驟生成的填充的縮小的多值圖像進(jìn)行壓縮;第2壓縮步驟,對(duì)與上述第1區(qū)域指定步驟所指定的字符區(qū)域?qū)?yīng)的部分2值圖像進(jìn)行壓縮;輸出步驟,輸出壓縮數(shù)據(jù),該壓縮數(shù)據(jù)包括由上述第1和第2區(qū)域指定步驟指定的位置信息、由上述第1和第2壓縮步驟生成的第1和第2壓縮碼、由上述代表色抽取步驟抽取的單位字符區(qū)域的代表色信息。
18.一種對(duì)壓縮數(shù)據(jù)進(jìn)行解壓縮的圖像處理方法,其特征在于,包括輸入步驟,輸入壓縮數(shù)據(jù),該壓縮數(shù)據(jù)包括對(duì)將多值圖像2值化后的2值圖像中的字符區(qū)域或反轉(zhuǎn)字符區(qū)域進(jìn)行壓縮得到的第1壓縮碼;對(duì)縮小的多值圖像進(jìn)行壓縮后得到的第2壓縮碼,該縮小的多值圖像是將上述多值圖像的縮小的多值圖像的字符區(qū)域或反轉(zhuǎn)字符區(qū)域內(nèi)的單位字符區(qū)域用其周圍色進(jìn)行了填充的圖像;上述字符區(qū)域或反轉(zhuǎn)字符區(qū)域的位置信息;該字符區(qū)域或反轉(zhuǎn)字符區(qū)域內(nèi)的單位字符區(qū)域的代表色信息;第1解壓縮步驟,對(duì)上述壓縮數(shù)據(jù)中的上述第1壓縮碼進(jìn)行解壓縮;第2解壓縮步驟,對(duì)上述壓縮數(shù)據(jù)中的上述第2壓縮碼進(jìn)行解壓縮;放大步驟,對(duì)由上述第2解壓縮步驟解壓縮后的縮小的多值圖像進(jìn)行放大;合成步驟,基于上述壓縮數(shù)據(jù)中的上述位置信息和上述代表色,把由上述第1解壓縮步驟解壓縮后的2值圖像和由上述放大步驟放大后的多值圖像進(jìn)行合成。
19.一種用于壓縮輸入的多值圖像的圖像處理裝置,包括2值化裝置,用于對(duì)所述多值圖像2值化;第1區(qū)域指定裝置,用于在由所述2值化裝置2值化的2值圖像中指定字符區(qū)域的位置,并確定所指定的字符區(qū)域是否是反轉(zhuǎn)字符區(qū)域;第2區(qū)域指定裝置,用于在由所述第1區(qū)域指定裝置指定的字符區(qū)域中指定單位字符區(qū)域的位置;代表色抽取裝置,用于根據(jù)指示由所述第1區(qū)域指定裝置指定的字符區(qū)域是否是反轉(zhuǎn)字符區(qū)域的區(qū)域類別信息、由所述第2區(qū)域指定裝置指定的單位字符區(qū)域的位置信息和多值圖像抽取單位字符區(qū)域的代表色。
20.根據(jù)權(quán)利要求19所述的圖像處理裝置,其特征在于,在通過一個(gè)反轉(zhuǎn)處理對(duì)所述反轉(zhuǎn)字符區(qū)域涂敷之后,所述代表色抽取裝置抽取所述反轉(zhuǎn)字符區(qū)域的代表色。
21.一種壓縮輸入的多值圖像的圖像處理方法,包括一個(gè)2值化步驟,對(duì)所述多值圖像2值化;第1區(qū)域指定步驟,在2值化步驟中2值化的2值圖像中指定字符區(qū)域的位置,并確定所指定的字符區(qū)域是否是反轉(zhuǎn)字符區(qū)域;第2區(qū)域指定步驟,在由上述第1區(qū)域指定步驟中指定的字符區(qū)域中指定單位字符區(qū)域的位置;代表色抽取步驟,根據(jù)表示由上述第1區(qū)域指定步驟中指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域的區(qū)域類別信息,和由上述第2區(qū)域指定步驟中指定的單位字符區(qū)域的位置信息,以及多值圖像,抽取上述單位字符區(qū)域的代表色。
22.根據(jù)權(quán)利要求21所述的圖像處理方法,其特征在于,在通過一個(gè)反轉(zhuǎn)處理對(duì)所述反轉(zhuǎn)字符區(qū)域涂敷之后,所述代表色抽取步驟抽取所述反轉(zhuǎn)字符區(qū)域的代表色。
全文摘要
本發(fā)明公開了一種圖像處理裝置。用2值化部將多值圖像2值化。用區(qū)域指定部A指定2值圖像中的字符區(qū)域的位置,并判定被指定的字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域。用區(qū)域指定部B指定字符區(qū)域中的單位字符區(qū)域的位置。用縮小部將多值圖像縮小。用代表色抽取部,基于表示字符區(qū)域是否為反轉(zhuǎn)字符區(qū)域的區(qū)域類別信息、單位字符區(qū)域的位置信息和縮小多值圖像,抽取單位字符區(qū)域的代表色。用字符區(qū)域填充部,基于字符區(qū)域的位置信息,將縮小多值圖像的字符區(qū)域用其周圍色進(jìn)行填充。用JPEG壓縮部,對(duì)填充縮小多值圖像進(jìn)行壓縮。用MMR壓縮部,對(duì)與字符區(qū)域?qū)?yīng)的部分2值圖像進(jìn)行壓縮。輸出包括位置信息、由各壓縮部生成的壓縮碼、單位字符區(qū)域的代表色信息的壓縮數(shù)據(jù)。
文檔編號(hào)G06T9/00GK1525403SQ200410004568
公開日2004年9月1日 申請(qǐng)日期2004年2月23日 優(yōu)先權(quán)日2003年2月24日
發(fā)明者三澤玲司 申請(qǐng)人:佳能株式會(huì)社