專利名稱:圖像處理裝置、圖像處理方法和程序及其記錄介質(zhì)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像處理裝置、圖像處理方法和程序及其記錄介質(zhì)。
背景技術(shù):
最近,作為當前掃描儀廣泛應(yīng)用的結(jié)果,文件的數(shù)字化已經(jīng)變?yōu)榱餍械膶嶋H應(yīng)用。然而,對于以比特位圖形式全色存儲,以例如300dpi掃描的A4尺寸的數(shù)字文件,必須占據(jù)多達24Mbytes的大量內(nèi)存。這樣的大量數(shù)據(jù)記錄不能附加到郵件上,并與郵件一起傳輸。
由此,通常使用JPEG,一種已知的壓縮技術(shù),來壓縮全色圖像數(shù)據(jù)。然而通過JPEG,盡管用于壓縮自然圖像,如照片時非常有效,并且使用時產(chǎn)生圖像質(zhì)量很高,但當高頻部分,如符號使用JPEG壓縮時,產(chǎn)生被稱為蚊式噪聲的圖像退化,并且壓縮比也減小。由此,由于通常的辦公室文件包括很多符號部分,在文件二值化后,MMR用于壓縮二值化文件,并且得到符號部分的坐標和其中符號的代表顏色,使準備成彩色的辦公室文件可以被容易地表示。進一步,對于復雜的彩色文件,如雜志,被壓縮的區(qū)域分成背景和符號部分,而當背景使用JPEG壓縮時,符號使用優(yōu)化的閾值二值化,并且得到的二值化圖像使用MMR壓縮,然后將顏色信息加入得到的MMR數(shù)據(jù)中。以這種方式,即使非常復雜的彩色文件也可以使用小數(shù)據(jù)文件代表。
由此,需要開發(fā)計算符號部分中符號的代表顏色的技術(shù)。后面是傳統(tǒng)方法的例子,用于計算符號的代表顏色。
首先,通過參考符號區(qū)域的二值化圖像,對黑色部分中的多值圖像數(shù)據(jù),準備粗糙的三維直方圖。然后,對相應(yīng)于粗糙的三維直方圖最高值的多值圖像象素,準備精細的直方圖,并且由此得到的最高值被確定為代表顏色。
然而,當上面的方法用于計算符號顏色的代表顏色時,盡管以300dpi或更高的分辨率讀取時,對于具有12點或更大高度的符號,可以計算所需顏色,但對10點或更小的符號,最初計算的代表顏色數(shù)據(jù),對二值化圖像的黑色的比例小,并且所需顏色不能被計算。
現(xiàn)在參考圖19,對于執(zhí)行計算來得到大符號代表顏色的情況,和對于執(zhí)行計算來得到小符號的代表顏色的情況進行說明。
圖19是顯示綠色符號寫在白色背景上的實例情況。對于相對粗的符號,得到二值化結(jié)果1901,并且在二值化結(jié)果1901中,黑色部分的多值圖像具有電平變化1902。在電平變化1902中,由于在部分1903和1904,電平長時間保持穩(wěn)定,這相應(yīng)于符號各自的顏色,顏色分布到顏色空間RGB中,如圖20A所示。圖20A中的塊2002是圖19中的綠色,即指示符號的代表顏色。由于符號部分的塊2002具有特定的尺寸,它可以被相對容易地選取。
然后,對于圖19中的精細符號1906,多值數(shù)據(jù)中的電平變化具有形狀1907,并且電平一到達部分1908和1909,這相應(yīng)于符號的代表顏色,就改變到背景部分的電平。在這種情況下,RGB顏色空間中的顏色分布如圖20B所示,并且與圖20A中的塊2002比較,難于使用得到的數(shù)據(jù),來計算圖20B中的部分2005。通過二值化處理,虛線的左側(cè)被二值化為黑色符號,而當使用傳統(tǒng)方法計算代表顏色時,得到點2005作為表示最大數(shù)的值。因為與所述的符號顏色相比,這不是優(yōu)選的,所以得到的符號具有白綠色邊框。
為了避免這種現(xiàn)象發(fā)生,有一種方法,通過它使二值化圖像被淡化,并且使用精細圖像執(zhí)行傳統(tǒng)的代表計算。然而,當應(yīng)用這種方法時,后面解釋會發(fā)生的缺點。
為了簡化解釋,符號“?!庇米骼印?br>
假設(shè)在圖21中,綠色符號“?!碑嬙诎咨尘吧?。用于符號“?!钡碾娖睫D(zhuǎn)換具有變化2104。對于返回到白色電平中心縮進,它最初是理想的;然而符號“?!保葱↑c完全返回到白色電平也許是不可能的。如果使用閾值2105執(zhí)行二值化處理,則得到實的黑點2102作為二值化結(jié)果。然后,如果對于這個點2102執(zhí)行淡化處理,則得到黑點2103,根據(jù)電平2104,由這個二值化圖像指示的多值圖像的比特位置是點2106,對于代表顏色這不是優(yōu)選電平。
由于對于具有小點符號,發(fā)生這種“破碎現(xiàn)象”,淡化處理明顯是不必要的。
這個二值化圖像用于對符號計算代表顏色,其中二值化圖像是為代表顏色采用的輸出。然而,對于優(yōu)化地代表符號的閾值,最好被二值化,使符號不發(fā)生模糊。進一步已知,當考慮隨后的OCR處理時,由于可以得到較好的OCR結(jié)果,變?yōu)閷嵭牡亩祷柡糜谧兊媚:摹?br>
圖22是對符號區(qū)域的亮度顯示典型直方圖的圖。點2201是二值化圖像所需的點。然而,當在這點2201執(zhí)行二值化時,從背景轉(zhuǎn)換到符號部分的象素,被二值化為黑點,即優(yōu)選輸出,而當執(zhí)行符號代表顏色的計算時,這個輸出形成噪聲。
這個狀態(tài)在圖22中顯示。當在圖22中的點2201執(zhí)行二值化時,這與在圖23中的電平2301執(zhí)行二值化相等,并且得到的二值化圖像,還包括從背景轉(zhuǎn)換到符號的很多部分2302和2303。
如上所述,由于二值化圖像用于計算符號的代表顏色,其中二值化圖像是采用來代表符號的輸出,對于符號部分不能計算優(yōu)化的代表顏色。
進一步,根據(jù)所述的傳統(tǒng)方法,對于每個符號區(qū)域,只可以得到一個代表顏色,并且不能處理多種顏色出現(xiàn)的符號區(qū)域。
發(fā)明內(nèi)容
為了解決上面的問題,本發(fā)明的一個目的是提供圖像處理裝置和圖像處理方法,用于對符號部分計算優(yōu)化代表顏色,并且提供其存儲介質(zhì)。
為了實現(xiàn)這個目的,根據(jù)本發(fā)明,圖像處理裝置包括
直方圖計算裝置,用于計算與輸入圖像一致的直方圖;二值化閾值計算裝置,用于根據(jù)直方圖計算二值化閾值,通過它輸入圖像中的預定區(qū)域被模糊;二值化裝置,用于通過所述二值化閾值使輸入圖像二值化;和計算裝置,用于根據(jù)二值化裝置得到的結(jié)果,計算輸入圖像中預定區(qū)域的顏色。
進一步,為了解決上面的問題,本發(fā)明的另一個目的是提供圖像處理裝置和圖像處理方法,用于對符號區(qū)域分配多種顏色,并且提供其存儲介質(zhì)。
為了實現(xiàn)這個目的,根據(jù)本發(fā)明,圖像處理裝置包括二值化裝置,用于使彩色圖像數(shù)據(jù)二值化;檢測裝置,用于檢測彩色圖像數(shù)據(jù)中的符號區(qū)域;顏色減少裝置,用于從組成符號區(qū)域中符號的N種顏色中,引入等于或小于N種顏色的M種顏色;符號切割裝置,用于對符號區(qū)域執(zhí)行符號切割處理;和顏色分配裝置,用于對符號切割裝置得到的每個切割的符號單元,分配M種顏色之一。
本發(fā)明還涉及一種圖像處理方法,用于為每個符號切割單元分配顏色,包括二值化步驟,用于使彩色圖像數(shù)據(jù)二值化;檢測步驟,用于檢測所述彩色圖像數(shù)據(jù)中的符號區(qū)域;顏色減少步驟,用于從形成所述符號區(qū)域的N種顏色中,得到M種顏色,其中M等于或小于N;以及顏色分配步驟,用于為每個符號切割單元分配所述M種顏色中的一種。
圖1是顯示根據(jù)本發(fā)明第一實施例的圖像處理裝置的結(jié)構(gòu)視圖;圖2是顯示最初圖像例子的圖;圖3是流程圖,顯示了通過二值化單元和區(qū)域分割單元執(zhí)行的處理;圖4是顯示最初圖像亮度的直方圖的圖;圖5是顯示通過最初圖像的二值化得到的二值化圖像的圖;圖6是顯示對二值化圖像執(zhí)行附加標記的狀態(tài)的圖;圖7是黑色區(qū)域的圖,它根據(jù)符號屬性從最初圖像中選??;圖8是顯示最初圖像中符號區(qū)域的圖;圖9是流程圖,顯示了通過符號、代表顏色操作單元執(zhí)行的處理;圖10是流程圖,顯示了計算閾值T2采用的方法的例子;圖11是顯示根據(jù)本發(fā)明第二實施例的圖像處理裝置的結(jié)構(gòu)視圖;圖12顯示普通符號與變換的符號之間的差異的圖;圖13是顯示轉(zhuǎn)換的符號部分的亮度直方圖;圖14是顯示根據(jù)本發(fā)明第三實施例的圖像處理裝置的結(jié)構(gòu)視圖;圖15是顯示根據(jù)本發(fā)明第三實施例的結(jié)構(gòu)視圖,用于展開壓縮的數(shù)據(jù);圖16是流程圖,顯示了處理形狀;圖18是顯示計算閾值T2使用的方法例子的圖;圖19是圖示,用于解釋用于大符號的代表顏色被計算的情況,和用于小符號的代表顏色被計算的情況;圖20A和20B是顯示RGB空間分布的圖;圖21是解釋二值化圖像淡化的圖;圖22是顯示圖像區(qū)域典型亮度的圖;圖23是顯示圖像二值化得到的結(jié)果的圖;圖24是顯示圖像二值化得到的結(jié)果的圖;圖25是顯示根據(jù)本發(fā)明第四實施例的圖像處理裝置的結(jié)構(gòu)視圖;圖26是顯示根據(jù)第四實施例的圖像處理裝置的安排視圖,用于展開壓縮的數(shù)據(jù);圖27是流程圖,顯示了根據(jù)本發(fā)明第四實施例執(zhí)行的符號區(qū)域檢測處理;圖28是用于解釋本發(fā)明的符號實施例的圖;
圖29是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號區(qū)域檢測處理的圖;圖30是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號區(qū)域檢測處理的圖;圖31是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號區(qū)域檢測處理的圖;圖32是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號區(qū)域檢測處理的圖;圖33是用于解釋根據(jù)本發(fā)明第四實施例,對符號區(qū)域再次二值化執(zhí)行的處理的圖;圖34A、34B和34C是解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號上色處理的圖;圖35是流程圖,用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號上色處理;圖36是流程圖,用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的一個顏色選取處理;圖37是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的一個顏色選取處理的圖;圖38A、38B和38C是解釋本發(fā)明第四實施例的圖像處理裝置展開壓縮的數(shù)據(jù),并連接得到的數(shù)據(jù)的狀態(tài)的圖;圖39是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的顏色減少處理的圖;圖40是顯示第五實施例的圖像處理裝置的結(jié)構(gòu)的改進方案的視圖;圖41A和41B是解釋根據(jù)改進方案執(zhí)行的圖像壓縮處理的圖;圖42A、42B和42C是解釋當根據(jù)改進方案使符號區(qū)域二值化時執(zhí)行的處理的圖;圖43是流程圖,顯示了根據(jù)本發(fā)明第五實施例執(zhí)行的符號顏色選取處理;
圖44是流程圖,顯示了根據(jù)本發(fā)明第五實施例執(zhí)行的顏色減少處理;圖45是流程圖,顯示了根據(jù)本發(fā)明第五實施例執(zhí)行的顏色減少處理;圖46是用于解釋掃描儀產(chǎn)生的符號轉(zhuǎn)換部分(灰度)的圖;圖47是用于解釋根據(jù)本發(fā)明第五實施例執(zhí)行的顏色減少處理的圖;圖48是用于解釋根據(jù)本發(fā)明第五實施例執(zhí)行的顏色減少處理的圖;圖49是顯示代表符號移位部分的三維直方圖的圖,其中符號由掃描儀產(chǎn)生;和圖50是用于解釋根據(jù)本發(fā)明第五實施例執(zhí)行的顏色分配的圖,用于使用符號切割信息確定每個符號的顏色。
具體實施例方式
在后面的實施例中,符號包含字符等。
(第一實施例)現(xiàn)在將結(jié)合附圖具體描述本發(fā)明的優(yōu)選實施例。
圖1是顯示根據(jù)這個實施例的圖像處理裝置結(jié)構(gòu)的圖。
二值化單元(a)102將輸入的最初圖像101二值化,并產(chǎn)生二值化圖像(a)103。
區(qū)域分割單元104檢測接收的二值化圖像(a)103中的符號區(qū)域或照片區(qū)域,并產(chǎn)生區(qū)域的坐標和屬性,例如用于符號和照片的區(qū)域信息105。
根據(jù)區(qū)域信息105,MMR壓縮單元106對于二值化圖像(a)103的部分執(zhí)行MMR壓縮,并產(chǎn)生壓縮的碼D107,其中二值化圖像(a)103的部分相應(yīng)于具有符號屬性的區(qū)域。
根據(jù)區(qū)域信息105,符號代表顏色操作單元108計算符號的代表顏色,其中符號的代表顏色包括在相應(yīng)于具有符號屬性的區(qū)域中。用于計算符號代表顏色的二值化單元(b)1801,包括在符號代表顏色操作單元108中,并且產(chǎn)生二值化圖像(b)1802。在這個處理中得到的顏色信息,作為區(qū)域信息105的屬性被新寫入。
根據(jù)區(qū)域信息105,JPEG壓縮單元109壓縮最初圖像的部分,并產(chǎn)生壓縮的碼C110,其中最初圖像的部分包括在相應(yīng)于包括自然圖像屬性區(qū)域的區(qū)域中。
現(xiàn)在將更具體地解釋這個結(jié)構(gòu)。
圖3是流程圖,顯示了由二值化單元(a)102和區(qū)域分割單元104執(zhí)行的處理。
步驟S301到S303顯示了二值化單元(a)102執(zhí)行的處理,而步驟S304到S306顯示了區(qū)域分割單元104執(zhí)行的處理。
在步驟S301中,輸入最初圖像101,如RGB彩色圖像,并且通過使用后面的等式,對這個圖像執(zhí)行亮度轉(zhuǎn)換,來產(chǎn)生亮度圖像J。
Y=0.299R+0.587G+0.114B在步驟S302,準備亮度數(shù)據(jù)直方圖,并且計算用于二值化的閾值T。
在步驟S303,通過使用閾值T,使亮度圖像J二值化,并且產(chǎn)生二值化圖像K。
在步驟S304,跟蹤黑色象素的邊界線,并且對每個黑色區(qū)域執(zhí)行標記附加。
在步驟S305,附加標記的黑色區(qū)域的形式和比特位置被采用,來確定圖像是符號還是自然圖像。
在步驟S306,根據(jù)它們的形式和比特位置連接符號區(qū)域,盡管步驟S306的連接處理不總是被執(zhí)行。在這種情況下,計算代表顏色的符號區(qū)域的數(shù)量增加,并且處理時間延長,而優(yōu)點是,顏色的改變可以被精確地處理。
現(xiàn)在通過使用圖2中的最初圖像,對直到步驟S306連接處理完成的情況,給出解釋。
對圖2中的最初圖像執(zhí)行亮度轉(zhuǎn)換(步驟S301和S302),并且得到的亮度直方圖如圖4所示。從這個直方圖中,采用平均和離散的數(shù)據(jù)來計算閾值T=150,并且得到的二值化圖像,即圖1中的二值化圖像103如圖5所示(S303)。圖6是顯示狀態(tài)的圖,其中對于圖5中的二值化圖像,以減小的分辨率執(zhí)行邊界跟蹤,并且對所有的黑色區(qū)域執(zhí)行標記附加(S304)。標記被附加的黑色區(qū)域的形式和比特位置信息,被采用來確定符號或自然圖像的屬性(S305)。應(yīng)該注意,這個圖像不實際產(chǎn)生而只是概念。在這個例子中,由于部分601較大,并且包含黑色區(qū)域,因而它被確定為自然圖像。進一步,由于區(qū)域602到605包括符號,并具有空白的形狀,它們的區(qū)域被確定為邊框。在這個實施例中,邊框信息不包括為區(qū)域信息105,并且被忽略。然而,應(yīng)用可以保持邊框信息,或可以采用邊框信息作為符號區(qū)域信息的背景。在這種情況下,必須提供用于計算背景顏色的裝置。
圖7是顯示黑色區(qū)域的圖,其中從圖2的最初圖像中選取符號屬性。當黑色象素根據(jù)它們是否彼此靠近定比特位,并且它們的高度和寬度是否匹配來分組時,圖8顯示的17個符號區(qū)域801到817可以根據(jù)需要被檢測。在這個實施例中,執(zhí)行分組(S306),并且應(yīng)用了符號屬性的17個坐標數(shù)據(jù)組,存儲在圖1的JPEG壓縮單元109中,同時圖6中應(yīng)用了照片屬性的符號坐標601,存儲在圖1的JPEG壓縮單元109中。
圖9是流程圖,顯示了符號代表顏色操作單元108執(zhí)行的處理。由于對所有包括在區(qū)域信息105中的坐標執(zhí)行這個處理,在步驟S901執(zhí)行判斷來確定是否有符號坐標還沒有被處理。如果確定有符號坐標還沒有被處理,程序控制前進到步驟S902,或者如果確定沒有這樣的坐標,處理結(jié)束。
在步驟S902,執(zhí)行判斷來確定符號屬性是否應(yīng)用到坐標上;如果應(yīng)用了,則程序控制前進到步驟S903,而如果沒有應(yīng)用,則程序控制返回到步驟S901。
在步驟S903,對相應(yīng)于區(qū)域信息的最初圖像,計算亮度直方圖。由于這個直方圖用于部分區(qū)域,與圖4顯示中包括的直方圖相比,它非??赡懿痪哂袕碗s的形狀,而具有如圖22中顯示的那樣的簡單形狀。
在步驟S904,執(zhí)行計算來得到優(yōu)化閾值,即根據(jù)發(fā)生符號模糊的閾值T2,而用于確定一個代表顏色,這個閾值T2相應(yīng)于圖22中的點2202。
現(xiàn)在將使用圖10中的流程圖,來解釋計算閾值T2的例子方法。
在步驟S1001,0值替換到變量“l(fā)imit”中,用于計算過程數(shù),使處理不進入死循環(huán)。
在步驟S1002,亮度直方圖用于得到直方圖的平均值及其時滯執(zhí)行的計算,這特別存儲為skew-first。對于這些計算,采用了后面的等式。
average=Σi=0255histgram(i)]]>skew_first=Σi=0255(i-average)3*histgram(i)]]>在步驟S1003,“average”替換到HistUpper中,并且0值替換到HistLower中,后面在步驟S1004,執(zhí)行判斷來確定變量“l(fā)imit”等于還是大于10。當變量“l(fā)imit”等于或大于10時,程序控制轉(zhuǎn)換到步驟S1009(在這種情況下,除了10還可以采用5或20)。然后,在步驟S1005,HistUpper用于計算HistLower的直方圖。
average=Σi=HistLowerHistUpperhistgram(i)]]>myu=Σi=HistLowerHistUpper(i-average)*histgram(i)]]>skew=Σi=HistLowerHistUpper(i-average)*histgram(i)]]>在步驟S1006,執(zhí)行判斷來確定是否滿足條件skew<my*0.1,并且當滿足時,不需要進一步的計算,并且程序控制跳到步驟S1010。然而當這個條件不滿足時,程序控制前進到步驟S1007,其中執(zhí)行判斷來確定是否滿足條件skew<0.0并且skew_first<skew*0.1。如果滿足這些條件,則不需要進一步的計算,并且程序 控制跳到步驟S1010。但如果這些條件不滿足,程序控制前進到步驟S1008,并且“average”替換到“HistLower”中。然后在步驟S1009,變量“l(fā)imit”遞增一,并且程序控制返回到步驟S1004。
通過重復這個過程,在步驟S1010,最后“average”替換到閾值T2中,結(jié)果,獲得產(chǎn)生模糊的二值化圖像的閾值,其中模糊的二值化圖像由圖22中的點2202指示。
根據(jù)這個閾值,當圖像二值化時沒有黑色象素出現(xiàn),由于可以根據(jù)直方圖的形狀得到這個閾值,從閾值T2計算靠近黑色區(qū)域的象素數(shù)。當象素數(shù)特別小時,象素需要或多或少地修正,使它們靠近白色。圖17顯示了直方圖的形狀,它趨于反射這樣的結(jié)果。
除了上述復雜計算,根據(jù)得到直方圖并選擇閾值的另一個方法,所有象素的5%(這個數(shù)只是個例子)被二值化為黑點。圖18是顯示閾值計算例子的直方圖。
在步驟S905,二值化單元(b)1081使用閾值T2將部分區(qū)域二值化,并且產(chǎn)生圖1中的二值化圖像(b)1082。如圖22所示,通過使用閾值T2,即點2202來使區(qū)域二值化,而這意味著在圖24的電平2401使區(qū)域二值化,從而執(zhí)行二值化卻不包括轉(zhuǎn)換部分2402和2403。然后根據(jù)需要,對得到的二值化圖像執(zhí)行淡化處理。由于閾值根據(jù)二值化圖像的模糊而發(fā)生,在用于代表顏色計算執(zhí)行的傳統(tǒng)淡化處理中,錯誤發(fā)生的概率減小,如參考圖21所解釋的。在步驟S906,對相應(yīng)于二值化圖像(b)黑色部分的最初圖像的每個RGB象素,產(chǎn)生直方圖。用于直方圖的顏色空間可以不是RGB,而當最初圖像是YUV時還可以是YUV。在步驟S907,RGB直方圖的每個峰值被確定為符號代表顏色,并且寫入?yún)^(qū)域信息105中作為相應(yīng)區(qū)域的屬性。
對步驟S906和S907可以采用后面的其它方法。例如,除了每個RGB象素的直方圖,計算RGB三維直方圖。在這種情況下,計算器的功能不可能具體地計算直方圖,而最好計算粗糙的直方圖,而不被顏色轉(zhuǎn)換點產(chǎn)生的噪聲影響。作為一種方法,首先通過使用粗糙的直方圖得到最高值,然后計算粗糙的直方圖中出現(xiàn)的具體的直方圖,最后再次得到最高值。
最后,根據(jù)二值化圖像區(qū)域信息,對于應(yīng)用符號屬性并符合二值化圖像(a)102的區(qū)域,執(zhí)行MMR壓縮,并且產(chǎn)生壓縮碼D107。同樣,對于應(yīng)用自然圖像屬性并符合最初圖像數(shù)據(jù)的區(qū)域,執(zhí)行JPEG壓縮,并產(chǎn)生壓縮碼C110。根據(jù)需 要,通過收集區(qū)域信息105,其中區(qū)域信息105包括區(qū)域類型,如符號或自然圖像,和圖像是符號時的代表顏色,同樣還有壓縮碼C111和壓縮碼D112,來產(chǎn)生格式。得到的格式用作壓縮數(shù)據(jù)。
(第二實施例)圖11是顯示根據(jù)本發(fā)明第二實施例的圖像處理裝置結(jié)構(gòu)的圖。在這個實施例中,不采用使用閾值得到的二值化圖像,作為執(zhí)行區(qū)域分割的圖像。相反,對所有的象素通過差分濾波,計算相對于臨近象素的邊緣量,并且邊緣量被二值化而得到二值化圖像,并且這個二值化圖像用于執(zhí)行區(qū)域分割。第一實施例中使用的邊界線跟蹤也被使用,作為區(qū)域分割方法。
第一和這個實施例之間的差異是,作為符號選取的區(qū)域還包括普通二值化轉(zhuǎn)換的區(qū)域。
圖12是顯示普通符號與變換的符號之間差異的圖。變換的符號是例如紅色背景上的白色符號,這在彩色文件中并不特別少見。在第一實施例中,不對轉(zhuǎn)換的符號提供符號屬性,而對包括外部彩色邊框的區(qū)域提供自然的自然屬性。在這個實施例中,由于差分二值化圖像用于區(qū)域分割,如圖12所示,轉(zhuǎn)換的符號區(qū)域還可以分成符號。在這種情況下,亮度直方圖具有圖13顯示的形狀,而符號區(qū)域直方圖通常具有圖22顯示的形狀。頂峰部分1301指示一塊背景,而頂峰部分1302指示一塊符號。在這個實施例中,對于產(chǎn)生部分二值化圖像(b)(圖11中的11082)的二值化處理,需要轉(zhuǎn)換處理,其中部分二值化圖像(b)用于計算符號代表顏色。
可以使用后面的等式,確定符號是否被轉(zhuǎn)換。
后面的等式是圖1中結(jié)構(gòu)的一個例子。
average=Σi=0255histgram(i)]]>skew_first=Σi=0255(i-average)3*histgram(i)]]>可以確定當skew_first為負時,區(qū)域是圖22顯示的普通符號部分,而當skew_first為正時,區(qū)域是圖13顯示的變換的符號部分。
當參考圖16的流程圖時,這個處理將被簡要地解釋。在圖16中,右側(cè)(S1613到S1619)恰巧與圖10中的流程圖相同,而左側(cè)(S1605到S1611)是用于變換的符號的計算處理。
當在步驟S1603的skew_first>0時,設(shè)置DoInvert標志,來指示二值化單元執(zhí)行轉(zhuǎn)換處理。
當設(shè)置DoInvert標志時(ON),輸出視覺結(jié)果的二值化單元(b)11081和二值化單元(a)1111,轉(zhuǎn)換二值化結(jié)果。在提供來處理變換的符號的安排中,區(qū)域分割單元1104必須檢測具有邊框?qū)傩缘膮^(qū)域,并且還必須計算邊框中的平均顏色。這是因為變換的符號的背景顏色是白色以外的顏色,并且這個顏色必須代表。負責這個處理的邊框區(qū)域平均顏色操作單元,沒有在圖11中顯示。
通過圖14中的安排,由于對于背景保持所有的JPEG數(shù)據(jù),具有邊框?qū)傩缘膮^(qū)域不必被準備,來處理變換的符號,其中圖14中的安排將在后面描述。
(第三實施例)還可以采用圖14顯示的圖像處理裝置的結(jié)構(gòu)。
將簡要描述圖14中的結(jié)構(gòu)。
在這個結(jié)構(gòu)中,對于區(qū)域分割處理,提供用于只檢測符號區(qū)域坐標的符號區(qū)域選取單元1402,并且符號區(qū)域選取單元1402存儲符號區(qū)域坐標1403。
二值化單元1404產(chǎn)生符號區(qū)域的二值化圖像1405,并根據(jù)二值化圖像1405,符號部分上色單元1408產(chǎn)生文件1413,其中最初圖像的符號部分被染成周圍部分的平均顏色。對得到的部分二值化圖像執(zhí)行MMR壓縮,并且產(chǎn)生壓縮碼D,而對符號省略圖像執(zhí)行JPEG壓縮,并產(chǎn)生壓縮碼C。
符號代表顏色操作單元1411執(zhí)行第一實施例中圖9顯示的處理,并產(chǎn)生代表顏色1412。
圖15是顯示結(jié)構(gòu)的圖,用于展開壓縮數(shù)據(jù),其中壓縮數(shù)據(jù)通過圖14中的安排得到。
為了展開壓縮數(shù)據(jù),對于壓縮數(shù)據(jù)C執(zhí)行JPEG展開處理,并且產(chǎn)生多值圖像G。進一步,對壓縮碼D執(zhí)行MMR展開處理,并且對部分區(qū)域產(chǎn)生二值化圖像F。然后,執(zhí)行連接過程,其中代表值加到圖像G的黑色二值化象素中,而二值化白色圖像不變,最后得到圖像H。
與圖14和15的結(jié)構(gòu)比較,保持了省略符號區(qū)域的整個JPEG圖像,使最初圖像的氣氛不丟失。
(修正方案)還可以對多個裝置組成的系統(tǒng)采用本發(fā)明(例如主計算機、接口設(shè)備、讀取器或打印機),或?qū)τ趩蝹€裝置采用本發(fā)明(例如復印機和傳真機)。
進一步,還可以通過對系統(tǒng)或裝置(CPU或MPU)提供存儲介質(zhì)(或記錄介質(zhì)),其上記錄有實現(xiàn)本實施例功能的軟件程序,并通過允許系統(tǒng)或裝置讀取并執(zhí)行記錄的程序碼,來實現(xiàn)本發(fā)明的目的。在這種情況下,從存儲介質(zhì)讀取的程序碼提供上述實施例的功能,并且其上記錄有程序碼的存儲介質(zhì)組成本發(fā)明。而且,通過本發(fā)明,不僅能夠通過計算機執(zhí)行程序碼,來提供先前實施例的功能,而且程序碼可以與計算機上運行的操作系統(tǒng)(OS)相互作用,或與另一個軟件應(yīng)用相互作用,來提供上面實施例中描述的功能。
進一步,通過本發(fā)明,從記錄介質(zhì)上讀取的程序碼,可以寫入存儲器中,其中存儲器安裝在插入計算機的功能擴展板上,或?qū)懭脒B接到計算機上的功能擴展單元上,并且與程序碼中的指令一致,CPU安裝在功能擴展板或功能擴展單元上,可以執(zhí)行部分或全部實際處理,來實現(xiàn)上述實施例的功能。
如上所述,根據(jù)本發(fā)明,與輸入圖像一致的直方圖被計算,并且根據(jù)閾值模糊圖像中的預定區(qū)域,計算二值化閾值。通過使用得到的二值化閾值,使輸入的圖像二值化,并且采用輸入圖像計算輸入圖像預定區(qū)域的顏色。由此,即使對于細線符號,從背景上轉(zhuǎn)換到符號的部分也可以被刪除,從而對符號可以得到優(yōu)化的代表顏色。
(第四實施例)現(xiàn)在將根據(jù)本發(fā)明的第四實施例,對圖像處理裝置給出解釋,在將完全彩色圖像存儲在存儲介質(zhì)上,或通過傳輸介質(zhì)傳輸之前,第四實施例有效地壓縮圖像數(shù)據(jù),而保持最初圖像轉(zhuǎn)換的信息。
這個實施例的圖像處理裝置,首先對整個圖像區(qū)域產(chǎn)生亮度直方圖,使圖像區(qū)域二值化,并選取幾個符號區(qū)域。然后,對各自的符號區(qū)域執(zhí)行符號切割處理,并且采用結(jié)果來確定每個得到的區(qū)域是否應(yīng)該被再次作為符號區(qū)域?qū)Υ.攨^(qū)域不應(yīng)該被作為符號區(qū)域?qū)Υ龝r,執(zhí)行判斷來確定相關(guān)區(qū)域中的對象是否具有單一顏色。當對象具有單一顏色時,確定對這個對象應(yīng)該執(zhí)行MMR壓縮。當對象不具有單一顏色時,確定應(yīng)該對這個對象執(zhí)行JPEG壓縮。進一步,當確定圖像應(yīng)該被作為符號區(qū)域?qū)Υ龝r,通過預定的顏色減少處理方式減少組成區(qū)域的顏色。當通過顏色減少處理只得到一種顏色時,代表那個顏色的調(diào)色板(例如(R,G,B)=(20,30,40))被確定為MMR壓縮目標,而與二值化圖像相關(guān)。通過顏色減少處理,當圖像可以通過預定數(shù)量(例如四種)或更少的顏色來代表時,每次執(zhí)行符號切割處理,代表各自顏色的調(diào)色板與指示顏色的象素比特位置的多值圖像彼此相關(guān),而確定為ZIP壓縮目標。當不能通過預定數(shù)量的顏色代表圖像時,在執(zhí)行顏色減少處理前,最初圖像被確定為JPEG壓縮目標。
圖25是顯示當采用本發(fā)明的方法進行圖像壓縮處理的結(jié)構(gòu)圖。圖像二值化單元3102接收最初圖像3101,并且優(yōu)化地使最初圖像3101二值化,來得到整個表面二值化圖像3103。符號區(qū)域檢測器3104接收完整表面二值化的圖像3103,檢測符號區(qū)域,并準備符號區(qū)域坐標3112。
符號顏色選取單元3108接收符號區(qū)域坐標3112,參考坐標上的最初圖像和二值化圖像3103,來計算二值化圖像中黑色部分的最初圖像顏色,準備多個調(diào)色板3114,并根據(jù)調(diào)色板3114對最初圖像執(zhí)行顏色減少處理。
在符號區(qū)域檢測器3104確定為符號,并且符號顏色選取單元3108將其符號顏色數(shù)減少到小于M的區(qū)域,符號部分上色單元3105從最初圖像中選取二值化圖像3103的黑色部分,將黑色部分染成周圍部分的顏色,并準備圖像A。
減少單元3106接收并減少圖像A,并產(chǎn)生圖像B。
JPEG壓縮單元3107接收圖像B,并且對圖像B執(zhí)行JPEG壓縮,來產(chǎn)生壓縮碼X(3113)。
顏色減少的圖像3109是用于多符號的區(qū)域,其顏色通過符號顏色選取單元3108減少。當顏色減少的圖像3109是一比特位時,MMR壓縮單元3110接收顏色減少的圖像3109,并執(zhí)行MMR壓縮而得到多壓縮碼Y(3115)。對于兩比特位的減少顏色的圖像3109,ZIP壓縮單元311 1接收這個圖像3109,并壓縮它而得到多壓縮碼Z(3116)。最后,連接數(shù)據(jù)3112到3116來得到壓縮的數(shù)據(jù)3001A。
符號區(qū)域檢測處理圖27是流程圖,用于解釋通過符號區(qū)域檢測器3104執(zhí)行的處理。
在步驟S3301,彩色圖像被接收,并且對彩色圖像執(zhí)行亮度轉(zhuǎn)換,而通過淡化使分辨率減小,并得到亮度圖像J。當最初圖像在例如300dpi為RGB24字節(jié)時,對于每四個象素垂直地并電平地執(zhí)行操作。
Y=0.299R+0.587G+0.114B得到的新圖像J在75dpi為Y8比特位。在步驟S3302,準備用于亮度數(shù)據(jù)的直方圖,并且計算二值化閾值T。
在步驟S3303,通過使用閾值T使亮度圖像J二值化,并且建立二值化圖像K。進一步,在步驟S3304,對黑色象素執(zhí)行邊界線跟蹤,并且對所有的黑色區(qū)域執(zhí)行標記附加。在步驟S3305,在黑色區(qū)域中確定假定為符號的區(qū)域,而在步驟S3306,根據(jù)它們的形狀和比特位置連接區(qū)域。
現(xiàn)在將描述這個處理的例子。圖4中的彩色文件被接收,并且通過對彩色文件淡化并執(zhí)行亮度轉(zhuǎn)換,而得到圖5中的直方圖。通過參考這個直方圖,采用平均數(shù)據(jù)和分布數(shù)據(jù)來計算閾值T(例如150),并且得到圖6中顯示的二值化圖像。對圖6中的黑色象素執(zhí)行邊界線跟蹤,并且通過標記附加,只有一組黑色象素被識別為符號,其中黑色象素組的寬度和高度等于或小于閾值。然后,圖7中的黑色象素組確定為符號區(qū)域,在這個例子中,為了解釋而單純顯示圖像,而在符號區(qū)域檢測處理中不實際建立。
當黑色象素根據(jù)它們是否靠近定比特位,并且它們的高度和寬度是否匹配來分組時,可以檢測圖32中顯示的16個符號區(qū)域。用于象素的坐標數(shù)據(jù)存儲為圖25中的符號區(qū)域坐標3112。
除了使圖像二值化,通過使用差分濾波,對于所有象素,可以計算相對于臨近象素的邊緣量,并且對邊緣量二值化,對得到的二值化圖像可以執(zhí)行邊界線跟蹤,來檢測符號區(qū)域。
用于符號區(qū)域的符號顏色選取處理圖43是流程圖,用于符號顏色選取單元3108執(zhí)行的處理。在這個處理中采用了完全表面二值化圖像103;然而,只有符號區(qū)域和彩色圖像的坐標可以被接收,并且可以采用彩色圖像二值化得到的圖像,來執(zhí)行代表顏色操作處理。
對符號區(qū)域檢測器3104確定為符號區(qū)域的所有區(qū)域,執(zhí)行圖43中的處理。
(再次二值化處理)首先,在步驟S6001執(zhí)行再次二值化判斷。
完全表面二值化的圖像3103不總是優(yōu)選地二值化所有符號區(qū)域而得到的圖像。由于結(jié)果圖像的質(zhì)量被極大地影響,不論二值化圖像太厚還是太薄,對于每個符號區(qū)域執(zhí)行的優(yōu)化二值化是理想的。由于與圖29的完全表面直方圖相比,可以對每個符號區(qū)域的亮度直方圖,期望圖33顯示的較簡單的形狀,所以可以容易地確定閾值。部分3901是一組背景顏色,而部分3902是一組符號顏色。在這個實施例中,為了減少處理時間,只對“太厚的二值化圖像”執(zhí)行再次二值化,其中“太厚的二值化圖像”在圖像質(zhì)量上具有更強的效果。
特別地,符號區(qū)域檢測器3104在確定為符號的區(qū)域上掃描二值化圖像,并以隔離點濾波器執(zhí)行圖樣匹配。執(zhí)行判斷來確定出現(xiàn)的隔離點是等于還是大于區(qū)域中的閾值。當隔離點等于或大于閾值時,得到用于區(qū)域的亮度直方圖,計算優(yōu)化的閾值,并且執(zhí)行再次二值化。對于普通符號區(qū)域,只需要特別準備亮度直方圖,來得到更好的圖像;然而在一些情況下,可能得到較差的結(jié)果(通過再次二值化得到圖像可能更差)。為了防止這樣的現(xiàn)象,用于得到完全表面二值化圖像的二值化閾值被輸入,用于再次二值化,并且提供例外處理,其中當?shù)玫降亩祷瘓D像具有比再次二值化的閾值更高的密度時,不執(zhí)行再次二值化。
(符號切割處理)在步驟S6002,執(zhí)行符號切割信息。
根據(jù)符號區(qū)域是風景還是人像,符號切割單元改變處理方式。符號區(qū)域檢測器根據(jù)黑塊的安排,確定符號部分的風景或人像定比特位,并準備指示是使用風景還是使用人像定比特位的信息。當風景定比特位用于符號區(qū)域時,首先,在主掃描方向上突出二值化圖像的黑色象素。并當檢測到線之間的分離時,在次掃描方向上對每條線突出黑色象素,并且得到用于每個符號的信息。當人像定比特位用于符號區(qū)域時,在子掃描方向上執(zhí)行線切割,并且在主掃描方向上執(zhí)行符號切割。這時,在線的方向上,線切割最好突出為三段,來允許圖像傾斜。通過這個處理,可以得到每條線的坐標信息和符號的坐標信息,其中它們沿每條線分開。
在符號調(diào)整處理中(步驟S6003,這將在后面描述),采用符號切割信息,在符號區(qū)域檢測器確定為符號的區(qū)域中,確定每個黑色對象是否為符號。特別地,根據(jù)其尺寸和形狀,確定黑色對象是否是符號。當考慮圖像質(zhì)量和數(shù)據(jù)壓縮時,為了將它轉(zhuǎn)換成單一顏色或多種顏色的區(qū)域(例如,因為可以得到更高的圖像質(zhì)量和更好的壓縮比,應(yīng)該通過單一顏色MMR而不是JPEG來代表具有單一顏色的標志),不需要黑色對象為符號。然而,由于符號區(qū)域以外的區(qū)域非??赡苡苫叶却恚枰_定對象。
(符號判斷處理)在步驟S6003執(zhí)行符號判斷處理。
在這個處理中,輸入符號切割信息(S6002),并且對每條線計算平均符號尺寸。當用于非常小符號的信息被忽略時,可以得到更好的結(jié)果。如果對象形比平均尺寸大得多,則確定不是符號,而如果對象的形狀從縱橫比看來不是符號,而不論它的平均尺寸,則仍然確定不是符號。
但當在區(qū)域中出現(xiàn)m個黑色對象時,并當所有的m個黑色對象被確定不是符號時,符號判斷單元輸出區(qū)域是圖像的判斷。
當m個黑色對象中的n個黑色對象不是符號時(m>n,n>=0),即當保留不指示符號的矩形時,二值化圖像上的黑色對象被刪除,其中二值化圖像被確定不是符號,并且輸出相關(guān)區(qū)域是符號的判斷。
當考慮最終圖像質(zhì)量時,加入后面的例外處理。當區(qū)域中十個符號中的五個代表為單一顏色的符號時,并當其它五個符號被認為不是符號,并且對它們執(zhí)行JPEG壓縮時,得到不均勻的圖像,這在視覺上不是優(yōu)選的。這樣,對于符號判斷單元或者對符號或者對圖像頻繁改變判斷的情況,根據(jù)矩形確定為符號的安排和頻率,所有的對象確定為矩形符號或矩形圖像。
在符號判斷處理中,當區(qū)域確定為符號時,程序控制前進到步驟S6004。并當區(qū)域確定不是符號時,程序控制轉(zhuǎn)換到步驟S6005。
(單一顏色判斷)在步驟S6005執(zhí)行單一顏色判斷處理。
這里處理的區(qū)域,是符號區(qū)域檢測器確定為符號,但在符號判斷處理中確定不是符號的區(qū)域。如上所述,無論區(qū)域是否為符號,對單一顏色代表的區(qū)域最好執(zhí)行單一顏色處理,并且對結(jié)果執(zhí)行MMR壓縮,從而得到更高的圖像質(zhì)量和更高的壓縮比。這樣,執(zhí)行處理來確定區(qū)域是否是單一顏色。
作為特定的例子,對于彩色圖像的象素GRB電平得到直方圖,其中彩色圖像的象素相應(yīng)于二值化圖像的黑色部分,并且當直方圖所有的分布值等于或大于閾值時,確定區(qū)域為單一顏色。
當區(qū)域為單一顏色時,程序控制前進到步驟S6006,用于顏色選取,并當區(qū)域由多種顏色代表時,處理結(jié)束。
(一種顏色選取處理)當參考圖36的流程圖時,解釋在步驟S6006的一種顏色選取處理。
在步驟S4202,在掃描處理中,顏色從背景轉(zhuǎn)換到符號部分的部分中,當黑色對象的數(shù)量減少時,對于二值化圖像newbi執(zhí)行淡化處理,其中二值化圖像被符號坐標參考,并且建立新的二值化圖像。在步驟S4203,從最初圖像的RGB值得到直方圖,其中最初圖像符合圖像newbi的黑色象素(可以準備用于另一種顏色空間,如YUV空間的直方圖)。在步驟S4204,得到用于RGB的代表值,并且在這種情況下,可以采用最大值?;蛘撸梢圆捎昧硪环N方法,這種方法通過使用粗糙直方圖得到最大值,其中使用減少的步數(shù)準備粗糙直方圖,并且采用具體直方圖得到最大值,其中具體直方圖在粗糙直方圖中出現(xiàn)。
使用這種方法,可以從圖37顯示的直方圖中得到真實代表值4301,而不被噪聲4302干擾。具體解釋將參考圖37給出??梢詮睦绨吮忍匚坏腞數(shù)據(jù)中,得到圖37中的256級具體直方圖。由于最大值為1302,這不是真實代表值,直方圖除以64而分成彼此重疊的八段,并且這八段使用256級的直方圖再次計算。顯示了得到的段0到段8;然而,段0和段8每段只具有32級。通過再次計算,發(fā)現(xiàn)代表值出現(xiàn)在段6中,并且搜索段6來得到最大值4301。對于所有的符號坐標重復上面的處理,并且對于每個符號坐標計算一個代表顏色。
(顏色減少處理)在步驟S6004,對于符號執(zhí)行顏色減少處理。
在顏色減少單元4082執(zhí)行的處理中,即使單一顏色代表最初文件,也在掃描中出現(xiàn)顏色從背景轉(zhuǎn)換到符號部分的部分。
圖46和49是顯示掃描促使的顏色轉(zhuǎn)換的的圖。在圖46中,為了簡化解釋,除了RGB,只采用了R。在電平R=(32,32,32),符號A最初被單一顏色代表。然而,當符號A被掃描儀讀取時,用于這個符號的數(shù)據(jù)被發(fā)布,如放大的象素所指示的。只有三個象素6201、6202和6203到達靠近最初電平R=(32,32,32)的黑色,并且其它象素定比特位在背景顏色(在這種情況下為白色)與電平R=(32,32,32)之間,使符號被作為轉(zhuǎn)換部分的灰度代表。圖49是顯示狀態(tài)的圖,其中通過使用圖46中符號A象素電平的三維直方圖,使顏色轉(zhuǎn)換。假設(shè)背景顏色是白色6501,而符號顏色是黑色6502,并且部分5603是轉(zhuǎn)換部分。
由于掃描單一顏色最初代表的符號部分,沒有必要代表組成方差的轉(zhuǎn)換部分。當可以只使用代表顏色表示轉(zhuǎn)換部分時,會得到高的圖像質(zhì)量,并且所需數(shù)據(jù)的量減少。然而,即使對二值化圖像執(zhí)行淡化過程,也難于從背景中完全去除符號區(qū)域的轉(zhuǎn)換部分顏色。由此,通過使用一個符號區(qū)域被單一顏色表示的事實,采用符號切割信息而將顏色限制在每個符號一種,從而導致符號質(zhì)量和壓縮比的提高是客觀的。應(yīng)該注意,當由灰度最初表示的符號在高的圖像質(zhì)量下被壓縮時,只需要執(zhí)行一個附加的例外過程,如確定符號是否由多種顏色代表。也就是,當使用符號切割信息,將一個符號限制為一種顏色時,由于符號圖像的掃描,能夠去除作為方差的轉(zhuǎn)換部分,其中符號圖像由單一顏色最初代表。
當參考圖44的流程圖時,具體描述顏色減少單元執(zhí)行的處理。
在步驟S6102,對于二值化圖像執(zhí)行淡化過程,其中二值化圖像被符號坐標參考,并且相應(yīng)于轉(zhuǎn)換部分的黑色部分數(shù)被減少,在轉(zhuǎn)換部分,顏色在掃描中從背景轉(zhuǎn)換到符號部分,并且準備新圖像“thinimage”。由于二值化圖像“thinimage”用于步驟S6110的處理,通過具有二值化值255(黑色)和0(白色)的八字節(jié),組成這個圖像。在步驟S6103,對最初圖像的RGB顏色,得到三維直方圖,其中最初圖像符合“thinimage”的黑色象素。這時,例如當輸入圖像每個具有八字節(jié)的RGB顏色時,通常需要256*256*256的直方圖。當考慮圖像部分所必需的不是灰度級而是分辨率時,并且考慮當通過掃描儀執(zhí)行的讀取中方差減小時,象素值的小差異將被忽略,來計算代表顏色時,并不實際需要很多這樣等級的直方圖。由此,在這個例子中,得到上五比特位的RGB三維直方圖。為了得到直方圖,還計算符號區(qū)域中出現(xiàn)的黑色象素總數(shù)blacknum。
在這個實施例中,采用RGB空間,然而,也可以采用其它顏色空間,如Lab和YUV。進一步,采用三維直方圖;然而,可以對各自的顏色采用三個一維直方圖。
在步驟S6104,執(zhí)行初始過程,其中在區(qū)域中代表的符號顏色數(shù)colnum被復比特位,或者被處理的象素數(shù)okpixel被復比特位。而在步驟S6105計算代表值。在這種情況下,包括目標直方圖的七個直方圖的總值到達最大值的點,被采用作為代表值(七個直方圖目標點,R維上的兩個臨近點,G維上的兩個臨近點,B維上的兩個臨近點(見圖39))。這樣得到的最大值替換到Color[colnum]、colG[colnum]和colB[colnum]中。
確定被轉(zhuǎn)換成代表值的顏色范圍,在范圍中,代表值作為中心。
固定代表值來得到三個一維直方圖。圖47是顯示得到的三個一維直方圖的圖。例如,當代表值為(Color[26]、colG[30]和colB[22])時,得到一維直方圖R(=所有直方圖沿線6301突起),其中三維直方圖G和B固定在30和22;得到一維直方圖G(=所有直方圖沿線6302突起),其中三維直方圖R和B固定在26和22;并得到一維直方圖B(=所有直方圖沿線6303突起),其中三維直方圖R和G固定在26和30。例如,一維直方圖R具有圖48顯示的形狀,并且從中檢測點6401和6402,并且確定“R range”,其中這些點用作代表值。用于對圖像確定二值化閾值的方法被采用,來檢測點6401和6402。例如,當點6403是代表值時,包括0到代表值的直方圖被替換到二值化閾值確定函數(shù)中而得到點6401,并且從包括代表值的直方圖,在圖48中的步驟S31轉(zhuǎn)換而成的直方圖,被替換到二值化閾值確定函數(shù)中,而得到點6402。
對R、G和B確定顏色范圍,并且替換到fg_range[colnum]中。
在步驟S6106,fg_range[colnum]中三維直方圖所有的值被設(shè)置為0。這時,設(shè)置為0的象素數(shù)加到代表處理的象素數(shù)okpixel上。
在步驟S6107,執(zhí)行大致的顏色判斷。對于已經(jīng)出現(xiàn)的所有顏色執(zhí)行這個處理。當發(fā)現(xiàn)大致的顏色時,跳出處理循環(huán)。如對符號切割所解釋的,在通過掃描儀得到的圖像中,灰度顏色發(fā)生在背景顏色與符號顏色之間。換句話說,如圖49所示,彩色象素(6503)出現(xiàn)在背景顏色(6501)與符號顏色之間(6502)。通過參考二值化圖像,接近背景顏色的線6504的顏色,不加到三維直方圖中(通過淡化二值化圖像,線6504靠近符號顏色側(cè)定比特位)。然而,仍然出現(xiàn)灰度部分,并且在符號顏色6502被選取后,這部分的顏色將被選取。例如,當fg_color
為(32,40,40)時,趨于從fg_color[m]中選取(96,112,96)。執(zhí)行大致的顏色判斷,來確定這兩種是相同的顏色。由于在不一致的顏色空間,RGB空間中,進行這個判斷有點難,所以在Lab空間中執(zhí)行這個判斷。當對fg_color
=(32,40,40)執(zhí)行Lab轉(zhuǎn)換時,得到(15,-4,-1);并當對fg_color[m]=(96,112,96)執(zhí)行Lab轉(zhuǎn)換時,得到(45,-9,-7)。
通過這個處理,能夠去除灰度部分,其中當掃描儀讀取單一顏色最初代表的符號圖像時,灰度部分作為方差發(fā)生,并且可以以高壓縮比來壓縮高質(zhì)量圖像。
實際上,應(yīng)該檢測背景顏色,并且沿著背景顏色的延伸線出現(xiàn)的顏色,和fg_color
,應(yīng)該被確定為大致的顏色。然而在這個事實中,假設(shè)背景中包括很多白色部分,并且當Lab空間中“ab”的距離等于或小于閾值時,相關(guān)的顏色確定為大致的顏色。確定結(jié)果保持在kinji[]矩陣中,kinji[]中具有相同數(shù)的顏色代表大致的顏色。
下面顯示了一個例子,其中kinji
和kinji[3]都是0。也就是,kinji
和kinji[3]確定為大致的顏色。
fg_color
=(32,40,40)kinji
=0fg_color[1]=(248,64,48)kinji[1]=1fg_color[2]=(48,256,32)kinji[2]=2fg_color[3]=(96,112,96)kinji[3]=0在步驟S6018,colnum遞增。
在步驟S6019,執(zhí)行檢測,來確定黑色象素數(shù)是否超過75%(“75”只是個例子),其中已經(jīng)完成了顏色選取。
也就是,執(zhí)行檢測,來確定是否滿足okpixel*75>blacknum*100。
如果黑色象素數(shù)已經(jīng)超過75%,程序控制前進到步驟S6110。如果黑色象素數(shù)還沒有超過75%,程序控制轉(zhuǎn)移到步驟S6113。
在步驟S6110,在“thinimage”中形成調(diào)色板圖像。特別地,參考彩色圖像的象素RGB電平,其中“thinimage”的值符合象素255(指示顏色分配還沒有被執(zhí)行),并當RGB數(shù)據(jù)出現(xiàn)在fg_color[m]中時,kinji[m]+1的值(值1)被替換到“thinimage”符合的象素值中。在這種情況下,除了kinji[m],替換kinji[m]+1,因為0值是代表非符號部分的特殊數(shù)(背景部分),當kinji[m]為0時不能被替換。
在步驟S6110,當在“thinimage”中形成調(diào)色板圖像時,在步驟S6111,從調(diào)色板圖像中,通過使用符號切割信息,對每個符號準備顏色信息charpal。
對每個符號切割單元準備顏色信息charpal的方法,將使用圖50中的符號圖像作為例子來描述。在符號部分“明日は晴れです,昨日は雨でした?!敝校僭O(shè)“晴れ”代表fg_color[1]選取的紅色,“雨”是fg_color[2]檢測的藍色,而其它符號是黑色。
在符號切割處理中,符號開始的“明”被處理為第一符號。假設(shè)在這個符號中出現(xiàn)的細線圖像“thinimage”的黑色象素數(shù)為100,并且100中的70個象素出現(xiàn)在fg_color
中,而20個出現(xiàn)在fg_color[3]中。由于kinji
和kinji[3]都是0(大致的顏色),在步驟S6110,值1分配給90個象素。這時,當一個數(shù)占據(jù)存在黑色象素的最大值時,那種顏色被分配。在這個例子中,保留十個還沒有分配顏色的象素,即使檢測到這些象素的顏色,顏色的總數(shù)也不超過90。這樣,用于“明”的顏色信息charpal
被確定為1。
以這種方式,從三個charpal,0到2中選擇分配給每個符號切割部分的顏色。結(jié)果,作為顏色信息charpal,對“晴”的左側(cè)偏旁“日”和右側(cè)偏旁“青”及“れ”,kinji[1]+1=2指示分配紅色;對“雨”kinji[2]+1=3指示分配藍色;而對其余的符號,kinji
+1=1指示分配黑色。
當不同值不一致地出現(xiàn)在多個kinji[]中時,符號趨于被多種顏色代表。然而,這個確定限制于大致的顏色判斷處理優(yōu)選作用時的那些情況。這樣,當包括這個函數(shù)時,推薦Lab空間中大致的顏色判斷處理的性能。
在這個例子中,由于對所有存在的二十個符號分配顏色信息charpal,這個狀態(tài)與步驟S6113用于跳出符號顏色選取循環(huán)的條件匹配,并且程序控制跳到步驟S6114。然而,在步驟S6112,當只對20個符號中的18個分配顏色信息時,只對于這些charpal沒有準備的符號,再次得到三維直方圖,并且程序控制返回到步驟S6105。這時,charpal沒有準備的淡化符號的黑色象素數(shù),被替換到blacknum中,并且“okpixel”被復比特位。然后,在上面的例子中,由于顏色選取到fg_color[3]完成,所以執(zhí)行以fg_color[4]開始的選取。
這時,為了增加處理速度,在步驟S6112再次獲得三維直方圖可以只被執(zhí)行一次,并且在步驟S6110和步驟S6111的處理可以只被限制為兩次重復。試驗顯示了這足以得到滿意的圖像質(zhì)量。
在上面的限制下,當程序控制跳出步驟S6113的循環(huán)時,仍然可以有符號,其中charpal還沒有被處理。由此,在步驟S6114,當符號nokorichar等于或大于一時,其中charpal還沒有被處理,顏色信息被強制分配給未處理的charpal。特別地,在步驟S6111的分配過程中,當考慮“thinimage”的象素255后續(xù)的趨勢時(即顏色選取還沒有被處理的象素),即使得到最大值,顏色信息也替換到charpal中。然而,在步驟S6114,忽略“thinimage”的象素255,并且使用0(背景)以外象素的最大值,來確定charpal的值。由于存在這樣的情況,0(背景)以外的象素都是255(即使對一個象素也不執(zhí)行顏色選取),對定比特位在附近的象素,charpal的顏色被替換到charpal中。例如,當圖50中的“す”相應(yīng)于這種情況得條件時,附近定比特位的“で”的charpal被替換進來。
這時,得到數(shù)字值“colnum”,作為已經(jīng)被選取的顏色數(shù)。然而,由于這個值包括大致的顏色,并且還可以包括沒有使用的顏色,即使它被選取,值colnum也不同于實際使用的顏色數(shù)(usecolnum)。這樣,在步驟S6115,檢查charpal來計算實際使用的顏色數(shù)。
在步驟S6116,當在步驟S6115計算的“usecolnum”等于或大于16時,包括背景(0)的17種顏色出現(xiàn),并且不能被四比特位代表。這樣,程序控制前進到步驟S6117,用于這個區(qū)域的顏色減少處理被放棄,并且返回DOJPEG(區(qū)域被代表為背景圖像)。應(yīng)該注意,當允許使用八比特位而不是四比特位時,usecolnum不是16而是256。
當usecolnum是一時,程序控制轉(zhuǎn)換到步驟S6118,并且對使用準備一種顏色的調(diào)色板。在步驟S6119,輸入二值化圖像被編入,并且在步驟S6120返回DOMMR。
當usecolnum等于或大于二并小于16時,程序控制轉(zhuǎn)換到步驟S6121,使用顏色的調(diào)色板被準備,并且在步驟S6122,建立調(diào)色板圖像。在這個例子中,當usecolnum是二或三時,建立調(diào)色板,其中對每個象素使用兩比特位來代表。在步驟S6123,返回DOZIP。
當這樣得到的顏色減少圖像3109具有一比特位時(返回MMR作為符號顏色選取的結(jié)果),MMR壓縮單元3110對圖像3109執(zhí)行MMR壓縮,并準備壓縮碼Y。當顏色減少圖像3109具有兩比特位或更多比特位時(返回DOZIP作為符號顏色選取的結(jié)果),ZIP單元3111壓縮圖像3109,并準備壓縮碼Z。當返回DOJPEG時,圖像3109不傳輸?shù)組MR壓縮單元3110或ZIP壓縮單元3111,其中不出現(xiàn)減少顏色的圖像,并且命令傳輸?shù)姆柌糠稚仙珕卧?105,而不將圖像作為符號區(qū)域?qū)Υ?br>
符號上色處理當參考圖34A到34C和35時,將描述通過符號部分上色單元3104執(zhí)行的處理。圖35是流程圖,顯示了符號部分上色處理。
作為一個例子,假設(shè)采用圖34A中顯示的圖像用作最初圖像,其中灰度圖像用作背景,而藍色符號ABC實質(zhì)畫在中心,并且假設(shè)從最初圖像中得到圖34B顯示的一個符號區(qū)域的二值化圖像。在符號部分上色處理中,首先在步驟S4101,整個圖像被分成32×32的區(qū)域(此后被稱作部分),并且對于每部分執(zhí)行處理。在這個處理中得到的狀態(tài)顯示在圖34C中。為了簡化解釋,顯示了5×5的部分,并且在部分上左側(cè)的數(shù)指示了部分數(shù)。部分數(shù)不限制于這里使用的數(shù),并且圖像可以分成不同數(shù)的部分。
在步驟S4102,執(zhí)行檢測來確定部分是否還沒有被處理,在步驟S4113,執(zhí)行判斷來確定符號部分上色的目標區(qū)域是否出現(xiàn)在那部分中。符號顏色選取單元3108已經(jīng)返回DOJPEG的區(qū)域,不被認為是符號部分上色目標,即使符號區(qū)域檢測器3104確定那個區(qū)域是符號區(qū)域,也是如此。
在圖34的例子中,在步驟S4103確定,在部分00到04、10、14、20、24和30到35中,沒有符號部分上色目標區(qū)域,并且對它們不執(zhí)行任何處理,而處理下一部分。對于符號部分上色目標區(qū)域出現(xiàn)的部分(例如部分1),在步驟S4104,通過參考相應(yīng)的二值化圖像,對于彩色圖像的RGB值(或YUV值)計算平均值ave_color,其中彩色圖像符合二值化圖像的白色部分。然而,在步驟S4105,相應(yīng)的二值化圖像被參考,并且相應(yīng)黑色象素的象素密度數(shù)據(jù)被確定為ave_color。對于符號上色目標區(qū)域出現(xiàn)的部分,重復上述處理。結(jié)果,在符號出現(xiàn)的部分,可以嵌入周邊象素的平均值。
得到的圖像通過減少單元3106減少。在這個實施例中,采用簡單的淡化過程用于尺寸減小。減少處理和符號部分上色處理可以反向地執(zhí)行。在這種情況下,考慮二值化圖像與彩色圖像之間的比特位置轉(zhuǎn)換。
進一步,如果必要,通過收集符號區(qū)域坐標3112、調(diào)色板3114、壓縮碼X3113、壓縮碼Y3115和壓縮碼Z3116來準備格式。用于收集這五個的例子格式是Adobe(商標)的PDF。Adobe的PDF是通過應(yīng)用“Acrobat Reader(商標)”顯示的格式,它由Adobe免費發(fā)布,并且可以避免這樣的問題,即接收側(cè)不具有應(yīng)用來準備文件,這樣就不能打開文件。另一個例子格式是XML。XML是通過網(wǎng)絡(luò)進行文件或數(shù)據(jù)的交換或發(fā)布的描述語言。
展開處理圖26是顯示展開處理所需的安排的圖。
JPEG展開單元3201對接收的壓縮碼X3113執(zhí)行JPEG展開,并準備多值圖像E。放大單元3202接收多值圖像E,并且放大它而得到多值圖像F3203。MMR展開單元3204接收壓縮碼Y3115,并準備二值化圖像G3205。IP展開單元3206接收壓縮碼Z3116,并且建立多種顏色圖像H3207。圖像連接單元3208接收符號區(qū)域坐標3112,和相應(yīng)的調(diào)色板3114及二值化圖像G3205或多種顏色圖像H3207;當二值化圖像或多種顏色圖像的圖像數(shù)據(jù)代表透明性時,選擇圖像F3203的象素顏色,或在其它情況下選擇相應(yīng)的調(diào)色板顏色;并且建立最終圖像I3209。
圖38A到38C是顯示連接單元3208得到的結(jié)果的圖。首先,在圖38A中顯示通過JPEG展開單元得到的壓縮碼C。對于這個處理,采用圖34中的圖像;然而,當采用用于JPEG壓縮的量化不可逆方法時,得到數(shù)據(jù),其象素值與從圖34C中得到的稍許不同。與符號部分展開前,最初圖像被JPEG不可逆壓縮方法壓縮的情況相比,當采用相同的量化表時,象素值中的改變小。換句話說,得到高質(zhì)量的圖像。在這個實施例中,通過MMR壓縮得到的二值化圖像,用作執(zhí)行連接處理的符號區(qū)域。通過展開得到的二值化圖像顯示在圖38B中。假設(shè)用于這個圖像的調(diào)色板為R=20,G=30和B=225。通過參考圖38B中的二值化圖像,調(diào)色板顏色(20,30,225)數(shù)據(jù)放置在圖像38A相應(yīng)于黑色象素的圖像部分上,并且最后,得到圖38C中顯示的圖像。對于多種顏色圖像,調(diào)色板數(shù)改變。例如,對于兩比特位,對四個象素值00、01、10、11分配的調(diào)色板被應(yīng)用。一個象素代表透明性,而例如,當它為00時,對于這個象素選擇圖38A中的象素。
對于象素值01,應(yīng)用調(diào)色板值01;對于象素值10,應(yīng)用調(diào)色板值10;而對于象素值11,放置調(diào)色板值11。結(jié)果,得到展開的圖像3209。
<修正方案>
在上面的實施例中,通過使用完全表面單一閾值,建立二值化圖像。然而,可以采用另一個閾值;例如,對于符號區(qū)域檢測器3104檢測的每個符號區(qū)域,可以計算優(yōu)化的閾值,并且可以建立二值化圖像。在這種情況下,不需要圖43中的步驟S4001的再次二值化處理確定處理。
進一步,相同的二值化圖像已經(jīng)被符號部分上色單元3105和符號顏色選取單元3108使用;然而,相同的二值化圖像不總需要被使用,并且對于單元3105和3108,可以內(nèi)部地提供優(yōu)化二值化單元。
而且,在上面的實施例中,當不能處理在具有低亮度的背景上,具有高亮度的符號時,可以通過使用例如圖40中的安排執(zhí)行這個處理。對于具有目標象素作為中心的象素,差分處理單元4702執(zhí)行圖41A和圖41B顯示的差分濾波,并且以這樣的方式使象素二值化,即當象素值的絕對值超過閾值時,象素被確定為黑色,并當絕對值不超過閾值時,象素被確定為白色。在圖41A中顯示了第一差分濾波器??梢酝ㄟ^上部檢測電平線,而可以通過下部檢測垂直線,并且可以通過使用兩個濾波器的總絕對值檢測斜線。進一步,還可以采用斜線濾波器。處理所有方向的第二差分濾波器顯示在圖41B中。還可以對電平檢測和垂直檢測準備第二差分濾波器。這個濾波器對所有的象素定比特位,并且建立差分圖像4702。這時,當?shù)笏貢r執(zhí)行濾波,分辨率可以同時減小。對于這樣得到的二值化圖像,當在圖27中的步驟S3303開始的處理被執(zhí)行時,包括變換的符號的符號區(qū)域坐標,也可以被檢測到。還為了選取轉(zhuǎn)換的符號作為符號區(qū)域,二值化單元4703必須對付這個處理。當選取轉(zhuǎn)換的符號作為符號區(qū)域時,主要在圖42中接收圖樣,而在上面的實施例中假設(shè)只有圖33中的圖樣被接收。圖42B中的情況是用于轉(zhuǎn)換的符號的,而圖42C中的情況是兩種顏色的符號,即黑色符號和白色符號,出現(xiàn)在相同的灰色背景中的情況,當考慮這三個圖樣時,二值化單元4703只需要檢測點A和B,并執(zhí)行二值化處理,使夾在點A與B之間的區(qū)域為白色,而其它區(qū)域為黑色?;蛘撸豢紤]圖42C中的情況,只有一個閾值需要被檢測到,其中沿著閾值背景與符號部分被分離,并且對于轉(zhuǎn)換的圖樣,可以執(zhí)行圖樣轉(zhuǎn)換。當轉(zhuǎn)換的符號區(qū)域可以以這種方式處理時,轉(zhuǎn)換的符號區(qū)域可以通過符號部分上色處理而平滑,其中轉(zhuǎn)換的符號保持在第四實施例的JPEG壓縮圖像中。結(jié)果,壓縮效率提高,并且轉(zhuǎn)換的符號部分可以被壓縮,而不會使分辨率減小,或因為蚊子噪聲而產(chǎn)生的退化。
還可以對于多個裝置(例如主計算機、接口設(shè)備、讀取器或打印機)組成的系統(tǒng),或?qū)σ粋€裝置(例如復印機或傳真機)采用本發(fā)明。
進一步,還可以通過對系統(tǒng)或裝置(CPU或MPU)提供存儲介質(zhì)(或記錄介質(zhì)),其上記錄有實現(xiàn)本實施例功能的軟件程序碼,并且通過允許系統(tǒng)或裝置讀取并執(zhí)行記錄的程序碼,來實現(xiàn)本發(fā)明的目的。在這種情況下,從存儲介質(zhì)上讀取的程序碼,提供上述實施例的功能,并且其上記錄有程序碼的存儲介質(zhì)組成本發(fā)明。而且,通過本發(fā)明,不僅通過計算機執(zhí)行程序碼來提供前面實施例的功能,而且程序碼可以與計算機上運行的操作系統(tǒng)(OS)相互作用,或與其它軟件應(yīng)用相互作用,來提供上面實施例中描述的功能。
更進一步,通過本發(fā)明,從存儲介質(zhì)讀取的程序碼,可以寫入內(nèi)存中,其中內(nèi)存安裝在插入計算機的功能擴展板上,或者寫入連接到計算機的功能擴展單元上,并且與程序碼的指令相一致,安裝在功能擴展板或功能擴展單元上的CPU,可以執(zhí)行所需的部分或全部實際處理,來實現(xiàn)上述實施例的功能。
當對上面的存儲介質(zhì)應(yīng)用本發(fā)明時,相應(yīng)于上述流程圖(圖43和/或圖44及45)的程序碼存儲在存儲介質(zhì)上。
根據(jù)本發(fā)明,由于對于每個符號切割單元分配一種顏色,符號可以由多種顏色有效地代表,并當這種方法用于壓縮系統(tǒng)時,可以以高壓縮比執(zhí)行高質(zhì)量的圖像壓縮。
權(quán)利要求
1.一種圖像處理裝置,用于為每個符號切割單元分配顏色,包括二值化裝置,用于使彩色圖像數(shù)據(jù)二值化;檢測裝置,用于檢測所述彩色圖像數(shù)據(jù)中的符號區(qū)域;顏色減少裝置,用于從形成所述符號區(qū)域的N種顏色中,得到M種顏色,其中M等于或小于N;以及顏色分配裝置,用于為每個符號切割單元分配所述M種顏色中的一種。
2.一種圖像處理方法,用于為每個符號切割單元分配顏色,包括二值化步驟,用于使彩色圖像數(shù)據(jù)二值化;檢測步驟,用于檢測所述彩色圖像數(shù)據(jù)中的符號區(qū)域;顏色減少步驟,用于從形成所述符號區(qū)域的N種顏色中,得到M種顏色,其中M等于或小于N;以及顏色分配步驟,用于為每個符號切割單元分配所述M種顏色中的一種。
全文摘要
本發(fā)明涉及一種圖像處理裝置,用于為每個符號切割單元分配顏色,包括二值化裝置,用于使彩色圖像數(shù)據(jù)二值化;檢測裝置,用于檢測所述彩色圖像數(shù)據(jù)中的符號區(qū)域;顏色減少裝置,用于從形成所述符號區(qū)域的N種顏色中,得到M種顏色,其中M等于或小于N;以及顏色分配裝置,用于為每個符號切割單元分配所述M種顏色中的一種。
文檔編號H04N1/403GK1658650SQ20051005426
公開日2005年8月24日 申請日期2001年7月12日 優(yōu)先權(quán)日2000年7月12日
發(fā)明者戶田雨加利 申請人:佳能株式會社