圖像處理裝置、圖像處理方法和程序及其記錄介質(zhì)的制作方法

文檔序號：7616162閱讀：162來源：國知局

專利名稱：圖像處理裝置、圖像處理方法和程序及其記錄介質(zhì)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及圖像處理裝置、圖像處理方法和程序及其記錄介質(zhì)。
背景技術(shù)：
最近，作為當前掃描儀廣泛應(yīng)用的結(jié)果，文件的數(shù)字化已經(jīng)變?yōu)榱餍械膶嶋H應(yīng)用。然而，對于以比特位圖形式全色存儲，以例如300dpi掃描的A4尺寸的數(shù)字文件，必須占據(jù)多達24Mbytes的大量內(nèi)存。這樣的大量數(shù)據(jù)記錄不能附加到郵件上，并與郵件一起傳輸。
由此，通常使用JPEG，一種已知的壓縮技術(shù)，來壓縮全色圖像數(shù)據(jù)。然而通過JPEG，盡管用于壓縮自然圖像，如照片時非常有效，并且使用時產(chǎn)生圖像質(zhì)量很高，但當高頻部分，如符號使用JPEG壓縮時，產(chǎn)生被稱為蚊式噪聲的圖像退化，并且壓縮比也減小。由此，由于通常的辦公室文件包括很多符號部分，在文件二值化后，MMR用于壓縮二值化文件，并且得到符號部分的坐標和其中符號的代表顏色，使準備成彩色的辦公室文件可以被容易地表示。進一步，對于復雜的彩色文件，如雜志，被壓縮的區(qū)域分成背景和符號部分，而當背景使用JPEG壓縮時，符號使用優(yōu)化的閾值二值化，并且得到的二值化圖像使用MMR壓縮，然后將顏色信息加入得到的MMR數(shù)據(jù)中。以這種方式，即使非常復雜的彩色文件也可以使用小數(shù)據(jù)文件代表。
由此，需要開發(fā)計算符號部分中符號的代表顏色的技術(shù)。后面是傳統(tǒng)方法的例子，用于計算符號的代表顏色。
首先，通過參考符號區(qū)域的二值化圖像，對黑色部分中的多值圖像數(shù)據(jù)，準備粗糙的三維直方圖。然后，對相應(yīng)于粗糙的三維直方圖最高值的多值圖像象素，準備精細的直方圖，并且由此得到的最高值被確定為代表顏色。
然而，當上面的方法用于計算符號顏色的代表顏色時，盡管以300dpi或更高的分辨率讀取時，對于具有12點或更大高度的符號，可以計算所需顏色，但對10點或更小的符號，最初計算的代表顏色數(shù)據(jù)，對二值化圖像的黑色的比例小，并且所需顏色不能被計算。
現(xiàn)在參考圖19，對于執(zhí)行計算來得到大符號代表顏色的情況，和對于執(zhí)行計算來得到小符號的代表顏色的情況進行說明。
圖19是顯示綠色符號寫在白色背景上的實例情況。對于相對粗的符號，得到二值化結(jié)果1901，并且在二值化結(jié)果1901中，黑色部分的多值圖像具有電平變化1902。在電平變化1902中，由于在部分1903和1904，電平長時間保持穩(wěn)定，這相應(yīng)于符號各自的顏色，顏色分布到顏色空間RGB中，如圖20A所示。圖20A中的塊2002是圖19中的綠色，即指示符號的代表顏色。由于符號部分的塊2002具有特定的尺寸，它可以被相對容易地選取。
然后，對于圖19中的精細符號1906，多值數(shù)據(jù)中的電平變化具有形狀1907，并且電平一到達部分1908和1909，這相應(yīng)于符號的代表顏色，就改變到背景部分的電平。在這種情況下，RGB顏色空間中的顏色分布如圖20B所示，并且與圖20A中的塊2002比較，難于使用得到的數(shù)據(jù)，來計算圖20B中的部分2005。通過二值化處理，虛線的左側(cè)被二值化為黑色符號，而當使用傳統(tǒng)方法計算代表顏色時，得到點2005作為表示最大數(shù)的值。因為與所述的符號顏色相比，這不是優(yōu)選的，所以得到的符號具有白綠色邊框。
為了避免這種現(xiàn)象發(fā)生，有一種方法，通過它使二值化圖像被淡化，并且使用精細圖像執(zhí)行傳統(tǒng)的代表計算。然而，當應(yīng)用這種方法時，后面解釋會發(fā)生的缺點。
為了簡化解釋，符號“?！庇米骼印?br> 假設(shè)在圖21中，綠色符號“?！碑嬙诎咨尘吧?。用于符號“?！钡碾娖睫D(zhuǎn)換具有變化2104。對于返回到白色電平中心縮進，它最初是理想的；然而符號“?！保葱↑c完全返回到白色電平也許是不可能的。如果使用閾值2105執(zhí)行二值化處理，則得到實的黑點2102作為二值化結(jié)果。然后，如果對于這個點2102執(zhí)行淡化處理，則得到黑點2103，根據(jù)電平2104，由這個二值化圖像指示的多值圖像的比特位置是點2106，對于代表顏色這不是優(yōu)選電平。
由于對于具有小點符號，發(fā)生這種“破碎現(xiàn)象”，淡化處理明顯是不必要的。
這個二值化圖像用于對符號計算代表顏色，其中二值化圖像是為代表顏色采用的輸出。然而，對于優(yōu)化地代表符號的閾值，最好被二值化，使符號不發(fā)生模糊。進一步已知，當考慮隨后的OCR處理時，由于可以得到較好的OCR結(jié)果，變?yōu)閷嵭牡亩祷柡糜谧兊媚：摹?br> 圖22是對符號區(qū)域的亮度顯示典型直方圖的圖。點2201是二值化圖像所需的點。然而，當在這點2201執(zhí)行二值化時，從背景轉(zhuǎn)換到符號部分的象素，被二值化為黑點，即優(yōu)選輸出，而當執(zhí)行符號代表顏色的計算時，這個輸出形成噪聲。
這個狀態(tài)在圖22中顯示。當在圖22中的點2201執(zhí)行二值化時，這與在圖23中的電平2301執(zhí)行二值化相等，并且得到的二值化圖像，還包括從背景轉(zhuǎn)換到符號的很多部分2302和2303。
如上所述，由于二值化圖像用于計算符號的代表顏色，其中二值化圖像是采用來代表符號的輸出，對于符號部分不能計算優(yōu)化的代表顏色。
進一步，根據(jù)所述的傳統(tǒng)方法，對于每個符號區(qū)域，只可以得到一個代表顏色，并且不能處理多種顏色出現(xiàn)的符號區(qū)域。

發(fā)明內(nèi)容
為了解決上面的問題，本發(fā)明的一個目的是提供圖像處理裝置和圖像處理方法，用于對符號部分計算優(yōu)化代表顏色，并且提供其存儲介質(zhì)。
為了實現(xiàn)這個目的，根據(jù)本發(fā)明，圖像處理裝置包括
直方圖計算裝置，用于計算與輸入圖像一致的直方圖；二值化閾值計算裝置，用于根據(jù)直方圖計算二值化閾值，通過它輸入圖像中的預定區(qū)域被模糊；二值化裝置，用于通過所述二值化閾值使輸入圖像二值化；和計算裝置，用于根據(jù)二值化裝置得到的結(jié)果，計算輸入圖像中預定區(qū)域的顏色。
進一步，為了解決上面的問題，本發(fā)明的另一個目的是提供圖像處理裝置和圖像處理方法，用于對符號區(qū)域分配多種顏色，并且提供其存儲介質(zhì)。
為了實現(xiàn)這個目的，根據(jù)本發(fā)明，圖像處理裝置包括二值化裝置，用于使彩色圖像數(shù)據(jù)二值化；檢測裝置，用于檢測彩色圖像數(shù)據(jù)中的符號區(qū)域；顏色減少裝置，用于從組成符號區(qū)域中符號的N種顏色中，引入等于或小于N種顏色的M種顏色；符號切割裝置，用于對符號區(qū)域執(zhí)行符號切割處理；和顏色分配裝置，用于對符號切割裝置得到的每個切割的符號單元，分配M種顏色之一。
本發(fā)明還涉及一種圖像處理方法，用于為每個符號切割單元分配顏色，包括二值化步驟，用于使彩色圖像數(shù)據(jù)二值化；檢測步驟，用于檢測所述彩色圖像數(shù)據(jù)中的符號區(qū)域；顏色減少步驟，用于從形成所述符號區(qū)域的N種顏色中，得到M種顏色，其中M等于或小于N；以及顏色分配步驟，用于為每個符號切割單元分配所述M種顏色中的一種。

圖1是顯示根據(jù)本發(fā)明第一實施例的圖像處理裝置的結(jié)構(gòu)視圖；圖2是顯示最初圖像例子的圖；圖3是流程圖，顯示了通過二值化單元和區(qū)域分割單元執(zhí)行的處理；圖4是顯示最初圖像亮度的直方圖的圖；圖5是顯示通過最初圖像的二值化得到的二值化圖像的圖；圖6是顯示對二值化圖像執(zhí)行附加標記的狀態(tài)的圖；圖7是黑色區(qū)域的圖，它根據(jù)符號屬性從最初圖像中選??；圖8是顯示最初圖像中符號區(qū)域的圖；圖9是流程圖，顯示了通過符號、代表顏色操作單元執(zhí)行的處理；圖10是流程圖，顯示了計算閾值T2采用的方法的例子；圖11是顯示根據(jù)本發(fā)明第二實施例的圖像處理裝置的結(jié)構(gòu)視圖；圖12顯示普通符號與變換的符號之間的差異的圖；圖13是顯示轉(zhuǎn)換的符號部分的亮度直方圖；圖14是顯示根據(jù)本發(fā)明第三實施例的圖像處理裝置的結(jié)構(gòu)視圖；圖15是顯示根據(jù)本發(fā)明第三實施例的結(jié)構(gòu)視圖，用于展開壓縮的數(shù)據(jù)；圖16是流程圖，顯示了處理形狀；圖18是顯示計算閾值T2使用的方法例子的圖；圖19是圖示，用于解釋用于大符號的代表顏色被計算的情況，和用于小符號的代表顏色被計算的情況；圖20A和20B是顯示RGB空間分布的圖；圖21是解釋二值化圖像淡化的圖；圖22是顯示圖像區(qū)域典型亮度的圖；圖23是顯示圖像二值化得到的結(jié)果的圖；圖24是顯示圖像二值化得到的結(jié)果的圖；圖25是顯示根據(jù)本發(fā)明第四實施例的圖像處理裝置的結(jié)構(gòu)視圖；圖26是顯示根據(jù)第四實施例的圖像處理裝置的安排視圖，用于展開壓縮的數(shù)據(jù)；圖27是流程圖，顯示了根據(jù)本發(fā)明第四實施例執(zhí)行的符號區(qū)域檢測處理；圖28是用于解釋本發(fā)明的符號實施例的圖；
圖29是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號區(qū)域檢測處理的圖；圖30是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號區(qū)域檢測處理的圖；圖31是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號區(qū)域檢測處理的圖；圖32是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號區(qū)域檢測處理的圖；圖33是用于解釋根據(jù)本發(fā)明第四實施例，對符號區(qū)域再次二值化執(zhí)行的處理的圖；圖34A、34B和34C是解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號上色處理的圖；圖35是流程圖，用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的符號上色處理；圖36是流程圖，用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的一個顏色選取處理；圖37是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的一個顏色選取處理的圖；圖38A、38B和38C是解釋本發(fā)明第四實施例的圖像處理裝置展開壓縮的數(shù)據(jù)，并連接得到的數(shù)據(jù)的狀態(tài)的圖；圖39是用于解釋根據(jù)本發(fā)明第四實施例執(zhí)行的顏色減少處理的圖；圖40是顯示第五實施例的圖像處理裝置的結(jié)構(gòu)的改進方案的視圖；圖41A和41B是解釋根據(jù)改進方案執(zhí)行的圖像壓縮處理的圖；圖42A、42B和42C是解釋當根據(jù)改進方案使符號區(qū)域二值化時執(zhí)行的處理的圖；圖43是流程圖，顯示了根據(jù)本發(fā)明第五實施例執(zhí)行的符號顏色選取處理；
圖44是流程圖，顯示了根據(jù)本發(fā)明第五實施例執(zhí)行的顏色減少處理；圖45是流程圖，顯示了根據(jù)本發(fā)明第五實施例執(zhí)行的顏色減少處理；圖46是用于解釋掃描儀產(chǎn)生的符號轉(zhuǎn)換部分(灰度)的圖；圖47是用于解釋根據(jù)本發(fā)明第五實施例執(zhí)行的顏色減少處理的圖；圖48是用于解釋根據(jù)本發(fā)明第五實施例執(zhí)行的顏色減少處理的圖；圖49是顯示代表符號移位部分的三維直方圖的圖，其中符號由掃描儀產(chǎn)生；和圖50是用于解釋根據(jù)本發(fā)明第五實施例執(zhí)行的顏色分配的圖，用于使用符號切割信息確定每個符號的顏色。
具體實施例方式
在后面的實施例中，符號包含字符等。
(第一實施例)現(xiàn)在將結(jié)合附圖具體描述本發(fā)明的優(yōu)選實施例。
圖1是顯示根據(jù)這個實施例的圖像處理裝置結(jié)構(gòu)的圖。
二值化單元(a)102將輸入的最初圖像101二值化，并產(chǎn)生二值化圖像(a)103。
區(qū)域分割單元104檢測接收的二值化圖像(a)103中的符號區(qū)域或照片區(qū)域，并產(chǎn)生區(qū)域的坐標和屬性，例如用于符號和照片的區(qū)域信息105。
根據(jù)區(qū)域信息105，MMR壓縮單元106對于二值化圖像(a)103的部分執(zhí)行MMR壓縮，并產(chǎn)生壓縮的碼D107，其中二值化圖像(a)103的部分相應(yīng)于具有符號屬性的區(qū)域。
根據(jù)區(qū)域信息105，符號代表顏色操作單元108計算符號的代表顏色，其中符號的代表顏色包括在相應(yīng)于具有符號屬性的區(qū)域中。用于計算符號代表顏色的二值化單元(b)1801，包括在符號代表顏色操作單元108中，并且產(chǎn)生二值化圖像(b)1802。在這個處理中得到的顏色信息，作為區(qū)域信息105的屬性被新寫入。
根據(jù)區(qū)域信息105，JPEG壓縮單元109壓縮最初圖像的部分，并產(chǎn)生壓縮的碼C110，其中最初圖像的部分包括在相應(yīng)于包括自然圖像屬性區(qū)域的區(qū)域中。
現(xiàn)在將更具體地解釋這個結(jié)構(gòu)。
圖3是流程圖，顯示了由二值化單元(a)102和區(qū)域分割單元104執(zhí)行的處理。
步驟S301到S303顯示了二值化單元(a)102執(zhí)行的處理，而步驟S304到S306顯示了區(qū)域分割單元104執(zhí)行的處理。
在步驟S301中，輸入最初圖像101，如RGB彩色圖像，并且通過使用后面的等式，對這個圖像執(zhí)行亮度轉(zhuǎn)換，來產(chǎn)生亮度圖像J。
Y＝0.299R+0.587G+0.114B在步驟S302，準備亮度數(shù)據(jù)直方圖，并且計算用于二值化的閾值T。
在步驟S303，通過使用閾值T，使亮度圖像J二值化，并且產(chǎn)生二值化圖像K。
在步驟S304，跟蹤黑色象素的邊界線，并且對每個黑色區(qū)域執(zhí)行標記附加。
在步驟S305，附加標記的黑色區(qū)域的形式和比特位置被采用，來確定圖像是符號還是自然圖像。
在步驟S306，根據(jù)它們的形式和比特位置連接符號區(qū)域，盡管步驟S306的連接處理不總是被執(zhí)行。在這種情況下，計算代表顏色的符號區(qū)域的數(shù)量增加，并且處理時間延長，而優(yōu)點是，顏色的改變可以被精確地處理。
現(xiàn)在通過使用圖2中的最初圖像，對直到步驟S306連接處理完成的情況，給出解釋。
對圖2中的最初圖像執(zhí)行亮度轉(zhuǎn)換(步驟S301和S302)，并且得到的亮度直方圖如圖4所示。從這個直方圖中，采用平均和離散的數(shù)據(jù)來計算閾值T＝150，并且得到的二值化圖像，即圖1中的二值化圖像103如圖5所示(S303)。圖6是顯示狀態(tài)的圖，其中對于圖5中的二值化圖像，以減小的分辨率執(zhí)行邊界跟蹤，并且對所有的黑色區(qū)域執(zhí)行標記附加(S304)。標記被附加的黑色區(qū)域的形式和比特位置信息，被采用來確定符號或自然圖像的屬性(S305)。應(yīng)該注意，這個圖像不實際產(chǎn)生而只是概念。在這個例子中，由于部分601較大，并且包含黑色區(qū)域，因而它被確定為自然圖像。進一步，由于區(qū)域602到605包括符號，并具有空白的形狀，它們的區(qū)域被確定為邊框。在這個實施例中，邊框信息不包括為區(qū)域信息105，并且被忽略。然而，應(yīng)用可以保持邊框信息，或可以采用邊框信息作為符號區(qū)域信息的背景。在這種情況下，必須提供用于計算背景顏色的裝置。
圖7是顯示黑色區(qū)域的圖，其中從圖2的最初圖像中選取符號屬性。當黑色象素根據(jù)它們是否彼此靠近定比特位，并且它們的高度和寬度是否匹配來分組時，圖8顯示的17個符號區(qū)域801到817可以根據(jù)需要被檢測。在這個實施例中，執(zhí)行分組(S306)，并且應(yīng)用了符號屬性的17個坐標數(shù)據(jù)組，存儲在圖1的JPEG壓縮單元109中，同時圖6中應(yīng)用了照片屬性的符號坐標601，存儲在圖1的JPEG壓縮單元109中。
圖9是流程圖，顯示了符號代表顏色操作單元108執(zhí)行的處理。由于對所有包括在區(qū)域信息105中的坐標執(zhí)行這個處理，在步驟S901執(zhí)行判斷來確定是否有符號坐標還沒有被處理。如果確定有符號坐標還沒有被處理，程序控制前進到步驟S902，或者如果確定沒有這樣的坐標，處理結(jié)束。
在步驟S902，執(zhí)行判斷來確定符號屬性是否應(yīng)用到坐標上；如果應(yīng)用了，則程序控制前進到步驟S903，而如果沒有應(yīng)用，則程序控制返回到步驟S901。
在步驟S903，對相應(yīng)于區(qū)域信息的最初圖像，計算亮度直方圖。由于這個直方圖用于部分區(qū)域，與圖4顯示中包括的直方圖相比，它非?？赡懿痪哂袕碗s的形狀，而具有如圖22中顯示的那樣的簡單形狀。
在步驟S904，執(zhí)行計算來得到優(yōu)化閾值，即根據(jù)發(fā)生符號模糊的閾值T2，而用于確定一個代表顏色，這個閾值T2相應(yīng)于圖22中的點2202。
現(xiàn)在將使用圖10中的流程圖，來解釋計算閾值T2的例子方法。
在步驟S1001，0值替換到變量“l(fā)imit”中，用于計算過程數(shù)，使處理不進入死循環(huán)。
在步驟S1002，亮度直方圖用于得到直方圖的平均值及其時滯執(zhí)行的計算，這特別存儲為skew-first。對于這些計算，采用了后面的等式。
average=Σi=0255histgram(i)]]>skew_first=Σi=0255(i-average)3*histgram(i)]]>在步驟S1003，“average”替換到HistUpper中，并且0值替換到HistLower中，后面在步驟S1004，執(zhí)行判斷來確定變量“l(fā)imit”等于還是大于10。當變量“l(fā)imit”等于或大于10時，程序控制轉(zhuǎn)換到步驟S1009(在這種情況下，除了10還可以采用5或20)。然后，在步驟S1005，HistUpper用于計算HistLower的直方圖。
average=Σi=HistLowerHistUpperhistgram(i)]]>myu=Σi=HistLowerHistUpper(i-average)*histgram(i)]]>skew=Σi=HistLowerHistUpper(i-average)*histgram(i)]]>在步驟S1006，執(zhí)行判斷來確定是否滿足條件skew＜my*0.1，并且當滿足時，不需要進一步的計算，并且程序控制跳到步驟S1010。然而當這個條件不滿足時，程序控制前進到步驟S1007，其中執(zhí)行判斷來確定是否滿足條件skew＜0.0并且skew_first＜skew*0.1。如果滿足這些條件，則不需要進一步的計算，并且程序控制跳到步驟S1010。但如果這些條件不滿足，程序控制前進到步驟S1008，并且“average”替換到“HistLower”中。然后在步驟S1009，變量“l(fā)imit”遞增一，并且程序控制返回到步驟S1004。
通過重復這個過程，在步驟S1010，最后“average”替換到閾值T2中，結(jié)果，獲得產(chǎn)生模糊的二值化圖像的閾值，其中模糊的二值化圖像由圖22中的點2202指示。
根據(jù)這個閾值，當圖像二值化時沒有黑色象素出現(xiàn)，由于可以根據(jù)直方圖的形狀得到這個閾值，從閾值T2計算靠近黑色區(qū)域的象素數(shù)。當象素數(shù)特別小時，象素需要或多或少地修正，使它們靠近白色。圖17顯示了直方圖的形狀，它趨于反射這樣的結(jié)果。
除了上述復雜計算，根據(jù)得到直方圖并選擇閾值的另一個方法，所有象素的5％(這個數(shù)只是個例子)被二值化為黑點。圖18是顯示閾值計算例子的直方圖。
在步驟S905，二值化單元(b)1081使用閾值T2將部分區(qū)域二值化，并且產(chǎn)生圖1中的二值化圖像(b)1082。如圖22所示，通過使用閾值T2，即點2202來使區(qū)域二值化，而這意味著在圖24的電平2401使區(qū)域二值化，從而執(zhí)行二值化卻不包括轉(zhuǎn)換部分2402和2403。然后根據(jù)需要，對得到的二值化圖像執(zhí)行淡化處理。由于閾值根據(jù)二值化圖像的模糊而發(fā)生，在用于代表顏色計算執(zhí)行的傳統(tǒng)淡化處理中，錯誤發(fā)生的概率減小，如參考圖21所解釋的。在步驟S906，對相應(yīng)于二值化圖像(b)黑色部分的最初圖像的每個RGB象素，產(chǎn)生直方圖。用于直方圖的顏色空間可以不是RGB，而當最初圖像是YUV時還可以是YUV。在步驟S907，RGB直方圖的每個峰值被確定為符號代表顏色，并且寫入?yún)^(qū)域信息105中作為相應(yīng)區(qū)域的屬性。
對步驟S906和S907可以采用后面的其它方法。例如，除了每個RGB象素的直方圖，計算RGB三維直方圖。在這種情況下，計算器的功能不可能具體地計算直方圖，而最好計算粗糙的直方圖，而不被顏色轉(zhuǎn)換點產(chǎn)生的噪聲影響。作為一種方法，首先通過使用粗糙的直方圖得到最高值，然后計算粗糙的直方圖中出現(xiàn)的具體的直方圖，最后再次得到最高值。
最后，根據(jù)二值化圖像區(qū)域信息，對于應(yīng)用符號屬性并符合二值化圖像(a)102的區(qū)域，執(zhí)行MMR壓縮，并且產(chǎn)生壓縮碼D107。同樣，對于應(yīng)用自然圖像屬性并符合最初圖像數(shù)據(jù)的區(qū)域，執(zhí)行JPEG壓縮，并產(chǎn)生壓縮碼C110。根據(jù)需要，通過收集區(qū)域信息105，其中區(qū)域信息105包括區(qū)域類型，如符號或自然圖像，和圖像是符號時的代表顏色，同樣還有壓縮碼C111和壓縮碼D112，來產(chǎn)生格式。得到的格式用作壓縮數(shù)據(jù)。
(第二實施例)圖11是顯示根據(jù)本發(fā)明第二實施例的圖像處理裝置結(jié)構(gòu)的圖。在這個實施例中，不采用使用閾值得到的二值化圖像，作為執(zhí)行區(qū)域分割的圖像。相反，對所有的象素通過差分濾波，計算相對于臨近象素的邊緣量，并且邊緣量被二值化而得到二值化圖像，并且這個二值化圖像用于執(zhí)行區(qū)域分割。第一實施例中使用的邊界線跟蹤也被使用，作為區(qū)域分割方法。
第一和這個實施例之間的差異是，作為符號選取的區(qū)域還包括普通二值化轉(zhuǎn)換的區(qū)域。
圖12是顯示普通符號與變換的符號之間差異的圖。變換的符號是例如紅色背景上的白色符號，這在彩色文件中并不特別少見。在第一實施例中，不對轉(zhuǎn)換的符號提供符號屬性，而對包括外部彩色邊框的區(qū)域提供自然的自然屬性。在這個實施例中，由于差分二值化圖像用于區(qū)域分割，如圖12所示，轉(zhuǎn)換的符號區(qū)域還可以分成符號。在這種情況下，亮度直方圖具有圖13顯示的形狀，而符號區(qū)域直方圖通常具有圖22顯示的形狀。頂峰部分1301指示一塊背景，而頂峰部分1302指示一塊符號。在這個實施例中，對于產(chǎn)生部分二值化圖像(b)(圖11中的11082)的二值化處理，需要轉(zhuǎn)換處理，其中部分二值化圖像(b)用于計算符號代表顏色。
可以使用后面的等式，確定符號是否被轉(zhuǎn)換。
后面的等式是圖1中結(jié)構(gòu)的一個例子。
average=Σi=0255histgram(i)]]>skew_first=Σi=0255(i-average)3*histgram(i)]]>可以確定當skew_first為負時，區(qū)域是圖22顯示的普通符號部分，而當skew_first為正時，區(qū)域是圖13顯示的變換的符號部分。
當參考圖16的流程圖時，這個處理將被簡要地解釋。在圖16中，右側(cè)(S1613到S1619)恰巧與圖10中的流程圖相同，而左側(cè)(S1605到S1611)是用于變換的符號的計算處理。
當在步驟S1603的skew_first＞0時，設(shè)置DoInvert標志，來指示二值化單元執(zhí)行轉(zhuǎn)換處理。
當設(shè)置DoInvert標志時(ON)，輸出視覺結(jié)果的二值化單元(b)11081和二值化單元(a)1111，轉(zhuǎn)換二值化結(jié)果。在提供來處理變換的符號的安排中，區(qū)域分割單元1104必須檢測具有邊框?qū)傩缘膮^(qū)域，并且還必須計算邊框中的平均顏色。這是因為變換的符號的背景顏色是白色以外的顏色，并且這個顏色必須代表。負責這個處理的邊框區(qū)域平均顏色操作單元，沒有在圖11中顯示。
通過圖14中的安排，由于對于背景保持所有的JPEG數(shù)據(jù)，具有邊框?qū)傩缘膮^(qū)域不必被準備，來處理變換的符號，其中圖14中的安排將在后面描述。
(第三實施例)還可以采用圖14顯示的圖像處理裝置的結(jié)構(gòu)。
將簡要描述圖14中的結(jié)構(gòu)。
在這個結(jié)構(gòu)中，對于區(qū)域分割處理，提供用于只檢測符號區(qū)域坐標的符號區(qū)域選取單元1402，并且符號區(qū)域選取單元1402存儲符號區(qū)域坐標1403。
二值化單元1404產(chǎn)生符號區(qū)域的二值化圖像1405，并根據(jù)二值化圖像1405，符號部分上色單元1408產(chǎn)生文件1413，其中最初圖像的符號部分被染成周圍部分的平均顏色。對得到的部分二值化圖像執(zhí)行MMR壓縮，并且產(chǎn)生壓縮碼D，而對符號省略圖像執(zhí)行JPEG壓縮，并產(chǎn)生壓縮碼C。
符號代表顏色操作單元1411執(zhí)行第一實施例中圖9顯示的處理，并產(chǎn)生代表顏色1412。
圖15是顯示結(jié)構(gòu)的圖，用于展開壓縮數(shù)據(jù)，其中壓縮數(shù)據(jù)通過圖14中的安排得到。
為了展開壓縮數(shù)據(jù)，對于壓縮數(shù)據(jù)C執(zhí)行JPEG展開處理，并且產(chǎn)生多值圖像G。進一步，對壓縮碼D執(zhí)行MMR展開處理，并且對部分區(qū)域產(chǎn)生二值化圖像F。然后，執(zhí)行連接過程，其中代表值加到圖像G的黑色二值化象素中，而二值化白色圖像不變，最后得到圖像H。
與圖14和15的結(jié)構(gòu)比較，保持了省略符號區(qū)域的整個JPEG圖像，使最初圖像的氣氛不丟失。
(修正方案)還可以對多個裝置組成的系統(tǒng)采用本發(fā)明(例如主計算機、接口設(shè)備、讀取器或打印機)，或?qū)τ趩蝹€裝置采用本發(fā)明(例如復印機和傳真機)。
進一步，還可以通過對系統(tǒng)或裝置(CPU或MPU)提供存儲介質(zhì)(或記錄介質(zhì))，其上記錄有實現(xiàn)本實施例功能的軟件程序，并通過允許系統(tǒng)或裝置讀取并執(zhí)行記錄的程序碼，來實現(xiàn)本發(fā)明的目的。在這種情況下，從存儲介質(zhì)讀取的程序碼提供上述實施例的功能，并且其上記錄有程序碼的存儲介質(zhì)組成本發(fā)明。而且，通過本發(fā)明，不僅能夠通過計算機執(zhí)行程序碼，來提供先前實施例的功能，而且程序碼可以與計算機上運行的操作系統(tǒng)(OS)相互作用，或與另一個軟件應(yīng)用相互作用，來提供上面實施例中描述的功能。
進一步，通過本發(fā)明，從記錄介質(zhì)上讀取的程序碼，可以寫入存儲器中，其中存儲器安裝在插入計算機的功能擴展板上，或?qū)懭脒B接到計算機上的功能擴展單元上，并且與程序碼中的指令一致，CPU安裝在功能擴展板或功能擴展單元上，可以執(zhí)行部分或全部實際處理，來實現(xiàn)上述實施例的功能。
如上所述，根據(jù)本發(fā)明，與輸入圖像一致的直方圖被計算，并且根據(jù)閾值模糊圖像中的預定區(qū)域，計算二值化閾值。通過使用得到的二值化閾值，使輸入的圖像二值化，并且采用輸入圖像計算輸入圖像預定區(qū)域的顏色。由此，即使對于細線符號，從背景上轉(zhuǎn)換到符號的部分也可以被刪除，從而對符號可以得到優(yōu)化的代表顏色。
(第四實施例)現(xiàn)在將根據(jù)本發(fā)明的第四實施例，對圖像處理裝置給出解釋，在將完全彩色圖像存儲在存儲介質(zhì)上，或通過傳輸介質(zhì)傳輸之前，第四實施例有效地壓縮圖像數(shù)據(jù)，而保持最初圖像轉(zhuǎn)換的信息。
這個實施例的圖像處理裝置，首先對整個圖像區(qū)域產(chǎn)生亮度直方圖，使圖像區(qū)域二值化，并選取幾個符號區(qū)域。然后，對各自的符號區(qū)域執(zhí)行符號切割處理，并且采用結(jié)果來確定每個得到的區(qū)域是否應(yīng)該被再次作為符號區(qū)域?qū)Υ．攨^(qū)域不應(yīng)該被作為符號區(qū)域?qū)Υ龝r，執(zhí)行判斷來確定相關(guān)區(qū)域中的對象是否具有單一顏色。當對象具有單一顏色時，確定對這個對象應(yīng)該執(zhí)行MMR壓縮。當對象不具有單一顏色時，確定應(yīng)該對這個對象執(zhí)行JPEG壓縮。進一步，當確定圖像應(yīng)該被作為符號區(qū)域?qū)Υ龝r，通過預定的顏色減少處理方式減少組成區(qū)域的顏色。當通過顏色減少處理只得到一種顏色時，代表那個顏色的調(diào)色板(例如(R，G，B)＝(20，30，40))被確定為MMR壓縮目標，而與二值化圖像相關(guān)。通過顏色減少處理，當圖像可以通過預定數(shù)量(例如四種)或更少的顏色來代表時，每次執(zhí)行符號切割處理，代表各自顏色的調(diào)色板與指示顏色的象素比特位置的多值圖像彼此相關(guān)，而確定為ZIP壓縮目標。當不能通過預定數(shù)量的顏色代表圖像時，在執(zhí)行顏色減少處理前，最初圖像被確定為JPEG壓縮目標。
圖25是顯示當采用本發(fā)明的方法進行圖像壓縮處理的結(jié)構(gòu)圖。圖像二值化單元3102接收最初圖像3101，并且優(yōu)化地使最初圖像3101二值化，來得到整個表面二值化圖像3103。符號區(qū)域檢測器3104接收完整表面二值化的圖像3103，檢測符號區(qū)域，并準備符號區(qū)域坐標3112。
符號顏色選取單元3108接收符號區(qū)域坐標3112，參考坐標上的最初圖像和二值化圖像3103，來計算二值化圖像中黑色部分的最初圖像顏色，準備多個調(diào)色板3114，并根據(jù)調(diào)色板3114對最初圖像執(zhí)行顏色減少處理。
在符號區(qū)域檢測器3104確定為符號，并且符號顏色選取單元3108將其符號顏色數(shù)減少到小于M的區(qū)域，符號部分上色單元3105從最初圖像中選取二值化圖像3103的黑色部分，將黑色部分染成周圍部分的顏色，并準備圖像A。
減少單元3106接收并減少圖像A，并產(chǎn)生圖像B。
JPEG壓縮單元3107接收圖像B，并且對圖像B執(zhí)行JPEG壓縮，來產(chǎn)生壓縮碼X(3113)。
顏色減少的圖像3109是用于多符號的區(qū)域，其顏色通過符號顏色選取單元3108減少。當顏色減少的圖像3109是一比特位時，MMR壓縮單元3110接收顏色減少的圖像3109，并執(zhí)行MMR壓縮而得到多壓縮碼Y(3115)。對于兩比特位的減少顏色的圖像3109，ZIP壓縮單元311 1接收這個圖像3109，并壓縮它而得到多壓縮碼Z(3116)。最后，連接數(shù)據(jù)3112到3116來得到壓縮的數(shù)據(jù)3001A。
符號區(qū)域檢測處理圖27是流程圖，用于解釋通過符號區(qū)域檢測器3104執(zhí)行的處理。
在步驟S3301，彩色圖像被接收，并且對彩色圖像執(zhí)行亮度轉(zhuǎn)換，而通過淡化使分辨率減小，并得到亮度圖像J。當最初圖像在例如300dpi為RGB24字節(jié)時，對于每四個象素垂直地并電平地執(zhí)行操作。
Y＝0.299R+0.587G+0.114B得到的新圖像J在75dpi為Y8比特位。在步驟S3302，準備用于亮度數(shù)據(jù)的直方圖，并且計算二值化閾值T。
在步驟S3303，通過使用閾值T使亮度圖像J二值化，并且建立二值化圖像K。進一步，在步驟S3304，對黑色象素執(zhí)行邊界線跟蹤，并且對所有的黑色區(qū)域執(zhí)行標記附加。在步驟S3305，在黑色區(qū)域中確定假定為符號的區(qū)域，而在步驟S3306，根據(jù)它們的形狀和比特位置連接區(qū)域。
現(xiàn)在將描述這個處理的例子。圖4中的彩色文件被接收，并且通過對彩色文件淡化并執(zhí)行亮度轉(zhuǎn)換，而得到圖5中的直方圖。通過參考這個直方圖，采用平均數(shù)據(jù)和分布數(shù)據(jù)來計算閾值T(例如150)，并且得到圖6中顯示的二值化圖像。對圖6中的黑色象素執(zhí)行邊界線跟蹤，并且通過標記附加，只有一組黑色象素被識別為符號，其中黑色象素組的寬度和高度等于或小于閾值。然后，圖7中的黑色象素組確定為符號區(qū)域，在這個例子中，為了解釋而單純顯示圖像，而在符號區(qū)域檢測處理中不實際建立。
當黑色象素根據(jù)它們是否靠近定比特位，并且它們的高度和寬度是否匹配來分組時，可以檢測圖32中顯示的16個符號區(qū)域。用于象素的坐標數(shù)據(jù)存儲為圖25中的符號區(qū)域坐標3112。
除了使圖像二值化，通過使用差分濾波，對于所有象素，可以計算相對于臨近象素的邊緣量，并且對邊緣量二值化，對得到的二值化圖像可以執(zhí)行邊界線跟蹤，來檢測符號區(qū)域。
用于符號區(qū)域的符號顏色選取處理圖43是流程圖，用于符號顏色選取單元3108執(zhí)行的處理。在這個處理中采用了完全表面二值化圖像103；然而，只有符號區(qū)域和彩色圖像的坐標可以被接收，并且可以采用彩色圖像二值化得到的圖像，來執(zhí)行代表顏色操作處理。
對符號區(qū)域檢測器3104確定為符號區(qū)域的所有區(qū)域，執(zhí)行圖43中的處理。
(再次二值化處理)首先，在步驟S6001執(zhí)行再次二值化判斷。
完全表面二值化的圖像3103不總是優(yōu)選地二值化所有符號區(qū)域而得到的圖像。由于結(jié)果圖像的質(zhì)量被極大地影響，不論二值化圖像太厚還是太薄，對于每個符號區(qū)域執(zhí)行的優(yōu)化二值化是理想的。由于與圖29的完全表面直方圖相比，可以對每個符號區(qū)域的亮度直方圖，期望圖33顯示的較簡單的形狀，所以可以容易地確定閾值。部分3901是一組背景顏色，而部分3902是一組符號顏色。在這個實施例中，為了減少處理時間，只對“太厚的二值化圖像”執(zhí)行再次二值化，其中“太厚的二值化圖像”在圖像質(zhì)量上具有更強的效果。
特別地，符號區(qū)域檢測器3104在確定為符號的區(qū)域上掃描二值化圖像，并以隔離點濾波器執(zhí)行圖樣匹配。執(zhí)行判斷來確定出現(xiàn)的隔離點是等于還是大于區(qū)域中的閾值。當隔離點等于或大于閾值時，得到用于區(qū)域的亮度直方圖，計算優(yōu)化的閾值，并且執(zhí)行再次二值化。對于普通符號區(qū)域，只需要特別準備亮度直方圖，來得到更好的圖像；然而在一些情況下，可能得到較差的結(jié)果(通過再次二值化得到圖像可能更差)。為了防止這樣的現(xiàn)象，用于得到完全表面二值化圖像的二值化閾值被輸入，用于再次二值化，并且提供例外處理，其中當?shù)玫降亩祷瘓D像具有比再次二值化的閾值更高的密度時，不執(zhí)行再次二值化。
(符號切割處理)在步驟S6002，執(zhí)行符號切割信息。
根據(jù)符號區(qū)域是風景還是人像，符號切割單元改變處理方式。符號區(qū)域檢測器根據(jù)黑塊的安排，確定符號部分的風景或人像定比特位，并準備指示是使用風景還是使用人像定比特位的信息。當風景定比特位用于符號區(qū)域時，首先，在主掃描方向上突出二值化圖像的黑色象素。并當檢測到線之間的分離時，在次掃描方向上對每條線突出黑色象素，并且得到用于每個符號的信息。當人像定比特位用于符號區(qū)域時，在子掃描方向上執(zhí)行線切割，并且在主掃描方向上執(zhí)行符號切割。這時，在線的方向上，線切割最好突出為三段，來允許圖像傾斜。通過這個處理，可以得到每條線的坐標信息和符號的坐標信息，其中它們沿每條線分開。
在符號調(diào)整處理中(步驟S6003，這將在后面描述)，采用符號切割信息，在符號區(qū)域檢測器確定為符號的區(qū)域中，確定每個黑色對象是否為符號。特別地，根據(jù)其尺寸和形狀，確定黑色對象是否是符號。當考慮圖像質(zhì)量和數(shù)據(jù)壓縮時，為了將它轉(zhuǎn)換成單一顏色或多種顏色的區(qū)域(例如，因為可以得到更高的圖像質(zhì)量和更好的壓縮比，應(yīng)該通過單一顏色MMR而不是JPEG來代表具有單一顏色的標志)，不需要黑色對象為符號。然而，由于符號區(qū)域以外的區(qū)域非?？赡苡苫叶却恚枰_定對象。
(符號判斷處理)在步驟S6003執(zhí)行符號判斷處理。
在這個處理中，輸入符號切割信息(S6002)，并且對每條線計算平均符號尺寸。當用于非常小符號的信息被忽略時，可以得到更好的結(jié)果。如果對象形比平均尺寸大得多，則確定不是符號，而如果對象的形狀從縱橫比看來不是符號，而不論它的平均尺寸，則仍然確定不是符號。
但當在區(qū)域中出現(xiàn)m個黑色對象時，并當所有的m個黑色對象被確定不是符號時，符號判斷單元輸出區(qū)域是圖像的判斷。
當m個黑色對象中的n個黑色對象不是符號時(m＞n，n＞＝0)，即當保留不指示符號的矩形時，二值化圖像上的黑色對象被刪除，其中二值化圖像被確定不是符號，并且輸出相關(guān)區(qū)域是符號的判斷。
當考慮最終圖像質(zhì)量時，加入后面的例外處理。當區(qū)域中十個符號中的五個代表為單一顏色的符號時，并當其它五個符號被認為不是符號，并且對它們執(zhí)行JPEG壓縮時，得到不均勻的圖像，這在視覺上不是優(yōu)選的。這樣，對于符號判斷單元或者對符號或者對圖像頻繁改變判斷的情況，根據(jù)矩形確定為符號的安排和頻率，所有的對象確定為矩形符號或矩形圖像。
在符號判斷處理中，當區(qū)域確定為符號時，程序控制前進到步驟S6004。并當區(qū)域確定不是符號時，程序控制轉(zhuǎn)換到步驟S6005。
(單一顏色判斷)在步驟S6005執(zhí)行單一顏色判斷處理。
這里處理的區(qū)域，是符號區(qū)域檢測器確定為符號，但在符號判斷處理中確定不是符號的區(qū)域。如上所述，無論區(qū)域是否為符號，對單一顏色代表的區(qū)域最好執(zhí)行單一顏色處理，并且對結(jié)果執(zhí)行MMR壓縮，從而得到更高的圖像質(zhì)量和更高的壓縮比。這樣，執(zhí)行處理來確定區(qū)域是否是單一顏色。
作為特定的例子，對于彩色圖像的象素GRB電平得到直方圖，其中彩色圖像的象素相應(yīng)于二值化圖像的黑色部分，并且當直方圖所有的分布值等于或大于閾值時，確定區(qū)域為單一顏色。
當區(qū)域為單一顏色時，程序控制前進到步驟S6006，用于顏色選取，并當區(qū)域由多種顏色代表時，處理結(jié)束。
(一種顏色選取處理)當參考圖36的流程圖時，解釋在步驟S6006的一種顏色選取處理。
在步驟S4202，在掃描處理中，顏色從背景轉(zhuǎn)換到符號部分的部分中，當黑色對象的數(shù)量減少時，對于二值化圖像newbi執(zhí)行淡化處理，其中二值化圖像被符號坐標參考，并且建立新的二值化圖像。在步驟S4203，從最初圖像的RGB值得到直方圖，其中最初圖像符合圖像newbi的黑色象素(可以準備用于另一種顏色空間，如YUV空間的直方圖)。在步驟S4204，得到用于RGB的代表值，并且在這種情況下，可以采用最大值?；蛘撸梢圆捎昧硪环N方法，這種方法通過使用粗糙直方圖得到最大值，其中使用減少的步數(shù)準備粗糙直方圖，并且采用具體直方圖得到最大值，其中具體直方圖在粗糙直方圖中出現(xiàn)。
使用這種方法，可以從圖37顯示的直方圖中得到真實代表值4301，而不被噪聲4302干擾。具體解釋將參考圖37給出?？梢詮睦绨吮忍匚坏腞數(shù)據(jù)中，得到圖37中的256級具體直方圖。由于最大值為1302，這不是真實代表值，直方圖除以64而分成彼此重疊的八段，并且這八段使用256級的直方圖再次計算。顯示了得到的段0到段8；然而，段0和段8每段只具有32級。通過再次計算，發(fā)現(xiàn)代表值出現(xiàn)在段6中，并且搜索段6來得到最大值4301。對于所有的符號坐標重復上面的處理，并且對于每個符號坐標計算一個代表顏色。
(顏色減少處理)在步驟S6004，對于符號執(zhí)行顏色減少處理。
在顏色減少單元4082執(zhí)行的處理中，即使單一顏色代表最初文件，也在掃描中出現(xiàn)顏色從背景轉(zhuǎn)換到符號部分的部分。
圖46和49是顯示掃描促使的顏色轉(zhuǎn)換的的圖。在圖46中，為了簡化解釋，除了RGB，只采用了R。在電平R＝(32，32，32)，符號A最初被單一顏色代表。然而，當符號A被掃描儀讀取時，用于這個符號的數(shù)據(jù)被發(fā)布，如放大的象素所指示的。只有三個象素6201、6202和6203到達靠近最初電平R＝(32，32，32)的黑色，并且其它象素定比特位在背景顏色(在這種情況下為白色)與電平R＝(32，32，32)之間，使符號被作為轉(zhuǎn)換部分的灰度代表。圖49是顯示狀態(tài)的圖，其中通過使用圖46中符號A象素電平的三維直方圖，使顏色轉(zhuǎn)換。假設(shè)背景顏色是白色6501，而符號顏色是黑色6502，并且部分5603是轉(zhuǎn)換部分。
由于掃描單一顏色最初代表的符號部分，沒有必要代表組成方差的轉(zhuǎn)換部分。當可以只使用代表顏色表示轉(zhuǎn)換部分時，會得到高的圖像質(zhì)量，并且所需數(shù)據(jù)的量減少。然而，即使對二值化圖像執(zhí)行淡化過程，也難于從背景中完全去除符號區(qū)域的轉(zhuǎn)換部分顏色。由此，通過使用一個符號區(qū)域被單一顏色表示的事實，采用符號切割信息而將顏色限制在每個符號一種，從而導致符號質(zhì)量和壓縮比的提高是客觀的。應(yīng)該注意，當由灰度最初表示的符號在高的圖像質(zhì)量下被壓縮時，只需要執(zhí)行一個附加的例外過程，如確定符號是否由多種顏色代表。也就是，當使用符號切割信息，將一個符號限制為一種顏色時，由于符號圖像的掃描，能夠去除作為方差的轉(zhuǎn)換部分，其中符號圖像由單一顏色最初代表。
當參考圖44的流程圖時，具體描述顏色減少單元執(zhí)行的處理。
在步驟S6102，對于二值化圖像執(zhí)行淡化過程，其中二值化圖像被符號坐標參考，并且相應(yīng)于轉(zhuǎn)換部分的黑色部分數(shù)被減少，在轉(zhuǎn)換部分，顏色在掃描中從背景轉(zhuǎn)換到符號部分，并且準備新圖像“thinimage”。由于二值化圖像“thinimage”用于步驟S6110的處理，通過具有二值化值255(黑色)和0(白色)的八字節(jié)，組成這個圖像。在步驟S6103，對最初圖像的RGB顏色，得到三維直方圖，其中最初圖像符合“thinimage”的黑色象素。這時，例如當輸入圖像每個具有八字節(jié)的RGB顏色時，通常需要256*256*256的直方圖。當考慮圖像部分所必需的不是灰度級而是分辨率時，并且考慮當通過掃描儀執(zhí)行的讀取中方差減小時，象素值的小差異將被忽略，來計算代表顏色時，并不實際需要很多這樣等級的直方圖。由此，在這個例子中，得到上五比特位的RGB三維直方圖。為了得到直方圖，還計算符號區(qū)域中出現(xiàn)的黑色象素總數(shù)blacknum。
在這個實施例中，采用RGB空間，然而，也可以采用其它顏色空間，如Lab和YUV。進一步，采用三維直方圖；然而，可以對各自的顏色采用三個一維直方圖。
在步驟S6104，執(zhí)行初始過程，其中在區(qū)域中代表的符號顏色數(shù)colnum被復比特位，或者被處理的象素數(shù)okpixel被復比特位。而在步驟S6105計算代表值。在這種情況下，包括目標直方圖的七個直方圖的總值到達最大值的點，被采用作為代表值(七個直方圖目標點，R維上的兩個臨近點，G維上的兩個臨近點，B維上的兩個臨近點(見圖39))。這樣得到的最大值替換到Color[colnum]、colG[colnum]和colB[colnum]中。
確定被轉(zhuǎn)換成代表值的顏色范圍，在范圍中，代表值作為中心。
固定代表值來得到三個一維直方圖。圖47是顯示得到的三個一維直方圖的圖。例如，當代表值為(Color[26]、colG[30]和colB[22])時，得到一維直方圖R(＝所有直方圖沿線6301突起)，其中三維直方圖G和B固定在30和22；得到一維直方圖G(＝所有直方圖沿線6302突起)，其中三維直方圖R和B固定在26和22；并得到一維直方圖B(＝所有直方圖沿線6303突起)，其中三維直方圖R和G固定在26和30。例如，一維直方圖R具有圖48顯示的形狀，并且從中檢測點6401和6402，并且確定“R range”，其中這些點用作代表值。用于對圖像確定二值化閾值的方法被采用，來檢測點6401和6402。例如，當點6403是代表值時，包括0到代表值的直方圖被替換到二值化閾值確定函數(shù)中而得到點6401，并且從包括代表值的直方圖，在圖48中的步驟S31轉(zhuǎn)換而成的直方圖，被替換到二值化閾值確定函數(shù)中，而得到點6402。
對R、G和B確定顏色范圍，并且替換到fg_range[colnum]中。
在步驟S6106，fg_range[colnum]中三維直方圖所有的值被設(shè)置為0。這時，設(shè)置為0的象素數(shù)加到代表處理的象素數(shù)okpixel上。
在步驟S6107，執(zhí)行大致的顏色判斷。對于已經(jīng)出現(xiàn)的所有顏色執(zhí)行這個處理。當發(fā)現(xiàn)大致的顏色時，跳出處理循環(huán)。如對符號切割所解釋的，在通過掃描儀得到的圖像中，灰度顏色發(fā)生在背景顏色與符號顏色之間。換句話說，如圖49所示，彩色象素(6503)出現(xiàn)在背景顏色(6501)與符號顏色之間(6502)。通過參考二值化圖像，接近背景顏色的線6504的顏色，不加到三維直方圖中(通過淡化二值化圖像，線6504靠近符號顏色側(cè)定比特位)。然而，仍然出現(xiàn)灰度部分，并且在符號顏色6502被選取后，這部分的顏色將被選取。例如，當fg_color
為(32，40，40)時，趨于從fg_color[m]中選取(96，112，96)。執(zhí)行大致的顏色判斷，來確定這兩種是相同的顏色。由于在不一致的顏色空間，RGB空間中，進行這個判斷有點難，所以在Lab空間中執(zhí)行這個判斷。當對fg_color
＝(32，40，40)執(zhí)行Lab轉(zhuǎn)換時，得到(15，-4，-1)；并當對fg_color[m]＝(96，112，96)執(zhí)行Lab轉(zhuǎn)換時，得到(45，-9，-7)。
通過這個處理，能夠去除灰度部分，其中當掃描儀讀取單一顏色最初代表的符號圖像時，灰度部分作為方差發(fā)生，并且可以以高壓縮比來壓縮高質(zhì)量圖像。
實際上，應(yīng)該檢測背景顏色，并且沿著背景顏色的延伸線出現(xiàn)的顏色，和fg_color
，應(yīng)該被確定為大致的顏色。然而在這個事實中，假設(shè)背景中包括很多白色部分，并且當Lab空間中“ab”的距離等于或小于閾值時，相關(guān)的顏色確定為大致的顏色。確定結(jié)果保持在kinji[]矩陣中，kinji[]中具有相同數(shù)的顏色代表大致的顏色。
下面顯示了一個例子，其中kinji
和kinji[3]都是0。也就是，kinji
和kinji[3]確定為大致的顏色。
fg_color
＝(32，40，40)kinji
＝0fg_color[1]＝(248，64，48)kinji[1]＝1fg_color[2]＝(48，256，32)kinji[2]＝2fg_color[3]＝(96，112，96)kinji[3]＝0在步驟S6018，colnum遞增。
在步驟S6019，執(zhí)行檢測，來確定黑色象素數(shù)是否超過75％(“75”只是個例子)，其中已經(jīng)完成了顏色選取。
也就是，執(zhí)行檢測，來確定是否滿足okpixel*75＞blacknum*100。
如果黑色象素數(shù)已經(jīng)超過75％，程序控制前進到步驟S6110。如果黑色象素數(shù)還沒有超過75％，程序控制轉(zhuǎn)移到步驟S6113。
在步驟S6110，在“thinimage”中形成調(diào)色板圖像。特別地，參考彩色圖像的象素RGB電平，其中“thinimage”的值符合象素255(指示顏色分配還沒有被執(zhí)行)，并當RGB數(shù)據(jù)出現(xiàn)在fg_color[m]中時，kinji[m]+1的值(值1)被替換到“thinimage”符合的象素值中。在這種情況下，除了kinji[m]，替換kinji[m]+1，因為0值是代表非符號部分的特殊數(shù)(背景部分)，當kinji[m]為0時不能被替換。
在步驟S6110，當在“thinimage”中形成調(diào)色板圖像時，在步驟S6111，從調(diào)色板圖像中，通過使用符號切割信息，對每個符號準備顏色信息charpal。
對每個符號切割單元準備顏色信息charpal的方法，將使用圖50中的符號圖像作為例子來描述。在符號部分“明日は晴れです，昨日は雨でした?！敝校僭O(shè)“晴れ”代表fg_color[1]選取的紅色，“雨”是fg_color[2]檢測的藍色，而其它符號是黑色。
在符號切割處理中，符號開始的“明”被處理為第一符號。假設(shè)在這個符號中出現(xiàn)的細線圖像“thinimage”的黑色象素數(shù)為100，并且100中的70個象素出現(xiàn)在fg_color
中，而20個出現(xiàn)在fg_color[3]中。由于kinji
和kinji[3]都是0(大致的顏色)，在步驟S6110，值1分配給90個象素。這時，當一個數(shù)占據(jù)存在黑色象素的最大值時，那種顏色被分配。在這個例子中，保留十個還沒有分配顏色的象素，即使檢測到這些象素的顏色，顏色的總數(shù)也不超過90。這樣，用于“明”的顏色信息charpal
被確定為1。
以這種方式，從三個charpal，0到2中選擇分配給每個符號切割部分的顏色。結(jié)果，作為顏色信息charpal，對“晴”的左側(cè)偏旁“日”和右側(cè)偏旁“青”及“れ”，kinji[1]+1＝2指示分配紅色；對“雨”kinji[2]+1＝3指示分配藍色；而對其余的符號，kinji
+1＝1指示分配黑色。
當不同值不一致地出現(xiàn)在多個kinji[]中時，符號趨于被多種顏色代表。然而，這個確定限制于大致的顏色判斷處理優(yōu)選作用時的那些情況。這樣，當包括這個函數(shù)時，推薦Lab空間中大致的顏色判斷處理的性能。
在這個例子中，由于對所有存在的二十個符號分配顏色信息charpal，這個狀態(tài)與步驟S6113用于跳出符號顏色選取循環(huán)的條件匹配，并且程序控制跳到步驟S6114。然而，在步驟S6112，當只對20個符號中的18個分配顏色信息時，只對于這些charpal沒有準備的符號，再次得到三維直方圖，并且程序控制返回到步驟S6105。這時，charpal沒有準備的淡化符號的黑色象素數(shù)，被替換到blacknum中，并且“okpixel”被復比特位。然后，在上面的例子中，由于顏色選取到fg_color[3]完成，所以執(zhí)行以fg_color[4]開始的選取。
這時，為了增加處理速度，在步驟S6112再次獲得三維直方圖可以只被執(zhí)行一次，并且在步驟S6110和步驟S6111的處理可以只被限制為兩次重復。試驗顯示了這足以得到滿意的圖像質(zhì)量。
在上面的限制下，當程序控制跳出步驟S6113的循環(huán)時，仍然可以有符號，其中charpal還沒有被處理。由此，在步驟S6114，當符號nokorichar等于或大于一時，其中charpal還沒有被處理，顏色信息被強制分配給未處理的charpal。特別地，在步驟S6111的分配過程中，當考慮“thinimage”的象素255后續(xù)的趨勢時(即顏色選取還沒有被處理的象素)，即使得到最大值，顏色信息也替換到charpal中。然而，在步驟S6114，忽略“thinimage”的象素255，并且使用0(背景)以外象素的最大值，來確定charpal的值。由于存在這樣的情況，0(背景)以外的象素都是255(即使對一個象素也不執(zhí)行顏色選取)，對定比特位在附近的象素，charpal的顏色被替換到charpal中。例如，當圖50中的“す”相應(yīng)于這種情況得條件時，附近定比特位的“で”的charpal被替換進來。
這時，得到數(shù)字值“colnum”，作為已經(jīng)被選取的顏色數(shù)。然而，由于這個值包括大致的顏色，并且還可以包括沒有使用的顏色，即使它被選取，值colnum也不同于實際使用的顏色數(shù)(usecolnum)。這樣，在步驟S6115，檢查charpal來計算實際使用的顏色數(shù)。
在步驟S6116，當在步驟S6115計算的“usecolnum”等于或大于16時，包括背景(0)的17種顏色出現(xiàn)，并且不能被四比特位代表。這樣，程序控制前進到步驟S6117，用于這個區(qū)域的顏色減少處理被放棄，并且返回DOJPEG(區(qū)域被代表為背景圖像)。應(yīng)該注意，當允許使用八比特位而不是四比特位時，usecolnum不是16而是256。
當usecolnum是一時，程序控制轉(zhuǎn)換到步驟S6118，并且對使用準備一種顏色的調(diào)色板。在步驟S6119，輸入二值化圖像被編入，并且在步驟S6120返回DOMMR。
當usecolnum等于或大于二并小于16時，程序控制轉(zhuǎn)換到步驟S6121，使用顏色的調(diào)色板被準備，并且在步驟S6122，建立調(diào)色板圖像。在這個例子中，當usecolnum是二或三時，建立調(diào)色板，其中對每個象素使用兩比特位來代表。在步驟S6123，返回DOZIP。
當這樣得到的顏色減少圖像3109具有一比特位時(返回MMR作為符號顏色選取的結(jié)果)，MMR壓縮單元3110對圖像3109執(zhí)行MMR壓縮，并準備壓縮碼Y。當顏色減少圖像3109具有兩比特位或更多比特位時(返回DOZIP作為符號顏色選取的結(jié)果)，ZIP單元3111壓縮圖像3109，并準備壓縮碼Z。當返回DOJPEG時，圖像3109不傳輸?shù)組MR壓縮單元3110或ZIP壓縮單元3111，其中不出現(xiàn)減少顏色的圖像，并且命令傳輸?shù)姆柌糠稚仙珕卧?105，而不將圖像作為符號區(qū)域?qū)Υ?br> 符號上色處理當參考圖34A到34C和35時，將描述通過符號部分上色單元3104執(zhí)行的處理。圖35是流程圖，顯示了符號部分上色處理。
作為一個例子，假設(shè)采用圖34A中顯示的圖像用作最初圖像，其中灰度圖像用作背景，而藍色符號ABC實質(zhì)畫在中心，并且假設(shè)從最初圖像中得到圖34B顯示的一個符號區(qū)域的二值化圖像。在符號部分上色處理中，首先在步驟S4101，整個圖像被分成32×32的區(qū)域(此后被稱作部分)，并且對于每部分執(zhí)行處理。在這個處理中得到的狀態(tài)顯示在圖34C中。為了簡化解釋，顯示了5×5的部分，并且在部分上左側(cè)的數(shù)指示了部分數(shù)。部分數(shù)不限制于這里使用的數(shù)，并且圖像可以分成不同數(shù)的部分。
在步驟S4102，執(zhí)行檢測來確定部分是否還沒有被處理，在步驟S4113，執(zhí)行判斷來確定符號部分上色的目標區(qū)域是否出現(xiàn)在那部分中。符號顏色選取單元3108已經(jīng)返回DOJPEG的區(qū)域，不被認為是符號部分上色目標，即使符號區(qū)域檢測器3104確定那個區(qū)域是符號區(qū)域，也是如此。
在圖34的例子中，在步驟S4103確定，在部分00到04、10、14、20、24和30到35中，沒有符號部分上色目標區(qū)域，并且對它們不執(zhí)行任何處理，而處理下一部分。對于符號部分上色目標區(qū)域出現(xiàn)的部分(例如部分1)，在步驟S4104，通過參考相應(yīng)的二值化圖像，對于彩色圖像的RGB值(或YUV值)計算平均值ave_color，其中彩色圖像符合二值化圖像的白色部分。然而，在步驟S4105，相應(yīng)的二值化圖像被參考，并且相應(yīng)黑色象素的象素密度數(shù)據(jù)被確定為ave_color。對于符號上色目標區(qū)域出現(xiàn)的部分，重復上述處理。結(jié)果，在符號出現(xiàn)的部分，可以嵌入周邊象素的平均值。
得到的圖像通過減少單元3106減少。在這個實施例中，采用簡單的淡化過程用于尺寸減小。減少處理和符號部分上色處理可以反向地執(zhí)行。在這種情況下，考慮二值化圖像與彩色圖像之間的比特位置轉(zhuǎn)換。
進一步，如果必要，通過收集符號區(qū)域坐標3112、調(diào)色板3114、壓縮碼X3113、壓縮碼Y3115和壓縮碼Z3116來準備格式。用于收集這五個的例子格式是Adobe(商標)的PDF。Adobe的PDF是通過應(yīng)用“Acrobat Reader(商標)”顯示的格式，它由Adobe免費發(fā)布，并且可以避免這樣的問題，即接收側(cè)不具有應(yīng)用來準備文件，這樣就不能打開文件。另一個例子格式是XML。XML是通過網(wǎng)絡(luò)進行文件或數(shù)據(jù)的交換或發(fā)布的描述語言。
展開處理圖26是顯示展開處理所需的安排的圖。
JPEG展開單元3201對接收的壓縮碼X3113執(zhí)行JPEG展開，并準備多值圖像E。放大單元3202接收多值圖像E，并且放大它而得到多值圖像F3203。MMR展開單元3204接收壓縮碼Y3115，并準備二值化圖像G3205。IP展開單元3206接收壓縮碼Z3116，并且建立多種顏色圖像H3207。圖像連接單元3208接收符號區(qū)域坐標3112，和相應(yīng)的調(diào)色板3114及二值化圖像G3205或多種顏色圖像H3207；當二值化圖像或多種顏色圖像的圖像數(shù)據(jù)代表透明性時，選擇圖像F3203的象素顏色，或在其它情況下選擇相應(yīng)的調(diào)色板顏色；并且建立最終圖像I3209。
圖38A到38C是顯示連接單元3208得到的結(jié)果的圖。首先，在圖38A中顯示通過JPEG展開單元得到的壓縮碼C。對于這個處理，采用圖34中的圖像；然而，當采用用于JPEG壓縮的量化不可逆方法時，得到數(shù)據(jù)，其象素值與從圖34C中得到的稍許不同。與符號部分展開前，最初圖像被JPEG不可逆壓縮方法壓縮的情況相比，當采用相同的量化表時，象素值中的改變小。換句話說，得到高質(zhì)量的圖像。在這個實施例中，通過MMR壓縮得到的二值化圖像，用作執(zhí)行連接處理的符號區(qū)域。通過展開得到的二值化圖像顯示在圖38B中。假設(shè)用于這個圖像的調(diào)色板為R＝20，G＝30和B＝225。通過參考圖38B中的二值化圖像，調(diào)色板顏色(20，30，225)數(shù)據(jù)放置在圖像38A相應(yīng)于黑色象素的圖像部分上，并且最后，得到圖38C中顯示的圖像。對于多種顏色圖像，調(diào)色板數(shù)改變。例如，對于兩比特位，對四個象素值00、01、10、11分配的調(diào)色板被應(yīng)用。一個象素代表透明性，而例如，當它為00時，對于這個象素選擇圖38A中的象素。
對于象素值01，應(yīng)用調(diào)色板值01；對于象素值10，應(yīng)用調(diào)色板值10；而對于象素值11，放置調(diào)色板值11。結(jié)果，得到展開的圖像3209。
<修正方案>
在上面的實施例中，通過使用完全表面單一閾值，建立二值化圖像。然而，可以采用另一個閾值；例如，對于符號區(qū)域檢測器3104檢測的每個符號區(qū)域，可以計算優(yōu)化的閾值，并且可以建立二值化圖像。在這種情況下，不需要圖43中的步驟S4001的再次二值化處理確定處理。
進一步，相同的二值化圖像已經(jīng)被符號部分上色單元3105和符號顏色選取單元3108使用；然而，相同的二值化圖像不總需要被使用，并且對于單元3105和3108，可以內(nèi)部地提供優(yōu)化二值化單元。
而且，在上面的實施例中，當不能處理在具有低亮度的背景上，具有高亮度的符號時，可以通過使用例如圖40中的安排執(zhí)行這個處理。對于具有目標象素作為中心的象素，差分處理單元4702執(zhí)行圖41A和圖41B顯示的差分濾波，并且以這樣的方式使象素二值化，即當象素值的絕對值超過閾值時，象素被確定為黑色，并當絕對值不超過閾值時，象素被確定為白色。在圖41A中顯示了第一差分濾波器?？梢酝ㄟ^上部檢測電平線，而可以通過下部檢測垂直線，并且可以通過使用兩個濾波器的總絕對值檢測斜線。進一步，還可以采用斜線濾波器。處理所有方向的第二差分濾波器顯示在圖41B中。還可以對電平檢測和垂直檢測準備第二差分濾波器。這個濾波器對所有的象素定比特位，并且建立差分圖像4702。這時，當?shù)笏貢r執(zhí)行濾波，分辨率可以同時減小。對于這樣得到的二值化圖像，當在圖27中的步驟S3303開始的處理被執(zhí)行時，包括變換的符號的符號區(qū)域坐標，也可以被檢測到。還為了選取轉(zhuǎn)換的符號作為符號區(qū)域，二值化單元4703必須對付這個處理。當選取轉(zhuǎn)換的符號作為符號區(qū)域時，主要在圖42中接收圖樣，而在上面的實施例中假設(shè)只有圖33中的圖樣被接收。圖42B中的情況是用于轉(zhuǎn)換的符號的，而圖42C中的情況是兩種顏色的符號，即黑色符號和白色符號，出現(xiàn)在相同的灰色背景中的情況，當考慮這三個圖樣時，二值化單元4703只需要檢測點A和B，并執(zhí)行二值化處理，使夾在點A與B之間的區(qū)域為白色，而其它區(qū)域為黑色?；蛘撸豢紤]圖42C中的情況，只有一個閾值需要被檢測到，其中沿著閾值背景與符號部分被分離，并且對于轉(zhuǎn)換的圖樣，可以執(zhí)行圖樣轉(zhuǎn)換。當轉(zhuǎn)換的符號區(qū)域可以以這種方式處理時，轉(zhuǎn)換的符號區(qū)域可以通過符號部分上色處理而平滑，其中轉(zhuǎn)換的符號保持在第四實施例的JPEG壓縮圖像中。結(jié)果，壓縮效率提高，并且轉(zhuǎn)換的符號部分可以被壓縮，而不會使分辨率減小，或因為蚊子噪聲而產(chǎn)生的退化。
還可以對于多個裝置(例如主計算機、接口設(shè)備、讀取器或打印機)組成的系統(tǒng)，或?qū)σ粋€裝置(例如復印機或傳真機)采用本發(fā)明。
進一步，還可以通過對系統(tǒng)或裝置(CPU或MPU)提供存儲介質(zhì)(或記錄介質(zhì))，其上記錄有實現(xiàn)本實施例功能的軟件程序碼，并且通過允許系統(tǒng)或裝置讀取并執(zhí)行記錄的程序碼，來實現(xiàn)本發(fā)明的目的。在這種情況下，從存儲介質(zhì)上讀取的程序碼，提供上述實施例的功能，并且其上記錄有程序碼的存儲介質(zhì)組成本發(fā)明。而且，通過本發(fā)明，不僅通過計算機執(zhí)行程序碼來提供前面實施例的功能，而且程序碼可以與計算機上運行的操作系統(tǒng)(OS)相互作用，或與其它軟件應(yīng)用相互作用，來提供上面實施例中描述的功能。
更進一步，通過本發(fā)明，從存儲介質(zhì)讀取的程序碼，可以寫入內(nèi)存中，其中內(nèi)存安裝在插入計算機的功能擴展板上，或者寫入連接到計算機的功能擴展單元上，并且與程序碼的指令相一致，安裝在功能擴展板或功能擴展單元上的CPU，可以執(zhí)行所需的部分或全部實際處理，來實現(xiàn)上述實施例的功能。
當對上面的存儲介質(zhì)應(yīng)用本發(fā)明時，相應(yīng)于上述流程圖(圖43和/或圖44及45)的程序碼存儲在存儲介質(zhì)上。
根據(jù)本發(fā)明，由于對于每個符號切割單元分配一種顏色，符號可以由多種顏色有效地代表，并當這種方法用于壓縮系統(tǒng)時，可以以高壓縮比執(zhí)行高質(zhì)量的圖像壓縮。
權(quán)利要求
1.一種圖像處理裝置，用于為每個符號切割單元分配顏色，包括二值化裝置，用于使彩色圖像數(shù)據(jù)二值化；檢測裝置，用于檢測所述彩色圖像數(shù)據(jù)中的符號區(qū)域；顏色減少裝置，用于從形成所述符號區(qū)域的N種顏色中，得到M種顏色，其中M等于或小于N；以及顏色分配裝置，用于為每個符號切割單元分配所述M種顏色中的一種。
2.一種圖像處理方法，用于為每個符號切割單元分配顏色，包括二值化步驟，用于使彩色圖像數(shù)據(jù)二值化；檢測步驟，用于檢測所述彩色圖像數(shù)據(jù)中的符號區(qū)域；顏色減少步驟，用于從形成所述符號區(qū)域的N種顏色中，得到M種顏色，其中M等于或小于N；以及顏色分配步驟，用于為每個符號切割單元分配所述M種顏色中的一種。
全文摘要
本發(fā)明涉及一種圖像處理裝置，用于為每個符號切割單元分配顏色，包括二值化裝置，用于使彩色圖像數(shù)據(jù)二值化；檢測裝置，用于檢測所述彩色圖像數(shù)據(jù)中的符號區(qū)域；顏色減少裝置，用于從形成所述符號區(qū)域的N種顏色中，得到M種顏色，其中M等于或小于N；以及顏色分配裝置，用于為每個符號切割單元分配所述M種顏色中的一種。
文檔編號H04N1/403GK1658650SQ20051005426
公開日2005年8月24日申請日期2001年7月12日優(yōu)先權(quán)日2000年7月12日
發(fā)明者戶田雨加利申請人:佳能株式會社

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：戶田雨加利
技術(shù)所有人：佳能株式會社
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動信號時頻分析理論與測試系統(tǒng)設(shè)計 2.汽車檢測系統(tǒng)設(shè)計 3.汽車電子控制系統(tǒng)設(shè)計
4、畢老師：機構(gòu)動力學與控制
5、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>