国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      圖像處理裝置、圖像處理方法、圖像處理程序和記錄介質(zhì)的制作方法

      文檔序號(hào):6637163閱讀:288來(lái)源:國(guó)知局
      專利名稱:圖像處理裝置、圖像處理方法、圖像處理程序和記錄介質(zhì)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種處理和識(shí)別數(shù)字文檔圖像的方法,以提高圖像質(zhì)量,用于輸出圖像到打印機(jī)或在顯示裝置上顯示圖像。打印文檔的數(shù)字圖像通過(guò)諸如掃描儀等的成像設(shè)備輸入。本發(fā)明也涉及一種程序,該程序用于使計(jì)算機(jī)執(zhí)行文檔成像操作以進(jìn)行圖像處理,以及使計(jì)算機(jī)執(zhí)行用于文檔圖像處理和識(shí)別的方法。本發(fā)明進(jìn)一步提供一種通過(guò)所述方法進(jìn)行文檔圖像處理的裝置,以及一種記錄所述程序的計(jì)算機(jī)可讀記錄介質(zhì)。
      背景技術(shù)
      由于彩色掃描儀和數(shù)碼相機(jī)已經(jīng)廣泛傳播,打印的彩色文檔常用作被累積、輸出和重復(fù)使用的輸入信息。而且,輸入圖像數(shù)據(jù)通過(guò)網(wǎng)絡(luò)被傳送到遠(yuǎn)方。當(dāng)數(shù)字彩色文檔圖像數(shù)據(jù)沒有經(jīng)過(guò)圖像處理就照原樣被顯示或打印,或者經(jīng)過(guò)OCR(光學(xué)字符閱讀器)等通過(guò)光學(xué)讀取和識(shí)別顯示圖像中的字符的設(shè)備處理時(shí),經(jīng)??梢杂^察到下面的現(xiàn)象。
      字符和背景之間的對(duì)比度低。
      本來(lái)是白色的背景卻被著色。
      由于透視(see-through)圖像或噪聲,背景被污染。
      像素之間的相互干擾產(chǎn)生一種導(dǎo)致均勻條紋圖案的莫爾現(xiàn)象。
      由于分辨率低,所以小印字體的清晰度低,即使用OCR處理后識(shí)別的精確度也很低。
      為了解決這些問(wèn)題,必須要進(jìn)行一種圖像加強(qiáng)重操作,該操作適用于彩色文檔圖像數(shù)據(jù)。已經(jīng)被揭示的作為解決方案的文本圖像加重方法可以被分為下面四種如對(duì)比度加強(qiáng)的色調(diào)校正,過(guò)濾,基于模型的圖像復(fù)原和提高分辨率。
      可以進(jìn)行色調(diào)校正以從背景上去除顏色,以及在圖像數(shù)據(jù)中加重對(duì)比度(例如,可以參見專利文獻(xiàn)1,和非專利文獻(xiàn)1和2)。至于過(guò)濾,已經(jīng)揭示了利用形態(tài)學(xué)(morphology)從二進(jìn)制圖像數(shù)據(jù)或灰度圖像數(shù)據(jù)中提取特征的噪聲去除方法(例如,可以參見非專利文獻(xiàn)3和4)。作為過(guò)濾方法的另一個(gè)例子,使用二次過(guò)濾器而不模糊細(xì)節(jié)的去除噪聲的方法已經(jīng)被揭示(例如,參見非專利文獻(xiàn)5)。
      莫爾現(xiàn)象的原因是在圖像數(shù)據(jù)中表現(xiàn)為點(diǎn)圖案的中間色(halftone color)部分。但是,可以通過(guò)把中間色部分轉(zhuǎn)換成連續(xù)的色調(diào)表現(xiàn)來(lái)避免莫爾現(xiàn)象(例如,參見專利文獻(xiàn)2)。采用基于模型的圖像復(fù)原的方法也很有效,如通過(guò)對(duì)OCR識(shí)別錯(cuò)誤的原因進(jìn)行聚類分析(cluster analysis)并且把這些原因分類成模型來(lái)復(fù)原圖像的方法(例如,參見非專利文獻(xiàn)6)。
      為了增加字符的清晰度和OCR的精度,提高低分辨率字符圖像數(shù)據(jù)的分辨率是有效的。為了實(shí)現(xiàn)該目的,揭示了下面的方法通過(guò)聚類(clustering)來(lái)均化字符位圖(用彩色點(diǎn)的陣列來(lái)表示每個(gè)圖像的數(shù)據(jù))以產(chǎn)生所需要分辨率的輪廓的方法(例如,參見專利文獻(xiàn)3和非專利文獻(xiàn)7);根據(jù)分布的二相性,平滑度和亮度這三個(gè)標(biāo)準(zhǔn)形成的評(píng)價(jià)函數(shù),通過(guò)把數(shù)據(jù)用公式表示為一個(gè)反問(wèn)題并根據(jù)所述評(píng)價(jià)函數(shù)來(lái)復(fù)原最佳分辨率圖像數(shù)據(jù)的方法(例如,參見非專利文獻(xiàn)8和9);和通過(guò)插值提高分辨率和對(duì)數(shù)據(jù)二值化的方法(例如,參見專利文獻(xiàn)4到7和非專利文獻(xiàn)10和11)。通過(guò)進(jìn)行上述種種對(duì)彩色文檔圖像數(shù)據(jù)的處理,可以產(chǎn)生用于各種用途,如顯示、打印和OCR等的最佳圖像數(shù)據(jù)。
      最近,除了產(chǎn)生適用于OCR的二值圖像數(shù)據(jù)和適用于打印的光柵圖像數(shù)據(jù),還出現(xiàn)了數(shù)字化圖像的各種新用途。例如,已經(jīng)揭示了以下的技術(shù)一種基于“混合光柵容量模型(Mixed Raster Content Model)”表示圖像數(shù)據(jù)的新穎圖像數(shù)據(jù)文件表現(xiàn)技術(shù),該“混合光柵容量模型”將圖像數(shù)據(jù)分成背景(減小到低分辨率),諸如字符等的前景(具有原始的分辨率或更高的分辨率),和前景的色彩(如字符調(diào)色板);一種重新排列和重新組合從掃描圖像數(shù)據(jù)中獲得的字符和圖片的構(gòu)成元素以將它們變成適用于用HTML在屏幕上瀏覽的格式的技術(shù)(例如,參見非專利文獻(xiàn)12)。
      以下是上述參考文獻(xiàn)的列表專利文獻(xiàn)1美國(guó)專利,專利號(hào)為5524070專利文獻(xiàn)2日本公開的專利申請(qǐng),申請(qǐng)?zhí)枮?003-281526專利文獻(xiàn)3美國(guó)專利,專利號(hào)為5930393專利文獻(xiàn)4日本專利,專利號(hào)為3345350專利文獻(xiàn)5日本公開的專利申請(qǐng),申請(qǐng)?zhí)枮?-340446專利文獻(xiàn)6日本公開的專利申請(qǐng),申請(qǐng)?zhí)枮?001-118032專利文獻(xiàn)7美國(guó)專利,專利號(hào)為6347156
      非專利文獻(xiàn)1Y.C.Shin等人的“信件紙張圖像的對(duì)比度加強(qiáng)”(“ContrastEnhancement of Mail Piece Images”),美國(guó),SPIE會(huì)議論文集,1992年,1661卷,27-37頁(yè)。
      非專利文獻(xiàn)2Y.C.Shin等人的“基于窗口統(tǒng)計(jì)的信件紙張圖像的加強(qiáng)”(“Enhancement of Mail Piece Images Based on Window Statistics”),美國(guó),SPIE會(huì)議論文集,1993年,1906卷,37-48頁(yè)。
      非專利文獻(xiàn)3L. Koshinen,等人的“基于軟件形態(tài)過(guò)濾器的文本加強(qiáng)方法”(“TextEnhancement Method Based on Soft Morphological Filter”),美國(guó),SPIE會(huì)議論文集,1994年,2181卷,243-253頁(yè)。
      非專利文獻(xiàn)4J.Liang,等人的“使用二值化形態(tài)過(guò)濾器的文檔圖像復(fù)原”(“Document Image Restoration Using Binary Morphological Filters”,美國(guó),SPIE會(huì)議論文集,1996年,2660卷,274-285頁(yè)。
      非專利文獻(xiàn)5G.Ramponi等人的“用二次過(guò)濾器來(lái)加重文檔圖像”(“EnhancingDocument Images with a Quadratic Filter”),美國(guó),信號(hào)處理(Signal Processing),1993年,33卷,23-34頁(yè)。
      非專利文獻(xiàn)6M.Y.Jaisimha等人的“基于模型的對(duì)用于OCR的文檔圖像的復(fù)原”,美國(guó),SPIE會(huì)議論文集,1996年,2660卷,297-308頁(yè)。
      非專利文獻(xiàn)7J.D.Hobby等人的“通過(guò)位圖聚類和均化提高降質(zhì)的文檔圖像”(“Enhancing Degraded Document Images via Bitmap Clustering and Averaging”),德國(guó),第4次文檔分析和識(shí)別國(guó)際會(huì)議論文集(”Proceeding of 4thInternational Conference on DocumentAnalysis and Recognition”),1997年8月。
      非專利文獻(xiàn)8P.D.Thouin等人的“一種用于復(fù)原低分辨率文檔圖像的方法”(“AMethod for Restoration of Low-Resolution Document Images”),美國(guó),文檔分析和識(shí)別的國(guó)際期刊(”International Journal on Document Analysis and Recognition”),2000年,第2卷,200-210頁(yè)。
      非專利文獻(xiàn)9P.D.Thouin等人的“用于復(fù)原低分辨率文檔和文本圖像的自動(dòng)系統(tǒng)”(“Automated System for Restoration of Low-Resolution Document and Text Images”),美國(guó),電子成像期刊(”Journal of Electronic Imaging”),2001年,第10卷,第2期,535-547頁(yè)。
      非專利文獻(xiàn)10M.J.Taylor等人的“加強(qiáng)來(lái)自相機(jī)的文檔圖像”(“Enhancement ofDocument Images from Cameras”),美國(guó),SPIE會(huì)議論文集,1998年,3305期,230-241頁(yè)。
      非專利文獻(xiàn)11H.Li等人的“數(shù)碼攝像機(jī)中的文本加強(qiáng)”(“Text Enhancement inDigital Video”),美國(guó),SPIE會(huì)議論文集,1999年,3651卷,2-9頁(yè)。
      非專利文獻(xiàn)12T.Breuel等人的“PDA的紙張”(“Paper to PDA”),加拿大,16期圖案識(shí)別國(guó)際會(huì)議論文集(”International Conference on Pattern Recognition”)。
      在用戶指定的彩色文檔數(shù)據(jù)的數(shù)據(jù)格式(用途)的數(shù)量比較小的情況下,可以流水線的方式對(duì)輸入圖像數(shù)據(jù)進(jìn)行幾個(gè)操作以得到合成圖像數(shù)據(jù)。但是,當(dāng)用途變得更多樣化時(shí),就產(chǎn)生了下面的問(wèn)題1)在各用途的應(yīng)用程序中造成負(fù)擔(dān)和浪費(fèi)由于同樣的步驟被每個(gè)用途所調(diào)用,需要進(jìn)行不必要的操作。
      對(duì)于每個(gè)用途,“取消(Undo)”和“重做(Redo)”步驟所必需的中間數(shù)據(jù)需要分別管理。
      對(duì)于每個(gè)用途,操作的歷史和狀態(tài)需要分別管理。
      2)加重和系統(tǒng)的維護(hù)變得困難當(dāng)采用對(duì)于某個(gè)用途來(lái)說(shuō)能產(chǎn)生最佳圖像數(shù)據(jù)的新操作,或引入新的用途,新的文件格式,或新的圖像數(shù)據(jù)表示格式時(shí),就必須應(yīng)對(duì)各用途的單個(gè)應(yīng)用程序中的該新操作和格式。
      把文件格式或圖像表示格式與各用途關(guān)聯(lián)起來(lái)用于產(chǎn)生最佳圖像的步驟可能是錯(cuò)誤的。為了克服這個(gè)問(wèn)題,需要產(chǎn)生與文件格式或圖像表示格式的數(shù)量相同的低模塊化的應(yīng)用程序。

      發(fā)明內(nèi)容
      本發(fā)明的總的目的在于提供一種能克服上述缺點(diǎn)的圖像處理裝置,圖像處理方法,圖像處理程序和記錄介質(zhì)。
      本發(fā)明的更具體的目的在于提供一種圖像處理裝置,該裝置通過(guò)一種負(fù)擔(dān)和耗費(fèi)低的方法,對(duì)于通過(guò)掃描儀或成像裝置輸入的彩色文檔圖像數(shù)據(jù),管理和處理用于產(chǎn)生每個(gè)用途的最佳圖像的數(shù)據(jù)。這樣的圖像處理裝置也具有很好的可擴(kuò)展性,維護(hù)這樣的裝置是很容易進(jìn)行的。
      本發(fā)明的上述目的通過(guò)一種執(zhí)行面向?qū)ο蟮膱D像處理的圖像處理裝置來(lái)實(shí)現(xiàn),該裝置使用包含原始圖像對(duì)象和產(chǎn)生用戶指定形式的圖像數(shù)據(jù)的優(yōu)化對(duì)象的圖像處理對(duì)象執(zhí)行所述面向?qū)ο蟮膱D像處理,通過(guò)對(duì)包含圖像特征量、圖像要素和圖像處理功能的圖像數(shù)據(jù)進(jìn)行歸一化而產(chǎn)生所述原始圖像對(duì)象,該圖像數(shù)據(jù)處于合適圖像處理的狀態(tài),該裝置包含獲取要進(jìn)行圖像處理的圖像數(shù)據(jù)的圖像數(shù)據(jù)獲取單元;對(duì)由該圖像數(shù)據(jù)獲取單元所獲取的圖像數(shù)據(jù)進(jìn)行歸一化、以產(chǎn)生原始圖像對(duì)象的歸一化單元;和基于歸一化單元所歸一化的圖像數(shù)據(jù)、用優(yōu)化對(duì)象產(chǎn)生最佳圖像數(shù)據(jù)的優(yōu)化單元。
      用這樣的圖像處理裝置,對(duì)于從任何類型的圖像數(shù)據(jù)輸入裝置輸入的任何輸入數(shù)據(jù),可以產(chǎn)生適合用戶要求的各種用途的最佳圖像數(shù)據(jù)。
      本發(fā)明的上述目的也可以通過(guò)執(zhí)行面向?qū)ο蟮膱D像處理的圖像處理方法來(lái)實(shí)現(xiàn),該方法使用包含原始圖像對(duì)象和產(chǎn)生用戶指定形式的圖像數(shù)據(jù)的優(yōu)化對(duì)象執(zhí)行所述面向?qū)ο蟮膱D像處理,所述原始圖像對(duì)象通過(guò)對(duì)包含圖像特征量、圖像要素和圖像處理功能的圖像數(shù)據(jù)進(jìn)行歸一化而產(chǎn)生,該圖像數(shù)據(jù)處于合適圖像處理的狀態(tài),該方法包含如下步驟獲取要進(jìn)行圖像處理的圖像數(shù)據(jù)的圖像數(shù)據(jù)獲取步驟;對(duì)圖像數(shù)據(jù)獲取步驟中獲取的圖像數(shù)據(jù)進(jìn)行歸一化、以產(chǎn)生原始圖像對(duì)象的歸一化步驟;和基于歸一化步驟中歸一化的圖像數(shù)據(jù)、用優(yōu)化對(duì)象產(chǎn)生最佳圖像數(shù)據(jù)的步驟。
      通過(guò)這個(gè)方法,對(duì)于任何類型的彩色文檔圖像數(shù)據(jù),可以產(chǎn)生適合用戶要求的各種用途的最佳圖像數(shù)據(jù)。
      在上述的圖像處理方法中,最佳圖像數(shù)據(jù)產(chǎn)生步驟包括如下步驟將所述歸一化的圖像數(shù)據(jù)的背景部分共同改變?yōu)榘咨谋尘叭コ襟E;和產(chǎn)生優(yōu)化對(duì)象作為表示在所述背景去除步驟中要使用的色調(diào)校正曲線的對(duì)象的優(yōu)化對(duì)象產(chǎn)生步驟。
      通過(guò)這個(gè)方法,采用色調(diào)校正曲線,能將圖像數(shù)據(jù)的背景部分退變成白色。而且,產(chǎn)生一種對(duì)象以存儲(chǔ)和保持用于顏色去除的參數(shù)。
      在上述的圖像處理方法中,最佳圖像數(shù)據(jù)產(chǎn)生步驟包括如下步驟將所述歸一化的圖像數(shù)據(jù)的背景部分共同改變?yōu)榇眍伾谋尘扒謇聿襟E;和產(chǎn)生優(yōu)化對(duì)象作為表示在所述背景清理步驟中要使用的色調(diào)校正曲線的對(duì)象的優(yōu)化對(duì)象產(chǎn)生步驟。
      通過(guò)這種方法,采用色調(diào)校正曲線,能將圖像數(shù)據(jù)的背景部分退變成一種代表色。而且,產(chǎn)生一種對(duì)象以存儲(chǔ)和保持用于退色的參數(shù)。
      在上述的圖像處理方法中,最佳圖像數(shù)據(jù)產(chǎn)生步驟包括如下步驟從歸一化的圖像數(shù)據(jù)中提取字符的提取步驟,該字符作為具有原始分辨率或更高分辨率的二值化圖像數(shù)據(jù)被提??;和產(chǎn)生優(yōu)化對(duì)象作為表示在所述提取步驟中提取的二值化圖像數(shù)據(jù)的對(duì)象的優(yōu)化對(duì)象產(chǎn)生步驟。
      通過(guò)這種方法,圖像數(shù)據(jù)中的字符可以被提取,并可以作為原始分辨率或更高分辨率的二值化圖像數(shù)據(jù)被存儲(chǔ)和保持。
      上述的圖像處理方法中,最佳圖像數(shù)據(jù)產(chǎn)生步驟包括如下步驟對(duì)從歸一化的圖像數(shù)據(jù)中提取的每個(gè)字符的顏色進(jìn)行估計(jì)的估計(jì)步驟;和產(chǎn)生優(yōu)化對(duì)象作為表示在所述估計(jì)步驟中估計(jì)的字符顏色數(shù)據(jù)的對(duì)象的優(yōu)化對(duì)象產(chǎn)生步驟。
      通過(guò)這種方法,包含在圖像數(shù)據(jù)中的字符可以被提取,每個(gè)字符顏色數(shù)據(jù)可以被存儲(chǔ)和保持。
      上述的圖像處理方法中,優(yōu)化對(duì)象產(chǎn)生步驟包括如下步驟將字符顏色數(shù)據(jù)分類成少量的聚類(cluster),并將歸一化的圖像數(shù)據(jù)中的每個(gè)字符分配給顏色聚類中的一個(gè)聚類的分配步驟;和產(chǎn)生表示聚類特征化數(shù)據(jù)和關(guān)于每個(gè)字符的聚類分配數(shù)據(jù)的對(duì)象的對(duì)象產(chǎn)生步驟,該對(duì)象被作為形成優(yōu)化對(duì)象的對(duì)象之一而產(chǎn)生。
      通過(guò)這種方法,該存儲(chǔ)的字符顏色數(shù)據(jù)可以被分成少量的聚類,并且包含在圖像數(shù)據(jù)中的每個(gè)字符可以被分配給顏色聚類中的一個(gè)聚類。
      在上述的圖像處理方法中,在歸一化步驟中產(chǎn)生的原始圖像對(duì)象和在所述優(yōu)化對(duì)象產(chǎn)生步驟中產(chǎn)生的優(yōu)化對(duì)象都具有包含圖像特征量和圖像要素的基本數(shù)據(jù)。在該方法中,歸一化步驟和優(yōu)化對(duì)象產(chǎn)生步驟都包含如下步驟計(jì)算對(duì)基本數(shù)據(jù)要進(jìn)行圖像處理加以定義用的圖像特征量和圖像要素的計(jì)算步驟;產(chǎn)生存儲(chǔ)和保持所述計(jì)算步驟的計(jì)算結(jié)果的對(duì)象的對(duì)象產(chǎn)生步驟;管理所述對(duì)象中基本數(shù)據(jù)的設(shè)定、更新、當(dāng)前操作狀態(tài)和歷史記錄的對(duì)象管理步驟,具有指向在所述對(duì)象產(chǎn)生步驟中產(chǎn)生的對(duì)象的指針;和根據(jù)所述對(duì)象的當(dāng)前操作狀態(tài)產(chǎn)生圖像數(shù)據(jù)的圖像數(shù)據(jù)產(chǎn)生步驟,具有操作狀態(tài)數(shù)據(jù)和歷史數(shù)據(jù)。
      通過(guò)這種方法,可以用一個(gè)對(duì)象共同完成復(fù)雜功能和狀態(tài)管理。
      在上述的圖像處理方法中,圖像數(shù)據(jù)產(chǎn)生步驟包含產(chǎn)生整體部分或指定部分的光柵圖像數(shù)據(jù)的光柵圖像產(chǎn)生步驟。
      通過(guò)這種方法,對(duì)其進(jìn)行了色調(diào)校正和分辨率校正等操作的光柵圖像數(shù)據(jù)可以根據(jù)對(duì)象的狀態(tài)產(chǎn)生。
      在上述的圖像處理方法中,圖像數(shù)據(jù)產(chǎn)生步驟包含產(chǎn)生二值化圖像數(shù)據(jù)或彩色圖像數(shù)據(jù)的字符圖像產(chǎn)生步驟,該二值化圖像數(shù)據(jù)或彩色圖像數(shù)據(jù)為包含在整體部分或指定部分中的字符。
      根據(jù)這種方法,通過(guò)參考所述對(duì)象的當(dāng)前狀態(tài),特別是參考字符數(shù)據(jù)的分辨率放大倍率能輸出指定部分的字符圖像數(shù)據(jù)。
      在上述的圖像處理方法中,圖像數(shù)據(jù)產(chǎn)生步驟包含彩色字符圖像產(chǎn)生步驟,所述彩色字符圖像產(chǎn)生步驟產(chǎn)生共同地包含其顏色屬于整體部分或指定部分的指定顏色聚類的字符的圖像數(shù)據(jù)。
      通過(guò)這種方法,可以產(chǎn)生共同地包含其顏色屬于各自顏色聚類的字符的二值化圖像。
      本發(fā)明的上述目的也可以通過(guò)使計(jì)算機(jī)執(zhí)行上述任一種圖像處理方法的圖像處理程序來(lái)實(shí)現(xiàn)。
      由于這個(gè)程序是由現(xiàn)有的對(duì)象形成,所以可以應(yīng)對(duì)各種用途以及各種圖像數(shù)據(jù)輸入設(shè)備的特性。
      本發(fā)明的上述目的也可以通過(guò)記錄有上述圖像處理程序的記錄介質(zhì)來(lái)實(shí)現(xiàn)。
      用這樣的記錄介質(zhì),本發(fā)明的圖像處理可以在任何地方進(jìn)行,只要上述圖像處理裝置的組成部分已經(jīng)準(zhǔn)備好。
      根據(jù)本發(fā)明,實(shí)現(xiàn)了面向?qū)ο蟮臄?shù)據(jù)處理。因此,可以提供一種導(dǎo)致較少負(fù)擔(dān)和耗費(fèi)的圖像處理裝置。這樣的圖像處理裝置顯示了很好的可擴(kuò)展性,維護(hù)這樣的裝置也比較容易。本發(fā)明還提供了一種圖像處理方法,圖像處理程序和與上述圖像處理裝置相關(guān)的記錄介質(zhì)。
      通過(guò)結(jié)合附圖對(duì)下面的實(shí)施例的詳細(xì)描述,本發(fā)明上述的和其他的目的,特征和優(yōu)點(diǎn)將會(huì)更顯而易見。


      圖1是說(shuō)明圖像處理裝置一結(jié)構(gòu)例的框圖;圖2是圖像處理裝置的最佳圖像數(shù)據(jù)產(chǎn)生操作的流程圖;
      圖3是顯示“要素結(jié)構(gòu)(對(duì)象)表示”單元整個(gè)結(jié)構(gòu)的類分層結(jié)構(gòu)圖表;圖4顯示優(yōu)化對(duì)象一結(jié)構(gòu)例;圖5顯示了定義原始圖像對(duì)象的類的程序的例子;圖6顯示了定義字符顏色對(duì)象的類的程序的例子;圖7A顯示和原始圖像產(chǎn)生相關(guān)對(duì)象的程序的例子;圖7B顯示根據(jù)圖7A所示的源代碼所得到的圖像產(chǎn)生的結(jié)果;圖7C顯示圖7B所示的圖像產(chǎn)生結(jié)果的一部分的放大圖像;圖8A顯示和圖像中的背景清理相關(guān)的程序的例子;圖8B顯示根據(jù)圖8A所示的源代碼所得到的圖像產(chǎn)生的結(jié)果;圖8C顯示圖8B所示的圖像產(chǎn)生結(jié)果的一部分的放大圖像;圖9A顯示和圖像中的背景清理相關(guān)的程序的例子;圖9B顯示根據(jù)圖9A所示的源代碼所得到的圖像產(chǎn)生的結(jié)果;圖9C顯示圖9B所示的圖像產(chǎn)生結(jié)果的一部分的放大圖像;圖10A顯示與圖像中的字符加重和背景清理相關(guān)的程序的例子;圖10B顯示根據(jù)圖10A所示的源代碼所得到的圖像產(chǎn)生的結(jié)果;圖10C顯示圖10B所示的圖像產(chǎn)生結(jié)果的一部分的放大圖像;圖11A顯示與圖像中的字符分辨率和字符顏色相關(guān)的程序的例子;圖11B顯示根據(jù)圖11A所示的源代碼所得到的圖像產(chǎn)生的結(jié)果;圖11C顯示根據(jù)圖11A所示的源代碼所得到的圖像產(chǎn)生的另一個(gè)結(jié)果;圖12A顯示和光柵圖像產(chǎn)生相關(guān)的程序的例子;圖12B顯示根據(jù)圖12A所示的源代碼所得到的圖像產(chǎn)生的結(jié)果;圖13A顯示和圖像中的色調(diào)校正和字符相關(guān)的程序的例子;圖13B顯示根據(jù)圖13A所示的源代碼所得到的圖像產(chǎn)生的結(jié)果;圖13C顯示和圖像中的色調(diào)校正和字符相關(guān)的程序的例子;圖13D顯示根據(jù)圖13A所示的源代碼所得到的圖像產(chǎn)生的結(jié)果;圖14A顯示與圖像中的色調(diào)校正、字符和字符顏色相關(guān)的程序的例子;圖14B顯示根據(jù)圖14A所示的源代碼所得到的圖像產(chǎn)生的結(jié)果;圖14C顯示圖14B所示的圖像產(chǎn)生結(jié)果的一部分的放大圖像;
      圖15A顯示和二值化字符圖像相關(guān)的程序的例子;圖15B顯示根據(jù)圖15A所示的源代碼所得到的圖像產(chǎn)生的結(jié)果;圖16A顯示和二值化字符圖像的分辨率相關(guān)的程序的例子;圖16B顯示根據(jù)圖16A所示的源代碼所得到的圖像產(chǎn)生的結(jié)果。
      具體實(shí)施例方式
      下面參照附圖詳細(xì)描述根據(jù)本發(fā)明的圖像處理方法,圖像處理裝置,圖像處理程序和記錄介質(zhì)的較佳實(shí)施例。
      在本發(fā)明中,采用了一種使用“面向?qū)ο蟆钡某绦?。這種“面向?qū)ο蟆钡母拍罹褪前阎攸c(diǎn)放在與程序相關(guān)的變量和要被執(zhí)行的功能上,而不是程序的內(nèi)部結(jié)構(gòu)。在本發(fā)明的實(shí)施例中,當(dāng)彩色文檔圖像數(shù)據(jù)被處理時(shí),用于產(chǎn)生原始圖像數(shù)據(jù)(歸一化的圖像數(shù)據(jù))和每個(gè)用途的最佳圖像數(shù)據(jù)的“材料”、用于產(chǎn)生最佳圖像數(shù)據(jù)的傳統(tǒng)處理步驟、以及操作的歷史和狀態(tài)被統(tǒng)一地作為對(duì)象來(lái)管理。
      更具體地說(shuō),用于產(chǎn)生最佳圖像數(shù)據(jù)的“材料”包含一組定義色調(diào)校正函數(shù)的參數(shù),表示高分辨率字符的二值化圖像數(shù)據(jù),和字符顏色數(shù)據(jù)和對(duì)應(yīng)的聚類數(shù)據(jù)。操作的歷史和材料包括從一組已有的函數(shù)中選擇出來(lái)的色調(diào)校正函數(shù)的系數(shù)(index),提高分辨率的放大倍數(shù),字符顏色的聚類方法和每個(gè)操作的開/關(guān)控制。
      圖1是根據(jù)本發(fā)明實(shí)施圖像處理方法的圖像處理裝置一結(jié)構(gòu)例的框圖。在圖1中,圖像處理裝置110包含CPU111,存儲(chǔ)器112(帶有ROM1121和RAM1122),硬盤單元(以下稱“HDD”)113,可更換磁盤單元114,顯示單元115,和包含諸如鍵盤和鼠標(biāo)的指示裝置的輸入單元116,掃描單元117,網(wǎng)絡(luò)接口118,所有這些都連接到總線119。圖像處理裝置110經(jīng)通信線路100從網(wǎng)絡(luò)接口118連接到外部網(wǎng)絡(luò)。
      在該實(shí)施例中,要被處理的彩色位像數(shù)據(jù)被保存在可更換磁盤單元114中。該實(shí)施例的圖像處理程序被保存在HDD113中。當(dāng)用戶激活圖像處理程序時(shí),圖像處理程序被讀取到RAM1122中,以便啟動(dòng)圖像處理。另外,也可以在RAM1122中存儲(chǔ)通過(guò)通信線路100傳送到網(wǎng)絡(luò)接口118的圖像數(shù)據(jù),或者通過(guò)掃描單元117讀取的圖像數(shù)據(jù),以便執(zhí)行圖像處理。
      參考圖2,說(shuō)明圖1所示的圖像處理裝置110執(zhí)行最佳圖像數(shù)據(jù)產(chǎn)生操作。圖2是圖像處理裝置110要執(zhí)行的最佳圖像數(shù)據(jù)產(chǎn)生操作的流程圖。
      首先當(dāng)激活圖像處理裝置110時(shí),,存儲(chǔ)在HDD113中的圖像處理程序根據(jù)來(lái)自CPU111的指令被讀入RAM1122中(步驟S201)。然后使用輸入單元116的鍵盤或指示裝置,選擇根據(jù)需要將要優(yōu)化的彩色位像數(shù)據(jù)(步驟S202),并讀出圖像數(shù)據(jù)。
      讀取的圖像數(shù)據(jù)被存儲(chǔ)在RAM1122中,根據(jù)圖像處理程序進(jìn)行歸一化,從而產(chǎn)生原始圖像對(duì)象。執(zhí)行歸一化過(guò)程,不論輸入的圖像數(shù)據(jù)是何類型或狀態(tài)。原始圖像對(duì)象被添加到RAM1122的圖像處理程序中作為原始圖像數(shù)據(jù)(歸一化的圖像數(shù)據(jù)),該原始圖像數(shù)據(jù)是在圖像處理裝置110中產(chǎn)生最佳圖像數(shù)據(jù)的”材料”之一(步驟S203)。
      用輸入單元116的鍵盤或指示裝置來(lái)設(shè)定圖像數(shù)據(jù)的用途(要使用的圖像數(shù)據(jù)的格式)(步驟S204)。確定用于產(chǎn)生適合已選擇用途的圖像數(shù)據(jù)的優(yōu)化對(duì)象是否已經(jīng)產(chǎn)生(步驟S205)。該確定步驟是通過(guò)在預(yù)定對(duì)象中設(shè)定的方法(函數(shù))來(lái)執(zhí)行的。通過(guò)這種方法,同時(shí)執(zhí)行優(yōu)化對(duì)象產(chǎn)生后的管理。
      如果優(yōu)化對(duì)象已經(jīng)被產(chǎn)生(步驟S205中的“是”),則采用優(yōu)化對(duì)象產(chǎn)生最佳圖像數(shù)據(jù)(步驟S207)。如果適合輸入圖像數(shù)據(jù)用途的優(yōu)化對(duì)象還沒有產(chǎn)生(步驟205中的“否”),則根據(jù)圖像處理程序產(chǎn)生優(yōu)化對(duì)象。被產(chǎn)生的優(yōu)化對(duì)象被加到RAM1122中的圖像處理程序中(步驟S206)。然后,采用產(chǎn)生的優(yōu)化對(duì)象來(lái)產(chǎn)生最佳圖像數(shù)據(jù)(步驟S207),并且結(jié)束最佳圖像數(shù)據(jù)產(chǎn)生操作。
      如上述步驟S203和S206所述,被產(chǎn)生的對(duì)象被加到RAM1122中的圖像處理程序中。當(dāng)該程序完成時(shí),帶有添加的對(duì)象的圖像處理程序被存儲(chǔ)在HDD113中,并且在步驟S201中被讀取的圖像處理程序被重寫。
      (圖像處理程序中的對(duì)象的結(jié)構(gòu))下面將描述用于實(shí)現(xiàn)圖2流程圖中所示操作的“對(duì)象”。該對(duì)象是根據(jù)輸入數(shù)據(jù)(參數(shù))、執(zhí)行適合該對(duì)象內(nèi)部條件的預(yù)定功能的黑盒子。用戶根據(jù)要被執(zhí)行的功能調(diào)用現(xiàn)有的對(duì)象,然后得到被執(zhí)行的該功能。
      在沒有具有要被執(zhí)行的功能的對(duì)象時(shí),或者要執(zhí)行復(fù)雜的功能時(shí),組合兩個(gè)或兩個(gè)以上現(xiàn)有對(duì)象以產(chǎn)生單個(gè)對(duì)象。只要能維持同樣的基本功能,當(dāng)要被處理的參數(shù)發(fā)生變化或功能的數(shù)量增加時(shí),對(duì)象能很容易產(chǎn)生派生對(duì)象。
      如圖2流程圖所示操作的描述中,對(duì)通過(guò)圖像輸入裝置而被數(shù)字化的圖像數(shù)據(jù)進(jìn)行“歸一化”,以校正由于用于輸入圖像數(shù)據(jù)的圖像輸入裝置的固有特性所造成的圖像質(zhì)量的變化。
      例如,根據(jù)掃描儀的MTF(調(diào)制傳遞函數(shù)),可能會(huì)產(chǎn)生莫爾現(xiàn)象。為了避免該現(xiàn)象,應(yīng)使用申請(qǐng)?zhí)枮?003-281526的日本專利公開中揭示的歸一化操作把由點(diǎn)表示的中間色圖案轉(zhuǎn)換成連續(xù)的色調(diào)圖像。
      通過(guò)歸一化操作,輸入圖像數(shù)據(jù)被轉(zhuǎn)換成適合圖像處理的原始圖像數(shù)據(jù)。原始圖像數(shù)據(jù)由在歸一化操作中產(chǎn)生的原始圖像對(duì)象來(lái)表示。原始圖像對(duì)象也可以用一組對(duì)象來(lái)形成。
      下面,用于產(chǎn)生每個(gè)用途的最佳圖像的操作(以下稱“優(yōu)化操作”)被進(jìn)行。這里,用途可能涉及在紙張上打印,在顯示板或PDA上顯示,或搜索。根據(jù)用途,“最佳圖像”的圖像表示格式和文件格式不同。
      對(duì)于在紙張上打印,圖像數(shù)據(jù)需要用如光柵圖像或PDF等結(jié)構(gòu)化文件來(lái)表示。對(duì)于顯示,圖像數(shù)據(jù)需要以HTML的形式表示。對(duì)于搜索,圖像數(shù)據(jù)需要以經(jīng)過(guò)OCR的文本文件的形式來(lái)表示。如上所述,當(dāng)“優(yōu)化操作”被結(jié)合到用于產(chǎn)生圖像格式或文件的程序中時(shí),就可能產(chǎn)生不必要的負(fù)荷或者使加重和維護(hù)變得困難。
      為了消除這些問(wèn)題,用于產(chǎn)生原始圖像數(shù)據(jù)和最佳圖像數(shù)據(jù)的“材料”,用于產(chǎn)生最佳圖像數(shù)據(jù)的步驟,以及這些步驟的歷史和狀態(tài)被認(rèn)為是“對(duì)象”。采用“要素結(jié)構(gòu)(對(duì)象)表示”單元以便統(tǒng)一管理這些對(duì)象。“要素結(jié)構(gòu)(對(duì)象)表示”單元由類形成,該類構(gòu)成一個(gè)模板,在該模板中寫有同類對(duì)象所共有的功能以及各個(gè)對(duì)象固有的存儲(chǔ)格式。圖3是顯示“要素結(jié)構(gòu)(對(duì)象)表示”單元的整體結(jié)構(gòu)的分層結(jié)構(gòu)圖。
      在圖3所示的類分層圖中,根300是收集整個(gè)“要素結(jié)構(gòu)(對(duì)象)表示”單元的形式根,并具有空的內(nèi)部。根300具有三個(gè)基本的類圖像301,色調(diào)校正302和顏色聚類303。
      圖像301是一般的圖像對(duì)象的類,存儲(chǔ)如圖像信息(如大小和分辨率)和光柵圖像陣列等的基本數(shù)據(jù)。作為自身方法圖像301還存儲(chǔ)設(shè)定所述被存儲(chǔ)數(shù)據(jù)用的步驟。色調(diào)校正302是色調(diào)校正對(duì)象的類。顏色聚類303是字符顏色聚類對(duì)象的類。
      原始圖像304是原始圖像對(duì)象的類,該原始圖像對(duì)象表示由歸一化從成像裝置輸入的或從通信電路或數(shù)據(jù)讀取器獲得的圖像數(shù)據(jù)(即,在該實(shí)施例中為存儲(chǔ)在可更換磁盤單元114中的圖像數(shù)據(jù))而得到的圖像數(shù)據(jù)。二值化文本305是字符對(duì)象的類,文本顏色306是字符顏色對(duì)象的類。這三個(gè)類從圖像301中派生出來(lái)。
      (對(duì)象結(jié)構(gòu))采用圖3所示的從每個(gè)功能派生出來(lái)的類,形成用于每個(gè)類型的圖像處理的對(duì)象。本發(fā)明的這個(gè)實(shí)施例中的圖像處理程序中的對(duì)象包含原始圖像對(duì)象和優(yōu)化對(duì)象。原始圖像對(duì)象代表已對(duì)其進(jìn)行歸一化的原始圖像。優(yōu)化對(duì)象表示定義要對(duì)原始圖像進(jìn)行優(yōu)化處理的一組參數(shù)和數(shù)據(jù),或者表示定義對(duì)需進(jìn)行優(yōu)化操作的圖像要素要進(jìn)行處理的一組參數(shù)和數(shù)據(jù)。
      圖4顯示優(yōu)化對(duì)象一結(jié)構(gòu)例。優(yōu)化對(duì)象400包含原始圖像對(duì)象401,色調(diào)校正對(duì)象402,字符對(duì)象403,字符顏色對(duì)象404,和從字符顏色對(duì)象404中派生出來(lái)的字符顏色聚類對(duì)象405。上面已經(jīng)描述了原始圖像對(duì)象401,下面將描述其他的對(duì)象。
      色調(diào)校正對(duì)象存儲(chǔ)和保持用于定義將圖像數(shù)據(jù)的背景部分退變?yōu)榘咨摹氨尘叭コ被蛴糜诙x將背景部分退變?yōu)榇眍伾摹氨尘扒謇怼钡纳{(diào)校正的參數(shù)的對(duì)象。
      字符對(duì)象從圖像數(shù)據(jù)中提取字符、將字符作為具有原始分辨率或更高分辨率的二值化圖像數(shù)據(jù)來(lái)存儲(chǔ)和保持的對(duì)象。
      字符顏色對(duì)象從圖像數(shù)據(jù)提取字符、存儲(chǔ)和保持每個(gè)字符的顏色數(shù)據(jù)的對(duì)象。
      字符顏色聚類對(duì)象將由字符顏色對(duì)象存儲(chǔ)的字符顏色數(shù)據(jù)分成少量的聚類、并將圖像數(shù)據(jù)中每個(gè)字符分配給顏色聚類中的一個(gè)聚類的對(duì)象。
      來(lái)自對(duì)象(該對(duì)象是產(chǎn)生主對(duì)象的“輸入”)的指針(根據(jù)程序指示存儲(chǔ)區(qū)域的變量或自變量)被提供給構(gòu)成上述優(yōu)化對(duì)象的那些對(duì)象的每一個(gè)。由于按照原始圖像數(shù)據(jù)(歸一化的輸入圖像數(shù)據(jù))作為輸入產(chǎn)生色調(diào)校正對(duì)象402,字符對(duì)象403,字符顏色對(duì)象404,因而提供來(lái)自原始圖像對(duì)象401的指針。由于按照字符顏色對(duì)象404作為輸入計(jì)算字符顏色聚類對(duì)象405,因而提供來(lái)自字符顏色對(duì)象404的指針。
      (各對(duì)象的成員變量和方法)每個(gè)對(duì)象保持下列成員變量(表示類的當(dāng)前狀態(tài))和方法。
      基本數(shù)據(jù)對(duì)象的基本數(shù)據(jù)(圖像或參數(shù))。
      產(chǎn)生優(yōu)化對(duì)象的步驟計(jì)算用于定義優(yōu)化操作的參數(shù)和數(shù)據(jù)組;產(chǎn)生相應(yīng)的優(yōu)化對(duì)象,將計(jì)算結(jié)果作為優(yōu)化對(duì)象來(lái)管理。
      優(yōu)化對(duì)象的指針提供給基于對(duì)象產(chǎn)生的優(yōu)化對(duì)象的指針。
      當(dāng)前狀態(tài)的管理和設(shè)定用于設(shè)定如優(yōu)化操作的開/關(guān)狀態(tài)等的歷史和狀態(tài)的步驟和管理歷史和狀態(tài)的變量。
      根據(jù)當(dāng)前狀態(tài)提供圖像的步驟參考優(yōu)化操作的當(dāng)前狀態(tài),以提供圖像數(shù)據(jù)。
      應(yīng)該使用那些成員變量和方法,或者那些被使用的成員變量和方法的內(nèi)容在對(duì)象間變化。例如,原始圖像對(duì)象401包含下列1)到5)的成員變量和方法1)基本數(shù)據(jù)——原始圖像的光柵數(shù)據(jù),大小和分辨率2)產(chǎn)生優(yōu)化對(duì)象的步驟——產(chǎn)生色調(diào)校正對(duì)象——產(chǎn)生字符對(duì)象(以分辨率放大倍率為參數(shù))和字符顏色對(duì)象3)優(yōu)化對(duì)象的指針——色調(diào)校正對(duì)象——字符對(duì)象(用于各個(gè)分辨率放大倍率)——字符顏色對(duì)象4)設(shè)定當(dāng)前狀態(tài)的步驟,和管理該狀態(tài)的變量——色調(diào)校正模式(背景去除,背景清理,或關(guān))——用于背景去除或清理的色調(diào)校正系數(shù)(index)——字符分辨率放大倍率(在加重字符的情況下為1或更高,在不加重字符的情況下為0)5)根據(jù)當(dāng)前狀態(tài)提供圖像的步驟——產(chǎn)生光柵圖像數(shù)據(jù)參考當(dāng)前狀態(tài),產(chǎn)生已被執(zhí)行了如色調(diào)校正,分辨率校正等操作的光柵圖像數(shù)據(jù)的步驟(用于打印)。
      ——二值化/彩色字符圖像輸出參考當(dāng)前狀態(tài),特別是參考字符分辨率放大倍率,輸出指定區(qū)域的字符圖像數(shù)據(jù)的步驟(用于OCR和HTML)。
      ——產(chǎn)生屬于每個(gè)顏色聚類的字符圖像數(shù)據(jù)產(chǎn)生以屬于每個(gè)顏色聚類的顏色共同地表示字符的二值化圖像數(shù)據(jù)的步驟(用于PDF)。
      字符顏色對(duì)象404包含如下1)到4)的成員變量和方法
      1)基本數(shù)據(jù)——每個(gè)字符的顏色的光柵圖像數(shù)據(jù),大小和分辨率2)產(chǎn)生優(yōu)化對(duì)象的步驟——產(chǎn)生字符顏色聚類對(duì)象3)優(yōu)化對(duì)象的指針——字符顏色聚類對(duì)象4)設(shè)定當(dāng)前狀態(tài)的步驟,和管理該狀態(tài)的變量——聚類操作的開/關(guān)(優(yōu)化對(duì)象,和狀態(tài)的設(shè)定/改變和管理)在各個(gè)用途的應(yīng)用側(cè)管理是否已經(jīng)產(chǎn)生優(yōu)化對(duì)象是比較麻煩的。因此,能夠用同樣的方法進(jìn)行優(yōu)化對(duì)象的產(chǎn)生和狀態(tài)的設(shè)定和改變。
      例如,色調(diào)校正對(duì)象的產(chǎn)生,模式設(shè)定和改變(背景去除,背景清理或色調(diào)校正關(guān)閉),以及背景去除/清理的強(qiáng)度的設(shè)定和改變都是由原始圖像對(duì)象的單一方法“set_tone_correction(int mode,int factor)”來(lái)執(zhí)行的。在啟動(dòng)該方法時(shí)色調(diào)校正對(duì)象還沒有被產(chǎn)生的情況下,進(jìn)行色調(diào)校正對(duì)象的產(chǎn)生(包含背景代表顏色的計(jì)算和定義色調(diào)校正的參數(shù)的計(jì)算),然后進(jìn)行狀態(tài)(色調(diào)校正模式和系數(shù))的設(shè)定。
      (程序例)最佳圖像產(chǎn)生程序的例子用C++語(yǔ)言顯示,該程序采用上述圖像要素的面向?qū)ο蟮谋硎境绦颉?br> 圖5顯示定義原始圖像對(duì)象的類的程序的例子。圖6顯示定義字符顏色對(duì)象的類的程序的例子。圖5中的源代碼500和圖6中的源代碼600是用C++程序言語(yǔ)編程的例子。
      圖7A到7C顯示定義和原始圖像產(chǎn)生相關(guān)的對(duì)象的程序的例子以及圖像產(chǎn)生的結(jié)果。圖7A的源代碼710定義變量“img”作為原始圖像類的指針,以及定義變量“dibarray”作為存儲(chǔ)所提供圖像的字符陣列的指針。,將輸入圖像數(shù)據(jù)的指針“dibarray_0”作為參數(shù)激活用于初始化原始圖像對(duì)象“img”的方法“set_image”。這里,當(dāng)參考對(duì)象“img”的當(dāng)前狀態(tài),用于產(chǎn)生光柵圖像數(shù)據(jù)的方法“rendering”被激活時(shí),如圖7B所示的圖像720被產(chǎn)生。由于“優(yōu)化操作”還沒有被進(jìn)行,輸入圖像被原原本本的輸出。圖7C顯示這樣的輸入圖像的一部分的放大圖像730。
      圖8A到圖8C顯示和圖像背景清理相關(guān)的程序例以及圖像產(chǎn)生結(jié)果。在圖8A顯示的源代碼810中,用于設(shè)定色調(diào)校正對(duì)象的方法“set_tone_correction”被激活以設(shè)定背景清理為0級(jí)。進(jìn)而,用于設(shè)定字符對(duì)象(分辨率加倍)和字符顏色對(duì)象的方法“set_text_enhancement”被激活時(shí)。這里,當(dāng)通過(guò)參考對(duì)象“img”的當(dāng)前狀態(tài)產(chǎn)生光柵數(shù)據(jù)的方法“rendering”被激活,如圖8B所示的圖像820被產(chǎn)生。圖8C顯示這樣的圖像的一部分的放大圖像830。從圖8C可以看出,背景中的污點(diǎn)和透視圖像被去除,在放大的圖像中每個(gè)字符的清晰度被增加。
      圖9A到圖9C顯示和圖像背景清理相關(guān)的程序例以及圖像產(chǎn)生的結(jié)果。在圖9A所示的源代碼中,方法“set_tone_correction”被激活使得色調(diào)校正對(duì)象沒有起作用。這里,當(dāng)通過(guò)參考對(duì)象“img”的當(dāng)前狀態(tài)產(chǎn)生光柵數(shù)據(jù)的方法“rendering”被激活時(shí),如圖9B所示的圖像920被產(chǎn)生。圖9C顯示圖像920的一部分的放大圖像930。雖然通過(guò)回到原始圖像狀態(tài)會(huì)在背景中重現(xiàn)污點(diǎn)和透視圖像,但是每個(gè)放大的字符的清晰度仍和圖8C中的放大圖像830中的清晰度相同。
      圖10A到圖10C顯示與圖像和背景清理中的字符加重相關(guān)的程序例以及圖像產(chǎn)生的結(jié)果。在圖10A所示的源代碼1010中,方法“set_text_enchancement”被激活,使得字符對(duì)象和字符顏色對(duì)象不起作用。而且,用于設(shè)定色調(diào)校正對(duì)象的方法“set_tone_correction”被激活,以設(shè)定0級(jí)的背景去除。當(dāng)通過(guò)參考對(duì)象“img”的當(dāng)前狀態(tài)產(chǎn)生光柵數(shù)據(jù)的方法“rendering”被激活時(shí),如圖10B所示的圖像1020被產(chǎn)生。圖10C顯示圖像1020的一部分的放大圖像1030。雖然背景被去除并且退變到白色,字符返回到原始圖像的狀態(tài)。
      圖11A到圖11C顯示與圖像中的字符分辨率和字符顏色相關(guān)的程序例和圖像產(chǎn)生的結(jié)果。在圖11A所示的源代碼1110中,用于設(shè)定字符對(duì)象(分辨率加倍)和字符顏色對(duì)象的方法“set_text_enhancement”被激活。進(jìn)而,字符顏色對(duì)象“Text_Color”的方法“set_color_clustering”被激活以啟動(dòng)字符顏色聚類。通過(guò)激活對(duì)象“Text_Color”的方法“number_of_cluster”,可以得到顏色聚類的數(shù)量(在該例子中為2)。當(dāng)用于產(chǎn)生收集屬于每個(gè)顏色聚類的字符的圖像數(shù)據(jù)的方法“get_color_plane”被激活時(shí),可得到如圖11B和11C所示的用于每個(gè)字符顏色聚類的圖像1120和圖像1130。
      圖12A和12B顯示和光柵圖像產(chǎn)生有關(guān)的程序例以及圖像產(chǎn)生的結(jié)果。在圖12A所示的源代碼1210中,通過(guò)參考對(duì)象“img”的當(dāng)前狀態(tài)產(chǎn)生光柵數(shù)據(jù)的方法“rendering”被激活。和圖9B所示的圖像920相比,圖12B顯示的產(chǎn)生的圖像1220具有兩倍高的字符分辨率。因此,清晰度更高。而且,由于這些字符顏色被聚類,每個(gè)顏色的不均勻性被去除。同時(shí),背景仍保持被去除。
      圖13A到13D顯示與圖像中的色調(diào)校正和字符相關(guān)的程序例以及圖像產(chǎn)生結(jié)果。在圖13A所示的源代碼1310中,方法“get_binary_character”被激活以產(chǎn)生二值化字符圖像數(shù)據(jù),這些二值化字符圖像數(shù)據(jù)屬于一個(gè)長(zhǎng)寬為25的部分區(qū)域,這個(gè)區(qū)域的原點(diǎn)的像素位于原始圖像的坐標(biāo)(807,828)處。這里,字符分辨率被設(shè)定為兩倍高。圖13B所示的圖像1320是根據(jù)源代碼1310產(chǎn)生。在圖13C所示的源代碼1330中,通過(guò)方法“set_text_enhancement”把字符分辨率返回到原始值,并且方法“get_binary_character”被再次激活。圖13D所示的圖像1340是根據(jù)源代碼1330產(chǎn)生。從產(chǎn)生的圖像可以看出,由于字符分辨率的差別造成的二值化圖像質(zhì)量的差別是很明顯的。
      圖14A到圖14C顯示與圖像中色調(diào)校正、字符和字符顏色有關(guān)的程序例以及圖像產(chǎn)生的結(jié)果。在圖14A所示的源代碼1410中,兩種方法被激活,使得色調(diào)校正對(duì)象不起作用,字符對(duì)象和字符顏色對(duì)象不起作用。圖14B顯示由激活方法“rendering”所產(chǎn)生的圖像1420。圖14C顯示圖像1420的一部分的放大圖像1430。從圖像1420和1430可以看出,圖像的狀態(tài)回到與放大的原始圖像730相同的狀態(tài)。
      圖15A和圖15B顯示與二值化字符圖像相關(guān)的程序例以及圖像產(chǎn)生的結(jié)果。在圖15A所示的源代碼1510中,用于提取屬于部分區(qū)域的二值化字符圖像數(shù)據(jù)的方法“get_binary_character”如圖13A所示的源代碼1310中那樣被激活,。但是,由于字符對(duì)象和字符顏色對(duì)象沒有起作用,所以字符不能被提取。結(jié)果,如圖15B所示那樣不會(huì)產(chǎn)生圖像。
      圖16A和16B顯示和二值化字符圖像的分辨率相關(guān)的程序例以及圖像產(chǎn)生的結(jié)果。在圖16A所示的源代碼1610中,方法“set_text_enhancement”被激活以便把字符對(duì)象和字符顏色對(duì)象設(shè)定成兩倍高的分辨率。當(dāng)用于提取屬于部分區(qū)域的二值化字符圖像數(shù)據(jù)的方法“get_binary_character”被激活時(shí),就會(huì)得到如圖16B所示的、與作為圖13A所示的源代碼1310結(jié)果所產(chǎn)生的圖像1320(見圖13B)一樣的圖像1620。
      如上所述,現(xiàn)有的方法僅被用于本發(fā)明的實(shí)施例的程序的例子。以這種方法,不管每個(gè)“優(yōu)化操作”的類型是什么,適合用途的圖像可以通過(guò)少量的方法得到。而且,也不需要存儲(chǔ)和保持中間數(shù)據(jù)。即使引入新的“優(yōu)化操作”,格式是一樣的以便實(shí)施不同功能的方法(成員函數(shù))可以通過(guò)共同的接口(多態(tài)性)而被等同地處理。通過(guò)這樣做,即使要引入新的對(duì)象,只需要添加用于調(diào)用與操作相對(duì)應(yīng)的對(duì)象的操作方法的部分。
      為了應(yīng)對(duì)各種數(shù)字化的圖像數(shù)據(jù)的用途,這個(gè)實(shí)施例提供了一種作為“對(duì)象”共同管理用于產(chǎn)生原始圖像數(shù)據(jù)和最佳圖像數(shù)據(jù)的“材料”、產(chǎn)生最佳圖像的步驟、操作的歷史和狀態(tài)的方法。通過(guò)引入“面向?qū)ο蟆笨梢缘玫饺缦碌?)到3)的優(yōu)點(diǎn)1)由于操作的歷史和狀態(tài)被共同管理,不需要考慮每個(gè)用途。
      2)由于原始圖像數(shù)據(jù)(歸一化的)和用于優(yōu)化的“材料”被不變地存儲(chǔ)和保持,因而可返回到任何想要的狀態(tài),并且很容易執(zhí)行“取消(Undo)”和“重做(Redo)”,并且用于產(chǎn)生曾經(jīng)作成的最佳圖像數(shù)據(jù)的“材料”可以被共享,使得優(yōu)化操作不用被兩個(gè)或更多的“用途”調(diào)用。
      3)由于分別管理用途和最佳圖像產(chǎn)生,擴(kuò)展性和系統(tǒng)維護(hù)可以更容易。在系統(tǒng)側(cè),參考當(dāng)前“狀態(tài)”,作成和每個(gè)用途相對(duì)應(yīng)的圖像的步驟應(yīng)當(dāng)作為和對(duì)象關(guān)聯(lián)的方法加以準(zhǔn)備。例如,只要準(zhǔn)備一個(gè)簡(jiǎn)單的步驟用于根據(jù)產(chǎn)生原始圖像數(shù)據(jù)和最佳圖像數(shù)據(jù)的“材料”產(chǎn)生用于打印的光柵數(shù)據(jù)或用于OCR的二值化圖像數(shù)據(jù)。
      如上所述,按照發(fā)明的圖像處理裝置,圖像處理方法,圖像處理程序和記錄介質(zhì),對(duì)于通過(guò)掃描儀和圖像裝置輸入的彩色文檔圖像,用于產(chǎn)生每個(gè)用途的最佳圖像的數(shù)據(jù)根據(jù)“面向?qū)ο蟆边M(jìn)行處理。因此,產(chǎn)生更小的負(fù)擔(dān)和更少的浪費(fèi),可以實(shí)現(xiàn)具有優(yōu)良擴(kuò)展性的圖像處理,同時(shí)只需要簡(jiǎn)單的維護(hù)。
      上述實(shí)施例中描述的圖像處理方法可以通過(guò)在如個(gè)人計(jì)算機(jī)和工作站等計(jì)算機(jī)中執(zhí)行預(yù)定的圖像處理程序而實(shí)現(xiàn)。這個(gè)程序被記錄在可以被計(jì)算機(jī)讀取的如硬盤,軟盤,CD-ROM,MO或DVD等記錄介質(zhì)中。然后從該記錄介質(zhì)中讀出這個(gè)程序,并被計(jì)算機(jī)執(zhí)行。這個(gè)程序可以是被分布在如因特網(wǎng)等網(wǎng)絡(luò)上的傳輸媒介。
      如上所述,在要把包含通過(guò)掃描儀或數(shù)碼相機(jī)讀入的字符的圖像數(shù)據(jù)轉(zhuǎn)換成用途的最佳數(shù)據(jù)狀態(tài)的情況下,本發(fā)明的圖像處理裝置,圖像處理方法,圖像處理程序和記錄介質(zhì)是很有用的。本發(fā)明特別適用于將紙張介質(zhì)上的刊物轉(zhuǎn)換成如PDF的數(shù)字信息以通過(guò)網(wǎng)絡(luò)來(lái)公開的情況。
      需要注意的是本發(fā)明并不限定于上述揭示的具體實(shí)施例,在不脫離本發(fā)明的范圍的前提下可以進(jìn)行各種變化和修改。
      本專利申請(qǐng)以2004年8月10日提交的申請(qǐng)?zhí)枮?004-233802的日本在先專利申請(qǐng)為基礎(chǔ),該申請(qǐng)的全部?jī)?nèi)容通過(guò)引證被結(jié)合在本專利申請(qǐng)中。
      權(quán)利要求
      1.一種圖像處理裝置(110),該裝置使用包含原始圖像對(duì)象(401)和產(chǎn)生用戶指定形式的圖像數(shù)據(jù)的優(yōu)化對(duì)象(400)的圖像處理對(duì)象執(zhí)行面向?qū)ο髨D像處理,通過(guò)對(duì)包含圖像特征量、圖像要素和圖像處理功能的圖像數(shù)據(jù)進(jìn)行歸一化而產(chǎn)生所述原始圖像對(duì)象(401),所述圖像數(shù)據(jù)處于合適圖像處理的狀態(tài),其特征在于,所述圖像處理裝置包含獲取要進(jìn)行圖像處理的圖像數(shù)據(jù)的圖像數(shù)據(jù)獲取單元;對(duì)由所述圖像數(shù)據(jù)獲取單元所獲取的圖像數(shù)據(jù)進(jìn)行歸一化、以便產(chǎn)生原始圖像對(duì)象的歸一化單元;和基于所述歸一化單元所歸一化的圖像數(shù)據(jù)、用優(yōu)化對(duì)象產(chǎn)生最佳圖像數(shù)據(jù)的優(yōu)化單元。
      2.一種圖像處理方法,使用包含原始圖像對(duì)象(401)和產(chǎn)生用戶指定形式的圖像數(shù)據(jù)的優(yōu)化對(duì)象(400)的圖像處理對(duì)象執(zhí)行面向?qū)ο蟮膱D像處理,通過(guò)對(duì)包含圖像特征量、圖像要素和圖像處理功能的圖像數(shù)據(jù)進(jìn)行歸一化而產(chǎn)生該原始圖像對(duì)象(401),該圖像數(shù)據(jù)處于合適圖像處理的狀態(tài),其特征在于,所述方法包含獲取要進(jìn)行圖像處理的圖像數(shù)據(jù)的圖像數(shù)據(jù)獲取步驟(S202);對(duì)在所述圖像數(shù)據(jù)獲取步驟中獲取的圖像數(shù)據(jù)進(jìn)行歸一化、以便產(chǎn)生原始圖像對(duì)象的歸一化步驟(S203);和根據(jù)在所述歸一化步驟中歸一化的圖像數(shù)據(jù)、用優(yōu)化對(duì)象產(chǎn)生最佳圖像數(shù)據(jù)的優(yōu)化步驟(S207)。
      3.如權(quán)利要求2所述的圖像處理方法,其特征在于,所述優(yōu)化步驟包含將所述歸一化的圖像數(shù)據(jù)的背景部分共同改變?yōu)榘咨谋尘叭コ襟E;和產(chǎn)生優(yōu)化對(duì)象作為表示在所述背景去除步驟中要使用的色調(diào)校正曲線的對(duì)象的優(yōu)化對(duì)象產(chǎn)生步驟(S206)。
      4.如權(quán)利要求2所述的圖像處理方法,其特征在于,所述優(yōu)化步驟包含將所述歸一化的圖像數(shù)據(jù)的背景部分共同改變?yōu)榇眍伾谋尘扒謇聿襟E;和產(chǎn)生優(yōu)化對(duì)象作為表示在所述背景清理步驟中要使用的色調(diào)校正曲線的對(duì)象的優(yōu)化對(duì)象產(chǎn)生步驟(S206)。
      5.如權(quán)利要求2所述的圖像處理方法,其特征在于,所述優(yōu)化步驟包含從歸一化的圖像數(shù)據(jù)中提取字符的提取步驟,該字符作為原始分辨率或高分辨率的二值化圖像數(shù)據(jù)被提?。缓彤a(chǎn)生優(yōu)化對(duì)象作為表示在所述提取步驟中提取的二值化圖像數(shù)據(jù)的對(duì)象的優(yōu)化對(duì)象產(chǎn)生步驟。
      6.如權(quán)利要求2所述的圖像處理方法,其特征在于,所述優(yōu)化步驟包含對(duì)從歸一化的圖像數(shù)據(jù)中提取的每個(gè)字符的顏色進(jìn)行估計(jì)的估計(jì)步驟;產(chǎn)生優(yōu)化對(duì)象作為表示在所述估計(jì)步驟中估計(jì)的字符顏色數(shù)據(jù)的對(duì)象的優(yōu)化對(duì)象產(chǎn)生步驟。
      7.如權(quán)利要求6所述的圖像處理方法,其特征在于,所述優(yōu)化對(duì)象產(chǎn)生步驟包含將字符顏色數(shù)據(jù)分類成少量的聚類,并將歸一化的圖像數(shù)據(jù)中的每個(gè)字符分配給顏色聚類中的一個(gè)聚類的分配步驟;和產(chǎn)生表示聚類特征化數(shù)據(jù)和關(guān)于每個(gè)字符的聚類分配數(shù)據(jù)的對(duì)象的對(duì)象產(chǎn)生步驟,該對(duì)象被作為形成優(yōu)化對(duì)象的對(duì)象之一而產(chǎn)生。
      8.如權(quán)利要求2所述的圖像處理方法,其特征在于,在所述歸一化步驟中產(chǎn)生的原始圖像對(duì)象和在所述優(yōu)化對(duì)象產(chǎn)生步驟中產(chǎn)生的優(yōu)化對(duì)象都具有包含圖像特征量和圖像要素的基本數(shù)據(jù);所述歸一化步驟和所述優(yōu)化對(duì)象產(chǎn)生步驟都包含計(jì)算用于限定要對(duì)基本數(shù)據(jù)進(jìn)行的圖像處理的圖像特征量和圖像要素的計(jì)算步驟;產(chǎn)生用于存儲(chǔ)和保持所述計(jì)算步驟的計(jì)算結(jié)果的對(duì)象的對(duì)象產(chǎn)生步驟;管理所述對(duì)象中基本數(shù)據(jù)的設(shè)定、更新、當(dāng)前操作狀態(tài)和歷史記錄的對(duì)象管理步驟,所述對(duì)象管理步驟具有指向在所述對(duì)象產(chǎn)生步驟中產(chǎn)生的對(duì)象的指針;和根據(jù)所述對(duì)象的所述當(dāng)前操作狀態(tài)產(chǎn)生圖像數(shù)據(jù)的圖像產(chǎn)生步驟,所述圖像產(chǎn)生步驟具有操作狀態(tài)和歷史記錄的數(shù)據(jù)。
      9.如權(quán)利要求8所述的圖像處理方法,其特征在于,所述圖像數(shù)據(jù)產(chǎn)生步驟包含產(chǎn)生整體部分或指定部分的光柵圖像數(shù)據(jù)的光柵圖像產(chǎn)生步驟。
      10.如權(quán)利要求8所述的圖像處理方法,其特征在于,所述圖像產(chǎn)生步驟包含產(chǎn)生二值化圖像數(shù)據(jù)或彩色圖像數(shù)據(jù)的字符圖像產(chǎn)生步驟,該二值化圖像數(shù)據(jù)或彩色圖像數(shù)據(jù)為包含在整體部分或指定部分中的字符。
      11.如權(quán)利要求8所述的圖像處理方法,其特征在于,所述圖像產(chǎn)生步驟包含彩色字符圖像產(chǎn)生步驟,所述彩色字符圖像產(chǎn)生步驟產(chǎn)生共同地包含顏色屬于整體部分或指定部分的指定顏色聚類的字符的圖像數(shù)據(jù)。
      12.一種圖像處理程序,其特征在于,用于使計(jì)算機(jī)執(zhí)行如權(quán)利要求2到11中任一項(xiàng)所述的圖像處理方法。
      13.一種記錄介質(zhì),其特征在于,所述記錄介質(zhì)記錄有如權(quán)利要求12所述的圖像處理程序。
      全文摘要
      本發(fā)明提供了一種圖像處理系統(tǒng),該系統(tǒng)進(jìn)行面向?qū)ο蟮膱D像處理并共同管理圖像數(shù)據(jù),圖像要素和圖像處理的歷史和狀態(tài)。在這個(gè)圖像處理系統(tǒng)中,要被歸一化的原始圖像對(duì)象(401)被產(chǎn)生用于要被處理的圖像數(shù)據(jù)。然后,使用優(yōu)化對(duì)象(400)把歸一化的圖像數(shù)據(jù)轉(zhuǎn)換成符合用途的最佳圖像數(shù)據(jù)格式。采用對(duì)象中相同的方法(功能)來(lái)執(zhí)行對(duì)象的產(chǎn)生,狀態(tài)的設(shè)定和改變。
      文檔編號(hào)G06K9/60GK1737852SQ200510091720
      公開日2006年2月22日 申請(qǐng)日期2005年8月8日 優(yōu)先權(quán)日2004年8月10日
      發(fā)明者西田廣文 申請(qǐng)人:株式會(huì)社理光
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1