圖像處理裝置、圖像處理方法及計算機程序的制作方法

文檔序號：7594491閱讀：130來源：國知局

專利名稱：圖像處理裝置、圖像處理方法及計算機程序的制作方法
技術領域：
本發(fā)明涉及在表示圖像的概要的縮略圖顯示中，將圖像的一部分放大并顯示的圖像處理裝置、圖像處理方法及計算機程序。
背景技術：
存在為了知道已生成的打印數據實際上怎樣被打印，在打印前能在顯示器上通過目視來確認的打印預覽功能。
在預覽功能中，用戶通過觀察縮小顯示整個圖像的縮略圖顯示，能夠知道已輸入的圖像的內容是怎樣的內容。該方法特別是在利用復印機進行多頁面的圖像處理時很方便，此時，往往在預覽顯示器區(qū)域排列多幅縮略像以進行顯示。
但是，關于上述已說明的數字復印機等數字圖像輸入輸出裝置中的預覽功能，在現有的方法中存在著以下問題。
即，用縮略圖(thumbnail，簡略顯示部分圖像)顯示圖像的目的并非僅是縮小并排列圖像，而是識別涉及多頁面的輸入圖像的圖像信息的概要以獲得進行判斷的材料。當象復制文檔那樣在輸入圖像中包含許多字符信息時，若采用縮小1頁面進行顯示的現有的縮略圖顯示，則存在著這樣的問題，即難以理解頁面的概要，僅知道頁面似乎是字符圖像，而理解頁面的概要是縮略圖顯示本來的目的。
此處，在文件包含ASCII碼那樣的文本數據被記述時，通過顯示其標題(解說)，用戶能夠知道關于文件內容的概要，例如作為個人計算機的軟件也已經實現。但是，當用掃描儀取入的圖像和用數碼攝像機拍攝的一般的圖像中包含字符時，在圖像數據中不備有解說，因此不能夠完成這樣的功能。另外，在市面上流通的數字文件的格式存在有多種，因此在上述的文本中能顯示標題的情況是有限的，在大多數情況下，與上述相同，則存在著難以理解頁面的概要，僅知道頁面似乎是字符圖像的問題。
另外，以往在打印預覽功能中，為了知道打印圖像的詳細情況，在用戶選擇了放大模式時，通過用與打印時的圖像的分別率相同的分辨率在預覽畫面上顯示打印圖像，然后通過用手動反復試驗指定放大顯示位置，能進行細節(jié)的確認(日本特開2001-63155)。
但是，采用上述的方法在放大縮小顯示縮略像進行觀察時，通過用手動設定放大縮小的位置和放大縮小率，往往需要反復試驗。

發(fā)明內容
本發(fā)明是鑒于上述問題而做出的，其目的在于使得能夠易于理解地顯示圖像的內容。
另外，本發(fā)明是鑒于上述問題而完成的，其目的在于進行能夠易于理解地顯示字符的縮略圖顯示。
為達到上述目的，本發(fā)明提供一種圖像處理裝置，包括進行圖像是第1種類的圖像還是第2種類的圖像的判別的判別裝置；以及根據上述判別裝置的判別結果，在上述圖像被判別為第1種類的圖像的情況，進行將上述第1種類的圖像的特征的一部分放大了的縮略圖顯示的顯示裝置。
此外，本發(fā)明提供一種圖像處理裝置，其特征在于，包括進行圖像是字符圖像還是灰度圖像的判別的判別裝置；以及根據上述判別裝置的判別結果，在上述圖像被判別為字符圖像的情況，進行將上述字符圖像的一部分放大了的縮略圖顯示的顯示裝置。
本發(fā)明目的在于提供新功能。為達到上述目的，權利要求和本發(fā)明的其它特征將從接下來的說明書、附圖中得以明確。

附圖包括在說明書中并構成其一部分，說明本發(fā)明的實施例，并與該說明一起用來解釋本發(fā)明的原理。
圖1是表示本發(fā)明的實施例的數字圖像輸入輸出裝置的圖。
圖2是從上方看本發(fā)明的實施例的數字圖像輸入輸出裝置的圖。
圖3是表示數字圖像輸入輸出裝置的上面的顯示器單元的圖。
圖4是在顯示器單元上配置了進行從圖像輸入單元讀入的多頁面的縮略圖顯示的小區(qū)間窗口的圖。
圖5是表示預覽縮略圖的本發(fā)明的實施例的主要概念的圖。
圖6是表示預覽縮略圖的現有的處理的圖。
圖7是表示本發(fā)明的實施例的裝置構成例的方框圖。
圖8A、圖8B是表示像域分離單元的動作的圖。
圖9A、圖9B是在字符區(qū)域中進行最先字符位置判別的圖。
圖10A、圖10B是表示關于像域判別字符圖像時的區(qū)域分割的方法的圖。
圖11是表示本發(fā)明的實施例的處理步驟的流程圖。
具體實施例方式
以下，舉出本發(fā)明的優(yōu)選實施例的一例說明其原理。以下，例示基于本發(fā)明的原理的實施形式，并且為了幫助理解而進行說明的實施例，本發(fā)明的適用范圍不限于該實施例的詳細情況。
在圖1和圖2中，1000是用于說明本發(fā)明的實施例的數字圖像輸入輸出裝置。在本實施例中，數字圖像輸入輸出裝置1000由圖像輸入單元(掃描儀單元)900和圖像輸出單元(打印機單元)800構成。圖3是表示從上方看圖2的圖像輸出單元800的上面的顯示器單元10的圖。顯示器單元10是用于顯示預覽的顯示單元，88是位于顯示器單元10內的區(qū)域的預覽顯示單元88。另外，12是被配置在顯示器單元10上的用戶接口用開關。10為壓敏式觸摸面板，用戶通過按壓12進行各種操作。從圖像輸入單元900所讀入的圖像實際上在被打印前作為預覽而顯示。在預覽顯示單元88中有縮略圖顯示功能，圖4表示將從圖像輸入單元900讀入的多個頁面在預覽顯示單元88中進行縮略圖顯示的顯示單元。多個頁面的各自的圖像被配置在從小區(qū)域窗口90到97。在圖4中，使用8個窗口備有8頁面的縮略圖顯示用的窗口。
圖5是表示本實施例的基本原理的圖，在表示所輸入的頁面圖像概要的縮略圖中，在字符圖像的情況下，通過用高分別率顯示推測為其文章的最先的部分，容易理解頁面的概要。另一方面，在自然圖像等的灰度圖像的情況下，通過顯示整個頁面，容易理解頁面的概要。
為了補充說明圖5的基本原理，以下示出與現有例比較的本發(fā)明的實施例的特征、以及本發(fā)明的處理的更詳細的步驟。
圖6是現有的預覽的縮略圖顯示的例子。在圖6中將作為已讀入的輸入頁面圖像的8頁面的圖像數據，分別作為輸入圖像20、輸入圖像21、輸入圖像22...輸入圖像27表示，圖中省略了輸入圖像23和27。這些輸入圖像如圖示那樣，縮小用虛線所包圍的區(qū)域即每一頁面的整個圖像，從小區(qū)域窗口90到97作為縮略像被顯示。
對于輸入圖像的各頁面，目前，如圖6所示，為了知道多幅的讀入圖像的概要而顯示了整個頁面的縮小圖像。此時，在輸入圖像20和22那樣的灰度圖像中，用戶能夠適當地理解關于輸入圖像的數據內容。但是，在讀入了輸入圖像21和24那樣的字符為主的圖像數據時，如縮略圖顯示區(qū)域91和94那樣即使能理解數據以字符為中心，但此時，對作為進行預覽顯示的目的的理解內容概要，卻沒有效果。
因此，在該實施例中，可以利用圖7所示的結構進行動作來實現圖5的功能，使用戶理解頁面的內容。
圖7是表示裝置構成例的方框圖。在本實施例的該方框圖中，特別抽取出與本發(fā)明關聯的部分進行說明，另外實際的物理結構(信號處理LSI、印刷電路板、打印裝置機械部分等)和邏輯方框沒有作為以1對1相同地對應的結構而限定，但作為本發(fā)明的原理卻能得到相同的效果。
50是表示整個裝置的方框，51是圖像讀入單元51，52是像域判別單元52，53是預覽變量設定單元53，54是預覽圖像數據生成單元54，55是進行打印用的圖像處理的字符區(qū)域圖像處理單元55，56同樣是進行打印用的圖像處理的灰度區(qū)域圖像處理單元56，57是生成打印圖像數據的打印圖像數據生成單元57，58是預覽圖像顯示單元58，59是打印單元59，60是用戶輸入單元60。
在圖7中，粗箭頭表示圖像數據流，細箭頭表示與本發(fā)明相關的控制信號流。
在圖像讀入單元51中所讀入的1頁面的圖像，在像域判別單元52中，判別是報告書等字符圖像為主的圖像，還是自然圖像和風景等的灰度圖像為主的圖像。對于已讀入的數字圖像，在像域判別單元52中，給予所謂是字符圖像還是灰度圖像的屬性。
作為該方法的例子，如圖8A和圖8B所示那樣，通過計算圖像數據值的直方圖，能夠判別是灰度圖像還是字符圖像。圖8A是字符圖像的圖像數據的直方圖，圖8B是風景等的灰度圖像的圖像數據的直方圖，橫軸是亮度Y數據的值，縱軸是圖像內的數據個數。在圖8A的情況下，圖像數據個數的峰值位于高亮度和低亮度部分，在這樣的直方圖的情況下，高亮度部分判定是背景的白地，低亮度部分判定是字符的黑色部分，可推定此圖像數據為字符圖像。另外，在圖8B的情況下，因為圖像數據個數均勻分布，在這樣的直方圖的情況下，沒有字符圖像那樣的特征，而且因為分布了具有某些灰度的圖像數據，所以能夠推定此圖像數據是灰度圖像。
根據該判別結果，對圖像數據進行與各自的屬性相對應的圖像處理。在已讀入的數字圖像的屬性是字符圖像的情況下，在字符區(qū)域圖像處理單元55中進行最適合于字符圖像的圖像處理。最適合于字符圖像的數字圖像處理是這樣的方法，例如作為使用了電攝影方式的打印單元的例子，為了用與打印單元的物理性最大分辨率一致的高精細的點來表現并生成穩(wěn)定的小點，就用對比度高的2值來表現。另外，最適合于灰度圖像的數字圖像處理是這樣的方法，例如作為使用了電攝影方式的打印單元的例子，與字符圖像的情況相反，通過降低分辨率并增大每1個點的面積，使以1點內的面積比進行表現的多值灰度表現穩(wěn)定化。這些方法作為電攝影的打印技術的方法已為人們所熟知。這樣，經過處理使得在像域判別后變成適當的表達的圖像數據，在打印圖像數據生成單元57中進行利用對照表的灰度曲線修正，生成作為即將輸出之前的1個數字圖像數據，并將其輸送到進行紙上打印的打印單元59。
此處，在本實施例中的像域判別單元52對某個圖像區(qū)域進行上述的直方圖計算的像域判別，作為該判別區(qū)域，能夠將1頁面例如分割成矩形并對每個分割區(qū)域都判別像域，因此在裝置中保持該每個矩形的像域判別結果的同時，能夠綜合各分割區(qū)域的判別結果并確定作為整個頁面的判別結果。
在本實施例中，使用在圖像讀入單元51中所讀入的數字圖像數據來實現進行預覽顯示的預覽功能。作為本實施例中的預覽功能，通過變更讀入圖像的放大縮小(變倍)、顯示區(qū)域的上下左右的顯示位置(XY坐標)的移動這樣的預覽變量，在預覽圖像顯示單元58中顯示與其相應的圖像。
輸入圖像數據在像域判別單元52中被給予字符圖像或灰度圖像的屬性，參照該屬性，在預覽變量設定單元53中初始設定預覽變量并在縮略圖顯示中使用。在預覽變量設定單元53中進行以下那樣的動作。在像域判別的結果是灰度圖像的情況下，將放大縮小(變倍)倍率變成最小并作為關于該頁面的縮略圖顯示整個頁面。在本實施例中可從100％(最小)到800％(最大)進行放大縮小，因此該情況為100％。此外，此處說明的100％的值是指在縮略圖顯示窗中能100％顯示整個頁面的倍率設定。顯示位置(XY坐標)由于是整體顯示，所以在該情況下沒有關系。此外，用戶使用用戶接口12，作為放大縮小(變倍)倍率能設定任意的值，并能將該值作為初始設定的值設定在預覽變量設定單元53中，在進行縮略圖顯示時，總是用已設定的值進行顯示。另一方面，在像域判別的結果是字符圖像的情況下，將放大縮小(變倍)倍率設定為比倍率更大的預定的放大倍率。此處作為參考例設定為800％。此時，圖像被放大并部分地顯示，因此有必要確定其顯示位置。此外，與像域判別的結果是灰度圖像的情況下相同，用戶使用用戶接口12，作為放大縮小(變倍)倍率可設定任意的值，并能將該值作為初始設定的值設定在預覽變量設定單元53中，在進行縮略圖顯示時，總是用已設定的值進行顯示。關于本實施例中的該方法，用圖9A和圖9B進行說明。
在圖9A和圖9B中，表示在像域判別單元52中被判別為字符圖像區(qū)域的區(qū)域直方圖。圖9A是與圖8A相同被判別為字符區(qū)域的區(qū)域直方圖，在數據個數中能看到字符部分和背景部分的峰值。另一方面，在圖9B的直方圖中，推測為在該區(qū)域中被只能看到背景部分，因此能夠被判別為背景的白地相連續(xù)的部分。使用該判別確定預覽放大顯示時的顯示位置。
在圖10A和圖10B表示關于1頁面的圖像使用該判別方法的方法。圖10A表示像域判別字符圖像時的區(qū)域分割的方法，如圖那樣將1頁面分割成小區(qū)域的矩形，并對于各自的矩形區(qū)域進行上述圖9A中的判別、即進行背景部分和存在字符的部分的區(qū)分。圖中，在各矩形中，存在字符“Once upon a time…”的部分是字符部分，空白的矩形是背景部分。在圖10B中示出了各矩形部分的判別結果。在圖10B中，71是背景矩形部分，72和75是字符存在矩形部分。此處，在本實施例中，在1頁面的圖像中，從左上起在水平方向上，一邊判別是背景部分還是字符存在部分，一邊對各矩形區(qū)域依次進行掃描。在到達了右端的時刻在垂直方向上下降1行，再一次從左端在水平方向上一邊判別一邊掃描。反復操作以上步驟來確定最初的字符存在矩形部分。其結果就是找到圖10B的字符存在矩形部分75，因此將該75的位置設定為預覽放大顯示時的顯示位置。在本實施例中，設定預覽顯示位置(XY坐標)以便表示預覽顯示的左上方的坐標。
圖11表示在上述的數字圖像輸入輸出裝置1000中進行的處理過程的流程圖。在圖11中，首先在步驟S1中進行圖像讀入，接著在步驟S2中，利用已生成的圖8A和圖8B的直方圖進行是字符圖像還是灰度圖像的判別。在是灰度圖像的情況下，在步驟S3設定預覽倍率。另一方面，在是字符圖像的情況下，在步驟S4設定預覽倍率，在步驟S5使用圖9A和圖9B的直方圖，檢測在頁面內存在字符的坐標，并設定預覽坐標。使用這些已設定的值在步驟S6進行預覽顯示。
對每一讀入頁面進行該圖11的控制，顯示與各自的頁面相應的縮略圖。表示該原理整體的圖是圖5。在圖5中，將輸入數據的虛線的部分作為縮略圖顯示而顯示在顯示器上，與現有例的圖6比較，圖5的效果已很明顯。
此外，用上述的方法設定放大縮小倍率和顯示位置進行預覽顯示，但預覽顯示后，用戶用手動設定放大縮小倍率和顯示位置，能夠更詳細的觀察。
另外，對于本實施例，在1頁面的圖像中，從左上方依次在水平方向掃描了各矩形區(qū)域，但也可以從不限于左上方的任何方向掃描。另外，在本實施例中，將預覽顯示位置設為了左上方的坐標，但也可以設定左上方以外的任何坐標。
另外，在本實施例中所使用的可辨認是指，以用戶能夠閱讀的某種程度以上的大小來顯示字符。
如以上所示那樣，通過本實施例的結構，對于表示數字圖像打印裝置所輸入的頁面圖像的概要的縮略圖功能，在灰度圖像的情況下，可顯示整個圖像來識別是怎樣的圖像。另外，在字符圖像的情況下，通過用高分辨率顯示推測為該文章的最先的部分，可理解該字符，因此容易達到作為縮略圖顯示的本來的目的的“理解頁面的概要”的目的。
另外，以往利用字符顯示的內容理解只在包含文本信息的計算機軟件用的文檔等中是可能的，但是在本發(fā)明中，即使是作為位圖的已讀入的掃描儀讀入圖像，也能以適當高概率理解頁面的概要。
此外，不要求將OCR(光學字符識別)等的精度高的字符識別作為絕對必要條件，關于字符圖像縮略圖顯示，其顯示是適當的還是錯誤識別的依賴于人的文章理解能力，因此從實用的觀點出發(fā)，與性能價格比相稱的識別成功率就足夠了(總之，即使識別失敗，只要用最佳效果顯示即可)。其結果，在本發(fā)明中，不需要用于特別化的像域分離和預覽變量設定的裝置，能再利用現有的打印用的像域分離功能，而且能不變更現有的圖像處理系統(tǒng)結構，而以追加到現有系統(tǒng)中的形式來實現本發(fā)明的功能。
另外，在本實施例中，敘述了關于圖像處理裝置內的圖像數據的縮略圖顯示，但也適用于預先將打印前的圖像顯示在PC的顯示器上的，打印預覽的預覽顯示和數字攝像機的顯示器的縮略圖顯示單元。
在上述的實施例的基本形式中，關于主體圖像中的字符圖像，根據在一般流通圖像中平均被使用的字符的大小規(guī)定了變倍倍率，一般地，在明信片和卡片等的原稿尺寸小的圖像中不使用特大的字符的可能性較大，因此能夠檢測原稿尺寸，并按照該尺寸變更變倍倍率的設定。
在該情況下，作為實施例可以列舉如下的方法，即收集各種抽樣圖像，對每個原稿尺寸在一般流通圖像中平均被使用的字符的大小取得統(tǒng)計數據，從而預先確定規(guī)定變倍倍率。
另外，作為其它的實施例，在關于裝置的成本相對地有富余并裝載了OCR(光學字符識別)可高速地使用時，通過使用OCR替代上述像域分離單元來精確地判別字符的位置和尺寸，能夠更精確地確定預覽變量，并能夠使上述的字符圖像的縮略圖顯示的精度更加提高。
如以上已說明的那樣，依據本實施例，在圖像處理裝置內的圖像數據的縮略圖顯示中，在字符圖像的情況下，通過放大并部分顯示字符可容易理解地顯示字符，在灰度圖像的情況下，通過顯示灰度區(qū)域整體的圖像能夠理解顯示怎樣的圖像。
以上，舉出若干個優(yōu)選實施例說明了本發(fā)明，但顯然本發(fā)明不受這些實施例的限制，在權利要求的范圍內可進行各種變形和應用。
權利要求
1.一種圖像處理裝置，其特征在于，包括進行圖像是第1種類的圖像還是第2種類的圖像的判別的判別裝置；以及根據上述判別裝置的判別結果，在上述圖像被判別為第1種類的圖像的情況，進行將上述第1種類的圖像的特征的一部分放大了的縮略圖顯示的顯示裝置。
2.一種圖像處理裝置，其特征在于，包括進行圖像是字符圖像還是灰度圖像的判別的判別裝置；以及根據上述判別裝置的判別結果，在上述圖像被判別為字符圖像的情況，進行將上述字符圖像的一部分放大了的縮略圖顯示的顯示裝置。
3.根據權利要求2所述的圖像處理裝置，其特征在于，在上述顯示裝置中，用戶可預先將放大縮小倍率和/或縮略圖顯示位置作為缺省值設定。
4.根據權利要求2所述的圖像處理裝置，其特征在于，在上述顯示裝置中顯示了縮略圖后，用戶可再次設定放大縮小倍率和/或縮略圖顯示位置。
5.根據權利要求2所述的圖像處理裝置，其特征在于，在上述判別裝置中，使用光學字符識別處理進行判別。
6.一種圖像處理裝置，其特征在于，包括進行圖像是字符圖像還是灰度圖像的判別的判別裝置；以及根據上述判別裝置的判別結果，在上述圖像被判別為字符圖像的情況，確定進行將上述字符圖像的一部分放大了的縮略圖顯示的預覽變量的確定裝置。
7.根據權利要求6所述的圖像處理裝置，其特征在于，上述預覽變量是放大縮小倍率和/或預覽顯示位置的坐標值。
8.根據權利要求6所述的圖像處理裝置，其特征在于，還包括用戶指定上述預覽變量的指定裝置。
9.根據權利要求7所述的圖像處理裝置，其特征在于，上述預覽顯示位置的坐標值通過將圖像分割成小區(qū)域的矩形，并通過為了對各矩形區(qū)域判別是字符圖像還是背景圖像進行掃描而確定。
10.一種圖像處理方法，其特征在于，包括以下步驟進行圖像是是第1種類的圖像還是第2種類的圖像的判別的判別步驟；以及根據上述判別步驟的判別結果，在上述圖像被判別為第1種類的圖像的情況，進行將上述第1種類的圖像的特征的一部分放大了的縮略圖顯示的顯示步驟。
11.一種圖像處理方法，其特征在于，包括以下步驟進行圖像是字符圖像還是灰度圖像的判別的判別步驟；以及根據上述判別步驟的判別結果，在上述圖像被判別為字符圖像的情況，進行將上述字符圖像的一部分放大了的縮略圖顯示的顯示步驟。
12.根據權利要求11所述的圖像處理方法，其特征在于，在上述顯示步驟中，用戶可預先將放大縮小倍率和/或縮略圖顯示位置作為缺省值設定。
13.根據權利要求11所述的圖像處理方法，其特征在于，在上述顯示步驟中顯示了縮略圖后，用戶可再次設定放大縮小倍率和/或縮略圖顯示位置。
14.根據權利要求11所述的圖像處理方法，其特征在于，在上述判別步驟中，使用光學字符識別處理進行判別。
15.一種圖像處理方法，其特征在于，包括以下步驟進行圖像是字符圖像還是灰度圖像的判別的判別步驟；以及根據上述判別步驟的判別結果，在上述圖像被判別為字符圖像的情況，確定進行將上述字符圖像的一部分放大了的縮略圖顯示的預覽變量的確定步驟。
16.根據權利要求15所述的圖像處理方法，其特征在于，上述預覽變量是放大縮小倍率和/或預覽顯示位置的坐標值。
17.根據權利要求15所述的圖像處理方法，其特征在于，還包括用戶指定上述預覽變量的指定步驟。
18.根據權利要求16所述的圖像處理方法，其特征在于，上述預覽顯示位置的坐標通過將圖像分割成小區(qū)域的矩形，并通過為了對各矩形區(qū)域判別是字符區(qū)域或背景區(qū)域進行掃描而確定。
全文摘要
本發(fā)明提供一種圖像處理裝置、圖像處理方法及計算機程序。在表示被輸入到數字圖像打印裝置中的圖像的概要的縮略圖顯示中，進行圖像是第1種類的圖像還是第2種類的圖像的判別，在圖像被判別為第1種類的圖像的情況，進行將上述第1種類的圖像的特征的一部分放大了的縮略圖顯示，從而能夠可理解地顯示圖像的內容。另外，本發(fā)明在表示被輸入到數字圖像打印裝置中的圖像的概要的縮略圖顯示中，進行圖像是字符圖像還是灰度圖像的判別，在上述圖像被判別為字符圖像的情況，進行將上述字符圖像的一部分放大了的縮略圖顯示，從而能夠可理解地顯示字符。
文檔編號H04N1/393GK1591311SQ20041005704
公開日2005年3月9日申請日期2004年8月25日優(yōu)先權日2003年8月26日
發(fā)明者田中守申請人:佳能株式會社

完整全部詳細技術資料下載