專利名稱:信息處理裝置、信息處理方法及計算機可讀介質(zhì)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息處理裝置、信息處理方法以及計算機程序,更具體地,涉及一種使得可以分析在利用彩色標(biāo)記的附加寫入中的多條附加寫入信息之間的重疊或附加寫入信息與原始信息之間的重疊、并執(zhí)行精確的附加寫入?yún)^(qū)域提取的信息處理裝置、信息處理方法以及計算機程序。
背景技術(shù):
在對文檔的數(shù)據(jù)處理領(lǐng)域,從文檔圖像數(shù)據(jù)獲得各文檔區(qū)域的屬性的處理(例如針對各屬性對圖像區(qū)域進行分類,然后執(zhí)行字符識別處理(OCR光學(xué)字符識別),以生成經(jīng)分類的文本數(shù)據(jù)并將該文本數(shù)據(jù)保存在數(shù)據(jù)庫中)公知為索引提取處理。例如,JP-A-5-342326(這里使用的術(shù)語“JP-A”是指“未審查已
公開日本專利申請”)和JP-A-2002-123815公開了該索引提取處理的現(xiàn)有技術(shù)。
JP-A-2003-271942描述了用于進行如下操作的結(jié)構(gòu)定義預(yù)定文檔形式,設(shè)定附加寫入?yún)^(qū)域以允許按照文檔形式進行附加寫入,在設(shè)定的附加寫入?yún)^(qū)域中嵌入位置信息,以及當(dāng)從文檔提取附加寫入信息時為了高效地獲得附加寫入信息而消除與原始信息進行核對的需要。此外,JP-A-2003-18393描述一種用于將區(qū)域識別信息嵌入文檔的分割區(qū)域中并當(dāng)提取附加寫入信息時從該區(qū)域高效地提取附加寫入信息的處理結(jié)構(gòu)。
此外,JP-A-10-255027和JP-A-11-272654等描述了如下的結(jié)構(gòu)如果針對紙原稿執(zhí)行諸如附加寫入的變化處理,則確定和提取變化部分并將提取的變化部分信息添加到原始信息作為管理用數(shù)據(jù),例如附加寫入部分提取處理結(jié)構(gòu)。
如上所述,在針對文檔的數(shù)據(jù)處理中,提出了用于按照類型對包含在文檔中的各條數(shù)據(jù)進行分類或歸類并以分類方式將數(shù)據(jù)保存在數(shù)據(jù)庫等的存儲部中的各種技術(shù)。然而,從包含在文檔中的文檔區(qū)域提取屬性的自動處理涉及性能限制,并且,為了執(zhí)行精確的屬性提取,在目前條件下需要人(操作員)的介入。
為通過人(操作員)的介入而執(zhí)行屬性提取,執(zhí)行如下處理由人在紙原稿上標(biāo)記與預(yù)定屬性相對應(yīng)的屬性值并掃描原稿,然后提取標(biāo)記區(qū)域信息作為屬性值。例如,按照如下方式來預(yù)設(shè)信息類型與標(biāo)記顏色之間的對應(yīng)紅色標(biāo)記設(shè)定部分是日期數(shù)據(jù)、藍色標(biāo)記設(shè)定部分是文檔名稱數(shù)據(jù),并且通過判斷標(biāo)記顏色來獲取屬性信息。
然而,判斷標(biāo)記顏色來獲取屬性信息的結(jié)構(gòu)帶來下面的問題例如,如果利用各種顏色的標(biāo)記向原稿進行附加寫入,則可能發(fā)生不同標(biāo)記顏色之間的重疊(例如,紅色與藍色之間的重疊等)。此外,可能發(fā)生作為附加寫入的標(biāo)記顏色(例如紅色)與原始信息(例如黑色)之間的重疊。在不同色彩之間的發(fā)生重疊的部分中,在通過掃描儀進行讀取時,無法識別基本的標(biāo)記顏色,并將其讀取為不同顏色。因此,如果讀取這種原稿,則在重疊部分中不能執(zhí)行精確的標(biāo)記顏色提取,并且不能精確地執(zhí)行基于標(biāo)記顏色的附加寫入?yún)^(qū)域確定;這是一個問題。
因此,本發(fā)明的目的是提供一種信息處理裝置、信息處理方法以及計算機程序,其使得可以分析在作為屬性設(shè)定處理而執(zhí)行的利用彩色標(biāo)記的附加寫入中的多條附加寫入信息之間的重疊或附加寫入信息與原始信息之間的重疊、并且執(zhí)行精確的附加寫入?yún)^(qū)域提取。
發(fā)明內(nèi)容
(1)根據(jù)本發(fā)明的第一方面,一種信息處理裝置包括顏色提取單元,其輸入通過以不同顏色向原始文檔寫入附加寫入信息而提供的附加寫入文檔,并獲取該附加寫入文檔上的顏色信息;顏色分析單元,其基于由所述顏色提取單元提取的顏色,分析通過顏色混合產(chǎn)生的顏色組合和顏色空間之一與由所述顏色提取單元提取的顏色之間的對應(yīng)關(guān)系;接合和整合單元,其基于所述顏色分析單元的分析結(jié)果來確定所述附加寫入文檔中的不同顏色之間的重疊,并接合與該重疊和附加寫入信息的中斷之間的對應(yīng)部分相對應(yīng)的附加寫入信息的中斷;確定單元,其根據(jù)在所述接合和整合單元中接合的附加寫入信息來確定所述附加寫入文檔的指定區(qū)域;以及信息分析單元,其讀取由所述確定單元分析出的指定區(qū)域中包含的信息。
(2)如項(1)中所述的信息處理裝置,其中所述顏色分析單元基于由所述顏色提取單元提取的顏色來在顏色空間中提取可能發(fā)生減色法混合的部分顏色空間。
(3)如項(1)中所述的信息處理裝置,其中所述顏色分析單元基于由所述顏色提取單元提取的顏色來提取與所述顏色提取單元提取的顏色相對應(yīng)的減色法混合組合。
(4)如項(1)中所述的信息處理裝置,其中所述信息分析單元對由所述確定單元分析出的指定區(qū)域中包含的信息執(zhí)行字符識別處理。
(5)如項(1)中所述的信息處理裝置,其中所述信息分析單元獲取由所述確定單元分析出的指定區(qū)域中包含的信息作為圖像數(shù)據(jù)。
(6)如項(1)中所述的信息處理裝置,其中所述信息分析單元讀取以下兩種信息之一(i)所述附加寫入信息中包括的區(qū)域中包含的信息,以及(ii)內(nèi)包區(qū)域與所述附加寫入信息接觸并重疊的區(qū)域中包含的信息。
(7)如項(1)所述的信息處理裝置,該信息處理裝置包括圖像處理單元,其輸入原始文檔和附加寫入文檔并執(zhí)行差值提取,其中所述顏色提取單元獲取關(guān)于所述圖像處理單元產(chǎn)生的差值圖像數(shù)據(jù)的顏色信息。
(8)如項(1)所述的信息處理裝置,該信息處理裝置包括圖像處理單元,其輸入原始文檔和附加寫入文檔并執(zhí)行差值提取,其中所述顏色提取單元獲取關(guān)于所述圖像處理單元產(chǎn)生的差值圖像數(shù)據(jù)的顏色信息。
(9)如項(1)所述的信息處理裝置,該信息處理裝置包括圖像處理單元,其輸入附加寫入文檔并去除該附加寫入文檔中的分格線,其中所述顏色提取單元獲取關(guān)于由所述圖像處理單元產(chǎn)生的已去除分格線的圖像數(shù)據(jù)的顏色信息。
(10)根據(jù)本發(fā)明的第二方面,一種信息處理方法包括以下步驟輸入通過以不同顏色將附加寫入信息寫入原始文檔中而提供的附加寫入文檔;獲取所述附加寫入文檔上的顏色信息;基于所提取的顏色,分析通過顏色混合產(chǎn)生的顏色組合和顏色空間之一與所提取的顏色之間的對應(yīng)關(guān)系;基于分析所獲得的分析結(jié)果來確定所述附加寫入文檔中的不同顏色之間的重疊;接合與在該重疊和附加寫入信息的中斷之間的對應(yīng)部分相對應(yīng)的附加寫入信息的中斷;根據(jù)經(jīng)接合的附加寫入信息來確定所述附加寫入文檔的指定區(qū)域;以及讀取分析出的指定區(qū)域中包含的信息。
(11)如項(10)所述的信息處理方法,其中分析對應(yīng)關(guān)系的步驟是基于所提取的顏色來在顏色空間中提取可能發(fā)生減色法混合的部分顏色空間。
(12)如項(10)所述的信息處理方法,其中分析對應(yīng)關(guān)系的步驟是基于所提取的顏色來提取與所提取的顏色相對應(yīng)的減色法混合組合。
(13)如項(10)所述的信息處理方法,其中讀取信息的步驟是對包含在分析出的指定區(qū)域中的信息執(zhí)行字符識別處理。
(14)如項(10)所述的信息處理方法,其中讀取信息的步驟是獲取包含在分析出的指定區(qū)域中的信息作為圖像數(shù)據(jù)。
(15)如項(10)所述的信息處理方法,其中讀取信息的步驟是讀取以下兩種信息之一(i)所述附加寫入信息中包括的區(qū)域中包含的信息,以及(ii)內(nèi)包區(qū)域與所述附加寫入信息接觸并重疊的區(qū)域中包含的信息。
(16)如項(10)所述的信息處理方法,該信息處理方法包括以下步驟輸入原始文檔和附加寫入文檔;和執(zhí)行差值提取,其中獲取顏色信息的步驟是獲取關(guān)于所產(chǎn)生的差值圖像數(shù)據(jù)的顏色信息。
(17)如項(10)所述的信息處理方法,該信息處理方法包括以下步驟輸入附加寫入文檔;和去除該附加寫入文檔中的分格線,其中獲取顏色信息的步驟是獲取關(guān)于所產(chǎn)生的已去除分格線的圖像數(shù)據(jù)的顏色信息。
(18)如項(10)所述的信息處理方法,該信息處理方法包括以下步驟基于所提取的顏色信息而生成限于多條預(yù)設(shè)顏色信息的限定顏色圖像,其中分析對應(yīng)關(guān)系的步驟是基于所述限定顏色圖像來分析通過顏色混合產(chǎn)生的顏色組合和顏色空間之一與所提取的顏色之間的對應(yīng)關(guān)系。
(19)根據(jù)本發(fā)明的第三方面,一種計算機可讀介質(zhì)存儲有使計算機執(zhí)行用以執(zhí)行文檔分析處理的處理的程序,該文檔分析處理包括以下步驟輸入通過以不同顏色將附加寫入信息寫入原始文檔中而提供的附加寫入文檔;獲取所述附加寫入文檔上的顏色信息;基于所提取的顏色,分析通過顏色混合所產(chǎn)生的顏色組合和顏色空間之一與所提取的顏色之間的對應(yīng)關(guān)系;基于分析所獲得的分析結(jié)果來確定所述附加寫入文檔中的不同顏色之間的重疊;接合與在重疊和附加寫入信息的中斷之間的對應(yīng)部分相對應(yīng)的附加寫入信息的中斷;根據(jù)經(jīng)接合的附加寫入信息來確定所述附加寫入文檔的指定區(qū)域;以及讀取分析出的指定區(qū)域中包含的信息。
本發(fā)明的計算機程序例如是可由諸如CD、FD或MO的記錄介質(zhì)或諸如網(wǎng)絡(luò)的通信介質(zhì)提供的計算機程序,所述記錄介質(zhì)或通信介質(zhì)用于為可執(zhí)行計算機可讀格式的各種程序代碼的計算機系統(tǒng)提供計算機程序。以計算機可讀格式來提供這種程序,由此在計算機系統(tǒng)中實現(xiàn)響應(yīng)于該程序的處理。
根據(jù)結(jié)合附圖對本發(fā)明的優(yōu)選實施例的以下詳細描述,本發(fā)明的上述和其它目的、特征和優(yōu)點將變得顯而易見。該說明書中的系統(tǒng)是由多個單元(裝置)組成的邏輯組,并不限于容納在單個機柜中的一組單元(裝置)。
根據(jù)本發(fā)明的構(gòu)成,例如,在對涉及利用彩色標(biāo)記進行附加寫入(其被執(zhí)行為針對文檔的屬性設(shè)定處理)的附加寫入文檔的分析處理中,圖像處理裝置檢測多條附加寫入信息之間的重疊或附加寫入信息與原始信息之間的重疊,分析重疊的顏色是按照哪種顏色組合產(chǎn)生的,恢復(fù)在該重疊中中斷的附加寫入信息,并可靠地讀取經(jīng)恢復(fù)的附加寫入信息的指定信息。圖像處理裝置對包含在經(jīng)恢復(fù)的附加寫入信息的指定信息中的字符(文本)進行字符識別等的信息分析,并將分析結(jié)果存儲在數(shù)據(jù)庫等中。根據(jù)該構(gòu)成,例如,如果在附加寫入文檔中發(fā)生不同顏色標(biāo)記之間的重疊或彩色標(biāo)記與原始信息之間的重疊,則可以提取精確的附加寫入信息,并提取和分析附加寫入信息所確定的信息。
基于附圖詳細描述本發(fā)明的示例性實施例,在附圖中圖1是描述利用附加寫入部分索引處理的針對文檔的數(shù)據(jù)處理的一般處理示例的圖;圖2是描述利用附加寫入部分索引處理的索引設(shè)定示例的圖;圖3是描述利用附加寫入部分索引處理的針對文檔的數(shù)據(jù)處理的一般處理示例的圖;圖4是描述由本發(fā)明的信息處理裝置執(zhí)行的利用附加寫入部分索引處理的針對文檔的數(shù)據(jù)處理示例的圖;圖5是描述由本發(fā)明的信息處理裝置執(zhí)行的利用附加寫入部分索引處理的針對文檔的數(shù)據(jù)處理示例的圖;
圖6A和6B是描述由本發(fā)明的信息處理裝置執(zhí)行的利用附加寫入部分索引處理的針對文檔的數(shù)據(jù)處理示例的圖;圖7A和7B是描述減色法混合的發(fā)生情況的圖;圖8A和8B是描述由本發(fā)明的信息處理裝置執(zhí)行的利用附加寫入部分索引處理的針對文檔的數(shù)據(jù)處理示例的圖;圖9A1、9A2、9B1和9B2是描述由本發(fā)明的信息處理裝置執(zhí)行的利用附加寫入部分索引處理的針對文檔的數(shù)據(jù)處理示例的圖;圖10是表示本發(fā)明的信息處理裝置的構(gòu)成示例的框圖;圖11A和11B是描述由本發(fā)明的信息處理裝置執(zhí)行的處理順序的流程圖;圖12是表示本發(fā)明的信息處理裝置的構(gòu)成示例的框圖;圖13A和13B是描述由本發(fā)明的信息處理裝置執(zhí)行的處理順序的流程圖;圖14A和14B是描述由本發(fā)明的信息處理裝置執(zhí)行的處理順序的流程圖;圖15A和15B是描述由本發(fā)明的信息處理裝置執(zhí)行的處理順序的流程圖;以及圖16是表示本發(fā)明的信息處理裝置的硬件配置示例的框圖。
具體實施例方式
將參照附圖來介紹根據(jù)本發(fā)明實施例的信息處理裝置、信息處理方法以及計算機程序。
首先,將參照圖1至3來介紹利用附加寫入部分索引處理的文檔處理的一般處理示例。附加寫入部分索引處理如下例如,操作員利用響應(yīng)于類別設(shè)定的特定顏色的標(biāo)記對文檔上的字符串等的信息進行檢查處理,通過掃描儀讀取處理后的文檔,根據(jù)讀取的圖像數(shù)據(jù)來判斷標(biāo)記顏色,對文檔上的信息進行分類,并將文檔的索引信息存儲在數(shù)據(jù)庫中。
例如,如下地響應(yīng)于信息類型來預(yù)先關(guān)聯(lián)要使用的標(biāo)記顏色紅色文件名,藍色日期,綠色關(guān)鍵字等,并且操作員從文檔中選擇與信息類型相對應(yīng)的信息,并檢查具有分配給該信息類型的標(biāo)記的選擇信息。然后,諸如PC的信息處理裝置從通過掃描儀讀取的圖像數(shù)據(jù)獲取標(biāo)記顏色信息,通過執(zhí)行例如字符識別(OCR)處理等將顏色信息的指示部分的文檔信息等轉(zhuǎn)換為數(shù)據(jù),并將該數(shù)據(jù)存儲在數(shù)據(jù)庫中作為對應(yīng)的索引信息。
將參照附圖來介紹根據(jù)本發(fā)明實施例的信息處理裝置、信息處理方法以及計算機程序。
首先,將參照圖1至3來介紹利用附加寫入部分索引處理的文檔處理的一般處理示例。附加寫入部分索引處理如下例如,操作員利用響應(yīng)于類別設(shè)定的特定顏色的標(biāo)記對文檔上的字符串等的信息進行檢查處理,通過掃描儀讀取處理后的文檔,根據(jù)讀取的圖像數(shù)據(jù)來判斷標(biāo)記顏色,對文檔上的信息進行分類,并將文檔的索引信息存儲在數(shù)據(jù)庫中。
例如,如下地響應(yīng)于信息類型來預(yù)先關(guān)聯(lián)要使用的標(biāo)記顏色紅色文件名,藍色日期,綠色關(guān)鍵字等,并且操作員從文檔中選擇與信息類型相對應(yīng)的信息,并檢查具有分配給該信息類型的標(biāo)記的選擇信息。然后,諸如PC的信息處理裝置從通過掃描儀讀取的圖像數(shù)據(jù)獲取標(biāo)記顏色信息,通過執(zhí)行例如字符識別(OCR)處理等將顏色信息的指示部分的文檔信息等轉(zhuǎn)換為數(shù)據(jù),并將該數(shù)據(jù)存儲在數(shù)據(jù)庫中作為與該文檔相對應(yīng)的索引信息。
例如,圖1所示的信息處理裝置51通過打印機52輸出存儲在數(shù)據(jù)庫54中的文檔。該文檔是圖中所示的原始文檔11。操作員基于信息類型與使用的標(biāo)記顏色之間的預(yù)設(shè)對應(yīng)關(guān)系來利用標(biāo)記執(zhí)行對原始文檔11的附加寫入。結(jié)果是圖中所示的附加寫入文檔12。
例如,基于預(yù)定規(guī)則在附加寫入文檔上設(shè)置紅色、藍色和綠色標(biāo)記21至23。例如,標(biāo)記顏色與信息類型之間的對應(yīng)關(guān)系設(shè)定為紅色文件名,藍色日期,綠色關(guān)鍵字。
通過掃描儀53讀取附加寫入文檔12,信息處理裝置51執(zhí)行數(shù)據(jù)處理并執(zhí)行與要處理的文檔相對應(yīng)的索引信息的設(shè)定處理。
下面將參照圖2來介紹信息處理裝置51中執(zhí)行的索引設(shè)定處理。將與先前參照圖1描述的原始文檔11相對應(yīng)的文檔數(shù)據(jù)文件71存儲在數(shù)據(jù)庫54中,信息處理裝置51基于先前參照圖1描述的附加寫入文檔12來提取與原始文檔11相對應(yīng)的索引信息,并將該索引信息存儲在數(shù)據(jù)庫中作為與所述文檔相對應(yīng)的索引信息。
信息處理裝置51基于標(biāo)記顏色與信息類型之間的如下對應(yīng)關(guān)系信息從附加寫入文檔12讀取信息紅色文件名,藍色日期,綠色關(guān)鍵字,并通過結(jié)合利用字符識別處理(OCR)等來獲取圖2所示的索引信息。在該圖所示的示例中,從附加寫入文檔12提取下面的多條索引信息并將其存儲在數(shù)據(jù)庫54中作為文檔的索引信息(1)標(biāo)記顏色=紅色->文件名“備忘錄”,“安全措施課程CD-ROM發(fā)布及開發(fā)”(2)標(biāo)記顏色=藍色->日期“2004年3月29日”(3)標(biāo)記顏色=綠色->關(guān)鍵字“安全措施課程網(wǎng)絡(luò)社會中存在風(fēng)險?。 薄?br>
下面將參照圖3來介紹給出索引處理的順序。圖3所示的文檔101是對其應(yīng)用索引提取處理的文檔。在步驟S11,操作員利用與信息類型相對應(yīng)的預(yù)定標(biāo)記顏色對文檔101執(zhí)行標(biāo)記附加寫入,以產(chǎn)生標(biāo)記附加寫入文檔102。
信息處理裝置51通過掃描儀讀取標(biāo)記附加寫入文檔102,并執(zhí)行數(shù)據(jù)處理(步驟S12處的彩色標(biāo)注提取處理)。
信息處理裝置51基于如下對應(yīng)關(guān)系信息從標(biāo)記附加寫入文檔102提取信息紅色文件名,藍色日期,綠色關(guān)鍵字。
如圖中所示,提取出(1)紅色標(biāo)記記錄數(shù)據(jù)103a(2)藍色標(biāo)記記錄數(shù)據(jù)103b(3)綠色標(biāo)記記錄數(shù)據(jù)103c信息處理裝置51在步驟S13從提取的數(shù)據(jù)中執(zhí)行字符串提取,獲得如圖所示的以下索引信息并將這些索引信息存儲在數(shù)據(jù)庫中作為文檔101的索引信息(1)索引數(shù)據(jù)104a=[標(biāo)記顏色=紅色->文件名“備忘錄”,“安全措施課程CD-ROM發(fā)布及開發(fā)”](2)索引數(shù)據(jù)104b=[標(biāo)記顏色=藍色->日期“2004年3月29日”](3)索引數(shù)據(jù)104c=[標(biāo)記顏色=綠色->關(guān)鍵字“安全措施課程網(wǎng)絡(luò)社會中存在風(fēng)險!!”]。
因此,可以針對各類型對包含在文檔中的各條數(shù)據(jù)進行分類或歸類,并將與文檔相對應(yīng)的索引信息存儲在數(shù)據(jù)庫等的存儲部中。在處理中,人(操作員)輸入標(biāo)記。然而,如上所述,如果利用各種彩色標(biāo)記附加寫入到原稿,則可能發(fā)生作為附加寫入信息的不同標(biāo)記顏色之間的重疊,此外,可能發(fā)生作為附加寫入的標(biāo)記顏色與原始信息之間的重疊。在不同顏色之間的發(fā)生重疊的部分中,當(dāng)通過掃描儀進行讀取時,基本的標(biāo)記顏色被讀取為不同的顏色。因此,如果讀取這種原稿,則存在如下問題在重疊部分中無法執(zhí)行精確的標(biāo)記顏色提取,且無法精確地執(zhí)行基于標(biāo)記顏色對附加寫入?yún)^(qū)域的確定。
本發(fā)明具有解決這種問題的構(gòu)成。即,在作為屬性設(shè)定處理而執(zhí)行的利用彩色標(biāo)記的附加寫入中,使得可以分析作為不同標(biāo)記顏色的多條附加寫入信息之間的重疊或附加寫入信息與原始信息之間的重疊,并使得可以精確地提取附加寫入?yún)^(qū)域。下面將參照圖4及其以后的圖來詳細地介紹本發(fā)明的信息處理裝置51執(zhí)行的處理。
圖4是描述在作為對文檔的屬性設(shè)定處理而執(zhí)行的利用彩色標(biāo)記的附加寫入中發(fā)生作為不同標(biāo)記顏色的多條附加寫入信息之間的重疊或附加寫入信息與原始信息之間的重疊的具體示例的圖。
操作員利用各種彩色標(biāo)記對圖4所示的原始文檔201進行作為屬性設(shè)定的檢查。這里,示出了利用與各屬性相關(guān)聯(lián)的彩色標(biāo)記執(zhí)行圍繞與特定屬性(例如,日期、文件名、關(guān)鍵字等)相對應(yīng)的文檔區(qū)域的處理的示例。在圖4所示的示例中,標(biāo)記顏色是黃色(Y)、品紅色(M)以及藍色(B),原稿的顏色是黑色(K)。
操作員利用標(biāo)記得到的屬性賦予結(jié)果是附加寫入文檔202。利用黃色(Y)、品紅色(M)和藍色(B)的彩色標(biāo)記來檢查附加寫入文檔202。然而,在具有標(biāo)記附加寫入的附加寫入文檔202中發(fā)生附加寫入信息重疊211(不同標(biāo)記顏色之間的重疊)以及附加寫入與原始信息重疊212(標(biāo)記顏色與原稿的原始信息之間的重疊)。
在附加寫入信息重疊211和附加寫入與原始信息重疊212中,當(dāng)通過掃描儀讀取附加寫入文檔原稿時,不能識別出作為基本附加寫入信息的標(biāo)記顏色。結(jié)果,不可能精確地把握具有標(biāo)記顏色的指定區(qū)域。
本質(zhì)上,必須從圖5所示的附加寫入文檔202中精確地讀取下面三個指定區(qū)域
黃色(Y)標(biāo)記顏色指定區(qū)域221,品紅色(M)標(biāo)記顏色指定區(qū)域222,和藍色(B)標(biāo)記顏色指定區(qū)域223,針對這三個區(qū)域中的文本信息執(zhí)行OCR處理,并存儲在數(shù)據(jù)庫等的存儲部中作為與各屬性相對應(yīng)的索引信息。然而,在通過掃描儀進行讀取時,在附加寫入信息重疊211或附加寫入與原始信息重疊212中無法檢測到基本標(biāo)記顏色,從而難以把握具有標(biāo)記的指定區(qū)域。
本發(fā)明的信息處理裝置51分析附加寫入信息重疊211和附加寫入與原始信息重疊212,并可以檢測基本標(biāo)記顏色。下面將參照附圖來介紹分析處理示例。圖6A和6B是描述基于對不同標(biāo)記顏色之間的重疊的顏色分析而彼此區(qū)分不同標(biāo)記顏色的附加寫入?yún)^(qū)域的處理的圖。
圖6A表示其中當(dāng)使用黃色(Y)和品紅色(M)作為兩種不同標(biāo)記顏色時發(fā)生重疊的示例。如圖6A所示,設(shè)定黃色(Y)標(biāo)記附加寫入?yún)^(qū)域231和品紅色(M)標(biāo)記附加寫入?yún)^(qū)域232,在兩條附加寫入信息中發(fā)生重疊233。
當(dāng)通過掃描儀來讀取原稿時,重疊233被識別為紅色(R)。即,根據(jù)下式將其識別為紅色(R)黃色(Y)+品紅色(M)=紅色(R)。
假定通過掃描儀讀取的顏色信息是先前用于原稿的原始信息顏色(例如,黑色)以及用于附加寫入的標(biāo)記顏色(這里為黃色(Y)和品紅色(M))。即,基本上通過掃描儀讀取的顏色信息原則上是黑色(K)、黃色(Y)和品紅色(M)三種顏色中的任一種。
如果從掃描儀讀取的原稿中檢測到除基本使用的顏色之外的任何顏色,則本發(fā)明的信息處理裝置51確定該顏色是通過混合顏色而產(chǎn)生的顏色,并基于檢測到的顏色來分析混合了哪些顏色。
在圖6A和6B所示的示例中,在重疊233中檢測到紅色(R)。本發(fā)明的信息處理裝置51分析混合了黑色(K)、黃色(Y)和品紅色(M)三種顏色中的哪些而產(chǎn)生了檢測到的紅色。信息處理裝置51將原始顏色信息和用作附加寫入標(biāo)記的顏色信息(例如,黑色、黃色和品紅色)保存在存儲部中,并在使用顏色信息與通過掃描儀讀取的顏色信息之間進行比較,以分析混合了哪種使用顏色而產(chǎn)生檢測到的不包含在使用顏色信息(例如,黑色、黃色和品紅色)中的顏色(紅色)。
在圖6A和6B所示的示例中,在重疊233中檢測到紅色(R)。紅色(R)被分析為是通過混合黃色(Y)和品紅色(M)而產(chǎn)生的顏色。即,確定紅色(R)=黃色(Y)+品紅色(M)并確定重疊223是黃色(Y)標(biāo)記與品紅色(M)標(biāo)記之間的重疊。根據(jù)先前制定的規(guī)則來進行基于檢測到的顏色的顏色分析。
信息處理裝置51可預(yù)先將掃描儀檢測到的顏色信息與檢測到的顏色信息中包含的多個使用顏色之間的對應(yīng)關(guān)系表保存在信息處理裝置51的存儲部中,并可利用該對應(yīng)關(guān)系表基于檢測到的顏色來分析使用顏色,或可基于檢測到的顏色而執(zhí)行顏色分離處理并可依次分析實際使用顏色。為生成該表或進行顏色分析,可應(yīng)用在顏色分析領(lǐng)域中已知的顏色空間中的減色法混合區(qū)域信息。
下面將參照圖7A和7B來介紹減色法混合。圖7A和7B是描述在不同顏色空間中的減色法混合的如下發(fā)生狀況的圖(1)在CMYK(或RGB)空間中的減色法混合的發(fā)生狀況;和(2)在Lab空間中的減色法混合的發(fā)生狀況。
在示出CMYK(或RGB)空間中的減色法混合的發(fā)生狀況的圖7A中,頂點表示C(青色)、M(品紅色)、Y(黃色)、K(黑色)、R(紅色)、G(綠色)、B(藍色)和W(白色)。例如,采用圖中所示的提取顏色241作為提取顏色。如果任何其它顏色與提取顏色混合而產(chǎn)生的顏色區(qū)域是由圖中所示的長方體所表示的作為可能發(fā)生減色法混合的部分顏色空間242的區(qū)域。
即,由以連接提取顏色和黑色(K)的線作為對角線的長方體表示可能發(fā)生減色法混合的部分顏色空間。因此,例如,如果從掃描儀讀取信息中獲得未用作原始顏色或附加寫入標(biāo)記顏色的顏色,則可以根據(jù)可能發(fā)生減色法混合的部分顏色空間來逆向分析該混合顏色。
例如,如果假設(shè)當(dāng)通過掃描儀讀取的顏色是紅色(R)時,紅色(R)是通過減色法混合而產(chǎn)生的,則可確定該混合顏色位于M(品紅色)、Y(黃色)、R(紅色)和W(白色)的平面上。例如,如果用作原稿和標(biāo)記的顏色是M(品紅色)和Y(黃色),則確定R(紅色)是通過混合M(品紅色)和Y(黃色)而產(chǎn)生的顏色,并可確定掃描儀檢測到的R(紅色)是通過混合M(品紅色)和Y(黃色)而產(chǎn)生的。
圖7A是示出CMYK(或RGB)空間中的減色法混合的發(fā)生狀況的圖;不僅在CMYK(或RGB)空間中,而且在Lab空間中,如圖7B所示,可將圖中示出為若任何其它顏色與提取顏色251混合而產(chǎn)生的顏色的區(qū)域的錐形區(qū)域定義為可能發(fā)生減色法混合的部分顏色空間252。因此,可在CMYK、RGB、Lab等的各種顏色空間中單獨地定義可能發(fā)生減色法混合的部分顏色空間,并可使用根據(jù)掃描儀讀取信息而分析的顏色信息的各種設(shè)定。
應(yīng)用上述減色法混合區(qū)域信息,從而本發(fā)明的信息處理裝置51生成掃描儀檢測到的顏色信息與檢測到的顏色信息中包含的多個使用顏色之間的對應(yīng)關(guān)系表,并預(yù)先將該對應(yīng)關(guān)系表保存在信息處理裝置51的存儲部中,并利用該對應(yīng)關(guān)系表基于檢測到的顏色來分析使用顏色。另選地,信息處理裝置51通過應(yīng)用上述減色法混合區(qū)域信息而基于檢測到的顏色執(zhí)行顏色分離處理,并依次分析實際使用顏色。在任一種情況下,必須預(yù)先獲得讀取原稿中使用的原始和附加寫入信息的使用顏色信息。
已參照圖6A和6B描述了當(dāng)發(fā)生不同顏色的多條附加寫入信息之間的重疊時的顏色分析。當(dāng)利用彩色標(biāo)記對文檔進行附加寫入時,還發(fā)生彩色標(biāo)記與原始信息之間的重疊。即,例如,如圖8A所示,發(fā)生原始信息=黑色(K)與附加寫入標(biāo)記顏色=品紅色(M)之間的重疊等。
在該情況下,也進行應(yīng)用上述減色法混合區(qū)域信息的分析,或基于檢測到的顏色信息與檢測到的顏色信息中包含的多個使用顏色之間的對應(yīng)關(guān)系表而進行分析。如圖中所示,品紅色(M)+黑色(K)=黑色(K)在該情況下,原始信息=黑色(K)與附加寫入標(biāo)記顏色=品紅色(M)之間的重疊變?yōu)楹谏?K),這與原始信息相同。信息處理裝置51檢測到附加寫入?yún)^(qū)域的中斷(break),并且如果該中斷被設(shè)定為上述的條件顏色,例如,品紅色(M)+黑色(K)=黑色(K),則信息處理裝置51確定檢測到的中斷是品紅色(M)與黑色(K)之間的重疊,并執(zhí)行以附加寫入顏色(品紅色(M))連接中斷的處理,以恢復(fù)為如圖8B所示的沒有中斷的附加寫入信息261,從而獲得由該經(jīng)恢復(fù)的附加寫入信息所指定的部分(包含區(qū)域與重疊)中包含的原始信息262,并提取該原始信息作為具有由附加寫入信息261所指定的屬性的信息。
本發(fā)明的信息處理裝置51執(zhí)行這樣的分析處理,由此執(zhí)行對附加寫入信息與任何其它信息(原始信息或任何其它附加寫入信息)之間的重疊的顏色分析,并精確地獲得與基本使用顏色相對應(yīng)的準確的附加寫入信息區(qū)域和由附加寫入指定的原始信息。
圖9示出在如下示例中基于顏色分析對附加寫入信息記錄區(qū)域的檢測處理示例(1)黑線與單色附加寫入重疊的示例(2)黑線與雙色附加寫入重疊的示例。
在圖9A的示例中,例如,使用黑色(K)作為原始信息并使用品紅色(M)作為附加寫入信息,黑色(K)與品紅色(M)之間的重疊變?yōu)槠芳t色(M)+黑色(K)=黑色(K)并從掃描儀讀取信息中將作為附加寫入信息的品紅色(M)獲得為中斷信息。信息處理裝置51確定品紅色(M)的附加寫入信息的中斷是否為與通過基于使用顏色(品紅色(M)與黑色(K))的上述減色法混合所產(chǎn)生的顏色信息相對應(yīng)的顏色。如果信息處理裝置51確定其為可能發(fā)生的顏色,則信息處理裝置51確定該區(qū)域是由于使用顏色之間的重疊而出現(xiàn)的區(qū)域,即,在本示例中為通過如下混合而產(chǎn)生的黑色(K)品紅色(M)+黑色(K)=黑色(K)并確定檢測到的中斷是品紅色(M)與黑色(K)之間的重疊,且執(zhí)行以附加寫入顏色(品紅色(M))連接中斷的處理,以恢復(fù)為如圖9A2所示的沒有中斷的附加寫入信息,從而獲得由經(jīng)恢復(fù)的附加寫入信息所指定的部分(內(nèi)包區(qū)域與重疊)中包含的原始信息,并在存儲部(數(shù)據(jù)庫)中登記該原始信息作為具有與附加寫入顏色相對應(yīng)的屬性的信息。
在圖9B的示例中,例如,使用黑色(K)作為原始信息并使用品紅色(M)和黃色(Y)作為附加寫入信息。在本示例中,發(fā)生下面三種不同的重疊(a)黃色(Y)與品紅色(M)之間的重疊->黃色(Y)+品紅色(M)=紅色(R);(b)黃色(Y)與黑色(K)之間的重疊->黃色(Y)+黑色(K)=黑色(K);以及(c)品紅色(M)與黑色(K)之間的重疊->品紅色(M)+黑色(K)=黑色(K)。
從掃描儀讀取信息中將作為附加寫入信息的品紅色(M)和黃色(Y)獲得為中斷信息。信息處理裝置51確定品紅色(M)和黃色(Y)的附加寫入信息的中斷是否為與通過基于使用顏色(品紅色(M)、黃色(Y)和黑色(K))的上述減色法混合所產(chǎn)生的顏色信息相對應(yīng)的顏色。如果信息處理裝置51確定其為可能發(fā)生的顏色,則信息處理裝置51確定該區(qū)域是由于使用顏色之間的重疊而出現(xiàn)的區(qū)域。
在該示例中,如果品紅色(M)的附加寫入信息的中斷是通過如下混合而產(chǎn)生的黑色(K)品紅色(M)+黑色(K)=黑色(K),則確定檢測到的中斷是品紅色(M)與黑色(K)之間的重疊,并以附加寫入顏色(品紅色(M))連接該中斷。
同理,如果黃色(Y)的附加寫入信息的中斷是通過如下混合而產(chǎn)生的黑色(K)黃色(Y)+黑色(K)=黑色(K),則確定檢測到的中斷是黃色(Y)與黑色(K)之間的重疊,并以附加寫入顏色(黃色(Y))連接該中斷。
未包含在使用顏色中的紅色(R)的檢測部分被確定是通過上述減色法混合而產(chǎn)生的顏色,并且由于黃色(Y)+品紅色(M)=紅色(R),所以確定在紅色(R)的檢測部分中混合的以前的顏色信息是黃色(Y)和品紅色(M),并確定該區(qū)域是黃色(Y)與品紅色(M)之間的重疊區(qū)域。
基于該分析,執(zhí)行如下處理恢復(fù)為如圖9B2所示的沒有中斷的附加寫入信息,獲得由經(jīng)恢復(fù)的附加寫入信息所指定的部分(內(nèi)包區(qū)域與重疊)中包含的原始信息,并在存儲部(數(shù)據(jù)庫)中對該原始信息進行登記,作為具有與附加寫入顏色相對應(yīng)的屬性的信息。
接下來,將參照圖10和11來介紹本發(fā)明的信息處理裝置的一個實施例的構(gòu)成。圖10是示出本發(fā)明的信息處理裝置的一個實施例的構(gòu)成的框圖,而圖11是與圖10中所示的信息處理裝置中執(zhí)行的處理示例相對應(yīng)的流程圖。
如圖10所示,信息處理裝置400具有數(shù)據(jù)輸入單元401、顏色提取單元402、顏色分析單元403、接合和整合單元(后文也簡稱為“附加寫入?yún)^(qū)域接合和整合單元”)404、確定單元(后文也簡稱為“附加寫入?yún)^(qū)域指定部分確定單元”)405、信息分析單元(后文也簡稱為“附加寫入?yún)^(qū)域指定部分信息分析單元”)406、以及分析信息存儲單元407。將參照圖11的流程圖來介紹具有該構(gòu)成的信息處理裝置400中的處理示例。
圖11提供與兩個處理順序相對應(yīng)的兩個流程圖。首先,介紹根據(jù)圖11A的流程圖的處理示例。首先,在步驟S101,圖10所示的數(shù)據(jù)輸入單元401輸入要處理的圖像數(shù)據(jù)。例如,該圖像數(shù)據(jù)是具有以不同彩色標(biāo)記設(shè)定的屬性(即,用標(biāo)記進行了檢查)的文檔圖像數(shù)據(jù);輸入通過掃描儀讀取的數(shù)據(jù)、存儲在存儲部中的圖像數(shù)據(jù)等作為要處理的數(shù)據(jù)。
在步驟S102,顏色提取單元402提取在輸入的圖像數(shù)據(jù)中使用的顏色。例如,提取用在原始信息中的黑色(K)和用作附加寫入信息的黃色(Y)和品紅色(M)。
在步驟S103,顏色分析單元403在顏色空間(YMCK、GBR等的顏色空間)中針對在步驟102提取的顏色而提取可能發(fā)生減色法混合的各部分顏色空間。例如,如果例如使用黑色(K)作為原始信息并使用黃色(Y)和品紅色(M)作為附加寫入信息,則提取顏色241被設(shè)定為圖7A所示的顏色空間中的黑色(K)、黃色(Y)和品紅色(M),找出可能發(fā)生減色法混合的各部分顏色空間,并將其作為接合和恢復(fù)時的目標(biāo)顏色區(qū)域。例如,紅色(R)成為黃色(Y)和品紅色(M)的接合和恢復(fù)時的目標(biāo)顏色區(qū)域。
接下來,在步驟S104,附加寫入?yún)^(qū)域接合和整合單元404利用減色法混合的部分顏色空間信息針對各像素進行接合和整合。如果黑色(K)、黃色(Y)和品紅色(M)是使用顏色,則由減色法混合所產(chǎn)生的顏色是根據(jù)下面關(guān)系式的黑色(K)和紅色(R)區(qū)域
品紅色(M)+黑色(K)=黑色(K)黃色(Y)+黑色(K)=黑色(K)黃色(Y)+品紅色(M)=紅色(R)并且如果以品紅色(M)或黃色(Y)設(shè)定的附加寫入信息中的中斷的發(fā)生部分是黑色(K)或紅色(R),則確定該區(qū)域為使用區(qū)域之間的重疊區(qū)域并發(fā)生了中斷,接合該部分以產(chǎn)生恢復(fù)的附加寫入信息。
接著,在步驟S105,附加寫入?yún)^(qū)域指定部分確定單元405提取文本信息、圖像信息作為由經(jīng)恢復(fù)的附加寫入信息所包括的信息。例如,如圖5所示,提取由附加寫入信息221至223所包括的原始信息(文本信息、圖像信息)。
接著,在步驟S106,圖10所示的附加寫入?yún)^(qū)域指定部分信息分析單元406和分析信息存儲單元407分析附加寫入信息的內(nèi)包區(qū)域中的信息(文本信息、圖像信息),并且例如通過執(zhí)行OCR來分析文本信息,且將圖像信息存儲在存儲部中作為圖像數(shù)據(jù)。
在圖11B所示的處理流程中,S201和S202類似于圖11A所示的處理流程的S101和S102。在S201,輸入要處理的文檔圖像,在步驟S202從輸入的文檔圖像提取顏色。在圖11B所示的處理流程中,在S203,顏色分析單元403針對在S202從文檔中提取的顏色檢查減色法混合組合。
例如,如果使用黑色(K)作為原始信息并使用黃色(Y)和品紅色(M)作為附加寫入信息,則顏色分析單元403基于使用顏色來檢查可能是由減色法混合所產(chǎn)生的顏色。在該情況下,根據(jù)下面關(guān)系式確定減色法混合所產(chǎn)生的顏色為黑色(K)和紅色(R)品紅色(M)+黑色(K)=黑色(K)黃色(Y)+黑色(K)=黑色(K)
黃色(Y)+品紅色(M)=紅色(R)。
接下來,在步驟S204,附加寫入?yún)^(qū)域接合和整合單元404參照在S203分析的減色法混合組合,接合并整合各像素的區(qū)域。即,如果黑色(K)和紅色(R)區(qū)域是通過減色法混合以多個顏色產(chǎn)生的顏色,并且以品紅色(M)或黃色(Y)設(shè)定的附加寫入信息中的中斷的發(fā)生部分是黑色(K)或紅色(R),則確定該區(qū)域為使用區(qū)域之間的重疊區(qū)域并發(fā)生了中斷,接合該部分以產(chǎn)生經(jīng)恢復(fù)的附加寫入信息。
S205和S206類似于圖11A所示的處理流程中的S105和S106。通過圖10所示的附加寫入?yún)^(qū)域指定部分信息分析單元406和分析信息存儲單元407,提取由經(jīng)恢復(fù)的附加寫入信息所包括的信息,分析附加寫入信息的內(nèi)包區(qū)域中的信息并將其存儲在存儲部中。
接下來,將參照圖12來介紹本發(fā)明的信息處理裝置的第二實施例的構(gòu)成。類似于先前參照圖10描述的信息處理裝置,圖12所示的信息處理裝置420具有數(shù)據(jù)輸入單元401、顏色提取單元402、顏色分析單元403、附加寫入?yún)^(qū)域接合和整合單元404、附加寫入?yún)^(qū)域指定部分確定單元405、附加寫入?yún)^(qū)域指定部分信息分析單元406、以及分析信息存儲單元407。除了這些部件,信息處理裝置420還具有圖像處理單元421和限定顏色圖像生成單元422。
作為對要處理的輸入圖像的預(yù)處理,圖像處理單元421例如執(zhí)行差值提取處理根據(jù)附加有彩色標(biāo)記的附加寫入圖像數(shù)據(jù)與附加寫入前的原始圖像之差而僅僅提取附加寫入信息,或者如果原始文檔包含分格線(rule line)則執(zhí)行去除分格線等的處理等。
限定顏色圖像生成單元422執(zhí)行下面的處理將在顏色提取單元402中從要處理的文檔獲得的顏色信息只分配到特定顏色,例如,先前輸入到信息處理裝置的使用顏色信息和可能是由減色法混合所產(chǎn)生的顏色。例如,如果對于原始信息使用黑色(K)并使用黃色(Y)和品紅色(M)作為附加寫入信息,則將在顏色提取單元402中從要處理的文檔獲得的顏色信息分配到使用顏色和可能是由減色法混合所產(chǎn)生的“紅色(R)”。即,即使由于掃描儀讀取錯誤等而檢測到具有小誤差的顏色,也將該顏色分配到少數(shù)限定顏色中的任一個,由此可靠地提取全部信息。
下面將參照圖13至15的流程圖來介紹具有圖12所示的構(gòu)成的信息處理裝置420中的處理示例。圖13至15示出13A到15B的六個處理流程。在圖13和14所示的流程13A到14B是在圖12所示的信息處理裝置420中不應(yīng)用圖像處理單元421的處理的處理,是使用下面單元的處理數(shù)據(jù)輸入單元401、顏色提取單元402、限定顏色圖像生成單元422、顏色分析單元403、附加寫入?yún)^(qū)域接合和整合單元404、附加寫入?yún)^(qū)域指定部分確定單元405、附加寫入?yún)^(qū)域指定部分信息分析單元406、以及分析信息存儲單元407。圖15A和15B所示的流程是描述除上述部件外還應(yīng)用圖像處理單元421的處理順序的處理流程。
首先,介紹根據(jù)圖13A的流程圖的處理。首先,在S301,圖12所示的數(shù)據(jù)輸入單元401輸入要處理的圖像數(shù)據(jù)。例如,該圖像數(shù)據(jù)是具有以不同彩色標(biāo)記設(shè)定的屬性(即,用標(biāo)記進行了檢查)的文檔圖像數(shù)據(jù);輸入通過掃描儀讀取的數(shù)據(jù)、存儲在存儲部中的圖像數(shù)據(jù)等作為要處理的數(shù)據(jù)。
在步驟S302,顏色提取單元402和限定顏色圖像生成單元422執(zhí)行處理。首先,顏色提取單元402提取輸入的圖像數(shù)據(jù)中使用的顏色。例如,提取在原始信息中使用的黑色(K)和用作附加寫入信息的黃色(Y)及品紅色(M),還有從附加寫入信息重疊(例如,黃色(Y)和品紅色(M))等中檢測的紅色(R),此外,還檢測由于打印時或掃描時的誤差而被確定為接近于黃色(Y)、品紅色(M)或紅色(R)的顏色的顏色區(qū)域。
限定顏色圖像生成單元422執(zhí)行限定顏色轉(zhuǎn)換,以通過限定顏色轉(zhuǎn)換確定包含小誤差的顏色區(qū)域是有限個顏色。例如,執(zhí)行下面的處理,即僅將顏色信息分配到先前輸入至信息處理裝置的使用顏色信息和可能由減色法混合所產(chǎn)生的顏色。如果對于原始信息使用黑色(K)并使用黃色(Y)和品紅色(M)作為附加寫入信息,則將在顏色提取單元402中從要處理的文檔獲取的顏色信息分配到使用顏色和可能由減色法混合所產(chǎn)生的顏色“紅色(R)”。
在S303,顏色分析單元403針對從302產(chǎn)生的限定顏色文檔提取的顏色來檢查減色法混合組合。例如,如果使用黑色(K)作為原始信息并且使用黃色(Y)和品紅色(M)作為附加寫入信息,則顏色分析單元403基于使用顏色而檢查可能由減色法混合所產(chǎn)生的顏色。在該示例中,根據(jù)以下關(guān)系式確定由減色法混合所產(chǎn)生的顏色為黑色(K)和紅色(R)品紅色(M)+黑色(K)=黑色(K)黃色(Y)+黑色(K)=黑色(K)黃色(Y)+品紅色(M)=紅色(R)。
接下來,在S304,附加寫入?yún)^(qū)域接合和整合單元404參照在S303處分析的減色法混合的組合,接合并整合各像素的區(qū)域。即,如果黑色(K)和紅色(R)區(qū)域是通過減色法混合以多個顏色產(chǎn)生的顏色,且以品紅色(M)或黃色(Y)設(shè)定的附加寫入信息中的中斷的發(fā)生部分是黑色(K)或紅色(R),則確定該區(qū)域為使用區(qū)域之間的重疊區(qū)域并發(fā)生中斷,并且接合該部分以產(chǎn)生經(jīng)恢復(fù)的附加寫入信息。
S305和S306類似于圖11A所示的處理流程中的S105和S106。通過圖12所示的附加寫入?yún)^(qū)域指定部分信息分析單元406和分析信息存儲單元407,提取由經(jīng)恢復(fù)的附加寫入信息所包括的信息,分析附加寫入信息的內(nèi)包區(qū)域中的信息并將其存儲在存儲部中。
在圖13B所示的處理流程中,步驟S401到S403類似于圖13A所示的處理流程中的S301到S303。在圖13B所示的處理流程中,在步驟S404,附加寫入?yún)^(qū)域接合和整合單元404參照在步驟S403分析的減色法混合的組合,接合并整合各像素的區(qū)域。即,如果黑色(K)和紅色(R)區(qū)域是通過減色法混合以多個顏色產(chǎn)生的顏色,且以品紅色(M)或黃色(Y)設(shè)定的附加寫入信息中的中斷的發(fā)生部分是黑色(K)或紅色(R),則確定該區(qū)域為使用區(qū)域之間的重疊區(qū)域并發(fā)生了中斷,并且接合該部分以產(chǎn)生經(jīng)恢復(fù)的附加寫入信息。為執(zhí)行處理,如果對應(yīng)于重疊顏色(減色法混合)的顏色區(qū)域大于預(yù)定值(閾值),則附加寫入?yún)^(qū)域接合和整合單元404執(zhí)行針對各像素的接合,并當(dāng)以最短距離到達當(dāng)前像素時,接合并整合該顏色區(qū)域。
步驟S405和S406類似于圖11A所示的處理流程中的S105和S106。通過圖12所示的附加寫入?yún)^(qū)域指定部分信息分析單元406和分析信息存儲單元407,提取由經(jīng)恢復(fù)的附加寫入信息所包括的信息,分析附加寫入信息的內(nèi)包區(qū)域中的信息并將其存儲在存儲部中。
類似于圖13中的處理流程,圖14所示的處理流程是在圖12所示的信息處理裝置420中不應(yīng)用圖像處理單元421的處理的處理,是使用下面單元的處理數(shù)據(jù)輸入單元401、顏色提取單元402、限定顏色圖像生成單元422、顏色分析單元403、附加寫入?yún)^(qū)域接合和整合單元404、附加寫入?yún)^(qū)域指定部分確定單元405、附加寫入?yún)^(qū)域指定部分信息分析單元406、以及分析信息存儲單元407。
首先,將介紹圖14A所示的處理流程。在該處理流程中,S501到S505類似于圖13A所示的處理流程中的S301到S305。即,在S501,數(shù)據(jù)輸入單元401輸入要處理的圖像數(shù)據(jù)。在S502,顏色提取單元402提取使用顏色,限定顏色圖像生成單元422將提取顏色轉(zhuǎn)換為限定顏色。在S503,顏色分析單元403針對從在S502產(chǎn)生的限定顏色圖像提取的顏色檢查減色法混合的組合。
接著,在S504,附加寫入?yún)^(qū)域接合和整合單元404參照在S503分析的減色法混合的組合,針對各像素進行接合和整合。此外,在S505,通過經(jīng)恢復(fù)的附加寫入信息來確定內(nèi)包區(qū)域。
在該處理示例中,S506不同于圖13A所示的S306。在S506,圖12所示的附加寫入?yún)^(qū)域指定部分信息分析單元406獲取與經(jīng)恢復(fù)的附加寫入信息接觸且重疊的區(qū)域以及經(jīng)恢復(fù)的附加寫入信息所包括的區(qū)域作為分析目標(biāo)信息,并且進行分析,例如執(zhí)行字符識別(OCR)處理。該處理是基于如下確定的附加寫入信息與作為原始信息的字符信息之間的重疊區(qū)域例如也包含在由附加寫入信息對其賦予屬性的信息中。
接下來,將介紹圖14B所示的處理流程。圖14B中的處理流程也在圖12所示的信息處理裝置中執(zhí)行。S601至S605類似于圖13A的流程圖中的S301至S305以及圖14A的流程圖中的S501至S505,因此將不再對其進行介紹。
在該處理示例中,S606不同于圖13A中的S306和圖14A中的S506。在該處理示例中,在S606,圖12所示的附加寫入?yún)^(qū)域指定部分信息分析單元406和分析信息存儲單元407將附加寫入信息的內(nèi)包區(qū)域中的圖像信息存儲在存儲部中。在迄今描述的處理流程中,針對文本圖像信息執(zhí)行字符識別處理(OCR),并將該信息轉(zhuǎn)換為例如文本數(shù)據(jù),然后將其存儲在存儲部中。然而,在該處理示例中,獲取由附加寫入信息指定的區(qū)域中的圖像數(shù)據(jù),并將其存儲在存儲部中。在該情況下,將圖像數(shù)據(jù)存儲在存儲部中作為與特定屬性相關(guān)聯(lián)的圖像數(shù)據(jù)。
接下來,將介紹圖15所示的處理流程。在圖15A和15B中所示的流程是在圖12所示的信息處理裝置420中應(yīng)用圖像處理單元421的處理的處理,是使用下面單元的處理數(shù)據(jù)輸入單元401、圖像處理單元421、顏色提取單元402、限定顏色圖像生成單元422、顏色分析單元403、附加寫入?yún)^(qū)域接合和整合單元404、附加寫入?yún)^(qū)域指定部分確定單元405、附加寫入?yún)^(qū)域指定部分信息分析單元406、以及分析信息存儲單元407。
首先將介紹圖15A所示的處理流程。首先,在S701,圖12所示的數(shù)據(jù)輸入單元401輸入要處理的圖像數(shù)據(jù)。例如,該圖像數(shù)據(jù)是具有以不同彩色標(biāo)記設(shè)定的屬性(即,用標(biāo)記進行了檢查)的文檔圖像數(shù)據(jù);輸入通過掃描儀讀取的數(shù)據(jù)、存儲在存儲部中的圖像數(shù)據(jù)等作為要處理的數(shù)據(jù)。
接著,在圖像處理單元421中執(zhí)行S702和S703。在S702,圖像處理單元421利用要處理文檔的標(biāo)識符(例如,打印輸出ID)作為關(guān)鍵字在信息處理裝置的存儲部、通過網(wǎng)絡(luò)連接的數(shù)據(jù)庫等中搜索原稿(不帶附加寫入的文檔或圖像),并輸入或下載所發(fā)現(xiàn)的原稿。
例如,如果輸入圖4所示的附加寫入文檔202作為要處理的圖像數(shù)據(jù),則輸入與附加寫入文檔202相對應(yīng)的原始文檔201,此外,在S703,圖像處理單元421提取具有附加寫入的圖像與原稿之間的差,并提取附加寫入部分的差值圖像。即,例如執(zhí)行圖4所示的附加寫入文檔202與原始文檔201之間的差值分析,用以提取附加寫入部分的差值圖像。
下面將介紹差值提取處理的概要。首先,執(zhí)行對原始文檔圖像和附加寫入文檔圖像兩個圖像的對準處理。關(guān)于兩個圖像的對準技術(shù),可應(yīng)用任何現(xiàn)有的各種技術(shù)。基本上,從圖像提取類似的特征區(qū)域,并將它們彼此關(guān)聯(lián)?;谙嚓P(guān)聯(lián)的特征區(qū)域計算兩個圖像之間的偏移量,并在基于偏移量對圖像數(shù)據(jù)進行校正的同時將這些圖像對準。
接著,提取經(jīng)對準的原始文檔圖像數(shù)據(jù)與附加寫入文檔圖像數(shù)據(jù)之差。在該處理中,例如,檢測原始文檔圖像數(shù)據(jù)的坐標(biāo)位置(x,y)與附加寫入文檔圖像數(shù)據(jù)的坐標(biāo)位置(X,Y)是否存在差值,并且僅當(dāng)存在差值時,才假設(shè)該差值是用于執(zhí)行數(shù)據(jù)提取的附加寫入信息。在執(zhí)行該處理時,提取原始文檔圖像數(shù)據(jù)中不存在的且僅在附加寫入文檔圖像數(shù)據(jù)中存在的數(shù)據(jù)。
接著,在S704,顏色提取單元402基于該差值圖像數(shù)據(jù)來提取使用顏色。例如,如果用作附加寫入信息的顏色是黃色(Y)、品紅色(M)等,則提取黃色(Y)和品紅色(M)。
接著,在S705,顏色分析單元403在顏色空間(YMCK、GBR等)中針對在S704提取的各顏色提取可能發(fā)生減色法混合的部分顏色空間。例如,如果使用例如黃色(Y)和品紅色(M)作為附加寫入信息,則在圖7A所示的顏色空間中將提取顏色241設(shè)定為黃色(Y)和品紅色(M),并找出可能發(fā)生減色法混合的各部分顏色空間。
接著,在S706,附加寫入?yún)^(qū)域接合和整合單元404使用減色法混合的部分顏色空間信息,參照輸入的圖像(附加寫入文檔)和差值圖像,接合并整合附加寫入信息的中斷。如上所述,使用顏色與通過減色法混合產(chǎn)生的顏色之間的關(guān)系例如是黃色(Y)+品紅色(M)=紅色(R)。
基于該關(guān)系式,如果中斷的發(fā)生部分的顏色是紅色(R),則確定該區(qū)域為使用區(qū)域之間的重疊區(qū)域且發(fā)生了中斷,并且接合該部分以產(chǎn)生經(jīng)恢復(fù)的附加寫入信息。
S707和S708類似于圖11A所示的處理流程中的S105和S106。通過圖12所示的附加寫入?yún)^(qū)域指定部分信息分析單元406和分析信息存儲單元407,提取由經(jīng)恢復(fù)的附加寫入信息包括的信息,分析附加寫入信息的內(nèi)包區(qū)域中的信息并將其存儲在存儲部中。
接下來,將介紹根據(jù)圖15B的流程圖的處理示例。圖15B所示的處理流程是當(dāng)原始文檔為例如包含表數(shù)據(jù)的分格線等的文檔時執(zhí)行的處理;它是通過去除包含在附加寫入文檔中的分格線并消除在圖12所示的信息處理裝置420的圖像處理單元421中的額外數(shù)據(jù)而執(zhí)行處理的順序。
首先,在S801,圖12所示的數(shù)據(jù)輸入單元401輸入要處理的圖像數(shù)據(jù)。例如,圖像數(shù)據(jù)是具有以不同彩色標(biāo)記設(shè)定的屬性(即,用標(biāo)記進行了檢查)的文檔圖像數(shù)據(jù);輸入通過掃描儀讀取的數(shù)據(jù)、存儲在存儲部中的圖像數(shù)據(jù)等作為要處理的數(shù)據(jù)。該輸入數(shù)據(jù)是通過對包含表的分格線等的原始文檔賦予屬性(例如通過彩色標(biāo)記來賦予)而提供的附加寫入文檔。
接著,在圖像處理單元421中執(zhí)行S802和S803。圖像處理單元421在S802從輸入圖像(附加寫入文檔)提取表分格線,在S803刪除提取的表分格線。
接著,在S804,顏色提取單元402基于去除了分格線的圖像數(shù)據(jù)而提取使用的顏色。例如,如果用作附加寫入信息的顏色是黃色(Y)、品紅色(M)等,則提取黃色(Y)和品紅色(M)還有紅色(R)等。此外,限定顏色圖像生成單元422將提取顏色轉(zhuǎn)換為限定顏色以產(chǎn)生限定顏色圖像。
接著,在S805,顏色分析單元403針對從在S804處產(chǎn)生的限定顏色圖像提取的顏色檢查減色法混合的組合。此外,在S806,附加寫入?yún)^(qū)域接合和整合單元404參照在S805處分析的減色法混合的組合,接合并整合各像素的區(qū)域。此外,通過圖12中示出的附加寫入?yún)^(qū)域指定部分信息分析單元406和分析信息存儲單元407,在S807處提取經(jīng)恢復(fù)的附加寫入信息包括的信息,并在S808處分析附加寫入信息的內(nèi)包區(qū)域中的信息且將其存儲在存儲部中。
最后,將參照圖16來介紹本發(fā)明的圖像處理裝置的硬件配置示例。圖16所示的配置是實現(xiàn)為PC等的圖像處理裝置的硬件配置示例,該圖像處理裝置例如包括諸如掃描儀的圖像數(shù)據(jù)讀取部531和諸如打印機的數(shù)據(jù)輸出部532。
CPU(中央處理單元)501是用于按照程序執(zhí)行處理的控制部,所述程序記載了在實施例中先前描述的各種類型的數(shù)據(jù)處理(即,圖像處理、顏色提取處理、限定顏色圖像生成處理、顏色分析處理、附加寫入?yún)^(qū)域接合和整合處理、附加寫入?yún)^(qū)域指定部分確定處理、附加寫入?yún)^(qū)域指定部分信息分析處理、分析信息存儲處理等)的執(zhí)行順序。
ROM(只讀存儲器)502存儲CPU 501使用的程序、操作參數(shù)等,RAM(隨機存取存儲器)503存儲CPU 501的執(zhí)行中使用的程序、CPU 501的執(zhí)行中適當(dāng)改變的參數(shù)等。它們通過實現(xiàn)為CPU總線等的主機總線504而連接。
主機總線504通過橋接器505連接到諸如PCI(外圍設(shè)備互連/接口)總線的外部總線506。
鍵盤508和定點設(shè)備509是由用戶操作的輸入設(shè)備。顯示器510實現(xiàn)為用于顯示諸如文本和圖像信息的各條信息的液晶顯示器、CRT(陰極射線管)等。
HDD(硬盤驅(qū)動器)511包含硬盤,并驅(qū)動該硬盤以記錄或回放CPU501執(zhí)行的程序和信息。該硬盤存儲作為文檔的原始文檔、賦予了屬性值的附加寫入文檔、應(yīng)用于基于減色法混合的顏色分析處理的數(shù)據(jù)等。此外,硬盤存儲各種數(shù)據(jù)處理程序、各種計算機程序等。
驅(qū)動器512讀取記錄在諸如磁盤、光盤、磁光盤或半導(dǎo)體存儲器的經(jīng)安裝的可移動記錄介質(zhì)521上的數(shù)據(jù)或程序,并將數(shù)據(jù)或程序提供到通過接口507、外部總線506、橋接器505以及主機總線504連接的RAM503??梢苿佑涗浗橘|(zhì)521也可用于像硬盤的數(shù)據(jù)記錄區(qū)域。
連接端口514是用于連接外部連接機522的端口,并具有USB、IEEE1394等的連接部。連接端口514通過接口507、外部總線506、橋接器505以及主機總線504等連接到CPU 501等。通信部515連接到網(wǎng)絡(luò),用于執(zhí)行與外部系統(tǒng)的數(shù)據(jù)通信處理。數(shù)據(jù)讀取部531執(zhí)行文檔讀取處理,數(shù)據(jù)輸出部532執(zhí)行文檔數(shù)據(jù)輸出處理。
圖16所示的圖像處理裝置的硬件配置示例是一個系統(tǒng)示例,本發(fā)明的圖像處理裝置不限于圖16所示的構(gòu)成,而可以是可執(zhí)行先前在實施例中描述的處理的任何構(gòu)成。
盡管參照具體的實施例詳細地描述了本發(fā)明,但應(yīng)理解,在不脫離本發(fā)明的精神和范圍的情況下對于本領(lǐng)域技術(shù)人員來說很多變型都是顯而易見的。即,僅出于闡述的目的公開了本發(fā)明,應(yīng)當(dāng)理解本發(fā)明并不限于這些具體的實施例,而是由權(quán)利要求來限定。
可通過硬件和軟件兩者或任一個來執(zhí)行說明書中描述的處理順序。為了執(zhí)行軟件處理,可將記錄處理順序的程序安裝在并入于執(zhí)行用的專用硬件中的計算機的存儲器中,或可將其安裝在可執(zhí)行各種類型的執(zhí)行用處理的通用計算機中。
例如,可將程序預(yù)先記錄在作為記錄介質(zhì)的硬盤或ROM(只讀存儲器)中,或可將其臨時或永久地存儲(記錄)在諸如軟盤、CD-ROM(光盤只讀存儲器)、MO(磁光)盤、DVD(數(shù)字多功能盤)、磁盤或半導(dǎo)體存儲器的可移動記錄介質(zhì)中。這樣的可移動記錄介質(zhì)可被提供為封裝軟件產(chǎn)品。
不僅可以如上所述從可移動記錄介質(zhì)將程序安裝在計算機中,而且可以通過無線電波將程序從下載站點傳送到計算機,或以有線方式通過諸如因特網(wǎng)的網(wǎng)絡(luò)傳送到計算機,使計算機接收如此傳送的程序,并將該程序安裝在并入的諸如硬盤的記錄介質(zhì)上。
說明書中描述的各種類型的處理不僅可按照根據(jù)描述的時間順序來執(zhí)行,而且可響應(yīng)于執(zhí)行處理的裝置的處理能力或根據(jù)需要并行地或單獨地執(zhí)行。本說明書中的系統(tǒng)是由多個單元(裝置)組成的邏輯組,而并不限于容納在單個機柜中的一組單元(裝置)。
如上所述,例如,在對涉及利用彩色標(biāo)記進行附加寫入(其被作為針對文檔的屬性設(shè)定處理而執(zhí)行)的附加寫入文檔的分析處理中,本發(fā)明的圖像處理裝置檢測多條附加寫入信息之間的重疊或附加寫入信息與原始信息之間的重疊,分析重疊的顏色是由哪種顏色組合產(chǎn)生的,恢復(fù)在該重疊中中斷的附加寫入信息,并可靠地讀取經(jīng)恢復(fù)的附加寫入信息的指定信息。圖像處理裝置對包含在經(jīng)恢復(fù)的附加寫入信息的指定信息中的字符(文本)進行字符識別等的信息分析,并將分析結(jié)果存儲在數(shù)據(jù)庫等中。根據(jù)該構(gòu)成,例如,如果在附加寫入文檔中發(fā)生不同顏色標(biāo)記之間的重疊或彩色標(biāo)記與原始信息之間的重疊,則可以提取精確的附加寫入信息,并提取和分析附加寫入信息所確定的信息。
權(quán)利要求
1.一種信息處理裝置,該信息處理裝置包括顏色提取單元,其輸入通過以不同顏色向原始文檔寫入附加寫入信息而提供的附加寫入文檔,并獲取該附加寫入文檔上的顏色信息;顏色分析單元,其基于由所述顏色提取單元提取的顏色,分析通過顏色混合產(chǎn)生的顏色組合和顏色空間之一與由所述顏色提取單元提取的顏色之間的對應(yīng)關(guān)系;接合和整合單元,其基于所述顏色分析單元的分析結(jié)果來確定所述附加寫入文檔上的不同顏色之間的重疊,并接合與該重疊和附加寫入信息的中斷之間的對應(yīng)部分相對應(yīng)的附加寫入信息的中斷;確定單元,其根據(jù)在所述接合和整合單元中接合的附加寫入信息來確定所述附加寫入文檔的指定區(qū)域;以及信息分析單元,其讀取由所述確定單元分析出的指定區(qū)域中包含的信息。
2.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,所述顏色分析單元基于由所述顏色提取單元提取的顏色來在顏色空間中提取可能發(fā)生減色法混合的部分顏色空間。
3.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,所述顏色分析單元基于由所述顏色提取單元提取的顏色來提取與所述顏色提取單元提取的顏色相對應(yīng)的減色法混合組合。
4.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,所述信息分析單元對由所述確定單元分析出的指定區(qū)域中包含的信息執(zhí)行字符識別處理。
5.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,所述信息分析單元獲取由所述確定單元分析出的指定區(qū)域中包含的信息作為圖像數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的信息處理裝置,其中,所述信息分析單元讀取以下兩種信息之一(i)所述附加寫入信息中包括的區(qū)域中包含的信息,以及(ii)內(nèi)包區(qū)域與所述附加寫入信息接觸并重疊的區(qū)域中包含的信息。
7.根據(jù)權(quán)利要求1所述的信息處理裝置,該信息處理裝置包括圖像處理單元,其輸入原始文檔和附加寫入文檔,并執(zhí)行差值提取,其中,所述顏色提取單元獲取關(guān)于由所述圖像處理單元產(chǎn)生的差值圖像數(shù)據(jù)的顏色信息。
8.根據(jù)權(quán)利要求1所述的信息處理裝置,該信息處理裝置包括圖像處理單元,其輸入附加寫入文檔并去除該附加寫入文檔上的分格線,其中,所述顏色提取單元獲取關(guān)于由所述圖像處理單元產(chǎn)生的已去除分格線的圖像數(shù)據(jù)的顏色信息。
9.根據(jù)權(quán)利要求1所述的信息處理裝置,該信息處理裝置包括圖像生成單元,其基于由所述顏色提取單元提取的顏色信息而生成限于多條預(yù)設(shè)顏色信息的限定顏色圖像,其中,所述顏色分析單元基于該限定顏色圖像生成單元產(chǎn)生的限定顏色圖像,分析通過顏色混合產(chǎn)生的顏色組合和顏色空間之一與所述顏色提取單元所提取的顏色之間的對應(yīng)關(guān)系。
10.一種信息處理方法,該信息處理方法包括以下步驟輸入通過以不同顏色將附加寫入信息寫入原始文檔中而提供的附加寫入文檔;獲取所述附加寫入文檔上的顏色信息;基于所提取的顏色,分析通過顏色混合產(chǎn)生的顏色組合和顏色空間之一與所提取的顏色之間的對應(yīng)關(guān)系;基于分析所獲得的分析結(jié)果來確定所述附加寫入文檔上的不同顏色之間的重疊;接合與在所述重疊和附加寫入信息的中斷之間的對應(yīng)部分相對應(yīng)的附加寫入信息的中斷;根據(jù)經(jīng)接合的附加寫入信息來確定所述附加寫入文檔的指定區(qū)域;以及讀取分析出的指定區(qū)域中包含的信息。
11.根據(jù)權(quán)利要求10所述的信息處理方法,其中,分析對應(yīng)關(guān)系的步驟是基于所提取的顏色而在顏色空間中提取可能發(fā)生減色法混合的部分顏色空間。
12.根據(jù)權(quán)利要求10所述的信息處理方法,其中,分析對應(yīng)關(guān)系的步驟是基于所提取的顏色而提取與所提取的顏色相對應(yīng)的減色法混合組合。
13.根據(jù)權(quán)利要求10所述的信息處理方法,其中,讀取信息的步驟是對分析出的指定區(qū)域中包含的信息執(zhí)行字符識別處理。
14.根據(jù)權(quán)利要求10所述的信息處理方法,其中,讀取信息的步驟是獲取分析出的指定區(qū)域中包含的信息作為圖像數(shù)據(jù)。
15.根據(jù)權(quán)利要求10所述的信息處理方法,其中,讀取信息的步驟是讀取以下兩種信息之一(i)所述附加寫入信息中包括的區(qū)域中包含的信息;以及(ii)內(nèi)包區(qū)域與所述附加寫入信息接觸并重疊的區(qū)域中包含的信息。
16.根據(jù)權(quán)利要求10所述的信息處理方法,該信息處理方法包括以下步驟輸入原始文檔和附加寫入文檔;和執(zhí)行差值提取,其中,獲取顏色信息的步驟是獲取關(guān)于所產(chǎn)生的差值圖像數(shù)據(jù)的顏色信息。
17.根據(jù)權(quán)利要求10所述的信息處理方法,該信息處理方法包括以下步驟輸入附加寫入文檔;和去除該附加寫入文檔中的分格線,其中,獲取顏色信息的步驟是獲取關(guān)于所產(chǎn)生的已去除分格線的圖像數(shù)據(jù)的顏色信息。
18.根據(jù)權(quán)利要求10所述的信息處理方法,該信息處理方法包括以下步驟基于所提取的顏色信息而生成限于多條預(yù)設(shè)顏色信息的限定顏色圖像,其中,分析對應(yīng)關(guān)系的步驟是基于所述限定顏色圖像來分析通過顏色混合產(chǎn)生的顏色組合和顏色空間之一與所提取的顏色之間的對應(yīng)關(guān)系。
19.一種計算機可讀介質(zhì),該計算機可讀介質(zhì)存儲有使計算機執(zhí)行用以執(zhí)行文檔分析處理的處理的程序,該文檔分析處理包括以下步驟輸入通過以不同顏色將附加寫入信息寫入原始文檔中而提供的附加寫入文檔;獲取所述附加寫入文檔上的顏色信息;基于所提取的顏色,分析通過顏色混合所產(chǎn)生的顏色組合和顏色空間之一與所提取的顏色之間的對應(yīng)關(guān)系;基于分析所獲得的分析結(jié)果來確定所述附加寫入文檔上的不同顏色之間的重疊;接合與在重疊和附加寫入信息的中斷之間的對應(yīng)部分相對應(yīng)的附加寫入信息的中斷;根據(jù)經(jīng)接合的附加寫入信息來確定所述附加寫入文檔的指定區(qū)域;以及讀取分析出的指定區(qū)域中包含的信息。
全文摘要
本發(fā)明提供了信息處理裝置、信息處理方法及計算機可讀介質(zhì)。信息處理裝置包括顏色提取單元,其輸入通過以不同顏色向原始文檔寫入附加寫入信息而提供的附加寫入文檔,并獲取該附加寫入文檔上的顏色信息;顏色分析單元,其基于所提取的顏色,分析通過顏色混合產(chǎn)生的顏色組合和顏色空間之一與所提取的顏色之間的對應(yīng)關(guān)系;接合和整合單元,其基于所述顏色分析單元的分析結(jié)果來確定所述附加寫入文檔上的不同顏色之間的重疊,并接合與重疊和附加寫入信息的中斷之間的對應(yīng)部分相對應(yīng)的附加寫入信息的中斷;確定單元,其根據(jù)經(jīng)接合的附加寫入信息來確定所述附加寫入文檔的指定區(qū)域;以及信息分析單元,其讀取包含在分析出的指定區(qū)域中的信息。
文檔編號G06K9/34GK101030251SQ20061013573
公開日2007年9月5日 申請日期2006年10月18日 優(yōu)先權(quán)日2006年3月3日
發(fā)明者伊藤篤 申請人:富士施樂株式會社