專利名稱:圖像文件分類方法、圖像文件分類設(shè)備和計算機程序產(chǎn)品的制作方法
技術(shù)領(lǐng)域:
OOOl]本發(fā)明涉及一種圖像文件分類方法、圖像文件分類設(shè)備和
計算機程序產(chǎn) 品。
背景技術(shù):
在JP-A-11-238072 7>開的技術(shù)中,從全文本識別的文檔中 通過編索引提取關(guān)鍵字。
0005]然而,在傳統(tǒng)的關(guān)鍵字輸入方法(1)和(2)中,存在一 個問題,在保存圖像文件時用戶必須手動指定關(guān)鍵字和關(guān)鍵字提取范 圍。下面首先概迷本發(fā)明,然后詳細(xì)解釋本發(fā)明的配置和處 理。圖l是示出本發(fā)明基本原理的流程圖。
0015j—般而言,本發(fā)明具有下面的基本特征。也就是說,本發(fā) 明設(shè)有存儲單元、控制單元和圖像讀取單元,存儲單元存儲指定圖像 文件的分類目的地的分類條件(步驟SA-1)。"分類條件,,指定圖像文 件的分類目的地,將屬性信息、字符、顏色、形狀、坐標(biāo)或劃線類型 與分類目的地關(guān)聯(lián)起來,以將它們存儲為分類條件。在
圖1中,設(shè)置 分類條件,例如,當(dāng)分類關(guān)鍵字是"發(fā)票"時,分類到"文件夾A";當(dāng) 分類關(guān)鍵字是"收據(jù)"時,分類到"文件夾B";當(dāng)分類關(guān)鍵字是"收據(jù)" 并且標(biāo)記的顏色是"紅色,,時,分類到"文件夾C"。本發(fā)明通過圖像讀取單元(例如掃描儀)讀取圖像文件(例 如文檔文件)(步驟SA-2),并且從讀取的圖像文件的標(biāo)記部分(參 見圖1的Ml-M3)提取分類關(guān)鍵字。"標(biāo)記部分,,是用戶用標(biāo)記在圖 像文件上指定的區(qū)域,例如,如圖1所示的,用半透明顏色(例如熒 光粉色、熒光綠色、熒光黃色、熒光藍(lán)色)的標(biāo)記指定(例如,通過 標(biāo)記出字符、圏出字符、在字符下劃線)的區(qū)域。顏色識別單元102f識別標(biāo)記部分的顏色(步驟SB-2), 并且基于顏色識別單元102f是否已經(jīng)識別出標(biāo)記部分的顏色來判斷 是否存在標(biāo)記部分(步驟SB-3)。當(dāng)判斷出存在標(biāo)記部分時(步驟 SB-3:是),顏色識別單元102f前進到步驟SB-4的處理。另一方 面,當(dāng)判斷出不存在標(biāo)記部分時(步驟SB-3:否),處理結(jié)束。分 類關(guān)鍵字提取單元102a可以將通過顏色識別單元102f的處理識別的 顏色設(shè)置為分類關(guān)鍵字。劃線識別單元102i識別在標(biāo)記部分中畫出的劃線的類型 (步驟SB-8)。分類關(guān)鍵字提取單元102a可以將通過劃線識別單 元102i的處理識別的劃線類型設(shè)置為分類關(guān)鍵字。根據(jù)本發(fā)明,可以基于分類的圖像文件的條件自動生成分 類條件,由此簡化分類條件的設(shè)置操作。
[0067I根據(jù)本發(fā)明,可以基于標(biāo)記部分中的字符來分類圖像文件。
[0068根據(jù)本發(fā)明,可以基于標(biāo)記部分的顏色來分類圖像文件。0069根據(jù)本發(fā)明,可以基于標(biāo)記部分的形狀來分類圖像文件。 [0070I根據(jù)本發(fā)明,可以基于標(biāo)記部分在圖像文件上的坐標(biāo)來分 類圖像文件。
[0071根據(jù)本發(fā)明,可以基于在標(biāo)記部分中畫出的劃線的類型來分類圖像文件。
[0072根據(jù)本發(fā)明,可以通過比較分類關(guān)鍵字和分類條件來決定 分類目的地。
[0073盡管為了完整和清楚的公開,已經(jīng)參照具體實施例描述 本發(fā)胡,但是所附權(quán)利要求不限于所述具體實施例,而是解釋為包括 落在此處提出的基本教導(dǎo)內(nèi)的、本領(lǐng)域的技術(shù)人員可以實現(xiàn)的所有修 改和替換結(jié)構(gòu)。
權(quán)利要求
1. 一種由圖像文件分類設(shè)備執(zhí)行的圖像文件分類方法,所述圖像文件分類設(shè)備包括存儲單元、控制單元和圖像讀取單元,其中所述存儲單元包括分類條件存儲單元,用于存儲指定圖像文件的分類目的地的分類條件,所述方法包括分類關(guān)鍵字提取步驟,從所述圖像讀取單元讀取的圖像文件的標(biāo)記部分提取分類關(guān)鍵字;分類目的地決定步驟,通過比較由分類關(guān)鍵字提取步驟提取的分類關(guān)鍵字和存儲在所述分類條件存儲單元中的分類條件,來決定所述圖像文件的分類目的地;以及圖像文件分類步驟,將所述圖像文件分類到由分類目的地決定步驟決定的分類目的地中。
2. 根據(jù)權(quán)利要求1的圖像文件分類方法,其中 所述方法還包括耦合步驟,將由分類關(guān)鍵字提取步驟提取的分類關(guān)鍵字與所述圖像文件關(guān)聯(lián)起來,以將其存儲在所述存儲單元中。
3. 根據(jù)權(quán)利要求l的圖像文件分類方法,其中 所述方法還包括分類條件生成步驟,基于由圖像文件分類步驟分類的圖像文件的屬性信息生成分類條件,以將該分類條件存儲在所述 分類條件存儲單元中。
4. 根據(jù)權(quán)利要求1的圖像文件分類方法,其中 所述分類關(guān)鍵字提取步驟還包括字符識別步驟,用于識別標(biāo)記部分中的字符并將該字符設(shè)置為分類關(guān)鍵字。
5. 根據(jù)權(quán)利要求1的圖像文件分類方法,其中 所述分類關(guān)鍵字提取步驟還包括顏色識別步驟,用于識別標(biāo)記部分的顏色并將該顏色設(shè)置為分類關(guān)鍵字。
6. 根據(jù)權(quán)利要求1的圖像文件分類方法,其中 所述分類關(guān)鍵字提取步驟還包括形狀識別步驟,用于識別標(biāo)記部分的形狀并將該形狀設(shè)置為分類關(guān)鍵字。
7. 根據(jù)權(quán)利要求1的圖像文件分類方法,其中 所述分類關(guān)鍵字提取步驟還包括坐標(biāo)識別步驟,用于識別標(biāo)記部分在所述圖像文件上的坐標(biāo)并將該坐標(biāo)設(shè)置為分類關(guān)鍵字。
8. 根據(jù)權(quán)利要求1的圖像文件分類方法,其中 所述分類關(guān)鍵字提取步驟還包括劃線識別步驟,用于識別在標(biāo)記部分中畫出的劃線的類型并將該劃線類型設(shè)置為分類關(guān)鍵字。
9. 根據(jù)權(quán)利要求3-8之一的圖像文件分類方法,其中 所述分類條件存儲步驟將屬性信息、字符、顏色、形狀、坐標(biāo)或劃線類型與分類目的地關(guān)聯(lián)起來,以將其存儲為分類條件。
10. —種圖像文件分類設(shè)備,包括存儲單元、控制單元和圖像讀 取單元,其中所述存儲單元包括分類條件存儲單元,用于存儲指定圖像文件的 分類目的地的分類條件,以及 所述控制單元包括分類關(guān)鍵字提取單元,從所述圖像讀取單元讀取的圖像文件的標(biāo)記部分提取分類關(guān)鍵字;分類目的地決定單元,通過比較由所述分類關(guān)鍵字提取單元提取 的分類關(guān)鍵字和存儲在所述分類條件存儲單元中的分類條件,來決定 所述圖像文件的分類目的地;以及圖像文件分類單元,將所述圖像文件分類到由所述分類目的地決 定單元決定的分類目的地中。
11. 根據(jù)權(quán)利要求10的圖像文件分類設(shè)備,其中 所述控制單元還包括耦合單元,該耦合單元將由所述分類關(guān)鍵字提取單元提取的分類關(guān)鍵字和所述圖像文件關(guān)聯(lián)起來,以將其存儲在 所述存儲單元中。
12. 根據(jù)權(quán)利要求10的圖像文件分類設(shè)備,其中 所述控制單元還包括分類條件生成單元,該分類條件生成單元基于由所述圖像文件分類單元分類的圖像文件的屬性信息生成分類條件,以將該分類條件存儲在所述分類條件存儲單元中。
13. 根據(jù)權(quán)利要求10的圖像文件分類設(shè)備,其中 所述分類關(guān)鍵字提取單元還包括字符識別單元,用于識別標(biāo)記部分中的字符并將該字符設(shè)置為分類關(guān)鍵字。
14. 根據(jù)權(quán)利要求10的圖像文件分類設(shè)備,其中所述分類關(guān)鍵字提取單元還包括顏色識別單元,用于識別標(biāo)記部 分的顏色并將該顏色設(shè)置為分類關(guān)鍵字。
15. 根據(jù)權(quán)利要求10的圖像文件分類設(shè)備,其中 所述分類關(guān)鍵字提取單元還包括形狀識別單元,用于識別標(biāo)記部分的形狀并將該形狀設(shè)置為分類關(guān)鍵字。
16. 根據(jù)權(quán)利要求IO的圖像文件分類設(shè)備,其中 所述分類關(guān)鍵字提取單元還包括坐標(biāo)識別單元,用于識別標(biāo)記部分在所述圖像文件上的坐標(biāo)并將該坐標(biāo)設(shè)置為分類關(guān)鍵字。
17. 根據(jù)權(quán)利要求10的圖像文件分類設(shè)備,其中 所述分類關(guān)鍵字提取單元還包括劃線識別單元,用于識別在標(biāo)記部分中畫出的劃線的類型并將該劃線類型設(shè)置為分類關(guān)鍵字。
18. 根據(jù)權(quán)利要求12 - 17之一的圖像文件分類設(shè)備,其中 所述分類條件存儲單元將屬性信息、字符、顏色、形狀、坐標(biāo)或劃線類型與分類目的地關(guān)聯(lián)起來,以將其存儲為分類條件。
19. 一種具有計算機可讀介質(zhì)的計算才幾程序產(chǎn)品,該計算機可讀 介質(zhì)包括用于由圖像文件分類設(shè)備執(zhí)行圖像文件分類方法的編程指 令,所述圖像文件分類設(shè)備包括存儲單元、控制單元和圖像讀取單元,其中所述存儲單元包括分類條件存儲單元,用于存儲指定圖像文件的 分類目的地的分類條件,并且所述指令當(dāng)由計算機執(zhí)行時使計算機執(zhí)行分類關(guān)鍵字提取步驟,從所述圖像讀取單元讀取的圖像文件的標(biāo) 記部分提取分類關(guān)鍵字;分類目的地決定步驟,通過比較由分類關(guān)鍵字提取步驟提取的分類關(guān)鍵字和存儲在所述分類條件存儲單元中的分類條件,來決定所述圖像文件的分類目的地;以及圖像文件分類步驟,將所述圖像文件分類到由分類目的地決定步 驟決定的分類目的地中。
全文摘要
本發(fā)明涉及圖像文件分類方法、圖像文件分類設(shè)備和計算機程序產(chǎn)品。圖像文件分類方法由圖像文件分類設(shè)備執(zhí)行,該圖像文件分類設(shè)備包括存儲單元、控制單元和圖像讀取單元,其中存儲單元包括分類條件存儲單元,用于存儲指定圖像文件的分類目的地的分類條件。所述方法包括分類關(guān)鍵字提取步驟,從圖像讀取單元讀取的圖像文件的標(biāo)記部分提取分類關(guān)鍵字;分類目的地決定步驟,通過比較由分類關(guān)鍵字提取步驟提取的分類關(guān)鍵字和存儲在分類條件存儲單元中的分類條件,來決定圖像文件的分類目的地;以及圖像文件分類步驟,用于將圖像文件分類到由分類目的地決定步驟決定的分類目的地中。
文檔編號G06F17/30GK101520788SQ20081014995
公開日2009年9月2日 申請日期2008年10月17日 優(yōu)先權(quán)日2008年2月27日
發(fā)明者久保諭, 北川光一, 小坂清人, 山本英典, 谷口泰紀(jì) 申請人:株式會社Pfu