專利名稱:表單處理系統(tǒng)、ocr裝置、表單制作裝置及其處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種對(duì)表單進(jìn)行制作以及讀取的表單處理系統(tǒng)、OCR裝置、表單制作裝置以及表單處理方法。
背景技術(shù):
近年來(lái),在各領(lǐng)域中進(jìn)行著無(wú)紙化,但是例如在組織的基礎(chǔ)業(yè)務(wù)中,發(fā)票、考勤表、 調(diào)查表、試卷以及醫(yī)院的診斷表等仍然使用印刷在紙張上的表單。用戶為了有效地管理之后通過(guò)手寫(xiě)等填寫(xiě)在表單上的信息,利用掃描儀讀取表單,利用OCR (Optical Character Reader 光符閱讀機(jī))裝置實(shí)施OCR處理。但是,在表單的布局、格式不正確的情況下,有時(shí)無(wú)法正確地進(jìn)行OCR處理。因此, 公開(kāi)了一種技術(shù),即根據(jù)由用戶輸入的OCR型號(hào)、行字段數(shù)、字符數(shù)自動(dòng)生成表單格式(例如專利文獻(xiàn)1)。另外,提出了一種信息處理裝置,即將從表單讀取到的圖像數(shù)據(jù)與作為選擇基準(zhǔn)的多個(gè)選擇基準(zhǔn)圖像數(shù)據(jù)進(jìn)行比較,選擇對(duì)應(yīng)于從表單讀取到的圖像數(shù)據(jù)的選擇基準(zhǔn)圖像數(shù)據(jù),根據(jù)該選擇基準(zhǔn)圖像數(shù)據(jù)來(lái)進(jìn)行0 CR處理(例如專利文獻(xiàn)2)。專利文獻(xiàn)1 日本特開(kāi)平8-30659號(hào)公報(bào)專利文獻(xiàn)2 日本特開(kāi)2000-132542號(hào)公報(bào)
發(fā)明內(nèi)容
發(fā)明要解決的問(wèn)題以往,利用OCR裝置有時(shí)無(wú)法對(duì)掃描儀所讀取到的表單的圖像數(shù)據(jù)正確地進(jìn)行 OCR處理。另外,有時(shí)以O(shè)CR處理的精度為優(yōu)先而僅能將表單的布局固定地形成。因此,本發(fā)明是鑒于這種問(wèn)題而完成的,目的在于提供一種能夠提高表單的OCR 處理精度的表單處理系統(tǒng)、OCR裝置、OCR處理程序、表單制作裝置、表單制作程序以及表單處理方法。用于解決問(wèn)題的方案為了解決上述問(wèn)題,本發(fā)明的表單處理系統(tǒng)包括表單制作裝置和OCR裝置,表單制作裝置具有布局生成部,其生成表示表單布局的布局信息;以及布局發(fā)送部,其將所生成的布局信息發(fā)送給OCR裝置,其中,OCR裝置具有布局獲取部,其獲取從表單制作裝置發(fā)送過(guò)來(lái)的布局信息;以及OCR處理部,其根據(jù)獲取到的布局信息對(duì)掃描儀所讀出到的表單的圖像數(shù)據(jù)進(jìn)行OCR處理。OCR裝置還可以具有輔助生成部,其生成用于輔助生成布局信息的輔助信息;以及輔助發(fā)送部,其將輔助信息發(fā)送給表單制作裝置,其中,表單制作裝置還具有輔助獲取部,該輔助獲取部獲取發(fā)送過(guò)來(lái)的輔助信息,布局生成部根據(jù)所獲取到的輔助信息來(lái)生成布局信息。在輔助信息中也可以包含與使用于OCR裝置的OCR處理部的算法有關(guān)的算法信肩、ο
輔助生成部還可以根據(jù)OCR處理的結(jié)果來(lái)生成表示所獲取到的輔助信息的改進(jìn)點(diǎn)的改進(jìn)信息,在輔助信息中包含改進(jìn)信息。表單制作裝置還可以具有基準(zhǔn)生成部,該基準(zhǔn)生成部根據(jù)所生成的布局信息來(lái)生成基準(zhǔn)數(shù)據(jù),該基準(zhǔn)數(shù)據(jù)為與OCR處理的結(jié)果進(jìn)行比較的基準(zhǔn),布局發(fā)送部將基準(zhǔn)數(shù)據(jù)發(fā)送給OCR裝置,OCR裝置還具有基準(zhǔn)獲取部,該基準(zhǔn)獲取部獲取發(fā)送過(guò)來(lái)的基準(zhǔn)數(shù)據(jù),輔助生成部根據(jù)獲取到的基準(zhǔn)數(shù)據(jù)和OCR處理的結(jié)果來(lái)生成改進(jìn)信息。表單制作裝置還可以具有數(shù)據(jù)輸出部,該數(shù)據(jù)輸出部將所生成的布局信息輸出到打印機(jī),在所生成的布局信息中包含用于定義可變表單的可變信息,該可變表單是表單中的輸入?yún)^(qū)域可變的表單,當(dāng)數(shù)據(jù)輸出部將已確定可變信息中的輸入?yún)^(qū)域的布局信息輸出到打印機(jī)時(shí),布局發(fā)送部將已確定可變信息中的輸入?yún)^(qū)域的布局信息發(fā)送給OCR裝置。還可以包括打印機(jī)和圖像讀取裝置,表單制作裝置還具有輸出控制部,其在打印機(jī)印刷表單的情況下,控制打印機(jī)使其在預(yù)先確定的印刷條件下進(jìn)行印刷;以及讀取控制部,其在由圖像讀取裝置讀取表單的情況下,指定圖像讀取裝置的動(dòng)作方法。表單制作裝置還具有不使用要素決定部,其決定布局信息中的不使用的圖像要素;以及參考用圖像生成部,其根據(jù)布局信息來(lái)生成排除了由不使用要素決定部決定為不使用的圖像要素而得到的參考用圖像數(shù)據(jù),布局發(fā)送部將布局信息或者參考用圖像數(shù)據(jù)發(fā)送給OCR裝置,OCR裝置還具有圖像校正部,該圖像校正部在接收到參考用圖像數(shù)據(jù)的情況下根據(jù)該參考用圖像數(shù)據(jù)來(lái)校正掃描儀讀取到的表單的圖像數(shù)據(jù)。OCR裝置還可以具有不使用要素決定部,其決定布局信息中的不使用的圖像要素;參考用圖像生成部,其根據(jù)布局信息來(lái)生成排除了由不使用要素決定部決定為不使用的圖像要素而得到的參考用圖像數(shù)據(jù);以及圖像校正部,其根據(jù)參考用圖像數(shù)據(jù)來(lái)校正掃描儀讀取到的表單的圖像數(shù)據(jù)。在由不使用要素決定部決定為不使用的圖像要素中包含可變的字符串或者數(shù)字串、點(diǎn)線、虛線、包含灰色的彩色填充、陰影、條形碼的圖案圖像、包含灰色的彩色圖像要素、 比預(yù)先確定的預(yù)定值細(xì)的線、比預(yù)先確定的預(yù)定值小的字符。參考用圖像生成部也可以對(duì)從布局信息中排除由上述不使用要素決定部決定為不使用的圖像要素而得到的圖像要素進(jìn)行柵格化處理。為了解決上述問(wèn)題,本發(fā)明的OCR裝置具有布局獲取部,其獲取從制作表單的表單制作裝置發(fā)送過(guò)來(lái)的表示表單布局的布局信息;以及OCR處理部,其根據(jù)獲取到的布局信息對(duì)掃描儀讀取到的表單的圖像數(shù)據(jù)進(jìn)行OCR處理。為了解決上述問(wèn)題,本發(fā)明的OCR處理程序使計(jì)算機(jī)作為以下部分而發(fā)揮功能 布局獲取部,其獲取從制作表單的表單制作裝置發(fā)送過(guò)來(lái)的表示表單布局的布局信息;以及OCR處理部,其根據(jù)獲取到的布局信息對(duì)掃描儀讀取到的表單的圖像數(shù)據(jù)進(jìn)行OCR處理。為了解決上述問(wèn)題,本發(fā)明的表單制作裝置具有布局生成部,其生成表示表單布局的布局信息;以及布局發(fā)送部,其向OCR裝置發(fā)送所生成的布局信息,該0 CR裝置對(duì)在表單中填寫(xiě)的填寫(xiě)信息進(jìn)行分析。為了解決上述問(wèn)題,,本發(fā)明的表單制作程序使計(jì)算機(jī)作為以下部分而發(fā)揮功能 布局生成部,其生成表示表單布局的布局信息;以及布局發(fā)送部,其向OCR裝置發(fā)送所生成的布局信息,該0 CR裝置對(duì)在表單中填寫(xiě)的填寫(xiě)信息進(jìn)行分析。
為了解決上述問(wèn)題,本發(fā)明的表單處理方法通過(guò)表單制作裝置以及與表單制作裝置通信連接的OCR裝置來(lái)進(jìn)行表單管理,表單制作裝置生成表示表單布局的布局信息,并將所生成的布局信息發(fā)送給OCR裝置,OCR裝置獲取從表單制作裝置發(fā)送過(guò)來(lái)的布局信息, 并根據(jù)所獲取到的布局信息對(duì)掃描儀所讀取出的表單的圖像數(shù)據(jù)進(jìn)行OCR處理。發(fā)明的效果如上所述,本發(fā)明能夠提高表單的OCR處理精度。
圖1是表示表單處理系統(tǒng)的概要連接關(guān)系的說(shuō)明圖。圖2是表示表單制作裝置的結(jié)構(gòu)的功能框圖。圖3是表示表單布局的一例的說(shuō)明圖。圖4是用于說(shuō)明布局信息(特征信息以及數(shù)據(jù)屬性信息)的說(shuō)明圖。圖5是用于說(shuō)明參考用圖像數(shù)據(jù)的說(shuō)明圖。圖6是表示OCR裝置的結(jié)構(gòu)的功能框圖。圖7是用于說(shuō)明改進(jìn)信息的說(shuō)明圖。圖8是表示表單處理方法測(cè)試時(shí)的整體處理流程的序列圖。圖9是表示表單處理方法使用時(shí)的整體處理流程的序列圖。附圖標(biāo)記說(shuō)明100 表單處理系統(tǒng);110 表單制作裝置;120 0 CR裝置;130 打印機(jī);140 掃描儀;152 表單;160 布局生成部;162 不使用要素決定部;164 參考用圖像生成部;166 輔助獲取部;170 基準(zhǔn)生成部;172 布局發(fā)送部;174 數(shù)據(jù)輸出部;192 參考用圖像數(shù)據(jù); 220 布局獲取部;224 圖像校正部;2 :0CR處理部;2 輔助生成部;230 基準(zhǔn)獲取部; 232 輔助發(fā)送部。
具體實(shí)施例方式下面,參照附圖詳細(xì)說(shuō)明本發(fā)明的優(yōu)選實(shí)施方式。上述實(shí)施方式示出的尺寸、材料、其它具體的數(shù)值等僅是用于使發(fā)明的理解變得容易的例示,除了具有特別說(shuō)明的情況以外,并不限定本發(fā)明。此外,在本說(shuō)明書(shū)以及附圖中,對(duì)實(shí)質(zhì)上具有相同的功能、結(jié)構(gòu)的要素附加相同的附圖標(biāo)記來(lái)省略重復(fù)說(shuō)明,另外省略與本發(fā)明沒(méi)有直接關(guān)系的要素的圖示。(表單處理系統(tǒng)100)圖1是表示表單處理系統(tǒng)100的概要連接關(guān)系的說(shuō)明圖。表單處理系統(tǒng)100構(gòu)成為包括表單制作裝置110、0CR裝置120、打印機(jī)130、掃描儀140。表單制作裝置110通過(guò)因特網(wǎng)、LAN(LocalArea Network 局域網(wǎng))、專用線路等通信網(wǎng)150與OCR裝置120相連接。 另外,表單制作裝置110例如通過(guò)LAN與打印機(jī)130相連接,OCR裝置120例如通過(guò)LAN與掃描儀140相連接。當(dāng)接收到由用戶輸入的制作布局的輸入時(shí),表單制作裝置110生成表示表單152 布局(與布局有關(guān)的信息)的布局信息。然后,打印機(jī)130印刷所生成的該布局信息的表單152。用戶在印刷出的表單152上通過(guò)手寫(xiě)、蓋印以及沖壓等記載例如業(yè)務(wù)上的信息。當(dāng)向表單152的記載完成時(shí),掃描儀140讀取記載有信息的表單152,OCR裝置120對(duì)讀取到的該圖像數(shù)據(jù)進(jìn)行OCR處理,獲取填寫(xiě)在表單152上的填寫(xiě)信息。例如,提出了一種表單制作裝置,即根據(jù)由用戶手動(dòng)輸入的OCR型號(hào)、行字段數(shù)、 字符數(shù)來(lái)自動(dòng)生成表單格式。但是,這種表單制作裝置僅自動(dòng)地調(diào)整要制作的表單的文本框、表單尺寸,存在要確定OCR型號(hào)等麻煩。并且,在反復(fù)讀取同一布局的表單的情況下,為了提高OCR處理精度,用戶必須對(duì)OCR裝置指定成為讀取對(duì)象的表單的讀取位置等。另外,將由掃描儀140讀取到的成為OCR處理對(duì)象的圖像數(shù)據(jù)與成為OCR處理的參考的圖像數(shù)據(jù)(以下稱為參考用圖像數(shù)據(jù))進(jìn)行比較來(lái)校正圖像數(shù)據(jù)的位置偏移、傾斜, 由此能夠提高OCR處理精度。作為生成這樣的參考用圖像數(shù)據(jù)的手段,例如可考慮以下手段利用掃描儀140 讀取印刷出的表單152,由用戶判斷印刷的字符、格線等根據(jù)數(shù)據(jù)不同而可變的部分,在圖像處理中將其刪除而設(shè)為參考用圖像數(shù)據(jù);使用空數(shù)據(jù)作為與可變的部分有關(guān)的數(shù)據(jù),印刷表單152,利用掃描儀140讀取而設(shè)為參考用圖像數(shù)據(jù)。例如在進(jìn)行印刷、利用掃描儀140讀取時(shí),在存在由于顏色(包括黑色)變淺等濃度變化的影響而很有可能使OCR處理精度下降的部分的情況下,如果是前一方法,則用戶要對(duì)這些部分分別進(jìn)行逐一指示刪除的操作,而判斷哪一部分容易受到濃度變化的影響等是困難的,有可能產(chǎn)生作業(yè)錯(cuò)誤而增加用戶的作業(yè)負(fù)擔(dān)。至于后一方法,存在無(wú)法避免濃度變化的影響而使OCR處理精度下降的情況。另外,用戶需要特意準(zhǔn)備空數(shù)據(jù)作為表單152輸出而使作業(yè)負(fù)擔(dān)增加。并且,無(wú)法刪除自動(dòng)地生成的表單152的輸出日期和時(shí)間、頁(yè)碼、連號(hào)等字符、標(biāo)記。另外,在所生成的參考用圖像數(shù)據(jù)中殘留按照每個(gè)表單152而可變的可變部分的情況下,使用哪一方法都會(huì)使OCR處理精度下降。另外,在讀取印刷過(guò)一次的表單152時(shí),表單152起皺或者在表單152上附著臟污都會(huì)導(dǎo)致無(wú)法得到正確的參考用圖像數(shù)據(jù)而使OCR 處理精度下降。本實(shí)施方式所涉及的表單處理系統(tǒng)100在表單制作裝置110生成布局信息時(shí),還將該布局信息共用于OCR裝置120的OCR處理。特別是,在使用參考用圖像數(shù)據(jù)的情況下, 表單制作裝置110生成不包含位置偏移、傾斜的校正所不需要的信息的參考用圖像數(shù)據(jù), 發(fā)送給OCR裝置120。因而,根據(jù)該表單處理系統(tǒng)100,能夠在減輕用戶的作業(yè)負(fù)擔(dān)的同時(shí)提高OCR處理精度。下面,按照表單制作裝置110、OCR裝置120的順序詳細(xì)說(shuō)明表單制作裝置110、OCR裝置120的結(jié)構(gòu)。(表單制作裝置110)圖2是表示表單制作裝置110的結(jié)構(gòu)的功能框圖。表單制作裝置110構(gòu)成為包括顯示部154、操作部156、中央控制部158。顯示部巧4包括液晶顯示器、有機(jī)EL (Electro Luminescence 電致發(fā)光)顯示器等。操作部156包括設(shè)置于顯示部154的顯示面上的觸摸面板、設(shè)置有多個(gè)操作鍵的鍵盤(pán)、 鼠標(biāo)等指示裝置、十字鍵以及操縱桿等。表單制作裝置110在顯示部154中顯示布局制作畫(huà)面,接受用戶通過(guò)操作部156的操作輸入而生成表單152的布局。圖3是表示表單152的布局的一例的說(shuō)明圖。如圖3所示,作為表單152的布局, 例如設(shè)定文本框182a、字符182b、基準(zhǔn)標(biāo)記182c、條形碼182d等的配置。在此,在OCR裝置120對(duì)掃描儀140所讀取的圖像數(shù)據(jù)實(shí)施0 CR處理時(shí),基準(zhǔn)標(biāo)記182c成為表單152的方向以及布局位置的基準(zhǔn)。另外,條形碼182d是按照規(guī)定的規(guī)則對(duì)任意的信息進(jìn)行編碼而得到的,例如表示識(shí)別表單152的表單ID。表單制作裝置110根據(jù)用戶通過(guò)操作部156的操作輸入來(lái)設(shè)定圖3示出的布局。 此時(shí),表單152包括作為匯總具有規(guī)則性的輸入方式的區(qū)域的多個(gè)輸入?yún)^(qū)域184。輸入?yún)^(qū)域184例如被文本框18 包圍。在輸入?yún)^(qū)域184中能夠按照每個(gè)輸入?yún)^(qū)域184來(lái)設(shè)定假設(shè)為要填寫(xiě)的字符種類(英文、數(shù)字、日文、符號(hào)等)、屬性(手寫(xiě)字符、鉛字等)等。中央控制部158通過(guò)半導(dǎo)體集成電路來(lái)控制表單制作裝置110整體,其中,該半導(dǎo)體集成電路包括中央處理裝置(CPU)、保存有程序等的ROM、作為工作區(qū)的RAM等。另外,中央控制部158還作為布局生成部160、不使用要素決定部162、參考用圖像生成部164、輔助獲取部166、基準(zhǔn)生成部168、布局發(fā)送部170、數(shù)據(jù)輸出部172、輸出控制部174以及讀取控制部176而發(fā)揮功能。布局生成部160根據(jù)用戶通過(guò)操作部156輸入操作而設(shè)定的布局來(lái)生成表示表單 152布局的布局信息。在布局信息中包含特征信息、OCR屬性信息。特征信息是注釋(字典)等表示布局特征的信息,例如對(duì)格線、字符設(shè)定其位置、線類型等。OCR屬性信息是表示成為OCR處理的對(duì)象的位置(以下稱為OCR位置)、成為該OCR處理的對(duì)象的字符、標(biāo)記等數(shù)據(jù)屬性的信息。下面,根據(jù)圖4說(shuō)明特征信息以及0 CR屬性信息。圖4是用于說(shuō)明布局信息(特征信息和數(shù)據(jù)屬性信息)的說(shuō)明圖。特別是,圖4 的(a)示出文本框18 的布局信息(特征信息),圖4的(b)示出字符182b的布局信息 (特征信息),圖4的(c)示出輸入?yún)^(qū)域184的布局信息(OCR屬性信息)。如圖4的(a)所示,文本框18 的布局信息例如包括布局ID 190a、表單ID 190b、基準(zhǔn)點(diǎn)坐標(biāo)190c、行列 190d、尺寸190e、線寬190f、線類型190g、顏色190h等。布局ID 190a是識(shí)別該文本框18 的識(shí)別信息。表單ID 190b是識(shí)別成為表單 152的源的布局信息的識(shí)別信息。基準(zhǔn)點(diǎn)坐標(biāo)190c表示成為該文本框18 的基準(zhǔn)的點(diǎn)、例如文本框18 左下角的點(diǎn)的坐標(biāo)。在本實(shí)施方式中,坐標(biāo)系例如以表單152左下角基準(zhǔn)標(biāo)記182c為原點(diǎn),將橫向方向設(shè)為χ軸而將縱向方向設(shè)為y軸。行列190d表示進(jìn)一步分割被該文本框18 包圍的區(qū)域的情況下的行和列的數(shù)量。另外,布局信息(特征信息)也可以是不以表為單位設(shè)定文本框18 而以進(jìn)一步分割被該文本框18 包圍的區(qū)域而得到的塊為單位設(shè)定該文本框18 的信息。尺寸190e例如表示進(jìn)一步分割被該文本框18 包圍的表而得到的塊的寬度和高度,在行、列不同而寬度、高度不同的情況下,按照每個(gè)行或者每個(gè)列進(jìn)行設(shè)定。文本框18 的線寬190f、線類型190g、顏色190h也同樣地,在由于行、列不同而不同的情況下也按照每個(gè)行或者每個(gè)列進(jìn)行設(shè)定。此時(shí),在相鄰的行、列中文本框18 的線寬190f、線類型190g、 顏色190h不同的情況下,文本框18 夾持的部分例如以通過(guò)用戶的操作輸入而在后面進(jìn)行的設(shè)定優(yōu)先。另外,并不限于利用格線包圍四周的文本框182a,還能夠單獨(dú)地設(shè)定格線。如圖4的(b)所示,字符182b的布局信息例如包括布局ID190a、表單ID 190b、基準(zhǔn)點(diǎn)坐標(biāo)190c、大小190i以及內(nèi)容190j等。大小190i表示字符182b的大小,內(nèi)容190j 表示“采購(gòu)發(fā)票” “年” “月” “日”等實(shí)際要印刷的字符182b本身。另外,在字符182b例如為連號(hào)的發(fā)票編號(hào)、根據(jù)用戶不同而不同的用戶編號(hào)而可變的情況下,也可以在布局信息中包含表示字符182b的變更規(guī)則的可變信息。如圖4的(c)所示,輸入?yún)^(qū)域184的布局信息例如包括布局ID190a、表單ID 190b、 基準(zhǔn)點(diǎn)坐標(biāo)190c、尺寸190e、字符種類190k、屬性1901以及顏色190m等。如上所述,字符種類190k是假設(shè)為被填寫(xiě)的字符的種類,例如能夠設(shè)定英文、數(shù)字、日文平假名、日文片假名、標(biāo)記、日文等。關(guān)于屬性1901,如果填寫(xiě)的方法為手寫(xiě)則能夠設(shè)定手寫(xiě)字符、如果是印刷、數(shù)據(jù)符號(hào)等則能夠設(shè)定鉛字等。圖4示出的布局信息(特征信息和數(shù)據(jù)屬性信息)僅是一例,除了設(shè)定基準(zhǔn)標(biāo)記 182c、條形碼182d以外還可設(shè)定能夠記載于表單152的各種結(jié)構(gòu)要素的信息。另外,特征信息例如也可以用PDLO^ge Description Language 頁(yè)面描述語(yǔ)言)等各種數(shù)據(jù)形式來(lái)表不。另外,上述參考用圖像數(shù)據(jù)是將通過(guò)用戶的操作輸入而設(shè)定的布局例如圖像化 (柵格化)為使用了 RGB、CMYK等表色方法的位圖形式等而得到的圖像數(shù)據(jù)。但是,在僅使布局圖像化時(shí),例如由于上述的進(jìn)行印刷、掃描儀140讀取時(shí)產(chǎn)生濃度變化的部分、自動(dòng)地生成的表單152的輸出日期和時(shí)間、頁(yè)碼、連號(hào)等字符、標(biāo)記這種按照每個(gè)表單152而可變的可變部分的影響,很有可能使OCR處理精度下降。因此,本實(shí)施方式的表單制作裝置110 具備不使用要素決定部162。不使用要素決定部162決定布局信息中的不使用圖像要素。參考用圖像生成部 164根據(jù)布局信息并例如參照不使用要素決定部162對(duì)每個(gè)圖像要素附加的表示是否可以圖像化的圖像化標(biāo)志,生成排除了由不使用要素決定部162決定為不使用的(圖像化標(biāo)志為不可(false:假))的圖像要素而得到的參考用圖像數(shù)據(jù)。在本實(shí)施方式中,圖像要素是與布局信息中的圖3示出的文本框182a、字符182b、基準(zhǔn)標(biāo)記182c、條形碼182d等各個(gè)項(xiàng)目對(duì)應(yīng)的信息。圖5是用于說(shuō)明參考用圖像數(shù)據(jù)的說(shuō)明圖。在表單制作裝置110中,關(guān)于不使用要素決定部162,例如“付款通知單”“采購(gòu)發(fā)票”等固定的文字(字符)、實(shí)線格線、文本框、 白色(在RGB中表示為(255、255、255))、黑色(在RGB中表示為(0、0、0))的圖像要素不會(huì)使OCR處理精度下降,因此不使用要素決定部162將這些圖像要素的圖像化標(biāo)志設(shè)為可 (true 真)ο另外,由不使用要素決定部162決定為不使用的圖像要素包含可變的字符串或者數(shù)字串、點(diǎn)線、虛線、包含灰色的彩色填充、陰影、條形碼等的圖案圖像、包含灰色的彩色圖像要素、比預(yù)先確定的預(yù)定值細(xì)的線、比預(yù)先確定的預(yù)定值小的字符。關(guān)于這些圖像要素, 由于打印機(jī)130、掃描儀140的性能差、處理方式不同等原因,在所生成的參考用圖像數(shù)據(jù)中有時(shí)線的粗細(xì)、分辨率、顏色、半色調(diào)點(diǎn)的結(jié)構(gòu)產(chǎn)生差或者產(chǎn)生干涉條紋。不使用要素決定部162將這些圖像要素的圖像化標(biāo)志設(shè)為false (不可)。根據(jù)上述結(jié)構(gòu),能夠從參考用圖像數(shù)據(jù)更可靠地排除導(dǎo)致OCR處理精度下降的圖像要素。如圖5所示,表單制作裝置110的參考用圖像生成部164生成排除了由不使用要素決定部162決定為不使用的圖像要素的參考用圖像數(shù)據(jù)192,將該參考用圖像數(shù)據(jù)192發(fā)送到OCR裝置120,在此不使用的圖像要素為虛線、可變的字符串、條形碼的圖像要素。后述的OCR裝置120的圖像校正部對(duì)參考用圖像數(shù)據(jù)192以及由掃描儀140讀取到的表單152 的圖像數(shù)據(jù)進(jìn)行位置偏移、傾斜的校正。
通過(guò)OCR裝置120根據(jù)排除了不使用的圖像要素而得到的參考用圖像數(shù)據(jù)進(jìn)行 OCR處理的結(jié)構(gòu),避免由于用戶的判斷錯(cuò)誤等而在參考用圖像數(shù)據(jù)中殘留按照每個(gè)表單 152變化的可變部分的情況,與用戶的技能無(wú)關(guān),能夠提高OCR處理精度。另外,不需要對(duì)不使用的圖像要素逐一進(jìn)行指示刪除的操作或者準(zhǔn)備空數(shù)據(jù),從而能夠大幅減輕用戶的作業(yè)負(fù)擔(dān)。并且,與讀取印刷過(guò)一次的數(shù)據(jù)152來(lái)生成參考用圖像數(shù)據(jù)的情況相比,本實(shí)施方式的表單制作裝置110不受表單152的褶皺、附著于表單152的臟污的影響,由此OCR處
理精度較高。另外,參考用圖像生成部164僅使從布局信息排除了由不使用要素決定部162決定為不使用的圖像要素而得到的圖像要素柵格化。因此,與使所有圖像要素柵格化之后從參考用圖像數(shù)據(jù)刪除不使用的圖像要素部分的情況相比,能夠使參考用圖像生成部164的處理負(fù)載減少,減少量為使不使用的圖像要素柵格化的處理量。輔助獲取部166獲取從后述的OCR裝置120發(fā)送過(guò)來(lái)的輔助信息。在輔助獲取部 166獲取到輔助信息的情況下,布局生成部160能夠根據(jù)該輔助信息生成布局信息。在輔助信息中包含與使用于OCR裝置120的OCR處理部中的算法有關(guān)的算法信息,例如為OCR裝置120的型號(hào)名稱或者在OCR裝置120的OCR處理部中使用的OCR處理軟件的名稱或者版本。布局生成部160與輔助獲取部166所獲取的算法信息相應(yīng)地對(duì)布局信息施加限制。例如在根據(jù)用戶的操作輸入配置文本框18 的情況下,布局生成部160對(duì)該文本框 18 的線寬190f設(shè)置下限值。例如在算法信息為OCR處理軟件的名稱和版本的情況下,根據(jù)以該OCR處理軟件和版本確定的算法的性能來(lái)設(shè)定該下限值。同樣地,布局生成部160根據(jù)算法信息對(duì)基準(zhǔn)標(biāo)記182c的大小190i和配置(基準(zhǔn)點(diǎn)坐標(biāo)190c)、條形碼182d的大小190i、掃描儀140無(wú)法讀取的濾色、字符種類190k、屬性1901等設(shè)定項(xiàng)目施加限制。另外,在用戶指示了文本框18 等結(jié)構(gòu)要素的配置的情況下,布局生成部160也可以根據(jù)算法信息來(lái)決定該結(jié)構(gòu)要素的布局信息所含的上述設(shè)定項(xiàng)目的初始值。根據(jù)使用算法信息的結(jié)構(gòu),能夠減少用于確認(rèn)表單152的OCR處理精度的測(cè)試以及觀察該測(cè)試的OCR處理結(jié)果來(lái)修正布局信息這種作業(yè)的反復(fù)次數(shù),能夠大幅減輕用戶的作業(yè)負(fù)擔(dān)?;鶞?zhǔn)生成部168根據(jù)布局生成部160所生成的布局信息來(lái)生成成為與OCR裝置 120中的OCR處理的結(jié)果進(jìn)行比較的基準(zhǔn)的基準(zhǔn)數(shù)據(jù)。后面詳細(xì)說(shuō)明基準(zhǔn)數(shù)據(jù)。布局發(fā)送部170將布局信息、基準(zhǔn)數(shù)據(jù)發(fā)送給OCR裝置120。另外,布局發(fā)送部170 將排除了由不使用要素決定部162決定為不使用的圖像要素而得到的參考用圖像數(shù)據(jù)發(fā)送給OCR裝置120。數(shù)據(jù)輸出部172將布局信息變換為與印刷對(duì)應(yīng)的形式之后輸出到打印機(jī) 130。輸出控制部174在印刷表單152的情況下控制打印機(jī)130使其在預(yù)定的印刷條件下進(jìn)行印刷。并不限于輸出控制部174直接控制打印機(jī)130的情況,也可以是以下情況輸出控制部174將禁止變更的印刷條件等控制信息輸出到打印機(jī)130,打印機(jī)130根據(jù)該控制信息來(lái)設(shè)定印刷條件。
在隨意地在打印機(jī)130中變更印刷條件而例如進(jìn)行縮小印刷時(shí),印刷出的表單 152的字符大小變小或者線的粗細(xì)變細(xì),從而有可能使OCR處理精度下降。輸出控制部174 控制打印機(jī)130使其在預(yù)定的印刷條件下進(jìn)行印刷,從而能夠避免以上的情況。讀取控制部176將指定掃描儀140讀取表單152并轉(zhuǎn)換為圖像數(shù)據(jù)時(shí)的分辨率、 讀取后執(zhí)行的應(yīng)用程序、命令的指定信息通過(guò)通信網(wǎng)150輸出到掃描儀140。并不限于通過(guò)上述通信網(wǎng)150輸出,讀取控制部176也可以將指定信息例如作為條形碼182d嵌入于表單 152,掃描儀140從該條形碼182d獲取指定信息。根據(jù)具備上述讀取控制部176的結(jié)構(gòu),能夠以適合于OCR處理的分辨率生成圖像數(shù)據(jù)或者利用掃描儀140的應(yīng)用程序、命令來(lái)校正生成后的圖像數(shù)據(jù),從而能夠進(jìn)一步提高OCR處理精度。(OCR 裝置 120)圖6是表示OCR裝置120的結(jié)構(gòu)的功能框圖。OCR裝置120構(gòu)成為包括顯示部 200、操作部202、存儲(chǔ)裝置204、中央控制部206。顯示部200包括液晶顯示器、有機(jī)EL顯示器等。操作部202包括設(shè)置于顯示部200 的顯示面上的觸摸面板、設(shè)置有多個(gè)操作鍵的鍵盤(pán)、鼠標(biāo)等指示裝置、十字鍵、操縱桿等。存儲(chǔ)裝置204包括HDD (Hard Disk Drive 硬盤(pán)驅(qū)動(dòng)器)、快閃存儲(chǔ)器、非易失性 RAM (Random Access Memory 隨機(jī)存取存儲(chǔ)器)等,存儲(chǔ)布局信息等。在本實(shí)施方式中, 存儲(chǔ)裝置204與OCR裝置120 —體地形成,但是并不限于上述情況,也可以是獨(dú)立的例如 NAS (Network Attached Storage 網(wǎng)絡(luò)附加存儲(chǔ))、外置 HDD、USB (Universal Serial Bus 通用串行總線)存儲(chǔ)器等。中央控制部206通過(guò)半導(dǎo)體集成電路來(lái)控制OCR裝置120整體,其中,該半導(dǎo)體集成電路包括中央處理裝置(CPU)、保存有程序等的ROM、作為工作區(qū)的RAM等。另外,中央控制部206還作為布局獲取部220、圖像獲取部222、圖像校正部224、0CR處理部226、輔助生成部228、基準(zhǔn)獲取部230以及輔助發(fā)送部232而發(fā)揮功能。布局獲取部220獲取從表單制作裝置110發(fā)送過(guò)來(lái)的布局信息或者參考用圖像數(shù)據(jù),存儲(chǔ)到存儲(chǔ)裝置204。圖像獲取部222從掃描儀140獲取讀取表單152而生成的圖像數(shù)據(jù)。在布局獲取部220預(yù)先接收到參考用圖像數(shù)據(jù)的情況下,圖像校正部2M根據(jù)存儲(chǔ)在存儲(chǔ)裝置204中的參考用圖像數(shù)據(jù)對(duì)由掃描儀140讀取到的表單152的圖像數(shù)據(jù)進(jìn)行位置偏移、傾斜的校正。存儲(chǔ)在存儲(chǔ)裝置204中的參考用圖像數(shù)據(jù)例如與表單152的表單 ID相對(duì)應(yīng),圖像校正部224能夠參照與所生成的表單152的圖像數(shù)據(jù)對(duì)應(yīng)的參考用圖像數(shù)據(jù)。另外,在本實(shí)施方式中設(shè)為以下結(jié)構(gòu)表單制作裝置110具備不使用要素決定部 162和參考用圖像生成部164,由OCR裝置120接收在表單制作裝置110中生成的參考用圖像數(shù)據(jù),但是也可以是以下結(jié)構(gòu)即OCR裝置120具備不使用要素決定部162和參考用圖像生成部164。OCR處理部2 例如以圖像獲取部222獲取到的圖像數(shù)據(jù)的圖像中的基準(zhǔn)標(biāo)記 182c為基準(zhǔn),讀取以條形碼182d等形式記載的表單152的表單ID。另外,OCR處理部226 從存儲(chǔ)裝置204讀出包含該表單ID的布局信息,根據(jù)讀出的布局信息對(duì)掃描儀140所讀取的表單152的圖像數(shù)據(jù)進(jìn)行OCR處理(從圖像數(shù)據(jù)中抽取該圖像數(shù)據(jù)所示的字符、數(shù)字等內(nèi)容的處理)。本實(shí)施方式的0 CR裝置120根據(jù)從表單制作裝置110獲取到的布局信息進(jìn)行 OCR處理,因此例如文本框18 的位置、讀取寫(xiě)入信息的位置可知,從而能夠提高OCR處理精度。并且,與例如由掃描儀140讀取印刷出的表單152而生成圖像數(shù)據(jù)并根據(jù)該圖像數(shù)據(jù)進(jìn)行位置偏移、傾斜的校正的情況相比,根據(jù)布局信息、參考用圖像數(shù)據(jù)進(jìn)行OCR處理的 OCR裝置120不受附著于表單152的臟污、表單152的褶皺的影響,從而能夠提高OCR處理精度。另外,在0 CR裝置120中共用由表單制作裝置110生成的布局信息,因此用戶不需要分別在表單制作裝置110和0 CR裝置120中進(jìn)行相同的設(shè)定,從而能夠減輕用戶的作業(yè)負(fù)擔(dān)。并且,在根據(jù)條件變更、根據(jù)OCR處理的結(jié)果需要提高0 CR處理精度而對(duì)制作過(guò)一次的表單152進(jìn)行布局信息的修正的情況下,也同樣地在表單制作裝置110和OCR裝置120 中共用在表單制作裝置110中修正過(guò)的布局信息,從而能夠減輕用戶的作業(yè)負(fù)擔(dān)。另外,在布局信息中包含對(duì)可變表單進(jìn)行定義的可變信息,該可變表單是表單152 中的輸入?yún)^(qū)域184的例如形狀、大小190i、配置、分割數(shù)等可變的表單。如果在處理這種可變表單的情況下不采用任何方法,則OCR處理部2 不得不僅根據(jù)圖像數(shù)據(jù)估計(jì)該輸入?yún)^(qū)域184,有時(shí)無(wú)法得到適當(dāng)?shù)腛CR結(jié)果。因此,在本實(shí)施方式中, 表單制作裝置110根據(jù)用戶的輸入操作來(lái)確定布局信息中的作為可變信息的輸入?yún)^(qū)域184 的形狀、大小190i、配置、分割數(shù)等,當(dāng)數(shù)據(jù)輸出部172將包含確定了可變信息中的輸入?yún)^(qū)域184的可變信息的布局信息輸出到打印機(jī)130時(shí),以該數(shù)據(jù)輸出部172的輸出為契機(jī),布局發(fā)送部170將確定了該輸入?yún)^(qū)域184的布局信息發(fā)送給OCR裝置120。另外,在要在打印機(jī)130中確定輸入?yún)^(qū)域184的形狀、大小190i、配置、分割數(shù)等的情況下,布局發(fā)送部170 也可以以來(lái)自打印機(jī)130的表單152的實(shí)際印刷為契機(jī),將確定了該輸入?yún)^(qū)域184的布局信息發(fā)送給OCR裝置120。根據(jù)上述結(jié)構(gòu),在OCR裝置120中布局信息的輸入?yún)^(qū)域184已確定,因此能夠根據(jù)正確的輸入?yún)^(qū)域184的信息來(lái)提高OCR處理精度,并且由于成為OCR處理的對(duì)象的區(qū)域縮小,因此能夠降低處理負(fù)載。另外,這種情況下的布局信息也可以是上述的與用戶的操作輸入相應(yīng)的表單152 的布局的參考用圖像數(shù)據(jù)。例如,OCR裝置120將掃描儀140所讀取的表單152的圖像數(shù)據(jù)例如格線的位置等以與作為布局信息的參考用圖像數(shù)據(jù)一致地方式進(jìn)行校正之后,進(jìn)行 OCR處理。即使根據(jù)上述結(jié)構(gòu)也能夠提高OCR處理精度。輔助生成部2 生成輔助信息,該輔助信息輔助布局信息的生成。并且,在輔助信息中還包含表示布局信息的改進(jìn)點(diǎn)的改進(jìn)信息。以上說(shuō)明了輔助信息中的算法信息,因此在此詳細(xì)說(shuō)明改進(jìn)信息。圖7是用于說(shuō)明改進(jìn)信息的說(shuō)明圖。特別是,圖7的(a)表示布局信息的一例,圖 7的(b)表示改進(jìn)信息的一例,圖7的(c)表示基準(zhǔn)數(shù)據(jù)的一例。輔助生成部2 參照由布局獲取部220獲取到的例如圖7的(a)示出的與輸入?yún)^(qū)域184有關(guān)的布局信息。前面使用圖4的(c)說(shuō)明了上述布局信息,因此省略說(shuō)明。另外,輔助生成部2 確認(rèn)由OCR處理部2 進(jìn)行OCR處理的結(jié)果,即確認(rèn)對(duì)以所參照的布局信息表示的、應(yīng)該讀取寫(xiě)入信息的分割得到的輸入?yún)^(qū)域184是否讀取出寫(xiě)入信息(讀取成功與否)。例如在讀取手寫(xiě)字符的情況下,OCR處理部2 對(duì)于與登記于OCR處理軟件的基準(zhǔn)字符進(jìn)行對(duì)照的結(jié)果是判斷為最接近的字符,將表示與基準(zhǔn)字符匹配的程度的指標(biāo)值與規(guī)定閾值進(jìn)行比較來(lái)判斷讀取成功與否。能夠根據(jù)用戶的操作輸入來(lái)變更該閾值。輔助生成部2 根據(jù)OCR處理結(jié)果生成圖7的(b)示出的使布局信息中的表示分割得到的該輸入?yún)^(qū)域184的布局ID 190a與讀取成功與否(讀取成功與否250)相關(guān)聯(lián)的
改進(jìn)信息。這樣,改進(jìn)信息例如表示OCR處理的結(jié)果、準(zhǔn)確地說(shuō)是在應(yīng)該讀取寫(xiě)入信息的分割得到的輸入?yún)^(qū)域184中讀取失敗的情況。在布局生成部160中根據(jù)該改進(jìn)信息例如以紅色填充讀取失敗的分割得到的輸入?yún)^(qū)域184或者染紅包圍分割得到的該輸入?yún)^(qū)域184的文本框18 來(lái)促使用戶改進(jìn)。并且,根據(jù)用戶的操作輸入,例如進(jìn)行增大輸入?yún)^(qū)域184、文本框18 的大小190i等布局信息的修正來(lái)實(shí)現(xiàn)提高0 CR處理精度。根據(jù)使用上述改進(jìn)信息的結(jié)構(gòu),即使不按照每個(gè)輸入?yún)^(qū)域184確認(rèn)寫(xiě)入信息的讀取成功與否也自動(dòng)地進(jìn)行提示,因此能夠減輕用戶的作業(yè)負(fù)擔(dān),并且能夠避免看漏要改進(jìn)的點(diǎn)這種情況。另外,使用上述表單制作裝置110的基準(zhǔn)生成部168所生成的基準(zhǔn)數(shù)據(jù),能夠使改進(jìn)信息作為更有益的信息而有效地實(shí)現(xiàn)改進(jìn)?;鶞?zhǔn)生成部168所生成的基準(zhǔn)數(shù)據(jù)是不包含于布局信息的使用于確認(rèn)OCR處理精度的測(cè)試中的數(shù)據(jù)?;鶞?zhǔn)數(shù)據(jù)例如包含圖7的(c)示出的表示分割得到的輸入?yún)^(qū)域184的布局ID 190a、用戶用于進(jìn)行測(cè)試而寫(xiě)入到分割得到的該輸入?yún)^(qū)域184的字符的大小^Oa以及內(nèi)容^0b。在這種情況下,用戶預(yù)先對(duì)在表單152中分割得到的輸入?yún)^(qū)域184寫(xiě)入被確定為基準(zhǔn)數(shù)據(jù)的例如大小260a、內(nèi)容^Ob的字符。另外,并不限于手寫(xiě)字符,也可以利用打印機(jī) 130印刷被確定為基準(zhǔn)數(shù)據(jù)的字符。在這種情況下,不受用戶手寫(xiě)字符的好壞限制,能夠可靠地檢測(cè)由掃描儀140的圖像失真等引起的讀取失敗而改進(jìn)OCR處理精度。之后,OCR裝置120的圖像獲取部222通過(guò)掃描儀140獲取該表單152的圖像數(shù)據(jù)?;鶞?zhǔn)獲取部230獲取布局發(fā)送部170所發(fā)送的基準(zhǔn)數(shù)據(jù)。輔助生成部2 根據(jù)基準(zhǔn)獲取部230所獲取到的基準(zhǔn)數(shù)據(jù)以及0 CR處理的結(jié)果來(lái)生成改進(jìn)信息。輔助生成部2 例如將表示確定了大小沈徹、內(nèi)容^Ob的字符等的基準(zhǔn)數(shù)據(jù)與實(shí)際被寫(xiě)入了字符等的表單152的圖像數(shù)據(jù)的OCR處理結(jié)果進(jìn)行比較,生成改進(jìn)信息,后述的輔助發(fā)送部232將該改進(jìn)信息發(fā)送給表單制作裝置110。表單制作裝置110根據(jù)該改進(jìn)信息來(lái)修正布局信息。根據(jù)使用上述基準(zhǔn)數(shù)據(jù)的結(jié)構(gòu),能夠進(jìn)行是否存在字符錯(cuò)誤識(shí)別等詳細(xì)的比較,從而能夠提高布局信息的改進(jìn)精度。如上所述,通過(guò)使用算法信息、改進(jìn)信息這種輔助信息,表單制作裝置110能夠共享可在0 CR裝置120側(cè)掌握的信息,表單制作裝置110的布局生成部160能夠生成容易進(jìn)行OCR處理的布局信息。輔助發(fā)送部232將由輔助生成部228生成的輔助信息發(fā)送給表單制作裝置110。以上,通過(guò)所說(shuō)明的表單制作裝置110和OCR裝置120,能夠在大幅減輕用戶的作業(yè)負(fù)擔(dān)的同時(shí)提高OCR處理精度。另外,還提供使計(jì)算機(jī)作為表單制作裝置110而發(fā)揮功能的表單制作程序以及作為OCR裝置120而發(fā)揮功能的OCR處理程序、存儲(chǔ)有該表單制作程序和OCR處理程序的計(jì)算機(jī)可讀取的軟盤(pán)、光磁盤(pán)、R0M、EPR0M、EEPR0M、CD(Compact Disc 致密光盤(pán))、DVD (Digital Versatile Disc 數(shù)字多功能光盤(pán))、BD (Blu-ray Disc 藍(lán)光光盤(pán))等存儲(chǔ)介質(zhì)。在此,程序是指通過(guò)任意的語(yǔ)言、描述方法描述的數(shù)據(jù)處理方法。另外,該表單制作程序和OCR處理程序也可以被存儲(chǔ)在通過(guò)通信網(wǎng)150與表單制作裝置110或者OCR裝置120相連接的任意的應(yīng)用程序服務(wù)器,根據(jù)需要還能夠下載其全部或者一部分。(表單處理方法)接著,說(shuō)明進(jìn)行上述表單處理程序的使用的表單處理方法。圖8是表示表單處理方法測(cè)試時(shí)的整體處理流程的序列圖,圖9是表示表單處理方法使用時(shí)的整體處理流程的序列圖。如圖8所示,當(dāng)OCR裝置120將包含算法信息的輔助信息發(fā)送給表單制作裝置110 時(shí)(S 300),在表單制作裝置110中,布局生成部160根據(jù)用戶的操作輸入來(lái)生成表示表單 152的布局的布局信息(S 302)。然后,按照印刷表單152的操作輸入,數(shù)據(jù)輸出部172將確定了輸入?yún)^(qū)域184的布局信息變換為與印刷對(duì)應(yīng)的形式之后輸出到打印機(jī)130(S304)。 打印機(jī)130印刷表單152(S306)。不使用要素決定部162決定布局信息中的不使用的圖像要素(S308)。參考用圖像生成部164根據(jù)布局信息生成排除了由不使用要素決定部162決定為不使用的圖像要素而得到的參考用圖像數(shù)據(jù)(S 310)。然后,基準(zhǔn)生成部168根據(jù)確定了輸入?yún)^(qū)域184的布局信息來(lái)生成基準(zhǔn)數(shù)據(jù)(S 310)。布局發(fā)送部170將布局信息、參考用圖像數(shù)據(jù)、基準(zhǔn)數(shù)據(jù)發(fā)送給OCR裝置120 (S 314)。用戶在印刷出的表單152中例如記載顯示在顯示部154中的基準(zhǔn)數(shù)據(jù)所示的確定了大小260a、內(nèi)容^Ob的字符等。在印刷出的表單152中記載了信息之后,掃描儀140讀取記載了該信息的表單 152 (S 316),將圖像數(shù)據(jù)發(fā)送給OCR裝置120 (S318)。OCR裝置120的圖像校正部2M根據(jù)參考用圖像數(shù)據(jù)對(duì)由掃描儀140讀取并生成的表單152的圖像數(shù)據(jù)進(jìn)行位置偏移、傾斜的校正(S320)。OCR處理部2 根據(jù)布局信息對(duì)圖像數(shù)據(jù)進(jìn)行OCR處理(S32》。然后,輔助生成部2 根據(jù)OCR處理的結(jié)果和基準(zhǔn)數(shù)據(jù)來(lái)生成改進(jìn)信息(S324)。輔助發(fā)送部232將改進(jìn)信息發(fā)送給表單制作裝置110(S326)。表單制作裝置110的布局生成部160根據(jù)改進(jìn)信息來(lái)促使用戶改進(jìn),修正布局信息(S328)。如圖9所示,在使用時(shí),按照印刷表單152的操作輸入,表單制作裝置110的數(shù)據(jù)輸出部172將確定了輸入?yún)^(qū)域184的布局信息變換為與印刷對(duì)應(yīng)的形式之后輸出到打印機(jī) 130 (S 340)。表單制作裝置110的不使用要素決定部162決定布局信息中的不使用的圖像要素(S 342)。參考用圖像生成部164根據(jù)布局信息生成排除了由不使用要素決定部162 決定為不使用的圖像要素而得到的參考用圖像數(shù)據(jù)(S344)。布局發(fā)送部170將布局信息、 參考用圖像數(shù)據(jù)發(fā)送給OCR裝置120 (S 346)。打印機(jī)130印刷表單152 (S 348)。將此時(shí)的表單152的布局信息設(shè)為已經(jīng)通過(guò)圖8示出的表單處理方法根據(jù)改進(jìn)信息修正的信息。然后,用戶通過(guò)手寫(xiě)等方式將業(yè)務(wù)上的信息記載于表單152上之后,掃描儀140讀取所記載的表單152(S 350),當(dāng)讀取到的圖像數(shù)據(jù)發(fā)送給OCR裝置120時(shí)(S 352),0CR裝置120的圖像校正部2M根據(jù)參考用圖像數(shù)據(jù)對(duì)掃描儀140讀取并生成的表單152的圖像數(shù)據(jù)進(jìn)行位置偏移、傾斜的校正(S 354)。然后,OCR處理部2 對(duì)校正后的圖像數(shù)據(jù)進(jìn)行 OCR處理來(lái)獲取寫(xiě)入信息(S 356)。上述圖像數(shù)據(jù)的布局信息已經(jīng)在圖8中進(jìn)行了修正,因此OCR處理精度也變高。根據(jù)這種表單處理方法,在圖8示出的測(cè)試時(shí)以及圖9示出的使用時(shí)都能夠減輕用戶的作業(yè)負(fù)擔(dān),并且通過(guò)使用根據(jù)改進(jìn)信息修正過(guò)的布局信息能夠提高OCR處理精度。以上,參照
了本發(fā)明的優(yōu)選實(shí)施方式,但是當(dāng)然本發(fā)明并不限于上述實(shí)施方式。本領(lǐng)域技術(shù)人員在記載于權(quán)利要求的范圍內(nèi)的范疇中能夠想得到各種變更例或者修正例是顯而易見(jiàn)的,這些也當(dāng)然理解為屬于本發(fā)明的技術(shù)范圍。此外,本說(shuō)明書(shū)的表單處理方法中的各工序不一定按照記載為序列圖的順序以時(shí)間序列進(jìn)行處理,還可以包含并列或者子程序的處理。產(chǎn)業(yè)上的可利用件能夠?qū)⒈景l(fā)明利用于進(jìn)行表單的制作以及讀取的表單處理系統(tǒng)、OCR裝置、OCR處理程序、表單制作裝置、表單制作程序以及表單處理方法。
權(quán)利要求
1.一種表單處理系統(tǒng),包括表單制作裝置和OCR裝置, 上述表單制作裝置具有布局生成部,其生成表示表單布局的布局信息;以及布局發(fā)送部,其將所生成的上述布局信息發(fā)送給上述OCR裝置, 其中,上述OCR裝置具有布局獲取部,其獲取從上述表單制作裝置發(fā)送過(guò)來(lái)的布局信息;以及 OCR處理部,其根據(jù)獲取到的上述布局信息對(duì)掃描儀所讀取出的表單的圖像數(shù)據(jù)進(jìn)行 OCR處理。
2.根據(jù)權(quán)利要求1所述的表單處理系統(tǒng),其特征在于, 上述OCR裝置還具有輔助生成部,其生成用于輔助生成上述布局信息的輔助信息;以及輔助發(fā)送部,其將上述輔助信息發(fā)送給上述表單制作裝置,其中,上述表單制作裝置還具有輔助獲取部,該輔助獲取部獲取發(fā)送過(guò)來(lái)的上述輔助 fn息,上述布局生成部根據(jù)所獲取到的上述輔助信息來(lái)生成上述布局信息。
3.根據(jù)權(quán)利要求2所述的表單處理系統(tǒng),其特征在于,在上述輔助信息中包含與使用于上述OCR裝置的OCR處理部的算法有關(guān)的算法信息。
4.根據(jù)權(quán)利要求2或者3所述的表單處理系統(tǒng),其特征在于,上述輔助生成部根據(jù)上述OCR處理的結(jié)果來(lái)生成表示所獲取到的上述布局信息的改進(jìn)點(diǎn)的改進(jìn)信息,在上述輔助信息中包含上述改進(jìn)信息。
5.根據(jù)權(quán)利要求4所述的表單處理系統(tǒng),其特征在于,上述表單制作裝置還具有基準(zhǔn)生成部,該基準(zhǔn)生成部根據(jù)所生成的上述布局信息來(lái)生成基準(zhǔn)數(shù)據(jù),該基準(zhǔn)數(shù)據(jù)為與上述OCR處理的結(jié)果進(jìn)行比較的基準(zhǔn), 上述布局發(fā)送部將上述基準(zhǔn)數(shù)據(jù)發(fā)送給上述OCR裝置, 上述OCR裝置還具有基準(zhǔn)獲取部,該基準(zhǔn)獲取部獲取發(fā)送過(guò)來(lái)的上述基準(zhǔn)數(shù)據(jù), 上述輔助生成部根據(jù)所獲取到的上述基準(zhǔn)數(shù)據(jù)和上述OCR處理的結(jié)果來(lái)生成上述改進(jìn)fe息。
6.根據(jù)權(quán)利要求1至5中的任一項(xiàng)所述的表單處理系統(tǒng),其特征在于,上述表單制作裝置還具有數(shù)據(jù)輸出部,該數(shù)據(jù)輸出部將所生成的上述布局信息輸出到打印機(jī),在所生成的上述布局信息中包含用于定義可變表單的可變信息,該可變表單是表單中的輸入?yún)^(qū)域可變的表單,當(dāng)上述數(shù)據(jù)輸出部將已確定上述可變信息中的輸入?yún)^(qū)域的布局信息輸出到上述打印機(jī)時(shí),上述布局發(fā)送部將已確定上述輸入?yún)^(qū)域的布局信息發(fā)送給上述OCR裝置。
7.根據(jù)權(quán)利要求1所述的表單處理系統(tǒng),其特征在于, 還包括打印機(jī)和圖像讀取裝置,上述表單制作裝置還具有輸出控制部,其在上述打印機(jī)印刷表單的情況下,控制打印機(jī)以使其在預(yù)先確定的印刷條件下進(jìn)行印刷;以及讀取控制部,其在由上述圖像讀取裝置讀取表單的情況下,指定圖像讀取裝置的動(dòng)作方法。
8.根據(jù)權(quán)利要求1至7中的任一項(xiàng)所述的表單處理系統(tǒng),其特征在于, 上述表單制作裝置還具有不使用要素決定部,其決定上述布局信息中的不使用的圖像要素;以及參考用圖像生成部,其根據(jù)上述布局信息來(lái)生成已排除由上述不使用要素決定部決定為不使用的圖像要素而得到的參考用圖像數(shù)據(jù),其中,上述布局發(fā)送部將上述布局信息或者上述參考用圖像數(shù)據(jù)發(fā)送給上述OCR裝置,上述OCR裝置還具有圖像校正部,該圖像校正部在接收到上述參考用圖像數(shù)據(jù)的情況下根據(jù)該參考用圖像數(shù)據(jù)來(lái)校正上述掃描儀所讀取出的表單的圖像數(shù)據(jù)。
9.根據(jù)權(quán)利要求1至7中的任一項(xiàng)所述的表單處理系統(tǒng),其特征在于, 上述OCR裝置還具有不使用要素決定部,其決定上述布局信息中的不使用的圖像要素; 參考用圖像生成部,其根據(jù)上述布局信息來(lái)生成已排除由上述不使用要素決定部決定為不使用的圖像要素而得到的參考用圖像數(shù)據(jù);以及圖像校正部,其根據(jù)上述參考用圖像數(shù)據(jù)來(lái)校正上述掃描儀所讀取出的表單的圖像數(shù)據(jù)。
10.根據(jù)權(quán)利要求8或者9所述的表單處理系統(tǒng),其特征在于,在由上述不使用要素決定部決定為不使用的圖像要素中包含可變的字符串或者數(shù)字串、點(diǎn)線、虛線、包含灰色的彩色填充、陰影、條形碼的圖案圖像、包含灰色的彩色圖像要素、 比預(yù)先確定的預(yù)定值細(xì)的線、或者比預(yù)先確定的預(yù)定值小的字符。
11.根據(jù)權(quán)利要求8至10中的任一項(xiàng)所述的表單處理系統(tǒng),其特征在于,上述參考用圖像生成部對(duì)從上述布局信息中排除由上述不使用要素決定部決定為不使用的圖像要素而得到的圖像要素進(jìn)行柵格化處理。
12.—種OCR裝置,具有布局獲取部,其獲取從制作表單的表單制作裝置發(fā)送過(guò)來(lái)的表示表單布局的布局信息;以及OCR處理部,其根據(jù)所獲取到的上述布局信息對(duì)掃描儀所讀取出的表單的圖像數(shù)據(jù)進(jìn)行OCR處理。
13.一種表單制作裝置,具有布局生成部,其生成表示表單的布局的布局信息;以及布局發(fā)送部,其向OCR裝置發(fā)送所生成的上述布局信息,該OCR裝置對(duì)在上述表單中填寫(xiě)的填寫(xiě)信息進(jìn)行分析。
14.一種表單處理方法,通過(guò)表單制作裝置以及與上述表單制作裝置通信連接的OCR 裝置來(lái)進(jìn)行表單管理,上述表單制作裝置生成表示表單布局的布局信息,并將所生成的上述布局信息發(fā)送給上述OCR裝置,上述OCR裝置獲取從上述表單制作裝置發(fā)送過(guò)來(lái)的布局信息,并根據(jù)所獲取到的上述布局信息對(duì)掃描儀所讀取出的表單的圖像數(shù)據(jù)進(jìn)行OCR處理。
全文摘要
提供一種表單處理系統(tǒng)、OCR裝置、表單制作裝置及其處理方法,提高表單的OCR處理精度。本發(fā)明的表單處理系統(tǒng)(100)包括表單制作裝置(110)和OCR裝置(120),表單制作裝置具有布局生成部(160)和布局發(fā)送部(170),該布局生成部(160)生成表示表單(152)布局的布局信息,該布局發(fā)送部(170)將所生成的布局信息發(fā)送給OCR裝置,OCR裝置具有布局獲取部(220)和OCR處理部(226),該布局獲取部(220)獲取從表單制作裝置發(fā)送過(guò)來(lái)的布局信息,該OCR處理部(226)根據(jù)獲取到的布局信息對(duì)掃描儀(140)讀取到的表單的圖像數(shù)據(jù)進(jìn)行OCR處理。
文檔編號(hào)G06K9/20GK102331914SQ201110136450
公開(kāi)日2012年1月25日 申請(qǐng)日期2011年5月24日 優(yōu)先權(quán)日2010年5月24日
發(fā)明者杉田敏彥, 桑村良則, 萩澤章一, 道場(chǎng)鄉(xiāng) 申請(qǐng)人:株式會(huì)社Pfu