專(zhuān)利名稱(chēng):表單處理系統(tǒng)、表單制作裝置以及表單處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種對(duì)表單進(jìn)行制作以及讀取的表單處理系統(tǒng)、表單制作裝置以及表單處理方法。
背景技術(shù):
近年來(lái),在各領(lǐng)域中進(jìn)行著無(wú)紙化,但是例如在組織的基礎(chǔ)業(yè)務(wù)中,發(fā)票、考勤表、 調(diào)查表、試卷以及醫(yī)院的診斷表等仍然使用印刷在紙張上的表單。用戶(hù)為了有效地管理之后通過(guò)手寫(xiě)等填寫(xiě)在表單上的信息,利用掃描儀讀取表單,利用OCR (Optical Character Reader 光符閱讀機(jī))裝置實(shí)施OCR處理。但是,在表單的布局、格式不正確的情況下,有時(shí)無(wú)法正確地進(jìn)行OCR處理。因此, 公開(kāi)了一種技術(shù),即根據(jù)由用戶(hù)輸入的OCR型號(hào)、行字段數(shù)、字符數(shù)自動(dòng)生成表單格式(例如專(zhuān)利文獻(xiàn)1)。另外,提出了一種信息處理裝置,即將從表單讀取到的圖像數(shù)據(jù)與作為選擇基準(zhǔn)的多個(gè)選擇基準(zhǔn)圖像數(shù)據(jù)進(jìn)行比較,選擇對(duì)應(yīng)于從表單讀取到的圖像數(shù)據(jù)的選擇基準(zhǔn)圖像數(shù)據(jù),根據(jù)該選擇基準(zhǔn)圖像數(shù)據(jù)來(lái)進(jìn)行OCR處理(例如專(zhuān)利文獻(xiàn)2)。專(zhuān)利文獻(xiàn)1 日本特開(kāi)平8-30659號(hào)公報(bào)專(zhuān)利文獻(xiàn)2 日本特開(kāi)2000-132542號(hào)公報(bào)
發(fā)明內(nèi)容
發(fā)明要解決的問(wèn)題以往,無(wú)法利用OCR裝置對(duì)掃描儀所讀取到的表單的圖像數(shù)據(jù)正確地進(jìn)行OCR處理。另外,也存在以O(shè)CR處理的精度為優(yōu)先而僅能使表單的布局固定地形成的情況。因此,本發(fā)明是鑒于這種問(wèn)題而完成的,目的在于提供一種能夠提高表單的OCR 處理精度的表單處理系統(tǒng)、OCR裝置、OCR處理程序、表單制作裝置、表單制作程序以及表單處理方法。用于解決問(wèn)題的方案為了解決上述問(wèn)題,本發(fā)明的表單處理系統(tǒng)包括表單制作裝置和打印機(jī),表單制作裝置具有布局生成部,其生成表示表單布局的布局信息;繪制指示部,其根據(jù)布局信息,使打印機(jī)的繪制執(zhí)行部生成與該布局信息的至少一部分對(duì)應(yīng)的參考用圖像數(shù)據(jù);以及圖像發(fā)送部,其將所生成的參考用圖像數(shù)據(jù)發(fā)送給OCR裝置,打印機(jī)具有繪制執(zhí)行部,該繪制執(zhí)行部根據(jù)繪制指示部的指示生成參考用圖像數(shù)據(jù)。繪制指示部還可以投入印刷作業(yè)來(lái)調(diào)用繪制執(zhí)行部,使繪制執(zhí)行部根據(jù)印刷作業(yè)生成參考用圖像數(shù)據(jù),當(dāng)獲取完所生成的參考用圖像數(shù)據(jù)時(shí),取消印刷作業(yè)。在存在多個(gè)繪制執(zhí)行部的情況下,繪制指示部還可以執(zhí)行以下操作中的某一個(gè)操作使所有繪制執(zhí)行部生成參考用圖像數(shù)據(jù);僅使預(yù)先確定的一個(gè)繪制執(zhí)行部生成參考用圖像數(shù)據(jù);使所有的繪制執(zhí)行部生成參考用圖像數(shù)據(jù)并合成;僅使用戶(hù)所選擇的繪制執(zhí)行部生成參考用圖像數(shù)據(jù)。
為了解決上述問(wèn)題,本發(fā)明的表單處理系統(tǒng)包括打印機(jī)和表單制作裝置,打印機(jī)具有功能發(fā)送部,該功能發(fā)送部將表示印刷功能的印刷功能信息發(fā)送給表單制作裝置,表單制作裝置具有布局生成部,其生成表示表單布局的布局信息;繪制執(zhí)行部,其根據(jù)印刷功能信息和布局信息,生成與布局信息的至少一部分對(duì)應(yīng)的參考用圖像數(shù)據(jù);以及圖像發(fā)送部,其將所生成的參考用圖像數(shù)據(jù)發(fā)送給OCR裝置。表單制作裝置還可以具有布局生成部,其生成表示表單布局的布局信息;以及布局發(fā)送部,其將所生成的布局信息發(fā)送給OCR裝置,OCR裝置具有布局獲取部,其獲取從表單制作裝置發(fā)送過(guò)來(lái)的布局信息;以及OCR處理部,其根據(jù)獲取到的布局信息對(duì)由掃描儀讀取到的表單的圖像數(shù)據(jù)進(jìn)行OCR處理。OCR裝置還可以具有輔助生成部,其生成輔助生成布局信息的輔助信息;以及輔助發(fā)送部,其將輔助信息發(fā)送給表單制作裝置,表單制作裝置還具有輔助獲取部,該輔助獲取部獲取發(fā)送過(guò)來(lái)的輔助信息,布局生成部根據(jù)獲取到的輔助信息來(lái)生成布局信息。在輔助信息中還可以包含與使用于OCR裝置的OCR處理部的算法有關(guān)的算法信肩、ο輔助生成部還可以根據(jù)OCR處理的結(jié)果來(lái)生成表示獲取到的布局信息的改進(jìn)點(diǎn)的改進(jìn)信息,在輔助信息中包含改進(jìn)信息。表單制作裝置還可以具有基準(zhǔn)生成部,該基準(zhǔn)生成部根據(jù)所生成的布局信息來(lái)生成基準(zhǔn)數(shù)據(jù),該基準(zhǔn)數(shù)據(jù)為與OCR處理的結(jié)果進(jìn)行比較的基準(zhǔn),布局發(fā)送部將基準(zhǔn)數(shù)據(jù)發(fā)送給OCR裝置,OCR裝置還具有基準(zhǔn)獲取部,該基準(zhǔn)獲取部獲取發(fā)送過(guò)來(lái)的基準(zhǔn)數(shù)據(jù),輔助生成部根據(jù)獲取到的基準(zhǔn)數(shù)據(jù)和OCR處理的結(jié)果來(lái)生成改進(jìn)信息。表單制作裝置還可以具有數(shù)據(jù)輸出部,該數(shù)據(jù)輸出部將所生成的布局信息輸出到打印機(jī),在所生成的布局信息中包含對(duì)可變表單進(jìn)行定義的可變信息,該可變表單是表單中的輸入?yún)^(qū)域可變的表單,當(dāng)數(shù)據(jù)輸出部將確定了可變信息中的輸入?yún)^(qū)域的布局信息輸出到打印機(jī)時(shí),布局發(fā)送部將確定了可變信息中的輸入?yún)^(qū)域的布局信息發(fā)送給OCR裝置。表單處理系統(tǒng)還可以包括圖像讀取裝置,表單制作裝置還具有輸出控制部,其在打印機(jī)印刷表單的情況下,控制打印機(jī)使其在預(yù)先確定的印刷條件下進(jìn)行印刷;以及讀取控制部,其在由圖像讀取裝置讀取表單的情況下,指定該圖像讀取裝置的動(dòng)作方法。為了解決上述問(wèn)題,本發(fā)明的表單制作裝置具有布局生成部,其生成表示表單布局的布局信息;繪制指示部,其根據(jù)布局信息,使打印機(jī)的繪制程序生成與布局信息的至少一部分對(duì)應(yīng)的參考用圖像數(shù)據(jù);以及圖像發(fā)送部,其將所生成的參考用圖像數(shù)據(jù)發(fā)送給 OCR裝置。為了解決上述問(wèn)題,本發(fā)明的表單制作程序使計(jì)算機(jī)作為以下部分而發(fā)揮功能 布局生成部,其生成表示表單布局的布局信息;繪制指示部,其根據(jù)布局信息,使打印機(jī)的繪制程序生成與布局信息的至少一部分對(duì)應(yīng)的參考用圖像數(shù)據(jù);以及圖像發(fā)送部,其將所生成的參考用圖像數(shù)據(jù)發(fā)送給OCR裝置。為了解決上述問(wèn)題,本發(fā)明的表單處理方法通過(guò)表單制作裝置以及與表單制作裝置通信連接的OCR裝置來(lái)進(jìn)行表單管理,表單制作裝置生成表示表單布局的布局信息,根據(jù)布局信息,使打印機(jī)的繪制程序生成與布局信息的至少一部分對(duì)應(yīng)的參考用圖像數(shù)據(jù); 以及將所生成的參考用圖像數(shù)據(jù)發(fā)送給OCR裝置。
發(fā)明的效果如上所述,本發(fā)明能夠提高表單的OCR處理精度。
圖1是表示表單處理系統(tǒng)的概要連接關(guān)系的說(shuō)明圖。圖2是表示表單制作裝置的結(jié)構(gòu)的功能框圖。圖3是表示表單布局的一例的說(shuō)明圖。圖4是用于說(shuō)明布局信息(特征信息以及數(shù)據(jù)屬性信息)的說(shuō)明圖。圖5是表示打印機(jī)的結(jié)構(gòu)的功能框圖。圖6是表示其它打印機(jī)的結(jié)構(gòu)的功能框圖。圖7是表示其它表單制作裝置的結(jié)構(gòu)的功能框圖。圖8是表示OCR裝置的結(jié)構(gòu)的功能框圖。圖9是用于說(shuō)明改進(jìn)信息的說(shuō)明圖。圖10是表示表單處理方法測(cè)試時(shí)的整體處理流程的序列圖。圖11是表示表單處理方法使用時(shí)的整體處理流程的序列圖。圖12是表示其它表單處理方法測(cè)試時(shí)的整體處理流程的序列圖。圖13是表示其它表單處理方法使用時(shí)的整體處理流程的序列圖。附圖標(biāo)記說(shuō)明100 表單處理系統(tǒng);110,350 表單制作裝置;120 :0CR裝置;130,300 打印機(jī); 140 掃描儀;152 表單;160 布局生成部;162 繪制指示部;164 圖像發(fā)送部;166 輔助獲取部;168 基準(zhǔn)生成部;170 布局發(fā)送部;172 數(shù)據(jù)輸出部;220、372 繪制執(zhí)行部;320 功能發(fā)送部;420 布局獲取部;似4 圖像校正部;似6 :0CR處理部;4 輔助生成部;430 基準(zhǔn)獲取部;432 輔助發(fā)送部。
具體實(shí)施例方式下面,參照附圖詳細(xì)說(shuō)明本發(fā)明的優(yōu)選實(shí)施方式。上述實(shí)施方式示出的尺寸、材料、其它具體的數(shù)值等僅是用于使發(fā)明的理解變得容易的例示,除了具有特別說(shuō)明的情況以外,并不限定本發(fā)明。此外,在本說(shuō)明書(shū)以及附圖中,對(duì)實(shí)質(zhì)上具有相同的功能、結(jié)構(gòu)的要素附加相同的附圖標(biāo)記來(lái)省略重復(fù)說(shuō)明,另外省略與本發(fā)明沒(méi)有直接關(guān)系的要素的圖示。(表單處理系統(tǒng)100)圖1是表示表單處理系統(tǒng)100的概要連接關(guān)系的說(shuō)明圖。表單處理系統(tǒng)100構(gòu)成為包括表單制作裝置110、0CR裝置120、打印機(jī)130、掃描儀140。表單制作裝置110通過(guò)因特網(wǎng)、LAN (Local Area Network :局域網(wǎng))、專(zhuān)用線路等通信網(wǎng)150與OCR裝置120相連接。 另外,表單制作裝置110例如通過(guò)LAN與打印機(jī)130相連接,OCR裝置120例如通過(guò)LAN與掃描儀140相連接。當(dāng)接收到由用戶(hù)輸入的制作布局的輸入時(shí),表單制作裝置110生成表示表單152 布局(與布局有關(guān)的信息)的布局信息。然后,打印機(jī)130印刷所生成的該布局信息的表單152。用戶(hù)在印刷出的表單152上通過(guò)手寫(xiě)、蓋印以及沖壓等例如記載業(yè)務(wù)上的信息。當(dāng)向表單152的記載完成時(shí),掃描儀140讀取記載有信息的表單152,OCR裝置120對(duì)讀取到的該圖像數(shù)據(jù)進(jìn)行OCR處理,獲取填寫(xiě)在表單152上的填寫(xiě)信息。例如,提出了一種表單制作裝置,即根據(jù)由用戶(hù)手動(dòng)輸入的OCR型號(hào)、行字段數(shù)、 字符數(shù)來(lái)自動(dòng)生成表單格式。但是,這種表單制作裝置僅自動(dòng)地調(diào)整要制作的表單的文本框、表單尺寸,存在要確定OCR型號(hào)等麻煩。并且,在反復(fù)讀取同一布局的表單的情況下,為了提高OCR處理精度,用戶(hù)必須對(duì)OCR裝置指定成為讀取對(duì)象的表單的讀取位置等。另外,將由掃描儀140讀取到的成為OCR處理對(duì)象的圖像數(shù)據(jù)與成為OCR處理的參考的圖像數(shù)據(jù)(以下稱(chēng)為參考用圖像數(shù)據(jù))進(jìn)行比較來(lái)校正圖像數(shù)據(jù)的位置偏移、傾斜, 由此能夠提高OCR處理精度。該參考用圖像數(shù)據(jù)通過(guò)表單制作裝置所具備的繪制功能來(lái)生成,但是表單制作裝置110的繪制功能使用與打印機(jī)130不同的獨(dú)立的圖像生成引擎,因此有時(shí)細(xì)微部分與實(shí)際上由打印機(jī)130印刷出的表單不同。例如每個(gè)打印機(jī)130不同而可印刷區(qū)域、原點(diǎn)位置、 字體種類(lèi)、尺寸、分辨率變換時(shí)的像素的插值方法等不同,由于該原因有可能引起位置偏移、傾斜的校正失敗而使OCR處理精度下降。本實(shí)施方式所涉及的表單處理系統(tǒng)100在表單制作裝置110生成布局信息時(shí),還將該布局信息共用于OCR裝置120的OCR處理。特別是,在使用參考用圖像數(shù)據(jù)的情況下, 表單制作裝置110生成更接近于實(shí)際上由打印機(jī)130印刷出的表單的參考用圖像數(shù)據(jù),發(fā)送給OCR裝置120。因而,根據(jù)該表單處理系統(tǒng)100,能夠在減輕用戶(hù)的作業(yè)負(fù)擔(dān)的同時(shí)提高OCR處理精度。下面,按照表單制作裝置110、OCR裝置120的順序詳細(xì)說(shuō)明表單制作裝置110、OCR裝置120的結(jié)構(gòu)。(表單制作裝置110)圖2是表示表單制作裝置110的結(jié)構(gòu)的功能框圖。表單制作裝置110構(gòu)成為包括顯示部154、操作部156、中央控制部158。顯示部巧4包括液晶顯示器、有機(jī)EL (Electro Luminescence 電致發(fā)光)顯示器等。操作部156包括設(shè)置于顯示部154的顯示面上的觸摸面板、設(shè)置有多個(gè)操作鍵的鍵盤(pán)、 鼠標(biāo)等指示裝置、十字鍵以及操縱桿等。表單制作裝置110在顯示部154中顯示布局制作畫(huà)面,接受用戶(hù)通過(guò)操作部156輸入的操作而生成表單152的布局。圖3是表示表單152的布局的一例的說(shuō)明圖。如圖3所示,作為表單152的布局, 例如設(shè)定文本框182a、字符18 、基準(zhǔn)標(biāo)記182c、條形碼182d等的配置。在此,在OCR裝置 120對(duì)掃描儀140所讀取的圖像數(shù)據(jù)實(shí)施OCR處理時(shí),基準(zhǔn)標(biāo)記182c成為表單152的方向以及布局位置的基準(zhǔn)。另外,條形碼182d是按照規(guī)定的規(guī)則對(duì)任意的信息進(jìn)行編碼而得到的,例如表示用于識(shí)別表單152的表單ID。表單制作裝置110根據(jù)用戶(hù)通過(guò)操作部156輸入的操作來(lái)設(shè)定圖3示出的布局。 此時(shí),表單152包括作為匯總具有規(guī)則性的輸入方式的區(qū)域的多個(gè)輸入?yún)^(qū)域184。輸入?yún)^(qū)域184例如被文本框18 包圍。在輸入?yún)^(qū)域184中能夠按照每個(gè)輸入?yún)^(qū)域184而設(shè)定假設(shè)為要填寫(xiě)的字符種類(lèi)(英文、數(shù)字、日文、符號(hào)等)、屬性(手寫(xiě)字符、鉛字等)等。中央控制部158通過(guò)半導(dǎo)體集成電路來(lái)控制表單制作裝置110整體,其中,該半導(dǎo)體集成電路包括中央處理裝置(CPU)、保存有程序等的ROM、作為工作區(qū)的RAM等。另外,中央控制部158還作為布局生成部160、繪制指示部162、圖像發(fā)送部164、輔助獲取部166、基準(zhǔn)生成部168、布局發(fā)送部170、數(shù)據(jù)輸出部172、輸出控制部174以及讀取控制部176而發(fā)揮功能。布局生成部160根據(jù)用戶(hù)通過(guò)操作部156輸入操作而設(shè)定的布局來(lái)生成表示表單 152布局的布局信息。在布局信息中包含特征信息、OCR屬性信息。特征信息是注釋(字典)等表示布局特征的信息,例如對(duì)格線、字符設(shè)定其位置、線類(lèi)型等。OCR屬性信息是表示成為OCR處理的對(duì)象的位置(以下稱(chēng)為OCR位置)、成為該OCR處理的對(duì)象的字符、標(biāo)記等數(shù)據(jù)屬性的信息。下面,根據(jù)圖4說(shuō)明特征信息以及OCR屬性信息。圖4是用于說(shuō)明布局信息(特征信息和數(shù)據(jù)屬性信息)的說(shuō)明圖。特別是,圖4 的(a)示出文本框18 的布局信息(特征信息),圖4的(b)示出字符182b的布局信息 (特征信息),圖4的(c)示出輸入?yún)^(qū)域184的布局信息(OCR屬性信息)。如圖4的(a)所示,文本框18 的布局信息例如包括布局ID 190a、表單ID 190b、基準(zhǔn)點(diǎn)坐標(biāo)190c、行列 190d、尺寸190e、線寬190f、線類(lèi)型190g、顏色190h等。布局ID 190a是識(shí)別該文本框18 的識(shí)別信息。表單ID 190b是識(shí)別成為表單 152的源的布局信息的識(shí)別信息?;鶞?zhǔn)點(diǎn)坐標(biāo)190c表示成為該文本框18 的基準(zhǔn)的點(diǎn)、例如文本框18 左下角的點(diǎn)的坐標(biāo)。在本實(shí)施方式中,坐標(biāo)系例如以表單152左下角基準(zhǔn)標(biāo)記182c為原點(diǎn),將橫向方向設(shè)為χ軸而將縱向方向設(shè)為y軸。行列190d表示進(jìn)一步分割被該文本框18 包圍的區(qū)域的情況下的行和列的數(shù)量。另外,布局信息也可以是不以表為單位設(shè)定文本框18 而以進(jìn)一步分割被該文本框18 包圍的區(qū)域而得到的塊為單位設(shè)定該文本框18 的信息。尺寸190e例如表示進(jìn)一步分割被文本框18 包圍的表而得到的塊的寬度和高度,在行、列不同而寬度、高度不同的情況下,按照每個(gè)行或者每個(gè)列進(jìn)行設(shè)定。文本框18 的線寬190f、線類(lèi)型190g、顏色190h也同樣地,在由于行、列不同而不同的情況下,按照每個(gè)行或者每個(gè)列進(jìn)行設(shè)定。此時(shí),在相鄰的行、列中文本框18 的線寬190f、線類(lèi)型190g、 顏色190h不同的情況下,文本框18 夾持的部分例如以通過(guò)用戶(hù)的操作輸入而在后面進(jìn)行的設(shè)定為優(yōu)先。另外,并不限于利用格線包圍四周的文本框182a,還能夠單獨(dú)地設(shè)定格線。如圖4的(b)所示,字符182b的布局信息例如包括布局ID190a、表單ID 190b、基準(zhǔn)點(diǎn)坐標(biāo)190c、大小190i以及內(nèi)容190j等。大小190i表示字符182b的大小,內(nèi)容190j 表示“采購(gòu)發(fā)票” “年” “月” “日”等要實(shí)際印刷的字符182b本身。另外,在字符182b例如為連號(hào)的發(fā)票編號(hào)、用戶(hù)不同而不同的用戶(hù)編號(hào)而可變的情況下,也可以在布局信息中包含表示字符182b的變更規(guī)則的可變信息。如圖4的(c)所示,輸入?yún)^(qū)域184的布局信息例如包括布局ID190a、表單ID 190b、 基準(zhǔn)點(diǎn)坐標(biāo)190c、尺寸190e、字符種類(lèi)190k、屬性1901以及顏色190m等。如上所述,字符種類(lèi)190k是假設(shè)為要被填寫(xiě)的字符的種類(lèi),例如能夠設(shè)定英文、數(shù)字、日文平假名、日文片假名、標(biāo)記、日文等。關(guān)于屬性1901,如果填寫(xiě)的方法為手寫(xiě)則能夠設(shè)定手寫(xiě)字符,如果為印刷、數(shù)據(jù)符號(hào)等則能夠設(shè)定鉛字等。圖4示出的布局信息(基準(zhǔn)特征信息和數(shù)據(jù)屬性信息)僅是一例,除了設(shè)定基準(zhǔn)標(biāo)記182c、條形碼182d以外還可設(shè)定能夠記載于表單152的各種結(jié)構(gòu)要素的信息。另外, 基準(zhǔn)特征信息例如也可以用PDLO3age Description Language 頁(yè)面描述語(yǔ)言)等各種數(shù)據(jù)形式來(lái)表示。另外,上述參考用圖像數(shù)據(jù)是將通過(guò)用戶(hù)的操作輸入而設(shè)定的布局例如圖像化 (柵格化)為使用了 RGB、CMYK等表色方法的位圖形式等而得到的圖像數(shù)據(jù)。但是,如上所述,表單制作裝置110的繪制功能使用與打印機(jī)130不同的獨(dú)立的圖像生成引擎,因此在細(xì)微部分有時(shí)與實(shí)際上由打印機(jī)130印刷出的表單不同。因此,有可能使OCR處理精度下降。 因此,本實(shí)施方式的表單制作裝置110具備繪制指示部162。繪制指示部162根據(jù)布局信息使后述的打印機(jī)130的繪制執(zhí)行部生成與布局信息的至少一部分對(duì)應(yīng)的參考用圖像數(shù)據(jù)。這樣,本實(shí)施方式的繪制指示部162使承擔(dān)打印機(jī)130的繪制功能的繪制執(zhí)行部生成參考用圖像數(shù)據(jù)。根據(jù)上述結(jié)構(gòu),能夠生成與打印機(jī)130的各印刷功能例如可印刷區(qū)域、原點(diǎn)位置、字體種類(lèi)、尺寸、分辨率變換時(shí)的像素的插值方法等特征匹配的參考用圖像數(shù)據(jù),能夠更可靠地執(zhí)行位置偏移、傾斜的校正,從而能夠提高OCR處理精度。另外,繪制指示部162還可以投入印刷作業(yè)來(lái)調(diào)用繪制執(zhí)行部,使繪制執(zhí)行部根據(jù)印刷作業(yè)生成參考用圖像數(shù)據(jù),當(dāng)獲取所生成的參考用圖像數(shù)據(jù)完成時(shí),取消印刷作業(yè)。根據(jù)上述結(jié)構(gòu),打印機(jī)130不追加新功能,而能夠使用印刷作業(yè)的投入和取消功能來(lái)生成參考用圖像數(shù)據(jù),從而能夠以更低成本實(shí)現(xiàn)表單處理系統(tǒng)。在存在多個(gè)繪制執(zhí)行部的情況下,繪制指示部162還可以執(zhí)行以下操作中的某一種操作使所有繪制執(zhí)行部生成參考用圖像數(shù)據(jù);僅使預(yù)先確定的一個(gè)繪制執(zhí)行部生成參考用圖像數(shù)據(jù);使所有的繪制執(zhí)行部生成參考用圖像數(shù)據(jù)并合成;僅使用戶(hù)所選擇的繪制執(zhí)行部生成參考用圖像數(shù)據(jù)。在此,參考用圖像數(shù)據(jù)的合成例如為針對(duì)單色位圖形式的圖像數(shù)據(jù)將每個(gè)點(diǎn)的值相加(求和)的處理。根據(jù)上述結(jié)構(gòu),能夠按照用戶(hù)的使用目的生成參考用圖像數(shù)據(jù)。圖像發(fā)送部164將由繪制指示部162指示而生成的參考用圖像數(shù)據(jù)發(fā)送給OCR裝置 120。輔助獲取部166獲取從后述的OCR裝置120發(fā)送過(guò)來(lái)的輔助信息。在輔助獲取部 166獲取到輔助信息的情況下,布局生成部160能夠根據(jù)該輔助信息生成布局信息。在輔助信息中包含與使用于OCR裝置120的OCR處理部中的算法有關(guān)的算法信息,例如為OCR 裝置120的型號(hào)名稱(chēng)或者使用于OCR裝置120的OCR處理部的OCR處理軟件的名稱(chēng)或者版本。布局生成部160與輔助獲取部166所獲取的算法信息相應(yīng)地對(duì)布局信息施加限制。例如在根據(jù)用戶(hù)的操作輸入配置文本框18 的情況下,布局生成部160對(duì)該文本框 18 的線寬190f設(shè)置下限值。例如在算法信息為OCR處理軟件的名稱(chēng)和版本的情況下,根據(jù)以該OCR處理軟件和版本所確定的算法的性能來(lái)設(shè)定該下限值。同樣地,布局生成部160根據(jù)算法信息對(duì)基準(zhǔn)標(biāo)記182c的大小190i和配置(基準(zhǔn)點(diǎn)坐標(biāo)190c)、條形碼182d的大小190i、掃描儀140無(wú)法讀取的脫落顏色、字符種類(lèi)190k、 屬性1901等的設(shè)定項(xiàng)目施加限制。另外,在用戶(hù)指示了文本框18 等結(jié)構(gòu)要素的配置的情況下,布局生成部160也可以根據(jù)算法信息來(lái)決定該結(jié)構(gòu)要素的布局信息所含的上述設(shè)定項(xiàng)目的初始值。根據(jù)使用算法信息的結(jié)構(gòu),能夠減少用于確認(rèn)表單152的OCR處理精度的測(cè)試以及觀察該測(cè)試的OCR處理結(jié)果來(lái)修正布局信息這種作業(yè)的反復(fù)次數(shù),從而能夠大幅減輕用戶(hù)的作業(yè)負(fù)擔(dān)?;鶞?zhǔn)生成部168根據(jù)布局生成部160所生成的布局信息來(lái)生成基準(zhǔn)數(shù)據(jù),該基準(zhǔn)數(shù)據(jù)為與OCR裝置120中的OCR處理的結(jié)果進(jìn)行比較的基準(zhǔn)。后面詳細(xì)說(shuō)明基準(zhǔn)數(shù)據(jù)。布局發(fā)送部170將布局信息、基準(zhǔn)數(shù)據(jù)發(fā)送給OCR裝置120。數(shù)據(jù)輸出部172將布局信息變換為與印刷對(duì)應(yīng)的形式之后輸出到打印機(jī)130。輸出控制部174在印刷表單152的情況下控制打印機(jī)130以使其在預(yù)定的印刷條件下進(jìn)行印刷。輸出控制部174并不限于直接控制打印機(jī)130的情況,也可以是以下情況 輸出控制部174將禁止變更的印刷條件等控制信息輸出到打印機(jī)130,打印機(jī)130根據(jù)該控制信息來(lái)設(shè)定印刷條件。在隨意地在打印機(jī)130中變更印刷條件而例如導(dǎo)致進(jìn)行縮小印刷時(shí),印刷出的表單152的字符大小變小或者線的粗細(xì)變細(xì),從而有可能使OCR處理精度下降。輸出控制部 174控制打印機(jī)130以使其在預(yù)定的印刷條件下進(jìn)行印刷,由此能夠避免以上的情況。讀取控制部176將指定掃描儀140讀取表單152并轉(zhuǎn)換為圖像數(shù)據(jù)時(shí)的分辨率、 讀取后執(zhí)行的應(yīng)用程序、命令的指定信息通過(guò)通信網(wǎng)150輸出到掃描儀140。并不限于通過(guò)上述通信網(wǎng)150輸出,也可以是讀取控制部176將指定信息例如作為條形碼182d嵌入于表單152,掃描儀140從該條形碼182d獲取指定信息。根據(jù)具備上述讀取控制部176的結(jié)構(gòu),能夠以適合于OCR處理的分辨率生成圖像數(shù)據(jù)或者利用掃描儀140的應(yīng)用程序、命令來(lái)校正生成后的圖像數(shù)據(jù),從而能夠進(jìn)一步提高OCR處理精度。(打印機(jī)130)圖5是表示打印機(jī)130的結(jié)構(gòu)的功能框圖。打印機(jī)130構(gòu)成為包括顯示部200、操作部202、印刷部204、中央控制部206。顯示部200包括液晶顯示器、有機(jī)EL顯示器等。操作部202包括設(shè)置于顯示部200 的顯示面上的觸摸面板、設(shè)置有多個(gè)操作鍵的鍵盤(pán)、鼠標(biāo)等指示裝置、十字鍵、操縱桿等。印刷部204印刷基于圖像數(shù)據(jù)的圖像,該圖像數(shù)據(jù)是后述的繪制執(zhí)行部220使接收到的圖像數(shù)據(jù)柵格化而得到的。中央控制部206通過(guò)半導(dǎo)體集成電路來(lái)控制打印機(jī)130整體,其中,該半導(dǎo)體集成電路包括中央處理裝置(CPU)、保存有程序等的ROM、作為工作區(qū)的RAM等。另外,中央控制部206還作為繪制執(zhí)行部220而發(fā)揮功能。繪制執(zhí)行部220將從表單制作裝置110發(fā)送過(guò)來(lái)的印刷作業(yè)(圖像數(shù)據(jù))例如圖像化(柵格化)為使用了 CMYK等表色方法的位圖形式等。在本實(shí)施方式中,繪制執(zhí)行部 220根據(jù)表單制作裝置110的繪制指示部162的指示來(lái)生成上述參考用圖像數(shù)據(jù),根據(jù)繪制指示部162的印刷作業(yè)取消指示,將參考用圖像數(shù)據(jù)發(fā)送給繪制指示部162來(lái)代替發(fā)送給印刷部204。在上述例子中,設(shè)為使用打印機(jī)130所具備的繪制執(zhí)行部220的結(jié)構(gòu),但是也可以使安裝于表單制作裝置110、其它計(jì)算機(jī)的打印機(jī)130的打印驅(qū)動(dòng)程序作為繪制執(zhí)行部220 而發(fā)揮功能。并且,也可以設(shè)為表單制作裝置具備繪制執(zhí)行部的結(jié)構(gòu)。下面,根據(jù)圖6、圖7來(lái)說(shuō)明表單制作裝置具備繪制執(zhí)行部的結(jié)構(gòu)。(打印機(jī)300以及表單制作裝置350)圖6是表示其它打印機(jī)300的結(jié)構(gòu)的功能框圖。圖7是表示其它表單制作裝置 350的結(jié)構(gòu)的功能框圖。打印機(jī)300構(gòu)成為包括顯示部200、操作部202、印刷部204、中央控制部306。表單制作裝置350構(gòu)成為包括顯示部154、操作部156、中央控制部364。打印機(jī)300的顯示部200、操作部202、印刷部204以及表單制作裝置350的顯示部154、操作部156、中央控制部364的布局生成部160、圖像發(fā)送部164、輔助獲取部166、基準(zhǔn)生成部168、布局發(fā)送部170、數(shù)據(jù)輸出部172、輸出控制部174、讀取控制部176作為打印機(jī)130和表單制作裝置110的結(jié)構(gòu)要素,功能與上述結(jié)構(gòu)要素的功能實(shí)質(zhì)上相同,因此省略重復(fù)說(shuō)明。打印機(jī)300的中央控制部306通過(guò)半導(dǎo)體集成電路來(lái)控制打印機(jī)300整體,其中, 該半導(dǎo)體集成電路包括中央處理裝置(CPU)、保存有程序等的ROM、作為工作區(qū)的RAM等。另外,中央控制部306還作為功能發(fā)送部320而發(fā)揮功能。功能發(fā)送部320將表示印刷功能的印刷功能信息發(fā)送給表單制作裝置350。印刷功能信息具體地說(shuō)例如為表示打印機(jī)300的分辨率、印刷范圍、抖動(dòng)(dithering)等所支持的印刷功能的信息。表單制作裝置350的中央控制部364通過(guò)半導(dǎo)體集成電路來(lái)控制表單制作裝置 350整體,其中,該半導(dǎo)體集成電路包括中央處理裝置(CPU)、保存有程序等的ROM、作為工作區(qū)的RAM等。另外,中央控制部364還作為布局生成部160、繪制執(zhí)行部372、圖像發(fā)送部 164、輔助獲取部166、基準(zhǔn)生成部168、布局發(fā)送部170、數(shù)據(jù)輸出部172、輸出控制部174以及讀取控制部176而發(fā)揮功能。繪制執(zhí)行部372根據(jù)印刷功能信息和布局信息來(lái)生成與布局信息的至少一部分對(duì)應(yīng)的參考用圖像數(shù)據(jù)。使用上述打印機(jī)300和表單制作裝置350也能夠抑制每個(gè)打印機(jī)的功能差的影響而更可靠地執(zhí)行位置偏移、傾斜的校正,從而能夠提高OCR處理精度。并且,由表單制作裝置350生成參考用圖像數(shù)據(jù),因此還能夠根據(jù)需要對(duì)柵格化處理進(jìn)行微調(diào)整。(OCR 裝置 120)圖8是表示OCR裝置120的結(jié)構(gòu)的功能框圖。OCR裝置120構(gòu)成為包括顯示部 400、操作部402、存儲(chǔ)裝置404、中央控制部406。顯示部400包括液晶顯示器、有機(jī)EL顯示器等。操作部402包括設(shè)置于顯示部400 的顯示面上的觸摸面板、設(shè)置有多個(gè)操作鍵的鍵盤(pán)、鼠標(biāo)等指示裝置、十字鍵、操縱桿等。存儲(chǔ)裝置404包括HDD (Hard Disk Drive 硬盤(pán)驅(qū)動(dòng)器)、快閃存儲(chǔ)器、非易失性 RAM (Random Access Memory 隨機(jī)存取存儲(chǔ)器)等,存儲(chǔ)布局信息等。在本實(shí)施方式中, 存儲(chǔ)裝置404與OCR裝置120 —體地形成,但是并不限于上述情況,也可以是獨(dú)立的例如 NAS (Network Attached Storage 網(wǎng)絡(luò)附加存儲(chǔ))、外置 HDD、USB (Universal Serial Bus 通用串行總線)存儲(chǔ)器等。中央控制部406通過(guò)半導(dǎo)體集成電路來(lái)控制OCR裝置120整體,其中,該半導(dǎo)體集成電路包括中央處理裝置(CPU)、保存有程序等的ROM、作為工作區(qū)的RAM等。另外,中央控制部406還作為布局獲取部420、圖像獲取部422、圖像校正部424、0CR處理部426、輔助生成部428、基準(zhǔn)獲取部430以及輔助發(fā)送部432而發(fā)揮功能。布局獲取部420獲取從表單制作裝置110發(fā)送過(guò)來(lái)的布局信息或者參考用圖像數(shù)據(jù),存儲(chǔ)到存儲(chǔ)裝置404。圖像獲取部422從掃描儀140獲取讀取表單152而生成的圖像數(shù)據(jù)。在布局獲取部420預(yù)先接收到參考用圖像數(shù)據(jù)的情況下,圖像校正部4M根據(jù)存儲(chǔ)在存儲(chǔ)裝置404中的參考用圖像數(shù)據(jù)對(duì)由掃描儀140讀取到的表單152的圖像數(shù)據(jù)進(jìn)行位置偏移、傾斜的校正。存儲(chǔ)在存儲(chǔ)裝置404中的參考用圖像數(shù)據(jù)例如與表單152的表單 ID相對(duì)應(yīng),圖像校正部似4能夠參照與所生成的表單152的圖像數(shù)據(jù)對(duì)應(yīng)的參考用圖像數(shù)據(jù)。OCR處理部似6例如以圖像獲取部422獲取到的圖像數(shù)據(jù)的圖像中的基準(zhǔn)標(biāo)記 182c的位置為基準(zhǔn),讀取以條形碼182d等形式記載的表單152的表單ID。另外,OCR處理部4 從存儲(chǔ)裝置404讀出包含該表單ID的布局信息,根據(jù)讀出的布局信息對(duì)掃描儀140 所讀取的表單152的圖像數(shù)據(jù)進(jìn)行OCR處理(從圖像數(shù)據(jù)中抽取該圖像數(shù)據(jù)所示出的字符、數(shù)字等內(nèi)容的處理)。本實(shí)施方式的OCR裝置120根據(jù)從表單制作裝置110獲取到的布局信息進(jìn)行OCR 處理,因此例如可知文本框18 的位置、讀取寫(xiě)入信息的位置,從而能夠提高OCR處理精度。并且,與例如由掃描儀140讀取印刷出的表單152而生成圖像數(shù)據(jù)并根據(jù)該圖像數(shù)據(jù)進(jìn)行位置偏移、傾斜的校正的情況相比,根據(jù)布局信息、參考用圖像數(shù)據(jù)進(jìn)行OCR處理的OCR 裝置120不受附著于表單152的臟污、表單152的褶皺的影響,從而能夠提高OCR處理精度。另外,在OCR裝置120中共用由表單制作裝置110生成的布局信息,因此用戶(hù)不需要在表單制作裝置110和OCR裝置120各自中進(jìn)行相同的設(shè)定,從而能夠減輕用戶(hù)的作業(yè)負(fù)擔(dān)。 并且,在根據(jù)條件變更、根據(jù)OCR處理的結(jié)果需要提高OCR處理精度而對(duì)制作過(guò)一次的表單 152進(jìn)行布局信息的修正的情況下,也同樣地在表單制作裝置110和OCR裝置120中共用在表單制作裝置110中修正的布局信息,從而能夠減輕用戶(hù)的作業(yè)負(fù)擔(dān)。另外,在布局信息中包含對(duì)可變表單進(jìn)行定義的可變信息,該可變表單是表單152 中的輸入?yún)^(qū)域184的例如形狀、大小190i、配置、分割數(shù)等可變的表單。如果在處理這種可變表單的情況下不采用任何方法,則OCR處理部似6不得不僅根據(jù)圖像數(shù)據(jù)估計(jì)該輸入?yún)^(qū)域184,有時(shí)無(wú)法得到適當(dāng)?shù)腛CR結(jié)果。因此,在本實(shí)施方式中, 表單制作裝置110根據(jù)用戶(hù)的輸入操作來(lái)確定布局信息中的作為可變信息的輸入?yún)^(qū)域184 的形狀、大小190i、配置、分割數(shù)等,當(dāng)數(shù)據(jù)輸出部172將包含確定了可變信息中的輸入?yún)^(qū)域184的可變信息的布局信息輸出到打印機(jī)130時(shí),以該數(shù)據(jù)輸出部172的輸出為契機(jī),布局發(fā)送部170將確定了該輸入?yún)^(qū)域184的布局信息發(fā)送給OCR裝置120。另外,在要在打印機(jī)130中確定輸入?yún)^(qū)域184的形狀、大小190i、配置、分割數(shù)等的情況下,布局發(fā)送部170 也可以以來(lái)自打印機(jī)130的表單152的實(shí)際印刷為契機(jī),將確定了該輸入?yún)^(qū)域184的布局信息發(fā)送給OCR裝置120。根據(jù)上述結(jié)構(gòu),在OCR裝置120中布局信息的輸入?yún)^(qū)域184已確定,因此能夠根據(jù)正確的輸入?yún)^(qū)域184的信息提高OCR處理精度,并且由于成為OCR處理的對(duì)象的區(qū)域縮小, 因此能夠降低處理負(fù)載。另外,這種情況下的布局信息也可以是與用戶(hù)的操作輸入相應(yīng)的上述表單152的布局的參考用圖像數(shù)據(jù)。例如,OCR裝置120將掃描儀140所讀取的表單152的圖像數(shù)據(jù)例如格線的位置等以使其與作為布局信息的參考用圖像數(shù)據(jù)一致地方式進(jìn)行校正之后,進(jìn)行OCR處理。根據(jù)上述結(jié)構(gòu)也能夠提高OCR處理精度。輔助生成部4 生成輔助信息,該輔助信息輔助生成布局信息。并且,在布局信息中還包含表示布局信息的改進(jìn)點(diǎn)的改進(jìn)信息。前面說(shuō)明了輔助信息中的算法信息,因此在此詳細(xì)說(shuō)明改進(jìn)信息。圖9是用于說(shuō)明改進(jìn)信息的說(shuō)明圖。特別是,圖9的(a)表示布局信息的一例,圖 9的(b)表示改進(jìn)信息的一例,圖9的(c)表示基準(zhǔn)數(shù)據(jù)的一例。輔助生成部4 參照由布局獲取部420獲取到的、例如圖9的(a)示出的與輸入?yún)^(qū)域184有關(guān)的布局信息。在前面使用圖4的(c)說(shuō)明了上述布局信息,因此省略說(shuō)明。另外,輔助生成部4 確認(rèn)由OCR處理部似6進(jìn)行OCR處理的結(jié)果、即對(duì)于以所參照的布局信息表示的、應(yīng)該讀取寫(xiě)入信息的分割得到的輸入?yún)^(qū)域184是否讀取出寫(xiě)入信息 (讀取成功與否)。例如在讀取手寫(xiě)字符的情況下,OCR處理部似6對(duì)于與登記于OCR處理軟件的基準(zhǔn)字符進(jìn)行對(duì)照的結(jié)果是判斷為最接近的字符,將表示與基準(zhǔn)字符匹配的程度的指標(biāo)值與規(guī)定閾值進(jìn)行比較來(lái)判斷讀取成功與否。能夠根據(jù)用戶(hù)的操作輸入來(lái)變更該閾值。輔助生成部4 根據(jù)OCR處理結(jié)果生成圖9的(b)示出的、將布局信息中的表示分割得到的該輸入?yún)^(qū)域184的布局ID 190a與讀取成功與否(讀取成功與否450)相關(guān)聯(lián)的改進(jìn)信息。這樣,改進(jìn)信息例如表示OCR處理的結(jié)果、準(zhǔn)確地說(shuō)是在應(yīng)該讀取寫(xiě)入信息的分割得到的輸入?yún)^(qū)域184中讀取失敗的情況。在布局生成部160中根據(jù)該改進(jìn)信息例如以紅色填充讀取失敗的分割得到的輸入?yún)^(qū)域184或者染紅包圍分割得到的該輸入?yún)^(qū)域184的文本框18 來(lái)促使用戶(hù)改進(jìn)。并且,根據(jù)用戶(hù)的操作輸入,進(jìn)行例如增大輸入?yún)^(qū)域184、文本框18 的大小190i等布局信息的修正來(lái)實(shí)現(xiàn)提高OCR處理精度。根據(jù)使用上述改進(jìn)信息的結(jié)構(gòu),即使不按照每個(gè)輸入?yún)^(qū)域184確認(rèn)寫(xiě)入信息的讀取成功與否也自動(dòng)地進(jìn)行提示,因此能夠減輕用戶(hù)的作業(yè)負(fù)擔(dān),并且能夠避免看漏要改進(jìn)的點(diǎn)這種情況。另外,使用上述表單制作裝置110的基準(zhǔn)生成部168所生成的基準(zhǔn)數(shù)據(jù),能夠使改進(jìn)信息成為更有益的信息而有效地實(shí)現(xiàn)改進(jìn)?;鶞?zhǔn)生成部168所生成的基準(zhǔn)數(shù)據(jù)是不包含于布局信息的、使用于確認(rèn)OCR處理精度的測(cè)試中的數(shù)據(jù)?;鶞?zhǔn)數(shù)據(jù)例如包含圖9的(c) 示出的、表示分割得到的輸入?yún)^(qū)域184的布局ID190a、用戶(hù)用于進(jìn)行測(cè)試而寫(xiě)入到分割得到的該輸入?yún)^(qū)域184的寫(xiě)入字符的大小460a以及內(nèi)容460b。在這種情況下,用戶(hù)預(yù)先對(duì)在表單152中進(jìn)行分割而得到的輸入?yún)^(qū)域184寫(xiě)入被確定為基準(zhǔn)數(shù)據(jù)的例如大小460a、內(nèi)容460b的字符。另外,并不限于手寫(xiě)字符,也可以利用打印機(jī)130印刷被確定為基準(zhǔn)數(shù)據(jù)的字符。在這種情況下,不受用戶(hù)手寫(xiě)字符的好壞限制, 能夠可靠地檢測(cè)由掃描儀140的圖像失真等引起的讀取失敗而改進(jìn)OCR處理精度。之后, OCR裝置120的圖像獲取部422通過(guò)掃描儀140獲取該表單152的圖像數(shù)據(jù)?;鶞?zhǔn)獲取部430獲取布局發(fā)送部170所發(fā)送的基準(zhǔn)數(shù)據(jù)。輔助生成部4 根據(jù)基準(zhǔn)獲取部430所獲取到的基準(zhǔn)數(shù)據(jù)以及OCR處理的結(jié)果來(lái)生成改進(jìn)信息。
輔助生成部4 例如將表示確定了大小460a、內(nèi)容460b的字符等的基準(zhǔn)數(shù)據(jù)與實(shí)際被寫(xiě)入了字符等的表單152的圖像數(shù)據(jù)的OCR處理結(jié)果進(jìn)行比較,生成改進(jìn)信息,后述的輔助發(fā)送部432將該改進(jìn)信息發(fā)送給表單制作裝置110。表單制作裝置110根據(jù)該改進(jìn)信息來(lái)修正布局信息。根據(jù)使用上述基準(zhǔn)數(shù)據(jù)的結(jié)構(gòu),能夠進(jìn)行是否存在字符錯(cuò)誤識(shí)別等詳細(xì)的比較,從而能夠提高布局信息的改進(jìn)精度。如上所述,通過(guò)使用算法信息、改進(jìn)信息這種輔助信息,表單制作裝置110能夠共享可在OCR裝置120側(cè)掌握的信息,表單制作裝置110的布局生成部160能夠生成容易進(jìn)行OCR處理的布局信息。輔助發(fā)送部432將由輔助生成部428生成的輔助信息發(fā)送給表單制作裝置110。以上,通過(guò)所說(shuō)明的表單制作裝置110和OCR裝置120,能夠在大幅減輕用戶(hù)的作業(yè)負(fù)擔(dān)的同時(shí)提高OCR處理精度。另外,還提供使計(jì)算機(jī)作為表單制作裝置110而發(fā)揮功能的表單制作程序以及作為OCR裝置120而發(fā)揮功能的OCR處理程序、存儲(chǔ)有該表單制作程序和OCR處理程序的計(jì)算機(jī)可讀取的軟盤(pán)、光磁盤(pán)、R0M、EPR0M、EEPR0M、CD(Compact Disc 致密光盤(pán))、DVD (Digital Versatile Disc 數(shù)字多功能光盤(pán))、BD (Blu-ray Disc 藍(lán)光光盤(pán))等存儲(chǔ)介質(zhì)。在此,程序是指通過(guò)任意的語(yǔ)言、描述方法描述的數(shù)據(jù)處理方法。另外,該表單制作程序和OCR處理程序也可以被存儲(chǔ)在通過(guò)通信網(wǎng)150與表單制作裝置110或者OCR裝置120相連接的任意的應(yīng)用程序服務(wù)器,還能夠根據(jù)需要下載其全部或者一部分。(表單處理方法)接著,說(shuō)明進(jìn)行包括表單制作裝置110和打印機(jī)130的表單處理系統(tǒng)的運(yùn)用的表單處理方法。圖10是表示表單處理方法測(cè)試時(shí)的整體處理流程的序列圖,圖11是表示表單處理方法使用時(shí)的整體處理流程的序列圖。如圖10所示,當(dāng)OCR裝置120將包含算法信息的輔助信息發(fā)送給表單制作裝置 110時(shí)(S500),在表單制作裝置110中,布局生成部160根據(jù)用戶(hù)的操作輸入來(lái)生成表示表單152布局的布局信息650 。繪制指示部162將生成參考用圖像數(shù)據(jù)的指示發(fā)送給打印機(jī)130(S504),打印機(jī)130的繪制執(zhí)行部220生成參考用圖像數(shù)據(jù)(S506),將所生成的參考用圖像數(shù)據(jù)發(fā)送給表單制作裝置110(S508)。然后,按照印刷表單152的操作輸入,數(shù)據(jù)輸出部172將確定了輸入?yún)^(qū)域184的布局信息變換為與印刷對(duì)應(yīng)的形式之后輸出到打印機(jī) 130(S510)。打印機(jī)130印刷表單152(S512)。然后,基準(zhǔn)生成部168根據(jù)確定了輸入?yún)^(qū)域 184的布局信息來(lái)生成基準(zhǔn)數(shù)據(jù)(S514)。布局發(fā)送部170將布局信息、基準(zhǔn)數(shù)據(jù)發(fā)送給OCR 裝置120,圖像發(fā)送部164將參考用圖像數(shù)據(jù)發(fā)送給OCR裝置120 (S516)。用戶(hù)在印刷出的表單152中例如記載顯示在顯示部巧4中的基準(zhǔn)數(shù)據(jù)所示的確定了大小460a、內(nèi)容460b的字符等。在印刷出的表單152中記載了信息之后,掃描儀140讀取記載了該信息的表單 152 (S518),將圖像數(shù)據(jù)發(fā)送給OCR裝置120(S520)。OCR裝置120的圖像校正部4 根據(jù)參考用圖像數(shù)據(jù)對(duì)由掃描儀140讀取并生成的表單152的圖像數(shù)據(jù)進(jìn)行位置偏移、傾斜的校正(S52》。OCR處理部似6根據(jù)布局信息對(duì)圖像數(shù)據(jù)進(jìn)行OCR處理(S524)。然后,輔助生成部4 根據(jù)OCR處理的結(jié)果和基準(zhǔn)數(shù)據(jù)來(lái)生成改進(jìn)信息(S526)。輔助發(fā)送部432將改進(jìn)信息發(fā)送給表單制作裝置110(S528)。表單制作裝置110的布局生成部160根據(jù)改進(jìn)信息來(lái)促使用戶(hù)改進(jìn),修正布局信息(S530)。如圖11所示,在使用時(shí),按照印刷表單152的操作輸入,表單制作裝置110的數(shù)據(jù)輸出部172將確定了輸入?yún)^(qū)域184的布局信息變換為與印刷對(duì)應(yīng)的形式之后輸出到打印機(jī) 130(S550)。繪制指示部162將生成參考用圖像數(shù)據(jù)的指示發(fā)送給打印機(jī)130(S552),打印機(jī)130的繪制執(zhí)行部220生成參考用圖像數(shù)據(jù)(S5M),將所生成的參考用圖像數(shù)據(jù)發(fā)送給表單制作裝置110(S556)。表單制作裝置110的布局發(fā)送部170將布局信息發(fā)送給OCR裝置120,圖像發(fā)送部164將參考用圖像數(shù)據(jù)發(fā)送給OCR裝置120(S558)。打印機(jī)130印刷表單152(S560)。將此時(shí)的表單152的布局信息設(shè)為已經(jīng)通過(guò)圖10示出的表單處理方法根據(jù)改進(jìn)信息修正的信息。然后,用戶(hù)在表單152上通過(guò)手寫(xiě)等方式將業(yè)務(wù)上的信息記載于表單152上之后,掃描儀140讀取記載過(guò)的表單152(S562),當(dāng)讀取到的圖像數(shù)據(jù)發(fā)送給OCR裝置120時(shí) (S564),OCR裝置120的圖像校正部似4根據(jù)參考用圖像數(shù)據(jù)對(duì)掃描儀140讀取并生成的表單152的圖像數(shù)據(jù)進(jìn)行位置偏移、傾斜的校正(S566)。OCR處理部似6對(duì)校正后的圖像數(shù)據(jù)進(jìn)行OCR處理而獲取寫(xiě)入信息(S568)。上述圖像數(shù)據(jù)的布局在圖10中已經(jīng)進(jìn)行了修正,因此OCR處理精度也變高。接著,說(shuō)明進(jìn)行包括表單制作裝置350和打印機(jī)300的表單處理系統(tǒng)的運(yùn)用的表單處理方法。圖12是表示其它表單處理方法測(cè)試時(shí)的整體處理流程的序列圖,圖13是表示使用其它表單處理方法時(shí)的整體處理流程的序列圖。如圖12所示,當(dāng)OCR裝置120將包含算法信息的輔助信息發(fā)送給表單制作裝置 350時(shí)(S500),在表單制作裝置350中,布局生成部160根據(jù)用戶(hù)的操作輸入來(lái)生成表示表單152布局的布局信息(S502)。打印機(jī)300的功能發(fā)送部320例如根據(jù)表單制作裝置350的指示將表示印刷功能的印刷功能信息發(fā)送給表單制作裝置350 (S604)。繪制執(zhí)行部372根據(jù)印刷功能信息和布局信息來(lái)生成參考用圖像數(shù)據(jù)(S606)。下面,關(guān)于布局信息發(fā)送步驟S510至布局信息修正步驟S530,功能與在圖10的說(shuō)明中說(shuō)明的上述部分的功能實(shí)質(zhì)上相同,因此附加相同的附圖標(biāo)記而省略重復(fù)說(shuō)明。如圖13所示,在使用時(shí),按照印刷表單152的操作輸入,表單制作裝置350的數(shù)據(jù)輸出部172將確定了輸入?yún)^(qū)域184的布局信息變換為與印刷對(duì)應(yīng)的形式之后輸出到打印機(jī) 300(S550)。打印機(jī)300的功能發(fā)送部320例如根據(jù)表單制作裝置350的指示將表示印刷功能的印刷功能信息發(fā)送給表單制作裝置350 (S654)。繪制執(zhí)行部372根據(jù)印刷功能信息和布局信息生成參考用圖像數(shù)據(jù)(S656)。下面,關(guān)于布局信息發(fā)送步驟S558至OCR處理步驟S568,功能與在圖11的說(shuō)明中說(shuō)明的上述部分的功能實(shí)質(zhì)上相同,因此附加相同的附圖標(biāo)記而省略重復(fù)說(shuō)明。根據(jù)這種表單處理方法,在圖10、12示出的測(cè)試時(shí)以及圖11、13示出的使用時(shí)都能夠減輕用戶(hù)的作業(yè)負(fù)擔(dān),并且能夠通過(guò)使用根據(jù)改進(jìn)信息而修正的布局信息來(lái)提高OCR 處理精度。以上,參照
了本發(fā)明的優(yōu)選實(shí)施方式,但是當(dāng)然本發(fā)明并不限于上述實(shí)施方式。本領(lǐng)域技術(shù)人員在記載于權(quán)利要求的范圍的范疇中能夠想得到各種變更例或者修正例是顯而易見(jiàn)的,這些也當(dāng)然理解為屬于本發(fā)明的技術(shù)范圍。
此外,本說(shuō)明書(shū)的表單處理方法中的各工序不一定按照記載為序列圖的順序以時(shí)間序列進(jìn)行處理,還可以包含并列或者子程序的處理。產(chǎn)業(yè)上的可利用件能夠?qū)⒈景l(fā)明利用于進(jìn)行表單的制作以及讀取的表單處理系統(tǒng)、OCR裝置、OCR處理程序、表單制作裝置、表單制作程序以及表單處理方法。
權(quán)利要求
1.一種表單處理系統(tǒng),包括表單制作裝置和打印機(jī), 上述表單制作裝置具有布局生成部,其生成表示表單布局的布局信息;繪制指示部,其根據(jù)上述布局信息,使上述打印機(jī)的繪制執(zhí)行部生成與該布局信息的至少一部分對(duì)應(yīng)的參考用圖像數(shù)據(jù);以及圖像發(fā)送部,其將所生成的上述參考用圖像數(shù)據(jù)發(fā)送給OCR裝置, 其中,上述打印機(jī)具有上述繪制執(zhí)行部,該繪制執(zhí)行部根據(jù)上述繪制指示部的指示生成上述參考用圖像數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的表單處理系統(tǒng),其特征在于,上述繪制指示部投入印刷作業(yè)來(lái)調(diào)用上述繪制執(zhí)行部,使該繪制執(zhí)行部根據(jù)該印刷作業(yè)生成上述參考用圖像數(shù)據(jù),當(dāng)獲取完成所生成的參考用圖像數(shù)據(jù)時(shí),取消該印刷作業(yè)。
3.根據(jù)權(quán)利要求1或者2所述的表單處理系統(tǒng),其特征在于,在存在多個(gè)上述繪制執(zhí)行部的情況下,上述繪制指示部執(zhí)行以下操作中的某一個(gè)操作使所有該繪制執(zhí)行部生成上述參考用圖像數(shù)據(jù);僅使預(yù)先確定的一個(gè)該繪制執(zhí)行部生成上述參考用圖像數(shù)據(jù);使所有的該繪制執(zhí)行部生成上述參考用圖像數(shù)據(jù)并進(jìn)行合成;僅使用戶(hù)所選擇的該繪制執(zhí)行部生成上述參考用圖像數(shù)據(jù)。
4.一種表單處理系統(tǒng),包括打印機(jī)和表單制作裝置,上述打印機(jī)具有功能發(fā)送部,該功能發(fā)送部將表示印刷功能的印刷功能信息發(fā)送給上述表單制作裝置,上述表單制作裝置具有布局生成部,其生成表示表單布局的布局信息;繪制執(zhí)行部,其根據(jù)上述印刷功能信息和上述布局信息,生成與該布局信息的至少一部分對(duì)應(yīng)的參考用圖像數(shù)據(jù);以及圖像發(fā)送部,其將所生成的上述參考用圖像數(shù)據(jù)發(fā)送給OCR裝置。
5.根據(jù)權(quán)利要求1至4中的任一項(xiàng)所述的表單處理系統(tǒng),其特征在于,上述表單制作裝置還具有布局發(fā)送部,該布局發(fā)送部將所生成的上述布局信息發(fā)送給 OCR裝置,上述表單處理系統(tǒng)還包括上述OCR裝置,該OCR裝置具有 布局獲取部,其獲取從上述表單制作裝置發(fā)送過(guò)來(lái)的布局信息;以及 OCR處理部,其根據(jù)所獲取到的上述布局信息對(duì)掃描儀所讀取出的表單的圖像數(shù)據(jù)進(jìn)行OCR處理。
6.根據(jù)權(quán)利要求1至5中的任一項(xiàng)所述的表單處理系統(tǒng),其特征在于, 上述OCR裝置還具有輔助生成部,其生成用于輔助生成上述布局信息的輔助信息;以及輔助發(fā)送部,其將上述輔助信息發(fā)送給上述表單制作裝置,其中,上述表單制作裝置還具有輔助獲取部,該輔助獲取部獲取發(fā)送過(guò)來(lái)的上述輔助 fn息,上述布局生成部根據(jù)所獲取到的上述輔助信息來(lái)生成上述布局信息。
7.根據(jù)權(quán)利要求6所述的表單處理系統(tǒng),其特征在于,在上述輔助信息中包含與使用于上述OCR裝置的OCR處理部的算法有關(guān)的算法信息。
8.根據(jù)權(quán)利要求6或者7所述的表單處理系統(tǒng),其特征在于,上述輔助生成部根據(jù)上述OCR處理的結(jié)果來(lái)生成表示所獲取到的上述布局信息的改進(jìn)點(diǎn)的改進(jìn)信息,在上述輔助信息中包含上述改進(jìn)信息。
9.根據(jù)權(quán)利要求8所述的表單處理系統(tǒng),其特征在于,上述表單制作裝置還具有基準(zhǔn)生成部,該基準(zhǔn)生成部根據(jù)所生成的上述布局信息來(lái)生成基準(zhǔn)數(shù)據(jù),該基準(zhǔn)數(shù)據(jù)為與上述OCR處理的結(jié)果進(jìn)行比較的基準(zhǔn), 上述布局發(fā)送部將上述基準(zhǔn)數(shù)據(jù)發(fā)送給上述OCR裝置, 上述OCR裝置還具有基準(zhǔn)獲取部,該基準(zhǔn)獲取部獲取發(fā)送過(guò)來(lái)的上述基準(zhǔn)數(shù)據(jù), 上述輔助生成部根據(jù)所獲取到的上述基準(zhǔn)數(shù)據(jù)和上述OCR處理的結(jié)果來(lái)生成上述改進(jìn)fe息。
10.根據(jù)權(quán)利要求1至9中的任一項(xiàng)所述的表單處理系統(tǒng),其特征在于,上述表單制作裝置還具有數(shù)據(jù)輸出部,該數(shù)據(jù)輸出部將所生成的上述布局信息輸出到打印機(jī),在所生成的上述布局信息中包含用于定義可變表單的可變信息,該可變表單是表單中的輸入?yún)^(qū)域可變的表單,當(dāng)上述數(shù)據(jù)輸出部將已確定上述可變信息中的輸入?yún)^(qū)域的布局信息輸出到上述打印機(jī)時(shí),上述布局發(fā)送部將已確定上述輸入?yún)^(qū)域的布局信息發(fā)送給上述OCR裝置。
11.根據(jù)權(quán)利要求1至10中的任一項(xiàng)所述的表單處理系統(tǒng),其特征在于, 還包括圖像讀取裝置,上述表單制作裝置還具有輸出控制部,其在上述打印機(jī)印刷表單的情況下,控制該打印機(jī)以使其在預(yù)先確定的印刷條件下進(jìn)行印刷;以及讀取控制部,其在由上述圖像讀取裝置讀取表單的情況下,指定該圖像讀取裝置的動(dòng)作方法。
12.—種表單制作裝置,具有布局生成部,其生成表示表單布局的布局信息;繪制指示部,其根據(jù)上述布局信息,使打印機(jī)的繪制執(zhí)行部生成與該布局信息的至少一部分對(duì)應(yīng)的參考用圖像數(shù)據(jù);以及圖像發(fā)送部,其將所生成的上述參考用圖像數(shù)據(jù)發(fā)送給OCR裝置, 其中,上述繪制執(zhí)行部根據(jù)上述繪制指示部的指示生成上述參考用圖像數(shù)據(jù)。
13.一種表單處理方法,通過(guò)表單制作裝置以及與上述表單制作裝置通信連接的OCR 裝置來(lái)進(jìn)行表單管理,上述表單制作裝置生成表示表單布局的布局信息,根據(jù)上述布局信息,使打印機(jī)的繪制執(zhí)行部生成與該布局信息的至少一部分對(duì)應(yīng)的參考用圖像數(shù)據(jù);以及將所生成的上述參考用圖像數(shù)據(jù)發(fā)送給上述OCR裝置, 其中,上述繪制執(zhí)行部根據(jù)指示生成上述參考用圖像數(shù)據(jù)。
全文摘要
提供一種表單處理系統(tǒng)、表單制作裝置以及表單處理方法,提高表單的OCR處理精度。本發(fā)明的表單處理系統(tǒng)(100)包括表單制作裝置(110)和OCR裝置(120),表單制作裝置具有布局生成部(160)和布局發(fā)送部(170),該布局生成部(160)生成表示表單(152)布局的布局信息,該布局發(fā)送部(170)將所生成的布局信息發(fā)送給OCR裝置,OCR裝置具有布局獲取部(420)和OCR處理部(426),該布局獲取部(420)獲取從表單制作裝置發(fā)送過(guò)來(lái)的布局信息,該OCR處理部(426)根據(jù)獲取到的布局信息對(duì)由掃描儀(140)讀取到的表單的圖像數(shù)據(jù)進(jìn)行OCR處理。
文檔編號(hào)G06K9/20GK102331913SQ20111013619
公開(kāi)日2012年1月25日 申請(qǐng)日期2011年5月24日 優(yōu)先權(quán)日2010年5月24日
發(fā)明者杉田敏彥, 桑村良則, 萩澤章一, 道場(chǎng)鄉(xiāng) 申請(qǐng)人:株式會(huì)社Pfu