專利名稱:數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及媒體處理裝置及涉及例如適用于金融機構(gòu)文件處理的數(shù)據(jù)媒體處理方法,并特別涉及進行對諸如個人文件等具有各種格式的文件的處理的數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法。
背景技術(shù):
近年來,作為閱讀當作圖象數(shù)據(jù)(一個圖象)的字符信息并然后識別字符的裝置,諸如光學(xué)字符閱讀裝置(OCR裝置)得到發(fā)展,并在各種行業(yè)中,廣泛使用圖象數(shù)據(jù)閱讀裝置以便達到業(yè)務(wù)上效率的擴充等。
例如,在金融機構(gòu)等的窗口操作的操作者通過使用上述圖象數(shù)據(jù)閱讀裝置有效處理文件媒體(多個文件)而達到業(yè)務(wù)的擴充。
特別,為了在進行上述這種文件處理的業(yè)務(wù)中有效達到擴充,不僅需要同類型的文件媒體(專用于識別處理的媒體),而且還需要自動地處理具有不同格式的文件媒體。
這樣,使用圖象數(shù)據(jù)閱讀裝置的文件媒體的處理能夠通過使用例如圖115所示的文件處理裝置對于多種文件媒體進行。
特別,參照圖115,標號1001表示用于閱讀文件的圖象數(shù)據(jù)的圖象數(shù)據(jù)閱讀裝置。圖象數(shù)據(jù)閱讀裝置1001連接到計算機1002使得它能夠在計算機1002的控制下進行圖象數(shù)據(jù)的閱讀操作。可注意的是,例如圖象掃描器或者傳真機用作為圖象數(shù)據(jù)閱讀裝置1001。
同時,計算機1002作為用于控制圖象數(shù)據(jù)閱讀裝置1001的控制裝置由諸如鍵盤或者鼠標(圖115中只示出鍵盤)用于從操作者輸入指令、數(shù)據(jù)等的輸入單元1002-1,計算機主機1002-2,及用于顯示數(shù)據(jù)、控制信息等顯示單元1002-3組成。可注意到,由圖象數(shù)據(jù)閱讀裝置1001所閱讀的圖象數(shù)據(jù)的字符識別處理是由計算機主機1002-2進行的。
進而,標號硬盤1003表示一個硬盤。硬盤1003連接到計算機1002并預(yù)先存儲信息(下面稱為“定義對象的信息”)1003A到1003C,...,該信息對于例如圖116所示的每一種類的文件,指定要被識別的字符數(shù)據(jù)的位置信息,及字符的類型,數(shù)目等等。
可注意的是,能夠使用如圖116或117所示的圖象數(shù)據(jù)閱讀和識別裝置1005替代上述的圖象數(shù)據(jù)閱讀裝置1001。圖象數(shù)據(jù)閱讀和識別裝置1005能夠進行類似于圖象數(shù)據(jù)閱讀裝置1001的圖象數(shù)據(jù)閱讀操作以及字符識別。
為了使用圖象數(shù)據(jù)閱讀和識別裝置1005識別出現(xiàn)在例如圖116所示的電費付款通知單1004上的字符數(shù)據(jù),通過操作者操作鍵盤1002-1指定文件類型(這種情形下,定義對象信息1003B對應(yīng)于電費付款通知單1004(文件B))。
然后,計算機1002訪問硬盤1003取得被指定的文件的定義對象信息1003B,并向圖象數(shù)據(jù)閱讀和識別裝置1005報告該定義對象信息1003B。
繼而,圖象數(shù)據(jù)閱讀和識別裝置1005能夠基于作為來自計算機1002的控制信息的定義對象信息1003B實現(xiàn)圖象數(shù)據(jù)的閱讀和字符識別的處理。
可是,在處理諸如參照圖116上述的文件的過程中,由于定義對象信息是對每一要閱讀的文件通過操作者的指定而被指定的,故加重了操作者的負擔,并且此外,當定義對象在數(shù)量上增加時,可能出現(xiàn)指定的錯誤。在需要處理數(shù)千種文件的地方,對于操作者指定一個定義對象實際上是困難的。
因而,此間如圖117所示還提出另一方法,在文件1004規(guī)定的位置處1004a記錄用于標識一個文件以便同任何其它文件相區(qū)別的ID號碼(這種情形下是′0102′),使得文件的閱讀處理能夠自動地進行而無需如上述那樣由操作者指定文件類型。
由剛才所述的方法,當文件的圖象數(shù)據(jù)要由圖象數(shù)據(jù)閱讀和識別裝置1005閱讀時,可通過首先識別在預(yù)定位置1004a所記錄的ID號碼,然后使用對應(yīng)于所識別的ID號碼的定義對象信息(這種情形下為1003B)實現(xiàn)字符的識別。
然而在要閱讀圖象數(shù)據(jù)時,如果在諸如圖象數(shù)據(jù)閱讀裝置1001或者圖象數(shù)據(jù)閱讀和識別裝置1005等光學(xué)閱讀裝置中(例如文件處理裝置)文件等所放置的位置錯位時,或甚至例如閱讀與其定義對象信息預(yù)先存儲在硬盤1003中的文件相同的文件,則由于字符數(shù)據(jù)區(qū)域,即字形等等區(qū)域?qū)⒄拯c(物理原點)的圖象坐標不表現(xiàn)為與定義對象信息的圖象相同的坐標,而在文件處理裝置中等判斷布局彼此不同。
在文件處理裝置等中,除非在彼此調(diào)整了所閱讀圖象數(shù)據(jù)的布局和定義對象信息的布局之后進行圖象數(shù)據(jù)的字符識別,否則有時不能正規(guī)地進行字符識別處理。因而,各個圖象的參照點被提取,并且各個圖象對該參照點的坐標彼此進行比較以實現(xiàn)布局之間的重合的鑒別。
這里,主要使用以下兩者方法取得圖象數(shù)據(jù)的參照點。要注意的是,作為先決條件,供閱讀的對象文件是事先打印的文件并且文件在表格上的打印位置以高度精確管理。
根據(jù)第一方法,當文件的圖象數(shù)據(jù)由圖象數(shù)據(jù)閱讀裝置閱讀時,表格端邊緣1006的左上轉(zhuǎn)角位置P確定為參照點,該裝置中如圖118(a)所示,被閱讀的文件的表格端邊緣1006與閱讀背景1007能夠彼此識別開。
根據(jù)第二方法,當文件的圖象數(shù)據(jù)要由圖象掃描器或者傳真機閱讀時,由于閱讀背景1009與被閱讀的表格端邊緣1008如在圖118(b)所見不能彼此識別開,故在對象文件表格上打印一個參照標號R供預(yù)先閱讀,并且從圖象數(shù)據(jù)抽取這個標號R且被判斷為參照點。
第二個方法優(yōu)點在于,由于參照點位置是作為參照標號R預(yù)先打印的,故即使在閱讀裝置中文件所放置的位置移動,參照點也能夠被穩(wěn)定地抽取。
然而,在文件處理裝置等中,即使通過上述方法精確抽取了參照點,如果圖象數(shù)據(jù)的閱讀方向不是正確的方向,則圖象數(shù)據(jù)的字符說明方向也不是正確的方向,因而字符識別處理不能進行。
例如如圖119中所示,如果其上的信息是在水平方向所述一轉(zhuǎn)帳票具(文件C)1010在錯誤的方向(在圖119中垂直方向)上被閱讀,則這樣所閱讀的轉(zhuǎn)帳票具1010的圖象數(shù)據(jù)是在錯誤的方向上顯示的,如顯示單元1002-3上參照符號1010A所示。
因而,由文件處理裝置等進行字符識別處理時,操作者必須目視觀察顯示單元1002-3以判斷文件閱讀方向是否正確,并當文件的閱讀方向不正確時,從鍵盤1002-1輸入指令以便旋轉(zhuǎn)所閱讀的文件圖象數(shù)據(jù)90度或180度,使得實現(xiàn)圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理,以便文件的圖象數(shù)據(jù)能夠在如顯示單元1002-3上由參照符號1010B標記的正確方向上顯示。
順便來說,在通常向銀行帳戶匯付工作中,操作者輸入在文件上所述的帳戶號碼、姓名、款的數(shù)量等等信息,該文件是來自文件處理裝置1000的鍵盤1002-1等的一個匯付請求票具。這時,操作者目視地交替觀察文件及顯示單元1002-3以便進行輸入操作。
然而,在文件和顯示單元1002-3目視被交替地觀察以便按這樣的方式進行輸入操作的地方,由于涉及到操作者眼睛很多的運動,故問題在于目視可辨別性變壞并且有可能文件的條目和屏幕上的條目之間的匹配被搞錯。
于是,又一種文件處理裝置已經(jīng)提出,其中文件由圖象數(shù)據(jù)閱讀裝置1001等閱讀,并且所閱讀的圖象數(shù)據(jù)本身與圖象數(shù)據(jù)字符識別的結(jié)果一同顯示在顯示單元1002-3上。
使用文件處理裝置,由于文件上描述的信息能夠直接在顯示單元1002-3上目視觀察到,故可減少眼睛的運動,因而在對字符識別結(jié)果的確認和修改時能夠減少字符識別的結(jié)果和圖象數(shù)據(jù)之間匹配的差錯。
同時,近年來,通過使用客戶機-服務(wù)器系統(tǒng)的服務(wù)器以高速度集中方式進行數(shù)據(jù)處理的方法主要在金融機構(gòu)等采用。
例如,提出把對于金融機構(gòu)的每一個銀行(業(yè)務(wù)辦公室)安裝的客戶機與安裝在地區(qū)中心的服務(wù)器通過專線或交換線互聯(lián)而構(gòu)成一個客戶機-服務(wù)器系統(tǒng),并通過服務(wù)器集中進行文件處理以達到業(yè)務(wù)效率的提高。
在以這種方式由服務(wù)器進行集中處理的地方,由于集中到服務(wù)器上的數(shù)據(jù)量變得非常大,操作者不能通過服務(wù)器進行文件處理。于是,必須設(shè)計其中無需操作者的干預(yù)服務(wù)器能夠自動地進行文件處理的系統(tǒng)。
于是,如果其上描述文件上的ID號碼的文件如上述參照圖117所述的文件標識處理用于剛才所說明的客戶機-服務(wù)器系統(tǒng),則服務(wù)器能夠自動地辨別文件的類型并進行文件的閱讀處理。
繼而,還是使用客戶機-服務(wù)器系統(tǒng),其中由圖象數(shù)據(jù)閱讀裝置所閱讀的圖象數(shù)據(jù)本身與圖象數(shù)據(jù)字符識別的結(jié)果一同顯示在顯示單元上,文件上所描述的信息能夠直接在顯示單元上目視觀察,從而在對字符識別的結(jié)果的確認與修改時降低了字符識別的結(jié)果與圖象數(shù)據(jù)之間的匹配出錯。
可是,在處理參照圖117的上述這種文件的技術(shù)中,可被閱讀的文件媒體只是對于文件處理裝置專用而生產(chǎn)的文件媒體,并且由于不能使用通常所使用的普通文件,這時問題就在于,專用的文件必須重新生成。
同時,在如上參照圖118(a)所述這種第一參照點抽取方法中,由于在表格上文件的打印位置必須以高精確度進行管理,其中涉及例如由字處理器等打印的文件,如果人工放置表格,則在很多情形下每當進行打印時打印位置會變化。因而,這時問題就在于,設(shè)置表格端邊緣1006的左上轉(zhuǎn)角位置P為參照點是不適宜的。
進而,在如上參照圖118(b)所述這種第二參照點抽取方法中,供閱讀的對象文件是其上參照標記R被打印的專用文件,并且問題在于,涉及其上沒有打印參照標記R的普通文件的地方,則參照點不能被抽取。
進而,又使用在用于文件閱讀器等其中文件中表的特別點用作為參照點的識別技術(shù)中所采用的技術(shù),則問題在于,供識別的對象文件的布局在一定程度上不能規(guī)定,該技術(shù)在功能上不是很有效的。
應(yīng)當注意,即使在作為其圖象先前已經(jīng)被閱讀過的同一文件再次閱讀,由于在圖象閱讀時灰塵、模糊等原因,會發(fā)現(xiàn)所閱讀的圖象與先前的不同了,并在這種情形下,相同的參照點可能有時不能被抽取。
而且,為了使得服務(wù)器能夠自動地進行參照圖119所示的圖象數(shù)據(jù)的那種旋轉(zhuǎn)校正處理,這必須進行實際閱讀的圖象數(shù)據(jù)的字符識別,并然后依靠是否能夠進行字符識別而進行辨別,看文件的閱讀方向是對還是錯,而這里它問題就在于,這大大地妨礙了工作效率的提高。
同時,在以上所描述的這種方法中,其中圖象數(shù)據(jù)字符識別的結(jié)果與圖象數(shù)據(jù)本身顯示在顯示單元上以便進行字符識別的結(jié)果的確認和修改,由于通過目視觀察進行圖象數(shù)據(jù)和確認條款之間匹配,于是問題在于,圖象數(shù)據(jù)包含大量的待確認的條款,故錯誤的識別仍難于避免。
進而,在圖象數(shù)據(jù)不能一次顯示在顯示單元時,顯示屏必須滾屏以便向后查看數(shù)據(jù),這種情形下,必須按動所需的鍵以便進行滾屏操作。于是問題在于操作復(fù)雜化了。
本發(fā)明是在看到如上述的諸問題而作出的,本發(fā)明的一個目的在于提供一種數(shù)據(jù)媒體處理裝置和數(shù)據(jù)媒體處理方法,使用該裝置和方法能夠進行通常所使用的文件并具有如私人票具等各種格式的文件處理。
本發(fā)明的另一個目的在于,提供一種數(shù)據(jù)媒體處理方法,其中即使對于在由字處理器等在普通紙上所打印的文件,也無需使用如以往技術(shù)中諸如表格端邊緣、參照標記等而能夠從所打印的文件的圖象數(shù)據(jù)自動地進行穩(wěn)定正常的抽取參照點的處理。
本發(fā)明的又一個目的在于提供一種數(shù)據(jù)媒體處理方法,按這種方法,由圖象數(shù)據(jù)閱讀裝置所閱讀的圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理能夠自動地進行。
本發(fā)明的另一目的是為了提供一種數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法,其中強調(diào)圖象數(shù)據(jù)部分基于事先定義的信息而顯示以提高可識別性,并允許平穩(wěn)地進行確認和修改處理。
本發(fā)明的又一個目的是提供一種數(shù)據(jù)媒體處理裝置及數(shù)據(jù)媒體處理方法,其中在字符單元中的字符圖象從文件單元中或者條款單元中的圖象數(shù)據(jù)抽取,并且對字符圖象進行編輯,以便減少打字的運動及比較的對象,此外允許高度精確性的確認,使得校正確認操作所需的勞動和時間能夠顯著減少。
發(fā)明內(nèi)容
根據(jù)本發(fā)明,基于從其信息是以任意格式描述的數(shù)據(jù)媒體而讀出的圖象,用于識別信息的數(shù)據(jù)媒體處理裝置的特征在于,它包括以下裝置用于從所閱讀的圖象數(shù)據(jù)抽取包括格式在內(nèi)的對于數(shù)據(jù)媒體唯有的特征并從這些特征規(guī)定被識別的信息所出現(xiàn)的位置的裝置,以及用于識別由該裝置所規(guī)定的位置處的圖象數(shù)據(jù)以便鑒別信息的圖象識別裝置。
特別地,根據(jù)本發(fā)明,基于從其信息是以任意格式描述的數(shù)據(jù)媒體而讀出的圖象,用于識別信息的數(shù)據(jù)媒體處理裝置的特征在于,它包括布局分析處理部分用于抽取所閱讀的圖象布局的特征以分析布局的結(jié)構(gòu)并基于所抽取的特征邏輯上表示該布局;備選布局存儲部分,其中存儲備選的的布局;以及布局的對比檢驗處理部分,用于使用由布局分析處理部分所抽取的布局特征作為限制檢索項從備選布局存儲部分檢索備選布局以便對比檢驗是否出現(xiàn)了一個相符的備選布局。
其中,數(shù)據(jù)媒體處理裝置可進而包括一個分析預(yù)處理部分,用于對圖象進行所需的預(yù)處理,這在由布局分析處理部分進行布局分析處理之前形成一個識別對象。
或者布局分析處理部分至少能夠包含一個布局特征抽取部分用于抽取圖象的布局特征,以及一個布局分析部分用于基于由布局特征抽取部分所抽取的布局特征分析布局的結(jié)構(gòu)。
進而,布局分析處理部分的構(gòu)成使得,它首先抽取布局的特征,然后抽取布局的邏輯原點,且布局對比檢驗處理部分的構(gòu)成使得,它參照由布局分析處理部分所抽取的邏輯原點對比檢驗是否有相符的備選布局。
這里,布局具有由劃線所形成的表格結(jié)構(gòu),布局特征抽取部分包括用于抽取布局的劃線的劃線抽取部分,而布局分析部分包括基于由布局特征抽取部分所抽取的布局的劃線用于分析由劃線形成的表格結(jié)構(gòu)的表格結(jié)構(gòu)分析部分。同時,布局具有不包含劃線的無劃線表格結(jié)構(gòu),布局特征抽取部分包括一個條目數(shù)據(jù)抽取部分用于抽取布局的條目數(shù)據(jù),同時布局分析部分包括表格結(jié)構(gòu)分析部分用于基于由布局特征抽取部分所抽取的布局的條目數(shù)據(jù)分析無劃線的表格結(jié)構(gòu)。
進而,布局分析處理部分能夠這樣構(gòu)造,使得它判斷圖象中的標題區(qū)域,識別標題區(qū)域中的的標題條目并判斷對應(yīng)的條目數(shù)據(jù)。
或者,數(shù)據(jù)媒體處理裝置能夠這樣構(gòu)造,使得備選布局存儲部分的構(gòu)造存儲壓縮的備選布局的信息,而布局對比檢驗處理部分壓縮處理由布局分析處理部分所抽取的布局特征,并應(yīng)用布局的壓縮特征作為限制檢索項從備選布局存儲部分檢索壓縮的備選布局,以便對比檢驗是否出現(xiàn)了相符的備選布局。
又或者,備選布局存儲部分可這樣構(gòu)造使得通過學(xué)習(xí)能夠更新備選布局的信息。
在具有上述結(jié)構(gòu)的本發(fā)明數(shù)據(jù)媒體處理裝置中,在信息出現(xiàn)位置鑒定步驟,從所閱讀的圖象抽取包括格式在內(nèi)的數(shù)據(jù)媒體唯有的特征,并從特征,鑒定待識別的信息所出現(xiàn)的位置,并在圖象識別步驟中,識別在前面的步驟鑒定的位置處的圖象,以便由此鑒別信息,基于從其上信息以任意格式描述的數(shù)據(jù)媒體所閱讀的圖象實現(xiàn)信息的識別。
特別,在本發(fā)明數(shù)據(jù)媒體處理裝置中,在布局分析處理步驟中,抽取讀取的圖象布局的特征以便分析布局的結(jié)構(gòu),并基于所抽取的特征邏輯上表示該布局。并在布局對比檢驗步驟中,應(yīng)用在布局分析處理步驟中所抽取的布局特征作為限制檢索項而檢索存儲在備選布局存儲部分的備選布局,以便由此對比檢驗符合的備選布局是否出現(xiàn),以便基于從其上信息以任意格式描述的數(shù)據(jù)媒體讀取的圖象實現(xiàn)信息的識別。
在布局分析處理步驟中,可以首先抽取布局的特征并然后抽取布局邏輯原點,并在布局對比檢驗處理步驟中,可參照在布局分析處理步驟中所抽取的邏輯原點鑒別信息。
進而,在布局分析處理步驟中,可鑒別讀取的圖象布局是否在預(yù)定的方向,并可基于鑒別的結(jié)果轉(zhuǎn)換讀取的圖象數(shù)據(jù)使得布局能夠在預(yù)定的方向。讀取的圖象數(shù)據(jù)的轉(zhuǎn)換處理可以是那種旋轉(zhuǎn)布局的處理。
這里,布局具有由劃線形成的表格結(jié)構(gòu),在布局分析處理步驟中,抽取布局的劃線,并基于所抽取的布局劃線分析由劃線形成的表格結(jié)構(gòu)。同時,在布局不包含劃線的無劃線表格結(jié)構(gòu)之處,在布局分析處理步驟中,抽取布局的條款數(shù)據(jù),并基于所抽取的布局的條款數(shù)據(jù)分析無劃線的表格結(jié)構(gòu)。
進而,在布局分析處理步驟中,能夠確定圖象中的標題區(qū)域,并能夠確認標題區(qū)域中的標題條款信息及確定對應(yīng)的條款數(shù)據(jù)。
在壓縮的備選布局信息存儲到備選布局存儲部分之處,在布局對比檢驗處理步驟中,對在布局分析處理步驟中所抽取的布局特征進行壓縮處理,并應(yīng)用先前步驟中壓縮的布局特征作為限制檢索項從備選布局存儲部分檢索壓縮的備選布局,并然后,基于檢索的結(jié)果,對比檢驗是否出現(xiàn)了符合的備選布局。
進而,在備選布局中信息由備選布局存儲部分通過學(xué)習(xí)而更新。
于是,本發(fā)明的數(shù)據(jù)媒體處理裝置的優(yōu)點在于,由于日常產(chǎn)生的各種文件或圖象被電子化自動地分析,使用通常的輸入系統(tǒng)(OCR輸入系統(tǒng),數(shù)據(jù)輸入系統(tǒng)等等)的輸入工作的效率能夠大大提高。
進而,由于布局記錄信息是基于任何類型的任意文件布局識別的結(jié)果而產(chǎn)生的,并通過學(xué)習(xí)寄存到備選布局存儲部分,因而具有相同布局的文件鑒別能夠自動地進行,于是可以降低用于產(chǎn)生專用文件所需的勞務(wù)和費用。進而,由于輸入能夠在學(xué)習(xí)之后立即進行,故達到基于本裝置的系統(tǒng)的安裝周期能夠減小。
進而,由于文件的圖象數(shù)據(jù)是正常分析處理的,故對于不同于專用的昂貴的OCR文件的文件自動識別處理,其裁剪錯誤或打印錯誤很少。
根據(jù)本發(fā)明,用于基于從其上的信息以任意格式描述的數(shù)據(jù)媒體讀取的圖象識別信息的數(shù)據(jù)媒體處理方法的特征在于,它包括抽取格式的邏輯原點的邏輯原點抽取步驟,參照在前面步驟抽取的邏輯原點抽取包括格式在內(nèi)的數(shù)據(jù)媒體唯有的特征,并從特征確定待識別的信息出現(xiàn)的位置的信息出現(xiàn)位置確定步驟,以及當在前面的步驟確定的位置處的圖象要被識別時,參照在邏輯原點抽取步驟所抽取的邏輯原點,鑒別信息的圖象識別步驟。
在邏輯原點抽取步驟,不僅能夠抽取格式的邏輯原點,而且能夠抽取向邏輯原點提供輔助信息的邏輯原點輔助坐標信息,并在圖象識別步驟,參照邏輯原點和邏輯原點輔助坐標信息能夠鑒別信息。
布局具有由劃線形成的表格結(jié)構(gòu)之處,抽取有關(guān)定義表格結(jié)構(gòu)的轉(zhuǎn)角之一的坐標信息作為格式的邏輯原點。
這時,可以抽取有關(guān)其余轉(zhuǎn)角的坐標信息作為邏輯原點輔助坐標信息。
特別,在布局具有由劃線形成的表格結(jié)構(gòu)之處,抽取具有最小X坐標和最小Y坐標定義表格結(jié)構(gòu)轉(zhuǎn)角之一的坐標信息作為格式的邏輯原點。
這時,可以抽取具有最大X坐標和最小Y坐標的另一個轉(zhuǎn)角的坐標信息,以及具有最小X坐標和最大Y坐標的又一個轉(zhuǎn)角的坐標信息以及具有最大X坐標和最大Y坐標的另外一個轉(zhuǎn)角的坐標信息,作為邏輯原點輔助坐標信息。
另一方面,在布局具有不包含劃線的無劃線表格結(jié)構(gòu)之處,抽取關(guān)于該布局中的條目數(shù)據(jù)的外接矩形轉(zhuǎn)角之一的坐標信息作為該格式的邏輯原點。
這時,可以抽取關(guān)于該外接(circumscribed)矩形其它轉(zhuǎn)角的坐標信息作為邏輯原點輔助坐標信息。
更特別地,在布局具有不包括劃線的無劃線表格結(jié)構(gòu)之處,抽取具有最小X坐標和最小Y坐標的外接矩形轉(zhuǎn)角之一的坐標信息作為該格式的邏輯原點。
這時,可以抽取具有最大X坐標和最小Y坐標的外接矩形的另一個轉(zhuǎn)角的坐標信息,以及具有最小X坐標和最大Y坐標的另一個轉(zhuǎn)角的坐標信息以及具有最大X坐標和最大Y坐標的另一個轉(zhuǎn)角的坐標信息,作為邏輯原點輔助坐標信息。
于是,本發(fā)明的數(shù)據(jù)媒體處理方法的優(yōu)點在于,由于處理對象文件的布局分析是基于劃線條目或者從圖象數(shù)據(jù)抽取的條目數(shù)據(jù)進行的,并且由布局分析所得的區(qū)域轉(zhuǎn)角的坐標之中預(yù)定的坐標被確定為邏輯原點坐標和校正坐標,故邏輯原點坐標和校正坐標甚至可從普通文件而不是其上印制了參照標記等專用文件的圖象數(shù)據(jù)抽取。
進而,由于在抽取邏輯原點時同時抽取校正坐標作為邏輯原點的附加信息,故在布局對比檢驗處理中邏輯原點的對比檢驗時能夠可靠地檢測到相一致。
特別,由于邏輯原點的對比檢驗是通過與所考慮的邏輯原點坐標相關(guān)的校正坐標的坐標對比檢驗進行的,故即使在圖象閱讀時位置發(fā)生變動,布局中的對比檢驗處理也可以可靠地進行。
進而,根據(jù)本發(fā)明,用于基于從其上信息以任意格式描述的數(shù)據(jù)媒體所讀取的圖象而識別信息的數(shù)據(jù)媒體處理方法的特征在于,包含格式在內(nèi)的數(shù)據(jù)媒體唯有的特征從讀取的圖象數(shù)據(jù)中抽取并然后壓縮處理,并使用該壓縮處理的特征作為限制檢索項檢索存儲在存儲部分的參照壓縮信息以便對比檢驗是否存在相符的參照壓縮信息,然后基于對比檢驗的結(jié)果識別特定位置處的圖象以便鑒別該信息。
這里在對特征壓縮處理之前,可以對讀取的圖象數(shù)據(jù)進行偏斜校正或變形校正處理。
而且,在對特征進行壓縮處理時,參照構(gòu)成讀取的圖象數(shù)據(jù)的劃線條款的水平劃線對其上側(cè)劃線共同具有相同劃線的那些劃線條款進行Y坐標單一化處理,并參照構(gòu)成讀取的圖象數(shù)據(jù)的劃線條款的垂直劃線對其左側(cè)劃線共同具有相同劃線的那些劃線條款進行X坐標單一化處理。
或者,在對特征進行壓縮處理時,轉(zhuǎn)換特征為對應(yīng)的比特流,并對該比特流進行壓縮處理并作為矩陣表格。
于是,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理方法的優(yōu)點在于,由于對作為布局成分之一的劃線條款的布局進行壓縮處理并表示為矩陣表格,并在布局對比檢驗時對這種矩陣表格彼此進行對比檢驗,故布局對比檢驗處理速度不依賴劃線條款數(shù)目而僅對對比檢驗的一個對象的布局數(shù)目成正比線性地增加,并且大量文件的布局的對比檢驗處理可以高速進行。
進而,由于在其上劃線條款的布局被反射的位表格的壓縮處理之前,對讀取的圖象數(shù)據(jù)進行偏斜校正及變形校正處理,并對劃線條款進行Y坐標單一化處理及X坐標單一化處理,故在閱讀圖象數(shù)據(jù)時發(fā)生的布局變化可被吸收。
進而,根據(jù)本發(fā)明,用于基于從其上信息以任意格式描述的數(shù)據(jù)媒體所讀取的圖象而識別信息的數(shù)據(jù)媒體處理方法其特征在于,它包括記錄步驟,在該步驟進行抽取所讀取的圖象的布局的特征,分析布局的結(jié)構(gòu),在一顯示單元上顯示所分析的布局結(jié)構(gòu),對顯示的布局結(jié)構(gòu)設(shè)定預(yù)定的特征數(shù)據(jù)識別區(qū)域,通過外部輸入裝置輸入對應(yīng)于該區(qū)域中的標志信息的代碼數(shù)據(jù),從特征數(shù)據(jù)識別區(qū)域和代碼數(shù)據(jù)產(chǎn)生區(qū)域特征數(shù)據(jù),并在與所分析的布局結(jié)構(gòu)的鏈接關(guān)系中寄存區(qū)域特征數(shù)據(jù);并包括對比檢驗步驟,在該步驟進行抽取分別讀取的圖象的特征,分析布局結(jié)構(gòu),檢索作為參照數(shù)據(jù)的在記錄步驟所記錄的區(qū)域特征數(shù)據(jù)及布局結(jié)構(gòu),并對比檢驗是否存在相符的區(qū)域特征數(shù)據(jù)。
這里,當對應(yīng)于區(qū)域中的標志信息的代碼數(shù)據(jù)在記錄步驟輸入時,輸入具有對應(yīng)于標志信息的有效性代碼數(shù)據(jù)。
于是,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理方法,由于擴展了類似于字符識別裝置的區(qū)域圖象特征抽取機制和特征對比檢驗機制,并與布局識別系統(tǒng)相結(jié)合,故指定區(qū)域中任意圖形的圖象的識別處理能夠與布局識別處理以聯(lián)鎖關(guān)系進行。
進而,由于對比檢驗對象的區(qū)域特征數(shù)據(jù)記錄在與布局信息的鏈接關(guān)系中,故對比檢驗的對象能夠限制在一個布局的單元,因而不需要進行普通字符識別處理所需的大量的那種對比檢驗處理,故能夠達到高識別速率。
此外,如果橡膠密封、簽字等條款指定為特征數(shù)據(jù)識別條款,那么這種由普通字符識別所不能識別的橡膠密封、簽字等條款則是能夠識別的,并且對應(yīng)的代碼數(shù)據(jù)能夠作為橡膠密封、簽字等條款的特征區(qū)域識別的結(jié)果而獲得。
進而,根據(jù)本發(fā)明,用于基于從其上信息以任意格式描述的數(shù)據(jù)媒體所讀取的圖象而識別信息的數(shù)據(jù)媒體處理方法的特征在于,它包括布局分析處理步驟,該步驟抽取對讀取的圖象布局特征,分析該布局的結(jié)構(gòu),基于所抽取的特征判定圖象中的標題區(qū)域,識別標題區(qū)域中的標題條款信息,判定對應(yīng)的條款數(shù)據(jù)并邏輯表示該布局;并包括布局對比檢驗處理步驟,該步驟使用在布局分析處理步驟中抽取的布局特征作為檢索限制項檢索存儲在備選布局存儲部分中的備選布局,以便對比檢驗是否存在相符的備選布局。
該數(shù)據(jù)媒體處理方法特征還在于,布局分析處理步驟包括標題位置備選判定步驟,該步驟基于布局結(jié)構(gòu)分析的結(jié)果判定標題位置備選;以及標題條款的對比檢驗步驟,該步驟與前面步驟所判定的標題位置備選進行對比檢驗標題區(qū)域中的標題條款信息。
在標題條款對比檢驗步驟中進行標題條款的對比檢驗時,在對要對比檢驗的圖象數(shù)據(jù)進行規(guī)范化處理之后進行標題條款的對比檢驗處理。
于是,本發(fā)明的數(shù)據(jù)媒體處理方法的優(yōu)點在于,由于通過從分析對象的文件圖象劃線條款結(jié)構(gòu)進行檢索和對比檢驗標題位置的標題分析處理而進行布局識別處理,能夠標識標題條款和對應(yīng)于標題條款的條款數(shù)據(jù),以便自動地分析對應(yīng)于文件上描述的標題的條款信息,故無需進行標題條款的字符識別處理即可立即進行條款數(shù)據(jù)的字符識別。
同時,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象數(shù)據(jù)閱讀裝置,用于閱讀作為具有以其一種格式描述的所需信息的數(shù)據(jù)媒體的文件的圖象數(shù)據(jù),一個圖象數(shù)據(jù)存儲器,用于存儲由圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù),文件標識信息抽取裝置,用于從存儲在圖象數(shù)據(jù)存儲器中的文件的圖象數(shù)據(jù)抽取文件上所描述的所需的文件標識信息,一個文件標識字典,用于寄存由文件標識信息抽取裝置作為對特定文件的文件標識信息而抽取的文件標識信息,參照裝置,用于參照由圖象數(shù)據(jù)閱讀裝置所讀取并存儲在圖象數(shù)據(jù)存儲器的任意文件的圖象數(shù)據(jù)以便檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息,以及文件標識裝置,用于基于由參照裝置參照的結(jié)果標識該任意文件是否為特定的文件。
進而,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象數(shù)據(jù)閱讀裝置用于閱讀作為具有以其一種格式描述的所需信息的數(shù)據(jù)媒體的文件的圖象數(shù)據(jù),一個圖象數(shù)據(jù)存儲器和一個文件存儲器用于存儲由圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù),文件標識信息抽取裝置用于從存儲在圖象數(shù)據(jù)存儲器中的文件的圖象數(shù)據(jù)抽取文件上所描述的所需的文件標識信息,一個文件標識字典用于寄存由文件標識信息抽取裝置作為對特定文件的文件標識信息而抽取的文件標識信息,驗證裝置用于讀出存儲在文件存儲器中的特定文件的圖象數(shù)據(jù)并驗證該特定文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中所寄存的文件標識信息,鑒別裝置用于基于由驗證裝置驗證的結(jié)果鑒別是否能夠識別該特定的文件,參照裝置用于參照由圖象數(shù)據(jù)閱讀裝置所讀取并存儲在圖象數(shù)據(jù)存儲器的任意文件的圖象數(shù)據(jù)以便檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息,以及文件標識裝置用于基于由參照裝置參照的結(jié)果標識該任意文件是否為特定的文件。
這里,參照裝置也可作為驗證裝置,而文件標識裝置也可作為鑒別裝置。
在具有上述結(jié)構(gòu)的本發(fā)明數(shù)據(jù)媒體處理裝置中,從作為由圖象數(shù)據(jù)閱讀裝置所閱讀并具有以其格式描述的所需信息的數(shù)據(jù)媒體的特定文件的圖象數(shù)據(jù),抽取該特定文件上所描述的文件標識信息,并將該文件標識信息寄存到文件標識字典,并然后借助于圖象數(shù)據(jù)閱讀裝置讀取任意文件的圖象數(shù)據(jù),之后參照任意文件的圖象數(shù)據(jù)以檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息,以便標識任意文件是否為特定文件。
進而,在本發(fā)明的數(shù)據(jù)媒體處理裝置中,從作為由圖象數(shù)據(jù)閱讀裝置所閱讀并具有以其上格式描述的所需信息的數(shù)據(jù)媒體的特定文件的圖象數(shù)據(jù),抽取該特定文件上所描述的文件標識信息,并將該文件標識信息寄存到文件標識字典,并然后再次輸入特定文件的圖象數(shù)據(jù),并驗證輸入的特定文件圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息以鑒別特定文件的識別是否為可能,此后當能夠識別特定文件時,借助于圖象數(shù)據(jù)閱讀裝置讀取任意文件的圖象數(shù)據(jù),并參照任意文件的圖象數(shù)據(jù)以檢測任意文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息,以便標識任意文件是否為特定文件。
這里當文件標識信息要寄存到文件標識字典中時,由圖象數(shù)據(jù)閱讀裝置所閱讀的特定文件的圖象數(shù)據(jù)能夠顯示在顯示單元上,并且能夠從所顯示的特定文件的圖象數(shù)據(jù)中指定包含特定文件上所描述的文件標識信息的圖象的區(qū)域,以便抽取文件標識信息。
或者當文件標識信息要寄存到文件標識字典中時,能夠從由圖象數(shù)據(jù)閱讀裝置所讀取的特定文件圖象數(shù)據(jù)自動地抽取在特定文件上所描述的特定文件標識信息。
又或者,當文件標識信息要寄存到文件標識字典中時,在文件標識信息寄存到文件標識字典中時,能夠存儲在寄存時所讀取的特定文件的圖象數(shù)據(jù),并且當文件標識信息要寄存到文件標識字典中時,存儲的特定文件圖象數(shù)據(jù)能夠再次作為特定文件的圖象數(shù)據(jù)輸入,并能夠驗證輸入的特定文件的圖象數(shù)據(jù)是否包含寄存在文件標識字典中的文件標識信息,以便鑒別該特定文件是否能夠識別。
于是本發(fā)明的數(shù)據(jù)媒體處理裝置的優(yōu)點在于,由于即使多個類型的要由圖象閱讀裝置閱讀的文件以混合狀態(tài)出現(xiàn),也能夠自動地驗證其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置讀取的文件的類型,于是操作者無需熟悉每一文件的定義而能夠進行操作,因而預(yù)期能夠改進工作效率。該數(shù)據(jù)媒體處理裝置的優(yōu)點還在于,用于標識文件自身的ID號碼等不必在文件上描述,并可以使用普通的文件,因而該數(shù)據(jù)媒體處理裝置能夠自然適用于現(xiàn)有的系統(tǒng)。
進而,由于能夠驗證由操作者指定的文件標識信息是否正確,故該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,文件的錯誤鑒別能夠完全避免,因而改進了裝置的可靠性。
此外,由于參照裝置也作為驗證裝置,而文件標識裝置也作為鑒別裝置,故該數(shù)據(jù)媒體處理裝置的優(yōu)點在于能夠簡化裝置的結(jié)構(gòu)。
進而,改根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置的優(yōu)點在于,它包括一個圖象閱讀部分用于閱讀具有標志信息的數(shù)據(jù)媒體的一個圖象,一個標志識別部分用于識別由圖象閱讀部分所閱讀的圖象中的標志圖象信息并轉(zhuǎn)換該標志圖象信息為對應(yīng)的代碼信息,一個顯示單元用于以所讀取的圖象的狀態(tài)顯示標志圖象信息,以及一個所讀取的標志圖象顯示控制部分,用于當標志圖象信息沒有被成功地轉(zhuǎn)換為對應(yīng)的代碼信息時,引起沒有成功進行轉(zhuǎn)換的不能識別的標志圖象信息以所讀取的圖象狀態(tài)同與不能識別的標志圖象信息相關(guān)的標志圖象信息一同顯示在顯示單元上,所讀取的標志圖象顯示控制部分包含強調(diào)顯示部分用于強調(diào)顯示不能識別的標志圖象信息。
這里,數(shù)據(jù)媒體處理裝置還包括一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于不能識別的標志圖象信息的正確回答數(shù)據(jù),以及正確回答數(shù)據(jù)顯示裝置,用于當由數(shù)據(jù)輸入裝置的操作輸入正確回答數(shù)據(jù)時,引起正確回答數(shù)據(jù)顯示在顯示單元上不同于不能識別的標志信息顯示區(qū)域的正確回答數(shù)據(jù)顯示區(qū)域中。
該數(shù)據(jù)媒體處理裝置進而能夠包括強調(diào)顯示改變裝置,用于當由數(shù)據(jù)輸入裝置的操作輸入正確回答數(shù)據(jù)時,引起已經(jīng)按強調(diào)顯示的不能識別的標志圖象信息以表明不能識別的標志圖象信息已經(jīng)被修改的不同的強調(diào)方式顯示。
或者,該數(shù)據(jù)媒體處理裝置進而能夠包括強調(diào)顯示改變裝置,用于當正確回答數(shù)據(jù)由正確回答數(shù)據(jù)顯示裝置顯示在顯示單元上不同于不能識別的標志圖象信息顯示區(qū)域的正確回答數(shù)據(jù)顯示區(qū)域中時,引起已經(jīng)按強調(diào)顯示的不能識別的標志圖象信息以表明不能識別的標志圖象信息已經(jīng)被修改的不同的強調(diào)方式顯示。
特別,根據(jù)本發(fā)明其中讀取具有標志信息的數(shù)據(jù)媒體的圖象并識別讀取圖象中的標志圖象信息且轉(zhuǎn)換為對應(yīng)的代碼信息的數(shù)據(jù)媒體處理裝置的特征在于,當標志圖象信息沒有成功地轉(zhuǎn)換為對應(yīng)的代碼信息時,沒有被成功地轉(zhuǎn)換的不能識別的標志信息以所讀取的圖象狀態(tài)與同不能識別的標志圖象信息相關(guān)的標志圖象信息一同顯示在顯示單元上,并且不能識別的標志圖象信息按強調(diào)方式顯示,并然后當通過數(shù)據(jù)輸入裝置的操作輸入對應(yīng)于不能識別的標志圖象信息的正確答案數(shù)據(jù)時,已經(jīng)按強調(diào)方式顯示的不能識別的標志圖象信息以不同的強調(diào)方式顯示,該方式表明不能識別的標志圖象信息已經(jīng)被修改。
簡而言之,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象閱讀部分用于閱讀具有標志信息的數(shù)據(jù)媒體圖象,一個標志識別部分用于識別由圖象閱讀部分所讀取的圖象中的標志圖象信息并轉(zhuǎn)換該標志圖象信息為對應(yīng)的代碼信息,一個顯示單元用于以讀取的圖象狀態(tài)顯示標志圖象信息,以及一個讀取的標志圖象顯示控制部分用于當標志圖象信息沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息時引起沒有成功進行轉(zhuǎn)換的不能識別的標志圖象信息,在顯示單元上以讀取的圖象狀態(tài)與同不能識別的標志圖象信息相關(guān)標志圖象信息一同顯示,強調(diào)顯示部分用于引起不能識別的標志圖象信息按強調(diào)方式顯示,一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于不能識別的圖象信息的正確答案數(shù)據(jù),強調(diào)顯示改變裝置用于當正確答案數(shù)據(jù)由數(shù)據(jù)輸入裝置的操作輸入時,引起直到這時已經(jīng)被強調(diào)顯示的不能識別的標志圖象信息以表明修改完成不同的強調(diào)方式顯示,以及識別信息修改裝置用于當正確答案數(shù)據(jù)由數(shù)據(jù)輸入裝置的操作輸入時基于正確答案數(shù)據(jù)而修改不能識別的標志信息。
在具有上述結(jié)構(gòu)的本發(fā)明的數(shù)據(jù)媒體處理裝置中,當讀取了具有標志信息數(shù)據(jù)媒體圖象并且識別讀取的圖象中標志圖象信息且轉(zhuǎn)換為對應(yīng)的代碼信息時,如果標志圖象信息沒有成功地轉(zhuǎn)換為對應(yīng)的代碼信息,則沒有成功被轉(zhuǎn)換的不能識別的標志圖象信息,在顯示單元上以讀取的圖象狀態(tài)與同不能識別的標志圖象信息相關(guān)標志圖象信息一同顯示,并且不能識別的標志圖象信息以強調(diào)方式顯示。
進而,當對應(yīng)于不能識別的標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,正確答案數(shù)據(jù)顯示在顯示單元上不同于不能識別的標志圖象信息的顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中。
或者當對應(yīng)于不能識別的標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,已經(jīng)按強調(diào)方式顯示的不能識別的標志圖象信息以不同的強調(diào)方式顯示,該方式表明不能識別的標志圖象信息已經(jīng)被修改。
又或者當對應(yīng)于不能識別的標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,正確答案數(shù)據(jù)顯示在顯示單元上不同于不能識別的標志圖象信息的顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中,同時已經(jīng)按強調(diào)方式顯示的不能識別的標志圖象信息以不同的強調(diào)方式顯示,該方式表明不能識別的標志圖象信息已經(jīng)被修改。
于是,由本發(fā)明的數(shù)據(jù)媒體處理裝置,當標志圖象信息沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息時,沒有成功進行轉(zhuǎn)換的不能識別的標志圖象信息在顯示單元上以讀取的圖象狀態(tài)與同不能識別的標志圖象信息相關(guān)標志圖象信息一同顯示,并且不能識別的標志圖象信息以強調(diào)方式顯示。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,即使例如因為大量的變形字符而標志圖象信息不能被識別,可通過參照字符串中的前面及后繼字符等的圖象信息進行高精度的確認操作,于是用于正確與錯誤之間的確認操作所需的勞務(wù)和時間能夠降低。
進而,當對應(yīng)于不能識別的標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,在顯示單元上正確答案數(shù)據(jù)顯示在不同于不能識別的標志圖象信息顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中,因而,標志圖象信息與已經(jīng)輸入的正確答案數(shù)據(jù)可通過目視觀察再確認。于是,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于用于正確與錯誤之間的確認操作所需的勞務(wù)和時間能夠降低,并可進行高精度的確認操作。
此外,當對應(yīng)于不能識別的標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,在顯示單元上正確答案數(shù)據(jù)顯示在不同于不能識別的標志圖象信息顯示區(qū)域的正確答案數(shù)據(jù)顯示區(qū)域中,同時已經(jīng)按強調(diào)方式顯示的不能識別的標志圖象信息以不同強調(diào)方式顯示,該方式表明不能識別的標志圖象信息已經(jīng)被修改。于是,標志圖象信息與已經(jīng)輸入的正確答案數(shù)據(jù)可通過目視觀察再確認。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于可進行高精度的確認操作,并且對是否已經(jīng)進行了對于不能識別的標志的輸入或者修改為錯誤識別的標志的標識能夠容易作出,結(jié)果是改進了目視的識別能力,防止了操作者等等雙重修改等等,此外用于正確與錯誤之間的確認操作所需的勞務(wù)和時間能夠降低。
進而,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象閱讀部分用于閱讀具有標志信息的數(shù)據(jù)媒體圖象,一個標志識別部分用于識別由圖象閱讀部分所讀取的圖象中的標志圖象信息并轉(zhuǎn)換該標志圖象信息為對應(yīng)的代碼信息,一個顯示單元用于以讀取的圖象狀態(tài)顯示標志圖象信息,以及一個最小組合單元標志圖象信息抽取部分用于抽取最小組合單元的標志圖象信息,以便對于最小組合單元的每一片標志圖象信息該圖象信息被轉(zhuǎn)換為圖象中的代碼信息,以及最小組合單元標志圖象顯示控制部分,用于引起由最小組合單元標志圖象信息抽取部分所抽取的最小組合單元標志圖象信息,按照與通過由標志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標志信息的對應(yīng)關(guān)系被顯示。
這里,最小組合單元標志圖象顯示控制部分可具有引起多片同類的最小組合單元標志圖象信息,按照與通過由標志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標志信息的對應(yīng)關(guān)系被顯示,并包含強調(diào)顯示裝置用于引起僅是所希望的一片標志圖象信息按強調(diào)方式顯示。
或者,該數(shù)據(jù)媒體處理裝置能夠進而包括相關(guān)的標志圖象顯示裝置用于顯示一片標志圖象信息使之以讀取的圖象狀態(tài)與同一片標志圖象信息相關(guān)的標志圖象信息一同被顯示在顯示單元上,并且相關(guān)的標志圖象顯示裝置能夠包含強調(diào)顯示裝置用于引起一片標志圖象信息以強調(diào)方式被顯示。
又或者,該數(shù)據(jù)媒體處理裝置能夠進而包括一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于一片標志圖象信息的正確答案數(shù)據(jù),以及正確答案數(shù)據(jù)顯示裝置用于當正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時引起正確答案數(shù)據(jù)被顯示在一個正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于一片標志圖象信息和與一片標志圖象信息相關(guān)的標志圖象信息所顯示的區(qū)域。
另外,該數(shù)據(jù)媒體處理裝置還能夠包括一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于一片標志圖象信息的正確答案數(shù)據(jù),以及強調(diào)顯示改變裝置用于當由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時引起已經(jīng)以強調(diào)方式顯示的一片標志圖象信息以不同的強調(diào)方式顯示,該方式表明一片標志圖象信息已經(jīng)被修改。
或另外,該數(shù)據(jù)媒體處理裝置還能夠包括一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于一片標志圖象信息的正確答案數(shù)據(jù),正確答案數(shù)據(jù)顯示裝置用于當正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時引起正確答案數(shù)據(jù)被顯示在一個正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于一片標志圖象信息和與一片標志圖象信息相關(guān)的標志圖象信息所顯示的區(qū)域,以及強調(diào)顯示改變裝置用于當由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時引起已經(jīng)以強調(diào)方式顯示的一片標志圖象信息以不同的強調(diào)方式顯示,該方式表明一片標志圖象信息已經(jīng)被修改。
特別,根據(jù)本發(fā)明,其中閱讀具有標志圖象信息的數(shù)據(jù)媒體的圖象、并識別所讀取的圖象中的標志圖象信息、且轉(zhuǎn)換為對應(yīng)的代碼信息的媒體處理方法的特征在于要被轉(zhuǎn)換為圖象中的代碼信息的多片同類的最小組合單元標志圖象信息,按照與通過由標志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標志信息的對應(yīng)關(guān)系被顯示,同時僅是所希望的一片標志圖象信息按強調(diào)方式顯示,并然后當對應(yīng)于該一片標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置的操作輸入時,已經(jīng)按強調(diào)方式顯示的一片標志圖象信息以不同的強調(diào)方式被顯示,該方式表明一片標志圖象信息已經(jīng)被修改,從而對應(yīng)于一片標志圖象信息錯誤識別的信息基于正確答案數(shù)據(jù)被修改。
簡而言之,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象閱讀部分用于閱讀具有標志信息的數(shù)據(jù)媒體圖象,一個標志識別部分用于識別由圖象閱讀部分所讀取的圖象中的標志圖象信息并轉(zhuǎn)換該標志圖象信息為對應(yīng)的代碼信息,一個顯示單元用于以讀取的圖象狀態(tài)顯示標志圖象信息,以及一個最小組合單元標志圖象信息抽取部分用于抽取最小組合單元的標志圖象信息,以便對于最小組合單元的每一片標志圖象信息該圖象信息被轉(zhuǎn)換為圖象中的代碼信息,一個最小組合單元標志圖象顯示控制部分,用于引起由最小組合單元標志圖象信息抽取部分所抽取的最小組合單元的多片標志圖象信息,按照與通過由標志圖象信息轉(zhuǎn)換所獲得的代碼信息表明的標志信息的對應(yīng)關(guān)系被顯示,強調(diào)顯示裝置用于引起僅是所希望的一片標志圖象信息按強調(diào)方式顯示,一個數(shù)據(jù)輸入裝置用于輸入對應(yīng)于一片標志圖象信息的正確答案數(shù)據(jù),強調(diào)顯示改變裝置用于當由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時引起直到這時已經(jīng)以強調(diào)方式顯示的一片標志圖象信息以不同的強調(diào)方式顯示,該方式表明一片標志圖象信息完成修改,以及識別信息修改裝置用于當由數(shù)據(jù)輸入裝置的操作輸入正確答案數(shù)據(jù)時基于正確答案數(shù)據(jù)修改對應(yīng)于一片標志圖象信息的錯誤識別信息。
在具有上述結(jié)構(gòu)的本發(fā)明的數(shù)據(jù)媒體處理裝置中,當閱讀具有標志信息的數(shù)據(jù)媒體圖象并識別所讀取的圖象中的標志圖象信息且轉(zhuǎn)換為對應(yīng)的代碼信息時,在顯示單元上以對應(yīng)于由轉(zhuǎn)換標志圖象信息所獲得的代碼信息表示的標志信息的關(guān)系顯示要被轉(zhuǎn)換為圖象中的代碼信息最小組合單元的標志圖象信息。
在相同類型的最小組合單元的多片標志圖象信息以對應(yīng)于由轉(zhuǎn)換標志圖象信息所獲得的代碼信息表示的標志信息的關(guān)系而顯示之處,只有所希望的一片標志圖象信息按強調(diào)方式顯示。
或者,所希望的一片標志圖象信息以所讀取的圖象狀態(tài)在顯示單元上與同該標志圖象信息片相關(guān)的標志圖象信息一同顯示,并且該一片標志圖象信息是按強調(diào)方式顯示的。
而且,當對應(yīng)于該一片標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于該一片標志圖象信息及與該一片標志圖象信息相關(guān)的標志圖象信息被顯示的區(qū)域。
或者,當對應(yīng)于該一片標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,已經(jīng)以強調(diào)方式顯示的該一片標志圖象信息按不同的強調(diào)方式顯示,該方式表明該一片標志圖象信息已被修改。
又或者,當對應(yīng)于該一片標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于該一片標志圖象信息及與該一片標志圖象信息相關(guān)的標志圖象信息被顯示的區(qū)域,并且已經(jīng)以強調(diào)方式顯示的該一片標志圖象信息按不同的強調(diào)方式顯示,該方式表明該一片標志圖象信息已被修改。
于是,由本發(fā)明的數(shù)據(jù)媒體處理裝置,由于標志顯示在允許這些標志易于目視觀察的一個單元中,其顯示方式使得只有相同的標志顯示在顯示單元的相同區(qū)域中,并且只有所希望的一片標志圖象信息按強調(diào)方式顯示,故操作者只要參照圖象信息就能夠確認識別的結(jié)果,而無需參照相關(guān)的圖象信息,因而減少了操作者的眼睛的運動。而且,只有被處理的標志圖象信息按強調(diào)方式顯示以便減少比較的對象數(shù)目。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,正確與錯誤之間的確認操作所需的勞務(wù)和時間能夠顯著降低。
而且,由于所希望的一片標志圖象信息以所讀取的圖象狀態(tài)與該片標志圖象信息相關(guān)標志圖象信息一同顯示在顯示單元中,并且一片標志圖象信息是按強調(diào)方式顯示的,故該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,即使例如由于該標志圖象信息是一個變形很大的字符而不能被識別,也能通過參照字符串中前面的及后面的字符等進行高精度的確認操作,因而正確與錯誤之間的確認操作所需的勞務(wù)和時間能夠顯著降低。
進而,當對應(yīng)于該一片標志圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置操作輸入時,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于該一片標志圖象信息及與該一片標志圖象信息相關(guān)的標志圖象信息被顯示的區(qū)域,并且已經(jīng)以強調(diào)方式顯示的該一片標志圖象信息按不同的強調(diào)方式顯示,該方式表明該一片標志圖象信息已被修改。于是,標志圖象信息和輸入的正確答案時間能夠通過目視觀察再確認。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,能夠進行高精度的確認操作,并且對于是否進行了對于一個不能識別的標志的輸入或者修改為被錯誤識別的標志,能夠易于作出標識,結(jié)果是改進了目視鑒別力而防止了操作者的雙重修改等等,此外能夠降低正確與錯誤之間的確認操作所需的勞務(wù)和時間。
而且,本發(fā)明的數(shù)據(jù)媒體處理裝置的特征在于,它包括一個圖象數(shù)據(jù)輸入裝置用于輸入包含多個條款信息在內(nèi)的數(shù)據(jù)媒體圖象數(shù)據(jù),一個具有圖象數(shù)據(jù)顯示區(qū)域和條款顯示區(qū)域的顯示單元,條款顯示區(qū)域具有多個條款數(shù)據(jù)輸入顯示區(qū)域部分,一個顯示控制裝置用于引起通過圖象數(shù)據(jù)輸入裝置所獲得的圖象數(shù)據(jù)顯示在圖象數(shù)據(jù)顯示區(qū)域中,并用于當對應(yīng)于所希望的條款之一的圖象數(shù)據(jù)部分的數(shù)據(jù)要由數(shù)據(jù)輸入裝置輸入時,引起光標指示顯示在條款顯示區(qū)域中所希望的一個條款數(shù)據(jù)輸入顯示區(qū)域部分,以及一個圖象數(shù)據(jù)局部強調(diào)顯示裝置用于在以下情形下引起只有所希望的條款對應(yīng)的圖象數(shù)據(jù)部分按強調(diào)方式顯示,即當通過顯示控制裝置光標指示顯示在條款顯示區(qū)域中的條款數(shù)據(jù)輸入顯示區(qū)域部分的所希望的一個條款數(shù)據(jù)輸入顯示部分時,其狀態(tài)為其中包含多個條款信息的圖象數(shù)據(jù)顯示在顯示單元的圖象數(shù)據(jù)顯示區(qū)域中。
這里,顯示控制裝置除了圖象數(shù)據(jù)局部強調(diào)顯示裝置之外,能夠包含圖象數(shù)據(jù)強調(diào)顯示刪除裝置用于當光標指示通過光標移動操作裝置移動到不同于所希望的條款數(shù)據(jù)輸入顯示區(qū)域部分的另一個條款數(shù)據(jù)輸入顯示區(qū)域部分時,刪除對應(yīng)于該條款的圖象數(shù)據(jù)部分的強調(diào)顯示,以及強調(diào)顯示轉(zhuǎn)變控制裝置用于控制圖象數(shù)據(jù)局部強調(diào)顯示裝置,使得響應(yīng)圖象數(shù)據(jù)強調(diào)顯示刪除裝置,只有對應(yīng)于不同的條款數(shù)據(jù)輸入顯示區(qū)域部分的不同條款的圖象數(shù)據(jù)部分能夠按強調(diào)方式顯示。
或者,顯示控制裝置除了圖象數(shù)據(jù)局部強調(diào)顯示裝置,圖象數(shù)據(jù)強調(diào)顯示刪除裝置和強調(diào)顯示轉(zhuǎn)變控制裝置之外,能夠包含顯示屏滾屏裝置用于引起沒有在顯示單元上顯示的圖象數(shù)據(jù)部分在顯示單元上顯示。
進而,該圖象數(shù)據(jù)局部強調(diào)顯示裝置能夠包含可響應(yīng)來自外部的指令而改變強調(diào)顯示部分的改變裝置。
在具有上述結(jié)構(gòu)的本發(fā)明的數(shù)據(jù)媒體處理裝置中,當包含多個條款的信息數(shù)據(jù)媒體的圖象數(shù)據(jù)顯示在顯示單元上時,只有對應(yīng)于確定的一個條款的圖象數(shù)據(jù)部分被強調(diào)顯示。
當對應(yīng)于所希望的一個條款的圖象數(shù)據(jù)部分的數(shù)據(jù)要以這樣的狀態(tài)被輸入,即其中包含多個條款信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)在顯示單元上的圖象數(shù)據(jù)顯示區(qū)域中顯示時,如果光標指示顯示在顯示單元上與圖象數(shù)據(jù)顯示區(qū)域分開設(shè)置的條款顯示區(qū)域的所希望的一個條款輸入顯示區(qū)域部分,則只有對應(yīng)的所希望的條款圖象數(shù)據(jù)部分按強調(diào)顯示,并當此后要輸入對應(yīng)于另一個條款的圖象數(shù)據(jù)部分的數(shù)據(jù)時,如果光標指示從所希望的條款數(shù)據(jù)輸入顯示區(qū)域部分移動到不同的一個條款數(shù)據(jù)輸入顯示區(qū)域部分,則所希望條款的對應(yīng)的圖象數(shù)據(jù)部分的強調(diào)顯示被刪除,而不同的條款的對應(yīng)的圖象數(shù)據(jù)部分按強調(diào)顯示。
或者,當對應(yīng)于顯示單元上顯示的所希望的一個條款的圖象數(shù)據(jù)部分的數(shù)據(jù)要按照這樣的狀態(tài)被輸入,即其中包含多個條款的信息在內(nèi)的數(shù)據(jù)媒體的圖象數(shù)據(jù)部分顯示在顯示單元上圖象數(shù)據(jù)顯示區(qū)域中時,如果光標指示顯示在顯示單元上與圖象數(shù)據(jù)顯示區(qū)域分開設(shè)置的條款顯示區(qū)域所希望的一個條款數(shù)據(jù)輸入顯示區(qū)域部分,那么只有對應(yīng)的所希望的條款的圖象數(shù)據(jù)部分按強調(diào)顯示,并當此后對應(yīng)于沒有顯示在顯示單元上一個不同的條款的圖象數(shù)據(jù)部分的數(shù)據(jù)被輸入時,如果光標指示從所希望的條款數(shù)據(jù)輸入顯示區(qū)域部分移動到不同的一個條款數(shù)據(jù)輸入顯示區(qū)域部分,則所希望的條款的對應(yīng)的圖象數(shù)據(jù)部分的強調(diào)顯示被刪除,同時進行滾屏以便不同條款的圖象數(shù)據(jù)部分能夠顯示在顯示單元的圖象數(shù)據(jù)顯示區(qū)域中以便顯示在顯示單元的圖象數(shù)據(jù)顯示區(qū)域中顯示不同條款的圖象數(shù)據(jù)部分,并按強調(diào)方式顯示該不同條款對應(yīng)的圖象數(shù)據(jù)部分。
于是,由本發(fā)明的數(shù)據(jù)媒體處理裝置,如果光標指示顯示在數(shù)據(jù)將向其輸入的條款數(shù)據(jù)輸入顯示區(qū)域部分之一,則被同時參照的一個條款的圖象數(shù)據(jù)部分按強調(diào)方式顯示。于是,即使一個操作者先從顯示單元移開其目光然后又觀察顯示單元,也能夠防止該操作者觀察到錯誤的條款。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,防止了在參照圖象數(shù)據(jù)時匹配中的錯誤識別,由此提高了目視鑒別力,能夠防止輸入操作所需的勞務(wù)和時間,同時防止誤輸入。
進而,當一個要被參照的條款的圖象數(shù)據(jù)沒有在顯示單元上顯示時,能夠響應(yīng)強調(diào)顯示部分的運動進行自動滾屏。于是,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于,例如能夠減少按壓鍵盤之類費時的操作。
此外,還能夠使得操作者改變強調(diào)顯示部分的類型或區(qū)域。因而,該數(shù)據(jù)媒體處理裝置的優(yōu)點在于它能夠根據(jù)用途而使用。
圖1是表示根據(jù)本發(fā)明的一個實施例數(shù)據(jù)媒體處理裝置的一般結(jié)構(gòu)的功能框圖;圖2到圖4是表示根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置處理過程的圖示;圖5是表示本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置布局分析處理部分的結(jié)構(gòu)的功能框圖;圖6是表示根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置文件處理過程的圖示;圖7是表示根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置的一個圖象閱讀器的簡略透視圖;圖8和圖9是功能框圖,其中標注出由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理;圖10和圖11是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所處理的文件例子的圖示;圖12和圖13是表示根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置的圖象數(shù)據(jù)旋轉(zhuǎn)校正處理的流程圖;圖14是表示根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置的原點抽取和對比檢驗處理應(yīng)用的處理過程圖示;圖15(a)和15(b),圖16與圖17是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所處理的文件例子的圖示;圖18是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的邏輯原點抽取處理的流程圖;圖19是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的邏輯原點校正坐標的相符鑒別的圖示;圖20(a)和20(b)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所處理的文件例子的圖示;圖21是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的邏輯原點對比檢驗處理的流程圖;圖22是處理過程示意圖,其中標注了由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣對比檢驗處理;圖23是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣表產(chǎn)生處理的圖示;圖24(a)和24(b)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣表格產(chǎn)生處理時對圖象數(shù)據(jù)坐標規(guī)范化處理的圖示;圖25到圖27是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣表產(chǎn)生處理時位表格產(chǎn)生處理的圖示;圖28是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所產(chǎn)生的矩陣表格的圖示;圖29和圖30是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣表格對比檢驗處理的流程圖;圖31(a)和31(b)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的矩陣表格對比檢驗處理時矩陣信息的圖示;圖32是處理過程示意圖,其中標注出由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的特征數(shù)據(jù)識別處理;圖33和圖34是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的字符數(shù)據(jù)識別處理的圖示;圖35和圖36是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所處理的交換一般轉(zhuǎn)帳文件的圖示;圖37是處理過程示意圖,其中標注出由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理;圖38是表示用于由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理中所使用的劃線條款結(jié)構(gòu)信息的圖示;圖39是表示用于由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理中所使用的劃線條款結(jié)構(gòu)信息的劃線屬性的圖示;圖40和圖41(a)到圖41(d)是表示用于由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理中所使用的劃線條款結(jié)構(gòu)信息表格的圖示;圖42、圖43(a)及圖43(b)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理中使用的對比檢驗位置搜尋規(guī)則的圖示;圖44是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理流程圖;圖45是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理結(jié)果的一例的圖示;圖46(a)到圖46(c),圖47(a)到圖47(c)及圖48(a)到48(c)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理時標題的例子的圖示;圖49是表示在由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理時規(guī)范化處理的一例的圖示;圖50是表示用于由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理中所應(yīng)用的條款標題詞典的圖示;圖51(a)及圖51(b)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理時標題條款數(shù)據(jù)的對比檢驗結(jié)果的一例的圖示;圖52(a)到圖52(c)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析處理時基于標題校正規(guī)則的對比檢驗結(jié)果的校正的圖示;圖53是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析的流程圖;圖54(a)到圖54(h)及55(a)到圖55(f)是表示由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析中使用的標題部分劃線條款與數(shù)據(jù)部分劃線條款之間的連接規(guī)則的圖示;圖56是表示在由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析時對應(yīng)于標題條款的條款數(shù)據(jù)位置判定結(jié)果分析的圖示;圖57和圖58是表示在由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析時不同信息的鏈接關(guān)系的的圖示;圖59(a)到圖59(b)是表示在由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析時鏈接到功能條款的條款數(shù)據(jù)的圖示;圖60(a)到圖60(f)是表示在由根據(jù)本發(fā)明的該實施例數(shù)據(jù)媒體處理裝置所進行的標題分析時款數(shù)條款鏈接處理的圖示;圖61是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的結(jié)構(gòu)的示意圖;圖62和圖63是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的功能框圖;圖64到圖66是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的操作的流程圖;圖67是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的顯示單元的一個顯示一例的圖示;圖68是表示由根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置所產(chǎn)生的相關(guān)信息的圖示;圖69是表示由根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置所產(chǎn)生的強調(diào)信息的圖示;
圖70到78是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的顯示單元的顯示的例子的圖示;圖79是表示由根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置產(chǎn)生的強調(diào)信息的圖示;圖80到圖85是表示根據(jù)本發(fā)明的該實施例圖象數(shù)據(jù)顯示裝置的顯示單元的顯示例子的圖示;圖86是表示根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置的結(jié)構(gòu)的示意圖;圖87到圖89是根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置的功能框圖;圖90到圖97是根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置的操作的流程圖;圖98是表示由根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置所產(chǎn)生的整面圖象的圖示;圖99是表示由根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置所產(chǎn)生的識別字符信息的圖示;圖100是表示由根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置所產(chǎn)生的相關(guān)信息的圖示;圖101到圖104是表示根據(jù)本發(fā)明的該實施例閱讀標志顯示-識別信息修改裝置的顯示例子的圖示;圖105是表示根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置的框圖;圖106是一控制框圖,其中標注出根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置的操作;圖107是表示根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在登記步驟操作時操作的流程圖;圖108是表示根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在登記步驟操作時操作的操作圖示;圖109是一控制框圖,其中標注出根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在登記步驟操作時的操作;圖110是表示根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在登記步驟操作時操作的操作的流程圖;圖111是一控制框圖,其中標注出根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在登記步驟操作時的操作;圖112是表示根據(jù)本發(fā)明的該實施例第一變形的文件標識裝置在應(yīng)用步驟操作時操作的操作的流程圖;圖113是表示根據(jù)本發(fā)明的該實施例第二變形的文件標識裝置的控制框圖;圖114是表示根據(jù)本發(fā)明的該實施例第二變形的文件標識裝置的操作流程圖;圖115是表示一文件識別裝置結(jié)構(gòu)的示意圖;圖116是表示該文件識別裝置操作的圖示;圖117是表示對該文件識別裝置操作的變形的圖示;圖118(a)和118(b)是表示圖象數(shù)據(jù)參照點抽取方法的圖示;以及圖119是表示圖象數(shù)據(jù)旋轉(zhuǎn)校正處理的圖示。
具體實施例方式
(a)本發(fā)明的實施例的說明(a1)數(shù)據(jù)媒體處理裝置的說明圖1是表示根據(jù)本發(fā)明的一個實施例數(shù)據(jù)媒體處理裝置的一般結(jié)構(gòu)的功能框圖。
這里,圖1中所示的數(shù)據(jù)媒體處理裝置30實現(xiàn)基于從具有諸如個人票據(jù)等各種格式的文件媒體(文件)所讀取的圖象數(shù)據(jù)(圖象)的信息識別。
數(shù)據(jù)媒體處理裝置30具體由例如由安裝在金融機構(gòu)的每一分支辦公室(業(yè)務(wù)辦公室)的客戶機(CL)35和安裝在地區(qū)中心并通過交換線路36等連接到客戶機35的服務(wù)器(SV)39組成,并且各個業(yè)務(wù)辦公室的文件處理由地區(qū)中心的服務(wù)器39集中進行。
特別地,該數(shù)據(jù)媒體處理裝置30不僅能夠?qū)τ谠撐募幚硌b置產(chǎn)生的專用文件進行處理,而且通過分析文件的圖象數(shù)據(jù)布局以識別對象文件的格式而能夠處理其上信息以任意格式輸入的文件,以便基于文件格式識別的結(jié)果處理和實現(xiàn)字符的識別。
數(shù)據(jù)媒體處理裝置30如圖1中所示在功能上包括一個布局識別處理模塊16,一個字符識別處理模塊17和一個操作者確認/校正處理模塊18。
布局識別處理模塊16實現(xiàn)對由一個圖象數(shù)據(jù)閱讀裝置所讀取的圖象數(shù)據(jù)19的布局識別處理,并包含一個分析預(yù)處理部分1,一個布局分析處理部分2,一個布局對比檢驗處理部分3及一個布局編輯處理部分4。
分析預(yù)處理部分1產(chǎn)生一低密度圖象用于在識別對象的圖象數(shù)據(jù)19格式轉(zhuǎn)換之后的分析處理,以便減少布局的變化因素以提高分析的精確度,并除去圖象數(shù)據(jù)上在分析處理時造成精確度惡化的因素的灰塵等。
布局分析處理部分2參照分析詞典13從讀取的圖象數(shù)據(jù)抽取作為布局特征的劃線條款及條款數(shù)據(jù),基于這樣抽取的劃線條款及條款數(shù)據(jù)而分析布局的結(jié)構(gòu)并邏輯上表示該布局。
簡而言之,布局分析處理部分2功能上是作為從所讀取的圖象數(shù)據(jù)抽取文件媒體特有的特征的裝置,并基于該特征確定待識別的信息所出現(xiàn)的位置。
更具體來說,布局分析處理部分2分析識別對象圖象的布局以抽取作為布局特征而構(gòu)成該布局的各種成分(劃線條款和條款數(shù)據(jù)),并從這樣抽取的布局特征產(chǎn)生對該布局粗略限制項的該布局的關(guān)鍵信息,以便在隨后階段由布局對比檢驗處理部分3進行布局對比檢驗處理時檢索已登記的布局信息。
如圖5中所示,布局分析處理部分2至少包含用于抽取圖象布局特征的布局特征抽取部分2A,及用于基于由布局特征抽取部分2A所抽取的布局特征而分析布局結(jié)構(gòu)的布局分析部分2B。
布局特征抽取部分2A包括一個劃線抽取部分2C和一個條款數(shù)據(jù)抽取部分2D,而布局分析部分2B包括一個表格結(jié)構(gòu)分析部分2E。
在布局具有由劃線所形成的表格結(jié)構(gòu)之處,作為由布局的劃線所形成的最小矩形的劃線條款是由劃線抽取部分2C抽取的,并且由劃線條款形成的表格結(jié)構(gòu)由表格結(jié)構(gòu)分析部分2E基于所抽取的劃線條款進行分析。
另一方面,在布局具有沒有劃線的無劃線表格結(jié)構(gòu)之處,布局的條款數(shù)據(jù)由條款數(shù)據(jù)抽取部分2D抽取,并且無劃線的表格結(jié)構(gòu)由表格結(jié)構(gòu)分析部分2E基于這樣抽取的布局條款數(shù)據(jù)進行分析。
而且,在抽取了劃線條款和條款數(shù)據(jù)之后,布局分析處理部分2抽取布局的邏輯原點(logic origin)。
特別地,布局分析處理部分2通過標號處理實現(xiàn)(2-1)標號圖象的產(chǎn)生,用于對比檢驗的(2-2)文件圖象的邏輯原點和模糊級信息的抽取,(2-3)劃線條款的抽取和由(上述的)劃線條款所形成的表格結(jié)構(gòu)的分析,(2-4)條款數(shù)據(jù)的抽取和沒有劃線出現(xiàn)(上述的)條款表格結(jié)構(gòu)的分析,以及(2-5)標題區(qū)域的判定和標題條款的識別以及對應(yīng)的條款數(shù)據(jù)的判定(標題分析處理)。
要注意的是,由(2-1)中標號處理所進行的標號圖象的產(chǎn)生處理是從所輸入的圖象數(shù)據(jù)(二進制圖象數(shù)據(jù))計算連接成分(彼此連接的二進制圖象成分),以產(chǎn)生具有適用于各個連接成分的標號的標號圖象。例如這一標號處理由“連接區(qū)域抽取裝置和方法”(日本專利公開申請No.Heisei 08-55219)得知。
同時,在(2-3)中的劃線條款的抽取處理是從由劃線所圍繞的字符數(shù)據(jù)、圖形形式等等抽取劃線部分并對劃線部分與數(shù)據(jù)部分彼此分開的處理。例如該劃線條款的抽取處理可由“圖象抽取系統(tǒng)”(日本專利公開申請No.Heisei 06-309498)得知。
進而,在(2-5)中的標題分析處理判定一個圖象中的標題區(qū)(標題條款),識別標題區(qū)域中的標題條款信息并判定對應(yīng)的條款數(shù)據(jù)。
特別地,在本實施例中,布局分析處理部分2標識標題條款及對應(yīng)于標題條款的條款數(shù)據(jù),使得條款數(shù)據(jù)的字符識別能夠在沒有由字符識別處理模塊17進行標題條款的字符識別處理情形下立即進行。
以上所說明的處理(2-2)將在(a2)原點抽取與對比檢驗處理的說明中詳細描述,而處理(2-5)將在(a6)標題分析處理的說明中詳細描述。
順便而言,布局對比檢驗處理部分3的功能是作為圖象識別裝置用于使用由布局分析處理部分2作為限制檢索項所抽取的布局特征(劃線條款和條款數(shù)據(jù)),而從布局數(shù)據(jù)庫(布局DB)14檢索備選布局,并對它們進行對比檢驗看是否存在一相符的備選布局,以便識別在由布局分析處理部分2所確定的一個位置處的一個圖象而鑒別在所確定的位置處的信息。
布局DB 14是在其中存儲備選布局信息的備選布局存儲部分,并在本實施例中,存儲壓縮的備選布局信息作為備選布局信息。要注意的是,這里的布局信息壓縮處理將在以下詳述。
布局DB 14還具有布局校正信息用于校正由布局分析處理部分2所進行的布局分析結(jié)果的校正,布局分析的結(jié)果是使用布局校正信息由將在以下說明的布局編輯處理部分4校正的,使得隨后的處理能夠以高精度進行。
而且,布局DB 14的內(nèi)容是基于由布局識別處理模塊16或操作者確認/校正處理模塊18通過學(xué)習(xí)備選布局信息被更新的,因而消除了由操作者等向布局DB 14進行備選布局信息記錄操作的必要性,達到了操作的簡化。
布局對比檢驗處理部分3參照由布局分析處理部分2所抽取的邏輯原點實現(xiàn)對比檢驗,以檢驗是否存在相符的備選布局。
特別地,布局對比檢驗處理部分3應(yīng)用由布局分析處理部分2所產(chǎn)生的布局關(guān)鍵信息檢索并對比檢驗存儲在布局DB 14中的布局信息以獲得相符的布局信息。
而且,當上述的對比檢驗處理部分3實現(xiàn)布局的檢索和對比檢驗時,它首先使用布局關(guān)鍵信息作為粗略限制項的檢索限制項檢索布局DB 14,并然后對于作為檢索的結(jié)果所獲得的多個備選布局進行詳細的對比檢驗以判定相符的布局。
更特別地,在與備選布局進行詳細對比檢驗處理時,布局對比檢驗處理部分3限制項的細節(jié)程度的升序進行(3-1)劃線條款位矩陣的對比檢驗,(3-2)劃線條款位置與劃線條款屬性的細化對比檢驗,(3-3)條款數(shù)據(jù)位置的對比檢驗,(3-4)標題位置與標題內(nèi)容的對比檢驗以及(3-5)區(qū)域圖象(唯一圖象)的特征數(shù)據(jù)的對比檢驗。
在這里劃線條款位矩陣的對比檢驗(3-1)是通過對由布局分析處理部分2所抽取的布局特征的壓縮處理,并應(yīng)用已壓縮處理的布局特征作為檢索限制項從布局DB 14檢索壓縮的備選布局而進行的對比檢驗。
特別地,在本實施例中,布局DB 14具有存儲在其中的壓縮的備選布局信息,并且布局對比檢驗處理部分3產(chǎn)生壓縮處理的布局信息并相互對比檢驗壓縮的布局信息,以達到高速布局對比檢驗處理。
注意,處理(3-1)將在(a4)矩陣對比檢驗處理說明中詳細描述,處理(3-2)到(3-4)將在(a6)標題分析處理說明中詳細描述,以及處理(3-5)將在(b)本發(fā)明的實施例變型的說明中詳細描述。
進而,在布局DB 14中作為由布局對比檢驗處理部分3所進行的布局DB 14的檢索和對比檢驗的結(jié)果存在相符的布局之處,基于如上所述從布局DB 14所得的布局校正信息布局編輯處理部分4校正布局分析的結(jié)果,并然后輸出該校正的布局信息作為布局識別結(jié)果20。
要注意,其中使用了布局校正信息的校正的內(nèi)容是標題位置及標題內(nèi)容的校正,以及鏈接到標題的條款數(shù)據(jù)位置與條款數(shù)據(jù)屬性的校正。
另一方面,在布局DB 14中作為由布局對比檢驗處理部分3所進行的布局DB 14的檢索和對比檢驗的結(jié)果不存在相符的布局之處,布局編輯處理部分4判定布局分析的結(jié)果作為新的布局并作為其本來那樣的布局信息(布局識別結(jié)果)輸出該布局。
順便而言,字符識別處理模塊17對來自布局識別處理模塊16的布局識別結(jié)果20進行字符識別處理,并包含一個字符識別定義產(chǎn)生部分5,字符識別處理部分6以及知識處理部分7。
字符識別定義產(chǎn)生部分5基于作為布局識別結(jié)果20輸出的布局信息而產(chǎn)生一個字符識別定義(臨時定義)21,該定義定義了要由字符識別處理部分6使用的字符識別對象條款數(shù)據(jù)位置和條款數(shù)據(jù)屬性。
雖然布局識別結(jié)果20的條款數(shù)據(jù)信息是以對分析對象圖象的左上角的絕對坐標輸出的,但是分析對象圖象左上角由于在圖象閱讀時形式位置的變化不一定與固定的位置相符。
因而,每當與分析對象圖象一致時字符識別定義產(chǎn)生部分5動態(tài)地產(chǎn)生字符識別定義21。
字符識別處理部分6使用由字符識別定義產(chǎn)生部分5從布局信息所產(chǎn)生的字符識別定義21,對于字符識別對象的圖象數(shù)據(jù)進行字符識別處理,并取得識別結(jié)果的代碼數(shù)據(jù)。
知識處理部分7參照在其中記錄了用于識別結(jié)果的校正信息的知識數(shù)據(jù)庫(知識DB)15校正字符識別處理部分6的識別結(jié)果代碼數(shù)據(jù),并輸出校正的代碼數(shù)據(jù)作為字符識別結(jié)果22。
操作者確認/校正處理模塊18是這樣一個模塊,其中布局識別結(jié)果20和字符識別結(jié)果22顯示在終端單元(例如圖1中的一個客戶機10),并由操作者進行對圖象數(shù)據(jù)處理結(jié)果的確認和修改處理,該模塊還包含一個布局屏幕顯示處理部分8及字符識別結(jié)果屏幕顯示處理部分9。
基于布局識別結(jié)果20的布局信息,布局屏幕顯示處理部分8顯示識別對象圖象及諸如標題位置和標題內(nèi)容,對應(yīng)的條款位置等分析的結(jié)果,以便允許操作者對布局識別結(jié)果20和字符識別結(jié)果22進行修改和確認。
本實施例中,如同以下在(a7)對識別字符的確認和修改處理中所詳述那樣,擴大了普通的修改和確認處理使得在對應(yīng)的文件圖象上的識別結(jié)果與標題內(nèi)容的代碼數(shù)據(jù)和/或條款數(shù)據(jù)按類似的形式顯示在客戶機10的顯示單元上,以便能夠?qū)Σ季中畔⑦M行修改和確認處理。
字符識別結(jié)果屏幕顯示處理部分9,在屏幕上與布局屏幕顯示處理部分8的顯示一致地顯示對應(yīng)于字符識別對象圖象的識別條款的字符識別結(jié)果的代碼數(shù)據(jù)。
而且,在客戶機10中,由一操作者確認對應(yīng)于顯示單元上所顯示的識別對象圖象的布局識別結(jié)果20和/或字符識別結(jié)果22,并根據(jù)需要對布局識別結(jié)果20和字符識別結(jié)果22進行修改。
要注意,圖1所示的數(shù)據(jù)媒體處理裝置30除了布局識別除了模塊16之外還包括字符識別處理模塊17,和上述的操作者確認/校正處理模塊18,布局登記信息產(chǎn)生處理部分11和知識登記信息產(chǎn)生處理部分12。
布局登記信息產(chǎn)生處理部分11把由操作者修改的內(nèi)容作為校正數(shù)據(jù)加到布局識別結(jié)果20布局信息中(這由圖4中的學(xué)習(xí)布局信息28表示,該圖將在以下說明),以產(chǎn)生布局校正信息被存儲到布局DB 14中。要注意,這樣產(chǎn)生的布局校正信息在其校正內(nèi)容被鑒別之后由布局DB 14進行學(xué)習(xí)并登記到其中。
而且,布局登記信息產(chǎn)生處理部分11把由操作者修改的內(nèi)容作為校正數(shù)據(jù)加到布局識別結(jié)果20的布局信息中,以產(chǎn)生分析詞典學(xué)習(xí)信息24(這在以下將說明的圖4中由登記布局信息29表示)。這樣產(chǎn)生的分析詞典學(xué)習(xí)信息24在其校正內(nèi)容被鑒別之后由分析詞典13進行學(xué)習(xí)并登記到其中。
知識登記信息產(chǎn)生處理部分12把由操作者修改的內(nèi)容作為校正數(shù)據(jù)加到字符識別結(jié)果22的代碼數(shù)據(jù)中以產(chǎn)生用于知識DB 15的知識學(xué)習(xí)信息23,并且這樣產(chǎn)生的學(xué)習(xí)數(shù)據(jù)由知識DB 15學(xué)習(xí)并登記到其中。
在具有上述結(jié)構(gòu)的本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置30中,當閱讀具有任意格式的文件的圖象數(shù)據(jù)19時,對圖象數(shù)據(jù)19的布局進行分析以識別對象文件的格式供處理之用,并且文件的字符識別基于文件的格式識別的結(jié)果進行。
然后,布局識別結(jié)果20和字符識別結(jié)果22由操作者確認并根據(jù)需要進行修改。
以下將參照圖2到圖4說明數(shù)據(jù)媒體處理裝置30的操作。
首先,將參照圖2說明當用于處理的對象文件的布局是一新出現(xiàn)的布局時的處理。
首先,在布局識別處理模塊16的分析預(yù)處理部分1中,對用于處理的對象文件的圖象數(shù)據(jù)進行分析預(yù)處理(步驟A1)。
然后,布局分析處理部分2從供識別的對象圖象抽取作為布局成分的劃線條款和條款數(shù)據(jù),并參照分析詞典13作為分析結(jié)果輸出布局中的標題條款位置和對應(yīng)于該條款內(nèi)容的條款數(shù)據(jù)位置(步驟A2)。
這里,步驟A2的布局分析處理步驟是一學(xué)習(xí)出現(xiàn)位置確定步驟,其中從讀取的圖象數(shù)據(jù)抽取文件媒體所特有的特征,并基于這些特征確定待識別的信息的位置,并抽取讀取的圖象布局的特征,分析布局的結(jié)構(gòu)并以抽取的特征邏輯表示該布局。
而且,布局分析處理步驟A2包括在抽取了布局的劃線條款和條款數(shù)據(jù)之后抽取布局的邏輯原點的步驟,并進而包括鑒別讀取的圖象布局是否具有預(yù)定方向的步驟,以及基于該步驟鑒別的結(jié)果轉(zhuǎn)換讀取的圖象數(shù)據(jù)的步驟,使得布局能夠具有預(yù)定的方向。要注意,對于讀取的圖象數(shù)據(jù)的轉(zhuǎn)換處理是使得布局旋轉(zhuǎn)的處理,并且這一處理將在出現(xiàn)的以下(a3)圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理的說明中詳細說明。
這里,在布局具有由劃線所形成的表格結(jié)構(gòu)之處,布局分析處理步驟A2包括從圖象數(shù)據(jù)抽取劃線條款的步驟,和基于在該步驟所抽取的劃線條款分析由劃線所形成的表格結(jié)構(gòu)的步驟。
另一方面,在布局具有沒有劃線的無劃線表格結(jié)構(gòu)之處,布局分析處理步驟A2包括從圖象數(shù)據(jù)抽取條款數(shù)據(jù)的步驟,和基于在該步驟所抽取的條款數(shù)據(jù)分析無劃線表格結(jié)構(gòu)的步驟。
進而,布局分析處理步驟A2包括判定圖象中標題區(qū)域、識別標題區(qū)域中的標題條款信息并判定對應(yīng)的條款數(shù)據(jù)的步驟。
然后,布局對比檢驗處理部分3使用抽取的布局成分(劃線條款和條款數(shù)據(jù))作為檢索項檢索布局DB 14。然而,由于供處理的對象文件是新文件,對應(yīng)的布局在布局DB 14中不存在,因而不能取得備選布局信息和布局校正信息(步驟A3)。
這里,在步驟A3中的布局對比檢驗處理步驟是一圖象識別步驟,其中識別在步驟A2所確定的位置處的圖象數(shù)據(jù)以判定在所確定的位置處的信息,并使用在步驟A2所抽取的布局的特征作為檢索限制項而檢索存儲在布局DB 14中的備選布局,以實現(xiàn)對比檢驗看是否存在相符的備選布局。
布局對比檢驗處理步驟A3包括參照在步驟A2所抽取的邏輯原點鑒別信息的步驟,并進而包括壓縮處理在步驟A2中所抽取的布局特征的壓縮處理步驟,使用在該步驟壓縮的布局特征作為限制檢索項從布局DB 14檢索壓縮的備選布局的步驟,以及基于在該步驟的檢索結(jié)果進行對比檢驗以檢驗是否存在相符的備選布局的步驟。
進而,布局編輯處理部分4以無校正校正信息狀態(tài)(步驟A4)產(chǎn)生一布局識別結(jié)果20,由于在步驟A3沒有得到作為對比檢驗一個結(jié)果的備選布局信息和布局校正信息。
字符識別處理模塊17的字符識別識別定義產(chǎn)生部分5基于在步驟A4所產(chǎn)生的布局識別結(jié)果20產(chǎn)生一字符識別定義21(圖4的步驟A14)。
此后,字符識別處理部分6使用在步驟A14所產(chǎn)生的字符識別定義21進行字符識別對象的條款數(shù)據(jù)的字符識別,以便取得識別結(jié)果的代碼數(shù)據(jù)(圖4的步驟A15)。
進而,參照在其中記錄了用于識別結(jié)果的校正信息的知識DB15,知識處理部分7校正在步驟A15取得的識別結(jié)果代碼數(shù)據(jù),以產(chǎn)生字符識別結(jié)果22(圖4的步驟A16)。
這里,操作者確認/校正處理模塊18的布局屏幕顯示處理部分8參照在步驟A4所產(chǎn)生的布局識別結(jié)果20并向客戶機10的顯示單元輸出標題條款內(nèi)容和對應(yīng)于該標題的位置的條款數(shù)據(jù)位置(圖4所示的布局分析信息26)。進而,布局屏幕顯示處理部分8向客戶機10的顯示單元輸出讀取的圖象數(shù)據(jù)(圖4所示的屏幕顯示圖象27)(步驟A5)。
進而,字符識別結(jié)果屏幕顯示處理部分9向客戶機10的顯示單元輸出對應(yīng)于字符識別對象圖象的識別條款的字符識別結(jié)果22(該字符識別結(jié)果22在步驟A16中產(chǎn)生),該輸出與布局屏幕顯示處理部分8進行的顯示是一致的。
這里,顯示在客戶機10的顯示單元上的布局識別結(jié)果20和字符識別結(jié)果22的確認和修改操作是由操作者進行的(步驟A6)。
進而,布局信息產(chǎn)生處理部分11從來自操作者進行的確認和修改布局操作的結(jié)果產(chǎn)生對布局(布局登記信息)的校正信息。
要注意,步驟A7中所產(chǎn)生的布局登記信息是作為對該布局的校正信息[布局DB學(xué)習(xí)信息25(學(xué)習(xí)布局信息28)和分析詞典學(xué)習(xí)信息24(登記布局信息29)]在布局DB 14和分析詞典13上被反映的,從而實現(xiàn)布局學(xué)習(xí)處理(步驟A8)。
特別地,在步驟A8中,備選布局信息通過在布局DB 14中的學(xué)習(xí)而被更新。
繼而,參照圖2將說明供處理的對象文件的布局是再次出現(xiàn)的布局時的處理。
首先,布局識別處理模塊16的分析預(yù)處理部分1進行如上所述的供處理的對象文件圖象數(shù)據(jù)19的分析預(yù)處理(步驟A1)。
然后,布局分析處理部分2按類似于上述步驟A2中的方式分析布局,并輸出該布局分析的結(jié)果(步驟A9)。
進而,布局對比檢驗處理部分3使用所抽取的布局成分(劃線條款和條款數(shù)據(jù))作為檢索項檢索布局DB 14,以取得相符的布局的詳細信息和布局校正信息(步驟A10)。
這時,由于供處理的對象文件再次出現(xiàn),故對應(yīng)的備選布局信息作為布局DB 14檢索的結(jié)果被報告,并且布局的詳細信息與這樣報告的備選布局進行對比檢驗以鑒別布局之間的一致性。
要注意,在鑒別出布局彼此一致的地方,布局編輯處理部分4實現(xiàn)在步驟A1 1到A13的處理判定該布局為一個已經(jīng)存在的布局。另一方面,在作為對比檢驗的結(jié)果判定出不一致,則布局編輯處理部分4實現(xiàn)步驟A4到A8的處理判定該布局為一個新的布局。
這里,基于作為布局DB 14檢索的結(jié)果所取得的布局校正信息,布局編輯處理部分4校正布局分析的結(jié)果和對應(yīng)于該數(shù)據(jù)的位置的數(shù)據(jù)位置,以產(chǎn)生布局識別結(jié)果20(步驟A11)。
字符識別處理模塊17的處理類似于上述與圖4的步驟A14到A15相關(guān)的處理。
這里,操作者確認/校正處理模塊18的布局屏幕顯示處理部分8參照在步驟A11中所產(chǎn)生的布局識別結(jié)果20,并向客戶機10的顯示器輸出標題條款內(nèi)容和對應(yīng)于該標題位置的條款數(shù)據(jù)位置(圖4中所示的布局分析信息26)。進而,布局屏幕顯示處理部分8向客戶機10的顯示單元輸出讀取的圖象數(shù)據(jù)(圖4中所示的屏幕顯示圖象27)(步驟A12)。
同時,字符識別結(jié)果屏幕顯示處理部分9與由布局屏幕顯示處理部分8進行的顯示一致地,向客戶機10的顯示單元輸出對應(yīng)于字符識別對象圖象的識別條款的字符識別結(jié)果22(這字符識別結(jié)果22是在步驟A16產(chǎn)生的)。
這里,顯示在客戶機10的顯示單元上的布局識別結(jié)果20的確認操作和/或字符識別結(jié)果22的確認與修改操作由操作者進行(步驟A13)。
要注意,供處理的對象文件的布局是一個現(xiàn)有的布局,由于對于分析對象圖象的處理在當步驟A13中布局的確認操作完成時的時間點被完成的,故沒有進行由布局登記信息產(chǎn)生處理部分11產(chǎn)生布局登記信息。
最后,將說明圖6所示的數(shù)據(jù)媒體處理裝置30進行文件處理。
這里,在每一醫(yī)務(wù)室中,文件的圖象數(shù)據(jù)由圖象數(shù)據(jù)閱讀裝置(例如,電傳機31,圖象掃描器32或者如圖6中所示的DATA-EXE33或圖6和7中所示的圖象閱讀器34)。
這里,由圖象掃描器32、DATA-EXE 33或圖象閱讀器34讀取的圖象數(shù)據(jù)傳送到客戶機35。
然后,來自傳真機31的圖象數(shù)據(jù)通過交換機線路(ISDN/公共網(wǎng)絡(luò))36和傳真機適配器37傳送到地區(qū)中心服務(wù)器39,同時通過交換機線路(ISDN/公共網(wǎng)絡(luò))36和通信適配器38來自客戶機35的圖象數(shù)據(jù)傳送到地區(qū)中心服務(wù)器39。
服務(wù)器39自動地并集中地進行從各個醫(yī)務(wù)室傳送的文件圖象數(shù)據(jù)的分析處理,并存儲私人票據(jù)識別軟件成分40,包括知識數(shù)據(jù)庫(知識dB)15,布局數(shù)據(jù)庫(布局DB)14及集中的字符識別裝置6。
服務(wù)器39具有對應(yīng)于上述圖1中所示布局識別處理模塊16和字符識別處理模塊17的功能,而作為提供了這些功能的軟件私人票據(jù)識別軟件成分40安裝在硬盤上或者其它未示出的存儲上,以便進行相應(yīng)的處理。
進而,地區(qū)中心還包括客戶機(CL)10以便確認和修改由服務(wù)器39進行的圖象數(shù)據(jù)分析處理結(jié)果。
特別地,客戶機10具有對應(yīng)于上述圖1所示的操作者確認/校正處理模塊18的功能。在客戶機10中,提供上述這種功能的適用的軟件安裝在硬盤上或者其它未示出的存儲上,以便進行相應(yīng)的處理。
然后,圖象數(shù)據(jù)的布局和結(jié)果的字符識別顯示在客戶機10的顯示單元上,而操作者可參照顯示單元以實現(xiàn)對圖象數(shù)據(jù)分析結(jié)果的確認或者修改。
要注意,為了允許諸如被引入到地區(qū)中心的票據(jù)文件的處理,圖象閱讀器34和DATA-EYE 33作為圖象數(shù)據(jù)閱讀裝置連接到客戶機10,使得由這些圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù)能夠傳送到服務(wù)器39。
進而,由服務(wù)器39分析的文件分析的結(jié)果通過分支服務(wù)器(BS)41傳送到作為主機設(shè)備的主計算機(未示出)。
這樣,利用根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置30,通過自動地電子化地分析每天出現(xiàn)的各種文件或文件圖象能夠大大提高使用通常的輸入系統(tǒng)(OCR輸入系統(tǒng),數(shù)據(jù)輸入系統(tǒng)等)輸入工作的效率。
特別地,利用根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置30,能夠構(gòu)成不僅能夠處理用于普通輸入系統(tǒng)的專用文件,而且能夠處理現(xiàn)有的如其原樣的各種各樣任意文件的輸入系統(tǒng)。
更特別地,通過自動地分析構(gòu)成金融機構(gòu)等的輸入工作對象的私人一般轉(zhuǎn)帳文件的布局(由最終用戶所產(chǎn)生的一般轉(zhuǎn)帳票據(jù)),能夠直接進行字符識別處理和輸入處理,并能夠進行私人一般轉(zhuǎn)帳票據(jù)的完全自動的識別處理。
通過基于任意票據(jù)任何各種各樣類型的布局識別結(jié)果20產(chǎn)生布局登記信息并學(xué)習(xí)和記錄該結(jié)果到布局DB 14,此后能夠自動地進行對于具有相同布局文件的鑒別,因而可降低對于產(chǎn)生專用文件所需的勞務(wù)和費用,并在學(xué)習(xí)之后能夠立即輸入。因而,能夠達到降低包括現(xiàn)有裝置30在內(nèi)的系統(tǒng)引入周期。
進而,由于正常地對文件的圖象數(shù)據(jù)進行分析,能夠達到對不同于昂貴的專用OCR文件的文件的自動識別處理,由此減少了剪切錯誤或打印錯誤。
(a2)原點抽取與對比檢驗處理的說明圖14是表示由根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置進行的原點抽取與對比檢驗處理的應(yīng)用的處理示意圖。
一般,即使使用光學(xué)閱讀裝置(掃描器,傳真機等)閱讀具有相同布局的圖象,由于在閱讀時位置的位移,各個布局的成分(劃線條款與條款數(shù)據(jù))對圖象物理原點的坐標也不會出現(xiàn)出相等的數(shù)值。
于是,當比較布局的成分以鑒別布局的一致性時,必須使得從各個布局所抽取的邏輯原點的位置匹配,計算布局的各個成分對邏輯原點相對坐標并使用相對坐標對比檢驗這些布局。
由于在圖象閱讀時必須排除諸如灰塵或污物之類圖象的任何變形因素而穩(wěn)定地抽取這一邏輯原點,故必須選擇能夠以充分高的精度穩(wěn)定抽取的坐標位置為邏輯原點。
因而,本實施例中,平行使用了多種抽取方法來抽取邏輯原點,使得即使在處理具有任意布局的文件時也能夠抽取到正規(guī)穩(wěn)定的邏輯原點。
這里,在根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置30中,在圖14中可見,由布局分析處理部分2進行的布局分析處理步驟A2(和A9)包括抽取格式的邏輯原點的邏輯原點抽取步驟M1,及參照步驟M1中抽取的邏輯原點抽取包括格式在內(nèi)的媒體特有的特征,并從抽取的特征確定待識別的信息所出現(xiàn)的位置的信息出現(xiàn)位置確定步驟。
同時,由布局對比檢驗處理部分3進行的布局對比檢驗處理步驟A3(和A10)包括在信息出現(xiàn)位置確定步驟所確定的位置的圖象識別時參照在邏輯原點抽取步驟M1(步驟M2)所抽取的邏輯原點進行布局對比檢驗的圖象識別步驟,以鑒別所抽取的字符信息。
進而,在由布局分析處理部分2所進行的邏輯原點抽取步驟M1中,除了抽取格式的邏輯原點之外,還抽取向邏輯原點提供輔助信息的邏輯原點輔助坐標信息,并在由布局對比檢驗處理部分3所進行的圖象識別步驟中,參照邏輯原點和邏輯原點輔助坐標信息(步驟M2)進行布局對比檢驗處理,以鑒別所抽取的特征信息。
這里,本實施例中,在具有其中由劃線形成的表格結(jié)構(gòu)之處,在定義了該表格結(jié)構(gòu)的轉(zhuǎn)角中抽取具有最小X坐標和最小Y坐標的轉(zhuǎn)角的坐標信息[(圖15(a)中所示的坐標A]作為格式的邏輯原點,并作為邏輯原點輔助坐標信息,抽取具有最大X坐標和最小Y坐標的另一個轉(zhuǎn)角,具有最小X坐標和最大Y坐標的另一個轉(zhuǎn)角以及具有最大X坐標和最大Y坐標的另一個轉(zhuǎn)角[分別為圖15(a)中所示的坐標Aa,Ab,Ac]。
在布局具有沒有劃線的無劃線表格結(jié)構(gòu)中,例如如圖17所示,抽取在外接矩形的轉(zhuǎn)角中具有最小X坐標和最小Y坐標的轉(zhuǎn)角的坐標信息(圖17中所示的坐標D)作為該格式的邏輯原點,并作為邏輯原點輔助坐標信息,抽取具有最大X坐標和最小Y坐標的外接矩形的另一個轉(zhuǎn)角,具有最小X坐標和最大Y坐標的另一個轉(zhuǎn)角以及具有最大X坐標和最大Y坐標的另一個轉(zhuǎn)角(分別為圖17中所示的坐標Da,Db,Dc)。
這里,將首先說明邏輯原點抽取處理。
邏輯原點的抽取處理是由圖5所示的布局分析部分2B的表格結(jié)構(gòu)分析部分2E具體進行的。
基于由布局特征抽取部分2A的劃線抽取部分2C所抽取的劃線條款和由布局特征抽取部分2A的條款數(shù)據(jù)抽取部分2D所抽取的條款數(shù)據(jù),表格結(jié)構(gòu)分析部分2E具體分析劃線條款的外接矩形,由劃線條款所形成的表格結(jié)構(gòu)的最大外接矩形,和條款數(shù)據(jù)的外接矩形,從這些矩形抽取轉(zhuǎn)角的坐標并設(shè)置預(yù)定的坐標為邏輯原點坐標和校正坐標。
以下將參照圖18中所示的流程圖說明這時布局分析處理部分2的操作。
首先在處理對象布局基于劃線之處,作為邏輯原點抽取處理的預(yù)處理,布局特征抽取部分2A的劃線抽取部分2C從作為抽取對象的圖象數(shù)據(jù)抽取劃線(步驟B1),并然后抽取由所抽取的劃線形成的最小矩形作為劃線條款(步驟B2)。
然后,布局分析部分2B的表格結(jié)構(gòu)分析部分2E鑒別劃線條款是否已經(jīng)被抽取(步驟B3),并在劃線條款已經(jīng)被抽取且這樣抽取的劃線條款寬和高彼此近似相等地就位之處,這些劃線條款被認為并分組為具有邏輯關(guān)系的一個劃線條款組(步驟B4)。
進而,表格結(jié)構(gòu)分析部分2E鑒別在該組中是否出現(xiàn)一個表格結(jié)構(gòu)(這里表格結(jié)構(gòu)表示由2行x2列或更多的劃線條款組所形成的一個區(qū)域)(步驟B5)。
這里,在出現(xiàn)表格結(jié)構(gòu)之處,表格結(jié)構(gòu)分析部分2E抽取表格結(jié)構(gòu)中象圖15(a)中斜線部分I所示那種最大矩形區(qū)域并取得該矩形區(qū)域的四個轉(zhuǎn)角的坐標(步驟B6)。
然后,該矩形的左上角坐標A(Xo,Yo)被設(shè)置為邏輯原點,而其余的右上角坐標Aa,左下角坐標Ab及右下角坐標Ac的三個位置設(shè)置為對邏輯原點的校正坐標(步驟B7和步驟B8)。
另一方面,在如圖15(b)中所看到的出現(xiàn)多個表格結(jié)構(gòu)之處,表格結(jié)構(gòu)分析部分2E抽取各個表格結(jié)構(gòu)(參照斜線部分I)并取得每一個矩形區(qū)域的四個轉(zhuǎn)角的坐標(步驟B6)。
然后,當每一表格結(jié)構(gòu)的邏輯原點在水平方向和垂直方向投影時的坐標B(最小X坐標,最小Y坐標)[這就是,(Xo,Yo)]被設(shè)置為邏輯原點,而三個位置即坐標Ba(最大X坐標,最小Y坐標),坐標Bb(最小X坐標,最大Y坐標)及坐標Bc(最大X坐標,最大Y坐標)被設(shè)置為對邏輯原點的校正坐標(步驟B7和步驟B8)。
進而,在任何劃線條款組中不出現(xiàn)表格結(jié)構(gòu)之處,表格結(jié)構(gòu)分析部分2E抽取如圖16中斜線部分I所示位于最外的劃線條款的矩形區(qū)域之一,并取得每一個矩形區(qū)域的四個轉(zhuǎn)角的坐標(步驟B12)。
然后,當每一矩形的邏輯原點在水平方向和垂直方向投影時的坐標C[(最小X坐標,最小Y坐標),這就是,(Xo,Yo)]被設(shè)置為邏輯原點,而三個位置即坐標Ca(最大X坐標,最小Y坐標),坐標Cb(最小X坐標,最大Y坐標)及坐標Cc(最大X坐標,最大Y坐標)被設(shè)置為對邏輯原點的校正坐標(步驟B13和步驟B14)。
順便來說,在布局完全不包含劃線條款之處,布局特征抽取部分2A的條款數(shù)據(jù)抽取部分2D抽取布局中的條款數(shù)據(jù),而表格結(jié)構(gòu)方向部分2E抽取那些如圖17斜線I所示位于最外側(cè)的條款數(shù)據(jù)的矩形區(qū)域,并取得每一個矩形區(qū)域的四個轉(zhuǎn)角的坐標(步驟B9)。
然后,當每一矩形的邏輯原點在水平方向和垂直方向投影時的坐標D(最小X坐標,最小Y坐標),這就是,(Xo,Yo)]被設(shè)置為邏輯原點,而三個位置即坐標Da(最大X坐標,最小Y坐標),坐標Db(最小X坐標,最大Y坐標)及坐標Dc(最大X坐標,最大Y坐標)被設(shè)置為對邏輯原點的校正坐標(步驟B10和步驟B11)。
進而,表格結(jié)構(gòu)方向部分2E不僅取得如上述方式所抽取的邏輯原點坐標和對邏輯原點的校正坐標,而且取得作為在抽取邏輯原點時所采用的方法的記錄信息的邏輯原點抽取方法(即,表示每一邏輯原點已經(jīng)從表格結(jié)構(gòu),劃線條款及條款數(shù)據(jù)的哪一個抽取的信息)。
要注意,在以下的說明中,指示諸如上述邏輯原點抽取方法的邏輯原點可能被稱為表格邏輯原點,劃線條款邏輯原點或條款數(shù)據(jù)邏輯原點。
然后,布局分析處理部分2向布局對比檢驗處理部分3作為邏輯原點信息發(fā)送出邏輯原點抽取方法,邏輯原點坐標及邏輯原點校正坐標。
以下將說明邏輯原點對比檢驗處理。
該邏輯原點對比檢驗處理是由以上圖1中所示的布局對比檢驗處理部分3進行的。
在進行布局之間的對比時,布局的布局成分坐標被轉(zhuǎn)換為對邏輯原點的相對坐標,而該相對坐標彼此進行比較以實現(xiàn)從布局所抽取的邏輯原點的比較。
然而實際上,即使布局相同,由于在閱讀時諸如對圖象的污染或弄臟等變化因素可能有時也檢測不到邏輯原點的一致性。
這時,基于一個邏輯原點的信息,再次動態(tài)地檢測其它邏輯原點,并然后鑒別邏輯原點之間的一致性。
將參照圖21所示的流程圖說明這時布局對比檢驗處理部分3的操作。
首先,在本實施例中,由于使用多種方法由上述的布局分析處理部分2抽取抽取邏輯原點,故在對邏輯原點之間對比檢驗之前先要進行對邏輯原點抽取方法之間的一致性鑒別(步驟C1和C2)。
如果邏輯原點的抽取方法彼此之間是一致的,則如在圖19所見,對布局L1和另一個布局L2的邏輯原點校正坐標彼此進行比較以鑒別邏輯原點校正坐標之間的一致性(步驟C3到C5)。
這里,在鑒別為校正坐標之間一致之處,基于布局L1的邏輯原點坐標E(最小X坐標,最小Y坐標)和布局L2的邏輯原點坐標F(最小X坐標,最小Y坐標)計算布局L1的Ea到Ec的校正坐標及布局L2的Fa到Fc的校正坐標的相對坐標(Ea′到Ec′及Fa′到Fc′),并通過相對坐標之間的一致性鑒別進行校正坐標之間的一致性鑒別。
特別地,通過作出包含邏輯原點坐標信息的校正坐標之間的一致性鑒別而鑒別邏輯坐標之間的一致性以便對布局進行對比檢驗(步驟C6)相對坐標計算的表達式由以下表達式(1)到(6)給出(相對坐標Ea′)=(校正坐標Ea)-(邏輯原點坐標E)……(1)(相對坐標Eb′)=(校正坐標Eb)-(邏輯原點坐標E)……(2)(相對坐標Ec′)=(校正坐標Ec)-(邏輯原點坐標E)……(3)(相對坐標Fa′)=(校正坐標Fa)-(邏輯原點坐標E)……(4)(相對坐標Fb′)=(校正坐標Fb)-(邏輯原點坐標E)……(5)(相對坐標Fc′)=(校正坐標Fc)-(邏輯原點坐標E)……(6)進而,由以下表達式(7)到(9)給出對于相對坐標之間的一致性要求|(相對坐標Ea′)-(相對坐標Fa′)|≤ε(ε一致性范圍)……(7)|(相對坐標Eb′)-(相對坐標Fb′)|≤ε(ε一致性范圍)……(8)|(相對坐標Ec′)-(相對坐標Fc′)|≤ε(ε一致性范圍)……(9)另一方面,在邏輯原點抽取方法彼此不一致(參照步驟C2)或校正坐標彼此不一致(參照步驟C4)之處,則基于其它布局的邏輯原點信息進行布局之一的邏輯坐標再抽取。
這里,如果由于圖20中所見對劃線的污染布局L1部分地不能檢測,則在圖20(b)可見使用布局L1的邏輯原點信息(邏輯原點抽取方法,邏輯原點坐標G和校正坐標Ga到Gc)抽取布局L2的新的邏輯原點坐標H′和新的檢測坐標H′a,Hb和Hc(步驟C7和C8)。
在這時邏輯原點信息再抽取時,在圖20(a)和20(b)中可見首先從布局L1和布局L2的邏輯原點坐標和校正坐標分別計算X坐標之間的差Xa,Xb,和X′a,X′b,及Y坐標之間的差Ya,Yb,和Y′a,Y′b。
以下如表達式(10)到(17)給出計算這些差的表達式(布局L1)差Xa=|(校正坐標Ga的X坐標)-(邏輯原點坐標G的X坐標)|……(10)差Xb=|(校正坐標Gc的X坐標)-(校正坐標Gb的X坐標)|……(11)差Ya=|(校正坐標Gb的Y坐標)-(邏輯原點坐標G的Y坐標)|……(12)差Yb=|(校正坐標Gc的Y坐標)-(校正坐標Ga的Y坐標)|……(13)(布局L2)差X′a=|(校正坐標Ha的X坐標)-(邏輯原點坐標H的X坐標)|……(14)差X′b=|(校正坐標Hc的X坐標)-(校正坐標Hb的X坐標)|……(15)差Ya=|(校正坐標Hb的Y坐標)-(邏輯原點坐標H的Y坐標)|……(16)差Yb=|(校正坐標Hc的Y坐標)-(校正坐標Ha的Y坐標)|……(17)
然后,所計算的差彼此進行比較以鑒別一些差是否一致。
這里,由于對于布局L1和布局L2,差Ya和Y′a不一致,并且差Yb和差Y′b不一致,故從布局L2的坐標中搜尋與布局L1的差Ya和Yb一致的差。
換言之,邏輯原點和校正坐標是從布局L2內(nèi)根據(jù)對于布局L1的邏輯原點抽取方法搜尋的(參照步驟C7和C8)。
如果作為搜尋的結(jié)果成功地檢測出一致的坐標,則在圖20(a)可見這些坐標用作為邏輯原點H′和校正坐標H′a。
另一方面,如果如果作為搜尋的結(jié)果沒有成功地檢測出一致的坐標,那么按上述類似的方式邏輯原點和校正坐標是從布局L1內(nèi)根據(jù)對于布局L2的邏輯原點抽取方法搜尋的(參照步驟C9和C10)。
要注意,如果用這一方法也不能成功地檢測出一致的坐標,則不進行布局之間的對比檢驗(步驟C11)。
這樣,由根據(jù)本發(fā)明的該實施例的原點抽取和對比檢驗處理,由于供處理的對象文件的布局分析是基于從圖象數(shù)據(jù)所抽取的劃線條款和條款數(shù)據(jù)進行的,并判定由布局分析所獲得的區(qū)域的轉(zhuǎn)角坐標中預(yù)定的坐標為邏輯原點坐標和校正坐標,故邏輯原點坐標和校正坐標也能夠從不同于其上印制有標記等專用文件的普通文件的圖象數(shù)據(jù)抽取。
而且,由于從多種邏輯原點抽取方法中動態(tài)地選擇一個優(yōu)化的方法,故能夠進行適合于供處理的對象文件布局的邏輯原點抽取。
此外,由于在邏輯原點抽取時,同時抽取校正坐標作為邏輯原點的補充信息,故在布局對比檢驗處理中邏輯原點之間對比檢驗時,能夠以一定的可靠性檢驗到一致性。
特別地,由于邏輯原點之間的對比檢驗是通過其中邏輯原點坐標相結(jié)合的校正坐標的相對坐標之間的對比檢驗進行的,故即使在圖象閱讀時發(fā)生位移,布局之間的對比檢驗處理也能夠可靠地進行。
而且,即使在因為有灰塵、污染等而邏輯原點不能正確地抽取之處,由于使用校正坐標根據(jù)對其它布局的邏輯原點抽取方法進行邏輯原點的再抽取,故能夠判定可被可靠地抽取的另一個點為邏輯原點。
要注意,雖然在本實施例中布局的左上轉(zhuǎn)角處的點判定為邏輯原點,但邏輯原點并不限于此,而是右上轉(zhuǎn)角,左下轉(zhuǎn)角或右下轉(zhuǎn)角也可判定為邏輯原點。
(a3)圖象數(shù)據(jù)旋轉(zhuǎn)校正處理的說明一般,在文件處理裝置等裝置中,如果供閱讀的對象文件的閱讀方向是不正確的方向,那么不能進行字符識別處理,因為圖象數(shù)據(jù)(圖象)的字符表示方向不是一個正確的方向。
因而,在根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置中,在上述的原點抽取處理時,判定所讀取的圖象的方向,而如果圖象的方向是錯誤的,則對于圖象要進行旋轉(zhuǎn)校正處理,使得圖象的方向能夠變?yōu)檎_的方向。因而,即使供閱讀的對象文件的閱讀方向是錯誤的,也能夠進行如下所述的圖象的布局分析處理和/或字符識別處理。
這里,圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理是由上述圖1和5中所示的布局分析處理部分2進行的。為了實現(xiàn)圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理,布局分析處理部分2包括判定所讀取的圖象的布局是否指向預(yù)定的的方向的步驟,以及基于前面步驟中判定結(jié)果旋轉(zhuǎn)所讀取的圖象數(shù)據(jù)的布局的步驟,使得該布局能夠指向預(yù)定的方向。
這里,其中標注出由本發(fā)明的數(shù)據(jù)媒體處理裝置30所進行的圖象數(shù)據(jù)的旋轉(zhuǎn)校正處理的功能框圖示于圖8和9。圖8為其中具有劃線條款的一文件要被處理的一功能框圖,而圖9是其中沒有劃線條款的另一文件要被處理的功能框圖。
當有劃線條款的一文件要被處理時,如圖8所示在數(shù)據(jù)媒體處理裝置30中,發(fā)揮作用的有以下部分圖象輸入部分301,圖象數(shù)據(jù)存儲器302,旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303,劃線抽取部分(劃線抽取部分)2C,劃線條款信息存儲部分304,劃線條款分析部分(表格結(jié)構(gòu)分析部分)2E,垂直/水平鑒別設(shè)置部分305,水平延伸劃線條款存儲部分306,圖象90度旋轉(zhuǎn)部分307,圖象180度旋轉(zhuǎn)部分308,及字符串識別模塊(字符識別處理模塊)17。
圖象輸入部分301讀取文件的圖象數(shù)據(jù)等。圖象數(shù)據(jù)存儲器302是供暫時存儲所讀取的圖象數(shù)據(jù)的一個存儲器。
旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303是一個用于存儲對其已經(jīng)進行了旋轉(zhuǎn)校正處理的圖象數(shù)據(jù)的存儲器。后來的布局識別處理,字符識別處理等等使用存儲在旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303中的圖象數(shù)據(jù)進行。
劃線條款抽取部分(劃線抽取部分)2C搜尋所讀取的圖象數(shù)據(jù),以便自動地抽取構(gòu)成由劃線所形成的最小矩形的劃線條款。劃線條款信息存儲部分304是用于存儲由劃線抽取部分2C所抽取的劃線條款信息的一個存儲器。
劃線條款分析部分(表格結(jié)構(gòu)分析部分)2E分析劃線條款信息存儲部分304中所存儲的劃線條款的形狀是垂直延伸形狀還是水平延伸形狀,以便判定圖象數(shù)據(jù)的閱讀方向是垂直閱讀方向還是水平閱讀方向。
在銀行、企業(yè)等中所處理的大部分票據(jù)、文件等通常是水平方向表示的。因而,劃線條款在大多數(shù)情形下是水平延伸的,于是水平延伸的劃線條款多于垂直延伸的劃線條款的狀態(tài)被設(shè)置為垂直/水平鑒別設(shè)置部分305的標準,并基于這樣設(shè)置的標準,鑒別圖象數(shù)據(jù)的閱讀方向。
水平延伸劃線條款存儲部分306存儲已經(jīng)被表格結(jié)構(gòu)分析處理部分2E判定為水平延伸的劃線條款的劃線條款。
在劃線條款被表格結(jié)構(gòu)分析處理部分2E判定為垂直延伸的劃線條款時,圖象90度旋轉(zhuǎn)部分307旋轉(zhuǎn)圖象數(shù)據(jù)90度以實現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
字符串識別處理部分17識別劃線條款中的字符,并當字符識別不能由字符識串別部分17成功地進行時,圖象180度旋轉(zhuǎn)部分308旋轉(zhuǎn)該圖象數(shù)據(jù)180度以便實現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
要注意,旋轉(zhuǎn)校正的圖象數(shù)據(jù)存儲到圖象數(shù)據(jù)存儲器302中和旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303中2,并類似于上述方式由劃線條款抽取部分2C,劃線條款分析部分2E以及字符串識別部分17進行處理。
另一方面,如圖9中可見當無劃線條款的另一文件要被處理時,在數(shù)據(jù)媒體處理裝置30中,發(fā)揮作用的有以下部分圖象輸入部分301,圖象數(shù)據(jù)存儲器302,旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303,標記部分309,標記信息存儲部分310,字符區(qū)域結(jié)合部分311,字符區(qū)域結(jié)合規(guī)則部分312,結(jié)合結(jié)果存儲部分313,字符串垂直/水平鑒別設(shè)置部分314,圖象90度旋轉(zhuǎn)部分307,圖象180度旋轉(zhuǎn)部分308,及字符串識別模塊(字符識別處理模塊)17。
圖象輸入部分301,圖象數(shù)據(jù)存儲器302及旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303具有上述類似的功能和結(jié)構(gòu)。
標記部分309對于從象素信息抽取相繼的點信息進行標記處理。標記信息存儲部分310是用于存儲由標記部分309所抽取的相繼點信息的一個存儲器。
字符區(qū)域結(jié)合部分311基于由標記部分309所抽取的相繼點信息根據(jù)由字符區(qū)域結(jié)合規(guī)則部分312所設(shè)置的結(jié)合規(guī)則結(jié)合相繼的字符為一字符串以抽取條款數(shù)據(jù)。結(jié)合結(jié)果存儲部分313存儲由字符區(qū)域結(jié)合部分311所抽取的條款數(shù)據(jù)。
特別地,標記部分309,標記信息存儲部分310,字符區(qū)域結(jié)合部分311,字符區(qū)域結(jié)合規(guī)則部分312及結(jié)合結(jié)果存儲部分313協(xié)同構(gòu)成條款數(shù)據(jù)抽取部分2D。
字符串垂直/水平鑒別部分314分析由字符區(qū)域結(jié)合部分311所抽取的條款數(shù)據(jù)的形狀是垂直延伸的形狀還是水平延伸的形狀以鑒別圖象數(shù)據(jù)的閱讀方向是垂直閱讀方向還是水平閱讀方向。
而且,當條款數(shù)據(jù)的字符串由字符串垂直/水平鑒別部分314判定為垂直延伸的字符串時,圖象90度旋轉(zhuǎn)部分307旋轉(zhuǎn)該圖象數(shù)據(jù)90度以實現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
字符串識別部分17識別條款數(shù)據(jù)中的字符。當字符識別不能由字符串識別部分17成功地進行時,圖象180度旋轉(zhuǎn)部分308旋轉(zhuǎn)圖象數(shù)據(jù)180度以實現(xiàn)對圖象數(shù)據(jù)的旋轉(zhuǎn)校正。
要注意,旋轉(zhuǎn)校正的圖象數(shù)據(jù)存儲到圖象數(shù)據(jù)存儲器302和旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303并由標記部分309,字符區(qū)域結(jié)合部分311,字符串垂直/水平鑒別部分314和字符串識別部分17以類似于上述方式處理。
在具有上述結(jié)構(gòu)的根據(jù)本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置中,如果圖象數(shù)據(jù)從圖象輸入部分301輸入,則劃線條款或條款數(shù)據(jù)從圖象數(shù)據(jù)抽取。
這里,在圖象數(shù)據(jù)包含劃線條款之處,劃線條款由劃線條款抽取部分2C抽取,并且由表格結(jié)構(gòu)分析部分2E分析,由表格結(jié)構(gòu)分析部分2E所抽取的劃線條款的形狀是垂直延伸形狀還是水平延伸形狀的哪一個。
然后,在分析出劃線條款形狀為垂直延伸形狀之處,圖象數(shù)據(jù)由圖象90度旋轉(zhuǎn)部分307旋轉(zhuǎn)校正90度。
另一方面,在分析出劃線條款的形狀為水平延伸形狀之處,劃線條款的字符識別由字符串識別部分17進行,但是當字符識別不能成功地進行時,該圖象數(shù)據(jù)由圖象180旋轉(zhuǎn)部分308旋轉(zhuǎn)校正180度。
此外,在圖象數(shù)據(jù)不包含劃線條款之處,條款數(shù)據(jù)由字符區(qū)域結(jié)合部分311抽取,并由字符區(qū)域結(jié)合分析部分311分析由字符區(qū)域結(jié)合部分311所抽取的條款數(shù)據(jù)的形狀是垂直延伸形狀還是水平延伸形狀的哪一個。
這里,在分析出條款數(shù)據(jù)的形狀為水平延伸形狀之處,劃線條款的字符識別由字符串識別部分17進行,但是當字符識別不能成功地進行時,該圖象數(shù)據(jù)由圖象180旋轉(zhuǎn)部分308旋轉(zhuǎn)校正180度。
然后將參照圖12和13所示的流程圖進而說明該數(shù)據(jù)媒體處理裝置30的圖象數(shù)據(jù)旋轉(zhuǎn)校正處理。
首先,進行待處理的供圖象識別的票據(jù),文件等的圖象數(shù)據(jù)閱讀(步驟G1)。要注意,票據(jù)、文件等的表可能從任何方向被閱讀。
例如,當閱讀具有如圖10所示的這種劃線條款的文件320時,所讀取的圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302(步驟G2)。要注意,只有在第一次閱讀時,同一圖象數(shù)據(jù)也存儲到旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303中(步驟G3)。
然后,抽取圖象數(shù)據(jù)中的劃線條款(例如在圖10中,表示出劃線條款M)。
這里,如果成功地抽取了劃線條款,則劃線條款信息存儲到劃線條款信息存儲部分304(步驟G5和G6)。
表格結(jié)構(gòu)分析部分2E基于存儲在劃線條款信息存儲部分304的劃線條款信息分析每一劃線條款的形狀,并對劃線條款是垂直延伸還是水平延伸的劃線條款進行鑒別及分類(步驟G7和G8)。然后,在劃線條款信息的劃線條款為水平延伸的劃線條款之處,它存儲到水平延伸的劃線條款存儲部分306(步驟G9)。
進而,表格結(jié)構(gòu)分析部分2E基于由垂直/水平鑒別設(shè)置部分305所設(shè)置的標準鑒別水平延伸的劃線條款數(shù)目是否大于垂直延伸的劃線條款數(shù)目以便鑒別圖象數(shù)據(jù)的閱讀方向是正確還是錯誤(步驟G10)。
這里,如果表格結(jié)構(gòu)方向部分2E鑒別出水平延伸的劃線條款較大,則由字符串識別部分17進行字符識別(從步驟G10的YES途徑到步驟G11)。
如果由字符串識別部分17成功地進行了字符的識別,則判定圖象數(shù)據(jù)的閱讀方向是正常的(步驟G12的YES途徑)。
另一方面,如果由字符串識別部分17沒有成功地進行字符的識別,則由于有可能圖象已經(jīng)旋轉(zhuǎn)了180度(即圖象被垂直地反轉(zhuǎn)),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,圖象180度旋轉(zhuǎn)部分308對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G14)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G4到G12)。
另一方面,如果由表格結(jié)構(gòu)分析部分2E鑒別出垂直于是的劃線條款數(shù)目較大,則待存儲到圖象數(shù)據(jù)存儲器302的圖象數(shù)據(jù)由圖象90度旋轉(zhuǎn)部分308進行90度的旋轉(zhuǎn)校正(步驟G13)。于是,旋轉(zhuǎn)后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述的處理的處理(步驟G4到G12)。
然后,如果在進行了90度旋轉(zhuǎn)校正處理之后對圖象數(shù)據(jù)仍沒有成功地由字符串識別部分17進行字符的識別,則由于有可能圖象處于旋轉(zhuǎn)了180度的狀態(tài),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,圖象180度旋轉(zhuǎn)部分308對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G14)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G4到G12)。
另一方面,如果在上述步驟G5沒有成功地抽取劃線條款,則由于其中存在這樣的情形,例如讀取到如圖11所示沒有劃線條款的文件321,則進行以下的處理以抽取條款數(shù)據(jù)。
首先,標記部分309從存儲在旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)抽取標記信息(例如圖11中所示的標記信息N)(從步驟G5的NO途徑到圖13的步驟G15)。所抽取的標記信息存儲到標記信息存儲部分310(步驟G16)。
然后,字符區(qū)域結(jié)合部分311基于字符區(qū)域結(jié)合規(guī)則部分312的規(guī)則結(jié)合存儲在標記信息存儲部分310中的標記信息的各個片斷為一個字符串。于是,抽取條款數(shù)據(jù)(例如,圖11中,其中七個標記信息片斷“出”,“張”,“旅”,“費”,“精”,“算”,和“書”被結(jié)合為一個字符串的字符區(qū)域的結(jié)合結(jié)果(“出張旅費精算書”)表示為條款數(shù)據(jù))(步驟G17),并且該結(jié)合結(jié)果存儲到結(jié)合結(jié)果存儲部分313(步驟G18)。
進而,字符串垂直/水平鑒別部分314鑒別水平延伸的條款數(shù)據(jù)數(shù)目是否大于垂直延伸的條款數(shù)據(jù)的數(shù)目以鑒別圖象數(shù)據(jù)的閱讀方向是正確還是錯誤的(步驟G19)。
這里,如果由字符串垂直/水平鑒別部分314鑒別出水平延伸的條款數(shù)據(jù)的數(shù)目較大,則由字符串識別部分17進行字符識別(步驟G20)。
如果由字符串識別部分17成功地進行了字符識別,則判定圖象數(shù)據(jù)的閱讀方向是正常的(步驟G21)。
反之如果由字符串識別部分17沒有成功地進行字符的識別,則由于有可能圖象處于旋轉(zhuǎn)了180度的狀態(tài),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G23)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G15到G21)。
另一方面,如果由字符串垂直/水平鑒別部分314鑒別出垂直延伸的條款數(shù)據(jù)的數(shù)目較大,則存儲在圖象數(shù)據(jù)存儲器302中的圖象數(shù)據(jù)由圖象80度旋轉(zhuǎn)部分308旋轉(zhuǎn)校正90度(步驟G22)。于是,旋轉(zhuǎn)之后的圖象數(shù)據(jù)此后存儲到旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G15到G21)。
然后,如果在90度旋轉(zhuǎn)校正處理進行之后對圖象數(shù)據(jù)仍不能由字符串識別部分17進行字符的識別,則由于有可能圖象處于旋轉(zhuǎn)了180度的狀態(tài),在圖象數(shù)據(jù)一次存儲到圖象數(shù)據(jù)存儲器302之后,由圖象180度旋轉(zhuǎn)部分308對已旋轉(zhuǎn)的圖象數(shù)據(jù)存儲器303的圖象數(shù)據(jù)作180度的旋轉(zhuǎn)校正(步驟G23)。于是,旋轉(zhuǎn)180度之后的圖象數(shù)據(jù)此后被存儲到旋轉(zhuǎn)圖象數(shù)據(jù)存儲器303并經(jīng)受類似于上述處理的處理(步驟G15到G21)。
這樣,使用根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置30,從讀取的圖象數(shù)據(jù)中抽取劃線條款或者條款數(shù)據(jù),并鑒別所抽取的劃線條款或條款數(shù)據(jù)的形狀是為水平延伸形狀還是垂直延伸形狀。如果劃線條款或條款數(shù)據(jù)的形狀為垂直延伸形狀,則對圖象數(shù)據(jù)進行90度的旋轉(zhuǎn)校正。然后,如果即使在劃線條款或條款數(shù)據(jù)的形狀為水平延伸的形狀之處也不能成功地進行字符識別,則進行圖象數(shù)據(jù)的180度旋轉(zhuǎn)校正。于是,從圖象數(shù)據(jù)究竟在什么方向被讀取,可自動地鑒別圖象數(shù)據(jù)的閱讀方向,并當圖象數(shù)據(jù)的閱讀方向錯誤時,圖象數(shù)據(jù)能夠自動地被旋轉(zhuǎn)校正。結(jié)果,數(shù)據(jù)媒體處理裝置30的優(yōu)點在于,可以避免由操作者進行確認和旋轉(zhuǎn)校正操作,并可有效地由客戶機-服務(wù)器系統(tǒng)進行文件的自動處理。
(a4)矩陣對比檢驗處理的說明一般在文件處理裝置等裝置中,由于在供處理的對象文件的布局與存儲在布局DB等之中的布局之間進行對比檢驗處理時,對各個布局的成分(劃線條款,條款數(shù)據(jù)等)相繼進行對比檢驗,以實現(xiàn)坐標,尺寸等等之間的比較,在布局的成分數(shù)(N)增加時,對比檢驗操作的次數(shù)增加得很多,因而大量文件的布局對比檢驗處理不能以高速進行。
于是,在根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置30中,作為布局成分之一的劃線條款布局被壓縮處理并表示為矩陣表,并在布局之間對比檢驗時,它們的矩陣表彼此進行對比檢驗,使得大量文件布局的對比檢驗處理能夠以高速進行。
這里,根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置30是這樣構(gòu)造的布局對比檢驗處理部分3對由布局分析處理部分2所抽取的劃線條款的布局進行壓縮處理以將其表示為一個矩陣表,并使用該矩陣表作為限制檢索項目檢索存儲在布局DB 14中參照矩陣表以便對比檢驗是否存在相符的矩陣表。基于對比檢驗的結(jié)果,字符識別處理模塊17鑒別在特定位置的圖象信息。
這里,在圖22中示出其中標注了根據(jù)本實施例的數(shù)據(jù)媒體處理裝置30的矩陣對比檢驗處理的處理過程示意圖。
在數(shù)據(jù)媒體處理裝置30中,如圖22所示,如果首先閱讀供處理的對象文件并輸入分析對象的圖象數(shù)據(jù)19,然后布局分析處理部分2分析所輸入的圖象數(shù)據(jù)以抽取劃線部分并抽取由劃線部分所形成的矩形作為劃線條款。
這時,從劃線部分等計算圖象的傾斜度,并對所抽取的各個劃線條款的坐標位置進行傾斜校正。進而,抽取布局的邏輯原點和校正坐標,并作為布局信息設(shè)置校正的劃線條款的坐標位置,邏輯原點和校正坐標(步驟F1)。
然后,布局對比檢驗處理部分3對于對應(yīng)于輸入的圖象數(shù)據(jù)產(chǎn)生一個10 DPI(每英寸點數(shù))的位表,并在位表上對應(yīng)的位置處布局信息的最低行中標繪出各個劃線條款的左上坐標和劃線條款的右下坐標。
進而,根據(jù)在一行中是否存在數(shù)據(jù)對所產(chǎn)生的位表進行壓縮處理,并根據(jù)行的構(gòu)造規(guī)律在行方向上進行壓縮處理以產(chǎn)生一矩陣表(步驟F2)。
這樣壓縮的矩陣表與其它布局信息一同存儲到布局DB 14(步驟F3)。
要注意,上述的步驟F1對應(yīng)于圖2所示的步驟A2,而上述的步驟F2和F3對應(yīng)于圖2所示的步驟A3。
進而,在數(shù)據(jù)媒體處理裝置30中,如果讀取了供對比檢驗的對象文件并輸入了方向?qū)ο蟮膱D象數(shù)據(jù)19,那么布局分析處理部分2進行類似于上述步驟F1的處理,并設(shè)置劃線條款的坐標位置,邏輯原點和校正坐標作為布局信息(步驟F4)。
然后,布局對比檢驗處理部分3對所輸入的圖象數(shù)據(jù)進行類似于上述步驟F2的處理以產(chǎn)生一矩陣表(步驟F5)。
這里,布局對比檢驗處理部分3從布局DB 14讀出對比檢驗對象的矩陣表并參照布局的各個邏輯原點以行為單元對比檢驗位位置,以實現(xiàn)在讀取的對比檢驗對象的矩陣表與在上述步驟F5中產(chǎn)生的矩陣表之間的對比檢驗。
進而,從矩陣表的位位置對比檢驗的結(jié)果計算出的關(guān)于所有對比檢驗位的數(shù)目計算出相符的位數(shù)目,并作為矩陣表相符比例輸出對比檢驗結(jié)果200(步驟F6)。
要注意,上述的步驟F4對應(yīng)于圖2中所示的步驟A9,而上述的步驟F5和F6對應(yīng)于圖2中所示的步驟A10。
這里,將參照圖23說明上述步驟F2和F5中的矩陣表產(chǎn)生處理。
首先,從作為矩陣表產(chǎn)生對象的一個圖象抽取劃線,并從所抽取的劃線抽取劃線條款(由劃線所形成的最小矩形區(qū)域)。這時,基于布局的傾向度信息對于所抽取的劃線條款的各個坐標進行傾斜校正(步驟F21)。
然后,校驗布局上的每一劃線的線性以獲得劃線的變形率,并對在步驟F21中校正的劃線條款傾斜的坐標進行變形校正(步驟F22)。
進而,參照形成劃線條款的水平劃線以設(shè)置其上面的劃線共同具有相同的劃線以至它們都具有相同的數(shù)值的那些劃線條款的左上轉(zhuǎn)角Y坐標數(shù)值,以實現(xiàn)如圖24(a)中所見的Y坐標的正規(guī)化(步驟F23)。參照形成劃線條款的垂直劃線以設(shè)置其左側(cè)的劃線共同具有相同的劃線以至它們都具有相同的數(shù)值的那些劃線條款的左上轉(zhuǎn)角X坐標數(shù)值,以實現(xiàn)如圖24(b)中所見的X坐標的正規(guī)化(步驟F24)。
特別地,在本實施例中,在其上反映出劃線條款的布局的位表壓縮處理之前,對所讀取的圖象數(shù)據(jù)進行傾斜校正和變形校正處理(參照步驟F21和F22),并然后參照形成劃線條款的水平劃線,以便對其上面的劃線共同具有相同的劃線的那些劃線條款進行Y坐標的歸一化處理(參照步驟F23),此后參照形成劃線條款的垂直劃線,以便對其左側(cè)劃線共同具有相同劃線的那些劃線條款進行X坐標的歸一化處理(參照步驟F24),以便吸收在閱讀圖象數(shù)據(jù)中所產(chǎn)生的布局中的變化。
進而,對于布局上的所有的劃線條款,根據(jù)在具有相同Y坐標劃線條款的單元中位表指定的分辨率對劃線條款的左上轉(zhuǎn)角的坐標進行坐標轉(zhuǎn)換(位串轉(zhuǎn)換),并在圖25中所見的表對應(yīng)的位置處設(shè)置位。
這時,設(shè)置被轉(zhuǎn)換的劃線條款的Y坐標之間的距離以便如圖26中所見排列管理信息J(步驟F25)。
這里,對由步驟F25中的轉(zhuǎn)換所產(chǎn)生的位表進行處理以便如圖27中所見從頂行開始相繼進行行的比較,并且具有相同位結(jié)構(gòu)的相繼的行在行方向被壓縮為一行以產(chǎn)生壓縮的系位信息K,并作為行壓縮信息向行管理信息J設(shè)置壓縮完成標志Q(步驟F26)。
然后如圖28中所見,作為一個矩陣表設(shè)置這樣產(chǎn)生的包含壓縮行位信息K和行管理信息J的矩陣表信息S(步驟F27)。
特別地,在本實施例中,在劃線條款的布局壓縮處理時,劃線條款的布局被轉(zhuǎn)換為對應(yīng)的位串,而對位串進行壓縮處理。然后,這樣壓縮處理的位表設(shè)置為矩陣表。于是,在布局對比檢驗時對比檢驗操作的數(shù)目只是與對比檢驗對象的布局的數(shù)目成比例地線性增加,而不依賴于布局的成分數(shù)目(N),于是能夠以高速進行大量文件布局的對比檢驗處理。
進而,將參照圖29和30的流程圖說明上述步驟F6中的矩陣表對比檢驗處理。
首先,布局對比檢驗處理部分3產(chǎn)生并獲得例如在圖31(a)中所見那樣的對比檢驗源矩陣信息,并設(shè)置壓縮的對比檢驗源矩陣信息的行位信息(K1)為對比檢驗源工作區(qū)域(步驟D1)。
進而,例如從布局DB 14取得如圖31(b)中所示的那種對比檢驗?zāi)繕司仃囆畔?,并向一個對比檢驗?zāi)繕斯ぷ鲄^(qū)設(shè)置壓縮的對比檢驗?zāi)繕司仃囆畔⒌男形恍畔?K′1)(步驟D2)。
然后,布局對比檢驗處理部分3相繼地對壓縮的行位信息(K1)和(K′1)從頂位開始進行比較和對比檢驗以實現(xiàn)對一行的對比檢驗(步驟D3)。
這里,如果壓縮的行位信息(K1)和(K′1)表現(xiàn)不相符,則設(shè)置不相符作為對比檢驗的結(jié)果200(參照圖22)(步驟D4和D10)。然而,由于這里的壓縮的行位信息(K1)和(K′1)是相符的,故基于行管理信息J向?qū)Ρ葯z驗源工作區(qū)設(shè)置對比檢驗源壓縮的行位信息K(步驟D4和D5)。
在步驟D5,參照行管理信息J(步驟E1),并且如果對于對應(yīng)的行管理信息J設(shè)置壓縮完成標記Q,則鑒別出該行是壓縮行,并向?qū)Ρ葯z驗源工作區(qū)設(shè)置最后對比檢驗的行的壓縮行位信息K(步驟E2和E4)。然而,如果對于行管理信息J的對應(yīng)的行沒有設(shè)置壓縮完成標志Q,則鑒別出該行為非壓縮行,并向?qū)Ρ葯z驗源工作區(qū)設(shè)置新的的對應(yīng)行的壓縮行位信息K(步驟E2和E3)。
進而,還基于行管理信息J′向?qū)Ρ葯z驗?zāi)繕斯ぷ鲄^(qū)設(shè)置對比檢驗?zāi)繕藟嚎s行位信息K′(步驟D6)。
而且在步驟D6,類似于上述步驟D5,參照行管理信息J′(步驟E1),并且如果對于對應(yīng)的行管理信息J′設(shè)置壓縮完成標記Q′,則鑒別出該行是壓縮行,并向?qū)Ρ葯z驗源工作區(qū)設(shè)置最后對比檢驗的行的壓縮行位信息K′(步驟E2和E4)。然而,如果對于行管理信息J′的對應(yīng)的行沒有設(shè)置壓縮完成標志Q′,則鑒別出該行為非壓縮行,并向?qū)Ρ葯z驗源工作區(qū)設(shè)置新的的對應(yīng)行的壓縮行位信息K′(步驟E2和E3)。
如果對于所有的行壓縮行位信息K和K′標記的結(jié)果證實在固定區(qū)域內(nèi)所有的行是彼此相符的,則設(shè)置一致性作為對比檢驗結(jié)果200(步驟D7到D9)。
反之,如果在比較處理中發(fā)現(xiàn)不一致或者比較對象之一的行位信息在比較完成之前結(jié)束,則設(shè)置不一致性作為對比檢驗結(jié)果200(步驟D7、D8和D10)。
這樣,使用根據(jù)本發(fā)明的該實施例的媒體處理裝置的矩陣對比檢驗處理,由于作為布局成分之一的劃線條款的布局被壓縮處理以至表示為矩陣表,并在布局比較時,對矩陣表彼此之間進行對比檢驗,故布局的對比檢驗處理速度僅僅對對象布局對比檢驗的數(shù)目成比例地增加,而不依賴于劃線條款的數(shù)目。于是,能夠以高速進行大量文件的布局對比檢驗處理。
這時,由于對比檢驗對象布局表示在構(gòu)成布局的劃線條款中,故布局可穩(wěn)定地被表示。
而且,由于在其上反映出劃線條款的布局的位表的壓縮處理之前,對讀取的圖象數(shù)據(jù)進行傾斜校正和變形校正處理,并對各個劃線條款進行Y坐標歸一化處理及X坐標歸一化處理,故在閱讀圖象時所產(chǎn)生的布局中的變化可被吸收。
進而,由于根據(jù)一階文件的特征壓縮位表,故文件中的布局成分的數(shù)目能夠有效地壓縮表示。
(a5)特征數(shù)據(jù)識別處理的說明一般,在字符識別裝置中,由于普通的字符構(gòu)成一個識別對象,必須使用考慮了識別率的用于識別對象所產(chǎn)生的字典,而任意動態(tài)指定的圖形形式是不能被識別的。
而且,由于識別對象事先假設(shè)為字符,就存在諸如識別對象區(qū)域方面的限制以及設(shè)定供識別的定義對象方面的限制,而任意的區(qū)域是不能設(shè)定為識別對象的。
因而,根據(jù)本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置30是這樣構(gòu)造的,使得包含在字符識別處理中不能識別字符的區(qū)域圖象(布局),圖形形式等作為特征數(shù)據(jù)被記錄,同時對應(yīng)于該特征數(shù)據(jù)的代碼數(shù)據(jù)作為對布局附加的信息被記錄,并在布局對比檢驗處理時,進行布局的特征數(shù)據(jù)之間的對比檢驗,并在發(fā)現(xiàn)相符的特征數(shù)據(jù)時,取得對應(yīng)于特征數(shù)據(jù)的代碼數(shù)據(jù)并在顯示器上顯示為識別的結(jié)果,于是在字符識別處理中不能被識別的字符,圖形形式等。
其中標注了根據(jù)本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置30的特征數(shù)據(jù)識別處理的處理示意圖示于圖32中。
在根據(jù)本實施例的數(shù)據(jù)媒體處理裝置30中,如圖32所示,由右下步驟進行特征數(shù)據(jù)識別處理通過學(xué)習(xí)處理向布局DB 14記錄特征數(shù)據(jù)的記錄步驟(步驟H1,A6和H2),以及對比檢驗記錄的特征數(shù)據(jù)是否包含與分開讀取的圖形相符的特征數(shù)據(jù)的對比檢驗步驟(步驟H3)。
在記錄步驟中,抽取所讀取的圖象布局中的特征以便分析布局的結(jié)構(gòu)(步驟H1),并且所分析的布局顯示在一形式單元403上(步驟A6)。然后,如圖33所示,進行布局學(xué)習(xí)處理(步驟H2),以便對于所顯示的布局結(jié)構(gòu)設(shè)置預(yù)定的的特征數(shù)據(jù)記錄區(qū)域T(在圖33中由斜線所表示),并且借助于外部輸入裝置404輸入對應(yīng)于區(qū)域T中的標記信息(在圖33中“富士通株式會社”)的代碼數(shù)據(jù)U[在圖33中,“Fujitsu(Ltd)”],此后從特征數(shù)據(jù)識別區(qū)域T和代碼數(shù)據(jù)U產(chǎn)生區(qū)域特征數(shù)據(jù),并以同上述分析的布局結(jié)構(gòu)相鏈接的狀態(tài)被記錄。
在根據(jù)本實施例的數(shù)據(jù)媒體處理裝置30中,通過在區(qū)域特征數(shù)據(jù)的識別時對于特征數(shù)據(jù)識別區(qū)域T進行歸一化處理,能夠在對比檢驗步驟可靠地進行區(qū)域特征數(shù)據(jù)的對比檢驗,這將在以下說明。
在這一記錄步驟,由于在輸入對應(yīng)于標記信息的代碼數(shù)據(jù)U時向上述區(qū)域T輸入了具有對應(yīng)于標記信息意義的代碼數(shù)據(jù),故如果它識別出特征數(shù)據(jù)識別區(qū)域T,作為識別的結(jié)果數(shù)據(jù)媒體處理裝置30能夠在屏幕上顯示出對應(yīng)的代碼數(shù)據(jù)。
另一方面,在對比檢驗步驟中,在上述的記錄步驟之后,抽取分開讀取的圖象特征,并然后使用在記錄步驟所記錄的區(qū)域特征數(shù)據(jù)和布局結(jié)構(gòu)作為參照數(shù)據(jù)檢索布局DB 14以便對比檢驗是否有相符的布局。
當具有上述結(jié)構(gòu)的根據(jù)本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置30實現(xiàn)特征數(shù)據(jù)識別處理時,通過學(xué)習(xí)處理字符數(shù)據(jù)記錄到布局DB14,并對比檢驗是否有某個記錄的特征數(shù)據(jù)與分開讀取的圖象相符。然后,如果發(fā)現(xiàn)了相符的特征數(shù)據(jù),則取得對應(yīng)于該特征數(shù)據(jù)的代碼數(shù)據(jù)并作為識別的結(jié)果顯示在顯示對于403上。
將參照圖32到34更為詳細地說明數(shù)據(jù)媒體處理裝置30這時的操作。
特別地,如圖32中所見,如果布局分析的一個對象文件圖象19是新讀取的,則布局分析處理部分2分析該對象文件的布局以產(chǎn)生布局信息(步驟H1)。
這里,在操作者確認/校正處理模塊18(參照圖1)中,一文件的圖象及所分析的圖象信息顯示在顯示對于403上,并且如圖33中所見,由操作者設(shè)置一個特征數(shù)據(jù)識別區(qū)域T(“富士通株式會社”),并從外部輸入裝置404輸入對應(yīng)的代碼數(shù)據(jù)U[“Fujitsu(Ltd)”](步驟H6)。
進而,布局記錄信息產(chǎn)生處理部分11從由操作者指定的區(qū)域T和輸入的代碼數(shù)據(jù)U產(chǎn)生區(qū)域特征數(shù)據(jù),并學(xué)習(xí)該區(qū)域特征數(shù)據(jù),且作為布局校正數(shù)據(jù)與由布局識別處理模塊16所取得的布局信息一同記錄到布局DB 14(步驟H2)。
于是,在記錄步驟中的操作是由操作者確認/校正處理模塊18和上述布局記錄信息產(chǎn)生處理部分11進行的。
在區(qū)域特征數(shù)據(jù)這樣記錄到布局DB 14之后,如果再次讀取與上述處理的相同的文件圖象19,則布局分析處理部分2分析該對象文件并產(chǎn)生布局信息。
進而,布局對比檢驗處理部分3使用所分析的布局信息作為檢索項檢索布局DB 14以便取得對于在步驟H2學(xué)習(xí)和記錄的文件的布局校正信息。
這里,對于所取得的布局校正信息的區(qū)域特征數(shù)據(jù)是否包含對應(yīng)于要被分析的文件的圖象的區(qū)域特征數(shù)據(jù)進行對比檢驗。如果對比檢驗的結(jié)果證實某個區(qū)域特征數(shù)據(jù)滿足與要被分析的文件圖象相符的項,則對應(yīng)于該區(qū)域特征數(shù)據(jù)的代碼數(shù)據(jù)U設(shè)置為布局識別結(jié)果(步驟H3)。
然后,在操作者確認/校正處理模塊18中,所讀取的文件圖象和布局識別結(jié)果20顯示在顯示單元403上,并且如圖34所見以類似于一般字符識別結(jié)果22的方式,在顯示單元403上作為特征數(shù)據(jù)識別結(jié)果顯示出特征數(shù)據(jù)識別區(qū)域T及對應(yīng)的代碼數(shù)據(jù)U(步驟A13)。
這樣,利用根據(jù)本發(fā)明該實施例的媒體處理裝置的特征數(shù)據(jù)識別處理,在功能上擴充了類似于字符識別裝置的區(qū)域圖象特征抽取機制和特征對比檢驗機制,并且與布局識別系統(tǒng)相結(jié)合,使得在記錄步驟由操作者所指定的特征數(shù)據(jù)識別區(qū)域T和對應(yīng)的代碼數(shù)據(jù)U(識別結(jié)果代碼)被動態(tài)地學(xué)習(xí)并與布局分析分結(jié)果一同記錄到布局DB14,并在要對具有所學(xué)習(xí)布局相同布局的文件進行識別時,在對比檢驗步驟從布局DB 14與布局信息一同取得區(qū)域特征數(shù)據(jù),并對該區(qū)域特征數(shù)據(jù)與識別對象的文件圖象的區(qū)域進行對比檢驗,此后取得對應(yīng)的代碼數(shù)據(jù)U作為對比檢驗的結(jié)果并作為識別的結(jié)果被設(shè)置且輸出,于是允許在指定的區(qū)域中的圖形形式的圖象的識別處理與布局識別處理相關(guān)聯(lián)地進行。
特別地,通過記錄任意指定區(qū)域的圖象作為識別對象區(qū)域,該任意區(qū)域可被識別以取得對應(yīng)的代碼數(shù)據(jù)而無需限于字符,并通過動態(tài)地對識別對象區(qū)域與布局信息一同學(xué)習(xí)到布局DB 14中,當布局再次出現(xiàn)時,能夠與布局識別處理相關(guān)聯(lián)地進行識別對象區(qū)域的識別處理。
進而,在本實施例中,由于對比檢驗的對象的區(qū)域特征數(shù)據(jù)與布局信息相關(guān)聯(lián)地被記錄,故對比檢驗的對象能夠限制在布局單元中,并從而無需進行如普通的字符識別裝置所需的大量對比檢驗處理,而能夠達到高的識別率。
此外,由于多個識別對象區(qū)域可設(shè)置在同一文件中,使得其數(shù)據(jù)具有關(guān)聯(lián)關(guān)系,故能夠彼此匹配地記錄布局中識別對象區(qū)域的位置信息和數(shù)據(jù)結(jié)構(gòu)。
要注意,上述這種特征數(shù)據(jù)識別處理也能夠用于′kanji′條款的′kana′識別處理,或者交換一般轉(zhuǎn)帳文件的客戶/接受者(recipient)的識別處理。
特別地,當文件上的′kanji′條款要作為特征數(shù)據(jù)被識別時,則進入到′kanji′的條款的區(qū)域被指定為特征區(qū)域,并且對應(yīng)的代碼數(shù)據(jù)輸入到′kana′,并且特征數(shù)據(jù)與代碼數(shù)據(jù)被學(xué)習(xí)且與文件的布局信息一同被記錄。
在采用這一對策之處,如果對具有與另一個被學(xué)習(xí)和識別的文件的布局相同布局的文件進行布局識別,則′kana′的代碼數(shù)據(jù)能夠作為′kanji′的條款的特征區(qū)域的識別結(jié)果而取得。
進而,類似于′kanji′的條款的特征數(shù)據(jù)識別處理的情形,如果橡皮圖章、簽字等的條款指定為特征數(shù)據(jù)識別條款,則不能通過普通字符識別被識別的橡皮圖章、簽字等的條款能夠被識別,并且對應(yīng)的代碼數(shù)據(jù)能夠作為橡皮圖章、簽字等的特征區(qū)域的識別結(jié)果而取得。
此外,在交換一般的轉(zhuǎn)帳文件中,要被輸入的客戶的全名或者接受者的全名條款是沒有任意組合的,但是具有與文件相關(guān)的關(guān)系(參見圖35和36)。
于是,通過學(xué)習(xí)和記錄,當客戶或者接受者的全名要作為特征數(shù)據(jù)識別條款、在鏈接關(guān)系中它們的關(guān)系被學(xué)習(xí)和記錄時,在特征數(shù)據(jù)對比檢驗時能夠進行高精度的識別。
(a6)標題分析處理的說明在根據(jù)本發(fā)明該數(shù)據(jù)媒體處理裝置30中,是自動地進行標題分析處理的,其中從分析對象文件圖象的劃線條款結(jié)構(gòu)和對應(yīng)于文件上所輸入的標題的條款信息搜尋并對比檢驗標題位置。
這里,根據(jù)本實施例的數(shù)據(jù)媒體處理裝置30包括布局分析處理步驟A2(或者A9)邏輯表示讀取的圖象布局,以及布局對比檢驗處理步驟A3(或者A10)對比檢驗在布局DB 14中是否存在與讀取的圖象的布局相符的布局。該布局分析處理步驟A2(或者A9)抽取讀取的圖象布局的劃線條款,分析布局的結(jié)構(gòu),從抽取的劃線條款判定圖象中的標題區(qū)域,識別標題區(qū)域中的標題條款信息以判定對應(yīng)的條款數(shù)據(jù)并邏輯表示該布局,而這些是由布局分析處理部分2的布局分析部分2B實現(xiàn)的。
該布局分析處理步驟A2(或者A9)包括基于布局結(jié)構(gòu)分析的結(jié)果判定標題位置備選項的標題位置備選判定步驟,以及標題條款對比檢驗步驟,在該步驟對標題區(qū)域中的標題條款信息與在標題位置備選判定步驟所判定的標題位置備選項進行對比檢驗。
要注意,標題條款對比檢驗步驟中的標題條款的對比檢驗處理,是在標題條款對比檢驗步驟中,對要被對比檢驗的圖象數(shù)據(jù)按上述參照圖49那種方式進行正規(guī)化處理之后實現(xiàn)的。
另一方面,布局對比檢驗處理步驟A3(或者A10)應(yīng)用在布局分析處理步驟所抽取的布局的劃線條款作為檢索限制項而檢索布局DB 14中存儲的備選布局,要被對比檢驗是否有相符的備選布局,而這是由布局對比檢驗處理部分3實現(xiàn)的。
這里,在圖37中示出標注出根據(jù)本實施例的數(shù)據(jù)媒體處理裝置30布局分析處理部分2的布局分析部分2B的標題分析處理的示意圖。
如在圖37中所見,布局分析部分2B進行作為標題位置備選判定步驟K9的處理,這包括劃線條款結(jié)構(gòu)分析處理(步驟K1)以及條款標題位置搜尋處理(步驟K2),并然后進行作為標題條款對比檢驗步驟K10的處理,這包括條款標題對比檢驗處理(K3),超復(fù)數(shù)特征數(shù)據(jù)抽取對比檢驗處理(步驟K4),標題對比檢驗結(jié)果校正處理(步驟K5),條款數(shù)據(jù)位置搜尋處理(步驟K6),條款數(shù)據(jù)部分鏈接處理(步驟K7)及款額條款鏈接處理(步驟K8)。
分析字典13存儲標題搜尋規(guī)則505,條款標題字典507,標題校正規(guī)則508以及數(shù)據(jù)搜尋規(guī)則509。
在劃線條款結(jié)構(gòu)分析處理(步驟K1)中,參照通過布局分析所獲得的劃線條款信息502和表格結(jié)構(gòu)信息(未示出)而產(chǎn)生一劃線條款結(jié)構(gòu)信息表(劃線條款結(jié)構(gòu)信息TBL)503作為以標題位置搜尋規(guī)則待評價的規(guī)則關(guān)鍵信息,這將在以下說明。
作為由布局分析部分2B的表格結(jié)構(gòu)分析部分2E表格結(jié)構(gòu)分析的一個結(jié)果,示于圖38的這種結(jié)構(gòu)信息被添加到各個劃線條款中。
以下將參照圖38說明劃線條款信息502。劃線條款I(lǐng)D是用于各個劃線條款標識的ID信息,并在劃線條款抽取時進行唯一的編號。組ID是當劃線條款被分組時加到相同組的標識ID。塊ID是用于各個單元之間標識的ID,同一組被劃分為單元而具有相同劃線條款結(jié)構(gòu)。
表格結(jié)構(gòu)表示由一個組ID標識的劃線條款是否具有一表格結(jié)構(gòu),并為了防止表格結(jié)構(gòu)的存在與不存在之間的鑒別被固定,表格結(jié)構(gòu)的存在與不存在之間的鑒別以條款行數(shù)/條款列數(shù)進行。要注意,條款行數(shù)表示劃線條款表格的行結(jié)構(gòu)以一組的表格矩形出現(xiàn),而條款列數(shù)表示劃線條款表格的列結(jié)構(gòu)以一組的表格矩形出現(xiàn)。
進而,劃線條款屬性是各個劃線條款作為布局的成分的屬性信息,并且屬性與文件布局的對應(yīng)關(guān)系示于圖39中。
如在圖39中所見,可得到以下條款作為不同于表格結(jié)構(gòu)的劃線條款的劃線條款。
(a)1劃線條款[1](b)2劃線條款[2](c)塊劃線條款[B](d)嵌套劃線條款[I]同時,如在圖39中所見,可獲得以下條款作為表格結(jié)構(gòu)劃線條款。
(e)屬于標題行的劃線條款[H](f)屬于腳注行的劃線條款[F](g)屬于本體行的劃線條款[D](h)屬于向上凸起的劃線條款[U](i)屬于向下凸起的劃線條款[L]要注意,由于圖39所示的文件布局不包含腳注行,而且(f)屬于腳注線的劃線條款不出現(xiàn)。
同時,(a)到(i)的[]中出現(xiàn)的1,2,B,I,H,F(xiàn),D,U和L為各個劃線屬性的代碼。
順便來說,行信息指示在劃線條款表格中的劃線條款行數(shù),而列信息指示在劃線條款表格中的劃線條款列數(shù)。
例如如圖39(d)中所示,同時,層次信息指示作為劃線條款屬性的具有嵌套結(jié)構(gòu)的劃線條款層次關(guān)系。
進而,頂/末指示同一組中劃線條款的位置信息。
然后,參照通過布局分析所獲得的上述這種劃線條款信息502和表格結(jié)構(gòu)信息而產(chǎn)生劃線條款結(jié)構(gòu)信息表格(TBL)503[參照圖40和41(a)到41(d)]。
另一方面,在條款本體位置搜尋處理(步驟K2)中,在步驟K1中所產(chǎn)生的劃線條款結(jié)構(gòu)信息表格503的劃線條款以標題位置搜尋規(guī)則評價[參見圖42,43(a)和43(b)]以便判定標題位置備選項。
標題搜尋規(guī)則505設(shè)計為就供分析的對象文件在確認度中以它們較高階的一個開始,而對象文件為交換一般轉(zhuǎn)帳文件(第一階表格)的標題搜尋規(guī)則505的一個例子給出如下。
首先,以下說明不是用于表格結(jié)構(gòu)的標題位置搜尋規(guī)則。
非表格結(jié)構(gòu)的劃線條款可能包含向上凸起的劃線條款,向下凸起的劃線條款及包含屬于同一組作為表格結(jié)構(gòu)的腳注的劃線條款,和屬于非表格結(jié)構(gòu)組的一組而且不形成一個表格的劃線條款,并且以下將說明用于這些劃線條款的標題位置搜尋規(guī)則。
(a)在涉及單個劃線條款之處,標題部分出現(xiàn)在劃線條款中(*數(shù)據(jù)部分共同存在)。
(b)在涉及一嵌套的劃線條款之處,標題部分出現(xiàn)在該嵌套的左側(cè)劃線條款處。
(c)在涉及一嵌套的劃線條款之處,標題部分出現(xiàn)在該嵌套的上側(cè)劃線條款處。
(d)在涉及兩個或者更多劃線條款之處,標題部分出現(xiàn)在頂部劃線條款處。
(e)在涉及兩個或者更多劃線條款之處,標題部分出現(xiàn)在頂部劃線條款及下一個劃線條款處。
進而,以下將說明用于表格結(jié)構(gòu)部分的標題搜尋規(guī)則505。
表格結(jié)構(gòu)劃線條款出現(xiàn)在包含一個表格矩形或者在同一組2行X2列或更多的劃線條款中最大矩形部分,并且標頭部分出現(xiàn)在最大矩形部分的頂行,同時本體2部分出現(xiàn)在隨后的行部分。
以下將說明用于上述這種劃線條款的標題位置搜尋規(guī)則。
(f)具有多個涉及部分的標題條款出現(xiàn)在表格結(jié)構(gòu)部分的頭行。
(g)在表格結(jié)構(gòu)部分的頭行中出現(xiàn)嵌套劃線條款之處,在劃線條款的上側(cè)出現(xiàn)復(fù)標題。
(h)在表格結(jié)構(gòu)部分的頭行中出現(xiàn)嵌套劃線條款之處,在劃線條款的下側(cè)出現(xiàn)子標題。
當布局分析部分2B在步驟K2實現(xiàn)條款標題位置搜尋處理時,例如基于上述這種標題搜尋規(guī)則505進行對構(gòu)成標題對比檢驗對象的標題位置備選項的判定,并將參照圖44的流程圖說明這時的處理過程。
首先,從在步驟K1所產(chǎn)生的劃線條款結(jié)構(gòu)信息表503抽取劃線條款信息(步驟J1)。
然后,基于標題搜尋規(guī)則505進行標題位置的評價(步驟J2),并記錄評價的結(jié)果到劃線條款結(jié)構(gòu)信息表503(步驟J3)。
這里,要鑒別標題位置的評價是否已經(jīng)基于所有的標題搜尋規(guī)則505進行過,并且如果保留有某個規(guī)則沒有用于標題位置的評價,則標題位置的評價基于該規(guī)則進行(步驟J4到步驟J2和J3)。
進而,要鑒別標題位置的評價是否已經(jīng)對于所有的劃線條款信息進行過,并且如果保留有某個劃線條款信息還沒有用于評價,則對該保留的劃線條款信息進行評價(步驟J5到步驟J1和J4)。
然后,在標題評價對于所有的劃線條款信息已經(jīng)完成之后,參照操作參數(shù)信息501中的評價參照數(shù)值判定標題位置備選項(步驟J6)。
例如,對于圖39所示的文件,由圖45中的網(wǎng)狀(網(wǎng)格部分V)表示的劃線條款判定為標題位置備選項。
進而,在條款標題對比檢驗處理中(步驟K3),對于基于標題搜尋規(guī)則505所判定的標題位置備選項進行對于超復(fù)雜特征數(shù)據(jù)的抽取對比檢驗處理以便使用條款標題字典507對比檢驗出現(xiàn)在劃線條款中的條款數(shù)據(jù)(步驟K4)。然后,基于對比檢驗的結(jié)果判定標題位置備選項的劃線條款的位置與對應(yīng)于該標題的功能條款。
這里,將說明構(gòu)成對比檢驗對象的標題條款數(shù)據(jù)(在標題劃線條款中的條款數(shù)據(jù))。標題位置備選項的劃線條款可能包括多個標題條款數(shù)據(jù)。
這時,通過以下方法判定構(gòu)成對比檢驗對象的標題條款數(shù)據(jù)。
首先,假設(shè)構(gòu)成對比檢驗對象的標題條款數(shù)據(jù)為標題位置備選項的劃線條款中最大條款數(shù)據(jù),例如如圖46(a)中所見。
這里,如果標題是單一功能標題,則由于在對比檢驗只有一個標題條款數(shù)據(jù)起作用,假設(shè)其余的條款數(shù)據(jù)為灰塵或某些裝飾的原來單元,例如如圖46(b)中所見。但是即使在標題為復(fù)功能標題之處,也要假設(shè)標題條款數(shù)據(jù)通常為連續(xù)出現(xiàn)的,例如如圖46(c)中所見。
同時,在如圖47(a)中所見垂直書寫的標題或由如圖47(b)或47(c)中那種多行組成的標題的情形,則假設(shè)對比檢驗對象的標題條款數(shù)據(jù)出現(xiàn)在包含連續(xù)條款數(shù)據(jù)的區(qū)域中。
特別地,假設(shè)垂直書寫的條款數(shù)據(jù)是從與頂行的條款數(shù)據(jù)相同的X坐標相近的位置開始的,垂直書寫的條款數(shù)據(jù)出現(xiàn)在與隨后的條款數(shù)據(jù)結(jié)合的頂行條款數(shù)據(jù)的區(qū)域中。
然而,在如圖48(a)或48(b)中所示的那種復(fù)標題的情形或如圖所示48(c)多行標題情形,標題條款數(shù)據(jù)不能被正確地判定。
于是,在該處理中,只有在上述狀態(tài)下結(jié)合的區(qū)域被視為條款數(shù)據(jù)處理。
順便來說,在標題條款對比檢驗步驟K10中的超復(fù)雜特征數(shù)據(jù)抽取對比檢驗處理(步驟K4)中,對標題條款進行正規(guī)化處理。于是,即使在不同文件之間在字體或者印刷字體/印刷間距中存在差別,在對比檢驗時要被匹配的標題條款數(shù)據(jù)的所有圖象仍能夠存儲到條款標題字典507中。
為了克服印刷字體中的差別,采取了一個對策以實現(xiàn)標題條款對比檢驗,這是通過重心劃分為四部分(手寫字符識別技術(shù))的正規(guī)化處理之后由基于超復(fù)雜字符的對比檢驗進行的。
同時,為了克服印刷間距的差別,采取了一個對策以便對要被對比檢驗的標題條款數(shù)據(jù)字符之間的空隙正規(guī)化,如圖49中所見使得它們能具有固定的大小(例如一個點)。
進而,為了克服條款標題的字體的的差別,采取了一個對策,使得表示標題表達方式的多種字體事先在條款標題字典507中。
作為超復(fù)雜特征信息在它們正規(guī)化處理之后,條款標題字典507事先存儲從采樣文件取得的標題條款數(shù)據(jù)的圖象。進而,為了吸收標題之間字體的差別,指示相同功能的條款標題被分類并存儲在相同的類別中,如圖50中所見。
然后,當標題條款數(shù)據(jù)在步驟K4由字符通過比檢驗抽取處理進行對比檢驗時,類別ID、標題圖象ID和各個備選標題的差度作為對比檢驗的結(jié)果按備選項的順序報告,如圖51(a)和51(b)中所見。
進而,參照操作參數(shù)信息501的標題對比檢驗參數(shù)(Th1和Th2)判定在標題條款位置的標題內(nèi)容。
特別,滿足對比檢驗結(jié)果的第一備選標題差度等于或低于對比檢驗參數(shù)(Th1)的要求,以及滿足對比檢驗結(jié)果的第一備選項與具有不同類型ID的另一備選項之間的差度差別等于或高于對比檢驗參數(shù)(Th2)的差度差別要求的這些內(nèi)容被判定為在標題條款位置處的的標題內(nèi)容。
例如,在圖51所示的例子中,如果在假設(shè)Th1=1,000和Th2=2,000之下進行評價,則獲得以下的結(jié)果,并從而能夠看到對比檢驗結(jié)果滿足上述的兩個要求(差度要求和差度差別要求)。
差度要求(350)≤(Th1=1,000)→OK差度差別要求|2,700-350|≥(Th2=2,000)→OK當在這種方式下進行標題條款數(shù)據(jù)的對比檢驗時,可能的結(jié)果情形是(情形1),其中所有對比檢驗結(jié)果為OK標題條款的分析完全成功地進行,而另一種情形(情形2),其中對某些標題條款的分析不成功,并且另一情形是(情形3),其中對幾乎所有的標題條款分析都不成功。
這里,在情形1的情形下,對比檢驗的結(jié)果報告它們是作為標題分析的結(jié)果,但是在情形3的情形下,判定標題分析結(jié)果是不成功的,并且報告文件識別的結(jié)果為不符合要求的本意。
另一方面,在情形2的情形下,進行標題對比檢驗結(jié)果的校正處理(步驟K5)。于是,在一特定情形下,能夠?qū)€沒有進行分析的標題條款進行分析。
對于作為標題條款的對比檢驗的結(jié)果由表格結(jié)構(gòu)部分的標題行所定義的基本標題條款,在以下情形下,根據(jù)標題校正規(guī)則508(使用標題校正規(guī)則508的標題對比檢驗結(jié)果校正處理,步驟K5)進行校正。要注意,只有在對比檢驗的結(jié)果沒有定義時標題校正規(guī)則508才被采用,但是不能在拒絕對比檢驗結(jié)果的方式下使用。
這里,如在圖52(a)所見在具有嵌套結(jié)構(gòu)的復(fù)合標題條款之一不定義之處,如果使用標題校正規(guī)則508進行校正,則從復(fù)合標題條款的功能條款內(nèi)容能夠唯一地判定其余的功能條款(這是由于在復(fù)合標題條款的“NAME OF FINANCIAL ORGAN”情形下,“NAME OFBANK”與“NAME OF BANK OFFICE”必定對應(yīng)于嵌套的標題條款),能夠?qū)ι形闯晒Φ乇环治龅臉祟}條款進行分析。
進而,如在圖52(b)所見,例如如果在只有一般轉(zhuǎn)帳文件的標題行中主要條款的標題之一不定義之處,使用標題校正規(guī)則508進行校正,則由于從功能名稱信息表唯一地判定了要包含在標題行中的功能條款,故能夠?qū)ι形闯晒Φ乇环治龅臉祟}條款(被嵌套部分W)進行分析。
此外,如果如圖52(c)中所見在只有要被包含的非標題行的基本標題條款之一未定義,并且只有未定義的標題備選位置之一出現(xiàn)之處,使用使用標題校正規(guī)則508進行校正,則在標題位置備選項與基本標題條款數(shù)目彼此相符之處,能夠?qū)ι形闯晒Φ乇环治龅臉祟}條款(被嵌套部分W)進行分析,因為它能夠通過任何定義的標題的消除法被判定。
要注意,在圖52(a)到52(c)中,尚未成功地被分析的任何標題條款由被嵌套部分W表示,而已經(jīng)通過標題對比檢驗校正處理進行了分析的任何其它標題條款由另外的被嵌套部分W′表示。
同時,在條款數(shù)據(jù)位置搜尋處理(步驟K6)中,搜尋對應(yīng)于作為標題條款對比檢驗結(jié)果最后定義的標題條款的條款數(shù)據(jù)的劃線條款位置。
首先,類似于對標題條款(標題劃線條款)位置的搜尋,通過使用數(shù)據(jù)搜尋規(guī)則509評價劃線條款結(jié)構(gòu)信息表503的各個劃線條款,進行對應(yīng)于標題部分的條款數(shù)據(jù)的劃線條款位置的搜尋。
這里,條款數(shù)據(jù)位置的搜尋與標題條款位置的搜尋之不同在于,在條款數(shù)據(jù)位置搜尋情形下,由于標題條款已經(jīng)被定義,故首先評價標題以便選擇搜尋規(guī)則,并然后把該規(guī)則用于各個劃線條款,而在標題條款位置搜尋的情形下,因為涉及標題條款的對比檢驗處理,故首先判定標題位置的備選項,在條款數(shù)據(jù)位置搜尋的情形下,條款數(shù)據(jù)位置必須作為搜尋處理的結(jié)果判定。
然后,在搜尋條款數(shù)據(jù)位置中,基于劃線條款結(jié)構(gòu)信息表503和數(shù)據(jù)搜尋規(guī)則509,判定對應(yīng)于已經(jīng)判定的標題條款的條款數(shù)據(jù)位置(條款數(shù)據(jù)的劃線條款位置)。
然后將參照圖53的流程圖說明該操作。首先抽取通過標題分析所判定的標題條款信息(步驟L1),并判定對應(yīng)于這樣抽取的標題條款的數(shù)據(jù)搜尋規(guī)則509(步驟L2)。
此后,從劃線條款結(jié)構(gòu)信息表503抽取劃線條款信息(步驟L3),并以數(shù)據(jù)搜尋規(guī)則509進行評價(步驟L4)。
然后,由該評價的結(jié)果判定條款數(shù)據(jù)位置,并作為功能名稱信息設(shè)置所判定的條款數(shù)據(jù)位置的劃線ID(步驟L5)。
進而,鑒別是否對于所有的劃線條款信息已經(jīng)完成評價,并且如果評價已經(jīng)完成,則繼而進行對于下一個劃線條款信息的評價(步驟L6和L3到L5)。
進而,鑒別是否對應(yīng)于所有的標題條款信息的條款數(shù)據(jù)位置都已經(jīng)被判定,如果還遺留有其條款數(shù)據(jù)位置沒有被判定的標題條款,則對下一個標題條款信息進行處理(步驟L7和L2到L6)。
這里,除非涉及表格結(jié)構(gòu),則標題部分劃線條款與涉及部分劃線條款之間的連接規(guī)則按以下方式定義。
(a)數(shù)據(jù)部分的劃線條款為跟隨標題部分的劃線條款[參見圖54(a)和54(b)]。
(b)在沒有跟隨標題部分的劃線條款之處,數(shù)據(jù)部分出現(xiàn)在該標題部分的同一劃線條款中[參見圖54(c)]。
(c)在多個劃線條款跟隨標題部分之處,數(shù)據(jù)部分出現(xiàn)在直到另一個無關(guān)的標題出現(xiàn)的位置的劃線條款中[參見圖54(d)和54(e)]。
(d)在標題部分以嵌套的劃線條款成對出現(xiàn)之處,數(shù)據(jù)部分出現(xiàn)在子劃線條款中[參見圖54(f)和54(g)]。
(e)在出現(xiàn)兩個劃線條款之處,有可能標題部分與數(shù)據(jù)部分會出現(xiàn)在同一劃線條款中[參見圖54(h)]。
同時,在涉及表格結(jié)構(gòu)之處,標題部分劃線條款與涉及部分劃線條款之間的連接規(guī)則按以下方式定義。
(f)在表格為垂直的一維表格之處,數(shù)據(jù)部分跟隨標題劃線條款的列方向的劃線條款[參見圖55(a)]。
(g)在表格為垂直的一維表格并且標題包含兩列之處,數(shù)據(jù)部分跟隨標題劃線條款的列方向的劃線條款[參見圖55(b)]。
(h)在表格為垂直的一維表格并且標題包含嵌套條款之處,數(shù)據(jù)部分跟隨成對的標題劃線條款方向的劃線條款[參見圖55(c)]。
(i)在表格為垂直的一維表格并且標題為復(fù)合標題之處,數(shù)據(jù)部分跟隨復(fù)合標題劃線條款列方向的劃線條款[參見圖55(d)]。
(j)在表格為水平一維表格之處,數(shù)據(jù)部分跟隨標題劃線條款的行方向的劃線條款[參見圖55(e)]。
(k)在表格為二維表格之處,數(shù)據(jù)部分跟隨標題劃線條款的列/行方向的劃線條款[參見圖55(f)]。
這里,對應(yīng)于標題條款的條款數(shù)據(jù)位置的判定例子示于圖56中。要注意,在圖56中,每一標題條款的判定位置是由網(wǎng)格部分X指示的,同時條款數(shù)據(jù)位置由X′表示,標題條款判定位置與條款數(shù)據(jù)位置之間的鏈接關(guān)系由箭頭標號表示。
進而,在條款數(shù)據(jù)部分鏈接處理(步驟K7)中,參照對應(yīng)于標題劃線條款的數(shù)據(jù)部分劃線條款的位置而判定數(shù)據(jù)部分劃線條款中條款數(shù)據(jù)的位置并設(shè)置它們之間的鏈接關(guān)系。
從標題部分到對應(yīng)的條款數(shù)據(jù)部分的鏈接關(guān)系示于圖57和58。
這里,在多于一個條款數(shù)據(jù)出現(xiàn)在劃線條款中或者其中出現(xiàn)條款數(shù)據(jù)部分的矩形區(qū)域中之處,則根據(jù)操作參數(shù)信息501判定要與功能條款鏈接的條款數(shù)據(jù)。
在要從單一功能條款被鏈接之處,從指定的行和列位置根據(jù)操作參數(shù)信息501鏈接指定行數(shù)和指定列數(shù)條款數(shù)據(jù)[參見59(a)]。
這里,在要從單一功能條款被鏈接之處,條款數(shù)據(jù)鏈接的操作參數(shù)信息501包括以下信息。
(a)鏈接由一指定行開始的指定數(shù)目的行(*缺省指定行=第一行,指定行數(shù)=一行)。然而,在條款數(shù)據(jù)行數(shù)目小于指定行數(shù)目之處,鏈接區(qū)域中所有的條款數(shù)據(jù)行。
(b)鏈接由一指定列開始的指定數(shù)目的列(*缺省指定列=第一列,指定列數(shù)=所有的列數(shù))。然而,在條款數(shù)據(jù)列數(shù)目小于指定列數(shù)目之處,鏈接區(qū)域中所有的條款數(shù)據(jù)列。
另一方面,在要從復(fù)合功能條款鏈接之處,根據(jù)操作參數(shù)信息501按功能條款的定義順序鏈接來自指定行和指定列的指定行數(shù)和指定列數(shù)的條款數(shù)據(jù)[參見59圖(b)]。
這里,在要從復(fù)合功能條款鏈接之處,條款數(shù)據(jù)鏈接的操作參數(shù)信息501包括以下信息。
(c)在N≥K并且M<K之處,條款數(shù)據(jù)行按功能條款鏈接順序分配。
(d)在N<K并且M≥K之處,條款數(shù)據(jù)列按功能條款鏈接順序分配。
(e)在N≥K并且M≥K之處,條款數(shù)據(jù)行按功能條款鏈接順序分配。
(f)在N≥K并且M≥K之處,條款數(shù)據(jù)列按功能條款鏈接順序分配。
(g)在N<K并且M<K之處,分配不可能,故條款數(shù)據(jù)不鏈接。
要注意,在以上說明中,N是條款行數(shù),M是條款列數(shù),而K是功能條款數(shù)。
然后,在款額鏈接處理(步驟K8)中,在被分析的標題條款的功能條款是一款額,一項服務(wù)費等之處,校驗對應(yīng)的條款數(shù)據(jù)屬于其中的劃線條款,并且如果該結(jié)構(gòu)為列定界的劃線條款,則各個單一列劃線條款彼此連接而形成單一條款數(shù)據(jù)信息,并且條款數(shù)據(jù)鏈接到功能條款。
這里,在對應(yīng)于標題部分的條款數(shù)據(jù)部分劃分為三個或者更多的(根據(jù)操作參數(shù)指定數(shù)值)劃線條款,且各個劃線條款的尺寸低于操作參數(shù)設(shè)定值,此外判定了標題功能為一款額之處,則鑒別出劃線條款為列定界劃線條款[參見圖60(a)和60(b)]。
然后,如果鑒別出條款數(shù)據(jù)部分的劃線條款是由一列定界劃線條款形成的,則各個劃線條款鏈接之間的關(guān)系從頂列的劃線條款開始相繼設(shè)置,并作為相繼的劃線條款處理劃線條款以連接這些劃線條款[參見圖60(c)]。
進而在條款數(shù)據(jù)部分的劃線條款是由對列定界劃線條款形成之處,由于各個劃線條款中的條款數(shù)據(jù)也是被劃分的狀態(tài),故對各個劃條款數(shù)據(jù)組合處理以設(shè)置它們?yōu)閱我粭l款數(shù)據(jù),彼此連接這些條款數(shù)據(jù)[參見圖60(d)]。
要注意,雖然以上說明了劃線條款為一列定界劃線條款的情形,三列對講機劃線條款也可以類似的方式處理。
又對于三列定界款額部分,劃線條款與條款數(shù)據(jù)的連接按與單列定界款額部分的情形類似的方式進行。然而,由于三列定界款額部分具有較小的列寬度和較小的劃線條款數(shù),故設(shè)置了與單列定界款額部分不同的要求[參見圖60(e)和60(f)]。
當具有上述結(jié)構(gòu)的根據(jù)本發(fā)明的該實施例的數(shù)據(jù)媒體處理裝置30進行標題分析處理時,在布局分析處理步驟A2(或A9)中,抽取所讀取的圖象的布局特征以便分析布局的結(jié)構(gòu),并校驗所抽取的特征判定圖象中的標題區(qū)域。然后,識別標題標題區(qū)域中的標題條款信息并判定對應(yīng)的條款數(shù)據(jù),并邏輯上表示該布局。
然后,在布局對比檢驗處理步驟A3(或A10)中,應(yīng)用在布局分析處理步驟A2(或A9)所抽取的布局特征作為限制檢索項,檢索存儲在布局DB 14中的備選布局,以便對比檢驗是否存在相符的備選布局。
這樣,應(yīng)用根據(jù)本發(fā)明該實施例的數(shù)據(jù)媒體處理裝置30,由于在供分析的對象文件上所描述的標題條款和對應(yīng)于該標題條款的條款數(shù)據(jù)能夠通過進行了標題分析處理之后的布局識別處理進行標識,其中在標題分析處理中,從文件的圖象劃線條款結(jié)構(gòu)搜尋和對比檢驗標題位置并自動分析對應(yīng)于文件上所描述的標題的條款信息,故在沒有進行標題條款的字符識別處理之下能夠立即進行條款數(shù)據(jù)的字符識別。
(a7)對識別結(jié)果的確認和修改處理的說明(1)圖象數(shù)據(jù)顯示裝置的說明圖61是表示本發(fā)明該實施例的圖象數(shù)據(jù)顯示裝置640的結(jié)構(gòu)的示意圖。圖象數(shù)據(jù)顯示裝置640通過作為圖象數(shù)據(jù)顯示其上描述了一個人(這個人由其姓名確定)要匯款,帳號(帳目No.),匯款額度等等的文件進行匯款請求處理,并通過操作者操作鍵盤等輸入諸如帳號,姓名,及匯款額度等匯款數(shù)據(jù),,或者通過操作者的目視觀察進行確認由其它什么裝置等所進行的圖象數(shù)據(jù)(匯款數(shù)據(jù))的字符識別結(jié)果是正確或錯誤并必要時對字符識別結(jié)果進行修改而進行匯款請求處理。圖象數(shù)據(jù)顯示裝置640對應(yīng)于圖6所示的數(shù)據(jù)媒體處理裝置的客戶機10。
特別,圖象數(shù)據(jù)顯示裝置640是這樣構(gòu)造的雖然操作者能夠目視觀察顯示在一顯示單元上的圖象數(shù)據(jù)并進行輸入操作,但是例如當文件由諸如OCR裝置這樣的圖象數(shù)據(jù)處理裝置讀取時,字符識別字符識別能夠自動地進行,并且操作者能夠進行僅涉及被錯誤識別的或尚未成功地識別的字符輸入操作。
圖61所示的圖象數(shù)據(jù)顯示裝置640包括作為圖象數(shù)據(jù)輸入裝置的一個圖象掃描器621A和一個光學(xué)字符閱讀裝置(OCR裝置)621B,一個作為數(shù)據(jù)輸入裝置的鍵盤631,一個作為顯示控制裝置的計算機主機629,一個顯示單元630和一個硬盤622。
要注意,圖象數(shù)據(jù)顯示裝置640是連接到圖6所示的服務(wù)器39上的,其功能是作為工作站從圖象掃描器621A向服務(wù)器39輸出圖象數(shù)據(jù)(匯款數(shù)據(jù)),檢索由服務(wù)器39所識別的圖象數(shù)據(jù)字符的字符識別結(jié)果,并在顯示單元630上顯示檢索出的字符識別結(jié)果,并向服務(wù)器39輸出由操作者確認和修改過的匯款數(shù)據(jù)。
圖象掃描器621A閱讀標號多個條款的銀行的匯款請求票據(jù)等的文件,并向圖象數(shù)據(jù)顯示裝置640輸入圖象數(shù)據(jù)。
OCR裝置621B類似于圖象掃描器6221A,閱讀圖象數(shù)據(jù)并進行所讀取的圖象數(shù)據(jù)的字符識別。
在本實施例中,對于圖象數(shù)據(jù)顯示裝置640裝設(shè)了圖象掃描器621A和OCR裝置621B這兩者,以便能夠處理各種格式的圖象數(shù)據(jù)。
要注意,在圖象數(shù)據(jù)由OCR裝置621B閱讀之處,圖象數(shù)據(jù)的字符識別結(jié)果是顯示在圖象數(shù)據(jù)顯示裝置640的顯示單元630上的。
顯示單元630具有一個圖象數(shù)據(jù)顯示區(qū)域611和一個條款數(shù)據(jù)顯示區(qū)域614,并如圖70中所見那樣顯示輸入的文件圖象數(shù)據(jù)。
這里,圖象數(shù)據(jù)顯示區(qū)域611是這樣一個區(qū)域部分,在其中要顯示從圖象掃描器621A或OCR裝置621B輸入的文件圖象數(shù)據(jù)。
圖象數(shù)據(jù)顯示區(qū)域611顯示包括多個條款信息的圖象數(shù)據(jù),并在圖70中顯示包括“帳號(帳戶No.)”,“姓名”,“代理銀行(交易)”和“款額”四個條款612的信息的圖象數(shù)據(jù)。
設(shè)置條款數(shù)據(jù)顯示區(qū)域614是為了使用鍵盤631輸入對應(yīng)于圖象數(shù)據(jù)顯示區(qū)域611所希望的一個條款612的圖象數(shù)據(jù)部分的匯款數(shù)據(jù)。
條款數(shù)據(jù)顯示區(qū)域614具有多個數(shù)據(jù)輸入顯示區(qū)域部分615。在圖70中,圖象數(shù)據(jù)顯示區(qū)域614具有四個數(shù)據(jù)輸入顯示區(qū)域部分615即“條款1到條款4”,其中“條款1”對應(yīng)于“帳號”;“條款2”對應(yīng)于“姓名”;“條款3”對應(yīng)于“交易”;和“條款4”對應(yīng)于“款額”。
所希望的數(shù)據(jù)輸入顯示區(qū)部分615之一由光標指示器616表示,并能夠輸入顯示在所希望的對應(yīng)于它的條款612之一的圖象數(shù)據(jù)部分的匯款數(shù)據(jù)。要注意,數(shù)據(jù)的輸入能夠使用作為數(shù)據(jù)輸入裝置的鍵盤631進行。
進而,圖61中所示的圖象數(shù)據(jù)顯示裝置640包括上述的硬盤622。硬盤622作為用于存儲作為定義信息的圖象數(shù)據(jù)分區(qū)信息定義存儲部分。要注意,圖象數(shù)據(jù)分區(qū)信息表示用于把從圖象掃描器621A或者OCR裝置621B輸入的文件圖象數(shù)據(jù)劃分為多個條款612的圖象數(shù)據(jù)部分的信息。
示于圖61的計算機主機629功能是作為顯示控制裝置(以下計算機主機629能夠稱為顯示控制裝置629),并在圖象數(shù)據(jù)顯示區(qū)域61 1中顯示通過從圖象掃描器621A或者OCR裝置621B輸入的圖象數(shù)據(jù)所獲得的圖象數(shù)據(jù)。進而計算機主機629還指示,當對應(yīng)于所希望的條款612之一的圖象數(shù)據(jù)部分的數(shù)據(jù)從鍵盤613被輸入時,光標指示器616在用于條款數(shù)據(jù)顯示區(qū)域614中所希望的條款612的數(shù)據(jù)輸入顯示區(qū)域615。
計算機主機629使用存儲在硬盤622的圖象數(shù)據(jù)分區(qū)信息,識別從圖象掃描器621A或者OCR裝置612B輸入的文件的圖象數(shù)據(jù)的劃線,轉(zhuǎn)換該劃線為包含多個條款612圖象數(shù)據(jù)部分的表格,并在圖象數(shù)據(jù)顯示區(qū)域611中顯示通過轉(zhuǎn)換所獲得的圖象數(shù)據(jù)。
進而,圖61和62所示計算機主 629并作為顯示控制裝置包括一個強調(diào)信息產(chǎn)生處理部分623,一個作為圖象數(shù)據(jù)局部強調(diào)顯示裝置的強調(diào)顯示部分624,一個作為圖象數(shù)據(jù)強調(diào)顯示刪除裝置的強調(diào)顯示刪除部分625,一個作為強調(diào)顯示轉(zhuǎn)移控制裝置的強調(diào)顯示轉(zhuǎn)移控制部分626和作為顯示屏幕滾動裝置的屏幕滾動部分627。
強調(diào)信息產(chǎn)生處理部分623參照從作為圖象數(shù)據(jù)輸入裝置所輸入的圖象數(shù)據(jù),或存儲在硬盤622上的圖象數(shù)據(jù)劃分信息(定義信息),以產(chǎn)生相關(guān)信息P和強調(diào)信息Q。
如圖68中所見,相關(guān)信息P是用于使得“條款1到條款4”在與“帳號”,“姓名”,“交易”和“款額”的對應(yīng)關(guān)系中分別相關(guān)的信息。
強調(diào)信息Q是用于在圖象數(shù)據(jù)顯示區(qū)域611中進行強調(diào)顯示的信息,并具有包含對應(yīng)于指示條款612的科目“科目1到科目4”的強調(diào)顯示類型的強調(diào)顯示屬性信息,以及一個強調(diào)顯示區(qū)域。要注意,“科目1到科目4”分別對應(yīng)于“帳號”,“姓名”,“交易”和“款額”。
進而,強調(diào)顯示類型包括一個網(wǎng)格,一個裝飾劃線等等,并在本實施例中,作為強調(diào)顯示,向?qū)?yīng)于“科目1”和“科目3”的條款612顯示設(shè)置一個寬框顯示方式,并向?qū)?yīng)于“科目2”和“科目4”的條款顯示設(shè)置一個網(wǎng)格顯示方式,使得“科目1到科目4”順序地被強調(diào)顯示,能夠設(shè)置不同的強調(diào)顯示以達到較高的可視性。
同時,強調(diào)顯示區(qū)域使用包含X坐標和Y坐標的坐標(以點為單位)指示任何條款612的強調(diào)顯示部分613的開始和結(jié)束,并且對于每一條款612可任意設(shè)置強調(diào)顯示部分613的尺寸。
相關(guān)信息P和強調(diào)信息Q在圖64所示的流程圖的步驟A1′和A2′中產(chǎn)生。
如果在計算機主機629的控制之下,在其中包含多個條款的信息的圖象數(shù)據(jù)顯示在圖象數(shù)據(jù)顯示區(qū)域611中的狀態(tài)下,在條款數(shù)據(jù)顯示區(qū)域614中對于條款612數(shù)據(jù)輸入顯示區(qū)域部分615之內(nèi)對于所希望的條款612之一的數(shù)據(jù)輸入顯示區(qū)域部分615之一之處,光標指示器616被指示,則強調(diào)顯示部分624僅強調(diào)顯示對應(yīng)于如由標號613所指的數(shù)據(jù)輸入顯示區(qū)域部分615的所希望的條款612之一的圖象數(shù)據(jù)部分。
特別地,當在用于所希望的條款612之一的數(shù)據(jù)輸入顯示區(qū)域部分615中指示光標指示器616時,當通過目視觀察要進行圖象數(shù)據(jù)與輸入條款之間的匹配以允許進行平滑的輸入操作時,則強調(diào)顯示部分624僅強調(diào)顯示對應(yīng)于對帶有提高可視性的網(wǎng)格、裝飾劃線等條款612的數(shù)據(jù)輸入顯示區(qū)域部分615的圖象數(shù)據(jù)部分。
進而,強調(diào)顯示刪除部分625刪除由強調(diào)顯示部分624所強調(diào)的所希望的條款612之一的圖象數(shù)據(jù)部分的強調(diào)顯示部分613,以便轉(zhuǎn)換條款612的顯示為該強調(diào)顯示之前的狀態(tài)。特別地,如果光標指示器616通過光標移動操作移動到不同于對于所希望的條款612之一的數(shù)據(jù)輸入顯示區(qū)域部分615的對于另一個條款612之一的數(shù)據(jù)輸入顯示區(qū)域部分616,則強調(diào)顯示刪除部分625刪除對應(yīng)于該條款的圖象數(shù)據(jù)部分的強調(diào)顯示部分613。
強調(diào)顯示轉(zhuǎn)移控制部分626的作用在于與強調(diào)顯示刪除部分625的聯(lián)鎖關(guān)系,并進行控制,使得在強調(diào)顯示刪除部分625刪除對應(yīng)的一定的條款612之一的圖象數(shù)據(jù)部分的強調(diào)顯示部分613之后,移動光標指示器616到對于另一個條款612的數(shù)據(jù)輸入顯示區(qū)域部分615,并只有對應(yīng)于對于由光標指示器616所指示的條款612的數(shù)據(jù)輸入顯示區(qū)域部分615的條款612的圖象數(shù)據(jù)部分由強調(diào)顯示部分624強調(diào)顯示。
進而,屏幕滾動部分627從圖象數(shù)據(jù)的部分顯示在顯示單元630的狀態(tài),顯示在顯示單元630上沒有顯示的那些圖象數(shù)據(jù)。
強調(diào)顯示部分624具有作為變化裝置的變化部分628。變化部分628響應(yīng)來自外部的指令,例如使用鍵盤,而改變強調(diào)顯示類型或區(qū)域,并包含變化信息獲取部分628A和強調(diào)信息變化部分628B。
變化信息獲取部分628A獲取以下將要說明的變化信息R。強調(diào)信息變化部分628B使用變化信息R更新將在以下說明的強調(diào)信息Q以便產(chǎn)生強調(diào)信息Q′。
實際上,能夠向計算機主機629提供如同強調(diào)顯示部分624,強調(diào)顯示刪除部分625,強調(diào)顯示轉(zhuǎn)移控制部分626及屏幕滾動部分627的功能的適當?shù)能浖惭b到硬盤622或某種其它的存儲器,以構(gòu)成圖象數(shù)據(jù)顯示裝置640。
根據(jù)本實施例具有上述結(jié)構(gòu)的圖象數(shù)據(jù)顯示裝置640以如下方式操作。
圖67中示出當文件的圖象數(shù)據(jù)從圖62所示的圖象數(shù)據(jù)劃分裝置621(圖象掃描器621A或者OCR裝置621B)輸入并顯示在顯示單元(圖62中未示出)時的一個初始屏幕。
這時,如圖67中所見,包含多個條款信息的圖象數(shù)據(jù),即包含“帳號”,“姓名”,“交易”和“款額”四個條款信息的圖象數(shù)據(jù),顯示在顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611中。
另一方面,當輸入的匯款數(shù)據(jù)要被輸入時,光標指示器616移動到所希望的一個數(shù)據(jù)輸入顯示區(qū)域部分615以輸入對應(yīng)于所希望的條款612之一的圖象數(shù)據(jù)部分的匯款數(shù)據(jù)。這時,如在圖70中所見,所希望的條款612的圖象數(shù)據(jù)部分通過強調(diào)顯示部分624以強調(diào)顯示部分613被強調(diào)顯示,并從圖71到76可見,在光標指示器616移動時強調(diào)顯示部分613也在圖象數(shù)據(jù)顯示區(qū)域611中移動。
要注意,雖然圖象數(shù)據(jù)的字符識別結(jié)果沒有在圖67和70到76中所示的數(shù)據(jù)輸入顯示區(qū)域部分615中顯示,它自然能夠另外顯示。
這里,在圖70中,示出當“帳號(0001)”的條款612被強調(diào)顯示時的顯示單元。
如果在圖70所見的那種狀態(tài)下操作者借助于鍵盤631輸入“ 0001”,然后人工操作鍵盤631在條款數(shù)據(jù)顯示區(qū)域614中移動光標指示器616從“條款1”到“條款2”,然后強調(diào)顯示部分613響應(yīng)由強調(diào)顯示轉(zhuǎn)移控制部分626的操作在如圖71中所見的圖象數(shù)據(jù)顯示區(qū)域611從“帳號(0001)”移動到“姓名(Taro Fuji)”。這種狀態(tài)下,操作者將使用鍵盤631輸入“Taro Fuji”。
類似地如果操作者借助于鍵盤631輸入“Taro Fuji”并人工操作鍵盤631移動光標指示器616從“條款2”到“條款3”,則強調(diào)顯示部分613如圖72所見通過強調(diào)顯示轉(zhuǎn)移控制部分626從“姓名(Taro Fuji)”移動到“交易(010)”。然后,如果操作者進而輸入“010”并移動光標指示器616從“條款3”到“條款4”,則強調(diào)顯示部分613通過強調(diào)顯示轉(zhuǎn)移控制部分626如圖73中所見從“交易(010)”移動到“款額(¥12,000)”。而且這時,操作者自然將使用鍵盤輸入“010”和“¥12,000”。
例如,如果在這樣輸入作為對應(yīng)于“條款4”的匯款數(shù)據(jù)的款額數(shù)據(jù)“¥12,000”之后按動了鍵盤631的回車鍵,則對應(yīng)于“條款1到條款4”的匯款數(shù)據(jù)(帳號、姓名、交易和款額數(shù)據(jù))示出到圖6中所示的服務(wù)器39。
然后,響應(yīng)回車鍵的按動,光標指示器616再次從“條款4”移動到“條款1”,并且通過強調(diào)顯示轉(zhuǎn)移控制部分626如圖74中所見在第二行強調(diào)顯示部分613從“款額(¥12,000)”移動到“帳號(0010)”。此后,每次重復(fù)上述的操作,圖象數(shù)據(jù)顯示區(qū)域611中的條款612可被一次又一次地強調(diào)顯示。
換言之,對應(yīng)于出現(xiàn)光標指示器616的數(shù)據(jù)輸入顯示區(qū)域部分615的條款612之一被強調(diào)顯示,并在光標指示器616移動時,強調(diào)顯示部分613在不同的條款612之間也移動。
同時,匯款數(shù)據(jù)的輸入在具有光標指示器616的數(shù)據(jù)輸入顯示區(qū)域部分615處進行,并如果光標指示數(shù)據(jù)向其輸入的數(shù)據(jù)輸入顯示區(qū)域部分615之一移動,則同時被參照的條款612的圖象數(shù)據(jù)部分被強調(diào)顯示。于是,能夠防止當數(shù)據(jù)被參照時匹配中的錯誤識別要被增加目視的可視性,由此輸入操作所需的勞務(wù)能夠被降低并可防止匯款數(shù)據(jù)的誤輸入。
如果假設(shè)上述的匯款數(shù)據(jù)輸入處理進而進行到如圖75中所見顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611最低行中的″款額(¥1,765)″被強調(diào)顯示,然后在沒有在顯示單元630上顯示的某些條款612保持在低于“款額(¥1,765)”之處,如果光標指示器616在條款數(shù)據(jù)顯示區(qū)域614中從“條款4”移動到“條款1”,則如圖76中所示通過強調(diào)顯示轉(zhuǎn)移控制部分626,在圖象數(shù)據(jù)顯示區(qū)域611中顯示屏幕627和強調(diào)顯示部分613按對應(yīng)關(guān)系從″款額(¥1,765)″移動到“帳號(2148)”。
換言之,在處于圖象數(shù)據(jù)顯示區(qū)域611的最低位置的條款612之一被強調(diào)顯示而在顯示單元630上沒有被顯示的某些條款612保持在低于條款612之處,則能夠通過在數(shù)據(jù)輸入顯示區(qū)域部分615之間移動光標指示器616使得顯示屏自動地滾屏。
要注意,雖然在圖76中顯示屏的滾動一個個條款地進行并且條款“帳號(2148)”被顯示,但是顯示滾動的方式不限于此,并且通過移動“帳號(2148)”到最上行使得低于它們的一屏的其它條款能夠被顯示,對于一屏(七個條款)的所有的條款能夠被交替地滾動。
這里,如圖70到76中所示這種強調(diào)顯示的移動控制是由強調(diào)顯示部分624、強調(diào)顯示刪除部分625、強調(diào)顯示轉(zhuǎn)移控制部分626以及屏幕滾動部分627進行的,并在以下參照圖65更詳細地說明這時的操作流。
例如,如果如圖70到71中所見在條款數(shù)據(jù)顯示區(qū)域614中光標指示器616從“條款1”移動到“條款2”,即如果構(gòu)成圖象數(shù)據(jù)顯示區(qū)域611中的輸入對象的條款612之一變?yōu)椴煌谝呀?jīng)是上一個輸入對象的條款612之一,則鑒別在上一次輸入時強調(diào)顯示的屬性(強調(diào)顯示類型或者強調(diào)顯示區(qū)域)是否已經(jīng)發(fā)生變化(步驟B1′)。
然后,如果強調(diào)顯示的屬性已經(jīng)發(fā)生變化,則強調(diào)顯示刪除625使得在先前的顯示中條款612的圖象數(shù)據(jù)顯示部分的強調(diào)顯示屬性返回到普通顯示屬性(變化之前的屬性)以刪除強調(diào)顯示(步驟B2′),并為下一個條款612取得相關(guān)信息(步驟B3′)。
此后,強調(diào)顯示部分624參照相關(guān)信息P鑒別關(guān)于構(gòu)成輸入對象的該條款612的相關(guān)信息P是否出現(xiàn)(步驟B4′),如果關(guān)于構(gòu)成輸入對象的該條款612的相關(guān)信息P出現(xiàn),則取得顯示部分624取得強調(diào)信息Q,并且變化信息獲取部分628A參照該強調(diào)信息Q而取得取得顯示屬性中的變化信息(步驟B5′)。
進而,鑒別對應(yīng)于構(gòu)成輸入對象的條款612的圖象數(shù)據(jù)部分是否在顯示單元630上顯示以鑒別是否需要自動滾屏(步驟B6′)。如果不需要自動滾屏,則強調(diào)信息改變部分628B以步驟B5′中所要求的變化信息改變圖象數(shù)據(jù)部分的強調(diào)顯示屬性,并且如圖70和71中所見,強調(diào)顯示部分613從“帳號(0001)”移動到“姓名(TaroFuji)”。
另一方面,如果在步驟B6′中鑒別出需要自動滾屏,則如圖75和76中所見滾屏部分627響應(yīng)強調(diào)顯示部分613的移動進行自動滾屏處理(步驟B7′),并且強調(diào)信息改變部分628B以步驟B5′中所要求的變化信息改變圖象數(shù)據(jù)部分的強調(diào)顯示屬性(步驟B8′)。
這樣,強調(diào)顯示的移動控制是這樣進行的,即鑒別強調(diào)顯示屬性中的變化是否已經(jīng)發(fā)生,并如果強調(diào)顯示屬性中的變化已經(jīng)發(fā)生,則任何條款612的上一個強調(diào)顯示被刪除,并鑒別關(guān)于構(gòu)成輸入對象的條款612之一的相關(guān)信息P是否出現(xiàn),并如果關(guān)于構(gòu)成輸入對象的條款612之一的相關(guān)信息P出現(xiàn),則需要強調(diào)顯示屬性中的變化信息。
進而,鑒別是否需要自動滾屏,并如果不需要自動滾屏,則改變強調(diào)顯示屬性,但是如果需要自動滾屏,則進行自動滾屏處理并然后改變強調(diào)顯示屬性。
順便來說,通過改變強調(diào)信息Q能夠任意改變強調(diào)顯示部分613的顯示類型和顯示區(qū)域。
這將通過例子的方式說明,其中例如在77中所示顯示單元30上,作為圖象數(shù)據(jù)顯示區(qū)域611的最低階處的條款612的“款額(¥4,321)”被強調(diào)顯示。
這時,從圖69和79的強調(diào)信息Q可見,“款額(¥4,321)”的條款612的強調(diào)顯示部分613能夠通過定義開始位置坐標(320,180)以及結(jié)束位置坐標(420,200)而唯一地判定。要注意,開始位置坐標(320,180)是在對應(yīng)于“科目4(款額)”的“No.7開始”處所指示的坐標,而結(jié)束位置坐標(420,200)是在對應(yīng)于“科目4(款額)”的“No.7結(jié)束”處所指示的坐標。
然后,如圖78中所見,如果強調(diào)顯示部分613的開始位置坐標(320,180)變?yōu)?360,180),則圖77中所示的條款612的“款額(¥4,321)”的強調(diào)顯示部分613的區(qū)域變?yōu)閳D78中所見的狹窄的區(qū)域。
通過改變強調(diào)信息Q的開始位置的坐標或者結(jié)束位置的坐標,能夠任意設(shè)置強調(diào)顯示部分613的區(qū)域的大小。
強調(diào)顯示信息Q的這種改變能夠這樣進行,即通過使用作為數(shù)據(jù)輸入裝置的鍵盤或某些其它裝置,向圖象數(shù)據(jù)顯示裝置640輸入改變強調(diào)顯示屬性的指令而改變圖62和63中所示的部分628。
特別地,在改變部分628中,如果變化信息獲取部分628A要求變化信息R,則強調(diào)信息改變部分628B更新強調(diào)信息Q以產(chǎn)生強調(diào)信息Q′,并在以下將參照圖66說明這時的操作流程。
如果變化信息R輸入,則變化信息獲取部分628A首先進行強調(diào)信息改變開始識別處理(步驟C1′)及強調(diào)信息改變結(jié)束識別處理(步驟C2′),并然后進行改變信息獲取處理(步驟C3′)以識別強調(diào)信息Q以什么方式已經(jīng)被改變。
然后,例如如圖79中所見,根據(jù)識別的結(jié)果,強調(diào)信息改變部分628B進行強調(diào)信息更新處理(步驟C4′)及強調(diào)信息改變處理(步驟C5′),以便更新強調(diào)信息而產(chǎn)生強調(diào)信息Q′。
由于強調(diào)顯示部分613的顯示類型和顯示區(qū)域能夠這樣任意改變,故強調(diào)顯示能夠根據(jù)應(yīng)用自由地進行。
要注意,雖然圖象數(shù)據(jù)字符識別的結(jié)果沒有顯示在圖77或78所示的數(shù)據(jù)輸入顯示區(qū)域部分615中,但數(shù)據(jù)自然能夠被交替顯示。
于是,由根據(jù)本實施例的圖象數(shù)據(jù)顯示裝置640,如果改變指示移動到數(shù)據(jù)要被輸入的數(shù)據(jù)輸入顯示區(qū)域部分615,則同時被參照的條款612的圖象數(shù)據(jù)部分被強調(diào)顯示。于是,即使操作者目光一時離開了顯示單元630并然后又觀看顯示單元630,也能夠防止操作者看錯了條款612。于是,該圖象數(shù)據(jù)顯示裝置640的優(yōu)點在于,當圖象數(shù)據(jù)被參照時防止了匹配中的誤識別并改進了可視性,并此外降低了用于輸入操作的勞務(wù),防止了誤輸入。
進而,當要被參照條款612的圖象數(shù)據(jù)沒有顯示在顯示單元630上時,由于能夠響應(yīng)強調(diào)顯示部分613的移動而自動滾屏,故圖象數(shù)據(jù)顯示裝置640的優(yōu)點還在于,例如可以減少諸如按鍵這種無益的操作。
進而,圖象數(shù)據(jù)顯示裝置640的優(yōu)點在于,強調(diào)顯示部分613的類型或區(qū)域可以由操作者改變并可根據(jù)用途而使用。
要注意,雖然本實施例中當顯示在顯示單元上的文件的圖象數(shù)據(jù)進行強調(diào)顯示時,預(yù)定的條款612如圖70中所見被整個地強調(diào)顯示,但是強調(diào)顯示方式不限于此,并且例如預(yù)定條款612的部分能夠如圖80所見以另外方式強調(diào)顯示。
這里,在圖80所示的顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611中,顯示了包含五個條款“帳號”、“科目”“銀行名字/分理處名字”、“接受者”及“款額”的信息的圖象數(shù)據(jù)。
當要輸入?yún)R款數(shù)據(jù)時,光標指示器616被移動到所希望的一個數(shù)據(jù)輸入顯示部分615,并且對應(yīng)的匯款數(shù)據(jù)輸入到所希望的一個條款612的圖象數(shù)據(jù)部分。這時,如圖80中所見,所希望的條款612的圖象數(shù)據(jù)部分以強調(diào)顯示部分613被強調(diào)顯示(在“銀行名字/分理處名字(Fujitsu銀行)”的位置),并在光標指示器616移動時,如圖81和82中所見強調(diào)顯示部分613也在圖象數(shù)據(jù)顯示區(qū)域611中移動。
要注意,雖然在圖82中強調(diào)顯示的是條款612的字符“接受者(Ichiro Yamada)”,但是如圖83中所見,另外也可以對整個條款612強調(diào)顯示。
進而,例如如圖84中所見,文件的圖象數(shù)據(jù)能夠另外對各個信息在顯示單元630上顯示。
這里,在圖84所示的顯示單元630的圖象數(shù)據(jù)顯示區(qū)域611中,顯示了包含七個條款“銀行名字”、“分理處名字”、“帳號”、“科目”、“款額”、“接受者”及“客戶”的信息的圖象數(shù)據(jù)。
類似地,當要顯示匯款數(shù)據(jù)時,光標指示器616移動到所希望的數(shù)據(jù)輸入顯示區(qū)域部分616,并且對應(yīng)的匯款數(shù)據(jù)輸入到所希望的條款612′的圖象數(shù)據(jù)部分。這時,如圖84中所見所希望的條款612′的圖象數(shù)據(jù)部分以強調(diào)顯示部分613(“科目(1)”的位置)被強調(diào)顯示,并在光標指示器616移動時,如圖85中所見,強調(diào)顯示部分613也在圖象數(shù)據(jù)顯示區(qū)域611中移動。
而且在文件的圖象數(shù)據(jù)這樣顯示之處,能夠達到本實施例的類似的那些優(yōu)點。
要注意,雖然如圖80到85所示在數(shù)據(jù)輸入顯示區(qū)域部分615中沒有顯示出圖象數(shù)據(jù)字符識別的結(jié)果,但是這里自然能夠按其它方式顯示。
進而,雖然在本實施例中,由圖象數(shù)據(jù)輸入裝置閱讀銀行中所使用的文件并且作為圖象數(shù)據(jù)在一個顯示單元之類的屏幕上顯示,但是數(shù)據(jù)媒體不限于此,而是某些其它類型的數(shù)據(jù)(例如一個名單)也可由圖象數(shù)據(jù)輸入裝置閱讀并作為圖象數(shù)據(jù)在一個顯示單元之類的屏幕上顯示。而且這時,也可達到類似于本實施例的優(yōu)點。
此外,雖然本實施例中操作者目視地觀察讀取的圖象數(shù)據(jù)并進行輸入操作,例如當文件由圖象數(shù)據(jù)輸入裝置閱讀文件時,字符識別能夠以另外方式自動地進行,同時操作者僅對于包含被誤識別的或者不能成功識別的字符的條款進行輸入操作。
在采用上述結(jié)構(gòu)之處,能夠達到本實施例那些類似的優(yōu)點,并且此外能夠顯著減少輸入操作所需的勞務(wù)和時間。
(2)讀取的符號顯示-識別信息修改裝置的說明在上節(jié)(1)中詳細說明的圖象數(shù)據(jù)顯示裝置640中,由于圖象數(shù)據(jù)的編輯和顯示是以包含多個字符的條款單元進行的,當要對自動字符識別的結(jié)果是正確還是錯誤進行確認時,通過目視觀察從相繼出現(xiàn)在圖象數(shù)據(jù)中的不同字符中進行對應(yīng)于被識別的確認對象的字符的字符選擇。因而,由于眼睛的移動和涉及許多比較對象,對于正確與錯誤之間的確認操作可能需要許多勞務(wù)和時間。
因而,這種情形下,付款請求處理能夠使用如圖86所示的那種讀取符號顯示-識別信息修改裝置進行。
例如,讀取符號顯示-識別信息修改裝置740取得其上作為圖象寫有諸如款項類別和要支付的款額的付款數(shù)據(jù)的文件,并通過自動字符識別轉(zhuǎn)換付款數(shù)據(jù)的圖象為代碼信息以進行付款請求處理。然而,是由操作者使用鍵盤之類對在轉(zhuǎn)換時不能識別或者誤識別的字符(字符包括數(shù)字。這類似地適用于以下的說明)進行修改。
這里,讀取符號顯示-識別信息修改裝置740對應(yīng)于圖6中所示的數(shù)據(jù)媒體處理裝置30的客戶機10,并且在它連接到圖6所示的服務(wù)器39之處,它的作用是作為一個工作站進行對不能識別的字符或者誤識別的字符的修改處理,這類似于對于由連接到服務(wù)器39的集中化的字符識別處理部分6進行的圖象字符識別的結(jié)果,并向服務(wù)器39輸出修改的結(jié)果。
為此目的,如圖86所示,讀取符號顯示-識別信息修改裝置740包括一個作為圖象移動部分的圖象閱讀器721,一個作為數(shù)據(jù)輸入裝置的鍵盤722,一個硬盤723,一個作為符號識別裝置的計算機主機724和一個顯示單元725。
圖象閱讀器721閱讀全區(qū)域的圖象P,該圖象是具有諸如其上寫出例如圖98所示的付款數(shù)據(jù)的文件上的數(shù)字或者字符的符號信息的圖象,并向計算機主機724輸入作為數(shù)字、字符之類的圖象信息的符號圖象信息的全區(qū)域的圖象P。
要注意,雖然該符號圖象信息是由最小組成單元的的數(shù)字或者字符單元組成,但是它不限于此,并且能夠使用數(shù)字和/或字符集合作為組成單元。進而,多個這種全區(qū)域圖象P能夠被聚集保持。
鍵盤722由操作者人工操作輸入作為正確答案數(shù)據(jù)的適當?shù)拇a數(shù)據(jù),該數(shù)據(jù)對應(yīng)于沒有被成功地自動識別或者被誤識別的符號圖象信息。
進而,顯示單元725顯示從圖象閱讀器由721在閱讀圖象狀態(tài)所輸入的符號圖象信息,并包括一個不能識別的符號圖象信息顯示區(qū)域732A,一個符號圖象信息顯示區(qū)域733A,一個相關(guān)符號圖象信息顯示區(qū)域733B,及一個正確答案數(shù)據(jù)顯示區(qū)域733C。
不能識別的符號圖象信息顯示區(qū)域732A與其周圍的符號圖象信息一同顯示沒有成功被自動識別的符號圖象信息,并對于這種不能識別的符號圖象信息采用取得顯示,使得它能夠從周圍的符號圖象信息被標識出。例如,在圖101的屏幕A中,“1.′?′(拒絕字符)”所示的“2034”中的“3”是不能識別的符號圖象信息,而“2”、“0”和“4”對應(yīng)于周圍的符號圖象信息。
符號圖象信息顯示區(qū)域733A在一個要轉(zhuǎn)換為代碼信息的圖象中顯示最小組成單元的符號圖象信息,這是按照由符號圖象信息的轉(zhuǎn)換所獲得的代碼信息表示的符號信息的對應(yīng)關(guān)系顯示的。
特別地,例如對于數(shù)字,從圖101的屏幕A可見,作為通過劃分一個圖象所獲得的最小組成單元的符號圖象信息,提供了對應(yīng)于“0”到“9”的區(qū)域,并且相同的符號顯示在相同的區(qū)域,其方式是表示“1”的符號圖象信息都顯示在對應(yīng)于“1”的區(qū)域中,以便能夠減少眼睛的移動。
相關(guān)符號圖象信息顯示區(qū)域733B是這樣構(gòu)造的,例如當通過參照字符行的前后字符能夠易于對自動字符識別的結(jié)果的正確和錯誤之間進行確認和修改時,圍繞按強調(diào)顯示的符號信息的圖象信息響應(yīng)例如鍵盤722的參照鍵的按動而被顯示以供參照。例如,在圖103的屏幕F中,“1175”的“7”為按強調(diào)顯示的符號圖象信息,而“1”、“1”和“5”是圍繞它的圖象信息。
正確答案數(shù)據(jù)顯示區(qū)域733C顯示從鍵盤722作為正確答案輸入的適當?shù)拇a數(shù)據(jù)。例如,在圖103的屏幕中,表示出“7”是被輸入的。
進而,圖86所示的讀取符號顯示-識別信息修改裝置740包括上述的硬盤723。硬盤723作用是作為定義信息存儲部分用于存儲讀取的指定信息作為定義信息。要注意,讀取的指定信息表示有關(guān)全區(qū)域圖象P的劃分以及作為代碼數(shù)據(jù)的識別的信息。
圖86所示的計算機主機724功能是作為符號識別裝置(計算機主機724以下可稱為符號識別裝置724),并識別從圖象閱讀器721輸入的圖象符號的圖象信息,轉(zhuǎn)換該符號的圖象信息為代碼數(shù)據(jù),進行符號圖象的預(yù)定處理并在顯示單元725上顯示該圖象。
圖86和87所示作為符號識別裝置的計算機主機724包括一個作為符號識別部分的字符識別部分726,一個讀取符號圖象顯示控制部分727,一個作為正確答案數(shù)據(jù)顯示裝置的正確答案數(shù)據(jù)顯示部分728,一個作為最小組合單元符號圖象信息抽取部分的字符圖象抽取處理部分729,一個作為最小組合單元符號圖象顯示看錯部分的字符圖象顯示處理部分730,一個作為相關(guān)符號圖象顯示裝置的相關(guān)符號圖象顯示部分731,一個作為識別信息修改裝置的識別信息修改部分752,以及一個相關(guān)信息產(chǎn)生部分741。
字符識別部分726識別由圖象閱讀器721所讀取的圖象中的符號圖象信息,并轉(zhuǎn)換它為對應(yīng)的代碼信息。字符識別部分726具有類似于例如字符識別裝置之類的功能。
字符識別部分726參照由圖象閱讀裝置721所讀取的全區(qū)域圖象P或存儲在硬盤723上的讀指定信息(定義信息)以產(chǎn)生識別字符信息S。
識別字符信息S表示由字符識別部分726識別的字符的代碼數(shù)據(jù)并如圖99中所見由“條款名稱”、“條款列數(shù)”和“識別結(jié)果”表示。
“條款名稱”對應(yīng)于圖98的全區(qū)域圖象P中的“水價格”及“電費帳單”并具有條款“SUI-1到SUI-4”及“DEN-1到DEN-4”。
“條款列數(shù)”是一個條款的列的數(shù)目,并在這時設(shè)定為使得可輸入六個字符和/或數(shù)字?!白R別結(jié)果”表示識別為字符的代碼數(shù)據(jù)的代碼信息。要注意,從與另外所示的正確答案數(shù)據(jù)相比可見,“SUI-1”和“SUI-4”識別的結(jié)果分別是該識別為不可能和該識別有錯誤。
當符號圖象信息沒有成功地被轉(zhuǎn)換為對應(yīng)的代碼信息時,讀符號圖象顯示控制部分727在顯示單元725上與讀取的圖象狀態(tài)中的未識別的符號圖象信息相關(guān)符號圖象信息一同顯示這一未識別的沒有成功轉(zhuǎn)換的符號圖象信息。
特別地,讀符號圖象顯示控制部分727在顯示單元725上顯示即沒有被字符識別部分726識別也沒有被成功轉(zhuǎn)換為對應(yīng)的代碼信息的符號圖象信息,該信息是作為未識別的符號圖象信息與位于未識別的符號圖象信息周圍的相關(guān)的符號圖象信息一同在未識別的符號圖象信息顯示區(qū)域732A中以讀取的圖象狀態(tài)顯示的。
進而,讀取的符號圖象顯示控制部分727包括一個強調(diào)顯示部分727A作為強調(diào)顯示裝置用于強調(diào)顯示未識別的符號圖象信息,以便使得易于由操作者識別出未識別的符號圖象信息。
讀符號圖象顯示控制部分727還包括一個強調(diào)顯示改變部分727B作為強調(diào)顯示改變裝置,用于如果正確答案數(shù)據(jù)由正確答案數(shù)據(jù)顯示部分728顯示在顯示單元725上不同于未識別的符號圖象信息顯示區(qū)域732A的正確答案數(shù)據(jù)顯示區(qū)域733C中,則改變已經(jīng)強調(diào)顯示的未識別的符號圖象信息的顯示為表示完成修改的另一種強調(diào)顯示。
字符圖象抽取處理部分729抽取圖象中最小組合單元的符號圖象信息,以轉(zhuǎn)換為用于最小組合單元符號圖象信息每一片的代碼信息。
特別地,字符圖象抽取處理部分729劃分并抽取其最小組合單元例如為數(shù)字或字符的符號圖象信息為以數(shù)字或字符為單元的信息并作為這樣的信息,并參照存儲在硬盤723上的全區(qū)域圖象P或者讀指定信息(定義信息)以產(chǎn)生相關(guān)信息R。
字符圖象信息和相關(guān)信息R通過執(zhí)行圖91所示的流程圖的步驟B1″到B8″而產(chǎn)生。
特別地,全區(qū)域圖象P劃分為字符單元以產(chǎn)生字符圖象信息(步驟B1″),并取得全區(qū)域圖象P上的字符圖象信息的位置(文件上的位置)信息(步驟B2″)。
然后,鑒別字符圖象信息是否指定給預(yù)定的條款(水價格,電費帳單等),并如果字符圖象信息指定給預(yù)定的條款,則字符圖象信息對于各個條款被分類(步驟B4″),并設(shè)置各個圖象信息在各個條款中的位置信息(步驟B5″)。
在字符圖象信息沒有指定給預(yù)定的條款之處,它對于有關(guān)作為條款的行的各個條款被分類(步驟B6″),并設(shè)置各個條款中的字符圖象信息的位置信息(步驟B7″)。
使用這樣設(shè)置的各個條款中的字符圖象信息的位置信息產(chǎn)生相關(guān)信息R(步驟B8″)。要注意,相關(guān)信息R具有與被識別的字符相關(guān)的識別字符信息。
字符圖象顯示處理部分730具有引起由字符圖象抽取處理部分729所抽取的最小組成單元的符號圖象信息(例如以數(shù)字或者字符為單元的圖象信息)按照與通過符號圖象信息轉(zhuǎn)換所獲得的代碼信息所代表的符號信息的對應(yīng)關(guān)系而顯示的功能,并具有引起相同類型的多片最小組合單元的符號圖象信息按照與與通過符號圖象信息轉(zhuǎn)換所獲得的代碼信息所代表的符號信息的對應(yīng)關(guān)系而顯示的功能。
具體來說,例如字符圖象顯示處理部分730引起通過由字符圖象抽取處理部分729所抽取的“1”的圖象信息的轉(zhuǎn)換所獲得的代碼信息,顯示在在顯示單元725上“0”到“9”等多個符號被顯示的符號圖象信息顯示區(qū)域733A的部分內(nèi)“1”這個符號信息要被顯示的部分處。
字符圖象顯示處理部分730包括一個作為用于僅對于所希望的一個符號圖象信息進行強調(diào)顯示的強調(diào)顯示裝置的強調(diào)顯示部分730A,使得易于識別當前正在被處理的圖象信息。
進而,如果由作為數(shù)據(jù)輸入裝置的鍵盤722的操作而輸入正確答案數(shù)據(jù),則作為強調(diào)顯示改變裝置的強調(diào)顯示改變部分730B進行另一個強調(diào)顯示,該強調(diào)顯示表示對于已經(jīng)按強調(diào)方式被強調(diào)的一個符號的信息的修改的完成,以使得在修改之前該符號圖象信息與修改之后該符號圖象信息之間易于識別。
在顯示單元725上相關(guān)的符號圖象顯示部分731一同顯示符號圖象的信息與讀取的圖象狀態(tài)中的符號圖象信息相關(guān)的符號信息。
具體來說,在顯示單元725上的相關(guān)符號圖象信息顯示區(qū)域733B中,相關(guān)符號圖象顯示部分731一同顯示一個符號圖象的信息與位于讀取的圖象狀態(tài)的符號圖象信息周圍的相關(guān)的符號圖象信息,并當通過例如參照字符行中先前的和隨后的字符而能夠?qū)ψ址詣幼R別的結(jié)果的修改的正確和錯誤之間易于進行確認時,則顯示供參照而被強調(diào)顯示的圖象信息周圍的圖象信息。
進而,相關(guān)符號圖象顯示部分731包括作為強調(diào)顯示裝置用于對符號圖象的信息進行強調(diào)顯示的一個強調(diào)顯示部分731A,并使得易于從相關(guān)的符號圖象信息識別。
如果正確答案數(shù)據(jù)通過鍵盤722的操作輸入,則正確答案顯示部分728引起正確答案數(shù)據(jù)被顯示在顯示單元725上的正確答案數(shù)據(jù)顯示區(qū)域733C中,該區(qū)域是不同于符號圖象信息顯示區(qū)域733A及相關(guān)符號圖象信息顯示區(qū)域733B的一個區(qū)域。
進而,如果從鍵盤722輸入對于不能識別的符號圖象信息或者誤識別的符號圖象信息的正確答案數(shù)據(jù),則識別信息修改部分752寄存正確答案數(shù)據(jù)作為正確答案代碼數(shù)據(jù)以實現(xiàn)對不能識別的符號圖象信息或者誤識別的符號圖象信息的修改,并如圖88中所見包括一個修改信息取得處理部分742和修改結(jié)果反映處理部分743。
相關(guān)信息產(chǎn)生部分741參照相關(guān)信息R和識別字符信息S以產(chǎn)生具有識別字符信息的相關(guān)信息R′。
如圖100中所見,相關(guān)信息R′表示多個字符信息的“全區(qū)域圖象上的位置和尺寸”,“對應(yīng)的字符條款名稱”,“對應(yīng)的條款圖象名稱”,“條款內(nèi)列位置”,“識別字符”,“字符識別信息中的位移”和“修改完成標志”。
這里,“全區(qū)域圖象上的位置和尺寸”表示全區(qū)域圖象P上的字符圖象信息的位置信息并以比特單位表示。
“對應(yīng)的字符條款名稱”表示字符圖象信息所屬的條款(諸如“SUI-1到SUI-4”)。“對應(yīng)的條款圖象名稱”表示字符圖象信息所屬的條款,并對應(yīng)于“對應(yīng)的字符條款名稱”(諸如“SUI-1到SUI-4”)。
例如,雖然圖99所示的條款“SUI-1”對應(yīng)于識別字符信息“1050”,但它包含圖100中所見的字符圖象1到4的信息并具有“ISUI-1”的圖象名稱。
此外,“條款內(nèi)列位置”表示在一個條款中字符圖象信息的位置?!白R別字符”表示表示字符信息S,并表示識別位置“1”在條款中第三列位置,“0”在第四列位置,“5”在第五列位置,并且“0”第六列位置。
進而,雖然在圖100中“修改完成標志”都是“OFF”,當對不能識別的字符或誤識別的字符進行修改時,對應(yīng)于字符圖象的信息的“修改完成標志”則變?yōu)椤癘N”使得表示出對其修改已經(jīng)進行。
要注意,字符圖象信息也由“字符識別信息中的位移”信息定義。
相關(guān)信息R’由諸如圖92中所示的處理產(chǎn)生。
首先,對于由條款和/或行表示的各個位置信息對識別字符信息S進行分類(步驟C1′),而被分類的識別字符信息S加到對應(yīng)的相關(guān)信息R上(步驟C2′)。然后,鑒別識別字符信息S的條款和/或行內(nèi)字符的數(shù)目是否在相關(guān)信息R的條款或者行內(nèi)字符數(shù)目之內(nèi)(步驟C3′)。進而鑒別識別字符信息S的條款和/或行的數(shù)目是否在相關(guān)信息R的條款或者行數(shù)目之內(nèi)(步驟C4′)。然后基于該鑒別,更新相關(guān)信息R以產(chǎn)生相關(guān)信息R′。
實際上,讀符號顯示-識別信息修改裝置740是通過向計算機主機724裝設(shè)適當?shù)挠布?gòu)成的,這些硬件能夠向硬盤提供上述功能部分,諸如字符識別部分726,讀符號圖象顯示控制部分727,字符圖象抽取處理部分729,字符圖象顯示處理部分730,相關(guān)符號圖象顯示部分731,正確答案數(shù)據(jù)圖象顯示部分728以及相關(guān)信息產(chǎn)生部分741。
根據(jù)本實施例具有上述結(jié)構(gòu)的讀符號顯示-識別信息修改裝置740操作方式如下。
供閱讀的對象文件的全區(qū)域圖象P由圖87所示的圖象閱讀裝置721產(chǎn)生,并且全區(qū)域圖象P轉(zhuǎn)換為字符圖象信息,并應(yīng)用讀指定信息(定義信息)由符號識別裝置724產(chǎn)生相關(guān)信息R′。
當應(yīng)用相關(guān)信息R′字符圖象信息顯示在顯示單元上時,顯示單元725上的初始屏幕如圖101的屏幕A那樣。
這時,作為拒絕字符和位于該拒絕字符周圍的“2034”和“1201”顯示在不能識別的符號圖象信息顯示區(qū)域732A中,并且表示“0”到“9”的字符圖象顯示在符號圖象信息顯示區(qū)域733A中“0”到“9”的區(qū)域中。
要注意,顯示在不能識別的符號圖象信息顯示區(qū)域732A中的“2034”以寬框強調(diào)顯示,以便指示這些字符是修改對象,并且作為不能識別的字符的拒絕字符“3”以斜線強調(diào)顯示。類似地,在不能識別的符號圖象信息顯示區(qū)域732A中顯示的“1201”中,作為不能識別的字符的拒絕字符“2”以斜線強調(diào)顯示。
這里,如圖101到104中所示這種字符圖象信息的顯示是由圖87中所示的符號識別這種724進行的,并且將參照圖93說明這時的操作流程。
首先,符號識別這種724取得全區(qū)域圖象P(步驟D1″),并復(fù)制相關(guān)信息R′且對其按識別字符信息S的順序分類(步驟D2″)。
鑒別該識別字符是否為不能識別的拒絕字符(步驟D3″),并如果它為拒絕字符,則符號識別裝置724取得圍繞它的和/或一個條款的字符圖象信息并在不能識別的符號圖象信息顯示區(qū)域732A中顯示該信息(步驟D4″)。要注意,步驟D1″到D4″的操作按這種拒絕字符的數(shù)目重復(fù)(步驟D5″)。
另一方面,當識別字符不是拒絕字符時,符號識別裝置724在符號圖象信息顯示區(qū)域733A的對應(yīng)區(qū)域中顯示該字符圖象信息(步驟D6″),并且步驟D6″的操作按識別字符的數(shù)目重復(fù)(步驟D7″)。
如果操作者使用鍵盤722在圖101所示的初始屏幕A那樣的狀態(tài)輸入“3”作為正確答案數(shù)據(jù),則“3”正確答案數(shù)據(jù)顯示區(qū)域733C中,并然后例如如果按動確定鍵,則如屏幕B上所示,顯示在不能識別的符號圖象信息顯示區(qū)域732A中的作為在“2034”的拒絕字符的“3”的位置的強調(diào)顯示從斜線顯示變?yōu)榫W(wǎng)格強調(diào)顯示,這指示拒絕字符已經(jīng)被修改。識別字符信息S與此一同被修改,并且相關(guān)信息R′被更新。
進而,在屏幕B上,相應(yīng)指示“2034”中的拒絕字符“3”已經(jīng)被修改的網(wǎng)格強調(diào)顯示的變化,寬框的強調(diào)顯示自動地施加到下一個修改對象的“1201”上。
進而,如果在上述屏幕B的那種狀態(tài)下,操作者使用鍵盤722輸入“2”作為正確答案數(shù)據(jù),則“2”顯示在正確答案數(shù)據(jù)顯示區(qū)域733C中。然后,如果按動確定鍵,則顯示在不能識別的符號圖象信息顯示區(qū)域732A中作為在“1201”的拒絕字符的“2”的位置的強調(diào)顯示從斜線顯示變?yōu)榫W(wǎng)格強調(diào)顯示,這指示拒絕字符已經(jīng)被修改。識別字符信息S對此響應(yīng)而被修改,并且相關(guān)信息R′被更新。
順便來說,在顯示在符號圖象信息顯示區(qū)域733A的“0”到“9”區(qū)域中表示“0”到“9”字符圖象的任何一個為不同之處,即在字符圖象信息被誤識別之處,例如如果操作者按動鍵盤722的Tab鍵,則寬框的強調(diào)顯示從“1.′?′(即將字符)”移動到顯示單元725的“2.′0′”的區(qū)域,如圖102中所見。
進而,如果重復(fù)按動tab鍵,則如圖103的屏幕E中所見寬框的強調(diào)顯示移動到“3.′1′”區(qū)域。重復(fù)這樣作,表示修改對象的寬框強調(diào)顯示相繼在顯示單元725中移動。
特別地,當寬框的強調(diào)顯示要在“0”到“9”的區(qū)域之間移動時,按動tab鍵以選擇所希望的字符圖象的信息,并在圖103的屏幕E上作為誤識別的結(jié)果而顯示的字符圖象信息“7”(即“7”的圖象已經(jīng)被轉(zhuǎn)換為“1”的代碼信息)以寬框強調(diào)顯示。
這里,在“7”的字符圖象信息是正確還是錯誤不能由其自身易于辨別之處,如果如圖89所見操作者按動鍵盤722的參照鍵,則從如圖103屏幕所見,作為相關(guān)符號圖象顯示裝置的相關(guān)符號圖象顯示部分731參照相關(guān)信息R′在相關(guān)符號圖象顯示區(qū)域733B顯示參照圖象。
如果,在上述屏幕F這種狀態(tài)下,操作者使用鍵盤722輸入“7”作為正確答案數(shù)據(jù)并按動確定鍵,則“7”顯示在正確答案數(shù)據(jù)顯示區(qū)域733C中,并且“7”的字符圖象信息的代碼信息從誤識別的“1”修改為“7”,如圖104中所見。然后,表示這種修改已經(jīng)進行的網(wǎng)格強調(diào)顯示施加到“7”的字符圖象信息上。
特別地,識別字符信息S和相關(guān)信息R′被更新,并且指示修改已經(jīng)進行的的強調(diào)顯示施加到“7”的修改的字符圖象信息上。
這里,如圖89中所示的參照圖象顯示處理如以上所述由相關(guān)符號圖象顯示部分731進行,并且將參照圖97說明這時的操作流程。
首先,鑒別參照圖象是否被顯示(步驟H1′)。如果參照圖象沒有被顯示,則相關(guān)符號圖象顯示部分731檢索按強調(diào)顯示的相關(guān)對象的字符圖象信息的相關(guān)信息R′(步驟H2′)。
然后,取得圍繞相關(guān)對象和/或條款的字符圖象信息的圖象信息(步驟H3′),并且設(shè)置參照圖象要顯示的位置為使得參照圖象不會覆蓋按強調(diào)顯示的相關(guān)對象的字符圖象信息的位置(步驟H4′)。然后,顯示參照圖象(步驟H5′)。
要注意,如果在參照圖象顯示時再次按動參照鍵,則參照圖象被刪除(步驟H6′)。
這里,通過圖87和88中所示的相關(guān)信息獲取處理部分742與相關(guān)結(jié)果反映處理部分743,以及作為強調(diào)顯示改變裝置的強調(diào)顯示改變部分727B,進行對于如圖101到104中所見的字符圖象信息的這種修改,以下將參照圖94到96說明這時的操作流程。
如圖88中所見,如果操作者通過鍵盤722輸入正確答案數(shù)據(jù),則該正確答案數(shù)據(jù)作為修改信息輸入到修改信息獲取處理部分742,而修改結(jié)果反映處理部分743使用修改信息和相關(guān)信息R′產(chǎn)生識別字符信息S,并修改與更新相關(guān)信息R′。同時,強調(diào)顯示改變部分727B參照修改信息向已經(jīng)被修改的條款施加指示這種修改的強調(diào)顯示。
這時,如圖94中所見輸入屏幕被顯示(步驟E1″)那樣,修改信息獲取處理部分742鑒別識別字符是否為不能識別的字符的拒絕字符(步驟E2″)。如果識別字符為拒絕字符,則修改信息獲取處理部分742向外圍和/或條款圖象信息施加表示該外/圍條款圖象信息為供修改的拒絕條款的寬框強調(diào)顯示(步驟E3″),并向作為識別字符的該拒絕字符施加不同于寬框的斜線式的另一種強調(diào)顯示(步驟E4″)。
反之,如果識別字符不是拒絕字符,則寬框的強調(diào)顯示施加到該字符圖象信息(步驟E5″)。
這里,例如如果由操作者操作鍵盤722按動TAB鍵或參照鍵(用于在由TAB鍵移動方向相反方向上移動光標的鍵)(步驟E6”),則指示修改對象的寬框的強調(diào)顯示被移動而使得下一個字符圖象信息能夠被表示為修改對象(步驟E7″)。如果寬框的強調(diào)顯示移動到最后的字符圖象信息,然后這一操作由第一字符圖象信息開始進行(步驟E8″)。
要注意,如果按動其它鍵,則向修改信息產(chǎn)生部分741報告修改信息(步驟E9″)。
另一方面,圖88所示的修改結(jié)果反映處理部分743,如圖95中所見,檢索按強調(diào)顯示的字符圖象信息的相關(guān)信息R′(步驟F1″),修改識別字符(不能識別的字符或者誤識別字符)(步驟F2″),修改相關(guān)信息R′的識別字符(步驟F3″),并顯示或刪除參照圖象(步驟F4″)。
進而,圖88所示的強調(diào)顯示修改部分727B如圖96中所見取得修改信息(步驟G1″)并施加表示修改已經(jīng)進行的強調(diào)顯示(步驟G2″)。
如上所述,由讀符號顯示-識別信息修改裝置740對字符圖象信息的顯示與修改以及參照圖象的顯示,如圖90中所見,是通過以下步驟進行的獲取作為全區(qū)域圖象P的圖象數(shù)據(jù)(步驟A1″),抽取字符圖象信息(步驟A2″),獲取識別字符圖象信息(步驟A3″),產(chǎn)生相關(guān)信息(步驟A4″),顯示字符圖象信息(步驟A5″),獲取修改信息(步驟A6″),按動數(shù)據(jù)鍵或參照鍵(步驟A7″),響應(yīng)世界鍵的按動而反映修改結(jié)果(步驟A8″),強調(diào)顯示修改的字符圖象信息(步驟A9″),以及由計算機主機724響應(yīng)參照鍵的按動而顯示參照圖象(步驟A10″),并且這一處理是對于所有被顯示的字符圖象信息進行的(步驟A11″)。
這樣,使用根據(jù)本實施例的讀符號顯示-識別信息修改裝置740,沒有被計算機主機724成功地識別的不能識別的字符的圖象信息,在讀取的圖象狀態(tài)下在顯示單元725上圍繞不能識別的字符與字符圖象信息一同顯示,并且向不能識別的字符的圖象信息施加強調(diào)顯示。于是,的讀符號顯示-識別信息修改裝置740的優(yōu)點在于,通過參照字符行中前后的字符圖象信息,能夠進行高精確度的確認操作,并能夠降低正確與錯誤之間的確認操作所需的勞務(wù)和時間。
進而,使用使用根據(jù)本實施例的讀符號顯示-識別信息修改裝置740,如果對應(yīng)于不能識別的字符或者誤識別的字符的正確答案數(shù)據(jù)通過操作鍵盤722輸入,則正確答案數(shù)據(jù)顯示在顯示單元725上,并且直到現(xiàn)在被強調(diào)強調(diào)顯示的不能識別的字符或者誤識別的圖象信息以表示完成修改的不同的強調(diào)顯示而被顯示。于是,該讀符號顯示-識別信息修改裝置740的優(yōu)點在于,能夠易于辨別一個字符對其一個不能識別的字符的輸入或者對一個誤識別的字符的修改已經(jīng)進行與另一個字符對其這種操作沒有進行,于是提高了目視可辨別性而防止了被操作者雙重修改等,從而顯著降低了正確和錯誤之間的確認操作所需的勞務(wù)和時間。
此外,使用根據(jù)本實施例的讀符號顯示-識別信息修改裝置740,符號能夠以易于進行目視觀察的單位被顯示,使得只有相同的符號顯示在顯示單元上相同的區(qū)域中,并只向所希望的一個字符圖象的信息施加強調(diào)顯示。于是,讀符號顯示-識別信息修改裝置740的優(yōu)點在于,操作者只要參照圖象信息而無需參照相關(guān)的外圍字符圖象的信息即能夠確認識別結(jié)果為正確或者錯誤,于是能夠顯著減少操作者眼睛的移動,其優(yōu)點還在于能夠把強調(diào)顯示僅施加到正在被處理的字符圖象信息以減少比較對象,并且顯著降低了正確和錯誤之間的確認操作所需的勞務(wù)和時間。
進而,使用根據(jù)本實施例的讀符號顯示-識別信息修改裝置740,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域中,該區(qū)域不同于其中顯示如上述的一個字符圖象信息和與該字符圖象信息相關(guān)的周圍字符圖象信息的區(qū)域。于是,讀符號顯示-識別信息修改裝置740的優(yōu)點在于,能夠通過目視觀察對字符圖象信息和輸入的正確答案數(shù)據(jù)進行再確認,于是降低了正確和錯誤之間的確認操作所需的勞務(wù)和時間,此外確認操作能夠以高精確度進行。
要注意,雖然本實施例中,當要修改不能識別的字符或者誤識別的字符時,對于不能識別的字符或者誤識別的字符所輸入的正確答案數(shù)據(jù)顯示在顯示單元725的正確答案數(shù)據(jù)顯示區(qū)域733C中,不能識別的字符或者誤識別的字符能夠以另外的方式被修改而不必對不能識別的字符或者誤識別字符顯示正確答案,或者另外只對于不能識別的字符和誤識別的字符之一的正確答案能夠被顯示以修改不能識別的字符或者誤識別的字符。
進而,雖然本實施例中,如圖98中所見的那種表格格式的文件用作為其上描述存入數(shù)據(jù)的文件,都是其上描述存入數(shù)據(jù)的文件不限于此,而是可使用任何其它格式的文件。
(b)對本發(fā)明該實施例的修改的說明(b1)根據(jù)對該實施例的第一修改的文件識別裝置的說明圖105是表示根據(jù)對本發(fā)明的該實施例的第一修改的文件識別裝置。而且圖105所示的文件識別裝置能夠由以下裝置組成圖象數(shù)據(jù)閱讀裝置811,計算機812(這一計算機812包括如下所述的一個輸入部分812-1,一個顯示單元812-2,及一個控制部分812-3),以及類似于上述圖115的硬盤的一個硬盤813(參照標號1001,1002和1003)。
圖象數(shù)據(jù)閱讀裝置811閱讀文件的圖象數(shù)據(jù),并對于這一圖象數(shù)據(jù)閱讀裝置811能夠使用類似于參照圖115上述的一個光學(xué)字符閱讀裝置(OCR裝置),一個圖象掃描器等。
基于由圖象數(shù)據(jù)閱讀裝置811所讀取的文件的圖象數(shù)據(jù),控制部分812-3進行作為文件數(shù)據(jù)的處理,并能夠由作為CPU和存儲器的計算機812的功能部分形成。
進而,類似于參照圖115前面所述的部分,控制部分812-3連接到諸如鍵盤或鼠標等輸入部分(參照在以下將說明的圖106的標號812-1),該輸入部分用于由操作者輸入數(shù)據(jù)、指令等到控制部分812-3,并連接到一個顯示單元(參照在以下將說明的圖106的標號812-2),該顯示單元用于顯示由圖象數(shù)據(jù)閱讀裝置811所閱讀的圖象數(shù)據(jù)等。
硬盤(文件存儲器)813存儲所有由圖象數(shù)據(jù)閱讀裝置所讀取的文件的圖象數(shù)據(jù)。
順便來說,如圖105所示,控制部分812-3在功能上包括一個圖象數(shù)據(jù)截取部分815,一個文件標識字典部分816,一個數(shù)據(jù)比較部分817,一個閾值設(shè)定部分818,一個文件鑒別部分819,一個定義尺寸部分820,一個定義存儲表821,一個字符識別部分822,及一個字符識別結(jié)果存儲部分823。
圖象數(shù)據(jù)存儲器814存儲由圖象數(shù)據(jù)閱讀裝置811曾經(jīng)讀取的文件的圖象數(shù)據(jù)。圖象數(shù)據(jù)截取部分815具有作為文件標識信息抽取裝置的功能并形成一抽取對象,該抽取裝置用于響應(yīng)基于由操作者進行的輸入部分812-1的操作的信息指令(標識信息),從存儲在圖象數(shù)據(jù)存儲器814的文件的圖象數(shù)據(jù)抽取在文件上描述的所希望的文件標識信息。
當上述的圖象數(shù)據(jù)截取部分815從標識信息抽取所需的文件標識信息時,由圖象數(shù)據(jù)閱讀裝置811讀取的文件的圖象數(shù)據(jù)顯示(投影)在顯示單元812-2上,并且操作者能夠基于顯示在顯示單元812-2上的圖象數(shù)據(jù)指令標識信息。
要注意,作為通過圖象數(shù)據(jù)截取部分815構(gòu)成抽取對象的信息,例如通過軟件或固件處理操作者能夠指令例如任何所述的信息,諸如字符信息,標記,文件上描述的印章或劃線,并且圖象數(shù)據(jù)截取部分815自動地抽取被指令的信息的坐標位置信息,所述信息大小信息及數(shù)據(jù)信息,作為文件標識信息。
進而,文件標識字典部分(文件標識字典)816記錄由圖象數(shù)據(jù)截取部分815作為特定文件的文件標識所抽取文件標識信息。
更具體來說,如圖108所見,加有ID號碼′0101′文件類型A的文件標識信息存儲在區(qū)域816a中,而加有ID號碼′0102′文件類型B的文件標識信息存儲在區(qū)域816b中。
于是,作為從通過圖象數(shù)據(jù)閱讀裝置811所讀取的特定文件的圖象數(shù)據(jù)抽取寫在文件上的標識信息并向文件標識字典部分816記錄文件標識信息的記錄步驟的操作是由上述圖象數(shù)據(jù)存儲器814,圖象數(shù)據(jù)截取部分815及文件標識字典部分816進行的。
要注意,雖然當文件標識信息要被記錄到文件標識字典部分816時,由上述的圖象數(shù)據(jù)閱讀裝置811所讀取的文件的圖象數(shù)據(jù)一度存儲到圖象數(shù)據(jù)存儲器814中,但是由圖象數(shù)據(jù)閱讀裝置所閱讀的所有文件的圖象數(shù)據(jù)是存儲到硬盤813上的。
數(shù)據(jù)比較部分817具有作為校驗裝置的功能,用于讀出存儲在圖象數(shù)據(jù)存儲器814中的特定文件的圖象數(shù)據(jù)并校驗該特定文件的圖象數(shù)據(jù)是否包含存儲在文件標識字典部分816中記錄的文件標識信息,并還具有作為參照裝置的功能,用于檢測由圖象數(shù)據(jù)閱讀裝置811所讀取的并存儲在圖象數(shù)據(jù)存儲器814中的任意文件的圖象數(shù)據(jù)是否包含存儲在文件標識字典部分816中的文件標識信息,從而簡化了裝置的結(jié)構(gòu)。
進而,文件鑒別部分819具有作為鑒別裝置的功能,用于鑒別特定文件的識別是否能夠基于由作為校驗裝置的數(shù)據(jù)比較部分817所校驗的結(jié)果進行以便鑒別該特定文件是否已經(jīng)被完全確定為一個文件,并具有作為文件標識裝置的另一個功能,用于基于由作為參照裝置的比較部分所進行的參照的結(jié)果辨別任意一個文件是否為一個特定的文件,從而簡化了裝置的結(jié)構(gòu)。
更具體來說,作為校驗裝置的數(shù)據(jù)比較部分817,從文件標識字典部分816一個接一個圖象地從存儲在硬盤813有關(guān)所有文件的圖象數(shù)據(jù),相繼抽取由圖象數(shù)據(jù)截取部分815按文件的圖象數(shù)據(jù)為單元所抽取的信息,以及對應(yīng)的文件標識信息,并對比檢驗這些信息。作為鑒別裝置的文件鑒別部分819,基于來自數(shù)據(jù)比較部分817的文件標識信息對比檢驗的結(jié)果,而鑒別該文件是否能夠被唯一無誤地確定。
進而,作為參照裝置的數(shù)據(jù)比較部分817對由圖象數(shù)據(jù)截取部分815從由圖象數(shù)據(jù)閱讀裝置811輸入的圖象數(shù)據(jù)所抽取的信息,與來自文件標識字典部分816對應(yīng)的文件標識信息進行對比檢驗,以便計算相符的程度。作為文件鑒別裝置的文件鑒別部分819對于來自數(shù)據(jù)比較部分817的文件標識信息與來自閾值設(shè)定部分818的閾值進行比較,以鑒別從圖象數(shù)據(jù)閱讀裝置811所輸入的圖象數(shù)據(jù)的文件是否能夠被辨別。
于是,進行作為鑒別特定文件的識別是否可能的檢驗步驟的操作,并通過上述的文件標識字典部分816,數(shù)據(jù)比較部分817,閾值設(shè)置部分818和文件鑒別部分819進行作為鑒別任意文件是否為特定文件的操作步驟的操作。
換言之,上述的記錄步驟對應(yīng)于圖3的<當布局第一次出現(xiàn)時>的處理(布局分析處理A2,操作者處理A6及布局學(xué)習(xí)處理A8),而上述的檢驗步驟和操作步驟對應(yīng)于圖3的<當布局再次出現(xiàn)時>的處理(布局分析處理A9,布局對比檢驗處理A10,和操作者處理A13)。
要注意,在基于來自上述閾值設(shè)定部分818的閾值信息由文件的鑒別部分819進行一致性鑒別時,來自上述閾值設(shè)定部分818的閾值信息設(shè)定為這樣的程度,即使得鑒別的進行能夠吸收在圖象數(shù)據(jù)閱讀注重811的閱讀操作時的誤差,文件自身的打印誤差等等。
當文件鑒別部分819鑒別有關(guān)任意文件為特定文件時,即當系統(tǒng)操作時文件識別部分819成功地識別出其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置811讀取的文件是一個對應(yīng)于記錄在文件識別字典部分816中的文件標識信息的特定文件時,定義存儲部分820從定義存儲表821讀出用于文件上所描述的數(shù)據(jù)的識別的定義信息,并在其中存儲該定義信息一次。
定義存儲表821存儲定義信息(例如,閱讀位置信息,字符屬性信息,閱讀列數(shù)等等),該信息要用于對應(yīng)于記錄在文件標識字典部分816中文件標識信息的一個特定文件上所描述的內(nèi)容的字符識別。
字符識別部分822接收存儲在上述圖象數(shù)據(jù)存儲器814中的圖象數(shù)據(jù),且該數(shù)據(jù)與已經(jīng)成功地被標識為記錄在文件標識字典部分816中的一個特定文件的文件及對應(yīng)于來自定義存儲部分820的圖象數(shù)據(jù)的定義信息相關(guān),并且字符識別部分822根據(jù)該定義信息進行該圖象數(shù)據(jù)的字符識別處理。
進而,字符識別結(jié)果存儲部分823存儲由字符識別部分822所識別的字符信息。
以下就上述的記錄步驟,檢驗步驟和操作步驟,說明根據(jù)具有上述結(jié)構(gòu)的本發(fā)明該實施例的第一修改的文件標識裝置的的操作。
·記錄步驟中的處理的說明首先,以下參照標出了記錄步驟中的操作的圖106中所示的控制框圖以及表示在圖107和圖108中所示的記錄步驟中的操作的流程圖,說明根據(jù)本實施例的文件標識裝置在記錄步驟中的操作。
具體來說,如圖108中所見,如果響應(yīng)操作者的操作由圖象數(shù)據(jù)閱讀裝置811閱讀電費繳納通知文件824B的圖象數(shù)據(jù)(圖107的步驟B1),則所讀取的圖象數(shù)據(jù)一度存儲到圖象數(shù)據(jù)存儲裝置814中(圖107的步驟B2),并且該圖象數(shù)據(jù)也存儲到硬盤813使得由圖象數(shù)據(jù)閱讀裝置811讀取的所有圖象數(shù)據(jù)被存儲(圖107的步驟B3)。要注意,如圖108中所見由圖象數(shù)據(jù)閱讀裝置811讀取的圖象數(shù)據(jù)顯示在顯示單元812-2上(圖107的步驟B4)。
這里,在存儲在圖象數(shù)據(jù)存儲器814和硬盤813中的圖象數(shù)據(jù)為有關(guān)對于第一時間所讀取的一個文件的圖象數(shù)據(jù)之處,文件標識信息存儲到如下所述的文件標識字典部分816中。
具體而言,在操作者參照顯示單元812-2并操作輸入部分812-1時,構(gòu)成抽取對象的多片信息被指令到圖象數(shù)據(jù)截取部分815(圖107的步驟B5)。
圖象數(shù)據(jù)截取部分815從存儲在圖象數(shù)據(jù)存儲器814中的文件的圖象數(shù)據(jù)中自動地抽取文件上所描述的信息中的位置信息,尺寸信息及數(shù)據(jù)信息(圖107的步驟B6),并作為文件的標識信息記錄這些信息到文件標識字典部分816(圖107的步驟B)。
例如,如圖108中所見,操作者操作輸入部分812-1指定表示繳納通知的繳納款項內(nèi)容的“電費”為第一信息,并指定表示付費人的姓名的“Ichiro Fuji”為第二信息。于是,圖象數(shù)據(jù)截取部分815存儲上述第一信息的位置信息,尺寸信息和數(shù)據(jù)信息,并抽取第二信息的位置信息,尺寸信息和數(shù)據(jù)信息。
因而,所抽取的文件824B的文件標識信息作為其ID號碼為“0102”的B類文件的文件標識信息存儲到文件標識字典部分816的區(qū)域816b。
要注意,在根據(jù)本修改的文件標識裝置中,由圖象數(shù)據(jù)截取部分815所截取的圖象數(shù)據(jù)通常僅用于文件的標識。
進而,在根據(jù)本修改的文件標識裝置中,通過記錄多片關(guān)于一個文件的文件標識信息,無需進行以上如(a5)特征數(shù)據(jù)識別處理中所述的圖象數(shù)據(jù)的歸一化處理,而能夠在以下所述的的檢驗步驟和操作步驟標識一個文件。
·檢驗步驟中的處理的說明接下來,以下將參照標出檢驗步驟操作的圖109中所示的控制框圖和表示檢驗步驟中的操作的圖110中所示的流程圖,說明根據(jù)本實施例的文件標識裝置在檢驗步驟中的操作。
如上所述,在記錄步驟,文件表示信息記錄到文件表示字典部分816。然后,進行作為檢驗步驟的操作,在該步驟使用記錄在文件標識字典部分816中的文件標識信息,檢驗存儲在硬盤816上的所有文件的圖象是否能夠確定性地被標識。
具體而言,使用在記錄步驟硬盤813操作時所存儲的及記錄在文件標識字典部分816中的所有文件的圖象(全部文件的圖象),對于一個文件的每一圖象與記錄在文件標識字典部分816中的文件標識信息進行對比檢驗。
更具體來說,來自硬盤813的文件的圖象通過圖象數(shù)據(jù)存儲器814輸出到圖象數(shù)據(jù)截取部分815(圖110的步驟C1),并且圖象數(shù)據(jù)截取部分815基于文件標識字典部分816中的對應(yīng)文件的文件標識信息的位置信息和尺寸信息抽取用于對比檢驗的數(shù)據(jù)。
數(shù)據(jù)比較部分817接收來自圖象數(shù)據(jù)截取部分815的對比檢驗數(shù)據(jù)和作為來自文件標識字典部分816的文件標識信息的數(shù)據(jù)信息(圖110的步驟C2和C3),并且參照它們之間數(shù)據(jù)的一致程度進行比較和對比檢驗(圖110的步驟C4)。
文件鑒別部分819接收來自數(shù)據(jù)比較部分817的結(jié)果和來自閾值設(shè)定部分818的閾值,并當所有文件標識信息的一致性程度在閾值范圍之內(nèi)時,由于數(shù)據(jù)彼此吻合,故文件鑒別部分819鑒別出從硬盤813所抽取的文件的類型能夠被唯一確定,并記錄該確定的文件類型(從步驟C5的YES路線到步驟C6)。
另一方面,當來自數(shù)據(jù)比較部分817的文件標識信息的某些一致性程度不在閾值范圍之內(nèi)時,則數(shù)據(jù)彼此不吻合,故鑒別出文件的類型不能被確定(從步驟C5的NO路線到步驟C7)。然后,如果上述的處理沒有對于文件標識字典部分816的所有文件類型完成,則對于記錄在文件標識字典部分816中下一個文件類型的文件標識信息進行類似的處理(從步驟C7的NO路線到步驟C2)。于是,除非對于所有的文件類型確定了文件,不進行在步驟C6的處理。
然后,對于存儲在硬盤813中的所有類型的文件圖象按類似于上述方式進行文件標識信息的一致性程度的鑒別(步驟C8)。
進而,如果存儲在硬盤813中的所有類型的文件圖象已經(jīng)成功地確定為各個不同的文件,則判定檢驗為OK,并且作為檢驗步驟的操作而結(jié)束(從步驟C9的YES路線到步驟C10)。然而在任何其它情形下,判定存儲在文件標識字典部分816中的文件標識信息有缺陷,并且有缺陷的文件報告給操作者以便請求對于文件再指定文件標識信息(從步驟C9的NO路線到步驟C11)。
于是,如果在記錄步驟之后從硬盤再次輸入特定文件的圖象數(shù)據(jù),并由數(shù)據(jù)比較部分817檢驗該輸入的特定文件是否包含記錄在文件標識字典部分816中的文件標識信息,由圖象數(shù)據(jù)截取部分815能夠鑒別該特定文件的識別是否為可能。
·操作步驟操作的說明接下來,參照標注出操作步驟的操作的圖111中所示的控制框圖以及表示操作步驟中的操作的圖112中所示的流程圖,將說明根據(jù)本實施例的文件標識裝置在操作步驟中的操作。
如上所述,在檢驗步驟中,使用記錄在文件標識字典部分816中的文件標識信息,檢驗存儲在硬盤813上的所有文件的圖象是否能夠被確定。在檢驗結(jié)束之后,在裝置的實際操作中,對于任意一個文件的圖象數(shù)據(jù)進行諸如下述的確定文件類型的操作步驟的操作。
具體而言,如果一定的文件的圖象數(shù)由操作者通過圖象數(shù)據(jù)閱讀裝置811的操作而被閱讀(圖112的步驟D1),則所讀取的圖象數(shù)據(jù)一度存儲到圖象數(shù)據(jù)存儲器814中(圖112的步驟D2)。
然后,基于構(gòu)成一定的文件的類型的文件標識信息的位置信息和尺寸信息,圖象數(shù)據(jù)截取部分815從多個位置抽取并截取一度存儲在圖象數(shù)據(jù)存儲器814中的圖象數(shù)據(jù)(標識信息)(步驟D3和D4)。
然后,數(shù)據(jù)比較部分817計算由圖象數(shù)據(jù)截取部分815所截取的所有圖象數(shù)據(jù)的數(shù)據(jù)信息與構(gòu)成該文件的標識信息的數(shù)據(jù)信息之間的一致性程度以實現(xiàn)比較和鑒別(步驟D5)。
進而,文件鑒別部分819比較作為來自數(shù)據(jù)比較部分817的比較和鑒別的結(jié)果而計算的一致性程度與對于一致性程度在閾值設(shè)定部分818中所設(shè)定的標準,以便鑒別從由圖象數(shù)據(jù)閱讀裝置811所讀取的圖象數(shù)據(jù)與來自文件標識字典部分816的文件標識信息是否能夠確定文件的類型(步驟D6)。
具體來說,當?shù)谝晃募愋虯的圖象數(shù)據(jù)從圖象數(shù)據(jù)閱讀裝置811讀取,同時第二文件類型B的文件標識信息用作為構(gòu)成比較對象的來自文件標識字典816文件標識信息時,鑒別不一致性,并且使用關(guān)于來自文件標識字典部分816的另一文件類型的文件標識信息進行一致程度的鑒別(從步驟D3的NO路線經(jīng)過步驟D8的NO路線到步驟D3)。
另一方面,例如,當?shù)谝晃募愋虯的圖象數(shù)據(jù)從圖象數(shù)據(jù)閱讀裝置811讀入時,如果來自文件標識字典部分816的構(gòu)成比較對象的文件標識信息是關(guān)于第一文件類型A的信息,則對于該文件標識信息鑒別鑒別一致性,并且讀入的圖象數(shù)據(jù)確定為相關(guān)文件類型。這時所確定的文件類型存儲到控制部分812-3中未示出的一個存儲器中(從步驟D的YES路線到D7)。
要注意,在由上述的文件鑒別部分819進行鑒別時,如果由圖象數(shù)據(jù)截取部分815所截取的多個位置的圖象數(shù)據(jù)任何之一與來自文件標識字典部分816的文件標識信息不相符,則它被鑒別為不同類型的文件。
然后基于存儲在文件標識字典部分816的所有各個類型的文件的文件標識信息,對來自由上述圖象數(shù)據(jù)閱讀部分811所讀取圖象數(shù)據(jù)的文件標識信息的一致性程度進行類似于上述鑒別的的鑒別(步驟D8)。
這里,如果由圖象數(shù)據(jù)閱讀部分811所讀取圖象數(shù)據(jù)已經(jīng)由上述一致性程度鑒別成功地確定為一個文件類型的數(shù)據(jù),則所確定的文件類型輸出到定義存儲部分820(參照圖105)(從步驟D9的YES路線到步驟D10)。
然而,如果該圖象數(shù)據(jù)沒有被確定為一個文件類型的數(shù)據(jù),則例如借助于顯示單元812-2向操作者報告文件確定失敗(從步驟D9的NO路線到步驟D11)。
要注意,如果確定為一個類型的文件類型輸入到定義存儲部分820,則定義存儲部分820從定義存儲表821讀出對應(yīng)于所確定的文件類型的定義信息(讀位置信息,字符屬性信息,讀列數(shù)目等等)。
于是,字符識別部分822識別其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置811讀取并存儲在圖象數(shù)據(jù)存儲器814中的文件上所描述的定義信息和字符信息,并作為識別的結(jié)果存儲該字符信息到字符識別結(jié)果存儲部分823。
于是當特定文件已經(jīng)在檢驗步驟被成功地識別時,通過借助于圖象數(shù)據(jù)閱讀裝置811閱讀任意文件的圖象數(shù)據(jù)并參照任意文件的圖象數(shù)據(jù)以檢測該圖象數(shù)據(jù)是否包含記錄在文件標識字典部分816中的文件標識信息,能夠標識該任意文件是否為特定文件并可進行字符識別。
這樣,使用根據(jù)本發(fā)明的該實施例的第一修改的文件標識裝置,由于它包含圖象數(shù)據(jù)閱讀裝置811,圖象數(shù)據(jù)存儲器814,硬盤813,圖象數(shù)據(jù)截取部分815,文件標識字典部分816,數(shù)據(jù)比較部分817及文件鑒別部分819,在該裝置操作中,能夠自動地標識其圖象數(shù)據(jù)已經(jīng)由圖象數(shù)據(jù)閱讀裝置811讀取的文件的類型。于是,即使要由圖象數(shù)據(jù)閱讀裝置811讀取的多種類型文件以混合狀態(tài)出現(xiàn),操作者無需知道每一文件的定義而能夠處理這些文件。于是,該文件識別裝置的優(yōu)點在于能夠達到工作的高效率。該文件識別裝置的優(yōu)點還在于,,用于標識文件本身的ID號碼等無需在文件上說明而可使用普通的文件,于是該文件標識裝置能夠易于用于現(xiàn)有的系統(tǒng)。
進而,在向文件標識字典部分816記錄文件識別信息時,只要操作者指定該信息同時目視觀察投影在顯示單元812-2上的供記錄的對象文件的圖象數(shù)據(jù)即能夠自動地取得必要的文件標識信息。于是,易于產(chǎn)生用于文件標識的字典,并能夠達到在工作效率的改進。
進而,由于該文件標識裝置包含作為檢驗裝置的數(shù)據(jù)比較部分817和作為鑒別裝置的文件鑒別部分819,故能夠檢驗由操作者所指定的文件標識信息是否正確。于是,該文件標識裝置的優(yōu)點在于,完全消除了文件標識中的錯誤并改進了裝置的可靠性。
進而,在操作者指令一個文件中多個位置作為標識信息之處,能夠比基于指定單個位置時的標識信息那樣所抽取的文件標識信息更高的精度從基于標識信息所抽取的文件標識信息而標識文件。
(b2)根據(jù)該實施例的第二修改的文件標識裝置的說明圖113是表示根據(jù)本發(fā)明該實施例第二修改的文件標識裝置的一個框圖,并具體示出其中標注出記錄標注操作的控制框圖。
圖113中所示的文件標識裝置具有基本上與參照圖105上述文件標識裝置類似的結(jié)構(gòu),所不同之處在于,文件標識信息抽取裝置包含一個自動標題部分抽取部分815a,自動條款標題部分抽取部分815b和文件標識信息截取部分815c。
自動科目部分抽取部分815a自動地抽取有關(guān)存儲在圖象數(shù)據(jù)存儲器814中的文件被視為科目部分的圖象數(shù)據(jù)部分的位置信息(例如參照作為示于圖108中上述第一文件標識信息的′電費率′)。
自動條款標題部分抽取部分815b自動地從存儲在圖象數(shù)據(jù)存儲器814中的有關(guān)一個文件的圖象數(shù)據(jù)抽取一個條款部分的位置信息。
基于來自自動科目部分抽取部分815a和自動條款標題部分抽取部分815b的位置信息,文件標識信息截取部分815c從存儲在圖象數(shù)據(jù)存儲器814中的圖象數(shù)據(jù)截取科目部分和條款部分尺寸信息及作為文件標識信息的數(shù)據(jù)信息。
使用具有上述結(jié)構(gòu)根據(jù)本發(fā)明該實施例的第二修改的文件標識裝置,作為類似于上述實施例的記錄標步驟的操作,如果圖象數(shù)據(jù)閱讀裝置811響應(yīng)操作者的操作而讀取一個文件的圖象數(shù)據(jù)(圖114的步驟E1),那么圖象數(shù)據(jù)存儲器814存儲一度存儲所讀取的圖象數(shù)據(jù)(圖114的步驟E2),并且該圖象數(shù)據(jù)還存儲到硬盤813使得由圖象數(shù)據(jù)一度裝置811所讀取的所有圖象數(shù)據(jù)被存儲(圖114的步驟E3)。
然后,自動科目部分抽取部分815a自動地抽取似乎是文件科目的部分的位置信息(圖114的步驟E4),并且自動條款標題部分抽取部分815b自動地抽取劃線條款中所描述的條款標題的位置信息(圖114的步驟E5)。
基于來自上述自動科目部分抽取部分815a和自動條款標題部分抽取部分815b的位置信息,文件標識信息截取部分815c抽取尺寸信息和數(shù)據(jù)信息(圖114的步驟E6),并記錄位置信息和尺寸信息以及對應(yīng)于該位置信息作為文件標識信息的數(shù)據(jù)信息到文件標識字典部分816(圖114的步驟E7)。
要注意,檢驗步驟或操作步驟中的操作基本上類似于上述實施例的操作。
于是,使用上述參照圖105文件標識裝置,雖然操作者根據(jù)本實施例參照顯示單元812-2并操作輸入部分812-1指定用于文件標識信息抽取的標識信息,但是特定文件上所描述的特定文件標識信息能夠自動地從由圖象數(shù)據(jù)閱讀裝置811所讀取的特定文件的圖象數(shù)據(jù)抽取并記錄到文件標識字典部分816。于是,其中的優(yōu)點在于,操作者的操作效率能夠顯著改進。
要注意,在上述參照圖113的實施例中,雖然使用科目部分和條款部分作為用于文件標識信息抽取的標識信息,但是此外文件的任何其它部分(固定信息部分)也可使用。
(b3)其它在上述本發(fā)明該實施例的修改中,作為檢驗裝置的數(shù)據(jù)比較部分817和作為鑒別裝置的文件鑒別部分819進行檢驗步驟的操作,這操作的進行是通過在記錄步驟之后當特定文件的圖象數(shù)據(jù)再次輸入時檢驗輸入的特定文件的圖象數(shù)據(jù)是否包含記錄在文件標識字典部分816中的文件標識信息以便鑒別該特定文件的識別是否可能。然而,即使省略檢驗步驟的操作,至少在裝置的操作中,由于其圖象數(shù)據(jù)由圖象數(shù)據(jù)閱讀裝置811讀取的文件的類型能夠被自動地標識,即使要由圖象數(shù)據(jù)閱讀裝置811讀取的多個類型文件混合狀態(tài)出現(xiàn),操作者也能夠處理這些文件而無需知道每一文件的定義。于是,其中的優(yōu)點在于,科研改進工作效率。進而,用于標識文件本身的ID號碼等不需要在文件上描述,于是能夠使用普通的文件。于是另一個優(yōu)點在于,易于用于現(xiàn)有的系統(tǒng)。
進而,在記錄文件標識信息到文件標識字典816時,只要如果操作者在觀察投影到顯示單元812-2上的供記錄的對象文件的圖象數(shù)據(jù)時進行指定,則能夠自動地取得必要的文件標識信息。于是,易于產(chǎn)生用于文件之間的標識的字典,并能夠達到工作效率的改進。
如上所述,根據(jù)本發(fā)明的數(shù)據(jù)媒體處理裝置和數(shù)據(jù)媒體處理方法適用于處理例如金融機構(gòu)中的文件,并特別地,由于能夠自動地處理具有各種格式的文件諸如私人文件等,故該數(shù)據(jù)媒體處理裝置和數(shù)據(jù)媒體處理方法被認為有很高的可使用性。
權(quán)利要求
1.一種數(shù)據(jù)媒體處理方法,用于基于從在其上以任意格式描述信息的數(shù)據(jù)媒體中讀取的圖象(19)識別信息,其特征在于從讀取的圖象數(shù)據(jù)(19)抽取包含該格式的數(shù)據(jù)媒體所獨有的特征并然后進行壓縮處理,以及使用該壓縮處理的特征作為限制檢索項檢索存儲在存儲部分(14)中的參照壓縮信息以便比較是否存在相符的參照壓縮信息,此后基于比較的結(jié)果識別指定位置處的圖象以便鑒別信息。
2.如權(quán)利要求1中所述的數(shù)據(jù)媒體處理方法,其特征在于,在對特征壓縮處理之前,對于讀取的圖象數(shù)據(jù)(19)進行傾斜校正和變形校正處理。
3.如權(quán)利要求1中所述的數(shù)據(jù)媒體處理方法,其特征在于,在對特征壓縮處理時,參照構(gòu)成讀取的圖象數(shù)據(jù)(19)的劃線項目的水平劃線,以便對其上側(cè)劃線共同具有相同劃線的那些劃線項目進行Y坐標統(tǒng)一(unification)處理,并參照構(gòu)成讀取的圖象數(shù)據(jù)(19)的劃線項目的垂直劃線,以便對其左側(cè)劃線共同具有相同劃線的那些劃線項目進行X坐標統(tǒng)一處理。
4.如權(quán)利要求1中所述的數(shù)據(jù)媒體處理方法,其特征在于,在對特征壓縮處理時,特征被轉(zhuǎn)換為對應(yīng)的比特流,并且該比特流被壓縮處理且設(shè)置為一矩陣表。
5.一種數(shù)據(jù)媒體處理方法,用于基于從在其上以任意格式描述信息的數(shù)據(jù)媒體中讀取的圖象(19)識別信息,其特征在于它包括標題分析處理步驟,用于抽取讀取的圖象(19)的布局特征,分析布局的結(jié)構(gòu),基于所抽取的特征確定圖象中的標題區(qū)域,在標題區(qū)域中識別標題項目信息并確定對應(yīng)的項目數(shù)據(jù)。
6.如權(quán)利要求5中所述的數(shù)據(jù)媒體處理方法,其特征在于,標題分析處理步驟包括標題位置備選確定步驟(K9),用于基于布局結(jié)構(gòu)的分析結(jié)果確定標題位置備選項,還包括標題項目比較步驟(K10),用于比較標題區(qū)域中的標題項目信息與在前面步驟(K9)中確定的標題位置備選項。
7.如權(quán)利要求6中所述的數(shù)據(jù)媒體處理方法,其特征在于,在標題項目比較步驟(K10)中進行標題項目比較時,在對要比較的圖象數(shù)據(jù)(19)進行歸一化處理之后執(zhí)行標題項目的比較處理。
8.一種數(shù)據(jù)媒體處理方法,其特征在于它包括登記步驟(B1到B7),用于從作為由圖象數(shù)據(jù)讀取裝置(811)所讀取的并在其上以一種格式描述所需信息的數(shù)據(jù)媒體的特定文檔(824B)的圖象數(shù)據(jù),抽取在該特定文檔(824B)上所描述的文檔標識信息,并將該文檔標識信息登記到一文檔標識字典(816);以及操作步驟(D1到D11),用于繼登記步驟(B1到B7)之后,借助于所述圖象數(shù)據(jù)讀取裝置(811)讀取任意文檔的圖象數(shù)據(jù),參照該任意文檔的圖象數(shù)據(jù)以檢測該任意文檔的圖象數(shù)據(jù)是否包含登記在所述文檔標識字典(816)中的文檔標識信息,以便標識該任意文檔是否為特定的文檔(824B)。
9.一種數(shù)據(jù)媒體處理方法,其特征在于它包括登記步驟(B1到B7),用于從作為由圖象數(shù)據(jù)讀取裝置(811)所讀取的并在其上以一種格式描述所需信息的數(shù)據(jù)媒體的特定文檔(824B)的圖象數(shù)據(jù),抽取在該特定文檔(824B)上所描述的文檔標識信息,并將該文檔標識信息登記到一文檔標識字典(816);驗證步驟(C1到C11),用于繼登記步驟(B1到B7)之后,再次輸入特定文檔(824B)的圖象數(shù)據(jù)并驗證所輸入的特定文檔(824B)的圖象數(shù)據(jù)是否包含登記在所述文檔標識字典(816)中的文檔標識信息,以鑒別該特定文檔(824B)的識別是否可能;以及操作步驟(D1到D11),用于當在驗證步驟(C1到C11)中特定文檔(824B)的識別為可能時,借助于所述圖象數(shù)據(jù)讀取裝置(811)讀取任意文檔的圖象數(shù)據(jù),并參照該任意文檔的圖象數(shù)據(jù)以檢測該任意文檔的圖象數(shù)據(jù)是否包含登記在所述文檔標識字典(816)中的文檔標識信息,以便標識該任意文檔是否為特定的文檔(824B)。
10.如權(quán)利要求8或9所述的數(shù)據(jù)媒體處理方法,其特征在于,在登記步驟(B1到B7)中,由所述圖象數(shù)據(jù)讀取裝置(811)讀取的特定文檔(824B)的圖象數(shù)據(jù)顯示在顯示單元(812-2)上,并且從所顯示的特定文檔(824B)的圖象數(shù)據(jù)內(nèi)指定包含在該特定文檔(824B)上所描述的文檔標識信息的圖象的區(qū)域,以抽取文檔標識信息,此后文檔標識信息被登記到所述文檔標識字典(816)。
11.如權(quán)利要求8或9所述的數(shù)據(jù)媒體處理方法,其特征在于,在登記步驟(B1到B7)中,在特定文檔(824B)上所描述的特定文檔標識信息從由所述圖象數(shù)據(jù)讀取裝置(811)讀取的特定文檔(824B)的圖象數(shù)據(jù)自動地抽取,并將該特定文檔標識信息登記到所述文檔標識字典(816)。
12.如權(quán)利要求9中所述的數(shù)據(jù)媒體處理方法,其特征在于在登記步驟(B1到B7)中,在將該文檔標識信息登記到所述文檔標識字典(816)時,存儲在登記時所讀取的特定文檔(824B)的圖象數(shù)據(jù);以及在驗證步驟(C1到C11)中,所存儲的特定文檔(824B)的圖象數(shù)據(jù)再次作為特定文檔(824B)的圖象數(shù)據(jù)被輸入,并驗證所輸入的特定文檔(824B)的圖象數(shù)據(jù)是否包含登記在所述文檔標識字典(816)中的文檔標識信息以鑒別該特定文檔(824B)的識別是否可能。
13.一種數(shù)據(jù)媒體處理裝置,其特征在于它包括圖象數(shù)據(jù)讀取裝置(811),用于讀取作為以其一種格式描述所需信息的數(shù)據(jù)媒體的文檔的圖象數(shù)據(jù);圖象數(shù)據(jù)存儲器(814),用于存儲由所述圖象數(shù)據(jù)讀取裝置(811)讀取的文檔的圖象數(shù)據(jù);文檔標識信息抽取裝置(815),用于從存儲在所述圖象數(shù)據(jù)存儲器(814)中的文檔的圖象數(shù)據(jù)中抽取在文檔上描述的所需文檔標識信息;文檔標識字典(816),用于登記由所述文檔標識信息抽取裝置(815)抽取的文檔標識信息作為用于特定文檔(824B)的文檔標識信息;參照裝置(817),用于參照由所述圖象數(shù)據(jù)讀取裝置(811)所讀取并存儲在所述圖象數(shù)據(jù)存儲器(814)中的任意文檔的圖象數(shù)據(jù),以便檢測任意文檔的圖象數(shù)據(jù)是否包含登記在所述文檔標識字典(816)中的文檔標識信息;以及文檔標識裝置(819),用于基于由所述參照裝置(817)參照的結(jié)果標識任意文檔是否為特定的文檔(824B)。
14.一種數(shù)據(jù)媒體處理裝置,其特征在于它包括圖象數(shù)據(jù)讀取裝置(811),用于讀取作為以其一種格式描述所需信息的數(shù)據(jù)媒體的文檔的圖象數(shù)據(jù);圖象數(shù)據(jù)存儲器(814)和文件存儲器(813),用于存儲由所述圖象數(shù)據(jù)讀取裝置(811)讀取的文檔的圖象數(shù)據(jù);文檔標識信息抽取裝置(815),用于從存儲在所述圖象數(shù)據(jù)存儲器(814)中的文檔的圖象數(shù)據(jù)抽取在文檔上所描述的所需的文檔標識信息;文檔標識字典(816),用于登記由所述文檔標識信息抽取裝置(815)抽取的文檔標識信息作為用于特定文檔(824B)的文檔標識信息;驗證裝置(817),用于讀出存儲在所述文件存儲器(813)中的特定文檔(824B)的圖象數(shù)據(jù)并驗證該特定文檔(824B)的圖象數(shù)據(jù)是否包含登記在所述文檔標識字典(816)中的文檔標識信息;鑒別裝置(819),用于基于由所述驗證裝置(817)的驗證結(jié)果鑒別特定文檔(824B)的識別是否可能;參照裝置(817),用于參照由所述圖象數(shù)據(jù)讀取裝置(811)所讀取并存儲在所述圖象數(shù)據(jù)存儲器(814)中的任意文檔的圖象數(shù)據(jù),以便檢測該任意文檔的圖象數(shù)據(jù)是否包含登記在所述文檔標識字典(816)中的文檔標識信息;以及文檔標識裝置(819),用于基于由所述參照裝置(817)的參照結(jié)果標識任意文檔是否為特定的文檔(824B)。
15.如權(quán)利要求14中所述的數(shù)據(jù)媒體處理裝置,其特征在于所述參照裝置(817)還用作為所述驗證裝置(817),以及所述文檔標識裝置(819)還用作為所述鑒別裝置(819)。
16.一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取,并且在所讀取的圖象中的符號圖象信息被識別并被轉(zhuǎn)換為對應(yīng)的代碼信息,其特征在于,當符號圖象信息沒有被成功地轉(zhuǎn)換為對應(yīng)的代碼信息時,沒有被成功轉(zhuǎn)換的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與同不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同被顯示在顯示單元(725)上,并且不可識別符號圖象信息被強調(diào)顯示。
17.如權(quán)利要求16中所述的數(shù)據(jù)媒體處理方法,其特征在于,當對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置(722)的操作輸入時,正確答案數(shù)據(jù)顯示在所述顯示單元(725)上不同于不可識別符號圖象信息顯示區(qū)域(723A)的正確答案數(shù)據(jù)顯示區(qū)域(733C)上。
18.如權(quán)利要求16中所述的數(shù)據(jù)媒體處理方法,其特征在于,當對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置(722)的操作輸入時,已經(jīng)被強調(diào)顯示的不可識別符號圖象信息按不同的強調(diào)方式顯示,該強調(diào)方式表示不可識別符號圖象信息已經(jīng)被修改。
19.如權(quán)利要求16中所述的數(shù)據(jù)媒體處理方法,其特征在于,當對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置(722)的操作輸入時,正確答案數(shù)據(jù)顯示在所述顯示單元(725)上不同于不可識別符號圖象信息顯示區(qū)域(732A)的正確答案數(shù)據(jù)顯示區(qū)域(733C)中,同時已經(jīng)被強調(diào)顯示的不可識別符號圖象信息按不同的強調(diào)方式顯示,該強調(diào)方式表示不可識別符號圖象信息已經(jīng)被修改。
20.一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取,并且在所讀取的圖象中的符號圖象信息被識別并被轉(zhuǎn)換為對應(yīng)的代碼信息,其特征在于,圖象中要被轉(zhuǎn)換為代碼信息的最小組成單元的符號圖象信息,在顯示單元(725)上相應(yīng)于由通過符號圖象信息的轉(zhuǎn)換所獲得的代碼信息所表達的符號信息被顯示。
21.如權(quán)利要求20中所述的數(shù)據(jù)媒體處理方法,其特征在于,在多條同類最小組成單元的符號圖象信息相應(yīng)于通過由符號圖象信息的轉(zhuǎn)換所獲得的代碼信息表達的符號信息被顯示時,僅強調(diào)顯示多條符號圖象信息中所需的一條。
22.如權(quán)利要求20中所述的數(shù)據(jù)媒體處理方法,其特征在于,所需的一條符號圖象信息在所述顯示單元(725)上以一個讀取圖象的狀態(tài)與同該條符號圖象信息相關(guān)聯(lián)的符號圖象信息一同顯示,并且該一條符號圖象信息被強調(diào)顯示。
23.如權(quán)利要求22中所述的數(shù)據(jù)媒體處理方法,其特征在于,當對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置(722)的操作輸入時,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域(733C)上,該區(qū)域不同于顯示該一條符號圖象信息以及與該一條符號圖象信息相關(guān)聯(lián)的符號圖象信息的區(qū)域(733A)。
24.如權(quán)利要求22中所述的數(shù)據(jù)媒體處理方法,其特征在于,當對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置(722)的操作輸入時,已經(jīng)被強調(diào)顯示的該一條符號圖象信息以不同的強調(diào)方式顯示,該強調(diào)方式表示該一條符號圖象信息已經(jīng)被修改。
25.如權(quán)利要求23中所述的數(shù)據(jù)媒體處理方法,其特征在于,當對應(yīng)于一條符號圖象信息的正確答案數(shù)據(jù)通過數(shù)據(jù)輸入裝置(722)的操作輸入時,正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域(733C)上,該區(qū)域不同于顯示該一條符號圖象信息以及與該一條符號圖象信息相關(guān)的符號圖象信息的區(qū)域(733A),并且已經(jīng)被強調(diào)顯示的該一條符號圖象信息以不同的強調(diào)方式顯示,該強調(diào)方式表示該一條符號圖象信息已經(jīng)被修改。
26.一種數(shù)據(jù)媒體處理裝置,其特征為它包括圖象讀取部分(721),用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分(726),用于識別由所述圖象讀取部分(721)讀取的圖象中的符號圖象信息并轉(zhuǎn)換該符號圖象信息為對應(yīng)的代碼信息;顯示單元(725),用于以一個讀取圖象的狀態(tài)顯示符號圖象信息;以及讀取符號圖象顯示控制部分(727),用于當符號圖象信息沒有成功轉(zhuǎn)換為對應(yīng)的代碼信息時,使其轉(zhuǎn)換沒有成功進行的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與同不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同顯示在所述顯示單元(725)上;所述讀取符號圖象顯示控制部分(727)包含用于強調(diào)顯示不可識別符號圖象信息的強調(diào)顯示裝置(727A)。
27.如權(quán)利要求26中所述的數(shù)據(jù)媒體處理裝置,其特征在于該裝置還包括數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù);以及正確答案數(shù)據(jù)顯示裝置(728),用于當正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使正確答案數(shù)據(jù)顯示在所述顯示單元上不同于不可識別符號圖象信息顯示區(qū)域的一個正確答案數(shù)據(jù)顯示區(qū)域(733C)內(nèi)。
28.如權(quán)利要求27中所述的數(shù)據(jù)媒體處理裝置,其特征在于該裝置還包括強調(diào)顯示改變裝置(727B),用于當正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使已經(jīng)強調(diào)顯示的符號圖象信息以不同的強調(diào)方式被顯示,該強調(diào)方式表示不可識別符號圖象信息已經(jīng)被修改。
29.如權(quán)利要求27中所述的數(shù)據(jù)媒體處理裝置,其特征在于該裝置還包括強調(diào)顯示改變裝置(727B),用于當正確答案數(shù)據(jù)由所述正確答案數(shù)據(jù)顯示裝置(728)顯示在所述顯示單元(725)上不同于所述不可識別符號圖象信息顯示區(qū)域(732A)的所述正確答案數(shù)據(jù)顯示區(qū)域(733C)內(nèi)時,使已經(jīng)被強調(diào)顯示的不可識別符號圖象信息按不同的強調(diào)顯示方式顯示,該強調(diào)方式表示不可識別符號圖象信息已經(jīng)被修改。
30.一種數(shù)據(jù)媒體處理裝置,其特征在于它包括圖象讀取部分(721),用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分(726),用于識別由所述圖象讀取部分(721)讀取的圖象中的符號圖象信息并轉(zhuǎn)換該符號圖象信息為對應(yīng)的代碼信息;顯示單元(725),用于以一個讀取圖象的狀態(tài)顯示符號圖象信息一個;最小組成單元符號圖象信息抽取部分(729),用于對于每一條最小組成單元的符號圖象信息抽取圖象中要被轉(zhuǎn)換為代碼信息的最小組成單元的符號圖象信息;以及最小組成單元符號圖象顯示控制部分(730),用于使由所述最小組成單元符號圖象信息抽取部分(729)所抽取的最小組成單元的符號圖象信息相應(yīng)于由通過符號圖象信息轉(zhuǎn)換所獲得的代碼信息表示的符號信息而顯示。
31.如權(quán)利要求30中所述的數(shù)據(jù)媒體處理裝置,其特征在于所述最小組成單元符號圖象顯示控制部分(730)具有使多條同類的最小組成單元的符號圖象信息相應(yīng)于由通過符號圖象信息轉(zhuǎn)換所獲得的代碼信息表示的符號信息進行顯示的功能,以及包括強調(diào)顯示裝置(730A),用于使得僅強調(diào)顯示所需的一條符號圖象信息。
32.如權(quán)利要求30中所述的數(shù)據(jù)媒體處理裝置,其特征在于它還包括相關(guān)符號圖象顯示裝置(731),用于在所述顯示單元(725)上以一個讀取圖象的狀態(tài)與同該一條符號圖象信息相關(guān)聯(lián)的符號圖象信息一同顯示該一條符號圖象信息,以及所述相關(guān)符號圖象顯示裝置(731)包含強調(diào)顯示裝置(731A),用于使該一條符號圖象信息被強調(diào)顯示。
33.如權(quán)利要求30中所述的數(shù)據(jù)媒體處理裝置,其特征在于它還包括數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù);以及正確答案數(shù)據(jù)顯示裝置(728),用于當正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域(733C)內(nèi),該區(qū)域不同于顯示該一條符號圖象信息以及與該一條符號圖象信息相關(guān)聯(lián)的符號圖象信息的區(qū)域(732A)。
34.如權(quán)利要求30中所述的數(shù)據(jù)媒體處理裝置,其特征在于它還包括數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù);以及強調(diào)顯示改變裝置(730B),用于當正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使已經(jīng)被強調(diào)顯示的該一條符號圖象信息按不同的強調(diào)顯示方式顯示,該強調(diào)方式表示該一條符號圖象信息已經(jīng)被修改。
35.如權(quán)利要求30中所述的數(shù)據(jù)媒體處理裝置,其特征在于它還包括數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù);正確答案數(shù)據(jù)顯示裝置(728),用于當正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使正確答案數(shù)據(jù)顯示在正確答案數(shù)據(jù)顯示區(qū)域(733C)內(nèi),該區(qū)域不同于顯示該一條符號圖象信息與同該一條符號圖象信息相關(guān)聯(lián)的符號圖象信息的區(qū)域(733A);以及強調(diào)顯示改變裝置(730B),用于當正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使已經(jīng)被強調(diào)顯示的該一條符號圖象信息按不同的強調(diào)顯示方式顯示,該強調(diào)方式表示該一條符號圖象信息已經(jīng)被修改。
36.一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取并且在所讀取的圖象中的符號圖象信息被識別并轉(zhuǎn)換為對應(yīng)的代碼信息,其特征在于,當符號圖象信息沒有成功轉(zhuǎn)換為對應(yīng)的代碼信息時,沒有成功轉(zhuǎn)換的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與同不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同顯示在顯示單元(725)上,并且不可識別符號圖象信息被強調(diào)顯示,并且然后,當對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,已經(jīng)被強調(diào)顯示的該不可識別符號圖象信息按不同的強調(diào)顯示方式顯示,該強調(diào)方式表示該不可識別符號圖象信息已經(jīng)被修改,并且基于正確答案數(shù)據(jù)修改該不可識別符號圖象信息。
37.一種數(shù)據(jù)媒體處理方法,其中具有符號信息的數(shù)據(jù)媒體的圖象被讀取并且在所讀取的圖象中的符號圖象信息被識別并轉(zhuǎn)換為對應(yīng)的代碼信息,其特征在于,要被轉(zhuǎn)換為代碼信息的多條同類最小組成單元的符號圖象信息相應(yīng)于由通過符號圖象信息的轉(zhuǎn)換所獲得的代碼信息表達的符號信息被顯示,同時僅強調(diào)顯示所需的一條符號圖象信息,并且然后當對應(yīng)于一條符號圖象信息的正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,已經(jīng)被強調(diào)顯示的該一條符號圖象信息按不同的強調(diào)顯示方式顯示,該強調(diào)方式表示該一條符號圖象信息已經(jīng)被修改,并且基于正確答案數(shù)據(jù)修改對應(yīng)于該一條符號圖象信息的錯誤識別信息。
38.一種數(shù)據(jù)媒體處理裝置,其特征在于它包括圖象讀取部分,用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分(726),用于識別由所述圖象讀取部分(721)讀取的圖象中的符號圖象信息并轉(zhuǎn)換該符號圖象信息為對應(yīng)的代碼信息;顯示單元(725),用于以一個讀取圖象的狀態(tài)顯示符號圖象信息;讀取符號圖象顯示控制部分(727),用于當符號圖象信息沒有成功轉(zhuǎn)換為對應(yīng)的代碼信息時,使沒有成功進行轉(zhuǎn)換的不可識別符號圖象信息以一個讀取圖象的狀態(tài)與同不可識別符號圖象信息相關(guān)聯(lián)的符號圖象信息一同顯示在所述顯示單元(725)上;強調(diào)顯示裝置(727A),用于使不可識別符號圖象信息被強調(diào)顯示;數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于不可識別符號圖象信息的正確答案數(shù)據(jù);強調(diào)顯示改變裝置(727B),用于當正確答案數(shù)據(jù)由所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使到此時被強調(diào)顯示的不可識別符號圖象信息以與表示修改完成的強調(diào)方式不同的強調(diào)方式被顯示;以及識別信息修改裝置(752),用于當正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置(722)的操作輸入時,基于該正確答案數(shù)據(jù)修改不可識別符號圖象信息。
39.一種數(shù)據(jù)媒體處理裝置,其特征在于它包括圖象讀取部分,用于讀取具有符號信息的數(shù)據(jù)媒體的圖象;符號識別部分(726),用于識別由所述圖象讀取部分(721)讀取的圖象中的符號圖象信息并轉(zhuǎn)換該符號圖象信息為對應(yīng)的代碼信息;顯示單元(725),用于以一個讀取圖象的狀態(tài)顯示符號圖象信息;最小組成單元符號圖象信息抽取部分(729),用于對于每一條最小組成單元的符號圖象信息抽取圖象中要被轉(zhuǎn)換為代碼信息的最小組成單元的符號圖象信息;最小組成單元符號圖象顯示控制部分(730),用于使由所述最小組成單元符號圖象信息抽取部分(729)所抽取的多條最小組成單元的符號圖象信息相應(yīng)于由通過符號圖象信息轉(zhuǎn)換所獲得的代碼信息表示的符號信息進行顯示;強調(diào)顯示裝置(730A),用于使得僅強調(diào)顯示所需的一條符號圖象信息;數(shù)據(jù)輸入裝置(722),用于輸入對應(yīng)于該一條符號圖象信息的正確答案數(shù)據(jù);強調(diào)顯示改變裝置(730B),用于當正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置(722)的操作輸入時,使到此時被強調(diào)顯示的一條符號圖象信息與表示修改完成的強調(diào)方式不同的強調(diào)顯示方式顯示;識別信息修改裝置(752),用于當正確答案數(shù)據(jù)通過所述數(shù)據(jù)輸入裝置(722)的操作輸入時,基于該正確答案數(shù)據(jù)修改對應(yīng)于該一條符號圖象信息的錯誤識別信息。
40.一種數(shù)據(jù)媒體處理方法,其特征在于,當包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)顯示在顯示單元(630)上時,僅強調(diào)顯示對應(yīng)于特定的一個項目的圖象數(shù)據(jù)的一部分。
41.一種數(shù)據(jù)媒體處理方法,其特征在于,當對應(yīng)于所需的一個項目(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)要被以這樣一種狀態(tài)輸入時,即包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)顯示在顯示單元(630)上的圖象數(shù)據(jù)顯示區(qū)域(611)中,如果光標指示(616)顯示在所述顯示單元(630)上與所述圖象數(shù)據(jù)顯示區(qū)域(611)分開設(shè)置的項目顯示區(qū)域(614)的所需一個項目數(shù)據(jù)輸入顯示區(qū)域部分(615)之處,則僅強調(diào)顯示對應(yīng)的所需項目(612)的圖象數(shù)據(jù)部分。
42.一種數(shù)據(jù)媒體處理方法,其特征在于,當對應(yīng)于所需一個項目(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)要以這樣一種狀態(tài)輸入時,即包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù)顯示在顯示單元(630)上圖象數(shù)據(jù)顯示區(qū)域(611)中,如果光標指示(616)顯示在顯示單元(630)上與所述圖象數(shù)據(jù)顯示區(qū)域(611)分開設(shè)置的項目顯示區(qū)域(614)的所需一個項目數(shù)據(jù)輸入顯示區(qū)域部分(615)之處,則僅強調(diào)顯示對應(yīng)的所需項目(612)的圖象數(shù)據(jù)部分;以及然后當對應(yīng)于另外一個項目(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)要被輸入時,如果所述光標指示(616)從所需項目數(shù)據(jù)輸入顯示區(qū)域部分(615)移動到一個不同的項目數(shù)據(jù)輸入顯示區(qū)域部分(615),則所需項目(612)的對應(yīng)圖象數(shù)據(jù)部分的強調(diào)顯示被刪除,而不同的項目(612)的對應(yīng)圖象數(shù)據(jù)部分被強調(diào)顯示。
43.一種數(shù)據(jù)媒體處理方法,其特征在于,當對應(yīng)于顯示在顯示單元(630)上的所需一個項目(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)要被以這樣一種狀態(tài)輸入時,即包含多個項目的信息的數(shù)據(jù)媒體的部分圖象數(shù)據(jù)顯示在顯示單元(630)上的圖象數(shù)據(jù)顯示區(qū)域(611)中,如果光標指示(616)顯示在所述顯示單元(630)上與所述圖象數(shù)據(jù)顯示區(qū)域(611)分開設(shè)置的項目顯示區(qū)域(614)的所需一個項目數(shù)據(jù)輸入顯示區(qū)域部分(615)之處,則僅強調(diào)顯示對應(yīng)的所需項目(612)的圖象數(shù)據(jù)部分;以及當此后要輸入對應(yīng)于沒有顯示在所述顯示單元(630)上的一個不同項目(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)時,如果所述光標指示(616)從所需項目數(shù)據(jù)輸入顯示區(qū)域部分(615)移動到一個不同的項目數(shù)據(jù)輸入顯示區(qū)域部分(615),則所需項目(612)的對應(yīng)圖象數(shù)據(jù)部分的強調(diào)顯示被刪除,同時進行滾屏使得不同項目(612)的圖象數(shù)據(jù)部分能夠在所述顯示單元(630)的所述圖象數(shù)據(jù)顯示區(qū)域(611)被顯示,以便在所述顯示單元(630)的所述圖象數(shù)據(jù)顯示區(qū)域(611)顯示該不同項目(612)的圖象數(shù)據(jù)部分,并且強調(diào)顯示該不同項目(612)的對應(yīng)的圖象數(shù)據(jù)部分。
44.一種數(shù)據(jù)媒體處理裝置,其特征在于它包括圖象數(shù)據(jù)輸入裝置(621,621A,621B),用于輸入包含多個項目的信息的數(shù)據(jù)媒體的圖象數(shù)據(jù);顯示單元(630),具有圖象數(shù)據(jù)顯示區(qū)域(611)和一個具有多個項目數(shù)據(jù)輸入顯示區(qū)域部分(615)的項目顯示區(qū)域(614);顯示控制裝置(629),用于使通過所述圖象數(shù)據(jù)輸入裝置(621,621A,621B)所獲得的圖象數(shù)據(jù)顯示在所述圖象數(shù)據(jù)顯示區(qū)域(611)中,并用于當對應(yīng)于所需一個項目(612)的圖象數(shù)據(jù)部分的數(shù)據(jù)要由數(shù)據(jù)輸入裝置(631)輸入時,使光標指示(616)顯示在所述項目顯示區(qū)域(614)中所需一個項目數(shù)據(jù)輸入顯示區(qū)域部分(615);以及圖象數(shù)據(jù)部分強調(diào)顯示裝置(624),用于當光標指示(616)由所述顯示控制裝置(629)顯示在所述項目顯示區(qū)域(614)中所需一個項目數(shù)據(jù)輸入顯示區(qū)域部分(615)之處,其顯示狀態(tài)為包含多個項目的信息的圖象數(shù)據(jù)顯示在所述顯示單元(630)的所述圖象數(shù)據(jù)顯示區(qū)域(611)中時,使得僅強調(diào)顯示所需項目(612)的對應(yīng)圖象數(shù)據(jù)部分。
45.如權(quán)利要求44中所述的數(shù)據(jù)媒體處理裝置,其特征在于所述顯示控制裝置(629)除了所述圖象數(shù)據(jù)部分強調(diào)顯示裝置(624)之外還包括,圖象數(shù)據(jù)強調(diào)顯示刪除裝置(625),用于當所述光標指示(616)通過光標移動操作裝置(631)移動到不同于所需項目數(shù)據(jù)輸入顯示區(qū)域部分(615)的另一個項目數(shù)據(jù)輸入顯示區(qū)域部分(615)時,刪除對應(yīng)于該項目(612)的圖象數(shù)據(jù)部分的強調(diào)顯示;以及強調(diào)顯示轉(zhuǎn)移控制裝置(626),用于控制所述圖象數(shù)據(jù)部分強調(diào)顯示裝置(624),使得響應(yīng)于所述圖象數(shù)據(jù)強調(diào)顯示刪除裝置(625),僅可強調(diào)顯示對應(yīng)于該不同項目數(shù)據(jù)輸入顯示區(qū)域部分(615)的不同項目(612)的圖象數(shù)據(jù)部分。
46.如權(quán)利要求44中所述的數(shù)據(jù)媒體處理裝置,其特征在于所述顯示控制裝置(629)除了所述圖象數(shù)據(jù)部分強調(diào)顯示裝置(624),圖象數(shù)據(jù)強調(diào)顯示刪除裝置(625)及強調(diào)顯示轉(zhuǎn)移控制裝置(626)之外還包括,顯示滾屏裝置(627),用于使沒有顯示在所述顯示單元(630)上的圖象數(shù)據(jù)部分顯示在所述顯示單元(630)上。
47.如權(quán)利要求44到46中所述的數(shù)據(jù)媒體處理裝置,其特征在于所述圖象數(shù)據(jù)部分強調(diào)顯示裝置(624)包括能夠響應(yīng)來自外部的指令改變強調(diào)顯示的部分的改變部分(628)。
48.一種數(shù)據(jù)媒體處理裝置(30),用于基于從在其上以任意格式描述信息的數(shù)據(jù)媒體中讀取的圖象(19)識別信息,其特征在于它包括標題分析處理部分,用于抽取讀取的圖象(19)的布局特征,分析布局的結(jié)構(gòu),基于所抽取的特征確定圖象中的標題區(qū)域,識別標題區(qū)域中的標題項目信息并確定對應(yīng)的項目數(shù)據(jù)。
全文摘要
一種適用于例如金融機構(gòu)中處理文件的數(shù)據(jù)媒體處理裝置和數(shù)據(jù)媒體處理方法。用于基于從其上的信息以任意格式描述的數(shù)據(jù)媒體讀取的圖象(19)而識別信息的數(shù)據(jù)媒體處理裝置(30)的結(jié)構(gòu)為,它包括裝置(2)用于從讀取的圖象數(shù)據(jù)(19)抽取包含格式的數(shù)據(jù)媒體所唯有的特征并從這些特征確定要被識別的信息所出現(xiàn)的位置,以及圖象識別裝置(3)用于識別由前面的裝置(2)所確定的位置處的圖象(19)以鑒別信息,使得數(shù)據(jù)媒體處理裝置(30)能夠處理具有諸如私人票據(jù)等各種格式的文件。
文檔編號G06K9/20GK1540578SQ20041000389
公開日2004年10月27日 申請日期1996年7月30日 優(yōu)先權(quán)日1995年7月31日
發(fā)明者江口真一, 勝又裕, 千葉亙一, 松野秀樹, 永野義博, 牛田和秀, 鐮田英夫, 松橋智浩, 稲岡秀行, 渡部英一, 直井聰, 坂根俊司, 小原勝利, 山本一范, 渡邊和人, 木嶋順之, 山崎芳則, 町田泰孝, 一, 之, 人, 利, 博, 司, 夫, 孝, 樹, 浩, 秀, 范 , 行 申請人:富士通株式會社