字符識(shí)別系統(tǒng)、字符識(shí)別程序以及字符識(shí)別方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及字符識(shí)別系統(tǒng)。
【背景技術(shù)】
[0002]以往,提供了用于光學(xué)讀取被打印在紙上的字符而進(jìn)行識(shí)別的光學(xué)字符識(shí)別系統(tǒng),例如,在下述專(zhuān)利文獻(xiàn)1、2中作了公開(kāi)。
[0003]另一方面,如下述專(zhuān)利文獻(xiàn)3所公開(kāi)的那樣,為了在系統(tǒng)之間或應(yīng)用程序之間進(jìn)行數(shù)據(jù)的交接,需要借助通過(guò)畫(huà)面捕捉得到的圖像數(shù)據(jù),識(shí)別計(jì)算機(jī)的顯示器上顯示的字符。
[0004]現(xiàn)有技術(shù)文獻(xiàn)
[0005]專(zhuān)利文獻(xiàn)
[0006]專(zhuān)利文獻(xiàn)1:日本特開(kāi)2008-305126號(hào)公報(bào)
[0007]專(zhuān)利文獻(xiàn)2:日本特開(kāi)2010-26805號(hào)公報(bào)
[0008]專(zhuān)利文獻(xiàn)3:日本特開(kāi)2011-81537號(hào)公報(bào)
【發(fā)明內(nèi)容】
[0009]發(fā)明所要解決的課題
[0010]但是,顯示器上的顯示字符與被打印在紙上的字符相比,點(diǎn)的分辨率粗,所以即使采用現(xiàn)有的光學(xué)字符識(shí)別的手法,有時(shí)候識(shí)別率也會(huì)大幅下降。尤其是對(duì)于為了增大顯示數(shù)據(jù)量而使用的小字符尺寸的字符而言,識(shí)別率極端地降低。
[0011]本發(fā)明就是鑒于上述課題而完成的,其目的在于提供一種字符識(shí)別系統(tǒng),其能夠以高的準(zhǔn)確率識(shí)別顯示在計(jì)算機(jī)的顯示器上的字符。
[0012]用于解決課題的手段
[0013]為了解決上述課題,本發(fā)明的字符識(shí)別系統(tǒng)用于識(shí)別計(jì)算機(jī)的顯示器上顯示的字符,其特征在于,所述字符識(shí)別系統(tǒng)具有:存儲(chǔ)裝置,其針對(duì)規(guī)定的顯示字體和字符尺寸的組合,記錄有識(shí)別辭典,所述識(shí)別辭典具有關(guān)于具備該顯示字體和字符尺寸的各字符的構(gòu)成點(diǎn)的配置的信息;以及字符識(shí)別部,其參照所述識(shí)別辭典,提取與關(guān)于所述顯示器上顯示的識(shí)別對(duì)象字符的構(gòu)成點(diǎn)的配置的信息完全一致的字符,由此確定所述識(shí)別對(duì)象字符。
[0014]此外,本發(fā)明的字符識(shí)別程序用于使計(jì)算機(jī)識(shí)別顯示器上顯示的字符,其特征在于,所述字符識(shí)別程序使所述計(jì)算機(jī)執(zhí)行以下步驟:識(shí)別辭典生成步驟,針對(duì)規(guī)定的顯示字體和字符尺寸的組合,生成識(shí)別辭典,所述識(shí)別辭典具有關(guān)于具備該顯示字體和字符尺寸的各字符的構(gòu)成點(diǎn)的配置的信息;以及字符識(shí)別步驟,參照所述識(shí)別辭典,提取與關(guān)于所述顯示器上顯示的識(shí)別對(duì)象字符的構(gòu)成點(diǎn)的配置的信息完全一致的字符,由此確定所述識(shí)別對(duì)象字符。
[0015]此外,本發(fā)明的字符識(shí)別方法用于識(shí)別計(jì)算機(jī)的顯示器上顯示的字符,其特征在于,所述字符識(shí)別方法具有以下步驟:識(shí)別辭典生成步驟,針對(duì)規(guī)定的顯示字體和字符尺寸的組合,生成識(shí)別辭典,所述識(shí)別辭典具有關(guān)于具備該顯示字體和字符尺寸的各字符的構(gòu)成點(diǎn)的配置的信息;以及字符識(shí)別步驟,參照所述識(shí)別辭典,提取與關(guān)于所述顯示器上顯示的識(shí)別對(duì)象字符的構(gòu)成點(diǎn)的配置的信息完全一致的字符,由此確定所述識(shí)別對(duì)象字符。
[0016]發(fā)明效果
[0017]根據(jù)本發(fā)明,即使是顯示在計(jì)算機(jī)的顯示器上的分辨率低的字符,也能夠高精度地進(jìn)行字符識(shí)別。
【附圖說(shuō)明】
[0018]圖1是概略地示出本發(fā)明的實(shí)施方式的字符識(shí)別系統(tǒng)的結(jié)構(gòu)的示意圖。
[0019]圖2是示出本發(fā)明的實(shí)施方式的識(shí)別辭典的內(nèi)容的圖。
[0020]圖3是概略地示出本發(fā)明的實(shí)施方式的字符識(shí)別系統(tǒng)的功能的框圖。
[0021]圖4是示出本發(fā)明的實(shí)施方式的識(shí)別辭典的生成處理的流程的流程圖。
[0022]圖5是示出本發(fā)明的實(shí)施方式的字符識(shí)別的處理的流程的流程圖。
[0023]圖6是用于說(shuō)明本發(fā)明的實(shí)施方式的字符識(shí)別的處理的圖。
【具體實(shí)施方式】
[0024]下面,參照附圖詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式的字符識(shí)別系統(tǒng)。圖1是概略地示出本實(shí)施方式的字符識(shí)別系統(tǒng)的結(jié)構(gòu)的示意圖。圖2是示出本實(shí)施方式的識(shí)別辭典的內(nèi)容的圖。圖3是概略地示出本實(shí)施方式的字符識(shí)別系統(tǒng)的功能的框圖。
[0025]如圖1所示,字符識(shí)別系統(tǒng)I具有:計(jì)算機(jī)主體10 ;顯示器30,其是顯示來(lái)自計(jì)算機(jī)主體10的輸出信息的顯示裝置;以及鍵盤(pán)和鼠標(biāo)等輸入裝置32,其用于將信息輸入到計(jì)算機(jī)主體10。
[0026]本實(shí)施方式的字符識(shí)別系統(tǒng)I是用于識(shí)別顯示器30上顯示的字符的系統(tǒng),其特征在于,在進(jìn)行字符識(shí)別時(shí),不是利用光學(xué)字符識(shí)別,而是根據(jù)關(guān)于構(gòu)成字符的構(gòu)成點(diǎn)的配置的信息是否完全一致,來(lái)進(jìn)行字符的確定。在本實(shí)施方式中,以識(shí)別應(yīng)用程序A在顯示器30上的顯示窗口內(nèi)的規(guī)定的識(shí)別對(duì)象區(qū)域中顯示的顯示字符的情況為例進(jìn)行說(shuō)明。
[0027]計(jì)算機(jī)主體10具有:用于進(jìn)行各種運(yùn)算的CPU(Central Processing Unit,中央處理單元)等運(yùn)算裝置11 ;以及用于存儲(chǔ)各種信息的HDD (Hard Disc Drive,硬盤(pán)驅(qū)動(dòng)器)和作為運(yùn)算處理的工作區(qū)進(jìn)行使用的RAM (Random Access Memory,隨機(jī)存取存儲(chǔ)器)等存儲(chǔ)裝置12。
[0028]存儲(chǔ)裝置12具有:程序保存部121,其保存有安裝于計(jì)算機(jī)主體10的OS (Operating System:操作系統(tǒng))、字符識(shí)別程序、識(shí)別辭典生成程序、字體檢查程序、應(yīng)用程序A等各種程序;識(shí)別辭典DB (數(shù)據(jù)庫(kù))122,其保存有在進(jìn)行字符識(shí)別時(shí)使用的識(shí)別辭典;用于字體檢查的字體檢查用辭典DB 123 ;以及視頻存儲(chǔ)器125,其臨時(shí)保持顯示器30上顯示的畫(huà)面內(nèi)容。
[0029]關(guān)于程序保存部121,字符識(shí)別程序是用于執(zhí)行后述的字符識(shí)別處理的程序,識(shí)別辭典生成程序是用于執(zhí)行后述的識(shí)別辭典的生成處理的程序。此外,字體檢查程序是用于在進(jìn)行識(shí)別辭典的生成和字符識(shí)別時(shí),取得識(shí)別對(duì)象字符的顯示字體和字符尺寸的信息的程序。
[0030]在識(shí)別辭典DB 122中,按照顯示字體和字符尺寸的每種組合,生成識(shí)別辭典并進(jìn)行記錄。參照?qǐng)D2來(lái)說(shuō)明識(shí)別辭典的識(shí)別辭典記錄的內(nèi)容。識(shí)別辭典DB 122內(nèi)的各記錄具有“辭典ID”、“顯示字體”、“字符尺寸”、“字符代碼”、“外框內(nèi)點(diǎn)配置”、“外框尺寸”、“外框位置”的項(xiàng)目。
[0031]“辭典ID”是各識(shí)別辭典的識(shí)別符,如果是相同顯示字體和字符尺寸的組合,則為相同的識(shí)別符,如果顯示字體和字符尺寸的至少一個(gè)不同,則為不同的識(shí)別符?!帮@示字體”、“字符尺寸”和“字符代碼”是作為該記錄的生成源的字符的字體、尺寸、字符代碼。
[0032]“外框內(nèi)點(diǎn)配置”是包含構(gòu)成辭典生成源的字符的全部構(gòu)成點(diǎn)的最小矩形外框內(nèi)的點(diǎn)配置位置的信息。例如,將配置有黑色點(diǎn)的位置設(shè)為“ I ”,將沒(méi)有配置的空白位置設(shè)為“0”,從矩形外框內(nèi)的左上朝向右下,按照每行以“00110101110000”的形式進(jìn)行記錄。
[0033]“外框尺寸”是上述最小矩形外框的縱橫的尺寸信息(點(diǎn)的個(gè)數(shù))。“外框位置”是從基線(標(biāo)準(zhǔn)底線)到上述最小矩形外框的下邊的距離。在本實(shí)施方式中,“外框內(nèi)點(diǎn)配置”、“外框尺寸”、“外框位置”的項(xiàng)目相當(dāng)于關(guān)于字符的構(gòu)成點(diǎn)的配置的信息。
[0034]字體檢查用辭典DB 123內(nèi)記錄的字體檢查用辭典是用于在進(jìn)行識(shí)別辭典的生成和字符識(shí)別時(shí),取得識(shí)別對(duì)象字符的顯示字體和字符尺寸的信息的辭典。字體檢查用辭典僅針對(duì)例如“務(wù)U 3尤朽”等規(guī)定的檢查用的多種字符,具有與關(guān)于計(jì)算機(jī)主體10中安裝的全部字體的全部尺寸的上述識(shí)別辭典相同的信息。
[0035]接著,參照?qǐng)D3來(lái)說(shuō)明字符識(shí)別系統(tǒng)I的功能。如該圖所示,字符識(shí)別系統(tǒng)I具有:字體檢查部20,其具有識(shí)別顯示器30上顯示的顯示字符的顯示字體和字符尺寸的功能;辭典生成部21,其具有預(yù)先生成上述識(shí)別辭典的功能;以及字符識(shí)別部25,其具有進(jìn)行字符識(shí)別的功能。
[0036]這各個(gè)部分的功能是使運(yùn)算裝置11執(zhí)行程序保存部121中保存的字體檢查程序、識(shí)別辭典生成程序、字符識(shí)別程序來(lái)實(shí)現(xiàn)的。
[0037]接著,進(jìn)一步參照?qǐng)D4來(lái)說(shuō)明識(shí)別辭典DB 122中記錄的識(shí)別辭典的生成處理的流程。圖4是示出本實(shí)施方式的識(shí)別辭典的生成處理的流程的流程圖。
[0038]識(shí)別辭典的生成是在后述的字符識(shí)別處理之前進(jìn)行的,辭典生成部21生成針對(duì)之后待識(shí)別的識(shí)別對(duì)象字符的顯示字體和字符尺寸的組合的識(shí)別辭典。當(dāng)然,在已經(jīng)針對(duì)相同顯示字體和字符尺寸的組合生成了識(shí)別辭典的情況下,無(wú)需再次進(jìn)行辭典的生成,只要使用已經(jīng)登記的識(shí)別辭典即可。
[0039]在識(shí)別辭典的生成時(shí),在計(jì)算機(jī)主體10中執(zhí)行識(shí)別辭典生成程序。首先,在Sll中,進(jìn)行生成識(shí)別辭典所需的顯示字體和字符尺寸的取得。該字符尺寸等的取得是啟動(dòng)字體檢查程序而進(jìn)行的。
[0040]這里生成的識(shí)別辭典是應(yīng)用程序A在顯示窗口內(nèi)的規(guī)定的識(shí)別對(duì)象區(qū)域內(nèi)顯示的識(shí)別對(duì)象字符的顯示字體和字符尺寸的組合的識(shí)別辭典,所以字體檢查程序參照記錄在字體檢查用辭典DB 123內(nèi)的字體檢查用辭典,自動(dòng)確定該識(shí)別對(duì)象字符的顯示字體和字符尺寸。
[0041]具體而言,字體檢查部20通過(guò)畫(huà)面捕捉從視頻存儲(chǔ)器125取得識(shí)別對(duì)象字符的圖像數(shù)據(jù),一邊參照字體檢查用辭典DB 123,一邊提取與構(gòu)成識(shí)別對(duì)象字符的點(diǎn)的配置信息完全一致的字符。由此,確定與識(shí)別對(duì)象字符相同字體和相同尺寸的字符,能夠取得識(shí)別對(duì)象區(qū)域中顯示的字符的顯示字體和字符尺寸的信息。
[0042]另外,參照該字體檢查用辭典DB 123提取字符的處理與后述的字符識(shí)別的處理相同,所以省略詳細(xì)的說(shuō)明。此外,字體檢查用辭典是僅針對(duì)檢查用的多種字符的辭典,所以在進(jìn)行字體檢查時(shí),操作員需要預(yù)先進(jìn)行字符的輸入等作業(yè),以使該檢查用的字符作為識(shí)別對(duì)象字符顯示在識(shí)別對(duì)象區(qū)域內(nèi)。
[0043]與現(xiàn)有的光學(xué)字符識(shí)別不同,在本實(shí)施方式中,根據(jù)字符的構(gòu)成點(diǎn)的配置位置是否相同,進(jìn)行字符的識(shí)別,如果顯示字體或字符尺寸不同,則會(huì)被識(shí)