字符識(shí)別裝置和字符識(shí)別方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種能夠高精度地識(shí)別票據(jù)(日語:帳票)等中寫入的手寫字符的字符識(shí)別裝置和字符識(shí)別方法,特別涉及一種能夠高精度且高速地識(shí)別以中國內(nèi)地的簡體文字、中國臺(tái)灣的繁體文字寫入的漢字字符的字符識(shí)別裝置和字符識(shí)別方法。
【背景技術(shù)】
[0002]以光學(xué)方式讀取票據(jù)等中記載的手寫漢字來進(jìn)行字符識(shí)別的字符識(shí)別裝置構(gòu)成為:提取按每個(gè)字符切取出的字符圖形的特征,由于漢字構(gòu)造是由位于漢字的左側(cè)的偏(日語九)、位于漢字構(gòu)造的右側(cè)的旁(日語< <0 )、位于漢字構(gòu)造的上側(cè)的冠(日語:扣九? <0 )、位于漢字構(gòu)造的下側(cè)的腳(日語:? L )、位于包圍漢字構(gòu)造整體的位置的構(gòu)(日語:扣圭;I )、位于從漢字的上側(cè)下垂到下側(cè)的位置的垂(日語:/^扎)以及位于從漢字構(gòu)造的左側(cè)沿著下側(cè)的位置的繞(日語i 3 )這樣的配置于多個(gè)區(qū)域的漢字要素的組合構(gòu)成的,因此,判別用于分割各區(qū)域的分割區(qū)域,并且使用歐幾里德(Euclid)距離值來提取字符圖像的特征量,從而進(jìn)行字符識(shí)別。
[0003]基于該以往技術(shù)的字符識(shí)別處理構(gòu)成為通過由字符識(shí)別裝置的計(jì)算機(jī)執(zhí)行如圖18所示的以下步驟來進(jìn)行字符識(shí)別:步驟S1801,提取字符圖像的特征;步驟S1802,基于通過該步驟S1801提取出的特征量來判定字符圖像是漢字還是非漢字;步驟S1804,計(jì)算通過該步驟S1802進(jìn)行了判定的字符圖像的歐幾里德距離值;步驟S1803,判別漢字的字符圖像的部首等分割區(qū)域;步驟S1805,計(jì)算通過步驟S1803進(jìn)行了區(qū)域判定的字符圖像的進(jìn)行η分割得到的每個(gè)區(qū)域的余弦相似度;步驟S1806,將通過該步驟S1805計(jì)算出的相似度與同形字符表進(jìn)行比較來選擇同形字符和相似字符候選;步驟S1807,基于通過上述步驟S1804計(jì)算出的歐幾里德距離以及通過步驟S1806選擇出的同形字符和相似字符候選來判定識(shí)別候選的字符;以及步驟S1808,輸出通過該步驟S1807判定出的字符候選的判定結(jié)果。另夕卜,上述同形字符表按共同的部首、旁等將漢字進(jìn)行分類,并且按人目視時(shí)相像的字形將漢字進(jìn)行分類。
[0004]通過上述步驟S1807,候選判定使用以下條件來進(jìn)行識(shí)別字符候選的判定:(1)根據(jù)通過步驟S1802得到的漢字、非漢字結(jié)果來選擇候選;(2)選擇通過步驟S1804得到的歐幾里德距離值小的候選;(3)選擇通過步驟S1805得到的余弦相似度高的候選;(4)選擇在一部分分割區(qū)域中余弦相似度高的候選;以及(5)選擇余弦相似度大的字符類型(日語:字種)所屬的同形字符分類表,其中,通過圖22所示的公式來計(jì)算上述歐幾里德距離值和余弦相似度,其中,X為輸入圖案矢量,μ為平均圖案矢量。
[0005]S卩,以往的字符識(shí)別處理構(gòu)成為通過將字符圖像的歐幾里德距離值、余弦相似度、區(qū)域分割以及同形字符表比較這樣的各種技術(shù)進(jìn)行組合來決定識(shí)別字符候選。
[0006]此外,作為記載了基于以往技術(shù)的字符識(shí)別技術(shù)的文獻(xiàn),可以列舉出下述的專利文獻(xiàn)1,在該專利文獻(xiàn)1中記載了如下技術(shù):特征量提取部從由輸入部輸入的字符圖像提取字符圖像的特征量,匹配部在使用擬貝葉斯判別函數(shù)計(jì)算與辭典的相異度時(shí),一邊根據(jù)字符圖像來調(diào)整擬貝葉斯判別函數(shù)要計(jì)算的主成分?jǐn)?shù)(擬貝葉斯判別函數(shù)式的k) 一邊計(jì)算與辭典的相異度,由此減少對字符識(shí)別精度的提高的貢獻(xiàn)不穩(wěn)定的主成分校正項(xiàng)的計(jì)算,從而消除字符識(shí)別所不需要的小的特征量,并補(bǔ)充特征不足成分。作為記載了前述的分割部首來進(jìn)行字符識(shí)別的技術(shù)的文獻(xiàn),可以列舉出下述的專利文獻(xiàn)2,在該專利文獻(xiàn)2中記載了如下技術(shù):區(qū)域合并部基于所輸入的手寫字符的各筆畫的坐標(biāo)序列來判定該筆畫是否跨越了字符框內(nèi)的分割區(qū)域,在跨越了的情況下合并相應(yīng)的分割區(qū)域,部首切取部基于合并后的分割區(qū)域以部首為單位對上述手寫字符進(jìn)行切取,部首識(shí)別部參照部首識(shí)別辭典對該切取出的各部首進(jìn)行識(shí)別處理,字符結(jié)構(gòu)部基于部首識(shí)別處理的結(jié)果和字符結(jié)構(gòu)辭典來獲取手寫字符的識(shí)別結(jié)果,由此容易地進(jìn)行部首切取來提高識(shí)別精度。作為記載了在字符識(shí)別中使用歐幾里德距離的技術(shù)的文獻(xiàn),可以列舉出下述的專利文獻(xiàn)3,在該專利文獻(xiàn)3中記載了設(shè)置有以下單元的技術(shù):標(biāo)準(zhǔn)化單元,其將字符圖像部分標(biāo)準(zhǔn)化成規(guī)定尺寸的矩形圖像;特征量計(jì)算單元,其計(jì)算將由該標(biāo)準(zhǔn)化單元標(biāo)準(zhǔn)化后的矩形圖像進(jìn)行分割所得到的分割圖像各自的HOG (Histograms of Oriented Gradient:梯度方向直方圖)特征量;距離計(jì)算單元,其計(jì)算將HOG特征量空間中的各分割圖像的HOG特征量結(jié)合起來得到的圖像部分的HOG特征量與各規(guī)定字符圖像的HOG特征量的歐幾里德距離;比較單元,其比較由該距離計(jì)算單元計(jì)算出的距離;以及字符識(shí)別單元,其基于比較單元的比較結(jié)果來識(shí)別上述字符圖像部分中有可能包含的字符。
[0007]專利文獻(xiàn)1:日本特開2000-215272號(hào)公報(bào)
[0008]專利文獻(xiàn)2:日本特開平11-184971號(hào)公報(bào)
[0009]專利文獻(xiàn)3:日本特開2014-29608號(hào)公報(bào)
【發(fā)明內(nèi)容】
[0010]發(fā)明要解決的問題
[0011]上述的基于以往技術(shù)的字符識(shí)別技術(shù)從作為識(shí)別對象的字符圖像提取大量的特征量來估計(jì)成為正確答案的類別(例如日語的“務(wù)” “亜”等),因此,若是漢字則會(huì)成為數(shù)千個(gè)類別,從而在進(jìn)行高精度識(shí)別時(shí)處理時(shí)間變得冗長,特別是近年來,存在不僅對日語的漢字進(jìn)行字符識(shí)別、還對中國內(nèi)地的簡體文字、中國臺(tái)灣的繁體文字進(jìn)行字符識(shí)別的需求,識(shí)別對象的漢字類型增加,因此招致處理時(shí)間變得更冗長的問題。
[0012]另外,對于字符識(shí)別裝置,存在即使精度比較低也要高速地對大量票據(jù)進(jìn)行字符識(shí)別的顧客需求以及即使處理時(shí)間長也要高精度地對大量票據(jù)進(jìn)行字符識(shí)別的顧客需求,但是基于以往技術(shù)的字符識(shí)別裝置存在難以根據(jù)顧客需求來調(diào)整處理速度和識(shí)別精度的問題。
[0013]并且,上述的專利文獻(xiàn)1所記載的技術(shù)是想要通過消除字符識(shí)別所不需要的小的特征量并補(bǔ)充特征不足成分來實(shí)現(xiàn)高速且高精度,但是存在高精度化根據(jù)所設(shè)定的閾值而有限度、從而導(dǎo)致容許一定數(shù)量的誤辨別的問題,其它專利文獻(xiàn)所記載的技術(shù)存在難以高速處理的問題。
[0014]本發(fā)明的第一目的在于解決前述的以往技術(shù)的問題,提供一種能夠進(jìn)行高速高精度的漢字字符的識(shí)別的字符識(shí)別裝置和字符識(shí)別方法,第二目的在于提供一種能夠根據(jù)顧客需求來調(diào)整速度和識(shí)別精度的字符識(shí)別裝置和字符識(shí)別方法。_5] 用于解決問題的方案
[0016]為了達(dá)到上述的目的,本發(fā)明的第一發(fā)明是一種字符識(shí)別裝置,該字符識(shí)別裝置具備:輸入部,其以光學(xué)方式將包括漢字的字符讀取為字符圖像,該漢字由多個(gè)區(qū)域的漢字要素構(gòu)成;圖像獲取部,其獲取使用該輸入部讀取的字符圖像;外部存儲(chǔ)部,其保存字符辨別用辭典和同形字符表,該字符辨別用辭典保存有多個(gè)標(biāo)準(zhǔn)字符圖像,該同形字符表用于按共同的部首、旁將漢字進(jìn)行分類并且將目視時(shí)相像的相似和同形的漢字進(jìn)行分類;以及運(yùn)算部,其參照該字符辨別用辭典和同形字符表來控制字符圖像的字符識(shí)別,其中,該運(yùn)算部參照字符辨別用辭典對輸入的字符圖像執(zhí)行字符識(shí)別處理,該字符識(shí)別裝置的特征在于,
[0017]上述運(yùn)算部包括:
[0018]分割區(qū)域判定單元,判定按漢字要素對上述圖像獲取部所獲取的1個(gè)字符單位的字符圖像進(jìn)行分割的分割區(qū)域;
[0019]余弦相似度計(jì)算單元,計(jì)算通過該分割區(qū)域判定單元進(jìn)行了判定的字符圖像的同一區(qū)域位置處的漢字要素的余弦相似度;
[0020]歐幾里德距離值計(jì)算單元,計(jì)算通過上述分割區(qū)域判定單元進(jìn)行了判定的字符圖像的同一區(qū)域位置處的漢字要素的歐幾里德距離值;
[0021]同形字符表制作單元,制作將以下字符圖像作為相似度高的同形字符進(jìn)行分組而得到的同形字符表:基于通過上述分割區(qū)域判定單元判定出的分割區(qū)域的漢字結(jié)構(gòu)相同且同一區(qū)域位置的漢字要素之間的基于通過上述余弦相似度計(jì)算單元計(jì)算出的余弦相似度的相似度高于規(guī)定值的字符圖像、以及漢字要素之間的通過上述歐幾里德距離值計(jì)算單元計(jì)算出的歐幾里德距離值小于規(guī)定值的字符圖像;以及
[0022]標(biāo)準(zhǔn)字符識(shí)別單元,將以下字符圖像之間的邏輯或的字符圖像作為候選字符來進(jìn)行字符識(shí)別:通過上述余弦相似度計(jì)算單元計(jì)算出的余弦相似度大于規(guī)定的余弦相似度的字符圖像、通過上述歐幾里德距離值計(jì)算單元計(jì)算出的歐幾里德距離值小于規(guī)定值的字符圖像、以及通過上述同形字符表制作單元將同一區(qū)域位置的相似度高的字符圖像進(jìn)行分組而得到的同形字符的字符圖像。
[0023]本發(fā)明的第二發(fā)明的特征在于,在第一發(fā)明的字符識(shí)別裝置中,上述運(yùn)算部還包括高精度字符識(shí)別單元,該高精度字符識(shí)別單元基于從通過標(biāo)準(zhǔn)字符識(shí)別單元的邏輯或而得到的字符圖像中排除通過上述分割區(qū)域判定單元分割出的多個(gè)分割區(qū)域的結(jié)構(gòu)不同的異種候選字符以及該異種候選字符所屬的組中包含的字符圖像后得到的候選字符,來進(jìn)行字符識(shí)別。
[0024]本發(fā)明的第三發(fā)明的特征在于,在第一發(fā)明或第二發(fā)明的字符識(shí)別裝置中,上述運(yùn)算部還包括高速字符識(shí)別單元,該高速字符識(shí)別單元將通過上述歐幾里德距離值計(jì)算單元計(jì)算出的歐幾里德距離值小于規(guī)定值的字符圖像作為候選字符來進(jìn)行字符識(shí)別。
[0025]本發(fā)明的第四發(fā)明的特征在于,在第一發(fā)明至第三發(fā)明中的任一發(fā)明的字符識(shí)別裝置中,上述同形字符表制作單元包括分大組單元和分小組單元,該分大組單元將基于通過上述分割區(qū)域判定單元判定出的分割區(qū)域的漢字結(jié)構(gòu)相同的字符圖像分為大組,該分小組單元將通過該分大組單元分組得到的大組內(nèi)的、特定區(qū)域位置的漢字要素的余弦相似度高于規(guī)定值且歐幾里德距離值小于規(guī)定值的字符圖像分為小組,上述運(yùn)算部將通過該分大組單元和該分小組單元分組得到的字符圖像保存在同形字符表中。
[0026]本發(fā)明的第五發(fā)明的特征在于,在第一發(fā)明至第四發(fā)明中的任一發(fā)明的字符識(shí)別裝置中,上述運(yùn)算部具備對上述標(biāo)準(zhǔn)字符識(shí)別單元、上述高精度字符識(shí)別單元以及上述高速字符識(shí)別單元進(jìn)行切換或調(diào)整的功能。
[0027]另外,本發(fā)明的第六發(fā)明是一種識(shí)別字符的字符識(shí)別裝置的字符識(shí)別方法,該字符識(shí)別裝置具備:輸入部,其以光學(xué)方式將包括漢字的字符讀取為字符圖像,該漢字由多個(gè)區(qū)域的漢字要素構(gòu)成;圖像獲取部,其獲取使用該輸入部讀取的字符圖像;外部存儲(chǔ)部,其保存字符辨別用辭典和同形字