專利名稱:一種掃描識別模板制作和使用方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及掃描識別技術(shù)領(lǐng)域,具體涉及一種掃描識別模板制作和使用方法及系統(tǒng)。
背景技術(shù):
隨著社會的不斷進(jìn)步,數(shù)字化技術(shù)的迅猛發(fā)展,人們越來越青睞電子化的資料索取,所以越來越多對紙質(zhì)資料需要進(jìn)行數(shù)字化處理,進(jìn)行掃描識別。數(shù)字化生產(chǎn)過程中,OCR技術(shù)非常關(guān)鍵,OCR技術(shù)的優(yōu)劣直接影響資料識別質(zhì)量的好壞。而紙質(zhì)資料中的各種圖表、公式等極大增加計算機(jī)自動識別的難度。還有一些資料中的圖片,識別起來會浪費大量時間,而且效果不好,同時大大降低識別的效率。識別之后的內(nèi)容整理的工作量也是十分龐大的,非常容易造成內(nèi)容混亂,還需要人工進(jìn)行整理,增加了人工成本。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對目前OCR技術(shù)的缺陷,提供一種掃描識別模板制作和使用方法及系統(tǒng),以提高圖文識別的效率和質(zhì)量。本發(fā)明提供一種掃描識別模板制作和使用方法,包括如下步驟(SO)制作識別模板,在所述模板中劃出定位塊,并設(shè)置定位塊的屬性;(Si)對掃描圖像進(jìn)行區(qū)域分析,查找出與圖像區(qū)域重合率達(dá)到設(shè)定閥值的模板;(S2)將所述模板中的定位塊與掃描圖像中的區(qū)域進(jìn)行匹配,提取并識別已匹配定位塊的內(nèi)容信息;(S3)對已識別的定位塊內(nèi)容信息進(jìn)行歸類。進(jìn)一步,如上所述的一種掃描識別模板制作和使用方法,該方法還包括,對掃描圖像進(jìn)行歸一化處理,所述歸一化處理是指,將掃描中造成的圖像變形進(jìn)行矯正。進(jìn)一步,如上所述的一種掃描識別模板制作和使用方法,步驟(so)中,所述模板是指包含邊界的封閉圖形區(qū)域,所述模板中包含一個或多個定位塊,其中,定位塊指模板內(nèi)部的封閉矩形框,用于對其匹配區(qū)域內(nèi)的內(nèi)容進(jìn)行識別并進(jìn)行標(biāo)記。更進(jìn)一步,如上所述的一種掃描識別模板制作和使用方法,模板和定位塊均有附加屬性,包含匹配度量屬性,用于衡量模板與圖像的重合率、定位塊與圖像區(qū)域的重合率, 以及作為人工干預(yù)的指標(biāo)。更進(jìn)一步,如上所述的一種掃描識別模板制作和使用方法,所述定位塊的附加屬性還包含1)識別內(nèi)容類型包括文字、圖形、圖像;2)識別內(nèi)容聚類標(biāo)簽用于系統(tǒng)根據(jù)該標(biāo)簽對識別內(nèi)容進(jìn)行分類處理;3)內(nèi)容校驗規(guī)則用于對識別內(nèi)容進(jìn)行檢查的規(guī)則;4)自動變形屬性用于定位塊與圖像區(qū)域重合對比時,對定位塊在設(shè)定閥值范圍內(nèi)進(jìn)行大小、位置的微調(diào)。進(jìn)一步,如上所述的一種掃描識別模板制作和使用方法,步驟(S》中,模板中定位塊與與掃描圖像中的區(qū)域進(jìn)行匹配,即兩個區(qū)域矩形重合率達(dá)到定位塊的匹配度量屬性設(shè)定的閾值即認(rèn)為該區(qū)域與該定位塊匹配。更進(jìn)一步,如上所述的一種掃描識別模板制作和使用方法,步驟(S》中,定位塊允許嵌套,定位塊對其區(qū)域內(nèi)內(nèi)容進(jìn)行識別時,按照如下次序進(jìn)行識別被嵌套層數(shù)、匹配度、優(yōu)先權(quán)重。更進(jìn)一步,如上所述的一種掃描識別模板制作和使用方法,步驟(S》中,定位塊根據(jù)其匹配區(qū)域的圖像內(nèi)容,對定位塊在設(shè)定閥值范圍內(nèi)進(jìn)行大小、位置的微調(diào)。更進(jìn)一步,如上所述的一種掃描識別模板制作和使用方法,步驟(S》中,定位塊根據(jù)識別內(nèi)容類型標(biāo)記,對其區(qū)域內(nèi)的圖像進(jìn)行不同類型的處理如針對文字進(jìn)行OCR識別、針對圖像進(jìn)行摳圖,針對圖形可能進(jìn)行曲線擬合。一種掃描識別模板制作和使用系統(tǒng),包括模板制作裝置,用于制作模板以及劃出模板中定位塊,并設(shè)置定位塊的屬性;模板管理裝置,用于管理所有的模板,并查找出與圖像區(qū)域重合率達(dá)到設(shè)定閥值的模板;識別執(zhí)行裝置,用于將定位塊與掃描圖像中的區(qū)域進(jìn)行匹配,提取并識別已匹配定位塊的內(nèi)容信息;分類裝置,用于對完成識別的內(nèi)容信息進(jìn)行分類。本發(fā)明的有益效果如下本發(fā)明對于基于模板出版的文件,有助于提升識別效率, 并進(jìn)行識別信息校驗與分類。對于圖像區(qū)域特征明顯的,通過切分區(qū)域,并通過不同識別難度區(qū)域的分離和標(biāo)記,不僅能夠相互驗證以提升識別的準(zhǔn)確性,而且還同時進(jìn)行識別內(nèi)容的分類整理。采用本發(fā)明所述的方法和系統(tǒng),解決了摳取的圖片的相對定位問題,大幅度降低了人工整理的工作量。
圖1是本發(fā)明實施例中一種掃描識別模板制作和使用系統(tǒng)結(jié)構(gòu)圖;圖2是本發(fā)明實施例中一種掃描識別模板制作和使用方法流程圖;圖3是實施例中一個原始掃描圖像;圖4是實施例中的最適合圖3的模板圖樣;圖5是實施例中定位塊與圖像區(qū)域進(jìn)行匹配的示意圖。
具體實施例方式下面結(jié)合說明書附圖對本發(fā)明的具體實施方式
進(jìn)行詳細(xì)說明。如圖1所示,本發(fā)明提供了一種掃描識別模板制作系統(tǒng),包括模板制作裝置11,用于制作模板以及模板中定位塊,并設(shè)置定位塊的屬性;模板管理裝置12,用于管理所有的模板,并查找出與圖像區(qū)域重合率達(dá)到設(shè)定閥值的模板;識別執(zhí)行裝置13,用于將定位塊與掃描圖像中的區(qū)域進(jìn)行匹配,提取并識別已匹配定位塊的內(nèi)容信息;分類裝置14,用于對完成識別的內(nèi)容信息進(jìn)行分類。上述系統(tǒng)所實現(xiàn)的一種掃描識別模板制作方法如圖2所示,該方法包括如下步驟SO:制作識別模板,在所述模板中劃出定位塊,并設(shè)置定位塊的屬性。本發(fā)明實施例中,所述模板是指包含邊界的封閉圖形區(qū)域,所述模板中包含一個或多個定位塊,其中,定位塊指模板內(nèi)部的封閉矩形框,用于對其匹配區(qū)域內(nèi)的內(nèi)容進(jìn)行識別并進(jìn)行標(biāo)記。模板和定位塊均有附加屬性,包含匹配度量屬性,用于衡量模板與圖像的重合率、定位塊與圖像區(qū)域的重合率,以及作為人工干預(yù)的指標(biāo)。所述定位塊的附加屬性還包含1)識別內(nèi)容類型如文字、圖形、圖像;2)識別內(nèi)容聚類標(biāo)簽用于系統(tǒng)根據(jù)該標(biāo)簽對識別內(nèi)容進(jìn)行分類處理。3)內(nèi)容校驗規(guī)則,用于對識別內(nèi)容進(jìn)行檢查的規(guī)則;4)自動變形屬性用于定位塊與圖像區(qū)域重合對比時,對定位塊在設(shè)定閥值范圍內(nèi)進(jìn)行大小、位置的微調(diào)。Sl 對掃描圖像進(jìn)行區(qū)域分析,查找出與圖像區(qū)域重合率達(dá)到設(shè)定閥值的模板。本發(fā)明實施例中,對掃描圖像進(jìn)行連通域分析,根據(jù)連通域的特性進(jìn)行圖像的區(qū)域分割,將區(qū)域分割后的圖像與模板管理裝置中的模板進(jìn)行匹配,計算區(qū)域重合率,由此找出對應(yīng)的模板。這種連通域分析及匹配方法為本領(lǐng)域的公知技術(shù)。本發(fā)明實施例中,還包括對掃描圖像進(jìn)行歸一化處理,所述歸一化處理是指,將掃描中造成的圖像變形進(jìn)行矯正,典型如頁面彎曲,大小有輕微變化。歸一化處理有助于提高模板與掃描圖像匹配的效率和準(zhǔn)確度。掃描頁面的歸一化處理所采用的都是一些公知的圖像處理技術(shù)。S2:將所述模板中的定位塊與掃描圖像中的區(qū)域進(jìn)行匹配,提取并識別已匹配定位塊的內(nèi)容信息。本發(fā)明實施例中,模板中定位塊與掃描圖像中的區(qū)域進(jìn)行匹配,即兩個區(qū)域矩形重合率達(dá)到定位塊的匹配度量屬性設(shè)定的閥值即認(rèn)為該區(qū)域與該定位塊匹配。更進(jìn)一步,定位塊允許嵌套,定位塊對其區(qū)域內(nèi)的內(nèi)容進(jìn)行識別時,按照如下次序進(jìn)行識別被嵌套層數(shù)、匹配度、優(yōu)先權(quán)重。更進(jìn)一步,定位塊根據(jù)其匹配區(qū)域的圖像內(nèi)容,對定位塊在設(shè)定閥值范圍內(nèi)進(jìn)行大小、位置的微調(diào)。更進(jìn)一步,定位塊根據(jù)識別內(nèi)容類型標(biāo)記,對其區(qū)域內(nèi)的圖像進(jìn)行不同類型的處理如針對文字進(jìn)行OCR識別、針對圖像進(jìn)行摳圖,針對圖形可能進(jìn)行曲線擬合。S3 對已識別的定位塊內(nèi)容信息進(jìn)行歸類。如某些定位塊對應(yīng)的識別信息為圖像,某些定位塊對應(yīng)的識別信息為文字,對這些不同類型的內(nèi)容信息進(jìn)行相應(yīng)的歸類。下面為本發(fā)明具體的實施例描述,以詳細(xì)說明掃描識別模板制作方法的具體技術(shù)細(xì)節(jié)。
圖3是實施例中一個原始掃描圖像,由圖中可以看出,該原始掃描是一個菜譜的內(nèi)容,包括一幅完成品的圖樣,整個菜譜的材料,制作方法及注意事項。圖4是實施例中的最適合圖3的模板圖樣。在模板管理裝置中,根據(jù)圖3進(jìn)行區(qū)域分析,查找出與圖像區(qū)域重合率達(dá)到設(shè)定閥值的模板,本實施例中,如圖4所示的版式模板。由圖中可以看出,該模板由2個部分組成,模板外框41、和定位塊42。其中,模板外框41設(shè)定了整個掃描圖像的大小,定位塊42則標(biāo)記出掃描圖像中內(nèi)容的分布情況。本實施例中,定位塊都包含有以下屬性1)識別內(nèi)容類型如文字、圖形、圖像;2)識別內(nèi)容聚類標(biāo)簽用于系統(tǒng)根據(jù)該標(biāo)簽對識別內(nèi)容進(jìn)行分類處理。3)內(nèi)容校驗規(guī)則,用于對識別內(nèi)容進(jìn)行檢查的規(guī)則;4)自動變形屬性用于定位塊與圖像區(qū)域重合對比時,對定位塊在設(shè)定閥值范圍內(nèi)進(jìn)行大小、位置的微調(diào)。圖5是實施例中定位塊與圖像區(qū)域進(jìn)行匹配。在識別執(zhí)行裝置中,首先將模板中定位塊與圖像區(qū)域按照位置匹配,即兩個區(qū)域矩形重合率達(dá)到設(shè)定閥值即認(rèn)為該區(qū)域與該定位塊匹配。這種位置匹配技術(shù)為本領(lǐng)域的公知技術(shù),此處就不再過多的進(jìn)行介紹,本實施例中,閥值設(shè)定為85%,即模板中定位塊與圖像區(qū)域的重合率達(dá)到85%以上,就認(rèn)為該區(qū)域與該定位塊匹配。本實施例中,如圖5所示。在區(qū)域與定位塊進(jìn)行初級匹配后,根據(jù)設(shè)置在定位塊中的屬性,對定位塊在設(shè)定閥值范圍內(nèi)進(jìn)行大小、位置的微調(diào)。例如對定位塊c,當(dāng)定位塊c與圖像中的注意事項匹配之后,定位塊C自動縮小到文字范圍,而忽略了文字的外框。接下來,識別已匹配定位塊的內(nèi)容,將識別的內(nèi)容記錄在定位塊內(nèi)。同時將識別的內(nèi)容進(jìn)行分類,例如定位塊a識別出的內(nèi)容類型為圖像,定位塊b識別出的內(nèi)容類型為文字。將已識別的定位塊內(nèi)容信息進(jìn)行歸類。顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其同等技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。
權(quán)利要求
1.一種掃描識別模板制作和使用方法,包括如下步驟(50)制作識別模板,在所述模板中劃出定位塊,并設(shè)置定位塊的屬性;(51)對掃描圖像進(jìn)行區(qū)域分析,查找出與圖像區(qū)域重合率達(dá)到設(shè)定閥值的模板;(52)將所述模板中的定位塊與掃描圖像中的區(qū)域進(jìn)行匹配,提取并識別已匹配定位塊的內(nèi)容信息;(53)對已識別的定位塊內(nèi)容信息進(jìn)行歸類。
2.如權(quán)利要求1所述的一種掃描識別模板制作和使用方法,其特征在于,該方法還包括,對掃描圖像進(jìn)行歸一化處理,所述歸一化處理是指,將掃描中造成的圖像變形進(jìn)行矯正。
3.如權(quán)利要求1所述的一種掃描識別模板制作和使用方法,其特征在于,步驟(SO)中, 所述模板是指包含邊界的封閉圖形區(qū)域,所述模板中包含一個或多個定位塊,其中,定位塊指模板內(nèi)部的封閉矩形框,用于對其匹配區(qū)域內(nèi)的內(nèi)容進(jìn)行識別并進(jìn)行標(biāo)記。
4.如權(quán)利要求3所述的一種掃描識別模板制作和使用方法,其特征在于,所述的模板和定位塊均有附加屬性,包含匹配度量屬性,用于衡量模板與圖像的重合率、定位塊與圖像區(qū)域的重合率,以及作為人工干預(yù)的指標(biāo)。
5.如權(quán)利要求4所述的一種掃描識別模板制作和使用方法,其特征在于,所述定位塊的附加屬性還包含1)識別內(nèi)容類型包括文字、圖形、圖像;2)識別內(nèi)容聚類標(biāo)簽用于系統(tǒng)根據(jù)該標(biāo)簽對識別內(nèi)容進(jìn)行分類處理;3)內(nèi)容校驗規(guī)則用于對識別內(nèi)容進(jìn)行檢查的規(guī)則;4)自動變形屬性用于定位塊與圖像區(qū)域重合對比時,對定位塊在設(shè)定閥值范圍內(nèi)進(jìn)行大小、位置的微調(diào)。
6.如權(quán)利要求4所述的一種掃描識別模板制作和使用方法,其特征在于,步驟(S2)中, 模板中定位塊與掃描圖像中的區(qū)域進(jìn)行匹配,如果兩個區(qū)域矩形重合率達(dá)到定位塊的匹配度量屬性設(shè)定的閥值即認(rèn)為該區(qū)域與該定位塊匹配。
7.如權(quán)利要求6所述的一種掃描識別模板制作和使用方法,其特征在于,步驟(S2)中, 定位塊允許嵌套,定位塊對其區(qū)域內(nèi)內(nèi)容進(jìn)行識別時,按照如下次序進(jìn)行識別被嵌套層數(shù)、匹配度、優(yōu)先權(quán)重。
8.如權(quán)利要求6所述的一種掃描識別模板制作和使用方法,其特征在于,步驟(S2)中, 定位塊根據(jù)其匹配區(qū)域的圖像內(nèi)容,對定位塊在設(shè)定閥值范圍內(nèi)進(jìn)行大小、位置的微調(diào)。
9.如權(quán)利要求6所述的一種掃描識別模板制作和使用方法,其特征在于,步驟(S2)中, 定位塊根據(jù)識別內(nèi)容類型標(biāo)記,對其區(qū)域內(nèi)的圖像進(jìn)行不同類型的處理。
10.一種掃描識別模板制作和使用系統(tǒng),包括模板制作裝置,用于制作模板以及劃出模板中定位塊,并設(shè)置定位塊的屬性;模板管理裝置,用于管理所有的模板,并查找出與圖像區(qū)域重合率達(dá)到設(shè)定閥值的模板;識別執(zhí)行裝置,用于將定位塊與掃描圖像中的區(qū)域進(jìn)行匹配,提取并識別已匹配定位塊的內(nèi)容信息;分類裝置,用于對完成識別的內(nèi)容信息進(jìn)行分類。
全文摘要
本發(fā)明涉及一種掃描識別模板制作和使用方法及系統(tǒng)。包括制作識別模板,在所述模板中劃出定位塊,并設(shè)置定位塊的屬性;對掃描圖像進(jìn)行區(qū)域分析,查找出與圖像區(qū)域重合率達(dá)到設(shè)定閥值的模板;將所述模板中的定位塊與掃描圖像中的區(qū)域進(jìn)行匹配,提取并識別已匹配定位塊的內(nèi)容信息;對已識別的定位塊內(nèi)容信息進(jìn)行歸類。采用本發(fā)明方法及系統(tǒng),大大提升對規(guī)則復(fù)雜版面的識別效率,并且自動完成對識別信息校驗與分類。
文檔編號G06K9/00GK102567711SQ20101062280
公開日2012年7月11日 申請日期2010年12月29日 優(yōu)先權(quán)日2010年12月29日
發(fā)明者周長嶺, 龔健 申請人:方正國際軟件(北京)有限公司, 方正國際軟件有限公司