国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      圖像分類器生成方法和裝置及圖像分類方法和裝置制造方法

      文檔序號:6488799閱讀:239來源:國知局
      圖像分類器生成方法和裝置及圖像分類方法和裝置制造方法
      【專利摘要】本發(fā)明提供一種圖像分類器生成方法和裝置及圖像分類方法和裝置。生成用于表單分揀設(shè)備的圖像分類器的方法,包括:從多個樣本圖像中的每個樣本圖像中提取多個局部特征;將多個樣本圖像中的每個樣本圖像劃分為多個子區(qū)域;將從多個樣本圖像中提取的多個局部特征中的至少與多個子區(qū)域中的同一子區(qū)域相關(guān)聯(lián)的局部特征分為同一組;以及根據(jù)同一組中的局部特征生成與同一子區(qū)域?qū)?yīng)的搜索樹作為圖像分類器。
      【專利說明】圖像分類器生成方法和裝置及圖像分類方法和裝置
      【技術(shù)領(lǐng)域】
      [0001]本申請總體上涉及圖像處理的領(lǐng)域,更具體而言,涉及一種圖像分類器生成方法和裝置及圖像分類方法和裝置。
      【背景技術(shù)】
      [0002]圖像分類是圖像處理領(lǐng)域中的一個重要方面。在圖像處理領(lǐng)域,很多圖像處理需要根據(jù)圖像分類的結(jié)果來進(jìn)行。因此,圖像分類的有效性和準(zhǔn)確度對圖像處理領(lǐng)域中的很多圖像處理起著至關(guān)重要的作用。
      [0003]文檔圖像是各種圖像類型中的一種圖像類型。文檔圖像一般具有固定的版面格式,其具體示例包括表單圖像、執(zhí)照圖像、證書圖像、收據(jù)圖像、發(fā)票圖像等等。文檔圖像一般包括預(yù)打印的內(nèi)容和后打印的內(nèi)容,其中,預(yù)打印的內(nèi)容通常對應(yīng)于文檔的模板本身,例如空白表單等等;后打印的內(nèi)容涉及機(jī)打或手工填寫的內(nèi)容,例如簽字、圖章等等。文檔圖像分類通常在文檔的自動分發(fā)、歸檔、標(biāo)引和提取等方面起到至關(guān)重要的作用。
      [0004]目前,對圖像進(jìn)行分類的技術(shù)主要是像素級別的模板圖像匹配。這種技術(shù)的缺點在于難以避免繁瑣的制定模板、書寫規(guī)則和確認(rèn)系統(tǒng)的過程。另外,某些技術(shù)使用字符識別的結(jié)果,但是如果圖像質(zhì)量劣化,則識別結(jié)果變得不可靠,從而導(dǎo)致分類的結(jié)果變差。另外,現(xiàn)有技術(shù)中還存在一種基于機(jī)器學(xué)習(xí)對圖像進(jìn)行分類的技術(shù),但是該技術(shù)需要大量的手工標(biāo)注的樣本作為訓(xùn)練集。然而,在實際應(yīng)用中由于版權(quán)保護(hù)和信息安全等原因,通常不容易獲得真實的訓(xùn)練樣本,這使得基于機(jī)器學(xué)習(xí)對圖像進(jìn)行分類的技術(shù)難以應(yīng)用于實際。另外,現(xiàn)有技術(shù)中還存在一種基于圖形匹配進(jìn)行圖像分類的技術(shù),雖然該技術(shù)不需要大量的訓(xùn)練數(shù)據(jù),但是其適用范圍往往局限于某種特定的版式(例如曼哈頓板塊等),或者是假設(shè)可以獲得完美的圖像分割。因此,基于圖形匹配進(jìn)行圖像分類的技術(shù)同樣難以應(yīng)用于實際。
      [0005]因此,為了克服對圖像進(jìn)行分類的現(xiàn)有技術(shù)的上述缺點,本申請?zhí)岢隽艘环N新穎的和獨創(chuàng)的對圖像進(jìn)行分類的技術(shù),可獲得如下技術(shù)益處中的至少之一:其適用范圍廣泛,需要的訓(xùn)練數(shù)據(jù)少,受圖像格式、尺寸或質(zhì)量的影響小,以及提高了圖像分類的健壯性、準(zhǔn)確性和有效性。

      【發(fā)明內(nèi)容】

      [0006]在下文中將給出關(guān)于本發(fā)明的簡要概述,以便提供關(guān)于本發(fā)明的某些方面的基本理解。應(yīng)當(dāng)理解,這個概述并不是關(guān)于本發(fā)明的窮舉性概述。它并不是意圖確定本發(fā)明的關(guān)鍵或重要部分,也不是意圖限定本發(fā)明的范圍。其目的僅僅是以簡化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。
      [0007]根據(jù)本申請的實施例,提供了一種生成用于表單分揀設(shè)備的圖像分類器的方法,包括:從多個樣本圖像中的每個樣本圖像中提取多個局部特征;將多個樣本圖像中的每個樣本圖像劃分為多個子區(qū)域;將從多個樣本圖像中提取的多個局部特征中的至少與多個子區(qū)域中的同一子區(qū)域相關(guān)聯(lián)的局部特征分為同一組;以及根據(jù)同一組中的局部特征生成與同一子區(qū)域?qū)?yīng)的搜索樹作為圖像分類器。
      [0008]根據(jù)上述方法,其中,子區(qū)域彼此交疊。
      [0009]根據(jù)上述方法,其中,子區(qū)域為通過劃分樣本圖像得到的網(wǎng)格、或通過對劃分樣本圖像得到的網(wǎng)格按照方向進(jìn)行劃分而得到的分區(qū)。
      [0010]根據(jù)本發(fā)明的另一實施例,提供了一種生成用于表單分揀設(shè)備的圖像分類器的裝置,包括:提取單元,用于從多個樣本圖像中的每個樣本圖像中提取多個局部特征;劃分單元,用于將多個樣本圖像中的每個樣本圖像劃分為多個子區(qū)域;分組單元,用于將從多個樣本圖像中提取的多個局部特征中的至少與多個子區(qū)域中的同一子區(qū)域相關(guān)聯(lián)的局部特征分為同一組;以及生成單元,用于根據(jù)同一組中的局部特征生成與同一子區(qū)域?qū)?yīng)的搜索樹作為圖像分類器。
      [0011]根據(jù)上述裝置,其中,子區(qū)域彼此交疊。
      [0012]根據(jù)上述裝置,其中,子區(qū)域為通過劃分樣本圖像得到的網(wǎng)格、或通過對劃分樣本圖像得到的網(wǎng)格按照方向進(jìn)行劃分而得到的分區(qū)。
      [0013]根據(jù)本發(fā)明的又一實施例,提供了一種在表單分揀設(shè)備中對圖像進(jìn)行分類的方法,包括:從待分類的至少一個圖像中的每個圖像中提取多個局部特征;將待分類的至少一個圖像中的每個圖像劃分為多個子區(qū)域;針對從待分類的至少一個圖像中的每個圖像中提取的多個局部特征中的每個局部特征,通過與多個子區(qū)域中的關(guān)聯(lián)于該局部特征的子區(qū)域?qū)?yīng)的搜索樹,得到與該局部特征最相似的最近鄰特征,以及根據(jù)與最近鄰特征對應(yīng)的圖像類別得到每個圖像的初級分類結(jié)果;以及根據(jù)多個初級分類結(jié)果進(jìn)行投票,以得到每個圖像的最終分類結(jié)果。
      [0014]根據(jù)上述方法,還包括:根據(jù)與從待分類的圖像中提取的多個局部特征中的每個局部特征最相似的最近鄰特征,將待分類的圖像與圖像類別中的模板圖像進(jìn)行對準(zhǔn)。
      [0015]根據(jù)本發(fā)明的再一實施例,提供了一種在表單分揀設(shè)備中對圖像進(jìn)行分類的裝置,包括:提取部分,用于從待分類的至少一個圖像中的每個圖像中提取多個局部特征;劃分部分,用于將待分類的至少一個圖像中的每個圖像劃分為多個子區(qū)域;初級分類部分,用于針對從待分類的至少一個圖像中的每個圖像中提取的多個局部特征中的每個局部特征,通過與多個子區(qū)域中的關(guān)聯(lián)于每個局部特征的子區(qū)域?qū)?yīng)的搜索樹,得到與該局部特征最相似的最近鄰特征,以及根據(jù)與最近鄰特征對應(yīng)的圖像類別得到每個圖像的初級分類結(jié)果;以及投票部分,用于根據(jù)多個初級分類結(jié)果進(jìn)行投票,以得到每個圖像的最終分類結(jié)果O
      [0016]根據(jù)上述裝置,還包括:對準(zhǔn)部分,用于根據(jù)與從待分類的圖像中提取的多個局部特征中的每個局部特征最相似的最近鄰特征,將待分類的圖像與圖像類別中的模板圖像進(jìn)行對準(zhǔn)。
      [0017]本申請的對圖像進(jìn)行分類的方法和裝置可獲得如下技術(shù)益處中的至少之一:其適用范圍廣泛,需要的訓(xùn)練數(shù)據(jù)少,受圖像格式、尺寸或質(zhì)量的影響小,因此可以提高圖像分類的健壯性、準(zhǔn)確性和有效性。
      【專利附圖】

      【附圖說明】
      [0018]本發(fā)明可以通過參考下文中結(jié)合附圖所給出的描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標(biāo)記來表示相同或者相似的部件。所述附圖連同下面的詳細(xì)說明一起包含在本說明書中并且形成本說明書的一部分,而且用來進(jìn)一步舉例說明本發(fā)明的優(yōu)選實施例和解釋本發(fā)明的原理和優(yōu)點。在附圖中:
      [0019]圖1是示出根據(jù)本發(fā)明的一個實施例的生成圖像分類器的方法的示意性流程圖;
      [0020]圖2是示出根據(jù)本發(fā)明的一個實施例的生成圖像分類器的示意圖;
      [0021]圖3是示出根據(jù)本發(fā)明的一個實施例的生成圖像分類器的裝置的示意性框圖;
      [0022]圖4是示出根據(jù)本發(fā)明的一個實施例的對圖像進(jìn)行分類的方法的示意性流程圖;
      [0023]圖5是示出根據(jù)本發(fā)明的一個實施例的對圖像進(jìn)行分類的示意圖;
      [0024]圖6是示出根據(jù)本發(fā)明的一個實施例的對圖像進(jìn)行對準(zhǔn)的處理的示意性流程圖;
      [0025]圖7是示出對圖像進(jìn)行對準(zhǔn)的示意圖;
      [0026]圖8是示出對準(zhǔn)后的圖像的示意圖;
      [0027]圖9是示出根據(jù)本發(fā)明的一個實施例的對圖像進(jìn)行分類的裝置的示意性框圖;
      [0028]圖10是示出根據(jù)本發(fā)明的另一個實施例的對圖像進(jìn)行分類的裝置的示意性框圖;
      [0029]圖11是示出可用于作為實施根據(jù)本發(fā)明的實施例的信息處理設(shè)備的示意性框圖。
      【具體實施方式】
      [0030]在下文中將結(jié)合附圖對本發(fā)明的示范性實施例進(jìn)行描述。為了清楚和簡明起見,在說明書中并未描述實際實施方式的所有特征。然而,應(yīng)該了解,在開發(fā)任何這種實際實施方式的過程中可以做出很多特定于實施方式的決定,以便實現(xiàn)開發(fā)人員的具體目標(biāo),并且這些決定可能會隨著實施方式的不同而有所改變。
      [0031]在此,還需要說明的一點是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的裝置結(jié)構(gòu),而省略了與本發(fā)明關(guān)系不大的其他細(xì)節(jié)。
      [0032]下面結(jié)合圖1和圖2來描述根據(jù)本發(fā)明的一個實施例的生成圖像分類器的方法。圖1是示出根據(jù)本發(fā)明的一個實施例的生成圖像分類器的方法的示意性流程圖。圖2是示出根據(jù)本發(fā)明的一個實施例的生成圖像分類器的示意圖。
      [0033]在借助根據(jù)本發(fā)明的實施例的生成圖像分類器的方法來生成圖像分類器時,如圖1所示,該方法在SlOO開始。在SlOO之后,該方法前進(jìn)到S102。
      [0034]在S102處,從多個樣本圖像中的每個樣本圖像中提取多個局部特征。
      [0035]如圖2中的202所示,為了便于從輸入的多個樣本圖像201中的每個樣本圖像中提取多個局部特征,可以對輸入的多個樣本圖像中的每個樣本圖像進(jìn)行圖像預(yù)處理。輸入的多個樣本圖像201 —般為彩色圖像,其包含的信息量較大,導(dǎo)致運算量也較大。為了減小后續(xù)的運算量,可以將作為彩色圖像的多個樣本圖像201轉(zhuǎn)化為灰度圖像。本領(lǐng)域技術(shù)人員應(yīng)該理解,可以采用將彩色圖像轉(zhuǎn)化為灰度圖像的各種具體技術(shù),其具體細(xì)節(jié)在此不再贅述。另外,為了減少所提取的特征的數(shù)量以減少運算量,還可以對輸入的多個樣本圖像201或其轉(zhuǎn)化后的灰度圖像進(jìn)行下采樣。例如,當(dāng)輸入的多個樣本圖像201或其轉(zhuǎn)化后的灰度圖像的寬和高的像素值的最大值max_wh大于1000時,可以以系數(shù)K = 2n進(jìn)行下采樣,從而使下采樣后的圖像的寬和高的像素值的最大值max_wh’減小到1000以下。本領(lǐng)域技術(shù)人員應(yīng)該理解,可以采用對圖像進(jìn)行下采樣的各種具體技術(shù),其具體細(xì)節(jié)在此不再贅述。
      [0036]本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述對多個樣本圖像中的每個樣本圖像進(jìn)行圖像預(yù)處理是可選的。即,也可以不對多個樣本圖像中的每個樣本圖像進(jìn)行圖像預(yù)處理,而是直接從多個樣本圖像中的每個樣本圖像中提取多個局部特征。
      [0037]如圖2中的203所示,可以直接從多個樣本圖像中的每個樣本圖像中提取多個局部特征,或者可以從經(jīng)過圖像預(yù)處理之后的多個樣本圖像中的每個樣本圖像中提取多個局部特征。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,可以采用本領(lǐng)域中的各種提取圖像局部特征的方法來從多個樣本圖像中的每個樣本圖像中提取多個局部特征,例如可以采用SIFT (ScaleInvariant Feature Transform,尺度不變特征變換)方法、SURF (Speeded Up RobustFeature,加速穩(wěn)健特征)方法、BRISK方法或FREAK方法等等。本文中采用SIFT方法作為示例從多個樣本圖像中的每個樣本圖像中提取多個局部特征。具體地,可以采用SIFT方法從多個樣本圖像201中的第i個樣本圖像中提取多個特征描述子,每個描述子包括:長
      度M等于128維的特征向量Di=Iidil, di2,......,diM],其記錄了與該局部特征相關(guān)聯(lián)的特征
      區(qū)域的強(qiáng)度;長度為4維的向量Fi=Ki, Yi],其分別記錄了該局部特征的X軸和Y軸的位置;尺度Si ;以及主方向Ri等。有關(guān)SIFT方法的具體描述,可以參考“Distinctive ImageFeatures from Scale-1nvariant Keypoints,,,D.Lowe,In Intl.Journal of ComputerVision, vol.60,n0.2,第 91-110 頁,2004 年。
      [0038]回到圖1,在S104處,將多個樣本圖像中的每個樣本圖像劃分為多個子區(qū)域。
      [0039]如圖2所示,假設(shè)當(dāng)前處理的樣本圖像201為通過掃描得到的“營業(yè)執(zhí)照”的文檔圖像,則可以如圖2中的204所示,將該“營業(yè)執(zhí)照”的文檔圖像劃分為多個子區(qū)域。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,可以采用各種方法按照一定的模式將文檔圖像劃分為多個子區(qū)域,以及劃分得到的多個子區(qū)域的形狀、大小等可以相同,也可以不相同,只要可以將整個文檔圖像劃分為多個面積比整個文檔圖像的面積更小的子區(qū)域即可。換言之,本發(fā)明對劃分得到的子區(qū)域的形狀和大小不做具體的限定。
      [0040]具體地,根據(jù)本發(fā)明的一個實施例,子區(qū)域可以為通過劃分樣本圖像得到的網(wǎng)格。例如,如圖2所示,可以將“營業(yè)執(zhí)照”的文檔圖像劃分為mXn個網(wǎng)格,其中,m和η均為自然數(shù),并且m和η可以相等但不同時等于I。網(wǎng)格的形狀可以為矩形或正方形等。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,網(wǎng)格的形狀也可以為其它形狀,例如圓形或橢圓形等。另外,劃分得到的mXn個網(wǎng)格中的各個網(wǎng)格之間的大小可以相同,也可以不同。換言之,本發(fā)明對劃分得到的網(wǎng)格的形狀和大小不做具體的限定。
      [0041]根據(jù)本發(fā)明的另一個實施例,子區(qū)域可以為通過對劃分樣本圖像得到的網(wǎng)格按照方向進(jìn)行劃分而得到的分區(qū)。例如,如圖2中的206所示,針對將“營業(yè)執(zhí)照”的文檔圖像劃分得到的mXn個網(wǎng)格中的每個網(wǎng)格,按照方向?qū)⒚總€網(wǎng)格均勻劃分為r個分區(qū)作為子區(qū)域,例如按照[O, η /4] > [ Ti /4, /2]、[31 /2,3 /4]、[3 η /4, π ]、[ Ji , 5 π /4]、[5 Ji/4,3 Ji/2]、[3 Ji/2,7 Ji/4]和[7 π/4,2 π/]共8個方向?qū)⒚總€網(wǎng)格劃分為8個分區(qū)作為8個子區(qū)域。分別對mXn個網(wǎng)格中的每個網(wǎng)格執(zhí)行分區(qū)的劃分,由此可以得到mXnXr個分區(qū)作為mXnXr個子區(qū)域。
      [0042]本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,子區(qū)域還可以是其它形狀或大小等,只要所有子區(qū)域的集合可以覆蓋整個文檔圖像即可。
      [0043]另外,為了進(jìn)一步改善子區(qū)域邊界附近的特征標(biāo)記的不確定性可能引起的不足,在將樣本圖像劃分為多個子區(qū)域時,可以使多個子區(qū)域彼此交疊。換言之,在將樣本圖像劃分為多個子區(qū)域時,可以使相鄰的一個子區(qū)域與另一個子區(qū)域存在部分重疊的區(qū)域。
      [0044]具體地,在子區(qū)域是通過劃分樣本圖像得到的網(wǎng)格的情況下,如圖2中的205所示,由虛線框表示的相鄰的兩個網(wǎng)格彼此交疊,即由虛線框表示的相鄰的兩個網(wǎng)格存在部分重疊。另外,在子區(qū)域是通過對劃分樣本圖像得到的網(wǎng)格按照方向進(jìn)行劃分而得到的分區(qū)的情況下,也可以對方向采用類似的方式,使得相鄰的兩個分區(qū)也彼此交疊。
      [0045]再次回到圖1,在S106,將從多個樣本圖像中提取的多個局部特征中的至少與多個子區(qū)域中的同一子區(qū)域相關(guān)聯(lián)的局部特征分為同一組。
      [0046]如上所述,可以從每個樣本圖像中提取多個局部特征。另外,如上所述可以將每個樣本圖像劃分為多個子區(qū)域。因此,可以根據(jù)所提取的局部特征中所包含的X坐標(biāo)和Y坐標(biāo)的位置信息,來確定該局部特征是從樣本圖像中的哪個子區(qū)域中提取的,即確定與該局部特征相關(guān)聯(lián)的子區(qū)域。
      [0047]假設(shè)存在N個樣本圖像UMGdIMG2,……,IMGp,……,IMGN},其中p和N均為自然數(shù)并且I SN。另外,假設(shè)N個樣本圖像中的每個樣本圖像可被劃分為W個子區(qū)域(SR1, SR2,……,SRq,……,SRJ,其中q和W均為自然數(shù)并且I≤q≤W。另外,可以用Fp,q表示從第P個樣本圖像的第q個子區(qū)域中提取的局部特征。因此,可以將分別從N個樣本圖像的第I個子區(qū)域中提取的局部特征{FijFy,……,F(xiàn)iu,……,F(xiàn)n,J劃分為同一組作為與第I個子區(qū)域相關(guān)聯(lián)的所有局部特征。類似地,可以將分別從N個樣本圖像的第2個子區(qū)域中提取的局部特征汜,2,匕2,……,F(xiàn)p,2,……,F(xiàn)n,2}劃分為同一組作為與第2個子區(qū)域相關(guān)聯(lián)的所有局部特征,直至可以將分別從N個樣本圖像的第W個子區(qū)域中提取的局部特征……,F(xiàn)P,W,……,F(xiàn)n,w}劃分為同一組作為與第W個子區(qū)域相關(guān)聯(lián)的所有局部特征為止。
      [0048]具體地,在子區(qū)域是通過劃分樣本圖像得到的mXn個網(wǎng)格的情況下,可以根據(jù)所提取的局部特征中所包含的X坐標(biāo)和Y坐標(biāo)的位置信息,來確定該局部特征是從樣本圖像的mXn個網(wǎng)格中的哪個網(wǎng)格中提取的,即確定與該局部特征相關(guān)聯(lián)的網(wǎng)格,從而可以將從多個樣本圖像中提取的多個局部特征中的至少與mXn個網(wǎng)格中的同一網(wǎng)格相關(guān)聯(lián)的局部特征分為同一組。
      [0049]另外,在子區(qū)域是通過對劃分樣本圖像得到的mXn個網(wǎng)格按照方向進(jìn)行劃分而得到的mXnXr分區(qū)的情況下,可以根據(jù)所提取的局部特征中所包含的X坐標(biāo)和Y坐標(biāo)的位置信息,來確定該局部特征是從樣本圖像的mXnXr個分區(qū)中的哪個分區(qū)中提取的,SP確定與該局部特征相關(guān)聯(lián)的分區(qū),從而可以將從多個樣本圖像中提取的多個局部特征中的至少與mXnXr個分區(qū)中的同一分區(qū)相關(guān)聯(lián)的局部特征分為同一組。
      [0050]在S106之后,該方法前進(jìn)到S108。在S108處,根據(jù)同一組中的局部特征生成與同一子區(qū)域?qū)?yīng)的搜索樹作為圖像分類器。
      [0051]如上所述,通過步驟S106可以將從多個樣本圖像中提取的多個局部特征中的至少與多個子區(qū)域中的同一子區(qū)域相關(guān)聯(lián)的局部特征分為同一組。在從多個樣本圖像中獲得與同一子區(qū)域相關(guān)聯(lián)的所有局部特征作為同一組之后,可以利用該同一組中的所有局部特征生成與該同一子區(qū)域?qū)?yīng)的搜索樹作為圖像分類器,其中該搜索樹的每個葉子節(jié)點表示該同一組中的所有局部特征之一。例如,可以利用該同一組中的所有局部特征生成與該同一子區(qū)域?qū)?yīng)的KD樹作為圖像分類器,其中該KD樹的每個葉子節(jié)點表示該同一組中的所有局部特征之一。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,除了 KD樹之外,還可以采用其它的存儲方式作為上述搜索樹,只要所生成的搜索樹能夠方便地實現(xiàn)對該同一組中的所有局部特征的最近鄰搜索即可。
      [0052]接著上述的示例,可以根據(jù)從N個樣本圖像的第I個子區(qū)域中提取的所有局部特征{Fu,F(xiàn)2,P……,F(xiàn)iu,……,F(xiàn)n, J,來生成與第I個子區(qū)域?qū)?yīng)的搜索樹TR1,其中該搜索樹TR1的每個葉子節(jié)點表示該同一組中的所有局部特征{F^Fu,……,F(xiàn)iu,……,F(xiàn)n」}之一。類似地,可以根據(jù)從N個樣本圖像的第2個子區(qū)域中提取的所有局部特征{Fli2,F(xiàn)2,2)……,F(xiàn)p;2,……,F(xiàn)n,2},來生成與第2個子區(qū)域?qū)?yīng)的搜索樹TR2,其中該搜索樹TR2的每個葉子節(jié)點表示該同一組中的所有局部特征{Fi,2,F(xiàn)2,2,……,F(xiàn)p,2,……,F(xiàn)n,2}之一,直至可以根據(jù)從N個樣本圖像的第W個子區(qū)域中提取的所有局部特征……,F(xiàn)P,W,……,F(xiàn)N,W},來生成與第W個子區(qū)域?qū)?yīng)的搜索樹TRw為止,其中該搜索樹TRw的每個葉子節(jié)點表示該同一組中的所有局部特征{Fu,F(xiàn)2;w,……,F(xiàn)p,w,……,F(xiàn)n,w}之一。
      [0053]具體地,在子區(qū)域是通過劃分樣本圖像得到的mXn個網(wǎng)格的情況下,可以根據(jù)與mXn個網(wǎng)格中的同一網(wǎng)格相關(guān)聯(lián)的所有局部特征生成與該同一網(wǎng)格對應(yīng)的搜索樹,從而可以總共生成分別與mXn個網(wǎng)格對應(yīng)的mXn個搜索樹。
      [0054]另外,在子區(qū)域是通過對劃分樣本圖像得到的mXn個網(wǎng)格按照方向進(jìn)行劃分而得到的mXnXr分區(qū)的情況下,可以根據(jù)與mXnXr個分區(qū)中的同一分區(qū)相關(guān)聯(lián)的所有局部特征生成與該同一分區(qū)對應(yīng)的搜索樹,從而可以總共生成分別與mXnXr分區(qū)對應(yīng)的mXnXr個搜索樹。
      [0055]最后,該方法在SllO處結(jié)束。另外,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述S102和S104的順序可以是任意的,即S102和S104可以同時執(zhí)行,也可以先執(zhí)行S102再執(zhí)行S104,或者先執(zhí)行S104在執(zhí)行S102。
      [0056]根據(jù)上述方法生成的圖像分類器可獲得如下技術(shù)益處中的至少之一:其適用范圍廣泛,需要的訓(xùn)練數(shù)據(jù)少,受圖像格式、尺寸或質(zhì)量的影響小,因此采用該圖像分類器進(jìn)行圖像分類可以提高圖像分類的健壯性、準(zhǔn)確性和有效性。
      [0057]下面結(jié)合圖3來詳細(xì)說明根據(jù)本發(fā)明的一個實施例的生成圖像分類器的裝置的配置。圖3是示出根據(jù)本發(fā)明的一個實施例的生成圖像分類器的裝置的示意性框圖。
      [0058]如圖3所示,生成圖像分類器的裝置300包括:提取單元302,用于從多個樣本圖像中的每個樣本圖像中提取多個局部特征;劃分單元304,用于將多個樣本圖像中的每個樣本圖像劃分為多個子區(qū)域;分組單元306,用于將從多個樣本圖像中提取的多個局部特征中的至少與多個子區(qū)域中的同一子區(qū)域相關(guān)聯(lián)的局部特征分為同一組;以及生成單元308,用于根據(jù)同一組中的局部特征生成與同一子區(qū)域?qū)?yīng)的搜索樹作為圖像分類器。
      [0059]需要指出的是,在與裝置有關(guān)的實施例中所涉及的相關(guān)術(shù)語或表述與以上對根據(jù)本發(fā)明的實施例的方法的實施例闡述中所使用的術(shù)語或表述對應(yīng),在此不再贅述。
      [0060]上述圖3中的裝置例如可以被配置成按照相應(yīng)方法中的相應(yīng)步驟的工作方式來操作。細(xì)節(jié)參見上述針對根據(jù)本申請的實施例的方法所闡述的實施例。在此不再贅述。[0061]本領(lǐng)域技術(shù)人員理解,在上面描述的根據(jù)本發(fā)明各實施例的生成圖像分類器的方法中的各步驟或者生成圖像分類器的裝置中的各功能單元,可以根據(jù)實際需要進(jìn)行任意的組合,即,一個生成圖像分類器的方法實施例中的處理步驟可以與其它生成圖像分類器的方法實施例中的處理步驟進(jìn)行組合;或者,一個生成圖像分類器的裝置實施例中的功能單元可以與其它生成圖像分類器的裝置實施例中的功能單元進(jìn)行組合,以便實現(xiàn)所期望的技術(shù)目的。
      [0062]此外,本申請的實施例還提出了一種用于表單分揀設(shè)備的信息處理設(shè)備,其包括上述根據(jù)本發(fā)明的實施例的生成圖像分類器的裝置及其改進(jìn)方案。
      [0063]此外,本申請的實施例還提出了一種程序產(chǎn)品,該程序產(chǎn)品承載機(jī)器可執(zhí)行的指令,當(dāng)在信息處理設(shè)備上執(zhí)行所述指令時,所述指令使得所述信息處理設(shè)備執(zhí)行如根據(jù)上述本發(fā)明的實施例的生成圖像分類器的方法。
      [0064]此外,本申請的實施例還提出了一種存儲介質(zhì),該存儲介質(zhì)包括機(jī)器可讀的程序代碼,當(dāng)在信息處理設(shè)備上執(zhí)行所述程序代碼時,所述程序代碼使得所述信息處理設(shè)備執(zhí)行如根據(jù)上述本發(fā)明的實施例的生成圖像分類器的方法。
      [0065]相應(yīng)地,用于承載上述存儲有機(jī)器可讀取的指令代碼的程序產(chǎn)品的存儲介質(zhì)也包括在本發(fā)明的公開中。所述存儲介質(zhì)包括但不限于軟盤、光盤、磁光盤、存儲卡、存儲棒等
      坐寸ο
      [0066]下面結(jié)合圖4和圖5來描述根據(jù)本發(fā)明的一個實施例的對圖像進(jìn)行分類的方法。圖4是示出根據(jù)本發(fā)明的一個實施例的對圖像進(jìn)行分類的方法的示意性流程圖。圖5是示出根據(jù)本發(fā)明的一個實施例的對圖像進(jìn)行分類的示意圖。
      [0067]在借助根據(jù)本發(fā)明的實施例的對圖像進(jìn)行分類的方法對圖像進(jìn)行分類時,如圖4所示,該方法在S400開始。在S400之后,該方法前進(jìn)到S402。
      [0068]在S402處,從待分類的至少一個圖像中的每個圖像中提取多個局部特征。
      [0069]如圖5中的502所示,為了便于從輸入的待分類圖像501中提取多個局部特征,可以對輸入的待分類圖像進(jìn)行圖像預(yù)處理。輸入的待分類圖像501 —般為彩色圖像,其包含的信息量較大,導(dǎo)致運算量也較大。為了減小后續(xù)的運算量,可以將作為彩色圖像的待分類圖像201轉(zhuǎn)化為灰度圖像。本領(lǐng)域技術(shù)人員應(yīng)該理解,可以采用將彩色圖像轉(zhuǎn)化為灰度圖像的各種具體技術(shù),其具體細(xì)節(jié)在此不再贅述。另外,為了減少所提取的特征的數(shù)量以減少運算量,還可以對輸入的待分類圖像501或其轉(zhuǎn)化后的灰度圖像進(jìn)行下采樣。例如,當(dāng)輸入的待分類圖像501或其轉(zhuǎn)化后的灰度圖像的寬和高的像素值的最大值max_wh大于1000時,可以以系數(shù)K = 2n進(jìn)行下采樣,從而使下采樣后的圖像的寬和高的像素值的最大值max_wh’減小到1000以下。本領(lǐng)域技術(shù)人員應(yīng)該理解,可以采用對圖像進(jìn)行下采樣的各種具體技術(shù),其具體細(xì)節(jié)在此不再贅述。
      [0070]本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述對待分類圖像進(jìn)行圖像預(yù)處理是可選的。S卩,也可以不對待分類圖像進(jìn)行圖像預(yù)處理,而是直接從待分類圖像中提取多個局部特征。
      [0071]如圖5中的503所示,可以直接從待分類圖像中提取多個局部特征,或者可以從經(jīng)過圖像預(yù)處理之后的待分類圖像中提取多個局部特征。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,可以采用本領(lǐng)域中的各種提取圖像局部特征的方法來從待分類圖像中提取多個局部特征,例如可以米用SIFT (Scale Invariant Feature Transform,尺度不變特征變換)方法、SURF(Speeded Up Robust Feature,加速穩(wěn)健特征)方法、BRISK方法或FREAK方法等等。本文中采用SIFT方法作為示例從待分類圖像中提取多個局部特征。具體地,可以采用SIFT方法從待分類圖像501中提取多個特征描述子,每個描述子包括:長度M等于128維的特征向量D=W1, d2,……,dM],其記錄了與該局部特征相關(guān)聯(lián)的特征區(qū)域的強(qiáng)度;長度為4維的向量F=[X,Y],其分別記錄了該局部特征的X軸和Y軸的位置;尺度S ;以及主方向R等。有關(guān)SIFT方法的具體描述,可以參考“Distinctive Image Features from Scale-1nvariantKeypoints,,,D.Lowe, In Intl.Journal of Computer Vision, vol.60, n0.2,第 91-110 頁,2004 年。
      [0072]回到圖4,在S402之后,該方法前進(jìn)到S404。在S404處,將待分類的至少一個圖像中的每個圖像劃分為多 個子區(qū)域。
      [0073]如圖5所示,假設(shè)當(dāng)前處理的待分類圖像501為通過掃描得到的“營業(yè)執(zhí)照”的文檔圖像,則可以如圖5中的504所示,將該“營業(yè)執(zhí)照”的文檔圖像劃分為多個子區(qū)域。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,可以采用各種方法按照一定的模式將文檔圖像劃分為多個子區(qū)域,以及劃分得到的多個子區(qū)域的形狀、大小等可以相同,也可以不相同,只要可以將整個文檔圖像劃分為多個面積比整個文檔圖像的面積更小的子區(qū)域即可。換言之,本發(fā)明對劃分得到的子區(qū)域的形狀和大小不做具體的限定。
      [0074]具體地,根據(jù)本發(fā)明的一個實施例,子區(qū)域可以為通過劃分樣本圖像得到的網(wǎng)格。例如,如圖5所示,可以將“營業(yè)執(zhí)照”的文檔圖像劃分為mXn個網(wǎng)格,其中,m和η均為自然數(shù),并且m和η可以相等但不同時等于I。網(wǎng)格的形狀可以為矩形或正方形等。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,網(wǎng)格的形狀也可以為其它形狀,例如圓形或橢圓形等。另外,劃分得到的mXn個網(wǎng)格中的各個網(wǎng)格之間的大小可以相同,也可以不同。換言之,本發(fā)明對劃分得到的網(wǎng)格的形狀和大小不做具體的限定。
      [0075]根據(jù)本發(fā)明的另一個實施例,子區(qū)域可以為通過對劃分樣本圖像得到的網(wǎng)格按照方向進(jìn)行劃分而得到的分區(qū)。例如,如圖5中的506所示,針對將“營業(yè)執(zhí)照”的文檔圖像劃分得到的mXn個網(wǎng)格中的每個網(wǎng)格,按照方向?qū)⒚總€網(wǎng)格均勻劃分為r個分區(qū)作為子區(qū)域,例如按照[O, η /4] > [ Ti /4, /2]、[31 /2,3 /4]、[3 η /4, π ]、[ Ji , 5 π /4]、[5 Ji/4,3 Ji/2]、[3 Ji/2,7 Ji/4]和[7 π/4,2 π/]共8個方向?qū)⒚總€網(wǎng)格劃分為8個分區(qū)作為8個子區(qū)域。分別對mXn個網(wǎng)格中的每個網(wǎng)格執(zhí)行分區(qū)的劃分,由此可以得到mXnXr個分區(qū)作為mXnXr個子區(qū)域。
      [0076]本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,子區(qū)域還可以是其它形狀或大小等,只要所有子區(qū)域的集合可以覆蓋整個文檔圖像即可。
      [0077]另外,為了進(jìn)一步改善子區(qū)域邊界附近的特征標(biāo)記的不確定性可能引起的不足,在將待分類圖像劃分為多個子區(qū)域時,可以使多個子區(qū)域彼此交疊。換言之,在將待分類圖像劃分為多個子區(qū)域時,可以使相鄰的一個子區(qū)域與另一個子區(qū)域存在部分重疊的區(qū)域。
      [0078]具體地,在子區(qū)域是通過劃分待分類圖像得到的網(wǎng)格的情況下,如圖5中的505所示,由虛線框表示的相鄰的兩個網(wǎng)格彼此交疊,即由虛線框表示的相鄰的兩個網(wǎng)格存在部分重疊。另外,在子區(qū)域是通過對劃分待分類圖像得到的網(wǎng)格按照方向進(jìn)行劃分而得到的分區(qū)的情況下,也可以對方向采用類似的方式,使得相鄰的兩個分區(qū)也彼此交疊。
      [0079]再次回到圖4,在S404之后,該方法前進(jìn)到S406處。在S406處,針對從待分類的至少一個圖像中的每個圖像中提取的多個局部特征中的每個局部特征,通過與多個子區(qū)域中的關(guān)聯(lián)于該局部特征的子區(qū)域?qū)?yīng)的搜索樹,得到與該局部特征最相似的最近鄰特征,以及根據(jù)與最近鄰特征對應(yīng)的圖像類別得到每個圖像的初級分類結(jié)果。
      [0080]如上所述,可以從待分類圖像中提取多個局部特征。另外,如上所述可以將待分類圖像劃分為多個子區(qū)域。因此,可以根據(jù)所提取的局部特征中所包含的X坐標(biāo)和Y坐標(biāo)的位置信息,來確定該局部特征是從待分類圖像中的哪個子區(qū)域中提取的,即確定與該局部特征相關(guān)聯(lián)的子區(qū)域。
      [0081]假設(shè)待分類圖像可被劃分為W個子區(qū)域{SRp SR2,……,SR,,……,SRj,其中q和W均為自然數(shù)并且I W。另外,可以用Fq表示從待分類圖像的第q個子區(qū)域中提取的局部特征。因此,可以將從待分類圖像的第I個子區(qū)域中提取的局部特征F1作為與第I個子區(qū)域相關(guān)聯(lián)的局部特征。類似地,可以將從待分類圖像的第2個子區(qū)域中提取的局部特征F2作為與第2個子區(qū)域相關(guān)聯(lián)的局部特征,直至可以將從待分類圖像的第W個子區(qū)域中提取的局部特征Fw作為與第W個子區(qū)域相關(guān)聯(lián)的局部特征為止。
      [0082]具體地,在子區(qū)域是通過劃分樣本圖像得到的mXn個網(wǎng)格的情況下,可以根據(jù)所提取的局部特征中所包含的X坐標(biāo)和Y坐標(biāo)的位置信息,來確定該局部特征是從待分類圖像的mXn個網(wǎng)格中的哪個網(wǎng)格中提取的,即確定與該局部特征相關(guān)聯(lián)的網(wǎng)格。
      [0083]另外,在子區(qū)域是通過對劃分待分類圖像得到的mXn個網(wǎng)格按照方向進(jìn)行劃分而得到的mXnXr分區(qū)的情況下,可以根據(jù)所提取的局部特征中所包含的X坐標(biāo)和Y坐標(biāo)的位置信息,來確定該局部特征是從待分類圖像的mXnXr個分區(qū)中的哪個分區(qū)中提取的,即確定與該局部特征相關(guān)聯(lián)的分區(qū)。
      [0084]在確定了與從待分類圖像中提取的局部特征相關(guān)聯(lián)的子區(qū)域之后,可以通過與該子區(qū)域?qū)?yīng)的搜索樹,得到待分類 圖像的初級分類結(jié)果。具體地,可以利用從待分類圖像中提取的局部特征,在與該局部特征相關(guān)聯(lián)的子區(qū)域所對應(yīng)的搜索樹中搜索與該局部特征最相似的最近鄰特征,以及根據(jù)最近鄰特征中包含的與該最近鄰特征對應(yīng)的圖像類別,得到待分類圖像屬于哪個圖像類別的初級分類結(jié)果。例如,搜索樹可以是KD樹。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,除了 KD樹之外,還可以采用其它的存儲方式作為上述搜索樹,只要搜索樹能夠方便地實現(xiàn)對局部特征的最近鄰搜索即可。另外,本領(lǐng)域技術(shù)人員還應(yīng)當(dāng)理解,搜索樹可以是預(yù)先設(shè)定的,也可以是通過本發(fā)明中之前描述的用于生成圖像分類器的方法而生成的。
      [0085]接著上面的示例,假設(shè)從待分類圖像中提取了 W個局部特征{Fi,F(xiàn)2,……,F(xiàn)q,……,F(xiàn)w},其中局部特征F1是從待分類圖像的第I個子區(qū)域中提取的,局部特征F2是從待分類圖像的第2個子區(qū)域中提取的,F(xiàn)q是從待分類圖像的第q個子區(qū)域中提取的,而Fw是從待分類圖像的第W個子區(qū)域中提取的。另外,假設(shè)與待分類圖像中的第I至第W個子區(qū)域?qū)?yīng)的搜索樹分別為TR1, TR2,……,TR,,……,TRW。可以利用局部特征F1,在與第I個子區(qū)域?qū)?yīng)的搜索樹TR1中搜索與局部特征F1最相似的最近鄰特征!\。如上所述,最近鄰特征中包含與該最近鄰特征對應(yīng)的圖像類別。假設(shè)存在如下3個圖像類別A、B和C,并且假設(shè)與最近鄰特征T1對應(yīng)的圖像類別為A,則根據(jù)與最近鄰特征T1對應(yīng)的圖像類別A,判斷待分類圖像的圖像類別為A (即初級分類結(jié)果);類似地,可以利用局部特征F2,在與第2個子區(qū)域?qū)?yīng)的搜索樹TR2中搜索與局部特征F2最相似的最近鄰特征T2。假設(shè)與最近鄰特征T2對應(yīng)的圖像類別為B,則根據(jù)與最近鄰特征T2對應(yīng)的圖像類別B,判斷待分類圖像的圖像類別為B (即初級分類結(jié)果);……;類似地,可以利用局部特征Fw,在與第W個子區(qū)域?qū)?yīng)的搜索樹TRw中搜索與局部特征Fw最相似的最近鄰特征Tw。假設(shè)與最近鄰特征Tw對應(yīng)的圖像類別為C,則根據(jù)與最近鄰特征Tw對應(yīng)的圖像類別C,判斷待分類圖像的圖像類別為C (BP初級分類結(jié)果)。因此,根據(jù)從待分類圖像中提取的W個局部特征,可以分別通過與關(guān)聯(lián)于W個局部特征的W個子區(qū)域?qū)?yīng)的W個搜索樹,得到該待分類圖像屬于哪個圖像類別的W個初級分類結(jié)果。[0086]在S406之后,該方法前進(jìn)到S408。在S408處,根據(jù)多個所述初級分類結(jié)果進(jìn)行投票,以得到每個圖像的最終分類結(jié)果。
      [0087]接著上面的示例,根據(jù)得到的W個初級分類結(jié)果進(jìn)行投票,以統(tǒng)計W個初級分類結(jié)果中有多少個將待分類圖像的圖像類別判斷為A、W個初級分類結(jié)果中有多少個將待分類圖像的圖像類別判斷為B以及W個初級分類結(jié)果中有多少個將待分類圖像的圖像類別判斷為C,并且將得票最高的圖像類別作為待分類圖像的最終分類結(jié)果。該投票過程可以用下面的公式表不:
      [0088]C(/) = arginax!| {xy | L(x,) = /,0 < y < ,V} ||
      0<i<k '
      [0089]其中,&表示從待分類的圖像中提取的局部特征,S表示從待分類的圖像中提取的局部特征的數(shù)量,L(Xj)表示與Xj的最近鄰特征對應(yīng)的圖像類別。
      [0090]一般情況下,通過上述步驟就可以獲得待分類圖像的圖像類別。另外,如果在上述投票步驟中得票數(shù)排名前兩位的圖像類別的得票數(shù)之間的差小于預(yù)定閾值,則表示存在相似的圖像類別。例如,電匯憑證的“借方憑證”、“匯款依據(jù)”、“付出憑證”與“收入憑證”之間的差別往往僅在于標(biāo)題不同。在這種情況下,可以通過其它方法對這些相似的圖像類別進(jìn)行細(xì)分類,例如可以根據(jù)顏色將相似的圖像類別區(qū)分開。另外,也可以在得票數(shù)排名前兩位的圖像類別的得票數(shù)之間的差小于預(yù)定閾值的情況下向用戶給出相應(yīng)的提示,以及由用戶從這些相似的圖像類別中選擇與待分類的圖像最相似的圖像類別。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述預(yù)定閾值可以預(yù)先設(shè)定或者根據(jù)試驗來確定。另外,本領(lǐng)域技術(shù)人員應(yīng)該理解,上述處理僅是優(yōu)選的,而非必須的。
      [0091]最后,該方法在S410處結(jié)束。另外,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述S102和S104的順序可以是任意的,即S102和S104可以同時執(zhí)行,也可以先執(zhí)行S102再執(zhí)行S104,或者先執(zhí)行S104在執(zhí)行S102。
      [0092]上述對圖像進(jìn)行分類的方法可獲得如下技術(shù)益處中的至少之一:其適用范圍廣泛,受圖像格式、尺寸或質(zhì)量的影響小,因此可以提高圖像分類的健壯性、準(zhǔn)確性和有效性。
      [0093]下面結(jié)合圖6、圖7和圖8來描述根據(jù)本發(fā)明的一個實施例的對圖像進(jìn)行對準(zhǔn)的方法。圖6是示出根據(jù)本發(fā)明的一個實施例的對圖像進(jìn)行對準(zhǔn)的處理的示意性流程圖。圖7是示出對圖像進(jìn)行對準(zhǔn)的示意圖。圖8是示出對準(zhǔn)后的圖像的示意圖。對圖像進(jìn)行對準(zhǔn)具有重要意義。例如,通過對圖像進(jìn)行對準(zhǔn)可以得到待分類的圖像相對于模板圖像的幾何變換的信息,例如旋轉(zhuǎn)、平移、放大或透視等等。另外,將待分類的圖像與模板圖像對準(zhǔn)之后,可以根據(jù)預(yù)定的模板從待分類的圖像的感興趣區(qū)域中提取關(guān)鍵數(shù)據(jù),以及可以將提取的關(guān)鍵數(shù)據(jù)用于后續(xù)的數(shù)據(jù)分析與挖掘等等。[0094]在借助根據(jù)本發(fā)明的實施例的對圖像進(jìn)行對準(zhǔn)的方法對圖像進(jìn)行對準(zhǔn)時,如圖6所示,該方法在S600開始。在S600之后,該方法前進(jìn)到S602。
      [0095]在S602處,根據(jù)與從待分類的圖像中提取的多個局部特征中的每個局部特征最相似的最近鄰特征,將待分類的圖像與圖像類別中的模板圖像進(jìn)行對準(zhǔn)。
      [0096]如上所述,通過上述S406可以獲得與從待分類圖像中提取的多個局部特征中的每個局部特征最相似的最近鄰特征,這些最近鄰特征屬于圖像類別中的模板圖像。由此,可以根據(jù)所得到的最近鄰特征,將待分類的圖像與圖像類別中的模板圖像進(jìn)行對準(zhǔn)。也就是說,在對圖像進(jìn)行分類的過程中,還可以利用對圖像進(jìn)行分類的中間結(jié)果(即與從待分類圖像中提取的多個局部特征中的每個局部特征最相似的最近鄰特征),將待分類的圖像與模板圖像進(jìn)行對準(zhǔn)。然而,現(xiàn)有的對圖像進(jìn)行對準(zhǔn)的方法主要是通過對圖像的特定區(qū)域進(jìn)行匹配,例如表格線、基準(zhǔn)點或特定的字符圖像(例如標(biāo)題)等?,F(xiàn)有的對圖像進(jìn)行對準(zhǔn)的方法必須預(yù)先將圖像調(diào)整為規(guī)定的尺寸,同時對圖像質(zhì)量要求較高。相反,本申請利用對圖像進(jìn)行分類的中間結(jié)果來實現(xiàn)待分類的圖像與模板圖像的對準(zhǔn),從而可以獲得以下益處中的至少之一:無需將圖像調(diào)整為規(guī)定的尺寸,或?qū)D像質(zhì)量要求較低。下面結(jié)合圖7和圖8詳細(xì)描述將待分類的圖像與圖像類別中的模板圖像進(jìn)行對準(zhǔn)的處理。
      [0097]首先,獲得待分類的圖像與圖像類別中的模板圖像之間所有最近鄰的匹配特征對。所有的匹配特征對組成匹配特征對集合TS。匹配特征對集合TS中的每個匹配特征對包括兩個特征Tl和T2,其中Tl來自于待分類的圖像,而T2來自于模板圖像。匹配特征對集合TS是所有滿足如下條件的匹配對的集合:1)通過上述S406獲得的與特征Tl最相似的最近鄰特征是特征T2 ;2)特征T2屬于圖像類別中的用于對準(zhǔn)的模板圖像。
      [0098]接著,利用兩個匹配特征對得到用于對圖像進(jìn)行對準(zhǔn)的非反射性的幾何變換(仿射變換的一種)函數(shù)。非反射性的幾何變換是一種只包括縮放、旋轉(zhuǎn)和平移的線性變換,這類變換可以用下面的公式來表示:
      【權(quán)利要求】
      1.一種生成用于表單分揀設(shè)備的圖像分類器的方法,包括: 從多個樣本圖像中的每個樣本圖像中提取多個局部特征; 將所述多個樣本圖像中的每個樣本圖像劃分為多個子區(qū)域; 將從所述多個樣本圖像中提取的所述多個局部特征中的至少與所述多個子區(qū)域中的同一子區(qū)域相關(guān)聯(lián)的局部特征分為同一組;以及 根據(jù)所述同一組中的局部特征生成與所述同一子區(qū)域?qū)?yīng)的搜索樹作為所述圖像分類器。
      2.根據(jù)權(quán)利要求1所述的方法,其中,所述子區(qū)域彼此交疊。
      3.根據(jù)權(quán)利要求1或2所述的方法,其中,所述子區(qū)域為通過劃分所述樣本圖像得到的網(wǎng)格、或通過對劃分所述樣本圖像得到的網(wǎng)格按照方向進(jìn)行劃分而得到的分區(qū)。
      4.一種生成用于表單分揀設(shè)備的圖像分類器的裝置,包括: 提取單元,用于從多個樣本圖像中的每個樣本圖像中提取多個局部特征; 劃分單元,用于將所述多個樣本圖像中的每個樣本圖像劃分為多個子區(qū)域; 分組單元,用于將從所述多個樣本圖像中提取的所述多個局部特征中的至少與所述多個子區(qū)域中的同一子區(qū)域相關(guān)聯(lián)的局部特征分為同一組;以及 生成單元,用于根據(jù)所述同一組中的局部特征生成與所述同一子區(qū)域?qū)?yīng)的搜索樹作為所述圖像分類器。
      5.根據(jù)權(quán)利要求4所述的裝置,其中,所述子區(qū)域彼此交疊。
      6.根據(jù)權(quán)利要求4或5所述的裝置,其中,所述子區(qū)域為通過劃分所述樣本圖像得到的網(wǎng)格、或通過對劃分所述樣本圖像得到的網(wǎng)格按照方向進(jìn)行劃分而得到的分區(qū)。
      7.—種在表單分揀設(shè)備中對圖像進(jìn)行分類的方法,包括: 從待分類的至少一個圖像中的每個圖像中提取多個局部特征; 將所述待分類的至少一個圖像中的每個圖像劃分為多個子區(qū)域; 針對從所述待分類的至少一個圖像中的每個圖像中提取的所述多個局部特征中的每個局部特征,通過與所述多個子區(qū)域中的關(guān)聯(lián)于該局部特征的子區(qū)域?qū)?yīng)的搜索樹,得到與該局部特征最相似的最近鄰特征,以及根據(jù)與所述最近鄰特征對應(yīng)的圖像類別得到所述每個圖像的初級分類結(jié)果;以及 根據(jù)多個所述初級分類結(jié)果進(jìn)行投票,以得到所述每個圖像的最終分類結(jié)果。
      8.根據(jù)權(quán)利要求7所述的方法,還包括: 根據(jù)與從待分類的圖像中提取的所述多個局部特征中的每個局部特征最相似的所述最近鄰特征,將待分類的圖像與圖像類別中的模板圖像進(jìn)行對準(zhǔn)。
      9.一種在表單分揀設(shè)備中對圖像進(jìn)行分類的裝置,包括: 提取部分,用于從待分類的至少一個圖像中的每個圖像中提取多個局部特征; 劃分部分,用于將所述待分類的至少一個圖像中的每個圖像劃分為多個子區(qū)域;初級分類部分,用于針對從所述待分類的至少一個圖像中的每個圖像中提取的所述多個局部特征中的每個局部特征,通過與所述多個子區(qū)域中的關(guān)聯(lián)于該局部特征的子區(qū)域?qū)?yīng)的搜索樹,得到與該局部特征最相似的最近鄰特征,以及根據(jù)與所述最近鄰特征對應(yīng)的圖像類別得到所述每個圖像的初級分類結(jié)果;以及 投票部分,用于根據(jù)多個所述初級分類結(jié)果進(jìn)行投票,以得到所述每個圖像的最終分類結(jié)果。
      10.根據(jù)權(quán)利要求9所述的裝置,還包括: 根據(jù)與從待分類的圖像中提取的所述多個局部特征中的每個局部特征最相似的所述最近鄰特征,將待分類的圖像與圖像類別中的模板圖像進(jìn)行對準(zhǔn)。
      【文檔編號】G06K9/62GK103679188SQ201210337846
      【公開日】2014年3月26日 申請日期:2012年9月12日 優(yōu)先權(quán)日:2012年9月12日
      【發(fā)明者】陳思源, 何源, 孫俊 申請人:富士通株式會社
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1