国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      圖像數(shù)據(jù)庫編輯方法、圖像數(shù)據(jù)庫編輯程序和圖像檢索方法

      文檔序號:6348532閱讀:234來源:國知局
      專利名稱:圖像數(shù)據(jù)庫編輯方法、圖像數(shù)據(jù)庫編輯程序和圖像檢索方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及圖像數(shù)據(jù)庫編輯方法、圖像數(shù)據(jù)庫編輯程序和圖像檢索方法。更具體地,本發(fā)明涉及用于利用局部特征進(jìn)行特定物體識別的圖像數(shù)據(jù)庫的編輯方法、用于使計算機執(zhí)行該編輯方法的程序和利用該圖像數(shù)據(jù)庫的圖像檢索方法。
      背景技術(shù)
      特定物體識別是在其它圖像的物體中確定與被拍攝為圖像的物體相同的物體的處理。如這里所使用的,該處理還稱為圖像識別。例如,該處理可以用于檢測部件的過量或不足、檢測假冒品等、或者替代條形碼處理,因而具有高實用性。這里,“被拍攝為圖像的物體”意為圖像中所包括的作為查詢的樣例(檢索目標(biāo)),并且“在其它圖像的物體中確定與被拍攝為圖像的物體相同的物體的處理”還理解為從已預(yù)先登記多個圖像的圖像數(shù)據(jù)庫中檢索包括相同樣例的圖像的處理,即圖像檢索處理。利用局部特征的方法被公知地作為特定物體識別方法之一。在利用局部特征的方法中,利用通過預(yù)定過程從圖像提取出的局部特征來表示圖像,并且將局部特征與從其它圖像提取出的局部特征進(jìn)行比較或匹配,從而進(jìn)行辨認(rèn)(識別)。例如,在SIFT(尺度不變特征變換)(例如見非專利文獻(xiàn)1)和PCA-SIFT (主成分分析-SIFT)(例如見非專利文獻(xiàn)2) 中利用局部特征。將該局部特征表示為多維向量,因此,該局部特征也稱為特征向量。上述方法具有以下優(yōu)點由于基于圖像的局部特征提取多個特征向量,因而即使當(dāng)包括在查詢圖像中的樣例和/或包括在圖像數(shù)據(jù)庫所登記的圖像中的樣例存在遮擋或變化時,也能夠以高精度進(jìn)行識別。與本發(fā)明相關(guān)的其它文獻(xiàn)包括非專利文獻(xiàn)3、4和5。稍后將說明本發(fā)明與各文獻(xiàn)之間的具體關(guān)聯(lián)。引用列表非專利文獻(xiàn)非專利文獻(xiàn) 1 :D. G. Lowe,"Distinctive image features from scale-invariant keypoints,,,Internal Journal of Computer Vision, 60, 2, pp. 91-110, 2004。非專禾Ij文獻(xiàn) 2:Y.Ke,and R. Sukthankar, "PCA-SIFT :A more distinctive representation for local image descriptors,,,Proc. CVPR' 04, vol. 2, pp. 506-513, 2004。非專利文獻(xiàn) 3 :Noguchi, Kise, and Iwamura "Experimental Study of Memory Reduction for Object Recognition based on Local Descriptors,,,Collection of papers in Meeting on image recognition and understanding(MIRU 2008), OS 10-3, pp.251-258,2008o非專利文獻(xiàn) 4 :D. Nister and H. Stewenius, "Scalable Recognition with a Vocabulary Tree", Proc. CVPR 2006,pp.775-781,2006。
      # 專禾I」JC ^ 5 :S. Arya, D. Mount, R. Silverman and Α. Y. ffu,"An optimal algorithm for approximate nearest neighbor searching", Journal of the ACM, vol. 45,no. 6,pp.891—923,1998。

      發(fā)明內(nèi)容
      發(fā)明要解決的技術(shù)問題如果圖像具有VGA尺寸,則從一個圖像提取出的局部特征的數(shù)量通常是約幾千或者有時是幾萬。因此,在要識別的圖像的尺寸或數(shù)量大的情況下,用于比較圖像的局部特征所需的處理時間和用于存儲局部特征所需的存儲器量成為問題。為了解決上述問題,已提出了減少用于存儲各局部特征所需的存儲器量的方案 (見非專利文獻(xiàn)幻。具體地,進(jìn)行用以減少表示各特征向量的維數(shù)值的多值數(shù)據(jù)的位數(shù)的標(biāo)量量化,以減少用于將各局部特征登記入圖像數(shù)據(jù)庫所需的存儲器量,從而減少整個圖像數(shù)據(jù)庫所需的存儲器量。該方法具有以下優(yōu)點通過預(yù)先調(diào)查各特征向量的維數(shù)值的分布,能夠以相對容易的方式進(jìn)行標(biāo)量量化。同時,還提出了向量量化的概念。作為向量量化的方法之一,D. Nister等已提出了利用稱為詞匯樹的樹結(jié)構(gòu)的方法(例如見非專利文獻(xiàn) 4)。然而,在該方法中,需要增加樹結(jié)構(gòu)的高度以維持高識別率。因此,存在這樣的問題不能期望存儲器量減少的充分效果。本發(fā)明正是考慮到上述背景而做出,并且本發(fā)明提供一種用于在利用從圖像提取出的局部特征通過近鄰搜索的方式進(jìn)行物體識別的方法中減少用于物體識別的圖像數(shù)據(jù)庫所需的存儲器量而不大幅降低物體識別的識別率的方法;以及提供用于使計算機執(zhí)行該方法的程序。另外,本發(fā)明提供用于利用基于上述方法所編輯的圖像數(shù)據(jù)庫來檢索圖像的方法。技術(shù)方案本發(fā)明提供了一種圖像數(shù)據(jù)庫編輯方法,用于編輯用以存儲要與查詢圖像進(jìn)行比較的參考圖像的圖像數(shù)據(jù)庫,并且所述圖像數(shù)據(jù)庫用于物體識別,所述圖像數(shù)據(jù)庫編輯方法包括提取步驟,用于從要存儲在所述圖像數(shù)據(jù)庫中的參考圖像提取表示不同位置的局部特征的多個參考特征向量,其中,各所述參考特征向量具有向量長度和向量方向;聚類步驟,用于形成各自包括不同的特征向量的多個簇;選擇步驟,用于從各所述簇選擇特征向量作為各所述簇的代表向量;以及存儲步驟,用于將所述代表向量與所述參考圖像相關(guān)聯(lián)地存儲在所述圖像數(shù)據(jù)庫中,其中所述聚類步驟形成各所述簇以使得表示所述參考圖像上位置靠近的局部特征的參考特征向量屬于相同的簇;所述選擇步驟對具有長向量長度的任一參考特征向量給予優(yōu)先級,以選擇所述代表向量;通過以與提取所述參考特征向量相同的方式從所述查詢圖像生成至少一個查詢特征向量、并且在所述查詢特征向量和所述代表向量之間采取近鄰搜索來進(jìn)行所述比較;以及通過計算機來執(zhí)行各上述步驟。在其它方面,本發(fā)明提供了一種圖像數(shù)據(jù)庫編輯程序,用于使計算機執(zhí)行對圖像數(shù)據(jù)庫的編輯,所述圖像數(shù)據(jù)庫存儲要與查詢圖像進(jìn)行比較的參考圖像并且用于物體識別,所述圖像數(shù)據(jù)庫編輯程序包括提取步驟,用于從要存儲在所述圖像數(shù)據(jù)庫中的參考圖像提取表示不同位置的局部特征的多個參考特征向量,其中,各所述參考特征向量具有向量長度和向量方向;聚類步驟,用于形成各自包括不同的特征向量的多個簇;選擇步驟,用于從各所述簇選擇特征向量作為各所述簇的代表向量;以及存儲步驟,用于將所述代表向量與所述參考圖像相關(guān)聯(lián)地存儲在所述圖像數(shù)據(jù)庫中,其中所述聚類步驟形成各所述簇以使得表示所述參考圖像上位置靠近的局部特征的參考特征向量屬于相同的簇;所述選擇步驟對具有長向量長度的任一參考特征向量給予優(yōu)先級,以選擇所述代表向量;以及通過以與提取所述參考特征向量相同的方式從所述查詢圖像生成至少一個查詢特征向量、并且在所述查詢特征向量和所述代表向量之間采取近鄰搜索來進(jìn)行所述比較。另外,作為與上述圖像數(shù)據(jù)庫編輯方法相關(guān)聯(lián)的方法,本發(fā)明提供了一種圖像檢索方法,用于從圖像數(shù)據(jù)庫中檢索與查詢圖像相對應(yīng)的特定的參考圖像,所述圖像數(shù)據(jù)庫預(yù)先存儲有要與所述查詢圖像進(jìn)行比較的多個參考圖像,并且所述圖像數(shù)據(jù)庫用于圖像檢索,各所述參考圖像與從各所述參考圖像提取出的代表向量相關(guān)聯(lián)地存儲,所述圖像檢索方法包括提取步驟,用于提取表示所述查詢圖像的局部特征并且具有向量長度和向量方向的至少一個查詢特征向量;比較步驟,用于通過在所述查詢特征向量和與各所述參考圖像相關(guān)的所述代表向量之間采取近鄰搜索,來比較所述查詢特征向量和所述代表向量,其中經(jīng)由如下的過程來獲得所述代表向量,該過程包括以與提取所述查詢特征向量相同的方式從各所述參考圖像提取多個參考特征向量;形成各自包括所述參考特征向量的多個簇,以使得表示各所述參考圖像上位置靠近的局部特征的參考特征向量屬于相同的簇;從各所述簇選擇所述代表向量,其中,通過對具有長向量長度的任一參考特征向量給予優(yōu)先級來選擇所述代表向量;以及通過計算機來執(zhí)行各上述步驟。注意,從查詢圖像生成查詢特征向量的過程與提取參考特征向量的過程相同。發(fā)明的效果在根據(jù)本發(fā)明的編輯圖像數(shù)據(jù)庫的方法中,形成各個簇以使得表示參考圖像上位置靠近的局部特征的參考特征向量屬于同一簇;對具有長向量長度的任一參考特征向量給予優(yōu)先級,以從各個簇選擇預(yù)定數(shù)量的代表向量;并且在代表向量和查詢特征向量之間進(jìn)行比較。因此,與不選擇代表向量的情況相比,可以節(jié)省用于將特征向量登記入圖像數(shù)據(jù)庫所需的存儲器量。另外,登記從各個簇選擇的代表向量,即以在圖像的整個區(qū)域上大致均勻的方式進(jìn)行登記,而不僅從圖像的部分區(qū)域取特征向量。因此,即使當(dāng)圖像中包括的樣例不均勻或者在拍攝圖像時存在由幾何變換引起的失真的情況下,也可以進(jìn)行魯棒的識別。根據(jù)本發(fā)明的圖像數(shù)據(jù)庫編輯程序與上述的圖像數(shù)據(jù)庫編輯方法具有相同的優(yōu)點ο


      圖1是用于說明作為近似最近鄰搜索的已知方法的ANN的概念的圖。在本發(fā)明的實施例中采用ANN作為近似最近鄰搜索的方法。圖2(a) 2(c)示出在本發(fā)明的實驗中在圖像數(shù)據(jù)庫中所登記的圖像的例子。圖 2(a)示出通過利用谷歌圖片搜索所收集的圖像的例子。圖2(b)示出在PCA-SIFT的Web站點上發(fā)表的圖像的例子。圖2(c)示出在作為照片分享網(wǎng)站的“flickr”上所收集的圖像的例子。圖3(a) 3(d)示出在本發(fā)明的實驗中用作查詢圖像的圖像示例。圖3(a)、3(b) 和3(c)分別示出通過以90°、75°和60°的拍攝角度拍攝樣例的照片所獲得的圖像。圖3(d)示出通過拍攝樣例的照片的一部分所獲得的圖像的例子。圖4是示出本發(fā)明的實驗的結(jié)果的圖。該圖示出對圖3(a) 3 (d)所示的查詢圖像的識別率以及識別率的平均識別率。
      具體實施例方式以下將說明本發(fā)明的優(yōu)選實施例。聚類步驟可以形成預(yù)定數(shù)量的簇。即使當(dāng)樣例在圖像中分布不均勻或拍攝圖像時存在由幾何變換引起的失真時,如果代表向量在圖像的整個區(qū)域上以大致均勻的方式分布,則也可以進(jìn)行魯棒的識別。要生成的簇的數(shù)量越大,代表向量分布得越均勻。如果預(yù)先例如通過實驗確定使得識別足夠魯棒的簇的數(shù)量,并且如果聚類步驟形成該預(yù)定數(shù)量的簇,則可以進(jìn)行足夠魯棒的識別。此外,選擇步驟可以從每個簇確定一個代表向量。另外,聚類步驟可以利用k_均值聚類來形成簇。因而,可以通過k_均值聚類對特征向量聚類以使得代表向量在圖像的整個區(qū)域上均勻分布??梢詫⑸鲜龅膬?yōu)選模式彼此結(jié)合。以下將參考附圖更詳細(xì)地說明本發(fā)明。注意,以下描述在所有方面是說明性的。以下描述不應(yīng)當(dāng)理解為對本發(fā)明的限制。本發(fā)明的特征方面是從對局部特征進(jìn)行篩選的視角來考慮減少用于圖像識別的圖像數(shù)據(jù)庫的存儲器量,并且提供用于實現(xiàn)該減少的方法。更具體地,考慮到特征向量的向量長度(尺度)和圖像空間中特征向量分布的均勻性,對局部特征進(jìn)行篩選。根據(jù)以下實施例和實驗,即使所使用的圖像數(shù)據(jù)庫的存儲器量減少到不篩選局部特征的情況下所使用的圖像數(shù)據(jù)庫的存儲器量的約10%,也獲得了 98%的識別率。以此方式,證實了本發(fā)明的有效性。這里,在說明根據(jù)本發(fā)明的用于減少存儲器量的方法之前,將先說明在特定物體識別中進(jìn)行的利用標(biāo)量量化的傳統(tǒng)存儲器量減少方法和相應(yīng)的圖像識別處理。利用標(biāo)量量化的傳統(tǒng)存儲器量減少方法通過與本發(fā)明的方法不同的方案來減少圖像數(shù)據(jù)庫的存儲器量。傳統(tǒng)存儲器量減少方法可以與本發(fā)明的方法結(jié)合,并且它們的結(jié)合是有效的。非專利文獻(xiàn)3提出了利用標(biāo)量量化以減少特定物體識別所需的存儲器量的方案。 在此方案中,表示各局部特征的特征向量的各維度可以取的值限于離散值,以實現(xiàn)存儲器量的減少。即,各個維度的值限于具有預(yù)定位長度的值。盡管在圖像數(shù)據(jù)庫中登記的局部特征的數(shù)量不變,但用于存儲各局部特征所需的存儲器量減少。因此,圖像數(shù)據(jù)庫所需的整個存儲器量減少。特征向量的提取在本實施例中,通過使用PCA-SIFT從參考圖像和查詢圖像提取局部特征(特征向
      量)O非專利文獻(xiàn)3記載了即使用2位表示利用PCA-SIFT所獲得的特征向量的各維度, 圖像識別中的識別率也幾乎不變。如果將通過利用PCA-SIFT所提取的特征向量的各維度的值表示為短型整數(shù),則用16位表示該值。因此,如果經(jīng)由標(biāo)量量化將特征向量的各維度減少為2位,則一個特征向量所需的存儲器量成為原存儲器量的約1/8。盡管圖像數(shù)據(jù)庫的存儲器量還包括在用于存儲各特征向量的存儲器量之外所需的存儲器量,但非專利文獻(xiàn)3 記載了即使考慮到這樣的存儲器量、也可以將圖像數(shù)據(jù)庫的存儲器量減少到原存儲器量的約 1/3。杳詢特征向量與參考特征向量之間的比較通過將查詢特征向量和參考特征向量彼此比較來進(jìn)行圖像提取。在比較處理中, 計算從查詢圖像所提取的各查詢特征向量與在圖像數(shù)據(jù)庫中登記的各參考特征向量之間的距離,并且確定作為查詢特征向量的近鄰的參考特征向量。然后,獲得與所確定的參考特征向量相關(guān)聯(lián)的圖像ID。作為識別結(jié)果的參考圖像的確定基于比較的結(jié)果進(jìn)行確定圖像識別結(jié)果的處理。在此處理中,投票給在比較處理中所獲得的與查詢特征向量相對應(yīng)的圖像ID,然后將得票最多的圖像ID所表示的參考圖像確定為識別結(jié)果。作為標(biāo)量量化的結(jié)果,距離計算的精度劣化。盡管距離計算的精度劣化但識別率幾乎不變的原因之一是在投票中根據(jù)少數(shù)服從多數(shù)規(guī)則(rule of majority)去除了錯誤的圖像ID。糊輸紐■白儲·ΜΦ誠本發(fā)明人關(guān)注于特征向量的篩選,作為通過與利用標(biāo)量量化的上述方法不同的方案來減少圖像數(shù)據(jù)庫的存儲器量的方法。篩選的方針在通過篩選參考局部特征來減少存儲器量的方法中,也利用PCA-SIFT提取局部特征。 從參考圖像所提取的局部特征的數(shù)量根據(jù)參考圖像的內(nèi)容而不同。在利用未進(jìn)行局部特征篩選而處于無減少狀態(tài)的圖像數(shù)據(jù)庫的情況下,將從圖像提取的所有局部特征登記入圖像數(shù)據(jù)庫。因此,要登記的局部特征的數(shù)量在參考圖像之間差異大。如果參考圖像包括大量的局部特征,則有時從參考圖像的特定部分提取了大量的相似局部特征。不必將所有相似局部特征登記入圖像數(shù)據(jù)庫。這是因為由于相似性、這些相似局部特征對識別率的提高將不會有很大貢獻(xiàn)。因此,對每一個圖像,將要登記入圖像數(shù)據(jù)庫的局部特征的最大數(shù)量限制為R,從而防止用于存儲參考特征向量所需的存儲器量增加。如果所提取的參考特征向量的數(shù)量不超過R,則將所有提取出的局部特征登記入圖像數(shù)據(jù)庫。如果所提取的參考特征向量的數(shù)量超過R,則基于以下思想來選擇要登記的局部特征。體在本發(fā)明中,優(yōu)選選擇對拍攝角度的變化具有相對魯棒的抵抗性的長向量長度的特征向量并且將其登記入圖像數(shù)據(jù)庫。整個檢索對象包括在要作為識別結(jié)果的參考圖像和相應(yīng)的查詢圖像中的可能性不低。然而,如果長向量長度的特征向量主要包括在參考圖像或查詢圖像的部分區(qū)域中,則包括在除這些部分區(qū)域以外的區(qū)域中的特征向量成為噪聲, 并且作為結(jié)果,變得難以檢索與查詢圖像相對應(yīng)的參考圖像。為了應(yīng)對檢索對象圖像中的這種不均勻呈現(xiàn),針對在已提取了參考特征向量的參考圖像中表示參考特征向量的位置的坐標(biāo)值,進(jìn)行最大聚類數(shù)量為R的k-均值聚類。
      _ 代廉影口 Wiff AMimm ) 接著,優(yōu)選從通過k_均值聚類所獲得的各個簇包括的參考特征向量中選擇具有最大向量長度的參考特征向量。將所選擇的特征向量登記入圖像數(shù)據(jù)庫。即,僅將代表各個簇的代表向量登記入圖像數(shù)據(jù)庫。經(jīng)由上述過程,以大致均勻的方式從參考圖像選擇參考特征向量,而沒有不均勻地選擇參考特征向量。因此,即使參考圖像中僅包括要提取的物體的一部分,識別出該物體的可能性也可以提高。&比箱Φ # ffl酬以■折傭^t白憤去ANN(近似最近鄰搜索)(例如見非專利文獻(xiàn)幻可以用于查詢特征向量和參考特征向量(或代表向量)之間的比較。ANN是通過利用樹結(jié)構(gòu)以高速進(jìn)行近似最近鄰搜索的方法。盡管由于近似而降低了向量比較的精度,但可以減少檢索所用的處理時間。圖1示出根據(jù)ANN的近似最近鄰搜索的概念。注意,出于簡化的目的,僅示出與說明有關(guān)的單元。將參考特征向量登記入圖像數(shù)據(jù)庫,以使參考特征向量劃分為多個單元并且形成樹結(jié)構(gòu)。這里,q表示查詢圖像的查詢特征向量,并且Pl P6表示參考特征向量。 另外,假定當(dāng)前已發(fā)現(xiàn)作為近鄰向量的pl。r是查詢特征向量q和參考特征向量pi之間的距離。在執(zhí)行最近鄰搜索的情況下,由于在這些單元中可能存在作為比Pl更近的相鄰向量的參考特征向量、即可能存在到q的距離小于r的參考特征向量,因而通過用實線表示的超球所重疊的單元是檢索的對象。另一方面,在執(zhí)行近似最近鄰搜索的情況下,設(shè)置通過對作為到Pl的距離的距離r應(yīng)用容許誤差ε所定義的超球,并且僅通過所設(shè)置的超球而重疊的單元是檢索的對象。表達(dá)式1r/(l+ ε )在此情況下,盡管可能不能發(fā)現(xiàn)作為最近鄰的參考特征向量(圖1中的p3),但要檢索的單元的數(shù)量減少,從而減少了檢索時間。在本發(fā)明的方法中,由于局部特征的減少,因此有可能不存在與查詢特征向量相對應(yīng)的最近鄰參考特征向量(要作為答案的參考特征向量)。因此,僅當(dāng)作為ANN的比較結(jié)果彼此關(guān)聯(lián)的查詢特征向量和參考特征向量之間的距離d小于預(yù)定閾值t時,給相應(yīng)的圖像投票。麵參考圖像和圖像數(shù)據(jù)庫進(jìn)行了用于證實篩選局部特征的有效性的實驗。在實驗中使用登記有100,000個參考圖像的圖像數(shù)據(jù)庫。100,000個參考圖像的圖像數(shù)據(jù)庫包括三個數(shù)據(jù)集A、B和C。數(shù)據(jù)集A包括通過利用谷歌圖片搜索收集的3100個圖像。在圖像收集中使用的搜索關(guān)鍵詞包括“海報”、“雜志”和“封面”等。數(shù)據(jù)集B包括在PCA-SIFT站點上發(fā)表的18,500個圖像。數(shù)據(jù)集C包括通過利用“動物”、“生日”、“食物”和“日本”等標(biāo)簽在作為照片分享站點的“flickr”上收集的78,400個圖像。數(shù)據(jù)集C主要包括物體、自然和人物等的照片。圖2示出經(jīng)由上述過程所收集的參考圖像的例子。注意,在收集參考圖像時,排除了尺寸等于或小于600X600像素的圖像,并且減小參考圖像的尺寸以使得參考圖像的縱向側(cè)等于或小于640像素。參考圖像的尺寸幾乎等于VGA尺寸。然后,通過利用(http://www.cs. emu. edu/yke/pcasift/ 上提供的)PCA-SIFT 從參考圖像提取局部特征。所提取的局部特征的總數(shù)量是1.82X 108。從作為上述圖像數(shù)據(jù)庫的子集的10,000個參考圖像的數(shù)據(jù)庫中提取的局部特征的總數(shù)量是2. 07X 107。然后,出于比較的目的,將根據(jù)非專利文獻(xiàn)4的利用向量量化的傳統(tǒng)存儲器量減少方法、以及根據(jù)本發(fā)明的利用局部特征篩選的存儲器量減少方法分別應(yīng)用至圖像數(shù)據(jù)庫,從而編輯共四個圖像數(shù)據(jù)庫。利用向量量化的存儲器量減少方法這里,將簡要說明利用向量量化的傳統(tǒng)存儲器量減少方法。在向量量化中,對分布在特征空間的特定區(qū)域中的特征向量分組。因此,需要定義一些用于對特征向量分組的方法。在本說明書中,如下對特征向量分組。首先,通過利用用于生成kd_樹的標(biāo)準(zhǔn)kd_樹分離規(guī)則來分割特征空間。在此方法中,選擇特征空間中表示最大方差的維度,并且在分布在所選擇的維度上的點的坐標(biāo)的中值處分割特征空間。設(shè)置要包括在分割后的各特征空間中的特征向量的最大數(shù)量(桶大小)b。分割特征空間直到在分割后的各特征空間中所包括的特征向量的數(shù)量等于或小于b為止。然后,計算分布在分割后的各特征空間中的特征向量的重心,并且用重心向量來替換分割后的特征空間中的特征向量。將重心向量登記入數(shù)據(jù)庫,并且將已被替換的特征向量所附帶的圖像ID附加至各重心向量,從而進(jìn)行向量量化。重心向量與向量量化中的碼字相對應(yīng),并且重心向量經(jīng)常稱為視覺詞(visual word) 0實驗參數(shù)用于通過利用向量量化的方法編輯圖像數(shù)據(jù)庫的參數(shù)b的值是1、2、3、5、10和20。另一方面,借助篩選局部特征的存儲器量減少方法來編輯圖像數(shù)據(jù)庫所使用的參數(shù)R的值是300、200、100、75和50。表1示出與各R值相對應(yīng)的、在100,000個參考圖像的圖像數(shù)據(jù)庫中所登記的局部特征的數(shù)量。表 1數(shù)據(jù)庫中登記的局部特征的數(shù)量(篩選)
      權(quán)利要求
      1.一種圖像數(shù)據(jù)庫編輯方法,用于編輯用以存儲要與查詢圖像進(jìn)行比較的參考圖像的圖像數(shù)據(jù)庫,并且所述圖像數(shù)據(jù)庫用于物體識別,所述圖像數(shù)據(jù)庫編輯方法包括提取步驟,用于從要存儲在所述圖像數(shù)據(jù)庫中的參考圖像提取表示不同位置的局部特征的多個參考特征向量,其中,各所述參考特征向量具有向量長度和向量方向; 聚類步驟,用于形成各自包括不同的特征向量的多個簇; 選擇步驟,用于從各所述簇選擇特征向量作為各所述簇的代表向量;以及存儲步驟,用于將所述代表向量與所述參考圖像相關(guān)聯(lián)地存儲在所述圖像數(shù)據(jù)庫中, 其中所述聚類步驟形成各所述簇以使得表示所述參考圖像上位置靠近的局部特征的參考特征向量屬于相同的簇;所述選擇步驟對具有長向量長度的任一參考特征向量給予優(yōu)先級,以選擇所述代表向量;通過以與提取所述參考特征向量相同的方式從所述查詢圖像生成至少一個查詢特征向量、并且在所述查詢特征向量和所述代表向量之間采取近鄰搜索來進(jìn)行所述比較;以及通過計算機來執(zhí)行各上述步驟。
      2.根據(jù)權(quán)利要求1所述的圖像數(shù)據(jù)庫編輯方法,其特征在于 所述聚類步驟形成預(yù)定數(shù)量的簇。
      3.根據(jù)權(quán)利要求1或2所述的圖像數(shù)據(jù)庫編輯方法,其特征在于 所述選擇步驟從每個所述簇確定一個代表向量。
      4.根據(jù)權(quán)利要求1 3中任一項所述的圖像數(shù)據(jù)庫編輯方法,其特征在于 所述聚類步驟利用k-均值聚類來形成所述簇。
      5.一種圖像檢索方法,用于從圖像數(shù)據(jù)庫中檢索與查詢圖像相對應(yīng)的特定參考圖像, 所述圖像數(shù)據(jù)庫預(yù)先存儲有要與所述查詢圖像進(jìn)行比較的多個參考圖像,并且所述圖像數(shù)據(jù)庫用于圖像檢索,各所述參考圖像與從各所述參考圖像提取出的代表向量相關(guān)聯(lián)地存儲,所述圖像檢索方法包括提取步驟,用于提取表示所述查詢圖像的局部特征并且具有向量長度和向量方向的至少一個查詢特征向量;比較步驟,用于通過在所述查詢特征向量和與各所述參考圖像相關(guān)的所述代表向量之間采取近鄰搜索,來比較所述查詢特征向量和所述代表向量,其中經(jīng)由如下的過程來獲得所述代表向量,該過程包括以與提取所述查詢特征向量相同的方式從各所述參考圖像提取多個參考特征向量;形成各自包括所述參考特征向量的多個簇,以使得表示各所述參考圖像上位置靠近的局部特征的參考特征向量屬于相同的簇;從各所述簇選擇所述代表向量,其中,通過對具有長向量長度的任一參考特征向量給予優(yōu)先級來選擇所述代表向量;以及通過計算機來執(zhí)行各上述步驟。
      6.一種圖像數(shù)據(jù)庫編輯程序,用于使計算機執(zhí)行對圖像數(shù)據(jù)庫的編輯,所述圖像數(shù)據(jù)庫存儲要與查詢圖像進(jìn)行比較的參考圖像并且用于物體識別,所述圖像數(shù)據(jù)庫編輯程序包括提取步驟,用于從要存儲在所述圖像數(shù)據(jù)庫中的參考圖像提取表示不同位置的局部特征的多個參考特征向量,其中,各所述參考特征向量具有向量長度和向量方向; 聚類步驟,用于形成各自包括不同的特征向量的多個簇; 選擇步驟,用于從各所述簇選擇特征向量作為各所述簇的代表向量;以及存儲步驟,用于將所述代表向量與所述參考圖像相關(guān)聯(lián)地存儲在所述圖像數(shù)據(jù)庫中, 其中所述聚類步驟形成各所述簇以使得表示所述參考圖像上位置靠近的局部特征的參考特征向量屬于相同的簇;所述選擇步驟對具有長向量長度的任一參考特征向量給予優(yōu)先級,以選擇所述代表向量;以及通過以與提取所述參考特征向量相同的方式從所述查詢圖像生成至少一個查詢特征向量、并且在所述查詢特征向量和所述代表向量之間采取近鄰搜索來進(jìn)行所述比較。
      全文摘要
      一種圖像數(shù)據(jù)庫創(chuàng)建方法,包括提取步驟,從將與用于物體識別的檢索查詢圖像進(jìn)行比較的參考圖像提取參考特征向量,其中,參考特征向量與參考圖像不同位置的局部特征相對應(yīng)并將各局部特征的位置和特性表示為向量位置、向量長度和向量方向;聚類步驟,創(chuàng)建包含不同參考特征向量的多個簇以使得各參考向量屬于多個簇中的任一;選擇步驟,從各個簇的參考特征向量選擇該簇的代表向量;以及將代表向量與參考圖像相關(guān)聯(lián)并相關(guān)聯(lián)地登記入用于物體識別的圖像數(shù)據(jù)庫的步驟,其中,在聚類步驟中創(chuàng)建各個簇以使得在鄰近向量位置的參考特征向量屬于相同的簇,在選擇步驟中對具有長向量長度的參考特征向量給予優(yōu)先級以選擇代表向量,以及通過從檢索查詢圖像生成至少一個查詢特征向量、并在查詢特征向量和代表向量之間應(yīng)用局部搜索來對檢索查詢圖像和參考圖像進(jìn)行相互比較,并通過計算機來執(zhí)行各上述步驟。
      文檔編號G06T7/00GK102341824SQ20108001038
      公開日2012年2月1日 申請日期2010年3月3日 優(yōu)先權(quán)日2009年3月4日
      發(fā)明者古橋幸人, 峯泰治, 本道貴行, 黃瀨浩一 申請人:公立大學(xué)法人大阪府立大學(xué), 奧林巴斯株式會社
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1