專利名稱:一種基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機視覺技術(shù)領(lǐng)域,特別涉及一種基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法。
背景技術(shù):
計算機視覺是一門研究如何使機器“看”的科學(xué),計算機視覺的一項重要任務(wù)是識別圖像或者視頻中的物體類別,在傳統(tǒng)方法中,針對靜態(tài)單幅圖像中物體類別的識別已有較成熟的研究,近年來,針對視頻中的物體識別則引起研究者越來越多的興趣。隨著攝像機和大容量存儲設(shè)備等硬件技術(shù)的普及發(fā)展,在很多新的應(yīng)用場景如視頻監(jiān)控、視頻檢索等任務(wù)中,可以獲取到物體的大量圖像數(shù)據(jù),從而為后端分類問題的訓(xùn)練和測試階段提供大量的樣本,這些樣本通常以圖像集合的模式進行建模表示。在這類識別問題中,每個集合通常包含屬于同一個物體類別的多個圖像樣本,這些圖像涵蓋了物體廣泛的表觀變化模式,比如姿態(tài)視角的變化、非剛性變形、光照變化等等。基于圖像集合的分類問題的難點在于,如何有效地刻畫與建模集合中多幅圖像的分布,并根據(jù)所建的模型綜合利用多樣本提供的信息。近年來,典型的做法主要有兩類,分別從參數(shù)式與非參數(shù)式兩個角度對圖像集合建模,前者通常利用概率分布函數(shù)來表示圖像集合的樣本分布,進而采用諸如K-L散度(Kullback-Leibler Divergence, KLD)之類的度量來計算兩個概率分布函數(shù)之間的相似度,后者則根據(jù)圖像集合中樣本的本質(zhì)變化模式將其建模為線性子空間或者更為一般的非線性流形,基于這種建模方式,集合匹配分類的問題就可以轉(zhuǎn)化為子空間或者流形匹配的問題,從而采用子空間或者流形上的各種可能的相似性度量函數(shù)與匹配策略進行分類??傮w而言,當(dāng)前采用的這兩類集合建模方法都對圖像集合中樣本分布的形式有一定程度的假設(shè),而在實際問題中集合樣本的來源通常是多種多樣的,當(dāng)與模型所假設(shè)的樣本分布形式差別較大時,分類效果就會有很大的偏差。
發(fā)明內(nèi)容
本發(fā)明旨在至少解決現(xiàn)有技術(shù)中存在的技術(shù)問題,特別創(chuàng)新地提出了一種基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法。為了實現(xiàn)本發(fā)明的上述目的,本發(fā)明提供了一種基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法,其包括如下步驟SI :給定待匹配的兩個圖像集合S1和S2,在訓(xùn)練集數(shù)據(jù)上進行主成分分析得到特征提取投影矩陣,將待匹配的圖像樣本投影到目標(biāo)特征子空間中;S2 :在所述目標(biāo)特征子空間中,建立待匹配的兩個圖像集合的二階統(tǒng)計量模型;S3 :去除所述二階統(tǒng)計量模型中的噪聲;S4:計算所述待匹配的兩個圖像集合的相似度,依據(jù)所述相似度大小完成圖像集合的匹配。本發(fā)明的圖像集合匹配方法對集合數(shù)據(jù)分布形式與集合樣本規(guī)模無任何先驗假設(shè),對集合中可能存在的噪聲數(shù)據(jù)具有很好的容忍性。本發(fā)明可以實現(xiàn)真實應(yīng)用場景中高精度高穩(wěn)定性的圖像集合/視頻序列分類,具有應(yīng)用到如視頻安全監(jiān)控、視頻檢索、大規(guī)模網(wǎng)絡(luò)數(shù)碼相冊管理等數(shù)字多媒體系統(tǒng)中的潛力。在本發(fā)明的一種優(yōu)選實施例中,取樣本集合的協(xié)方差矩陣或相關(guān)函數(shù)矩陣作為兩個圖像集合的二階統(tǒng)計量模型。并且對待匹配的兩個圖像集合對應(yīng)的濾波二階統(tǒng)計量模型采用對角線擾動方式去除奇異問題,然后采用黎曼流形上的行列式對數(shù)散度計算矩陣的相似度。本發(fā)明的圖像集合匹配方法采用集合的樣本協(xié)方差矩陣或相關(guān)函數(shù)矩陣作為描述子,自然地刻畫數(shù)據(jù)的分布模式,進一步通過計算在黎曼流形上的矩陣散度來度量兩個集合的相似度,完成集合的匹配分類。這種方法對集合樣本的分布形式和集合樣本的規(guī)模均無任何先驗假設(shè),算法模型直觀高效,計算簡便。本發(fā)明的附加方面和優(yōu)點將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。
·本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合下面附圖對實施例的描述中將變得明顯和容易理解,其中圖I是本發(fā)明基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法的流程圖;圖2是本發(fā)明一種優(yōu)選實施方式中所采用的圖像集合二階統(tǒng)計量建模方法示意圖。
具體實施例方式下面詳細(xì)描述本發(fā)明的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。圖I是本發(fā)明基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法的流程圖,從圖中可見,該圖像集合匹配方法包括如下步驟首先,進行統(tǒng)計建模,具體是第一步對樣本特征進行預(yù)處理,給定待匹配的兩個圖像集合S1和S2,在訓(xùn)練集數(shù)據(jù)上進行主成分分析得到特征提取投影矩陣,將待匹配的圖像樣本投影到目標(biāo)特征子空間中,在本實施方式中,進行主成分分析時采用圖像樣本的灰度值作為原始特征;第二步在目標(biāo)特征子空間中,建立待匹配的兩個圖像集合的二階統(tǒng)計量模型,在本實施方式中,取樣本集合的協(xié)方差矩陣或相關(guān)函數(shù)矩陣作為兩個圖像集合的二階統(tǒng)計量模型;然后,進行圖像集合匹配,具體是第三步去除二階統(tǒng)計量模型中的噪聲,針對上一步得到的原始樣本的二階統(tǒng)計量模型,將其進行特征值分解,將所得的特征值與對應(yīng)的特征向量按照大小順序依次排列,設(shè)定閾值并對特征值進行濾波,利用高于閾值的特征值與相應(yīng)的特征向量計算得到新的濾波二階統(tǒng)計量模型,從而去除原始統(tǒng)計模型中的噪聲影響,在本實施方式中,選擇將二階統(tǒng)計量模型的特征值及與其對應(yīng)的特征向量按照從大到小的順序排列并濾波;第四步計算待匹配的兩個圖像集合的相似度,依據(jù)相似度大小完成圖像集合的匹配,對待匹配的兩個圖像集合對應(yīng)的濾波二階統(tǒng)計量模型,首先采用對角線擾動方式去除奇異問題,然后采用黎曼流形上的行列式對數(shù)散度計算矩陣的相似度,依據(jù)相似度大小取值完成集合匹配分類任務(wù)。在本實施方式中,可以選擇任何二級統(tǒng)計量進行建模,具體可以為但不限于樣本集合的協(xié)方差矩陣或相關(guān)函數(shù)矩陣,由于選擇不同二階統(tǒng)計量模型時圖像集合匹配方法相同,因此,在本發(fā)明的一種優(yōu)選實施方式中,僅以協(xié)方差矩陣作為二階統(tǒng)計量模型為例進行說明,這是為了更好地說明本發(fā)明而不能理解為對本發(fā)明的限制。圖2是本發(fā)明一種優(yōu)選實施方式中所采用的圖像集合二階統(tǒng)計量建模方法示意圖,結(jié)合公式說明具體的圖像集合匹配方法為
首先,樣本特征預(yù)處理,給定兩個待匹配的圖像集合S1=IxiIi = l,2,...,m}和S2={yj:j=l,2,...,n},采用圖像樣本的灰度值作為原始特征,在訓(xùn)練集數(shù)據(jù)上進行主成分分析得到特征提取投影矩陣,將待匹配的圖像樣本投影到目標(biāo)特征子空間中,特征提取公式如下Xi' = Wxiy/ = Wyj(I)其中,W為訓(xùn)練集數(shù)據(jù)上學(xué)習(xí)得到的主成分投影矩陣,Xi',y/為特征提取后的樣本表不;然后,建立二階統(tǒng)計量模型,在上一步所得的特征子空間中,計算圖像集合的樣本均值向量,對樣本進行歸一化處理,之后計算樣本集的協(xié)方差矩陣,作為集合的二階統(tǒng)計量模型,具體地,針對圖像集合S1和S2,分別計算其均值向量如下
權(quán)利要求
1.一種基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法,其特征在于,包括如下步驟 51:給定待匹配的兩個圖像集合S1和S2,在訓(xùn)練集數(shù)據(jù)上進行主成分分析得到特征提取投影矩陣,將待匹配的圖像樣本投影到目標(biāo)特征子空間中; 52:在所述目標(biāo)特征子空間中,建立待匹配的兩個圖像集合的二階統(tǒng)計量模型; 53:去除所述二階統(tǒng)計量模型中的噪聲; 54:計算所述待匹配的兩個圖像集合的相似度,依據(jù)所述相似度大小完成圖像集合的匹配。
2.如權(quán)利要求I所述的基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法,其特征在于,進行主成分分析時采用圖像樣本的灰度值作為原始特征。
3.如權(quán)利要求I所述的基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法,其特征在于,取樣本集合的協(xié)方差矩陣或相關(guān)函數(shù)矩陣作為兩個圖像集合的二階統(tǒng)計量模型。
4.如權(quán)利要求I或3所述的基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法,其特征在于,去除所述二階統(tǒng)計量模型中的噪聲的方法為對所述二階統(tǒng)計量模型進行特征值分解,將特征值及與其對應(yīng)的特征向量按照大小順序排列,設(shè)定閾值對特征值進行濾波,利用高于閾值的特征值與相應(yīng)的特征向量計算得到新的濾波二階統(tǒng)計量模型。
5.如權(quán)利要求4所述的基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法,其特征在于,將二階統(tǒng)計量模型的特征值及與其對應(yīng)的特征向量按照從大到小的順序排列。
6.如權(quán)利要求I或4所述的基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法,其特征在于,所述待匹配的兩個圖像集合的相似度的計算方法為對待匹配的兩個圖像集合對應(yīng)的濾波二階統(tǒng)計量模型采用對角線擾動方式去除奇異問題,然后采用黎曼流形上的行列式對數(shù)散度計算矩陣的相似度。
全文摘要
本發(fā)明提出了一種基于數(shù)據(jù)二階統(tǒng)計量建模的圖像集合匹配方法,其包括如下步驟首先,給定待匹配的兩個圖像集合S1和S2,在訓(xùn)練集數(shù)據(jù)上進行主成分分析得到特征提取投影矩陣,將待匹配的圖像樣本投影到目標(biāo)特征子空間中;然后,在目標(biāo)特征子空間中,建立待匹配的兩個圖像集合的二階統(tǒng)計量模型;再后,去除二階統(tǒng)計量模型中的噪聲;最后,計算待匹配的兩個圖像集合的相似度,依據(jù)所述相似度大小完成圖像集合的匹配。本發(fā)明的圖像集合匹配方法對集合數(shù)據(jù)分布形式與集合樣本規(guī)模無任何先驗假設(shè),對集合中可能存在的噪聲數(shù)據(jù)具有很好的容忍性,算法模型直觀高效,計算簡便。
文檔編號G06K9/64GK102722732SQ20121017550
公開日2012年10月10日 申請日期2012年5月30日 優(yōu)先權(quán)日2012年5月30日
發(fā)明者戴瓊海, 王瑞平 申請人:清華大學(xué)