鍵像素點(diǎn)領(lǐng)域像素點(diǎn)的梯 度主方向,也即關(guān)鍵像素點(diǎn)的方向; 為了保持旋轉(zhuǎn)不變性,將坐標(biāo)軸旋轉(zhuǎn)為關(guān)鍵像素點(diǎn)的方向,然后W關(guān)鍵點(diǎn)為中屯、,取16 X 16大小的領(lǐng)域窗口,在每4 X 4大小的格子中計(jì)算8個(gè)梯度方向的直方圖,最終形成4 X 4 X 8 = 128維的SIFT人臉特征向量; 步驟3、將步驟2中得到的特征向量映射到intra-personal子空間中; 在該步驟中,為了削弱噪聲的影響,首先需要將步驟2中得到的特征向量利用PCA方法 (主成分分析)進(jìn)行降維,形成特征臉;其協(xié)方差矩陣表達(dá)式如下:其中,η為人臉樣本數(shù)量,XI表示人臉向量,m為η個(gè)人臉向量的均值;由于協(xié)方差矩陣描 述了向量之間的相關(guān)性,因此上述協(xié)方差矩陣的特征向量形成映射矩陣,根據(jù)映射矩陣對(duì) 人臉圖像數(shù)據(jù)進(jìn)行映射,即可形成特征臉;然后,為了保證同一個(gè)人不同的人臉圖片之間的 類內(nèi)不變性,將特征臉映射到intra-personal子空間中,其協(xié)方差矩陣表達(dá)式如下:其中,S表示同一個(gè)人的人臉圖片集合,XI和Xj表示同一個(gè)人的人臉圖片集合中不同的 兩張人臉圖片的人臉向量;Λ = {λι,···,λι^和ν=(νι,···,νι〇分別表示上式協(xié)方差矩陣的前 k個(gè)特征值和特征向量;同樣地,前k個(gè)特征向量形成映射矩陣,將上述特征臉數(shù)據(jù)通過(guò)該映 射矩陣進(jìn)行映射,從而保證同一個(gè)人的人臉圖片之間的類內(nèi)不變性;如果Cs是可逆的,那 么,特征臉映射到intra-personal子空間用下式來(lái)表達(dá):其中,V是由上述k個(gè)特征向量形成的映射矩陣,成w(Af,...,Af)是由上述k個(gè)特征值所 組成的對(duì)角矩陣,g即最終形成的特征矩陣; 步驟4、利用雙線性相似度函數(shù)和馬氏距離來(lái)計(jì)算兩個(gè)人臉特征向量之間的相似度得 分值; 馬氏距離已被廣泛用于人臉識(shí)別領(lǐng)域,但其識(shí)別效果不是特別好,而近幾年的研究表 明,雙線性相似度函數(shù)在圖片相似度捜索領(lǐng)域已獲得了很好的效果;因此,本方法中,結(jié)合 雙線性相似度函數(shù)和馬氏距離來(lái)計(jì)算兩個(gè)人臉特征向量之間的相似度得分值,其表達(dá)式如 下:其中,&巧,與)表示馬和馬特征矩陣之間的雙線性相似度函數(shù),馬俏,:矮示X和X特 征矩陣之間的馬氏距離;G和Μ均為k X k大小的矩陣,需要訓(xùn)練合適的Μ和G來(lái)盡量保證類內(nèi) 不變性的同時(shí)保證類間的最大可辨別性;因此,將in化a-personal子空間相似度量學(xué)習(xí)的 表達(dá)式定義成如下形式:其中,S和D分別表示相似人臉對(duì)(即同一個(gè)人的兩張人臉圖片)和不相似人臉對(duì)(即不 同人的兩張人臉圖片)的標(biāo)簽;II · Mf是矩陣的F范數(shù),即矩陣元素絕對(duì)值的平方和再開 方;其作用類似于向量的2范數(shù),因此,表達(dá)式ψν/ -iff + |g - ijp在保證類內(nèi)不變性的同 時(shí)有效地防止過(guò)擬合現(xiàn)象;ξ*是經(jīng)驗(yàn)判別的損失函數(shù),最小化該參數(shù)可W增強(qiáng)類間的可辨 別性;由此可見,Ct保證了類間的最大可辨別性,而|m - + |g - 保證了類內(nèi)不變性, 而正數(shù)丫用來(lái)協(xié)調(diào)運(yùn)兩個(gè)表達(dá)式所帶來(lái)的影響;對(duì)于上述表達(dá)式中的不等式,當(dāng)一對(duì)人臉 圖片來(lái)自于同一個(gè)人時(shí),yu = l,而ξυ的值較小,于是把/.。,咕f,)的值會(huì)盡可能大;而當(dāng)一 對(duì)人臉圖片來(lái)自于不同的人時(shí),yu = -l,而ξυ的值較小,于是瓜/.6·化,引的值會(huì)盡可能??; 因此,當(dāng)也W化,與)值較大時(shí),則表明一對(duì)人臉圖片來(lái)自于同一個(gè)人,反之,則表明一對(duì)人 臉來(lái)自于不同的人; 步驟5、利用KELM分類器判斷兩張圖片是否來(lái)自于同一個(gè)人; ELM是只包含一個(gè)隱含層和一個(gè)輸出層的神經(jīng)網(wǎng)絡(luò);其最顯著的特點(diǎn)是,它的隱含層參 數(shù)不需要進(jìn)行調(diào)試,而是隨機(jī)設(shè)定的,具有較強(qiáng)的泛化能力;假設(shè)化Μ的隱含層包含L個(gè)節(jié) 點(diǎn),則其輸出函數(shù)如下:其中,xeRd,yeRE,0表示隱含層的L個(gè)節(jié)點(diǎn)與輸出層之間的權(quán)重,h(x)表示L個(gè)節(jié)點(diǎn)與 輸入X之間的關(guān)系,它是一個(gè)非線性的激勵(lì)函數(shù)(如sigmoid函數(shù)),實(shí)際上,它的作用是將d 維數(shù)據(jù)映射到L維數(shù)據(jù)空間中,Wi表示隱含層第i個(gè)節(jié)點(diǎn)與輸入層的連接權(quán)重,bi表示隱含層 第i個(gè)節(jié)點(diǎn)的偏差; 在ELM的基礎(chǔ)上,又提出了一種基于核函數(shù)的ELM方法,即KELM方法;該方法是用核函數(shù) 來(lái)隱藏ELM原有的激勵(lì)函數(shù)H,從而更好地提高了算法的泛化能力;對(duì)于某一樣本XI,其輸出 函數(shù)表達(dá)式如下:Y=[yi; . . . ;yn]ERnXc 其中,C是一個(gè)回歸系數(shù); 將步驟4中得到的相似度得分值作為KELM分類器的輸入,所得到的輸出若為1,則表明 兩張人臉圖片來(lái)自于同一個(gè)人,若為0,則表明兩張人臉圖片來(lái)自于不同的人。2.根據(jù)權(quán)利要求1所述的基于關(guān)鍵點(diǎn)的改進(jìn)SIFT人臉特征提取方法,其特征在于:本方 法具體包括W下步驟, 1)將人臉數(shù)據(jù)庫(kù)中的數(shù)據(jù)分成10組進(jìn)行交叉驗(yàn)證實(shí)驗(yàn),其中,9組數(shù)據(jù)作為訓(xùn)練數(shù)據(jù), 剩余1組數(shù)據(jù)作為測(cè)試數(shù)據(jù),每組中包含300對(duì)來(lái)自同一個(gè)人的人臉圖片和300對(duì)來(lái)自不同 人的人臉圖片;對(duì)于每張人臉圖片,利用Ξ層深度卷積網(wǎng)絡(luò)級(jí)聯(lián)定位五個(gè)關(guān)鍵像素點(diǎn)的坐 標(biāo)位置,左眼中間位置的像素點(diǎn),右眼中間位置的像素點(diǎn),鼻尖上的像素點(diǎn),左嘴角的像素 點(diǎn)W及右嘴角的像素點(diǎn); 在Ξ層深度卷積網(wǎng)絡(luò)級(jí)聯(lián)結(jié)構(gòu)的第一層中,包含Ξ個(gè)深度卷積網(wǎng)絡(luò);第一個(gè)深度卷積 網(wǎng)絡(luò)的輸入是整張人臉,輸出五個(gè)關(guān)鍵像素點(diǎn)的位置;第二個(gè)深度卷積網(wǎng)絡(luò)的輸入是人臉 的上半部分,輸出眼睛和鼻子位置關(guān)鍵像素點(diǎn)的位置;第Ξ個(gè)深度卷積網(wǎng)絡(luò)的輸入是人臉 的下半部分,輸出鼻子和嘴己位置關(guān)鍵像素點(diǎn)的位置;最后,將運(yùn)Ξ個(gè)深度卷積網(wǎng)絡(luò)的輸出 結(jié)果進(jìn)行平均得到第一層最終的輸出;深層卷積網(wǎng)絡(luò)級(jí)聯(lián)的第二層和第Ξ層均取前一層輸 出結(jié)果中關(guān)鍵像素點(diǎn)周圍的領(lǐng)域作為輸入,對(duì)關(guān)鍵像素點(diǎn)的坐標(biāo)位置進(jìn)行再次確認(rèn),是對(duì) 第一層輸出結(jié)果的補(bǔ)充; 2) 對(duì)于步驟1)中的五個(gè)關(guān)鍵像素點(diǎn),W每個(gè)關(guān)鍵像素點(diǎn)為中屯、,取14X14的鄰域窗口 大小,計(jì)算該窗口中每個(gè)像素點(diǎn)的梯度模值和方向;然后統(tǒng)計(jì)梯度方向的直方圖;為了減少 突變的影響,用參數(shù)σ為1.5 X 14的高斯函數(shù)對(duì)直方圖進(jìn)行平滑處理;最后W每個(gè)關(guān)鍵像素 點(diǎn)鄰域像素的梯度方向分布特性來(lái)確定每個(gè)關(guān)鍵像素點(diǎn)的方向; 確定了關(guān)鍵像素點(diǎn)的方向后,將坐標(biāo)軸旋轉(zhuǎn)為關(guān)鍵像素點(diǎn)的方向,W確保旋轉(zhuǎn)不變性; 然后W關(guān)鍵像素點(diǎn)為中屯、取16X16的鄰域窗口大小,然后在每4X4大小的小塊上計(jì)算8個(gè) 方向的梯度直方圖,最終,每個(gè)特征向量形成4 X 4 X 8 = 128維的描述子;由于本發(fā)明中每張 人臉圖片的關(guān)鍵像素點(diǎn)數(shù)為5個(gè),因此,每張人臉圖片的特征向量為5X128 = 640維,運(yùn)不僅 大大降低了特征維數(shù),而且削弱了表情變化、光照變化W及其他環(huán)境因素等造成的影響,增 強(qiáng)了人臉特征的魯棒性; 3) 將步驟2)中得到的特征向量利用PCA(主成分分析)方法進(jìn)行降維,獲取前400個(gè)主成 分變量,形成400維的特征臉;然后,為了保證同一個(gè)人不同的人臉圖片之間的類內(nèi)不變性, 將特征臉映射到intra-personal子空間中,其中,intra-personal空間的特征維數(shù)取300; 4) 通過(guò)9組訓(xùn)練數(shù)據(jù)訓(xùn)練得到雙線性相似度函數(shù)和馬氏距離中的Μ參數(shù)和G參數(shù);利用 訓(xùn)練過(guò)程所得到的Μ參數(shù)和G參數(shù)計(jì)算訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)中各對(duì)人臉圖片之間的相似度 得分值; 5) 利用KELM分類器判斷兩張圖片是否來(lái)自于同一個(gè)人;在KELM分類器中,本發(fā)明選擇 徑向基核函數(shù)(RBF)作為核函數(shù),回歸系數(shù)C=1024;將步驟4)中得到的兩張人臉圖片之間 的相似度得分值作為KELM分類器的輸入,所得到的分類器輸出若為1,則表明兩張人臉圖片 來(lái)自于同一個(gè)人,若為0,則表明兩張人臉圖片來(lái)自于不同的人。
【專利摘要】基于關(guān)鍵點(diǎn)的改進(jìn)SIFT人臉特征提取方法,本方法采用了基于關(guān)鍵點(diǎn)的改進(jìn)SIFT人臉特征提取的方法。通過(guò)定位人臉中的五個(gè)關(guān)鍵像素點(diǎn),并利用SIFT方法中的方向直方圖來(lái)描述這五個(gè)關(guān)鍵點(diǎn),從而形成魯棒的人臉圖像特征向量。結(jié)合雙線性相似度函數(shù)和馬氏距離來(lái)計(jì)算兩個(gè)人臉特征向量之間的相似度得分值。采用KELM分類器對(duì)相似度得分值進(jìn)行二值分類,得分值較高的一類人臉圖片,兩張人臉圖片均被判為來(lái)自于同一個(gè)人,而得分值較低的一類人臉圖片,兩張人臉圖片均被判為來(lái)自于不同的人。在人臉特征向量的基礎(chǔ)上進(jìn)行人臉識(shí)別的過(guò)程中,結(jié)合了雙線性相似度函數(shù)和馬氏距離來(lái)計(jì)算兩特征向量的相似度得分值,增強(qiáng)了類間的可辨別性。
【IPC分類】G06K9/00
【公開號(hào)】CN105550657
【申請(qǐng)?zhí)枴緾N201510977092
【發(fā)明人】李偉, 王璐, 馮復(fù)標(biāo)
【申請(qǐng)人】北京化工大學(xué)
【公開日】2016年5月4日
【申請(qǐng)日】2015年12月23日