基于相位編碼特征和多度量學(xué)習(xí)的模糊人臉圖像驗(yàn)證方法
【專利摘要】本發(fā)明公開了一種基于相位編碼特征和多度量學(xué)習(xí)的模糊人臉圖像驗(yàn)證方法,包括:(1)訓(xùn)練階段:對(duì)樣本圖像進(jìn)行分塊,對(duì)每一圖像塊提取多尺度初級(jí)特征;用上述特征進(jìn)行fisher?kernel詞典學(xué)習(xí),生成分塊fisher?kernel編碼特征;對(duì)上述編碼特征進(jìn)行多度量矩陣學(xué)習(xí)以產(chǎn)生多個(gè)度量矩陣,并得到訓(xùn)練樣本經(jīng)過多度量矩陣投影后的度量距離,計(jì)算出正樣本、負(fù)樣本分別對(duì)集合的平均度量距離及方差,并通過高斯分布的概率計(jì)算公式確定最終的分類閾值;(2)驗(yàn)證階段:對(duì)于輸入的人臉圖像,對(duì)圖像分塊并提取多尺度初級(jí)特征,然后產(chǎn)生分塊fisher?kernel編碼特征,再通過多度量矩陣得到最終的度量距離,將此距離與閾值相比得出人臉驗(yàn)證結(jié)果。本發(fā)明具有識(shí)別率高、通用性強(qiáng)的優(yōu)點(diǎn)。
【專利說明】基于相位編碼特征和多度量學(xué)習(xí)的模糊人臉圖像驗(yàn)證方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域,尤其涉及一種基于相位編碼特征和多度 量學(xué)習(xí)的模糊人臉圖像驗(yàn)證方法。
【背景技術(shù)】
[0002] 人臉識(shí)別和驗(yàn)證技術(shù)在過去數(shù)十年間一直是計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域的研究 熱點(diǎn),同時(shí)在智能監(jiān)控、身份驗(yàn)證等場合也有著廣泛的應(yīng)用。經(jīng)過幾十年的發(fā)展,人臉識(shí)別 和驗(yàn)證技術(shù)在可控環(huán)境下已經(jīng)有相當(dāng)高的準(zhǔn)確率,但是在現(xiàn)實(shí)應(yīng)用中有許多因素會(huì)影響人 臉識(shí)別和驗(yàn)證的準(zhǔn)確率,圖像模糊和分辨率低是其中很重要的一個(gè)影響因素。
[0003] 造成圖像模糊主要是以下原因:一、從城市監(jiān)控視頻提取人臉進(jìn)行識(shí)別和驗(yàn)證時(shí), 因?yàn)榫嚯x的問題,得到的人臉圖像往往是低分辨率及模糊的;二、用二代證進(jìn)行身份驗(yàn)證 時(shí),由于芯片可存取圖像的條件限制,二代證存放的照片都是高度壓縮并且模糊的。面對(duì)模 糊的人臉圖像,傳統(tǒng)的方法無法取得可靠的識(shí)別和驗(yàn)證結(jié)果,為了處理模糊人臉圖像的識(shí) 別和驗(yàn)證問題,研究者們提出了以下的一些方法:基于超分辨率的方法、基于雙映射的方法 和基于模糊不變算子的方法?;诔直媛实姆椒ㄊ窍葘?duì)人臉圖像進(jìn)行超分辨率重構(gòu)補(bǔ)充 細(xì)節(jié),再進(jìn)行識(shí)別和驗(yàn)證,這種方法雖然能夠提高分辨率、構(gòu)建圖像細(xì)節(jié),但是超分辨率的 方法本質(zhì)是一種提高視覺品質(zhì)的增強(qiáng)方法,構(gòu)建出來的圖像細(xì)節(jié)可能與真實(shí)人臉圖像不符 進(jìn)而導(dǎo)致錯(cuò)誤的結(jié)果?;陔p映射的方法是把分辨率不同的庫圖像和測試圖像映射到同一 空間進(jìn)行識(shí)別,跨越了分辨率間的鴻溝,但是該方法不能處理現(xiàn)實(shí)環(huán)境的開集問題?;谀?糊不變算子的方法是通過提取對(duì)模糊不變的特征描述子實(shí)現(xiàn)人臉驗(yàn)證算法對(duì)模糊的魯棒 性,運(yùn)算速度快,而且適用于一般的人臉識(shí)別和驗(yàn)證框架。但是特征描述子的選擇、提取對(duì) 算法影響很大,在環(huán)境比較復(fù)雜的場合,現(xiàn)有的算子識(shí)別率較低。
[0004] 因此,針對(duì)現(xiàn)實(shí)環(huán)境中常見的模糊及低分辨率人臉圖像這個(gè)問題,尋找一種識(shí)別 率高的圖像識(shí)別方法具有重要應(yīng)用價(jià)值。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明針對(duì)現(xiàn)有人臉識(shí)別和驗(yàn)證方法不能魯棒地處理現(xiàn)實(shí)環(huán)境中常見的模糊及 低分辨率人臉圖像這個(gè)問題,提出了一種基于相位編碼特征和多度量學(xué)習(xí)的模糊人臉圖像 驗(yàn)證方法,該方法能從模糊的人臉圖像中提取緊湊、描述能力強(qiáng)的抗模糊特征,并結(jié)合所提 出的分塊度量方法,提高了驗(yàn)證算法的分類準(zhǔn)確率,壓縮了數(shù)據(jù)維度,在環(huán)境比較復(fù)雜的真 實(shí)數(shù)據(jù)上,仍然對(duì)模糊圖像有較好的識(shí)別準(zhǔn)確率。
[0006] 本發(fā)明的目的通過以下的技術(shù)方案實(shí)現(xiàn):基于相位編碼特征和多度量學(xué)習(xí)的模糊 人臉圖像驗(yàn)證方法,包括步驟:
[0007] ⑴訓(xùn)練階段:
[0008] (1-1)對(duì)輸入樣本圖像進(jìn)行分塊并對(duì)每一圖像塊提取多尺度初級(jí)特征;多尺度初 級(jí)特征為目標(biāo)像素與鄰域像素在頻域的相位差向量;
[0009] (l_2)fisher kernel詞典學(xué)習(xí):對(duì)于訓(xùn)練樣本,用步驟(1-1)提取的多尺度初級(jí) 特征進(jìn)行fisher kernel詞典學(xué)習(xí),并生成對(duì)應(yīng)的分塊fisher kernel編碼特征;
[0010] (1-3)多度量矩陣學(xué)習(xí):對(duì)訓(xùn)練樣本的分塊fisher kernel編碼特征進(jìn)行多度量 矩陣學(xué)習(xí)以產(chǎn)生多個(gè)度量矩陣,并得到訓(xùn)練樣本經(jīng)過多度量矩陣投影后的度量距離,計(jì)算 出正樣本對(duì)集合的平均度量距離及方差和負(fù)樣本對(duì)集合的平均度量距離及方差,并通過高 斯分布的概率計(jì)算公式確定最終的分類閾值;
[0011] (2)測試人臉驗(yàn)證階段:對(duì)于輸入的人臉圖像,首先對(duì)圖像分塊并提取多尺度初 級(jí)特征,然后通過fisher kernel詞典產(chǎn)生分塊fisher kernel編碼特征,再通過多度量矩 陣得到最終的度量距離,將此距離與閾值相比得出人臉驗(yàn)證結(jié)果。
[0012] 具體的,所述步驟(1-1)中提取多尺度初級(jí)特征的步驟是:
[0013] 假設(shè)計(jì)算的中心點(diǎn)是X。,它的八個(gè)相鄰點(diǎn)分別是xk, k = 1…8,對(duì)頻率u的響應(yīng)分 別是F(u, xt), t = 1…8,對(duì)應(yīng)的相位角度分別是Z F(u, xt), t = 1…8,中心點(diǎn)的相位角度 是Z: F(u, X。),則相位差向量為:
[0014] dp (u) = [ Z F (u, Xi) - Z F (u, xc), ···, Z F (u, x8) - Z F (u, xc) ]T ;
[0015] 然后在四個(gè)相位點(diǎn)Ul,u2, u3, u4分別計(jì)算頻率相應(yīng),將四個(gè)相位差向量串聯(lián)得到多 頻率相位差向量:(11)=[(1 1)(111)1(^(112)1(^(11 3)1'(11)(114)1']'其中11 1=[&,0]'112=[0,&]'113 =
[3,8]7和
【權(quán)利要求】
1. 基于相位編碼特征和多度量學(xué)習(xí)的模糊人臉圖像驗(yàn)證方法,其特征在于,包括步 驟: (1) 訓(xùn)練階段: (1-1)對(duì)輸入樣本圖像進(jìn)行分塊并對(duì)每一圖像塊提取多尺度初級(jí)特征;多尺度初級(jí)特 征為目標(biāo)像素與鄰域像素在頻域的相位差向量; (l-2)fisher kernel詞典學(xué)習(xí):對(duì)于訓(xùn)練樣本,用步驟(1-1)提取的多尺度初級(jí)特征 進(jìn)行fisher kernel詞典學(xué)習(xí),并生成對(duì)應(yīng)的分塊fisher kernel編碼特征; (1-3)多度量矩陣學(xué)習(xí):對(duì)訓(xùn)練樣本的分塊fisher kernel編碼特征進(jìn)行多度量矩陣 學(xué)習(xí)以產(chǎn)生多個(gè)度量矩陣,并得到訓(xùn)練樣本經(jīng)過多度量矩陣投影后的度量距離,計(jì)算出正 樣本對(duì)集合的平均度量距離及方差和負(fù)樣本對(duì)集合的平均度量距離及方差,并通過高斯分 布的概率計(jì)算公式確定最終的分類閾值; (2) 測試人臉驗(yàn)證階段:對(duì)于輸入的人臉圖像,首先對(duì)圖像分塊并提取多尺度初級(jí)特 征,然后通過fisher kernel詞典產(chǎn)生分塊fisher kernel編碼特征,再通過多度量矩陣得 到最終的度量距離,將此距離與閾值相比得出人臉驗(yàn)證結(jié)果。
2. 根據(jù)權(quán)利要求1所述的基于相位編碼特征和多度量學(xué)習(xí)的模糊人臉圖像驗(yàn)證方法, 其特征在于,所述步驟(1-1)中提取多尺度初級(jí)特征的步驟是: 假設(shè)計(jì)算的中心點(diǎn)是X。,它的八個(gè)相鄰點(diǎn)分別是xk,k = 1…8,對(duì)頻率u的響應(yīng)分別 是F(u, xt), t = 1…8,對(duì)應(yīng)的相位角度分別是Z F(u, xt), t = 1…8,中心點(diǎn)的相位角度是 Z: F(u, X。),則相位差向量為: dp (u) = [ Z F (u, Xi) - Z F (u, xc), ···, Z F (u, x8) - Z F (u, xc) ]T ; 然后在四個(gè)相位點(diǎn)Ul,u2, u3, u4分別計(jì)算頻率相應(yīng),將四個(gè)相位差向量串聯(lián)得到多頻率 相位差向量:(11)=[(11)(111)1'(1 1)(112)1'(11)(113) 1(^(114)1']'其中111=[&,0]'11 2=[0,&]'113=[&,&] 7和114 = [a, _a]T,而<1=^,Μ為頻域卷積的窗口大小;在多頻率相位差向量后加入空間坐 Μ 標(biāo)信息,得到初級(jí)特征描述子:
其中,W代表輸入圖像的寬度,h代表輸入圖像的高度,X代表圖像塊的橫坐標(biāo),y代表 圖像塊的縱坐標(biāo);所述多尺度初級(jí)特征是通過分別取Μ = 3、5、7計(jì)算初級(jí)特征描述子并連 接成一個(gè)向量得到的。
3. 根據(jù)權(quán)利要求1所述的基于相位編碼特征和多度量學(xué)習(xí)的模糊人臉圖像驗(yàn)證方法, 其特征在于,所述步驟(l_2)fisher kernel詞典學(xué)習(xí)的具體步驟是: (1-2-1)構(gòu)建詞典,對(duì)于輸入的多尺度初級(jí)特征,采用混合高斯模型構(gòu)建詞典;用EM算 法迭代估計(jì)模型參數(shù),步驟如下:設(shè)第i個(gè)樣本的特征為x(i)在混合高斯模型中出現(xiàn)概率 為:
其中: Wk是詞典中第k
個(gè)詞的權(quán)重,μ,和1,分別是詞典中第k個(gè)詞的均值和協(xié)方差,EM算法首先隨機(jī)初始化 GMM模型的K個(gè)高斯分布的均值和協(xié)方差,對(duì)于輸入的m個(gè)樣本,先計(jì)算第i個(gè)樣本來自第 k個(gè)高斯的期望值af =|?(zw=糾xw;w5/i5E),然后通過最大化期望值來更新模型參數(shù)
并得到混合高斯模型的詞 血. (1-2-2)用p (X | λ )表示特征的概率密度函數(shù),X = {xt, t = 1,2. · · T}表示圖 像中抽樣得到的低級(jí)特征集合,則對(duì)參數(shù)λ求導(dǎo)的梯度向量為gzVJognXM), 代入混合高斯模型求得對(duì)均值和協(xié)方差的導(dǎo)數(shù)為
和
,其中第i個(gè)詞在所有詞中的權(quán)重
^再對(duì)Gf進(jìn)行一次L2范數(shù)歸一化得
最后通過指數(shù) 歸一化的方法進(jìn)行去稀疏得到輸出fisher kernel編碼特征。
4. 根據(jù)權(quán)利要求3所述的基于相位編碼特征和多度量學(xué)習(xí)的模糊人臉圖像驗(yàn)證方法, 其特征在于,對(duì)于輸入特征fi,指數(shù)歸一化的計(jì)算公式為:
其中,α為指數(shù)歸一化參數(shù),在[〇, 1]之間。
5. 根據(jù)權(quán)利要求1所述的基于相位編碼特征和多度量學(xué)習(xí)的模糊人臉圖像驗(yàn)證方法, 其特征在于,所述步驟(1-3)中對(duì)訓(xùn)練樣本的分塊fisher kernel編碼特征進(jìn)行多度量矩 陣學(xué)習(xí)的步驟如下: (1-3-1)解以下的最優(yōu)化方程:
其中,輸入圖像共有K個(gè)分塊,故同時(shí)學(xué)習(xí) K個(gè)度量矩陣,其中Wk是第k個(gè) 度量矩陣,W。是初始的約束矩陣,η是訓(xùn)練樣本的數(shù)量,Dld為約束函數(shù),公式為 Dld (X,Y) = tr (ΧΓ1) -logdet (ΧΓ1) -n,用于衡量學(xué)習(xí)的度量矩陣與初始矩陣的距
是損失函數(shù),用以評(píng)價(jià) 多尺度度量投影后樣本距離的分布是否符合預(yù)期要求,其中(Uu = sid-η ; 2)),表示計(jì)算第k個(gè)圖像塊投影以后的距離;Υ是訓(xùn)練過 程中偏離初始矩陣的程度和訓(xùn)練樣本正確率的平衡參數(shù)(約束函數(shù)和限制函數(shù)之間的平 衡參數(shù)),δ u = 1表示樣本i, j是正樣本對(duì),否則δ υ = -1,ξ υ是松弛變量,τ是正負(fù) 樣本與平均特征的差距閾值,(ξ iPk是第k個(gè)圖像塊對(duì)應(yīng)的松弛變量;首先,用對(duì)樣本訓(xùn) 練進(jìn)行PCA降維得到的投影矩陣作為初始矩陣& e Rn~作為初始度量矩陣,然后,對(duì)于 所有的輸入分塊訓(xùn)練圖像對(duì){(承4)為},心z;: ,計(jì)算訓(xùn)練樣本對(duì)投影后的距離均值
,及相應(yīng)的差距閾值τ =0.6 P,且同理計(jì)算每 一分塊對(duì)應(yīng)的P k,τ k,然后對(duì)于k = 1,· · ·,Κ,初始化<?丨=Gc,% = 0,(4# = , Bk = U按經(jīng)驗(yàn)值設(shè)置Υ,迭代次數(shù)初始化為〇 ; (1-3-2)迭代執(zhí)行以下步驟進(jìn)行參數(shù)的更新及分塊度量的學(xué)習(xí): 對(duì)于輸入樣本對(duì)(<,<),計(jì)算投影距離:
然后進(jìn)行判斷,如果滿足約芽
> 則對(duì)分塊度量投影矩陣進(jìn)行參數(shù)的更 新,對(duì)于圖像的每個(gè)分塊k,如果^ 則計(jì)算
,然后 更新《=《-〇*,并計(jì)算聲與)7<^(<-4),再由β和ω通過 choiesky分解算法更新Bk的值并更新(客7" =r《y,(r+4/q《y),迭代次數(shù)加1,一直 重復(fù)該過程直到迭代收斂或者迭代次數(shù)超出設(shè)置的次數(shù)閾值,迭代結(jié)束后計(jì)算Gk = GJk, 并輸出度量矩陣恥句·々=ο,..·,AZ丨作為度量學(xué)習(xí)迭代的結(jié)果,其中= (1-3-3)學(xué)習(xí)得到Gk后,對(duì)于輸入樣本,度量距離為 劣)= (ζ?-ζ丨計(jì)算出正樣本對(duì)集合的平均度量距離及方差和 負(fù)樣本對(duì)集合的平均度量距離及方差,并通過高斯分布的概率計(jì)算公式確定最終的分類閾 值。
【文檔編號(hào)】G06K9/62GK104123560SQ201410318641
【公開日】2014年10月29日 申請(qǐng)日期:2014年7月3日 優(yōu)先權(quán)日:2014年7月3日
【發(fā)明者】賴劍煌, 袁洋, 馮展祥 申請(qǐng)人:中山大學(xué)