基于粗糙集和集成學(xué)習(xí)的人臉識別方法
【專利摘要】本發(fā)明公開了一種基于粗糙集和集成學(xué)習(xí)的人臉識別方法。其步驟為:1.提取人臉圖像并預(yù)處理,產(chǎn)生決策表;2.對決策表進行屬性約減,得到最佳屬性約減空間;3.從最佳屬性約減空間中隨機選擇一組最佳屬性約減組合并保存;4.計算最佳屬性約減組合中每一個條件屬性的依賴度值;5.根據(jù)依賴度值縮小約減空間;6.從縮小的約減空間中選擇一組最佳屬性約減組合并保存;7.判斷保存的最佳屬性約減組合的數(shù)量是否達到預(yù)先設(shè)定的值,若是,則返回4.,否則,用保存的最佳屬性約減組合訓(xùn)練基本分類器,識別人臉圖像。本發(fā)明通過對人臉圖像的屬性約減,提高了人臉圖像的識別率和穩(wěn)定性??捎糜诜纯职踩?、案件調(diào)查取證及商業(yè)、個人隱私保密。
【專利說明】基于粗糙集和集成學(xué)習(xí)的人臉識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明圖像處理【技術(shù)領(lǐng)域】,特別涉及一種人臉識別方法,可用于反恐安全、案件調(diào) 查取證及商業(yè)、個人隱私保密。
【背景技術(shù)】
[0002] 近幾十年以來,人臉識別技術(shù)逐漸成為圖像處理、模式識別等領(lǐng)域的研究熱點。人 臉識別技術(shù)是根據(jù)人的面部特征進行身份鑒定的一種生物特征識別技術(shù),由于人臉特征是 人類自身擁有,且很難偽造和竊取,再加上識別時不需要直接接觸、不易被人察覺的優(yōu)勢, 因此其在反恐安全、案件調(diào)查取證及商業(yè)和個人隱私保密領(lǐng)域都有著廣泛應(yīng)用。學(xué)術(shù)界以 及工業(yè)界越來越重視人臉識別技術(shù)的研究,它是目前生物特征識別中可行性、可靠性和準(zhǔn) 確性等專業(yè)技術(shù)指標(biāo)中數(shù)值較高的技術(shù)。
[0003] 人臉識別方法易受到周圍光線,人體面部被頭發(fā)、飾物遮擋,人年紀增長面部衰老 等多方面因素的影響。傳統(tǒng)的基于單個支持向量機SVM的人臉識別方法,試圖使得分類器 在經(jīng)驗風(fēng)險和泛化能力上達到一種妥協(xié),進而提高分類器的性能。單個SVM分類器在有大 量訓(xùn)練樣本的情況下,能獲得較好的識別性能,但在實際應(yīng)用中,獲得大量的訓(xùn)練樣本往往 是不現(xiàn)實的。
[0004] 集成學(xué)習(xí)通過把多個單個分類器的分類結(jié)果進行某種組合來決定最終的分類,以 取得比單個分類器更好的性能。典型的集成學(xué)習(xí)方法包括Bagging, Adaboost和Random subspace,他們采用不同的策略產(chǎn)生用于訓(xùn)練基本分類器的訓(xùn)練集。Bagging方法中訓(xùn)練基 本分類器需要的訓(xùn)練集是由原始訓(xùn)練集中隨機抽取一定數(shù)量的樣本組成;Adaboost方法 根據(jù)每次基本分類器對訓(xùn)練集中每個樣本的分類結(jié)果,及上次總體分類的準(zhǔn)確率,對每個 樣本的權(quán)值進行調(diào)整,降低被基本分類器分類正確的樣本的權(quán)值,提高被基本分類器分類 錯誤的樣本的權(quán)值,以此通過改變每個樣本的權(quán)值產(chǎn)生新的訓(xùn)練集;Random subspace方法 從原始訓(xùn)練集中隨機選擇不同的屬性組成新的訓(xùn)練集。
[0005] 上述集成學(xué)習(xí)方法由于均沒有較好的考慮人臉樣本中屬性之間的關(guān)系,也沒有對 人臉特征進行有效地提取,因此不能獲得較好的人臉識別效果。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的在于針對上述已有技術(shù)的不足,提出了一種基于粗糙集和集成學(xué)習(xí) 的人臉識別方法,提高人臉識別率。
[0007] 本發(fā)明的技術(shù)思路是:從人臉圖像中提取多組有利于分類的特征,并確保在沒有 大量訓(xùn)練樣本的情況下,通過集成若干個基本分類器,提高對人臉的識別率。
[0008] 根據(jù)上述思路,本發(fā)明的技術(shù)方案包括如下步驟:
[0009] (1)人臉圖像預(yù)處理:
[0010] (Ia)從標(biāo)準(zhǔn)人臉庫中獲取T幅人臉圖像,并將其劃分成N幅訓(xùn)練樣本圖像和M幅 測試樣本圖像,其中T彡2, N彡1,M彡1,N+M = T ;
[0011] (Ib)為訓(xùn)練樣本圖像建立決策表S,它是一個NXL矩陣,每一行代表一幅人臉圖 像,每一列代表人臉圖像的一個屬性特征,其中L>2,前L-I列表示圖像的條件屬性,第L列 表示圖像的決策屬性;
[0012] (2)對決策表S進行屬性約減,產(chǎn)生多組最佳屬性約減組合,用這些最佳屬性約減 組合構(gòu)成一個最佳屬性的約減空間K = U1, ..,Ai, ..,AJ,其中Ai為第i組最佳屬性約減組 合,i = 1,? ? ?,z,z 彡 2,Ai = Ic1, ? ?,Cj, ? ?,cj ,Cj 為圖像的第 j 個條件屬性,j = 1,? ? ?,n, l<n<L ;
[0013] (3)從最佳屬性約減空間中,隨機選擇一組最佳屬性約減組合,并保存。
[0014] (4)計算最新保存的最佳屬性約減組合中每一個條件屬性的依賴度值公式:
【權(quán)利要求】
1. 一種基于粗糙集和集成學(xué)習(xí)的人臉識別方法,包括如下步驟: (1) 人臉圖像預(yù)處理: (la) 從標(biāo)準(zhǔn)人臉庫中獲取T幅人臉圖像,并將其劃分成N幅訓(xùn)練樣本圖像和M幅測試 樣本圖像,其中T彡2,N彡1,M彡1,N+M=T; (lb) 為訓(xùn)練樣本圖像建立決策表S,它是一個NXL矩陣,每一行代表一幅人臉圖像,每 一列代表人臉圖像的一個屬性特征,其中L>2,前L-1列表示圖像的條件屬性,第L列表示圖 像的決策屬性; (2) 對決策表S進行屬性約減,產(chǎn)生多組最佳屬性約減組合,用這些最佳屬性約減組合 構(gòu)成一個最佳屬性的約減空間K= {&,..,化,..,AJ,其中化為第i組最佳屬性約減組合, i= 1,…,z,z彡2,Ai={cd? ?,Cj, ? ?,cj,Cj為圖像的第j個條件屬性,j= 1,…,n, l<n<L; (3) 從最佳屬性約減空間中,隨機選擇一組最佳屬性約減組合,并保存; (4) 計算最新保存的最佳屬性約減組合中每一個條件屬性的依賴度值公式:
,其中rP (Cp為條件屬性對P的依賴度值,P為從最佳屬性約減組合中 刪除條件屬性Cj后的屬性集,POSP(Cj)為條件屬性Cj相對屬性集P的正區(qū)域,| ? |為" ?" 的勢; (5) 找出最大的依賴度值所對應(yīng)的條件屬性Cm,其中me[l,n],從約減空間K中刪除 包含該條件屬性cm的最佳屬性約減組合,用剩余的最佳屬性約減組合構(gòu)成一個縮小的約減 空間; (6) 從縮小的約減空間中,利用準(zhǔn)確-多樣評估函數(shù)選擇一組最佳屬性約減組合,并保 存; (7) 判斷保存的最佳屬性約減組合的數(shù)量是否達到預(yù)先設(shè)定的值:如果數(shù)量達不到預(yù) 先設(shè)定的值,則返回步驟(4),如果數(shù)量達到預(yù)先設(shè)定的值,則執(zhí)行步驟(8); (8) 利用保存的每一個最佳屬性約減組合構(gòu)建一個訓(xùn)練樣本集,得到重新構(gòu)建的多組 訓(xùn)練樣本集;用每一個訓(xùn)練樣本集訓(xùn)練一個基本分類器,利用不同的基本分類器對測試樣 本集進行分類,得到不同的分類結(jié)果;采用集成學(xué)習(xí)中的多數(shù)投票法融合這些不同的分類 結(jié)果,得到測試樣本集的最終識別結(jié)果。
2. 根據(jù)權(quán)利要求1所述的基于粗糙集和集成學(xué)習(xí)的人臉識別方法,其中步驟(lb)所 述的為訓(xùn)練樣本圖像建立決策表S:是利用MATLAB軟件中的reshape函數(shù)分別將每一幅 人臉圖像轉(zhuǎn)換成一個行向量,每個行向量包含L-1個條件屬性,得到N幅人臉圖像的一個 NX(L-1)的矩陣A;用N幅人臉圖像的決策屬性形成一個NX1的列向量B;將得到的矩陣 A與列向量B合并,得到N幅人臉圖像的決策表,它是一個NXL矩陣,其中L的具體取值由 人臉圖像的大小決定。
3. 根據(jù)權(quán)利要求1所述的基于粗糙集和集成學(xué)習(xí)的人臉識別方法,其中所述步驟(2) 中最佳屬性約減組合,指訓(xùn)練樣本圖像的最小屬性子集,并且該子集具有原始屬性的分辨 能力。
4. 根據(jù)權(quán)利要求1所述的基于粗糙集和集成學(xué)習(xí)的人臉識別方法,其中步驟(2)所述 對決策表S進行屬性約減,產(chǎn)生多組最佳屬性約減組合,是利用RichardJensen編寫的嵌 入到weka軟件中的模糊粗糙集算法實現(xiàn)。
5. 根據(jù)權(quán)利要求1所述的基于粗糙集和集成學(xué)習(xí)的人臉識別方法,其中所述步驟(4) 中條件屬性h對P的依賴度值rP (Cp,按如下步驟獲得: (4a)訓(xùn)練樣本集U={xp. .,xk, . .,xN},其中xk為第k個樣本圖像,對于屬性集P,計 算不可分辨關(guān)系I(P):
其中,c為屬性集P中的條件屬性,Xl為第1個樣本圖像,g(xk,c)表示第k個樣本圖像 的第c個屬性所對應(yīng)的值,g(Xl,c)表示第1個樣本圖像的第c個屬性所對應(yīng)的值; (4b)根據(jù)步驟(4a)得到的不可分辨關(guān)系,計算基于屬性集P產(chǎn)生的等價類[X]P:[x]P ={xI(xk,xx)GI(P),XGU}; (4c)根據(jù)步驟(4b)中得到的等價類,計算屬性集P對于樣本集X的下近似£(X)和上 近似
其中,X是基于屬性集Ci產(chǎn)生的等價類[.v|(,小表示空集; (4d)根據(jù)步驟(4c)中得到的下近似£(X),計算條件屬性相對屬性集P的正區(qū)域:POSp(Cj) =U£(X)。
6. 根據(jù)權(quán)利要求1所述的基于粗糙集和集成學(xué)習(xí)的人臉識別方法,其中步驟(6)所述 的從縮小的約減空間中,利用準(zhǔn)確-多樣評估函數(shù)選擇一組最佳屬性約減組合的方法,按 如下步驟進行: (6a)計算基本分類器的經(jīng)驗損失A6mp(Ft,N):
其中,基本分類器組Ft由多個已確定的分類器和一個基本分類器組成,這些已確定的 分類器是基于保存的最佳屬性約減組合訓(xùn)練得到,一個基本分類器是基于縮小的約減空間 中的一個最佳屬性約減組合訓(xùn)練得到;at表示基本分類器組Ft中基本分類器的數(shù)量,fb (xk) 表示基本分類器組Ft中第b個分類器對第k個人臉圖像分類的結(jié)果,yk表示第k個人臉圖 像的決策屬性,其中5為基于縮小的約減空間中的最佳屬性約減組合訓(xùn)練的分類 器的總數(shù),bG[l,aJ,kG[1,N]; (6b)計算基本分類器之間的多樣性Ddiv(Ft,N):
其中,〇A定義為:如果第r個分類器能正確分類第k幅人臉圖像,則0A= 1,否則0A =〇, 〇qk定義為,如果第q個分類器能正確分類第k幅人臉圖像,則Oqk = 1,否則Oqk = 0, rG[1,at-l],qG[r+1,at]; (6c)根據(jù)步驟(6a)得到的基本分類器的經(jīng)驗損和步驟(6b)得到的基 本分類器之間的多樣性Ddiv(Ft,N),計算縮小的約減空間中每一個最佳屬性約減組合的準(zhǔn) 確-多樣評估函數(shù)值: AD(Ft,N) = 1-Aefflp (Ft,N) + ?XDdiv (Ft,N), 其中,w是平衡經(jīng)驗損失和多樣性的參數(shù); (6d)選擇最大的準(zhǔn)確-多樣評估函數(shù)值所對應(yīng)的最佳屬性約減組合。
7.根據(jù)權(quán)利要求1所述的基于粗糙集和集成學(xué)習(xí)的人臉識別方法,其中步驟(8)所述 的利用最佳屬性約減組合重新構(gòu)建訓(xùn)練樣本集,按如下步驟進行: (7a)給出一個最佳屬性約減組合化={Cl,. .,Cj,. .,cn},其中Cj為訓(xùn)練樣本集的第j個條件屬性; (7b)從訓(xùn)練樣本集U中刪除最佳屬性約減組合化中沒有出現(xiàn)的屬性,得到重新構(gòu)建的 訓(xùn)練樣本集歹=,其中5為第k個樣本圖像。
【文檔編號】G06K9/62GK104408468SQ201410704349
【公開日】2015年3月11日 申請日期:2014年11月26日 優(yōu)先權(quán)日:2014年11月26日
【發(fā)明者】焦李成, 郭雨薇, 屈嶸, 王爽, 侯彪, 楊淑媛, 馬文萍, 馬晶晶, 戎凱旋 申請人:西安電子科技大學(xué)