一種鄰域保持判別嵌入人臉識(shí)別方法及系統(tǒng)的制作方法
【專利摘要】一種鄰域保持判別嵌入人臉識(shí)別方法及系統(tǒng),本發(fā)明方法包括以下步驟。S1、對(duì)已有的人臉訓(xùn)練樣本集進(jìn)行初始降維,并根據(jù)訓(xùn)練樣本矩陣確定初始降維訓(xùn)練樣本矩陣。S2、尋找最優(yōu)變換AX1,令二次降維訓(xùn)練樣本矩陣X2=AX1,并獲取二次降維訓(xùn)練樣本集。S3、建立測(cè)試樣本并將其進(jìn)行二次降維獲得二次降維測(cè)試樣本,在二次降維訓(xùn)練樣本中查找與所述二次降維測(cè)試樣本相鄰的樣本,并將占比較高的二次降維訓(xùn)練樣本的類別賦予所述測(cè)試樣本。
【專利說明】一種鄰域保持判別嵌入人臉識(shí)別方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種鄰域保持判別嵌入人臉識(shí)別方法及系統(tǒng),尤其涉及一種基于類別信息的鄰域保持判別嵌入人臉識(shí)別方法及系統(tǒng)。
【背景技術(shù)】
[0002]在許多科學(xué)研究領(lǐng)域中,數(shù)據(jù)都是以高維形式存在的,比如圖像分類、文本分類、語音識(shí)別等,它們的維度(屬性)通??梢赃_(dá)到成百上千維,甚至更高。如何從高維數(shù)據(jù)中挖掘出用戶感興趣的特征,是近年來研究的一個(gè)熱點(diǎn)問題。而由于“維災(zāi)”的影響,也使得高維數(shù)據(jù)挖掘變得異常地困難,必須采用一些特殊的手段進(jìn)行處理。
[0003]人臉識(shí)別是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種識(shí)別技術(shù)。在人臉識(shí)別技術(shù)中,需要把人臉數(shù)據(jù)從高維空間映射到低維子空間。人臉是一種復(fù)雜、多變、高維的模式。盡管人們識(shí)別熟悉的人臉是容易的,但對(duì)機(jī)器來說如何準(zhǔn)確識(shí)別出人臉,仍是一件困難的事情。然而,由于人臉識(shí)別在身份驗(yàn)證、安全系統(tǒng)等方面具有廣泛用途,這一問題吸引眾多的研究者,使其成為計(jì)算機(jī)視覺和模式識(shí)別中一個(gè)重要的研究領(lǐng)域。
[0004]由于原始圖像數(shù)據(jù)的高維性,需要將訓(xùn)練數(shù)據(jù)集投影到低維線性子空間進(jìn)行降維?,F(xiàn)有技術(shù)中的降維方法主要有主成分分析方法和鄰域保持嵌入算法。其中,主成分分析(Principal Component Analysis, PCA)方法是常用的降維方法,是將多個(gè)變量通過線性變換以選出較少個(gè)數(shù)重要變量的一種多元統(tǒng)計(jì)分析方法。但該方法只適合于線性表示的數(shù)據(jù)。He等人提出了鄰域保持嵌入(Neighborhood Preserving Embedding, NPE)算法,該方法適用于流形數(shù)據(jù),已經(jīng)被成功地應(yīng)用到人臉識(shí)別領(lǐng)域。在有監(jiān)督學(xué)習(xí)中,判別信息對(duì)人臉識(shí)別問題是非常重要的。然而,NPE在進(jìn)行線性重構(gòu)時(shí)沒有對(duì)鄰域作類別判斷,忽略了樣本本身的類別信息。因此,該方法也存在一定缺陷。
[0005]鑒于上述原因,需要提供一種在NPE算法基礎(chǔ)上引入判別信息,基于類別信息的鄰域保持判別嵌入人臉識(shí)別方法,使得樣本點(diǎn)的低維坐標(biāo)能夠同時(shí)保持流形的局部幾何結(jié)構(gòu)和分類信息,提高人臉識(shí)別的效率。
【發(fā)明內(nèi)容】
[0006]本發(fā)明提供一種鄰域保持判別嵌入人臉識(shí)別方法,包括以下步驟:
[0007]S1、對(duì)已有的人臉訓(xùn)練樣本集進(jìn)行初始降維,并根據(jù)訓(xùn)練樣本矩陣確定初始降維訓(xùn)練樣本矩陣;
[0008]S2、尋找最優(yōu)變換AX1,令二次降維訓(xùn)練樣本矩陣X2=AX1,并獲取二次降維訓(xùn)練樣本集;
[0009]S3、建立測(cè)試樣本并將其進(jìn)行二次降維獲得二次降維測(cè)試樣本,在二次降維訓(xùn)練樣本中查找與所述二次降維測(cè)試樣本相鄰的樣本,并將占比較高的二次降維訓(xùn)練樣本的類別賦予所述測(cè)試樣本。
[0010]優(yōu)選的,在步驟SI中,若人臉訓(xùn)練樣本集為彳X1,.V,丨U Xi e Rd,yi={l,2,...,(:},進(jìn)行所述初始降維后獲得β
[0011]優(yōu)選的,在步驟SI中’若訓(xùn)練樣本矩陣為乂=^,^,...^」e RDX1,則初始降維訓(xùn)練樣本矩陣為X1=A1X,其中D是樣本的維數(shù),I是樣本數(shù)據(jù)的個(gè)數(shù),c是數(shù)據(jù)的類別數(shù),A1 e Rdxn是利用PCA獲得的投影矩陣。
[0012]優(yōu)選的,在步驟SI中,創(chuàng)建具有分類信息的矩陣.=其中
Ji € I'且當(dāng)yi=j時(shí),^的第j個(gè)分量為1,否則為O。
[0013]優(yōu)選的,在步驟SI中,初始降維采用主成分分析方法。
[0014]優(yōu)選的,在步驟S2中,使得軍卜-寫,#,
【權(quán)利要求】
1.一種鄰域保持判別嵌入人臉識(shí)別方法,其特征在于,包括以下步驟: s1、對(duì)已有的人臉訓(xùn)練樣本集進(jìn)行初始降維,并根據(jù)訓(xùn)練樣本矩陣確定初始降維訓(xùn)練樣本矩陣; s2、尋找最優(yōu)變換AX1,令二次降維訓(xùn)練樣本矩陣X2=AX1,并獲取二次降維訓(xùn)練樣本集; s3、建立測(cè)試樣本并將其進(jìn)行二次降維獲得二次降維測(cè)試樣本,在二次降維訓(xùn)練樣本中查找與所述二次降維測(cè)試樣本相鄰的樣本,并將占比較高的二次降維訓(xùn)練樣本的類別賦予所述測(cè)試樣本。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟SI中,若人臉訓(xùn)練樣本集為
Xi e Rd, Yi = {1,2,...,0},進(jìn)行所述初始降維后獲得
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟SI中,若訓(xùn)練樣本矩陣為X=[X1, x2,..., X1] e RDX1,則初始降維訓(xùn)練樣本矩陣為X1=A1X,其中D是樣本的維數(shù),I是樣本數(shù)據(jù)的個(gè)數(shù),c是數(shù)據(jù)的類別數(shù),A1 e Rdxn是利用PCA獲得的投影矩陣。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟SI中,創(chuàng)建具有分類信息的矩陣
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟SI中,初始降維采用主成分分析方法。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟S2中,使得
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟S2中,所述二次降維訓(xùn)練樣本集為{χVIi1^1 ?Λ = β(Χ?ΜΧ? + !Z1 F 其中 M=(1-W)T(1-W),I 為單位矩陣。* , ,
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,在步驟S3中,利用K近鄰分類器,在二次降維訓(xùn)練樣本中找到K個(gè)和二次降維測(cè)試樣本相鄰的樣本,并挑選占比較高的二次降維訓(xùn)練樣本的類別。
9.一種鄰域保持判別嵌入人臉識(shí)別系統(tǒng),其特征在于,包括預(yù)處理降維模塊、二次降維模塊及分類模塊,所述預(yù)處理降維模塊連接二次降維模塊,所述二次降維模塊連接分類模塊,所述預(yù)處理降維模塊,用于以主成分分析方法對(duì)訓(xùn)練樣本集進(jìn)行初始降維; 所述二次降維模塊,用于對(duì)已進(jìn)行初始降維的訓(xùn)練樣本進(jìn)行二次降維,得到二次降維訓(xùn)練樣本; 所述分類模塊,用于在二次降維訓(xùn)練樣本集中,利用K近鄰分類器,對(duì)二次降維測(cè)試樣本進(jìn)行分類。
【文檔編號(hào)】G06K9/62GK103577839SQ201310625378
【公開日】2014年2月12日 申請(qǐng)日期:2013年11月28日 優(yōu)先權(quán)日:2013年11月28日
【發(fā)明者】張莉, 包興, 趙夢(mèng)夢(mèng), 楊季文, 王邦軍, 何書萍, 李凡長 申請(qǐng)人:蘇州大學(xué)