專利名稱::基于核稀疏表示的人臉識別方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于圖像處理
技術(shù)領(lǐng)域:
,特別是涉及人臉的識別,可用于公共安全,信息安全,金融安全的監(jiān)督和防護。
背景技術(shù):
:人臉識別是比較容易為人們所接受的非侵犯性識別手段,從而成為備受計算機視覺與模式識別等領(lǐng)域關(guān)注的熱點問題。人臉識別技術(shù)的目的是賦予計算機根據(jù)人的面孔辨別人物身份的能力。人臉識別作為一個科學(xué)問題,是一個典型的圖像模式分析,理解與分類的計算機問題,它涉及模式識別,計算機視覺,智能人機交互,圖形學(xué),認知科學(xué)等多個學(xué)科。作為生物特征識別關(guān)鍵技術(shù)之一的人臉識別技術(shù)在公共安全,信息安全,金融等領(lǐng)域具有潛在的應(yīng)用前景。人臉被普遍認為是在圖像識別領(lǐng)域中最有研究價值的物體。這一方面是因為人臉在人類視覺系統(tǒng)中具有顯著的識別能力,另一方面是因為自動人臉識別技術(shù)中有大量重要的應(yīng)用。另外,人臉識別中的技術(shù)問題也涵蓋了物體識別研究中所遇到的問題。物體識別研究中的核心問題就是物體的哪個特征對于識別來說是最重要的或者是最富信息的??紤]到人臉的特殊幾何結(jié)構(gòu)和差異性,那些固定的濾波器,比如下采樣、傅里葉、小波等,就不能使用了,因為它們只對固定的信號有效,比如紋理圖像。取而代之的是那些能夠根據(jù)給出圖像而自適應(yīng)的提取人臉特征的方法,這些技術(shù)包括特征臉、Fisher臉、L鄰lace臉、主分量分析等等。由上述方法提取出來的特征更加利于人臉識別,包括最近鄰和最近子空間在內(nèi)的簡單的分類器都可以利用其進行識別。雖然有眾多的特征提取或選擇的方法,卻很少涉及到討論哪種特征更好或者更壞,對于使用者來說也缺少指導(dǎo)去挑選哪種特征去應(yīng)用。在人臉識別領(lǐng)域,.已經(jīng)付出了大量的努力和關(guān)注去尋找所謂"最優(yōu)"特征。這種需求可能會導(dǎo)致某種重要因素'被模糊化甚至被掩蓋,這些因素可能對整個識別過程中的特征選擇起到重要的作用。比如,不同的特征可能會影響到分類器的選擇,也可能影響到特征維度的確定。為此,AllenY.Yang和YiMa在2007年提出一種用訓(xùn)練圖片對測試圖片進行稀疏表出的方法,根據(jù)壓縮感知的原理求出稀疏表示向量,并進行設(shè)計分類的4方法。該方法說明特征的數(shù)量要比這些特征是如果構(gòu)造的要重要的多。只要特征的數(shù)量足夠多,甚至是隨機選擇特征也能夠進行很好的分類和識別。但是由于該方法求解的問題是一范數(shù)優(yōu)化問題,這樣就不可避免的遇到了針對同比例縮放的樣本無法合理求解系數(shù)向量和準確分類的問題,從而可能導(dǎo)致分類不夠精確。
發(fā)明內(nèi)容本發(fā)明的目的在于克服上述已有技術(shù)的不足,提出了一種基于核稀疏表示的人臉識別方法,以合理求解系數(shù)向量和準確分類的問題,提高分類器的精確。為實現(xiàn)上述目的,本發(fā)明包括如下步驟(1)將訓(xùn)練樣本矩陣^eK,,與測試樣本yeR",通過高斯核非線性映射至核空間,得到映射后的訓(xùn)練樣本矩陣Ce吸"x"和測試樣本/e]R",其中吸表示實數(shù)集;(2)生成一個隨機矩陣及eR"",其中d《",然后將隨機矩陣R與訓(xùn)練樣本矩陣c和測試樣本/相乘進行降維處理,得到降維后訓(xùn)練樣本矩陣。eRrfx"和測試樣本/'e股d,并對該降維后的訓(xùn)練樣本矩陣和測試樣本進行歸一化;(3)對歸一化后的訓(xùn)練樣本矩陣和測試樣本,利用如下優(yōu)化函數(shù)minsubjectto/"=求解最優(yōu)的樣本重構(gòu)系數(shù)向量^,/~為歸一化后的測試樣本,(?為歸一化后的訓(xùn)練樣本矩陣;(4)將求解得到的樣本重構(gòu)系數(shù)向量x,分別代入類別帶通函數(shù)5,:、-.0.-0《w=0,52(x)=000,并用亡與5,(x)相乘,對原測試樣本進行重構(gòu),K為類別總數(shù),",代表第z'類樣本所對應(yīng)系數(shù)的位置,其中/-1,2,…,K,代表樣本類別;(5)計算重構(gòu)后的樣本與原測試樣本的殘差^:(6)將原測試樣本的殘差^代入測試樣本/的類別判定公式<formula>formulaseeoriginaldocumentpage6</formula>求得在K個殘差中尋找的最小值,并將其下標n乍為最終的人臉識別結(jié)果,用identity(/)表示。本發(fā)明與現(xiàn)有方法相比具有以下優(yōu)點1、本方法由于對訓(xùn)練樣本矩陣和測試樣本采用了高斯核非線性映射,克服了求解一范數(shù)優(yōu)化函數(shù)的固有缺陷,即對同比例縮放的樣本無法合理求解樣本的重構(gòu)系數(shù)向量的問題,高了樣本的識別率。2、本方法由于對訓(xùn)練樣本矩陣和測試樣本采用了高斯核非線性映射,相比于原方法,映射后樣本的屬性值就具備了相似度的概念,這樣就能明確地反映出樣本在其特征空間中的位置關(guān)系,以便于分類。圖l是本發(fā)明的流程圖2是本發(fā)明在人工數(shù)據(jù)上與原分類算法的對比結(jié)果圖;圖3是現(xiàn)有ExtendedYaleB數(shù)據(jù)庫中的人臉樣本示意圖。具體實施例方式下面對本發(fā)明的實施例作詳細說明本實施例在以本發(fā)明技術(shù)方案為前提下進行實施,給出了詳細的實施方式和過程,但本發(fā)明的保護范圍不限于下述的實施例。-步驟1:將得到的訓(xùn)練和測試的人臉樣本映射至核空間。(la)輸入的樣本為ExtendedYaleB數(shù)據(jù)庫中的人臉樣本圖片,如圖3所示。該數(shù)據(jù)庫由2414張正面人臉組成,總共有38個類別,其中每一張圖片的尺寸均為192*168,且均經(jīng)過標準化處理。隨機的選取一半的樣本作為訓(xùn)練樣本,另一半作為測試樣本。由于每個類別的樣本數(shù)并不完全一致,所以每個類別平均取32幅圖片作為訓(xùn)練樣本,其余作為測試樣本。(lb)將訓(xùn)練樣本和測試樣本分別映射至核空間,本實施例采用的核函數(shù)為高斯徑向基核,其核函數(shù)的表示式如下A=exp(-/(2*/2))其中"、v均為樣本,A:為核映射結(jié)果,P為高斯徑向基核的參數(shù)。關(guān)于該核參數(shù)的選取,本實施例采用十倍交叉驗證的方法,將樣本均分為十等份,九份訓(xùn)練,一份測試。測試時,選擇將樣本映射至實驗中的最低維數(shù),選出最優(yōu)參數(shù)。推廣至其他維數(shù)時,則在當前最優(yōu)參數(shù)附近挑選即可。原訓(xùn)練IT本矩陣^sIT"x",測試樣本ye!T",通過映射后得到的訓(xùn)練樣本矩陣為CeR"x",測試樣本為/eR",其中,m為原樣本維數(shù),在本實施例中為32256,n為訓(xùn)練樣本的個數(shù)。步驟2:求解樣本重構(gòu)系數(shù)向量^。(2a)根據(jù)降維需要生成一個隨機矩陣及eR"",其中^/",然后將隨機矩陣R與訓(xùn)練樣本矩陣C和測試樣本/相乘,以進行降維處理,得到降維后訓(xùn)練樣本矩陣(?gIRrfx"和測試樣本/~eR";(2b)將降維后的訓(xùn)練樣本矩陣和測試樣本同時除以這兩者中的最大值,完成對降維后訓(xùn)練樣本矩陣和測試樣本的歸一化處理;(2c)對歸一化后的訓(xùn)練樣本矩陣和測試樣本,利用如下優(yōu)化函數(shù)-min14subjecttof=求解最優(yōu)樣本重構(gòu)系數(shù)向量^,該向量是歸一化后的訓(xùn)練樣本矩陣對測試樣本的最稀疏表示,其中/~為歸一化后的測試樣本,(?為歸一化后的訓(xùn)練樣本矩陣。步驟3:對測試樣本進行識別。(3a)將求解得到的樣本重構(gòu)系數(shù)向量^,分別代入類別帶通函數(shù)5,.,、-_0'-0'0a2,…Aw=0007并用(?與5,(x)相乘,對原測試樣本進行重構(gòu),K為類別總數(shù),A代表第/類樣本所對應(yīng)系數(shù)的位置,其中/=1,2,,K,代表樣本類別,這樣就得到K個測試樣本的重構(gòu)結(jié)果(5,(勾,其中/=1,2,,K;(3b)計算重構(gòu)后的樣本與歸一化后測試樣本的殘差C-。(/)=||/~-^,0)||2(3c)將原測試樣本的殘差^代入測試樣本/的類別判定公式identity(/)=argmin,r,(/)求得在K個殘差中尋找的最小值,并將其下標z'作為最終的人臉識別結(jié)果,用identity(Z)表示。本發(fā)明的效果通過以下仿真進一步說明1、仿真條件與內(nèi)容本發(fā)明首先采用人工數(shù)據(jù)進行實驗,人工數(shù)據(jù)選取的是分別以(0,0)、(0,5)和(5,5)為中心的三類高斯正態(tài)分布數(shù)據(jù),訓(xùn)練樣本由每類各50個樣本組成,測試樣本由每類各20個樣本組成,如圖2(a)和圖2(b)所示。使用ExtendedYaleB數(shù)據(jù)庫進行人臉識別實驗,該數(shù)據(jù)庫由2414張正面人臉組成,總共有38個類別。其中每一張圖片的尺寸均為192*168,且均經(jīng)過標準化處理。每個類別中的人臉圖片均在人工控制的不同光照強度和角度下拍攝獲得,如圖3所示。在實驗中,我們隨機的選取一半的樣本作為訓(xùn)練樣本,另一半作為測試樣本。由于每個類別的樣本數(shù)并不完全一致,所以每個類別取32幅圖片作為訓(xùn)練樣本,其余作為測試樣本。軟件平臺為MATLAB7.0。2、仿真結(jié)果本發(fā)明首先采用人工數(shù)據(jù)進行實驗,為的是說明在同比例縮放的樣本分布情況下,現(xiàn)有方法在分類吋的缺陷,以為在高維樣本實驗中的良好效果提供直觀的實驗依據(jù),實驗結(jié)果如圖2所示。其中圖2(a)為訓(xùn)練樣本的分布示意圖,圖2(b)為測試樣本,圖2(c)為現(xiàn)有稀疏表示分類方法的實驗結(jié)果,圖2(d)為本發(fā)明核稀疏表示分類方法的實驗結(jié)果。從圖2(c)中可以明顯看出,現(xiàn)有方法在低維樣本的分類中存在明顯缺陷,而圖2(d)所示的本發(fā)明引入高斯核映射之后,測試樣本得到了正確的分類。對于ExtendedYaleB數(shù)據(jù)庫的人臉識別實驗,為了進行對比,本實驗將人臉樣本分別降至20、30、56、120和504維,進行仿真比較,其實驗結(jié)果如表1所示。表l兩種方法在不同維數(shù)上的識別率對比<table>tableseeoriginaldocumentpage9</column></row><table>從表1可以看出,本發(fā)明方法在實驗中各個維度上的識別率均比現(xiàn)有方法要好。綜上,現(xiàn)有方法的應(yīng)用使得特征選擇的作用變得不再重要,隨機降維也能在人臉識別中得到好的實驗結(jié)果。本發(fā)明方法對訓(xùn)練樣本矩陣和測試樣本采用了高斯核非線性映射,在實驗中可以看到,在低維的人工數(shù)據(jù)和在人臉數(shù)據(jù)庫上的實驗效果都要優(yōu)于現(xiàn)有方法。權(quán)利要求1、一種基于核稀疏表示的人臉識別方法,包括步驟(1)將訓(xùn)練樣本矩陣id="icf0001"file="A2009100240520002C1.tif"wi="18"he="4"top="36"left="73"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>與測試樣本id="icf0002"file="A2009100240520002C2.tif"wi="15"he="4"top="37"left="118"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>通過高斯核非線性映射至核空間,得到映射后的訓(xùn)練樣本矩陣id="icf0003"file="A2009100240520002C3.tif"wi="16"he="3"top="48"left="104"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>和測試樣本id="icf0004"file="A2009100240520002C4.tif"wi="12"he="3"top="48"left="143"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>其中id="icf0005"file="A2009100240520002C5.tif"wi="3"he="3"top="49"left="167"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>表示實數(shù)集;(2)生成一個隨機矩陣id="icf0006"file="A2009100240520002C6.tif"wi="20"he="4"top="67"left="76"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>其中d<<n,然后將隨機矩陣R與訓(xùn)練樣本矩陣C和測試樣本l相乘進行降維處理,得到降維后訓(xùn)練樣本矩陣id="icf0007"file="A2009100240520002C7.tif"wi="16"he="4"top="78"left="153"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>和測試樣本id="icf0008"file="A2009100240520002C8.tif"wi="13"he="4"top="89"left="45"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>并對該降維后的訓(xùn)練樣本矩陣和測試樣本進行歸一化;(3)對歸一化后的訓(xùn)練樣本矩陣和測試樣本,利用如下優(yōu)化函數(shù)<mathsid="math0001"num="0001"><math><![CDATA[<mrow><mi>min</mi><msub><mrow><mo>|</mo><mo>|</mo><mi>x</mi><mo>|</mo><mo>|</mo></mrow><mn>1</mn></msub><mi>subjectto</mi><mover><mi>l</mi><mo>~</mo></mover><mo>=</mo><mover><mi>C</mi><mo>~</mo></mover><mi>x</mi></mrow>]]></math></maths>求解最優(yōu)的樣本重構(gòu)系數(shù)向量x,id="icf0010"file="A2009100240520002C10.tif"wi="2"he="4"top="120"left="102"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>為歸一化后的測試樣本,id="icf0011"file="A2009100240520002C11.tif"wi="3"he="4"top="120"left="153"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>為歸一化后的訓(xùn)練樣本矩陣;(4)將求解得到的樣本重構(gòu)系數(shù)向量x,分別代入類別帶通函數(shù)δi<mathsid="math0002"num="0002"><math><![CDATA[<mrow><msub><mi>δ</mi><mn>1</mn></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mfencedopen='['close=']'><mtable><mtr><mtd><msub><mi>α</mi><mn>0</mn></msub></mtd></mtr><mtr><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mn>0</mn></mtd></mtr></mtable></mfenced><mo>,</mo><msub><mi>δ</mi><mn>2</mn></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mfencedopen='['close=']'><mtable><mtr><mtd><mn>0</mn></mtd></mtr><mtr><mtd><msub><mi>α</mi><mn>2</mn></msub></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mn>0</mn></mtd></mtr></mtable></mfenced><mo>,</mo><mo>.</mo><mo>.</mo><mo>.</mo><mo>,</mo><msub><mi>δ</mi><mi>K</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>=</mo><mfencedopen='['close=']'><mtable><mtr><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mn>0</mn></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><mo>.</mo></mtd></mtr><mtr><mtd><msub><mi>α</mi><mi>K</mi></msub></mtd></mtr></mtable></mfenced></mrow>]]></math></maths>并用id="icf0013"file="A2009100240520002C13.tif"wi="3"he="4"top="177"left="32"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>與δi(x)相乘,對原測試樣本進行重構(gòu),得到重構(gòu)后的樣本id="icf0014"file="A2009100240520002C14.tif"wi="14"he="5"top="177"left="147"img-content="drawing"img-format="tif"orientation="portrait"inline="yes"/>K為類別總數(shù),αi代表第i類樣本所對應(yīng)系數(shù)的位置,其中i=1,2,…,K,代表樣本類別;(5)計算重構(gòu)后的樣本與歸一化后測試樣本的殘差ri<mathsid="math0003"num="0003"><math><![CDATA[<mrow><msub><mi>r</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>l</mi><mo>)</mo></mrow><mo>=</mo><msub><mrow><mo>|</mo><mo>|</mo><mover><mi>l</mi><mo>~</mo></mover><mo>-</mo><mover><mi>C</mi><mo>~</mo></mover><msub><mi>δ</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>x</mi><mo>)</mo></mrow><mo>|</mo><mo>|</mo></mrow><mn>2</mn></msub></mrow>]]></math></maths>(6)將原測試樣本的殘差ri代入測試樣本l的類別判定公式identity(l)=argminiri(l)求得在K個殘差中尋找的最小值,并將其下標i作為最終的人臉識別結(jié)果,用identity(l)表示。2、根據(jù)權(quán)利要求1所述的人臉識別方法,其特征在于,所述的將訓(xùn)練樣本矩陣Je吸""x"與測試樣本j;e股",通過高斯核非線性映射至核空間,其步驟為(2a)將訓(xùn)練樣本矩陣J中的樣本代入如下高斯徑向基核函數(shù)-得到的映射結(jié)果作為新的訓(xùn)練樣本矩陣C,其中"、v為任意兩個訓(xùn)練樣本,A為核映射結(jié)果,/為高斯徑向基核的參數(shù);(2b)把訓(xùn)練樣本矩陣^中的每個樣本與測試樣本y代入上述核函數(shù),得到的映射結(jié)果作為新的測試樣本/。3、根據(jù)權(quán)利要求1所述的人臉識別方法,其特征在于,所述的對該降維后的訓(xùn)練樣本矩陣和測試樣本進行歸一化,是將降維后的訓(xùn)練樣本矩陣和測試樣本同時除以這兩者中的最大值,得到標準化的數(shù)據(jù)以利于分類。全文摘要本發(fā)明公開了一種基于核稀疏表示的人臉識別方法,主要解決現(xiàn)有方法無法合理求解樣本重構(gòu)系數(shù)向量的問題。實現(xiàn)步驟為(1)將訓(xùn)練樣本矩陣和測試樣本映射至核空間,然后將映射后的樣本隨機降維至所需要的維度,并對其進行歸一化處理;(2)求解歸一化后的訓(xùn)練樣本矩陣與測試樣本之間的樣本重構(gòu)系數(shù)向量,將其代入類別帶通函數(shù),對原測試樣本進行重構(gòu);(3)求得各類別重構(gòu)樣本與原測試樣本的殘差,并代入類別判定公式得到識別結(jié)果。本發(fā)明提高了在人臉識別應(yīng)用中的精度,同時將應(yīng)用范圍推廣至低維樣本,使其更具有通用性,可用于公共安全,信息安全,金融安全的監(jiān)督和防護。文檔編號G06K9/00GK101667246SQ20091002405公開日2010年3月10日申請日期2009年9月25日優(yōu)先權(quán)日2009年9月25日發(fā)明者周偉達,周宏杰,莉張,哲晏,焦李成申請人:西安電子科技大學(xué)