国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于稀疏投影二值編碼的人臉識(shí)別方法及裝置與流程

      文檔序號(hào):12125897閱讀:266來源:國(guó)知局
      基于稀疏投影二值編碼的人臉識(shí)別方法及裝置與流程

      本發(fā)明涉及生物識(shí)別技術(shù),尤其涉及一種基于稀疏投影二值編碼的人臉識(shí)別方法及裝置。



      背景技術(shù):

      從原始社會(huì)到現(xiàn)今的信息社會(huì),從社會(huì)從公有到私有的過程中,對(duì)于個(gè)人隱私的保護(hù)需求與日俱增。越來越多的領(lǐng)域需要用到可靠的生物識(shí)別技術(shù),而人臉作為一種特殊的生物特征,具有特征唯一、相對(duì)穩(wěn)定、獲取簡(jiǎn)便且具備非接觸性等顯著優(yōu)點(diǎn)而受到廣泛關(guān)注。

      現(xiàn)有技術(shù)中的人臉識(shí)別算法主要包括基于實(shí)數(shù)值表示人臉特征的人臉識(shí)別方法和基于稠密二值特征向量表示人臉特征的人臉識(shí)別方法。其中,基于實(shí)數(shù)值表示人臉特征的人臉識(shí)別方法是指利用預(yù)先設(shè)計(jì)的目標(biāo)函數(shù)從輸入的人臉圖像中提取基于實(shí)數(shù)值表示的人臉特征,然后利用模式識(shí)別方法判斷輸入圖像屬于哪個(gè)人。基于稠密二值特征向量表示人臉特征的人臉識(shí)別方法是指將原始的基于實(shí)數(shù)值表示的人臉特征轉(zhuǎn)化為基于稠密二值特征向量表示的人臉特征,使用的投影矩陣是稠密投影矩陣(即矩陣中的絕大部分元素為非0元素),最后采用模式識(shí)別方法判斷輸入圖像屬于哪個(gè)人。

      但是,對(duì)于基于實(shí)數(shù)值表示人臉特征的人臉識(shí)別方法,一方面需要大量的存儲(chǔ)單元、計(jì)算速度慢,一般的計(jì)算機(jī)或移動(dòng)設(shè)備難以滿足其存儲(chǔ)和計(jì)算需求;另一方面,該方法對(duì)于人臉圖像中的局部變化敏感,當(dāng)同一張人臉圖像發(fā)生變化變化的程度超過某一閾值時(shí),分類器就會(huì)將兩個(gè)原本屬于同一個(gè)人的特征識(shí)別為不同人。在基于稠密二值特征向量表示人臉特征的人臉識(shí)別方法中,由于在二值量化過程中始終存在量化誤差的影響,當(dāng)量化后的二值特征向量的維度小于原始特征向量的維度時(shí),很可能導(dǎo)致大量判別信息的丟失,從而影響二值特征向量描述人臉圖像特征的能力;此外,基于稠密二值特征向量表示人臉特征的人臉識(shí)別方法還存在訓(xùn)練樣本的過擬合問題,而過擬合會(huì)導(dǎo)致人臉識(shí)別方法在計(jì)算過程中對(duì)數(shù)據(jù)的適應(yīng)性差,從而影響人臉識(shí)別方法的性能。



      技術(shù)實(shí)現(xiàn)要素:

      本發(fā)明提供一種基于稀疏投影二值編碼的人臉識(shí)別方法及裝置,以克服現(xiàn)有技術(shù)中的人臉識(shí)別方法識(shí)別速度慢、訓(xùn)練樣本過度擬合及對(duì)數(shù)據(jù)的適應(yīng)性差的技術(shù)問題。

      本發(fā)明提供一種基于稀疏投影二值編碼的人臉識(shí)別方法,包括:

      獲取訓(xùn)練集中各訓(xùn)練樣本的各像素點(diǎn)對(duì)應(yīng)的第一像素差值向量;其中,所述訓(xùn)練樣本為人臉圖像,所述訓(xùn)練集中包括多幅不同的人臉圖像;

      根據(jù)所述第一像素差值向量獲取滿足基于稀疏投影矩陣的第一目標(biāo)函數(shù)的各所述像素點(diǎn)對(duì)應(yīng)的第一二值特征向量;

      對(duì)所有的所述第一二值特征向量進(jìn)行聚類,得到多個(gè)聚類中心-單詞;

      將各所述訓(xùn)練樣本相對(duì)應(yīng)的第一二值特征向量組成第一矩陣,采用所述單詞對(duì)所述第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,根據(jù)所述第一線性重建結(jié)果得到第一向量;其中,每個(gè)訓(xùn)練樣本對(duì)應(yīng)一個(gè)第一向量;

      獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二二值特征向量,并將各所述第二二值特征向量組成第二矩陣,采用所述單詞對(duì)所述第二矩陣進(jìn)行線性重建,得到第二線性重建結(jié)果,根據(jù)所述第二線性重建結(jié)果得到第二向量;

      根據(jù)所述第一向量和所述第二向量,得到人臉識(shí)別結(jié)果。

      如上所述的方法,所述第一目標(biāo)函數(shù)如公式一所示:

      其中,R為稀疏投影矩陣,|R|0≤m表示稀疏投影矩陣R中非零元素的個(gè)數(shù)小于等于m個(gè),B為第一二值特征向量,參數(shù)m與所述稀疏投影矩陣R的稀疏程度具有關(guān)聯(lián)關(guān)系,m為正整數(shù),X為所述第一像素差值向量。

      如上所述的方法,所述將各所述訓(xùn)練樣本相對(duì)應(yīng)的第一二值特征向量組成第一矩陣,采用所述單詞對(duì)所述第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,根據(jù)所述第一線性重建結(jié)果得到第一向量;其中,每個(gè)訓(xùn)練樣本對(duì)應(yīng)一個(gè)第一向量,包括:

      采用所述單詞對(duì)所述第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,所述第一線性重建結(jié)果的表達(dá)式如公式二所示:

      Bi=ai1S1+ai2S2+...+aikSk 公式二;

      其中,Bi為第i個(gè)訓(xùn)練樣本的各第一二值特征向量組成的第一矩陣,Sk為第k個(gè)單詞,aik為在第i個(gè)訓(xùn)練樣本的對(duì)應(yīng)的所述第一矩陣采用所述單詞進(jìn)行線性重建時(shí)第k個(gè)單詞的權(quán)重;

      將所述第一線性重建結(jié)果的表達(dá)式中的各所述單詞對(duì)應(yīng)的權(quán)重組成第一向量(ai1,ai2,……,aik)。

      如上所述的方法,所述獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二二值特征向量,并將各所述第二二值特征向量組成第二矩陣,采用所述單詞對(duì)所述第二矩陣進(jìn)行線性重建,得到第二線性重建結(jié)果,根據(jù)所述第二線性重建結(jié)果得到第二向量,包括:

      獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二像素差值向量,并根據(jù)所述第二像素差值向量獲取滿足所述第一目標(biāo)函數(shù)的待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的所述第二二值特征向量;

      將各所述第二二值特征向量組成所述第二矩陣,并將所述第二矩陣采用所述單詞進(jìn)行線性重建,得到所述第二線性重建結(jié)構(gòu),所述第二線性重建結(jié)果的表達(dá)式如公式三所示:

      B測(cè)試=b1S1+b2S2+...+bkSk 公式三;

      其中,B測(cè)試為各所述第二二值特征向量組成的第二矩陣,Sk為第k個(gè)單詞,bk為所述第二矩陣采用所述單詞進(jìn)行線性重建時(shí)第k個(gè)單詞的權(quán)重;

      將所述第二線性重建結(jié)果的表達(dá)式中的各所述單詞對(duì)應(yīng)的權(quán)重組成所述第二向量(b1,b2,……,bk)。

      如上所述的方法,所述根據(jù)所述第一向量和所述第二向量,得到人臉識(shí)別結(jié)果,包括:

      將所述第一向量和所述第二向量輸入分類器;

      獲取所述分類器返回的第二向量與各所述第一向量的歐式距離;

      將與第二向量的歐式距離最短的第一向量對(duì)應(yīng)的訓(xùn)練樣本所對(duì)應(yīng)的人臉圖像識(shí)別為待檢測(cè)人臉的圖像。

      如上所述的方法,獲取訓(xùn)練集中各訓(xùn)練樣本的各像素點(diǎn)對(duì)應(yīng)的第一像素差值向量,包括:

      將各訓(xùn)練樣本劃分為多個(gè)塊;

      以每個(gè)塊中的每個(gè)像素點(diǎn)為第一中心像素點(diǎn),以r為半徑,得到所述第一中心像素點(diǎn)的第一鄰域像素點(diǎn),并按照順時(shí)針方向,將所述第一鄰域像素點(diǎn)的像素值與所述第一中心像素點(diǎn)的像素值進(jìn)行差值運(yùn)算,得到長(zhǎng)度為(2×r+1)×(2×r+1)-1維的第一像素差值向量;

      獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二像素差值向量,包括:

      將所述待檢測(cè)人臉的圖像劃分為多個(gè)塊;

      以每個(gè)塊中的每個(gè)像素點(diǎn)為第二中心像素點(diǎn),以r為半徑,得到所述第二中心像素點(diǎn)的第二鄰域像素點(diǎn),并按照順時(shí)針方向,將所述第二鄰域像素點(diǎn)的像素值與所述第二中心像素點(diǎn)的像素值進(jìn)行差值運(yùn)算,得到長(zhǎng)度為(2×r+1)×(2×r+1)-1維的第二像素差值向量;

      其中,r為正整數(shù)。

      如上所述的方法,所述根據(jù)所述第一像素差值向量獲取滿足基于稀疏投影矩陣的第一目標(biāo)函數(shù)的各所述像素點(diǎn)對(duì)應(yīng)的第一二值特征向量,包括:

      引入R的代理矩陣S,將所述第一目標(biāo)函數(shù)變換為第二目標(biāo)函數(shù),所述第二目標(biāo)函數(shù)如公式四所示:

      其中,變量α表示代理矩陣S的懲罰因子,用以平衡公式四中和這兩項(xiàng)的變量,|S|0表示代理矩陣S中非0元素的個(gè)數(shù),參數(shù)m與所述稀疏投影矩陣R的稀疏程度具有關(guān)聯(lián)關(guān)系;表示代理矩陣S與二值編碼B之間的量化誤差,表示代理矩陣S與R之間的誤差;

      對(duì)所述第二目標(biāo)函數(shù)進(jìn)行求解,得到所述第一二值特征向量。

      如上所述的方法,所述對(duì)所述第二目標(biāo)函數(shù)進(jìn)行求解,得到所述第一二值特征向量,包括:

      將所述第二目標(biāo)函數(shù)中的S和B隨機(jī)賦予初始值S0和B0,并固定所述第二目標(biāo)函數(shù)中的S和B,更新所述第二目標(biāo)函數(shù)中的R,得到R1,具體為:

      將所述第二目標(biāo)函數(shù)改成寫第一表達(dá)式,所述第一表達(dá)式如公式五所示:

      其中,C1=SX,為固定值;

      求解第一表達(dá)式,得到R1,具體為:

      通過公式六或公式七得到R1

      其中,thrm表示將得到的矩陣中的最大的m個(gè)元素保留,其余的元素置0;Rt+1表示利用公式六第(t+1)次迭代得到的解,Rt表示利用公式六上一次(即第(t)次)迭代的解,當(dāng)?shù)螖?shù)為N時(shí),利用公式六得到的解收斂,停止迭代,此時(shí)得到的RN=R1,其中R1表示對(duì)所述第二目標(biāo)函數(shù)求解時(shí),第一次迭代得到的R;

      R1=thrm(S) 公式七;

      其中,R1表示對(duì)所述第二目標(biāo)函數(shù)求解時(shí),第一次迭代得到的R。

      將所述第二目標(biāo)函數(shù)中的B賦予初始值B0,將所述第二目標(biāo)函數(shù)中的R賦為R1,并固定所述第二目標(biāo)函數(shù)中的B和R,更新所述第二目標(biāo)函數(shù)中的S,得到S1,具體為:

      將所述第二目標(biāo)函數(shù)改成寫第二表達(dá)式,所述第二表達(dá)式如公式八所示:

      其中,C2=(B+αRX)/(1+α)為固定值;

      求解第二表達(dá)式,得到S1,具體為:

      通過公式九求解S1

      對(duì)進(jìn)行奇異值分解得到U,V:S1=VUT......公式九;

      其中,S1表示對(duì)第二目標(biāo)函數(shù)求解時(shí),第一次迭代得到的S;

      將所述第二目標(biāo)函數(shù)中的S賦為S1,將所述第二目標(biāo)函數(shù)中的R賦為R1,并固定所述第二目標(biāo)函數(shù)中的S和R,更新所述第二目標(biāo)函數(shù)中的B,得到B1,具體為:

      將所述第二目標(biāo)函數(shù)改成寫第三表達(dá)式,所述第三表達(dá)式如公式十所示:

      其中,C3=SX,為固定值;

      求解第三表達(dá)式,得到B1,具體為:

      通過公式十一得到B1

      B=sign(C3)=sign(SX) 公式十一;

      其中,sign(*)為符號(hào)函數(shù),當(dāng)自變量*大于0時(shí),sign(*)函數(shù)輸出1,否則,sign(*)函數(shù)輸出0,B1表示對(duì)所述第二目標(biāo)函數(shù)求解時(shí),第一次迭代得到的B,自變量為矩陣C3中的元素;

      將所述第二目標(biāo)函數(shù)中的S賦為S1,將所述第二目標(biāo)函數(shù)中的B賦為和B1,并固定所述第二目標(biāo)函數(shù)中的S和B,更新所述第二目標(biāo)函數(shù)中的R,得到R2;

      將所述第二目標(biāo)函數(shù)中的B賦為B1,將所述第二目標(biāo)函數(shù)中的R賦為R2,并固定所述第二目標(biāo)函數(shù)中的B和R,更新所述第二目標(biāo)函數(shù)中的S,得到S2;

      將所述第二目標(biāo)函數(shù)中的S賦為S2,將所述第二目標(biāo)函數(shù)中的R賦為R2,并固定所述第二目標(biāo)函數(shù)中的S和R,更新所述第二目標(biāo)函數(shù)中的B,得到B2;

      重復(fù)執(zhí)行將所述第二目標(biāo)函數(shù)中的S賦為Sm-1,將所述第二目標(biāo)函數(shù)中的B賦為和Bm-1,并固定所述第二目標(biāo)函數(shù)中的S和B,更新所述第二目標(biāo)函數(shù)中的R,得到Rm;將所述第二目標(biāo)函數(shù)中的B賦為Bm-1,將所述第二目標(biāo)函數(shù)中的R賦為Rm,并固定所述第二目標(biāo)函數(shù)中的B和R,更新所述第二目標(biāo)函數(shù)中的S,得到Sm;將所述第二目標(biāo)函數(shù)中的S賦為Sm,將所述第二目標(biāo)函數(shù)中的R賦為Rm,并固定所述第二目標(biāo)函數(shù)中的S和R,更新所述第二目標(biāo)函數(shù)中的B,得到Bm的操作,直至完成M次迭代,第M次迭代得到的BM即為所述滿足第一目標(biāo)函數(shù)的各所述像素點(diǎn)對(duì)應(yīng)的第一二值特征向量;其中,m代表第m次迭代,所述m、M均為正整數(shù)。

      本發(fā)明還提供一種基于稀疏投影二值編碼的人臉識(shí)別裝置,包括:

      計(jì)算單元,所述計(jì)算單元用于獲取訓(xùn)練集中各訓(xùn)練樣本的各像素點(diǎn)對(duì)應(yīng)的第一像素差值向量;其中,所述訓(xùn)練樣本為人臉圖像,所述訓(xùn)練集中包括多幅不同的人臉圖像;

      所述計(jì)算單元還用于根據(jù)所述第一像素差值向量獲取滿足基于稀疏投影矩陣的第一目標(biāo)函數(shù)的各所述像素點(diǎn)對(duì)應(yīng)的第一二值特征向量;

      聚類單元,所述聚類單元對(duì)所有的所述第一二值特征向量進(jìn)行聚類,得到多個(gè)聚類中心-單詞;

      第一向量獲取單元,所述第一向量獲取單元用于將各所述訓(xùn)練樣本相對(duì)應(yīng)的第一二值特征向量組成第一矩陣,采用所述單詞對(duì)所述第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,根據(jù)所述第一線性重建結(jié)果得到第一向量;其中,每個(gè)訓(xùn)練樣本對(duì)應(yīng)一個(gè)第一向量;

      第二向量獲取單元,所述第二向量獲取單元用于獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二二值特征向量,并將各所述第二二值特征向量組成第二矩陣,采用所述單詞對(duì)所述第二矩陣進(jìn)行線性重建,得到第二線性重建結(jié)果,根據(jù)所述第二線性重建結(jié)果得到第二向量;

      識(shí)別單元,所述識(shí)別單元用于根據(jù)所述第一向量和所述第二向量,得到人臉識(shí)別結(jié)果。

      本發(fā)明提供一種基于稀疏投影二值編碼的人臉識(shí)別方法及裝置。本發(fā)明提供的基于稀疏投影二值編碼的人臉識(shí)別方法,包括獲取訓(xùn)練集中各訓(xùn)練樣本的各像素點(diǎn)對(duì)應(yīng)的第一像素差值向量;其中,訓(xùn)練樣本為人臉圖像,訓(xùn)練集中包括多幅不同的人臉圖像;根據(jù)第一像素差值向量獲取滿足基于稀疏投影矩陣的第一目標(biāo)函數(shù)的各像素點(diǎn)對(duì)應(yīng)的第一二值特征向量;對(duì)所有的第一二值特征向量進(jìn)行聚類,得到多個(gè)聚類中心-單詞;將各訓(xùn)練樣本相對(duì)應(yīng)的第一二值特征向量組成第一矩陣,采用單詞對(duì)第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,根據(jù)第一線性重建結(jié)果得到第一向量;其中,每個(gè)訓(xùn)練樣本對(duì)應(yīng)一個(gè)第一向量;獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二二值特征向量,并將各第二二值特征向量組成第二矩陣,采用單詞對(duì)第二矩陣進(jìn)行線性重建,得到第二線性重建結(jié)果,根據(jù)第二線性重建結(jié)果得到第二向量,根據(jù)第一向量和第二向量,得到人臉識(shí)別結(jié)果。本實(shí)施例的基于稀疏投影二值編碼的人臉識(shí)別方法采用采用稀疏投影矩陣對(duì)實(shí)值表示的像素差值向量進(jìn)行編碼得到二值特征向量,并對(duì)二值特征向量進(jìn)行聚類得到單詞,采用單詞線性重建每幅人臉圖像對(duì)應(yīng)的二值特征向量組成的矩陣,識(shí)別速度快,解決了訓(xùn)練樣本過度擬合的問題,且對(duì)數(shù)據(jù)的適應(yīng)性好,提高了人臉識(shí)別方法的識(shí)別人臉的準(zhǔn)確性和快速性。

      附圖說明

      為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

      圖1為本發(fā)明提供的基于稀疏投影二值編碼的人臉識(shí)別方法實(shí)施例一的流程圖;

      圖2為本發(fā)明的第一像素差值向量獲取示意圖;

      圖3為本發(fā)明提供的基于稀疏投影二值編碼的人臉識(shí)別方法實(shí)施例二的流程圖;

      圖4為本發(fā)明提供的基于稀疏投影二值編碼的人臉識(shí)別裝置的結(jié)構(gòu)示意圖。

      具體實(shí)施方式

      為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

      圖1為本發(fā)明提供的基于稀疏投影二值編碼的人臉識(shí)別方法實(shí)施例一的流程圖,圖2為本發(fā)明的第一像素差值向量獲取示意圖。

      如圖1~2所示,本實(shí)施例的方法可以包括:

      S101、獲取訓(xùn)練集中各訓(xùn)練樣本的各像素點(diǎn)對(duì)應(yīng)的第一像素差值向量;其中,訓(xùn)練樣本為人臉圖像,訓(xùn)練集中包括多幅不同的人臉圖像;

      S102、根據(jù)第一像素差值向量獲取滿足基于稀疏投影矩陣的第一目標(biāo)函數(shù)的各像素點(diǎn)對(duì)應(yīng)的第一二值特征向量;

      S103、對(duì)所有的第一二值特征向量進(jìn)行聚類,得到多個(gè)聚類中心-單詞;

      S104、將各訓(xùn)練樣本相對(duì)應(yīng)的第一二值特征向量組成第一矩陣,采用單詞對(duì)第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,根據(jù)第一線性重建結(jié)果得到第一向量;其中,每個(gè)訓(xùn)練樣本對(duì)應(yīng)一個(gè)第一向量;

      S105、獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二二值特征向量,并將各第二二值特征向量組成第二矩陣,采用單詞對(duì)第二矩陣進(jìn)行線性重建,得到第二線性重建結(jié)果,根據(jù)第二線性重建結(jié)果得到第二向量;

      S106、根據(jù)第一向量和第二向量,得到人臉識(shí)別結(jié)果。

      對(duì)于步驟S101,事先獲取大量的不同人臉圖像組成訓(xùn)練集,訓(xùn)練集中每一張人臉圖像稱為訓(xùn)練樣本。

      訓(xùn)練集建成后,獲取訓(xùn)練集中各訓(xùn)練樣本的各像素點(diǎn)對(duì)應(yīng)的第一像素差值向量,具體為:將各訓(xùn)練樣本劃分為多個(gè)塊;以每個(gè)塊中的每個(gè)像素點(diǎn)為第一中心像素點(diǎn),以r為半徑,得到第一中心像素點(diǎn)的第一鄰域像素點(diǎn),并按照順時(shí)針方向,將第一鄰域像素點(diǎn)的像素值與第一中心像素點(diǎn)的像素值進(jìn)行差值運(yùn)算,得到長(zhǎng)度為(2×r+1)×(2×r+1)-1維的第一像素差值向量;優(yōu)選地,r取3。為了清楚的解釋順時(shí)針方向,本實(shí)施例中采用r=2說明順時(shí)針方向的含義,如圖2所示,圖2中帶箭頭虛線的路徑即為順時(shí)針方向,每個(gè)方塊代表一個(gè)像素點(diǎn),A代表第一中心像素點(diǎn),沿該箭頭虛線方向依次將第一鄰域像素點(diǎn)的像素值與第一中心像素點(diǎn)的像素值分別進(jìn)行差值運(yùn)算,組成24維的第一像素差值向量。其中,第一鄰域像素點(diǎn)的個(gè)數(shù)也是(2×r+1)×(2×r+1)-1個(gè)。

      該步驟中,本領(lǐng)域技術(shù)人員可以理解的是,當(dāng)r的值選定后,由于訓(xùn)練樣本被分成的多個(gè)塊,每個(gè)塊中會(huì)有許多個(gè)邊緣像素點(diǎn)的第一鄰域像素點(diǎn)的個(gè)數(shù)不足(2×r+1)×(2×r+1)-1個(gè),為了使得到的第一像素差值向量的維數(shù)相同,將每個(gè)塊中第一鄰域像素點(diǎn)的個(gè)數(shù)不足(2×r+1)×(2×r+1)-1個(gè)的邊緣像素點(diǎn)舍棄。

      對(duì)于步驟S102,在得到第一像素差值向量后,根據(jù)第一像素差值向量獲取滿足基于稀疏投影矩陣的第一目標(biāo)函數(shù)的各像素點(diǎn)對(duì)應(yīng)的第一二值特征向量。在本實(shí)施例中,第一目標(biāo)函數(shù)如公式一所示:

      其中,R為稀疏投影矩陣,|R|0≤m表示稀疏投影矩陣R中非零元素的個(gè)數(shù)小于等于m個(gè),B為第一二值特征向量,參數(shù)m與稀疏投影矩陣R的稀疏程度具有關(guān)聯(lián)關(guān)系,m為正整數(shù),X為第一像素差值向量。

      其中,m的取值規(guī)則為,矩陣中所有元素的個(gè)數(shù)的4%~6%。

      采用稀疏投影矩陣對(duì)第一像素差值向量進(jìn)行編碼,得到的量化后的第一二值特征向量的維度遠(yuǎn)高于第一像素差值向量的維度,因此,能夠最小化第一像素差值向量和第一二值特征向量之間的量化誤差,可以提升第一二值特征向量描述人臉圖像的能力。而且,采用稀疏投影矩陣對(duì)第一像素差值向量進(jìn)行編碼,使得到的第一二值特征向量具有稀疏(即大部分元素均為0)的性質(zhì),可以通過調(diào)整投影矩陣的稀疏度,將人臉識(shí)別方法計(jì)算過程中需要調(diào)制參數(shù)的數(shù)量級(jí)調(diào)整為與訓(xùn)練數(shù)據(jù)復(fù)雜度相當(dāng)?shù)乃剑鉀Q了訓(xùn)練樣本中的數(shù)據(jù)過度擬合的問題。

      對(duì)于步驟S103,在得到訓(xùn)練集的各像素點(diǎn)對(duì)應(yīng)的第一二值特征向量后,對(duì)訓(xùn)練集的所有像素點(diǎn)對(duì)應(yīng)的第一二值特征向量進(jìn)行聚類,得到多個(gè)聚類中心-單詞;本實(shí)施例中可以采用K-Means聚類方法或者SGONG聚類方法對(duì)訓(xùn)練集的所有像素點(diǎn)對(duì)應(yīng)的第一二值特征向量進(jìn)行學(xué)習(xí),得到多個(gè)聚類中心-單詞,但并不限于上述兩種聚類方法。

      對(duì)于步驟S104,在對(duì)訓(xùn)練集的所有像素點(diǎn)對(duì)應(yīng)的第一二值特征向量進(jìn)行聚類,得到多個(gè)單詞后,接著獲取第一向量,具體為,每個(gè)訓(xùn)練樣本具有多個(gè)像素點(diǎn),每個(gè)像素點(diǎn)對(duì)應(yīng)一個(gè)第一二值特征向量,將一個(gè)訓(xùn)練樣本的各第一二值特征向量按照順序組成第一矩陣,接著,采用單詞對(duì)第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,根據(jù)第一線性重建結(jié)果得到第一向量;每一個(gè)訓(xùn)練樣本對(duì)應(yīng)一個(gè)第一向量。

      將各訓(xùn)練樣本相對(duì)應(yīng)的第一二值特征向量組成第一矩陣,采用單詞對(duì)第一矩陣進(jìn)行線性重建,比起直接采用原始的第一矩陣表示具有更好的數(shù)據(jù)適應(yīng)性。

      對(duì)于步驟S105,當(dāng)?shù)玫接?xùn)練集中每個(gè)訓(xùn)練樣本對(duì)應(yīng)的第一向量后,訓(xùn)練過程完成,開始人臉識(shí)別過程,采用上述獲取第一向量相同的方法獲取待檢測(cè)人臉的圖像對(duì)應(yīng)的第二向量,具體為:獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二二值特征向量,并將各第二二值特征向量組成第二矩陣,采用單詞對(duì)第二矩陣進(jìn)行線性重建,得到第二線性重建結(jié)果,根據(jù)第二線性重建結(jié)果得到第二向量。

      在該步驟中,獲取第二二值特征向量的方法與獲取第一二值特征向量的方法相同。

      對(duì)于步驟S106,在得到第一向量和第二向量后,便可以根據(jù)第一向量和第二向量,得到人臉識(shí)別結(jié)果,比如可采用分類器的方法:將第一向量和第二向量輸入分類器,使得分類器計(jì)算各第一向量和第二向量之間的歐式距離,獲取分類器返回的第二向量與各第一向量的歐式距離,將與第二向量的歐式距離最短的第一向量對(duì)應(yīng)的訓(xùn)練樣本所對(duì)應(yīng)的人臉圖像識(shí)別為待檢測(cè)人臉的圖像。

      本實(shí)施例的基于稀疏投影二值編碼的人臉識(shí)別方法,包括獲取訓(xùn)練集中各訓(xùn)練樣本的各像素點(diǎn)對(duì)應(yīng)的第一像素差值向量;其中,訓(xùn)練樣本為人臉圖像,訓(xùn)練集中包括多幅不同的人臉圖像;根據(jù)第一像素差值向量獲取滿足基于稀疏投影矩陣的第一目標(biāo)函數(shù)的各像素點(diǎn)對(duì)應(yīng)的第一二值特征向量;對(duì)所有的第一二值特征向量進(jìn)行聚類,得到多個(gè)聚類中心-單詞;將各訓(xùn)練樣本相對(duì)應(yīng)的第一二值特征向量組成第一矩陣,采用單詞對(duì)第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,根據(jù)第一線性重建結(jié)果得到第一向量;其中,每個(gè)訓(xùn)練樣本對(duì)應(yīng)一個(gè)第一向量;獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二二值特征向量,并將各第二二值特征向量組成第二矩陣,采用單詞對(duì)第二矩陣進(jìn)行線性重建,得到第二線性重建結(jié)果,根據(jù)第二線性重建結(jié)果得到第二向量,根據(jù)第一向量和第二向量,得到人臉識(shí)別結(jié)果。本實(shí)施例的基于稀疏投影二值編碼的人臉識(shí)別方法采用采用稀疏投影矩陣對(duì)實(shí)值表示的像素差值向量進(jìn)行編碼得到二值特征向量,并對(duì)二值特征向量進(jìn)行聚類得到單詞,采用單詞線性重建每幅人臉圖像對(duì)應(yīng)的二值特征向量組成的矩陣,識(shí)別速度快,解決了訓(xùn)練樣本過度擬合的問題,且對(duì)數(shù)據(jù)的適應(yīng)性好,提高了人臉識(shí)別方法的識(shí)別人臉的準(zhǔn)確性和快速性。

      下面對(duì)圖1所示方法實(shí)施例的技術(shù)方案進(jìn)行詳細(xì)說明。

      首先對(duì)根據(jù)第一像素差值向量獲取滿足基于稀疏投影矩陣的第一目標(biāo)函數(shù)的各像素點(diǎn)對(duì)應(yīng)的第一二值特征向量的方法進(jìn)行說明。

      圖3為本發(fā)明實(shí)施例提供的基于稀疏投影二值編碼的人臉識(shí)別方法實(shí)施例二的流程圖,如圖3所示,本實(shí)施例的方法包括:

      S301,引入第一目標(biāo)函數(shù)中的稀疏投影矩陣R的代理矩陣S,將第一目標(biāo)函數(shù)變換為第二目標(biāo)函數(shù);

      S302,對(duì)第二目標(biāo)函數(shù)進(jìn)行求解,得到第一二值特征向量。

      對(duì)于步驟S301,引入R的代理矩陣S,S矩陣的大小和矩陣R相同,將第一目標(biāo)函數(shù)變換為第二目標(biāo)函數(shù),第二目標(biāo)函數(shù)如公式四所示:

      其中,變量α表示代理矩陣S的懲罰因子,用以平衡公式四中和這兩項(xiàng)的變量,|S|0表示代理矩陣S中非0元素的個(gè)數(shù),表示代理矩陣S與二值編碼B之間的量化誤差,表示代理矩陣S與R之間的誤差;其中代理矩陣S也為稀疏投影矩陣。

      對(duì)于步驟S302,對(duì)第二目標(biāo)函數(shù)進(jìn)行求解,得到第一二值特征向量的方法,具體為:

      將第二目標(biāo)函數(shù)中的S和B隨機(jī)賦予初始值S0和B0,并固定第二目標(biāo)函數(shù)中的S和B,更新第二目標(biāo)函數(shù)中的R,得到R1,具體為:

      將第二目標(biāo)函數(shù)改成寫第一表達(dá)式,第一表達(dá)式如公式五所示:

      其中,C1=SX,為固定值;

      求解第一表達(dá)式,得到R1,具體為:

      通過公式六或公式七得到R1

      其中,thrm表示將得到的矩陣中的最大的m個(gè)元素保留,其余的元素置0;Rt+1表示利用公式六第(t+1)次迭代得到的解,Rt表示利用公式六上一次(即第(t)次)迭代的解,當(dāng)?shù)螖?shù)為N時(shí),利用公式六得到的解收斂,停止迭代,此時(shí)得到的RN=R1,其中R1表示對(duì)第二目標(biāo)函數(shù)求解時(shí),第一次迭代得到的R;

      R1=thrm(S) 公式七;

      其中,R1表示對(duì)第二目標(biāo)函數(shù)求解時(shí),第一次迭代得到的R。

      將第二目標(biāo)函數(shù)中的B賦予初始值B0,將第二目標(biāo)函數(shù)中的R賦為R1,并固定第二目標(biāo)函數(shù)中的B和R,更新第二目標(biāo)函數(shù)中的S,得到S1,具體為:

      將第二目標(biāo)函數(shù)改成寫第二表達(dá)式,第二表達(dá)式如公式八所示:

      其中,C2=(B+αRX)/(1+α)為固定值;

      求解第二表達(dá)式,得到S1,具體為:

      通過公式九求解S1

      對(duì)進(jìn)行奇異值分解得到U,V:S1=VUT.......公式九;

      其中,S1表示對(duì)第二目標(biāo)函數(shù)求解時(shí),第一次迭代得到的S;

      將第二目標(biāo)函數(shù)中的S賦為S1,將第二目標(biāo)函數(shù)中的R賦為R1,并固定第二目標(biāo)函數(shù)中的S和R,更新第二目標(biāo)函數(shù)中的B,得到B1,具體為:

      將第二目標(biāo)函數(shù)改成寫第三表達(dá)式,第三表達(dá)式如公式十所示:

      其中,C3=SX,為固定值;

      求解第三表達(dá)式,得到B1,具體為:

      通過公式十一得到B1

      B=sign(C3)=sign(SX) 公式十一;

      其中,sign(*)為符號(hào)函數(shù),將自變量*大于0時(shí),sign(*)函數(shù)輸出1,否則,sign(*)函數(shù)輸出0,B1表示對(duì)第二目標(biāo)函數(shù)求解時(shí),第一次迭代得到的B;自變量是指矩陣C3中的元素。

      將第二目標(biāo)函數(shù)中的S賦為S1,將第二目標(biāo)函數(shù)中的B賦為和B1,并固定第二目標(biāo)函數(shù)中的S和B,更新第二目標(biāo)函數(shù)中的R,得到R2

      將第二目標(biāo)函數(shù)中的B賦為B1,將第二目標(biāo)函數(shù)中的R賦為R2,并固定第二目標(biāo)函數(shù)中的B和R,更新第二目標(biāo)函數(shù)中的S,得到S2;

      將第二目標(biāo)函數(shù)中的S賦為S2,將第二目標(biāo)函數(shù)中的R賦為R2,并固定第二目標(biāo)函數(shù)中的S和R,更新第二目標(biāo)函數(shù)中的B,得到B2;

      重復(fù)執(zhí)行將第二目標(biāo)函數(shù)中的S賦為Sm-1,將第二目標(biāo)函數(shù)中的B賦為和Bm-1,并固定第二目標(biāo)函數(shù)中的S和B,更新第二目標(biāo)函數(shù)中的R,得到Rm;將第二目標(biāo)函數(shù)中的B賦為Bm-1,將第二目標(biāo)函數(shù)中的R賦為Rm,并固定第二目標(biāo)函數(shù)中的B和R,更新第二目標(biāo)函數(shù)中的S,得到Sm;將第二目標(biāo)函數(shù)中的S賦為Sm,將第二目標(biāo)函數(shù)中的R賦為Rm,并固定第二目標(biāo)函數(shù)中的S和R,更新第二目標(biāo)函數(shù)中的B,得到Bm的操作,直至完成M次迭代,第M次迭代得到的BM即為滿足第一目標(biāo)函數(shù)的各像素點(diǎn)對(duì)應(yīng)的第一二值特征向量;其中,m代表第m次迭代,m、M均為正整數(shù)。

      其中,M的取值可根據(jù)實(shí)際需要確定,本實(shí)施例中不作限定。

      下面對(duì)上一實(shí)施例中的公式六、公式十一的推導(dǎo)過程進(jìn)行介紹。

      首先對(duì)公式六的推導(dǎo)過程進(jìn)行說明;

      對(duì)于表達(dá)式一的求解過程比較困難,引入第三目標(biāo)函數(shù),第三目標(biāo)函數(shù)如公式十二所示:

      其中,

      根據(jù)F-范數(shù)的性質(zhì),表達(dá)式是恒大于0的,因此,第三目標(biāo)函數(shù)的數(shù)值不會(huì)小于表達(dá)式一的數(shù)值,因此公式十二的最優(yōu)解仍然滿足表達(dá)式一;

      采用迭代的求解第三目標(biāo)函數(shù),即固定S更新R,將第三目標(biāo)函數(shù)變換為表達(dá)式四,表達(dá)四如公式十三所示:

      其中,const表示不依賴R的常量;

      表達(dá)式四的向量形式如下式所示:

      其中,該式的解可以表示為其矩陣形式的解可以泛化為公式十四:

      采用公式十四進(jìn)行迭代求解R,迭代公式即為公式六。

      其次,對(duì)公式十一的推導(dǎo)過程進(jìn)行說明。

      表達(dá)式二可展開為式一的形式:由于矩陣B是正交的,因此為一個(gè)常數(shù),因此,上式則進(jìn)一步簡(jiǎn)化為:

      其中,n表示訓(xùn)練樣本的個(gè)數(shù),c表示二值特征向量的維度,為了最大化上式,需要當(dāng)(C3)ij大于等于0時(shí),讓Bij=1,當(dāng)(C3)ij小于0時(shí),讓Bij=1,于是轉(zhuǎn)化成了對(duì)公式十一的求解。

      其次,對(duì)上述實(shí)施例中的步驟“將各訓(xùn)練樣本相對(duì)應(yīng)的第一二值特征向量組成第一矩陣,采用單詞對(duì)第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,根據(jù)第一線性重建結(jié)果得到第一向量”進(jìn)行說明。

      將各訓(xùn)練樣本相對(duì)應(yīng)的第一二值特征向量組成第一矩陣,采用單詞對(duì)第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,根據(jù)第一線性重建結(jié)果得到第一向量,包括:

      采用單詞對(duì)第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,第一線性重建結(jié)果的表達(dá)式如公式二所示:

      Bi=ai1S1+ai2S2+...+aikSk 公式二;

      其中,Bi為第i個(gè)訓(xùn)練樣本的各第一二值特征向量組成的第一矩陣,Sk為第k個(gè)單詞,aik為在第i個(gè)訓(xùn)練樣本的對(duì)應(yīng)的所述第一矩陣采用單詞進(jìn)行線性重建時(shí)第k個(gè)單詞的權(quán)重;

      將第一線性重建結(jié)果的表達(dá)式中的各單詞對(duì)應(yīng)的權(quán)重組成第一向量(ai1,ai2,……,aik)。

      接著,對(duì)上述實(shí)施例中的步驟“獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二二值特征向量,并將各第二二值特征向量組成第二矩陣,采用單詞對(duì)第二矩陣進(jìn)行線性重建,得到第二線性重建結(jié)果,根據(jù)第二線性重建結(jié)果得到第二向量”進(jìn)行說明。

      獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二二值特征向量,并將各第二二值特征向量組成第二矩陣,采用單詞對(duì)第二矩陣進(jìn)行線性重建,得到第二線性重建結(jié)果,根據(jù)第二線性重建結(jié)果得到第二向量,包括:

      獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二像素差值向量,并根據(jù)第二像素差值向量獲取滿足第一目標(biāo)函數(shù)的待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二二值特征向量;

      將各所述第二二值特征向量組成所述第二矩陣,并將所述第二矩陣采用所述單詞進(jìn)行線性重建,得到所述第二線性重建結(jié)構(gòu),所述第二線性重建結(jié)果的表達(dá)式如公式三所示:

      B測(cè)試=b1S1+b2S2+...+bkSk 公式三;

      其中,B測(cè)試為各所述第二二值特征向量組成的第二矩陣,Sk為第k個(gè)單詞,bk為所述第二矩陣采用所述單詞進(jìn)行線性重建時(shí)第k個(gè)單詞的權(quán)重;

      將所述第二線性重建結(jié)果的表達(dá)式中的各所述單詞對(duì)應(yīng)的權(quán)重組成所述第二向量(b1,b2,……,bk)。

      其中,獲取第二像素差值向量的方法與獲取第一像素差值的方法相同,具體為:

      將待檢測(cè)人臉的圖像劃分為多個(gè)塊;

      以每個(gè)塊中的每個(gè)像素點(diǎn)為第二中心像素點(diǎn),以r為半徑,得到第二中心像素點(diǎn)的第二鄰域像素點(diǎn),并按照順時(shí)針方向,將第二鄰域像素點(diǎn)的像素值與第二中心像素點(diǎn)的像素值進(jìn)行差值運(yùn)算,得到長(zhǎng)度為(2×r+1)×(2×r+1)-1維的第二像素差值向量;

      獲取第二二值特征向量的方法與獲取第一二值特征向量的方法相同,此處不再贅述。

      圖4為本發(fā)明提供的基于稀疏投影二值編碼的人臉識(shí)別裝置的結(jié)構(gòu)示意圖,如圖4所示,本實(shí)施例的裝置可以包括:計(jì)算單元401,聚類單元402,第一向量獲取單元403,第二向量獲取單元404,識(shí)別單元405。

      計(jì)算單元401,用于獲取訓(xùn)練集中各訓(xùn)練樣本的各像素點(diǎn)對(duì)應(yīng)的第一像素差值向量;其中,訓(xùn)練樣本為人臉圖像,訓(xùn)練集中包括多幅不同的人臉圖像;

      計(jì)算單元401還用于根據(jù)第一像素差值向量獲取滿足基于稀疏投影矩陣的第一目標(biāo)函數(shù)的各像素點(diǎn)對(duì)應(yīng)的第一二值特征向量;

      聚類單元402,用于對(duì)所有的第一二值特征向量進(jìn)行聚類,得到多個(gè)聚類中心-單詞;

      第一向量獲取單元403,用于將各訓(xùn)練樣本相對(duì)應(yīng)的第一二值特征向量組成第一矩陣,采用單詞對(duì)第一矩陣進(jìn)行線性重建,得到第一線性重建結(jié)果,根據(jù)第一線性重建結(jié)果得到第一向量;其中,每個(gè)訓(xùn)練樣本對(duì)應(yīng)一個(gè)第一向量;

      第二向量獲取單元404,用于獲取待檢測(cè)人臉的圖像的各像素點(diǎn)對(duì)應(yīng)的第二二值特征向量,并將各第二二值特征向量組成第二矩陣,采用單詞對(duì)第二矩陣進(jìn)行線性重建,得到第二線性重建結(jié)果,根據(jù)第二線性重建結(jié)果得到第二向量;

      識(shí)別單元405,用于根據(jù)第一向量和第二向量,得到人臉識(shí)別結(jié)果。

      本實(shí)施例的裝置,可以用于執(zhí)行圖1所示方法實(shí)施例的技術(shù)方案,其實(shí)現(xiàn)原理和技術(shù)效果類似,此處不再贅述。

      本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述各方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。該程序在執(zhí)行時(shí),執(zhí)行包括上述各方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:ROM、RAM、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。

      最后應(yīng)說明的是:以上各實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍。

      當(dāng)前第1頁(yè)1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1