專利名稱:一種基于單訓(xùn)練樣本人臉識別的遠程身份認證方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種單訓(xùn)練樣本人臉識別方法。
背景技術(shù):
人臉識別技術(shù)是當前生物測定學(xué)領(lǐng)域中最具代表性和最富有挑戰(zhàn)性的重要技術(shù)方向。人臉識別是指基于已知的人臉樣本庫,利用圖像處理和/或模式識別技術(shù)從靜態(tài)或者動態(tài)場景中,識別一個或多個人臉。當前基于人臉識別算法進行身份認證的方法通常是采用多訓(xùn)練樣本的人臉識別方法,多訓(xùn)練樣本是指在人臉識別之前對于待識別人采集多張照片用做訓(xùn)練樣本,此種方
法通常需要在識別之前對待識別人做單人多張照片的大量采樣工作,不能夠利用國家現(xiàn)有的單人單張照片的人臉庫;同時由于此方法需要前期大量的采集工作,對于數(shù)量較大的群體該算法也并不適用。中國第CN 101957911A號發(fā)明專利申請公開了一種人臉識別方法及系統(tǒng),其也屬于生物特征識別與無線傳輸技術(shù)領(lǐng)域,該發(fā)明采用的人臉識別方法是基于多樣本訓(xùn)練的人臉識別方法,需要前期對待識別人做多張人臉照片采集工作?!痘跓o線和有線通信技術(shù)的人臉識別網(wǎng)絡(luò)體系及其識別方法》(公開號CN101873340A)則公開了一種基于無線和有線通信技術(shù)的人臉識別網(wǎng)絡(luò)體系及其識別方法,包含服務(wù)器,與服務(wù)器進行有線或無線通信連接的若干微機人臉識別終端、若干嵌入式人臉識別終端、若干手機終端及若干手持式專用采集終端。該發(fā)明專利申請采用的人臉識別方法是基于多樣本訓(xùn)練的人臉識別方法,也需要前期對待識別人做多張人臉照片采集工作?!痘谑謾C攝像頭結(jié)合人臉識別技術(shù)的身份識別方法》(公開號CN101226591A)則給出了一種無線網(wǎng)絡(luò)技術(shù)及模式識別領(lǐng)域的基于手機攝像頭結(jié)合人臉識別技術(shù)的身份識別方法,該發(fā)明專利申請強調(diào)了采集終端為手機且人臉識別算法采用的利用主成分分析(PCA)和線性鑒別分析(LDA)對候選數(shù)據(jù)集中的人臉數(shù)據(jù)進行識別訓(xùn)練后,對輸入圖像的人臉區(qū)域進行識別,該方式就目前的人臉識別算法技術(shù)來講很難取得較高的識別率。
發(fā)明內(nèi)容
因此,本發(fā)明的目的在于提供了一種基于單訓(xùn)練樣本人臉識別的身份認證方法,通過事先構(gòu)建針對面部子特征的多訓(xùn)練樣本集,實現(xiàn)對面部子特征的識別能力,并結(jié)合子特征識別融合技術(shù),實現(xiàn)單訓(xùn)練樣本人臉識別。本發(fā)明采用以下技術(shù)方案
一種基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其特征在于,包括以下步驟
I)輸入人臉子特征訓(xùn)練樣本素材準備一組人臉照片,容量為M = m[l]+m[2]+…+m[N],其中,N是訓(xùn)練樣本中參加拍攝樣本的人的數(shù)量,m[i] (I彡i彡N,m[i]彡I)是第i個人在給定的不同拍攝條件下照片的總數(shù)量;2)構(gòu)造訓(xùn)練樣本:M個訓(xùn)練素材,兩兩配對,產(chǎn)生MXM個人臉照片的訓(xùn)練樣本;
3)提取每個所述訓(xùn)練樣本的P個子特征,進而通過每個訓(xùn)練樣本中兩張照片對應(yīng)子特征之間的差值獲得每一訓(xùn)練樣本的P個子特征度量模塊;
4)給定任意的訓(xùn)練樣本,依據(jù)P個子特征度量模塊計算訓(xùn)練樣本中兩幅圖像的差值,構(gòu)造該樣本的P維樣本特征數(shù)據(jù)向量V,若訓(xùn)練樣本中兩副照片代表同一個人時,V的響應(yīng)值為r=l,否則r=0 ;
5)依據(jù)步驟4)中,對于MXM個訓(xùn)練向量和對應(yīng)的響應(yīng)值,通過機器學(xué)習的方法,得到機器學(xué)習的訓(xùn)練結(jié)果數(shù)據(jù)集;
6)輸入待識的當事人人臉照片,調(diào)用遠程的人臉圖片庫,從人臉圖片庫中取出匹配當事人的單張照片,調(diào)用P個子特征度量模塊計算出P個拓撲學(xué)距離空間意義下的距離,構(gòu)成待測試向量V’,依據(jù)步驟5中的機器學(xué)習算法和訓(xùn)練結(jié)果數(shù)據(jù)集,預(yù)測判定V’對應(yīng)的值r’ ;當r’ =1時,判定當事人的待識別照片與人臉圖片庫中所述單張照片對應(yīng)同一人;當1·’ =0時,判定兩幅照片對應(yīng)不同人。通過以上技術(shù)方案可以看出,依據(jù)本發(fā)明,通過適量的人臉子特征訓(xùn)練樣本,構(gòu)造子特征度量模塊,進而生成P維樣本數(shù)據(jù)向量V,通過機器學(xué)習算法形成訓(xùn)練結(jié)果數(shù)據(jù)集,步驟6)依據(jù)采用的機器學(xué)習算法和訓(xùn)練結(jié)果數(shù)據(jù)集判斷某對于單訓(xùn)練樣本的照片和輸入的待識別照片進行識別,這種方式大大提高了識別率,使單訓(xùn)練樣本人臉識別方法具有產(chǎn)業(yè)應(yīng)用前景。在步驟6)中,子特征的差值泛指兩個字特征向量在其所在拓撲學(xué)意義下距離空間內(nèi)的距離。上述基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,在步驟2)之前還包括對樣本素材尺度標準化的步驟統(tǒng)一所有照片上人的瞳孔平均坐標,且統(tǒng)一每一照片上的兩瞳孔間距,并把所述照片規(guī)整為同一尺寸。上述基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,對樣本素材尺寸標準化后還包括對樣本素材灰度化的步驟。上述基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,還包括對所獲得的灰度化的所述照片進行亮度標準化的步驟。上述基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,亮度標準化是執(zhí)行人臉檢測,切割出人臉區(qū)域,然后讓面部平均亮度和反差標準化。上述基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,面部平均亮度的標準為127,反差標準化的標準是亮度均方差為32。上述基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,所述步驟2)中照片規(guī)整的尺寸為像素值240X 320,瞳孔距離64像素。上述基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,對于RGB彩色照片,轉(zhuǎn)換為灰度圖像的步驟為,讀取各像素3個通道的亮度值,利用Y = ((R*299) + (G*587) + (B*114))/ 1000進行灰度化。上述基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,所述子特征的個數(shù)不少于6個且不大于38個。上述基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,機器學(xué)習的方法選自人工神經(jīng)網(wǎng)絡(luò)算法、支持向量機算法、貝葉斯分類算法、決策樹算法。
圖1為依據(jù)本發(fā)明的一種基于單訓(xùn)練樣本人臉識別的遠程身份認證方法。
具體實施例方式當前的單訓(xùn)練樣本人臉識別方法普遍識別率不高,大多在65%左右,不具有市場前景。發(fā)明人認為,只有識別率大于90%才具有產(chǎn)業(yè)應(yīng)用的價值。參照說明書附圖1,配置為人臉采集模塊,通過圖像或者是片采集數(shù)據(jù)獲得代是別的照片,也就是圖中左部的人臉照片;配置人臉照片庫,通常是國家人口信息庫、公安部的追逃庫、銀行聯(lián)網(wǎng)核查庫等匹配的庫文件,自然也包括如某個公司的人員庫,其所存在的往往是單一的照片,如身份證件的人臉照片,且表情往往比 較單一。另外,配置的人臉照片庫大多遠程分布,部分本地存放,如以公司為單位的庫文件,即便是公司內(nèi)部,可能涉及多個采集點,相應(yīng)的庫文件可能也遠程布設(shè)。然后配置的人臉對比模塊為本文所提出的基于單訓(xùn)練樣本的人臉識別方法,或者說本文的改進點體現(xiàn)在人臉對比方法的改進上。從而,關(guān)于人臉對比方法,通過有效融合多種子識別特征,實現(xiàn)單訓(xùn)練樣本人臉識別。具體步驟以樹形結(jié)構(gòu)的形式描述如下1、獲取樣本素材其容量為M = m[l]+m[2]+…+m[N],N是訓(xùn)練樣本中參加拍攝樣本人的數(shù)量,m[i] (I彡i彡N,m[i] > I)是第i個人在不同拍攝條件(如光照、姿態(tài)、表情等拍攝條件)下照片數(shù)量,該數(shù)量越大最終所獲得的域就越大,但運算量也會相應(yīng)增大。2、樣本素材尺度標準化,以利于后續(xù)步驟的處理采集的人像照片根據(jù)統(tǒng)一的標準,尺寸標準化。2-1、根據(jù)2,統(tǒng)一縮放、旋轉(zhuǎn)、平移、剪裁樣本素材,使得照片尺寸統(tǒng)一為240X320,兩瞳孔平均縱坐標為160,瞳孔平均橫坐標為120,瞳孔距離64像素。其中的縮放、旋轉(zhuǎn)、平移針對照片本身原始的圖像要素進行選擇,如角度不正,旋轉(zhuǎn)到位即可。注在圖像處理中,行列自動為像素值所標定,縱橫坐標對應(yīng)該像素值。3、樣本素材灰度化把RGB彩色圖像轉(zhuǎn)換為灰度圖像。3-1、根據(jù) 3,可用公式 Y = ((R*299) + (G*587) + (B*114)) / 1000,把 RGB 彩色圖像
轉(zhuǎn)換為灰度圖像。4、照片亮度標準化讓面部平均亮度和反差標準化。4-1、根據(jù)4,讓照片面部平均亮度值為127,亮度均方差32。5、構(gòu)造訓(xùn)練樣本M個訓(xùn)練素材,兩兩進行配對,產(chǎn)生MXM個人臉照片配對,這些配對就是訓(xùn)練樣本。6、根據(jù)MXM個訓(xùn)練樣本,構(gòu)造P (P ^ I)個子特征度量模塊,每個子特征度量模塊可以根據(jù)訓(xùn)練樣本計算樣本中的兩張照片對應(yīng)特征之間的差值。以下為經(jīng)過驗證可被選用的子特征度量模塊,數(shù)量為7個,并且通過經(jīng)過驗證,最多可以構(gòu)建38個子特征度量模塊。6-1、根據(jù)6,子特征度量模塊的一種是實現(xiàn)方法是計算樣本中兩幅照片中人臉下巴縱坐標的差。
6-2、根據(jù)6,子特征度量模塊的一種是實現(xiàn)方法是計算樣本中兩幅照片中人臉寬度的差。6-3、根據(jù)6,子特征度量模塊的一種是實現(xiàn)方法是計算樣本中兩幅照片中人臉下嘴唇縱坐標的差。6-4、根據(jù)6,子特征度量模塊的一種是實現(xiàn)方法是計算樣本中兩幅照片中人臉眉毛區(qū)域差異部分的面積(像素數(shù))。6-5、根據(jù)6,子特征度量模塊的一種是實現(xiàn)方法是計算樣本中兩幅照片中人臉性別的差異,同性別差異為0,不同性別差異為I。6-6、根據(jù)6,子特征度量模塊的一種是實現(xiàn)方法是計算樣本中兩幅照片中人臉的嘴寬度的差。6-7、根據(jù)6,子特征度量模塊的一種是實現(xiàn)方法是計算樣本中兩幅照片中人臉的ASM輪廓模型對應(yīng)節(jié)點坐標距離之和。7、給定任意的訓(xùn)練樣本,依據(jù)P個子特征度量模塊計算的樣本中兩幅圖像的差值,構(gòu)造一個P維樣本特征數(shù)據(jù)向量V。當訓(xùn)練樣本中的兩幅照片代表同一個人時,向量V對應(yīng)的響應(yīng)值r=l,否則r=0。8、對于MXM個訓(xùn)練樣本,可以得到MXM個訓(xùn)練向量和對應(yīng)的響應(yīng)值,可以借助于機器學(xué)習算法,得到機器學(xué)習訓(xùn)練結(jié)果數(shù)據(jù)集。8-1、根據(jù)8,機器學(xué)習算法可以是人工神經(jīng)網(wǎng)絡(luò)算法。8-2、根據(jù)8,機器學(xué)習算法可以是支持向量機算法。8-3、根據(jù)8,機器學(xué)習算法可以是貝葉斯分類算法。8-4、根據(jù)8,機器學(xué)習算法可以是決策樹算法。這樣,通過前述的8個步驟就構(gòu)造除了對比方法,依據(jù)所述對比方法,具體的對比步驟為
通過人臉采集模塊獲取待識別對象的人臉照片,這里的人臉照片通常是現(xiàn)場提取,如攝像頭的采集,然后通過匹配的人臉照片庫調(diào)出所述待識別對象的信息庫人臉照片。進而,使用所述對比方法,調(diào)用P個子特征度量模塊計算出P個差值,構(gòu)成待測試向量V’。依據(jù)步驟8中機器學(xué)習算法和訓(xùn)練結(jié)果數(shù)據(jù)集,預(yù)測判定V’對應(yīng)的值r’。當r’ =1時,判定兩幅照片對應(yīng)同一人;讓1·’ =0時,判定兩幅照片對應(yīng)不同人。從而,判斷出待識別對象是否在相應(yīng)的人臉數(shù)據(jù)庫中。在以上的內(nèi)容中,人臉采集模塊、人臉照片庫和人臉比對模塊,根據(jù)具體的配置可分布于相同或者不同的裝置內(nèi)。其相互之間的通訊,可以采用基于有限網(wǎng)絡(luò)的通訊方式,亦可以采用基于無線網(wǎng)絡(luò)的通信方式,還可以采用通過存儲介質(zhì)匹配數(shù)據(jù)轉(zhuǎn)移的架構(gòu),同時,還可以采用本地調(diào)用的方式。以上機器學(xué)習的算法是當前比較常用的圖像處理算法,在此不再贅述。經(jīng)過驗證上述識別方法的識別率在92. 5 96%。一個實施例1、編制樣本素材編制容量為M = NX 10=200X10=2000的樣本素材,N=200是訓(xùn)練樣本中參加拍攝樣本人的數(shù)量,每人10張照片。2、統(tǒng)一縮放、旋轉(zhuǎn)、平移、剪裁樣本素材,使得照片尺寸統(tǒng)一為240X320,兩瞳孔平均縱坐標為160,瞳孔平均橫坐標為120,瞳孔距離64像素。3、樣本素材灰度化用公式 Y = ((R*299) + (G*587) + (B*114)) / 1000,把 RGB 彩
色圖像轉(zhuǎn)換為灰度圖像。4、照片亮度標準化讓照片面部平均亮度值為127,亮度均方差32。5、構(gòu)造訓(xùn)練樣本M=2000個訓(xùn)練素材,兩兩進行配對,產(chǎn)生MXM個=4000000個人臉照片配對,這些配對就是訓(xùn)練樣本。6、根據(jù)MXM=4000000個訓(xùn)練樣本,構(gòu)造P=12個子特征度量模塊,每個子特征度量模塊可以根據(jù)訓(xùn)練樣本計算樣本中的兩張照片計算對應(yīng)特征之間的差值。這12個子特征模塊分別度量以下特征
(O眉毛濃度;
(2)眉毛覽度;
(3)鼻孔縱坐標;
(4)鼻孔間距;
(5)嘴中心點縱坐標;
(6)上嘴唇縱坐標;
(7)具有68個節(jié)點的ASM模型;
(8)眉毛的分布區(qū)域;
(9)眼睛的二值化形狀;
(10)嘴的形狀類型(利用聚類分析算法分類)
(11)鼻子形狀類型(利用聚類分析算法分類)
(12)性別
7、給定任意的訓(xùn)練樣本,依據(jù)P=12個子特征度量模塊計算的樣本中兩幅圖像的插值,構(gòu)造一個P=12維樣本特征數(shù)據(jù)向量V。當樣本中的兩幅照片代表同一個人時,向量V對應(yīng)的響應(yīng)值r=l,否則r=0。8、對于MXM=4000000個訓(xùn)練樣本,可以得到MXM=4000000個訓(xùn)練向量和對應(yīng)的
響應(yīng)值,可以借助于貝葉斯分類器,得到機器學(xué)習訓(xùn)練結(jié)果數(shù)據(jù)集。9、構(gòu)造定待測試樣本給出待識別比對的兩幅人臉照片,調(diào)用P=12個子特征度量模塊計算出P=12個差值,構(gòu)成12維待測試向量V’。依據(jù)8中機器學(xué)習算法和訓(xùn)練結(jié)果數(shù)據(jù)集,預(yù)測判定V’對應(yīng)的值r’。當r’ =1時,判定兩幅照片對應(yīng)同一人;當r’ =0時,判定兩幅照片對應(yīng)不同人。經(jīng)過驗證,該方法的識別率為95%。
權(quán)利要求
1.一種基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其特征在于,包括以下步驟 1)輸入人臉子特征訓(xùn)練樣本素材準備一組人臉照片,容量為M= m[l]+m[2]+…+m[N],其中,N是訓(xùn)練樣本中參加拍攝樣本的人的數(shù)量,m[i] (I彡i彡N,m[i]彡I)是第i個人在給定的不同拍攝條件下照片的總數(shù)量; 2)構(gòu)造訓(xùn)練樣本M個訓(xùn)練素材,兩兩配對,產(chǎn)生MXM個人臉照片的訓(xùn)練樣本; 3)提取每個所述訓(xùn)練樣本的P個子特征,進而通過每個訓(xùn)練樣本中兩張照片對應(yīng)子特征之間的差值獲得每一訓(xùn)練樣本的P個子特征度量模塊; 4)給定任意的訓(xùn)練樣本,依據(jù)P個子特征度量模塊計算訓(xùn)練樣本中兩幅圖像的差值,構(gòu)造該樣本的P維樣本特征數(shù)據(jù)向量V,若訓(xùn)練樣本中兩副照片代表同一個人時,V的響應(yīng)值為r=l,否貝丨J r=0 ; 5)依據(jù)步驟4)中,對于MXM個訓(xùn)練向量和對應(yīng)的響應(yīng)值,通過機器學(xué)習的方法,得到機器學(xué)習的訓(xùn)練結(jié)果數(shù)據(jù)集; 6)輸入待識的當事人人臉照片,調(diào)用遠程的人臉圖片庫,從人臉圖片庫中取出匹配當事人的單張照片,調(diào)用P個子特征度量模塊計算出P個拓撲學(xué)距離空間意義下的距離,構(gòu)成待測試向量V’,依據(jù)步驟5中的機器學(xué)習算法和訓(xùn)練結(jié)果數(shù)據(jù)集,預(yù)測判定V’對應(yīng)的值r’ ;當r’ =1時,判定當事人的待識別照片與人臉圖片庫中所述單張照片對應(yīng)同一人;當r’ =O時,判定兩幅照片對應(yīng)不同人。
2.根據(jù)權(quán)利要求1所述的基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其特征在于,在步驟2)之前還包括對樣本素材尺度標準化的步驟統(tǒng)一所有照片上人的瞳孔平均坐標,且統(tǒng)一每一照片上的兩瞳孔間距,并把所述照片規(guī)整為同一尺寸。
3.根據(jù)權(quán)利要求2所述的基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其特征在于,對樣本素材尺寸標準化后還包括對樣本素材灰度化的步驟。
4.根據(jù)權(quán)利要求3所述的基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其特征在于,還包括對所獲得的灰度化的所述照片進行亮度標準化的步驟。
5.根據(jù)權(quán)利要求4所述的基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其特征在于,亮度標準化是執(zhí)行人臉檢測,切割出人臉區(qū)域,然后讓面部平均亮度和反差標準化。
6.根據(jù)權(quán)利要求5所述的基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其特征在于,面部平均亮度的標準為127,反差標準化的標準是亮度均方差為32。
7.根據(jù)權(quán)利要求1所述的基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其特征在于,所述步驟2)中照片規(guī)整的尺寸為像素值240X 320,瞳孔距離64像素。
8.根據(jù)權(quán)利要求1所述的基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其特征在于,對于RGB彩色照片,轉(zhuǎn)換為灰度圖像的步驟為,讀取各像素3個通道的亮度值,利用Y =((R*299) + (G*587) + (B*114)) / 1000 進行灰度化。
9.根據(jù)權(quán)利要求1所述的基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其特征在于,所述子特征的個數(shù)不少于6個且不大于38個。
10.根據(jù)權(quán)利要求1所述的基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其特征在于,機器學(xué)習的方法選自人工神經(jīng)網(wǎng)絡(luò)算法、支持向量機算法、貝葉斯分類算法、決策樹算法。
全文摘要
本發(fā)明公開了一種基于單訓(xùn)練樣本人臉識別的遠程身份認證方法,其通過適量的人臉子特征訓(xùn)練樣本,構(gòu)造子特征度量模塊,進而生成P維樣本數(shù)據(jù)向量v,通過機器學(xué)習算法形成訓(xùn)練結(jié)果數(shù)據(jù)集,步驟6)依據(jù)采用的機器學(xué)習算法和訓(xùn)練結(jié)果數(shù)據(jù)集判斷某對于單訓(xùn)練樣本的照片和輸入的待識別照片進行識別,這種方式大大提高了識別率,使單訓(xùn)練樣本人臉識別方法具有產(chǎn)業(yè)應(yīng)用前景。在步驟6)中,子特征的差值泛指兩個字特征向量在其所在拓撲學(xué)意義下距離空間內(nèi)的距離。
文檔編號G06K9/66GK103020655SQ20121054318
公開日2013年4月3日 申請日期2012年12月16日 優(yōu)先權(quán)日2012年12月16日
發(fā)明者方亮, 許野平 申請人:山東神思電子技術(shù)股份有限公司