本發(fā)明屬于人工智能和模式識(shí)別技術(shù)領(lǐng)域,具體涉及一種基于神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別方法。
背景技術(shù):
人臉檢測問題最初來源于人臉識(shí)別(facerecognition)。人臉識(shí)別的研究可以追溯到20世紀(jì)60-70年代,經(jīng)過幾十年的曲折發(fā)展已日趨成熟。人臉檢測是自動(dòng)人臉檢測系統(tǒng)中的一個(gè)關(guān)鍵環(huán)節(jié),也是面部表情識(shí)別、頭部狀態(tài)估計(jì)的必須技術(shù)。早期的人臉識(shí)別研究主要針對(duì)具有較強(qiáng)約束條件的人臉圖像(如無背景的圖像),往往假設(shè)人臉位置已知或很容易獲得,因此人臉檢測問題并未受到重視。近幾年隨著電子商務(wù)等應(yīng)用的發(fā)展,人臉識(shí)別成為最有潛力的身份驗(yàn)證手段,這種應(yīng)用背景要求自動(dòng)人臉檢測系統(tǒng)能夠?qū)σ话悱h(huán)境中的人臉圖像具有一定的適應(yīng)能力。
人臉是一類具有相當(dāng)復(fù)雜的細(xì)節(jié)變化的自然結(jié)構(gòu)的目標(biāo),目前人臉檢測所面臨的問題可以歸結(jié)如下:
圖像平面內(nèi)變化:臉部圖像的最簡單變化可以通過臉部本事的旋轉(zhuǎn)、移動(dòng)、縮放、鏡像等獨(dú)立地表示。本類同樣包含所有的圖像亮度、對(duì)比度變化以及被其他物體遮擋。
姿態(tài)變化:臉部某些方面的姿態(tài)變包含在圖像平面變化中,比如旋轉(zhuǎn)和平移。不在圖像平面內(nèi)的臉部旋轉(zhuǎn)對(duì)表現(xiàn)會(huì)產(chǎn)生很大影響。另一類變化是臉部離攝像機(jī)的距離,會(huì)導(dǎo)致景物變形。
光線和膚色變化:目標(biāo)及其環(huán)境引起的變化,特別是目標(biāo)的表面特征和光源。光源的變化會(huì)引起臉部表現(xiàn)的強(qiáng)烈變化。
背景變化:當(dāng)目標(biāo)具有可預(yù)測的形狀,就可以選取一個(gè)只包含此物體象素的窗口,并忽略背景。可是,對(duì)于側(cè)臉,臉部本身的邊界是至關(guān)重要的特征,并且每個(gè)人的形狀都不一樣。因此,邊界是不可預(yù)測的,背景不能被簡單地屏蔽或忽略。
形狀變化:最后是目標(biāo)本身的形狀變化。對(duì)于人臉,此類變化包含了臉部表情,如嘴和眼睛的張開、閉合。
對(duì)于人臉檢測問題,從不同的角度可以有多種分類方法。同時(shí),人臉圖像所包含的模式特征十分豐富,這些特征中哪些是最有用的、如何利用這些特征,是人臉檢測要研究的主要問題。
技術(shù)實(shí)現(xiàn)要素:
為了解決上述問題,本發(fā)明提供一種基于人工神經(jīng)網(wǎng)絡(luò)的人臉檢測系統(tǒng),采用的技術(shù)方案如下:
基于人工神經(jīng)網(wǎng)絡(luò)的人臉檢測識(shí)別方法,包括以下步驟:
(1)位置和姿態(tài)估計(jì):用神經(jīng)網(wǎng)絡(luò)分析圖像中潛在的臉部區(qū)域并確定臉部姿態(tài);
(2)預(yù)處理:圖像進(jìn)行預(yù)處理來改善圖像的亮度和對(duì)比度;
(3)檢測:在前兩步對(duì)圖像作位置、姿態(tài)和預(yù)處理后,由面檢測器檢測是否存在人臉;
(4)決斷:通過利用啟發(fā)式算法,將面檢測器的檢測結(jié)果合并在一起作決斷,來增強(qiáng)人臉檢測的正確率。
優(yōu)選地,還包括人臉檢測訓(xùn)練,訓(xùn)練方法如下:
(1)窗口輸入圖像樣本;
(2)訓(xùn)練神經(jīng)網(wǎng)絡(luò),對(duì)人臉圖像樣本輸出1,非人臉圖像樣本輸出-1;在循環(huán)的第一次迭代時(shí),隨即初始化網(wǎng)絡(luò)的權(quán)重;
(3)使用上一次訓(xùn)練計(jì)算的權(quán)重做為下一次訓(xùn)練的起點(diǎn)。
優(yōu)選地,在輸入圖像樣本前還包括圖像樣本的處理,處理方法為:在20×20像素的窗口中,將圖像調(diào)整為統(tǒng)一的大小、位置和方位;圖像的擴(kuò)縮率為
優(yōu)選地,所述人臉訓(xùn)練所需的圖像樣本的生成方法如下:
(1)選擇初始人臉圖像;
(2)依據(jù)頭部的三維姿態(tài),在每張人臉圖樣上標(biāo)記特征點(diǎn);
(3)不同人臉上的標(biāo)記特征點(diǎn)組合;
(4)多次組合后,形成多個(gè)人臉圖像樣本。
優(yōu)選地,所述標(biāo)記特征點(diǎn)組合的原理為:相關(guān)特征點(diǎn)對(duì)之間的距離平方和為最小。
優(yōu)選地,所述標(biāo)記特征點(diǎn)組合的計(jì)算方法如下:當(dāng)存在旋轉(zhuǎn)、伸縮和移動(dòng)時(shí),相關(guān)特征點(diǎn)對(duì)之間的距離平方和為最小,即在二維形式下,坐標(biāo)變換可以寫為:
優(yōu)選地,有多對(duì)相關(guān)的坐標(biāo)集,上述公式擴(kuò)展為:
用偽逆方法解此線形方程系統(tǒng):命名左邊的矩陣為a,矢量形式的變量
偽逆解產(chǎn)生變換t是我們的初始目標(biāo),t最小化了
在知道如何組合兩組標(biāo)記了的特征點(diǎn)后,按如下的過程不斷組合特征點(diǎn):
(1)初始化
(2)對(duì)每一個(gè)人臉
(3)對(duì)每一人臉
(4)旋轉(zhuǎn)、平移和伸縮特征坐標(biāo)
(5)轉(zhuǎn)第2步;
(6)迭代多次后收斂,產(chǎn)生每一人臉與其它人臉組合的變換。
優(yōu)選地,所述步驟(2)中預(yù)處理包括光照補(bǔ)償。
優(yōu)選地,所述光照補(bǔ)償包括線性光照模型補(bǔ)償。
優(yōu)選地,所述光照補(bǔ)償還包括商圖像補(bǔ)償。
本發(fā)明有益效果:
(1)本發(fā)明增加了非人臉的識(shí)別訓(xùn)練,能有效識(shí)別復(fù)雜背景中的人臉,人臉識(shí)別正確率可高達(dá)98%以上;
(2)圖像檢測前采用光照補(bǔ)償處理方法,能消除光照影響。
具體實(shí)施方式
下面結(jié)合具體實(shí)施方式對(duì)本發(fā)明做進(jìn)一步的說明。
實(shí)施例1
基于人工神經(jīng)網(wǎng)絡(luò)的人臉檢測識(shí)別方法,包括以下步驟:
(1)位置和姿態(tài)估計(jì):用神經(jīng)網(wǎng)絡(luò)分析圖像中潛在的臉部區(qū)域并確定臉部姿態(tài);
(2)預(yù)處理:圖像進(jìn)行預(yù)處理來改善圖像的亮度和對(duì)比度;
(3)檢測:在前兩步對(duì)圖像作位置、姿態(tài)和預(yù)處理后,由面檢測器檢測是否存在人臉;
(4)決斷:通過利用啟發(fā)式算法,將面檢測器的檢測結(jié)果合并在一起作決斷,來增強(qiáng)人臉檢測的正確率。
在人臉檢測識(shí)別前,還包括人臉檢測訓(xùn)練,訓(xùn)練方法如下:
(1)圖像樣本的處理,處理方法為:在20×20像素的窗口中,將圖像調(diào)整為統(tǒng)一的大小、位置和方位;圖像的擴(kuò)縮率為
(2)窗口輸入圖像樣本;
(3)訓(xùn)練神經(jīng)網(wǎng)絡(luò),對(duì)人臉圖像樣本輸出1,非人臉圖像樣本輸出-1;在循環(huán)的第一次迭代時(shí),隨即初始化網(wǎng)絡(luò)的權(quán)重;
(4)使用上一次訓(xùn)練計(jì)算的權(quán)重做為下一次訓(xùn)練的起點(diǎn)。
本實(shí)施例中,所述人臉訓(xùn)練所需的圖像樣本的生成方法如下:
(1)選擇初始人臉圖像;
(2)依據(jù)頭部的三維姿態(tài),在每張人臉圖樣上標(biāo)記特征點(diǎn);
(3)不同人臉上的標(biāo)記特征點(diǎn)組合;
(4)多次組合后,形成多個(gè)人臉圖像樣本。
其中所述標(biāo)記特征點(diǎn)組合的原理為:相關(guān)特征點(diǎn)對(duì)之間的距離平方和為最小。具體如下:
當(dāng)存在旋轉(zhuǎn)、伸縮和移動(dòng)時(shí),相關(guān)特征點(diǎn)對(duì)之間的距離平方和為最小,即在二維形式下,坐標(biāo)變換可以寫為:
如果有多對(duì)相關(guān)的坐標(biāo)集,可以擴(kuò)展為:
當(dāng)有兩對(duì)及以上的不同特征點(diǎn)時(shí),可以用偽逆方法(pseudo-inversemethod)解此線形方程系統(tǒng)。命名左邊的矩陣為a,矢量形式的變量
偽逆解產(chǎn)生變換t是我們的初始目標(biāo),t最小化了
在知道如何組合兩組標(biāo)記了的特征點(diǎn)后,按如下的過程不斷組合特征點(diǎn):
(1)初始化
(2)對(duì)每一個(gè)人臉
(3)對(duì)每一人臉
(4)旋轉(zhuǎn)、平移和伸縮特征坐標(biāo)
(5)轉(zhuǎn)第2步;
(6)迭代多次后收斂,產(chǎn)生每一人臉與其它人臉組合的變換。
實(shí)施例2
本實(shí)施例與實(shí)施例1不同在于,在人臉檢測識(shí)別的步驟(2)中預(yù)處理包括光照補(bǔ)償;其中所述光照補(bǔ)償包括線性光照模型補(bǔ)償。
線性光照模型補(bǔ)償?shù)奶幚矸椒椋杭僭O(shè)增加多個(gè)光源到場景中會(huì)導(dǎo)致圖像是每一個(gè)光源單獨(dú)作用下圖像的和。作者進(jìn)一步假設(shè)物體對(duì)一個(gè)獨(dú)立的光源服從lambertian光照模型,即光線在各個(gè)方向均勻地散射到物體表面。這意味著物體上一個(gè)點(diǎn)的亮度只依賴于物體的反射率和物體表面與光源方向間的角度,用以下方程(假設(shè)沒有陰影)表示:
其中
由于光源方向
實(shí)施例3
本實(shí)施例與實(shí)施例2的不同在于圖像光照補(bǔ)償采用商圖像補(bǔ)償方法。
商圖像補(bǔ)償方法為:反復(fù)使用線性光照模型,即通過將輸入圖像投影到一個(gè)線性模型集組成的線性光照空間中,模擬投影找到
其中,
輸入圖像被合成圖像相除,產(chǎn)生所謂的“商圖像”。商圖像只包含新臉部的反射率和平均臉,在此假設(shè)所有臉具有相同的形狀。再進(jìn)一步,在正面光照上乘以平均臉既得處理后的圖像:
以上所述僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是在本發(fā)明的構(gòu)思下,利用本發(fā)明說明書內(nèi)容所作的等效結(jié)構(gòu)變換,或直接/間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域均包括在本發(fā)明的專利保護(hù)范圍內(nèi)。