專利名稱:基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,特別涉及一種在具有各種背景圖像中,且被旋轉(zhuǎn)過(guò)的人臉圖像識(shí)別的方法,屬于模式識(shí)別與人工智能技術(shù)領(lǐng)域。
背景技術(shù):
作為生物識(shí)別工程的重要組成部分,人臉檢測(cè)在身份鑒定、人物跟蹤等生物安全領(lǐng)域具有很大優(yōu)勢(shì)。其具有花費(fèi)低、無(wú)接觸、直觀、方便等優(yōu)點(diǎn)。其次,人臉檢測(cè)還可應(yīng)用于各種多媒體領(lǐng)域,如視頻會(huì)議、基于對(duì)象的數(shù)據(jù)編碼、基于內(nèi)容的視頻搜索、三維人臉合成等。并且,人臉檢測(cè)作為目標(biāo)檢測(cè)領(lǐng)域中的一個(gè)典型問(wèn)題,涵蓋了多方面學(xué)科的知識(shí),并對(duì)一般物體的檢測(cè)問(wèn)題具有重要的指導(dǎo)意義。
目前的人臉檢測(cè)方法可分為基于特征與基于統(tǒng)計(jì)兩方面。在這兩種方法的框架之下,發(fā)展了許多方法。Yuille等人運(yùn)用變形模板方法建立了一個(gè)描述人臉特征(如雙眼)的彈性模型。Yow等人利用了幾何、空間、灰度等特征對(duì)人臉進(jìn)行了判斷。
特征臉與支持向量機(jī)方法都屬于統(tǒng)計(jì)學(xué)習(xí)的范疇。其基本思想是從給定的正例和反例集合中歸納產(chǎn)生出接受最大范圍正例并排斥最大范圍反例的一般規(guī)則。其中,特征臉?lè)椒☉?yīng)用的比較廣泛。該方法利用卡胡內(nèi)-勞埃夫變換(Karhunen-Loeve Transform,簡(jiǎn)稱KL變換)產(chǎn)生的一組特征向量的加權(quán)線性組合來(lái)表示人臉。這一組特征向量就被稱為“特征臉”。支持向量機(jī)(Support Vector Machine,一種基于統(tǒng)計(jì)學(xué)習(xí)的分類方法,簡(jiǎn)稱SVM)是一種二次規(guī)劃方法,對(duì)兩類區(qū)分比較有效。神經(jīng)網(wǎng)絡(luò)也是一種基于樣本統(tǒng)計(jì)學(xué)習(xí)的方法。美國(guó)麻省理工學(xué)院(Massachusettes Instituteof Technology,簡(jiǎn)稱MIT)的研究者將人臉樣本集和非人臉樣本集的子類之間的距離作為識(shí)別特征向量,利用多層感知器(Multiple LevelProcessing,一種人工神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),簡(jiǎn)稱MLP)網(wǎng)絡(luò)作為分類器實(shí)現(xiàn)了人臉檢測(cè)。美國(guó)卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University,簡(jiǎn)稱CMU)的Rowley等人直接以圖像作為神經(jīng)網(wǎng)絡(luò)分類器,通過(guò)前饋神經(jīng)網(wǎng)絡(luò)對(duì)檢測(cè)結(jié)果優(yōu)化。
人臉的膚色在彩色空間中的分布相對(duì)來(lái)說(shuō)比較集中,因此利用這個(gè)特性也可以對(duì)包含人臉的彩色圖像進(jìn)行膚色提取。Hsu等人在YcbCr(一種彩色系統(tǒng),將彩色空間用三種坐標(biāo)Y,Cb,Cr表示)彩色空間內(nèi)建立了根據(jù)光照和背景變化的補(bǔ)償模型,并利用膚色模板確定了人臉區(qū)域。
近一段時(shí)期Viola等人利用AdaBoost(一種分層學(xué)習(xí)算法,其發(fā)明人根據(jù)該方法特征創(chuàng)造此名詞)算法進(jìn)行了人臉檢測(cè),取得了很好的效果。AdaBoost是一種基于統(tǒng)計(jì)的學(xué)習(xí)算法,能夠在學(xué)習(xí)過(guò)程中不斷根據(jù)正例反例中各個(gè)事先定義好的特征所起的效果調(diào)整該特征的權(quán)值,最終按照特征的性能由好到壞給出判斷準(zhǔn)則。
根據(jù)對(duì)國(guó)內(nèi)外人臉檢測(cè)技術(shù)的研究可以發(fā)現(xiàn)大部分方法都是對(duì)正面標(biāo)準(zhǔn)人臉進(jìn)行檢測(cè),一旦人臉在平面內(nèi)旋轉(zhuǎn),上述的就有可能失去效果。一些方法雖然對(duì)人臉旋轉(zhuǎn)進(jìn)行了檢測(cè),但主要集中在兩個(gè)研究方法上。第一是利用統(tǒng)計(jì)學(xué)習(xí)的方法,如神經(jīng)網(wǎng)絡(luò)等,對(duì)不同角度的輸入樣本進(jìn)行大量的學(xué)習(xí),從而能夠?qū)⒍嘟嵌热四樀那闆r包含到判別準(zhǔn)則中。這類方法首先需要大量的學(xué)習(xí)樣本,并且檢測(cè)效果受到這些樣本的影響很大,一旦測(cè)試集與學(xué)習(xí)集環(huán)境不同,就需要重新學(xué)習(xí)。第二種方法是根據(jù)各個(gè)角度分別進(jìn)行特征檢測(cè),即利用正面標(biāo)準(zhǔn)人臉的特征判別準(zhǔn)則,將人臉特征分別旋轉(zhuǎn)若干個(gè)角度對(duì)候選區(qū)域進(jìn)行檢測(cè)。這種方法需要對(duì)候選區(qū)域用每個(gè)角度都來(lái)判斷一遍,因此決定了角度范圍不能太多,之間的距離也很大,從而導(dǎo)致漏選。
由上述可知,大部分人臉檢測(cè)方法都僅對(duì)正面人臉姿態(tài)有效,但對(duì)人臉在平面內(nèi)旋轉(zhuǎn)較大角度卻沒(méi)有相應(yīng)的處理方法。因此,如果能夠?qū)ζ矫鎯?nèi)多角度人臉進(jìn)行檢測(cè)對(duì)可以提高系統(tǒng)在各種檢測(cè)環(huán)境如鏡頭搖擺、被測(cè)者不配合等情況下的識(shí)別率,同時(shí)可以提高在圖片與視頻檢索系統(tǒng)中的應(yīng)用范圍,并可應(yīng)用于其他旋轉(zhuǎn)物體的檢測(cè)。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,根據(jù)旋轉(zhuǎn)人臉的特征不變性,采用一種新的輻射模板對(duì)人臉進(jìn)行檢測(cè),根據(jù)在極坐標(biāo)系下人臉特征相對(duì)于旋轉(zhuǎn)中心體現(xiàn)的不依賴角度變換的特征,能夠判斷從0度到360度任意旋轉(zhuǎn)的人臉。
本發(fā)明的另一目的在于提供一種基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,可對(duì)平面內(nèi)多角度人臉進(jìn)行檢測(cè),可提高在各種檢測(cè)環(huán)境如鏡頭搖擺、被測(cè)者不配合等情況下的識(shí)別率,同時(shí)可以提高在圖片與視頻檢索系統(tǒng)中的應(yīng)用范圍。
本發(fā)明的目的是這樣實(shí)現(xiàn)的一種基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,至少包括步驟1取被檢測(cè)圖像的相應(yīng)區(qū)域的中心點(diǎn)作為輻射模板的中心點(diǎn),并初始化該輻射模板;步驟2計(jì)算輻射模板覆蓋區(qū)域中的每一點(diǎn),獲取該區(qū)域直方圖;步驟3根據(jù)人臉直方圖特征對(duì)該區(qū)域直方圖進(jìn)行特征匹配;步驟4獲取用于控制該人臉旋轉(zhuǎn)的方向數(shù)據(jù)。
上述初始化輻射模板的具體操作包括將該輻射模板的等分為一個(gè)以上的扇形,并設(shè)定sumk=0;αk=0;βk=0;其中
k為輻射模板的扇形序號(hào)值;αk與βk分別為兩個(gè)標(biāo)志量,表示第k個(gè)扇形是否為波峰或波谷;sumk為第k個(gè)扇形中的象素總數(shù)。
上述輻射模板直方圖計(jì)算包括步驟21取輻射模板覆蓋區(qū)域中一扇形中的一點(diǎn),如果該點(diǎn)滿足公式(x-i)2+(y-j)2<R,]]>則sumk=sumk+1;步驟22如果輻射模板覆蓋區(qū)域中的每一點(diǎn)都已計(jì)算,則結(jié)束;否則執(zhí)行步驟21;其中R為輻射模板的半徑;x,y分別為被計(jì)算點(diǎn)的笛卡兒坐標(biāo)中的橫向與縱向坐標(biāo)值;i,j分別是輻射模板圓心點(diǎn)的笛卡兒坐標(biāo)中的橫向與縱向坐標(biāo)值;k為被計(jì)算點(diǎn)所在的扇形序號(hào)值。
所述的特征匹配具體包括步驟31如果sumk>sumk+S-1modS,并且sumk>sumk+1modS,并且sumk<Pthreshold并且sumk<TThreshold;αk=1,βk=1;步驟32如果如下公式成立,Σk=0Sαk=3,]]>并且Σk=0Sβk=3,]]>并且|k-k′|<Wthreshold,αk=1并且αk′=1,則被計(jì)算的區(qū)域?yàn)橐蝗四樅蜻x區(qū)域;其中k為輻射模板的扇形序號(hào)值,k=0,1,…,S;k′為輻射模板中除扇形序號(hào)k以外的扇形序號(hào)值,k′=0,1,…,S;
S為輻射模板的扇形總數(shù);αk和αk′分別為表示第k和k’個(gè)扇形是否為波峰的標(biāo)志變量;βk為表示第k個(gè)扇形是否為波谷的標(biāo)志變量;PThreshold為扇形區(qū)域的波峰最大閾值;Ttthreshold為扇形區(qū)域的波谷最大閾值;Wthreshold為兩個(gè)波峰之間的最大間隔扇形數(shù),且0<Wthreshold<S。
所述的兩個(gè)波峰之間的最大間隔扇形數(shù)(即Wthreshold)的取值為5。
上述的步驟4具體包括步驟41根據(jù)如下公式計(jì)算三個(gè)波峰之間的距離最小值,得到代表雙眼的波峰扇形,|m-n|=min|k-k′|,且αk,k′,m,n=1;其中,m和n分別為代表雙眼扇形的編碼值;k為輻射模板的扇形序號(hào)值,k′為輻射模板中除扇形序號(hào)k以外的扇形序號(hào)值,k′=0,1,…,S;αk,k′,m,n為表示相應(yīng)扇形是否為波峰的標(biāo)志變量;步驟42對(duì)于編號(hào)值為t的扇形,如果m<t<n,且βt=1,則該扇形為人臉旋轉(zhuǎn)的方向標(biāo)志;其中m和n分別為代表雙眼扇形的編碼值;βt為表示第t個(gè)扇形是否為波谷的標(biāo)志變量。
上述被檢測(cè)圖像的相應(yīng)區(qū)域?yàn)榻?jīng)過(guò)邊緣提取的人臉候選區(qū)域,該邊緣提取的步驟如下步驟01從圖像中提取人臉?biāo)诘钠つw區(qū)域;其主要內(nèi)容為事先對(duì)大量人臉圖片進(jìn)行統(tǒng)計(jì),得到人臉膚色區(qū)域的像素分布概率,即每一種彩色像素值對(duì)應(yīng)一個(gè)是否屬于人臉膚色點(diǎn)的概率;提取時(shí)根據(jù)這些概率判斷實(shí)際采集的圖像中各個(gè)點(diǎn)的像素值是否屬于膚色點(diǎn)。
步驟02利用邊緣算子進(jìn)行方向性邊緣提取,得到皮膚區(qū)域內(nèi)的邊緣圖。其主要內(nèi)容是利用圖像處理學(xué)中的邊緣算子對(duì)膚色區(qū)域內(nèi)的輪廓線邊緣進(jìn)行提取,從而得到黑白二值化的邊緣圖像,顯示的像素點(diǎn)均為邊緣點(diǎn)。提取時(shí)采用水平、垂直、兩個(gè)對(duì)角線方向進(jìn)行邊緣提取,從而得到四個(gè)具有方向性的邊緣圖像。
本發(fā)明還進(jìn)一步包括根據(jù)獲得的人臉旋轉(zhuǎn)方向,將該旋轉(zhuǎn)人臉區(qū)域轉(zhuǎn)正到豎直。本發(fā)明中輻射模板的半徑根據(jù)被測(cè)區(qū)域確定,用以適應(yīng)人臉區(qū)域大小的差異。
本發(fā)明根據(jù)旋轉(zhuǎn)人臉的特征不變性,采用了一種新的輻射模板對(duì)人臉進(jìn)行檢測(cè),根據(jù)在極坐標(biāo)系下人臉特征相對(duì)于旋轉(zhuǎn)中心體現(xiàn)的不依賴角度變換的特征,能夠判斷從0度到360度任意旋轉(zhuǎn)的人臉;同時(shí),本發(fā)明可對(duì)平面內(nèi)多角度人臉進(jìn)行檢測(cè),可提高在各種檢測(cè)環(huán)境如鏡頭搖擺、被測(cè)者不配合等情況下的識(shí)別率,同時(shí)提高了在圖片與視頻檢索系統(tǒng)中的應(yīng)用范圍。
圖1為本發(fā)明輻射模板示意圖;圖2為本發(fā)明另一輻射模板示意圖;圖3為本發(fā)明輻射模板與直方圖對(duì)應(yīng)示意圖;圖4為本發(fā)明一實(shí)施例人臉輻射模板檢測(cè)示意圖;圖5為本發(fā)明另一實(shí)施例人臉輻射模板檢測(cè)示意圖;圖6為本發(fā)明帶有膚色及人臉邊緣預(yù)處理的輻射模板檢測(cè)原理流程示意圖。
具體實(shí)施例方式
以下結(jié)合附圖和具體的實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明本發(fā)明所述的旋轉(zhuǎn)人臉識(shí)別方法基于輻射模板,對(duì)一個(gè)圍繞其中心在平面內(nèi)旋轉(zhuǎn)的物體來(lái)說(shuō),如果我們?cè)谄湫D(zhuǎn)中心軸上觀察該物體,可以發(fā)現(xiàn)無(wú)論它在圓周內(nèi)旋轉(zhuǎn)多少角度,相對(duì)于它的中心,其形狀都保持不變;輻射模板就是用來(lái)提取出物體這一旋轉(zhuǎn)不變性的。
參見(jiàn)圖1和圖2,其為本發(fā)明的輻射模板示意圖,該模板為一個(gè)圓形,并且被分為若干輻射狀扇形區(qū)域。為了對(duì)不同人臉大小情況進(jìn)行處理,在輻射模板的基礎(chǔ)上又劃分了不同大小的若干同心圓,每一層同心圓表示一個(gè)模板,這樣圓形模板就有了不同的大小范圍,可以對(duì)不同大小人臉進(jìn)行檢測(cè)。
圖3為基于輻射模板的旋轉(zhuǎn)人臉識(shí)別原理示意圖。首先整個(gè)輻射模板被劃分為16個(gè)等面積扇形區(qū)域,按照逆時(shí)針從最上面開(kāi)始標(biāo)號(hào)為0至15。然后考慮人臉區(qū)域的邊緣特征,對(duì)正面人臉來(lái)說(shuō),如果按照垂直方向提取出其水平邊緣,結(jié)果將主要提取出雙眉、雙眼、嘴唇及鼻的下側(cè)邊緣特征。
統(tǒng)計(jì)每一個(gè)扇形區(qū)域內(nèi)的人臉邊緣點(diǎn)個(gè)數(shù)作為縱坐標(biāo),16個(gè)扇形區(qū)域作為橫坐標(biāo),則可以得到一個(gè)人臉區(qū)域邊緣點(diǎn)的直方圖。并且從圖中可以看出,直方圖明顯呈現(xiàn)出三個(gè)波峰、三個(gè)波谷(將第0號(hào)與15號(hào)扇形連接)的情況。之所以會(huì)出現(xiàn)這種信號(hào),是由于人臉的雙眼區(qū)域與嘴部呈現(xiàn)一種三角關(guān)系,即左右眼和嘴部邊緣比較集中,但左右眼之間、左眼與嘴、右眼與嘴之間均沒(méi)有明顯邊緣相連,因此體現(xiàn)在圓形模板的扇形區(qū)域中,就表現(xiàn)為這三個(gè)區(qū)域所落在的扇形內(nèi)數(shù)值較大,而三個(gè)區(qū)域之間的扇形區(qū)域數(shù)值較少。
值得注意的是如果不采取具有水平方向性的邊緣檢測(cè)而采用全方位邊緣檢測(cè),則會(huì)得到豎直方向的鼻子兩側(cè)和臉龐兩側(cè)邊緣線,這樣就會(huì)有邊緣落在原來(lái)數(shù)值為零的扇形區(qū)域里,導(dǎo)致雙眼和嘴的直方圖分界不明顯,無(wú)法出現(xiàn)三個(gè)波峰和波谷的特征。因此,邊緣檢測(cè)必須具有方向性。
采用圓形模板與扇形區(qū)域劃分,能夠在人臉邊緣旋轉(zhuǎn)后扇形區(qū)域直方圖仍能夠呈現(xiàn)三個(gè)波峰和波谷的特征,并且相對(duì)于正面人臉,直方圖在橫軸方向循環(huán)平移了若干單位。因此,對(duì)直方圖歸一化,就可以判斷所檢測(cè)區(qū)域是否滿足面部的三角關(guān)系。
因此,采用扇形輻射模板對(duì)進(jìn)行了方向性邊緣提取的圖像進(jìn)行檢測(cè),就可以得到包含人臉器官三角關(guān)系特征的候選區(qū)域。即滿足這種在輻射模板直方圖中呈現(xiàn)三個(gè)波峰、三個(gè)波谷的特征,同時(shí)又滿足一定閾值范圍的邊緣區(qū)域,就為人臉候選區(qū)域。
找到人臉候選區(qū)域后,因?yàn)樗锌赡苁切D(zhuǎn)的,還要找到它的旋轉(zhuǎn)角度。這一特征也可以通過(guò)人臉邊緣圖在輻射模板上的直方圖來(lái)得到。
如圖4所示。根據(jù)上面的分析,三個(gè)波谷代表雙眼之間和左右眼與嘴(包括鼻子)間的間隔。注意到正常人的雙眼之間間隔明顯小于他的左眼或右眼到其嘴部的間隔,即雙眼距離較近,每只眼睛距離嘴的距離較遠(yuǎn)。體現(xiàn)在輻射模板直方圖上就是有兩個(gè)波峰之間的距離明顯小于它們到第三個(gè)波峰的距離。因此根據(jù)這一點(diǎn),就可以判定出這兩個(gè)波峰代表的扇形區(qū)域是雙眼的主要部分,另一個(gè)波峰代表的扇形區(qū)域是嘴和鼻子的主要部分。
在圖4的直方圖中,代表嘴和鼻子的波峰的左邊的波峰就是左眼,其右邊的波峰就是右眼。在左右眼之間的波谷代表雙眼之間的扇形,其方向垂直于雙眼和嘴的邊緣直線,豎直向上由圓心指向頭發(fā)的方向。這樣,通過(guò)直方圖就可以區(qū)分出人臉上的三個(gè)主要器官,并判斷出整個(gè)區(qū)域的旋轉(zhuǎn)方向。
參見(jiàn)圖4、圖5,人臉?lè)謩e逆時(shí)針旋轉(zhuǎn)了45度和順時(shí)針旋轉(zhuǎn)了45度。從該圖中可以看出,在扇形區(qū)域的直方圖表示中,相對(duì)于正面,另外兩個(gè)直方圖分別向右、向左滑動(dòng)了4個(gè)單位(循環(huán)滑動(dòng),第0與15號(hào)扇形相接),但仍保持三個(gè)波峰、三個(gè)波谷的特征,表示了雙眼和嘴的邊緣在臉上的三角特征。
因此,采用扇形輻射模板對(duì)進(jìn)行了方向性邊緣提取的圖像進(jìn)行檢測(cè),就可以得到包含人臉器官三角關(guān)系特征的候選區(qū)域。即滿足這種在輻射模板直方圖中呈現(xiàn)三個(gè)波峰、三個(gè)波谷的特征,同時(shí)又滿足一定閾值范圍的邊緣區(qū)域,就為人臉候選區(qū)域。
找到人臉候選區(qū)域后,因?yàn)樗赡苁切D(zhuǎn)的,還要找到它的旋轉(zhuǎn)角度。這一特征也可以通過(guò)人臉邊緣圖在輻射模板上的直方圖來(lái)得到。根據(jù)上面的分析,三個(gè)波谷代表雙眼之間和左右眼與嘴(包括鼻子)間的間隔。正常人的雙眼之間間隔明顯小于他的左眼或右眼到其嘴部的間隔,即雙眼距離較近。每只眼睛距離嘴的距離較遠(yuǎn)。體現(xiàn)在輻射模板直方圖上就是有兩個(gè)波峰之間的距離明顯小于它們到第三個(gè)波峰的距離。因此根據(jù)這一點(diǎn),就可以判定出這兩個(gè)波峰代表的扇形區(qū)域是雙眼的主要部分,另一個(gè)波峰代表的扇形區(qū)域是嘴和鼻子的主要部分。
如果輻射模板的標(biāo)號(hào)按照?qǐng)D1所示,則在直方圖中,代表嘴和鼻子的波峰左邊的波峰就是左眼,其右邊的波峰就是右眼。在左、右眼之間的波谷代表雙眼之間的扇形,其方向垂直于雙眼和嘴的邊緣直線,豎直向上由圓心指向頭發(fā)的方向。如圖3所示。這樣,通過(guò)直方圖我們就可以區(qū)分出人臉上的三個(gè)主要器官,并判斷出整個(gè)區(qū)域的旋轉(zhuǎn)方向。
參見(jiàn)圖6,在實(shí)際應(yīng)用中為了提高針對(duì)人臉檢測(cè)的效果,還可以附加一些輔助步驟。下面給出一套應(yīng)用輻射模板的搜索匹配算法進(jìn)行旋轉(zhuǎn)人臉檢測(cè)的系統(tǒng),它的主要原理是首先,通過(guò)膚色模型提取出人臉?biāo)诘钠つw區(qū)域從而減少搜索時(shí)間;然后,利用邊緣算子進(jìn)行方向性邊緣提取,得到皮膚區(qū)域內(nèi)的邊緣圖;再在邊緣圖像上應(yīng)用輻射模板進(jìn)行人臉候選區(qū)域的搜索并得到其旋轉(zhuǎn)方向;最后將旋轉(zhuǎn)人臉區(qū)域轉(zhuǎn)正到豎直,并利用一個(gè)豎直人臉檢測(cè)器進(jìn)行最終判斷從而得到人臉檢測(cè)結(jié)果。
如圖6所示,旋轉(zhuǎn)人臉檢測(cè)的步驟包括,膚色檢測(cè)、邊緣檢測(cè)、輻射模板特征搜索以及豎直人臉檢測(cè)。
其中膚色檢測(cè)、邊緣檢測(cè)實(shí)際上是對(duì)圖像進(jìn)行預(yù)處理的過(guò)程。在采用輻射模板進(jìn)行檢測(cè)之前,為了節(jié)省計(jì)算時(shí)間,首先采用膚色模型對(duì)彩色輸入照片進(jìn)行預(yù)處理,得到膚色候選區(qū)域后再對(duì)該區(qū)域進(jìn)行邊緣檢測(cè)。進(jìn)行膚色檢測(cè)的時(shí)候,根據(jù)大量統(tǒng)計(jì)學(xué)習(xí)得到的結(jié)果進(jìn)行檢測(cè),對(duì)目標(biāo)圖象中每一個(gè)像素點(diǎn)進(jìn)行閾值判斷,大于膚色概率的認(rèn)為是膚色點(diǎn),否則認(rèn)為不是膚色點(diǎn)。然后進(jìn)行具有方向性的邊緣檢測(cè),得到皮膚邊緣內(nèi)的邊緣圖。之所以采取具有方向性的邊緣檢測(cè),是為了避免雙眼和嘴的其他邊緣被檢測(cè)到,這樣必然會(huì)影響識(shí)別結(jié)果。邊緣檢測(cè)可以按照垂直方向提取水平邊緣,同理可以提取垂直邊緣、對(duì)角線邊緣,具體提取哪幾個(gè)邊緣信息,可視具體情況而定。
膚色檢測(cè)、邊緣檢測(cè)之后就進(jìn)行輻射模板特征搜索,特征搜索時(shí)采用的輻射模板的級(jí)數(shù)可視邊緣提取的結(jié)果而定。特征搜索過(guò)程可分為第一步,搜索至人臉邊緣圖中某一區(qū)域A時(shí),設(shè)其中心坐標(biāo)為(i,j)。
第二步,初始化輻射模板;將其分成不同級(jí)大小,接著針對(duì)每一級(jí)模板進(jìn)行搜索,設(shè)其半徑為R,sumk=0是第k個(gè)扇形中的象素總數(shù),αk=0與βk=0是兩個(gè)標(biāo)志量,分別表示第k個(gè)扇形是否為波峰或波谷。這里k=0,1,…,15。
第三步,計(jì)算輻射模板直方圖;對(duì)區(qū)域中的每一點(diǎn)(x,y)如果它落在模板圓形區(qū)域內(nèi),即(x-i)2+(y-j)2<R,]]>則令sumk=sumk+1,當(dāng)且僅當(dāng)(x,y)屬于扇形k而且該點(diǎn)是經(jīng)過(guò)邊緣提取后得到的輪廓線邊緣點(diǎn),這里k可以為0,1,…,15。
第四步,特征匹配;1.對(duì)k=0,1,…,15
αk=1,當(dāng)且僅當(dāng)sumk>sumk+15mod16,sumk>sumk+1mod16,and sumk<PThresholdβk=1,當(dāng)且金當(dāng)sumk<sumk+15mod16,sumk<sumk+1mod16,and sumk<TThreshold2.如果滿足下列條件,區(qū)域A為一人臉候選區(qū)域;Σk=015αk=3,]]>Σk=015βk=3,]]>|k-k′|<WThreshold,αk=landαk′=1.
PThreshold=扇形區(qū)域的波峰最大閾值;TTthreshold=扇形區(qū)域的波谷最大閾值;WThreshold=兩個(gè)波峰之間的最大間隔扇形數(shù)。
PThreshold和TThreshold都與輻射模板的大小有關(guān),在本實(shí)施例中,Wthreshold的取值為5。
第五步,得到旋轉(zhuǎn)方向;1.對(duì)三個(gè)波峰,計(jì)算它們之間距離最小值,從而得到代表雙眼的兩個(gè)波峰扇形m和n,即|m-n|=min|k-k′|,αk,k′,m,n=12.扇形t為人臉旋轉(zhuǎn)方向標(biāo)志(即雙眼之間的扇形)如果滿足m<t<n且βt=1當(dāng)輻射模板找到某一個(gè)人臉候選區(qū)域并判斷出其旋轉(zhuǎn)角度后,就可以按照這一角度反向?qū)⒃搮^(qū)域轉(zhuǎn)回到豎直正面人臉狀態(tài),在灰度圖像中對(duì)這一區(qū)域進(jìn)行精確檢測(cè)。
本實(shí)施例中豎直正面人臉檢測(cè)方法是橫紋方法。此方法首先利用模糊化對(duì)圖像進(jìn)行處理,提取出圖像的橫向邊緣紋理,并將其按照像素的深度進(jìn)行重心歸一化,這樣人臉上各個(gè)器官在圖像上灰度較深,就會(huì)聚集成重心點(diǎn)。然后利用人臉器官特征模板進(jìn)行匹配,滿足人臉結(jié)構(gòu)關(guān)系,即有代表雙眼、鼻子和嘴的重心點(diǎn),則認(rèn)為是人臉。轉(zhuǎn)成正面人臉區(qū)域后,利用橫紋方法進(jìn)行精確檢測(cè),從而提高了整個(gè)系統(tǒng)的結(jié)果正確率。
由輻射模板的原理可以看出這種方法不單可以應(yīng)用到人臉檢測(cè),還可以應(yīng)用在其他旋轉(zhuǎn)物體的檢測(cè)上;例如可以建立對(duì)平面內(nèi)旋轉(zhuǎn)飛機(jī)圖像的檢測(cè)模型,以及在衛(wèi)星圖像中,地面目標(biāo)中的物體如飛機(jī)、車(chē)輛、艦船、建筑物等均可能在圖像中以不同角度旋轉(zhuǎn)出現(xiàn),因此采用輻射模板均可以進(jìn)行檢測(cè)。
最后應(yīng)說(shuō)明的是以上實(shí)施例僅用以說(shuō)明本發(fā)明而并非限制本發(fā)明所描述的技術(shù)方案;因此,盡管本說(shuō)明書(shū)參照上述的各個(gè)實(shí)施例對(duì)本發(fā)明已進(jìn)行了詳細(xì)的說(shuō)明,但是,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,仍然可以對(duì)本發(fā)明進(jìn)行修改或者等同替換;而一切不脫離本發(fā)明的精神和范圍的技術(shù)方案及其改進(jìn),其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
權(quán)利要求
1.一種基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,其特征在于該方法至少包括步驟1取被檢測(cè)圖像的相應(yīng)區(qū)域的中心點(diǎn)作為輻射模板的中心點(diǎn),并初始化該輻射模板;步驟2計(jì)算輻射模板覆蓋區(qū)域中的每一點(diǎn),獲取該區(qū)域直方圖;步驟3根據(jù)人臉直方圖特征對(duì)該區(qū)域直方圖進(jìn)行特征匹配;步驟4獲取用于控制該人臉旋轉(zhuǎn)的方向數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,其特征在于初始化輻射模板的具體操作包括將該輻射模板的等分為一個(gè)以上的扇形,并設(shè)定sumk=0;αk=0;βk=0;其中k為輻射模板的扇形序號(hào)值;αk與βk分別為兩個(gè)標(biāo)志量,表示第k個(gè)扇形是否為波峰或波谷;sumk為第k個(gè)扇形中的象素總數(shù)。
3.根據(jù)權(quán)利要求1所述的基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,其特征在于輻射模板直方圖計(jì)算包括步驟21取輻射模板覆蓋區(qū)域中一扇形中的一點(diǎn),如果該點(diǎn)滿足公式(x-i)2+(y-j)2<R,]]>則sumk=sumk+1;步驟22如果輻射模板覆蓋區(qū)域中的每一點(diǎn)都已計(jì)算,則結(jié)束;否則執(zhí)行步驟21;其中R為輻射模板的半徑;x,y分別為被計(jì)算點(diǎn)的笛卡兒坐標(biāo)中的橫向與縱向坐標(biāo)值;i,j分別是輻射模板圓心點(diǎn)的笛卡兒坐標(biāo)中的橫向與縱向坐標(biāo)值;k為被計(jì)算點(diǎn)所在的扇形序號(hào)值。
4.根據(jù)權(quán)利要求1所述的基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,其特征在于所述的特征匹配具體包括步驟31如果sumk>sumk+S-1modS,并且sumk>sumk+1modS,并且sumk<Pthreshold并且sumk<TThreshold;則αk=1,βk=1;步驟32如果如下公式成立,Σk=0Sαk=3,]]>并且Σk=0Sβk=3,]]>并且|k-k′|<Wthreshold,αk=1并且αk′=1,則被計(jì)算的區(qū)域?yàn)橐蝗四樅蜻x區(qū)域;其中k為輻射模板的扇形序號(hào)值,k=0,1,…,S;k′為輻射模板中除扇形序號(hào)k以外的扇形序號(hào)值,k′=0,1,…,S;S為輻射模板的扇形總數(shù);αk和αk′分別為表示第k和k’個(gè)扇形是否為波峰的標(biāo)志變量;βk為表示第k個(gè)扇形是否為波谷的標(biāo)志變量;PThreshold為扇形區(qū)域的波峰最大閾值;Ttthreshold為扇形區(qū)域的波谷最大閾值;Wthreshold為兩個(gè)波峰之間的最大間隔扇形數(shù),且0<Wthreshold<S。
5.根據(jù)權(quán)利要求4所述的基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,其特征在于所述的兩個(gè)波峰之間的最大間隔扇形數(shù)的取值范圍為5。
6.根據(jù)權(quán)利要求1所述的基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,其特征在于步驟4具體包括步驟41根據(jù)如下公式計(jì)算三個(gè)波峰之間的距離最小值,得到代表雙眼的波峰扇形,|m-n|=min|k-k′|,且αk,k′,m,n=1;其中,m和n分別為代表雙眼扇形的編碼值;k為輻射模板的扇形序號(hào)值,k′為輻射模板中除扇形序號(hào)k以外的扇形序號(hào)值,k′=0,1,…,S;αk,k′,m,n為表示相應(yīng)扇形是否為波峰的標(biāo)志變量;步驟42對(duì)于編號(hào)值為t的扇形,如果m<t<n,且βt=1,則該扇形為人臉旋轉(zhuǎn)的方向標(biāo)志;其中m和n分別為代表雙眼扇形的編碼值;βt為表示第t個(gè)扇形是否為波谷的標(biāo)志變量。
7.根據(jù)權(quán)利要求1-6所述的基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,其特征在于所述的區(qū)域?yàn)榻?jīng)過(guò)邊緣提取的人臉候選區(qū)域,該邊緣提取的步驟如下步驟01從圖像中提取人臉?biāo)诘钠つw區(qū)域;步驟02利用邊緣算子進(jìn)行方向性邊緣提取,得到皮膚區(qū)域內(nèi)的邊緣圖。
8.根據(jù)權(quán)利要求1所述的基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,其特征在于所述的方法進(jìn)一步包括根據(jù)獲得的人臉旋轉(zhuǎn)方向,將該旋轉(zhuǎn)人臉區(qū)域轉(zhuǎn)正到豎直。
9.根據(jù)權(quán)利要求1-4或6所述的基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,其特征在于所述輻射模板的半徑根據(jù)被測(cè)區(qū)域確定。
全文摘要
一種基于輻射模板的旋轉(zhuǎn)人臉檢測(cè)方法,至少包括取被檢測(cè)圖像的相應(yīng)區(qū)域的中心點(diǎn)作為輻射模板的中心點(diǎn),并初始化該輻射模板;計(jì)算輻射模板覆蓋區(qū)域中的每一點(diǎn),獲取該區(qū)域直方圖;根據(jù)人臉直方圖特征對(duì)該區(qū)域直方圖進(jìn)行特征匹配;獲取用于控制該人臉旋轉(zhuǎn)的方向數(shù)據(jù)。本發(fā)明根據(jù)旋轉(zhuǎn)人臉的特征不變性,采用了一種新的輻射模板對(duì)人臉進(jìn)行檢測(cè),根據(jù)在極坐標(biāo)系下人臉特征相對(duì)于旋轉(zhuǎn)中心體現(xiàn)的不依賴角度變換的特征,能夠判斷從0度到360度任意旋轉(zhuǎn)的人臉;同時(shí),本發(fā)明可對(duì)平面內(nèi)多角度人臉進(jìn)行檢測(cè),可提高在各種檢測(cè)環(huán)境如鏡頭搖擺、被測(cè)者不配合等情況下的識(shí)別率,同時(shí)提高了在圖片與視頻檢索系統(tǒng)中的應(yīng)用范圍。
文檔編號(hào)A61B5/117GK1502303SQ0215326
公開(kāi)日2004年6月9日 申請(qǐng)日期2002年11月26日 優(yōu)先權(quán)日2002年11月26日
發(fā)明者劉珩, 高文, 劉 珩 申請(qǐng)人:中國(guó)科學(xué)院計(jì)算技術(shù)研究所