近實時效應(yīng)的人眼檢測與定位方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計算機(jī)視覺領(lǐng)域,更具體的是一種具有近實時效應(yīng)的人眼檢測與定位 系統(tǒng)的實現(xiàn)。
【背景技術(shù)】
[0002] 人眼檢測技術(shù)在當(dāng)前的計算機(jī)視覺領(lǐng)域是最重要的發(fā)展趨勢之一。隨著裸眼3D技 術(shù)日趨成熟并逐漸走入我們的生活,如何讓人們更好地達(dá)到視覺上的享受,讓人們在全自 動的條件之下,得到最身臨其境的感受;同時,隨著計算機(jī)視覺領(lǐng)域的飛速發(fā)展,在人臉識 別研究中,眼睛作為重要的面部特征在人臉識別系統(tǒng)中也扮演著重要的角色。我們面臨的 現(xiàn)實情況使得人眼檢測與定位成為了我們研究的重要部分。
[0003] 然而,隨著背景復(fù)雜度的增強(qiáng),人眼定位系統(tǒng)的識別率極快的下降同時誤檢率極 大程度地上升。眼睛作為臉部特征的重要組成部分,它的檢測對于人臉信息的處理具有重 要的意義,因此只要人眼被精確定位,臉部其他各器官的位置定位也就變得簡單。眼睛的定 位還可以使人臉的歸一化得以較好地實現(xiàn),同時使得預(yù)處理的效果更加明顯。因而眼睛的 定位與人臉分割和人臉識別的結(jié)果直接相關(guān)。
[0004] 人臉檢測是一種非常復(fù)雜的模式識別技術(shù),這是因為人臉是一類具有復(fù)雜變化的 自然結(jié)構(gòu)目標(biāo),并且具有以下特征:(1)可變的模式,這是由于外貌、表情、膚色等的不同而 引起的;(2)人臉上可能存在眼鏡、胡須等附屬物;(3)人臉影像作為一種三維物體,很容易 受到光照產(chǎn)生的陰影的影響。目前人臉的檢測方法主要有基于知識的方法、基于特征的方 法、基于模板匹配的方法和基于外觀的方法?;谥R的方法,由于先驗知識的不完備性, 而使檢測能力受到限制;基于模板匹配的方法實現(xiàn)簡單,但檢測精度較低,且必須使用變形 模板才能檢測尺寸不同的人臉,而變形模板的參數(shù)調(diào)整是一個優(yōu)化的過程,耗時較長,實時 性差;基于外觀的方法可以達(dá)到較高的檢測精度,缺點是訓(xùn)練時間長,檢測速度慢,同時對 訓(xùn)練樣本的依賴性較強(qiáng)。
[0005] 人眼定位是人臉檢測中的關(guān)鍵步驟,當(dāng)前,對于人眼檢測定位,主要有兩種方式: 一種是首先在圖像中檢測人臉,然后在人臉區(qū)域中找到眼睛的位置,以此達(dá)到人眼檢測的 目的;另一種則直接在圖像中找到眼睛的位置。目前的人眼檢測與定位方法主要分為參數(shù) 可調(diào)的模型法(如霍夫變換、可變形眼睛模板)、眼角檢測法、特征眼法和對稱性檢測法。其 中參數(shù)可調(diào)的模型法需要定義一個能量函數(shù),通過調(diào)整模型參數(shù)使能量函數(shù)最小化,這種 思想好,但能量函數(shù)中的加權(quán)系數(shù)只能由經(jīng)驗確定,難以推廣,其次能量函數(shù)優(yōu)化過程十分 耗時,難以實際應(yīng)用。眼角檢測法通過Gabor濾波器檢測眼角,因此要求臉像尺寸較大,對圖 像質(zhì)量,尤其是眼角的對比度要求較高。特征眼檢測法由于事先不知人眼(或人臉)位置(以 及人臉是否傾斜),因此對圖像中對稱點的搜索十分耗時。
[0006] 由于當(dāng)前的人眼檢測技術(shù)主要是依賴于人臉檢測技術(shù)的發(fā)展,眼睛區(qū)域在整幅圖 像中的面積較小,直接在圖像中實施眼睛檢測會因為目標(biāo)過小,致使精度不高而且人臉檢 測的效果將直接影響眼睛檢測的準(zhǔn)確性。與此同時,當(dāng)前研究主要針對正面人臉圖像比較 多,在人臉出現(xiàn)偏移和旋轉(zhuǎn)時檢測精度不高,因為此時圖像中人眼的部分信息會發(fā)生變化, 很難魯棒地檢測眼睛。
[0007] 人眼檢測涉及人臉檢測,當(dāng)前人臉檢測算法存在著一定的局限性制約人眼檢測, 本發(fā)明就此提出了一種將傳統(tǒng)、經(jīng)典的算法同先驗知識結(jié)合起來的方法從而實現(xiàn)近實時檢 測和定位人眼的目的。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明的目的是克服現(xiàn)有技術(shù)的上述不足,從魯棒性和精確性兩方面考慮,提供 一種基于Adaboost算法和模板匹配的人臉檢測和定位方法。在現(xiàn)有有限資源的基礎(chǔ)上,實 現(xiàn)對于人眼的正確檢測率和定位率的提高。本發(fā)明的技術(shù)方案如下:
[0009] -種近實時效應(yīng)的人眼檢測與定位方法,首先利用Adaboost算法找到人臉區(qū)域, 并在此基礎(chǔ)上運(yùn)用先驗知識縮小眼睛的位置范圍,分別將左右眼睛的位置估計出來;然后 進(jìn)行模板匹配,初步檢測到人臉區(qū)域,并確定人眼的候選區(qū)域,通過計算人眼平均模板和待 檢測圖像之間的相關(guān)系數(shù),通過相關(guān)程度來最終確定該候選區(qū)域是否為人眼區(qū)域;當(dāng)相關(guān) 系數(shù)大于預(yù)先設(shè)定好的閾值判斷該區(qū)域為人眼區(qū)域,框出此區(qū)域,否則便不是人眼的位置。 [0010] 其中的具體過程可以如下:
[0011]①用Haar特征的位置信息,對訓(xùn)練樣本進(jìn)行統(tǒng)計就可以得到對應(yīng)的特征參數(shù),一 個弱分類器h(x)包括一個類Haar特征的特征值b-個分類閾值~和一個分類方向Pj;
[0012] ②利用Adaboost算法訓(xùn)練強(qiáng)分類器,訓(xùn)練流程如下:
[0013] (1)給定一個訓(xùn)練集(叉1,71)(叉2,72)...^^)...(叉11,711)^是輸入的訓(xùn)練樣本, yi是分類的類別標(biāo)志。其中h表示第i個樣本,y = 〇時為負(fù)樣本,y = l時為正樣本,η為訓(xùn)練樣 本總數(shù),在人眼檢測中,0和1分別表示非人眼與人眼。
[0014] (2)初始化權(quán)重:設(shè)Dt(i)為第t次循環(huán)中第i個樣本的誤差權(quán)重,對于負(fù)樣本, A (0 = ,P為負(fù)樣本個數(shù);對于正樣本,只的=,q為正樣本個數(shù);
[0015] (3)對于t = l,2,3...T,進(jìn)行迭代訓(xùn)練,選取當(dāng)輪中的最佳弱分類器,迭代T次即代 表選取T個最佳弱分類器;
[0016] ③通過Adaboost算法,得到弱分類器,以此訓(xùn)練得到強(qiáng)分類器,再利用分類器進(jìn)行 人臉檢測;
[0017] ④令找到的臉部框的上邊緣中心為坐標(biāo)原點,上邊緣為X軸,縱向中心對稱線為y 軸,則可以將左眼鏡像的位置縮小為臉部左半邊自原點四分之一到二分之一的地方,同理, 右眼鏡像的位置縮小為臉部右半邊自原點四分之一到二分之一的地方,初步確定人眼位 置,稱之為候選區(qū)域;
[0018] ⑤基于模板匹配的方法,在圖像灰度層次上直接比較目標(biāo)模板和候選區(qū)域之間的 相似性,計算二者之間的相關(guān)系數(shù),衡量T和S i」之間的誤差,公式為:
[0019] 其中,T(m,n)為模板,Sij(m,n)為搜索圖;
[0020] ⑥根據(jù)不同的匹配方向選取誤差閾值Eo,當(dāng)E(i,j)>Eo時停止該點的計算,繼續(xù)下 一點的計算。
[0021] 本發(fā)明采用Adaboost訓(xùn)練強(qiáng)分類器的訓(xùn)練流程,將弱分類器提升為強(qiáng)分類器,極 大提高了分類器的分類性能。提出的基于Haar-like特征和Adaboost的人臉檢測算法能夠 有效地處理大多數(shù)的人臉檢測問題,能夠在一定角度和距離內(nèi)較為準(zhǔn)確定位人臉的位置。 在人眼定位的過程中,本發(fā)明采用幾何分析和模板匹配相結(jié)合的方法可以極大程度的提高 檢測效率及正確率。
【附圖說明】
[0022] 圖1人眼檢測定位系統(tǒng)結(jié)構(gòu)圖
[0023] 圖2 Adaboost算法訓(xùn)練示意圖
[0024] 圖3人臉識別過程 [0025]圖4模板匹配過程
[0026]圖5視頻人眼定位,其中(a)為臉的位置,(b)為眼睛的確切位置
【具體實施方式】
[0027] 首先利用Adaboost算法找到人臉區(qū)域,并在此基礎(chǔ)上合理運(yùn)用先驗知識縮小眼睛 的理論位置范圍,分別將左右眼睛的位置估計出來。然后進(jìn)行模板匹配,通過上面的工作, 己經(jīng)初步檢測到了人臉區(qū)域,并確定了人眼的大概位置,通過計算人眼平均模板和待檢測 圖像之間的相關(guān)系數(shù),通過相關(guān)程度來最終確定該候選區(qū)域是否為人眼區(qū)域。當(dāng)相關(guān)系數(shù) 大于預(yù)先設(shè)定好的閾值判斷該區(qū)域為人眼區(qū)域,框出此區(qū)域,否則便不是人眼的位置。具體 過程如下:
[0028] 1、首先用Haar特征的位置信息,對訓(xùn)練樣本進(jìn)行統(tǒng)計就可以得到對應(yīng)的特征參 數(shù)。一個弱分類器h(x)包括一個類Haar特征的特征值一個分類閾值~和一個分類方向 Pj(通常為+1或者-1),它的形式為
[0029]
[0030] 其中,對于每一個特征,選擇閾值~