專利名稱:一種側(cè)面輪廓和人耳特征相結(jié)合的身份識(shí)別裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于基于人體生物特征的個(gè)人身份識(shí)別技術(shù),特別涉及人耳特征及人臉側(cè)面輪廓特征的測(cè)量與組合識(shí)別。
背景技術(shù):
身份識(shí)別是現(xiàn)代社會(huì)中人們經(jīng)常要遇到的問(wèn)題,例如在銀行、公安、網(wǎng)上購(gòu)物、商場(chǎng)、生活小區(qū)等需要安全檢驗(yàn)的場(chǎng)合都需要進(jìn)行身份識(shí)別。生物特征識(shí)別技術(shù)利用人類特有的生理(Physiological)或行為(Behavior)特征進(jìn)行自動(dòng)的身份識(shí)別和驗(yàn)證。是實(shí)現(xiàn)智能化社會(huì)保安和軍事安全的重要技術(shù)手段。特別是美國(guó)9.11事件以后各國(guó)政府對(duì)公共場(chǎng)合的反恐安全更加重視,利用人體特有的生物特征進(jìn)行身份識(shí)別受到了各國(guó)政府的高度重視。
生物特征識(shí)別技術(shù)與傳統(tǒng)的身份鑒別技術(shù)如身份證、IC卡、賬號(hào)密碼等方式相比具有很大的優(yōu)勢(shì),這是因?yàn)槿梭w生物特征是時(shí)刻跟隨自己的,不會(huì)丟失;另外生物特征復(fù)雜、仿造困難,這增加了可靠性和安全性。這些明顯的優(yōu)越性將使生物特征身份鑒別方式成為未來(lái)身份鑒別的主流方式。目前人們研究和使用的生物特征包括指紋、人臉、人耳、虹膜、視網(wǎng)膜、掌形、手勢(shì)、掌紋、聲紋、氣味、簽名、擊鍵習(xí)慣、步態(tài)等。
現(xiàn)有的根據(jù)側(cè)面輪廓進(jìn)行身份識(shí)別主要是通過(guò)攝像機(jī)獲取側(cè)面圖像,然后通過(guò)邊緣檢測(cè)得到人臉的側(cè)面輪廓,再根據(jù)側(cè)面輪廓上一些主要的特征點(diǎn)來(lái)得到人臉側(cè)面輪廓的結(jié)構(gòu)特征并進(jìn)行識(shí)別。存在的問(wèn)題是(1)通過(guò)邊緣檢測(cè)來(lái)獲取人的側(cè)面輪廓無(wú)法保證獲得非常精確的輪廓;(2)有研究表明,根據(jù)結(jié)構(gòu)特征進(jìn)行識(shí)別的可靠性較差,而根據(jù)統(tǒng)計(jì)特征進(jìn)行識(shí)別的可靠性則較好。
人耳識(shí)別是一種比較新的生物特征識(shí)別技術(shù),99年才開(kāi)始有相關(guān)的論文發(fā)表。人耳識(shí)別與其他生物特征識(shí)別相比具有其獨(dú)特的優(yōu)勢(shì),與指紋識(shí)別相比它具有非接觸的信息采集方式比較容易被人接受的優(yōu)點(diǎn),與人臉識(shí)別相比具有生物特征穩(wěn)定不變的優(yōu)點(diǎn)?,F(xiàn)有的人耳識(shí)別技術(shù)一般是根據(jù)攝像機(jī)拍攝的人耳圖像進(jìn)行識(shí)別,存在的一個(gè)問(wèn)題就是很難精確的在圖像中定位人耳的區(qū)域。由于人耳的顏色和人臉?lè)浅O嗨?,因此想要精確的在人的側(cè)臉上精確的定位人耳是一件非常困難的事情。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)上述根據(jù)側(cè)臉和人耳進(jìn)行識(shí)別的方法存在的不足而提供一種側(cè)臉和人耳相結(jié)合的組合識(shí)別裝置。
本發(fā)明的主要內(nèi)容為
采用攝像機(jī)獲取人的側(cè)面圖像信息,系統(tǒng)根據(jù)拍攝到的圖像自動(dòng)的移動(dòng)攝像機(jī)直到獲取到適合用于識(shí)別的圖像為止;從圖像中精確提取出人的側(cè)面輪廓并根據(jù)得到的側(cè)面輪廓進(jìn)行粗分類;根據(jù)粗分類結(jié)果精確的得到人耳的位置;在粗分類的結(jié)果中通過(guò)人耳進(jìn)行細(xì)分類,得到識(shí)別結(jié)果。
本發(fā)明的實(shí)現(xiàn)步驟如下1、訓(xùn)練時(shí)對(duì)每一個(gè)人拍攝不同角度的側(cè)面圖像,首先將每幅側(cè)面圖像進(jìn)行歸一化,然后對(duì)每幅圖像通過(guò)訓(xùn)練,得到每幅側(cè)面圖像對(duì)應(yīng)的側(cè)面輪廓特征向量,人耳的位置以及人耳的特征向量。
2、進(jìn)行識(shí)別時(shí)獲取包括人耳的人臉側(cè)面圖像可采用手持式的獲取裝置來(lái)獲取人的側(cè)面圖像,系統(tǒng)會(huì)根據(jù)拍攝到的圖像提示用戶移動(dòng)攝像機(jī);也可采用用戶不動(dòng),攝像機(jī)根據(jù)拍攝到的圖像自動(dòng)移動(dòng)相應(yīng)的位置的方法來(lái)獲取。
3、根據(jù)側(cè)面輪廓進(jìn)行粗分類,根據(jù)側(cè)面輪廓進(jìn)行分類目前多是根據(jù)側(cè)面輪廓的結(jié)構(gòu)信息來(lái)進(jìn)行分類的,但是,有研究表明,根據(jù)結(jié)構(gòu)信息進(jìn)行分類結(jié)果不穩(wěn)定,不如根據(jù)統(tǒng)計(jì)信息進(jìn)行分類的結(jié)果好,因此我們只是采用側(cè)面輪廓進(jìn)行粗分類,縮小后續(xù)識(shí)別的范圍。
4、對(duì)候選的每個(gè)輪廓,根據(jù)訓(xùn)練結(jié)果得到人耳的區(qū)域,然后提取該區(qū)域的特征,進(jìn)行識(shí)別,得到最終的識(shí)別結(jié)果。
本發(fā)明的優(yōu)點(diǎn)本發(fā)明與其它生物特征識(shí)別方法相比,具有以下幾個(gè)方面的優(yōu)勢(shì)(1)圖像獲取方便,與用戶的接口友好。與指紋、虹膜等生物特征的獲取相比更容易被人接受。
(2)圖像獲取設(shè)備成本低,壽命長(zhǎng),可維護(hù)性好。只需要普通的攝像機(jī)即可。
(3)根據(jù)側(cè)面輪廓識(shí)別可精確的得到人耳的位置,解決了人耳檢測(cè)與跟蹤的問(wèn)題。
(4)將基于結(jié)構(gòu)的側(cè)面輪廓識(shí)別與基于統(tǒng)計(jì)的人耳識(shí)別相結(jié)合,并考慮了人耳和側(cè)面輪廓的位置關(guān)系,可獲得較高的識(shí)別率和較快的識(shí)別速度。
圖1側(cè)臉和人耳結(jié)合的生物特征識(shí)別裝置系統(tǒng)流程圖;圖2通道式圖像獲取方式示意圖;圖3手持式圖像獲取方式示意圖;圖4側(cè)面輪廓提取示意圖;圖5側(cè)面輪廓識(shí)別示意圖;
圖6根據(jù)側(cè)面輪廓定位人耳區(qū)域示意圖;圖7人耳識(shí)別示意圖;圖8側(cè)臉在圖像中過(guò)于偏右和偏左的情況;圖9側(cè)臉在圖像中過(guò)于偏下和偏上的情況;圖10側(cè)臉在圖像中的合適位置。
具體實(shí)施例方式
本發(fā)明提出的側(cè)面輪廓和人耳特征相結(jié)合的身份識(shí)別裝置的系統(tǒng)流程圖如圖1所示,具體實(shí)施步驟如下步驟一圖像獲取圖像獲取是后續(xù)識(shí)別的基礎(chǔ)。獲取時(shí)可采用通道式獲取方式,如圖2所示,獲取圖像時(shí)用戶只需站立在攝像機(jī)的前面,系統(tǒng)根據(jù)拍攝到的圖像判斷圖像是否適合進(jìn)行識(shí)別,如不適合,則自動(dòng)的移動(dòng)攝像機(jī),直到拍攝到的圖像適合進(jìn)行識(shí)別為止;也可以采用手持式獲取方式,如圖3所示,他人或自己直接手持圖像獲取裝置獲取耳朵圖像,用提示音方式提示手動(dòng)的方向直到獲取到能用于識(shí)別的圖像為止。
步驟二提取側(cè)面輪廓系統(tǒng)獲取圖像之前先拍攝背景圖像,獲取到人的側(cè)面圖像后,減去背景圖像即可得到人的側(cè)面區(qū)域。從而得到側(cè)面輪廓。由于頭發(fā)的不穩(wěn)定性,我們只采用從鼻子上端開(kāi)始到下巴的這一段輪廓線進(jìn)行后續(xù)的操作,如圖4所示步驟三通過(guò)訓(xùn)練得到側(cè)臉輪廓特征,人耳的精確位置以及人耳的特征訓(xùn)練時(shí),對(duì)待識(shí)別的n個(gè)人,每人獲取m幅側(cè)面圖像,包括一定角度內(nèi)的旋轉(zhuǎn)。得到人的側(cè)面輪廓后,可以提取出側(cè)面輪廓上的特征點(diǎn)。具體提取方法如下首先將得到的側(cè)面輪廓用Freeman’s chain code表示,然后計(jì)算輪廓線上凹陷部分每點(diǎn)的曲率,可以得到5個(gè)曲率最大的點(diǎn)作為特征點(diǎn),如圖5的點(diǎn)A1,A4,A6,A8和A11所示;然后可以連接相鄰的兩個(gè)特征點(diǎn),得到四條線段A1A4,A4A6,A6A8以及A8A11,然后計(jì)算每?jī)蓚€(gè)特征點(diǎn)之間的輪廓線上到對(duì)應(yīng)線段上的垂直距離,距離最大的點(diǎn)也作為特征點(diǎn),如圖5的A2,A5,A7,A9所示;類似的,通過(guò)線段A2A4和A9A11,我們可以得到特征點(diǎn)A3和A10。這樣,我們就可以自動(dòng)準(zhǔn)確的得到11個(gè)特征點(diǎn)。
得到特征點(diǎn)之后,可以通過(guò)下面的方法來(lái)計(jì)算每個(gè)輪廓的特征設(shè)t1,t2,…,t10為表示距離的特征,t11,…,t19表示角度的特征,具體定義如下式所示
ti=AiAi+1‾hi=1,2,...10---(1)]]>h=110Σi=110AiAi+1‾---(2)]]>ti+10=∠AiAi+1Ai+2gi=1,2,...9---(3)]]>4g=19Σi=19∠AiAi+1Ai+2---(4)]]>則每個(gè)輪廓的特征向量為Tk=[t1,t2,…,t19] k=1,2,…,n×m。
我們選取A1和A4作為基準(zhǔn)點(diǎn),將所有訓(xùn)練樣本歸一化(包括大小和位置),然后手工標(biāo)出人耳的區(qū)域,如圖6示。
可以提取出n×m幅人耳圖像,然后對(duì)提取出的人耳進(jìn)行訓(xùn)練,此處我們采用經(jīng)典的PCA主成分分析方法進(jìn)行訓(xùn)練。設(shè)得到的n×m幅人耳圖像為Γ1,Γ2,Γ3,…,Γn×m,可以得到平均耳Ψ=1n×mΣi=1n×mΓi,]]>每幅人耳圖像與平均耳的差為Фi=Γi,-Ψ。則訓(xùn)練人耳圖像的協(xié)方差矩陣為C=1n×mΣi=1n×mΦiΦiT.]]>主成分分析就是要找到訓(xùn)練人耳圖像的協(xié)方差矩陣的最大的M個(gè)特征值λi,i=1,2,…,M以及與這些特征值對(duì)應(yīng)的特征向量ui,i=1,2,…,M。這些特征向量就形成了人耳空間的一組基。將每幅人耳圖像通過(guò)下式投影到人耳空間可得每幅人耳圖像在人耳空間中的坐標(biāo)ωjki=uiT(Γj-Ψ),i=1,2,...,M,j=1,2,...,n,k=1,2,...,m]]>則每幅人耳圖像在人耳空間的坐標(biāo)為Ωjk=[ωjk1,ωjk2,…,ωjkM,]j=1,2,…,nk=1,2,…,m同一個(gè)人的人耳圖像投影到人耳空間后得到的坐標(biāo)會(huì)聚集在一起,我們?nèi)⊥粋€(gè)人的人耳圖像投影到人耳空間后得到的坐標(biāo)的均值Ωj=1mΣk=1mΩjk]]>作為這個(gè)人的人耳的特征向量。
這樣對(duì)于每一幅側(cè)面圖像,我們得到的信息包括輪廓特征向量Tkk=1,2,…,n×m,人耳區(qū)域的位置,人耳的特征向量Ωj,k=1,2,…,n以及這幅圖像所屬的類別Lk,k=1,2,…,n。
步驟四根據(jù)側(cè)面輪廓進(jìn)行粗分類設(shè)Tkj表示第k個(gè)輪廓的第j個(gè)特征,sj表示輸入輪廓的第j個(gè)特征,則判別函數(shù)為fk=Σj=119ωj(Tkj-sj)2---(5)]]>其中ωj為權(quán)值,其計(jì)算方法如下(1)對(duì)于距離特征ωj=bjΣi=110bi---(6)]]>其中aj=1NRΣk=1NRTkj,bj=1NRΣk=1NR(Tkj-aj)2,]]>j=1,2,…,10。
(2)對(duì)于角度特征ωj=bjΣi=1119bi---(7)]]>其中aj=1NRΣk=1NRTkj,bj=1NRΣk=1NR(Tkj-aj)2,]]>j=11,12,…,19。
當(dāng)輸入一個(gè)側(cè)面輪廓進(jìn)行識(shí)別時(shí),與訓(xùn)練集中的Tkk=1,2,…,n×m計(jì)算式(5)的值,如果與Tk的距離小于某一給定閾值,則將Tk加入到候選輪廓中。需要指出的是,這一步只是進(jìn)行粗分類,把一些明顯不符合的候選輪廓去掉,減少后續(xù)步驟需要處理的數(shù)據(jù)量,因此閾值的設(shè)定比較寬松。
步驟五根據(jù)人耳細(xì)分類設(shè)經(jīng)過(guò)上一步的粗分類后,得到的候選集中包括H個(gè)候選輪廓,每個(gè)候選輪廓通過(guò)前面的訓(xùn)練可得到對(duì)應(yīng)的人耳的特征向量Ωi,i=1,2,…,H和所屬的類別信息Li,i=1,2,…,H。此時(shí)通過(guò)兩個(gè)基準(zhǔn)點(diǎn)A1,A4,將每個(gè)候選輪廓與訓(xùn)練集中的輪廓?dú)w一化,包括大小和位置都對(duì)齊,然后根據(jù)訓(xùn)練的結(jié)果,對(duì)于每一個(gè)候選輪廓都可以得到一個(gè)人耳區(qū)域,共得到H個(gè)人耳的候選區(qū)域,如圖7示,圖中的實(shí)線框表示正確的人耳區(qū)域,虛線框表示錯(cuò)誤的人耳區(qū)域。可以將每個(gè)候選的人耳區(qū)域投影到前面訓(xùn)練得到的人耳空間得到其在人耳空間中的坐標(biāo)Ω′i,i=1,2,…,H。計(jì)算該坐標(biāo)與其對(duì)應(yīng)的人耳的特征向量之間的距離di=‖Ω′i-Ωi‖,i=1,2,…,H。取dl=mini(di),]]>則最終的識(shí)別結(jié)果為L(zhǎng)l。
應(yīng)用舉例通道式身份識(shí)別裝置將攝像機(jī)放在通道一側(cè),人經(jīng)過(guò)時(shí)可拍攝到人的側(cè)面圖像。由于人的高矮不同以及站立的位置不同(相對(duì)攝像機(jī)偏前或者偏后),系統(tǒng)可自動(dòng)判斷并調(diào)整攝像機(jī)的位置(上下左右平移),以保證獲取到可用的圖像。由于事先拍攝了背景圖像,因此可以把拍攝到圖像與背景圖像相減,即可得到人的側(cè)面區(qū)域,如果該區(qū)域在圖像中過(guò)于偏右(左、上、下),如圖8圖9示,則將攝像機(jī)向左(右、下、上)移動(dòng)。判斷時(shí)可根據(jù)相減后的圖像的上邊(左邊、右邊)是否有黑色的背景區(qū)域來(lái)判斷。對(duì)于過(guò)于偏下的情況,可通過(guò)計(jì)算圖像中側(cè)臉區(qū)域得寬高比來(lái)判斷,如果比值大于某一閾值(由于人側(cè)面臉的高度與寬度之比一般在1.5-2之間,此處閾值可以設(shè)為2),則認(rèn)為圖像可用,否則將攝像機(jī)下移直到合適為止。拍攝到合適的圖像(如圖10)后,就可以采用上面提到的方法進(jìn)行身份識(shí)別。
手持式身份識(shí)別裝置攝像機(jī)安裝在手持裝置上,可以由自己或他人直接手持圖像獲取裝置獲取耳朵圖像,類似于通道式身份識(shí)別裝置獲取圖像的方法,根據(jù)拍攝到的側(cè)面區(qū)域在圖像中的位置,以提示音的方式提示手動(dòng)的方向直到獲取到能用于識(shí)別的圖像為止。然后采用上面提到的方法進(jìn)行身份識(shí)別。
權(quán)利要求
1.一種側(cè)面輪廓和人耳特征相結(jié)合的身份識(shí)別裝置,其特征在于采用攝像機(jī)獲取人的側(cè)面圖像信息,從圖像中精確提取出人的側(cè)面輪廓并根據(jù)得到的側(cè)面輪廓進(jìn)行粗分類;根據(jù)粗分類結(jié)果精確得到人耳的位置;在粗分類的結(jié)果中通過(guò)人耳進(jìn)行細(xì)分類,得到識(shí)別結(jié)果。
2.如權(quán)利要求1所述的一種側(cè)面輪廓和人耳特征相結(jié)合的身份識(shí)別裝置,其特征在于圖像獲取裝置可以安裝在上下左右運(yùn)動(dòng)的平臺(tái)上,該平臺(tái)置于門禁通道上,可以根據(jù)攝像機(jī)拍攝到的圖像判斷人的高低和前后位置,并自動(dòng)調(diào)整攝像機(jī)直到獲取到能用于識(shí)別的圖像為止。
3.如權(quán)利要求1所述的一種側(cè)面輪廓和人耳特征相結(jié)合的身份識(shí)別裝置,其特征在于圖像獲取裝置可以是直接手持裝置,他人或自己直接手持圖像獲取裝置獲取耳朵圖像,用提示音方式提示手動(dòng)的方向直到獲取到能用于識(shí)別的圖像為止。
全文摘要
本發(fā)明為一種將人臉的側(cè)面輪廓和人耳特征結(jié)合起來(lái)進(jìn)行身份識(shí)別的裝置,屬于生物特征識(shí)別技術(shù)。該裝置由圖像獲取裝置和計(jì)算裝置組成;圖像獲取裝置可以根據(jù)人耳的位置上下左右調(diào)整攝像機(jī)獲取清晰的人臉側(cè)面圖像;計(jì)算裝置根據(jù)獲取的圖像檢測(cè)出人臉的側(cè)面輪廓,根據(jù)側(cè)面輪廓進(jìn)行粗分類;在粗分類結(jié)果的基礎(chǔ)上,結(jié)合側(cè)面輪廓確定人耳的準(zhǔn)確位置,再利用人耳特征進(jìn)行精確分類,從而實(shí)現(xiàn)身份識(shí)別。
文檔編號(hào)G06K9/20GK1916936SQ20061012714
公開(kāi)日2007年2月21日 申請(qǐng)日期2006年9月7日 優(yōu)先權(quán)日2006年9月7日
發(fā)明者裴明濤, 賈云德 申請(qǐng)人:北京理工大學(xué)