面部識別的制作方法
【專利摘要】本發(fā)明涉及面部識別。一方面,本發(fā)明公開了一種數(shù)字信號處理器和方法,應(yīng)用它們在精簡數(shù)目的時(shí)鐘周期內(nèi)進(jìn)行對象檢測,包括面部檢測。該方法包括使用索貝爾邊緣檢測來識別多邊緣區(qū)域并且將這些區(qū)域分類為前景候選區(qū)域。前景候選區(qū)域進(jìn)一步被檢查垂直或水平對稱,對稱的窗口被分類為面部候選。只有對那些被確定為面部候選窗口進(jìn)行維奧拉-瓊斯(Viola-Jones)面部檢測。
【專利說明】面部識別
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理領(lǐng)域,更具體地,涉及一種基于邊緣的對象檢測系統(tǒng)和方法。
【背景技術(shù)】
[0002] 2001年由保羅·維奧拉(Paul Viola)和邁克爾?瓊斯(Michael Jones)提出的 對象檢測框架在本領(lǐng)域被熟知。維奧拉-瓊斯(Viola-Jones)運(yùn)算通過計(jì)算圖像矩形區(qū)域 像素的總和。Viola-Jones框架在查找圖像的水平和垂直特性方面(如邊緣)比較精確,在 分辨率方面則比較粗糙。
【專利附圖】
【附圖說明】
[0003] 查看附圖時(shí)結(jié)合下列詳細(xì)說明有助于理解本發(fā)明。需要強(qiáng)調(diào)的是按照行業(yè)標(biāo)準(zhǔn)做 法,附圖中各種特征的繪制僅用于說明。事實(shí)上,為了清晰地論述問題,各種特征的一些大 小可能被增加或縮減。
[0004] 圖1是灰階數(shù)字圖片的圖像顯示。
[0005] 圖2是使用索貝爾算子計(jì)算出圖1的邊緣檢測圖像。
[0006] 圖2A是從圖2的邊緣圖像中選擇的面部放大圖。
[0007] 圖3是依據(jù)本說明書的示例硬件平臺(tái)方框圖。
[0008] 圖4是依照本說明書的示例方法的流程圖。
[0009] 圖5是使用Viola-Jones檢測方法的示例圖形特性方框圖。
【發(fā)明內(nèi)容】
[0010] 一方面,公開了一種對象檢測方法,使用數(shù)字信號處理器在時(shí)鐘周期消耗降低的 情況下去識別數(shù)字圖像前景區(qū)域內(nèi)感興趣的對象,該方法包括將數(shù)字圖像分割成多個(gè)窗 口;對每個(gè)窗口進(jìn)行邊緣檢測;將每個(gè)窗口分類為前景候選或背景候選,其中分類包括計(jì) 算該窗口中的邊緣數(shù),僅當(dāng)窗口的邊緣數(shù)目大于閾值時(shí)將該窗口分類為前景候選,僅在分 類為前景候選的那些窗口才進(jìn)行附加的對象檢測。
[0011] 另一方面,公開了一種存儲(chǔ)著數(shù)字信號處理器的軟件指令集的有形的計(jì)算機(jī)可讀 存儲(chǔ)介質(zhì),該指令集適用于在時(shí)鐘周期消耗降低的情況下識別數(shù)字圖像前景區(qū)域內(nèi)感興趣 的對象,該指令集被配置以指導(dǎo)處理器將數(shù)字圖像分割成多個(gè)窗口;對每個(gè)窗口進(jìn)行邊緣 檢測;將每個(gè)窗口分類為前景候選或背景候選,其中分類包括計(jì)算該窗口中的邊緣數(shù),僅當(dāng) 窗口的邊緣數(shù)目大于閾值時(shí)將該窗口劃定為前景候選,僅在分類為前景候選的那些窗口進(jìn) 行附加的對象檢測。
[0012] 一種數(shù)字信號處理系統(tǒng)被配置以在時(shí)鐘周期消耗降低的情況下識別數(shù)字圖像前 景區(qū)域內(nèi)感興趣的對象,該系統(tǒng)包括處理器;和與處理器耦合通信的存儲(chǔ)指令集的存儲(chǔ)器, 當(dāng)執(zhí)行時(shí),指令處理器將數(shù)字圖像分割成多個(gè)窗口;對每個(gè)窗口進(jìn)行邊緣檢測;將每個(gè)窗 口分類為前景候選或背景候選,其中分類包括計(jì)算該窗口中邊緣數(shù),僅當(dāng)窗口邊緣數(shù)目大 于閾值時(shí)將窗口分類為前景候選;僅在分類為前景候選的那些窗口進(jìn)行附加的對象檢測。
【具體實(shí)施方式】
[0013] 下面提供許多不同的實(shí)施方案或示例用于實(shí)現(xiàn)本發(fā)明的不同功能。描述元件和組 合的特定示例用以簡要地說明本發(fā)明。當(dāng)然,這些僅僅是示例,并不旨在進(jìn)行限制。進(jìn)一步 地,本發(fā)明會(huì)在各種示例中重復(fù)一些相關(guān)的數(shù)字和字母或字母。這種重復(fù)不是為了決定所 討論的各種實(shí)施方案和/或配置之間的關(guān)系而是為了簡化和明晰其關(guān)系。
[0014] 不同的實(shí)施方案中有不同的優(yōu)勢,并沒有獨(dú)特的優(yōu)勢是實(shí)施方案所必須的。
[0015] 示例方法采用灰度位圖圖像為例。一幅灰度圖像可以被表示為一個(gè)大型的整型二 維數(shù)組,其中每個(gè)像素被定義了一個(gè)介于〇(純黑色,或完全沒有亮度)到1 (純白色,所有 亮度的總和)范圍內(nèi)的亮度值。亮度值在理論上是一個(gè)精確的分?jǐn)?shù)值,然而在實(shí)踐中分辨 率被位深所限制,使用整數(shù)值來代表分?jǐn)?shù)值(以16位為例,使用整數(shù)I代表十進(jìn)制數(shù)值n, 其中
【權(quán)利要求】
1. 一種對象檢測方法,在數(shù)字信號處理器上被執(zhí)行,用于在時(shí)鐘周期消耗降低的情況 下識別數(shù)字圖像前景區(qū)域內(nèi)感興趣的對象,所述方法包括: 將所述數(shù)字圖像分割成多個(gè)窗口; 對每個(gè)窗口進(jìn)行邊緣檢測; 將每個(gè)窗口分類為前景候選或背景候選,其中,分類包括計(jì)算所述窗口的邊緣數(shù),僅當(dāng) 窗口邊緣數(shù)目大于闊值時(shí)將窗口分類為前景候選; 僅在分類為前景候選的那些窗口進(jìn)行附加的對象檢測。
2. 如權(quán)利要求1所述的對象檢測方法,其中在每個(gè)窗口中進(jìn)行邊緣檢測包括對數(shù)字圖 像中的每個(gè)像素執(zhí)行索貝爾算子,所述索貝爾算子具有5X5像素核也。
3. 如權(quán)利要求1所述的對象檢測方法,還包括細(xì)分類每一個(gè)前景候選窗口作為對象候 選或非對象候選窗口,并且只在對象候選窗口執(zhí)行附加的對象檢測。
4. 如權(quán)利要求3所述的對象檢測方法,其中細(xì)分類每一前景候選窗口作為對象候選窗 口或非對象候選窗口,包括: 將所述窗口細(xì)拆分為兩個(gè)垂直的子窗口; 計(jì)算每個(gè)垂直子窗口的邊緣數(shù)量; 將每個(gè)垂直子窗口的邊緣數(shù)量與第二闊值進(jìn)行比較;僅當(dāng)在每一個(gè)垂直子窗口的邊緣 數(shù)目大于所述第二闊值時(shí)細(xì)分類窗口為對象候選窗口。
5. 如權(quán)利要求3中的對象檢測方法,其中將所述數(shù)字圖像分割成多個(gè)窗口包括;根據(jù) 被檢測對象期望的大小范圍,選擇比例因子、最小窗口大小和最大窗口大小。
6. 如權(quán)利要求3所述的對象檢測方法,其中將所述數(shù)字圖像分割成多個(gè)窗口,包括: 對于每個(gè)窗口,從前一個(gè)窗口動(dòng)態(tài)地選擇偏移量6.V; 其中將窗口分類為背景候選窗口所選擇的偏移量?化'大于將窗口分類為前景候選窗 口所選擇的偏移量化。
7. 如權(quán)利要求1所述的對象檢測方法,其中分類每個(gè)窗口作為前景候選或背景候選包 括: 比較所述窗口與基準(zhǔn)圖像中相應(yīng)窗口,如果所述窗口與所述相應(yīng)窗口基本相同的話, 把所述窗口分類為背景窗口。
8. -種存儲(chǔ)數(shù)字信號處理器的軟件指令集的有形的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述指令集 適用于在時(shí)鐘周期消耗降低的情況下識別數(shù)字圖像前景區(qū)域內(nèi)感興趣的對象,所述指令集 被配置W指導(dǎo)處理器: 將所述數(shù)字圖像分割成多個(gè)窗口; 對每個(gè)窗口進(jìn)行邊緣檢測; 將每個(gè)窗口分類為前景候選或背景候選,其中,分類包括計(jì)算所述窗口中的邊緣數(shù),僅 當(dāng)窗口邊緣數(shù)目大于闊值時(shí)將窗口分類為前景候選;僅在分類為前景候選的那些窗口進(jìn)行 附加的對象檢測。
9. 如權(quán)利要求8所述的有形的計(jì)算機(jī)存儲(chǔ)介質(zhì),其中在每個(gè)窗口中進(jìn)行邊緣檢測包括 對數(shù)字圖像中的每個(gè)像素執(zhí)行索貝爾算子,所述索貝爾算子具有5X5像素核也。
10. 如權(quán)利要求8所述的有形的計(jì)算機(jī)存儲(chǔ)介質(zhì),還包括細(xì)分類每一個(gè)前景候選窗口 作為面部候選窗口或非面部候選窗口,并且只在面部候選窗口執(zhí)行對象檢測。
11. 如權(quán)利要求10所述的有形的計(jì)算機(jī)存儲(chǔ)介質(zhì),其中細(xì)分類每一前景候選窗口作為 對象候選窗口或非對象候選窗口,包括: 將所述窗口細(xì)拆分為兩個(gè)垂直的子窗口; 計(jì)算每個(gè)垂直子窗口的邊緣數(shù)量; 將每個(gè)垂直子窗口的邊緣數(shù)量與第二闊值進(jìn)行比較;僅當(dāng)在每一個(gè)垂直子窗口的邊緣 數(shù)目大于所述第二闊值時(shí)細(xì)分類窗口為對象候選窗口。
12. 如權(quán)利要求10所述的有形的計(jì)算機(jī)存儲(chǔ)介質(zhì),其中將所述數(shù)字圖像分割成多個(gè)窗 口包括;根據(jù)被檢測對象期望的大小范圍,選擇比例因子、最小窗口大小和最大窗口大小。
13. 如權(quán)利要求8所述的有形的計(jì)算機(jī)存儲(chǔ)介質(zhì),將所述數(shù)字圖像分割成多個(gè)窗口,包 括: 對于每個(gè)窗口,從前一個(gè)窗口動(dòng)態(tài)地選擇偏移量3Y; 其中將窗口分類為背景候選窗口所選擇的偏移量AY;大于將窗口分類為前景候選窗口 所選擇的偏移量i.f.
14. 如權(quán)利要求8所述的有形的計(jì)算機(jī)存儲(chǔ)介質(zhì),其中分類每個(gè)窗口作為前景候選或 背景候選包括: 比較所述窗口與基準(zhǔn)圖像中相應(yīng)窗口,如果所述窗口與所述相應(yīng)窗口基本相同的話, 把所述窗口分類為背景窗口。
15. -種數(shù)字信號處理系統(tǒng)被配置W在時(shí)鐘周期消耗降低的情況下識別數(shù)字圖像前景 區(qū)域內(nèi)感興趣的對象,所述系統(tǒng)包括: 處理器和 與處理器禪合通信的存儲(chǔ)指令集的存儲(chǔ)器,當(dāng)執(zhí)行時(shí),指導(dǎo)處理器: 將所述數(shù)字圖像分割成多個(gè)窗口; 對每個(gè)窗口進(jìn)行邊緣檢測; 將每個(gè)窗口分類為前景候選或背景候選,其中分類包括計(jì)算所述窗口的邊緣數(shù),僅當(dāng) 窗口邊緣數(shù)目大于闊值時(shí)將窗口分類為前景候選; 僅在分類為前景候選的那些窗口進(jìn)行附加的對象檢測。
16. 如權(quán)利要求15所述的數(shù)字信號處理系統(tǒng),其中在每個(gè)窗口中進(jìn)行邊檢測包括對數(shù) 字圖像中的每個(gè)像素執(zhí)行索貝爾算子,所述索貝爾算子具有5X5像素核也。
17. 如權(quán)利要求15所述的數(shù)字信號處理系統(tǒng),還包括細(xì)分類每一個(gè)前景候選窗口作為 面部候選窗口或非面部候選窗口,并且只在面部候選窗口執(zhí)行對象檢測。
18. 如權(quán)利要求17所述的數(shù)字信號處理系統(tǒng),其中細(xì)分類每一前景候選窗口作為對象 候選窗口或非對象候選窗口,包括: 將所述窗口細(xì)拆分為兩個(gè)垂直的子窗口; 計(jì)算每個(gè)垂直子窗口的邊緣數(shù)量; 將每個(gè)垂直子窗口的邊緣數(shù)量與第二闊值進(jìn)行比較;僅當(dāng)在每一個(gè)垂直子窗口的邊緣 數(shù)目大于所述第二闊值時(shí)細(xì)分類窗口為對象候選窗口。
19. 如權(quán)利要求17所述的數(shù)字信號處理系統(tǒng),其中將所述數(shù)字圖像分割成多個(gè)窗口包 括;根據(jù)被檢測對象期望的大小范圍,選擇比例因子、最小窗口大小和最大窗口大小。
20. 如權(quán)利要求15所述的數(shù)字信號處理系統(tǒng),其中將所述數(shù)字圖像分割成多個(gè)窗口, 包括: 從前一個(gè)窗口動(dòng)態(tài)地選擇偏移量》'; 其中將窗口分類為背景候選窗口所選擇的偏移量化乂于將窗口分類為前景候選窗口 所選擇的偏移量SA'。
21. 如權(quán)利要求15所述的數(shù)字信號處理系統(tǒng),其中分類每個(gè)窗口作為前景候選或背景 候選包括: 比較所述窗口與基準(zhǔn)圖像中相應(yīng)窗口,如果所述窗口與所述相應(yīng)窗口基本相同的話, 把所述窗口分類為背景窗口。
【文檔編號】G06K9/46GK104424480SQ201410425757
【公開日】2015年3月18日 申請日期:2014年8月26日 優(yōu)先權(quán)日:2013年8月29日
【發(fā)明者】A·M·斯里帕達(dá)勞, B·珀依爾 申請人:亞德諾半導(dǎo)體集團(tuán)