專利名稱:物體檢測裝置和方法
技術領域:
本發(fā)明涉及一種物體檢測裝置和方法。
背景技術:
目前,以人臉檢測(face detection)為代表的物體檢測受到了越來越 多的關注。人臉檢測是指對于任意一幅給定的圖像,采用一定的策略對 其進行搜索以確定其中是否含有人臉,如果是,則返回人臉的位置、大 小和姿態(tài)。人臉通常具有十分豐富的生物特征信息,可以用于人機交互、 跟蹤監(jiān)控、身份識別等領域,而提取人臉相關信息的首要步驟正是定位 人臉區(qū)域。這使得人臉檢測技術具有非同尋常的意義和極為廣泛的應用 前景。人臉檢測的實用性將取決于檢測精度和檢測速度二者的提高。
在現有技術的檢測器層次結構中,由上至下依次是檢測器、強分 類器、弱分類器、特征提取以及函數映射。也就是說,現有技術的檢測 器包括多個強分類器,各強分類器包括多個弱分類器,各弱分類器包括 特征提取部和映射部。特征提取部進行特征提取,而映射部則采用基于 查找表(Look Up Table)的方法等方法進行弱分類。
如以下現有文件所示,通常的臉部檢測方法在進行特征提取時提取 圖像亮度差信息(差值),弱分類器以此為基礎進行是否是臉部的判斷(也 稱之為臉部準確度或弱分類),組合多個這些特征來制作出強分類器。
*專利文獻1
美國專利申請公開第2002/0102024號說明書 *專利文獻2
日本專利申請?zhí)亻_第2007-109229號 *非專利文獻1
"Robust Real-Time Face Detection", Paul A. Viola, Michael Jones,International Journal of Computer Vision No.572Vo1.2, pp 137-154(2004) *非專利文獻2
"高速全方向下的臉部檢測"、山下勞等、圖像識別/理解研討會 (MIRU2004) Vol. II, pp271-276
下面對這些現有技術進行簡要的說明。
美國專利申請公開第2002/0102024號說明書公開了 AdaBoost, AdaBoost是指一種組合多個識別能力較低的弱分類器,來獲得提高了判 斷能力的強分類器的學習方法,該方法是一種整體學習(Ensemble Learning)方法。
在AdaBoost這樣的方法中,從事先準備的特征中選擇適于識別的特 征,制作出弱分類器。為了通過盡可能少的弱分類器來學習強分類器, 重要之處在于事先準備好可提高識別能力的特征。
日本專利申請?zhí)亻_第2007-109229號通過樹結構的檢測器來檢測多 個臉部朝向的裝置,樹結構的各節(jié)點是由使用了多個Haar特征的弱分類 器構成的。
由于在該發(fā)明中使用了 Haar特征,因而通過使用經正規(guī)化的2個區(qū) 域之間的亮度差的強度分布,來計算特征量。因此,在各個弱分類器的 計算中使用加減法和除法,所以計算成本較大。
在"Robust Real-Time Face Detection"和"高速全方向下的臉部檢觀!]" 中,臉部檢測方法的特點大都在于,著眼于相鄰的2個區(qū)域,以區(qū)域之 間的亮度差(差值)為基礎來計算特征量。亮度差會因臉部亮度不同而 不同。例如,如果臉部較暗,則亮度差較小,如果臉部較亮則亮度差較 大。因此需要根據臉部明暗狀態(tài)來校正亮度差。
為了計算2個區(qū)域間的亮度差,需要計算各區(qū)域的平均亮度。在非 專利文獻1和2中,將積分圖像用于高速計算。
通過積分圖像來進行明暗狀態(tài)下的高速計算和校正,但對于積分圖 像而言,內存使用量較大,而且校正也會成為導致特征量計算耗時的原 因。
艮卩,如圖13所示,在三種不同亮度下的人臉下計算的Haar特征都需要經過校正,成為標準特征量。在圖13中,用白色框內的平均亮度減 去黑色框內的平均亮度,獲得亮度差。白色框表示粒子組合系數為正的 粒子,黑色框表示粒子組合系數為負的粒子。
綜上所述,可知,在現有的臉部檢測的通常手法中,使用著眼于臉 部的亮度差(差值)的特征量來判斷臉部準確度。無論臉部亮度發(fā)生何 種變化,都需要進行特征量校正,以計算出標準的特征量,計算特征量 需要耗費時間。
發(fā)明內容
本發(fā)明鑒于現有技術的上述缺點和局限作出,提供了一種物體檢測 裝置和方法,用于解決現有技術的一個或更多個缺點,至少提供一種有 益的選擇。
為了實現以上目的,本申請?zhí)峁┝艘韵碌陌l(fā)明。
發(fā)明1、 一種物體檢測裝置,所述物體檢測裝置用于從圖像中檢測 預定物體,所述物體檢測裝置包括一個或更多個強分類器,各強分類器 包括一個或更多個弱分類器,各弱分類器包括特征提取部和函數映射部, 所述特征提取部提取所述圖像的特征量,所述函數映射部根據所述特征 提取部提取的所述特征量,確定所述圖像的弱分類,其特征在于,所述 特征提取部包括
特征點提取部,從所述圖像中提取預定的特征點對組合; 像素值獲取部,獲得所述特征點對組合中的各特征點的像素值; 特征點比較部,根據像素值獲取部獲得的像素值,對各特征點對中 的兩個特征點進行比較,獲得邏輯值;以及
特征量獲得部,根據該邏輯值,確定所述圖像的特征量。 發(fā)明2、根據發(fā)明1所述的物體檢測裝置,其特征在于,所述像素 值為亮度。
發(fā)明3、根據發(fā)明1或2所述的物體檢測裝置,其特征在于,所述 特征點比較部對各特征點對中的兩個特征點的像素值進行直接比較,根 據其大小關系,根據預定的規(guī)則,獲得邏輯值。發(fā)明4、根據發(fā)明1或2所述的物體檢測裝置,其特征在于,所述 特征點比較部對各特征點對中的兩個特征點的像素值進行累積比較,根 據其大小關系,根據預定的規(guī)則,獲得邏輯值。
發(fā)明5、根據發(fā)明1或2所述的物體檢測裝置,其特征在于,所述 特征點比較部對各特征點對中的兩個特征點的像素值進行擴展累積比 較,依據其大小關系,根據預定的規(guī)則,獲得邏輯值。
發(fā)明6、根據發(fā)明1所述的物體檢測裝置,其特征在于,所述物體 檢測裝置還包括前處理部,所述前處理部用于對圖像進行處理,生成適 于進行特征量計算的圖像。
發(fā)明7、根據發(fā)明1所述的物體檢測裝置,其特征在于,所述物體 檢測裝置包括搜索窗口確定部,所述搜索窗口確定部用于確定在所述圖 像中搜索物體的子窗口 ,所述特征提取部提取所述圖像在所述子窗口中 的部分的特征量。
發(fā)明8、根據發(fā)明1所述的物體檢測裝置,其特征在于,所述物體 檢測裝置包括圖像縮放部,所述圖像縮放部用于對所述圖像進行縮放, 所述特征提取部提取經縮放的所述圖像的特征量。
發(fā)明9、根據發(fā)明1所述的物體檢測裝置,其特征在于,所述特征 點包括多個像素點,所述像素值獲取部計算所述多個像素點的平均像素 值作為所述特征點的像素值。
發(fā)明10、根據發(fā)明1所述的物體檢測裝置,其特征在于,所述特征 點包括多個像素點,所述物體檢測裝置包括縮小圖像制作部,所述縮小 圖像制作部根據所述特征點包括的像素點數目,對所述圖像進行縮小, 所述特征提取部提取經縮小的所述圖像的特征量。
發(fā)明11、根據發(fā)明IO所述的物體檢測裝置,其特征在于,所述縮小 圖像制作部制作出與倍率平方的數目相同的縮小圖像,所述特征提取部 提取適當位置的所述縮小圖像的特征量。
發(fā)明12、根據發(fā)明1所述的物體檢測裝置,其特征在于,所述物體 檢測裝置包括多個強分類器,所述多個強分類器構成為瀑布式結構、嵌 入型瀑布式結構、樹形結構中的一種。發(fā)明13、根據發(fā)明1所述的物體檢測裝置,其特征在于,所述物體 是人體、特定動物、汽車或人臉。
發(fā)明14、 一種物體檢測方法,所述物體檢測方法包括一個或更多個 強分類步驟,各強分類步驟包括一個或更多個弱分類步驟,各弱分類步 驟包括特征提取步驟和函數映射步驟,所述特征提取步驟提取待檢測圖 像的特征量,所述函數映射步驟根據所述特征提取步驟提取的所述特征 量,確定所述圖像的弱分類,其特征在于,所述特征提取步驟包括 特征點提取步驟,從所述圖像中提取預定的特征點對組合; 像素值獲取步驟,獲得所述特征點對組合中的各特征點的像素值; 特征點比較步驟,根據像素值獲取步驟獲得的像素值,對各特征點 對中的兩個特征點進行比較,獲得邏輯值;以及
特征量獲得步驟,根據該邏輯值,確定所述圖像的特征量。 發(fā)明15、根據發(fā)明14所述的物體檢測方法,其特征在于,所述像 素值為亮度。
發(fā)明16、根據發(fā)明14或15所述的物體檢測方法,其特征在于,所 述特征點比較步驟對各特征點對中的兩個特征點的像素值進行直接比 較,根據其大小關系,根據預定的規(guī)則,獲得邏輯值。
發(fā)明17、根據發(fā)明14或15所述的物體檢測方法,其特征在于,所 述特征點比較步驟對各特征點對中的兩個特征點的像素值進行累積比 較,根據其大小關系,根據預定的規(guī)則,獲得邏輯值。
發(fā)明18、根據發(fā)明14或15所述的物體檢測方法,其特征在于,所 述特征點比較步驟對各特征點對中的兩個特征點的像素值進行擴展累積 比較,依據其大小關系,根據預定的規(guī)則,獲得邏輯值。
發(fā)明19、根據發(fā)明14所述的物體檢測方法,其特征在于,所述物 體檢測方法還包括前處理步驟,所述前處理步驟用于對圖像進行處理, 生成適于進行特征量計算的圖像。
發(fā)明20、根據發(fā)明14所述的物體檢測方法,其特征在于,所述物 體檢測方法包括搜索窗口確定步驟,所述搜索窗口確定步驟用于確定在 所述圖像中搜索物體的子窗口,所述特征提取步驟提取所述圖像在所述子窗口中的部分的特征量。
發(fā)明21、根據發(fā)明14所述的物體檢測方法,其特征在于,所述物 體檢測方法包括圖像縮放步驟,所述圖像縮放步驟用于對所述圖像進行 縮放,所述特征提取步驟提取經縮放的所述圖像的特征量。
發(fā)明22、根據發(fā)明14所述的物體檢測方法,其特征在于,所述特 征點包括多個像素點,所述像素值獲取步驟計算所述多個像素點的平均 亮度作為所述特征點的像素值。
發(fā)明23、根據發(fā)明14所述的物體檢測方法,其特征在于,所述特 征點包括多個像素點,所述物體檢測方法包括縮小圖像制作步驟,所述 縮小圖像制作步驟根據所述特征點包括的像素點數目,對所述圖像進行 縮小,所述特征提取步驟提取經縮小的所述圖像的特征量。
發(fā)明24、根據發(fā)明23所述的物體檢測方法,其特征在于,所述縮 小圖像制作步驟制作出與倍率的平方數目相同的縮小圖像,所述特征提 取步驟提取適當位置的所述縮小圖像的特征量。
發(fā)明25、根據發(fā)明14所述的物體檢測方法,其特征在于,所述物 體檢測方法包括多個強分類步驟,所述多個強分類步驟構成為瀑布式結 構、嵌入型瀑布式結構、樹 形結構中的一種。
發(fā)明26、根據發(fā)明14所述的物體檢測方法,其特征在于,所述物 體是人體、特定動物、汽車或人臉。
本發(fā)明可以取得如下的技術效果
,由于可僅憑像素值(亮度等)的大小比較結果(邏輯值)即可計算 特征量,因而可實現非常高速下的特征量運算;
由于不使用乘法、除法,因而易于使其硬件化。
附圖構成了本申請的一部分,與文字說明一起用來對本發(fā)明的原理 進行解釋說明。在附圖中
圖1是說明應用本發(fā)明的物體檢測裝置的結構示意圖; 圖2示出了根據本發(fā)明的特征提取部的結構示意圖;圖3示出了提取的三對特征點;
圖4示出了現有技術的計算方法與本發(fā)明的計算方法的計算次數的 比較;
圖5示出了搜索窗口的確定;
圖6示出了強分類器組合為瀑布式結構、嵌入型瀑布式結構和樹形 結構的示意圖7是學習得到的識別器構成記錄的表達示意圖8示出了依據本發(fā)明的物體檢測方法的一種實施方式的流程圖9示出了依據本發(fā)明的物體檢測方法的另一種實施方式的流程
圖10示出了依據本發(fā)明的物體檢測方法的又一種實施方式的流程
圖11示例性地示出了縮小圖像的錯位制作;
圖12示出了本發(fā)明的物體檢測用特征量不受光照變化影響,無需校 正計算;以及
圖13示出了現有技術的物體檢測用特征量受光照變化影響,需要校 正計算。
具體實施例方式
下面結合附圖對本發(fā)明的具體實施方式
進行詳細的說明。 圖1是說明應用本發(fā)明的物體檢測裝置的結構示意圖。如圖1所示, 本發(fā)明的物體檢測裝置包括一個或更多個強分類器201 (圖中僅示出兩 個),各強分類器包括一個或更多個弱分類器202 (圖中僅示出兩個),各 弱分類器包括特征提取部203和函數映射部20。所述特征提取部203提 取待從中檢測特定物體的圖像的特征量,所述函數映射部204根據所述 特征提取部提取的所述特征量,確定所述圖像的弱分類。
圖2示出了根據本發(fā)明的特征提取部的結構示意圖。如圖2所示, 依據本發(fā)明的特征提取部203包括特征點提取部301,從所述圖像中提 取預定的特征點對組合;亮度獲取部302,獲得所述特征點對組合中的各特征點的亮度;特征點比較部303,根據亮度獲取部302獲得的亮度,對 各特征點對中的兩個特征點進行比較,獲得邏輯值;以及特征量獲得部 304,根據該邏輯值,確定所述圖像的特征量。
特征點提取部301從所述圖像中提取預定的特征點對組合。
如圖3所示,例如其提取3對特征點。其中深色的為正點,淺色的 為負點。正點和負點用于確定如后所述的比較的比較順序,將對應(同 序號)的正點與負點比較,大則邏輯值為l,否則為O (為0還為1取決 于約定,也可以與上面的情況相反)。
應該注意,這里的特征點可以對應于一個像素,也可以對應于幾個 像素的組合,例如4個像素的組合、16個像素的組合等, 一般組合的像 素數為4的整數次冪,對應于一塊方形圖像區(qū)域(比如lxl,2x2,4x4,8x8 的圖像塊),稱之為粒子。如圖所示,即使是同一粒子對中的各粒子的像 素數也可以不同。
亮度獲取部302獲得所述特征點對組合中的各特征點的亮度。對于 所述特征點由多個像素組合而成的情況,亮度獲取部302獲得所述多個 像素的平均亮度。出于說明的目的,在下面的說明中,假定亮度獲取部 302獲得的正點的亮度分別為210、 84和126,獲得的負點的亮度分別為 93、 137和145。
應該注意,本發(fā)明不限于獲得上述的亮度,還可以使用灰度、輝度、 抽出邊緣時的明度等等其它的像素值。亮度獲取部302對應于本發(fā)明的 像素值獲取部。
特征點比較部303根據亮度獲取部302獲得的亮度,對各特征點對 中的兩個特征點進行比較,獲得邏輯值。
進行比較可以釆用三種方法,在本文中分別稱為直接比較法、累積 比較法和擴展累積比較法。直接比較法進行特征點之間的直接比較,累 積比較法進行特征點之間的累積比較,擴展累積比較法進行特征點之間 的擴展累計比較。它們分別根據下面的公式l、 2和3進行工作。if) = W - W), ^ = v-、"
(1)
ft.(C) =&朋
、
乂
ifc)=咖i;2、w-":)) , /=1,
(2)
(3)
、w
式中的函數sign如下所示
'1,如果v》0
Lo,如果v<0
b")、 b廣和b;E。 分別表示通過直接比較
法、累積比較法和擴展累積比較法所獲得的針對第i對粒子的邏輯值。gl+ 和gi.分別表示第i對粒子中的正粒子和負粒子的像素值(例如亮度)。
特征量獲得部304根據特征點比較部303所得的邏輯值,確定所述 圖像的特征量。具體地,可以將邏輯值組合起來。
因而,在上面的亮度的情況下,在特征點比較部303分別采用直接 比較法、累積比較法和擴展累積比較法時,特征量獲得部304所獲得的 結果Z如下式所示。
因而,如上所述,本發(fā)明設計了一種特征量,其著眼于局部區(qū)域之 間的像素值(例如亮度)大小的邏輯關系(在本文中,也稱為大小關系),
直接比較
21084 126
"德
93 137 145
210
累積比較 0
、294—420
1
1
1
,230—375 t
93137 145
Z 個" 93 137 145
擴展累積比較
21084 12. \卜1
o ■可以根據多個區(qū)域間的亮度大小的邏輯關系,綜合判斷臉部準確度。
如果僅憑1對區(qū)域間的大小關系(是指兩個區(qū)域間各自平均亮度的
大小關系。區(qū)域按照一對一對的形式出現,如同Haar特征的白框區(qū)域和 黑框區(qū)域,但不要求這兩個框相鄰),則臉部與非臉部的判斷能力較低, 因而以多對區(qū)域間的大小關系為基礎來統(tǒng)一判斷。
圖4和圖5對現有技術的物體檢測方案和本發(fā)明的物體檢測方案進 行了比較。從中可以可看出,在特征形狀相同的情況下,根據本發(fā)明的 技術方案能夠大幅度削減特征量運算成本。
具體地,在現有技術的方案中,為了進行檢測,需要
1. 分別計算黑框B與相對應的白框口之間的亮度差(3次);
2. 亮度差的合計(l次);
3. 亮度差的校正(1次)
而對于本發(fā)明,對于直接比較法而言,只需要分別進行黑框睡l、 2
和3與相對應的白框口1、 2和3的平均亮度大小比較(3次)。
因而,在本發(fā)明中,著眼于明暗的大小關系(是邏輯值,即二值O或 1),而并非著眼于臉部的亮度差(差別量,整數值)。從上面的公式l、 2 和3可以看出,無論特征點比較部303采用直接比較法、累積比較法和 擴展累積比較法中的哪種方法,特征量獲得部304所獲得的結果Z都不 隨輸入圖像的線性變化而改變,因而即使在臉部的亮度發(fā)生變化的情況 下,其亮度大小的邏輯關系也不變,因此也無需進行特征量校正,可以 大幅度削減特征量計算的時間。另外,本發(fā)明無需進行乘法和除法,因 而可以削減計算成本。無需用于特征量校正的積分圖像,因而可以削減 內存使用量。圖12示出了本發(fā)明的特征量的穩(wěn)定性,其不受外界因素, 例如照明等影響,不需校正。
優(yōu)選地,本發(fā)明還包括前處理部。前處理部生成適于計算在本發(fā)明 中所用特征量的圖像。還可以事先對圖像進行伽瑪校正等校正,以使臉 部檢測率提高。前處理部是任選的部件,可以沒有。
另外,本發(fā)明可以包括搜索窗口設定部。搜索窗口設定部確定用于 進行搜索的窗口。以輸入圖像為基礎,利用搜索窗口確定用于搜索對象物體的搜索圖像。既可以通過切取來制作搜索圖像,也可以僅設定搜索 圖像的位置。對圖像進行掃描來制作搜索圖像。以設定的尺寸(即搜索 窗口的尺寸)來掃描,當行進到畫面終端的情況下,改變搜索圖像的尺 寸來進行掃描。搜索窗口既可以根據圖像整體來漸漸變小,也可以根據 較小尺寸而逐漸放大到圖像整體。具體地,如圖5所示。在確定了搜索 圖像的情況下,所述特征提取部提取所述搜索圖像的特征量。
利用特定大小的搜索窗口獲得搜索圖像可以減少本發(fā)明的物體檢測 裝置的訓練量,降低存儲空間,增加其實用性。
類似地,本發(fā)明還可以包括圖像縮放部,對輸入的圖像進行縮放, 縮放到預定的大小,所述特征提取部提取縮放后的圖像的特征量。這同 樣可以獲得減少本發(fā)明的物體檢測裝置的訓練量,降低存儲空間的優(yōu)點, 增加其實用性。
如上所述,本發(fā)明的特征點可以是一個像素,也可以是多個像素的
組合,在特征點為多個像素的組合的情況下,亮度獲取部302獲得所述 多個像素的平均亮度。但計算平均亮度會降低物體檢測速度。因此,可 以以原圖像(即輸入的圖像)為基礎,準備好縮小為1/2的圖像、縮小為 1/4的圖像、縮小為1/8的圖像這4種圖像。
通過使用縮小圖像,而可以通過如下參照1個像素來處理不同的矩 形尺寸下的區(qū)域的平均像素值,因而能實現高速化。
原圖像的2x2的區(qū)域為1/2的圖像下的lxl
原圖像的4x4的區(qū)域為1/4的圖像下的lxl
原圖像的8x8的區(qū)域為1/8的圖像下的lxl
在制作縮小圖像時,可以制作出與倍率數的平方相同數量的多個縮 小圖像。例如在制作l/2圖像時,制作出4個。在制作l/4圖像時,制作 出16個,在制作l/8圖像時,制作出64個。在制作不同的縮小圖像時, 錯開制作縮小圖像的開始位置。由此可以對于原圖像的任意位置來參照 所指定的區(qū)域尺寸的平均像素。這樣因為所用的框都是正方形的,即lxl、 2x2,…,8x8的,所以對應的縮小后的圖像中相應位置上的像素的亮度即 框中的多個像素的平均亮度,這樣就免去了計算平均亮度的過程。圖11示例性地示出了縮小圖像的錯開制作。
回到圖1,函數映射部根據特征獲得部獲得的特征值(即位列值,
在比較3個大小時,輸出0-7這8個值),根據事先學習所得的物體(臉 部)準確度的分布,得到判斷結果作為臉部準確度。具體地,在進行判 斷時,如果大于特定閾值則判定為候選,即其可能為物體(人臉)。強分 類器根據其所包括的一個或更多個弱分類器的分類結果,判別該候選是 否確實為物體(人臉)。在判別時,可以將所述一個或更多個弱分類器的 分類結果(臉部準確性)或通過對各弱分類器所得的特征量進行組合, 來判斷該候選是否確實為物體(人臉)。
例如如圖6所示,還可以利用多個強分類器進行分類。這些強分類 器例如可以構成為瀑布式結構、嵌入型瀑布式結構(把前一層結構的結 果轉交給下一層,在下一層利用到上一層結果的判斷方法)、樹形結構(判 斷多個類別,有分支或者通過多個路徑)。這些結構可以對物體的各個角 度、方位、遮擋、以及例如人臉的內在變化等進行辨別,可以提高適應 性和辨別的準確性。具體地,可以參照2006年9月20日提交的中國專 利申請第200610127853.7號。通過引用將該文獻并入本文中。
關于判定部判斷為臉部的區(qū)域,進行如下處理,把位置和大小略微 錯開的區(qū)域統(tǒng)一為l個臉部。
另外,在一個實施例中,本發(fā)明的物體檢測裝置還包括結果輸出 部,用于輸出物體檢測結果;存儲部,記錄學習所得的分類器信息。 本發(fā)明的學習裝置如下進行處理。 事先準備多個學習樣本(正確圖像、不正確圖像)。 把本發(fā)明中所用特征模式制作為特征庫(就是形成粒子對及其構成 的序列)。
針對各個學習樣本,根據各特征模式得到特征量(按照前面的計算 方式)。
從特征模式中選擇出最能夠判斷正確圖像與不正確圖像的特征模式。
以判斷結果為基礎,逐個更新學習樣本的權重。重復恒定次數下的上述處理,作為強分類器。
從不包含正確物體的圖像之中提取出強分類器錯誤識別到的區(qū)域, 收集了一定數量以上時,將它們作為不正確圖像。
使用正確圖像與新的不正確圖像重復進行上述處理,作為層級結構。
為了進行檢測處理,保持學習所得的分類器。
圖7的表示出了存儲部所保持的數據結構的例子。
在搜索處理中的某個位置上,使用記錄于存儲器中的檢測器,判斷 是否為臉部。
圖8示出了依據本發(fā)明的一種實施方式的物體檢測方法的流程圖。
如圖8所示,首先在步驟801,從待進行特定物體檢測的圖像中提 取預定的特征點對的組合。這些特征點對可以是圖像的預定位置處的特 征點對。該步驟例如由前述的特征點提取部執(zhí)行。
然后在步驟802,計算各特征點對中的特征點的像素值。所述像素 值例如可以是亮度。該步驟例如由前述的亮度獲取部執(zhí)行。
然后在步驟803中,對各對中的兩個特征點的像素值進行比較,獲 的邏輯值??梢岳们笆龉絣一3中的任一公式所公開的方法進行這種 比較。該步驟例如由前述的特征點比較部執(zhí)行。
然后在步驟804,根據比較的結果,獲得特征量。該特征量是所獲
得的邏輯值的組合。.該步驟例如由前述的特征量獲得部執(zhí)行。
圖9示出了依據本發(fā)明的另一種實施方式的物體檢測方法的流程圖。
如圖9所示,根據本發(fā)明的另一種實施方式的物體檢測方法在圖8 所示的物體檢測方法的基礎上增加了前處理步驟901,用于對待進行特定 物體檢測的圖像進行前處理,生成適于進行特征量計算的圖像。在該步 驟中還可以對圖像進行伽瑪校正等校正,以使臉部檢測率提高。
另外,本發(fā)明的該實施方式還可以包括確定搜索窗口的步驟902。 在該步驟中確定在所述圖像中搜索所述物體用的子窗口。圖8的特征點 提取等步驟都將針對圖像在該搜索窗口中的部分。
圖10示出了依據本發(fā)明的又一種實施方式的物體檢測方法的流程圖。
如圖IO所示,根據本發(fā)明的又一種實施方式的物體檢測方法在圖8 所示的物體檢測方法的基礎上增加了進行圖像縮放處理的步驟1001,用 于對待進行特定物體檢測的圖像進行縮放,縮放到預定的大小,后續(xù)步 驟針對縮放后的圖像進行。這可以減少本發(fā)明的物體檢測裝置的訓練量 (針對預定的圖像大小進行訓練即可),降低存儲空間,增加其實用性。
另外,本發(fā)明的該實施方式還可以包括制作縮小的圖像的步驟。如 前所述,由此可以對于原圖像的任意位置來參照所指定的區(qū)域尺寸的平 均像素。免去了計算平均像素值(亮度)的過程。
本領域的普通技術人員應該意識到,本發(fā)明的上述實施方式、實施 例都是示例性的。上述的方法步驟的順序可以根據實際情況進行調整, 可以并行執(zhí)行,也可以在不同的裝置上進行也可在同一裝置上進行。z
本領域的普通技術人員還應該意識到,上述的裝置和方法可以通過 專門硬件實現,也可以通過執(zhí)行特定計算機程序的計算機或邏輯器件實 現。該計算機程序可以使所述的計算機或邏輯器件實現上述方法或上述 方法的各個步驟,或者可以使該計算機或邏輯器件作為上述裝置或裝置 的部件而工作。該計算機程序以及存儲該計算機程序的計算機可讀存儲 介質也在本發(fā)明的保護范圍內。所述的計算機可讀存儲介質例如可以是 CD、 VCD、 DVD、磁盤、MO、閃存、磁帶等等本領域技術人員可以想 到的利用了磁、電、光或其任意組合的技術的各種存儲介質。
盡管本發(fā)明是利用以上的實施例進行說明的,但本發(fā)明的范圍并不 因此受限。本發(fā)明的范圍由權利要求書及其等同物確定。
權利要求
1、一種物體檢測裝置,所述物體檢測裝置用于從圖像中檢測預定物體,所述物體檢測裝置包括一個或更多個強分類器,各強分類器包括一個或更多個弱分類器,各弱分類器包括特征提取部和函數映射部,所述特征提取部提取所述圖像的特征量,所述函數映射部根據所述特征提取部提取的所述特征量,確定所述圖像的弱分類,其特征在于,所述特征提取部包括特征點提取部,從所述圖像中提取預定的特征點對組合;像素值獲取部,獲得所述特征點對組合中的各特征點的像素值;特征點比較部,根據像素值獲取部獲得的像素值,對各特征點對中的兩個特征點進行比較,獲得邏輯值;以及特征量獲得部,根據該邏輯值,確定所述圖像的特征量。
2、 根據權利要求1所述的物體檢測裝置,其特征在于,所述像素值 為亮度。
3、 根據權利要求1或2所述的物體檢測裝置,其特征在于,所述特 征點比較部對各特征點對中的兩個特征點的像素值進行直接比較,根據 其大小關系,根據預定的規(guī)則,獲得邏輯值。
4、 根據權利要求1或2所述的物體檢測裝置,其特征在于,所述特 征點比較部對各特征點對中的兩個特征點的像素值進行累積比較,根據 其大小關系,根據預定的規(guī)則,獲得邏輯值。
5、 根據權利要求1或2所述的物體檢測裝置,其特征在于,所述特 征點比較部對各特征點對中的兩個特征點的像素值進行擴展累積比較, 依據其大小關系,根據預定的規(guī)則,獲得邏輯值。
6、 根據權利要求1所述的物體檢測裝置,其特征在于,所述物體檢 測裝置還包括前處理部,所述前處理部用于對圖像進行處理,生成適于 進行特征量計算的圖像。
7、 根據權利要求l所述的物體檢測裝置,其特征在于,所述物體檢 測裝置包括搜索窗口確定部,所述搜索窗口確定部用于確定在所述圖像中搜索物體的子窗口,所述特征提取部提取所述圖像在所述子窗口中的 部分的特征量。
8、 根據權利要求l所述的物體檢測裝置,其特征在于,所述物體檢 測裝置包括圖像縮放部,所述圖像縮放部用于對所述圖像進行縮放,所 述特征提取部提取經縮放的所述圖像的特征量。
9、 根據權利要求1所述的物體檢測裝置,其特征在于,所述特征點 包括多個像素點,所述像素值獲取部計算所述多個像素點的平均像素值 作為所述特征點的像素值。
10、 根據權利要求1所述的物體檢測裝置,其特征在于,所述特征點包括多個像素點,所述物體檢測裝置包括縮小圖像制作部,所述縮小 圖像制作部根據所述特征點包括的像素點數目,對所述圖像進行縮小, 所述特征提取部提取經縮小的所述圖像的特征量。
11、 根據權利要求io所述的物體檢測裝置,其特征在于,所述縮小圖像制作部制作出與倍率平方的數目相同的縮小圖像,所述特征提取部 提取適當位置的所述縮小圖像的特征量。
12、 根據權利要求1所述的物體檢測裝置,其特征在于,所述物體 檢測裝置包括多個強分類器,所述多個強分類器構成為瀑布式結構、嵌 入型瀑布式結構和樹形結構中的一種。
13、 根據權利要求1所述的物體檢測裝置,其特征在于,所述物體 是人體、特定動物、汽車或人臉。
14、 一種物體檢測方法,所述物體檢測方法包括一個或更多個強分 類步驟,各強分類步驟包括一個或更多個弱分類步驟,各弱分類步驟包 括特征提取步驟和函數映射步驟,所述特征提取步驟提取待檢測圖像的 特征量,所述函數映射步驟根據所述特征提取步驟提取的所述特征量,確定所述圖像的弱分類,其特征在于,所述特征提取步驟包括 特征點提取步驟,從所述圖像中提取預定的特征點對組合; 像素值獲取步驟,獲得所述特征點對組合中的各特征點的像素值; 特征點比較步驟,根據像素值獲取步驟獲得的像素值,對各特征點對中的兩個特征點進行比較,獲得邏輯值;以及特征量獲得步驟,根據該邏輯值,確定所述圖像的特征量。
15、 根據權利要求14所述的物體檢測方法,其特征在于,所述像素 值為亮度。
16、 根據權利要求14或15所述的物體檢測方法,其特征在于,所 述特征點比較步驟對各特征點對中的兩個特征點的像素值進行直接比 較,根據其大小關系,根據預定的規(guī)則,獲得邏輯值。
17、 根據權利要求14或15所述的物體檢測方法,其特征在于,所 述特征點比較步驟對各特征點對中的兩個特征點的像素值進行累積比 較,根據其大小關系,根據預定的規(guī)則,獲得邏輯值。
18、 根據權利要求14或15所述的物體檢測方法,其特征在于,所 述特征點比較步驟對各特征點對中的兩個特征點的像素值進行擴展累積 比較,依據其大小關系,根據預定的規(guī)則,獲得邏輯值。
19、 根據權利要求14所述的物體檢測方法,其特征在于,所述物體 檢測方法還包括前處理步驟,所述前處理步驟用于對圖像進行處理,生 成適于進行特征量計算的圖像。
20、 根據權利要求14所述的物體檢測方法,其特征在于,所述物體 檢測方法包括搜索窗口確定步驟,所述搜索窗口確定步驟用于確定在所 述圖像中搜索物體的子窗口,所述特征提取步驟提取所述圖像在所述子窗口中的部分的特征量。
21、 根據權利要求14所述的物體檢測方法,其特征在于,所述物體檢測方法包括圖像縮放步驟,所述圖像縮放步驟用于對所述圖像進行縮 放,所述特征提取步驟提取經縮放的所述圖像的特征量。
22、 根據權利要求14所述的物體檢測方法,其特征在于,所述特征點包括多個像素點,所述像素值獲取步驟計算所述多個像素點的平均亮 度作為所述特征點的像素值。
23、 根據權利要求14所述的物體檢測方法,其特征在于,所述特征點包括多個像素點,所述物體檢測方法包括縮小圖像制作步驟,所述縮 小圖像制作步驟根據所述特征點包括的像素點數目,對所述圖像進行縮 小,所述特征提取步驟提取經縮小的所述圖像的特征量。
24、 根據權利要求23所述的物體檢測方法,其特征在于,所述縮小 圖像制作步驟制作出與倍率的平方數目相同的縮小圖像,所述特征提取 步驟提取適當位置的所述縮小圖像的特征量。
25、 根據權利要求14所述的物體檢測方法,其特征在于,所述物體 檢測方法包括多個強分類步驟,所述多個強分類步驟構成為瀑布式結構、 嵌入型瀑布式結構和樹形結構中的一種。
26、 根據權利要求14所述的物體檢測方法,其特征在于,所述物體 是人體、特定動物、汽車或人臉。
全文摘要
本發(fā)明公開了物體檢測裝置和方法。所述物體檢測裝置用于從圖像中檢測預定物體,所述物體檢測裝置包括一個或更多個強分類器,各強分類器包括一個或更多個弱分類器,各弱分類器包括特征提取部和函數映射部,所述特征提取部提取所述圖像的特征量,所述函數映射部根據所述特征提取部提取的所述特征量,確定所述圖像的弱分類,其特征在于,所述特征提取部包括特征點提取部,從所述圖像中提取預定的特征點對組合;像素值獲取部,獲得所述特征點對組合中的各特征點的像素值;特征點比較部,根據像素值獲取部獲得的像素值,對各特征點對中的兩個特征點進行比較,獲得邏輯值;以及特征量獲得部,根據該邏輯值,確定所述圖像的特征量。
文檔編號G06K9/00GK101470802SQ200710305499
公開日2009年7月1日 申請日期2007年12月28日 優(yōu)先權日2007年12月28日
發(fā)明者勞世紅, 山下隆義, 艾海舟, 暢 黃 申請人:清華大學;歐姆龍株式會社