專(zhuān)利名稱(chēng):基于語(yǔ)義Hough變換和偏最小二乘法的目標(biāo)檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)視覺(jué)技術(shù),具體涉及一種基于語(yǔ)義Hough變換和偏最小二乘法的目標(biāo)檢測(cè)方法。
背景技術(shù):
計(jì)算機(jī)視覺(jué)最初于上世紀(jì)60年代從數(shù)字圖像處理領(lǐng)域分離出來(lái),成為一個(gè)獨(dú)立的研究方向,并早已廣泛地應(yīng)用于航空航天、自動(dòng)導(dǎo)航、工業(yè)檢測(cè)、醫(yī)學(xué)研究、臨床診治、安全監(jiān)控和跟蹤、國(guó)防、交通、遙感等諸多重要領(lǐng)域中。其中,目標(biāo)檢測(cè),尤其是與人相關(guān)的檢測(cè),是與各種實(shí)際應(yīng)用聯(lián)系非常緊密的關(guān)鍵技術(shù)。以城市居民每天都必須參與其中的公共交通為例,全球每年有逾百萬(wàn)人在交通事故中喪生,但準(zhǔn)確而快速的行人檢測(cè)技術(shù)能及時(shí)發(fā)現(xiàn)處于車(chē)輛撞擊范圍內(nèi)的行人,幫助和提醒司機(jī)、特別是疲勞駕駛的司機(jī)及時(shí)采取制動(dòng)措施,從而能夠在一定程度上減少交通事故發(fā)生的次數(shù),挽救無(wú)辜的生命。因此,對(duì)計(jì)算機(jī) 視覺(jué)中的目標(biāo)檢測(cè)技術(shù)進(jìn)行深入研究,不斷提高檢測(cè)的準(zhǔn)確率,具有重要的現(xiàn)實(shí)意義。當(dāng)前,計(jì)算機(jī)視覺(jué)領(lǐng)域中目標(biāo)檢測(cè)的方法基本都采用滑動(dòng)窗口和廣義Hough變換兩種方案,這兩種方案在本質(zhì)上是等價(jià)的,但在具體實(shí)施過(guò)程中所涉及到的問(wèn)題有著較大差異。在滑動(dòng)窗口方案中,通常將目標(biāo)檢測(cè)看作一個(gè)分類(lèi)問(wèn)題,首先設(shè)計(jì)出一種能夠較好地描述目標(biāo)的特征,然后在正負(fù)訓(xùn)練樣本中分別將這種特征提取出來(lái),用以訓(xùn)練得到分類(lèi)器;再將分類(lèi)器作用于測(cè)試圖像,把測(cè)試圖像的特征進(jìn)行分類(lèi)以確定其中的目標(biāo)和非目標(biāo)。但是,滑動(dòng)窗口方案所采用的全局描述子對(duì)于遮擋情況很不魯棒。有一些改進(jìn)的方法人為地將目標(biāo)分成幾個(gè)組成部分(如“行人”這種目標(biāo)可以分成頭、手臂、軀干和腿等幾個(gè)部分),但這種劃分通常是啟發(fā)式的。而廣義Hough變換方案由于采用了局部特征投票的方式,對(duì)于遮擋情況有一定的魯棒性,又避免了人為劃分部分的問(wèn)題。廣義Hough 變換最初由 Ballard 等人(Ballard, D. H.,Generalizing theHough transform to detect arbitrary shapes. Pattern recognition, 1981,13(2)111-122)提出,用于在圖像中檢測(cè)任意形狀的圖形。目前,將廣義Hough變換應(yīng)用于目標(biāo)檢測(cè)的主要有 B. Leibe 等(Leibe, B.,A. Leonardis, and B. Schiele, Robust objectdetection with interleaved categorization and segmentation.InternationalJournal of Computer Vision, 2008. 77 (I) :p. 259-289)提出的隱式狀模型和 J. Gall 等(Gall, J. and V. Lempitsky. Class-specific hough forests for object detection, inCVPR. 2009:Ieee. p. 1022-1029.)提出的Hough森林兩種。其基本思路為,在訓(xùn)練時(shí)抽取目標(biāo)上的圖像塊或特征點(diǎn)并以某種方式進(jìn)行聚類(lèi),形成碼本,同時(shí)記錄每個(gè)特征點(diǎn)相對(duì)于各自目標(biāo)中心的偏移向量。當(dāng)進(jìn)行目標(biāo)檢測(cè)時(shí),抽取測(cè)試圖片中的特征點(diǎn)并送到碼本中匹配,根據(jù)所匹配到的碼本項(xiàng)找出偏移向量并據(jù)此進(jìn)行投票,最后找出投票最集中、票數(shù)最多的區(qū)域,即是目標(biāo)位置。廣義Hough變換方案是否有效的關(guān)鍵,在于碼本的準(zhǔn)確性,也即能否較準(zhǔn)確地建立圖像塊的特征與圖像塊投票向量之間的映射關(guān)系,使得圖像塊較正確地向可能的目標(biāo)中心位置投票。上述的隱式形狀模型方法是通過(guò)聚類(lèi)來(lái)生成碼本,但聚類(lèi)算法通常較大程度地依賴(lài)于一個(gè)閾值,它將影響整個(gè)聚類(lèi)過(guò)程的多個(gè)環(huán)節(jié),如每個(gè)類(lèi)的大小、類(lèi)的數(shù)量等。而在Hough森林方法中,碼本以隨機(jī)森林的形式存在,森林中每棵樹(shù)的深度和節(jié)點(diǎn)停止分裂的條件等也是算法所依賴(lài)一些重要參數(shù)。這些閾值和參數(shù)的設(shè)定通常沒(méi)有太多理論依據(jù),只能依據(jù)經(jīng)驗(yàn)或反復(fù)實(shí)驗(yàn)來(lái)選取。當(dāng)閾值和參數(shù)的數(shù)量越多時(shí),選擇合適的值難度就越大,難以產(chǎn)生最好的效果。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于語(yǔ)義Hough變換和偏最小二乘法的目標(biāo)檢測(cè)方法。本發(fā)明包括以下步驟 A.準(zhǔn)備訓(xùn)練樣本集(xQi, Xli, x2i, ......,Xm^dpyiXi=I, ......,N,N 為訓(xùn)練樣本數(shù),
N為自然數(shù),x0i表示訓(xùn)練樣本對(duì)應(yīng)的特征向量,每個(gè)訓(xùn)練樣本是一個(gè)圖像塊,取自感興趣的目標(biāo)上的圖像塊是正樣本,取自其它圖像的是負(fù)樣本,yi表示樣本類(lèi)別
權(quán)利要求
1.基于語(yǔ)義Hough變換和偏最小二乘法的目標(biāo)檢測(cè)方法,其特征在于包括以下步驟 A.準(zhǔn)備訓(xùn)練樣本集(xM,xu,x2i,......,xmi, Cli, Yi), i=l, ......,N,N為訓(xùn)練樣本數(shù),N為自然數(shù),Xtli表示訓(xùn)練樣本對(duì)應(yīng)的特征向量,每個(gè)訓(xùn)練樣本是一個(gè)圖像塊,取自感興趣的目標(biāo)上的圖像塊是正樣本,取自其它圖像的是負(fù)樣本,yi表示樣本類(lèi)別
2.如權(quán)利要求I所述的基于語(yǔ)義Hough變換和偏最小二乘法的目標(biāo)檢測(cè)方法,其特征在于在步驟A中,所述準(zhǔn)備訓(xùn)練樣本集采用以下方法 Al.從訓(xùn)練圖像所包含的目標(biāo)上抽取N/2個(gè)圖像塊,從不包含目標(biāo)的圖像中抽取N/2個(gè)圖像塊,得到N個(gè)訓(xùn)練樣本,即N個(gè)圖像塊Pi, i=l,……N ; A2.對(duì)于每個(gè)圖像塊Pi,在其周?chē)槿∨cPi相鄰或有重疊的、大小相同的m個(gè)圖像塊Pli, ......Pmi。抽取Pi的特征向量Xtli以及Pji的特征向量XjZ,j=l,......,m; A3.用Xcii分別減去Xji',得到訓(xùn)練樣本Pi對(duì)應(yīng)的m個(gè)語(yǔ)義特征向量Xji = X0i-X1 Ji (j=I,. . . , m); A4.對(duì)于每個(gè)訓(xùn)練樣本Pi,若它來(lái)自于目標(biāo),則是正樣本,yi=+l,取它與所屬目標(biāo)的中心坐標(biāo)之間的偏移向量作為它對(duì)應(yīng)的屯;若它不是來(lái)自于目標(biāo),則是負(fù)樣本,yi=_l,設(shè)置Cli=(-OO,- OO ),得到訓(xùn)練樣本集(X(|i,Xii,x2i,......,Xmi7ClpyiXi=I, ......,N。
3.如權(quán)利要求I所述的基于語(yǔ)義Hough變換和偏最小二乘法的目標(biāo)檢測(cè)方法,其特征在于在步驟B中,所述利用偏最小二乘法求出回歸系數(shù)矩陣Bltl, Bl1, ...,Blffl采用以下方法 BI.分別對(duì)Xtl和Y1進(jìn)行中心化
4.如權(quán)利要求I所述的基于語(yǔ)義Hough變換和偏最小二乘法的目標(biāo)檢測(cè)方法,其特征在于在步驟C中,所述利用偏最小二乘法求出回歸系數(shù)矩陣B、Bv1, Bvffl采用以下方法 Cl.將步驟BI B4中的Y1替換成Y2 ; C2.重復(fù)步驟BI B6,求出回歸系數(shù)矩陣Bv。,Bv1, . . ·,Bvm。
5.如權(quán)利要求I所述的基于語(yǔ)義Hough變換和偏最小二乘法的目標(biāo)檢測(cè)方法,其特征在于在步驟G中,所述在Hough圖像中找出投票密度的局部極大值點(diǎn)采用以下方法 GI.將Hough圖像劃分成a X a大小的網(wǎng)格,統(tǒng)計(jì)每個(gè)網(wǎng)格內(nèi)的票數(shù)總和,找出票數(shù)和為局部極大的網(wǎng)格作為候選網(wǎng)格; G2.在每個(gè)候選網(wǎng)格中,使用mean-shift算法找到網(wǎng)格內(nèi)的密度局部極大值點(diǎn)。所有的局部極大值點(diǎn)即作為檢測(cè)到的目標(biāo)位置,完成檢測(cè)。
全文摘要
基于語(yǔ)義Hough變換和偏最小二乘法的目標(biāo)檢測(cè)方法,涉及計(jì)算機(jī)視覺(jué)技術(shù)。首先利用訓(xùn)練集建立圖像塊的特征向量、語(yǔ)義特征向量與圖像塊類(lèi)別和投票偏移向量之間的回歸模型,然后將待檢測(cè)圖像中的每個(gè)圖像塊的特征向量和語(yǔ)義特征向量代入回歸模型,找出類(lèi)別為正的圖像塊并產(chǎn)生投票、形成Hough圖像,最后在Hough圖像中找出投票密度的局部極大值點(diǎn)作為檢測(cè)結(jié)果,完成目標(biāo)檢測(cè)。
文檔編號(hào)G06K9/66GK102831445SQ20121027263
公開(kāi)日2012年12月19日 申請(qǐng)日期2012年8月1日 優(yōu)先權(quán)日2012年8月1日
發(fā)明者王菡子, 唐建宇 申請(qǐng)人:廈門(mén)大學(xué)