国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于深度圖像的對(duì)象檢測(cè)方法及其實(shí)現(xiàn)裝置與流程

      文檔序號(hào):11991083閱讀:383來(lái)源:國(guó)知局
      基于深度圖像的對(duì)象檢測(cè)方法及其實(shí)現(xiàn)裝置與流程
      本發(fā)明涉及模式識(shí)別和人機(jī)交互領(lǐng)域,更具體地說(shuō),涉及一種基于深度圖像的對(duì)象檢測(cè)方法及其實(shí)現(xiàn)裝置。

      背景技術(shù):
      基于圖像的物體檢測(cè)是指在一幅給定圖像中確定是否存在某一類(lèi)或者幾類(lèi)特定的物體,并且給出該物體在圖像中的具體的位置的過(guò)程。在模式識(shí)別和人機(jī)交互領(lǐng)域,常見(jiàn)的被檢測(cè)的物體包括:車(chē)輛、人體、人臉、手等。通過(guò)確定這些對(duì)象的大小、位置、以及運(yùn)動(dòng)等信息,計(jì)算機(jī)可以實(shí)現(xiàn)對(duì)于特定的視覺(jué)目標(biāo)或者人的行為進(jìn)行響應(yīng),最終實(shí)現(xiàn)人機(jī)交互或者計(jì)算機(jī)自動(dòng)處理識(shí)別的目的。物體檢測(cè)過(guò)程中包括兩個(gè)關(guān)鍵步驟:特征選擇和分類(lèi)器的學(xué)習(xí)。特征選擇需要解決的問(wèn)題是:對(duì)于當(dāng)前對(duì)象而言,哪些信息具有更強(qiáng)的描述能力。特征選擇是否恰當(dāng),直接決定了物體檢測(cè)的成功與否。例如:在人臉檢測(cè)領(lǐng)域,PaulViola和MichaelJones將灰度差異特征(Haar)應(yīng)用于快速魯棒的人臉檢測(cè),并且獲得的巨大的成功;在人體檢測(cè)領(lǐng)域,NavneetDalal和BillTriggs利用梯度方向直方圖(HOG)特征進(jìn)行人體描述,實(shí)現(xiàn)了較高性能的人體檢測(cè)。分類(lèi)器學(xué)習(xí)所解決的問(wèn)題是:在已確定的特征的基礎(chǔ)上,找到一系列規(guī)則,用這些規(guī)則來(lái)判定當(dāng)前圖像區(qū)域是否為包含物體的區(qū)域。確定規(guī)則的過(guò)程稱(chēng)為(機(jī)器)學(xué)習(xí)的過(guò)程。在物體檢測(cè)領(lǐng)域,目前經(jīng)常采用的分類(lèi)器包括支持向量機(jī)(SVM)方法和基于Adaboost的方法。物體檢測(cè)的輸入圖像通常為彩色圖像或者灰度圖像。為了實(shí)現(xiàn)對(duì)于不同大小的物體的檢測(cè),常采用的策略為對(duì)于輸入圖像在多個(gè)尺度上進(jìn)行放縮,形成一個(gè)圖像金字塔,然后在圖像金字塔的所有層上利用掃描窗口進(jìn)行判定。最后再將所有層上的判定結(jié)果映射回到輸入圖像的標(biāo)準(zhǔn)尺寸上進(jìn)行融合,從而實(shí)現(xiàn)對(duì)不同大小的物體進(jìn)行檢測(cè)。然而,這種基于灰度或者彩色圖像的檢測(cè)方法存在以下不足:其一,易受光照變化的影響,當(dāng)光照變化較大時(shí),物體的外觀會(huì)發(fā)生較大的變化,而在光照較弱的環(huán)境下,某些外觀特征也會(huì)變得不可辨識(shí);其二,易受到復(fù)雜的背景的影響,當(dāng)背景紋理很豐富時(shí),極易產(chǎn)生與物體相似的外觀模式,產(chǎn)生誤檢;其三,需要對(duì)于圖像的所有尺度的所有位置進(jìn)行檢測(cè),掃描窗口的數(shù)量過(guò)多,當(dāng)采用計(jì)算量較大的特征時(shí),系統(tǒng)的實(shí)時(shí)性沒(méi)有保證。四、

      技術(shù)實(shí)現(xiàn)要素:
      本發(fā)明的目的在于針對(duì)上述物體檢測(cè)技術(shù)中,檢測(cè)窗口數(shù)量過(guò)多,限制了計(jì)算量較大的復(fù)雜特征的應(yīng)用的問(wèn)題,提出了一種基于深度圖像的對(duì)象檢測(cè)方法及其實(shí)現(xiàn)裝置。實(shí)現(xiàn)本發(fā)明目的的技術(shù)解決方案為:本發(fā)明基于深度圖像的對(duì)象檢測(cè)方法,包括訓(xùn)練過(guò)程和檢測(cè)過(guò)程,訓(xùn)練過(guò)程的步驟如下:a1)從相機(jī)中讀取圖像作為數(shù)據(jù)源;a2)根據(jù)待檢測(cè)物體距離相機(jī)的距離,在圖像上對(duì)物體進(jìn)行分割;a3)在分割的基礎(chǔ)上計(jì)算物體的外觀和形狀特征;a4)根據(jù)計(jì)算出的物體的外觀和形狀特征訓(xùn)練針對(duì)于物體的分類(lèi)器;檢測(cè)過(guò)程的步驟如下:b1)從相機(jī)中讀取圖像作為數(shù)據(jù)源;b2)根據(jù)物體距離相機(jī)的距離對(duì)其圖像進(jìn)行不同尺度的縮放,形成一個(gè)圖像金字塔;b3)對(duì)于圖像金字塔的每一層的圖像上的非空區(qū)域,劃分為多個(gè)掃描窗口;b4)在每一個(gè)掃描窗口內(nèi)部,計(jì)算物體的外觀和形狀特征;b5)利用訓(xùn)練過(guò)程中得到的分類(lèi)器,對(duì)掃描窗口內(nèi)的外觀和形狀特征進(jìn)行判定,決定掃描窗口內(nèi)是否包含目標(biāo)物體;b6)將圖像金字塔每一層的檢測(cè)結(jié)果進(jìn)行融合,得到最終的檢測(cè)結(jié)果。本發(fā)明基于深度圖像的對(duì)象檢測(cè)方法,所述步驟a1)和步驟b1)中的數(shù)據(jù)源可以只包含深度圖像,也可以同時(shí)包含可見(jiàn)光圖像;深度圖像是物體距離相機(jī)的距離;該深度圖像通過(guò)雙目視覺(jué)設(shè)備或通過(guò)紅外結(jié)構(gòu)光投影設(shè)備得到。本發(fā)明基于深度圖像的對(duì)象檢測(cè)方法,所述步驟a2)如下:a21)在深度圖像上標(biāo)記目標(biāo)物體的包圍框;對(duì)深度圖像和可見(jiàn)光圖像進(jìn)行配準(zhǔn),利用變化矩陣將一個(gè)圖像上的標(biāo)注結(jié)果映射到另一個(gè)圖像上;a22)從包圍框的中心開(kāi)始,得到物體在包圍框內(nèi)部的聯(lián)通區(qū)域;假設(shè)同一個(gè)物體在深度上是連續(xù)的,在深度圖像上已經(jīng)標(biāo)注的物體包圍框內(nèi),采用連續(xù)區(qū)域分析connectedcomponentanalysis方法將物體進(jìn)行分割,每個(gè)包圍框被分割成兩部分:物體區(qū)域和背景區(qū)域;a23)如果輸入信息除了深度圖像還包括可見(jiàn)光圖像,在配準(zhǔn)的基礎(chǔ)上將步驟12)中的分割結(jié)果映射到可見(jiàn)光圖像上。本發(fā)明基于深度圖像的對(duì)象檢測(cè)方法,所述步驟a3)包括以下具體步驟:a31)利用待測(cè)物體距離相機(jī)的距離信息,將待測(cè)物體區(qū)域剪切出來(lái),對(duì)其大小進(jìn)行尺寸歸一化處理;a32)在歸一化后的樣本上計(jì)算物體的形狀特征;a33)如果輸入信息除了深度圖像還包括可見(jiàn)光圖像,對(duì)其進(jìn)行外觀特征的計(jì)算;a34)將可得到的物體的所有特征,形成一個(gè)特征池;對(duì)該特征池進(jìn)行特征選擇,找到那些分類(lèi)錯(cuò)誤率較小的的特征,用于區(qū)分目標(biāo)物體和非目標(biāo)物體。本發(fā)明基于深度圖像的對(duì)象檢測(cè)方法,所述步驟a4)包括以下具體步驟:a41)在已有的目標(biāo)樣本集、非目標(biāo)樣本集以及它們的特征池的基礎(chǔ)上,進(jìn)行分類(lèi)器的訓(xùn)練;a42)從特征池中,利用迭代過(guò)程,選擇具有最小分類(lèi)錯(cuò)誤率的特征;a43)利用選擇的特征,生成物體對(duì)應(yīng)的分類(lèi)器。本發(fā)明基于深度圖像的對(duì)象檢測(cè)方法,所述步驟b2)包括以下具體步驟:b21)給定輸入圖像對(duì),包括可見(jiàn)光圖像和深度圖像,且輸入圖像對(duì)已經(jīng)經(jīng)過(guò)配準(zhǔn);b22)構(gòu)建可見(jiàn)光圖像金字塔和深度圖像金字塔;b221):圖像初始尺度s為1,標(biāo)準(zhǔn)檢測(cè)窗口的大小為;b222):圖像尺度為s,對(duì)應(yīng)的等效檢測(cè)窗口大小為,即對(duì)應(yīng)的物體的像的大小為;b223):當(dāng)物體的像時(shí),其對(duì)應(yīng)的深度的取值范圍為;b224):根據(jù)步驟b223)中的范圍,獲得當(dāng)前深度圖像:其中,表示深度圖像中的像素點(diǎn)的坐標(biāo)位置;表示該位置上的物體的距離值;b225):根據(jù)深度圖像,分割出對(duì)應(yīng)的可見(jiàn)光圖像中的相應(yīng)區(qū)域,表示為;b226):根據(jù)當(dāng)前圖像尺度縮小深度圖像和可見(jiàn)光圖像,作為圖像金字塔的第一層;b227):更新當(dāng)前圖像尺度;b228):重復(fù)步驟b222)~b227),構(gòu)建圖像金字塔上的其他層次:可見(jiàn)光圖像金字塔以及深度圖像金字塔;b229):當(dāng)圖像金字塔的圖像的尺寸小于標(biāo)準(zhǔn)檢測(cè)窗口尺寸時(shí),構(gòu)建過(guò)程終止。本發(fā)明基于深度圖像的對(duì)象檢測(cè)方法,所述步驟b4)包括以下具體步驟:b41)在掃描窗口內(nèi)計(jì)算物體的形狀特征;b42)如果輸入信息除了深度圖像還包括可見(jiàn)光圖像,對(duì)可見(jiàn)光圖像進(jìn)行外觀特征的計(jì)算。本發(fā)明基于深度圖像的對(duì)象檢測(cè)方法,所述步驟b5)包括以下具體步驟:b51)將判定為物體的檢測(cè)窗口映射回到輸入圖像尺寸,假設(shè)當(dāng)前檢測(cè)窗口的位置為,其在原始圖像上的對(duì)應(yīng)位置為;b52)在原始輸入圖像上,將重疊區(qū)域大于一定閾值的窗口進(jìn)行融合,然后利用分類(lèi)器輸出進(jìn)行閾值處理,得到最終檢測(cè)結(jié)果。本發(fā)明基于深度圖像的對(duì)象檢測(cè)方法的實(shí)現(xiàn)裝置,包括數(shù)據(jù)采集模塊,用于采集樣本數(shù)據(jù),其中包括深度信息獲取模塊和可見(jiàn)光信息獲取模塊,數(shù)據(jù)采集模塊將采集到的深度圖像和可見(jiàn)光圖像傳遞給數(shù)據(jù)配準(zhǔn)模塊;數(shù)據(jù)配準(zhǔn)模塊,用于配準(zhǔn)深度圖像和可見(jiàn)光圖像,數(shù)據(jù)配準(zhǔn)模塊將配準(zhǔn)結(jié)果傳遞給距離分割模塊;距離分割模塊,用于將距離相機(jī)遠(yuǎn)近不同的物體分離,將分離結(jié)果傳遞給特征計(jì)算模塊;特征計(jì)算模塊,用于計(jì)算分割后的物體的形狀特征和外觀特征,并將計(jì)算好的特征傳遞給分類(lèi)器訓(xùn)練模塊;分類(lèi)器訓(xùn)練模塊,用于根據(jù)特征計(jì)算裝置得到的特征,訓(xùn)練得到分類(lèi)器;分類(lèi)器檢測(cè)模塊,利用分類(lèi)器訓(xùn)練模塊得到的分類(lèi)器,對(duì)輸入的深度圖像以及可見(jiàn)光圖像進(jìn)行檢測(cè),得到可能包含物體的候選窗口,并將結(jié)果傳遞給后處理模塊;后處理模塊,對(duì)于分類(lèi)器檢測(cè)裝置得到的候選窗口進(jìn)行融合,輸出物體檢測(cè)窗口。本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn):其一,深度圖像不受光照變化的影響,當(dāng)光照變化較大或者在光照較弱的環(huán)境下,本發(fā)明仍然能夠?qū)δ繕?biāo)對(duì)象辨識(shí);其二,不易受到復(fù)雜的背景的影響,即使當(dāng)背景紋理很豐富時(shí),仍然能夠有效的將目標(biāo)與背景進(jìn)行區(qū)分,從而減小誤檢數(shù)目;其三,不需要對(duì)于圖像的所有尺度的所有位置進(jìn)行檢測(cè),通過(guò)稀疏的圖像金字塔,有效的減少了掃描窗口的數(shù)目,顯著提高了檢測(cè)的速度,當(dāng)采用計(jì)算量較大的特征時(shí),系統(tǒng)的實(shí)時(shí)性仍然可以保證。附圖說(shuō)明圖1是圖像采集設(shè)備采集的彩色/灰度圖像和深度圖像的示意圖。圖2是正例數(shù)據(jù)預(yù)處理流程圖。圖3圖像歸一化過(guò)程示意圖。圖4傳統(tǒng)物體檢測(cè)中圖像金字塔的構(gòu)建。圖5物體成像大小與其距離投影中心的距離的關(guān)系。圖6基于深度信息的圖像金字塔的構(gòu)建。圖7基于深度圖像的對(duì)象檢測(cè)方法的實(shí)現(xiàn)裝置。具體實(shí)施方式本發(fā)明提供了一種利用基于深度圖像的對(duì)象檢測(cè)方法,包括訓(xùn)練和檢測(cè)兩個(gè)過(guò)程:訓(xùn)練過(guò)程包括以下步驟:1)根據(jù)物體距離相機(jī)的距離,在深度圖像上對(duì)物體區(qū)域進(jìn)行分割;2)在分割的基礎(chǔ)上計(jì)算物體的外觀和形狀特征;3)根據(jù)所述特征訓(xùn)練針對(duì)于物體的分類(lèi)器。檢測(cè)過(guò)程包括以下步驟:4)根據(jù)物體距離相機(jī)的距離對(duì)其圖像進(jìn)行不同尺度的縮放,形成一個(gè)圖像金字塔。5)對(duì)于圖像金字塔的每一層的圖像上的非空區(qū)域,劃分為多個(gè)掃描窗口。6)在每一個(gè)掃描窗口內(nèi)部,計(jì)算外觀和形狀特征;7)利用訓(xùn)練過(guò)程中得到的分類(lèi)器,對(duì)掃描窗口內(nèi)的所述特征進(jìn)行判定,決定掃描窗口內(nèi)是否包含目標(biāo)物體。8)將圖像金字塔每一層的檢測(cè)結(jié)果進(jìn)行融合,得到最終的檢測(cè)結(jié)果。上述方法中,所述步驟1)中物體距離相機(jī)的距離表示成為一副深度圖像;上述方法中,所述步驟1)中的深度圖像可以通過(guò)雙目視覺(jué)設(shè)備得到;上述方法中,所述步驟1)中的深度圖像也可以通過(guò)紅外結(jié)構(gòu)光投影設(shè)備得到;上述方法中,所述步驟1)包括以下具體步驟:11)在深度圖像上標(biāo)注待檢測(cè)的物體的包圍框;12)從包圍框的中心開(kāi)始,得到物體在包圍框內(nèi)部的聯(lián)通區(qū)域;13)如果輸入信息除了深度圖像還包括彩色圖像或者灰度圖像,在彩色圖像和灰度圖像經(jīng)過(guò)配準(zhǔn)后,在彩色圖像上的對(duì)應(yīng)位置進(jìn)行分割。上述方法中,所述步驟2)包括以下具體步驟:21)利用物體距離相機(jī)的距離信息,對(duì)物體區(qū)域的大小進(jìn)行歸一化;22)在歸一化后的樣本上計(jì)算物體的形狀特征;23)如果輸入信息除了深度圖像還包括彩色圖像或者灰度圖像,可以對(duì)其進(jìn)行外觀特征的計(jì)算。24)將可得到的物體的所有特征,形成一個(gè)特征池。上述方法中,所述步驟3)包括以下具體步驟:31)從特征池中,利用迭代過(guò)程,選擇具有最小分類(lèi)錯(cuò)誤率的一組的特征;32)利用選擇的特征,生成物體對(duì)應(yīng)的分類(lèi)器。上述方法中,所述步驟4)包括以下具體步驟:41)對(duì)于輸入深度圖像,根據(jù)物體距離相機(jī)的距離,劃分成多個(gè)圖像,稱(chēng)為一組圖像;42)對(duì)于41)中的一組圖像,利用21)中的歸一化方法,對(duì)一組圖像根據(jù)其距離相機(jī)的距離進(jìn)行不同尺度的縮放,形成一個(gè)圖像金字塔;上述方法中,所述步驟5)包括以下具體步驟:51)每一層的圖像金字塔對(duì)應(yīng)于位于一定距離區(qū)間的物體,圖像金字塔中一層的圖像只有在對(duì)應(yīng)區(qū)間內(nèi)的物體的位置具有有效的取值;其他位置取值為空值。52)在每一層的圖像金字塔的非空值區(qū)域,劃分為多個(gè)掃描窗口。上述方法中,所述步驟6)包括以下具體步驟:61)在掃描窗口上計(jì)算物體的形狀特征;形狀特征的提取可以采用哈爾特征Haar,梯度方向直方圖特征HOG或者輪廓模板等特征。本發(fā)明中利用梯度方向直方圖特征描述物體的形狀。62)如果輸入信息除了深度圖像還包括彩色圖像或者灰度圖像,可以對(duì)其進(jìn)行外觀特征的計(jì)算。外觀特征或者紋理特征的提取可以使用哈爾特征Haar或者局部二值模式特征LBP。本發(fā)明中采用哈爾特征Haar。上述方法中,所述步驟7)包括以下具體步驟:71)將特征輸入步驟3)中得到分類(lèi)器。72)所述分類(lèi)器對(duì)輸入特征給出判定結(jié)果,判定當(dāng)前窗口為目標(biāo)物體或者非目標(biāo)物體。上述方法中,所述步驟8)包括以下具體步驟:81)將每一層的圖像金字塔的檢測(cè)結(jié)果,放縮回原始圖像中。82)在原始圖像中,將相互重疊的檢測(cè)結(jié)果進(jìn)行合并,得到最終檢測(cè)結(jié)果。本發(fā)明還提供了一種基于深度圖像的對(duì)象檢測(cè)方法的實(shí)現(xiàn)裝置,包括下列模塊:數(shù)據(jù)采集模塊,用于采集樣本數(shù)據(jù);數(shù)據(jù)配準(zhǔn)模塊,用于配準(zhǔn)深度圖像和彩色圖像;距離分割模塊,用于將距離相機(jī)遠(yuǎn)近不同的物體分離;特征計(jì)算模塊,用于計(jì)算分割后的物體的形狀特征和外觀特征;分類(lèi)器訓(xùn)練模塊,用于根據(jù)特征計(jì)算裝置得到的特征,訓(xùn)練分類(lèi)器;分類(lèi)器檢測(cè)模塊,用于對(duì)輸入的深度圖像以及彩色或者灰度圖像進(jìn)行檢測(cè),得到可能包含物體的候選窗口;后處理模塊,對(duì)于分類(lèi)器檢測(cè)裝置得到的候選窗口進(jìn)行后處理,輸出物體檢測(cè)窗口。上述裝置中,還包括分類(lèi)器選擇裝置:根據(jù)用戶要求,選擇使用物體的形狀特征或者外觀特征。上述裝置中,分類(lèi)器結(jié)構(gòu)為瀑布型分類(lèi)器。上述裝置中,瀑布型分類(lèi)器的每一層分類(lèi)器可以采用支持向量機(jī)(SVM)分類(lèi)器或者Adaboost分類(lèi)器。下面結(jié)合附圖對(duì)本發(fā)明的具體實(shí)施方式作進(jìn)一步詳細(xì)的說(shuō)明。本發(fā)明的物體檢測(cè)方法包括訓(xùn)練過(guò)程(生成檢測(cè)器)和檢測(cè)過(guò)程(應(yīng)用檢測(cè)器進(jìn)行物體檢測(cè))兩個(gè)主要過(guò)程。訓(xùn)練過(guò)程是指通過(guò)已知的樣本,學(xué)習(xí)確定物體的規(guī)則的過(guò)程。包括以下具體步驟:首先,本發(fā)明的數(shù)據(jù)源為從圖像采集設(shè)備得到深度圖像和彩色/灰度圖像,如圖1所示。在以下說(shuō)明中,在不引起混淆的前提下,將彩色/灰度圖像統(tǒng)稱(chēng)為可見(jiàn)光圖像。深度圖像12上的每個(gè)像素點(diǎn)的值表示該物點(diǎn)到相機(jī)投影中心的距離,如13所示。深度圖像可以由雙目視覺(jué)裝置獲得或者結(jié)構(gòu)光投影裝置獲得。深度圖像為本發(fā)明的必要數(shù)據(jù)源,通過(guò)該數(shù)據(jù)可以得到物體的形狀信息以及三維位置信息??梢?jiàn)光圖像11由可見(jiàn)光成像裝置獲得??梢?jiàn)光圖像為本發(fā)明的可選數(shù)據(jù)源。在可獲得彩色/灰度數(shù)據(jù)的情況下,可以得到物體的外觀和紋理信息;在不可獲得彩色/灰度數(shù)據(jù)的情況下,可以通過(guò)深度圖像中物體的形狀信息進(jìn)行物體檢測(cè)。其次,數(shù)據(jù)預(yù)處理過(guò)程包括正例樣本(包含目標(biāo)物體的樣本)的采集和反例樣本(不包含目標(biāo)物體的樣本)的采集。正例樣本的預(yù)處理過(guò)程如圖2所示,其中包括以下具體步驟:可見(jiàn)光圖像與深度圖像的配準(zhǔn)過(guò)程21,是確定可見(jiàn)光圖像與深度圖像上的像素點(diǎn)之間的對(duì)應(yīng)關(guān)系的過(guò)程。配準(zhǔn)的結(jié)果為兩幅圖像之間的坐標(biāo)變換矩陣,通過(guò)該變換矩陣,可以找到深度圖像和可見(jiàn)光圖像上的像素點(diǎn)的映射關(guān)系。該坐標(biāo)變換矩陣可以作為圖像采集設(shè)備參數(shù),在圖像采集設(shè)備的相關(guān)出廠說(shuō)明中給出;也可以采用人工的方法,利用靶標(biāo)物體進(jìn)行配準(zhǔn)。在深度圖像上標(biāo)記物體的包圍框22。在深度圖像上標(biāo)記目標(biāo)物體的包圍框。該過(guò)程也可以在可見(jiàn)光圖像上進(jìn)行,因?yàn)樯疃葓D像和可見(jiàn)光圖像已經(jīng)經(jīng)過(guò)配準(zhǔn),因此可以利用變化矩陣將一個(gè)圖像上的標(biāo)注結(jié)果映射到另一個(gè)圖像上。利用深度圖像的連通性進(jìn)行物體的分割24。這里采用一個(gè)假設(shè),同一個(gè)物體在深度上應(yīng)該是連續(xù)的。利用這個(gè)假設(shè),在深度圖像上已經(jīng)標(biāo)注的物體包圍框內(nèi),將物體進(jìn)行分割。然后將分割結(jié)果映射到可見(jiàn)光圖像上23。至此,每個(gè)包圍框被分割成兩部分,物體區(qū)域和背景區(qū)域。分割方法采用連續(xù)區(qū)域分析(connectedcomponentanalysis,CCA)方法。尺寸歸一化處理25,26。將可見(jiàn)光圖像和深度圖像上的包圍框區(qū)域剪切出來(lái),放縮到標(biāo)準(zhǔn)尺寸??梢?jiàn)光圖像的歸一化過(guò)程如圖3所示,在包含物體的圖像31、32、33上手工標(biāo)注物體的包圍框34,歸一化后成標(biāo)準(zhǔn)尺寸的樣本35。本發(fā)明中物體的標(biāo)準(zhǔn)尺寸為24×24像素。根據(jù)具體應(yīng)用不同,也可以采用其它標(biāo)準(zhǔn)化尺寸。深度圖像的歸一化過(guò)程與可見(jiàn)光圖像相同。形狀特征提取28。在歸一化后的深度圖像的樣本上,提取物體的形狀特征。形狀特征的提取可以采用哈爾特征Haar,梯度方向直方圖特征HOG或者輪廓模板等特征。本發(fā)明中利用梯度方向直方圖特征描述物體的形狀。外觀特征提取27。在歸一化后可見(jiàn)光圖像的樣本上,提取物體的外觀特征或者紋理特征。外觀特征或者紋理特征的提取可以使用哈爾特征Haar或者局部二值模式特征LBP。本發(fā)明中采用哈爾特征Haar。形成特征池29。在提取完物體的外觀和形狀特征后,對(duì)于目標(biāo)物體形成一個(gè)由多個(gè)特征組成的特征池。該特征池中的特征數(shù)目非常大,需要進(jìn)行特征選擇,找到那些分類(lèi)錯(cuò)誤率較小的的特征,用于分類(lèi)。反例樣本的包圍框在不包含目標(biāo)的圖像上隨機(jī)選取。歸一化處理的過(guò)程和特征提取的過(guò)程與正例樣本相同。最后,分類(lèi)器的生成。在已有的正例樣本集、反例樣本集以及它們的特征池的基礎(chǔ)上,任意學(xué)習(xí)算法都可以被用來(lái)進(jìn)行分類(lèi)器的訓(xùn)練,例如支持向量機(jī)SVM或者RealAdaboost算法等。本發(fā)明中分類(lèi)器采用RealAdaboost算法進(jìn)行學(xué)習(xí)。該分類(lèi)器的形式如下:()其中,表示應(yīng)用于學(xué)習(xí)窗口的強(qiáng)分類(lèi)器函數(shù),其輸出為1或者-1,如果為1,則表示判定為目標(biāo)物體;如果為-1,則表示判定為非目標(biāo)物體。公式(1)表示,強(qiáng)分類(lèi)器的判定結(jié)果是多個(gè)弱分類(lèi)器的信度的累加(加法操作)得到的。是符號(hào)函數(shù)。每個(gè)表示一個(gè)弱分類(lèi)器的計(jì)算,在本發(fā)明中,每個(gè)弱分類(lèi)器對(duì)應(yīng)于特征池中的一個(gè)特征。是特征的的標(biāo)號(hào),同時(shí)也是弱分類(lèi)器器的標(biāo)號(hào)。是待檢測(cè)窗口。在本例子中,由各弱分類(lèi)器構(gòu)成。對(duì)于物體檢測(cè)問(wèn)題,針對(duì)某一具體目標(biāo)物體,圖像中“非目標(biāo)物體”的數(shù)量要遠(yuǎn)遠(yuǎn)大于“目標(biāo)物體”的數(shù)量。因此,在訓(xùn)練或者使用分類(lèi)器的過(guò)程中,為了提高效率運(yùn)行,本發(fā)明采用層級(jí)式的瀑布型分類(lèi)器。瀑布型分類(lèi)器包含個(gè)串行的層級(jí)分類(lèi)器,每個(gè)層級(jí)分類(lèi)器都會(huì)排除一定比例的反例樣本,因此,只有通過(guò)所有層級(jí)分類(lèi)器后的測(cè)試樣本才會(huì)被判定為“物體”。樣本在瀑布型分類(lèi)器中測(cè)試的層級(jí)數(shù)目越少,測(cè)試的速度也就越快。因?yàn)榇蟛糠帧胺悄繕?biāo)物體”窗口在層級(jí)分類(lèi)器中的前幾個(gè)層級(jí)通過(guò)少量的計(jì)算就可以被排除,且實(shí)際圖像中“非目標(biāo)物體”的數(shù)量要遠(yuǎn)遠(yuǎn)大于“目標(biāo)物體”的數(shù)量,因此通過(guò)這種瀑布型分類(lèi)器,可以迅速排除大量“非目標(biāo)物體”窗口,從而提高處理效率。而“目標(biāo)物體”窗口雖然要經(jīng)過(guò)所有的層級(jí),但是因?yàn)槠渌急壤鄬?duì)較少,對(duì)于整體的速度影響不大。經(jīng)過(guò)訓(xùn)練過(guò)程后,生成的分類(lèi)器可以直接用于檢測(cè)一定大小的物體。在本發(fā)明中,歸一化后的樣本尺寸為24×24像素,因此,生成的分類(lèi)器可以直接用于檢測(cè)24×24像素大小的物體。應(yīng)用檢測(cè)器進(jìn)行物體檢測(cè)是指對(duì)于任意給定圖像,判定圖像中是否包含目標(biāo)物體以及確定目標(biāo)物體所在位置的過(guò)程。本發(fā)明中分類(lèi)器可以直接用于檢測(cè)24×24像素大小的物體,對(duì)于不同大小的物體,可以通過(guò)放縮輸入圖像的方式來(lái)進(jìn)行檢測(cè)。例如,將輸入圖像的寬和高分別縮小到原來(lái)的后,利用檢測(cè)器進(jìn)行檢測(cè)得到的物體,其實(shí)際圖像尺寸為48×48。為了實(shí)現(xiàn)對(duì)于所有尺寸的物體的檢測(cè),需要將輸入圖像按照一定的比例進(jìn)行一系列的放縮,得到一個(gè)圖像金字塔。然后窮舉圖像金字塔的所有位置,進(jìn)行標(biāo)準(zhǔn)尺寸的物體檢測(cè)。最后再將所有的檢測(cè)結(jié)果按照其所在圖像的放縮尺度進(jìn)行復(fù)原,得到最終的物體檢測(cè)結(jié)果。這里,圖像金字塔的放縮尺度稱(chēng)為尺度因子,用表示;掃描窗口的移動(dòng)步長(zhǎng)用表示,標(biāo)準(zhǔn)檢測(cè)窗口尺寸用表示,輸入圖像的尺寸用表示。傳統(tǒng)的圖像金字塔構(gòu)建過(guò)程如圖4所示。給定輸入圖像40,構(gòu)建圖像金字塔41的過(guò)程如下:步驟1:初始的圖像尺度為1。步驟2:根據(jù)當(dāng)前圖像尺度縮小圖像,形成圖像金字塔的第一層410。步驟3:在圖像410上以為步長(zhǎng),移動(dòng)掃描窗口415,檢測(cè)所有的位置,判斷其是否為目標(biāo)物體。步驟4:將判定為目標(biāo)物體的檢測(cè)窗口映射回到輸入圖像尺寸,假設(shè)當(dāng)前檢測(cè)窗口的位置為,其在原始圖像上的對(duì)應(yīng)位置為步驟5:更新當(dāng)前圖像尺度步驟6:重復(fù)步驟2~步驟5,構(gòu)建圖像金字塔上的其他層次:411、412、413、414、…,進(jìn)行相應(yīng)尺度的物體檢測(cè)。步驟7:當(dāng)圖像金字塔的圖像的尺寸小于標(biāo)準(zhǔn)檢測(cè)窗口尺寸時(shí),檢測(cè)過(guò)程終止。步驟8:在原始輸入圖像上,將重疊區(qū)域大于一定閾值的窗口進(jìn)行融合,然后利用檢測(cè)的可信度進(jìn)行閾值處理,得到最終檢測(cè)結(jié)果。上述的檢測(cè)過(guò)程,一個(gè)主要的問(wèn)題是掃描窗口的數(shù)量非常巨大。以輸入圖像大小為的圖像為例,假設(shè)掃描窗口的尺寸為;尺度因子;移動(dòng)步長(zhǎng)用。為了遍歷所有的位置和尺度,需要判別的掃描窗口的數(shù)量約為21萬(wàn)個(gè)。大量的檢測(cè)窗口會(huì)顯著影響檢測(cè)器的檢測(cè)時(shí)間。在本發(fā)明中,深度圖像和可見(jiàn)光圖像同時(shí)獲得,可以利用圖像的深度信息來(lái)大大減少掃描窗口的數(shù)量。如圖5所示成像系統(tǒng)中,投影中心50、投影平面(像平面)51,物體52,以及物體在像平面上的投影53。假設(shè)物體實(shí)際尺寸為mm,其距離投影中心的距離為,像的尺寸為像素,像平面到投影中心的距離為。假設(shè)像素與mm之間的變換比例為,則像的尺寸由像素轉(zhuǎn)換為mm,可以表示為。根據(jù)圖5,不難得出物體的像的尺寸和物體的尺寸以及物體距離投影中心的距離存在以下關(guān)系:()進(jìn)一步表示為:()其中,因?yàn)閷?duì)于給定成像系統(tǒng)中,和均為常數(shù),因此也為常數(shù)。對(duì)于特定的物體檢測(cè)任務(wù)而言,其所檢測(cè)的目標(biāo)物體的實(shí)際尺寸通常會(huì)在一定的范圍之內(nèi)。例如對(duì)于人臉檢測(cè),人臉的實(shí)際尺寸的正常范圍為;如對(duì)于手掌檢測(cè),人的手掌的實(shí)際尺寸的正常范圍為。因此,物體的尺寸可以表示為基準(zhǔn)尺寸與變化區(qū)間的形式。即:()其中為目標(biāo)物體的基準(zhǔn)尺寸,而為目標(biāo)物體尺寸的變化區(qū)間。而公式(3)可以進(jìn)一步表示為:()其中,。對(duì)于用于檢測(cè)特定的目標(biāo)的特定系統(tǒng),和均為確定參數(shù),且可以通過(guò)計(jì)算得到。公式(5)是成像系統(tǒng)的一般性公式,表示物體的像尺寸與物體到投影中心的距離的乘積,可以近似的認(rèn)為是一個(gè)常數(shù)。在本發(fā)明中,因?yàn)閿?shù)據(jù)源為經(jīng)過(guò)配準(zhǔn)的可見(jiàn)光圖像與深度圖像組成的圖像對(duì),因此可以認(rèn)為物體到投影中心的距離是已知的(通過(guò)深度圖像的信息)。本發(fā)明的所采用的檢測(cè)過(guò)程如圖6所示:步驟1:給定輸入圖像對(duì)60,包括可見(jiàn)光圖像601和深度圖像602。且輸入圖像對(duì)601和602已經(jīng)經(jīng)過(guò)配準(zhǔn)。步驟2:構(gòu)建可見(jiàn)光圖像金字塔61和深度圖像金字塔62,進(jìn)行多尺度的物體檢測(cè)。步驟201:圖像初始尺度s為1,標(biāo)準(zhǔn)檢測(cè)窗口的大小為。步驟202:圖像尺度為s,對(duì)應(yīng)的等效檢測(cè)窗口大小為,即對(duì)應(yīng)的物體的像的大小為步驟203:根據(jù)公式(5),當(dāng)物體的像時(shí),其對(duì)應(yīng)的深度的取值范圍為步驟204:根據(jù)步驟203中的范圍,獲得當(dāng)前深度圖像,如圖6中的620:在這里,表示深度圖像中的像素點(diǎn)的坐標(biāo)位置;表示該位置上的物體的距離值。上式表明,深度圖像中的像素只包含屬于步驟203中范圍的部分;而不屬于該范圍的像素值為空值()。這里需要指出,空值不等同于0,空值表示圖像上該部分為無(wú)效區(qū)域。如圖6中的陰影區(qū)域616和617均表示空區(qū)域。步驟205:根據(jù)深度圖像,分割出對(duì)應(yīng)的可見(jiàn)光圖像中的相應(yīng)區(qū)域,表示為。步驟206:根據(jù)當(dāng)前圖像尺度縮小620深度圖像和610可見(jiàn)光圖像,作為圖像金字塔的第一層。步驟207:在圖像610和620上的非空區(qū)域以為步長(zhǎng),移動(dòng)掃描窗口615,檢測(cè)所有的位置,判斷其是否為物體。步驟208:將判定為物體的檢測(cè)窗口映射回到輸入圖像尺寸,假設(shè)當(dāng)前檢測(cè)窗口的位置為,其在原始圖像上的對(duì)應(yīng)位置為步驟209:更新當(dāng)前圖像尺度步驟210:重復(fù)步驟202~步驟209,構(gòu)建圖像金字塔上的其他層次:可見(jiàn)光圖像金字塔611、612、613、614、…;以及深度圖像金字塔621、622、623、624、…。進(jìn)行相應(yīng)尺度的物體檢測(cè)。步驟211:當(dāng)圖像金字塔的圖像的尺寸小于標(biāo)準(zhǔn)檢測(cè)窗口尺寸時(shí),檢測(cè)過(guò)程終止。步驟3:在原始輸入圖像上,將重疊區(qū)域大于一定閾值的窗口進(jìn)行融合,然后利用檢測(cè)的可信度進(jìn)行閾值處理,得到最終檢測(cè)結(jié)果63。這里需要著重指出,本發(fā)明在步驟207中,掃描窗口只掃描深度圖像和可見(jiàn)光圖像上的非空區(qū)域。而在金字塔的每一層上,非空區(qū)域所占的比例通常很小,因此掃描窗口的數(shù)量遠(yuǎn)遠(yuǎn)小于傳統(tǒng)的檢測(cè)系統(tǒng)。因此,物體的檢測(cè)速度可以較傳統(tǒng)系統(tǒng)提升10倍以上。此外,因?yàn)榭諈^(qū)域的加入,物體的誤檢率能夠顯著的降低。另一方面,因?yàn)閷⑽矬w圖像的大小與物體的實(shí)際尺寸相關(guān)聯(lián),可以排除一些非正常尺寸的物體檢測(cè),例如對(duì)于人臉檢測(cè)而言,可以排除宣傳畫(huà)和照片上的過(guò)大或者過(guò)小的非真實(shí)的人臉。這一特性可以應(yīng)用于某些安防領(lǐng)域,利用尺寸信息的約束和人臉區(qū)域在深度圖像上的非平面特性,可以排除利用照片通過(guò)安檢的可能。所述的具體步驟可以劃分為7個(gè)具體模塊,構(gòu)成基于深度圖像的對(duì)象檢測(cè)方法的實(shí)現(xiàn)裝置,如圖7所示:數(shù)據(jù)采集模塊,用于采集樣本數(shù)據(jù);數(shù)據(jù)配準(zhǔn)模塊,用于配準(zhǔn)深度圖像和彩色圖像;距離分割模塊,用于將距離相機(jī)遠(yuǎn)近不同的物體分離;特征計(jì)算模塊,用于計(jì)算分割后的物體的形狀特征和外觀特征;分類(lèi)器訓(xùn)練模塊,用于根據(jù)特征計(jì)算裝置得到的特征,訓(xùn)練分類(lèi)器;分類(lèi)器檢測(cè)模塊,用于對(duì)輸入的深度圖像以及彩色或者灰度圖像進(jìn)行檢測(cè),得到可能包含物體的候選窗口;后處理模塊,對(duì)于分類(lèi)器檢測(cè)裝置得到的候選窗口進(jìn)行后處理,輸出物體檢測(cè)窗口。上述裝置中,還包括分類(lèi)器選擇裝置:根據(jù)用戶要求,選擇使用物體的形狀特征或者外觀特征。上述裝置中,分類(lèi)器結(jié)構(gòu)為瀑布型分類(lèi)器。上述裝置中,瀑布型分類(lèi)器的每一層分類(lèi)器可以采用支持向量機(jī)(SVM)分類(lèi)器或者Adaboost分類(lèi)器。
      當(dāng)前第1頁(yè)1 2 3 
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1