一種基于顯著直方圖特征的行人檢測(cè)方法及系統(tǒng)的制作方法
【專利摘要】一種基于顯著直方圖特征的行人檢測(cè)方法及系統(tǒng),訓(xùn)練階段包括首先分別將樣本數(shù)據(jù)集中每個(gè)正樣本或負(fù)樣本歸一化為預(yù)設(shè)尺寸,然后作為輸入圖像提取特征,根據(jù)所得特征訓(xùn)練分類器;正樣本的圖像包含行人,負(fù)樣本的圖像不包含行人;測(cè)試階段包括對(duì)測(cè)試數(shù)據(jù)集中任一測(cè)試圖像,首先以測(cè)試圖像為輸入圖像,分別以輸入圖像的每個(gè)像素為中心建立預(yù)設(shè)尺寸的局部區(qū)域,并提取每個(gè)局部區(qū)域的特征,然后將每個(gè)局部區(qū)域的特征輸入訓(xùn)練階段所得分類器,得到各局部區(qū)域是否包含行人的分類結(jié)果。提取特征時(shí),將梯度的幅值和相應(yīng)局部區(qū)域顯著概率值結(jié)合成帶有顯著信息的梯度幅值,然后和梯度的方向形成顯著直方圖;通過統(tǒng)計(jì)顯著直方圖,形成特征描述。
【專利說明】一種基于顯著直方圖特征的行人檢測(cè)方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及目標(biāo)檢測(cè)領(lǐng)域,特別涉及一種基于顯著直方圖特征的行人檢測(cè)技術(shù)方案。
【背景技術(shù)】
[0002]目標(biāo)檢測(cè)在計(jì)算機(jī)視覺中是一個(gè)熱點(diǎn),廣泛的應(yīng)用在刑偵監(jiān)控、特定目標(biāo)檢索、機(jī)器人學(xué)和智能車輛中;行人在目標(biāo)檢測(cè)中又是尤為重要的因素,因此行人檢測(cè)在近幾年的時(shí)間里引起了高度重視和研究。但是在不同場(chǎng)景下光照、噪聲以及行人的多種姿態(tài)變化使行人檢測(cè)的研究面臨很大的挑戰(zhàn)。目前大多的行人檢測(cè)算法都是借助于Dalal-Triggs在文獻(xiàn)(“Histograms of oriented gradients for human detection.1n ComputerVision and Pattern Recognition,,,2005.CVPR2005.1EEE Computer Society Conferenceon, volumel, pages886_893.)中提出的HOG特征。經(jīng)過多年的研究,該領(lǐng)域取得了很大的改進(jìn)。在 Piotr Dollar 的文獻(xiàn)(Piotr Dollar, Christian Wojek, Bernt Schiele, and PietroPerona.Pedestrian detection:An evaluation of the state of the art.Pattern Analysisand Machine Intelligence, IEEE Transactions on, 34(4):743-761, 2012.)中對(duì)目前十六種行人檢測(cè)算法比對(duì)的調(diào)研中可以發(fā)現(xiàn),在行人檢測(cè)過程中有兩個(gè)重要的元素:特征和分類器。檢測(cè)過程包含訓(xùn)練和測(cè)試兩個(gè)階段:第一,從訓(xùn)練圖像中提取特征,其中特征包含了行人的色彩、紋理及外形等基本屬性信息,將提取的特征訓(xùn)練出SVM分類器;第二,從測(cè)試集圖像中提取特征,將這些特征送入到訓(xùn)練好的分類器,最后給出分類結(jié)果。從HOG特征的檢測(cè)結(jié)果中可以看出,大部分的誤檢大多出現(xiàn)在背景的區(qū)域;而這些背景區(qū)域都是圖像的非顯著區(qū)域。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的是提出一種基于顯著直方圖特征的行人檢測(cè)技術(shù)方案,解決現(xiàn)有的同類算法中高誤檢問題,通過滑動(dòng)窗口法得到最佳的結(jié)果。
[0004]為了達(dá)到以上目的,本發(fā)明采用的技術(shù)方案提供了一種基于顯著直方圖特征的行人檢測(cè)方法,包括訓(xùn)練階段和測(cè)試階段,
[0005]訓(xùn)練階段包括首先分別將樣本數(shù)據(jù)集中每個(gè)正樣本或負(fù)樣本歸一化為預(yù)設(shè)尺寸,然后作為輸入圖像提取特征,根據(jù)所得特征訓(xùn)練分類器;正樣本的圖像包含行人,負(fù)樣本的圖像不包含行人;提取特征包括進(jìn)行以下步驟,
[0006]步驟1.1,對(duì)輸入圖像進(jìn)行顏色空間的歸一化;
[0007]步驟1.2,以輸入圖像的每個(gè)像素為中心建立預(yù)設(shè)尺寸的局部區(qū)域,獲取每個(gè)局部區(qū)域的顯著概率值;
[0008]步驟1.3,對(duì)輸入圖像進(jìn)行劃分,劃分成多個(gè)大塊,每個(gè)大塊包括aXa個(gè)小塊,每個(gè)小塊中包含bXb個(gè)像素,a和b為預(yù)設(shè)參數(shù);
[0009]步驟1.4,采集每個(gè)像素的梯度的幅值和方向;[0010]步驟1.5,對(duì)每個(gè)像素,將步驟1.4中所得梯度的幅值和步驟1.2中得到的相應(yīng)局部區(qū)域顯著概率值結(jié)合成帶有顯著信息的梯度幅值,然后和步驟1.4中得到的梯度的方向形成顯著直方圖;統(tǒng)計(jì)每個(gè)像素的顯著直方圖,形成每個(gè)像素的特征描述子;將每個(gè)小塊中所有像素的特征描述子串聯(lián)起來,得到各小塊的特征描述子;將每個(gè)大塊中所有小塊的特征描述子串聯(lián)起來,得到各大塊的特征描述子;將輸入圖像中所有大塊的特征描述子串聯(lián)起來,得到該輸入圖像的特征描述子;
[0011]測(cè)試階段包括對(duì)測(cè)試數(shù)據(jù)集中任一測(cè)試圖像,首先以測(cè)試圖像為輸入圖像,分別以輸入圖像的每個(gè)像素為中心建立預(yù)設(shè)尺寸的局部區(qū)域,并提取每個(gè)局部區(qū)域的特征,然后將每個(gè)局部區(qū)域的特征輸入訓(xùn)練階段所得分類器,得到各局部區(qū)域是否包含行人的分類結(jié)果;提取特征包括進(jìn)行以下步驟,
[0012]步驟2.1,對(duì)輸入圖像進(jìn)行顏色空間的歸一化;
[0013]步驟2.2,以輸入圖像的每個(gè)像素為中心建立預(yù)設(shè)尺寸的局部區(qū)域,獲取每個(gè)局部區(qū)域的顯著概率值;
[0014]步驟2.3,基于以輸入圖像的每個(gè)像素為中心建立的預(yù)設(shè)尺寸的局部區(qū)域,將每個(gè)局部區(qū)域分別劃分成多個(gè)大塊,每個(gè)大塊包括aXa個(gè)小塊,每個(gè)小塊中包含bXb個(gè)像素,a和b為預(yù)設(shè)參數(shù);
[0015]步驟2.4,采集每個(gè)像素的梯度的幅值和方向;
[0016]步驟2.5,基于以輸入圖像的每個(gè)像素為中心建立的預(yù)設(shè)尺寸的局部區(qū)域,對(duì)每個(gè)局部區(qū)域分別提取特征如下,
[0017]對(duì)局部區(qū)域中每個(gè)像素,將步驟2.4中所得梯度的幅值和步驟2.2中得到的顯著概率值結(jié)合成帶有顯著信息的梯度幅值,然后和步驟2.4中得到的梯度的方向形成顯著直方圖;統(tǒng)計(jì)每個(gè)像素的顯著直方圖,形成每個(gè)像素的特征描述子;將每個(gè)小塊中所有像素的特征描述子串聯(lián)起來,便得到各小塊的特征描述子;將每個(gè)大塊中所有小塊的特征描述子串聯(lián)起來,便得到各大塊的特征描述子;將局部區(qū)域中所有大塊的特征描述子串聯(lián)起來,便得到該局部區(qū)域的特征描述子,作為該局部區(qū)域的特征。
[0018]而且,步驟1.2和2.2中,設(shè)歸一化后的輸入圖像記為圖像I,圖像I的每個(gè)像素Ik的顯著度Y (Ik)通過下式獲得,
[0019]
【權(quán)利要求】
1.一種基于顯著直方圖特征的行人檢測(cè)方法,其特征在于:包括訓(xùn)練階段和測(cè)試階段, 訓(xùn)練階段包括首先分別將樣本數(shù)據(jù)集中每個(gè)正樣本或負(fù)樣本歸一化為預(yù)設(shè)尺寸,然后作為輸入圖像提取特征,根據(jù)所得特征訓(xùn)練分類器;正樣本的圖像包含行人,負(fù)樣本的圖像不包含行人;提取特征包括進(jìn)行以下步驟, 步驟1.1,對(duì)輸入圖像進(jìn)行顏色空間的歸一化; 步驟1.2,以輸入圖像的每個(gè)像素為中心建立預(yù)設(shè)尺寸的局部區(qū)域,獲取每個(gè)局部區(qū)域的顯著概率值; 步驟1.3,對(duì)輸入圖像進(jìn)行劃分,劃分成多個(gè)大塊,每個(gè)大塊包括aX a個(gè)小塊,每個(gè)小塊中包含bXb個(gè)像素,a和b為預(yù)設(shè)參數(shù); 步驟1.4,采集每個(gè)像素的梯度的幅值和方向; 步驟1.5,對(duì)每個(gè)像素,將步驟1.4中所得梯度的幅值和步驟1.2中得到的相應(yīng)局部區(qū)域顯著概率值結(jié)合成帶有顯著信息的梯度幅值,然后和步驟1.4中得到的梯度的方向形成顯著直方圖;統(tǒng)計(jì)每個(gè)像素的顯著直方圖,形成每個(gè)像素的特征描述子;將每個(gè)小塊中所有像素的特征描述子串聯(lián)起來,得到各小塊的特征描述子;將每個(gè)大塊中所有小塊的特征描述子串聯(lián)起來,得到各大塊的特征描述子;將輸入圖像中所有大塊的特征描述子串聯(lián)起來,得到該輸入圖像的特 征描述子; 測(cè)試階段包括對(duì)測(cè)試數(shù)據(jù)集中任一測(cè)試圖像,首先以測(cè)試圖像為輸入圖像,分別以輸入圖像的每個(gè)像素為中心建立預(yù)設(shè)尺寸的局部區(qū)域,并提取每個(gè)局部區(qū)域的特征,然后將每個(gè)局部區(qū)域的特征輸入訓(xùn)練階段所得分類器,得到各局部區(qū)域是否包含行人的分類結(jié)果;提取特征包括進(jìn)行以下步驟, 步驟2.1,對(duì)輸入圖像進(jìn)行顏色空間的歸一化; 步驟2.2,以輸入圖像的每個(gè)像素為中心建立預(yù)設(shè)尺寸的局部區(qū)域,獲取每個(gè)局部區(qū)域的顯著概率值; 步驟2.3,基于以輸入圖像的每個(gè)像素為中心建立的預(yù)設(shè)尺寸的局部區(qū)域,將每個(gè)局部區(qū)域分別劃分成多個(gè)大塊,每個(gè)大塊包括aX a個(gè)小塊,每個(gè)小塊中包含b X b個(gè)像素,a和b為預(yù)設(shè)參數(shù); 步驟2.4,采集每個(gè)像素的梯度的幅值和方向; 步驟2.5,基于以輸入圖像的每個(gè)像素為中心建立的預(yù)設(shè)尺寸的局部區(qū)域,對(duì)每個(gè)局部區(qū)域分別提取特征如下, 對(duì)局部區(qū)域中每個(gè)像素,將步驟2.4中所得梯度的幅值和步驟2.2中得到的顯著概率值結(jié)合成帶有顯著信息的梯度幅值,然后和步驟2.4中得到的梯度的方向形成顯著直方圖;統(tǒng)計(jì)每個(gè)像素的顯著直方圖,形成每個(gè)像素的特征描述子;將每個(gè)小塊中所有像素的特征描述子串聯(lián)起來,便得到各小塊的特征描述子;將每個(gè)大塊中所有小塊的特征描述子串聯(lián)起來,便得到各大塊的特征描述子;將局部區(qū)域中所有大塊的特征描述子串聯(lián)起來,便得到該局部區(qū)域的特征描述子,作為該局部區(qū)域的特征。
2.根據(jù)權(quán)利要求1所述基于顯著直方圖特征的行人檢測(cè)方法,其特征在于:步驟1.2和2.2中,設(shè)歸一化后的輸入圖像記為圖像I,圖像I的每個(gè)像素Ik的顯著度Y(Ik)通過下式獲得,
3.根據(jù)權(quán)利要求2所述基于顯著直方圖特征的行人檢測(cè)方法,其特征在于:步驟1.4和步驟2.4中,采集每個(gè)像素單元中各像素點(diǎn)的梯度的幅值和方向如下, 提取位置(x,y)處像素的梯度如下,
Gx (x, y) = H(x+1, y)-H(x-l, y)
Gy (x, y) = H(x, y+l)-H(x, y-1) 其中,Gx(x,y)、Gy(x, y)表示圖像I中位置(x,y)處的水平方向梯度、垂直方向梯度,H(x, y)為在位置(x,y)處像素的像素值,該像素處的梯度的幅值G(x,y)和方向θ (x, y)分別表示為,
4.根據(jù)權(quán)利要求3所述基于顯著直方圖特征的行人檢測(cè)方法,其特征在于:步驟1.4和步驟2.4中,每個(gè)像素單元的顯著信息的梯度幅值提取如下,
Gs (X,y) = G(x, y)F(s(x; y)) 其中,F(xiàn)(s(x,y))是以位置(x,y)處像素為中心的預(yù)設(shè)尺寸的局部區(qū)域相應(yīng)顯著概率值F(s(x,y))。5.—種基于顯著直方圖特征的行人檢測(cè)系統(tǒng),其特征在于:包括以下模塊, 訓(xùn)練模塊,用于首先分別將樣本數(shù)據(jù)集中每個(gè)正樣本或負(fù)樣本歸一化為預(yù)設(shè)尺寸,然后作為輸入圖像提取特征,根據(jù)所得特征訓(xùn)練分類器;正樣本的圖像包含行人,負(fù)樣本的圖像不包含行人; 分類模塊,用于對(duì)測(cè)試數(shù)據(jù)集中任一測(cè)試圖像,首先以測(cè)試圖像為輸入圖像,分別以輸入圖像的每個(gè)像素為中心建立預(yù)設(shè)尺寸的局部區(qū)域,并提取每個(gè)局部區(qū)域的特征,然后將每個(gè)局部區(qū)域的特征輸入訓(xùn)練階段所得分類器,得到各局部區(qū)域是否包含行人的分類結(jié)果; 訓(xùn)練模塊包括以下子模塊,第一歸一化子模塊,用于對(duì)輸入圖像進(jìn)行顏色空間的歸一化; 第一顯著概率值獲取子模塊,用于以輸入圖像的每個(gè)像素為中心建立預(yù)設(shè)尺寸的局部區(qū)域,獲取每個(gè)局部區(qū)域的顯著概率值; 第一圖像劃分子模塊,用于對(duì)輸入圖像進(jìn)行劃分,劃分成多個(gè)大塊,每個(gè)大塊包括aXa個(gè)小塊,每個(gè)小塊中包含bXb個(gè)像素,a和b為預(yù)設(shè)參數(shù); 第一梯度采集子模塊,用于采集每個(gè)像素的梯度的幅值和方向; 第一特征生成子模塊,用于對(duì)每個(gè)像素,將第一梯度采集子模塊所得梯度的幅值和第一顯著概率值獲取子模塊得到的相應(yīng)局部區(qū)域顯著概率值結(jié)合成帶有顯著信息的梯度幅值,然后和第一梯度采集子模塊得到的梯度的方向形成顯著直方圖;統(tǒng)計(jì)每個(gè)像素的顯著直方圖,形成每個(gè)像素的特征描述子;將每個(gè)小塊中所有像素的特征描述子串聯(lián)起來,得到各小塊的特征描述子;將每個(gè)大塊中所有小塊的特征描述子串聯(lián)起來,得到各大塊的特征描述子;將輸入圖像中所有大塊的特征描述子串聯(lián)起來,得到該輸入圖像的特征描述子;分類模塊包括以下子模塊, 第二歸一化子模塊,用于對(duì)輸入圖像進(jìn)行顏色空間的歸一化; 第二顯著概率值獲取子模塊,用于以輸入圖像的每個(gè)像素為中心建立預(yù)設(shè)尺寸的局部區(qū)域,獲取每個(gè)局部區(qū)域的顯著概率值; 第二圖像劃分子模塊,用于基于以輸入圖像的每個(gè)像素為中心建立的預(yù)設(shè)尺寸的局部區(qū)域,將每個(gè)局部區(qū)域分別劃分成多個(gè)大塊,每個(gè)大塊包括aXa個(gè)小塊,每個(gè)小塊中包含bXb個(gè)像素,a和b為預(yù)設(shè)參數(shù); 第二梯度采集子模塊,用于采集每個(gè)像素的梯度的幅值和方向; 第二特征生成子模塊,用于基于以輸入圖像的每個(gè)像素為中心建立的預(yù)設(shè)尺寸的局部區(qū)域,對(duì)每個(gè)局部區(qū)域分別提取特征如下, 對(duì)局部區(qū)域中每個(gè)像素,將第二梯度采集子模塊所得梯度的幅值和第二顯著概率值獲取子模塊得到的顯著概率值結(jié)合成帶有顯著信息的梯度幅值,然后和第二梯度采集子模塊得到的梯度的方向形成顯著直方圖;統(tǒng)計(jì)每個(gè)像素的顯著直方圖,形成每個(gè)像素的特征描述子;將每個(gè)小塊中所有像素的特征描述子串聯(lián)起來,便得到各小塊的特征描述子;將每個(gè)大塊中所有小塊的特征描述子串聯(lián)起來,便得到各大塊的特征描述子;將局部區(qū)域中所有大塊的特征描述子串聯(lián)起來,便得到該局部區(qū)域的特征描述子,作為該局部區(qū)域的特征。
【文檔編號(hào)】G06T7/00GK104008404SQ201410268777
【公開日】2014年8月27日 申請(qǐng)日期:2014年6月16日 優(yōu)先權(quán)日:2014年6月16日
【發(fā)明者】胡瑞敏, 方穩(wěn)華, 梁超, 王曉, 南源源, 溫屹, 陳軍 申請(qǐng)人:武漢大學(xué)