一種基于隨機森林支持向量機的行人識別系統(tǒng)及處理方法
【技術領域】
[0001]本發(fā)明涉及智能監(jiān)控的行人識別技術領域,尤其涉及一種基于隨機森林支持向量機的行人識別系統(tǒng)及處理方法。
【背景技術】
[0002]行人識別是模式識別領域中活躍的研究方向之一。在行人檢索和識別中,隨著樣本庫的加大,檢索識別一幅圖像的速度和準確率都受到較大的影響。行人特征提取方面,RGB、HSV等顏色直方圖信息被廣泛使用,但是易受環(huán)境影響。Gabor小波提取行人紋理特征,但是當提取不到準確的邊界曲線時候,最終得到的紋理特征會有很大變化。LBP提取紋理特征對光照有魯棒性但是在行人姿態(tài)發(fā)生很大變化時,僅從LBP提取到的紋理特征識別行人目標準確率會很低。此外,在相似度計算方面隨著樣本庫的加大,測試圖像面對的負樣本加大,與測試圖像具有相仿特征的樣本出現(xiàn)概率加大,這都會影響到測試結果的準確性,即使RankSVM計算相似度排名順序,并未給出相似度絕對值,而是排序結果供使用者自己判斷,可隨著樣本加大,干擾樣本出現(xiàn)概率大,正樣本的排名順序也會靠后。
【發(fā)明內(nèi)容】
[0003]本發(fā)明所要解決的技術問題是提供一種基于隨機森林支持向量機的行人識別系統(tǒng)及處理方法,用相似度排名方式代替了以往的相似度絕對值得比較,無需劃定閾值,得出的排名結果便于使用者自己判斷,采用K-means聚類算法代替人工給出樣本類別,可以挖掘出樣本間的潛在聯(lián)系。
[0004]本發(fā)明解決上述技術問題的技術方案如下:一種基于隨機森林支持向量機的行人識別系統(tǒng),包括特征提取模塊、聚類模塊、隨機森林創(chuàng)建模塊和評分模型模塊;
[0005]所述特征提取模塊,用于從各圖像人物樣本中提取顏色特征信息和紋理特征信息,并將各圖像人物樣本中的各顏色特征和紋理特征用多維特征向量的形式表示;
[0006]所述聚類模塊,用于根據(jù)K-means聚類算法對所有圖像人物樣本的多維特征向量進行聚類處理,得到類別矩陣;
[0007]K-means算法的思想是:首先隨機選取幾個數(shù)據(jù)點作為聚類中心點,其次將每個數(shù)據(jù)都聚類到最近的聚類中心點,最后計算每個類的重心,如果重心到聚類中心點的距離大于給定閾值,就以重心為此類的聚類中心點繼續(xù)聚類,直至類的重心到聚類中心點的距離小于閾值;
[0008]所述隨機森林創(chuàng)建模塊,用于根據(jù)所述多維特征向量和類別矩陣建立隨機森林模型,再通過所述隨機森林模型對待測試人物圖像進行特征預測,得到預測類別號;
[0009]所述評分模型模塊,用于通過RankSVM排序算法對圖像人物樣本進行訓練,得到評分模型,再通過所述評分模型根據(jù)所述預測類別號對待測試人物圖像進行識別、評分和排序,得到待測試人物圖像相似度排名。
[0010]本發(fā)明的有益效果是:用相似度排名方式代替了以往的相似度絕對值的比較,無需劃定閾值,得出的排名結果便于使用者自己判斷;建立隨機森林模型需要多特征,僅從表觀特征無法人工將樣本們分類完善,采用K-means聚類算法代替人工給出樣本類別,可以挖掘出樣本間的潛在聯(lián)系。
[0011 ] 在上述技術方案的基礎上,本發(fā)明還可以做如下改進。
[0012]進一步,所述評分模型模塊包括模型構建單元和評分單元,
[0013]所述模型構建單元,用于將所述圖像人物樣本的多維特征向量通過RankSVM排序算法進行訓練,得到評分模型;
[0014]所述評分單元,用于通過評分模型按所述預測類別號對待測試人物圖像進行識別并評分,將識別到的結果根據(jù)評分大小進行排列,得到待測試人物圖像相似度排名。
[0015]采用上述進一步方案的有益效果是:僅在預測到的預測類別號中使用評分模型(即利用RankSVM排序算法)進行識別、評分、排列,使得到的排名結果既準確又相對單一。
[0016]進一步,所述隨機森林模型包括多個決策樹,每個決策樹對待測試人物圖像進行特征預測時,分別給出預測值,若該預測值出現(xiàn)次數(shù)最多則得到該特征的預測分類號。
[0017]隨機森林自動創(chuàng)建決策樹群,但是大部分的決策樹對于分類沒有意義,每個節(jié)點用了不相關的特征作出判斷,最終一棵決策樹分出了兩類。當做預測的時候,新的觀察到的特征隨著決策樹自上而下走下來,這樣一組觀察到的特征將會被貼上一個預測值。一旦森林中的每棵樹都給出了預測值,所有的預測結果將被匯總到一起,所有樹的模式投票被返回做為最終的預測結果。這些貌似沒有意義的決策樹做出的預測結果涵蓋所有情況,這些預測結果將會彼此抵消,而占少數(shù)的那些優(yōu)秀的樹的預測結果將會脫穎而出,做出一個好的預測。
[0018]隨機森林是由一群決策樹構成,每棵決策樹都隨機的從輸入樣本中選取固定數(shù)量的樣本數(shù)據(jù)存入根節(jié)點,一般是樣本數(shù)據(jù)量的10%,每次二叉分都隨機的選取少量特征作為依據(jù)進行判斷,操作時可選取三類特征預測分類號。
[0019]采用上述進一步方案的有益效果是:K_means聚類算法結合隨機森林起到一個對樣本數(shù)據(jù)初篩的作用。
[0020]進一步,所述顏色特征信息包括RGB、HSV和YCBCR顏色空間的特征信息;對所述紋理特征信息的提取通過Gabor小波算法和LBP算法進行提取;Gabor小波提取各樣本的紋理特征,LBP算法提取樣本中人物上衣的紋理特征。
[0021]采用上述進一步方案的有益效果是:識別出各圖像人物樣本中具有顯著特征的特征信息。
[0022]進一步,所述隨機森林創(chuàng)建模塊根據(jù)K-means聚類算法對所有圖像人物樣本的多維特征向量進行聚類處理,得到類別矩陣,所述類別矩陣為聚五類。
[0023]采用上述進一步方案的有益效果是:類別矩陣為聚五類,效果更直觀。
[0024]本發(fā)明解決上述技術問題的另一技術方案如下:一種基于隨機森林支持向量機的行人識別處理方法,包括如下步驟:
[0025]步驟S1:從各圖像人物樣本中提取顏色特征信息和紋理特征信息,并將各圖像人物樣本中的各顏色特征和紋理特征用多維特征向量的形式表示;
[0026]步驟S2:根據(jù)K-means聚類算法對所有圖像人物樣本的多維特征向量進行聚類處理,得到類別矩陣;
[0027]步驟S3:根據(jù)所述多維特征向量和類別矩陣建立隨機森林模型,再通過所述隨機森林模型對待測試人物圖像進行特征預測,得到預測類別號;
[0028]步驟S4:通過RankSVM排序算法對圖像人物樣本進行訓練,得到評分模型,再通過所述評分模型根據(jù)所述預測類別號對待測試人物圖像進行識別、評分和排序,得到待測試人物圖像相似度排名。
[0029]在上述技術方案的基礎上,本發(fā)明還可以做如下改進。
[0030]進一步,實現(xiàn)所述步驟S4的具體步驟為:
[0031]步驟S4.1:將所述圖像人物樣本的多維特征向量通過RankSVM排序算法進行訓練,得到評分模型;
[0032]步驟S4.2:通過評分模型按所述預測類別號對待測試人物圖像進行識別并評分,將識別到的結果根據(jù)評分大小進行排列,得到待測試人物圖像相似度排名。
[0033]進一步,所述隨機森林模型包括多個決策樹,每個決策樹對待測試人物圖像進行特征預測時,分別給出預測值,若該預測值出現(xiàn)次數(shù)最多則得到該特征的預測分類號。
[0034]進一步,所述顏色特征信息包括RGB、HSV和YCBCR顏色空間的特征信息;對所述紋理特征信息的提取通過Gabor小波算法和LBP算法進行提取。
[0035]進一步,述步驟S2中根據(jù)K-means聚類算法對所有圖像人物樣本的多維特征向量進行聚類處理,得到類別矩陣,所述類別矩陣為聚五類。
[0036]基于VIPeR樣本庫的實驗證明,該方法對行人姿態(tài)變化具有魯棒性,在計算相似度的時候會排除來自其他幾類樣本的干擾,同時也充分利用了同一行人的多個特征間的潛在聯(lián)系,RankSVM的排名結果也會靠前,綜合多特征實現(xiàn)將正樣本和測試目標歸到同一類的目的。在此基礎上進行相似度計算,會使得識別準確率提升,相比MCC與RankSVM等現(xiàn)有技術列舉的傳統(tǒng)算法識別準確率高。
【附圖說明】
[0