037]圖1為本發(fā)明基于隨機森林的行人識別系統(tǒng)的模塊框圖;
[0038]圖2為本發(fā)明基于隨機森林的行人識別處理方法的方法流程圖;
[0039]圖3為本發(fā)明RF-SVM識別方法與其他識別方法對比的識別率圖。
[0040]附圖中,各標記所代表的部件名稱如下:
[0041]丨、特征提取模塊,2、聚類模塊,3、隨機森林創(chuàng)建模塊,4、評分模型模塊,401、模型構(gòu)建單元,402、評分單元。
【具體實施方式】
[0042]以下結(jié)合附圖對本發(fā)明的原理和特征進行描述,所舉實例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。
[0043]針對卡口環(huán)境及大樣本情況下,本發(fā)明提出一種新的基于隨機森林和RankSVM的行人識別方法RF-SVM(RondomForest SVM)。首先,單個訓(xùn)練樣本提取多維特征向量,經(jīng)K-means算法將所有訓(xùn)練樣本的特征向量聚類,根據(jù)隨機森林得到測試目標的預(yù)測類別號,在此類范圍內(nèi)采用RankSVM算法,將相似度排名順序作為行人識別結(jié)果,相比MCC等文中實驗列舉的傳統(tǒng)算法識別準確率高出10 %左右。
[0044]如圖1所示,一種基于隨機森林支持向量機的行人識別系統(tǒng),包括特征提取模塊
1、聚類模塊2、隨機森林創(chuàng)建模塊3和評分模型模塊4 ;
[0045]所述特征提取模塊1,用于從各圖像人物樣本中提取顏色特征信息和紋理特征信息,并將各圖像人物樣本中的各顏色特征和紋理特征用多維特征向量的形式表示;
[0046]所述聚類模塊2,用于根據(jù)K-means聚類算法對所有圖像人物樣本的多維特征向量進行聚類處理,得到類別矩陣;
[0047]K-means算法的思想是:首先隨機選取幾個數(shù)據(jù)點作為聚類中心點,其次將每個數(shù)據(jù)都聚類到最近的聚類中心點,最后計算每個類的重心,如果重心到聚類中心點的距離大于給定閾值,就以重心為此類的聚類中心點繼續(xù)聚類,直至類的重心到聚類中心點的距離小于閾值;
[0048]所述隨機森林創(chuàng)建模塊3,用于根據(jù)所述多維特征向量和類別矩陣建立隨機森林模型,再通過所述隨機森林模型對待測試人物圖像進行特征預(yù)測,得到預(yù)測類別號;
[0049]所述評分模型模塊4,用于通過RankSVM排序算法對圖像人物樣本進行訓(xùn)練,得到評分模型,再通過所述評分模型根據(jù)所述預(yù)測類別號對待測試人物圖像進行識別、評分和排序,得到待測試人物圖像相似度排名。
[0050]RankSVM中數(shù)據(jù)分為訓(xùn)練集、驗證集、測試集,都進行特征提取和量化。其中,訓(xùn)練集就是指原始數(shù)據(jù),每一列都是特征信息,提取的是原始特征,訓(xùn)練出多個基分類器。驗證集是結(jié)合多個基分類器對每種類別的得分,訓(xùn)練集成分類器。測試集就是用來最后做測試用的數(shù)據(jù)集。
[0051 ] 所述評分模型模塊4包括模型構(gòu)建單元401和評分單元402,
[0052]所述模型構(gòu)建單元401,用于將所述圖像人物樣本的多維特征向量通過RankSVM排序算法進行訓(xùn)練,得到評分模型;
[0053]所述評分單元402,用于通過評分模型按所述預(yù)測類別號對待測試人物圖像進行識別并評分,將識別到的結(jié)果根據(jù)評分大小進行排列,得到待測試人物圖像相似度排名。
[0054]所述隨機森林模型包括多個決策樹,每個決策樹對待測試人物圖像進行特征預(yù)測時,分別給出預(yù)測值,若該預(yù)測值出現(xiàn)次數(shù)最多則得到該特征的預(yù)測分類號。
[0055]隨機森林自動創(chuàng)建決策樹群,但是大部分的決策樹對于分類沒有意義,每個節(jié)點用了不相關(guān)的特征作出判斷,最終一棵決策樹分出了兩類。當做預(yù)測的時候,新的觀察到的特征隨著決策樹自上而下走下來,這樣一組觀察到的特征將會被貼上一個預(yù)測值。一旦森林中的每棵樹都給出了預(yù)測值,所有的預(yù)測結(jié)果將被匯總到一起,所有樹的模式投票被返回做為最終的預(yù)測結(jié)果。這些貌似沒有意義的決策樹做出的預(yù)測結(jié)果涵蓋所有情況,這些預(yù)測結(jié)果將會彼此抵消,而占少數(shù)的那些優(yōu)秀的樹的預(yù)測結(jié)果將會脫穎而出,做出一個好的預(yù)測。
[0056]隨機森林是由一群決策樹構(gòu)成,每棵決策樹都隨機的從輸入樣本中選取固定數(shù)量的樣本數(shù)據(jù)存入根節(jié)點,一般是樣本數(shù)據(jù)量的10%,每次二叉分都隨機的選取少量特征作為依據(jù)進行判斷,操作時可選取三類特征預(yù)測分類號。
[0057]所述隨機森林創(chuàng)建模塊3根據(jù)K-means聚類算法對所有圖像人物樣本的多維特征向量進行聚類處理,得到類別矩陣,所述類別矩陣為聚五類。
[0058]操作時可選取三類(#1,#2,#3)數(shù)據(jù)(特征預(yù)測分類號),隨機森林的輸入矩陣中保存著樣本們的正確分類,這些正確的分類就來源于之前的K-means聚類結(jié)果。正確的類標記為1,其他類標記為O ;qid表示這是對同一個樣本的數(shù)據(jù);后面是指5個特征,即5個基分類器對于此類數(shù)據(jù)的不同預(yù)測得分。三類(#1,#2, #3)數(shù)據(jù)如下:
[0059]I qid:l 1:0.8 2:0.2 3:0.2 4:0.1 5:0.5 # I I
[0060]O qid:l 1:0.1 2:0.7 3:0.2 4:0.4 5:0.3 # I 2
[0061]O qid:l 1:0.1 2:0.7 3:0.2 4:0.4 5:0.3 # I 3
[0062]所述顏色特征信息包括RGB、HSV和YCBCR顏色空間的特征信息;對所述紋理特征信息的提取通過Gabor小波算法和LBP算法進行提取。Gabor小波提取各樣本的紋理特征,LBP算法提取樣本中人物上衣的紋理特征。
[0063]如圖2所示,一種基于隨機森林支持向量機的行人識別處理方法,包括如下步驟:
[0064]步驟S1:從各圖像人物樣本中提取顏色特征信息和紋理特征信息,并將各圖像人物樣本中的各顏色特征和紋理特征用多維特征向量的形式表示;
[0065]步驟S2:根據(jù)K-means聚類算法對所有圖像人物樣本的多維特征向量進行聚類處理,得到類別矩陣;
[0066]步驟S3:根據(jù)所述多維特征向量和類別矩陣建立隨機森林模型,再通過所述隨機森林模型對待測試人物圖像進行特征預(yù)測,得到預(yù)測類別號;
[0067]步驟S4:通過RankSVM排序算法對圖像人物樣本進行訓(xùn)練,得到評分模型,再通過所述評分模型根據(jù)所述預(yù)測類別號對待測試人物圖像進行識別、評分和排序,得到待測試人物圖像相似度排名。
[0068]RankSVM中數(shù)據(jù)分為訓(xùn)練集、驗證集、測試集,都進行特征提取和量化。其中,訓(xùn)練集就是指原始數(shù)據(jù),每一列都是特征信息,提取的是原始特征,訓(xùn)練出多個基分類器。驗證集是結(jié)合多個基分類器對每種類別的得分,訓(xùn)練集成分類器。測試集就是用來最后做測試用的數(shù)據(jù)集。
[0069]實現(xiàn)所述步驟S4的具體步驟為:
[0070]步驟S4.1:將所述圖像人物樣本的多維特征向量通過RankSVM排序算法進行訓(xùn)練,得到評分模型;
[0071]步驟S4.2:通過評分模型按所述預(yù)測類別號對待測試人物圖像進行識別并評分,將識別到的結(jié)果根據(jù)評分大小進行排列,得到待測試人物圖像相似度排名。
[0072]所述隨機森林模型包括多個決策樹,每個決策樹對待測試人物圖像進行特征預(yù)測時,分別給出預(yù)測值,若該預(yù)測值出現(xiàn)次數(shù)最多則得到該特征的預(yù)測分類號。
[0073]隨機森林是由一群決策樹構(gòu)成,每棵決策樹都隨機的從輸入樣本中選取固定數(shù)量的樣本數(shù)據(jù)存入根節(jié)點,一般是樣本數(shù)據(jù)量的10%,每次二叉分都隨機的選取少量特征作為依據(jù)進行判斷,操作時可選取三類特征預(yù)測分類號。
[0074]所述步驟S2中根據(jù)K-means聚類算法對所有圖像人物樣本的多維特征向量進行聚類處理,得到類別矩陣,所述類別矩陣為聚五類。
[0075]操作時可選取三類(#1,#2,#3)數(shù)據(jù)(特征預(yù)測分類號),隨機森林的輸入矩陣中保存著樣本們的正確分類,這些正確的分類就來源于之前的K-means聚類結(jié)果。正確的類標記為1,其他類標記為O ;qid表示這是對同一個樣本的數(shù)據(jù);后面是指5個特征,即5個基分類器對于此類數(shù)據(jù)的不同預(yù)測得分。三類(#1,#2, #3)數(shù)據(jù)如下:
[0076]I qi