本發(fā)明涉及一種基于卷積神經(jīng)網(wǎng)絡(luò)的監(jiān)控視頻中人車目標(biāo)分類方法,屬于模式識(shí)別技術(shù)領(lǐng)域。
背景技術(shù):
隨著社會(huì)的不斷發(fā)展,公共安全防范已經(jīng)成為城市現(xiàn)代化的重要基礎(chǔ),視頻監(jiān)控系統(tǒng)作為安全防范系統(tǒng)的重要組成部分,發(fā)揮著重要的作用,在城市道路交通領(lǐng)域,廣泛使用視頻監(jiān)控系統(tǒng)實(shí)時(shí)記錄人、車的交通行為,利用卷積神經(jīng)網(wǎng)絡(luò)識(shí)別監(jiān)控視頻中的人、車等目標(biāo),能夠極大的提高各類交通案件的處置效率?,F(xiàn)有的監(jiān)控視頻中人車分類方法,分類精度不高,且實(shí)時(shí)性不夠強(qiáng)。
技術(shù)實(shí)現(xiàn)要素:
鑒于上述原因,本發(fā)明的目的在于提供一種基于卷積神經(jīng)網(wǎng)絡(luò)的監(jiān)控視頻中人車目標(biāo)分類方法,利用多角度的樣本圖片對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行有針對(duì)性的訓(xùn)練、調(diào)整,能夠達(dá)到較高的人車分類準(zhǔn)確率。
為實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:
一種基于卷積神經(jīng)網(wǎng)絡(luò)的監(jiān)控視頻中人車目標(biāo)分類方法,包括:
s1:獲取多角度性的樣本集,并將樣本集劃分為訓(xùn)練樣本集、驗(yàn)證樣本集和測(cè)試樣本集;
s2:建立卷積神經(jīng)網(wǎng)絡(luò);
s3:將訓(xùn)練樣本集中的樣本圖片先減去每個(gè)像素點(diǎn)對(duì)應(yīng)的均值,然后作為訓(xùn)練數(shù)據(jù)輸入該卷積神經(jīng)網(wǎng)絡(luò),進(jìn)行有監(jiān)督的學(xué)習(xí),得到訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)的各層的參數(shù);
s4:利用訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)的各層的參數(shù),初始化與步驟s2中所述卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相同的卷積神經(jīng)網(wǎng)絡(luò),得到具有監(jiān)控視頻中人車目標(biāo)分類功能的圖像識(shí)別網(wǎng)絡(luò)。
所述步驟s1中,所述多角度性的樣本集的獲取方法是:
采集大量的監(jiān)控視頻中的人、車、非人非車的圖片,將所有圖片縮放到同等像素大小的圖片,在所有圖片中添加用于區(qū)別人、車、非人非車圖片的標(biāo)簽,對(duì)所有圖片進(jìn)行鏡像、旋轉(zhuǎn)處理。
所述步驟s2中的卷積神經(jīng)網(wǎng)絡(luò)包括兩個(gè)卷積層、兩個(gè)下采樣層,一個(gè)全 連接層,及softmax分類器,第一卷積層濾波器的大小為5×5像素,特征圖為6個(gè),第一下采樣層濾波器的大小為2×2像素,特征圖為6個(gè),第二卷積層濾波器的大小為5×5像素,特征圖為16個(gè),第二下采樣層濾波器的大小為2×2像素,特征圖為16個(gè),全連接層的特征圖為120個(gè),softmax分類器輸出三種類型的目標(biāo):人、車、其他。
對(duì)所有圖片進(jìn)行水平鏡像處理,然后沿水平方向旋轉(zhuǎn)10度。
本發(fā)明的優(yōu)點(diǎn)是:
1、采集大量的監(jiān)控視頻中的圖片,并對(duì)圖片進(jìn)行預(yù)處理,增加了不同樣本圖片之間的差異性,在此基礎(chǔ)上對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行有針對(duì)性的訓(xùn)練、調(diào)整,能夠達(dá)到較高的分類準(zhǔn)確率,保證了分類過(guò)程的實(shí)時(shí)性;
2、采用機(jī)器自學(xué)習(xí)的方法,減少了人為干預(yù),使卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)到全面的人車特征,網(wǎng)絡(luò)的泛化能力強(qiáng)。
附圖說(shuō)明
圖1是本發(fā)明的卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖。
圖2是本發(fā)明的卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程圖。
圖3是利用本發(fā)明的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分類的過(guò)程圖。
具體實(shí)施方式
如圖1至3所示,本發(fā)明公開(kāi)的基于卷積神經(jīng)網(wǎng)絡(luò)的監(jiān)控視頻中人車目標(biāo)分類方法,包括以下步驟:
s1:獲取樣本集,并將樣本集劃分為訓(xùn)練樣本集、驗(yàn)證樣本集和測(cè)試樣本集;
采集大量的監(jiān)控視頻中的人、車、非人非車的圖片,將所有圖片縮放到32×32像素大小,對(duì)所有圖片于每個(gè)像素點(diǎn)進(jìn)行平均值計(jì)算,并在所有圖片中添加標(biāo)簽,例如,在有人的圖片中添加0,在有車的圖片中添加1,在非人非車的圖片中添加2;
之后,對(duì)所有圖片進(jìn)行預(yù)處理后作為樣本圖片,預(yù)處理包括圖片的鏡像、旋轉(zhuǎn)處理,鏡像方式為水平鏡像,旋轉(zhuǎn)角度為沿水平方向旋轉(zhuǎn)10度;預(yù)處理后得到的樣本圖片具有全面、豐富的多角度特征,且增大了不同樣本圖片(人、車、其他)之間的差異性。
將所有樣本圖片分成訓(xùn)練樣本集(占總樣本的85%)、驗(yàn)證樣本集(占總樣本的10%)和測(cè)試樣本集(占總樣本的5%)。
s2:建立卷積神經(jīng)網(wǎng)絡(luò);
如圖1所示,本發(fā)明建立的卷積神經(jīng)網(wǎng)絡(luò)包括兩個(gè)卷積層、兩個(gè)下采樣層,一個(gè)全連接層,及softmax分類器。第一卷積層濾波器的大小為5×5像素,特征圖為6個(gè),第一下采樣層濾波器的大小為2×2像素,特征圖為6個(gè),第二卷積層濾波器的大小為5×5像素,特征圖為16個(gè),第二下采樣層濾波器的大小為2×2像素,特征圖為16個(gè),全連接層的特征圖為120個(gè),softmax分類器輸出三種類型的目標(biāo):人、車、其他。
s3:將訓(xùn)練樣本集中的樣本圖片先減去每個(gè)像素點(diǎn)對(duì)應(yīng)的均值,然后作為訓(xùn)練數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò),進(jìn)行帶標(biāo)簽的有監(jiān)督的學(xué)習(xí),得到訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)的各層的參數(shù);
訓(xùn)練過(guò)程中,采用隨機(jī)梯度下降法調(diào)整卷積神經(jīng)網(wǎng)絡(luò)中各層的參數(shù),觀察卷積神經(jīng)網(wǎng)絡(luò)在驗(yàn)證樣本集上的準(zhǔn)確率變化,并調(diào)整卷積神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,確保卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練樣本集上收斂并在驗(yàn)證樣本集上達(dá)到較高的分類準(zhǔn)確率,當(dāng)卷積神經(jīng)網(wǎng)絡(luò)收斂后(準(zhǔn)確率達(dá)到設(shè)定的閾值),保存卷積神經(jīng)網(wǎng)絡(luò)中各層的參數(shù)。
s4:利用訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)的各層的參數(shù),初始化同樣結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò),得到具有監(jiān)控視頻中人車目標(biāo)分類功能的圖像識(shí)別網(wǎng)絡(luò)。
后續(xù)即可利用該圖像識(shí)別網(wǎng)絡(luò)對(duì)測(cè)試樣本集進(jìn)行測(cè)試、分類。
于一具體實(shí)施例中,使用的訓(xùn)練樣本集大小為24000張身份證照片,驗(yàn)證樣本集的大小為2823張身份證照片,測(cè)試樣本集的大小為1411張監(jiān)控視頻中的人、車、非人非車的圖片,測(cè)試前,先將測(cè)試樣本集的樣本圖片減去每個(gè)像素對(duì)應(yīng)的均值,然后輸入圖像識(shí)別網(wǎng)絡(luò),最終該圖像識(shí)別網(wǎng)絡(luò)在測(cè)試樣本集上的分類準(zhǔn)確率達(dá)到了86%,由于樣本圖片具有多角度性,因而分類準(zhǔn)確率較高。
以上所述是本發(fā)明的較佳實(shí)施例及其所運(yùn)用的技術(shù)原理,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),在不背離本發(fā)明的精神和范圍的情況下,任何基于本發(fā)明技術(shù)方案基礎(chǔ)上的等效變換、簡(jiǎn)單替換等顯而易見(jiàn)的改變,均屬于本發(fā)明保護(hù)范圍之內(nèi)。