本發(fā)明涉及智能交通管理領域,更具體的說,是涉及一種基于多特征深度學習的車輛檢測方法及裝置。
背景技術:
智能交通裝置(its)采用圖像處理、人工智能、嵌入式、傳感器和模式識別等多種技術手段,解決交通擁堵、交通事故等問題,從而提高道路交通裝置安全性和有效性。其中,車輛檢測是智能交通裝置的重要組成部分,交通疏導、輔助駕駛裝置道路監(jiān)控等領域有著廣闊的應用前景。
目前,常用的車輛檢測方法有:基于建模和模板匹配的方法和基于統(tǒng)計學習的方法。基于建模和模板匹配的方法利用局部特征描述車輛,并利用模版匹配方法進行車輛定位,該方法容易受到背景環(huán)境、復雜光照和復雜天氣的影響,且對所建模型的要求較高,算法的穩(wěn)定性不夠好。基于統(tǒng)計學習的方法首先對車輛樣本提取特征,再利用分類器對樣本特征進行訓練,獲得前景車輛和復雜背景的差異特征后,利用差異特征進行車輛定位。目前利用神經(jīng)網(wǎng)絡自主學習識別對象特征的方法已成功實現(xiàn),如利用卷積神經(jīng)網(wǎng)絡(convolutionalneuralnetwork,cnn)自主選取車輛特征進行學習與識別,但是采用單純的cnn方案擺脫不了運算量大、所需時間長的缺點。
技術實現(xiàn)要素:
有鑒于此,有必要針對上述問題,提供一種基于多特征深度學習的車輛檢測方法及裝置,用組合特征的卷積神經(jīng)網(wǎng)絡方法,能夠減少訓練所需計算量,縮短檢測時間,同時提高了車輛定位的準確率。
為了實現(xiàn)上述目的,本發(fā)明的技術方案如下:
一種基于多特征深度學習的車輛檢測方法,包括以下步驟:
s1、通過組合特征卷積神經(jīng)網(wǎng)絡訓練得到的車輛檢測模型;
s2、抓拍獲取車輛圖像數(shù)據(jù);
s3、提取車輛圖像數(shù)據(jù)中的特征信息;
s4、將特征信息輸入到車輛檢測模型中進行車輛檢測,得到檢測結果。
作為優(yōu)選的,在步驟s1中,所述組合特征卷積神經(jīng)網(wǎng)絡的訓練過程包括:
s11、獲取若干車輛樣本圖像,組成源樣本,并標注樣本圖像中每輛車的有外接矩形框;
s12、提取源樣本中每一個樣本圖像的灰度信息、x方向上的sobel邊緣檢測信息、y方向上的sobel邊緣檢測信息;
s13、將步驟s12中獲取的信息輸入到組合特征卷積神經(jīng)網(wǎng)絡中進行訓練,得到車輛監(jiān)測模型。
作為優(yōu)選的,在步驟s2中,所述特征信息包括灰度信息、x方向上的sobel邊緣檢測信息、y方向上的sobel邊緣檢測信息。
作為優(yōu)選的,所述步驟s3具體包括:對源圖像分別進行灰度變換、x方向上的sobel邊緣檢測、y方向上的sobel邊緣檢測,得到灰度信息、x方向上的sobel邊緣檢測信息、y方向上的sobel邊緣檢測信息三個單通道圖像,并舍棄原來的rgb顏色特征。
作為優(yōu)選的,所述步驟s4具體包括:
s41、在組合特征卷積神經(jīng)網(wǎng)絡中輸入灰度信息、x方向上的sobel邊緣檢測信息、y方向上的sobel邊緣檢測信息;
s42、灰度信息、x方向上的sobel邊緣檢測信息、y方向上的sobel邊緣檢測信息分別經(jīng)過第一卷積層、第一池化層,得到三個維度為n的特征向量;
s43、將三個特征向量進行組合,得到維度為3*n的組合特征向量;將組合特征向量作為下一個卷積層的輸入,經(jīng)過若干組卷積層計算并均值池化后,輸入到全連接層,最終輸出車輛坐標位置。
作為優(yōu)選的,所述步驟s42具體包括:
s421、灰度圖像經(jīng)過第一卷積層進行卷積計算conv(5,1,32),卷積核大小為5*5,滑動時每次移動1個像素,總共32個特征圖像;經(jīng)過第一池化層采用最大池化pooling(3,2),池化范圍大小為3*3,每次移動2個像素,得到灰度圖像的特征向量(x1,x2,...,xn);
s422、x方向上的sobel邊緣圖像經(jīng)過經(jīng)過第一卷積層進行卷積計算conv(5,1,32),卷積核大小為5*5,滑動時每次移動1個像素,總共32個特征圖像;經(jīng)過第一池化層采用最大池化pooling(3,2),池化范圍大小為3*3,每次移動2個像素,得到x方向上的sobel邊緣圖像的特征向量(y1,y2,...,yn);
s422、y方向上的sobel邊緣圖像經(jīng)過經(jīng)過卷積層進行卷積計算conv(5,1,32),卷積核大小為5*5,滑動時每次移動1個像素,總共32個特征圖像;經(jīng)過池化層采用最大池化pooling(3,2),池化范圍大小為3*3,每次移動2個像素,得到y(tǒng)方向上的sobel邊緣圖像的特征向量(z1,z2,...,zn)。
作為優(yōu)選的,所述步驟s43具體包括:
s431、將步驟s2中的三個特征向量進行組合,得到維度為3*n的組合特征向量(x1,x2,...,xn,y1,y2,...,yn,z1,z2,...,zn),作為下一個卷積層的輸入;
s431、經(jīng)過第二卷積層進行卷積計算conv2(5,1,32),卷積核大小為5*5,滑動時每次移動1個像素,總共32個特征圖像;
s432、經(jīng)過第二池化層采用均值池化pooling(3,2),池化范圍大小為3*3,每次移動2個像素;
s433、經(jīng)過第三卷積層進行卷積計算conv3(5,1,64),卷積核大小為3*3,滑動時每次移動2個像素,總共64個特征圖像;
s434、經(jīng)過第三池化層采用均值池化pooling(3,2),池化范圍大小為3*3,每次移動2個像素;
s435、經(jīng)過第一全連接層fc(512),全連接層的節(jié)點個數(shù)為64個;
s436、經(jīng)過第二全連接層fc(4),全連接層的節(jié)點個數(shù)為4個,最終輸出四個數(shù)字輸出(4),表示車輛位置的坐標。
作為優(yōu)選的,所述步驟s436還包括:經(jīng)過損失函數(shù)層,最終輸出四個數(shù)字輸出(4)轉換為真實坐標數(shù)值。
一種根據(jù)上述的方法進行車輛檢測的裝置,包括獲取單元、圖像預處理單元、訓練單元和檢測單元;
所述獲取單元用于獲取抓拍的檢測車輛圖像;
所述圖像預處理單元用于用于對車輛圖像提取三個通道的特征信息,包括:灰度信息、x方向上的sobel邊緣檢測、y方向上的sobel邊緣檢測;
所述訓練單元用于通過組合特征卷積神經(jīng)網(wǎng)絡訓練得到的車輛檢測模型;
所述檢測單元用于將預處理之后的圖像輸入到車輛檢測模型中進行車輛檢測,輸出車輛的相對位置。
作為優(yōu)選的,所述訓練單元具體包括:獲取若干車輛樣本圖像,組成源樣本,并標注樣本圖像中每輛車的有外接矩形框;提取樣本集中每一個樣本圖片的三通道信息:灰度信息、x方向上的sobel邊緣檢測、y方向上的sobel邊緣檢測;將三個通道信息輸入到組合特征卷積神經(jīng)網(wǎng)絡中進行訓練,根據(jù)檢測結果與所述外接矩形框調(diào)整所述卷積核內(nèi)的參數(shù)和全連接層的參數(shù),直至所述檢測結果中車輛的位置與所述外接矩形框盡可能接近,得到車輛檢測模型。
與現(xiàn)有技術相比,本發(fā)明的有益效果在于:本發(fā)明通過獲得智能網(wǎng)絡攝像機采集標準的抓拍車輛圖像,對車輛圖像提取三個通道的特征信息,主要包括:灰度信息、x方向上的sobel邊緣檢測、y方向上的sobel邊緣檢測,將三個通道的特征信息,輸入到預先訓練得到的組合特征卷積神經(jīng)網(wǎng)絡模型中進行車輛檢測,輸出檢測結果。本發(fā)明針對車輛的外觀信息和和形狀信息,提取了三個特征通道,舍棄了原始的rgb顏色特征,增加了我們對特征的先驗知識,并利用組合特征的卷積神經(jīng)網(wǎng)絡方法,能夠減少訓練所需計算量,縮短檢測時間,同時提高了車輛定位的準確率。
附圖說明
圖1為本發(fā)明實施例的方法流程圖;
圖2為本發(fā)明實施例組合特征卷積神經(jīng)網(wǎng)絡的工作流程圖;
圖3為本發(fā)明實施例的裝置結構框圖。
具體實施方式
下面結合附圖和實施例對本發(fā)明所述的一種基于多特征深度學習的車輛檢測方法及裝置作進一步說明。
以下是本發(fā)明所述的一種基于多特征深度學習的車輛檢測方法及裝置的最佳實例,并不因此限定本發(fā)明的保護范圍。
圖1示出了一種基于多特征深度學習的車輛檢測方法,包括以下步驟:
s1、通過組合特征卷積神經(jīng)網(wǎng)絡訓練得到的車輛檢測模型;
s2、抓拍獲取車輛圖像數(shù)據(jù);
s3、提取車輛圖像數(shù)據(jù)中的特征信息;
s4、將特征信息輸入到車輛檢測模型中進行車輛檢測,得到檢測結果。
作為優(yōu)選的,在步驟s1中,所述組合特征卷積神經(jīng)網(wǎng)絡的訓練過程包括:
s11、獲取若干車輛樣本圖像,組成源樣本,并標注樣本圖像中每輛車的有外接矩形框;
s12、提取源樣本中每一個樣本圖像的灰度信息、x方向上的sobel邊緣檢測信息、y方向上的sobel邊緣檢測信息;
s13、將步驟s12中獲取的信息輸入到組合特征卷積神經(jīng)網(wǎng)絡中進行訓練,得到車輛監(jiān)測模型。
作為優(yōu)選的,在步驟s2中,所述特征信息包括灰度信息、x方向上的sobel邊緣檢測信息、y方向上的sobel邊緣檢測信息。
作為優(yōu)選的,所述步驟s3具體包括:對源圖像分別進行灰度變換、x方向上的sobel邊緣檢測、y方向上的sobel邊緣檢測,得到灰度信息、x方向上的sobel邊緣檢測信息、y方向上的sobel邊緣檢測信息三個單通道圖像,并舍棄原來的rgb顏色特征。
如圖2所示,圖中,conv(m,n,k)表示卷積核大小為m*m,滑動時每次移動n個像素,總共有k個特征圖像;maxpooling(m,n)表示采用最大池化(maxpooling),范圍大小是m*m,每次移動n個像素;avepooling(m,n)表示采用均值池化(averagepooling);fc(m)表示這是一個全連接層,節(jié)點個數(shù)為m個;loss表示這是一個損失函數(shù)層。所述步驟s4具體包括:
s41、在組合特征卷積神經(jīng)網(wǎng)絡中輸入灰度信息、x方向上的sobel邊緣檢測信息、y方向上的sobel邊緣檢測信息(灰度圖像128*128,x方向上的sobel邊緣圖像128*128,y方向上的sobel邊緣圖像128*128);
s42、灰度信息、x方向上的sobel邊緣檢測信息、y方向上的sobel邊緣檢測信息分別經(jīng)過第一卷積層、第一池化層,得到三個維度為n的特征向量;
s43、將三個特征向量進行組合,得到維度為3*n的組合特征向量;將組合特征向量作為下一個卷積層的輸入,經(jīng)過若干組卷積層計算并均值池化后,輸入到全連接層,最終輸出車輛坐標位置。
作為優(yōu)選的,所述步驟s42具體包括:
s421、灰度圖像經(jīng)過第一卷積層進行卷積計算conv(5,1,32),卷積核大小為5*5,滑動時每次移動1個像素,總共32個特征圖像;經(jīng)過第一池化層采用最大池化pooling(3,2),池化范圍大小為3*3,每次移動2個像素,得到灰度圖像的特征向量(x1,x2,...,xn);
s422、x方向上的sobel邊緣圖像經(jīng)過經(jīng)過第一卷積層進行卷積計算conv(5,1,32),卷積核大小為5*5,滑動時每次移動1個像素,總共32個特征圖像;經(jīng)過第一池化層采用最大池化pooling(3,2),池化范圍大小為3*3,每次移動2個像素,得到x方向上的sobel邊緣圖像的特征向量(y1,y2,...,yn);
s422、y方向上的sobel邊緣圖像經(jīng)過經(jīng)過卷積層進行卷積計算conv(5,1,32),卷積核大小為5*5,滑動時每次移動1個像素,總共32個特征圖像;經(jīng)過池化層采用最大池化pooling(3,2),池化范圍大小為3*3,每次移動2個像素,得到y(tǒng)方向上的sobel邊緣圖像的特征向量(z1,z2,...,zn)。
作為優(yōu)選的,所述步驟s43具體包括:
s431、將步驟s2中的三個特征向量進行組合,得到維度為3*n的組合特征向量(x1,x2,...,xn,y1,y2,...,yn,z1,z2,…,zn),作為下一個卷積層的輸入;
s431、經(jīng)過第二卷積層進行卷積計算conv2(5,1,32),卷積核大小為5*5,滑動時每次移動1個像素,總共32個特征圖像;
s432、經(jīng)過第二池化層采用均值池化pooling(3,2),池化范圍大小為3*3,每次移動2個像素;
s433、經(jīng)過第三卷積層進行卷積計算conv3(5,1,64),卷積核大小為3*3,滑動時每次移動2個像素,總共64個特征圖像;
s434、經(jīng)過第三池化層采用均值池化pooling(3,2),池化范圍大小為3*3,每次移動2個像素;
s435、經(jīng)過第一全連接層fc(512),全連接層的節(jié)點個數(shù)為64個;
s436、經(jīng)過第二全連接層fc(4),全連接層的節(jié)點個數(shù)為4個,最終輸出四個數(shù)字輸出(4),表示車輛位置的坐標。
作為優(yōu)選的,所述步驟s436還包括:經(jīng)過損失函數(shù)層,最終輸出四個數(shù)字輸出(4)轉換為真實坐標數(shù)值。
車輛檢測模型的訓練可以利用反向傳播(bp,backpropagation)算法調(diào)整參數(shù),使得在測試集上輸出的結果與真實的標注盡可能接近。反向傳播除了在全鏈接層進行調(diào)整之外,在灰度通圖像、x方向上的sobel邊緣圖像和y方向上的sobel邊緣圖像輸入到卷積神經(jīng)網(wǎng)絡時卷積層分別進行調(diào)整,從而提取不同的特征卷積參數(shù)。
圖3示出了一種根據(jù)上述的方法進行車輛檢測的裝置,包括獲取單元、圖像預處理單元、訓練單元和檢測單元;
所述獲取單元用于獲取抓拍的檢測車輛圖像;
所述圖像預處理單元用于用于對車輛圖像提取三個通道的特征信息,包括:灰度信息、x方向上的sobel邊緣檢測、y方向上的sobel邊緣檢測;
所述訓練單元用于通過組合特征卷積神經(jīng)網(wǎng)絡訓練得到的車輛檢測模型;
所述檢測單元用于將預處理之后的圖像輸入到車輛檢測模型中進行車輛檢測,輸出車輛的相對位置。
作為優(yōu)選的,所述訓練單元具體包括:獲取若干車輛樣本圖像,組成源樣本,并標注樣本圖像中每輛車的有外接矩形框;提取樣本集中每一個樣本圖片的三通道信息:灰度信息、x方向上的sobel邊緣檢測、y方向上的sobel邊緣檢測;將三個通道信息輸入到組合特征卷積神經(jīng)網(wǎng)絡中進行訓練,根據(jù)檢測結果與所述外接矩形框調(diào)整所述卷積核內(nèi)的參數(shù)和全連接層的參數(shù),直至所述檢測結果中車輛的位置與所述外接矩形框盡可能接近,得到車輛檢測模型。
與現(xiàn)有技術相比,本發(fā)明的有益效果在于:本發(fā)明通過獲得智能網(wǎng)絡攝像機采集標準的抓拍車輛圖像,對車輛圖像提取三個通道的特征信息,主要包括:灰度信息、x方向上的sobel邊緣檢測、y方向上的sobel邊緣檢測,將三個通道的特征信息,輸入到預先訓練得到的組合特征卷積神經(jīng)網(wǎng)絡模型中進行車輛檢測,輸出檢測結果。本發(fā)明針對車輛的外觀信息和和形狀信息,提取了三個特征通道,舍棄了原始的rgb顏色特征,增加了我們對特征的先驗知識,并利用組合特征的卷積神經(jīng)網(wǎng)絡方法,能夠減少訓練所需計算量,縮短檢測時間,同時提高了車輛定位的準確率。
以上所述實施例僅表達了本發(fā)明的幾種實施方式,其描述較為具體和詳細,但并不能因此而理解為對本發(fā)明專利范圍的限制。應當指出的是,對于本領域的普通技術人員來說,在不脫離本發(fā)明構思的前提下,還可以做出若干變形和改進,這些都屬于本發(fā)明的保護范圍。因此,本發(fā)明專利的保護范圍應以所附權利要求為準。