本發(fā)明涉及計(jì)算機(jī)視覺領(lǐng)域,尤其涉及一種基于虛擬號(hào)牌的無牌車輛識(shí)別方法,是交通應(yīng)用領(lǐng)域中的一項(xiàng)重要應(yīng)用。
背景技術(shù):
伴隨我國(guó)交通事業(yè)的快速發(fā)展與民用車輛的大規(guī)模增加,通過圖像對(duì)行駛車輛進(jìn)行分類管理顯得尤為重要,特別時(shí)對(duì)于無牌車的識(shí)別與管理工作。目前還沒有一種成熟的無牌車識(shí)別解決方案,由于該方案需要準(zhǔn)確獲取車輛的位置大小、車輛品牌、年檢標(biāo)、掛件等信息,以此唯一確定同一車輛。只有這樣才能有效的進(jìn)行無牌車檢索與管理,但是以往的方法往往由于特征描述不全面,導(dǎo)致該項(xiàng)工作展開的并不是很好。
技術(shù)實(shí)現(xiàn)要素:
為了有效的查找檢索出目標(biāo)車輛,通過圖像處理構(gòu)建虛擬號(hào)牌庫(kù),由此提高無牌車的識(shí)別和管理。本發(fā)明的目的是通過以下技術(shù)方案實(shí)現(xiàn)的。
一種基于虛擬號(hào)牌的無牌車輛識(shí)別方法,其特征在于,所述方法包括:步驟1為虛擬號(hào)牌構(gòu)建步驟,包括基于視頻或圖像進(jìn)行車輛檢測(cè),獲得車輛特寫圖,對(duì)車輛圖像進(jìn)行特征提取,生成虛擬號(hào)牌,構(gòu)建虛擬號(hào)牌庫(kù);步驟2為虛擬號(hào)牌庫(kù)識(shí)別步驟,包括基于視頻或圖像進(jìn)行目標(biāo)車輛檢測(cè),獲得目標(biāo)車輛特寫圖,對(duì)目標(biāo)車輛圖像進(jìn)行特征提取,生成虛擬號(hào)牌,與所述虛擬號(hào)牌庫(kù)比對(duì)結(jié)果。
優(yōu)選地,所述步驟1包括:
步驟1-1、基于視頻或圖像進(jìn)行車輛檢測(cè),提取車輛圖像;
步驟1-2、對(duì)車輛圖像進(jìn)行特征提取,所述特征提取是基于深度學(xué)習(xí)所描述的圖像特征,所述圖像特征包括描述全車圖像的若干維全局特征,和/或描述車輛局部區(qū)域的若干維局部特征;
步驟1-3、將所得的全局特征和/或局部特征量化,并存儲(chǔ),生成虛擬號(hào)牌,構(gòu)建虛擬號(hào)牌庫(kù)。
優(yōu)選地,所述步驟2包括:
步驟2-1、基于視頻或圖像進(jìn)行目標(biāo)車輛檢測(cè),提取目標(biāo)車輛圖像;
步驟2-2、對(duì)目標(biāo)車輛圖像進(jìn)行特征提取,所述特征提取是基于深度學(xué)習(xí)所描述的圖像特征,所述圖像特征包括描述全車圖像的若干維全局特征,和/或描述車輛局部區(qū)域的若干維局部特征;
步驟2-3、將所得的目標(biāo)車輛的全局特征和/或局部特征量化,并存儲(chǔ),生成目標(biāo)車輛的虛擬號(hào)牌;
步驟2-4、將目標(biāo)車輛的虛擬號(hào)牌與虛擬號(hào)牌庫(kù)中的虛擬號(hào)牌逐一比對(duì),得到識(shí)別結(jié)果。
優(yōu)選地,步驟1-2或者步驟2-2中,所述深度學(xué)習(xí)包括采用快速區(qū)域深度卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測(cè)算法。
優(yōu)選地,步驟1-2或者步驟2-2中,不采用所述深度學(xué)習(xí)的方法,而是采用級(jí)聯(lián)特征目標(biāo)檢測(cè)方法。
優(yōu)選地,所述快速區(qū)域深度卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測(cè)算法包括在得到車輛的特寫圖之后,利用深度卷積方法,將所述特寫圖作為深度卷積神經(jīng)網(wǎng)絡(luò)的輸入,通過前饋神經(jīng)網(wǎng)絡(luò)計(jì)算得到車輛圖像的若干維全局特征,同時(shí)按照幾何位置關(guān)系確定局部區(qū)域,以此為基礎(chǔ)獲取相應(yīng)的若干維局部特征。
優(yōu)選地,所述步驟1-3包括將獲得的全局特征以及局部特征形成完整的特征向量并無損的存儲(chǔ)于特征庫(kù)中,以此構(gòu)建車輛的虛擬號(hào)牌庫(kù),或者根據(jù)大量樣本數(shù)據(jù)的訓(xùn)練,將特征按照訓(xùn)練閾值形成哈希碼,根據(jù)相應(yīng)的哈希表征算法形成二維碼,以此構(gòu)建車輛的虛擬號(hào)牌庫(kù)。
優(yōu)選地,所述步驟2-4包括采用分布式并行計(jì)算的方式,采用倒數(shù)比距離與余弦距離將目標(biāo)車輛的虛擬號(hào)牌和數(shù)據(jù)庫(kù)中的虛擬號(hào)牌進(jìn)行距離相似度匹配,從而進(jìn)行車輛比對(duì)分析。
優(yōu)選地,所述步驟2-4包括當(dāng)相似度高于一定閾值時(shí),判定識(shí)別成功,并輸出所匹配的虛擬號(hào)牌結(jié)果。
本發(fā)明的優(yōu)點(diǎn)在于:在基于圖像識(shí)別的基礎(chǔ)上,充分利用車輛的全局與局部特征,包括但不僅限于基于深度學(xué)習(xí)或級(jí)聯(lián)目標(biāo)描述的圖像特征。進(jìn)而生成虛擬號(hào)牌與比對(duì),綜合考慮了整體與局部信息,以此為基礎(chǔ),對(duì)于每一輛車來說,可以生成唯一的車輛虛擬號(hào)牌,從而不用車牌識(shí)別也能有效的查找檢索出目標(biāo)車輛,對(duì)于高速公路逃費(fèi)稽查、無牌車闖紅燈、肇事車輛快速查找等多種交通應(yīng)用有著積極意義。
附圖說明
通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
圖1示出了根據(jù)本發(fā)明實(shí)施例的一種基于虛擬號(hào)牌的無牌車輛識(shí)別方法流程圖;
圖2示出了根據(jù)本發(fā)明實(shí)施例的多層卷積神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)圖;
圖3示出了根據(jù)本發(fā)明實(shí)施例的改進(jìn)的多層卷積神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)圖。
圖4示出了根據(jù)本發(fā)明實(shí)施例的DPM+深度目標(biāo)檢測(cè)用于車輛識(shí)別的方法流程圖。
圖5示出了根據(jù)本發(fā)明實(shí)施例的深度識(shí)別神經(jīng)網(wǎng)絡(luò)框架圖。
具體實(shí)施方式
下面將參照附圖更詳細(xì)地描述本公開的示例性實(shí)施方式。雖然附圖中顯示了本公開的示例性實(shí)施方式,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開而不應(yīng)被這里闡述的實(shí)施方式所限制。相反,提供這些實(shí)施方式是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
根據(jù)本發(fā)明的實(shí)施例,公開了一種基于虛擬號(hào)牌的無牌車輛識(shí)別方法,所述方法包括如下步驟:
步驟1-1、基于視頻或圖像進(jìn)行車輛檢測(cè),提取車輛圖像;
步驟1-2、對(duì)車輛圖像進(jìn)行特征提取,所述特征提取是基于深度學(xué)習(xí)(例如:快速區(qū)域深度卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測(cè)算法)所描述的圖像特征,所述圖像特征包括描述全車圖像的若干維(例如4096維)全局特征,也可以包括描述車輛局部區(qū)域的若干維局部特征,比如車輛車窗、年檢標(biāo)、排氣柵格、掛墜等局部區(qū)域的若干維(例如4096維)局部特征;
步驟1-3、將所得的全局特征和/或局部特征量化,并存儲(chǔ),生成虛擬號(hào)牌,構(gòu)建虛擬號(hào)牌庫(kù);
步驟2-1、基于視頻或圖像進(jìn)行目標(biāo)車輛檢測(cè),提取目標(biāo)車輛圖像;
步驟2-2、對(duì)目標(biāo)車輛圖像進(jìn)行特征提取,所述特征提取是基于深度學(xué)習(xí)(例如:快速區(qū)域深度卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測(cè)算法)所描述的圖像特征,所述圖像特征包括描述全車圖像的若干維(例如4096維)全局特征,和/或描述車輛局部區(qū)域的若干維局部特征,比如車輛車窗、年檢標(biāo)、排氣柵格、掛墜等局部區(qū)域的若干維(例如4096維)局部特征;
步驟2-3、將所得的目標(biāo)車輛的全局特征和/或局部特征量化,并存儲(chǔ),生成目標(biāo)車輛的虛擬號(hào)牌;
步驟2-4、將目標(biāo)車輛的虛擬號(hào)牌與虛擬號(hào)牌庫(kù)中的虛擬號(hào)牌逐一比對(duì),得到識(shí)別結(jié)果。
根據(jù)本發(fā)明的實(shí)施例,車輛特寫圖屬于自然圖像,其圖像的一部分的統(tǒng)計(jì)特性與其他部分是一樣的,由此在一部分學(xué)習(xí)的特征也能用在另一部分上,所以對(duì)于這個(gè)圖像上的所有位置,可以使用同樣的學(xué)習(xí)特征。
優(yōu)選地,在步驟1-2中,快速區(qū)域深度卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)檢測(cè)算法包括在得到車輛的特寫圖之后,利用深度卷積方法,將所述特寫圖作為深度卷積神經(jīng)網(wǎng)絡(luò)的輸入,通過前饋神經(jīng)網(wǎng)絡(luò)計(jì)算得到車輛圖像的若干維全局特征,同時(shí)按照幾何位置關(guān)系確定局部區(qū)域,以此為基礎(chǔ)獲取相應(yīng)的若干維局部特征。具體地,基于卷積神經(jīng)網(wǎng)絡(luò)得到若干維全局特征或者若干維局部特征包括如下步驟:
對(duì)于所采集的車輛特寫圖,從車輛特寫全局圖像中(或者從車輛車窗、年檢標(biāo)、排氣柵格、掛墜等局部區(qū)域圖像中)隨機(jī)選取一小塊,例如3x3作為樣本,從這個(gè)小塊樣本中學(xué)習(xí)一些特征,可以把從這個(gè)3x3樣本中學(xué)習(xí)到的特征作為探測(cè)器,應(yīng)用到車輛特寫圖像的任意地方中去。優(yōu)選地,用從3x3樣本中所學(xué)習(xí)到的特征跟原本的車輛特寫圖(包括車輛特寫全局圖像或者車輛車窗、年檢標(biāo)、排氣柵格、掛墜等局部區(qū)域圖像)作卷積,從而對(duì)圖上的任一位置獲得一個(gè)不同特征的激活值。根據(jù)本發(fā)明的實(shí)施例,首先從一個(gè)96x96的車輛特寫圖像中學(xué)習(xí)到它的一個(gè)3x3的樣本所具有的特征,假設(shè)這是由有100個(gè)隱含單元的自編碼完成的。對(duì)96x96的圖像的每個(gè)3x3的小塊圖像區(qū)域都進(jìn)行卷積運(yùn)算,以得到卷積特征。也就是說,抽取3x3的小塊區(qū)域,并且從起始坐標(biāo)開始依次標(biāo)記為(1,1),(1,2),...,一直到(94,94),然后對(duì)抽取的區(qū)域逐個(gè)運(yùn)行訓(xùn)練過的稀疏自編碼來得到特征的激活值。在這個(gè)實(shí)施例中,可以得到100個(gè)集合,每個(gè)集合含有89x89個(gè)卷積特征。按照本發(fā)明實(shí)施例,卷積處理過程為:假設(shè)給定了r*c的車輛特寫圖像,將其定義為Xlarge。首先通過從車輛特寫圖像中抽取的a*b的小尺寸圖像樣本Xsmall訓(xùn)練稀疏自編碼,得到了k個(gè)特征(k為隱含層神經(jīng)元數(shù)量),然后對(duì)于Xlarge中的每個(gè)a*b大小的塊,求激活值fs,然后對(duì)這些fs進(jìn)行卷積。這樣得到(r-a+1)*(c-b+1)*k個(gè)卷積后的特征矩陣。
在通過卷積獲得了車輛特寫圖的特征之后,利用這些特征去做分類?,F(xiàn)有技術(shù)中使用的是把所有解析出來的特征關(guān)聯(lián)到一個(gè)分類器,例如softmax分類器,計(jì)算量非常大。例如:對(duì)于一個(gè)96X96像素的圖像,通過3x3個(gè)輸入學(xué)習(xí)得到了400個(gè)特征,而每一個(gè)卷積都會(huì)得到一個(gè)(96-3+1)*(96-3+1)=8836的結(jié)果集,由于已經(jīng)得到了400個(gè)特征,所以對(duì)于每個(gè)樣例結(jié)果集的大小就將達(dá)到百萬級(jí)的特征。而學(xué)習(xí)一個(gè)擁有超過百萬特征的輸入的分類器極易出現(xiàn)過度擬合的現(xiàn)象。為了解決這個(gè)問題并且描述大的圖像,在本發(fā)明的實(shí)施例中,對(duì)車輛特寫圖像的不同位置的特征進(jìn)行聚合統(tǒng)計(jì),優(yōu)選地,計(jì)算圖像一個(gè)區(qū)域上的某個(gè)特定特征的平均值(或最大值)。這些概要統(tǒng)計(jì)特征不僅具有低得多的維度(相比使用所有提取得到的特征),同時(shí)還會(huì)改善結(jié)果(不容易過度擬合)。將這些區(qū)域的平均(或最大)特征來最為改進(jìn)的卷積特征,用于做分類。
通常地,車輛特寫圖使用的是彩色圖,彩色圖有3個(gè)通道,對(duì)于每一個(gè)通道單獨(dú)進(jìn)行卷積和池化,隱藏層的每一個(gè)值是對(duì)應(yīng)到一幅圖的3個(gè)通道穿起來的,所以分3個(gè)通道進(jìn)行卷積之后要加起來,正好才能對(duì)應(yīng)到一個(gè)隱藏層的神經(jīng)元上,即對(duì)應(yīng)到一個(gè)特征。
進(jìn)一步地,在具體的實(shí)施方式中,使用多層卷積,然后再使用全連接層進(jìn)行訓(xùn)練,多層卷積的目的是一層卷積學(xué)到的特征往往是局部的,層數(shù)越高,學(xué)到的特征就越全局化。可以采用圖2所示的模型對(duì)車輛特寫圖進(jìn)行卷積。該模型采用了2-GPU并行結(jié)構(gòu),即第1、2、4、5卷積層都是將模型參數(shù)分為2部分進(jìn)行訓(xùn)練的。在這里,更進(jìn)一步,并行結(jié)構(gòu)分為數(shù)據(jù)并行與模型并行。數(shù)據(jù)并行是指在不同的GPU上,模型結(jié)構(gòu)相同,但將訓(xùn)練數(shù)據(jù)進(jìn)行切分,分別訓(xùn)練得到不同的模型,然后再將模型進(jìn)行融合。而模型并行則是,將若干層的模型參數(shù)進(jìn)行切分,不同的GPU上使用相同的數(shù)據(jù)進(jìn)行訓(xùn)練,得到的結(jié)果直接連接作為下一層的輸入。
圖2所示模型的基本參數(shù)為:
輸入:224×224大小的車輛特寫圖,3通道
第一層卷積:5×5大小的卷積核96個(gè),每個(gè)GPU上48個(gè)。
第一層max-pooling:2×2的核。
第二層卷積:3×3卷積核256個(gè),每個(gè)GPU上128個(gè)。
第二層max-pooling:2×2的核。
第三層卷積:與上一層是全連接,3*3的卷積核384個(gè)。分到兩個(gè)GPU上個(gè)192個(gè)。
第四層卷積:3×3的卷積核384個(gè),兩個(gè)GPU各192個(gè)。該層與上一層連接沒有經(jīng)過pooling層。
第五層卷積:3×3的卷積核256個(gè),兩個(gè)GPU上個(gè)128個(gè)。
第五層max-pooling:2×2的核。
第一層全連接:4096維,將第五層max-pooling的輸出連接成為一個(gè)一維向量,作為該層的輸入。
第二層全連接:4096維
Softmax層:輸出為1000,輸出的每一維都是車輛特寫圖屬于該類別的概率。
進(jìn)一步地,可以采用圖3的結(jié)構(gòu)對(duì)上述模型進(jìn)行改進(jìn)。在圖3中,在最后只有一層全連接層,然后就是softmax層了,其中,以該全連接層作為圖像的表示。在全連接層,以第四層卷積和第三層max-pooling的輸出作為全連接層的輸入,由此學(xué)習(xí)到車輛特寫圖局部的和全局的特征。
在步驟1-3中,將獲得的全局特征以及局部特征形成完整的特征向量并無損的存儲(chǔ)于特征庫(kù)中,以此構(gòu)建車輛的虛擬號(hào)牌庫(kù),或者根據(jù)大量樣本數(shù)據(jù)的訓(xùn)練,將特征按照訓(xùn)練閾值形成哈希碼,根據(jù)相應(yīng)的哈希表征算法形成二維碼,以此構(gòu)建車輛的虛擬號(hào)牌庫(kù)。
優(yōu)選地,該步驟中構(gòu)建車輛的虛擬號(hào)牌庫(kù)可以采用如下三種算法之一:
算法一的步驟為:
1.按照前述的卷積神經(jīng)網(wǎng)絡(luò)算法把圖片統(tǒng)一縮放到8*8,共64個(gè)像素的圖片。2.轉(zhuǎn)化為灰度圖:把縮放后的圖片轉(zhuǎn)化為256階的灰度圖。
灰度圖相關(guān)算法如下(R=red,G=green,B=blue):
1).浮點(diǎn)算法:Gray=R*0.3+G*0.59+B*0.11
2).整數(shù)方法:Gray=(R*30+G*59+B*11)/100
3).移位方法:Gray=(R*76+G*151+B*28)>>8;
4).平均值法:Gray=(R+G+B)/3;
5).僅取綠色:Gray=G;
3.計(jì)算平均值:計(jì)算進(jìn)行灰度處理后圖片的所有像素點(diǎn)的平均值。
4.比較像素灰度值:遍歷灰度圖片每一個(gè)像素,如果大于平均值記錄為1,否則為0。
5.得到信息指紋:組合64個(gè)bit位,順序隨意保持一致性。
6.采用距離比對(duì),距離越大則說明圖片越不一致,反之,距離越小則說明圖片越相似,當(dāng)距離為0時(shí),說明完全相同。
算法二的步驟為:
1.按照前述的卷積神經(jīng)網(wǎng)絡(luò)算法把圖片統(tǒng)一縮放到32*32的大小,方便DCT計(jì)算。
2.轉(zhuǎn)化為灰度圖:把縮放后的圖片轉(zhuǎn)化為256階的灰度圖。(具體算法見算法一的步驟)
3.計(jì)算DCT:DCT把圖片分離成分率的集合。
4.縮小DCT:DCT是32*32,保留左上角的8*8,這些代表的圖片的最低頻率。5.計(jì)算平均值:計(jì)算縮小DCT后的所有像素點(diǎn)的平均值。
6.進(jìn)一步減小DCT:大于平均值記錄為1,反之記錄為0。
7.得到信息指紋:組合64個(gè)信息位,順序隨意保持一致性即可。
8.采用距離比對(duì),距離越大則說明圖片越不一致,反之,距離越小則說明圖片越相似,當(dāng)距離為0時(shí),說明完全相同。
算法三的步驟為:
1.按照前述的卷積神經(jīng)網(wǎng)絡(luò)算法把圖片統(tǒng)一縮放到9*8的大小,共72個(gè)像素點(diǎn)。
2.轉(zhuǎn)化為灰度圖:把縮放后的圖片轉(zhuǎn)化為256階的灰度圖。(具體算法見算法一的步驟)
3.計(jì)算差異值:算法三是工作在相鄰像素之間,這樣每行9個(gè)像素之間產(chǎn)生了8個(gè)不同的差異,一共8行,則產(chǎn)生了64個(gè)差異值。
4.獲得指紋:如果左邊的像素比右邊的更亮,則記錄為1,否則為0。
5.得到信息指紋:組合64個(gè)信息位,順序隨意保持一致性即可。
6.采用距離比對(duì),距離越大則說明圖片越不一致,反之,距離越小則說明圖片越相似,當(dāng)距離為0時(shí),說明完全相同。
在步驟2-2中,采用與步驟1-2相類似的方法,基于卷積神經(jīng)網(wǎng)絡(luò)得到目標(biāo)車輛的若干維全局特征或者若干維局部特征。
在步驟2-3中,與步驟1-3類似地,將步驟2-2所得的目標(biāo)車輛的全局特征和/或局部特征量化,并存儲(chǔ),生成目標(biāo)車輛的虛擬號(hào)牌。
在步驟2-4中,采用分布式并行計(jì)算的方式,采用倒數(shù)比距離與余弦距離將目標(biāo)車輛的虛擬號(hào)牌和數(shù)據(jù)庫(kù)中的虛擬號(hào)牌進(jìn)行距離相似度匹配,從而進(jìn)行車輛比對(duì)分析,當(dāng)相似度高于一定閾值時(shí),判定識(shí)別成功,并輸出所匹配的虛擬號(hào)牌結(jié)果。
在具體的實(shí)施例中,采用距離相似度匹配進(jìn)行判斷是采用向量空間中兩個(gè)向量夾角的余弦值作為衡量?jī)蓚€(gè)個(gè)體間差異的大小的度量。向量是多維空間中有方向的線段,如果兩個(gè)向量的方向一致,即夾角接近零,那么這兩個(gè)向量就相近。而要確定兩個(gè)向量方向是否一致,這就要用到余弦定理計(jì)算向量的夾角。假定三角形的三條邊為a,b和c,對(duì)應(yīng)的三個(gè)角為A,B和C,那么角A的余弦為:
如果將三角形的兩邊b和c看成是兩個(gè)向量,則上述公式等價(jià)于:
其中分母表示兩個(gè)向量b和c的長(zhǎng)度,分子表示兩個(gè)向量的內(nèi)積。
在本發(fā)明的實(shí)施例中,步驟1-3得到的虛擬號(hào)牌庫(kù)中特征向量X和步驟2-3得到的目標(biāo)車輛虛擬號(hào)牌的特征向量Y分別是:
x1,x2,...,x6400和y1,y2,...,y6400
則,它們之間的余弦距離可以用它們之間夾角的余弦值來表示:
當(dāng)向量夾角余弦愈趨近于1時(shí),特征向量趨近于完全重復(fù)。當(dāng)向量夾角余弦高于一定閾值時(shí),判定識(shí)別成功,并輸出所匹配的虛擬號(hào)牌庫(kù)中的虛擬號(hào)牌結(jié)果。
在本發(fā)明的另一個(gè)優(yōu)選實(shí)施例中,步驟1-2或者步驟2-2中,不采用單一的深度學(xué)習(xí)的方法,而是采用級(jí)聯(lián)特征目標(biāo)檢測(cè)方法。具體地,采用DPM(形變部件模型)與深度目標(biāo)檢測(cè)相結(jié)合的方法,其中,DPM作為目標(biāo)檢測(cè)算法,該算法的步驟簡(jiǎn)要概括為:
1模版級(jí)聯(lián)形狀特征提?。?/p>
2全局圖像級(jí)聯(lián)形狀特征提??;
3基于快速滑窗匹配的SVM目標(biāo)檢測(cè)與位置擬合。
深度目標(biāo)檢測(cè)是通過利用深度學(xué)習(xí)良好的特征表達(dá)能力設(shè)計(jì)的一種級(jí)聯(lián)目標(biāo)檢測(cè)工作流程,其綜合衡量了硬件成本與運(yùn)算準(zhǔn)確率之間的關(guān)系,該算法的步驟簡(jiǎn)要概括為:
1圖像多分辨率金字塔構(gòu)建;
2分級(jí)深度前饋計(jì)算,獲取多層級(jí)特征圖;
3基于SOFTMAX快速滑窗匹配的目標(biāo)檢測(cè);
4多級(jí)投票機(jī)制的區(qū)域位置NMS擬合。
本發(fā)明的優(yōu)選實(shí)施例中,所采用的算法處理是將DPM和深度目標(biāo)檢測(cè)相結(jié)合。通常地,深度目標(biāo)檢測(cè)算法在目標(biāo)的檢測(cè)率中表現(xiàn)出優(yōu)異的性能,但是由于沒有考慮到物體內(nèi)在的幾何結(jié)構(gòu)關(guān)系,特別是對(duì)于車輛、自行車、行人等剛性結(jié)構(gòu)比較明確的物體,因此本發(fā)明將DPM算法中的彈簧形變模型引入到深度學(xué)習(xí)模型中。DPM+深度目標(biāo)檢測(cè)用于車輛識(shí)別的方法流程圖如圖4所示。
本發(fā)明的深度卷積網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示,該網(wǎng)絡(luò)充分利用了圖像的局部與全局信息特征,包含圖像的紋理、顏色、梯度等多種深度特征,自底向上從抽象到具體,真正實(shí)現(xiàn)了全方位準(zhǔn)確描述。在具體卷積操作時(shí),下一層的卷積操作不光是依賴上一層的卷積層,還依賴上幾層的卷積,這樣能夠充分的考慮區(qū)域一致性,正是這種近似冗余的描述使得算法的魯棒性很高。
本發(fā)明沒有采用現(xiàn)有技術(shù)中的百層甚至千層神經(jīng)網(wǎng)絡(luò),而是結(jié)合實(shí)際提出了特有的深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),該網(wǎng)絡(luò)結(jié)構(gòu)清晰簡(jiǎn)便,可操作性與可擴(kuò)展性非常高。
以上所述,僅為本發(fā)明較佳的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。