本發(fā)明涉及基于計算機(jī)模式識別技術(shù),尤其涉及一種基于壓縮感知域和卷積神經(jīng)網(wǎng)絡(luò)的路牌識別方法。
背景技術(shù):
在日常的交通行駛中,交通路牌起著很大的作用,正確地自動識別交通路牌具有潛在應(yīng)用價值。應(yīng)用傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)對路牌進(jìn)行識別時,首先要對路牌圖像進(jìn)行二值化,但是二值化的結(jié)果就忽略可顏色信息,而交通路牌中的黑黃紅藍(lán)白顏色各自代表了不同的意義。二值化后所得到的圖像有著很多的信息重疊部分,如果圖像自身攜帶“噪聲”,則在應(yīng)用傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)進(jìn)行識別的時候出現(xiàn)識別錯誤的可能性會大大增加。隨著全球衛(wèi)星導(dǎo)航系統(tǒng)的快速發(fā)展和廣泛應(yīng)用,車輛自動導(dǎo)航和無人駕駛逐漸成為一個研究和應(yīng)用熱點(diǎn),故路牌自動快速識別就成為一個亟待解決的問題。
深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。深度學(xué)習(xí)的概念由hinton等人于2006年提出?;谏疃戎眯啪W(wǎng)絡(luò)(dbn)提出非監(jiān)督貪心逐層訓(xùn)練算法,為解決深層結(jié)構(gòu)相關(guān)的優(yōu)化難題帶來希望,隨后提出多層自動編碼器深層結(jié)構(gòu)。此外hubel等人提出的卷積神經(jīng)網(wǎng)絡(luò)是第一個真正多層結(jié)構(gòu)學(xué)習(xí)算法,它利用空間相對關(guān)系減少參數(shù)數(shù)目以提高訓(xùn)練性能。
卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)中一種典型模型之一,是近年發(fā)展起來并引起廣泛重視的一種計算機(jī)模式識別方法。20世紀(jì)60年代,hubel和wiesel提出了卷積神經(jīng)網(wǎng)絡(luò)(convolutionalneuralnetworks,cnn)。cnn是為識別二維形狀而特殊設(shè)計的一個多層感知器,其網(wǎng)絡(luò)結(jié)構(gòu)對平移、比例縮放、傾斜或者共他形式的變形具有高度不變性?,F(xiàn)在,cnn已經(jīng)成為眾多科學(xué)領(lǐng)域的研究熱點(diǎn)之一,特別是在模式分類領(lǐng)域。由于cnn不需對圖像進(jìn)行復(fù)雜的前期預(yù)處理,可以直接輸入原始圖像,因此已成功應(yīng)用于路牌識別中。
原始圖片包含許多分類時不需要的特征信息,導(dǎo)致卷積神經(jīng)網(wǎng)絡(luò)的計算量非常大,運(yùn)行時間長。但是利用測量矩陣將原始圖像轉(zhuǎn)換到壓縮感知域,保留主要特征,從而減少計算量和運(yùn)行時間,提高路牌識別的魯棒性。
本發(fā)明提供了一種基于壓縮感知域和深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)的路牌識別方法,利用測量矩陣將圖像信號轉(zhuǎn)換到壓縮感知域,保留圖像中的主要特征,然后直接使用卷積神經(jīng)網(wǎng)絡(luò)從圖片的壓縮感知域中提取特征,對路牌進(jìn)行識別,提高了路牌識別的魯棒性。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是增強(qiáng)路牌識別的魯棒性,提高路牌識別的正確率。
為了解決上述技術(shù)問題,本發(fā)明提供了一種基于壓縮感知域和卷積神經(jīng)網(wǎng)絡(luò)的路牌識別方法,用于路牌識別上;該方法包括:
利用測量矩陣將圖像信號轉(zhuǎn)換到壓縮感知域;
將基于壓縮感知域的信號作為卷積神經(jīng)網(wǎng)絡(luò)的輸入;
使用卷積神經(jīng)網(wǎng)絡(luò)從中提取有效非線性特征;
通過分類器,對路牌圖像進(jìn)行識別。
其中,根據(jù)所述訓(xùn)練樣本獲得所述基于壓縮感知域的圖像信號,包括:
根據(jù)圖像信號的維數(shù)確定測量矩陣的大?。?/p>
利用測量矩陣將圖像信號轉(zhuǎn)換到壓縮感知域;
獲得基于壓縮感知域的圖像信號。
其中,根據(jù)所述訓(xùn)練樣本獲得卷積神經(jīng)網(wǎng)絡(luò)的輸入,包括:
將基于壓縮感知域圖像的尺寸調(diào)整為32×32;
并將其作為卷積神經(jīng)網(wǎng)絡(luò)的輸入。
其中,根據(jù)所述獲得有效的非線性特征,包括:
采用經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)模型,分別有兩層卷積層、兩層最大池化層,兩層全連接層;
網(wǎng)絡(luò)層1和3為卷基層,分別產(chǎn)生20和50張?zhí)卣鲌D;
網(wǎng)絡(luò)層2和4為最大池化層,也可稱為次抽樣層;
網(wǎng)絡(luò)層5和6位全連接層,分別產(chǎn)生維數(shù)為500×1和10×1的有效非線性特征向量。
其中,所述的分類器,包括:
定義分類器的參數(shù)及具體結(jié)構(gòu);
將特征向量輸入至分類器;
分類器輸出路牌的標(biāo)簽類別。
附圖說明
附圖用來提供對本發(fā)明技術(shù)方案的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本申請的實施例一起用于解釋本發(fā)明的技術(shù)方案,并不構(gòu)成對本發(fā)明技術(shù)方案的限制。
圖1為本申請實施例的基于壓縮感知域和卷積神經(jīng)網(wǎng)絡(luò)的路牌識別方法的流程示意圖。
圖2為本申請實施例中獲得壓縮后圖像信號的流程示意圖。
圖3為本申請實施例獲得卷積神經(jīng)網(wǎng)絡(luò)的輸入的流程示意圖。
圖4為本申請實施例獲得有效的非線性特征流程示意圖。
圖5為卷積神經(jīng)網(wǎng)絡(luò)lenet-5的結(jié)構(gòu)示意圖。
圖6為本申請實施例述及的softmax分類器流程示意圖。
具體實施方式
以下將結(jié)合附圖及實施例來詳細(xì)說明本發(fā)明的實施方式,借此對本發(fā)明如何應(yīng)用技術(shù)手段來解決技術(shù)問題,并達(dá)成技術(shù)效果的實現(xiàn)過程能充分理解并據(jù)以實施。
本申請實施例的基于壓縮感知域和卷積神經(jīng)網(wǎng)絡(luò)的路牌識別方法,用于路牌的識別。本申請實施例所述的路牌識別,主要是指運(yùn)用壓縮感知域和卷積神經(jīng)網(wǎng)絡(luò)。
本申請的實施例可以利用卷積神經(jīng)網(wǎng)絡(luò)直接從壓縮感知域中提取有效的非線性他正,通過softmax作為分類器,對gtsrb數(shù)據(jù)集中的路牌圖片進(jìn)行識別。
如圖1所示,本申請實施例的基于壓縮感知域和卷積神經(jīng)網(wǎng)絡(luò)的路牌識別方法,主要包括如下步驟:
步驟s110,利用測量矩陣將圖像信號轉(zhuǎn)換到壓縮感知域;
步驟s120,將基于壓縮感知域的信號作為卷積神經(jīng)網(wǎng)絡(luò)的輸入;
步驟s130,使用卷積神經(jīng)網(wǎng)絡(luò)從中提取有效非線性特征;
步驟s140,通過分類器,對路牌圖像進(jìn)行識別。
本申請實施例中,根據(jù)所述獲得壓縮后的圖像信號。圖2表示出了提取所述基于壓縮感知域的圖像信號的主要步驟。
步驟s210,根據(jù)圖像信號的維數(shù)確定測量矩陣的大小;
測量矩陣采用高斯矩陣。
隨機(jī)高斯測量矩陣是壓縮感知中最常用的測量矩陣,該矩陣中的元素服從均值為0,方差為
高斯隨機(jī)測量矩陣的優(yōu)點(diǎn)在于它幾乎和任意稀疏矩陣不想關(guān),且滿足受限等距性,同時它需要的測量值數(shù)目比較少,對于長度為n,稀疏度為k的原始數(shù)據(jù),僅需要m≥cklog(n/k)個測量值就可以高概率的恢復(fù)重構(gòu)出原始數(shù)據(jù),其中c是一個非常小的量。
由于路牌圖像大小不一,則測量矩陣的大小也不同。
步驟s220,利用測量矩陣將圖像轉(zhuǎn)換到壓縮感知域;
利用測量矩陣將圖像轉(zhuǎn)換到壓縮感知域,減小圖像的數(shù)據(jù)量,保留主要特征,同時獲得大小統(tǒng)一的圖像信號。
步驟s230,獲得基于壓縮感知域的圖像信號。
本申請實施例中,根據(jù)所述獲得卷積神經(jīng)網(wǎng)絡(luò)的輸入。圖3示出了獲得卷積神經(jīng)網(wǎng)絡(luò)的輸入的主要步驟。
步驟s310,將壓縮后圖像的尺寸調(diào)整為32×32;
因為卷積神經(jīng)網(wǎng)絡(luò)的輸入圖像大小是固定的,所以將壓縮后的圖像信號統(tǒng)一調(diào)整為32×32。
步驟s320,將調(diào)整后的圖像作為卷積神經(jīng)網(wǎng)絡(luò)的輸入。
本申請實施例中,根據(jù)所述獲得有效的非線性特征。圖4示出了獲得有效的非線性特征的主要步驟。
步驟s410,采用經(jīng)典的lenet-5卷積神經(jīng)網(wǎng)絡(luò)模型,分別有兩層卷積層、兩層最大池化層,兩層全連接層。
lenet-5是一種卷積神經(jīng)網(wǎng)絡(luò),最初用于手寫數(shù)字識別中。卷積神經(jīng)網(wǎng)絡(luò)lenet-5的結(jié)構(gòu)如圖5所示,輸入圖像要經(jīng)過大小歸一化,每一個神經(jīng)元的輸入來自于前一層的一個局部鄰域,并被加上由一組權(quán)值決定的權(quán)重。提取的這些特征在下一層結(jié)合形成更高一級的特征。同一特征圖的神經(jīng)元共享相同的一組權(quán)值,次抽樣層對上一層進(jìn)行平均。
步驟s420,網(wǎng)絡(luò)層1和3為卷積層,分別產(chǎn)生20和50張?zhí)卣鲌D。
網(wǎng)絡(luò)層1是由6個特征圖組成的卷積層。每個神經(jīng)元與輸入圖像的一個5×5的鄰域相連接,因此每個特征圖的大小是28×28。
網(wǎng)絡(luò)層3是由16個大小為10×10的特征圖組成的卷積層。特征圖的每個神經(jīng)元與s2網(wǎng)絡(luò)層的若干個特征圖的5×5的鄰域連接。
步驟s430,網(wǎng)絡(luò)層2和4為最大池化層,也可稱為次抽樣層。
網(wǎng)絡(luò)層2是由6個大小為14×14的特征圖組成的次抽樣層,它是由網(wǎng)絡(luò)層1抽樣得到。特征圖的每個神經(jīng)元與c1層的一個大小為2×2的鄰域連接。
網(wǎng)絡(luò)層4是由16個大小為5×5的特征圖組成的次抽樣層。特征圖的每個神經(jīng)元與c3層的一個2×2大小的鄰域相連接。
步驟s440,網(wǎng)絡(luò)層5和6為全連接層,分別產(chǎn)生維數(shù)為500×1和10×1的有效非線性特征向量。
網(wǎng)絡(luò)層5是卷積層,總共120個featuremap,每個featuremap與s4層所有的featuremap相連接,卷積核大小是5*5。c5的featuremap變成了1個點(diǎn),共計有120(25*16+1)=48120個參數(shù)。
網(wǎng)絡(luò)層6,包括84個神經(jīng)元,與網(wǎng)絡(luò)層c5進(jìn)行全連接。
本申請實施例中,根據(jù)所述構(gòu)成softmax分類器。圖6為本申請實施例述及的softmax分類器示意圖。
步驟s610,定義softmax分類器的參數(shù)及具體結(jié)構(gòu)。
步驟s620,將特征向量輸入至分類器。
步驟s630,分類器輸出路牌的標(biāo)簽類別。
本申請實施例提出了一種基于壓縮感知域和深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)的路牌識別方法,直接使用卷積神經(jīng)網(wǎng)絡(luò)從圖片的壓縮感知域中提取特征,對路牌進(jìn)行識別,提高了路牌識別的精確度。該方法包括:利用測量矩陣將圖像信號轉(zhuǎn)換到壓縮感知域,并將其作為卷積神經(jīng)網(wǎng)絡(luò)的輸入,然后直接使用卷積神經(jīng)網(wǎng)絡(luò)從中提取有效的非線性特征,對路牌圖像進(jìn)行識別,提高了路牌識別的魯棒性。