一種融合類別屬性的深度網(wǎng)絡(luò)地下目標(biāo)識別方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及探地雷達技術(shù)領(lǐng)域,特別是一種融合類別屬性的深度網(wǎng)絡(luò)地下目標(biāo)識 別方法及系統(tǒng)。
【背景技術(shù)】
[0002] 探地雷達(ground penetrating radar,GPR)是20世紀(jì)80年代新興起的一種利用 電磁波反射原理,來探測地下目標(biāo)物以及地質(zhì)結(jié)構(gòu)與分布的淺地層無損探測技術(shù)。它根據(jù) 電磁波在介質(zhì)中傳播時,其傳播路徑、強度、波形隨介質(zhì)的電磁性質(zhì)和幾何結(jié)構(gòu)而發(fā)生變化 的性質(zhì),推斷介質(zhì)的結(jié)構(gòu)和目標(biāo)的位置、形狀等,已經(jīng)成為淺層地下探測的有效手段。由于 地下物質(zhì)成分的多樣和復(fù)雜,介質(zhì)損耗造成電磁波在有損耗介質(zhì)中傳播發(fā)生較大衰減;構(gòu) 成大地物質(zhì)的物理成份、密度、濕度等參數(shù)因地質(zhì)環(huán)境的不同而差異很大,以及地上地下各 種雜波干擾等諸多因素,造成探地雷達系統(tǒng)在數(shù)據(jù)處理、數(shù)據(jù)分析與解譯上的困難。
[0003] 探地雷達地下目標(biāo)識別主要包括目標(biāo)特征提取和識別,目標(biāo)特征提取與選擇己經(jīng) 有較成熟的方法。由于地下環(huán)境復(fù)雜,目標(biāo)體形狀各異,難以得到完備的樣本集,這使得地 下目標(biāo)識別方法研究方面仍面臨許多技術(shù)上的難點,導(dǎo)致GPR在實際應(yīng)用中難以達到預(yù)期 的性能。
[0004] 目前,常用的地下目標(biāo)識別方法主要有以下幾類:基于時域參數(shù)的識別方法,基于 統(tǒng)計學(xué)的識別方法和神經(jīng)網(wǎng)絡(luò)識別方法。
[0005] (1)采用時域參數(shù)進行識別。時域特征參數(shù),能在一定程度上反映著信號的形狀及 位置信息,但對于復(fù)雜地質(zhì)環(huán)境中的目標(biāo)信號,直接在時域上識別正確率較低。
[0006] (2)統(tǒng)計學(xué)識別方法主要是基于隱馬爾可夫模型HMM(Hidden Markov Model)的檢 測方法,以及HMM與神經(jīng)網(wǎng)絡(luò)結(jié)合的方法。這一類方法都以回波信號中雙曲線目標(biāo)的形狀特 征為基礎(chǔ),并未涉及地下目標(biāo)回波信號中豐富的時頻聯(lián)合信息,識別的精度有待于提高。
[0007] (3)神經(jīng)網(wǎng)絡(luò)識別方法,比較常用的有BP網(wǎng)絡(luò)(Back Propagation)、RBF網(wǎng)絡(luò) (Radical Bas is Function)、支撐向量機SVM(Support Vector Machine)和小波網(wǎng)絡(luò)WNN (Wavelet Neural Network)等。
[0008] BP神經(jīng)網(wǎng)絡(luò)具有一般神經(jīng)網(wǎng)絡(luò)的優(yōu)點,如學(xué)習(xí)規(guī)則簡單,較強的非線性映射能力 和容錯能力等。BP神經(jīng)網(wǎng)絡(luò)的缺點在于隨著網(wǎng)絡(luò)層數(shù)的增加,模型訓(xùn)練易陷入局部極值以 及算法的收斂速度慢,從而降低特征提取分類的效果和效率。
[0009] 與BP網(wǎng)絡(luò)相比,RBF網(wǎng)絡(luò)具有唯一最佳逼近的特性,且無局部極小問題存在;具有 較強的輸入和輸出映射功能;網(wǎng)絡(luò)連接權(quán)值與輸出呈線性關(guān)系;學(xué)習(xí)過程收斂速度快;具有 很強的聚類分析能力。RBF網(wǎng)絡(luò)的不足:它不能解釋本身的推理過程和推理依據(jù);不能向用 戶提出必要的詢問,而且當(dāng)數(shù)據(jù)不充分的時候,神經(jīng)網(wǎng)絡(luò)就無法進行工作;它把一切問題的 特征都變?yōu)閿?shù)字,把一切推理都變?yōu)閿?shù)值計算,易導(dǎo)致信息丟失。
[0010] SVM是一種以統(tǒng)計學(xué)理論為基礎(chǔ)的,以結(jié)構(gòu)風(fēng)險最小化的學(xué)習(xí)機學(xué)習(xí)方法,在解決 小樣本、非線性及高維模式識別問題中表現(xiàn)出特有的優(yōu)勢。從理論上說,SVM算法得到的將 是全局最優(yōu)解,解決了 BP網(wǎng)絡(luò)中無法避免的局部極值問題。SVM方法的兩個不足:對大規(guī)模 訓(xùn)練樣本難以實施,用于解決多分類問題存在困難。
[0011 ] 小波神經(jīng)網(wǎng)絡(luò)WNN(Wavelet Neural Network)是由大量非線性處理單元廣泛互連 而成的網(wǎng)絡(luò),具有逼近能力強、收劍速度快、網(wǎng)絡(luò)結(jié)構(gòu)明確、網(wǎng)絡(luò)參數(shù)(隱層結(jié)點數(shù)和權(quán)重) 的選取有理論依據(jù)、有效避免了局部最小值等優(yōu)點,并且能大規(guī)模并行處理、分布式信息存 儲,具有較強的函數(shù)學(xué)習(xí)能力和容錯能力。相比多層感知器MLP (mul t i-lay er perc印tron)網(wǎng)絡(luò)和RBF網(wǎng)絡(luò),小波神經(jīng)網(wǎng)絡(luò)的構(gòu)造比較復(fù)雜,其運算復(fù)雜度增加;在多維輸 入的情況下,隨著網(wǎng)絡(luò)的輸入維數(shù)的增加,網(wǎng)絡(luò)所需訓(xùn)練樣本呈指數(shù)增長,網(wǎng)絡(luò)結(jié)果也將隨 之變得龐大,導(dǎo)致收斂速度下降;隱含層結(jié)點數(shù)確定困難;無法根據(jù)實際情況自適應(yīng)選擇合 適的小波基函數(shù)。
[0012] 淺層學(xué)習(xí) (shal low learning)雖然理論模型簡單,但對復(fù)雜函數(shù)的表示能力弱, 并且淺層模型提取出來的淺層特征對復(fù)雜問題分類的效率不高。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)通過 增加隱含層的結(jié)點個數(shù),在一定程度上能夠克服淺層網(wǎng)絡(luò)的特征學(xué)習(xí)能力不足的缺點,但 是傳統(tǒng)神經(jīng)網(wǎng)絡(luò)反向傳播算法參數(shù)隨機初始化,收斂速度慢,而且在參數(shù)初始化不當(dāng)?shù)那?況下會引起網(wǎng)絡(luò)學(xué)習(xí)局部收斂,嚴重過擬合。
[0013] 為解決傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)隨機初始化網(wǎng)絡(luò)中的權(quán)值,容易導(dǎo)致網(wǎng)絡(luò)收斂到局部最小 值問題,2006年,Hinton G和他的團隊提出了一種深度置信網(wǎng)絡(luò)(deep belief network, DBN),提出多隱層的人工神經(jīng)網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習(xí)能力,可以學(xué)習(xí)得到更深刻更本質(zhì) 的特征,從而更有利于可視化或分類;深度神經(jīng)網(wǎng)絡(luò)可以通過"逐層初始化"(layer-wise pre-training)的方法克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速度慢的缺點。逐層初始化是通過無監(jiān)督學(xué) 習(xí)實現(xiàn)的。深度學(xué)習(xí)的本質(zhì)是通過構(gòu)建含有多個隱層的機器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù), 來學(xué)習(xí)和得到大量更具代表性的特征信息,從而提高分類和預(yù)測的準(zhǔn)確性。此后,多種深度 學(xué)習(xí)模型被陸續(xù)提出,并在各個領(lǐng)域得到應(yīng)用。
[0014] 深度學(xué)習(xí)與淺層學(xué)習(xí)的本質(zhì)區(qū)別是網(wǎng)絡(luò)層次和訓(xùn)練方式不同。淺層學(xué)習(xí)一般只含 有一個隱含層,而深度學(xué)習(xí)往往含有多個隱含層,可以將復(fù)雜的問題分層次研究和表達,層 次之間非線性,對于復(fù)雜函數(shù)表達能力強;但網(wǎng)絡(luò)層次過多會使得訓(xùn)練時間變長,而且訓(xùn)練 層次的增多也并不能確保算法精度得到提升。為此,深度學(xué)習(xí)引進了新的訓(xùn)練方法一一即 "分層訓(xùn)練",以提高學(xué)習(xí)效率和分類效果。
[0015] 研究表明,目標(biāo)識別與分類性能與訓(xùn)練樣本的數(shù)量、算法迭代次數(shù)有密切關(guān)系。當(dāng) 運用大量(如5萬個以上)訓(xùn)練樣本進行訓(xùn)練時,隨著迭代次數(shù)的增加,識別率從88.59%上 升到97.27%。當(dāng)降低訓(xùn)練樣本數(shù)量時,算法對測試樣本的識別率會急速下降,尤其當(dāng)訓(xùn)練 所使用的樣本不足2萬個時,識別率僅為59.21 %,識別效果下降明顯。這對于GPR目標(biāo)數(shù)據(jù) 的分析與識別是不能滿足需要的。因此,需要提出一種當(dāng)樣本量不足或訓(xùn)練迭代次數(shù)不多 時可有效地提高GPR目標(biāo)的識別率的識別方法。
【發(fā)明內(nèi)容】
[0016] 本發(fā)明提供一種融合類別屬性的深度網(wǎng)絡(luò)地下目標(biāo)識別方法及系統(tǒng),以解決現(xiàn)有 的技術(shù)問題,當(dāng)樣本量不足或訓(xùn)練迭代次數(shù)不多時可有效地提高GPR目標(biāo)的識別率。
[0017] -方面,本發(fā)明實施例提供一種融合類別屬性的深度網(wǎng)絡(luò)地下目標(biāo)識別方法,包 括以下步驟:
[0018] 對接收到的多個地下目標(biāo)物返回的探地雷達回波信號進行預(yù)處理,提取分別表征 所述多個目標(biāo)物的多個目標(biāo)信號;
[0019] 根據(jù)所述多個目標(biāo)信號建立樣本數(shù)據(jù)集,所述樣本數(shù)據(jù)集包括所述多個目標(biāo)信號 和目標(biāo)信號所屬的多個類別信息;
[0020] 深度網(wǎng)絡(luò)分類器對所述樣本數(shù)據(jù)集內(nèi)的數(shù)據(jù)進行深度網(wǎng)絡(luò)訓(xùn)練迭代計算,尋找使 得所述樣本數(shù)據(jù)集的代價函數(shù)值最小的參數(shù);
[0021] 在所述深度網(wǎng)絡(luò)訓(xùn)練迭代計算過程中,利用softmax回歸方式進行分類識別以確 定所述多個目標(biāo)物。
[0022] 所述對接收到的多個地下目標(biāo)物返回的探地雷達回波信號進行預(yù)處理,具體包 括:
[0023]對多個所述GPR回波信號分別進行背景噪聲去除、濾波處理、道間信號能量均衡、 子波相干加強和深部弱信號增強處理。
[0024]在一個實施例中,設(shè)接收到的所述探地雷達回波信號即GPR回波信號共有m個,根 據(jù)所述多個目標(biāo)信號建立數(shù)據(jù)樣本集,具體為:
[0025]從所述m個GPR回波信號中提取目標(biāo)信號A-scan數(shù)據(jù)組合成目標(biāo)信號矩陣X=[x (1)],其中,x(1)(i = l,2,···,m)表示第i個A-scan樣本數(shù)據(jù),每個A-scan數(shù)據(jù)為矩陣X中的一 列,對應(yīng)的樣本類別矩陣為& (1)}4 = 1,2,一,!11,7(1)是樣本數(shù)據(jù)^1)對應(yīng)的類別信息標(biāo)簽, 111 個樣本數(shù)據(jù)構(gòu)成的樣本數(shù)據(jù)集為{(X(1),y(1)),…,(X (m),y(m))},其分別屬于k個類別。
[0026] 在一個實施例中,進一步的,深度網(wǎng)絡(luò)分類器對所述樣本數(shù)據(jù)集內(nèi)的數(shù)據(jù)進行深 度網(wǎng)絡(luò)訓(xùn)練迭代計算,尋找使得所述樣本數(shù)據(jù)集的代價函數(shù)值最小的參數(shù),具體為:
[0027] A、把Χ=[Χ(1)](? = 1,2,···,π〇作為深層稀疏編碼模型的輸入數(shù)據(jù),通過下式計算 所述深度網(wǎng)絡(luò)的第i隱層的狀態(tài):
[0028]
[0029] 其中,W為各隱層之間的連接參數(shù),即權(quán)值向量,b為偏置項;
[0030] B、通過BP算法計算得到使所述樣本數(shù)據(jù)集的代價函數(shù)值最小的全局最優(yōu)權(quán)值向 量W,b,其中所述樣本數(shù)據(jù)集的代價函數(shù)J (W,b)為:
[0031]
[0032] 其中,m,si分別表示深度網(wǎng)絡(luò)層數(shù)和1層單元數(shù),|y^.)為稀疏性約束項;
[0