一種基于多層神經(jīng)網(wǎng)絡(luò)的超光譜圖像分割方法
【專利摘要】本發(fā)明公開了一種基于多層神經(jīng)網(wǎng)絡(luò)的超光譜圖像分割方法,步驟如下:1)非監(jiān)督學(xué)習(xí)過程;2)監(jiān)督學(xué)習(xí)過程;3)反向傳播調(diào)整參數(shù);4)對(duì)輸出數(shù)據(jù)降維;5)把降維后的數(shù)據(jù)做超像素分割。本發(fā)明提出的方案基于機(jī)器自學(xué)習(xí)的思想,使得到的特征比人為設(shè)計(jì)特征更加精確,有更好的魯棒性,適用于各種場(chǎng)景的圖像中。該學(xué)習(xí)只涉及到參數(shù)的調(diào)節(jié),計(jì)算效率高,分割的效果更好。
【專利說明】一種基于多層神經(jīng)網(wǎng)絡(luò)的超光譜圖像分割方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域,更具體地說,涉及一種基于多層神經(jīng)網(wǎng) 絡(luò)的超光譜圖像分割方法。
【背景技術(shù)】
[0002] 目前超光譜圖像在許多領(lǐng)域得到了廣泛的應(yīng)用,而超光譜圖像分割是從超光譜圖 像上提取有用的信息的重要途徑之一,因此對(duì)超光譜圖像的分類識(shí)別進(jìn)行研究具有重要的 理論與實(shí)際意義。
[0003] 人的眼睛只能接收可見光,而超光譜是把光譜范圍擴(kuò)展到可見光之外的范圍。在 圖像上來說就是普通的彩色圖像只有三個(gè)波段,即紅、綠、藍(lán)三個(gè)可見波段成像的疊加,可 以表示為一個(gè)m*n*3的矩陣,m*n為圖像的尺寸,而超光譜圖像則是很多波段數(shù)據(jù)的集合, 包括不可見的波段,可以表示為:m*n*L,L是波段數(shù)。不同的波段可以探測(cè)物體,因此超光 譜圖像可以用來確認(rèn)被識(shí)別物體的組成成分等。但是處理超光譜圖像時(shí),由于數(shù)據(jù)量過大, 許多現(xiàn)有的一些技術(shù)無法直接應(yīng)用。超光譜圖像分割的重點(diǎn)在于光譜特征提取在傳統(tǒng)的可 見光圖像的特征提取中,梯度特征與點(diǎn)特征是兩大類常見的特征。梯度特征比如Canny算 子,Laplace-Gaussian算子和方向梯度直方圖H0G等。對(duì)于前兩種算子,能夠比較好的檢 測(cè)出圖像中所有邊緣處的點(diǎn),但是這兩種方法很可能將圖像分割成幾個(gè)不連通的區(qū)域塊, 而H0G的缺點(diǎn)是維數(shù)高,計(jì)算開銷大。而常見的點(diǎn)特征如角點(diǎn)、圓點(diǎn)等,雖然維度不高,但是 在背景比較凌亂的情況下難以達(dá)到滿意的效果,造成了檢測(cè)準(zhǔn)確率低的問題。因此,傳統(tǒng)的 特征提取方法不是一個(gè)好的解決方案。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的在于提供一種基于多層神經(jīng)網(wǎng)絡(luò)的超光譜圖像分割方法,用多層神 經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的特征代替人為設(shè)計(jì)的特征,把得到的特征降維,然后再用超像素進(jìn)行分割。
[0005] 實(shí)現(xiàn)本發(fā)明目的的技術(shù)方案為:多層神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示。它包含輸入層, 多個(gè)隱層和一個(gè)輸出層,相鄰層節(jié)點(diǎn)之間完全連接,輸入層的節(jié)點(diǎn)數(shù)等于超光譜圖像的維 數(shù)。該方法包括訓(xùn)練和圖像分割兩個(gè)過程。
[0006] 下列步驟用到的字符說明:輸入數(shù)據(jù)集X = {(Xp 1)} k e Rn,h e L,i = 1, 2,...,N},其中N是訓(xùn)練樣本的數(shù)目,對(duì)于超光譜圖像中的每一個(gè)像素 Xi e Rn(n為超光譜 圖像中一個(gè)像素所含有的光譜帶數(shù))。^是對(duì)應(yīng)的Xi的類別標(biāo)簽。將多層神經(jīng)網(wǎng)絡(luò)中每一 層的輸入記為X,每一層的輸出記為太。
[0007] 訓(xùn)練過程包括以下步驟:
[0008] 1)非監(jiān)督學(xué)習(xí)過程;
[0009] 2)監(jiān)督學(xué)習(xí)過程;
[0010] 3)反向傳播調(diào)整參數(shù);
[0011] 圖像分割:
[0012] 4)對(duì)輸出數(shù)據(jù)降維;
[0013] 5)把降維后的數(shù)據(jù)做超像素分割。
[0014] 上述方法中,所述步驟1)包括以下具體步驟:
[0015] 11)構(gòu)造自動(dòng)編碼器;
[0016] 12)構(gòu)造降噪自動(dòng)編碼器;
[0017] 13)構(gòu)造多層降噪自動(dòng)編碼器。
[0018] 上述方法中,所述步驟11)包括以下具體步驟:
[0019] 111)編碼部分:
[0020] 編碼部分就是將本層的輸入X做一個(gè)非線性映射,映射函數(shù):
[0021] y' = f g (x) = s (ffx+b) (1)
[0022] 其中,
【權(quán)利要求】
1. 一種基于多層神經(jīng)網(wǎng)絡(luò)的超光譜圖像分割方法,其特征在于步驟如下: 1) 非監(jiān)督學(xué)習(xí)過程; 2) 監(jiān)督學(xué)習(xí)過程; 3) 反向傳播調(diào)整參數(shù); 4) 對(duì)輸出數(shù)據(jù)降維; 5) 把降維后的數(shù)據(jù)做超像素分割。
2. 根據(jù)權(quán)利要求1所述的基于多層神經(jīng)網(wǎng)絡(luò)的超光譜圖像分割方法,其特征在于所述 步驟1)包括以下具體步驟: 11) 構(gòu)造自動(dòng)編碼器; 12) 構(gòu)造降噪自動(dòng)編碼器,在數(shù)據(jù)輸入到自動(dòng)編碼器之前,先將輸入數(shù)據(jù)X,用函數(shù) de( ·)加入噪聲,即隨機(jī)將X中r%的值置為0 ; 13) 構(gòu)造多層降噪自動(dòng)編碼器,將各層全連接得到多層降噪自動(dòng)編碼器,首先訓(xùn)練輸入 層與第一層的參數(shù),此時(shí)隨機(jī)將輸入數(shù)據(jù)中的30%的值置為0,然后訓(xùn)練第一層與第二層 的參數(shù),此時(shí)隨機(jī)將第一層輸出中的20%的值置為0,最后訓(xùn)練第二層與第三層的參數(shù),隨 機(jī)將第二層輸出中的10 %的值置為0。
3. 根據(jù)權(quán)利要求2所述的基于多層神經(jīng)網(wǎng)絡(luò)的超光譜圖像分割方法,其特征在于:所 述步驟11)包括以下具體步驟: 111) 編碼部分:將本層的輸入X做一個(gè)非線性映射,映射函數(shù):y /= f θ (X)= s(Wx+b),其中,
其中θ = (w,b)是編碼也就是映射到輸出空間的參數(shù); 112) 譯碼部分:將本層的輸出y'再映射回輸入空間,也就是重構(gòu)過程,映射函數(shù):z = ge, (y' )=S(W' x+b'),其中θ' =〇T,b')為譯碼部分也就是重構(gòu)過程的參數(shù); 113) 構(gòu)造目標(biāo)函數(shù):
該目標(biāo)函數(shù)是最小化重 構(gòu)得到的Z與輸入數(shù)據(jù)X的二范式; 114) 優(yōu)化過程:用隨機(jī)梯度下降優(yōu)化,迭代更新,更新過程如下式所示:
WgracP W grad? ^ grad 的表達(dá)式如下:
其中,s,ω = S(x)(l-S(x)),α是學(xué)習(xí)速率,這里取值〇. 001。
4. 根據(jù)權(quán)利要求1所述的基于多層神經(jīng)網(wǎng)絡(luò)的超光譜圖像分割方法,其特征在于所述 步驟2)包括以下具體步驟: 21) 構(gòu)造目標(biāo)函數(shù):
其中,k是類別數(shù),表示類別 為d時(shí)的概率值,Wd和bd表示類別為d時(shí)的參數(shù); 22) 構(gòu)造損失函數(shù):
23) 優(yōu)化過程:用隨機(jī)梯度下降優(yōu)化,迭代更新,更新過程如下式所 示:
其中,α是學(xué)習(xí)速率,這里取值〇. 1,并且
每次只更新一個(gè)類別的參數(shù),全部訓(xùn)練完成后會(huì) 得到所有類別的參數(shù)。
5. 根據(jù)權(quán)利要求1所述的基于多層神經(jīng)網(wǎng)絡(luò)的超光譜圖像分割方法,其特征在于所述 步驟3)包括以下具體步驟: 31) 把圖像中的每個(gè)像素 X輸入到步驟2)中訓(xùn)練好的模型,計(jì)算這個(gè)神經(jīng)網(wǎng)絡(luò)每個(gè)單 元u的輸入ou ; 32) 對(duì)這個(gè)神經(jīng)網(wǎng)絡(luò)的每個(gè)輸出單元u,計(jì)算誤差eu:eu = 〇u(l-〇u)(y' -〇u),其中, /是邏輯回歸的目標(biāo)輸出值; 33) 對(duì)于這個(gè)神經(jīng)網(wǎng)絡(luò)隱層中的每個(gè)單元h,計(jì)算誤差項(xiàng)ε h : ε h = 〇h(l-〇h)*2 u E outputs胃8 u ; 34) 用梯度下降法更新每個(gè)網(wǎng)絡(luò)權(quán)值Wi :
其中,Wi表示本層的第i的權(quán)值,Xi表示本層的第i個(gè)輸入值,η 是學(xué)習(xí)速率,取值〇. 1。
6. 根據(jù)權(quán)利要求1所述的基于多層神經(jīng)網(wǎng)絡(luò)的超光譜圖像分割方法,其特征在于所述 步驟4)中采用傳統(tǒng)的主成份分析PCA或者多維標(biāo)度法MDS方法降維,把得到的數(shù)據(jù)降到3 維。
7. 根據(jù)權(quán)利要求1所述的基于多層神經(jīng)網(wǎng)絡(luò)的超光譜圖像分割方法,其特征在于所述 步驟5)包括以下具體步驟: 51)初始化聚類中心:均勻的分配k個(gè)聚類中心Ck = [ak,bk,ck,xk,yk] T,其中,ak,bk, ck表示使用主成分分析PCA降維后得到的三維特征,xk,yk是像素的坐標(biāo);相鄰距離為S個(gè) 像素,
N是圖像像素的個(gè)數(shù); 52) 在每個(gè)聚類中心的3x3鄰域內(nèi)計(jì)算梯度,并把聚類中心移動(dòng)到梯度最小的位置; 53) 對(duì)每個(gè)像素i初始化類標(biāo)簽1 (i) = -1,距離d (i)=…; 54) 在每個(gè)聚類中心Ck的2Sx2S區(qū)域內(nèi),計(jì)算Ck與該區(qū)域內(nèi)每個(gè)像素的距 離D :特征距離:
,像素間距離:
總的距離:
其中m,S 是一固定值,用于歸一化距離,如果D < d⑴則d(i) = D,l(i) = K; 55) 迭代更新聚類中心與殘差項(xiàng)E:聚類中心用所有屬于這個(gè)類像素的平均[ak, bk,c k,xk,yk]更新;用2范數(shù)表示新舊聚類中心的殘差項(xiàng)E,迭代終止條件為殘差項(xiàng) E < threshold。
【文檔編號(hào)】G06K9/66GK104050677SQ201410308041
【公開日】2014年9月17日 申請(qǐng)日期:2014年6月30日 優(yōu)先權(quán)日:2014年6月30日
【發(fā)明者】劉亞洲, 陳俊龍, 孫權(quán)森 申請(qǐng)人:南京理工大學(xué)