基于深度神經網絡的sar紋理圖像分類方法
【專利摘要】本發(fā)明提出了一種基于深度神經網絡的SAR紋理圖像分類方法,主要解決已有技術應用在樣本數量較大,特征維數較多的SAR紋理圖像分類準確率低的問題。其實現(xiàn)步驟是:(1)提取SAR圖像的低級特征;(2)通過深度神經網絡的第一層RBF神經網絡對SAR圖像訓練低級特征,得到圖像的高級特征;(3)通過深度神經網絡的第二層RBM神經網絡訓練高級特征,得到圖像的更高級特征;(4)通過深度神經網絡的第三層RBF神經網絡訓練更高級特征,得到圖像紋理分類特征;(5)將圖像測試樣本的紋理分類特征與測試樣本標簽對比,調節(jié)深度神經網絡各層參數,得到最優(yōu)測試分類準確率。本發(fā)明分類準確率高,可用于目標識別或目標跟蹤。
【專利說明】基于深度神經網絡的SAR紋理圖像分類方法
【技術領域】
[0001] 本發(fā)明屬于圖像處理【技術領域】,特別涉及一種基于深度神經網絡的多樣本、多類 另Ij、特征復雜的SAR紋理圖像分類方法,可用于目標識別,目標跟蹤等領域。
【背景技術】
[0002] 合成孔徑雷達SAR在地球科學遙感領域的應用非常廣泛。SAR紋理圖像分類是模 式識別在SAR圖像處理中的應用,它將圖像數據從二維灰度空間轉換到目標模式空間,其 分類的結果是根據圖像的不同屬性將其劃分為多個不同類別的子區(qū)域。SAR圖像的可靠分 類特征主要是灰度特征和紋理特征,但是在實際應用中利用灰度特征進行分類得到的結果 并不是很理想,因此好的紋理特征成為提高分類精度的重要手段。SAR圖像中含有特別豐富 的紋理信息,不同的地表粗糙程度代表不同的紋理特征,從SAR圖像中提取有效的紋理信 息,成為了合成孔徑雷達識別地物的一項關鍵技術。
[0003] 傳統(tǒng)的獲取圖像紋理特征的主要方法有基于幾何知識的方法、基于結構的方法、 基于統(tǒng)計學的方法、基于信號處理的方法和基于建模的方法。目前的熱點方法是基于統(tǒng)計 學的紋理提取方法。紋理圖像的主要分類算法有距離度量法、人工神經網絡分類算法和支 撐矢量機,其中人工神經網絡分類算法在樣本數量很大時能夠獲得較高的分類準確率。
[0004] SAR紋理圖像分類是利用傳統(tǒng)機器學習的方法對其紋理特征進行分類。但是傳統(tǒng) 機器學習和信號處理方法是僅含單層非線性變換的淺層學習結構。淺層模型的一個共性是 僅含單個將原始輸入信號轉換到特定問題空間特征的簡單結構。深度學習通過學習一種深 層非線性網絡結構,實現(xiàn)復雜函數逼近,表征輸入數據的分布式表示,并展現(xiàn)了強大的從少 數樣本集中學習數據集本質特征的能力。
[0005] 深度學習通過組合低層特征形成更加抽象的高層表示,即屬性類別或特征表示, 以發(fā)現(xiàn)數據的分布式特征表示。深度學習可通過多層映射單元和逐層學習的算法獲取輸入 數據的主要結構信息。
[0006] 近年來,隨著計算機技術的迅速發(fā)展,大量的文本,語音,圖像,視頻等數據與日俱 增,大量的數據成為有價值的信息資源,信息成為商業(yè)運作的核心。數據挖掘的核心原理是 通過充分利用計算機的先進技術從大量的復雜的數據中攫取出其本質特征,從而可以充分 利用其中有價值的數據信息。數據挖掘包含很多方法,其中非常重要的一種是分類。分類的 方法同樣在機器學習,人工智能以及模式識別等相關科技領域已然成為當前受到關注的方 法。它可以從內容豐富、蘊藏大量信息的數據庫中提取描述重要數據類的模型,用于做出智 能決策,所以應用非常廣泛。分類的目的是學習到一個分類函數或分類模型,通過該分類模 型,分析訓練數據表現(xiàn)出的特性,描述每個類的特征,根據類的描述對測試數據進行分類。
【發(fā)明內容】
[0007] 本發(fā)明的目的在于針對上述已有技術的不足,提出一種深度神經網絡的SAR紋理 圖像分類方法,以獲得較高的分類準確率。
[0008] 本發(fā)明的技術方案是這樣實現(xiàn)的:
[0009] 一.技術原理
[0010] 徑向基函數RBF是一個取值僅僅依賴于離原點距離的實值函數,S卩O(X)= 〇 ( Il X Il ),或者是到任意中心點C的距離,即〇 (X,C) = 〇( Il X-C Il ),標準的距離一般使 用歐氏距離。任意一個滿足〇 (X) = 〇 ( Il X Il )特性的函數〇都叫做徑向基函數RBF,這 種徑向基函數RBF可以作為神經網絡隱含層的核函數,完成神經網絡的函數逼近等功能。
[0011] RBF神經網絡由三層組成,一個輸入層,一個隱含層和一個輸出層。RBF神經網絡 的基本思想是:用徑向基函數RBF作為"隱"單元的基函數構成隱含層空間,先將數據非線 性映射到一個高維度的空間中;然后在高維空間用線性模型來做回歸或者分類;再將輸入 向量直接映射到隱含層的空間。RBF神經網絡可以以任意準確率逼近任意連續(xù)函數。目前 廣泛應用于非線性函數逼近、數據處理、模式識別、圖像分類、系統(tǒng)建模等。
[0012] 受限玻爾茲曼機RBM神經網絡由兩層組成,一個隱含單元和一個可視單元。隱含 單元和可視單元包含一定數量的神經元。受限玻爾茲曼機RBM神經網絡是一種模擬神經網 絡結構的隨機概率模型。隱含單元和可視單元自身的所有神經元之間都不連接,但隱含單 元和可視單元之間的所有神經元是完全連接的。受限玻爾茲曼機RBM神經網絡是一種無導 師學習的特征提取模型,由于它是基于能量的模型,所以能夠提取到較優(yōu)的特征,可通過對 比差異算法CD算法來訓練受限玻爾茲曼機RBM神經網絡。
[0013] 傳統(tǒng)的SAR紋理圖像分類方法是通過淺層學習結構,學習到的特征比較低級,本 發(fā)明的出發(fā)點是拓展深度學習應用,著眼于如何充分合理地利用深度學習在增強傳統(tǒng)學習 算法RBF神經網絡在SAR紋理圖像地物分類問題的性能。
[0014] 二?技術方案
[0015] 根據上述原理,本發(fā)明的技術方案包括以下步驟:
[0016] 步驟1,定義深度神經網絡包括三層結構,其中第一層與第三層均是由一個輸入單 元,一個隱含單元和一個輸出單元組成的徑向基函數RBF神經網絡;第二層是由一個隱含 單元和一個可視單元組成的受限玻爾茲曼機RBM神經網絡;
[0017] 步驟2,通過學習 SAR圖像訓練樣本的紋理分類特征,訓練出所述的深度神經網 絡:
[0018] (2a)選取包含城鎮(zhèn),農田,山脈三類地物的SAR圖像作為第一個實驗對象,選取包 含十三類紋理實物的SAR圖像texture作為第二個實驗對象,提取這兩個實驗對象訓練樣 本的紋元特征和灰度特征,即實驗對象訓練樣本的低級特征,然后通過對該低級特征進行 訓練,得到深度神經網絡;
[0019] (2b)將實驗對象訓練樣本的低級特征作為深度神經網絡中第一層輸入單元的輸 入特征,通過徑向基函數RBF神經網絡對低級特征進行訓練,得到該RBF神經網絡中隱含單 元的輸出,作為深度神經網絡的第一層輸出,即實驗對象的高級特征,完成深度神經網絡第 一層的訓練;
[0020] (2c)通過受限玻爾茲曼機RBM神經網絡對實驗對象的高級特征進行訓練,得到該 RBM神經網絡中隱含單元的輸出,作為深度神經網絡的第二層輸出,即實驗對象的更高級特 征,完成深度神經網絡第二層的訓練;
[0021] (2d)通過徑向基函數RBF神經網絡對實驗對象的更高級特征進行訓練,得到該 RBF神經網絡輸出單元的輸出,作為深度神經網絡的第三層輸出,即實驗對象訓練樣本的紋 理分類特征,完成深度神經網絡第三層的訓練;
[0022] 步驟3,利用步驟2訓練好的深度神經網絡對實驗對象測試樣本進行分類:
[0023] (3a)提取實驗對象測試樣本的低級特征,利用深度神經網絡第一層徑向基函數 RBF神經網絡對該低級特征進行訓練,得到該RBF神經網絡隱含單元的輸出,即實驗對象測 試樣本的高級特征,利用矩陣實驗室MATLAB自帶的SimO函數,預測出該高級特征的類別 標簽;
[0024] (3b)將預測出實驗對象測試樣本高級特征的類別標簽與實驗對象給定的測試樣 本類別標簽進行對比,統(tǒng)計標簽相同的樣本個數,完成利用徑向基函數RBF神經網絡對SAR 紋理圖像的分類;
[0025] (3c)將實驗對象測試樣本的高級特征通過深度神經網絡第二層和第三層的訓練, 得到實驗對象測試樣本的紋理分類特征,利用矩陣實驗室MATLAB自帶的SimO函數,預測 出該測試樣本紋理分類特征的標簽;
[0026] (3d)將預測出實驗對象測試樣本地物分類特征的標簽與實驗對象給定的測試樣 本類別標簽進行對比,統(tǒng)計標簽相同的樣本個數,完成利用深度神經網絡對SAR紋理圖像 的分類。
[0027] 本發(fā)明與已有技術相比,具有以下優(yōu)點:
[0028] 1.本發(fā)明由于利用了 SAR圖像的低級特征,不僅提高了深度神經網絡分類的效 率,而且為提高深度神經網絡的分類準確率提供了很好的基礎特征。
[0029] 2.本發(fā)明由于利用了深度神經網絡逐層學習的優(yōu)勢,提取到SAR圖像的層次特 征,使其更好地逼近圖像的本質特征,克服了已有技術逼近圖像特征能力有限的缺點。
[0030] 3.本發(fā)明由于利用了深度學習中"逐層初始化"的方法,通過對SAR圖像的低級特 征進行訓練,不僅降低了時間復雜度,還可以避免出現(xiàn)梯度擴散的問題。
[0031] 實驗結果表明,本發(fā)明能夠有效的應用于SAR紋理圖像的分類問題,獲得了比已 有技術支撐矢量機SVM和徑向基函數RBF神經網絡更高的魯棒性和分類準確率,可進一步 應用于特征更復雜,類別更多的SAR紋理圖像的分類問題。
【專利附圖】
【附圖說明】
[0032] 圖1是本發(fā)明的實現(xiàn)流程圖;
[0033] 圖2是本發(fā)明中的深度神經網絡的結構圖;
[0034] 圖3是本發(fā)明仿真使用的各類實物的單個訓練樣本圖;
[0035] 圖4是本發(fā)明仿真使用的各類實物的單個測試樣本圖。
【具體實施方式】
[0036] 參照圖1,對本發(fā)明的實施步驟詳述如下:
[0037] 步驟1,定義一個由三層結構構成的深度神經網絡。
[0038] 如圖2所示,本實例定義的深度神經網絡包括三層結構,其中第一層與第三層均 是由一個輸入單元,一個隱含單元和一個輸出單元組成的徑向基函數RBF神經網絡;第二 層是由一個隱含單元和一個可視單元組成的受限玻爾茲曼機RBM神經網絡。
[0039] 步驟2,通過學習 SAR圖像訓練樣本的紋理分類特征,訓練出所述的深度神經網 絡。
[0040] (2a)提取SAR圖像訓練樣本的紋元特征和灰度特征,即SAR圖像訓練樣本的低級 特征;
[0041] 從SAR圖像地物數據庫中選取包含城鎮(zhèn),農田,山脈三類地物的SAR圖像作為第一 個實驗對象,從USC-SIPI數據庫中選取包含十三類紋理實物的SAR圖像texture作為第二 個實驗對象,其中的十三類紋理實物分別是:草地、樹皮、稻草、人字形編織、粗紡毛織物、小 牛皮壓、沙灘、水、木紋、拉菲亞樹、豬皮、磚墻、塑料泡沫。texture每類實物原圖的大小為 1024*1024,將每類實物原圖平均分割成大小為64*64的圖像塊,每類中隨機選取128個作 為訓練樣本,其余128個樣本作為測試樣本。
[0042] texture各類實物的單個訓練樣本如圖3所示,其中圖3(a)_3(m)分別代表草地、 樹皮、稻草、人字形編織、粗紡毛織物、小牛皮壓、沙灘、水、木紋、拉菲亞樹、豬皮、磚墻、塑料 泡沫十三類紋理實物。
[0043] texture各類實物的單個測試樣本如圖4所示,其中圖4(a)-4 (m)分別代表草地、 樹皮、稻草、人字形編織、粗紡毛織物、小牛皮壓、沙灘、水、木紋、拉菲亞樹、豬皮、磚墻、塑料 泡沫十三類紋理實物。
[0044] 提取實驗對象紋元特征的實施步驟詳述如下:
[0045] (2al)用遍歷的方法對每個64*64的訓練樣本取9*9的圖像塊,每個訓練樣本取出 56*56個塊,將9*9的塊變成81*1的列向量,則每個訓練樣本變成81*3136的矩陣;
[0046] (2a2)隨機生成一個50*81的隨機矩陣rand,將各類地物的訓練樣本矩陣分別乘 以隨機矩陣rand,得到50*3136大小的矩陣;
[0047] (2a3)每類訓練樣本的50*3136矩陣用K均值聚類方法得到50個聚類中心,即大 小為50*50的矩陣,將十三類訓練樣本的聚類中心組成一個650*50的中心矩陣;
[0048] (2a4)統(tǒng)計每類每個樣本與中心矩陣的最小歐氏距離,得到訓練樣本的統(tǒng)計直方 圖,即紋元特征;
[0049] (2b)通過徑向基函數RBF神經網絡對實驗對象訓練樣本的低級特征進行訓練,完 成深度神經網絡第一層的訓練:
[0050] (2bl)將實驗對象訓練樣本的低級特征作為矩陣實驗室MATLAB自帶的徑向基函 數RBF神經網絡訓練函數NEWRB ()的輸入單元;
[0051] (2b2)用K均值聚類方法初始化徑向基函數RBF神經網絡的歐式距離中心,隨機初 始化徑向基函數RBF神經網絡的均方差,徑向基函數RBF神經網絡訓練函數NEWRB ()根據 均方差和歐式距離中心自動確定該RBF神經網絡隱含單元的結點數目;
[0052] (2b3)通過梯度下降法的多次迭代,調節(jié)徑向基函數RBF神經網絡的隱含單元的 結點數目,使得徑向基函數RBF神經網絡的均方差最小,得到該RBF神經網絡中隱含單元的 輸出,作為深度神經網絡的第一層輸出,即實驗對象的高級特征,完成深度神經網絡第一層 徑向基函數RBF神經網絡的訓練;
[0053] (2c)通過受限玻爾茲曼機RBM神經網絡對實驗對象的高級特征進行訓練,完成深 度神經網絡第二層的訓練:
[0054] (2cl)將實驗對象的高級特征作為受限玻爾茲曼機RBM神經網絡可視單元的輸入 特征;
[0055] (2c2)隨機初始化受限玻爾茲曼機RBM神經網絡的權值矩陣W和偏置值b,通過對 比差異⑶算法訓練權值矩陣W和偏置值b ;
[0056] (2c3)通過吉布斯采樣算法的多次迭代,優(yōu)化權值矩陣W和偏置值b,得到受限玻 爾茲曼機RBM神經網絡中隱含單元的輸出,作為深度神經網絡的第二層輸出,即實驗對象 的更高級特征,完成受限玻爾茲曼機RBM神經網絡的訓練;
[0057] (2d)通過徑向基函數RBF神經網絡對實驗對象的更高級特征進行訓練,完成深度 神經網絡第三層的訓練:
[0058] (2dl)將實驗對象的更高級特征作為矩陣實驗室MATLAB自帶的徑向基函數RBF神 經網絡訓練函數NEWRBO的輸入單元;
[0059] (2d2)用K均值聚類方法初始化徑向基函數RBF神經網絡的歐式距離中心,隨機初 始化徑向基函數RBF神經網絡的均方差,徑向基函數RBF神經網絡訓練函數NEWRB ()根據 均方差和歐式距離中心自動確定該RBF神經網絡隱含單元的結點數目;
[0060] (2d3)通過梯度下降法的多次迭代,調節(jié)徑向基函數RBF神經網絡的隱含單元的 結點數目,使得徑向基函數RBF神經網絡的均方差最小,得到該RBF神經網絡輸出單元的輸 出,作為深度神經網絡的第三層輸出,即實驗對象訓練樣本的紋理分類特征,完成深度神經 網絡第三層徑向基函數RBF神經網絡的訓練。
[0061] 步驟3,利用步驟2訓練好的深度神經網絡對實驗對象測試樣本進行分類。
[0062] (3a)提取實驗對象測試樣本的低級特征,利用深度神經網絡第一層徑向基函數 RBF神經網絡對該低級特征進行訓練,得到該RBF神經網絡隱含單元的輸出,即實驗對象測 試樣本的高級特征,利用MATLAB的sim()函數,預測出該高級特征的類別標簽;
[0063] (3b)將預測出實驗對象測試樣本高級特征的類別標簽與實驗對象給定的測試樣 本類別標簽進行對比,統(tǒng)計標簽相同的樣本個數,完成利用徑向基函數RBF神經網絡對SAR 紋理圖像的分類;
[0064] (3c)將實驗對象測試樣本的高級特征通過深度神經網絡第二層和第三層的訓練, 得到實驗對象測試樣本的紋理分類特征,利用矩陣實驗室MATLAB自帶的SimO函數,預測 出該測試樣本紋理分類特征的標簽;
[0065] (3d)將預測出實驗對象測試樣本地物分類特征的標簽與實驗對象給定的測試樣 本類別標簽進行對比,統(tǒng)計標簽相同的樣本個數,完成利用深度神經網絡對SAR紋理圖像 的分類。
[0066] 本發(fā)明的效果可以通過以下仿真實驗來進行驗證。
[0067] 1 ?仿真條件:
[0068] 在 CPU 為 Core (TM) 22. 3GHZ、內存 2G、WIND0WS XP 系統(tǒng)上使用 MatlabR2012a 進行 仿真。
[0069] 2.仿真內容與結果:
[0070] 仿真實驗一,利用本發(fā)明的深度神經網絡、支撐矢量機SVM和徑向基函數RBF神經 網絡三種方法對第一個實驗對象的紋元特征和灰度特征進行訓練,得到紋理分類特征,從 而實現(xiàn)分類。分類準確率取20次實驗的平均值,對比結果如表一所示。
[0071] 表一.三種方法分類精度對比表
[0072]
【權利要求】
1. 一種基于深度神經網絡的SAR紋理圖像分類方法,包括以下步驟: (1) 定義深度神經網絡包括三層結構,其中第一層與第三層均是由一個輸入單元,一個 隱含單元和一個輸出單元組成的徑向基函數RBF神經網絡;第二層是由一個隱含單元和一 個可視單元組成的受限玻爾茲曼機RBM神經網絡; (2) 通過學習SAR圖像訓練樣本的紋理分類特征,訓練出所述的深度神經網絡: (2a)選取包含城鎮(zhèn),農田,山脈三類地物的SAR圖像作為第一個實驗對象,選取包含 十三類紋理實物的SAR圖像texture作為第二個實驗對象,提取這兩個實驗對象訓練樣本 的紋元特征和灰度特征,即實驗對象訓練樣本的低級特征,然后通過對該低級特征進行訓 練,得到深度神經網絡; (2b)將實驗對象訓練樣本的低級特征作為深度神經網絡中第一層輸入單元的輸入特 征,通過徑向基函數RBF神經網絡對低級特征進行訓練,得到該RBF神經網絡中隱含單元的 輸出,作為深度神經網絡的第一層輸出,即實驗對象的高級特征,完成深度神經網絡第一層 的訓練; (2c)通過受限玻爾茲曼機RBM神經網絡對實驗對象的高級特征進行訓練,得到該RBM 神經網絡中隱含單元的輸出,作為深度神經網絡的第二層輸出,即實驗對象的更高級特征, 完成深度神經網絡第二層的訓練; (2d)通過徑向基函數RBF神經網絡對實驗對象的更高級特征進行訓練,得到該RBF神 經網絡輸出單元的輸出,作為深度神經網絡的第三層輸出,即實驗對象訓練樣本的紋理分 類特征,完成深度神經網絡第三層的訓練; (3) 利用步驟(2)訓練好的深度神經網絡對實驗對象測試樣本進行分類: (3a)提取實驗對象測試樣本的低級特征,利用深度神經網絡第一層徑向基函數RBF神 經網絡對該低級特征進行訓練,得到該RBF神經網絡隱含單元的輸出,即實驗對象測試樣 本的高級特征,利用矩陣實驗室MATLAB自帶的sim〇函數,預測出該高級特征的類別標 簽; (3b)將預測出實驗對象測試樣本高級特征的類別標簽與實驗對象給定的測試樣本類 別標簽進行對比,統(tǒng)計標簽相同的樣本個數,完成利用徑向基函數RBF神經網絡對SAR紋 理圖像的分類; (3c)將實驗對象測試樣本的高級特征通過深度神經網絡第二層和第三層的訓練,得到 實驗對象測試樣本的紋理分類特征,利用矩陣實驗室MATLAB自帶的sim〇函數,預測出該 測試樣本紋理分類特征的標簽; (3d)將預測出實驗對象測試樣本地物分類特征的標簽與實驗對象給定的測試樣本類 別標簽進行對比,統(tǒng)計標簽相同的樣本個數,完成利用深度神經網絡對SAR紋理圖像的分 類。
2. 根據權利要求1所述的方法,其中步驟(2b)所述的通過RBF神經網絡對低級特征進 行訓練,按如下步驟進行: (2bl)將低級特征作為矩陣實驗室MATLAB自帶的徑向基函數RBF神經網絡訓練函數 NEWRB ()的輸入單元; (2b2)用K均值聚類方法初始化徑向基函數RBF神經網絡的歐式距離中心,隨機初始化 徑向基函數RBF神經網絡的均方差,徑向基函數RBF神經網絡訓練函數NEWRB ()根據均方 差和歐式距離中心自動確定該RBF神經網絡隱含單元的結點數目; (2b3)通過梯度下降法的多次迭代,調節(jié)徑向基函數RBF神經網絡的隱含單元的結點 數目,使得徑向基函數RBF神經網絡的均方差最小,完成徑向基函數RBF神經網絡的訓練。
3.根據權利要求1所述的方法,其中步驟(2c)所述的通過受限玻爾茲曼機RBM神經網 絡對實驗對象的高級特征進行訓練,按如下步驟進行: (2cl)將實驗對象的高級特征作為受限玻爾茲曼機RBM神經網絡可視單元的輸入特 征; (2c2)隨機初始化受限玻爾茲曼機RBM神經網絡的權值矩陣W和偏置值b,通過對比差 異⑶算法訓練權值矩陣W和偏置值b ; (2c3)通過吉布斯采樣算法的多次迭代,優(yōu)化權值矩陣W和偏置值b,完成受限玻爾茲 曼機RBM神經網絡的訓練。
【文檔編號】G06K9/46GK104408483SQ201410745713
【公開日】2015年3月11日 申請日期:2014年12月8日 優(yōu)先權日:2014年12月8日
【發(fā)明者】焦李成, 李玲玲, 韓佳敏, 屈嶸, 楊淑媛, 侯彪, 王爽, 劉紅英, 熊濤, 馬文萍, 馬晶晶 申請人:西安電子科技大學