一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法
【專利摘要】本發(fā)明公開了一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法,包括高光譜圖像數(shù)據(jù)預處理——歸一化、去噪、降維等;boostrap采樣和加權(quán)平均獲取參考樣本集;光譜信號隨機過程理論假設(shè)——假設(shè)一,光譜信號是一平穩(wěn)隨機過程某一時刻的隨機試驗,假設(shè)二,每個隨機試驗取值的概率都相等,其次根據(jù)隨機過程自相關(guān)理論對光譜信號進行抽象,得出自相關(guān)系數(shù)計算公式,最后將其組合成自相關(guān)特征向量;采用最優(yōu)方向法(MOD)對相關(guān)性特征向量進行稀疏分解。本發(fā)明從隨機過程互相關(guān)的角度提出高光譜分類中特征抽取方法,具有較好的抗噪性和穩(wěn)定性高,能夠提高高光譜分類的精度。
【專利說明】一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于高光譜圖像處理領(lǐng)域,尤其涉及一種高光譜圖像分類中光譜向量互相 關(guān)特征的抽取方法。
【背景技術(shù)】
[0002] 高光譜圖像將傳統(tǒng)的空間維信息和光譜維信息有機地融合和為一體,在獲取場景 空間圖像的同時,得到場景內(nèi)所有對象的連續(xù)光譜,從而實現(xiàn)依據(jù)對象光譜特征分類和識 別的目標。與傳統(tǒng)的全色、多光譜遙感相比,因其高光譜分辨率和空間分辨率,有效得結(jié)合 的光譜信息與空間信息,且數(shù)據(jù)量豐富,數(shù)據(jù)模型易于描述,高光譜圖像在識別與精確分類 方面具有突出的優(yōu)勢。隨著高光譜成像技術(shù)的發(fā)展和成熟,高光譜圖像處理技術(shù)已被廣泛 成功應(yīng)用于醫(yī)學診斷,農(nóng)業(yè)檢測,礦物探測,環(huán)境監(jiān)測等領(lǐng)域中。
[0003] 高光譜圖像分類問題仍然是高光譜圖像分析與處理技術(shù)的所面臨的一大難題。高 光譜圖像本身存在很大缺陷,例如海量造成的數(shù)據(jù)冗余度過大,高空間分辨率帶來的光譜 混合以及噪聲的影響,大大增加了精細分類的難度。傳統(tǒng)的高光譜特征匹配分類方法需要 大量的先驗知識,對光譜特征數(shù)據(jù)庫依賴性太高,而統(tǒng)計分類方法運算速度慢,精度受訓練 樣本的影響較大。已有的特征抽取和分類方法往往受限于高光譜圖像自身的缺陷,表現(xiàn)為 算法的穩(wěn)定性和魯棒性不足。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的目的就是為了解決上述問題,提供一種高光譜圖像分類中光譜向量互相 關(guān)特征的抽取方法,它具有能有效應(yīng)對小樣本學習分類問題,且具有良好的抗噪性,能有效 提高整個分類系統(tǒng)的分類精確度優(yōu)點。
[0005] 為了實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
[0006] -種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法,包括以下步驟:
[0007] 步驟(1):對高光譜圖像原始數(shù)據(jù)進行預處理得到訓練樣本集合;所述預處理包 括:將三維高光譜數(shù)據(jù)轉(zhuǎn)化為二維特征向量矩陣、數(shù)據(jù)歸一化、采用主成分分析法進行降維 和隨機抽取部分已標記樣本構(gòu)成訓練樣本集合;
[0008] 步驟(2):采取boostrap抽樣法從訓練樣本集合中獲取參考樣本集,計算訓練樣 本集合中的訓練樣本與參考樣本集的參考樣本的互相關(guān)系數(shù),構(gòu)建互相關(guān)系數(shù)特征向量;
[0009] 步驟(3):特征選擇:根據(jù)步驟(2)中構(gòu)建的互相關(guān)系數(shù)特征向量,從降低計算復 雜度角度出發(fā)需要進行特征再選擇,選擇方法是對步驟(2)中構(gòu)建的相關(guān)系數(shù)特征向量進 行稀疏表示,稀疏化相關(guān)系數(shù)特征向量得到稀疏特征向量。
[0010] 所述步驟⑴包括:
[0011] 步驟(1-1):將三維高光譜圖像轉(zhuǎn)換成二維特征矢量形式: _2] ImxNxK > ^LxK ⑴
【權(quán)利要求】
1. 一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法,其特征是,包括以下步 驟: 步驟(1):對高光譜圖像原始數(shù)據(jù)進行預處理得到訓練樣本集合;所述預處理包括:將 三維高光譜數(shù)據(jù)轉(zhuǎn)化為二維特征向量矩陣、數(shù)據(jù)歸一化、采用主成分分析法進行降維和隨 機抽取部分已標記樣本構(gòu)成訓練樣本集合; 步驟(2):采取boostrap抽樣法從訓練樣本集合中獲取參考樣本集,計算訓練樣本集 合中的訓練樣本與參考樣本集的參考樣本的互相關(guān)系數(shù),構(gòu)建互相關(guān)系數(shù)特征向量; 步驟(3):特征選擇:根據(jù)步驟(2)中構(gòu)建的互相關(guān)系數(shù)特征向量,從降低計算復雜度 角度出發(fā)需要進行特征再選擇,選擇方法是對步驟(2)中構(gòu)建的相關(guān)系數(shù)特征向量進行稀 疏表示,稀疏化相關(guān)系數(shù)特征向量得到稀疏特征向量。
2. 如權(quán)利要求1所述的一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法,其特 征是,所述將三維高光譜數(shù)據(jù)轉(zhuǎn)化為二維特征向量矩陣的步驟為: 步驟(1-1):將三維高光譜圖像轉(zhuǎn)換成二維特征矢量形式:
其中,I是三維高光譜圖像,M為圖像行數(shù),N為圖像列數(shù),K為特征數(shù),I1是轉(zhuǎn)化后的二 維特征矩陣,I1的每一行對應(yīng)一個樣本,每一列對應(yīng)一個特征,L是像元總數(shù),Lable是對應(yīng) 于I的標簽矩陣,Lable1是對應(yīng)于I1的標簽矩陣。
3. 如權(quán)利要求1或2所述的一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法, 其特征是,所述數(shù)據(jù)歸一化的步驟為: 步驟(1-2):按照特征維,即所述步驟(1-1)中I1的列,搜索每列中的特征值的最小值Xniin、最大值Xniax,將[XniiwXniax]之間的原特征值映射到[-1,1]之間,映射關(guān)系如公式⑶所 示:
其中,ymax = 1,ymin = _i,X是Ii中原特征值,y是映射到[_1,1]之間后的特征值,用y取代X,I1經(jīng)歸一化后得到歸一化后的圖像數(shù)據(jù)12。
4. 如權(quán)利要求1所述的一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法,其特 征是,所述采用主成分分析法進行降維的步驟為: 步驟(1-3):采用主成分分析法對歸一化后的圖像數(shù)據(jù)I2進行主成分分析,降低圖像 噪聲和特征維度: 主成分分析過程如下:歸一化后的圖像數(shù)據(jù)I2表示成I2= (X1,X2,…,Xi,-,XJt,其中Xi為一個κχ1的列向量,表不一個樣本; 樣本中心化,即對I2中所有樣本進行中心化操作,具體方法為將I2中所有向量減去全 局均值向量i 計算中心化后的I2的協(xié)方差矩陣Σ=Ι2Τ*Ι2,然后對協(xié)方差矩陣Σ特征分解,得到特 征值矩陣Λ和特征向量矩陣ω,對I2進行主成分變換: I3 =I2*ω(4) I3是經(jīng)過PCA降維后的圖像數(shù)據(jù),I3的特征維度Kl遠小于I2的特征維數(shù)Κ。
5. 如權(quán)利要求1所述的一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法,其特 征是,所述隨機抽取部分已標記樣本構(gòu)成訓練樣本集合的步驟為: 步驟(1-4):隨機抽取訓練樣本集合: 抽取方式采用隨機數(shù)方法,即隨機產(chǎn)生一組1?L之間的隨機數(shù)a=(叫,a2,. ..,ai),隨機數(shù)不重復,1是隨機數(shù)的個數(shù); 將生成的隨機數(shù)作為行標號,從步驟(1-3)的I3中抽取對應(yīng)的行組成訓練樣本集合train_matrix1XK1, 將生成的隨機數(shù)作為行標號,從步驟(1-1)的Lableji取對應(yīng)的標簽,組成訓練樣本 類別標簽集合trian_labellxl; train_matrix1XK1的每一行代表一個訓練樣本,對應(yīng)trian_labellxl中相應(yīng)行的類標 簽。
6. 如權(quán)利要求1所述的一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法,其特 征是,所述步驟(2)包括: 步驟(2-1):采取boostrap抽樣法構(gòu)建各類別參考樣本集合: 步驟(2-2):假設(shè)任意兩個光譜特征向量X1=(xn, x12,-",Xiki)' x2 = (x21, X22,… ,xau)T,分別是隨機過程x(t,ω)的兩次不同時間t,t+τ的隨機試驗,則x(t,ω)= Xl,X(t+τ,ω) =X2,對于離散平穩(wěn)隨機過程,同一平穩(wěn)隨機過程不同時間隨機試驗的互相 關(guān)有:
RxY(τ )表示兩個隨機實驗X(t,ω)、X(t+τ,ω)的互相關(guān),τ為時間間隔,Ω= {ωι,ω2,…,ω?!卅瓆表示隨機試驗樣本空間,N為隨機試驗所有可能結(jié)果的個數(shù),Coi 是某次隨機試驗的結(jié)果,P(Oi)是隨機試驗取得Coi的概率; 當t固定時,令Χ(ω) =X(t,ω),Υ(ω) =X(t+T,ω),則公式(6)改寫為:
'(τ)表示兩個隨機試驗的互相關(guān),Xli=X(t, (Oi)、x2i=X(t+τ,(Oi)分別對應(yīng)于光 譜特征向量XpX2第i個特征值,ω?eΩ= {ω1;ω2,…,Coi,…,ωΝ},Ω表示隨機試驗樣 本空間,N為隨機試驗所有可能結(jié)果的個數(shù),且N=Kl,Coi是某次隨機試驗的結(jié)果,P(Coi) 是隨機試驗取得概率; 步驟(2-3):對步驟(2-2)的條件作進一步假設(shè)--假設(shè)所有特征取值的概率P(Coi) 相等,則能夠去掉公式(7)的P(Coi),用Rxy取代Rxy(T),進一步轉(zhuǎn)變得:
步驟(2-4):根據(jù)式(8)的形式,結(jié)合kernel方法,將原始數(shù)據(jù)映射到高維空間,引入RBF核函數(shù),其結(jié)構(gòu)如下式所述:
其中,k(x,r)表示RBF核函數(shù),X表示測試樣本列向量,r是參考樣本列向量,〇是RBF核函數(shù)的參數(shù),且參數(shù)σ可調(diào); 公式(8)能夠被公式(9)取代: Rxr =k(x,r) (10) Rxl?是向量X與r之間的相關(guān)系數(shù),X表示測試樣本列向量,r是參考樣本列向量; 步驟(2-5):通過計算得到相關(guān)系數(shù)特征向量構(gòu)成的訓練樣本矩陣; 步驟(2-6):通過計算得到相關(guān)系數(shù)特征向量構(gòu)成的測試樣本矩陣。
7. 如權(quán)利要求6所述的一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法,其特 征是,所述步驟(2-5)的步驟為: 步驟(2-5-1):對所述步驟(1-4)中訓練樣本集合train_matrix1XK1中任意訓練樣本Xi,即train_matrix1XK1中的一行數(shù)據(jù),按照公式(9)和公式(10)計算訓練樣本Xi與步驟 (2-1)的總體參考樣本矩陣Ref中每個參考樣本的互相關(guān)系數(shù),得到訓練樣本Xi與總參考 樣本集合Ref所有參考樣本的相關(guān)系數(shù)特征向量Cori,用Cori取代Xi作為訓練樣本; 步驟(2-5-2):對所述步驟(1-4)中訓練樣本集合train_matrix1XK1中所有訓練樣 本Xi,i= 1,2,…,1執(zhí)行步驟(2-5-1)操作,得到相關(guān)系數(shù)特征向量構(gòu)成的訓練樣本矩陣 train= (Cor1,cor2,…,Cor1)τ ; 所述步驟(2-6)的步驟為: 步驟(2-6-1):對所述步驟(1-3)I3中任意一個測試樣本X%即I3中的一行數(shù)據(jù),按照 公式(9)和公式(10)計算測試樣本X%與步驟(2-1)的總體參考樣本矩陣Ref中每個參考 樣本的互相關(guān)系數(shù),得到測試樣本X%與總參考樣本集合Ref所有參考樣本的相關(guān)系數(shù)特征 向量cor%用cof取代X%作為測試樣本; 步驟(2-6-2)對所述步驟(1-3)I3中所有測試樣本<,i= 1,2,…,L,L為I3中樣本數(shù),執(zhí)行步驟(2-6-1)操作,得到相關(guān)系數(shù)特征向量構(gòu)成的測試樣本矩陣 ie.si=(cor(,cor《,…,cor[)T 〇
8. 如權(quán)利要求1或7所述的一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法, 其特征是,所述步驟(3)特征選擇的方法為: 步驟(3-1):采用稀疏分解法對步驟(2-5-2)的訓練樣本矩陣train中的相關(guān)系數(shù)訓 練樣本進行稀疏分解,同時獲得稀疏字典Φ,稀疏分解后,對應(yīng)于train中每一個樣本Cori 會得到一個稀疏系數(shù)特征向量ai,用ai取代COTi,得到稀疏系數(shù)訓練樣本集合Train; 步驟(3-2):對所述步驟(2-6-2)相關(guān)系數(shù)測試樣本矩陣test在步驟(3-1)的稀疏字 典Φ上進行稀疏分解,稀疏分解后,對應(yīng)于test中每一個樣本coif會得到一個稀疏系數(shù)特 征向量 <,用α丨取代cor;V得到稀疏系數(shù)測試樣本集合Test。
9. 如權(quán)利要求6所述的一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法,其特 征是,所述步驟(2-1)的步驟為: 假設(shè)有C類,且每類參考樣本數(shù)Ni ;對類別i,根據(jù)所述步驟(1-4)中訓練樣本類別標 簽集合trian_labellxl和訓練樣本集合train_matrix1XK1,首先從訓練樣本集合train_ matrix1XK1中抽取類別標簽為i的樣本,構(gòu)成樣本子集Subi,其次從Subi中有放回抽取樣本 子集Subi樣本總數(shù)的80%加權(quán)平均,所述加權(quán)平均公式如下:
其中,Mfi是加權(quán)后的新樣本,是一個IXKl的行向量,Xi是抽取的樣本,11是抽取的 樣本數(shù); 抽取Ni次后,會得到一個新的參考樣本矩陣= 匯總所有類別參考樣本矩陣,得到總體參考樣本矩陣Ref= (Ref1,Ref2,…,Refc)τ。
10.如權(quán)利要求8所述的一種高光譜圖像分類中光譜向量互相關(guān)特征的抽取方法,其 特征是, 所述稀疏分解的方法如下,稀疏分解的基本模型為:
y是未稀疏化的特征向量,φ是稀疏字典,Ct是特征向量y在稀疏字典Φ上分解的稀 疏系數(shù),λ是一個控制稀疏系數(shù)α變化的參數(shù); 所述稀疏字典Φ采用最優(yōu)方向法學習獲得: 以步驟(2-5-2)中train的相關(guān)系數(shù)訓練樣本作為最優(yōu)方向法的輸入樣本X,尋找到一 個稀疏字典Φ:
X是輸入樣本,A稀疏系數(shù)矩陣,βi表示A中的第i列。
【文檔編號】G06K9/46GK104463247SQ201410748096
【公開日】2015年3月25日 申請日期:2014年12月9日 優(yōu)先權(quán)日:2014年12月9日
【發(fā)明者】劉治, 唐波, 聶明鈺, 孫育霖, 宿方琪, 肖曉燕, 張偉 申請人:山東大學