基于像素聚類的wrapper式高光譜波段選擇方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,更進一步涉及高光譜影像(Hyperspectral Imagery)波段選擇領(lǐng)域中基于無監(jiān)督的高光譜波段選擇方法,具體是一種基于像素聚類的 wrapper式高光譜波段選擇方法,用于高光譜圖像處理中的數(shù)據(jù)降維,方便后續(xù)的數(shù)據(jù)處 理。
【背景技術(shù)】
[0002] 近年來,隨著遙感技術(shù)和成像光譜儀的發(fā)展,高光譜遙感能夠在連續(xù)的波段上獲 取地物的光譜信息。雖然豐富的光譜數(shù)據(jù)信息使得精確的目標識別成為可能;但是同時,龐 大的數(shù)據(jù)難以避免的出現(xiàn)了數(shù)據(jù)冗余的現(xiàn)象,為后續(xù)的高光譜圖像處理帶來了數(shù)據(jù)維度過 高、計算量大、耗費存儲空間的難題。因此,如何在最大程度保留高光譜數(shù)據(jù)豐富信息的基 礎(chǔ)上降低數(shù)據(jù)維度是高光譜圖像處理的重要技術(shù)問題之一。
[0003] 高光譜圖像降維方法有特征提取與波段選擇兩種,特征提取方法會根據(jù)原始的波 段信息生成新的合成波段,一般是通過線性或者非線性的方法將高維波段空間映射至低維 波段空間,從而達到降維的目的。常用方法如:PCA主成分分析法,ICA獨立分量分析法等 等。波段選擇是從原始的波段中選擇一部分現(xiàn)有的波段,相對于特征提取的方法,波段選擇 不會改變原始的波段數(shù)據(jù),較好的保留了原始波段中的物理含義以及地物的光譜特性,因 此從物理意義上講,波段選擇更適合高光譜圖像的降維。
[0004] 高光譜圖像波段選擇可以分為無監(jiān)督波段選擇和有監(jiān)督波段選擇兩類,其主要區(qū) 別在于是否需要標記樣本的參與。無監(jiān)督波段選擇不需要標記樣本的參與,利用圖像數(shù)據(jù) 的內(nèi)在結(jié)構(gòu)來選擇波段,更加符合實際情況,因此使用范圍更加廣泛。有監(jiān)督波段選擇需要 已知標記樣本的參與,雖然標記樣本的標記信息可以提高波段選擇的性能,但是高光譜圖 像的標記樣本通常難以獲取,這大大限制了有監(jiān)督波段選擇方法的應(yīng)用范圍。
[0005] 現(xiàn)有的無監(jiān)督波段選擇方法,如 SBBS(Similarity-Based Unsupervised Band Selection)、ECA(Exemplar Component Analysis)、ΜΙ-based(Mutual Informatio based) 等,一般都使用全部的像素點參與運算,或者隨機選取一定比例(如10%)的像素點參與 運算。選用全部的像素點運算量較大會降低波段選擇的效率,而隨機選取一定比例的像素 點會因為隨機性影響導(dǎo)致結(jié)果有波動且隨機選取一定比例的像素點沒有與之相對的實際 物理含義。
[0006] 高光譜圖像數(shù)據(jù)是地球上各種類型地物對于光譜射線的反射,高光譜圖像的標記 樣本指的是高光譜圖像中某一個像素點對應(yīng)的實地區(qū)域的地物標記,標記樣本的獲取有 兩種途徑:第一種是需要由人工實地考察該地區(qū)的地物之后人工記錄得到,這種方法需要 大量的人工參與,需耗費大量人力物力資源;第二種是根據(jù)已有的標準圖像光譜庫,使用 得到的高光譜圖像數(shù)據(jù)與光譜庫中的數(shù)據(jù)對比匹配得到,這種方法需要經(jīng)過大量的對比 匹配運算,而且如果標準光譜庫中沒有該種地物則無法完成匹配。然而隨著季節(jié)變換、人 類勞作、地球運動等原因,即使是同一塊區(qū)域的地物也無時無刻不在發(fā)生變化,同時地球 上的某些區(qū)域,如:高山、深海、荒漠、密林等區(qū)域是難以進入的,所以想要獲取這些高光譜 圖像的標記樣本是十分困難的;更重要的是,很多情況下需要對實時獲取到的高光譜圖像 做處理,無法等待標記樣本的獲取?,F(xiàn)有的有監(jiān)督波段選擇方法,如MRMR(Max-Relevance Min-Redundancy)、wrapper式等,都需要大量標記樣本的參與。當沒有標記樣本時就無法 使用這些方法,使得有監(jiān)督波段選擇方法的使用范圍大大受限。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)的不足,提出一種不需要已知標記樣本參與 就可以使用有監(jiān)督波段選擇方法的基于像素聚類的wrapper式高光譜波段選擇方法。
[0008] 本發(fā)明的技術(shù)方案的實現(xiàn)包括有如下步驟:
[0009] (1)輸入待波段選擇的高光譜圖像,假設(shè)圖像的原始波段數(shù)目為P,將該圖像轉(zhuǎn)換 為矩陣形式的高光譜數(shù)據(jù);
[0010] (2)對高光譜數(shù)據(jù)做超像素(Superpixel)分割,共產(chǎn)生N個相關(guān)的圖像塊;
[0011] (3)對每一個圖像塊,利用像素點之間的相關(guān)性方法挑選一個最具代表性的像素 點,共得到N個代表點;
[0012] (4)對N個代表點使用k-medoids方法進行聚類,這種聚類屬于無監(jiān)督聚類,得到 N個代表點的初始聚類結(jié)果;以N個代表點的初始聚類結(jié)果作為初始標簽,再使用支撐向量 機(SVM)對初始聚類結(jié)果進行優(yōu)化分類,得到N個代表點的最終聚類結(jié)果;
[0013] (5)以N個代表點的最終聚類結(jié)果作為最終標簽,將這N個代表點作為標記樣本, 用wrapper式波段選擇方法在原始波段中選擇波段,實現(xiàn)高光譜圖像的波段選擇。
[0014] 本發(fā)明的基本思路是:對原高光譜圖像數(shù)據(jù)做超像素分割得到超像素塊,從超像 素塊中選取具有代表性的像素點,對這些代表點使用聚類的方法得到最終標簽,使得代表 點可以作為標記樣本來使用,用這些代表點作為標記樣本參與有監(jiān)督的wrapper式波段選 擇方法,實現(xiàn)高光譜圖像的波段選擇。
[0015] 與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點:
[0016] 第一:現(xiàn)有的有監(jiān)督波段選擇方法需要已知標記樣本的參與,而通常情況下已知 標記樣本是很難得到的;本發(fā)明中用代表點的最終聚類結(jié)果當做最終標簽,形成標記樣本, 因此本發(fā)明不需要已知標記樣本參與就可以使用有監(jiān)督波段選擇方法;實現(xiàn)了在無監(jiān)督波 段選擇領(lǐng)域中使用有監(jiān)督波段選擇方法,擴大了有監(jiān)督波段選擇方法的應(yīng)用范圍。
[0017] 第二:高光譜圖像是對實際地物的一種反映,而實際地物一般是成片出現(xiàn)的,如一 片農(nóng)田、一片湖泊、一片居民區(qū)等等。本發(fā)明中是對高光譜圖像做超像素分割之后,從超像 素塊中挑選最具代表性像素點用作后續(xù)波段選擇處理;那么超像素塊對應(yīng)于實際地物的成 片區(qū)域,因此從超像素塊中挑選最具代表性像素點用作后續(xù)波段選擇處理不僅可以減低波 段選擇的運算量,提高波段選擇效率,而且這些代表點還具有實際的物理意義。
[0018] 第三:一般的k-medoids聚類方法的效果受到聚類中心的隨機初始化的影響十分 嚴重,本發(fā)明在使用k-medoids進行初始聚類后,再將SVM分類器引入到無監(jiān)督的聚類過程 中,借由分類器強大的分類能力,優(yōu)化了聚類效果,提高了聚類的可靠性。
【附圖說明】:
[0019] 圖1是本發(fā)明的流程圖;
[0020] 圖2是在indian pines高光譜圖像上本發(fā)明與已有技術(shù)的選擇效果對比曲線圖;
[0021] 圖3是在paviaU高光譜圖像上本發(fā)明與已有技術(shù)的選擇效果對比曲線圖。
【具體實施方式】:
[0022] 下面參照附圖,對本發(fā)明詳細說明
[0023] 高光譜圖像數(shù)據(jù)通常是由數(shù)萬個像素點的數(shù)百個波段數(shù)據(jù)組成,如此龐大且高維 度的數(shù)據(jù)雖然帶來了豐富的地物信息,但同時也給高光譜圖像的處理帶來了諸多問題與不 便之處。由于高光譜圖像數(shù)據(jù)是地物對于連續(xù)波段的光譜反射曲線,其中存在有大量的冗 余信息,因此,如何在最大程度保留高光譜數(shù)據(jù)豐富信息的基礎(chǔ)上降低數(shù)據(jù)維度是高光譜 圖像處理的重要技術(shù)問題之一。
[0024] 有監(jiān)督波段選擇方法由于使用標記樣本的標記信息,提高了波段選擇的性能。但 是出于標記樣本的難以獲取和對高光譜圖像實時處理的需要,有監(jiān)督波段選擇方法的應(yīng) 用范圍一直受到很大限制。為此本發(fā)明展開了研究與探索,提出了一種基于像素聚類的 wrapper式高光譜波段選擇方法。
[0025] 實施例1 :
[0026] 基于像素聚類的wrapper式高光譜波段選擇方法的具體步驟如下:
[0027] (1)輸入待波段選擇的高光譜圖像,假設(shè)圖像的原始波段數(shù)目為P,將該圖像轉(zhuǎn)換 為矩陣形式的高光譜數(shù)據(jù);
[0028] 本例中所選的高光譜圖像是通過機載可見光及紅外成像光譜儀AVIRIS獲取的印 第安納州高光譜圖像,該高光譜圖像中包含有16種不同種類的地物,其中有大豆、小麥、玉 米、草地、人工建筑、道路等等,這些地物分布在圖中的不同區(qū)域。該高光譜圖像包含220個 原始波段,即P = 220,波長范圍為0. 4 μ m-2. 5 μ m。該高光譜圖像中像素點數(shù)目為145*145, 則轉(zhuǎn)換為矩陣形式后的高光譜圖像數(shù)據(jù)大小為145*145*220。為了方面后續(xù)數(shù)據(jù)處理,對高 光譜圖像數(shù)據(jù)做歸一化操作,將高光譜圖像的光譜值歸一化到0-1之間。
[0029] (2)對高光譜數(shù)據(jù)做超像素(Superpixel)分割,共產(chǎn)生N個相關(guān)的圖像塊;
[0030] 本例中米用 SLIC(simple linear iterative clustering)算法對高光譜圖像做 超像素分割,具體步驟包括有:
[0031] 2. 1 :輸入想要得到的目標圖像塊數(shù)X,本例中目標圖像塊數(shù)為500,即X = 500 ;
[0032] 2. 2 :計算像素點i與像素點j的空間距離ds與譜域距離dp,其計算公式分別如 下:
[0035] 其中row# row」分別代表像素點i與像素點j的行坐標,column ;與column .j分 別代表像素點i與像素點j的列坐標;