基于低階互信息和光譜上下文波段選擇的高光譜分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于遙感圖像處理技術(shù)領(lǐng)域,具體是一種高光譜圖像的分類方法,用于土 壤調(diào)查、城市環(huán)境監(jiān)測(cè)、災(zāi)害評(píng)估等領(lǐng)域的地物區(qū)分和辨別。
【背景技術(shù)】
[0002] 高光譜分辨率遙感,是當(dāng)前遙感技術(shù)的前沿領(lǐng)域。它能夠在電磁波譜的可見(jiàn)光、近 紅外、中紅外以及熱紅外波段范圍內(nèi),獲取許多非常窄且光譜連續(xù)的圖像數(shù)據(jù)。高光譜遙感 圖像將反映地物屬性的光譜信息和揭示地物空間關(guān)系的圖像信息有效地結(jié)合在一起,具有 "圖譜合一"的特性。它能夠探測(cè)到在寬波段遙感中不可探測(cè)的物質(zhì),已經(jīng)受到了各國(guó)遙感 科學(xué)家的廣泛關(guān)注。
[0003] 高光譜遙感目前已在軍事領(lǐng)域和民用領(lǐng)域發(fā)揮著越來(lái)越重要的作用。對(duì)于高光 譜圖像而言,無(wú)論是軍事領(lǐng)域的應(yīng)用,還是民用領(lǐng)域的應(yīng)用,都是以精確的分類識(shí)別為基礎(chǔ) 的。高光譜圖像高的光譜分辨率,能夠?yàn)榈匚锏膭澐趾捅鎰e提供充足的信息,但同時(shí)給數(shù)據(jù) 的存儲(chǔ)和傳輸帶來(lái)了困難,也給數(shù)據(jù)的處理帶來(lái)了巨大的挑戰(zhàn)。最主要的是造成Hughes現(xiàn) 象。由于光譜波段的收集常常會(huì)受到變化的大氣、光照條件和傳感器噪聲的影響,使得高光 譜圖像會(huì)含有一些噪聲波段。此外,高光譜波段連續(xù)的屬性使得波段間往往具有很高的相 關(guān)性,這導(dǎo)致波段間存在一定的冗余。通常來(lái)說(shuō),去除這些冗余和噪聲信息,能夠提高高光 譜圖像處理的性能,同時(shí)避免Hughes現(xiàn)象和降低計(jì)算復(fù)雜度。所以,波段選擇是很有必要 的。
[0004] 在高光譜圖像中,類別的標(biāo)記工作常常需要高額的人力成本,耗費(fèi)大量的時(shí)間代 價(jià)。此外,人工的標(biāo)記有時(shí)因不同的工作環(huán)境,不同的時(shí)間,個(gè)人的偏好等因素的影響存在 著一定的誤差。所以,對(duì)于高光譜圖像而言,有時(shí)候存在完全缺乏類別標(biāo)簽信息的情況。由 于缺少樣本類別標(biāo)簽信息,使得波段的搜索缺乏了有力的辨別性指導(dǎo)。在這種情況下,如何 利用波段自身的屬性,降低波段的數(shù)目,同時(shí)盡可能保持高光譜圖像處理的性能,是一個(gè)具 有挑戰(zhàn)性的課題。
[0005] 通常來(lái)說(shuō),波段選擇方法是從原始波段中選擇出最有信息的波段子集。它可以分 為:基于排序的方法和基于聚類的方法。
[0006] 基于排序的方法中,有代表性的包括:基于約束的方法、基于拉普拉斯值的方法 Lscore、基于權(quán)重主成分的方法等。上述這些方法采用了不同的準(zhǔn)則,但是,它們的目的都 是選擇出單個(gè)富含信息量的波段。由于快速的排序過(guò)程使得這些方法的時(shí)間復(fù)雜度較低。 但是,單個(gè)富含信息量波段的組合,不一定能夠?qū)е乱粋€(gè)好的性能。因?yàn)檫@些具有高信息量 的波段之間會(huì)存在大量的冗余,很難提供一些額外的信息。
[0007] 基于聚類的方法,選擇的波段集合來(lái)自于不同的聚類簇,所以它們是低冗余的。同 時(shí),選擇出最具有代表性的波段,能夠使得選擇的波段集合盡可能地含有原有波段的信息。 有代表性的包括:基于最大信息壓縮指標(biāo)和k近鄰聚類的方法MIC、基于Ward連法的等級(jí) 聚類方法WaLuMI和基于模糊均值和遺傳算法的方法FCM-GA等。這些基于聚類的方法由于 在每個(gè)聚類簇中,是通過(guò)計(jì)算成對(duì)波段的相似性來(lái)選擇出最有代表性的波段,而忽略了每 個(gè)聚類簇中多個(gè)波段之間的相關(guān)性,因而不能選擇出最富含信息的波段。
[0008] 綜上,已有基于排序的方法和基于聚類的方法均存在波段選擇性能不佳,從而導(dǎo) 致分類精度差、時(shí)間復(fù)雜度高的問(wèn)題。
【發(fā)明內(nèi)容】
[0009] 本發(fā)明的目的在于克服上述已有方法的不足,提出一種基于低階互信息和光譜上 下文的高光譜波段選擇方法,以改善波段選擇性能,減小分類時(shí)間復(fù)雜度,提高分類精度。
[0010] 實(shí)現(xiàn)本發(fā)明的技術(shù)方案是:根據(jù)近鄰波段具有很高相關(guān)性的光譜波段上下文先驗(yàn) 信息的特性,利用統(tǒng)計(jì)的方法自動(dòng)去除噪聲波段,從而縮小波段空間搜索范圍;利用自信息 測(cè)量波段的信息含量,利用正則化互信息測(cè)量波段之間的冗余性,通過(guò)序列前向搜索方法 選擇出具有高信息含量低冗余性的波段子集并保留;針對(duì)保留的波段子集,利用分類器進(jìn) 行分類。具體步驟如下:
[0011] (1)將高光譜圖像各類樣本取少量作為訓(xùn)練樣本,其余作為測(cè)試樣本;
[0012] (2)對(duì)高光譜樣本集合進(jìn)行列歸一化處理;
[0013] (3)利用正則化互信息測(cè)度,統(tǒng)計(jì)訓(xùn)練樣本集合中波段與其鄰域波段之間的相關(guān) 性的均值,若其相關(guān)性的均值小于訓(xùn)練樣本集合中任意兩個(gè)波段相關(guān)性的均值,則視為噪 聲波段,進(jìn)行去除;
[0014] (4)利用序列前向搜索方法,從訓(xùn)練樣本集合中通過(guò)最大化單個(gè)波段的自信息, 和最小化波段與波段之間的正則化互信息,來(lái)選擇出具有高信息含量且低冗余性的波段子 集;
[0015] (5)在訓(xùn)練和測(cè)試樣本集中,僅僅保留選擇的波段,利用訓(xùn)練樣本對(duì)支撐矢量機(jī)進(jìn) 行學(xué)習(xí),利用學(xué)習(xí)出的支撐矢量機(jī)對(duì)測(cè)試樣本進(jìn)行分類,得到分類結(jié)果。
[0016] 本發(fā)明與現(xiàn)有技術(shù)相比具有如下優(yōu)點(diǎn):
[0017] 由于本發(fā)明利用光譜波段上下文之間的先驗(yàn)信息,自動(dòng)去除噪聲波段,縮小了波 段空間搜索范圍,克服了已有波段選擇方法因搜索空間過(guò)大引起的時(shí)間復(fù)雜度過(guò)高的問(wèn) 題,同時(shí)利用自信息和正則化互信息,使選擇出的波段子集具有低冗余性且具有高信息含 量。
[0018] 對(duì)比于已有的基于排序的方法,本發(fā)明利用正則化互信息能夠降低波段之間的冗 余性。對(duì)比于已有的基于聚類的方法,在本發(fā)明中,單個(gè)波段的自信息,也可以考慮為單個(gè) 波段與包含此波段的聚類簇中所有波段的互信息,能夠選擇出更具有信息量的波段子集。
[0019] 另一方面,本發(fā)明采用的自信息和互信息的測(cè)度,具有非線性、非參數(shù)和不需要預(yù) 先知道樣本數(shù)據(jù)分布的優(yōu)勢(shì),具有更廣闊的應(yīng)用前景。
【附圖說(shuō)明】
[0020] 圖1是本發(fā)明的實(shí)現(xiàn)流程圖;
[0021] 圖2是本發(fā)明仿真使用的IndianPines高光譜圖像的偽彩圖和分類參考圖;
[0022] 圖3是用本發(fā)明及四種對(duì)比方法對(duì)IndianPines高光譜圖像的分類結(jié)果圖。
【具體實(shí)施方式】
[0023] 參照?qǐng)D1,本發(fā)明的實(shí)施步驟如下:
當(dāng)前第1頁(yè)
1 
2