面向?qū)ο蟮倪b感影像單類分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及的是遙感影像分類技術(shù)領(lǐng)域,具體涉及一種面向?qū)ο蟮倪b感影像單類 分類方法。
【背景技術(shù)】
[0002] 近年來,多類分類方法層出不窮,而利用單類分類器提取遙感影像中的興趣類別, 相關(guān)的研究還較少。一個常用的單類分類器是單類支持向量機(jī)(〇116-〇138831^口01'1:-vector machine,0CSVM) dOCSVM方法在高維空間中,尋找一個能將興趣類別分開的具有最 大間隔的超平面,它的缺點(diǎn)是自由參數(shù)的選擇困難。在構(gòu)造分類器過程中,除了興趣類別樣 本外,未標(biāo)記樣本也提供了有用的信息,例如Transductive SVM(TSVM)方法,通過利用未標(biāo) 記樣本可以得到較好的分類性能,TSVM方法需要設(shè)定迭代次數(shù),而且需要已標(biāo)記樣本中的 正樣本和負(fù)樣本兩個方面。還有基于支持域描述的方法(support vector data description,SVDD),利用一個包含目標(biāo)數(shù)據(jù)的盡可能小的球體進(jìn)行判別,由小樣本訓(xùn)練就 能得到較好的分類效果,SVDD方法的主要缺點(diǎn)也是參數(shù)設(shè)置比較復(fù)雜。Li et al.提出了 PUL(positive and unlabeled learning)算法進(jìn)行單類分類,在高分辨率遙感影像中進(jìn)行 了實驗,分別提取了影像中的各個單類,包括市區(qū)、樹木、草地、水體、裸地。Li et al.提出 的遙感影像單類分類的MAXENT方法,在訓(xùn)練過程中只要求正樣本,實驗結(jié)果表明其單類分 類效果優(yōu)于0CSVM方法。MAXENT方法選擇具有最大熵的分布形式作為興趣類別的數(shù)據(jù)分布, 是一種參數(shù)化的方法,對于不規(guī)則的興趣類別分布形式,效果受到影響。
【發(fā)明內(nèi)容】
[0003] 針對現(xiàn)有技術(shù)上存在的不足,本發(fā)明目的是在于提供一種面向?qū)ο蟮倪b感影像單 類分類方法,簡化了樣本選擇過程,可以有效實現(xiàn)遙感影像單類信息的提取。
[0004] 為了實現(xiàn)上述目的,本發(fā)明是通過如下的技術(shù)方案來實現(xiàn):面向?qū)ο蟮倪b感影像 單類分類方法,包括以下步驟:(1)將類別空間劃分為興趣類別和非興趣類別二類;(2)根據(jù) 圖像空間的鄰近性選擇興趣類別和非興趣類別訓(xùn)練樣本;(3)根據(jù)特征空間的鄰近性選擇 興趣類別和非興趣類別的部分訓(xùn)練樣本;(4)在兩類樣本的基礎(chǔ)上進(jìn)行最近鄰分類,提取興 趣類別。
[0005] 本發(fā)明以圖像分割后獲得的圖像對象為基本的操作單元,而不是基于單個象素操 作。圖像對象的生成綜合考慮了鄰近像素的光譜和空間信息,將鄰近像素合并成勻質(zhì)的斑 塊,克服了基于像素方法的不足。而且,通過圖像分割獲得的圖像對象具有一定的屬性,不 僅包含了光譜信息,還包括紋理、大小、形狀、緊致性、上下文等從圖像中提取出的附加信 息,在不增加外來信息的情況下增加了分類的依據(jù),從而提高分類的精度,使分類結(jié)果更加 接近目視判別的結(jié)果。當(dāng)遙感影像被分割為對象后,還可以建立對象之間的拓?fù)潢P(guān)系,從而 有可能實現(xiàn)地理信息系統(tǒng)中的空間分析。
[0006] 本發(fā)明的有益效果:基于最近鄰方法,提取影像中的興趣類別。面向?qū)ο蠓椒ㄔ诜?割階段結(jié)合了影像的空間信息和光譜信息,增加了分類依據(jù)。另一方面,面向?qū)ο蠓椒▽υ?影像數(shù)據(jù)集進(jìn)行優(yōu)化,減小了類內(nèi)方差,增加了類間可分性,使得單類分類器分類精度提 高。根據(jù)最近鄰方法的特點(diǎn),將類別劃分為興趣類別和非興趣類別即可,并根據(jù)圖像空間和 特征空間鄰近性選擇非興趣類別的部分訓(xùn)練樣本,簡化了分類過程。
【附圖說明】
[0007] 下面結(jié)合附圖和【具體實施方式】來詳細(xì)說明本發(fā)明;
[0008] 圖1(a)為本發(fā)明的實施例1的TM遙感影像實驗數(shù)據(jù)1圖;
[0009]圖1(b)為本發(fā)明的實施例1的TM遙感影像實驗數(shù)據(jù)2圖;
[0010]圖2(a)為本發(fā)明的不透水表面提取的圖像空間樣本選擇圖;
[0011] 圖2(b)為本發(fā)明的不透水表面提取的提取結(jié)果圖;
[0012] 圖3(a)為本發(fā)明的水體提取的圖像空間樣本選擇圖;
[0013] 圖3(b)為本發(fā)明的水體提取的提取結(jié)果圖;
[0014] 圖4(a)為本發(fā)明的水體提取的圖像和特征空間樣本選擇;
[0015] 圖4(b)為本發(fā)明的水體提取的提取結(jié)果圖。
【具體實施方式】
[0016] 為使本發(fā)明實現(xiàn)的技術(shù)手段、創(chuàng)作特征、達(dá)成目的與功效易于明白了解,下面結(jié)合
【具體實施方式】,進(jìn)一步闡述本發(fā)明。
[0017] 本【具體實施方式】采用以下技術(shù)方案:面向?qū)ο蟮倪b感影像單類分類方法,包括以 下步驟:(1)將類別空間劃分為興趣類別和非興趣類別二類;(2)根據(jù)圖像空間的鄰近性選 擇興趣類別和非興趣類別訓(xùn)練樣本;(3)根據(jù)特征空間的鄰近性選擇興趣類別和非興趣類 別的部分訓(xùn)練樣本;(4)在兩類樣本的基礎(chǔ)上進(jìn)行最近鄰分類,提取興趣類別。
[0018] 本【具體實施方式】的面向?qū)ο笥跋穹诸愔?,分割后每個影像對象內(nèi)的象素均值作為 數(shù)據(jù)點(diǎn),而且分割過程使用的參數(shù)可以控制分割后影像對象的平均大小,類似在一定的分 布總體抽取一定數(shù)量的樣本,然后計算樣本均值的分布。假設(shè)一定的數(shù)據(jù)集(一定分布的總 體),已知該分布的期望和方差,從這個總體中抽出一部分(m個)數(shù)據(jù),構(gòu)成一個樣本,計算 出一個樣本平均值,這樣有放回的無數(shù)次抽選樣本,將會產(chǎn)生無數(shù)個樣本平均數(shù),而且這些 樣本平均數(shù)具有自己的分布形式。在抽樣比非常小的情況下,無放回抽樣與有放回抽樣的 誤差基本是相同的,可以利用有放回抽樣的誤差計算公式來代替無放回的情況,所以影像 分割后的數(shù)據(jù)集分布形式可以類似的計算出來。
[0019]對任意分布的總體X,期望為EX,方差為DX,有放回抽選樣本,容量為m,設(shè)樣本均值 為隨機(jī)變量y,則
[0020] y = (xi+X2+---+Xm)/m
[0021] 其中,^^2,一&為總體的!11個有放回抽樣,那么7的期望為
[0023]由于 Dy = Ey2_(Ey)2^Ey!^
[0027] 由此可得,抽取的樣本均值的期望與總體期望相等,方差為總體方差的1/m。而且 統(tǒng)計理論表明,不論總體的分布如何,只要樣本容量m足夠大(大于30),樣本均值的分布總 會趨向于正態(tài)分布。在面向?qū)ο笥跋穹诸愔?,一般都能保證實際分割的影像對象足夠大,可 以包含從幾十到上百個象素,因此,樣本均值數(shù)據(jù)的分布形式可以很好的近似正態(tài)分布。面 向?qū)ο蠓椒▽λ杏跋癜邏K組成的數(shù)據(jù)集進(jìn)行分類,由于各類別的期望值不變,類內(nèi)方差 為總體方差的1/m,且服從正態(tài)分布,因此,各個類別之間的類間距離不變,類內(nèi)方差減小, 從而類別可分性增加,有利于單類分類中閾值參數(shù)的選擇。
[0028] 在單類信息提取訓(xùn)練樣本選擇中,首先選擇興趣類別的代表區(qū)域,而對非興趣類 另IJ,則選擇與興趣類別鄰近的部分樣本進(jìn)行訓(xùn)練,目的是找到興趣類別與非興趣類別的邊 界,通過邊界來區(qū)分興趣類別與非興趣類別。由遙感影像的空間臨近效應(yīng),相互鄰近的像素 特征往往相近。因此,選擇興趣類別樣本的同時,在圖像空間中,選擇與興趣類別鄰近的非 興趣類別樣本,而不需要對非興趣類別代表點(diǎn)進(jìn)行完全選擇,使樣本選擇過程變得簡單。 此外,在實際應(yīng)用中,將圖像空間和特征空間的鄰近性結(jié)合起來進(jìn)行訓(xùn)練樣本的選擇,在無 需了解影像中所有類別劃分的情況下,實現(xiàn)感興趣類別的有效提取。
[0029]在圖像空間中,選擇相互鄰近的興趣類別和非興趣類別圖像對象,提高了學(xué)習(xí)效 率和可靠性。在特征空間中,由于分割后形成的圖像對象都有屬性值,根據(jù)屬性值選擇與興 趣類別相近的非興趣類別圖像對象作為訓(xùn)練樣本。兩種方法都不考慮影像中的類別劃分情 況,只根據(jù)空間和特征鄰近性進(jìn)行樣本選擇,二者結(jié)合起來實現(xiàn)興趣類別和非興趣類別的 有效區(qū)分。
[0030] 實施例1:實驗圖像為兩幅TM遙感影像,如圖1所示,其中圖1 (a)包含不透水表面、 草地、林地和水體四個類別,圖1 (b)也包含四個類別:不透水表面、水體、耕地和村莊。
[0031] 采用最近鄰方法提取單類信息,在興趣類別樣本的周圍選擇非興趣類別樣本,這 種方法減少了樣本選擇的工作量。對圖1 (a)中的TM實驗影像,以不透水面為興趣類別,訓(xùn)練 樣本的選擇如圖2(a)所示,其中白色區(qū)域為興趣類別樣本,周圍的黑色區(qū)域為非興趣類別 樣本,圖2(b)為分類結(jié)果。單類信息提取的精度評價指標(biāo)一般為生產(chǎn)精度和用戶精度,生產(chǎn) 精度指興趣類別的正確分類數(shù)占參考數(shù)據(jù)中該類別象素總數(shù)的比例,而用戶精度指興趣類 別正確分類數(shù)占分為該類象素總數(shù)的比例。實驗數(shù)據(jù)1中不透水面單類提取的生產(chǎn)精度和 用戶精度分別為85.3%和90.9%。
[0032] 而對于有些情況,這種訓(xùn)練樣本的選擇方法不能很好的將特征相近的興趣類別與 非興趣類別分開。例如在圖1(b)所示的實驗影像中提取水體類別,圖3(a)為水體類別及其 周圍選擇的訓(xùn)練樣本,白色區(qū)域為水體,黑色區(qū)域為其他類別。圖3(b)為分類結(jié)果,可以看 出,由于陰影的特征與水體相似,有些陰影區(qū)域被錯分為水體。
[0033] 為了避免基于圖像空間的樣本選擇產(chǎn)生特征相近目標(biāo)的錯分,將圖像空間和特征 空間結(jié)合起來。由于在面向?qū)ο蠓椒ㄖ校瑘D像分割后每個對象都有各自的屬性特征值,從而 可以選擇與興趣類別光譜特征相似的非興趣類別訓(xùn)練樣本。如圖4(a)所示,增加圖像下方 的陰影區(qū)域作為非興趣類別樣本,圖4(b)為分類結(jié)果??梢钥闯觯@種特征空間和圖像空間 樣本選擇相結(jié)合的方法可以克服單一方法的不足,錯分區(qū)域明顯減少,本實驗中水體的單 類提取生產(chǎn)精度和用戶精度分別為99.0%和98.0%,分類效果好。
[0034]以上顯示和描述了本發(fā)明的基本原理和主要特征和本發(fā)明的優(yōu)點(diǎn)。本行業(yè)的技術(shù) 人員應(yīng)該了解,本發(fā)明不受上述實施例的限制,上述實施例和說明書中描述的只是說明本 發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會有各種變化和改進(jìn),這些變 化和改進(jìn)都落入要求保護(hù)的本發(fā)明范圍內(nèi)。本發(fā)明要求保護(hù)范圍由所附的權(quán)利要求書及其 等效物界定。
【主權(quán)項】
1.面向?qū)ο蟮倪b感影像單類分類方法,其特征在于,包括以下步驟:(1)將類別空間劃 分為興趣類別和非興趣類別二類;(2)根據(jù)圖像空間的鄰近性選擇興趣類別和非興趣類別 訓(xùn)練樣本;(3)根據(jù)特征空間的鄰近性選擇興趣類別和非興趣類別的部分訓(xùn)練樣本;(4)在 兩類樣本的基礎(chǔ)上進(jìn)行最近鄰分類,提取興趣類別。
【專利摘要】本發(fā)明公開了一種面向?qū)ο蟮倪b感影像單類分類方法,它涉及遙感影像分類技術(shù)領(lǐng)域。包括以下步驟:(1)將類別空間劃分為興趣類別和非興趣類別二類;(2)根據(jù)圖像空間的鄰近性選擇興趣類別和非興趣類別訓(xùn)練樣本;(3)根據(jù)特征空間的鄰近性選擇興趣類別和非興趣類別的部分訓(xùn)練樣本;(4)在兩類樣本的基礎(chǔ)上進(jìn)行最近鄰分類,提取興趣類別。本發(fā)明簡化了樣本選擇過程,可以有效實現(xiàn)遙感影像單類信息的提取。
【IPC分類】G06K9/62
【公開號】CN105550695
【申請?zhí)枴緾N201510880838
【發(fā)明人】薄樹奎, 李向, 荊永菊, 鄭小東, 金秋春, 李玲玲
【申請人】鄭州航空工業(yè)管理學(xué)院
【公開日】2016年5月4日
【申請日】2015年11月27日