專利名稱:基于并行稀疏譜聚類的sar圖像分割方法
技術(shù)領(lǐng)域:
本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,涉及SAR圖像分割,可用于雷達目標檢測和目標 識別。
背景技術(shù):
合成孔徑雷達SAR具有全天時、全天候的探測與偵察能力。它利用脈沖壓縮技術(shù) 獲得高的距離分辨率,利用合成孔徑原理提高方位分辨率,從而相比真實孔徑雷達在遙感 領(lǐng)域具有獨特的優(yōu)勢。對SAR圖像的理解和解譯屬于圖像處理范疇,還涉及信號處理,模式 識別及機器學習等眾多學科。SAR圖像分割作為SAR圖像處理的關(guān)鍵環(huán)節(jié)之一,在國防和民 用領(lǐng)域正受到越來越廣泛的關(guān)注?,F(xiàn)有的SAR圖像分割方法大致可以分為基于區(qū)域的分割 方法和基于邊界的分割方法,如閾值分割、形態(tài)學的方法、聚類的方法、及隨機場的方法等。其中,基于聚類的SAR圖像分割方法,是將SAR圖像中相似的區(qū)域盡量劃分成一 類,將不相似的區(qū)域劃分在不同的類別中。已經(jīng)有很多成熟的聚類算法被用到SAR圖像分 割中。作為一門新興學科,結(jié)合譜圖理論的譜聚類算法充分發(fā)掘了數(shù)據(jù)的成對點相似特性, 通過圖的拉普拉斯矩陣特征分解達到降維目的,使得聚類結(jié)果更加穩(wěn)健。但是,當數(shù)據(jù)規(guī)模 n比較大的時候,譜聚類算法需要計算大小為nXn的相似矩陣,并計算相應拉普拉斯矩陣 的特征分解問題,其計算的時間復雜度和空間復雜度分別為0(n3)和0(n2),不能有效地對 包含大規(guī)模數(shù)據(jù)的SAR圖像進行分割。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述已有技術(shù)的不足,提出了一種基于并行稀疏譜聚類的 SAR圖像分割方法,以減小譜聚類的時間和空間復雜度,從而能夠有效地對包含大規(guī)模數(shù)據(jù) 的SAR圖像進行分割。為實現(xiàn)上述目的,本發(fā)明包括以下步驟(1)對待分割的SAR圖像進行3層平穩(wěn)小波變換,圖像像素點總個數(shù)為n,通過下 式對每個像素點提取出10維子帶能量特征,構(gòu)成大小為nX 10的輸入數(shù)據(jù)樣本E 其中,MXN為利用滑動窗口確定的子帶大小,這里取值為16X16,coef(i,j)為平 穩(wěn)小波子帶中第i行第j列的系數(shù)值;(2)配置MATLAB7. 8R2009 (a)版本的并行計算環(huán)境;(3)進行并行任務(wù)劃分,使用并行任務(wù)調(diào)度器將像素點總個數(shù)為n的輸入數(shù)據(jù)樣 本均衡劃分到P個處理器上,遇到不能整除的情況則將剩余的數(shù)據(jù)樣本存放到最后一個節(jié) 占上-(4)在各個處理器節(jié)點上分布式地計算n/p個數(shù)據(jù)樣本到其他所有數(shù)據(jù)樣本之間 的歐氏距離,得到距離矩陣;
(5)對距離矩陣的每一列按照從小到大順序進行排序,并根據(jù)下面的公式計算分 塊相似矩陣S 其中,Xl,...,xn表示n個數(shù)據(jù)樣本點,| |X「Xj| |2表示排序后的距離矩陣,o表示 尺度參數(shù),對相似矩陣只保留每個數(shù)據(jù)樣本與周圍離它最相近的t個數(shù)據(jù)樣本之間的值, 其他位置都稀疏化成0值;(6)將各個處理器節(jié)點計算得到的相似矩陣通過并行任務(wù)調(diào)度器收集到主節(jié)點 上,并排成一行匯聚成一個大小為nXn的稀疏相似矩陣W ;(7)根據(jù)稀疏相似矩陣W計算對角線元素為< 的度矩陣D,進而計算出拉普
拉斯矩陣L = D_1/2WD_"2,利用MATLAB的eigs函數(shù)對拉普拉斯矩陣進行特征分解;(8)將特征分解后得到的特征值進行排序,得到前K個最大特征值1
其對應的特征向量表示成vW, ,/;(9)將得到的特征向量排成一行,構(gòu)造出特征向量矩陣U = [v1,v2,…,/],并對
其歸一化,得到規(guī)范化特征向量矩陣 (10)將規(guī)范化特征向量矩陣Y的每一行看成是空間□ K中的一個點,用K-均值聚 類算法將其聚為K類,并使用正交初始化尋找初始聚類中心;(11)根據(jù)得到的聚類中心,使用歐氏距離測度把SAR圖像中的所有像素點劃分到 不同的類別中,每一個像素點獲得一個聚類標簽,將這些聚類標簽重新組合成和原圖像尺 寸相同的矩陣,將矩陣元素作為分割結(jié)果圖像的灰度值并顯示出來,從而得到最終分割結(jié)合.本發(fā)明與現(xiàn)有的技術(shù)相比具有以下優(yōu)點1)本發(fā)明利用MATLAB并行計算環(huán)境,設(shè)計用于SAR圖像分割的并行稀疏譜聚類方 法,能夠有效解決現(xiàn)有譜聚類技術(shù)運算量過大的問題;2)本發(fā)明利用稀疏矩陣存儲譜聚類的大規(guī)模相似矩陣,能夠有效解決現(xiàn)有譜聚類 技術(shù)在存儲空間上的局限性;3)本發(fā)明相對已有的SAR圖像分割技術(shù),設(shè)計的并行稀疏譜聚類方法能夠充分發(fā) 掘SAR圖像的內(nèi)在信息,獲得更好的分割效果仿真實驗結(jié)果表明,本發(fā)明提出的并行稀疏譜聚類方法能夠有效地應用于SAR圖 像分割,并進一步應用于雷達目標檢測和目標識別。
圖1是本發(fā)明的實現(xiàn)流程圖;圖2是本發(fā)明的MATLAB并行計算環(huán)境示意圖;圖3是本發(fā)明仿真使用的集群環(huán)境示意圖;圖4是本發(fā)明與現(xiàn)有K-均值聚類算法和Nystrtoi近似譜聚類算法應用于 ChinaLake機場SAR圖像分割的對比實驗結(jié)果圖;圖5是本發(fā)明與現(xiàn)有K-均值聚類算法和Nystr6m近似譜聚類算法應用于廈門鼓浪嶼SAR圖像分割的對比實驗結(jié)果圖; 圖6是本發(fā)明與現(xiàn)有K-均值聚類算法和Nystrdm近似譜聚類算法應用于瑞士湖區(qū) SAR圖像分割的對比實驗結(jié)果圖;圖7是本發(fā)明對瑞士湖區(qū)SAR圖像分割的并行加速比和效率示意圖。
具體實施例方式參照圖1,本發(fā)明的具體實施過程如下步驟1.提取待分割SAR圖像的特征。SAR圖像不僅數(shù)據(jù)量大,在成像過程中不同的地物有不同的后向發(fā)射和散射特性, 從而具有豐富的幅度、相位、極化和紋理信息,并且,圖像固有的相干斑噪聲對于分割性能 直接產(chǎn)生影響,因此,有必要在圖像分割前對SAR圖像進行紋理分析,提取有效的紋理特征 進行聚類。在以上分析基礎(chǔ)上,先對待分割的SAR圖像進行3層平穩(wěn)小波變換,圖像像素點總 個數(shù)為n,通過下式對每個像素點提取出10維子帶能量特征,構(gòu)成大小為nX 10的輸入數(shù)據(jù) 樣本E: 其中,MXN為利用滑動窗口確定的子帶大小,這里取值為16X16,coef(i, j)為 平穩(wěn)小波子帶中第i行第j列的系數(shù)值,這樣,對于大小為256X256的SAR圖像,就構(gòu)成 65536X10的矩陣作為并行稀疏譜聚類方法的輸入數(shù)據(jù)。步驟2.配置MATLAB并行計算環(huán)境。本步驟的具體實施參照圖2如下2a)在如圖3所示的高性能64刀片集群環(huán)境中安裝MATLAB 7. 8R2009 (a)版本的 并行計算工具箱和分布式計算服務(wù)器;2b)在各個集群節(jié)點上用mdce start命令啟動分布式計算服務(wù)器;2c)在集群的主節(jié)點上用startjobmanager命令啟動并行任務(wù)調(diào)度器;2d)在各個處理器節(jié)點上用startworker命令啟動工作進程。步驟3.并行任務(wù)劃分。3a)根據(jù)配置好的MATLAB并行計算環(huán)境,使用f indResource命令指定配置好的任 務(wù)調(diào)度器;3b)使用該任務(wù)調(diào)度器,用createjob命令創(chuàng)建作業(yè);3c)在所創(chuàng)建的作業(yè)中,將規(guī)模為n的輸入數(shù)據(jù)樣本用createTask命令均衡劃分 到P個處理器上,遇到不能整除的情況則將剩余的數(shù)據(jù)樣本存放到最后一個節(jié)點上;3d)使用submit命令提交作業(yè),然后用waitForState命令將各個任務(wù)安排到相應 的任務(wù)隊列里等待各個處理器節(jié)點的執(zhí)行;3e)各個處理器節(jié)點分布式地計算n/p個數(shù)據(jù)樣本到其他所有數(shù)據(jù)樣本之間的歐 氏距離,獲得距離矩陣,對得到的距離矩陣的每一列按照從小到大順序進行排序,并根據(jù)下 面的公式將其轉(zhuǎn)換成分塊相似矩陣S
6
其中,Xl,...,xn表示n個數(shù)據(jù)樣本點,| |Xi_Xj| |2表示排序后的距離矩陣,o表示 尺度參數(shù),對相似矩陣只保留每個數(shù)據(jù)樣本與周圍離它最相近的t個數(shù)據(jù)樣本之間的值, 其他位置都稀疏化成0值。步驟4.主節(jié)點任務(wù)收集。用getAllOutputArguments命令將p個處理器節(jié)點的計算結(jié)果收集到主節(jié)點上, 并匯聚成一個大小為nXn的完整的稀疏相似矩陣W = [Sp Sp],其中Sji = 1,..., P)表示P個處理器節(jié)點計算得到的分塊相似矩陣。步驟5.計算拉普拉斯矩陣特征分解問題。根據(jù)這個稀疏相似矩陣W計算對角線元素為
度矩陣D,進而計算出拉普拉 斯矩陣L = D_1/2WD_"2,利用MATLAB的eigs函數(shù)對這個大規(guī)模稀疏拉普拉斯矩陣進行特征 分解,得到前K個最大特征值1 =入≥入2≥…≥,以及這些特征值對應的特征向量步驟6.對歸一化的特征向量矩陣進行K-均值聚類。將得到的特征向量排成一行,構(gòu)造出特征向量矩陣U= [vSv2,…,/],對其歸一
化得到規(guī)范化特征向量矩陣
,將規(guī)范化特征向量矩陣Y的每一行看成是空
間口 K中的一個點,用K-均值聚類算法將其聚為K類,并使用正交初始化尋找初始聚類中 心。步驟7.輸出分割結(jié)果。根據(jù)得到的聚類中心,使用歐氏距離測度把SAR圖像中的所有像素點劃分到不同 的類別中,每一個像素點獲得一個聚類標簽,將這些聚類標簽重新組合成和原圖像尺寸相 同的矩陣,將矩陣元素作為分割結(jié)果圖像的灰度值并顯示出來,從而得到最終分割結(jié)果。
本發(fā)明的效果可以通過如下仿真實驗進行驗證。對比實驗中給出本發(fā)明的并行稀疏譜聚類方法,以及現(xiàn)有的K-均值聚類算法和 NyStr6m近似譜聚類算法的分割結(jié)果。其中,現(xiàn)有的K-均值聚類和NystrSm近似譜聚類選取 的是10次實驗視覺效果最好的分割結(jié)果,本發(fā)明的并行稀疏譜聚類方法由于結(jié)果比較穩(wěn) 定選取的是1次實驗的分割結(jié)果。NystrSm近似譜聚類選取的樣本點個數(shù)為100,尺度參數(shù) s = 0. 2。并行稀疏譜聚類選取的最近鄰數(shù)為100,尺度參數(shù)s = 0. 05。使用以上三種分割方法對3幅SAR圖像進行分割的對比實驗結(jié)果如下1)對Ku波段SAR圖像的分割結(jié)果如圖4所示,其中圖4 (a)為美國加利福尼亞州的China Lake機場3米分辨率的Ku波段SAR圖像, 圖像尺寸為400 X 400,包括跑道、空地和機場建筑物三類地物。圖4(b)為現(xiàn)有的K-均值聚類方法的分割結(jié)果,可見跑道上有很多細小的斑點被 誤分成其他兩類。圖4(c)為現(xiàn)有的Nystriim近似方法的分割結(jié)果,盡管機場跑道的區(qū)域一致性得到 了改善,但是右上方的機場建筑物則被分割得支離破碎,在實際應用中不利于準確進行目 標識別。
圖4(d)為本發(fā)明的并行稀疏譜聚類方法的分割結(jié)果,它準確給出了完整的跑道 和建筑物的輪廓,并且,對于三岔形跑道中央密布的路網(wǎng),相比其他兩種算法獲得了更加完 整的區(qū)域。2)對C-波段SAR圖像的分割結(jié)果如圖所示,其中圖5 (a)為一幅RadarSAT-2衛(wèi)星拍攝的中國廈門鼓浪嶼地區(qū)C_波段SAR圖像,極 化方式為HV極化,截取圖像塊尺寸為400X400。圖5(b)為現(xiàn)有的K-均值聚類方法的分割結(jié)果,它受島嶼上地形分布干擾太大,造 成陸地部分很多誤分,延伸進水域的一些陸地與島嶼之間被零散地分隔開來。圖5 (c)為現(xiàn)有的Nystr6m近似方法的分割結(jié)果,盡管比K-均值的結(jié)果有些改善, 但還是未能獲得完整的一塊區(qū)域。圖5(d)是本發(fā)明的并行稀疏譜聚類方法的分割結(jié)果,可以清晰地看出鼓浪嶼和 廈門島一樣被完整劃分成陸地部分,并且對于一些與水域?qū)Ρ榷炔町愝^小的海岸線也能和 島嶼部分保持較好的連接度。3)對X-波段SAR圖像的分割結(jié)果如圖6所示,其中圖 6 (a)為 Space Radar Laboratory Missions 的一幅 1994 年瑞士一湖區(qū)的 3 視 X-波段SAR圖像,圖像尺寸為512X512,包含三類地物湖泊、城區(qū)和山地。圖6 (b)為現(xiàn)有的K-均值聚類方法的分割結(jié)果,它很好地將湖泊劃分出來,但是, 在左右兩邊的山地地區(qū)同時也存在了嚴重的錯分成水域的情況。圖6 (c)為現(xiàn)有的Nystr6m近似方法的分割結(jié)果,它對山地區(qū)域的分割情況有所改 善,但是城區(qū)和山地有很多的混淆。圖6(d)為本發(fā)明的并行稀疏譜聚類方法的分割結(jié)果,它在三種算法中最佳,它不 僅將湖泊沿岸準確提取出來,在山地區(qū)域沒有絲毫誤分成湖泊的情況,并且,城區(qū)的分割結(jié) 果保持了較好的區(qū)域完整性。因此,本發(fā)明的并行稀疏譜聚類方法被用來分割這幅SAR圖 像是十分合適的。在本發(fā)明的并行計算中,對于p個處理器,Ts表示在串行計算機上算法從開始到結(jié) 束所需要的時間,TP表示在并行計算機上算法從開始到最后一個處理器完成任務(wù)所需要的 時間,加速比SP和效率EP分別定義為SP = TS/TP, EP = Ss/P。加速比衡量的是并行算法的 執(zhí)行速度相對于串行算法的執(zhí)行速度加快了多少倍。效率衡量的是單個處理器的計算能力 被有效利用的比率。用本發(fā)明的并行稀疏譜聚類方法對圖6(a)所示的瑞士湖區(qū)SAR圖像進行分割,其 并行加速比曲線和并行效率曲線分別如圖7(a)和圖7(b)所示。其中,所用到的處理器個 數(shù)最多達到了 42個。從圖7可以看出,由于本發(fā)明的并行稀疏譜聚類方法采用MATLAB分布式計算,除 了任務(wù)的調(diào)度和數(shù)據(jù)共享的傳輸之外,各個處理器之間并不需要進行通信,因此在處理器 個數(shù)小于24時可以得到近乎線性的加速比。而當處理器個數(shù)上升到42個時,由于大規(guī)模 稀疏矩陣傳輸以及多處理器任務(wù)調(diào)度耗時增加,使得加速比有所下降,但是還是保持著上 升的趨勢。在效率方面,小于32個處理器的并行情況下,效率都可以達到90%以上,表明各 個處理器節(jié)點得到了相對充分的利用。處理器較多時,消息阻塞和消息延時降低了單個處 理器的利用率。
權(quán)利要求
一種基于并行稀疏譜聚類的SAR圖像分割方法,包括以下步驟(1)對待分割的SAR圖像進行3層平穩(wěn)小波變換,圖像像素點總個數(shù)為n,通過下式對每個像素點提取出10維子帶能量特征,構(gòu)成大小為n×10的輸入數(shù)據(jù)樣本E <mrow><mi>E</mi><mo>=</mo><mfrac> <mn>1</mn> <mrow><mi>M</mi><mo>×</mo><mi>N</mi> </mrow></mfrac><munderover> <mi>Σ</mi> <mrow><mi>i</mi><mo>=</mo><mn>1</mn> </mrow> <mi>M</mi></munderover><munderover> <mi>Σ</mi> <mrow><mi>j</mi><mo>=</mo><mn>1</mn> </mrow> <mi>N</mi></munderover><mo>|</mo><mi>coef</mi><mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo></mrow><mo>|</mo> </mrow>其中,M×N為利用滑動窗口確定的子帶大小,這里取值為16×16,coef(i,j)為平穩(wěn)小波子帶中第i行第j列的系數(shù)值;(2)配置MATLAB7.8R2009(a)版本的并行計算環(huán)境;(3)進行并行任務(wù)劃分,使用并行任務(wù)調(diào)度器將像素點總個數(shù)為n的輸入數(shù)據(jù)樣本均衡劃分到p個處理器上,遇到不能整除的情況則將剩余的數(shù)據(jù)樣本存放到最后一個節(jié)點上;(4)在各個處理器節(jié)點上分布式地計算n/p個數(shù)據(jù)樣本到其他所有數(shù)據(jù)樣本之間的歐氏距離,得到距離矩陣;(5)對距離矩陣的每一列按照從小到大順序進行排序,并根據(jù)下面的公式計算分塊相似矩陣S <mrow><mi>S</mi><mo>=</mo><mi>exp</mi><mrow> <mo>(</mo> <mo>-</mo> <mfrac><msup> <mrow><mo>|</mo><mo>|</mo><msub> <mi>x</mi> <mi>i</mi></msub><mo>-</mo><msub> <mi>x</mi> <mi>j</mi></msub><mo>|</mo><mo>|</mo> </mrow> <mn>2</mn></msup><msup> <mrow><mn>2</mn><mi>σ</mi> </mrow> <mn>2</mn></msup> </mfrac> <mo>)</mo></mrow><mo>,</mo> </mrow>i,j=1,...,n其中,x1,...,xn表示n個數(shù)據(jù)樣本點,||xi-xj||2表示排序后的距離矩陣,σ表示尺度參數(shù),對相似矩陣只保留每個數(shù)據(jù)樣本與周圍離它最相近的t個數(shù)據(jù)樣本之間的值,其他位置都稀疏化成0值;(6)將各個處理器節(jié)點計算得到的相似矩陣通過并行任務(wù)調(diào)度器收集到主節(jié)點上,并排成一行匯聚成一個大小為n×n的稀疏相似矩陣W;(7)根據(jù)稀疏相似矩陣W計算對角線元素為的度矩陣D,進而計算出拉普拉斯矩陣L=D-1/2WD-1/2,利用MATLAB的eigs函數(shù)對該拉普拉斯矩陣進行特征分解;(8)對特征分解后得到的特征值進行排序,得到前K個最大特征值1=λ1≥λ2≥…≥λK,其對應的特征向量表示成v1,v2…,vK;(9)將得到的特征向量排成一行,構(gòu)造出特征向量矩陣U=[v1,v2,…,vK],并對其歸一化,得到規(guī)范化特征向量矩陣(10)將規(guī)范化特征向量矩陣Y的每一行看成是空間口K中的一個點,用K-均值聚類算法將其聚為K類,并使用正交初始化尋找初始聚類中心;(11)根據(jù)得到的聚類中心,使用歐氏距離測度把SAR圖像中的所有像素點劃分到不同的類別中,每一個像素點獲得一個聚類標簽,將這些聚類標簽重新組合成和原圖像尺寸相同的矩陣,將矩陣元素作為分割結(jié)果圖像的灰度值并顯示出來,從而得到最終分割結(jié)果。FSA00000086656300013.tif,FSA00000086656300021.tif
2.根據(jù)權(quán)利要求1所述的一種基于并行稀疏譜聚類的SAR圖像分割方法,其中步驟 (2)所述的配置MATLAB7. 8R2009 (a)版本的并行計算環(huán)境,按照如下步驟進行2a)在高性能集群環(huán)境上安裝MATLAB7. 8R2009 (a)版本的并行計算工具箱和分布式計 算服務(wù)器;2b)在各個集群節(jié)點上啟動分布式計算服務(wù)器;2c)在集群的主節(jié)點上啟動并行任務(wù)調(diào)度器; 2d)在各個處理器節(jié)點上啟動工作進程。
3.根據(jù)權(quán)利要求1所述的一種基于并行稀疏譜聚類的SAR圖像分割方法,其中步驟 (3)所述的并行任務(wù)劃分,按照如下步驟進行3a)根據(jù)步驟(2)配置好的MATLAB并行計算環(huán)境,指定所使用的并行任務(wù)調(diào)度器; 3b)使用該并行任務(wù)調(diào)度器創(chuàng)建作業(yè);3c)在所創(chuàng)建的作業(yè)中,將像素點總個數(shù)為η的輸入數(shù)據(jù)樣本均衡劃分到P個處理器 上,遇到不能整除的情況則將剩余的數(shù)據(jù)樣本存放到最后一個節(jié)點上;3d)提交作業(yè),并將各個任務(wù)安排到相應的任務(wù)隊列里等待各個處理器節(jié)點的執(zhí)行。
全文摘要
本發(fā)明公開了一種基于并行稀疏譜聚類的SAR圖像分割方法,它涉及圖像處理技術(shù)領(lǐng)域,主要解決已有譜聚類技術(shù)在解決大規(guī)模SAR圖像分割應用上的局限性問題。其實現(xiàn)過程是1)對待分割的SAR圖像提取特征;2)配置MATLAB并行計算環(huán)境;3)將任務(wù)劃分到各個處理器節(jié)點,計算分塊稀疏相似矩陣;4)并行任務(wù)調(diào)度器收集計算結(jié)果并匯聚成完整的稀疏相似矩陣;5)求解拉普拉斯矩陣并進行特征分解;6)對經(jīng)過歸一化后的特征向量矩陣進行K-均值聚類;7)輸出SAR圖像分割結(jié)果。本發(fā)明能夠有效克服已有譜聚類技術(shù)在運算量和存儲空間上的瓶頸問題,對大規(guī)模SAR圖像進行分割效果顯著,適用于SAR圖像目標檢測和目標識別。
文檔編號G01S13/90GK101853491SQ20101016149
公開日2010年10月6日 申請日期2010年4月30日 優(yōu)先權(quán)日2010年4月30日
發(fā)明者莊雄, 張佳, 朱虎明, 李陽陽, 焦李成, 王爽, 緱水平, 鐘樺 申請人:西安電子科技大學