專利名稱:利用流形譜聚類進行圖像分割的方法
利用流形譜聚類進行圖像分割的方法技術(shù)領(lǐng)域
本發(fā)明屬于圖像處理領(lǐng)域,涉及一種圖像分割方法,具體地說是一種基于譜聚 類的圖像分割的方法,可用于目標(biāo)檢測與跟蹤及對衛(wèi)星拍攝地形地貌照片的處理。
背景技術(shù):
數(shù)字圖像處理技術(shù)是一個跨學(xué)科的領(lǐng)域。隨著計算機科學(xué)技術(shù)的不斷發(fā)展,圖 像處理和分析逐漸形成了自己的科學(xué)體系,圖像分割是一種重要的圖像處理技術(shù),可應(yīng) 用于醫(yī)學(xué)圖像檢測病灶區(qū)、精密零件表面缺陷檢測、處理衛(wèi)星拍攝的地形地貌照片等。 圖像分割是從圖像處理到圖像分析的關(guān)鍵步驟,可以說,圖像分割結(jié)果的好壞直接影響 對圖像的理解。為后續(xù)工作有效進行而將圖像劃分為若干個有意義區(qū)域的技術(shù)稱為圖像 分割,也就是將圖像中具有特殊涵義的不同區(qū)域區(qū)分開來,這些區(qū)域是互相不交叉的, 每一個區(qū)域都滿足特定區(qū)域的一致性,在分割結(jié)果中1)每個區(qū)域的像素有著相同的特 征;2)不同子區(qū)域具有不同的特征,并且它們沒有公共特征;3)分割的所有子區(qū)域的并 集就是原來的圖像;4)各個子集是連通的區(qū)域。
圖像分割的方法和種類有很多,常見的分割技術(shù)閾值分割技術(shù),微分算子邊 緣檢測,區(qū)域增長技術(shù),聚類分割技術(shù)?;趫D論的譜聚類圖像分割方法是近年來國際 上分割領(lǐng)域的研究熱點。
基于圖論的譜聚類圖像分割,是將圖像映射為帶權(quán)無向圖,把像素點視作節(jié) 點,利用最小剪切準則得到圖像的最佳分割。該方法本質(zhì)上將圖像分割問題轉(zhuǎn)化為最優(yōu) 化問題。Shi和MaKk在2000年根據(jù)譜圖理論建立了 2_way劃分的Normailized-Cut (Ncut) 的目標(biāo)函數(shù),設(shè)計了用于圖像分割的算法,由此發(fā)展出一系列算法,如Ng和Weiss提出 的k-way劃分的Ncut算法;Meila和Shi提出的Normalized Cut與隨機游動關(guān)系的算法; Zlia和Dhillon提出的基于二分圖的算法等。在這些經(jīng)典的算法中都采用高斯相似函數(shù)計 算相似度矩陣W,當(dāng)數(shù)據(jù)量變大時,即數(shù)據(jù)點個數(shù)η很大時,相似度矩陣W為Μη的矩 陣,存儲和特征分解都很困難,尤其對于一副圖像更大,同時高斯相似函數(shù)中存在人為 手動設(shè)置尺度參數(shù)的問題。為了解決此問題Fowlkes et al.提出了基于Nystrom逼近的譜 聚類應(yīng)用于圖像分割,此方法首先隨機選擇1(1 = η)個樣本點,計算一個小的相似度矩陣 S其大小為1*1,對其進行特征分解,然后采用Nystrom方法逼近原始相似度矩陣W。這 個方法雖然克服了數(shù)據(jù)量大的問題,但是依舊存在一些問題1)隨機選擇樣本點使得它 結(jié)果不穩(wěn)定;2)它依舊采用了高斯相似函數(shù)計算相似度,必須人為手動設(shè)置尺度參數(shù); 3)計算樣本點和圖像中剩余的像素點之間的相似度時時間很長,使得分割效率較低。發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述已有技術(shù)的不足,提出一種利用流形譜聚類進行圖 像分割的方法,使得分割的結(jié)果穩(wěn)定,并且不需要人為設(shè)置尺度參數(shù),提高分割的效率。
為實現(xiàn)上述目的,本發(fā)明將流形距離測度的思想引入譜聚類圖像分割方法中, 其具體步驟包括如下
1)輸入一幅圖像,在Luv顏色空間中獲得該圖像的顏色特征& =汍,fu,fv}, 并提取圖像的十維小波紋理特征Fw= {f1; f2,…,f10},采用特征融合的方法將顏色特征 與小波紋理特征進行融合,得到圖像的融合特征F = aFc+bFw,其中F的每一行表示一個 像素點的特征,&、fu、^分別表示Luv顏色空間的亮度分量L、色度坐標(biāo)分量U和色度 坐標(biāo)分量ν的特征,ζ表示小波紋理特征Fw第丨維特征i= 1,2...10, a和b分別表示顏 色特征和紋理特征所占的比例,且a+b = 1 ;
2)采用分水嶺算法將該輸入圖像預(yù)分割為流形集M = {m^l,,將各流形所包含的 所有像素點特征的平均值分別作為各流形的流形特征,得到流形特征集MF = 0/1^,其 中流形In1為分水嶺算法預(yù)分割輸入圖像所得的第i個區(qū)域,i = l,2,…,η, η表示流 形集M的大小,mf為第i個流形In1的流形特征;
3)計算每個流形特征mf與其他流形特征之間的歐氏距離,依據(jù)每個流形特征 mf的所有歐氏距離尋找到流形In1Wk個近鄰流形,構(gòu)造一個大小為n*n的距離矩陣d =[Ci1Jn,n當(dāng)?shù)趈個流形ιη是m,的k個近鄰中的一個時,d^等于mf與mf之間的歐氏距 離,否則為-1表示不連通,且4 = 0,其中i,j = 1, 2,…,η, k的取值范圍為5到 9之間的整數(shù),依據(jù)不同的圖像人為選擇不同的值,C^表示距離矩陣d的第i行第j列元 素,Ci11表示距離矩陣d的第i行第i列元素;
4)使用弗洛伊德算法根據(jù)距離矩陣d計算各個流形之間的最短路徑,得到大小 為nh的流形距離矩陣D = [D1Jnin,其中Dy為第i個流形In1與第j個流形ιη之間的最 短路徑,其中Du表示流形距離矩陣D中第i行第j列元素;
5)構(gòu)造大小為nh相似度矩陣W= [WiJlrtl,其中第i行第j列的元素 巧=7^,(〃力,對角線元素為0,且當(dāng)Dy = -1 Wwy等于0 ;η
6)計算度矩陣A= [A1Jnv其中第i行第i列的元素Λ =Σ%,其它元素為0,;=1并計算歸一化拉普拉斯矩陣L = A-172WA-172 ;
7)對歸一化拉普拉斯矩陣L進行特征分解,并取該L的前K個最大的特征值對 應(yīng)的特征向量構(gòu)造譜矩陣V= {Vl,v2,…,νκ},其中K為人為設(shè)定的圖像分類數(shù),V1 為L的第i個特征向量i= 1,2,...K;
8)計算歸一化譜矩陣Y = [Y1Jnv其中第i行第j列的元素& =C^X2)1/2’\ 為譜矩陣V的第i行第i列的元素;
9)采用k均值聚類算法,將歸一化譜矩陣Y的各行聚為K類,得到聚類標(biāo)簽向 量C = {C, }二,其中C1表示第i個流形嗎被分割為第C1類,Cie{l,2,...K};
10)將圖像中有相同標(biāo)簽的流形分配同一種顏色,輸出分割后的圖像。
本發(fā)明與現(xiàn)有基于Nystrom逼近的譜聚類應(yīng)用于圖像分割方法相比具有如下優(yōu)占.^ \\\ ·
1.本發(fā)明采用分水嶺算法預(yù)分割圖像得到流形集,比Nystrom隨機選擇樣本點穩(wěn)定,因此本發(fā)明能夠得到穩(wěn)定的分割結(jié)果。
2.本發(fā)明采用了流形距離度量兩個流形之間的距離,根據(jù)流行距離計算相似度 矩陣,不需要人為設(shè)置尺度參數(shù)。
3.本發(fā)明的相似度矩陣是一個稀疏矩陣,特征分解時耗費的時間短,因此本發(fā) 明的分割效率高。
圖1是本發(fā)明的流程圖2是本發(fā)明仿真試驗中使用的原始測試圖像sea、airplane和fox ;
圖3是現(xiàn)有基于Nystrom逼近譜聚類方法和本發(fā)明在三幅測試圖像上的分割結(jié)^ ο具體實施方式
參照圖1,本發(fā)明的實現(xiàn)步驟包括如下
步驟1,提取輸入圖像的融合特征。
(1.1)輸入一幅圖像,提取該圖像在Luv顏色空間的顏色特征,所有像素點的顏 色特征構(gòu)成一個大小為N*3的矩陣{&,fu,fv},其每一行代表一個像素的顏色特 征,N表示該圖像的像素點數(shù),&、fu、^分別表示Luv顏色空間的亮度分量L、色度坐 標(biāo)分量u和色度坐標(biāo)分量ν的特征;
(1. 采用三層小波分解,在每個像素點上獲得10維的紋理特征,所有像素點的 紋理特征構(gòu)成一個大小為N*10的矩陣Fw= {f1; f2,…,f10},其每一行代表一個像素點 的紋理特征, 表示第i維紋理特征i = 1,2...10 ;
(1.3)計算輸入圖像的融合特征F = aFc+bFw,融合特征F的大小為N*13,其 每一行代表一個像素點的融合特征,a和b分別表示顏色特征和紋理特征所占的比例,且 a+b = 1,仿真實驗中 a = 0.6,b = 0.4。
步驟2,預(yù)分割輸入圖像得到流形集。
0.1)采用分水嶺算法預(yù)分割輸入圖像,得到每個像素點的標(biāo)簽,標(biāo)簽范圍從1 到n,尋找具有相同標(biāo)簽的像素點,并把有相同標(biāo)簽的像素點合并為一個區(qū)域,給每個過 分割區(qū)域制定一個標(biāo)號嗎,i = l,2,…,η,獲得輸入圖像的流形集M =化仏,η表示 流形集M的大小。本步驟也可以采用均值飄逸算法獲得輸入圖像的流形集,分水嶺算法 參見文獻Roerdink, J., Meijster, A.: The watershed transform Definitions, algorithms andparallelization strategies .Fundamental Informaticae 41 (2000) 187-228 ;
(2.2)取每個流形包含的像素點的融合特征的平均值,將這個平均值作為對應(yīng)流 形嗎的流形特征mf,構(gòu)成流形集的流形特征集MF = 1^/1^,其大小為n*13。
步驟3,計算距離矩陣。
(3.1)把流形特征集MF中每一行看做一個點,依據(jù)歐式距離公式 Cllj=^mfn -mfll\ +\\mf'2 -m尸2『+…+ ||<13 -<13『,計算每一個點與剩下n_l點的歐 氏距離,構(gòu)成大小為nh的距離矩陣d = [ ]η,η,且dn = 0,其中表示距離矩陣d的第i行第j列元素,Ci11表示距離矩陣d的第i行第i列元素,i,j = 1, 2,…,η;
(3.2)在距離矩陣d的每一行中尋找前k個非零最小值,把當(dāng)前行剩下的n-k-1 個非零元素用-1替代,k的取值范圍為5到9之間的整數(shù),依據(jù)不同的圖像人為選擇不 同的值,在仿真實驗中k= 7。
步驟4,計算流形距離矩陣。
使用弗洛伊德算法在距離矩陣d中計算各個流形之間的最短路徑,得到大小 為nh的流形距離矩陣D = [Dy]n.n,流形距離矩陣D的每一行有k個非零元素,有n-k 個-1,其中E^表示流形距離矩陣D中第i行第j列元素。本步驟也可以采用迪克斯特拉算 法獲得流行距離矩陣D,弗洛伊德算法參見文獻R.W.Floyd,"Algorithm 97 Shortest Path, ” Commun.ACM, vol.5, p.345, 1962。
步驟5,計算相似度矩陣。
構(gòu)造一個大小為nh相似度矩陣W = [W1Jnin,其中Wij表示第i行第j列的元 素,%=7^",(/^>相似度矩陣%的對角線元素為0,且當(dāng)Du = -I時Wij等于0。
步驟6,計算度矩陣和歸一化拉普拉斯矩陣。
構(gòu)造一個大小為nh的度矩陣A = [A1Jnin,并構(gòu)造歸一化拉普拉斯矩陣L = A-172WA-172, i,j = l,2,...η,其中A11表示第i行第i列的元素,4,=Σ;=Λ,度矩陣A的非對角線元素為0。
步驟7,構(gòu)造譜矩陣。
對歸一化拉普拉斯矩陣L進行特征分解,取該L的前K個最大的特征值對應(yīng)的特 征向量組成譜矩陣V={Vl,v2,…,vK}, V1為該L的第i個特征向量i= 1,2,...K, K為人為設(shè)置的輸入圖像的分割類別數(shù)。
步驟8,計算歸一化譜矩陣。
對步驟7得到的譜矩陣V進行歸一化,得到歸一化譜矩陣Y = [Υ ]η,η,其中Yij 表示歸一化譜矩陣Y第i行第j列的元素,& = vVlQlv^m'Vli表示譜矩陣V的第i行第j 列的元素,i,j = 1,2,...η。
步驟9,獲得標(biāo)簽向量。
把步驟8所得的歸一化譜矩陣Y的每一行看做一個數(shù)據(jù)點,則共有η個數(shù) 據(jù)點,將這η個數(shù)據(jù)點作為k均值聚類算法的輸入,得到這η個數(shù)據(jù)點的標(biāo)簽向量 C = k^,其中Ci表示第i個數(shù)據(jù)點被聚為第Ci類,及第i個流形mi被分割到第C1 類,C1 e {1,2,...K}, i = 1, 2,…,n, k 均值聚類算法參見文獻G.P.Babu and M.N.Murty, ” Simulated annealingfor selecting initialseeds in the k—means algorithm, ” Ind. J.PureAppl.Math, vol.25pp.85-94, 19940
步驟10,輸出分割后的圖像。
將圖像中相同標(biāo)簽的流形分割為同一類,每類分配不同的顏色,得到分割圖 像,輸出分割后的圖像。
本發(fā)明的效果可以通過以下實驗進一步說明
1.仿真條件
在CPU 為 pentium(R) 4、3.OOGHZ、內(nèi)存 1G、WINDOWS XP 系統(tǒng),Matlab7.1平臺上進行了仿真。
2.仿真內(nèi)容
本發(fā)明在Berkeley segmentation database上驗證其效果。選擇了圖2中的三幅圖像用作測試,并與現(xiàn)有的基于Nystrom逼近的譜聚類方法進行了對比。三幅測試圖像分 別是圖2(a)所示的sea圖像、圖2(b)所示的airplane圖像和圖2(c)所示的fox的圖像, 在所有實驗中令k = 7,在sea圖像中K = 3,在airplane圖像中K = 2,在fox的圖像K=3。
對圖2 (a)所示的sea圖像利用本發(fā)明和基于Nystrom逼近的譜聚類方法進行圖像 分割,結(jié)果分別如圖3(a)和圖3(b),從如圖3(a)可見,本發(fā)明分割后的天空與海面的分 界線清晰,海面平滑,人的輪廓明顯,帆船的帆清晰可見,更接近圖2 (a)所示的sea圖像 的目標(biāo)意義;從圖3(b)可見現(xiàn)有基于Nystrom逼近的譜聚類方法分割的天空和海面的分 界線已經(jīng)失真,海面存在很多噪聲,人的輪廓很模糊,帆船的帆已經(jīng)被分割為兩部分, 失去了圖2(a)所示的sea圖像的目標(biāo)意義。
對圖2 (b)所示的airplane圖像利用本發(fā)明和基于Nystrom逼近的譜聚類方法進 行圖像分割,結(jié)果分別如圖3 (c)和圖3(d),從圖3(c)可見,本發(fā)明分割后的飛機輪廓清 晰,機身的星形與機尾的字母也被分割出來,天空和飛機明顯是兩類,無交疊區(qū)域,更 具圖2(b)所示的airplane圖像的分割意義;從圖3(d)可見,現(xiàn)有基于Nystrom逼近的譜 聚類方法分割的飛機的輪廓已經(jīng)失真,機身的星形也被分割到機體,機尾的字母也被分 割到了機身,天空中的一部分被分割為與飛機同一類,失去了圖2(b)所示的airplane圖像 的分割意義。
對圖2 (c)所示的fox圖像利用本發(fā)明和基于Nystrom逼近的譜聚類方法進行圖像 分割,結(jié)果如圖3(e)和圖3(f),從圖3(e)可見,本發(fā)明分割后的樹林與雪地的分界線清 晰,樹林區(qū)域平滑,雪地?zé)o噪聲,狼的輪廓細節(jié)明顯可見,更接近圖2(c)所示的fox圖 像的目標(biāo)意義;從圖3(f)可見現(xiàn)有基于Nystrom逼近的譜聚類方法分割的樹林與雪地的 分界線模糊,樹林的一部分與狼被分割為同一類,雪地中存在噪聲,失去了圖2(c)所示 的fox圖像的目標(biāo)意義。
權(quán)利要求
1.一種利用流形譜聚類進行圖像分割的方法,包括如下步驟1)輸入一幅圖像,在Luv顏色空間中獲得該圖像的顏色特征Fc=汍,fu,fv},并提 取圖像的十維小波紋理特征Fw= {f1; f2,…,f10},采用特征融合的方法將顏色特征與小 波紋理特征進行融合,得到圖像的融合特征F = aFc+bFw,其中F的每一行表示一個像素 點的特征,&、fu、^分別表示Luv顏色空間的亮度分量L、色度坐標(biāo)分量U和色度坐標(biāo) 分量ν的特征,ζ表示小波紋理特征Fw第丨維特征i= 1,2...10,a和b分別表示顏色特 征和紋理特征所占的比例,且a+b = 1 ;2)采用分水嶺算法將該輸入圖像預(yù)分割為流形集M= {m^l,,將各流形所包含的所有像素點融合特征的平均值分別作為各流形的流形特征,得到流形特征集MF = fm/1^1,其中流形In1為分水嶺算法預(yù)分割輸入圖像所得的第i個區(qū)域,i = l,2,…,η, η表示流 形集M的大小,mf為第i個流形In1的流形特征;3)計算每個流形特征mf與其他流形特征之間的歐氏距離,依據(jù)每個流形特征mf的 所有歐氏距離尋找到流形In1Wk個近鄰流形,構(gòu)造一個大小為n*n的距離矩陣d=[cy n*n當(dāng)?shù)趈個流形珥是In1Wk個近鄰中的一個時,dy等于mf與mf之間的歐氏距離,否 則為-1表示不連通,且+ = 0,其中i,j = 1, 2,…,η, k的取值范圍為5到9之間 的整數(shù),依據(jù)不同的圖像人為選擇不同的值,dy表示距離矩陣d的第i行第j列元素,du 表示距離矩陣d的第i行第i列元素;4)使用弗洛伊德算法根據(jù)距離矩陣d計算各個流形之間的最短路徑,得到大小為n*n 的流形距離矩陣D = [D1Jnin,其中Dy為第i個流形In1與第j個流形ιη之間的最短路 徑,其中Du表示流形距離矩陣D中第i行第j列元素;5)構(gòu)造大小為n*n相似度矩陣W= [WJn,n,其中第i行第j列的元素巧[!^,(〃力,對角線元素為0,且當(dāng)Dy = -1 WWy等于0 ;η6)計算度矩陣A=[Α ]η*η,其中第i行第i列的元素Λ =Σ%,其它元素為0,并計;=1算歸一化拉普拉斯矩陣L = A-172WA-172 ;7)對歸一化拉普拉斯矩陣L進行特征分解,并取該L的前K個最大的特征值對應(yīng)的 特征向量構(gòu)造譜矩陣V={Vl,v2,…,νκ},其中K為人為設(shè)定的圖像分類數(shù),χ為L 的第i個特征向量i = 1,2,...K;8)計算歸一化譜矩陣Y= [YiJlrtl,其中第i行第j列的元素&為譜矩陣V的第i行第i列的元素;9)采用k均值聚類算法,將歸一化譜矩陣Y的各行聚為K類,得到聚類標(biāo)簽向量 匸=仏戊1,其中(;1表示第1個流形1111被分割為第(;1類,Cie{l,2,...K};10)將圖像中有相同標(biāo)簽的流形分配同一種顏色,輸出分割后的圖像。
2.根據(jù)權(quán)利要求書1所述的利用流形譜聚類進行圖像分割的方法,其特征在于步 驟1)所述的采用特征融合的方法將顏色特征與小波紋理特征進行融合,是利用F = aFc+bFw,計算輸入圖像的融合特征F,其中設(shè)置a = 0.6,b = 0.4。
3.根據(jù)權(quán)利要求書1所述的利用流形譜聚類進行圖像分割的方法,其特征在于步驟2)所述的采用分水嶺算法將輸入圖像預(yù)分割為流形集M= Ir^1,按如下步驟進行(2a)采用經(jīng)典的分水嶺算法預(yù)分割輸入圖像,得到每個像素點的標(biāo)簽,標(biāo)簽范圍從1 到η ;(2b)尋找具有相同標(biāo)簽的像素點,并把有相同標(biāo)簽的像素點合并為一個區(qū)域,給每 個過分割區(qū)域制定一個標(biāo)號叫,i=l,2,…,η,獲得輸入圖像的流形集M = 。 4.根據(jù)權(quán)利要求書1所述的利用流形譜聚類進行圖像分割的方法,其特征在于步驟3)所述的依據(jù)每個流形特征mf的所有歐氏距離尋找到流形In1的k個近鄰流形,按如下 步驟進行(3a)把流形特征集MF中每一行看作一個點,依據(jù)歐式距離 Cllj=^mfn -mfll\ +\\mf'2 -m尸2『+…+ ||<13 -<13『,計算每一個點與剩下n_l點的歐氏距離,mf有13維特征,將這n-1個歐氏距離作為距離矩陣J = 的第i行,且dy =0, i, j = 1,2, ..., η ;(3b)從距離矩陣d的每一行尋找前k個非零最小值,將這k個非零最小值所對應(yīng)的距 離矩陣d中列的標(biāo)簽值作為當(dāng)前行標(biāo)簽i對應(yīng)流形In1的k個近鄰流形,其中設(shè)置k = 7, i = 1, 2, ...η。
全文摘要
本發(fā)明公開了一種利用流形譜聚類進行圖像分割的方法,主要解決現(xiàn)有方法的存儲規(guī)模大、計算效率和分割精度低的問題。實現(xiàn)步驟為(1)輸入一幅圖像,提取輸入圖像的顏色和紋理特征,并利用分水嶺算法獲得輸入圖像的流形集;(2)計算流形特征集,構(gòu)造距離矩陣,由弗洛伊德算法得流行距離矩陣;(3)計算相似度矩陣,進而構(gòu)造度矩陣以及歸一化拉普拉斯矩陣;(4)特征分解歸一化拉普拉斯矩陣,進而構(gòu)造譜矩陣;(5)對譜矩陣進行歸一化,得到歸一化譜矩陣,由k均值算法得流形集的標(biāo)簽向量,輸出分割結(jié)果。本發(fā)明存儲規(guī)模小、計算效率和分割精度高,可應(yīng)用于醫(yī)學(xué)圖像檢測病灶區(qū)、精密零件表面缺陷檢測、衛(wèi)星拍攝的地形地貌照片的處理。
文檔編號G06T7/00GK102024262SQ20111000158
公開日2011年4月20日 申請日期2011年1月6日 優(yōu)先權(quán)日2011年1月6日
發(fā)明者公茂果, 劉娟, 尚榮華, 李陽陽, 沈彥波, 焦李成, 王爽, 鄭喆坤, 馬文萍 申請人:西安電子科技大學(xué)