專利名稱:基于均值偏移和k均值聚類技術(shù)的圖像對象提取方法
技術(shù)領(lǐng)域:
本發(fā)明涉及利用圖像語義處理圖像的方法。
背景技術(shù):
隨著信息時代的飛速發(fā)展,基于內(nèi)容的圖像檢索技術(shù)(CBIR)的研究成果已經(jīng)轉(zhuǎn)化為應(yīng)用技術(shù),而且日益增長的應(yīng)用需求反過來推動其研究向更高層次發(fā)展。CBIR的基本思路是從圖像中提取底層的視覺特征——顏色,紋理,形狀等,然后基于這些特征將用戶查詢的圖像與數(shù)據(jù)庫中的圖像進(jìn)行相似度的衡量,其中圖像的相似性判斷建立在視覺特征的相似性上。然而計算機自動提取的圖像視覺特性與人所理解的圖像內(nèi)容存在很大的不同。人們判斷圖像的相似性并非建立在圖像的顏色、形狀等特性上,而是主要根據(jù)圖像的內(nèi)容含義來判斷圖像是否符合自己的需要。因此傳統(tǒng)的CBIR (基于內(nèi)容的圖像檢索)系統(tǒng)的檢索結(jié)果往往不盡如人意。這就需要一些高層次的概念,這些概念包含了人對圖像所描述的對象、事件以及所表達(dá)的感情等內(nèi)容的理解,這就是圖像所具有的語義特征,即圖像的高層語義知識。當(dāng)這些高層語義知識被提取出來后,才能給包括圖像檢索在內(nèi)的一系列應(yīng)用提供更加令人滿意的結(jié)果?,F(xiàn)有的檢索領(lǐng)域,與圖像檢索領(lǐng)域相對應(yīng)的文本檢索領(lǐng)域已經(jīng)發(fā)展發(fā)展得相當(dāng)成熟,而對圖像的語義的提取,便是將圖像信息轉(zhuǎn)化為與語義相關(guān)的文本信息,從而將文本到圖像的檢索轉(zhuǎn)化為文本到文本的檢索,能夠大大地提高圖像檢索的準(zhǔn)確率。圖像語義的提取,其前提是提取圖像中的對象。即將圖像中各個具有特定特征的區(qū)域劃分并提取出來的過程,現(xiàn)有的圖像對象提取方法大致分為三類基于區(qū)域的方法,基于網(wǎng)格的方法,基于輪廓的方法。基于區(qū)域的方法適用于大規(guī)模顏色相近的區(qū)域,而對具有復(fù)雜內(nèi)部細(xì)節(jié)的對象無法有效識別?;诰W(wǎng)格的方法適用于具有規(guī)則形狀的對象,而對其他形狀的對象無法有效識別。本發(fā)明的基本思路是基于區(qū)域分割的圖像對象提取算法。均值偏移(Mean Shift)算法是一種特征空間聚類算法,它的一個突出優(yōu)點是不須人為地設(shè)置過多的參數(shù),從而得到較為客觀的圖像分割結(jié)果。均值偏移算法的實質(zhì)對圖像進(jìn)行平滑處理,消除圖像對象內(nèi)部的細(xì)節(jié),從而得到圖像的對象信息。K均值聚類(K-Means)算法是另一種廣泛使用的聚類分析方法。K均值聚類算法用于圖像分割具有直觀、快速、易于實現(xiàn)的特點。然而K均值聚類算法的問題是需要確定聚類數(shù)目,并且初始聚類中心的選擇對分類結(jié)果具有較大的影響。同時,K均值聚類僅僅使用了圖像的顏色信息而沒有利用空間信息,因而圖像中的細(xì)節(jié)信息會對聚類的結(jié)果產(chǎn)生較大的影響,從而使得K均值聚類往往無法得到需要的結(jié)果。
發(fā)明內(nèi)容
本發(fā)明目的是以基于區(qū)域的方法為基礎(chǔ),將均值偏移和K均值聚類算法相結(jié)合, 結(jié)合二者的優(yōu)點,并規(guī)避了二者的缺點。從而得到擁有較好結(jié)果的圖像對象提取結(jié)果,亦即提高識別的準(zhǔn)確度。本 發(fā)明的技術(shù)方案是基于均值偏移和K均值聚類技術(shù)的圖像對象提取方法,使用均值偏移進(jìn)行圖像平滑
均值偏移算法是一種不用直接計算梯度找到模式點的算法,在圖像平滑過程中,就是要找到不同色彩的聚類點;圖像中的每一個像素經(jīng)過色彩空間轉(zhuǎn)換表達(dá)了一個像素的空間信息和色彩信息,其中,空間位置和色彩均相近的像素,在五維色彩空間中也相近;因而,在五維空間中進(jìn)行聚類,得到的結(jié)果重新映射到圖像中,即可得到達(dá)到所需要的效果。對于任何需要處理的圖像對象,1)先應(yīng)用meanshift算法進(jìn)行圖像平滑消除細(xì)節(jié)信息,分別用xi和zi (i=l,…,η)表示原始和平滑后的圖像像素點,利用meanshift算法對圖像進(jìn)行平滑處理;對于每一個像素點
1-1)初始化j=l,且使yj+1=xi,像素點的空間;
1-2)在以yj為中心的超球體中計算實現(xiàn)窗口中心的偏移,直到滿足收斂條件; 這里的超球體是指經(jīng)過色彩空間的轉(zhuǎn)化可以在5維特征空間中獲得的很多點,每個點對應(yīng)圖像中的一個像素,表達(dá)了該像素所有的信息,亦即空間位置和色彩信息;
1-3)給Zi賦值,將收斂的色彩賦給當(dāng)前像素Zi=(Xi,y。。nv);
這里是均值偏移算法的固定步驟,yconv是坐標(biāo)點,就是當(dāng)前像素Zi的坐標(biāo)。2) k均值聚類
在進(jìn)行過meanshift平滑操作后,圖像的細(xì)節(jié)部分將被忽略,從而將均值偏移的結(jié)果按照其顏色信息進(jìn)行進(jìn)一步聚類;在這一步驟中,要求聚類過程具有較高的效率并且能夠滿足一定的精度要求;運用k均值聚類算法對圖像進(jìn)行分割;
K均值聚類的算法如下應(yīng)用K-means算法進(jìn)行顏色聚類以提取圖像中的對象信息,
2-1)對于大小為mχ η的圖像,構(gòu)建大小為(m χ η) * 3的矩陣,其中每一行為對應(yīng)像素點三個通道的顏色信息;
2-2)從m χ η個數(shù)據(jù)對象中隨機選取K個對象作為初始聚類中心; 2-3)根據(jù)每個聚類對象的均值(中心為對象),計算每個對象與這些中心對象的距離, 并根據(jù)最小距離重新對相應(yīng)的對象進(jìn)行劃分; 2-4)重新計算每一個有變化的聚類的均值;
2-5)迭代運行2-3)和2-4)直到每個聚類的變化程度滿足收斂條件。對于K均值聚類的結(jié)果,將m χ η個輸入硬劃分為K個不同的聚類,使得其結(jié)果滿足條件相同聚類中的對象相似度較高;不同聚類中的對象相似度較低。從直觀上而言各個聚類本身盡可能的緊湊,而各個聚類之間盡可能地分開。通過對均值偏移和k均值聚合算法的結(jié)合使用,結(jié)合了各自的優(yōu)點,規(guī)避了各自的缺點,能夠在較短時間內(nèi)對圖像中對象提取得到較好的效果。實驗結(jié)果表明,對于對比度較高和較低的對象均能夠得到較好的提取效果,得到與人眼相近的效果。均值偏移(Mean Shift)算法是一種特征空間聚類算法,它的一個突出優(yōu)點是不須人為地設(shè)置過多的參數(shù),從而得到較為客觀的圖像分割結(jié)果。均值偏移算法的實質(zhì)對圖像進(jìn)行平滑處理,消除圖像對象內(nèi)部的細(xì)節(jié),從而得到圖像的對象信息。K均值聚類(K-Means)算法是另一種廣泛使用的聚類分析方法。K均值聚類算法用于圖像分割具有直觀、快速、易于實現(xiàn)的特點。然而K均值聚類算法的問題是需要確定聚類數(shù)目,并且初始聚類中心的選擇對分類結(jié)果具有較大的影響。同時,K均值聚類僅僅使用了圖像的顏色信息而沒有利用空間信息,因而圖像中的細(xì)節(jié)信息會對聚類的結(jié)果產(chǎn)生較大的影響,從而使得K均值聚類往往無法得到需要的結(jié)果。本發(fā)明的有益效果是當(dāng)一圖為原始圖片(400x300),則單純利用meanshift算法進(jìn)行對象提取的結(jié)果,可以看出,對于對比度較高的對象可以得到較好的效果,而對于對比度較低的對象,由于meanshift本身屬于軟聚類,因此算法的結(jié)果和原圖并未有太大的區(qū)另IJ,然而對于測試圖片,無論效果如何,均需花費8s左右的時間。如果為單純利用k-means 算法進(jìn)行圖像提取的結(jié)果,可見對于對比度較低的圖片能夠得到較好的效果,而對于對比度較高的對象,由于細(xì)節(jié)信息過多,反而沒有很好的效果。如果算法首先用meanshift算法消除了對象的細(xì)節(jié)信息,然后利用k-means算法進(jìn)行進(jìn)一步的操作,由結(jié)果可以看出,兩種算法的結(jié)合使用彌補了對方不適用的范圍,能夠得到較好的效果,同時由于meanshift算法僅僅用了較小的參數(shù)進(jìn)行了濾波操作,整個算法的時間在Is以下。本發(fā)明將均值偏移和K均值聚類算法相結(jié)合,結(jié)合二者的優(yōu)點,并規(guī)避了二者的缺點。算法的時間短且效率高。從而得到擁有較好結(jié)果的圖像對象提取結(jié)果。
圖1是本發(fā)明的處理流程圖。
具體實施例方式1、顏色空間的選擇
為了使得算法的結(jié)果和人眼視覺分析的結(jié)果盡量一致,本發(fā)明采用CIE提出的LUV均勻彩色模型。在該色彩空間中,L分量表示顏色的亮度,而U分量和V分量均表示顏色的色差。2、應(yīng)用meanshift算法進(jìn)行圖像平滑消除細(xì)節(jié)信息分別用xi和zi (i=l,…, η)表示原始和平滑后的圖像,利用meanshift算法對圖像進(jìn)行平滑處理。對于每一個像素占.
1)初始化」=1,且使7丄l=xi
2)在以yj為中心的超球體中計算實現(xiàn)窗口中心的偏移,直到滿足收斂條件
3)給zi賦值,將收斂的色彩賦給當(dāng)前像素zi=(xi,yconv)
3、應(yīng)用K-means算法進(jìn)行顏色聚類以提取圖像中的對象信息 1)對于大小為m χ η的圖像,構(gòu)建大小為(m χ η) * 3的矩陣,其中每一行為對應(yīng)像素點三個通道的顏色信息。2) Wmxn個數(shù)據(jù)對象中隨機選取K個對象作為初始聚類中心
3)根據(jù)每個聚類對象的均值(中心對象),計算每個對象與這些中心對象的距離,并根據(jù)最小距離重新對相應(yīng)的對象進(jìn)行劃分
4)重新計算每一個有變化的聚類的均值
5)迭代運行3)和4)直到每個聚類的變化程度滿足收斂條件。
權(quán)利要求
1.基于均值偏移和K均值聚類技術(shù)的圖像對象提取方法,其特征是先使用均值偏移進(jìn)行圖像平滑1)先應(yīng)用meanshift算法進(jìn)行圖像平滑消除細(xì)節(jié)信息,分別用xi和zi(i=l,…,η) 表示原始和平滑后的圖像像素點,利用meanshift算法對圖像進(jìn)行平滑處理;對于每一個像素點1-1)初始化j=l,且使yj+1=xi, 像素點的空間;1 - 2 ) 在以y j為中心的超球體中計算實現(xiàn)窗口中心的偏移,直到滿足收斂條件;這里的超球體是指經(jīng)過色彩空間的轉(zhuǎn)化可以在5維特征空間中獲得的很多點,每個點對應(yīng)圖像中的一個像素, 表達(dá)了該像素所有的信息,亦即空間位置和色彩信息;1-3)給Zi賦值,將收斂的色彩賦給當(dāng)前像素Zi=(Xi,y。。nv);這里是均值偏移算法的固定步驟,yconv是坐標(biāo)點,就是當(dāng)前像素Zi的坐標(biāo);2)k均值聚類在進(jìn)行過meanshift平滑操作后,圖像的細(xì)節(jié)部分將被忽略,從而將均值偏移的結(jié)果按照其顏色信息進(jìn)行進(jìn)一步聚類;在這一步驟中,要求聚類過程具有較高的效率并且能夠滿足一定的精度要求;運用k均值聚類算法對圖像進(jìn)行分割;K均值聚類的算法如下應(yīng)用K-means算法進(jìn)行顏色聚類以提取圖像中的對象信息?2-1)對于大小為m χ η的圖像,構(gòu)建大小為(m χ η) * 3的矩陣,其中每一行為對應(yīng)像素點三個通道的顏色信息;2-2) Wmxn個數(shù)據(jù)對象中隨機選取K個對象作為初始聚類中心; 2-3) 根據(jù)每個聚類對象的均值(中心為對象),計算每個對象與這些中心對象的距離,并根據(jù)最小距離重新對相應(yīng)的對象進(jìn)行劃分; 2-4) 重新計算每一個有變化的聚類的均值;2-5) 迭代運行2-3)和2-4)直到每個聚類的變化程度滿足收斂條件。
2.基于均值偏移和K均值聚類技術(shù)的圖像對象提取方法,其特征是對于任何需要處理的圖像對象;1)先應(yīng)用meanshift算法進(jìn)行圖像平滑消除細(xì)節(jié)信息,分別用xi和zi(i=l,…,η) 表示原始和平滑后的圖像像素點,利用meanshift算法對圖像進(jìn)行平滑處理;對于每一個像素點1-1)初始化j=l,且使yj+1=xi,像素點的空間;1-2)在以yj為中心的超球體中計算實現(xiàn)窗口中心的偏移,直到滿足收斂條件; 這里的超球體是指經(jīng)過色彩空間的轉(zhuǎn)化可以在5維特征空間中獲得的很多點,每個點對應(yīng)圖像中的一個像素,表達(dá)了該像素所有的信息,亦即空間位置和色彩信息; 1-3)給zi賦值,將收斂的色彩賦給當(dāng)前像素zi=(xi,yconv) 這里是均值偏移算法的固定步驟,yconv是坐標(biāo)點,就是當(dāng)前像素Zi的坐標(biāo);2)應(yīng)用K-means算法進(jìn)行顏色聚類以提取圖像中的對象信息,2-1) 對于大小為m χ η的圖像,構(gòu)建大小為(m χ η) * 3的矩陣,其中每一行為對應(yīng)像素點三個通道的顏色信息;2-2) Wmxn個數(shù)據(jù)對象中 隨機選取K個對象作為初始聚類中心; 2-3) 根據(jù)每個聚類對象的均值(中心為對象),計算每個對象與這些中心對象的距離,并根據(jù)最小距離重新對相應(yīng)的對象進(jìn)行劃分; 2-4) 重新計算每一個有變化的聚類的均值;2-5) 迭代運行2-3)和2-4)直到每個聚類的變化程度滿足收斂條件。
全文摘要
基于均值偏移和K均值聚類技術(shù)的圖像對象提取方法,先使用均值偏移進(jìn)行圖像平滑,先應(yīng)用meanshift算法進(jìn)行圖像平滑消除細(xì)節(jié)信息,在進(jìn)行過meanshift平滑操作后,圖像的細(xì)節(jié)部分將被忽略,從而將均值偏移的結(jié)果按照其顏色信息進(jìn)行進(jìn)一步聚類;在這一步驟中,要求聚類過程具有較高的效率并且能夠滿足一定的精度要求;運用k均值聚類算法對圖像進(jìn)行分割;K均值聚類的算法如下應(yīng)用K-means算法進(jìn)行顏色聚類以提取圖像中的對象信息,均值偏移和K均值聚類算法相結(jié)合,結(jié)合二者的優(yōu)點,并規(guī)避了二者的缺點。算法的時間短且效率高。從而得到擁有較好結(jié)果的圖像對象提取結(jié)果。
文檔編號G06K9/62GK102222234SQ20111019645
公開日2011年10月19日 申請日期2011年7月14日 優(yōu)先權(quán)日2011年7月14日
發(fā)明者陳國慶, 高瞻 申請人:蘇州兩江科技有限公司