一種基于模糊不變特征的模糊圖像識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計算機視覺、模式識別技術(shù)領(lǐng)域,更具體地,設(shè)及一種基于模糊不變特 征的模糊圖像識別方法。
【背景技術(shù)】
[0002] 圖像識別是計算機視覺中重要的基礎(chǔ)研究內(nèi)容,在很多領(lǐng)域有著廣泛的應(yīng)用。在 實際應(yīng)用中,圖像中常常包含有各種外界干擾,例如幾何與卷積退化,圖像模糊也是其中一 種。優(yōu)秀的圖像識別系統(tǒng)應(yīng)該在各種不理想的成像條件下都能正常工作,目前已有很多學(xué) 者展開了該方面的研究。不過,關(guān)于圖像模糊條件下目標(biāo)識別的研究國內(nèi)外都還非常少。 圖像模糊主要是由目標(biāo)與鏡頭間的相對運動、鏡頭散焦W及大氣端流引起圖像退化而形成 的。模糊圖像是理想圖像與成像系統(tǒng)的點擴展函數(shù)經(jīng)卷積后形成,模糊程度主要由點擴展 函數(shù)決定。
[0003] 圖像模糊在直觀上會造成圖像的邊緣崎變與細節(jié)信息損失,該對后續(xù)的圖像識別 會產(chǎn)生非常不利的影響,因而降低最終的識別率。傳統(tǒng)的模糊圖像識別方法一般先對圖像 進行去模糊處理,在圖像模糊被去除后利用現(xiàn)有圖像特征對圖像進行識別。該種方法雖然 能夠解決問題,但是,由于去模糊算法設(shè)及到模糊點擴展函數(shù)的估計,而點擴展函數(shù)的估計 則需要對圖像進行多次反復(fù)的迭代求解,因此去模糊算法的時間復(fù)雜度普遍比較高,在實 際的圖像處理中需要耗費大量的時間。因此,傳統(tǒng)方法在一些實時性要求較高的場景中有 較大的局限性。
【發(fā)明內(nèi)容】
[0004] 針對現(xiàn)有技術(shù)的W上缺陷或改進需求,本發(fā)明提供一種基于模糊不變特征的模糊 圖像識別方法,其目的在于提供一種不進行圖像去模糊處理,通過直接提取圖像模糊不變 特征進行圖像識別的方法。本發(fā)明在保證高識別率的同時,避免了傳統(tǒng)模糊圖像識別中先 去模糊該一步驟的實行,具有效率高,實時性和適應(yīng)性強的特點。
[0005] 本發(fā)明提供一種于模糊不變特征的模糊圖像識別方法,包括W下步驟:
[0006] 步驟1提取輸入圖像的紋理模糊不變特征,包括W下子步驟:
[0007] (1-1)對于所述輸入圖像上的每一點,在W其為中屯、、MXM像素點鄰域內(nèi),在給定 的頻域點上計算短時傅里葉變換,得到向量V = [G (Ui, X),G (也X),G (叫,X),G相,X)],其 中,111、112、113、114為所述給定的頻域點,
【主權(quán)項】
1. 一種基于模糊不變特征的模糊圖像識別方法,其特征在于,包括: 步驟1提取輸入圖像的紋理模糊不變特征,包括以下子步驟: (1-1)對于所述輸入圖像上的每一點,在以其為中心、MXM像素點鄰域內(nèi),在給定的頻 域點上計算短時傅里葉變換,得到向量V = [G (U1, X),G (u2, X),G (u3, X),G (u4, X)],其中,Up u2、u3、u4為所述給定的頻域點
,u = +,,、!^將所述 向量V中的實部與虛部分開,得到待編碼向量W = [Re(V),Im (V)],其中Re(V)表示所述向 量V的實部,Im(V)表示所述向量V的虛部; (1-2)對所述待編碼向量W中每一個元素進行量化,并根據(jù)以下公式對量化后的每一 個元素^進行編碼,得到像素點的紋理特征值b :
(1-3)對每一個像素點均進行所述子步驟(1-1)?(1-2)的計算,將所有的紋理特征值 進行直方圖統(tǒng)計,得到所述輸入圖像的紋理模糊不變特征; 步驟2提取所述輸入圖像的結(jié)構(gòu)模糊不變特征,包括以下子步驟: (2-1)對于所述輸入圖像,計算其梯度幅值與方向; (2-2)將所述輸入圖像劃分成多個圖像塊,并在每一圖像塊內(nèi)再劃分成多個細胞單元, 對一個圖像塊內(nèi)每個細胞單元進行梯度直方圖統(tǒng)計并進行串接得到所述圖像塊的梯度方 向直方統(tǒng)計圖,將所有圖像塊的梯度方向直方統(tǒng)計圖串接得到所述梯度方向直方統(tǒng)計圖的 結(jié)構(gòu)特征; (2-3)計算所述結(jié)構(gòu)特征的均值,將小于所述均值的部分歸零; (2-4)對歸零后的所述結(jié)構(gòu)特征進行歸一化處理,得到所述結(jié)構(gòu)模糊不變特征; 步驟3使用核典型相關(guān)分析方法將所述驟1和所述步驟2獲得的所述紋理模糊不變特 征和所述結(jié)構(gòu)模糊不變特征進行融合,得到所述輸入圖像的融合模糊不變特征; 步驟4對清晰圖像進行所述步驟1?3的計算得到所述清晰圖像的融合模糊不變特 征,并利用所述融合模糊不變特征訓(xùn)練SVM分類器; 步驟5使用經(jīng)所述步驟4訓(xùn)練好的SVM分類器對所述輸入圖像的融合模糊不變特征進 行識別,得到相應(yīng)的識別結(jié)果。
2. 如權(quán)利要求1所述的方法,其特征在于,所述子步驟(1-1)中M為奇數(shù)。
3. 如權(quán)利要求1或2所述的方法,其特征在于,所述子步驟(1-1)中所述給定的頻域點 為屮=(a, 0)、U2= (0, a)、u 3= (a, a)、U4= (a,-a),其中
4. 如權(quán)利要求I或2所述的方法,其特征在于,所述子步驟(1-2)中以公式
對所述待編碼向量W中的每一個元素進行量化。
5. 如權(quán)利要求1所述的方法,其特征在于,所述子步驟(2-1)中以下式計算所述輸入圖 像的所述梯度幅值與所述方向: 其中,m(x,y)為在像素點(x,y)處梯度的幅值;GX為水平方向梯度,Gy為垂直方向梯 度;θ (X,y)為在像素點(X,y)處梯度的方向。
6. 如權(quán)利要求1或5所述的方法,其特征在于,所述子步驟(2-2)中均以從左向右、從 上向下的順序進行梯度方向直方統(tǒng)計圖的串接。
7. 如權(quán)利要求1或5所述的方法,其特征在于,所述子步驟(2-4)中以以下式對歸零后 的所述結(jié)構(gòu)特征進行歸一化處理:
其中,ξ為接近于O的正數(shù)。
8. 如權(quán)利要求1所述的方法,其特征在于,所述步驟3中采用徑向基函數(shù)
對所述紋理模糊不變特征和所述結(jié)構(gòu)模糊不變特征進行計 算,得到相應(yīng)的核矩陣,其中,σ為所述徑向基函數(shù)的參數(shù)。
9. 如權(quán)利要求1所述的方法,其特征在于,所述步驟4中SVM分類器訓(xùn)練過程和所述步 驟5中SVM分類器識別過程中使用的核函數(shù)均為線性核函數(shù),其定義為
【專利摘要】本發(fā)明公開了一種基于模糊不變特征的模糊圖像識別方法,屬于計算機視覺、模式識別技術(shù)領(lǐng)域。本發(fā)明包括:分別從紋理與結(jié)構(gòu)兩個方面提取模糊圖像的模糊不變特征;將所提取的特征采用KCCA方法進行融合;利用訓(xùn)練樣本提取融合特征訓(xùn)練SVM分類器;利用訓(xùn)練得到的SVM分類器對模糊圖像進行識別。相比于傳統(tǒng)的模糊圖像識別方法,本發(fā)明所提供的方法可以在不去圖像模糊的情況下直接對模糊圖像進行識別,具有識別準(zhǔn)確率高、實時性強的特點。本發(fā)明在模糊圖像識別領(lǐng)域中具有較高的應(yīng)用價值。
【IPC分類】G06K9-62
【公開號】CN104537381
【申請?zhí)枴緾N201410844715
【發(fā)明人】曹治國, 肖陽, 朱夢宇, 解曉康
【申請人】華中科技大學(xué)
【公開日】2015年4月22日
【申請日】2014年12月30日