專利名稱:基于稀疏表示和視皮層注意機制的目標檢測方法
技術領域:
本發(fā)明屬于圖像處理技術領域,更進ー步涉及自然場景圖像處理技術領域中的一種基于稀疏表示和視皮層注意機制的目標檢測方法。本發(fā)明可用于道路標志檢測、視頻監(jiān)控、眼動預測和目標識別。
背景技術:
目標檢測是計算機視覺和模式識別系統(tǒng)中非常關鍵的技術之一,目標檢測的效果直接影響著整個系統(tǒng)的可靠性和有效性。然而基于圖像處理、機器學習等簡單的方法并不能夠完全適用于大多數(shù)的圖像。因此,需要關注人類視覺注意機制,研究人類眼睛是如何搜尋、查找和檢測自然場景中的目標的。視覺注意機制,是靈長目類動物視覺系統(tǒng)的ー個內(nèi)在的屬性。它是ー種將人目光注視引導到場景中感興趣物體的機制。通常,進入人們視野的視覺信息是海量的,但是從這些海量的信息中,人們依然能夠搜尋到想要的信息。根據(jù)心理學的很多研究實驗成果,已經(jīng)模擬出了許多人類大腦感知事物的模型,而這些模型大都僅僅適用于解釋某些心理物理學實驗的結(jié)果,并不能直接用于自然圖像處理中的目標檢測?,F(xiàn)有最著名的視覺注意計算方法就是視覺顯著性計算方法,視覺注意是與周圍環(huán)境完全與眾不同的目標物會自動的從視野環(huán)境中“跳出”并且吸引注意力的關注。選擇性注意力機制可以將人們的視覺關注引導到在場景中稱之為“顯著性區(qū)域”的那一部分。視覺的顯著性計算方法提供了關于這些可能吸引觀測者注意力的預測區(qū)域。在視覺顯著性計算方法中有一種視覺顯著性檢測的方法。例如,杭州電子科技大學在其專利申請“基于韋伯定理和中央-周圍假設的視覺顯著性檢測方法”(專利申請?zhí)?201110002235.0,公開號CN102103750A)中提出了ー種視覺顯著性檢測方法。該專利申請利用彩色變換方法提取于是圖像的CIELAB空間彩色分量圖,再根據(jù)韋伯定理計算各個彩色分量圖中每個像素點的水平梯度差勵值和遲滯梯度差勵值,接著由水平梯度差勵值和遲滯梯度差勵值計算任意梯度方向的差勵值,統(tǒng)計差勵直方圖,最后每個像素點建立其局部顯著性激勵矢量,得到局部顯著性判決值和全局顯著性激勵值,并由此得到顯著性判決值。 該方法雖然能夠能夠獲得與輸入圖像相同分辨率的視覺顯著性圖,但仍存在的不足是,計算復雜度高,并且沒有更好的模擬人類視皮層注意機制,使得到的顯著性圖不能很好的符合人眼對目標的感知。在視覺顯著性計算方法中還有ー種基于HMAX的目標分類方法。例如, Riesenhuber 禾ロ Poggio 在又獻“Riesenhuber M,Poggio Τ. Hierarchical models of object recognition in cortex[J]. Nature Neuroscience,1999,2(11) :1019-1025. ” 中提出了ー種目標分類方法。Serre等人改進了該方法。該方法將原始圖像經(jīng)過四層分解,分別得到Sl単元圖、Cl単元圖、S2單元圖和C2特征矢量,該方法提取的特征具有旋轉(zhuǎn)、平移等不變性,并且保留了局部特征的幾何特性,對位置和尺度不敏感,即使對于有稍許變形和失真的輸入圖像,仍能取得很好的分類效果方法。但是,該方法存在的不足之處是,不能直接用來尋找圖像的顯著性區(qū)域,忽略了顯著性或者目標的位置,即不能模擬人腦的“位置通路”。
發(fā)明內(nèi)容
本發(fā)明針對上述現(xiàn)有技術存在的不足,提出了 ー種基于稀疏表示和視皮層注意機制的目標檢測方法。本發(fā)明在尋找自然場景圖像的顯著性上更能符合人眼的感知特性,既降低了現(xiàn)有技術復雜度,又具有較高的正確率和較低的誤檢率;在心理學刺激模式圖片上的與傳統(tǒng)的顯著圖檢測方法相比也有較好有效性和準確性。本發(fā)明實現(xiàn)上述目的的思路是首先,使用多尺度,多方向的Gabor濾波器組對輸入的待檢測圖像進行Gabor濾波,提取得到HMAX模型的Sl層細胞;其次使用取樣和最大化操作獲得HMAX模型的Cl層細胞;再次,利用獨立成分分析ICA,用HMAX模型的Cl層細胞構(gòu)造稀疏基;最后,利用對尺度和平移具有不變性的C2層細胞以及香農(nóng)熵理論,構(gòu)造用于視覺顯著性區(qū)域檢測的測度,得到原始圖像的顯著性圖。本發(fā)明的步驟包括如下(1)輸入待檢測圖像;(2)使用多尺度,多方向的Gabor濾波器組對輸入的待檢測圖像進行Gabor濾波, 提取得到HMAX模型的Sl層細胞;(3)對Sl層細胞采樣并使用最大化操作,提取得到HMAX模型的Cl層細胞;(4)獲得稀疏基4a)對Cl層細胞的各個方向隨機抽取大小為4X4的采樣塊,將抽取的采樣塊內(nèi)像素按從左至右,從上至下的順序?qū)懗闪邢蛄啃问剑恢貜统槿?000次,得到2000個列向量;4b)將2000個列向量同時輸入到獨立成分分析ICA系統(tǒng)中,獲得稀疏基;(5)提取S2層細胞5a)將訓練圖像作為樣本圖像,對輸入的樣本圖像依次進行步驟(2)和(3)的操作,得到樣本圖像的Cl層細胞,對樣本圖像的Cl層細胞使用取樣方法產(chǎn)生特征塊模板,每個特征塊模板用一個矩陣表示;5b)對Cl層細胞使用取樣方法產(chǎn)生Cl層細胞采樣塊,每個Cl層細胞的采樣塊用一個矩陣表示;5c)將特征塊模板與Cl層細胞采樣塊按照徑向基函數(shù)匹配方法,獲得HMAX模型的 S2層細胞;(6)對輸出的S2層細胞使用最大值操作,獲得HMAX模型的C2層細胞;(7)按如下公式計算C2層細胞的信息熵
權(quán)利要求
1.基于稀疏表示和視皮層注意機制的目標檢測方法,包括如下步驟(1)輸入待檢測圖像;(2)使用多尺度,多方向的Gabor濾波器組對輸入的待檢測圖像進行Gabor濾波,提取得到HMAX模型的Sl層細胞;(3)對Sl層細胞采樣并使用最大化操作,提取得到HMAX模型的Cl層細胞;(4)獲得稀疏基4a)對Cl層細胞的各個方向隨機抽取大小為4X4的采樣塊,將抽取的采樣塊內(nèi)像素按從左至右,從上至下的順序?qū)懗闪邢蛄啃问?;重復抽?000次,得到2000個列向量;4b)將2000個列向量同時輸入到獨立成分分析ICA系統(tǒng)中,獲得稀疏基;(5)提取S2層細胞5a)將訓練圖像作為樣本圖像,對輸入的樣本圖像依次進行步驟(2)和(3)的操作,得到樣本圖像的Cl層細胞,對樣本圖像的Cl層細胞使用取樣方法產(chǎn)生特征塊模板,每個特征塊模板用一個矩陣表示;5b)對Cl層細胞使用取樣方法產(chǎn)生Cl層細胞采樣塊,每個Cl層細胞的采樣塊用ー個矩陣表示;5c)將特征塊模板與Cl層細胞采樣塊按照徑向基函數(shù)匹配方法,獲得HMAX模型的S2 層細胞;(6)對輸出的S2層細胞使用最大值操作,獲得HMAX模型的C2層細胞;(7)按如下公式計算C2層細胞的信息熵
2.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機制的目標檢測方法,其特征在于步驟( 所述的Gabor濾波步驟是第一歩,構(gòu)造由4個方向,16個尺度組成的Gabor濾波器組
3.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機制的目標檢測方法,其特征在于步驟(3)所述的采樣并進行最大化操作提取Cl層細胞的步驟是第一歩,將8個子帶各個方向的任一響應圖劃分成對應于各個子帶采樣寬度的正方形子格,然后再將這些子格劃分成同樣大小的正方形格子,完成減采樣過程;在每個正方形格子中取響應的最大值,得到最大值圖;第二歩,對每個子帶兩個相鄰尺度的最大值圖進行比較,求其對應格子的最大值,得到具有不變性質(zhì)的Cl層細胞。
4.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機制的目標檢測方法,其特征在于步驟5a)所述的取樣產(chǎn)生特征塊模板的方法是從所有樣本圖像的Cl層細胞中隨機選擇ー個子帯,在該子帶包含的各個方向上抽取不同位置的正方形區(qū)域,將抽取的每個區(qū)域作為ー個特征塊模板。
5.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機制的目標檢測方法,其特征在于步驟5b)所述的取樣產(chǎn)生Cl細胞采樣塊的方法是從Cl層細胞中每個子帶的各個方向上抽取不同位置的正方形區(qū)域,將抽取的所有區(qū)域作為Cl層細胞采樣塊。
6.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機制的目標檢測方法,其特征在于步驟5c)所述的徑向基函數(shù)匹配方法是按照下式將特征塊模板與Cl層細胞采樣塊進行匹配運算得到S2層細胞;Ys = exp (- y Il Xt-Ps Il 2)其中,Ys 層細胞的響應值,exp為指數(shù)運算符號,、為縱橫比,Il Il 2為歐式距離的平方運算符號,)(τ為Cl層細胞采樣塊構(gòu)成的矩陣,T= 1,2,…M,M為Cl層細胞采樣塊的個數(shù),Ps為特征值模板構(gòu)成的矩陣,S= 1,2,…N,N為特征塊模板的個數(shù)。
7.根據(jù)權(quán)利要求1所述的基于稀疏表示和視皮層注意機制的目標檢測方法,其特征在于步驟(6)所述的最大化操作提取C2層細胞的方法是對屬于各個特征塊模板的S2層細胞選其中的最大值作為C2層細胞,N個模板得到N個最大值,共得到N個C2層細胞。
全文摘要
本發(fā)明公開了一種基于稀疏表示和視皮層注意機制的目標檢測方法,其實現(xiàn)步驟為(1)使用多尺度,多方向的Gabor濾波器組對輸入的待檢測圖像進行Gabor濾波,提取得到HMAX模型的S1層細胞;(2)利用獨立成分分析ICA,用HMAX模型的C1層細胞構(gòu)造稀疏基;(3)利用對尺度和平移具有不變性的C2層細胞以及香農(nóng)熵理論,得到C2層細胞的信息熵,更進一步構(gòu)造用于視覺顯著性區(qū)域檢測的測度,得到原始圖像的顯著性圖。本發(fā)明在尋找自然場景圖像的顯著性上更能符合人眼的感知特性,具有較高的正確率和較低的誤檢率;在心理學刺激模式圖片上的與傳統(tǒng)的顯著圖檢測方法相比也有較好有效性和準確性。
文檔編號G06T7/00GK102567997SQ20121000167
公開日2012年7月11日 申請日期2012年1月4日 優(yōu)先權(quán)日2012年1月4日
發(fā)明者李潔, 王秀美, 王穎, 趙曉靜, 路文, 鄧成, 韓冰, 高新波 申請人:西安電子科技大學