基于視覺(jué)注意機(jī)制模型的圖像處理方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像處理領(lǐng)域,特別涉及一種基于視覺(jué)注意機(jī)制模型的圖像處理方 法。
【背景技術(shù)】
[0002] 目前,視覺(jué)注意機(jī)制主要從兩種模型進(jìn)行研究,一種是自底向上的視覺(jué)注意模型, 另一種是自頂向下的視覺(jué)注意模型。
[0003] 自底向上的視覺(jué)注意模型主要由圖像自身驅(qū)動(dòng),現(xiàn)在的算法主要從四個(gè)方面出 發(fā)。層次性方法、譜分析方法、對(duì)比度方法、基于信息熵的方法。層次性方法主要代表模型 是Itti模型,GBVS模型;譜分析方法主要代表模型是SR模型,F(xiàn)T模型,PQRT模型;對(duì)比度 方法主要代表模型有CA模型;基于信息熵的方法主要代表模型是A頂模型。Itti模型能夠 檢測(cè)到的顯著圖分辨率較低,和圖像分辨率有著很大關(guān)系,不容易檢測(cè)到圖像中主要目標(biāo)。 CA模型有時(shí)會(huì)過(guò)分強(qiáng)調(diào)邊緣,無(wú)法達(dá)到全局對(duì)比度的效果。目前的自底向上的模型沒(méi)有加 入目標(biāo)的先驗(yàn)知識(shí),在目標(biāo)檢測(cè)時(shí)并沒(méi)有排除非目標(biāo)的干擾。
[0004] 自頂向下的模型加入了目標(biāo)的先驗(yàn)知識(shí),是高級(jí)認(rèn)知到低級(jí)認(rèn)知的過(guò)程,現(xiàn)有的 研究方法中,有的方法通過(guò)引入低秩結(jié)構(gòu)建立自頂向下的模型,有的方法基于樣本訓(xùn)練分 類器建立自頂向下的模型,但是這些方法都是通過(guò)建立獨(dú)立的模型進(jìn)行圖形處理,方法的 難度和復(fù)雜性較高。
【發(fā)明內(nèi)容】
[0005] 【要解決的技術(shù)問(wèn)題】
[0006] 本發(fā)明的目的是提供一種基于視覺(jué)注意機(jī)制模型的圖像處理方法,以解決目前的 自頂向下的視覺(jué)注意模型的難度和復(fù)雜性較高的問(wèn)題。
[0007] 【技術(shù)方案】
[0008] 本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的。
[0009] 本發(fā)明涉及一種基于視覺(jué)注意機(jī)制模型的圖像處理方法,該方法包括以下步驟:
[0010] A、分別提取原始圖像的顏色特征、紋理特征和方向特征,將顏色特征的顯著圖、紋 理特征的顯著圖和方向特征的顯著圖進(jìn)行合成得到原始圖像的底層顯著圖;
[0011] B、選擇樣本數(shù)據(jù)庫(kù),在樣本數(shù)據(jù)庫(kù)中隨機(jī)選擇訓(xùn)練樣本及訓(xùn)練樣本的 Ground-truth圖像,確定訓(xùn)練特征,所述訓(xùn)練樣本包括正樣本和負(fù)樣本;
[0012] C、根據(jù)訓(xùn)練樣本和訓(xùn)練特征得到訓(xùn)練特征矩陣,根據(jù)正樣本的索引、負(fù)樣本的索 引得到標(biāo)簽矩陣,采用SVM訓(xùn)練得到SVM分類器;
[0013]D、將原始圖像通過(guò)SVM分類器進(jìn)行分類得到感興趣區(qū)域。
[0014] 作為一種優(yōu)選的實(shí)施方式,所述訓(xùn)練特征由1個(gè)紋理特征、4個(gè)方向特征、1個(gè)原始 圖像的底層顯著圖、11個(gè)顏色特征、13個(gè)圖像金字塔特征組成。
[0015] 作為另一種優(yōu)選的實(shí)施方式,所述步驟A中顏色特征的顯著圖的計(jì)算方法為:
[0016] 對(duì)原始圖像進(jìn)行DCT變換:i=DCT(I);
[0017]對(duì)J進(jìn)行DCT反變換:X= ._/Z)CT[.s'/g;r?];
[0018] 分別對(duì)HSV顏色空間的三個(gè)波段進(jìn)行重建得到原始圖像的顏色特征的顯著圖:
[0019] 其中,X為原始圖像,g為高斯核函數(shù),sign為符號(hào)函數(shù),j為HSV顏色空間的波段。
[0020] 作為另一種優(yōu)選的實(shí)施方式,所述紋理特征和方向特征的特征圖的計(jì)算方法為:
[0021] 對(duì)原始圖像的紋理特征和方向特征進(jìn)行DOG濾波得到方向特征和紋理特征的濾
征的顯著圖的維數(shù),const為不依賴圖像特征的常數(shù)。
[0027] 作為另一種優(yōu)選的實(shí)施方式,所述步驟A中通過(guò)將顏色特征的顯著圖、方向特征 的顯著圖、紋理特征的顯著圖線性相加得到總的顯著圖。
[0028] 作為另一種優(yōu)選的實(shí)施方式,所述圖像金字塔為高斯金字塔。
[0029] 作為另一種優(yōu)選的實(shí)施方式,所述樣本數(shù)據(jù)庫(kù)為Judd數(shù)據(jù)庫(kù)。
[0030]【有益效果】
[0031] 本發(fā)明提出的技術(shù)方案具有以下有益效果:
[0032] (1)本發(fā)明分別建立了自頂向下的視覺(jué)注意模型和自底向上的視覺(jué)注意模型,自 底向上的模型主要從圖像本身特征出發(fā),自頂向下的模型加入了顯著性目標(biāo)的先驗(yàn)知識(shí), 本發(fā)明通過(guò)將兩個(gè)模型進(jìn)行結(jié)合,將自底向上的視覺(jué)注意模型的顯著圖應(yīng)用于自頂向下的 視覺(jué)注意模型,降低了自頂向下的視覺(jué)注意模型的復(fù)雜度,提高了整個(gè)方法的檢測(cè)精度,最 終得到的顯著圖更接近人眼視覺(jué)注意。
[0033] (2)本發(fā)明主要針對(duì)視覺(jué)注意模型,能夠快速發(fā)現(xiàn)目標(biāo)的位置并增強(qiáng)目標(biāo)的位置, 可以應(yīng)用于目標(biāo)檢測(cè)、圖像分割、目標(biāo)檢測(cè)、目標(biāo)識(shí)別預(yù)處理階段,減少了全圖處理的復(fù)雜 度和時(shí)間。
【附圖說(shuō)明】
[0034] 圖1為實(shí)施例一中的底層顯著圖與Itti模型、CA模型、rgb-signature模型、GBVS 模型、A頂模型的顯著圖的PR曲線。
[0035] 圖2為實(shí)施例一中不同特征組合下的PR曲線。
【具體實(shí)施方式】
[0036] 為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖,對(duì)本發(fā)明的具體 實(shí)施方式進(jìn)行清楚、完整的描述,顯然,所描述的實(shí)施例是本發(fā)明的一部分實(shí)施例,而不是 全部實(shí)施例,也不是對(duì)本發(fā)明的限制?;诒景l(fā)明的實(shí)施例,本領(lǐng)域普通技術(shù)人員在不付出 創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明的保護(hù)范圍。
[0037] 實(shí)施例一
[0038] 實(shí)施例一提供一種基于視覺(jué)注意機(jī)制模型的圖像處理方法。該方法包括以下步 驟:
[0039]( -)通過(guò)自底向上的視覺(jué)注意模型得到原始圖像的底層顯著圖
[0040]自底向上的視覺(jué)注意模型從待處理的原始圖像的底層特征出發(fā),首先提取圖像的 顏色特征、紋理特征、方向特征,采用DCT獲得顏色特征的顯著圖,采用DOG濾波和song算 法獲得方向特征和紋理特征的顯著圖,最后將各個(gè)特征的顯著圖進(jìn)行線性相加得到總的顯 著圖,得到的總的顯著圖記為原始圖像的底層顯著圖。
[0041] (1)顏色特征的顯著圖
[0042] 待處理的原始圖像可以表示為:
[0043] X = f+b,
[0044] f?代表前景圖像,b代表背景。通常只對(duì)圖像前景感興趣,對(duì)于一個(gè)可以分解為上 述式子的圖像,可以通過(guò)對(duì)圖像進(jìn)行DCT變換然后反變換到空間上,計(jì)算重建后的圖像的 顯著性。假設(shè)圖像的前景和背景相關(guān),通過(guò)平滑重建圖像生成顯著圖。
[0045] 圖像顯著性定義為:
[0046] saliency(X)= sign(DCT(X))
[0047] 圖像顯著圖表示為:
[0048]
[0049] 基于上述理論,顏色特征的顯著圖的計(jì)算方法為:
[0050] 對(duì)原始圖像進(jìn)行DCT變換:I = DCTXy);
[0051 ]對(duì)i進(jìn)行DCT反變換:X=//JCT[.S7_g"i];
[0052] 分別對(duì)HSV顏色空間的三個(gè)波段進(jìn)行重建得到原始圖像的顏色特征的顯著圖:
[0053] 其中,x為原始圖像,g為高斯核函數(shù),sign為符號(hào)函數(shù),j為HSV顏色空間的波段。
[0054] (2)方向特征和紋理特征的顯著圖
[0055] 紋理特征和方向特征的特征圖的計(jì)算方法為:
[0056] 對(duì)原始圖像的紋理特征和方向特征進(jìn)行DOG濾波得到方向特征和紋理特征的濾
尺度參數(shù),f為紋理特征或方向特征對(duì)應(yīng)的DOG濾波響應(yīng);
[0057] 分別根據(jù)下式對(duì)紋理特征和方向特征進(jìn)行取對(duì)數(shù)操作得到:
征的顯著圖的維數(shù)(i= 1,2, 3…,20) ,const為不依賴圖像特征的常數(shù)。需要說(shuō)明,由于紋 理特征是1維矩陣,方向特征是四個(gè)方向的4維矩陣,總共是5維矩陣,在4個(gè)尺度下進(jìn)行 DOG濾波得到20維矩陣,每一維矩陣代表一層特征。
[0061](二)采用自頂向下的視覺(jué)注意模型得到感興趣區(qū)域
[0062]自頂向下的視覺(jué)注意模型主要從目標(biāo)的先驗(yàn)知識(shí)出發(fā),將樣本庫(kù)中顯著性區(qū)域和 非顯著區(qū)域的特征作為訓(xùn)練對(duì)象。
[0063] 為了構(gòu)建本發(fā)明實(shí)施例的自頂向下的視覺(jué)注意模型,在Judd數(shù)據(jù)庫(kù)隨機(jī)選擇100 幅圖像作為訓(xùn)練樣本和100幅作為測(cè)試樣本。從每個(gè)訓(xùn)練圖像中選擇10個(gè)正樣本和10個(gè) 負(fù)樣本,10個(gè)正樣本選擇的條件是從訓(xùn)練樣本中Ground-truth圖像中顯著度值在前10% 的像素點(diǎn),負(fù)樣本選擇條件是訓(xùn)練樣本對(duì)應(yīng)圖像G