一種基于群稀疏特征選擇的圖像檢索方法
【專利摘要】本發(fā)明公開了一種基于群稀疏特征選擇的圖像檢索方法,包括特征選擇與圖像檢索兩部分,其中特征選擇步驟包括選取圖像對、提取多種特征、形成特征差異矩陣、建立群稀疏邏輯回歸模型、運用優(yōu)化算法求解權重、選擇出最優(yōu)特征;圖像檢索步驟包括提取圖像庫所有圖像的最優(yōu)特征、形成圖像特征庫、提取查詢圖像最優(yōu)特征、相似度比較、求出最大相似度圖像序號、輸出檢索圖像。本發(fā)明運用自適應譜梯度算法有效的求解群稀疏邏輯回歸模型,具有更快的收斂速度,更少的運行時間。傳統的基于內容的圖像檢索,特征的選擇是特定的,本發(fā)明用全部訓練特征進行圖像檢索相比,在相同的實驗條件下,圖像的查準率明顯提高,圖像檢索的效率增強。
【專利說明】一種基于群稀疏特征選擇的圖像檢索方法
【技術領域】
[0001]本發(fā)明涉及圖像信息處理【技術領域】,尤其涉及一種基于群稀疏特征選擇的圖像檢索方法。
【背景技術】
[0002]隨著數據庫技術、多媒體技術、網絡技術的飛速發(fā)展,人們越來越多地接觸到擁有大量數字圖像的數據庫,為了對圖像庫進行有效管理,人們急切的需要高效的圖像檢索系統。由于技術原因,目前許多流行的商用Web圖像搜索引擎,如Google、百度、360搜索等等都是傳統的基于文本的圖像檢索?;谖谋镜膱D像檢索采用Web網頁中與圖像關聯的文字信息來完成搜索任務,但是它有如下的缺點:1.描述能力有限,例如對紋理,不規(guī)則形狀等無法精確描述。2.描述具有主觀性,不同人對同一副圖像的描述可能不同。3.在現代社會海量的圖像面前,每一幅圖像皆有詳細的文本描述顯然這是不現實的。為了克服傳統檢索方法的局限性,基于內容的圖像檢索技術應運而生?;趦热莸膱D像檢索采用的做法是預先采用某些特征提取算法抽取圖像的低層特征(如顏色、紋理和形狀等)并形成一個特征庫。然后提取查詢圖像的特征并與特征庫進行匹配以尋找相似的圖像。由于這些特征都是客觀獨立地存在于圖像中的,因此這種圖像檢索方法的主要特點是利用圖像本身包含的客觀視覺特性,不需要人為干預和解釋,能夠通過計算機自動實現對圖像特征的提取和存儲。因此基于內容的圖像檢索技術已迅速成為圖像數據庫技術中的研究熱點之一,并得到了國內外信息領域科技人員的廣泛重視和研究。基于內容的圖像檢索,這個概念是于1992年最先由T.Kato提出的,經過這20年的研究,國內外的許多高校和研究機構投入了大量的資金、人力和物力進行研究,并取得了一定的成果。如IBM公司開發(fā)的QBIC系統,Virage公司開發(fā)的Virage系統,MIT的多媒體實驗室開發(fā)的Photobook系統,哥倫比亞大學開發(fā)的VisualSEEK和WebSEEK系統,中國科學院計算機技術研究所智能信息處理重點實驗室研發(fā)的Mires系統等等。
[0003]圖像特征的提取是基于內容的圖像檢索的第一步也是最為關鍵的一步。圖像的特征包括低層視覺特征(包括顏色、紋理、形狀等)和高層語義特征(主體對象、行為特征、情感特征等)。由于目前圖像理解、計算機視覺等領域的研究水平還很有限,使得現有的對基于內容的圖像檢索技術的研究和應用均是基于圖像的低層視覺特征來進行的,還無法在真正意義上做到基于高層語義的圖像檢索。不同的圖像低層視覺特征都具有其獨特的性質和適合的應用場合,例如顏色特征適用于顏色信息較為豐富,且圖像之間顏色分布差異較大的圖像數據庫;對于富含紋理信息的圖像(醫(yī)學圖像、植物圖像、巖石圖像等)通常采用的方法是基于紋理特征的檢索方式;而針對具有明確主體對象且目標邊緣清晰的圖像使用形狀特征進行檢索則能取得較好的檢索效果。在系統的復雜度和檢索時間允許的情況下,將多種低層視覺特征組合起來進行圖像檢索可以獲得更好的檢索結果。
[0004]隨著計算機視覺的發(fā)展,圖像的特征越來越豐富,而圖像特征的性質千差萬別,各不相同。如顏色特征就可以有RGB,HSV,LAB等等,紋理特征有Tamura,SIFT (尺度不變的幾何變化),Gabor等等,形狀特征有不變矩,邊緣方向直方圖,霍夫變換直線檢測等等。當使用多種特征組合進行圖像檢索,如果不加選擇的使用大量特征進行圖像檢索,由于多種特征的存在,必然產生數據冗余,計算復雜度上升,檢索的效率與性能下降等問題。對于這個問題,目前有兩種解決方案,一種是對維數大的特征的進行降維處理,另外一種是對特征進行擇優(yōu)選擇。對于降維方法,存在兩個問題:1.縮減的維數不是盲目的,因為如果維數被縮減到必要的維數以下,圖像特征的信息就有可能丟失。2.而且由于底層屬于同類特征的不同特征有強烈的相關性,降維并不能夠徹底解決數據冗余的問題。所以特征選擇是一個比較好的方法,對于不同圖像庫,最優(yōu)的特征一般也不一樣,因此選擇最優(yōu)特征非常重要。對于一個圖像庫來說,所選取的特征好壞直接影響檢索性能,如何建立一個可以選擇對于特定圖像庫最為有效的特征組合的通用的模型成為一個非常重要的問題。
【發(fā)明內容】
[0005]本發(fā)明所要解決的技術問題在于提出了一種基于群稀疏特征選擇解決方案,將其用于基于內容的圖像檢索上,在提聞檢索的準確率的同時,有效地提升了檢索的效率。
[0006]一種基于群稀疏特征選擇的圖像檢索方法,其特征在于,包括特征選擇和圖像檢索兩部分:
[0007]一、特征選擇具體包括:
[0008]步驟11、針對圖像庫中的每一幅圖像,比較其圖像關鍵字形成相似與不相似序列,接著比較相似與不相似序列的圖像顯著區(qū)域的歐式距離,獲取圖像庫中每一幅圖像的相似對與不相似對,得到該圖像的相似性度量向量;
[0009]步驟12、對獲得的每一幅圖像的相似對與不相似對分別提取訓練特征,圖像庫中所有圖像的訓練特征形成兩個特征矩陣,將前述兩個特征矩陣相減形成特征差異矩陣;
[0010]步驟13、設定權重系數,并依據特征差異矩陣與相似性度量向量,建立群稀疏邏輯模型;
[0011]步驟14、利用優(yōu)化算法求解群稀疏邏輯模型,求解出權重系數;
[0012]步驟15、根據權重系數中非O群對應于特征差異矩陣所占位置,得出最優(yōu)特征;步驟16、對于圖像庫中的所有圖像提取步驟15得出的最優(yōu)特征,將提取的特征以矩陣的形式保存,形成圖像特征庫;
[0013]二、圖像檢索具體包括:
[0014]步驟21、對查詢圖像,按照步驟11至步驟15的方式提取出最優(yōu)特征;
[0015]步驟22、利用相似度度量,將查詢圖像的最優(yōu)特征與圖像特征庫中的每一幅圖像的特征進行相似性匹配;
[0016]步驟23、將匹配得出的圖像按照相似度的程度從大到小進行排序,得出經過排序的圖像序號;
[0017]步驟24、根據步驟23得出的圖像序號,從圖像特征庫中提取出對應圖像,并作為查詢圖像對應的檢索圖像輸出。
[0018]作為本發(fā)明的進一步優(yōu)選方案,所述步驟14中,優(yōu)化算法為自適應譜梯度算法。
[0019]作為本發(fā)明的進一步優(yōu)選方案,所述步驟23中,相似度度量的計算方法選擇L1距離,L2距離,直方圖交集,卡方距離,KL-D距離中的一種。[0020]相比現有技術,本發(fā)明方法具有以下有益效果:
[0021]1.運用群稀疏算法構建針對圖像庫進行特征選擇的通用方法;
[0022]2.優(yōu)化算法中采用的自適應譜梯度算法(ANSPG)相比譜梯度算法(SPG)有效減少了算法的時間復雜度,在處理群稀疏表示問題上性能優(yōu)越;
[0023]3.運用本文通過基于群稀疏特征選擇的算法,提高了基于內容圖像檢索的性能,并通過實驗驗證了本文提出基于內容的圖像檢索方法的性能。
【專利附圖】
【附圖說明】
[0024]圖1為特征選擇和特征檢索流程圖;
[0025]圖2 (a)、圖2 (b)分別為圖像對選擇策略和構建的群稀疏邏輯模型示意圖;
[0026]圖3 (a)、圖3 (b)、圖3 (c)Corel5K為非別在數據庫上使用譜梯度(SPG)算法與自適應譜梯度(ANSPG)算法分別對顏色特征,紋理與方向特征進行選擇;
[0027]圖4為在Corel5K數據庫上索查準率比較;
[0028]圖5為在IAPRIC12數據庫上索查準率比較;
[0029]圖6為具體實例中所選用的訓練特征;
[0030]圖7為不同特征在不同距離度量下的查準率;
[0031]圖8為SPG(譜梯度算法)與ANSPG(自適應譜梯度)算法在Corel5K上時間花費。
【具體實施方式】
[0032]下面結合附圖對本發(fā)明的技術方案進行詳細說明:
[0033]本發(fā)明所述一種基于群稀疏特征選擇圖像檢索方法,包括特征選擇與圖像檢索兩部分,如圖1所示。
[0034]特征選擇步驟包括:
[0035]步驟1、圖像對獲取與形成相似性度量向量:在圖像庫中選擇圖像對是本文提出算法的一個重要的預備工作。從第一幅圖像開始,圖像相似對的選擇流程如圖2 (a)所示。由于關鍵字的比較相對于圖像歐氏距離的比較計算的時間復雜度很低,所以本文首先將圖像庫中第一幅圖與其余圖像的關鍵字進行比較,如果有大于三分之二關鍵字相同的,則生成第一幅圖像的一個相似序列,如果有沒有關鍵字相同的,則生成第一幅圖像的一個不相似序列。然后將相似列與不相似列中的每一幅圖像分別同第一幅圖像運用歐氏距離的度量方法進行相似性比較,選Ii1 Cn1為選擇的相似圖像對數目)幅最相似的圖像與第一幅圖像組成相似對,同時選n2 Cn2為選擇的不相似圖像對數目)幅最不相似的圖像與第一幅圖像組成不相似對,從而可以構建關于第一幅圖像的所有相似對和不相似對。依次對圖像庫中第二幅圖像到最后一幅圖像重復運用流程圖2 Ca)中所示圖像對的構建方法,最終可以得到圖像庫中每一幅圖像所對應的所有相似與不相似圖像對。然后根據構建的相似對和不相似對,將相似對賦予I而不相似對賦予-1,從而得到一個相似性度量向量Y。
[0036]步驟2、提取特征與構建特征差異矩陣:如圖1所示將所得圖像對首先分為兩個圖像列L1與L2,然后分別提取訓練特征得到特征矩陣A與B,把A和B相減得到特征差異矩陣X e Rnxp (η為圖像對數目,P為所有訓練特征的維數),Xi e X可以看作一對圖像的特征差,具體如如圖2 (b)所示。
[0037]步驟3、建立Q1范數正則化框架:建立對于特征差異矩陣X e RnXp,X中的第i行定義為Xi e Rixp。相似性度量向量定義為Y e Rnxi,向量Y中的元素分別為對圖像對賦予值。權重向量定義為we RPX1。因此Y可以用特征的一個稀疏線性組合加上殘差項Θ GRpxl來表示:
[0038]
【權利要求】
1.一種基于群稀疏特征選擇的圖像檢索方法,其特征在于,包括特征選擇和圖像檢索兩部分: 一、特征選擇具體包括: 步驟11、針對圖像庫中的每一幅圖像,比較其圖像關鍵字形成相似與不相似序列,接著比較相似與不相似序列的圖像顯著區(qū)域的歐式距離,獲取圖像庫中每一幅圖像的相似對與不相似對,得到該圖像的相似性度量向量; 步驟12、對獲得的每一幅圖像的相似對與不相似對分別提取訓練特征,圖像庫中所有圖像的訓練特征形成兩個特征矩陣,將前述兩個特征矩陣相減形成特征差異矩陣; 步驟13、設定權重系數,并依據特征差異矩陣與相似性度量向量,建立群稀疏邏輯模型; 步驟14、利用優(yōu)化算法求解群稀疏邏輯模型,求解出權重系數; 步驟15、根據權重系數中非O群對應于特征差異矩陣所占位置,得出最優(yōu)特征; 步驟16、對于圖像庫中的所有圖像提取步驟15得出的最優(yōu)特征,將提取的特征以矩陣的形式保存,形成圖像特征庫; 二、圖像檢索具體包括: 步驟21、對查詢圖像,按照步驟11至步驟15的方式提取出最優(yōu)特征; 步驟22、利用相似度度量,將查詢圖像的最優(yōu)特征與圖像特征庫中的每一幅圖像的特征進行相似性匹配; 步驟23、將匹配得出的圖像按照相似度的程度從大到小進行排序,得出經過排序的圖像序號; 步驟24、根據步驟23得出的圖像序號,從圖像特征庫中提取出對應圖像,并作為查詢圖像對應的檢索圖像輸出。
2.如權利要求1一種基于群稀疏特征選擇的圖像檢索方法,其特征在于:所述步驟14中,優(yōu)化算法為自適應譜梯度算法。
3.如權利要求1一種基于群稀疏特征選擇的圖像檢索方法,其特征在于:所述步驟22中,相似度度量的計算方法選擇L1距離,L2距離,直方圖交集,卡方距離或KL-D距離中的一種。
【文檔編號】G06F17/30GK103810252SQ201410027227
【公開日】2014年5月21日 申請日期:2014年1月21日 優(yōu)先權日:2014年1月21日
【發(fā)明者】徐軍, 鄭秋中 申請人:南京信息工程大學