一種基于多尺度全局特征和局部特征的圖像分類方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計(jì)算機(jī)圖像分類方法,特別是一種基于多尺度全局特征和局部特征的 圖像分類方法。
【背景技術(shù)】
[0002] 圖像分類一直是計(jì)算機(jī)圖像領(lǐng)域的一個(gè)基本問題,特別是隨著互聯(lián)網(wǎng)的急速發(fā) 展,大量的無分類的圖像出現(xiàn)在網(wǎng)絡(luò)中,給圖像的快速檢索及建立在分類之上的應(yīng)用帶來 了極大挑戰(zhàn)。
[0003] 目前為止,常見的圖像分類技術(shù)包括基于色彩特征的分類技術(shù),基于紋理特征的 分類技術(shù),基于形狀特征的分類技術(shù)和基于空間關(guān)系的分類技術(shù)?;谏侍卣鞯姆诸惣?術(shù)假設(shè)每種物體都有其特有的色彩特征,由于顏色直方圖具有簡單且對旋轉(zhuǎn)和縮放不敏感 等特征,得到了廣泛的關(guān)注;基于紋理的圖像分類技術(shù),經(jīng)歷了從灰度共生矩陣到小波變換 的過程,達(dá)到了一定分類效果;基于形狀分析的圖像分類技術(shù)大多圍繞著形狀的輪廓特征 和形狀的區(qū)域特征,更常用的辦法是采用區(qū)域特征和邊界特征相結(jié)合的形式進(jìn)行形狀相似 性分析;基于空間關(guān)系的圖像分類技術(shù),由于利用圖像中對象間的位置空間關(guān)系區(qū)別圖像, 符合人們識別圖像的習(xí)慣,所以近些年許多研宄人員從圖像中對象空間位置關(guān)系出發(fā)著手 分析,雖然起到過一定作用,但由于它們都是采用對象的最小外接矩形來表示一個(gè)對象空 間位置,這對于矩形對象來說是比較合適的,但是當(dāng)兩個(gè)對象是不規(guī)則形狀,且它們在空間 關(guān)系上是分離時(shí),它們的外接矩形卻存在著某種包含和交疊,結(jié)果出現(xiàn)對這些對象空間關(guān) 系的錯(cuò)誤表不。
[0004] 雖然目前圖像分類的方法很多,但大多沒有考慮圖像中的文本特征對分類起到的 作用。同時(shí),對整個(gè)圖像提取特征不但不是必須的而且需要花費(fèi)大量計(jì)算時(shí)間。
【發(fā)明內(nèi)容】
[0005] 發(fā)明目的:本發(fā)明所要解決的問題是針對目前圖像分類技術(shù)的不足,提供一種基 于多尺度全局特征和局部特征的圖像分類方法,特別是利用圖像中的文本信息提取有效顯 著區(qū)域并計(jì)算顯著區(qū)域中的顏色特征和空間分布特征,利用小波圖像金字塔得到多尺度全 局特征,利用四分樹算法得到局部特征,最后結(jié)合多尺度全局特征和局部特征對圖像進(jìn)行 分類。
[0006] 為了解決上述問題,本發(fā)明公開了一種基于多尺度全局特征和局部特征的圖像分 類方法,包括以下步驟:
[0007] 將待分類圖像數(shù)據(jù)庫中的每張?jiān)紙D像I作為輸入,執(zhí)行步驟1~步驟11 :
[0008] 步驟1 :利用MATLAB軟件提供的小波圖像金字塔算法輸入原始圖像I,輸出五種不 同尺度的圖像,每種尺度的圖像作為下一步的輸入圖像,執(zhí)行步驟2~步驟9 ;五種不同尺 度的圖像處理完畢后執(zhí)行步驟10 ;
[0009] 步驟2 :計(jì)算輸入圖像的灰度圖像。其中輸入圖像屬于RGB顏色空間,每個(gè)像素由 紅,綠,藍(lán)三個(gè)顏色值決定,每種顏色取值范圍O~255。計(jì)算后的灰度圖像每個(gè)像素由一個(gè) 灰度值決定,灰度值取值范圍〇~255 ;
[0010] 步驟3 :利用MATLAB軟件提供的Canny邊緣和Sobel邊緣計(jì)算方法,計(jì)算灰度圖 像的Canny邊緣圖像和Sobel邊緣圖像。其中,Canny邊緣圖像和Sobel邊緣圖像都屬于 二值圖像,每個(gè)像素取值〇或1 ;
[0011] 步驟4 :分別計(jì)算Canny邊緣圖像的特征向量場和Sobel邊緣圖像的特征向量 場。計(jì)算得到的特征向量場在每個(gè)像素處,其值為一個(gè)向量,表示該像素處場值的大小和方 向;
[0012] 步驟5 :分別計(jì)算Canny特征向量場的顯著區(qū)域和Sobel特征向量場的顯著區(qū)域。 其中,顯著區(qū)域表現(xiàn)為二值圖像,像素值為〇表示該像素不屬于顯著區(qū)域,像素值為1表示 該像素屬于顯著區(qū)域;
[0013] 步驟6 :計(jì)算Canny顯著區(qū)域和Sobel顯著區(qū)域的交集,得到這兩種顯著區(qū)域的重 合區(qū)域,過濾后作為最終顯著區(qū)域;
[0014] 步驟7 :提取最終顯著區(qū)域的空間分布特征;
[0015] 步驟8 :根據(jù)最終顯著區(qū)域,保留其對應(yīng)位置處輸入圖像的像素值,提取這些像素 值的顏色特征。顏色特征包括RGB顏色特征,HSV顏色特征和灰度顏色特征;
[0016] 步驟9 :合并步驟7得到的空間分布特征和步驟8得到的顏色特征,得到原始圖像 的全局特征。
[0017] 步驟10 :將原始圖像I用四分樹算法四等分為四個(gè)區(qū)域,每一個(gè)區(qū)域作為輸入圖 像,執(zhí)行步驟2~步驟8,得到輸入圖像的空間分布特征和顏色特征,合并空間分布特征和 顏色特征,得到原始圖像的局部特征;
[0018] 步驟11 :整合步驟9和步驟10得到的原始圖像的全局特征和局部特征,作為圖像 的分類特征;
[0019] 步驟12 :選擇邏輯回歸分類器,對數(shù)據(jù)庫中的圖像進(jìn)行分類。
[0020] 本發(fā)明步驟4中,計(jì)算Canny邊緣圖像的特征向量場和Sobel邊緣圖像的特征向 量場包括以下步驟,定義能量函數(shù)ε,通過最小化能量函數(shù) ε計(jì)算Canny邊緣圖像的特征 向量場gcanny:
【主權(quán)項(xiàng)】
1. 一種基于多尺度全局特征和局部特征的圖像分類方法,其特征在于,包括以下步 驟: 將待分類圖像數(shù)據(jù)庫中的每張?jiān)紙D像I作為輸入,執(zhí)行步驟1~步驟11 : 步驟1:利用小波圖像金字塔算法輸入原始圖像I,輸出五種不同尺度的圖像,每種尺 度的圖像作為下一步的輸入圖像,執(zhí)行步驟2~步驟9,五種不同尺度的圖像處理完畢后執(zhí) 行步驟10 ; 步驟2 :計(jì)算輸入圖像的灰度圖像,其中輸入圖像屬于RGB顏色空間,每個(gè)像素由紅, 綠,藍(lán)三個(gè)顏色值決定,每種顏色取值范圍0~255,計(jì)算后的灰度圖像每個(gè)像素由一個(gè)灰 度值決定,灰度值取值范圍〇~255 ; 步驟3 :計(jì)算灰度圖像的Canny邊緣圖像和Sobel邊緣圖像,其中,Canny邊緣圖像和 Sobel邊緣圖像都屬于二值圖像,每個(gè)像素取值0或1 ; 步驟4 :分別計(jì)算Canny邊緣圖像的特征向量場和Sobel邊緣圖像的特征向量場,計(jì)算 得到的特征向量場在每個(gè)像素處,其值為一個(gè)向量,表示該像素處場值的大小和方向; 步驟5 :分別計(jì)算Canny特征向量場的顯著區(qū)域和Sobel特征向量場的顯著區(qū)域,其 中,顯著區(qū)域表現(xiàn)為二值圖像,像素值為0表示該像素不屬于顯著區(qū)域,像素值為1表示該 像素屬于顯著區(qū)域; 步驟6 :計(jì)算Canny顯著區(qū)域和Sobel顯著區(qū)域的交集,得到這兩種顯著區(qū)域的重合區(qū) 域,過濾后作為最終顯著區(qū)域; 步驟7 :提取最終顯著區(qū)域的空間分布特征; 步驟8 :根據(jù)最終顯著區(qū)域,保留其對應(yīng)位置處輸入圖像的像素值,提取這些像素值的 顏色特征,顏色特征包括RGB顏色特征,HSV顏色特征和灰度顏色特征,RGB顏色指紅色Red, 綠色Green和藍(lán)色Blue首字母縮寫,HSV顏色指色調(diào)Hue,飽和度Saturation和亮度Value 首字母縮寫; 步驟9 :合并步驟7得到的空間分布特征和步驟8得到的顏色特征,得到原始圖像的全 局特征; 步驟10 :將原始圖像I用四分樹算法四等分為四個(gè)區(qū)域,每一個(gè)區(qū)域作為輸入圖像,執(zhí) 行步驟2~步驟8,得到輸入圖像的空間分布特征和顏色特征,合并空間分布特征和顏色特 征,得到原始圖像的局部特征; 步驟11 :整合步驟9和步驟10得到的原