本發(fā)明屬于圖像處理技術(shù)領(lǐng)域,特別涉及了基于深度卷積和梯度旋轉(zhuǎn)不變性的航拍圖像目標(biāo)檢測方法。
背景技術(shù):
近年來,隨著航拍技術(shù)的不斷發(fā)展,高分辨率航拍遙感相機相繼研制成功,航拍圖像在應(yīng)急救災(zāi)、數(shù)字城市建設(shè)、工程設(shè)計等重大需求領(lǐng)域得到了廣泛的應(yīng)用;同時,隨著大數(shù)據(jù)技術(shù)的興起為航拍圖像處理提供了新的思路。航拍圖像包含的豐富信息量,覆蓋了各個尺度的物體,且分布密集,如何快速高效地實現(xiàn)航拍圖像目標(biāo)檢測至關(guān)重要。
航拍圖像具有大范圍、寬視角、高分辨率、數(shù)據(jù)量巨大的特點,這給目標(biāo)檢測帶來巨大的問題與挑戰(zhàn)。航拍圖像成像角度變化大,一般的特征算子需要提取出不同角度的特征,再進行合并與篩選,這使得計算量大大的增加;同時,且由于航拍鏡頭的變化以及航拍目標(biāo)的多變使得通常的目標(biāo)檢測算法難以適用于航拍圖像目標(biāo)檢測。目前的研究主要是通過結(jié)合低層特征與模型來實現(xiàn)對航拍圖像目標(biāo)的分割與檢測,沒有充分考慮到圖像的高層特征以及隱藏在其中的角度不變特征。
技術(shù)實現(xiàn)要素:
為了解決上述背景技術(shù)提出的技術(shù)問題,本發(fā)明旨在提供基于深度卷積和梯度旋轉(zhuǎn)不變性的航拍圖像目標(biāo)檢測方法,克服了航拍圖像成像角度變化大、航拍鏡頭變化大以及航拍目標(biāo)多變帶來的困難。
為了實現(xiàn)上述技術(shù)目的,本發(fā)明的技術(shù)方案為:
基于深度卷積和梯度旋轉(zhuǎn)不變性的航拍圖像目標(biāo)檢測方法,包括以下步驟:
(1)輸入航拍圖像,利用BING算法對目標(biāo)進行粗定位,提取包含目標(biāo)的感興趣區(qū)域;
(2)對于步驟(1)提取到的感興趣區(qū)域,采用AlexNet深度卷積網(wǎng)絡(luò)進行分析,選取AlexNet深度卷積網(wǎng)絡(luò)的Pooling5層為最佳角度不敏感特征,即AP特征;
(3)基于旋轉(zhuǎn)梯度不變性,提取感興趣區(qū)域的旋轉(zhuǎn)梯度不變特征,即RGT特征;
(4)采用SFFS算法融合步驟(2)得到的AP特征和步驟(3)得到的RGT特征,生成AP-RGT特征;
(5)使用支持向量機對生成的AP-RGT特征進行訓(xùn)練分類,并在SVM分類器后進行非極大值抑制的過程,過濾錯誤的分類,再建立優(yōu)化問題,求解得到目標(biāo)檢測結(jié)果。
進一步地,步驟(1)的具體過程如下:
(a)使用模板[-1,0,+1]作用于航拍圖像,計算出航拍圖像的梯度值bk,l,并通過尺度變換將其歸一化到8*8的尺度,得到歸一化的梯度特征值Ng,其中,bk,l的下標(biāo)k、l分別表示模板[-1,0,+1]的行和列;
(b)利用二進制估計算法,對梯度特征值Ng進行估計,獲得BING特征:
(c)將獲得的BING特征輸入到LinearSVM中進行訓(xùn)練,得到SVM分類器,作為第一級分類器,將得到的第一級分類器作用于訓(xùn)練樣本所在的位置,得到待選目標(biāo)框,通過非極大值抑制濾去錯誤的待選目標(biāo)框,將剩下的待選目標(biāo)框作為第二級分類器的訓(xùn)練樣本,輸入到LinearSVM中進行訓(xùn)練,得到第二級分類器;
(d)利用窮舉法從航拍圖像上得到的感興趣區(qū)域的所有待選區(qū)域,將步驟(c)得到的級聯(lián)分類器作用于各個待選區(qū)域,每一個待選區(qū)域通過線性模型w∈R64打分機制進行評分:sl=<w,gl>,得分sl最高的待選區(qū)域即為感興趣區(qū)域,其中<w,gl>表示將線性模型w和BING特征gl作內(nèi)積運算。
進一步地,步驟(3)的具體過程如下:
(A)設(shè)提取到的感興趣區(qū)域圖像為I(x,y),S(x,y)為其對應(yīng)的離散圖像:
計算離散圖像的局部空間值:
Σ(x,y,s)=S(x+s,y+s)+S(x-s-1,y-s-1)-S(x+s,y-s-1)-S(x-s-1,y+s)上式中s表示某一尺度,(x,y)為感興趣區(qū)域內(nèi)的點;
為增加特征的尺度不變性并降低計算復(fù)雜度,利用金字塔尺度空間獲取不同尺度下的局部空間值,再通過比較得到局部空間極值,局部空間極值對應(yīng)的尺度即為給定尺度;
(B)采用可變核函數(shù)檢測感興趣區(qū)域,在檢測過程中,對于同一個點采用兩個不同大小的核函數(shù),在步驟(A)獲得的給定尺度s下,內(nèi)部的核函數(shù)為2s+1,外部的核函數(shù)為4s+1,則濾波器響應(yīng):
F(x,y,s)=B(x,y,s)-B(x,y,2s)
上式中B(x,y,s)為區(qū)域規(guī)范化輸出:
B(x,y,s)=(2s+1)-2Σ(x,y,s)
上式中Σ(x,y,s)為步驟(A)得到的局部空間極值,表示大小為2s+1的區(qū)域中所有像素和;
(C)在給定尺度下獲取感興趣特征點,以感興趣特征點為圓心抽取直徑為sp的統(tǒng)計塊,處于統(tǒng)計塊內(nèi)的點的坐標(biāo)表示:
上式中s*u,s*v分別對應(yīng)為x,y在給定尺度s下的離散值;
(D)將統(tǒng)計塊內(nèi)的笛卡爾梯度方向作為該統(tǒng)計塊的方向,計算統(tǒng)計塊內(nèi)的梯度值并歸一化,得到RGT特征。
:進一步地,步驟(4)的具體過程如下:
(Ⅰ)設(shè)AP-RGT特征的集合為Z,集合Z初始為空集,在AP特征集和RGT特征集的并集中選擇一個子集t加入集合Z中,并使加入子集t后的集合Z的評價函數(shù)達(dá)到最優(yōu);
(Ⅱ)在集合Z中剔除子集z,并使剔除子集z后的集合Z的評價函數(shù)達(dá)到最優(yōu);
(Ⅲ)循環(huán)步驟(Ⅰ)-(Ⅱ),得到nrep個候選集合Z;
(IV)計算各候選集合Z的貝葉斯分類精度:
Jnrep(Z)=1-E[{ε(Z,Tr;Dr)}]
上式中,E(*)表示求期望,ε(Z,Tr;Dr)則表示貝葉斯分類錯分率,Tr表示錯分的集合,Dr表示訓(xùn)練集,r=1,2,…,nrep;
選擇貝葉斯分類精度值最大對應(yīng)的集合Z作為融合后的AP-RGT特征集。
進一步地,在步驟(5)中,使用的分類函數(shù)為其中xi為輸入,yi為輸出,xi,yi∈Z,Z為步驟(4)得到的AP-RGT特征集,為當(dāng)前特征距離分類平面的間隔,為設(shè)置的特征距離分類平面的最大間隔,b為偏移量,ω為需要求取的目標(biāo)檢測結(jié)果;將作為優(yōu)化問題的目標(biāo)函數(shù),求得該問題的最優(yōu)解即為最終的目標(biāo)檢測結(jié)果。
采用上述技術(shù)方案帶來的有益效果:
本發(fā)明提出基于AP特征的提取方法,解決航拍圖像鏡頭旋轉(zhuǎn)以及飛行帶來仿射變換等問題;結(jié)合旋轉(zhuǎn)梯度不變性,引入RGT特征,增加了特征的魯棒性與表征力,進一步提高目標(biāo)檢測的準(zhǔn)確率;利用SFFS算法將AP和RGT兩類特征進行融合生成AP-RGT特征,在降低維數(shù)的同時,提高了檢測速度。突破了航拍圖像在飛行過程中由于旋轉(zhuǎn)需要多次提取不同角度特征的局限性。本發(fā)明適用于高分辨率的航拍圖像目標(biāo)檢測。
附圖說明
圖1是本發(fā)明的基本流程圖。
具體實施方式
以下將結(jié)合附圖,對本發(fā)明的技術(shù)方案進行詳細(xì)說明。
如圖1所示,基于深度卷積和梯度旋轉(zhuǎn)不變性的航拍圖像目標(biāo)檢測方法,包括以下步驟:
步驟1、輸入航拍圖像,利用BING算法對目標(biāo)進行粗定位,提取包含目標(biāo)的感興趣區(qū)域。
使用模板[-1,0,+1]作用于航拍圖像,計算出航拍圖像的梯度值bk,l,通過尺度變換將其歸一化到8*8的尺度,得到歸一化的梯度特征值Ng,其中,bk,l的下標(biāo)k、l分別表示模板[-1,0,+1]的行和列;
利用二進制估計算法,對梯度特征值Ng進行估計,獲得BING特征:
將獲得的BING特征輸入到LinearSVM中進行訓(xùn)練,得到SVM分類器,作為第一級分類器,將得到的第一級分類器作用于訓(xùn)練樣本所在的位置,得到待選目標(biāo)框,通過非極大值抑制濾去錯誤的待選目標(biāo)框,將剩下的待選目標(biāo)框作為第二級分類器的訓(xùn)練樣本,輸入到LinearSVM中進行訓(xùn)練,得到第二級分類器。
利用窮舉法從航拍圖像上得到的感興趣區(qū)域的所有待選區(qū)域,將上述級聯(lián)分類器作用于各個待選區(qū)域,每一個待選區(qū)域通過線性模型w∈R64打分機制進行評分:sl=<w,gl>,得分sl最高的待選區(qū)域即為感興趣區(qū)域,其中<w,gl>表示將線性模型w和BING特征gl作內(nèi)積運算。
步驟2、對于步驟1提取到的感興趣區(qū)域,采用AlexNet網(wǎng)絡(luò)進行分析,提取AlexNet網(wǎng)絡(luò)的池化層Pooling5、全連結(jié)層Fc6、Fc7的特征來分析角度不敏感性,選取AlexNet網(wǎng)絡(luò)的Pooling5層為最佳角度不敏感特征,即AP特征。
步驟3、基于旋轉(zhuǎn)梯度不變性,提取感興趣區(qū)域的旋轉(zhuǎn)梯度不變特征,即RGT特征。
設(shè)提取到的感興趣區(qū)域圖像為I(x,y),S(x,y)為其對應(yīng)的離散圖像:
計算離散圖像的局部空間值:
∑(x,y,s)=S(x+s,y+s)+S(x-s-1,y-s-1)-S(x+s,y-s-1)-S(x-s-1,y+s)上式中s表示某一尺度,(x,y)為感興趣區(qū)域內(nèi)的點;
為增加特征的尺度不變性并降低計算復(fù)雜度,利用金字塔尺度空間獲取不同尺度下的局部空間值,再通過比較得到局部空間極值,局部空間極值對應(yīng)的尺度即為給定尺度。
采用可變核函數(shù)檢測感興趣區(qū)域,在檢測過程中,對于同一個點采用兩個不同大小的核函數(shù),在獲得的給定尺度s下,內(nèi)部的核函數(shù)為2s+1,外部的核函數(shù)為4s+1,則濾波器響應(yīng):
F(x,y,s)=B(x,y,s)-B(x,y,2s)
上式中B(x,y,s)為區(qū)域規(guī)范化輸出:
B(x,y,s)=(2s+1)-2∑(x,y,s)
上式中∑(x,y,s)為前述得到的局部空間極值,表示大小為2s+1的區(qū)域中所有像素和。
在給定尺度下獲取感興趣特征點,以感興趣特征點為圓心抽取直徑為sp的統(tǒng)計塊,處于統(tǒng)計塊內(nèi)的點的坐標(biāo)表示:
上式中s*u,s*v分別對應(yīng)為x,y在給定尺度s下的離散值。
將統(tǒng)計塊內(nèi)的笛卡爾梯度方向作為該統(tǒng)計塊的方向,計算統(tǒng)計塊內(nèi)的梯度值并歸一化,得到RGT特征。
步驟4、采用SFFS算法融合步驟2得到的AP特征和步驟3得到的RGT特征,生成AP-RGT特征。
設(shè)AP-RGT特征的集合為Z,集合Z初始為空集,在AP特征集和RGT特征集的并集中選擇一個子集t加入集合Z中,并使加入子集t后的集合Z的評價函數(shù)達(dá)到最優(yōu)。
在集合Z中剔除子集z,并使剔除子集z后的集合Z的評價函數(shù)達(dá)到最優(yōu)。
循環(huán)上述過程,得到nrep個候選集合Z。計算各候選集合Z的貝葉斯分類精度:
Jnrep(Z)=1-E[{ε(Z,Tr;Dr)}]
上式中,E(*)表示求期望,ε(Z,Tr;Dr)則表示貝葉斯分類錯分率,Tr表示錯分的集合,Dr表示訓(xùn)練集,r=1,2,…,nrep;
選擇貝葉斯分類精度值最大對應(yīng)的集合Z作為融合后的AP-RGT特征集。
步驟5、使用支持向量機對生成的AP-RGT特征進行訓(xùn)練分類,并在SVM分類器后進行非極大值抑制的過程,過濾錯誤的分類,再建立優(yōu)化問題,求解得到目標(biāo)檢測結(jié)果。
使用的分類函數(shù)為其中xi為輸入,yi為輸出,xi,yi∈Z,Z為步驟4得到的AP-RGT特征集,為當(dāng)前特征距離分類平面的間隔,為設(shè)置的特征距離分類平面的最大間隔,b為偏移量,ω為需要求取的目標(biāo)檢測結(jié)果;將作為優(yōu)化問題的目標(biāo)函數(shù),求得該問題的最優(yōu)解即為最終的目標(biāo)檢測結(jié)果。
以上實施例僅為說明本發(fā)明的技術(shù)思想,不能以此限定本發(fā)明的保護范圍,凡是按照本發(fā)明提出的技術(shù)思想,在技術(shù)方案基礎(chǔ)上所做的任何改動,均落入本發(fā)明保護范圍之內(nèi)。