本發(fā)明屬于電子技術(shù)領(lǐng)域,更進(jìn)一步涉及圖像數(shù)據(jù)處理技術(shù)領(lǐng)域中的一種基于支持向量機(jī)的運(yùn)動(dòng)目標(biāo)分類方法。本發(fā)明可用于對(duì)視頻圖像處理中的運(yùn)動(dòng)目標(biāo)進(jìn)行精確的分類,為后續(xù)的目標(biāo)追蹤和識(shí)別提供可靠數(shù)據(jù)。
背景技術(shù):
視頻中運(yùn)動(dòng)目標(biāo)的分類在對(duì)視頻圖像分析研究中起著重要的作用,為后續(xù)的目標(biāo)追蹤和行為分析等處理環(huán)節(jié)提供實(shí)時(shí)有效的結(jié)果和數(shù)據(jù)。
目前常用的運(yùn)動(dòng)目標(biāo)分類方法有基于形狀特征的方法、基于運(yùn)動(dòng)特征的方法和基于學(xué)習(xí)的方法等,但到目前為止還不存在一個(gè)通用的方法?;谛螤钐卣鞯姆诸惙椒ǜ鶕?jù)目標(biāo)的形狀特征達(dá)到分類的效果,但他依賴于目標(biāo)的完整提取,當(dāng)背景復(fù)雜,運(yùn)動(dòng)目標(biāo)模糊的情況下,形狀特征不能準(zhǔn)確提取,分類精度不高。
目前有很多基于監(jiān)督學(xué)習(xí)的目標(biāo)識(shí)別算法應(yīng)用到運(yùn)動(dòng)目標(biāo)分類識(shí)別中,基于支持向量機(jī)的運(yùn)動(dòng)目標(biāo)分類是最簡(jiǎn)單、使用最普遍的方法之一。
張壯署,蔡曉東在其發(fā)表的論文“監(jiān)控視頻中運(yùn)動(dòng)目標(biāo)識(shí)別分類系統(tǒng)研究”(《電視技術(shù)》2012年23期第165-167頁(yè))中公開了一種基于監(jiān)控視頻中運(yùn)動(dòng)目標(biāo)識(shí)別分類算法。該算法通過(guò)提取視頻中運(yùn)動(dòng)目標(biāo)的高階矩、長(zhǎng)寬比和占空比,然后利用支持向量機(jī)來(lái)進(jìn)行訓(xùn)練識(shí)別分類。該方法存在的不足之處是,當(dāng)運(yùn)動(dòng)目標(biāo)比較模糊時(shí),運(yùn)動(dòng)目標(biāo)的形狀特征不明顯,導(dǎo)致分類精確度不高。
北京環(huán)境特性研究所申請(qǐng)的專利文件“一種基于視頻圖像的目標(biāo)分類方法”(專利申請(qǐng)?zhí)?01510012901.7,公布號(hào)CN 104657741 A)公開了一種基于視頻圖像的運(yùn)動(dòng)目標(biāo)分類方法。該方法的實(shí)現(xiàn)過(guò)程為,根據(jù)連續(xù)的視頻圖像進(jìn)行監(jiān)控區(qū)域的背景學(xué)習(xí),獲得監(jiān)控區(qū)域的當(dāng)前背景圖形,根據(jù)當(dāng)前背景圖像對(duì)當(dāng)前視頻幀進(jìn)行逐像素背景差分操作和圖像分割操作,形成目標(biāo)圖像,從目標(biāo)圖像中提取目標(biāo)區(qū)域,對(duì)各個(gè)目標(biāo)區(qū)域進(jìn)行主成份分析,計(jì)算目標(biāo)區(qū)域的矩形飽和度特征,根據(jù)矩形飽和度特征和預(yù)設(shè)的閾值,對(duì)目標(biāo)區(qū)域進(jìn)行分類。該方法存在的不足之處是,通過(guò)逐像素背景差分得到目標(biāo)圖像,當(dāng)背景復(fù)雜且存在背景運(yùn)動(dòng)干擾的情況下不能正確提取出運(yùn)動(dòng)目標(biāo)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服上述已有技術(shù)的不足,提出一種基于支持向量機(jī)的運(yùn)動(dòng)目標(biāo)分類方法,將彩色視頻圖像轉(zhuǎn)換成灰度圖像,采用混合高斯背景建模建立背景圖像,提取出視頻中的運(yùn)動(dòng)目標(biāo),對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行形態(tài)學(xué)濾波,再對(duì)處理過(guò)的運(yùn)動(dòng)目標(biāo)進(jìn)行邊緣,梯度,信息熵提取,訓(xùn)練支持向量機(jī),得到分類器模型,從而在保證環(huán)境多變的情況下有效的完成視頻運(yùn)動(dòng)目標(biāo)的分類處理,提高了運(yùn)動(dòng)目標(biāo)分類的精確度。
實(shí)現(xiàn)本發(fā)明目的的具體步驟如下:
(1)利用攝像頭讀取待分類運(yùn)動(dòng)目標(biāo)的彩色紅綠藍(lán)RGB視頻;
(2)逐幀讀取待分類運(yùn)動(dòng)目標(biāo)的彩色紅綠藍(lán)RGB視頻,得到彩色視頻幀圖像;
(3)在彩色視頻圖像中隨機(jī)讀取一幀圖像,得到一幀待處理彩色視頻圖像;
(4)預(yù)處理;
(4a)按照下式,計(jì)算待處理彩色視頻幀圖像轉(zhuǎn)換成灰度圖像中每一像素點(diǎn)的灰度值,將計(jì)算后的灰度值組成灰度圖像;
Grayi,j=0.299Ri,j+0.587Gi,j+0.114Bi,j
其中,Grayi,j表示灰度圖像中第i行,第j列像素點(diǎn)的灰度值,Ri,j表示彩色視頻幀圖像中第i行,第j列的像素點(diǎn)的紅色分量值,Gi,j表示彩色視頻幀圖像中第i行,第j列像素點(diǎn)的綠色分量值,Bi,j表示彩色視頻幀圖像中第i行,第j列像素點(diǎn)的藍(lán)色分量值;
(4b)采用混合高斯背景建模建立背景圖像,保存該混合高斯背景建模得到的最終背景圖像;
(4c)用灰度圖像減去最終背景圖像,得到運(yùn)動(dòng)目標(biāo)圖像;
(4d)二值化運(yùn)動(dòng)目標(biāo)圖像,得到二值化運(yùn)動(dòng)目標(biāo)圖像;
(4e)對(duì)二值化運(yùn)動(dòng)目標(biāo)圖像進(jìn)行形態(tài)學(xué)濾波,得到濾波后的運(yùn)動(dòng)目標(biāo)圖像;
(5)提取濾波后的運(yùn)動(dòng)目標(biāo)圖像的邊緣、信源熵和梯度三個(gè)特征;
(5a)利用Canny算子,提取濾波后的運(yùn)動(dòng)目標(biāo)圖像的邊緣強(qiáng)度,將所提取的邊緣強(qiáng)度作為邊緣強(qiáng)度特征值;
(5b)利用梯度強(qiáng)度公式,提取濾波后的運(yùn)動(dòng)目標(biāo)圖像的梯度強(qiáng)度;
(5c)利用信源熵公式,提取濾波后的運(yùn)動(dòng)目標(biāo)圖像的信源熵;
(6)判斷是否讀取完所有的彩色視頻幀圖像,若是,則執(zhí)行步驟(7),否則,執(zhí)行步驟(3);
(7)將所有運(yùn)動(dòng)目標(biāo)圖像的特征組成目標(biāo)特征集。
(8)用目標(biāo)特征集訓(xùn)練支持向量機(jī);
(8a)將目標(biāo)特征集均分為兩部分,一部分作為訓(xùn)練特征集,一部分作為測(cè)試特征集;
(8b)將訓(xùn)練特征集投入到支持向量機(jī)中訓(xùn)練,得到檢測(cè)模型分類器;
(8c)將測(cè)試特征集放入檢測(cè)模型分類器中,得到與檢測(cè)模型分類器的分類模式對(duì)應(yīng)的分類結(jié)果;
(9)輸出分類結(jié)果。
本發(fā)明與現(xiàn)有技術(shù)相比具有如下優(yōu)點(diǎn):
第一,由于本發(fā)明通過(guò)使用運(yùn)動(dòng)目標(biāo)圖像的邊緣、信源熵和梯度三個(gè)特征來(lái)訓(xùn)練支持向量機(jī),克服了現(xiàn)有技術(shù)中僅使用運(yùn)動(dòng)目標(biāo)的形狀特征來(lái)訓(xùn)練支持向量機(jī),而該方法當(dāng)運(yùn)動(dòng)目標(biāo)比較模糊時(shí),運(yùn)動(dòng)目標(biāo)的形狀特征不明顯,分類精確度不高的缺點(diǎn),使得本發(fā)明具有更加明顯的運(yùn)動(dòng)目標(biāo)特征,達(dá)到精確分類的優(yōu)點(diǎn)。
第二,由于本發(fā)明采用了混合高斯背景建模建立背景圖像,對(duì)運(yùn)動(dòng)目標(biāo)圖像進(jìn)行形態(tài)學(xué)濾波來(lái)提取運(yùn)動(dòng)目標(biāo)圖像,克服了現(xiàn)有技術(shù)通過(guò)逐像素背景差分得到目標(biāo)圖像,而該方法當(dāng)背景復(fù)雜且存在背景運(yùn)動(dòng)干擾的情況下,不能正確提取出運(yùn)動(dòng)目標(biāo)的缺點(diǎn),使得本發(fā)明具有減小了背景的干擾,使得提取的運(yùn)動(dòng)目標(biāo)更加精確的優(yōu)點(diǎn)。
附圖說(shuō)明
圖1為本發(fā)明的流程圖;
圖2為采用本發(fā)明與現(xiàn)有技術(shù)提取的運(yùn)動(dòng)目標(biāo)仿真實(shí)驗(yàn)對(duì)比圖;
圖3為本發(fā)明實(shí)測(cè)數(shù)據(jù)的分類結(jié)果示意圖。
具體實(shí)施方式
下面結(jié)合附圖,對(duì)本發(fā)明的具體實(shí)施步驟做進(jìn)一步的詳細(xì)描述。
參照附圖1,本發(fā)明的具體步驟如下。
步驟1.利用攝像頭讀取待分類運(yùn)動(dòng)目標(biāo)的彩色紅綠藍(lán)RGB視頻。
步驟2.逐幀讀取待分類運(yùn)動(dòng)目標(biāo)的彩色紅綠藍(lán)RGB視頻,得到彩色視頻幀圖像。
步驟3.在彩色視頻圖像中隨機(jī)讀取一幀圖像,得到一幀待處理彩色視頻圖像。
步驟4.預(yù)處理。
按照下式,計(jì)算待處理彩色視頻幀圖像轉(zhuǎn)換成灰度圖像中每一像素點(diǎn)的灰度值,將計(jì)算后的灰度值組成灰度圖像。
Grayi,j=0.299Ri,j+0.587Gi,j+0.114Bi,j
其中,Grayi,j表示灰度圖像中第i行,第j列像素點(diǎn)的灰度值,Ri,j表示彩色視頻幀圖像中第i行,第j列的像素點(diǎn)的紅色分量值,Gi,j表示彩色視頻幀圖像中第i行,第j列像素點(diǎn)的綠色分量值,Bi,j表示彩色視頻幀圖像中第i行,第j列像素點(diǎn)的藍(lán)色分量值。
采用混合高斯背景建模建立背景圖像,保存該混合高斯背景建模得到的最終背景圖像。
采用混合高斯背景建模建立背景圖像的具體步驟如下:
第1步,在彩色視頻圖像中隨機(jī)讀取視頻圖像的一幀圖像,將所讀取的彩色視頻幀圖像作為參考幀圖像,用參考幀圖像初始化混合高斯背景模型,得到初始化背景圖像。
第2步,在彩色視頻幀圖像中讀取一幀沒(méi)有讀取過(guò)的彩色視頻幀,根據(jù)所讀取的彩色視頻幀圖像的像素點(diǎn)之間的關(guān)聯(lián)程度,對(duì)該彩色視頻幀圖像進(jìn)行抖動(dòng)預(yù)判斷和穩(wěn)健處理,得到處理后的彩色視頻幀圖像。
第3步,對(duì)比初始化背景圖像與處理后彩色視頻幀圖像的相似度,將初始化背景圖像與處理后彩色視頻幀圖像的相似度小于85%時(shí)的處理后彩色視頻幀圖像,作為參考幀圖像,將該參考幀圖像放入高斯模型中更新該高斯模型。
第4步,判斷是否讀取完所有的彩色視頻幀,若是,則執(zhí)行第5步,否則,執(zhí)行第2步。
第5步,將高斯模型更新后的最后一幅圖像作為最終背景圖像。
用灰度圖像減去最終背景圖像,得到運(yùn)動(dòng)目標(biāo)圖像。
利用二值化運(yùn)動(dòng)目標(biāo)圖像的公式,對(duì)運(yùn)動(dòng)目標(biāo)圖像進(jìn)行二值化,得到二值化運(yùn)動(dòng)目標(biāo)圖像。
二值化運(yùn)動(dòng)目標(biāo)圖像的公式如下:
其中,M(x,y)表示二值化運(yùn)動(dòng)目標(biāo)圖像在像素點(diǎn)(x,y)的像素值,D(x,y)表示運(yùn)動(dòng)目標(biāo)圖像在像素點(diǎn)(x,y)的像素值,x表示運(yùn)動(dòng)目標(biāo)圖像的橫坐標(biāo),y表示運(yùn)動(dòng)目標(biāo)圖像的縱坐標(biāo),T表示二值化的閾值,其大小為196個(gè)像素。
對(duì)二值化運(yùn)動(dòng)目標(biāo)圖像進(jìn)行形態(tài)學(xué)濾波,得到濾波后的運(yùn)動(dòng)目標(biāo)圖像。
步驟5.提取濾波后的運(yùn)動(dòng)目標(biāo)圖像的邊緣、信源熵和梯度三個(gè)特征。
利用Canny算子,提取濾波后的運(yùn)動(dòng)目標(biāo)圖像的邊緣強(qiáng)度,將所提取的邊緣強(qiáng)度作為邊緣強(qiáng)度特征值。
利用Canny算子提取濾波后的運(yùn)動(dòng)目標(biāo)圖像的邊緣強(qiáng)度,將所提取的邊緣強(qiáng)度作為邊緣強(qiáng)度特征值的具體步驟如下:
第1步,用濾波后的運(yùn)動(dòng)目標(biāo)圖像與高斯平滑濾波器做卷積,得到卷積后圖像;
第2步,使用一階有限差分對(duì)卷積后圖像計(jì)算偏導(dǎo)數(shù),得到兩個(gè)陣列P和Q;
第3步,按照下式,計(jì)算卷積后圖像的邊緣強(qiáng)度M;
第4步,利用二分法,在[0,100]內(nèi)選擇一個(gè)自然數(shù),將所選自然數(shù)作為Canny算子的閾值;
第5步,比較邊緣強(qiáng)度與Canny算子閾值的大小,將邊緣強(qiáng)度大于Canny算子閾值的邊緣強(qiáng)度作為邊緣強(qiáng)度特征值。
利用如下梯度強(qiáng)度公式,提取濾波后的運(yùn)動(dòng)目標(biāo)圖像的梯度強(qiáng)度。
其中,E表示濾波后運(yùn)動(dòng)目標(biāo)圖像的信源熵,∑表示求和操作,N表示濾波后運(yùn)動(dòng)目標(biāo)圖像的像素點(diǎn)總數(shù),p(n)表示濾波后運(yùn)動(dòng)目標(biāo)圖像的第n個(gè)像素點(diǎn)對(duì)應(yīng)灰度值的概率,log2表示以2為底的對(duì)數(shù)操作。
利用如下信源熵公式,提取濾波后的運(yùn)動(dòng)目標(biāo)圖像的信源熵。
其中,||Δf||2表示濾波后運(yùn)動(dòng)目標(biāo)圖像的梯度強(qiáng)度,表示平方根操作,Gu表示濾波后的運(yùn)動(dòng)目標(biāo)圖像水平方向的梯度幅值,Gv表示濾波后的運(yùn)動(dòng)目標(biāo)圖像垂直方向的梯度幅值,表示求偏導(dǎo)操作,f表示濾波后運(yùn)動(dòng)目標(biāo)圖像的信息量,u表示濾波后的運(yùn)動(dòng)目標(biāo)圖像空間的橫坐標(biāo)的坐標(biāo)值,v表示濾波后的運(yùn)動(dòng)目標(biāo)圖像空間的縱坐標(biāo)坐標(biāo)值。
步驟6.判斷是否讀取完所有的彩色視頻幀圖像,若是,則執(zhí)行步驟7,否則,執(zhí)行步驟3。
步驟7.將所有運(yùn)動(dòng)目標(biāo)圖像的特征組成目標(biāo)特征集。
步驟8.用目標(biāo)特征集訓(xùn)練支持向量機(jī)。
將目標(biāo)特征集均分為兩部分,一部分作為訓(xùn)練特征集,一部分作為測(cè)試特征集。
將訓(xùn)練特征集投入到支持向量機(jī)中訓(xùn)練,得到檢測(cè)模型分類器。
將測(cè)試特征集放入檢測(cè)模型分類器中,得到與檢測(cè)模型分類器的分類模式對(duì)應(yīng)的分類結(jié)果。
步驟9.輸出分類結(jié)果。
下面結(jié)合附圖2對(duì)本發(fā)明的仿真效果做進(jìn)一步的描述。
1.仿真實(shí)驗(yàn)的條件:
在CPU為core 3.06GHZ、內(nèi)存2G、WINDOWS XP系統(tǒng)上使用Microsoft Visual C++6.0編程環(huán)境進(jìn)行仿真。
2.仿真實(shí)驗(yàn)的內(nèi)容結(jié)果分析:
用本發(fā)明方法和現(xiàn)有的運(yùn)動(dòng)目標(biāo)分類方法分別對(duì)采集的視頻進(jìn)行仿真,并比較其效果。本發(fā)明的仿真實(shí)驗(yàn)是采用本發(fā)明方法和現(xiàn)有技術(shù)的方法分別對(duì)實(shí)際場(chǎng)景的視頻做處理。提取的運(yùn)動(dòng)目標(biāo)對(duì)比結(jié)果如圖2所示,其中圖2(a)為逐像素背景差分算法提取的白天的運(yùn)動(dòng)目標(biāo);圖2(b)為逐像素背景差分算法提取的夜晚的運(yùn)動(dòng)目標(biāo);圖2(c)為本發(fā)明提取的白天的運(yùn)動(dòng)目標(biāo);圖2(d)為逐像素背景差分算法提取的夜晚的運(yùn)動(dòng)目標(biāo)。通過(guò)圖2可見,像素背景差分算法提取的運(yùn)動(dòng)目標(biāo)中包含了人的陰影,本發(fā)明提取的運(yùn)動(dòng)目標(biāo)明顯優(yōu)于像素背景差分算法提取的運(yùn)動(dòng)目標(biāo)。從圖2仿真實(shí)驗(yàn)結(jié)果可以看出,采用高斯背景建模建立背景提取運(yùn)動(dòng)目標(biāo)的方法,能夠在保護(hù)運(yùn)動(dòng)目標(biāo)完整性的前提下,避免復(fù)雜背景的影響,有效地提取出精確的運(yùn)動(dòng)目標(biāo),完整且較精確的運(yùn)動(dòng)目標(biāo)可以使得分類更加精確。
通過(guò)本發(fā)明方法和現(xiàn)有方法對(duì)數(shù)據(jù)庫(kù)中的10個(gè)視頻中的運(yùn)動(dòng)目標(biāo)進(jìn)行分類,本次實(shí)驗(yàn)將目標(biāo)分為人和其他運(yùn)動(dòng)目標(biāo),經(jīng)過(guò)分類結(jié)果與真實(shí)運(yùn)動(dòng)目標(biāo)的類型做比較,統(tǒng)計(jì)分類結(jié)果的正確率。據(jù)統(tǒng)計(jì),本發(fā)明的分類準(zhǔn)確率為96.76%,現(xiàn)有方法的分類準(zhǔn)確率為95.98%。由此可以看出,本發(fā)明比現(xiàn)有方法能夠獲得更高的分類準(zhǔn)確率。