專利名稱:一種基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種鏡頭邊界檢測方法,特別地,涉及一種基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測方法。
背景技術(shù):
在視頻檢索的過程中,鏡頭邊界檢測是整個系統(tǒng)的第一步,鏡頭邊界檢測的準(zhǔn)確度和效率的高低,關(guān)系到整個視頻檢索系統(tǒng)的成敗,是視頻檢索系統(tǒng)中至關(guān)重要的一步。鏡頭邊界檢測的任務(wù)就是通過比較視頻序列幀的差異來尋找鏡頭邊界,確定鏡頭變化類型和位置。目前,該領(lǐng)域內(nèi)解決鏡頭邊界檢測的方法主要是基于閾值和基于機(jī)器學(xué)習(xí)的?;陂撝档姆椒ㄓ捎陂撝颠x取的好壞對檢測效果有較大的影響;而且不同的視頻閾值差異很大。這些都限制了閾值方法更進(jìn)一步提高效果。近年來,基于機(jī)器學(xué)習(xí)的鏡頭邊界檢測方法得到了深入研究。在文獻(xiàn)題目:《Supervised classification for video shotsegmentation [A]》作者:Y Qi, Hauptmann A T Liu, IEEE ICME03[C]。Baltimore, MD, USA,2003,vol.2,689-692中,采用k最近鄰域分類、Naive Bayes可能性分類法和支持向量機(jī)將視頻序列幀分成切變幀和非切變幀;對非切變幀,又采用小波光滑去噪的方法來檢測漸變中貞,從而完成鏡頭邊界的分割。文獻(xiàn)題目:((Shot Boundary Detection Based on SVMsvia Visual Attention Features》作者:Li Xiuqiang, Xiao Guoqiang, Jiang Jianmin,2009 International Forum on Information Technology and Applications 中,提出了一種符合人類視覺注意的特征,并用以組成一定維數(shù)的特征向量,采用支持向量機(jī)完成突變和漸變的檢測。為了增強(qiáng)對運(yùn)動和噪音的魯棒性,提取亮度幀差來輔助檢測。文獻(xiàn)題目:((Algorithm for Shot Boundary Detection based on Support Vector Machine inCompressed Domain》作者:Jian-Rong Cao and An-Ni Cai,在 Tien Tzu Hsueh Pao/ActaElectronica Sinica,36(l) =203-208,2008中提出,利用滑動窗口的方法將提取到的壓縮域特征組成一個多維的特征向量,對SVM進(jìn)行訓(xùn)練,使用訓(xùn)練好的SVM模型對視頻幀進(jìn)行分類,從而得到鏡頭的邊界。但是支持向量機(jī)參數(shù)的選取至今仍然沒有一個統(tǒng)一的標(biāo)準(zhǔn),參數(shù)選取大多依靠經(jīng)驗(yàn)采取試湊的方法,這樣不僅費(fèi)時而且很難得到滿意的結(jié)果。本文使用粒子群優(yōu)化算法對支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化,首次使用支持向量機(jī)和粒子群優(yōu)化算法進(jìn)行鏡頭邊界檢測,對支持向量機(jī)的分類模型進(jìn)行了優(yōu)化,降低了參數(shù)選擇的盲目性和不準(zhǔn)確。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是:針對現(xiàn)有鏡頭邊界檢測技術(shù)的不足,提出一種基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測算法。能夠更加有目的和針對性的選取支持向量機(jī)的參數(shù),進(jìn)而得到近似最優(yōu)參數(shù),而且使得鏡頭分割的效果也在一定程度上提升。
本發(fā)明的技術(shù)方案是:使用一種新型的基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測算法,原始數(shù)據(jù)是待鏡頭邊界檢測的視頻數(shù)據(jù)。首先提取視頻數(shù)據(jù)的底層特征,本方法主要提取像素域上的顏色一階矩和顏色二階矩、顏色直方圖、角點(diǎn)、DC系數(shù)等特征。各種特征的具體提取如下:顏色一階矩顏色一階矩在鏡頭發(fā)生切變時會有劇烈變化,對于檢測切變有著較好的效果;另外,還可以和二階矩結(jié)合起來檢測是否發(fā)生漸變。一階矩的提取如下式所示:
權(quán)利要求
1.一種基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測算法,原始數(shù)據(jù)是待鏡頭邊界檢測的視頻數(shù)據(jù),其特征在于,包括以下步驟: (1),提取視頻數(shù)據(jù)的底層特征,本方法主要提取像素域上的顏色一階矩和顏色二階矩、顏色直方圖、角點(diǎn)、DC系數(shù)特征; (2),使用粒子群算法對選取支持向量機(jī)的懲罰因子和核函數(shù)參數(shù)進(jìn)行優(yōu)化; (3),利用得到的近似最優(yōu)參數(shù)訓(xùn)練得到最優(yōu)分類模型,并以此為基礎(chǔ)對視頻序列幀進(jìn)行分類,最終完成鏡頭分割。
2.根據(jù)權(quán)利要求1所述的基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測算法,其特征在于,所述的步驟(2)包括以下步驟: (2.A),種群初始化和參數(shù)初始設(shè)置,種群規(guī)模設(shè)定為由20個粒子組成,這些粒子的位置和速度是隨機(jī)生成的,懲罰因子c和核函數(shù)參數(shù)Y的變化范圍分別是
和
,加速常數(shù)Cl和c2分別取1.4和1.8 ; (2.B),適應(yīng)度值計算,種群規(guī)模設(shè)定為20,適應(yīng)度值的計算按照下式進(jìn)行:f(c, Y ) = accuracy,我們選用支持向量機(jī)中的交叉驗(yàn)證策略來計算訓(xùn)練集的適應(yīng)度值,綜合考慮到驗(yàn)證效率和準(zhǔn)確率,我們將訓(xùn)練集劃分為三個部分來進(jìn)行交叉驗(yàn)證; (2.C),更新粒子的位置和速度,進(jìn)行循環(huán)迭代:本代種群的全局最優(yōu)解和局部最優(yōu)解得到以后,需要進(jìn)行粒子信息的更新。位置和速度的更新根據(jù)下面兩式進(jìn)行:Vi+1 = WXVi+C1XrandX (Pbest-Xi)+C2 X randX (gbest-Xj), Xi+1== Xi+Vi+1 ; (2.D),比較更新全局最優(yōu)解和局部最優(yōu)解,如果當(dāng)前的適應(yīng)度值優(yōu)于局部的最好適應(yīng)度值,將當(dāng)前值作為最好的適應(yīng)度值,同時更新局部最優(yōu)的粒子信息;如果當(dāng)前的適應(yīng)度值優(yōu)于全局的最好適應(yīng)度值,替換全局最優(yōu)為當(dāng)前的適應(yīng)度值,并更新全局最優(yōu)粒子信息。`
3.根據(jù)權(quán)利要求1所述的基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測算法,其特征在于,所述的步驟(I)中所述的顏色一階矩的提取如下式所示:
4.根據(jù)權(quán)利要求1所述的基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測算法,其特征在于,所述的步驟(I)中所述的顏色二階矩提取如下:二階矩的提取如下式所示:
5.根據(jù)權(quán)利要求1所述的基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測算法,其特征在于,所述的步驟(I)中所述的顏色直方圖提取如下: 顏色直方圖定義式為:
6.根據(jù)權(quán)利要求1所述的基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測算法,其特征在于,所述的步驟(I)中所述的角點(diǎn)提取如下:我們定義X為圖像幀角點(diǎn)的特征度量:
7.根據(jù)權(quán)利要求1所述的基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測算法,其特征在于,所述的步驟(I)中所述的DC系數(shù)的提取如下:根據(jù)MPEG編碼原理,對圖像進(jìn)行DCT變換,再經(jīng)量化得到DC系數(shù);首先將圖像分割成η X η的塊,對于DCT變換,DCT系數(shù)的第一個值是直流分量,即為DC系數(shù),數(shù)量上等于該塊的平均值;于是就可以直接提取每一個塊的DC分量,以該分量的值代表整個塊;在此基礎(chǔ)上得到相鄰兩幀對應(yīng)宏塊位置上的ηΧη塊的DC系數(shù)之差大于某個閾值的數(shù)量,我們把它作為DC系數(shù)這個特征的幀間差異;若當(dāng)前幀和前一幀的差異較大,則很可能發(fā)生了鏡頭變化。
8.根據(jù)權(quán)利要求7所述的基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測算法,其特征在于,所述的η可以取8。
全文摘要
本發(fā)明涉及一種基于支持向量機(jī)和粒子群優(yōu)化算法的鏡頭邊界檢測算法,原始數(shù)據(jù)是待鏡頭邊界檢測的視頻數(shù)據(jù),包括以下步驟(1),提取視頻數(shù)據(jù)的底層特征,本方法主要提取像素域上的顏色一階矩和顏色二階矩、顏色直方圖、角點(diǎn);還有壓縮域上的DC系數(shù)特征;(2),使用粒子群算法對支持向量機(jī)的核函數(shù)參數(shù)和懲罰因子進(jìn)行優(yōu)化;(3),利用得到的近似最優(yōu)參數(shù)訓(xùn)練得到最優(yōu)分類模型,并以此為基礎(chǔ)對視頻序列幀進(jìn)行分類,最終完成鏡頭分割。
文檔編號G06K9/46GK103164707SQ201110413529
公開日2013年6月19日 申請日期2011年12月9日 優(yōu)先權(quán)日2011年12月9日
發(fā)明者孫學(xué)梅, 趙龍, 孫寶山 申請人:天津工業(yè)大學(xué)