基于運動矢量劃分的前景檢測方法
【技術領域】
[0001] 本發(fā)明設及的是一種前景檢測方法,具體是一種基于稠密光流和方向劃分的圖像 內容檢索方法。
【背景技術】
[0002] 隨著視頻監(jiān)控系統(tǒng)的覆蓋和手機等手持移動攝像設備的普及,視頻數(shù)據(jù)正在W- 個驚人的速度增長,而如何從數(shù)量龐大的視頻文件中提取有價值信息也成為一個亟待解決 問題。
[0003] 背景建模和目標追蹤是視頻分析的基礎。背景建?;诒尘芭c前景是否在運動、 運動方向和顏色等方面的差異進行前景和背景的區(qū)分和識別,而目標追蹤根據(jù)目標的特征 及其運動產生的視頻前后帖的差異,實現(xiàn)目標的實時跟蹤。
[0004] 光流是一種簡單實用的圖像運動的表達方式,通常定義為一個圖像序列中的圖像 亮度模式的表觀運動,即空間物體表面上的點的運動速度在視覺傳感器的成像平面上的表 達。
[0005] 馬里蘭大學的IsmailHaritaoglu博±等人在2000年時提出的W4算法用于人類 行為識別與監(jiān)控,該算法因其簡單高效的特點而成為最早被實際運用的算法。
[0006] 比利時列日大學的Oliver631111油博±等人致力于視頻監(jiān)控技術的應用,特別是 背景建模和步態(tài)識別,他們的ViBe算法快速高效,有別于傳統(tǒng)算法,可嵌入到相機中,魯椿 性強。
[0007] 西北工業(yè)大學的王永忠、梁彥等人從事目標跟蹤方面的研究,主要成果;針對傳 統(tǒng)的混合高斯背景建模方法對非平穩(wěn)場景較為敏感的缺點,提出了一種新型的混合高斯模 型。
[000引上述技術方案均限定在背景靜止的條件下,本發(fā)明與上述技術方案最大的不同在 于,本發(fā)明的檢測方法是基于對稠密光流場的處理,因而可W在攝像機進行簡單運動的情 景下進行前景識別。對光流場的計算與分析可W確定背景的運動模式;之后可W將區(qū)別于 背景運動模式的物體認定為前景;目前在運動背景的前景識別范疇內。
[0009] 專利文獻"一種基于光流場聚類的運動目標分割方法"(專利申請?zhí)?201310174529. 0)中應用了對光流產生的矢量場進行C-均值聚類算法。本發(fā)明與該方法不 同的是聚類的劃分方式不同。本發(fā)明的方法沒有迭代求取類內誤差平方和最小化,而是新 定義量化標準與劃分方法,擁有更快的處理速度,同時增加對檢測結果的平滑處理和有效 性檢測。
【發(fā)明內容】
[0010] 針對現(xiàn)有技術中的缺陷,本發(fā)明的目的是提供一種基于運動矢量劃分的前景檢測 方法。
[0011] 根據(jù)本發(fā)明提供的一種基于運動矢量劃分的前景檢測方法,使用離散運動矢量劃 分運動趨勢w進行前景檢測,包括對視頻圖像中的至少一帖圖像執(zhí)行如下步驟:
[0012] 步驟1 ;對帖圖像進行稠密光流計算,得到連續(xù)運動矢量;
[0013] 步驟2 ;在該帖圖像中,對全部像素分別進行所述連續(xù)運動矢量的量化處理,得到 由多種離散運動矢量構成的量化矢量集;
[0014] 步驟3 ;按照離散運動矢量所含的像素數(shù),對該帖圖像中存在的每種離散運動矢 量進行排序,根據(jù)排序結果按照運動趨勢由主至次劃歸出多類運動趨勢;其中,首次劃歸出 的運動趨勢記為第一類運動趨勢;
[0015] 步驟4;除了所述第一類運動趨勢之外,計算在該帖圖像中各類運動趨勢所構成 的連通圖面積,并將連通圖面積進行排序;將序號靠前的多個連通圖面積所對應的連通域 作為前景目標;
[0016] 步驟5 ;對前景目標的跟蹤進行平滑處理和有效性檢驗。
[0017] 優(yōu)選地,所述稠密光流計算采用的光流算法為:
[0018] OpenCV開源庫函數(shù)中的函數(shù)calcOpticalFlowFarneback。
[0019] 優(yōu)選地,所述量化矢量集為65種離散運動矢量,其中,64種離散運動矢量由4種非 零模長和16個方向排列組合得到,1種離散運動矢量為無方向的0模長矢量,具體為:
[0020] 4種非零模長為:最大模長、四分之一最大模長、二分之一最大模長、四分之立最 大模長;其中,所述最大模長是指所有離散運動矢量中的最大模長;
[0021] 16個方向為;W水平向右為起始方向逆時針方向將圓周角16等分得到的方向。 [002引優(yōu)選地,所述步驟3,包括如下步驟:
[0023] 步驟3. 1 ;對該帖圖像中存在的每種離散運動矢量按照所含的像素數(shù)由多到少進 行排序;
[0024] 步驟3. 2 ;在未劃歸入運動趨勢的離散運動矢量中,選取排序序號靠前的N種離散 運動矢量構成一類矢量集合,在該類矢量集合中選取序號最前的離散運動矢量作為運動趨 勢中屯、矢量;若該帖圖像中未劃歸入運動趨勢的離散運動矢量的種類不足N種,則選取該 帖圖像中全部未劃歸入運動趨勢的離散運動矢量作為該類矢量集合;
[0025] 步驟3.3 ;在該類矢量集合中,計算該運動趨勢中屯、矢量分別與其余離散運動矢 量的距離;
[0026] 步驟3. 4 ;將距離小于闊值的離散運動矢量劃歸入該運動趨勢中屯、矢量所代表的 運動趨勢中;
[0027] 步驟3. 5 ;判斷一帖圖像中存在的離散運動矢量是否均已劃歸入運動趨勢中:若 是,則認為完成運動趨勢的劃歸;否則,則進入步驟3. 2繼續(xù)執(zhí)行;
[002引其中,對一帖圖像,將首次劃歸出的運動趨勢作為所述第一類運動趨勢。
[0029] 優(yōu)選地,在所述步驟4中,將序號靠前且面積大于面積闊值的多個連通圖面積所 對應的連通圖區(qū)域作為前景目標。
[0030] 優(yōu)選地,所述有效性檢驗的判定標準為;對于當前帖,當前帖圖像及其前連續(xù)兩帖 圖像均滿足如下條件:
[003UAp<5
[0032] 其中,p表示目標描述參數(shù),目標描述參數(shù)p由目標中屯、的橫坐標X、目標中屯、的縱 坐標y、目標的高度K目標的寬度W構成;AP表示目標描述參數(shù)在連續(xù)兩帖圖像之間的變 化量,5為連續(xù)兩帖圖像之間目標描述參數(shù)變化的有效上限;
[003引若Ap小于5則判定追蹤有效;否則,則判定追蹤無效,放棄當前帖圖像的檢測。
[0034] 優(yōu)選地,所述平滑處理的方法為取當前帖圖像與其前連續(xù)兩帖圖像的加權平均:
[0035]
[0036] 其中,Si為第i帖圖像平滑處理后的目標描述參數(shù),Pi為第i帖圖像的目標描述參 數(shù),Ph為第i-1帖圖像的目標描述參數(shù),PW為第i-2帖圖像的目標描述參數(shù);其中,i> 3。
[0037] 優(yōu)選地,在步驟3. 3中的所述距離distance,具體為:
[0038] distance] =(01_〇2) 2+ 相-!!!]) 2
[0039] 其中,distance表示兩個離散運動矢量之間的空間距離,〇i、mi分別為其中一個離 散運動矢量的方向序號、量化模長,〇2、m2分別為其中另一個離散運動矢量的方向序號、量化 模長。
[0040] 優(yōu)選地,還包括如下步驟:
[0041] 步驟0 ;使用高斯模糊及減采樣,處理視頻圖像。
[0042] 優(yōu)選地,所述視頻圖像的特征為:
[0043] 特征A;畫面中存在與背景有相對運動的前景物體;
[0044] 特征B;采集視頻圖像的攝像機允許運動,即背景為運動或者靜止;
[0045] 特征C;高斯金字塔處理根據(jù)視頻分辨率大小進行。
[0046] 與現(xiàn)有技術相比,本發(fā)明具有如下的有益效果;
[0047] 本發(fā)明通過稠密光流的計算,獲取視頻帖中每一像素的運動方向矢量。再將連續(xù) 的運動矢量量化,W便于根據(jù)運動趨勢的運動矢量劃分,得到表征運動趨勢的矩陣。尋找該 矩陣中的最大連通域,可區(qū)分出前景與背景,并定位前景目標。最后添加對前景目標的判 另IJ,W消除部分抖動與誤檢的情況。實驗證明,本發(fā)明在簡單場景中能較好地檢測出前景目 標的位置、大小,并有較快的運行速率。
【附圖說明】
[0048] 通過閱讀參照W下附圖對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、 目的和優(yōu)點將會變得更明顯:
[0049] 圖1是本發(fā)明的處理流程圖;
[0化日]圖2是本發(fā)明的矢量劃分流程圖。
【具體實施方式】
[0化1] 下面結合具體實施例對本發(fā)明進行詳細說明。W下實施例將有助于本領域的技術 人員進一步理解本發(fā)明,但不W任何形式限制本發(fā)明。應當指出的是,對本領域的普通技術 人員來說,在不脫離本發(fā)明構思的前提下,還可W做出若干變化和改進。該些都屬于本發(fā)明 的保護范圍。
[0化2] 本發(fā)明提供了一種基于運動矢量劃分的前景檢測方法。在區(qū)分前景與背景的運動 趨勢時,使用稠密光流為分辨的基礎。對于視頻文件中的每帖圖像采用高斯金字塔對圖像 進行向下分解,然后采用GunnarFarneback的稠密光流計算方法,之后對計算所得的光流 場進行量化處理獲得離散的運動矢量矩陣,再對該矩陣進行方向的劃分,最終尋找連通域,W找出與背景運動方向或速度不同的前景物體,完成前景目標的捜索過程。本發(fā)明中的連 續(xù)矢量量化方法和劃分的方法能夠較好的對光流矢量場進行分析處理。通過連通域的面積 比較得出前景目標也是在前景物體不確定的情況下迅速捕捉前景位置的方法。
[0化3] 本發(fā)明提供的基于運動矢量劃分的前景檢測方法,是通過W下方案實現(xiàn)的:
[0化4] 對輸入的視頻文件進行逐帖處理,首先將每帖圖像轉換為Mat格式,調用 OpenCV開源庫函數(shù)calcOpticalFlowFarnebackQ,即GunnarFarneback的光流算法calc化ticalFlowFarneback。計算每帖圖像稠密光流的光流場。之后的分析對象為該光流 場,大小與視頻文件分辨率相同,每個元素均為標識運動方向的二維向量。
[0化5] 本發(fā)明中將連續(xù)運動矢量轉換為離散數(shù)值的離散運動矢量W便于分類。設定離散 運動矢量分為包括0模長在內的5種模長(最大模長為所有離散運動矢量中的最大模長, 除0W外其余S種模長為最大模長的^ )和每種模長16個方向水平向右為起始 方向逆時針方向將圓周角16等分),得到65個離散運動矢量(0模長運動矢量無方向);即: 65種離散運動矢量,其中,64種離散運動矢量由4種非零模長和16個方向排列組合得到, 1種離散運動矢量為無方向的0模長矢量,具體為;4種非零模長為:最大模長、四分之一最 大模長、二分之一最大模長、四分之=最大模長;其中,所述最大模長是指所有離散運動矢 量中的最大模長;16個方向為;W水平向右為起始方向逆時針方向將圓周角16等分得到的 方向。
[0化6] 首先將光流場的二維連續(xù)運動矢量進行方向的歸一化。通過
[0057]
[005引
[0059] 式中angle為光流場向量角度,fy為光流場縱坐標y方向數(shù)值,fx為光流場橫坐 標X方向數(shù)值,0為連續(xù)運動矢量量