本發(fā)明涉及動態(tài)攝像機下視頻目標持續(xù)跟蹤的技術領域,尤其涉及一種基于雙向SIFT流運動評估的大位移目標稀疏跟蹤方法。
背景技術:
在傳統(tǒng)視頻跟蹤方法研究中,大部分研究者給定了一個運動平滑性假設條件,也就是說目標在視頻幀間的運動變化是連續(xù)且光滑的。然而,在實際跟蹤場景中,往往會因為攝像機視野切換或晃動、視頻幀被抽取、目標快速運動和低幀率視頻采集等客觀因素的存在,導致目標在視頻幀間產(chǎn)生了大的運動位移,破壞了傳統(tǒng)研究方法的假定條件,引起現(xiàn)有大量目標跟蹤算法的執(zhí)行失敗。為了適應跟蹤目標這種異常的運動行為,保證算法能夠持續(xù)地跟蹤興趣目標,必須提出一種新的視頻目標跟蹤算法。
針對上述問題,很多研究者提出了一些研究思路:(1)基于檢測方法的目標跟蹤,旨在利用檢測手段搜索整個狀態(tài)空間以覆蓋不同的運動位移,這類方法的優(yōu)點是能夠在特定的場景下適應大位移運動目標的跟蹤問題,但其易遭遇局部最優(yōu)化問題,而且擴大的搜索范圍會導致大量的背景信息有待處理,如果出現(xiàn)背景復雜的場景跟蹤這類方法容易失?。?2)基于多尺度和分層策略的目標跟蹤,旨在利用多尺度和分層策略使得目標運動在高尺度或高層空間下再次滿足平滑性條件;這類方法的優(yōu)點是簡單易操作,但其適合于目標幀間運動位移不太大的情況下,而且嚴重依賴分解的層數(shù)或尺度數(shù)目;(3)基于多運動模型的目標跟蹤,旨在通過預先設計的運動模型并借助其能夠容忍各種運動位移量而實現(xiàn)有效跟蹤,這類方法的優(yōu)點是直接從目標運動入手能夠精確實現(xiàn)不確定運作狀態(tài)的評估,但是該類方法嚴重依賴精確的運動模型,在現(xiàn)實中因為目標運動的不確定性其難以廣義化;(4)基于馬爾科夫鏈蒙特卡羅(Markov-chain Monte Carlo,MCMC)的目標跟蹤,旨在通過不同的重要性采樣方法提供能夠覆蓋目標所有運動狀態(tài)以解決目標的大位移運動問題。該類方法的優(yōu)點是能夠處理目標的多模態(tài)分布和目標丟失再跟蹤的問題,但該類方法需要先驗信息,而且容易陷入局部最優(yōu)化。
因此,研究一種基于雙向SIFT流運動評估的目標稀疏跟蹤新方法,能夠直接從幀間運動場出發(fā)評估目標運動位移的程度,不需要任何先驗信息;能夠避免局部陷入問題,這將給大 位移目標持續(xù)性跟蹤方法研究指引一個新的研究方向;通過對該技術的深入研究能夠盡可能地減少目標持續(xù)性跟蹤技術的約束條件,大大促進跟蹤方法的實際應用化進程。
技術實現(xiàn)要素:
為了解決上述技術問題,本發(fā)明提出了一種基于雙向SIFT流運動評估的大位移目標稀疏跟蹤方法,將擴展SIFT流方法引入到視頻目標跟蹤問題中,結合稀疏外觀表示理論通過在線學習實現(xiàn)外觀模型的實時更新,對動態(tài)攝像機下目標存在幀間運動大位移時能夠有效地實現(xiàn)持續(xù)性跟蹤,實現(xiàn)了幀間存在大運動位移目標的精確跟蹤,提高了在復雜場景下跟蹤的適應能力。
為了達到上述目的,本發(fā)明的技術方案是:將SIFT流方法引入到跟蹤問題中,提出雙向SIFT流運動評估方法,利用其特性可以實現(xiàn)對目標幀間的大運動位移進行預測;采用稀疏表示理論描述目標外觀,有效地提高了外觀模型對部分遮擋和光線變化等環(huán)境因素的容忍度;觀測樣本采樣有效性的提高,能夠構建良好的字典矩陣,再通過字典學習,保證了外觀模型的魯棒性。本發(fā)明中提出的雙SIFT流運動評估策略,能夠保證目標幀間產(chǎn)生大位移時,獲得好的觀測樣本集合,從而跟蹤能夠適應目標在幀間存在大運動位移的情況。
一種基于雙向SIFT流運動評估的大位移目標稀疏跟蹤方法,其步驟如下:
步驟1:初始化字典:讀取第一幀圖像數(shù)據(jù)信息以及目標在第一幀內(nèi)給定的狀態(tài)參數(shù),在目標初始位置處稠密采樣產(chǎn)生目標模板T1,T2,…,Tn,選擇單位矩陣Im作為瑣屑模板,將瑣屑模板壓縮為G*J的大小,再拉伸為m維列向量,構造初始的字典其中,DT表示字典模板,Tj表示第j個目標的正樣本,j=1,…,n,n表示模板的數(shù)目,G和J分別表示瑣屑模板的寬度和高度,m表示向量的維數(shù),表示實數(shù)域;
步驟2:采用雙向SIFT流技術評估目標運動位移:新一幀圖像到來時,依據(jù)雙向SIFT流技術評估目標在上一幀圖像和新一幀圖像之間的運動位移量,其包括的主要內(nèi)容為:
(1)對相鄰兩幀圖像中的所有像素點采用SIFT流技術進行特征匹配,相鄰兩幀圖像中的所有像素點匹配問題轉換成采用置信度傳播方法求解下式的最優(yōu)化問題:
其中,wk(p)=(uk(p),vk(p))是像素點p=(x,y)從第k-1到k幀的位移向量,u,v分別表示水平和垂直方向,x,y表示點p在圖像中的坐標值,sk(p)是像素點p在第k幀圖像內(nèi)的SIFT 特征向量;N表示在構建馬爾科夫隨機場時鄰域結構邊的數(shù)目,α是一個像素在兩幀間運動位移量的懲罰因子,β表示代價項的增長率,d是一個截斷因子,p,q分別表示第k-1幀和k幀中對應的兩個像素點;
(2)依據(jù)目標在第k-1幀內(nèi)的狀態(tài)信息,獲得目標所組成的像素點集合 采用SIFT流算法獲得像素點集合在第k幀圖像中的預測點集合再對預測點集合中所有點做反方向的SIFT流算法處理;依據(jù)SIFT流前后一致性評估參數(shù)ErorFB,對預測點集合進行濾波,獲得可靠像素點集合Pk,同時獲得k-1幀內(nèi)相匹配的點的集合Pk-1,構建幀間目標上的可靠匹配像素點對集合 預測點集合的濾波準則如下:
當ErorFB≤ThFB時,該像素點保留,否則,該像素點濾除;
其中,表示k-1幀目標包含的像素點的集合,表示在第k幀內(nèi)對應的預測點的集合,表示對集合進行濾波后跟蹤目標所包含的像素點集合, 表示集合Pk在k-1幀圖像內(nèi)對應的像素點的集合,m表示像素點的數(shù)目;ThFB為置信度傳播方法對像素點進行前后一致性評估所能夠容忍的最大誤差閾值;
(3)依據(jù)可靠匹配像素點對集合Pk,k-1確定跟蹤目標在幀間的運動狀態(tài):下一幀內(nèi)目標的位移量通過可靠點對之間位移量的中值獲得,目標的尺度通過前后兩幀內(nèi)兩點間距離比值的中值確定,目標的寬度和高度通過上幀內(nèi)目標尺寸和尺度值共同確定;
步驟3:獲取觀測樣本集合:對新的一幀圖像,依據(jù)步驟2的運動評估策略獲得新一幀圖像中目標的預測狀態(tài),對其進行高斯采樣獲得候選樣本集合,同樣將這些候選樣本壓縮為G*J的大小,再拉伸為m維列向量,構造觀測矩陣Y=[y1,…,yl],其中y1,…,yl為觀測樣本,l為候選樣本模板的個數(shù);
步驟4:觀測樣本的一般線性表示形式:
yi=DTαi+ε=αi1d1+αi2d2+…+αindn+εi,i=1,2,…,l;
其中,DT=[d1,d2…dn]是正樣本構造的字典模板,εi表示殘差項,αi=[αi1,αi2,…,αin]是第i個觀測樣本的線性表示的分解系數(shù);
步驟5:依據(jù)稀疏表示理論,計算稀疏外觀模型的稀疏系數(shù)矩陣,系數(shù)αi的求解可以轉換成以下的最小化問題:
通過L1范數(shù)最小化方式對上式進行求解;
其中,||·||2和||·||1分別代表2范數(shù)和1范數(shù),λ為正則化因子;
步驟6:獲得觀測樣本的重構誤差:結合步驟5求解出來的系數(shù)αi和字典DT,求解每個觀測模板在這種外觀模型表示下的重構誤差值:
選擇重構誤差最小的觀測樣本[x,y,width,high]作為目標的跟蹤結果;其中,width,high分別表示跟蹤目標的寬度和高度;
構建似然函數(shù),確定最佳候選樣本:依據(jù)獲得的稀疏系數(shù)計算每個觀測樣本yi的重構誤差,建立似然函數(shù)來說明觀測樣本是跟蹤目標的可能性,似然函數(shù)表示為exp(-Π*ei),Π表示比例因子;利用最大似然函數(shù)估計,獲得最佳的目標候選樣本作為跟蹤結果;
步驟7:字典模板DT更新:依據(jù)置信度閾值方法確定字典模板的更新形式;
重復步驟2-7的操作實現(xiàn)大位移運動目標的跟蹤。
所述置信度閾值方法為:利用似然函數(shù)exp(-Π*ei)的最大似然估計的似然值與預先設定的置信度閾值進行比較,如果大于置信度閾值說明跟蹤結果較優(yōu),則將其作為基樣本進行采樣以更新字典模板。
所述SIFT流算法的步驟:(1)對相鄰幀的圖像像素點提取SIFT特征;(2)將SIFT特征融入到光流運動評估框架中,將點匹配問題轉化成最優(yōu)化求解問題;(3)獲得像素點p=(x,y)從第k-1到k幀的位移向量wk(p)=(uk(p),vk(p))。
本發(fā)明的有益效果:直接從跟蹤目標視頻幀間SIFT流場出發(fā)評估運動位移,無需先驗知識,能夠獲得全局最優(yōu)的像素點匹配效果,卻具有局部最優(yōu)化的運行效率。通過雙SIFT流技術對目標幀間位移量進行一個評估,能夠彌補傳統(tǒng)跟蹤方法無法適應這樣問題的不足。再結合稀疏表示理論,使得跟蹤方法能夠?qū)δ繕瞬糠终趽醯膯栴}。同時采用字典學習方法提高了目標外觀模型的適應能力,使得此方法能夠很好適應目標的幀間大位移運動問題,為后續(xù)對跟蹤目標的識別、理解和分析具有重要意義。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明的系統(tǒng)流程圖。
圖2為本發(fā)明視頻圖像幀間SIFT流場示意圖。
圖3為本發(fā)明基于雙向SIFT流場一致性評估的點軌跡濾波示意圖。
圖4為本發(fā)明與其他算法的中心誤差比較示意圖。
圖5為本發(fā)明與其他算法的跟蹤效果示意圖。
具體實施方式
下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有付出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本發(fā)明的思想在于:(1)將擴展的SIFT流技術引入到跟蹤問題,給大位移運動目標跟蹤算法研究指出一個新的研究思路;(2)基于SIFT流技術能夠兼顧SIFT特征匹配和光流技術的優(yōu)點,提出雙向SIFT流場一致性評估方法實現(xiàn)對跟蹤目標幀間的運動位移量進行有效預測;(3)采用稀疏表示理論描述目標特征,通過在線學習策略實時更新目標外觀模型,從而實現(xiàn)大位移運動目標的持續(xù)性跟蹤。
本發(fā)明用于實施的硬件環(huán)境:Intel(R)Core(TM)i3 CPU 3.2G計算機、4GB內(nèi)存、1G顯卡,運行的軟件環(huán)境是:Matlab R20012a和Windows 7,實驗數(shù)據(jù)庫來自AVSS2007、實驗室拍攝的視頻和吳毅老師公布的數(shù)據(jù)庫。
如圖1所示,本發(fā)明實施例提供了一種基于雙向SIFT流運動評估的大位移目標稀疏跟蹤方法,其步驟如下:
步驟1:初始化字典:讀取第一幀圖像數(shù)據(jù)信息以及目標在第一幀內(nèi)給定的狀態(tài)參數(shù),在目標初始位置處稠密采樣產(chǎn)生目標模板T1,T2,…,Tn,選擇單位矩陣Im作為瑣屑模板,將瑣屑模板壓縮為G*J的大小,G和J分別表示瑣屑樣本的寬度和高度;再拉伸為m維列向量,m表示向量的維數(shù),構造初始的字典表示實數(shù)域;其中,Tj表示第j個目標正樣本,j=1,…,n,n表示模板的數(shù)目。
給定跟蹤目標狀態(tài)信息,通過緊密采樣獲得目標正樣本T1,T2,…,T10(數(shù)目為10),將其壓縮成12×15尺寸的模板,并分別轉換成180×1的列向量,形成樣本矩陣T180×10,構造180×180的瑣屑模板矩陣I180×180,形成180×190尺寸的字典D=[T180×10 I180×180]。
步驟2:采用雙向SIFT流技術評估目標運動位移:新一幀圖像到來時,依據(jù)雙向SIFT流 技術評估目標在上一幀圖像和新一幀圖像之間的運動位移量。
因為傳統(tǒng)很多方法不能適應目標的幀間大位移運動問題,本發(fā)明將SIFT流技術引入跟蹤問題,采用雙SIFT流運動評估方法實現(xiàn)對目標在幀間形成的大位移程度的進行估計,具體過程有以下三步:
(1)對相鄰兩幀圖像中的所有像素點采用SIFT流技術進行特征匹配,相鄰兩幀圖像中的所有像素點匹配問題轉換成采用置信度傳播方法求解下式的最優(yōu)化問題:
其中,wk(p)=(uk(p),vk(p))是像素點p=(x,y)從第k-1到k幀的位移向量,Ek(·)為能量函數(shù);u,v分別表示水平和垂直方向,x,y表示點p在圖像中的坐標值,sk(p)是像素點p在第k幀圖像內(nèi)的SIFT特征向量;N表示在構建馬爾科夫隨機場時鄰域結構邊的數(shù)目,α是一個像素在兩幀間運動位移量的懲罰因子,β表示代價項的增長率,d是一個截斷因子,p,q分別表示第k-1幀和k幀中對應的兩個像素點。
上述優(yōu)化問題采用基于馬爾科夫隨機場理論的置信度傳播BP(Belief Propagation)方法來求解,這種方法能達到全局最優(yōu),而且運行效率近似于局部方法。采用BP算法求解獲得相鄰兩幀圖像內(nèi)所有像素點的位移關系,建立目標在幀間的SIFT流場。
本發(fā)明中α=300,β=0.5,d=3。在置信度傳播理論中,采用消息傳遞機制實現(xiàn)最優(yōu)化,像素點間的消息按下式計算:
其中,Dp(wp)為像素點自身數(shù)據(jù)的代價項,V(wp,wq)為像素點間的不連續(xù)代價項,N(p)\q代表著除了q像素點外的p鄰域系統(tǒng),表示點p的鄰域系統(tǒng)的中點s向其傳遞的消息大?。唤?jīng)過T次迭代運算每個像素對應的置信度計算如下:
其中,bq(wq)表示點q與點p匹配程度的置信度值,表示點q與點p之間傳遞的消息,迭代的數(shù)目必須保證置信度傳播方法在圖模型上收斂。這種情況下,迭代的消息傳遞機制收斂到像素點最有可能對應的離散標簽值。當滿足收斂條件后,t表示迭代的 次數(shù),每個像素的標簽值被選擇,像素點依據(jù)最大置信度值確定其在圖像中的位置,本發(fā)明迭代次數(shù)為5,鄰域系統(tǒng)選擇4鄰域,即:N=4。如圖2(a)中的每個像素都與其在圖2(b)中所匹配的像素間產(chǎn)生一個(Δx,Δy)的位移量,依據(jù)這些變化量形成了如圖2(c)中所示的SIFT流場,稱其為目標幀間的運動場,由圖2(c)可以看出目標的整體運動趨勢。
(2)依據(jù)目標在第k-1幀內(nèi)的狀態(tài)信息,獲得目標所組成的像素點集合 采用SIFT流算法獲得像素點集合在第k幀圖像中的預測點集合 再對預測點集合中所有點進行反向的SIFT流算法處理;依據(jù)SIFT流前后一致性評估參數(shù)ErorFB,對預測點集合進行濾波,獲得可靠像素點集合Pk,同時獲得k-1幀內(nèi)相匹配的點的集合Pk-1,構建幀間目標上的可靠匹配像素點對集合預測點集合的濾波準則如下:
當ErorFB≤ThFB時,該像素點保留,否則,該像素點濾除;
其中,表示k-1幀目標包含的像素點的集合,表示在第k幀內(nèi)對應的預測點的集合,表示對進行濾波后跟蹤目標所包含的像素點集合, 表示集合Pk在k-1幀圖像內(nèi)對應的像素點的集合,m表示像素點的數(shù)目;ThFB為置信度傳播方法對像素點進行前后一致性評估所能夠容忍的最大誤差閾值;
具體地,采用點軌跡濾波機制,建立跟蹤目標中像素點的可靠運動軌跡集合。設定S=(I1,I2…,Ik)是一個圖像序列,I1,I2…,Ik表示圖像序列,k表示圖像的幀數(shù),如圖2所示,pk是k時刻圖像中的一個像素點位置,使用SIFT流算法獲得點pk在k+1幀圖像中的匹配點pk+1,從而形成點的前向運動軌跡然后,對點pk+1采用SIFT流算法獲得其在k時刻圖像中的匹配點從而形成點的后向運動軌跡如果不存在跟蹤誤差,和pk將會完全重合。
現(xiàn)定義FB誤差為和的歐幾里得距離,計算公式為它描述了雙向流場的一致性程度,誤差值越小說明前后項一致性程度越高,則點的運動軌跡越可靠;反之,則說明預測到的點的運動軌跡可能錯誤。利用所有像素點幀間的FB誤差值構建圖像序列幀間的誤差流場,依據(jù)誤差流場的中值確定閾值ThFB,依據(jù)以下準則對可靠點軌跡進行提煉:如果則相應點對形成的軌跡保留;如果則相應點對形成的軌跡濾除。
如圖3所示,第k幀圖像中跟蹤目標上點pk與它在k+1幀圖像中的預測點pk+1形成前向 軌跡同類,第k+1幀圖像中的點pk+1與它在k幀圖像中的預測點形成后向軌跡圖2中明顯看出前后軌跡偏差較大,因此濾波這一不可靠的點對(pk,pk+1);對所有點采用相同的操作,獲得濾波后的可靠點對集合。
所述SIFT流算法的步驟:(1)對相鄰幀的圖像像素點提取SIFT特征;(2)將SIFT特征融入到光流運動評估框架下,將點匹配問題轉化成最優(yōu)化求解問題;(3)獲得像素點p=(x,y)從第k-1到k幀的位移向量wk(p)=(uk(p),vk(p))。
(3)依據(jù)可靠匹配像素點對集合Pk,k-1確定跟蹤目標在幀間的運動狀態(tài)。下一幀內(nèi)目標的位移量通過可靠點對之間位移量的中值獲得,目標的尺度通過前后兩幀內(nèi)兩點間距離比值的中值確定,目標的寬度和高度通過上幀內(nèi)目標尺寸和尺度值共同確定。
經(jīng)過第(2)和(3)步的操作,跟蹤目標上的稠密點集合及預測稠密點集合得到提煉,獲得可靠匹配像素點對集合跟蹤目標狀態(tài)X=[x,y,width,high,scale]T,分別按照以下方式確定各個參數(shù):
A、跟蹤目標位置Z的確定:
假定點位移矢量為z=[x,y]T,依據(jù)第2步的幀間運動流場圖,可以獲得可靠匹配像素點對集合Pk,k-1中所有點對之間的運動關系,用描述第i對可靠點之間的關系,運動矢量形成的集合為其數(shù)目與可靠點集合中點對數(shù)目一致,則跟蹤目標的位置矢量Zk被確定如下:
其中,m是受軌跡濾波和校正策略影響而自適應確定,但是m必須保證數(shù)目大于20,否則目標狀態(tài)很難保證正確。
B、跟蹤目標尺度scale的確定:
首先從可靠匹配像素點對集合Pk,k-1隨即選取點對,數(shù)目為g=m/2,分別計算第k和k-1幀圖像中隨機選取的點的距離:
其中,(x,y)為點的坐標值,建立可靠點的距離集合和則目標的尺度scale被確定如下:
跟蹤目標的寬度width和高度high被確定如下:
widthk=widthk-1×scalek
highk=highk-1×scalek。
經(jīng)過(1)-(3)步驟的操作,跟蹤目標在幀間的運動位移會被確定,也就是說獲得了跟蹤目標在下一幀可能出現(xiàn)的預測位置。
步驟3:獲取觀測樣本集合:對新的一幀圖像,依據(jù)步驟2的運動評估策略獲得新一幀圖像中目標的預測狀態(tài),對其進行高斯采樣獲得候選樣本集合,同樣將這些候選樣本壓縮為G*J的大小,再拉伸為m維列向量,構造觀測矩陣Y=[y1,…,yl],其中y1,…,yl為觀測樣本,l為候選樣本模板的個數(shù)。
利用雙SIFT流技術對目標在下一幀位置進行預測后,采用高斯采樣獲得候選樣300個,將其壓縮為12×15大小的樣本,同樣將每個樣本拉伸為180×1維的列向量,構造由候選樣本組成的觀測矩陣Y=[y1,…,yl],yi為180×1維的列向量,i=1,2,…,300為候選樣本的數(shù)目。
步驟4:觀測樣本的一般線性表示形式:
yi=DTαi+ε=αi1d1+αi2d2+…+αindn+εi,i=1,2,…,l;
其中,DT=[d1,d2…dn]是正樣本構造的字典,εi表示殘差項,αi=[αi1,αi2,…,αin]是第i個觀測樣本的線性表示的分解系數(shù);
步驟5:依據(jù)稀疏表示理論,計算稀疏外觀模型的稀疏系數(shù)矩陣,系數(shù)αi的求解可以轉換成以下的最小化問題:
通過L1范數(shù)最小化方式對上式進行求解;
其中,||·||2和||·||1分別代表2范數(shù)和1范數(shù),λ為正則化因子。
利用觀測樣本矩陣Y180×300和字典矩陣D180×190求解稀疏系數(shù)矩陣,300表示觀測樣本的數(shù)目。字典矩陣D180×190由模板矩陣T180×10和識別矩陣I180×180構成。通過LASSO算法對上述最小化問題求解,λ=0.01,獲得稀疏系數(shù)矩陣α。
步驟6:獲得觀測樣本的重構誤差:結合步驟5求解出來的稀疏系數(shù)矩陣α和字典DT,求解每個觀測模板在這種外觀模型表示下的重構誤差值:
選擇重構誤差最小的觀測樣本[x,y,width,high]作為目標的跟蹤結果;其中,width,high分別表示觀測樣本的寬和高。
構建似然函數(shù),確定最佳候選樣本:依據(jù)獲得的稀疏系數(shù)計算每個觀測樣本yi的重構誤差,建立似然函數(shù)來說明觀測樣本是跟蹤目標的可能性,似然函數(shù)表示為exp(-Π*ei),Π=30。利用最大似然函數(shù)估計,獲得最佳的目標候選樣本作為跟蹤結果。
步驟7:字典模板DT更新:依據(jù)置信度閾值方法確定字典模板的更新形式。
動態(tài)場景下目標的運動和攝像機的轉動會使跟蹤目標的外觀特征發(fā)生變化,字典模板的更新能夠保證目標跟蹤的持續(xù)性。跟蹤過程中對模板庫中的目標模式進行每5幀更新一次,更新準則依據(jù)此5幀內(nèi)具有獲得最大似然估計值的跟蹤結果去動態(tài)替換模板庫中與其相似程度最小的模板。
置信度閾值方法為:利用重構誤差建立似然函數(shù)exp(-Π*ei),其值反映了觀測樣本對應的目標稀疏表示的重構誤差大小。似然函數(shù)的值越小,說明它的稀疏表示越可靠。利用最大似然估計,獲得此刻的最大跟蹤結果。將此似然值與預先設定的置信度閾值進行比較,如果大于置信度閾值說明跟蹤結果較優(yōu),則將其作為基樣本進行采樣以更新字典模板。
重復步驟2-7的操作實現(xiàn)大位移運動目標的跟蹤。
本發(fā)明采用了定量和定性兩種評價方式,定量評價方式采用中心位置誤差率(Center Location Error,CLE)來評價。中心位置誤差是計算估計目標的中心位置和真實位置之間的平均歐氏距離,一般其值越小說明跟蹤結果比較優(yōu)。圖4是本發(fā)明的方法與代表性跟蹤算法CT,IVT、L1T、VTD和WMILT的比較結果。定性評價方式采用本發(fā)明和各種代表性方法在特殊幀上的跟蹤效果圖,如圖5所示。
如圖5分別所示的三個視頻Deer、Face1和Face2,第一個視頻Deer中目標在水平方向的幀間運動位移達到44個像素,第二個Face1和第三個Face2視頻中目標在垂直方向上的幀間運動位移分別達到了39和88個像素,這些幀間大位移的產(chǎn)生使得其它跟蹤算法均表現(xiàn)出不適應,本發(fā)明提出的方法獲得了好的跟蹤效果。綜合圖4和圖5結果可知,本發(fā)明提供的目標跟蹤方法能夠很好地解決目標幀間運動大位移問題,獲得了較好地跟蹤表現(xiàn)。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。