一種基于稀疏表示的視覺目標(biāo)跟蹤方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于計(jì)算機(jī)視覺領(lǐng)域,具體涉及智能監(jiān)控領(lǐng)域,特別涉及一種基于稀疏表 示的視覺目標(biāo)跟蹤。
【背景技術(shù)】
[0002] 基于視覺的目標(biāo)跟蹤技術(shù)(一般是指基于視頻或者是圖像序列的目標(biāo)跟蹤),是 在一系列的圖像中對目標(biāo)物體進(jìn)行檢測、提取、識別和跟蹤,從而獲得目標(biāo)物體的相關(guān)參 數(shù),如位置、速度、尺度、軌跡等;進(jìn)一步根據(jù)跟蹤結(jié)果進(jìn)行處理和分析,實(shí)現(xiàn)對目標(biāo)物體的 行為理解,或者完成更高一級的任務(wù)。這是一個(gè)迅猛崛起的熱點(diǎn)領(lǐng)域,屬于計(jì)算機(jī)視覺領(lǐng)域 的研宄范疇,具有廣泛的應(yīng)用前景和科學(xué)研宄價(jià)值。經(jīng)過近二三十年的發(fā)展過程,國內(nèi)外已 經(jīng)出現(xiàn)了各種跟蹤算法,包括一些經(jīng)典的算法以及基于這些算法的創(chuàng)新性算法。
[0003] 根據(jù)跟蹤算法的原理與技術(shù)不同,可以將這些跟蹤算法分為判決模型的跟蹤 方法和生成模型的跟蹤方法?;谂袥Q模型的跟蹤算法將跟蹤問題看成是分類問題,尤 其在單目標(biāo)跟蹤中,將跟蹤問題看成是二分類問題,比較經(jīng)典的分類器有SVM(Supp 〇rt Vector Machine)分類器,Adaboost的分類器。最近較為流行的基于分類器的算法有CSK, Struct,CT等算法。對于基于生成模型的跟蹤算法而言,跟蹤的目的是在鄰域內(nèi)尋找到與目 標(biāo)相似度最大的區(qū)域,實(shí)際上是尋找與目標(biāo)相似度函數(shù)最大的區(qū)域,即最優(yōu)化估計(jì)目標(biāo)的 狀態(tài),其中比較有效的經(jīng)典算法有卡爾曼濾波、粒子濾波,最近較為流行的有MTT,LSK等算 法。
[0004] 稀疏跟蹤算法是近年來發(fā)展比較迅速的一種新興跟蹤算法,屬于生成模型的跟蹤 方法。由于算法是基于一系列的模板庫得到的最終結(jié)果,因此對于光照變化、復(fù)雜環(huán)境以及 姿態(tài)改變等都具有較好的魯棒性,如文獻(xiàn)"X. Mei and H. Ling. "Robust visual tracking CN 103440645A using Llminimization"·12th International Conference on Computer Vision,Kyoto, Japan,2009 (1436-1443). "但是,由于模板庫往往采用目標(biāo)的整體模板作為 特征,因此對目標(biāo)遮擋的情況處理效果不佳。
[0005] 上述算法大多能夠在簡單的場景中進(jìn)行魯棒的實(shí)時(shí)跟蹤。但在不受限制的日常視 頻中跟蹤目標(biāo)仍然是一個(gè)重大挑戰(zhàn)。光照、尺寸變化、遮擋、目標(biāo)旋轉(zhuǎn)、復(fù)雜背景等都是帶來 困難的因素。因此,如何設(shè)計(jì)一個(gè)魯棒性較強(qiáng)的跟蹤算法,能夠在條件較為苛刻的情況下獲 得較好的表現(xiàn),是計(jì)算機(jī)視覺領(lǐng)域一個(gè)重要的課題。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明提出了一種基于稀疏表示的視覺跟蹤算法,對跟蹤目標(biāo)姿態(tài)變化,環(huán)境光 照變化以及遮擋等情況具有很強(qiáng)的魯棒性,且能改善對目標(biāo)遮擋的情況處理效果。
[0007] 本發(fā)明包括兩個(gè)部分,首先構(gòu)造用于跟蹤目標(biāo)的判決字典D、匹配字典A和灰度矩 陣T,然后在當(dāng)前幀中基于判決字典D、匹配字典A和灰度矩陣T在候選圖像中查找與跟蹤 目標(biāo)最相似的候選圖像,確定當(dāng)前所跟蹤目標(biāo)的目標(biāo)圖像,其具體過程為:
[0008] 步驟I :確定初始化圖像并確定所述初始化圖像的目標(biāo)圖像,在該步驟中個(gè),通常 取視頻或者是圖像序列的第一幀圖像為初始化圖像,并確定初始化圖像的目標(biāo)圖像(矩形 圖像塊),即目標(biāo)模板,可根據(jù)初始化圖像手動(dòng)給定的初始化位置得到目標(biāo)圖像(目標(biāo)大 小、在圖像中的位置坐標(biāo))。
[0009] 步驟2 :基于當(dāng)前目標(biāo)圖像生成判決字典D、匹配字典A和目標(biāo)模板灰度矩陣T :
[0010] 在初始化圖像中,確定距離目標(biāo)圖像中心Pl (預(yù)設(shè)值,具體值根據(jù)不同的處理環(huán) 境根據(jù)經(jīng)驗(yàn)設(shè)定,通常設(shè)置為1~10)個(gè)像素點(diǎn)的矩形區(qū)域?yàn)榍熬澳0宓牟蓸訁^(qū)域,確定距 離目標(biāo)圖像中心P2 (預(yù)設(shè)值,且P2大于P1,具體值根據(jù)不同的處理環(huán)境根據(jù)經(jīng)驗(yàn)設(shè)定,通 常設(shè)置P2與Pl的差值為1~5)個(gè)像素點(diǎn)的矩形區(qū)域與前景模板的采樣區(qū)域的空集為背 景模板的采樣區(qū)域(即圍繞著前景模板的采樣區(qū)域的回字形區(qū)域);對前景模板的采樣區(qū) 域進(jìn)行隨機(jī)采樣,并選擇N p (預(yù)設(shè)值,具體值根據(jù)不同的處理環(huán)境根據(jù)經(jīng)驗(yàn)設(shè)定,通常取值 為[3060])個(gè)與目標(biāo)圖像大小相等的采樣圖像作為前景模板D+;對背景模板的采樣區(qū)域進(jìn) 行隨機(jī)采樣,并選擇凡(預(yù)設(shè)值,具體值根據(jù)不同的處理環(huán)境根據(jù)經(jīng)驗(yàn)設(shè)定,通常取值設(shè)置 為[200300])個(gè)與目標(biāo)圖像大小相等的采樣圖像作為背景模板D_,由前景模板D+和背景模 板D_構(gòu)成判決字典D ;
[0011] 基于預(yù)設(shè)的矩形滑動(dòng)窗(尺寸為w*h,其寬w、高h(yuǎn)的取值為預(yù)設(shè)值,具體值根據(jù)不 同的處理環(huán)境根據(jù)經(jīng)驗(yàn)設(shè)定,通??苫谀繕?biāo)圖像大小進(jìn)行設(shè)置,例如w可以設(shè)置為目標(biāo) 圖像寬度的1/8, 1/16,1/32, 1/64等,h可以設(shè)置為目標(biāo)圖像高度的1/8, 1/16,1/32, 1/64 等),在目標(biāo)圖像上進(jìn)行左、右、上、下滑動(dòng)采樣,且左右采樣間隔相同,上下采樣間隔相同 (通常為可設(shè)置為w/2,上下采樣間隔可設(shè)置為h/2,當(dāng)然也可以進(jìn)行其他設(shè)置例如w/4,h/4 等,取決于計(jì)算的精細(xì)度要求),得到目標(biāo)圖像的碎片集,并基于K均值聚類方法從所述碎 片集中選取K個(gè)碎片(K個(gè)具有代表性的碎片),由K個(gè)碎片構(gòu)成訓(xùn)練集并得到匹配字典A, 其中K是K均值聚類方法的泛稱,為預(yù)設(shè)值,具體值根據(jù)不同的處理環(huán)境根據(jù)經(jīng)驗(yàn)設(shè)定,通 常取值范圍為[50 100],下文描述的K均值聚類方法計(jì)算時(shí),K的取值可以設(shè)置各不相同的 取值,通常通常取值范圍為[50 100];設(shè)置用于存放目標(biāo)圖像的碎片集的各碎片的灰度值 的灰度矩陣T,所述灰度矩陣T中各碎片的灰度值為:碎片的各點(diǎn)像素值的累加和。
[0012] 步驟3 :基于構(gòu)建好的判決字典D、匹配字典A和灰度矩陣T,確定初始化圖像的各 后續(xù)幀圖像的目標(biāo)位置,即對非第一幀圖像進(jìn)行目標(biāo)跟蹤處理:
[0013] 301 :候選粒子的采樣及候選粒子的預(yù)預(yù)選取
[0014] 首先是候選粒子的采樣:對當(dāng)前幀圖像進(jìn)行采樣(本處理過程直接基于慣用技術(shù) 完成即可,本發(fā)明不作限定,通??梢杂昧W訛V波方式完成采樣,采樣的粒子數(shù)量具體依實(shí) 際情況而定,一般可選擇500左右),得到第一候選圖像樣本集,然后基于K均值聚類從第一 候選樣本集中選取K個(gè)聚類中心,并計(jì)算每個(gè)聚類中心的置信值H。:
[0015] 基于公式(1)計(jì)算對應(yīng)的稀疏系數(shù):
[0016]
【主權(quán)項(xiàng)】
1. 一種基于稀疏表示的