本發(fā)明涉及圖像處理技術領域,更具體地,涉及一種跨攝像頭的行人軌跡匹配方法。
背景技術:
隨著計算機技術和圖像處理技術的發(fā)展,基于視頻的智能監(jiān)控系統(tǒng)得到廣泛的應用,其中行人追蹤技術在商業(yè)客流分析、社會公共安全監(jiān)控等領域發(fā)揮著巨大的作用。由于單個攝像機的視野有限,為了擴展視野,實現(xiàn)行人的長距離追蹤,基于多攝像頭的行人追蹤技術備受關注。實現(xiàn)多攝像頭行人跟蹤的一個關鍵技術難題是對不同攝像頭視域內的行人進行匹配關聯(lián)。
傳統(tǒng)的行人追蹤技術主要依靠視頻中行人的表觀特征進行追蹤,如基于梯度直方圖(HOG)特征向量的追蹤方法,基于加權顏色直方圖模型的粒子濾波追蹤方法等。但是在多攝像頭環(huán)境下,由于不同攝像機的視角差異問題,在交疊視域中觀察到的行人表觀特征具有很大差別,很可能一個攝像頭拍到某位行人的正面,但是另外一個攝像頭拍攝到的卻是該行人的背面。這導致傳統(tǒng)方法難以準確地在兩個攝像頭之間追蹤行人。
為了解決以上問題,現(xiàn)有技術提供了以下幾種跨攝像頭的軌跡匹配方法:
1)通過歐氏距離的最大最小值判斷相似性。首先將候選軌跡分為n段,目標軌跡分別計算其對應點與n段軌跡的最短距離,然后再將其與n段軌跡的最短距離中取最大距離當做候選軌跡、目標軌跡間的距離;
2)通過疑似移動對象匹配數(shù)判斷相似性。獲取目標軌跡的匹配基準軌跡點列表,對列表中的每個軌跡點分別獲取疑似移動對象列表,統(tǒng)計對象列表中的匹配數(shù),將匹配數(shù)最大的疑似移動對象當做匹配對象。
上述方案中,一方面,傳統(tǒng)的行人追蹤技術依靠視頻中行人的表觀特征進行追蹤,但是在多攝像頭環(huán)境下由于視角差異,追蹤準確率有較大下降。另一方面,傳統(tǒng)的軌跡匹配方法通過計算不同軌跡間軌跡點的歐氏距離來判斷相似性,由于不同軌跡的長度經常不同(軌跡點數(shù)量不相同),需要采取插值等手段增加虛擬軌跡點,這會引入度量誤差。
技術實現(xiàn)要素:
本發(fā)明為解決以上方法在進行跨攝像頭追蹤時由于存在視角差異導致的追蹤準確率低或引入度量誤差的缺陷,提供了一種跨攝像頭的行人軌跡匹配方法,該方法不使用行人的視覺表觀特征進行跨攝像頭匹配,而是通過匹配不同攝像頭的最相似軌跡來確定是否屬于同一行人,解決了跨攝像頭的行人追蹤問題;且由于全局運動模式特征是共享的,每條軌跡在全局運動模式特征上的權重可以直接用于計算相似度,從而解決了軌跡點對齊問題。
為實現(xiàn)以上發(fā)明目的,采用的技術方案是:
一種跨攝像頭的行人軌跡匹配方法,包括以下步驟:
S1.提取目標攝像頭的一條行人軌跡作為目標軌跡,然后將其余攝像頭在該時間段內存在的所有軌跡作為候選軌跡;
S2.使用中國連鎖餐廳過程訓練分層狄利克雷過程,提取所有軌跡的全局運動模式特征,同時獲得目標軌跡和各條候選軌跡在全局運動模式特征上的特征權重;
S3.分別計算目標軌跡特征權重與各條候選軌跡特征權重之間的余弦距離作為相似性度量,然后將余弦距離最小的候選軌跡作為目標軌跡的匹配軌跡。
優(yōu)選地,所述中國連鎖餐廳過程訓練分層狄利克雷過程,提取所有軌跡的全局運動模式特征并獲得特征權重的具體過程如下:
S11.定義tji為第j個軌跡中第i個觀察值xji所屬的集合,tji的取值有如下關系:
t、k、θ、x分別表示所有tji、kjt、θk、xji組成的集合,α0表示狄利克雷過程Gj的集中參數(shù),t表示tji的實際取值,f(·)表示多項式分布的概率密度函數(shù),表示去除第i個觀察值后,第j個軌跡中集合t的觀察值數(shù)量,t-ji表示去除集合tji后,第j個軌跡的其余觀察值集合;
S12.定義kjt為第j個軌跡中集合t的運動模式,定義St為集合t上的觀察值,kjt的取值有如下關系:
k-jt表示去除觀察值集合t后,第j個軌跡的其余觀察值集合所屬的運動模式集合;γ為狄利克雷過程G0的集中參數(shù);表示所有軌跡的觀察值集合中去除集合t后,余下的集合中屬于運動模式k的數(shù)量;
S13.定義θk為第k種運動模式,定義Sk為所有軌跡中屬于運動模式k的觀察值,θk的取值有如下關系:
h(θk)表示基分布H的概率密度函數(shù),θ-k表示去除運動模式k后,其余運動模式的取值的集合;
S14.統(tǒng)計第j個軌跡中所有觀察值集合的運動模式種類情況,即為特征權重{π}:
T表示第j個軌跡中集合t的元素個數(shù),其中是狄拉克δ函數(shù),具有如下性質:
優(yōu)選地,所述步驟S3中,計算目標軌跡特征權重與各條候選軌跡特征權重之間的余弦距離,然后利用匈牙利算法將余弦距離最小的候選軌跡作為目標軌跡的匹配軌跡。
與現(xiàn)有技術相比,本發(fā)明的有益效果是:
1.相對于傳統(tǒng)的行人追蹤技術,本發(fā)明通過匹配不同攝像頭的最相似軌跡來確定同一行人,解決了不同攝像頭中行人表觀特征差異過大的問題;
2.相對于傳統(tǒng)的軌跡匹配技術,本發(fā)明通過HDP提取軌跡共享的全局運動模式特征,每條軌跡在全局運動模式特征上的權重可以直接用于計算相似度,從而解決了軌跡點對齊問題。
附圖說明
圖1為方法的流程圖。
具體實施方式
附圖僅用于示例性說明,不能理解為對本專利的限制;
以下結合附圖和實施例對本發(fā)明做進一步的闡述。
實施例1
如圖1所述,本發(fā)明提供的方法具體包括以下步驟:
利用{x}=(x1,x2,…,xL)來表示一條行人軌跡,其中xi表示觀察值,L為軌跡長度,每個觀察值xi由當前點的位置信息和相鄰點間的運動方向信息組成,其中位置信息的取值范圍是160×120,相鄰點間運動方向信息分為上下左右4個方向,即每個觀察值都是一個三維向量,xi∈R3。
在以上基礎上,本發(fā)明提供的方法包括以下步驟:
S1.提取目標攝像頭的一條行人軌跡作為目標軌跡,然后將其余攝像頭在該時間段內出現(xiàn)的所有軌跡作為候選軌跡;
S2.使用中國連鎖餐廳過程訓練分層狄利克雷過程,提取所有軌跡的全局運動模式特征,同時獲得目標軌跡和各條候選軌跡在全局運動模式特征上的特征權重;
S3.分別計算目標軌跡特征權重與各條候選軌跡特征權重之間的余弦距離作為相似性度量,然后將余弦距離最小的候選軌跡作為目標軌跡的匹配軌跡。
直觀上看,全局運動模式特征就是所有的軌跡中經常出現(xiàn)的一小段軌跡,如從畫面左上方移動到畫面中央等。
中國連鎖餐廳過程假設有多間連鎖餐廳,每間餐廳共用同一份有無窮多種菜品的菜單,并且可容納無窮多張餐桌;餐廳中的每張餐桌可以容納無窮多位顧客,且每張餐桌只提供一道菜。
定義tji為第j個餐廳中第i位顧客選擇的餐桌,顧客以正比于njt的概率選擇第t張已經有人的餐桌(即tji=t),其中njt為第j個餐廳中餐桌t上的顧客數(shù);同時顧客也以正比于α0的概率選擇新餐桌(即tji=tnew),α0為狄利克雷過程Gj的集中參數(shù)。
定義kjt為第j個餐廳中第t張餐桌提供的菜,餐桌以正比于mk的概率選擇第k道菜(即kjt=k),其中mk為所有餐廳里提供第k道菜的餐桌數(shù);同時餐桌也以正比于γ的概率選擇一道新菜(即kjt=knew),γ為狄利克雷過程G0的集中參數(shù)。
定義θk為第k道菜,θk實際上是關于基分布H的獨立同分布隨機變量,即θk~H?;植糎是一個L維狄利克雷分布,H=Dir(γ/L,…,γ/L),L為觀察值的取值范圍,觀察值xji是以θk為參數(shù)的多項式分布產生,即xji~f(θk)。
上述CRF定義中,一間餐廳對應一條軌跡,一位顧客對應軌跡的一個觀察值,一張餐桌對應一個觀察值集合,一道菜對應觀察值的一種運動模式。
因此,所述中國連鎖餐廳過程訓練分層狄利克雷過程,提取所有軌跡的全局運動模式特征并獲得特征權重的具體過程如下:
S11.定義tji為第j個軌跡中第i個觀察值xji所屬的集合,tji的取值有如下關系:
t、k、θ、x分別表示所有tji、kjt、θk、xji組成的集合,α0表示狄利克雷過程Gj的集中參數(shù),t表示tji的實際取值,f(·)表示多項式分布的概率密度函數(shù),表示去除第i個觀察值后,第j個軌跡中集合t的觀察值數(shù)量,t-ji表示去除集合tji后,第j個軌跡的其余觀察值集合;
S12.定義kjt為第j個軌跡中集合t的運動模式,定義St為集合t上的觀察值,kjt的取值有如下關系:
k-jt表示去除觀察值集合t后,第j個軌跡的其余觀察值集合所屬的運動模式集合;γ為狄利克雷過程G0的集中參數(shù);表示所有軌跡的觀察值集合中去除集合t后,余下的集合中屬于運動模式k的數(shù)量;
S13.定義θk為第k種運動模式,定義Sk為所有軌跡中屬于運動模式k的觀察值,θk的取值有如下關系:
h(θk)表示基分布H的概率密度函數(shù),θ-k表示去除運動模式k后,其余運動模式的取值的集合;
S14.統(tǒng)計第j個軌跡中所有觀察值集合的運動模式種類情況,即為特征權重{π}:
T表示第j個軌跡中集合t的元素個數(shù),其中是狄拉克δ函數(shù),具有如下性質:
顯然,本發(fā)明的上述實施例僅僅是為清楚地說明本發(fā)明所作的舉例,而并非是對本發(fā)明的實施方式的限定。對于所屬領域的普通技術人員來說,在上述說明的基礎上還可以做出其它不同形式的變化或變動。這里無需也無法對所有的實施方式予以窮舉。凡在本發(fā)明的精神和原則之內所作的任何修改、等同替換和改進等,均應包含在本發(fā)明權利要求的保護范圍之內。