基于二次譜聚類和hmm-rf混合模型的高速車輛行為識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及高速車輛行為識別方法。
[000引發(fā)明背景:
[0003] 近年來,提取交通監(jiān)控視頻中的有用信息來分析交通行為已成為研究人員關(guān)注的 熱點問題之一。交通行為的學(xué)習(xí)關(guān)鍵是學(xué)習(xí)運動車輛的行為模式,然后識別車輛行為,甚至 能對交通行為進(jìn)行預(yù)測。例如,高速公路上的車輛一般都沿著固定的道路和指定的方向行 駛,通過學(xué)習(xí)該些正常軌跡模型就可W自動檢測出逆行、S形行駛等高速公路上的異常行駛 行為。
[0004] 為了給高速車輛行為識別提供訓(xùn)練樣本,首先要利用車輛檢測和跟蹤算法從高速 交通視頻中提取車輛軌跡數(shù)據(jù),并對車輛軌跡進(jìn)行聚類。車輛軌跡聚類的一個重要問題就 是如何衡量車輛軌跡間的相似度。車輛軌跡聚類的難點在于車輛軌跡的長度是不固定的, 而大多數(shù)傳統(tǒng)的聚類算法的操作數(shù)據(jù)都建立在固定的維度空間(數(shù)據(jù)長度是固定且一致 的)?,F(xiàn)有的方法通常是直接考慮不同軌跡間的長度偏差,嘗試找到不同軌跡間對應(yīng)相似的 部分,即LCSS軌跡相似度,對車輛跟蹤環(huán)節(jié)中的噪聲或者異常值有一定的魯椿性;然后,在 構(gòu)建的LCSS軌跡相似度矩陣上用譜聚類算法進(jìn)行車輛軌跡聚類。。但從高速交通視頻中提 取的車輛軌跡存在少量的超車、變道等行駛軌跡,單單采用LCSS相似度和譜聚類算法會將 該些少量軌跡錯誤地分類到直行軌跡中。
[0005] 針對高速車輛行為實時性的要求,各國的研究人員一般采用基于軌跡的車輛行為 識別方法。考慮到HMM車輛軌跡建模方法對車輛行為識別率較高,但是只考慮本類型車輛 軌跡的正樣本的作用,而未考慮其他類型車輛軌跡負(fù)樣本的影響,從而很大程度上限制了 HMM車輛軌跡建模方法的分類能力,在多類別車輛軌跡識別上存在較大局限性;且僅用最 大似然值進(jìn)行分類,存在較高的誤識別率。
[0006] 技術(shù)方案:
[0007] 本發(fā)明要克服現(xiàn)有技術(shù)的缺點,提供一種基于二次譜聚類和HMM-RF混合模型的 高速車輛行為識別方法。
[000引本發(fā)明利用軌跡曲率來識別具有曲線軌跡特征的超車軌跡,利用傾角相似度和譜 聚類算法來識別非曲線軌跡中的變道軌跡,并將得到所有聚類簇用LCSS和譜聚類算法進(jìn) 行再聚類,從而有效地區(qū)分超車、變道W及直行軌跡等。在車輛行為識別時,該方法將不同 軌跡類型HMM模型的多維概率輸出作為隨機(jī)森林RF模型的輸入來識別多類型軌跡,用來替 代最大似然值分類,提高了車輛行為識別的準(zhǔn)確率。具體流程詳見圖1所示。
[0009] 本發(fā)明所述的一種基于二次譜聚類和HMM-RF混合模型的高速車輛行為識別方 法,包括W下步驟:
[0010] 步驟1.高速公路車輛軌跡二次譜聚類自動分類,利用車輛檢測和跟蹤算法從交 通視頻中提取車輛軌跡數(shù)據(jù)集,采用軌跡曲率特征、傾角相似度W及LCSS相似度,再結(jié)合 譜聚類算法對車輛軌跡進(jìn)行聚類,有效區(qū)分直行、超車、變道等類型。
[0011] 該方法首先采用最小二乘法擬合多項式來求解軌跡曲率,并計算軌跡中前N個最 大曲率的均值作為該軌跡曲率。若大于曲率闊值T,則為曲線聚簇;反之,則為非曲線聚簇。 接著對曲線聚簇構(gòu)建LCSS相似度矩陣,用譜聚類進(jìn)行聚類,得到曲線聚類最終結(jié)果;對非 曲線聚簇用最小二乘法擬合軌跡傾角,構(gòu)建軌跡傾角相似度矩陣,并用譜聚類算法進(jìn)行第 一次聚類,取得非曲線聚類中間結(jié)果,然后建立它的軌跡LCSS相似度矩陣,再用譜聚類對 非曲線聚類中間結(jié)進(jìn)行第二次聚類,獲得非曲線聚簇最終結(jié)果;最后整合兩個聚類結(jié)果,確 定最終聚類結(jié)果。
[0012] 軌跡傾角相似度,定義如下:
[0013]
(1)
[0014] 其中
對第i條軌跡的傾角,dem"=max(|目目jl)為 最大的傾角差值,n為軌跡數(shù)量。而
為軌跡的傾斜 率,其中Tm(x),Tm(y)表示第m個軌跡點的X,y軸坐標(biāo)值,1為軌跡長度。
[0015] LCSS軌跡相似度由Vlachos等提出的,定義如下;
[0016]
C2)
[0017] 其中LCSS(Fp,F(xiàn)。)描述軌跡Fp,F(xiàn)。間的最長公共子串的長度,Tp,T。分別表示軌跡 Fp,F(xiàn)。的長度。LCSS的遞歸定義如下;
[001 引
[0019] 利用動態(tài)規(guī)劃高效計算LCSS相似度,e表示兩點間歐式距離的闊值,護(hù)二{fl,… ,fj代表所有t時刻的所有樣本點,ft表不t時刻某一樣本點;
[0020] 根據(jù)軌跡相似度度量方法,計算兩兩軌跡間的相似度,進(jìn)而構(gòu)成軌跡相似度矩陣S ={Sxy},1《X,y《n,且S是全聯(lián)通圖的鄰接矩陣,Sq是相似度矩陣坐標(biāo)(X,y)處的值,n 為軌跡數(shù)量,即矩陣大??;譜聚類算法根據(jù)軌跡相似度矩陣計算特征向量找出數(shù)據(jù)間的內(nèi) 在聯(lián)系,將軌跡劃分為不同的類簇。
[0021] 步驟2.基于方向角的高速公路車輛軌跡特征提取,交通視頻中不同車輛行為產(chǎn) 生的方向信息能夠較好地描述車輛行駛狀態(tài)的信息,可W用來區(qū)分車輛行為模式,采用相 鄰軌跡點形成的方向角來表征。
[0022]假設(shè)車輛軌跡序列上t時刻的坐標(biāo)為(X。yt),t+1時刻的坐標(biāo)為(Xw,心1),則形 成的方向角0 =arctan((yt+i-yt)/(Xt+i-Xt))。在兼顧識別準(zhǔn)確率W及實時性需求,我們對 方向角在16個方向進(jìn)行均衡量化編碼,每31/8量化到一個方向,按照逆時針順序?qū)γ總€方 向區(qū)間進(jìn)行編碼,且依次對應(yīng)于0~15的碼字,如圖2所示。
[0023] 最后利用依次獲得的所有方向角序列0 1,0 2,…,0。_1構(gòu)成了車輛軌跡的新特征 值序列Le= (0。02,…,0n-lK
[0024] 步驟3.基于HMM的車輛行為模型的構(gòu)建,根據(jù)量化編碼后的車輛軌跡特征序列, 對同一類型的車輛軌跡建立對應(yīng)的基于HMM的車輛行為模型;將特征序列樣本對初始模型 不斷迭代,直到模型收斂。
[0025] 假設(shè)隨機(jī)觀察序列為0 = 〇1,〇2,…,〇n,HMM可定義為S元組A= {>,A,B},且有 M(通常為3~8)個馬爾可夫狀態(tài);
[0026] (a)模型初始化
[0027] 初始矩陣31 = {>J,用于描述觀察序列在初始狀態(tài)t= 1時的概率31k=P(ql= Sk),Sk表示第k個隱馬爾科夫狀態(tài),ql表示t= 1時刻的分布,1《k《M,且
狀態(tài) 轉(zhuǎn)移矩陣A= {Ski},用于描述狀態(tài)之間轉(zhuǎn)移的概率3ki二P(Qt二SiQt-i二Sk),l《k,l《M, 而
觀察概率矩陣bi(u) =P,用于描述狀態(tài)1對應(yīng)觀察值的輸出概率;bi(u) =P{Ot =化I Qt= s i},1《1《M,1《u《N,而
M是狀態(tài)數(shù),N是編碼符號的總數(shù);
[00測 (b)模型的更新
[0029] 利用新的車輛軌跡數(shù)據(jù),采用Baum-Welch算法重新估計A=元組;接著用 化rward算法計算更新前后模型的最大似然值,直到前后模型的最大似然值的差值在闊值 之內(nèi),停止迭代。
[0030] 步驟4.基于隨機(jī)森林(R巧車輛行為模型構(gòu)建,用特征序列經(jīng)由對應(yīng)HMM車輛行 為模型的多維概率的輸出作為隨機(jī)森林模型的輸入矢量,確立隨機(jī)森林車輛行為模型,最 后組合構(gòu)成基于HMM-RF車輛行為識別混合模型。
[0031] HMM模型良好的車輛軌跡建模能力和RF模型的強(qiáng)分類能力,提出了一種基于 HMM-HF混合模型的車輛軌跡行為識別方法。具體的思路就是將HMM作為車輛軌跡模型的一 部分和RF模型共同組成車輛軌跡模型,WHMM模型作為車輛軌跡模型的前綴,W此來對用 于RF模型的多類車輛軌跡數(shù)據(jù)有區(qū)分性的特征變換。
[0032] 車輛軌跡混合模型訓(xùn)練具體過程如下:
[0033] 1)利用聚類好的不同類軌跡數(shù)據(jù),重新采樣到統(tǒng)一長度N的范圍內(nèi),提取方向角 特征,構(gòu)建新的特征序列
[0034] 2)通過Baum-Welch算法來分別迭代訓(xùn)練與車輛行為