一種基于多維數(shù)據(jù)的交通異常點檢測方法
【專利摘要】本發(fā)明涉及一種基于多維數(shù)據(jù)的交通異常點檢測方法,該方法對微波設(shè)備獲取的每條路段連續(xù)一段時間內(nèi)的流量、速度和車道占有率數(shù)據(jù),先根據(jù)速度數(shù)據(jù)計算路段的歷史擁堵概率,通過對比最近時間的交通狀態(tài)指標(biāo)值定義路段的正、負(fù)異常,再從負(fù)異常的路段中用基于密度的局部異常因子方法計算異常度,并結(jié)合正負(fù)異常因子計算加權(quán)異常度并排序。本發(fā)明方法采用多指標(biāo)數(shù)據(jù),考慮了樣本空間數(shù)據(jù)分布不均勻的情況,通過結(jié)合交通數(shù)據(jù)本身特性,避免了基于密度的局部異常因子方法的局部有限性,能有效檢測出道路異常點,幫助交管部門指揮道路交通,調(diào)節(jié)優(yōu)化道路的使用效率,具有通用性強、可行性強、可靠性高、適用性強的特點。
【專利說明】一種基于多維數(shù)據(jù)的交通異常點檢測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及智能交通領(lǐng)域,尤其涉及一種基于多維數(shù)據(jù)的交通異常點檢測方法?!颈尘凹夹g(shù)】
[0002] 隨著城市經(jīng)濟(jì)的快速發(fā)展,城市交通中機動車數(shù)量不斷增加,如何有效調(diào)控交通 流量,優(yōu)化道路的使用效率,疏導(dǎo)道路的交通狀況,成為城市智能交通領(lǐng)域研究的重點。而 其中的一個關(guān)鍵技術(shù)就是對城市交通的異常進(jìn)行檢測,即通過一定的技術(shù)手段檢測出城市 交通中出現(xiàn)異常的路段。異常點的檢測是城市交通公共信息服務(wù)的主要內(nèi)容,也是交通管 理部門部署警力、疏導(dǎo)道路交通的必要手段。交通異常點的檢測一般是采用車流量數(shù)據(jù)進(jìn) 行分析,但該做法沒有考慮交通數(shù)據(jù)本身特性,會將正常數(shù)據(jù)檢測為異常,如出現(xiàn)紅燈的時 間不固定而導(dǎo)致的某時段某路段流量出現(xiàn)變化的情況。因此采用多指標(biāo)數(shù)據(jù)檢測交通道路 異常點來克服單個指標(biāo)的片面性和較大誤差。在異常點檢測中,通過采用技術(shù)手段對多指 標(biāo)數(shù)據(jù)進(jìn)行分析計算,得出交通異常的路段,包括正異常和負(fù)異常,正異常指好的異常,即 交通狀態(tài)相比以前變好了;負(fù)異常指壞的異常,即交通狀態(tài)相比以前變壞了,負(fù)異常的路段 是交通管理部門重點關(guān)注的路段,因此本發(fā)明主要考慮負(fù)異常的情況。
[0003] 目前對交通異常點檢測的研究較少,一般只是單純的擁堵檢測。異常點檢測可采 用離群點檢測的方法,主要有基于模型的方法,基于鄰近度的方法,基于聚類的方法以及基 于密度的方法?;谀P偷姆椒ㄒ笫孪戎罃?shù)據(jù)服從什么分布,對多維數(shù)據(jù)的檢測性較 差;基于鄰近度的方法不適用于交通大數(shù)據(jù)集,對參數(shù)選擇較敏感,且無法滿足交通數(shù)據(jù)分 布不均勻的需求;基于聚類的方法其檢測結(jié)果與簇類個數(shù)的選取有關(guān),會出現(xiàn)誤判現(xiàn)象,即 使是不需預(yù)先選擇簇類個數(shù)的DBSCAN方法對于簇的邊界樣本同樣會出現(xiàn)誤判,且不能較 好反映多維數(shù)據(jù);基于密度的方法能有效適用于分布不均勻的多維交通數(shù)據(jù),且在交通異 常點檢測中對參數(shù)的選擇不敏感。為了定量給出交通異常點,設(shè)計一種基于多維數(shù)據(jù)的交 通異常點檢測方法是十分有必要的。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明為克服上述的不足之處,目的在于提供一種基于多維數(shù)據(jù)的交通異常點檢 測方法,該方法對微波設(shè)備獲取的每條路段連續(xù)一段時間內(nèi)的流量、速度和車道占有率數(shù) 據(jù),先根據(jù)速度數(shù)據(jù)計算路段的歷史擁堵概率,通過對比最近時間的交通狀態(tài)指標(biāo)值定義 路段的正、負(fù)異常,再從負(fù)異常的路段中用基于密度的局部異常因子方法計算異常度,并結(jié) 合正負(fù)異常因子計算加權(quán)異常度。本發(fā)明方法采用多指標(biāo)數(shù)據(jù),考慮了樣本空間數(shù)據(jù)分布 不均勻的情況,通過結(jié)合交通數(shù)據(jù)本身特性,避免了基于密度的局部異常因子方法的局部 有限性,能有效檢測出道路異常點,幫助交管部門指揮道路交通,調(diào)節(jié)優(yōu)化道路的使用效 率。
[0005] 本發(fā)明是通過以下技術(shù)方案達(dá)到上述目的:一種基于多維數(shù)據(jù)的交通異常點檢測 方法,包括如下步驟:
[0006] (1)采集微波監(jiān)控路段的交通特征數(shù)據(jù);
[0007] (2)計算每條路段的歷史擁堵概率;
[0008] (3)根據(jù)每條路段的交通特征數(shù)據(jù)來判斷并定義路段的正負(fù)異常;
[0009] (4)采用基于密度的局部離群因子算法計算異常度;
[0010] (5)通過步驟(2)與步驟(4)得到的結(jié)果計算加權(quán)異常度;
[0011] (6)對步驟(5)得到的結(jié)果進(jìn)行排序,得到前T個加權(quán)異常度最大的路段,T為預(yù) 先設(shè)置的閾值;
[0012] (7)輸出前T個加權(quán)異常度最大的路段。
[0013] 作為優(yōu)選,所述步驟(1)所述的交通特征數(shù)據(jù)包括微波監(jiān)測路段的車流量、車輛 速度、車道占有率三類數(shù)據(jù)。
[0014] 作為優(yōu)選,所述步驟(2)計算每條路段的歷史擁堵概率是以車輛速度數(shù)據(jù)為對 象,計算速度小于V的數(shù)據(jù)占有率;歷史擁堵概率的計算式子如下所示:
[0015]
【權(quán)利要求】
1. 一種基于多維數(shù)據(jù)的交通異常點檢測方法,其特征在于包括如下步驟: (1) 采集微波監(jiān)控路段的交通特征數(shù)據(jù); (2) 計算每條路段的歷史擁堵概率; (3) 根據(jù)每條路段的交通特征數(shù)據(jù)來判斷并定義路段的正負(fù)異常; (4) 采用基于密度的局部離群因子算法計算異常度; (5) 通過步驟(2)與步驟(4)得到的結(jié)果計算加權(quán)異常度; (6) 對步驟(5)得到的結(jié)果進(jìn)行排序,得到前T個加權(quán)異常度最大的路段,T為預(yù)先設(shè) 置的閾值; (7) 輸出前T個加權(quán)異常度最大的路段。
2. 根據(jù)權(quán)利要求1所述的一種基于多維數(shù)據(jù)的交通異常點檢測方法,其特征在于:所 述步驟(1)所述的交通特征數(shù)據(jù)包括微波監(jiān)測路段的車流量、車輛速度、車道占有率三類 數(shù)據(jù)。
3. 根據(jù)權(quán)利要求1或2所述的一種基于多維數(shù)據(jù)的交通異常點檢測方法,其特征在于: 所述步驟(2)計算每條路段的歷史擁堵概率是以車輛速度數(shù)據(jù)為對象,計算速度小于V的 數(shù)據(jù)占有率;歷史擁堵概率的計算式子如下所示:
其中,P(i)為第i條路段的歷史擁堵概率,v(i)為第i條路段的微波速度數(shù)據(jù),sum為 求個數(shù)函數(shù)。
4. 根據(jù)權(quán)利要求1或2所述的一種基于多維數(shù)據(jù)的交通異常點檢測方法,其特征在于: 所述步驟(3)判斷并定義路段的正負(fù)異常的規(guī)則為若交通狀態(tài)為暢通,則正負(fù)異常因子為 flag= 0-p;若交通狀態(tài)為非暢通,則正負(fù)異常因子為flag= 1-p;flag>O為負(fù)異常, flag彡0為正異常。
5. 根據(jù)權(quán)利要求1所述的一種基于多維數(shù)據(jù)的交通異常點檢測方法,其特征在于:所 述步驟(4)計算異常度的基于密度的局部離群因子算法包括如下步驟: 1) 對輸入的m*n數(shù)據(jù)D計算D中所有對象的K距離鄰域,其中m為數(shù)據(jù)對象的個數(shù),n 為維度; 2) 計算對象p與其K距離鄰域?qū)ο蟮目蛇_(dá)距離,其中可達(dá)距離是該對象的K距離與該 對象和對象P的距離之間的較大值: reach_dist_k(p,〇) =max{K_distance(o),dist(p,o)}; 3) 計算對象p的局部可達(dá)密度: lrd_k(p) = |N_k(p)I/E〇eN-k(p)reach_dist_k(p,〇) 其中局部可達(dá)密度是對象的K距離鄰域內(nèi)所有對象的可達(dá)距離之和與K距離鄰域內(nèi)的 對象個數(shù)之比的倒數(shù); 4) 計算對象p的局部離群因子:
5) 重復(fù)步驟1)至4),求出所有輸入數(shù)據(jù)的局部離群因子,若有r條路段,每條路段有 m,個數(shù)據(jù)對象,則可得到!個m,維的LOF序列,LOF值就是所求的異常度。
6. 根據(jù)權(quán)利要求5所述的一種基于多維數(shù)據(jù)的交通異常點檢測方法,其特征在于:所 述步驟1)計算D中對象的K距離鄰域的方法如下: a) 采用歐式距離或曼哈頓距離,數(shù)據(jù)D的距離矩陣為dist:m*m的對稱矩陣,計算每兩 個對象間的距離; b) 對每個對象與其他對象的距離進(jìn)行排序,第K個最小距離即為K距離[distance; c) 得到每個對象的K距離鄰域: N_k(p) ={pIdist(p,q) ^K_distance(p)} 其中每個對象的K距離鄰域即為與其的距離不大于其K距離的對象的集合。
7. 根據(jù)權(quán)利要求1所述的一種基于多維數(shù)據(jù)的交通異常點檢測方法,其特征在于:所 述步驟(5)計算加權(quán)異常度是以負(fù)異常路段的LOF異常度乘以代表歷史擁堵概率的正負(fù)異 常因子flag得到路段的加權(quán)異常度,計算式子如下: WLOF(i) =L0F(i)lastXflag(i) 其中,LOF(i)last是第i條負(fù)異常路段的最后一個LOF值,flag(i)是第i條路段的負(fù) 異常因子,WLOF(i)是第i條路段的加權(quán)異常度。
8. 根據(jù)權(quán)利要求3所述的一種基于多維數(shù)據(jù)的交通異常點檢測方法,其特征在于:所 述的速度V為0km/h-20km/h中的任意一個速度值。
9. 根據(jù)權(quán)利要求1所述的一種基于多維數(shù)據(jù)的交通異常點檢測方法,其特征在于:所 述的閾值T設(shè)置為5。
【文檔編號】G08G1/01GK104504901SQ201410837207
【公開日】2015年4月8日 申請日期:2014年12月29日 優(yōu)先權(quán)日:2014年12月29日
【發(fā)明者】李丹, 李建元, 王浩, 張麒, 顧超 申請人:浙江銀江研究院有限公司