本發(fā)明涉及智能交通,尤其涉及一種基于聚類和偏差閾值修正篩選的公交軌跡挖掘方法及應(yīng)用。
背景技術(shù):
1、智能交通是未來城市管理的重要組成部分,而公共交通工具,諸如地鐵、公交車等具有運量大、成本低、安全環(huán)保的優(yōu)勢,是智能化交通管理的重中之重。
2、對公交gps數(shù)據(jù)進行處理與分析,能夠從中準確提取公交線路的具體軌跡,而其又是進行公交站距計算、公交電子圍欄繪制、路況分析以及公交到站時間預(yù)測的基礎(chǔ),對公交公司進行公交實時監(jiān)控、公交報表統(tǒng)計以及公交大數(shù)據(jù)分析有著重要意義。
3、雖然gps已經(jīng)較為準確,但是由于信號干擾、地形、天氣、設(shè)備穩(wěn)定性等因素的影響,仍舊會出現(xiàn)偏移的問題,而目前,利用聚類算法對多輛車的軌跡進行相似度計算是軌跡挖掘的常見方法,然而,由于上述問題,一些異常軌跡點無法做到完全篩除,即使利用多輛車的軌跡進行相似度計算和提取也會使得計算復(fù)雜度過高并且無法完全避免異常點的連接,導(dǎo)致軌跡的準確性受影響,可見,現(xiàn)有技術(shù)在處理軌跡數(shù)據(jù)時仍然存在一定的局限性。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種基于聚類和偏差閾值修正篩選的公交軌跡挖掘方法及應(yīng)用。
2、為實現(xiàn)前述發(fā)明目的,本發(fā)明采用的技術(shù)方案包括:
3、第一方面,本發(fā)明提供一種基于聚類和偏差閾值修正篩選的公交軌跡挖掘方法,其包括:
4、獲取同一線路中的多個公交車的gps原始數(shù)據(jù);
5、對所述gps原始數(shù)據(jù)進行聚類處理,形成若干簇,剔除不屬于任一簇的數(shù)據(jù)點,獲得聚類篩選數(shù)據(jù);
6、將所述聚類篩選數(shù)據(jù)按照站序進行分段,形成多段數(shù)據(jù);
7、對所述多段數(shù)據(jù)中的任一段,計算目標數(shù)據(jù)點指向下一數(shù)據(jù)點的第一方位角,以及指向段尾站的第二方位角,計算所述第一方位角和第二方位角的角度偏差值;
8、統(tǒng)計所述角度偏差值的分布,設(shè)定初始閾值,使得高于所述初始閾值的角度偏差值所占比例為預(yù)設(shè)比例;
9、基于所述目標數(shù)據(jù)點與段尾站之間的到站距離計算修正因子,所述修正因子與所述到站距離具有反相關(guān)的趨勢且始終為正值;
10、基于所述修正因子與所述初始閾值的乘積計算篩選閾值,并剔除對應(yīng)的所述第一方位角在所述篩選閾值以上的部分目標數(shù)據(jù)點,得到方位角篩選數(shù)據(jù);
11、基于所述方位角篩選數(shù)據(jù),提取所述線路對應(yīng)的公交軌跡。
12、第二方面,本發(fā)明還提供一種上述公交軌跡挖掘方法在公交運營管理中的應(yīng)用。
13、第三方面,本發(fā)明還提供一種基于多目標車輛gps數(shù)據(jù)聚類的公交軌跡挖掘系統(tǒng),其包括:
14、數(shù)據(jù)獲取模塊,用于獲取同一線路中的多個公交車的gps原始數(shù)據(jù);
15、聚類篩選模塊,用于對所述gps原始數(shù)據(jù)進行聚類處理,形成若干簇,剔除不屬于任一簇的數(shù)據(jù)點,獲得聚類篩選數(shù)據(jù);
16、分段模塊,用于將所述聚類篩選數(shù)據(jù)按照站序進行分段,形成多段數(shù)據(jù);
17、角度偏差模塊,用于對所述多段數(shù)據(jù)中的任一段,計算目標數(shù)據(jù)點指向下一數(shù)據(jù)點的第一方位角,以及指向段尾站的第二方位角,計算所述第一方位角和第二方位角的角度偏差值;
18、初始閾值模塊,用于統(tǒng)計所述角度偏差值的分布,設(shè)定初始閾值,使得高于所述初始閾值的角度偏差值所占比例為預(yù)設(shè)比例;
19、修正因子模塊,用于基于所述目標數(shù)據(jù)點與段尾站之間的到站距離計算修正因子,所述修正因子與所述到站距離反相關(guān)且始終為正值;
20、閾值篩選模塊,用于基于所述修正因子與所述初始閾值的乘積計算篩選閾值,并剔除對應(yīng)的所述第一方位角在所述篩選閾值以上的部分目標數(shù)據(jù)點,得到方位角篩選數(shù)據(jù);
21、軌跡提取模塊,用于基于所述方位角篩選數(shù)據(jù),提取所述線路對應(yīng)的公交軌跡。
22、基于上述技術(shù)方案,與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果至少包括:
23、本發(fā)明所提供的公交軌跡挖掘方法首先基于無監(jiān)督聚類算法和方位角差異的篩選規(guī)則來聚合線路軌跡,利用多輛公交車gps數(shù)據(jù)相互補充,降低異常點對軌跡分析的影響;此外本發(fā)明還提出了針對方位角差異篩選的基于到站距離反相關(guān)的修正算法,針對到站距離的不同設(shè)定不同的角度差異篩選力度,避免不同位置的篩選過于嚴格或過于松弛,最終提供了高精度和高可信度的軌跡數(shù)據(jù),給智能化交通管理創(chuàng)造了有利條件。
24、上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠使本領(lǐng)域技術(shù)人員能夠更清楚地了解本申請的技術(shù)手段,并可依照說明書的內(nèi)容予以實施,以下以本發(fā)明的較佳實施例并配合詳細附圖說明如后。
1.一種基于聚類和偏差閾值修正篩選的公交軌跡挖掘方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的公交軌跡挖掘方法,其特征在于,所述初始閾值的確定過程表示為:
3.根據(jù)權(quán)利要求1所述的公交軌跡挖掘方法,其特征在于,所述修正因子為非線性函數(shù),且設(shè)置上限值和下限值。
4.根據(jù)權(quán)利要求3所述的公交軌跡挖掘方法,其特征在于,所述修正因子的計算方式表示為:
5.根據(jù)權(quán)利要求1所述的公交軌跡挖掘方法,其特征在于,所述角度偏差值的計算過程表示為:
6.根據(jù)權(quán)利要求1所述的公交軌跡挖掘方法,其特征在于,所述聚類篩選數(shù)據(jù)的獲取過程具體包括:
7.根據(jù)權(quán)利要求1所述的公交軌跡挖掘方法,其特征在于,在進行所述聚類處理前,還包括:
8.根據(jù)權(quán)利要求1或7所述的公交軌跡挖掘方法,其特征在于,所述gps原始數(shù)據(jù)包括公交車的經(jīng)緯度、站序、瞬時速度、時間戳。
9.權(quán)利要求1-8中任意一項所述的公交軌跡挖掘方法在公交運營管理中的應(yīng)用。
10.一種基于多目標車輛gps數(shù)據(jù)聚類的公交軌跡挖掘系統(tǒng),其特征在于,包括: