1.一種公交乘客客流數據采集與分析方法,其特征在于:包括以下步驟:
(1)初步采集:追蹤用戶在公交無線網絡接入點的出現時刻ts與消失時刻te;
(2)匹配:將公交車GPS數據與站點信息進行匹配,得到公交車在各站點的??繒r刻,構建公交車在各站點的??啃畔?,至少包括公交車在各站點的??繒r刻和對應站點的名稱;
(3)篩除干擾:結合用戶的出現時刻ts與消失時刻te、公交車GPS數據和所述步驟(2)匹配得到的公交車在各站點的停靠信息,以設定的時間閾值Δt和距離閾值Δs為約束條件,判斷用戶是否為公交車乘客;
剔除不是公交車乘客的用戶信息,保留判斷為公交車乘客的用戶信息,并得到作為公交車乘客的用戶的上車站點和下車站點;
(4)客流推導:根據所述步驟(3)得到的作為公交車乘客的用戶的上車站點和下車站點,計算得到各站點的客流,并按線路行駛方向累加得到站點間的斷面客流;
(5)數據修正:將所述步驟(4)得到的客流與人工實際統(tǒng)計的客流進行比較,計算客流誤差;對客流誤差的分布進行假設檢驗,建立客流誤差修正算法對所述步驟(4)中得到的客流進行修正。
2.根據權利要求1所述的公交乘客客流數據采集與分析方法,其特征在于:所述步驟(1)基于IEEE802.11的通信機制,用戶的移動終端通過WIFI方式傳輸信息幀,公交車AP終端對用戶的移動終端進行無認證感知并采集,記錄用戶信息,并進行幀類型的識別;
優(yōu)選地,所述用戶信息包括用戶MAC地址、信息傳輸時間、信息幀類型和信號強度。
3.根據權利要求1所述的公交乘客客流數據采集與分析方法,其特征在于:所述步驟(2)中將公交車GPS數據與站點信息進行匹配的方法為:
(21)查詢目標線路每個站點的經緯度坐標;
(22)換算每條GPS數據記錄的經緯度坐標與每個站點的經緯度坐標換對應位置的距離djw;每條GPS數據均至少包括記錄時刻、在所述記錄時刻公交車所處的經緯度坐標以及公交車的速度;
(23)篩選出每個站點半徑閾值dr范圍內的所有GPS數據,從中篩選出公交車的速度最小且最小的速度小于速度閾值的記錄點作為公交車在該站點的停車點,記錄停靠時刻tb;半徑閾值dr和所述速度閾值均為設定的;
(24)將各站點的站點名稱、站點的經緯度坐標、對應的停車點處的經緯度坐標、站點和對應的停車點的距離、對應的最小的公交車的速度構成匹配結果;
優(yōu)選地,所述距離djw的計算公式為:
C=sin(LatA)*sin(LatB)+cos(LatA)*cos(LatB)*cos(MLonA-MLonB);
djw=R*Arccos(C)*π/180
其中:LonA和LatA為站點的經緯度坐標;LonB和LatB為GPS記錄點的經緯度坐標;R為地球半徑;Mlon表示對東經取正,對西經取負后得到的新經度;
優(yōu)選地,所述速度閾值為10km/h。
4.根據權利要求1所述的公交乘客客流數據采集與分析方法,其特征在于:所述步驟(3)中的時間閾值Δt的計算方法為:
根據上一部公交車GPS數據與站點信息匹配的結果,計算所在線路各站點之間公交車的行駛時間集合TI;再提取所述行駛時間集合TI的85%分位數tI85,把大于tI85的行駛時間剔除,保留剩余的行駛時間得到行駛時間集合TI’,并求得TI’的均值則時間閾值Δt根據下式計算得到:
5.根據權利要求1所述的公交乘客客流數據采集與分析方法,其特征在于:所述步驟(3)中的距離閾值Δs為:
Δs=db2
其中,db2為若乘客下車后往與公交車的行駛方向相同的方向行走,公交車AP終端最后一次接收到乘客的數據時,公交車距離站點的距離。
6.根據權利要求1所述的公交乘客客流數據采集與分析方法,其特征在于:所述步驟(3)包括以下步驟:
(31)對每個用戶,計算消失時刻te與出現時刻ts之差得到持續(xù)時間Tse;
(32)若持續(xù)時間Tse小于時間閾值Δt,則認定對應的用戶不是公交車乘客,直接刪除對應的用戶的數據;否則,進入步驟(33);
(33)在公交車GPS數據中,尋找在出現時刻ts公交車的經緯度坐標和在消失時刻te公交車的經緯度坐標;
(34)基于所述步驟(2)匹配得到的公交車在各站點的??啃畔?,將離出現時刻ts公交車的經緯度坐標最近的同方向的站點設定為用戶的上車站點,將離消失時刻te公交車的經緯度坐標最近的同方向的站點設定為用戶的下車站點;
(35)計算出現時刻ts公交車的經緯度坐標與設定的上車站點之間的距離d1,以及消失時刻te公交車的經緯度坐標與設定的下車站點之間的距離d2;當所述距離d1和所述距離d2均小于所述距離閾值Δs時,判定對應的用戶為公交車乘客,所述步驟(34)中設定的上車站點和下車站點為用戶實際的上車站點和下車站點。
7.根據權利要求1所述的公交乘客客流數據采集與分析方法,其特征在于:所述步驟(5)中對客流誤差進行假設檢驗和修正包括:
假設客流誤差服從正態(tài)分布,對樣本進行參數估計,擬合得到客流誤差的正態(tài)分布,稱為擬合正態(tài)分布;
通過正態(tài)假設檢驗判斷所述擬合正態(tài)分布的合理性;
將通過檢驗的擬合正態(tài)分布的期望值作為客流的修正值,將所述修正值加上所述步驟(4)推斷得到的客流,得到修正后的客流;
優(yōu)選的,所述擬合采用MATLAB軟件進行。
8.根據權利要求6所述的公交乘客客流數據采集與分析方法,其特征在于:所述檢驗的方法為利用T檢驗進行顯著性水平為0.05的假設檢驗。
9.根據權利要求6所述的公交乘客客流數據采集與分析方法,其特征在于:所述檢驗的方法為皮爾遜卡方檢驗;
優(yōu)選地,所述檢驗的方法包括以下步驟:
將需要檢驗的數據分為等量的m組;
依次計算以下各式:
npi=Xmax*pi
其中:pi為正態(tài)概率;npi為理論頻數;n表示所用于檢驗的樣本量;Xmax表示分成m組中,每組的上限;μ表示利用樣本計算的均值;α表示利用樣本計算的標準差;ni表示每組中的樣本數;χ2表示計算的卡方值;
如果算得的χ2趨向于自由度為l-k-1的χ2分布,則假設檢驗成立,樣本數據符合假設的正態(tài)分布;
如果算得的χ2大于自由度為l-k-1的χ2分布時,假設檢驗不成立;
其中,l表示檢驗的分組數量,等于上述的m;k表示需要估計的未知參數的個數,此處等于2。
10.根據權利要求1所述的公交乘客客流數據采集與分析方法,其特征在于:所述步驟(5)中,對客流誤差的分布進行假設檢驗前,對客流誤差進行分段,且后續(xù)假設檢驗和修正針對分段后的各段客流誤差及所對應的客流進行;
優(yōu)選地,所述分段根據線路的不同、和/或時間段的不同、和/或公交站點群的不同進行。