本發(fā)明屬于道路交通信息服務(wù)與運(yùn)營(yíng)管理領(lǐng)域,涉及一種數(shù)據(jù)采集與分析方法,尤其是一種乘客客流數(shù)據(jù)采集與分析方法。
背景技術(shù):
:目前,公交公司、交通管理部門所需的乘客站點(diǎn)上下客與站間斷面客流信息的主要數(shù)據(jù)來(lái)源有人工抽樣、交通IC卡以及車門視頻數(shù)據(jù)。其中,人工抽樣具有高精準(zhǔn)度、人力成本大、樣本過(guò)小的特點(diǎn);交通IC卡則具有用戶多、數(shù)據(jù)量大、使用頻率高等特點(diǎn),但由于大量公交只需上車刷卡,導(dǎo)致IC卡無(wú)法準(zhǔn)確獲知乘客的下車站點(diǎn);視頻數(shù)據(jù)能夠較準(zhǔn)確地識(shí)別各車門的上下客人數(shù),但人流高峰時(shí)識(shí)別精度會(huì)明顯下降,且無(wú)法獲知乘客的出行OD(起訖點(diǎn))。公開(kāi)號(hào)為CN105096601A的中國(guó)專利申請(qǐng)“基于公交移動(dòng)WiFi熱點(diǎn)的線路滿載率實(shí)時(shí)計(jì)算方法”中,根據(jù)公交車牌ID數(shù)據(jù)提取對(duì)應(yīng)該公交車牌ID的鏈接WiFi的實(shí)時(shí)手機(jī)用戶數(shù)目,從而計(jì)算單個(gè)公交車車輛上的實(shí)際乘客總數(shù),結(jié)合承載定員人數(shù)計(jì)算單個(gè)公交車車輛滿載率。該方法通過(guò)滿載率來(lái)判斷線路設(shè)計(jì)合理性,最終達(dá)到公交車輛分配調(diào)度的最優(yōu)化平衡目的。公開(kāi)號(hào)為CN103700174A的中國(guó)專利申請(qǐng)“一種基于WiFi身份識(shí)別的公交客流數(shù)據(jù)采集及OD分析方法”中,通過(guò)公交AP熱點(diǎn)讀取乘客所持有WiFi設(shè)備的MAC地址,識(shí)別乘客身份再通過(guò)對(duì)列表中MAC地址的統(tǒng)計(jì)獲取公交車上下車及斷面持有WiFi乘客總?cè)藬?shù)。該方法建立乘客信息數(shù)據(jù)庫(kù),得到整個(gè)城市所有公交站點(diǎn)之間的OD矩陣。但上述技術(shù)都沒(méi)有考慮公交車,包括小汽車、公交車等臨近車輛的干擾,同時(shí)城區(qū)與郊區(qū)的道路交通流存在很大差異,不同的公交上下客流也存在不同分布的誤差,具體的修正或擴(kuò)樣方法不可一概而論。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的在于提供一種能夠極大地排除干擾,有效修正的公交乘客客流數(shù)據(jù)采集與分析方法。為了達(dá)到上述目的,本發(fā)明的解決方案是:一種公交乘客客流數(shù)據(jù)采集與分析方法,包括以下步驟:(1)初步采集:追蹤用戶在公交無(wú)線網(wǎng)絡(luò)接入點(diǎn)的出現(xiàn)時(shí)刻ts與消失時(shí)刻te;(2)匹配:將公交車GPS數(shù)據(jù)與站點(diǎn)信息進(jìn)行匹配,得到公交車在各站點(diǎn)的??繒r(shí)刻,構(gòu)建公交車在各站點(diǎn)的停靠信息,至少包括公交車在各站點(diǎn)的??繒r(shí)刻和對(duì)應(yīng)站點(diǎn)的名稱;(3)篩除干擾:結(jié)合用戶的出現(xiàn)時(shí)刻ts與消失時(shí)刻te、公交車GPS數(shù)據(jù)和所述步驟(2)匹配得到的公交車在各站點(diǎn)的??啃畔?,以設(shè)定的時(shí)間閾值Δt和距離閾值Δs為約束條件,判斷用戶是否為公交車乘客;剔除不是公交車乘客的用戶信息,保留判斷為公交車乘客的用戶信息,并得到作為公交車乘客的用戶的上車站點(diǎn)和下車站點(diǎn);(4)客流推導(dǎo):根據(jù)所述步驟(3)得到的作為公交車乘客的用戶的上車站點(diǎn)和下車站點(diǎn),計(jì)算得到各站點(diǎn)的客流,并按線路行駛方向累加得到站點(diǎn)間的斷面客流;(5)數(shù)據(jù)修正:將所述步驟(4)得到的客流與人工實(shí)際統(tǒng)計(jì)的客流進(jìn)行比較,計(jì)算客流誤差;對(duì)客流誤差的分布進(jìn)行假設(shè)檢驗(yàn),建立客流誤差修正算法對(duì)所述步驟(4)中得到的客流進(jìn)行修正。所述步驟(1)基于IEEE802.11的通信機(jī)制,用戶的移動(dòng)終端通過(guò)WIFI方式傳輸信息幀,公交車AP終端對(duì)用戶的移動(dòng)終端進(jìn)行無(wú)認(rèn)證感知并采集,記錄用戶信息,并進(jìn)行幀類型的識(shí)別。優(yōu)選地,所述用戶信息包括用戶MAC地址、信息傳輸時(shí)間、信息幀類型和信號(hào)強(qiáng)度。所述步驟(2)中將公交車GPS數(shù)據(jù)與站點(diǎn)信息進(jìn)行匹配的方法為:(21)查詢目標(biāo)線路每個(gè)站點(diǎn)的經(jīng)緯度坐標(biāo);(22)換算每條GPS數(shù)據(jù)記錄的經(jīng)緯度坐標(biāo)與每個(gè)站點(diǎn)的經(jīng)緯度坐標(biāo)換對(duì)應(yīng)位置的距離djw;每條GPS數(shù)據(jù)均至少包括記錄時(shí)刻、在所述記錄時(shí)刻公交車所處的經(jīng)緯度坐標(biāo)以及公交車的速度;(23)篩選出每個(gè)站點(diǎn)半徑閾值dr范圍內(nèi)的所有GPS數(shù)據(jù),從中篩選出公交車的速度最小且最小的速度小于速度閾值的記錄點(diǎn)作為公交車在該站點(diǎn)的停車點(diǎn),記錄??繒r(shí)刻tb;半徑閾值dr和所述速度閾值均為設(shè)定的;(24)將各站點(diǎn)的站點(diǎn)名稱、站點(diǎn)的經(jīng)緯度坐標(biāo)、對(duì)應(yīng)的停車點(diǎn)處的經(jīng)緯度坐標(biāo)、站點(diǎn)和對(duì)應(yīng)的停車點(diǎn)的距離、對(duì)應(yīng)的最小的公交車的速度構(gòu)成匹配結(jié)果。優(yōu)選地,所述距離djw的計(jì)算公式為:C=sin(LatA)*sin(LatB)+cos(LatA)*cos(LatB)*cos(MLonA-MLonB);djw=R*Arccos(C)*π/180其中:LonA和LatA為站點(diǎn)的經(jīng)緯度坐標(biāo);LonB和LatB為GPS記錄點(diǎn)的經(jīng)緯度坐標(biāo);R為地球半徑;Mlon表示對(duì)東經(jīng)取正,對(duì)西經(jīng)取負(fù)后得到的新經(jīng)度。優(yōu)選地,所述速度閾值為10km/h。所述步驟(3)中的時(shí)間閾值Δt的計(jì)算方法為:根據(jù)上一部公交車GPS數(shù)據(jù)與站點(diǎn)信息匹配的結(jié)果,計(jì)算所在線路各站點(diǎn)之間公交車的行駛時(shí)間集合TI;再提取所述行駛時(shí)間集合TI的85%分位數(shù)tI85,把大于tI85的行駛時(shí)間剔除,保留剩余的行駛時(shí)間得到行駛時(shí)間集合TI’,并求得TI’的均值則時(shí)間閾值Δt根據(jù)下式計(jì)算得到:所述步驟(3)中的距離閾值Δs為:Δs=db2其中,db2為若乘客下車后往與公交車的行駛方向相同的方向行走,公交車AP終端最后一次接收到乘客的數(shù)據(jù)時(shí),公交車距離站點(diǎn)的距離。所述步驟(3)包括以下步驟:(31)對(duì)每個(gè)用戶,計(jì)算消失時(shí)刻te與出現(xiàn)時(shí)刻ts之差得到持續(xù)時(shí)間Tse;(32)若持續(xù)時(shí)間Tse小于時(shí)間閾值Δt,則認(rèn)定對(duì)應(yīng)的用戶不是公交車乘客,直接刪除對(duì)應(yīng)的用戶的數(shù)據(jù);否則,進(jìn)入步驟(33);(33)在公交車GPS數(shù)據(jù)中,尋找在出現(xiàn)時(shí)刻ts公交車的經(jīng)緯度坐標(biāo)和在消失時(shí)刻te公交車的經(jīng)緯度坐標(biāo);(34)基于所述步驟(2)匹配得到的公交車在各站點(diǎn)的??啃畔?,將離出現(xiàn)時(shí)刻ts公交車的經(jīng)緯度坐標(biāo)最近的同方向的站點(diǎn)設(shè)定為用戶的上車站點(diǎn),將離消失時(shí)刻te公交車的經(jīng)緯度坐標(biāo)最近的同方向的站點(diǎn)設(shè)定為用戶的下車站點(diǎn);(35)計(jì)算出現(xiàn)時(shí)刻ts公交車的經(jīng)緯度坐標(biāo)與設(shè)定的上車站點(diǎn)之間的距離d1,以及消失時(shí)刻te公交車的經(jīng)緯度坐標(biāo)與設(shè)定的下車站點(diǎn)之間的距離d2;當(dāng)所述距離d1和所述距離d2均小于所述距離閾值Δs時(shí),判定對(duì)應(yīng)的用戶為公交車乘客,所述步驟(34)中設(shè)定的上車站點(diǎn)和下車站點(diǎn)為用戶實(shí)際的上車站點(diǎn)和下車站點(diǎn)。所述步驟(5)中對(duì)客流誤差進(jìn)行假設(shè)檢驗(yàn)和修正包括:假設(shè)客流誤差服從正態(tài)分布,對(duì)樣本進(jìn)行參數(shù)估計(jì),擬合得到客流誤差的正態(tài)分布,稱為擬合正態(tài)分布;通過(guò)正態(tài)假設(shè)檢驗(yàn)判斷所述擬合正態(tài)分布的合理性;將通過(guò)檢驗(yàn)的擬合正態(tài)分布的期望值作為客流的修正值,將所述修正值加上所述步驟(4)推斷得到的客流,得到修正后的客流。優(yōu)選的,所述擬合采用MATLAB軟件進(jìn)行。所述檢驗(yàn)的方法為利用T檢驗(yàn)進(jìn)行顯著性水平為0.05的假設(shè)檢驗(yàn)。所述檢驗(yàn)的方法為皮爾遜卡方檢驗(yàn)。優(yōu)選地,所述檢驗(yàn)的方法包括以下步驟:將需要檢驗(yàn)的數(shù)據(jù)分為等量的m組;依次計(jì)算以下各式:pi=φ(Xmax-μα)]]>npi=Xmax*piχ2=Σi=0m(ni-npi)2npi]]>其中:pi為正態(tài)概率;npi為理論頻數(shù);n表示所用于檢驗(yàn)的樣本量;Xmax表示分成m組中,每組的上限;μ表示利用樣本計(jì)算的均值;α表示利用樣本計(jì)算的標(biāo)準(zhǔn)差;ni表示每組中的樣本數(shù);χ2表示計(jì)算的卡方值;如果算得的χ2趨向于自由度為l-k-1的χ2分布,則假設(shè)檢驗(yàn)成立,樣本數(shù)據(jù)符合假設(shè)的正態(tài)分布;如果算得的χ2大于自由度為l-k-1的χ2分布時(shí),假設(shè)檢驗(yàn)不成立;其中,l表示檢驗(yàn)的分組數(shù)量,等于上述的m;k表示需要估計(jì)的未知參數(shù)的個(gè)數(shù),此處等于2。所述步驟(5)中,對(duì)客流誤差的分布進(jìn)行假設(shè)檢驗(yàn)前,對(duì)客流誤差進(jìn)行分段,且后續(xù)假設(shè)檢驗(yàn)和修正針對(duì)分段后的各段客流誤差及所對(duì)應(yīng)的客流進(jìn)行。優(yōu)選地,所述分段根據(jù)線路的不同、和/或時(shí)間段的不同、和/或公交站點(diǎn)群的不同進(jìn)行。由于采用上述方案,本發(fā)明的有益效果是:本發(fā)明提出了一種基于公交車內(nèi)無(wú)線局域網(wǎng)數(shù)據(jù)傳輸和公交車GPS數(shù)據(jù)融合的公交車乘客客流數(shù)據(jù)采集與分析方法,該方法自動(dòng)化程度高,操作簡(jiǎn)單;能夠采集的數(shù)據(jù)量大,用戶多,范圍廣;同時(shí),能夠綜合考慮臨近行人、車輛等多方面的干擾,所得結(jié)果更貼合實(shí)際情況,精度高。該方法不僅適用于人流密集的城區(qū),同樣適用于人流稀疏的郊區(qū),適用范圍廣,能夠作為當(dāng)前公交客流采集的有效的補(bǔ)充方法。附圖說(shuō)明圖1為本發(fā)明一實(shí)施例中乘客客流數(shù)據(jù)采集與分析方法的流程圖;圖2為該實(shí)施例中所采用的IEEE802.11通信協(xié)議數(shù)據(jù)包格式;圖3為本發(fā)明實(shí)施例中用戶往公交車行駛相反方向運(yùn)行示例;圖4為本發(fā)明實(shí)施例中用戶往公交車行駛相同方向運(yùn)行示例;圖5a為本發(fā)明實(shí)施例中算法推導(dǎo)的站點(diǎn)上下客流;圖5b為本發(fā)明實(shí)施例中算法推導(dǎo)的站間斷面客流與實(shí)際斷面客流對(duì)比圖;圖5c為本發(fā)明實(shí)施例中修正過(guò)后的斷面客流與實(shí)際斷面客流對(duì)比圖;圖6a-圖6f為本發(fā)明實(shí)施例中修正前后的斷面客流誤差對(duì)比圖(包含6個(gè)班次)。具體實(shí)施方式以下結(jié)合附圖所示實(shí)施例對(duì)本發(fā)明作進(jìn)一步的說(shuō)明。本發(fā)明提出了一種乘客客流數(shù)據(jù)采集與分析方法。本實(shí)施例中,該方法充分利用公交車的WIFI覆蓋,在設(shè)置有AP終端(AP即WirelessAccessPoint,表示訪問(wèn)接入點(diǎn))的公交車上,利用乘客無(wú)線移動(dòng)終端例如手機(jī)開(kāi)啟WIFI功能后,基于IEEE802.11的通信機(jī)制,對(duì)用戶的WIFI設(shè)備(即前述無(wú)線移動(dòng)終端,在本實(shí)施例中為乘客手機(jī))進(jìn)行無(wú)認(rèn)證感知并采集,結(jié)合公交車GPS等信息,實(shí)現(xiàn)公交線路與站點(diǎn)的客流采集與分析。首先當(dāng)用戶出現(xiàn)在公交車AP終端覆蓋范圍內(nèi)且手機(jī)WIFI功能開(kāi)啟時(shí),公交車AP終端能夠嗅探到用戶手機(jī);根據(jù)WIFI無(wú)認(rèn)證感知技術(shù)獲取用戶的WIFI信息;利用算法推導(dǎo)(當(dāng)前現(xiàn)有公交AP終端已經(jīng)具有記錄用戶手機(jī)(終端)收發(fā)WIFI信息幀的幀頭的功能,即前述嗅探功能)出用戶的出現(xiàn)時(shí)刻與消失時(shí)刻,根據(jù)用戶上下車的行為,建立用戶上下車的數(shù)據(jù)模型;當(dāng)用戶滿足上下車應(yīng)有的行為特征時(shí),認(rèn)為該用戶確實(shí)是乘車的乘客;根據(jù)得到的乘客上下站信息推算公交車客流,并建立客流修正模型,即用于修正客流的模型,并利用該客流修正模型對(duì)此次得到的乘客客流數(shù)據(jù)進(jìn)行修正。本實(shí)施例中,該利用公交車WIFI數(shù)據(jù)與GPS數(shù)據(jù)融合的客流采集與分析方法(圖1為其流程圖),主要可分為以下四個(gè)階段:(1)初步采集階段:公交車AP終端利用IEEE802.11的通信機(jī)制,抓取周邊用戶手機(jī)通過(guò)WIFI方式傳輸?shù)男畔^并進(jìn)行解析,記錄用戶MAC地址mac、信息傳輸時(shí)間datetime、信息幀類型type、信號(hào)強(qiáng)度rssi等信息,并進(jìn)行幀類型的識(shí)別。根據(jù)IEEE802.11通信協(xié)議,數(shù)據(jù)結(jié)構(gòu)如附圖2,根據(jù)控制幀F(xiàn)rameControl字節(jié)來(lái)解析用戶傳輸?shù)男畔㈩愋汀?個(gè)字節(jié)為:4bit(Subtype)+2bit(Type)+2bit(ProtocolVersion,默認(rèn)為00)。在本發(fā)明中,主要解析的信息幀類型為0x40、0x48、0x88,得到用戶出現(xiàn)時(shí)刻ts與消失時(shí)刻te。圖2中,該數(shù)據(jù)包只用第一幀,即FrameControl控制幀,其余幀為加密報(bào)文;本發(fā)明僅獲取信息幀中的控制幀,圖2中從左到右分別為:控制幀、報(bào)文標(biāo)識(shí)ID、地址1,地址2、地址3、序列控制、地址4、QoS(QualityofService服務(wù)質(zhì)量)控制、HT(HighThroughput頻寬控制)、信息報(bào)文、FCS(FrameCheckSequence)報(bào)文校驗(yàn)位。(2)公交車GPS數(shù)據(jù)與站點(diǎn)信息的匹配階段:將公交車GPS數(shù)據(jù)與站點(diǎn)信息進(jìn)行匹配。公交車在行駛時(shí),GPS設(shè)備每隔一定時(shí)間間隔就會(huì)記錄下公交車所處經(jīng)緯度、速度以及對(duì)應(yīng)的時(shí)刻。根據(jù)公交車距離站點(diǎn)的距離djw與實(shí)時(shí)速度v來(lái)作為判別公交車是否到站的條件,得到每趟公交車在各站點(diǎn)的??繒r(shí)刻tb,構(gòu)建公交車在各站點(diǎn)??啃畔?。上述公交車在各站點(diǎn)停靠信息包括公交車在各站點(diǎn)的??繒r(shí)刻、對(duì)應(yīng)站點(diǎn)的名稱、對(duì)應(yīng)站點(diǎn)的經(jīng)緯度等;在本實(shí)施例中,可將其制作為公交車到站時(shí)刻表。(3)篩除干擾階段:結(jié)合用戶的出現(xiàn)時(shí)刻ts與消失時(shí)刻te、公交車GPS數(shù)據(jù)和步驟(2)匹配得到的公交車在各站點(diǎn)的??啃畔?,以設(shè)定的時(shí)間閾值Δt和距離閾值Δs為約束條件,判斷用戶是否為公交車乘客。剔除不是公交車乘客的用戶信息,保留判斷為公交車乘客的用戶信息,并得到用戶的上車站點(diǎn)和下車站點(diǎn)。(4)客流推導(dǎo)階段:根據(jù)步驟(3)得到的各用戶的上車站點(diǎn)與下車站點(diǎn),計(jì)算得到各站點(diǎn)的上下車客流;更進(jìn)一步,并按線路行駛方向累加得到站點(diǎn)間的斷面客流。(5)數(shù)據(jù)修正:根據(jù)推算的客流與人工實(shí)際統(tǒng)計(jì)的客流進(jìn)行比較,計(jì)算客流誤差;分析不同條線路、不同時(shí)間段、不同公交站點(diǎn)群的誤差情況,對(duì)誤差分布進(jìn)行假設(shè)檢驗(yàn),建立誤差分段修正算法對(duì)推算得到的客流進(jìn)行修正。上述步驟(2)中,公交車GPS數(shù)據(jù)與站點(diǎn)信息匹配的具體方法如下:GPS設(shè)備每一秒鐘進(jìn)行一次關(guān)于公交車的記錄,記錄包括當(dāng)前日期與時(shí)刻(精確到秒)、公交車所處的經(jīng)度、緯度、朝向、當(dāng)前速度、海拔等。其中,當(dāng)前對(duì)應(yīng)的時(shí)刻、經(jīng)度、緯度、當(dāng)前速度是本發(fā)明所需的關(guān)鍵數(shù)據(jù)。GPS設(shè)備采集數(shù)據(jù)時(shí)在其內(nèi)部實(shí)時(shí)存儲(chǔ),可在采集結(jié)束后將數(shù)據(jù)由常規(guī)數(shù)據(jù)文件格式(如CSV格式)導(dǎo)出,數(shù)據(jù)格式如表1所示。表1表1中,INDEX表示數(shù)據(jù)編號(hào)、TRACKNUMBER表示線路編號(hào)、UTCDATE與UTCTIME表示協(xié)調(diào)世界時(shí)間中的日期與時(shí)間、LOCALDATE與LOCALTIME表示北京時(shí)區(qū)日期與時(shí)間、LATITUDE表示緯度、N/S表示南/北半球、LONGITUDE表示經(jīng)度、E/W表示東/西半球、ALTITUDE表示海拔,SPEED表示速度。將公交車GPS數(shù)據(jù)與公交車站點(diǎn)信息進(jìn)行匹配時(shí),首先,在線查詢目標(biāo)線路每一站的真實(shí)經(jīng)緯度;然后,計(jì)算每一條GPS數(shù)據(jù)記錄的經(jīng)緯度坐標(biāo)與每個(gè)站點(diǎn)的經(jīng)緯度坐標(biāo)對(duì)應(yīng)地點(diǎn)之間的距離djw(單位為KM);計(jì)算公式如下:C=sin(LatA)*sin(LatB)+cos(LatA)*cos(LatB)*cos(MLonA-MLonB);djw=R*Arccos(C)*π/180;式中第一點(diǎn)A的經(jīng)緯度為(LonA,LatA),第二點(diǎn)B的經(jīng)緯度為(LonB,LatB),R代表地球半徑。A和B分別為站點(diǎn)以及GPS記錄點(diǎn)。MLon是對(duì)經(jīng)度進(jìn)行處理后得到的新經(jīng)度,具體為對(duì)東經(jīng)取正,對(duì)西經(jīng)取負(fù)。接著篩選出每一個(gè)站點(diǎn)半徑閾值dr范圍內(nèi)的所有GPS數(shù)據(jù)記錄(本實(shí)施例中,dr取30m,這是因?yàn)椋簩?duì)于港灣式停靠站而言,站臺(tái)長(zhǎng)度至少要有兩個(gè)車位長(zhǎng)(大約30米));再?gòu)闹泻Y選出速度最小且該最小的速度小于速度閾值(本實(shí)施例中,該速度閾值為10km/h)的記錄點(diǎn)作為車輛在該站點(diǎn)的停車點(diǎn),停靠時(shí)刻為tb。之后將站點(diǎn)名稱、站點(diǎn)經(jīng)緯度坐標(biāo)、停車點(diǎn)處的經(jīng)緯度坐標(biāo)、站點(diǎn)和停車點(diǎn)間的距離、最小速度構(gòu)成一張新的表作為匹配結(jié)果,如表2所示。表2中,longitude表示匹配時(shí)刻的車輛經(jīng)度、latitude表示匹配時(shí)刻的車輛緯度、stop表示匹配的停靠站點(diǎn)名、s_longitude表示站點(diǎn)經(jīng)度、s_latitude表示站點(diǎn)緯度、date_time表示匹配時(shí)刻、speed表示車輛瞬時(shí)速度、dis表示車輛距離站點(diǎn)距離。表2longitudelatitudestops_longitudes_latitudedate_timespeeddis121.21887231.289391老宅121.218840931.289257812016/5/1608:17:030.0011160.015102183121.21758331.304266馬南121.217562431.304497932016/5/1608:20:2920.2977350.02586357121.21771231.310661東趙巷121.217612431.310544932016/5/1608:22:080.1290560.016003578121.21221231.321674方泰121.212161931.321481362016/5/1608:26:560.0415430.02194342121.20227131.333355三里橋121.202005731.333443742016/5/1608:31:3957.9951970.027063072121.19569431.340294沙港橋121.195883731.340101742016/5/1608:34:2020.8879010.027955843121.20034831.345905桃園121.200514331.34599932016/5/1608:36:240.2120230.01895952121.20941231.353659六里橋121.209544731.353748572016/5/1608:38:1430.7931180.016064005121.22411331.366531現(xiàn)龍121.223939631.366333272016/5/1608:41:5317.7638530.027468328121.22744831.368883嘉安公路勝辛路121.227170131.368827232016/5/1608:43:1414.7817190.027098682121.23449731.37418塔城路滬宜公路121.23444431.374431752016/5/1608:45:475.6982740.028442291121.24208831.380753塔城路梅園路121.24218331.380655752016/5/1608:48:260.1461630.014079269121.24164631.386711城中路清河路121.241800831.386535342016/5/1608:53:580.044460.024440646121.2346531.391605嘉定中心醫(yī)院121.234342731.391620382016/5/1609:01:154.5831050.029218506121.2321731.393064招呼站19121.231959431.393129332016/5/1609:02:040.1959590.021265096121.23236131.394772公交嘉定北站121.232081431.394758332016/5/1609:03:1329.8126950.02657817上述步驟(3)中,用戶公交乘車行為判別閾值界定的具體方法如下:時(shí)間閾值Δt的大小與公交車各站之間行駛時(shí)間密切相關(guān)。根據(jù)上一部公交車GPS的匹配結(jié)果,計(jì)算在該條線路各站點(diǎn)之間公交車的行駛時(shí)間集合TI。再提取該時(shí)間集合的85%分位數(shù)tI85,把大于tI85的行駛時(shí)間剔除,得到剩余的行駛時(shí)間集合為TI’,并求得TI’的的均值根據(jù)乘客出行習(xí)慣以及大量跟車試驗(yàn)的觀察,絕大多數(shù)乘客會(huì)乘坐兩站及兩站以上,極少部分乘客只乘坐一站。因此Δt根據(jù)下式計(jì)算得到:距離閾值Δs的作用在于篩選掉一些通過(guò)時(shí)間閾值Δt無(wú)法排除的長(zhǎng)時(shí)間跟車干擾,即公交車周圍長(zhǎng)時(shí)間跟車的車輛,如果這些長(zhǎng)時(shí)間跟車的車輛中手機(jī)開(kāi)啟WIFI功能,會(huì)對(duì)采集產(chǎn)生干擾。若手機(jī)用戶確實(shí)存在乘車行為,那么用戶WIFI數(shù)據(jù)出現(xiàn)與消失時(shí),該公交車的位置應(yīng)處在距離站點(diǎn)的一定范圍Δs內(nèi)。因?yàn)楣卉嘇P終端存在一個(gè)約100m的嗅探范圍,WIFI數(shù)據(jù)集中用戶手機(jī)最后一條信息幀的發(fā)送或接收時(shí)間并不能完全等同于該用戶的下車時(shí)間,上車時(shí)同理。假如一乘客下車后往與公交相反的方向步行,示意圖如圖3。圖3表示的是一種最極端情況。假設(shè)乘客行走速度為vp1,本實(shí)施例中為1.5m/s,公交車輛行駛速度為vb,本實(shí)施例中為5m/s。則經(jīng)過(guò)一段時(shí)間(本實(shí)施例中為15s)后,公交車與該乘客相距100米,乘客走出公交車AP終端的嗅探范圍。此刻公交車AP終端獲取到該乘客所攜移動(dòng)設(shè)備的最后一條廣播幀,乘客離站臺(tái)dp1米,本實(shí)施例中為22.5m,公交車離站臺(tái)db1米,本實(shí)施例中為77.5m。假如一乘客下車后往與公交相同的方向步行,示意圖如圖4。圖4表示的也是一種最極端情況。假設(shè)乘客行走速度為vp,本實(shí)施例中為1.5m/s,公交車輛行駛速度為vb,本實(shí)施例中為5m/s。則經(jīng)過(guò)一段時(shí)間(本實(shí)施例中為29s)后,公交車與該乘客相距100米,乘客走出公交車AP終端的嗅探范圍。此刻公交車AP終端獲取到該乘客所攜移動(dòng)設(shè)備的最后一條廣播幀,此時(shí)乘客離站臺(tái)dp2米,本實(shí)施例中為43m,公交車離站臺(tái)db2米,本實(shí)施例中為143m。那么應(yīng)有:dp1+db1=100;db2-dp2=100;那么Δs的推算方法如下:Δs=max(db1,db2);其中,100指的是WIFI嗅探范圍為100m;db1為若乘客下車后往與公交車相反的方向行走,公交車AP終端最后一次接收到乘客的數(shù)據(jù)時(shí),公交車距離站臺(tái)的距離;db2為若乘客下車后往與公交車相同的方向行走,公交車AP終端最后一次接收到乘客的數(shù)據(jù)時(shí),公交車距離站臺(tái)的距離。顯然,db2大于db1,因此Δs=db2。時(shí)間閾值Δt與距離閾值Δs的作用如下:(1)將mac地址隨機(jī)跳變的用戶從數(shù)據(jù)源中篩除。一般功能上能夠?qū)崿F(xiàn)跳變的用戶,在其手機(jī)設(shè)備鎖定或喚醒的時(shí)候,會(huì)產(chǎn)生跳變,在設(shè)備鎖定兩分鐘之后,也會(huì)跳變。其跳變間隔時(shí)間多在兩分鐘及以下。(2)將車外靜止行人干擾設(shè)備和車外運(yùn)動(dòng)行人的干擾設(shè)備從數(shù)據(jù)源中剔除。無(wú)論車外行人是靜止還是運(yùn)動(dòng),它在公交車AP終端掃描范圍內(nèi)的持續(xù)被掃描時(shí)間都小于一分鐘。(3)將車外跟車的其他車輛內(nèi)的干擾設(shè)備從數(shù)據(jù)源中剔除。對(duì)于跟車時(shí)間較短的干擾車輛,通過(guò)設(shè)定時(shí)間閾值Δt可直接剔除;而對(duì)于跟車時(shí)間較長(zhǎng)的干擾車輛,相關(guān)數(shù)據(jù)可結(jié)合設(shè)定距離閾值Δs剔除。上述步驟(3)中,進(jìn)行篩選的具體方法如下:首先獲取公交車AP終端所探測(cè)的用戶攜帶設(shè)備的mac地址、信號(hào)強(qiáng)度、掃描時(shí)間等,即公交車AP終端捕獲的源數(shù)據(jù);其次獲取用戶mac出現(xiàn)時(shí)刻ts和消失時(shí)刻te,相減計(jì)算持續(xù)時(shí)間Tse。接著,判斷持續(xù)時(shí)間Tse是否大于或等于時(shí)間閾值Δt。如果小于,則認(rèn)定該用戶不是該趟公交車的乘客,直接刪除其數(shù)據(jù)。如果大于或等于,則根據(jù)該用戶mac的出現(xiàn)時(shí)刻和消失時(shí)刻,在公交車GPS數(shù)據(jù)中找到在出現(xiàn)時(shí)刻ts公交車的經(jīng)緯度坐標(biāo)和在消失時(shí)刻te公交車的經(jīng)緯度坐標(biāo);再根據(jù)步驟(2)得到的公交車站點(diǎn)停靠信息,即前文提到的公交站點(diǎn)??繒r(shí)刻表,匹配最近的同方向站點(diǎn)為設(shè)定的上車站點(diǎn)和設(shè)定的下車站點(diǎn)。最后,若在出現(xiàn)時(shí)刻ts公交車的位置與設(shè)定的上車站點(diǎn)的距離d1與在消失時(shí)刻te公交車的位置與設(shè)定的下車站點(diǎn)的距離d2均小于距離閾值Δs,則表示上下車站點(diǎn)匹配有效,即該用戶為該趟公交車的乘客,設(shè)定的上車站點(diǎn)為其實(shí)際的上車站點(diǎn),設(shè)定的下車站點(diǎn)為其實(shí)際的下車站點(diǎn)。否則,則認(rèn)定該用戶不是該趟公交車的乘客,該用戶的數(shù)據(jù)為干擾數(shù)據(jù),將其刪除。上述步驟(4)中,進(jìn)行客流推導(dǎo)的具體方法如下:基于上述得到的各用戶的上車站點(diǎn)與下車站點(diǎn),累計(jì)得到各站點(diǎn)的上下車客流,更進(jìn)一步地,累計(jì)得到任意兩個(gè)站點(diǎn)之間的斷面客流。例如,第一站的上車人數(shù)為A1,下車人數(shù)為B1,則第一站與第二站間的斷面客流為A1-B1。同理,若第n-1站到第n站的斷面客流為Dn-1,第n站上車人數(shù)為An,下車人數(shù)為Bn,則可推算第n站到第n+1站的推導(dǎo)斷面客流為Dn=Dn-1+An-Bn。上述步驟(5)中,進(jìn)行客流修正的具體方法如下:基于已有線路及班次的原始數(shù)據(jù),利用各線路推導(dǎo)的斷面客流與真實(shí)斷面客流(通過(guò)人工調(diào)研得到真實(shí)斷面客流)之差,探求客流誤差的統(tǒng)計(jì)規(guī)律,從而對(duì)探測(cè)斷面客流進(jìn)行分階段修正。上述人工調(diào)研的總采樣量中包含的班次越多,修正結(jié)果越準(zhǔn)確。假設(shè)客流誤差整體服從正態(tài)分布,對(duì)樣本進(jìn)行參數(shù)估計(jì),通過(guò)MATLAB軟件擬合得到客流誤差符合均值為μ和方差為α的正態(tài)分布。再通過(guò)正態(tài)假設(shè)檢驗(yàn)該正態(tài)分布的合理性。檢驗(yàn)方法有兩種:一種是利用T檢驗(yàn)進(jìn)行顯著性水平為0.05的假設(shè)檢驗(yàn)。一種是將需檢驗(yàn)的數(shù)據(jù)分為大致等量的m組,通過(guò)正態(tài)概率pi和理論頻數(shù)npi算得χ2值,從而驗(yàn)證服從正態(tài)分布的均值μ的合理性。具體公式如下:pi=φ(Xmax-μα)]]>npi=Xmax*piχ2=Σi=0m(ni-npi)2npi]]>其中:n表示所用于檢驗(yàn)的樣本量(即樣本的個(gè)數(shù));m表示將n個(gè)樣本分成組的組數(shù);Xmax表示每組的上限;μ表示利用樣本計(jì)算的均值;α表示利用樣本計(jì)算的標(biāo)準(zhǔn)差;ni表示每組中的樣本數(shù);χ2表示計(jì)算的卡方值。如果算得的χ2趨向于自由度為l-k-1(其中,l表示檢驗(yàn)的分組數(shù)量,即上述的m值,k表示有幾個(gè)需要估計(jì)的未知參數(shù),此處未μ與α即2個(gè))的χ2分布時(shí),假設(shè)檢驗(yàn)成立,樣本數(shù)據(jù)符合正態(tài)分布。如果χ2大于自由度為l-k-1的χ2分布時(shí),假設(shè)檢驗(yàn)不成立。在針對(duì)誤差分布進(jìn)行假設(shè)檢驗(yàn)時(shí),需要對(duì)推導(dǎo)的客流進(jìn)行分段,不同線路區(qū)段、不同時(shí)段、不同的推導(dǎo)客流對(duì)應(yīng)的誤差會(huì)有不同分布,對(duì)于公交線路首末段,一般客流較小,可將一定范圍內(nèi)的幾個(gè)站點(diǎn)進(jìn)行合并,以減小推導(dǎo)客流存在誤差的可能變化范圍,利于后期修正。本實(shí)施例中,選取一條上海市郊區(qū)線路作為本發(fā)明的檢驗(yàn)對(duì)象,測(cè)試時(shí)間為工作日上午早高峰至午間,共采集了12趟公交WIFI數(shù)據(jù)。共采集到約18萬(wàn)條WIFI數(shù)據(jù)記錄,平均每趟公交為1.5萬(wàn)條。對(duì)公交車GPS數(shù)據(jù)與公交站點(diǎn)信息進(jìn)行匹配,對(duì)于dr的確定,因?yàn)楣淮蠖嗖扇「蹫呈酵?空荆九_(tái)長(zhǎng)度至少要有兩個(gè)車位長(zhǎng)(大約30米),取±15米。再加上車站所查詢到的經(jīng)緯度坐標(biāo)與真實(shí)坐標(biāo)間有15米左右的誤差,所以,在此選擇dr=30m作為閾值,即離某一站真實(shí)經(jīng)緯度坐標(biāo)30米之內(nèi)的速度最小且該最小速度小于速度閾值的點(diǎn)為公交停靠點(diǎn),匹配結(jié)果如表2所示。之后根據(jù)計(jì)算得到站點(diǎn)間時(shí)長(zhǎng)的85分位數(shù)tI85為4分47秒,小于等于85分位數(shù)的剩余時(shí)間集合的均值為2分23秒,因此時(shí)間閾值Δt為4分46秒;距離閾值Δs設(shè)為200米(由于實(shí)際測(cè)試中,WIFI嗅探達(dá)不到高頻率采樣(小于等于10s),所以導(dǎo)致距離計(jì)算會(huì)產(chǎn)生誤差,實(shí)際實(shí)施時(shí)距離閾值需要放大,故設(shè)為200m)。通過(guò)時(shí)間閾值和距離閾值對(duì)WIFI數(shù)據(jù)進(jìn)行篩選,得到的公交站點(diǎn)OD出行表如表3所示。推算得到的公交線路站點(diǎn)上下客流與斷面客流如圖5a和圖5b所示。由于目前乘客的手機(jī)WIFI功能不會(huì)高頻率向周邊廣播信息(一般時(shí)間大于30s),所以通過(guò)該時(shí)間戳對(duì)用戶的出現(xiàn)與消失時(shí)間進(jìn)行定位有一定誤差,會(huì)對(duì)最終的匹配結(jié)果產(chǎn)生影響,且公交上不同客流時(shí)的誤差比例相差較大,故通過(guò)實(shí)地采集的數(shù)據(jù)與推導(dǎo)斷面客流結(jié)果的差值對(duì)其進(jìn)行分段修正,分別為[0,10]、(10,20]、(20,30]以及(30,∞),修正結(jié)果如圖5c示。(本實(shí)施例中假設(shè)檢驗(yàn)時(shí),利用了6個(gè)班次的斷面客流推導(dǎo)結(jié)果與人工調(diào)研結(jié)果,對(duì)上述4個(gè)分段分別進(jìn)行客流誤差分布的假設(shè)檢驗(yàn),可求得各分段客流誤差正態(tài)分布函數(shù),并將該正態(tài)分布的期望值作為各分段斷面客流數(shù)據(jù)的修正值,采取推斷值加上修正值的操作完成修正。)修正后的誤差與修正前的誤差對(duì)比如圖6a-圖6f所示(圖6a-圖6f中,每個(gè)圖顯示一個(gè)班次的修正情況),由圖6a-圖6f可知修正后的線路中部斷面客流數(shù)據(jù)誤差明顯減小,準(zhǔn)確度達(dá)70~80%。圖6a-圖6f中,橫坐標(biāo)表示站點(diǎn)序號(hào),縱坐標(biāo)表示客流。表3綜上所述,本發(fā)明提出了一種基于公交車內(nèi)無(wú)線局域網(wǎng)數(shù)據(jù)傳輸和公交車GPS數(shù)據(jù)融合的公交車乘客客流數(shù)據(jù)采集與分析方法,該方法自動(dòng)化程度高,操作簡(jiǎn)單;能夠采集的數(shù)據(jù)量大,用戶多,范圍廣;同時(shí),能夠綜合考慮臨近行人、車輛等多方面的干擾,所得結(jié)果更貼合實(shí)際情況,精度高。該方法不僅適用于人流密集的城區(qū),同樣適用于人流稀疏的郊區(qū),適用范圍廣,能夠作為當(dāng)前公交客流采集的有效的補(bǔ)充方法。上述的對(duì)實(shí)施例的描述是為便于該
技術(shù)領(lǐng)域:
的普通技術(shù)人員能理解和應(yīng)用本發(fā)明。熟悉本領(lǐng)域技術(shù)的人員顯然可以容易地對(duì)這些實(shí)施例做出各種修改,并把在此說(shuō)明的一般原理應(yīng)用到其他實(shí)施例中而不必經(jīng)過(guò)創(chuàng)造性的勞動(dòng)。因此,本發(fā)明不限于這里的實(shí)施例,本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的揭示,不脫離本發(fā)明范疇所做出的改進(jìn)和修改都應(yīng)該在本發(fā)明的保護(hù)范圍之內(nèi)。當(dāng)前第1頁(yè)1 2 3