国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于忠實乘客的多特征地鐵乘車人數(shù)預(yù)測方法與流程

      文檔序號:11520381閱讀:549來源:國知局
      一種基于忠實乘客的多特征地鐵乘車人數(shù)預(yù)測方法與流程
      本發(fā)明屬于交通數(shù)據(jù)處理及客流預(yù)測
      技術(shù)領(lǐng)域
      ,尤其涉及一種基于忠實乘客的多特征地鐵乘車人數(shù)預(yù)測方法。
      背景技術(shù)
      :地鐵交通作為城市交通的重要組成部分,是居民出行的主要方式,對緩解城市交通擁堵起到了至關(guān)重要的作用,地鐵客流量是地鐵交通運營組織的重要參考依據(jù),同時,地鐵客流量的預(yù)測也是交通運輸系統(tǒng)的重要組成部分。所以,客流量的預(yù)測是交通運輸預(yù)測的重點及熱點的研究問題,也是地鐵調(diào)度優(yōu)化技術(shù)的基礎(chǔ)研究內(nèi)容。大數(shù)據(jù)時代的到來使得基于個體粒度的海量時空軌跡獲取人類移動模式成為可能,地鐵上下車乘客的隨機(jī)性較大,影響因素較多,加大了預(yù)測的難度,因此為了更加準(zhǔn)確的預(yù)測地鐵站點的乘車人數(shù),及時的對客流組織方案進(jìn)行完善與調(diào)整,設(shè)計有效的綜合考慮多因素的預(yù)測模型是極為重要的。技術(shù)實現(xiàn)要素:本發(fā)明的目的是針對上述問題,提出了一種基于忠實乘客的多特征地鐵乘車人數(shù)預(yù)測方法,通過構(gòu)建多元線性回歸模型,提取時間、天氣、歷史乘車人數(shù)、忠實乘客人數(shù)、站點功能特征,訓(xùn)練模型,得到預(yù)測結(jié)果,為地鐵運營調(diào)度部門提供實時調(diào)度管理依據(jù)。本發(fā)明的技術(shù)方案:一種基于忠實乘客的多特征地鐵乘車人數(shù)預(yù)測方法,步驟如下:s1:數(shù)據(jù)預(yù)處理數(shù)據(jù)的清洗,清除缺失值;即清除早上六點之前及晚上十點之后的時段的數(shù)據(jù),并刪除偏離平均值較大的數(shù)據(jù);數(shù)據(jù)包括卡號、日期、時間、站點名稱、線路編號、交易金額、地鐵站點的橫坐標(biāo)x、地鐵站點的縱坐標(biāo)y和交易類型,其中,日期的格式為yyyy-mm-dd,時間的格式為hh:mm:ss,交易金額:以“元”為單位,交易類型:取值為“優(yōu)惠”或“非優(yōu)惠”;s2:提取時間、天氣狀況、歷史乘車人數(shù)、忠實乘客人數(shù)、站點功能特征s2.1:時間劃分:從早上6:00到晚上22:00,以一小時為單位將一天劃分為n個時間片;s2.2:提取天氣特征,分為三類:晴天、雨天以及多云天氣,并進(jìn)行規(guī)范化處理,即將晴天取值為1,雨天取值為0,多云天取值為0.5;s2.3:忠實乘客人數(shù):在某一時間片內(nèi),每天都有刷卡記錄的乘客即為該時間片的忠實乘客;依據(jù)地鐵乘客的刷卡信息,按步驟s2.1劃分好的時間片,提取每個時間片的忠實乘客人數(shù);s2.4:將地鐵站按功能分類:風(fēng)景區(qū)、名勝古跡區(qū)、商業(yè)區(qū)、居民區(qū)、高新技術(shù)區(qū)和休閑娛樂區(qū);s2.5:歷史乘車人數(shù):按步驟s2.1劃分好的時間片,對所預(yù)測的第某天的某個時間片之前的所有天數(shù)在該時間片的乘車人數(shù)取平均值,即定義為該時間片的歷史乘車人數(shù);s3:建立多元線性回歸模型s3.1:輸入輸出變量:選取時間、天氣狀況、歷史乘車人數(shù)以及忠實乘客人數(shù)這四個影響因素作為輸入變量,而作為輸出變量的只有一個因素,即地鐵站點在某一時間片內(nèi)的實際乘車人數(shù);s3.2:訓(xùn)練集和測試集劃分:將提取的數(shù)據(jù)集中后三天的數(shù)據(jù)作為測試集,其余數(shù)據(jù)作為訓(xùn)練集;s3.3:訓(xùn)練集和測試集的數(shù)據(jù)標(biāo)準(zhǔn)化:將訓(xùn)練集和測試集分別進(jìn)行標(biāo)準(zhǔn)化處理,經(jīng)過處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1,轉(zhuǎn)換公式如下:其中:μ為訓(xùn)練集或測試集中所有樣本數(shù)據(jù)的均值,σ為訓(xùn)練集或測試集中所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差;s3.4:建立多元線性回歸模型:地鐵客流受時間、天氣狀況、歷史乘車人數(shù)、忠實乘客人數(shù)諸多因素影響,多元線性回歸模型根據(jù)訓(xùn)練集數(shù)據(jù),建立地鐵客流與諸因素之間的回歸模型,實現(xiàn)客流與各個因素之間關(guān)系的定量化分析,直觀的反映出客流與各因素之間的關(guān)系;設(shè)樣本容量為n,因變量為yi,i=1,2,3,…,n;m個自變量為xj,j=1,2,3,…,m;令:則多元線性回歸模型為:y=βx+ε;其中:β為回歸系數(shù),ε為隨機(jī)誤差;s4:訓(xùn)練數(shù)據(jù)將標(biāo)準(zhǔn)化的訓(xùn)練集數(shù)據(jù)輸入到多元線性回歸模型中,進(jìn)行訓(xùn)練和學(xué)習(xí);s5:預(yù)測乘車人數(shù)將標(biāo)準(zhǔn)化的測試集數(shù)據(jù)輸入到已經(jīng)訓(xùn)練好的多元線性回歸模型中,對地鐵站點的乘車人數(shù)進(jìn)行預(yù)測,再由多元線性回歸模型輸出預(yù)測結(jié)果值。本發(fā)明的有益效果:本發(fā)明充分考慮了多因素對預(yù)測地鐵乘車人數(shù)的影響,并分析了其內(nèi)在規(guī)律,為地鐵運營調(diào)度部門提供了重要的參考依據(jù)。附圖說明圖1為一種基于忠實乘客的多特征地鐵乘車人數(shù)預(yù)測方法的流程圖。圖2為商業(yè)區(qū)代表站點國權(quán)路乘車乘客預(yù)測結(jié)果示意圖。圖3為風(fēng)景區(qū)代表站點楊高中路乘車乘客預(yù)測結(jié)果示意圖。圖4為名勝古跡區(qū)代表站點豫園乘車乘客預(yù)測結(jié)果示意圖。圖5為居民區(qū)代表站點通河新村乘車乘客預(yù)測結(jié)果示意圖。圖6為高新技術(shù)區(qū)代表站點張江高科乘車乘客預(yù)測結(jié)果示意圖。圖7為休閑娛樂區(qū)代表站點靜安寺乘車乘客預(yù)測結(jié)果示意圖。圖2~圖7中x軸為樣本標(biāo)號,y軸乘客數(shù)量,標(biāo)簽l1為真實值,標(biāo)簽pred為預(yù)測值。具體實施方式為了使本發(fā)明的目的、技術(shù)方案及其優(yōu)勢更加清晰明了,下面將對本發(fā)明的具體實施方式作進(jìn)一步的詳細(xì)描述。本發(fā)明提供了一種基于忠實乘客的多特征地鐵乘車人數(shù)預(yù)測方法,流程如圖1所示,該方法包括:s1:對2015年4月1號至2015年4月30一個月(除休息日以外)的上海地鐵乘客刷卡的原始數(shù)據(jù)進(jìn)行預(yù)處理。地鐵乘客刷卡數(shù)據(jù)所包含的信息如下表1所示。編號名稱注釋1卡號唯一地標(biāo)識一張地鐵卡2日期格式為yyyy-mm-dd3時間格式為hh:mm:ss4站點名稱地鐵站點的名稱5線路編號標(biāo)識站點所在的線路6交易金額以“元”為單位7x地鐵站點的橫坐標(biāo)8y地鐵站點的縱坐標(biāo)9交易類型取值為“優(yōu)惠”或“非優(yōu)惠”表1s2:提取時間、天氣、歷史乘車人數(shù)、忠實乘客、站點功能特征,具體步驟如下:s2.1:時間劃分:將一天中從早上6:00到晚上22:00以一小時為單位劃分為17個時間片。s2.2:提取天氣特征,并進(jìn)行規(guī)范化處理:將天氣狀況分為三類,晴天、雨天以及多云天氣,并進(jìn)行規(guī)范化處理,即將晴天取值為1,雨天取值為0,多云天取值為0.5。s2.3:定義忠實乘客:在某一時間片內(nèi),每天都有刷卡記錄的乘客即為該時間片的忠實乘客。s2.4:提取忠實乘客特征:按照s2.1所劃分好的時間片,根據(jù)乘客刷卡記錄的id號依次提取忠實乘客特征。s2.5:將地鐵站按功能分類,具體分為:風(fēng)景區(qū)、名勝古跡區(qū)、商業(yè)區(qū)、居民區(qū)、高新技術(shù)區(qū)、休閑娛樂區(qū)這幾大區(qū)域。s2.6:歷史乘車人數(shù):按步驟s2.1劃分好的時間片,對所預(yù)測的第某天的某個時間片之前的所有天數(shù)在該時間片的乘車人數(shù)取平均值,即定義為該時間片的歷史乘車人數(shù);s3:建立多元線性回歸模型。s3.1:輸入輸出變量:選取時間、天氣狀況、歷史乘車人數(shù)、以及依據(jù)歷史乘客刷卡的id號所統(tǒng)計的忠實乘客信息這四個影響因素作為輸入變量,而作為輸出變量的只有一個因素,即地鐵站點的乘車人數(shù);s3.2:將處理好的數(shù)據(jù)劃分為訓(xùn)練集和測試集,部分訓(xùn)練集數(shù)據(jù)如下表2所示。樣本編號時間天氣歷史人數(shù)忠實乘客站點乘車人數(shù)16:000.54732651227:000.51936134195738:000.52581132257049:000.58857888510:000.53891390611:000.53780380712:000.54860500813:000.54130372914:000.535113361015:000.548004341116:000.565415961217:000.5116091153表2s3.3:訓(xùn)練集和測試集的數(shù)據(jù)標(biāo)準(zhǔn)化處理:不同評價指標(biāo)往往具有不同的量綱和量綱單位,這樣會影響到數(shù)據(jù)分析的結(jié)果,為了消除指標(biāo)之間的量綱影響,需要進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理,以解決數(shù)據(jù)指標(biāo)之間的可比性,原始數(shù)據(jù)經(jīng)過數(shù)據(jù)標(biāo)準(zhǔn)化處理后,各指標(biāo)處于同一數(shù)量級,適合進(jìn)行綜合對比評價。將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,經(jīng)過處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1,轉(zhuǎn)換公式如下:其中:μ為訓(xùn)練集或測試集中所有樣本數(shù)據(jù)的均值,σ為訓(xùn)練集或測試集中所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差;s3.4:建立多元線性回歸模型:地鐵客流受時間、天氣、歷史乘車人數(shù)、忠實乘客等諸多因素影響,多元線性回歸模型能根據(jù)訓(xùn)練樣本數(shù)據(jù),建立地鐵客流與諸因素之間的回歸模型,實現(xiàn)客流與各個因素之間關(guān)系的定量化分析,能夠很直觀的反映出客流與各因素之間的關(guān)系。設(shè)樣本容量為n,因變量為yi(i=1,2,3,…,n),m個自變量為xj(j=1,2,3,…,m),令:則多元線性回歸模型為:y=βx+ε;其中β為回歸系數(shù),ε為隨機(jī)誤差。s4:訓(xùn)練數(shù)據(jù):將標(biāo)準(zhǔn)化的訓(xùn)練數(shù)據(jù)集輸入到模型中,進(jìn)行數(shù)據(jù)的訓(xùn)練和學(xué)習(xí)。s5:預(yù)測乘車人數(shù)。s5.1:將標(biāo)準(zhǔn)化的測試集輸入到已經(jīng)訓(xùn)練好的模型中,對地鐵站點的乘車人數(shù)進(jìn)行預(yù)測,再由模型輸出預(yù)測結(jié)果值。s5.2:評價標(biāo)準(zhǔn):①均方根誤差(rmse),計算公式為:其中n為測試集樣本個數(shù),xobs,i為每個樣本的預(yù)測值,xmodel,i為每個樣本的真實值。②平均絕對誤差(mae),計算公式為:其中n為測試集樣本個數(shù),xobs,i為每個樣本的預(yù)測值,xmodel,i為每個樣本的真實值。具體結(jié)果如下表3、表4及圖2、圖3、圖4、圖5、圖6、圖7所示。代表區(qū)域站點國權(quán)路楊高中路豫園通河新村張江高科靜安寺rmse37.8757.3651.1443.4564.4488.80表3代表區(qū)域站點國權(quán)路楊高中路豫園通河新村張江高科靜安寺mae29.0541.9043.7731.3149.6867.05表4從上述結(jié)果可以看出,預(yù)測誤差相對較小,在客流量波動性較大的區(qū)域預(yù)測誤差相對高一些,如:休閑娛樂區(qū)。在客流量波動性較小的區(qū)域,預(yù)測誤差相對較低一些,如:居民區(qū)。以上的所述是本發(fā)明的具體實施步驟及所運用的技術(shù)原理,若依本發(fā)明的構(gòu)想所作的改變,其所產(chǎn)生的功能作用仍未超出說明書及附圖所涵蓋的精神時,仍應(yīng)屬本發(fā)明的保護(hù)范圍。當(dāng)前第1頁12
      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1