本發(fā)明涉及公交客流預(yù)測,尤其涉及一種聯(lián)合頻域與空域特征的公交客流預(yù)測方法。
背景技術(shù):
1、公交出行時域信號序列的精確預(yù)測對于公交系統(tǒng)的規(guī)劃、運營和管理至關(guān)重要。通過精確預(yù)測,公交企業(yè)、規(guī)劃機構(gòu)和監(jiān)管機構(gòu)能夠深入分析客流的動態(tài)變化,為公交網(wǎng)絡(luò)的布局、時刻表的編排、車輛和人員的調(diào)度等提供關(guān)鍵的數(shù)據(jù)支撐。這種預(yù)測不僅保障了公交服務(wù)的質(zhì)量,而且對于緩解交通擁堵、提升城市運行效率具有深遠的影響。公交出行時域信號序列數(shù)據(jù)具有復(fù)雜的趨勢、季節(jié)等特征,這些數(shù)據(jù)蘊含著豐富的信息。通過有效提取和分析這些數(shù)據(jù),可以揭示客流的時空頻分布規(guī)律,進而科學(xué)地預(yù)測其發(fā)展趨勢。這種分析對于優(yōu)化公交系統(tǒng),滿足乘客的出行需求,提高公交服務(wù)的吸引力和效率至關(guān)重要。在進行公交客流預(yù)測時,需要綜合考慮多種因素,包括但不限于公交站點周圍土地利用類型、公交線網(wǎng)布局的影響。通過應(yīng)用先進的數(shù)據(jù)分析技術(shù)和模型,可以更準(zhǔn)確地捕捉客流變化的模式,為公交系統(tǒng)的持續(xù)改進和乘客服務(wù)的優(yōu)化提供決策支持。
2、目前在公交出行時域信號序列預(yù)測領(lǐng)域中,基于深度學(xué)習(xí)的公交出行時域信號序列預(yù)測方法未能依據(jù)公交出行時域序列的趨勢、季節(jié)等特性對信號序列進行分解,未能進一步針對不同成分的特性分別進行信號特征的提取。且現(xiàn)有的預(yù)測方法大多數(shù)僅利用其時域特征進行分析預(yù)測,對時域信號序列中所包含的重要頻域信息及站點間隱藏的動靜態(tài)空間關(guān)系未能進行充分挖掘利用。而現(xiàn)實中的時間序列在時域、頻域和空域都包含豐富的信息,因此充分提取時間序列中的時空頻特征,并通過深度學(xué)習(xí)技術(shù)自動學(xué)習(xí)時間序列的時空頻特征信息提高預(yù)測性能,是目前研究的重點和難點。
3、目前,現(xiàn)有技術(shù)中的公交客流預(yù)測方法多是基于公交出行時域信號序列進行分析,僅提取時域特征,未能充分利用時間序列的頻率特征,容易產(chǎn)生過擬合或欠擬合的問題。
4、公交出行時域信號序列具有復(fù)雜的特征,如趨勢、季節(jié)性、周期性和不規(guī)則性等。目前,現(xiàn)有技術(shù)中的公交客流預(yù)測方法未能基于上述特征將公交出行時域信號序列進行成分分解,未能分別捕捉不同成分的時空頻域特征,缺乏預(yù)測的靈活性。
5、城市公交線網(wǎng)中站點間具有復(fù)雜的動靜態(tài)空間相關(guān)性,目前,現(xiàn)有技術(shù)中的公交客流預(yù)測方法未能充分挖掘站點之間存在多種隱藏動靜態(tài)空間相關(guān)性特征,未能完善地建模站點之間的空間相關(guān)性。
技術(shù)實現(xiàn)思路
1、本發(fā)明的實施例提供了一種聯(lián)合頻域與空域特征的公交客流預(yù)測方法,以實現(xiàn)有效地對公交客流進行預(yù)測。
2、為了實現(xiàn)上述目的,本發(fā)明采取了如下技術(shù)方案。
3、一種聯(lián)合頻域與空域特征的公交客流預(yù)測方法,包括:
4、根據(jù)公交ic卡刷卡數(shù)據(jù)獲取公交出行時域信號序列,采用局部加權(quán)回歸的季節(jié)趨勢分解算法stl方法將公交出行時域信號序列分解為:季節(jié)分量、趨勢分量和殘差分量;
5、采用頻域注意力機制處理季節(jié)分量得到基于頻域注意力的季節(jié)分量,并獲取公交出行時間序列中各站點的權(quán)重,根據(jù)各站點的權(quán)重選取需要采用的站點;
6、根據(jù)趨勢分量、站點間距離圖、站點poi相似性圖和站點客流相似性圖,利用多圖卷積神經(jīng)網(wǎng)絡(luò)得到空間特征;
7、根據(jù)所述基于頻域注意力的季節(jié)分量通過擴張因果卷積處理得到多尺度季節(jié)特征,根據(jù)所述空間特征通過擴張因果卷積處理得到多尺度趨勢特征,根據(jù)所述多尺度季節(jié)特征和所述多尺度趨勢特征對各站點未來的客流量進行預(yù)測。
8、優(yōu)選地,所述的根據(jù)公交ic卡刷卡數(shù)據(jù)獲取公交出行時域信號序列,包括:
9、收集公交ic卡刷卡數(shù)據(jù),對公交ic卡刷卡數(shù)據(jù)進行預(yù)處理,該預(yù)處理包括填補缺失值,處理錯誤和重復(fù)的數(shù)據(jù)剔除,將預(yù)處理后的公交ic卡刷卡數(shù)據(jù)以一定的時間粒度劃分,統(tǒng)計各連續(xù)時段內(nèi)各站點的客流,獲取公交出行時域信號序列xt∈rl×d,其中l(wèi)為樣本的時間總步數(shù),d為公交站點數(shù);
10、用stl方法將公交出行時域信號序列xt∈rl×d分解為季節(jié)分量st、趨勢分量tt和殘差分量rt。
11、優(yōu)選地,所述的采用局部加權(quán)回歸的季節(jié)趨勢分解算法stl方法將公交出行時域信號序列分解為:季節(jié)分量、趨勢分量和殘差分量,包括:
12、公交出行時域信號序列xt的分解過程包括內(nèi)循環(huán)和外循環(huán)兩個過程,內(nèi)循環(huán)嵌套在外循環(huán)中,內(nèi)循環(huán)用季節(jié)平滑與趨勢平滑分別更新季節(jié)分量與趨勢分量,內(nèi)循環(huán)每次迭代結(jié)束后,開始外部循環(huán),計算殘差分量,stl方法的分解公式為:
13、xt=st+tt+rt,t=1,...,n
14、其中,輸入的公交出行時域信號序列xt∈rl×d,l為樣本的時間總步數(shù),d為公交站點數(shù),st為季節(jié)分量,tt為趨勢分量,rt為殘差分量;
15、內(nèi)循環(huán)的具體步驟為:假設(shè)和是內(nèi)循環(huán)第k次迭代的季節(jié)和趨勢分量,且的初值為0,那么和的第k+1步計算過程如下:
16、將原始的公交出行時域信號序列xt減去趨勢分量ttk,得到一個新的去趨勢序列xt-ttk:
17、對去趨勢序列xt-ttk進行局部加權(quán)回歸loess平滑處理,得到初步的季節(jié)序列
18、使用過濾器對進行低通濾波處理,對低通濾波結(jié)果進行l(wèi)oess處理,得到剩余的趨勢序列將平滑循環(huán)子序列去趨勢化,得到季節(jié)分量
19、
20、其中,為第k+1次迭代中獲得的季節(jié)分量,為第k+1次迭代中初步的季節(jié)序列,為第k+1次迭代中經(jīng)過loess處理得到的剩余趨勢序列;
21、去掉原始序列xt的季節(jié)性成分,通過loess對去季節(jié)序列進行平滑,得到趨勢分量
22、通過loess對去季節(jié)序列進行平滑,得到趨勢分量
23、3)當(dāng)內(nèi)部循環(huán)的一次迭代結(jié)束時,開始外部循環(huán),利用內(nèi)部循環(huán)中得到的季節(jié)分量和趨勢分量,計算出殘差分量
24、
25、其中,為第k+1次迭代中獲得的殘差分量,xt為原始序列,為第k+1次迭代中獲得的季節(jié)分量,為第k+1次迭代中獲得的趨勢分量。
26、優(yōu)選地,所述的采用頻域注意力機制處理季節(jié)分量得到基于頻域注意力的季節(jié)分量,并獲取公交出行時間序列中各站點的權(quán)重,根據(jù)各站點的權(quán)重選取需要采用的站點,包括:
27、將季節(jié)分量st∈rl×d經(jīng)過全連接層映射為一組向量q,k,v∈rl×d,將q,k∈rl×d向量在變量方向進行快速傅里葉變換,得到對應(yīng)的頻域序列qk,kk∈rl×(d/2);
28、qk,kk=fft(q,k)
29、
30、xn表示時間序列在每一時間步第n個變量的值,n是時間序列變量的總長度,k是頻率索引,取值范圍為[0,n/2];
31、求出kk的共軛矩陣
32、
33、將qk和相乘得到季節(jié)項的能量項,把季節(jié)項的能量項通過傅里葉逆變換得到季節(jié)項變量方向的自相關(guān)函數(shù),如下式所示:
34、
35、式中f-1表示傅里葉逆變換;
36、將季節(jié)項變量方向的自相關(guān)函數(shù)經(jīng)過softmax函數(shù)得到季節(jié)項各個變量的權(quán)重ωr∈rl×d,所述季節(jié)項各個變量表示各個站點,以權(quán)重ωr的大小反映季節(jié)項的各個站點的重要性,將ωr與v向量相乘得到基于頻域注意力的季節(jié)分量表示
37、ωr=softmax(rq,k)
38、
39、其中,ωr為季節(jié)項各個變量即站點的權(quán)重,rq,k為季節(jié)項變量方向的自相關(guān)函數(shù),
40、為基于頻域注意力的季節(jié)分量表示,v為季節(jié)分量st經(jīng)過全連接層映射的向量。
41、優(yōu)選地,所述的根據(jù)趨勢分量、站點間距離圖、站點poi相似性圖和站點客流相似性圖,利用多圖卷積神經(jīng)網(wǎng)絡(luò)得到空間特征,包括:
42、將交通網(wǎng)絡(luò)表示為加權(quán)圖g=(v,e,a),其中v和e分別表示節(jié)點和節(jié)點間的邊,每個節(jié)點vi表示一個站點,邊eij表示站點vi和vj之間的相關(guān)性,a∈r|v|×|v|表示鄰接矩陣,根據(jù)站點的多重相關(guān)性構(gòu)建站點間距離圖、站點興趣點poi相似性圖和站點客流相似性圖;
43、站點poi相似性圖的構(gòu)建過程包括:
44、站點poi相似性圖中兩個頂點之間邊的權(quán)重被定義為功能相似度,使用調(diào)整余弦相似度計算各站點不同類別poi的數(shù)量所組成的向量pois的相似性,ph,i和ph,j分別表示站點vi和vj的pois向量,其中h表示pois類別數(shù),表示該類poi中所有站點的平均值,thp用于調(diào)整ap的稀疏性;
45、
46、表示站點poi相似性圖ap中站點vi和vj之間相關(guān)性強度
47、站點間距離圖的構(gòu)建過程包括:
48、使用閾值高斯核構(gòu)建鄰接矩陣計算站點i和j之間的距離,距離目標(biāo)站點較近的站點所占權(quán)重較大,dist(vi,vj)表示站點i與站點j之間的距離,σ表示距離標(biāo)準(zhǔn)差,thd為設(shè)定的距離閾值,用于控制ad的稀疏性;
49、
50、表示站點間距離圖ad中站點vi和vj之間的相關(guān)性強度站點客流量相似性圖的構(gòu)建過程包括:
51、基于皮爾遜相關(guān)系數(shù)計算n個站點在k個時隙內(nèi)的客流量相似性:
52、
53、
54、as表示站點客流量相似性圖,ωij表示站點vi和vj之間的相關(guān)性強度;
55、對站點間距離圖、站點poi相似性圖和站點客流相似性圖的鄰接矩陣a分別進行歸一化處理得到公式如下:
56、
57、其中,in為單位矩陣,為添加了自環(huán)的歸一化鄰接矩陣,在加權(quán)矩陣上增加一個softmax操作,則多圖融合過程表示為:
58、wp',wd',ws'=softmax(wp,wd,ws)
59、
60、表示哈達瑪乘法,af為多圖融合的結(jié)果,站點間距離圖ad、站點poi相似性圖ap、站點鄰接圖as進行歸一化處理的結(jié)果分別為wd,wp,ws分別為各圖對應(yīng)的是調(diào)整各圖權(quán)重的可學(xué)習(xí)加權(quán)矩陣,w'p,w'd,w's為加權(quán)矩陣經(jīng)過softmax操作后的結(jié)果;
61、圖卷積表達式為:
62、
63、其中σ是激活函數(shù),為各節(jié)點的特征矩陣,wl是第l層的權(quán)重矩陣;
64、多圖卷積模塊將公交客流趨勢分量和站點間距離圖ad、站點poi相似性圖ap、站點鄰接圖as這三種不同類型的圖的融合結(jié)果af作為圖卷積神經(jīng)網(wǎng)絡(luò)的輸入,多圖卷積模塊采用單層圖卷積網(wǎng)絡(luò)gcn進行卷積操作以捕獲各站點間的關(guān)系,圖卷積的表達式如上所示,生成空間特征
65、優(yōu)選地,所述的根據(jù)所述基于頻域注意力的季節(jié)分量通過擴張因果卷積處理得到多尺度季節(jié)特征,根據(jù)所述空間特征通過擴張因果卷積處理得到多尺度趨勢特征,根據(jù)所述多尺度季節(jié)特征和所述多尺度趨勢特征對各站點未來的客流量進行預(yù)測,包括:
66、采用擴張因果卷積為基于頻域注意力的季節(jié)分量和空間特征分別設(shè)計多個不同大小的卷積核,設(shè)定卷積核大小用k表示,對于輸入x的擴張因果卷積函數(shù)定義為:
67、
68、其中,輸入x在多尺度頻域模塊與多尺度空域模塊中分別為基于頻域注意力的季節(jié)分量與空間特征s代表輸入的特征信息;d為空洞參數(shù),即空洞間隔大小;s-d·i代表對歷史位置信息定位;
69、分別對與進行擴張因果卷積后,將獲得的多尺度的趨勢特征χt和季節(jié)特征χs
70、相結(jié)合對公交客流量進行預(yù)測。yt=σ(wp(χs+χt)+bp)
71、其中,yt∈rt×d為各站點未來t個連續(xù)時段的客流量,wp是可學(xué)習(xí)的權(quán)重矩陣,bp為偏置項,σ為激活函數(shù)。
72、由上述本發(fā)明的實施例提供的技術(shù)方案可以看出,本發(fā)明基于stl方法將公交出行時域信號序列進行分解,基于頻域注意力處理季節(jié)項分量,篩選對預(yù)測具有重要影響的站點;基于多圖卷積神經(jīng)網(wǎng)絡(luò)處理趨勢項分量,充分挖掘站點間隱藏的動靜態(tài)空間相關(guān)性,提高預(yù)測性能。最終為趨勢分量和季節(jié)分量分別設(shè)計多個不同大小的卷積核,將獲得的多尺度趨勢特征和季節(jié)性特征相結(jié)合進行多尺度客流量預(yù)測。本發(fā)明在頻域上處理公交出行時域信號序列,采用頻域注意力機制對不同的公交站點賦予不同的權(quán)重,反映公交出行時域信號序列中各站點的重要程度,使模型更加專注公交線網(wǎng)中的關(guān)鍵站點。
73、本發(fā)明附加的方面和優(yōu)點將在下面的描述中部分給出,這些將從下面的描述中變得明顯,或通過本發(fā)明的實踐了解到。