本發(fā)明涉及車輛調(diào)度,具體而言,涉及一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法及裝置。
背景技術(shù):
1、隨著城市化進(jìn)程的加快和居民出行需求的多樣化,城市內(nèi)的網(wǎng)約車供需不平衡問題愈發(fā)突出。這不僅影響了乘客的出行體驗(yàn),也對(duì)網(wǎng)約車平臺(tái)的運(yùn)營(yíng)效率提出了挑戰(zhàn)。
2、城市內(nèi)的網(wǎng)約車供需不平衡往往表現(xiàn)在高峰時(shí)段的某些區(qū)域車輛供給不足,而其他時(shí)段或區(qū)域車輛則處于閑置狀態(tài)。這種供需錯(cuò)配不僅導(dǎo)致乘客等待時(shí)間延長(zhǎng),對(duì)于網(wǎng)約車平臺(tái)而言,這種不平衡狀況還會(huì)導(dǎo)致車輛利用率下降,增加運(yùn)營(yíng)成本。
3、城內(nèi)車輛重定位作為解決城內(nèi)區(qū)域間網(wǎng)約車供需不平衡問題的一項(xiàng)重要措施,正逐漸受到關(guān)注和重視。但目前尚未有一個(gè)很好的融合車輛重定位策略的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法。
4、有鑒于此,申請(qǐng)人在研究了現(xiàn)有的技術(shù)后特提出本申請(qǐng)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明旨在提供一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法及裝置,以解決城內(nèi)區(qū)域間網(wǎng)約車供需不平衡的問題,提升網(wǎng)約車平臺(tái)的運(yùn)營(yíng)效率和服務(wù)質(zhì)量,緩解城市交通壓力。
2、為解決上述技術(shù)問題,本發(fā)明通過以下技術(shù)方案實(shí)現(xiàn):
3、一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法,包括:
4、s1,獲取城際網(wǎng)約車某條運(yùn)營(yíng)線路上的城市a和城市b的道路網(wǎng)絡(luò)數(shù)據(jù)后,分別劃分若干區(qū)域,并實(shí)時(shí)獲取各區(qū)域內(nèi)的往返乘客拼車出行數(shù)據(jù);
5、s2,給定調(diào)度時(shí)刻集合和重定位調(diào)度時(shí)刻集合,在所述重定位調(diào)度時(shí)刻集合的每個(gè)重定位調(diào)度時(shí)刻,通過深度學(xué)習(xí)算法預(yù)測(cè)出未來一段時(shí)間內(nèi)城市a和城市b各區(qū)域的乘客出行需求量;
6、s3,根據(jù)預(yù)測(cè)的乘客出行需求量,分別計(jì)算城市a和城市b各區(qū)域的空閑車輛數(shù)、供需平衡差和盈利路徑總?cè)藬?shù);
7、s4,根據(jù)計(jì)算出的空閑車輛數(shù)、供需差、盈利路徑總?cè)藬?shù)與所述往返乘客拼車出行數(shù)據(jù),構(gòu)建雙層優(yōu)化模型;其中,所述雙層優(yōu)化模型包括上層模型與下層模型;所述上層模型以最大化所有調(diào)度時(shí)間點(diǎn)的利潤(rùn)的總和為目標(biāo);所述下層模型以最大化重定位后的潛在利潤(rùn)為目標(biāo);
8、s5,對(duì)城市a和城市b中的每個(gè)區(qū)域分別構(gòu)建獨(dú)立的智能體;其中,所述智能體包括狀態(tài)空間、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù);
9、s6,采用多智能體圖深度q學(xué)習(xí)網(wǎng)絡(luò)算法對(duì)每個(gè)區(qū)域的智能體進(jìn)行差異性學(xué)習(xí),以捕獲各區(qū)域的空間關(guān)系,得到近似最優(yōu)q值函數(shù);根據(jù)所述近似最優(yōu)q值函數(shù),得到空閑車輛的重定位決策;
10、s7,遍歷所述調(diào)度時(shí)刻集合的每個(gè)調(diào)度時(shí)刻,判斷當(dāng)前時(shí)刻是否達(dá)到重定位調(diào)度時(shí)刻集合的重定位調(diào)度間隔;若達(dá)到,則預(yù)測(cè)得到乘客出行需求量,根據(jù)對(duì)應(yīng)智能體得到空閑車輛的重定位決策后,使用多輪二分圖匹配方法進(jìn)行城際動(dòng)態(tài)拼車調(diào)度;否則,直接使用多輪二分圖匹配算法進(jìn)行動(dòng)態(tài)拼車調(diào)度,迭代直到完成所有調(diào)度時(shí)刻,得到融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方案。
11、本發(fā)明還提供了一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化裝置,包括:
12、數(shù)據(jù)獲取單元,用于獲取城際網(wǎng)約車某條運(yùn)營(yíng)線路上的城市a和城市b的道路網(wǎng)絡(luò)數(shù)據(jù)后,分別劃分若干區(qū)域,并實(shí)時(shí)獲取各區(qū)域內(nèi)的往返乘客拼車出行數(shù)據(jù);
13、乘客需求預(yù)測(cè)單元,用于給定調(diào)度時(shí)刻集合和重定位調(diào)度時(shí)刻集合,在所述重定位調(diào)度時(shí)刻集合的每個(gè)重定位調(diào)度時(shí)刻,通過深度學(xué)習(xí)算法預(yù)測(cè)出未來一段時(shí)間內(nèi)城市a和城市b各區(qū)域的乘客出行需求量;
14、供需指標(biāo)計(jì)算單元,用于根據(jù)預(yù)測(cè)的乘客出行需求量,分別計(jì)算城市a和城市b各區(qū)域的空閑車輛數(shù)、供需平衡差和盈利路徑總?cè)藬?shù);
15、雙層模型構(gòu)建單元,用于根據(jù)計(jì)算出的空閑車輛數(shù)、供需差、盈利路徑總?cè)藬?shù)與所述往返乘客拼車出行數(shù)據(jù),構(gòu)建雙層優(yōu)化模型;其中,所述雙層優(yōu)化模型包括上層模型與下層模型;所述上層模型以最大化所有調(diào)度時(shí)間點(diǎn)的利潤(rùn)的總和為目標(biāo);所述下層模型以最大化重定位后的潛在利潤(rùn)為目標(biāo);
16、多智能體構(gòu)建單元,用于對(duì)城市a和城市b中的每個(gè)區(qū)域分別構(gòu)建獨(dú)立的智能體;其中,所述智能體包括狀態(tài)空間、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù);
17、車輛重定位單元,用于得到重定位決策,采用多智能體圖深度q學(xué)習(xí)網(wǎng)絡(luò)算法對(duì)每個(gè)區(qū)域的智能體進(jìn)行差異性學(xué)習(xí),以捕獲各區(qū)域的空間關(guān)系,得到近似最優(yōu)q值函數(shù);根據(jù)所述近似最優(yōu)q值函數(shù),得到空閑車輛的重定位決策;
18、動(dòng)態(tài)拼車調(diào)度單元,用于得到融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方案,遍歷所述調(diào)度時(shí)刻集合的每個(gè)調(diào)度時(shí)刻,判斷當(dāng)前時(shí)刻是否達(dá)到重定位調(diào)度時(shí)刻集合的重定位調(diào)度間隔;若達(dá)到,則預(yù)測(cè)得到乘客出行需求量,根據(jù)對(duì)應(yīng)智能體得到空閑車輛的重定位決策后,使用多輪二分圖匹配方法進(jìn)行城際動(dòng)態(tài)拼車調(diào)度;否則,直接使用多輪二分圖匹配算法進(jìn)行動(dòng)態(tài)拼車調(diào)度,迭代直到完成所有調(diào)度時(shí)刻,得到融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方案。
19、本發(fā)明還提供了一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化設(shè)備,包括處理器以及存儲(chǔ)器,所述存儲(chǔ)器內(nèi)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序能夠被所述處理器執(zhí)行,以實(shí)現(xiàn)如上所述的一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法。
20、本發(fā)明還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)可讀指令,所述計(jì)算機(jī)可讀指令被計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)所在設(shè)備的處理器執(zhí)行時(shí)實(shí)現(xiàn)如上所述的一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法。
21、綜上所述,與現(xiàn)有技術(shù)相比,本發(fā)明具有如下有益效果:
22、本發(fā)明基于城際動(dòng)態(tài)拼車和車輛重定位的雙層規(guī)劃模型,上層模型以最大化所有調(diào)度時(shí)間點(diǎn)利潤(rùn)的總和為優(yōu)化目標(biāo),下層模型以最大化重定位后的潛在利潤(rùn)為優(yōu)化目標(biāo)。本發(fā)明同時(shí)設(shè)計(jì)多智能體圖深度q學(xué)習(xí)網(wǎng)絡(luò)(multi-agent?graph?deep?q-network,magdqn)算法。該算法結(jié)合多區(qū)域需求量預(yù)測(cè),考慮供需平衡、匹配路徑可行性和移動(dòng)成本,將每個(gè)區(qū)域視為獨(dú)立的智能體,引入多頭圖注意力網(wǎng)絡(luò)mgat學(xué)習(xí)重定位關(guān)系,實(shí)現(xiàn)多智能體協(xié)同決策雙側(cè)城市內(nèi)的空閑車輛重定位。
23、本發(fā)明提出了基于多區(qū)域需求量預(yù)測(cè)和車輛重定位的城際動(dòng)態(tài)拼車優(yōu)化方案,進(jìn)一步提高城際拼車的總利潤(rùn),能夠有效緩解網(wǎng)約車供需不平衡的問題。
1.一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法,其特征在于,設(shè)城市a的區(qū)域節(jié)點(diǎn)集合為,城市b的區(qū)域節(jié)點(diǎn)集合為,實(shí)時(shí)獲取的各區(qū)域內(nèi)往返乘客拼車出行數(shù)據(jù)包括乘客數(shù)據(jù)和車輛數(shù)據(jù);其中,
3.根據(jù)權(quán)利要求2所述的一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法,其特征在于,設(shè)調(diào)度時(shí)間集合為,每個(gè)調(diào)度時(shí)刻為t,共有個(gè)調(diào)度時(shí)間;重定位調(diào)度時(shí)間集合為,每個(gè)重定位調(diào)度時(shí)刻為;則,
4.根據(jù)權(quán)利要求3所述的一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法,其特征在于,所述上層模型包含上層目標(biāo)函數(shù)、上層決策變量與上層約束條件;其中,所述上層目標(biāo)函數(shù)為:
5.根據(jù)權(quán)利要求4所述的一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法,其特征在于,所述下層模型包含下層目標(biāo)函數(shù)、下層決策變量與下層約束條件;其中,所述下層目標(biāo)函數(shù)的表達(dá)式為:
6.根據(jù)權(quán)利要求5所述的一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法,其特征在于,所述智能體的狀態(tài)空間包括:區(qū)域內(nèi)可調(diào)空閑車輛數(shù)、供需差、盈利路徑總?cè)藬?shù)與移動(dòng)成本;所述智能體的動(dòng)作任務(wù)是將空閑車輛移動(dòng)到適當(dāng)?shù)钠渌麉^(qū)域或者不移動(dòng),且將所有區(qū)域的編號(hào)作為智能體的動(dòng)作空間;所述智能體的獎(jiǎng)勵(lì)函數(shù)從供需平衡、匹配路徑可行性和移動(dòng)成本三個(gè)方面設(shè)計(jì)而成;其中,構(gòu)建城市a的智能體的步驟為:
7.根據(jù)權(quán)利要求6所述的一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法,其特征在于,所述多智能體圖深度q學(xué)習(xí)網(wǎng)絡(luò)算法基于多頭圖注意力網(wǎng)絡(luò),對(duì)每個(gè)智能體的所屬區(qū)域和其他區(qū)域構(gòu)建無向圖,算法引入兩個(gè)相同的結(jié)構(gòu)網(wǎng)絡(luò):一是行為網(wǎng)絡(luò),用于學(xué)習(xí)預(yù)測(cè)q值;另一個(gè)是目標(biāo)網(wǎng)絡(luò),用于計(jì)算目標(biāo)q值;算法的輸入為所有區(qū)域狀態(tài)構(gòu)成的狀態(tài)空間,輸出為狀態(tài)動(dòng)作對(duì)應(yīng)的q值函數(shù),具體公式如下:
8.根據(jù)權(quán)利要求7所述的一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法,其特征在于,在計(jì)算每個(gè)智能體的目標(biāo)q值時(shí),將其他智能體的目標(biāo)q值的平均值加上當(dāng)前智能體的目標(biāo)q值得到,以考慮不同智能體的協(xié)同影響,并采用均方誤差損失函數(shù)來衡量q值的預(yù)測(cè)值與目標(biāo)值之間的差距,表達(dá)式如下:
9.根據(jù)權(quán)利要求8所述的一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化方法,其特征在于,所述多智能體圖深度q學(xué)習(xí)網(wǎng)絡(luò)算法的學(xué)習(xí)訓(xùn)練過程如下:
10.一種融合城內(nèi)車輛重定位的城際動(dòng)態(tài)拼車調(diào)度優(yōu)化裝置,其特征在于,包括: