基于多智能體仿真的城市公共交通政策分析平臺(tái)的制作方法
【技術(shù)領(lǐng)域】
[0001] 城市公共交通管理。具體講,設(shè)及基于多智能體仿真的城市公共交通政策分析平 臺(tái)。
【背景技術(shù)】
[0002] Agent技術(shù)是人工智能研究領(lǐng)域的熱點(diǎn),由面向?qū)ο蠹夹g(shù)發(fā)展而來(lái)。由異構(gòu)、分 布、動(dòng)態(tài)、大規(guī)模自治Agent松散親合所構(gòu)成的系統(tǒng),稱(chēng)之為多Agent系統(tǒng)(Multi-Agent System,M巧,也可泛指所有由多個(gè)自治或半自治模塊組成的系統(tǒng)。在交通領(lǐng)域,利用多 Agent技術(shù)解決復(fù)雜交通問(wèn)題的研究也正在日益增多。多Agent仿真技術(shù)為解決早高峰通 勤現(xiàn)有研究的局限性提供了新的方法。多Agent系統(tǒng)中的每個(gè)Agent都有其不同的行為動(dòng) 機(jī)和行為機(jī)制,并具有在不完全信息下求解問(wèn)題的能力,Agent所具備的知識(shí)和獲取的數(shù)據(jù) 是相互獨(dú)立的,系統(tǒng)不具備全局控制機(jī)制。每個(gè)Agent的行為都將對(duì)環(huán)境造成影響,而環(huán)境 所包含的信息又通過(guò)反饋機(jī)制傳遞給Agent,從而影響其行為。
[0003] 多Agent技術(shù)在交通相關(guān)領(lǐng)域得到了廣泛的運(yùn)用。在交通控制和管理領(lǐng)域, Fei-YueWang設(shè)計(jì)了將Agent技術(shù)運(yùn)用于現(xiàn)實(shí)城市交通控制的硬件及系統(tǒng)實(shí)現(xiàn)。Van Katwi化等提供了一個(gè)能在動(dòng)態(tài)交通管理中實(shí)驗(yàn)不同策略的多Agent系統(tǒng),W研究不同 策略的適用性。在交通信號(hào)燈控制領(lǐng)域,化oy等建立一個(gè)具有在線學(xué)習(xí)能力的分層式多 Agent構(gòu)架,運(yùn)用模糊神經(jīng)決策控制交通信號(hào)燈?;痚n等設(shè)計(jì)了帶適應(yīng)和合作的信號(hào)燈 Agent用于分散式的交通燈控制。Kosonen設(shè)計(jì)一個(gè)基于多Agent的信號(hào)燈控制系統(tǒng),其利 用實(shí)時(shí)檢測(cè)器數(shù)據(jù)對(duì)路網(wǎng)情況進(jìn)行在線仿真。
[0004] 值得一提的是,多Agent系統(tǒng)所具備的Agent的異構(gòu)性、自治性等特點(diǎn),使其尤為 適合在交通仿真領(lǐng)域中使用,不論是行人流的仿真、駕駛行為的仿真,甚至在道路交叉口仿 真或者空中交通流量仿真方面也都得到了較好的應(yīng)用。Burmeister等利用多Agent技術(shù)實(shí) 現(xiàn)了一個(gè)微觀交通仿真模型,在其模型中將駕駛員及其所駕駛車(chē)輛視為一個(gè)智能Agent,由 傳感器、效應(yīng)器、通訊機(jī)制、動(dòng)機(jī)、認(rèn)知等模塊組成,結(jié)果表明新模型更為契合實(shí)際,并且克 服了傳統(tǒng)仿真模型中的諸多不足。化achimW址le等利用基于Agent的方法對(duì)兩路徑情況 進(jìn)行仿真,研究了實(shí)時(shí)信息影響下的駕駛員行為。Salim等提出了一個(gè)基于Agent的模型用 于仿真道路交叉口的安全狀況,在其模型中,Agent利用數(shù)據(jù)流挖掘的方法用于偵測(cè)交叉口 路況、碰撞提示和回避等方面。Rossetti等利用帶有信念化eliefs)、愿望(desires)、意圖 (intentions)的抓IAgent研究駕駛員的決策行為。在Li等的工作中,多Agent的協(xié)同機(jī) 制和網(wǎng)格計(jì)算方法結(jié)合起來(lái)被用于空中交通流的仿真,提高了傳統(tǒng)空中交通流仿真中的計(jì) 算效率。DaSilva等開(kāi)發(fā)了能夠仿真駕駛員行為、交通燈、交通擁堵預(yù)測(cè)的多Agent仿 真平臺(tái)。Kukla建立了一個(gè)基于多Agent的行人仿真模型。
【發(fā)明內(nèi)容】
[0005] 為克服技術(shù)的不足,為政策的制定、交通管理效率的提高提供技術(shù)支持。為此,本 發(fā)明采取的技術(shù)方案是,基于多智能體仿真的城市公共交通政策分析平臺(tái),由大規(guī)模自治Agent松散親合所構(gòu)成,形成多Agent系統(tǒng)(Multi-AgentSystem,MAS,),通勤者Agent代 表在早高峰有出勤需求的居民,其基本行為模式為在每個(gè)仿真天內(nèi)乘坐公交車(chē)至工作區(qū)上 班,結(jié)束通勤后衡量此次通勤的成本,更新經(jīng)驗(yàn)庫(kù)和知識(shí);系統(tǒng)包括如下幾個(gè)主要模塊:
[0006] 環(huán)境感知模塊:用于感知環(huán)境中的擁擠、早到或遲到的延誤懲罰等因素;
[0007] 記憶存儲(chǔ)模塊:用于保存和提取歷史通勤信息;
[0008] 成本衡量模塊;結(jié)合環(huán)境感知模塊計(jì)算通勤成本;
[0009] 經(jīng)驗(yàn)庫(kù):隨著系統(tǒng)的演化Agent會(huì)不斷更新自己的經(jīng)驗(yàn),其內(nèi)容體現(xiàn)了Agent對(duì)記 憶中整個(gè)高峰通勤狀況的感受和評(píng)價(jià);
[0010] 學(xué)習(xí)機(jī)制:采用基于Agent的Bush-Mosteller算法;
[0011] 決策控制模塊:結(jié)合經(jīng)驗(yàn)庫(kù)和通勤者記憶的信息,對(duì)下一個(gè)仿真天選乘的班次進(jìn) 行決策?;贐ush-Mosteller的通勤者學(xué)習(xí)機(jī)制包括;
[0012] 1)義用Bush-Mosteller強(qiáng)化學(xué)習(xí)模型;
[001引。策略學(xué)習(xí)機(jī)制;
[0014] 將BM模型應(yīng)用到早高峰通勤情境下,通勤者的可選策略集即為早高峰所有班車(chē) 集合,記為T(mén),每一輛公交車(chē)代表一個(gè)選擇策略,每個(gè)策略對(duì)應(yīng)一個(gè)選擇概率從而整個(gè)策略 集對(duì)應(yīng)了一個(gè)概率向量,由隨機(jī)決策準(zhǔn)則決定每仿真天內(nèi)通勤者所選策略。通勤者單次通 勤效用由成本衡量模塊計(jì)算;
[0015] 3)刺激計(jì)算規(guī)則
[0016] 在BM標(biāo)準(zhǔn)模型中,刺激S。的計(jì)算方式公式如下:
[0017]
公式(1)
[001引其中
[0019] C。一策略a相對(duì)應(yīng)的平均通勤
[0020] A-通勤者對(duì)此次通勤成本的期望
[0021] Cm"-該通勤者的歷史最高通勤成本
[0022] Cmi。一該通勤者的歷史最低通勤成本
[0023] 式(1)的分母表示該通勤者歷史任意一次成本與期望之差的絕對(duì)值的上確界;
[0024] 4)概率更新過(guò)程
[00巧]把A取為該通勤者的歷史平均通勤成本。在一次通勤中采用策略a之后,其對(duì)應(yīng) 概率P。更新規(guī)則如下;
[0026]
公式(2)
[0027] 在式(2)中,P。,,代表t時(shí)刻策略a對(duì)應(yīng)的選擇概率,1表示學(xué)習(xí)率(0 < 1 < 1), 其體現(xiàn)了通勤者學(xué)習(xí)的速度,S。,,是在t時(shí)刻選擇策略a后計(jì)算得到的刺激;
[0028] 對(duì)于未被選擇的策略,其對(duì)應(yīng)的概率更新規(guī)則如下:
[0029]
[0030] 采用在參數(shù)一致的情況下對(duì)比經(jīng)典解析結(jié)果的方法,檢驗(yàn)多Agent系統(tǒng)模型的正 確性;采用Tian模型作為驗(yàn)證多Agent方法適用性的基準(zhǔn)模型,在Tian的模型中,通勤者 被假定為是同質(zhì)的,并且對(duì)整個(gè)早高峰通勤狀況具有完備信息,首先采用與其一致的假定 條件和參數(shù)設(shè)置進(jìn)行實(shí)驗(yàn),從Hi站出發(fā),選擇乘坐班車(chē)j的通勤者的總成本用如下公式計(jì) 算:
[003。
公式(4)
[003引其中,P康示從H卻出發(fā)到工作地W的票價(jià),假定Pi是恒定的并不隨時(shí)間變化,ci表示通勤者從&出發(fā)乘坐班車(chē)j到達(dá)W過(guò)程中的總擁擠成本,擁擠成本的計(jì)算用一個(gè)包 含車(chē)內(nèi)擁擠水平和站間行駛時(shí)間的函數(shù)表示,如式巧);
[0033]
公式巧)
[0034] 其中,呵是從站咕上車(chē)乘坐班車(chē)j的通勤者數(shù)量,顯然有> 0,TS表示從站HS 到站Hw的行駛時(shí)間,擁擠函數(shù)g(n)代表通勤者對(duì)擁擠水平的感知,當(dāng)車(chē)廂內(nèi)沒(méi)有人的時(shí) 候,擁擠成本為0,即g(〇) =〇;g(n)取線性函數(shù);
[003引式(4)中的第四項(xiàng)5 (j)表示通勤者乘坐班車(chē)j所獲得的延誤懲罰 成本,該里延誤懲罰成本的定義與Vickrey的瓶頸模型一致,模型中用T= {C,. . .,2, 1,0, -1,-2,. . .,-C}表示所有公交車(chē)的集合,C和C取足夠大W確保所有通 勤者均能在整個(gè)交通高峰階段完成通勤,假定只有一輛公交車(chē)是在上班時(shí)間時(shí)刻準(zhǔn)時(shí)到達(dá) 工作區(qū)W的,用0表示,由此,j> 0表示在上班時(shí)間之前就到達(dá)W的公交班次,早到的時(shí)間 良PjXt,其中t為公交車(chē)發(fā)車(chē)間隔,j< 0表示在上班時(shí)間點(diǎn)之后到達(dá)W的公交班次,遲到 時(shí)間為-jXt, 5 (_]')的計(jì)算如式做:
[0036]
公式化)
[0037] 其中,0和丫均為正數(shù),分別代表早到、遲到情況下每單位時(shí)間所帶來(lái)的延誤懲 罰成本;
[0038] 在計(jì)算等價(jià)問(wèn)題時(shí)假定Pi+af= 0,最終通過(guò)求解凸函數(shù)最小化問(wèn)題得到通勤者 出發(fā)時(shí)間的均衡狀態(tài)分布:
[0039] 達(dá)到均衡時(shí)通勤者出發(fā)時(shí)間分布滿足滿足四點(diǎn)性質(zhì):
[0040] (1)對(duì)于非起始站點(diǎn)&,如果某班車(chē)j上在該站載客人數(shù)>0,則上游站臺(tái)中一 定也有人乘坐該車(chē);
[00川 似對(duì)于非起始站點(diǎn)Hi,如果某班車(chē)j上在該站載客人數(shù)> 0,則上一站臺(tái)Hh- 定有人乘坐該車(chē);
[0042] (3)對(duì)于非起始站點(diǎn)&,如果某班車(chē)j上在該站載客人數(shù)/< > 0,則該車(chē)所搭載的 上游所有站臺(tái)的總?cè)藬?shù)是一個(gè)獨(dú)立于j的常量;更進(jìn)一步說(shuō),上游每一站的上車(chē)人數(shù)均是 獨(dú)立于j的常量nS
[0043] 除了最后一個(gè)上車(chē)站即非Hk的H1,對(duì)于所有班車(chē)j屬于T,所有在Hi站上j車(chē)的 人數(shù)均小于等于ni。
[0044] 與已有技術(shù)相比,本發(fā)明的技術(shù)特點(diǎn)與效果:
[0045] 本發(fā)明通過(guò)agent建模及分析,可獲取高峰前免費(fèi)乘車(chē)、公交提速等各項(xiàng)交通管 理政策能夠取得的效果預(yù)計(jì),為政策的制定、交通管理效率的提高提供技術(shù)支持。
【附圖說(shuō)明】
[0046] 圖1通勤者Agent模塊。
[0047] 圖2BM模型中的認(rèn)知結(jié)構(gòu)改變過(guò)程。
[0048] 圖3策略a更新過(guò)程。
[0049] 圖4典型算例。
[0050] 圖5通勤者班次選擇分布。
[0051]圖6 "峰前免費(fèi)"政策仿真實(shí)驗(yàn)結(jié)果。a通勤者收斂程度;b各站通勤者平均通勤 成本(均衡時(shí));c通勤者班次選擇分布。
[0052] 圖7"峰前免費(fèi)"政策組與理想組實(shí)驗(yàn)對(duì)比。
[0053] 圖8各班次所載乘客的平均通勤成本。
[0054] 圖9 "分時(shí)折扣"政