類型在寒冷天易發(fā)生,可能與道路結(jié)冰有關(guān)。
[0066]步驟3:建立預(yù)測交通警情等級的屬性集
[0067]預(yù)測交通警情等級的特征屬性集中包括第幾三小時(shí)、星期幾、是否節(jié)假日、是否 工作日、是否有重大活動(dòng)、溫度、可見度、降雨量等8個(gè)特征屬性維度,將全天24小時(shí)劃 分為23:00-2:00為第1個(gè)三小時(shí),2:00-5:00為第2個(gè)三小時(shí),5:00-8:00為第3個(gè) 三小時(shí),8:00-11:00為第4個(gè)三小時(shí),11:00-14:00為第5個(gè)三小時(shí),14:00-17:00為 第6個(gè)三小時(shí),17:00-20:00為第7個(gè)三小時(shí),20:00-23:00為第8個(gè)三小時(shí),分別用 [1,2, 3, 4, 5, 6, 7, 8]表示,星期一至星期日用[1,2, 3, 4, 5, 6, 7]表示,工作日用1表示,非工 作日用0表示,若當(dāng)前區(qū)域內(nèi)有大型活動(dòng)、放假等情況用1表示,溫度離散化為[1,2, 3, 4] 四個(gè)等級,可見度離散化為[1,2, 3, 4, 5]五個(gè)等級,降雨量離散化為[1,2, 3, 4, 5]五個(gè)等 級。整理好的特征屬性表如表6所示,表6為預(yù)測交通警情等級的特征屬性集,數(shù)據(jù)庫中存 儲(chǔ)形式,表6與杭州市溫度等級與警情關(guān)系圖中特征屬性維度從左至右均一一對應(yīng)。
[0068]
[0069]表6
[0070] 步驟4 :轄區(qū)內(nèi)交通警情等級劃分
[0071]選取近6個(gè)月內(nèi)各個(gè)交警支隊(duì)的交通警情數(shù)據(jù),將全天24小時(shí)分成8份,每份為3 小時(shí)時(shí)間段,與采集到的天氣數(shù)據(jù)時(shí)間段吻合。23:00-2:00為第1個(gè)三小時(shí),2:00-5:00 為第2個(gè)三小時(shí),5:00-8:00為第3個(gè)三小時(shí),8:00-11:00為第4個(gè)三小時(shí),11:00-14:00 為第5個(gè)三小時(shí),14:00-17:00為第6個(gè)三小時(shí),17:00-20:00為第7個(gè)三小時(shí), 20:00-23:00為第8個(gè)三小時(shí),采用等區(qū)間裝箱的方式將三小時(shí)時(shí)段內(nèi)所有警情數(shù)量求 和,構(gòu)成( Xl,x2,…,xn)關(guān)于當(dāng)前轄區(qū)交通警情數(shù)量的一個(gè)樣本空間,由n個(gè)樣本點(diǎn)組成,其 中無=丄乏^可計(jì)算出當(dāng)前交警支隊(duì)的警情數(shù)量均值記為Uf 3〇2 n n - \ 計(jì)算出警情數(shù)量的方差記為〇,故警情數(shù)量屬于[0, 的標(biāo)記警情等級為Q,警情數(shù) 量屬于[y - 0,y + 0 )的標(biāo)記警情等級為c2,警情數(shù)量屬于[y + 0,+ <-)的標(biāo)記警情等級為c30
[0072] 步驟5:構(gòu)造樸素貝葉斯分類器并預(yù)測各個(gè)區(qū)域的交通警情等級
[0073] 以事故類警情預(yù)警為例,將2013年1月至2015年2月數(shù)據(jù)分為兩部分,2013年1 月至2014年11月1日共4977條數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)集,2014年11月1日至2015年2月3 日共738條數(shù)據(jù)作為測試數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)集中的4977條數(shù)據(jù)輸入分類器訓(xùn)練出一組與 特征值有關(guān)的系數(shù),去除738條測試集中的警情等級標(biāo)簽,然后將738條測試數(shù)據(jù)輸入訓(xùn)練 好的分類器中,記錄下預(yù)測出的警情等級,將預(yù)測出的警情等級與測試集中原有的警情等 級標(biāo)簽進(jìn)行對比,測試預(yù)測結(jié)果的準(zhǔn)確率。實(shí)驗(yàn)分別采用貝葉斯分類器和決策樹分類器進(jìn) 行分類,并得到測試結(jié)果概況如表7所示,表7為貝葉斯分類器和決策樹分類器預(yù)測準(zhǔn)確率 對比。
[0074]
[0075]表 7
[0076] 738條測試數(shù)據(jù)中預(yù)測準(zhǔn)確573條數(shù)據(jù),準(zhǔn)確率達(dá)到77. 6422764228%,預(yù)測錯(cuò)誤 165條數(shù)據(jù),錯(cuò)誤的165條數(shù)據(jù)中跨等級預(yù)測錯(cuò)誤數(shù)據(jù)為15條,其余預(yù)測錯(cuò)誤的150條警情 等級均為相鄰等級。
【主權(quán)項(xiàng)】
1. 一種城市交通警情等級預(yù)測方法,其特征在于:所述預(yù)測方法包括如下步驟: 步驟1:時(shí)間數(shù)據(jù)整理 時(shí)間數(shù)據(jù)包括5維特征屬性,分別是第幾單位時(shí)間、星期幾、是否節(jié)假日、是否工作日 和是否有重大活動(dòng),所述第幾單位時(shí)間屬性處理方法為設(shè)定單位時(shí)間At= 24h/N,按單位 時(shí)間△t將全天24小時(shí)分為N段;獲取國務(wù)院頒布的法定節(jié)假日信息構(gòu)成節(jié)假日屬性;依 據(jù)節(jié)假日和周末信息構(gòu)成工作日屬性;根據(jù)當(dāng)天是否有大型考試、當(dāng)前轄區(qū)內(nèi)學(xué)校是否放 假、是否有大型場館活動(dòng)定義是否有重大活動(dòng)屬性; 步驟2 :天氣數(shù)據(jù)與交通警情關(guān)聯(lián)性分析及處理 天氣數(shù)據(jù)包括溫度、可見度、降雨量3個(gè)特征屬性; 步驟3 :建立預(yù)測交通警情等級的屬性集 根據(jù)數(shù)據(jù)庫信息,將處理后的時(shí)間數(shù)據(jù)、天氣數(shù)據(jù)、重大活動(dòng)日、中小學(xué)放假特征屬性 整合成多維數(shù)據(jù)寬表,其中包括8個(gè)離散的特征屬性維度; 步驟4 :轄區(qū)內(nèi)交通警情等級劃分 統(tǒng)計(jì)各轄區(qū)近期6個(gè)月內(nèi)的警情發(fā)生次數(shù),采用動(dòng)態(tài)劃分的方法將交通警情發(fā)生次 數(shù)劃分為三個(gè)等級,將各個(gè)交警支隊(duì)在單位時(shí)間At內(nèi)的警情數(shù)量采用等區(qū)間裝箱方法 求和,構(gòu)成(XpXh-sxj關(guān)于交通警情數(shù)量的一個(gè)樣本空間,由n個(gè)樣本點(diǎn)組成,其中可計(jì)算出當(dāng)前交警支隊(duì)的警情數(shù)量均值記為U,計(jì)算出警情數(shù)量的標(biāo)準(zhǔn)差記為〇,故警情數(shù)量屬于[〇, 的標(biāo)記警情等級為Q,警情 數(shù)量屬于[y- 〇,y+ 〇)的標(biāo)記警情等級為c2,警情數(shù)量屬于[y+ 〇,+ <-)的標(biāo)記警情等 級為c3; 步驟5 :構(gòu)造樸素貝葉斯分類器 選取第幾三小時(shí)&、星期幾X2、是否節(jié)假日X3、是否工作日X4、是否有重大 活動(dòng)X5、溫度X6、可見度X7、降雨量&構(gòu)成預(yù)測交通警情等級的多維數(shù)據(jù)集T= {&,X2,X3,X4,X5,X6,X7,X8},將標(biāo)記好的警情等級與多維數(shù)據(jù)集共同構(gòu)成樸素貝葉斯分類的 訓(xùn)練集R= {Xi,X2,X3,X4,X5,X6,X7,X8,CJ,其中CiG(ci,c2,c3),從而使每個(gè)訓(xùn)練樣本都具 有相應(yīng)的警情等級類別標(biāo)簽。已知未來幾天各個(gè)特征屬性Ti={Xi,X2,X3,X4,X5,X6,X7,X8} =d預(yù)測當(dāng)前區(qū)域的交通警情等級,根據(jù)樸素貝葉斯分類器的原理可知需要比較在I\ = d的條件下屬于Q、C2、C3三類警情等級的概率大小,即需要計(jì)算p(Ci|凡=d)、p(C2 |凡= d)、p(C3|Ti=d)三者的概率。由貝葉斯公式可知,其中 Cf(CdQQ,比較?沁|1\= (1)、口((:2|1\= (1)、口((:3|1\=d)三者的概率大小只需要比 較pfX^pCTfdie)、p(C2)p(Ti=d|c2)、p(C3)p(Ti=d|c3)三者的大小,分母p(Ti=d) 對所有類別為常數(shù); 通過統(tǒng)計(jì)訓(xùn)練集R中屬于警情等級(^的樣本個(gè)數(shù)可計(jì)算出p(Ci)的概率,即p(Ti = dlQ)即在類另iJCi中屬性1\的取值為d的概率,具體口〇\=dlCj=p(X1=dJCibd=(12|(^)…口氏二d8|Ci),其中d=(屯,d2,…,d8),8個(gè)離散特征屬性的先驗(yàn)概率p(Xi= dJCi)、…、p(X8= (18|(^)通過計(jì)算在每個(gè)類另ljQ中每個(gè)屬性父濟(jì)值為!^的概率p(Xi= 屯|Q)求得; 步驟6 :預(yù)測各區(qū)域的交通警情等級 由步驟5形成各特征屬性的概率表,將所有特征屬性的概率相乘計(jì)算出pKilTi)、p(C211\)、p(C311\)三者的概率大小,將所有特征屬性的概率相乘時(shí)如果有某個(gè)特征屬性的 概率值為零,會(huì)消除乘積中涉及的所有其他屬性概率的影響,導(dǎo)致最終的結(jié)果為 零,每個(gè)特征屬性從1開始計(jì)數(shù),P(Q|TJ、p(C21TJ、p(C31TJ三者中最大的概率值即為樸 素貝葉斯分類器預(yù)測出的當(dāng)前特征屬性條件下的交通警情等級。2.如權(quán)利要求1所述的一種城市交通警情等級預(yù)測方法,其特征在于:所述步驟2中, 將降雨量分為以下五個(gè)等級,降雨量〇?lmm-9. 9mm時(shí)為小雨,降雨量為10mm-24. 9mm為中 雨,降雨量25mm-49. 9mm為大雨,降雨量50mm-99. 9mm為暴雨,降雨量100mm以上為大暴雨; 將可見度等級分為以下五類,可見度大于l〇km時(shí)為無霧,可見度為lkm-10km時(shí)為輕霧,可 見度為200m-lkm時(shí)大霧,可見度為50m-200m時(shí)為濃霧,可見度小于50m時(shí)為強(qiáng)霧;將溫度 劃分為小于5°C,5°C-28°C,29°C-35°C,大于35°C四個(gè)等級。
【專利摘要】一種城市交通警情等級預(yù)測方法,包括如下步驟:步驟1:時(shí)間數(shù)據(jù)整理,時(shí)間數(shù)據(jù)包括5維特征屬性,分別是第幾單位時(shí)間、星期幾、是否節(jié)假日、是否工作日和是否有重大活動(dòng);步驟2:天氣數(shù)據(jù)與交通警情關(guān)聯(lián)性分析及處理:天氣數(shù)據(jù)包括溫度、可見度、降雨量3個(gè)特征屬性;步驟3:建立預(yù)測交通警情等級的屬性集:根據(jù)數(shù)據(jù)庫信息,將處理后的時(shí)間數(shù)據(jù)、天氣數(shù)據(jù)、重大活動(dòng)日、中小學(xué)放假特征屬性整合成多維數(shù)據(jù)寬表,其中包括8個(gè)離散的特征屬性維度;步驟4:轄區(qū)內(nèi)交通警情等級劃分;步驟5:構(gòu)造樸素貝葉斯分類器;步驟6:預(yù)測各區(qū)域的交通警情等級。本發(fā)明提供了一種有效實(shí)現(xiàn)預(yù)測、準(zhǔn)確性較好的城市交通警情等級預(yù)測方法。
【IPC分類】G08G1/01
【公開號】CN104992557
【申請?zhí)枴緾N201510242669
【發(fā)明人】李建元, 王浩, 顧超, 張麒
【申請人】浙江銀江研究院有限公司
【公開日】2015年10月21日
【申請日】2015年5月13日