基于手機信令數(shù)據(jù)的居民出行方式綜合判別的方法
【技術領域】
[0001] 本發(fā)明屬于交通規(guī)劃數(shù)據(jù)分析領域,具體涉及一種基于手機信令數(shù)據(jù)的居民出行 方式綜合判別的方法。
【背景技術】
[0002] 居民出行信息在交通規(guī)劃、交通控制管理等方面起著至關重要的作用,它揭示了 城市土地利用、商業(yè)活動、人文風俗、公交線網(wǎng)管理的規(guī)律,被廣泛的應用于城市綜合交通 規(guī)劃、智能交通系統(tǒng)等領域。但是現(xiàn)有居民出行調(diào)查均按照美國交通工程師協(xié)會、歐洲運輸 協(xié)會、我國交通運輸管理部門或行業(yè)協(xié)會的認可的問卷調(diào)查、電話詢問等方法,這些傳統(tǒng)方 法一般存在成本高、工作量大、數(shù)據(jù)處理周期長、內(nèi)容主觀性強、數(shù)據(jù)不精確等問題。隨著手 機用戶的急劇擴大、使用成本的大幅度下降,讓利用手機移動數(shù)據(jù)進行數(shù)據(jù)挖掘,提取獲得 精確完整的居民出行信息成為可能。在手機移動數(shù)據(jù)挖掘中,如何識別用戶在什么階段采 用了那種出行方式,是現(xiàn)在研究的重難點之所在。
[0003] 與本發(fā)明相關的現(xiàn)有技術一
[0004] 現(xiàn)有技術一的技術方案
[0005] 發(fā)明專利:基于AGPS技術的交通出行方式識別方法
[0006] 申請人:北京交通大學
[0007] 發(fā)明人:錢大琳羅藝閆彭李珊珊李成華董倩
[0008] 現(xiàn)有技術一的缺點
[0009] 1.數(shù)據(jù)源為來自手機中GPS模塊提供的手機狀態(tài)信息數(shù)據(jù)。且對于手機GPS信號 具有嚴格的要求。滿足要求的才能夠進行出行方式的識別,否則無法識別。
[0010] 2.出行方式識別方法是通過BP神經(jīng)網(wǎng)絡,需要大量的樣本進行訓練,然后才能利 用訓練好的模型進行出行方式識別。算法復雜、運算量太大,不易推廣。
[0011] 3.識別的出行方式為步行、公交車、小汽車,對于軌道交通無法進行有效識別。
[0012] 與本發(fā)明相關的現(xiàn)有技術二
[0013] 現(xiàn)有技術二的技術方案
[0014] 發(fā)明專利:一種基于手機信號數(shù)據(jù)的出行方式識別方法
[0015] 申請人:上海美惠軟件有限公司
[0016] 發(fā)明人:孫立光陳明威裘煒毅邱志軍劉勝平冉斌
[0017] 現(xiàn)有技術二的缺點
[0018] 1.數(shù)據(jù)源為手機網(wǎng)絡信號。
[0019] 2.識別的出行方式為軌道交通、地面公交、私人機動車、自行車與步行,但是缺乏 出租車與電動車的識別。
[0020] 與本發(fā)明相關的現(xiàn)有技術三
[0021] 現(xiàn)有技術三的技術方案
[0022] 發(fā)明專利:一種基于智能手機的道路出行方式判別方法及系統(tǒng)
[0023] 申請人:中國航天系統(tǒng)工程有限公司
[0024] 發(fā)明人:王法巖雷利軍王振華萬蔚荊長林景澤濤單雅文聶煒張丹
[0025] 現(xiàn)有技術三的缺點
[0026] 1.數(shù)據(jù)源為具有GPS模塊的手機狀態(tài)信息數(shù)據(jù)
[0027] 2.識別的出行方式為步行、乘車,對于軌道交通等交通方法無法進行識別。
[0028] 與本發(fā)明相關的現(xiàn)有技術四
[0029] 現(xiàn)有技術四的技術方案
[0030] 發(fā)明專利:一種基于手機定位的交通出行模式識別方法
[0031] 申請人:廣州地理研究所
[0032] 發(fā)明人:李勇周捍東
[0033] 現(xiàn)有技術四的缺點
[0034] 1.數(shù)據(jù)源為主動數(shù)據(jù)與被動數(shù)據(jù)。主動數(shù)據(jù)為GPS與AGPS數(shù)據(jù),被動數(shù)據(jù)為基于 移動網(wǎng)絡的定位技術的數(shù)據(jù)。
[0035] 2.識別的出行方式為步行、公交、自駕車/出租車,對于軌道交通等其他出行方式 無法進行識別。
【發(fā)明內(nèi)容】
[0036] 本發(fā)明針對現(xiàn)有技術數(shù)據(jù)源獲取受限于GPS或者網(wǎng)絡信息及判別方法未能反映 軌道交通等信息而提出了一種基于手機信令數(shù)據(jù)的居民出行方式綜合判別的方法。
[0037] 為解決以上問題,本發(fā)明的技術方法是提供一種基于手機信令數(shù)據(jù)的居民出行方 式綜合判別的方法,包括以下步驟:
[0038] 步驟1 :借助現(xiàn)有交通出行方式情況,提取出行方式特征,根據(jù)現(xiàn)有樣本得到出行 方式的先驗概率;
[0039] 步驟2 :獲取某個用戶一次完整出行的手機信令數(shù)據(jù),并通過移動時空路徑的刻 畫與停留點的識別,提取用戶的單一出行方式子鏈;
[0040] 步驟3 :通過出行方式子鏈的平均速度,將出行方式進行初次判別,判別的結(jié)果為 機動車出行或非機動車出行;
[0041] 步驟4 :通過平均速度、出行時長與出行距離三個屬性,對非機動車出行進行判 另IJ,判別的結(jié)果為步行或自行車出行;
[0042] 步驟5 :將屬于機動車出行方式的出行方式子鏈與GIS線網(wǎng)進行匹配,如果出行方 式與GIS軌道交通線網(wǎng)匹配,就判別為軌道交通出行;如果出行方式與GIS公交線網(wǎng)匹配, 就判別為常規(guī)公交出行;如果與GIS軌道交通線網(wǎng)與GIS公交線網(wǎng)都不匹配,就轉(zhuǎn)到步驟 6 ;
[0043] 步驟6 :通過平均速度、最大速度與出行時長三個屬性,對剩下可能的出行方式進 行判別,判別的結(jié)果為電動車、自駕車或出租車。
[0044] 作為優(yōu)選,步驟1包括:
[0045] 1)交通出行方式的提取特征;
[0046] 2)步行與自行車判別的判別屬性的選取;
[0047] 3)步行與自行車先驗概率構(gòu)建;
[0048] 4)電動車、自駕車與出租車判別的判別屬性的選取;
[0049] 5)電動車、自駕車與出租車先驗概率構(gòu)建。
[0050] 作為優(yōu)選,步驟2還包括:
[0051 ] 通過停留點的分割,使得每一條出行方式子鏈只包含一種出行方式。
[0052] 作為優(yōu)選,步驟3具體為:
[0053] 若平均速度小于速度閾值Cvl,則判別為非機動車出行;若平均速度大于等于速度 閾值Cvl,則判別為機動車出行。
[0054] 作為優(yōu)選,步驟4具體包括:
[0055] 根據(jù)步驟1取得的判別步行與自行車的先驗概率,根據(jù)公式p (X I yi) p (yi)對判別 的類別進行計算,并選取類型計算P(Xly1)P(Y1)中的最大項作為判別的出行方式;其中,X 中判別的屬性,這里為平均速度、出行時長與出行距離,y1為判別的類型,這里為步行與自 行車。
[0056] 作為優(yōu)選,步驟6包括:
[0057] 結(jié)合電動車、自駕車與出租車出行的先驗概率,利用公式ρ(χ|7ι)ρ( 7ι)對于判別 的類別進行計算,并選取類型計算P(Xly1)P(Y1)中的最大項作為判別的出行方式;其中,X 中判別的屬性,這里為平均速度、最大速度與出行時長,Y1為判別的類型,這里為電動車、自 駕車與出租車。
[0058] 綜上所述本發(fā)明可以為基于手機信令數(shù)據(jù)的居民出行信息獲取工作增加一個維 度,并且可以實現(xiàn)以下效果:
[0059] 1.本發(fā)明利用的源數(shù)據(jù)為移動網(wǎng)絡運營商提供的、符合國家法律關于個人隱私的 手機信令數(shù)據(jù)。具有獲取方式簡單、獲取成本低、信息樣本大等特點。
[0060] 2.識別方法借助了現(xiàn)有的交通方式的出行特征,不需要過多的樣本進行訓練。算 法簡單、容易實現(xiàn)。
[0061] 3.本發(fā)明識別的出行方式基本包含了城市居民出行的主要方式。即步行、自行車、 常規(guī)公交、電動車、自駕車、出租車與軌道交通。
[0062] 4.對于城市交通規(guī)劃提供數(shù)據(jù)基礎。
[0063] 5.為城市規(guī)劃與建設提供數(shù)據(jù)基礎。
【附圖說明】
[0064] 圖1為本發(fā)明的總流程示意圖;
[0065] 圖2判別方法的貝葉斯決策樹。
【具體實施方式】
[0066] 為使本發(fā)明的目的、技術方案及優(yōu)點更加清楚明白,以下參照附圖并舉實施例,對 本發(fā)明做進一步詳細說明。
[0067] 本發(fā)明的目的是通過移動網(wǎng)絡運營商提供的手機信令數(shù)據(jù)對用戶出行方式進行 判別的方法。其數(shù)據(jù)源是移動網(wǎng)絡運營商提供的手機信令數(shù)據(jù),然后通過數(shù)據(jù)清洗、集成以 及位置換算進行處理。并借助移動時空路徑的刻畫與停留點的識別,通過本發(fā)明的方法對 居民出行方式進行判別。該方法可以實現(xiàn)步行、自行車、常規(guī)公交、電動車、自駕車、出租車 與軌道交通七種常見出行方式的有效判別,從而可以得到居民的出行方式信息,為城市的 專項交通規(guī)劃、綜合交通規(guī)劃與智能交通系統(tǒng)等領域提供數(shù)據(jù)基礎。
[0068] 本發(fā)明中的手機信令數(shù)據(jù)是指,在手機通信過程之中,當發(fā)生打接電話、發(fā)短信、 開關機、跨LAC區(qū)域、按一定間隔刷新時,由手機運營商記錄的手機話單數(shù)據(jù)(CDR)及手機 話務數(shù)據(jù)(TDR)。
[0069] 步驟1助現(xiàn)有交通出行方式情況,提取出行方式特征,根據(jù)現(xiàn)有樣本得到出行方 式的先驗概率。
[0070] 定義X = Ia1, a2......,am}為待判別的出行鏈,而每個a為x的一個判別屬性。C = Iy1, y2……yj為判別的交通出行方式的類型的集合,而每個y為C的一個具體的出行方式。
[0071] 對于步行與自行車的判別過程中:
[0072] X = {:平均速度,出行時長,出行距離},C = {步行,自行車}
[0073] 需要獲得的先驗概率為:
[0074] 表1步行與自行車出行判別先驗概率
CN 105117789 A 說明書 5/9 頁
[0077] 對于電動車、自駕車與出租車的判別過程中:x = {:平均速度,最大速度,出行時 長},C =