本發(fā)明涉及以公共交通為導(dǎo)向型(TOD)城市發(fā)展模式領(lǐng)域,尤其涉及一種基于城市數(shù)據(jù)的TOD城市區(qū)域劃分與挖掘方法。
背景技術(shù):
TOD城市發(fā)展模式已經(jīng)成為解決城市可持續(xù)發(fā)展的一種可能方案,該種發(fā)展模式可重塑城市發(fā)展的形態(tài),提升其品質(zhì),緩解城市面臨的諸多問題。要想進(jìn)行TOD型城市的建設(shè),首要的問題便是合理劃分區(qū)域,接著便是要選擇最有價(jià)值的區(qū)域作為TOD區(qū)域進(jìn)行相應(yīng)的開發(fā)。本發(fā)明將利用公共交通站點(diǎn)數(shù)據(jù)來確定區(qū)域中心和邊界方法,之后利用公共交通路線來挖掘TOD區(qū)域。但現(xiàn)有的技術(shù)中,往往是根據(jù)經(jīng)緯度直接將區(qū)域進(jìn)行劃分,或者根據(jù)路網(wǎng)數(shù)據(jù)來進(jìn)行區(qū)域劃分,而這些并不能很好的體現(xiàn)公共交通中心,不利于城市圍繞公共交通進(jìn)行發(fā)展。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的主要針對上述現(xiàn)有研究的一些不足之處,提出一種數(shù)據(jù)驅(qū)動(dòng)的公共交通導(dǎo)向型城市區(qū)域劃分與挖掘方法,通過對公共交通站點(diǎn)數(shù)據(jù)處理,來確定區(qū)域中心和區(qū)域邊界,利用公共交通路線數(shù)據(jù),來挖掘出TOD區(qū)域,為城市發(fā)展規(guī)劃提供有效信息。
本發(fā)明是通過以下技術(shù)方案達(dá)到上述目的,一種數(shù)據(jù)驅(qū)動(dòng)的公共交通導(dǎo)向型城市區(qū)域劃分與挖掘方法,其包括如下步驟:
1)對于距離小于d的公共交通站點(diǎn),建立一條邊,得到公共交通網(wǎng)絡(luò),d為預(yù)先設(shè)置的閾值。
2)根據(jù)1)中的公共交通網(wǎng)絡(luò),提取出各個(gè)連通分量中的點(diǎn)集S,加入到點(diǎn)集S的集合T中。
3)對于每個(gè)點(diǎn)集檢查是否符合期望。不符合做調(diào)整。
4)計(jì)算每個(gè)點(diǎn)集中的中心,得到區(qū)域中心。
5)根據(jù)4)中的區(qū)域中心,區(qū)域中的的點(diǎn)屬于距離最近的區(qū)域中心,得到區(qū)域邊界。
6)利用公共交通路線數(shù)據(jù)在區(qū)域之間建邊,得到區(qū)域網(wǎng)絡(luò)。
7)根據(jù)6)中的區(qū)域網(wǎng)絡(luò),來計(jì)算區(qū)域排名。
8)輸出前N個(gè)區(qū)域作為TOD區(qū)域。
步驟1)具體步驟:
將每一個(gè)站點(diǎn)作為一個(gè)節(jié)點(diǎn),對于任意兩個(gè)距離小于d的站點(diǎn)建立一條邊,則整個(gè)公共交通網(wǎng)絡(luò)中會(huì)形成多個(gè)連通分量。
步驟2)具體步驟:
遍歷圖中的每一個(gè)連通分量,每次遍歷新的連通分量的時(shí)候,生成空集合S,將遍歷的節(jié)點(diǎn)加入到集合S,該連通分量遍歷結(jié)束的時(shí)候,將集合S加入集合的集合T中。
步驟3)對于每個(gè)點(diǎn)集檢查是否符合期望。不符合做調(diào)整。包括以下步驟:
3.1)針對每個(gè)集合中的節(jié)點(diǎn),如果存在兩個(gè)節(jié)點(diǎn)之間的距離大于2d,則可認(rèn)為該集合中的節(jié)點(diǎn),至少能分成兩個(gè)集合,則執(zhí)行3.2);如果均不存在,則可認(rèn)為每個(gè)集合中的所有節(jié)點(diǎn)離其中心位置都不超過d,則點(diǎn)集符合期望,執(zhí)行步驟4)
3.2)將該集合中距離最遠(yuǎn)的兩個(gè)節(jié)點(diǎn)作為k-means算法中初始化的質(zhì)心,然后在該集合中執(zhí)行k-means算法,形成兩個(gè)簇。
3.3)刪除原先的點(diǎn)集合,將兩個(gè)簇當(dāng)成新生成的點(diǎn)集加入T中,繼續(xù)檢查新的集合。
步驟4)計(jì)算每個(gè)點(diǎn)集中中心的公式:
其中n為區(qū)域中的節(jié)點(diǎn)數(shù)量,lat(i)為第i個(gè)節(jié)點(diǎn)的緯度,lng(i)為第i個(gè)節(jié)點(diǎn)的經(jīng)度。lng(center)和lat(center)即為得到的中心的位置。
步驟5)得到區(qū)域邊界的公式:
我們將從基于連通分量的聚類算法中獲得的R個(gè)聚合站點(diǎn)(即候選中心)P={p1,p2,...,pR}作為種子,將整個(gè)研究區(qū)域X進(jìn)行Voronoi劃分,從而形成R個(gè)不相交的Voronoi多邊形,一個(gè)多邊形就是一個(gè)以聚合站點(diǎn)pi為中心的TOD候選發(fā)展區(qū)域ri,正式定義如公式所下。
ri={x∈X|D(x,pi)≤D(x,pj),i,j={1,2,...,R},i≠j}
在上式公式中,我們使用歐幾里得度量作為其中的距離函數(shù)D。
步驟6)利用公共交通路線數(shù)據(jù)在區(qū)域之間建邊,得到區(qū)域網(wǎng)絡(luò)具體步驟:
我們賦予每條地鐵線的質(zhì)量為wk,快速公交線的質(zhì)量為wn,普通公交線的質(zhì)量為wm,并且數(shù)值依次降低,然后將所有路線的連續(xù)兩站的區(qū)域,作為兩個(gè)節(jié)點(diǎn),建立一條相應(yīng)權(quán)值的邊,若路線的連續(xù)兩站在同一區(qū)域,則忽略。
步驟7)計(jì)算區(qū)域排名具體步驟:
我們將基于隨機(jī)游走模型的PageRank算法應(yīng)用在區(qū)域關(guān)系網(wǎng)絡(luò)中,作為計(jì)算區(qū)域重要性的基礎(chǔ)。
7.1)給定所有R個(gè)區(qū)域(即節(jié)點(diǎn))的RandomWalk值(簡稱RW值)RWi(0),并且滿足
7.2)迭代進(jìn)行計(jì)算,計(jì)算第k步的公式如下:
其中,d為阻尼系數(shù),一般取0.85。由si,j所組成的R行R列的矩陣S一般稱為轉(zhuǎn)移矩陣。
7.3)當(dāng)RW(k)–RW(k-1)的絕對值的和不超過閾值W的,停止迭代計(jì)算。
7.2)中轉(zhuǎn)移矩陣的具體定義:
7.2.1)連接重要性:
我們賦予每條地鐵線的質(zhì)量為wk,快速公交線的質(zhì)量為wn,普通公交線的質(zhì)量為wm,并且數(shù)值依次降低。那么,在區(qū)域連接網(wǎng)絡(luò)中,節(jié)點(diǎn)vi和節(jié)點(diǎn)vj的連接重要性w(vi,vj)可由如下公式計(jì)算得出。
w(vi,vj)=mi,jwm+ni,jwn+ki,jwk
7.2.2)轉(zhuǎn)移矩陣:
在確定連接重要性之后,根據(jù)各邊重要性占目標(biāo)節(jié)點(diǎn)出邊總重要性的比例進(jìn)行概率轉(zhuǎn)移,即改進(jìn)后轉(zhuǎn)移矩陣S中的元素si,j根據(jù)如下公式計(jì)算,
其中,w(vi,vj)代表節(jié)點(diǎn)vi和節(jié)點(diǎn)vj之間的連接重要性,可由7.2.1)中公式計(jì)算得出,集合N(vj)是節(jié)點(diǎn)vj鄰居節(jié)點(diǎn)的集合,即與節(jié)點(diǎn)vj相連的節(jié)點(diǎn)。
附圖說明
圖1為本發(fā)明實(shí)施案例提供的一種數(shù)據(jù)驅(qū)動(dòng)的公共交通導(dǎo)向型城市區(qū)域劃分與挖掘方法的流程圖;
圖2為本發(fā)明實(shí)施案例提取出區(qū)域中心的流程圖;
圖3為一種數(shù)據(jù)驅(qū)動(dòng)的公共交通導(dǎo)向型城市區(qū)域劃分與挖掘方法實(shí)施案例利用杭州市公共交通站點(diǎn)數(shù)據(jù)得到的區(qū)域劃分結(jié)果圖;
圖4為一種數(shù)據(jù)驅(qū)動(dòng)的公共交通導(dǎo)向型城市區(qū)域劃分與挖掘方法實(shí)施案例利用杭州市公共交通路線數(shù)據(jù)得到的區(qū)域挖掘結(jié)果圖;
具體實(shí)施方式
本發(fā)明實(shí)施例提供了一種數(shù)據(jù)驅(qū)動(dòng)的公共交通導(dǎo)向型城市區(qū)域劃分與挖掘方法,如圖1所示,該方法包括:
步驟1:利用杭州市公共交通站點(diǎn)數(shù)據(jù)建立公共交通網(wǎng)絡(luò),d值這里取800,對于每一個(gè)點(diǎn)對(u,v),若距離distance(u,v)小于d,則添加邊edge(u,v),最終形成公共交通網(wǎng)絡(luò)。
公共交通線路及站點(diǎn)數(shù)據(jù)如下所示。
本文研究了三種類型的公共交通站點(diǎn)及路線:普通公交、快速公交和地鐵。在我們所獲得的數(shù)據(jù)集中,直接包含了2015年2月杭州市641條普通公交線路的8255個(gè)站點(diǎn),以及14條快速公交線路的446個(gè)站點(diǎn)信息,其格式如表1所示。
表1 公交線路及站點(diǎn)數(shù)據(jù)格式
Tab.1Format of bus dataset
由于該數(shù)據(jù)集中缺少地鐵的相關(guān)信息,而地鐵在TOD發(fā)展中扮演者不可或缺的作用,所以我們手動(dòng)加入杭州1、2、4、5和6號(hào)地鐵線共127個(gè)地鐵站點(diǎn),及其相關(guān)的重要信息,例如,經(jīng)度和緯度。
步驟2:根據(jù)杭州市公共交通網(wǎng)絡(luò),形成點(diǎn)集的集合T。
遍歷圖中的每一個(gè)連通分量,每次遍歷新的連通分量的時(shí)候,生成空集合S,將遍歷的節(jié)點(diǎn)加入到集合S,該連通分量遍歷結(jié)束的時(shí)候,將集合S加入集合的集合T中。
步驟3:對于每個(gè)點(diǎn)集檢查是否符合期望。不符合做調(diào)整。包括以下步驟:
3.1)針對每個(gè)集合中的節(jié)點(diǎn),如果存在兩個(gè)節(jié)點(diǎn)之間的距離大于2d,則可認(rèn)為該集合中的節(jié)點(diǎn),至少能分成兩個(gè)集合,則執(zhí)行3.2);如果均不存在,則可認(rèn)為每個(gè)集合中的所有節(jié)點(diǎn)離其中心位置都不超過d,則點(diǎn)集符合期望,執(zhí)行步驟4)
3.2)將該集合中距離最遠(yuǎn)的兩個(gè)節(jié)點(diǎn)作為k-means算法中初始化的質(zhì)心,然后在該集合中執(zhí)行k-means算法,形成兩個(gè)簇。
3.3)刪除原先的點(diǎn)集合,將兩個(gè)簇當(dāng)成新生成的點(diǎn)集加入T中,繼續(xù)檢查新的集合。
步驟4:根據(jù)每個(gè)點(diǎn)集中中心的公式:
提取出每個(gè)點(diǎn)集的中心。
步驟5:根據(jù)公式ri={x∈X|D(x,pi)≤D(x,pj),i,j={1,2,...,R},i≠j},劃分區(qū)域邊界。
步驟6:利用公共交通路線數(shù)據(jù)在區(qū)域之間建邊,得到區(qū)域網(wǎng)絡(luò)具體步驟:
我們賦予每條地鐵線的質(zhì)量為wk,快速公交線的質(zhì)量為wn,普通公交線的質(zhì)量為wm,并且數(shù)值依次降低,然后將所有路線的連續(xù)兩站的區(qū)域,作為兩個(gè)節(jié)點(diǎn),建立一條相應(yīng)權(quán)值的邊,若路線的連續(xù)兩站在同一區(qū)域,則忽略。這里取wk=1,wn=2,wm=3。
步驟7:計(jì)算區(qū)域排名具體步驟:
我們將基于隨機(jī)游走模型的PageRank算法應(yīng)用在區(qū)域關(guān)系網(wǎng)絡(luò)中,作為計(jì)算區(qū)域重要性的基礎(chǔ)。
7.1)給定所有R個(gè)區(qū)域(即節(jié)點(diǎn))的RandomWalk值(簡稱RW值)RWi(0),并且滿足
7.2)迭代進(jìn)行計(jì)算,計(jì)算第k步的公式如下:
其中,d為阻尼系數(shù),一般取0.85。由si,j所組成的R行R列的矩陣S一般稱為轉(zhuǎn)移矩陣。
7.3)當(dāng)RW(k)–RW(k-1)的絕對值的和不超過閾值W的,停止迭代計(jì)算,這里W取的是所有和不超過10-16。
7.2)中轉(zhuǎn)移矩陣的具體定義:
7.2.1)連接重要性:
我們賦予每條地鐵線的質(zhì)量為wk,快速公交線的質(zhì)量為wn,普通公交線的質(zhì)量為wm,并且數(shù)值依次降低。那么,在區(qū)域連接網(wǎng)絡(luò)中,節(jié)點(diǎn)vi和節(jié)點(diǎn)vj的連接重要性w(vi,vj)可由如下公式計(jì)算得出。
w(vi,vj)=mi,jwm+ni,jwn+ki,jwk
7.2.2)轉(zhuǎn)移矩陣:
在確定連接重要性之后,根據(jù)各邊重要性占目標(biāo)節(jié)點(diǎn)出邊總重要性的比例進(jìn)行概率轉(zhuǎn)移,即改進(jìn)后轉(zhuǎn)移矩陣S中的元素si,j根據(jù)如下公式計(jì)算,
其中,w(vi,vj)代表節(jié)點(diǎn)vi和節(jié)點(diǎn)vj之間的連接重要性,可由7.2.1)中公式計(jì)算得出,集合N(vj)是節(jié)點(diǎn)vj鄰居節(jié)點(diǎn)的集合,即與節(jié)點(diǎn)vj相連的節(jié)點(diǎn)。
步驟8:輸出排名前N個(gè)區(qū)域作為TOD區(qū)域,這里N取50。
圖3是根據(jù)杭州市公共交通站點(diǎn)數(shù)據(jù)得到的區(qū)域劃分結(jié)果。圖3中劃分出的645個(gè)區(qū)域大小適中,位于繁華和偏僻地段的區(qū)域面積相差不大,并且從多邊形的中心和邊界來看,也符合實(shí)際地理狀況,例如圖中的區(qū)域邊界符合錢塘江的走向。從所得實(shí)驗(yàn)結(jié)果可知,我們提出的基于連通分量聚類的區(qū)域劃分方法可以有效解決冗余車站的問題,能夠劃分出合理的區(qū)域,并且也避免了原始聚類算法中K值的確定以及結(jié)果不穩(wěn)定等問題。
圖4是根據(jù)杭州市公共交通路線數(shù)據(jù)得到的區(qū)域挖掘結(jié)果。從圖4中可以看出,基于連接重要性導(dǎo)向的隨機(jī)游走算法可以識(shí)別出城市規(guī)劃中的絕大部分的各級新城,在整體分散的同時(shí)達(dá)到了局部聚集的效果,與實(shí)際更相符。