一種基于手機(jī)數(shù)據(jù)的城市人群分布動(dòng)態(tài)感知方法
【專利摘要】本發(fā)明公開(kāi)了一種基于手機(jī)數(shù)據(jù)的城市人群分布動(dòng)態(tài)感知方法,基于手機(jī)數(shù)據(jù)預(yù)測(cè)手機(jī)用戶的家小區(qū),采用線性回歸得到表征人群密度與手機(jī)用戶數(shù)關(guān)系的方程,標(biāo)定回歸方程中的待定參數(shù)值,得到表征區(qū)域人群密度與區(qū)域手機(jī)用戶密度的相關(guān)關(guān)系,進(jìn)而完成人群分布感知。本發(fā)明的技術(shù)效果在于,通過(guò)手機(jī)數(shù)據(jù)的人群分布動(dòng)態(tài)感知方法,實(shí)施簡(jiǎn)單,成本低,更利于在其他數(shù)據(jù)信息相對(duì)匱乏的偏遠(yuǎn)地區(qū)展開(kāi);且手機(jī)數(shù)據(jù)時(shí)效性強(qiáng),相較于傳統(tǒng)的人群分布感知方法,基于手機(jī)數(shù)據(jù)的人群分布感知方法能夠動(dòng)態(tài)感知城市人群分布,這為城市管控、城市人群流動(dòng)預(yù)測(cè)等相關(guān)方向的研究提供了基礎(chǔ)。
【專利說(shuō)明】
一種基于手機(jī)數(shù)據(jù)的城市人群分布動(dòng)態(tài)感知方法
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及一種基于手機(jī)數(shù)據(jù)的城市人群分布動(dòng)態(tài)感知方法。
【背景技術(shù)】
[0002]城市人群分布動(dòng)態(tài)感知,是城市重點(diǎn)區(qū)域管控、城市人群流動(dòng)預(yù)測(cè)等相關(guān)方向的研究基礎(chǔ),對(duì)城市突發(fā)事件預(yù)警、城市交通管控、城市公共資源配置等方面都有著重大意義。傳統(tǒng)的城市人群分布感知主要是人口普查方法,耗費(fèi)大量的人力物力資源,調(diào)查周期長(zhǎng),人群分布感知的結(jié)果缺少時(shí)效性;現(xiàn)有的城市人群分布感知方法有依靠遙感衛(wèi)星進(jìn)行感知的方法、使用地理信息系統(tǒng)進(jìn)行建模的方法等。相較于人口普查的方法,現(xiàn)有方法可以實(shí)現(xiàn)較大精度的城市人群分布感知,成本相對(duì)較低。然而,這些方法目前仍存在以下問(wèn)題:
[0003]1、仍需投入較大的成本;
[0004]2、相關(guān)建模數(shù)據(jù),尤其是偏遠(yuǎn)地區(qū)的相關(guān)數(shù)據(jù)仍然缺乏;
[0005]3、方法和模型較復(fù)雜,實(shí)施門(mén)檻高;
[0006]4、無(wú)法實(shí)現(xiàn)人群分布的動(dòng)態(tài)感知。
[0007]綜上所述,目前的人群分布感知方法仍然存在不足,多數(shù)人群分布測(cè)量方法技術(shù)較復(fù)雜,實(shí)施難度較高,數(shù)據(jù)獲取較困難。世界許多地區(qū)的人群分布信息時(shí)效性差,更新較慢,甚至缺乏。無(wú)法提高實(shí)現(xiàn)城市人群分布感知的時(shí)間精細(xì)度,達(dá)到動(dòng)態(tài)實(shí)時(shí)感知模式。
【發(fā)明內(nèi)容】
[0008]本發(fā)明提出了一種基于手機(jī)數(shù)據(jù)的、融入手機(jī)市場(chǎng)占有率的城市人群分布動(dòng)態(tài)感知方法,僅通過(guò)使用手機(jī)數(shù)據(jù),便可動(dòng)態(tài)感知城市人群分布,實(shí)施簡(jiǎn)單,成本低,時(shí)效性高,利于在其他數(shù)據(jù)信息相對(duì)匱乏的偏遠(yuǎn)地區(qū)展開(kāi)。
[0009 ]為了實(shí)現(xiàn)上述技術(shù)目的,本發(fā)明的技術(shù)方案是,
[0010]—種基于手機(jī)數(shù)據(jù)的城市人群分布動(dòng)態(tài)感知方法,包括以下步驟:
[0011]步驟一:基于手機(jī)數(shù)據(jù)預(yù)測(cè)手機(jī)用戶的家小區(qū),所述的家小區(qū)指在預(yù)設(shè)時(shí)間區(qū)間內(nèi)手機(jī)用戶信令記錄數(shù)出現(xiàn)最多的小區(qū);
[0012]步驟二:根據(jù)家小區(qū)情況提取手機(jī)信令數(shù)據(jù)記錄和家小區(qū)面積,得到預(yù)設(shè)時(shí)間區(qū)間內(nèi)家小區(qū)中手機(jī)用戶密度;
[0013]步驟三:根據(jù)家小區(qū)的人口普查數(shù)據(jù)和手機(jī)用戶數(shù)量,得到家小區(qū)的手機(jī)市場(chǎng)占有率;
[0014]步驟四:根據(jù)家小區(qū)中手機(jī)用戶密度和家小區(qū)的手機(jī)市場(chǎng)占有率,采用線性回歸得到表征人群密度與手機(jī)用戶數(shù)關(guān)系的方程,標(biāo)定回歸方程中的待定參數(shù)值,得到表征區(qū)域人群密度與區(qū)域手機(jī)用戶密度的相關(guān)關(guān)系;
[0015]步驟五:根據(jù)手機(jī)數(shù)據(jù)信令信息,得到預(yù)設(shè)時(shí)間區(qū)間內(nèi)家小區(qū)手機(jī)用戶數(shù),根據(jù)回歸方程計(jì)算出家小區(qū)預(yù)設(shè)時(shí)間區(qū)間內(nèi)人群密度,進(jìn)而完成預(yù)設(shè)時(shí)間區(qū)間內(nèi)人群分布感知。
[0016]所述的方法,所述的步驟一中,在基于手機(jī)數(shù)據(jù)預(yù)測(cè)手機(jī)用戶的家小區(qū)前,首先處理手機(jī)數(shù)據(jù):僅選取在用于確定家小區(qū)的時(shí)間區(qū)間中至少有一條信令信息的手機(jī)用戶數(shù)據(jù)。
[0017]所述的方法,所述的步驟二中,所述的手機(jī)用戶密度為1/A。,其中N。指家小區(qū)c的夜間手機(jī)用戶數(shù),A。為家小區(qū)c的面積。
[0018]所述的方法,所述的步驟三中,根據(jù)1/AC= RC/UC計(jì)算家小區(qū)c的手機(jī)市場(chǎng)占有率I/λ。,其中R。表示家小區(qū)c的人口普查數(shù)據(jù),U。表示所偵測(cè)到的以家小區(qū)c為家小區(qū)的手機(jī)用戶數(shù)量。
[0019]所述的方法,所述的步驟四中,表征人群密度與手機(jī)用戶數(shù)關(guān)系的回歸方程為P。= α(Οβ,其中σ。為家小區(qū)c預(yù)設(shè)時(shí)間內(nèi)手機(jī)用戶密度,P。表示家小區(qū)c的預(yù)設(shè)時(shí)間人口密度,σ。通過(guò)AcXNc/A。得到,將回歸方程改寫(xiě)為logbcOzloghhPlogl^cXNcyA。),采用線性回歸模型Υ = βο+βιΧ+ε,ε?σ2來(lái)確定參數(shù)βο和參數(shù)0!的值,0Q = log(a),βι = β,數(shù)據(jù)集(Xi,yi)(i = l,2,...,n)中,Xi = log(AcXNi/Ai),yi = log(Pi),最后根據(jù)參數(shù)a和β與參數(shù)之間的關(guān)系得到參數(shù)a和β的值。
[0020]所述的方法,所述的預(yù)設(shè)時(shí)間區(qū)間為晚間時(shí)間窗,即晚上20:00至次日早晨7:00。[0021 ]本發(fā)明的技術(shù)效果在于,通過(guò)手機(jī)數(shù)據(jù)的人群分布動(dòng)態(tài)感知方法,實(shí)施簡(jiǎn)單,成本低,更利于在其他數(shù)據(jù)信息相對(duì)匱乏的偏遠(yuǎn)地區(qū)展開(kāi);且手機(jī)數(shù)據(jù)時(shí)效性強(qiáng),相較于傳統(tǒng)的人群分布感知方法,基于手機(jī)數(shù)據(jù)的人群分布感知方法能夠動(dòng)態(tài)感知城市人群分布,這為城市管控、城市人群流動(dòng)預(yù)測(cè)等相關(guān)方向的研究提供了基礎(chǔ)。
【附圖說(shuō)明】
[0022]圖1為本發(fā)明的流程示意圖;
[0023]圖2(a)為未融入手機(jī)市場(chǎng)占有率因素的夜間人群密度與手機(jī)用戶密度的關(guān)系,(b)為融入手機(jī)市場(chǎng)占有率因素的夜間人群密度與手機(jī)用戶密度的關(guān)系;
[0024]圖3(a)為灣區(qū)人口普查結(jié)果,(b)為灣區(qū)夜間人群分布感知結(jié)果;
[0025]圖4為灣區(qū)白天與夜間的人口相對(duì)差分布圖。
【具體實(shí)施方式】
[0026]下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述,但不作為對(duì)本發(fā)明的限定。
[0027]本實(shí)施例使用美國(guó)舊金山灣區(qū)2010年中連續(xù)的21天、429,595個(gè)手機(jī)用戶、平均每天約有I,200,000條的手機(jī)信令數(shù)據(jù),用以介紹本發(fā)明的【具體實(shí)施方式】。參見(jiàn)圖1,【具體實(shí)施方式】包括以下步驟:
[0028]步驟一:基于手機(jī)數(shù)據(jù)預(yù)測(cè)手機(jī)用戶的家小區(qū)。處理手機(jī)數(shù)據(jù),清洗掉不滿足條件的手機(jī)用戶,預(yù)測(cè)手機(jī)用戶的家小區(qū),所述的家小區(qū)指在晚間時(shí)間窗(20:00-7:00)手機(jī)用戶信令記錄數(shù)出現(xiàn)最多的小區(qū)。因此,在灣區(qū),被選取的手機(jī)用戶在所有21天的20:00到第二天7:00時(shí)間段中需至少有一條信令信息,用于確定其家小區(qū)。我們從中選取了 360,612個(gè)手機(jī)用戶的信令信息來(lái)進(jìn)行人群分布感知的具體實(shí)施;
[0029]步驟二:標(biāo)定參數(shù)值。采用線性回歸的方法,標(biāo)定回歸方程中的待定參數(shù)值,得到表征區(qū)域人群密度與區(qū)域手機(jī)用戶密度的相關(guān)關(guān)系;
[0030]相關(guān)研究表明,人群密度與人群活躍程度存在超線性關(guān)系。最新研究中,常使用非線性方程P。= ^^)^表征人群密度與手機(jī)用戶活躍度的關(guān)系。其中,O。表示C小區(qū)夜間手機(jī)用戶密度,P。表示c小區(qū)的夜間人□密度。研究表明,非線性方程Κ = α(σ。)^著很好的擬合效果。本發(fā)明融入了手機(jī)市場(chǎng)占有率因素,對(duì)原有方法進(jìn)行了改進(jìn),圖,2a展示了未考慮手機(jī)市場(chǎng)占有率因素時(shí)夜間人群密度與手機(jī)用戶密度的關(guān)系,圖2b展示了考慮手機(jī)市場(chǎng)占有率的情況下夜間人群密度與手機(jī)用戶密度的關(guān)系,可見(jiàn),考慮手機(jī)市場(chǎng)占有率因素在本研究中是必要的。具體步驟如下:
[0031]步驟1:根據(jù)步驟一所述的家小區(qū)定義,利用手機(jī)數(shù)據(jù)包含的時(shí)間信息與位置信息提取手機(jī)用戶在家小區(qū)的通訊記錄;
[0032]步驟2:通過(guò)上述手機(jī)信令數(shù)據(jù)記錄和各小區(qū)面積,計(jì)算出夜間手機(jī)用戶密度N。/A。,其中,N。指c小區(qū)夜間手機(jī)用戶數(shù),A。為c小區(qū)的面積;
[0033]步驟3:計(jì)算不同小區(qū)的手機(jī)市場(chǎng)占有率。使用公式l/λ。=!?。/!]。計(jì)算小區(qū)c的手機(jī)市場(chǎng)占有率,其中,R。表示c小區(qū)的人口普查數(shù)據(jù),U。表示所偵測(cè)到的以c小區(qū)為家小區(qū)的手機(jī)用戶數(shù)量。本發(fā)明提出的表征人群密度與手機(jī)用戶活躍度的關(guān)系式即為Ρα = α(?ΧΝ。/AcOe,其中λ。為手機(jī)市場(chǎng)占有率l/λ。的倒數(shù),表示的是以c小區(qū)為家小區(qū)的手機(jī)用戶其擴(kuò)樣系數(shù)值。
[0034]步驟4:標(biāo)定回歸方程中的α值和β值。步驟3中的回歸方程的回歸參數(shù)是非線性的。但將步驟3中的回歸方程改寫(xiě)為1g(Pc) = 1g(Cx)-Plog(AcXNcyAc)的形式,便可將非線性回歸方程轉(zhuǎn)變?yōu)榫€性回歸方程,進(jìn)而求解回歸參數(shù)。采用線性回歸模型Υζβο+βχΧ+ε,ε?σ2來(lái)確定參數(shù)βο和參數(shù)βι的值,0Q = log(a) J1 = P,數(shù)據(jù)集(Xi,yi)(i = l,2,...,n,n = 892)中,乂1 = 1(^(人。\化/^),71 = 1(^(00;參數(shù)枷和參數(shù)01均服從正態(tài)分布,回歸模型的回歸度越高,βο的均值越接近于Oj1的均值越接近I。這里我們使用最常用到的最小二乘法來(lái)解決此線性回歸問(wèn)題。結(jié)果顯示,βο = 0.585,其置信度為95%的置信區(qū)間為(0.563,0.601),? =
0.929,其置信度為95 %的置信區(qū)間為(0.922,0.936),回歸模型相關(guān)系數(shù)R2 = 0.98,均方根誤差rmse = 0.1,說(shuō)明變量X與變量Y有著高度相關(guān)性。根據(jù)參數(shù)a和β與參數(shù)βο和0!之間的關(guān)系,我們可以計(jì)算出,0 = 3.848,0 = 0.929;
[0035]步驟三:感知區(qū)域夜間人群分布。根據(jù)手機(jī)數(shù)據(jù)信令信息,我們可以得到任一小區(qū)夜間手機(jī)用戶數(shù)N,由步驟二步驟4中表征人群密度與手機(jī)用戶數(shù)關(guān)系方程,我們便可以計(jì)算出任一小區(qū)夜間人群密度,進(jìn)而完成灣區(qū)夜間人群分布感知;
[0036]如圖3所示。圖3a展示了根據(jù)灣區(qū)人口普查數(shù)據(jù)繪制的灣區(qū)人群密度分布圖,用以表征灣區(qū)夜間人群分布。用作基礎(chǔ)數(shù)據(jù)。圖3b為基于手機(jī)數(shù)據(jù)的灣區(qū)夜間人群密度分布感知結(jié)果,可以看出,基于本文提出的城市人群分布感知方法所得到的灣區(qū)夜間人群密度感知結(jié)果和人口普查結(jié)果一致性很高。
[0037]步驟四:城市人群分布動(dòng)態(tài)感知。手機(jī)數(shù)據(jù)數(shù)量大,獲取速度快,采集途徑簡(jiǎn)單,具有即時(shí)性,高效性等優(yōu)點(diǎn)。這些特征為動(dòng)態(tài)感知城市人群分布提供了可能。當(dāng)手機(jī)信令被記錄時(shí),其觸發(fā)時(shí)間戳亦被記錄下來(lái),這是時(shí)序動(dòng)態(tài)研究的基礎(chǔ)。不同于傳統(tǒng)的人口普查方式等所獲取的人群分布數(shù)據(jù),基于包含時(shí)間戳的手機(jī)數(shù)據(jù),我們可以研究白天和夜間,周末與周中,夏季與秋季等不同時(shí)間段城市人群分布的差異,動(dòng)態(tài)地了解和認(rèn)識(shí)城市人群分布和流動(dòng)規(guī)律。
[0038]由于所研究數(shù)據(jù)限制(時(shí)間戳未記錄日期),本實(shí)施方案介紹僅探究白天與夜間灣區(qū)人群密度分布的相對(duì)差,以展示基于手機(jī)數(shù)據(jù)的城市人群分布感知方法在動(dòng)態(tài)感知上的可行性。
[0039]我們將21天的手機(jī)信令數(shù)據(jù)劃分為白天部分(7:00—20:00)和夜間部分(20:00—7:00),以此展開(kāi)白天與夜間灣區(qū)動(dòng)態(tài)人群分布研究。步驟二步驟4中的公式作為兩個(gè)時(shí)段的人群密度計(jì)算式,0和0均采用上文中的線性回歸最優(yōu)擬合值(即,α = 3.848,β = 0.929)。
[0040]我們計(jì)算了白天與夜間灣區(qū)人群分布密度相對(duì)差。如圖4所示??梢钥闯雒黠@的空間分布特征差異,白天人群密度較大的小區(qū)基本沿高速路分布,和前人研究結(jié)果相一致。研究時(shí)間變化對(duì)城市人群空間分布的影響,對(duì)城市人群聚集區(qū)域管控、交通規(guī)劃等具有重要意義。
【主權(quán)項(xiàng)】
1.一種基于手機(jī)數(shù)據(jù)的城市人群分布動(dòng)態(tài)感知方法,其特征在于,包括以下步驟: 步驟一:基于手機(jī)數(shù)據(jù)預(yù)測(cè)手機(jī)用戶的家小區(qū),所述的家小區(qū)指在預(yù)設(shè)時(shí)間區(qū)間內(nèi)手機(jī)用戶信令記錄數(shù)出現(xiàn)最多的小區(qū); 步驟二:根據(jù)家小區(qū)情況提取手機(jī)信令數(shù)據(jù)記錄和家小區(qū)面積,得到預(yù)設(shè)時(shí)間區(qū)間內(nèi)豕小區(qū)中手機(jī)用戶當(dāng)度; 步驟三:根據(jù)家小區(qū)的人口普查數(shù)據(jù)和手機(jī)用戶數(shù)量,得到家小區(qū)的手機(jī)市場(chǎng)占有率;步驟四:根據(jù)家小區(qū)中手機(jī)用戶密度和家小區(qū)的手機(jī)市場(chǎng)占有率,采用線性回歸得到表征人群密度與手機(jī)用戶數(shù)關(guān)系的方程,標(biāo)定回歸方程中的待定參數(shù)值,得到表征區(qū)域人群密度與區(qū)域手機(jī)用戶密度的相關(guān)關(guān)系; 步驟五:根據(jù)手機(jī)數(shù)據(jù)信令信息,得到預(yù)設(shè)時(shí)間區(qū)間內(nèi)家小區(qū)手機(jī)用戶數(shù),根據(jù)回歸方程計(jì)算出家小區(qū)預(yù)設(shè)時(shí)間區(qū)間內(nèi)人群密度,進(jìn)而完成預(yù)設(shè)時(shí)間區(qū)間內(nèi)人群分布感知。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的步驟一中,在基于手機(jī)數(shù)據(jù)預(yù)測(cè)手機(jī)用戶的家小區(qū)前,首先處理手機(jī)數(shù)據(jù):僅選取在用于確定家小區(qū)的時(shí)間區(qū)間中至少有一條信令信息的手機(jī)用戶數(shù)據(jù)。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的步驟二中,所述的手機(jī)用戶密度為K/A。,其中N。指家小區(qū)c的夜間手機(jī)用戶數(shù),A。為家小區(qū)c的面積。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述的步驟三中,根據(jù)1/%= R。/!]。計(jì)算家小區(qū)c的手機(jī)市場(chǎng)占有率l/λ。,其中R。表示家小區(qū)c的人口普查數(shù)據(jù),U。表示所偵測(cè)到的以家小區(qū)c為家小區(qū)的手機(jī)用戶數(shù)量。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述的步驟四中,表征人群密度與手機(jī)用戶數(shù)關(guān)系的回歸方程為Pc^c^c/,其中O。為家小區(qū)c預(yù)設(shè)時(shí)間內(nèi)手機(jī)用戶密度,P。表示家小區(qū)C的預(yù)設(shè)時(shí)間人口密度,O。通過(guò)AcXNc/A。得到,將回歸方程改寫(xiě)為log(p。)= log(a)+01og(入。\化/^),采用線性回歸模型¥ =枷+|^+6,£?02來(lái)確定參數(shù)0()和參數(shù)01的值氺()=1呢(α),βι = β,數(shù)據(jù)集(xi,yi)(i = l,2,...,n)中,Xi = log(>cXNi/Ai),yi = 1g(Pi),最后根據(jù)參數(shù)a和β與參數(shù)βο和βι之間的關(guān)系得到參數(shù)a和β的值。6.根據(jù)權(quán)利要求1-5任一所述的方法,其特征在于,所述的預(yù)設(shè)時(shí)間區(qū)間為晚間時(shí)間窗,即晚上20:00至次日早晨7:00。
【文檔編號(hào)】H04W4/02GK106060776SQ201610373565
【公開(kāi)日】2016年10月26日
【申請(qǐng)日】2016年5月31日
【發(fā)明人】王璞, 徐仲之, 曲迎春
【申請(qǐng)人】中南大學(xué)