一種用戶聚集熱點區(qū)域識別方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及城市規(guī)劃管理技術(shù)領(lǐng)域,尤其涉及一種用戶聚集熱點區(qū)域識別方法及 裝置。
【背景技術(shù)】
[0002] 隨著城市經(jīng)濟(jì)和社會的不斷發(fā)展,城市公交規(guī)劃和城建規(guī)劃面臨著很大的難題, 尤其在北京、上海、廣州、深圳等人口逾1000萬的"超大城市";而且人口流動復(fù)雜頻繁,因 此,城市規(guī)劃的相關(guān)部門需要根據(jù)用戶的實際聚集區(qū)域及時、科學(xué)的規(guī)劃相關(guān)的基礎(chǔ)設(shè)施。
[0003] 目前,城市基礎(chǔ)設(shè)施建設(shè)一般是基于城市居民的停留聚集特征來對應(yīng)發(fā)展,而現(xiàn) 有技術(shù)中通常采用無線移動定位技術(shù),例如GPS(Global Positioning System,全球定位系 統(tǒng))來識別城市居民的停留聚集特征。GPS定位技術(shù)是通過綜合多顆衛(wèi)星的數(shù)據(jù)測量用戶到 衛(wèi)星的距離,再利用距離差得出用戶的位置。發(fā)明人在實施本發(fā)明的過程中發(fā)現(xiàn)現(xiàn)有的技 術(shù)方案存在以下缺點:1、獲取測量數(shù)據(jù)的成本高;2、開通GPS定位的用戶數(shù)量相對較少,很 難全面反映整個城市的居民聚集熱點區(qū)域;3、在密集城區(qū),由于周圍遮擋物、干擾源越多, 測量的精度會越低;4、無法接收到室內(nèi)用戶的GPS衛(wèi)星信號。
【發(fā)明內(nèi)容】
[0004] 針對現(xiàn)有技術(shù)存在的問題,本發(fā)明的目的在于提供一種用戶聚集熱點區(qū)域識別方 法及裝置,能夠?qū)崿F(xiàn)實時、高精準(zhǔn)地識別用戶聚集熱點區(qū)域,且分析數(shù)據(jù)獲取方便,成本低 廉,滿足了使用要求。
[0005] 本發(fā)明實施例提供一種用戶聚集熱點區(qū)域識別方法,包括如下步驟:
[0006] 基于獲取到的待識別區(qū)域內(nèi)的每一個用戶在特定時間段內(nèi)的手機(jī)信令數(shù)據(jù),統(tǒng)計 每一所述用戶所經(jīng)過的基站及該用戶在每一所述基站的移動特征;其中,所述移動特征包 括首次出現(xiàn)的時間、出現(xiàn)的次數(shù)、頻率和累計間隔時間;
[0007] 計算每一所述用戶對所述待識別區(qū)域內(nèi)的每一個基站的興趣度,及經(jīng)過同一個基 站的任意兩個用戶的移動特征向量之間的空間距離;其中,所述興趣度為對出現(xiàn)的次數(shù)、頻 率及累計間隔時間分配不同權(quán)重后進(jìn)行加權(quán)平均所得到的值;所述移動特征向量為由所述 移動特征所包含的各變量組成的有序數(shù)組;
[0008] 針對經(jīng)過所述待識別區(qū)域內(nèi)的每一個基站的每一個用戶,統(tǒng)計出與該用戶的移動 特征向量之間的空間距離最近的前K個用戶,并提取所述K個用戶的興趣度最高的前N個基 站,將所述N個基站均作為候選熱點基站;其中,K為正整數(shù),N為正整數(shù);
[0009] 將用戶數(shù)達(dá)到一預(yù)設(shè)的閾值的每一所述候選熱點基站作為一個熱點基站,每一所 述熱點基站所覆蓋的一個區(qū)域為一個用戶聚集熱點區(qū)域;其中,所述預(yù)設(shè)的閾值大于K。
[0010] 作為上述方案的改進(jìn),當(dāng)經(jīng)過所述待識別區(qū)域內(nèi)的某一個基站的用戶的數(shù)量小于 K時,則確定該基站為非熱點基站。
[0011] 作為上述方案的改進(jìn),所述手機(jī)信令數(shù)據(jù)包括用戶手機(jī)ID;
[0012] 每一所述用戶對應(yīng)一個用戶手機(jī)ID。
[0013] 作為上述方案的改進(jìn),假設(shè)所述出現(xiàn)的次數(shù)為a,頻率為b,累計間隔時間為c,則所 述興趣度z = a X qi+b X q2+c X q3;其中,qi+q2+q3 = 1,qi、q2、q3分別為a、b、c的權(quán)重。
[0014] 本發(fā)明實施例還提供一種用戶聚集熱點區(qū)域識別裝置,包括:
[0015] 統(tǒng)計單元,用于基于獲取到的待識別區(qū)域內(nèi)的每一個用戶在特定時間段內(nèi)的手機(jī) 信令數(shù)據(jù),統(tǒng)計每一所述用戶所經(jīng)過的基站及該用戶在每一所述基站的移動特征;所述移 動特征包括首次出現(xiàn)的時間、出現(xiàn)的次數(shù)、頻率和累計間隔時間;
[0016] 計算單元,用于計算每一所述用戶對所述待識別區(qū)域內(nèi)的每一個基站的興趣度, 及經(jīng)過同一個基站的任意兩個用戶的移動特征向量之間的空間距離;其中,所述興趣度為 對出現(xiàn)的次數(shù)、頻率及累計間隔時間分配不同權(quán)重后進(jìn)行加權(quán)平均所得到的值;所述移動 特征向量為由所述移動特征所包含的各變量組成的有序數(shù)組;
[0017] 候選熱點基站獲取單元,用于針對經(jīng)過所述待識別區(qū)域內(nèi)的每一個基站的每一個 用戶,統(tǒng)計出與該用戶的移動特征向量之間的空間距離最近的前K個用戶,并提取所述K個 用戶的興趣度最高的前N個基站,將所述N個基站均作為候選熱點基站;其中,K為正整數(shù),N 為正整數(shù);
[0018] 用戶聚集熱點區(qū)域識別單元,用于將用戶數(shù)達(dá)到一預(yù)設(shè)的閾值的每一所述候選熱 點基站作為一個熱點基站,每一所述熱點基站所覆蓋的一個區(qū)域為一個用戶聚集熱點區(qū) 域;其中,所述預(yù)設(shè)的閾值大于K。
[0019] 作為上述方案的改進(jìn),當(dāng)經(jīng)過所述待識別區(qū)域內(nèi)的某一個基站的用戶的數(shù)量小于 K時,則確定該基站為非熱點基站。
[0020] 作為上述方案的改進(jìn),所述手機(jī)信令數(shù)據(jù)包括用戶手機(jī)ID;
[0021] 每一所述用戶對應(yīng)一個用戶手機(jī)ID。
[0022] 作為上述方案的改進(jìn),假設(shè)所述出現(xiàn)的次數(shù)為a,頻率為b,累計間隔時間為c,則所 述興趣度z = a X qi+b X q2+c X q3;其中,qi+q2+q3 = 1,qi、q2、q3分別為a、b、c的權(quán)重。
[0023] 本發(fā)明實施例提供的用戶聚集熱點區(qū)域識別方法及裝置,具有如下有益效果:基 于通信運營商提供的手機(jī)信令數(shù)據(jù),統(tǒng)計出待識別區(qū)域內(nèi)的每一個用戶在特定時間段內(nèi)經(jīng) 過的基站及該用戶在每一所述基站的移動特征;然后,采用協(xié)同聚類的方法對經(jīng)過所述待 識別區(qū)域內(nèi)的每一個基站的每一個用戶的最具有相似移動特征的前K個用戶進(jìn)行聚類;接 著,采用協(xié)同過濾的方法提取出所述K個用戶的興趣度最高的前N個基站,并將所述N個基站 均作為候選熱點基站;最后,將用戶數(shù)達(dá)到一預(yù)設(shè)的閾值的每一所述候選熱點基站作為一 個熱點基站,每一所述熱點基站所覆蓋的一個區(qū)域為一個用戶聚集熱點區(qū)域。本發(fā)明實施 例利用的源數(shù)據(jù)為通信運營商提供的手機(jī)信令數(shù)據(jù),獲取方式簡單、獲取成本低且信息樣 本大;能夠?qū)崟r、高精準(zhǔn)地識別出用戶聚集熱點區(qū)域,為城市公交規(guī)劃和城建規(guī)劃提供高質(zhì) 量的數(shù)據(jù)分析結(jié)果。
【附圖說明】
[0024] 圖1是本發(fā)明提供的用戶聚集熱點區(qū)域識別方法的一個實施例的流程示意圖。
[0025] 圖2是本發(fā)明提供的用戶聚集熱點區(qū)域識別裝置的一個實施例的流程示意圖。
【具體實施方式】
[0026] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于 本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護(hù)的范圍。
[0027] 請參閱圖1,是本發(fā)明提供的用戶聚集熱點區(qū)域識別方法的一個實施例的流程示 意圖。
[0028] 本發(fā)明提供一種用戶聚集熱點區(qū)域識別方法,包括步驟S11~S14,具體如下:
[0029] S11,基于獲取到的待識別區(qū)域內(nèi)的每一個用戶在特定時間段內(nèi)的手機(jī)信令數(shù)據(jù), 統(tǒng)計每一所述用戶所經(jīng)過的基站及該用戶在每一所述基站的移動特征。
[0030] 其中,所述移動特征包括首次出現(xiàn)的時間、出現(xiàn)的次數(shù)、頻率和累計間隔時間。
[0031] 所述手機(jī)信令數(shù)據(jù)是由通信運營商(比如移動通信運營商)提供、符合國家法律關(guān) 于個人隱私的源數(shù)據(jù),具有獲取方式簡單、獲取成本低、樣本周期靈活、數(shù)量大等特點。它是 指在手機(jī)通信過程中,當(dāng)發(fā)生通話、短信接發(fā)、正常位置更新等通信事件時,由手機(jī)通信運 營商記錄的各類信令數(shù)據(jù)。
[0032] 優(yōu)選的,所述手機(jī)信令數(shù)據(jù)包括用戶手機(jī)ID;本發(fā)明認(rèn)為每一所述用戶對應(yīng)一部 手機(jī)及一個用戶手機(jī)ID。
[0033] 每一所述用戶在移動的過程中,該用戶的手機(jī)總是會定期或不定期地、主動或被 動地和其中一個基站保持聯(lián)系。當(dāng)每一所述用戶的手機(jī)當(dāng)前服務(wù)基站的信號強(qiáng)度減弱,鄰 近基站的信號強(qiáng)度超過所述當(dāng)前服務(wù)基站,則該用戶的手機(jī)信號會切換到所述鄰近基站, 以便獲得更好的信號。在切換的過程中,通信運營商會保留相關(guān)切換記錄。
[0034] 優(yōu)選的,每一所述用戶在每一所述基站的移動特征包括首次出現(xiàn)的時間、出現(xiàn)的 次數(shù)、頻率和累計間隔時間;其中,所述首次出現(xiàn)的時間是指在所述特定時間段內(nèi),該用戶 的手機(jī)信號首次切換到每一所述基站后第一條信令事件的發(fā)生時間;所述出現(xiàn)的次數(shù)是指 在所述特定時間段內(nèi),該用戶的手機(jī)信號切換到每一所述基站的次數(shù);所述頻率是指在所 述特定時間段內(nèi),在該用戶所經(jīng)過的全部所述基站的累計次數(shù)中,經(jīng)過每一所述基站的次 數(shù)所占的比例;所述累計間隔時間是指在所述特定時間段內(nèi),在該用戶經(jīng)過每一所述基站 的次數(shù)中,對相鄰兩次之間的間隔時間進(jìn)行累計相加所得到的時間;其中,所述相鄰兩次之 間的間隔時間是指當(dāng)前次在每一所述基站的最后一條信令事件的發(fā)生時間與下一次切換 到該基站的第一條信令事件的發(fā)生時間之間的間隔時間;所述特定時間段可以為一天、一 個小時、半個小時或任意的一個時間范圍值,這些可根據(jù)實際的需要進(jìn)行設(shè)置,本發(fā)明不做 具體的限制。
[0035] S12,計算每一所述用戶對所述待識別區(qū)域內(nèi)的每一個基站的興趣度,及經(jīng)過同一 個基站的任意兩個用戶的移動特征向量之間的空間距離。
[0036] 其中,所述興趣度為對出現(xiàn)的次數(shù)、頻率及累計間隔時間分配不同權(quán)重后進(jìn)行加 權(quán)平均所得到的值;所述移動特征向量為由所述移動特征所包含的各變量組成的有序數(shù) 組。
[0037] 優(yōu)選的,假設(shè)每一所述用戶在所述待識別區(qū)域內(nèi)的每一個基站出現(xiàn)的次數(shù)為a;在 該用戶所經(jīng)過的全部所述基站的累計次數(shù)中,經(jīng)過所述待識別區(qū)域內(nèi)的每一個基站的次數(shù) 所占的比例為b,以及在該用戶經(jīng)過所述待識別區(qū)域內(nèi)的每一個基站的次數(shù)中,對相鄰兩次 之間的間隔時間進(jìn)行累計相加所得到的時間為C,則該用戶對所述待識別區(qū)域內(nèi)的每一個 基站的興趣度Z = a X qi+b X q2+c X q3;其中,qi+q2+q3 = 1,qi、q2、q3分別為a、b、c的權(quán)重。
[0038] 優(yōu)選的,所述移動特征向量為由所述移動特征所包含的各變量組成的有序數(shù)組, 也就是說,所述移動特征向量為由所述首次出現(xiàn)時間、出現(xiàn)的次數(shù)、頻率和累計間隔時間這 四個變量組成的有序數(shù)組。
[0039] 又假設(shè)每一所述用戶的手機(jī)信號首次切換到所述待識別區(qū)域內(nèi)的每一個基站后 第一條信令事件的發(fā)生時間為t,則經(jīng)過同一個基站的任意兩個用戶的移動特征向量之間
[0040]