本發(fā)明屬于移動通信,具體涉及基于循環(huán)神經(jīng)網(wǎng)絡(luò)的智能蜂窩網(wǎng)絡(luò)流量預(yù)測方法及系統(tǒng)。
背景技術(shù):
1、隨著5g移動通信的發(fā)展和智能化時(shí)代的到來,實(shí)現(xiàn)精準(zhǔn)的蜂窩網(wǎng)絡(luò)流量預(yù)測已經(jīng)成為了通信系統(tǒng)邁向智能化的必經(jīng)之路。蜂窩網(wǎng)絡(luò)流量預(yù)測不僅有利于負(fù)載均衡和網(wǎng)絡(luò)資源的合理分配,還可以輔助移動終端進(jìn)行邊緣計(jì)算和任務(wù)卸載。
2、然而,由于復(fù)雜的外部環(huán)境、動態(tài)移動行為的復(fù)雜性以及網(wǎng)絡(luò)業(yè)務(wù)請求產(chǎn)生的隨機(jī)性,蜂窩網(wǎng)絡(luò)流量預(yù)測任務(wù)困難重重。尤其當(dāng)涉及到城市尺度下的區(qū)域流量預(yù)測時(shí),各個(gè)小區(qū)之間復(fù)雜的時(shí)空依賴使其流量特點(diǎn)更加難以捕捉,尋找能夠聯(lián)合跨域數(shù)據(jù)集對區(qū)域蜂窩網(wǎng)絡(luò)流量進(jìn)行精準(zhǔn)預(yù)測是亟待解決的重要問題。
3、另外,在人工智能的推進(jìn)下,蜂窩網(wǎng)絡(luò)逐步向智能化發(fā)展。越來越多的研究表明,深度學(xué)習(xí)模型在時(shí)間序列的預(yù)測中有著優(yōu)秀的表現(xiàn),將人工智能引入對蜂窩網(wǎng)絡(luò)流量的預(yù)測已經(jīng)成為了研究熱點(diǎn)。
技術(shù)實(shí)現(xiàn)思路
1、針對上述問題,本發(fā)明提出了一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的智能蜂窩網(wǎng)絡(luò)流量預(yù)測方法及系統(tǒng),通過引入一個(gè)基于convlstm(convolutional?long?short?term?memory,卷積長短期記憶網(wǎng)絡(luò))的循環(huán)神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)框架stcnet(spatial-temporal?cross-domainnetwork),以捕捉其在時(shí)空域上的復(fù)雜依賴關(guān)系,并采用多個(gè)輸入網(wǎng)絡(luò),同時(shí)將蜂窩網(wǎng)絡(luò)流量數(shù)據(jù)、跨域數(shù)據(jù)和時(shí)間特征數(shù)據(jù)作為輸入,以同時(shí)提取流量數(shù)據(jù)的自相關(guān)特性以及其與外部影響因素的關(guān)系,進(jìn)行流量預(yù)測。
2、為了實(shí)現(xiàn)以上目的,本發(fā)明采用如下技術(shù)方案:
3、基于循環(huán)神經(jīng)網(wǎng)絡(luò)的智能蜂窩網(wǎng)絡(luò)流量預(yù)測方法,包括以下步驟:
4、s1,建立智能蜂窩網(wǎng)絡(luò)模型;
5、s2,利用所述智能蜂窩網(wǎng)絡(luò)模型,結(jié)合目前城市廣域蜂窩網(wǎng)絡(luò)流量數(shù)據(jù)集,建立蜂窩流量預(yù)測的任務(wù)模型,分析任務(wù)的解決方案,并描述蜂窩流量預(yù)測問題;
6、s3,根據(jù)所述蜂窩流量預(yù)測問題,提出蜂窩流量數(shù)據(jù)和跨域數(shù)據(jù)集,并進(jìn)行相關(guān)性分析;
7、s4,根據(jù)步驟s3的問題分析結(jié)果,建立stcnet預(yù)測算法模型,在城市尺度上對區(qū)域流量進(jìn)行預(yù)測;
8、s5,對stcnet預(yù)測算法模型做出改進(jìn),探索遷移學(xué)習(xí)策略,并實(shí)現(xiàn)對流量的最佳預(yù)測;
9、s6,對所述最佳預(yù)測的預(yù)測誤差進(jìn)行評估。
10、作為優(yōu)選,步驟s1中,所述智能蜂窩網(wǎng)絡(luò)模型包括數(shù)據(jù)中心、云服務(wù)器、智能基站、智能無人機(jī)和用戶;其中,所述云服務(wù)器用于提供云計(jì)算服務(wù);所述數(shù)據(jù)中心用于收集并存儲蜂窩流量和跨域信息數(shù)據(jù);所述智能基站構(gòu)成網(wǎng)鏈路建立的基本單元;所述智能無人機(jī)根據(jù)實(shí)時(shí)情況被分配到任務(wù)卸載和邊緣計(jì)算任務(wù)中。
11、作為優(yōu)選,步驟s2具體包括如下步驟:
12、s21,對于給定 t個(gè)時(shí)間間隔中觀察到全網(wǎng)范圍內(nèi)的移動流量數(shù)據(jù),對應(yīng)設(shè)定表示為的時(shí)空序列,其中 d是 t時(shí)刻以 x*y網(wǎng)格表示的地理區(qū)域中移動流量數(shù)據(jù),即:
13、(1);
14、其中,表示具有坐標(biāo)( x, y)網(wǎng)格中的數(shù)據(jù)流量;
15、s22,將簡單的使用時(shí)空序列算法進(jìn)行蜂窩網(wǎng)絡(luò)流量預(yù)測的問題,建模成在給定先前的s個(gè)觀測值的情況下,預(yù)測最可能的 k步數(shù)據(jù)點(diǎn)序列,即:
16、(2);
17、其中,、、分別為預(yù)測的 t、t+k、t-s+1時(shí)刻的數(shù)據(jù)點(diǎn);函數(shù)為時(shí)空序列預(yù)測算法,算法學(xué)習(xí)的參數(shù)為函數(shù)的參數(shù);
18、s23,考慮到蜂窩網(wǎng)絡(luò)流量的產(chǎn)生不僅受時(shí)空因素影響,還受跨域因素影響,對如下三種跨域因素進(jìn)行關(guān)注:
19、基站的分布信息bss、城市興趣點(diǎn)信息poi以及社交活動水平信息。
20、作為優(yōu)選,步驟s3中,所述歷史蜂窩流量數(shù)據(jù)采用的是城市廣域蜂窩網(wǎng)絡(luò)流量數(shù)據(jù)集,具體包括三種類型:流量數(shù)據(jù)internet、呼叫服務(wù)數(shù)據(jù)ca1l和短信服務(wù)數(shù)據(jù)sms;所述歷史蜂窩流量數(shù)據(jù)將選定的城市劃分為設(shè)定的網(wǎng)格數(shù),每個(gè)網(wǎng)格覆蓋相同的城市區(qū)域面積;在每個(gè)樣本中分別記錄每個(gè)網(wǎng)格的id、時(shí)間間隔以及詳細(xì)業(yè)務(wù)記錄;
21、步驟s3中,所述跨域數(shù)據(jù)集包含基站信息,城市興趣點(diǎn)信息以及社交活動水平信息;所述基站信息涵蓋多種與基站相關(guān)的信息,包括基站的具體位置、移動國家代碼以及每個(gè)基站的覆蓋范圍;所述城市興趣點(diǎn)信息包括13種興趣點(diǎn),且每個(gè)類別的詳細(xì)描述跟每個(gè)類別的編號加在一起形成最終的表示;所述社交活動水平信息獲得的數(shù)據(jù)包含用戶在使用twitter軟件時(shí)生成的信息,用于反映用戶對網(wǎng)絡(luò)服務(wù)的總體需求程度。
22、作為優(yōu)選,步驟s4中,所述stcnet預(yù)測算法模型包括如下兩部分:
23、基于多個(gè)convlstm的建模與特征學(xué)習(xí)部分和基于密集連接卷積神經(jīng)網(wǎng)絡(luò)densnet的預(yù)測部分;
24、步驟s4具體包括如下步驟:
25、s41,所述基于多個(gè)convlstm的建模與特征學(xué)習(xí)部分包括三種網(wǎng)絡(luò)模型,每種網(wǎng)絡(luò)模型分別接收蜂窩網(wǎng)絡(luò)流量數(shù)據(jù)、時(shí)間特征數(shù)據(jù)和跨域數(shù)據(jù);stcnet預(yù)測算法模型在處理輸入任務(wù)時(shí),采用三種網(wǎng)絡(luò)模型組合的結(jié)構(gòu),每個(gè)網(wǎng)絡(luò)模型分別對不同的輸入數(shù)據(jù)進(jìn)行特征學(xué)習(xí);將三種網(wǎng)絡(luò)模型的初步特征輸出按照指定維度拼接,作為密集連接卷積神經(jīng)網(wǎng)絡(luò)densnet的輸入,densnet的輸出即為最終的預(yù)測值;
26、s42,拼接特征學(xué)習(xí):構(gòu)建時(shí)空卷積網(wǎng)絡(luò)stcnet,通過密集卷積的方式有效提取蜂窩網(wǎng)絡(luò)流量數(shù)據(jù)的復(fù)雜特征。
27、作為優(yōu)選,步驟s41包括如下步驟:
28、s411,進(jìn)行時(shí)空相關(guān)性模型構(gòu)建,用于接收蜂窩網(wǎng)絡(luò)流量數(shù)據(jù);采用convlstm的兩層網(wǎng)絡(luò)進(jìn)行時(shí)空建模;convlstm的輸出表示為:
29、(3);
30、其中,?h代表隱狀態(tài),f代表遺忘門,w表示需要學(xué)習(xí)的權(quán)重,r表示觀察到的特征域;
31、s412,進(jìn)行時(shí)間特征信息嵌入模型構(gòu)建,用于接受蜂窩網(wǎng)絡(luò)流量的日期和時(shí)間間隔信息;采用兩層線性神經(jīng)網(wǎng)絡(luò)進(jìn)行建模,并處理對應(yīng)的特征向量,具體處理過程如下:
32、提取日期時(shí)間的四個(gè)特征,包括星期幾、當(dāng)天時(shí)間、是否工作日和是否周末;將四個(gè)數(shù)據(jù)編碼后形成特征向量 m;將所述特征向量 m送入一個(gè)兩層的全連接神經(jīng)網(wǎng)絡(luò)中進(jìn)行嵌入學(xué)習(xí),以進(jìn)行特征融合;在經(jīng)過全連接神經(jīng)網(wǎng)絡(luò)后, m的具體計(jì)算過程如下:
33、(4);
34、其中,和是神經(jīng)網(wǎng)絡(luò)中需要學(xué)習(xí)的權(quán)重和偏置, l=1,2,表示第 l層網(wǎng)絡(luò);表示采用sigmoid函數(shù)作為激活函數(shù),為特征向量m的輸出;
35、最后再次使用reshape函數(shù),最終顯示特征嵌入的輸出為:
36、(5);
37、s413,進(jìn)行跨域數(shù)據(jù)模型構(gòu)建,用于接受跨域數(shù)據(jù)信息;所述跨域數(shù)據(jù)模型主體包括兩層卷積神經(jīng)網(wǎng)絡(luò);將基站數(shù)據(jù)、興趣點(diǎn)數(shù)據(jù)以及社交活動數(shù)據(jù),按照各自的特定維度進(jìn)行拼接,形成一個(gè)全新的數(shù)據(jù)張量;隨后將整合后的數(shù)據(jù)張量輸入到卷積神經(jīng)網(wǎng)絡(luò)中,通過卷積操作和非線性變換,提取出跨域數(shù)據(jù)的初步特征;所述初步特征將作為后續(xù)預(yù)測模型的重要輸入,具體公式如下:
38、(6);
39、(7);
40、其中,表示拼接操作,是需要學(xué)習(xí)的參數(shù);是由正則化、激活函數(shù)及卷積操作組成的復(fù)合函數(shù);是基站的流量數(shù)據(jù),是城市興趣點(diǎn)流量數(shù)據(jù),是社交活動水平的流量數(shù)據(jù)。
41、作為優(yōu)選,步驟s42包括如下步驟:
42、s421,將步驟s41中時(shí)空相關(guān)性模型、時(shí)間特征信息嵌入模型和跨域數(shù)據(jù)模型輸出的初步特征輸出拼接,得到初步特征融合后的統(tǒng)一表示,具體公式如下:
43、(8);
44、s422,將拼接后的特征輸入進(jìn)一個(gè)密集神經(jīng)卷積神經(jīng)網(wǎng)絡(luò)中;所述密集卷積神經(jīng)網(wǎng)絡(luò)由 l層組成,每層通過一個(gè)復(fù)合函數(shù)進(jìn)行特征變換;所述復(fù)合函數(shù)由批正則化、激活函數(shù)和卷積操作復(fù)合而成;
45、s423,考慮到密集卷積神經(jīng)網(wǎng)絡(luò)中每一層的輸入都包含了之前所有層的輸出,因此設(shè)定第 l層的輸出表示為:
46、(9);
47、最終在第l層產(chǎn)生一個(gè)高度抽象的特征表示;所述特征表示被送入一個(gè)激活函數(shù),以產(chǎn)生最終的預(yù)測結(jié)果;
48、s424,定義優(yōu)化目標(biāo)為最小化預(yù)測值與真實(shí)值y之間的frobenius范數(shù),用于訓(xùn)練stcnet:
49、(10);
50、其中,表示stcnet中需要優(yōu)化的參數(shù)集合。
51、作為優(yōu)選,步驟s5具體包括如下過程:
52、s51,選取基于區(qū)域聚類遷移學(xué)習(xí)策略,用于提升模型的預(yù)測性能;考慮到不同區(qū)域的蜂窩網(wǎng)絡(luò)流量數(shù)據(jù)之間具有一定相關(guān)性,將蜂窩區(qū)域業(yè)務(wù)相近的區(qū)域劃分為同族,并對不同族中的區(qū)域采用不同參數(shù)的模型進(jìn)行優(yōu)化;
53、s52,采用譜聚類算法對區(qū)域進(jìn)行分族,以在聚類的同時(shí)保持小區(qū)的空間位置,具體如下:
54、將蜂窩網(wǎng)絡(luò)流量數(shù)據(jù)集與跨域數(shù)據(jù)集、、相結(jié)合,形成一個(gè)整體特征表示d作為城市中所有區(qū)域的數(shù)據(jù)表示;
55、s53,將整個(gè)區(qū)域建模成為一個(gè)圖,則每個(gè)小區(qū)成為圖中的節(jié)點(diǎn),由小區(qū)之間是否相接來確定邊的信息;根據(jù)頂點(diǎn)和邊的關(guān)系,計(jì)算得出相應(yīng)的鄰接矩陣 a,而鄰接矩陣 a對應(yīng)的梯度就是組成的蜂窩網(wǎng)絡(luò)流量數(shù)據(jù)集和跨域數(shù)據(jù)集的整體特征表示d;隨后,構(gòu)造拉普拉斯矩陣l如下:
56、(11);
57、其中, p是一個(gè)對角矩陣, p中的元素代表 a的第 i行的和;隨后,得出拉普拉斯矩陣l的 k個(gè)最大特征向量,并在堆疊成列后得到矩陣;
58、s54,根據(jù)對步驟s53中獲得的矩陣x進(jìn)行計(jì)算,得到每個(gè)小區(qū)對應(yīng)的聚類標(biāo)簽;
59、s55,將stcnet在第一個(gè)族中進(jìn)行訓(xùn)練,并保存在對應(yīng)族群中訓(xùn)練得出的模型參數(shù);
60、s56,使用步驟s55輸出的模型參數(shù),對第二個(gè)類別上的訓(xùn)練模型進(jìn)行網(wǎng)絡(luò)參數(shù)初始化,并繼續(xù)訓(xùn)練;循環(huán)重復(fù),直至完成對 k類數(shù)據(jù)的學(xué)習(xí)。
61、作為優(yōu)選,步驟s6具體包括如下過程:
62、s61,選取三種經(jīng)典標(biāo)準(zhǔn)對預(yù)測誤差進(jìn)行評估,包括均分根誤差 rmse,平均絕對誤差 mae以及決定系數(shù)r2;在預(yù)測結(jié)果的評估中, rmse和 mae的值越小,表示stcnet預(yù)測算法模型的性能越好;而r2的值越接近1,說明stcnet預(yù)測算法模型的擬合效果越好,性能越優(yōu)。
63、本發(fā)明還公開了基于循環(huán)神經(jīng)網(wǎng)絡(luò)的智能蜂窩網(wǎng)絡(luò)流量預(yù)測系統(tǒng),包括以下模塊:
64、初始智能蜂窩網(wǎng)絡(luò)模型模塊,用于根據(jù)數(shù)據(jù)流量分布及網(wǎng)絡(luò)系統(tǒng)組件關(guān)系,構(gòu)建初始智能蜂窩網(wǎng)絡(luò)模型;
65、蜂窩流量預(yù)測的任務(wù)模型分析模塊,用于建立蜂窩流量預(yù)測的任務(wù)模型,分析任務(wù)的解決方案;
66、流量數(shù)據(jù)分析模塊,用于分析歷史蜂窩流量數(shù)據(jù)和跨域數(shù)據(jù)集;
67、stcnet算法預(yù)測模塊,用于建立stcnet預(yù)測算法模型,在城市尺度上對區(qū)域流量進(jìn)行預(yù)測;
68、stcnet改進(jìn)及遷移學(xué)習(xí)模塊,用于對stcnet做出改進(jìn),考慮結(jié)合遷移學(xué)習(xí)策略;
69、預(yù)測誤差評估模塊,用于對預(yù)測結(jié)果產(chǎn)生的誤差進(jìn)行評估。
70、本發(fā)明相對于現(xiàn)有技術(shù),具有如下技術(shù)效果:
71、(1)本發(fā)明使用時(shí)空跨域神經(jīng)網(wǎng)絡(luò)stcnet進(jìn)行跨域蜂窩網(wǎng)絡(luò)流量預(yù)測,巧妙的結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)和長短時(shí)神經(jīng)網(wǎng)絡(luò)的特性使用convlstm進(jìn)行時(shí)空建模,同時(shí)使用線性層捕獲蜂窩網(wǎng)絡(luò)流量數(shù)據(jù)的時(shí)間特性,使用特征拼接方法捕獲跨域數(shù)據(jù)的特征以進(jìn)行輔助預(yù)測;
72、(2)本發(fā)明拓展不同業(yè)務(wù)間的遷移學(xué)習(xí),避免不同地區(qū)的地區(qū)分異因素耦合到一起造成的數(shù)據(jù)繁瑣復(fù)雜,提高流量預(yù)測的準(zhǔn)確率。