基于大數(shù)據(jù)統(tǒng)計(jì)模型的無(wú)線網(wǎng)絡(luò)話務(wù)量預(yù)測(cè)方法
【專利摘要】本發(fā)明公開了一種基于大數(shù)據(jù)統(tǒng)計(jì)模型的無(wú)線網(wǎng)絡(luò)話務(wù)量預(yù)測(cè)方法,在無(wú)線網(wǎng)絡(luò)中給定的一個(gè)小區(qū)中,無(wú)線網(wǎng)絡(luò)話務(wù)量的預(yù)測(cè)可以通過將每一個(gè)話務(wù)測(cè)量值根據(jù)網(wǎng)絡(luò)話務(wù)特征和移動(dòng)用戶行為特征分解為相應(yīng)的趨勢(shì)分量T(t)、季節(jié)性分量S(t)、突發(fā)分量B以及隨機(jī)誤差分量R,對(duì)各自分量的內(nèi)在特征進(jìn)行解析,各自預(yù)測(cè)后,最后通過公式X(t)=(1+B(t))×(T(t)+S(t)+R(t))重新組合還原成整體的預(yù)測(cè)值。本發(fā)明利用大數(shù)據(jù)的真實(shí)樣本剖析出每個(gè)話務(wù)測(cè)量值的組成部分,將傳統(tǒng)話務(wù)預(yù)測(cè)的測(cè)量值進(jìn)行了更小粒度的分解,從而揭示了每個(gè)話務(wù)歷史測(cè)量值分解過后的子特征,利用大數(shù)據(jù)技術(shù),將海量歷史數(shù)據(jù)利用合適的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)算法,挖掘出無(wú)線網(wǎng)絡(luò)的話務(wù)特征,從而為網(wǎng)絡(luò)話務(wù)評(píng)估和預(yù)測(cè)提供了一整套系統(tǒng)化,準(zhǔn)確率高的解決方案體系。
【專利說明】基于大數(shù)據(jù)統(tǒng)計(jì)模型的無(wú)線網(wǎng)絡(luò)話務(wù)量預(yù)測(cè)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于移動(dòng)通訊領(lǐng)域,特別涉及一種基于大數(shù)據(jù)統(tǒng)計(jì)模型的無(wú)線網(wǎng)絡(luò)話務(wù)量預(yù)測(cè)方法。
【背景技術(shù)】
[0002]移動(dòng)數(shù)據(jù)業(yè)務(wù)和智能終端的指數(shù)增長(zhǎng)給移動(dòng)運(yùn)營(yíng)商帶來了大量的新用戶和收入。然而,眾所周知的是,無(wú)線網(wǎng)絡(luò)容量是一種有限的資源,其面臨著流量和服務(wù)需求增長(zhǎng)兩大挑戰(zhàn)。如今,數(shù)據(jù)海嘯和信令風(fēng)暴正以壓倒性地趨勢(shì)吞噬著無(wú)線網(wǎng)絡(luò)資源。為了防止資源被無(wú)限制的消耗,這就需要運(yùn)營(yíng)商適當(dāng)?shù)卣{(diào)整容量管理策略來滿足不斷增加的網(wǎng)絡(luò)容量需求。無(wú)線網(wǎng)絡(luò)的容量是指滿足所有的語(yǔ)音、數(shù)據(jù)和信令流量的各種資源。無(wú)線網(wǎng)絡(luò)容量管理是一種保證無(wú)線網(wǎng)絡(luò)被正確地分配從而滿足流量需求和盡可能的以一種最有效的方式來利用網(wǎng)絡(luò)資源的過程。網(wǎng)絡(luò)容量管理需要考慮現(xiàn)有和未來的需求,如網(wǎng)絡(luò)運(yùn)營(yíng)商的商業(yè)運(yùn)營(yíng)目標(biāo)、網(wǎng)絡(luò)KP1、服務(wù)質(zhì)量,及最終網(wǎng)絡(luò)提供的應(yīng)用和服務(wù)的盈利能力。
[0003]由于移動(dòng)數(shù)據(jù)海嘯,在過去幾年中移動(dòng)運(yùn)營(yíng)商在不同程度上都出現(xiàn)了網(wǎng)絡(luò)負(fù)荷過載的現(xiàn)象。然而,移動(dòng)運(yùn)營(yíng)商不可能無(wú)限投資去擴(kuò)大網(wǎng)絡(luò)規(guī)模。傳統(tǒng)的基于業(yè)務(wù)流量增長(zhǎng)的網(wǎng)絡(luò)資源規(guī)劃方法,并沒有解決擴(kuò)大網(wǎng)絡(luò)容量和資本支出之間的矛盾。在智能手機(jī)出現(xiàn)之前,網(wǎng)絡(luò)應(yīng)用只有語(yǔ)音和簡(jiǎn)單的數(shù)據(jù)服務(wù),設(shè)備運(yùn)行在一個(gè)相對(duì)單一的模式下。在這單一的服務(wù)模式下,網(wǎng)絡(luò)在一段時(shí)間內(nèi)是穩(wěn)定的。在預(yù)測(cè)網(wǎng)絡(luò)容量時(shí),移動(dòng)運(yùn)營(yíng)商通常專注于無(wú)線網(wǎng)絡(luò)中的總流量,同時(shí)也考慮覆蓋和干擾的問題。盡管如此,智能終端帶來了大量無(wú)法預(yù)測(cè)的變化,如無(wú)法簡(jiǎn)單量化的信令流量、并發(fā)連接進(jìn)行的各種新的應(yīng)用或每一個(gè)數(shù)據(jù)應(yīng)用連接所產(chǎn)生的數(shù)據(jù)流量變化。
[0004]傳統(tǒng)的無(wú)線容量規(guī)劃方法只考慮到一個(gè)主要因素——用戶數(shù)量。用一個(gè)通用的函數(shù)來表示的話,就是未來需求的容量=目前容量+正比于用戶增長(zhǎng)產(chǎn)生的容量。由于多元化業(yè)務(wù)模式的智能手機(jī)和用戶行為,未來需求的容量需考慮增加用戶識(shí)別和服務(wù)多樣性等因素。因此,引進(jìn)一種新維度的公式,未來需求的容量=目前容量+正比于用戶增長(zhǎng)產(chǎn)生的容量+多元化的智能手機(jī)行為和業(yè)務(wù)增長(zhǎng)的容量。
[0005]因此,運(yùn)營(yíng)商需要一個(gè)科學(xué)的方法來預(yù)測(cè)網(wǎng)絡(luò)資源和規(guī)劃網(wǎng)絡(luò)容量。該方法需要考慮到流量模型中的動(dòng)態(tài)變化,即用戶數(shù)量變化、智能手機(jī)用戶行為和服務(wù)模式。本文介紹了一種基于業(yè)務(wù)測(cè)量和服務(wù)趨勢(shì)的數(shù)據(jù)分析和建模評(píng)估LTE網(wǎng)絡(luò)容量的系統(tǒng)方法。該方法目的在于解決兩個(gè)主要問題:
首先,這種方法能夠預(yù)測(cè)流量模型中由于多元化的服務(wù)模式和用戶行為引起的動(dòng)態(tài)變化。這種動(dòng)態(tài)變化會(huì)引起網(wǎng)絡(luò)流量變化,最終影響網(wǎng)絡(luò)容量。此外,容量在端到端的網(wǎng)絡(luò)設(shè)備資源支持下,其物理閾值(上限和下限)是由不同業(yè)務(wù)多樣化的服務(wù)和設(shè)備有效利用網(wǎng)絡(luò)軟、硬件的能力所決定的。基于相關(guān)參數(shù)的流量模型可以代表網(wǎng)絡(luò)流量的統(tǒng)計(jì)特征和網(wǎng)絡(luò)資源。智能手機(jī)上多種服務(wù)給流量模型帶來了動(dòng)態(tài)變化,這將最終影響3G和LTE網(wǎng)絡(luò)容量評(píng)估的精確性。如果不能準(zhǔn)確計(jì)算的網(wǎng)絡(luò)閾值可能會(huì)導(dǎo)致網(wǎng)絡(luò)中斷或服務(wù)性能下降。[0006]第二,該方法能以自動(dòng)調(diào)優(yōu)的辦法來計(jì)算網(wǎng)絡(luò)容量,反映業(yè)務(wù)模型中的動(dòng)態(tài)變化。該方法應(yīng)該是一個(gè)持續(xù)循環(huán)式的學(xué)習(xí)過程,以識(shí)別網(wǎng)絡(luò)容量管理的弊端,并執(zhí)行精確的網(wǎng)絡(luò)規(guī)劃。該模型基本上回答了兩個(gè)問題:什么時(shí)候網(wǎng)絡(luò)容量需要被增加?如何用節(jié)約成本的方式實(shí)現(xiàn)擴(kuò)容?
無(wú)線網(wǎng)絡(luò)性能、服務(wù)質(zhì)量和容量管理在學(xué)術(shù)界和工業(yè)界已被許多人做了研究。2G、3G或LTE網(wǎng)絡(luò)的現(xiàn)有研究都是由各種模擬方法執(zhí)行的。
[0007]基于模擬的方法研究3GUMTS網(wǎng)絡(luò)性能和服務(wù)質(zhì)量在學(xué)術(shù)界得到了公認(rèn)。Shiao-LiTsaoet.Al.(2002)利用模擬的方法設(shè)計(jì)和評(píng)估了三種可能的UMTS-WLAN互通策略。即移動(dòng)IP方法、網(wǎng)關(guān)方法和基于當(dāng)前UMTS、WLAN和移動(dòng)IP規(guī)格的模擬方法。SZlovencsak(2002)提出了一個(gè)類樹型的UMTS地面網(wǎng),他們開發(fā)了兩種類型的啟發(fā)式算法,以確保在這種網(wǎng)絡(luò)拓?fù)渲休^低的流量損失。其中一個(gè)算法通過修改樹的拓?fù)浣Y(jié)構(gòu)解決了這個(gè)問題,而另一個(gè)通過插入額外鏈接拓展網(wǎng)絡(luò)。他們的方法展示了如何在現(xiàn)實(shí)網(wǎng)絡(luò)場(chǎng)景中找到一個(gè)折衷的方法來實(shí)現(xiàn)拓?fù)浣Y(jié)構(gòu)優(yōu)化和網(wǎng)絡(luò)擴(kuò)展。Khan et.al.(2012)提出了一種新的用于低比特率和分辨率(QCIF)的H.264編碼的視頻,這種基于內(nèi)容的、非侵入式的質(zhì)量體驗(yàn)預(yù)測(cè)模型,同樣適應(yīng)UMTS網(wǎng)絡(luò)。他們認(rèn)為視頻應(yīng)用在UMTS網(wǎng)絡(luò)下的成功很大程度上取決于滿足用戶的QoE要求。因此用它來預(yù)測(cè)并控制視頻質(zhì)量來滿足用戶的QoE要求是非常可取的。在研究中,他們通過NS2進(jìn)行了仿真驗(yàn)證了該自適應(yīng)方案的有效性,特別是在UMTS接入網(wǎng)絡(luò)中,這是一個(gè)瓶頸。Navaie, K.和Sharafat,A.(2003)進(jìn)行了一種在上行和下行空中接口容量的分析。他們定義一個(gè)服務(wù)的最大并發(fā)用戶數(shù)為公認(rèn)容量,并以此和并發(fā)用戶數(shù)定義出網(wǎng)絡(luò)總負(fù)荷的函數(shù)。大量案例研究將上述方案輸出的結(jié)果和網(wǎng)絡(luò)仿真的結(jié)果進(jìn)行了比較,比較結(jié)果證明了在網(wǎng)絡(luò)設(shè)計(jì)和規(guī)劃中此方案的準(zhǔn)確性和實(shí)用性。
[0008]從UMTS到LTE,模擬仿真被認(rèn)為是最典型的研究網(wǎng)絡(luò)性能、質(zhì)量和容量相關(guān)問題的平滑過渡的方法。下 面是一些基于仿真的算法和工具來探討LTE網(wǎng)絡(luò)性能、服務(wù)質(zhì)量和容量使用的研究。例如,Ikuno J.C.et Al。(2010)進(jìn)行了系統(tǒng)級(jí)LTE網(wǎng)絡(luò)仿真。LTE系統(tǒng)級(jí)模擬器在Matlab中提供了評(píng)估LTE SISO下行共享信道,和使用了開環(huán)空間復(fù)用的MMO網(wǎng)絡(luò)以及傳輸多樣性模式。Ouyang, Ye (2012)在LTE網(wǎng)絡(luò)的SI接口上進(jìn)行仿真分析研究了吞吐量的行為,其網(wǎng)絡(luò)結(jié)構(gòu)和拓?fù)涫峭ㄟ^Opnet連接的。一些不同的流量場(chǎng)景被仿真去探索SI接口的流量行為。Engels,A.(2013)提出了一個(gè)關(guān)于LTE多層網(wǎng)絡(luò)優(yōu)化的自適應(yīng)權(quán)衡性能指標(biāo)的方法。其引入低干擾近似模型,這些相關(guān)優(yōu)化問題被編碼成混合整型線性程序并嵌入到一個(gè)自組織網(wǎng)絡(luò)操作和優(yōu)化框架中。這個(gè)優(yōu)化過程考慮了時(shí)變優(yōu)化參數(shù)自動(dòng)適應(yīng)對(duì)網(wǎng)絡(luò)的變化?;诖硇苑抡娴难芯空撟C了我們整體概念的適應(yīng)性和潛在價(jià)值。Amzallag, D.et.al.(2013)研究LTE小區(qū)選擇流程來確定小區(qū)向每個(gè)移動(dòng)臺(tái)提供服務(wù)。他們提出了兩種不同的小區(qū)選擇的算法,第一個(gè)算法給出(Ι-r)近似解,一個(gè)移動(dòng)臺(tái)可以被多個(gè)基站同時(shí)覆蓋。第二個(gè)算法給出了 l_r / 2 近似解,而每一個(gè)移動(dòng)臺(tái)最多被一個(gè)基站覆蓋。仿真結(jié)果表明,相比當(dāng)前小區(qū)選擇算法,該算法提升近20%的網(wǎng)絡(luò)使用能力。
[0009]據(jù)上所述,事實(shí)證明,這一領(lǐng)域大多采用仿真建模進(jìn)行研究分析。然而,由于大數(shù)據(jù)方法變得可用,它提供了一個(gè)機(jī)會(huì)從另一個(gè)方面去研究這個(gè)問題,而不再是模擬仿真。
[0010]首先仿真建模在無(wú)線網(wǎng)絡(luò)問題分析,大數(shù)據(jù)分析至少有兩大優(yōu)勢(shì)。
[0011]大數(shù)據(jù)分析利用真實(shí)的測(cè)量數(shù)據(jù)而不是模擬仿真數(shù)據(jù)或假設(shè)場(chǎng)景來研究無(wú)線網(wǎng)絡(luò)的一個(gè)特定的問題。測(cè)量數(shù)據(jù)從網(wǎng)絡(luò)側(cè)或用戶側(cè)真實(shí)量化反映了網(wǎng)絡(luò)和用戶的行為,一旦有個(gè)合適的分析算法能夠描述這個(gè)抽象的網(wǎng)絡(luò)現(xiàn)象,我們就有理由相信這個(gè)分析結(jié)果更加可靠和值得信賴。這些測(cè)量的數(shù)據(jù)中還隱藏著許多未知的無(wú)線網(wǎng)絡(luò)問題。電信大數(shù)據(jù)數(shù)據(jù)分析的目標(biāo)是挖掘無(wú)線網(wǎng)絡(luò)的數(shù)據(jù)關(guān)系,揭示隱藏的數(shù)據(jù)背后的事實(shí)。
[0012]大數(shù)據(jù)分析通常是監(jiān)督學(xué)習(xí)(也可以非監(jiān)督式)或后學(xué)習(xí)過程,使用實(shí)測(cè)數(shù)據(jù)來推斷數(shù)據(jù)背后的某種模式,以合理的方式來揭示出未見過情況。大數(shù)據(jù)分析方法與傳統(tǒng)仿真方法相比,最大區(qū)別是大數(shù)據(jù)分析方法采用真實(shí)數(shù)據(jù)來揭示無(wú)線網(wǎng)絡(luò)隱藏的問題,而不是假設(shè)場(chǎng)景模擬。我們也承認(rèn)有時(shí)模擬仿真也應(yīng)用真實(shí)數(shù)據(jù)來分析抽象網(wǎng)絡(luò)問題,但這并不能完全替代上述大數(shù)據(jù)分析方法在研究網(wǎng)絡(luò)性能、容量、服務(wù)質(zhì)量問題中的兩大優(yōu)勢(shì)。
【發(fā)明內(nèi)容】
[0013]本發(fā)明的目的是提供一種基于大數(shù)據(jù)統(tǒng)計(jì)模型的無(wú)線網(wǎng)絡(luò)話務(wù)量預(yù)測(cè)方法。
[0014]為了實(shí)現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:一種基于大數(shù)據(jù)統(tǒng)計(jì)模型的無(wú)線網(wǎng)絡(luò)話務(wù)量預(yù)測(cè)方法,在無(wú)線網(wǎng)絡(luò)中給定的一個(gè)小區(qū)中,無(wú)線網(wǎng)絡(luò)話務(wù)量的預(yù)測(cè)方法包括以下步驟:
1)趨勢(shì)分量T(t)的預(yù)測(cè):
11)建立趨勢(shì)分量T(t)預(yù)測(cè)模型:
將獲取的無(wú)線網(wǎng)絡(luò)話務(wù)量歷史數(shù)據(jù)的測(cè)量時(shí)間序列分成m份,每段長(zhǎng)度為η天,取置信度為95%,如果趨勢(shì)分量歷史數(shù)據(jù)呈現(xiàn)正態(tài)分布,確定其邊界為u-2o和u + 2σ,來排除離群異常值;分段考慮每段上的數(shù)據(jù),將每一段的起始無(wú)線網(wǎng)絡(luò)話務(wù)量歷史數(shù)據(jù)Xk和斜率Slopek擬合為一條直線,在擬合過程中,保證每相鄰兩條擬合曲線首尾連續(xù),將無(wú)線網(wǎng)絡(luò)話務(wù)量歷史數(shù)據(jù)作為訓(xùn)練樣本進(jìn)行建模,獲得趨勢(shì)分量T (t)預(yù)測(cè)模型:
_ =(I);
12)斜率Slopek的修正:
如果最近連續(xù)N個(gè)斜率不小于零,那么第Ν+1的斜率不應(yīng)小于零,修正后斜率由下式表示:
K = Max\Kr+i , y min (Aj.,Aj-_2, ^y-λ'+ιΒ (2),
其中Z是可調(diào)節(jié)的,直到一個(gè)最佳常數(shù)時(shí)候使得真實(shí)值與擬合值的差距達(dá)到最??;
13)趨勢(shì)分量的預(yù)測(cè):
采用趨勢(shì)分量的預(yù)測(cè)模型獲得趨勢(shì)分量的預(yù)測(cè)值;
2)季節(jié)性分量S(t)的預(yù)測(cè):
21)確定周期長(zhǎng)度1:
設(shè)L是獲取的無(wú)線網(wǎng)絡(luò)話務(wù)量歷史數(shù)據(jù)的時(shí)間序列長(zhǎng)度,周期長(zhǎng)度i=l~L/2,i分為j份,對(duì)于i=l,2...L/2,按下式計(jì)算出各i值下關(guān)于j的方差和值:
σ? m麵=53(3);
M
對(duì)于i=l,2,3…L/2,假設(shè)P為i內(nèi)每段的采樣點(diǎn)數(shù)目,定義p=L/i,構(gòu)建P個(gè)樣本數(shù)據(jù)集,每個(gè)樣本數(shù)據(jù)集包含P中相同位置q上的所有樣本,按下式計(jì)算出每個(gè)P的方差的和:
【權(quán)利要求】
1.一種基于大數(shù)據(jù)統(tǒng)計(jì)模型的無(wú)線網(wǎng)絡(luò)話務(wù)量預(yù)測(cè)方法,其特征在于在無(wú)線網(wǎng)絡(luò)中給定的一個(gè)小區(qū)中,無(wú)線網(wǎng)絡(luò)話務(wù)量的預(yù)測(cè)方法包括以下步驟: 1)趨勢(shì)分量T(t)的預(yù)測(cè): 11)建立趨勢(shì)分量T(t)預(yù)測(cè)模型: 將獲取的無(wú)線網(wǎng)絡(luò)話務(wù)量歷史數(shù)據(jù)的測(cè)量時(shí)間序列分成m份,每段長(zhǎng)度為η天,取置信度為95%,如果趨勢(shì)分量歷史數(shù)據(jù)呈現(xiàn)正態(tài)分布,確定其邊界為u-2o和u + 2σ,來排除離群異常值;分段考慮每段上的數(shù)據(jù),將每一段的起始無(wú)線網(wǎng)絡(luò)話務(wù)量歷史數(shù)據(jù)Xk和斜率Slopek擬合為一條直線,在擬合過程中,保證每相鄰兩條擬合曲線首尾連續(xù),將無(wú)線網(wǎng)絡(luò)話務(wù)量歷史數(shù)據(jù)作為訓(xùn)練樣本進(jìn)行建模,獲得趨勢(shì)分量T (t)預(yù)測(cè)模型:
2.根據(jù)權(quán)利要求1所述的基于大數(shù)據(jù)統(tǒng)計(jì)模型的無(wú)線網(wǎng)絡(luò)話務(wù)量預(yù)測(cè)方法,其特征在于:所述建立趨勢(shì)分量T (t)預(yù)測(cè)模型中異常值的排除,首先判斷歷史數(shù)據(jù)樣本集是否呈現(xiàn)正態(tài)分布,如果通過正態(tài)分布的檢驗(yàn),采用正態(tài)分布的邊界來排除異常值;如果時(shí)間序列不符合正態(tài)分布,采用四分位差法排除異常值。
【文檔編號(hào)】H04W16/22GK103987056SQ201410238066
【公開日】2014年8月13日 申請(qǐng)日期:2014年5月30日 優(yōu)先權(quán)日:2014年5月30日
【發(fā)明者】吳冬華, 程艷云, 閆興秀 申請(qǐng)人:南京華蘇科技有限公司