專利名稱:一種基于局域最大最小概率機(jī)的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及無(wú)線網(wǎng)絡(luò)領(lǐng)域,特別是涉及一種無(wú)線網(wǎng)絡(luò)流量的預(yù)測(cè)方法。
背景技術(shù):
近年來(lái)隨著無(wú)線網(wǎng)絡(luò)技術(shù)應(yīng)用的不斷推廣,安全問(wèn)題已成為無(wú)線局域網(wǎng)發(fā)展中遇到的最為關(guān)鍵的問(wèn)題之一,除了基于密鑰管理和認(rèn)證實(shí)現(xiàn)的訪問(wèn)控制技術(shù)之外,網(wǎng)絡(luò)流量預(yù)測(cè)和異常檢測(cè)逐漸成為解決上述難題的重要手段。同時(shí)網(wǎng)絡(luò)流量的分析與預(yù)測(cè)對(duì)于網(wǎng)絡(luò)規(guī)劃和網(wǎng)絡(luò)資源管理都具有重要的意義。預(yù)測(cè)是根據(jù)某個(gè)事物當(dāng)前的發(fā)展勢(shì)態(tài)及規(guī)律對(duì)將來(lái)的狀態(tài)做出分析并預(yù)告,它包含采集歷史數(shù)據(jù)并用某種數(shù)學(xué)模型來(lái)求解和外推未來(lái)的數(shù)據(jù)。網(wǎng)絡(luò)流量預(yù)測(cè)的方法一直伴隨著時(shí)間序列分析方法(Time Series Analysis, TSA)的發(fā)展而層出不窮,這些方法可 以分為兩大類經(jīng)典方法和智能方法(Intelligent Algorithms)。經(jīng)典方法主要包括AR模型(Auto-Regressive), MA 模型(Moving Average), ARMA 模型(Auto-Regressive andMoving Average), ARIMA 模型(Auto-Regressive Integrated Moving Average), ARFIMA模型(Auto-Regressive Fractionally Integrated Moving Average)以及貝葉斯模型(Bayesian)和卡爾曼濾波模型(Karlman Filtering)等,這些經(jīng)典預(yù)測(cè)方法主要用于解決有線網(wǎng)絡(luò)流量的預(yù)測(cè)問(wèn)題。與有線網(wǎng)絡(luò)比較,無(wú)線網(wǎng)絡(luò)流量具有突發(fā)性強(qiáng)、規(guī)律性差的特點(diǎn),因此將上述經(jīng)典方法應(yīng)用于無(wú)線網(wǎng)絡(luò)時(shí),會(huì)產(chǎn)生較大的預(yù)測(cè)誤差。近年來(lái)出現(xiàn)了采用智能算法的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)方法,主要包括小波分析(Wavelet Analysis),人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANN),支持向量機(jī)(Support Vector Machine, SVM)和基于混沛理論的局域支持向量機(jī)(Local SVM based on Chaos Theory, LSVM),以及最大最小概率機(jī)(Minimax Probability Machine Regression, MPMR)等。LSVM方法的核心思想是從輸入SVM的數(shù)據(jù)集中找出一些特征點(diǎn)來(lái)構(gòu)造一個(gè)鄰近點(diǎn)集合NNPS (Nearest Neighbor Points Set),然后將NNPS作為輸入SVM的訓(xùn)練集對(duì)SVM進(jìn)行訓(xùn)練,該方法可以有效提高無(wú)線網(wǎng)絡(luò)流量的預(yù)測(cè)精度。LSVM方法在構(gòu)造NNPS時(shí),需要計(jì)算歐氏距離來(lái)度量?jī)牲c(diǎn)之間的相似性,其主要優(yōu)點(diǎn)是簡(jiǎn)單、直觀。但是歐氏距離在度量相似性方面存在缺陷即使兩個(gè)非常相似的向量在時(shí)間軸上的輕微移動(dòng)也可能造成二者之間的歐氏距離變得非常大。作為L(zhǎng)SVM方法的改進(jìn),LSVM-DTW-K方法采用動(dòng)態(tài)時(shí)間折疊算法(Dynamic Time Wrapping, DTW)來(lái)替代基于歐氏距離的相似度計(jì)算方法,可以忽略向量之間在時(shí)間軸上的全局或局部移動(dòng)。為進(jìn)一步消除在構(gòu)造NNPS時(shí)可能產(chǎn)生的一些偽鄰近點(diǎn)對(duì)預(yù)測(cè)精度的影響,該方法采用K策略從NNPS中剔除了一些DTW距離相對(duì)較大的點(diǎn)。實(shí)驗(yàn)證明,LSVM-DTW-K方法可以顯著提高無(wú)線網(wǎng)絡(luò)流量的預(yù)測(cè)精度。不足之處在確定NNPS的個(gè)數(shù)和K策略中需要剔除多少個(gè)偽鄰近點(diǎn)時(shí),該方法主要依靠人工經(jīng)驗(yàn),缺乏科學(xué)依據(jù)和必要的計(jì)算;另外DTW算法的時(shí)間復(fù)雜度也明顯高于基于歐氏距離的相似度計(jì)算方法。為進(jìn)一步提高無(wú)線網(wǎng)絡(luò)流量的預(yù)測(cè)精度和實(shí)時(shí)計(jì)算能力,LSVM-HQ-SAX-DTW-K方法主要進(jìn)行了如下改進(jìn)采用HQ信息準(zhǔn)則(Hannan-Quinn Information Criterion, HQ)計(jì)算出NNPS的個(gè)數(shù);同時(shí)在進(jìn)行DTW相似度計(jì)算之前采用SAX算法(Symbolic AggregateApproximation, SAX)對(duì)時(shí)間序列進(jìn)行符號(hào)化處理以降低時(shí)間復(fù)雜度,實(shí)驗(yàn)證明了該方法的有效性。但是在采用K策略決定剔除多少個(gè)偽鄰近點(diǎn)時(shí),該方法主要依靠人工經(jīng)驗(yàn)、缺乏科學(xué)依據(jù)和必要計(jì)算的問(wèn)題仍然存在。最大最小概率機(jī)MPMR是近年來(lái)一種新的用于時(shí)間序列預(yù)測(cè)的智能方法,屬于全局預(yù)測(cè)方法。有關(guān)文獻(xiàn)對(duì)基于MPMR和基于SVM的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)算法進(jìn)行了比較,證明了前者在預(yù)測(cè)精度方面的有效性。但是,MPMR與SVM—樣,在建立具有實(shí)時(shí)計(jì)算能力的預(yù)測(cè)模型時(shí)存在缺陷其主要思想是希望利用所有的歷史信息來(lái)推斷未來(lái),因此當(dāng)輸入數(shù)據(jù)達(dá)到一定規(guī)模時(shí),計(jì)算量將急劇增加,訓(xùn)練時(shí)間將變得很長(zhǎng)甚至超過(guò)數(shù)據(jù)采集的時(shí)間間隔,使得預(yù)測(cè)已經(jīng)失去了實(shí)際意義。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是如何能夠創(chuàng)新地進(jìn)一步提高無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)精 度和實(shí)時(shí)計(jì)算能力,能夠更準(zhǔn)確、更及時(shí)地進(jìn)行無(wú)線網(wǎng)絡(luò)流量的預(yù)測(cè)。為了解決上述問(wèn)題,本發(fā)明公開(kāi)了一種基于局域最大最小概率機(jī)的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)方法,其技術(shù)方案包括以下各步驟
步驟I :用互信息量算法計(jì)算時(shí)間序列的時(shí)間延遲"
步驟2 :用Cao氏法計(jì)算時(shí)間序列的嵌入維數(shù)《 ;
步驟3 :用延遲坐標(biāo)狀態(tài)相空間重構(gòu)法對(duì)時(shí)間序列進(jìn)行相空間重構(gòu),得到相空間;
步驟4 :用AICi信息準(zhǔn)則計(jì)算相空間的鄰近點(diǎn)個(gè)數(shù)先;
步驟5 :用基于KD-Tree的鄰近點(diǎn)選擇算法構(gòu)造鄰近點(diǎn)集合MVBS1 ;
步驟6 :用Ki策略從鄰近點(diǎn)集合MVPS中剔除偽鄰近點(diǎn),得到經(jīng)過(guò)裁剪的鄰近點(diǎn)集合NNPS' ;
步驟7 :用經(jīng)過(guò)裁減的鄰近點(diǎn)集合MVRS1'構(gòu)造最大最小概率機(jī)MPMR的訓(xùn)練特征集; 步驟8 :調(diào)整最大最小概率機(jī)MPMR的參數(shù),訓(xùn)練模型,得到預(yù)測(cè)值。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)
(1)本發(fā)明通過(guò)對(duì)輸入MPMR模型的數(shù)據(jù)集進(jìn)行預(yù)處理(包括對(duì)時(shí)間序列進(jìn)行相空間重構(gòu)、用AICi信息準(zhǔn)則和基于KD-Tree的高維鄰近點(diǎn)選擇算法構(gòu)造鄰近點(diǎn)集合NNPS以及用Ki策略剔除偽鄰近點(diǎn)等),實(shí)現(xiàn)了基于MPMR預(yù)測(cè)模型的局域化,克服了基于MPMR全局預(yù)測(cè)模型的缺陷,提高了無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)精度和實(shí)時(shí)計(jì)算能力,能夠更準(zhǔn)確、更及時(shí)地進(jìn)行無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè);
(2)本發(fā)明采用AICi信息準(zhǔn)則來(lái)準(zhǔn)確計(jì)算鄰近點(diǎn)個(gè)數(shù),解決了LSVM-DTW-K方法中確定NNPS的個(gè)數(shù)時(shí),主要依靠人工經(jīng)驗(yàn)、缺乏科學(xué)依據(jù)和必要計(jì)算的問(wèn)題。另外與LSVM-HQ-SAX-DTW-K方法中HQ信息準(zhǔn)則比較,AICi信息準(zhǔn)則表現(xiàn)出更好的性能;
(3)高維空間下選擇鄰近點(diǎn)常用的方法是使用某種距離度量(如DTW或者歐氏距離等),但是這種方法的復(fù)雜度普遍較高,尤其是當(dāng)樣本數(shù)大時(shí),效率非常低下。利用KD-Tree在鄰近點(diǎn)存儲(chǔ)上的特點(diǎn)(即空間位置相近的數(shù)據(jù)點(diǎn)在KD-Tree上存儲(chǔ)的結(jié)點(diǎn)也相近,甚至存儲(chǔ)在相同的節(jié)點(diǎn)上),本發(fā)明使用基于KD-Tree的高維鄰近點(diǎn)選擇算法來(lái)構(gòu)造鄰近點(diǎn)集合NNPS,能夠在給定某空間點(diǎn)后迅速找到其鄰居,比使用距離度量的方法表現(xiàn)出更好的性倉(cāng)泛;
(4)本發(fā)明采用了一種Ki策略來(lái)剔除NNPS中的偽鄰近點(diǎn)。該策略充分考慮了樣點(diǎn)所在曲線的方向?qū)Α班徑彼a(chǎn)生的影響,利用鄰近點(diǎn)集合NNPS中的每個(gè)點(diǎn)與目標(biāo)點(diǎn)的夾角余弦關(guān)系來(lái)消除偽鄰近點(diǎn)。該策略解決了 LSVM-DTW-K和LSVM-HQ-SAX-DTW-K方法中剔除多少個(gè)偽鄰近點(diǎn)主要依靠人工經(jīng)驗(yàn)、缺乏科學(xué)依據(jù)和必要計(jì)算的問(wèn)題。
圖I為本發(fā)明的基于局域最大最小概率機(jī)的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)方法流程圖。
具體實(shí)施例方式下面結(jié)合附圖對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。
·
如附圖I所示,本發(fā)明方法按照以下步驟進(jìn)行無(wú)線網(wǎng)絡(luò)流量的預(yù)測(cè)
步驟I:用互信息量算法計(jì)算時(shí)間序列的時(shí)間延遲T ;
假設(shè)有兩個(gè)由離散時(shí)間序列構(gòu)成的系統(tǒng)1=( , ,…,aJ和J7=If1,J2,…,,以力例,系統(tǒng)的信息熵定義為H(X) = -Xp(^)Inp(Xi),其中p(Xi)表示系統(tǒng)X處于&狀態(tài)
m n
的概率。系統(tǒng)Z和T的聯(lián)合熵定義為其中,、表示
系統(tǒng)處于A狀態(tài)且系統(tǒng)F處于4狀態(tài)的概率。兩系統(tǒng)if、Y的互信息可由兩者的熵和聯(lián)合熵得到KX,Y、)= H(X)+ HO7)- H(XJ)。接下來(lái)定義Lu] = [X1 ,X14J ,其中x代表時(shí)間序列Xl , J代表時(shí)間序列, x和7的時(shí)間延遲為T(mén)。此時(shí)互信息!(X’Y)是與時(shí)間延遲^■有關(guān)的函數(shù),將其記為/fr)。I(Tf)的大小代表與的相關(guān)性,當(dāng)/¢1")= 0
時(shí),Xl與完全不相關(guān),而/(T)的極小值則表示JCi與XL+r最大程度的不相關(guān)。取
m第一次達(dá)到極小時(shí)的T為最佳時(shí)間延遲。步驟2 :用Cao氏法計(jì)算時(shí)間序列的嵌入維數(shù)《 ;
嵌入維數(shù)的計(jì)算一般有飽和嵌入維數(shù)法、偽最近鄰點(diǎn)法和Cao氏法等。本發(fā)明采用Cao氏法確定嵌入維數(shù)。下面介紹利用Cao氏法計(jì)算嵌入維數(shù)的步驟對(duì)于足.=(尤0),)0' + 亡,.",11;1 + (濟(jì)-1 ),/=1,2,.",1(若 I,貝Ij t = -mT+l ;若 T= I,貝丨J
ILsr w+i — y* 故+i
),定義蛾岣=_B_______)^________________I_______________. U = HV,其中 Jff44 為《+1維重構(gòu)相
1 = n — (m — I) T|p i j I
空間的第^個(gè)相點(diǎn),^r1為^r1的最近鄰點(diǎn),I I為歐氏距離下的最大值范數(shù)。所有相點(diǎn)的平均值定義為= (V ) , m 只依賴于嵌入維數(shù)_和時(shí)間延遲T。
t ,=1E(m)
定義CfAcMgg (w) = 5 0 +1) /J1 ( )從M變?yōu)镸 +1時(shí)相空間的變化情況,當(dāng)Change (m)隨著
m的增加而停止變化時(shí),這時(shí)的《 + 1就是重構(gòu)相空間的最佳嵌入維數(shù)。步驟3 :用延遲坐標(biāo)狀態(tài)相空間重構(gòu)法對(duì)時(shí)間序列進(jìn)行相空間重構(gòu),得到相空間; 相關(guān)文獻(xiàn)已經(jīng)證明無(wú)線網(wǎng)絡(luò)流量具有混沌特性。相空間重構(gòu)的目的在于在高維相空間
中恢復(fù)混沌吸引子(混沌吸引子作為混沌系統(tǒng)的特征之一,體現(xiàn)著混沌系統(tǒng)的規(guī)律性,它意味著混沌系統(tǒng)最終會(huì)落入某一特定的軌跡之中,這種特定的軌跡就是混沌吸引子)。在確定性的基礎(chǔ)上,對(duì)序列動(dòng)力學(xué)因素的分析,目前廣泛采用的是延遲坐標(biāo)狀態(tài)相空間重構(gòu)法。假
設(shè)有時(shí)間序列Z = ( , A ,... , },時(shí)間延遲為T(mén),嵌入維數(shù)為《,則重構(gòu)S點(diǎn)時(shí)間序列后
X(I) X(I + T)…x(l + (ffl - 1)T)
r i X(2)x(2 + r)…x(2 + (m - l)r)
的軌跡為■; ; .,其中當(dāng)時(shí),
■' - 'T*I
x(t)x(t + T)x(t + (m- 1)T) _
t = n-mr+\ ;當(dāng)T= I時(shí),= -( -1)t, I為重構(gòu)相空間后的相點(diǎn)數(shù)。由重構(gòu)后的軌跡可見(jiàn),當(dāng)時(shí)間序列被映射到高維空間后,呈現(xiàn)出一種有規(guī)律的結(jié)構(gòu)。步驟4 :用AICi信息準(zhǔn)則計(jì)算相空間的鄰近點(diǎn)個(gè)數(shù)I:;
目前可用于鄰近點(diǎn)計(jì)算的方法主要有AIC信息準(zhǔn)則(Akaike informationcriterion, AIC), BIC 信息準(zhǔn)則(Bayesian information criterion, BIC), HQ 信息準(zhǔn)則以及AICi信息準(zhǔn)則。本發(fā)明采用AICi信息準(zhǔn)則(An Improved Variant of the AkaikeInformation Criterion,AlCi)。下面介紹基于AICi信息準(zhǔn)則的鄰近點(diǎn)個(gè)數(shù)計(jì)算方法(1)
假設(shè)有時(shí)間序列tqAp.AVuX」,將重構(gòu)后的相空間分為兩部分,每個(gè)行向量稱為一段數(shù)據(jù);(2)對(duì)第二部分的每段數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)步長(zhǎng)設(shè)置為^若為單步預(yù)測(cè)則= I。同時(shí),用歸一化均方誤差來(lái)表征模型的短期可預(yù)測(cè)性能,其定義如下
① + J - I] - Xp[v(i) + J — I]
“:'%叫,M-,其中是第二部分?jǐn)?shù)據(jù)行向量的個(gè)數(shù),
(yj- xf
/ ^-1
力時(shí)間序列的樣本總數(shù),X=表示時(shí)間序列的均值,^為每段數(shù)據(jù)的起始
ii^(0
數(shù)據(jù)的序號(hào),I]是利用線性映射得到的點(diǎn)辦(:)+J-I]的預(yù)測(cè)值,映射關(guān)系定
義為0 +step) = asx(f) +k,其中step為預(yù)測(cè)步長(zhǎng)(注意與前面定義的預(yù)測(cè)步長(zhǎng)&的區(qū)
分)、為1 維行向量為常數(shù);(3)通過(guò)對(duì)cm = (h + kmDmN l1n s)k"進(jìn)行
as him…'N極小化處理可以得到鄰近點(diǎn)個(gè)數(shù)* ,其中C(Ar)表示關(guān)于t的一元二次方程即上一步所求得的值:力常數(shù),是嵌入維數(shù),表示擬合數(shù)據(jù)個(gè)數(shù)。步驟5 :用基于KD-Tree的鄰近點(diǎn)選擇算法構(gòu)造鄰近點(diǎn)集合NNPS ;
鄰近點(diǎn)的個(gè)數(shù)確定后,接下來(lái)就是根據(jù)鄰近點(diǎn)個(gè)數(shù)選取鄰近點(diǎn)集合。高維空間下選擇鄰近點(diǎn)的常用方法是使用某種度量距離來(lái)衡量如DTW或者歐氏距離等,但是這種方法的計(jì)算復(fù)雜度普遍較高,尤其是當(dāng)樣本數(shù)大時(shí),效率非常低下。本發(fā)明使用一種基于KD-Tree的高維鄰近點(diǎn)選擇算法。KD-Tree是一種根據(jù)*維空間中的點(diǎn)集對(duì)空間進(jìn)行分割的數(shù)據(jù)結(jié)構(gòu),它與二元搜索樹(shù)不同,每個(gè)樹(shù)結(jié)點(diǎn)表示、維空間的一個(gè)點(diǎn),并且每一層都根據(jù)該層的分辨器對(duì)相應(yīng)對(duì)象做出分枝決策和進(jìn)行遞歸劃分,直至一個(gè)樹(shù)結(jié)點(diǎn)中表示的空間點(diǎn)數(shù)少于給定的最大點(diǎn)數(shù)時(shí),結(jié)束劃分。KD-Tree的優(yōu)點(diǎn)在于空間位置相近的數(shù)據(jù)點(diǎn)在KD-Tree上存儲(chǔ)的結(jié)點(diǎn)也相近,甚至存儲(chǔ)在相同的節(jié)點(diǎn)上,因此在給定某空間點(diǎn)后可以迅速找到其鄰居。下面
介紹求解步驟該算法首先對(duì)重構(gòu)相空間后的樣本點(diǎn)名構(gòu)造KD-Tree,然后利用搜索算法在KD-Tree中搜索與目標(biāo)點(diǎn)JTi最鄰近的I個(gè)點(diǎn)。步驟6 :用Ki策略從鄰近點(diǎn)集合MVR 中剔除偽鄰近點(diǎn),得到經(jīng)過(guò)裁剪的鄰近點(diǎn)集合NNPS' ;
Ki策略策略是LSVM-DTW-K和LSVM-HQ-SAX-DTW-K方法中所采用的K策略的改進(jìn)算法,充分考慮了樣點(diǎn)所在曲線的方向?qū)Α班徑彼a(chǎn)生的影響,它利用AWPSf中的每個(gè)點(diǎn)與
目標(biāo)點(diǎn)4的夾角余弦關(guān)系,來(lái)消除偽鄰近點(diǎn)。夾角余弦的范圍設(shè)定為[_1,1],夾角余弦值
越大,說(shuō)明兩個(gè)點(diǎn)越鄰近。Ki策略的步驟如下首先是計(jì)算中每個(gè)點(diǎn)與目標(biāo)點(diǎn)名的
夾角余弦,記為(Cos(IXc0sP)1 ...,C0S };然后設(shè)定閾值T例如戶= 0.03 ;如果滿足條件 _)-畫(huà)^s0) =(2X. =)}|xl纖w,則該點(diǎn)從鄰近點(diǎn)集合A爾中剔除,直
max{cos( 1) cos(z), ...3 cos(i)} |
到剔除所有偽鄰近點(diǎn)為止,得到經(jīng)過(guò)裁剪的鄰近點(diǎn)集合NNPS'。步驟7 :用經(jīng)過(guò)裁減的鄰近點(diǎn)集合MVRSt'構(gòu)造最大最小概率機(jī)MPMR的訓(xùn)練特征集;
利用NNPS'再加上訓(xùn)練目標(biāo)值即可構(gòu)造訓(xùn)練特征集,訓(xùn)練特征集包括石及其對(duì)應(yīng)的目標(biāo)值_+航)。步驟8 :調(diào)整最大最小概率機(jī)MPMR的參數(shù),訓(xùn)練模型,得到預(yù)測(cè)值。最大最小概率機(jī)MPMR的參數(shù)主要有核函數(shù)及核函數(shù)的參數(shù)。核函數(shù)的類型主要有線性核、多項(xiàng)式核和徑向基函數(shù)。徑向基函數(shù)是非線性核,能夠解決線性不可分問(wèn)題。線性核是徑向基函數(shù)核的一個(gè)特例。多項(xiàng)式核一般需要較多的參數(shù),而徑向基函數(shù)核的參數(shù)相對(duì)較少。本發(fā)明采用徑向基函數(shù)核,其主要的參數(shù)有兩個(gè)參數(shù)々和羅。參數(shù)對(duì)預(yù)測(cè)結(jié)果有較大影響,當(dāng)P很小時(shí),預(yù)測(cè)結(jié)果誤差大;隨著$值增大,預(yù)測(cè)準(zhǔn)確的點(diǎn)增多,但誤差值變大,即準(zhǔn)確點(diǎn)較準(zhǔn),不準(zhǔn)確點(diǎn)誤差很大。經(jīng)過(guò)測(cè)試,當(dāng)P的取值大于100時(shí),預(yù)測(cè)誤差基本保持穩(wěn)定。在MPMR模型中,訓(xùn)練數(shù)據(jù)集一般通過(guò)加減印值來(lái)構(gòu)造二分類,當(dāng)取值很小時(shí),兩類數(shù)據(jù)的大量數(shù)據(jù)點(diǎn)重合,可用于分類的有效信息點(diǎn)較少,容易導(dǎo)致擬合曲線不準(zhǔn)確 '芻啊―取值很大時(shí),兩類數(shù)據(jù)距離較遠(yuǎn),計(jì)算時(shí)考慮了過(guò)多的無(wú)效或錯(cuò)誤數(shù)據(jù)點(diǎn),擬合和預(yù)測(cè)效果會(huì)受到嚴(yán)重影響。經(jīng)過(guò)測(cè)試,當(dāng)印取值為i時(shí),效果最佳。MPMR的參數(shù)調(diào)整完后,將訓(xùn)練特征集輸入MPMR訓(xùn)練模型,得到擬合模型。
最后將預(yù)測(cè)集輸入擬合模型,得到預(yù)測(cè)值。
權(quán)利要求
1.一種基于局域最大最小概率機(jī)的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)方法,其特征在于,包括以下各個(gè)步驟 步驟I:用互信息量算法計(jì)算時(shí)間序列的時(shí)間延遲T 步驟2 :用Cao氏法計(jì)算時(shí)間序列的嵌入維數(shù) ; 步驟3 :用延遲坐標(biāo)狀態(tài)相空間重構(gòu)法對(duì)時(shí)間序列進(jìn)行相空間重構(gòu),得到相空間; 步驟4 :用AICi信息準(zhǔn)則計(jì)算相空間的鄰近點(diǎn)個(gè)數(shù)是; 步驟5 :用基于KD-Tree的鄰近點(diǎn)選擇算法構(gòu)造鄰近點(diǎn)集合AWR ; 步驟6 :用Ki策略從鄰近點(diǎn)集合MWPSf中剔除偽鄰近點(diǎn),得到經(jīng)過(guò)裁剪的鄰近點(diǎn)集合NNPS' ; 步驟7 :用經(jīng)過(guò)裁減的鄰近點(diǎn)集合構(gòu)造最大最小概率機(jī)MPMR的訓(xùn)練特征集; 步驟8 :調(diào)整最大最小概率機(jī)MPMR的參數(shù),訓(xùn)練模型,得到預(yù)測(cè)值。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于 所述用AICi信息準(zhǔn)則計(jì)算相空間鄰近點(diǎn)個(gè)數(shù)的方法具體按照以下步驟將重構(gòu)后的相空間分為兩部分,每個(gè)行向量稱為一段數(shù)據(jù);對(duì)第二部分的每段數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)步長(zhǎng)設(shè)置為I ,若為單步預(yù)測(cè)則= I,同時(shí),用歸一化均方誤差來(lái)表征 模型的短期可預(yù)測(cè)性能,其定義如下
3.根據(jù)權(quán)利要求I所述的方法,其特征在于 所述Ki策略從鄰近點(diǎn)集合MVR 中剔除偽鄰近點(diǎn)的算法具體按照以下步驟將夾角余弦的范圍設(shè)定為[_1,1],夾角余弦值越大,說(shuō)明兩個(gè)點(diǎn)越鄰近,計(jì)算AWPS中每個(gè)點(diǎn)與目標(biāo)點(diǎn)的夾角余弦,記為(cos(l), cos(2),..., COS(I));設(shè)定閾值r如果滿足條件V,則該點(diǎn)從鄰近點(diǎn)集合皿巧中剔除,直
全文摘要
本發(fā)明提供了一種基于局域最大最小概率機(jī)的無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)方法,用互信息量算法計(jì)算時(shí)間序列的時(shí)間延遲,用Cao氏法計(jì)算時(shí)間序列的嵌入維數(shù),用延遲坐標(biāo)狀態(tài)相空間重構(gòu)法對(duì)時(shí)間序列進(jìn)行相空間重構(gòu),得到相空間,用AICi信息準(zhǔn)則計(jì)算相空間的鄰近點(diǎn)個(gè)數(shù),用基于KD-Tree的鄰近點(diǎn)選擇算法構(gòu)造鄰近點(diǎn)集合,用Ki策略從鄰近點(diǎn)集合中剔除偽鄰近點(diǎn),得到經(jīng)過(guò)裁剪的鄰近點(diǎn)集合,用于構(gòu)造最大最小概率機(jī)的訓(xùn)練特征集,調(diào)整最大最小概率機(jī)的參數(shù),訓(xùn)練模型,得到預(yù)測(cè)值,實(shí)現(xiàn)了基于最大最小概率機(jī)預(yù)測(cè)模型的局域化,能夠更準(zhǔn)確、更及時(shí)地進(jìn)行無(wú)線網(wǎng)絡(luò)流量預(yù)測(cè)。
文檔編號(hào)H04W16/22GK102685766SQ201210145940
公開(kāi)日2012年9月19日 申請(qǐng)日期2012年5月13日 優(yōu)先權(quán)日2012年5月13日
發(fā)明者劉興偉, 李花, 汪麗, 王小宇, 薄慧, 陳燕其 申請(qǐng)人:西華大學(xué)