基于改進高斯過程回歸模型的狀態(tài)監(jiān)測數(shù)據(jù)流異常檢測方法
【專利摘要】基于改進高斯過程回歸方法的狀態(tài)監(jiān)測數(shù)據(jù)流異常檢測方法,本發(fā)明涉及狀態(tài)監(jiān)測數(shù)據(jù)流異常檢測方法。本發(fā)明是要解決現(xiàn)有方法處理監(jiān)測數(shù)據(jù)流的異常檢測效果低的問題。一、確定歷史數(shù)據(jù)滑動窗口尺寸;二、確定均值函數(shù)與協(xié)方差函數(shù)的類型;三、設定超參數(shù)初始值為[0-1]之間的隨機數(shù);四、提取與當前時刻t最近的q個數(shù)據(jù);五、確定高斯過程回歸模型;六、利用高斯過程回歸模型的性質進行預測;七、計算t+1時刻的正常數(shù)據(jù)的PI;八、將監(jiān)測數(shù)據(jù)與PI比較;九、判斷是否將真實的監(jiān)測數(shù)據(jù)標記為異常;十、計算對應于t+1時刻監(jiān)測值的β(xt+1);十一、將真實值或者預測均值與t+1添加到DT;十二、創(chuàng)建新的DT。本發(fā)明應用于網(wǎng)絡通信領域。
【專利說明】基于改進高斯過程回歸模型的狀態(tài)監(jiān)測數(shù)據(jù)流異常檢測方法
【技術領域】
[0001]本發(fā)明涉及狀態(tài)監(jiān)測數(shù)據(jù)流異常檢測方法。
【背景技術】
[0002]隨著系統(tǒng)復雜性提升,利用狀態(tài)監(jiān)測數(shù)據(jù)估計設備或系統(tǒng)性能愈發(fā)重要。以衛(wèi)星為例,衛(wèi)星在軌運行期間產(chǎn)生的遙測數(shù)據(jù)是地面人員估計是衛(wèi)星健康狀態(tài)的唯一依據(jù)。類似,挖掘飛行器的監(jiān)測數(shù)據(jù)同樣可以為相應的系統(tǒng)或者子系統(tǒng)的狀態(tài)估計提供重要參考信息。另外,與正常的數(shù)據(jù)相比,異常數(shù)據(jù)往往預示著系統(tǒng)可能會發(fā)生的異常事件或潛在的故障信息,異常數(shù)據(jù)更值得進一步分析。因此,異常檢測吸引了很多領域研究學者的廣泛關注,如可靠性、自動測試、機器學習、數(shù)據(jù)挖掘等。在異常檢測方法中,基于規(guī)則和基于模型的方法都需要手動提取和實現(xiàn),而數(shù)據(jù)驅動的方法則采取完全不同的方式推理異常,數(shù)據(jù)驅動模型現(xiàn)已廣泛應用于異常檢測。
[0003]最近,隨著計算技術、數(shù)據(jù)采集技術及通信技術的發(fā)展,可用的狀態(tài)監(jiān)測數(shù)據(jù)在變異性、速度以及數(shù)量等方面已經(jīng)以不可預知的速度快速增長。因此,我們對狀態(tài)監(jiān)測數(shù)據(jù)進行異常檢測時必須要解決流式數(shù)據(jù)對于檢測異常帶來的挑戰(zhàn)。首先,因為流式數(shù)據(jù)的無限性,離線算法會耗盡內存空間。其次,由于多分類器要求訓練數(shù)據(jù)具有完整的標簽,而流式數(shù)據(jù)中正常數(shù)據(jù)與異常數(shù)據(jù)具有不平衡的特點,因此傳統(tǒng)的多分類器將不能適用。另外,對于數(shù)據(jù)流的演化特性,模型必須能夠適應數(shù)據(jù)流的變化。所以,本發(fā)明將利用基于數(shù)據(jù)驅動的方法實現(xiàn)狀態(tài)監(jiān)測數(shù)據(jù)流的實時異常檢測。
[0004]目前,基于數(shù)據(jù)驅動的流式數(shù)據(jù)的異常檢測主要分為三個不同的類別:基于統(tǒng)計的方法、基于數(shù)據(jù)挖掘的方法以及基于預測模型的方法。
[0005]基于統(tǒng)計的方法是應用于數(shù)據(jù)流異常檢測的早期方法,基于統(tǒng)計的方法假設正常的流式數(shù)據(jù)服從特定的分布或者在基本時間窗口內的均值或方差保持不變,基于統(tǒng)計的異常檢測方法已經(jīng)被應用于很多領域,包括通信網(wǎng)絡、安全交換系統(tǒng)以及傳感器網(wǎng)絡等;然而,應用統(tǒng)計方法進行異常檢測存在很多限制,其一般情況下只適用于統(tǒng)計量突變異常檢測?;跀?shù)據(jù)挖掘的方法涉及到頻繁項挖掘、聚類與分類等方法,其可應用于數(shù)值及文本數(shù)據(jù)流異常檢測。但是基于數(shù)據(jù)挖掘方法的異常檢測精度取決于訓練數(shù)據(jù)的完整性。為了實現(xiàn)分類數(shù)據(jù)模型的更新,新的模式要求使用者加入,因此,基于數(shù)據(jù)挖掘的方法不適宜于缺少專業(yè)知識情況下的監(jiān)測數(shù)據(jù)流異常檢測。而因為預測模型的廣泛發(fā)展,基于預測模型的異常檢測方法被提出,基于預測模型的方法通過判斷未來數(shù)據(jù)樣本是否落入預測區(qū)間來判斷其異常情況?;跀?shù)據(jù)驅動的預測方法不需要預先分類的訓練樣本,而且,其可以擴展到大量樣本,并能夠實現(xiàn)數(shù)據(jù)流的增量估計。現(xiàn)在基于預測模型的方法已經(jīng)應用于環(huán)境傳感器異常檢測、疾病疫情檢測等。
[0006]應用于數(shù)據(jù)流異常檢測的數(shù)據(jù)驅動預測模型包括樸素貝葉斯(Nai‘ve)、近鄰方法(NC, nearest cluster)、單層線性網(wǎng)絡(Single-layer linear network, LN)、多層感知器(MLP, Multilayer perception)、卡爾曼濾波(KF, Kalman Filter)等。其中,Nai've是一種應用于時間序列預測的非常流行的基礎算法。它通常應用于單點異常檢測,并作為數(shù)據(jù)建模的預處理方法。而MLP,LN and KF由于其本身并不能輸出不確定性表達,所以常常結合其他算法或者使用k層交叉檢驗算法來確定預測區(qū)間。然而,k層交叉檢驗算法或者其他算法的引入將降低檢測效率。
[0007]數(shù)據(jù)流隨著時間的推移,持續(xù)到達,存儲在內存中的數(shù)據(jù)增多,為了實時在線的估計數(shù)據(jù)流中未來的元素值,不能將滑動窗口模型中的所有有效元素都作為歷史數(shù)據(jù)輸入預測模型,采用預測模型進行異常檢測引入預測窗口技術,對于當前時刻t,其基本窗口的預測窗口為DT = {xt_q, xt_q+1,...,xt},根據(jù)此預測窗口的歷史數(shù)據(jù),預測xt+1正常時的均值和置信區(qū)間。其異常檢測框架如圖1所示。
[0008](I)把Dt作為訓練數(shù)據(jù),利用一步預測模型預測xt+1的值。一般自身不具備不確定性表達的預測模型需通過十層交叉檢驗的方法確定最終的預測模型,十層交叉檢驗方法將原始的訓練數(shù)據(jù)等分為10份,每次取1份作為測試數(shù)據(jù),其他作為訓練數(shù)據(jù),即模型被訓練十次,其中預測誤差的均值最小的一次訓練過程得到的模型參數(shù)將成為最終的預測模
型,從而得到預測的均值
[0009](2)用概率P計算正常情況下數(shù)據(jù)流在t+Ι時刻的數(shù)值波動范圍的上下限。其由下式?jīng)Q定:
【權利要求】
1.基于改進高斯過程回歸模型的狀態(tài)監(jiān)測數(shù)據(jù)流異常檢測方法,其特征在于它包括以下步驟: 步驟一:根據(jù)已經(jīng)獲得的離線單維狀態(tài)監(jiān)測數(shù)據(jù)X,利用自相關分析方法確定歷史數(shù)據(jù)滑動窗口尺寸,即q的值,并設定顯著水平α與假設檢驗中最大允許的犯第二類錯誤的概率β _ ; 步驟二:根據(jù)離線單維狀態(tài)監(jiān)測數(shù)據(jù)X的特征確定均值函數(shù)與協(xié)方差函數(shù)的類型;其中,所述均值函數(shù)設為常數(shù)O,協(xié)方差函數(shù)為平方指數(shù)協(xié)方差函數(shù)與噪聲函數(shù)的組合,其定義如下:
2.根據(jù)權利要求1所述的基于改進高斯過程回歸模型的狀態(tài)監(jiān)測數(shù)據(jù)流異常檢測方法,其特征在于:所述步驟五中利用共軛梯度法迭代搜索的迭代次數(shù)為100次。
3.根據(jù)權利要求1或2所述的基于改進高斯過程回歸模型的狀態(tài)監(jiān)測數(shù)據(jù)流異常檢測方法,其特征在于:所述步驟六中C(i,i)是將訓練數(shù)據(jù)DT帶入?yún)f(xié)方差函數(shù)中形成。
4.根據(jù)權利要求3所述的基于改進高斯過程回歸模型的狀態(tài)監(jiān)測數(shù)據(jù)流異常檢測方法,其特征在于:所述步驟六中K (i,t+Ι)是將訓練數(shù)據(jù)DT與預測數(shù)據(jù)帶入(I)式中的平方指數(shù)協(xié)方差函數(shù)k(i,j)中得到的協(xié)方差矩陣。
5.根據(jù)權利要求4所述的基于改進高斯過程回歸模型的狀態(tài)監(jiān)測數(shù)據(jù)流異常檢測方法,其特征在于:所述步驟六中K(t+l,t+l)是將測試數(shù)據(jù)帶入k(i,j)中得到的協(xié)方差矩陣。
【文檔編號】H04W24/04GK103974311SQ201410216320
【公開日】2014年8月6日 申請日期:2014年5月21日 優(yōu)先權日:2014年5月21日
【發(fā)明者】彭宇, 龐景月, 宋歌, 劉大同, 彭喜元 申請人:哈爾濱工業(yè)大學