国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于BCC?KNN的云計算中心智能運維方法及系統(tǒng)與流程

      文檔序號:12278185閱讀:468來源:國知局
      一種基于BCC?KNN的云計算中心智能運維方法及系統(tǒng)與流程

      本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤其涉及一種基于BCC-KNN的云計算中心智能運維方法及系統(tǒng)。



      背景技術(shù):

      NIST定義云計算是一個模型,用于隨時隨地的按需快速的通過網(wǎng)絡(luò)訪問一個可配置的計算資源(網(wǎng)絡(luò)、服務(wù)器、存儲、應(yīng)用程序和服務(wù))共享池。計算資源只需要很小的管理代價和與服務(wù)提供商較少的交互便能夠快速的獲取和釋放。云計算模型由5個基本特征、3種服務(wù)模型、4種部署模型組成。

      基本特征有按需自服務(wù)、資源池化、廣泛的網(wǎng)絡(luò)連接方式、快速的彈性擴展、可計量的服務(wù)。

      按需自服務(wù)是指用戶可以自主地根據(jù)需要單向地準備計算資源,不需要與服務(wù)提供商進行交互。

      資源池化是指服務(wù)提供者將計算資源匯集到資源池中(類型包括存儲、處理、內(nèi)存、帶寬、和虛擬機等),通過多租戶模式共享給多個消費者,根據(jù)消費者的需求對不同的物理資源和虛擬資源進行動態(tài)分配或重分配。以用戶為中心的界面使云基礎(chǔ)架構(gòu)能夠?qū)崿F(xiàn)應(yīng)用對用戶的透明性,用戶基于自已的需求訪問服務(wù)而不用考慮服務(wù)是在哪里提供。

      廣泛的網(wǎng)絡(luò)連接方式是指通過標準化,云計算提供的資源能夠被各種異構(gòu)的瘦終端或特定的客戶端,比如手機、平板電腦、工作站所訪問。

      快速的彈性擴展是云計算的一個很重要的特征,因為資源池化和快速彈性,用戶能夠獲取的資源似乎是無窮無盡的,并且可以在任何時候獲取任何數(shù)量的資源。彈性的重要性在于能夠按需分配資源,應(yīng)用程序駐留在可以快速進行水平擴展的數(shù)據(jù)中心中,即云服務(wù)的規(guī)??煽焖偕炜s,以自動適應(yīng)業(yè)務(wù)負載的動態(tài)變化。用戶使用的資源同業(yè)務(wù)的需求相一致,避免了因為服務(wù)器性能過載或冗余而導致的服務(wù)質(zhì)量下降或資源浪費。值得注意的是,資源的擴展必須是細粒度并且足夠快速才能使計算資源跟計算負載很好的匹配。因為服務(wù)器的峰值工作量比平均值要高3-10倍,所以傳統(tǒng)的數(shù)據(jù)中心的服務(wù)器利用率大概僅在10%到30%左右。為了保證服務(wù)質(zhì)量,服務(wù)器要按峰值工作量需求來部署,這就必然導致了非峰值時間資源的浪費,而且負載的波動性越強浪費的資源就越多。

      可計量的服務(wù)是指云系統(tǒng)利用一種計量功能來自動調(diào)控和優(yōu)化資源利用,根據(jù)不同的服務(wù)類型按照合適的度量指標進行計量、監(jiān)控和報告資源使用情況,提升服務(wù)提供者和服務(wù)消費者的透明度。

      然而,現(xiàn)在云計算中心的規(guī)模過大,傳統(tǒng)環(huán)境中的低頻異常在云計算中心就會因規(guī)?;兂筛哳l異常,并且許多的異常會重復出現(xiàn)。因此,若是不能利用有效的方式而是要人為負責大量異常的處理,這就會導致了較高的同種異常人工重復處理成本,即異常發(fā)生并處理后,當再次出現(xiàn)時人工還要重復處理過程。

      另外,云應(yīng)用本身在運行過程中會產(chǎn)生相關(guān)的狀態(tài)數(shù)據(jù),這些數(shù)據(jù)會指導運維人員對異常進行判定,但大量的云應(yīng)用產(chǎn)生的海量的運行狀態(tài)數(shù)據(jù)會導致運維人員要花費大量的時間和精力去分析這些數(shù)據(jù)來定位異常并判定其類型,延長了異常的修復時間。

      最后,由于傳統(tǒng)環(huán)境下的維護管理的手段、系統(tǒng)、模型的設(shè)計都不是面向云計算中心的,所以許多的維護任務(wù)不能用簡單的步驟一次完成,這就迫使云管理者要投入大量人力資源,導致較高的運營費用。



      技術(shù)實現(xiàn)要素:

      為了解決上述技術(shù)問題,本發(fā)明的目的是提供一種能快速處理異常情況,且能降低運營成本的一種基于BCC-KNN的云計算中心智能運維方法及系統(tǒng)。

      本發(fā)明所采用的技術(shù)方案是:

      一種基于BCC-KNN的云計算中心智能運維方法,包括以下步驟:

      A、檢測所有服務(wù)的運行狀態(tài)是否發(fā)生異常,并對發(fā)生異常的服務(wù)采集其運行狀態(tài)數(shù)據(jù);

      B、對采集得到的運行狀態(tài)數(shù)據(jù)進行處理并將其利用BCC-KNN算法進行分類處理;

      C、根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案并執(zhí)行。

      作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟A包括:

      A1、對所有服務(wù)的運行狀態(tài)數(shù)據(jù)進行循環(huán)檢測,判斷其是否發(fā)生異常,若是,則執(zhí)行步驟A2;否則進行執(zhí)行步驟A1;

      A2、對發(fā)生異常的服務(wù)進行運行狀態(tài)數(shù)據(jù)的采集。

      作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟B包括:

      B1、對采集得到的運行狀態(tài)數(shù)據(jù)進行篩選處理;

      B2、將處理后的運行狀態(tài)數(shù)據(jù)轉(zhuǎn)換成符合BCC-KNN算法的數(shù)據(jù)格式;

      B3、對轉(zhuǎn)換格式后的運行狀態(tài)數(shù)據(jù)利用BCC-KNN算法進行實時分類處理,得出服務(wù)對應(yīng)的異常類別。

      作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟B3包括:

      B31、將存儲的實例集按照異常類別進行劃分聚簇;

      B32、計算各聚簇內(nèi)所有實例的數(shù)據(jù)的均值,得到異常聚簇中心;

      B33、對未分類的運行狀態(tài)數(shù)據(jù)與各異常聚簇中心進行相似度計算,將其歸類至與其相似度最高的異常聚簇中心所在的聚簇,并將該聚簇的異常類別作為其對應(yīng)的異常類別,從而得到該服務(wù)對應(yīng)的異常類別。

      作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟C包括:

      C1、根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案;

      C2、根據(jù)需要調(diào)用的解決方案,生成其自動化執(zhí)行腳本,并執(zhí)行。

      作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟C2后還包括:

      C3、檢測腳本執(zhí)行后該異常是否處理成功,若不成功,則發(fā)送警報通知工作人員進行人為處理;

      C4、根據(jù)分類后聚簇的運行狀態(tài)數(shù)據(jù),對聚簇的異常聚簇中心進行更新。

      本發(fā)明所采用的另一技術(shù)方案是:

      一種基于BCC-KNN的云計算中心智能運維系統(tǒng),包括:

      異常狀態(tài)采集模塊,用于檢測所有服務(wù)的運行狀態(tài)是否發(fā)生異常,并對發(fā)生異常的服務(wù)采集其運行狀態(tài)數(shù)據(jù);

      異常檢測模塊,用于對采集得到的運行狀態(tài)數(shù)據(jù)進行處理并將其利用BCC-KNN算法進行分類處理;

      異常處理模塊,用于根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案并執(zhí)行。

      作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常狀態(tài)采集模塊包括:

      運行狀態(tài)檢測模塊,用于對所有服務(wù)的運行狀態(tài)數(shù)據(jù)進行循環(huán)檢測,判斷其是否發(fā)生異常,若是,則執(zhí)行數(shù)據(jù)采集模塊;否則進行執(zhí)行運行狀態(tài)檢測模塊;

      數(shù)據(jù)采集模塊,用于對發(fā)生異常的服務(wù)進行運行狀態(tài)數(shù)據(jù)的采集。

      作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常檢測模塊包括:

      數(shù)據(jù)處理模塊,用于對采集得到的運行狀態(tài)數(shù)據(jù)進行篩選處理;

      數(shù)據(jù)轉(zhuǎn)換模塊,用于將處理后的運行狀態(tài)數(shù)據(jù)轉(zhuǎn)換成符合BCC-KNN算法的數(shù)據(jù)格式;

      數(shù)據(jù)分類模塊,用于對轉(zhuǎn)換格式后的運行狀態(tài)數(shù)據(jù)利用BCC-KNN算法進行實時分類處理,得出服務(wù)對應(yīng)的異常類別。

      作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常處理模塊包括:

      處理方案生成模塊,用于根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案;

      自動化執(zhí)行模塊,用于根據(jù)需要調(diào)用的解決方案,生成其自動化執(zhí)行腳本,并執(zhí)行。

      本發(fā)明的有益效果是:

      本發(fā)明一種基于BCC-KNN的云計算中心智能運維方法通過對異常情況依次進行檢測、判定和自動化解決執(zhí)行的過程,能對云服務(wù)發(fā)生的異常情況進行智能自主處理,有效減少人為的介入,提高異常處理的速度,實現(xiàn)提高服務(wù)的可用性和減少工作人員的工作量的目的,大大減少運營成本。

      本發(fā)明的另一個有益效果是:

      本發(fā)明一種基于BCC-KNN的云計算中心智能運維系統(tǒng)通過異常狀態(tài)采集模塊、異常檢測模塊和異常處理模塊對異常情況依次進行檢測、判定和自動化解決執(zhí)行的過程,能對云服務(wù)發(fā)生的異常情況進行智能自主處理,有效減少人為的介入,提高異常處理的速度,實現(xiàn)提高服務(wù)的可用性和減少工作人員的工作量的目的,大大減少運營成本。

      附圖說明

      下面結(jié)合附圖對本發(fā)明的具體實施方式作進一步說明:

      圖1是本發(fā)明一種基于BCC-KNN的云計算中心智能運維方法的步驟流程圖;

      圖2是本發(fā)明一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的模塊方框圖。

      具體實施方式

      參考圖1,本發(fā)明一種基于BCC-KNN的云計算中心智能運維方法,包括以下步驟:

      A、檢測所有服務(wù)的運行狀態(tài)是否發(fā)生異常,并對發(fā)生異常的服務(wù)采集其運行狀態(tài)數(shù)據(jù);

      B、對采集得到的運行狀態(tài)數(shù)據(jù)進行處理并將其利用BCC-KNN算法進行分類處理;

      C、根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案并執(zhí)行。

      作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟A包括:

      A1、對所有服務(wù)的運行狀態(tài)數(shù)據(jù)進行循環(huán)檢測,判斷其是否發(fā)生異常,若是,則執(zhí)行步驟A2;否則進行執(zhí)行步驟A1;

      A2、對發(fā)生異常的服務(wù)進行運行狀態(tài)數(shù)據(jù)的采集。

      其中,對機器或服務(wù)進行檢測,若發(fā)生異常則采集異常發(fā)生時的運行狀態(tài)數(shù)據(jù)。這里需要預先對正常情況數(shù)據(jù)進行設(shè)定范圍,超過則判定為異常,比如對某項服務(wù)要求是對一個請求的響應(yīng)時間不能超過3秒,因此編寫的檢測工具就可以是對訪問時間進行計時,超過三秒即認為該服務(wù)發(fā)生異常,然后對該服務(wù)進行循環(huán)檢測,當發(fā)生異常時(相應(yīng)時間超3秒)便采集該服務(wù)的運行狀態(tài)數(shù)據(jù)。

      作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟B包括:

      B1、對采集得到的運行狀態(tài)數(shù)據(jù)進行篩選處理;

      B2、將處理后的運行狀態(tài)數(shù)據(jù)轉(zhuǎn)換成符合BCC-KNN算法的數(shù)據(jù)格式;

      B3、對轉(zhuǎn)換格式后的運行狀態(tài)數(shù)據(jù)利用BCC-KNN算法進行實時分類處理,得出服務(wù)對應(yīng)的異常類別。

      BCC-KNN算法主要有三個優(yōu)點,第一點在于在存在傾斜類分布的情況下仍然具備較好的分類性能,第二點在于改進了傳統(tǒng)KNN需要存儲整個訓練集的缺點,只需存儲由訓練集轉(zhuǎn)換的數(shù)據(jù)結(jié)構(gòu),大副降低存儲代價并提高分類的實時性,第三點在于BCC-KNN支持增量學習,能隨著異常數(shù)據(jù)的不斷產(chǎn)生自主進化,持續(xù)的適應(yīng)新的環(huán)境。

      進一步,所述對采集得到的運行狀態(tài)數(shù)據(jù)進行篩選處理包括處理無效值、缺失值并去除不完整的數(shù)據(jù)、錯誤的數(shù)據(jù)、重復的數(shù)據(jù)使得注入處理系統(tǒng)的數(shù)據(jù)量降低,加快數(shù)據(jù)的處理速度進而提升處理效率。

      進一步,將處理后的運行狀態(tài)數(shù)據(jù)轉(zhuǎn)換成符合BCC-KNN算法的數(shù)據(jù)格式包含將數(shù)據(jù)轉(zhuǎn)換成其它合適的數(shù)值表示方式,或者對數(shù)據(jù)進行歸一化處理,使得每個屬性的取值范圍不會相差過大,并且數(shù)據(jù)的每個屬性都是可計算的。

      作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟B3包括:

      B31、將存儲的實例集按照異常類別進行劃分聚簇;

      B32、計算各聚簇內(nèi)所有實例的數(shù)據(jù)的均值,得到異常聚簇中心;

      B33、對未分類的運行狀態(tài)數(shù)據(jù)與各異常聚簇中心進行相似度計算,將其歸類至與其相似度最高的異常聚簇中心所在的聚簇,并將該聚簇的異常類別作為其對應(yīng)的異常類別,從而得到該服務(wù)對應(yīng)的異常類別。

      作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟C包括:

      C1、根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案;

      C2、根據(jù)需要調(diào)用的解決方案,生成其自動化執(zhí)行腳本,并執(zhí)行。

      進一步,解決方案的生成調(diào)用是利用相對簡單的異常處理方案組合而成,也就是說一個異常解決方案是由很多個子方案構(gòu)成,這樣可以增加方案的靈活性和重用性。解決方案需要按照預先定義好的格式進行編寫,執(zhí)行時可以根據(jù)機器的環(huán)境自動生成相對應(yīng)的腳本。

      作為所述的一種基于BCC-KNN的云計算中心智能運維方法的進一步改進,所述步驟C2后還包括:

      C3、檢測腳本執(zhí)行后該異常是否處理成功,若不成功,則發(fā)送警報通知工作人員進行人為處理;

      C4、根據(jù)分類后聚簇的運行狀態(tài)數(shù)據(jù),對聚簇的異常聚簇中心進行更新。

      進一步,當一個新異常出現(xiàn)時,已存的方案不能很好的進行處理導致處理失敗,此時就需要通知工作人員進行人為編寫解決方案并放入方案庫,更新異常類別和方案的對應(yīng)關(guān)系,同時將新的異常狀態(tài)加入訓練集用以提高該類的預測準確率,進而當該異常狀態(tài)再次出現(xiàn)時就能夠自主處理而不用人為再次參與。

      參考圖2,本發(fā)明一種基于BCC-KNN的云計算中心智能運維系統(tǒng),包括:

      異常狀態(tài)采集模塊,用于檢測所有服務(wù)的運行狀態(tài)是否發(fā)生異常,并對發(fā)生異常的服務(wù)采集其運行狀態(tài)數(shù)據(jù);

      異常檢測模塊,用于對采集得到的運行狀態(tài)數(shù)據(jù)進行處理并將其利用BCC-KNN算法進行分類處理;

      異常處理模塊,用于根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案并執(zhí)行。

      作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常狀態(tài)采集模塊包括:

      運行狀態(tài)檢測模塊,用于對所有服務(wù)的運行狀態(tài)數(shù)據(jù)進行循環(huán)檢測,判斷其是否發(fā)生異常,若是,則執(zhí)行數(shù)據(jù)采集模塊;否則進行執(zhí)行運行狀態(tài)檢測模塊;

      數(shù)據(jù)采集模塊,用于對發(fā)生異常的服務(wù)進行運行狀態(tài)數(shù)據(jù)的采集。

      作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常檢測模塊包括:

      數(shù)據(jù)處理模塊,用于對采集得到的運行狀態(tài)數(shù)據(jù)進行篩選處理;

      數(shù)據(jù)轉(zhuǎn)換模塊,用于將處理后的運行狀態(tài)數(shù)據(jù)轉(zhuǎn)換成符合BCC-KNN算法的數(shù)據(jù)格式;

      數(shù)據(jù)分類模塊,用于對轉(zhuǎn)換格式后的運行狀態(tài)數(shù)據(jù)利用BCC-KNN算法進行實時分類處理,得出服務(wù)對應(yīng)的異常類別。

      作為所述的一種基于BCC-KNN的云計算中心智能運維系統(tǒng)的進一步改進,所述異常處理模塊包括:

      處理方案生成模塊,用于根據(jù)分類后得到的異常類別從方案庫調(diào)用相應(yīng)的解決方案;

      自動化執(zhí)行模塊,用于根據(jù)需要調(diào)用的解決方案,生成其自動化執(zhí)行腳本,并執(zhí)行。

      其中,本發(fā)明中的BCC-KNN算法核心思想是將訓練實例集轉(zhuǎn)換成異常聚簇中心集。一個異常類別包含許多的實例,每個實例有自已的具體屬性數(shù)據(jù),我們依據(jù)異常類別將實例進行劃分,即具有相同異常類別的所有實例屬于同一個聚簇。

      當HTTP數(shù)據(jù)集按異常類別劃分后,同一個劃分內(nèi)的實例類別相同,因此每個類別可以看作是一個聚簇。因為傳統(tǒng)KNN算法要和每個全部訓練集實例進行相似度運算,這就有很大的計算開銷并且要將整個訓練集存儲起來,所以我們?nèi)裟軐澐趾蟮木鄞赜靡粋€模型表示,那么就能將訓練數(shù)據(jù)集轉(zhuǎn)換成了模型,我們采用的模型就是計算聚簇內(nèi)的所有的實例的均值,并將這個均值作為聚簇的中心,這樣每個聚簇就只需要一條記錄即可表示,存儲量大大降低。有了異常聚簇中心集后,就要對未分類的實例進行分類,算法將未分類的實例與轉(zhuǎn)換后的異常聚簇中心進行相似度計算,而不是和整個訓練集計算相似度,然后將相似度最高的聚簇中心的異常類別作為實例的類別。具體的說就是利用KNN算法的思想,將未分類的實例與每個聚簇中心進行相似度計算。若相似度采用歐式距離,那么在和所有的聚簇中心依次計算距離后,將與其距離最近的聚簇中心所在的異常類別作為該實例的分類結(jié)果。因為算法的分類采用相似度計算,并且選取相似度最高的聚簇中心作為實例的分類結(jié)果,即K的取值為1,這就降低偏斜類分布的影響。

      另外,算法將訓練集轉(zhuǎn)換成異常聚簇中心,使得算法只需與異常聚簇中心而不是和整個訓練集進行相似度計算,這樣不但使得分類的速度大大加快降低時間復雜度,同時也降低了空間復雜度,因為同樣只需要存儲聚簇中心而不是整個訓練集,使得所有的異常聚簇中心可以全部放入內(nèi)存,有利于聚簇中心的快速更新,此處的重要性在于時間和空間復雜度的降低使得算法能夠大幅提高分類的實時性。

      因為BCC-KNN將數(shù)據(jù)集轉(zhuǎn)換為異常聚簇中心集,所以為了實現(xiàn)增量式學習算法要能根據(jù)新產(chǎn)生異常實例來調(diào)整異常聚簇中心集,將新知識與舊知識結(jié)合,使得異常聚簇中心集能隨著新知識的加入不斷調(diào)整適應(yīng)新的環(huán)境。同時為了防止過期的舊知識對新環(huán)境的處理造成影響,還要丟棄過期的部分聚簇中心值。當產(chǎn)生異常實例時,異常的類別只有新的異常和已經(jīng)發(fā)生異常兩種類型。針對這兩種類型的異常算法的增量學習策略如下:

      若異常是已經(jīng)發(fā)生過的,那么就將該異常實例劃分到該異常類別對應(yīng)的聚簇中,然后基于該實例與聚簇中心重新計算聚簇中心。

      若異常是新的異常,那么此時就將該異常實例劃分為一個新的聚簇,然后將該實例作為聚簇中心。

      存儲了異常聚簇中心集后,異常實例產(chǎn)生后我們要對異常聚簇中心進行更新,我們用(Anew,Bnew,Cnew,Nnew…,class)向量來描述新產(chǎn)生的HTTP數(shù)據(jù)和異常的類別正確對應(yīng),具體為(0.75,0.78,0.79,0.29,0,0.77,負載過高),記為(VCTnew,class)。首先我們判定class的值,因class的值“負載過高”能在聚簇列別中找到,就說明產(chǎn)生的異常實例是已經(jīng)發(fā)生過的,那么直接將該異常實例與其異常類別對應(yīng)的聚簇中心進行平均值計算。負載過高對應(yīng)的聚簇中心向量CLUcenter進行平均值計算,新中心向量記為NEWCLUcenter,因此計算公式如下:

      若異常實例所屬的異常類別是第一次出現(xiàn),我們同樣用(VCTnew,class)來描述,具體的數(shù)據(jù)與異常類別對應(yīng)為(0.8,0.1,0.1,0,0,0,配置錯誤),即其class的值為配置錯誤。由于異常聚簇中心集中就沒有配置錯誤類別對應(yīng)的聚簇條目,因此可知該異常類別是第一次發(fā)生,所以我們要將該異常實例劃分到一個新的聚簇中,聚簇對應(yīng)的類別就是配置錯誤,而實例的聚簇中心NEWCLUcenter就初始化為(VCTnew,class)。

      通過前面的描述,可知算法能夠根據(jù)新產(chǎn)生的異常實例不斷調(diào)整異常聚簇中心集,但是為了防止舊數(shù)據(jù)對利用新知識分類這個過程的影響,算法會丟棄過期的數(shù)據(jù),算法定義一個固定時間段,這也是數(shù)據(jù)的有效期,那么隨著時間的流逝,超過有效期的數(shù)據(jù)就會被丟棄,這樣就使得異常聚簇中心集總是能夠持續(xù)的適應(yīng)最新的環(huán)境。

      由于我們的聚簇中心是計算該異常類別下所有實例的平均值,因此,為了刪除過期的數(shù)據(jù),我們給異常聚簇中心集中的每個數(shù)據(jù)條目一個時間戳,然后將時間戳在有效期內(nèi)的子聚簇中心組合共同來計算平均值。簡單說就是聚簇中心由幾個子中心構(gòu)成,每個子中心都有自己的時間戳,隨時間流逝,過期的時間戳標識的子聚簇中心就被刪除,不能再被用作生成聚簇中心。

      比如我們把過期時間限定為三個月,以月為單位刪除舊數(shù)據(jù),那么我們可以將每個月作為一個子聚類中心,因此就有3個子聚簇中心,假設(shè)當前月為0,上個月為1,上上個月為2。實際的聚簇中心是由三個子聚簇中心算出的,我們用CLU0sub-center來表示時間戳為0的條目,CLU1sub-center來表示時間戳為1的條目,CLU2sub-center來表示時間戳為2的條目,并假設(shè)我們用(中心屬性Areal,中心屬性Breal,中心屬性Creal…)向量來表示負載過高異常類別的聚簇中心,記為CLUreal-center,而這個聚簇中心是真正用來計算相似度的使用的,那么CLUreal-center計算公式如下;

      當時間進入新的月份后,所有新產(chǎn)生的實例都標識為新月份的時間戳,子聚簇中心的初始化過程和新異常類別發(fā)生的過程相似,即將新月份內(nèi)產(chǎn)生的第一個該異常類別的實例作為子聚簇中心,其后的產(chǎn)生的實例與再與該子聚簇中心重新計算均值。接下來要將時間超過三個月的子聚簇中心刪除,以多時間戳聚簇中心集為例,當進入新的月份時,每個時間戳的值加1,異常聚簇中心集中的所有時間戳標識大于2的條目應(yīng)被刪除。我們假設(shè)進入新月份產(chǎn)生的負載過高異常為(0.73,0.782,0.80,0.22,0,0.76,負載過高)。

      以上是對本發(fā)明的較佳實施進行了具體說明,但本發(fā)明創(chuàng)造并不限于所述實施例,熟悉本領(lǐng)域的技術(shù)人員在不違背本發(fā)明精神的前提下還可做作出種種的等同變形或替換,這些等同的變形或替換均包含在本申請權(quán)利要求所限定的范圍內(nèi)。

      當前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1