1.一種面向高性能計算系統(tǒng)的異常檢測方法,其特征在于,包括:
2.根據(jù)權利要求1所述的方法,其特征在于,獲取計算系統(tǒng)中計算結點對應的監(jiān)控指標切分后的數(shù)據(jù)片段,包括:
3.根據(jù)權利要求2所述的方法,其特征在于,利用提取的實時的監(jiān)控指標的特征與聚類簇進行模式匹配,包括:
4.根據(jù)權利要求2所述的方法,其特征在于,所述監(jiān)控指標,包括系統(tǒng)層面指標、應用層面指標、網(wǎng)絡層面指標;其中,所述系統(tǒng)層面指標,包括cpu使用率、內(nèi)存使用率、磁盤i/o、磁盤空間、網(wǎng)絡流量、進程狀態(tài)和系統(tǒng)負載;
5.根據(jù)權利要求1所述的方法,其特征在于,利用所述數(shù)據(jù)片段中靠近聚類簇質心的部分數(shù)據(jù)片段訓練共享模型,包括:
6.根據(jù)權利要求5所述的方法,其特征在于,所述方法,還包括:
7.根據(jù)權利要求6所述的方法,其特征在于,所述方法,還包括沿著時間軸定義滑動窗口,當所述異常分數(shù)超過k-sigma的上界時,則判斷數(shù)據(jù)點為異常;其中,k是控制異常分數(shù)的閾值靈敏度的預定義參數(shù)。
8.一種面向高性能計算系統(tǒng)的異常檢測系統(tǒng),其特征在于,包括:
9.一種計算機設備,其特征在于,包括處理器和存儲器;
10.一種非臨時性計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時以用于實現(xiàn)如權利要求1-7中任一一項所述的面向高性能計算系統(tǒng)的異常檢測方法。