本說明書實(shí)施例涉及計算機(jī),尤其是一種告警關(guān)聯(lián)分析方法、裝置和計算機(jī)設(shè)備。
背景技術(shù):
1、隨著系統(tǒng)架構(gòu)的復(fù)雜多樣,運(yùn)維領(lǐng)域的統(tǒng)一告警平臺的告警數(shù)量變得非常龐大。為了降低故障對業(yè)務(wù)的影響、縮短故障處置耗時,需從海量告警中識別出同源、相關(guān)告警。
2、現(xiàn)有的技術(shù)方案中,通過對每一條告警,識別出告警對象并標(biāo)注實(shí)例對象、進(jìn)而調(diào)用后臺配置管理平臺、消費(fèi)實(shí)例對象之間的關(guān)聯(lián)關(guān)系,從而來確定告警之間的關(guān)聯(lián)關(guān)系。但現(xiàn)有的解決方案開展的前提條件,是定位告警對象的實(shí)例對象;但由于各種原因,告警對象和配置管理里的實(shí)例對象通常不是一一對應(yīng)的關(guān)系,使得實(shí)際應(yīng)用該解決方案時,一條告警可能對應(yīng)到零個、一個或者多個實(shí)例對象。此外,配置管理內(nèi)不同實(shí)例對象間的關(guān)聯(lián)關(guān)系,通常是“部署”關(guān)系,例如,數(shù)據(jù)庫部署在主機(jī)上、主機(jī)部署在交換機(jī)某個端口上等等。這樣的關(guān)聯(lián)關(guān)系不夠豐富,在實(shí)際生產(chǎn)中有效性有限。真實(shí)環(huán)境里的關(guān)聯(lián)關(guān)系,還可能是除“部署”以外的其他關(guān)系,而這種情況無法通過現(xiàn)有解決方案中的實(shí)例對象關(guān)聯(lián)識別。使得現(xiàn)有的故障分析,存在不全面、不準(zhǔn)確的問題。
3、有鑒于此,本說明書實(shí)施例旨在提供一種告警關(guān)聯(lián)分析方法、裝置和計算機(jī)設(shè)備。
技術(shù)實(shí)現(xiàn)思路
1、針對現(xiàn)有技術(shù)的上述問題,本說明書實(shí)施例的目的在于,提供一種告警關(guān)聯(lián)分析方法、裝置和計算機(jī)設(shè)備,以解決現(xiàn)有技術(shù)中難以從龐大的告警中識別出關(guān)聯(lián)告警和從關(guān)聯(lián)告警中識別出根因告警的問題。
2、為了解決上述技術(shù)問題,本說明書實(shí)施例的具體技術(shù)方案如下:
3、第一方面,本說明書實(shí)施例提供一種告警關(guān)聯(lián)分析方法,包括:
4、根據(jù)預(yù)設(shè)滑動時間窗口,獲取目標(biāo)告警;
5、將所述目標(biāo)告警投影在預(yù)先確定的各個維度上,得到所述目標(biāo)告警在各個維度上的特征值;
6、根據(jù)所述特征值對所述目標(biāo)告警進(jìn)行篩選收斂,得到關(guān)聯(lián)告警集合;
7、根據(jù)所述關(guān)聯(lián)告警集合中的各個關(guān)聯(lián)告警的主維度,確定所述關(guān)聯(lián)告警集合中的根因告警。
8、具體地,根據(jù)預(yù)設(shè)滑動時間窗口,獲取目標(biāo)告警,為:
9、根據(jù)開始時間節(jié)點(diǎn)和所述滑動時間窗口,獲取若干目標(biāo)告警;
10、將所述若干目標(biāo)告警中發(fā)生時間最晚的一個目標(biāo)告警作為標(biāo)記目標(biāo)告警,以所述標(biāo)記目標(biāo)告警發(fā)生時間更新所述開始時間節(jié)點(diǎn),判斷在更新的開始時間節(jié)點(diǎn)后的滑動時間窗口內(nèi),是否發(fā)生有其他告警;
11、若是,則確定所述其他告警為目標(biāo)告警,并重復(fù)上一步驟,直至在更新的開始時間節(jié)點(diǎn)后的滑動時間窗口內(nèi),未發(fā)生有其他告警。
12、進(jìn)一步的,根據(jù)所述特征值對所述目標(biāo)告警進(jìn)行篩選收斂,得到關(guān)聯(lián)告警集合,為:
13、將所述目標(biāo)告警中的任意一個告警作為待關(guān)聯(lián)告警;
14、判斷所述待關(guān)聯(lián)告警與所述目標(biāo)告警中除所述待關(guān)聯(lián)告警外的任意一個告警之間,是否存在特征值相同的維度;
15、若是,則判斷所述待關(guān)聯(lián)告警為關(guān)聯(lián)告警,由所述關(guān)聯(lián)告警構(gòu)成的集合為所述關(guān)聯(lián)告警集合。
16、具體地,根據(jù)所述關(guān)聯(lián)告警集合中的各個關(guān)聯(lián)告警的主維度,確定所述關(guān)聯(lián)告警集合中的根因告警,包括:
17、對所述關(guān)聯(lián)告警集合中的各個關(guān)聯(lián)告警,按照其主維度的層級進(jìn)行排序;
18、將所述排序結(jié)果中,主維度層級最低的關(guān)聯(lián)告警為根因告警。
19、進(jìn)一步地,確定所述關(guān)聯(lián)告警集合中的根因告警,包括:
20、判斷所述排序結(jié)果中,主維度層級最低的關(guān)聯(lián)告警的數(shù)量是否不止一個;
21、若是,則確定主維度層級最低的關(guān)聯(lián)告警中發(fā)生時間最早的一個為所述根因告警。
22、優(yōu)選地,所述方法還包括:
23、根據(jù)預(yù)設(shè)的各個維度的權(quán)重,計算所述根因告警和所述關(guān)聯(lián)告警集合中其他各個關(guān)聯(lián)告警之間的關(guān)聯(lián)度;
24、將所述關(guān)聯(lián)度滿足預(yù)設(shè)關(guān)聯(lián)度條件的關(guān)聯(lián)告警與所述根因告警進(jìn)行關(guān)聯(lián)輸出。
25、優(yōu)選地,所述方法還包括:
26、根據(jù)預(yù)設(shè)的各個維度的權(quán)重,采集所述關(guān)聯(lián)告警集合中與所述根因告警在滿足預(yù)設(shè)權(quán)重閾值的維度上有相同特征值的各其他關(guān)聯(lián)告警;
27、將各其他關(guān)聯(lián)告警與所述根因告警進(jìn)行關(guān)聯(lián)輸出。
28、第二方面,本說明書實(shí)施例提供一種告警關(guān)聯(lián)分析裝置,包括:
29、獲取模塊,用于根據(jù)預(yù)設(shè)滑動時間窗口,獲取目標(biāo)告警;
30、投影模塊,用于將所述目標(biāo)告警投影在預(yù)先確定的各個維度上,得到所述目標(biāo)告警在各個維度上的特征值;
31、收斂模塊,用于根據(jù)所述特征值對所述目標(biāo)告警進(jìn)行篩選收斂,得到關(guān)聯(lián)告警集合;
32、確定模塊,用于根據(jù)所述關(guān)聯(lián)告警集合中的各個關(guān)聯(lián)告警的主維度,確定所述關(guān)聯(lián)告警集合中的根因告警。
33、第三方面,本說明書實(shí)施例提供一種計算機(jī)設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時實(shí)現(xiàn)如上述技術(shù)方案提供的方法。
34、第四方面,本說明書實(shí)施例提供一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)如上述技術(shù)方案提供的方法。
35、第五方面,本說明書實(shí)施例提供一種計算機(jī)程序產(chǎn)品,包括至少一條指令或至少一段程序,所述至少一條指令或所述至少一段程序由處理器加載并執(zhí)行以實(shí)現(xiàn)如上述技術(shù)方案提供的方法。
36、采用上述技術(shù)方案,本說明書實(shí)施例提供的一種告警關(guān)聯(lián)分析方法、裝置和計算機(jī)設(shè)備,通過投影的方式得到目標(biāo)告警在各個維度上的特征值進(jìn)而確定存在關(guān)聯(lián)關(guān)系的目標(biāo)告警,得到關(guān)聯(lián)告警集合;再根據(jù)告警所屬主維度,定位關(guān)聯(lián)告警集合中的根因告警,實(shí)現(xiàn)了從數(shù)量龐大的告警中關(guān)聯(lián)告警和根因告警的識別和定位,能夠減少無關(guān)、冗余告警的干擾,有利于運(yùn)維管理和故障分析、縮短運(yùn)維人員故障處理所需耗費(fèi)的時間以及降低故障對業(yè)務(wù)帶來的不利影響。并且,無需對現(xiàn)有的配置管理平臺進(jìn)行改進(jìn),成本低廉;對關(guān)聯(lián)告警和根因告警的識別和定位簡單、便捷。
37、為讓本說明書實(shí)施例的上述和其他目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附圖式,作詳細(xì)說明如下。
1.一種告警關(guān)聯(lián)分析方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)預(yù)設(shè)滑動時間窗口,獲取目標(biāo)告警,進(jìn)一步為:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述特征值對所述目標(biāo)告警進(jìn)行篩選收斂,得到關(guān)聯(lián)告警集合,進(jìn)一步為:
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述關(guān)聯(lián)告警集合中的各個關(guān)聯(lián)告警的主維度,確定所述關(guān)聯(lián)告警集合中的根因告警,進(jìn)一步包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,確定所述關(guān)聯(lián)告警集合中的根因告警,進(jìn)一步包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
8.一種告警關(guān)聯(lián)分析裝置,其特征在于,包括:
9.一種計算機(jī)設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運(yùn)行的計算機(jī)程序,其特征在于,所述處理器執(zhí)行所述計算機(jī)程序時實(shí)現(xiàn)如權(quán)利要求1至7任意一項所述的方法。
10.一種計算機(jī)可讀存儲介質(zhì),其特征在于,所述計算機(jī)可讀存儲介質(zhì)存儲有計算機(jī)程序,所述計算機(jī)程序被處理器執(zhí)行時實(shí)現(xiàn)如權(quán)利要求1至7任意一項所述的方法。
11.一種計算機(jī)程序產(chǎn)品,其特征在于,包括至少一條指令或至少一段程序,所述至少一條指令或所述至少一段程序由處理器加載并執(zhí)行以實(shí)現(xiàn)如權(quán)利要求1至7任意一項所述的方法。