本技術(shù)涉及數(shù)據(jù)處理的,尤其是涉及一種數(shù)據(jù)中心的故障排查方法、系統(tǒng)、終端及存儲介質(zhì)。
背景技術(shù):
1、數(shù)據(jù)中心是用于集中存儲、管理和分發(fā)數(shù)據(jù)的設(shè)施,通常包括大量的服務(wù)器、存儲設(shè)備和網(wǎng)絡(luò)設(shè)備。它們在現(xiàn)代信息技術(shù)架構(gòu)中扮演著至關(guān)重要的角色,廣泛應用于云計算、網(wǎng)站托管、企業(yè)數(shù)據(jù)管理等領(lǐng)域。
2、相關(guān)技術(shù)中,對于數(shù)據(jù)中心的監(jiān)控技術(shù)也是越發(fā)成熟,通過設(shè)備使用數(shù)據(jù)、工況數(shù)據(jù)、主機及配件性能數(shù)據(jù)、配件更換數(shù)據(jù)等設(shè)備與服務(wù)數(shù)據(jù),進行設(shè)備故障、服務(wù)、配件需求的預測,為主動服務(wù)提供技術(shù)支撐,延長設(shè)備使用壽命,降低故障率。
3、但是由于目前大多都是對于設(shè)備內(nèi)部數(shù)據(jù)進行監(jiān)控,無法對設(shè)備外部進行監(jiān)控,因此若是由于設(shè)備外部因素導致數(shù)據(jù)中心異常,則很容易出現(xiàn)發(fā)現(xiàn)不及時的情況,從而無法及時對故障處進行檢修。
技術(shù)實現(xiàn)思路
1、為了提高對數(shù)據(jù)中心監(jiān)控的全面性以及及時定位故障處,本技術(shù)提供一種數(shù)據(jù)中心的故障排查方法、系統(tǒng)、終端及存儲介質(zhì)。
2、第一方面,本技術(shù)提供一種數(shù)據(jù)中心的故障排查方法,采用如下技術(shù)方案:
3、一種數(shù)據(jù)中心的故障排查方法,包括:
4、根據(jù)數(shù)據(jù)中心內(nèi)設(shè)備的數(shù)量及位置,構(gòu)建故障巡視軌跡;
5、控制巡視攝像頭按照所述故障巡視軌跡對數(shù)據(jù)中心進行周期性巡視;
6、獲取巡視過程中所述巡視攝像頭采集的巡視視頻流;
7、根據(jù)所述巡視視頻流,判斷數(shù)據(jù)中心是否存在異常;
8、若是,則定位異常位置,并發(fā)送報警信息。
9、通過采用上述技術(shù)方案,除了對設(shè)備內(nèi)運行數(shù)據(jù)的監(jiān)控,還可以通過構(gòu)建故障巡視軌跡,從而控制巡視攝像頭按照故障巡視軌跡進行周期性巡視,從而根據(jù)獲獲取的巡視視頻流,判斷數(shù)據(jù)中心是否存在異常,進而定位異常位置,并發(fā)送報警信息,以實現(xiàn)對設(shè)備外部的監(jiān)控,從而提高數(shù)據(jù)中心監(jiān)控的全面性以及能夠及時定位故障處。
10、可選的,所述發(fā)送報警信息之后,包括:
11、調(diào)取預建立的故障影響因素表,所述故障影響因素表能夠?qū)崟r更新;
12、從所述故障影響因素表中查找與所述異常位置關(guān)聯(lián)的設(shè)備信息,所述設(shè)備信息包括設(shè)備所處環(huán)境數(shù)據(jù)、運行時間及維護時間;
13、根據(jù)所述設(shè)備信息,分析故障原因。
14、通過采用上述技術(shù)方案,建立故障影響因素表,故障影響因素表內(nèi)的環(huán)境數(shù)據(jù)、運行時間實時更新,維護人員對設(shè)備維護后,維護時間進行更新;在設(shè)備故障后,可以通過設(shè)備當前關(guān)聯(lián)的環(huán)境數(shù)據(jù)、運行時間及維護時間分析故障原因,從而提高故障原因分析效率。
15、可選的,所述故障排查方法還包括:
16、根據(jù)所述故障影響因素表,獲取故障頻發(fā)處的重點位置;
17、獲取巡視攝像頭的實時位置;
18、獲取所述實時位置與所述巡視攝像頭當前軌跡前進方向上的所述重點位置之間的區(qū)域間距;
19、判斷所述區(qū)域間距是否在間距閾值內(nèi);
20、若是,則降低所述巡視攝像頭的移動速度;
21、在所述巡視攝像頭經(jīng)過所述重點位置,且所述區(qū)域間距脫離所述間距閾值后,恢復所述巡視攝像頭的移動速度。
22、通過采用上述技術(shù)方案,當巡視攝像頭靠近重點位置后,說明此時巡視攝像頭正在向故障頻發(fā)處移動,因此,可以通過降低巡視攝像頭的移動速度,從而間接延長巡視攝像頭采集故障頻發(fā)處巡視視頻流的時長,從而提高故障排查的準確性。
23、可選的,所述降低所述巡視攝像頭的移動速度的步驟包括:
24、構(gòu)建速度變化模型;其中,v表示巡視攝像頭的移動速度,d表示區(qū)域間距,d0表示間距閾值,k表示正常數(shù),表征速度的最大可能值,a表示正常數(shù),表征模型曲線陡峭的程度;
25、根據(jù)所述速度變化模型,降低所述移動速度。
26、可選的,所述獲取故障頻發(fā)處的重點位置的步驟包括:
27、通過所述故障影響因素表,確定故障設(shè)備關(guān)聯(lián)的故障次數(shù);
28、篩選所述故障次數(shù)大于預設(shè)次數(shù)閾值的設(shè)備,篩選出的設(shè)備對應所在位置即為重點位置。
29、通過采用上述技術(shù)方案,故障發(fā)生次數(shù)大于次數(shù)閾值的設(shè)備所在位置即為故障頻發(fā)處的重點位置。
30、可選的,所述獲取故障頻發(fā)處的重點位置之后的步驟包括:
31、確定所述重點位置關(guān)聯(lián)的故障排查等級;
32、根據(jù)所述故障排查等級,賦予所述重點位置對應的間距閾值;所述故障排查等級越高,對應的所述間距閾值越大。
33、通過采用上述技術(shù)方案,可以根據(jù)故障排查等級,自適應調(diào)整對應的間距閾值,從而進一步提高故障排查的準確性。
34、可選的,所述根據(jù)所述巡視視頻流,判斷數(shù)據(jù)中心是否存在異常的步驟包括:
35、將所述巡視視頻流逐幀轉(zhuǎn)換成巡視圖片;
36、剔除多余相似性高的巡視圖片,以生成巡視圖片集;
37、將所述巡視圖片集輸入至預先訓練完成的神經(jīng)網(wǎng)絡(luò)模型中,以獲得判斷結(jié)果;
38、根據(jù)所述判斷結(jié)果,確定所述數(shù)據(jù)中心是否異常。
39、通過采用上述技術(shù)方案,剔除多余相似性高的巡視圖片,以實現(xiàn)圖片數(shù)據(jù)噪聲清洗,從而可以降低對圖片判斷的干擾,從而提高判斷效率。
40、第二方面,本技術(shù)提供了一種數(shù)據(jù)中心的故障排查系統(tǒng),采用如下技術(shù)方案:
41、一種數(shù)據(jù)中心的故障排查系統(tǒng),包括:
42、軌跡構(gòu)建模塊,用于根據(jù)數(shù)據(jù)中心內(nèi)設(shè)備的數(shù)據(jù)及位置,構(gòu)建故障巡視軌跡;
43、控制模塊,用于控制巡視攝像頭按照所述故障巡視軌跡對設(shè)備進行周期性巡視;
44、視頻獲取模塊,用于獲取巡視過程中所述巡視攝像頭采集的巡視視頻流;
45、判斷模塊,用于根據(jù)所述巡視視頻流,判斷數(shù)據(jù)中心是否存在異常;
46、異常定位報警模塊,用于在數(shù)據(jù)中心異常時,定位異常位置,并發(fā)送報警信息。
47、通過采用上述技術(shù)方案,除了對設(shè)備內(nèi)運行數(shù)據(jù)的監(jiān)控,還可以通過構(gòu)建故障巡視軌跡,從而控制巡視攝像頭按照故障巡視軌跡進行周期性巡視,從而根據(jù)獲獲取的巡視視頻流,判斷數(shù)據(jù)中心是否存在異常,進而定位異常位置,并發(fā)送報警信息,以實現(xiàn)對設(shè)備外部的監(jiān)控,從而提高數(shù)據(jù)中心監(jiān)控的全面性以及能夠及時定位故障處。
48、第三方面,本技術(shù)提供了一種終端,采用如下技術(shù)方案:
49、一種終端,包括:
50、存儲器,存儲有數(shù)據(jù)中心的故障排查質(zhì)程序;
51、處理器,用于執(zhí)行所述存儲器上存儲的程序,以實現(xiàn)上述數(shù)據(jù)中心的故障排查方法的步驟。
52、第四方面,本技術(shù)提供了一種計算機可讀存儲介質(zhì),采用如下技術(shù)方案:
53、一種計算機可讀存儲介質(zhì),存儲有能夠被處理器加載并執(zhí)行上述數(shù)據(jù)中心的故障排查方法的計算機程序。
54、綜上所述,本技術(shù)存在至少以下有益效果:
55、1、構(gòu)建故障巡視軌跡,并控制巡視攝像頭按照故障巡視軌跡對設(shè)備進行周期性巡視的目的是,除了對設(shè)備內(nèi)運行數(shù)據(jù)的監(jiān)控,還可以根據(jù)獲獲取的巡視視頻流,判斷數(shù)據(jù)中心是否存在異常,進而定位異常位置,并發(fā)送報警信息,以實現(xiàn)對設(shè)備外部的監(jiān)控,從而提高數(shù)據(jù)中心監(jiān)控的全面性以及能夠及時定位故障處。
56、2、獲取巡視攝像頭的實時位置與巡視攝像頭當前軌跡前進方向上的故障頻發(fā)處的重點位置之間的區(qū)域間距,并判斷區(qū)域間距是否在間距閾值內(nèi)的目的是,當巡視攝像頭靠近重點位置后,說明此時巡視攝像頭正在向故障頻發(fā)處移動,因此,可以通過降低巡視攝像頭的移動速度,從而間接延長巡視攝像頭采集故障頻發(fā)處巡視視頻流的時長,從而提高故障排查的準確性。
57、3、確定重點位置關(guān)聯(lián)的故障排查等級,并根據(jù)故障排查等級,賦予重點位置對應的間距閾值的目的是,自適應調(diào)整故障頻發(fā)處對應的間距閾值,從而進一步提高故障排查的準確性。