故障處理方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種故障處理方法及系統(tǒng),涉及故障分析【技術(shù)領(lǐng)域】。本發(fā)明實施例提供的故障處理方法和系統(tǒng),本故障關(guān)聯(lián)方法中,對設(shè)備工作狀況進(jìn)行實時監(jiān)控,當(dāng)監(jiān)控到主故障A發(fā)生,則分別以主故障A發(fā)生時間點向前和向后查找時間窗T內(nèi),是否有故障B發(fā)生,如果有,則建立關(guān)聯(lián)關(guān)系。故障關(guān)聯(lián)關(guān)系的建立,有利于運(yùn)維人員針對關(guān)聯(lián)故障進(jìn)行處理,提高故障處理效率。進(jìn)一步的,本發(fā)明實施例還建立有內(nèi)存緩存隊列,通過以隊列方式在內(nèi)存中緩存故障,以便在確定故障關(guān)聯(lián)關(guān)系時,僅查詢該內(nèi)存緩存隊列便可以快速的找到是否有關(guān)聯(lián)故障發(fā)生,避免對大樣本進(jìn)行分析,進(jìn)一步提高故障處理效率。
【專利說明】故障處理方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及故障分析【技術(shù)領(lǐng)域】,特別涉及一種故障處理方法及系統(tǒng)。
【背景技術(shù)】
[0002]在日常設(shè)備維護(hù)中,通常是通過監(jiān)控人員監(jiān)控,如發(fā)現(xiàn)故障,便將該故障提交維護(hù)人員對其進(jìn)行排查處理,以及時恢復(fù)正常工作狀態(tài)。
[0003]但是,上述處理方法中,對于維護(hù)人員而言,由于收到的上報故障雜亂無章,毫無規(guī)律而言,因此,在對故障排查和處理時,效率低下。因此,迫切需要一種高效有序的故障處理解決方案,以提高故障處理效率。
【發(fā)明內(nèi)容】
[0004]鑒于上述問題,本發(fā)明實施例提供一種故障處理方法及系統(tǒng),使得能夠根據(jù)有序上報的故障,實現(xiàn)高效快速的故障處理解決方案。
[0005]本發(fā)明實施例采用了如下技術(shù)方案:
[0006]本發(fā)明一個實施例提供了一種故障處理方法,所述方法包括:
[0007]當(dāng)監(jiān)控到第一故障發(fā)生時,分別向前和向后查找預(yù)定時間窗內(nèi)是否有第二故障發(fā)生;
[0008]如查找到第二故障發(fā)生,則將所述第一故障和第二故障作為關(guān)聯(lián)故障,上報所述關(guān)聯(lián)故障;如未查找到第二故障發(fā)生,則將所述第一故障上報;
[0009]針對上報的故障,若為關(guān)聯(lián)故障,則對其進(jìn)行合并處理;若為第一故障,則對其進(jìn)行處理。
[0010]所述方法還包括:
[0011]建立關(guān)聯(lián)模板,用于記錄故障之間的關(guān)聯(lián)關(guān)系;及
[0012]建立內(nèi)存緩存隊列,在監(jiān)控過程中若有故障發(fā)生,則以隊列的方式在內(nèi)存中緩存該故障;
[0013]則所述當(dāng)監(jiān)控到第一故障發(fā)生時,分別向前和向后查找預(yù)定時間窗內(nèi)是否有第二故障發(fā)生具體包括:
[0014]當(dāng)監(jiān)控到第一故障發(fā)生時,查詢所述關(guān)聯(lián)模板,判斷所述第一故障是否存在關(guān)聯(lián)故障,若不存在關(guān)聯(lián)故障,則上報所述第一故障;
[0015]若存在關(guān)聯(lián)故障,則在所述內(nèi)存緩存隊列中查詢所述第一故障發(fā)生前預(yù)定時間窗內(nèi)是否有與之關(guān)聯(lián)的第二故障,并且,在所述第一故障發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控是否有第二故障發(fā)生。
[0016]所述方法還包括:對所述內(nèi)存緩存隊列進(jìn)行監(jiān)控管理,清除當(dāng)前處理故障發(fā)生預(yù)定時間窗之前的故障;
[0017]則所述當(dāng)監(jiān)控到第一故障發(fā)生時,分別向前和向后查找預(yù)定時間窗內(nèi)是否有第二故障發(fā)生具體包括:
[0018]當(dāng)監(jiān)控到第一故障發(fā)生時,查詢所述關(guān)聯(lián)模板,判斷所述第一故障是否存在關(guān)聯(lián)故障,若不存在關(guān)聯(lián)故障,則上報所述第一故障;
[0019]若存在關(guān)聯(lián)故障,則在所述內(nèi)存緩存隊列中查詢是否有與之關(guān)聯(lián)的第二故障,并且,在所述第一故障發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控所述內(nèi)存緩存隊列中是否有第二故障發(fā)生。
[0020]若存在關(guān)聯(lián)故障,所述方法還包括:
[0021]根據(jù)所述關(guān)聯(lián)模板中的故障關(guān)聯(lián)關(guān)系,在內(nèi)存緩存隊列中建立以設(shè)備網(wǎng)元唯一標(biāo)識及關(guān)聯(lián)規(guī)則ID標(biāo)識的一個分組,則當(dāng)監(jiān)控到故障發(fā)生時,將當(dāng)前監(jiān)控到的故障緩存在其所對應(yīng)的設(shè)備網(wǎng)元唯一標(biāo)識及關(guān)聯(lián)規(guī)則ID標(biāo)識的分組中。
[0022]所述第二故障為一個或多個。
[0023]互為關(guān)聯(lián)故障的第一故障和第二故障的關(guān)系如下:
[0024]第一故障為主故障,則第二故障為次故障;或
[0025]第一故障為次故障,則第二故障為主故障。
[0026]本發(fā)明實施例還提供一種故障處理系統(tǒng),所述系統(tǒng)包括:
[0027]關(guān)聯(lián)故障查找模塊,用于當(dāng)監(jiān)控到第一故障發(fā)生時,分別向前和向后查找預(yù)定時間窗內(nèi)是否有第二故障發(fā)生;
[0028]上報模塊,用于若所述關(guān)聯(lián)故障查找模塊查找到第二故障發(fā)生,則將所述第一故障和第二故障作為關(guān)聯(lián)故障,上報所述關(guān)聯(lián)故障;若所述關(guān)聯(lián)故障查找模塊未查找到第二故障發(fā)生,則將所述第一故障上報;
[0029]處理模塊,用于針對上報的故障,若為關(guān)聯(lián)故障,則對其進(jìn)行合并處理;若為第一故障,則對其進(jìn)行處理。
[0030]所述系統(tǒng)還包括:
[0031]關(guān)聯(lián)模板模塊,用于建立關(guān)聯(lián)模板,記錄故障之間的關(guān)聯(lián)關(guān)系;
[0032]緩存模塊,用于建立內(nèi)存緩存隊列,在監(jiān)控過程中若有故障發(fā)生,則以隊列的方式在內(nèi)存中緩存該故障;
[0033]則所述關(guān)聯(lián)故障查找模塊具體包括:
[0034]故障類型判斷單元,用于當(dāng)監(jiān)控到第一故障發(fā)生時,查詢所述關(guān)聯(lián)模板,判斷所述第一故障是否存在關(guān)聯(lián)故障;
[0035]查找單元,用于所述故障類型判斷單元的判斷結(jié)果為存在關(guān)聯(lián)故障,則在所述內(nèi)存緩存隊列中查詢所述第一故障發(fā)生前預(yù)定時間窗內(nèi)是否有與之關(guān)聯(lián)的第二故障,并且,在所述第一故障發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控是否有第二故障發(fā)生;
[0036]上報觸發(fā)單元,用于當(dāng)所述故障類型判斷單元的判斷結(jié)果為不存在關(guān)聯(lián)故障,則觸發(fā)所述上報模塊上報所述第一故障;及,根據(jù)所述查找單元的查找結(jié)果觸發(fā)所述上報單元上報故障。
[0037]所述系統(tǒng)還包括:
[0038]內(nèi)存緩存隊列管理模塊,用于對所述內(nèi)存緩存隊列進(jìn)行監(jiān)控管理,清除當(dāng)前處理故障發(fā)生預(yù)定時間窗之前的故障;
[0039]則所述關(guān)聯(lián)故障查找模塊具體包括:
[0040]故障類型判斷單元,用于當(dāng)監(jiān)控到第一故障發(fā)生時,查詢所述關(guān)聯(lián)模板,判斷所述第一故障是否存在關(guān)聯(lián)故障;
[0041]查找單元,用于所述故障類型判斷單元的判斷結(jié)果為存在關(guān)聯(lián)故障,則在所述內(nèi)存緩存隊列中查詢是否有與之關(guān)聯(lián)的第二故障,并且,在所述第一故障發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控所述內(nèi)存緩存隊列中是否有第二故障發(fā)生;
[0042]上報觸發(fā)單元,用于當(dāng)所述故障類型判斷單元的判斷結(jié)果為不存在關(guān)聯(lián)故障,則觸發(fā)所述上報模塊上報所述第一故障;及,根據(jù)所述查找單元的查找結(jié)果觸發(fā)所述上報單元上報故障。
[0043]所述緩存模塊還包括:
[0044]分組單元,用于存在關(guān)聯(lián)故障時,根據(jù)所述關(guān)聯(lián)模板中的故障關(guān)聯(lián)關(guān)系,在內(nèi)存緩存隊列中建立以設(shè)備網(wǎng)元唯一標(biāo)識及關(guān)聯(lián)規(guī)則ID標(biāo)識的一個分組,則當(dāng)監(jiān)控到故障發(fā)生時,將當(dāng)前監(jiān)控到的故障緩存在其所對應(yīng)的設(shè)備網(wǎng)元唯一標(biāo)識及關(guān)聯(lián)規(guī)則ID標(biāo)識的分組中;
[0045]所述第二故障為一個或多個;
[0046]互為關(guān)聯(lián)故障的第一故障和第二故障的關(guān)系如下:
[0047]第一故障為主故障,則第二故障為次故障;或
[0048]第一故障為次故障,則第二故障為主故障。
[0049]本發(fā)明實施例提供的故障處理方法和系統(tǒng),本故障關(guān)聯(lián)方法中,對設(shè)備工作狀況進(jìn)行實時監(jiān)控,當(dāng)監(jiān)控到主故障A發(fā)生,則分別以主故障A發(fā)生時間點向前和向后查找時間窗T內(nèi),是否有故障B發(fā)生,如果有,則建立關(guān)聯(lián)關(guān)系。故障關(guān)聯(lián)關(guān)系的建立,有利于運(yùn)維人員針對關(guān)聯(lián)故障進(jìn)行處理,提高故障處理效率。
[0050]進(jìn)一步的,本發(fā)明實施例還建立有內(nèi)存緩存隊列,通過以隊列方式在內(nèi)存中緩存故障,以便在確定故障關(guān)聯(lián)關(guān)系時,僅查詢該內(nèi)存緩存隊列便可以快速的找到是否有關(guān)聯(lián)故障發(fā)生,避免對大樣本進(jìn)行分析,進(jìn)一步提高故障處理效率。
【專利附圖】
【附圖說明】
[0051]圖1為本發(fā)明一個實施例提供的一種故障處理方法流程圖;
[0052]圖2為本發(fā)明另一實施例提供的一種故障處理方法流程圖;
[0053]圖3為本發(fā)明實施例提供的故障處理方法的一種具體實例流程圖;
[0054]圖4為本發(fā)明一個實施例提供的一種故障處理系統(tǒng)框圖。
【具體實施方式】
[0055]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進(jìn)一步地詳細(xì)描述。
[0056]在日常設(shè)備維護(hù)中,通過監(jiān)控人員不斷觀察分析,總結(jié)出故障發(fā)生規(guī)律。通常,若多個故障通常一起發(fā)生,則稱該多個故障之間具備影響關(guān)系,稱為關(guān)聯(lián)故障。比如,當(dāng)A故障發(fā)生,通常前后10分鐘內(nèi)B故障也會發(fā)生,則認(rèn)為告警A和告警B為影響關(guān)系,根據(jù)具體應(yīng)用場景,關(guān)聯(lián)故障之間存在主次關(guān)系,例如在上述關(guān)聯(lián)關(guān)系中,A為主故障,B為次故障。
[0057]本故障關(guān)聯(lián)方法中,對設(shè)備工作狀況進(jìn)行實時監(jiān)控,當(dāng)監(jiān)控到主故障A發(fā)生,則分別以主故障A發(fā)生時間點向前和向后查找時間窗T內(nèi),是否有故障B發(fā)生,如果有,則建立關(guān)聯(lián)關(guān)系。故障關(guān)聯(lián)關(guān)系的建立,有利于維護(hù)人員針對關(guān)聯(lián)故障進(jìn)行處理,提高故障處理效率。
[0058]具體的,參見圖1,為本發(fā)明實施例提供的一種故障處理方法,具體包括如下步驟:
[0059]SlOl:監(jiān)控故障發(fā)生。
[0060]S102:當(dāng)監(jiān)控到第一故障發(fā)生時,分別向前和向后查找預(yù)定時間窗內(nèi)是否有第二故障發(fā)生。
[0061]根據(jù)不同的應(yīng)用場景,預(yù)定時間窗的長度可以設(shè)置不同。比如,在通信行業(yè)通信設(shè)備維護(hù)應(yīng)用場景中,可以設(shè)置預(yù)定時間窗的長度為10分鐘。
[0062]S103:如查找到第二故障發(fā)生,則將所述第一故障和第二故障作為關(guān)聯(lián)故障,上報所述關(guān)聯(lián)故障;如未查找到第二故障發(fā)生,則將所述第一故障上報。
[0063]第一故障和第二故障是關(guān)聯(lián)故障,即通常情況下,兩者會伴隨發(fā)生,在實際應(yīng)用中,如果在故障上報之前,能夠?qū)收线M(jìn)行關(guān)聯(lián)分析處理,并上報,這樣,維護(hù)人員便可以針對故障進(jìn)行關(guān)聯(lián)合并處理,能夠大大提高故障處理效率。
[0064]需要說明的是,上述第二故障可以是一個或多個,也就是說,若第一故障為A故障,第二故障可以為B故障,也可以為B故障、C故障和D故障等等,此處不做限制。
[0065]另外需要說明的是,互為關(guān)聯(lián)故障的第一故障和第二故障的關(guān)系可以是:
[0066]第一故障為主故障,則第二故障為次故障;或,第一故障為次故障,則第二故障為主故障。比如,若某基站故障為主故障,則下行信號發(fā)送故障便可以設(shè)置為次故障。
[0067]S104:針對上報的故障,若為關(guān)聯(lián)故障,則對其進(jìn)行合并處理;若為第一故障,則對其進(jìn)行處理。
[0068]本發(fā)明實施例中,查找主故障A發(fā)生前T時間(即時間窗T前)的次故障B。找到的次故障B,建立關(guān)聯(lián)關(guān)系。并繼續(xù)接收次故障B,建立關(guān)聯(lián)關(guān)系。當(dāng)主故障A超過時間窗T,主故障A不在關(guān)聯(lián)次故障B。
[0069]可見,本發(fā)明實施例提供的故障處理方法和系統(tǒng),本故障關(guān)聯(lián)方法中,對設(shè)備工作狀況進(jìn)行實時監(jiān)控,當(dāng)監(jiān)控到主故障A發(fā)生,則分別以主故障A發(fā)生時間點向前和向后查找時間窗T內(nèi),是否有故障B發(fā)生,如果有,則建立關(guān)聯(lián)關(guān)系。故障關(guān)聯(lián)關(guān)系的建立,有利于運(yùn)維人員針對關(guān)聯(lián)故障進(jìn)行處理,提高故障處理效率。
[0070]優(yōu)選的,參見圖2,本發(fā)明另一實施例提供了另一種故障處理方法。本發(fā)明實施例進(jìn)一步的建立有內(nèi)存緩存隊列,通過以隊列方式在內(nèi)存中緩存故障,以便在確定故障關(guān)聯(lián)關(guān)系時,僅查詢該內(nèi)存緩存隊列便可以快速的找到是否有關(guān)聯(lián)故障發(fā)生,從而避免對大樣本數(shù)據(jù)進(jìn)行分析處理,能夠進(jìn)一步提高故障處理效率。
[0071]具體步驟如下:
[0072]S201:建立關(guān)聯(lián)|旲板,用于記錄故障之間的關(guān)聯(lián)關(guān)系。
[0073]S202:建立內(nèi)存緩存隊列,在監(jiān)控過程中若有故障發(fā)生,則以隊列的方式在內(nèi)存中緩存該故障。
[0074]具體實踐中,當(dāng)收到故障B時,計算出故障的超時時間窗(即故障發(fā)生時間+時間窗T分鐘)。將故障以隊列的方式存入內(nèi)存緩存中。若當(dāng)前處理故障為故障A,則查詢內(nèi)存緩存隊列中緩存的故障A之前時間窗T分鐘內(nèi)是否有故障B存在,可見,通過增加內(nèi)存緩存隊列,可以避免對大樣本數(shù)據(jù)進(jìn)行分析的步驟,僅僅在內(nèi)存緩存隊列中查詢即可。
[0075]S203:當(dāng)監(jiān)控到第一故障發(fā)生時,查詢上述關(guān)聯(lián)模板,判斷第一故障是否存在關(guān)聯(lián)故障,若不存在關(guān)聯(lián)故障,則執(zhí)行步驟S204,若存在關(guān)聯(lián)故障,則執(zhí)行步驟S205。
[0076]S204:上報第一故障,執(zhí)行步驟S208。
[0077]S205:在內(nèi)存緩存隊列中查詢第一故障發(fā)生前預(yù)定時間窗內(nèi)是否有與之關(guān)聯(lián)的第二故障,并且,在第一故障發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控是否有第二故障發(fā)生。如查找到第二故障發(fā)生,則執(zhí)行步驟S206,如未查找到第二故障發(fā)生,則執(zhí)行步驟S204。
[0078]優(yōu)選的,本發(fā)明實施例還包括如下步驟:對內(nèi)存緩存隊列進(jìn)行監(jiān)控管理,清除當(dāng)前處理故障發(fā)生預(yù)定時間窗之前的故障。
[0079]針對該步驟,當(dāng)收到故障B時,計算出故障的超時時間窗(即故障發(fā)生時間+時間窗T分鐘)。將故障以隊列的方式存入內(nèi)存緩存中。若當(dāng)前處理故障為故障A,則查詢內(nèi)存緩存隊列中緩存的故障A之前是否有故障B存在(內(nèi)存緩存隊列中存儲的僅僅為當(dāng)前處理故障即故障A之前時間窗T分鐘內(nèi)的),并且,在第一故障(故障A)發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控內(nèi)存緩存隊列中是否有第二故障(故障B)發(fā)生??梢?,通過增加內(nèi)存緩存隊列,可以避免對大樣本數(shù)據(jù)進(jìn)行分析的步驟,僅僅在內(nèi)存緩存隊列中查詢即可。
[0080]進(jìn)一步的,若存在關(guān)聯(lián)故障,本發(fā)明實施例所述方法還包括:
[0081]根據(jù)所述關(guān)聯(lián)模板中的故障關(guān)聯(lián)關(guān)系,在內(nèi)存緩存隊列中建立以“設(shè)備網(wǎng)元唯一標(biāo)識+關(guān)聯(lián)規(guī)則ID”標(biāo)識的一個分組,則當(dāng)監(jiān)控到故障發(fā)生時,將當(dāng)前監(jiān)控到的故障緩存在其所對應(yīng)的設(shè)備網(wǎng)元唯一標(biāo)識及關(guān)聯(lián)規(guī)則ID標(biāo)識的分組中。
[0082]其中,設(shè)備網(wǎng)元唯一標(biāo)識,用于唯一標(biāo)識網(wǎng)絡(luò)中的某臺設(shè)備。
[0083]關(guān)聯(lián)規(guī)則ID,用于標(biāo)識關(guān)聯(lián)規(guī)則,比如A故障為主故障,B故障為次故障。
[0084]相應(yīng)的,在內(nèi)存緩存隊列中查詢關(guān)聯(lián)故障的步驟,具體為在內(nèi)存緩存隊列中以“設(shè)備網(wǎng)元唯一標(biāo)識+關(guān)聯(lián)規(guī)則ID”標(biāo)識的分組中查詢即可。這樣,可以進(jìn)一步縮小數(shù)據(jù)處理的樣本,進(jìn)一步提聞故障處理的效率。
[0085]S206:將第一故障和第二故障作為關(guān)聯(lián)故障,上報該關(guān)聯(lián)故障。
[0086]S207:對關(guān)聯(lián)故障進(jìn)行合并處理,結(jié)束。
[0087]S208:對第一故障進(jìn)行處理。
[0088]第一故障和第二故障是關(guān)聯(lián)故障,即通常情況下,兩者會伴隨發(fā)生,在實際應(yīng)用中,如果在故障上報之前,能夠?qū)收线M(jìn)行關(guān)聯(lián)分析處理,并上報,這樣,維護(hù)人員便可以針對故障進(jìn)行關(guān)聯(lián)合并處理,能夠大大提高故障處理效率。
[0089]需要說明的是,上述第二故障可以是一個或多個,也就是說,若第一故障為A故障,第二故障可以為B故障,也可以為B故障、C故障和D故障等等,此處不做限制。
[0090]另外需要說明的是,互為關(guān)聯(lián)故障的第一故障和第二故障的關(guān)系可以是:
[0091]第一故障為主故障,則第二故障為次故障;或,第一故障為次故障,則第二故障為主故障。比如,若某基站故障為主故障,則下行信號發(fā)送故障便可以設(shè)置為次故障。
[0092]本發(fā)明實施例中,在內(nèi)存緩存隊列中查找主故障A發(fā)生前T時間(即時間窗T前)的次故障B。找到的次故障B,建立關(guān)聯(lián)關(guān)系。并繼續(xù)接收次故障B,建立關(guān)聯(lián)關(guān)系。當(dāng)主故障A超過時間窗T,主故障A不在關(guān)聯(lián)次故障B。
[0093]可見,本發(fā)明實施例提供的故障處理方法和系統(tǒng),本故障關(guān)聯(lián)方法中,對設(shè)備工作狀況進(jìn)行實時監(jiān)控,當(dāng)監(jiān)控到主故障A發(fā)生,則分別以主故障A發(fā)生時間點向前和向后查找時間窗T內(nèi),是否有故障B發(fā)生,如果有,則建立關(guān)聯(lián)關(guān)系。故障關(guān)聯(lián)關(guān)系的建立,有利于運(yùn)維人員針對關(guān)聯(lián)故障進(jìn)行處理,提高故障處理效率。
[0094]進(jìn)一步的,本發(fā)明實施例還建立有內(nèi)存緩存隊列,通過以隊列方式在內(nèi)存中緩存故障,以便在確定故障關(guān)聯(lián)關(guān)系時,僅查詢該內(nèi)存緩存隊列便可以快速的找到是否有關(guān)聯(lián)故障發(fā)生,避免對大樣本進(jìn)行分析,進(jìn)一步提高故障處理效率。
[0095]參見圖3,為本發(fā)明實施例提供的一種具體的故障處理方法的實例,整體思路:首先,緩存需要關(guān)聯(lián)的故障。然后,根據(jù)故障定位信息,將故障分組。最后,當(dāng)故障設(shè)備的主、次故障均發(fā)生故障時,進(jìn)行故障關(guān)聯(lián)。實現(xiàn)的大體包括以下描述,具體子步驟請參見圖3所示,此處不再贅述。
[0096]S301:定義關(guān)聯(lián)規(guī)則。
[0097]同一個設(shè)備發(fā)生故障A為主告警,發(fā)生故障B為子告警。定義時間窗長度為T分鐘。
[0098]S302:接收活動告警。
[0099]1.收到故障A (或者故障B),建立一個以“網(wǎng)元唯一標(biāo)識+關(guān)聯(lián)規(guī)則ID”的一個分組,計算出故障的超時時間窗(即故障發(fā)生時間+時間窗T分鐘)。將故障以隊列的方式存入內(nèi)存緩存中。
[0100]i1.收到故障B (或者故障A)。查找“網(wǎng)元唯一標(biāo)識+關(guān)聯(lián)規(guī)則ID”是否存在未超時數(shù)據(jù)。如果存在,且互為主次告警,將故障A、故障B關(guān)聯(lián)。
[0101]S303:超時丟棄。
[0102]檢索隊列,將超過時間窗T的告警從分組隊列中刪除。不再用于關(guān)聯(lián)。
[0103]可見,本實例的有益效果是:大大減少了大數(shù)據(jù)樣本的復(fù)雜查詢,加快故障關(guān)聯(lián)速度,從而大大提高了故障處理的效率。
[0104]參見圖4,本發(fā)明實施例提供一種故障處理系統(tǒng),包括:
[0105]關(guān)聯(lián)故障查找模塊401,用于當(dāng)監(jiān)控到第一故障發(fā)生時,分別向前和向后查找預(yù)定時間窗內(nèi)是否有第二故障發(fā)生。
[0106]上報模塊402,用于若關(guān)聯(lián)故障查找模塊401查找到第二故障發(fā)生,則將第一故障和第二故障作為關(guān)聯(lián)故障,上報該關(guān)聯(lián)故障;若關(guān)聯(lián)故障查找模塊401未查找到第二故障發(fā)生,則將第一故障上報。
[0107]處理模塊403,用于針對上報的故障,若為關(guān)聯(lián)故障,則對其進(jìn)行合并處理;若為第一故障,則對其進(jìn)行處理。
[0108]進(jìn)一步的,本發(fā)明實施例提供的故障處理系統(tǒng)還包括:
[0109]關(guān)聯(lián)模板模塊404,用于建立關(guān)聯(lián)模板,記錄故障之間的關(guān)聯(lián)關(guān)系。
[0110]緩存模塊405,用于建立內(nèi)存緩存隊列,在監(jiān)控過程中若有故障發(fā)生,則以隊列的方式在內(nèi)存中緩存該故障。
[0111]則關(guān)聯(lián)故障查找模塊401具體包括:
[0112]故障類型判斷單元,用于當(dāng)監(jiān)控到第一故障發(fā)生時,查詢所述關(guān)聯(lián)模板,判斷所述第一故障是否存在關(guān)聯(lián)故障。
[0113]查找單元,用于所述故障類型判斷單元的判斷結(jié)果為存在關(guān)聯(lián)故障,則在所述內(nèi)存緩存隊列中查詢所述第一故障發(fā)生前預(yù)定時間窗內(nèi)是否有與之關(guān)聯(lián)的第二故障,并且,在所述第一故障發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控是否有第二故障發(fā)生。
[0114]以及,上報觸發(fā)單元,用于當(dāng)所述故障類型判斷單元的判斷結(jié)果為不存在關(guān)聯(lián)故障,則觸發(fā)所述上報模塊上報所述第一故障;及,根據(jù)所述查找單元的查找結(jié)果觸發(fā)所述上報單元上報故障。
[0115]再進(jìn)一步的,本發(fā)明實施例提供的故障處理系統(tǒng)還包括:
[0116]內(nèi)存緩存隊列管理模塊406,用于對內(nèi)存緩存隊列進(jìn)行監(jiān)控管理,清除當(dāng)前處理故障發(fā)生預(yù)定時間窗之前的故障。
[0117]則所述關(guān)聯(lián)故障查找模塊401具體包括:
[0118]故障類型判斷單元,用于當(dāng)監(jiān)控到第一故障發(fā)生時,查詢所述關(guān)聯(lián)模板,判斷所述第一故障是否存在關(guān)聯(lián)故障。
[0119]查找單元,用于所述故障類型判斷單元的判斷結(jié)果為存在關(guān)聯(lián)故障,則在所述內(nèi)存緩存隊列中查詢是否有與之關(guān)聯(lián)的第二故障,并且,在所述第一故障發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控所述內(nèi)存緩存隊列中是否有第二故障發(fā)生。
[0120]以及,上報觸發(fā)單元,用于當(dāng)所述故障類型判斷單元的判斷結(jié)果為不存在關(guān)聯(lián)故障,則觸發(fā)所述上報模塊上報所述第一故障;及,根據(jù)所述查找單元的查找結(jié)果觸發(fā)所述上報單元上報故障。
[0121]優(yōu)選的,上述緩存模塊還包括:
[0122]分組單元,用于存在關(guān)聯(lián)故障時,根據(jù)所述關(guān)聯(lián)模板中的故障關(guān)聯(lián)關(guān)系,在內(nèi)存緩存隊列中建立以設(shè)備網(wǎng)元唯一標(biāo)識及關(guān)聯(lián)規(guī)則ID標(biāo)識的一個分組,則當(dāng)監(jiān)控到故障發(fā)生時,將當(dāng)前監(jiān)控到的故障緩存在其所對應(yīng)的設(shè)備網(wǎng)元唯一標(biāo)識及關(guān)聯(lián)規(guī)則ID標(biāo)識的分組中。
[0123]需要說明的是,上述第二故障可以是一個或多個,也就是說,若第一故障為A故障,第二故障可以為B故障,也可以為B故障、C故障和D故障等等,此處不做限制。
[0124]另外需要說明的是,互為關(guān)聯(lián)故障的第一故障和第二故障的關(guān)系可以是:
[0125]第一故障為主故障,則第二故障為次故障;或,第一故障為次故障,則第二故障為主故障。比如,若某基站故障為主故障,則下行信號發(fā)送故障便可以設(shè)置為次故障。
[0126]需要說明的是,本發(fā)明系統(tǒng)實施例中的各個模塊或者單元的工作原理和處理過程可以參見上述圖1、圖2和圖3所示方法實施例中的相關(guān)描述,此處不再贅述。
[0127]可見,本發(fā)明實施例提供的故障處理方法和系統(tǒng),本故障關(guān)聯(lián)方法中,對設(shè)備工作狀況進(jìn)行實時監(jiān)控,當(dāng)監(jiān)控到主故障A發(fā)生,則分別以主故障A發(fā)生時間點向前和向后查找時間窗T內(nèi),是否有故障B發(fā)生,如果有,則建立關(guān)聯(lián)關(guān)系。故障關(guān)聯(lián)關(guān)系的建立,有利于運(yùn)維人員針對關(guān)聯(lián)故障進(jìn)行處理,提高故障處理效率。
[0128]進(jìn)一步的,本發(fā)明實施例還建立有內(nèi)存緩存隊列,通過以隊列方式在內(nèi)存中緩存故障,以便在確定故障關(guān)聯(lián)關(guān)系時,僅查詢該內(nèi)存緩存隊列便可以快速的找到是否有關(guān)聯(lián)故障發(fā)生,避免對大樣本進(jìn)行分析,進(jìn)一步提高故障處理效率。
[0129]為了便于清楚描述本發(fā)明實施例的技術(shù)方案,在發(fā)明的實施例中,采用了“第一”、“第二”等字樣對功能和作用基本相同的相同項或相似項進(jìn)行區(qū)分,本領(lǐng)域技術(shù)人員可以理解“第一”、“第二”等字樣并不對數(shù)量和執(zhí)行次序進(jìn)行限定。
[0130]以上所述僅為本發(fā)明的較佳實施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種故障處理方法,其特征在于,所述方法包括: 當(dāng)監(jiān)控到第一故障發(fā)生時,分別向前和向后查找預(yù)定時間窗內(nèi)是否有第二故障發(fā)生;如查找到第二故障發(fā)生,則將所述第一故障和第二故障作為關(guān)聯(lián)故障,上報所述關(guān)聯(lián)故障;如未查找到第二故障發(fā)生,則將所述第一故障上報; 針對上報的故障,若為關(guān)聯(lián)故障,則對其進(jìn)行合并處理;若為第一故障,則對其進(jìn)行處理。
2.根據(jù)權(quán)利要求1所述的故障處理方法,其特征在于,所述方法還包括: 建立關(guān)聯(lián)模板,用于記錄故障之間的關(guān)聯(lián)關(guān)系 '及 建立內(nèi)存緩存隊列,在監(jiān)控過程中若有故障發(fā)生,則以隊列的方式在內(nèi)存中緩存該故障; 則所述當(dāng)監(jiān)控到第一故障發(fā)生時,分別向前和向后查找預(yù)定時間窗內(nèi)是否有第二故障發(fā)生具體包括: 當(dāng)監(jiān)控到第一故障發(fā)生時,查詢所述關(guān)聯(lián)模板,判斷所述第一故障是否存在關(guān)聯(lián)故障,若不存在關(guān)聯(lián)故障,則上報所述第一故障; 若存在關(guān)聯(lián)故障,則在所述內(nèi)存緩存隊列中查詢所述第一故障發(fā)生前預(yù)定時間窗內(nèi)是否有與之關(guān)聯(lián)的第二故障,并且,在所述第一故障發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控是否有第二故障發(fā)生。
3.根據(jù)權(quán)利要求2所述的故障處理方法,其特征在于,所述方法還包括:對所述內(nèi)存緩存隊列進(jìn)行監(jiān)控管理,清除當(dāng)前處理故障發(fā)生預(yù)定時間窗之前的故障; 則所述當(dāng)監(jiān)控到第一故障發(fā)生時,分別向前和向后查找預(yù)定時間窗內(nèi)是否有第二故障發(fā)生具體包括: 當(dāng)監(jiān)控到第一故障發(fā)生時,查詢所述關(guān)聯(lián)模板,判斷所述第一故障是否存在關(guān)聯(lián)故障,若不存在關(guān)聯(lián)故障,則上報所述第一故障; 若存在關(guān)聯(lián)故障,則在所述內(nèi)存緩存隊列中查詢是否有與之關(guān)聯(lián)的第二故障,并且,在所述第一故障發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控所述內(nèi)存緩存隊列中是否有第二故障發(fā)生。
4.根據(jù)權(quán)利要求2或3所述的故障處理方法,其特征在于,若存在關(guān)聯(lián)故障,所述方法還包括: 根據(jù)所述關(guān)聯(lián)模板中的故障關(guān)聯(lián)關(guān)系,在內(nèi)存緩存隊列中建立以設(shè)備網(wǎng)元唯一標(biāo)識及關(guān)聯(lián)規(guī)則ID標(biāo)識的一個分組,則當(dāng)監(jiān)控到故障發(fā)生時,將當(dāng)前監(jiān)控到的故障緩存在其所對應(yīng)的設(shè)備網(wǎng)元唯一標(biāo)識及關(guān)聯(lián)規(guī)則ID標(biāo)識的分組中。
5.根據(jù)權(quán)利要求1-3任一項所述的故障處理方法,其特征在于,所述第二故障為一個或多個。
6.根據(jù)權(quán)利要求1-3任一項所述的故障處理方法,其特征在于,互為關(guān)聯(lián)故障的第一故障和第二故障的關(guān)系如下: 第一故障為主故障,則第二故障為次故障;或 第一故障為次故障,則第二故障為主故障。
7.一種故障處理系統(tǒng),其特征在于,所述系統(tǒng)包括: 關(guān)聯(lián)故障查找模塊,用于當(dāng)監(jiān)控到第一故障發(fā)生時,分別向前和向后查找預(yù)定時間窗內(nèi)是否有第二故障發(fā)生; 上報模塊,用于若所述關(guān)聯(lián)故障查找模塊查找到第二故障發(fā)生,則將所述第一故障和第二故障作為關(guān)聯(lián)故障,上報所述關(guān)聯(lián)故障;若所述關(guān)聯(lián)故障查找模塊未查找到第二故障發(fā)生,則將所述第一故障上報; 處理模塊,用于針對上報的故障,若為關(guān)聯(lián)故障,則對其進(jìn)行合并處理;若為第一故障,則對其進(jìn)行處理。
8.根據(jù)權(quán)利要求7所述的故障處理系統(tǒng),其特征在于,所述系統(tǒng)還包括: 關(guān)聯(lián)模板模塊,用于建立關(guān)聯(lián)模板,記錄故障之間的關(guān)聯(lián)關(guān)系; 緩存模塊,用于建立內(nèi)存緩存隊列,在監(jiān)控過程中若有故障發(fā)生,則以隊列的方式在內(nèi)存中緩存該故障; 則所述關(guān)聯(lián)故障查找模塊具體包括: 故障類型判斷單元,用于當(dāng)監(jiān)控到第一故障發(fā)生時,查詢所述關(guān)聯(lián)模板,判斷所述第一故障是否存在關(guān)聯(lián)故障; 查找單元,用于所述故障類型判斷單元的判斷結(jié)果為存在關(guān)聯(lián)故障,則在所述內(nèi)存緩存隊列中查詢所述第一故障發(fā)生前預(yù)定時間窗內(nèi)是否有與之關(guān)聯(lián)的第二故障,并且,在所述第一故障發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控是否有第二故障發(fā)生; 上報觸發(fā)單元,用于當(dāng)所述故障類型判斷單元的判斷結(jié)果為不存在關(guān)聯(lián)故障,則觸發(fā)所述上報模塊上報所述第一故障;及,根據(jù)所述查找單元的查找結(jié)果觸發(fā)所述上報單元上報故障。
9.根據(jù)權(quán)利要求8所述的故障處理系統(tǒng),其特征在于,所述系統(tǒng)還包括: 內(nèi)存緩存隊列管理模塊,用于對所述內(nèi)存緩存隊列進(jìn)行監(jiān)控管理,清除當(dāng)前處理故障發(fā)生預(yù)定時間窗之前的故障; 則所述關(guān)聯(lián)故障查找模塊具體包括: 故障類型判斷單元,用于當(dāng)監(jiān)控到第一故障發(fā)生時,查詢所述關(guān)聯(lián)模板,判斷所述第一故障是否存在關(guān)聯(lián)故障; 查找單元,用于所述故障類型判斷單元的判斷結(jié)果為存在關(guān)聯(lián)故障,則在所述內(nèi)存緩存隊列中查詢是否有與之關(guān)聯(lián)的第二故障,并且,在所述第一故障發(fā)生后的預(yù)定時間窗內(nèi),繼續(xù)監(jiān)控所述內(nèi)存緩存隊列中是否有第二故障發(fā)生; 上報觸發(fā)單元,用于當(dāng)所述故障類型判斷單元的判斷結(jié)果為不存在關(guān)聯(lián)故障,則觸發(fā)所述上報模塊上報所述第一故障;及,根據(jù)所述查找單元的查找結(jié)果觸發(fā)所述上報單元上報故障。
10.根據(jù)權(quán)利要求8或9所述的故障處理系統(tǒng),其特征在于,所述緩存模塊還包括: 分組單元,用于存在關(guān)聯(lián)故障時,根據(jù)所述關(guān)聯(lián)模板中的故障關(guān)聯(lián)關(guān)系,在內(nèi)存緩存隊列中建立以設(shè)備網(wǎng)元唯一標(biāo)識及關(guān)聯(lián)規(guī)則ID標(biāo)識的一個分組,則當(dāng)監(jiān)控到故障發(fā)生時,將當(dāng)前監(jiān)控到的故障緩存在其所對應(yīng)的設(shè)備網(wǎng)元唯一標(biāo)識及關(guān)聯(lián)規(guī)則ID標(biāo)識的分組中;所述第二故障為一個或多個; 互為關(guān)聯(lián)故障的第一故障和第二故障的關(guān)系如下: 第一故障為主故障,則第二故障為次故障;或 第一故障為次故障,則第二故障為主故障。
【文檔編號】H04L12/24GK104243192SQ201310237951
【公開日】2014年12月24日 申請日期:2013年6月17日 優(yōu)先權(quán)日:2013年6月17日
【發(fā)明者】李宏琳 申請人:北京神州泰岳軟件股份有限公司