国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      監(jiān)控代理的故障處理方法和系統(tǒng)的制作方法

      文檔序號:7575863閱讀:159來源:國知局
      專利名稱:監(jiān)控代理的故障處理方法和系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及計算機(jī)應(yīng)用領(lǐng)域,尤其涉及一種監(jiān)控代理的故障處理方法和系統(tǒng)。
      背景技術(shù)
      當(dāng)前,計算機(jī)越來越普及,應(yīng)用面也越來越廣。個人PC的應(yīng)用推動了服務(wù)器的廣 泛應(yīng)用?,F(xiàn)在,規(guī)模大型的公司和機(jī)構(gòu)每時每刻都運行著數(shù)以萬計的服務(wù)器。隨著服務(wù)器 的廣泛應(yīng)用,如何對大量的服務(wù)器、存儲及網(wǎng)絡(luò)設(shè)備有效地管理也成為公司和機(jī)構(gòu)越來越 關(guān)心的一個問題。為此,各大服務(wù)器廠商和軟件公司紛紛推出自己的設(shè)備管理軟件。該設(shè)備管理軟 件按是否需要在被監(jiān)控的資源節(jié)點上安裝代理來實現(xiàn)管理功能分為2種類型。其中一種是 必須在被監(jiān)控節(jié)點安裝監(jiān)控代理程序,管理軟件才可以實現(xiàn)對被監(jiān)控的資源節(jié)點的管理; 另一種是無須安裝代理,通過簡單網(wǎng)絡(luò)管理協(xié)議(Simple Network Management Protocol, SNMP)或智能平臺管理接口 (International Precious Metals Institute, IPMI)等實現(xiàn) 管理。在這兩種類型的設(shè)備管理軟件中,不在被監(jiān)控節(jié)點安裝監(jiān)控代理服務(wù)程序是最簡 便、最安全的管理方式。但是,通過SNMP協(xié)議和其他諸如IPMI等協(xié)議對只能實現(xiàn)對設(shè)備的 簡單管理。隨著用戶對設(shè)備管理要求的越來越高,這種方式已經(jīng)越來越不能滿足用戶的管 理需求。因此,在被監(jiān)控的資源節(jié)點安裝監(jiān)控代理服務(wù)程序是目前較為普遍的一種方式。在實現(xiàn)本發(fā)明過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)存在如下問題由于各種原因引起的監(jiān)控代理停止運行會使得監(jiān)控中心端無法與監(jiān)控代理進(jìn)行 正常通信,導(dǎo)致無法監(jiān)控中心無法繼續(xù)對被監(jiān)控的資源節(jié)點進(jìn)行管理,成為此種監(jiān)控方式 的一個軟肋。為了解決監(jiān)控代理停止運行,無法正常與監(jiān)控中心通訊的問題,我們提出一套具 有靈活性和監(jiān)控容錯功能的設(shè)備監(jiān)控管理的方案。

      發(fā)明內(nèi)容
      本發(fā)明提供一種監(jiān)控代理的故障處理方法和系統(tǒng),以解決現(xiàn)有技術(shù)中不能及時處 理監(jiān)控代理運行中止的問題。為解決上述技術(shù)問題,本發(fā)明提供了如下技術(shù)方案一種監(jiān)控代理的故障處理方法,被監(jiān)控的資源節(jié)點包括第一監(jiān)控代理和第二監(jiān)控 代理,其中所述第二監(jiān)控代理監(jiān)控所述第一監(jiān)控代理的運行狀態(tài);在監(jiān)控到第一監(jiān)控代理因故障運行中止時,所述第二監(jiān)控代理觸發(fā)第一監(jiān)控代理 的啟動流程。進(jìn)一步的,所述方法還具有如下特點所述第二監(jiān)控代理觸發(fā)第一監(jiān)控代理的啟動流程,包括所述第二監(jiān)控代理判斷所述第一監(jiān)控代理發(fā)生的故障是否需要處理;如果所述第一監(jiān)控代理發(fā)生的故障需要處理,則所述第二監(jiān)控代理在處理該所述 第一監(jiān)控代理發(fā)生的故障后啟動所述第一監(jiān)控代理;否則,所述第二監(jiān)控代理直接啟動所 述第一監(jiān)控代理。進(jìn)一步的,所述方法還具有如下特點所述處理該所述第一監(jiān)控代理發(fā)生的故障 的過程,包括所述第二監(jiān)控代理從本地預(yù)先存儲的故障處理策略中查找所述第一監(jiān)控代理發(fā) 生的故障對應(yīng)的處理策略;如果查找到第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略,則所述第二監(jiān)控代理采用 該處理策略處理所述第一監(jiān)控代理發(fā)生的故障;如果未查找到所述第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略,則所述第二監(jiān)控代 理從監(jiān)控中心獲取該監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略,再采用該處理策略處理所述第 一監(jiān)控代理發(fā)生的故障;或者,所述第二監(jiān)控代理請求監(jiān)控中心處理所述第二監(jiān)控代理發(fā) 生的故障。進(jìn)一步的,所述方法還具有如下特點所述第二監(jiān)控代理觸發(fā)第一監(jiān)控代理的啟 動流程,包括所述第二監(jiān)控代理向監(jiān)控中心上報第一監(jiān)控代理運行中止的信息;所述監(jiān)控中心根據(jù)所述第一監(jiān)控代理運行中止的信息,啟動所述第一監(jiān)控代理。進(jìn)一步的,所述方法還具有如下特點所述第二監(jiān)控代理觸發(fā)第一監(jiān)控代理的啟 動流程,包括所述第二監(jiān)控代理判斷所述第一監(jiān)控代理發(fā)生的故障是否需要處理;如果所述第一監(jiān)控代理發(fā)生的故障需要處理,則所述第二監(jiān)控代理通知監(jiān)控中心 處理所述第一監(jiān)控代理發(fā)生的故障;所述監(jiān)控中心處理所述監(jiān)控代理發(fā)生的故障,并在故 障處理完成后,啟動所述第一監(jiān)控代理;如果所述第一監(jiān)控代理發(fā)生的故障不需要處理,則所述第二監(jiān)控代理直接啟動所 述第一監(jiān)控代理。一種監(jiān)控代理的故障處理系統(tǒng),被監(jiān)控的資源節(jié)點包括第一監(jiān)控代理和第二監(jiān)控 代理,其中所述第二監(jiān)控代理包括監(jiān)控裝置,用于監(jiān)控所述第一監(jiān)控代理的運行狀態(tài);處理裝置,用于在監(jiān)控到第一監(jiān)控代理因故障運行中止時,所述第二監(jiān)控代理觸 發(fā)第一監(jiān)控代理的啟動流程。進(jìn)一步的,所述方法還具有如下特點所述處理裝置包括判斷模塊,用于判斷所述第一監(jiān)控代理發(fā)生的故障是否需要處理;啟動模塊,用于在所述第一監(jiān)控代理發(fā)生的故障需要處理時,在處理該所述第一 監(jiān)控代理發(fā)生的故障后啟動所述第一監(jiān)控代理;以及,在所述第一監(jiān)控代理發(fā)生的故障不 需要處理時所述第二監(jiān)控代理直接啟動所述第一監(jiān)控代理。進(jìn)一步的,所述方法還具有如下特點所述處理裝置還包括查找模塊,用于從本地預(yù)先存儲的故障處理策略中查找所述第一監(jiān)控代理發(fā)生的
      5故障對應(yīng)的處理策略;第一處理模塊,用于在查找到第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略時,采用 該處理策略處理所述第一監(jiān)控代理發(fā)生的故障;第二處理模塊,用于在未查找到所述第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略 時,從監(jiān)控中心獲取該監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略,再采用該處理策略處理所述 第一監(jiān)控代理發(fā)生的故障;或者,所述第二監(jiān)控代理請求監(jiān)控中心處理所述第二監(jiān)控代理 發(fā)生的故障。進(jìn)一步的,所述方法還具有如下特點所述處理裝置包括上報模塊,用于向所述監(jiān)控中心上報第一監(jiān)控代理運行中止的信息;所述系統(tǒng)還包括監(jiān)控中心,用于根據(jù)所述第一監(jiān)控代理運行中止的信息,啟動所述第一監(jiān)控代理。進(jìn)一步的,所述方法還具有如下特點所述處理裝置包括判斷模塊,用于判斷所述第一監(jiān)控代理發(fā)生的故障是否需要處理;通知模塊,用于在所述第一監(jiān)控代理發(fā)生的故障需要處理時,通知所述監(jiān)控中心 處理所述第一監(jiān)控代理發(fā)生的故障;啟動模塊,用于在所述第一監(jiān)控代理發(fā)生的故障不需要處理時,直接啟動所述第 一監(jiān)控代理;所述系統(tǒng)還包括監(jiān)控中心,用于處理所述第一監(jiān)控代理發(fā)生的故障,并在故障處理完成后,啟動所 述第一監(jiān)控代理。本發(fā)明提供的實施例,通過第二監(jiān)控代理監(jiān)控第一監(jiān)控代理的運行狀態(tài),在第一 監(jiān)控代理運行中止時,觸發(fā)啟動該第一監(jiān)控代理的流程,縮短了發(fā)現(xiàn)第一監(jiān)控代理故障的 時間,能夠縮短啟動第一監(jiān)控代理的時間,保證信息的正常通信。


      圖1為本發(fā)明提供的監(jiān)控代理的故障處理方法的流程示意圖;圖2為本發(fā)明提供的監(jiān)控代理的故障處理系統(tǒng)實施例的結(jié)構(gòu)示意圖;圖3為圖2所示系統(tǒng)實施例中所述處理裝置的結(jié)構(gòu)示意圖;圖4為圖3所示處理裝置的另一結(jié)構(gòu)示意圖;圖5為圖2所示系統(tǒng)實施例的另一結(jié)構(gòu)示意圖;圖6為圖2所示系統(tǒng)實施例的又一結(jié)構(gòu)示意圖。
      具體實施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖及具體實施例對 本發(fā)明作進(jìn)一步的詳細(xì)描述。需要說明的是,在不沖突的情況下,本申請中的實施例及實施 例中的特征可以相互任意組合。圖1為本發(fā)明提供的監(jiān)控代理的故障處理方法的流程示意圖。圖1所示方法實施例包括在實施例一中,監(jiān)控中心為被監(jiān)控的資源包括第一監(jiān)控代理和第二監(jiān)控代理。其中所述被監(jiān)控的資源可以是某一網(wǎng)絡(luò)系統(tǒng)(如云計算操作系統(tǒng))中的物理設(shè) 備,可以為服務(wù)器、存儲設(shè)備(如數(shù)據(jù)庫)和傳輸設(shè)備(如交換機(jī)和路由器等)中至少一個。步驟101、第二監(jiān)控代理接收第一監(jiān)控代理因故障不運行的信息;其中,監(jiān)測第一監(jiān)控代理的運行狀態(tài)可以有該第二監(jiān)控代理進(jìn)行監(jiān)測,但不限于 此,也可以通過被監(jiān)控的資源節(jié)點中用于與第一監(jiān)控代理通信的通信單元來實現(xiàn)監(jiān)測功 能,例如,該通信模塊在向第一監(jiān)控代理發(fā)送信息后在一預(yù)定的時間內(nèi)沒有收到對應(yīng)的響 應(yīng),則通信模塊確定該第一監(jiān)控代理不處于運行狀態(tài),則向第二監(jiān)控代理發(fā)送該第一監(jiān)控 代理因故障不運行的信息。步驟102、第二監(jiān)控代理觸發(fā)啟動該第一監(jiān)控代理的流程。其中根據(jù)啟動該第一監(jiān)控代理的操作執(zhí)行體的不同,將觸發(fā)啟動該第一監(jiān)控代理 的流程有如下兩種方式第一種方式102A是由第二監(jiān)控代理啟動,具體如下步驟201、該第二監(jiān)控代理判斷所述第一監(jiān)控代理發(fā)生的故障是否需要處理;例如,第二監(jiān)控代理可以預(yù)先存儲一列表,記錄第一監(jiān)控代理上可能發(fā)生的故障 中需要處理的故障,采用該列表進(jìn)行比較。步驟202、如果所述第一監(jiān)控代理發(fā)生的故障需要處理,則在處理該所述第一監(jiān)控 代理發(fā)生的故障后再啟動該第一監(jiān)控代理;否則,直接啟動該第一監(jiān)控代理。需要說明的是,步驟201執(zhí)行的內(nèi)容是為了保證后續(xù)啟動該第一監(jiān)控代理時只需 一次啟動操作該第一監(jiān)控代理就能正常運行,以達(dá)到縮短故障的處理時間的目的。當(dāng)然,也 可以直接啟動,因為對于一些故障在重啟第一監(jiān)控代理就會消失,比如由于監(jiān)控中心發(fā)送 了錯誤的命令造成第一監(jiān)控代理運行中止,此時直接啟動該第一監(jiān)控代理就可以了。然而, 對于一些故障,如第一監(jiān)控代理沒有足夠的硬盤空間存儲日志信息的情況,在啟動該第一 監(jiān)控代理后,該故障仍然存在,關(guān)閉該第一監(jiān)控代理,再等待故障處理完成才能啟動該第一 監(jiān)控代理,由此可以看出,直接啟動該第一監(jiān)控代理,有可能出現(xiàn)二次啟動的問題,增加了 故障處理的時間。其中,步驟202中的處理該所述第一監(jiān)控代理發(fā)生的故障的過程也可以如下兩種 方式 第一種方式202A具體包括步驟Al、第二監(jiān)控代理從本地預(yù)先存儲的需要處理的故障對應(yīng)的處理策略,查找 該第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略;如果查找到,則執(zhí)行步驟A5 ;否則,執(zhí)行步驟A2 A5 ;步驟A2、第二監(jiān)控代理向監(jiān)控中心查詢該第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策 略;步驟A3、監(jiān)控中心生成該第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略;步驟A4、監(jiān)控中心向第二監(jiān)控代理發(fā)送該第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策 略;在步驟A4執(zhí)行完成后,執(zhí)行步驟A5。
      步驟A5、第二監(jiān)控代理采用得到的處理策略處理該第一監(jiān)控代理發(fā)生的故障;步驟A6、在檢測到故障處理完成后,第二監(jiān)控代理啟動該第一監(jiān)控代理。其中在第一種方式202A中,如果執(zhí)行步驟Al后未查找到該第一監(jiān)控代理發(fā)生的 故障對應(yīng)的處理策略,步驟A2 A5的執(zhí)行內(nèi)容還可以采用如下方式進(jìn)行處理第二監(jiān)控 代理向監(jiān)控中心上報第一監(jiān)控代理運行中止的信息;監(jiān)控中心根據(jù)第二監(jiān)控代理上報的信 息,對該第一監(jiān)控代理進(jìn)行故障處理。第二種方式102B是由監(jiān)控中心或者其與第二監(jiān)控代理共同對第一監(jiān)控代理的啟 動進(jìn)行管理,具體如下第一種方式為只由監(jiān)控中心來啟動該第一監(jiān)控代理,具體包括所述第二監(jiān)控代理向監(jiān)控中心上報第一監(jiān)控代理運行中止的信息;所述監(jiān)控中心 根據(jù)所述第一監(jiān)控代理運行中止的信息,啟動所述第一監(jiān)控代理。此方式中,只要第一監(jiān)控代理運行中止,第二監(jiān)控代理就會向監(jiān)控中心發(fā)送信息, 以觸發(fā)監(jiān)控中心啟動第一監(jiān)控代理的流程。此種方式的優(yōu)點在于,與現(xiàn)有技術(shù)中監(jiān)控中心 通過一段時間不能接收到第一監(jiān)控代理發(fā)送的信息才能確定第一監(jiān)控代理運行中止相比, 監(jiān)控中心能夠及時獲知第一監(jiān)控代理運行中止的信息,能夠快速進(jìn)行故障處理,縮短第一 監(jiān)控代理運行中止的時間且第二監(jiān)控代理的操作流程簡單。第二種方式為監(jiān)控中心與第二監(jiān)控代理共同對第一監(jiān)控代理的啟動進(jìn)行管理,具 體包括所述第二監(jiān)控代理在預(yù)先存儲的需要處理的故障信息中查找是否包括所述第一 監(jiān)控代理發(fā)生的故障;如果在所述需要處理的故障信息中未查找到所述第一監(jiān)控代理發(fā)生的故障,則所 述第二監(jiān)控代理直接啟動該第一監(jiān)控代理;如果在所述需要處理的故障信息中查找到所述第一監(jiān)控代理發(fā)生的故障,則所述 第二監(jiān)控代理通知監(jiān)控中心處理所述第一監(jiān)控代理發(fā)生的故障,所述監(jiān)控中心處理所述第 一監(jiān)控代理發(fā)生的故障,并在故障處理完成后,啟動所述第一監(jiān)控代理。由于一些故障在重啟該第一監(jiān)控代理后故障就會消失,所以為了縮短第一監(jiān)控代 理的處理時間,優(yōu)選的,第二監(jiān)控代理可以先判斷第一監(jiān)控代理發(fā)生的故障是否需要處理, 如果需要處理,則向監(jiān)控中心上報的第一監(jiān)控代理運行中止的信息,否則,第二監(jiān)控代理直 接啟動該第一監(jiān)控代理。由上可以看出,對于在重啟該第一監(jiān)控代理后故障就會消失的故 障,由該第二監(jiān)控代理直接啟動,減少了第二監(jiān)控代理的上報流程,也減少了監(jiān)控中心的處 理任務(wù)。需要說明的是,在實際應(yīng)用中,被監(jiān)控的資源節(jié)點包括多個監(jiān)控代理時,只需有一 個監(jiān)控代理被其余的至少一個監(jiān)控代理監(jiān)控即可。舉例來說,被監(jiān)控的資源節(jié)點上有兩個 監(jiān)控代理,兩者可以互相監(jiān)控對方的運行狀態(tài)。當(dāng)然,被監(jiān)控的資源節(jié)點上的多個監(jiān)控代理的代理內(nèi)容可以相同,也可以不同。例 如,一個監(jiān)控代理負(fù)責(zé)提供各種信息獲取的接口 ;另一個監(jiān)控代理負(fù)責(zé)監(jiān)控系統(tǒng)運行情況。圖2為本發(fā)明提供的監(jiān)控代理的故障處理系統(tǒng)實施例的結(jié)構(gòu)示意圖。結(jié)合圖1所 示方法實施例的內(nèi)容,圖2所示系統(tǒng)包括被監(jiān)控的資源節(jié)點包括第一監(jiān)控代理和第二監(jiān) 控代理,其中所述第一監(jiān)控代理和所述第二監(jiān)控代理的代理功能不同,所述第二監(jiān)控代理包括監(jiān)控裝置,用于監(jiān)控所述第一監(jiān)控代理的運行狀態(tài);處理裝置,用于在監(jiān)控到第一監(jiān)控代理因故障運行中止時,所述第二監(jiān)控代理觸 發(fā)第一監(jiān)控代理的啟動流程。圖3為圖2所示系統(tǒng)實施例中所述處理裝置的結(jié)構(gòu)示意圖。圖3所示處理裝置包 括判斷模塊,用于判斷所述第一監(jiān)控代理發(fā)生的故障是否需要處理;啟動模塊,用于在所述第一監(jiān)控代理發(fā)生的故障需要處理時,在處理該所述第一 監(jiān)控代理發(fā)生的故障后啟動所述第一監(jiān)控代理;以及,在所述第一監(jiān)控代理發(fā)生的故障不 需要處理時所述第二監(jiān)控代理直接啟動所述第一監(jiān)控代理。圖4為圖3所示處理裝置的另一結(jié)構(gòu)示意圖。圖4所示處理裝置還包括查找模塊,用于從本地預(yù)先存儲的故障處理策略中查找所述第一監(jiān)控代理發(fā)生的 故障對應(yīng)的處理策略;第一處理模塊,用于在查找到第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略時,采用 該處理策略處理所述第一監(jiān)控代理發(fā)生的故障;第二處理模塊,用于在未查找到所述第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略 時,從監(jiān)控中心獲取該監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略,再采用該處理策略處理所述 第一監(jiān)控代理發(fā)生的故障;或者,所述第二監(jiān)控代理請求監(jiān)控中心處理所述第二監(jiān)控代理 發(fā)生的故障。圖5為圖2所示系統(tǒng)實施例的另一結(jié)構(gòu)示意圖。圖5所示系統(tǒng)具體如下所述處理裝置包括上報模塊,用于向所述監(jiān)控中心上報第一監(jiān)控代理運行中止的信息;所述系統(tǒng)還包括監(jiān)控中心,用于根據(jù)所述第一監(jiān)控代理運行中止的信息,啟動所述第一監(jiān)控代理。圖6為圖2所示系統(tǒng)實施例的又一結(jié)構(gòu)示意圖。圖6所示系統(tǒng)具體如下所述處理裝置包括判斷模塊,用于判斷所述第一監(jiān)控代理發(fā)生的故障是否需要處理;通知模塊,用于在所述第一監(jiān)控代理發(fā)生的故障需要處理時,通知所述監(jiān)控中心 處理所述第一監(jiān)控代理發(fā)生的故障;啟動模塊,用于在所述第一監(jiān)控代理發(fā)生的故障不需要處理時,直接啟動所述第 一監(jiān)控代理;所述系統(tǒng)還包括監(jiān)控中心,用于處理所述第一監(jiān)控代理發(fā)生的故障,并在故障處理完成后,啟動所 述第一監(jiān)控代理。本發(fā)明提供的系統(tǒng)實施例,通過第二監(jiān)控代理監(jiān)控第一監(jiān)控代理的運行狀態(tài),在 第一監(jiān)控代理運行中止時,觸發(fā)啟動該第一監(jiān)控代理的流程,縮短了發(fā)現(xiàn)第一監(jiān)控代理故 障的時間,能夠縮短啟動第一監(jiān)控代理的時間,保證信息的正常通信。本領(lǐng)域普通技術(shù)人員可以理解上述實施例的全部或部分步驟可以使用計算機(jī)程 序流程來實現(xiàn),所述計算機(jī)程序可以存儲于一計算機(jī)可讀存儲介質(zhì)中,所述計算機(jī)程序在相應(yīng)的硬件平臺上(如系統(tǒng)、設(shè)備、裝置、器件等)執(zhí)行,在執(zhí)行時,包括方法實施例的步驟 之一或其組合。可選地,上述實施例的全部或部分步驟也可以使用集成電路來實現(xiàn),這些步驟可 以被分別制作成一個個集成電路模塊,或者將它們中的多個模塊或步驟制作成單個集成電 路模塊來實現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。上述實施例中的各裝置/功能模塊/功能單元可以采用通用的計算裝置來實現(xiàn), 它們可以集中在單個的計算裝置上,也可以分布在多個計算裝置所組成的網(wǎng)絡(luò)上。上述實施例中的各裝置/功能模塊/功能單元以軟件功能模塊的形式實現(xiàn)并作為 獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機(jī)可讀取存儲介質(zhì)中。上述提到的計算機(jī) 可讀取存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。以上所述,僅為本發(fā)明的具體實施方式
      ,但本發(fā)明的保護(hù)范圍并不局限于此,任何 熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求所述的保護(hù)范圍為準(zhǔn)。
      權(quán)利要求
      1.一種監(jiān)控代理的故障處理方法,其特征在于,被監(jiān)控的資源節(jié)點包括第一監(jiān)控代理 和第二監(jiān)控代理,其中所述第二監(jiān)控代理監(jiān)控所述第一監(jiān)控代理的運行狀態(tài);在監(jiān)控到第一監(jiān)控代理因故障運行中止時,所述第二監(jiān)控代理觸發(fā)第一監(jiān)控代理的啟 動流程。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第二監(jiān)控代理觸發(fā)第一監(jiān)控代理的 啟動流程,包括所述第二監(jiān)控代理判斷所述第一監(jiān)控代理發(fā)生的故障是否需要處理;如果所述第一監(jiān)控代理發(fā)生的故障需要處理,則所述第二監(jiān)控代理在處理該所述第一 監(jiān)控代理發(fā)生的故障后啟動所述第一監(jiān)控代理;否則,所述第二監(jiān)控代理直接啟動所述第 一監(jiān)控代理。
      3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述處理該所述第一監(jiān)控代理發(fā)生的故 障的過程,包括所述第二監(jiān)控代理從本地預(yù)先存儲的故障處理策略中查找所述第一監(jiān)控代理發(fā)生的 故障對應(yīng)的處理策略;如果查找到第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略,則所述第二監(jiān)控代理采用該處 理策略處理所述第一監(jiān)控代理發(fā)生的故障;如果未查找到所述第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略,則所述第二監(jiān)控代理從 監(jiān)控中心獲取該監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略,再采用該處理策略處理所述第一監(jiān) 控代理發(fā)生的故障;或者,所述第二監(jiān)控代理請求監(jiān)控中心處理所述第二監(jiān)控代理發(fā)生的 故障。
      4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第二監(jiān)控代理觸發(fā)第一監(jiān)控代理的 啟動流程,包括所述第二監(jiān)控代理向監(jiān)控中心上報第一監(jiān)控代理運行中止的信息;所述監(jiān)控中心根據(jù)所述第一監(jiān)控代理運行中止的信息,啟動所述第一監(jiān)控代理。
      5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述第二監(jiān)控代理觸發(fā)第一監(jiān)控代理的 啟動流程,包括所述第二監(jiān)控代理判斷所述第一監(jiān)控代理發(fā)生的故障是否需要處理;如果所述第一監(jiān)控代理發(fā)生的故障需要處理,則所述第二監(jiān)控代理通知監(jiān)控中心處理 所述第一監(jiān)控代理發(fā)生的故障;所述監(jiān)控中心處理所述監(jiān)控代理發(fā)生的故障,并在故障處 理完成后,啟動所述第一監(jiān)控代理;如果所述第一監(jiān)控代理發(fā)生的故障不需要處理,則所述第二監(jiān)控代理直接啟動所述第 一監(jiān)控代理。
      6.一種監(jiān)控代理的故障處理系統(tǒng),其特征在于,被監(jiān)控的資源節(jié)點包括第一監(jiān)控代理 和第二監(jiān)控代理,其中所述第二監(jiān)控代理包括監(jiān)控裝置,用于監(jiān)控所述第一監(jiān)控代理的運行狀態(tài);處理裝置,用于在監(jiān)控到第一監(jiān)控代理因故障運行中止時,所述第二監(jiān)控代理觸發(fā)第 一監(jiān)控代理的啟動流程。
      7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述處理裝置包括判斷模塊,用于判斷所述第一監(jiān)控代理發(fā)生的故障是否需要處理; 啟動模塊,用于在所述第一監(jiān)控代理發(fā)生的故障需要處理時,在處理該所述第一監(jiān)控 代理發(fā)生的故障后啟動所述第一監(jiān)控代理;以及,在所述第一監(jiān)控代理發(fā)生的故障不需要 處理時所述第二監(jiān)控代理直接啟動所述第一監(jiān)控代理。
      8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述處理裝置還包括查找模塊,用于從本地預(yù)先存儲的故障處理策略中查找所述第一監(jiān)控代理發(fā)生的故障 對應(yīng)的處理策略;第一處理模塊,用于在查找到第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略時,采用該處 理策略處理所述第一監(jiān)控代理發(fā)生的故障;第二處理模塊,用于在未查找到所述第一監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略時,從 監(jiān)控中心獲取該監(jiān)控代理發(fā)生的故障對應(yīng)的處理策略,再采用該處理策略處理所述第一監(jiān) 控代理發(fā)生的故障;或者,所述第二監(jiān)控代理請求監(jiān)控中心處理所述第二監(jiān)控代理發(fā)生的 故障。
      9.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于 所述處理裝置包括上報模塊,用于向所述監(jiān)控中心上報第一監(jiān)控代理運行中止的信息; 所述系統(tǒng)還包括監(jiān)控中心,用于根據(jù)所述第一監(jiān)控代理運行中止的信息,啟動所述第一監(jiān)控代理。
      10.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于 所述處理裝置包括判斷模塊,用于判斷所述第一監(jiān)控代理發(fā)生的故障是否需要處理; 通知模塊,用于在所述第一監(jiān)控代理發(fā)生的故障需要處理時,通知所述監(jiān)控中心處理 所述第一監(jiān)控代理發(fā)生的故障;啟動模塊,用于在所述第一監(jiān)控代理發(fā)生的故障不需要處理時,直接啟動所述第一監(jiān) 控代理;所述系統(tǒng)還包括監(jiān)控中心,用于處理所述第一監(jiān)控代理發(fā)生的故障,并在故障處理完成后,啟動所述第 一監(jiān)控代理。
      全文摘要
      本發(fā)明提供一種監(jiān)控代理的故障處理方法和系統(tǒng)。所述方法中所述被監(jiān)控的資源節(jié)點包括第一監(jiān)控代理和第二監(jiān)控代理,其中所述第二監(jiān)控代理監(jiān)控所述第一監(jiān)控代理的運行狀態(tài);在監(jiān)控到第一監(jiān)控代理因故障運行中止時,所述第二監(jiān)控代理觸發(fā)第一監(jiān)控代理的啟動流程。
      文檔編號H04L12/24GK102148707SQ20111003098
      公開日2011年8月10日 申請日期2011年1月28日 優(yōu)先權(quán)日2011年1月28日
      發(fā)明者劉成平, 王理想 申請人:浪潮(北京)電子信息產(chǎn)業(yè)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1