專利名稱:用于分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明的領(lǐng)域是數(shù)據(jù)處理,或者更具體地講,是用于分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的方法、設(shè)備和產(chǎn)品。
背景技術(shù):
1948年EDVAC計(jì)算機(jī)系統(tǒng)的開發(fā)經(jīng)常被引用作為計(jì)算機(jī)時(shí)代的開始。自那時(shí)以來(lái),計(jì)算機(jī)系統(tǒng)已演變?yōu)闃O為復(fù)雜的裝置。今天的計(jì)算機(jī)比早期的諸如EDVAC的系統(tǒng)精密得多。計(jì)算機(jī)系統(tǒng)通常包括硬件和軟件部件、應(yīng)用程序、操作系統(tǒng)、處理器、總線、存儲(chǔ)器、輸入/輸出裝置等的組合。隨著半導(dǎo)體加工和計(jì)算機(jī)架構(gòu)的進(jìn)步把計(jì)算機(jī)的性能推升得越來(lái)越高,更精密的計(jì)算機(jī)軟件已逐漸發(fā)展以利用硬件的更高性能,從而導(dǎo)致今天的計(jì)算機(jī)系統(tǒng)比僅僅幾年前的計(jì)算機(jī)系統(tǒng)強(qiáng)大得多。用于密集型計(jì)算的現(xiàn)代分布式處理系統(tǒng)可具有數(shù)百萬(wàn)裝置,在每個(gè)裝置上運(yùn)行許多進(jìn)程,所有進(jìn)程能夠?yàn)樽詣?dòng)錯(cuò)誤恢復(fù)、向系統(tǒng)管理員報(bào)告以及為了其它原因而執(zhí)行錯(cuò)誤和狀態(tài)報(bào)告。在許多情況下,在例如出錯(cuò)的情況下,這種錯(cuò)誤報(bào)告和狀態(tài)報(bào)告的絕對(duì)數(shù)量如此巨大以致不能以有意義的方式處理它們。例如,接收到十萬(wàn)個(gè)錯(cuò)誤報(bào)告的系統(tǒng)管理員可能由于這種報(bào)告的絕對(duì)數(shù)量而不知所措,因此,總的說(shuō)來(lái),這些報(bào)告變得越來(lái)越無(wú)用并且不相關(guān)。
發(fā)明內(nèi)容
提供了用于分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的方法、系統(tǒng)和產(chǎn)品,包括由與事件隊(duì)列關(guān)聯(lián)的事件收聽器確定事件隊(duì)列中的一個(gè)或多個(gè)事件是否尚未由任何事件分析器分配到任何事件池;如果事件隊(duì)列中的一個(gè)或多個(gè)事件尚未被分配到任何事件池,則由事件收聽器根據(jù)事件分析規(guī)則識(shí)別一個(gè)或多個(gè)警報(bào);由事件收聽器向警報(bào)隊(duì)列發(fā)送由事件收聽器識(shí)別的所有警報(bào);警報(bào)隊(duì)列具有關(guān)聯(lián)的警報(bào)收聽器;由警報(bào)收聽器確定警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)是否尚未被分配到任何警報(bào)池;如果警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)尚未被分配到任何警報(bào)池,則由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則確定是否抑制該警報(bào);把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。通過(guò)下面對(duì)如附圖中所示的本發(fā)明的示例性實(shí)施例的更加具體的描述,本發(fā)明的前述和其它目的、特征和優(yōu)點(diǎn)將會(huì)變得清楚,在附圖中相同的標(biāo)號(hào)通常代表本發(fā)明的示例性實(shí)施例的相同部件。
圖1示出根據(jù)本發(fā)明實(shí)施例的用于分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的示例性系統(tǒng)。圖2闡述根據(jù)本發(fā)明實(shí)施例的包括用于相關(guān)警報(bào)傳送的示例性計(jì)算機(jī)的自動(dòng)計(jì)算機(jī)器的框圖。
圖3闡述根據(jù)本發(fā)明實(shí)施例的用于分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的示例性系統(tǒng)的框圖。圖4闡述根據(jù)本發(fā)明實(shí)施例的示出把事件分配到事件池的圖。圖5闡述根據(jù)本發(fā)明實(shí)施例的示出把警報(bào)分配到警報(bào)池的圖。圖6闡述根據(jù)本發(fā)明實(shí)施例的用于分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的示例性方法的流程圖。
圖7闡述示出包括事件收聽器和警報(bào)收聽器的分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的另外的方法的流程圖。
具體實(shí)施例方式參照從圖1開始的附圖描述根據(jù)本發(fā)明實(shí)施例的用于分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的示例性方法、系統(tǒng)和計(jì)算機(jī)程序產(chǎn)品。圖1示出根據(jù)本發(fā)明實(shí)施例的用于分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的示例性系統(tǒng)。分布式處理系統(tǒng)通常實(shí)現(xiàn)為通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)通信的多個(gè)自主或半自主計(jì)算機(jī)。在這種示例性分布式處理系統(tǒng)中,計(jì)算機(jī)經(jīng)常彼此交互以實(shí)現(xiàn)共同的目標(biāo)。在這種示例性分布式系統(tǒng)中運(yùn)行的計(jì)算機(jī)程序通常稱為分布式程序,分布式編程常用于描述編寫這種程序的過(guò)程。在圖1的例子中,分布式處理系統(tǒng)(101)實(shí)現(xiàn)為并行計(jì)算機(jī)(100)、用于該計(jì)算機(jī)的具有數(shù)據(jù)存儲(chǔ)裝置(11 形式的非易失性存儲(chǔ)器、用于該計(jì)算機(jī)的具有打印機(jī)(120)形式的輸出裝置和用于該計(jì)算機(jī)的具有計(jì)算機(jī)終端(12 形式的輸入/輸出裝置。在圖1的例子中的并行計(jì)算機(jī)(100)還包括多個(gè)計(jì)算節(jié)點(diǎn)(102)。每個(gè)計(jì)算節(jié)點(diǎn)是包括一個(gè)或多個(gè)計(jì)算機(jī)處理器、它自己的計(jì)算機(jī)存儲(chǔ)器和它自己的輸入/輸出功能的自動(dòng)計(jì)算裝置。計(jì)算節(jié)點(diǎn)(102)通過(guò)幾種獨(dú)立數(shù)據(jù)通信網(wǎng)絡(luò)(包括高速以太網(wǎng)(174)、聯(lián)合測(cè)試行動(dòng)組(“JTAG”)網(wǎng)絡(luò)(104)、針對(duì)集體操作進(jìn)行優(yōu)化的樹形網(wǎng)絡(luò)(1( )和針對(duì)點(diǎn)到點(diǎn)操作進(jìn)行優(yōu)化的環(huán)網(wǎng)(108))耦接以進(jìn)行數(shù)據(jù)通信。樹形網(wǎng)絡(luò)(106)是包括連接到計(jì)算節(jié)點(diǎn)的數(shù)據(jù)通信鏈路以把計(jì)算節(jié)點(diǎn)組織為樹的數(shù)據(jù)通信網(wǎng)絡(luò)。每個(gè)數(shù)據(jù)通信網(wǎng)絡(luò)由計(jì)算節(jié)點(diǎn)(10 之間的數(shù)據(jù)通信鏈路實(shí)現(xiàn)。數(shù)據(jù)通信鏈路為并行計(jì)算機(jī)的計(jì)算節(jié)點(diǎn)之間的并行操作提供數(shù)據(jù)通信。除了計(jì)算節(jié)點(diǎn)之外,計(jì)算機(jī)(100)還包括通過(guò)數(shù)據(jù)通信網(wǎng)絡(luò)之一 (174)耦接到計(jì)算節(jié)點(diǎn)(102)的輸入/輸出(“I/O”)節(jié)點(diǎn)(110,114)。I/O節(jié)點(diǎn)(110,114)在計(jì)算節(jié)點(diǎn)(102)和I/O裝置(118,120,122)之間提供I/O服務(wù)。I/O節(jié)點(diǎn)(110,114)通過(guò)局域網(wǎng)(“LAN”)連接到數(shù)據(jù)通信I/O裝置(118,120,122)。計(jì)算機(jī)(100)還包括通過(guò)網(wǎng)絡(luò)之一(104)耦接到計(jì)算節(jié)點(diǎn)的服務(wù)節(jié)點(diǎn)(116)。服務(wù)節(jié)點(diǎn)(116)提供對(duì)于多個(gè)計(jì)算節(jié)點(diǎn)而言共同的服務(wù),把程序載入到計(jì)算節(jié)點(diǎn),在計(jì)算節(jié)點(diǎn)上開始程序執(zhí)行,取回計(jì)算節(jié)點(diǎn)上程序操作的結(jié)果等等。服務(wù)節(jié)點(diǎn)(116)運(yùn)行服務(wù)應(yīng)用(124)并通過(guò)計(jì)算機(jī)終端(12 上運(yùn)行的服務(wù)應(yīng)用界面(126)與用戶(128)通信。圖1的分布式處理系統(tǒng)的許多部件(即,分布式處理系統(tǒng)的裝置或者圖1的分布式處理系統(tǒng)的裝置上運(yùn)行的進(jìn)程)能夠通過(guò)事件進(jìn)行某種形式的錯(cuò)誤或狀態(tài)報(bào)告,并且許多這種部件也能夠接收響應(yīng)于一個(gè)或多個(gè)這種事件的警報(bào)。通常,在根據(jù)本發(fā)明實(shí)施例可用的分布式處理系統(tǒng)中,幾十萬(wàn)或者幾百萬(wàn)的部件可提供事件或者接收警報(bào)。圖1的服務(wù)節(jié)點(diǎn)(116)在其上安裝了事件和警報(bào)分析模塊(124),事件和警報(bào)分析模塊(124)能夠執(zhí)行根據(jù)本發(fā)明實(shí)施例的分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送。圖1的事件和警報(bào)分析模塊(124)實(shí)現(xiàn)為能夠執(zhí)行以下操作的自動(dòng)計(jì)算機(jī)器在事件隊(duì)列中接收來(lái)自分布式處理系統(tǒng)的一個(gè)或多個(gè)部件的多個(gè)事件;由事件分析器把每個(gè)接收的事件分配到事件池;由事件分析器根據(jù)事件分析規(guī)則和分配到事件池的事件識(shí)別一個(gè)或多個(gè)警報(bào);由事件分析器向警報(bào)分析器發(fā)送由事件分析器識(shí)別的所有警報(bào);由警報(bào)分析器把識(shí)別的警報(bào)分配到警報(bào)池;由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則和警報(bào)池中的警報(bào)確定是否抑制任何警報(bào);并且把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。在一些實(shí)施例中,未抑制的警報(bào)被發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。一個(gè)這種部件可以是向系統(tǒng)管理員進(jìn)行顯示的終端(122)。其它部件可包括產(chǎn)生事件的部件、用于錯(cuò)誤報(bào)告的部件、用于自動(dòng)錯(cuò)誤恢復(fù)的部件或者本領(lǐng)域技術(shù)人員將會(huì)想到的任何其它部件。圖1的事件和警報(bào)模塊(124)還包括能夠執(zhí)行以下操作的自動(dòng)計(jì)算機(jī)器由與事件隊(duì)列關(guān)聯(lián)的事件收聽器確定事件隊(duì)列中的一個(gè)或多個(gè)事件是否尚未由任何事件分析器分配到任何事件池;如果事件隊(duì)列中的一個(gè)或多個(gè)事件尚未被分配到任何事件池,則由事件收聽器根據(jù)事件分析規(guī)則識(shí)別一個(gè)或多個(gè)警報(bào);由事件收聽器向警報(bào)隊(duì)列發(fā)送由事件收聽器識(shí)別的所有警報(bào);警報(bào)隊(duì)列具有關(guān)聯(lián)的警報(bào)收聽器;由警報(bào)收聽器確定警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)是否尚未被分配到任何警報(bào)池;如果警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)尚未被分配到任何警報(bào)池,則由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則確定是否抑制該警報(bào);并且把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。圖1的事件和警報(bào)模塊(124)使得在任何給定時(shí)間接收的事件和產(chǎn)生的警報(bào)的數(shù)量對(duì)于試圖識(shí)別分布式處理系統(tǒng)中的問題或事故的系統(tǒng)管理員(128)而言不那么巨大。相關(guān)警報(bào)傳送提供在確定如何管理與分布式處理系統(tǒng)關(guān)聯(lián)的功能和錯(cuò)誤時(shí)對(duì)于用戶而言更有意義的警報(bào)。構(gòu)成圖1中示出的示例性分布式處理系統(tǒng)的節(jié)點(diǎn)、網(wǎng)絡(luò)和I/O裝置的布置僅用于說(shuō)明,而非用于限制本發(fā)明。如本領(lǐng)域技術(shù)人員能想到的,根據(jù)本發(fā)明實(shí)施例能夠?qū)崿F(xiàn)相關(guān)警報(bào)傳送的分布式數(shù)據(jù)處理系統(tǒng)可包括圖1中未顯示的另外的節(jié)點(diǎn)、網(wǎng)絡(luò)、裝置和架構(gòu)。圖1的例子中的并行計(jì)算機(jī)(100)包括16個(gè)計(jì)算節(jié)點(diǎn)(102);根據(jù)本發(fā)明實(shí)施例能夠?qū)崿F(xiàn)相關(guān)警報(bào)傳送的并行計(jì)算機(jī)有時(shí)包括幾千個(gè)計(jì)算節(jié)點(diǎn)。如本領(lǐng)域技術(shù)人員能想到的,除了以太網(wǎng)和JTAG之外,這種數(shù)據(jù)處理系統(tǒng)中的網(wǎng)絡(luò)還可支持許多數(shù)據(jù)通信協(xié)議,包括例如TCP(傳輸控制協(xié)議)、IP(互聯(lián)網(wǎng)協(xié)議)等。除了圖1中示出的硬件平臺(tái)之外,本發(fā)明的各種實(shí)施例可實(shí)現(xiàn)在各種硬件平臺(tái)上。根據(jù)本發(fā)明的相關(guān)警報(bào)傳送通常利用計(jì)算機(jī)(S卩,利用自動(dòng)計(jì)算機(jī)器)來(lái)實(shí)現(xiàn)。在圖1的系統(tǒng)中,例如,并行計(jì)算機(jī)的所有服務(wù)節(jié)點(diǎn)、I/O節(jié)點(diǎn)、計(jì)算節(jié)點(diǎn)在某種程度上至少實(shí)現(xiàn)為計(jì)算機(jī)。為了進(jìn)一步的解釋,因此,圖2闡述根據(jù)本發(fā)明實(shí)施例的包括用于相關(guān)警報(bào)傳送的示例性計(jì)算機(jī)(15 的自動(dòng)計(jì)算機(jī)器的框圖。圖2的計(jì)算機(jī)(15 包括至少一個(gè)計(jì)算機(jī)處理器(156)或者“CPU”;以及隨機(jī)存取存儲(chǔ)器(16 ( “RAM”),通過(guò)高速存儲(chǔ)器總線(166)和總線適配器(158)連接到處理器(156)和計(jì)算機(jī)(152)的其它部件,并且通過(guò)擴(kuò)展總線連接到用于與分布式處理系統(tǒng)(101)的其它部件通信的適配器。事件和警報(bào)分析模塊(124)存儲(chǔ)在RAM(168)中,它是根據(jù)本發(fā)明實(shí)施例的用于相關(guān)警報(bào)傳送的自動(dòng)計(jì)算機(jī)器的模塊。事件和警報(bào)分析模塊(124)包括事件分析器(208)和警報(bào)分析器(218)。圖2的事件分析器是能夠根據(jù)接收的事件識(shí)別警報(bào)的自動(dòng)計(jì)算機(jī)器的模塊。也就是說(shuō),事件分析器通常接收事件并產(chǎn)生警報(bào)。在許多實(shí)施例中,多個(gè)事件分析器并行地實(shí)現(xiàn)。通常,這種事件分析器被分配給特定事件池并且可關(guān)注來(lái)自特定部件或者由特定事故引起的事件以產(chǎn)生更加簡(jiǎn)潔的一組警報(bào)。圖2的警報(bào)分析器是能夠執(zhí)行以下操作的自動(dòng)計(jì)算機(jī)器的模塊識(shí)別事件中的用于發(fā)送的警報(bào)和其它警報(bào);識(shí)別另外的用于發(fā)送的警報(bào);并且抑制由事件分析器識(shí)別的不必要的、不相關(guān)的或者由于其它原因不想要的警報(bào)。也就是說(shuō),警報(bào)分析器通常接收警報(bào)和事件并根據(jù)這些警報(bào)和事件產(chǎn)生或者轉(zhuǎn)發(fā)警報(bào)。在許多實(shí)施例中,多個(gè)警報(bào)分析器并行地實(shí)現(xiàn)。通常,這種警報(bào)分析器被分配給特定警報(bào)池并且可關(guān)注具有特定屬性的警報(bào)以產(chǎn)生更加簡(jiǎn)潔的一組警報(bào)。圖2的事件和警報(bào)分析模塊(124)包括用于執(zhí)行以下操作的計(jì)算機(jī)程序指令在事件隊(duì)列中接收來(lái)自分布式處理系統(tǒng)(101)的一個(gè)或多個(gè)部件(例如,100,182,181,180和170)的多個(gè)事件;由事件分析器(208)把每個(gè)接收的事件分配到事件池;由事件分析器(208)根據(jù)事件分析規(guī)則和分配到事件池的事件識(shí)別一個(gè)或多個(gè)警報(bào);由事件分析器(208)向警報(bào)分析器(218)發(fā)送由事件分析器(208)識(shí)別的所有警報(bào);由警報(bào)分析器(218)把識(shí)別的警報(bào)分配到警報(bào)池;由警報(bào)分析器(218)根據(jù)警報(bào)分析規(guī)則和警報(bào)池中的警報(bào)確定是否抑制任何警報(bào);并且把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。圖2的事件和警報(bào)模塊(124)還包括用于執(zhí)行以下操作的計(jì)算機(jī)程序指令由與事件隊(duì)列關(guān)聯(lián)的事件收聽器確定事件隊(duì)列中的一個(gè)或多個(gè)事件是否尚未由任何事件分析器分配到任何事件池;如果事件隊(duì)列中的一個(gè)或多個(gè)事件尚未被分配到任何事件池,則由事件收聽器根據(jù)事件分析規(guī)則識(shí)別一個(gè)或多個(gè)警報(bào);由事件收聽器向警報(bào)隊(duì)列發(fā)送由事件收聽器識(shí)別的所有警報(bào);警報(bào)隊(duì)列具有關(guān)聯(lián)的警報(bào)收聽器;由警報(bào)收聽器確定警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)是否尚未被分配到任何警報(bào)池;如果警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)尚未被分配到任何警報(bào)池,則由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則確定是否抑制該警報(bào);并且把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。在RAM(168)中還存儲(chǔ)操作系統(tǒng)(154)。根據(jù)本發(fā)明實(shí)施例的可用于相關(guān)警報(bào)傳送的操作系統(tǒng)包括UNIX 、Linux 、MicrosoftXP 、AIX 、IBM的i5/0S 和本領(lǐng)域技術(shù)人員將會(huì)想到的其它操作系統(tǒng)。圖2的例子中的操作系統(tǒng)(IM)、事件和警報(bào)分析模塊(IM)、事件分析器008)、警報(bào)分析器(218)顯示在RAM(168)中,但這種軟件的許多部件通常也存儲(chǔ)在非易失性存儲(chǔ)器中,例如存儲(chǔ)在盤驅(qū)動(dòng)器(170)上。圖2的計(jì)算機(jī)(152)包括通過(guò)擴(kuò)展總線(160)和總線適配器(158)耦接到處理器(156)和計(jì)算機(jī)(15 的其它部件的盤驅(qū)動(dòng)適配器(172)。盤驅(qū)動(dòng)適配器(172)以盤驅(qū)動(dòng)器(170)的形式把非易失性數(shù)據(jù)存儲(chǔ)器連接到計(jì)算機(jī)(152)。根據(jù)本發(fā)明實(shí)施例的用于相關(guān)警報(bào)傳送的計(jì)算機(jī)中的盤驅(qū)動(dòng)適配器包括集成驅(qū)動(dòng)電子設(shè)備(“IDE”)適配器、小型計(jì)算機(jī)系統(tǒng)接口(“SCSI”)適配器和本領(lǐng)域技術(shù)人員將會(huì)想到的其它盤驅(qū)動(dòng)適配器。如本領(lǐng)域技術(shù)人員能想到的,非易失性計(jì)算機(jī)存儲(chǔ)器還可以實(shí)現(xiàn)為光盤驅(qū)動(dòng)器、電可擦除可編程只讀存儲(chǔ)器(所謂的“EEPR0M”或“閃速”存儲(chǔ)器)、RAM驅(qū)動(dòng)器等等。圖2的示例性計(jì)算機(jī)(152)包括一個(gè)或多個(gè)輸入/輸出(“I/O”)適配器(178)。I/O適配器通過(guò)例如用于控制向顯示裝置(諸如,計(jì)算機(jī)顯示屏幕)的輸出以及來(lái)自用戶輸入裝置(181)(諸如,鍵盤和鼠標(biāo))的用戶輸入的軟件驅(qū)動(dòng)程序和計(jì)算機(jī)硬件,執(zhí)行面向用戶的輸入/輸出。圖2的示例性計(jì)算機(jī)(15 包括視頻適配器(209),視頻適配器(209)是針對(duì)對(duì)于顯示裝置(180)(諸如,顯示屏幕或計(jì)算機(jī)監(jiān)視器)的圖形輸出而專門設(shè)計(jì)的I/0適配器的例子。視頻適配器(209)通過(guò)高速視頻總線(164)、總線適配器(158)和前側(cè)總線(162)(前側(cè)總線(162)也是高速總線)連接到處理器(156)。圖2的示例性計(jì)算機(jī)(152)包括用于與其它計(jì)算機(jī)(182)的數(shù)據(jù)通信和用于與數(shù)據(jù)通信網(wǎng)絡(luò)(100)的數(shù)據(jù)通信的通信適配器(167)。這種數(shù)據(jù)通信可以通過(guò)RS-232連接、通過(guò)外部總線(諸如,通用串行總線(“USB”))、通過(guò)數(shù)據(jù)通信網(wǎng)絡(luò)(諸如,IP數(shù)據(jù)通信網(wǎng)絡(luò))以及按照本領(lǐng)域技術(shù)人員將會(huì)想到的其它方式以串行方式執(zhí)行。通信適配器實(shí)現(xiàn)硬件級(jí)的數(shù)據(jù)通信,通過(guò)這種硬件級(jí)的數(shù)據(jù)通信,一個(gè)計(jì)算機(jī)直接地或者通過(guò)數(shù)據(jù)通信網(wǎng)絡(luò)把數(shù)據(jù)通信發(fā)送給另一計(jì)算機(jī)。根據(jù)本發(fā)明實(shí)施例的可用于相關(guān)警報(bào)傳送的通信適配器的例子包括用于有線撥號(hào)通信的調(diào)制解調(diào)器、用于有線數(shù)據(jù)通信網(wǎng)絡(luò)通信的以太網(wǎng)(IEEE802. 3)適配器和用于無(wú)線數(shù)據(jù)通信網(wǎng)絡(luò)通信的802. 11適配器。為了進(jìn)一步的解釋,圖3闡述根據(jù)本發(fā)明實(shí)施例的用于分布式處理系統(tǒng)(102)中的相關(guān)警報(bào)傳送的示例性系統(tǒng)的框圖。圖3的系統(tǒng)包括事件和警報(bào)分析模塊(IM)。圖3的事件和警報(bào)分析模塊(124)在事件隊(duì)列(206)中接收來(lái)自分布式處理系統(tǒng)(10 的一個(gè)或多個(gè)部件的多個(gè)事件002)。根據(jù)本發(fā)明實(shí)施例的分布式處理系統(tǒng)的部件可以是分布式處理系統(tǒng)的裝置或者在分布式處理的裝置上運(yùn)行的進(jìn)程。通常為了錯(cuò)誤或狀態(tài)報(bào)告,這種部件經(jīng)常能夠執(zhí)行某一形式事件發(fā)送。根據(jù)本發(fā)明實(shí)施例的事件是分布式處理系統(tǒng)的部件中或部件上的特定事故的通知。這種事件被從發(fā)生事故的部件或另一報(bào)告部件發(fā)送給根據(jù)本發(fā)明的事件和警報(bào)分析模塊。通常,事件是數(shù)據(jù)處理系統(tǒng)的部件中發(fā)生的錯(cuò)誤的通知。事件經(jīng)常實(shí)現(xiàn)為通過(guò)數(shù)據(jù)通信網(wǎng)絡(luò)或共享存儲(chǔ)器發(fā)送的消息。根據(jù)本發(fā)明實(shí)施例的用于事件和警報(bào)分析的典型事件包括發(fā)生時(shí)間、記錄時(shí)間、事件類型、事件ID、報(bào)告部件、源部件和其它屬性。發(fā)生時(shí)間是在部件上發(fā)生該事件的時(shí)間。記錄時(shí)間是事件被包括在事件隊(duì)列O06)中的時(shí)間并且在圖3的例子中通常由監(jiān)測(cè)器(204)插入到事件中。事件類型是事件的一般類型,如本領(lǐng)域技術(shù)人員能想到的,諸如電源錯(cuò)誤、鏈接失敗錯(cuò)誤、與未接收到消息或者丟包相關(guān)的錯(cuò)誤等等。事件ID是事件的唯一標(biāo)識(shí)。報(bào)告部件是報(bào)告該事件的部件的標(biāo)識(shí)。源部件是發(fā)生該事件的部件的標(biāo)識(shí)。在許多情況下,但并非在所有情況下,報(bào)告部件和源部件是分布式處理系統(tǒng)的同一部件。在圖3的例子中,事件和警報(bào)分析模塊(124)包括監(jiān)測(cè)器O04),監(jiān)測(cè)器Q04)從分布式處理系統(tǒng)的部件接收事件并把接收的事件(20 放在事件隊(duì)列(206)中。圖3的監(jiān)測(cè)器(204)可接收來(lái)自分布式處理系統(tǒng)的部件的由其發(fā)送的事件,可定期地輪詢分布式處理系統(tǒng)的一個(gè)或多個(gè)部件或者按照本領(lǐng)域技術(shù)人員將會(huì)想到的其它方式從部件接收事件。圖3的系統(tǒng)包括事件分析器(208)。圖3的事件分析器(208)是能夠根據(jù)接收的事件識(shí)別警報(bào)的自動(dòng)計(jì)算機(jī)器的模塊。也就是說(shuō),事件分析器通常接收事件并產(chǎn)生警報(bào)。在許多實(shí)施例中,多個(gè)事件分析器并行地實(shí)現(xiàn)。通常,事件分析器被分配給特定事件池并且可關(guān)注來(lái)自特定部件或者由特定事故引起的事件以產(chǎn)生更加簡(jiǎn)潔的一組警報(bào)。
圖3的事件分析器(208)把每個(gè)接收的事件(202)分配給事件池(212)。事件池(212)是按照事件發(fā)生的時(shí)間、按照事件被記錄在事件隊(duì)列中的時(shí)間、被包括在事件池中的時(shí)間或者本領(lǐng)域技術(shù)人員將會(huì)想到的其它時(shí)間而組織的事件的集合。也就是說(shuō),事件池是按照時(shí)間組織的事件的集合。這種事件池經(jīng)常提供分析一組時(shí)間相關(guān)事件并根據(jù)它們識(shí)別警報(bào)的能力。通常,這種事件池有助于根據(jù)多個(gè)相關(guān)事件識(shí)別或多或少的相關(guān)警報(bào)。根據(jù)圖3的方法的事件池具有預(yù)定初始時(shí)間段,在圖3的例子中,由事件分析器把每個(gè)接收的事件分配給事件池包括對(duì)于分配給事件池的每個(gè)事件把所述預(yù)定初始時(shí)間段延長(zhǎng)分配給該事件的特定時(shí)間段。以這種方式,利用每個(gè)接收的事件延長(zhǎng)事件池,直至可有益地用于識(shí)別警報(bào)的事件的集合被分配給事件池。如上所述,在本發(fā)明的一些實(shí)施例中,超過(guò)一個(gè)事件分析器可并行地操作。這樣,每個(gè)事件分析器可維護(hù)根據(jù)本發(fā)明實(shí)施例的用于相關(guān)警報(bào)傳送的一個(gè)或多個(gè)事件池。由事件分析器把事件分配給事件池因此可包括僅選擇來(lái)自一個(gè)或多個(gè)特定部件的事件。在這種實(shí)施例中,可以為特定事件池選擇特定部件,以從一個(gè)或多個(gè)部件的特定組提供與特定時(shí)間段關(guān)聯(lián)的事件。還可以通過(guò)僅選擇特定事件類型的事件執(zhí)行由事件分析器把事件分配給事件池。在這種實(shí)施例中,可以為特定事件池選擇特定事件,以從特定組的事件類型提供與特定時(shí)間段關(guān)聯(lián)的事件。圖3的例子中的事件分析器(208)根據(jù)事件分析規(guī)則(210)和分配給事件池的事件識(shí)別一個(gè)或多個(gè)警報(bào)(214)。事件分析規(guī)則(210)是用于以有意義的方式解析接收的事件以根據(jù)事件識(shí)別相關(guān)警報(bào)的預(yù)定規(guī)則的集合。預(yù)先確定這種規(guī)則以根據(jù)一個(gè)或多個(gè)事件的組合和這些事件的屬性識(shí)別特定警報(bào)。事件分析規(guī)則例如可規(guī)定根據(jù)特定事件類型或事件的部件類型或者該事件的其它屬性識(shí)別用于發(fā)送給系統(tǒng)管理員的特定的預(yù)定警報(bào)。這種事件分析規(guī)則是靈活的并且可針對(duì)特定分布式計(jì)算系統(tǒng)及其功能進(jìn)行修改。根據(jù)本發(fā)明實(shí)施例的警報(bào)是基于超過(guò)一個(gè)事件的事故(諸如,錯(cuò)誤)的精煉標(biāo)識(shí),因此提供在分布式處理系統(tǒng)中在其操作的上下文中的事故的標(biāo)識(shí)。通常,警報(bào)可以是根據(jù)從數(shù)據(jù)處理系統(tǒng)的一個(gè)或多個(gè)部件接收的多個(gè)事件識(shí)別的特定錯(cuò)誤類型的事故的通知,諸如多個(gè)裝置之間的鏈接失敗(所述多個(gè)裝置中的每個(gè)裝置正在基于單個(gè)鏈接失敗產(chǎn)生許多事件)或者引起幾千個(gè)事件的電源故障等。警報(bào)經(jīng)常實(shí)現(xiàn)為通過(guò)數(shù)據(jù)通信網(wǎng)絡(luò)或共享存儲(chǔ)器發(fā)送的消息。根據(jù)本發(fā)明實(shí)施例的典型警報(bào)具有基于識(shí)別出該警報(bào)的接收的事件的屬性的附于警報(bào)的屬性。圖3的例子中的事件分析器O08)把由事件分析器O08)識(shí)別的所有警報(bào)(214)發(fā)送給警報(bào)分析器(218)。圖3的警報(bào)分析器是能夠執(zhí)行以下操作的自動(dòng)計(jì)算機(jī)器的模塊識(shí)別來(lái)自事件的用于發(fā)送的警報(bào)和其它警報(bào);識(shí)別另外的用于發(fā)送的警報(bào);并且抑制由事件分析器識(shí)別的不必要的、不相關(guān)的或者由于其它原因不想要的警報(bào)。也就是說(shuō),警報(bào)分析器通常接收警報(bào)和事件并根據(jù)這些警報(bào)和事件產(chǎn)生或者轉(zhuǎn)發(fā)警報(bào)。在許多實(shí)施例中,多個(gè)警報(bào)分析器并行地實(shí)現(xiàn)。通過(guò)警報(bào)隊(duì)列(216)把圖3的例子中的警報(bào)(216)從事件分析器(208)發(fā)送到警報(bào)分析器(218)。圖3的警報(bào)分析器018)把每個(gè)識(shí)別的警報(bào)014)分配給警報(bào)池(224)。警報(bào)池(224)是按照導(dǎo)致警報(bào)被識(shí)別的一個(gè)或多個(gè)事件的時(shí)間、識(shí)別警報(bào)的時(shí)間或者本領(lǐng)域技術(shù)人員將會(huì)想到的其它時(shí)間組織的警報(bào)的集合。也就是說(shuō),警報(bào)池是按照時(shí)間組織的警報(bào)的集合。這種警報(bào)池常提供分析根據(jù)某一時(shí)間識(shí)別并被包括在警報(bào)池中的一組警報(bào)的能力。通常,這種警報(bào)池有助于根據(jù)多個(gè)相關(guān)事件和多個(gè)相關(guān)警報(bào)識(shí)別或多或少的相關(guān)警報(bào)。如本領(lǐng)域技術(shù)人員能想到的,可通過(guò)僅選擇從來(lái)自一個(gè)或多個(gè)特定部件的事件產(chǎn)生的警報(bào)、僅選擇與特定警報(bào)類型關(guān)聯(lián)的警報(bào)等,執(zhí)行由警報(bào)分析器把識(shí)別的警報(bào)分配給警報(bào)池(224)。圖3的警報(bào)分析器(218)根據(jù)警報(bào)分析規(guī)則(22 和警報(bào)池中的警報(bào)確定是否抑制任何警報(bào)。通常通過(guò)以下操作來(lái)執(zhí)行抑制警報(bào)丟棄警報(bào)、刪除警報(bào)或者以其它方式不把抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的部件。警報(bào)分析規(guī)則(222)是用于執(zhí)行以下操作的規(guī)則的集合抑制一個(gè)或多個(gè)警報(bào)以提供用于向分布式處理系統(tǒng)的部件發(fā)送(諸如,用于向系統(tǒng)管理員顯示)的更加相關(guān)的一組警報(bào)并且識(shí)別用于向分布式處理系統(tǒng)的一個(gè)或多個(gè)部件發(fā)送的另外的警報(bào)。如本領(lǐng)域技術(shù)人員能想到的,警報(bào)分析規(guī)則例如可規(guī)定要抑制重復(fù)的警報(bào),要抑制用于向特定部件發(fā)送的特定類型的警報(bào),要抑制發(fā)送給特定部件的特定類型的警報(bào)等等。對(duì)于用于自動(dòng)錯(cuò)誤恢復(fù)的分布式處理系統(tǒng)的部件或者對(duì)于原本可能從多個(gè)原始未分析的警報(bào)得到更少信息的系統(tǒng)管理員而言,這種警報(bào)可能更加有意義。圖3的警報(bào)分析器018)還能訪問事件隊(duì)列(206)。依賴于警報(bào)分析規(guī)則的圖3的警報(bào)分析器(218)可在一些實(shí)施例中從事件隊(duì)列選擇事件并根據(jù)選擇的事件確定是否抑制任何警報(bào)。也就是說(shuō),對(duì)于抑制警報(bào)以及對(duì)于識(shí)別用于向一個(gè)或多個(gè)部件發(fā)送的另外的警報(bào),警報(bào)分析規(guī)則也可以考慮事件及其屬性。這種事件可與警報(bào)池中的警報(bào)相關(guān)或者獨(dú)立于這些警報(bào)。圖3的警報(bào)分析器(218)把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。警報(bào)分析器可通過(guò)在數(shù)據(jù)通信網(wǎng)絡(luò)上、通過(guò)共享存儲(chǔ)器發(fā)送作為消息的警報(bào)或者按照本領(lǐng)域技術(shù)人員將會(huì)想到的其它方式,把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。在圖3的例子中,未抑制的警報(bào)(220)被發(fā)送給終端(122)以顯示給系統(tǒng)管理員(128)。圖3的警報(bào)分析器(218)還能夠根據(jù)警報(bào)分析規(guī)則(22 、警報(bào)池(224)中的警報(bào)和選擇的事件(206)識(shí)別一個(gè)或多個(gè)另外的警報(bào)并把它們發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。所述另外的警報(bào)可包括未由事件分析器識(shí)別的一個(gè)或多個(gè)警報(bào)。這種另外的警報(bào)可把附加信息提供給系統(tǒng)管理員的分布式處理系統(tǒng)的部件。如上所述,在根據(jù)本發(fā)明實(shí)施例的相關(guān)警報(bào)傳送的許多實(shí)施例中,多個(gè)事件分析器(208)和警報(bào)分析器018)與多個(gè)事件池(21 和警報(bào)池(224)并行地工作。然而,在這種實(shí)施例中,存在這樣的可能性事件將不會(huì)被事件分析器分配到事件池或者警報(bào)將不會(huì)被警報(bào)分析器分配到警報(bào)池。典型地,事件或者警報(bào)可能不被分配到事件池或者警報(bào)池,因?yàn)槭录蛘呔瘓?bào)的屬性不與由任何實(shí)例化的事件分析器或者警報(bào)分析器所尋求的屬性相對(duì)應(yīng)。這樣,圖3的事件和警報(bào)分析模塊(124)具有與事件隊(duì)列(206)關(guān)聯(lián)的事件收聽器090),用于處理未被分配到事件池012)的事件;以及與警報(bào)隊(duì)列(216)關(guān)聯(lián)的警報(bào)收聽器092),用于處理未被分配到警報(bào)池OM)的警報(bào)。圖3的例子中的事件收聽器(四0)是監(jiān)測(cè)事件隊(duì)列中的每個(gè)事件并確定該事件是否已被分配給一個(gè)或多個(gè)事件池的自動(dòng)計(jì)算機(jī)器的模塊。事件收聽器(四0)確定事件隊(duì)列中的一個(gè)或多個(gè)事件是否尚未被任何事件分析器分配給任何事件池,如果事件隊(duì)列中的一個(gè)或多個(gè)事件尚未被分配給任何事件池,則事件收聽器(四0)根據(jù)事件分析規(guī)則識(shí)別一個(gè)或多個(gè)警報(bào)并把識(shí)別的警報(bào)發(fā)送給警報(bào)隊(duì)列。警報(bào)收聽器(292)是監(jiān)測(cè)警報(bào)隊(duì)列并確定一個(gè)或多個(gè)警報(bào)是否尚未被分配給警報(bào)池的自動(dòng)計(jì)算機(jī)器的模塊。圖3的警報(bào)收聽器( 確定警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)是否尚未被分配給任何警報(bào)池,如果警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)尚未被分配給任何警報(bào)池,則警報(bào)收聽器( 根據(jù)警報(bào)分析規(guī)則確定是否抑制該警報(bào)并把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。如上所述,根據(jù)本發(fā)明的相關(guān)警報(bào)傳送包括把事件分配給事件池。為了進(jìn)一步的解釋,圖4闡述根據(jù)本發(fā)明實(shí)施例的示出把事件分配到事件池的圖。事件池(21 是按照事件發(fā)生的時(shí)間、按照事件被記錄在事件隊(duì)列中的時(shí)間、被包括在事件池中的時(shí)間或者本領(lǐng)域技術(shù)人員將會(huì)想到的其它時(shí)間組織的事件的集合。也就是說(shuō),事件池是按照時(shí)間組織的事件的集合。這種事件池經(jīng)常提供分析一組時(shí)間相關(guān)事件并根據(jù)它們識(shí)別警報(bào)的能力。通常,這種事件池有助于根據(jù)多個(gè)相關(guān)事件識(shí)別或多或少的相關(guān)警報(bào)。事件經(jīng)常根據(jù)它們的記錄時(shí)間被分配給事件池。也就是說(shuō),通常按照在事件隊(duì)列中接收到事件的次序把事件插入到事件池中。在圖4的例子中,當(dāng)在時(shí)間、把第一事件“事件0”(402)分配給事件池012)時(shí)開始事件池012)的定時(shí)。針對(duì)從、到tf的預(yù)定初始時(shí)間段開始圖4的事件池。也就是說(shuō),當(dāng)接收到第一個(gè)事件“事件O” (402)時(shí),圖4的事件池具有在、開始并且在tf結(jié)束的預(yù)定初始時(shí)間段??筛鶕?jù)本領(lǐng)域技術(shù)人員將會(huì)想到的許多因素構(gòu)造所述預(yù)定初始時(shí)間段,如本領(lǐng)域技術(shù)人員能想到的,諸如分布式處理系統(tǒng)中的部件的數(shù)量、接收事件的頻率、通常接收的事件的類型等等。在圖4的例子中,對(duì)于在從、到tf的所述預(yù)定初始時(shí)間段期間分配給事件池的每個(gè)新事件,所述初始時(shí)間段被延長(zhǎng)分配給該事件的特定時(shí)間段。在圖4的例子中,當(dāng)把“事件1” (402)分配給事件池012)時(shí),所述預(yù)定初始時(shí)間段、-、被延長(zhǎng)具有時(shí)間el的“延長(zhǎng)部分1” (406),由此建立在tf+el之前沒有其它事件被分配給事件池的情況下在tf+el封閉事件池012)的新時(shí)間。類似地,在圖4的例子中,當(dāng)把具有時(shí)間e2的“事件2” (404)分配給事件池時(shí),現(xiàn)在延長(zhǎng)的‘-“μ的時(shí)間段再次被延長(zhǎng)了延長(zhǎng)部分2(408),由此建立在tf+el+e2之前或者事件池的某一最大時(shí)間屆滿之前沒有其它事件被分配給事件池的情況下在時(shí)間tf+el+e2封閉事件池的新時(shí)間。以這種方式,利用每個(gè)接收的事件延長(zhǎng)事件池直至可有益地用于識(shí)別警報(bào)的事件的集合被分配給事件池。在本發(fā)明的典型實(shí)施例中,事件池可具有不能再延長(zhǎng)的最大持續(xù)時(shí)間。在這種情況下,可能存在這樣的要求未駐留于事件池中達(dá)到閾值時(shí)長(zhǎng)的事件應(yīng)該移至下一事件池。在一些實(shí)施例中,移至下一事件池的這種事件的屬性與初始事件池一起用于根據(jù)本發(fā)明實(shí)施例的相關(guān)警報(bào)傳送,在其它實(shí)施例中,這種事件的屬性與該事件所移至的下一事件池一起用于相關(guān)警報(bào)傳送。在許多實(shí)施例中,多個(gè)事件池可并行地使用,這種事件池中的一個(gè)或多個(gè)事件池被分配給特定事件分析器。在這種實(shí)施例中,事件分析器可指向具有特定屬性的事件池中的事件。
如上所述,根據(jù)本發(fā)明的相關(guān)警報(bào)傳送還包括把警報(bào)分配給警報(bào)池。為了進(jìn)一步的解釋,圖5闡述根據(jù)本發(fā)明實(shí)施例的示出把警報(bào)分配到警報(bào)池的圖。圖5的警報(bào)池(224)以類似于圖4的事件池的方式工作。也就是說(shuō),根據(jù)圖5的例子的警報(bào)池包括警報(bào),該警報(bào)池的定時(shí)以時(shí)間、處的第一個(gè)警報(bào)“警報(bào)0” (500)開始,并被構(gòu)造為具有預(yù)定初始時(shí)間段、-、。在圖5的例子中,針對(duì)在從、到tf的預(yù)定初始時(shí)間段中分配給警報(bào)池的每個(gè)新警報(bào),所述初始時(shí)間段被延長(zhǎng)了分配給該警報(bào)的特定時(shí)間段。在圖5的例子中,當(dāng)把“警報(bào)1” (502)分配給警報(bào)池OM)時(shí),所述預(yù)定初始時(shí)間段被延長(zhǎng)了具有時(shí)間el的“延長(zhǎng)部分1” (506),由此建立在tf+el之前沒有其它警報(bào)被分配給警報(bào)池的情況下在tf+el封閉警報(bào)池(224)的新時(shí)間。類似地,在圖5的例子中,當(dāng)把具有時(shí)間e2的“警報(bào)2” (504)分配給警報(bào)池時(shí),現(xiàn)在延長(zhǎng)的的時(shí)間段再次被延長(zhǎng)了“延長(zhǎng)部分2”(508),由此建立在tf+el+e2之前或者在警報(bào)池的某一最大時(shí)間屆滿之前沒有其它警報(bào)被分配給警報(bào)池的情況下在時(shí)間tf+el+e2封閉警報(bào)池的新時(shí)間。在本發(fā)明的典型實(shí)施例中,警報(bào)池可具有不能再延長(zhǎng)的最大持續(xù)時(shí)間。在這種情況下,可存在這樣的要求未駐留于警報(bào)池中達(dá)到閾值時(shí)長(zhǎng)的警報(bào)應(yīng)該移至下一警報(bào)池。在一些實(shí)施例中,移至下一警報(bào)池的這種警報(bào)的屬性與初始警報(bào)池一起用于根據(jù)本發(fā)明實(shí)施例的相關(guān)警報(bào)傳送,在其它實(shí)施例中,這種警報(bào)的屬性與該警報(bào)所移至的下一警報(bào)池一起用于相關(guān)警報(bào)傳送。在許多實(shí)施例中,多個(gè)警報(bào)池可并行地使用,這種警報(bào)池中的一個(gè)或多個(gè)警報(bào)池被分配給特定警報(bào)分析器。在這種實(shí)施例中,警報(bào)分析器可指向具有特定屬性的警報(bào)池中的警報(bào)。為了進(jìn)一步的解釋,圖6闡述根據(jù)本發(fā)明實(shí)施例的分布式處理系統(tǒng)(102)中的相關(guān)警報(bào)傳送的示例性方法的流程圖。圖6的方法包括在事件隊(duì)列中接收(40 來(lái)自分布式處理系統(tǒng)的一個(gè)或多個(gè)部件的多個(gè)事件002)。根據(jù)本發(fā)明實(shí)施例的用于相關(guān)警報(bào)傳送的事件可包括發(fā)生時(shí)間、記錄時(shí)間、事件類型、事件ID、報(bào)告部件和源部件。通過(guò)接收由數(shù)據(jù)處理系統(tǒng)的一個(gè)或多個(gè)部件啟動(dòng)的事件并根據(jù)事件發(fā)生的時(shí)間或者根據(jù)接收到事件的時(shí)間把事件存儲(chǔ)在事件隊(duì)列中,可以執(zhí)行在事件隊(duì)列中接收(402)來(lái)自分布式處理系統(tǒng)的一個(gè)或多個(gè)部件的多個(gè)事件002)。通過(guò)對(duì)部件的狀態(tài)進(jìn)行輪詢并且作為響應(yīng)接收事件并且根據(jù)事件發(fā)生的時(shí)間或者根據(jù)接收到事件的時(shí)間把事件存儲(chǔ)在事件隊(duì)列中,也可以執(zhí)行在事件隊(duì)列中接收(40 來(lái)自分布式處理系統(tǒng)的一個(gè)或多個(gè)部件的多個(gè)事件(202)。圖6的方法包括由事件分析器把每個(gè)接收的事件(20 分配(404)給事件池(212)。在本發(fā)明的一些實(shí)施例中,通過(guò)根據(jù)記錄時(shí)間把事件分配給事件池,可執(zhí)行由事件分析器把每個(gè)接收的事件(20 分配(404)給事件池012)。也可以根據(jù)事件的屬性執(zhí)行由事件分析器把每個(gè)接收的事件(20 分配(404)給事件池012)。如本領(lǐng)域技術(shù)人員能想到的,這種屬性可包括發(fā)生事故從而產(chǎn)生事件的部件的標(biāo)識(shí)或類型、事件的報(bào)告部件、事件ID、事件類型等等。根據(jù)圖6的方法的事件池包括在預(yù)定初始時(shí)間段期間發(fā)生的事件,在圖6的例子中,由事件分析器把每個(gè)接收的事件分配(404)給事件池包括對(duì)于分配給事件池的每個(gè)事件,把所述預(yù)定初始時(shí)間段延長(zhǎng)(426)分配給該事件的特定時(shí)間段。
圖6的方法還包括由事件分析器根據(jù)事件分析規(guī)則(210)和分配到事件池的事件識(shí)別(410) —個(gè)或多個(gè)警報(bào)(214)。通過(guò)根據(jù)分配給事件池的事件的一個(gè)或多個(gè)屬性識(shí)別警報(bào),可執(zhí)行由事件分析器根據(jù)事件分析規(guī)則(210)和分配到事件池的事件識(shí)別(410)一個(gè)或多個(gè)警報(bào)014)。通過(guò)把事件的屬性與事件分析規(guī)則進(jìn)行比較并作為比較的結(jié)果識(shí)別一個(gè)或多個(gè)警報(bào),可執(zhí)行由事件分析器根據(jù)事件分析規(guī)則(210)和分配到事件池的事件識(shí)別(410) —個(gè)或多個(gè)警報(bào)014)。如本領(lǐng)域技術(shù)人員能想到的,這種屬性可包括從其接收事件的部件的類型、產(chǎn)生事件的部件的類型、產(chǎn)生事件的部件的標(biāo)識(shí)、產(chǎn)生或接收事件的時(shí)間、事件中報(bào)告的錯(cuò)誤和許多其它屬性。通過(guò)為事件池選擇事件并且把事件池的事件的屬性與事件分析規(guī)則進(jìn)行比較并且作為比較的結(jié)果識(shí)別根據(jù)事件分析規(guī)則規(guī)定用于發(fā)送的一個(gè)或多個(gè)警報(bào),可執(zhí)行由事件分析器根據(jù)事件分析規(guī)則(210)和分配到事件池的事件識(shí)別(410) —個(gè)或多個(gè)警報(bào)(214)。圖6的方法還包括由事件分析器向警報(bào)分析器發(fā)送G12)由事件分析器識(shí)別的所有警報(bào)014)。通過(guò)從事件分析器向警報(bào)分析器發(fā)送包含警報(bào)的消息,可執(zhí)行由事件分析器向警報(bào)分析器發(fā)送(41 由事件分析器識(shí)別的所有警報(bào)(214)。這種消息可在網(wǎng)絡(luò)上、通過(guò)共享存儲(chǔ)器或者按照本領(lǐng)域技術(shù)人員將會(huì)想到的其它方式被從事件分析器發(fā)送到警報(bào)分析器。圖6的方法還包括由警報(bào)分析器把識(shí)別的警報(bào)分配(414)給警報(bào)池(224)。根據(jù)圖6的方法的警報(bào)池具有預(yù)定初始時(shí)間段,在圖6的例子中,由警報(bào)分析器把識(shí)別的警報(bào)分配(414)給警報(bào)池(224)包括對(duì)于分配給警報(bào)池的每個(gè)警報(bào),把所述預(yù)定初始時(shí)間段延長(zhǎng)(426)分配給該警報(bào)的特定時(shí)間段。根據(jù)警報(bào)的屬性也可以執(zhí)行由警報(bào)分析器把識(shí)別的警報(bào)分配(414)給警報(bào)池(224)。如本領(lǐng)域技術(shù)人員能想到的,這種屬性可包括發(fā)生事故從而產(chǎn)生用于識(shí)別警報(bào)的事件的部件的標(biāo)識(shí)或類型、警報(bào)ID、警報(bào)類型等等。圖6的方法還包括由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則022)和警報(bào)池中的警報(bào)確定(416)是否抑制任何警報(bào)。可根據(jù)警報(bào)的一個(gè)或多個(gè)屬性執(zhí)行由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則(222)和警報(bào)池中的警報(bào)確定(416)是否抑制任何警報(bào)。如本領(lǐng)域技術(shù)人員能想到的,這種屬性可包括發(fā)生事故從而產(chǎn)生用于識(shí)別警報(bào)的事件的部件的標(biāo)識(shí)或類型、警報(bào)ID、警報(bào)類型等等。在這種實(shí)施例中,通過(guò)把警報(bào)池中的警報(bào)的屬性與警報(bào)分析規(guī)則進(jìn)行比較并且作為比較的結(jié)果識(shí)別根據(jù)事件分析規(guī)則進(jìn)行抑制的一個(gè)或多個(gè)警報(bào),可執(zhí)行由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則022)和警報(bào)池中的警報(bào)確定G16)是否抑制任何警報(bào)。圖6的方法還包括把未抑制的警報(bào)發(fā)送(42 給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。通過(guò)把包含警報(bào)的消息發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件,可執(zhí)行把未抑制的警報(bào)發(fā)送(42 給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。在許多情況下,可作為消息把警報(bào)發(fā)送給系統(tǒng)管理員,從而向系統(tǒng)管理員告知分布式處理系統(tǒng)內(nèi)的一個(gè)或多個(gè)事故。如上所述,警報(bào)分析規(guī)則可根據(jù)事件選擇另外的警報(bào)或者抑制警報(bào)。在這種實(shí)施例中,確定是否抑制任何警報(bào)包括選擇事件并根據(jù)選擇的事件確定是否抑制任何警報(bào)。圖6的方法因此還包括由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則022)、警報(bào)池(224)中的警報(bào)和任何選擇的事件識(shí)別(420) —個(gè)或多個(gè)另外的警報(bào),在圖6的方法中,發(fā)送(42 未抑制的警報(bào)還包括把任何另外的警報(bào)發(fā)送(424)給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。如上所述,在根據(jù)本發(fā)明實(shí)施例的相關(guān)警報(bào)傳送的許多實(shí)施例中,多個(gè)事件分析器和警報(bào)分析器與多個(gè)事件池和警報(bào)池并行地工作。然而,在這種實(shí)施例中,存在這樣的可能性事件將不會(huì)被事件分析器分配到事件池或者警報(bào)將不會(huì)被警報(bào)分析器分配到警報(bào)池。典型地,事件或者警報(bào)可能不被分配到事件池或者警報(bào)池,因?yàn)槭录蛘呔瘓?bào)的屬性不與由任何實(shí)例化的事件分析器或者警報(bào)分析器所尋求的屬性相對(duì)應(yīng)。這樣,在根據(jù)本發(fā)明的相關(guān)警報(bào)傳送的一些實(shí)施例中,事件收聽器與事件隊(duì)列關(guān)聯(lián)以處理未被分配到事件池的事件并且警報(bào)收聽器與警報(bào)隊(duì)列關(guān)聯(lián)以處理未被分配到警報(bào)池的警報(bào)。因此,為了進(jìn)一步的解釋,圖7闡述示出包括事件收聽器和警報(bào)收聽器的分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的另外的方法的流程圖。圖7的方法類似于圖6的方法,因?yàn)槿缫陨蠀⒄請(qǐng)D6所討論的一樣,圖7的方法包括在事件隊(duì)列(206)中接收(50 來(lái)自分布式處理系統(tǒng)的一個(gè)或多個(gè)部件的多個(gè)事件;由多個(gè)事件分析器把一個(gè)或多個(gè)接收的事件(202)分配(504)給一個(gè)或多個(gè)事件池012);由事件分析器根據(jù)事件分析規(guī)則和分配到事件池的事件識(shí)別(506) —個(gè)或多個(gè)警報(bào);由事件分析器向警報(bào)分析器發(fā)送(514)由事件分析器識(shí)別的所有警報(bào)。然而,在圖7的例子中,事件隊(duì)列具有關(guān)聯(lián)的事件收聽器,圖7的方法還包括由與事件隊(duì)列(206)關(guān)聯(lián)的事件收聽器確定(508)事件隊(duì)列Q06)中的一個(gè)或多個(gè)事件(202)是否尚未由任何事件分析器分配到任何事件池012)。事件收聽器是監(jiān)測(cè)事件隊(duì)列中的每個(gè)事件并確定該事件是否已被分配給一個(gè)或多個(gè)事件池的自動(dòng)計(jì)算機(jī)器的模塊。典型地,一個(gè)事件可能不被分配到事件池,因?yàn)樵撌录膶傩圆慌c由任何實(shí)例化的事件分析器所尋求的屬性相對(duì)應(yīng)。通過(guò)在數(shù)據(jù)結(jié)構(gòu)中跟蹤事件并且在該數(shù)據(jù)結(jié)構(gòu)中具有當(dāng)事件分析器把事件分配給事件池時(shí)設(shè)置的標(biāo)識(shí),可執(zhí)行由與事件隊(duì)列(206)關(guān)聯(lián)的事件收聽器確定(508)事件隊(duì)列(206)中的一個(gè)或多個(gè)事件(20 是否尚未由任何事件分析器分配到任何事件池(212)。這種數(shù)據(jù)結(jié)構(gòu)可由事件和警報(bào)分析模塊單獨(dú)維護(hù),可被包括在事件自身中,或者以本領(lǐng)域技術(shù)人員將會(huì)想到的其它方式被維護(hù)。如果事件隊(duì)列(206)中的一個(gè)或多個(gè)事件O02)尚未被分配到任何事件池(212),則圖7的方法包括由事件收聽器根據(jù)事件分析規(guī)則識(shí)別(510) —個(gè)或多個(gè)警報(bào)。通過(guò)選擇尚未被分配到事件池的事件并且把事件的屬性與事件分析規(guī)則進(jìn)行比較并且作為比較的結(jié)果識(shí)別根據(jù)事件分析規(guī)則規(guī)定用于發(fā)送的一個(gè)或多個(gè)警報(bào),可執(zhí)行由事件收聽器根據(jù)事件分析規(guī)則識(shí)別(510) —個(gè)或多個(gè)警報(bào)。圖7的方法包括由事件收聽器向警報(bào)隊(duì)列O06)發(fā)送(512)由事件收聽器識(shí)別的所有警報(bào)。通過(guò)從事件收聽器向警報(bào)隊(duì)列發(fā)送包含警報(bào)的消息,可執(zhí)行由事件收聽器向警報(bào)隊(duì)列(206)發(fā)送(512)由事件收聽器識(shí)別的所有警報(bào)。這種消息可以在網(wǎng)絡(luò)上、通過(guò)共享存儲(chǔ)器或者按照本領(lǐng)域技術(shù)人員將會(huì)想到的其它方式被從事件收聽器發(fā)送到警報(bào)隊(duì)列。圖7的方法與圖6的方法的類似處還在于,如以上參照?qǐng)D6所討論的,圖7的方法包括由多個(gè)警報(bào)分析器把一個(gè)或多個(gè)識(shí)別的警報(bào)分配(516)到一個(gè)或多個(gè)警報(bào)池OM);由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則(222)和警報(bào)池024)中的警報(bào)確定(526)是否抑制任何警報(bào);由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則、警報(bào)池中的警報(bào)和選擇的事件識(shí)別(528) —個(gè)或多個(gè)另外的警報(bào);把未抑制的警報(bào)發(fā)送(524)給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。然而,在圖7的例子中,警報(bào)隊(duì)列(206)具有關(guān)聯(lián)的警報(bào)收聽器,圖7的方法還包括由警報(bào)收聽器確定(518)警報(bào)隊(duì)列(206)中的一個(gè)或多個(gè)警報(bào)是否尚未被分配到任何警報(bào)池OM)。典型地,警報(bào)可能不被分配到警報(bào)池,因?yàn)榫瘓?bào)的屬性不與由任何實(shí)例化的警報(bào)分析器所尋求的屬性相對(duì)應(yīng)。通過(guò)在一數(shù)據(jù)結(jié)構(gòu)中跟蹤警報(bào)并且在該數(shù)據(jù)結(jié)構(gòu)中具有當(dāng)警報(bào)分析器把警報(bào)分配給警報(bào)池時(shí)設(shè)置的標(biāo)識(shí),可執(zhí)行由警報(bào)收聽器確定(518)警報(bào)隊(duì)列Q06)中的一個(gè)或多個(gè)警報(bào)是否尚未被分配到任何警報(bào)池OM)。這種數(shù)據(jù)結(jié)構(gòu)可由事件和警報(bào)分析模塊單獨(dú)維護(hù),可被包括在警報(bào)自身中,或者以本領(lǐng)域技術(shù)人員將會(huì)想到的其它方式維護(hù)。如果警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)尚未被分配到任何警報(bào)池OM),則圖7的方法還包括由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則確定(520)是否抑制警報(bào)。根據(jù)警報(bào)的一個(gè)或多個(gè)屬性可以執(zhí)行由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則確定(520)是否抑制警報(bào)。如本領(lǐng)域技術(shù)人員能想到的,這種屬性可包括發(fā)生事故從而產(chǎn)生用于識(shí)別警報(bào)的事件的部件的標(biāo)識(shí)或類型、警報(bào)ID、警報(bào)類型等等。在這種實(shí)施例中,通過(guò)把未分配到警報(bào)池的警報(bào)的屬性與警報(bào)分析規(guī)則進(jìn)行比較并且作為比較的結(jié)果識(shí)別根據(jù)事件分析規(guī)則用于抑制的一個(gè)或多個(gè)警報(bào),可執(zhí)行由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則確定(520)是否抑制警報(bào)。圖7的方法還包括由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則識(shí)別(52 —個(gè)或多個(gè)另外的警報(bào)。通過(guò)選擇尚未被分配到警報(bào)池的警報(bào)并且把該警報(bào)的屬性與警報(bào)分析規(guī)則進(jìn)行比較并且作為比較的結(jié)果識(shí)別根據(jù)警報(bào)分析規(guī)則規(guī)定用于發(fā)送的一個(gè)或多個(gè)警報(bào),可執(zhí)行由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則識(shí)別(52 —個(gè)或多個(gè)另外的警報(bào)。圖7的方法還包括把未抑制的警報(bào)發(fā)送(524)給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。通過(guò)把包含警報(bào)的消息發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件,可執(zhí)行把未抑制的警報(bào)發(fā)送(524)給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。在許多情況下,可作為消息把警報(bào)發(fā)送給系統(tǒng)管理員,從而向系統(tǒng)管理員告知分布式處理系統(tǒng)內(nèi)的一個(gè)或多個(gè)事故。本領(lǐng)域技術(shù)人員應(yīng)該理解,本發(fā)明的各方面可以實(shí)現(xiàn)為系統(tǒng)、方法或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明的各方面可以采用通常全部可在本文中稱為“電路”、“模塊”或“系統(tǒng)”的完全硬件實(shí)施例、完全軟件實(shí)施例(包括固件、駐留軟件、微碼等)或組合軟件和硬件方面的實(shí)施例的形式。另外,本發(fā)明的各方面可以采用在其上實(shí)現(xiàn)有計(jì)算機(jī)可讀程序代碼的一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)中實(shí)現(xiàn)的計(jì)算機(jī)程序產(chǎn)品的形式??梢允褂靡粋€(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)的任何組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是(但不限于)電子、磁、光學(xué)、電磁、紅外或半導(dǎo)體系統(tǒng)、設(shè)備或裝置或者前述各項(xiàng)的任何合適的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉列表)將包括下述各項(xiàng)具有一個(gè)或多個(gè)線的電氣連接、便攜式計(jì)算機(jī)盤、硬盤、隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(ROM)、可擦除可編程只讀存儲(chǔ)器(EPR0M或閃存)、光纖、便攜式壓縮盤只讀存儲(chǔ)器(CD-ROM)、光學(xué)存儲(chǔ)裝置、磁存儲(chǔ)裝置或前述各項(xiàng)的任何合適的組合。在該文檔的上下文中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是能夠包含或存儲(chǔ)由指令執(zhí)行系統(tǒng)、設(shè)備或裝置使用或結(jié)合指令執(zhí)行系統(tǒng)、設(shè)備或裝置使用的程序的任何有形介質(zhì)。計(jì)算機(jī)可讀信號(hào)介質(zhì)可包括例如基帶中或作為載波的一部分的嵌入了計(jì)算機(jī)可讀程序代碼的傳播數(shù)據(jù)信號(hào)。這種傳播信號(hào)可采用各種形式中的任何形式,包括但不限于電磁信號(hào)、光學(xué)信號(hào)或者它們的任何合適的組合。計(jì)算機(jī)可讀信號(hào)介質(zhì)可以是并非計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)并且能夠傳送、傳播或傳輸由指令執(zhí)行系統(tǒng)、設(shè)備或裝置使用或結(jié)合指令執(zhí)行系統(tǒng)、設(shè)備或裝置使用的程序的任何計(jì)算機(jī)可讀介質(zhì)。可以使用任何合適的介質(zhì)(包括但不限于無(wú)線、有線、光纖纜、RF等或前述各項(xiàng)的任何合適的組合)來(lái)傳輸計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼??梢园凑找环N或多種編程語(yǔ)言的任何組合編寫用于執(zhí)行本發(fā)明的各方面的操作的計(jì)算機(jī)程序代碼,所述編程語(yǔ)言包括面向?qū)ο缶幊陶Z(yǔ)言,諸如JaVa、Smalltalk、C++等;和常規(guī)的過(guò)程編程語(yǔ)言,諸如“C”編程語(yǔ)言或類似編程語(yǔ)言。程序代碼可以完全在用戶計(jì)算機(jī)上執(zhí)行、部分在用戶計(jì)算機(jī)上執(zhí)行、作為獨(dú)立軟件包執(zhí)行、部分在用戶的計(jì)算機(jī)上并且部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在后一情形中,遠(yuǎn)程計(jì)算機(jī)可以通過(guò)任何類型的網(wǎng)絡(luò)(包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN))連接到用戶的計(jì)算機(jī),或者可以例如使用互聯(lián)網(wǎng)服務(wù)提供商通過(guò)互聯(lián)網(wǎng)連接到外部計(jì)算機(jī)。以上參考根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或框圖描述了本發(fā)明的各方面。應(yīng)該理解,流程圖和/或框圖中的每個(gè)框以及流程圖和/或框圖中的框的組合能夠由計(jì)算機(jī)程序指令實(shí)現(xiàn)。這些計(jì)算機(jī)程序指令可被提供給通用計(jì)算機(jī)、專用計(jì)算機(jī)或者其它可編程數(shù)據(jù)處理設(shè)備的處理器,以產(chǎn)生一臺(tái)機(jī)器,從而使指令(所述指令經(jīng)由計(jì)算機(jī)或者其它可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行)產(chǎn)生用于實(shí)現(xiàn)流程圖和/或框圖的一個(gè)或多個(gè)框中指定的功能/動(dòng)作的裝置。這些計(jì)算機(jī)程序指令也可存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中,該計(jì)算機(jī)可讀介質(zhì)能夠指示計(jì)算機(jī)、其它可編程數(shù)據(jù)處理設(shè)備或其它裝置按照特定的方式發(fā)揮作用,從而存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的指令產(chǎn)生一種制造產(chǎn)品,所述制造產(chǎn)品包括實(shí)現(xiàn)流程圖和/或框圖的一個(gè)或多個(gè)框中指定的功能/動(dòng)作的指令。計(jì)算機(jī)程序指令也可被加載到計(jì)算機(jī)、其它可編程數(shù)據(jù)處理設(shè)備或其它裝置上,以使得在所述計(jì)算機(jī)、其它可編程設(shè)備或其它裝置上執(zhí)行一系列的操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在該計(jì)算機(jī)或其它可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)流程圖和/或框圖的一個(gè)或多個(gè)框中指定的功能/動(dòng)作的處理。附圖中的流程圖和框圖示出了根據(jù)本發(fā)明各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)方式的架構(gòu)、功能和操作。在這方面,流程圖或框圖中的每個(gè)框可代表包括用于實(shí)現(xiàn)指定的邏輯功能的一個(gè)或多個(gè)可執(zhí)行指令的代碼的模塊、段或一部分。還應(yīng)該注意的是,在一些另外的實(shí)現(xiàn)方式中,框中標(biāo)注的功能可以不按附圖中標(biāo)注的次序執(zhí)行。例如,事實(shí)上,根據(jù)涉及的功能,連續(xù)示出的兩個(gè)框可以基本上同時(shí)執(zhí)行,或者這些框有時(shí)候可以以相反的次序執(zhí)行。還應(yīng)該注意的是,框圖和/或流程圖中的每個(gè)框以及框圖和/或流程圖中的框的組合能夠由執(zhí)行指定的功能或動(dòng)作的基于專用硬件的系統(tǒng)或?qū)S糜布陀?jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。通過(guò)前面的描述應(yīng)該理解,在不脫離本發(fā)明的真實(shí)精神的情況下可對(duì)本發(fā)明的各種實(shí)施例作出變型和修改。本說(shuō)明書中的描述僅用于說(shuō)明的目的而不應(yīng)該在限制的意義上進(jìn)行解釋。本發(fā)明的范圍僅由權(quán)利要求的語(yǔ)言限制。
權(quán)利要求
1.一種用于分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的方法,該方法包括由與事件隊(duì)列關(guān)聯(lián)的事件收聽器確定事件隊(duì)列中的一個(gè)或多個(gè)事件是否尚未由任何事件分析器分配到任何事件池;如果事件隊(duì)列中的一個(gè)或多個(gè)事件尚未被分配到任何事件池,則由事件收聽器根據(jù)事件分析規(guī)則識(shí)別一個(gè)或多個(gè)警報(bào);由事件收聽器向警報(bào)隊(duì)列發(fā)送由事件收聽器識(shí)別的所有警報(bào);警報(bào)隊(duì)列具有關(guān)聯(lián)的警報(bào)收聽器;由警報(bào)收聽器確定警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)是否尚未被分配到任何警報(bào)池;如果警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)尚未被分配到任何警報(bào)池,則由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則確定是否抑制該警報(bào);以及把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。
2.如權(quán)利要求1所述的方法,還包括由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則識(shí)別一個(gè)或多個(gè)另外的警報(bào);以及把所述一個(gè)或多個(gè)另外的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。
3.如權(quán)利要求1所述的方法,還包括由事件分析器根據(jù)事件分析規(guī)則和分配到事件池的事件識(shí)別一個(gè)或多個(gè)警報(bào);由事件分析器向警報(bào)分析器發(fā)送由事件分析器識(shí)別的所有警報(bào)。
4.如權(quán)利要求1所述的方法,還包括由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則和警報(bào)池中的警報(bào)確定是否抑制任何警報(bào);以及把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。
5.如權(quán)利要求4所述的方法,其中由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則和警報(bào)池中的警報(bào)確定是否抑制任何警報(bào)還包括選擇事件并根據(jù)選擇的事件確定是否抑制任何警報(bào)。
6.如權(quán)利要求4所述的方法,還包括由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則、警報(bào)池中的警報(bào)和選擇的事件識(shí)別一個(gè)或多個(gè)另外的警報(bào);并且發(fā)送未抑制的警報(bào)還包括把所述一個(gè)或多個(gè)另外的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。
7.一種用于分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的系統(tǒng),該設(shè)備包括計(jì)算機(jī)處理器、可操作地耦接到計(jì)算機(jī)處理器的計(jì)算機(jī)存儲(chǔ)器,該計(jì)算機(jī)存儲(chǔ)器在它的內(nèi)部布置了計(jì)算機(jī)程序指令,該計(jì)算機(jī)程序指令當(dāng)由計(jì)算機(jī)處理器執(zhí)行時(shí)能夠使該系統(tǒng)執(zhí)行下述步驟由與事件隊(duì)列關(guān)聯(lián)的事件收聽器確定事件隊(duì)列中的一個(gè)或多個(gè)事件是否尚未由任何事件分析器分配到任何事件池;如果事件隊(duì)列中的一個(gè)或多個(gè)事件尚未被分配到任何事件池,則由事件收聽器根據(jù)事件分析規(guī)則識(shí)別一個(gè)或多個(gè)警報(bào);由事件收聽器向警報(bào)隊(duì)列發(fā)送由事件收聽器識(shí)別的所有警報(bào);警報(bào)隊(duì)列具有關(guān)聯(lián)的警報(bào)收聽器;由警報(bào)收聽器確定警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)是否尚未被分配到任何警報(bào)池;如果警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)尚未被分配到任何警報(bào)池,則由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則確定是否抑制該警報(bào);以及把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。
8.如權(quán)利要求7所述的系統(tǒng),其中所述計(jì)算機(jī)存儲(chǔ)器在它的內(nèi)部布置了計(jì)算機(jī)程序指令,該計(jì)算機(jī)程序指令當(dāng)由計(jì)算機(jī)處理器執(zhí)行時(shí)能夠使該系統(tǒng)執(zhí)行下述步驟由警報(bào)收聽器根據(jù)警報(bào)分析規(guī)則識(shí)別一個(gè)或多個(gè)另外的警報(bào);以及把所述一個(gè)或多個(gè)另外的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。
9.如權(quán)利要求7所述的系統(tǒng),其中所述計(jì)算機(jī)存儲(chǔ)器在它的內(nèi)部布置了計(jì)算機(jī)程序指令,該計(jì)算機(jī)程序指令當(dāng)由計(jì)算機(jī)處理器執(zhí)行時(shí)能夠使該系統(tǒng)執(zhí)行下述步驟由事件分析器根據(jù)事件分析規(guī)則和分配到事件池的事件識(shí)別一個(gè)或多個(gè)警報(bào);由事件分析器向警報(bào)分析器發(fā)送由事件分析器識(shí)別的所有警報(bào)。
10.如權(quán)利要求7所述的系統(tǒng),其中所述計(jì)算機(jī)存儲(chǔ)器在它的內(nèi)部布置了計(jì)算機(jī)程序指令,該計(jì)算機(jī)程序指令當(dāng)由計(jì)算機(jī)處理器執(zhí)行時(shí)能夠使該系統(tǒng)執(zhí)行下述步驟由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則和警報(bào)池中的警報(bào)確定是否抑制任何警報(bào);以及把未抑制的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。
11.如權(quán)利要求10所述的系統(tǒng),其中由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則和警報(bào)池中的警報(bào)確定是否抑制任何警報(bào)還包括選擇事件并根據(jù)選擇的事件確定是否抑制任何警報(bào)。
12.如權(quán)利要求10所述的系統(tǒng),其中所述計(jì)算機(jī)存儲(chǔ)器在它的內(nèi)部布置了計(jì)算機(jī)程序指令,該計(jì)算機(jī)程序指令當(dāng)由計(jì)算機(jī)處理器執(zhí)行時(shí)能夠使該系統(tǒng)執(zhí)行由警報(bào)分析器根據(jù)警報(bào)分析規(guī)則、警報(bào)池中的警報(bào)和選擇的事件識(shí)別一個(gè)或多個(gè)另外的警報(bào)的步驟;并且發(fā)送未抑制的警報(bào)還包括把所述一個(gè)或多個(gè)另外的警報(bào)發(fā)送給分布式處理系統(tǒng)的一個(gè)或多個(gè)部件。
全文摘要
本發(fā)明涉及用于分布式處理系統(tǒng)中的相關(guān)警報(bào)傳送的方法和系統(tǒng)。相關(guān)警報(bào)傳送包括由與事件隊(duì)列關(guān)聯(lián)的事件收聽器確定事件隊(duì)列中的一個(gè)或多個(gè)事件是否尚未由任何事件分析器分配到任何事件池;如果事件隊(duì)列中的一個(gè)或多個(gè)事件尚未被分配到任何事件池,則由事件收聽器根據(jù)事件分析規(guī)則識(shí)別一個(gè)或多個(gè)警報(bào);由事件收聽器向警報(bào)隊(duì)列發(fā)送由事件收聽器識(shí)別的所有警報(bào);警報(bào)隊(duì)列具有關(guān)聯(lián)的警報(bào)收聽器;確定警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)是否尚未被分配到任何警報(bào)池;如果警報(bào)隊(duì)列中的一個(gè)或多個(gè)警報(bào)尚未被分配到任何警報(bào)池,則根據(jù)警報(bào)分析規(guī)則確定是否抑制該警報(bào);以及發(fā)送未抑制的警報(bào)。
文檔編號(hào)G06F11/32GK102567180SQ20111036029
公開日2012年7月11日 申請(qǐng)日期2011年11月15日 優(yōu)先權(quán)日2010年12月7日
發(fā)明者J·E·卡雷, M·W·馬克蘭德, P·J·桑德斯 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司