專利名稱:關(guān)聯(lián)并確定系統(tǒng)和企業(yè)事件的根本原因的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
此處所述的方法、系統(tǒng)、圖形用戶接口(“GUI”)、計算機可讀介質(zhì)和應(yīng)用編程接口(“API”)涉及信息和數(shù)據(jù)管理,特別涉及企業(yè)事件監(jiān)視和過濾。
背景技術(shù):
企業(yè)利用大型、復(fù)雜的計算環(huán)境,其包括多個企業(yè)組件(例如,服務(wù)器、路由器、數(shù)據(jù)庫、主機、個人計算機、智能代理、業(yè)務(wù)應(yīng)用程序)。本領(lǐng)域中已知監(jiān)視復(fù)雜企業(yè)計算環(huán)境的系統(tǒng)(例如美國專利No.5,958,012“使用虛擬現(xiàn)實技術(shù)來顯示并仿真對網(wǎng)絡(luò)組件的導(dǎo)航的網(wǎng)絡(luò)管理系統(tǒng)”)。監(jiān)視系統(tǒng)可依賴于當(dāng)遇到問題(例如盤崩潰、服務(wù)器崩潰、網(wǎng)絡(luò)阻塞、數(shù)據(jù)庫存取失敗)時生成并報告事件的企業(yè)組件。然而,當(dāng)?shù)谝黄髽I(yè)組件遇到問題(例如盤崩潰)時,該問題可具有使其它企業(yè)組件也遇到問題(例如,數(shù)據(jù)庫存取失敗)的連鎖效應(yīng)。因此,傳統(tǒng)的監(jiān)視系統(tǒng)從企業(yè)組件接收企業(yè)事件,其中許多事件是癥狀(symptomatic)事件(例如,作為其它更基本的事件的結(jié)果而生成和/或報告的)而非根本原因事件(例如基本事件)。區(qū)分癥狀事件和根本原因事件是歷來是很難的,需要熟練的操作者和大量的時間投入。
存在于企業(yè)計算環(huán)境內(nèi)硬件和軟件之間的關(guān)系和從屬致使單一根本原因產(chǎn)生的癥狀事件,其使操作者混淆并延緩了根本問題的識別乃至解決。例如,數(shù)據(jù)庫管理程序等軟件組件依賴處理器和盤等至少兩個硬件組件以執(zhí)行數(shù)據(jù)庫管理功能。因此,若處理器和盤二者之一遇到問題,除了生成和報告企業(yè)事件(例如盤寫入失敗)的盤和/或處理器,數(shù)據(jù)庫管理程序在數(shù)據(jù)庫存取嘗試失敗(例如數(shù)據(jù)庫寫入失敗)時傾向于生成并報告企業(yè)事件。于是,監(jiān)視企業(yè)計算環(huán)境的系統(tǒng)和/或方法將以來自數(shù)據(jù)庫管理程序的癥狀事件和來自硬件的因果事件二者共同呈遞。傳統(tǒng)上,難以區(qū)分癥狀和根本原因事件。
發(fā)明內(nèi)容
以下梗概給出了示例企業(yè)管理方法、系統(tǒng)、GUI、計算機可讀介質(zhì)和API的簡要討論,以基本地理解關(guān)聯(lián)并確定系統(tǒng)和企業(yè)事件的根本原因的某些方面。此簡介并非深入的縱覽,而且不期望識別關(guān)鍵或重要元素或劃清該方法的范圍等。
于是,本申請一方面涉及一種用于企業(yè)組件管理的計算機實現(xiàn)方法。該方法包括建立可以從中生成企業(yè)事件的上下文,建立關(guān)聯(lián)規(guī)則,其有助于確定企業(yè)事件是否識別了根本原因,并建立企業(yè)組件間的從屬關(guān)系,以有助于確定企業(yè)事件是否識別了根本原因。隨著這些項目的建立,該方法包括例示關(guān)聯(lián)對象以有助于累積和關(guān)聯(lián)有聯(lián)系的企業(yè)事件,接收企業(yè)事件,和確定從中生成企業(yè)事件的上下文。一旦接收了事件,該方法包括將企業(yè)事件與關(guān)聯(lián)對象聯(lián)系起來,更新企業(yè)事件所應(yīng)用的關(guān)聯(lián)規(guī)則,和基于從中生成事件的上下文、關(guān)聯(lián)規(guī)則、從屬性、和企業(yè)事件與關(guān)聯(lián)對象間的關(guān)系而確定事件的根本原因。隨著根本原因的確定,該方法生成與根本原因相關(guān)的指示符。
本申請另一方面涉及一種用來確定企業(yè)事件的根本原因的系統(tǒng)。該系統(tǒng)包括企業(yè)事件接收器,用來接收企業(yè)事件;關(guān)聯(lián)規(guī)則數(shù)據(jù),用來存儲有助于確定企業(yè)事件的根本原因的關(guān)聯(lián)規(guī)則;和因果數(shù)據(jù)存儲器,用來存儲有助于確定企業(yè)事件的根本原因的因果關(guān)系,其中該因果涉及兩個或多個企業(yè)組件。該系統(tǒng)還包括關(guān)聯(lián)對象數(shù)據(jù)存儲器,用來存儲與候選根本原因相關(guān)的關(guān)聯(lián)對象,其中關(guān)聯(lián)對象具有關(guān)聯(lián)規(guī)則;和定時器,其在確定根本原因之前,定義一段時期,其間接收當(dāng)確定企業(yè)事件的根本原因時將考慮到的企業(yè)事件。該系統(tǒng)還包括根本原因確定器,其通過分析關(guān)聯(lián)對象而確定企業(yè)事件的根本原因。一旦確定了企業(yè)事件的根本原因,其可顯示于系統(tǒng)中包括的接口上。
本申請另一方面涉及一種帶有圖形用戶接口的計算機系統(tǒng)。該圖形用戶接口包括顯示器、選擇設(shè)備、以及提供數(shù)據(jù)條目并從顯示器上的數(shù)據(jù)條目中進行選擇的方法。該方法包括檢索數(shù)據(jù)條目,其代表根本原因判定和在確定根本原因中分析的關(guān)聯(lián)對象,并將該數(shù)據(jù)條目顯示于顯示器上。該方法還包括接收數(shù)據(jù)條目選擇信號,其指示選擇儀所選擇的數(shù)據(jù)條目,并響應(yīng)于該信號,有選擇地提供與數(shù)據(jù)條目相關(guān)的附加數(shù)據(jù)。
本申請另一方面涉及一組在計算機可讀介質(zhì)上體現(xiàn)的應(yīng)用程序接口(API)集合,用于由計算機組件結(jié)合確定企業(yè)事件的根本原因的應(yīng)用程序而執(zhí)行。該API包括第一接口,其接收企業(yè)事件;第二接口,其接收企業(yè)事件所應(yīng)用的關(guān)聯(lián)規(guī)則;第三接口,其接收關(guān)聯(lián)規(guī)則的關(guān)聯(lián)對象,該關(guān)聯(lián)規(guī)則包括由第二接口接收的關(guān)聯(lián)規(guī)則;和第四接口,其返回企業(yè)事件的根本原因,其中根本原因是通過檢驗由第三接口接收的關(guān)聯(lián)對象而確定的。
本申請另一方面涉及一種計算機可讀介質(zhì),其上存儲與關(guān)聯(lián)對象相關(guān)的數(shù)據(jù)結(jié)構(gòu)。該關(guān)聯(lián)對象包括存儲對象標(biāo)識符的字段,該對象標(biāo)識符識別從中接收企業(yè)事件的企業(yè)對象;存儲從企業(yè)事件中檢索的事件消息的字段;和存儲企業(yè)事件所應(yīng)用的關(guān)聯(lián)規(guī)則的字段。該關(guān)聯(lián)對象還包括存儲已存儲的關(guān)聯(lián)規(guī)則已完成程度的字段、存儲企業(yè)事件可被接收的時期的字段、和存儲根本原因確定器標(biāo)識符的字段,該根本原因確定器標(biāo)識符識別可向其提供數(shù)據(jù)結(jié)構(gòu)的根本原因確定器。
根據(jù)本發(fā)明的這些方面,結(jié)合下面的說明和附圖對示例性地示出的一個示例方法進行說明。不過這些示例是指示性的,其僅指示可利用的方法、系統(tǒng)、GUI、API和介質(zhì)的各種方式之一,因此其旨在包括等價物。通過下面結(jié)合附圖進行的詳細描述,本發(fā)明的其它優(yōu)點和新穎特點將會變得更清楚。
圖1是可以支持企業(yè)管理的示例系統(tǒng)和/或方法的示例計算環(huán)境的原理方框圖。
圖2圖解了兩例事務(wù)流水線。
圖3圖解了根本原因判定系統(tǒng)和/或方法的協(xié)作集合的示例網(wǎng)絡(luò)構(gòu)成。
圖4是圖解了用于確定企業(yè)事件的根本原因的示例系統(tǒng)的原理方框圖。
圖5是圖解了用于確定企業(yè)事件的根本原因的示例系統(tǒng)的原理方框圖,其中系統(tǒng)包括影響分析器。
圖6是圖解了與用于確定企業(yè)事件的根本原因的系統(tǒng)相關(guān)聯(lián)的示例登錄數(shù)據(jù)存儲的原理方框圖。
圖7圖解企業(yè)管理系統(tǒng)和/或方法所利用的示例應(yīng)用編程接口。
圖8是圖解企業(yè)管理的示例方法的流程圖。
圖9是圖解將企業(yè)事件與關(guān)聯(lián)對象聯(lián)系起來的示例方法的流程圖。
圖10是圖解與確定是否存在關(guān)聯(lián)規(guī)則完成相關(guān)的示例處理的流程圖。
圖11是圖解基于分析由根本原因確定器產(chǎn)生的指示符而進行的示例處理的流程圖。
圖12是圖解與示例根本原因判定相關(guān)的定時處理的流程圖。
具體實施例方式
下面,參照附圖來詳細說明與系統(tǒng)和企業(yè)事件的關(guān)聯(lián)根本原因相關(guān)的方法、系統(tǒng)、GUI、API和計算機可讀介質(zhì),其中相同附圖標(biāo)記統(tǒng)統(tǒng)代表相同元件。在下面的說明中,為了解釋,陳述了多個具體細節(jié)、以有助于仔細理解。不過也可證實關(guān)聯(lián)根本原因也可不靠這些具體細節(jié)來實踐。在其它實施例中,以方框圖形式來表示已知的結(jié)構(gòu)和設(shè)備,以簡化說明。
介紹根本原因分析考慮通過分析企業(yè)事件、企業(yè)組件間的因果關(guān)系、從中生成事件的上下文和涉及企業(yè)事件的規(guī)則,而識別復(fù)雜企業(yè)計算環(huán)境中明顯問題簇的底層或基本原因。一個示例根本原因分析是通過分析多條事件關(guān)聯(lián)規(guī)則的完成狀態(tài)而執(zhí)行的,該關(guān)聯(lián)規(guī)則可在關(guān)聯(lián)對象中累積。該關(guān)聯(lián)規(guī)則有助于因果關(guān)系集合的模型化,該因果關(guān)系涉及對根本原因事件的診斷和區(qū)分。關(guān)聯(lián)規(guī)則可由從企業(yè)組件所生成的事件中提取的數(shù)據(jù)來填充。當(dāng)添入了足夠數(shù)量的關(guān)聯(lián)規(guī)則的組件時,則可在確定根本原因時考慮該規(guī)則。規(guī)則的組件可以由包括但不限于OR、AND、XOR和NOT等布爾運算來組合。
事件和關(guān)聯(lián)規(guī)則可由根本原因確定器來處理。當(dāng)事件達到根本原因確定器時,可啟動定時器,其確定收集有關(guān)事件的時期。一旦該時期過去了,則可基于所收集的事件和受該事件影響的關(guān)聯(lián)規(guī)則的集合來確定根本原因。
一旦識別了根本原因,即執(zhí)行影響分析。影響分析可以檢驗企業(yè)事件并,例如,積極地警告其它潛在受該根本原因影響的企業(yè)組件,啟動故障排除(failover)處理,啟動維護處理,和/或報警給例如操作工作人員。于是,根本原因確定器運用并應(yīng)用企業(yè)管理操作者的知識和經(jīng)驗。
傳統(tǒng)上,向事件管理系統(tǒng)呈遞企業(yè)計算環(huán)境中生成的幾乎全部企業(yè)事件,使得更難明鑒企業(yè)事件集合的根本原因。于是,此處所述的方法、系統(tǒng)、GUI、API和介質(zhì)有助于從根本原因事件中過濾掉癥狀事件,以簡化企業(yè)管理診斷和管理。過濾技術(shù)包括但不限于事件格式變換(reformatting)和事件壓抑(suppression)。過濾在與企業(yè)管理系統(tǒng)相關(guān)的控制臺(console)處縮減了例如所顯示的事件的數(shù)量和頻率。因此,利用企業(yè)管理系統(tǒng)功能的控制臺的操作者將遇到更小型、更集中的問題空間,導(dǎo)致企業(yè)管理的改進。
在一個示例中,軟件對象模型企業(yè)組件例如代理、應(yīng)用程序、設(shè)備和數(shù)據(jù)存儲。對象可具有狀態(tài),并可因此處于包括但不限于受管態(tài)、期望態(tài)和維護態(tài)等狀態(tài)中。企業(yè)對象可參于關(guān)系。于是,企業(yè)對象可涉及父/子關(guān)系、主/從關(guān)系、協(xié)同關(guān)系或涉及從屬的關(guān)系(例如事務(wù)流水線),其中這些關(guān)系有助于對企業(yè)組件間從屬性的模型化。存儲從屬規(guī)則和關(guān)聯(lián)規(guī)則的數(shù)據(jù)結(jié)構(gòu)有助于捕獲對象間的關(guān)系。
企業(yè)組件可被組織成域,以有助于協(xié)作根本原因判定。例如,為第一域確定的根本原因在與為第二域確定的根本原因組合時,可提供有關(guān)域根本原因中哪一個是主要(overarching)根本原因、或問題的終極根本原因是否多個根本原因的組合。
根本原因確定器從企業(yè)計算環(huán)境接收事件。從企業(yè)事件中檢索的數(shù)據(jù)可用于填充事件關(guān)聯(lián)規(guī)則。該根本原因確定器接收事件,填充事件關(guān)聯(lián)規(guī)則,關(guān)聯(lián)并累積事件,并在足夠數(shù)量的事件和/或足夠的時期流逝后確定相關(guān)事件的根本原因。根本原因確定器可接著報告根本原因事件,縮減呈遞給管理站、控制臺和/或操作者的事件數(shù)量。
根本原因判定系統(tǒng)可包括事件日志,其存儲所接收的事件;以及根本原因日志,其存儲所確定的根本原因。日志可用來檢驗由根本原因確定器利用的推理法,以有助于理解和/或適應(yīng)根本原因確定器如何達到根本原因判定。
根本原因判定系統(tǒng)還可包括GUI,其顯示包括但不限于由根本原因確定器分析的關(guān)聯(lián)對象和所確定的根本原因等數(shù)據(jù)項目。當(dāng)顯示關(guān)聯(lián)對象時,GUI可顯示與關(guān)聯(lián)對象相關(guān)的統(tǒng)計數(shù)據(jù)如與關(guān)聯(lián)對象相關(guān)的事件數(shù)量、由關(guān)聯(lián)對象考慮的事件數(shù)量、到時期到期的時間、與關(guān)聯(lián)對象相關(guān)的候選根本原因、候選根本原因的置信等級以及關(guān)聯(lián)對象的數(shù)據(jù)要求。類似地,當(dāng)顯示根本原因時,GUI可顯示包括但不限于事件上下文數(shù)據(jù)、關(guān)聯(lián)規(guī)則、從屬數(shù)據(jù)、關(guān)聯(lián)對象標(biāo)識符和根本原因確定器標(biāo)識符的信息。
于是,為了通過根本原因判定來簡化并改進企業(yè)管理,此處所述的方法等有助于說明企業(yè)計算環(huán)境(包括企業(yè)內(nèi)的關(guān)系),定義企業(yè)組件間的因果關(guān)系,識別指出企業(yè)組件問題的事件,并從潛在的根本原因候選者中識別出最有可能的根本原因事件。
為了為此處所述的系統(tǒng)、方法、GUI和API的各方面提供上下文,圖1和下面的討論提供了可實施的示例方法、系統(tǒng)、GUI和API的環(huán)境的簡要的、一般性的說明。在描述計算機硬件和/或計算機可執(zhí)行指令的通用上下文的同時,由一個或多個計算機組件執(zhí)行的程序模塊也可與其它程序模塊組合實施和/或作為硬件和軟件的組合實施?!坝嬎銠C組件”指的是與計算機有關(guān)的物理和/或邏輯實體,或者是硬件、固件、軟件、其組合,或執(zhí)行中的軟件。例如,計算機組件可以是運行于處理器上的處理、處理器、對象、可執(zhí)行程序、執(zhí)行線程、程序、程序映像和計算機。一個或多個計算機組件可棲于處理和/或執(zhí)行線程內(nèi),并且計算機組件可以局限于一臺計算機上和/或分布在兩臺或多臺計算機間。程序模塊一般包括對象、程序、可執(zhí)行線程、數(shù)據(jù)結(jié)構(gòu)等,其執(zhí)行特定任務(wù)或?qū)嵤?shù)據(jù)類型。
圖1所圖解的環(huán)境只是系統(tǒng)、方法、GUI和API可實現(xiàn)功能的一個示例環(huán)境,因此不限于這種系統(tǒng)、方法、API和/或GUI的范圍。適于該方法、系統(tǒng)、GUI和API的公知計算機系統(tǒng)和配置包括但不限于主機、微機、基于微處理器的系統(tǒng)、多處理系統(tǒng)和分布式計算環(huán)境。
圖1圖解了示例計算機100,其包括由總線108可操作地連接的處理器102、存儲器104、盤106、輸入/輸出端口110和網(wǎng)絡(luò)接口112。處理器102可以是各種不同的處理器,包括雙微處理器及其它多處理器架構(gòu)。存儲器104包括易失性存儲器和/或非易失性存儲器。非易失性存儲器可以包括但不限于只讀存儲器(ROM)、可編程只讀存儲器(PROM)、電可編程只讀存儲器(EPROM)、電可擦寫可編程只讀存儲器(EEPROM)等。易失性存儲器可以包括例如隨機存取存儲器(RAM)、同步RAM(SRAM)、動態(tài)RAM(DRAM)、同步DRAM(SDRAM)、雙數(shù)據(jù)率SDRAM(DDR SDRAM)和直接RAM總線RAM(DRRAM)。盤106可以包括但不限于盤驅(qū)動器、軟驅(qū)、磁帶驅(qū)動器、Zip驅(qū)動器、閃存卡和/或存儲棒(memory stick)等設(shè)備。此外,盤106可以包括只讀光盤(CD-ROM)、可記錄CD驅(qū)動器(CD-R驅(qū)動器)、可重寫CD驅(qū)動器(CD-RW驅(qū)動器)和/或數(shù)字多用ROM驅(qū)動器(DVD-ROM)等光驅(qū)。存儲器104可以存儲例如處理114和/或數(shù)據(jù)116。盤106和/或存儲器104可存儲控制和分配計算機100的資源的操作系統(tǒng)。
總線108可以是單內(nèi)部總互連架構(gòu)和/或其它總線架構(gòu)??偩€108可以是各種不同的類型,包括但不限于存儲器總線或存儲器控制器、外圍總線或外部總線、和/或局部總線。局部總線的類型可以包括但不限于工業(yè)標(biāo)準架構(gòu)(ISA)總線、微通道架構(gòu)(MSA)總線、擴展ISA(EISA)總線、外圍組件互連(PCI)總線、通用串行(USB)總線和小型計算機系統(tǒng)接口(SCSI)總線。
計算機100經(jīng)輸入/輸出端口110與輸入/輸出設(shè)備118交互。輸入/輸出設(shè)備118包括但不限于鍵盤、麥克風(fēng)、定點和選擇設(shè)備、照相機、視頻卡、顯示器等。輸入/輸出端口110包括但不限于串行端口、并行端口和USB端口。
計算機100可在網(wǎng)絡(luò)環(huán)境中操作,并從而由網(wǎng)絡(luò)接口112連接至網(wǎng)絡(luò)120。通過網(wǎng)絡(luò)120,計算機100可邏輯地連接至遠程計算機122。網(wǎng)絡(luò)120包括但不限于局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)和其它網(wǎng)絡(luò)。網(wǎng)絡(luò)接口112可結(jié)合局域網(wǎng)技術(shù),包括但不限于光纖分布式數(shù)據(jù)接口(FDDI)、銅線分布式數(shù)據(jù)接口(CDDI)、以太網(wǎng)/IEEE 802.3、令牌網(wǎng)/IEEE 802.5等。類似地,網(wǎng)絡(luò)接口112還可以結(jié)合廣域網(wǎng)技術(shù),包括但不限于點對點鏈路、電路切換網(wǎng)絡(luò)如綜合業(yè)務(wù)數(shù)現(xiàn)在字網(wǎng)絡(luò)(ISDN)、分組交換網(wǎng)絡(luò)和數(shù)字訂戶線路。
轉(zhuǎn)向圖2,其圖解了兩例事務(wù)流水線。作為圖解,企業(yè)組件集合200排成兩條分離的事務(wù)流水線。例如,第一條事務(wù)流水線220包括帳戶數(shù)據(jù)庫230、主機240、網(wǎng)絡(luò)服務(wù)器250和網(wǎng)絡(luò)接口260。類似地,第二條事務(wù)流水線210包括帳戶數(shù)據(jù)庫230、主機240、銷售服務(wù)器270和銷售應(yīng)用程序280。兩條事務(wù)流水線210和220皆含有帳戶數(shù)據(jù)庫230和主機240。因此,對于為帳戶數(shù)據(jù)庫230或主機240生成的企業(yè)事件,企業(yè)事件可為網(wǎng)絡(luò)服務(wù)器250、網(wǎng)絡(luò)接口260、銷售服務(wù)器270和銷售應(yīng)用程序280而生成。
企業(yè)組件間的關(guān)系可按因果關(guān)系而捕獲。盡管網(wǎng)絡(luò)接口260與銷售應(yīng)用程序280間沒有明顯的連接,但網(wǎng)絡(luò)接口260與網(wǎng)絡(luò)服務(wù)器250間、以及銷售應(yīng)用程序280與銷售服務(wù)器270間卻有明顯的關(guān)系。此外,主機240與帳戶數(shù)據(jù)庫230間有關(guān)系,還有其它圖解出的從屬性。在因果關(guān)系數(shù)據(jù)存儲中捕獲和存儲事務(wù)流水線有助于區(qū)分癥狀事件與根本原因事件。此外,對從屬關(guān)系建模有助于進行影響分析。例如,網(wǎng)絡(luò)服務(wù)器250的問題很可能影響網(wǎng)絡(luò)接口260,而銷售服務(wù)器270的問題很可能影響銷售應(yīng)用程序280。不過,網(wǎng)絡(luò)服務(wù)器250的問題不太可能導(dǎo)致銷售應(yīng)用程序280的問題。不過,主機240的問題很可能導(dǎo)致企業(yè)組件250、260、270和280的問題。
圖3圖解了根本原因確定器的聚集300。根本原因確定器至少部分基于在事件接收器處接收的事件而生成根本原因判定。于是,根本原因確定器310至少部分基于在事件接收器340處接收的事件而達到根本原因判定。類似地,根本原因確定器320與事件接收器350交互,而根本原因確定器330與事件接收器360交互。通過定義可在事件接收器340、350和360處接收的企業(yè)事件集合,以包含在其它根本原因確定器處做出的根本原因判定,根本原因確定器310、320和330可參與根本原因確定器的網(wǎng)絡(luò)。這有助于產(chǎn)生靈活、動態(tài)的根本原因確定器的網(wǎng)絡(luò),其提供相對于傳統(tǒng)系統(tǒng)的優(yōu)點。優(yōu)點包括但不限于將企業(yè)分區(qū)成較小的域,并從多個企業(yè)中累積和關(guān)聯(lián)數(shù)據(jù)。此外,靈活性有助于根本原因確定器間的故障排除處理,其中若第一個根本原因確定器崩潰了,則第二個根本原因確定器可執(zhí)行先前由崩潰的根本原因確定器所執(zhí)行的處理,這有助于分布式企業(yè)管理。
圖4圖解了確定企業(yè)事件的根本原因的示例系統(tǒng)。企業(yè)400可包括各種企業(yè)組件,其中每一個可生成一種或多種企業(yè)事件410。一種示例系統(tǒng)與如美國專利No.5,958,012中所述的企業(yè)監(jiān)視系統(tǒng)集成。事件410由事件接收器420接收,事件接收器420可以是此處所定義的術(shù)語“計算機組件”。是否從事件接收器420向根本原因確定器440傳遞事件可至少部分地由定時器430的操作來控制。定時器430定義了預(yù)期發(fā)生有關(guān)事件410的時期。在某些場合下,在由定時器430定義的時期之外到達的事件410可呈遞給根本原因確定器440(例如根本原因判定首要事件)。根本原因確定器440通過分析存儲于例如關(guān)聯(lián)對象數(shù)據(jù)存儲器460中的關(guān)聯(lián)對象來確定一個或多個企業(yè)事件410的根本原因。關(guān)聯(lián)對象數(shù)據(jù)存儲器460可以是例如獨立或分布式數(shù)據(jù)庫、數(shù)據(jù)結(jié)構(gòu)(例如文件、陣列、數(shù)據(jù)庫表)等。關(guān)聯(lián)對象可包含一條或多條關(guān)聯(lián)規(guī)則及其它信息(例如關(guān)聯(lián)對象標(biāo)識符、時間數(shù)據(jù)、定時器數(shù)據(jù))。
根本原因確定器440能存取關(guān)聯(lián)規(guī)則數(shù)據(jù)存儲器450,其存儲一條或多條關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則數(shù)據(jù)存儲器450中存儲的關(guān)聯(lián)規(guī)則可包含例如多個組件,用于可被評價的表達式,以確定與企業(yè)事件集合相關(guān)的一組值是否指出了企業(yè)400中實體的問題的可能根本原因。盡管單一關(guān)聯(lián)規(guī)則可提供用于確定根本原因的單個數(shù)據(jù)點,但在關(guān)聯(lián)對象中聚集的關(guān)聯(lián)規(guī)則的累積也可提供一組數(shù)據(jù)點,其可提供更高的置信等級或更精明的根本原因判定。于是,關(guān)聯(lián)規(guī)則有助于確定企業(yè)事件的根本原因。盡管孤立地檢驗企業(yè)事件和/或關(guān)聯(lián)規(guī)則提供了對確定根本原因有用的信息,但因果數(shù)據(jù)存儲器470存儲兩個或多個企業(yè)組件間的因果關(guān)系,這有助于產(chǎn)生數(shù)據(jù)點的組合。一種示例因果數(shù)據(jù)存儲器470可存儲事務(wù)流水線從屬關(guān)系。在圖2中圖解了兩例事務(wù)流水線從屬關(guān)系,而為了簡潔起見,在此省略對其的討論。
一種示例事件接收器420既從企業(yè)400也從手工企業(yè)事件提供器(未圖示)接收事件410。作為圖解,事件410可從企業(yè)400通過計算機網(wǎng)絡(luò)而到達。類似地,獨立的企業(yè)組件可生成其由人類操作者解釋的信號作為企業(yè)事件,并繼而提供給事件接收器420。獨立的企業(yè)組件可以是例如不連接至網(wǎng)絡(luò)的安全、離站備份系統(tǒng)。
接口480圖解為與根本原因確定器440通信。一種示例接口480是圖形用戶接口,其有助于顯示由根本原因確定器440確定的根本原因和/或與根本原因判定相關(guān)的信息(例如在確定中利用的關(guān)聯(lián)對象、在確定中完成的關(guān)聯(lián)規(guī)則、企業(yè)事件、因果關(guān)系)。
一種示例根本原因確定器440檢驗與存儲于關(guān)聯(lián)對象數(shù)據(jù)存儲器460的關(guān)聯(lián)對象相關(guān)的關(guān)聯(lián)規(guī)則的完成程度。例如,根本原因確定器440可以產(chǎn)生有關(guān)已完成的關(guān)聯(lián)規(guī)則的數(shù)量的統(tǒng)計數(shù)據(jù)、和已完成的關(guān)聯(lián)規(guī)則的復(fù)雜度(例如三組件關(guān)聯(lián)規(guī)則對比十二組件關(guān)聯(lián)規(guī)則)。確定關(guān)聯(lián)規(guī)則的完成程度和確定已完成的關(guān)聯(lián)規(guī)則的類型和復(fù)雜度有助于選擇關(guān)聯(lián)對象,以在確定根本原因時進一步進行分析。此外,確定關(guān)聯(lián)規(guī)則的完成程度有助于重新配置定時器430設(shè)立的時期。例如,若100%的關(guān)聯(lián)規(guī)則已100%完成了,則時期可能太長了,因為有效的根本原因判定可以低于100%完成。反之,若小百分比(例如5%)的關(guān)聯(lián)規(guī)則已完成,則定時器430設(shè)立的時期可通過加長而受益,以有助于完成更高百分比的關(guān)聯(lián)規(guī)則。
假設(shè)不只一條的關(guān)聯(lián)規(guī)則已完成,則在一個示例中,根本原因確定器440可將由已完成的關(guān)聯(lián)規(guī)則指出的候選根本原因進行排序。在產(chǎn)生排序后,根本原因確定器440在一個示例中可接受操作者的手工輸入以選擇根本原因??稍诟驹虼_定器440的訓(xùn)練期間對手工操作者輸入進行分析,以有助于訓(xùn)練根本原因確定器440如何從一個或多個候選根本原因中自動確定根本原因。于是,將事件存儲于事件日志600(圖6),并將所確定的根本原因存儲于根本原因日志610(圖6),同時在接口480上呈遞候選根本原因有助于直到機器學(xué)習(xí),使根本原因確定器440適應(yīng)根本原因選擇算法。
不同企業(yè)可具有企業(yè)組件的不同混和,其生成企業(yè)事件410的不同混和。此外,不同企業(yè)400可得益于不同觀點的管理。因此,關(guān)聯(lián)規(guī)則的不同集合可存儲于關(guān)聯(lián)規(guī)則數(shù)據(jù)存儲器450中。為了有助于創(chuàng)建多樣的關(guān)聯(lián)規(guī)則,一種示例系統(tǒng)包括關(guān)聯(lián)規(guī)則制作器。制作器可包括圖形用戶接口,其簡化了對已有規(guī)則的適應(yīng)和/或新規(guī)則的建立。類似地,不同企業(yè)400可具有不同企業(yè)組件和/或企業(yè)組件集合間的不同因果關(guān)系。因此,一種示例系統(tǒng)包括因果關(guān)系制作器,其有助于定義可存儲于因果數(shù)據(jù)存儲器470的因果關(guān)系。
企業(yè)400可包括一個以上的域。此外,可存在多個企業(yè)400。在多個企業(yè)域或多個企業(yè)的場合下,可基于為分離域和/或企業(yè)而做的一個或多個初始根本原因判定來預(yù)測終極根本原因判定。于是,一種示例系統(tǒng)包括根本原因判定接收器(未圖示),其從一個或多個根本原因確定器440接受一個或多個根本原因判定作為輸入。在一個示例中,根本原因判定可傳遞至根本原因判定接收器作為企業(yè)事件,其有助于靈活地創(chuàng)建根本原因確定器的動態(tài)網(wǎng)絡(luò)。
一種示例用戶接口480是含顯示器和選擇設(shè)備的圖形用戶接口。接口480可用來在接口480上顯示數(shù)據(jù)條目集,并使用選擇設(shè)備從顯示于顯示器上的數(shù)據(jù)條目集中進行選擇。數(shù)據(jù)條目集可從各種來源(例如事件日志600、根本原因日志610、關(guān)聯(lián)規(guī)則數(shù)據(jù)存儲器450、關(guān)聯(lián)對象數(shù)據(jù)存儲器460、因果數(shù)據(jù)存儲器470)中檢索。在一種示例接口480中,數(shù)據(jù)條目集僅限于根本原因判定和在達到根本原因判定時所分析的關(guān)聯(lián)對象。接口480將數(shù)據(jù)條目集顯示于顯示器,并接收數(shù)據(jù)條目選擇信號,其指出由選擇設(shè)備選擇了所顯示的數(shù)據(jù)條目中的哪一個。為了響應(yīng)數(shù)據(jù)條目選擇信號,接口480可顯示與所選數(shù)據(jù)條目相關(guān)的附加數(shù)據(jù)。例如,若數(shù)據(jù)條目是根本原因判定,則接口480可顯示附加信息,其包括但不限于與根本原因判定相關(guān)的事件上下文數(shù)據(jù)、達到根本原因判定時所分析的一條或多條關(guān)聯(lián)規(guī)則、與涉及根本原因判定的企業(yè)組件相關(guān)的從屬數(shù)據(jù)、識別在達到根本原因判定時考慮的關(guān)聯(lián)對象的關(guān)聯(lián)對象標(biāo)識符、以及識別在達到根本原因判定時利用的根本原因確定器440的根本原因確定器標(biāo)識符。類似地,若所選數(shù)據(jù)條目是關(guān)聯(lián)對象,則接口480可提供附加數(shù)據(jù),其包括但不限于與定時器430關(guān)聯(lián)的定時器數(shù)據(jù)、從事件日志600中檢索出的一項或多項數(shù)據(jù)、識別用于存儲參與填充與關(guān)聯(lián)對象相關(guān)的關(guān)聯(lián)規(guī)則的企業(yè)事件的事件日志600的事件日志標(biāo)識符、與關(guān)聯(lián)對象相關(guān)的關(guān)聯(lián)規(guī)則、從屬性、以及關(guān)聯(lián)對象統(tǒng)計數(shù)據(jù)(例如考慮的事件數(shù)量、考慮的關(guān)聯(lián)對象數(shù)量、考慮的關(guān)聯(lián)規(guī)則數(shù)量、已完成的關(guān)聯(lián)規(guī)則數(shù)量)。
接口480還呈遞有助于添加、刪除和/或掛起(suspend)關(guān)聯(lián)對象的信息。此外,接口480有助于通過手工終止定時器到期時鐘而強迫關(guān)聯(lián)。
此處所述的系統(tǒng)、方法和圖形用戶接口可存取各種數(shù)據(jù)結(jié)構(gòu)。一種可存儲于計算機可讀介質(zhì)上的示例數(shù)據(jù)結(jié)構(gòu)與關(guān)聯(lián)對象相關(guān)。關(guān)聯(lián)對象可包括各種字段。一種示例字段集包括存儲對象標(biāo)識符的第一字段。對象標(biāo)識符唯一地識別從中接收企業(yè)事件的企業(yè)對象。第二字段存儲從企業(yè)事件中檢索出的事件消息。事件消息可從企業(yè)事件直接拷貝,或在存儲于第二字段之前處理(例如分析、模式匹配)。一種示例第三字段存儲企業(yè)事件所應(yīng)用的關(guān)聯(lián)規(guī)則。于是,關(guān)聯(lián)對象累積關(guān)聯(lián)規(guī)則以有助于高效的發(fā)送(route)因果判定。一種示例第四字段存儲與存儲于第三字段的一種或多種關(guān)聯(lián)規(guī)則的完成程度相關(guān)的數(shù)據(jù)。例如,第四字段可存儲百分比數(shù)據(jù),其指出關(guān)聯(lián)規(guī)則已完成的百分比,而對于未完成的關(guān)聯(lián)規(guī)則,指出這些未完成的關(guān)聯(lián)規(guī)則的完成百分比。一種示例第五字段存儲可以接收企業(yè)事件的時期。一種示例第六字段存儲根本原因確定器標(biāo)識符,其唯一地識別可對其提供計算機可讀介質(zhì)上存儲的數(shù)據(jù)結(jié)構(gòu)的根本原因確定器。于是,該示例第六字段有助于構(gòu)建靈活、動態(tài)的用于企業(yè)管理的根本原因確定器的網(wǎng)絡(luò)。
圖5圖解了與根本原因確定器440和接口480通信的示例影響分析器500。影響分析器500確定除去與根本原因相關(guān)的企業(yè)組件以外的企業(yè)組件是否可能受到被確定為根本原因的問題的影響。借助圖解,下游計算機組件可能受到上游計算機組件的失敗的影響,同時上游計算機組件不可能受到下游計算機組件的影響。例如,在包含后端銀行應(yīng)用程序和多個前端自動出納機(ATM)應(yīng)用程序的企業(yè)計算環(huán)境中,單個ATM的失敗不可能影響后端銀行應(yīng)用程序,不過,后端銀行應(yīng)用程序的失敗可能影響大量前端ATM應(yīng)用程序。
于是,影響分析器500可執(zhí)行包括但不限于告知受根本原因影響的企業(yè)組件和啟動與受影響的企業(yè)組件相關(guān)聯(lián)的影響處理的行動。告知受影響的企業(yè)組件可通過的機制包括但不限于中斷、信號、消息和事件。類似地,影響處理包括但不限于故障排除處理、重啟處理、關(guān)閉處理、安全處理和維護處理。故障排除處理可利用于銀行/ATM示例中,以將ATM請求從失敗的銀行應(yīng)用程序重新發(fā)送至例如備份的銀行應(yīng)用程序。類似地,可采用重啟處理來嘗試重啟銀行應(yīng)用程序。可采用關(guān)閉處理來例如暫時關(guān)閉ATM前端應(yīng)用程序,以允許有機會執(zhí)行后端銀行應(yīng)用程序的重啟和/或故障排除。盡管后端銀行應(yīng)用程序失敗或重啟了,但可采取例如安全處理以限制前端ATM應(yīng)用程序可提供的事務(wù)數(shù)量和/或類型。此外,當(dāng)影響分析器500確定例如盡管銀行應(yīng)用程序尚未失敗但在可預(yù)見的未來可能發(fā)生(例如盤接近飽和)時,可計劃維護處理。
圖6圖解了示例事件日志600,其可操作地(例如電地、物理地和/或由數(shù)據(jù)通信地)連接至事件接收器420。事件日志數(shù)據(jù)存儲器600有助于存儲所接收的企業(yè)事件,進而有助于備份、確定重建和后方案(post solution)機器學(xué)習(xí)。具有由根本原因確定器440考慮的事件日志600有助于重啟和/或重新執(zhí)行由例如根本原因確定器440的崩潰而中斷的根本原因判定。事件日志600有助于根本原因確定器440是如何達到其根本原因判定的后方案分析。后方案分析有助于對根本原因確定器440進行重構(gòu)和/或重編程,以更精確地確定根本原因。在一個示例中,事件日志600有選擇地存儲所接收的企業(yè)事件,以有助于縮減重復(fù)存儲的企業(yè)事件的數(shù)量。例如,在銀行/ATM中,單臺ATM機可報告一千次其無法存取銀行應(yīng)用程序。這一千條消息不可能皆是確定根本原因所必要的。于是,來自ATM的第一企業(yè)事件和所選擇的后續(xù)消息(例如,每單位時間一條消息)可存儲于事件日志600,而其它的重復(fù)消息就不存儲了。
圖6還圖解了存儲已確定的根本原因的根本原因日志數(shù)據(jù)存儲器610。將已確定的根本原因存儲于根本原因日志數(shù)據(jù)存儲器610有助于例如如何做出根本原因判定的后方案分析,并計劃將根本原因遞送至下游根本原因確定器。而且,將根本原因判定存儲于根本原因日志數(shù)據(jù)存儲器610有助于訓(xùn)練操作者,其任務(wù)是基于評價根本原因判定而進行企業(yè)管理。根本原因的歷史日志可被用來以產(chǎn)生簡化訓(xùn)練操作者的仿真。
應(yīng)該明白,圖4~6所圖解的系統(tǒng)可實施于一個計算機組件和/或兩個或多個分布式、協(xié)作、通信計算機組件。
下面參照圖7,圖解了應(yīng)用程序接口(API)780、其提供對根本原因判定應(yīng)用程序770的存取。API 780可由程序員750和/或處理760利用,以存取由應(yīng)用程序770執(zhí)行的處理和/或由應(yīng)用程序770利用的數(shù)據(jù)。例如,程序員750可編寫程序以存取由根本原因判定應(yīng)用程序770利用和/或產(chǎn)生的事件710、規(guī)則720、對象730和/或根本原因740。API 780的存在有助于利用根本原因判定應(yīng)用程序770,因為程序員750不必理解根本原因判定應(yīng)用程序770的內(nèi)部操作。程序員750僅需知道應(yīng)用程序770的接口780。這有助于封裝應(yīng)用程序770的功能,同時又暴露該功能。類似地,API 780可將數(shù)據(jù)值提供給根本原因判定應(yīng)用程序770和/或從應(yīng)用程序770檢索數(shù)據(jù)值。例如,檢索規(guī)則720的處理760可經(jīng)API 780將規(guī)則720提供給應(yīng)用程序770。盡管圖解了根本原因判定應(yīng)用程序770,但應(yīng)明白,API 780可向根本原因判定系統(tǒng)和/或方法提供接口。
于是,在一種示例API 780中,應(yīng)用程序接口集可存儲于計算機可讀介質(zhì)上。該接口可由計算機組件執(zhí)行以存取根本原因判定系統(tǒng)和/或方法。接口可包括但不限于第一接口,其接收企業(yè)事件;第二接口,其接收與企業(yè)事件相關(guān)的關(guān)聯(lián)規(guī)則;第三接口,其接收包含關(guān)聯(lián)規(guī)則的關(guān)聯(lián)對象,該關(guān)聯(lián)規(guī)則包括由第二接口接收的關(guān)聯(lián)規(guī)則;和第四接口,其返回企業(yè)事件的根本原因。
有鑒于此處所示和說明的示例系統(tǒng),參照圖8~12的流程圖可更好地理解所實施的方法。盡管為了簡化說明而將所繪方法表示和圖解成一系列方框,但應(yīng)明白,該方法不限于方框的次序。一些方框可以不同于所示和說明的次序出現(xiàn)和/或與其它方框同時出現(xiàn)。再者,不是全部的所繪方框都是實施示例方法所必需的,而附加和/或替代方法可利用未圖示的附加方框。
有些方法可由計算機可執(zhí)行指令和/或存儲于計算機可讀介質(zhì)上的操作來實施,該計算機可讀介質(zhì)包括但不限于專用集成電路(ASIC)、光盤(CD)、數(shù)字多用盤(DVD)、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可編程只讀存儲器(PROM)、電可擦寫可編程只讀存儲器(EEPROM)、盤、載波和存儲器棒。
下面參照圖8,其是表示管理企業(yè)計算環(huán)境的示例計算機實施方法的流程圖。一種示例企業(yè)計算環(huán)境包括多個由企業(yè)對象模型化的企業(yè)組件。企業(yè)組件可以是例如程序、線程、處理、網(wǎng)絡(luò)組件(例如路由器、重復(fù)器、橋、網(wǎng)關(guān))、計算機(例如主機、迷你計算機、個人計算機、服務(wù)器、手執(zhí)機、膝上機)和其它通信器材(例如蜂窩電話、尋呼機、個人數(shù)字助理(PDA))。企業(yè)對象包括對可以為其生成企業(yè)事件的企業(yè)組件進行抽象化和模型化的軟件。
企業(yè)組件可布置成動態(tài)的復(fù)雜網(wǎng)絡(luò)。當(dāng)一個企業(yè)組件遇到問題(例如應(yīng)用程序崩潰了)時,有關(guān)組件也會遇到問題。例如,利用崩潰的應(yīng)用程序的事務(wù)處理系統(tǒng)無法響應(yīng)用戶咨詢。
當(dāng)企業(yè)組件遇到問題時,他們能生成并報告企業(yè)事件。企業(yè)事件可采取許多形式,通常包括識別企業(yè)組件問題的文本消息和一個或多個可唯一地識別企業(yè)事件和遇到問題的企業(yè)組件的標(biāo)識符。企業(yè)事件還可包括問題持續(xù)時間、初次察覺問題的時刻、生成企業(yè)事件的時刻、報告企業(yè)事件的時刻和與問題相關(guān)的數(shù)據(jù)值(例如溫度=85度)等信息。于是,關(guān)聯(lián)和確定企業(yè)事件的根本原因包括接收和處理各種格式的各種企業(yè)事件。
由于遇到初始問題的企業(yè)組件和有關(guān)企業(yè)組件將生成并報告企業(yè)事件,故圖8的流程方法有助于分離癥狀企業(yè)事件與根本原因企業(yè)事件。
在800處,該方法建立了上下文集,從中可生成和/或觀察企業(yè)事件。確定上下文的規(guī)則可隨企業(yè)而異,其由例如規(guī)則程序員來確定,并可在企業(yè)內(nèi)部根據(jù)企業(yè)的觀點(例如應(yīng)用中心觀點、硬件中心觀點、業(yè)務(wù)處理中心觀點)而變化。上下文可由企業(yè)獲悉規(guī)則集而捕獲,該規(guī)則集將企業(yè)事件與有關(guān)事件集關(guān)聯(lián),從而有助于將大量事件過濾成較小的事件集。一種示例上下文是事務(wù)流水線,其是鏈接的從屬企業(yè)組件集和/或用于事務(wù)處理的對象集。
在810處,建立起有助于確定企業(yè)是否識別根本原因的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則在一個示例中可包括涉及企業(yè)事件數(shù)據(jù)的布爾表達式。由于企業(yè)事件是根據(jù)本方法而接收的,故布爾表達式的組件部分由從企業(yè)事件中檢索的數(shù)據(jù)而填充。于是,布爾表達式如果完成就可被評價,以確定在810處建立的關(guān)聯(lián)規(guī)則是否指示邏輯真結(jié)果,以及已完成的關(guān)聯(lián)規(guī)則是否導(dǎo)向確定根本原因。其它示例關(guān)聯(lián)規(guī)則即使在規(guī)則中存在小于100%可被規(guī)則利用的數(shù)據(jù),也可產(chǎn)生值。例如,規(guī)則x=A或B或(C與D)在某些場合下可僅以A或B的值來評價。
在820處,建立起兩個或多個企業(yè)組件間的從屬性集。從屬性有助于通過對因果關(guān)系進行模型化而確定企業(yè)事件是否識別了根本原因。識別已存在于企業(yè)中的因果關(guān)系簡化了預(yù)期事件的搜索并忽略了無關(guān)事件。例如,若企業(yè)組件A依賴于企業(yè)組件B,并從企業(yè)組件A接收了企業(yè)事件,則在820處建立的從屬性有助于從企業(yè)組件B中搜索企業(yè)事件,并有助于忽略來自企業(yè)組件C的企業(yè)事件,同時確定對于企業(yè)組件A處遇到的問題是否有上游根本原因(例如實體B的問題)。
由于企業(yè)計算環(huán)境可包括復(fù)雜的具有大量因果關(guān)系的企業(yè)組件網(wǎng)絡(luò),故建立企業(yè)組件問題的根本原因可能涉及分析多個有關(guān)的關(guān)聯(lián)規(guī)則。在830處,例示了一個相關(guān)對象,以有助于累積有關(guān)的關(guān)聯(lián)規(guī)則。隨著企業(yè)事件的到來,其被發(fā)送至容納確定根本原因的有關(guān)關(guān)聯(lián)規(guī)則的相關(guān)對象。將關(guān)聯(lián)規(guī)則累積入關(guān)聯(lián)對象有助于例如分離關(guān)聯(lián)對象中的關(guān)聯(lián)規(guī)則的并行處理,并從而有助于縮減與企業(yè)管理相關(guān)的處理時間。因此,根本原因事件可比傳統(tǒng)單處理系統(tǒng)更快地確定。
在840處,該方法接收企業(yè)事件。企業(yè)事件可從各種企業(yè)組件中生成并報告。于是,企業(yè)事件可采取各種企業(yè)事件格式之一。由于分離企業(yè)監(jiān)視器的任務(wù)可以是以不同觀點(例如硬件、軟件、業(yè)務(wù)處理)來監(jiān)視企業(yè)計算環(huán)境,故在850處,確定從中接收企業(yè)事件并對其進行觀察的上下文。確定生成企業(yè)事件的上下文,并從而確定對其進行分析的觀點有助于將企業(yè)事件發(fā)送至一個或多個關(guān)聯(lián)對象和/或根本原因確定器。這種多重發(fā)送有助于多個監(jiān)視器的并行處理。
在860處,企業(yè)事件被與一個或多個關(guān)聯(lián)對象聯(lián)系起來。企業(yè)事件可通過例如檢驗與關(guān)聯(lián)對象相關(guān)的關(guān)聯(lián)規(guī)則的組件部分而與關(guān)聯(lián)對象聯(lián)系起來,以確定從企業(yè)事件接收的數(shù)據(jù)是否可用來填充一個或多個字段或規(guī)則的組件部分。若企業(yè)事件由數(shù)據(jù)聯(lián)系至與關(guān)聯(lián)對象相關(guān)的關(guān)聯(lián)規(guī)則,則在870處可更新關(guān)聯(lián)規(guī)則。例如,若關(guān)聯(lián)規(guī)則具有五個作為布爾表達式的一部分的企業(yè)事件數(shù)據(jù)組件,而企業(yè)事件數(shù)據(jù)是五個組件之一,則可確定企業(yè)事件數(shù)據(jù)的值,而關(guān)聯(lián)規(guī)則中的布爾表達式可由該值來更新。此外,可更新關(guān)聯(lián)對象和/或關(guān)聯(lián)規(guī)則,以反映布爾表達式的完成程度。借助圖解,可更新記錄布爾表達式組分數(shù)量和布爾表達式填充組件數(shù)量的數(shù)據(jù)值。這種完成數(shù)據(jù)可控制例如是否將關(guān)聯(lián)規(guī)則應(yīng)用于根本原因判定。
方框840~870可包含于可由例如結(jié)合圖12所述的定時器控制的循環(huán)。于是,這組方框840~870可重復(fù)一次或多次,同時將一組企業(yè)事件呈遞給該方法。在晚些時刻,在程序控制下(例如定時器到期、預(yù)定的可配置的收到事件數(shù)量),存在循環(huán)并在880處確定根本原因。確定根本原因是基于以下之中的至少一個從中生成事件的上下文、在810處建立并在870處更新的關(guān)聯(lián)規(guī)則集、在820處建立的從屬性集以及一個或多個被聯(lián)系至在830處例示并在860處更新的關(guān)聯(lián)對象的企業(yè)事件集。例如,可分析帶有完整關(guān)聯(lián)規(guī)則的關(guān)聯(lián)對象,以確定是否及多少關(guān)聯(lián)規(guī)則產(chǎn)生布爾真值。若一個或多個關(guān)聯(lián)規(guī)則產(chǎn)生布爾真值,則確定根本原因涉及在具有報告真值的一個或多個關(guān)聯(lián)規(guī)則的關(guān)聯(lián)對象間進行選擇。做出該選擇的技術(shù)包括但不限于排序、神經(jīng)網(wǎng)絡(luò)技術(shù)、模式匹配技術(shù)和線性編程。盡管關(guān)聯(lián)規(guī)則是在產(chǎn)生邏輯值(例如真、假)的布爾表達式的上下文中說明的,但應(yīng)明白,關(guān)聯(lián)規(guī)則也可采取其它形式(例如函數(shù)、關(guān)系),而不限于布爾表達式。
在890處,生成與根本原因相關(guān)的指示符。該指示符可以是例如消息、企業(yè)事件、中斷、信號、或?qū)ο?。指示符可控制后方案活?例如計劃維護、故障排除處理、啟動影響分析)。
于是,圖8圖解了管理企業(yè)計算環(huán)境的示例方法。該方法包括預(yù)先確立的規(guī)則、上下文和從屬關(guān)系,其有助于提供可評價從企業(yè)組件接收的企業(yè)事件的框架。一旦企業(yè)組件遇到問題并開始生成和報告企業(yè)事件,則該方法接收事件,將其聯(lián)系至關(guān)聯(lián)規(guī)則,更新累積關(guān)聯(lián)規(guī)則的關(guān)聯(lián)對象并最終確定有關(guān)企業(yè)事件集的根本原因。該根本原因判定有助于理解基于根本原因判定應(yīng)采取何種行動??梢栽u價由該方法生成的指示符,以有助于執(zhí)行適當(dāng)?shù)钠髽I(yè)計算環(huán)境管理功能。
下面參照圖9,此流程解了將企業(yè)事件與一個或多個關(guān)聯(lián)對象聯(lián)系起來的示例。將企業(yè)事件與關(guān)聯(lián)對象聯(lián)系起來包括,在862處,識別與應(yīng)用企業(yè)事件的關(guān)聯(lián)規(guī)則相關(guān)的關(guān)聯(lián)對象。例如,關(guān)聯(lián)規(guī)則可以在表達式中具有多個組件。該組件可以反映可從企業(yè)事件得到的值。于是,企業(yè)事件可由數(shù)據(jù)基于企業(yè)事件是否提供關(guān)聯(lián)規(guī)則表達式的組件值而聯(lián)系至關(guān)聯(lián)規(guī)則。
確定關(guān)聯(lián)規(guī)則是否聯(lián)系至企業(yè)事件可以涉及,在864處,對企業(yè)事件文本字段進行分析,以確定是否有文本可填充關(guān)聯(lián)規(guī)則表達式組分。類似地,在864處,企業(yè)事件字段可與關(guān)聯(lián)規(guī)則表達式組分進行模式匹配,以確定企業(yè)事件是否含有可填充關(guān)聯(lián)規(guī)則表達式組分的數(shù)據(jù)。此外,可以檢驗企業(yè)事件中的唯一標(biāo)識符,以確定企業(yè)事件是否含有可填充關(guān)聯(lián)規(guī)則表達式組分的數(shù)據(jù)。盡管在864處圖解了分析、模式匹配和標(biāo)識符匹配,但應(yīng)明白,也可利用其它確定方法。若確定企業(yè)事件含有可填充關(guān)聯(lián)規(guī)則表達式組分的數(shù)據(jù),則可從企業(yè)事件中提取該數(shù)據(jù),以有助于以從該數(shù)據(jù)確定的值來更新關(guān)聯(lián)規(guī)則。
圖10圖解了一種用來確定根本原因的示例方法。該示例方法檢驗關(guān)聯(lián)規(guī)則的完成程度,并對已完成的關(guān)聯(lián)規(guī)則進行排序。在882處,從例如關(guān)聯(lián)對象數(shù)據(jù)存儲器中檢索例示關(guān)聯(lián)對象。記著關(guān)聯(lián)對象是在接收包含涉及與關(guān)聯(lián)對象相關(guān)的關(guān)聯(lián)規(guī)則的數(shù)據(jù)的企業(yè)事件時被例示的。在883處,獲取了在882處檢索的與關(guān)聯(lián)對象相關(guān)的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)對象可包含例如一條或多條關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則有助于識別企業(yè)組件和/或由相互關(guān)聯(lián)的企業(yè)組件生成的企業(yè)事件。一種示例關(guān)聯(lián)規(guī)則格式包括標(biāo)識符,其唯一地識別規(guī)則和到期(maturity)時間,即從第一個企業(yè)事件出現(xiàn)直到關(guān)聯(lián)根本原因到期(例如有理由假設(shè)基本上涉及第一個企業(yè)事件的所有企業(yè)事件已到達的時間)的時期。該示例關(guān)聯(lián)規(guī)則格式還可包括“事務(wù)流水線”字段,其可以是例如企業(yè)組件和指出其故障的事件的列表。該示例關(guān)聯(lián)規(guī)則格式還可包括“要生成的關(guān)聯(lián)事件”字段,其在完成了關(guān)聯(lián)規(guī)則并產(chǎn)生了指示該關(guān)聯(lián)對識別根本原因有貢獻的值時,定義要生成的企業(yè)事件。要生成的企業(yè)事件可包括具有從一個或多個企業(yè)事件中提取的文本和/或數(shù)據(jù)的字段。
該示例關(guān)聯(lián)規(guī)則格式還可包括“目標(biāo)事件管理器”字段,其可以是例如根本原因確定器和/或事件管理器的列表,向其發(fā)送將上一字段中所述的關(guān)聯(lián)事件。這有助于建立負責(zé)企業(yè)內(nèi)各種域的根本原因確定器網(wǎng)絡(luò),這又有助于并行處理和根本原因判定的本地化。該示例格式還可包括“刪除前的時間”字段,其描述在其后有理由斷言基本上涉及初次接收的企業(yè)事件的所有事件已處理過了的一段時間。關(guān)聯(lián)規(guī)則可以是動態(tài)的,于是格式可隨時間變化。
若企業(yè)組件由企業(yè)對象模型化,則關(guān)聯(lián)規(guī)則可含有“對象標(biāo)識符”等字段,其有助于唯一地識別企業(yè)對象。類似地,該規(guī)則可包括“對象描述”字段。對象簡化了企業(yè)組件的建立和維護狀態(tài)。于是,企業(yè)對象可具有這樣的狀態(tài),其被檢驗以確定被確定為根本原因的企業(yè)組件是否處于這種狀態(tài)即影響確定企業(yè)對象是根本原因時所采取的行動。例如,處于“維護”態(tài)的企業(yè)對象可望成為多個企業(yè)事件的根本原因,不過,基于企業(yè)對象的“維護”態(tài)而采取的行動可能不同于當(dāng)企業(yè)對象具有“運行中”的預(yù)期態(tài)時采取的行動。作為圖解,若企業(yè)對象的狀態(tài)可望成為“運行中”,則確定企業(yè)對象是根本原因時采取的行動或許包括故障排除處理。不過,若企業(yè)對象的狀態(tài)是“維護”,則采取的行動或許是在報告與處于“維護”態(tài)的企業(yè)對象相關(guān)的任何其它企業(yè)對象之前,告知下游對象等待足以完成維護的時期。
在884處,就關(guān)聯(lián)規(guī)則是否完成做出確定。作為圖解,關(guān)聯(lián)規(guī)則可具有四個組分,其邏輯“加”在一起以產(chǎn)生布爾真或假值。如上述,關(guān)聯(lián)規(guī)則組分的值可從企業(yè)事件數(shù)據(jù)字段中提取。若在884處的確定是“是”,則在885處,對已完成的關(guān)聯(lián)規(guī)則進行排序,以有助于與其它已完成的關(guān)聯(lián)規(guī)則比較。排序可基于例如事務(wù)流水線中的有關(guān)位置。
在886處,就是否還有另一規(guī)則需要檢驗做出確定。若確定是“是”,則處理返回883。若確定是“否”,則前往887,在此就是否還有另一關(guān)聯(lián)對象需要處理做出確定。若在887處的確定是“是”,則處理返回882。若確定是“否”,則前往888,在此選擇根本原因。該選擇可以通過檢驗已排序的完成的關(guān)聯(lián)規(guī)則集,并選擇排序最高的規(guī)則。不過,用來選擇根本原因的其它技術(shù)可包括但不限于手工選擇、模式匹配和神經(jīng)網(wǎng)絡(luò)技術(shù)。
下面轉(zhuǎn)向圖11,其是與關(guān)聯(lián)和確定根本原因事件的計算機實施方法相關(guān)的附加處理的流程圖。該處理可基于例如在890處(圖8)產(chǎn)生的指示符而有選擇地執(zhí)行。
在1100處,就是否向下游傳遞事件做出確定。作為圖解,在根本原因確定器網(wǎng)絡(luò)中,為第一域確定的根本原因可傳遞至其它根本原因確定器,以有助于協(xié)作根本原因判定。因此,在890處產(chǎn)生的指示符可指出由該方法確定的根本原因應(yīng)傳遞至其它根本原因確定器。若在1100處的確定是“是”,則在1100處,將企業(yè)事件傳遞至根本原因判定所利用的其它方法和/或系統(tǒng)。在1120處,就是否向下游傳遞消息做出確定。消息可被傳遞至例如控制臺應(yīng)用程序和/或操作者。若根本原因判定觸發(fā)了解決根本原因的自動處理(例如重啟了暫停的處理),則可有目的地告知操作者出現(xiàn)了重啟。不過,若根本原因判定需要操作者的關(guān)注,則可將消息顯示給操作者。于是,若在1120處的確定是“是”,則在1130處,將消息傳遞至下游。
在1140處,就是否啟動故障排除做出確定。作為圖解,若獨立盤的冗余陣列中的一張盤失敗了,但仍有足夠數(shù)量的獨立盤以執(zhí)行冗余陣列的容錯功能,則不需要故障排除處理。不過,若冗余陣列中的多個獨立盤失敗了,以致威脅到了容錯特征,則可采取這樣的處理即從冗余陣列中移除一張或多張失敗的獨立盤并將不同的獨立盤插入冗余陣列。因此若在1140處的確定是“是”,則在1150處,可啟動故障排除處理。
在1160處,就是否啟動維護處理做出確定。例如,880處的根本原因判定和890處的指示符可指出盤接近了與盤碎片相關(guān)的閾值。由于不同盤可能在不同級別的盤碎片情況下受影響和/或失敗,故熟練的操作者可有選擇地在不同級別的盤碎片情況下執(zhí)行維護。因此,可將該方法配置為基于880處的根本原因判定和890處生成的指示符而自動啟動維護。于是,若在1160處的確定是“是”,則可在1170處啟動維護處理。
下面參照圖12,該流程解了與限制在確定根本原因之前收集企業(yè)事件的時期相關(guān)的處理。一種用于根本原因判定的方法可得益于限制這樣一段時期,在該段時期內(nèi),通過分配足夠時間收集潛在有關(guān)的企業(yè)事件,以收集有意義的企業(yè)事件集,同時有理由地限制響應(yīng)企業(yè)事件的潛在漫長響應(yīng)時間。
在840處接收企業(yè)事件。在1200處,就事件是否涉及企業(yè)事件問題的第一個事件做出確定。若在1200處的確定是“是”,則在1210處啟動定時器。定時器運行的這段時期是可由企業(yè)計算環(huán)境管理系統(tǒng)的操作者設(shè)定的可配置時間。例如,對于大型企業(yè)和/或域而言,該定時器可設(shè)成第一時期,而對于較小企業(yè)和/或域而言,該定時器則可設(shè)成較短的第二時期。類似地,具有長從屬鏈條的企業(yè)可得益于更長的定時器時期,而具有相對簡易從屬性的企業(yè)可得益于較短的定時器時期。
在1220處就與企業(yè)事件或有關(guān)企業(yè)事件集相關(guān)的定時器時期是否到期做出確定。若在1220處的確定是“否”,則在1270處對該企業(yè)事件進行處理。該處理包括但不限于登錄企業(yè)事件、更新企業(yè)事件所應(yīng)用的關(guān)聯(lián)規(guī)則等。不過,若在1220處的確定是“是”,則在1230處就接收的企業(yè)事件是否可能變更定時器到期后做出的根本原因判定而做出確定。在1230處做出的確定假設(shè)一旦定時器到期,就在例如1250處做出根本原因判定。若在1230處的確定是“否”,則在1260處就是否確定了對于定時器啟動和到期之間收集的企業(yè)事件集的根本原因而做出確定。若在1260處的確定是“是”,則處理返回840。而若在1260處的確定是“否”,則在1250處確定根本原因。在1250處確定根本原因可由此處所述的方法和/或設(shè)備來執(zhí)行。
若在1230處的確定是“是”,即盡管定時器在1220處到期了,但在840處接收的企業(yè)事件仍可能變更上次在1250處確定的根本原因,則在1240處,取消上次確定的根本原因。之后,在1250處,重新確定根本原因。作為對可能變更根本原因判定的事件的圖解,考慮從有數(shù)以千計的用戶通過網(wǎng)關(guān)來存取單個數(shù)據(jù)庫的基于網(wǎng)絡(luò)的應(yīng)用程序接收的企業(yè)事件集。若數(shù)據(jù)庫崩潰了,則與基于網(wǎng)絡(luò)的應(yīng)用程序相關(guān)的網(wǎng)絡(luò)瀏覽器和/或客戶機應(yīng)用程序可能生成諸多指出網(wǎng)關(guān)不響應(yīng)的企業(yè)事件。海量的企業(yè)事件很容易淹沒企業(yè)計算環(huán)境的帶寬,從而阻止傳送由數(shù)據(jù)庫生成的企業(yè)事件。一旦從客戶機應(yīng)用程序接收到第一個企業(yè)事件,就可啟動定時器。在定時器等待期間,可從客戶機應(yīng)用程序接收大量(例如10,000個)企業(yè)事件。不過,由崩潰的數(shù)據(jù)庫生成的企業(yè)事件卻可能接收不到。它可能在路由器中列隊等待被散發(fā)給事件管理系統(tǒng)。接著,在定時器到期后,可接收與崩潰的數(shù)據(jù)庫相關(guān)的企業(yè)事件。設(shè)10,000個指出網(wǎng)關(guān)不響應(yīng)的企業(yè)事件和一個姍姍來遲的指出網(wǎng)關(guān)已試過并無法讀取的數(shù)據(jù)庫已崩潰的企業(yè)事件,從10,000個與網(wǎng)關(guān)有關(guān)的企業(yè)事件做出的確定很容易地被與崩潰的數(shù)據(jù)庫相關(guān)的企業(yè)事件所壓倒。
應(yīng)該明白,此處所述用來確定根本原因的方法可在單個計算機組件上執(zhí)行和/或在兩個或多個協(xié)作、通信的計算機組件間分布。此外應(yīng)該明白,此處所述的方法有可能由多個計算機組件并行執(zhí)行。
一旦確定了根本原因,則一種用于企業(yè)組件管理的示例方法即執(zhí)行影響分析。影響分析考慮了確定哪個企業(yè)組件,若是有的話,有可能受到問題的影響,該問題啟動了導(dǎo)致根本原因判定的企業(yè)事件。作為圖解,包括安全服務(wù)器、安全和不安全后端應(yīng)用程序、以及安全和不安全前端應(yīng)用程序的企業(yè)可得益于崩潰的安全服務(wù)器的影響分析。例如,不安全后端和不安全前端皆不可能受到崩潰的安全服務(wù)器的影響,不過安全后端應(yīng)用程序和安全前端應(yīng)用程序則可能受影響。因此,影響分析可導(dǎo)致基于安全服務(wù)器崩潰的根本原因判定而識別應(yīng)被告知、禁止等的企業(yè)組件。
上述內(nèi)容包括數(shù)個示例。當(dāng)然不可能為了說明關(guān)聯(lián)和確定系統(tǒng)和企業(yè)事件的根本原因所利用的系統(tǒng)、方法、GUI、API的目的而逐一說明組件或方法的每個可想到的組合。不過,本領(lǐng)域一般技術(shù)人員應(yīng)該明白有可能出現(xiàn)更多組合和變更。相應(yīng)地,本申請旨在涵蓋落入所附權(quán)利要求書的范圍內(nèi)的各種替代、修改和變化。此外,就“包括(include)”一詞在具體實施方式
或權(quán)利要求書中利用的范圍而言,該詞是包括性的,其使用方式與在權(quán)利要求書中作為劃界詞而利用的“包括(comprising)”具有類似地的解釋。
權(quán)利要求
1.一種用于企業(yè)組件管理的計算機實現(xiàn)方法,包括建立可以從中生成企業(yè)事件的上下文集合;建立關(guān)聯(lián)規(guī)則集合,其有助于確定企業(yè)事件是否識別了根本原因;建立一個或多個企業(yè)組件間的從屬關(guān)系集合,以有助于確定企業(yè)事件是否識別了根本原因;例示一個或多個關(guān)聯(lián)對象,以有助于累積和關(guān)聯(lián)有關(guān)的企業(yè)事件;接收企業(yè)事件;確定從中生成所述企業(yè)事件的上下文;將所述企業(yè)事件與一個或多個關(guān)聯(lián)對象聯(lián)系起來;更新所述企業(yè)事件所應(yīng)用的一個或多個關(guān)聯(lián)規(guī)則;基于從中生成事件的上下文、關(guān)聯(lián)規(guī)則集合、從屬關(guān)系集合、以及與一個或多個關(guān)聯(lián)對象有關(guān)的一個或多個企業(yè)事件集合之中的至少一個,來確定根本原因;以及生成與所述根本原因相關(guān)的指示符。
2.根據(jù)權(quán)利要求1的方法,其中將所述企業(yè)事件與一個或多個關(guān)聯(lián)對象聯(lián)系起來包括識別與所述企業(yè)事件所應(yīng)用的一個或多個關(guān)聯(lián)規(guī)則相關(guān)的一個或多個關(guān)聯(lián)對象;以及從企業(yè)事件中提取信息,以有助于更新關(guān)聯(lián)規(guī)則。
3.根據(jù)權(quán)利要求2的方法,其中識別所述企業(yè)事件所應(yīng)用的一個或多個關(guān)聯(lián)規(guī)則包括以下之中的至少一個分析一個或多個企業(yè)事件文本字段;對一個或多個企業(yè)事件數(shù)據(jù)字段進行模式匹配;以及對一個或多個企業(yè)事件標(biāo)識符字段進行匹配以有助于對一個或多個關(guān)聯(lián)規(guī)則文本字段、數(shù)據(jù)字段和標(biāo)識符字段進行比較。
4.根據(jù)權(quán)利要求1的方法,其中確定根本原因包括確定是否存在一個或多個關(guān)聯(lián)規(guī)則;以及若有一個或多個關(guān)聯(lián)規(guī)則完成,則在一個或多個關(guān)聯(lián)規(guī)則完成間選擇。
5.根據(jù)權(quán)利要求1的方法,包括執(zhí)行影響分析。
6.根據(jù)權(quán)利要求1的方法,其中基于所述指示符,將事件傳遞至下游組件。
7.根據(jù)權(quán)利要求1的方法,其中基于所述指示符,將消息傳遞至下游組件。
8.根據(jù)權(quán)利要求1的方法,其中基于所述指示符,運行一個或多個故障排除處理。
9.根據(jù)權(quán)利要求1的方法,其中基于所述指示符,運行一個或多個維護處理。
10.根據(jù)權(quán)利要求1的方法,其中所述計算機實現(xiàn)方法是由單個計算機組件來執(zhí)行的。
11.根據(jù)權(quán)利要求1的方法,其中所述計算機實現(xiàn)方法是由兩個或多個計算機組件來執(zhí)行的。
12.根據(jù)權(quán)利要求1的方法,包括啟動定時器,其測量收集在確定根本原因時分析的企業(yè)事件的一段時期;以及延遲確定根本原因,直到定時器期滿。
13.根據(jù)權(quán)利要求12的方法,其中若在所述定時器到期后接收了可能變更根本原因判定的企業(yè)事件,則取消在所述定時器運行期間從所述企業(yè)事件集合中確定的根本原因,并確定新的根本原因。
14.一種計算機可讀介質(zhì),其存儲了一種用于企業(yè)組件管理的方法的計算機可執(zhí)行指令,所述方法包括建立可以從中生成企業(yè)事件的上下文集合;建立關(guān)聯(lián)規(guī)則集合,其有助于確定企業(yè)事件是否識別了根本原因;建立一個或多個企業(yè)組件間的從屬關(guān)系集合,以有助于確定企業(yè)事件是否識別了根本原因;例示一個或多個關(guān)聯(lián)對象,以有助于累積和關(guān)聯(lián)有關(guān)的企業(yè)事件;接收企業(yè)事件;確定從中生成所述企業(yè)事件的上下文;將所述企業(yè)事件與一個或多個關(guān)聯(lián)對象聯(lián)系起來;更新所述企業(yè)事件所應(yīng)用的一個或多個關(guān)聯(lián)規(guī)則;基于從中生成事件的上下文、關(guān)聯(lián)規(guī)則集合、從屬關(guān)系集合、以及與一個或多個關(guān)聯(lián)對象有關(guān)的一個或多個企業(yè)事件集合之中的至少一個,來確定根本原因;以及生成與所述根本原因相關(guān)的指示符。
15.一種用來確定企業(yè)事件的根本原因的系統(tǒng),包括企業(yè)事件接收器,其接收一個或多個企業(yè)事件;關(guān)聯(lián)規(guī)則數(shù)據(jù)存儲器,其存儲有助于確定所述企業(yè)事件的根本原因的一個或多個關(guān)聯(lián)規(guī)則;因果數(shù)據(jù)存儲器,其存儲有助于確定企業(yè)事件的根本原因的因果關(guān)系,其中所述因果關(guān)系使兩個或多個企業(yè)組件產(chǎn)生聯(lián)系;關(guān)聯(lián)對象數(shù)據(jù)存儲器,其存儲與一個或多個候選根本原因相關(guān)的一個或多個關(guān)聯(lián)對象,其中所述關(guān)聯(lián)對象包括一個或多個關(guān)聯(lián)規(guī)則;定時器,其在確定所述根本原因之前,定義了一段時期,其間接收當(dāng)確定企業(yè)事件的根本原因時將考慮到的企業(yè)事件;根本原因確定器,其通過分析一個或多個關(guān)聯(lián)對象,來確定一個或多個企業(yè)事件的根本原因;以及接口,其呈遞所述根本原因。
16.根據(jù)權(quán)利要求15的系統(tǒng),其中所述企業(yè)事件接收器從一個或多個企業(yè)組件和手工企業(yè)事件提供器之中的至少一個接收一個或多個企業(yè)事件。
17.根據(jù)權(quán)利要求15的系統(tǒng),其中所述因果數(shù)據(jù)存儲器可存儲一個或多個事務(wù)流水線從屬關(guān)系。
18.根據(jù)權(quán)利要求15的系統(tǒng),包括影響分析器,其確定除去與根本原因相關(guān)的企業(yè)組件以外的企業(yè)組件是否可能受到企業(yè)事件的根本原因的影響。
19.根據(jù)權(quán)利要求18的系統(tǒng),其中所述影響分析器有選擇地執(zhí)行以下至少之一向受影響企業(yè)組件告知根本原因;以及啟動與受影響企業(yè)組件相關(guān)的影響處理。
20.根據(jù)權(quán)利要求19的系統(tǒng),其中所述影響處理至少包括以下之一故障排除處理、重啟處理、關(guān)閉處理、安全處理和維護處理。
21.根據(jù)權(quán)利要求15的系統(tǒng),包括事件日志數(shù)據(jù)存儲器,其存儲所接收的企業(yè)事件。
22.根據(jù)權(quán)利要求21的系統(tǒng),其中所述事件日志數(shù)據(jù)存儲器有選擇地存儲所接收的企業(yè)事件,其中所述選擇是基于企業(yè)事件的唯一性而做出的,以有助于通過縮減重復(fù)存儲的企業(yè)事件而縮減存儲需求。
23.根據(jù)權(quán)利要求15的系統(tǒng),包括根本原因日志數(shù)據(jù)存儲器,其存儲已確定的根本原因。
24.根據(jù)權(quán)利要求15的系統(tǒng),其中所述根本原因確定器計算與一個或多個關(guān)聯(lián)對象相關(guān)的一個或多個關(guān)聯(lián)規(guī)則被完成的程度。
25.根據(jù)權(quán)利要求24的系統(tǒng),其中所述根本原因確定器對一個或多個候選根本原因進行排序,并接受選擇根本原因的手工輸入。
26.根據(jù)權(quán)利要求15的系統(tǒng),包括關(guān)聯(lián)規(guī)則制作器,其有助于定義關(guān)聯(lián)規(guī)則。
27.根據(jù)權(quán)利要求15的系統(tǒng),包括因果關(guān)系制作器,其有助于定義因果關(guān)系。
28.根據(jù)權(quán)利要求15的系統(tǒng),包括根本原因判定接收器,其從一個或多個根本原因確定器中接收一個或多個根本原因判定,其中所述根本原因確定器在確定一個或多個企業(yè)事件的根本原因時考慮一個或多個根本原因判定。
29.根據(jù)權(quán)利要求15的系統(tǒng),其中所述系統(tǒng)是由單個計算機組件來執(zhí)行的。
30.根據(jù)權(quán)利要求15的系統(tǒng),其中所述系統(tǒng)是分布于兩個或多個計算機組件間的。
31.根據(jù)權(quán)利要求15的系統(tǒng),其中所述接口是圖形用戶接口。
32.一種計算機可讀介質(zhì),其存儲了一種用來確定企業(yè)事件的根本原因的系統(tǒng)的計算機可執(zhí)行組件,包括企業(yè)事件接收組件,其接收一個或多個企業(yè)事件;關(guān)聯(lián)規(guī)則數(shù)據(jù)存儲組件,其存儲有助于確定所述企業(yè)事件的根本原因的一個或多個關(guān)聯(lián)規(guī)則;因果數(shù)據(jù)存儲組件,其存儲有助于確定企業(yè)事件的根本原因的因果關(guān)系,其中所述因果關(guān)系使兩個或多個企業(yè)組件產(chǎn)生聯(lián)系;關(guān)聯(lián)對象數(shù)據(jù)存儲組件,其存儲與一個或多個候選根本原因相關(guān)的一個或多個關(guān)聯(lián)對象,其中所述關(guān)聯(lián)對象包括一個或多個關(guān)聯(lián)規(guī)則;定時組件,其在確定所述根本原因之前,定義了一段時期,其間接收當(dāng)確定企業(yè)事件的根本原因時將考慮到的企業(yè)事件;根本原因判定組件,其通過分析一個或多個關(guān)聯(lián)對象而確定一個或多個企業(yè)事件的根本原因;以及顯示組件,其顯示所述根本原因。
33.一種在具有圖形用戶接口的計算機系統(tǒng)中提供數(shù)據(jù)條目集合并從顯示器上的數(shù)據(jù)條目集合中進行選擇的方法,該圖形用戶接口包括顯示器和選擇儀,該方法包括檢索數(shù)據(jù)條目集合,各數(shù)據(jù)條目代表根本原因判定和在確定根本原因時分析的關(guān)聯(lián)對象之一;將所述數(shù)據(jù)條目集合顯示于顯示器上;接收數(shù)據(jù)條目選擇信號,其指示選擇所選擇的數(shù)據(jù)條目的選擇裝置;以及響應(yīng)于該信號,有選擇地提供與所述數(shù)據(jù)條目相關(guān)的附加數(shù)據(jù)。
34.根據(jù)權(quán)利要求33的方法,其中若所選擇的數(shù)據(jù)條目是根本原因判定,則提供附加數(shù)據(jù)包括以下至少之一事件上下文數(shù)據(jù)、關(guān)聯(lián)規(guī)則、從屬數(shù)據(jù)、關(guān)聯(lián)對象標(biāo)識符和根本原因確定器標(biāo)識符。
35.根據(jù)權(quán)利要求33的方法,其中若所選擇的數(shù)據(jù)條目是關(guān)聯(lián)對象,則提供附加數(shù)據(jù)包括以下至少之一定時器數(shù)據(jù)、事件日志數(shù)據(jù)、一個或多個關(guān)聯(lián)規(guī)則、一個或多個從屬關(guān)系和關(guān)聯(lián)對象統(tǒng)計數(shù)據(jù)。
36.一組在計算機可讀介質(zhì)上體現(xiàn)的應(yīng)用編程接口,用于由計算機組件結(jié)合確定企業(yè)事件的根本原因的應(yīng)用程序而執(zhí)行,包括第一接口,其接收企業(yè)事件;第二接口,其接收企業(yè)事件所應(yīng)用的關(guān)聯(lián)規(guī)則;第三接口,其接收包括一個或多個關(guān)聯(lián)規(guī)則的關(guān)聯(lián)對象,所述關(guān)聯(lián)規(guī)則包括由所述第二接口接收的關(guān)聯(lián)規(guī)則;以及第四接口,其返回企業(yè)事件的根本原因,其中根本原因是通過檢驗由所述第三接口接收的一個或多個關(guān)聯(lián)對象而確定的。
37.一種計算機可讀介質(zhì),其上存儲與關(guān)聯(lián)對象相關(guān)的數(shù)據(jù)結(jié)構(gòu),包括第一字段,其存儲對象標(biāo)識符,該對象標(biāo)識符識別從中接收企業(yè)事件的企業(yè)對象;第二字段,其存儲從企業(yè)事件中檢索出的事件消息;第三字段,其存儲企業(yè)事件所應(yīng)用的一條或多條關(guān)聯(lián)規(guī)則;第四字段,其存儲在所述第三字段中存儲的一條或多條關(guān)聯(lián)規(guī)則已完成程度;第五字段,其存儲可接收企業(yè)事件的時期;以及第六字段,其存儲根本原因確定器標(biāo)識符,該根本原因確定器標(biāo)識符識別可向其提供數(shù)據(jù)結(jié)構(gòu)的一個或多個根本原因確定器。
38.一種用來關(guān)聯(lián)事件并確定基礎(chǔ)事件的系統(tǒng),包括用來接收事件的裝置;用來存儲事件的裝置;用來將事件應(yīng)用于一條或多條關(guān)聯(lián)規(guī)則的裝置;以及用來基于對一條或多條關(guān)聯(lián)規(guī)則已完成程度的檢驗和由關(guān)聯(lián)規(guī)則產(chǎn)生的值確定基礎(chǔ)事件的裝置。
全文摘要
提供了一種方法、系統(tǒng)、GUI、API、計算機可讀介質(zhì)和數(shù)據(jù)結(jié)構(gòu),用來簡化對企業(yè)組件的復(fù)雜系統(tǒng)的管理。該計算機可執(zhí)行方法包括關(guān)聯(lián)和確定企業(yè)事件的根本原因。因此,企業(yè)組件管理通過區(qū)分癥狀事件與根本原因事件而得以簡化,這有助于及時地采取適當(dāng)?shù)木S護行動。該系統(tǒng)提供了基于計算機的系統(tǒng),用來接收和關(guān)聯(lián)事件,接著從這些與時間有關(guān)的所接收的、已關(guān)聯(lián)的事件集來診斷根本原因事件。該系統(tǒng)包括計算機組件,用來接收、存儲和關(guān)聯(lián)事件;和用來分析這些事件及有關(guān)的關(guān)聯(lián)規(guī)則的根本原因確定器。
文檔編號G06F11/34GK1549969SQ02817047
公開日2004年11月24日 申請日期2002年7月8日 優(yōu)先權(quán)日2001年7月6日
發(fā)明者基倫·康奈利, 基倫 康奈利, 特 考爾, 薩特萬特·考爾, 豪厄爾, 馬克·豪厄爾 申請人:電腦聯(lián)合想象公司