監(jiān)控計(jì)算網(wǎng)絡(luò)的制作方法
【專利說(shuō)明】
【背景技術(shù)】
[0001]計(jì)算網(wǎng)絡(luò)可以包括數(shù)以千計(jì)的被配置成與彼此交互的網(wǎng)絡(luò)項(xiàng)目。網(wǎng)絡(luò)項(xiàng)目除其它之外可以包括軟件、模型、方案、諸如過(guò)程文檔編制的形式文檔編制、服務(wù)水平協(xié)議(SLA)、服務(wù)器、儲(chǔ)存器、路由器、交換機(jī)、以及處理單元。針對(duì)能夠影響網(wǎng)絡(luò)項(xiàng)目的管理的變化監(jiān)控這些網(wǎng)絡(luò)項(xiàng)目。
【附圖說(shuō)明】
[0002]在以下的詳細(xì)描述中并參考附圖描述某些示例,其中:
圖1是計(jì)算系統(tǒng)的示例的框圖;
圖2是管理模板的示例的框圖;
圖3是監(jiān)控方面的示例的圖解;
圖4是基于拓?fù)淠J降谋O(jiān)控系統(tǒng)和所監(jiān)控的應(yīng)用服務(wù)的示例的框圖;
圖5是基于拓?fù)淠J降谋O(jiān)控系統(tǒng)的示例的框圖;
圖6是配置無(wú)代理(agent-less)監(jiān)控應(yīng)用的基于拓?fù)淠J降谋O(jiān)控系統(tǒng)的框圖;
圖7是配置監(jiān)控系統(tǒng)的方法的示例的過(guò)程流程圖;
圖8是配置監(jiān)控系統(tǒng)的方法的示例的過(guò)程流程圖;
圖9是重新配置監(jiān)控系統(tǒng)的方法的示例的過(guò)程流程圖;以及圖10是重新配置監(jiān)控系統(tǒng)的方法的示例的過(guò)程流程圖。
【具體實(shí)施方式】
[0003]本文中描述的技術(shù)一般地涉及監(jiān)控并管理計(jì)算網(wǎng)絡(luò)。信息技術(shù)(IT)環(huán)境可以包括數(shù)千硬件和軟件元件,以及源自內(nèi)部或外部提供商的服務(wù)。由管理系統(tǒng)管理這些元件和服務(wù)。不論何時(shí)在IT環(huán)境中的元件或服務(wù)變化,都可以重新配置該管理系統(tǒng)。諸如新的系統(tǒng)、應(yīng)用和網(wǎng)絡(luò)的按需供應(yīng)(on-demand provis1ning)和虛擬化技術(shù)的IT環(huán)境引入了在IT環(huán)境中的高頻率的變化。這些變化增加了在以及時(shí)、高效、低成本的方式管理服務(wù)方面的挑占戈。
[0004]當(dāng)監(jiān)控服務(wù)或元件時(shí),在環(huán)境的上下文中而不是孤立地考慮元件。例如,服務(wù)的應(yīng)用可以包括若干組件,除其它之外諸如服務(wù)器、中間件、以及數(shù)據(jù)庫(kù)。應(yīng)用的組件與彼此交互并因此以整體的方式被對(duì)待。由于元件在服務(wù)中的角色可以影響如何管理該元件,因此考慮環(huán)境的上下文。例如,在數(shù)據(jù)庫(kù)服務(wù)器上的磁盤(pán)I/O可以比應(yīng)用的應(yīng)用服務(wù)器機(jī)器包括更嚴(yán)格的控制。
[0005]當(dāng)前的監(jiān)控系統(tǒng)可以是節(jié)點(diǎn)中央式(node-centric)的,配置在所監(jiān)控的服務(wù)器的上下文中的監(jiān)控系統(tǒng)。然而,節(jié)點(diǎn)中央式監(jiān)控系統(tǒng)使用人類用戶來(lái)配置監(jiān)控系統(tǒng),并來(lái)針對(duì)給定的元件或服務(wù)激活適當(dāng)?shù)谋O(jiān)控。像這樣(as such),監(jiān)控系統(tǒng)的效率依賴于用戶知道在哪里以及如何部署應(yīng)用以及應(yīng)用的基礎(chǔ)設(shè)施和服務(wù),以及依賴于用戶理解哪些應(yīng)用正在每個(gè)節(jié)點(diǎn)上運(yùn)行。
[0006]節(jié)點(diǎn)中央式監(jiān)控系統(tǒng)對(duì)簡(jiǎn)單的場(chǎng)景來(lái)說(shuō)可以是高效的。然而,節(jié)點(diǎn)中央式監(jiān)控系統(tǒng)對(duì)復(fù)雜的IT環(huán)境來(lái)說(shuō)是低效的。例如,在動(dòng)態(tài)IT環(huán)境中,在發(fā)生變化和用戶察覺(jué)變化并更新監(jiān)控系統(tǒng)之間可能發(fā)生延遲。在IT環(huán)境中的變化和監(jiān)控系統(tǒng)的調(diào)節(jié)之間的延遲可能導(dǎo)致諸如錯(cuò)誤警報(bào)或未能監(jiān)控新元件的問(wèn)題。錯(cuò)誤警報(bào)是當(dāng)停用服務(wù)時(shí)對(duì)停止的服務(wù)的報(bào)告。另外,節(jié)點(diǎn)中央式監(jiān)控系統(tǒng)可能缺乏模擬所管理的元件的角色上下文的能力。不通過(guò)模擬所管理的元件的角色上下午,節(jié)點(diǎn)中央式監(jiān)控系統(tǒng)不能夠向用戶提供該上下文,使得當(dāng)配置將要如何管理服務(wù)器時(shí)剝奪了用戶的完整信息。
[0007]通過(guò)監(jiān)控IT環(huán)境的拓?fù)淠J?在計(jì)算網(wǎng)絡(luò)中的網(wǎng)絡(luò)項(xiàng)目之間的布局和互連),監(jiān)控系統(tǒng)可以自動(dòng)地識(shí)別在IT環(huán)境中的變化并配置監(jiān)控系統(tǒng),而不是依賴人類用戶。通過(guò)自動(dòng)化監(jiān)控系統(tǒng),可以增加監(jiān)控系統(tǒng)的效率,然而同時(shí)地降低維持監(jiān)控系統(tǒng)的成本。
[0008]基于拓?fù)淠J降谋O(jiān)控系統(tǒng)可以自動(dòng)地識(shí)別形成計(jì)算網(wǎng)絡(luò)的復(fù)雜應(yīng)用的拓?fù)淠J剑⒃跊](méi)有用戶干涉的情況下配置計(jì)算網(wǎng)絡(luò)的管理和監(jiān)控?;谕?fù)淠J降谋O(jiān)控系統(tǒng)可以分析在配置管理數(shù)據(jù)庫(kù)(“CMDB”)中的計(jì)算網(wǎng)絡(luò)的表示。計(jì)算網(wǎng)絡(luò)可以是動(dòng)態(tài)的并隨著對(duì)網(wǎng)絡(luò)項(xiàng)目的修改、添加、或排除而變化。因此,可以設(shè)計(jì)拓?fù)淠J奖O(jiān)控系統(tǒng)以根據(jù)在計(jì)算網(wǎng)絡(luò)中的最新更新實(shí)際地(virtually)顯示計(jì)算網(wǎng)絡(luò)的拓?fù)淠J?,并根?jù)這些變化配置計(jì)算網(wǎng)絡(luò)的監(jiān)控。
[0009]如本文中使用的那樣,術(shù)語(yǔ)“監(jiān)控拓?fù)淠J健敝傅氖强梢栽贗T網(wǎng)絡(luò)中存在一次或多次的復(fù)合IT系統(tǒng)的結(jié)構(gòu)的定義。例如,拓?fù)淠J娇梢悦枋鰬?yīng)用服務(wù)包括在節(jié)點(diǎn)上運(yùn)行的應(yīng)用服務(wù)器,并且應(yīng)用服務(wù)器使用在另一節(jié)點(diǎn)上運(yùn)行的數(shù)據(jù)庫(kù)。該定義是該拓?fù)淠J健?br>[0010]基于拓?fù)淠J降谋O(jiān)控系統(tǒng)可以自動(dòng)地從在CMDB中的配置項(xiàng)目或配置類型中查詢針對(duì)網(wǎng)絡(luò)項(xiàng)目的配置信息??梢怨?yīng)基于拓?fù)淠J降谋O(jiān)控系統(tǒng)以反映在計(jì)算系統(tǒng)中的配置項(xiàng)目或配置項(xiàng)目類型。另外,通過(guò)監(jiān)控在CMDB中的更新,基于拓?fù)淠J降谋O(jiān)控系統(tǒng)可以動(dòng)態(tài)地更新監(jiān)控配置以當(dāng)在計(jì)算網(wǎng)絡(luò)中發(fā)生在配置項(xiàng)目類型或配置項(xiàng)目中的變化時(shí)反映該變化。
[0011]圖1是計(jì)算系統(tǒng)的示例的框圖。計(jì)算系統(tǒng)100包括計(jì)算網(wǎng)絡(luò)102。計(jì)算網(wǎng)絡(luò)可以包括應(yīng)用服務(wù)104,其被部署在應(yīng)用服務(wù)器106上。應(yīng)用服務(wù)器106可以依賴于數(shù)據(jù)庫(kù)108來(lái)存儲(chǔ)數(shù)據(jù)。應(yīng)用服務(wù)器106和數(shù)據(jù)庫(kù)106可以在一個(gè)節(jié)點(diǎn)或多個(gè)節(jié)點(diǎn)110上運(yùn)行。例如,應(yīng)用服務(wù)104可以是web應(yīng)用,其被部署在運(yùn)行在節(jié)點(diǎn)NI上的WebLogic服務(wù)器106上。WebLogic服務(wù)器106可以包括對(duì)運(yùn)行在節(jié)點(diǎn)N2上的My SQL數(shù)據(jù)庫(kù)108的依賴。
[0012]計(jì)算系統(tǒng)100可以包括監(jiān)控應(yīng)用112。監(jiān)控應(yīng)用112根據(jù)其監(jiān)控配置來(lái)監(jiān)控計(jì)算網(wǎng)絡(luò)(102)的IT元件。監(jiān)控應(yīng)用除其它事物之外檢查每個(gè)IT元件遞送的服務(wù)的可用性和性能。例如,監(jiān)控應(yīng)用112檢查應(yīng)用服務(wù)(104 )的響應(yīng)時(shí)間和服務(wù)器110的CPU利用。
[0013]計(jì)算系統(tǒng)100還包括處理單元114。處理單元114可以包括中央處理單元(CF1U) 116以執(zhí)行所存儲(chǔ)的指令;以及存儲(chǔ)設(shè)備118,其存儲(chǔ)通過(guò)CPUl 16可執(zhí)行的指令。CPUl 16可以是單核處理器、多核處理器、或任何數(shù)目的其它配置。另外,處理單元114可以包括多于一個(gè)CPUl16 ο
[0014]處理單元114可以包括存儲(chǔ)器118。存儲(chǔ)器118可以包括隨機(jī)存取存儲(chǔ)器(RAM)、只讀存儲(chǔ)器(R0M)、閃存存儲(chǔ)器、或任何其它適當(dāng)?shù)拇鎯?chǔ)系統(tǒng)。例如,存儲(chǔ)器118可以包括動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)。處理單元114還可以包括操作系統(tǒng)120??梢詫⒉僮飨到y(tǒng)120存儲(chǔ)在存儲(chǔ)器118上。
[0015]處理單元114還包括運(yùn)行時(shí)間服務(wù)模型(RTSM)122。運(yùn)行時(shí)間服務(wù)模型122可以是配置管理數(shù)據(jù)庫(kù)(CMDB)。運(yùn)行時(shí)間服務(wù)模型包括客戶的IT環(huán)境的模型,并且隨著在IT環(huán)境中發(fā)生變化而自動(dòng)地或手動(dòng)地更新運(yùn)行時(shí)間服務(wù)模型。
[0016]配置項(xiàng)目(Cl)是在CMDBl22中的網(wǎng)絡(luò)項(xiàng)目或IT元件的表示。配置項(xiàng)目可以包括軟件、模型、方案、諸如過(guò)程文檔編制的形式文檔編制、服務(wù)水平協(xié)議(SLA)、服務(wù)器、儲(chǔ)存器、路由器、交換機(jī)、處理單元等的表示。在CMDB中可以采用如同“的組件”、“依賴于”、或“在…上主控”的關(guān)系來(lái)表示Cl以模擬所管理的應(yīng)用的結(jié)構(gòu)和在IT組件之間的拓?fù)潢P(guān)系。對(duì)在CMDB中的Cl進(jìn)行按類型歸類(type)以便諸如不同的Unix主機(jī)或MySQL數(shù)據(jù)庫(kù)實(shí)例的類似項(xiàng)目分享類似的屬性并且可以被容易地查詢。在CMDB內(nèi)的配置記錄中可以記錄關(guān)于每個(gè)配置項(xiàng)目的信息。配置記錄是包含網(wǎng)絡(luò)項(xiàng)目的配置細(xì)節(jié)的記錄。
[0017]CMDB可以記錄每個(gè)配置項(xiàng)目的屬性,以及其與其它配置項(xiàng)目的關(guān)系。配置項(xiàng)目類型、以及配置記錄可以收集關(guān)于相對(duì)類似的網(wǎng)絡(luò)項(xiàng)目的活動(dòng)的信息,然而同時(shí)地識(shí)別針對(duì)每個(gè)網(wǎng)絡(luò)項(xiàng)目連同在計(jì)算網(wǎng)絡(luò)中的其它網(wǎng)絡(luò)項(xiàng)目的配置信息。
[0018]另外,CMDB可以使用網(wǎng)絡(luò)發(fā)現(xiàn)方法收集針對(duì)網(wǎng)絡(luò)項(xiàng)目的信息并存儲(chǔ)關(guān)于配置項(xiàng)目類型的信息。例如,可以使用連續(xù)地掃描IT環(huán)境和對(duì)變化的數(shù)據(jù)饋送(data feed)的發(fā)現(xiàn)技術(shù)更新CMDB。雖然關(guān)于CMDB討論本文中討論的示例,但是在一些示例中,可以使用不同的數(shù)據(jù)儲(chǔ)存設(shè)備來(lái)存儲(chǔ)配置信息。
[0019]處理單元114還包括操作管理應(yīng)用124。操作管理應(yīng)用124合并來(lái)自一個(gè)或多個(gè)監(jiān)控應(yīng)用112的監(jiān)控信息并向一組用戶呈現(xiàn)該可用性/性能信息以便于在所監(jiān)控的IT網(wǎng)絡(luò)102中的問(wèn)題的解決。操作管理應(yīng)用使用運(yùn)行時(shí)間服務(wù)模型(CMDBH22來(lái)提供所管理的IT網(wǎng)絡(luò)102的模型。操作管理應(yīng)用124還使用基于拓?fù)涞谋O(jiān)控系統(tǒng)114來(lái)配置監(jiān)控應(yīng)用112以根據(jù)操作管理應(yīng)用124的需要監(jiān)控IT網(wǎng)絡(luò)102。
[0020]處理單元114還包括基于拓?fù)涞谋O(jiān)控系統(tǒng)126?;谕?fù)涞谋O(jiān)控系統(tǒng)126可以是操作管理應(yīng)用124的子集或者可以將基于拓?fù)涞谋O(jiān)控系統(tǒng)126安裝在處理單元114上作為獨(dú)立式應(yīng)用。可以在各種處理環(huán)境中實(shí)現(xiàn)基于拓?fù)涞谋O(jiān)控系統(tǒng)126。
[0021 ]另外,基于拓?fù)淠J降谋O(jiān)控系統(tǒng)126可以包括至少一個(gè)管理模板128。每個(gè)管理模板128可以包括監(jiān)控方面(monitoring aspects)130。監(jiān)控方面130是特定于特殊監(jiān)控技術(shù)的被封裝的監(jiān)控配置的監(jiān)控包。可以將監(jiān)控方面130與Cl類型相關(guān)聯(lián)以宣告可以將監(jiān)控方面應(yīng)用于在IT環(huán)境中的該類型的Cl實(shí)例。監(jiān)控方面130包括監(jiān)控策略132。監(jiān)控策略包含向監(jiān)控應(yīng)用指示應(yīng)如何監(jiān)控IT元件的詳細(xì)