一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng)及方法
【專利摘要】本發(fā)明涉及一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng)及方法,包括用于存儲目標(biāo)監(jiān)控對象配置信息的監(jiān)控對象數(shù)據(jù)庫,用于根據(jù)目標(biāo)監(jiān)控設(shè)備信息組件采集任務(wù),將采集任務(wù)分配給采集服務(wù)器,同時(shí)維護(hù)所有采集服務(wù)器的狀態(tài)和性能的采集管理節(jié)點(diǎn);用于監(jiān)控采集任務(wù)的調(diào)度,采集插件的管理以及對采集結(jié)果數(shù)據(jù)的存儲的采集服務(wù)器;用于存儲采集服務(wù)器的注冊信息及狀態(tài)信息的管理節(jié)點(diǎn)數(shù)據(jù)庫;用于存儲采集服務(wù)器采集的數(shù)據(jù)的性能數(shù)據(jù)庫。本發(fā)明為用戶提供精確、實(shí)時(shí)的監(jiān)控?cái)?shù)據(jù),用戶通過對監(jiān)控?cái)?shù)據(jù)的分析,可以迅速感知到系統(tǒng)資源是否能夠支撐當(dāng)前業(yè)務(wù)需求或存在過度冗余,從而達(dá)到業(yè)務(wù)穩(wěn)定運(yùn)行和資源最大化利用的目的。
【專利說明】-種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及云計(jì)算【技術(shù)領(lǐng)域】,尤其設(shè)及一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控 系統(tǒng)及方法。
【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)技術(shù)尤其是云計(jì)算的飛速發(fā)展,云中設(shè)備的資源狀態(tài)目前無法得到精 確、連續(xù)的監(jiān)控?cái)?shù)據(jù),W至于用戶無法迅速感知到系統(tǒng)資源是否能夠支撐當(dāng)前的業(yè)務(wù)需求 或是否存在過度冗余,也就很難做到業(yè)務(wù)的穩(wěn)定運(yùn)行和資源最大化利用。因此,需要一種監(jiān) 控系統(tǒng)對設(shè)備進(jìn)行監(jiān)控,準(zhǔn)確、連續(xù)的獲取設(shè)備數(shù)據(jù)。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明所要解決的技術(shù)問題是針對現(xiàn)有技術(shù)的不足,提供一種穩(wěn)定易用、易拓展、 支持多資源、易實(shí)施的基于云平臺的監(jiān)控系統(tǒng)及方法。
[0004] 本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種基于云平臺的分布式可擴(kuò)展資源 監(jiān)控系統(tǒng),包括監(jiān)控對象數(shù)據(jù)庫、一個(gè)采集管理節(jié)點(diǎn)、至少一個(gè)采集服務(wù)器、管理節(jié)點(diǎn)數(shù)據(jù) 庫和性能數(shù)據(jù)庫;
[0005] 所述監(jiān)控對象數(shù)據(jù)庫,其用于存儲目標(biāo)監(jiān)控對象的配置信息;
[0006] 所述采集管理節(jié)點(diǎn),其用于根據(jù)目標(biāo)監(jiān)控設(shè)備信息組件采集任務(wù),將采集任務(wù)分 配給采集服務(wù)器,同時(shí)維護(hù)所有采集服務(wù)器的狀態(tài)和性能;
[0007] 所述采集服務(wù)器,其用于監(jiān)控采集任務(wù)的調(diào)度,采集插件的管理W及對采集結(jié)果 數(shù)據(jù)的存儲;
[000引所述管理節(jié)點(diǎn)數(shù)據(jù)庫,其用于存儲采集服務(wù)器的注冊信息及狀態(tài)信息;
[0009] 所述性能數(shù)據(jù)庫,其用于存儲采集服務(wù)器采集的數(shù)據(jù)一種。
[0010] 本發(fā)明的有益效果是:本發(fā)明所述系統(tǒng)能及時(shí)感知到被監(jiān)控對象配置信息的變化 從而保證系統(tǒng)時(shí)刻都是在采集應(yīng)該采集的對象,而且在能準(zhǔn)確無誤地采集到各種已支持設(shè) 備的性能和狀態(tài)信息,提供了非常好的容錯(cuò)機(jī)制,監(jiān)控系統(tǒng)中任何一個(gè)組件出現(xiàn)異常都可 在短時(shí)間內(nèi)恢復(fù)到正常工作狀態(tài),而且對于未來進(jìn)一步拓展采集插件提供了非常良性的接 P。
[0011] 在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可W做如下改進(jìn)。
[0012] 進(jìn)一步,所述采集管理節(jié)點(diǎn)啟動(dòng)時(shí)或者每隔一個(gè)定周期主動(dòng)從監(jiān)控對象數(shù)據(jù)庫中 讀取所有設(shè)備配置信息,根據(jù)獲取的所有設(shè)備配置信息組件相應(yīng)的采集任務(wù),將采集任務(wù) 存儲到管理節(jié)點(diǎn)數(shù)據(jù)庫。
[0013] 進(jìn)一步,所述采集管理節(jié)點(diǎn)包括配置文件存儲模塊,其存儲有設(shè)備分配規(guī)則配置 文件和預(yù)定義任務(wù)配置文件。
[0014] 進(jìn)一步,所述采集管理節(jié)點(diǎn)采用系統(tǒng)預(yù)定義方式或用戶自定義方式組件采集任 務(wù);
[0015] 所述系統(tǒng)預(yù)定義方式建立采集任務(wù)具體為:讀取采集設(shè)備分配規(guī)則配置文件和預(yù) 定義任務(wù)配置文件,獲取采集設(shè)備分配規(guī)則和預(yù)定義任務(wù),根據(jù)每一個(gè)預(yù)定義任務(wù)的設(shè)備 類型從監(jiān)控對象數(shù)據(jù)庫中獲取所有該設(shè)備類型的設(shè)備,用每一個(gè)設(shè)備與采集設(shè)備分配規(guī)則 進(jìn)行比對,獲得該設(shè)備對應(yīng)的采集服務(wù)器信息,得到采集服務(wù)器和被監(jiān)控設(shè)備的映射關(guān)系, 根據(jù)映射關(guān)系中采集服務(wù)器個(gè)數(shù)組建相應(yīng)個(gè)數(shù)的采集任務(wù),將采集任務(wù)加入待分配任務(wù)列 表,等待分配;
[0016] 所述用戶自定義方式組建采集任務(wù)的具體實(shí)現(xiàn)為:用戶根據(jù)自身需求,通過預(yù)留 接口直接組建采集任務(wù),將采集任務(wù)加入待分配任務(wù)列表,等待分配。
[0017] 進(jìn)一步,所述采集服務(wù)器采用集中式管理,每個(gè)采集服務(wù)器啟動(dòng)時(shí)向采集管理節(jié) 點(diǎn)注冊自身信息,采集管理節(jié)點(diǎn)根據(jù)獲得采集服務(wù)器注冊信息更新管理節(jié)點(diǎn)數(shù)據(jù)庫,所述 采集管理節(jié)點(diǎn)更新管理節(jié)點(diǎn)數(shù)據(jù)庫具體為:更新管理節(jié)點(diǎn)數(shù)據(jù)庫中采集服務(wù)器信息,查詢 管理節(jié)點(diǎn)數(shù)據(jù)庫中對應(yīng)此采集服務(wù)器是否存在相應(yīng)的采集任務(wù),如果查詢結(jié)果不為空則更 新該采集服務(wù)器的采集任務(wù)列表。
[001引進(jìn)一步,所述采集服務(wù)器監(jiān)控采集任務(wù)的調(diào)度,根據(jù)采集任務(wù)的類型W及采集周 期,查詢采集服務(wù)器自身維護(hù)的采集插件信息,調(diào)用采集插件的采集設(shè)備分配方法,采集插 件返回與被監(jiān)控設(shè)備相等個(gè)數(shù)的數(shù)據(jù)采集線程,采集服務(wù)器維護(hù)所述數(shù)據(jù)采集線程并根據(jù) 采集周期定時(shí)調(diào)用相應(yīng)的數(shù)據(jù)采集線程進(jìn)行數(shù)據(jù)采集,并將采集的數(shù)據(jù)返回給采集服務(wù) 器;采集服務(wù)器將采集的數(shù)據(jù)存儲在性能數(shù)據(jù)庫中。
[0019] 進(jìn)一步,所述采集管理節(jié)點(diǎn)定時(shí)向所有采集服務(wù)器發(fā)送消息,監(jiān)控采集服務(wù)器的 服務(wù)狀態(tài),將采集服務(wù)器的狀態(tài)信息和相應(yīng)時(shí)間存儲入管理節(jié)點(diǎn)數(shù)據(jù)庫。
[0020] 進(jìn)一步,所述采集管理節(jié)點(diǎn)和各個(gè)采集服務(wù)器均配備有第=方進(jìn)程保護(hù)工具。
[0021] 進(jìn)一步,所述第S方進(jìn)程保護(hù)工具采用Supervisord,用于保證所述監(jiān)控系統(tǒng)自身 的健壯性。
[0022] 本發(fā)明解決上述技術(shù)問題的另一技術(shù)方案如下;一種基于云平臺的分布式可擴(kuò)展 資源監(jiān)控方法,包括如下步驟:
[0023] 步驟1,采集管理節(jié)點(diǎn)獲取目標(biāo)監(jiān)控設(shè)備信息;
[0024] 步驟2,根據(jù)目標(biāo)監(jiān)控設(shè)備信息組件采集任務(wù),將采集任務(wù)下發(fā)到采集服務(wù)器;
[0025] 步驟3,采集服務(wù)器監(jiān)控采集任務(wù)的調(diào)度,采集插件的管理W及對采集結(jié)果數(shù)據(jù)的 存儲。
[0026] 在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可W做如下改進(jìn)。
[0027] 進(jìn)一步,步驟2中采用系統(tǒng)預(yù)定義方式或用戶自定義方式組件采集任務(wù);
[002引所述系統(tǒng)預(yù)定義方式建立采集任務(wù)具體為:讀取采集設(shè)備分配規(guī)則配置文件和預(yù) 定義任務(wù)配置文件,獲取采集設(shè)備分配規(guī)則和預(yù)定義任務(wù),根據(jù)每一個(gè)預(yù)定義任務(wù)的設(shè)備 類型從監(jiān)控對象數(shù)據(jù)庫中獲取所有該設(shè)備類型的設(shè)備,用每一個(gè)設(shè)備與采集設(shè)備分配規(guī)則 進(jìn)行比對,獲得該設(shè)備對應(yīng)的采集服務(wù)器信息,得到采集服務(wù)器和被監(jiān)控設(shè)備的映射關(guān)系, 根據(jù)映射關(guān)系組件相應(yīng)個(gè)數(shù)的采集任務(wù),將采集任務(wù)加入待分配任務(wù)列表,等待分配;
[0029] 所述用戶自定義方式組建采集任務(wù)的具體實(shí)現(xiàn)為:用戶根據(jù)自身需求,通過預(yù)留 接口直接組建采集任務(wù),將采集任務(wù)加入待分配任務(wù)列表,等待分配。
[0030] 進(jìn)一步,步驟3中采集服務(wù)器監(jiān)控采集任務(wù)的調(diào)度的具體步驟為;根據(jù)采集任務(wù) 的類型w及采集周期,查詢采集服務(wù)器自身維護(hù)的采集插件信息,調(diào)用采集插件的采集設(shè) 備分配方法,采集插件返回與被監(jiān)控設(shè)備相等個(gè)數(shù)的數(shù)據(jù)采集線程,采集服務(wù)器維護(hù)所述 數(shù)據(jù)采集線程并根據(jù)采集周期定時(shí)調(diào)用相應(yīng)的數(shù)據(jù)采集線程進(jìn)行數(shù)據(jù)采集,并將采集的數(shù) 據(jù)返回給采集服務(wù)器;采集服務(wù)器將采集的數(shù)據(jù)存儲在性能數(shù)據(jù)庫中。
【專利附圖】
【附圖說明】
[0031] 圖1為本發(fā)明所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng)框圖;
[0032] 圖2為本發(fā)明所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控方法流程圖;
[0033] 圖3為本發(fā)明所述預(yù)定方式組件采集任務(wù)方法流程圖;
[0034] 圖4為本發(fā)明所述采集服務(wù)器注冊流程圖;
[0035] 圖5為本發(fā)明所述采集管理節(jié)點(diǎn)查詢采集服務(wù)器狀態(tài)方法流程圖;
[0036] 圖6為本發(fā)明所述采集任務(wù)調(diào)度方法流程圖。
[0037] 附圖中,各標(biāo)號所代表的部件列表如下:
[003引1、監(jiān)控對象數(shù)據(jù)庫,2、采集管理節(jié)點(diǎn),3、采集服務(wù)器,4、管理節(jié)點(diǎn)數(shù)據(jù)庫,5、性能 數(shù)據(jù)庫。
【具體實(shí)施方式】
[0039] W下結(jié)合附圖對本發(fā)明的原理和特征進(jìn)行描述,所舉實(shí)例只用于解釋本發(fā)明,并 非用于限定本發(fā)明的范圍。
[0040] 如圖1所示,一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng),需要進(jìn)行如下搭建: 配置監(jiān)控對象數(shù)據(jù)庫,將需要監(jiān)控對象的配置信息存儲在監(jiān)控對象數(shù)據(jù)庫中;配置管理節(jié) 點(diǎn)數(shù)據(jù)庫,在管理節(jié)點(diǎn)數(shù)據(jù)庫中建立采集管理節(jié)點(diǎn)需要的數(shù)據(jù)庫表;配置性能數(shù)據(jù)庫,在性 能數(shù)據(jù)庫中建立各個(gè)采集服務(wù)器需要的數(shù)據(jù)庫表;配置采集管理節(jié)點(diǎn),將采集管理節(jié)點(diǎn)部 署在一臺裝有Tomcat環(huán)境的服務(wù)器上,編輯監(jiān)控設(shè)備分配規(guī)則配置文件,配置監(jiān)控對象數(shù) 據(jù)庫和管理節(jié)點(diǎn)數(shù)據(jù)庫的地址;配置采集服務(wù)器,根據(jù)業(yè)務(wù)需要確定采集服務(wù)器的數(shù)量,在 每個(gè)采集服務(wù)器主機(jī)上安裝一套采集服務(wù)器程序,并配置好管理節(jié)點(diǎn)地址W及性能數(shù)據(jù)庫 地址。
[0041] 一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng),包括監(jiān)控對象數(shù)據(jù)庫1、一個(gè)采集 管理節(jié)點(diǎn)2、至少一個(gè)采集服務(wù)器3、管理節(jié)點(diǎn)數(shù)據(jù)庫4和性能數(shù)據(jù)庫5 ;所述監(jiān)控對象數(shù)據(jù) 庫1,其用于存儲目標(biāo)監(jiān)控對象的配置信息;所述采集管理節(jié)點(diǎn)2,其用于根據(jù)目標(biāo)監(jiān)控設(shè) 備信息組件采集任務(wù),將采集任務(wù)分配給采集服務(wù)器,同時(shí)維護(hù)所有采集服務(wù)器的狀態(tài)和 性能;所述采集服務(wù)器3,其用于監(jiān)控采集任務(wù)的調(diào)度,采集插件的管理W及對采集結(jié)果數(shù) 據(jù)的存儲;所述管理節(jié)點(diǎn)數(shù)據(jù)庫4,其用于存儲采集服務(wù)器的注冊信息及狀態(tài)信息;所述性 能數(shù)據(jù)庫5,其用于存儲采集服務(wù)器采集的數(shù)據(jù)一種。
[0042] 如圖2所示,一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控方法,包括如下步驟:
[0043] 步驟1,采集管理節(jié)點(diǎn)獲取目標(biāo)監(jiān)控設(shè)備信息;
[0044] 步驟2,根據(jù)目標(biāo)監(jiān)控設(shè)備信息組件采集任務(wù),將采集任務(wù)下發(fā)到采集服務(wù)器;
[0045] 步驟3,采集服務(wù)器監(jiān)控采集任務(wù)的調(diào)度,采集插件的管理W及對采集結(jié)果數(shù)據(jù)的 存儲。
[0046] 本發(fā)明所述系統(tǒng)具有W下特性。
[0047] 1.基于云平臺:
[0048] 該監(jiān)控系統(tǒng)能夠監(jiān)控云平臺所管理的各種資源,包括計(jì)算資源(物理機(jī), HYPERVISOR,虛擬機(jī))、存儲設(shè)備、網(wǎng)絡(luò)設(shè)備(交換機(jī),路由器,負(fù)載均衡,防火墻)W及應(yīng)用 程序(Tomcat, Apache, MySQL)等未來可能要拓展的資源。
[0049] 該監(jiān)控系統(tǒng)的架構(gòu)是分布式的,由一個(gè)采集管理節(jié)點(diǎn)(Col lectManager)和若干 個(gè)采集服務(wù)器(Col lectServer)組成。所述采集管理節(jié)點(diǎn),負(fù)責(zé)監(jiān)控系統(tǒng)中采集任務(wù)的管 理、分配,同時(shí)維護(hù)所有采集服務(wù)器的信息和狀態(tài)。所述采集服務(wù)器,負(fù)責(zé)監(jiān)控采集任務(wù)的 調(diào)度,采集插件的管理W及對采集結(jié)果數(shù)據(jù)的存儲。
[0050] 2.易擴(kuò)展;
[0化1] 監(jiān)控系統(tǒng)不僅僅能夠?qū)ι衔乃岬降馁Y源實(shí)施監(jiān)控,同時(shí)也非常方便支持開發(fā) 自定義插件來監(jiān)控未來要拓展的資源。目前,系統(tǒng)中共有4種類型的插件,物理機(jī)插件、 Hypervisor插件、虛擬機(jī)插件和應(yīng)用程序插件,它們統(tǒng)一拓展系統(tǒng)中預(yù)留的接口并返回固 定格式的數(shù)據(jù)。未來要拓展的插件:首先要拓展系統(tǒng)預(yù)留的采集插件接口,在該個(gè)接口下實(shí) 現(xiàn)采集任務(wù)分配方法返回的值的是采集線程集合;然后拓展采集線程該個(gè)接口,在該個(gè)接 口下實(shí)現(xiàn)數(shù)據(jù)采集的具體過程,返回值是系統(tǒng)要求的固定格式。
[0052] 3.系統(tǒng)穩(wěn)定性保證:
[0化3] 監(jiān)控系統(tǒng)提供了采集服務(wù)器狀態(tài)監(jiān)測機(jī)制、每一個(gè)系統(tǒng)組件(包括采集管理節(jié)點(diǎn) 和每一個(gè)采集服務(wù)器)都配備一個(gè)第S方進(jìn)程監(jiān)控工具--Supervisord。Supervisord 能夠在進(jìn)程出現(xiàn)中斷的情況下重新啟動(dòng)該個(gè)進(jìn)程,保證程序的能夠自恢復(fù)運(yùn)行。利用 Supervisord工具的進(jìn)程自恢復(fù)機(jī)制來保證系統(tǒng)任何狀態(tài)下都能對外提供穩(wěn)定的服務(wù)。 [0化4] 監(jiān)控系統(tǒng)還對所有的采集服務(wù)器提供了屯、跳機(jī)制,避免了了采集服務(wù)器進(jìn)程存在 但是服務(wù)不正常工作的情況。
[005引例如凍集管理節(jié)點(diǎn)重啟,與采集任務(wù)信息的管理一樣。采集服務(wù)器重啟,與系統(tǒng) 中所有采集服務(wù)器信息管理和服務(wù)狀態(tài)管理流程一樣。
[0化6] 監(jiān)控對象數(shù)據(jù)來源:
[0化7] 監(jiān)控系統(tǒng)所需要監(jiān)控對象的配置信息存儲在監(jiān)控對象數(shù)據(jù)庫中,所述采集管理節(jié) 點(diǎn)2啟動(dòng)時(shí)或者每隔一個(gè)定周期主動(dòng)從監(jiān)控對象數(shù)據(jù)庫中讀取所有設(shè)備配置信息,根據(jù)獲 取的所有設(shè)備配置信息組件相應(yīng)的采集任務(wù),將采集任務(wù)存儲到管理節(jié)點(diǎn)數(shù)據(jù)庫。保證及 時(shí)監(jiān)控到更新的監(jiān)控對象。
[0化引采集任務(wù)信息管理:
[0059] 如圖3所示,所述采集管理節(jié)點(diǎn)2包括配置文件存儲模塊,其存儲有設(shè)備分配規(guī)則 配置文件和預(yù)定義任務(wù)配置文件。所述采集管理節(jié)點(diǎn)采用系統(tǒng)預(yù)定義方式或用戶自定義方 式組件采集任務(wù)。
[0060] 所述系統(tǒng)預(yù)定義方式建立采集任務(wù)具體為:采集管理節(jié)點(diǎn)啟動(dòng)或者重啟時(shí),讀取 采集設(shè)備分配規(guī)則配置文件和預(yù)定義任務(wù)配置文件,獲取采集設(shè)備分配規(guī)則和6個(gè)預(yù)定 義任務(wù)(分別是物理機(jī)的性能和狀態(tài)、Hypervisor的性能和狀態(tài)、虛擬機(jī)的性能和狀態(tài)任 務(wù)),且該6個(gè)預(yù)定義任務(wù)的采集周期均是每5分鐘一次。遍歷6個(gè)預(yù)定義任務(wù),根據(jù)每一 個(gè)預(yù)定義任務(wù)的設(shè)備類型從監(jiān)控對象數(shù)據(jù)庫中獲取所有該設(shè)備類型的設(shè)備,用每一個(gè)設(shè)備 與采集設(shè)備分配規(guī)則進(jìn)行比對,獲得該設(shè)備對應(yīng)的采集服務(wù)器信息,得到采集服務(wù)器和被 監(jiān)控設(shè)備的映射關(guān)系,根據(jù)映射關(guān)系中采集服務(wù)器個(gè)數(shù)組建相應(yīng)個(gè)數(shù)的采集任務(wù),將采集 任務(wù)加入待分配任務(wù)列表,等待分配。
[0061] 所述用戶自定義方式組建采集任務(wù)的具體實(shí)現(xiàn)為:用戶根據(jù)自身需求,通過預(yù)留 接口直接組建采集任務(wù),將采集任務(wù)加入待分配任務(wù)列表,等待分配。
[0062] 對采集任務(wù)的管理除了包括采集任務(wù)的組件外,還包括通過系統(tǒng)預(yù)留接口對采集 任務(wù)的刪除、更改、查詢和分配:
[0063] 通過系統(tǒng)預(yù)留接口查詢監(jiān)控采集管理節(jié)點(diǎn)下所有的任務(wù)信息,也可W查詢某一采 集服務(wù)器下的所有任務(wù)信息。
[0064] 對于采集任務(wù)存儲和分配包括:
[00化]第一,在采集管理節(jié)點(diǎn)啟動(dòng)、重啟或定時(shí)刷新時(shí),在采集管理節(jié)點(diǎn)2都會發(fā)生監(jiān)控 采集任務(wù)的重新組建,然后根據(jù)監(jiān)控采集任務(wù)中的采集服務(wù)器信息將此監(jiān)控采集任務(wù)下發(fā) 到對應(yīng)的采集服務(wù)器。
[0066] 第二,在采集服務(wù)器啟動(dòng)時(shí)向采集管理節(jié)點(diǎn)注冊自身信息,采集管理節(jié)點(diǎn)都會去 采集管理節(jié)點(diǎn)數(shù)據(jù)庫中查詢該個(gè)采集服務(wù)器是否有任務(wù)需要執(zhí)行,如果查詢結(jié)果不為空就 把任務(wù)信息更新給該個(gè)采集服務(wù)器,如果為空則什么也不做。
[0067] 系統(tǒng)中所有采集服務(wù)器信息管理和服務(wù)狀態(tài)管理:
[00側(cè)如圖4所示,所述采集服務(wù)器3采用集中式管理,每個(gè)采集服務(wù)器(Col lectServe;r)3啟動(dòng)時(shí)向采集管理節(jié)點(diǎn)(Col lectManager)2注冊自身信息,采集管理節(jié)點(diǎn)2 根據(jù)獲得采集服務(wù)器注冊信息更新管理節(jié)點(diǎn)數(shù)據(jù)庫4,所述采集管理節(jié)點(diǎn)2更新管理節(jié)點(diǎn) 數(shù)據(jù)庫4具體為;更新管理節(jié)點(diǎn)數(shù)據(jù)庫4中采集服務(wù)器信息,查詢管理節(jié)點(diǎn)數(shù)據(jù)庫4中對應(yīng) 此采集服務(wù)器3是否存在相應(yīng)的采集任務(wù),如果查詢結(jié)果不為空則更新該采集服務(wù)器的采 集任務(wù)列表。
[0069] 如圖5所示,采集管理節(jié)點(diǎn)2定時(shí)向所有采集服務(wù)器3發(fā)送消息,監(jiān)控采集服務(wù)器 的服務(wù)狀態(tài),將采集服務(wù)器的狀態(tài)信息和相應(yīng)時(shí)間存儲入管理節(jié)點(diǎn)數(shù)據(jù)庫。
[0070] 采集任務(wù)調(diào)度:
[0071] 如圖6所示,所述采集服務(wù)器3監(jiān)控采集任務(wù)的調(diào)度,根據(jù)采集任務(wù)的類型W及采 集周期,查詢采集服務(wù)器自身維護(hù)的采集插件信息,調(diào)用采集插件的采集設(shè)備分配方法,采 集插件返回與被監(jiān)控設(shè)備相等個(gè)數(shù)的數(shù)據(jù)采集線程,采集服務(wù)器維護(hù)所述數(shù)據(jù)采集線程并 根據(jù)采集周期定時(shí)調(diào)用相應(yīng)的數(shù)據(jù)采集線程進(jìn)行數(shù)據(jù)采集,并將采集的數(shù)據(jù)返回給采集服 務(wù)器;采集服務(wù)器將采集的數(shù)據(jù)存儲在性能數(shù)據(jù)庫中。
[0072] 采集任務(wù)格式說明:
[0073] 采集任務(wù)字段;
[0074]
【權(quán)利要求】
1. 一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng),其特征在于,包括監(jiān)控對象數(shù)據(jù)庫、 一個(gè)采集管理節(jié)點(diǎn)、至少一個(gè)采集服務(wù)器、管理節(jié)點(diǎn)數(shù)據(jù)庫和性能數(shù)據(jù)庫; 所述監(jiān)控對象數(shù)據(jù)庫,其用于存儲目標(biāo)監(jiān)控對象的配置信息; 所述采集管理節(jié)點(diǎn),其用于根據(jù)目標(biāo)監(jiān)控設(shè)備信息組件采集任務(wù),將采集任務(wù)分配給 采集服務(wù)器,同時(shí)維護(hù)所有采集服務(wù)器的狀態(tài)和性能; 所述采集服務(wù)器,其用于監(jiān)控采集任務(wù)的調(diào)度,采集插件的管理以及對采集結(jié)果數(shù)據(jù) 的存儲; 所述管理節(jié)點(diǎn)數(shù)據(jù)庫,其用于存儲采集服務(wù)器的注冊信息及狀態(tài)信息; 所述性能數(shù)據(jù)庫,其用于存儲采集服務(wù)器采集的數(shù)據(jù)。
2. 根據(jù)權(quán)利要求1所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng),其特征在于, 所述采集管理節(jié)點(diǎn)啟動(dòng)時(shí)或者每隔一個(gè)定周期主動(dòng)從監(jiān)控對象數(shù)據(jù)庫中讀取所有設(shè)備配 置信息,根據(jù)獲取的所有設(shè)備配置信息組件相應(yīng)的采集任務(wù),將采集任務(wù)存儲到管理節(jié)點(diǎn) 數(shù)據(jù)庫。
3. 根據(jù)權(quán)利要求2所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng),其特征在于, 所述采集管理節(jié)點(diǎn)包括配置文件存儲模塊,其存儲有設(shè)備分配規(guī)則配置文件和預(yù)定義任務(wù) 配置文件。
4. 根據(jù)權(quán)利要求3所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng),其特征在于, 所述采集管理節(jié)點(diǎn)采用系統(tǒng)預(yù)定義方式或用戶自定義方式組件采集任務(wù); 所述系統(tǒng)預(yù)定義方式建立采集任務(wù)具體為:讀取采集設(shè)備分配規(guī)則配置文件和預(yù)定義 任務(wù)配置文件,獲取采集設(shè)備分配規(guī)則和預(yù)定義任務(wù),根據(jù)每一個(gè)預(yù)定義任務(wù)的設(shè)備類型 從監(jiān)控對象數(shù)據(jù)庫中獲取所有該設(shè)備類型的設(shè)備,用每一個(gè)設(shè)備與采集設(shè)備分配規(guī)則進(jìn)行 比對,獲得該設(shè)備對應(yīng)的采集服務(wù)器信息,得到采集服務(wù)器和被監(jiān)控設(shè)備的映射關(guān)系,根據(jù) 映射關(guān)系中采集服務(wù)器個(gè)數(shù)組建相應(yīng)個(gè)數(shù)的采集任務(wù),將采集任務(wù)加入待分配任務(wù)列表, 等待分配; 所述用戶自定義方式組建采集任務(wù)的具體實(shí)現(xiàn)為:用戶根據(jù)自身需求,通過預(yù)留接口 直接組建采集任務(wù),將采集任務(wù)加入待分配任務(wù)列表,等待分配。
5. 根據(jù)權(quán)利要求1所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng),其特征在于, 所述采集服務(wù)器采用集中式管理,每個(gè)采集服務(wù)器啟動(dòng)時(shí)向采集管理節(jié)點(diǎn)注冊自身信息, 采集管理節(jié)點(diǎn)根據(jù)獲得采集服務(wù)器注冊信息更新管理節(jié)點(diǎn)數(shù)據(jù)庫,所述采集管理節(jié)點(diǎn)更新 管理節(jié)點(diǎn)數(shù)據(jù)庫具體為:更新管理節(jié)點(diǎn)數(shù)據(jù)庫中采集服務(wù)器信息,查詢管理節(jié)點(diǎn)數(shù)據(jù)庫中 對應(yīng)此采集服務(wù)器是否存在相應(yīng)的采集任務(wù),如果查詢結(jié)果不為空則更新該采集服務(wù)器的 米集任務(wù)列表。
6. 根據(jù)權(quán)利要求1所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng),其特征在于, 采集服務(wù)器監(jiān)控采集任務(wù)的調(diào)度,根據(jù)采集任務(wù)的類型以及采集周期,查詢采集服務(wù)器自 身維護(hù)的采集插件信息,調(diào)用采集插件的采集設(shè)備分配方法,采集插件返回與被監(jiān)控設(shè)備 相等個(gè)數(shù)的數(shù)據(jù)采集線程,采集服務(wù)器維護(hù)所述數(shù)據(jù)采集線程并根據(jù)采集周期定時(shí)調(diào)用相 應(yīng)的數(shù)據(jù)采集線程進(jìn)行數(shù)據(jù)采集,并將采集的數(shù)據(jù)返回給采集服務(wù)器;采集服務(wù)器將采集 的數(shù)據(jù)存儲在性能數(shù)據(jù)庫中。
7. 根據(jù)權(quán)利要求1所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng),其特征在于, 所述采集管理節(jié)點(diǎn)定時(shí)向所有采集服務(wù)器發(fā)送消息,監(jiān)控采集服務(wù)器的服務(wù)狀態(tài),將采集 服務(wù)器的狀態(tài)信息和相應(yīng)時(shí)間存儲入管理節(jié)點(diǎn)數(shù)據(jù)庫。
8. 根據(jù)權(quán)利要求1所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng),其特征在于, 所述采集管理節(jié)點(diǎn)和各個(gè)采集服務(wù)器均配備有第三方進(jìn)程保護(hù)工具。
9. 根據(jù)權(quán)利要求8所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控系統(tǒng),其特征在于, 所述第三方進(jìn)程保護(hù)工具采用Superv i sord。
10. -種基于云平臺的分布式可擴(kuò)展資源監(jiān)控方法,其特征在于,包括如下步驟: 步驟1,采集管理節(jié)點(diǎn)獲取目標(biāo)監(jiān)控設(shè)備信息; 步驟2,根據(jù)目標(biāo)監(jiān)控設(shè)備信息組件采集任務(wù),將采集任務(wù)下發(fā)到采集服務(wù)器; 步驟3,采集服務(wù)器監(jiān)控采集任務(wù)的調(diào)度,采集插件的管理以及對采集結(jié)果數(shù)據(jù)的存 儲。
11. 根據(jù)權(quán)利要求10所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控方法,其特征在 于,步驟2中采用系統(tǒng)預(yù)定義方式或用戶自定義方式組件采集任務(wù); 所述系統(tǒng)預(yù)定義方式建立采集任務(wù)具體為:讀取采集設(shè)備分配規(guī)則配置文件和預(yù)定義 任務(wù)配置文件,獲取采集設(shè)備分配規(guī)則和預(yù)定義任務(wù),根據(jù)每一個(gè)預(yù)定義任務(wù)的設(shè)備類型 從監(jiān)控對象數(shù)據(jù)庫中獲取所有該設(shè)備類型的設(shè)備,用每一個(gè)設(shè)備與采集設(shè)備分配規(guī)則進(jìn)行 比對,獲得該設(shè)備對應(yīng)的采集服務(wù)器信息,得到采集服務(wù)器和被監(jiān)控設(shè)備的映射關(guān)系,根據(jù) 映射關(guān)系組件相應(yīng)個(gè)數(shù)的采集任務(wù),將采集任務(wù)加入待分配任務(wù)列表,等待分配; 所述用戶自定義方式組建采集任務(wù)的具體實(shí)現(xiàn)為:用戶根據(jù)自身需求,通過預(yù)留接口 直接組建采集任務(wù),將采集任務(wù)加入待分配任務(wù)列表,等待分配。
12. 根據(jù)權(quán)利要求10所述一種基于云平臺的分布式可擴(kuò)展資源監(jiān)控方法,其特征在 于,步驟3中采集服務(wù)器監(jiān)控采集任務(wù)的調(diào)度的具體步驟為:根據(jù)采集任務(wù)的類型以及采 集周期,查詢采集服務(wù)器自身維護(hù)的采集插件信息,調(diào)用采集插件的采集設(shè)備分配方法,采 集插件返回與被監(jiān)控設(shè)備相等個(gè)數(shù)的數(shù)據(jù)采集線程,采集服務(wù)器維護(hù)所述數(shù)據(jù)采集線程并 根據(jù)采集周期定時(shí)調(diào)用相應(yīng)的數(shù)據(jù)采集線程進(jìn)行數(shù)據(jù)采集,并將采集的數(shù)據(jù)返回給采集服 務(wù)器;采集服務(wù)器將采集的數(shù)據(jù)存儲在性能數(shù)據(jù)庫中。
【文檔編號】G06F17/30GK104486445SQ201410838425
【公開日】2015年4月1日 申請日期:2014年12月30日 優(yōu)先權(quán)日:2014年12月30日
【發(fā)明者】張行, 陳博 申請人:北京天云融創(chuàng)軟件技術(shù)有限公司