專利名稱:一種用于監(jiān)控業(yè)務(wù)服務(wù)器的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及監(jiān)控領(lǐng)域,尤其涉及一種用于監(jiān)控業(yè)務(wù)服務(wù)器的方法和裝置。
背景技術(shù):
隨著企業(yè)規(guī)模的不斷壯大,越來越多的企業(yè)著手在更多的區(qū)域發(fā)展公司業(yè)務(wù),因此企業(yè)的網(wǎng)絡(luò)也就出現(xiàn)了跨區(qū)域分布的情況。這就需要設(shè)計(jì)的監(jiān)控系統(tǒng)能夠支持對(duì)跨區(qū)域網(wǎng)絡(luò)的統(tǒng)一監(jiān)控。然而傳統(tǒng)的監(jiān)控系統(tǒng)只專注于如何對(duì)設(shè)備做很好的監(jiān)控和展現(xiàn)而沒有對(duì)跨區(qū)域監(jiān)控做很好的設(shè)計(jì)或者沒有一個(gè)成形的架構(gòu)。這就導(dǎo)致對(duì)于傳統(tǒng)監(jiān)控系統(tǒng)來言,要支持對(duì)跨區(qū)域的統(tǒng)一監(jiān)控需要花費(fèi)很大的力氣來實(shí)現(xiàn),并且即使跨區(qū)域的統(tǒng)一監(jiān)控建立成功,需根據(jù)每個(gè)區(qū)域的變化情況逐一采取對(duì)應(yīng)的監(jiān)控指令進(jìn)行維護(hù),后期的維護(hù)成本也很聞。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種用于監(jiān)控業(yè)務(wù)服務(wù)器的方法和裝置,使得監(jiān)控系統(tǒng)對(duì)跨區(qū)域的支持變得簡單,同時(shí)也通過預(yù)測的方式自動(dòng)發(fā)送監(jiān)控指令,降低了監(jiān)控系統(tǒng)的維護(hù)成本。為達(dá)到上述目的,采用如下技術(shù)方案一種用于監(jiān)控業(yè)務(wù)服務(wù)器的方法,包括在預(yù)定的時(shí)間間隔時(shí),各區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件向所位于的業(yè)務(wù)服務(wù)器上的數(shù)據(jù)匯總組件發(fā)送業(yè)務(wù)監(jiān)控?cái)?shù)據(jù),由所述數(shù)據(jù)匯總組件將所接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)生成監(jiān)控信息;所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)以預(yù)定格式指示各區(qū)域中的業(yè)務(wù)數(shù)據(jù)和監(jiān)控點(diǎn)名稱;業(yè)務(wù)服務(wù)器將所生成的監(jiān)控信息發(fā)送到監(jiān)控服務(wù)器;所述監(jiān)控服務(wù)器存儲(chǔ)所接收的監(jiān)控信息,并按照統(tǒng)計(jì)時(shí)間間隔基于所存儲(chǔ)的監(jiān)控信息分級(jí)統(tǒng)計(jì),生成匯總數(shù)據(jù)進(jìn)行展現(xiàn)。優(yōu)選的,所述由所述數(shù)據(jù)匯總組件將所接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)生成監(jiān)控信息,包括所述數(shù)據(jù)匯總組件對(duì)接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)進(jìn)行分析;在不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的心跳信息數(shù)據(jù)的情況下,生成心跳信息數(shù)據(jù);在區(qū)域中不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,生成監(jiān)控點(diǎn)數(shù)據(jù);在區(qū)域中存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,更新監(jiān)控點(diǎn)數(shù)據(jù);當(dāng)達(dá)到預(yù)定時(shí)間間隔時(shí),基于所述心跳信息數(shù)據(jù)和所述監(jiān)控點(diǎn)數(shù)據(jù)生成所述監(jiān)控信息。優(yōu)選的,所生成的監(jiān)控信息包括監(jiān)控點(diǎn)信息、調(diào)用次數(shù)信息、響應(yīng)次數(shù)和響應(yīng)時(shí)間信息中的至少一個(gè)。優(yōu)選的,所述生成匯總數(shù)據(jù)后,將匯總數(shù)據(jù)發(fā)送至業(yè)務(wù)服務(wù)器中的控制組件,控制組件對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測,調(diào)用對(duì)應(yīng)的監(jiān)控指令發(fā)送至數(shù)據(jù)匯總組件,進(jìn)而對(duì)各區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件進(jìn)行控制。優(yōu)選的,所述控制組件對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測時(shí),將匯總數(shù)據(jù)在基于歷史記錄中的監(jiān)控?cái)?shù)據(jù)和監(jiān)控指令的建立的預(yù)測模型中進(jìn)行匹配,得到匯總數(shù)據(jù)對(duì)應(yīng)的監(jiān)控指令。本發(fā)明還公開了一種用于監(jiān)控業(yè)務(wù)服務(wù)器的裝置,包括采集模塊,用于在預(yù)定的時(shí)間間隔時(shí),各區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件向所位于的業(yè)務(wù)服務(wù)器上的數(shù)據(jù)匯總組件發(fā)送業(yè)務(wù)監(jiān)控?cái)?shù)據(jù),由所述數(shù)據(jù)匯總組件將所接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)生成監(jiān)控信息;所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)以預(yù)定格式指示各區(qū)域中的業(yè)務(wù)數(shù)據(jù)和監(jiān)控點(diǎn)名稱;通信模塊,用于使業(yè)務(wù)服務(wù)器將所生成的監(jiān)控信息發(fā)送到監(jiān)控服務(wù)器; 展現(xiàn)模塊,用于所述監(jiān)控服務(wù)器存儲(chǔ)所接收的監(jiān)控信息,并按照統(tǒng)計(jì)時(shí)間間隔基于所存儲(chǔ)的監(jiān)控信息分級(jí)統(tǒng)計(jì),生成匯總數(shù)據(jù)進(jìn)行展現(xiàn)。優(yōu)選的,所述采集模塊配置為對(duì)接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)進(jìn)行分析;在不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的心跳信息數(shù)據(jù)的情況下,生成心跳信息數(shù)據(jù);在區(qū)域中不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,生成監(jiān)控點(diǎn)數(shù)據(jù);在區(qū)域中存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,更新監(jiān)控點(diǎn)數(shù)據(jù);所述采集模塊進(jìn)一步配置為當(dāng)達(dá)到預(yù)定時(shí)間間隔時(shí),基于所述心跳信息數(shù)據(jù)和所述監(jiān)控點(diǎn)數(shù)據(jù)生成所述監(jiān)控信息。優(yōu)選的,所生成的監(jiān)控信息包括監(jiān)控點(diǎn)信息、調(diào)用次數(shù)信息、響應(yīng)次數(shù)和響應(yīng)時(shí)間信息中的至少一個(gè)。優(yōu)選的,所述裝置還包括,預(yù)測模塊,用于將匯總數(shù)據(jù)發(fā)送至業(yè)務(wù)服務(wù)器中的控制組件,控制組件對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測,調(diào)用對(duì)應(yīng)的監(jiān)控指令發(fā)送至數(shù)據(jù)匯總組件,進(jìn)而對(duì)各區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件進(jìn)行控制。優(yōu)選的,所述預(yù)測模塊對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測時(shí),將匯總數(shù)據(jù)在基于歷史記錄中的監(jiān)控?cái)?shù)據(jù)和監(jiān)控指令的建立的預(yù)測模型中進(jìn)行匹配,得到匯總數(shù)據(jù)對(duì)應(yīng)的監(jiān)控指令。本發(fā)明實(shí)施例提供的一種用于監(jiān)控業(yè)務(wù)服務(wù)器的方法和裝置,將監(jiān)控系統(tǒng)的各采集模組分別部署在各區(qū)域中統(tǒng)一進(jìn)行數(shù)據(jù)采集,并根據(jù)分級(jí)統(tǒng)計(jì)、匯總之后的監(jiān)控?cái)?shù)據(jù)進(jìn)行分析統(tǒng)計(jì),并通過對(duì)匯總數(shù)據(jù)自動(dòng)預(yù)測對(duì)應(yīng)的監(jiān)控指令,從而再次對(duì)各采集模組的監(jiān)控策略進(jìn)行調(diào)整,形成自適應(yīng)的監(jiān)控體系。
圖I為本發(fā)明提供的一種用于監(jiān)控業(yè)務(wù)服務(wù)器的方法的步驟流程圖;圖2為本發(fā)明提供的一種用于監(jiān)控業(yè)務(wù)服務(wù)器的裝置的結(jié)構(gòu)模塊圖。
具體實(shí)施例方式下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例一種用于監(jiān)控業(yè)務(wù)服務(wù)器的方法及裝置進(jìn)行詳細(xì)描述。隨著計(jì)算機(jī)的廣泛應(yīng)用,企業(yè)中需要對(duì)許多業(yè)務(wù)系統(tǒng)進(jìn)行監(jiān)控。然而,現(xiàn)在的監(jiān)控系統(tǒng)僅限于對(duì)硬件系統(tǒng)的監(jiān)控。在現(xiàn)實(shí)中,需要對(duì)業(yè)務(wù)處理功能或方法進(jìn)行監(jiān)控?,F(xiàn)在的分布式部署,不能保證每個(gè)業(yè)務(wù)都獨(dú)占一臺(tái)服務(wù)器,當(dāng)一個(gè)業(yè)務(wù)系統(tǒng)被部署到多個(gè)系統(tǒng)上時(shí),難免會(huì)受其它業(yè)務(wù)系統(tǒng)影響。在一些情況下,服務(wù)器可能需要監(jiān)控?cái)?shù)以百計(jì)的業(yè)務(wù)系統(tǒng),而一個(gè)業(yè)務(wù)系統(tǒng)可能有數(shù)十個(gè)業(yè)務(wù)處理功能或方法。對(duì)于如此之多的監(jiān)控內(nèi)容,需要一個(gè)好的內(nèi)容界定方法來區(qū)分不同的業(yè)務(wù)系統(tǒng)、業(yè)務(wù)功能、硬件系統(tǒng)等的監(jiān)控信息;并為監(jiān)控?cái)?shù)據(jù)的采集、存儲(chǔ)、實(shí)時(shí)分析、報(bào)告、報(bào)警的邏輯精簡提供數(shù)據(jù)基礎(chǔ)。本發(fā)明公開了一種用于監(jiān)控業(yè)務(wù)服務(wù)器的方法,如圖I所示,包括
步驟101 :在預(yù)定的時(shí)間間隔時(shí),各區(qū)域?qū)?yīng)的mysql數(shù)據(jù)采集組件向所位于的業(yè)務(wù)服務(wù)器上的數(shù)據(jù)匯總組件發(fā)送業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)以及采集組件自身的一些性能數(shù)據(jù),由mysql服務(wù)器的所述數(shù)據(jù)匯總組件將所接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)和采集組件自身數(shù)據(jù)生成監(jiān)控信息;所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)以預(yù)定格式指示各區(qū)域中的業(yè)務(wù)數(shù)據(jù)和監(jiān)控點(diǎn)名稱;所述由所述數(shù)據(jù)匯總組件將所接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)生成監(jiān)控信息,包括如下步驟步驟a :數(shù)據(jù)匯總組件對(duì)接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)進(jìn)行分析;業(yè)務(wù)服務(wù)器上的數(shù)據(jù)匯總組件接收到各區(qū)域上傳的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)后,對(duì)業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)按對(duì)應(yīng)的數(shù)據(jù)類型進(jìn)行統(tǒng)計(jì),并結(jié)合設(shè)定的閾值將統(tǒng)計(jì)結(jié)果擬合為性能曲線,從而分析各數(shù)據(jù)指標(biāo)的變化情況。如某區(qū)域數(shù)據(jù)采集組件上傳的響應(yīng)時(shí)間發(fā)生范圍過大,超過設(shè)定的閾值,則該區(qū)域?qū)?yīng)的鏈路故障的概率偏高,數(shù)據(jù)匯總組件觸發(fā)對(duì)應(yīng)的事件對(duì)該區(qū)域進(jìn)行提示。步驟b :在不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的心跳信息數(shù)據(jù)的情況下,生成心跳信息數(shù)據(jù);實(shí)際情況中,如果不存在對(duì)應(yīng)的心跳信息數(shù)據(jù),則說明心跳信息數(shù)據(jù)由于某種原因沒有發(fā)送,但該區(qū)域數(shù)據(jù)采集組件對(duì)應(yīng)的線程依然正常存在,則生成心跳信息數(shù)據(jù)。步驟c :在區(qū)域中不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,生成監(jiān)控點(diǎn)數(shù)據(jù);每個(gè)區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)一旦沒有生成,則生成監(jiān)控點(diǎn)數(shù)據(jù),并保存在區(qū)域?qū)?yīng)的子數(shù)據(jù)庫中。步驟d :在區(qū)域中存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,更新監(jiān)控點(diǎn)數(shù)據(jù);同理,每個(gè)區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)已經(jīng)生成時(shí),則該監(jiān)控點(diǎn)數(shù)據(jù)記錄的為上一時(shí)刻的區(qū)域狀態(tài),因此更新對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù),并保存在區(qū)域?qū)?yīng)的子數(shù)據(jù)庫中。步驟e :當(dāng)達(dá)到預(yù)定時(shí)間間隔時(shí),基于所述心跳信息數(shù)據(jù)和所述監(jiān)控點(diǎn)數(shù)據(jù)生成所述監(jiān)控信息。
當(dāng)各區(qū)域中的數(shù)據(jù)采集組件無法連接至業(yè)務(wù)服務(wù)器時(shí),數(shù)據(jù)采集組件可將監(jiān)控信息保存在各區(qū)域的子數(shù)據(jù)庫中,當(dāng)連接恢復(fù)正常后再把監(jiān)控?cái)?shù)據(jù)發(fā)送到業(yè)務(wù)服務(wù)器。優(yōu)選的,所生成的監(jiān)控信息包括監(jiān)控點(diǎn)信息、調(diào)用次數(shù)信息、響應(yīng)次數(shù)和響應(yīng)時(shí)間信息中的至少一個(gè)。步驟102 :業(yè)務(wù)服務(wù)器將所生成的監(jiān)控信息發(fā)送到監(jiān)控服務(wù)器;業(yè)務(wù)服務(wù)器采用同步的方式將監(jiān)控信息發(fā)送到監(jiān)控服務(wù)器,也可采用異步的方式,在設(shè)定的既定時(shí)間段內(nèi)將監(jiān)控信息發(fā)送到監(jiān)控服務(wù)器。步驟103 :監(jiān)控服務(wù)器存儲(chǔ)所接收的監(jiān)控信息,并基于監(jiān)控信息進(jìn)行業(yè)務(wù)處理,mysql服務(wù)器按照統(tǒng)計(jì)時(shí)間間隔基于所存儲(chǔ)的監(jiān)控信息分級(jí)統(tǒng)計(jì),生成匯總數(shù)據(jù)進(jìn)行展現(xiàn)。mysql服務(wù)器具體分級(jí)統(tǒng)計(jì)的匯總過程如下
I.監(jiān)控服務(wù)器啟動(dòng)時(shí),按不同的匯總粒度定時(shí)匯總?cè)蝿?wù),匯總粒度包括30分鐘匯總,I小時(shí)匯總,6小時(shí)匯總,I天匯總。2.每個(gè)粒度的匯總?cè)蝿?wù)從存儲(chǔ)的歷史監(jiān)控?cái)?shù)據(jù)中獲取該匯總?cè)蝿?wù)需要的監(jiān)控?cái)?shù)據(jù),然后通過預(yù)定義的匯總算法進(jìn)行監(jiān)控?cái)?shù)據(jù)的匯總。3.匯總的算法包括了對(duì)一段時(shí)間內(nèi)的數(shù)據(jù)求平均值,最大值,最小值等算法。4.監(jiān)控服務(wù)器對(duì)各個(gè)匯總?cè)蝿?wù)匯總后的匯總數(shù)據(jù)進(jìn)行存儲(chǔ),并提供給展現(xiàn)模塊進(jìn)行展現(xiàn)?;诜旨?jí)的思想進(jìn)行監(jiān)控信息的分級(jí)統(tǒng)計(jì),可使用戶按不同的時(shí)段查看監(jiān)控?cái)?shù)據(jù),從而判斷各區(qū)域?qū)?yīng)的工作狀態(tài),滿足了用戶的不同需要。本實(shí)施例中,基于監(jiān)控信息進(jìn)行業(yè)務(wù)處理時(shí),監(jiān)控設(shè)定的預(yù)警閾值,一旦匯總數(shù)據(jù)達(dá)到了預(yù)警閾值,則觸發(fā)郵件、短信等告警通知。具體過程如下I.監(jiān)控服務(wù)器啟動(dòng)用于進(jìn)行告警計(jì)算的告警模塊。2.用戶通過展現(xiàn)平臺(tái)將監(jiān)控信息的預(yù)警閾值發(fā)送到監(jiān)控服務(wù)器的告警模塊。預(yù)警閾值包括(I).用來界定監(jiān)控信息是否超過該預(yù)警閾值的計(jì)算符號(hào),如大于、小于、包含等符號(hào);(2).預(yù)警閾值的計(jì)算符號(hào)所需要的操作數(shù)。3.告警模塊用接收到監(jiān)控信息和設(shè)定的預(yù)警閾值進(jìn)行此對(duì)得出是否違反了預(yù)警閾值的結(jié)論。4.如果監(jiān)控信息超過了設(shè)定的預(yù)警閾值,則觸發(fā)郵件、短信等事件通知用戶。步驟104 mysql服務(wù)器將匯總數(shù)據(jù)發(fā)送至業(yè)務(wù)服務(wù)器中的控制組件,控制組件對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測,調(diào)用對(duì)應(yīng)的監(jiān)控指令發(fā)送至mysql服務(wù)器的數(shù)據(jù)匯總組件,進(jìn)而對(duì)各區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件進(jìn)行控制。所述控制組件對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測時(shí),包括對(duì)mysql采集組件自身性能情況的分析預(yù)測和監(jiān)控?cái)?shù)據(jù)走勢(shì)的分析預(yù)測。將匯總數(shù)據(jù)在基于歷史記錄中的監(jiān)控?cái)?shù)據(jù)和監(jiān)控指令的建立的預(yù)測模型中進(jìn)行匹配,得到匯總數(shù)據(jù)對(duì)應(yīng)的監(jiān)控指令。對(duì)mysql采集組件性能的分析預(yù)測是通過分析mysql采集組件的性能數(shù)據(jù)來預(yù)測組件未來一段時(shí)間是否會(huì)出現(xiàn)性能問題,并通過匯總組件對(duì)各區(qū)域的數(shù)據(jù)采集組件進(jìn)行控制,具體過程如下
I.接收到匯總的采集組件自身的性能數(shù)據(jù)形成原始監(jiān)控?cái)?shù)據(jù),原始監(jiān)控?cái)?shù)據(jù)中包括采集組件監(jiān)控的資源數(shù)量,CPU消耗情況,內(nèi)存占用消耗情況,進(jìn)程內(nèi)線程使用情況等信息;2.將原始監(jiān)控?cái)?shù)據(jù)進(jìn)行訓(xùn)練,將于通過對(duì)監(jiān)控資源的數(shù)量線程使用情況和造成的CPU、內(nèi)存消耗情況來推算出監(jiān)控資源的數(shù)量、線程情況與CPU、內(nèi)存消耗的此例,從而得到監(jiān)控資源對(duì)應(yīng)的預(yù)測模型;3.當(dāng)監(jiān)控資源的數(shù)量增加時(shí),根據(jù)預(yù)測模型預(yù)測采集組件增加的CPU、內(nèi)存消耗情況;4.如果預(yù)測到采集組件的CPU、內(nèi)存消耗情況超過了采集組件當(dāng)前分配的CPU、內(nèi)存。通過匯總組件發(fā)送的監(jiān)控指令來調(diào)整采集組件的CPU、內(nèi)存分配情況。預(yù)測模型建立時(shí),需要連續(xù)穩(wěn)定運(yùn)行一段時(shí)間,這樣可根據(jù)積累的原始監(jiān)控?cái)?shù)據(jù)進(jìn)行計(jì)算或訓(xùn)練。所述預(yù)測模型中,監(jiān)控資源的數(shù)量、使用的線程數(shù)分別對(duì)應(yīng)計(jì)算出的消耗負(fù)載(CPU、內(nèi)存)的平衡值。當(dāng)監(jiān)控資源的數(shù)量增加或使用的線程數(shù)變化的時(shí)候,根據(jù)預(yù)測模型中存儲(chǔ)出的平衡值,動(dòng)態(tài)調(diào)整消耗的負(fù)載(分配的CPU、內(nèi)存);或者根據(jù)當(dāng)前的消耗負(fù)載(cpu、內(nèi)存的實(shí)際消耗值)計(jì)算出的平衡值,來動(dòng)態(tài)調(diào)整使用的線程數(shù)和/或監(jiān)控資源的數(shù)量。對(duì)數(shù)據(jù)走勢(shì)的分析預(yù)測是基于采集到的歷史數(shù)據(jù)的分析總結(jié)出數(shù)據(jù)的規(guī)律以及走勢(shì),預(yù)測數(shù)據(jù)可能到某個(gè)時(shí)間點(diǎn)會(huì)超過設(shè)定的告警閾值,并將預(yù)測結(jié)果發(fā)送告警通知以便用戶可以及時(shí)處理,防患于未然。具體分析過程如下I.接收到匯總的監(jiān)控信息,通過對(duì)歷史時(shí)段范圍內(nèi)的監(jiān)控信息進(jìn)行統(tǒng)計(jì),得到原始監(jiān)控?cái)?shù)據(jù),對(duì)原始監(jiān)控?cái)?shù)據(jù)進(jìn)行分析,得到預(yù)測模型,根據(jù)預(yù)測模型分析推斷出監(jiān)控信息對(duì)應(yīng)的增長速率。下面以按周為周期的預(yù)測模型如下
時(shí)間第一周_______第二周___
__筒一周二周三周四周五周六周日周一周二周三 ...
0-1 點(diǎn) X11 X120 X130 X140 X150 X160 X170X210X220X230_ O
8-9 點(diǎn) X11 X128 X138 X148 X158 X168 X178X218X228X238__8______
23-24 點(diǎn) X1123 X122 X132 X142 X152 X162 X172X212X222X232___3__3_ 3 3 3 3333其中,Xl 10代表,第一個(gè)I代表是第一周,第二個(gè)I代表周一,第三個(gè)數(shù)O代表是O點(diǎn)的數(shù)據(jù),則XllO代表第一周周一 O點(diǎn)的匯總數(shù)據(jù)。X210代表,第二周周一 O點(diǎn)的匯總數(shù)據(jù),依次類推,則X2323代表第2周周三23點(diǎn)的匯總數(shù)據(jù)。當(dāng)系統(tǒng)獲取到了各個(gè)小時(shí)的原始監(jiān)控?cái)?shù)據(jù),則可對(duì)原始監(jiān)控?cái)?shù)據(jù)進(jìn)行多個(gè)角度的分析和預(yù)測,得到預(yù)測模型在某一實(shí)施例中,按照每周的相同時(shí)段的數(shù)據(jù)進(jìn)行分析,獲取每周一 8點(diǎn)的原始監(jiān)控?cái)?shù)據(jù)進(jìn)行比較,按照線性回歸預(yù)測方法進(jìn)行預(yù)測,在系統(tǒng)運(yùn)行平穩(wěn)并且業(yè)務(wù)相對(duì)固定的情況下,則可此較準(zhǔn)確的預(yù)測到下周一同一時(shí)間點(diǎn)的數(shù)據(jù)是什么,同理,可準(zhǔn)確預(yù)測下個(gè)月同一天的數(shù)據(jù)情況。2.根據(jù)預(yù)測模型對(duì)當(dāng)前采集到的原始監(jiān)控?cái)?shù)據(jù)按照一定的預(yù)測算法進(jìn)行預(yù)測,可較準(zhǔn)確推斷出下一個(gè)時(shí)間點(diǎn)監(jiān)控信息的值,以及何時(shí)監(jiān)控信息的值將超過設(shè)定的閾值;結(jié)合具體業(yè)務(wù)情況選對(duì)需要分析的原始監(jiān)控?cái)?shù)據(jù),有些業(yè)務(wù)是每月的最后幾天會(huì)很忙,有的業(yè)務(wù)是每周的周一會(huì)集中處理,結(jié)合這些業(yè)務(wù)特點(diǎn),選取對(duì)應(yīng)的數(shù)據(jù)源進(jìn)行分 析,可預(yù)估到下一次業(yè)務(wù)集中處理時(shí),預(yù)測模型即可推測出準(zhǔn)確的監(jiān)控信息。3.在臨近所述時(shí)間點(diǎn)時(shí),如果預(yù)測到的監(jiān)控?cái)?shù)據(jù)大于設(shè)定的閾值,則通過郵件、短信等方式觸發(fā)對(duì)應(yīng)的事件,將預(yù)測結(jié)果發(fā)送給用戶,提前通知用戶做好相應(yīng)的處理和準(zhǔn)備。如果某項(xiàng)業(yè)務(wù)是每周一上午8點(diǎn)集中處理,已經(jīng)連續(xù)兩周的周一 8點(diǎn),監(jiān)控?cái)?shù)據(jù)顯示系統(tǒng)負(fù)載穩(wěn)步增長,通過預(yù)測模型進(jìn)行線性回歸預(yù)測,下周一負(fù)載將創(chuàng)新高,則需要提前通知管理員,或者升級(jí)系統(tǒng),或者增加負(fù)載,提前預(yù)防下周一的負(fù)載高峰。同時(shí),如果負(fù)載連續(xù)增長,則從另外一個(gè)方面反映系統(tǒng)的負(fù)載出現(xiàn)問題或者系統(tǒng)容量不足,或者業(yè)務(wù)系統(tǒng)出現(xiàn)負(fù)載方面的問題,為提前診斷及預(yù)防提供了依據(jù)。同樣,對(duì)于業(yè)務(wù)月度某一天集中處理的業(yè)務(wù)亦然。本發(fā)明還公開了一種用于監(jiān)控業(yè)務(wù)服務(wù)器的裝置,如圖2所示,包括采集模塊201,用于在預(yù)定的時(shí)間間隔時(shí),各區(qū)域?qū)?yīng)的mysql數(shù)據(jù)采集組件向所位于的業(yè)務(wù)服務(wù)器上的數(shù)據(jù)匯總組件發(fā)送業(yè)務(wù)監(jiān)控?cái)?shù)據(jù),由mysql服務(wù)器的所述數(shù)據(jù)匯總組件將所接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)生成監(jiān)控信息;所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)以預(yù)定格式指示各區(qū)域中的業(yè)務(wù)數(shù)據(jù)和監(jiān)控點(diǎn)名稱;通信模塊202,用于使業(yè)務(wù)服務(wù)器將所生成的監(jiān)控信息發(fā)送到監(jiān)控服務(wù)器;展現(xiàn)模塊203,用于所述監(jiān)控服務(wù)器存儲(chǔ)所接收的監(jiān)控信息,并由mysql服務(wù)器按照統(tǒng)計(jì)時(shí)間間隔基于所存儲(chǔ)的監(jiān)控信息分級(jí)統(tǒng)計(jì),生成匯總數(shù)據(jù)進(jìn)行展現(xiàn)。優(yōu)選的,所述采集模塊配置為對(duì)接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)進(jìn)行分析;在不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的心跳信息數(shù)據(jù)的情況下,生成心跳信息數(shù)據(jù);在區(qū)域中不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,生成監(jiān)控點(diǎn)數(shù)據(jù);在區(qū)域中存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,更新監(jiān)控點(diǎn)數(shù)據(jù);所述采集模塊進(jìn)一步配置為當(dāng)達(dá)到預(yù)定時(shí)間間隔時(shí),基于所述心跳信息數(shù)據(jù)和所述監(jiān)控點(diǎn)數(shù)據(jù)生成所述監(jiān)控信息。優(yōu)選的,所生成的監(jiān)控信息包括監(jiān)控點(diǎn)信息、調(diào)用次數(shù)信息、響應(yīng)次數(shù)和響應(yīng)時(shí)間信息中的至少一個(gè)。優(yōu)選的,所述裝置還包括,預(yù)測模塊204,用于將匯總數(shù)據(jù)發(fā)送至業(yè)務(wù)服務(wù)器中的控制組件,控制組件對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測,調(diào)用對(duì)應(yīng)的監(jiān)控指令發(fā)送至數(shù)據(jù)匯總組件,進(jìn)而對(duì)各區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件進(jìn)行控制。優(yōu)選的,所述預(yù)測模塊對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測時(shí),將匯總數(shù)據(jù)在基于歷史記錄中的監(jiān)控?cái)?shù)據(jù)和監(jiān)控指令的建立的預(yù)測模型中進(jìn)行匹配,得到匯總數(shù)據(jù)對(duì)應(yīng)的監(jiān)控指令。本發(fā)明實(shí)施例提供的一種用于監(jiān)控業(yè)務(wù)服務(wù)器的方法和裝置,將監(jiān)控系統(tǒng)的各采集模組分別部署在各區(qū)域中統(tǒng)一進(jìn)行數(shù)據(jù)采集,并根據(jù)分級(jí)統(tǒng)計(jì)、匯總之后的監(jiān)控?cái)?shù)據(jù)進(jìn)行分析統(tǒng)計(jì),并通過對(duì)匯總數(shù)據(jù)自動(dòng)預(yù)測對(duì)應(yīng)的監(jiān)控指令,從而再次對(duì)各采集模組的監(jiān)控策略進(jìn)行調(diào)整,形成自適應(yīng)的監(jiān)控體系。以上所述,僅為本發(fā)明的具體實(shí)施方式
,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵 蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。
權(quán)利要求
1.一種用于監(jiān)控業(yè)務(wù)服務(wù)器的方法,其特征在于,包括 在預(yù)定的時(shí)間間隔時(shí),各區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件向所位于的業(yè)務(wù)服務(wù)器上的數(shù)據(jù)匯總組件發(fā)送業(yè)務(wù)監(jiān)控?cái)?shù)據(jù),由所述數(shù)據(jù)匯總組件將所接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)生成監(jiān)控信息;所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)以預(yù)定格式指示各區(qū)域中的業(yè)務(wù)數(shù)據(jù)和監(jiān)控點(diǎn)名稱; 業(yè)務(wù)服務(wù)器將所生成的監(jiān)控信息發(fā)送到監(jiān)控服務(wù)器; 所述監(jiān)控服務(wù)器存儲(chǔ)所接收的監(jiān)控信息,并按照統(tǒng)計(jì)時(shí)間間隔基于所存儲(chǔ)的監(jiān)控信息分級(jí)統(tǒng)計(jì),生成匯總數(shù)據(jù)進(jìn)行展現(xiàn)。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于所述由所述數(shù)據(jù)匯總組件將所接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)生成監(jiān)控信息,包括 所述數(shù)據(jù)匯總組件對(duì)接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)進(jìn)行分析; 在不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的心跳信息數(shù)據(jù)的情況下,生成心跳信息數(shù)據(jù); 在區(qū)域中不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,生成監(jiān)控點(diǎn)數(shù)據(jù); 在區(qū)域中存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,更新監(jiān)控點(diǎn)數(shù)據(jù); 當(dāng)達(dá)到預(yù)定時(shí)間間隔時(shí),基于所述心跳信息數(shù)據(jù)和所述監(jiān)控點(diǎn)數(shù)據(jù)生成所述監(jiān)控信息。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于所生成的監(jiān)控信息包括監(jiān)控點(diǎn)信息、調(diào)用次數(shù)信息、響應(yīng)次數(shù)和響應(yīng)時(shí)間信息中的至少一個(gè)。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于所述生成匯總數(shù)據(jù)后,將匯總數(shù)據(jù)發(fā)送至業(yè)務(wù)服務(wù)器中的控制組件,控制組件對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測,調(diào)用對(duì)應(yīng)的監(jiān)控指令發(fā)送至數(shù)據(jù)匯總組件,進(jìn)而對(duì)各區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件進(jìn)行控制。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于所述控制組件對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測時(shí),將匯總數(shù)據(jù)在基于歷史記錄中的監(jiān)控?cái)?shù)據(jù)和監(jiān)控指令的建立的預(yù)測模型中進(jìn)行匹配,得到匯總數(shù)據(jù)對(duì)應(yīng)的監(jiān)控指令。
6.一種用于監(jiān)控業(yè)務(wù)服務(wù)器的裝置,其特征在于,包括 采集模塊,用于在預(yù)定的時(shí)間間隔時(shí),各區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件向所位于的業(yè)務(wù)服務(wù)器上的數(shù)據(jù)匯總組件發(fā)送業(yè)務(wù)監(jiān)控?cái)?shù)據(jù),由所述數(shù)據(jù)匯總組件將所接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)生成監(jiān)控信息;所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)以預(yù)定格式指示各區(qū)域中的業(yè)務(wù)數(shù)據(jù)和監(jiān)控點(diǎn)名稱; 通信模塊,用于使業(yè)務(wù)服務(wù)器將所生成的監(jiān)控信息發(fā)送到監(jiān)控服務(wù)器; 展現(xiàn)模塊,用于所述監(jiān)控服務(wù)器存儲(chǔ)所接收的監(jiān)控信息,并按照統(tǒng)計(jì)時(shí)間間隔基于所存儲(chǔ)的監(jiān)控信息分級(jí)統(tǒng)計(jì),生成匯總數(shù)據(jù)進(jìn)行展現(xiàn)。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于所述采集模塊配置為對(duì)接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)進(jìn)行分析; 在不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的心跳信息數(shù)據(jù)的情況下,生成心跳信息數(shù)據(jù); 在區(qū)域中不存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,生成監(jiān)控點(diǎn)數(shù)據(jù); 在區(qū)域中存在與所述業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)相對(duì)應(yīng)的監(jiān)控點(diǎn)數(shù)據(jù)的情況下,更新監(jiān)控點(diǎn)數(shù)據(jù);所述采集模塊進(jìn)一步配置為當(dāng)達(dá)到預(yù)定時(shí)間間隔時(shí),基于所述心跳信息數(shù)據(jù)和所述監(jiān)控點(diǎn)數(shù)據(jù)生成所述監(jiān)控信息。
8.根據(jù)權(quán)利要求6所述的裝置,其特征在于所生成的監(jiān)控信息包括監(jiān)控點(diǎn)信息、調(diào)用次數(shù)信息、響應(yīng)次數(shù)和響應(yīng)時(shí)間信息中的至少一個(gè)。
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于所述裝置還包括,預(yù)測模塊,用于將匯總數(shù)據(jù)發(fā)送至業(yè)務(wù)服務(wù)器中的控制組件,控制組件對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測,調(diào)用對(duì)應(yīng)的監(jiān)控指令發(fā)送至數(shù)據(jù)匯總組件,進(jìn)而對(duì)各區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件進(jìn)行控制。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于所述預(yù)測模塊對(duì)匯總數(shù)據(jù)進(jìn)行分析預(yù)測時(shí),將匯總數(shù)據(jù)在基于歷史記錄中的監(jiān)控?cái)?shù)據(jù)和監(jiān)控指令的建立的預(yù)測模型中進(jìn)行匹配,得到匯總數(shù)據(jù)對(duì)應(yīng)的監(jiān)控指令。
全文摘要
本發(fā)明實(shí)施例公開了一種用于監(jiān)控業(yè)務(wù)服務(wù)器的方法和裝置,屬于監(jiān)控領(lǐng)域。方法包括各區(qū)域?qū)?yīng)的數(shù)據(jù)采集組件向所位于的業(yè)務(wù)服務(wù)器上的數(shù)據(jù)匯總組件發(fā)送業(yè)務(wù)監(jiān)控?cái)?shù)據(jù),由所述數(shù)據(jù)匯總組件將所接收的業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)生成監(jiān)控信息;業(yè)務(wù)服務(wù)器將所生成的監(jiān)控信息發(fā)送到監(jiān)控服務(wù)器;所述監(jiān)控服務(wù)器存儲(chǔ)所接收的監(jiān)控信息,并按照統(tǒng)計(jì)時(shí)間間隔基于所存儲(chǔ)的監(jiān)控信息分級(jí)統(tǒng)計(jì),生成匯總數(shù)據(jù)進(jìn)行展現(xiàn)。本發(fā)明將監(jiān)控系統(tǒng)的各采集模組分別部署在各區(qū)域中統(tǒng)一進(jìn)行數(shù)據(jù)采集,并根據(jù)分級(jí)統(tǒng)計(jì)、匯總之后的監(jiān)控?cái)?shù)據(jù)進(jìn)行分析統(tǒng)計(jì),并通過對(duì)匯總數(shù)據(jù)自動(dòng)預(yù)測對(duì)應(yīng)的監(jiān)控指令,從而再次對(duì)各采集模組的監(jiān)控策略進(jìn)行調(diào)整,形成自適應(yīng)的監(jiān)控體系。
文檔編號(hào)H04L12/26GK102882745SQ20121037126
公開日2013年1月16日 申請(qǐng)日期2012年9月29日 優(yōu)先權(quán)日2012年9月29日
發(fā)明者何宇 申請(qǐng)人:摩卡軟件(天津)有限公司