本發(fā)明屬于存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法,尤其涉及一種云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法及監(jiān)測(cè)系統(tǒng)。
背景技術(shù):
1、在云計(jì)算領(lǐng)域,針對(duì)存儲(chǔ)異常io的監(jiān)控是一個(gè)重要的研究方向,它涉及到業(yè)務(wù)中斷、eio(設(shè)備輸入/輸出錯(cuò)誤)以及時(shí)延過大等問題的檢測(cè)和處理。目前使用的存儲(chǔ)監(jiān)控主要包括以下幾類:(1)當(dāng)前性能監(jiān)控和管理:云計(jì)算監(jiān)控的關(guān)鍵用例之一是性能監(jiān)控和管理,目的是實(shí)時(shí)了解應(yīng)用程序和服務(wù)的性能表現(xiàn),及時(shí)發(fā)現(xiàn)和解決潛在的性能問題;(2)安全監(jiān)控:安全監(jiān)控可以幫助企業(yè)和組織監(jiān)控云計(jì)算環(huán)境的安全性,及時(shí)發(fā)現(xiàn)和應(yīng)對(duì)安全威脅,幫助解決與存儲(chǔ)相關(guān)的安全問題;(3)存儲(chǔ)空間監(jiān)控:云監(jiān)控服務(wù)能夠及時(shí)獲取存儲(chǔ)空間不足的實(shí)例信息,有助于避免因存儲(chǔ)空間不足導(dǎo)致的數(shù)據(jù)無法寫入和業(yè)務(wù)影響。
2、綜上所述,目前對(duì)于存儲(chǔ)業(yè)務(wù)的監(jiān)控,大多是針對(duì)正常情況下的業(yè)務(wù)性能和空間,但是對(duì)于存儲(chǔ)業(yè)務(wù)的異常情況,如io短暫跌0、發(fā)生eio或者時(shí)延過大等情況仍缺乏可靠有效的監(jiān)控手段,因而難以滿足用戶對(duì)存儲(chǔ)業(yè)務(wù)的多方位監(jiān)控需求。
技術(shù)實(shí)現(xiàn)思路
1、為了克服現(xiàn)有存儲(chǔ)監(jiān)控方法無法在存儲(chǔ)業(yè)務(wù)發(fā)生異常情況時(shí)對(duì)其進(jìn)行有效監(jiān)控的缺陷,本發(fā)明提出了一種新的云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法。通過本方法可以對(duì)塊存儲(chǔ)和文件存儲(chǔ)的業(yè)務(wù)異常進(jìn)行及時(shí)監(jiān)測(cè)和上報(bào)告警,使得故障能夠得到及時(shí)處理,有助于提升運(yùn)維效率。
2、本發(fā)明方法和系統(tǒng)的設(shè)計(jì)要點(diǎn)包括:
3、1.性能閾值設(shè)定與響應(yīng)機(jī)制:本發(fā)明涵蓋一種根據(jù)預(yù)設(shè)性能閾值(如內(nèi)存使用率超過60%)自動(dòng)觸發(fā)響應(yīng)措施(如內(nèi)存加壓)的系統(tǒng)和方法。
4、2.故障模擬與壓力測(cè)試:本發(fā)明包括使用特定工具(如stress)對(duì)云主機(jī)進(jìn)行內(nèi)存加壓,以模擬故障和進(jìn)行壓力測(cè)試的方法。
5、3.實(shí)時(shí)性能監(jiān)控與日志記錄:本發(fā)明包括一種實(shí)時(shí)監(jiān)控云主機(jī)性能并記錄測(cè)試結(jié)果的系統(tǒng),包括每1秒打印一次結(jié)果的機(jī)制,本發(fā)明系統(tǒng)對(duì)于業(yè)務(wù)的閃斷監(jiān)控尤其敏感,對(duì)于存儲(chǔ)業(yè)務(wù)連續(xù)性要求較高的業(yè)務(wù)比較友好。
6、4.超時(shí)時(shí)間設(shè)置與異常檢測(cè):本發(fā)明涵蓋一種設(shè)置業(yè)務(wù)最大時(shí)延并檢測(cè)時(shí)延超標(biāo)或異常(如業(yè)務(wù)跌0或err?io)的方法,本方法可以適用于多種存儲(chǔ)類型的監(jiān)控。
7、5.自動(dòng)化腳本執(zhí)行:本發(fā)明提供一種執(zhí)行自動(dòng)化腳本以進(jìn)行性能測(cè)試和監(jiān)控的方法,該腳本能夠根據(jù)預(yù)設(shè)參數(shù)(如超時(shí)時(shí)間)自動(dòng)調(diào)整行為。
8、具體地,本發(fā)明提供了一種云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法,如圖8所示,本方法包括下述步驟:
9、s1.在云平臺(tái)上創(chuàng)建云主機(jī)ecs,同時(shí)附帶創(chuàng)建一塊數(shù)據(jù)盤;
10、s2.在云平臺(tái)上針對(duì)步驟s1創(chuàng)建的云主機(jī)ecs創(chuàng)建告警規(guī)則;
11、s3.登錄步驟s1創(chuàng)建的云主機(jī)ecs并安裝相關(guān)組件,對(duì)塊存儲(chǔ)或文件存儲(chǔ)下發(fā)讀寫業(yè)務(wù),運(yùn)行vdbench腳本進(jìn)行存儲(chǔ)測(cè)試,并將vdbench運(yùn)行的結(jié)果文件替換到監(jiān)控腳本的vdbench_file參數(shù)中;
12、s4.設(shè)置業(yè)務(wù)最大時(shí)延,執(zhí)行監(jiān)控腳本并將業(yè)務(wù)最大時(shí)延設(shè)置為超時(shí)時(shí)延;
13、s5.持續(xù)監(jiān)控業(yè)務(wù)執(zhí)行過程,當(dāng)執(zhí)行業(yè)務(wù)的時(shí)延大于步驟s4設(shè)置的超時(shí)時(shí)延或出現(xiàn)其他錯(cuò)誤時(shí),腳本使用stress工具對(duì)告警規(guī)則監(jiān)控的指標(biāo)參數(shù)進(jìn)行修改實(shí)現(xiàn)故障模擬,進(jìn)而觸發(fā)步驟s2設(shè)置的告警規(guī)則。
14、進(jìn)一步地,本發(fā)明云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法步驟s2中所述的告警規(guī)則監(jiān)控的指標(biāo)包括但不限于:虛擬內(nèi)存使用率、cpu使用率、cpu平均負(fù)載;
15、所述監(jiān)控指標(biāo)的參數(shù)可通過stress工具進(jìn)行修改。
16、進(jìn)一步地,本發(fā)明云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法步驟s3中所述的相關(guān)組件包括但不限于:stress組件、bc計(jì)算器組件和監(jiān)控執(zhí)行腳本、vdbench工具、vdbench運(yùn)行腳本和vdbench配置文件。
17、進(jìn)一步地,本發(fā)明云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法步驟s3中所述的對(duì)塊存儲(chǔ)或文件存儲(chǔ)下發(fā)讀寫業(yè)務(wù),下發(fā)的讀寫業(yè)務(wù)需保證vdbench每1秒打印一次結(jié)果。
18、可選地,本發(fā)明云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法步驟s3中所述的對(duì)塊存儲(chǔ)或文件存儲(chǔ)下發(fā)讀寫業(yè)務(wù),下發(fā)的讀寫業(yè)務(wù)需保證vdbench每2秒或每5秒打印一次結(jié)果。
19、進(jìn)一步地,本發(fā)明云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法步驟s5中所述的其他錯(cuò)誤包括但不限于:io業(yè)務(wù)跌0、err?io。
20、優(yōu)選地,本發(fā)明云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法步驟s5中所述的腳本使用stress工具對(duì)告警規(guī)則監(jiān)控的指標(biāo)參數(shù)進(jìn)行修改實(shí)現(xiàn)故障模擬,進(jìn)而觸發(fā)步驟s2設(shè)置的告警規(guī)則,當(dāng)告警規(guī)則監(jiān)控的指標(biāo)為虛擬內(nèi)存使用率時(shí),腳本使用stress工具對(duì)ecs進(jìn)行內(nèi)存加壓,使ecs內(nèi)存使用占比異常升高,進(jìn)而觸發(fā)虛擬內(nèi)存使用率告警規(guī)則。
21、另一方面,本發(fā)明還提供了一種云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)系統(tǒng),本監(jiān)測(cè)系統(tǒng)運(yùn)行時(shí)實(shí)現(xiàn)上述的云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法的步驟。
22、另外,本發(fā)明還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述的云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法的步驟。
23、綜上,本發(fā)明云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法具有以下優(yōu)點(diǎn):
24、(1)本方法集成了云計(jì)算資源管理、性能監(jiān)控、自動(dòng)化測(cè)試和告警系統(tǒng),提供了一種新的云資源性能管理和故障模擬解決方案。本方法通過自動(dòng)化測(cè)試和告警機(jī)制,可以更有效地監(jiān)控和使用云資源,確保了資源的高效利用。
25、(2)本方法通過模擬故障和性能瓶頸,可以提前發(fā)現(xiàn)并解決潛在問題,增強(qiáng)了系統(tǒng)的穩(wěn)定性和可靠性,且本方法在執(zhí)行過程中不會(huì)影響其他云資源的使用,只會(huì)對(duì)當(dāng)前云主機(jī)ecs造成影響,保障了云資源的獨(dú)立性和安全性。
26、(3)本方法中采用的自動(dòng)化監(jiān)控和告警流程減少了人工檢查和干預(yù),降低了人力成本,且自動(dòng)化監(jiān)控和告警系統(tǒng)可以快速響應(yīng)性能問題,及時(shí)采取措施,提升了響應(yīng)速度,減少了系統(tǒng)故障時(shí)間。
27、(4)本方法采用基于數(shù)據(jù)驅(qū)動(dòng)的決策,通過收集和分析性能數(shù)據(jù),可以基于實(shí)際數(shù)據(jù)做出更加合理的資源管理和擴(kuò)展決策。
1.一種云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法,其特征在于,步驟s2中所述的告警規(guī)則監(jiān)控的指標(biāo)包括:虛擬內(nèi)存使用率、cpu使用率、cpu平均負(fù)載;
3.根據(jù)權(quán)利要求1所述的云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法,其特征在于,步驟s3中所述的相關(guān)組件包括:stress組件、bc計(jì)算器組件和監(jiān)控執(zhí)行腳本、vdbench工具、vdbench運(yùn)行腳本和vdbench配置文件。
4.根據(jù)權(quán)利要求1所述的云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法,其特征在于,步驟s3中所述的對(duì)塊存儲(chǔ)或文件存儲(chǔ)下發(fā)讀寫業(yè)務(wù),下發(fā)的讀寫業(yè)務(wù)需保證vdbench每1秒打印一次結(jié)果。
5.根據(jù)權(quán)利要求1所述的云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法,其特征在于,步驟s3中所述的對(duì)塊存儲(chǔ)或文件存儲(chǔ)下發(fā)讀寫業(yè)務(wù),下發(fā)的讀寫業(yè)務(wù)需保證vdbench每2秒或每5秒打印一次結(jié)果。
6.根據(jù)權(quán)利要求1所述的云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法,其特征在于,步驟s5中所述的其他錯(cuò)誤包括:io業(yè)務(wù)跌0、err?io。
7.根據(jù)權(quán)利要求1所述的云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法,其特征在于,步驟s5中所述的腳本使用stress工具對(duì)告警規(guī)則監(jiān)控的指標(biāo)參數(shù)進(jìn)行修改實(shí)現(xiàn)故障模擬,進(jìn)而觸發(fā)步驟s2設(shè)置的告警規(guī)則,當(dāng)告警規(guī)則監(jiān)控的指標(biāo)為虛擬內(nèi)存使用率時(shí),腳本使用stress工具對(duì)ecs進(jìn)行內(nèi)存加壓,使ecs內(nèi)存使用占比異常升高,進(jìn)而觸發(fā)虛擬內(nèi)存使用率告警規(guī)則。
8.一種云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)系統(tǒng),其特征在于,所述監(jiān)測(cè)系統(tǒng)運(yùn)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7任一項(xiàng)所述的云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法的步驟。
9.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1-7任一項(xiàng)所述的云計(jì)算通用的塊存儲(chǔ)和文件存儲(chǔ)業(yè)務(wù)異常監(jiān)測(cè)方法的步驟。