一種智能運維管理方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及運維管理領(lǐng)域,尤其涉及一種智能運維管理方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著信息化建設(shè)的深入發(fā)展,IT系統(tǒng)日益成為核心業(yè)務(wù)處理的關(guān)鍵基礎(chǔ)設(shè)施;為了保證網(wǎng)絡(luò)、服務(wù)器、數(shù)據(jù)庫等IT資源的正常運行,需要對其進(jìn)行維護(hù);當(dāng)系統(tǒng)出現(xiàn)異常時能夠及時產(chǎn)生告警并通知到運維人員,運維人員根據(jù)告警對異常進(jìn)行定位,診斷,并完成相應(yīng)的維護(hù)操作。
[0003]目前的運維管理方法是:一旦發(fā)現(xiàn)了指標(biāo)越界,基本的做法是記錄在案,指標(biāo)偏離正常值未必是運行故障的表現(xiàn),它大多數(shù)情況是代表了運行保障質(zhì)量的下降,我們可以通過事后人工統(tǒng)計這些越界的頻度、次數(shù),來了解問題的發(fā)生源、嚴(yán)重程度,進(jìn)行針對性處理。通過人工方式來分析問題往往效率低下,耗費了大量的時間,而且問題發(fā)現(xiàn)也不夠及時。
[0004]針對人工分析的弊端,我們提出“智能策略”的概念,設(shè)置智維規(guī)則時可以指定一旦指標(biāo)越界能關(guān)聯(lián)觸發(fā)的智能策略,該智能策略觸發(fā)后承擔(dān)了原來需要人工處理的所有事情,如數(shù)據(jù)分析統(tǒng)計等等,大大提高了管理效率、減輕了管理負(fù)擔(dān)。
【發(fā)明內(nèi)容】
[0005]鑒于目前運維管理領(lǐng)域存在的上述不足,本發(fā)明提供一種智能運維管理方法及系統(tǒng),能夠在異常時觸發(fā)處置策略來替代人工進(jìn)行處理,提高了運維管理效率。
[0006]為達(dá)到上述目的,本發(fā)明的實施例采用如下技術(shù)方案:
[0007]—種智能運維管理方法,所述智能運維管理方法包括以下步驟:
[0008]根據(jù)管理場景設(shè)置處置策略;
[0009]根據(jù)管理對象設(shè)置智維規(guī)則并關(guān)聯(lián)管理對象所在管理場景的處置策略;
[0010]根據(jù)智維規(guī)則對管理對象進(jìn)行指定指標(biāo)的采集和閾值對比判斷是否有越界;
[0011]若發(fā)現(xiàn)有越界則根據(jù)其關(guān)聯(lián)的處置策略進(jìn)行處理。
[0012]依照本發(fā)明的一個方面,所述根據(jù)場景設(shè)置處置策略的【具體實施方式】可為:首先篩選出需要設(shè)置處置策略的管理場景,然后根據(jù)管理場景中的管理對象分別設(shè)置不同的處置策略。
[0013]依照本發(fā)明的一個方面,所述根據(jù)管理對象設(shè)置智維規(guī)則時,需要根據(jù)管理對象的重要程度將管理對象分為不同的等級,再根據(jù)管理需求為不同等級的管理對象設(shè)置智維規(guī)則。
[0014]依照本發(fā)明的一個方面,所述智維規(guī)則包括以下要素:管理等級、管理對象類別、管理對象范圍、管理指標(biāo)、監(jiān)測密度和判斷標(biāo)準(zhǔn)。
[0015]依照本發(fā)明的一個方面,所述若發(fā)現(xiàn)有越界則根據(jù)其關(guān)聯(lián)的處置策略進(jìn)行處理的【具體實施方式】可為:若發(fā)現(xiàn)有越界,則對其所對應(yīng)的管理對象根據(jù)其關(guān)聯(lián)的處置策略進(jìn)行數(shù)據(jù)分析和聯(lián)動處置。
[0016]依照本發(fā)明的一個方面,所述智能運維管理方法還包括以下步驟:在根據(jù)關(guān)聯(lián)的處置策略進(jìn)行處理后提示用戶查看結(jié)果。
[0017]一種智能運維管理系統(tǒng),所述智能運維管理系統(tǒng)包括:
[0018]策略模塊,用于根據(jù)管理場景設(shè)置處置策略;
[0019]智維模塊,用于根據(jù)管理對象設(shè)置智維規(guī)則并關(guān)聯(lián)管理對象所在管理場景的處置策略;
[0020]采集判斷模塊,用于根據(jù)智維規(guī)則對管理對象進(jìn)行指定指標(biāo)的采集和閾值對比判斷是否有越界;
[0021]處理模塊,用于在發(fā)現(xiàn)有越界時根據(jù)其關(guān)聯(lián)的處置策略進(jìn)行處理。
[0022]依照本發(fā)明的一個方面,所述根據(jù)管理對象設(shè)置智維規(guī)則時,需要根據(jù)管理對象的重要程度將管理對象分為不同的等級,再根據(jù)管理需求為不同等級的管理對象設(shè)置智維規(guī)則。
[0023]依照本發(fā)明的一個方面,所述在發(fā)現(xiàn)有越界時根據(jù)其關(guān)聯(lián)的處置策略進(jìn)行處理的【具體實施方式】可為:若發(fā)現(xiàn)有越界,則對其所對應(yīng)的管理對象根據(jù)其關(guān)聯(lián)的處置策略進(jìn)行數(shù)據(jù)分析和聯(lián)動處置。
[0024]依照本發(fā)明的一個方面,所述智能運維管理系統(tǒng)還包括提示模塊,用于在根據(jù)關(guān)聯(lián)的處置策略進(jìn)行處理后提示用戶查看結(jié)果。
[0025]本發(fā)明實施的優(yōu)點:本發(fā)明所述的智能運維管理方法通過根據(jù)管理場景設(shè)置處置策略,為需要策略的管理場景設(shè)置處置策略;根據(jù)管理對象設(shè)置智維規(guī)則并關(guān)聯(lián)管理對象所在管理場景的處置策略,根據(jù)智維規(guī)則對管理對象進(jìn)行指定指標(biāo)的采集和閾值對比判斷是否有越界,將智維規(guī)則與處置策略關(guān)聯(lián)起來,再根據(jù)智維規(guī)則來進(jìn)行運維管理,并進(jìn)行采集與越界判斷;若發(fā)現(xiàn)有越界則根據(jù)其關(guān)聯(lián)的處置策略進(jìn)行處理,在為管理對象設(shè)置智維規(guī)則時可以指定一旦指標(biāo)越界能關(guān)聯(lián)觸發(fā)的處置策略,該處置策略觸發(fā)后承擔(dān)了原來需要人工處理的所有事情,大大提高了管理效率、減輕了管理負(fù)擔(dān)。
【附圖說明】
[0026]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0027]圖1為本發(fā)明所述的一種智能運維管理方法示意圖;
[0028]圖2為本發(fā)明所述的一種智能運維管理系統(tǒng)的結(jié)構(gòu)示意圖。
【具體實施方式】
[0029]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
[0030]如圖1所示,一種智能運維管理方法,所述智能運維管理方法包括以下步驟:
[0031]步驟S1:根據(jù)管理場景設(shè)置處置策略;
[0032]所述步驟SI根據(jù)管理場景設(shè)置處置策略的【具體實施方式】可為:首先篩選出需要設(shè)置處置策略的管理場景,然后根據(jù)管理場景中的管理對象分別設(shè)置不同的處置策略,如數(shù)據(jù)分析統(tǒng)計和問題查找并解決等等。
[0033]在實際應(yīng)用中,首先提煉出需要進(jìn)行智能運維管理的場景,將上述場景按照處置策略規(guī)范進(jìn)行開發(fā),然后將開發(fā)完成的處置策略加入到運維管理系統(tǒng)中。
[0034]步驟S2:根據(jù)管理對象設(shè)置智維規(guī)則并關(guān)聯(lián)管理對象所在管理場景的處置策略;
[0035]所述步驟S2根據(jù)管理對象設(shè)置智維規(guī)則并關(guān)聯(lián)管理對象所在管理場景的處置策略的【具體實施方式】可為:在為管理場景中的管理對象進(jìn)行智維規(guī)則設(shè)置時,需要關(guān)聯(lián)該管理隨想所在管理場景的處置策略。例如,用戶設(shè)置了某條智維規(guī)則:針對所有主機(jī)設(shè)置了針對“CPU使用率”指標(biāo)進(jìn)行監(jiān)控,則可將其關(guān)聯(lián)到“高負(fù)載進(jìn)程定位策略”的處置策略。
[0036]在實際應(yīng)用中,在根據(jù)管理對象設(shè)置智維規(guī)則時,可根據(jù)管理對象的重要程度將管理對象分為不同的等級,再根據(jù)管理需求為不同等級的管理對象設(shè)置智維規(guī)則。例如,用戶設(shè)置了某條智維規(guī)則:針對所有一級主機(jī)設(shè)置了針對“CPU使用率”指標(biāo)進(jìn)行監(jiān)控。
[0037]在實際應(yīng)用中,所述智維規(guī)則可包括以下要素:管理等級、管理對象類別、管理對象范圍、管理指標(biāo)、監(jiān)測密度和判斷標(biāo)準(zhǔn)。
[0038]在實際應(yīng)用中,所述管理等級具體可為:規(guī)則適用的管理對象的等級,可以按照管理重要性設(shè)置為不同的等級,如“一級”,“二級”等等,同一管理對象僅可指定一個等級。
[0039]在實際應(yīng)用中,所述管理對象類別具體可為:將具備相同特征的管理對象定義為一個類別,如“路由器”,“Windows”,“Oracle”等等,同一管理對象僅可指定一個類別。
[0040]在實際應(yīng)用中,所述管理對象范圍具體可為:針對管理對象類別,規(guī)則所適用的管理對象的范圍,所述范圍具體可以是某個網(wǎng)段,如“192.168.1.1-192.168.1.10”,也可以是某個類別下具體的某些管理對象。
[0041]在實際應(yīng)用中,所述管理指標(biāo)具體可為:監(jiān)測的管理對象范圍的指標(biāo),如“CPU使用率”,“磁盤使用率”等,僅可為每一個范圍的管理對象指定一個指標(biāo)。
[0042]在實際應(yīng)用中,所述監(jiān)測密度具體可為:監(jiān)測的頻度,如設(shè)置了監(jiān)測密度為“I分鐘”,那么就意味著如果指標(biāo)出現(xiàn)異常,最多I分鐘內(nèi)就可以被發(fā)現(xiàn)。
[0043]在實際應(yīng)用中,所述判斷標(biāo)準(zhǔn)具體可為:指標(biāo)異常(越界)的條件,如監(jiān)測“CPU使用率”指標(biāo),判斷標(biāo)準(zhǔn)可以設(shè)置為“大于90 % ”,也就是說當(dāng)CPU使用率大于90 %的條件下認(rèn)為這個管理對象的這個指標(biāo)可能出現(xiàn)了異常。
[0044]在實際應(yīng)用中,所述管理指標(biāo)、監(jiān)測密度和判斷標(biāo)準(zhǔn)可具體是根據(jù)管理等級、管理對象類別和管理對象范圍來進(jìn)行設(shè)置的。
[0045]步驟S3:根據(jù)智維規(guī)則對管理對象進(jìn)行指定指標(biāo)的采集和閾值對比判斷是否有越界;
[0046]所述步驟S3根據(jù)智維規(guī)則對管理對象進(jìn)行指定指標(biāo)的采集和閾值對比判斷是否有越界的【具體實施方式】可為:根據(jù)智維規(guī)則中的管理指標(biāo)來對管理對象進(jìn)行指定的管理指標(biāo)采集,然后根據(jù)采集結(jié)果及預(yù)設(shè)管