本發(fā)明涉及計(jì)算機(jī),涉及一種的異常事件定位方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、在互聯(lián)網(wǎng)平臺的日常開發(fā)和維護(hù)工作中,需實(shí)時(shí)監(jiān)控平臺中各種線上指標(biāo)數(shù)據(jù),當(dāng)檢測到任一指標(biāo)數(shù)據(jù)出現(xiàn)異常時(shí),例如,應(yīng)用程序的崩潰次數(shù)過高或平臺訪問量驟降時(shí),需收集對應(yīng)的指標(biāo)數(shù)據(jù)進(jìn)行歸因分析,以快速定位出指標(biāo)數(shù)據(jù)出現(xiàn)異常的原因,進(jìn)而針對異常原因進(jìn)行優(yōu)化或修復(fù),以提升平臺用戶的平臺使用體驗(yàn),常規(guī)的方法是業(yè)務(wù)收到指標(biāo)異動的告警時(shí)通過人工方式跟異動的指標(biāo)相關(guān)的相關(guān)方都咨詢一遍,確定操作異常的相關(guān)方并人工分析定位異常原因,不僅作業(yè)繁瑣、費(fèi)時(shí),而且容易出錯。
技術(shù)實(shí)現(xiàn)思路
1、鑒于以上內(nèi)容,有必要提供一種的異常事件定位方法,其主要目的在于當(dāng)檢測到異常業(yè)務(wù)指標(biāo)數(shù)據(jù)時(shí),通過快速排查后驗(yàn)概率大的操作事件,從而提高定位異常事件的效率。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供一種異常事件定位方法,其特征在于,所述方法包括:
3、當(dāng)檢測到預(yù)設(shè)業(yè)務(wù)系統(tǒng)具有異常業(yè)務(wù)指標(biāo)數(shù)據(jù)時(shí),獲取所述預(yù)設(shè)業(yè)務(wù)系統(tǒng)在預(yù)設(shè)時(shí)間內(nèi)的第一操作事件集;
4、從預(yù)設(shè)數(shù)據(jù)庫中獲取第一操作事件集中每個操作事件的條件概率和先驗(yàn)概率,根據(jù)所述條件概率和先驗(yàn)概率依次計(jì)算所述第一操作事件集中每個操作事件的后驗(yàn)概率;
5、若有操作事件的后驗(yàn)概率大于或等于預(yù)設(shè)閾值,則生成對應(yīng)操作事件的第一排查結(jié)果,并將該第一排查結(jié)果發(fā)送給預(yù)先確定的電子設(shè)備;
6、若有操作事件的后驗(yàn)概率小于預(yù)設(shè)閾值,則按照預(yù)設(shè)的排列順序?qū)λ龅谝徊僮魇录兴泻篁?yàn)概率小于預(yù)設(shè)閾值的操作事件進(jìn)行篩查排序,并根據(jù)篩查排序結(jié)果生成第二排查結(jié)果,并將該第二次排查結(jié)果發(fā)送給預(yù)先確定的電子設(shè)備。
7、可選地,所述異常業(yè)務(wù)指標(biāo)數(shù)據(jù)的檢測,包括:
8、從預(yù)設(shè)數(shù)據(jù)庫中獲取歷史業(yè)務(wù)指標(biāo)數(shù)據(jù)的均值和方差;
9、根據(jù)所述歷史業(yè)務(wù)指標(biāo)數(shù)據(jù)的均值和方差計(jì)算出正常業(yè)務(wù)指標(biāo)數(shù)據(jù)的標(biāo)準(zhǔn)業(yè)務(wù)值區(qū)間;
10、獲取待檢測業(yè)務(wù)指標(biāo)數(shù)據(jù)的第一業(yè)務(wù)值,判斷所述第一業(yè)務(wù)值是否處于所述標(biāo)準(zhǔn)業(yè)務(wù)值區(qū)間內(nèi);
11、若所述第一業(yè)務(wù)值不處于所述標(biāo)準(zhǔn)業(yè)務(wù)值區(qū)間內(nèi),則判斷所述待檢測業(yè)務(wù)指標(biāo)數(shù)據(jù)為異常業(yè)務(wù)指標(biāo)數(shù)據(jù)。
12、可選地,所述獲取所述預(yù)設(shè)業(yè)務(wù)系統(tǒng)在預(yù)設(shè)時(shí)間內(nèi)的第一操作事件集,包括:
13、判斷所述異常業(yè)務(wù)指標(biāo)數(shù)據(jù)為離線指標(biāo)數(shù)據(jù)或?qū)崟r(shí)指標(biāo)數(shù)據(jù);
14、若為離線指標(biāo)數(shù)據(jù),則獲取所述預(yù)設(shè)業(yè)務(wù)系統(tǒng)在離線時(shí)間內(nèi)發(fā)生的所有操作事件,作為所述第一操作事件集;
15、若為實(shí)時(shí)指標(biāo)數(shù)據(jù),則獲取所述異常業(yè)務(wù)指標(biāo)數(shù)據(jù)對應(yīng)的時(shí)間點(diǎn)之前預(yù)設(shè)時(shí)間內(nèi)發(fā)生的所有操作事件,作為所述第一操作事件集。
16、可選地,所述生成對應(yīng)操作事件的第一排查結(jié)果,包括:
17、依次對所述第一操作事件集中后驗(yàn)概率大于或等于預(yù)設(shè)閾值的操作事件進(jìn)行排查,并將排查結(jié)果存儲至預(yù)設(shè)的消息隊(duì)列中;
18、合并所述消息隊(duì)列中所有操作事件的排查結(jié)果,得到所述第一排查結(jié)果。
19、可選地,所述第一操作事件集中每個操作事件對應(yīng)的先驗(yàn)概率和條件概率,按照如下步驟得到:
20、獲取所述預(yù)設(shè)系統(tǒng)的歷史操作事件集和歷史業(yè)務(wù)指標(biāo)數(shù)據(jù)集;
21、根據(jù)所述歷史業(yè)務(wù)指標(biāo)數(shù)據(jù)集計(jì)算所述歷史操作事件集中每個操作事件的先驗(yàn)概率和條件概率,并將計(jì)算的每個操作事件的先驗(yàn)概率和條件概率保存到所述預(yù)設(shè)數(shù)據(jù)庫中,所述歷史操作事件集包含第一操作事件集中的所有事件。
22、可選地,所述后驗(yàn)概率的計(jì)算公式為:
23、p(a,b)=p(b,a)*p(a)/p(b)
24、p(b)=p(b,a)*p(a)+p(b,a`)*p(a`)
25、其中,p(a,b)表示出現(xiàn)異常業(yè)務(wù)指標(biāo)數(shù)據(jù)b時(shí),第一操作事件a(所述第一操作事件是指第一操作事件集中的操作事件)發(fā)生的后驗(yàn)概率,p(a)指所述第一操作事件a發(fā)生的先驗(yàn)概率;p(a`)指所述第一操作事件a不發(fā)生的先驗(yàn)概率,p(b)指出現(xiàn)異常業(yè)務(wù)指標(biāo)數(shù)據(jù)b的概率;p(b,a)指所述第一操作事件a發(fā)生的情況下,出現(xiàn)異常業(yè)務(wù)指標(biāo)數(shù)據(jù)b的條件概率;p(b,a`)指所述第一操作事件a未發(fā)生的情況下,出現(xiàn)異常業(yè)務(wù)指標(biāo)數(shù)據(jù)b的條件概率。
26、可選地,所述按照預(yù)設(shè)的排列順序?qū)λ霾僮魇录M(jìn)行篩查排序指按照后驗(yàn)概率的高低對所述操作事件進(jìn)行篩查排序。
27、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種異常事件定位裝置,所述裝置包括:
28、檢測模塊:用于當(dāng)檢測到預(yù)設(shè)業(yè)務(wù)系統(tǒng)具有異常業(yè)務(wù)指標(biāo)數(shù)據(jù)時(shí),獲取所述預(yù)設(shè)業(yè)務(wù)系統(tǒng)在預(yù)設(shè)時(shí)間內(nèi)的第一操作事件集;
29、計(jì)算模塊:用于從預(yù)設(shè)數(shù)據(jù)庫中獲取第一操作事件集中每個操作事件的條件概率和先驗(yàn)概率,根據(jù)所述條件概率和先驗(yàn)概率依次計(jì)算所述第一操作事件集中每個操作事件的后驗(yàn)概率;
30、第一排查模塊:用于若有操作事件的后驗(yàn)概率大于或等于預(yù)設(shè)閾值,則生成對應(yīng)操作事件的第一排查結(jié)果,并將該第一排查結(jié)果發(fā)送給預(yù)先確定的電子設(shè)備;
31、第二排查模塊:用于若有操作事件的后驗(yàn)概率小于預(yù)設(shè)閾值,則按照預(yù)設(shè)的排列順序?qū)λ龅谝徊僮魇录兴泻篁?yàn)概率小于預(yù)設(shè)閾值的操作事件進(jìn)行篩查排序,并根據(jù)篩查排序結(jié)果生成第二排查結(jié)果,并將該第二次排查結(jié)果發(fā)送給預(yù)先確定的電子設(shè)備。
32、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種電子設(shè)備,所述電子設(shè)備包括:
33、存儲器,存儲至少一個計(jì)算機(jī)程序;及
34、處理器,執(zhí)行所述存儲器中存儲的程序以實(shí)現(xiàn)上述所述的異常事件定位方法。
35、此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種計(jì)算機(jī)可讀存儲介質(zhì),所述計(jì)算機(jī)可讀存儲介質(zhì)中存儲有至少一個計(jì)算機(jī)程序,所述至少一個計(jì)算機(jī)程序被電子設(shè)備中的處理器執(zhí)行以實(shí)現(xiàn)上述所述的異常事件定位方法。
36、基于本發(fā)明提供的上述方案,當(dāng)檢測到預(yù)設(shè)業(yè)務(wù)系統(tǒng)具有異常業(yè)務(wù)指標(biāo)數(shù)據(jù)時(shí),獲取所述預(yù)設(shè)業(yè)務(wù)系統(tǒng)出現(xiàn)異常業(yè)務(wù)指標(biāo)數(shù)據(jù)的預(yù)設(shè)時(shí)間內(nèi)發(fā)生的第一操作事件集,根據(jù)事先計(jì)算好并存儲在預(yù)設(shè)數(shù)據(jù)庫中所有操作事件的先驗(yàn)概率和條件概率,依次計(jì)算所述第一操作事件集中每個操作事件的后驗(yàn)概率,從而提高計(jì)算所有操作事件的后驗(yàn)概率的效率,若有操作事件的后驗(yàn)概率大于或等于預(yù)設(shè)閾值,則說明該操作事件是導(dǎo)致出現(xiàn)異常業(yè)務(wù)指標(biāo)數(shù)據(jù)的概率較大,因此,優(yōu)先對該操作事件進(jìn)行排查;對后驗(yàn)概率小于預(yù)設(shè)閾值的操作事件,則按照預(yù)設(shè)的排列順序?qū)Φ谝徊僮魇录兴泻篁?yàn)概率小于預(yù)設(shè)閾值的操作事件進(jìn)行篩查排序,并根據(jù)篩查排序結(jié)果生成第二排查結(jié)果,本發(fā)明通過對后驗(yàn)概率較大的操作事件進(jìn)行優(yōu)先排查,后驗(yàn)概率較小的操作事件進(jìn)行排序的方法,能夠快速排查導(dǎo)致異常業(yè)務(wù)指標(biāo)數(shù)據(jù)的原因,從而提高異常事件定位的效率。
1.一種異常事件定位方法,其特征在于,所述方法包括:
2.如權(quán)利要求1所述的異常事件定位方法,其特征在于,所述異常業(yè)務(wù)指標(biāo)數(shù)據(jù)的檢測,包括:
3.如權(quán)利要求1所述的異常事件定位方法,其特征在于,所述獲取所述預(yù)設(shè)業(yè)務(wù)系統(tǒng)在預(yù)設(shè)時(shí)間內(nèi)的第一操作事件集,包括:
4.如權(quán)利要求1所述的異常事件定位方法,其特征在于,所述生成對應(yīng)操作事件的第一排查結(jié)果,包括:
5.如權(quán)利要求4所述的異常事件定位方法,其特征在于,所述第一操作事件集中每個操作事件對應(yīng)的先驗(yàn)概率和條件概率,按照如下步驟得到:
6.如權(quán)利要求1所述的異常事件定位方法,其特征在于,所述后驗(yàn)概率的計(jì)算公式為:
7.如權(quán)利要求1所述的異常事件定位方法,其特征在于,所述按照預(yù)設(shè)的排列順序?qū)λ霾僮魇录M(jìn)行篩查排序指按照后驗(yàn)概率的高低對所述操作事件進(jìn)行篩查排序。
8.一種異常事件定位裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:
10.一種計(jì)算機(jī)可讀存儲介質(zhì),存儲有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任意一項(xiàng)所述的異常事件定位方法。