專利名稱:基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信網(wǎng)絡(luò)技術(shù),尤其涉及基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷方法及系 統(tǒng)。
背景技術(shù):
隨著網(wǎng)絡(luò)規(guī)模的不斷增大,相應(yīng)地,網(wǎng)絡(luò)中的告警數(shù)量也會不斷增多。核心網(wǎng)故障 可能發(fā)生在終端接入設(shè)備層、網(wǎng)絡(luò)傳輸層、核心控制層以及綜合業(yè)務(wù)層等,這些故障會引發(fā) 一系列告警,故障是產(chǎn)生告警的原因,告警是當檢測到錯誤或異常狀態(tài)時產(chǎn)生的特定類型 的通知,并不是所有告警都表明故障原因,所以需要對網(wǎng)絡(luò)中發(fā)生的告警事件進行關(guān)聯(lián)分 析,診斷產(chǎn)生故障的原因。核心網(wǎng)發(fā)生故障時,告警之間的關(guān)聯(lián),以及告警和故障之間的關(guān) 系是隱性的、不確定的。面對核心網(wǎng)中產(chǎn)生的大量告警信息,網(wǎng)絡(luò)管理員往往很難從中找 出故障的真正原因,從而快速實施故障修復(fù)和障礙排除,因此,對于故障管理來講,其難點 就在于故障診斷和定位。為了更好地解決故障診斷定位問題,需要對所接收的告警信息進 行分析和處理,以便能更好地完成故障管理的任務(wù)。故障診斷是網(wǎng)絡(luò)管理系統(tǒng)的一個重要 組成部分,故障診斷的智能化是故障管理追求的目標,也是保證復(fù)雜、高速的核心網(wǎng)高可靠 性、高適應(yīng)性的必然要求。因此,如何從海量的告警數(shù)據(jù)中發(fā)現(xiàn)核心網(wǎng)中的相關(guān)告警信息,幫助網(wǎng)絡(luò)管理人 員診斷網(wǎng)絡(luò)故障,是當前網(wǎng)絡(luò)故障管理所面臨的主要問題。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是解決網(wǎng)絡(luò)故障診斷系統(tǒng)快速診斷和定位核心網(wǎng)告 警的問題。為了解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是提供一種基于貝葉斯網(wǎng)絡(luò)的 核心網(wǎng)故障診斷方法,包括以下步驟從核心網(wǎng)的故障受理中心采集包含有告警信息和故障類型的原始數(shù)據(jù),將所述原 始數(shù)據(jù)分別映射為與告警信息和故障類型相對應(yīng)的正整數(shù)集合從而生成樣本數(shù)據(jù),將樣本 數(shù)據(jù)轉(zhuǎn)換為包含故障類型分類結(jié)果的多維正整數(shù)數(shù)組存儲到后備訓(xùn)練數(shù)據(jù)集中進行積累, 當后備訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)達到設(shè)定的閾值后放入訓(xùn)練數(shù)據(jù)集中;運用貝葉斯網(wǎng)絡(luò)算法對訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)進行計算,獲得故障類型與各組 告警信息之間的關(guān)聯(lián),構(gòu)建告警信息相對于故障類型按照一定概率關(guān)聯(lián)的圖形,該圖形經(jīng) 過多次迭代達到最優(yōu)從而獲得貝葉斯網(wǎng)絡(luò)分類器;從核心網(wǎng)的網(wǎng)絡(luò)管理系統(tǒng)采集含有告警信息的原始數(shù)據(jù),并預(yù)處理生成待診斷數(shù) 據(jù),將待診斷數(shù)據(jù)作為貝葉斯網(wǎng)絡(luò)分類器定位故障類型的輸入,經(jīng)貝葉斯網(wǎng)絡(luò)分類器計算 獲得告警信息對應(yīng)的故障類型。在上述方法,在構(gòu)建貝葉斯網(wǎng)絡(luò)分類器之前對訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)進行數(shù)據(jù) 優(yōu)化。
在上述方法中,如果環(huán)境發(fā)生變化對訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)進行數(shù)據(jù)優(yōu)化。在上述方法中,所述數(shù)據(jù)優(yōu)化包括以下步驟將訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)個數(shù)P劃分為N等份,N >= 2,然后從后備訓(xùn)練數(shù)據(jù) 集的樣本數(shù)據(jù)集合Q中按順序選擇最新的P/N條信息,再由貝葉斯網(wǎng)絡(luò)分類器通過N+1迭 交叉運算計算出每一等份的貢獻度,再用Q集合中選出的等份數(shù)據(jù)替換P集合中貢獻度最 低的等份數(shù)據(jù),所述N+1迭交叉運算是指,將N+1等份數(shù)據(jù)編號,然后依次選擇一等份數(shù)據(jù)作為被 驗證數(shù)據(jù),其余N等份數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)構(gòu)建貝葉斯網(wǎng)絡(luò)分類器,用分類器對被驗證的等 份數(shù)據(jù)做分類,再跟實際的分類結(jié)果比較,如果分類精度越低,表明被驗證這組數(shù)據(jù)和其它 N組數(shù)據(jù)關(guān)聯(lián)度越低,被驗證的這組數(shù)據(jù)對構(gòu)建分類器的貢獻度越低。在上述方法中,訓(xùn)練數(shù)據(jù)集的大小為每類故障50-100條。本發(fā)明還提供了一種基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷系統(tǒng),包括數(shù)據(jù)處理中心 和貝葉斯網(wǎng)絡(luò)分類器,所述數(shù)據(jù)處理中心包括數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊和訓(xùn)練數(shù)據(jù) 集,所述數(shù)據(jù)采集模塊從網(wǎng)絡(luò)管理系統(tǒng)采集含有告警信息的原始數(shù)據(jù),這些原始數(shù)據(jù)經(jīng)過 數(shù)據(jù)預(yù)處理模塊處理后生成待診斷數(shù)據(jù);從故障受理中心采集包含有告警信息和故障類型 的原始數(shù)據(jù),它們經(jīng)過數(shù)據(jù)預(yù)處理模塊處理后生成樣本數(shù)據(jù),所述樣本數(shù)據(jù)經(jīng)貝葉斯網(wǎng)絡(luò) 算法計算,獲得故障類型與各組告警信息之間的關(guān)聯(lián),構(gòu)建告警信息相對于故障類型按照 一定概率關(guān)聯(lián)的圖形,該圖形經(jīng)過多次迭代達到最優(yōu)從而獲得貝葉斯網(wǎng)絡(luò)分類器;所述待 診斷數(shù)據(jù)作為貝葉斯網(wǎng)絡(luò)分類器定位故障的輸入,經(jīng)貝葉斯網(wǎng)絡(luò)分類器計算獲得告警信息 對應(yīng)的故障類型。在上這系統(tǒng)中,所述數(shù)據(jù)處理中心還包括數(shù)據(jù)優(yōu)化模塊,所述數(shù)據(jù)優(yōu)化模塊對訓(xùn) 練數(shù)據(jù)集中的樣本數(shù)據(jù)進行數(shù)據(jù)優(yōu)化。本發(fā)明,利用貝葉斯網(wǎng)絡(luò)分類器構(gòu)建故障診斷系統(tǒng),實現(xiàn)了對錯綜復(fù)雜的核心網(wǎng) 故障進行智能化的系統(tǒng)診斷功能,提高了診斷的準確性和靈活性,并且該系統(tǒng)構(gòu)建于網(wǎng)絡(luò) 管理系統(tǒng)之上,易于實施,對核心網(wǎng)綜合信息處理具有廣泛的適應(yīng)性。
圖1是本發(fā)明提供的基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷系統(tǒng)的結(jié)構(gòu)框圖;圖2是數(shù)據(jù)處理中心結(jié)構(gòu)框圖;圖3是本發(fā)明提供的基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷方法中貝葉斯網(wǎng)絡(luò)分類 器的構(gòu)建流程圖;圖4是貝葉斯網(wǎng)絡(luò)分類器的應(yīng)用流程圖;圖5是簡化后的告警信息和故障類型之間的概率關(guān)系有向無環(huán)圖。
具體實施例方式故障診斷是數(shù)據(jù)挖掘中典型的分類問題,即通過采集告警信息來定位故障類型, 由于告警信息受多種因素的影響,具有不確定性,要弄清楚復(fù)雜因素之間的關(guān)系以及對結(jié) 果的影響是非常困難的,但是,受復(fù)雜因素影響的不確定數(shù)據(jù)一般是服從正態(tài)分布的,因 此,基于這種原理,本發(fā)明提出了一種基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷方法及系統(tǒng),通過一定量的樣本數(shù)據(jù)積累,構(gòu)建訓(xùn)練數(shù)據(jù)集,再通過貝葉斯網(wǎng)絡(luò)算法來構(gòu)建貝葉斯網(wǎng)絡(luò)分類 器,從而預(yù)測將來發(fā)生的告警信息所反映的故障類別。下面結(jié)合附圖對本發(fā)明作出詳細的說明。如圖1、圖2所示,本發(fā)明提供的基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷系統(tǒng)600是運 行在網(wǎng)絡(luò)管理系統(tǒng)500之上的應(yīng)用程序,該故障診斷系統(tǒng)600包括數(shù)據(jù)處理中心610和貝 葉斯網(wǎng)絡(luò)分類器620兩個組成部分。網(wǎng)絡(luò)管理系統(tǒng)500屬于現(xiàn)有技術(shù),通過運行支撐網(wǎng)200、 綜合業(yè)務(wù)系統(tǒng)400、核心控制系統(tǒng)300實現(xiàn)對接入設(shè)備群100的管理。數(shù)據(jù)處理中心610主要由數(shù)據(jù)采集模塊611、數(shù)據(jù)預(yù)處理模塊612、數(shù)據(jù)優(yōu)化模塊 616和訓(xùn)練數(shù)據(jù)集617四部分組成。數(shù)據(jù)采集模塊611采集兩方面的原始數(shù)據(jù),一是從網(wǎng)絡(luò)管理系統(tǒng)500采集含有告 警信息的原始數(shù)據(jù),這些原始數(shù)據(jù)經(jīng)過數(shù)據(jù)預(yù)處理模塊612處理后生成待診斷數(shù)據(jù)614;二 是從故障受理中心700采集包含有告警信息和故障類型的原始數(shù)據(jù),它們經(jīng)過數(shù)據(jù)預(yù)處理 模塊612處理后生成樣本數(shù)據(jù)613。告警信息可以抽象為一組離散的數(shù)據(jù),數(shù)據(jù)預(yù)處理模 塊612將所有的告警信息都映射為正整型數(shù)據(jù)并作為輸入數(shù)據(jù)存儲到多維數(shù)組中,將故障 類型也映射為正整型數(shù)據(jù)并作為輸出存儲到一維數(shù)組中。貝葉斯網(wǎng)絡(luò)分類器620由貝葉斯網(wǎng)絡(luò)算法模塊621、分類器622和故障診斷報表模 塊623組成。樣本數(shù)據(jù)613存儲到訓(xùn)練數(shù)據(jù)集617中作為基準數(shù)據(jù)供分類器622學(xué)習,經(jīng) 貝葉斯網(wǎng)絡(luò)算法模塊621的計算,獲得故障類型與各組告警信息之間的關(guān)聯(lián),構(gòu)建告警信 息相對于故障類型按照一定概率關(guān)聯(lián)的圖形,該圖形經(jīng)過多次迭代達到最優(yōu)從而獲得貝葉 斯網(wǎng)絡(luò)分類器620,待診斷數(shù)據(jù)614作為分類器622定位故障的輸入,經(jīng)貝葉斯網(wǎng)絡(luò)分類器 620計算獲得告警信息對應(yīng)的故障類型。為了清楚表述貝葉斯網(wǎng)絡(luò)分類器620的建立過程,特選7組典型樣本數(shù)據(jù)加以舉 例說明,當然7組數(shù)據(jù)量在實際應(yīng)用中是肯定不夠的,這里僅為示例性的說明。核心網(wǎng)告警定義Al. SIP注冊失敗告警,數(shù)據(jù)預(yù)處理后,產(chǎn)生為1/未產(chǎn)生為0A2.呼叫中斷告警,數(shù)據(jù)預(yù)處理后,產(chǎn)生為1/未產(chǎn)生為0A3.自動計費異常告警,數(shù)據(jù)預(yù)處理后,產(chǎn)生為1/未產(chǎn)生為0A4.網(wǎng)管配置代理失敗告警,數(shù)據(jù)預(yù)處理后,產(chǎn)生為1/未產(chǎn)生為0A5.計費進程中斷告警,數(shù)據(jù)預(yù)處理后,產(chǎn)生為1/未產(chǎn)生為0A6.數(shù)據(jù)審計完成通知,數(shù)據(jù)預(yù)處理后,產(chǎn)生為1/未產(chǎn)生為0A7. SIP鏈路中斷告警,數(shù)據(jù)預(yù)處理后,產(chǎn)生為1/未產(chǎn)生為0核心網(wǎng)故障定義El. SIP網(wǎng)關(guān)進程DOWN,數(shù)據(jù)預(yù)處理后映射為1E2. AGENT主進程DOWN,數(shù)據(jù)預(yù)處理后映射為2E3.網(wǎng)關(guān)插槽物理異常,數(shù)據(jù)預(yù)處理后映射為3E4.網(wǎng)關(guān)內(nèi)部邏輯異常,數(shù)據(jù)預(yù)處理后映射為4E5. M3UA異常,數(shù)據(jù)預(yù)處理后映射為5以A2呼叫中斷告警為例,告警信息與故障類型之間的關(guān)系如表1所示表1
對表1說明如下如第1組數(shù)據(jù),當同時發(fā)生AlSIP注冊失敗告警、A2呼叫中斷告警時,認為是因為 ElSIP網(wǎng)關(guān)進程DOWN故障。告警信息和故障類型之間是7維數(shù)組和1維數(shù)組的映射關(guān)系, 但映射關(guān)系并非固定的,或者說用戶自己也不確定哪些告警產(chǎn)生就一定是何故障,比如說 第1組和第6組數(shù)據(jù)既是如此,但當前發(fā)生的系列告警和某種故障之間又存在關(guān)聯(lián),這些隱 藏的關(guān)聯(lián)可以通過貝葉斯網(wǎng)絡(luò)621算法來發(fā)現(xiàn)并構(gòu)建分類器622。貝葉斯網(wǎng)絡(luò)分類器620是通過貝葉斯網(wǎng)絡(luò)算法進行構(gòu)建的,最終生成診斷報告。 在構(gòu)建分類器622之前,數(shù)據(jù)優(yōu)化模塊616從后備訓(xùn)練數(shù)據(jù)集615中選擇樣本數(shù)據(jù)613,完 成訓(xùn)練數(shù)據(jù)集617的初始化;在構(gòu)建分類器622之后,當分類準備度不高或者下降時,數(shù)據(jù) 優(yōu)化616模塊結(jié)合貝葉斯網(wǎng)絡(luò)621算法計算各樣本數(shù)據(jù)613的貢獻度來優(yōu)化訓(xùn)練數(shù)據(jù)集 617,從而達到優(yōu)化分類器622的目的。貝葉斯網(wǎng)絡(luò)分類器620是基于訓(xùn)練數(shù)據(jù)集617建立起來的,它是分類器622自學(xué) 習的知識庫,也就是說,訓(xùn)練數(shù)據(jù)集617直接關(guān)系到分類器622的準確度。訓(xùn)練數(shù)據(jù)集617 大小以每類故障50-100條為最佳,太小會影響到分類器622的分類精度;太大會影響到能 分類器622的性能;訓(xùn)練數(shù)據(jù)集617在應(yīng)用中不斷地更新,當出現(xiàn)新告警或者新故障類型 時,都需要即時更新訓(xùn)練數(shù)據(jù)集617。貝葉斯網(wǎng)絡(luò)算法基于統(tǒng)計中的貝葉斯定理,通過后驗概率來預(yù)測各種分類的概率 大小,概率最大的就是最可能的預(yù)測結(jié)果,依此類推。 貝葉斯網(wǎng)絡(luò)算法采用聯(lián)合概率分布發(fā)掘各變量之間的關(guān)聯(lián)度;
貝葉斯網(wǎng)絡(luò)算法通過對訓(xùn)練數(shù)據(jù)集合做循環(huán)推理,構(gòu)建起貝葉斯網(wǎng)絡(luò),這個網(wǎng)絡(luò) 是由各個變量之間的關(guān)聯(lián)度連接起來的。一組變量Ix1, χ2,χ3,…,χη},貝葉斯網(wǎng)絡(luò)算法可 計算出Xl、X2發(fā)生時Χ3、…、Xn發(fā)生的概率,或者是Χ3、Χ4同時發(fā)生時出現(xiàn)1的概率是多少等。貝葉斯網(wǎng)絡(luò)模型構(gòu)建的關(guān)鍵在于兩點⑴、構(gòu)建各變量之間的概率關(guān)系圖;⑵、 計算各變量之間概率大小。下面結(jié)合表1、表2和圖5來具體解釋。圖5是簡化后的告警和 故障之間的概率關(guān)系的有向無環(huán)圖,如圖5中Al和A3之間是條件獨立的,所以它們之間沒 有依賴關(guān)系,Α1、Α3是Α2的雙親節(jié)點,Al和A3告警同時產(chǎn)生時,出現(xiàn)Α2的概率是0. 95,只 產(chǎn)生A3告警時,出現(xiàn)Α2的概率是0.2,依次可以推出最終各種故障發(fā)生的概率各是多少,如 表2所示。 分類器622對告警信息做出分類,給出發(fā)生每類故障的概率,概率大小作為定位 故障的依據(jù);對于多個故障同時發(fā)生情況,告警信息隱含了這些故障原因,分類器622能夠 對多個故障做出區(qū)分,并分別給出發(fā)生的概率。分類器622具有自學(xué)習能力和很強的適應(yīng) 性,當環(huán)境發(fā)生改變,影響到定位故障準確率時,可以通過數(shù)據(jù)優(yōu)化616模塊,優(yōu)化分類器 622以適應(yīng)新的環(huán)境。分類器622提取少數(shù)幾組大概率的故障診斷結(jié)果,并按照概率大小生 成故障診斷報表623,報告給故障受理中心700。本發(fā)明提供的基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷方法,包括以下步驟Α10、構(gòu)建貝葉斯網(wǎng)絡(luò)分類器620。結(jié)合圖1、圖2和圖3所示,故障受理中心700將告警信息和故障類型提交給故障 診斷系統(tǒng)600,數(shù)據(jù)采集模塊611采集上述告警信息和故障類型,由于告警信息和故障類型 都是離散數(shù)據(jù),數(shù)據(jù)預(yù)處理模塊612將這些告警信息和故障類型分別映射為正整數(shù)集合并 生成樣本數(shù)據(jù)613,該樣本數(shù)據(jù)613轉(zhuǎn)換為包含故障類型分類結(jié)果的多維正整數(shù)數(shù)組存儲 到后備訓(xùn)練數(shù)據(jù)集615中。最初,訓(xùn)練數(shù)據(jù)集617是空的,分類器622還未構(gòu)建。當后備訓(xùn) 練數(shù)據(jù)集615中的樣本數(shù)據(jù)613達到設(shè)定的閾值后,閾值設(shè)定為20ΧΝ,Ν為故障類別數(shù)目, 數(shù)據(jù)優(yōu)化模塊616從后備訓(xùn)練數(shù)據(jù)集615中挑選樣本數(shù)據(jù)613到訓(xùn)練數(shù)據(jù)集617中,條件 是每類故障樣本數(shù)據(jù)613不少于20條可設(shè)置條且故障類別個數(shù)超過5種可設(shè)置種類,不滿 足條件的返回到后備訓(xùn)練數(shù)據(jù)集615中繼續(xù)積累。運用貝葉斯網(wǎng)絡(luò)621算法在訓(xùn)練數(shù)據(jù)集617上做運算,計算各組合變量之間的關(guān) 聯(lián),構(gòu)建這些變量按照一定概率關(guān)聯(lián)起來的圖形,這個圖形經(jīng)過多次迭代達到最優(yōu),即得到 了分類器622模型。
7
Al,A3Al,-A3-Al,A3 Al 廣A3
0.950.70.20.10.050.30.80.9
表2
A20、應(yīng)用貝葉斯網(wǎng)絡(luò)分類器620。再結(jié)合圖4所示,分類器622模型構(gòu)建起來后,即可對告警信息做分析、診斷故障, 步驟如下B10、網(wǎng)絡(luò)管理系統(tǒng)500監(jiān)測到上報的告警信息后,通知數(shù)據(jù)采集611模塊采集告 警數(shù)據(jù)并送到數(shù)據(jù)預(yù)處理模塊612中,生成待診斷數(shù)據(jù)614,該待診斷數(shù)據(jù)614為多維數(shù)組 格式;B20、將多維數(shù)組輸入到分類器622模型中,得到一維數(shù)組輸出,數(shù)組大小和故障 類別個數(shù)一致。一維數(shù)組中按順序存儲了設(shè)定故障類型發(fā)生的概率,然后按照概率大小,生 成故障診斷報表623,提交給故障受理中心700 ;B30、故障受理中心將報表生成工單,下發(fā)給工程人員,工程人員現(xiàn)場排除故障。故 障排除后,工程人員將信息反饋到故障受理中心700 ;B40、如果故障定位有誤,故障受理中心(700)將處理結(jié)果和最初診斷記錄一并提 交給故障診斷系統(tǒng)600,數(shù)據(jù)優(yōu)化616模塊將修正的信息轉(zhuǎn)存到后備訓(xùn)練數(shù)據(jù)集615中;A30、貝葉斯網(wǎng)絡(luò)分類器620的優(yōu)化。再參見圖3,分類器622模型建立后,并不代表著以后可以適應(yīng)一切,它還需要不 斷地優(yōu)化達到當前階段的最優(yōu)。初始化時,為了盡快創(chuàng)建分類器622模型,設(shè)定的條件一般 都不苛刻,也可以理解為此時創(chuàng)建的分類器622模型并未達到最優(yōu),需要在隨后的應(yīng)用中 累積樣本數(shù)據(jù)量,然后再做模型優(yōu)化。不僅樣本數(shù)據(jù)613量不足可能影響分類器622模型, 如果環(huán)境發(fā)生變化,以前的樣本數(shù)據(jù)613也并不能夠反映新的情況,所以還需要累積新環(huán) 境下的樣本數(shù)據(jù)613,并做模型優(yōu)化。優(yōu)化步驟數(shù)據(jù)優(yōu)化616模塊將數(shù)據(jù)訓(xùn)練集617中數(shù)據(jù)個數(shù)P劃分為N等份(N > =2),然后從后備訓(xùn)練數(shù)據(jù)集615的數(shù)據(jù)集合Q中按順序選擇最新的P/N條信息,再由貝葉 斯網(wǎng)絡(luò)分類器620通過N+1迭交叉運算(P/N個數(shù)據(jù)為一等份,原來P集合中的N等份+Q 集合中選出的一等份,即為N+1等份數(shù)據(jù),對N+1等份數(shù)據(jù)做交叉運算,即為N+1迭交叉運 算),計算出每一等份的貢獻度,再用Q集合中選出的等份數(shù)據(jù)替換P集合中貢獻度最低的 等份數(shù)據(jù),運行該方法還可對Q集合中次新信息做運算,這樣就可以保證P集合中始終是貢 獻度高的數(shù)據(jù)。N+1迭交叉運算是指,將N+1等份數(shù)據(jù)編號,然后依次選擇一等份數(shù)據(jù)作為被驗證 數(shù)據(jù),其余N等份數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)構(gòu)建貝葉斯網(wǎng)絡(luò)分類模型,然后用分類模型對被驗證 的等份數(shù)據(jù)做分類,再跟實際的分類結(jié)果比較,即可得到分類精度,如果分類精度越低,表 明被驗證這組數(shù)據(jù)和其它N組數(shù)據(jù)關(guān)聯(lián)度越低,反向也說明被驗證的這組對構(gòu)建分類模型 貢獻度越低。值得注意的是,數(shù)據(jù)優(yōu)化616可能會消耗大量的系統(tǒng)資源,一般是在系統(tǒng)負荷較 小的時間段進行。本發(fā)明比常規(guī)故障診斷工具有著明顯的優(yōu)勢(1)、智能化貝葉斯網(wǎng)絡(luò)分類器的理論基礎(chǔ)是數(shù)理統(tǒng)計中的貝葉斯定理,具備循 環(huán)推理能力,也就是自學(xué)習能力;貝葉斯網(wǎng)絡(luò)分類器能夠從樣本數(shù)據(jù)中推理各告警之間的 關(guān)聯(lián),以及這些告警和故障之間的概率關(guān)系,也就是說它可以從以往的經(jīng)驗數(shù)據(jù)中學(xué)習知 識,構(gòu)建模型,預(yù)測未來,充分體現(xiàn)了智能化。
(2)、系統(tǒng)性貝葉斯網(wǎng)絡(luò)分類器是基于數(shù)據(jù)挖掘的專家系統(tǒng),建立在網(wǎng)絡(luò)管理系 統(tǒng)之上,可對整個核心網(wǎng)的告警信息做綜合分析,體現(xiàn)出全局性和系統(tǒng)性;(3)、準確率高核心網(wǎng)告警信息具有較強的特定性,即特定的一些告警組合暗含 著特定的故障信息,貝葉斯網(wǎng)絡(luò)分類器處理這些告警信息時,準確率很高,通過以往經(jīng)驗, 可以達到95%以上;(4)、適應(yīng)性強貝葉斯網(wǎng)絡(luò)分類器可以通過優(yōu)化訓(xùn)練數(shù)據(jù)集,不斷地自學(xué)習來適 應(yīng)變化中的核心網(wǎng)環(huán)境。本發(fā)明不局限于上述最佳實施方式,任何人應(yīng)該得知在本發(fā)明的啟示下作出的結(jié) 構(gòu)變化,凡是與本發(fā)明具有相同或相近的技術(shù)方案,均落入本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷方法,其特征在于包括以下步驟從核心網(wǎng)的故障受理中心采集包含有告警信息和故障類型的原始數(shù)據(jù),將所述原始數(shù)據(jù)分別映射為與告警信息和故障類型相對應(yīng)的正整數(shù)集合從而生成樣本數(shù)據(jù),將樣本數(shù)據(jù)轉(zhuǎn)換為包含故障類型分類結(jié)果的多維正整數(shù)數(shù)組存儲到后備訓(xùn)練數(shù)據(jù)集中進行積累,當后備訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)達到設(shè)定的閾值后放入訓(xùn)練數(shù)據(jù)集中;運用貝葉斯網(wǎng)絡(luò)算法對訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)進行計算,獲得故障類型與各組告警信息之間的關(guān)聯(lián),構(gòu)建告警信息相對于故障類型按照一定概率關(guān)聯(lián)的圖形,該圖形經(jīng)過多次迭代達到最優(yōu)從而獲得貝葉斯網(wǎng)絡(luò)分類器;從核心網(wǎng)的網(wǎng)絡(luò)管理系統(tǒng)采集含有告警信息的原始數(shù)據(jù),并預(yù)處理生成待診斷數(shù)據(jù),將待診斷數(shù)據(jù)作為貝葉斯網(wǎng)絡(luò)分類器定位故障類型的輸入,經(jīng)貝葉斯網(wǎng)絡(luò)分類器計算獲得告警信息對應(yīng)的故障類型。
2.如權(quán)利要求1所述的基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷方法,其特征在于在構(gòu)建貝 葉斯網(wǎng)絡(luò)分類器之前對訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)進行數(shù)據(jù)優(yōu)化。
3.如權(quán)利要求1所述的基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷方法,其特征在于,如果環(huán) 境發(fā)生變化對訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)進行數(shù)據(jù)優(yōu)化。
4.如權(quán)利要求2或3所述的基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷方法,其特征在于所述 數(shù)據(jù)優(yōu)化包括以下步驟將訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)個數(shù)P劃分為N等份,N> = 2,然后從后備訓(xùn)練數(shù)據(jù)集的 樣本數(shù)據(jù)集合Q中按順序選擇最新的P/N條信息,再由貝葉斯網(wǎng)絡(luò)分類器通過N+1迭交叉 運算計算出每一等份的貢獻度,再用Q集合中選出的等份數(shù)據(jù)替換P集合中貢獻度最低的 等份數(shù)據(jù),所述N+1迭交叉運算是指,將N+1等份數(shù)據(jù)編號,然后依次選擇一等份數(shù)據(jù)作為被驗證 數(shù)據(jù),其余N等份數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)構(gòu)建貝葉斯網(wǎng)絡(luò)分類器,用分類器對被驗證的等份數(shù) 據(jù)做分類,再跟實際的分類結(jié)果比較,如果分類精度越低,表明被驗證這組數(shù)據(jù)和其它N組 數(shù)據(jù)關(guān)聯(lián)度越低,被驗證的這組數(shù)據(jù)對構(gòu)建分類器的貢獻度越低。
5.如權(quán)利要求1所述的基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷方法,其特征在于,訓(xùn)練數(shù) 據(jù)集的大小為每類故障50-100條。
6.基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷系統(tǒng),包括數(shù)據(jù)處理中心和貝葉斯網(wǎng)絡(luò)分類器, 其特征在于所述數(shù)據(jù)處理中心包括數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊和訓(xùn)練數(shù)據(jù)集,所述數(shù)據(jù)采集 模塊從網(wǎng)絡(luò)管理系統(tǒng)采集含有告警信息的原始數(shù)據(jù),這些原始數(shù)據(jù)經(jīng)過數(shù)據(jù)預(yù)處理模塊處 理后生成待診斷數(shù)據(jù);從故障受理中心采集包含有告警信息和故障類型的原始數(shù)據(jù),它們 經(jīng)過數(shù)據(jù)預(yù)處理模塊處理后生成樣本數(shù)據(jù),所述樣本數(shù)據(jù)經(jīng)貝葉斯網(wǎng)絡(luò)算法計算,獲得故 障類型與各組告警信息之間的關(guān)聯(lián),構(gòu)建告警信息相對于故障類型按照一定概率關(guān)聯(lián)的圖 形,該圖形經(jīng)過多次迭代達到最優(yōu)從而獲得貝葉斯網(wǎng)絡(luò)分類器;所述待診斷數(shù)據(jù)作為貝葉 斯網(wǎng)絡(luò)分類器定位故障的輸入,經(jīng)貝葉斯網(wǎng)絡(luò)分類器計算獲得告警信息對應(yīng)的故障類型。
7.如權(quán)利要求6所述的基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷系統(tǒng),其特征在于所述數(shù)據(jù) 處理中心還包括數(shù)據(jù)優(yōu)化模塊,所述數(shù)據(jù)優(yōu)化模塊對訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)進行數(shù)據(jù)優(yōu) 化。
全文摘要
本發(fā)明公開了一種基于貝葉斯網(wǎng)絡(luò)的核心網(wǎng)故障診斷方法及系統(tǒng),該方法從核心網(wǎng)的故障受理中心采集包含有告警信息和故障類型的原始數(shù)據(jù)并生成樣本數(shù)據(jù),之后存儲到后備訓(xùn)練數(shù)據(jù)集中進行積累,達到設(shè)定的閾值后放入訓(xùn)練數(shù)據(jù)集中;運用貝葉斯網(wǎng)絡(luò)算法對訓(xùn)練數(shù)據(jù)集中的樣本數(shù)據(jù)進行計算,構(gòu)造貝葉斯網(wǎng)絡(luò)分類器;從核心網(wǎng)的網(wǎng)絡(luò)管理系統(tǒng)采集含有告警信息的原始數(shù)據(jù),經(jīng)貝葉斯網(wǎng)絡(luò)分類器計算獲得告警信息對應(yīng)的故障類型。本發(fā)明,利用貝葉斯網(wǎng)絡(luò)分類器構(gòu)建故障診斷系統(tǒng),實現(xiàn)了對錯綜復(fù)雜的核心網(wǎng)故障進行智能化的系統(tǒng)診斷功能,提高了診斷的準確性和靈活性,并且該系統(tǒng)構(gòu)建于網(wǎng)絡(luò)管理系統(tǒng)之上,易于實施,對核心網(wǎng)綜合信息處理具有廣泛的適應(yīng)性。
文檔編號H04L12/24GK101917297SQ20101026547
公開日2010年12月15日 申請日期2010年8月30日 優(yōu)先權(quán)日2010年8月30日
發(fā)明者張瑋, 鄭學(xué)智 申請人:烽火通信科技股份有限公司