国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于決策樹算法的電能表故障預(yù)測方法與流程

      文檔序號:11825294閱讀:451來源:國知局

      本發(fā)明涉及一種基于決策樹算法在一段時間周期內(nèi)(月、季、半年、年)預(yù)測電能表在發(fā)生計量、用電異常時發(fā)生故障的概率,屬于電力行業(yè)用電營銷和計量技術(shù)領(lǐng)域。



      背景技術(shù):

      目前,由于安徽省電力公司安裝在現(xiàn)場的電能表已經(jīng)超過2500萬只,由于對現(xiàn)場運行電能表運行狀況無法進行分析,發(fā)現(xiàn)發(fā)生故障概率較高的電能表,只能按照DL/T448-2000《電能計量裝置技術(shù)管理規(guī)程》和《電能表現(xiàn)場狀態(tài)檢驗方案》的要求開展對占2%的I、II、III類電能表定期抽檢,對抽檢不合格的安排輪換,而對占98%的IV、V類電能表不進行現(xiàn)場抽檢,缺乏切實可行的手段對電能表運行狀況進行分析和預(yù)測,同時,由于存在大量的隨機抽樣工作,同時也會造成大量表計浪費,也存在部分真實存在故障的標因為抽取樣本中未發(fā)現(xiàn)而未及時更換。所以,現(xiàn)有的管理規(guī)程和狀態(tài)檢驗方案無法滿足安徽省電力公司業(yè)務(wù)現(xiàn)狀,制約了計量業(yè)務(wù)的發(fā)展,迫切需要應(yīng)用新的技術(shù)手段解決上述問題。



      技術(shù)實現(xiàn)要素:

      針對現(xiàn)有技術(shù)存在的不足,本發(fā)明目的是提供一種基于決策樹算法的電能表故障預(yù)測方法,能夠準確、及時地發(fā)現(xiàn)問題電能表,并通過決策樹算法預(yù)測發(fā)生故障的概率,從而降低了計量與用電檢查部門人員現(xiàn)場排查和計量故障處理的工作量。

      為了實現(xiàn)上述目的,本發(fā)明是通過如下的技術(shù)方案來實現(xiàn):

      本發(fā)明的基于決策樹算法的電能表故障預(yù)測方法,是建立在計量裝置在線監(jiān)測與智能診斷系統(tǒng)(以下簡稱計量在線監(jiān)測系統(tǒng),為現(xiàn)有系統(tǒng)此處不再贅述)上,針對計量在線監(jiān)測發(fā)現(xiàn)的異常事件,通過建立電能表故障預(yù)測模型,分析電能表時鐘超差、過壓、過流等異常發(fā)生后,其發(fā)生故障的概率。包括以下幾個步驟:

      (1)首先通過采集裝置采集用戶的抄表數(shù)據(jù)、用電數(shù)據(jù)、終端和電能表事件,然后按照計量在線監(jiān)測系統(tǒng)設(shè)定的規(guī)則(現(xiàn)有規(guī)則,此處不再贅述)進行檢查,排除由于所述采集裝置誤報產(chǎn)生的錯誤數(shù)據(jù),生成計量、用電異常事件;

      (2)按照廠商和批次分析統(tǒng)計時間段內(nèi),專變用戶及低壓用戶的電能表中是否存在環(huán)境、質(zhì)量問題造成發(fā)生計量故障的電能表,然后對發(fā)生故障的電能表以批次為單位統(tǒng)計各類故障率指標,并進行相關(guān)性分析(現(xiàn)有的分析方法,此處不再贅述),定義發(fā)生問題的電能表的影響因子,從而建立基于決策樹算法的故障診斷模型;

      (3)針對所述專變用戶統(tǒng)計當(dāng)前是否存在滿足判斷故障的計量、用電異常事件(如電能表時鐘超差、過壓、過流、反向潛動等異常事件);針對所述低壓用戶統(tǒng)計當(dāng)前是否存在滿足判斷故障的計量異常事件(如電能表時鐘超差、反向潛動事件);對發(fā)生上述異常的電能表用電能表故障預(yù)測模型分析發(fā)生故障值;

      (4)根據(jù)所述決策樹算法的故障診斷模型分析的結(jié)果,參考營銷系統(tǒng)的電能表計量故障換表及故障表檢定信息,驗證電能表運行是否會發(fā)生故障;

      (5)如果判斷準確率達到80%則結(jié)束流程,如果低于這個準確率則轉(zhuǎn)向步驟(3)重新進行分析。

      步驟(2)中,所述專變用戶的環(huán)境問題包括電壓過壓、電流過流、電能表開表蓋或電能表開端鈕蓋;所述專變用戶的質(zhì)量問題包括電能表總與各費率之和不一致、電能表飛走、電能表停走、電能表倒走、電能表反向潛動或者電能表時鐘電池故障;所述低壓用戶的環(huán)境問題包括電能表開表蓋;所述低壓用戶的質(zhì)量問題包括電能表總與各費率之和不一致、電能表飛走、電能表倒走、電能表停走、電能表反向潛動或者電能表時鐘電池故障。

      步驟(3)中,用電異常事件包括電能表時鐘超差、電能表對時超次數(shù)、電壓過壓和電流過流;計量異常事件包括電能表時鐘超差、電能表對時超次數(shù)。

      步驟(3)中,所述電能表故障預(yù)測模型是基于群體分析,然后對屬于群體的個體進行預(yù)測的模型,包括對群體發(fā)生質(zhì)量異常的統(tǒng)計,權(quán)值歸一化及故障預(yù)測,所述群體具體按廠商和批次,電能表故障預(yù)測模型分析方法如下:

      (3-1)對所述電能表各類質(zhì)量故障進行統(tǒng)計

      如果電能表發(fā)生質(zhì)量異常情形中的任意一個異常,即n>0,n=n1+n2+…ni+…+nn,ni為電能表總發(fā)生質(zhì)量異常情形中的任意一個異常,則確定為數(shù)據(jù)集;

      (3-2)對于每批次電能表的質(zhì)量異常都有一個占比,計算每個質(zhì)量異常占比:

      Pi=Ni/N,其中,Ni為質(zhì)量異常中任意一個異常,N為該批次總數(shù);

      然后對計算出來的質(zhì)量異常占比進行歸一化處理;

      <mrow> <mi>x</mi> <mo>=</mo> <mfrac> <mrow> <mi>x</mi> <mo>-</mo> <mi>min</mi> </mrow> <mrow> <mi>max</mi> <mo>-</mo> <mi>min</mi> </mrow> </mfrac> </mrow>

      其中,x為樣本中的數(shù)據(jù),max為樣本數(shù)據(jù)的最大值,min為樣本數(shù)據(jù)的最小值;

      (3-3)故障預(yù)測

      對質(zhì)量異常占比及對應(yīng)的可信度值進行劃定,如果質(zhì)量異常占比在[0,0.2]之間,則可信度是20%,質(zhì)量異常占比在[0.3,0.6]之間,則可信度是45%,質(zhì)量異常占比在[0.7,0.85]之間,則可信度是65%,質(zhì)量異常占比在[0.86,1之間,則可信度是80%;

      故障值公式如下:

      <mrow> <mi>K</mi> <mo>=</mo> <msubsup> <mi>&Sigma;</mi> <mi>i</mi> <mi>n</mi> </msubsup> <msub> <mi>P</mi> <mi>i</mi> </msub> <mo>*</mo> <mi>h</mi> </mrow>

      其中,Pi為質(zhì)量異常占比,h為該質(zhì)量異常占比對應(yīng)的可信度。

      本發(fā)明能準確、及時地發(fā)現(xiàn)問題電能表,并預(yù)測發(fā)生故障的概率,對電力公司加強故障電能表現(xiàn)場抽檢,及時排查問題和消缺,提高了業(yè)務(wù)時效性、減少經(jīng)營損失、客戶投訴風(fēng)險,降低計量與用電檢查部門人員的工作量,滿足了電力公司對現(xiàn)場運行計量裝置的工況進行實時監(jiān)測的需求。

      附圖說明

      圖1為本發(fā)明的基于決策樹算法的電能表故障預(yù)測方法工作流程圖。

      具體實施方式

      為使本發(fā)明實現(xiàn)的技術(shù)手段、創(chuàng)作特征、達成目的與功效易于明白了解,下面結(jié)合具體實施方式,進一步闡述本發(fā)明。

      隨著用電信息采集系統(tǒng)發(fā)展和應(yīng)用,尤其是計量裝置在線監(jiān)測與智能診斷系統(tǒng)的應(yīng)用取得的成就,具備了分析對電能表運行狀態(tài)的可能性。在此基礎(chǔ)上,結(jié)合營銷業(yè)務(wù)系統(tǒng)、計量生產(chǎn)調(diào)度平臺的信息,應(yīng)用統(tǒng)計分析、數(shù)據(jù)挖掘和機器學(xué)習(xí)技術(shù)構(gòu)建電能表故障預(yù)測程序,實現(xiàn)對現(xiàn)有分布在城鄉(xiāng)2500多萬只電能表的狀態(tài)進行分析。

      本發(fā)明基于決策樹算法的電能表故障預(yù)測模型。在指定分析周期內(nèi),以電能表制造廠商、供貨批次、生產(chǎn)日期為分析對象,對統(tǒng)計對象內(nèi)的電能表發(fā)生各類質(zhì)量故障、報廢率、檢定結(jié)果和故障換表及折舊等情況,以此為分析要素,對屬于這個分析對象的電能表個體在發(fā)生特定的計量異常情況下,是否發(fā)生會故障進行預(yù)測和分析,從而為制定電能表現(xiàn)場抽檢和輪換計劃提供技術(shù)參考依據(jù),實現(xiàn)現(xiàn)場抽檢的針對性,極大地提高工作效率,使電能表從目前的“計劃檢修”向“狀態(tài)檢修”轉(zhuǎn)變。在確保電能表安全、穩(wěn)定運行的前提條件下,以最經(jīng)濟的成本對現(xiàn)場的電能表運行進行監(jiān)測和狀態(tài)分析,判斷其中的電能表是否會發(fā)生故障。

      參見圖1,具體的預(yù)測方法如下:

      1、對用戶的采集數(shù)據(jù)進行清理,排除由于采集裝置異常而突然產(chǎn)生很大數(shù)據(jù)(如電流超過額定電流300%)的樣本點;排除營銷系統(tǒng)正在走拆表、換表流程的用戶;檢查用戶檔案信息中,電能表的計量方式與額定電壓、接線方式是否一致,排除用戶檔案錄入錯誤的問題。通過對上述情況的處理,避免干擾計量在線監(jiān)測系統(tǒng)對數(shù)據(jù)的應(yīng)用和分析;

      2、針對專變用戶統(tǒng)計分析時間段內(nèi)發(fā)生環(huán)境異常(如:電壓過壓、電流過流、電能表開表蓋或電能表開端鈕蓋等異常事件)、質(zhì)量異常(如:電能表總與各費率之和不一致、電能表飛走、電能表停走、電能表倒走、電能表反向潛動或者電能表時鐘電池故障等事件)的電能表,同時分析發(fā)生問題的電能表的屬性(如:運行年限、生產(chǎn)廠商和批次及安裝區(qū)域等信息);針對低壓用戶統(tǒng)計分析時間段內(nèi)發(fā)生質(zhì)量異常(如:電能表總與各費率之和不一致、電能表飛走、電能表倒走、電能表停走、電能表反向潛動或者電能表時鐘電池故障等事件)、環(huán)境異常(如:電能表開表蓋等異常事件)的電能表信息,同時分析發(fā)生問題的電能表的屬性(運行年限、生產(chǎn)廠商和批次及安裝區(qū)域等信息);

      分析時間周期包括月、季、半年和年。

      3、數(shù)據(jù)需要進行篩選,清洗和處理后,轉(zhuǎn)成各類監(jiān)控與分析指標后才能被用來訓(xùn)練和檢驗。我們并非取全量數(shù)據(jù)做預(yù)測,而是對發(fā)生計量、用電異常的電能表進行預(yù)測是否會發(fā)生故障。

      1)對分析對象的電能表各類質(zhì)量故障進行統(tǒng)計

      如果電能表發(fā)生質(zhì)量異常(如:電能表總與各費率之和不一致、電能表飛走、電能表停走、電能表倒走、電能表反向潛動或者電能表時鐘電池故障等事件)中的任意一個異常,即n>0,n=n1+n2+…+nn(ni為電能表總與各費率之和不一致、電能表飛走、電能表停走、電能表倒走、電能表反向潛動或者電能表時鐘電池故障等各類事件),則作為我們的數(shù)據(jù)集。

      2)計算每個質(zhì)量異常占比

      對于每批次電能表的質(zhì)量異常都有一個占比,公式如下:

      (i為質(zhì)量異常中任意一個異常,N為該批次總數(shù))計算出來的占比進行歸一化處理。

      3)計算故障值

      每個上報的質(zhì)量異常中的異常次數(shù)都會有一定誤差,質(zhì)量異常占比值得不同決定了可信度的大小。可信度的選用是在對最近五年電能表故障處理與原因分析的數(shù)據(jù)統(tǒng)計的基礎(chǔ)上,通過大量分析比對得出現(xiàn)的結(jié)果。對質(zhì)量異常占比及對應(yīng)的可信度值進行劃定,如果質(zhì)量異常占比在[0,0.2]之間,我們認為可信度是20%,質(zhì)量異常占比在[0.3,0.6]之間,我們認為可信度是45%,質(zhì)量異常占比在[0.7,0.85]之間,我們認為可信度是65%,質(zhì)量異常占比在[0.86,1之間,我們認為可信度是80%。故障值公式如下:

      (Pi為質(zhì)量異常占比,h為該異常占比對應(yīng)的可信度)

      故障值將會作為該模型一個重要的輸入指標。

      4、采用C5.0決策樹算法,對現(xiàn)有數(shù)據(jù)所包含的分類規(guī)則進行歸納和提煉,數(shù)據(jù)除輸入角色的變量外,一定還包含輸出角色的輸出變量,且輸出變量的取值在現(xiàn)有變量上是已知的,它指導(dǎo)著模型的學(xué)習(xí),使模型能夠理解怎樣的輸入變量取值或組合,得到怎么樣的分類結(jié)果,步驟如下:

      1)決策樹的生長

      利用訓(xùn)練樣本集完成決策樹的建立過程,本質(zhì)上是對訓(xùn)練樣本集的反復(fù)分組過程,決策樹上的各個分支實現(xiàn)數(shù)據(jù)不斷地分組過程中逐漸生長出來的。因此。決策樹的生長核心算法就是確定數(shù)據(jù)分組標準。屬性選擇方法總是選擇最好的屬性作為分裂屬性,即讓每個分支的記錄的類別盡可能純。它將所有屬性列表的所有屬性按照某個標準排序,從而選出最好的屬性。本發(fā)明中我們采用的是C5.0算法,所有用的是增益比率(gain ratio)選取分裂屬性。

      a)信息增益(Information gain):

      信息增益基于香濃的信息論,它找出的屬性R具有這樣的特點:以屬性R分裂前后的信息增益比其他屬性最大。這里信息的定義如下:

      Gain(R)=Info(D)-I(D)

      信息增益Gain(R)表示屬性R給分類帶來的信息量,我們尋找Gain最大的屬性,就能使分類盡可能的純,即最可能的把不同的類分開。不過我們發(fā)現(xiàn)對所有的屬性Info(D)都是一樣的,所以求最大的Gain可以轉(zhuǎn)化為求最新的I(D)。

      其中

      其中的m表示數(shù)據(jù)集D中類別C的個數(shù),表示D中任意一個記錄屬于的概率,計算時=(D中屬于類的集合的記錄個數(shù)/|D|)。Info(D)表示將數(shù)據(jù)集D不同的類分開需要的信息量;

      假設(shè)我們選擇屬性R作為分裂屬性,數(shù)據(jù)集D中,R有k個不同的取值{,,…,},于是可將D根據(jù)R的值分成k組{,,…,},按R進行分裂后,將數(shù)據(jù)集D不同的類分開還需要的信息量為:

      <mrow> <msub> <mi>Info</mi> <mi>R</mi> </msub> <mrow> <mo>(</mo> <mi>D</mi> <mo>)</mo> </mrow> <mo>=</mo> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </msubsup> <mfrac> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> <mi>D</mi> </mfrac> <mo>*</mo> <mi>I</mi> <mi>n</mi> <mi>f</mi> <mo>.</mo> </mrow>

      b)增益比率(gain ratio)

      信息增益選擇方法有一個很大的缺陷,它總是會傾向于選擇屬性值多的屬性,如果我們在上面的數(shù)據(jù)記錄中加一個使用單位屬性,假設(shè)16條記錄(安徽16個市供電公司)中的每個使用單位不同,那么信息增益就會選擇使用單位作為最佳屬性,因為按使用單位分裂后,每個組只包含一條記錄,而每個記錄只屬于一類,因此純度最高,以使用單位作為測試分裂的結(jié)點下面有16個分支。但是這樣的分類太廣泛,影響分析效率。對此,我們對其進行改進,采用增益比率。

      首先引入一個分裂信息:

      <mrow> <msub> <mi>SplitInfo</mi> <mi>R</mi> </msub> <mrow> <mo>(</mo> <mi>D</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <mfrac> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> <mi>D</mi> </mfrac> <msub> <mi>log</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mfrac> <mrow> <mo>|</mo> <msub> <mi>D</mi> <mi>j</mi> </msub> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <mi>D</mi> <mo>|</mo> </mrow> </mfrac> <mo>)</mo> </mrow> </mrow>

      增益比率定義為信息增益與分裂信息的比率:

      <mrow> <mi>G</mi> <mi>a</mi> <mi>i</mi> <mi>n</mi> <mi>R</mi> <mi>a</mi> <mi>t</mi> <mi>i</mi> <mi>o</mi> <mrow> <mo>(</mo> <mi>R</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>G</mi> <mi>a</mi> <mi>i</mi> <mi>n</mi> </mrow> <mrow> <mi>S</mi> <mi>p</mi> <mi>l</mi> <mi>i</mi> <mi>t</mi> <mi>I</mi> <mi>n</mi> <mi>f</mi> </mrow> </mfrac> </mrow>

      2)決策樹的剪枝

      完整的決策樹并不是一顆分類預(yù)測新數(shù)據(jù)對象的最佳樹,過于精確,會失去一般性而無法用于新數(shù)據(jù)的預(yù)測,這種現(xiàn)象稱為過度擬合,所以我們要對決策樹進行剪枝,剪枝又分為兩種,預(yù)剪枝和后剪枝,具體如下:

      a)預(yù)剪枝:限制決策樹的充分生長,事先指定最大深度。

      b)后剪枝:生長完畢后在進行剪枝,剪枝過程中不斷計算當(dāng)前決策子樹輸出變量的預(yù)測精度和誤差,用戶可事先指定一個允許的最大錯誤率。

      由于本發(fā)明采用的是C5.0算法,該算法選取的是后剪枝的方法。

      3)Boosting技術(shù)

      為了提高決策樹分析的準確性,我們采用boosting技術(shù),迭代了三次,每一次迭代都針對上次分類錯誤的信息進行重點分析,最后通過加權(quán)投票的方法,得到最優(yōu)模型。

      以上顯示和描述了本發(fā)明的基本原理和主要特征和本發(fā)明的優(yōu)點。本行業(yè)的技術(shù)人員應(yīng)該了解,本發(fā)明不受上述實施例的限制,上述實施例和說明書中描述的只是說明本發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會有各種變化和改進,這些變化和改進都落入要求保護的本發(fā)明范圍內(nèi)。本發(fā)明要求保護范圍由所附的權(quán)利要求書及其等效物界定。

      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1