用戶用電竊電行為模式的分析方法
【專利摘要】本發(fā)明涉及一種用戶用電竊電行為模式的分析方法,包括步驟:(1)用戶用電數(shù)據(jù)采集及電表異常事件數(shù)據(jù)采集;(2)抽取歷史用電數(shù)據(jù)及電能表異常事件數(shù)據(jù)處理:(3)歷史用電及電能表異常事件數(shù)據(jù)清洗處理;(4)構(gòu)建竊電行為分析模型;(5)竊電模型參數(shù)的修正處理;(6)竊電風險評估。本發(fā)明采用大數(shù)據(jù)平臺框架下進行,海量數(shù)據(jù)并行計算,解決了運行計算效率低下的問題,滿足落了用電部門日分析、日處理、日監(jiān)測的要求,可以讓業(yè)務(wù)人員自主選擇高風險的竊電用戶,進行處理,從而提高工作效率。
【專利說明】用戶用電竊電行為模式的分析方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于用戶用電分析【技術(shù)領(lǐng)域】,尤其是一種用戶用電竊電行為模式的分析方法。
【背景技術(shù)】
[0002]用電信息的管理是用電營銷的重要基礎(chǔ)和數(shù)據(jù)支撐,隨著智能電網(wǎng)的不斷深入建設(shè),對用電信息管理的精益化要求不斷提高。當前,用電信息采集系統(tǒng)的日采集,日計算。數(shù)據(jù)的實時的監(jiān)控和獲取已不是解決相關(guān)問題的瓶頸。針對每日的海量的采集數(shù)據(jù),如何在此基礎(chǔ)上完成有效的、準確的數(shù)據(jù)分析,進而發(fā)現(xiàn)相關(guān)用電方面的問題,提升用電信息方面的數(shù)據(jù)處理水平。目前,關(guān)于用電信息的數(shù)據(jù)分析,依靠常規(guī)的數(shù)據(jù)統(tǒng)計,不能發(fā)現(xiàn)隱藏在海量數(shù)據(jù)背后的問題。業(yè)務(wù)人員不能直觀的從數(shù)據(jù)統(tǒng)計中發(fā)現(xiàn)問題,僅靠業(yè)務(wù)人員的經(jīng)驗分析問題、發(fā)現(xiàn)問題、處理問題。同時,面對海量的日用電數(shù)據(jù),靠人力去做基礎(chǔ)數(shù)據(jù)的分析,只是簡單的計算和直接的經(jīng)驗,存在分析出的結(jié)果不正確、數(shù)據(jù)分析的工作效率低下等問題。
[0003]如何提高系統(tǒng)自動化的分析能力,利用海量的數(shù)據(jù)去分析發(fā)現(xiàn)問題及其處理分析,一直是用電信息管理的亟待解決的問題。當前,在面臨著竊電手段的多樣性、科技性等特點,如何通過讓數(shù)據(jù)說話,讓數(shù)理統(tǒng)計與業(yè)務(wù)需求相結(jié)合,最大化的提高數(shù)據(jù)分析的自主性和智能性也是智能電網(wǎng)的必行趨勢。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于克服傳統(tǒng)的、單一化的、常規(guī)的分析用電用戶竊電的風險,解決目前海量的采集數(shù)據(jù)單靠人工分析基礎(chǔ)數(shù)據(jù)的不足,利用分析系統(tǒng)的分析能力,構(gòu)建竊電行為分析模型,提高分析的能力與效率,而提出一種用戶用電竊電行為模式的分析方法。
[0005]本發(fā)明解決其技術(shù)問題是采取以下技術(shù)方案實現(xiàn)的:
[0006]一種用戶用電竊電行為模式的分析方法,包括步驟如下:
[0007](I)用戶用電數(shù)據(jù)采集及電表異常事件數(shù)據(jù)采集:在用電信息采集系統(tǒng)的主站采集用戶的用電數(shù)據(jù)及主動采集電表異常事件數(shù)據(jù);
[0008](2)抽取歷史用電數(shù)據(jù)及電能表異常事件數(shù)據(jù)處理:包括對采集系統(tǒng)的檔案數(shù)據(jù)、日采集數(shù)據(jù)及計量電能表事件數(shù)據(jù),抽取到數(shù)據(jù)分析系統(tǒng)數(shù)據(jù)庫;
[0009](3)歷史用電及電能表異常事件數(shù)據(jù)清洗處理:在數(shù)據(jù)分析系統(tǒng)中對歷史的用電數(shù)據(jù)及電能表事件數(shù)據(jù)做清洗處理;
[0010](4)構(gòu)建竊電行為分析模型:在分析系統(tǒng)中利用歷史用電數(shù)據(jù)及電表異常事件等數(shù)據(jù)特征,構(gòu)建綜合性的竊電分析數(shù)據(jù)模型;
[0011](5)竊電模型參數(shù)的修正處理;根據(jù)歷史用電數(shù)據(jù)及電表異常事件數(shù)據(jù)訓(xùn)練過的數(shù)據(jù)集,對竊電分析數(shù)據(jù)模型做訓(xùn)練,根據(jù)訓(xùn)練結(jié)果修正模型的參數(shù);
[0012](6)竊電風險評估,根據(jù)竊電行為分析模型分析出的數(shù)據(jù),對每個用電用戶做風險等級評估。
[0013]而且,所述步驟(I)的具體方法包括:
[0014]①用電信息采集系統(tǒng)主站負責每天采集用戶的電能表數(shù)值和購電信息數(shù)據(jù),計量電能表的開蓋事件,用電信息采集系統(tǒng)實時召測用戶電能表零線進向電流和出向電流,用電信息采集系統(tǒng)對存儲在終端上的電能表的零點凍結(jié)數(shù)據(jù)實施兩種采集策略,一是終端定時上報終端數(shù)據(jù);二是用電信息采集系統(tǒng)按計劃下發(fā)召測任務(wù),采集終端中的電能表數(shù)據(jù)和電能表異常事件;
[0015]②用電信息采集系統(tǒng)主站負責接收、解析終端的上行報文,數(shù)據(jù)庫負責對主站采集的數(shù)據(jù)按不同的數(shù)據(jù)項類別進行存儲。
[0016]而且,所述步驟(2)的具體方法包括:
[0017]①檔案數(shù)據(jù)抽取:數(shù)據(jù)分析系統(tǒng)每日定時抽取當前采集系統(tǒng)最新的用戶檔案數(shù)據(jù),包括用戶檔案、電能表檔案、計量點檔案,同時對分析系統(tǒng)中的原檔案與新檔案做分析比較,不一致的檔案,打上標志戳;
[0018]②日采集數(shù)據(jù):數(shù)據(jù)分析系統(tǒng)每日定時抽取當天增量的日采集數(shù)據(jù),包括:日凍結(jié)示值、用戶購電次數(shù)、剩余金額及總購電金額;
[0019]③計量電能表事件數(shù)據(jù):數(shù)據(jù)分析系統(tǒng)每日定時抽取計量電能表的事件數(shù)據(jù),包括開蓋記錄事件及停電事件。
[0020]而且,所述步驟(3)的具體方法包括:
[0021 ] ①對日凍結(jié)數(shù)據(jù)做清洗數(shù)據(jù),按月計算每塊電能表的日最大用電量、日最小用電量、均值及標準差的統(tǒng)計值,比對這些統(tǒng)計值,找出特征值,包括負值,標準差異常值做數(shù)據(jù)清洗,清洗后的數(shù)據(jù)重新計算統(tǒng)計值;
[0022]②對日剩余金額做數(shù)據(jù)清洗,按月計算每塊電能表的日用電金額、日最小用電金額、均值及標準差的統(tǒng)計值,其做法與日凍結(jié)數(shù)據(jù)的清洗方式一致,但是注意用戶的購電記錄,否則會出現(xiàn)干凈的數(shù)據(jù)被誤清洗;
[0023]③對計量電能表開蓋事件做清洗,獲取每次開蓋的原始時間點。
[0024]而且,所述步驟(4)的具體方法包括:
[0025]①設(shè)置每塊電能表日用電量、日用電金額與竊電相關(guān)度的度量指標,根據(jù)用戶電能表的歷史用電信息,采用離群點中基于密度的算法,發(fā)現(xiàn)電能表中用電的突出時間點,并利用回歸算法驗證其時間點后,日用電量、日用電金額在整體上是否具有趨向性或長期零電量;
[0026]②按臺區(qū)的維度計算供電能表的日供電量、臺區(qū)下用戶所用的售電量、臺區(qū)的日實際線損率、計算出的結(jié)果與歷史的線損率波動比較,分析原低損臺區(qū)是否呈上升趨勢,確認上升的起始時間點;
[0027]③對上述的度量指標與用戶電能表的開蓋記錄相結(jié)合,采用人工網(wǎng)絡(luò)神經(jīng)算法,確定各指標的度量的權(quán)重,針對強相關(guān)的指標,在人工網(wǎng)絡(luò)神經(jīng)算法中設(shè)置相關(guān)因子。
[0028]而且,所述步驟(5)的具體方法包括:
[0029]針對構(gòu)建的竊電分析數(shù)據(jù)模型,利用清洗過的訓(xùn)練數(shù)據(jù)集,對數(shù)據(jù)模型進行訓(xùn)練處理,同時注意建立各算法運行時間指標,對數(shù)據(jù)模型訓(xùn)練出的結(jié)果,做符合度的驗證,確定數(shù)據(jù)模型是否在置信度的范圍內(nèi),根據(jù)結(jié)果去修正數(shù)據(jù)模型的參數(shù)及算法。[0030]而且,所述步驟(6)的具體方法包括:
[0031]根據(jù)數(shù)據(jù)分析系統(tǒng)中的竊電行為分析的數(shù)據(jù)模型,對影響竊電因素的度量指標,在整體上評估用電用戶的竊電風險等級,采用貝葉斯信念網(wǎng)絡(luò)算法,根據(jù)不同的度量指標、各自的權(quán)重,確定用電用戶電能表的發(fā)生竊電行為的概率。
[0032]本發(fā)明的優(yōu)點和積極效果是:
[0033]本發(fā)明提出了采用用戶用電竊電行為模式的分析方法,解決以前靠人工經(jīng)驗和分析問題單一化的問題,具有如下技術(shù)效果:
[0034](I)用戶用電竊電行為模式的分析方法,滿足用電部門日分析、日處理、日監(jiān)測的要求。
[0035](2)由于構(gòu)建的竊電行為分析的數(shù)據(jù)模型,采用大數(shù)據(jù)平臺框架下進行,海量數(shù)據(jù)并行計算,解決了運行計算效率低下的問題。
[0036](3)對竊電行為分析的數(shù)據(jù)采用概率進行風險等級的評估,可以讓業(yè)務(wù)人員自主選擇高風險的竊電用戶,進行處理,從而提高工作效率。
【具體實施方式】
[0037]以下對本發(fā)明實施做進一步詳述,以下實施例只是描述性的,不是限定性的,不能以此限定本發(fā)明的保護范圍。
[0038]一種用戶用電竊電行為模式的分析方法,方法步驟如下:
[0039](I)用戶用電數(shù)據(jù)采集及電表異常事件數(shù)據(jù)采集:在用電信息采集系統(tǒng)的主站采集用戶的用電數(shù)據(jù)及主動采集電表異常事件數(shù)據(jù);具體包括:
[0040]①用電信息采集系統(tǒng)主站負責每天采集用戶的電能表數(shù)值和購電信息數(shù)據(jù),計量電能表的開蓋事件,用電信息采集系統(tǒng)實時召測用戶電能表零線進向電流和出向電流,用電信息采集系統(tǒng)對存儲在終端上的電能表的零點凍結(jié)數(shù)據(jù)實施兩種采集策略,一是終端定時上報終端數(shù)據(jù);二是用電信息采集系統(tǒng)按計劃下發(fā)召測任務(wù),采集終端中的電能表數(shù)據(jù)和電能表異常事件;
[0041]②用電信息采集系統(tǒng)主站負責接收、解析終端的上行報文,數(shù)據(jù)庫負責對主站采集的數(shù)據(jù)按不同的數(shù)據(jù)項類別進行存儲;
[0042](2)抽取歷史用電數(shù)據(jù)及電能表異常事件數(shù)據(jù)處理:包括對采集系統(tǒng)的檔案數(shù)據(jù)、日采集數(shù)據(jù)及計量電能表事件數(shù)據(jù),抽取到數(shù)據(jù)分析系統(tǒng)數(shù)據(jù)庫,具體方法為:
[0043]①檔案數(shù)據(jù)抽取:數(shù)據(jù)分析系統(tǒng)每日定時抽取當前采集系統(tǒng)最新的用戶檔案數(shù)據(jù),包括:用戶檔案、電能表檔案、計量點檔案,同時對分析系統(tǒng)中的原檔案與新檔案做分析比較,不一致的檔案,打上標志戳;
[0044]②日采集數(shù)據(jù):數(shù)據(jù)分析系統(tǒng)每日定時抽取當天增量的日采集數(shù)據(jù),包括:日凍結(jié)示值、用戶購電次數(shù)、剩余金額及總購電金額;
[0045]③計量電能表事件數(shù)據(jù):數(shù)據(jù)分析系統(tǒng)每日定時抽取計量電能表的事件數(shù)據(jù),包括:開蓋記錄事件及停電事件;
[0046](3)歷史用電及電能表異常事件數(shù)據(jù)清洗處理:在數(shù)據(jù)分析系統(tǒng)中對歷史的用電數(shù)據(jù)及電能表事件數(shù)據(jù)做清洗處理,其目的是清洗因終端誤報的錯誤數(shù)據(jù)造成竊電行為分析數(shù)據(jù)模型的誤差,具體方法為:[0047]①對日凍結(jié)數(shù)據(jù)做清洗數(shù)據(jù),按月計算每塊電能表的日最大用電量、日最小用電量、均值及標準差的統(tǒng)計值,比對這些統(tǒng)計值,找出特征值,包括負值,標準差異常值做數(shù)據(jù)清洗,清洗后的數(shù)據(jù)重新計算統(tǒng)計值;
[0048]②對日剩余金額做數(shù)據(jù)清洗,按月計算每塊電能表的日用電金額、日最小用電金額、均值及標準差的統(tǒng)計值,其做法與日凍結(jié)數(shù)據(jù)的清洗方式一致,但是注意用戶的購電記錄,否則會出現(xiàn)干凈的數(shù)據(jù)被誤清洗;
[0049]③對計量電能表開蓋事件做清洗,獲取每次開蓋的原始時間點;
[0050](4)構(gòu)建竊電行為分析模型:在分析系統(tǒng)中利用歷史用電數(shù)據(jù)及電表異常事件等數(shù)據(jù)特征,構(gòu)建綜合性的竊電分析數(shù)據(jù)模型;
[0051]①設(shè)置每塊電能表日用電量、日用電金額與竊電相關(guān)度的度量指標,根據(jù)用戶電能表的歷史用電信息,采用離群點中基于密度的算法,發(fā)現(xiàn)電能表中用電的突出時間點,并利用回歸算法驗證其時間點后,日用電量、日用電金額在整體上是否具有趨向性或長期零電量;
[0052]②按臺區(qū)的維度計算供電能表的日供電量、臺區(qū)下用戶所用的售電量、臺區(qū)的日實際線損率、計算出的結(jié)果與歷史的線損率波動比較,分析原低損臺區(qū)是否呈上升趨勢,確認上升的起始時間點;
[0053]③對上述的度量指標與用戶電能表的開蓋記錄相結(jié)合,采用人工網(wǎng)絡(luò)神經(jīng)算法,確定各指標的度量的權(quán)重,針對強相關(guān)的指標,在人工網(wǎng)絡(luò)神經(jīng)算法中設(shè)置相關(guān)因子;
[0054](5)竊電模型參數(shù)的修正處理:針對構(gòu)建的竊電分析數(shù)據(jù)模型,利用清洗過的訓(xùn)練數(shù)據(jù)集,對數(shù)據(jù)模型進行訓(xùn)練處理,同時注意建立各算法運行時間指標,對數(shù)據(jù)模型訓(xùn)練出的結(jié)果,做符合度的驗證,確定數(shù)據(jù)模型是否在置信度的范圍內(nèi),根據(jù)結(jié)果去修正數(shù)據(jù)模型的參數(shù)及算法;
[0055](6)竊電風險評估:根據(jù)數(shù)據(jù)分析系統(tǒng)中的竊電行為分析的數(shù)據(jù)模型,對影響竊電因素的度量指標,在整體上評估用電用戶的竊電風險等級,采用貝葉斯信念網(wǎng)絡(luò)算法,根據(jù)不同的度量指標、各自的權(quán)重,確定用電用戶電能表的發(fā)生竊電行為的概率。
【權(quán)利要求】
1.一種用戶用電竊電行為模式的分析方法,其特征在于包括步驟如下: (1)用戶用電數(shù)據(jù)采集及電表異常事件數(shù)據(jù)采集:在用電信息采集系統(tǒng)的主站采集用戶的用電數(shù)據(jù)及主動采集電表異常事件數(shù)據(jù); (2)抽取歷史用電數(shù)據(jù)及電能表異常事件數(shù)據(jù)處理:包括對采集系統(tǒng)的檔案數(shù)據(jù)、日采集數(shù)據(jù)及計量電能表事件數(shù)據(jù),抽取到數(shù)據(jù)分析系統(tǒng)數(shù)據(jù)庫; (3)歷史用電及電能表異常事件數(shù)據(jù)清洗處理:在數(shù)據(jù)分析系統(tǒng)中對歷史的用電數(shù)據(jù)及電能表事件數(shù)據(jù)做清洗處理; (4)構(gòu)建竊電行為分析模型:在分析系統(tǒng)中利用歷史用電數(shù)據(jù)及電表異常事件等數(shù)據(jù)特征,構(gòu)建綜合性的竊電分析數(shù)據(jù)模型; (5)竊電模型參數(shù)的修正處理;根據(jù)歷史用電數(shù)據(jù)及電表異常事件數(shù)據(jù)訓(xùn)練過的數(shù)據(jù)集,對竊電分析數(shù)據(jù)模型做訓(xùn)練,根據(jù)訓(xùn)練結(jié)果修正模型的參數(shù); (6)竊電風險評估,根據(jù)竊電行為分析模型分析出的數(shù)據(jù),對每個用電用戶做風險等級評估。
2.根據(jù)權(quán)利要求1所述的用戶用電竊電行為模式的分析方法,其特征在于:所述步驟(1)的具體方法包括: ①用電信息采集系統(tǒng)主站負責每天采集用戶的電能表數(shù)值和購電信息數(shù)據(jù),計量電能表的開蓋事件,用電信息采集系統(tǒng)實時召測用戶電能表零線進向電流和出向電流,用電信息采集系統(tǒng)對存儲在終端上的電能表的零點凍結(jié)數(shù)據(jù)實施兩種采集策略,一是終端定時上報終端數(shù)據(jù);二是用電信息采集系統(tǒng)按計劃下發(fā)召測任務(wù),采集終端中的電能表數(shù)據(jù)和電能表異常事件; ②用電信息采集系統(tǒng)主站負責接收、解析終端的上行報文,數(shù)據(jù)庫負責對主站采集的數(shù)據(jù)按不同的數(shù)據(jù)項類別進行存儲。
3.根據(jù)權(quán)利要求1所述的用戶用電竊電行為模式的分析方法,其特征在于:所述步驟(2)的具體方法包括: ①檔案數(shù)據(jù)抽取:數(shù)據(jù)分析系統(tǒng)每日定時抽取當前采集系統(tǒng)最新的用戶檔案數(shù)據(jù),包括用戶檔案、電能表檔案、計量點檔案,同時對分析系統(tǒng)中的原檔案與新檔案做分析比較,不一致的檔案,打上標志戳; ②日采集數(shù)據(jù):數(shù)據(jù)分析系統(tǒng)每日定時抽取當天增量的日采集數(shù)據(jù),包括:日凍結(jié)示值、用戶購電次數(shù)、剩余金額及總購電金額; ③計量電能表事件數(shù)據(jù):數(shù)據(jù)分析系統(tǒng)每日定時抽取計量電能表的事件數(shù)據(jù),包括開蓋記錄事件及停電事件。
4.根據(jù)權(quán)利要求1所述的用戶用電竊電行為模式的分析方法,其特征在于:所述步驟(3)的具體方法包括: ①對日凍結(jié)數(shù)據(jù)做清洗數(shù)據(jù),按月計算每塊電能表的日最大用電量、日最小用電量、均值及標準差的統(tǒng)計值,比對這些統(tǒng)計值,找出特征值,包括負值,標準差異常值做數(shù)據(jù)清洗,清洗后的數(shù)據(jù)重新計算統(tǒng)計值; ②對日剩余金額做數(shù)據(jù)清洗,按月計算每塊電能表的日用電金額、日最小用電金額、均值及標準差的統(tǒng)計值,其做法與日凍結(jié)數(shù)據(jù)的清洗方式一致,但是注意用戶的購電記錄,否則會出現(xiàn)干凈的數(shù)據(jù)被誤清洗;③對計量電能表開蓋事件做清洗,獲取每次開蓋的原始時間點。
5.根據(jù)權(quán)利要求1所述的用戶用電竊電行為模式的分析方法,其特征在于:所述步驟(4)的具體方法包括: ①設(shè)置每塊電能表日用電量、日用電金額與竊電相關(guān)度的度量指標,根據(jù)用戶電能表的歷史用電信息,采用離群點中基于密度的算法,發(fā)現(xiàn)電能表中用電的突出時間點,并利用回歸算法驗證其時間點后,日用電量、日用電金額在整體上是否具有趨向性或長期零電量; ②按臺區(qū)的維度計算供電能表的日供電量、臺區(qū)下用戶所用的售電量、臺區(qū)的日實際線損率、計算出的結(jié)果與歷史的線損率波動比較,分析原低損臺區(qū)是否呈上升趨勢,確認上升的起始時間點; ③對上述的度量指標與用戶電能表的開蓋記錄相結(jié)合,采用人工網(wǎng)絡(luò)神經(jīng)算法,確定各指標的度量的權(quán)重,針對強相關(guān)的指標,在人工網(wǎng)絡(luò)神經(jīng)算法中設(shè)置相關(guān)因子。
6.根據(jù)權(quán)利要求1所述的用戶用電竊電行為模式的分析方法,其特征在于:所述步驟(5)的具體方法包括: 針對構(gòu)建的竊電分析數(shù)據(jù)模型,利用清洗過的訓(xùn)練數(shù)據(jù)集,對數(shù)據(jù)模型進行訓(xùn)練處理,同時注意建立各算法運行時間指標,對數(shù)據(jù)模型訓(xùn)練出的結(jié)果,做符合度的驗證,確定數(shù)據(jù)模型是否在置信度的范 圍內(nèi),根據(jù)結(jié)果去修正數(shù)據(jù)模型的參數(shù)及算法。
7.根據(jù)權(quán)利要求1所述的用戶用電竊電行為模式的分析方法,其特征在于:所述步驟(6)的具體方法包括: 根據(jù)數(shù)據(jù)分析系統(tǒng)中的竊電行為分析的數(shù)據(jù)模型,對影響竊電因素的度量指標,在整體上評估用電用戶的竊電風險等級,采用貝葉斯信念網(wǎng)絡(luò)算法,根據(jù)不同的度量指標、各自的權(quán)重,確定用電用戶電能表的發(fā)生竊電行為的概率。
【文檔編號】G06Q50/06GK104036357SQ201410260920
【公開日】2014年9月10日 申請日期:2014年6月12日 優(yōu)先權(quán)日:2014年6月12日
【發(fā)明者】鐘珊, 趙寶國, 劉志, 賈培剛, 高偉, 劉軍, 劉罡, 王子興, 孫繼科, 馬濤, 張皓 申請人:國家電網(wǎng)公司, 國網(wǎng)天津市電力公司