本發(fā)明涉及數(shù)據(jù)處理方法,具體涉及一種客戶側(cè)不同類型用電安全用數(shù)據(jù)處理方法。
背景技術(shù):
1、隨著信息化水平的不斷提高,電力企業(yè)在日常的管理過程中積累了海量的用電信息,比如電力信息系統(tǒng)、繼電保護(hù)系統(tǒng)、電網(wǎng)運營系統(tǒng)等不同設(shè)備中的用電信息,這些計量設(shè)備中存有的海量的電力數(shù)據(jù)占據(jù)著電網(wǎng)計算機(jī)存儲系統(tǒng)大量的內(nèi)存,降低了計算機(jī)的運行效率,并增加了電網(wǎng)整體的運行負(fù)擔(dān)。
2、所以亟需利用數(shù)據(jù)提取技術(shù)對這些龐大的電力數(shù)據(jù)進(jìn)行深度的提取分析,從中獲取對電力企業(yè)運行和管理具有指導(dǎo)性和有幫助的用電信息是極其重要和有意義的。
技術(shù)實現(xiàn)思路
1、為此,本發(fā)明提供一種客戶側(cè)不同類型用電安全用數(shù)據(jù)處理方法,以解決現(xiàn)有技術(shù)中的上述問題。為了實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:根據(jù)本發(fā)明的第一方面,一種客戶側(cè)不同類型用電安全用數(shù)據(jù)處理方法,包括:
2、步驟一:構(gòu)建數(shù)據(jù)模型,提取存在異常用電行為的用戶;
3、步驟二:對用電數(shù)據(jù)進(jìn)行預(yù)處理,清洗掉數(shù)據(jù)集中為空、為零、相同的數(shù)據(jù)及剔除掉用電數(shù)據(jù)嚴(yán)重缺失的電力用戶,對用電數(shù)據(jù)缺失值處理,對用電數(shù)據(jù)標(biāo)準(zhǔn)化;
4、步驟三:根據(jù)數(shù)據(jù)相似度,對電力用戶進(jìn)行分類,其劃分算法具體為:
5、
6、其中,||xi-cj‖為數(shù)據(jù)對象xi和聚類中心cj之間的歐式距離;
7、步驟四:對用電數(shù)據(jù)特征選擇和特征降維。
8、進(jìn)一步,構(gòu)建數(shù)據(jù)模型,提取存在異常用電行為的用戶,具體包括:
9、101、在進(jìn)行數(shù)據(jù)提取任務(wù)之前,首先需要對業(yè)務(wù)需求進(jìn)行分析,即弄清楚要做什么以及要達(dá)到怎樣的效果,確定提取的目標(biāo)就是利用電力用戶的負(fù)荷數(shù)據(jù)提取出存在異常用電行為的用戶;
10、102、根據(jù)確定的提取目標(biāo)從數(shù)據(jù)存儲設(shè)備中采集到所需要的提取數(shù)據(jù)集,對采集到的數(shù)據(jù)集進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)變換、數(shù)據(jù)規(guī)約處理;
11、103、通過分析提取對象所屬的類別和希望達(dá)到的提取目的,對提取對象進(jìn)行數(shù)據(jù)預(yù)處理后,考慮要選取哪種適合的提取方法,并對選取的方法進(jìn)行建模分析;
12、104、根據(jù)提取數(shù)據(jù)自身的特點和具有的規(guī)律以及提取的目的選取合適的提取方法來構(gòu)建提取模型;
13、105、對構(gòu)建的模型進(jìn)行性能評估,可以利用模型評價指標(biāo)對采用的提取方法進(jìn)行分析。
14、進(jìn)一步,對用電數(shù)據(jù)進(jìn)行預(yù)處理,包括:
15、對用電數(shù)據(jù)清洗,部分電力用戶的用電數(shù)據(jù)可能會存在大量的缺失值、連續(xù)的空值或者大量的相同值,其中剔除用電數(shù)據(jù)中嚴(yán)重缺失的電力用戶判定規(guī)則為:
16、針對用戶的日負(fù)荷數(shù)據(jù),負(fù)荷數(shù)據(jù)缺失四分之一及其以上的;
17、月負(fù)荷數(shù)據(jù)中有三分之一數(shù)據(jù)缺失的電力用戶;
18、月負(fù)荷數(shù)據(jù)一半以上為零的電力用戶;
19、日、月負(fù)荷數(shù)據(jù)均相同的用戶。
20、進(jìn)一步,對用電數(shù)據(jù)進(jìn)行預(yù)處理,還包括:
21、對用電數(shù)據(jù)缺失值處理,其具體處理公式為:
22、拉格朗日插值公式:
23、對于給定的n+1個數(shù)據(jù)點(x_0,y_0),(x_1,y_1),...,(x_n,y_n),拉格朗日插值多項式l(x)可以表示為:
24、l(x)=σ[i=0to?n]y_i*l_i(x)
25、其中l(wèi)_i(x)是拉格朗日基函數(shù),表示為:
26、l_i(x)=π[j=0to?n,j?。絠](x-x_j)/(x_i-x_j)。
27、進(jìn)一步,對用電數(shù)據(jù)進(jìn)行預(yù)處理,還包括:
28、對用電數(shù)據(jù)標(biāo)準(zhǔn)化,采用最小-最大標(biāo)準(zhǔn)化方法對采集到的用電數(shù)據(jù)進(jìn)行歸一化處理,即對缺失數(shù)據(jù)插補后的用電數(shù)據(jù)進(jìn)行線性變換,使經(jīng)過處理后的用電數(shù)據(jù)介于0和1之間,具體計算公式如下:
29、
30、其中,xnew為標(biāo)準(zhǔn)化處理后的用電數(shù)據(jù),x為用戶原始的用電數(shù)據(jù),xmin、xmax分別為原始用電數(shù)據(jù)在標(biāo)準(zhǔn)化處理前的最小值和最大值。
31、進(jìn)一步,對用電數(shù)據(jù)特征選擇,具體包括:
32、假設(shè)每一類用戶的用電數(shù)據(jù)包含了(li,i=1,2,…,n|li∈n)個用戶h天的用電數(shù)據(jù),每一個用戶的用電數(shù)據(jù)序列可以表示為h維的向量每一類用戶的用電數(shù)據(jù)序列集為sl=(sl,l=1,2,…,li),每一類提取的特征集可以表示為v=(vl,l=1,2,…,li)。
33、本發(fā)明具有如下優(yōu)點:
34、通過建立分析模型,使得工作人員可以對龐大的電力數(shù)據(jù)進(jìn)行深度的提取分析,從中獲取對電力企業(yè)運行和管理具有指導(dǎo)性和有幫助的用電信息是極其重要和有意義的,其中數(shù)據(jù)通過一定的格式轉(zhuǎn)換將數(shù)據(jù)進(jìn)行無量綱化、統(tǒng)一化等處理,使其能夠更加適應(yīng)提取模型對數(shù)據(jù)特性的要求,保證模型分析結(jié)果的準(zhǔn)確性,對數(shù)據(jù)進(jìn)行預(yù)處理,清洗掉數(shù)據(jù)集中為空、為零、相同的數(shù)據(jù)及剔除掉用電數(shù)據(jù)嚴(yán)重缺失的電力用戶,以后期對數(shù)據(jù)的處理效率。
1.一種客戶側(cè)不同類型用電安全用數(shù)據(jù)處理方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種客戶側(cè)不同類型用電安全用數(shù)據(jù)處理方法,其特征在于,構(gòu)建數(shù)據(jù)模型,提取存在異常用電行為的用戶,具體包括:
3.根據(jù)權(quán)利要求1所述的一種客戶側(cè)不同類型用電安全用數(shù)據(jù)處理方法,其特征在于,對用電數(shù)據(jù)進(jìn)行預(yù)處理,包括:
4.根據(jù)權(quán)利要求1所述的一種客戶側(cè)不同類型用電安全用數(shù)據(jù)處理方法,其特征在于,對用電數(shù)據(jù)進(jìn)行預(yù)處理,還包括:
5.根據(jù)權(quán)利要求1所述的一種客戶側(cè)不同類型用電安全用數(shù)據(jù)處理方法,其特征在于,對用電數(shù)據(jù)進(jìn)行預(yù)處理,還包括:
6.根據(jù)權(quán)利要求1所述的一種客戶側(cè)不同類型用電安全用數(shù)據(jù)處理方法,其特征在于,對用電數(shù)據(jù)特征選擇,具體包括: