一種面向削峰填谷的用電行為分析方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種面向削峰填谷的用電行為分析方法,包括:對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚類,獲取負荷在歷史時期內(nèi)不同日期的分群結(jié)果;對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得用戶在不同日期群下的分群結(jié)果;對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特征,獲得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。本發(fā)明能夠?qū)A繑?shù)據(jù)下的用戶用電行為進行分析,進而提高用戶行為定位的準確度,為更有效的開展客戶服務、提高客戶滿意度、降低運營風險提供決策參考。本發(fā)明還公開了一種面向削峰填谷的用電行為分析系統(tǒng)。
【專利說明】
-種面向削峰填谷的用電行為分析方法及系統(tǒng)
技術(shù)領域
[0001] 本發(fā)明設及用電分析技術(shù)領域,尤其設及一種面向削峰填谷的用電行為分析方法 及系統(tǒng)。
【背景技術(shù)】
[0002] 隨著用電采集系統(tǒng)的深化應用、客戶基礎信息的不斷完善,數(shù)據(jù)類型越來越多,數(shù) 據(jù)的精細化程度越來越高,電力信息數(shù)據(jù)呈現(xiàn)爆炸式增長趨勢,電力行業(yè)的大數(shù)據(jù)時代已 經(jīng)到來。目前運些數(shù)據(jù)主要應用于電力公司內(nèi)部營銷業(yè)務輔助決策,海量用電信息的數(shù)據(jù) 價值還沒有充分的挖掘和體現(xiàn)。
[0003] 目前對于用電行為分析,大多直接采用W下方法:
[0004] 專家經(jīng)驗法。一種專家分析方式,靠征求、匯集多位專家的意見進行用電行為分 析。運種方式能充分發(fā)揮專家個人的知識、經(jīng)驗和特長方面的優(yōu)勢。專家經(jīng)驗法是一種簡單 易行、應用方便的方法,但也存在明顯的缺點和不足:受人的主觀因素影響比較大,如專家 的專業(yè)水平和權(quán)威性等,都可能影響分析結(jié)論的準確程度。
[0005] 統(tǒng)計分析法。統(tǒng)計分析是基于統(tǒng)計理論,是應用數(shù)學的一個分支,在統(tǒng)計理論里, W概率論建立隨機性和不確定性的數(shù)據(jù)模型。統(tǒng)計分析可W為大型數(shù)據(jù)集提供兩種服務: 描述和推斷。描述性的統(tǒng)計分析可W概括或描寫數(shù)據(jù)的集合,而推斷性統(tǒng)計分析可W用來 繪制推論過程。但是,統(tǒng)計分析法,依賴于大量的家電設備自身的信息,采集運些數(shù)據(jù)難度 較大,不符合目前的現(xiàn)狀。
[0006] 無監(jiān)督學習法。利用一組類別未知的樣本調(diào)整分類器的參數(shù),使其達到所要求性 能的過程,也稱為無監(jiān)督訓練或無監(jiān)督學習,如聚類。利用各類用電行為數(shù)據(jù),從用電行為 上將相似的用戶聚類,并對每類用戶的行為模式進行識別與分析,提取模式特征。無監(jiān)督學 習,在傳統(tǒng)數(shù)據(jù)量下具備一定指導價值,但在海量數(shù)據(jù)下算法運行的性能得不到保障。
[0007] 綜上所述,傳統(tǒng)的方法在于方式上過于簡單,可在一定程度上對用電行為進行分 析,但在海量數(shù)據(jù)情況下應用效果不是很理想。
【發(fā)明內(nèi)容】
[000引本發(fā)明提供了一種面向削峰填谷的用電行為分析方法,能夠?qū)A繑?shù)據(jù)下的用戶 用電行為進行分析,進而提高用戶行為定位的準確度,為更有效的開展客戶服務、提高客戶 滿意度、降低運營風險提供決策參考。
[0009] 本發(fā)明提供了一種面向削峰填谷的用電行為分析方法,包括:
[0010] 對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚類,獲取負荷在歷史時期 內(nèi)不同日期的分群結(jié)果;
[0011] 對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得用戶 在不同日期群下的分群結(jié)果;
[0012] 對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特征,獲得歷史 上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。
[0013] 優(yōu)選地,所述方法還包括:
[0014] 基于動態(tài)時間規(guī)整方法,分析歷史時期內(nèi)和未來目標日期的相似匹配關(guān)系,獲得 所述未來目標日期的主網(wǎng)和用戶可能的負荷曲線特征。
[0015] 優(yōu)選地,所述對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算 法,獲得用戶在不同日期群下的分群結(jié)果包括:
[0016] 對每個群體化Q = I,…,k)所包含的日期下的所有非居民用戶逐點負荷數(shù)據(jù)進行 并行硬聚類算法,獲得非居民在不同日期群化下的分群結(jié)果化^j = I,…,m);
[0017] 相應的,所述對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特 征,獲得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象為:
[0018] 對比主網(wǎng)日期群Di的負荷特征和非居民用戶在日期群Di下的分群結(jié)果Du的負荷 特征,獲得歷史上不同日期下非居民的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。
[0019] 優(yōu)選地,所述對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算 法,獲得用戶在不同日期群下的分群結(jié)果包括:
[0020] 對每個群體化Q = I,…,k)所包含的日期下的所有居民用戶逐點負荷數(shù)據(jù)進行并 行硬聚類算法,獲得居民在不同日期群化下的分群結(jié)果化X(x = 1,…,y);
[0021] 相應的,所述對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特 征,獲得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象為:
[0022] 對比主網(wǎng)日期群化的負荷特征和居民用戶在化下的分群結(jié)果Dix的負荷特征,獲得 歷史上不同日期下居民的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。
[0023] 優(yōu)選地,所述基于動態(tài)時間規(guī)整方法,分析歷史時期內(nèi)和未來目標日期的相似匹 配關(guān)系,獲得所述未來目標日期的主網(wǎng)和用戶可能的負荷曲線特征包括:
[0024] 將歷史時期分為節(jié)假日、周末和工作日=日期集合;
[0025] 判斷待測日是否為節(jié)假日,若是,則直接用歷史同一節(jié)假日所歸屬的群體進行用 電行為分析,若否,則:
[0026] 根據(jù)溫度利用動態(tài)時間規(guī)整方法,分別在歷史周末集合和工作日集合中尋找歷史 相似日。
[0027] -種面向削峰填谷的用電行為分析系統(tǒng),包括:
[0028] 第一獲取模塊,用于對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚類, 獲取負荷在歷史時期內(nèi)不同日期的分群結(jié)果;
[0029] 第二獲取模塊,用于對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并行硬 聚類算法,獲得用戶在不同日期群下的分群結(jié)果;
[0030] 第S獲取模塊,用于對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的 負荷特征,獲得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。 [0031 ] 優(yōu)選地,所述系統(tǒng)還包括:
[0032] 第四獲取模塊,用于基于動態(tài)時間規(guī)整方法,分析歷史時期內(nèi)和未來目標日期的 相似匹配關(guān)系,獲得所述未來目標日期的主網(wǎng)和用戶可能的負荷曲線特征。
[0033] 優(yōu)選地,所述第二獲取模塊包括:
[0034] 第一硬聚類算法模塊,用于對每個群體DiU = I,…,k)所包含的日期下的所有非 居民用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得非居民在不同日期群化下的分群結(jié)果化J
[0035] 相應的,第S獲取模塊,用于對比主網(wǎng)日期群Di的負荷特征和非居民用戶在日期 群化下的分群結(jié)果化J的負荷特征,獲得歷史上不同日期下非居民的削峰填谷模式匹配結(jié)果 和錯峰用電的目標對象。
[0036] 優(yōu)選地,所述第二獲取模塊包括:
[0037] 第二硬聚類算法模塊,用于對每個群體DiU = I,…,k)所包含的日期下的所有居 民用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得居民在不同日期群化下的分群結(jié)果化x(X =
[003引相應的,第S獲取模塊,用于對比主網(wǎng)日期群化的負荷特征和居民用戶在化下的分 群結(jié)果化X的負荷特征,獲得歷史上不同日期下居民的削峰填谷模式匹配結(jié)果和錯峰用電的 目標對象。
[0039] 優(yōu)選地,所述第四獲取模塊包括:
[0040] 劃分模塊,用于將歷史時期分為節(jié)假日、周末和工作日=日期集合;
[0041] 判斷單元,用于判斷待測日是否為節(jié)假日;
[0042] 查找單元,用于當判斷單元判斷待測日為非節(jié)假日時,根據(jù)溫度利用動態(tài)時間規(guī) 整方法,分別在歷史周末集合和工作日集合中尋找歷史相似日。
[0043] 由上述方案可知,本發(fā)明提供的一種面向削峰填谷的用電行為分析方法,通過對 歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚類,獲取負荷在歷史時期內(nèi)不同日期 的分群結(jié)果,并對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲 得用戶在不同日期群下的分群結(jié)果,對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群 結(jié)果的負荷特征,獲得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標 對象。實現(xiàn)了通過對海量數(shù)據(jù)下用戶用電行為的分析,提高了用戶行為定位的準確度,為更 有效的開展客戶服務、提高客戶滿意度、降低運營風險提供了決策參考。
【附圖說明】
[0044] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可W 根據(jù)運些附圖獲得其他的附圖。
[0045] 圖1為本發(fā)明實施例一公開的一種面向削峰填谷的用電行為分析方法的流程圖;
[0046] 圖2為本發(fā)明實施例二公開的一種面向削峰填谷的用電行為分析方法的流程圖;
[0047] 圖3為本發(fā)明實施例=公開的一種面向削峰填谷的用電行為分析方法的流程圖;
[0048] 圖4為本發(fā)明實施例一公開的一種面向削峰填谷的用電行為分析系統(tǒng)的結(jié)構(gòu)示意 圖;
[0049] 圖5為本發(fā)明實施例二公開的一種面向削峰填谷的用電行為分析系統(tǒng)的結(jié)構(gòu)示意 圖;
[0050] 圖6為本發(fā)明實施例=公開的一種面向削峰填谷的用電行為分析系統(tǒng)的結(jié)構(gòu)示意 圖。
【具體實施方式】
[0051] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;?本發(fā)明中的實施例,本領域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0052] 如圖1所示,為本發(fā)明實施例一公開的一種面向削峰填谷的用電行為分析方法,包 括:
[0053] S101、對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚類,獲取負荷在歷 史時期內(nèi)不同日期的分群結(jié)果;
[0054] 當需要對用戶的用電行為進行分析時,從用電信息采集系統(tǒng)、調(diào)度自動化系統(tǒng)中 獲取用戶用電負荷及區(qū)域主網(wǎng)負荷的相關(guān)數(shù)據(jù),根據(jù)某區(qū)域歷史時期內(nèi)的主網(wǎng)每日的逐點 負荷數(shù)據(jù),對日期進行EM聚類化邱ec1:ation Maximization Algorithm,最大期望算法),實 現(xiàn)負荷在不同日期的分群結(jié)果。EM聚類化邱ec1:ation Maximization Algorithm,最大期望 算法),是一種迭代算法,用于含有隱變量的概率參數(shù)模型的最大似然估計或極大后驗概率 估計。EM聚類主要是兩個步驟:E步驟,最大期望判別所屬分4
和M步驟, 極大似然估計概率參^
。通過交替使用運兩個步驟, EM聚類逐步改進模型的參數(shù),使參數(shù)和訓練樣本的似然概率逐漸增大,最后終止于一個極 大點。EM聚類在依賴于不可觀察的隱變量的概率模型中被用于尋找概率模型參數(shù)的最大似 然估計,在EM聚類算法中,隱變量就是數(shù)據(jù)項所屬的類。
[0055] 根據(jù)EM算法的運行原理,將主網(wǎng)歷史負荷曲線分成化,…,Dk等k個群體,每個群體 內(nèi)的日期具備相似的負荷曲線特征,而不同群體之間的日期的逐點負荷存在比較大的差 異。通過分群,可W獲得主網(wǎng)在不同時期負荷的不同特征。
[0056] S102、對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲 得用戶在不同日期群下的分群結(jié)果;
[0057] 對于每個日期群體化(i = 1,…,k)下的日期,提取運些日期下的用戶的負荷數(shù)據(jù), 用Map-Reduce環(huán)境下的K-Means進行聚類。通過并行K-Means算法可W得到Di (i = 1,…,k) 下的用戶的負荷曲線特征。
[005引K-Means:是硬聚類算法,是典型的基于原型的目標函數(shù)聚類方法的代表,它是數(shù) 據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整 規(guī)則。K-means算法W歐式距離作為相似度測度,它是求對應某一初始聚類中屯、向量的最優(yōu) 分類,使得評價指標最小。算法采用誤差平方和準則函數(shù)作為聚類準則函數(shù)。
[0059]基于Map-Reduce下的并行K-Means包括3個階段,即INITIAL STAGE、MAP STAGE、 REDUCE STAGEo
[0060] INITIAL STAGE:首先確定聚類個數(shù)n,然后隨機生成n個中屯、點,同時將原始數(shù)據(jù) 集分成若干個數(shù)據(jù)塊。
[0061 ] MAP STAGE:將每一個數(shù)據(jù)子集對應分配給一個map函數(shù),針對每個數(shù)據(jù)塊,map函 數(shù)計算每個樣本所屬類別。map函數(shù)首先基于歐式距離公式計算每個樣本與每個中屯、點的 距離,然后找出與該樣本距離最近的中屯、點,每個樣本都被歸類到與其距離最近的中屯、點 所屬類別。
[0062] R抓UCE STAGE:歸并各數(shù)據(jù)塊歸類結(jié)果得到完整的聚類結(jié)果,重新計算類中屯、作 為下一次迭代的輸入,繼續(xù)進行下一次MAP STAGE迭代直至算法收斂(即類中屯、不再變化)。
[0063] S103、對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特征,獲 得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。
[0064] 對比主網(wǎng)負荷曲線特征和非居民/居民的負荷曲線特征,進行削峰填谷模式匹配, 得到迎峰型、逆峰型等用電客戶類型,進而發(fā)現(xiàn)重點錯峰用電對象。
[0065] 綜上所述,在上述實施例中,通過對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算 法進行聚類,獲取負荷在歷史時期內(nèi)不同日期的分群結(jié)果,并對每個群體所包含的日期下 的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得用戶在不同日期群下的分群結(jié)果,對比主 網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特征,獲得歷史上不同日期下用 戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。實現(xiàn)了通過對海量數(shù)據(jù)下用戶用電行 為的分析,提高了用戶行為定位的準確度,為更有效的開展客戶服務、提高客戶滿意度、降 低運營風險提供了決策參考。
[0066] 如圖2所示,為本發(fā)明實施例二公開的一種面向削峰填谷的用電行為分析方法,包 括:
[0067] S201、對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚類,獲取負荷在歷 史時期內(nèi)不同日期的分群結(jié)果;
[0068] 當需要對用戶的用電行為進行分析時,從用電信息采集系統(tǒng)、調(diào)度自動化系統(tǒng)中 獲取用戶用電負荷及區(qū)域主網(wǎng)負荷的相關(guān)數(shù)據(jù),根據(jù)某區(qū)域歷史時期內(nèi)的主網(wǎng)每日的逐點 負荷數(shù)據(jù),對日期進行EM聚類化邱ec1:ation Maximization Algorithm,最大期望算法),實 現(xiàn)負荷在不同日期的分群結(jié)果。EM聚類化邱ec1:ation Maximization Algorithm,最大期望 算法),是一種迭代算法,用于含有隱變量的概率參數(shù)模型的最大似然估計或極大后驗概率 估計。EM聚類主要是兩個步驟:E步驟,最大期望判別所屬分布
和M步驟, 極大似然估計概率參^
。通過交替使用運兩個步驟, EM聚類逐步改進模型的參數(shù),使參數(shù)和訓練樣本的似然概率逐漸增大,最后終止于一個極 大點。EM聚類在依賴于不可觀察的隱變量的概率模型中被用于尋找概率模型參數(shù)的最大似 然估計,在EM聚類算法中,隱變量就是數(shù)據(jù)項所屬的類。
[0069] 根據(jù)EM算法的運行原理,將主網(wǎng)歷史負荷曲線分成化,…,Dk等k個群體,每個群體 內(nèi)的日期具備相似的負荷曲線特征,而不同群體之間的日期的逐點負荷存在比較大的差 異。通過分群,可W獲得主網(wǎng)在不同時期負荷的不同特征。
[0070] S202、對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲 得用戶在不同日期群下的分群結(jié)果;
[0071] 對于每個日期群體化Q = I,…,k)下的日期,提取運些日期下的用戶的負荷數(shù)據(jù), 用Map-Reduce環(huán)境下的K-Means進行聚類。通過并行K-Means算法可W得到Di (i = 1,…,k) 下的用戶的負荷曲線特征。
[0072] K-Means:是硬聚類算法,是典型的基于原型的目標函數(shù)聚類方法的代表,它是數(shù) 據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整 規(guī)則。K-means算法W歐式距離作為相似度測度,它是求對應某一初始聚類中屯、向量的最優(yōu) 分類,使得評價指標最小。算法采用誤差平方和準則函數(shù)作為聚類準則函數(shù)。
[0073] 基于Map-Reduce下的并行K-Means包括3個階段,即INITIAL STAGE、MAP STAGE、 REDUCE STAGEo
[0074] INITIAL STAGE:首先確定聚類個數(shù)n,然后隨機生成n個中屯、點,同時將原始數(shù)據(jù) 集分成若干個數(shù)據(jù)塊。
[00巧]MAP STAGE:將每一個數(shù)據(jù)子集對應分配給一個map函數(shù),針對每個數(shù)據(jù)塊,map函 數(shù)計算每個樣本所屬類別。map函數(shù)首先基于歐式距離公式計算每個樣本與每個中屯、點的 距離,然后找出與該樣本距離最近的中屯、點,每個樣本都被歸類到與其距離最近的中屯、點 所屬類別。
[0076] R抓UCE STAGE:歸并各數(shù)據(jù)塊歸類結(jié)果得到完整的聚類結(jié)果,重新計算類中屯、作 為下一次迭代的輸入,繼續(xù)進行下一次MAP STAGE迭代直至算法收斂(即類中屯、不再變化)。
[0077] S203、對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特征,獲 得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象;
[0078] 對比主網(wǎng)負荷曲線特征和非居民/居民的負荷曲線特征,進行削峰填谷模式匹配, 得到迎峰型、逆峰型等用電客戶類型,進而發(fā)現(xiàn)重點錯峰用電對象。
[0079] S204、基于動態(tài)時間規(guī)整方法,分析歷史時期內(nèi)和未來目標日期的相似匹配關(guān)系, 獲得所述未來目標日期的主網(wǎng)和用戶可能的負荷曲線特征。
[0080] 根據(jù)動態(tài)時間規(guī)整方法,分析歷史時期內(nèi)和未來目標日期的相似匹配關(guān)系。提前 獲得目標日期的主網(wǎng)和用戶可能的負荷曲線特征,提供用戶分類及個性化服務、電力生產(chǎn) 調(diào)度服務、峰谷電價制定、有序用電方案制定、用電服務指導及相關(guān)增值服務。
[0081] 綜上所述,在上述實施例中,通過對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算 法進行聚類,獲取負荷在歷史時期內(nèi)不同日期的分群結(jié)果,并對每個群體所包含的日期下 的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得用戶在不同日期群下的分群結(jié)果,對比主 網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特征,獲得歷史上不同日期下用 戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。實現(xiàn)了通過對海量數(shù)據(jù)下用戶用電行 為的分析,提高了用戶行為定位的準確度,為更有效的開展客戶服務、提高客戶滿意度、降 低運營風險提供了決策參考。同時,根據(jù)動態(tài)時間規(guī)整方法,分析歷史時期內(nèi)和未來目標日 期的相似匹配關(guān)系。能夠提前獲得目標日期的主網(wǎng)和用戶可能的負荷曲線特征,提供用戶 分類及個性化服務、電力生產(chǎn)調(diào)度服務、峰谷電價制定、有序用電方案制定、用電服務指導 及相關(guān)增值服務。
[0082] 如圖3所示,為本發(fā)明實施例=公開的一種面向削峰填谷的用電行為分析方法,包 括:
[0083] S301、對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚類,獲取負荷在歷 史時期內(nèi)不同日期的分群結(jié)果;
[0084] 當需要對用戶的用電行為進行分析時,從用電信息采集系統(tǒng)、調(diào)度自動化系統(tǒng)中 獲取用戶用電負荷及區(qū)域主網(wǎng)負荷的相關(guān)數(shù)據(jù),根據(jù)某區(qū)域歷史時期內(nèi)的主網(wǎng)每日的逐點 負荷數(shù)據(jù),對日期進行EM聚類化邱ec1:ation Maximization Algorithm,最大期望算法),實 現(xiàn)負荷在不同日期的分群結(jié)果。EM聚類化邱ec1:ation Maximization Algorithm,最大期望 算法),是一種迭代算法,用于含有隱變量的概率參數(shù)模型的最大似然估計或極大后驗概率 估計。EM聚類主要是兩個步驟:E步驟,最大期望判別所屬分^
和M步驟, 極大似然估計概率參I
。通過交替使用運兩個步驟, EM聚類逐步改進模型的參數(shù),使參數(shù)和訓練樣本的似然概率逐漸增大,最后終止于一個極 大點。EM聚類在依賴于不可觀察的隱變量的概率模型中被用于尋找概率模型參數(shù)的最大似 然估計,在EM聚類算法中,隱變量就是數(shù)據(jù)項所屬的類。
[0085] 根據(jù)EM算法的運行原理,將主網(wǎng)歷史負荷曲線分成化,…,Dk等k個群體,每個群體 內(nèi)的日期具備相似的負荷曲線特征,而不同群體之間的日期的逐點負荷存在比較大的差 異。通過分群,可W獲得主網(wǎng)在不同時期負荷的不同特征。
[0086] S302、對每個群體DiU = I,…,k)所包含的日期下的所有非居民用戶逐點負荷數(shù) 據(jù)進行并行硬聚類算法,獲得非居民在不同日期群化下的分群結(jié)果化^ j = 1,…,m);
[0087] 對于每個日期群體DiQ = I,…,k)下的日期,提取運些日期下的非居民用戶的負 荷數(shù)據(jù),用Map-Reduce環(huán)境下的K-Means進行聚類。通過并行K-Means算法獲得非居民在不 同日期群化下的分群結(jié)果化^ j = 1,…,m)。
[0088] K-Means:是硬聚類算法,是典型的基于原型的目標函數(shù)聚類方法的代表,它是數(shù) 據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整 規(guī)則。K-means算法W歐式距離作為相似度測度,它是求對應某一初始聚類中屯、向量的最優(yōu) 分類,使得評價指標最小。算法采用誤差平方和準則函數(shù)作為聚類準則函數(shù)。
[0089] 基于Map-Reduce下的并行K-Means包括3個階段,即INITIAL STAGE、MAP STAGE、 REDUCE STAGEo
[0090] INITIAL STAGE:首先確定聚類個數(shù)n,然后隨機生成n個中屯、點,同時將原始數(shù)據(jù) 集分成若干個數(shù)據(jù)塊。
[0091] MAP STAGE:將每一個數(shù)據(jù)子集對應分配給一個map函數(shù),針對每個數(shù)據(jù)塊,map函 數(shù)計算每個樣本所屬類別。map函數(shù)首先基于歐式距離公式計算每個樣本與每個中屯、點的 距離,然后找出與該樣本距離最近的中屯、點,每個樣本都被歸類到與其距離最近的中屯、點 所屬類別。
[0092] R抓UCE STAGE:歸并各數(shù)據(jù)塊歸類結(jié)果得到完整的聚類結(jié)果,重新計算類中屯、作 為下一次迭代的輸入,繼續(xù)進行下一次MAP STAGE迭代直至算法收斂(即類中屯、不再變化)。
[0093] S303、對比主網(wǎng)日期群化的負荷特征和非居民用戶在日期群Di下的分群結(jié)果化J的 負荷特征,獲得歷史上不同日期下非居民的削峰填谷模式匹配結(jié)果和錯峰用電的目標對 象;
[0094] 對比主網(wǎng)日期群化的負荷特征和非居民用戶在Di下的分群結(jié)果化J的負荷特征,獲 得歷史上不同日期下非居民的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。根據(jù)非居民 群體的負荷特征制定有序用電及峰谷電價方案,對非居民各類主體的電力供需特征予W跟 蹤分析、推送展示、實時預測、及時預警,W進一步實現(xiàn)配電網(wǎng)負荷的削峰填谷和平穩(wěn)運行, 提升電力企業(yè)的精細化運營管理和需求側(cè)管理水平。
[00M] S304、對每個群體DiU = I,…,k)所包含的日期下的所有居民用戶逐點負荷數(shù)據(jù) 進行并行硬聚類算法,獲得居民在不同日期群化下的分群結(jié)果化x(x = 1,…,y);
[0096] 對于每個日期群體DiQ = I,…,k)下的日期,提取運些日期下的非居民用戶的負 荷數(shù)據(jù),用Map-Reduce環(huán)境下的K-Means進行聚類。通過并行K-Means算法獲得非居民在不 同日期群化下的分群結(jié)果DixU = 1,…,y)。
[0097] K-Means:是硬聚類算法,是典型的基于原型的目標函數(shù)聚類方法的代表,它是數(shù) 據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整 規(guī)則。K-means算法W歐式距離作為相似度測度,它是求對應某一初始聚類中屯、向量的最優(yōu) 分類,使得評價指標最小。算法采用誤差平方和準則函數(shù)作為聚類準則函數(shù)。
[0098] 基于Map-Reduce下的并行K-Means包括3個階段,即INITIAL STAGE、MAP STAGE、 REDUCE STAGEo
[0099] INITIAL STAGE:首先確定聚類個數(shù)n,然后隨機生成n個中屯、點,同時將原始數(shù)據(jù) 集分成若干個數(shù)據(jù)塊。
[0100] MAP STAGE:將每一個數(shù)據(jù)子集對應分配給一個map函數(shù),針對每個數(shù)據(jù)塊,map函 數(shù)計算每個樣本所屬類別。map函數(shù)首先基于歐式距離公式計算每個樣本與每個中屯、點的 距離,然后找出與該樣本距離最近的中屯、點,每個樣本都被歸類到與其距離最近的中屯、點 所屬類別。
[0101] R抓UCE STAGE:歸并各數(shù)據(jù)塊歸類結(jié)果得到完整的聚類結(jié)果,重新計算類中屯、作 為下一次迭代的輸入,繼續(xù)進行下一次MAP STAGE迭代直至算法收斂(即類中屯、不再變化)。
[0102] S305、對比主網(wǎng)日期群Di的負荷特征和居民用戶在Di下的分群結(jié)果Dix的負荷特 征,獲得歷史上不同日期下居民的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象;
[0103] 對比主網(wǎng)日期群化的負荷特征和居民用戶在化下的分群結(jié)果Dix的負荷特征,獲得 歷史上不同日期下居民的削峰填谷模式匹配結(jié)果和智能用電的目標對象。根據(jù)居民群體的 負荷特征對居民用戶用電行為予W解析,制定峰谷電價方案,探索指導用戶智能用電的需 求側(cè)管理模式。
[0104] S306、將歷史時期分為節(jié)假日、周末和工作日S日期集合;
[0105] S307、判斷待測日是否為節(jié)假日,若是,則進入S308,若否,則進入S309:
[0106] S308、直接用歷史同一節(jié)假日所歸屬的群體進行用電行為分析;
[0107] S309、根據(jù)溫度利用動態(tài)時間規(guī)整方法,分別在歷史周末集合和工作日集合中尋 找歷史相似日。
[0108] 動態(tài)時間規(guī)整方法具體描述如下:
[0109] 輸入:歷史年時間段內(nèi)周末\工作日溫度序列T〇id=(Ti,…,Tm),當前年同時間段內(nèi) 且包含待測日的周末\工作日溫度序歹
,滿足m>n。
[0110] 過程:捜索從巧,巧)點出發(fā)捜索至巧,,氏),可W展開若干條路徑,可計算每條路徑 達到巧,,,7)點時的總的積累距離,通過逐點向前尋找就可W求得整條路徑,具有最小累積 距離者即為規(guī)整路徑。對于巧,其可達到該格點的只可能是巧,^)、巧_1,巧)和 巧,吊),即選擇到運3個格點距離之中最小的路徑延伸到達巧,巧。求解兩序列匹配時,累 計距離最小所對應的規(guī)整函數(shù)O巧,兩,它表示為序列Teld上點Tl和Tnew上的點^之間的規(guī) 整路徑距離:
[0111]
[0112] 其中DistQJ)為Tcid上點Tl和Tnew上的點巧之間的歐式距離,在本發(fā)明中,該距離 為Tl和巧對應日期的溫度的差的絕對值。
[0113] 輸出:最小規(guī)整距離,W及點和點的匹配關(guān)系結(jié)果。
[0114] 運樣,每個目標日都可W找到歷史中的相似匹配日,從而得到目標日期主網(wǎng)及用 電客戶可能出現(xiàn)的負荷曲線特征,按照主網(wǎng)特征曲線和用電客戶用電特征曲線的削峰填谷 模式匹配結(jié)果,判斷用電客戶在該目標日下是否需要錯峰用電。如果用電客戶的負荷曲線 避開了主網(wǎng)的負荷高峰(逆峰型),則該用電客戶不是開展錯避峰用電措施的對象。如果用 電客戶的負荷曲線與主網(wǎng)的負荷曲線形狀相同(迎峰型)或用電客戶的負荷曲線一直處于 高峰水平(連續(xù)高峰型),則該用電客戶是開展錯避峰措施的重點客戶,可W通過有序用電、 峰谷電價等方式引導該客戶避開用電高峰,同時需要關(guān)注該類客戶電氣設備安全使用情 況。
[0115] 如圖4所示,為本發(fā)明實施例一公開的一種面向削峰填谷的用電行為分析系統(tǒng),包 括:
[0116] 第一獲取模塊401,用于對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚 類,獲取負荷在歷史時期內(nèi)不同日期的分群結(jié)果;
[0117] 當需要對用戶的用電行為進行分析時,從用電信息采集系統(tǒng)、調(diào)度自動化系統(tǒng)中 獲取用戶用電負荷及區(qū)域主網(wǎng)負荷的相關(guān)數(shù)據(jù),根據(jù)某區(qū)域歷史時期內(nèi)的主網(wǎng)每日的逐點 負荷數(shù)據(jù),對日期進行EM聚類化邱ec1:ation Maximization Algorithm,最大期望算法),實 現(xiàn)負荷在不同日期的分群結(jié)果。EM聚類化邱ec1:ation Maximization Algorithm,最大期望 算法),是一種迭代算法,用于含有隱變量的概率參數(shù)模型的最大似然估計或極大后驗概率 估計。EM聚類主要是兩個步驟:E步驟,最大期望判別所屬分^
和M步驟, 極大似然估計概率參避 。通過交替使用運兩個步驟, EM聚類逐步改進模型的參數(shù),使參數(shù)和訓練樣本的似然概率逐漸增大,最后終止于一個極 大點。EM聚類在依賴于不可觀察的隱變量的概率模型中被用于尋找概率模型參數(shù)的最大似 然估計,在EM聚類算法中,隱變量就是數(shù)據(jù)項所屬的類。
[0118] 根據(jù)EM算法的運行原理,將主網(wǎng)歷史負荷曲線分成化,…,Dk等k個群體,每個群體 內(nèi)的日期具備相似的負荷曲線特征,而不同群體之間的日期的逐點負荷存在比較大的差 異。通過分群,可W獲得主網(wǎng)在不同時期負荷的不同特征。
[0119] 第二獲取模塊402,用于對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并 行硬聚類算法,獲得用戶在不同日期群下的分群結(jié)果;
[0120] 對于每個日期群體化Q = I,…,k)下的日期,提取運些日期下的用戶的負荷數(shù)據(jù), 用Map-Reduce環(huán)境下的K-Means進行聚類。通過并行K-Means算法可W得到Di (i = 1,…,k) 下的用戶的負荷曲線特征。
[0121] K-Means:是硬聚類算法,是典型的基于原型的目標函數(shù)聚類方法的代表,它是數(shù) 據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整 規(guī)則。K-means算法W歐式距離作為相似度測度,它是求對應某一初始聚類中屯、向量的最優(yōu) 分類,使得評價指標最小。算法采用誤差平方和準則函數(shù)作為聚類準則函數(shù)。
[0122] 基于Map-Reduce下的并行K-Means包括3個階段,即INITIAL STAGE、MAP STAGE、 REDUCE STAGEo
[0123] INITIAL STAGE:首先確定聚類個數(shù)n,然后隨機生成n個中屯、點,同時將原始數(shù)據(jù) 集分成若干個數(shù)據(jù)塊。
[0124] MAP STAGE:將每一個數(shù)據(jù)子集對應分配給一個map函數(shù),針對每個數(shù)據(jù)塊,map函 數(shù)計算每個樣本所屬類別。map函數(shù)首先基于歐式距離公式計算每個樣本與每個中屯、點的 距離,然后找出與該樣本距離最近的中屯、點,每個樣本都被歸類到與其距離最近的中屯、點 所屬類別。
[0125] R抓UCE STAGE:歸并各數(shù)據(jù)塊歸類結(jié)果得到完整的聚類結(jié)果,重新計算類中屯、作 為下一次迭代的輸入,繼續(xù)進行下一次MAP STAGE迭代直至算法收斂(即類中屯、不再變化)。 [01%]第S獲取模塊403,用于對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié) 果的負荷特征,獲得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對 象。
[0127] 對比主網(wǎng)負荷曲線特征和非居民/居民的負荷曲線特征,進行削峰填谷模式匹配, 得到迎峰型、逆峰型等用電客戶類型,進而發(fā)現(xiàn)重點錯峰用電對象。
[0128] 綜上所述,在上述實施例中,通過對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算 法進行聚類,獲取負荷在歷史時期內(nèi)不同日期的分群結(jié)果,并對每個群體所包含的日期下 的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得用戶在不同日期群下的分群結(jié)果,對比主 網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特征,獲得歷史上不同日期下用 戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。實現(xiàn)了通過對海量數(shù)據(jù)下用戶用電行 為的分析,提高了用戶行為定位的準確度,為更有效的開展客戶服務、提高客戶滿意度、降 低運營風險提供了決策參考。
[0129] 如圖5所示,為本發(fā)明實施例二公開的一種面向削峰填谷的用電行為分析系統(tǒng),包 括:
[0130] 第一獲取模塊501,用于對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚 類,獲取負荷在歷史時期內(nèi)不同日期的分群結(jié)果;
[0131] 當需要對用戶的用電行為進行分析時,從用電信息采集系統(tǒng)、調(diào)度自動化系統(tǒng)中 獲取用戶用電負荷及區(qū)域主網(wǎng)負荷的相關(guān)數(shù)據(jù),根據(jù)某區(qū)域歷史時期內(nèi)的主網(wǎng)每日的逐點 負荷數(shù)據(jù),對日期進行EM聚類化邱ec1:ation Maximization Algorithm,最大期望算法),實 現(xiàn)負荷在不同日期的分群結(jié)果。EM聚類化邱ec1:ation Maximization Algorithm,最大期望 算法),是一種迭代算法,用于含有隱變量的概率參數(shù)模型的最大似然估計或極大后驗概率 估計。EM聚類主要是兩個步驟:E步驟,最大期望判別所屬分4
和M步驟, 極大似然估計概率參i
通過交替使用運兩個步驟, EM聚類逐步改進模型的參數(shù),使參數(shù)和訓練樣本的似然概率逐漸增大,最后終止于一個極 大點。EM聚類在依賴于不可觀察的隱變量的概率模型中被用于尋找概率模型參數(shù)的最大似 然估計,在EM聚類算法中,隱變量就是數(shù)據(jù)項所屬的類。
[0132] 根據(jù)EM算法的運行原理,將主網(wǎng)歷史負荷曲線分成化,…,Dk等k個群體,每個群體 內(nèi)的日期具備相似的負荷曲線特征,而不同群體之間的日期的逐點負荷存在比較大的差 異。通過分群,可W獲得主網(wǎng)在不同時期負荷的不同特征。
[0133] 第二獲取模塊502,用于對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并 行硬聚類算法,獲得用戶在不同日期群下的分群結(jié)果;
[0134] 對于每個日期群體化Q = I,…,k)下的日期,提取運些日期下的用戶的負荷數(shù)據(jù), 用Map-Reduce環(huán)境下的K-Means進行聚類。通過并行K-Means算法可W得到Di (i = 1,…,k) 下的用戶的負荷曲線特征。
[0135] K-Means:是硬聚類算法,是典型的基于原型的目標函數(shù)聚類方法的代表,它是數(shù) 據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整 規(guī)則。K-means算法W歐式距離作為相似度測度,它是求對應某一初始聚類中屯、向量的最優(yōu) 分類,使得評價指標最小。算法采用誤差平方和準則函數(shù)作為聚類準則函數(shù)。
[0136] 基于Map-Reduce下的并行K-Means包括3個階段,即INITIAL STAGE、MAP STAGE、 REDUCE STAGEo
[0137] INITIAL STAGE:首先確定聚類個數(shù)n,然后隨機生成n個中屯、點,同時將原始數(shù)據(jù) 集分成若干個數(shù)據(jù)塊。
[0138] MAP STAGE:將每一個數(shù)據(jù)子集對應分配給一個map函數(shù),針對每個數(shù)據(jù)塊,map函 數(shù)計算每個樣本所屬類別。map函數(shù)首先基于歐式距離公式計算每個樣本與每個中屯、點的 距離,然后找出與該樣本距離最近的中屯、點,每個樣本都被歸類到與其距離最近的中屯、點 所屬類別。
[0139] 服DUCE STAGE:歸并各數(shù)據(jù)塊歸類結(jié)果得到完整的聚類結(jié)果,重新計算類中屯、作 為下一次迭代的輸入,繼續(xù)進行下一次MAP STAGE迭代直至算法收斂(即類中屯、不再變化)。
[0140] 第S獲取模塊503,用于對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié) 果的負荷特征,獲得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對 象;
[0141] 對比主網(wǎng)負荷曲線特征和非居民/居民的負荷曲線特征,進行削峰填谷模式匹配, 得到迎峰型、逆峰型等用電客戶類型,進而發(fā)現(xiàn)重點錯峰用電對象。
[0142] 第四獲取模塊504,用于基于動態(tài)時間規(guī)整方法,分析歷史時期內(nèi)和未來目標日期 的相似匹配關(guān)系,獲得所述未來目標日期的主網(wǎng)和用戶可能的負荷曲線特征。
[0143] 根據(jù)動態(tài)時間規(guī)整方法,分析歷史時期內(nèi)和未來目標日期的相似匹配關(guān)系。提前 獲得目標日期的主網(wǎng)和用戶可能的負荷曲線特征,提供用戶分類及個性化服務、電力生產(chǎn) 調(diào)度服務、峰谷電價制定、有序用電方案制定、用電服務指導及相關(guān)增值服務。
[0144] 綜上所述,在上述實施例中,通過對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算 法進行聚類,獲取負荷在歷史時期內(nèi)不同日期的分群結(jié)果,并對每個群體所包含的日期下 的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得用戶在不同日期群下的分群結(jié)果,對比主 網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特征,獲得歷史上不同日期下用 戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。實現(xiàn)了通過對海量數(shù)據(jù)下用戶用電行 為的分析,提高了用戶行為定位的準確度,為更有效的開展客戶服務、提高客戶滿意度、降 低運營風險提供了決策參考。同時,根據(jù)動態(tài)時間規(guī)整方法,分析歷史時期內(nèi)和未來目標日 期的相似匹配關(guān)系。能夠提前獲得目標日期的主網(wǎng)和用戶可能的負荷曲線特征,提供用戶 分類及個性化服務、電力生產(chǎn)調(diào)度服務、峰谷電價制定、有序用電方案制定、用電服務指導 及相關(guān)增值服務。
[0145] 如圖6所示,為本發(fā)明實施例=公開的一種面向削峰填谷的用電行為分析系統(tǒng),包 括:
[0146] 第一獲取模塊601,用于對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚 類,獲取負荷在歷史時期內(nèi)不同日期的分群結(jié)果;
[0147] 當需要對用戶的用電行為進行分析時,從用電信息采集系統(tǒng)、調(diào)度自動化系統(tǒng)中 獲取用戶用電負荷及區(qū)域主網(wǎng)負荷的相關(guān)數(shù)據(jù),根據(jù)某區(qū)域歷史時期內(nèi)的主網(wǎng)每日的逐點 負荷數(shù)據(jù),對日期進行EM聚類化邱ec1:ation Maximization Algorithm,最大期望算法),實 現(xiàn)負荷在不同日期的分群結(jié)果。EM聚類化邱ec1:ation Maximization Algorithm,最大期望 算法),是一種迭代算法,用于含有隱變量的概率參數(shù)模型的最大似然估計或極大后驗概率 估計。EM聚類主要是兩個步驟:E步驟,最大期望判別所屬分3
和M步驟, 極大似然估計概率參避 通過交替使用運兩個步驟, EM聚類逐步改進模型的參數(shù),使參數(shù)和訓練樣本的似然概率逐漸增大,最后終止于一個極 大點。EM聚類在依賴于不可觀察的隱變量的概率模型中被用于尋找概率模型參數(shù)的最大似 然估計,在EM聚類算法中,隱變量就是數(shù)據(jù)項所屬的類。
[0148] 根據(jù)EM算法的運行原理,將主網(wǎng)歷史負荷曲線分成化,…,Dk等k個群體,每個群體 內(nèi)的日期具備相似的負荷曲線特征,而不同群體之間的日期的逐點負荷存在比較大的差 異。通過分群,可W獲得主網(wǎng)在不同時期負荷的不同特征。
[0149] 第一硬聚類算法模塊602,用于對每個群體DiQ = I,…,k)所包含的日期下的所有 非居民用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得非居民在不同日期群化下的分群結(jié)果
[0150] 對于每個日期群體DiQ = I,…,k)下的日期,提取運些日期下的非居民用戶的負 荷數(shù)據(jù),用Map-Reduce環(huán)境下的K-Means進行聚類。通過并行K-Means算法獲得非居民在不 同日期群化下的分群結(jié)果化^ j = 1,…,m)。
[0151] K-Means:是硬聚類算法,是典型的基于原型的目標函數(shù)聚類方法的代表,它是數(shù) 據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整 規(guī)則。K-means算法W歐式距離作為相似度測度,它是求對應某一初始聚類中屯、向量的最優(yōu) 分類,使得評價指標最小。算法采用誤差平方和準則函數(shù)作為聚類準則函數(shù)。
[0152] 基于Map-Reduce下的并行K-Means包括3個階段,即INITIAL STAGE、MAP STAGE、 REDUCE STAGEo
[0153] INITIAL STAGE:首先確定聚類個數(shù)n,然后隨機生成n個中屯、點,同時將原始數(shù)據(jù) 集分成若干個數(shù)據(jù)塊。
[0154] MAP STAGE:將每一個數(shù)據(jù)子集對應分配給一個map函數(shù),針對每個數(shù)據(jù)塊,map函 數(shù)計算每個樣本所屬類別。map函數(shù)首先基于歐式距離公式計算每個樣本與每個中屯、點的 距離,然后找出與該樣本距離最近的中屯、點,每個樣本都被歸類到與其距離最近的中屯、點 所屬類別。
[0K5] R抓UCE STAGE:歸并各數(shù)據(jù)塊歸類結(jié)果得到完整的聚類結(jié)果,重新計算類中屯、作 為下一次迭代的輸入,繼續(xù)進行下一次MAP STAGE迭代直至算法收斂(即類中屯、不再變化)。
[0156] 第S獲取模塊603,用于對比主網(wǎng)日期群化的負荷特征和非居民用戶在日期群化下 的分群結(jié)果化J的負荷特征,獲得歷史上不同日期下非居民的削峰填谷模式匹配結(jié)果和錯峰 用電的目標對象;
[0157] 對比主網(wǎng)日期群化的負荷特征和非居民用戶在Di下的分群結(jié)果化J的負荷特征,獲 得歷史上不同日期下非居民的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。根據(jù)非居民 群體的負荷特征制定有序用電及峰谷電價方案,對非居民各類主體的電力供需特征予W跟 蹤分析、推送展示、實時預測、及時預警,W進一步實現(xiàn)配電網(wǎng)負荷的削峰填谷和平穩(wěn)運行, 提升電力企業(yè)的精細化運營管理和需求側(cè)管理水平。
[0158] 第二硬聚類算法模塊604,用于對每個群體DiQ = I,…,k)所包含的日期下的所有 居民用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得居民在不同日期群Di下的分群結(jié)果化x(x = i,...,y);
[0159] 對于每個日期群體DiQ = I,…,k)下的日期,提取運些日期下的非居民用戶的負 荷數(shù)據(jù),用Map-Reduce環(huán)境下的K-Means進行聚類。通過并行K-Means算法獲得非居民在不 同日期群化下的分群結(jié)果DixU = 1,…,y)。
[0160] K-Means:是硬聚類算法,是典型的基于原型的目標函數(shù)聚類方法的代表,它是數(shù) 據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整 規(guī)則。K-means算法W歐式距離作為相似度測度,它是求對應某一初始聚類中屯、向量的最優(yōu) 分類,使得評價指標最小。算法采用誤差平方和準則函數(shù)作為聚類準則函數(shù)。
[0161] 基于Map-Reduce下的并行K-Means包括3個階段,即INITIAL STAGE、MAP STAGE、 REDUCE STAGEo
[0162] INITIAL STAGE:首先確定聚類個數(shù)n,然后隨機生成n個中屯、點,同時將原始數(shù)據(jù) 集分成若干個數(shù)據(jù)塊。
[0163] MAP STAGE:將每一個數(shù)據(jù)子集對應分配給一個map函數(shù),針對每個數(shù)據(jù)塊,map函 數(shù)計算每個樣本所屬類別。map函數(shù)首先基于歐式距離公式計算每個樣本與每個中屯、點的 距離,然后找出與該樣本距離最近的中屯、點,每個樣本都被歸類到與其距離最近的中屯、點 所屬類別。
[0164] 服DUCE STAGE:歸并各數(shù)據(jù)塊歸類結(jié)果得到完整的聚類結(jié)果,重新計算類中屯、作 為下一次迭代的輸入,繼續(xù)進行下一次MAP STAGE迭代直至算法收斂(即類中屯、不再變化)。
[0165] 第S獲取模塊603,用于對比主網(wǎng)日期群化的負荷特征和居民用戶在化下的分群結(jié) 果化X的負荷特征,獲得歷史上不同日期下居民的削峰填谷模式匹配結(jié)果和錯峰用電的目標 對象;
[0166] 對比主網(wǎng)日期群化的負荷特征和居民用戶在化下的分群結(jié)果Dix的負荷特征,獲得 歷史上不同日期下居民的削峰填谷模式匹配結(jié)果和智能用電的目標對象。根據(jù)居民群體的 負荷特征對居民用戶用電行為予W解析,制定峰谷電價方案,探索指導用戶智能用電的需 求側(cè)管理模式。
[0167] 劃分模塊605,用于將歷史時期分為節(jié)假日、周末和工作日=日期集合;
[016引判斷單元606,用于判斷待測日是否為節(jié)假日;
[0169] 查找單元607,用于當判斷單元606判斷待測日為非節(jié)假日時,根據(jù)溫度利用動態(tài) 時間規(guī)整方法,分別在歷史周末集合和工作日集合中尋找歷史相似日。
[0170] 動態(tài)時間規(guī)整方法具體描述如下:
[0171] 輸入:歷史年時間段內(nèi)周末\工作日溫度序列T〇id=(Ti,…,Tm),當前年同時間段內(nèi) 且包含待測日的周末\工作日溫度序巧
,滿足m>n。
[0172] 過程:捜索從巧亢)點出發(fā)捜索至(J;,。,可W展開若干條路徑,可計算每條路徑 達到(2;,j;)點時的總的積累距離,通過逐點向前尋找就可W求得整條路徑,具有最小累積 距離者即為規(guī)整路徑。對于巧,是),其可達到該格點的只可能是巧I /^)、巧I .^)和 巧,巧3:,即選擇到運3個格點距離之中最小的路徑延伸到達巧,呵。求解兩序列匹配時, 累計距離最小所對應的規(guī)整函數(shù),可,它表示為序列Told上點Tl和Tnew上的點巧之間的 規(guī)整路徑距離:
[0173]
[0174] 其中Dist ( i,j )為Told上點Ti和Tnew上的點^之間的歐式距離,在本發(fā)明中,該距離 為1'1和^^對應日期的溫度的差的絕對值。
[0175] 輸出:最小規(guī)整距離,W及點和點的匹配關(guān)系結(jié)果。
[0176] 運樣,每個目標日都可W找到歷史中的相似匹配日,從而得到目標日期主網(wǎng)及用 電客戶可能出現(xiàn)的負荷曲線特征,按照主網(wǎng)特征曲線和用電客戶用電特征曲線的削峰填谷 模式匹配結(jié)果,判斷用電客戶在該目標日下是否需要錯峰用電。如果用電客戶的負荷曲線 避開了主網(wǎng)的負荷高峰(逆峰型),則該用電客戶不是開展錯避峰用電措施的對象。如果用 電客戶的負荷曲線與主網(wǎng)的負荷曲線形狀相同(迎峰型)或用電客戶的負荷曲線一直處于 高峰水平(連續(xù)高峰型),則該用電客戶是開展錯避峰措施的重點客戶,可W通過有序用電、 峰谷電價等方式引導該客戶避開用電高峰,同時需要關(guān)注該類客戶電氣設備安全使用情 況。
[0177] 本實施例方法所述的功能如果W軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷 售或使用時,可W存儲在一個計算設備可讀取存儲介質(zhì)中?;谶\樣的理解,本發(fā)明實施例 對現(xiàn)有技術(shù)做出貢獻的部分或者該技術(shù)方案的部分可WW軟件產(chǎn)品的形式體現(xiàn)出來,該軟 件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用W使得一臺計算設備(可W是個人計算機, 服務器,移動計算設備或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步 驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(ROM,ReacK)nly Memo巧)、隨機存 取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可W存儲程序代碼的介質(zhì)。
[0178] 本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其它 實施例的不同之處,各個實施例之間相同或相似部分互相參見即可。
[0179] 對所公開的實施例的上述說明,使本領域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。 對運些實施例的多種修改對本領域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的 一般原理可W在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明 將不會被限制于本文所示的運些實施例,而是要符合與本文所公開的原理和新穎特點相一 致的最寬的范圍。
【主權(quán)項】
1. 一種面向削峰填谷的用電行為分析方法,其特征在于,包括: 對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚類,獲取負荷在歷史時期內(nèi)不 同日期的分群結(jié)果; 對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得用戶在不 同日期群下的分群結(jié)果; 對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特征,獲得歷史上不 同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,還包括: 基于動態(tài)時間規(guī)整方法,分析歷史時期內(nèi)和未來目標日期的相似匹配關(guān)系,獲得所述 未來目標日期的主網(wǎng)和用戶可能的負荷曲線特征。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對每個群體所包含的日期下的用戶逐 點負荷數(shù)據(jù)進行并行硬聚類算法,獲得用戶在不同日期群下的分群結(jié)果包括: 對每個群體Ddi = 1,…,k)所包含的日期下的所有非居民用戶逐點負荷數(shù)據(jù)進行并行 硬聚類算法,獲得非居民在不同日期群Drf的分群結(jié)果(j = 1,…,m); 相應的,所述對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特征, 獲得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象為: 對比主網(wǎng)日期群〇1的負荷特征和非居民用戶在日期群Di下的分群結(jié)果的負荷特征, 獲得歷史上不同日期下非居民的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對每個群體所包含的日期下的用戶逐 點負荷數(shù)據(jù)進行并行硬聚類算法,獲得用戶在不同日期群下的分群結(jié)果包括: 對每個群體Ddi = 1,…,k)所包含的日期下的所有居民用戶逐點負荷數(shù)據(jù)進行并行硬 聚類算法,獲得居民在不同日期群Drf的分群結(jié)果Dlx(x = 1,…,y); 相應的,所述對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷特征, 獲得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象為: 對比主網(wǎng)日期群〇1的負荷特征和居民用戶在Di下的分群結(jié)果Dlx的負荷特征,獲得歷史 上不同日期下居民的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。5. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于動態(tài)時間規(guī)整方法,分析歷史時 期內(nèi)和未來目標日期的相似匹配關(guān)系,獲得所述未來目標日期的主網(wǎng)和用戶可能的負荷曲 線特征包括: 將歷史時期分為節(jié)假日、周末和工作日三日期集合; 判斷待測日是否為節(jié)假日,若是,則直接用歷史同一節(jié)假日所歸屬的群體進行用電行 為分析,若否,則: 根據(jù)溫度利用動態(tài)時間規(guī)整方法,分別在歷史周末集合和工作日集合中尋找歷史相似 曰。6. -種面向削峰填谷的用電行為分析系統(tǒng),其特征在于,包括: 第一獲取模塊,用于對歷史時期內(nèi)的主網(wǎng)負荷數(shù)據(jù)利用最大期望算法進行聚類,獲取 負荷在歷史時期內(nèi)不同日期的分群結(jié)果; 第二獲取模塊,用于對每個群體所包含的日期下的用戶逐點負荷數(shù)據(jù)進行并行硬聚類 算法,獲得用戶在不同日期群下的分群結(jié)果; 第三獲取模塊,用于對比主網(wǎng)日期群的負荷特征和用戶在日期群下的分群結(jié)果的負荷 特征,獲得歷史上不同日期下用戶的削峰填谷模式匹配結(jié)果和錯峰用電的目標對象。7. 根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,還包括: 第四獲取模塊,用于基于動態(tài)時間規(guī)整方法,分析歷史時期內(nèi)和未來目標日期的相似 匹配關(guān)系,獲得所述未來目標日期的主網(wǎng)和用戶可能的負荷曲線特征。8. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述第二獲取模塊包括: 第一硬聚類算法模塊,用于對每個群體DK i = 1,…,k)所包含的日期下的所有非居民用 戶逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得非居民在不同日期群Di下的分群結(jié)果D^(j = 1,…,m); 相應的,第三獲取模塊,用于對比主網(wǎng)日期群〇1的負荷特征和非居民用戶在日期群DiT 的分群結(jié)果的負荷特征,獲得歷史上不同日期下非居民的削峰填谷模式匹配結(jié)果和錯峰 用電的目標對象。9. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述第二獲取模塊包括: 第二硬聚類算法模塊,用于對每個群體DKi = l,···,!〇所包含的日期下的所有居民用戶 逐點負荷數(shù)據(jù)進行并行硬聚類算法,獲得居民在不同日期群Di下的分群結(jié)果Dlx(x= 1,…, y); 相應的,第三獲取模塊,用于對比主網(wǎng)日期群〇1的負荷特征和居民用戶在Di下的分群結(jié) 果Dlx的負荷特征,獲得歷史上不同日期下居民的削峰填谷模式匹配結(jié)果和錯峰用電的目標 對象。10. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述第四獲取模塊包括: 劃分模塊,用于將歷史時期分為節(jié)假日、周末和工作日三日期集合; 判斷單元,用于判斷待測日是否為節(jié)假日; 查找單元,用于當判斷單元判斷待測日為非節(jié)假日時,根據(jù)溫度利用動態(tài)時間規(guī)整方 法,分別在歷史周末集合和工作日集合中尋找歷史相似日。
【文檔編號】G06Q50/06GK106022959SQ201610335190
【公開日】2016年10月12日
【申請日】2016年5月19日
【發(fā)明人】劉建, 趙加奎, 李宏發(fā), 黃秋岑, 劉芳, 劉玉璽, 方紅旺, 歐陽紅, 郝慶利, 盧耀宗, 程華福
【申請人】北京中電普華信息技術(shù)有限公司, 國網(wǎng)福建省電力有限公司, 國網(wǎng)信息通信產(chǎn)業(yè)集團有限公司, 國家電網(wǎng)公司