本發(fā)明屬于短期負荷預測,更具體地,涉及一種居民社區(qū)短期負荷預測模型構建方法及應用。
背景技術:
1、居民用電負荷作為社會用電負荷結構中數(shù)量最多、分布最廣的一類負荷,是電網(wǎng)供需平衡中需求側的重要組成部分。隨著居民生活水平的提高,家用電器的使用數(shù)量和負荷容量的不斷提升,直接導致了居民負荷在電網(wǎng)負荷中占比的升高。對居民用戶用電負荷進行預測,可以提升配電網(wǎng)應對風險能力、降低電能生產(chǎn)成本及減少環(huán)境污染。居民負荷存在著負荷設備多樣、用電行為差異等特點,使得其負荷曲線通常波動性較大、難以預測。
2、現(xiàn)階段,用于短期負荷預測的人工智能方法一般立足測量技術的進度,將歷史負荷數(shù)據(jù)作為輸入,通過對預測模型進行不斷訓練,得到性能較優(yōu)的預測模型。然而,在實際應用過程中,由于居民用戶用電負荷的隨機性和社區(qū)用戶波動性疊加而引入的雙重波動性,完全基于歷史負荷數(shù)據(jù)所構建的特征工程往往隨著時間推進而預測性能不斷降低,需要頻繁進行重新訓練,浪費大量計算和存儲資源,且實時性也不好。
技術實現(xiàn)思路
1、針對現(xiàn)有技術的以上缺陷或改進需求,本發(fā)明提供了一種居民社區(qū)短期負荷預測模型構建方法及應用,其目的在于提升居民社區(qū)短期負荷預測的準確度,并提升預測的實時性。
2、為實現(xiàn)上述目的,按照本發(fā)明的第一方面,提供了一種居民社區(qū)短期負荷預測模型構建方法,包括:
3、采用數(shù)據(jù)集對負荷預測基模型進行訓練,得到訓練好的短期負荷預測基模型;其中,所述數(shù)據(jù)集包括目標居民社區(qū)用戶過往歷史負荷數(shù)據(jù)和對應的氣象數(shù)據(jù),所述數(shù)據(jù)集中的每個訓練樣本包括:預測日d前一天d-1、前兩天d-2及前七天d-7的負荷數(shù)據(jù)和氣象數(shù)據(jù),以及預測日d當天預測時刻t的氣象數(shù)據(jù);
4、利用預測日d前一天d-1真實的負荷數(shù)據(jù)和氣象數(shù)據(jù),以及預測日d當天預測時刻t的氣象數(shù)據(jù)預報值,采用在線學習,對訓練好的短期負荷預測基模型進行在線增量訓練,將在線增量訓練完成后得到的模型作為最終的短期負荷預測模型,所述最終的短期負荷預測模型用于對預測日d當天預測時刻t的目標居民社區(qū)負荷進行預測。
5、進一步地,所述負荷預測基模型為基于xgboost的并行集成學習模型;所述并行集成學習模型包括n個并行的xgboost子模型;
6、用于各個xgboost子模型訓練的樣本子集的構建方式為:
7、從所述數(shù)據(jù)集中每次隨機有放回的抽取1個樣本,重復多次,得到一個樣本子集;經(jīng)過n輪隨機有放回的抽樣,得到n個樣本子集,分別對應作為各個xgboost子模型訓練的樣本子集;
8、所述并行集成學習模型的輸出通過對n個并行的xgboost子模型進行投票得到。
9、進一步地,在對短期負荷預測基模型訓練過程中,預測日d前一天d-1、前兩天d-2及前七天d-7的負荷數(shù)據(jù)和氣象數(shù)據(jù)為預測日d前一天d-1、前兩天d-2及前七天d-7在t-1、t、t+1時刻對應的負荷數(shù)據(jù)和氣象數(shù)據(jù);還包括在預測日d當天的t-1及t+1時刻對應的氣象數(shù)據(jù);
10、采用在線學習,對訓練好的短期負荷預測基模型進行在線增量訓練過程中,所述預測日d前一天d-1真實的負荷數(shù)據(jù)和氣象數(shù)據(jù)為預測日d前一天d-1在t-1、t、t+1時刻對應的真實負荷數(shù)據(jù)和真實氣象數(shù)據(jù);還包括在預測日d當天的t-1及t+1時刻對應的氣象數(shù)據(jù)預報值。
11、進一步地,在對短期負荷預測基模型訓練過程中,所述數(shù)據(jù)集中的每個訓練樣本還包括:
12、預測日d前一天d-1、前兩天d-2及前七天d-7的日期類型數(shù)據(jù),以及預測日d當天的日期類型數(shù)據(jù);
13、其中,所述日期類型數(shù)據(jù)用于表征對應日輸入的負荷數(shù)據(jù)是工作日用電負荷數(shù)據(jù),還是非工作日用電負荷數(shù)據(jù);
14、還包括利用預測日d前一天d-1的日期類型數(shù)據(jù),以及預測日d當天的日期類型數(shù)據(jù),采用在線學習,對訓練好的短期負荷預測基模型進行在線增量訓練,以得到所述最終的短期負荷預測模型。
15、進一步地,采用數(shù)據(jù)集對負荷預測基模型進行訓練之前,還包括對訓練樣本中的氣象數(shù)據(jù)進行特征篩選,具體包括:
16、將當前時刻的負荷數(shù)據(jù)與對應的氣象數(shù)據(jù)中的每個氣象特征依次進行互信息計算;將不低于預設互信息閾值對應的氣象特征作為影響程度較大的氣象特征數(shù)據(jù),用于參與對負荷預測基模型訓練。
17、按照本發(fā)明的第二方面,提供了一種居民社區(qū)短期負荷預測方法,包括:
18、將預測日d前一天d-1、前兩天d-2及前七天d-7的負荷數(shù)據(jù)和氣象數(shù)據(jù),以及預測日d當天預測時刻t的氣象數(shù)據(jù)預報值輸入至短期負荷預測模型中,得到預測日d當天預測時刻t的目標居民社區(qū)負荷預測值;
19、其中,所述短期負荷預測模型通過上述任一項所述的居民社區(qū)短期負荷預測模型構建方法得到。
20、進一步地,所述負荷數(shù)據(jù)和氣象數(shù)據(jù)為預測日d前一天d-1、前兩天d-2及前七天d-7在t-1、t、t+1時刻對應的負荷數(shù)據(jù)和氣象數(shù)據(jù);還包括在預測日d當天的t-1及t+1時刻對應的氣象數(shù)據(jù)預報值;
21、或/和,輸入至所述短期負荷預測模型中的數(shù)據(jù)還包括:預測日d前一天d-1、前兩天d-2及前七天d-7的日期類型數(shù)據(jù),以及預測日d當天的日期類型數(shù)據(jù);
22、其中,所述日期類型數(shù)據(jù)用于表征對應日輸入的負荷數(shù)據(jù)是工作日用電負荷數(shù)據(jù),還是非工作日用電負荷數(shù)據(jù)。
23、按照本發(fā)明的第三方面,提供了一種電子設備,包括計算機可讀存儲介質(zhì)和處理器;
24、所述計算機可讀存儲介質(zhì)用于存儲可執(zhí)行指令;
25、所述處理器用于讀取所述計算機可讀存儲介質(zhì)中存儲的可執(zhí)行指令執(zhí)行上述任意一項所述的居民社區(qū)短期負荷預測模型構建方法,或/和,執(zhí)行上述所述的居民社區(qū)短期負荷預測方法。
26、按照本發(fā)明的第四方面,提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述程序被處理器執(zhí)行時實現(xiàn)如上述任一項所述的居民社區(qū)短期負荷預測模型構建方法,或/和,實現(xiàn)如上述所述的居民社區(qū)短期負荷預測方法。
27、按照本發(fā)明的第五方面,提供了一種計算機程序產(chǎn)品,當所述計算機程序產(chǎn)品在計算機上運行時,使得計算機執(zhí)行上述任意一項所述的居民社區(qū)短期負荷預測模型構建方法,或/和,執(zhí)行上述所述的居民社區(qū)短期負荷預測方法。
28、總體而言,通過本發(fā)明所構思的以上技術方案,能夠取得以下有益效果:
29、(1)本發(fā)明考慮到居民用戶用電負荷的隨機性和社區(qū)用戶波動性疊加而引入的雙重波動性,直接基于歷史數(shù)據(jù)而訓練出的“固定”模型并不能準確反映當下居民社區(qū)負荷特性,從而帶來預測準確度下降、需要頻繁進行重新訓練等問題?;诖?,本發(fā)明先采用目標居民社區(qū)用戶過往歷史數(shù)據(jù)對基模型進行訓練,使得基模型先學習過往歷史時段社區(qū)居民用電負荷規(guī)律,得到基礎模型后,針對每一個預測日,利用預測日前一天已知的真實負荷數(shù)據(jù)、氣象數(shù)據(jù)以及預測日當天的氣象數(shù)據(jù)預報值對基模型進行在線更新,以學習居民用電規(guī)律的微小波動特性,如此,獲得的最終模型能夠適應居民社區(qū)負荷的波動特性,提高了居民社區(qū)負荷預測精度,無需針對該微小的波動重新進行整體的離線訓練,也提升了預測的實時性。并且,本發(fā)明構建的每個訓練樣本同時包含了預測日d前一天d-1、前兩天d-2及前七天d-7的負荷數(shù)據(jù)和氣象數(shù)據(jù),以及預測日d當天預測時刻t的氣象數(shù)據(jù),本發(fā)明認為這些數(shù)據(jù)均為影響預測日預測時刻負荷準確度的關鍵性數(shù)據(jù),基于此對預測模型進行訓練,可以使得預測模型充分學習社區(qū)居民用電負荷規(guī)律,以提升居民社區(qū)短期負荷預測的準確度,實驗也證實了本發(fā)明具有良好的預測性能,且預測速度更快、計算資源和存儲需求更低。
30、(2)作為優(yōu)選,負荷預測基模型采用基于xgboost的并行集成學習模型,即能夠利用xgboost預測準確性高和計算效率高的優(yōu)勢,又能夠提升xgboost集成模型的泛化能力,具體表現(xiàn)在:并行集成子模型對應樣本子集的構建,使得每次抽取的輸入數(shù)據(jù)之間相互獨立,且構造的每個子模型的樣本數(shù)據(jù)分布相同,在模型集成的過程中模擬了各種隨機情況,降低了出現(xiàn)高誤差的風險,有效減少集成模型(基模型)的輸出方差和降低模型過擬合程度,提高模型的泛化能力。
31、(3)作為優(yōu)選,本發(fā)明考慮到某一時刻的電力負荷數(shù)據(jù)實際上并不具有“記憶性”,即與過去的變化過程無關,只與它前一個時刻或后一個時刻相關,因此,只選取與預測時刻相鄰的包括預測時刻在內(nèi)的三個時刻的相關數(shù)據(jù)對模型進行訓練,可以大幅降低輸入矩陣維度,提高模型訓練速度,降低無關噪聲的干擾,提高預測準確度;并且,還包括預測日d當天在t-1及t+1時刻對應的氣象數(shù)據(jù)預報值,可以避免僅利用預測時刻對應的氣象數(shù)據(jù)預報值帶來的偶然性影響。
32、(4)進一步地,本發(fā)明還考慮到社區(qū)居民的工作日用電負荷和非工作日用電負荷的差異,將日期類型數(shù)據(jù)也作為影響因素之一對預測模型進行訓練,進一步提升了居民社區(qū)短期負荷預測的準確度。
33、(5)進一步地,對于居民社區(qū)短期電力負荷預測,氣象數(shù)據(jù)是影響程度很大且特征數(shù)量較多的一類影響因素,通過對氣象數(shù)據(jù)進行特征篩選,可以避免與預測任務沒有貢獻的氣象特征干擾預測模型的學習,采用特征篩選后的氣象特征數(shù)據(jù)可以減少數(shù)據(jù)的復雜性、降低特征維度、降低計算成本、提高預測模型的性能和可解釋性;在進行特征篩選時,考慮到負荷數(shù)據(jù)序列和氣象數(shù)據(jù)的隨機性,以及負荷數(shù)據(jù)序列和氣象數(shù)據(jù)之間的線性和非線性相關關系,采用互信息計算方式綜合分析特征相關程度,能夠?qū)崿F(xiàn)在減少冗余特征數(shù)量的同時最大程度保留特征數(shù)據(jù)中的最有價值信息。