本發(fā)明屬于新能源發(fā)電預測,涉及一種基于人工智能與機器學習的光伏發(fā)電預測方法,尤其是一種基于精細化建模與集成學習的光伏預測方法。
背景技術(shù):
1、對光伏發(fā)電的準確預測有助于保持電網(wǎng)供需平衡,維持頻率穩(wěn)定與電壓穩(wěn)定,保障電能質(zhì)量;有助于調(diào)度部門安排光伏電站與常規(guī)能源間的協(xié)調(diào)配合,減少冗余儲能設(shè)備的建設(shè)投資,降低發(fā)電成本,提高電力系統(tǒng)的經(jīng)濟性。
2、現(xiàn)階段,光伏預測方法主要有物理建模的方法與機器學習的方法。在物理建模方法中,常使用光電轉(zhuǎn)換效率對光伏電站出力進行預測。鑒于光伏電站地理位置的復雜性,常常遭受不同程度的云層遮擋、樹蔭遮蔽以及積灰等問題的影響,這些因素均會改變光電轉(zhuǎn)換效率,使得傳統(tǒng)的物理建模方法的抗干擾能力和魯棒性表現(xiàn)不佳。深度學習為機器學習的一個分支,由于近年來深度學習在圖像識別等方面取得了優(yōu)異的成果,不少研究人員使用深度學習的方法對光伏出力進行預測。但深度學習的方法往往會使模型存在嚴重的過擬合問題,導致模型在訓練集表現(xiàn)出色,但在驗證集或?qū)嶋H應(yīng)用時表現(xiàn)的卻不盡如人意。
3、因此,本發(fā)明提出一種基于精細化建模與集成學習的光伏預測方法。
4、經(jīng)檢索,未發(fā)現(xiàn)與本發(fā)明相同或相近似的現(xiàn)有技術(shù)的公開文獻。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提出一種基于精細化建模與集成學習的光伏預測方法,使用樹模型中的lightgbm,能夠在保證模型準確度的前提下,提高模型的泛化能力與魯棒性。
2、本發(fā)明解決其現(xiàn)實問題是采取以下技術(shù)方案實現(xiàn)的:
3、一種基于精細化建模與集成學習的光伏預測方法,所述光伏預測方法包括如下步驟:
4、s1、獲取光伏電站的歷史數(shù)據(jù),并對數(shù)據(jù)進行清洗,形成原始特征;并由原始特征構(gòu)造高相關(guān)性的新特征,并對原始特征進行擴展,構(gòu)造歷史特征以及統(tǒng)計特征,生成特征庫。
5、s2、基于步驟s1生成的特征庫,不同站點以及日內(nèi)所有時段統(tǒng)一訓練一個lightgbm模型;并根據(jù)歷史信息統(tǒng)計光伏出力為0的時段,對這些時段的預測結(jié)果進行后處理;
6、s3、對各光伏電站與日內(nèi)不同時段進行精細化建模;
7、s4、對各基學習器進行k折交叉驗證,以確定各基學習器的超參數(shù);使用集成學習的方法,對各基學習器進行并行集成,各基學習器的權(quán)重使用粒子群算法尋優(yōu)確定。
8、s5、將待預測時刻對應(yīng)的特征數(shù)據(jù)輸入到訓練好的基于精細化建模與集成學習的光伏預測模型,得到光伏出力的預測結(jié)果。
9、而且,所述步驟s1的具體方法為:
10、獲取光伏電站的歷史數(shù)據(jù),包括氣壓、溫度、輻照強度、風速、風向、云量、降水等歷史氣象數(shù)據(jù),以及歷史出力數(shù)據(jù)。并對數(shù)據(jù)進行清洗,剔除數(shù)據(jù)中的異常點與空值,形成原始特征。對原始特征進行皮爾森相關(guān)性分析,剔除明顯不相關(guān)的特性。由原始特征構(gòu)造高相關(guān)性的新特征,并對原始特征進行擴展,構(gòu)造歷史特征以及統(tǒng)計特征,生成特征庫。
11、而且,所述步驟s1中的各類歷史數(shù)據(jù)的顆粒度為15min,即一天96個點。
12、而且,所述步驟s1中構(gòu)造的高相關(guān)性的新特征為其中ii,t第i個光伏電站t時刻受到的輻照強度、si為第i個光伏電站的裝機容量、ti,t為第i個電站處t時刻的室外溫度,單位為華氏度。
13、而且,所述步驟s1中的歷史特征包括各特征的變化量與均值,統(tǒng)計特征包括按時間分組后各原始特征的最大值、最小值、均值、方差。
14、而且,所述步驟s2的具體方法為:
15、基于步驟s1生成的特征庫,不同站點以及日內(nèi)所有時段統(tǒng)一訓練一個lightgbm模型,作為集成學習的基學習器1;并根據(jù)歷史信息統(tǒng)計光伏出力為0的時段,對這些時段的預測結(jié)果進行后處理;
16、而且,所述步驟s3的具體方法為:
17、對所有光伏電站分別訓練一個lightgbm模型,并將各電站的預測結(jié)果進行整合,作為基學習器2;
18、對日內(nèi)存在光伏出力的每15min分別訓練lightgbm模型,各個模型僅負責對應(yīng)時段的光伏預測任務(wù),并將各個模型的預測結(jié)果進行整合,作為基學習器3。
19、而且,所述步驟s2和步驟s3的lightgbm模型訓練基于python中的lightgbm庫實現(xiàn)的,目標函數(shù)選取均方誤差mse。
20、而且,所述步驟s4的具體方法為:
21、令k取值為5,訓練集、測試集與驗證集的比例為4:1:1;使用k折交叉驗證進行調(diào)參時,從一組初值出發(fā),每次調(diào)參只調(diào)整一個超參數(shù),直至完成所有超參數(shù)的尋優(yōu);粒子群算法的種群規(guī)大小為30,最大迭代次數(shù)為50。
22、本發(fā)明的優(yōu)點和有益效果:
23、1、本發(fā)明提出一種基于精細化建模與集成學習的光伏預測方法,首先,獲取光伏電站的歷史數(shù)據(jù),包括氣壓、溫度、輻照強度、風速、風向、云量、降水等歷史氣象數(shù)據(jù),以及歷史出力數(shù)據(jù)。并對數(shù)據(jù)進行清洗,剔除數(shù)據(jù)中的異常點與空值,形成原始特征;對原始特征進行皮爾森相關(guān)性分析,剔除明顯不相關(guān)的特性。然后,由原始特征構(gòu)造高相關(guān)性的新特征,并對原始特征進行擴展,構(gòu)造歷史特征以及統(tǒng)計特征,生成特征庫。經(jīng)特征構(gòu)造與擴展后,特征庫由原始的11個特征擴展至222個特征,有效提高了模型預測的準確度。接著,對不同站點以及日內(nèi)所有時段統(tǒng)一訓練一個lightgbm模型,作為集成學習的基學習器1(baselearner)。此外,考慮到光伏出力具有時序特性,根據(jù)歷史信息統(tǒng)計光伏出力為0的時段,對這些時段的預測結(jié)果進行后處理(post-processing),人為干預使其預測結(jié)果為0,以提高預測準確度。考慮到不同光伏電站的出力特性各不相同,且由于光伏出力存在時序特性,同一個光伏電站在日內(nèi)的不同時段的出力特性也各不相同。因此,為使模型能夠充分學習并區(qū)分各光伏電站自身的出力特征與不同時段的出力特征,本方法對各光伏電站與日內(nèi)不同時段進行精細化建模。具體而言,對所有光伏電站分別訓練一個lightgbm模型,并將各電站的預測結(jié)果進行整合,作為基學習器2;對日內(nèi)存在光伏出力的每15min分別訓練lightgbm模型,各個模型僅負責對應(yīng)時段的光伏預測任務(wù),并將各個模型的預測結(jié)果進行整合,作為基學習器3;對各基學習器進行k折交叉驗證(k-fold?cross-validation),以確定各基學習器的超參數(shù);最后,使用集成學習的方法,對各基學習器進行并行集成,各基學習器的權(quán)重使用粒子群算法(particle?swarm?optimization,pso)尋優(yōu)確定。本發(fā)明通過使用特征重構(gòu)、精細化建模、k折交叉驗證以及集成學習等技術(shù)方法,提高了光伏預測的準確率,降低了模型的過擬合風險,提高了模型的泛化能力,為我國構(gòu)建新型電力系統(tǒng),促進可再生能源整合等方面提供了技術(shù)支持。
24、2、本發(fā)明通過構(gòu)造強相關(guān)性的新特征與構(gòu)造統(tǒng)計特征、歷史特征的方式,擴充了原始特征庫,使得模型更易學習到各變量之間的內(nèi)在聯(lián)系,有助于提高光伏預測的準確度;
25、3、本發(fā)明通過統(tǒng)計歷史信息統(tǒng)計光伏出力為0的時段,對這些時段的預測結(jié)果進行后處理(post-processing),提高了光伏預測準確度;
26、4、本發(fā)明基于樹模型中的lightgbm構(gòu)建基模型(base?learner),相較于深度學習的方法,lightgbm這一樹模型訓練時間短、所需數(shù)據(jù)少,且不容易產(chǎn)生過擬合。精細化建模的方法必然會使每個模型所分配的數(shù)據(jù)集減小,且建模越精細化,各個模型所分配到的數(shù)據(jù)集越小。使用深度學習訓練模型需要大量的數(shù)據(jù)集,因此lightgbm相比與深度學習的方法更適用于精細化建模,有助于提高光伏預測的準確率、泛化性與魯棒性;
27、5、本發(fā)明使用k折交叉驗證進行調(diào)參,從一組初值出發(fā),逐步調(diào)整各基學習器的超參數(shù),有利于提高模型性能與預測準確度;
28、6、本發(fā)明充分考慮了不同光伏電站出力特性的差異性與光伏電站日內(nèi)不同時段出力特性的差異性,分別針對光伏電站類別與時間段進行精細化建模。隨后使用集成學習的方法搭建光伏預測模型,采用粒子群算法對各基學習器的權(quán)重進行尋優(yōu)。集成后的模型兼具各基模型的優(yōu)勢,提高了光伏預測的準確率、泛化性與魯棒性。