本發(fā)明涉及光伏發(fā)電,具體涉及一種基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法。
背景技術(shù):
1、由于光伏發(fā)電受日照強度、氣候等因素影響,具有較強的波動性、隨機性、不可控性,尤其是在并網(wǎng)后會直接影響電網(wǎng)的穩(wěn)定性和安全性,對光伏發(fā)電量進行精確預(yù)測是實現(xiàn)光伏電站順利并網(wǎng)的關(guān)鍵。
2、光伏發(fā)電量的短期預(yù)測是指自預(yù)測時刻起未來1h~7d的預(yù)測預(yù)報。目前光伏發(fā)電量的預(yù)測方法主要包括物理方法、深統(tǒng)計方法、人工智能算法和組合方法等,人工智能算法包括機器學(xué)習(xí)和深度學(xué)習(xí)等。但現(xiàn)有的物理方法、深統(tǒng)計方法的工作量大,且預(yù)測精度低;人工智能預(yù)測方法往往考慮的氣象因子等影響因素較少,部分參數(shù)需要人工設(shè)定,容易出現(xiàn)運行速度慢、預(yù)測精度低等問題。
技術(shù)實現(xiàn)思路
1、針對現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供一種基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,其通過影響因子篩選和貝葉斯優(yōu)化對隨機森林算法進行優(yōu)化,使光伏發(fā)電量預(yù)測模型的運算時間縮短、預(yù)測精度提高。
2、本發(fā)明公開了一種基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,包括:
3、步驟1、確定預(yù)測步長,獲取原始數(shù)據(jù)集,并對原始數(shù)據(jù)集進行預(yù)處理后得到預(yù)處理數(shù)據(jù)集;
4、步驟2、對預(yù)處理數(shù)據(jù)集中的影響因子進行篩選,去除不重要的影響因子,生成特征數(shù)據(jù)集;
5、步驟3、建立基于超參數(shù)尋優(yōu)-隨機森林算法的預(yù)測模型;
6、步驟4、將特征數(shù)據(jù)集劃分訓(xùn)練集和測試集,使用訓(xùn)練集對預(yù)測模型進行訓(xùn)練;
7、步驟5、基于訓(xùn)練好的預(yù)測模型對測試集進行回歸分析,比較輸出結(jié)果與真實數(shù)據(jù)的差異并評價,評價通過后得到最優(yōu)預(yù)測模型;
8、步驟6、采集包括氣象數(shù)據(jù)的未來數(shù)據(jù),并將其輸入到最優(yōu)預(yù)測模型中,得到預(yù)測光伏發(fā)電量。
9、作為本發(fā)明的進一步改進,在所述步驟1中,以自然日或小時為預(yù)測步長,所述原始數(shù)據(jù)集至少包括歷史發(fā)電量數(shù)據(jù)和氣象數(shù)據(jù),所述氣象數(shù)據(jù)至少包括天氣、光照強度、降水量、氣溫、濕度、風(fēng)向、風(fēng)速和云量。
10、作為本發(fā)明的進一步改進,在所述步驟1中,對原始數(shù)據(jù)集進行預(yù)處理的具體操作為:異常值剔除,變?yōu)槿笔е?;缺失值補全;連續(xù)型變量標(biāo)準(zhǔn)化處理。
11、作為本發(fā)明的進一步改進,在所述步驟2中,篩選影響因子的方法為:使用方差分析捕捉影響因子與發(fā)電量之間的線性關(guān)系,根據(jù)f值和p值去除不重要的影響因子,生成特征數(shù)據(jù)集。
12、作為本發(fā)明的進一步改進,某一影響因子的f值越小,p值越大,越傾向于去除該影響因子。
13、作為本發(fā)明的進一步改進,在所述步驟3中,超參數(shù)尋優(yōu)方法為貝葉斯優(yōu)化。
14、作為本發(fā)明的進一步改進,貝葉斯優(yōu)化的尋優(yōu)目標(biāo)為隨機森林決策樹的數(shù)目和決策樹選取的特征個數(shù)。
15、作為本發(fā)明的進一步改進,在所述步驟4中,訓(xùn)練集和測試集的劃分比例為8:2,訓(xùn)練時模型的輸入包括氣象數(shù)據(jù),模型的輸入為發(fā)電量數(shù)據(jù)。
16、作為本發(fā)明的進一步改進,在所述步驟5中,所述評價的評價指標(biāo)包括:
17、(1)均方誤差mse:
18、
19、(2)均方根誤差rmse:
20、
21、(3)平均絕對誤差mae:
22、
23、(4)決定系數(shù)r2:
24、
25、式中,yi為真實值,為預(yù)測值,為平均值。
26、作為本發(fā)明的進一步改進,當(dāng)mse、rmse、mae小于各自的預(yù)設(shè)閾值,且r2大于預(yù)設(shè)閾值且小于1時,表征訓(xùn)練好的預(yù)測模型評價通過,并將其作為最優(yōu)預(yù)測模型;其中,mse、rmse、mae越小,r2越接近1,說明模型的誤差越低,穩(wěn)定性越高,擬合程度越好。
27、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:
28、本發(fā)明考慮了氣象因子和時序性等多種因素的影響,通過影響因子降維,降低了計算復(fù)雜度,提高了計算運行速度,避免了人為指定算法參數(shù)可能帶來的誤差,預(yù)測準(zhǔn)確度高、實用性強,有利于提前做好光伏發(fā)電系統(tǒng)的調(diào)度規(guī)劃。
1.一種基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,其特征在于,在所述步驟1中,以自然日或小時為預(yù)測步長,所述原始數(shù)據(jù)集至少包括歷史發(fā)電量數(shù)據(jù)和氣象數(shù)據(jù),所述氣象數(shù)據(jù)至少包括天氣、光照強度、降水量、氣溫、濕度、風(fēng)向、風(fēng)速和云量。
3.根據(jù)權(quán)利要求1所述的基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,其特征在于,在所述步驟1中,對原始數(shù)據(jù)集進行預(yù)處理的具體操作為:異常值剔除,變?yōu)槿笔е?;缺失值補全;連續(xù)型變量標(biāo)準(zhǔn)化處理。
4.根據(jù)權(quán)利要求1所述的基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,其特征在于,在所述步驟2中,篩選影響因子的方法為:使用方差分析捕捉影響因子與發(fā)電量之間的線性關(guān)系,根據(jù)f值和p值去除不重要的影響因子,生成特征數(shù)據(jù)集。
5.根據(jù)權(quán)利要求4所述的基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,其特征在于,某一影響因子的f值越小,p值越大,越傾向于去除該影響因子。
6.根據(jù)權(quán)利要求1所述的基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,其特征在于,在所述步驟3中,超參數(shù)尋優(yōu)方法為貝葉斯優(yōu)化。
7.根據(jù)權(quán)利要求6所述的基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,其特征在于,貝葉斯優(yōu)化的尋優(yōu)目標(biāo)為隨機森林決策樹的數(shù)目和決策樹選取的特征個數(shù)。
8.根據(jù)權(quán)利要求1所述的基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,其特征在于,在所述步驟4中,訓(xùn)練集和測試集的劃分比例為8:2,訓(xùn)練時模型的輸入包括氣象數(shù)據(jù),模型的輸入為發(fā)電量數(shù)據(jù)。
9.根據(jù)權(quán)利要求1所述的基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,其特征在于,在所述步驟5中,所述評價的評價指標(biāo)包括:
10.根據(jù)權(quán)利要求9所述的基于優(yōu)化隨機森林的光伏發(fā)電量短期預(yù)測方法,其特征在于,當(dāng)mse、rmse、mae小于各自的預(yù)設(shè)閾值,且r2大于預(yù)設(shè)閾值且小于1時,表征訓(xùn)練好的預(yù)測模型評價通過,并將其作為最優(yōu)預(yù)測模型;其中,mse、rmse、mae越小,r2越接近1,說明模型的誤差越低,穩(wěn)定性越高,擬合程度越好。