本發(fā)明涉及新能源發(fā)電的光伏預測,具體涉及一種預測超短期光伏發(fā)電出力的混合模型建立方法。
背景技術:
1、隨著全球能源需求的不斷增長,可再生能源的開發(fā)和利用受到了廣泛關注。在眾多可再生能源中,太陽能光伏發(fā)電具有清潔、可再生、環(huán)保等優(yōu)點,成為未來能源發(fā)展的重要方向。近年來,光伏發(fā)電系統(tǒng)在我國得到了廣泛的應用,其裝機容量逐年攀升。然而,光伏發(fā)電出力受天氣、溫度、濕度等多種因素影響,具有很大的不確定性和波動性,給電網(wǎng)調(diào)度和運行帶來了一定的挑戰(zhàn)。
2、為了提高光伏發(fā)電出力的預測精度,研究者們提出了多種預測方法,包括統(tǒng)計方法和物理方法。統(tǒng)計方法如時間序列分析、線性回歸等,依賴于歷史數(shù)據(jù)進行建模;物理方法則基于太陽輻射傳輸模型,考慮大氣層、云層等因素對太陽輻射的影響。然而,這些方法在預測超短期光伏發(fā)電出力時存在一定的局限性。統(tǒng)計方法可能無法捕捉到數(shù)據(jù)中的非線性關系,而物理方法計算復雜,對輸入?yún)?shù)的敏感性較高。
技術實現(xiàn)思路
1、本發(fā)明的目的是為了解決現(xiàn)有技術中存在的缺點,而提出的一種預測超短期光伏發(fā)電出力的混合模型建立方法。
2、為實現(xiàn)上述目的,本發(fā)明采用了如下技術方案:一種預測超短期光伏發(fā)電出力的混合模型建立方法,所述混合模型建立方法步驟如下:
3、s1:數(shù)據(jù)集采集原始數(shù)據(jù):
4、所述原始數(shù)據(jù)包括:光伏發(fā)電用戶基本信息、氣象變量數(shù)據(jù)以及實際功率數(shù)據(jù);
5、所述光伏發(fā)電用戶基本信息包括9個光伏發(fā)電用戶的位置和裝機容量的信息,即用戶f1-f9;
6、所述氣象變量數(shù)據(jù)為9個光伏發(fā)電用戶從2022年1月到2024年1月份,每間隔15分鐘的氣象數(shù)據(jù),包括光照強度、溫度、濕度、風速;
7、所述實際功率數(shù)據(jù)是9個光伏發(fā)電用戶從2022年1月到2024年1月份,每間隔15分鐘的發(fā)電出力數(shù)據(jù);
8、s2:數(shù)據(jù)預處理:
9、對步驟s1中收集的原始數(shù)據(jù)進行數(shù)據(jù)預處理;
10、數(shù)據(jù)預處理包括合并數(shù)據(jù)集;劃分訓練集、驗證集和測試集;對實際功率數(shù)據(jù)進行索引的重置;
11、通過上述數(shù)據(jù)預處理,原始數(shù)據(jù)被轉(zhuǎn)換為適合預測模型使用的格式,并包含了必要的特征和目標變量;
12、s3:特征工程處理;
13、對原始數(shù)據(jù)進行了深入的特征工程處理;
14、包括:氣象特征處理、歷史值特征提取、異常值處理、光照與當天最強光照的比值特征提取、當天的平均光照特征提取以及溫度與當天最高溫最低溫的差值特征提??;
15、通過這些特征工程處理步驟,原始數(shù)據(jù)被轉(zhuǎn)換為包含豐富信息且適合預測模型使用的格式,為光伏發(fā)電出力預測模型的構建和訓練提供了數(shù)據(jù)基礎;
16、s4:構建預測超短期光伏發(fā)電出力的混合模型:
17、通過結合了lightgbm、xgboost和catboost三種先進的梯度提升算法,以實現(xiàn)光伏發(fā)電出力的準確預測;
18、s41:模型參數(shù)配置:
19、為lightgbm、xgboost和catboost算法分別配置了參數(shù),包括學習率、樹的數(shù)量、樹的深度;
20、s42:訓練-交叉驗證:
21、使用五折交叉驗證方法將數(shù)據(jù)集分為5個折疊,每個折疊包含一部分訓練數(shù)據(jù)和驗證數(shù)據(jù);
22、針對每個折疊,使用訓練數(shù)據(jù)集對lightgbm、xgboost和catboost三種算法進行模型訓練;
23、在每個折疊的驗證數(shù)據(jù)集上評估模型性能;
24、計算每個折疊的均方根誤差(rmse)作為性能評估指標,最終評估結果是多個折疊的rmse平均值;
25、s43:模型融合:
26、采用了模型融合技術將三個模型的預測結果進行平均;
27、s5:模型性能評估:
28、步驟s4中的混合模型構建后,對混合模型進行評估:
29、均方根誤差(ermse)由公式1可以得到:
30、
31、準確率(cr)由公式2可以得到:
32、cr=1-ermse?公式2;
33、合格率(qr)由公式3、公式4可以得到:
34、
35、s6:模型特征重要性分析:
36、在模型構建和性能評估的過程中,還進行特征重要性分析,以確定對光伏發(fā)電出力預測影響最大的特征。
37、較佳的,所述步驟s2中,數(shù)據(jù)預處理包括:
38、s21:從指定的文件路徑讀取氣象變量數(shù)據(jù)、實際功率數(shù)據(jù)和光伏發(fā)電用戶基本信息;
39、s22:將氣象變量數(shù)據(jù)與光伏發(fā)電用戶基本信息合并,以便包含光伏用戶的編號、裝機容量、經(jīng)度和緯度信息;
40、s23:將時間戳轉(zhuǎn)換為上海時區(qū)的日期時間格式;
41、s24:對實際功率數(shù)據(jù)進行索引的重置:
42、將實際功率數(shù)據(jù)從多層索引轉(zhuǎn)換為單層索引,并重命名功率列為target;提取實際功率數(shù)據(jù)的級別,并將其轉(zhuǎn)換為整數(shù),以便與步驟s23中的時間戳進行匹配;
43、s25:將處理后的氣象變量數(shù)據(jù)與實際功率數(shù)據(jù)合并,劃分訓練集、驗證集和測試集;其中將用戶f1-f7的數(shù)據(jù)作為訓練集和驗證集,用戶f8和f9的數(shù)據(jù)用于模型的最終測試評估。
44、較佳的,所述步驟s3中,
45、所述氣象特征處理:對風速和風向特征進行轉(zhuǎn)換,以捕捉風對光伏發(fā)電的影響;
46、所述歷史值特征提?。和ㄟ^對輻照強度和溫度進行差分處理,提取了輻照強度和溫度的歷史值特征;
47、所述異常值處理:檢測和處理數(shù)據(jù)中的異常值,以減少模型對異常數(shù)據(jù)的敏感性;
48、所述光照與當天最強光照的比值特征提?。河嬎愎夥l(fā)電出力數(shù)據(jù)中每個時間點的輻照強度與當天最強光照的比值;
49、所述當天的平均光照特征提?。和ㄟ^分組聚合計算了每個光伏用戶在白天/黑夜狀態(tài)下當天的平均輻照強度,從而得到了每個光伏用戶在特定時間段內(nèi)的平均光照條件;
50、所述溫度與當天最高溫最低溫的差值特征提?。河嬎懔斯夥l(fā)電出力數(shù)據(jù)中每個時間點的溫度與當天最高溫度和最低溫度的差值。
51、較佳的,所述步驟s5中,對用戶f8和f9的數(shù)據(jù)進行了消融實驗,以驗證融合模型中各個組件的重要性;所述消融實驗是通過移除或替換模型中的關鍵組件來評估其對整體性能的影響。
52、較佳的,所述步驟s1中光伏發(fā)電出力預測的數(shù)據(jù)集是由數(shù)字中國創(chuàng)新大賽提供。
53、較佳的,所述步驟s5模型性能評估中評估指標參考了《調(diào)度側(cè)風電或光伏功率預測系統(tǒng)技術要求》。
54、第二方面,本發(fā)明提供一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述存儲器存儲計算機程序;所述處理器執(zhí)行前述的給予預測超短期光伏發(fā)電出力的混合模型建立方法。
55、第三方面,本發(fā)明提供一種可讀存儲介質(zhì),存儲有計算機程序;所述計算機程序被處理器執(zhí)行時基于預測超短期光伏發(fā)電出力的混合模型建立方法。
56、與現(xiàn)有技術相比,本發(fā)明的有益效果為:
57、(1)本發(fā)明通過模型融合技術,提高了預測的準確性,降低了預測誤差。其次,通過在用戶f8和f9的數(shù)據(jù)上進行訓練和測試,該融合模型顯示出了良好的泛化能力,這意味著該模型能夠適應不同時間、地點和條件下的光伏發(fā)電出力預測,減少過擬合的風險。
58、(2)從經(jīng)濟和環(huán)境效益的角度來看,本發(fā)明能夠減少預測準確率低帶來的考核費用,提高光伏電站的經(jīng)濟效益。同時,該模型有助于推動光伏發(fā)電的大規(guī)模應用,減少對化石燃料的依賴,促進可再生能源的使用,對環(huán)境保護具有積極意義。
59、(3)在實際應用中,本發(fā)明提出的模型能夠支持電網(wǎng)調(diào)度和光伏電站管理,提高電網(wǎng)的穩(wěn)定性和可靠性。光伏電站運營商可以通過該模型制定有效的運維策略,降低運行成本,提高經(jīng)濟效益。