本發(fā)明涉及電力短期負(fù)荷預(yù)測(cè),特別是一種基于diffusion-transformer-ar模型的工業(yè)園區(qū)短期負(fù)荷預(yù)測(cè)方法及系統(tǒng)。
背景技術(shù):
1、隨著智能電網(wǎng)的發(fā)展,電力負(fù)荷預(yù)測(cè)的準(zhǔn)確性對(duì)電力系統(tǒng)的穩(wěn)定運(yùn)行和經(jīng)濟(jì)安全至關(guān)重要。工業(yè)園區(qū)作為電力消費(fèi)的重要組成部分,其負(fù)荷預(yù)測(cè)面臨著諸多挑戰(zhàn)。傳統(tǒng)的負(fù)荷預(yù)測(cè)方法如時(shí)間序列分析和回歸分析在處理復(fù)雜非線性關(guān)系和多重影響因素時(shí)往往力不從心。近年來(lái),深度學(xué)習(xí)方法如lstm和cnn在電力負(fù)荷預(yù)測(cè)中展現(xiàn)出顯著優(yōu)勢(shì),但仍存在以下問(wèn)題:
2、難以準(zhǔn)確預(yù)測(cè)負(fù)荷的突發(fā)性波動(dòng)和非線性變化,尤其是在面對(duì)突發(fā)事件或異常情況時(shí)表現(xiàn)不佳;往往只考慮部分影響負(fù)荷變化的因素,缺乏對(duì)所有可能影響因素的全面分析;對(duì)負(fù)荷數(shù)據(jù)本身的時(shí)序特征研究不足,難以充分挖掘數(shù)據(jù)的季節(jié)性、周期性和隨機(jī)波動(dòng)特征;在處理長(zhǎng)序列數(shù)據(jù)時(shí)效率較低,難以捕捉長(zhǎng)距離的依賴關(guān)系。對(duì)數(shù)據(jù)中的不確定性和噪聲建模不足,影響預(yù)測(cè)的魯棒性。
3、這些問(wèn)題導(dǎo)致現(xiàn)有預(yù)測(cè)方法在面對(duì)復(fù)雜多變的工業(yè)園區(qū)負(fù)荷時(shí)難以達(dá)到理想的預(yù)測(cè)精度。因此,亟需一種能夠全面考慮多種影響因素、充分挖掘時(shí)序特征、有效處理長(zhǎng)序列數(shù)據(jù)、并能適應(yīng)不確定性的新型負(fù)荷預(yù)測(cè)方法。
技術(shù)實(shí)現(xiàn)思路
1、鑒于現(xiàn)有技術(shù)存在的問(wèn)題,提出了本發(fā)明。
2、因此,本發(fā)明所要解決的問(wèn)題在于難以準(zhǔn)確預(yù)測(cè)負(fù)荷的突發(fā)性波動(dòng)和非線性變化,尤其是在面對(duì)突發(fā)事件或異常情況時(shí)表現(xiàn)不佳;往往只考慮部分影響負(fù)荷變化的因素,缺乏對(duì)所有可能影響因素的全面分析;對(duì)負(fù)荷數(shù)據(jù)本身的時(shí)序特征研究不足,難以充分挖掘數(shù)據(jù)的季節(jié)性、周期性和隨機(jī)波動(dòng)特征;在處理長(zhǎng)序列數(shù)據(jù)時(shí)效率較低,難以捕捉長(zhǎng)距離的依賴關(guān)系。對(duì)數(shù)據(jù)中的不確定性和噪聲建模不足,影響預(yù)測(cè)的魯棒性的問(wèn)題。
3、為解決上述技術(shù)問(wèn)題,本發(fā)明提供如下技術(shù)方案:
4、第一方面,本發(fā)明實(shí)施例提供了一種基于diffusion-transformer-ar模型的工業(yè)園區(qū)短期負(fù)荷預(yù)測(cè)方法,其包括,獲取工業(yè)園區(qū)非平穩(wěn)歷史負(fù)荷數(shù)據(jù)和氣象數(shù)據(jù),對(duì)獲取到的負(fù)荷數(shù)據(jù)及氣象數(shù)據(jù)進(jìn)行缺失值處理,包括缺失值檢測(cè)以及通過(guò)估計(jì)值進(jìn)行缺失值填充,得到經(jīng)過(guò)清洗的時(shí)間序列數(shù)據(jù)集;
5、利用最大信息系數(shù)對(duì)負(fù)荷數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行相關(guān)性分析,選出與負(fù)荷相關(guān)性較強(qiáng)的氣象數(shù)據(jù),隨后對(duì)時(shí)間數(shù)據(jù)進(jìn)行再處理,得到具體化的時(shí)間特征;最后將包含負(fù)荷數(shù)據(jù)、氣象數(shù)據(jù)和時(shí)間數(shù)據(jù)的特征數(shù)據(jù)集,按照7:2:1的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集;
6、利用季節(jié)性趨勢(shì)分解法對(duì)負(fù)荷數(shù)據(jù)進(jìn)行時(shí)間序列分解,得到趨勢(shì)項(xiàng)、季節(jié)項(xiàng)和殘差項(xiàng)特征;
7、構(gòu)建擴(kuò)散transformer預(yù)測(cè)模型,將殘差項(xiàng)、氣象數(shù)據(jù)和時(shí)間數(shù)據(jù)作為模型輸入得到殘差預(yù)測(cè)結(jié)果;
8、構(gòu)建自回歸預(yù)測(cè)模型,將趨勢(shì)項(xiàng)作為模型輸入得到趨勢(shì)預(yù)測(cè)結(jié)果;
9、將殘差預(yù)測(cè)結(jié)果、趨勢(shì)預(yù)測(cè)結(jié)果和季節(jié)項(xiàng)進(jìn)行疊加得到負(fù)荷預(yù)測(cè)結(jié)果,優(yōu)化模型參數(shù),得到訓(xùn)練好的diffusion-transformer-ar預(yù)測(cè)模型;
10、利用訓(xùn)練好的模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè),獲得最終的負(fù)荷預(yù)測(cè)結(jié)果。
11、作為本發(fā)明所述基于diffusion-transformer-ar模型的工業(yè)園區(qū)短期負(fù)荷預(yù)測(cè)方法的一種優(yōu)選方案,其中:所述獲取工業(yè)園區(qū)歷史負(fù)荷數(shù)據(jù),檢測(cè)出負(fù)荷序列數(shù)據(jù)是否具有非平穩(wěn)性,采用單位根檢驗(yàn)方法對(duì)收集到的負(fù)荷數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗(yàn),具體步驟為:
12、首先建立假設(shè),原假設(shè)表示負(fù)荷序列數(shù)據(jù)具有單位根,即數(shù)據(jù)是非平穩(wěn)的;備擇假設(shè)表示負(fù)荷序列數(shù)據(jù)不具有單位根,即數(shù)據(jù)是平穩(wěn)的;
13、其次,使用赤池信息準(zhǔn)則來(lái)選擇自回歸模型的滯后階數(shù),隨后建立帶有滯后項(xiàng)的自回歸模型采用如下表達(dá)式:
14、
15、其中p是滯后階數(shù),δi是自回歸模型中的其它系數(shù);單位根可用augmenteddickey-fuller,adf表示;原假設(shè)可用h0表示;備擇假設(shè)可用h1表示;
16、再次,確定adf檢驗(yàn)的檢驗(yàn)統(tǒng)計(jì)量,該檢驗(yàn)統(tǒng)計(jì)量是基于回歸方程:
17、
18、估計(jì)的t統(tǒng)計(jì)量,其中是自回歸模型中的系數(shù)γ的估計(jì)值,是的標(biāo)準(zhǔn)誤差;最后,設(shè)置臨界值為5%以及確定滯后階數(shù),若計(jì)算得到的檢驗(yàn)統(tǒng)計(jì)量小于臨界值則數(shù)據(jù)是非平穩(wěn)的,否則數(shù)據(jù)是平穩(wěn)的;
19、所述獲取工業(yè)園區(qū)所在地的歷史氣象數(shù)據(jù),包括溫度、濕度、能見(jiàn)度、壓強(qiáng)、風(fēng)速、云覆蓋、降水概率和露點(diǎn),氣象數(shù)據(jù)的采集頻率和采集時(shí)刻需要與負(fù)荷數(shù)據(jù)相對(duì)應(yīng),以此來(lái)保證數(shù)據(jù)的一致性。
20、作為本發(fā)明所述基于diffusion-transformer-ar模型的工業(yè)園區(qū)短期負(fù)荷預(yù)測(cè)方法的一種優(yōu)選方案,其中:所述對(duì)獲取到的負(fù)荷數(shù)據(jù)及氣象數(shù)據(jù)進(jìn)行缺失值處理,其中,所得負(fù)荷數(shù)據(jù)及氣象數(shù)據(jù)進(jìn)行缺失值檢測(cè),并采取最近鄰插補(bǔ)法填充缺失值;
21、首先確定k值,既要考慮的鄰居數(shù)量,k值通過(guò)交叉驗(yàn)證的方法來(lái)確定,對(duì)于每個(gè)缺失值,通過(guò)歐氏距離來(lái)計(jì)算它與數(shù)據(jù)集中其它樣本的距離,選擇與缺失值距離最近的k個(gè)樣本作為最近鄰居,然后取k個(gè)最近鄰居的平均值作為缺失值的估計(jì)值,即:
22、
23、其中xi是缺失值,是最近鄰居的值,k是鄰居數(shù)量。
24、作為本發(fā)明所述基于diffusion-transformer-ar模型的工業(yè)園區(qū)短期負(fù)荷預(yù)測(cè)方法的一種優(yōu)選方案,其中:所述利用最大信息系數(shù)對(duì)負(fù)荷數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行相關(guān)性分析,其中步驟如下:
25、利用最大信息系數(shù)對(duì)負(fù)荷數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行相關(guān)性分析,最大信息系數(shù)表示可采用如下表達(dá)式:
26、
27、其中,
28、p(x,y)為變量x和y的聯(lián)合概率,p(x)和p(y)分別為變量x和y的邊緣概率,0<micx,y<1表示兩變量之間相關(guān)性的強(qiáng)弱;最后,基于micx,y值的大小,選擇出與負(fù)荷相關(guān)性較強(qiáng)的氣象數(shù)據(jù),分別為溫度、濕度和降水概率;
29、對(duì)時(shí)間數(shù)據(jù)進(jìn)行再處理,該時(shí)間數(shù)據(jù)為收集負(fù)荷數(shù)據(jù)的時(shí)間點(diǎn),但單一時(shí)刻數(shù)據(jù)對(duì)于時(shí)間方面的特征信息包含得不夠完善,因此采用自定義函數(shù)批量計(jì)算每一時(shí)刻所對(duì)應(yīng)的更為具體的時(shí)間特征,即將原始時(shí)間數(shù)據(jù)轉(zhuǎn)化為一年中的第幾月、第幾周和第幾天,以及是否周末和節(jié)假日這些具體時(shí)間特征;
30、最后,將包含負(fù)荷數(shù)據(jù)、氣象數(shù)據(jù)和時(shí)間數(shù)據(jù)的特征數(shù)據(jù)集進(jìn)行歸一化處理并進(jìn)行數(shù)據(jù)集劃分,按照7:2:1的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集;
31、其中訓(xùn)練集、驗(yàn)證集用于模型訓(xùn)練,在訓(xùn)練結(jié)果的基礎(chǔ)上通過(guò)損失函數(shù)優(yōu)化模型參數(shù),測(cè)試集用于測(cè)試模型性能。
32、作為本發(fā)明所述基于diffusion-transformer-ar模型的工業(yè)園區(qū)短期負(fù)荷預(yù)測(cè)方法的一種優(yōu)選方案,其中:所述利用季節(jié)性趨勢(shì)分解法對(duì)負(fù)荷數(shù)據(jù)進(jìn)行時(shí)間序列分解,其采用如下步驟:
33、時(shí)間序列分解主要采用局部加權(quán)線性回歸方法,loess是一種用于局部回歸分析的非參數(shù)方法,其將樣本劃分成連續(xù)小區(qū)間,對(duì)區(qū)間中的樣本進(jìn)行多項(xiàng)式擬合,通過(guò)不斷重復(fù)這個(gè)過(guò)程,從而得到在不同區(qū)間的加權(quán)回歸曲線,最后再把這些回歸曲線的中心連在一起整合成完整的回歸曲線,具體對(duì)于給定的數(shù)據(jù)點(diǎn)(xi,yi),loess采用局部加權(quán)線性回歸來(lái)擬合出一個(gè)平滑的曲線,對(duì)于任意的待預(yù)測(cè)點(diǎn)x,通過(guò)最小化加權(quán)殘差平方和來(lái)估計(jì)局部加權(quán)線性回歸的系數(shù)β0和β1,然后通過(guò)加權(quán)最小二乘法來(lái)預(yù)測(cè)其對(duì)應(yīng)的y值,其中wi是根據(jù)xi與待預(yù)測(cè)點(diǎn)x的距離確定的權(quán)重,采用高斯核函數(shù)進(jìn)行計(jì)算,即:
34、
35、其中xi是數(shù)據(jù)點(diǎn)的x值,α是平滑參數(shù);
36、時(shí)間序列分解通過(guò)時(shí)序分解加法原理對(duì)負(fù)荷序列數(shù)據(jù)進(jìn)行特征分解,一條時(shí)間序列是由多種成分相加組成,表示為yt=st+tt+rt,其中yt表示時(shí)間序列數(shù)據(jù),st表示季節(jié)項(xiàng),tt表示趨勢(shì)項(xiàng),rt表示殘差項(xiàng);
37、時(shí)間序列分解法的算法步驟為:首先設(shè)定算法所需參數(shù)值,包括周期性參數(shù)、平滑參數(shù)、趨勢(shì)窗口寬度和季節(jié)窗口寬度,周期性參數(shù)采用季節(jié)性的周期;平滑參數(shù)采用控制趨勢(shì)和季節(jié)項(xiàng)的平滑程度;趨勢(shì)窗口寬度表示合趨勢(shì)項(xiàng)的窗口寬度,季節(jié)窗口寬度表示擬合季節(jié)項(xiàng)的窗口寬度;
38、其次,使用趨勢(shì)窗口寬度的loess方法擬合時(shí)間序列的趨勢(shì)項(xiàng),對(duì)趨勢(shì)項(xiàng)利用加法分解進(jìn)行去除;
39、再次,使用季節(jié)窗口寬度的loess方法擬合剩余的序列以獲得季節(jié)項(xiàng),這需要在每個(gè)季節(jié)周期內(nèi)對(duì)數(shù)據(jù)進(jìn)行擬合,以捕捉季節(jié)性的周期性變化,并且將原始數(shù)據(jù)減去趨勢(shì)項(xiàng)和季節(jié)項(xiàng),得到殘差項(xiàng);
40、最后,檢查分解得到的趨勢(shì)項(xiàng)、季節(jié)項(xiàng)和殘差項(xiàng)是否合理,并對(duì)分解結(jié)果進(jìn)行進(jìn)一步的分析。
41、作為本發(fā)明所述基于diffusion-transformer-ar模型的工業(yè)園區(qū)短期負(fù)荷預(yù)測(cè)方法的一種優(yōu)選方案,其中:所述構(gòu)建擴(kuò)散transformer預(yù)測(cè)模型,其中可采用如下步驟:
42、經(jīng)典transformer包含編碼器和解碼器,其中多頭注意力機(jī)制最為主要,還包括位置編碼、前饋網(wǎng)絡(luò)和歸一化模塊;
43、多頭注意力模塊將經(jīng)過(guò)位置編碼的輸入序列映射到三個(gè)不同的表示空間分別為查詢空間、鍵空間和值空間,這些映射由學(xué)習(xí)得到的權(quán)重矩陣wq、wk和wv實(shí)現(xiàn);
44、對(duì)于每個(gè)頭h,首先計(jì)算查詢(q)和鍵(k)之間的點(diǎn)積,然后進(jìn)行縮放操作,最后經(jīng)過(guò)softmax函數(shù)處理得到注意力權(quán)重縮放操作指通常是除以查詢或鍵的維度的平方根,具體計(jì)算過(guò)程為:
45、q,k,v=linear(x)
46、
47、其中,qkt表示查詢和鍵之間的點(diǎn)積,dk=dmodel是鍵的維度;然后使用注意力權(quán)重對(duì)值(v)進(jìn)行加權(quán)求和,得到多頭注意力輸出為headh=attention(q,k,v)·v;最后,將所有注意力頭的輸出headh沿著最后一個(gè)維度進(jìn)行拼接得到
48、multihead(q,k,v)=concat(head1,head2,…,headh),
49、其中concat(·)表示拼接操作,每個(gè)頭都可以看作是一個(gè)獨(dú)立的注意力機(jī)制;
50、位置編碼模塊中,首先在時(shí)間步t,歷史負(fù)荷特征值h通過(guò)一個(gè)全連接層被轉(zhuǎn)換為一個(gè)d維的向量,考慮到輸入數(shù)據(jù)的時(shí)序特征,這些向量將會(huì)經(jīng)過(guò)位置編碼模塊,位置編碼模塊采用正弦和余弦函數(shù)來(lái)嵌入序列的位置信息,其數(shù)學(xué)公式如下所示:
51、
52、
53、其中,pos表示元素在時(shí)間序列中的位置,i表示嵌入向量的維度,而dmodel表示輸入嵌入層的維度,最終,位置信息和輸入嵌入值將會(huì)被加和,形成嵌入層的輸出;
54、前饋網(wǎng)絡(luò)由兩個(gè)線性層和一個(gè)激活函數(shù)組成;
55、首先將輸入數(shù)據(jù)通過(guò)一個(gè)線性變換,即將輸入矩陣乘以權(quán)重矩陣并加上偏置到一個(gè)新的特征表示,將線性變換的輸出輸入到一個(gè)激活函數(shù)中得到激活后的特征表示,最后將激活后的特征表示再次通過(guò)一個(gè)線性變換得到最終的前饋網(wǎng)絡(luò)層的輸出,具體過(guò)程為:
56、ffn(x)=relu(xw1+b1)w2+b2
57、其中x是輸入,w1和w2是權(quán)重矩陣,b1和b2是偏置,relu是激活函數(shù);
58、歸一化模塊采用層歸一化的方式,將每個(gè)樣本的每個(gè)特征進(jìn)行標(biāo)準(zhǔn)化,使得其均值為0,標(biāo)準(zhǔn)差為1,這意味著對(duì)于每個(gè)樣本,特征維度上的分布是獨(dú)立的,并且不同樣本之間的特征分布是一致的,即:
59、
60、其中,μ是特征向量的均值,σ是特征向量的標(biāo)準(zhǔn)差;擴(kuò)散模型需要構(gòu)建正向過(guò)程以及反向過(guò)程,具體步驟如下:
61、首先對(duì)擴(kuò)散神經(jīng)網(wǎng)絡(luò)模型的隱藏狀態(tài)分布進(jìn)行建模,其中h0是編碼器輸出的隱藏狀態(tài),h0~qh(h0)表示隱藏狀態(tài)的期望分布,利用pθ(h0)來(lái)近似的真實(shí)的分布qθ(h0),擴(kuò)散模型通過(guò)添加噪聲實(shí)現(xiàn)近似,具體如下:
62、
63、其中{αi}i=1:t∈(0,1)是由經(jīng)驗(yàn)所確定的集值。由高斯分布的可加性,直接得到原始隱藏狀態(tài)與經(jīng)過(guò)t個(gè)噪聲添加步驟后的隱藏狀態(tài)之間的關(guān)系為:
64、
65、其中然后,將白噪聲重新映射回原始數(shù)據(jù)空間,將所需分布的近似值進(jìn)行分解得到qh(h0):=∫qh(h0:t)dh1:t,并將分解表示為如下形式,即:
66、
67、其次,將白噪聲轉(zhuǎn)化為預(yù)期的隱藏狀態(tài),定義一個(gè)以參數(shù)θ建模模塊的反向過(guò)程pθ(h0),繼續(xù)將聯(lián)合分布進(jìn)行分解,即:
68、
69、其中,假設(shè)p(ht)為標(biāo)準(zhǔn)高斯分布,而其他部分則由選擇的參數(shù)化給出,具體表示為
70、通過(guò)上面步驟中的推理建立了一個(gè)神經(jīng)網(wǎng)絡(luò)模型,接著利用最小化負(fù)對(duì)數(shù)似然-logpθ(h0)來(lái)消除高斯噪聲,并將起始隱藏狀態(tài)視為一個(gè)條件,然后最大化證據(jù)下界(evidence?lower?bound,elbo)來(lái)得到反向分布qh(ht-1|ht)的閉合形式的表達(dá)式,即:
71、
72、通過(guò)添加起始隱藏狀態(tài)作為條件重寫反向過(guò)程,具體表示,為
73、
74、其中,βn=1-αn,然后將其轉(zhuǎn)換成如下的高斯密度函數(shù)的形式,即:
75、
76、其中,
77、通過(guò)以上推導(dǎo)得到其中隨后設(shè)對(duì)t=1,…,t-1簡(jiǎn)化訓(xùn)練,并通過(guò)近似期望來(lái)解決近似逆分布的問(wèn)題,即:
78、
79、以上過(guò)程通過(guò)構(gòu)建反向分布來(lái)對(duì)白噪聲進(jìn)行去噪,并且使用神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)期望。最后,用噪聲代替期望來(lái)重寫優(yōu)化目標(biāo),即:
80、
81、
82、在簡(jiǎn)化步驟中,通過(guò)刪除權(quán)重系數(shù)來(lái)獲得最終的優(yōu)化目標(biāo),并通過(guò)減少真實(shí)生成的正態(tài)噪聲和神經(jīng)網(wǎng)絡(luò)生成的噪聲之間的差異,即使用pθ(ht-1|ht)來(lái)逐步近似qh(ht-1|ht,h0),從而將白噪聲轉(zhuǎn)換為概率隱藏狀態(tài);
83、對(duì)于構(gòu)建好的dt殘差預(yù)測(cè)模型,將stl分解所得殘差項(xiàng)、氣象數(shù)據(jù)和時(shí)間數(shù)據(jù)作為模型輸入對(duì)模型進(jìn)行訓(xùn)練。
84、作為本發(fā)明所述基于diffusion-transformer-ar模型的工業(yè)園區(qū)短期負(fù)荷預(yù)測(cè)方法的一種優(yōu)選方案,其中:所述構(gòu)建自回歸預(yù)測(cè)模型可采用如下步驟:
85、構(gòu)建自回歸預(yù)測(cè)模型并進(jìn)行趨勢(shì)預(yù)測(cè),自回歸預(yù)測(cè)模型由輸入層、隱藏層和輸出層組成,采取串聯(lián)的方式對(duì)以上各層進(jìn)行連接;輸入層和輸出層由簡(jiǎn)單線性層構(gòu)建,簡(jiǎn)單線性層表示全連接層,隱藏層包含線性層和激活函數(shù),以此來(lái)學(xué)習(xí)復(fù)雜的時(shí)間序列;線性層具體過(guò)程為output=input×weightt+bias;
86、激活函數(shù)用于增加神經(jīng)網(wǎng)絡(luò)的非線性特性,模型采用relu激活函數(shù),具體表達(dá)式為relu(x)=max(0,x),其中當(dāng)輸入x大于等于0時(shí),輸出為x;當(dāng)輸入x小于0時(shí),輸出為0;
87、對(duì)于構(gòu)建好的ar模型,將stl分解所得趨勢(shì)項(xiàng)作為ar模型輸入對(duì)模型進(jìn)行訓(xùn)練,優(yōu)化模型參數(shù);
88、所述將殘差預(yù)測(cè)結(jié)果、趨勢(shì)預(yù)測(cè)結(jié)果和季節(jié)項(xiàng)根據(jù)時(shí)序分解加法原理進(jìn)行疊加得到負(fù)荷預(yù)測(cè)結(jié)果,通過(guò)自定義損失函數(shù)計(jì)算模型損失,并通過(guò)反向傳播算法優(yōu)化模型參數(shù),得到預(yù)訓(xùn)練好的diffusion-transformer-ar預(yù)測(cè)模型;
89、所述利用訓(xùn)練好的模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè),獲得測(cè)試集負(fù)荷預(yù)測(cè)結(jié)果:為避免梯度消失或爆炸、模型收斂速度慢和過(guò)擬合等問(wèn)題,將數(shù)據(jù)輸入模型前進(jìn)行歸一化處理,采用最?。畲髿w一化方法;對(duì)于每個(gè)特征,確定其允許的范圍,并計(jì)算其在整個(gè)數(shù)據(jù)集中的最小值fmax和最大值fmin;對(duì)于每個(gè)特征fi和每個(gè)樣本,進(jìn)行最?。畲髿w一化處理,即:
90、
91、其中,f′是歸一化后的特征值,對(duì)數(shù)據(jù)集中的所有特征都應(yīng)用上述步驟,將所有特征都?xì)w一化到相同的范圍內(nèi),對(duì)于模型的輸出結(jié)果,使用上述歸一化函數(shù)的逆變換函數(shù)轉(zhuǎn)換回原始數(shù)據(jù)的范圍,獲得最終的負(fù)荷預(yù)測(cè)結(jié)果。
92、第二方面,本發(fā)明實(shí)施例提供了基于diffusion-transformer-ar模型的工業(yè)園區(qū)短期負(fù)荷預(yù)測(cè)系統(tǒng),其包括;
93、獲取模塊,獲取工業(yè)園區(qū)非平穩(wěn)歷史負(fù)荷數(shù)據(jù)和氣象數(shù)據(jù),對(duì)獲取到的負(fù)荷數(shù)據(jù)及氣象數(shù)據(jù)進(jìn)行缺失值處理,包括缺失值檢測(cè)以及通過(guò)估計(jì)值進(jìn)行缺失值填充,得到經(jīng)過(guò)清洗的時(shí)間序列數(shù)據(jù)集;
94、劃分模塊,利用最大信息系數(shù)對(duì)負(fù)荷數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行相關(guān)性分析,選出與負(fù)荷相關(guān)性較強(qiáng)的氣象數(shù)據(jù),隨后對(duì)時(shí)間數(shù)據(jù)進(jìn)行再處理,得到具體化的時(shí)間特征;最后將包含負(fù)荷數(shù)據(jù)、氣象數(shù)據(jù)和時(shí)間數(shù)據(jù)的特征數(shù)據(jù)集,按照7:2:1的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集;
95、分解模塊,利用季節(jié)性趨勢(shì)分解法對(duì)負(fù)荷數(shù)據(jù)進(jìn)行時(shí)間序列分解,得到趨勢(shì)項(xiàng)、季節(jié)項(xiàng)和殘差項(xiàng)特征;
96、構(gòu)建模塊,構(gòu)建擴(kuò)散transformer預(yù)測(cè)模型,將殘差項(xiàng)、氣象數(shù)據(jù)和時(shí)間數(shù)據(jù)作為模型輸入得到殘差預(yù)測(cè)結(jié)果;
97、輸入模塊,構(gòu)建自回歸預(yù)測(cè)模型,將趨勢(shì)項(xiàng)作為模型輸入得到趨勢(shì)預(yù)測(cè)結(jié)果;
98、疊加模塊,將殘差預(yù)測(cè)結(jié)果、趨勢(shì)預(yù)測(cè)結(jié)果和季節(jié)項(xiàng)進(jìn)行疊加得到負(fù)荷預(yù)測(cè)結(jié)果,優(yōu)化模型參數(shù),得到訓(xùn)練好的diffusion-transformer-ar預(yù)測(cè)模型;
99、輸出模塊,利用訓(xùn)練好的模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè),獲得最終的負(fù)荷預(yù)測(cè)結(jié)果。
100、第三方面,本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)設(shè)備,包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,其中:所述計(jì)算機(jī)程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本發(fā)明第一方面所述的基于diffusion-transformer-ar模型的工業(yè)園區(qū)短期負(fù)荷預(yù)測(cè)方法的步驟。
101、第四方面,本發(fā)明實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其中:所述計(jì)算機(jī)程序指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)如本發(fā)明第一方面所述的基于diffusion-transformer-ar模型的工業(yè)園區(qū)短期負(fù)荷預(yù)測(cè)方法的步驟。
102、本發(fā)明有益效果為:預(yù)測(cè)精度顯著提升:通過(guò)結(jié)合diffusion模型、transformer模型和ar模型的優(yōu)勢(shì),該方法能夠更準(zhǔn)確地預(yù)測(cè)負(fù)荷的突發(fā)性波動(dòng)和非線性變化。特別是在面對(duì)異常情況時(shí),預(yù)測(cè)性能得到大幅提升。
103、全面考慮影響因素:利用最大信息系數(shù)(mic)進(jìn)行相關(guān)性分析,該方法能夠全面考慮各種可能影響負(fù)荷的因素,包括氣象數(shù)據(jù)和時(shí)間特征,從而提高預(yù)測(cè)的全面性和準(zhǔn)確性。
104、深度挖掘時(shí)序特征:采用stl分解法對(duì)負(fù)荷數(shù)據(jù)進(jìn)行時(shí)間序列分解,得到趨勢(shì)項(xiàng)、季節(jié)項(xiàng)和殘差項(xiàng),充分挖掘了負(fù)荷數(shù)據(jù)的時(shí)序特征,有效提取了數(shù)據(jù)中的周期性、趨勢(shì)性和隨機(jī)性信息。
105、高效處理長(zhǎng)序列數(shù)據(jù):通過(guò)引入transformer模型,該方法能夠高效處理長(zhǎng)序列數(shù)據(jù),捕捉長(zhǎng)距離的依賴關(guān)系,提高了對(duì)長(zhǎng)期趨勢(shì)的預(yù)測(cè)能力。
106、適應(yīng)數(shù)據(jù)不確定性:引入擴(kuò)散模型能夠更好地模擬數(shù)據(jù)中的不確定性和噪聲,提高了預(yù)測(cè)結(jié)果的魯棒性和可靠性。
107、計(jì)算效率提升:transformer模型的并行計(jì)算能力顯著提高了模型的訓(xùn)練和預(yù)測(cè)速度,特別是在處理大規(guī)模數(shù)據(jù)時(shí)表現(xiàn)優(yōu)異。
108、模型泛化能力增強(qiáng):通過(guò)綜合多種模型的優(yōu)勢(shì),該方法具有更強(qiáng)的泛化能力,能夠適應(yīng)不同類型的工業(yè)園區(qū)負(fù)荷特征。
109、預(yù)測(cè)結(jié)果可解釋性提高:通過(guò)時(shí)間序列分解和分別預(yù)測(cè)不同組成部分,該方法提高了預(yù)測(cè)結(jié)果的可解釋性,有助于理解負(fù)荷變化的內(nèi)在機(jī)制。
110、適應(yīng)性強(qiáng):該方法能夠適應(yīng)不同尺度、不同頻率的時(shí)間序列數(shù)據(jù),具有較強(qiáng)的適應(yīng)能力。
111、實(shí)用性高:該方法綜合考慮了理論創(chuàng)新和實(shí)際應(yīng)用,在提高預(yù)測(cè)精度的同時(shí),也保證了模型的實(shí)用性和可實(shí)施性,對(duì)于工業(yè)園區(qū)的電力管理和調(diào)度具有重要的實(shí)際應(yīng)用價(jià)值。