本發(fā)明涉及碳排放量預測,特別涉及一種帶有誤差修正的加權組合midas碳排放量預測方法。
背景技術:
1、全球變暖已經成為當今世界面臨的重大環(huán)境問題,碳排放量的持續(xù)增長被認為是導致全球變暖的主要原因之一,其中能源消耗是碳排放的主要來源。隨著經濟的快速增長,工業(yè)化和城市化導致能源需求激增,化石燃料的大量使用使二氧化碳等溫室氣體排放量不斷攀升。因此,亟需開發(fā)一種能夠精準預測二氧化碳排放量的方法,為應對全球氣候變暖提供科學依據和行動指南。
2、關于碳排放量的預測研究,現有學者往往采用同頻數據進行建模,通過加總方式使高頻數據轉化為低頻數據,這不可避免會損失高頻數據攜帶的有效信息。為了解決混頻數據的建模和預測問題,ghysels等人提出了混頻數據抽樣(midas)模型,該模型直接利用原始數據從高頻和低頻變量中提取有用信息,避免由于變量同頻化造成信息的損失,從而提高模型估計的有效性和預測的準確性。
3、中外學者針對碳排放量的混頻預測研究也取得了較好的成績,xu等人采用midas模型對中國電力行業(yè)的年度碳排放量進行預測,發(fā)現midas模型較自回歸分布滯后模型具有更高的預測精度。zhao等人基于midas模型和反向傳播(bp)神經網絡的組合模型來預測gdp的增長對二氧化碳排放量的影響。秦華英等人采用自回歸midas模型分析高頻季度gdp對低頻二氧化碳排放量的影響效應,結果說明了midas模型對二氧化碳排放量預測的合理性。
4、然而,當前大多數研究傾向于構建基于單變量的一元混頻數據模型來預測碳排放量,但在現實中,碳排放量的變動往往受多種因素共同影響。隨著變量的維度增加,變量間非線性特征愈發(fā)顯著,混頻數據模型只能識別和捕捉碳排放量變化的線性趨勢,模型的解釋能力有所減弱。
技術實現思路
1、本發(fā)明的目的在于:針對上述背景技術中存在的不足,提供一種帶有誤差修正的加權組合midas碳排放量預測方法,基于不同的加權策略構建ar-midas的組合預測模型,尋求預測中國碳排放量的最優(yōu)模型形式;將門控循環(huán)單元(gru)引入混頻數據預測模型中,以處理時間序列中的長期依賴關系,并應對變量間非線性問題,修正混頻數據模型的預測誤差,從而提高碳排放量的預測精度。
2、為了達到上述目的,本發(fā)明提供了一種帶有誤差修正的加權組合midas碳排放量預測方法,包括如下步驟:
3、s1:獲取碳排放量和宏觀經濟指標的歷史數據;
4、s2:對原始數據進行預處理;
5、s3:以宏觀經濟指標作為高頻自變量,碳排放量作為低頻因變量,構建ar-midas模型,通過不同的加權策略將多個單變量ar-midas模型進行組合預測;
6、s4:將最優(yōu)組合模型的預測誤差作為gru的輸入,通過殘差修正網絡模型對預測結果進行修正。
7、進一步地,步驟s1中,獲取碳排放量和宏觀經濟指標的歷史數據是指從國家統計局獲取1952年至2022年的宏觀經濟指標歷史數據,所述宏觀經濟指標包括gdp、工業(yè)增加值、建筑業(yè)增加值和交通運輸業(yè)增加值,從our?world?in?data獲取1952年至2022年的二氧化碳排放量歷史數據。
8、進一步地,步驟s2中,所述數據預處理包括:
9、s21:缺失值檢測與填補;
10、首先檢查數據集中是否存在缺失值,如果存在,采用最近鄰插值法來填補缺失值,以確保數據的完整性和分析的準確性;
11、s22:異常值識別與處理;
12、通過計算數據的均值、標準差、中位數、四分位數等統計指標,結合直方圖、箱線圖等可視化工具,判斷數據中是否存在異常值,如果存在,采用平均值修正法進行,以消除異常值對后續(xù)分析可能帶來的干擾;
13、s23:宏觀經濟指標轉換;
14、考慮到中國自1992年起才開始公布季度gdp、季度工業(yè)增加值、季度建筑業(yè)增加值和季度交通運輸業(yè)增加值等宏觀經濟指標數據,為了擴大時間范圍,采用二次插值法將1952年至1992年的年度宏觀經濟指標數據轉化為季度數據,從而豐富數據基礎;
15、s24:同比增長率計算;
16、為了捕捉數據中的動態(tài)變化特征,量化分析碳排放量及相關宏觀經濟指標的變化趨勢,分別計算碳排放量以及各宏觀經濟指標的同比增長率,同比增長率是通過比較當前時期與上一年同期的數據變化量占上一年同期數據量的百分比來獲得的,這種處理方式有助于消除季節(jié)性波動和長期趨勢的影響,使數據更加平滑和易于分析。
17、進一步地,步驟s3中,以宏觀經濟指標作為高頻自變量,碳排放量作為低頻因變量,構建ar-midas模型,通過不同的加權策略將多個單變量ar-midas模型進行組合預測,包括如下步驟:
18、s31:構建ar-midas模型;
19、ar-midas模型考慮了碳排放量自身的滯后效應,可以表示為:
20、
21、其中,y表示碳排放量的同比增長率,x表示宏觀經濟指標的同比增長率,表示權重函數和滯后算子的多項式函數,k為高頻數據的最大滯后階數,l是滯后算子,m表示高頻數據和低頻數據的頻率倍數差,p是自回歸滯后階數,h是向前預測的步長,α,β,λ為未知參數,μ~n(0,σ2)為隨機擾動項;
22、上式表示,第t年的碳排放量依賴于過去第p年的碳排放量以及過去k個季度相應的宏觀經濟指標的變動;
23、權重函數包括:almon權重函數、expalmon權重函數、beta權重函數、betann權重函數、非限制權重函數和分段函數(step)權重六種;
24、s32:構建加權組合midas模型;
25、組合預測模型的表達式如下:
26、
27、式中,表示組合預測結果,用n個加權個體預測的和來衡量,為t時刻預測的第n個結果,wn,t表示單個預測結果的權重;
28、加權策略包括以下幾種形式:
29、aic加權法:
30、
31、bic加權法:
32、
33、msfe加權法與dmsfe加權法:
34、
35、其中,t0對應樣本外預測的起點,ys和分別代表碳排放量的實際值和預測值,當δ=1時,wn,t代表msfe權重,當δ=0時,wn,t代表dmsfe權重。
36、進一步地,步驟s4中,將最優(yōu)組合模型的預測誤差作為gru的輸入,通過殘差修正網絡模型對預測結果進行修正,包括如下步驟:
37、s41:選擇最優(yōu)組合預測模型;
38、采用均方根誤差(rmse)來對比基于不同加權策略的組合模型預測精度,選擇rmse最小的模型作為最優(yōu)組合預測模型,rmse的表達式為:
39、
40、式中,ys和分別代表碳排放量的實際值和預測值;
41、s42:基于gru模型的誤差修正;
42、將最優(yōu)組合預測模型的預測結果與原始數據作差,得到一個誤差序列,將該誤差序列作為gru模型的輸入,輸出誤差預測值,將所述誤差預測值與最優(yōu)組合模型的預測值疊加,得到最終預測結果,完成誤差修正;
43、gru誤差修正模型具體采用如下公式:
44、zt=σ(wz·[ht-1,xt])
45、rt=σ(wr·[ht-1,xt])
46、
47、
48、其中,zt和rt分別代表重置門和更新門,xt是t時刻的輸入數據,ht和分別為t時刻的隱藏層狀態(tài)和候選隱藏層狀態(tài),σ為激活函數,wr和wz分別是rt和zt的權重矩陣。
49、與現有技術相較,本發(fā)明的顯著優(yōu)勢體現在以下幾個方面:
50、1、考慮到碳排放量自身的滯后效應,本發(fā)明在傳統的midas模型中引入自回歸項,構建ar-midas模型,捕捉過去碳排放水平對當前碳排放的影響,從而提高預測的準確性。
51、2、由于碳排放量的波動受多種因素影響,為了降低預測誤差的風險,本發(fā)明基于不同的加權策略構建ar-midas的組合預測模型,從單變量模型中提取并融合預測信息,提升預測的準確性,并增加預測結果的可靠性;
52、3、隨著變量的維度增加,變量間非線性特征愈發(fā)顯著,混頻數據模型只能識別和捕捉碳排放量變化的線性趨勢,基于此,本發(fā)明將gru引入混頻數據模型中,使模型能夠捕捉碳排放量的非線性特征,并有效處理時間序列中的長期依賴關系,修正混頻數據模型的預測誤差,從而提高碳排放量的預測精度。
53、下面通過附圖和具體實施例,對本發(fā)明的技術方案做進一步的詳細描述。