本發(fā)明涉及電子技術領域,尤其涉及一種空氣質(zhì)量指數(shù)預測方法和裝置。
背景技術:
隨著工業(yè)化和城鎮(zhèn)化的推進以及城市車輛的持續(xù)增加,大氣污染日益加重,城市空氣質(zhì)量逐步惡化,霧霾天氣也越來越多,嚴重影響了人們的工作生活,由此造成的健康損害引起了政府和民眾的廣泛關注。
AQI(空氣質(zhì)量指數(shù),Air Quality Index)是定量描述城市空氣質(zhì)量情況的一個參數(shù),也是目前衡量空氣質(zhì)量情況最常參考的指標。AQI通過函數(shù)關系將二氧化硫(SO2)、一氧化碳(CO)、二氧化氮(NO2)、臭氧(O3)以及懸浮顆粒物PM2.5和PM10五類污染物的含量信息折算為一個參數(shù)。AQI的取值區(qū)間為[0,500],AQI數(shù)值越大、級別越高,表面空氣污染狀況越嚴重。
對一個城市的AQI進行快速、準確地預測可為預防和治理空氣污染發(fā)揮積極作用。目前,針對AQI預測的方法主要分為兩大類:
(1)因素預測法:通過建立AQI與其各影響因素之間的定量關系預測AQI。然而,由于AQI的影響因素復雜,涉及數(shù)據(jù)量大,且各影響因素之間具有高度的非線性關系,因此難以建立精確的預測模型,預測精度差。
(2)基于時間序列的預測法:該類方法又可細分為兩類,具體為針對原始AQI時間序列的預測方法和融入數(shù)據(jù)分解技術的AQI時間序列預測方法。其中,數(shù)據(jù)分解技術例如EMD(經(jīng)驗模態(tài)分解,Empirical Mode Decomposition)、EEMD(集合經(jīng)驗模態(tài)分解,Ensemble Empirical Mode Decomposition)。然而,目前融入數(shù)據(jù)分解技術的AQI時間序列預測法,只采用單一數(shù)據(jù)分解技術對AQI時間序列數(shù)據(jù)進行分解以降低數(shù)據(jù)序列的非平穩(wěn)性,雖然在一定程度上提高了預測精度,但由于其分解后的數(shù)據(jù)序列中依然存在高頻震蕩數(shù)據(jù)序列,導致預測精度難以大幅提高。
所以,現(xiàn)有預測AQI的方法都存在預測精度差的技術問題。
技術實現(xiàn)要素:
本發(fā)明實施例提供了一種空氣質(zhì)量指數(shù)預測方法和裝置,用于通過兩階段分解及極限學習機對空氣質(zhì)量指數(shù)進行預測,實現(xiàn)提高預測精度的技術效果。
第一方面,本發(fā)明提供了一種空氣質(zhì)量指數(shù)預測方法,包括:
獲得待預測地理位置的歷史空氣質(zhì)量指數(shù)AQI數(shù)據(jù);
根據(jù)互補集合經(jīng)驗模態(tài)分解CEEMD方法,將所述歷史AQI數(shù)據(jù)分解為m個固有模態(tài)函數(shù)IMF分量和一個趨勢分量;其中,m為大于1的自然數(shù);
獲得所述m個IMF分量中的高頻IMF分量;
基于變分模態(tài)分解VMD方法,獲得所述高頻IMF分量的n個變分模態(tài)VM分量;其中,n為大于1的自然數(shù);
基于極限學習機模型,獲得所述n個VM分量的預測值、所述高頻IMF分量以外的其它IMF分量的預測值以及所述趨勢分量的預測值;
獲得所述高頻IMF分量對應的所述VM分量的預測值的第一線性疊加值,并將所述第一線性疊加值確定為所述高頻IMF的預測值;
獲得所述高頻IMF的預測值、所述其它IMF分量的預測值以及所述趨勢分量的預測值的第二線性疊加值,并將所述第二線性疊加值確定為所述待預測地理位置的AQI預測值。
可選的,根據(jù)互補集合經(jīng)驗模態(tài)分解CEEMD方法,將所述歷史AQI數(shù)據(jù)分解為m個固有模態(tài)函數(shù)IMF分量和一個趨勢分量,包括:
向所述歷史AQI數(shù)據(jù)序列中加入輔助白噪聲,獲得兩個新的集合IMF信號;其中,向所述歷史AQI數(shù)據(jù)序列中加入輔助白噪聲是以期望為0,標準差為0.2,正負成對且呈正態(tài)分布的形式加入;
基于經(jīng)驗模態(tài)分解EMD對所述兩個新的集合IMF信號中的每一個信號進行分解,獲得每個新的集合IMF的IMF分量;
判斷循環(huán)次數(shù)是否達到預設次數(shù)N;
當循環(huán)次數(shù)未達到預設次數(shù)時,再次執(zhí)行:向所述歷史AQI數(shù)據(jù)序列中加入輔助白噪聲,獲得兩個新的集合IMF信號,以及基于經(jīng)驗模態(tài)分解EMD對所述兩個新的集合IMF信號中的每一個信號進行分解,獲得每個新的集合IMF的IMF分量;
當所述循環(huán)次數(shù)達到所述預設次數(shù)N時,獲得2N組IMF分量,確定所述2N組IMF分量的平均值為所述歷史AQI數(shù)據(jù)的所述m個IMF分量和所述趨勢分量;其中,每組IMF分量均包括m個IMF分量和一個趨勢分量。
可選的,獲得所述m個IMF分量中的高頻IMF分量,包括:
按照頻率從高到低對所述m個IMF分量進行排序;
確定滿足預設條件的IMF分量為所述高頻IMF分量。
可選的,基于變分模態(tài)分解VMD方法,獲得所述高頻IMF分量的n個變分模態(tài)VM分量,包括:
初始化和n;其中,為第1次迭代中的第k個模態(tài)函數(shù),為的傅里葉轉換,λ表示朗格拉日乘法算子,{λ1}為第1次迭代中的拉格朗日乘法算子,為的傅里葉轉換,為初始化中心頻率,uk為k個模態(tài)函數(shù),ωk為中心頻率,n為迭代次數(shù);
根據(jù)下列公式更新uk:
根據(jù)下列公式更新ωk:
其中,為當前剩余量的維納濾波,為當前模態(tài)函數(shù)功率譜的重心,分別為g(t)、ui(t)、λ(t)和的傅里葉轉換,g(t)為所述高頻IMF分量,ui(t)為第i個模態(tài)函數(shù),λ(t)為拉格朗日乘法算子,為uk經(jīng)過n+1次迭代后的值,1≤i≤k,α為二次懲罰因子;
根據(jù)下列公式更新λ:
其中,為λ(ω)經(jīng)過n次迭代后的傅里葉轉換,為λ(ω)經(jīng)過n+1次迭代后的傅里葉轉換,τ為更新系數(shù);
判斷是否成立,其中,e>0;為uk經(jīng)過n次迭代后的傅里葉轉換;
當成立時,將uk作為所述n個VM分量;
當不成立時,再次更新uk和ωk。
可選的,基于極限學習機模型,獲得所述n個VM分量的預測值、所述高頻IMF分量以外的其它IMF分量的預測值以及所述趨勢分量的預測值,包括:
基于極限學習機模型,根據(jù)所述n個VM分量中每個VM分量的每前8個數(shù)據(jù)預測第9個數(shù)據(jù),獲得每個VM分量的預測值,進而獲得所述n個VM分量的預測值;
基于極限學習機模型,根據(jù)所述其它IMF分量中每個IMF分量的每前8個數(shù)據(jù)預測第9個數(shù)據(jù),獲得每個IMF分量的預測值,進而獲得所述其它IMF分量的預測值;
基于極限學習機模型,根據(jù)所述趨勢分量的每前8個數(shù)據(jù)預測第9個數(shù)據(jù),獲得所述趨勢分量的預測值。
可選的,所述歷史AQI數(shù)據(jù)的長度大于500。
第二方面,本發(fā)明提供了一種空氣質(zhì)量指數(shù)預測裝置,包括:
第一獲得模塊,用于獲得待預測地理位置的歷史空氣質(zhì)量指數(shù)AQI數(shù)據(jù);
CEEMD分解模塊,用于根據(jù)互補集合經(jīng)驗模態(tài)分解CEEMD方法,將所述歷史AQI數(shù)據(jù)分解為m個固有模態(tài)函數(shù)IMF分量和一個趨勢分量;其中,m為大于1的自然數(shù);
第二獲得模塊,用于獲得所述m個IMF分量中的高頻IMF分量;
VMD分解模塊,用于基于變分模態(tài)分解VMD方法,獲得所述高頻IMF分量的n個變分模態(tài)VM分量;其中,n為大于1的自然數(shù);
極限學習機模塊,用于基于極限學習機模型,獲得所述n個VM分量的預測值、所述高頻IMF分量以外的其它IMF分量的預測值以及所述趨勢分量的預測值;
第一線性疊加模塊,用于獲得所述高頻IMF分量對應的所述VM分量的預測值的第一線性疊加值,并將所述第一線性疊加值確定為所述高頻IMF的預測值;
第二線性疊加模塊,用于獲得所述高頻IMF的預測值、所述其它IMF分量的預測值以及所述趨勢分量的預測值的第二線性疊加值,并將所述第二線性疊加值確定為所述待預測地理位置的AQI預測值。
可選的,所述CEEMD模塊用于向所述歷史AQI數(shù)據(jù)序列中加入輔助白噪聲,獲得兩個新的集合IMF信號;其中,向所述歷史AQI數(shù)據(jù)序列中加入輔助白噪聲是以期望為0,標準差為0.2,正負成對且呈正態(tài)分布的形式加入;基于經(jīng)驗模態(tài)分解EMD對所述兩個新的集合IMF信號中的每一個信號進行分解,獲得每個新的集合IMF的IMF分量;判斷循環(huán)次數(shù)是否達到預設次數(shù)N;當循環(huán)次數(shù)未達到預設次數(shù)時,再次執(zhí)行:向所述歷史AQI數(shù)據(jù)序列中加入輔助白噪聲,獲得兩個新的集合IMF信號,以及基于經(jīng)驗模態(tài)分解EMD對所述兩個新的集合IMF信號中的每一個信號進行分解,獲得每個新的集合IMF的IMF分量;當所述循環(huán)次數(shù)達到所述預設次數(shù)N時,獲得2N組IMF分量,確定所述2N組IMF分量的平均值為所述歷史AQI數(shù)據(jù)的所述m個IMF分量和所述趨勢分量;其中,每組IMF分量均包括m個IMF分量和一個趨勢分量。
可選的,所述第二獲得模塊用于按照頻率從高到低對所述m個IMF分量進行排序;確定滿足預設條件的IMF分量為所述高頻IMF分量。
可選的,所述VMD分解模塊用于初始化和n;其中,為第1次迭代中的第k個模態(tài)函數(shù),為的傅里葉轉換,λ表示朗格拉日乘法算子,{λ1}為第1次迭代中的拉格朗日乘法算子,為{λ1}的傅里葉轉換,為初始化中心頻率,uk為k個模態(tài)函數(shù),ωk為中心頻率,n為迭代次數(shù);根據(jù)下列公式更新uk:根據(jù)下列公式更新ωk:其中,為當前剩余量的維納濾波,為當前模態(tài)函數(shù)功率譜的重心,分別為g(t)、ui(t)、λ(t)和的傅里葉轉換,g(t)為所述高頻IMF分量,ui(t)為第i個模態(tài)函數(shù),λ(t)為拉格朗日乘法算子,為uk經(jīng)過n+1次迭代后的值,1≤i≤k,α為二次懲罰因子;根據(jù)下列公式更新λ:其中,為λ(ω)經(jīng)過n次迭代后的傅里葉轉換,為λ(ω)經(jīng)過n+1次迭代后的傅里葉轉換,τ為更新系數(shù);判斷是否成立,其中,e>0;為uk經(jīng)過n次迭代后的傅里葉轉換;當成立時,將uk作為所述n個VM分量;當不成立時,再次更新uk和ωk。
可選的,所述極限學習模塊用于基于極限學習機模型,根據(jù)所述n個VM分量中每個VM分量的每前8個數(shù)據(jù)預測第9個數(shù)據(jù),獲得每個VM分量的預測值,進而獲得所述n個VM分量的預測值;基于極限學習機模型,根據(jù)所述其它IMF分量中每個IMF分量的每前8個數(shù)據(jù)預測第9個數(shù)據(jù),獲得每個IMF分量的預測值,進而獲得所述其它IMF分量的預測值;基于極限學習機模型,根據(jù)所述趨勢分量的每前8個數(shù)據(jù)預測第9個數(shù)據(jù),獲得所述趨勢分量的預測值。
可選的,所述歷史AQI數(shù)據(jù)的長度大于500。
本申請實施例中的上述一個或多個技術方案,至少具有如下一種或多種技術效果:
在本發(fā)明實施例的技術方案中,首先通過CEEMD將非平穩(wěn)的歷史AQI數(shù)據(jù)序列分解成一系列具有不同頻率特征的IMF分量和趨勢分量,然后,通過VMD將其中的每個高頻IMF分量進一步分解為若干VM分量,進一步通過極限學習機模型對各個VM分量以及除高頻IMF分量以外的其它IMF分量和趨勢分量進行預測,并將與每個高頻IMF分量對應的VM分量的預測值進行線性疊加得到該IMF的預測值,最后通過將所有IMF及趨勢分量的預測值進行線性疊加得到最終的AQI預測值。相較于現(xiàn)有技術,對于AQI的預測具有更高的精度。
附圖說明
圖1為本發(fā)明實施例中的AQI預測方法流程圖;
圖2為本發(fā)明實施例中預測AQI的數(shù)據(jù)流向示意圖;
圖3為本發(fā)明實施例中的示例性歷史AQI數(shù)據(jù)序列;
圖4為本發(fā)明實施例中分解圖3示出的歷史AQI數(shù)據(jù)序列獲得的IMF分量示意圖;
圖5為分解圖4示出的第一個IMF分量獲得的VM分量示意圖;
圖6為不同預測方法的擬合曲線示意圖;
圖7為圖6示出的不同預測方法的預測誤差值條形圖;
圖8為本發(fā)明實施例中的AQI預測裝置示意圖。
具體實施方式
本發(fā)明實施例提供了一種空氣質(zhì)量指數(shù)預測方法和裝置,用于通過兩階段分解及極限學習機對空氣質(zhì)量指數(shù)進行預測,實現(xiàn)提高預測精度的技術效果。
為了解決上述技術問題,本發(fā)明提供的技術方案總體思路如下:
在本發(fā)明實施例的技術方案中,首先通過CEEMD將非平穩(wěn)的歷史AQI數(shù)據(jù)序列分解成一系列具有不同頻率特征的IMF分量和趨勢分量,然后,通過VMD將其中的每個高頻IMF分量進一步分解為若干VM分量,進一步通過極限學習機模型對各個VM分量以及除高頻IMF分量以外的其它IMF分量和趨勢分量進行預測,并將與每個高頻IMF分量對應的VM分量的預測值進行線性疊加得到該IMF的預測值,最后通過將所有IMF及趨勢分量的預測值進行線性疊加得到最終的AQI預測值。
下面通過附圖以及具體實施例對本發(fā)明技術方案做詳細的說明,應當理解本申請實施例以及實施例中的具體特征是對本申請技術方案的詳細的說明,而不是對本申請技術方案的限定,在不沖突的情況下,本申請實施例以及實施例中的技術特征可以相互組合。
本文中術語“和/或”,僅僅是一種描述關聯(lián)對象的關聯(lián)關系,表示可以存在三種關系,例如,A和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另外,本文中字符“/”,一般表示前后關聯(lián)對象是一種“或”的關系。
本發(fā)明第一方面提供了一種AQI預測方法,請參考圖1,為本發(fā)明實施例中的AQI預測方法示意圖,以及圖2,為本發(fā)明實施例中預測AQI的數(shù)據(jù)流向示意圖。該方法包括:
S101:獲得待預測地理位置的歷史空氣質(zhì)量指數(shù)AQI數(shù)據(jù);
S102:根據(jù)互補集合經(jīng)驗模態(tài)分解CEEMD方法,將所述歷史AQI數(shù)據(jù)分解為m個固有模態(tài)函數(shù)IMF分量和一個趨勢分量;
S103:獲得所述m個IMF分量中的高頻IMF分量;
S104:基于變分模態(tài)分解VMD方法,獲得所述高頻IMF分量的n個變分模態(tài)VM分量;
S105:基于極限學習機模型,獲得所述n個VM分量的預測值、所述高頻IMF分量以外的其它IMF分量的預測值以及所述趨勢分量的預測值;
S106:獲得所述高頻IMF分量對應的所述VM分量的預測值的第一線性疊加值,并將所述第一線性疊加值確定為所述高頻IMF的預測值;
S107:獲得所述高頻IMF的預測值、所述其它IMF分量的預測值以及所述趨勢分量的預測值的第二線性疊加值,并將所述第二線性疊加值確定為所述待預測地理位置的AQI預測值。
為了更加清楚地描述本發(fā)明實施例的技術方案,下面將結合一組具體數(shù)據(jù)來說明。本領域技術人員應當理解,盡管本發(fā)明實施例中結合具體數(shù)據(jù)進行介紹,但僅是一種示例性,在具體實現(xiàn)過程中,并不限于下述案例。
圖3所示出了本發(fā)明實施例的示例性歷史AQI數(shù)據(jù)序列。圖3中的數(shù)據(jù)為湖北省武漢市自2014年7月1日至2016年6月30日的日AQI序列,共計731個數(shù)據(jù)。從圖3中可以看出,AQI序列波動較劇烈,且無明顯變化規(guī)律。在S101中,獲取上述包含731個歷史AQI數(shù)據(jù)的歷史AQI數(shù)據(jù)序列。在具體實現(xiàn)過程中,歷史AQI數(shù)據(jù)的長度應大于500,以保證預測的準確性。
然后,在S102中,利用CEEMD(互補集合經(jīng)驗模態(tài)分解,Complementary Ensemble Empirical Mode Decomposition)方法,將該歷史AQI數(shù)據(jù)序列分解為m個IMF(固有模態(tài)函數(shù),Intrinsic Mode Function)分量和一個趨勢分量。其中,m為大于1的自然數(shù)。在本發(fā)明實施例中,通過以下步驟進行分解:
S1021:向所述歷史AQI數(shù)據(jù)序列中加入輔助白噪聲,獲得兩個新的集合IMF信號;
S1022:基于經(jīng)驗模態(tài)分解EMD對所述兩個新的集合IMF信號中的每一個信號進行分解,獲得每個新的集合IMF的IMF分量;
S1023:判斷循環(huán)次數(shù)是否達到預設次數(shù)N;
S1024:獲得2N組IMF分量,并計算所述2N組IMF分量的平均值。
具體來講,在本發(fā)明實施例中,S1021中加入輔助白噪聲,是以期望為0,標準差為0.2,正負成對且呈正態(tài)分布的形式加入。具體通過以下公式(1)和公式(2)加入,
其中,X(t)為歷史AQI數(shù)據(jù)序列,wi(t)為第i次加入的輔助白噪聲的值。其中,wi(t)的幅值為0.2~2.5倍原始信號的標準偏差,或者隨噪聲的強度而適當調(diào)整,本發(fā)明不做具體限制。和則表示了加入輔助白噪聲后形成的兩個新的集合IMF信號。
接下來,在S1022中,對和進行EMD(經(jīng)驗模態(tài)分解,Empirical Mode Decomposition)分解,獲得和各自的IMF分量。具體通過以下過程獲得:
(1)識別出信號x(t)的所有極值點,獲得信號x(t)的上包絡線emax(t)和下包絡線emin(t),進一步獲得上下包絡線的平均值m1(t),
m1(t)=[emax(t)+emin(t)]/2。 公式(3)
x(t)表示加入了輔助白噪聲的信號,即或
(2)x(t)減去m1(t)得到移除低頻的新數(shù)據(jù)序列h1(t),
h1(t)=x(t)-m1(t)。 公式(4)
(3)由于h1(t)通常不是IMF分量,所以還需要進行k次篩選,直到篩選出所得到的平均曲線趨于零,此時篩選結果才是IMF分量。具體來講,令h1k(t)表示第k次篩選所得的數(shù)據(jù),h1(k-1)(t)表示第k-1次篩選所得的數(shù)據(jù)。利用限制標準差SD的值來判斷篩選結果是否為IMF分量,其中,
其中,T為當前篩選序列長度。當SD在[0.2,0.3]中時,篩選結束,獲得篩選結果,即IMF分量
h1k(t)=x(t)-m1k(t)。 公式(6)
其中,m1k(t)為上下包絡序列的平均值序列第k次篩選后所獲得的數(shù)據(jù)。
(4)令c1=h1k(t),c1即為信號x(t)的第一個IMF分量,即x(t)的高頻成分,因此,獲得移除最高頻成分的差值數(shù)據(jù)序列
r1=x(t)-c1。 公式(7)
然后,再次通過上述利用公式(5)中SD的值篩選出第二個IMF分量c2。
然后再獲得移除c2的序列,并再篩選出第三個IMF分量c3。依次類推,直到獲得c2,c3,…,cn和殘差項rn。換言之,本發(fā)明實施例中x(t)可理解為
其中,cj為第j個IMF分量,而rm就為趨勢分量。
接下來,在S1023中判斷S1021到S1022的循環(huán)次數(shù)是否達到預設次數(shù)N。其中,本發(fā)明實施例中的N為100~1000中的任意值,本發(fā)明不做限制。在預測圖3所示的歷史AQI數(shù)據(jù)序列中,可以取N=500。
當循環(huán)次數(shù)未達到N=500時,重新加入一組新的輔助白噪聲,進而再次獲得兩組IMF分量。
當循環(huán)次數(shù)達到N=500時,為了消除多次加入的輔助白噪聲的影響,取對應的IMF分量的均值為最終的IMF分量。具體來講,通過下列公式(9)獲得對應的IMF分量的均值:
其中,IMFj表示第j個分量,1≤j≤m,如圖4中的IMF1、IMF2、IMF3、IMF4、IMF5、IMF6、IMF7、IMF8、IMF9和Res。表示第i次加入輔助白噪聲得到的分解得到的第j個IMF,表示第i次加入輔助白噪聲得到的分解得到的第j個IMF。
接下來,執(zhí)行S103,具體為:
按照頻率從高到低對所述m個IMF分量進行排序;
確定滿足預設條件的IMF分量為所述高頻IMF分量。
首先按照每個IMF的頻率將m個IMF進行排序,然后選擇滿足預設條件的IMF分量為高頻IMF分量。本發(fā)明實施例中的預設條件例如為排序中的第一位,或者頻率較高且對預測結果影響較大,本發(fā)明不做具體限制。為了方便后續(xù)介紹,假設取排列在第一位的IMF分量為高頻IMF分量,如圖4中的IMF1。
接下來,在S104中,將高頻IMF分量分解成n個VM(變分模態(tài),Variational Mode)分量。n為大于1的自然數(shù),本發(fā)明所屬領域的普通技術人員可以根據(jù)實際進行設置,本發(fā)明不做具體限制。在處理圖3示出的歷史AQI數(shù)據(jù)時,可以設置n=10。本發(fā)明通過以下步驟對高頻IMF分量進行分解:
S1041:將高頻IMF分量分解為k(其中,k=10)個模態(tài)函數(shù),每個模態(tài)均為具有中心頻率的有限帶寬。使每個模態(tài)的帶寬估計之和最小,約束條件為f與各模態(tài)之和相等,則約束變分問題如下:
其中,g(t)表示高頻IMF分量,uk為g(t)的第k個模態(tài)函數(shù),ωk為uk的中心頻率,δ(t)為uk的Dirac分布。
S1042:為獲得該約束變分的最優(yōu)解,基于增廣拉格朗日函數(shù)將公式(11)轉換為公式(12),以將約束性變分問題轉化為非約束性變分問題。
其中,λ為朗格拉日乘法算子,公式(12)中的α為二次懲罰因子。
S1043:初始化和n。
其中,為第1次迭代中的第k個模態(tài)函數(shù),為的傅里葉轉換,λ表示朗格拉日乘法算子,{λ1}為第1次迭代中的拉格朗日乘法算子,為{λ1}的傅里葉轉換,為初始化中心頻率,uk為k個模態(tài)函數(shù),ωk為中心頻率,n為當前迭代次數(shù)。初始化就是把各個變量賦為默認值,本發(fā)明實施例中的初始化就是將和n賦值為0。
S1044:交替更新和λn+1。
其中,通過公式(13)更新
通過公式(14)更新
通過公式(15)更新λn+1:
其中,為當前剩余量的維納濾波,為當前模態(tài)函數(shù)功率譜的重心,分別為g(t)、ui(t)、λ(t)和的傅里葉轉換,ui(t)為第i個模態(tài)函數(shù),為uk經(jīng)過n+1次迭代后的值,1≤i≤k,為λ(ω)經(jīng)過n次迭代后的傅里葉轉換,為λ(ω)經(jīng)過n+1次迭代后的傅里葉轉換,τ為更新系數(shù)。
S1045:判斷公式(16)是否成立。
其中,e為大于0的任意值,為uk經(jīng)過n次迭代后的傅里葉轉換。
如果此時公式(16)不成立,則返回步驟S1044,重新更新和λn+1。如果公式(16)成立,則執(zhí)行S1046:將uk作為所述n個VM分量。輸出此時的uk,uk中的10個量就是高頻IMF的VM分量,如圖5所示。
接著,執(zhí)行S105:基于極限學習機模型,獲得所述n個VM分量的預測值、所述高頻IMF分量以外的其它IMF分量的預測值以及所述趨勢分量的預測值。在本發(fā)明實施例中,具體為通過如下過程實現(xiàn)S105:
根據(jù)輸入ELM(極限學習機,Extreme Learning Machine)模型的序列,利用每前8個數(shù)據(jù)預測第9個數(shù)據(jù)。
具體來講,輸入ELM模型的序列為每個高頻IMF分量的VM分量,高頻IMF分量以外的每一個IMF分量,以及趨勢分量。在具體實現(xiàn)過程中,輸入順序,即獲得預測值的順序可以任意選擇,本發(fā)明不做具體限制。圖3中IMF′i表示第i個IMF分量IMFi的預測值,Res’表示趨勢分量Res的預測值。
利用每前8個數(shù)據(jù)預測第9個數(shù)據(jù),是指從序列中的第9個數(shù)據(jù)開始,每個數(shù)據(jù)的預測值根據(jù)前8個數(shù)據(jù)來預測。具體來講,請參考公式(17),
x'i+9=f(xi+1,xi+2,…,xi+8) 公式(17)
公式(17)中的x'i+9表示第i+9個數(shù)據(jù)的預測值,i≥0,xi+1,xi+2,…,xi+8表示第i+9個數(shù)據(jù)的前8個數(shù)據(jù),公式(17)中的f為建立的ELM。
換言之,第9個數(shù)據(jù)由第1~8個數(shù)據(jù)預測,第10個數(shù)據(jù)由第2~9個數(shù)據(jù)預測,第11個數(shù)據(jù)由第3~10個數(shù)據(jù)預測,…
其中,模型訓練時設存在N個獨立的訓練樣本{(xi,ti),i=1,2,…,N}。xi表示ELM的輸入樣本,ti為期望輸出樣本,具體輸入樣本值xi=[xi1,xi2,…,xin]T∈R,具體期望輸出樣本值ti=[ti1,ti2,…,tim]T∈R。
假設激活函數(shù)為p(x),隱含層神經(jīng)元的閾值為bi,那么網(wǎng)絡輸出yj為
其中,j=1,2,…,N,wi=[wi1,wi2,…,win]為輸入層神經(jīng)元與隱含層第i層之間的連接權值,βi=[βi1,βi2,…,βim]為隱含層第i個神經(jīng)元與輸出層神經(jīng)元之間的連接權值。
容易看出,公式(18)可以轉化為
Y=Hβ, 公式(19)
其中,Y為網(wǎng)絡的輸出矩陣,H為網(wǎng)絡的隱含層輸出矩陣,β為隱含層與輸出層之間的連接權值。
公式(19)中的矩陣形式為
當激活函數(shù)p(x)無限可微時,輸入層與隱含層之間的連接權值w以及隱含層神經(jīng)元的閾值b在訓練前可以隨機選擇,且在訓練過程中保持不變。而隱含層與輸出層之間的連接權值β可以為公式(20)的最小二乘解,
即H+為隱含層輸出矩陣H的Moore-Penrose廣義逆矩陣。
接下來,在S106中,將高頻IMF分量的VM進行線性疊加,并將線性疊加得到的第一線性疊加值作為高頻IMF分量的預測值。
具體來講,如果高頻IMF分量僅有一個,則將所有VM分量線性疊加得到的第一線性疊加值作為該唯一的高頻IMF分量的預測值。如果高頻IMF分量有多個,則將每個高頻IMF分量自身分解出的VM分量進行疊加,得到每個高頻IMF分量的第一線性疊加值,進而將由自身的VM分量疊加出的值作為該高頻IMF分量的預測值。
最后,在S107中,將S106獲得的每個高頻IMF分量的預測值、每個其它IMF分量的預測值以及趨勢分量的預測值線性疊加,得到的第二線性疊加值就是AQI預測值。
圖6示出了不同預測方法的擬合曲線示意圖。其中,未添加標識符的曲線表示歷史AQI數(shù)據(jù)序列,曲線“ELM”表示現(xiàn)有的直接預測方法的擬合曲線,曲線“CEEMD-ELM”表示現(xiàn)有的融入CEEMD分解技術的AQI預測方法的擬合曲線,曲線“VMD-ELM”表示現(xiàn)有的融入VMD分解技術的AQI預測方法的擬合曲線,曲線“CEEMD-VMD-ELM”表示本發(fā)明實施例的預測方法的擬合曲線。
圖7示出了圖6所示的不同預測方法的預測誤差值。本發(fā)明實施例中的誤差包括平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分誤差(MAPE)。可以看出,相較于現(xiàn)有技術中的多種預測方法,本發(fā)明的預測方法誤差最小,因此,本發(fā)明提高了AQI預測的精度。
基于與前述實施例中AQI預測方法同樣的發(fā)明構思,本發(fā)明第二方面還提供一種AQI預測裝置,如圖8所示,包括:
第一獲得模塊101,用于獲得待預測地理位置的歷史空氣質(zhì)量指數(shù)AQI數(shù)據(jù);
CEEMD分解模塊102,用于根據(jù)互補集合經(jīng)驗模態(tài)分解CEEMD方法,將所述歷史AQI數(shù)據(jù)分解為m個固有模態(tài)函數(shù)IMF分量和一個趨勢分量;其中,m為大于1的自然數(shù);
第二獲得模塊103,用于獲得所述m個IMF分量中的高頻IMF分量;
VMD分解模塊104,用于基于變分模態(tài)分解VMD方法,獲得所述高頻IMF分量的n個變分模態(tài)VM分量;其中,n為大于1的自然數(shù);
極限學習機模塊105,用于基于極限學習機模型,獲得所述n個VM分量的預測值、所述高頻IMF分量以外的其它IMF分量的預測值以及所述趨勢分量的預測值;
第一線性疊加模塊106,用于獲得所述高頻IMF分量對應的所述VM分量的預測值的第一線性疊加值,并將所述第一線性疊加值確定為所述高頻IMF的預測值;
第二線性疊加模塊107,用于獲得所述高頻IMF的預測值、所述其它IMF分量的預測值以及所述趨勢分量的預測值的第二線性疊加值,并將所述第二線性疊加值確定為所述待預測地理位置的AQI預測值。
可選的,CEEMD模塊102用于向所述歷史AQI數(shù)據(jù)序列中加入輔助白噪聲,獲得兩個新的集合IMF信號;其中,向所述歷史AQI數(shù)據(jù)序列中加入輔助白噪聲是以期望為0,標準差為0.2,正負成對且呈正態(tài)分布的形式加入;基于經(jīng)驗模態(tài)分解EMD對所述兩個新的集合IMF信號中的每一個信號進行分解,獲得每個新的集合IMF的IMF分量;判斷循環(huán)次數(shù)是否達到預設次數(shù)N;當循環(huán)次數(shù)未達到預設次數(shù)時,再次執(zhí)行:向所述歷史AQI數(shù)據(jù)序列中加入輔助白噪聲,獲得兩個新的集合IMF信號,以及基于經(jīng)驗模態(tài)分解EMD對所述兩個新的集合IMF信號中的每一個信號進行分解,獲得每個新的集合IMF的IMF分量;當所述循環(huán)次數(shù)達到所述預設次數(shù)N時,獲得2N組IMF分量,確定所述2N組IMF分量的平均值為所述歷史AQI數(shù)據(jù)的所述m個IMF分量和所述趨勢分量;其中,每組IMF分量均包括m個IMF分量和一個趨勢分量。
可選的,第二獲得模塊103用于按照頻率從高到低對所述m個IMF分量進行排序;確定滿足預設條件的IMF分量為所述高頻IMF分量。
可選的,VMD分解模塊104用于初始化和n;其中,為第1次迭代中的第k個模態(tài)函數(shù),為的傅里葉轉換,λ表示朗格拉日乘法算子,{λ1}為第1次迭代中的拉格朗日乘法算子,為{λ1}的傅里葉轉換,為初始化中心頻率,uk為k個模態(tài)函數(shù),ωk為中心頻率,n為迭代次數(shù);根據(jù)下列公式更新uk:根據(jù)下列公式更新ωk:其中,為當前剩余量的維納濾波,為當前模態(tài)函數(shù)功率譜的重心,分別為g(t)、ui(t)、λ(t)和的傅里葉轉換,g(t)為所述高頻IMF分量,ui(t)為第i個模態(tài)函數(shù),λ(t)為拉格朗日乘法算子,為uk經(jīng)過n+1次迭代后的值,1≤i≤k,α為二次懲罰因子;根據(jù)下列公式更新λ:其中,為λ(ω)經(jīng)過n次迭代后的傅里葉轉換,為λ(ω)經(jīng)過n+1次迭代后的傅里葉轉換,τ為更新系數(shù);判斷是否成立,其中,e>0;為uk經(jīng)過n次迭代后的傅里葉轉換;當成立時,將uk作為所述n個VM分量;當不成立時,再次更新uk和ωk。
可選的,極限學習模塊105用于基于極限學習機模型,根據(jù)所述n個VM分量中每個VM分量的每前8個數(shù)據(jù)預測第9個數(shù)據(jù),獲得每個VM分量的預測值,進而獲得所述n個VM分量的預測值;基于極限學習機模型,根據(jù)所述其它IMF分量中每個IMF分量的每前8個數(shù)據(jù)預測第9個數(shù)據(jù),獲得每個IMF分量的預測值,進而獲得所述其它IMF分量的預測值;基于極限學習機模型,根據(jù)所述趨勢分量的每前8個數(shù)據(jù)預測第9個數(shù)據(jù),獲得所述趨勢分量的預測值。
可選的,所述歷史AQI數(shù)據(jù)的長度大于500。
前述圖1-圖7實施例中的AQI預測方法的各種變化方式和具體實例同樣適用于本實施例的AQI預測裝置,通過前述對AQI預測方法的詳細描述,本領域技術人員可以清楚的知道本實施例中AQI預測裝置的實施方法,所以為了說明書的簡潔,在此不再詳述。
本申請實施例中的上述一個或多個技術方案,至少具有如下一種或多種技術效果:
在本發(fā)明實施例的技術方案中,首先通過CEEMD將非平穩(wěn)的歷史AQI數(shù)據(jù)序列分解成一系列具有不同頻率特征的IMF分量和趨勢分量,然后,通過VMD將其中的每個高頻IMF分量進一步分解為若干VM分量,進一步通過極限學習機模型對各個VM分量以及除高頻IMF分量以外的其它IMF分量和趨勢分量進行預測,并將與每個高頻IMF分量對應的VM分量的預測值進行線性疊加得到該IMF的預測值,最后通過將所有IMF及趨勢分量的預測值進行線性疊加得到最終的AQI預測值。相較于現(xiàn)有技術,對于AQI的預測具有更高的精度。
本領域內(nèi)的技術人員應明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上實施的計算機程序產(chǎn)品的形式。
本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設備(系統(tǒng))、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合??商峁┻@些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設備的處理器以產(chǎn)生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
這些計算機程序指令也可存儲在能引導計算機或其他可編程數(shù)據(jù)處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設備上,使得在計算機或其他可編程設備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或其他可編程設備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
顯然,本領域的技術人員可以對本發(fā)明進行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及其等同技術的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。