反演模型的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于遙感技術(shù)領(lǐng)域,具體涉及的是基于杭州地區(qū)的氣溶膠光學(xué)厚度(A0D) 的大氣細(xì)顆粒物(PM2.5)的反演建模,利用A0D和PM2.5之間的正相關(guān)性,建立一種基于A0D 的杭州地區(qū)PM2.5反演模型。
【背景技術(shù)】
[0002] 大氣顆粒物(particulatematter,PM)是指分散在空氣環(huán)境中的固態(tài)或液態(tài)顆 粒物質(zhì),其中,動(dòng)力學(xué)直徑小于等于2. 5微米的即為細(xì)顆粒物(fineparticularmatter, PM2.5)。PM2.5因其易附帶有毒有害物質(zhì),并且能夠隨呼吸直接進(jìn)入人體肺部,對(duì)人體健康造 成一定傷害,因其輸送距離遠(yuǎn)以及在空氣中停留時(shí)間長的特點(diǎn),可對(duì)大氣造成污染。
[0003] 氣溶膠光學(xué)厚度(AerosolOpticalDepth,A0D)描述的是大氣顆粒物對(duì)太陽光的 吸收和散射特性,體現(xiàn)大氣氣溶膠的光學(xué)性質(zhì)。目前,針對(duì)A0D的測(cè)定主要分為空基觀測(cè)和 地基觀測(cè)兩種??栈^測(cè)是指通過搭載在衛(wèi)星上的中分辨率成像光譜儀(M0DIS)獲取數(shù)據(jù) 的方法,該方法能夠覆蓋更廣的空間范圍。地基觀測(cè)是氣溶膠光學(xué)特性研究中一種精度較 高的方法,主要是利用CE-318太陽光度計(jì)獲取具有區(qū)域代表性的氣溶膠光學(xué)參數(shù)。
[0004] 目前能夠反映大氣污染水平的指標(biāo)雖然比較多,并且其中大部分指標(biāo)都是通過地 面監(jiān)測(cè)點(diǎn)測(cè)得,具有較高的精確度,但是污染物的濃度水平易受溫度、濕度、氣壓等氣象因 素的影響,因此在綜合評(píng)價(jià)、比較以及真實(shí)反映各地區(qū)的空氣質(zhì)量存在一定的局限性。采用 A0D作為反映大氣污染狀況的綜合指標(biāo),不僅擴(kuò)大了監(jiān)測(cè)的區(qū)域范圍,同時(shí)可以整體反映顆 粒物及大氣污染物的綜合水平。因此,本發(fā)明利用A0D和PM2.5之間的相關(guān)性,建立反向傳 播神經(jīng)網(wǎng)絡(luò)模型(BP神經(jīng)網(wǎng)絡(luò)模型),可以較好的反映PM2.5的污染狀況。
[0005] 人工神經(jīng)網(wǎng)絡(luò)(ANN,artificialneuralnetworks)是以軟硬件形式出現(xiàn)并執(zhí)行 的計(jì)算機(jī)系統(tǒng),簡稱為神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)是根據(jù)人腦神經(jīng)系統(tǒng)中基本單元的工作方式,即 神經(jīng)元的組織結(jié)構(gòu)和運(yùn)行機(jī)制建立的數(shù)學(xué)模型。
[0006] 神經(jīng)網(wǎng)絡(luò)起源于1940s,由W.McCulloch和W.Pitts提出首個(gè)人工神經(jīng)網(wǎng)絡(luò)模型; 到了 1960s,更多的學(xué)者進(jìn)行神經(jīng)網(wǎng)絡(luò)模型的研究,其中包括F.Rosenblatt建立可用于模 式識(shí)別的神經(jīng)感知器網(wǎng)絡(luò),B.Widrow和T.Hoff則提出了Delta學(xué)習(xí)算法;在此后的十年 里,M.Minsky和S.Papert發(fā)現(xiàn)了神經(jīng)網(wǎng)絡(luò)的局限性;直到80年代計(jì)算機(jī)的出現(xiàn)拯救了神 經(jīng)網(wǎng)絡(luò)及其領(lǐng)域[1]。
[0007] 神經(jīng)網(wǎng)絡(luò)是由大量簡單的處理單元構(gòu)成的復(fù)雜網(wǎng)絡(luò)系統(tǒng),即通過神經(jīng)元及其互聯(lián) 拓?fù)浣Y(jié)構(gòu)和網(wǎng)絡(luò)學(xué)習(xí)算法,實(shí)現(xiàn)模擬人腦處理信息的能力。其中,神經(jīng)網(wǎng)絡(luò)通過數(shù)據(jù)在網(wǎng)絡(luò) 系統(tǒng)中的流動(dòng),將神經(jīng)元接收的輸入數(shù)據(jù)流進(jìn)行響應(yīng)處理后傳送到其他神經(jīng)元。通過學(xué)習(xí) 過程,網(wǎng)絡(luò)系統(tǒng)不斷獲取新的知識(shí),并以網(wǎng)絡(luò)結(jié)構(gòu)和連接權(quán)值的形式存儲(chǔ)在網(wǎng)絡(luò)系統(tǒng)之中。
[0008] BP神經(jīng)網(wǎng)絡(luò)模型(backpropagationneutralnetwork,BP)起源于 1986 年,由 Rumelhart和McCelland提出,是迄今為止應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)模型一直。BP神經(jīng)網(wǎng) 絡(luò)是一種按誤差反向傳播,具有三層或三層以上神經(jīng)元的多層前饋神經(jīng)網(wǎng)絡(luò)模型,不同的 神經(jīng)元之間通過網(wǎng)絡(luò)的權(quán)值進(jìn)行連接,層與層傳遞信息的同時(shí)通過添加閥值對(duì)信息進(jìn)行整 合。
[0009] BP神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)過由信息的正向傳播與誤差的反向傳播兩部分組成。當(dāng)信 息正向傳播時(shí),信息由輸入層傳入,經(jīng)隱含層進(jìn)行交換處理后,傳遞到輸出層。若輸出層的 實(shí)際輸出與期望輸出存在誤差,則將進(jìn)行第二個(gè)誤差反向傳播階段。在誤差反向傳播時(shí),將 輸出誤差由隱含層向輸入層進(jìn)行反向傳播,同時(shí)將誤差分?jǐn)偟礁鱾€(gè)神經(jīng)元,即為誤差修正 網(wǎng)絡(luò)的權(quán)值。權(quán)值不斷調(diào)整的過程,即為BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練的過程。
[0010] BP神經(jīng)網(wǎng)絡(luò)及其變化形式是人工神經(jīng)網(wǎng)絡(luò)中的核心部分。在人工神經(jīng)網(wǎng)絡(luò)的實(shí)際 應(yīng)用中,BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用較為廣泛,主要可以應(yīng)用于:函數(shù)逼近、模式識(shí)別、分類和數(shù)據(jù) 壓縮等應(yīng)用領(lǐng)域[2]。
[0011] 引證文件
[0012] [1].程國建.神經(jīng)計(jì)算與生長自組織網(wǎng)絡(luò)[M].西安:西安交通大學(xué)出版 社,2008. 10.
[0013] [2].周品.MATLAB神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)與應(yīng)用[M].北京:清華大學(xué)出版社,2013. 3.
【發(fā)明內(nèi)容】
[0014] 本發(fā)明的目的是根據(jù)杭州地區(qū)的A0D和PM2.5實(shí)測(cè)數(shù)據(jù),建立一種基于A0D的杭州 地區(qū)PM2.5反演模型。
[0015] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案具體包括如下步驟:
[0016] 步驟(1):對(duì)A0D和PM2.5的實(shí)測(cè)數(shù)據(jù)進(jìn)行篩選;
[0017] 步驟(2):對(duì)用于模型計(jì)算的實(shí)測(cè)數(shù)據(jù)進(jìn)行歸一化預(yù)處理;
[0018] 步驟(3):建立基于A0D實(shí)測(cè)數(shù)據(jù)的BP神經(jīng)網(wǎng)絡(luò)模型;
[0019] 步驟(4):通過A0D測(cè)試數(shù)據(jù)驗(yàn)證PM2.5反演模型。
[0020] 步驟⑴中所述針對(duì)A0D和PM2.5的實(shí)測(cè)數(shù)據(jù)進(jìn)行篩選,具體如下:由于A0D描述 的是大氣顆粒物對(duì)太陽光的吸收和散射特性,體現(xiàn)大氣氣溶膠的光學(xué)性質(zhì),因此只有在日 出之后至日落之前可以測(cè)得數(shù)據(jù),云的遮擋等天氣因素也會(huì)造成A0D數(shù)據(jù)的缺失,以及太 陽高度計(jì)自身產(chǎn)生系統(tǒng)誤差使得所測(cè)數(shù)據(jù)出現(xiàn)異常。
[0021] 與異?;蛉笔У腁0D數(shù)據(jù)相對(duì)應(yīng)的PM2.5數(shù)據(jù)同樣不適用于BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練與 驗(yàn)證,因此針對(duì)異常數(shù)據(jù)需要進(jìn)行剔除篩選。篩選的過程是針對(duì)實(shí)測(cè)數(shù)據(jù)中,在同一個(gè)時(shí)間 節(jié)點(diǎn)所分別測(cè)得的PM2.5和A0D數(shù)據(jù),如果其中任意一方出現(xiàn)空缺或是超出標(biāo)準(zhǔn)范圍(A0D的 值小于3),則剔除該時(shí)間節(jié)點(diǎn)的數(shù)據(jù)。
[0022] 步驟(2)中所述的歸一化預(yù)處理,具體如下:
[0023] 由于神經(jīng)網(wǎng)絡(luò)應(yīng)用范圍廣泛、來源多樣,不同的數(shù)據(jù)類型其值域也不相同,因此, 在神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建過程中,需要對(duì)輸入數(shù)據(jù)以及預(yù)期的輸出數(shù)據(jù)進(jìn)行歸一化處理,也 就是通過計(jì)算時(shí)的所有的數(shù)據(jù)都統(tǒng)一在〇~1的范圍內(nèi),即通過消除數(shù)據(jù)量綱的方式,提高 網(wǎng)絡(luò)系統(tǒng)的運(yùn)算速率,本發(fā)明采用的歸一化公式如下:
[0024]
(2、、、、[)
[0025]式中,tn_為歸一化之后變量t的平均值,t為歸一化之前的變量值,t_、t_分別 為變量t的最大值、最小值
[0026] 步驟(3)中所述的建立基于A0D實(shí)測(cè)數(shù)據(jù)的BP神經(jīng)網(wǎng)絡(luò)模型,即利用神經(jīng)網(wǎng)絡(luò)系 統(tǒng)自學(xué)習(xí)、自適應(yīng)、自組織以及較好的泛化能力實(shí)現(xiàn)基于A0D實(shí)測(cè)數(shù)據(jù)的PM2.5反演過程。具 體如下:
[0027] 3. 1對(duì)篩選后的實(shí)測(cè)數(shù)據(jù)進(jìn)行隨機(jī)分組,2/3的實(shí)測(cè)數(shù)據(jù)用于BP神經(jīng)網(wǎng)絡(luò)模型的 訓(xùn)練學(xué)習(xí),1/3的實(shí)測(cè)數(shù)據(jù)用于BP神經(jīng)網(wǎng)絡(luò)模型的驗(yàn)證;
[0028] 3. 2采用誤差反傳(BP,backwardpropagation)學(xué)習(xí)律建立BP神經(jīng)網(wǎng)絡(luò)模型,同 時(shí)采用LM(levenberg-marquardt)算法函數(shù)(trainglm)作為訓(xùn)練函數(shù),具體如下:
[0029] LM算法的目的是為在修正近似二階訓(xùn)練速率時(shí),避免計(jì)算Hessian矩陣。
[0030] 首先當(dāng)誤差性能函數(shù)具有平方和誤差時(shí),Hessian矩陣表示如下:
[0031] H=JTJ(3-2)
[0032] 梯度的計(jì)算表達(dá)式為:
[0033] g=JTe(3-3)
[0034] 其中,H是Hessian矩陣,即包含網(wǎng)絡(luò)系統(tǒng)的誤差函數(shù)對(duì)其權(quán)值和閾值一階導(dǎo)數(shù)的 雅可比矩陣J;/則是雅可比矩陣J的轉(zhuǎn)置矩陣;g是梯度;e是網(wǎng)絡(luò)系統(tǒng)誤差。
[0035] LM算法通過近似的Hessian矩陣進(jìn)行如下修正:
[0036] x(k+l) =x(k)_[JTJ+yJ]Te (3-4)
[0037] 其中,x(k)表示第k次迭代的權(quán)值和閾值所組成的向量,k為自然數(shù),表示迭代次 數(shù);y為比例系數(shù)。當(dāng)y取值較大時(shí),LM算法接近于梯度下降法,每成功迭代一次,y會(huì) 減小一些,也就是說在每一次迭代后,即誤差性能減小時(shí),y會(huì)減小,因此,LM算法中每一 次迭代的誤差性能總能達(dá)到最小。
[0038] 其次,需要確定神經(jīng)網(wǎng)絡(luò)系統(tǒng)的隱含層個(gè)數(shù)以及神經(jīng)元個(gè)數(shù)。通常情況下,確定隱 含層的神經(jīng)元個(gè)數(shù)有以下三種經(jīng)驗(yàn)公式:
[0041 ]M=log2n(3-7)
[0042] 在上述公式中,1為樣本總數(shù),M為隱含層的神經(jīng)元個(gè)數(shù),n為輸入層的神經(jīng)元個(gè) 數(shù),m為輸出層的神經(jīng)元個(gè)數(shù),a是取值范圍在0~10之間的常數(shù)。其中,在公式(3-5)中, 如果i〉M,則規(guī)定(士 =
[0043] 利用經(jīng)驗(yàn)公式估算隱含層神經(jīng)元個(gè)數(shù)時(shí),需要對(duì)上述的三個(gè)經(jīng)驗(yàn)均進(jìn)行計(jì)算后, 結(jié)合其計(jì)算結(jié)果才能確定神經(jīng)元個(gè)數(shù)的取值范圍。
[0044] 此外,如果隱含層的數(shù)量為1,各個(gè)神經(jīng)元之間會(huì)產(chǎn)生"相互作用",使得提高神經(jīng) 網(wǎng)絡(luò)系統(tǒng)的精度產(chǎn)生困難。具體的隱含層數(shù)量及其神經(jīng)元個(gè)數(shù)需要進(jìn)行多次實(shí)驗(yàn)才能獲 取。
[0045] 本發(fā)明發(fā)現(xiàn)在隱含層數(shù)量為2,神經(jīng)元數(shù)為14時(shí)建立的模型效果最好。
[0046] 最后,利用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱建立BP神經(jīng)網(wǎng)絡(luò)模型,期間需要不斷調(diào)整參 數(shù),調(diào)整參數(shù)包括訓(xùn)練次數(shù)、訓(xùn)練步數(shù)、學(xué)習(xí)速率以及訓(xùn)練目標(biāo);從而使得本網(wǎng)絡(luò)模型的學(xué) 習(xí)效果最佳。
[0047] 在步驟(4)中,針對(duì)步驟(3)中所建立的模型,利用1/3的數(shù)據(jù)進(jìn)行BP神經(jīng)網(wǎng)絡(luò) 模型的驗(yàn)證。具體如下:
[0048] 在MATLAB中調(diào)用步驟(3)所建的BP神經(jīng)網(wǎng)絡(luò)模型,輸入測(cè)試數(shù)據(jù)中的A0D實(shí)測(cè) 數(shù)據(jù)進(jìn)行計(jì)算,得到PM2.5的模擬數(shù)據(jù)并做反歸一化處理。
[0049] 本發(fā)明的有益效果如下:
[0050] 本發(fā)明能夠?qū)崿F(xiàn)PM2.5的反演建模,發(fā)明的主要思想是基于A0D和PM2.5之間的正相 關(guān),建立反向傳播神經(jīng)網(wǎng)絡(luò)模型(BP神經(jīng)網(wǎng)絡(luò)模型),可以較好的反映PM2.5的污染狀況。
[0051] -方面,本發(fā)明使用A0D較其他氣象因素可較好的反映PM2.5的濃度分布狀況,此 外,地基所測(cè)的A0D數(shù)據(jù)準(zhǔn)確度較高,能夠更好的體現(xiàn)其與PM2.5之間的關(guān)系。
[0052] 另一方面,現(xiàn)可從遙感數(shù)據(jù)直接獲取A0D的數(shù)據(jù),利用本發(fā)明的反演模型即可得 到PM2.5的濃度分布,并且實(shí)施過程可行強(qiáng)、計(jì)算過程便于程序集成、計(jì)算結(jié)果精度可靠,具 有較高的行業(yè)推廣價(jià)值和應(yīng)用前景。
【附圖說明】
[0053] 圖1為本發(fā)明流程圖;
[0054] 圖2為模型計(jì)算結(jié)果與實(shí)測(cè)數(shù)據(jù)的散點(diǎn)關(guān)系圖。
【具體實(shí)施方式】
[0055] 下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步說明。
[0056] 如圖1所示,一種基于A0D的杭州地區(qū)PM2.5反演模型。
[0057] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案具體包括如下步驟:
[0058] 步驟(1):對(duì)A0D和