本發(fā)明涉及深度學(xué)習(xí)(deep?learning,dl)與蒸發(fā)波導(dǎo)建模的交叉融合應(yīng)用領(lǐng)域,特別是涉及一種基于深度學(xué)習(xí)的蒸發(fā)波導(dǎo)高度的診斷方法。
背景技術(shù):
1、蒸發(fā)波導(dǎo)是由于水汽蒸發(fā)引起大氣濕度隨高度銳減形成的一種大氣層結(jié)。這種層結(jié)具有異常大氣折射率結(jié)構(gòu)。蒸發(fā)波導(dǎo)模型可以應(yīng)用于各種蒸發(fā)引起波導(dǎo)現(xiàn)象的研究和預(yù)測,例如湖泊蒸發(fā)、水庫蒸發(fā)、土壤蒸發(fā)等。
2、目前,基于莫寧-奧布霍夫相似理論,學(xué)者們提出了一系列用于診斷蒸發(fā)波導(dǎo)高度的物理模型。其中,常用的蒸發(fā)波導(dǎo)模型包括p-j模型、musson-gauthier-bruth(mgb)模型、babin模型、navy?postgraduate?school(nps)模型、偽折射模型等。
3、這些基于相似理論的物理模型,需要計算出大氣邊界層中的特征長度l和特征參數(shù)θ*和q*。一方面,這些參數(shù)在計算過程中,采用了一些近似,存在一定的不確定性;另一方面,而這些參數(shù)的確定往往需要使用cpu進(jìn)行十分耗時的迭代計算。例如,根據(jù)實際測試,利用intel?xeon?gold?5218的24個核心計算南海近海面一年的蒸發(fā)波導(dǎo)高度時,需要持續(xù)運算數(shù)個小時。近十年來,由于計算機圖形學(xué)和深度學(xué)習(xí)等領(lǐng)域?qū)仃囘\算的算力需求,gpu算力的增長速度要遠(yuǎn)遠(yuǎn)快于cpu。例如目前最強的民用級gpu,nvidia?rtx?4090的單精度浮點性能約為83tflops,而最強的民用級cpu,amd?7995wx約為12tflops。
4、為了更快速的計算出大片海域的蒸發(fā)波導(dǎo)高度,其中一個合理的研究方向就是如何利用好gpu提供的強大算力。得益于gpu提供的算力支持和傳感器技術(shù)的發(fā)展而帶來的海量數(shù)據(jù),利用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)驅(qū)動方式的建模發(fā)展迅速。
5、具體就近海面蒸發(fā)波導(dǎo)而言,由于衛(wèi)星同化技術(shù)的發(fā)展,各個數(shù)據(jù)庫積累了大量的天氣數(shù)據(jù),例如歐洲中期天氣預(yù)報中心(ecmwf)提供的era5數(shù)據(jù)集,或是美國國家大氣研究中心(ncar)提供的再分析資料,這使得利用深度神經(jīng)網(wǎng)絡(luò)完成的蒸發(fā)波導(dǎo)高度診斷成為了可能。當(dāng)利用這項技術(shù)后,完成高時空分辨率的蒸發(fā)波導(dǎo)診斷完全可以縮短至數(shù)秒內(nèi)。
6、現(xiàn)有技術(shù)中,關(guān)于蒸發(fā)波導(dǎo)高度的預(yù)測研究主要有:
7、1、公布號是cn112711899a的中國專利申請?zhí)岢觥耙环N蒸發(fā)波導(dǎo)高度的融合預(yù)測方法”,包括步驟:(1)蒸發(fā)波導(dǎo)高度真值獲??;(2)蒸發(fā)波導(dǎo)模型高度預(yù)測;(3)模型敏感性分析;(4)最小二乘支持向量機回歸建模:根據(jù)敏感性分析結(jié)果,在不同環(huán)境區(qū)間,以獲得的氣象、水文觀測數(shù)據(jù)和蒸發(fā)波導(dǎo)模型高度預(yù)測值為輸入,以蒸發(fā)波導(dǎo)高度真值為輸出,回歸獲得輸入與輸出之間的非線性映射關(guān)系,建立多個蒸發(fā)波導(dǎo)模型預(yù)測高度的融合預(yù)測模型;(5)蒸發(fā)波導(dǎo)高度預(yù)測。
8、該技術(shù)的主要不足為:該方法采用的支持向量機算法存在缺點,例如:(1)支持向量機不適合處理大規(guī)模數(shù)據(jù),當(dāng)數(shù)據(jù)特征很多時,訓(xùn)練時間會顯著增加。(2)當(dāng)面對小數(shù)據(jù)集時,支持向量機對噪聲比較敏感,從而導(dǎo)致模型容易過擬合。
9、2、公布號是cn116559977a的中國專利申請?zhí)岢觥耙环N基于bp神經(jīng)網(wǎng)絡(luò)的nps-gryanik20蒸發(fā)波導(dǎo)高度預(yù)測方法”,其采用基于nps-gryanik20蒸發(fā)波導(dǎo)模型的環(huán)境區(qū)間劃分的方法,在不同環(huán)境區(qū)間內(nèi)構(gòu)建基于捕食者算法的bp神經(jīng)網(wǎng)絡(luò)預(yù)測模型,實現(xiàn)蒸發(fā)波導(dǎo)高度的精準(zhǔn)預(yù)測,具體包括:蒸發(fā)波導(dǎo)高度真值獲取、基于nps-gryanik20蒸發(fā)波導(dǎo)模型的環(huán)境區(qū)間劃分、基于改進(jìn)bp神經(jīng)網(wǎng)絡(luò)預(yù)測模型、蒸發(fā)波導(dǎo)的高度預(yù)測等步驟。
10、該技術(shù)的主要不足為:該方法采用的捕食者算法優(yōu)化過程分為多個階段,涉及復(fù)雜的計算步驟。這可能會導(dǎo)致較高的計算成本,尤其是當(dāng)神經(jīng)網(wǎng)絡(luò)在大規(guī)模數(shù)據(jù)集上進(jìn)行訓(xùn)練時。此外,捕食者算法不適用于所有類型的問題,而此文獻(xiàn)中缺少必要的實驗來驗證捕食者算法的適用性。
11、3、公布號是cn116579225a的中國專利申請?zhí)岢觥耙环N基于卷積神經(jīng)網(wǎng)絡(luò)的蒸發(fā)波導(dǎo)高度區(qū)域預(yù)測方法”,該方法結(jié)合數(shù)值預(yù)報產(chǎn)品網(wǎng)格數(shù)據(jù),構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)的數(shù)值預(yù)報產(chǎn)品蒸發(fā)波導(dǎo)高度區(qū)域預(yù)測模型(nwpp-edh)。
12、該技術(shù)的主要缺陷為:此方法在網(wǎng)絡(luò)的各個模塊中一律使用2×2的經(jīng)典卷積層。較小的卷積核具有較小的感受野,會導(dǎo)致模型的擬合能力變差。在實驗部分,nwpp-edh的rmse指標(biāo)大于1從側(cè)面證明了這一點。此外,使用一般的卷積方式會使得網(wǎng)絡(luò)具有較大的體積,不僅增加了過擬合的風(fēng)險,同時降低了模型輸出結(jié)果的速度,并對運行設(shè)備的硬件提出了更高的要求。
技術(shù)實現(xiàn)思路
1、為解決目前蒸發(fā)波導(dǎo)模型在診斷波導(dǎo)高度中需要迭代計算而帶來的高額時間開銷,本發(fā)明提供了一種基于unet型深度神經(jīng)網(wǎng)絡(luò)的診斷方案,該神經(jīng)網(wǎng)絡(luò)以下簡稱edh-simunet。
2、edh-simunet是一種unet類型的網(wǎng)絡(luò),其包含下采樣部分、上采樣部分以及為了緩減梯度消失而存在的跳躍連接部分。edh-simunet使用深度方向可分離的卷積操作進(jìn)行下采樣,使用轉(zhuǎn)置卷積進(jìn)行上采樣。根據(jù)先驗知識,遠(yuǎn)距離處的天氣狀況對蒸發(fā)波導(dǎo)高度診斷的幫助不大,所以無需使用開銷巨大的注意力機制。
3、經(jīng)實驗測試,edh-simunet相較于傳統(tǒng)的物理模型在診斷速度上快一個數(shù)量級。此外,與傳統(tǒng)的機器學(xué)習(xí)方法相比,如xgboost和隨機森林,edh-simunet在診斷速度上同樣占有優(yōu)勢,而且在誤差方面表現(xiàn)更優(yōu)秀。
4、本發(fā)明的基于edh-simunet的大面積蒸發(fā)波導(dǎo)診斷方法包括以下步驟:
5、步驟一:從在分析數(shù)據(jù)集中篩選出區(qū)域內(nèi)近海面的氣溫、氣壓、濕度、風(fēng)速、海表溫度數(shù)據(jù),作為訓(xùn)練數(shù)據(jù)的特征;
6、步驟二:借助蒸發(fā)波導(dǎo)模型計算出氣溫、氣壓、濕度、風(fēng)速、海表溫度數(shù)據(jù)對應(yīng)的蒸發(fā)波導(dǎo)高度,即為訓(xùn)練數(shù)據(jù)制作標(biāo)簽;
7、步驟三:搭建edh-simunet神經(jīng)網(wǎng)絡(luò)并將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。其中訓(xùn)練集進(jìn)一步隨機劃分為訓(xùn)練集和驗證集。根據(jù)驗證集的表現(xiàn)進(jìn)行調(diào)參;
8、步驟四:借助測試集,計算rmse、mae、medae和rs等指標(biāo)對模型性能進(jìn)行評估和驗證。
9、本方法edh-simunet使用深度方向可分離卷積操作進(jìn)行下采樣,使用轉(zhuǎn)置卷積進(jìn)行上采樣,跳躍連接以緩減梯度消失和信息丟失的問題。
10、本方法有效解決了傳統(tǒng)物理蒸發(fā)波導(dǎo)模型在診斷波導(dǎo)高度時因迭代計算而產(chǎn)生的高額時間成本問題。除此以外,該方法能夠適應(yīng)不斷變化的數(shù)據(jù)和環(huán)境,自動調(diào)整參數(shù)以優(yōu)化性能,進(jìn)而輕松擴(kuò)展到新的數(shù)據(jù)集和任務(wù)上。因而edh-simunet有潛力避免物理模型在非均勻大氣條件和強穩(wěn)定大氣條件下,因普適函數(shù)、穩(wěn)定度修正函數(shù)和尺度參數(shù)的確定帶來差異較大的診斷結(jié)果。
1.一種基于edh-simunet的蒸發(fā)波導(dǎo)診斷方法,以采集到的區(qū)域內(nèi)氣溫、氣壓、濕度、風(fēng)速以及海表溫度數(shù)據(jù)為蒸發(fā)波導(dǎo)模型的輸入,預(yù)測得到區(qū)域內(nèi)海面上的蒸發(fā)波導(dǎo)高度;其特征在于所述蒸發(fā)波導(dǎo)模型的結(jié)構(gòu)是edh-simunet神經(jīng)網(wǎng)絡(luò);edh-simunet神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建步驟包括:
2.根據(jù)權(quán)利要求1所述的基于edh-simunet的蒸發(fā)波導(dǎo)診斷方法,其特征是所述步驟三中,在訓(xùn)練集用于蒸發(fā)波導(dǎo)模型訓(xùn)練之前,先對訓(xùn)練集進(jìn)行標(biāo)準(zhǔn)化處理,并保存均值和方差;
3.根據(jù)權(quán)利要求2所述的基于edh-simunet的蒸發(fā)波導(dǎo)診斷方法,其特征是對訓(xùn)練數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,即對每個網(wǎng)格點上的數(shù)據(jù)按照下式處理,
4.根據(jù)權(quán)利要求1所述的基于edh-simunet的蒸發(fā)波導(dǎo)診斷方法,其特征是步驟四中,通過計算均方根誤差rmse、平均絕對誤差mae、中值絕對誤差medae和/或相對強弱指標(biāo)rs對蒸發(fā)波導(dǎo)模型性能進(jìn)行評估和驗證。
5.根據(jù)權(quán)利要求1所述的基于edh-simunet的大面積蒸發(fā)波導(dǎo)診斷方法,其特征是所述輸入處理模塊中按數(shù)據(jù)處理順序依次為:輸入通道為6、輸出通道為64并填充1的3×3深度方向可分離卷積層;批次標(biāo)準(zhǔn)化層;relu層;輸入通道為64、輸出通道為64并填充1的3×3深度方向可分離卷積層;批次標(biāo)準(zhǔn)化層;relu層;