本發(fā)明涉及遙感數(shù)據(jù)處理,尤其涉及一種葉綠素a濃度遙感數(shù)據(jù)產(chǎn)品插補(bǔ)方法。
背景技術(shù):
1、葉綠素a濃度(chla)是衡量水體中浮游植物數(shù)量的一個(gè)重要指標(biāo)。因此,chla數(shù)據(jù)被廣泛用于海洋生態(tài)系統(tǒng)生產(chǎn)評(píng)估、浮游植物物候檢測(cè)和藻華監(jiān)測(cè)。近年來(lái),衛(wèi)星遙感已成為監(jiān)測(cè)全球chla的廣泛使用方法。衛(wèi)星傳感器可以以從每日到每月不等的時(shí)間分辨率覆蓋大面積。
2、然而,由于云層覆蓋、陽(yáng)光污染和其他不利條件,衛(wèi)星獲取的chla數(shù)據(jù)產(chǎn)品不可避免地會(huì)缺失,這大大阻礙了其在浮游植物相關(guān)領(lǐng)域的進(jìn)一步應(yīng)用。例如,modis-terra/aqua和viirs-snpp衛(wèi)星的全球數(shù)據(jù)產(chǎn)品中超過(guò)70%的數(shù)據(jù)是缺失的。因此,重建缺失信息,并獲得插補(bǔ)后的chla時(shí)間序列產(chǎn)品,可以更好地表征大范圍和長(zhǎng)期內(nèi)海洋浮游植物的實(shí)際變化狀態(tài)。
3、當(dāng)前,已經(jīng)提出了許多插補(bǔ)方法來(lái)重建chla遙感時(shí)間序列產(chǎn)品中的缺失信息。當(dāng)前方法根據(jù)一般可分為數(shù)據(jù)驅(qū)動(dòng)和非數(shù)據(jù)驅(qū)動(dòng)。其中,數(shù)據(jù)驅(qū)動(dòng)的方法主要包括傳統(tǒng)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法,這類方法通過(guò)建立缺失數(shù)據(jù)與有效或輔助數(shù)據(jù)之間的經(jīng)驗(yàn)關(guān)系來(lái)填補(bǔ)chla的缺失數(shù)據(jù)。典型的傳統(tǒng)機(jī)器學(xué)習(xí)方法包括自組織映射、支持向量回歸等。深度學(xué)習(xí)方法,如數(shù)據(jù)插值卷積自編碼器(dincae),卷積神經(jīng)網(wǎng)絡(luò),時(shí)空注意力生成對(duì)抗網(wǎng)絡(luò),也因其數(shù)據(jù)特征提取和非線性建模能力被引入chla插補(bǔ)任務(wù)中。整體上,數(shù)據(jù)驅(qū)動(dòng)的方法在填補(bǔ)chla缺失數(shù)據(jù)方面取得了良好效果,但其泛化能力始終受限于訓(xùn)練數(shù)據(jù)集的規(guī)模和時(shí)空多樣性。對(duì)于大范圍遙感時(shí)序數(shù)據(jù)嚴(yán)重缺失數(shù)據(jù)時(shí),數(shù)據(jù)驅(qū)動(dòng)類方法需要收集大規(guī)模數(shù)據(jù)集的難度很大,方法適用性受限。
4、相比之下,非數(shù)據(jù)驅(qū)動(dòng)的插補(bǔ)方法主要基于插值的思想,只需要利用原始chla數(shù)據(jù)本身的空間、時(shí)間或者時(shí)空特征來(lái)恢復(fù)缺失數(shù)據(jù)。這種方法具有很強(qiáng)的泛化和應(yīng)用能力,已廣泛用于海洋遙感領(lǐng)域。經(jīng)典的方法包括線性插值、最優(yōu)插值(oi)和kriging算法。這些方法簡(jiǎn)單高效,但只能利用單個(gè)像素的時(shí)間信息或空間信息。當(dāng)存在嚴(yán)重的時(shí)間或空間缺失時(shí),這種限制會(huì)使得插補(bǔ)的結(jié)果出現(xiàn)異常的時(shí)空模式。因此,利用空間域信息來(lái)輔助時(shí)間插值的方法被提出。例如數(shù)據(jù)插值經(jīng)驗(yàn)正交函數(shù)(dineof)方法利用時(shí)空數(shù)據(jù)特征實(shí)現(xiàn)了更為準(zhǔn)確的缺失數(shù)據(jù)重建。該方法已有效應(yīng)用于各類海洋遙感數(shù)據(jù)的插補(bǔ)任務(wù)。此外也有一些學(xué)者利用具有相似時(shí)間變化的空間鄰近像素填補(bǔ)目標(biāo)像素時(shí)間序列缺失。但是目前利用時(shí)空信息進(jìn)行插補(bǔ)的方法在數(shù)據(jù)缺失嚴(yán)重且高變異區(qū)域的不確定性依然較大。這主要是因?yàn)榉菙?shù)據(jù)驅(qū)動(dòng)的方法在填補(bǔ)chla時(shí)間序列間隙時(shí)仍然未充分利用時(shí)間和空間信息。
5、現(xiàn)有方法在時(shí)間域上傾向于通過(guò)時(shí)間線性插值預(yù)填補(bǔ)缺失數(shù)據(jù),這只能利用時(shí)間上鄰近觀測(cè)的信心而忽略了浮游植物生長(zhǎng)的獨(dú)特周期特征,即chla在不同年份相同周期應(yīng)該相似。在空間域,盡管有少數(shù)時(shí)空插值方法通過(guò)使用空間鄰近像素重建缺失像素,但它們通常在不同步驟中分別應(yīng)用空間和時(shí)間信息,無(wú)法協(xié)同使用。實(shí)際上,累計(jì)多年的長(zhǎng)期chla時(shí)間序列可以為填補(bǔ)確實(shí)是據(jù)提供豐富的參考信息,包括空間、時(shí)間和周期特征。然而,目前的方法仍未能有效地協(xié)同這些信息以重建長(zhǎng)期chla時(shí)間序列產(chǎn)品。這限制了現(xiàn)有方法在嚴(yán)重?cái)?shù)據(jù)間隙區(qū)域的適用性,特別是全球日常chla產(chǎn)品的平均缺失率超過(guò)70%,局部高達(dá)80%。因此,開(kāi)發(fā)一種能夠同時(shí)提取時(shí)間、空間和周期性變化特征的時(shí)空插補(bǔ)方法可以為chla遙感時(shí)序產(chǎn)品提供的嚴(yán)重缺失數(shù)據(jù)插補(bǔ)提供有效的解決方案。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的在于提供一種基于自適應(yīng)時(shí)空張量補(bǔ)全的葉綠素a濃度遙感數(shù)據(jù)產(chǎn)品插補(bǔ)方法,利用葉綠素a濃度遙感數(shù)據(jù)產(chǎn)品自身的時(shí)間、空間和周期性特征實(shí)現(xiàn)大范圍缺失數(shù)據(jù)的插補(bǔ),提高該數(shù)據(jù)產(chǎn)品在海洋生態(tài)環(huán)境監(jiān)測(cè)中的應(yīng)用能力。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案:
3、一種葉綠素a濃度遙感數(shù)據(jù)產(chǎn)品插補(bǔ)方法,包括以下步驟:
4、步驟a、對(duì)原始待插補(bǔ)的葉綠素a濃度遙感時(shí)間序列形成的三維張量按照空間、時(shí)間和周期特性重排列成新的三維時(shí)空張量形式
5、步驟b、基于張量截?cái)嗪朔稊?shù)模型構(gòu)建自適應(yīng)時(shí)空張量補(bǔ)全模型,輸入重新排列后葉綠素a濃度時(shí)空張量采用自適應(yīng)分配不同維度下張量權(quán)重的方式求解張量補(bǔ)全模型,獲得時(shí)空張量的解;
6、步驟c、將時(shí)空張量的解按照步驟a中的重排列形式,進(jìn)行逆變換后轉(zhuǎn)為原始數(shù)據(jù)對(duì)應(yīng)的格式,得到插補(bǔ)后的葉綠素a濃度遙感時(shí)間序列。
7、優(yōu)選地,所述步驟a中的具體步驟如下:
8、a1、將原始葉綠素a濃度遙感時(shí)間序列影像按照時(shí)間的順序排列成一個(gè)三維張量,記為:
9、其中m和n表示影像的尺寸,t表示整個(gè)時(shí)間序列中的日期長(zhǎng)度;
10、a2、由于葉綠素a濃度具有周期性變化的特性,將原始張量重新擺列成新的三維張量,記為:
11、其中ny表示整個(gè)時(shí)間序列的年份長(zhǎng)度,nd為每年的觀測(cè)數(shù)量。
12、優(yōu)選地,所述構(gòu)建自適應(yīng)時(shí)空張量補(bǔ)全模型的具體實(shí)現(xiàn)過(guò)程如下:
13、b11、基于秩最小化張量補(bǔ)全問(wèn)題函數(shù)表達(dá):
14、
15、式中,rank是葉綠素a濃度遙感時(shí)間序列數(shù)據(jù)張量的代數(shù)秩,ω表示觀測(cè)像素的索引集,pω表示在ω上的正交投影;
16、b12、利用加權(quán)凸核范數(shù)來(lái)近似張量秩,上述公式轉(zhuǎn)換為:
17、
18、式中,表示張量的第k個(gè)展開(kāi)矩陣,αk是的非負(fù)權(quán)重,并且滿足||·||*表示核范數(shù)正則化項(xiàng);
19、b13、進(jìn)而基于低秩矩陣補(bǔ)全并采用張量跡范數(shù)代替矩陣核范數(shù),上一步驟的低秩張量補(bǔ)全問(wèn)題轉(zhuǎn)換為:
20、
21、式中,y表示存在缺失的張量,a為一個(gè)對(duì)角矩陣,對(duì)角元素為0和1;
22、當(dāng)y中像素缺失時(shí),值為0,反之為1;
23、是數(shù)據(jù)的保真項(xiàng),為正則項(xiàng),表示真實(shí)數(shù)據(jù)的先驗(yàn)分布,λ是正則化參數(shù),用于平衡上述兩項(xiàng)的貢獻(xiàn)。
24、優(yōu)選地,所述采用自適應(yīng)分配不同維度下張量權(quán)重的方式求解張量補(bǔ)全模型的具體過(guò)程如下:
25、b21、對(duì)重排列的三維張量通過(guò)奇異值分解方法獲得第k維展開(kāi)矩陣的奇異值并按降序排列構(gòu)建一維奇異值序列;
26、b22、連接序列中第一個(gè)點(diǎn)與最大值形成直線,減去序列中每個(gè)點(diǎn)與該直線后進(jìn)行最大最小值歸一化,得到新的奇異值差異序列
27、b23、計(jì)算每個(gè)維度的低秩指標(biāo)其中ik-max為奇異值差異序列的局部最大值,qk為k維度下奇異值序列長(zhǎng)度;
28、b24、計(jì)算張量不同維度k的權(quán)重指標(biāo)其中
29、優(yōu)選地,所述獲得時(shí)空張量的解的具體過(guò)程為:
30、b31、得到的不同展開(kāi)維度k的權(quán)重后,引入新的張量值變量mk替換步驟b13中的xk,得到新的模型求解公式:
31、
32、進(jìn)一步的定義一個(gè)拉格朗日函數(shù):
33、
34、式中,bk為拉格朗日變量,β為懲罰參數(shù);
35、b33、基于上述步驟定義模型求解的優(yōu)化子問(wèn)題:
36、
37、b34、求解子問(wèn)題中mk和x的公式為:
38、
39、b35、設(shè)置迭代次數(shù)i,更新拉格朗日變量bk,此外每次迭代中權(quán)重參數(shù)αk都由求解張量補(bǔ)全模型這一步驟進(jìn)行更新,bk更新公式如下:
40、
41、優(yōu)選地,將步驟b中獲得的解按照步驟a重排列過(guò)程進(jìn)行逆變換為得到插補(bǔ)后的葉綠素a濃度遙感時(shí)間序列。
42、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
43、本發(fā)明,將張量補(bǔ)全思想引入葉綠素a濃度遙感時(shí)間序列缺失數(shù)據(jù)插補(bǔ)中,通過(guò)整合多維時(shí)空域信息,包括空間范圍、年際變異和周期性特征,構(gòu)建了更適用于多維特征提取的低秩三維時(shí)空張量,然后基于張量截?cái)嗪朔稊?shù)模型構(gòu)建自適應(yīng)時(shí)空張量補(bǔ)全模型,實(shí)現(xiàn)了葉綠素a濃度遙感時(shí)間序列缺失數(shù)據(jù)的插補(bǔ)。相較于以往的方法,該方法無(wú)需數(shù)據(jù)進(jìn)行訓(xùn)練即可應(yīng)用于不同空間范圍的遙感數(shù)據(jù)插補(bǔ)任務(wù),應(yīng)用成本低,并且方法的精度高、適用性強(qiáng),不僅可應(yīng)對(duì)嚴(yán)重缺失下葉綠素a濃度遙感時(shí)間序列的插補(bǔ),而且還可以推廣至其他海洋遙感數(shù)據(jù)產(chǎn)品的插補(bǔ)任務(wù)中。