專利名稱:基于單場(chǎng)降雨類型的降雨站點(diǎn)相似性評(píng)價(jià)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種降雨站點(diǎn)相似性評(píng)價(jià)方法,尤其涉及一種基于單場(chǎng)降雨類型的降雨站點(diǎn)相似性評(píng)價(jià)方法,,屬于水文水資源與數(shù)據(jù)挖掘技術(shù)交叉領(lǐng)域。
背景技術(shù):
時(shí)間序列是一種在科學(xué)研究、商業(yè)應(yīng)用中普遍存在的數(shù)據(jù)形式,如災(zāi)變預(yù)測(cè),降雨預(yù)測(cè),金融數(shù)據(jù)和電力負(fù)載數(shù)據(jù)預(yù)測(cè)等。在水文領(lǐng)域中,對(duì)時(shí)間序列的研究由來已久,通過研究水文時(shí)間序列的時(shí)空規(guī)律,對(duì)洪水暴雨等自然災(zāi)害進(jìn)行預(yù)測(cè),為流域水利建設(shè)及社會(huì)建設(shè)提供決策依據(jù)。降雨是水資源的主要來源之一,水資源是社會(huì)經(jīng)濟(jì)發(fā)展的重要支撐和保障條件,水利、農(nóng)業(yè)以及生態(tài)系統(tǒng)都受其影響。因此,研究 降雨時(shí)間序列對(duì)社會(huì)經(jīng)濟(jì)可持續(xù)發(fā)展和農(nóng)業(yè)水利事業(yè)布局具有重要的意義。目前我國大部分地區(qū)雨量站分布稀疏,許多雨量站設(shè)站時(shí)間較晚,部分站點(diǎn)降雨資料只有短短幾年。為了更準(zhǔn)確地認(rèn)識(shí)水文現(xiàn)象和解決水資源問題,需要對(duì)缺失資料的站點(diǎn)數(shù)據(jù)進(jìn)行補(bǔ)充,也需要設(shè)立新的觀測(cè)站點(diǎn),去除舊的冗余站點(diǎn)。因此有必要對(duì)降雨站點(diǎn)進(jìn)行相似性研究,為水資源管理提供新的技術(shù)支撐。以往對(duì)降雨時(shí)間序列的研究主要包括降雨預(yù)測(cè)、極值分布、周期分析和降水場(chǎng)的時(shí)空分布等。例如,陳曉宏等將模式識(shí)別的聚類分析理論方法引入降雨空間特征分類研究,進(jìn)行降雨特征空間分布模式識(shí)別,預(yù)測(cè)無雨量站點(diǎn)的降雨模式。以年降雨量的變換數(shù)據(jù)為基礎(chǔ),結(jié)合高程、氣溫和蒸發(fā)量作為特征參數(shù),分析不同聚類數(shù)下的分類有效性,將雨量站點(diǎn)類型分為六類,再經(jīng)過模型驗(yàn)證,預(yù)測(cè)無記錄的站點(diǎn)歸類,為降雨資料的插補(bǔ)延長提供了一種新的途徑;張國建等利用最大年降水量與最小年降水量比值來分析降水量的年際變化特征;蘇布達(dá)等利用weibull分布分析了長江流域降水極值時(shí)間序列的分布特征;王兆禮等采用Morlet小波函數(shù)對(duì)東江流域在不同時(shí)間尺度下的降雨周期和突變點(diǎn)進(jìn)行了研究;劉德地等將云模型引入到降雨量時(shí)空分布特性的研究中;歐春平等研究了基于信息熵的流域水文要素時(shí)空變異;巴金福等根據(jù)黃河上游逐月降水資料分析了汛期降雨量的變化趨勢(shì)和空間分布特征及其變化。降雨序列實(shí)質(zhì)是一個(gè)不連續(xù)的時(shí)間序列,大多數(shù)此前的研究,都是基于日月或年降雨量單純累積的宏觀統(tǒng)計(jì)分析,沒有從更細(xì)粒度分析單場(chǎng)降雨的統(tǒng)計(jì)特征。而單場(chǎng)降雨序列恰恰包含了更豐富的降雨信息,能反映降雨序列的本質(zhì)。例如單獨(dú)對(duì)兩個(gè)站點(diǎn)一年的降雨進(jìn)行統(tǒng)計(jì),同樣降雨量總和為IOOOmm的降雨,可能是8場(chǎng)單場(chǎng)降雨為125mm,也可能是20場(chǎng)單場(chǎng)降雨為50mm,甚至還可能是若干場(chǎng)不同降雨量,不同持續(xù)天數(shù)的降雨。若單純利用年降雨量的累計(jì)而不考慮單場(chǎng)降雨,則無法區(qū)分一年內(nèi)兩個(gè)站點(diǎn)降雨類型的差異,更無法區(qū)分降雨持續(xù)的時(shí)間等信息;若考慮單場(chǎng)降雨的情況,則可以區(qū)分出站點(diǎn)更多的降雨信息,除了單場(chǎng)降雨和,單場(chǎng)降雨日均值,大于或小于某個(gè)臨界值的降雨量,降雨天數(shù)等更多降雨信息。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題在于克服現(xiàn)有技術(shù)的不足,提供一種基于單場(chǎng)降雨類型的降雨站點(diǎn)相似性評(píng)價(jià)方法,針對(duì)降雨時(shí)間序列不連續(xù)的特點(diǎn),對(duì)單場(chǎng)降雨的各種特征進(jìn)行統(tǒng)計(jì)分析,通過研究基于單場(chǎng)降雨的降雨序列相似性,繼而研究區(qū)域降雨的相似性。本發(fā)明的基于單場(chǎng)降雨類型的降雨站點(diǎn)相似性評(píng)價(jià)方法,包括以下步驟步驟A、從降雨站點(diǎn)一段時(shí)期雨量歷史數(shù)據(jù)中提取各單場(chǎng)降雨的以下統(tǒng)計(jì)特征量單場(chǎng)降雨雨量和、單場(chǎng)降雨天數(shù)、單場(chǎng)降雨日平均降雨量、單場(chǎng)降雨日降雨量最大值、單場(chǎng)降雨日降雨量最小值、單場(chǎng)降雨日降雨量小于I. 27mm的雨量之和、單場(chǎng)降雨日降雨量小于I. 27mm的降雨天數(shù)、單場(chǎng)降雨日降雨量大于50mm的雨量之和、單場(chǎng)降雨日降雨量大于50mm的降雨天數(shù);各單場(chǎng)降雨的以上統(tǒng)計(jì)特征量構(gòu)成該單場(chǎng)降雨的特征向量;
步驟B、對(duì)所有單場(chǎng)降雨的特征向量進(jìn)行均值為0,方差為I的標(biāo)準(zhǔn)化;步驟C、對(duì)標(biāo)準(zhǔn)化后的單場(chǎng)降雨的特征向量進(jìn)行聚類,從而將各單場(chǎng)降雨歸入相應(yīng)的類別中;步驟D、對(duì)聚類得到的各類別的單場(chǎng)降雨場(chǎng)次數(shù)目進(jìn)行歸一化處理,統(tǒng)計(jì)每個(gè)站點(diǎn)的降雨類型直方圖;步驟E、根據(jù)下式計(jì)算任意兩個(gè)降雨站點(diǎn)M和N的降雨類型直方圖的相似度Sim(M, N),相似度越大表示兩個(gè)降雨站點(diǎn)的相似性越高
權(quán)利要求
1.基于單場(chǎng)降雨類型的降雨站點(diǎn)相似性評(píng)價(jià)方法,其特征在于,包括以下步驟 步驟A、從降雨站點(diǎn)一段時(shí)期雨量歷史數(shù)據(jù)中提取各單場(chǎng)降雨的以下統(tǒng)計(jì)特征量單場(chǎng)降雨雨量和、單場(chǎng)降雨天數(shù)、單場(chǎng)降雨日平均降雨量、單場(chǎng)降雨日降雨量最大值、單場(chǎng)降雨日降雨量最小值、單場(chǎng)降雨日降雨量小于I. 27mm的雨量之和、單場(chǎng)降雨日降雨量小于I.27mm的降雨天數(shù)、單場(chǎng)降雨日降雨量大于50mm的雨量之和、單場(chǎng)降雨日降雨量大于50mm的降雨天數(shù);各單場(chǎng)降雨的以上統(tǒng)計(jì)特征量構(gòu)成該單場(chǎng)降雨的特征向量; 步驟B、對(duì)所有單場(chǎng)降雨的特征向量進(jìn)行均值為0,方差為I的標(biāo)準(zhǔn)化; 步驟C、對(duì)標(biāo)準(zhǔn)化后的單場(chǎng)降雨的特征向量進(jìn)行聚類,從而將各單場(chǎng)降雨歸入相應(yīng)的類別中; 步驟D、對(duì)聚類得到的各類別的單場(chǎng)降雨場(chǎng)次數(shù)目進(jìn)行歸一化處理,統(tǒng)計(jì)每個(gè)站點(diǎn)的降雨類型直方圖; 步驟E、根據(jù)下式計(jì)算任意兩個(gè)降雨站點(diǎn)M和N的降雨類型直方圖的相似度Sim (M3N),相似度越大表示兩個(gè)降雨站點(diǎn)的相似性越高
2.如權(quán)利要求I所述基于單場(chǎng)降雨類型的降雨站點(diǎn)相似性評(píng)價(jià)方法,其特征在于,對(duì)標(biāo)準(zhǔn)化后的單場(chǎng)降雨的特征向量進(jìn)行聚類時(shí),采用基于DBI指數(shù)的K-means自動(dòng)聚類算法,具體如下 步驟Cl、設(shè)置聚類類別數(shù)K的初始值為MinK,MinK為預(yù)設(shè)的2到10之間的自然數(shù);步驟C2、判斷K是否小于等于預(yù)設(shè)的閾值MaxK,MaxK為大于MinK的自然數(shù);如果是,則隨機(jī)從樣本數(shù)據(jù)中取K個(gè)聚類中心,轉(zhuǎn)向步驟C2,否則轉(zhuǎn)向步驟C7 ; 步驟C3、分別計(jì)算各個(gè)樣本點(diǎn)到各聚類中心的距離,并且將該樣本點(diǎn)歸到與其距離最近的類中; 步驟C4、將所有樣本點(diǎn)歸類結(jié)束之后,重新計(jì)算這K個(gè)類別的聚類中心; 步驟C5、比較新計(jì)算的K個(gè)聚類中心與步驟C2中選取的聚類中心是否相同,若不同,則轉(zhuǎn)向步驟C3 ;否則,轉(zhuǎn)向步驟C6 ; 步驟C6、計(jì)算此時(shí)的DBI指數(shù),并使K=K+1,轉(zhuǎn)向步驟C2 ; 步驟C7、比較所有的DBI指數(shù)值,將DBI指數(shù)值最小的K所對(duì)應(yīng)的聚類結(jié)果作為最終的聚類結(jié)果輸出。
3.如權(quán)利要求2所述基于單場(chǎng)降雨類型的降雨站點(diǎn)相似性評(píng)價(jià)方法,其特征在于,所述閾值MaxK的取值范圍為15到30。
全文摘要
本發(fā)明公開了一種基于單場(chǎng)降雨類型的降雨站點(diǎn)相似性評(píng)價(jià)方法,屬于水文水資源與數(shù)據(jù)挖掘技術(shù)交叉領(lǐng)域。首先提取降雨時(shí)間序列中的雨量項(xiàng),經(jīng)過數(shù)據(jù)預(yù)處理,選擇和提取單場(chǎng)降雨特征,并將這些特征進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理;采用基于DBI指數(shù)的K-means自動(dòng)聚類方法進(jìn)行聚類,最后根據(jù)聚類結(jié)果計(jì)算降雨類型直方圖進(jìn)行相似性分析。本發(fā)明方法具有計(jì)算方法簡(jiǎn)單,但能包含降雨時(shí)間序列更多更細(xì)粒度信息,真正反映降雨站點(diǎn)相似性的優(yōu)點(diǎn)。
文檔編號(hào)G06F19/00GK102819677SQ20121026838
公開日2012年12月12日 申請(qǐng)日期2012年7月30日 優(yōu)先權(quán)日2012年7月30日
發(fā)明者朱躍龍, 李士進(jìn), 章龍飛, 萬定生, 高祥濤, 柏屏 申請(qǐng)人:河海大學(xué)