專(zhuān)利名稱(chēng):數(shù)據(jù)預(yù)測(cè)方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,更具體地,特別是涉及一種數(shù)據(jù)測(cè)試方法及系統(tǒng)。
背景技術(shù):
隨著近年來(lái)空間數(shù)據(jù)分析的需求與日俱增,空間統(tǒng)計(jì)在很多不同的領(lǐng)域的應(yīng)用越 來(lái)越廣泛。流行病學(xué)研究中,空間統(tǒng)計(jì)根據(jù)目標(biāo)地區(qū)的流行病發(fā)生數(shù)據(jù),指定疾病空間分布 圖,找出疾病特異性規(guī)律,發(fā)現(xiàn)高發(fā)區(qū)和分布細(xì)致特征,為疾病病因的研究提供線索,也為 控制和預(yù)防流行病的策略提供重要依據(jù)。地質(zhì)探索方面,空間統(tǒng)計(jì)主要用于研究空間結(jié)構(gòu) 和進(jìn)行空間估值。探礦過(guò)程中,考慮到礦藏在開(kāi)采之前在時(shí)間上結(jié)構(gòu)是不變的,因此通常是 在空間上布點(diǎn)進(jìn)行鉆探,對(duì)采樣得到的樣品進(jìn)行分析,使用空間統(tǒng)計(jì)估計(jì)礦藏的分布和儲(chǔ) 量。對(duì)環(huán)境污染進(jìn)行研究時(shí),運(yùn)用空間統(tǒng)計(jì)對(duì)污染的傳播方式進(jìn)行研究,有助于人們對(duì)環(huán)境 污染進(jìn)行控制??臻g統(tǒng)計(jì)對(duì)房地產(chǎn)的價(jià)值進(jìn)行評(píng)估時(shí),在考慮外界影響因素的基礎(chǔ)上,充分 考慮地區(qū)之間的相互關(guān)系,將對(duì)正確評(píng)估房地產(chǎn)的價(jià)值有很大幫助。而在交通領(lǐng)域中,可以 利用空間統(tǒng)計(jì)對(duì)人員、貨物在空間上的流動(dòng)方式進(jìn)行研究,同時(shí)對(duì)通道上的不同區(qū)段進(jìn)行 研究。其他在生物學(xué)、農(nóng)業(yè)、水文、古氣候、古地理、氣象學(xué)、遙感地質(zhì)、林業(yè)等許多方面空間 統(tǒng)計(jì)都有成功應(yīng)用的實(shí)例。目前數(shù)據(jù)預(yù)測(cè)是空間統(tǒng)計(jì)的主要方法之一,所謂數(shù)據(jù)預(yù)測(cè)是通過(guò)對(duì)于已知地理位 置的空間屬性值的規(guī)律和性質(zhì)進(jìn)行分析,建立空間模型來(lái)預(yù)測(cè)未知地理位置的空間屬性 值。例如采礦過(guò)程中,基于已有的礦藏地點(diǎn)分布和儲(chǔ)量的情況,結(jié)合地形的分布,得到其他 未知地點(diǎn)的礦藏儲(chǔ)量情況,從而為將來(lái)的鉆探和開(kāi)采提供決策參考。在流行病傳染趨勢(shì)的 研究中,可以根據(jù)已有的不同地區(qū)的流行病發(fā)病人數(shù),探索疾病的傳染規(guī)律,對(duì)疾病的發(fā)展 趨勢(shì)和地區(qū)間的影響進(jìn)行分析判斷,獲取未發(fā)病地區(qū)的發(fā)病趨勢(shì),從而可以有效地加以預(yù) 防和控制。數(shù)據(jù)預(yù)測(cè)最常用的方法是趨勢(shì)面分析和克里金插值法。趨勢(shì)面分析實(shí)質(zhì)上是通過(guò) 回歸分析原理,運(yùn)用最小二乘法擬合一個(gè)二維非線性函數(shù),模擬地理要素在空間上的分部 規(guī)律,展示地理要素在地域空間上的變化趨勢(shì)。其只考慮目標(biāo)點(diǎn)的空間地理位置,并未考 慮目標(biāo)點(diǎn)處各個(gè)鄰近點(diǎn)與目標(biāo)點(diǎn)鄰近的距離以及鄰近點(diǎn)觀測(cè)值空間分布,導(dǎo)致預(yù)測(cè)準(zhǔn)確度 低。為了解決趨勢(shì)面分析方法的上述問(wèn)題,研究人員提出了克里金插值法??死锝鸩?值法不僅考慮目標(biāo)點(diǎn)的空間地理位置,還充分考慮與目標(biāo)點(diǎn)相鄰的各個(gè)已知觀測(cè)點(diǎn)與目標(biāo) 點(diǎn)的距離,而且綜合已知觀測(cè)點(diǎn)觀測(cè)值的空間分布情況,對(duì)目標(biāo)點(diǎn)的觀測(cè)值進(jìn)行預(yù)測(cè),與趨 勢(shì)面分析相比,提高了預(yù)測(cè)準(zhǔn)確度。克里金插值法包括以下步驟步驟A 計(jì)算每個(gè)觀測(cè)點(diǎn)的趨勢(shì)值和該觀測(cè)點(diǎn)的殘差值;步驟B:分別計(jì)算每個(gè)觀測(cè)點(diǎn)與其他各個(gè)觀測(cè)點(diǎn)的距離,選取觀測(cè)點(diǎn)之間的最大 距離和最小距離,根據(jù)最大距離和最小距離將所述觀測(cè)點(diǎn)劃分為至少兩類(lèi);步驟C 分別計(jì)算每類(lèi)觀測(cè)點(diǎn)的平均殘差平方和,記為C(i),i = 1,2,...,m,其中c(i)的計(jì)算公式為 )=¥ ?!?^7)^7,‘)為觀測(cè)點(diǎn)的殘差值。步驟D 分別計(jì)算每個(gè)觀測(cè)點(diǎn)和預(yù)設(shè)的目標(biāo)點(diǎn)的距離,根據(jù)距離選取與之相對(duì)應(yīng) 的平均殘差平方和,并計(jì)算所述目標(biāo)點(diǎn)的殘差估計(jì)值;步驟E 基于所述殘差估計(jì)值,預(yù)測(cè)所述目標(biāo)點(diǎn)的觀測(cè)值??死锝鸩逯捣ㄏ啾融厔?shì)面分析來(lái)說(shuō),在目標(biāo)點(diǎn)的觀測(cè)值預(yù)測(cè)時(shí),綜合了已知觀測(cè) 點(diǎn)觀測(cè)值的空間分布情況以及各個(gè)觀測(cè)點(diǎn)與目標(biāo)點(diǎn)的距離,提高了預(yù)測(cè)準(zhǔn)確度。但是克里 金插值法的不足之處在于將其與不同觀測(cè)點(diǎn)空間上的相關(guān)性簡(jiǎn)化為距離上的相關(guān)性,但在 實(shí)際中,目標(biāo)點(diǎn)與不同觀測(cè)點(diǎn)空間上的相關(guān)性不僅與距離有關(guān),還存在方向相關(guān)性,比如 森林中某種樹(shù)木的生長(zhǎng)情況由于受地形和光照等因素影響,往往沿某一特定方向集中生 長(zhǎng)。農(nóng)業(yè)病蟲(chóng)害領(lǐng)域中,很多遷飛性害蟲(chóng)的遷飛軌跡受大氣環(huán)流和風(fēng)向影響,具有特定的方 向軌跡。因此,目標(biāo)點(diǎn)與不同觀測(cè)點(diǎn)方向上的相關(guān)性導(dǎo)致克里金插值法在數(shù)據(jù)預(yù)測(cè)時(shí),預(yù)測(cè) 準(zhǔn)確度降低。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提供一種數(shù)據(jù)預(yù)測(cè)方法及系統(tǒng),以實(shí)現(xiàn)數(shù)據(jù)預(yù)測(cè)時(shí) 同時(shí)運(yùn)用目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)的距離相關(guān)性以及方向相關(guān)性,提高目標(biāo)點(diǎn)觀測(cè)值預(yù)測(cè)的準(zhǔn)確度。為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種數(shù)據(jù)預(yù)測(cè)方法的技術(shù)方案如下一種數(shù)據(jù)預(yù)測(cè)方法,包括獲取各個(gè)觀測(cè)點(diǎn)的趨勢(shì)值和殘差值;確定數(shù)據(jù)預(yù)測(cè)的主方向;逐個(gè)計(jì)算每個(gè)觀測(cè)點(diǎn)與其他觀測(cè)點(diǎn)之間的距離,以及每個(gè)觀測(cè)點(diǎn)與其他觀測(cè)點(diǎn)之 間的連接線與主方向之間的夾角;選取最大距離值hmax、最小距離值hmin、最大夾角值θ max和最小夾角值θ min,根據(jù)距 離區(qū)間[hmin,hmax]和夾角區(qū)間[θ min,θ maJ將所述各個(gè)觀測(cè)點(diǎn)劃分為至少四類(lèi);依據(jù)所述殘差值,分別計(jì)算每類(lèi)觀測(cè)點(diǎn)的平均殘差平方和;分別計(jì)算目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)的距離,以及目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)之間的連接線與 主方向之間的夾角,選取與該距離和夾角相對(duì)應(yīng)的平均殘差平方和,預(yù)測(cè)目標(biāo)點(diǎn)的觀測(cè)值。本發(fā)明還提供一種數(shù)據(jù)預(yù)測(cè)系統(tǒng),包括數(shù)值獲取單元,用于獲取各個(gè)觀測(cè)點(diǎn)的趨勢(shì)值和殘差值;與數(shù)值獲取單元相連的主方向確定單元,用于確定數(shù)據(jù)預(yù)測(cè)的主方向;與主方向確定單元相連的距離夾角計(jì)算單元,所述距離夾角計(jì)算單元包括觀測(cè)點(diǎn) 距離夾角計(jì)算子單元,所述觀測(cè)點(diǎn)距離夾角計(jì)算子單元,用于逐個(gè)計(jì)算每個(gè)觀測(cè)點(diǎn)與其他 觀測(cè)點(diǎn)之間的距離,以及每個(gè)觀測(cè)點(diǎn)與其他觀測(cè)點(diǎn)之間的連接線與主方向之間的夾角;與距離夾角計(jì)算單元相連的觀測(cè)點(diǎn)分類(lèi)單元,用于選取最大距離值hmax、最小距離 值hmin、最大夾角值θ_和最小夾角值emin,根據(jù)距離區(qū)間[hmin,hmax]和夾角區(qū)間[emin, QfflaJ將所述各個(gè)觀測(cè)點(diǎn)劃分為至少四類(lèi);與觀測(cè)點(diǎn)分類(lèi)單元和數(shù)值獲取單元相連的平均殘差平方和計(jì)算單元,用于依據(jù)所 述殘差值,分別計(jì)算每類(lèi)觀測(cè)點(diǎn)的平均殘差平方和;
與平均殘差平方和計(jì)算單元相連的觀測(cè)值預(yù)測(cè)單元,用于分別計(jì)算目標(biāo)點(diǎn)與各個(gè) 觀測(cè)點(diǎn)的距離,以及目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)之間的連接線與主方向之間的夾角,選取與該距 離和夾角相對(duì)應(yīng)的平均殘差平方和,預(yù)測(cè)目標(biāo)點(diǎn)的觀測(cè)值。應(yīng)用上述技術(shù)方案,數(shù)據(jù)預(yù)測(cè)過(guò)程中,首先計(jì)算數(shù)據(jù)預(yù)測(cè)的主方向,按照觀測(cè)點(diǎn)之 間的距離,以及觀測(cè)點(diǎn)之間連接線與主方向的夾角對(duì)觀測(cè)點(diǎn)進(jìn)行分類(lèi),獲取每類(lèi)觀測(cè)點(diǎn)的 平均殘差平方和。將目標(biāo)點(diǎn)再按照與各個(gè)觀測(cè)點(diǎn)的距離和連接線與主方向之間的夾角,選 取平均殘差平方和,預(yù)測(cè)目標(biāo)點(diǎn)的觀測(cè)值。由于對(duì)觀測(cè)點(diǎn)的分類(lèi)以及對(duì)目標(biāo)點(diǎn)觀測(cè)值的預(yù) 測(cè)綜合考慮了距離相關(guān)性和方向相關(guān)性,相對(duì)于只考慮距離相關(guān)性的克里金插值法而言, 提高了平均殘差平方和的準(zhǔn)確度,進(jìn)而提高了目標(biāo)點(diǎn)觀測(cè)值預(yù)測(cè)的準(zhǔn)確度。
為了更清楚地說(shuō)明本發(fā)明實(shí)施例,下面將對(duì)實(shí)施例中所需要使用的附圖做簡(jiǎn)單的 介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人 員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例提供的數(shù)據(jù)預(yù)測(cè)方法的流程圖;圖2為圖1所示流程圖中步驟S102中主方向的示意圖;圖3為圖1所示流程圖中步驟S104的流程圖;圖4為圖1所示流程圖中步驟S106的流程圖;圖5為本發(fā)明實(shí)施例中所選用的具體實(shí)例中稻飛虱的蟲(chóng)量數(shù)目分布圖;圖6為本發(fā)明實(shí)施例提供的數(shù)據(jù)預(yù)測(cè)系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部實(shí)施例。基于本 發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下,所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)范圍。申請(qǐng)人:經(jīng)研究發(fā)現(xiàn),克里金插值法在進(jìn)行數(shù)據(jù)預(yù)測(cè)過(guò)程中,對(duì)觀測(cè)點(diǎn)分類(lèi)時(shí)只考 慮觀測(cè)點(diǎn)之間的距離,因此所得到的每類(lèi)觀測(cè)點(diǎn)的平均殘差平方和只與距離相關(guān)性有關(guān), 而未考慮實(shí)際情況中各個(gè)觀測(cè)點(diǎn)之間的方向相關(guān)性,導(dǎo)致平均殘差平方和的準(zhǔn)確的降低, 進(jìn)而導(dǎo)致目標(biāo)點(diǎn)觀測(cè)值預(yù)測(cè)的準(zhǔn)確度降低。為了解決上述問(wèn)題,本發(fā)明實(shí)施例提供一種數(shù)據(jù)預(yù)測(cè)方法,其對(duì)觀測(cè)點(diǎn)分類(lèi)時(shí),綜 合考慮了距離相關(guān)性和方向相關(guān)性,提高了每類(lèi)觀測(cè)點(diǎn)的平均殘差平方和的準(zhǔn)確度,進(jìn)而 提高了目標(biāo)點(diǎn)觀測(cè)值預(yù)測(cè)的準(zhǔn)確度。數(shù)據(jù)預(yù)測(cè)方法的流程圖如圖1所示,包括SlOl 獲取各個(gè)觀測(cè)點(diǎn)的趨勢(shì)值和殘差值;其中各個(gè)觀測(cè)點(diǎn)的趨勢(shì)值是根據(jù)趨 勢(shì)面分析方法計(jì)算得到的。趨勢(shì)面分析方法中常用的趨勢(shì)面模型函數(shù)包括一次趨勢(shì)面模 型函數(shù)、二次趨勢(shì)面模型函數(shù)和三次趨勢(shì)面模型函數(shù)。每個(gè)函數(shù)的具體表示如下一次趨勢(shì)面模型函數(shù)z = a0+alX+a2y ;二次趨勢(shì)面模型函數(shù)Ζ = Β0+ΒιΧ+Β2Υ+Β3Χ2+Β4ΧΥ+Β5Υ2 ;三次趨勢(shì)面模型函數(shù)
ζ = a0+a1x+a2y+a3x2+a4xy+a5y2+a6x3+a7x2y+a8xy2+a9y3 ;其中z為所預(yù)測(cè)的每個(gè)觀測(cè)點(diǎn)的趨勢(shì)值,χ和y分別表示每個(gè)觀測(cè)點(diǎn)的χ方向和 y方向的坐標(biāo)值。獲取各個(gè)觀測(cè)點(diǎn)的趨勢(shì)值時(shí),只需要將各個(gè)觀測(cè)點(diǎn)的坐標(biāo)值代入函數(shù)即可 計(jì)算出其趨勢(shì)值。殘差值是每個(gè)觀測(cè)點(diǎn)的實(shí)際觀測(cè)值和趨勢(shì)值的差值,由于各個(gè)觀測(cè)點(diǎn)的 實(shí)際觀測(cè)值是已知的,所以將實(shí)際觀測(cè)值減去其趨勢(shì)值即可得到其殘差值。S102 確定數(shù)據(jù)預(yù)測(cè)的主方向;由于數(shù)據(jù)預(yù)測(cè)需要綜合考慮距離相關(guān)性和方向相關(guān)性,因此,首先要確定所有觀 測(cè)點(diǎn)的發(fā)展趨勢(shì),也就是數(shù)據(jù)預(yù)測(cè)的主方向。以農(nóng)業(yè)病蟲(chóng)害為例,很多遷飛性害蟲(chóng)的遷飛軌 跡受大氣環(huán)流和風(fēng)向影響,具有特定的方向軌跡,因此農(nóng)業(yè)病蟲(chóng)害的數(shù)據(jù)預(yù)測(cè)的主方向即 病蟲(chóng)害會(huì)朝哪個(gè)方向擴(kuò)散。由于觀測(cè)點(diǎn)的實(shí)際觀測(cè)值已知,根據(jù)觀測(cè)點(diǎn)的坐標(biāo)值,觀測(cè)值聚 集的位置即數(shù)據(jù)預(yù)測(cè)的主方向,具體包括S1021 根據(jù)各個(gè)觀測(cè)點(diǎn)的坐標(biāo)值,建立線性回歸模型;S1022 確定所述線性回歸模型作為數(shù)據(jù)預(yù)測(cè)的主方向。圖2為數(shù)據(jù)預(yù)測(cè)的主方向的示意圖,假設(shè)圖2中正方形點(diǎn)為目標(biāo)點(diǎn),圓點(diǎn)為觀測(cè) 點(diǎn),從圖2中可以看出圓點(diǎn)主要聚集左下角和右上角兩個(gè)位置,因此在建立線性回歸模型 時(shí),選取聚集處的觀測(cè)點(diǎn)。聚集處觀測(cè)點(diǎn)的坐標(biāo)值已知,根據(jù)坐標(biāo)值建立線性回歸模型,即 一次線性直線。該直線K即為數(shù)據(jù)預(yù)測(cè)的主方向。S103 逐個(gè)計(jì)算每個(gè)觀測(cè)點(diǎn)與其他觀測(cè)點(diǎn)之間的距離,以及每個(gè)觀測(cè)點(diǎn)與其他觀 測(cè)點(diǎn)之間的連接線與主方向之間的夾角;假設(shè)觀測(cè)點(diǎn)的數(shù)目為n,首先將兩個(gè)觀測(cè)點(diǎn)組成一個(gè)觀測(cè)點(diǎn)對(duì),則η個(gè)觀測(cè)點(diǎn)組成 η (η-1) /2個(gè)觀測(cè)點(diǎn)對(duì),計(jì)算每一對(duì)觀測(cè)點(diǎn)之間的距離以及觀測(cè)點(diǎn)之間的連線和主方向的夾 角。由于有η (η-1) /2個(gè)觀測(cè)點(diǎn)對(duì),所以分別最多具有η (η-1) /2個(gè)距離值和夾角值。S104 選取最大距離值hmax、最小距離值hmin、最大夾角值θ max和最小夾角值θ min, 根據(jù)距離區(qū)間[hmin,hmax]和夾角區(qū)間[θ min,θ maJ將所述各個(gè)觀測(cè)點(diǎn)劃分為至少四類(lèi);步驟S104的流程圖如圖3所示,包括S1041 選取最大距離值hmax、最小距離值hmin、最大夾角值θ _和最小夾角值
θ . ·
mm,S1042 選取距離區(qū)間[hmin,hmax]中的距離值hi,將距離區(qū)間劃分為兩個(gè)子距離區(qū) 間[hmin,hj 和[Ii1,hmax];S1043 確定所述觀測(cè)點(diǎn)的距離值相對(duì)應(yīng)的子距離區(qū)間,并將觀測(cè)點(diǎn)的距離值位于 同一個(gè)子距離區(qū)間的觀測(cè)點(diǎn)劃分為同一類(lèi);其中對(duì)各個(gè)觀測(cè)點(diǎn)的劃分首先需要從距離區(qū)間中選取至少一個(gè)距離值h,將距離區(qū)間 劃分為多個(gè)子距離區(qū)間,確定觀測(cè)點(diǎn)對(duì)的距離值相對(duì)應(yīng)的子距離區(qū)間,并將距離值位于同 一個(gè)子距離區(qū)間的所有觀測(cè)點(diǎn)對(duì)劃分為同一類(lèi)。所劃分的觀測(cè)點(diǎn)類(lèi)與所選取的距離值h有 關(guān),假設(shè)觀測(cè)點(diǎn)類(lèi)的個(gè)數(shù)為P,選取的距離值h的個(gè)數(shù)為q,則ρ = q+1。S1044 選取夾角區(qū)間[θ min,θ _]中的夾角值θ i,將夾角區(qū)間劃分為兩個(gè)子夾角 區(qū)間[9min,0J 和[θι,BfflaJ ;S1045:確定所述同類(lèi)觀測(cè)點(diǎn)的夾角值相對(duì)應(yīng)的子夾角區(qū)間,并將同類(lèi)觀測(cè)點(diǎn)的夾 角值位于同一個(gè)子夾角區(qū)間的觀測(cè)點(diǎn)劃分為同一類(lèi);即
將根據(jù)距離值劃分為同一類(lèi)觀測(cè)點(diǎn)中的觀測(cè)點(diǎn),再確定該類(lèi)觀測(cè)點(diǎn)中觀測(cè)點(diǎn)對(duì)的 夾角值,將夾角值位于同一個(gè)子夾角區(qū)間的觀測(cè)點(diǎn)對(duì)再劃分為同一類(lèi)。所劃分的觀測(cè)點(diǎn)類(lèi) 與所選取的夾角值θ有關(guān),假設(shè)觀測(cè)點(diǎn)類(lèi)的個(gè)數(shù)為j,選取的夾角值θ的個(gè)數(shù)為i,則j =i+1。經(jīng)過(guò)步驟S104劃分后,觀測(cè)點(diǎn)對(duì)被分為p*j類(lèi),即觀測(cè)點(diǎn)類(lèi)的個(gè)數(shù)為p*j。當(dāng)然, 步驟S104還可以先按照夾角區(qū)間進(jìn)行劃分,再根據(jù)距離區(qū)間對(duì)已劃分的類(lèi)進(jìn)行劃分,獲取 的觀測(cè)點(diǎn)類(lèi)的個(gè)數(shù)同樣為P*j。按照子區(qū)間劃分觀測(cè)點(diǎn)對(duì)時(shí),分別選取的距離值h和夾角值θ可以是按照距離區(qū) 間[hmin,hmax]和夾角區(qū)間[emin,θ_]等分選取的,也可以是不等分選取的。本實(shí)施例是按 照等分選取的。S105 依據(jù)所述殘差值,分別計(jì)算每類(lèi)觀測(cè)點(diǎn)的平均殘差平方和;其計(jì)算公式為
權(quán)利要求
1.一種數(shù)據(jù)預(yù)測(cè)方法,其特征在于,包括 獲取各個(gè)觀測(cè)點(diǎn)的趨勢(shì)值和殘差值;確定數(shù)據(jù)預(yù)測(cè)的主方向;逐個(gè)計(jì)算每個(gè)觀測(cè)點(diǎn)與其他觀測(cè)點(diǎn)之間的距離,以及每個(gè)觀測(cè)點(diǎn)與其他觀測(cè)點(diǎn)之間的 連接線與主方向之間的夾角;選取最大距離值hmax、最小距離值hmin、最大夾角值θ_和最小夾角值emin,根據(jù)距離區(qū) 間[hmin,hmax]和夾角區(qū)間[Θ min,Θ max]將所述各個(gè)觀測(cè)點(diǎn)劃分為至少四類(lèi); 依據(jù)所述殘差值,分別計(jì)算每類(lèi)觀測(cè)點(diǎn)的平均殘差平方和;分別計(jì)算目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)的距離,以及目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)之間的連接線與主方 向之間的夾角,選取與該距離和夾角相對(duì)應(yīng)的平均殘差平方和,預(yù)測(cè)目標(biāo)點(diǎn)的觀測(cè)值。
2.根據(jù)權(quán)利要求1所述的數(shù)據(jù)預(yù)測(cè)方法,其特征在于,所述確定數(shù)據(jù)預(yù)測(cè)的主方向包括根據(jù)各個(gè)觀測(cè)點(diǎn)的坐標(biāo)值,建立線性回歸模型; 確定所述線性回歸模型作為數(shù)據(jù)預(yù)測(cè)的主方向。
3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)預(yù)測(cè)方法,其特征在于,所述選取最大距離值hmax、最 小距離值hmin、最大夾角值θ_和最小夾角值emin,根據(jù)距離區(qū)間[hmin,hmax]和夾角區(qū)間 [θ min,Θ _]將所述各個(gè)觀測(cè)點(diǎn)劃分為至少四類(lèi)包括選取最大距離值hmax、最小距離值hmin、最大夾角值emax和最小夾角值emin; 選取距離區(qū)間[hmin,hmax]中的距離值h1;將距離區(qū)間劃分為兩個(gè)子距離區(qū)間[hmin,hj 和[h1 hmax];確定所述觀測(cè)點(diǎn)的距離值相對(duì)應(yīng)的子距離區(qū)間,并將所述距離值位于同一個(gè)子距離區(qū) 間的觀測(cè)點(diǎn)劃分為同一類(lèi);選取夾角區(qū)間[θ min,θ maJ中的夾角值θ 將夾角區(qū)間劃分為兩個(gè)子夾角區(qū)間[θ min, 和[卜,Θ-];確定所述同類(lèi)觀測(cè)點(diǎn)的夾角值相對(duì)應(yīng)的子夾角區(qū)間,并將所述夾角值位于同一個(gè)子夾 角區(qū)間的觀測(cè)點(diǎn)劃分為同一類(lèi)。
4.根據(jù)權(quán)利要求3所述的數(shù)據(jù)預(yù)測(cè)方法,其特征在于,所述選取距離區(qū)間[hmin,hmax]中 的距離值Ii1具體為選取距離區(qū)間[hmin,hmax]中的至少一個(gè)距離值hp
5.根據(jù)權(quán)利要求4所述的數(shù)據(jù)預(yù)測(cè)方法,其特征在于,所述選取夾角區(qū)間[emin,BfflaJ 中的夾角值Q1具體為選取夾角區(qū)間,θ_]中的至少一個(gè)夾角值θ1()
6.根據(jù)權(quán)利要求5所述的數(shù)據(jù)預(yù)測(cè)方法,其特征在于,所述分別計(jì)算目標(biāo)點(diǎn)與各個(gè)觀 測(cè)點(diǎn)的距離,以及目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)之間的連接線與主方向之間的夾角,選取與該距離 和夾角相對(duì)應(yīng)的平均殘差平方和,預(yù)測(cè)目標(biāo)點(diǎn)的觀測(cè)值包括分別計(jì)算目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)的距離,以及目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)之間的連接線與主方 向之間的夾角;確定該距離和夾角相對(duì)應(yīng)的子距離區(qū)間和子夾角區(qū)間,并將該目標(biāo)點(diǎn)歸為子距離區(qū)間 和子夾角區(qū)間分別包含該目標(biāo)點(diǎn)的距離和夾角的觀測(cè)點(diǎn)類(lèi); 選取觀測(cè)點(diǎn)類(lèi)的平均殘差平方和,并計(jì)算目標(biāo)點(diǎn)的殘差值;運(yùn)用趨勢(shì)面模型計(jì)算所述目標(biāo)點(diǎn)的趨勢(shì)值,根據(jù)趨勢(shì)值和殘差值,預(yù)測(cè)所述目標(biāo)點(diǎn)的觀測(cè)值。
7.根據(jù)權(quán)利要求1至6任意一項(xiàng)所述的數(shù)據(jù)預(yù)測(cè)方法,其特征在于,所述獲取各個(gè)觀測(cè) 點(diǎn)的趨勢(shì)值和殘差值包括運(yùn)用趨勢(shì)面分析方法,計(jì)算各個(gè)觀測(cè)點(diǎn)的趨勢(shì)值; 根據(jù)趨勢(shì)值和觀測(cè)點(diǎn)的已知觀測(cè)值,計(jì)算該觀測(cè)點(diǎn)的殘差值。
8.一種數(shù)據(jù)預(yù)測(cè)系統(tǒng),其特征在于,包括數(shù)值獲取單元,用于獲取各個(gè)觀測(cè)點(diǎn)的趨勢(shì)值和殘差值; 與數(shù)值獲取單元相連的主方向確定單元,用于確定數(shù)據(jù)預(yù)測(cè)的主方向; 與主方向確定單元相連的距離夾角計(jì)算單元,所述距離夾角計(jì)算單元包括觀測(cè)點(diǎn)距離 夾角計(jì)算子單元,所述觀測(cè)點(diǎn)距離夾角計(jì)算子單元,用于逐個(gè)計(jì)算每個(gè)觀測(cè)點(diǎn)與其他觀測(cè) 點(diǎn)之間的距離,以及每個(gè)觀測(cè)點(diǎn)與其他觀測(cè)點(diǎn)之間的連接線與主方向之間的夾角;與距離夾角計(jì)算單元相連的觀測(cè)點(diǎn)分類(lèi)單元,用于選取最大距離值hmax、最小距離值 hmin、最大夾角值θ·和最小夾角值emin,根據(jù)距離區(qū)間[hmin,hmax]和夾角區(qū)間[emin,θ·] 將所述各個(gè)觀測(cè)點(diǎn)劃分為至少四類(lèi);與觀測(cè)點(diǎn)分類(lèi)單元和數(shù)值獲取單元相連的平均殘差平方和計(jì)算單元,用于依據(jù)所述殘 差值,分別計(jì)算每類(lèi)觀測(cè)點(diǎn)的平均殘差平方和;與平均殘差平方和計(jì)算單元相連的觀測(cè)值預(yù)測(cè)單元,用于分別計(jì)算目標(biāo)點(diǎn)與各個(gè)觀測(cè) 點(diǎn)的距離,以及目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)之間的連接線與主方向之間的夾角,選取與該距離和 夾角相對(duì)應(yīng)的平均殘差平方和,預(yù)測(cè)目標(biāo)點(diǎn)的觀測(cè)值。
9.根據(jù)權(quán)利要求8所述的數(shù)據(jù)預(yù)測(cè)系統(tǒng),其特征在于,所述觀測(cè)點(diǎn)分類(lèi)單元包括距離夾角選取子單元,用于選取最大距離值hmax、最小距離值hmin、最大夾角值θ _和最 小夾角值θ min ;與距離夾角選取子單元相連的距離區(qū)間劃分子單元,用于選取距離區(qū)間[hmin,hmax]中 的距離值h1;將距離區(qū)間劃分為兩個(gè)子距離區(qū)間[hmin,hj和D^hmaJ ;與距離夾角選取子單元相連的夾角區(qū)間劃分子單元,用于選取夾角區(qū)間[9min,θ_] 中的夾角值θ 將夾角區(qū)間劃分為兩個(gè)子夾角區(qū)間[θ min,θ J和[θ ρ θ max];與距離區(qū)間劃分子單元和夾角區(qū)間劃分子單元相連的類(lèi)劃分子單元,用于確定所述觀 測(cè)點(diǎn)的距離值相對(duì)應(yīng)的子距離區(qū)間,并將所述距離值位于同一個(gè)子距離區(qū)間的觀測(cè)點(diǎn)劃分 為同一類(lèi),同時(shí)確定所述同類(lèi)觀測(cè)點(diǎn)的夾角值相對(duì)應(yīng)的子夾角區(qū)間,并將所述夾角值位于 同一個(gè)子夾角區(qū)間的觀測(cè)點(diǎn)劃分為同一類(lèi)。
10.根據(jù)權(quán)利要求9所述的數(shù)據(jù)預(yù)測(cè)系統(tǒng),其特征在于,所述距離夾角計(jì)算單元包括目 標(biāo)點(diǎn)距離夾角計(jì)算子單元,所述目標(biāo)點(diǎn)距離夾角計(jì)算子單元,用于分別計(jì)算目標(biāo)點(diǎn)與各個(gè) 觀測(cè)點(diǎn)的距離,以及目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)之間的連接線與主方向之間的夾角;所述觀測(cè)值預(yù)測(cè)單元包括與所述目標(biāo)點(diǎn)距離夾角計(jì)算子單元相連的目標(biāo)點(diǎn)劃分子單 元,用于確定所述目標(biāo)點(diǎn)距離夾角計(jì)算子單元計(jì)算的距離和夾角相對(duì)應(yīng)的子距離區(qū)間和子 夾角區(qū)間,并將該目標(biāo)點(diǎn)歸為子距離區(qū)間和子夾角區(qū)間分別包含該目標(biāo)點(diǎn)的距離和夾角的 觀測(cè)點(diǎn)類(lèi);與平均殘差平方和計(jì)算單元相連的目標(biāo)點(diǎn)殘差值計(jì)算子單元,用于選取觀測(cè)點(diǎn)類(lèi)的平 均殘差平方和,并計(jì)算目標(biāo)點(diǎn)的殘差值;與目標(biāo)點(diǎn)殘差值計(jì)算子單元相連的預(yù)測(cè)子單元,用于運(yùn)用趨勢(shì)面模型計(jì)算所述目標(biāo)點(diǎn) 的趨勢(shì)值,根據(jù)趨勢(shì)值和殘差值,預(yù)測(cè)所述目標(biāo)點(diǎn)的觀測(cè)值。
全文摘要
本發(fā)明公開(kāi)了一種數(shù)據(jù)預(yù)測(cè)方法,包括獲取各個(gè)觀測(cè)點(diǎn)的趨勢(shì)值和殘差值;確定數(shù)據(jù)預(yù)測(cè)的主方向;逐個(gè)計(jì)算每個(gè)觀測(cè)點(diǎn)與其他觀測(cè)點(diǎn)之間的距離,以及每個(gè)觀測(cè)點(diǎn)與其他觀測(cè)點(diǎn)之間的連接線與主方向之間的夾角;將觀測(cè)點(diǎn)分類(lèi);依據(jù)所述殘差值,分別計(jì)算每類(lèi)觀測(cè)點(diǎn)的平均殘差平方和;分別計(jì)算目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)的距離,以及目標(biāo)點(diǎn)與各個(gè)觀測(cè)點(diǎn)之間的連接線與主方向之間的夾角,選取與該距離和夾角相對(duì)應(yīng)的平均殘差平方和,預(yù)測(cè)目標(biāo)點(diǎn)的觀測(cè)值。應(yīng)用上述技術(shù)方案,數(shù)據(jù)預(yù)測(cè)過(guò)程中,綜合考慮了距離相關(guān)性和方向相關(guān)性,相對(duì)于只考慮距離相關(guān)性的克里金插值法而言,提高了平均殘差平方和的準(zhǔn)確度,進(jìn)而提高了目標(biāo)點(diǎn)觀測(cè)值預(yù)測(cè)的準(zhǔn)確度。
文檔編號(hào)G06F19/00GK102063557SQ20101027848
公開(kāi)日2011年5月18日 申請(qǐng)日期2010年9月7日 優(yōu)先權(quán)日2010年9月7日
發(fā)明者瞿輝 申請(qǐng)人:合肥兆尹信息科技有限責(zé)任公司