專利名稱:基于不確定性空間數(shù)據(jù)挖掘的區(qū)域成礦預(yù)測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種新的區(qū)域成礦預(yù)測(cè)方法,屬于資源信息技術(shù)領(lǐng)域。
背景技術(shù):
區(qū)域成礦預(yù)測(cè)方法經(jīng)歷了從早期的礦床統(tǒng)計(jì)預(yù)測(cè)、中期的"地質(zhì)異常"預(yù)測(cè)到最近 的"三聯(lián)式"定量成礦預(yù)測(cè)和多重分形非線性成礦預(yù)測(cè)理論與方法。這些區(qū)域成礦預(yù)測(cè)理 論、技術(shù)和方法日趨成熟,在區(qū)域成礦預(yù)測(cè)中發(fā)揮了重要作用。但是,隨著區(qū)域和全球性地 質(zhì)空間數(shù)據(jù)的日益采集與獲取,面對(duì)海量多源的地質(zhì)空間數(shù)據(jù),傳統(tǒng)的區(qū)域成礦預(yù)測(cè)方法 很難快速有效地處理海量的地質(zhì)空間數(shù)據(jù)。上世紀(jì)九十年代興起的空間數(shù)據(jù)挖掘技術(shù)為海 量空間數(shù)據(jù)信息提取提供了很好的理論方法。申請(qǐng)人根據(jù)空間數(shù)據(jù)普遍存在的不確定性和 空間自相關(guān)性,提出了不確定性空間數(shù)據(jù)挖掘算法模型。同時(shí),如何快速利用好已有的海量 多源地質(zhì)空間數(shù)據(jù),高效進(jìn)行區(qū)域成礦定量預(yù)測(cè),顯得極具科學(xué)意義和經(jīng)濟(jì)價(jià)值。
發(fā)明內(nèi)容
本發(fā)明目的在于針對(duì)現(xiàn)有區(qū)域成礦預(yù)測(cè)方法的不足,提出一種從海量多源地質(zhì)空 間數(shù)據(jù)快速提取區(qū)域成礦信息,達(dá)到高效地進(jìn)行區(qū)域成礦預(yù)測(cè)的方法。顧及地質(zhì)空間數(shù)據(jù) 的不確定性和成礦信息提取的不確定性的基礎(chǔ)上,提出基于不確定性空間數(shù)據(jù)挖掘算法模 型的區(qū)域成礦預(yù)測(cè)方法,并建立相應(yīng)的評(píng)價(jià)指標(biāo)來客觀評(píng)價(jià)區(qū)域成礦預(yù)測(cè)結(jié)果。以下是本 發(fā)明的具體內(nèi)容 1、多源多尺度地質(zhì)空間數(shù)據(jù)預(yù)處理 按照四種不同尺度(區(qū)域成礦可行地段、區(qū)域成礦有利地段、區(qū)域成礦潛在地段、
區(qū)域成礦遠(yuǎn)景地段)成礦預(yù)測(cè)要求,按四種不同比例尺(i : 50萬、1 : 20萬、1 : 5萬和 i : i萬)進(jìn)行多源地質(zhì)空間數(shù)據(jù)的地質(zhì)要素?cái)?shù)字化和坐標(biāo)投影轉(zhuǎn)換(i : 50萬、1 : 20
萬和l : 5萬采用6度帶的高斯-克呂格北京1954平面坐標(biāo)系,1 : l萬采用3度帶的高 斯_克呂格北京1954平面坐標(biāo)系)。遙感數(shù)據(jù)的投影坐標(biāo)轉(zhuǎn)換利用同區(qū)域的地形圖建立對(duì) 應(yīng)控制點(diǎn),采用多項(xiàng)式擬合方法進(jìn)行坐標(biāo)配準(zhǔn)。
2、遙感礦化信息提取 根據(jù)區(qū)域內(nèi)地物對(duì)象的復(fù)雜性,對(duì)不同地物進(jìn)行不同的掩膜方法基礎(chǔ)上,采用特 征主成分分析和閥值異常分割方法提取鐵礦化信息和泥化信息,具體如下(以LandSAT ETM多光譜數(shù)據(jù)為例) (1)掩膜方法選擇(以西北高寒山區(qū)為例),對(duì)于云和雪,采用TM1高值區(qū)(DN值 140 165)作為閥值;對(duì)于水體,采用TM7/TM1 (0. 3 0. 4)作為閥值;對(duì)于植被,采用TM4/ TM3(1. 05 1. 2)作為閥值;對(duì)于沙漠和水體,直接通過目視圈定感興趣區(qū)進(jìn)行掩膜。
(2)特征主成分分析方法具體如下選擇TM1 、 TM3、 TM4和TM5作主成份分析獲取 鐵礦化信息,在獲得的4個(gè)PC圖像中,選擇TM3和TM1特征向量載荷因子絕對(duì)值較大且符 號(hào)相反的PC圖象作為鐵礦化異常信息提取的圖象;選擇TM1、 TM4、 TM5和TM7作主成份分析獲取泥化信息,在獲得的4個(gè)PC圖像中,TM5和TM7特征向量載荷因子絕對(duì)值較大且兩 者符號(hào)相反PC圖象作為泥化異常信息提取的圖象。 (3)閥值異常分割方法具體如下首先對(duì)提取的礦化信息進(jìn)行3X3或5X5的均 值濾波,以2.5 3.0倍標(biāo)準(zhǔn)離差o作為閥值,限定異常水平,對(duì)異常進(jìn)行閥值分割。
3、基于不確定性空間數(shù)據(jù)挖掘算法模型的成礦預(yù)測(cè) (1)根據(jù)不同地質(zhì)空間數(shù)據(jù)的不確定性類型,采用Monte Carlo模擬法進(jìn)行空間 數(shù)據(jù)不確定性模型 ①確定每個(gè)待輸入空間數(shù)據(jù)集Di( )的不確定性類型(位置數(shù)據(jù)的圓形正態(tài)模 型,屬性數(shù)據(jù)的一維正態(tài)模型); ②取用依空間數(shù)據(jù)集Di ( )分布的隨機(jī)采樣來代替原輸入空間數(shù)據(jù); ③對(duì)每一次實(shí)現(xiàn),存儲(chǔ)其結(jié)果Y( ); 隨機(jī)抽取10000組以上實(shí)驗(yàn)數(shù)據(jù)作為樣本數(shù)據(jù)。 (2)以EM (Expectation Maximization)算法為基礎(chǔ),考慮地質(zhì)空間數(shù)據(jù)的空間自 相關(guān)性,建立空間自相關(guān)矩陣的基礎(chǔ)上,采用鄰域EM算法對(duì)地質(zhì)空間屬性數(shù)據(jù)進(jìn)行模糊離 散化,具體如下 ①空間自相關(guān)矩陣建立借用Voronoi和Delaunay圖,結(jié)合距離標(biāo)準(zhǔn)來構(gòu)建空間 權(quán)重矩陣??紤]到空間數(shù)據(jù)的不確定性,采用三種方法計(jì)算空間數(shù)據(jù)間空間自相關(guān)矩陣中 心法、最小法和最大法。假設(shè)區(qū)域s中有n個(gè)位置不確定的點(diǎn),第i個(gè)點(diǎn)Pi的誤差帶用一 個(gè)圓形Qi表示。具體算法如下 輸入?yún)^(qū)域s中的一組點(diǎn)的誤差帶Q = &, Q2, ...Qn}和鄰域距離d 輸出區(qū)域S中一組點(diǎn)的鄰域圖和空間自相關(guān)距陣 步驟1 :構(gòu)造點(diǎn)集P的Voronoi多邊形 步驟2 :對(duì)所有相鄰的Voronoi多邊形進(jìn)行如下運(yùn)算步驟2. 1 :計(jì)算cUter(Ci, C》、《 & , Q》、計(jì)算& , Q》 步驟2. 2 :如果d <《,則在鄰域圖中連接Pi和Pj, 為1 ;否則Wij為0其中,d 為鄰域距離;cU^(Ci, Cj)表示相鄰誤差帶(Qi, Qj)質(zhì)心之間的距離;cU(Qi, Qj)表示相鄰 誤差帶(Qi,Qj)內(nèi)空間數(shù)據(jù)之間的最大距離;cLn(Qi,Qj)表示相鄰誤差帶(Qi,Qj)內(nèi)空間數(shù) 據(jù)之間的最小距離。 ②基于鄰域EM算法的地質(zhì)空間屬性數(shù)據(jù)進(jìn)行模糊離散化,其算法如下 根據(jù)地質(zhì)空間數(shù)據(jù)的地理坐標(biāo)和不確定性模型,按照①算法可建立離散空間數(shù)據(jù)
的的空間鄰近關(guān)系矩陣V:<formula>formula see original document page 4</formula>
為了考慮空間數(shù)據(jù)的空間自相關(guān)性,改進(jìn)函數(shù)
<formula>formula see original document page 4</formula> 引入新的項(xiàng)<formula>formula see original document page 4</formula>
然后,建立新的標(biāo)準(zhǔn)函數(shù)為U(c, e) =D(c, e) + p *G(C)(|3 >0)
其中,e是控制空間數(shù)據(jù)集的空間同質(zhì)性的參數(shù)。
則,E-步驟
其最優(yōu)化必要條件為如下形式
5q = log( " I ) +1 — log c汰+ A, +化;f w
最后得到如下方程
M步l
沐
argmaxZ)(cw+1,0)
6> 6>
(3)成礦關(guān)聯(lián)信息挖掘及不確定性評(píng)價(jià) ①顧及不確定性的成礦關(guān)聯(lián)規(guī)則挖掘地質(zhì)空間數(shù)據(jù)不確定性MonteCarlo模擬 —空間自相關(guān)矩陣構(gòu)建一連續(xù)型數(shù)據(jù)UNEM方法離散化一Apriori空間關(guān)聯(lián)規(guī)則提取 [OO43]②成礦關(guān)聯(lián)規(guī)則的不確定性評(píng)價(jià),采用支持度(su卯ort)、可信度(confidence) 和興趣度(interesting)三個(gè)評(píng)價(jià)指標(biāo)進(jìn)行成礦預(yù)測(cè)信息的不確定性評(píng)價(jià)
圖1 :青海東昆侖地區(qū)成礦關(guān)聯(lián)規(guī)則挖掘結(jié)果的不確定性評(píng)價(jià)指標(biāo)(支持度)圖
圖2 :青海東昆侖地區(qū)成礦關(guān)聯(lián)規(guī)則挖掘結(jié)果的不確定性評(píng)價(jià)指標(biāo)(可信度)圖
圖3 :青海東昆侖地區(qū)成礦關(guān)聯(lián)規(guī)則挖掘結(jié)果的不確定性評(píng)價(jià)指標(biāo)(興趣度)圖
具體實(shí)施例方式
為了更好地理解本發(fā)明的技術(shù)方案,以下以中國(guó)西部重要金屬成礦帶-青海東昆 侖為例,提供具體實(shí)施例。 首先,數(shù)字化多源地質(zhì)空間數(shù)據(jù),包括地質(zhì)礦產(chǎn)數(shù)據(jù)、地球化學(xué)數(shù)據(jù)和礦床數(shù)據(jù); 然后提取遙感礦化信息(該說明以LandSAT ETM數(shù)據(jù)為例);最后采用該發(fā)明中的不確定 性空間數(shù)據(jù)挖掘算法提取成礦關(guān)聯(lián)規(guī)則信息指導(dǎo)成礦預(yù)測(cè),以下結(jié)果為青海東昆侖成礦帶 鐵礦床的成礦關(guān)聯(lián)規(guī)則挖掘結(jié)果(如下表1)。 表1青海東昆侖成礦帶鐵礦床的成礦關(guān)聯(lián)規(guī)則挖掘結(jié)果及不確定性評(píng)價(jià)
5編號(hào)關(guān)聯(lián)規(guī)則
支持度 可信度
興趣度
1 北西向斷裂A矽卡巖化A遙感礦化異常 代-熱液型鐵礦床
2 北西向斷裂A碳酸鹽化A遙感礦化異常 代-熱液型鐵礦床
3 近東西向斷裂A矽卡巖化A遙感礦化異常 交代-熱液型鐵礦床
4 近東西向斷裂A綠泥石化A遙感礦化異常 交代-熱液型鐵礦床
5 近東西向斷裂A碳酸鹽化A遙感礦化異常 交代-熱液型鐵礦床
6 近東西向斷裂A硅化A遙感礦化異常一5 熱液型鐵礦床
7 北西向斷裂A矽卡巖化-c
8 北西向斷裂A碳酸鹽化一:=
9 北西向斷裂A遙感礦化異常 床
10 近東西向斷裂A矽卡巖化-U 近東西向斷裂A碳酸鹽化-
12 近東西向斷裂A硅化一>
13 矽卡巖化A遙感礦化異常-
14 綠泥石化A遙感礦化異常-
15 碳酸鹽化A遙感礦化異常-
16 硅化A遙感礦化異常-->
17 北西向斷裂一> 接觸交代-熱液型鐵礦床
18 砂卡巖化一> 接觸交代-熱液型鐵礦床
19 綠泥石化一> 接觸交代-熱液型鐵礦床 19 碳酸鹽化--> 接觸交代-熱液型鐵礦床
-> 接觸交0.17310l細(xì)OO0.992736
> 接觸交0.08000l細(xì)OO0.996772
—> 接觸0.096181.000000.995964
-->接觸0.096181.000000.995964
> 接觸0,08000l細(xì)OO0.996772
接觸交代-0.057691.000000,997579
接觸交代-熱液型鐵礦床 接觸交代-熱液型鐵礦床 -->接觸交代-熱液型鐵礦
■->接觸交代-熱液型鐵礦床 ->接觸交代-熱液型鐵礦床 接觸交代-熱液型鐵礦床 ->接觸交代-熱液型鐵礦床 ->接觸交代-熱液型鐵礦床 ->接觸交代-熱液型鐵礦床 接觸交代-熱液型鐵礦床
0.38466 0.11541
0.21156
0.13464 0.09618 0.09618 0.34620 0.13464 0.15387
0.48084 0.59623 0.23079 0.21156
0.95238 0.75000
l細(xì)OO 1.00000 l細(xì)OO 1.00000 0.77778 1.00000 1.00000 0.80645 0.96875
0.84615
0.936239 0.745157
0.78571 0.776836
0.99435 0.995964 0.995964 0.985472 0.772128 0.993543 0.996772 0.786274
0.94373 0.790315 0.837276
21 硅化一> 接觸交代-熱液型鐵礦床
0.13464
0.77778 0.772128
權(quán)利要求
基于不確定性空間數(shù)據(jù)挖掘的區(qū)域成礦預(yù)測(cè)方法,其特征在于充分利用多源海量地質(zhì)空間數(shù)據(jù)(基礎(chǔ)地質(zhì)礦產(chǎn)數(shù)據(jù)、遙感找礦數(shù)據(jù)、地球化學(xué)數(shù)據(jù)、礦山地質(zhì)數(shù)據(jù)、礦床數(shù)據(jù)),同時(shí)顧及地質(zhì)空間數(shù)據(jù)的不確定性和成礦信息提取的不確定性,采用申請(qǐng)人建立的不確定性空間數(shù)據(jù)挖掘算法模型,快速高效地進(jìn)行區(qū)域成礦預(yù)測(cè),包括三個(gè)主要步驟多源多尺度地質(zhì)空間數(shù)據(jù)的標(biāo)準(zhǔn)化處理;遙感礦化信息提??;基于不確定性空間數(shù)據(jù)挖掘算法模型的成礦預(yù)測(cè)。
2. 權(quán)利要求1所述的多源多尺度地質(zhì)空間數(shù)據(jù)的標(biāo)準(zhǔn)化,其特征在于按照不同尺度成 礦預(yù)測(cè)要求,按不同比例尺進(jìn)行多源地質(zhì)空間數(shù)據(jù)的預(yù)處理和幾何配準(zhǔn),包括l : 50萬、i : 20萬、1 : 5萬和i : i萬四種不同的數(shù)據(jù)比例尺要求,進(jìn)行地質(zhì)要素?cái)?shù)字化、投影坐 標(biāo)轉(zhuǎn)換。
3. 權(quán)利要求1所述的遙感礦化信息提取,其特征在于根據(jù)區(qū)域內(nèi)地物對(duì)象的復(fù)雜性,對(duì)不同地物(云、雪、水體、植被、沙漠等)進(jìn)行不同的掩膜方法基礎(chǔ)上,采用特征主成分分析和閥值異常分割方法提取鐵礦化信息和泥化信息,具體如下(以LandSat ETM多光譜數(shù) 據(jù)為例)(a) 掩膜方法選擇(以西北高寒山區(qū)為例),對(duì)于云和雪,采用TM1高值區(qū)(DN值 140 165)作為閥值;對(duì)于水體,采用TM7/TM1 (0. 3 0. 4)作為閥值;對(duì)于植被,采用TM4/ TM3(1. 05 1. 2)作為閥值;對(duì)于沙漠和水體,直接通過目視圈定感興趣區(qū)進(jìn)行掩膜;(b) 特征主成分分析方法具體如下選擇TM1、 TM3、 TM4和TM5作主成份分析獲取鐵礦 化信息;選擇TM1、 TM4、 TM5和TM7作主成份分析獲取泥化信息;(c) 閥值異常分割方法具體如下首先對(duì)提取的礦化信息進(jìn)行均值濾波,以2. 5 3. 0 倍標(biāo)準(zhǔn)離差o作為閥值,限定異常水平,對(duì)異常進(jìn)行閥值分割。
4. 權(quán)利要求1所述的基于不確定性空間數(shù)據(jù)挖掘算法模型的成礦預(yù)測(cè),具體如下(a) 根據(jù)不同地質(zhì)空間數(shù)據(jù)的不確定性類型,采用Monte Carlo模擬法進(jìn)行空間數(shù)據(jù) 不確定性模型;(b) 顧及地質(zhì)空間數(shù)據(jù)的空間自相關(guān)性,建立空間自相關(guān)矩陣的基礎(chǔ)上,采用鄰域EM 算法對(duì)地質(zhì)空間屬性數(shù)據(jù)進(jìn)行模糊離散化;(c) 對(duì)多源海量地質(zhì)空間數(shù)據(jù)進(jìn)行成礦關(guān)聯(lián)信息挖掘,并采支持度(support)、可信度 (confidence)和興趣度(interesting)三個(gè)評(píng)價(jià)指標(biāo)進(jìn)行成礦預(yù)測(cè)信息的不確定性評(píng)價(jià)。
全文摘要
一種基于不確定性空間數(shù)據(jù)挖掘的區(qū)域成礦預(yù)測(cè)方法,屬于資源信息處理與應(yīng)用技術(shù)領(lǐng)域。本發(fā)明充分利用多源海量地質(zhì)空間數(shù)據(jù)(基礎(chǔ)地質(zhì)礦產(chǎn)數(shù)據(jù)、遙感找礦數(shù)據(jù)、地球化學(xué)數(shù)據(jù)、礦山地質(zhì)數(shù)據(jù)、礦床數(shù)據(jù)),基于不確定性空間數(shù)據(jù)挖掘算法模型,高效提取區(qū)域成礦關(guān)聯(lián)信息,達(dá)到快速高效地進(jìn)行區(qū)域成礦預(yù)測(cè)的目的。該發(fā)明包括三個(gè)主要步驟多源多尺度地質(zhì)空間數(shù)據(jù)的幾何配準(zhǔn);遙感礦化信息提??;基于不確定性空間數(shù)據(jù)挖掘算法模型的成礦預(yù)測(cè)。本發(fā)明能夠更加高效、客觀地評(píng)價(jià)區(qū)域成礦遠(yuǎn)景區(qū)。
文檔編號(hào)G06F17/30GK101739396SQ200810046559
公開日2010年6月16日 申請(qǐng)日期2008年11月14日 優(yōu)先權(quán)日2008年11月14日
發(fā)明者何彬彬, 陳翠華 申請(qǐng)人:電子科技大學(xué)