本發(fā)明涉及地球物理領(lǐng)域,具體涉及一種基于cxdf算法的火成巖流體識(shí)別方法。
背景技術(shù):
1、火成巖儲(chǔ)層廣泛分布于地球上主要的含油盆地中。隨著油氣勘探和開發(fā)技術(shù)的進(jìn)步,行業(yè)逐漸向復(fù)雜巖性的火成巖儲(chǔ)層擴(kuò)展,這為油氣產(chǎn)量和儲(chǔ)量的增長(zhǎng)開辟了新的途徑。為了有效開發(fā)此類儲(chǔ)層,準(zhǔn)確識(shí)別儲(chǔ)層流體至關(guān)重要。傳統(tǒng)的儲(chǔ)層流體識(shí)別方法包括標(biāo)準(zhǔn)水層比較法、儲(chǔ)層最小電阻率法、徑向電阻率法和鄰井曲線比較法。然而,這些方法常常受到儲(chǔ)層條件的限制,例如巖性不一致和地層水鹽度相似,導(dǎo)致流體識(shí)別面臨困難。盡管已有多種機(jī)器學(xué)習(xí)方法(如支持向量機(jī)、極端梯度提升和隨機(jī)森林)用于油藏評(píng)價(jià),目前尚未有將機(jī)器學(xué)習(xí)方法應(yīng)用于復(fù)雜巖性火成巖儲(chǔ)層流體識(shí)別的相關(guān)研究。
2、集成學(xué)習(xí)方法通過將多個(gè)弱學(xué)習(xí)器組合成一個(gè)強(qiáng)學(xué)習(xí)器,既保留了弱學(xué)習(xí)器的特點(diǎn),又提升了模型的整體效果。典型的集成學(xué)習(xí)方法包括隨機(jī)森林、adaboost、gbrt和xgboost。這些方法已廣泛應(yīng)用于巖性識(shí)別、薄層識(shí)別和儲(chǔ)層物性反演。集成學(xué)習(xí)方法為復(fù)雜巖性火成巖儲(chǔ)層的開發(fā)提供了潛在的優(yōu)勢(shì)。然而,常規(guī)測(cè)井?dāng)?shù)據(jù)集的不平衡性對(duì)流體識(shí)別構(gòu)成挑戰(zhàn),基于不平衡數(shù)據(jù)的分類模型可能會(huì)偏向于多數(shù)類樣本,為此需要對(duì)數(shù)據(jù)集進(jìn)行重新平衡。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明針對(duì)上述現(xiàn)有技術(shù)存在的缺陷,提供了一種基于cxdf算法的火成巖流體識(shí)別方法。本發(fā)明基于自適應(yīng)多目標(biāo)群交叉優(yōu)化算法解決了初始數(shù)據(jù)集不平衡的問題,并采用極端梯度提升樹算法和深度森林算法相結(jié)合的集成學(xué)習(xí)方法,能夠?qū)崿F(xiàn)對(duì)復(fù)雜巖性火成巖儲(chǔ)層流體的有效識(shí)別。
2、本發(fā)明提供的一種基于cxdf算法的火成巖流體識(shí)別方法,具體包括以下模塊:
3、s1數(shù)據(jù)預(yù)處理:獲取研究區(qū)的巖心和測(cè)井?dāng)?shù)據(jù),將數(shù)據(jù)整理成xlsx格式的表格文件;對(duì)指定的測(cè)井?dāng)?shù)據(jù)取對(duì)數(shù)處理;對(duì)測(cè)井?dāng)?shù)據(jù)歸一化處理;預(yù)處理后的數(shù)據(jù)的78%為訓(xùn)練數(shù)據(jù)集,22%為驗(yàn)證數(shù)據(jù)集;將訓(xùn)練數(shù)據(jù)集標(biāo)簽分成兩部分,即多烴和低烴。
4、s2模型建立:基于cxdf算法和其他人工智能算法,構(gòu)建流體識(shí)別模型;基于驗(yàn)證數(shù)據(jù)集構(gòu)建模擬井;根據(jù)流體識(shí)別模型識(shí)別模擬井。
5、s3模型優(yōu)選:基于表格、雷達(dá)圖和柱狀圖進(jìn)行模型評(píng)價(jià)和模型對(duì)比;確定最佳的流體識(shí)別模型。
6、優(yōu)選的,s1所述的研究區(qū)的流體類型包括干層、低產(chǎn)油層、水層、油層、低產(chǎn)水層、含油水層和氣層。
7、優(yōu)選的,s1所述的研究區(qū)的巖性包括玄武巖、粗面巖、輝綠巖、安山巖和凝灰?guī)r。
8、優(yōu)選的,s1所述的測(cè)井?dāng)?shù)據(jù)包括中子(cnl)、密度(den)、自然伽馬(gr)、深側(cè)向電阻率(rlld)和微側(cè)向電阻率(rmll)。其中,s1所述的指定的測(cè)井?dāng)?shù)據(jù)為深側(cè)向電阻率(rlld)和微側(cè)向電阻率(rmll)。
9、優(yōu)選的,s1所述的多烴包括油層和氣層;s1所述的低烴包括干層、低產(chǎn)油層、水層、低產(chǎn)水層和含油水層。
10、優(yōu)選的,s2所述的cxdf算法是基于自適應(yīng)多目標(biāo)群交叉優(yōu)化(amsco)算法的優(yōu)化數(shù)據(jù)集,并結(jié)合xgboost算法和深度森林(df)算法的集成學(xué)習(xí)模型。
11、優(yōu)選的,所述的amsco算法提出了一種自適應(yīng)優(yōu)化的數(shù)據(jù)采樣模型,旨在解決分類場(chǎng)景下的數(shù)據(jù)不平衡問題。針對(duì)模型的自適應(yīng)特性,提出了一種可靠精度(ra)的復(fù)合評(píng)價(jià)標(biāo)準(zhǔn)。
12、優(yōu)選的,所述的amsco算法的再平衡過程,具體包括:將預(yù)處理后的訓(xùn)練數(shù)據(jù)集讀取為當(dāng)前訓(xùn)練數(shù)據(jù)集;基于當(dāng)前訓(xùn)練數(shù)據(jù)集評(píng)估可靠精度;將未滿足標(biāo)準(zhǔn)的當(dāng)前訓(xùn)練數(shù)據(jù)集分為少數(shù)類和多數(shù)類兩個(gè)子集;少數(shù)類子集利用過采樣技術(shù)(osmote)優(yōu)化,多數(shù)類子集利用組實(shí)例選擇技術(shù)(sis(o_major))優(yōu)化;將兩種優(yōu)化作為一個(gè)統(tǒng)一的迭代器耦合在一起,即通過迭代交叉兩種優(yōu)化的結(jié)果,逐步增強(qiáng)兩種優(yōu)化的數(shù)據(jù)混合效果,直到生成一個(gè)高質(zhì)量的數(shù)據(jù)集。
13、優(yōu)選的,s3模塊所述的雷達(dá)圖基于fbeta、精準(zhǔn)率和召回率三種評(píng)價(jià)指標(biāo)顯示出流體識(shí)別模型對(duì)模擬井中7種流體的識(shí)別效果。其中,所述的fbeta是一種用于評(píng)估二元分類模型準(zhǔn)確性的統(tǒng)計(jì)度量,不同的beta值對(duì)應(yīng)于召回率和準(zhǔn)確率的不同權(quán)重。
14、進(jìn)一步的,基于表格、雷達(dá)圖和柱狀圖的綜合識(shí)別效果,確定最佳的火成巖流體識(shí)別模型,以實(shí)現(xiàn)對(duì)復(fù)雜巖性火成巖流體的準(zhǔn)確識(shí)別。
1.本發(fā)明提供的一種基于cxdf算法的火成巖流體識(shí)別方法,其特征在于,具體包括以下模塊:
2.根據(jù)權(quán)利要求1所述的一種基于cxdf算法的火成巖流體識(shí)別方法,其特征在于:s1所述的研究區(qū)的流體類型包括干層、低產(chǎn)油層、水層、油層、低產(chǎn)水層、含油水層和氣層。
3.根據(jù)權(quán)利要求1所述的一種基于cxdf算法的火成巖流體識(shí)別方法,其特征在于:s1所述的研究區(qū)的巖性包括玄武巖、粗面巖、輝綠巖、安山巖和凝灰?guī)r。
4.根據(jù)權(quán)利要求1所述的一種基于cxdf算法的火成巖流體識(shí)別方法,其特征在于:s1所述的測(cè)井?dāng)?shù)據(jù)包括中子(cnl)、密度(den)、自然伽馬(gr)、深側(cè)向電阻率(rlld)和微側(cè)向電阻率(rmll),同時(shí)s1所述的指定的測(cè)井?dāng)?shù)據(jù)為深側(cè)向電阻率(rlld)和微側(cè)向電阻率(rmll)。
5.根據(jù)權(quán)利要求1所述的一種基于cxdf算法的火成巖流體識(shí)別方法,其特征在于:s1所述的多烴包括油層和氣層;s1所述的低烴包括干層、低產(chǎn)油層、水層、低產(chǎn)水層和含油水層。
6.根據(jù)權(quán)利要求1所述的一種基于cxdf算法的火成巖流體識(shí)別方法,其特征在于:s2所述的cxdf算法是基于自適應(yīng)多目標(biāo)群交叉優(yōu)化(amsco)算法的優(yōu)化數(shù)據(jù)集,并結(jié)合xgboost算法和深度森林(df)算法的集成學(xué)習(xí)模型。
7.根據(jù)權(quán)利要求6所述的一種基于cxdf算法的火成巖流體識(shí)別方法,其特征在于:所述的amsco算法提出了一種自適應(yīng)優(yōu)化的數(shù)據(jù)采樣模型,旨在解決分類場(chǎng)景下的數(shù)據(jù)不平衡問題,針對(duì)模型的自適應(yīng)特性,提出了一種可靠精度(ra)的復(fù)合評(píng)價(jià)標(biāo)準(zhǔn),其表達(dá)式如下:
8.根據(jù)權(quán)利要求6或7所述的一種基于cxdf算法的火成巖流體識(shí)別方法,其特征在于:所述的amsco算法的再平衡過程,具體包括:
9.根據(jù)權(quán)利要求1所述的一種基于cxdf算法的火成巖流體識(shí)別方法,其特征在于:s3所述的雷達(dá)圖基于fbeta、精準(zhǔn)率和召回率三種評(píng)價(jià)指標(biāo)顯示出流體識(shí)別模型對(duì)模擬井中7種流體的識(shí)別效果,同時(shí)所述的fbeta是一種用于評(píng)估二元分類模型準(zhǔn)確性的統(tǒng)計(jì)度量,不同的beta值對(duì)應(yīng)于召回率和精確率的不同權(quán)重,其表達(dá)式如下: