本發(fā)明涉及生物醫(yī)學(xué),更具體的說是涉及一種非酒精性脂肪肝腸道微生物標(biāo)志物及其應(yīng)用與構(gòu)建非酒精性脂肪肝檢測模型的方法。
背景技術(shù):
1、酒精性脂肪肝(nafld)的發(fā)病率在全球范圍內(nèi)呈上升趨勢,且不同地區(qū)和人群的患病率存在差異。在發(fā)達(dá)國家和地區(qū),如歐美,其患病率較高;而在發(fā)展中國家,隨著生活方式的改變和肥胖癥的流行,患病率也在逐漸增加。非酒精性脂肪肝(nafld)可見于各個(gè)年齡段,但在中年人群中更為常見,且男性的患病率略高于女性。目前的診斷主要依賴于影像學(xué)檢查(如超聲、磁共振成像等)和血液生化指標(biāo)(如谷丙轉(zhuǎn)氨酶、谷草轉(zhuǎn)氨酶、血脂等),但這些方法在疾病早期的敏感性和特異性不夠高;肝活檢雖然是診斷的金標(biāo)準(zhǔn),但它是一種有創(chuàng)性檢查,存在一定的風(fēng)險(xiǎn),且患者接受度較低。
2、研究發(fā)現(xiàn),非酒精性脂肪肝患者的腸道微生物多樣性可能降低,某些有益菌的數(shù)量減少,而有害菌或條件致病菌的數(shù)量增加;特定的腸道微生物種類、菌群比例或其代謝產(chǎn)物有望成為非酒精性脂肪肝的新型診斷標(biāo)志物。本發(fā)明旨在通過宏基因組測序技術(shù)識別酒精性脂肪肝患者與正常人群糞便樣品中的差異微生物群落,并利用隨機(jī)森林模型對這些差異微生物進(jìn)行驗(yàn)證,以期發(fā)現(xiàn)新的生物標(biāo)志物或治療靶點(diǎn),提高nafld的早期診斷率及治療效果。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是提供一種非酒精性脂肪肝腸道微生物標(biāo)志物及其應(yīng)用與構(gòu)建非酒精性脂肪肝檢測模型的方法,通過分析非酒精性脂肪肝患者的腸道微生物的組成和功能變化,更早地發(fā)現(xiàn)非酒精性脂肪肝的病情,并監(jiān)測治療效果。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
3、本發(fā)明提供了一種非酒精性脂肪肝腸道微生物標(biāo)志物,所述腸道微生物標(biāo)志物包括以下菌種:actinomyces_dentalis、長雙歧桿菌(bifidobacterium_longum)、faecalibacillus_intestinalis、anaerobutyricum_hallii、經(jīng)黏液真桿菌屬(blautia_wexlerae)、anaerostipes_hadrus、假小鏈雙歧桿菌(bifidobacterium_pseudocatenulatum)、dorea_longicatena。
4、進(jìn)一步地,所述應(yīng)用包括用于診斷患者是否患有非酒精性脂肪肝或非酒精性脂肪肝的產(chǎn)品、作為靶點(diǎn)用于非酒精性脂肪肝的病情評估和治療以及構(gòu)建非酒精性脂肪肝檢測模型;所述產(chǎn)品包括檢測試劑、檢測試劑盒和檢測芯片中的任意一種。
5、本發(fā)明還提供了一種利用非酒精性脂肪肝腸道微生物標(biāo)志物構(gòu)建非酒精性脂肪肝檢測模型的方法,包括以下步驟:
6、(1)分別提取非酒精性脂肪肝患者和健康人群的糞便中總dna,預(yù)處理后進(jìn)行測序,對測序結(jié)果進(jìn)行宏基因組組裝、基因預(yù)測及基因集構(gòu)建、物種組成及豐度、基因功能分析、多樣性分析以及多樣品比較分析,篩選出非酒精性脂肪肝腸道微生物標(biāo)志物;
7、(2)通過非酒精性脂肪肝腸道微生物標(biāo)志物建立鑒定非酒精性脂肪肝和健康人群樣本的隨機(jī)森林模型,評估,得到非酒精性脂肪肝檢測模型;
8、(3)將待測患者的宏基因組及其豐度信息輸入非酒精性脂肪肝檢測模型進(jìn)行識別。
9、進(jìn)一步地,所述步驟(1)中,所述預(yù)處理,包括:文庫制備,所述文庫制備具體為:
10、隨機(jī)打斷成特定長度的片段,對片段化后的dna末端進(jìn)行修復(fù),將修復(fù)后的dna片段兩端連接特定接頭序列,并去除多余接頭、引物,對特定接頭序列進(jìn)行pcr擴(kuò)增。
11、進(jìn)一步地,所述步驟(1)中,所述進(jìn)行測序,包括:用fastp進(jìn)行去除接頭、用bowtie2去除宿主序列、用metaphlan4進(jìn)行基于marker的物種豐度分析、用humann33進(jìn)行功能分析。
12、進(jìn)一步地,所述步驟(2)中,通過非酒精性脂肪肝腸道微生物標(biāo)志物建立鑒定非酒精性脂肪肝和健康人群樣本的隨機(jī)森林模型,評估,得到非酒精性脂肪肝檢測模型,具體為:
13、將非酒精性脂肪肝患者和健康人群分為訓(xùn)練集和測試集,利用python中的sklearn.ensemble.randomforestclassifier模塊對所述訓(xùn)練集進(jìn)行隨機(jī)森林模型訓(xùn)練;
14、所述評估的方法為:通過繪制學(xué)習(xí)曲線評估隨機(jī)森林模型的擬合程度,并通過十折交叉驗(yàn)證對隨機(jī)森林模型進(jìn)行驗(yàn)證。
15、進(jìn)一步地,所述步驟(2)中隨機(jī)森林模型的訓(xùn)練參數(shù)為:梯度n_estimators={100,500,?1000},max_depth={1,?2,?3,?7,?9},max_features=["log2",?"sqrt"],使用python軟件gridsearchcv模塊搜索最佳參數(shù),使用最佳參數(shù)重新構(gòu)建隨機(jī)森林模型,并在測試集上進(jìn)行預(yù)測。
16、根據(jù)本發(fā)明提供的具體實(shí)施例,本發(fā)明公開了以下技術(shù)效果:
17、(1)本發(fā)明從宏基因組數(shù)據(jù)中提取與非酒精性脂肪肝發(fā)病機(jī)制和進(jìn)程相關(guān)的生物標(biāo)志物;采用隨機(jī)森林算法來構(gòu)建非酒精性脂肪肝檢測模型,可以增加模型的泛化能力和抗過擬合性,還能夠更準(zhǔn)確地預(yù)測和評估糖尿病的病情,這有助于醫(yī)生制定更有效的治療方案,提高患者的生存率和生活質(zhì)量。
18、(2)本發(fā)明通過隨機(jī)森林模型和10折交叉驗(yàn)證的五次試驗(yàn)得到誤差曲線cverror,可以更準(zhǔn)確地識別出非酒精性脂肪肝患者和健康對照的差異菌,從而提高非酒精性脂肪肝的早期輔助診斷的準(zhǔn)確性,還通過roc曲線和marker菌,可以對非酒精性脂肪肝患者進(jìn)行個(gè)性化的治療,提高治療效果。本發(fā)明的模型被驗(yàn)證并應(yīng)用于臨床,可以減少昂貴的醫(yī)療測試和不必要的醫(yī)療干預(yù),從而節(jié)省醫(yī)療資源。
19、(3)本發(fā)明提出了一種利用隨機(jī)森林模型等方法來識別非酒精性脂肪肝的特異性腸道微生物標(biāo)志物的技術(shù)方案,可以用來揭示與非酒精性脂肪肝相關(guān)的宿主-微生物代謝途徑的變化,可能有助于發(fā)現(xiàn)新的生物標(biāo)志物,可能發(fā)現(xiàn)新的生物標(biāo)志物或治療靶點(diǎn)。
1.一種非酒精性脂肪肝腸道微生物標(biāo)志物,其特征在于,所述腸道微生物標(biāo)志物包括以下菌種:actinomyces_dentalis、長雙歧桿菌(bifidobacterium_longum)、faecalibacillus_intestinalis、anaerobutyricum_hallii、經(jīng)黏液真桿菌屬(blautia_wexlerae)、anaerostipes_hadrus、假小鏈雙歧桿菌(bifidobacterium_pseudocatenulatum)、dorea_longicatena。
2.一種權(quán)利要求1所述的非酒精性脂肪肝腸道微生物標(biāo)志物的應(yīng)用,其特征在于,所述應(yīng)用包括用于診斷患者是否患有非酒精性脂肪肝或非酒精性脂肪肝的產(chǎn)品、作為靶點(diǎn)用于非酒精性脂肪肝的病情評估和治療以及構(gòu)建非酒精性脂肪肝檢測模型;所述產(chǎn)品包括檢測試劑、檢測試劑盒和檢測芯片中的任意一種。
3.一種應(yīng)用權(quán)利要求1所述的非酒精性脂肪肝腸道微生物標(biāo)志物構(gòu)建非酒精性脂肪肝檢測模型的方法,其特征在于,包括以下步驟:
4.根據(jù)權(quán)利要求3所述的構(gòu)建非酒精性脂肪肝檢測模型的方法,其特征在于,所述步驟(1)中,所述預(yù)處理,包括:文庫制備,所述文庫制備具體為:
5.根據(jù)權(quán)利要求3所述的構(gòu)建非酒精性脂肪肝檢測模型的方法,其特征在于,所述步驟(1)中,所述進(jìn)行測序,包括:用fastp進(jìn)行去除接頭、用bowtie2去除宿主序列、用metaphlan4進(jìn)行基于marker的物種豐度分析、用humann33進(jìn)行功能分析。
6.根據(jù)權(quán)利要求3所述的構(gòu)建非酒精性脂肪肝檢測模型的方法,其特征在于,所述步驟(2)中,通過非酒精性脂肪肝腸道微生物標(biāo)志物建立鑒定非酒精性脂肪肝和健康人群樣本的隨機(jī)森林模型,評估,得到非酒精性脂肪肝檢測模型,具體為:
7.根據(jù)權(quán)利要求6所述的構(gòu)建克羅恩病檢測模型的方法,其特征在于,所述步驟(2)中隨機(jī)森林模型的訓(xùn)練參數(shù)為:梯度n_estimators={100,?500,?1000},max_depth={1,?2,3,?7,?9},max_features=["log2",?"sqrt"],使用python軟件gridsearchcv模塊搜索最佳參數(shù),使用最佳參數(shù)重新構(gòu)建隨機(jī)森林模型,并在測試集上進(jìn)行預(yù)測。