国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于miRNA數(shù)據(jù)和組織特異性網(wǎng)絡(luò)的藥物重定位方法與流程

      文檔序號(hào):11287056閱讀:726來(lái)源:國(guó)知局
      基于miRNA數(shù)據(jù)和組織特異性網(wǎng)絡(luò)的藥物重定位方法與流程

      本發(fā)明屬于生物信息學(xué)技術(shù)領(lǐng)域,涉及一種藥物重定位方法,具體涉及一種基于mirna數(shù)據(jù)和組織特異性網(wǎng)絡(luò)的藥物重定位方法,可用于預(yù)測(cè)組織特異性癌癥的候選藥物。



      背景技術(shù):

      復(fù)雜疾病研究一直是一個(gè)熱門且復(fù)雜的問(wèn)題,比如癌癥、糖尿病以及心血管疾病往往是由于復(fù)雜的遺傳因素和環(huán)境因素等共同導(dǎo)致的。過(guò)去幾十年中,盡管基因組學(xué)和生命科學(xué)領(lǐng)域迅速發(fā)展,但是新藥的開(kāi)發(fā)仍然是非常耗時(shí)、花費(fèi)巨大而且成功率很低,新藥的開(kāi)發(fā)已經(jīng)開(kāi)始停滯。據(jù)保守統(tǒng)計(jì),開(kāi)發(fā)一種新藥通常需要超過(guò)15年時(shí)間并且花費(fèi)8億到10億美元,所以當(dāng)下有迫切的需求通過(guò)花費(fèi)少量時(shí)間與金錢去發(fā)現(xiàn)藥物新的適應(yīng)癥。

      面對(duì)這些挑戰(zhàn),藥物重定位是一種發(fā)現(xiàn)現(xiàn)有藥物新的臨床適應(yīng)癥的策略,它可以大大降低新藥開(kāi)發(fā)的風(fēng)險(xiǎn)和成本,并且縮短藥物發(fā)現(xiàn)和臨床可用性之間的時(shí)間周期,在2013年新上市的84個(gè)藥物中有20%是重定位的藥物,藥物重定位在新藥發(fā)現(xiàn)和精準(zhǔn)醫(yī)療中起到了關(guān)鍵的作用。然而,早期藥物新適應(yīng)癥的發(fā)現(xiàn)往往是偶然的,比如砷作用于急性早幼粒細(xì)胞白血病、醋酸鋅作用于威爾遜氏病等,都是通過(guò)臨床實(shí)驗(yàn)偶爾發(fā)現(xiàn)的,伴隨著基因組學(xué)、生命科學(xué)、計(jì)算生物學(xué)的飛速發(fā)展以及各學(xué)科之間的融合交叉,藥物重定位正從依靠臨床偶然發(fā)現(xiàn)慢慢轉(zhuǎn)化為通過(guò)分析大規(guī)模生物數(shù)據(jù)進(jìn)行精準(zhǔn)的預(yù)測(cè),利用不同的數(shù)學(xué)模型以及計(jì)算的方法來(lái)提高預(yù)測(cè)藥物與疾病之間關(guān)系的準(zhǔn)確率。

      根據(jù)不同的理論假設(shè)與數(shù)據(jù),目前藥物重定位計(jì)算方法主要分為以下三大類:

      (1)基于基因表達(dá)數(shù)據(jù)的藥物重定位方法。

      隨著微陣列測(cè)序技術(shù)和新一代測(cè)序技術(shù)的發(fā)展,大大加快了探索人類基因組秘密的速度。由測(cè)序產(chǎn)生的基因序列數(shù)據(jù)、基因表達(dá)數(shù)據(jù)和染色體結(jié)構(gòu)數(shù)據(jù)等,使得從生物分子層面研究藥物重定位成為了可能。此類方法的主要流程是:首先對(duì)來(lái)自cmap數(shù)據(jù)庫(kù)中藥物作用于癌癥細(xì)胞系的基因表達(dá)值數(shù)據(jù)進(jìn)行處理,得到每個(gè)基因的差異表達(dá)值,對(duì)于每個(gè)藥物的基因按照其差異表達(dá)值從大到小進(jìn)行排名,設(shè)定閾值t,然后選擇排名靠前的t個(gè)基因和排名靠后的t個(gè)基因作為該藥物的特征,最后計(jì)算兩個(gè)藥物的特征之間的關(guān)系,作為兩個(gè)藥物之間的相似性權(quán)值,相似性權(quán)值越大,則兩個(gè)藥物功能越相似。此類方法的優(yōu)點(diǎn)是從基因?qū)用孢M(jìn)行藥物重定位研究,缺點(diǎn)是沒(méi)有考慮到生物分子之間的相互作用關(guān)系,結(jié)果的準(zhǔn)確率有待提升。

      (2)基于表型數(shù)據(jù)的藥物重定位方法。

      許多藥物作用于生物體內(nèi)常常會(huì)產(chǎn)生一些意想不到的效果,那些想要的和不想要的行為或生理變化可以認(rèn)為是藥物的適應(yīng)癥和副作用。藥物的適應(yīng)癥和副作用是可以用來(lái)預(yù)測(cè)藥物與藥物之間的關(guān)系,這可能提供額外的信息來(lái)探索藥物的相關(guān)行為機(jī)制。此類方法的主要流程是:首先從sider數(shù)據(jù)庫(kù)中下載得到藥物與其副作用關(guān)系的數(shù)據(jù),然后將每個(gè)藥物的副作用信息構(gòu)造一個(gè)向量,最后計(jì)算兩個(gè)藥物對(duì)應(yīng)副作用向量的相似性,作為兩個(gè)藥物之間的相似性權(quán)值,權(quán)值越大,則兩個(gè)藥物功能越相似。此類方法的優(yōu)點(diǎn)是從臨床表型層面進(jìn)行藥物重定位研究,比較直觀,缺點(diǎn)是沒(méi)有從藥物的治病機(jī)制以及疾病的致病機(jī)理方面進(jìn)行分析,結(jié)果的準(zhǔn)確率有待提升。

      (3)基于靶標(biāo)數(shù)據(jù)的藥物重定位方法。

      疾病的產(chǎn)生與生物系統(tǒng)中的異常分子高度相關(guān),比如基因、mirna等,可以影響蛋白質(zhì)表達(dá),導(dǎo)致疾病發(fā)生,所以有假設(shè)認(rèn)為表型相似的疾病有公共的致病基因,這表明通過(guò)尋找共享的生物分子總能找到相關(guān)或者共同的病因,而藥物治療疾病的主要途徑也是通過(guò)靶向疾病的致病基因,所以基于靶標(biāo)數(shù)據(jù)的藥物重定位研究可以從分子角度解釋藥物治療疾病的治病機(jī)制,相對(duì)于前面兩種藥物重定位方法準(zhǔn)確率較高,在如今的藥物重定位研究中有著重要的地位。該類方法的一般流程是:首先在相關(guān)數(shù)據(jù)庫(kù)中下載得到藥物與靶標(biāo)基因數(shù)據(jù)以及疾病和致病基因數(shù)據(jù),然后直接計(jì)算藥物的靶標(biāo)基因和疾病的致病基因之間的相關(guān)性系數(shù),或者將藥物的靶標(biāo)基因和疾病的致病基因同時(shí)映射到蛋白質(zhì)相互作用網(wǎng)絡(luò)中,利用網(wǎng)絡(luò)中的相關(guān)算法計(jì)算藥物的靶標(biāo)基因和疾病的致病基因之間的相似性權(quán)值,作為藥物與疾病之間的相似性權(quán)值,權(quán)值越大則藥物越有可能對(duì)疾病有治療效果。例如xuebingwu等人分別使用了在蛋白質(zhì)相互作用網(wǎng)絡(luò)中定義的直接鄰居與最短路徑兩種方法預(yù)測(cè)人類疾病與致病基因之間的關(guān)系,該方法同樣適用于預(yù)測(cè)藥物與疾病之間的關(guān)系,取得了較好的結(jié)果,但是該方法使用的是正常人類的蛋白質(zhì)相互作用網(wǎng)絡(luò),相對(duì)于使用與疾病緊密相關(guān)的組織特異性網(wǎng)絡(luò),準(zhǔn)確率較低。

      hailinchen等人,從sm2mir數(shù)據(jù)庫(kù)中下載得到藥物與mirna關(guān)系的數(shù)據(jù),同時(shí)從hmdd數(shù)據(jù)庫(kù)中下載得到mirna與疾病關(guān)系的數(shù)據(jù),然后利用超幾何分布計(jì)算藥物與疾病之間的相似性權(quán)值,該方法流程過(guò)于簡(jiǎn)單,沒(méi)有考慮到蛋白質(zhì)相互作用網(wǎng)絡(luò)對(duì)藥物重定位的重要影響,準(zhǔn)確率不高。



      技術(shù)實(shí)現(xiàn)要素:

      本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)存在的缺陷,提出了一種基于mirna數(shù)據(jù)和組織特異性網(wǎng)絡(luò)的藥物重定位方法,用于解決現(xiàn)有技術(shù)中存在的預(yù)測(cè)結(jié)果準(zhǔn)確率低的技術(shù)問(wèn)題。

      本發(fā)明的技術(shù)思路是:將癌癥差異表達(dá)mirna的靶標(biāo)基因和藥物的靶標(biāo)基因同時(shí)映射到組織特異性網(wǎng)絡(luò)中,利用模塊距離算法計(jì)算藥物和mirna的距離分?jǐn)?shù),然后計(jì)算每個(gè)藥物和多個(gè)癌癥差異表達(dá)mirna的距離分?jǐn)?shù)的均值,并將其進(jìn)行歸一化后得到藥物與癌癥之間的相似性權(quán)值,具體步驟如下:

      (1)從相關(guān)數(shù)據(jù)庫(kù)中下載n個(gè)癌癥病人樣本的mirna表達(dá)值數(shù)據(jù),得到矩陣wm×n,其中,m表示mirna的數(shù)量,n表示癌癥病人樣本的數(shù)量;

      (2)對(duì)矩陣wm×n進(jìn)行預(yù)處理:計(jì)算矩陣wm×n每一行mirna的均值,并將其作為該行mirna的表達(dá)值ri,得到包含m個(gè)mirna表達(dá)值的向量r=[r1,r2,r3,...,ri,...,rm],其中,i表示mirna的索引,且i=1,2,3,...,m;

      (3)獲取癌癥差異表達(dá)mirna:

      (3a)計(jì)算向量r=[r1,r2,r3,...,ri,...,rm]中每個(gè)mirna的z-score值;

      (3b)設(shè)定閾值t,并將大于閾值t的z-score值對(duì)應(yīng)的mirna作為癌癥差異表達(dá)mirna,得到l個(gè)癌癥差異表達(dá)mirna;

      (4)獲取相關(guān)數(shù)據(jù)和組織特異性網(wǎng)絡(luò):從drugbank數(shù)據(jù)庫(kù)中下載k個(gè)藥物與靶標(biāo)基因數(shù)據(jù),同時(shí)從giant數(shù)據(jù)庫(kù)中下載組織特異性蛋白質(zhì)相互作用網(wǎng)絡(luò),從相關(guān)數(shù)據(jù)庫(kù)中下載l個(gè)癌癥差異表達(dá)mirna對(duì)應(yīng)的靶標(biāo)基因數(shù)據(jù),并對(duì)組織特異性蛋白質(zhì)相互作用網(wǎng)絡(luò)進(jìn)行標(biāo)準(zhǔn)化,得到組織特異性網(wǎng)絡(luò);

      (5)獲取藥物和mirna的距離分?jǐn)?shù):

      (5a)將k個(gè)藥物與靶標(biāo)基因數(shù)據(jù)中藥物的靶標(biāo)基因和l個(gè)癌癥差異表達(dá)mirna對(duì)應(yīng)的靶標(biāo)基因數(shù)據(jù)中mirna的靶標(biāo)基因同時(shí)映射到組織特異性網(wǎng)絡(luò)中,得到藥物的靶標(biāo)基因集合和mirna的靶標(biāo)基因集合;

      (5b)利用模塊距離算法,計(jì)算藥物的靶標(biāo)基因集合和mirna的靶標(biāo)基因集合之間的距離分?jǐn)?shù),并將該距離分?jǐn)?shù)作為藥物與mirna的距離分?jǐn)?shù);

      (6)獲取藥物與癌癥的相似性權(quán)值:

      (6a)計(jì)算每個(gè)藥物與l個(gè)癌癥差異表達(dá)mirna的距離分?jǐn)?shù)的均值,并將得到的均值作為藥物與癌癥的距離分?jǐn)?shù),得到k個(gè)藥物與癌癥的距離分?jǐn)?shù);

      (6b)對(duì)藥物和癌癥的距離分?jǐn)?shù)進(jìn)行歸一化處理,得到藥物與癌癥的相似性權(quán)值;

      (7)獲取癌癥的候選藥物:設(shè)定閾值m,選擇大于閾值m的藥物與癌癥相似性權(quán)值對(duì)應(yīng)的藥物,作為治療癌癥的候選藥物。

      本發(fā)明與現(xiàn)有技術(shù)相比,具有以下優(yōu)點(diǎn):

      1、本發(fā)明在獲取藥物和mirna的距離分?jǐn)?shù)時(shí),在模塊距離算法中采用了癌癥相關(guān)的組織特異性網(wǎng)絡(luò),相對(duì)于目前方法中采用的正常人類蛋白質(zhì)相互作用網(wǎng)絡(luò),有效地提高了藥物重定位的準(zhǔn)確率。

      2、本發(fā)明在獲取藥物與癌癥的相似性權(quán)值時(shí),通過(guò)使用基于組織特異性網(wǎng)絡(luò)的模塊距離算法計(jì)算藥物與mirna的關(guān)系,得到藥物與癌癥的關(guān)系,相對(duì)于目前方法中直接通過(guò)靶標(biāo)基因建立藥物與癌癥的關(guān)系,進(jìn)一步提高了藥物重定位的準(zhǔn)確率。

      附圖說(shuō)明

      圖1是本發(fā)明的實(shí)現(xiàn)流程圖;

      圖2是本發(fā)明實(shí)施例中的模塊距離算法原理圖;

      圖3是本發(fā)明實(shí)施例的藥物重定位結(jié)果準(zhǔn)確率曲線仿真圖。

      具體實(shí)施方式

      以下結(jié)合附圖和具體實(shí)施例,對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。

      本實(shí)施例以乳腺癌為例。

      參照?qǐng)D1、基于mirna數(shù)據(jù)和組織特異性網(wǎng)絡(luò)的藥物重定位方法,包括如下步驟:

      步驟1)從tcga數(shù)據(jù)庫(kù)中下載1189個(gè)乳腺癌病人樣本的mirna表達(dá)值數(shù)據(jù),得到矩陣w,w矩陣有503行和1189列,其中行表示503個(gè)mirna,列表示1189個(gè)乳腺癌病人樣本;

      步驟2)對(duì)矩陣w進(jìn)行預(yù)處理:計(jì)算矩陣w每一行mirna的均值,并將其作為該行mirna的表達(dá)值ri,得到包含503個(gè)mirna表達(dá)值的向量r=[r1,r2,r3,...,ri,...,r503],其中,i表示mirna的索引,且i=1,2,3,...,503;

      mirna的表達(dá)值ri,其計(jì)算公式為:

      其中,wij表示矩陣w中的第i行j列的mirna表達(dá)值;

      步驟3)獲取乳腺癌差異表達(dá)mirna:

      步驟3a)計(jì)算向量r=[r1,r2,r3,...,ri,...,r503]中每個(gè)mirna的z-score值,z-score的計(jì)算公式為:

      其中,mean(r)表示r的平均值,σ(r)表示r的標(biāo)準(zhǔn)差;

      步驟3b)設(shè)定閾值1.645,并將大于閾值1.645的z-score值對(duì)應(yīng)的mirna作為乳腺癌差異表達(dá)mirna,得到25個(gè)乳腺癌差異表達(dá)mirna;

      步驟4)獲取相關(guān)數(shù)據(jù)和組織特異性網(wǎng)絡(luò):從drugbank數(shù)據(jù)庫(kù)中下載1017個(gè)藥物與靶標(biāo)基因數(shù)據(jù),同時(shí)從giant數(shù)據(jù)庫(kù)中下載組織特異性蛋白質(zhì)相互作用網(wǎng)絡(luò),從mirecords、mirtarbase和tarbase數(shù)據(jù)庫(kù)中下載25個(gè)乳腺癌差異表達(dá)mirna對(duì)應(yīng)的靶標(biāo)基因數(shù)據(jù),并對(duì)組織特異性蛋白質(zhì)相互作用網(wǎng)絡(luò)進(jìn)行標(biāo)準(zhǔn)化,得到組織特異性網(wǎng)絡(luò);

      對(duì)組織特異性蛋白質(zhì)相互作用網(wǎng)絡(luò)進(jìn)行標(biāo)準(zhǔn)化,其每一條邊權(quán)值的計(jì)算公式為:

      其中,w表示組織特異性蛋白質(zhì)相互作用網(wǎng)絡(luò)中邊的權(quán)值,w'表示組織特異性網(wǎng)絡(luò)中邊的權(quán)值;

      步驟5)獲取藥物和mirna的距離分?jǐn)?shù):

      步驟5a)將1017個(gè)藥物與靶標(biāo)基因數(shù)據(jù)中每個(gè)藥物的靶標(biāo)基因和25個(gè)乳腺癌差異表達(dá)mirna中對(duì)應(yīng)的靶標(biāo)基因數(shù)據(jù)中每個(gè)mirna的靶標(biāo)基因同時(shí)映射到組織特異性網(wǎng)絡(luò)中,得到藥物的靶標(biāo)基因集合和mirna的靶標(biāo)基因集合;

      步驟5b)利用模塊距離算法,計(jì)算藥物的靶標(biāo)基因集合和mirna的靶標(biāo)基因集合之間的距離分?jǐn)?shù),并將該距離分?jǐn)?shù)作為藥物與mirna的距離分?jǐn)?shù),共得到1017×25=25425個(gè)距離分?jǐn)?shù);

      模塊距離算法,其原理如圖2所示,假設(shè)mirnaa有3個(gè)靶標(biāo)基因,分別是a,b,c,藥物b有4個(gè)靶標(biāo)基因,分別是c,d,e,f。對(duì)于節(jié)點(diǎn)a,它到藥物b的靶標(biāo)c,d,e,f之間的距離分別是0.8,1.0,1.1和1.9,因此它到藥物b的最短距離為0.8。同理,可以得到mirnaa的所有靶標(biāo)a,b,c分別到藥物b的距離,以及藥物b的所有靶標(biāo)c,d,e,f到mirnaa的距離,最終mirnaa和藥物b之間的距離等于所有距離的均值,計(jì)算公式為:

      其中,da,b'表示利用模塊距離算法計(jì)算得到的mirna和藥物距離分?jǐn)?shù);

      步驟6)獲取藥物與乳腺癌的相似性權(quán)值:

      步驟6a)計(jì)算每個(gè)藥物與25個(gè)乳腺癌差異表達(dá)mirna的距離分?jǐn)?shù)的均值,并將得到的均值作為藥物與乳腺癌的距離分?jǐn)?shù),得到1017個(gè)藥物與乳腺癌的距離分?jǐn)?shù);

      計(jì)算每個(gè)藥物與25個(gè)乳腺癌差異表達(dá)mirna的距離分?jǐn)?shù)的均值,計(jì)算公式為:

      其中,表示藥物與mirna的距離分?jǐn)?shù),l表示乳腺癌差異表達(dá)mirna的索引,dd,b表示乳腺癌d與藥物b之間的距離分?jǐn)?shù);

      步驟6b)對(duì)藥物和乳腺癌的距離分?jǐn)?shù)進(jìn)行歸一化處理,得到1017個(gè)藥物與乳腺癌的相似性權(quán)值;

      對(duì)藥物和乳腺癌的距離分?jǐn)?shù)進(jìn)行歸一化處理,計(jì)算公式為:

      其中,maxd和mind分別表示由步驟(6a)計(jì)算得到的乳腺癌d與1017個(gè)藥物距離分?jǐn)?shù)中的最大值與最小值,sd,b表示乳腺癌d與藥物b相似性權(quán)值;

      步驟7)獲取癌癥的候選藥物:設(shè)定閾值0.934,選擇大于閾值0.934的藥物與癌癥相似性權(quán)值對(duì)應(yīng)的藥物,作為治療癌癥的候選藥物。

      以下結(jié)合仿真實(shí)驗(yàn),對(duì)本發(fā)明的技術(shù)效果作進(jìn)一步說(shuō)明:

      1.仿真條件

      仿真實(shí)驗(yàn)在amda8-5600kapuwithradeon(tm)hdgraphicsapu、主頻3.60ghz,內(nèi)存8g,windows7平臺(tái)上的matlabr2014a上進(jìn)行。

      2.仿真內(nèi)容與結(jié)果

      為了證明本發(fā)明能夠預(yù)測(cè)治療癌癥的候選藥物,以乳腺癌作為實(shí)施例對(duì)藥物重定位的結(jié)果進(jìn)行準(zhǔn)確率仿真實(shí)驗(yàn),其結(jié)果如圖3所示。

      參照?qǐng)D3、對(duì)藥物重定位結(jié)果按照相似性權(quán)值從大到小排名后,以ctd數(shù)據(jù)庫(kù)中存在的乳腺癌與藥物的關(guān)系作為基準(zhǔn),進(jìn)行準(zhǔn)確率分析,橫軸代表藥物數(shù)量的百分比,縱軸代表藥物重定位結(jié)果的準(zhǔn)確率,可以看出,結(jié)果的準(zhǔn)確率是隨著相似性權(quán)值的增加而提升。

      接下來(lái)對(duì)乳腺癌排名前30的預(yù)測(cè)結(jié)果進(jìn)行分析驗(yàn)證,如下表1所示。

      表1

      在上表中ctd標(biāo)記為“t”的表示對(duì)應(yīng)的藥物確實(shí)可以治療乳腺癌,標(biāo)記為“ref”的表示該藥物與乳腺癌的關(guān)系有文獻(xiàn)進(jìn)行報(bào)道過(guò),ctd分?jǐn)?shù)越高表示對(duì)應(yīng)的藥物越有可能治療乳腺癌,標(biāo)記為“none”的表示該藥物與乳腺癌的關(guān)系在ctd數(shù)據(jù)庫(kù)中找不到。從上表中可以看出,仿真實(shí)驗(yàn)預(yù)測(cè)結(jié)果排名前10的藥物準(zhǔn)確率為100%(10/10),前20個(gè)藥物的準(zhǔn)確率為95%(19/20),前30個(gè)藥物的準(zhǔn)確率為83.3%(25/30),說(shuō)明了我們方法的準(zhǔn)確率較高,藥物eribulinmesylate、tenecteplase、nadroparin、regorafenib和pralatrexate為預(yù)測(cè)的治療乳腺癌的候選藥物。

      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1