国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于異構圖的多邊類型圖卷積網絡預測piRNA-疾病關聯(lián)性方法、裝置及設備

      文檔序號:40385586發(fā)布日期:2024-12-20 12:08閱讀:4來源:國知局
      基于異構圖的多邊類型圖卷積網絡預測piRNA-疾病關聯(lián)性方法、裝置及設備

      本發(fā)明涉及生物信息,特別涉及一種基于異構圖的多邊類型圖卷積網絡預測pirna-疾病關聯(lián)性方法、裝置及設備。


      背景技術:

      1、pirna是一類獨特的非編碼小rna,主要在生殖細胞中表達。因為它們在各種生物過程中發(fā)揮著重要作用,并與無數(shù)疾病(包括癌癥、神經退行性疾病和其他老年疾病)存在關聯(lián)。pirna長度約為24-35個核苷酸,與piwi-亞家族argonaute蛋白結合,在轉座元件沉默、基因組防御和組蛋白修飾等功能中發(fā)揮關鍵作用。因此,發(fā)現(xiàn)pirna與疾病之間的關系對于醫(yī)學研究者更深入地了解疾病復雜的病理過程至關重要。在傳統(tǒng)的預測方法中,是通過生物實驗推斷pirna與疾病之間的相關性,其存在著設備要求特殊、操作復雜、實驗周期長和高花費等缺點,所以可以設計一個高效準確的計算方法可以為生物實驗提供指導,使得發(fā)現(xiàn)pirna-疾病關聯(lián)關系更有效率。

      2、例如zhang等人2022年在《plos?computational?biology》公開了一種pirna-疾病關聯(lián)關系預測方法ipida-ltr,ipida-ltr結合了成分法和學習排序法來識別已知pirna與疾病之間的關聯(lián)。zhang等人2022年在《plos?computational?biology》公開了一種pirna-疾病關聯(lián)關系預測方法ipida-gcn,ipida-gcn利用兩個gcn從pirna-疾病相互作用網絡和兩個相似網絡提取pirna和疾病的特征,并利用全連接網絡和內部生產作為輸出模塊預測pirna-疾病關聯(lián)評分。chen等人2024年在《briefings?in?bioinformatics》公開了一種pirna-疾病關聯(lián)關系預測方法putransgcn,putransgcn利用注意機制自動調整聚合異構節(jié)點特征的權重參數(shù)。為了解決不平衡數(shù)據(jù)集問題,采用由pu?bagging、兩步和間諜技術組成的組合正無標記學習(pul)方法來選擇可靠的負關聯(lián),并使用異構圖卷積網絡來發(fā)現(xiàn)潛在的pirna與疾病的關聯(lián)。

      3、盡管上述方法對pirna-疾病關聯(lián)的研究是有效的,但仍存在很多不足的地方。一方面,一些方法對pirna-疾病預測有用的信息利用不充分,沒有綜合考慮各種相似性數(shù)據(jù);另一方面,一些方法在學習pirna、疾病嵌入特征時未能較好地聚合鄰居節(jié)點信息,導致預測效果不理想。

      4、鑒于此,有必要提供一種新的方法解決上述技術問題。


      技術實現(xiàn)思路

      1、本發(fā)明要解決的技術問題是提供一種基于異構圖的多邊類型圖卷積網絡預測pirna-疾病關聯(lián)性方法,能有效提高pirna-疾病關聯(lián)預測的準確性,從而解決現(xiàn)有技術中存在的預測準確率較低的技術問題。其技術方案如下:

      2、本發(fā)明的一種基于異構圖的多邊類型圖卷積網絡預測pirna-疾病關聯(lián)性方法,包括如下步驟:

      3、s1,利用pirna相似性矩陣和疾病相似性矩陣構建pirna相似同構圖和疾病相似同構圖,并利用pirna-疾病關聯(lián)關系數(shù)據(jù)構建pirna-疾病關聯(lián)異構圖;

      4、s2,利用圖卷積神經網絡分別從所述pirna相似同構圖和所述疾病相似同構圖學習pirna的同構嵌入特征和疾病的同構嵌入特征,并利用基于異構圖的多邊類型圖卷積網絡從pirna-疾病關聯(lián)異構圖學習pirna的異構嵌入特征和疾病的異構嵌入特征;

      5、s3,利用注意力機制分別融合所述pirna的同構嵌入特征和所述疾病的同構嵌入特征以及所述pirna的異構嵌入特征和所述疾病的異構嵌入特征,獲得pirna的融合嵌入特征和疾病的融合嵌入特征;

      6、s4,將所述pirna的融合嵌入特征和所述疾病的融合嵌入特征水平拼接構成pirna-疾病對特征,利用多層感知機預測所述pirna-疾病對的關聯(lián)性。

      7、進一步地,步驟s1中,從mndr?4.0數(shù)據(jù)庫下載人類已知的pirna與疾病相關聯(lián)的數(shù)據(jù),構建pirna-疾病關聯(lián)矩陣并轉化為所述pirna-疾病關聯(lián)異構圖。

      8、進一步地,步驟s1中,利用pirna序列相似性和pirna高斯核相似性構建所述pirna相似同構圖;利用疾病語義相似性和疾病高斯核相似性構建所述疾病相似同構圖。

      9、進一步地,構建所述pirna相似同構圖,包括如下步驟:

      10、第一,通過smith–waterman算法計算pirna?pi和pj之間的序列相似性,并得到pirna序列相似性矩陣公式如下:

      11、

      12、其中,sw(pi,pj)表示基于smith-waterman算法的第i和第j個pirna之間的序列比對得分;

      13、第二,計算pirna?pi和pj之間的高斯核相似性,并得到pirna高斯核相似性矩陣公式如下:

      14、pgs(pi,pj)=exp(-γp||ip(pi)-ip(pj)||2),

      15、

      16、其中,ip(pi)表示pirna-疾病關聯(lián)矩陣中pirna?pi對應的行,參數(shù)γp用來控制核帶寬;參數(shù)γ,p是通過所有疾病與pirna之間的平均相關數(shù)來測量的,值為1;np表示pirna-疾病關聯(lián)矩陣中pirna的數(shù)量;

      17、第三,將pirna序列相似性矩陣和pirna高斯核相似性矩陣求平均,從而計算出pirnami和mj之間的集成相似性,然后得到pirna集成相似性矩陣計算公式如下:

      18、

      19、第四,在pirna集成相似性矩陣中選取每個pirna的k個最相似的鄰居,其中k=2;基于此,得到最終的pirna集成相似性矩陣并轉化為pirna相似同構圖,同構圖用二元矩陣表示,公式如下:

      20、

      21、其中,表示矩陣ap第i行第j列的元素,是pirna?pi包括pi在內的k個近鄰的集合,nk(pi)是pi?k個最近的鄰居。

      22、進一步地,構建所述疾病相似同構圖,包括如下步驟:

      23、第一,從mesh數(shù)據(jù)庫獲取疾病的有向無環(huán)圖dag,其中節(jié)點代表疾病,疾病之間的連接描述疾病之間的關系;并基于dag計算疾病語義相似度矩陣

      24、

      25、其中,表示疾病di的語義值,t(di)表示由節(jié)點di及其祖先節(jié)點組成的節(jié)點集合;表示疾病di對疾病di的語義貢獻,計算公式如下:

      26、

      27、其中δ為語義貢獻衰減因子,設為0.5;

      28、第二,計算疾病di和dj之間的高斯核相似性,并得到疾病高斯核相似性矩陣公式如下:

      29、dgs(di,dj)=exp(-γd||ip(di)-ip(dj)||2),

      30、

      31、其中,ip(di)表示pirna-疾病關聯(lián)矩陣中疾病di對應的列,參數(shù)γd用來控制核帶寬;參數(shù)γ’d是通過所有疾病與pirna之間的平均相關數(shù)來測量的,值為1;nd表示pirna-疾病關聯(lián)矩陣中疾病的數(shù)量;

      32、第三,將疾病語義相似性矩陣和疾病高斯核相似性矩陣求平均,從而計算出疾病di和dj之間的集成相似性,然后得到疾病集成相似性矩陣計算公式如下:

      33、

      34、第四,在疾病集成相似性矩陣中選取每個疾病的k個最相似的鄰居,其中k=2;基于此,得到最終的疾病集成相似性矩陣并轉化為疾病相似同構圖,同構圖用二元矩陣表示,公式如下:

      35、

      36、其中,表示矩陣ad第i行第j列的元素,是疾病di包括di在內的k個近鄰的集合,nk(di)是di?k個最近的鄰居。

      37、進一步地,步驟s2包括如下步驟:

      38、s21,利用gcn分別從pirna相似同構圖和疾病相似同構圖中學習pirna和疾病的同構嵌入特征,公式如下:

      39、

      40、

      41、其中,和分別是pirna和疾病在第l層的信息,和分別是pirna和疾病所在gcn第l層的權重矩陣,relu是激活函數(shù),dp和dd分別是ap和ad的對角矩陣,將pirna和疾病的最后一層輸出嵌入分別表示為和

      42、s22,利用基于異構圖的多邊類型圖卷積網絡從pirna-疾病關聯(lián)異構圖學習pirna和疾病的異構嵌入特征;在pirna-疾病關聯(lián)異構圖中,已知和未知的pirna-疾病關聯(lián)被視為不同的邊緣類型,并為每種邊緣類型t∈{0,1}分配單獨的處理通道;具體地說,圖卷積的每個邊類型都可以看作是消息傳遞的一種形式,其中向量值消息在圖的邊上傳遞和轉換;在上述模型中,為每一種邊緣類型分配了一個特定的轉換,從而得到從疾病dj到pirna?pi邊緣類型的消息mj→i,t形式如下:

      43、

      44、其中,n(pi)表示節(jié)點pi的鄰居集合,n(dj)表示節(jié)點dj的鄰居集合,wt為邊緣類型特定參數(shù)矩陣,xj為疾病節(jié)點dj的特征向量;從pirna?pi到疾病dj的消息mi→j,t以類似的方式處理;在消息傳遞步驟之后,通過對由特定邊類型t連接的所有鄰居nt(dj)求和,并將每種邊類型的結果累加到單個向量表示中,來累積每個節(jié)點的傳入消息:

      45、

      46、其中,sum表示累加操作,σ表示tanh激活函數(shù),為了得到pirna的最終表示,用一個線性算子對中間輸出zi進行變換:

      47、zi=whi,

      48、疾病嵌入的zj也使用類似的方法計算;在線性算子中,pirna的參數(shù)矩陣w疾病相同,將上述變換應用于pirna-疾病關聯(lián)異構圖的所有節(jié)點,可以得到pirna和疾病在異構圖中的最終表示。

      49、進一步地,步驟s3包括如下步驟:

      50、s31,使用注意機制自適應地學習藥物嵌入和疾病嵌入的相應重要性如下:

      51、

      52、

      53、其中,att是一個執(zhí)行注意力操作的神經網絡,和分別表示pirna和疾病嵌入和的注意力值;

      54、s32,根據(jù)這些注意力值將這些嵌入組合得到最終的pirna嵌入zp和疾病嵌入zd:

      55、

      56、

      57、進一步地,步驟s4包括如下步驟:

      58、s41,將兩個得到的嵌入連接起來表示pirna-疾病對,并將pirna-疾病對的嵌入送入到一個mlp進行預測:

      59、

      60、其中,表示pirna?i的嵌入,表示疾病j的嵌入,mlp是一個三層mlp神經網絡,表示pirna?i-疾病j對關聯(lián)的可能性;

      61、s42,計算預測結果與真實結果之間的二元交叉熵損失:

      62、

      63、其中,(i,j)表示pirna?i-疾病j對,yij表示真實標簽;考慮到同構圖和異構圖之間的共同語義,利用一致性約束來增強它們的通用性;對于pirna嵌入,為了捕獲pirna在不同圖之間的相似性,給出如下約束:

      64、

      65、同樣地,計算疾病的嵌入約束lcd,將交叉熵損失lbce、一致性約束lcp和lcd加權結合得到最終損失l:

      66、l=lbce+λlcp+λlcd

      67、其中λ是平衡這三項的超參數(shù)。

      68、本發(fā)明的一種基于異構圖的多邊類型圖卷積網絡預測pirna-疾病關聯(lián)性裝置,包括:

      69、圖構建模塊,利用pirna相似性矩陣和疾病相似性矩陣構建pirna相似同構圖和疾病相似同構圖,并利用pirna-疾病關聯(lián)關系數(shù)據(jù)構建pirna-疾病關聯(lián)異構圖;

      70、特征學習模塊,利用圖卷積神經網絡分別從pirna相似同構圖和疾病相似同構圖學習pirna和疾病的同構嵌入特征,并利用基于異構圖的多邊類型圖卷積網絡從pirna-疾病關聯(lián)異構圖學習pirna和疾病的異構嵌入特征;

      71、注意力融合模塊,利用注意力機制分別融合pirna和疾病的同構嵌入特征和異構嵌入特征,獲得pirna和疾病的融合嵌入特征;

      72、關聯(lián)預測模塊,將pirna和疾病的融合嵌入特征水平拼接構成pirna-疾病對特征,利用多層感知機預測pirna-疾病對的關聯(lián)性。

      73、本發(fā)明的一種基于異構圖的多邊類型圖卷積網絡預測pirna-疾病關聯(lián)性設備,其特征在于,包括存儲器、處理器以及儲存在存儲器上并可在處理器上運行的計算機程序,處理器執(zhí)行計算機程序時執(zhí)行權利要求1-8中任一項所述的方法步驟。

      74、本發(fā)明提供的基于異構圖的多邊類型圖卷積網絡預測pirna-疾病關聯(lián)性方法有益效果在于:

      75、一、本發(fā)明提供的基于異構圖的多邊類型圖卷積網絡預測pirna-疾病關聯(lián)性方法,充分利用了pirna和疾病的各種相似數(shù)據(jù),并充分考慮了鄰居節(jié)點信息,有效提高了pirna-疾病關聯(lián)預測的準確性。

      76、二、本發(fā)明提供的基于異構圖的多邊類型圖卷積網絡預測pirna-疾病關聯(lián)性方法,使用五折交叉驗證和案例驗證來評估,五折交叉驗證中實現(xiàn)了0.9292的auc和0.5006的aupr。

      當前第1頁1 2 
      網友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1