国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法

      文檔序號(hào):10613123閱讀:424來(lái)源:國(guó)知局
      一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法
      【專(zhuān)利摘要】本發(fā)明公開(kāi)一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法,解決分析生物網(wǎng)絡(luò)中蛋白質(zhì)相互作用并求取蛋白質(zhì)復(fù)合物的問(wèn)題。該方法將蛋白質(zhì)生物網(wǎng)絡(luò)構(gòu)建成圖模型,依據(jù)給定的種子頂點(diǎn)和蛋白質(zhì)間的相互作用,結(jié)合蛋白質(zhì)集群適應(yīng)度和蛋白質(zhì)頂點(diǎn)適應(yīng)度的求解方法,分析蛋白質(zhì)間的相互作用,求解蛋白質(zhì)復(fù)合物。本發(fā)明能夠形成解決在生物網(wǎng)絡(luò)中求取蛋白質(zhì)復(fù)合物問(wèn)題的方案,使蛋白質(zhì)復(fù)合物求取問(wèn)題在解決過(guò)程的準(zhǔn)確性和高效性方面得到保障。
      【專(zhuān)利說(shuō)明】
      一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法
      技術(shù)領(lǐng)域
      [0001] 本發(fā)明涉及一種蛋白質(zhì)復(fù)合物求取方法,主要利用蛋白質(zhì)間相互作用的關(guān)系,結(jié) 合蛋白質(zhì)集群適應(yīng)度和蛋白質(zhì)頂點(diǎn)適應(yīng)度求解蛋白質(zhì)復(fù)合物,屬于計(jì)算機(jī)技術(shù)、生物技術(shù) 等交叉技術(shù)應(yīng)用領(lǐng)域。
      【背景技術(shù)】
      [0002] 生物網(wǎng)絡(luò),是由化合物、蛋白質(zhì)分子以及蛋白質(zhì)間相互作用關(guān)系組成的生物結(jié)構(gòu)。 生物網(wǎng)絡(luò)視角提供了一組可用于分析整個(gè)生物體系結(jié)構(gòu)的方法,并且提供了一系列理論用 以說(shuō)明從這些結(jié)構(gòu)中觀(guān)察到的模式。生物網(wǎng)絡(luò)技術(shù)也應(yīng)用與大多數(shù)科學(xué)試驗(yàn)中,如酵母雙 雜交系統(tǒng),質(zhì)譜法和蛋白質(zhì)芯片技術(shù)。
      [0003] 在新的時(shí)代,最重要的挑戰(zhàn)之一是分析蛋白間相互作用,并鑒定出蛋白質(zhì)復(fù)合物。 分析蛋白間相互作用有助于理解某些生物過(guò)程和預(yù)測(cè)蛋白質(zhì)功能。本發(fā)明采用重疊聚類(lèi)算 法,引入蛋白質(zhì)適應(yīng)度的求取方法,形成蛋白質(zhì)復(fù)合物組成的方案。重疊聚類(lèi)算法是一種尋 找擁有最佳適應(yīng)度的蛋白質(zhì)集群的方法。蛋白質(zhì)適應(yīng)度求取方法是選擇組成復(fù)合物蛋白質(zhì) 的關(guān)鍵方法。本發(fā)明能夠形成解決在生物網(wǎng)絡(luò)中求取蛋白質(zhì)復(fù)合物問(wèn)題的方案,使蛋白質(zhì) 復(fù)合物求取問(wèn)題在解決過(guò)程的準(zhǔn)確性和高效性方面得到保障。
      [0004] 本發(fā)明給出一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法,解決分析生物網(wǎng)絡(luò)中的 蛋白質(zhì)相互作用并求取蛋白質(zhì)復(fù)合物的問(wèn)題。該方法將蛋白質(zhì)生物網(wǎng)絡(luò)構(gòu)建成圖模型,依 據(jù)給定的種子頂點(diǎn)和蛋白質(zhì)間的相互作用,結(jié)合蛋白質(zhì)集群適應(yīng)度和蛋白質(zhì)頂點(diǎn)適應(yīng)度的 求解方法,分析蛋白質(zhì)間的相互作用,求解蛋白質(zhì)復(fù)合物。

      【發(fā)明內(nèi)容】

      [0005] 技術(shù)問(wèn)題:本發(fā)明要解決生物網(wǎng)絡(luò)中的蛋白質(zhì)復(fù)合物求取問(wèn)題,該問(wèn)題是指給定 一個(gè)生物網(wǎng)絡(luò)模型,包括蛋白質(zhì)頂點(diǎn)集,蛋白質(zhì)間的相互作用關(guān)系和種子頂點(diǎn)的集合,從中 選擇部分蛋白質(zhì)組成蛋白質(zhì)復(fù)合物,使該復(fù)合物中的蛋白質(zhì)能夠相互適應(yīng),并使該復(fù)合物 擁最佳適應(yīng)能力。
      [0006] 技術(shù)方案:所述生物網(wǎng)絡(luò)中的蛋白質(zhì)復(fù)合物求取問(wèn)題描述如下:給定一個(gè)生物網(wǎng) 絡(luò)模型G(V,E,W),該模型包括頂點(diǎn)集V,邊集E和蛋白質(zhì)間相互作用關(guān)系集合W。給定必要蛋 白質(zhì)集EP、蛋白質(zhì)適應(yīng)度的臨界值t和頂點(diǎn)適應(yīng)度臨界值t m。該任務(wù)首先需要計(jì)算必要蛋白 質(zhì)圖Ge中子圖的蛋白質(zhì)適應(yīng)度,構(gòu)建必要子圖集合Se,然后計(jì)算每個(gè)必要子圖Si中每個(gè)頂點(diǎn) 的適應(yīng)度f(wàn)em,選出最大必要蛋白質(zhì)P em,求取必要圖Ce;其次要計(jì)算非必要蛋白質(zhì)圖Gn中子圖 的蛋白質(zhì)適應(yīng)度,構(gòu)建非必要子圖集合3",然后計(jì)算每個(gè)必要子圖S,中每個(gè)頂點(diǎn)的適應(yīng)度 fnm,選出最大非必要蛋白質(zhì)Pnm,求取非必要圖Cn;最后求取必要圖Ce和非必要圖C n合并后得 到的答案圖C,即要求取的蛋白質(zhì)復(fù)合物。在構(gòu)建圖模型過(guò)程中,把每個(gè)蛋白質(zhì)看作一個(gè)節(jié) 點(diǎn),邊的權(quán)值定義為蛋白質(zhì)間相互作用的強(qiáng)度,邊的權(quán)值越大,蛋白質(zhì)間相互作用越強(qiáng);邊 的權(quán)值越小,蛋白質(zhì)間的相互作用越弱。
      [0007] 該方法包括以下步驟:
      [0008] 步驟1)用戶(hù)輸入圖信息,建立圖模型G(V,E,W):根據(jù)用戶(hù)輸入圖信息,建立頂點(diǎn)集 V,邊集E和邊權(quán)集合W,得到圖模型G(V,E,W);
      [0009] 步驟2)構(gòu)建必要子圖集合Se:求取必要蛋白質(zhì)圖Ge,從圖Ge中選取適應(yīng)度ti符合條 件的頂點(diǎn)構(gòu)建成子圖Si,所有子圖&構(gòu)成必要子圖集合
      [0010] 步驟3)構(gòu)造必要圖Ce:篩選最大必要蛋白質(zhì)Pem,把適應(yīng)度f(wàn)em符合條件的最大必要 蛋白質(zhì)加入臨時(shí)圖Η,符合條件的臨時(shí)圖Η加入必要圖Ce ;
      [0011] 步驟4)構(gòu)建非必要子圖集合Sn:求取非必要蛋白質(zhì)圖Gn,從圖Gn中選取適應(yīng)度ti符 合條件的頂點(diǎn)構(gòu)建成子圖Si,所有子圖&構(gòu)成非必要子圖集合S n;
      [0012] 步驟5)構(gòu)造非必要圖Cn:篩選最大非必要蛋白質(zhì)Pnm,把適應(yīng)度f(wàn)nm符合條件的最大 非必要蛋白質(zhì)Pnm加入臨時(shí)圖H,符合條件的臨時(shí)圖Η加入非必要圖C n;
      [0013] 步驟6)求取答案圖C:求取非必要圖GjP必要圖Ge的并集,得到答案圖C。
      [0014] 其中:
      [0015] 所述的步驟1)用戶(hù)輸入圖信息,建立圖模型G(V,E,W),具體為:
      [0016] 步驟11)用戶(hù)輸入圖G(V,E,W)的頂點(diǎn)集V和邊集E,以及邊權(quán)集合W;所述頂點(diǎn)集V = {vi,V2, · · ·,Vn};邊集E= {ei(Vi,Vj),e2(Vi,Vj),· · ·,em(Vi,Vj)},邊集E中的每個(gè)元素 e(Vi, Vj)代表連接頂點(diǎn)Vi和頂點(diǎn)Vj的邊;邊權(quán)集合W= |wi(Vi,Vj) ,W2(Vi,Vj) , . . . ,Wm(Vi,Vj)},邊權(quán) 集合W中的每個(gè)元素 W(Vi,Vj)代表邊6(>:1,¥」)的權(quán)重,所述11代表頂點(diǎn)個(gè)數(shù),1]1代表邊數(shù),;[和」 代表不同頂點(diǎn)的下標(biāo),i和j是1到η之間的整數(shù);
      [0017] 步驟12)用戶(hù)輸入必要蛋白質(zhì)集ΕΡ、蛋白質(zhì)適應(yīng)度的臨界值t和頂點(diǎn)適應(yīng)度臨界值 U;所述必要蛋白質(zhì)集EP,是指用戶(hù)指定必須存在的蛋白質(zhì)頂點(diǎn)的集合;所述蛋白質(zhì)的適應(yīng) 度,是指蛋白質(zhì)集群在圖G(V,E,W)中適應(yīng)能力;所述頂點(diǎn)適應(yīng)度,是指蛋白質(zhì)頂點(diǎn)在圖G(V, E,W)中的適應(yīng)能力;所述蛋白質(zhì)適應(yīng)度的臨界值t,是指蛋白質(zhì)子圖的適應(yīng)度不能低于所給 臨界值t;所述頂點(diǎn)適應(yīng)度臨界值U,是指頂點(diǎn)的適應(yīng)度不能低于所給臨界值U。
      [0018] 所述的步驟2)構(gòu)建必要子圖集合&,具體為:
      [0019] 步驟21)把不屬于必要蛋白質(zhì)集EP的頂點(diǎn)Vi從圖G(V,E,W)中移走,得到必要蛋白 質(zhì)圖Ge;
      [0020] 步驟22)選出圖Ge中頂點(diǎn)個(gè)數(shù)大于1并且適應(yīng)度^大于種子適應(yīng)度臨界值U的子圖 Si,并把所有符合條件的子圖Si加入到必要子圖集合S沖;所述適應(yīng)度,是指子圖Si對(duì)應(yīng)的 適應(yīng)度,其計(jì)算公式為
      其中表示頂點(diǎn)V在圖腫的 入度權(quán)重,入度權(quán)重4是指在圖Η中與頂點(diǎn)ν直接相連的邊權(quán)和,其計(jì)算公式為:
      良示頂點(diǎn)ν在圖Η中的出度權(quán)重,0是指在圖Η 外與頂點(diǎn)ν直接相連的邊權(quán)和,其計(jì)算公式為:
      ;所述子圖S,, 是指頂點(diǎn)集和邊集分別是圖Ge的頂點(diǎn)集的子集和邊集的子集的圖;所述必要子圖集合Se,是 指包含所有子圖Si的集合;
      [0021] 步驟23)對(duì)必要子圖集合&中的每個(gè)子圖Si排序,按子圖規(guī)模和適應(yīng)度進(jìn)行非 遞增排序,即按子圖Si的規(guī)模從小到大排序,如果規(guī)模相等,按子圖51的適應(yīng)度從小到大排 序;所述子圖31的規(guī)模,是指子圖&中包含的頂點(diǎn)個(gè)數(shù)的大?。?br>[0022] 步驟24)建立一個(gè)必要圖Ce,初始化必要圖Ce為空,即Ce=〇。
      [0023] 所述的步驟3)構(gòu)造必要圖Ce,具體為:
      [0024]步驟31)如果必要子圖集合Se為空,跳轉(zhuǎn)到步驟4);
      [0025]步驟32)按先后順序從必要子圖集合S沖取出每個(gè)子圖Si,令臨時(shí)圖H = Si;找到臨 時(shí)圖Η的鄰居集合N;所述臨時(shí)圖H,是指用來(lái)表示一個(gè)指定圖的變量;所述臨時(shí)圖Η的鄰居集 合Ν,是指臨時(shí)圖Η中所有頂點(diǎn)鄰居的集合;初始化標(biāo)記變量flag = true ;所述標(biāo)記變量 flag,是指一個(gè)布爾型變量;
      [0026] 步驟33)如果標(biāo)記變量flag = false,跳轉(zhuǎn)到步驟3),在鄰居集合N中選出最大必要 蛋白質(zhì)Pem,所述最大必要蛋白質(zhì)Pem,是指在鄰居集合N中適應(yīng)度f(wàn)em最大的必要蛋白質(zhì),其 中,必要蛋白質(zhì)的適應(yīng)度f(wàn)em的計(jì)算公式為:= ,如果最大適應(yīng)度f(wàn)em不大于0, 跳轉(zhuǎn)到步驟35);
      [0027]步驟34)把最大必要蛋白質(zhì)Pem加入臨時(shí)圖Η中,更新鄰居集合N,返回步驟33);
      [0028] 步驟35)在鄰居集合Ν中選出最大非必要蛋白質(zhì)Pnm,所述最大非必要蛋白質(zhì)Pnm,是 指示在鄰居集合N中適應(yīng)度f(wàn)r?最大的非必要蛋白質(zhì);其中,非必要蛋白質(zhì)的適應(yīng)度f(wàn)nm的計(jì) 算公式為:;^1? = ;^+^丨-:^^1?丨;如果最大適應(yīng)度;^111不大于蛋白質(zhì)適應(yīng)度的臨界值1:,跳轉(zhuǎn)到 步驟37);
      [0029] 步驟36)把蛋白質(zhì)P?加入臨時(shí)圖Η中,更新鄰居集合N;返回步驟33);
      [0030] 步驟3 7)把臨時(shí)圖Η加入必要圖Ce中,把含有臨時(shí)圖Η中頂點(diǎn)的子圖Si從子圖集合Se 中移除;把標(biāo)記變量flag更新為false,即flag = false,返回步驟33)。
      [0031] 所述的步驟4)構(gòu)建必要子圖集合Sn,具體為:
      [0032]步驟41)移除圖G中屬于圖Ge的蛋白質(zhì)頂點(diǎn),得到非必要蛋白質(zhì)圖Gn;
      [0033] 步驟42)把非必要蛋白質(zhì)圖Gn中的所有頂點(diǎn)數(shù)大于1并且適應(yīng)度大于種子適應(yīng)度 臨界值U的子圖Si加入到非必要子圖集合5"中;所述子圖5 1,是指頂點(diǎn)集和邊集分別是非必 要蛋白質(zhì)圖6"的頂點(diǎn)集的子集和邊集的子集的圖;所述非必要子圖集合Sn,是指包含所有子 圖Si的集合;
      [0034] 步驟43)對(duì)非必要子圖集合Sn中的每個(gè)子圖Si排序,按子圖51的規(guī)模和適應(yīng)度進(jìn)行 非遞增排序;
      [0035] 步驟44)建立一個(gè)非必要圖Cn,初始化圖Cn為空,即Cn = Φ。
      [0036] 所述的步驟5)構(gòu)造非必要圖Cn,具體為:
      [0037] 步驟51)如果非必要子圖集合Sn為空,跳轉(zhuǎn)到步驟6);
      [0038]步驟52)按先后順序從非必要子圖集合Sn*取出每個(gè)子圖Si,令臨時(shí)圖H=Si;找到 臨時(shí)圖Η的鄰居集合N,初始化標(biāo)記變量f lag = true;
      [0039] 步驟53)如果標(biāo)記變量flag = false,跳轉(zhuǎn)到步驟5),在鄰居集合N中選出最大非必 要蛋白質(zhì)Ρ?,如果最大適應(yīng)度不大于0,跳轉(zhuǎn)到步驟55);
      [0040]步驟54)把蛋白質(zhì)P?加入臨時(shí)圖Η中,更新鄰居集合N,返回步驟53);
      [0041 ]步驟55)在鄰居集合Ν中選出最大必要蛋白質(zhì)Pem,如果最大適應(yīng)度f(wàn)em不大于蛋白 質(zhì)適應(yīng)度的臨界值t,跳轉(zhuǎn)到步驟57);
      [0042]步驟56)把蛋白質(zhì)pem加入子圖Η中,更新鄰居集合N,返回步驟53);
      [0043] 步驟57)把子圖Η加入到非必要圖(:沖,把含有子圖Η中頂點(diǎn)的子圖Si從子圖集合Sn 中移除,把標(biāo)記變量flag更新為false,即flag = false,返回步驟53)。
      [0044] 所述的步驟6)求取答案圖C,具體為:
      [0045] 步驟61)求取非必要圖G4P必要圖Ge的并集,圖Gn和圖Ge的并集即為答案圖C,即C = CeUCn;
      [0046] 步驟62)得到答案圖C。
      [0047] 有益效果:本發(fā)明利用圖算法形成高效的生物網(wǎng)絡(luò)蛋白質(zhì)復(fù)合物求取方法。具體 體現(xiàn)如下有益效果:
      [0048] 1)本發(fā)明提供一種生物網(wǎng)絡(luò)蛋白質(zhì)復(fù)合物求取方法,其完整的方法過(guò)程包括將生 物網(wǎng)絡(luò)中的復(fù)合物、蛋白質(zhì)及蛋白質(zhì)間相互作用的關(guān)系定義成圖模型、采用重疊聚類(lèi)算法 獲得答案圖。
      [0049] 2)本發(fā)明中所述建模過(guò)程中,提供一個(gè)或一套較為抽象的圖模型,能夠?qū)?shí)際問(wèn) 題中的相關(guān)求解方法轉(zhuǎn)化為數(shù)學(xué)化的模型形式。
      [0050] 3)本發(fā)明中引入了適應(yīng)度的概念,把復(fù)雜的問(wèn)題簡(jiǎn)單化,便于理解算法思想和求 解答案圖,使蛋白質(zhì)復(fù)合物求解問(wèn)題最終能夠得到較優(yōu)精確解。
      【附圖說(shuō)明】
      [0051 ]圖1是基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法流程圖。
      【具體實(shí)施方式】
      [0052]下面對(duì)本發(fā)明附圖的某些實(shí)施例作更加詳細(xì)的描述。
      [0053]根據(jù)附圖1,本發(fā)明【具體實(shí)施方式】為:
      [0054] 1) ·用戶(hù)輸入圖信息,建立圖模型G(V,E,W)。
      [0055] 11).用戶(hù)輸入圖G(V,E,W)的頂點(diǎn)集合V:V={V1, V2,V3,V4,V5};輸入邊集合E:E = {ei(Vl,V2),e2(Vl,V3),e3(V3, V4),e4(V3,V5),e5(V4, V5) };輸入邊權(quán)集合W:W= {wi(Vl,V2),W2 (VI,V3),W3(V3, V4),W4(V3, V5),W5(V4, V5) },其中W1(V1,V2) = 1,W2(V1,V3) = 1,W3(V3,V4) = 2,W4 (V3 , V5 ) 一 3 , W5 ( V4 , V5 ) 一 3〇
      [0056] 12).用戶(hù)輸入必要蛋白質(zhì)集:EP= {vi,V2,V3};輸入蛋白質(zhì)適應(yīng)度的臨界值t = l; 輸入頂點(diǎn)適應(yīng)度臨界值L = L
      [0057] 2).構(gòu)建必要子圖集合Se,具體步驟如下:
      [0058] 21).把不屬于必要蛋白質(zhì)集EP的頂V4和V5從圖G(V,E,W)中移走,得到必要蛋白質(zhì) 圖66乂={¥6而屬}。其中^代表蛋白質(zhì)圖6(3的頂點(diǎn)集力={%^3}瓜代表蛋白質(zhì)圖6 (3 的邊集,Ee= {ei(vi,V2),e2(vi,V3)} 代表蛋白質(zhì)圖Ge的邊權(quán)集合,W e = |ffi(vi,V2),W2(vi, V3)} Ο
      [0059] 22).計(jì)算圖Ge中頂點(diǎn)個(gè)數(shù)大于1的子圖的適應(yīng)度^.,選出適應(yīng)度義大于種子適應(yīng)度 臨界值tm的子圖S,,加入必要子圖集合中。求得i
      .其中 L I ,即4 得到必要子圖集合Se= {&}。
      [0060] 23).對(duì)必要子圖集合Se中的每個(gè)子圖Si按規(guī)模和適應(yīng)度進(jìn)行非遞增排序,得到Se = {Si}〇
      [0061 ] 24).初始化必要圖Ce為空,即Ce=〇。
      [0062] 3).構(gòu)造必要圖Ce。
      [0063 ] 31).從必要子圖集合Se中取出子圖Si,令臨時(shí)圖H= Si。找到臨時(shí)圖Η的鄰居集合N, 求得Ν= {VI,V2,V3}。初始化標(biāo)記變量flag = true。
      [0064] 32).計(jì)算鄰居集合N中必要蛋白質(zhì)的適應(yīng)度,根據(jù)必要蛋白質(zhì)的適應(yīng)度f(wàn)em的計(jì)算 公式fem=fH+{em}-fH-{em},求得
      得到最大必要蛋白質(zhì)Pem = VI。所 求最大必要蛋白質(zhì)VI的適應(yīng)度f(wàn)l小于0。
      [0065] 33).鄰居集合N中不存在非必要蛋白質(zhì)Pnm,默認(rèn)最大非必要蛋白質(zhì)Pnm的適應(yīng)度f(wàn)nm 小于蛋白質(zhì)適應(yīng)度的臨界值t。把臨時(shí)圖Η加入必要圖Ce,得到Ce= {{vi,V2,V3},{ei(vi,V2), e2(vi,V3)},{wi(vi,V2),W2(V1,V3)}},把標(biāo)記變量flag更親jf為false,即flag = false〇
      [0066] 34) .flag值為false,結(jié)束循環(huán)。
      [0067] 4).構(gòu)建必要子圖集合。
      [0068] 41).把屬于必要蛋白質(zhì)集EP的頂點(diǎn)V1,V!^P V3從圖G(V,E,W)中移走,得到非必要蛋 白質(zhì)圖6",6"={¥"311,1}。其中,¥ 11代表蛋白質(zhì)圖611的頂點(diǎn)集,¥11={^,^}$11代表蛋白質(zhì)圖 Gn的邊集,En= {e5(V4,V5)} ;Wn代表蛋白質(zhì)圖Gn的邊權(quán)集合,Wn= {W5(V4,V5)}。
      [0069] 42).計(jì)算圖6"中頂點(diǎn)個(gè)數(shù)大于1的子圖的適應(yīng)度I,選出適應(yīng)度4大于種子適應(yīng)度 臨界值tm的子圖Si,加入非必要子圖集合Sn*。求得
      求得 得到非必要子圖集合3η={&}。
      [0070] 43).對(duì)非必要子圖集合Sn中的每個(gè)子圖Si按規(guī)模和適應(yīng)度進(jìn)行非遞增排序,得到 Sn= {Si} 〇
      [0071] 44).初始化非必要圖Cn為空,gp Cn = Φ。
      [0072] 5).求取非必要圖Cn。
      [0073] 51).從非必要子圖集合Sn中取出子圖Si,令臨時(shí)圖H=Si。找到臨時(shí)圖Η的鄰居集合 Ν,求得N= {v3,V4,V5}。初始化標(biāo)記變量flag = true。
      [0074] 52).計(jì)算鄰居集合N中非必要蛋白質(zhì)的適應(yīng)度,根據(jù)非必要蛋白質(zhì)的適應(yīng)度f(wàn)nm的 計(jì)算公式;^1?=;^+^1-;^^1?1,求得.得到最大必要蛋白質(zhì)Pnm = V4。所求最 大必要蛋白質(zhì)V4的適應(yīng)度f(wàn)4小于0。
      [0075] 53).計(jì)算鄰居集合N中必要蛋白質(zhì)的適應(yīng)度,根據(jù)必要蛋白質(zhì)的適應(yīng)度f(wàn)em的計(jì)算 公式fem = fH+{em}-fH-{em},求得 < =一,求得最大必要蛋白質(zhì)Pnm=V3。 17
      [0076] 54).所求最大必要最大必要蛋白質(zhì)Pnm的適應(yīng)度f(wàn)3不大于蛋白質(zhì)適應(yīng)度的臨界值 t。把臨時(shí)圖Η加入非必要圖Cn,得到Cn= { {V4,V5},{e5(V4,V5) },|ff5(V4,V5)} },把標(biāo)記變量 f lag更新1 為false,艮P flag = false 〇
      [0077] 55) .flag值為false,結(jié)束循環(huán)。
      [0078] 6).求取答案圖C。
      [0079] 61).求取非必要圖Gn和必要圖Ge的合并圖,得到答案圖C,即C = CeUCn。
      [0080] 62).得到答案圖 C(Vc,Ec,Wc),其中,頂點(diǎn)集合Vc={v 1,v2,v3,V4,v5};邊集合E c={el (V1,V2),e2(Vl,V3),e3(V3,V4),e4(V3,V5),e5(V4,V5)};邊權(quán)集合Wc= {wi(Vl,V2),W2(V1,V3),W3 (V3,V4),W4(V3,V5),W5(V4,V5)},W1(V1,V2) = 1,W2(V1,V3) = 1,W3(V3,V4) = 2,W4(V3,V5)=3,W5 (V4 , V5 ) - 3 〇
      【主權(quán)項(xiàng)】
      1. 一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法,其特征在于該方法包括W下步驟: 步驟1)用戶(hù)輸入圖信息,建立圖模型G(V,E,W):根據(jù)用戶(hù)輸入圖信息,建立頂點(diǎn)集V,邊 集E和邊權(quán)集合W,得到圖模型G(V,E,W); 步驟2)構(gòu)建必要子圖集合Se:求取必要蛋白質(zhì)圖Ge,從圖Ge中選取適應(yīng)度ti符合條件的 頂點(diǎn)構(gòu)建成子圖Si,所有子圖Si構(gòu)成必要子圖集合Se; 步驟3)構(gòu)造必要圖Ce:篩選最大必要蛋白質(zhì)Pem,把適應(yīng)度f(wàn)em符合條件的最大必要蛋白 質(zhì)Pem加入臨時(shí)圖Η,符合條件的臨時(shí)圖Η加入必要圖Ce ; 步驟4)構(gòu)建非必要子圖集合Sn:求取非必要蛋白質(zhì)圖Gn,從圖Gn中選取適應(yīng)度ti符合條 件的頂點(diǎn)構(gòu)建成子圖Si,所有子圖Si構(gòu)成非必要子圖集合Sn; 步驟5)構(gòu)造非必要圖Cn:篩選最大非必要蛋白質(zhì)Pnm,把適應(yīng)度f(wàn)nm符合條件的最大非必 要蛋白質(zhì)Ργ?加入臨時(shí)圖H,符合條件的臨時(shí)圖Η加入非必要圖Cn; 步驟6)求取答案圖C:求取非必要圖Gn和必要圖Ge的并集,得到答案圖C。2. 根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法,其特征在于所述的 步驟1)用戶(hù)輸入圖信息,建立圖模型G(V,E,W),具體為: 步驟11)用戶(hù)輸入圖G(V,E,W)的頂點(diǎn)集V和邊集E,W及邊權(quán)集合W;所述頂點(diǎn)集V={vi, V2, . . .,Vn};邊集E= {ei(Vi,Vj) ,e2(Vi,Vj), . . . ,em(Vi,Vj)},邊集E中的每個(gè)元素 e(Vi,Vj)代 表連接頂點(diǎn)Vi和頂點(diǎn)Vj的邊;邊權(quán)集合W= {wi(Vi,Vj) ,W2(Vi,Vj) , . . . ,Wm(Vi,Vj)},邊權(quán)集合W 中的每個(gè)元素 w(Vi,Vj)代表邊e(Vi,Vj)的權(quán)重,所述η代表頂點(diǎn)個(gè)數(shù),m代表邊數(shù),i和j代表 不同頂點(diǎn)的下標(biāo),i和j是1到η之間的整數(shù); 步驟12)用戶(hù)輸入必要蛋白質(zhì)集ΕΡ、蛋白質(zhì)適應(yīng)度的臨界值t和頂點(diǎn)適應(yīng)度臨界值U;所 述必要蛋白質(zhì)集EP,是指用戶(hù)指定必須存在的蛋白質(zhì)頂點(diǎn)的集合;所述蛋白質(zhì)的適應(yīng)度,是 指蛋白質(zhì)集群在圖G(V,E,W)中適應(yīng)能力;所述頂點(diǎn)適應(yīng)度,是指蛋白質(zhì)頂點(diǎn)在圖G(V,E,W) 中的適應(yīng)能力;所述蛋白質(zhì)適應(yīng)度的臨界值t,是指蛋白質(zhì)子圖的適應(yīng)度不能低于所給臨界 值t;所述頂點(diǎn)適應(yīng)度臨界值U,是指頂點(diǎn)的適應(yīng)度不能低于所給臨界值tm。3. 根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法,其特征在于所述的 步驟2)構(gòu)建必要子圖集合Se,具體為: 步驟21)把不屬于必要蛋白質(zhì)集EP的頂點(diǎn)VI從圖G(V,E,W)中移走,得到必要蛋白質(zhì)圖 Ge; 步驟22)選出圖Ge中頂點(diǎn)個(gè)數(shù)大于1并且適應(yīng)度ti大于種子適應(yīng)度臨界值tm的子圖Si,并 把所有符合條件的子圖Si加入到必要子圖集合Se中;所述適應(yīng)度ti,是指子圖Si對(duì)應(yīng)的適應(yīng) 度,其計(jì)算公式為:其中《(Μ ^表示頂點(diǎn)V在圖Η中的入度 權(quán)重,入度權(quán)重逆是指在圖Η中與頂點(diǎn)V直接相連的邊權(quán)和,其計(jì)算公式為:表示頂點(diǎn)V在圖Η中的出度權(quán)重,Ml/)是指在圖Η 外與頂點(diǎn)V直接相連的邊權(quán)和,其計(jì)算公式為巧述子圖Si, 是指頂點(diǎn)集和邊集分別是圖Ge的頂點(diǎn)集的子集和邊集的子集的圖;所述必要子圖集合Se,是 指包含所有子圖Si的集合; 步驟23)對(duì)必要子圖集合Se中的每個(gè)子圖Si排序,按子圖Si的規(guī)模和適應(yīng)度進(jìn)行非遞增 排序,即按子圖Si的規(guī)模從小到大排序,如果規(guī)模相等,按子圖Si的適應(yīng)度從小到大排序;所 述子圖Si的規(guī)模,是指子圖Si中包含的頂點(diǎn)個(gè)數(shù)的大??; 步驟24 )建立一個(gè)必要圖Ce,初始化必要圖Ce為空,即Ce = Φ。4. 根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法,其特征在于所述的 步驟3)構(gòu)造必要圖Ce,具體為: 步驟31)如果必要子圖集合Se為空,跳轉(zhuǎn)到步驟4); 步驟32)按先后順序從必要子圖集合S沖取出每個(gè)子圖Si,令臨時(shí)圖H=Si;找到臨時(shí)圖 Η的鄰居集合N;所述臨時(shí)圖H,是指用來(lái)表示一個(gè)指定圖的變量;所述臨時(shí)圖Η的鄰居集合N, 是指臨時(shí)圖Η中所有頂點(diǎn)鄰居的集合;初始化標(biāo)記變量flag =化ue;所述標(biāo)記變量flag,是 指一個(gè)布爾型變量; 步驟33)如果標(biāo)記變量flag = false,跳轉(zhuǎn)到步驟3),在鄰居集合N中選出最大必要蛋白 質(zhì)Pem,所述最大必要蛋白質(zhì)Pem,是指在鄰居集合N中適應(yīng)度f(wàn)em最大的必要蛋白質(zhì),其中,必 要蛋白質(zhì)的適應(yīng)度f(wàn)em的計(jì)算公式為:fem = fH+W-fH-{em},如果最大適應(yīng)度f(wàn)em不大于0,跳轉(zhuǎn) 到步驟35); 步驟34)把最大必要蛋白質(zhì)Pem加入臨時(shí)圖Η中,更新鄰居集合N,返回步驟33); 步驟35)在鄰居集合Ν中選出最大非必要蛋白質(zhì)Pnm,所述最大非必要蛋白質(zhì)Pnm,是指示 在鄰居集合N中適應(yīng)度f(wàn)nm最大的非必要蛋白質(zhì);其中,非必要蛋白質(zhì)的適應(yīng)度f(wàn)nm的計(jì)算公 式為:片111=扣+{。111}-扣-{。111};如果最大適應(yīng)度片111不大于蛋白質(zhì)適應(yīng)度的臨界值1:,跳轉(zhuǎn)到步驟 37); 步驟36 )把蛋白質(zhì)Pnm加入臨時(shí)圖Η中,更新鄰居集合N;返回步驟33 ); 步驟37)把臨時(shí)圖Η加入必要圖Ce中,把含有臨時(shí)圖Η中頂點(diǎn)的子圖Si從子圖集合Se中移 除;把標(biāo)記變量flag更新為false,即flag = false,返回步驟33)。5. 根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法,其特征在于所述的 步驟4)構(gòu)建必要子圖集合Sn,具體為: 步驟41)移除圖G中屬于圖Ge的蛋白質(zhì)頂點(diǎn),得到非必要蛋白質(zhì)圖Gn; 步驟42)把非必要蛋白質(zhì)圖Gn中的所有頂點(diǎn)數(shù)大于1并且適應(yīng)度大于種子適應(yīng)度臨界值 U的子圖Si加入到非必要子圖集合Sn中;所述子圖Si,是指頂點(diǎn)集和邊集分別是非必要蛋白 質(zhì)圖Gn的頂點(diǎn)集的子集和邊集的子集的圖;所述非必要子圖集合Sn,是指包含所有子圖Si的 集合; 步驟43)對(duì)非必要子圖集合Sn中的每個(gè)子圖Si排序,按子圖Si的規(guī)模和適應(yīng)度進(jìn)行非遞 增排序; 步驟44)建立一個(gè)非必要圖Cn,初始化圖Cn為空,即Cn=〇。6. 根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法,其特征在于所述的 步驟5)構(gòu)造非必要圖Cn,具體為: 步驟51)如果非必要子圖集合Sn為空,跳轉(zhuǎn)到步驟6); 步驟52)按先后順序從非必要子圖集合Sn中取出每個(gè)子圖Si,令臨時(shí)圖H = Si;找到臨時(shí) 圖Η的鄰居集合N,初始化標(biāo)記變量f lag = true; 步驟53)如果標(biāo)記變量flag = false,跳轉(zhuǎn)到步驟5),在鄰居集合Ν中選出最大非必要蛋 白質(zhì)Pr?,如果最大適應(yīng)度f(wàn)nm不大于ο,跳轉(zhuǎn)到步驟55 ); 步驟54)把蛋白質(zhì)Pnm加入臨時(shí)圖Η中,更新鄰居集合N,返回步驟53); 步驟55)在鄰居集合Ν中選出最大必要蛋白質(zhì)Pem,如果最大適應(yīng)度f(wàn)em不大于蛋白質(zhì)適應(yīng) 度的臨界值t,跳轉(zhuǎn)到步驟57); 步驟56)把蛋白質(zhì)Pem加入子圖Η中,更新鄰居集合N,返回步驟53); 步驟57)把子圖助日入到非必要圖Cn中,把含有子圖Η中頂點(diǎn)的子圖Si從子圖集合Sn中移 除,把標(biāo)記變量flag更新為化Ise,即flag =化Ise,返回步驟53)。7.根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法,其特征在于所述的 步驟6)求取答案圖C,具體為: 步驟61)求取非必要圖Gn和必要圖Ge的并集,圖Gn和圖Ge的并集即為答案圖C,即C = CeU Cn; 步驟62)得到答案圖C。
      【文檔編號(hào)】G06F19/12GK105975804SQ201610281013
      【公開(kāi)日】2016年9月28日
      【申請(qǐng)日】2016年4月29日
      【發(fā)明人】田思明, 陳志 , 岳文靜, 陳雨詩(shī), 王宇虹, 卜杰, 陳志遠(yuǎn)
      【申請(qǐng)人】南京郵電大學(xué)
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1