一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法

文檔序號(hào)：10613123閱讀：424來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法，解決分析生物網(wǎng)絡(luò)中蛋白質(zhì)相互作用并求取蛋白質(zhì)復(fù)合物的問(wèn)題。該方法將蛋白質(zhì)生物網(wǎng)絡(luò)構(gòu)建成圖模型，依據(jù)給定的種子頂點(diǎn)和蛋白質(zhì)間的相互作用，結(jié)合蛋白質(zhì)集群適應(yīng)度和蛋白質(zhì)頂點(diǎn)適應(yīng)度的求解方法，分析蛋白質(zhì)間的相互作用，求解蛋白質(zhì)復(fù)合物。本發(fā)明能夠形成解決在生物網(wǎng)絡(luò)中求取蛋白質(zhì)復(fù)合物問(wèn)題的方案，使蛋白質(zhì)復(fù)合物求取問(wèn)題在解決過(guò)程的準(zhǔn)確性和高效性方面得到保障。
【專(zhuān)利說(shuō)明】
一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及一種蛋白質(zhì)復(fù)合物求取方法，主要利用蛋白質(zhì)間相互作用的關(guān)系，結(jié) 合蛋白質(zhì)集群適應(yīng)度和蛋白質(zhì)頂點(diǎn)適應(yīng)度求解蛋白質(zhì)復(fù)合物，屬于計(jì)算機(jī)技術(shù)、生物技術(shù) 等交叉技術(shù)應(yīng)用領(lǐng)域。
【背景技術(shù)】
[0002] 生物網(wǎng)絡(luò)，是由化合物、蛋白質(zhì)分子以及蛋白質(zhì)間相互作用關(guān)系組成的生物結(jié)構(gòu)。生物網(wǎng)絡(luò)視角提供了一組可用于分析整個(gè)生物體系結(jié)構(gòu)的方法，并且提供了一系列理論用以說(shuō)明從這些結(jié)構(gòu)中觀(guān)察到的模式。生物網(wǎng)絡(luò)技術(shù)也應(yīng)用與大多數(shù)科學(xué)試驗(yàn)中，如酵母雙雜交系統(tǒng)，質(zhì)譜法和蛋白質(zhì)芯片技術(shù)。
[0003] 在新的時(shí)代，最重要的挑戰(zhàn)之一是分析蛋白間相互作用，并鑒定出蛋白質(zhì)復(fù)合物。分析蛋白間相互作用有助于理解某些生物過(guò)程和預(yù)測(cè)蛋白質(zhì)功能。本發(fā)明采用重疊聚類(lèi)算法，引入蛋白質(zhì)適應(yīng)度的求取方法，形成蛋白質(zhì)復(fù)合物組成的方案。重疊聚類(lèi)算法是一種尋找擁有最佳適應(yīng)度的蛋白質(zhì)集群的方法。蛋白質(zhì)適應(yīng)度求取方法是選擇組成復(fù)合物蛋白質(zhì) 的關(guān)鍵方法。本發(fā)明能夠形成解決在生物網(wǎng)絡(luò)中求取蛋白質(zhì)復(fù)合物問(wèn)題的方案，使蛋白質(zhì) 復(fù)合物求取問(wèn)題在解決過(guò)程的準(zhǔn)確性和高效性方面得到保障。
[0004] 本發(fā)明給出一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法，解決分析生物網(wǎng)絡(luò)中的蛋白質(zhì)相互作用并求取蛋白質(zhì)復(fù)合物的問(wèn)題。該方法將蛋白質(zhì)生物網(wǎng)絡(luò)構(gòu)建成圖模型，依據(jù)給定的種子頂點(diǎn)和蛋白質(zhì)間的相互作用，結(jié)合蛋白質(zhì)集群適應(yīng)度和蛋白質(zhì)頂點(diǎn)適應(yīng)度的求解方法，分析蛋白質(zhì)間的相互作用，求解蛋白質(zhì)復(fù)合物。

【發(fā)明內(nèi)容】

[0005] 技術(shù)問(wèn)題:本發(fā)明要解決生物網(wǎng)絡(luò)中的蛋白質(zhì)復(fù)合物求取問(wèn)題，該問(wèn)題是指給定一個(gè)生物網(wǎng)絡(luò)模型，包括蛋白質(zhì)頂點(diǎn)集，蛋白質(zhì)間的相互作用關(guān)系和種子頂點(diǎn)的集合，從中選擇部分蛋白質(zhì)組成蛋白質(zhì)復(fù)合物，使該復(fù)合物中的蛋白質(zhì)能夠相互適應(yīng)，并使該復(fù)合物擁最佳適應(yīng)能力。
[0006] 技術(shù)方案:所述生物網(wǎng)絡(luò)中的蛋白質(zhì)復(fù)合物求取問(wèn)題描述如下：給定一個(gè)生物網(wǎng) 絡(luò)模型G(V，E，W)，該模型包括頂點(diǎn)集V，邊集E和蛋白質(zhì)間相互作用關(guān)系集合W。給定必要蛋白質(zhì)集EP、蛋白質(zhì)適應(yīng)度的臨界值t和頂點(diǎn)適應(yīng)度臨界值t m。該任務(wù)首先需要計(jì)算必要蛋白質(zhì)圖Ge中子圖的蛋白質(zhì)適應(yīng)度，構(gòu)建必要子圖集合Se，然后計(jì)算每個(gè)必要子圖Si中每個(gè)頂點(diǎn) 的適應(yīng)度f(wàn)em，選出最大必要蛋白質(zhì)P em，求取必要圖Ce;其次要計(jì)算非必要蛋白質(zhì)圖Gn中子圖的蛋白質(zhì)適應(yīng)度，構(gòu)建非必要子圖集合3"，然后計(jì)算每個(gè)必要子圖S,中每個(gè)頂點(diǎn)的適應(yīng)度 fnm，選出最大非必要蛋白質(zhì)Pnm，求取非必要圖Cn;最后求取必要圖Ce和非必要圖C n合并后得到的答案圖C，即要求取的蛋白質(zhì)復(fù)合物。在構(gòu)建圖模型過(guò)程中，把每個(gè)蛋白質(zhì)看作一個(gè)節(jié) 點(diǎn)，邊的權(quán)值定義為蛋白質(zhì)間相互作用的強(qiáng)度，邊的權(quán)值越大，蛋白質(zhì)間相互作用越強(qiáng);邊的權(quán)值越小，蛋白質(zhì)間的相互作用越弱。
[0007] 該方法包括以下步驟：
[0008] 步驟1)用戶(hù)輸入圖信息，建立圖模型G(V，E，W):根據(jù)用戶(hù)輸入圖信息，建立頂點(diǎn)集 V，邊集E和邊權(quán)集合W，得到圖模型G(V，E，W);
[0009] 步驟2)構(gòu)建必要子圖集合Se:求取必要蛋白質(zhì)圖Ge，從圖Ge中選取適應(yīng)度ti符合條件的頂點(diǎn)構(gòu)建成子圖Si，所有子圖&構(gòu)成必要子圖集合
[0010] 步驟3)構(gòu)造必要圖Ce:篩選最大必要蛋白質(zhì)Pem，把適應(yīng)度f(wàn)em符合條件的最大必要蛋白質(zhì)加入臨時(shí)圖Η，符合條件的臨時(shí)圖Η加入必要圖Ce ;
[0011] 步驟4)構(gòu)建非必要子圖集合Sn:求取非必要蛋白質(zhì)圖Gn，從圖Gn中選取適應(yīng)度ti符合條件的頂點(diǎn)構(gòu)建成子圖Si，所有子圖&構(gòu)成非必要子圖集合S n;
[0012] 步驟5)構(gòu)造非必要圖Cn:篩選最大非必要蛋白質(zhì)Pnm，把適應(yīng)度f(wàn)nm符合條件的最大非必要蛋白質(zhì)Pnm加入臨時(shí)圖H，符合條件的臨時(shí)圖Η加入非必要圖C n;
[0013] 步驟6)求取答案圖C:求取非必要圖GjP必要圖Ge的并集，得到答案圖C。
[0014] 其中：
[0015] 所述的步驟1)用戶(hù)輸入圖信息，建立圖模型G(V，E，W)，具體為：
[0016] 步驟11)用戶(hù)輸入圖G(V，E，W)的頂點(diǎn)集V和邊集E，以及邊權(quán)集合W;所述頂點(diǎn)集V = {vi，V2, · · ·，Vn};邊集E= {ei(Vi，Vj)，e2(Vi，Vj)，· · ·，em(Vi，Vj)}，邊集E中的每個(gè)元素 e(Vi, Vj)代表連接頂點(diǎn)Vi和頂點(diǎn)Vj的邊;邊權(quán)集合W= |wi(Vi,Vj) ,W2(Vi,Vj) , . . . ,Wm(Vi,Vj)}，邊權(quán) 集合W中的每個(gè)元素 W(Vi，Vj)代表邊6(>：1，￥」）的權(quán)重，所述11代表頂點(diǎn)個(gè)數(shù)，1]1代表邊數(shù)，；[和」代表不同頂點(diǎn)的下標(biāo)，i和j是1到η之間的整數(shù)；
[0017] 步驟12)用戶(hù)輸入必要蛋白質(zhì)集ΕΡ、蛋白質(zhì)適應(yīng)度的臨界值t和頂點(diǎn)適應(yīng)度臨界值 U;所述必要蛋白質(zhì)集EP，是指用戶(hù)指定必須存在的蛋白質(zhì)頂點(diǎn)的集合;所述蛋白質(zhì)的適應(yīng) 度，是指蛋白質(zhì)集群在圖G(V，E，W)中適應(yīng)能力;所述頂點(diǎn)適應(yīng)度，是指蛋白質(zhì)頂點(diǎn)在圖G(V， E，W)中的適應(yīng)能力;所述蛋白質(zhì)適應(yīng)度的臨界值t，是指蛋白質(zhì)子圖的適應(yīng)度不能低于所給臨界值t;所述頂點(diǎn)適應(yīng)度臨界值U，是指頂點(diǎn)的適應(yīng)度不能低于所給臨界值U。
[0018] 所述的步驟2)構(gòu)建必要子圖集合&，具體為：
[0019] 步驟21)把不屬于必要蛋白質(zhì)集EP的頂點(diǎn)Vi從圖G(V，E，W)中移走，得到必要蛋白質(zhì)圖Ge;
[0020] 步驟22)選出圖Ge中頂點(diǎn)個(gè)數(shù)大于1并且適應(yīng)度^大于種子適應(yīng)度臨界值U的子圖 Si，并把所有符合條件的子圖Si加入到必要子圖集合S沖；所述適應(yīng)度，是指子圖Si對(duì)應(yīng)的適應(yīng)度，其計(jì)算公式為
其中表示頂點(diǎn)V在圖腫的入度權(quán)重，入度權(quán)重4是指在圖Η中與頂點(diǎn)ν直接相連的邊權(quán)和，其計(jì)算公式為：
良示頂點(diǎn)ν在圖Η中的出度權(quán)重，0是指在圖Η 外與頂點(diǎn)ν直接相連的邊權(quán)和，其計(jì)算公式為：
；所述子圖S,，是指頂點(diǎn)集和邊集分別是圖Ge的頂點(diǎn)集的子集和邊集的子集的圖;所述必要子圖集合Se，是指包含所有子圖Si的集合；
[0021] 步驟23)對(duì)必要子圖集合&中的每個(gè)子圖Si排序，按子圖規(guī)模和適應(yīng)度進(jìn)行非遞增排序，即按子圖Si的規(guī)模從小到大排序，如果規(guī)模相等，按子圖51的適應(yīng)度從小到大排序;所述子圖31的規(guī)模，是指子圖&中包含的頂點(diǎn)個(gè)數(shù)的大?。?br>[0022] 步驟24)建立一個(gè)必要圖Ce，初始化必要圖Ce為空，即Ce=〇。
[0023] 所述的步驟3)構(gòu)造必要圖Ce，具體為：
[0024]步驟31)如果必要子圖集合Se為空，跳轉(zhuǎn)到步驟4);
[0025]步驟32)按先后順序從必要子圖集合S沖取出每個(gè)子圖Si，令臨時(shí)圖H = Si;找到臨時(shí)圖Η的鄰居集合N;所述臨時(shí)圖H，是指用來(lái)表示一個(gè)指定圖的變量;所述臨時(shí)圖Η的鄰居集合Ν，是指臨時(shí)圖Η中所有頂點(diǎn)鄰居的集合；初始化標(biāo)記變量flag = true ;所述標(biāo)記變量 flag，是指一個(gè)布爾型變量；
[0026] 步驟33)如果標(biāo)記變量flag = false，跳轉(zhuǎn)到步驟3)，在鄰居集合N中選出最大必要蛋白質(zhì)Pem，所述最大必要蛋白質(zhì)Pem，是指在鄰居集合N中適應(yīng)度f(wàn)em最大的必要蛋白質(zhì)，其中，必要蛋白質(zhì)的適應(yīng)度f(wàn)em的計(jì)算公式為:= ，如果最大適應(yīng)度f(wàn)em不大于0，跳轉(zhuǎn)到步驟35);
[0027]步驟34)把最大必要蛋白質(zhì)Pem加入臨時(shí)圖Η中，更新鄰居集合N，返回步驟33);
[0028] 步驟35)在鄰居集合Ν中選出最大非必要蛋白質(zhì)Pnm，所述最大非必要蛋白質(zhì)Pnm，是指示在鄰居集合N中適應(yīng)度f(wàn)r?最大的非必要蛋白質(zhì)；其中，非必要蛋白質(zhì)的適應(yīng)度f(wàn)nm的計(jì) 算公式為:；^1? = ；^+^丨-：^^1?丨；如果最大適應(yīng)度；^111不大于蛋白質(zhì)適應(yīng)度的臨界值1：，跳轉(zhuǎn)到步驟37);
[0029] 步驟36)把蛋白質(zhì)P?加入臨時(shí)圖Η中，更新鄰居集合N;返回步驟33);
[0030] 步驟3 7)把臨時(shí)圖Η加入必要圖Ce中，把含有臨時(shí)圖Η中頂點(diǎn)的子圖Si從子圖集合Se 中移除;把標(biāo)記變量flag更新為false，即flag = false，返回步驟33)。
[0031] 所述的步驟4)構(gòu)建必要子圖集合Sn，具體為：
[0032]步驟41)移除圖G中屬于圖Ge的蛋白質(zhì)頂點(diǎn)，得到非必要蛋白質(zhì)圖Gn;
[0033] 步驟42)把非必要蛋白質(zhì)圖Gn中的所有頂點(diǎn)數(shù)大于1并且適應(yīng)度大于種子適應(yīng)度臨界值U的子圖Si加入到非必要子圖集合5"中；所述子圖5 1，是指頂點(diǎn)集和邊集分別是非必要蛋白質(zhì)圖6"的頂點(diǎn)集的子集和邊集的子集的圖;所述非必要子圖集合Sn，是指包含所有子圖Si的集合；
[0034] 步驟43)對(duì)非必要子圖集合Sn中的每個(gè)子圖Si排序，按子圖51的規(guī)模和適應(yīng)度進(jìn)行非遞增排序；
[0035] 步驟44)建立一個(gè)非必要圖Cn，初始化圖Cn為空，即Cn = Φ。
[0036] 所述的步驟5)構(gòu)造非必要圖Cn，具體為：
[0037] 步驟51)如果非必要子圖集合Sn為空，跳轉(zhuǎn)到步驟6);
[0038]步驟52)按先后順序從非必要子圖集合Sn*取出每個(gè)子圖Si，令臨時(shí)圖H=Si;找到臨時(shí)圖Η的鄰居集合N，初始化標(biāo)記變量f lag = true;
[0039] 步驟53)如果標(biāo)記變量flag = false，跳轉(zhuǎn)到步驟5)，在鄰居集合N中選出最大非必要蛋白質(zhì)Ρ?，如果最大適應(yīng)度不大于0，跳轉(zhuǎn)到步驟55);
[0040]步驟54)把蛋白質(zhì)P?加入臨時(shí)圖Η中，更新鄰居集合N，返回步驟53);
[0041 ]步驟55)在鄰居集合Ν中選出最大必要蛋白質(zhì)Pem，如果最大適應(yīng)度f(wàn)em不大于蛋白質(zhì)適應(yīng)度的臨界值t，跳轉(zhuǎn)到步驟57);
[0042]步驟56)把蛋白質(zhì)pem加入子圖Η中，更新鄰居集合N，返回步驟53);
[0043] 步驟57)把子圖Η加入到非必要圖(:沖，把含有子圖Η中頂點(diǎn)的子圖Si從子圖集合Sn 中移除，把標(biāo)記變量flag更新為false，即flag = false，返回步驟53)。
[0044] 所述的步驟6)求取答案圖C，具體為：
[0045] 步驟61)求取非必要圖G4P必要圖Ge的并集，圖Gn和圖Ge的并集即為答案圖C，即C = CeUCn；
[0046] 步驟62)得到答案圖C。
[0047] 有益效果:本發(fā)明利用圖算法形成高效的生物網(wǎng)絡(luò)蛋白質(zhì)復(fù)合物求取方法。具體體現(xiàn)如下有益效果：
[0048] 1)本發(fā)明提供一種生物網(wǎng)絡(luò)蛋白質(zhì)復(fù)合物求取方法，其完整的方法過(guò)程包括將生物網(wǎng)絡(luò)中的復(fù)合物、蛋白質(zhì)及蛋白質(zhì)間相互作用的關(guān)系定義成圖模型、采用重疊聚類(lèi)算法獲得答案圖。
[0049] 2)本發(fā)明中所述建模過(guò)程中，提供一個(gè)或一套較為抽象的圖模型，能夠?qū)?shí)際問(wèn) 題中的相關(guān)求解方法轉(zhuǎn)化為數(shù)學(xué)化的模型形式。
[0050] 3)本發(fā)明中引入了適應(yīng)度的概念，把復(fù)雜的問(wèn)題簡(jiǎn)單化，便于理解算法思想和求解答案圖，使蛋白質(zhì)復(fù)合物求解問(wèn)題最終能夠得到較優(yōu)精確解。
【附圖說(shuō)明】
[0051 ]圖1是基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法流程圖。
【具體實(shí)施方式】
[0052]下面對(duì)本發(fā)明附圖的某些實(shí)施例作更加詳細(xì)的描述。
[0053]根據(jù)附圖1，本發(fā)明【具體實(shí)施方式】為：
[0054] 1) ·用戶(hù)輸入圖信息，建立圖模型G(V，E，W)。
[0055] 11).用戶(hù)輸入圖G(V，E，W)的頂點(diǎn)集合V:V={V1， V2，V3，V4，V5};輸入邊集合E:E = {ei(Vl，V2)，e2(Vl，V3)，e3(V3, V4)，e4(V3，V5)，e5(V4, V5) };輸入邊權(quán)集合W:W= {wi(Vl，V2)，W2 (VI，V3)，W3(V3, V4)，W4(V3, V5)，W5(V4, V5) }，其中W1(V1，V2) = 1，W2(V1，V3) = 1，W3(V3，V4) = 2，W4 (V3 , V5 ) 一 3 , W5 ( V4 , V5 ) 一 3〇
[0056] 12).用戶(hù)輸入必要蛋白質(zhì)集:EP= {vi，V2，V3};輸入蛋白質(zhì)適應(yīng)度的臨界值t = l; 輸入頂點(diǎn)適應(yīng)度臨界值L = L
[0057] 2).構(gòu)建必要子圖集合Se，具體步驟如下：
[0058] 21).把不屬于必要蛋白質(zhì)集EP的頂V4和V5從圖G(V，E，W)中移走，得到必要蛋白質(zhì) 圖66乂={￥6而屬}。其中^代表蛋白質(zhì)圖6(3的頂點(diǎn)集力={%^3}瓜代表蛋白質(zhì)圖6 (3 的邊集，Ee= {ei(vi，V2)，e2(vi，V3)} 代表蛋白質(zhì)圖Ge的邊權(quán)集合，W e = |ffi(vi，V2)，W2(vi, V3)} Ο
[0059] 22).計(jì)算圖Ge中頂點(diǎn)個(gè)數(shù)大于1的子圖的適應(yīng)度^.，選出適應(yīng)度義大于種子適應(yīng)度臨界值tm的子圖S,，加入必要子圖集合中。求得i
.其中 L I ,即4 得到必要子圖集合Se= {&}。
[0060] 23).對(duì)必要子圖集合Se中的每個(gè)子圖Si按規(guī)模和適應(yīng)度進(jìn)行非遞增排序，得到Se = {Si}〇
[0061 ] 24).初始化必要圖Ce為空，即Ce=〇。
[0062] 3).構(gòu)造必要圖Ce。
[0063 ] 31).從必要子圖集合Se中取出子圖Si，令臨時(shí)圖H= Si。找到臨時(shí)圖Η的鄰居集合N，求得Ν= {VI，V2，V3}。初始化標(biāo)記變量flag = true。
[0064] 32).計(jì)算鄰居集合N中必要蛋白質(zhì)的適應(yīng)度，根據(jù)必要蛋白質(zhì)的適應(yīng)度f(wàn)em的計(jì)算公式fem=fH+{em}-fH-{em}，求得
得到最大必要蛋白質(zhì)Pem = VI。所求最大必要蛋白質(zhì)VI的適應(yīng)度f(wàn)l小于0。
[0065] 33).鄰居集合N中不存在非必要蛋白質(zhì)Pnm，默認(rèn)最大非必要蛋白質(zhì)Pnm的適應(yīng)度f(wàn)nm 小于蛋白質(zhì)適應(yīng)度的臨界值t。把臨時(shí)圖Η加入必要圖Ce，得到Ce= {{vi，V2，V3}，{ei(vi，V2)， e2(vi，V3)}，{wi(vi，V2)，W2(V1，V3)}}，把標(biāo)記變量flag更親jf為false，即flag = false〇
[0066] 34) .flag值為false，結(jié)束循環(huán)。
[0067] 4).構(gòu)建必要子圖集合。
[0068] 41).把屬于必要蛋白質(zhì)集EP的頂點(diǎn)V1，V!^P V3從圖G(V，E，W)中移走，得到非必要蛋白質(zhì)圖6"，6"={￥"311，1}。其中，￥ 11代表蛋白質(zhì)圖611的頂點(diǎn)集，￥11={^，^}$11代表蛋白質(zhì)圖 Gn的邊集，En= {e5(V4，V5)} ;Wn代表蛋白質(zhì)圖Gn的邊權(quán)集合，Wn= {W5(V4，V5)}。
[0069] 42).計(jì)算圖6"中頂點(diǎn)個(gè)數(shù)大于1的子圖的適應(yīng)度I，選出適應(yīng)度4大于種子適應(yīng)度臨界值tm的子圖Si，加入非必要子圖集合Sn*。求得
求得得到非必要子圖集合3η={&}。
[0070] 43).對(duì)非必要子圖集合Sn中的每個(gè)子圖Si按規(guī)模和適應(yīng)度進(jìn)行非遞增排序，得到 Sn= {Si} 〇
[0071] 44).初始化非必要圖Cn為空，gp Cn = Φ。
[0072] 5).求取非必要圖Cn。
[0073] 51).從非必要子圖集合Sn中取出子圖Si，令臨時(shí)圖H=Si。找到臨時(shí)圖Η的鄰居集合 Ν，求得N= {v3，V4，V5}。初始化標(biāo)記變量flag = true。
[0074] 52).計(jì)算鄰居集合N中非必要蛋白質(zhì)的適應(yīng)度，根據(jù)非必要蛋白質(zhì)的適應(yīng)度f(wàn)nm的計(jì)算公式；^1?=；^+^1-；^^1?1，求得.得到最大必要蛋白質(zhì)Pnm = V4。所求最大必要蛋白質(zhì)V4的適應(yīng)度f(wàn)4小于0。
[0075] 53).計(jì)算鄰居集合N中必要蛋白質(zhì)的適應(yīng)度，根據(jù)必要蛋白質(zhì)的適應(yīng)度f(wàn)em的計(jì)算公式fem = fH+{em}-fH-{em}，求得 < =一,求得最大必要蛋白質(zhì)Pnm=V3。 17
[0076] 54).所求最大必要最大必要蛋白質(zhì)Pnm的適應(yīng)度f(wàn)3不大于蛋白質(zhì)適應(yīng)度的臨界值 t。把臨時(shí)圖Η加入非必要圖Cn，得到Cn= { {V4，V5}，{e5(V4，V5) }，|ff5(V4，V5)} }，把標(biāo)記變量 f lag更新1 為false，艮P flag = false 〇
[0077] 55) .flag值為false，結(jié)束循環(huán)。
[0078] 6).求取答案圖C。
[0079] 61).求取非必要圖Gn和必要圖Ge的合并圖，得到答案圖C，即C = CeUCn。
[0080] 62).得到答案圖 C(Vc，Ec，Wc)，其中，頂點(diǎn)集合Vc={v 1，v2，v3，V4，v5};邊集合E c={el (V1，V2)，e2(Vl，V3)，e3(V3，V4)，e4(V3，V5)，e5(V4，V5)};邊權(quán)集合Wc= {wi(Vl，V2)，W2(V1，V3)，W3 (V3，V4)，W4(V3，V5)，W5(V4，V5)}，W1(V1，V2) = 1，W2(V1，V3) = 1，W3(V3，V4) = 2，W4(V3，V5)=3，W5 (V4 , V5 ) - 3 〇
【主權(quán)項(xiàng)】
1. 一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法，其特征在于該方法包括W下步驟：步驟1)用戶(hù)輸入圖信息，建立圖模型G(V，E，W):根據(jù)用戶(hù)輸入圖信息，建立頂點(diǎn)集V，邊集E和邊權(quán)集合W，得到圖模型G(V，E，W); 步驟2)構(gòu)建必要子圖集合Se:求取必要蛋白質(zhì)圖Ge，從圖Ge中選取適應(yīng)度ti符合條件的頂點(diǎn)構(gòu)建成子圖Si，所有子圖Si構(gòu)成必要子圖集合Se; 步驟3)構(gòu)造必要圖Ce:篩選最大必要蛋白質(zhì)Pem，把適應(yīng)度f(wàn)em符合條件的最大必要蛋白質(zhì)Pem加入臨時(shí)圖Η，符合條件的臨時(shí)圖Η加入必要圖Ce ; 步驟4)構(gòu)建非必要子圖集合Sn:求取非必要蛋白質(zhì)圖Gn，從圖Gn中選取適應(yīng)度ti符合條件的頂點(diǎn)構(gòu)建成子圖Si，所有子圖Si構(gòu)成非必要子圖集合Sn; 步驟5)構(gòu)造非必要圖Cn:篩選最大非必要蛋白質(zhì)Pnm，把適應(yīng)度f(wàn)nm符合條件的最大非必要蛋白質(zhì)Ργ?加入臨時(shí)圖H，符合條件的臨時(shí)圖Η加入非必要圖Cn; 步驟6)求取答案圖C:求取非必要圖Gn和必要圖Ge的并集，得到答案圖C。2. 根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法，其特征在于所述的步驟1)用戶(hù)輸入圖信息，建立圖模型G(V，E，W)，具體為：步驟11)用戶(hù)輸入圖G(V，E，W)的頂點(diǎn)集V和邊集E，W及邊權(quán)集合W;所述頂點(diǎn)集V={vi， V2, . . .，Vn};邊集E= {ei(Vi,Vj) ,e2(Vi,Vj), . . . ,em(Vi,Vj)}，邊集E中的每個(gè)元素 e(Vi,Vj)代表連接頂點(diǎn)Vi和頂點(diǎn)Vj的邊;邊權(quán)集合W= {wi(Vi,Vj) ,W2(Vi,Vj) , . . . ,Wm(Vi,Vj)}，邊權(quán)集合W 中的每個(gè)元素 w(Vi，Vj)代表邊e(Vi，Vj)的權(quán)重，所述η代表頂點(diǎn)個(gè)數(shù)，m代表邊數(shù)，i和j代表不同頂點(diǎn)的下標(biāo)，i和j是1到η之間的整數(shù)；步驟12)用戶(hù)輸入必要蛋白質(zhì)集ΕΡ、蛋白質(zhì)適應(yīng)度的臨界值t和頂點(diǎn)適應(yīng)度臨界值U;所述必要蛋白質(zhì)集EP，是指用戶(hù)指定必須存在的蛋白質(zhì)頂點(diǎn)的集合;所述蛋白質(zhì)的適應(yīng)度，是指蛋白質(zhì)集群在圖G(V，E，W)中適應(yīng)能力;所述頂點(diǎn)適應(yīng)度，是指蛋白質(zhì)頂點(diǎn)在圖G(V，E，W) 中的適應(yīng)能力;所述蛋白質(zhì)適應(yīng)度的臨界值t，是指蛋白質(zhì)子圖的適應(yīng)度不能低于所給臨界值t;所述頂點(diǎn)適應(yīng)度臨界值U，是指頂點(diǎn)的適應(yīng)度不能低于所給臨界值tm。3. 根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法，其特征在于所述的步驟2)構(gòu)建必要子圖集合Se，具體為：步驟21)把不屬于必要蛋白質(zhì)集EP的頂點(diǎn)VI從圖G(V，E，W)中移走，得到必要蛋白質(zhì)圖 Ge; 步驟22)選出圖Ge中頂點(diǎn)個(gè)數(shù)大于1并且適應(yīng)度ti大于種子適應(yīng)度臨界值tm的子圖Si，并把所有符合條件的子圖Si加入到必要子圖集合Se中；所述適應(yīng)度ti，是指子圖Si對(duì)應(yīng)的適應(yīng) 度，其計(jì)算公式為：其中《(Μ ^表示頂點(diǎn)V在圖Η中的入度權(quán)重，入度權(quán)重逆是指在圖Η中與頂點(diǎn)V直接相連的邊權(quán)和，其計(jì)算公式為：表示頂點(diǎn)V在圖Η中的出度權(quán)重，Ml/)是指在圖Η 外與頂點(diǎn)V直接相連的邊權(quán)和，其計(jì)算公式為巧述子圖Si，是指頂點(diǎn)集和邊集分別是圖Ge的頂點(diǎn)集的子集和邊集的子集的圖；所述必要子圖集合Se，是指包含所有子圖Si的集合；步驟23)對(duì)必要子圖集合Se中的每個(gè)子圖Si排序，按子圖Si的規(guī)模和適應(yīng)度進(jìn)行非遞增排序，即按子圖Si的規(guī)模從小到大排序，如果規(guī)模相等，按子圖Si的適應(yīng)度從小到大排序;所述子圖Si的規(guī)模，是指子圖Si中包含的頂點(diǎn)個(gè)數(shù)的大??；步驟24 )建立一個(gè)必要圖Ce，初始化必要圖Ce為空，即Ce = Φ。4. 根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法，其特征在于所述的步驟3)構(gòu)造必要圖Ce，具體為：步驟31)如果必要子圖集合Se為空，跳轉(zhuǎn)到步驟4); 步驟32)按先后順序從必要子圖集合S沖取出每個(gè)子圖Si，令臨時(shí)圖H=Si;找到臨時(shí)圖 Η的鄰居集合N;所述臨時(shí)圖H，是指用來(lái)表示一個(gè)指定圖的變量;所述臨時(shí)圖Η的鄰居集合N，是指臨時(shí)圖Η中所有頂點(diǎn)鄰居的集合;初始化標(biāo)記變量flag =化ue;所述標(biāo)記變量flag，是指一個(gè)布爾型變量；步驟33)如果標(biāo)記變量flag = false，跳轉(zhuǎn)到步驟3)，在鄰居集合N中選出最大必要蛋白質(zhì)Pem，所述最大必要蛋白質(zhì)Pem，是指在鄰居集合N中適應(yīng)度f(wàn)em最大的必要蛋白質(zhì)，其中，必要蛋白質(zhì)的適應(yīng)度f(wàn)em的計(jì)算公式為:fem = fH+W-fH-{em}，如果最大適應(yīng)度f(wàn)em不大于0,跳轉(zhuǎn) 到步驟35); 步驟34)把最大必要蛋白質(zhì)Pem加入臨時(shí)圖Η中，更新鄰居集合N，返回步驟33); 步驟35)在鄰居集合Ν中選出最大非必要蛋白質(zhì)Pnm，所述最大非必要蛋白質(zhì)Pnm，是指示在鄰居集合N中適應(yīng)度f(wàn)nm最大的非必要蛋白質(zhì)；其中，非必要蛋白質(zhì)的適應(yīng)度f(wàn)nm的計(jì)算公式為:片111=扣+{。111}-扣-{。111};如果最大適應(yīng)度片111不大于蛋白質(zhì)適應(yīng)度的臨界值1：，跳轉(zhuǎn)到步驟 37); 步驟36 )把蛋白質(zhì)Pnm加入臨時(shí)圖Η中，更新鄰居集合N;返回步驟33 ); 步驟37)把臨時(shí)圖Η加入必要圖Ce中，把含有臨時(shí)圖Η中頂點(diǎn)的子圖Si從子圖集合Se中移除；把標(biāo)記變量flag更新為false,即flag = false，返回步驟33)。5. 根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法，其特征在于所述的步驟4)構(gòu)建必要子圖集合Sn，具體為：步驟41)移除圖G中屬于圖Ge的蛋白質(zhì)頂點(diǎn)，得到非必要蛋白質(zhì)圖Gn; 步驟42)把非必要蛋白質(zhì)圖Gn中的所有頂點(diǎn)數(shù)大于1并且適應(yīng)度大于種子適應(yīng)度臨界值 U的子圖Si加入到非必要子圖集合Sn中；所述子圖Si，是指頂點(diǎn)集和邊集分別是非必要蛋白質(zhì)圖Gn的頂點(diǎn)集的子集和邊集的子集的圖；所述非必要子圖集合Sn，是指包含所有子圖Si的集合；步驟43)對(duì)非必要子圖集合Sn中的每個(gè)子圖Si排序，按子圖Si的規(guī)模和適應(yīng)度進(jìn)行非遞增排序；步驟44)建立一個(gè)非必要圖Cn，初始化圖Cn為空，即Cn=〇。6. 根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法，其特征在于所述的步驟5)構(gòu)造非必要圖Cn，具體為：步驟51)如果非必要子圖集合Sn為空，跳轉(zhuǎn)到步驟6); 步驟52)按先后順序從非必要子圖集合Sn中取出每個(gè)子圖Si，令臨時(shí)圖H = Si;找到臨時(shí) 圖Η的鄰居集合N，初始化標(biāo)記變量f lag = true; 步驟53)如果標(biāo)記變量flag = false，跳轉(zhuǎn)到步驟5)，在鄰居集合Ν中選出最大非必要蛋白質(zhì)Pr?，如果最大適應(yīng)度f(wàn)nm不大于ο，跳轉(zhuǎn)到步驟55 ); 步驟54)把蛋白質(zhì)Pnm加入臨時(shí)圖Η中，更新鄰居集合N，返回步驟53); 步驟55)在鄰居集合Ν中選出最大必要蛋白質(zhì)Pem，如果最大適應(yīng)度f(wàn)em不大于蛋白質(zhì)適應(yīng) 度的臨界值t，跳轉(zhuǎn)到步驟57); 步驟56)把蛋白質(zhì)Pem加入子圖Η中，更新鄰居集合N，返回步驟53); 步驟57)把子圖助日入到非必要圖Cn中，把含有子圖Η中頂點(diǎn)的子圖Si從子圖集合Sn中移除，把標(biāo)記變量flag更新為化Ise，即flag =化Ise，返回步驟53)。7.根據(jù)權(quán)利要求1所述的基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法，其特征在于所述的步驟6)求取答案圖C，具體為：步驟61)求取非必要圖Gn和必要圖Ge的并集，圖Gn和圖Ge的并集即為答案圖C，即C = CeU Cn；步驟62)得到答案圖C。
【文檔編號(hào)】G06F19/12GK105975804SQ201610281013
【公開(kāi)日】2016年9月28日
【申請(qǐng)日】2016年4月29日
【發(fā)明人】田思明, 陳志 , 岳文靜, 陳雨詩(shī), 王宇虹, 卜杰, 陳志遠(yuǎn)
【申請(qǐng)人】南京郵電大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：田思明;陳志;岳文靜;陳雨詩(shī);王宇虹;卜杰;陳志遠(yuǎn);
技術(shù)所有人：南京郵電大學(xué);
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話(huà)進(jìn)行咨詢(xún)。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線(xiàn)網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢(xún)問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

蛋白質(zhì)復(fù)合體相關(guān)技術(shù)

蛋白質(zhì)復(fù)合物相關(guān)技術(shù)

復(fù)合蛋白質(zhì)相關(guān)技術(shù)

高一生物蛋白質(zhì)視頻相關(guān)技術(shù)

蛋白質(zhì)生物合成相關(guān)技術(shù)

蛋白質(zhì)的生物合成相關(guān)技術(shù)

蛋白質(zhì)生物價(jià)相關(guān)技術(shù)

高中生物必修一蛋白質(zhì)相關(guān)技術(shù)

高一生物必修一蛋白質(zhì)相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種基于生物網(wǎng)絡(luò)的蛋白質(zhì)復(fù)合物求取方法