国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法

      文檔序號(hào):6590528閱讀:311來(lái)源:國(guó)知局
      專利名稱:蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于系統(tǒng)生物學(xué)領(lǐng)域,涉及蛋白質(zhì)復(fù)合體的挖掘方法,更具體地,涉及一種蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法。
      背景技術(shù)
      蛋白質(zhì)是分子功能的執(zhí)行者和調(diào)控者,也是生命活動(dòng)的主要載體。蛋白質(zhì)很少以單體的形式發(fā)揮作用,而是通過(guò)與其它蛋白質(zhì)相互作用形成復(fù)合體或者功能模塊來(lái)協(xié)同地執(zhí)行生物功能。蛋白質(zhì)復(fù)合體的挖掘不僅有助于理解細(xì)胞的功能組織機(jī)理,還有助于揭示復(fù)雜疾病的發(fā)生原理。盡管科研人員可以通過(guò)化學(xué)實(shí)驗(yàn)測(cè)定方法較為準(zhǔn)確的測(cè)定某一環(huán)境下的較為穩(wěn)定的蛋白質(zhì)復(fù)合體,但是有些復(fù)合體內(nèi)的蛋白質(zhì)之間的相互作用是動(dòng)態(tài)變化的,即存在不穩(wěn)定蛋白質(zhì)復(fù)合體。以實(shí)驗(yàn)為基礎(chǔ)的研究方法難以偵測(cè)到這類蛋白質(zhì)復(fù)合體,并且需要耗費(fèi)大量的時(shí)間和昂貴的實(shí)驗(yàn)成本。近年來(lái),高通量蛋白質(zhì)相互作用預(yù)測(cè)技術(shù)的出現(xiàn)產(chǎn)生了大量的蛋白質(zhì)相互作用數(shù)據(jù),從蛋白質(zhì)相互作用網(wǎng)絡(luò)出發(fā)偵測(cè)蛋白質(zhì)復(fù)合體已經(jīng)成為了蛋白質(zhì)復(fù)合體挖掘的一個(gè)主流方法。目前,研究人員已經(jīng)提出了一系列用于挖掘蛋白質(zhì)復(fù)合體的圖聚類算法。這些算法主要基于分析蛋白質(zhì)相互作用網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)來(lái)偵測(cè)蛋白質(zhì)復(fù)合體。依據(jù)其實(shí)現(xiàn)思想的不同,可以把這些算法粗略地分為三個(gè)子類:基于密度的局部搜索算法、基于圖劃分的方法和基于層次聚類的方法。然而,由于每種算法都有各自的特點(diǎn),它們通常只能夠捕捉到網(wǎng)絡(luò)中某種特定的拓?fù)涮卣?。例如,基于密度的局部搜索算法通常只能偵測(cè)到蛋白質(zhì)相互作用網(wǎng)絡(luò)中緊密內(nèi)連接的子網(wǎng)絡(luò)結(jié)構(gòu)。然而研究表明,組織中的蛋白質(zhì)復(fù)合體不僅限于緊密內(nèi)連接的子網(wǎng)絡(luò)結(jié)構(gòu),蛋白質(zhì)相互作用網(wǎng)絡(luò)中也存在具有其它拓?fù)浣Y(jié)構(gòu)(例如星形和線形結(jié)構(gòu))的蛋白質(zhì)復(fù)合體。因此這些具有生物意義的低密度復(fù)合體往往會(huì)被傳統(tǒng)的基于密度的局部搜索算法所忽略?;趫D劃分的方法只能找到不重疊的蛋白質(zhì)復(fù)合體。而研究表明,蛋白質(zhì)在不同的環(huán)境下可能執(zhí)行不同的功能,因此蛋白質(zhì)復(fù)合體之間往往是相互重疊的?;趯哟尉垲惖姆椒軌虬l(fā)現(xiàn)蛋白質(zhì)相互作用網(wǎng)絡(luò)中的層次結(jié)構(gòu),但是這些方法對(duì)噪聲數(shù)據(jù)相當(dāng)敏感。而高通量技術(shù)得到蛋白質(zhì)相互作用數(shù)據(jù)不可避免地存在一定比例的噪聲(假陽(yáng)性和假陰性)。此外,基于層次聚類的方法同樣不能找到重疊的復(fù)合體。事實(shí)上,不同物種的不同組織通過(guò)不同實(shí)驗(yàn)手段得到的蛋白質(zhì)相互作用網(wǎng)絡(luò)往往具有多種多樣的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),因此很難找到一個(gè)算法在具有不同拓?fù)浣Y(jié)構(gòu)的蛋白質(zhì)相互作用網(wǎng)絡(luò)數(shù)據(jù)上都有出色的表現(xiàn)。因此,如何設(shè)計(jì)一種方法來(lái)捕捉網(wǎng)絡(luò)數(shù)據(jù)中的不同拓?fù)涮卣?,并且在不同的網(wǎng)絡(luò)數(shù)據(jù)上都能得到較為準(zhǔn)確的復(fù)合體偵測(cè)結(jié)果是一個(gè)值得研究的問(wèn)題。目前有兩種用于蛋白質(zhì)復(fù)合體挖掘的組裝聚類方法。一種是Asur等人提出的方法,他們首先提出兩種相似性度量來(lái)提高網(wǎng)絡(luò)數(shù)據(jù)的精確度,然后使用三種基于圖劃分的方法對(duì)改進(jìn)的網(wǎng)絡(luò)數(shù)據(jù)聚類,產(chǎn)生了六組聚類結(jié)果;最后,提出一種基于主成分分析的一致聚類方法將上述結(jié)果融合 為最終的聚類。該法需要預(yù)先設(shè)定蛋白質(zhì)復(fù)合體的個(gè)數(shù),但是真實(shí)情況下,蛋白質(zhì)相互作用網(wǎng)絡(luò)中的蛋白質(zhì)復(fù)合體個(gè)數(shù)往往是未知的。此外,其使用的聚類方法都是基于圖劃分的方法,這樣,該法可能只能夠捕捉到網(wǎng)絡(luò)的某種拓?fù)涮卣?,而忽略了其他重要的特征。并且在組裝不同聚類結(jié)果的時(shí)候,未對(duì)這些結(jié)果進(jìn)行篩選,這樣一來(lái),不可靠的聚類結(jié)果很可能會(huì)影響最終的聚類結(jié)果。另一種是Greene等人提出的方法。通過(guò)設(shè)置不同的聚類個(gè)數(shù),首先用非負(fù)矩陣分解產(chǎn)生了一系列聚類結(jié)果;然后提出一個(gè)層級(jí)元聚類方法將這些聚類結(jié)果融合為一系列不相交的“元聚類”,最后通過(guò)這些結(jié)果生成了原始網(wǎng)絡(luò)的軟層級(jí)聚類。該方法主要是提高一個(gè)特定算法的穩(wěn)定性,通過(guò)不同的初始值設(shè)置,產(chǎn)生一系列聚類結(jié)果,進(jìn)而綜合成一個(gè)最終的聚類。由于沒有對(duì)不同的聚類結(jié)果進(jìn)行篩選,而且僅使用了一種聚類方法,因此結(jié)果可能只反應(yīng)出數(shù)據(jù)的部分特征。

      發(fā)明內(nèi)容
      本發(fā)明的主要目的是為了從不同的聚類方法得到的聚類結(jié)果中提取有效的信息,并且產(chǎn)生一個(gè)更為準(zhǔn)確和可靠的聚類結(jié)果,進(jìn)而較為準(zhǔn)確地偵測(cè)蛋白質(zhì)復(fù)合體。為實(shí)現(xiàn)上述目的,本發(fā)明提出一種蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法,包括:S1.輸入一個(gè)蛋白質(zhì)相互作用網(wǎng)絡(luò),產(chǎn)生一個(gè)無(wú)向圖G,選擇m個(gè)聚類方法應(yīng)用到這個(gè)網(wǎng)絡(luò)上,得到m個(gè)聚類結(jié)果Bq, q=l,...,m ;B= (B1, B2,..., Bm);S2.對(duì)每個(gè)基本聚類結(jié)果B,,q=l,...,m ;重新生成一個(gè)特征網(wǎng)絡(luò),得到m個(gè)特征網(wǎng)絡(luò),m個(gè)特征網(wǎng)絡(luò)對(duì)應(yīng)m個(gè)特征矩陣;D= (D1, D2,, Dm);S3.對(duì)上述m個(gè)特征矩陣進(jìn)行加權(quán)組合,獲取蛋白質(zhì)相互作用網(wǎng)絡(luò)的合成矩陣W:
      權(quán)利要求
      1.一種蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法,其特征在于,包括: S1.輸入一個(gè)蛋白質(zhì)相互作用網(wǎng)絡(luò),產(chǎn)生一個(gè)無(wú)向圖G,選擇m個(gè)聚類方法應(yīng)用到這個(gè)網(wǎng)絡(luò)上,得到 m 個(gè)聚類結(jié)果 Bq, q=l,..., m ;B= (B1, B2,..., Bm); S2.對(duì)每個(gè)基本聚類結(jié)果B,,q=l,...,m;重新生成一個(gè)特征網(wǎng)絡(luò),得到m個(gè)特征網(wǎng)絡(luò);m個(gè)特征網(wǎng)絡(luò)對(duì)應(yīng)m個(gè)特征矩陣;D= (D1, D2,, Dm); S3.對(duì)上述m個(gè)特征矩陣進(jìn)行加權(quán)組合,獲取蛋白質(zhì)相互作用網(wǎng)絡(luò)的合成矩陣W:
      2.根據(jù)權(quán)利要求1所述的蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法,其特征在于,所述步驟SI還包括將蛋白質(zhì)相互作用網(wǎng)絡(luò)中未被第q個(gè)聚類方法聚類的蛋白質(zhì)設(shè)為單獨(dú)的復(fù)合體,并添加到對(duì)應(yīng)的聚類結(jié)果Bq中,q=l,...,m。
      3.根據(jù)權(quán)利要求1或2所述的蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法,其特征在于,所述特征矩陣Dq中的(Dq) i;J代表第q個(gè)特征網(wǎng)絡(luò)中第i個(gè)和第j個(gè)節(jié)點(diǎn)間的狀態(tài),當(dāng)?shù)趇個(gè)和第 j 個(gè)節(jié)點(diǎn)相連則
      4.根據(jù)權(quán)利要求1、2或3所述的蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法,其特征在于, 所述步驟S3后還包括引入一個(gè)正則項(xiàng)
      5.根據(jù)權(quán)利要求4所述的蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法,其特征在于,所述步驟S4包括以下步驟: ` S41.令I(lǐng)ii,z表示第i個(gè)蛋白質(zhì)屬于第z個(gè)復(fù)合體的幾率,設(shè)
      6.根據(jù)權(quán)利要求5所述的蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法,其特征在于,所述步驟S47中公式(13)采用下式替換
      7.根據(jù)權(quán)利要求6所述的蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法,其特征在于,所述步驟S48的替換方式為:通過(guò)更新公式(11),(14)和(15),能夠通過(guò)迭代更新U,H和β的數(shù)值來(lái)求解模型參數(shù);首先初始化Η=Η(°),其中每個(gè)元素隨機(jī)抽取自(O,I)上的均勻分布和U=U(O);第七次迭代的時(shí)候,先固定U=U(H),通過(guò)(11)和(14)更新βω和H(t)(先根據(jù)(n)使用H(H)更新得到β ω,再根據(jù)(14)使用U(H),H(H)和β (t)更新得到Ηω);;得到β (t)和Ηω之后,固定它們的取值,根據(jù)(15)得到U(t);如此不斷迭代,直到滿足設(shè)定的終止條件。
      全文摘要
      本發(fā)明公開了一種蛋白質(zhì)復(fù)合體挖掘的加權(quán)組裝聚類方法,包括輸入一個(gè)蛋白質(zhì)相互作用網(wǎng)絡(luò),產(chǎn)生一個(gè)無(wú)向圖,選擇m個(gè)聚類方法應(yīng)用到這個(gè)網(wǎng)絡(luò)上,得到m個(gè)聚類結(jié)果;對(duì)每個(gè)基本聚類結(jié)果,重新生成一個(gè)特征網(wǎng)絡(luò),得到m個(gè)特征網(wǎng)絡(luò),對(duì)應(yīng)m個(gè)特征矩陣;對(duì)m個(gè)特征矩陣進(jìn)行合成,獲取合成矩陣W其中uq是第q個(gè)特征網(wǎng)絡(luò)的權(quán)重,uq≥0,且滿足合成矩陣W對(duì)應(yīng)一個(gè)新的網(wǎng)絡(luò),其中元素Wi,j是度量新網(wǎng)絡(luò)中蛋白質(zhì)i和蛋白質(zhì)j的相似程度;采用貝葉斯非負(fù)矩陣分解算法挖掘該新網(wǎng)絡(luò)中的聚類;把權(quán)重的學(xué)習(xí)和復(fù)合體發(fā)現(xiàn)整合為一個(gè)優(yōu)化目標(biāo),從而通過(guò)聚類結(jié)果來(lái)優(yōu)化權(quán)重,反之用權(quán)重結(jié)果來(lái)指導(dǎo)聚類;優(yōu)化終止后獲取最終的蛋白質(zhì)復(fù)合體挖掘結(jié)果。
      文檔編號(hào)G06F19/12GK103235900SQ20131010485
      公開日2013年8月7日 申請(qǐng)日期2013年3月28日 優(yōu)先權(quán)日2013年3月28日
      發(fā)明者歐陽(yáng)樂, 戴道清, 張曉飛 申請(qǐng)人:中山大學(xué)
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1