国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于樹搜索和片段組裝的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法

      文檔序號:6543120閱讀:321來源:國知局
      一種基于樹搜索和片段組裝的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法
      【專利摘要】一種基于樹搜索和片段組裝的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法,包括以下步驟:A1、獲取蛋白質(zhì)的pdb格式的文件并清洗出所需數(shù)據(jù);A2、生成片段庫;A3、選取力場模型;A4、采用Rosetta的score3能量函數(shù);A5、將整個能量圖景離散化,并將每層進一步離散化,分成單獨的分塊區(qū),每次搜索根據(jù)能量的權(quán)重隨機選取一個能量層,并在該能量層依概率選取一個分塊區(qū),如果分塊區(qū)中包含有構(gòu)象,采用片段組裝方法,隨機選取序列上的一個片段,然后在片段庫中隨機選取一個片段,替換序列上的目標片段,用蒙特卡洛準則來判斷是否接受這個構(gòu)象,如果接受則將它放入一個集合當中。本發(fā)明可以大大減少計算量和計算時間,保證搜索到能量較低的構(gòu)象。
      【專利說明】一種基于樹搜索和片段組裝的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及計算機應(yīng)用領(lǐng)域,生物信息學,最優(yōu)化理論,分子生物學等,特別涉及一種蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法,屬于將現(xiàn)代智能優(yōu)化方法應(yīng)用到蛋白質(zhì)三維結(jié)構(gòu)預(yù)測。
      【背景技術(shù)】
      [0002]生物信息學通過綜合利用生物學,計算機科學和信息技術(shù)而揭示大量而復(fù)雜的生物數(shù)據(jù)所賦有的生物學奧秘。是當前研究的一個熱點。生物信息學研究成果已經(jīng)被廣泛應(yīng)用于序列比對,蛋白質(zhì)比對,基因識別分析,分子進化,序列重疊群裝配,遺傳密碼,藥物設(shè)計,生物系統(tǒng),蛋白質(zhì)結(jié)構(gòu)預(yù)測等。其中蛋白質(zhì)結(jié)構(gòu)預(yù)測是生物信息學領(lǐng)域的一個重要的分支。著名的諾貝爾化學獎獲得者Anfinsen通過對核糖核酸酶A的經(jīng)典研究表明去折疊的蛋白質(zhì)在體外可以自發(fā)的進行再折疊,僅僅是序列本身已經(jīng)包括了蛋白質(zhì)正確折疊的所有信息,并提出蛋白質(zhì)折疊的熱力學假說,這一理論認為結(jié)構(gòu)同源的蛋白質(zhì)可以通過不同的折疊途徑形成相似的天然構(gòu)象,蛋白質(zhì)的一級結(jié)構(gòu)決定了其三維結(jié)構(gòu),即蛋白質(zhì)的氨基酸序列決定了蛋白質(zhì)的三維空間結(jié)構(gòu),從熱力學分析,蛋白質(zhì)的天然構(gòu)型對應(yīng)著其物理能量最小的狀態(tài)。
      [0003]隨著2000年基因組工作草圖的完成,基因組的工作重心已經(jīng)從測序轉(zhuǎn)向了基因功能的識別,這一問題的解決顯得尤為重要。人們通過研究蛋白質(zhì)的內(nèi)在結(jié)構(gòu)來了解其內(nèi)在機理,并找出蛋白質(zhì)折疊的真正驅(qū)動力,這樣可以按照人們的設(shè)想設(shè)計出符合特定需求的非天然蛋白質(zhì),對疾病進行有效的預(yù)測和控制。蛋白質(zhì)結(jié)構(gòu)從頭預(yù)測也因此具有重大的意義。然后蛋白質(zhì)的結(jié)構(gòu)測定遠遠趕不上基因組測序的速度,單純的依靠實驗的方法測定所有的蛋白質(zhì)的三維結(jié)構(gòu)已經(jīng)遠遠不能滿足后基因時代對于蛋白質(zhì)數(shù)據(jù)分析的需求,有必要發(fā)展一種可靠的理論預(yù)測方法,從而迅速、簡便的獲取蛋白質(zhì)的結(jié)構(gòu)信息。
      [0004]蛋白質(zhì)的從頭預(yù)測方法就是選擇一種力場模型,將蛋白質(zhì)結(jié)構(gòu)抽象成一個數(shù)學模型,使其具有可計算性,然后進行算法的設(shè)計,從算法的時間和空間復(fù)雜度出發(fā),利用全局以及局部的優(yōu)化算法在能量曲面上搜索全局最優(yōu)解,在數(shù)學上屬于一種極其復(fù)雜的非凸多極值優(yōu)化問題。利用蛋白質(zhì)的一級序列,利用熱力學方法,計算得出蛋白質(zhì)的三維結(jié)構(gòu)。
      [0005]針對力場模型的優(yōu)化問題,2005年Bradley在結(jié)合蒙特卡洛優(yōu)化方法開發(fā)了分子建模Rosetta程序,成功預(yù)測CASP6中T0281目標蛋白(包含70個殘基)的Ca-RMSD為1.6 A-對某些小目標蛋白(〈85個殘基),甚至得到誤差精度小于1.5 A的高分辨率三維解析結(jié)構(gòu);2006年,Zhan采用Basin-Paving(BP)方法得到了腦啡肽在ECEPP/2、ECEPP/3兩種力場模型下最小能量構(gòu)象;2009年Roosi提出幾種BP改進策略,并給出了比較結(jié)果。結(jié)合隨機全局優(yōu)化算法,如遺傳算法(Genetic Algorithms, GA)、差分進化(DifferentialEvolution, DB)算法也應(yīng)用于力場模型的優(yōu)化,但是由于蛋白質(zhì)是一種強柔性的大分子體系,其勢函數(shù)表 達式極其復(fù)雜,存在極多局部極小點,這些算法極容易陷入某個局優(yōu)解;同時由于隨機算法缺乏全局收斂理論依據(jù)及解的不確定性,使用了全局選擇因子,算法只能收斂到全局最優(yōu)解,而忽略了眾多局部極值解,進一步限制了它們在實際問題中的應(yīng)用。[0006]我們了解到蛋白質(zhì)迅速折疊是因為隨機熱運動使得構(gòu)象發(fā)生改變,而根據(jù)漏斗狀的能量圖景中所體現(xiàn)的原理,構(gòu)象變化會使蛋白質(zhì)沿著能量下降的方向搜索到天然結(jié)構(gòu)。
      [0007]然而,如果采用窮舉搜索的方式來遍歷整個能量圖景,那是非常不科學的方式,首先要想遍歷整個能量圖景,其計算量非常龐大,這個值與離散化能量圖景后的最小單位值相關(guān),離散得越精細,計算量相應(yīng)越大,相應(yīng)的時間成本也越高,需要的計算機資源也越多。

      【發(fā)明內(nèi)容】

      [0008]為了克服現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)預(yù)測方式的計算量較大、計算時間很長的不足,本發(fā)明提供一種基于樹搜索和片段組裝的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法,采用將能量圖景適度離散化并依概率隨機選擇能量層和分塊區(qū)的方式,可以大大減少計算量,計算時間,同時保證搜索到能量較低的構(gòu)象,達到預(yù)測蛋白質(zhì)結(jié)構(gòu)的目的。
      [0009]本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:
      [0010]一種基于樹搜索和片段組裝的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法,所述預(yù)測方法包括以下步驟:
      [0011]Al、獲取蛋白質(zhì)的pdb格式的文件并清洗出所需數(shù)據(jù);
      [0012]A2、生成片段庫;
      [0013]A3、選取力場模型,力場模型表示形式如下:
      【權(quán)利要求】
      1.一種基于樹搜索和片段組裝的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法,其特征在于:所述預(yù)測方法包括以下步驟: Al、獲取蛋白質(zhì)的pdb格式的文件并清洗出所需數(shù)據(jù); A2、生成片段庫; A3、選取力場模型,力場模型表示形式如下:
      2.如權(quán)利要求1所述的一種基于樹搜索和片段組裝的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法,其特征在于:所述步驟Al中,從RCSB官網(wǎng)上下載所需的蛋白質(zhì)pdb文件,使用python腳本語言,編寫一個腳本程序,選出p db文件中包含蛋白質(zhì)原子詳細信息的那段信息,截取出來并保存成一個新的pdb文件。
      【文檔編號】G06F19/16GK103984878SQ201410138175
      【公開日】2014年8月13日 申請日期:2014年4月8日 優(yōu)先權(quán)日:2014年4月8日
      【發(fā)明者】張貴軍, 陳銘, 秦傳慶, 郝小虎, 周曉根, 梅珊, 李章維 申請人:浙江工業(yè)大學
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1