本發(fā)明屬于生物信息學領域,涉及一種rna假結的loop區(qū)域和stem區(qū)域的模擬方法及應用。
背景技術:
1、rna分子在細胞內(nèi)實現(xiàn)多種生物學功能,從遺傳信息的轉移,作為dna轉移到蛋白質(zhì)的中間體,以及酶催化等一系列的作用。rna分子的三維結構在很大程度上是由堿基配對的核苷酸對之間的相互作用決定的。rna分子的二級結構是三維結構中堿基對的集合。因此,二級結構可以用來作為預測較高結構水平的基礎。rna的一級結構信息可以利用實驗大量獲得,但利用實驗獲得rna的三維結構,會使得花費成本大,難度高,并且不是所有的三維結構都能從實驗測得。
2、隨著計算機的不斷發(fā)展,人們已經(jīng)可以利用理論方法預測rna的結構。預測的準確度取決于折疊結構的假設與潛在的能量模型。在結構預測中,比較常見的一種是堿基最大配對方法,該方法是基于rna的結構保守性的基礎上發(fā)展的一種算法,主要是依賴于序列的比對效果。但這種方法的缺點主要是保守區(qū)域的序列比對。另一種是最小自由能方法,主要是尋找一個處在能量穩(wěn)定的狀態(tài)下互補的結構。隨著不斷的發(fā)展和研究,預測rna二級結構的方法也越來越多。
3、假結是一種典型的三級結構,假結在生物學功能中具有不同的作用,例如包括自我剪切內(nèi)含子,形成各種核酶的催化核心、端粒酶、核糖開關和核糖體移碼。假結的生物學功能與其直接相關折疊穩(wěn)定性和構象變化。在rna假結中,穩(wěn)定性和折疊熱力學是主要取決于環(huán)區(qū)和莖區(qū)之間的相互作用。例如,假結在折疊過程中涉及幾種中間體。研究rna假結結構如何折疊和形成,在折疊過程中可能會形成錯誤折疊的中間體,因此建立正確的模型對于預測rna假結的結構預測是非常重要的。
4、現(xiàn)有技術中對于經(jīng)典的rna二級結構的熱力學參數(shù)進行了測定和估計類似,對于rna假結的一些模型結構的熱力學參數(shù)進行了測定,表明了溶液中的離子濃度對于rna的假結的穩(wěn)定性非常重要。并且對于假結中折疊過程中涉及到的構象轉變可能包含有中間步,主要是形成發(fā)夾的過程中。所以研究假結結構的環(huán)區(qū)域?qū)τ诮Y構穩(wěn)定性的貢獻非常困難,特別是包含至少兩個環(huán)結構的假結。對于假結的問題,已開發(fā)了許多算法以試圖做出準確的預測。但是由于rna假結的緊密結構使得假結中會形成原子與原子之間的非鍵相互作用,比如范德瓦爾斯作用,靜電作用,以及體積排斥等。所以在利用二級結構中的熱力學參數(shù)預測假結結構是不準確的。
技術實現(xiàn)思路
1、針對現(xiàn)有技術存在的問題,本發(fā)明以h型rna假結為研究基礎,提供了一種rna假結的loop區(qū)域和stem區(qū)域的模擬方法及應用。h型rna假結是由兩個螺旋組成莖(stem)和兩個跨越螺旋莖的環(huán)(loop)。rna假結構定義為具有堿基的結構環(huán)與rna的其他區(qū)域之間的配對。此外,rna的二級結構信息是預測其三級結構的關鍵步驟。預測rna二級結構的本質(zhì)就是在一級結構的基礎上,找出二級結構中stem區(qū)域堿基的配對,以及l(fā)oop區(qū)域的熱力學。本發(fā)明利用全原子動力學模擬來研究h-type假結中l(wèi)oop區(qū)域?qū)tem區(qū)域熱力學以及動力學性質(zhì)的影響。
2、一方面,本發(fā)明提供了一種rna假結的loop區(qū)域和stem區(qū)域的模擬方法,具體包括如下步驟:
3、s1.模擬方法的選擇:采用全原子力場和分子動力學模擬軟件進行rna結構的模擬;
4、s2.rna假結結構的選擇:h型rna假結;
5、s3.模擬系統(tǒng)的構建:突變h型rna假結stem區(qū)域末端的堿基,平衡模擬系統(tǒng)電荷,設定離子濃度,在水盒子中建立模擬系統(tǒng);
6、s4.模擬參數(shù)設置:處理靜電相互作用以及分子間相互作用,約束鍵長,并計算運動方程。
7、進一步地,本發(fā)明所述的h型rna假結的晶體結構為pdb?id:1hvu;
8、所述pdb?id:1hvu包括stem1區(qū)域、stem2區(qū)域、loop1區(qū)域和loop2區(qū)域;
9、所述stem1區(qū)域包含5個堿基堆積;所述stem2區(qū)域包含6個堿基堆積;
10、所述loop1區(qū)域包含2個核苷酸;所述loop2區(qū)域包含3個核苷酸。
11、進一步地,本發(fā)明所述的pdb?id:1hvu中所述loop1區(qū)域處在所述stem2區(qū)域形成的大溝中,所述loop2區(qū)域穿過所述stem1區(qū)域形成的小溝。
12、進一步地,本發(fā)明所述一種rna假結的loop區(qū)域和stem區(qū)域的模擬方法中模擬系統(tǒng)的構建包括:平衡模擬系統(tǒng)電荷為在系統(tǒng)中添加na+使模擬系統(tǒng)處于電荷中性;
13、所述設定離子濃度包括在pdb?id:1hvu晶體結構初始位置隨機添加na+和cl-;
14、所述保持模擬系統(tǒng)中水分子完全剛性為tip3p水模型和settle算法結合使用;
15、所述模擬水立方體盒子為所述模擬水立方體盒子利用周期性邊界條件,確保所述模擬水立方體盒子每個方向有三個或四個溶劑層。
16、所述模擬系統(tǒng)中包含26356個原子。
17、進一步地,發(fā)明所述一種rna假結的loop區(qū)域和stem區(qū)域的模擬方法中模擬參數(shù)設置包括:所述靜電相互作用的截斷距離為
18、所述分子間相互作用的截斷距離為
19、所述溶質(zhì)的鍵長使用相鄰的網(wǎng)格搜索方法,每十步更新一次;
20、所述運動方程的時間步長為2fs,坐標每2ps保存一次。
21、所述模擬系統(tǒng)在290k時的構象為初始結構。
22、另一方面,本發(fā)明提供了一種rna假結的loop區(qū)域和stem區(qū)域的模擬方法在預測rna假結結構中的應用。
23、進一步地,本發(fā)明預測rna假結結構包括開放stem區(qū)域末端的一對核苷酸以及l(fā)oop區(qū)域的核苷酸,統(tǒng)計stem區(qū)域堿基對的打開閉合幾率以及打開態(tài)與閉合態(tài)熵變和焓變。
24、進一步地,本發(fā)明計算了stem2區(qū)域的兩個堿基(u8以及a27)的rmsd(均方根偏差)和二面角,當堿基u8的rmsd大于并且二面角在-140°到100°之間,或者滿足對于堿基a27,rmsd大于并且扭轉角為約50°到100°之間。這兩個條件其中一個滿足或者兩者都滿足條件,構象就被定義為打開態(tài)。在這種狀態(tài)下,即堿基u8和堿基a27的其中一個堿基甩到溶劑中堿基對和堿基堆疊被破壞。
25、進一步地,本發(fā)明計算了打開態(tài)和閉合態(tài)的熱力學參數(shù),發(fā)現(xiàn)loop區(qū)域的存在使得stem區(qū)域的融解溫度降低,并且得到的焓變變大,熵變也變大。
26、進一步地,本發(fā)明計算了打開態(tài)和閉合態(tài)的動力學參數(shù),發(fā)現(xiàn)loop區(qū)域的存在沒有改變打開速率,而使得閉合速率變小。
27、與現(xiàn)有技術相比,本發(fā)明提供的技術方案至少具備下述的有益效果或優(yōu)點:
28、本發(fā)明通過長時間的高溫分子動力學模擬研究了h型假結的熱力學與動力學性質(zhì),利用堿基對的打開與閉合之間的轉換平衡,以及通過分析模擬軌跡得到了stem區(qū)域末端的堿基對的熱力學和動力學參數(shù)。得到以下結果,loop區(qū)域的存在使得stem區(qū)域的融解溫度降低。但loop區(qū)域的存在使得焓變變大,熵變變大。并且在相同的模擬溫度下,loop區(qū)域的存在打開速率變大,而使得閉合速率變小。這些結論表明loop區(qū)域?qū)τ趕tem區(qū)域的熱力學與動力學都有影響。因此,本發(fā)明通過研究loop區(qū)域?qū)τ趕tem區(qū)域的影響,為以后的結構預測提供可靠的參數(shù)。