蛋白質(zhì)三維結(jié)構(gòu)中金屬離子結(jié)合位點單配體殘基模板庫的建立方法及基于此的預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及生物信息學、結(jié)構(gòu)生物學、計算生物學領(lǐng)域,尤其設(shè)及基于蛋白質(zhì)Ξ維 空間結(jié)構(gòu)的金屬位點研究領(lǐng)域,更具體地設(shè)及一種蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點單 配體殘基模板庫的建立方法及基于此的預(yù)測方法。
【背景技術(shù)】
[0002] 包含金屬離子的金屬蛋白約占蛋白質(zhì)總量的Ξ分之一,廣泛存于自然界中發(fā)揮著 豐富多彩的生物學功能。金屬離子結(jié)合位點往往是酶的催化中屯、或起到結(jié)構(gòu)穩(wěn)定或調(diào)節(jié)等 重要作用。確定天然未知蛋白包含哪種金屬離子、結(jié)合位點位置W及W何種方式結(jié)合有助 于預(yù)測和研究該金屬蛋白的功能。然而,現(xiàn)代分子生物學研究往往采用異源表達方式得到 目標蛋白,在表達和分離純化過程中金屬離子也可能丟失或被替換,最終制備的未知蛋白 未必是其天然活性態(tài)的金屬結(jié)合形式。另一方面,隨著結(jié)構(gòu)基因組計劃廣泛開展,大量未知 功能蛋白結(jié)構(gòu)被測定,如何預(yù)測運些未知蛋白功能成為一個重要領(lǐng)域。其中,如何預(yù)測未知 蛋白中的金屬離子是一個重要方向,已有多種方法報道?,F(xiàn)有報道的方法對已知蛋白的預(yù) 測效果較好,但對未知蛋白特別是蛋白折疊類型或金屬離子配體殘基組合類型等未曾報道 的未知蛋白的預(yù)測效果較差。然而只有對未知蛋白預(yù)測是真正有意義的,如何實現(xiàn)對未知 蛋白中金屬結(jié)合位點更高的預(yù)測性能(高敏感性及高特異性),且能推廣應(yīng)用于多種金屬離 子類型的結(jié)合位點是科研工作者亟需解決的問題。
[0003] 本發(fā)明人在2011年發(fā)表了基于模板殘基對匹配預(yù)測鋒結(jié)合位點的TEMSP方法 ("Structure-b曰sed de novo prediction of zinc-binding sites inproteins ofunknown function",《Bioinfo;rmatics》(W下簡稱文獻1))。在該文中詳述了,TEMSP方法 W殘基對(residue pairs)為單位,基于未知蛋白中的殘基對與天然蛋白中金屬結(jié)合位點 配體殘基對的構(gòu)象相近的原理做初始預(yù)測。TEMSP方法較其他方法預(yù)測性能有較大提升,但 對未知蛋白的預(yù)測性能仍然較低。仍存在不足是,因為TEMSP方法W殘基對為單位同時依據(jù) 模板構(gòu)象預(yù)測潛在配體殘基側(cè)鏈構(gòu)象,當預(yù)測的金屬結(jié)合位點殘基數(shù)目是奇數(shù)時,至少有 一個潛在配體殘基側(cè)鏈構(gòu)象預(yù)測會用到兩個模板,導(dǎo)致會同時輸出兩個側(cè)鏈構(gòu)象預(yù)測結(jié) 構(gòu)。本專利是W單殘基為模板基礎(chǔ),實現(xiàn)了很大跨越,可W良好的解決前述方法的不足。由 于起始基礎(chǔ)不同,上層構(gòu)架和后面的很多分析處理環(huán)節(jié)也和2011年文章有很大不同。文獻1 的所有內(nèi)容都通過引用的方式并入本文。
【發(fā)明內(nèi)容】
[0004] 有鑒于此,本發(fā)明的主要目的在于提供一種蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點 單配體殘基模板庫的建立方法,W及一種基于其的預(yù)測方法。
[0005] 為了實現(xiàn)上述目的,作為本發(fā)明的一個方面,本發(fā)明提供了一種蛋白質(zhì)Ξ維結(jié)構(gòu) 中金屬離子結(jié)合位點單配體殘基模板庫的建立方法,包括W下步驟:
[0006] 收集蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點的單殘基匹配信息;
[0007] 從獲得的所述匹配信息中提取蛋白質(zhì)鏈上規(guī)則的金屬結(jié)合位點局域結(jié)構(gòu);
[0008] 分解所述金屬結(jié)合位點,建立單配體殘基與金屬離子相對空間位置關(guān)系的模板 庫。
[0009] 作為本發(fā)明的另一個方面,本發(fā)明還提供了一種基于蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子 結(jié)合位點的單配體殘基模板庫的預(yù)測方法,其特征在于,包括W下步驟:
[0010] 通過預(yù)先建立的蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點單配體殘基模板庫中的模 板與待預(yù)測蛋白質(zhì)上的同類型殘基進行匹配,W此對蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點 的單配體殘基是否匹配進行預(yù)測;
[0011] 其中,所述預(yù)先建立的蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點單配體殘基模板庫是 根據(jù)如上所述蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點單配體殘基模板庫的建立方法建立的。
[0012] 作為本發(fā)明的再一個方面,本發(fā)明還提供了一種基于蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子 結(jié)合位點的單配體殘基模板庫的預(yù)測方法,其特征在于,包括W下步驟:
[0013] a. W兩個殘基的Ce-Ca-C原子疊合方式,將預(yù)先建立的單配體殘基模板庫中每個與 目標殘基類型一致的模板逐個疊合代入待預(yù)測蛋白質(zhì)的結(jié)構(gòu)中,W疊合后的模板殘基側(cè)鏈 構(gòu)象,預(yù)測待預(yù)測蛋白質(zhì)的結(jié)構(gòu)中該潛在配體殘基結(jié)合相同金屬離子時的構(gòu)象態(tài);
[0014] b.分析兩兩潛在配體殘基結(jié)合相應(yīng)金屬離子時的構(gòu)象態(tài)組合在一起是否也滿足 結(jié)合該金屬離子的空間立體構(gòu)象必要條件,W此篩選出結(jié)合該金屬離子的第一潛在配體殘 基和第二潛在配體殘基W及初步預(yù)測結(jié)合的金屬離子坐標;
[0015] C.W初步預(yù)測結(jié)合的金屬離子坐標與周圍殘基的相對位置關(guān)系,W關(guān)鍵幾何量D、 G、C值作為篩選待預(yù)測蛋白質(zhì)上潛在配體殘基的指標,確定出少數(shù)可能的模板,其中D值為 金屬離子Μ與單配體殘基Ce原子的距離;G值為M-Ce-CaS原子形成夾角;C值為M-Ce-Ca-C四原 子形成的二面角;再W步驟a中所述的方法預(yù)測出第Ξ潛在配體殘基結(jié)合相同金屬離子時 的構(gòu)象態(tài),再次篩選Ξ個潛在配體殘基在各自模板指導(dǎo)下的構(gòu)象態(tài)組合在一起是否也滿足 結(jié)合該金屬離子的空間立體構(gòu)象必要條件;
[0016] d.如步驟C所述,篩選潛在的其它配體殘基;
[0017] e.當一個金屬結(jié)合位點中所有潛在配體殘基逐次篩選完后,采用位點整體評估打 分排序的策略做最終篩選,其中所述的打分通過計算偏差值實現(xiàn),打分函數(shù)基于預(yù)測的構(gòu) 象態(tài)與來自天然的單配體模板及金屬結(jié)合位點空間幾何特性雙重偏差得到。
[0018] 基于上述技術(shù)方案可知,本發(fā)明的方法可實現(xiàn)不依賴待檢索蛋白質(zhì)殘基側(cè)鏈構(gòu)象 的預(yù)測,即僅提供待檢索蛋白質(zhì)的主鏈結(jié)構(gòu)及Ce坐標,加上輸入蛋白質(zhì)序列,而不必輸入每 個殘基側(cè)鏈構(gòu)象坐標,本方法仍能預(yù)測出相應(yīng)的金屬結(jié)合位點。
【附圖說明】
[0019] 圖1為作為本發(fā)明一個優(yōu)選實施例的本發(fā)明預(yù)測方法的總流程圖;
[0020] 圖2為本發(fā)明建立蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點的單殘基匹配組合模板庫 的方法流程圖;
[0021] 圖3為本發(fā)明預(yù)測蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點的單殘基匹配組合的方法 流程圖。
【具體實施方式】
[0022] 下面結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整 地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒?發(fā)明的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施 例,都屬于本發(fā)明的保護范圍。
[0023] 本發(fā)明公開了一種預(yù)測蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點的單殘基匹配組合 的方法,該方法開發(fā)了一種W天然存在的單配體殘基金屬結(jié)合態(tài)為模板,W關(guān)鍵幾何量D、 G、C值為模板與潛在配體殘基是否匹配的檢索篩選條件,先由潛在第一、第二配體殘基確定 金屬的可能位置,再逐步加入第Ξ甚至第四配體殘基,最后計算預(yù)測位點與天然和標準位 點構(gòu)象偏差Deviation值,對其作為計分法的最后總排序,由此篩選出最終結(jié)果。
[0024] 更具體地,本發(fā)明公開了一種蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點單配體殘基模 板庫的建立方法,包括W下步驟:
[0025] 收集蛋白質(zhì)Ξ維結(jié)構(gòu)中金屬離子結(jié)合位點的單殘基匹配信息;