一種基于cid與etd質(zhì)譜譜圖融合的多肽從頭測序方法
【專利摘要】本發(fā)明提供了一種基于CID與ETD質(zhì)譜譜圖融合的多肽從頭測序方法,該方法包括以下步驟:1)對(duì)多肽進(jìn)行N-末端正電荷衍生;2)對(duì)步驟1)所得衍生多肽分別進(jìn)行CID質(zhì)譜裂解與ETD質(zhì)譜裂解;3)將步驟2)所得CID譜圖與ETD譜圖融合,得到CID-ETD融合譜圖;4)對(duì)CID-ETD融合譜圖進(jìn)行解析。本發(fā)明還提供了所述方法在多肽從頭測序中的應(yīng)用。本發(fā)明的提供的多肽從頭測序方法克服了單一的CID或ETD譜圖無法提供完整多肽碎裂信息的缺陷,可以得到高可信度的多肽從頭測序結(jié)果。
【專利說明】一種基于CID與ETD質(zhì)譜譜圖融合的多肽從頭測序方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及多肽分析領(lǐng)域,具體地,涉及一種多肽從頭測序方法,該方法通過將同一多肽段的CID譜圖與ETD譜圖相融合來解析多肽序列。
【背景技術(shù)】
[0002]在質(zhì)譜(Mass Spectrometry, MS)技術(shù)中,串聯(lián)質(zhì)譜(MS/MS)可用于獲得目標(biāo)物質(zhì)結(jié)構(gòu)的碎片,從而對(duì)目標(biāo)物質(zhì)進(jìn)行結(jié)構(gòu)分析。目前,通過液相色譜-串聯(lián)質(zhì)譜聯(lián)用系統(tǒng)(LC-MS/MS)可以很容易地分離與裂解復(fù)雜的多肽混合物,從而進(jìn)行蛋白質(zhì)的結(jié)構(gòu)分析。
[0003]數(shù)據(jù)庫檢索法是使用串聯(lián)質(zhì)譜進(jìn)行蛋白質(zhì)結(jié)構(gòu)分析時(shí)的常規(guī)方法。該方法是從特定的蛋白質(zhì)數(shù)據(jù)庫中提取目標(biāo)物質(zhì)所有的肽段序列,并將它們與串聯(lián)質(zhì)譜所得譜圖進(jìn)行比較和打分,找到可能性最大的肽段序列。但是,對(duì)于基因組未測序的物質(zhì),由于無法建立相應(yīng)的蛋白質(zhì)數(shù)據(jù)庫,常規(guī)的數(shù)據(jù)庫檢索方法無法獲得可以與質(zhì)譜譜圖進(jìn)行比較分析的多肽序列。
[0004]多肽從頭測序技術(shù)通過串聯(lián)質(zhì)譜譜圖上碎片離子之間的質(zhì)量差得到對(duì)應(yīng)的氨基酸殘基,可得到所有物種的肽段序列及翻譯后修飾,無需借助蛋白質(zhì)數(shù)據(jù)庫進(jìn)行檢索和比較即可對(duì)多肽序列進(jìn)行鑒定。多肽從頭測序有著很大的發(fā)展?jié)摿Γ悄壳暗涂尚哦鹊蔫b定結(jié)果限制了該技術(shù)的廣泛應(yīng)用。這種低可信度主要是由不充分的裂解以及同時(shí)產(chǎn)生的N-端系列離子和C-端系列離子相互重疊導(dǎo)致的。其中,N-端系列離子為a系列、b系列或c系列離子,C-端系列離子為X系列、y系列或z系列離子。
[0005]目前,為了避免N-端與C-端系列離子的重疊,提高多肽從頭測序的可信度,可采用多肽N-末端衍生技術(shù)進(jìn)行圖譜簡化處理。該技術(shù)包括多肽N-末端的負(fù)電荷衍生與正電荷衍生。其中,多肽N-末端正電荷衍生是指在多肽N-末端引入一個(gè)季銨基團(tuán)或季膦基團(tuán),從而提高二級(jí)譜圖中多肽N-末端a、b或c系列碎片離子的信號(hào)強(qiáng)度。(琥珀酰亞胺氧基羰基甲基)三(2,4,6-三甲氧苯基)溴化磷(Succinimidyloxycarbonylmethyltris(2, 4, 6-trimethoxyphenyl)phosphonium bromide, TMPP-Ac-OSu)是一種重要的多妝N-端正電荷衍生試劑,它可在一個(gè)簡單、快速、溫和的條件下對(duì)多肽的N-端進(jìn)行特異性的衍生,得到二價(jià)的TMPP-Ac衍生多肽。
[0006]碰撞誘導(dǎo)裂解(Collis1nInduced Dissociat1n, CID)與電子轉(zhuǎn)移裂解(Electron Transfer Dissociat1n,ETD)是質(zhì)譜的兩種不同裂解方式。二價(jià)的ΤΜΡΡ-Ac衍生多肽可以產(chǎn)生簡化的CID譜圖,圖中主要以一價(jià)b離子為主;二價(jià)的TMPP-Ac衍生多肽可以產(chǎn)生簡化的ETD譜圖,圖中只包含一價(jià)c離子和幾個(gè)已知的背景離子。大多數(shù)情況下,CID譜圖含有不完整的一價(jià)b系列離子,ETD譜圖含有不完整的一價(jià)c系列離子,同一多肽單獨(dú)的CID譜圖或ETD譜圖都無法提供充分的碎裂信息對(duì)多肽的序列進(jìn)行從頭鑒定。
[0007]同一多肽的CID譜圖與ETD譜圖提供的信息具有互補(bǔ)性,二者可以相互結(jié)合得到完整的多肽碎片信息。目前,尚無通過將同一多肽段的CID譜圖與ETD譜圖相融合的方法進(jìn)行多肽從頭測序的報(bào)道。
【發(fā)明內(nèi)容】
[0008]本發(fā)明的目的是提供一種多肽從頭測序方法,以克服單一的CID或ETD譜圖無法提供完整多肽碎裂信息的弊病,得到高可信度多肽從頭測序結(jié)果。
[0009]本發(fā)明提供了一種多肽從頭測序方法,該方法包括以下步驟:
[0010]I)對(duì)多肽進(jìn)行N-末端正電荷衍生;
[0011]2)對(duì)步驟I)所得衍生多肽進(jìn)行CID質(zhì)譜裂解與ETD質(zhì)譜裂解;
[0012]3)將步驟2)所得CID譜圖與ETD譜圖融合,得到CID-ETD融合譜圖;
[0013]4)對(duì)CID-ETD融合譜圖進(jìn)行解析。
[0014]具體地,
[0015]步驟I)所述正電荷衍生選用TMPP-Ac-OSu正電荷衍生試劑。
[0016]步驟2)所述質(zhì)譜裂解包括以下具體步驟:
[0017]①按照數(shù)據(jù)依賴模式(Data Dependent Decis1n Tree, DDDT)進(jìn)行一級(jí)質(zhì)譜譜圖米集;
[0018]②在每個(gè)一級(jí)譜圖中選擇三個(gè)強(qiáng)度最強(qiáng)的離子峰,進(jìn)行接下來的二級(jí)質(zhì)譜;
[0019]③將每個(gè)被選中的離子峰進(jìn)行一次CID裂解,得到CID譜圖;
[0020]④將每個(gè)被選中的離子峰再進(jìn)行一次ETD裂解,得到與步驟③所得CID譜圖對(duì)應(yīng)的ETD譜圖。
[0021]步驟3)所述譜圖的融合包括以下具體步驟:
[0022]①將步驟2所得.raw格式的CID譜圖與ETD譜圖分別轉(zhuǎn)化為.mgf格式的譜圖,轉(zhuǎn)化后的譜圖保留轉(zhuǎn)化前譜圖中所有母離子與碎片離子的信息;
[0023]②在.mgf格式的ETD譜圖中,將各離子峰的質(zhì)荷比(m/z)換算為離子的分子量,將分子量小于m、分子量大于η以及分子量分別等于p、q、r的離子移除,只保留一價(jià)c系列離子;
[0024]其中,
[0025]m = 646 ;
[0026]n = (m/z) 二價(jià)母離子 *2-128 ;
[0027]P = (m/z) 二價(jià)母離子 ±3.015 ;
[0028]q = [ (m/z) 二價(jià)母離子 *2—168.0781] ±3.015 ;
[0029]r = [(m/z) 二價(jià)母離子*2—533.1935] ±3.015 ;
[0030]③將一價(jià)c系列離子各自的分子量減去17.02655,得到虛擬的一價(jià)b系列離子;
[0031]④將虛擬的一價(jià)b系列離子的離子峰強(qiáng)度調(diào)整到與對(duì)應(yīng)的CID譜圖中最強(qiáng)的離子峰強(qiáng)度相等;
[0032]⑤將步驟④所得ETD譜圖疊加到對(duì)應(yīng)的.mgf格式的CID譜圖中,得到CID-ETD融合譜圖,該譜圖中只含有一價(jià)b系列離子。
[0033]步驟4)所述譜圖解析的工具選用PEAKS工作站。
[0034]本發(fā)明還提供了所述方法在多肽從頭測序中的應(yīng)用。
[0035]所述應(yīng)用包括對(duì)基因組未測序物種多肽的從頭測序。
[0036]本發(fā)明的技術(shù)特點(diǎn)在于:[0037]本發(fā)明用簡易的方法將同一多肽的ETD譜圖與CID譜圖相融合,融合后的CID-ETD融合譜圖有著突出的技術(shù)效果:其包含目標(biāo)多肽完整的一價(jià)b系列離子,使大量的不能通過CID譜圖或ETD譜圖得到解析的多肽序列可以被成功解析出來。
【專利附圖】
【附圖說明】
[0038]圖1,為草鯉多肽混合物的從頭測序鑒定結(jié)果;其中,(a)為被鑒定多肽的假陽性率分布圖,(b)為被鑒定多肽的檢索分?jǐn)?shù)分布圖。
[0039]圖2,為根據(jù)CID-ETD融合譜圖分析得到的草鯉非已知多肽序列“SNTLNFAVGYK” (A)和 “LQAALDNEANR” (B)。
[0040]圖3,為經(jīng)過正電荷衍生后的已知序列多肽“HADICTLPDTEK”的質(zhì)譜譜圖以及使用PEAKS工作站對(duì)質(zhì)譜譜圖進(jìn)行分析得到的多肽序列;其中,A為多肽的CID譜圖;B為根據(jù)CID譜圖分析得到的多肽序列;C為多肽的ETD譜圖;D為根據(jù)ETD譜圖分析得到的多肽序列;E為多肽的CID-ETD融合譜圖;F為根據(jù)CID-ETD融合譜圖分析得到的多肽序列。
【具體實(shí)施方式】
[0041]以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
[0042]實(shí)施例1:
[0043]1、樣品來源:
[0044]使用細(xì)胞裂解液提取來自基因組未測序草鯉的背部組織蛋白,所述細(xì)胞裂解液含有7M尿素、2M硫脲、2% CHAPS、10%核酸酶和1%蛋白酶抑制劑;取蛋白樣品lOOmg,使用12.5%的SDS-PAGE凝膠進(jìn)行蛋白質(zhì)分離;經(jīng)6_250染色后,將含有蛋白質(zhì)的凝膠帶切下;使用1mM的DTT和25mM的碘乙酰胺對(duì)蛋白質(zhì)進(jìn)行還原與封閉;使用胰蛋白酶對(duì)蛋白質(zhì)進(jìn)行酶切;多肽混合物即得。
[0045]2、實(shí)驗(yàn)步驟:
[0046]I)多肽的衍生:
[0047]①反應(yīng)體系的制備與平衡:在20 μ L的Eppendorf槍頭底部由下至上順序設(shè)置C8填料層、SCX填料層和C8填料層,得到C8-SCX-C8衍生反應(yīng)體系;將反應(yīng)體系用100 μ L45%的乙腈清洗,用10yL0.1%的三氟乙酸平衡;
[0048]②衍生反應(yīng):將步驟I所得多肽混合物約50 μ g與TMPP-Ac-OSu試劑(購自Sigma公司)ΙΟΟμ g混合溶解于含5%乙腈與0.1 %三氟乙酸的水溶液,載入反應(yīng)體系最上層;載入pH8.2、濃度為20mmol/L的碳酸氫鈉緩沖液100 μ L引發(fā)衍生反應(yīng);室溫下孵育2小時(shí)后,使用0.1 %的三氟乙酸ΙΟΟμ L清洗,終止反應(yīng);
[0049]③副產(chǎn)物的去除:使用ρΗ3.0、含有5mmol/L的磷酸二氫鉀和45%的乙腈的緩沖液100 μ L進(jìn)行洗脫;待以TMPP-Ac-OH為主的反應(yīng)副產(chǎn)物去處后,使用ρΗ3.0、含有5mmol/L的磷酸二氫鉀、500mmol/L的氯化鉀和45%的乙腈的緩沖液100 μ L進(jìn)行洗脫;
[0050]④衍生多肽的脫鹽與洗脫:使用0.1 %三氟乙酸100μ L進(jìn)行脫鹽,使用45%的乙腈100 μ L進(jìn)行洗脫,衍生多肽樣品即得。
[0051]2)多肽的質(zhì)譜分析:
[0052]①分析方法:LC_MS/MS;[0053]②儀器:LTQOrbitrap XL,購自 ThermoFisher Scientific 公司;
[0054]③色譜條件:
[0055]進(jìn)樣量:1yL;
[0056]固定相:C8;
[0057]流動(dòng)相:流動(dòng)相A為0.1%甲酸水溶液;流動(dòng)相B為含有0.1%甲酸的乙腈溶液;
[0058]流動(dòng)相梯度洗脫模式為:
【權(quán)利要求】
1.一種基于CID與ETD質(zhì)譜譜圖融合的多肽從頭測序方法,該方法包括以下步驟:I)對(duì)多肽進(jìn)行N-末端正電荷衍生;2)對(duì)步驟I)所得衍生多肽分別進(jìn)行CID質(zhì)譜裂解與ETD質(zhì)譜裂解;3)將步驟2)所得CID譜圖與ETD譜圖融合,得到CID-ETD融合譜圖;4)對(duì)CID-ETD融合譜圖進(jìn)行解析。
2.根據(jù)權(quán)利要求1所述的多肽從頭測序方法,其特征在于,步驟I)所述正電荷衍生選用TMPP-Ac-OSu正電荷衍生試劑。
3.根據(jù)權(quán)利要求1所述的多肽從頭測序方法,其特征在于,步驟2)所述質(zhì)譜裂解包括以下具體步驟: ①按照數(shù)據(jù)依賴模式進(jìn)行一級(jí)質(zhì)譜譜圖采集; ②在每個(gè)一級(jí)譜圖中選擇三個(gè)強(qiáng)度最強(qiáng)的離子峰,進(jìn)行接下來的二級(jí)質(zhì)譜; ③將每個(gè)被選中的離子峰進(jìn)行一次CID裂解,得到CID譜圖; ④將每個(gè)被選中的離子峰再進(jìn)行一次ETD裂解,得到與步驟③所得CID譜圖對(duì)應(yīng)的ETD譜圖。
4.根據(jù)權(quán)利要求1所述的多肽從頭測序方法,其特征在于,步驟3)所述譜圖的融合包括以下具體步驟: ①將步驟2)所得.raw格式的CID譜圖與ETD譜圖分別轉(zhuǎn)化為.mgf格式的譜圖,轉(zhuǎn)化后的譜圖保留轉(zhuǎn)化前 譜圖中所有母離子與碎片離子的信息; ②在.mgf格式的ETD譜圖中,將各尚子峰的質(zhì)荷比(m/z)換算成尚子的分子量,將分子量小于m、分子量大于η以及分子量分別等于P、q、r的離子移除,只保留一價(jià)c系列離子; 其中, m = 646 ;
n = (m/z) 二價(jià)母離子 *2-128 ;
P = (m/z) 二價(jià)母離子土 3.015 ;
q = [ (m/z) 二價(jià)母離子*2—168.0781] ±3.015 ;
r = [ (m/z) 二價(jià)母離子 *2—533.1935] ±3.015 ; ③將一價(jià)c系列離子各自的分子量減去17.02655,得到虛擬的一價(jià)b系列離子; ④將虛擬的一價(jià)b系列離子的離子峰強(qiáng)度調(diào)整到與對(duì)應(yīng)的CID譜圖中最強(qiáng)的離子峰強(qiáng)度相等; ⑤將步驟④所得ETD譜圖疊加到對(duì)應(yīng)的.mgf格式的CID譜圖中,得到CID-ETD融合譜圖,該譜圖中只含有一價(jià)b系列離子。
5.根據(jù)權(quán)利要求1所述的多肽從頭測序方法,其特征在于,步驟4)所述譜圖解析的工具選用PEAKS工作站。
6.權(quán)利要求1所述方法在多肽從頭測序中的應(yīng)用。
7.根據(jù)權(quán)利要求6所述的應(yīng)用,其特征在于,包括在基因組未測序物種多肽從頭測序中的應(yīng)用。
【文檔編號(hào)】G01N27/62GK104034791SQ201410184470
【公開日】2014年9月10日 申請(qǐng)日期:2014年5月4日 優(yōu)先權(quán)日:2014年5月4日
【發(fā)明者】紀(jì)建國, 王青松, 安明瑞 申請(qǐng)人:北京大學(xué)