一種鏈特異性全基因組范圍內(nèi)研究apa的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明 SS_3T_seq(Strand-specific 3'Terminal Sequencing)涉及一種鏈特異 性mRNA 3'末端非編碼區(qū)高通量測序文庫的構(gòu)建方法,用于在全基因組范圍內(nèi)研宄選擇性 多聚腺苷酸化(Alternative Polyadenylation,APA)〇
【背景技術(shù)】
[0002] 在全基因組范圍內(nèi)研宄APA變化現(xiàn)有的技術(shù)有多種,但方法原理都相近,現(xiàn)列舉 出兩種最具有代表性的。
[0003] 圖1和圖2展示了這兩種方法的實(shí)驗(yàn)原理圖:
[0004]圖 1 是 SAPAS(Sequencing APA Sites),將 RNA 直接加熱斷裂后,用含有 oligo dT的引物逆轉(zhuǎn)錄出第一鏈cDNA,鏈置換的方法合成雙鏈cDNA。然后用突變的〇1 igo dT(TTTTCTTTTTTCTTTTTT)與測序接頭連接作為PCR引物擴(kuò)增,擴(kuò)增出的產(chǎn)物中則不含有多 聚A(poly A)結(jié)構(gòu),以此避免多聚結(jié)構(gòu)對測序質(zhì)量的影響。SAPAS法的缺點(diǎn)是不能徹底消除 多聚A未切除對高通量測序質(zhì)量的影響。
[0005] 圖 2 是 3P_Seq (Poly (A) Position Profiling by sequencing),用 oligo dT 將含 有多聚A序列的RNA篩選出后,3'端加上一個(gè)帶生物素(Biotin)修飾的RNA接頭,然后經(jīng) 過RNase T1斷裂RNA后用含有鏈霉親和素的磁珠(Beads)篩選含有多聚A的片段,再用只 含有dTTP的逆轉(zhuǎn)錄體系將多聚A結(jié)構(gòu)逆轉(zhuǎn)錄成雜合雙聯(lián),利用RNase H的特性水解多聚A 結(jié)構(gòu),將含有APA位點(diǎn)的片段從磁珠上釋放下來,兩端加上RNA接頭后合成雙鏈cDNA,PCR 擴(kuò)增后即為可用于測序的文庫。3P_Seq法的缺點(diǎn)是RNA水平操作繁雜,需經(jīng)過多步的RNA 連接和酶切,對RNA的損傷和損失也較大,不適用于少量樣品文庫的構(gòu)建,且此方法難度較 大、成本較高。
[0006] 此外,以上兩種方法的斷裂方式都具有局限性,RNase T1酶切斷裂(3P-Seq)和 RNA直接加熱斷裂(SAPAS)的方法不能做到既能不損傷RNA同時(shí)又能隨即斷裂。且很多 基因組同一區(qū)域同時(shí)具有正負(fù)鏈的轉(zhuǎn)錄本,而現(xiàn)有技術(shù)方法均不可知轉(zhuǎn)錄本鏈的方向性信 息,即測序所得的序列來自DNA雙鏈的正鏈還是負(fù)鏈。
[0007] 因此本領(lǐng)域技術(shù)人員致力于開發(fā)一種盡可能減少RNA水平操作,在DNA水平移除 多聚A序列,消除多聚結(jié)構(gòu)對測序的影響的方法,同時(shí)該方法又能保留鏈的方向性信息。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明的目的是提供一種鏈特異性全基因組范圍內(nèi)研宄APA的方法,該方法在 DNA水平移除多聚A序列,同時(shí)又能保留鏈的方向信息。
[0009] 本發(fā)明提供的方法名為鏈特異性3'端測序法(SS-3T_seq,Strand-specific 3' Terminal Sequencing),該方法用于在全基因組范圍內(nèi)研宄APA的變化。
[0010] 所述方法包括以下步驟:
[0011] (1)構(gòu)建一種特殊的含有oligo dT的磁珠,用這種磁珠篩選含有多聚A的RNA,所 述磁珠既能篩選含有多聚A的RNA,同時(shí)又含有酶切位點(diǎn)移除文庫中的多聚A結(jié)構(gòu);
[0012] (2)在磁珠上逆轉(zhuǎn)錄合成第一鏈cDNA,逆轉(zhuǎn)錄體系中用甲基化的dCTP替代正常的 dCTP ;
[0013] (3)用特殊的dNTP合成雙鏈cDNA,所述特殊的dNTP是指其中用dUTP代替dTTP, 經(jīng)過斷裂后磁珠上留下的即為含有APA位點(diǎn)的片段;
[0014] (4)再經(jīng)過Gsu I酶切除去多聚A結(jié)構(gòu),將目的片段從磁珠上釋放下來;
[0015] (5)目的片段兩端經(jīng)過修飾后添加Illumina測序接頭;
[0016] (6)經(jīng)過片段大小篩選后,用USER酶處理以除去第二鏈中的dUTP,只剩余第一鏈 做PCR擴(kuò)增,即得到用于Illumina二代測序的文庫。
[0017] 優(yōu)選地,在本發(fā)明方法進(jìn)行之前,先對抽提的總RNA進(jìn)行質(zhì)量檢測,所述質(zhì)量檢測 的方法可以是瓊脂糖甲醛變性電泳或者用安捷倫2100Bioanaly Zer檢測,高質(zhì)量的RNA做 起始材料對精確分析APA變化很重要。
[0018] 優(yōu)選地,本發(fā)明方法適用于10 y g-100 y g的總RNA做為起始材料。
[0019] 優(yōu)選地,步驟(3)中合成雙鏈cDNA的過程中采用RNase H、Ecoli. DNA Polymerase、Ecoli. DNA ligase 三種酶。
[0020] 優(yōu)選地,步驟(5)中所述目的片段的兩端修飾是指形成平末端,且在5'端加上磷 酸化基團(tuán),在3'端添加一個(gè)堿基A ;所述添加Illumina測序接頭的具體方法為將修飾后的 目的片段與Illumina P5/P7接頭連接,連接酶優(yōu)選為T4DNA ligase。
[0021] 優(yōu)選地,步驟(6)中所述片段大小篩選采用2. 5%的瓊脂糖凝膠電泳分離片段。
[0022] 本發(fā)明方法的原理圖參見圖3,以下進(jìn)一步描述本發(fā)明的原理。
[0023] (一)關(guān)于特殊oligo dT磁珠的構(gòu)建
[0024] 普通的商業(yè)oligo dT磁珠用于篩選含有多聚A的RNA,而經(jīng)過改進(jìn)后的oligo dT 磁珠既能篩選含有多聚A的RNA,同時(shí)含有酶切位點(diǎn)移除文庫中的多聚A結(jié)構(gòu)。
[0025] 本發(fā)明所述構(gòu)建的特殊的磁珠具有以下特點(diǎn):
[0026] (1)oligo dT的3'端最后兩個(gè)T之間用硫代磷酸修飾,能夠在后期片段末端修飾 的時(shí)候保護(hù)APA位點(diǎn)不被核酸外切酶意外切除,同時(shí)保留4個(gè)T在APA位點(diǎn)旁邊用于后期 數(shù)據(jù)處理時(shí)數(shù)據(jù)的篩選;
[0027] (2)oligo dT序列的5'端加上一個(gè)Gsu I的酶切識別位點(diǎn)以及9個(gè)堿基的保護(hù)序 列,用以多聚A結(jié)構(gòu)的移除;
[0028] (3)引物的5'端添加生物素修飾,用以連接帶有鏈霉親和素的磁珠。
[0029] 進(jìn)一步地,與磁珠相連的引物序列如下:
[0030] 5, -Biotin-GAGCTAGITCTGGAGITITITITITITITITITITVN-3,其中第 19 位 T 和第 20 位T之間是用硫代磷酸修飾的。
[0031] (二)關(guān)于斷裂方式的選擇
[0032] 可以選擇的DNA斷裂方式包括超聲斷裂、DNase I處理等方法,但是超聲斷裂的方 法若控制不好很容易將整個(gè)DNA分子從磁珠上斷裂下來,DNase I反應(yīng)劇烈不容易控制斷 裂產(chǎn)物片段大小。
[0033] 為了減少對RNA的損傷,本發(fā)明優(yōu)選地采用在DNA階段斷裂。雙鏈cDNA合成后, 使用雙鏈cDNA斷裂酶將雙鏈cDNA斷裂成200-400bp的片段,經(jīng)過磁珠篩選后,掛在磁珠上 的片段即為靠近RNA 3'端且含有多聚A位點(diǎn)的片段,其中所述雙鏈cDNA斷裂酶優(yōu)選為NEB 公司的產(chǎn)品。
[0034](三)關(guān)于移除多聚A結(jié)構(gòu)的策略
[0035] 為了方便操作和降低實(shí)驗(yàn)難度,本發(fā)明選擇在DNA水平移除多聚A結(jié)構(gòu)。在逆轉(zhuǎn) 錄時(shí),在oligo dT的5'端引入Gsu I的酶切識別位點(diǎn),Gsu I是一種第三型限制性內(nèi)切 酶,在識別位點(diǎn)的下游16個(gè)堿基的位置切割形成兩個(gè)堿基的粘性末端,而且具有一種甲基 化封閉特性。當(dāng)識別位點(diǎn)(CTGGAG)中的堿基C被甲基化時(shí),則這個(gè)識別位點(diǎn)被封閉,無法 識別。由于多聚A結(jié)構(gòu)的移除的同時(shí)也將文庫片段從磁珠上釋放下來,為了防止移除多聚 結(jié)構(gòu)時(shí)文庫片段上也含有這個(gè)酶切位點(diǎn)造成APA位點(diǎn)的假陽性,本發(fā)明在逆轉(zhuǎn)錄的時(shí)候使 用甲基化的dCTP替代正常的dCTP,而在第二鏈cDNA合成的時(shí)候換回正常的dCTP,這樣就 可以在保證設(shè)計(jì)的Gsu I酶切位點(diǎn)完好的同時(shí)使其他識別位點(diǎn)被甲基化封閉,避免的假陽 性結(jié)果的產(chǎn)生。
[0036] (四)TTTT標(biāo)簽用于篩選數(shù)據(jù)精確定位APA位點(diǎn)
[0037] 本發(fā)明設(shè)計(jì)用于反轉(zhuǎn)的引物中含有20個(gè)T,Gsu I移除多聚A時(shí)切去16個(gè),留下 4個(gè)T的粘性末端在末端修飾時(shí)被切除,所以真正留在文庫片段上的是含有硫代磷酸修飾 的4個(gè)T用以標(biāo)記文庫片段的APA位點(diǎn)。
[0038] 本發(fā)明具有以下有益技術(shù)效果:
[0039] 1、實(shí)驗(yàn)操作簡單,RNA水平操作較少,簡化實(shí)驗(yàn)流程,降低步驟繁瑣引起的損失,同 時(shí)降低實(shí)驗(yàn)難度和造價(jià),使其應(yīng)用范圍更廣;
[0040] 2、DNA水平移除多聚A結(jié)構(gòu),提高測序質(zhì)量,使APA的鑒定更加準(zhǔn)確;
[0041] 3、DNA水平斷裂與現(xiàn)有斷裂方式相比減少了對RNA的損傷,提高了產(chǎn)率;
[0042] 4、二鏈合成時(shí)加入特殊dNTP(dUTP代替dTTP),最后USER酶處理,除去二鏈