一種用于新一代測序分析的多重目的dna片段富集方法
【專利摘要】本發(fā)明公開了一種DNA測序模板的制備方法。該方法包括如下步驟:(1)將待測序的DNA分子依次進行片段化、末端修復(fù)和補齊,3’端加A,以及連接接頭;(2)通過三輪半巢式PCR擴增富集目的DNA片段;前兩次PCR所用引物均為一條特異性引物和一條通用引物;第三次PCR所用引物由兩條通用引物組成;前兩次PCR可為多重PCR反應(yīng)。與Illumina?GA樣品前處理過程相比,本發(fā)明所提供的方法減少了樣品處理的步驟,節(jié)約了時間和經(jīng)濟成本,同時降低了起始DNA樣品的需求量;最重要的是,循環(huán)數(shù)的降低和Phusion高保真DNA聚合酶的使用降低了由于PCR而引入的突變,使得對所得數(shù)據(jù)的處理變得相對簡單清晰,同時本方法在應(yīng)用到各種重測序的實驗中時對測序深度的要求也降低。
【專利說明】—種用于新一代測序分析的多重目的DNA片段富集方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于基因工程領(lǐng)域,涉及一種DNA測序模板的制備方法,特別涉及一種用于新一代測序分析的目的DNA片段的富集方法。
【背景技術(shù)】
[0002]新一代測序技術(shù)(Next Generation Sequencing, NGS)是近年來新興的一系列測序技術(shù)的總稱,他們都是基于邊合成邊測序(Sequencing by Synthesis)的原理,具有高通量、時間短、數(shù)據(jù)量龐大的特點,已經(jīng)被廣泛應(yīng)用于基因組(重)測序、轉(zhuǎn)錄組測序、單核苷酸多態(tài)性(Single Nucleotide Polymorphism, SNP)開發(fā)等等方面,成為人們研究分子生物學(xué)、分子遺傳學(xué)等等的有力工具。
[0003]在多種新一代測序技術(shù)中,Illumina公司開發(fā)的基因組分析儀(GenomeAnalyzer, GA)由于具有成本相對較低、通量大、前處理較為簡單等等優(yōu)勢,成為目前應(yīng)用的最為廣泛的技術(shù)之一。
[0004]Illumina GA的DNA樣品前處理過程主要包括:(I) DNA樣品的片段化;(2)修復(fù)并補齊末端,以及3’端加A (腺嘌呤脫氧核苷酸);(3)連接接頭;(4)切膠純化;(5)使用Illumina公司提供的引物進行18個循環(huán)的PCR擴增;(6)切膠純化;(7)樣品質(zhì)量監(jiān)控(純度、濃度等)。隨后即可上機進樣開始測序。
[0005]Illumina GA的DNA樣品前處理方法不具有選擇性,因此,若只關(guān)注基因組(或轉(zhuǎn)錄組)中某一特定區(qū)域的序列,則需要在進行Illumina GA樣品前處理之前完成選擇性富集的過程。目前通用的選擇性富集 方法有:
[0006]聚合酶鏈?zhǔn)椒磻?yīng)(PCR):通過使用特異性引物對目的片段進行選擇性擴增。
[0007]水相雜交:如MIP (molecular inversion probe),通過帶有特異序列的探針與基因組樣品雜交后,連接成環(huán)并擴增,獲得目的片段;或使用生物素標(biāo)記的RNA探針與基因組碎片雜交,而后通過磁珠吸附生物素進而將特異序列與基因組碎片分離,而后進行富集。
[0008]固相雜交:使用類似于DNA微陣列(Microarray)處理的方法,在固相支持物上固定特異的探針序列來捕獲目的片段
[0009]上述二種方法都是在進行Illumina GA樣品如處理之如完成的,其中水相雜交和固相雜交涉及的技術(shù)相對復(fù)雜,成本不菲(尤其是DNA微陣列的固相支持物的獲得需要大量合成的特異序列),需要的起始基因組DNA用量很大,且在處理后仍需要對獲得的目的片段進行富集(通常也是靠PCR)。而PCR雖然是一種具有良好選擇性并且技術(shù)要求較低的方法,但是其擴增中會發(fā)生堿基的突變,雖然使用高保真的聚合酶能夠改善突變發(fā)生的頻率,但是隨著擴增循環(huán)數(shù)的增加,堿基突變的概率會愈加提高。由于Illmunia GA樣品前處理中有18個循環(huán)的PCR擴增,在Illumina GA樣品前處理之前的PCR反應(yīng)過程中引入的堿基突變會在隨后的Illumina GA的樣品前處理中被放大,并且測序得到的突變堿基的測序質(zhì)量與未突變堿基的測序質(zhì)量沒有顯著差異,無法分辨,這在檢測點突變(point mutation)或單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)的時候會對結(jié)果產(chǎn)生很大干擾,造成過多的假陽性結(jié)果。
【發(fā)明內(nèi)容】
[0010]本發(fā)明的目的是提供一種DNA測序模板的制備方法,所述DNA測序模板適宜采用Illumina公司的GA測序儀進行測序。 [0011]本發(fā)明所提供的DNA測序模板的制備方法,具體包括如下步驟:
[0012](I)將具有待測序位點的DNA樣品依次進行片段化、末端修復(fù)和補齊,3’端加A,以及連接接頭,得到用于第一次PCR反應(yīng)的模板;
[0013]所述待測序位點的上游核苷酸序列為已知,且存在PCR特異引物對應(yīng)的特異區(qū)域;所述待測序位點可以為一個也可為多個。
[0014]所述接頭為由長鏈和短鏈組成的一端是平末端另一端是5’粘性末端的雙鏈DNA,所述長鏈的5’端突出;在實際應(yīng)用中,可通過化學(xué)合成得到組成所述接頭的所述長鏈和所述短鏈,再自行變性退火后得到所述接頭。
[0015](2)用特異性引物Iros和通用引物I對步驟(1)得到的用于第一次PCR反應(yīng)的模板進行第一次PCR擴增,得到包含所述待測序位點的DNA片段;
[0016]所述特異性引物Iros與所述特異區(qū)域互補;所述通用引物I的序列含有選自步驟
(I)所述接頭中所述長鏈的5’端突出部分的序列。當(dāng)對多個位點或區(qū)域進行同時檢測時,應(yīng)保持各引物的退火溫度一致,這將有利于多重PCR反應(yīng)的進行。
[0017](3)用特異性引物2ros和通用引物2對步驟(2)得到的所述DNA片段進行第二次PCR擴增,得到包含所述待測序位點的DNA片段;
[0018]所述特異性引物2ros自5’端至3’端分為片段I和片段2,所述片段2與所述特異區(qū)域互補,且所述特異性引物2ros自3’端起第一個核苷酸與所述待測序位點之間的距離比所述特異性引物Iros自3’端起第一個核苷酸與所述待測序位點之間的距離更近;所述片段I與所述待測序位點的上游不互補;所述通用引物2的序列為選自步驟(1)所述接頭中所述長鏈的5’端突出部分的序列。當(dāng)對多個位點或區(qū)域進行同時檢測時,應(yīng)保持各引物的退火溫度一致,這將有利于多重PCR反應(yīng)的進行。
[0019](4)用通用引物3和通用引物4對步驟(3)得到的所述DNA片段進行第三次PCR擴增,得到DNA測序模板;
[0020]所述通用引物3的自5’端至3’端分為片段3和片段4,所述片段4為選自步驟
(3)所述片段1,所述片段3為如下a):
[0021]a) AATGATACGGCGACCACCGAGATCTACACTCTTTCCC (固相支持物結(jié)合區(qū)域)
[0022]所述通用引物4自5’端至3’端分為片段5和片段6,所述片段6選自步驟(1)所述接頭中所述長鏈的5’端突出部分的序列,所述片段5為如下b):
[0023]b) CAAGCAGAAGACGGCATA (固相支持物結(jié)合區(qū)域)。
[0024]經(jīng)過上述步驟的處理后,所得DNA測序模板還需經(jīng)過標(biāo)準(zhǔn)樣品純化處理、純度、濃度鑒定等步驟后可用于Illumina GA測序。
[0025]為了增加測序的準(zhǔn)確性,減少擴增中隨機錯配的出現(xiàn),上述步驟中的三次PCR反應(yīng)均使用Phusion高保真聚合酶。
[0026]在本發(fā)明的一個實施例中,所述接頭中所述長鏈的序列具體如序列表中序列1-10所示,所述接頭中所述短鏈的序列為如下中的任一種:
[0027]A)序列表中序列I的自3’端起倒數(shù)第9位-倒數(shù)第2位的反向互補序列;
[0028]B)序列表中序列2-序列10中任一個的自3’端起倒數(shù)第10位-倒數(shù)第2位的反向互補序列。[0029]在本發(fā)明的一個實施例中,用于所述第一次PCR反應(yīng)的所述通用引物I序列具體為序列表中序列11。
[0030]在本發(fā)明的一個實施例中,用于所述第二次PCR反應(yīng)的所述通用引物2序列具體為序列表中序列12。
[0031 ] 在本發(fā)明的一個實施例中,用于所述第三次PCR反應(yīng)的所述通用引物3和所述通用引物4的序列具體分別為序列表中序列13和序列14。
[0032]通常情況下,上述步驟中所述第一次PCR反應(yīng)進行10-15個循環(huán)的擴增;所述第二次PCR反應(yīng)進行10-15個循環(huán)的擴增;所述第三次PCR反應(yīng)進行15-18個循環(huán)的擴增。在本發(fā)明的實施例中,所述第一次PCR反應(yīng)具體進行了 15個循環(huán)的擴增;所述第二次PCR反應(yīng)進行了 15個循環(huán)的擴增;所述第三次PCR反應(yīng)進行了 18個循環(huán)的擴增。
[0033]本發(fā)明針對Illumina GA樣品前處理的過程進行改進,得到了新的用于IlluminaGA測序的DNA測序模板的制備方法,該方法減少了樣品處理的步驟,節(jié)約了時間和經(jīng)濟成本,同時降低了對起始DNA樣品的需求量。最為重要的是,循環(huán)數(shù)的降低(相對于PCR擴增與樣品制備過程分離的方法,本申請可降低10個以上的循環(huán)數(shù))和Phusion高保真DNA聚合酶的使用可以大大降低在樣品富集過程中由于PCR而引入的突變,使得對所得數(shù)據(jù)的處理變得相對簡單清晰,使得本方法在應(yīng)用到各種重測序的實驗中時對測序深度的要求大大降低。在此基礎(chǔ)上,我們引入了多重PCR (Multiplex Polymerase Chain Reaction)的方法,大大增加了樣品處理的效率。
【專利附圖】
【附圖說明】
[0034]圖1為三次PCR反應(yīng)過程示意圖。其中,A為第一次PCR反應(yīng)過程示意圖;B為第二次PCR反應(yīng)過程示意圖;C為第三次PCR反應(yīng)過程示意圖。
[0035]圖2為在瓊脂糖膠上檢測到的第三輪PCR產(chǎn)物。其中,泳道M代表1OObp ladder,泳道I和泳道2代表第三輪PCR的產(chǎn)物。
[0036]圖3為在瓊脂糖膠上檢測膠純化后的第三輪PCR產(chǎn)物。其中,泳道M代表lOObpladder,泳道I代表膠純化后的第三輪PCR的產(chǎn)物。
[0037]圖4為兩種聚合酶獲得的可用產(chǎn)物數(shù)量的比較圖。其中,PMP為使用Phusion高保真聚合酶;PMM為使用Multiplex多重聚合酶。
[0038]圖5為兩種聚合酶不同引物個數(shù)所得平均深度分析圖。其中,PMP為使用Phusion高保真聚合酶;PMM為使用Multiplex多重聚合酶;PM后的數(shù)值表示引物個數(shù)。
[0039]圖6為兩種聚合酶不同引物個數(shù)所得數(shù)據(jù)的利用率比較圖。其中,PM后的數(shù)值表示引物個數(shù)??v坐標(biāo)表示數(shù)據(jù)的利用率。其中,I表示Multiplex多重聚合酶(PMM),2表示Phusion高保真聚合酶(PMP)。
[0040]圖7為index03的堿基C變化為堿基T的頻率圖。其中,橫坐標(biāo)為各個堿基在0SC8基因上的位置坐標(biāo),縱坐標(biāo)為發(fā)生C到T的變化的堿基個數(shù)與該位置堿基測序深度的比值(即堿基變化頻率)。圖中圓圈圈出的點為經(jīng)過其它實驗及sanger法測序所驗證的已知陽性點。
[0041]圖8為所有數(shù)據(jù)中某位置上C到T堿基變化的個數(shù)和該位置的測序深度的關(guān)系圖。
【具體實施方式】
[0042]下述實施例中所使用的實驗方法如無特殊說明,均為常規(guī)方法。
[0043]下述實施例中所用的材料、試劑等,如無特殊說明,均可從商業(yè)途徑得到。
[0044]實施例1、用于Illumina公司GA測序的測序模板的制備及其測序
[0045]一、用于Illumina公司GA測序的測序模板的制備方法
[0046]在本實施例中,用于Illumina公司GA測序的測序模板的制備方法具體包括如下步驟:
[0047](I)將具有待測序位點的DNA樣品依次進行片段化、末端修復(fù)和補齊,3’端加A,以及連接接頭,得到用于第一次PCR反應(yīng)的模板;
[0048]所述待測序位點的上游核苷酸序列已知,且存在PCR特異引物對應(yīng)的特異區(qū)域;
[0049]所述接頭為由長鏈和短鏈組成的一端是平末端另一端是5’粘性末端的雙鏈DNA,所述長鏈的5’端突出;
[0050](2)用特異性引物·Iros和通用引物I對步驟(1)得到的用于第一次PCR反應(yīng)的模板進行第一次PCR擴增,得到包含所述待測序位點的DNA片段;
[0051]所述特異性引物Iros與所述特異區(qū)域互補;所述通用引物I的序列含有選自步驟
(I)所述接頭中所述長鏈的5’端突出部分的序列;
[0052](3)用特異性引物2ros和通用引物2對步驟(2)得到的所述DNA片段進行第二次PCR擴增,得到包含所述待測序位點的DNA片段;
[0053]所述特異性引物2ros自5’端至3’端分為片段I和片段2,所述片段2與所述特異區(qū)域互補,且所述特異性引物2ros自3’端起第一個核苷酸與所述待測序位點之間的距離比所述特異性引物2ros自3’端起第一個核苷酸與所述待測序位點之間的距離更近;所述片段I與所述待測序位點的上游不互補;所述通用引物2的序列選自步驟(1)所述接頭中所述長鏈的5’端突出部分的序列;
[0054](4)用通用引物3和通用引物4對步驟(3)得到的所述DNA片段進行第三次PCR擴增,得到DNA測序模板;
[0055]所述通用引物3的自5’端至3’端分為片段3和片段4,所述片段4為步驟(3)所述片段1,所述片段3為如下a):
[0056]a) AATGATACGGCGACCACCGAGATCTACACTCTTTCCC (固相支持物結(jié)合區(qū)域);
[0057]所述通用引物4自5’端至3’端分為片段5和片段6,所述片段6為步驟(1)所述接頭中所述長鏈的5’端突出部分的序列,所述片段5為如下b):
[0058]b) CAAGCAGAAGACGGCATACGAGATCGTGAT (固相支持物結(jié)合區(qū)域)。
[0059]二、步驟一所述的方法的實際應(yīng)用
[0060]本試驗將利用步驟一所述方法,以水稻品種中花11的基因組為待測序DNA樣品,針對其上的14個SNP位點(14個所述待測序位點)設(shè)計水稻基因組特異引物(14個所述特異性引物Iros和14個所述特異性引物2ros),制備用于Illumina公司GA測序的測序模板。
[0061]1、引物設(shè)計
[0062]( I)第一輪PCR引物序列的設(shè)計
[0063]用primer5.0軟件設(shè)計用于檢測位于水稻目的基因OsOSCs基因和CYP51基因上的上述14個待測序位點的第一輪PCR特異引物序列(特異性引物lros),設(shè)計引物序列原則為:GC%為40%-60%,長度為25個堿基,TM值為65°C左右。引物序列具體如表1所示,引物序列由上海生工合成。
[0064]表1第一輪PCR基因組特異性引物序列
[0065]
【權(quán)利要求】
1.DNA測序模板的制備方法,包括如下步驟: (1)將具有待測序位點的DNA樣品依次進行片段化、末端修復(fù)和補齊,3’端加A,以及連接接頭,得到用于第一次PCR反應(yīng)的模板; 所述待測序位點的上游核苷酸序列已知,且存在PCR特異引物對應(yīng)的特異區(qū)域; 所述接頭為由長鏈和短鏈組成的一端是平末端另一端是5’粘性末端的雙鏈DNA,所述長鏈的5’端突出; (2)用特異性引物Iros和通用引物I對步驟(1)得到的用于第一次PCR反應(yīng)的模板進行第一次PCR擴增,得到包含所述待測序位點的DNA片段; 所述特異性引物Iros與所述特異區(qū)域互補;所述通用引物I的序列含有選自步驟(1)所述接頭中所述長鏈的5’端突出部分的序列; (3)用特異性引物2ros和通用引物2對步驟(2)得到的所述DNA片段進行第二次PCR擴增,得到包含所述待測序位點的DNA片段; 所述特異性引物2ros自5’端至3’端分為片段I和片段2,所述片段2與所述特異區(qū)域互補,且所述特異性引物2ros自3’端起第一個核苷酸與所述待測序位點之間的距離比所述特異性引物Iros自3’端起第一個核苷酸與所述待測序位點之間的距離更近;所述片段I與所述待測序位點的上游不互補;所述通用引物2的序列選自步驟(1)所述接頭中所述長鏈的5’端突出部分的序列; (4)用通用引物3和通用引物4對步驟(3)得到的所述DNA片段進行第三次PCR擴增,得到DNA測序模板;· 所述通用引物3的自5’端至3’端分為片段3和片段4,所述片段4選自步驟(3)所述片段1,所述片段3為如下a):
a)AATGATACGGCGACCACCGAGATCTACACTCTTTCCC ; 所述通用引物4自5’端至3’端分為片段5和片段6,所述片段6選自步驟(1)所述接頭中所述長鏈的5’端突出部分的序列,所述片段5為如下b):
b)CAAGCAGAAGACGGCATA。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于:權(quán)利要求1步驟(2)-(4)的三次所述PCR反應(yīng)所用的DNA聚合酶均為Phusion高保真DNA聚合酶。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于:所述接頭中所述長鏈的序列如序列表中序列1-10所示,所述接頭中所述短鏈的序列為如下中的任一種: A)序列表中序列I的自3’端起倒數(shù)第9位-倒數(shù)第2位的反向互補序列; B)序列表中序列2-序列10中任一個的自3’端起倒數(shù)第10位-倒數(shù)第2位的反向互補序列。
4.根據(jù)權(quán)利要求1-3中任一所述的方法,其特征在于:用于所述第一次PCR反應(yīng)的所述通用引物I序列為序列表中序列U。
5.根據(jù)權(quán)利要求1-4中任一所述的方法,其特征在于:用于所述第二次PCR反應(yīng)的所述通用引物2序列為序列表中序列12。
6.根據(jù)權(quán)利要求1-5中任一所述的方法,其特征在于:用于所述第三次PCR反應(yīng)的所述通用引物3和所述通用引物4的序列分別為序列表中序列13和14。
【文檔編號】C12Q1/68GK103571822SQ201210253791
【公開日】2014年2月12日 申請日期:2012年7月20日 優(yōu)先權(quán)日:2012年7月20日
【發(fā)明者】漆小泉, 池旭, 張英春 申請人:中國科學(xué)院植物研究所