專利名稱:用于構(gòu)建測序文庫的系統(tǒng)與方法
技術(shù)領(lǐng)域:
本發(fā)明涉及基因工程領(lǐng)域,更具體地說,涉及一種接頭元件及一種構(gòu)建測序文庫的方法。
背景技術(shù):
在現(xiàn)階段,用于高通量基因測序的DNA片段都會首先制備成測序文庫。測序文庫的制備包括以下幾個步驟,首先隨機切割樣品基因組,獲得大量DNA片段,然后接上接頭進(jìn)行擴增反應(yīng)。在構(gòu)建文庫過程當(dāng)中,最大問題在于連接接頭時很容易出現(xiàn)接頭自連現(xiàn)象,同時由于接頭連接的隨意性,容易出現(xiàn)DNA片段兩端連接上同一接頭的非目標(biāo)接頭元件-DNA 片段復(fù)合物,既浪費了原材料又增加了產(chǎn)物分離提純的復(fù)雜程度。對于一些簡單的單核苷酸多態(tài)性(SingleNucleotide Polymorphisms, SNP) /DNA 的插入/缺失andel)篩選,單端(single read)測序和雙端(paired-end)測序均能滿足要求,而結(jié)構(gòu)變異篩選則需要pair-end或者mate-pair測序。目前應(yīng)用最廣的454DNA測序方法中一種構(gòu)建測序文庫的方法的基本步驟為(1)片段化大核酸分子,以產(chǎn)生目標(biāo)核酸;( 將捕捉元件連接至目標(biāo)核酸,以形成第一環(huán)形核酸分子;C3)用切割目標(biāo)核酸但不切割捕捉元件的限制性內(nèi)切核酸酶消化第一環(huán)形核酸,以產(chǎn)生含目標(biāo)核酸的兩個末端的線性核酸,所述兩個末端由捕捉元件分隔;(4)將線性核酸與分隔元件連接,已形成第二環(huán)形核酸;( 將第二環(huán)形核酸變?yōu)榄h(huán)形單鏈核酸;(6)使第一寡核苷酸與環(huán)形單鏈核酸退火, 并通過滾環(huán)擴增來擴增環(huán)形單鏈核酸,以產(chǎn)生單鏈滾環(huán)擴增產(chǎn)物;(7)使第二寡核苷酸與單鏈滾環(huán)擴增產(chǎn)物退火,以在單鏈滾環(huán)擴增產(chǎn)物中形成多個雙鏈區(qū);(8)使用切割多個雙鏈區(qū)的限制性內(nèi)切酶將單鏈滾環(huán)擴增產(chǎn)物消化為小片段,以產(chǎn)生含目標(biāo)核酸的兩個末端區(qū)里的DNA構(gòu)建物。該方法需要進(jìn)行二次環(huán)化,同時由于環(huán)化的效率較低需要進(jìn)行復(fù)雜的滾環(huán)擴增步驟,因此整個流程耗時長,操作復(fù)雜,成本高。針對上述問題,需要一種能夠在建庫過程中避免自連的接頭元件,同時需要建立一種在建庫過程中能夠避免出現(xiàn)接頭自連及非目標(biāo)接頭元件-DNA片段復(fù)合物,而且耗時短、操作簡便的建庫新方法。
發(fā)明內(nèi)容
本發(fā)明的目的之一在于提供一種接頭元件,旨在解決現(xiàn)有技術(shù)在建庫過程中出現(xiàn)接頭自連的問題。為了實現(xiàn)發(fā)明目的,所述接頭元件是從5’到3’端依次包含分叉區(qū)和配對區(qū)的分叉型雙鏈核酸接頭,所述分叉區(qū)雙鏈之間的堿基序列不能互補配對,所述分叉區(qū)的雙鏈各包含至少一個引物結(jié)合位點;所述配對區(qū)包含至少一個酶切識別位點。上述提供的分叉型雙鏈核酸接頭,其分叉設(shè)計能夠在建庫過程避免接頭自連現(xiàn)象的出現(xiàn);所述分叉區(qū)上包含的擴增引物結(jié)合位點,可以直接用于結(jié)合擴增引物,進(jìn)行擴增反應(yīng);而酶切識別位點則可以在建庫過程中酶切形成末端,便于進(jìn)行后續(xù)的操作。其中,所述接頭元件的分叉區(qū)每條鏈含有N個核苷酸,其中9 < N < 30,兩鏈之間的核苷酸不能配對。其中,所述接頭元件的配對區(qū)含有7 15對互補配對的核苷酸。其中,所述接頭元件配對區(qū)的3’末端為突出末端或平末端。進(jìn)一步的,所述接頭元件配對區(qū)的3’末端為突出末端時,其突出末端與DNA片段的粘性末端互補配對。更進(jìn)一步的,所述接頭元件配對區(qū)的3’末端為突出末端,且突出末端最后一個堿基為T。更進(jìn)一步的,所述接頭元件配對區(qū)的3’末端為平末端,且3’末端最后一個核苷酸為帶有雙脫氧堿基的核苷酸。本發(fā)明的目的之一在于提供一種構(gòu)建測序文庫的方法,旨在解決建庫過程中出現(xiàn)接頭自連及非目標(biāo)接頭元件-DNA片段復(fù)合物的問題。為了實現(xiàn)發(fā)明目的,所述一種構(gòu)建測序文庫的方法包括A.對源DNA進(jìn)行片段化處理,以產(chǎn)生目的DNA片段;B.目的DNA片段兩端連接上述接頭元件形成接頭元件-DNA復(fù)合物,加入擴增弓|物進(jìn)行擴增得到擴增引物;C.對擴增產(chǎn)物進(jìn)行富集回收,形成測序文庫。所述方法利用分叉型雙鏈核酸接頭,能夠在建庫過程中避免出現(xiàn)接頭之間自連現(xiàn)象以及非目標(biāo)接頭元件-DNA片段復(fù)合物。其中,在所述片段化處理步驟之后還包括目的DNA片段的分離純化以及末端修飾的步驟。其中,所述接頭元件至少包括本發(fā)明所述接頭元件中的一種。其中,所述擴增引物是生物素化的擴增引物,該擴增引物可以是聚合酶鏈?zhǔn)椒磻?yīng)引物,或是帶有RNA轉(zhuǎn)錄酶初始序列的轉(zhuǎn)錄引物。進(jìn)一步的,若擴增引物是聚合酶鏈反應(yīng)引物,則后續(xù)利用聚合酶鏈?zhǔn)椒磻?yīng)進(jìn)行擴增;若擴增引物是帶有RNA轉(zhuǎn)錄酶初始序列的轉(zhuǎn)錄引物,則后續(xù)利用轉(zhuǎn)錄法進(jìn)行擴增。其中,所述步驟C中擴增產(chǎn)物利用經(jīng)過親和素或鏈霉親和素修飾的磁珠吸附,然后通過磁鐵將其分離出來。本發(fā)明的目的之一在于提供一種構(gòu)建測序文庫的方法,旨在解決建庫過程中出現(xiàn)接頭自連及非目標(biāo)接頭元件-DNA片段復(fù)合物,以及耗時長操作復(fù)雜的問題。為了實現(xiàn)本發(fā)明目的,所述方法包括以下步驟A.對源DNA進(jìn)行片段化處理,以產(chǎn)生目的DNA片段;B.目的DNA片段兩端連上第一接頭元件形成接頭元件-DNA復(fù)合物,加入擴增弓丨物進(jìn)行擴增,得到擴增產(chǎn)物;C.酶切擴增產(chǎn)物得到酶切產(chǎn)物,環(huán)化酶切產(chǎn)物得到環(huán)化產(chǎn)物;D.酶切環(huán)化產(chǎn)物得到DNA構(gòu)建物;E.在DNA構(gòu)建物兩端連接第二接頭元件形成配對末端片段;F.解旋形成單鏈,得到配對末端測序文庫。
所述方法在目的DNA片段接上接頭元件之后先進(jìn)行擴增,然后再酶切環(huán)化,避免了操作復(fù)雜而又耗時較長的滾環(huán)擴增,也不需要進(jìn)行二次環(huán)化,操作簡便耗時短。同時,若所述方法利用分叉型雙鏈核酸接頭,能夠在建庫過程中避免出現(xiàn)接頭自連現(xiàn)象以及非目標(biāo)接頭元件-DNA片段復(fù)合物。其中,所述源DNA片段化處理步驟之后還包括目的DNA片段的分離純化以及末端修飾的步驟。其中,所述步驟B中擴增引物是生物素化的擴增引物。進(jìn)一步的,所述擴增引物上至少包含一個特異性酶切識別位點,酶切識別位點選用尿嘧啶堿基或限制性內(nèi)切酶識別位點。更進(jìn)一步的,若擴增引物上所帶的特異性酶切識別位點是尿嘧啶堿基,則步驟C 利用尿嘧啶特異性切除試劑進(jìn)行酶切;若擴增引物所帶特異性酶切識別位點為限制性內(nèi)切酶識別位點,則步驟C利用限制性內(nèi)切酶進(jìn)行酶切。其中,所述步驟C中酶切產(chǎn)物環(huán)化之后需要進(jìn)行純化回收步驟,即去除未環(huán)化的 DNA片段。其中,所述步驟D中利用能夠識別第一接頭元件上的酶切識別位點,切割目的DNA 片段但不切割接頭元件的II類限制性內(nèi)切酶(typells酶)酶切環(huán)化產(chǎn)物,從而得到接頭元件兩端連接有目的DNA片段末端的DNA構(gòu)建物。其中,所述步驟E中的第二接頭元件優(yōu)選包含分叉區(qū)與配對區(qū)的雙鏈核酸分子, 其中分叉區(qū)的每條鏈包含N個核苷酸,9 < N < 30,每條單鏈上各有一個擴增引物結(jié)合位點;配對區(qū)含有7 15對互補配對的核苷酸。其中,所述步驟F之后還可以包括步驟G 對所述的配對末端測序文庫進(jìn)行擴增,以得到更高拷貝數(shù)的配對末端測序文庫。其中,所述步驟G中擴增優(yōu)選通過微乳液PCR(emulsion PCR,E_PCR)進(jìn)行擴增,也可通過普通PCR進(jìn)行擴增。由上可知,本發(fā)明提供了一種接頭元件以及一種構(gòu)建測序文庫的方法,利用接頭元件的分叉設(shè)計,避免了在建庫過程中出現(xiàn)接頭之間自連以及DNA片段兩端連接同一接頭的現(xiàn)象;此外先擴增再環(huán)化,避開了滾環(huán)擴增以及二次環(huán)化的操作,能夠快速簡便的建立測序文庫。
圖1是本發(fā)明一個實施例中用于構(gòu)建測序文庫的接頭元件的結(jié)構(gòu)示意圖;圖2是本發(fā)明另一個實施例中用于構(gòu)建測序文庫的接頭元件的結(jié)構(gòu)示意圖;圖3是本發(fā)明一個實施例中構(gòu)建測序文庫的方法流程圖;圖4是本發(fā)明另一個實施例中構(gòu)建測序文庫的方法流程圖;圖5是本發(fā)明圖4實施例中構(gòu)建測序文庫的方法中第二接頭元件的結(jié)構(gòu)示意圖;圖6是本發(fā)明一個實施例中構(gòu)建測序文庫的方法示意圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。為了解決現(xiàn)有技術(shù)在建庫過程中出現(xiàn)接頭自連的問題,本發(fā)明所提供的接頭元件結(jié)構(gòu)為從5’到3’端依次包含分叉區(qū)和配對區(qū)的分叉型雙鏈核酸接頭,所述分叉區(qū)雙鏈之間的堿基序列不能互補配對,所述分叉區(qū)的雙鏈各包含至少一個引物結(jié)合位點;所述配對區(qū)包含至少一個酶切識別位點。
上述分叉型雙鏈核酸接頭的分叉設(shè)計能夠在建庫過程避免接頭自連現(xiàn)象的出現(xiàn); 所述分叉區(qū)上包含的擴增引物結(jié)合位點,可以直接用于結(jié)合擴增引物,進(jìn)行擴增反應(yīng);而酶切識別位點則可以在建庫過程中酶切形成末端,便于進(jìn)行后續(xù)的操作。優(yōu)選的,上述接頭元件的分叉區(qū)的每條鏈含有N個核苷酸,其中9 < N < 30,兩鏈之間的核苷酸不能配對。優(yōu)選的,所述接頭元件的配對區(qū)含有7 15對互補配對的核苷酸,更優(yōu)選為9-13 對互補配對的核苷酸。優(yōu)選的,所述接頭元件配對區(qū)的3’末端為突出末端或平末端。優(yōu)選的,所述接頭元件配對區(qū)的3’末端為突出末端時,其突出末端與DNA片段的粘性末端互補配對。更優(yōu)選的,所述接頭元件配對區(qū)的3’末端為突出末端,且突出末端最后一個堿基為T。更優(yōu)選的,所述接頭元件配對區(qū)的3’末端為平末端,且3’末端最后一個核苷酸為帶有雙脫氧堿基的核苷酸。對于本發(fā)明所提供的接頭元件的結(jié)構(gòu),其包含的各種技術(shù)方案將在下述提供的實施例中進(jìn)行詳細(xì)闡述。圖1示出了本發(fā)明的一個實施例中用于構(gòu)建測序文庫的接頭元件的結(jié)構(gòu)。該接頭元件包括從5’到3’端依次包含分叉區(qū)和配對區(qū)的分叉型雙鏈核酸接頭。其中,分叉的每條單鏈上各含有一個擴增引物結(jié)合位點;分叉區(qū)的雙鏈所包含的核苷酸個數(shù)各為18個;配對區(qū)含有一個酶切識別位點,包含12對互補配對的核苷酸,而且配對區(qū)3’末端為突出末端, 其DNA序列多出一個T堿基。本實施例中,采用分叉型雙鏈核酸接頭元件,可以在建庫過程中避免出現(xiàn)接頭之間自連的現(xiàn)象;而突出末端多出的T堿基,則可以更方便的與目的DNA片段進(jìn)行連接。應(yīng)當(dāng)說明,本實施例僅是本發(fā)明所提供的接頭元件的一個實施例,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。圖2示出了本發(fā)明的另一個實施例中用于構(gòu)建測序文庫的接頭元件的結(jié)構(gòu)。該接頭元件包括從5’到3’端依次包含分叉區(qū)和配對區(qū)的分叉型雙鏈核酸接頭。其中,分叉的每條單鏈上各包含一個擴增引物結(jié)合位點;分叉區(qū)的兩鏈所含的核苷酸個數(shù)分別為9和19 ; 而配對區(qū)含有一個酶切識別位點,含有10個互補配對的核苷酸;配對區(qū)3’末端的DNA序列最后一個堿基為雙脫氧堿基。
在本實施例中,采用分叉型雙鏈核酸接頭元件,可以在建庫過程中避免出現(xiàn)接頭之間自連現(xiàn)象的出現(xiàn);配對區(qū)3’末端的DNA序列最后一個堿基為雙脫氧堿基,則可以更進(jìn)一步的控制接頭元件與目的DNA片段之間連接的方向性。需要 說明的是與本接頭元件配合使用的,可以對目的DNA片段進(jìn)行末端去磷酸化操作,可以進(jìn)一步的避免在連接過程中出現(xiàn)目的DNA片段之間的自連現(xiàn)象,更能凸顯本發(fā)明提供的接頭元件的優(yōu)越性。應(yīng)當(dāng)說明,本實施例僅是本發(fā)明提供的接頭元件的一個實施例,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。圖3示出了本發(fā)明的一個實施例中構(gòu)建測序文庫的方法流程。該方法包括S101.對源DNA進(jìn)行片段化處理,以產(chǎn)生目的DNA片段;S102.目的DNA片段兩端連上接頭元件形成接頭元件-DNA復(fù)合物,加入擴增引物進(jìn)行擴增,得到擴增產(chǎn)物;S103.對擴增產(chǎn)物進(jìn)行富集回收,形成測序文庫。本發(fā)明的技術(shù)方案優(yōu)點在于利用分叉型雙鏈核酸接頭,能夠在建庫過程中避免出現(xiàn)接頭之間自連現(xiàn)象以及非目標(biāo)接頭元件-DNA片段復(fù)合物。需要說明的是步驟SlOl所述源DNA可來源于任意DNA,包括已知和未知序列的DNA,如基因組 DNA、大片段DNA、cDNA、質(zhì)粒DNA和線粒體DNA等。對于已知序列的源DNA,可用于進(jìn)行基因組多態(tài)性篩選以及基因疾病關(guān)聯(lián)的對比分析研究。所述源DNA片段化處理的方法,可以根據(jù)所需片段的大小,通過常用方法中的任一種進(jìn)行片段化,所述方法包括但不限于霧化、超聲破碎、機械剪切破碎片段化、酶切片段化、化學(xué)以及熱誘導(dǎo)片段化。在所述片段化處理之后還可包括目的DNA片段的分離純化以及末端修飾的步驟。 根據(jù)測序的片段長度需要,對于片段化得到的DNA片段,需要進(jìn)行目的DNA片段的分離純化,分離方法可以采用常用方法,如凝膠方法、蔗糖梯度或氯化銫梯度沉降、柱層析分離等。 根據(jù)所使用的片段化方法,所得的目的DNA片段可能需要進(jìn)一步的末端修飾,例如進(jìn)行磷酸化或去磷酸化、末端補平等,以便于后續(xù)的接頭元件連接。在步驟S102中,所述的接頭元件至少包括本發(fā)明所述接頭元件中的一種。若使用的接頭元件是配對區(qū)3’末端為突出末端的,通過其突出末端與DNA片段的粘性末端互補配對進(jìn)行連接。優(yōu)選的,若DNA片段化采用能切出粘性末端的內(nèi)切酶隨機酶切破碎方法,接頭元件的突出末端序列與該內(nèi)切酶切出的粘性末端序列互補;若采用其他方法如超聲破碎法進(jìn)行片段化,則對DNA片段進(jìn)行末端補平并加上A尾,而接頭元件的突出末端最后一個堿基為 T。若使用的接頭元件是配對區(qū)3’末端為平末端的,則接頭元件與DNA片段直接通過平末端連接方式連接。使用的接頭元件時配對區(qū)3’末端為平末端,且3’末端最后一個核苷酸為帶有雙脫氧堿基的核苷酸。更優(yōu)選的,使用前面所述配對區(qū)3’末端為平末端的接頭元件時,對DNA片段進(jìn)行去磷酸化處理,能夠避免DNA片段之間形成自連結(jié)構(gòu)。所述擴增引物是生物素化的擴增引物,該擴增引物可以是聚合酶鏈?zhǔn)椒磻?yīng)引物, 或是帶有RNA轉(zhuǎn)錄酶初始序列的轉(zhuǎn)錄引物。在步驟S103中,擴增產(chǎn)物利用經(jīng)過親和素或鏈霉親和素修飾的磁珠吸附,然后通過磁鐵將其分離出來。對于圖3所示本發(fā)明的技術(shù)方案,下面將給出具體實施例加以詳細(xì)闡述。在步驟SlOl的一個實施例中,步驟SlOl具體如下。
以Lambda DNA ( λ DNA)作為源DNA,利用超聲破碎方式進(jìn)行片段化處理。具體操作為將200 μ LA DNA放入400 μ L TE buffer溶液中,430W功率條件下超聲4s,反復(fù)5次。 得到的片段混合物利用瓊脂糖凝膠進(jìn)行分離純化,選擇400-600bp大小的片段切膠回收,得到目的DNA片段。應(yīng)當(dāng)說明的是,本實施例僅是本發(fā)明的步驟SlOl中的一個實施例,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。在步驟S102的一個實施例中,步驟S102具體實現(xiàn)如下在連接接頭元件之前,要對目的DNA片段進(jìn)行末端修飾,以便于接頭元件的連接。 本實施例中對目的DNA片段進(jìn)行磷酸化以及末端補平修飾,然后根據(jù)所選擇的分叉A-T接頭,即該接頭元件配對區(qū)的3’末端未突出末端,且突出末端最后一個堿基為T的分叉型雙鏈核酸接頭,對目的DNA片段進(jìn)行了加A尾的操作。本實施例中,磷酸化以及末端補平反應(yīng)體系為0嫩片段樣品,201^ ;IOmM dNTP, 1. 5μ L ;T4DNA 聚合酶,1 μ L ;Klenow DNA 聚合酶,0. 1 μ L ;Τ4 多核苷酸激酶,0· 5μ L ;IOm MATP, 1. 5 μ L ;T4DNA連接緩沖液,10 μ L ;加ddH20至100 μ L,20°C孵育20min,反應(yīng)結(jié)束后利用回收試劑盒進(jìn)行純化回收。加A尾的反應(yīng)體系為目的DNA片段樣品,60yL;Klenow緩沖液,10 μ L ; IOmM dATP, 2 μ L ;Klenow 酶,1 μ L ;力口 ddH20 至 100 μ L, 37°C孵育 30min,純化試劑盒純化回收。目的DNA片段與接頭元件連接形成接頭元件-DNA復(fù)合物,連接體系內(nèi)為目的 DNA片段,50 μ L ;接頭元件,2 μ L ; IOmM ATP, 5 μ L ;T4DNA連接酶,1 μ L ; 10 X Τ4連接酶緩沖液,10 μ L ;加ddH20至100 μ L,然后連接體系14°C孵育2h以上,純化試劑盒純化回收連接產(chǎn)物。連接產(chǎn)物內(nèi)加入生物素化的擴增引物,對其進(jìn)行擴增。擴增體系為40yL連接產(chǎn)物;上、下游兩端擴增引物各 10yL;dNTP10yL;Taqg| 10 μ L ;10Xbuffer,100 μ L ;力口 ddH20 至 100(^1^,擴增反應(yīng)程序為9412111士11 ;94°C 10s,57°C 10s,72°C 1 2min 12cycles ; 72 °C 5min。應(yīng)當(dāng)說明的是,本實施例僅是本發(fā)明的步驟S102中的一個實施例,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。在步驟S103的一個實施例中,步驟S103具體實現(xiàn)如下根據(jù)加入的生物素化擴增引物,利用親和素或鏈霉親和素修飾的磁珠對擴增產(chǎn)物進(jìn)行富集回收,然后清洗,TE溶液重懸擴增產(chǎn)物,形成測序文庫。應(yīng)當(dāng)說明的是,本實施例僅是本發(fā)明的步驟S103中的一個實施例,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。
圖4示出了本發(fā)明的一個實施例中構(gòu)建測序文庫的方法流程。該方法包括S201.對源DNA進(jìn)行片段化處理,以產(chǎn)生目的DNA片段;S202.目的DNA片段兩端連上第一接頭元件形成接頭元件-DNA復(fù)合物,加入擴增引物進(jìn)行擴增,得到擴增產(chǎn)物;S203.酶切擴增產(chǎn)物得到酶切產(chǎn)物,環(huán)化酶切產(chǎn)物得到環(huán)化產(chǎn)物S204.酶切環(huán)化產(chǎn)物得到DNA構(gòu)建物;S205.在DNA構(gòu)建物兩端連接第二接頭元件形成配對末端片段;S206.解旋形成單鏈,得到配對末端測序文庫;本方法的優(yōu)點在于在目的DNA片段接上接頭元件之后先進(jìn)行擴增,然后再酶切環(huán)化,避免了操作復(fù)雜而又耗時較長的滾環(huán)擴增,也不需要進(jìn)行二次環(huán)化,操作簡便耗時短。同時,若所述方法利用分叉型雙鏈核酸接頭,能夠在建庫過程中避免出現(xiàn)接頭自連現(xiàn)象以及非目標(biāo)接頭元件-DNA片段復(fù)合物。需要說明的是步驟S201中,源DNA與步驟SlOl中所述一樣可以是任意來源的DNA,包括已知和未知序列的DNA ;片段化的方法采用常用方法中的任一種方法進(jìn)行,根據(jù)測序的片段長度需要選用適合的方法;源DNA片段化處理步驟之后還可包括目的DNA片段的分離純化以及末端修飾的步驟。步驟S202中,第一接頭元件可以是各種形式的接頭元件,包括但不限于不分叉的普通接頭元件、分叉型接頭元件或帶有莖環(huán)結(jié)構(gòu)的接頭元件。優(yōu)選的,第一接頭元件是分叉型或帶有莖環(huán)結(jié)構(gòu)的雙鏈核酸接頭元件,能夠避免接頭自連現(xiàn)象以及非目標(biāo)接頭元件-DNA片段復(fù)合物的形成。進(jìn)一步優(yōu)選的,若使用的分叉型雙鏈核酸接頭元件是配對區(qū)3’末端為突出末端的,通過其突出末端與目的DNA片段的粘性末端互補配對進(jìn)行連接。若源DNA片段化采用能切出粘性末端的內(nèi)切酶隨機酶切破碎方法,接頭元件的突出末端序列與該內(nèi)切酶切出的粘性末端序列互補;若采用其他方法如超聲破碎法進(jìn)行片段化,則對DNA片段進(jìn)行末端補平并加上A尾,而接頭元件的突出末端最后一個堿基為T。進(jìn)一步優(yōu)選的,若使用的分叉型雙鏈核酸接頭元件是配對區(qū)3’末端為平末端的, 則接頭元件與DNA片段直接通過平末端連接方式連接。更進(jìn)一步優(yōu)選的,使用的接頭元件配對區(qū)3’末端為平末端,且3’末端最后一個核苷酸為帶有雙脫氧堿基的核苷酸。更進(jìn)一步優(yōu)選的,使用配對區(qū)3’末端為平末端的接頭元件時,對DNA片段進(jìn)行去磷酸化處理,能夠避免DNA片段之間形成自連結(jié)構(gòu)。步驟S203中,擴增引物是生物素化的擴增引物。優(yōu)選的,擴增引物上至少包含一個特異性酶切識別位點,酶切識別位點選用尿嘧啶堿基或限制性內(nèi)切酶識別位點。進(jìn)一步優(yōu)選的,若擴增引物上所帶的特異性酶切識別位點是尿嘧啶堿基,則步驟 S203利用尿嘧啶特異性切除試劑進(jìn)行酶切;若擴增引物所帶特異性酶切識別位點為限制性內(nèi)切酶識別位點,則步驟S203利用限制性內(nèi)切酶進(jìn)行酶切。
步驟S204中,酶切環(huán)化產(chǎn)物是利用能夠識別第一接頭元件上的酶切識別位點,切割目的DNA片段但不切割接頭元件的II類限制性內(nèi)切酶(typells酶)實現(xiàn)。步驟S205中,第二接頭元件優(yōu)選包含分叉區(qū)與配對區(qū)的雙鏈核酸分子,其中分叉區(qū)的每條鏈包含N個核苷酸,9 < NS 30,每條單鏈上各有一個擴增引物結(jié)合位點。進(jìn)一步優(yōu)選的,所述第二接頭元件的配對區(qū)包含7 15對互補配對的核苷酸,更進(jìn)一步優(yōu)選的,包含9 13對互補配對的核苷酸。對于圖4所示本發(fā)明的技術(shù)方案,下面將給出具體實 施例加以詳細(xì)闡述。在步驟S201的一個實施例中,步驟S201具體實現(xiàn)如下對于源DNA的片段化直接利用超聲破碎成隨機片段,超聲破碎的條件為430W功率條件下超聲4s,反復(fù)5次。以的凝膠進(jìn)行片段的大小分級分離,然后從凝膠中選擇 400-600bp大小的片段進(jìn)行切膠回收,得到目的DNA片段。應(yīng)當(dāng)說明的是,本實施例僅是本發(fā)明中步驟S201的一個實施例,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。在步驟S202的一個實施例中,步驟S202具體實現(xiàn)如下連接接頭元件之前,根據(jù)所用的接頭元件要對目的DNA片段進(jìn)行末端修飾,以便于接頭元件的連接。本發(fā)明的一個實施例中選用的接頭元件為分叉A-T接頭,對目的DNA 片段需要進(jìn)行磷酸化、末端補平以及加A尾處理;本發(fā)明的另一個實施例中選用的接頭元件為分叉雙脫氧接頭,所述分叉雙脫氧接頭為配對區(qū)得3’末端為平末端,且3’末端最后一個核苷酸為帶有雙脫氧堿基核苷酸的分叉雙鏈核酸接頭,對目的DNA片段需要進(jìn)行去磷酸化和末端補平處理。同時由于末端雙脫氧堿基的存在以及去磷酸化的處理,連接之后出現(xiàn) “缺口 ”現(xiàn)象,需要利用鏈置換DNA聚合酶進(jìn)行填補修復(fù),所述鏈置換DNA聚合酶在生化領(lǐng)域內(nèi)常見的有phi29聚合酶、Bst DNA聚合酶以及Klenow聚合酶。本實施例中優(yōu)選分叉雙脫氧接頭,連接以及填補“缺口 ”的反應(yīng)體系包含50 μ L 目的DNA片段、6 μ L擴增引物、10 μ L dNTP、5 μ L ΑΤΡ,然后加入緩沖液至100 μ L,60°C恒溫 5min,然后降溫到37°C,加入0. 3ul Taq酶and 0. 5ul T4DNA連接酶,37°C孵育30min。反應(yīng)結(jié)束后純化試劑盒提純回收,TE重懸連接產(chǎn)物。連接產(chǎn)物中加入擴增引物進(jìn)行擴增,得到擴增產(chǎn)物。所選用引物上帶有特異性酶切識別位點,而且為了便于擴增產(chǎn)物純化回收進(jìn)行后續(xù)操作,引物上設(shè)計帶有生物素或者其他抗性標(biāo)記,包括但不限于氨芐青霉素、四環(huán)素、卡那霉素、博來霉素和氯霉素。同時,還可以選用不同類型的擴增引物,如聚合酶鏈?zhǔn)綌U增引物或T7RNA轉(zhuǎn)錄擴增引物等,這決定了后續(xù)的擴增方式。加入擴增引物后,建立擴增體系,40 μ L連接產(chǎn)物、10 μ L dNTP、上下游兩端擴增引物各10 μ L、Taq酶20 μ L,加入PCR緩沖液至1000 μ L,擴增程序為94°C 2min ; 940C 10s,57°C 10s,72°C l-2min,12cycles ;72°C 5min。應(yīng)當(dāng)說明的是,上述實施例僅是本發(fā)明中步驟S202中的一個實施例,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。在步驟S203的一個實施例中,步驟S203具體實現(xiàn)如下對于上一步驟中的擴增產(chǎn)物直接采用試劑盒進(jìn)行回收。為使得酶切產(chǎn)物能夠順利的互補成環(huán),提高效率,在酶切之前對擴增產(chǎn)物進(jìn)行去A尾反應(yīng)。酶切反應(yīng)時,根據(jù)擴增引物上所帶的酶切識別位點,選擇不同的酶進(jìn)行酶切。為提高成環(huán)效率,本實施例優(yōu)選擴增引物上攜帶尿嘧啶堿基,利用尿嘧啶特異性切除試劑User酶進(jìn)行酶切,形成較長的突出末端,便于互補成環(huán),提高成環(huán)的效率。此外,也可以選擇限制性內(nèi)切酶識別位點,利用限制性內(nèi)切酶進(jìn)行酶切。利用User酶進(jìn)行酶切的酶切體系以及條件為擴增產(chǎn)物100 μ L、緩沖液 20 μ L、User酶10 μ L,然后加入ddH20至200 μ L,37°C孵育30min,反應(yīng)結(jié)束后純化試劑盒提純回收。
對擴增產(chǎn)物酶切并提純回收產(chǎn)物之后,進(jìn)行環(huán)化反應(yīng)。環(huán)化時,利用環(huán)化緩沖液將酶切產(chǎn)物稀釋到終濃度為2ng/yL,55°C恒溫處理5 lOmin,緩慢降溫到20°C,保持 IOmin,然后加入終濃度為ImM的ATP,終濃度為5wiss/1000 μ L的T4DNA連接酶(30wiss), ddH20加至ΙΟΟΟμ L,20°C孵育2h以上。反應(yīng)結(jié)束后,試劑盒純化回收環(huán)化產(chǎn)物。為保證環(huán)化產(chǎn)物的純度,減少后續(xù)操作中的酶用量,因此清除未環(huán)化的酶切產(chǎn)物。 利用能對未環(huán)化的DNA片段作用而對環(huán)化DNA鏈不起作用的ATP依賴性DNA酶,建立反應(yīng)體系終濃度為ImM的ATP、10 X buffer 30 μ L、IOU/μ L的ATP依賴性DNA酶5 μ L、環(huán)化產(chǎn)物220 μ L,ddH20加至300 μ L,37°C孵育2h,反應(yīng)結(jié)束試劑盒提純回收。應(yīng)當(dāng)說明的是,本實施例僅是本發(fā)明中步驟S203的一個實施例,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。在步驟S204的一個實施例中,步驟S204具體實現(xiàn)如下設(shè)計合成使得第一接頭元件的配對區(qū)上攜帶有酶切識別位點,利用能夠識別第一接頭元件上的酶切識別位點,切割目的DNA片段但不切割接頭元件的typells酶如Acu I 對環(huán)化產(chǎn)物進(jìn)行酶切,從而得到接頭元件兩端連接有目的DNA片段末端的DNA構(gòu)建物。本實施例中所用酶切體系為環(huán)化產(chǎn)物60 μ L(3 5 μ g) UOXNEB buffer 8 μ L、Acu I (NEB, 10U) 2 μ L、SAM(32mM) 1 μ L,力卩 ddH20 至 80 μ L,37°C孵育 2h,乙醇沉淀 DNA 片段,然后 TE 重 ;塁、ο應(yīng)當(dāng)給予說明的是,本實施例僅是本發(fā)明步驟S204的一個實施例,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。在步驟S205的一個實施例中,步驟S205具體實現(xiàn)如下連接第二接頭元件之前,對DNA構(gòu)建物進(jìn)行提純。由于擴增時加入的是生物素化的擴增引物,因此可以直接通過親和素或鏈霉親和素修飾的磁珠對DNA構(gòu)建物進(jìn)行快速簡便的提純。本實施例利用鏈霉親和素修飾的磁珠M280,對DNA構(gòu)建物進(jìn)行提純。提純產(chǎn)物與第二接頭元件孵育連接,形成配對末端片段。連接體系以及條件為終濃度為Ipmol的磁珠連接的DNA構(gòu)建物、第二接頭元件1 μ L、連接緩沖液2 μ L、T4連接酶(30wiSS/ μ L)稀釋到 5wiss、10mM ATP 2 μ L,加 ddH20 至 20 μ L,14°C孵育 2h。本實施中的第二接頭元件優(yōu)選分叉區(qū)與配對區(qū)的雙鏈核酸分子,具體結(jié)構(gòu)見圖5 所示。其中分叉區(qū)的每條鏈包含N個核苷酸,930,每條單鏈上各有一個擴增引物結(jié)合位點;配對區(qū)含有9對互補配對的核苷酸。在此步驟中也能換用平端接頭,為了避免出現(xiàn)接頭之間的自連,因此優(yōu)選分叉接頭。應(yīng)當(dāng)給予說明的是,本實施例僅是本發(fā)明步驟S205的一個實施例,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。在步驟S206的一個實施例中,步驟S206具體實現(xiàn)如下利用0. IM的NaOH清洗3次配對末端片段,使其解旋形成單鏈,洗脫緩沖液清洗3次,然后TE重懸保存。應(yīng)當(dāng)說明的是,本實施例僅是本發(fā)明步驟S206的一個實施例,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。對于上述實施例,可以進(jìn)一步對得到的配對末端測序文庫進(jìn)行擴增,以得到更高拷貝數(shù)的配對末端測序文庫。對于連接在磁珠上的單鏈產(chǎn)物,優(yōu)選使用E-PCR反應(yīng)進(jìn)行擴增,直接形成結(jié)合于固相載體上的擴增文庫。在典型的E-PCR實施方案中,先將一端的擴增引物固定于磁珠上,另一端引物位于水相溶液中,然后水相與油相混合制備成乳濁液體系,使得擴增反應(yīng)在相互隔離的封閉小液滴中進(jìn)行單分子擴增。在另一實施例中,也可以直接采用一般的聚合酶鏈?zhǔn)椒磻?yīng)進(jìn)行擴增,擴增體系為配對末端片段40 μ LUOXbuffer 30 μ LUOmM dNTP 3 μ L、上下游兩端引物各3 μ L、Taq酶3 μ L,ddH20加至300 μ L。擴增反應(yīng)程序為 94°C 2min ;94°C IOs ;57°C IOs ;72°C 20s, 15cycles ;72°C 5min。擴增產(chǎn)物利用試劑盒純化回收,TE重懸成為 待用的測序文庫。應(yīng)當(dāng)說明的是,上述實施例中僅給出了典型的擴增方式,并不用于限定本發(fā)明的保護(hù)范圍。圖6為本發(fā)明的一個實施例中構(gòu)建測序文庫的方法示意圖。該圖直觀的展示了利用分叉接頭元件構(gòu)建測序文庫的過程1、利用常用方法如超聲破碎法將源DNA進(jìn)行片段化處理,以產(chǎn)生目的DNA片段;將片段混合物通過凝膠電泳的方式進(jìn)行DNA片段的分離純化;回收目的DNA片段之后,對其進(jìn)行磷酸化、末端修復(fù)以及加A尾的末端修飾。2、將帶有擴增引物結(jié)合位點以及酶切識別位點的分叉A-T接頭元件連接到目的 DNA片段兩端,形成連接物,然后加入生物素化并帶有酶切識別位點的擴增引物對連接物進(jìn)行擴增,產(chǎn)生帶有生物素化的擴增產(chǎn)物。3、利用之前加入的擴增引物所帶的酶切位點,對擴增產(chǎn)物進(jìn)行酶切,酶切產(chǎn)物進(jìn)行環(huán)化。擴增引物中帶有尿嘧啶堿基,利用尿嘧啶特異性切除試劑User酶進(jìn)行酶切,產(chǎn)生長突出末端,提高成環(huán)的效率。4、環(huán)化產(chǎn)物酶切,得到接頭元件兩端連有目的DNA片段末端的DNA構(gòu)建物。利用能夠識別第一接頭元件上的酶切識別位點,切割目的DNA片段但不切割接頭元件的typells 酶對環(huán)化產(chǎn)物進(jìn)行酶切,從而得到接頭元件兩端連接有目的DNA片段末端的DNA構(gòu)建物。5、利用經(jīng)鏈霉素修飾的磁珠與DNA構(gòu)建物上攜帶的生物素作用,對酶切產(chǎn)物進(jìn)行純化回收。6、在DNA構(gòu)建物兩端連接上帶有擴增引物結(jié)合位點的第二接頭元件,形成配對末端片段分子。該第二接頭元件同樣為分叉接頭元件,可以避免出現(xiàn)接頭自連現(xiàn)象。7、將磁珠上所連接的配對末端片段解旋形成單鏈分子,形成測序文庫。本方法能夠避免進(jìn)行再次成環(huán)或者是利用滾環(huán)擴增來提高環(huán)化產(chǎn)物數(shù)量的操作, 降低了耗時。應(yīng)當(dāng)說明的是,本發(fā)明提供的接頭元件以及構(gòu)建測序文庫的方法典型的應(yīng)用于測序樣品的處理,但不限于測序,任何其他類似的應(yīng)用均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種用于構(gòu)建測序文庫的接頭元件,其特征在于,所述接頭元件是從5’到3’端依次包含分叉區(qū)和配對區(qū)的分叉型雙鏈核酸接頭;所述分叉區(qū)的兩條單鏈各包含至少一個擴增引物結(jié)合位點;所述配對區(qū)包含至少一個酶切識別位點。
2.根據(jù)權(quán)利要求1所述的用于構(gòu)建測序文庫的接頭元件,其特征在于,所述分叉區(qū)的每條鏈含有N個核苷酸,其中9 < N < 30。
3.根據(jù)權(quán)利要求1或2所述的用于構(gòu)建測序文庫的接頭元件,其特征在于,所述配對區(qū)含有7 15對互補配對的核苷酸。
4.根據(jù)權(quán)利要求3所述的用于構(gòu)建測序文庫的接頭元件,其特征在于,所述接頭元件配對區(qū)的3’末端為突出末端或平末端。
5.根據(jù)權(quán)利要求4所述的用于構(gòu)建測序文庫的接頭元件,其特征在于,所述接頭元件配對區(qū)的3’末端為突出末端,且突出末端最后一個堿基為T。
6.根據(jù)權(quán)利要求4所述的用于構(gòu)建測序文庫的接頭元件,其特征在于,所述接頭元件配對區(qū)的3’末端為平末端,且3’末端最后一個核苷酸為帶有雙脫氧堿基的核苷酸。
7.—種構(gòu)建測序文庫的方法,其特征在于,所述方法包括以下步驟A.對源DNA進(jìn)行片段化處理,以產(chǎn)生目的DNA片段;B.目的DNA片段兩端連上所述權(quán)利要求1至6的任一接頭元件形成接頭元件-DNA復(fù)合物,加入擴增引物進(jìn)行擴增,得到擴增產(chǎn)物;C.對擴增產(chǎn)物進(jìn)行富集回收,形成測序文庫。
8.根據(jù)權(quán)利要求7所述的構(gòu)建測序文庫的方法,其特征在于,所述步驟A之后還包括所述目的DNA片段的分離純化和末端修飾步驟。
9.根據(jù)權(quán)利要求7所述的構(gòu)建測序文庫的方法,其特征在于,步驟B中所述擴增引物采用聚合酶鏈?zhǔn)椒磻?yīng)引物,或帶有RNA轉(zhuǎn)錄酶初始序列的轉(zhuǎn)錄引物。
10.根據(jù)權(quán)利要求9所述的構(gòu)建測序文庫的方法,其特征在于,步驟B所述擴增引物是生物素化的引物。
11.根據(jù)權(quán)利要求9所述的構(gòu)建測序文庫的方法,其特征在于若擴增引物是聚合酶鏈反應(yīng)引物,則后續(xù)利用聚合酶鏈反應(yīng)進(jìn)行擴增;若擴增引物是帶有RNA轉(zhuǎn)錄酶初始序列的轉(zhuǎn)錄引物,則后續(xù)利用轉(zhuǎn)錄法進(jìn)行擴增。
12.根據(jù)權(quán)利要求10所述的構(gòu)建測序文庫的方法,其特征在于,步驟C所述擴增產(chǎn)物的富集回收利用親和素或鏈霉親和素修飾的磁珠進(jìn)行。
13.一種構(gòu)建測序文庫的方法,其特征在于,所述方法包括以下步驟A.對源DNA進(jìn)行片段化處理,以產(chǎn)生目的DNA片段;B.目的DNA片段兩端連上第一接頭元件形成接頭元件-DNA復(fù)合物,加入擴增弓|物進(jìn)行擴增,得到擴增產(chǎn)物;C.酶切擴增產(chǎn)物得到酶切產(chǎn)物,環(huán)化酶切產(chǎn)物得到環(huán)化產(chǎn)物;D.酶切環(huán)化產(chǎn)物得到DNA構(gòu)建物;E.在DNA構(gòu)建物兩端連接第二接頭元件形成配對末端片段;F.解旋形成單鏈,得到配對末端測序文庫。
14.根據(jù)權(quán)利要求13所述的構(gòu)建測序文庫的方法,其特征在于,所述片段化處理步驟之后還包括目的DNA片段的分離純化及末端修飾步驟。
15.根據(jù)權(quán)利要求13所述的構(gòu)建測序文庫的方法,其特征在于,步驟B所述擴增引物是生物素化的擴增引物。
16.根據(jù)權(quán)利要求13所述的構(gòu)建測序文庫的方法,其特征在于,所述擴增引物上帶有至少一個特異性酶切識別位點。
17.根據(jù)權(quán)利要求16所述的構(gòu)建測序文庫的方法,其特征在于若擴增引物上所帶的特異性酶切識別位點是尿嘧啶堿基,則步驟C利用尿嘧啶特異性切除試劑進(jìn)行酶切;若擴增引物所帶特異性酶切識別位點為限制性內(nèi)切酶識別位點,則步驟C利用相應(yīng)的限制性內(nèi)切酶進(jìn)行酶切。
18.根據(jù)權(quán)利要求13所述的構(gòu)建測序文庫的方法,其特征在于,步驟D中利用能夠識別接頭元件上的酶切識別位點,切割目的DNA片段但不切割接頭元件的II類限制性內(nèi)切酶進(jìn)行酶切環(huán)化產(chǎn)物,從而得到接頭元件兩端連接有目的DNA片段末端的DNA構(gòu)建物。
19.根據(jù)權(quán)利要求13所述的構(gòu)建測序文庫的方法,其特征在于,所述第二接頭元件是包含分叉區(qū)與配對區(qū)的雙鏈核酸分子,其中分叉區(qū)的每條鏈包含N個核苷酸,9 ^ N ^ 30 ; 配對區(qū)含有7 15對互補配對的核苷酸。
20.根據(jù)權(quán)利要求13所述的構(gòu)建測序文庫的方法,其特征在于,所述步驟F后還包括以下步驟G.對所述的配對末端測序文庫進(jìn)行擴增,以得到更高拷貝數(shù)的配對末端測序文庫。
全文摘要
本發(fā)明涉及基因工程領(lǐng)域,提供了用于構(gòu)建測序文庫的系統(tǒng)與方法。所述系統(tǒng)與方法包括接頭元件及其應(yīng)用于構(gòu)建測序文庫的方法。接頭元件是從5’到3’端依次包含分叉區(qū)與配對區(qū)的分叉型雙鏈核酸接頭,其分叉區(qū)的兩條單鏈各包含至少一個擴增引物結(jié)合位點,配對區(qū)包含至少一個酶切識別位點。本發(fā)明的接頭元件在文庫構(gòu)建過程中能夠避免接頭元件自連現(xiàn)象以及非目標(biāo)接頭元件-DNA片段復(fù)合物的出現(xiàn)。
文檔編號C40B50/06GK102296065SQ20111022295
公開日2011年12月28日 申請日期2011年8月4日 優(yōu)先權(quán)日2011年8月4日
發(fā)明者盛司潼 申請人:盛司潼