專利名稱:一種利用酶切延伸增加讀長的測序方法
技術(shù)領(lǐng)域:
本發(fā)明涉及基因工程領(lǐng)域,更具體地說,涉及一種利用酶切延伸增加讀長的測序方法。
背景技術(shù):
新一代測序技術(shù)(next-generation sequencing, NGS)主要包括焦磷酸測序法 (sequencing by pyrosequencing),合成法測序(sequencing by synthesis, SBS)禾口連接法測序(sequencing by ligation, SBL)。其中,連接法測序具有準確率高,成本低的優(yōu)點,適用于轉(zhuǎn)錄本及比較基因組學(xué)研究,特別是單核苷酸多態(tài)性(Single Nucleotide Polymorphisms, SNP)的檢測。現(xiàn)有的一種連接測序法是利用內(nèi)切酶酶切延伸進行測序的,如圖1所示,該方法的步驟包括(1)、利用帶有酶切識別位點的雙鏈寡核苷酸接頭一與核酸片段連接,得到待測核酸片段;O)、以識別酶切識別位點的限制性內(nèi)切酶對待測核酸片段進行酶切,得到其中一條鏈帶有突出末端的雙鏈產(chǎn)物;(3)、在雙鏈產(chǎn)物上連接一組對應(yīng)特定位置帶有熒光標記的雙鏈接頭二,得到連接產(chǎn)物;通過檢測連接產(chǎn)物的熒光信號獲取該特定位置對應(yīng)的核苷酸序列信息;其中,雙鏈接頭二帶有突出末端;每個雙鏈接頭二帶有酶切識別位點;根據(jù)酶切識別位點與酶切位點之間的核苷酸個數(shù),所述突出末端預(yù)先計算好一個或數(shù)個核苷酸;(4)、分離步驟(3)中的連接產(chǎn)物,得到分離產(chǎn)物;(5)、利用能識別步驟(3)中所帶酶切識別位點的酶對分離產(chǎn)物進行酶切,得到帶有酶切識別位點的一組片段;(6)、重復(fù)步驟C3)至(5)的操作,直至測得待測核酸片段上能測的所有核苷酸序列;其中最后一次重復(fù)操作時,可以忽略步驟(5)。在上述連接測序法中,利用帶有熒光標記的雙鏈寡核苷酸接頭作為檢測探針,以接頭上所帶酶切識別位點位置的變更來實現(xiàn)和控制測序位置的延伸推進。由于雙鏈寡核苷酸接頭核苷酸個數(shù)以及所使用的限制性內(nèi)切酶識別位點與酶切位點之間的核苷酸個數(shù)限制,所能檢測得到的核苷酸序列最多只能等于酶切識別位點與酶切位點之間的核苷酸個數(shù),其讀長受限制。因此,迫切需要一種新的利用酶切延伸增加讀長的測序方法,使測序的讀長不受限制,能讀取待測核酸片段上所需的核苷酸序列。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種利用酶切延伸增加讀長的測序方法,旨在解決現(xiàn)有技術(shù)中酶切延伸方法的讀長受限的問題。
為了實現(xiàn)發(fā)明目的,所述利用酶切延伸增加讀長的測序方法包括以下步驟A.將第一 anchor結(jié)合于原待測核酸片段的接頭一上;B.在第一 anchor延伸末端連接熒光探針,檢測其熒光信號,更換熒光探針并重復(fù)連接和檢測操作,得到第一 anchor延伸末端后M個核苷酸的序列信息;C.利用內(nèi)切酶將步驟B中已得到序列信息的核苷酸部分或完全切除,得到帶有待測序片段的酶切產(chǎn)物;D.酶切產(chǎn)物連接接頭二得新待測核酸片段,結(jié)合第二 anchor于接頭二上;E.在第二 anchor延伸末端連接熒光探針,檢測其熒光信號,更換熒光探針并重復(fù)連接和檢測操作,得到第二 anchor延伸末端后N個核苷酸的序列信息;F.重復(fù)步驟C至E的操作,直至測得原待測核酸片段中所需的核苷酸序列信息;其中,M、N均為正整數(shù)。其中,步驟A中所述第一 anchor帶有至少一個酶切識別位點。進一步的,所述步驟C包括以下步驟Cl.將熒光探針與第一 anchor洗脫,重置第一 anchor并進行鏈延伸,與原待測核酸片段形成雙鏈核酸分子;C2.內(nèi)切酶通過識別第一 anchor上所帶的酶切識別位點進行酶切,將步驟B中已得到序列信息的核苷酸部分或完全切除,得帶有待測序片段的酶切產(chǎn)物。其中,步驟C可以包括以下步驟Cl’ .在第一 anchor的另一端連接雙鏈的接頭三,該接頭三帶有至少一個酶切識別位點;C2’.利用內(nèi)切酶識別接頭三所帶的酶切識別位點,將步驟B中已得到序列信息的核苷酸部分或完全切除,得到帶有待測序片段的酶切產(chǎn)物。其中,所述步驟A中第一 anchor的一端是封閉的。進一步的,在步驟C前還包括步驟C0.對第一 anchor的另一端進行活化,使其能夠用于連接和延伸。其中,上述步驟中第一 anchor帶有至少一個特異性殘基。進一步的,所述步驟B包括以下步驟Bi.在帶有特異性殘基的第一 anchor延伸末端連接熒光探針,檢測其熒光信號, 得到對應(yīng)位置的核苷酸序列信息;B2.以特異性切割劑切割特異性殘基,將熒光探針及第一 anchor洗脫,重置第一 anchor ;B3.在第一 anchor延伸末端重復(fù)熒光探針的連接和檢測操作,得到第一 anchor延伸末端后M個核苷酸的序列信息。其中,步驟D中所述接頭二為平末端接頭、突出末端接頭、分叉型接頭或帶莖環(huán)結(jié)構(gòu)的接頭。其中,步驟D包括以下步驟Dl.酶切產(chǎn)物連接接頭二,得到帶有接頭二的雙鏈核酸片段;D2.將帶有接頭二的雙鏈核酸片段變性解離,得新待測核酸片段;D3.將第二 anchor結(jié)合于新待測核酸片段的接頭二上。
其中,所述第一 anchor和第二 anchor可以是相同或者不同的。進一步的,所述第二 anchor可以帶有至少一個酶切識別位點。進一步的,所述第二 anchor還可以帶有至少一個特異性殘基。其中,上述步驟中的原待測核酸片段固定于固相載體表面。其中,步驟B中所述M的數(shù)值范圍優(yōu)選為1 9,更優(yōu)選為1 6。其中,步驟E中所述N的數(shù)值范圍優(yōu)選為1 9,更優(yōu)選為1 6。由上可知,本發(fā)明所述利用酶切延伸增加讀長的測序方法,利用內(nèi)切酶將原待測核酸片段上已經(jīng)得到序列信息的核苷酸部分或完全切除,然后再連接新的接頭,用于錨定新的anchor并進行后續(xù)的測序反應(yīng),從而延長了測序反應(yīng)的讀長,且本發(fā)明的酶切延伸測序方法的讀長不受限制。
圖1是現(xiàn)有技術(shù)中一種利用內(nèi)切酶酶切延伸測序的連接測序法示意圖;圖2是本發(fā)明一個實施例中利用酶切延伸增加讀長的測序方法的方法流程圖;圖3是本發(fā)明一個實施例中所用第一 anchor的結(jié)構(gòu)示意圖;圖4是本發(fā)明一個實施例中利用圖3所示的第一 anchor得到其延伸末端后M位核苷酸序列信息的方法流程圖;圖5是本發(fā)明一個具體實施方式
中第一 anchor的結(jié)構(gòu)示意圖;圖6是本發(fā)明一個具體實施方式
中利用圖5所示的第一 anchor得到其延伸末端后M位核苷酸序列信息的方法流程圖;圖7是本發(fā)明另一個具體實施方式
中第一 anchor的結(jié)構(gòu)示意圖;圖8是本發(fā)明一個具體實施方式
中利用圖7所示的第一 anchor得到其延伸末端后M位核苷酸序列信息的方法流程圖;圖9是本發(fā)明一個實施例中得到帶有待測序片段的酶切產(chǎn)物的方法流程圖;圖10是本發(fā)明另一個實施例中得到帶有待測序片段的酶切產(chǎn)物的方法流程圖;圖11是本發(fā)明一個實施例中接頭二的結(jié)構(gòu)示意圖;圖12是本發(fā)明另一個實施例中接頭二的結(jié)構(gòu)示意圖;圖13是本發(fā)明另一個實施例中所用的接頭二的結(jié)構(gòu)示意圖;圖14是本發(fā)明另一個實施例中所用的接頭二的結(jié)構(gòu)示意圖;圖15是本發(fā)明另一個實施例中所用的接頭二的具體結(jié)構(gòu)示意圖;圖16是本發(fā)明一個實施例中得到第二 anchor延伸末端后N個核苷酸的序列信息的方法流程圖;圖17是本發(fā)明另一個實施例中得到第二 anchor延伸末端后N個核苷酸的序列信息的方法示意圖;圖18是本發(fā)明一個實施例中利用酶切延伸增加讀長的測序方法示意圖。
具體實施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。
本發(fā)明提供了一種利用酶切延伸增加讀長的測序方法,包括以下步驟首先將錨定引物第一 anchor與原待測核酸片段上的接頭一錨定結(jié)合,利用標記位置不同的熒光探針,重復(fù)連接熒光探針、采集熒光信號、洗脫熒光探針、更換熒光探針后再連接的步驟,并根據(jù)所連接的熒光探針種類的不同,讀取原待測核酸片段中第一 anchor延伸末端后M個核苷酸的序列信息;然后利用內(nèi)切酶進行酶切,將之前已經(jīng)讀取過的核苷酸序列部分或完全切除,保留帶有待測序核苷酸序列的新待測核酸片段,并使之與新的接頭連接,進而錨定新的anchor,然后通過在新的anchor的延伸末端連接不同的熒光探針,讀取新的anchor的延伸末端后N個核苷酸的序列信息。之后重復(fù)上述內(nèi)切酶酶切、更換新的接頭、錨定新的 anchor、連接新的熒光探針和檢測熒光信號讀取核苷酸序列信息的步驟,從而獲得原待測核酸片段中所需的核苷酸序列信息。利用本發(fā)明的酶切延伸測序方法進行測序,讀長不受限制。其中,上述步驟中的原待測核酸片段與新待測核酸片段是相對的,原待測核酸片段是指最初始的待測核酸片段,其上帶有接頭以及待測序的核酸片段;而新待測核酸片段是指經(jīng)過酶切之后的待測序片段連接新的接頭而形成的待測核酸片段。本發(fā)明中所述熒光探針分為不同組別類型,同組類型中不同熒光標記對應(yīng)同一特定位置的不同核苷酸序列,而不同組類型的熒光探針熒光標記對應(yīng)的特定位置不同。每次連接反應(yīng)中,加入同一組類型的熒光探針,根據(jù)所采集的熒光信號,可以讀取該組熒光探針標記特定位置對應(yīng)的核苷酸序列信息。本發(fā)明中所述的各種anchor是用于與待測核酸片段上的各種接頭進行錨定結(jié)合的單鏈寡核苷酸;其中所述anchor的一端是延伸末端,另一端可以是封閉的,也可以是不封閉的,封閉的優(yōu)勢在于避免anchor相互之間的自連現(xiàn)象的發(fā)生,保證anchor與熒光探針的定向連接。本發(fā)明所述延伸末端,是指能夠用于繼續(xù)連接并進行核苷酸鏈延伸的末端,其可位于anchor的3,端,也可位于anchor的5,端。本發(fā)明所述酶切識別位點,是指能夠被酶特異性識別并利用其進行酶切反應(yīng)的核苷酸序列,該序列的核苷酸個數(shù)無具體限制,可根據(jù)實際需要進行相應(yīng)的調(diào)整。圖2示出了本發(fā)明一個實施例中利用酶切延伸增加讀長的測序方法流程,該方法包括Si.將第一 anchor結(jié)合于原待測核酸片段的接頭一上;S2.在第一 anchor延伸末端連接熒光探針,檢測其熒光信號,更換熒光探針并重復(fù)連接和檢測操作,得到第一 anchor延伸末端后M個核苷酸的序列信息;S3.利用內(nèi)切酶將步驟S2中已得到序列信息的核苷酸部分或完全切除,得到帶有待測序片段的酶切產(chǎn)物;S4.酶切產(chǎn)物連接接頭二得到新待測核酸片段,將第二 anchor結(jié)合于接頭二上;S5.在第二 anchor延伸末端連接熒光探針,檢測其熒光信號,更換熒光探針并重復(fù)連接和檢測操作,得到第二 anchor延伸末端后N個核苷酸的序列信息;S6.重復(fù)步驟S3至S5的操作,直至測得原待測核酸片段中所能獲取的核苷酸序列 fn息ο針對本技術(shù)方案,需要說明的是
步驟Sl中所述的原待測核酸片段,至少其兩端帶有接頭,為使操作便利,優(yōu)選將其中一端接頭與固相載體連接,所述用于連接的固相載體可以使不同材質(zhì)和不同形狀的剛性物質(zhì),其材質(zhì)包括但不限于玻璃、硅、陶瓷、塑料和金屬;其形狀包括但不限于板層形、 平板形、圓片形和球形;對于固相載體,本發(fā)明優(yōu)選磁珠以及玻片。本步驟中所述第一 anchor是根據(jù)堿基互補配對原則,與原待測核酸片段上的接頭一進行錨定結(jié)合的錨定引物,用于在步驟S2中連接熒光探針。除此之外,第一 anchor還可以根據(jù)具體需要,進行不同的設(shè)計。在本發(fā)明的一個實施方案中,第一 anchor與原待測核酸片段一端的接頭一通過堿基互補配對進行錨定結(jié)合。該方案中,第一 anchor可以不進行封閉處理,以降低第一 anchor的合成成本;也可以在第一 anchor的一端進行封閉處理,避免第一 anchor相互之間發(fā)生自連,保證第一 anchor與熒光探針的定向連接。將第一 anchor的一端進行封閉,可以是第一 anchor的3,端,也可以是5,端,經(jīng)過封閉處理既可以控制連接的方向,又可以避免第一 anchor之間相互連接。在本步驟的一個具體實施方式
中,將第一 anchor的3’端進行封閉,封閉的方法包括但不限于雙脫氧、氨基化反應(yīng)、酰胺化,第一 anchor被封閉的3’端無法繼續(xù)連接,即第一 anchor的連接只能發(fā)生在5’端;而在本步驟的另一個具體實施方式
中,將第一 anchor的5’端進行封閉,封閉的方法包括但不限于去磷酸化或酰胺化,即第一 anchor的連接只能發(fā)生在3’端。在本發(fā)明的另一個實施方案中,第一 anchor帶有至少一個特異性殘基,所述特異性殘基是指其本身或其所帶的化學(xué)鍵能被特異性切割的殘基,它能使其所在的核苷酸片段由于被切割而更易于洗脫。用于切割特異性殘基的物質(zhì)稱為特異性切割劑。所述特異性殘基包括但不限于脫氧尿嘧啶核苷酸(de0Xy-UraCil,dU)、脫氧肌苷(deoxy Inosine,dI)、帶有硫代磷酸酯鍵的核苷酸和切口酶的酶切識別位點。其相應(yīng)的特異性切割劑包括但不限于尿嘧啶-DNA糖基化酶⑴racil-DNA Glycocasylase,UDG酶)、大腸桿菌核酸內(nèi)切酶V、帶有 Ag、Hg、Cu、Mn、Zn或Cd離子的化合物和切口酶。所述切口酶,是指能識別雙鏈核酸分子中一條核苷酸鏈所攜帶的酶切識別位點,而在帶有該酶切識別位點的核苷酸鏈上進行酶切形成切口的II型限制酶;本發(fā)明所述切口酶,包括但不限于Nt.Alw I內(nèi)切酶、Nt. BsmA I內(nèi)切酶、Nt. BspQ I內(nèi)切酶、Nt. BstNB I內(nèi)切酶。本實施方案的第一 anchor設(shè)計方式可以使得在后續(xù)的洗脫更換過程中更加便利。在本發(fā)明的另一個實施方案中,第一 anchor帶有至少一個酶切識別位點,該酶切識別位點可被直接利用于部分或完全切除步驟S2中所讀取過的核苷酸序列,使得整個發(fā)明技術(shù)方案步驟簡化,操作簡便。步驟Sl中所述接頭一為原待測核酸片段一端上的一段已知序列,用于使第一 anchor錨定結(jié)合到原待測核酸片段上。該接頭一可以是得到待測序的樣品之后進行測序文庫構(gòu)建過程中自行設(shè)計合成連接上去的,也可以是得到的待測序樣品本身已經(jīng)帶有的。步驟S2中,所述第一 anchor的延伸末端,是指在第一 anchor后能夠繼續(xù)連接并進行核苷酸鏈延伸的末端。根據(jù)步驟Sl中所述第一 anchor的不同設(shè)計結(jié)構(gòu),步驟S2可以采用不同的實現(xiàn)方式。在本發(fā)明的一個實施方案中,第一 anchor帶有特異性殘基,在本實施方案中的一個具體實施例中,第一 anchor的結(jié)構(gòu)如圖3所示,圖中所示X為A、G、C或T,Y代表特異性殘基,η為正整數(shù)。另外,圖中Y的個數(shù)以及Y在X中的位置可變,當(dāng)存在多個Y時,Y與Y 之間并不一定是以圖3中所示的相連的形式存在,可分別散布在第一 anchor的不同位置。 上述的第一 anchor可以使得步驟S2中熒光探針的洗脫以及更換的實現(xiàn)更加簡便。利用該結(jié)構(gòu)的第一 anchor實現(xiàn)步驟S2的方法如圖4所示,包括以下步驟S21.在帶有特異性殘基的第一 anchor延伸末端連接熒光探針,檢測其熒光信號, 得到對應(yīng)位置的核苷酸序列信息;S22.以特異性切割劑切割特異性殘基,將熒光探針及第一 anchor洗脫,重置第一 anchor ;S23.在第一 anchor延伸末端重復(fù)熒光探針的連接和檢測操作,得到第一 anchor 延伸末端后M個核苷酸的序列信息。需要說明的是,在該技術(shù)方案中,步驟S21中所述第一 anchor帶有的特異性殘基及其相應(yīng)的特異性切割劑可以包括多種。在本發(fā)明的一個優(yōu)選實施例中,如圖5所示,第一 anchor帶有的特異性殘基為dU 堿基,其對應(yīng)的特異性切割劑為UDG酶。利用如圖5所示結(jié)構(gòu)的第一 anchor,步驟S2可以通過圖6所示的方法實現(xiàn),該方法包括以下步驟S21’.在帶有dU堿基的第一 anchor延伸末端連接熒光探針,檢測其熒光信號,得到對應(yīng)位置的核苷酸序列信息;S22’.以UDG酶識別dU堿基并進行酶切,將熒光探針及第一 anchor洗脫,重置第一 anchor ;S23,.在第一 anchor延伸末端重復(fù)熒光探針的連接和檢測操作,得到第一 anchor 延伸末端后M個核苷酸的序列信息。以該技術(shù)方案實現(xiàn)步驟S2,其優(yōu)勢在于,第一 anchor帶有dU堿基,可以直接利用特異性識別酶切dU堿基的UDG酶對第一 anchor進行切割,形成短片段,從而使得步驟S2 中熒光探針的洗脫以及更換的實現(xiàn)更加簡便。在本發(fā)明的另一個優(yōu)選實施例中,如圖7所示,第一 anchor所帶的特異性殘基為切口酶Nt. Alw I的酶切識別堿基。利用如圖7所示結(jié)構(gòu)的第一 anchor,步驟S2可以通過如圖8所示的方法實現(xiàn),該方法包括以下步驟S21”.在帶有切口酶酶切識別位點的第一 anchor延伸末端連接熒光探針,檢測其熒光信號,得到對應(yīng)位置的核苷酸序列信息;S22”.以切口酶識別切口酶酶切識別位點并進行酶切,將熒光探針洗脫;S23”.在第一 anchor延伸末端重復(fù)熒光探針的連接和檢測操作,得到第一 anchor 延伸末端后M個核苷酸的序列信息。以該技術(shù)方案實現(xiàn)步驟S2,其優(yōu)勢在于,在更換熒光標記對應(yīng)堿基位置不同的熒光探針時,可以利用第一 anchor上所攜帶的切口酶酶切識別位點,通過相應(yīng)的切口酶直接將原來連接的熒光探針與第一 anchor之間的連接打斷,從而輕松將原來連接的熒光探針洗掉,連接新的熒光探針,避免將第一 anchor洗脫之后又重置,簡化操作步驟,同時節(jié)省試劑的成本。其中,上述步驟中所述M為正整數(shù),其數(shù)值范圍由本發(fā)明所使用的連接酶決定,優(yōu)選為1 9,更優(yōu)選為1 6。在本發(fā)明的一個實施方案中,利用T4連接酶實現(xiàn)本發(fā)明所述的酶切延伸測序法,M的數(shù)值優(yōu)選為1 6 ;在本發(fā)明的另一個實施方案中,利用Tth連接酶實現(xiàn)本發(fā)明所述的酶切延伸測序法,M的數(shù)值范圍可優(yōu)選為1 9。在上述優(yōu)選范圍內(nèi), 本發(fā)明的酶切延伸測序法不僅能夠增加測序讀長,測序讀長不受限制,還能進一步提高測序過程中的熒光探針與anchor連接的準確性,進而提高核苷酸序列信息讀取的準確性。其中,當(dāng)利用T4連接酶,將熒光探針連接在anchor的3’端或者5’端時,熒光探針與anchor 發(fā)生連接的那一端的6個堿基需與相應(yīng)的待測序片段完全互補配對,才能實現(xiàn)連接;當(dāng)利用Tth連接酶,將熒光探針連接在anchor的3’端或5’端時,分別要求熒光探針與anchor 連接的那一端的8個或9個堿基與相應(yīng)的待測序片段完全互補配對,才能實現(xiàn)連接。上述步驟中所使用的熒光探針分為不同組別類型,同組類型中不同熒光標記對應(yīng)同一特定位置的不同核苷酸序列信息,而不同組類型的熒光探針熒光標記對應(yīng)的特定位置不同。每次連接反應(yīng)中,加入同一組類型的熒光探針,根據(jù)所采集的熒光信號,可以得到該組熒光探針標記特定位置對應(yīng)的核苷酸序列信息;而通過第一 anchor的雜交結(jié)合-熒光探針的連接-采集熒光信號-熒光探針的洗脫這些操作的重復(fù),可以準確的得到第一 anchor 延伸末端后M個核苷酸的序列信息。在步驟S2結(jié)束之后,原待測核酸片段上保留了結(jié)合的第一 anchor和熒光探針。為了便于步驟S3中的內(nèi)切酶進行酶切,可將第一 anchor延伸末端重新活化,然后加入四種核苷酸,利用DNA聚合酶,沿著第一 anchor延伸末端的方向,將固定于固相載體上的原待測核酸片段形成完整的雙鏈核酸分子。步驟S3中所述內(nèi)切酶,是指能識別雙鏈核酸分子上所帶有的特異性酶切識別堿基序列,然后在距離酶切識別位點一定數(shù)量堿基的位置進行雙鏈核酸切割的酶。在本發(fā)明中,可以使用酶切之后能得到平末端的內(nèi)切酶,優(yōu)選使用酶切之后能得到粘性突出末端的內(nèi)切酶,其選用原則遵循通過識別酶切識別位點,能將步驟S2中已經(jīng)獲取的核苷酸序列全部或部分切除的內(nèi)切酶即可。在選用內(nèi)切酶時,優(yōu)選最適反應(yīng)溫度在37°C左右的內(nèi)切酶,最適反應(yīng)溫度過高的內(nèi)切酶容易導(dǎo)致在酶切過程中雙鏈的變性解離,從而導(dǎo)致后續(xù)熒光探針的連接受阻;優(yōu)選對甲基化不敏感的內(nèi)切酶,以便能持續(xù)的酶切和獲取待測核酸片段的核苷酸序列;優(yōu)選酶切識別位點與酶切位點之間核苷酸個數(shù)在4以上的,使得每次酶切之后向前延伸測序的長度更長。本發(fā)明所用的內(nèi)切酶可以是II型內(nèi)切酶,包括但不限于Acu I.Alw I.Bbs I.Bbv
I、BccI、BceA I、BciV I、BfuA I、Bmr I、Bpm I、Bsa I、BseR I、Bsg I、BsmA I、BsmB I、 BsmF I、BspM I、BspQ I、BtgZ I、Ear I、Eci I、Fau I、Fok I、Hga I、Hph I、HpyA V、Mbo
II、MlyI、Mnl I、Ple I、Sap I、SfaN I、BpuE I、Mme I 和 NmeAIII,其中優(yōu)選 Acu I、Bbv I,BceA I,Bpm I,BseR I,BspM I,Fok I,Hga I,Mbo II 和 Mnl I ;所用的內(nèi)切酶也可以是 III型內(nèi)切酶,包括但不限于Ecop 1和Ecop 15 1。步驟S3中,用于被內(nèi)切酶進行識別的酶切識別位點,可以通過第一 anchor帶入, 也可以通過其他方法帶入。根據(jù)酶切識別位點來源的不同,步驟S3也可以通過不同的方法實現(xiàn)。在本發(fā)明中的一個實施方案中,酶切識別位點直接由第一 anchor帶入,即第一 anchor帶有至少一個酶切識別位點。
利用第一 anchor上所帶有的酶切識別位點,可以有多種不同的方式實現(xiàn)步驟S3。 在本方案的一個具體實施方式
中,步驟S3可以直接利用內(nèi)切酶識別第一 anchor上所帶的酶切識別位點,將步驟S2中已經(jīng)得到序列信息的核苷酸部分或完全切除,得到帶有待測序片段的酶切產(chǎn)物。利用該實施方式實現(xiàn)步驟S3的優(yōu)勢在于,在步驟S2得到第一 anchor延伸末端后 M個核苷酸的序列信息之后,利用第一 anchor上所帶有的酶切識別位點直接進行酶切,可以簡化操作步驟。在本方案的另一個具體實施方式
中,利用第一 anchor上所帶有的酶切識別位點, 步驟S3還可以通過如圖9所示的方法實現(xiàn),該方法包括如下步驟S31.將熒光探針與第一 anchor洗脫,重置第一 anchor并進行鏈延伸,與原待測核酸片段形成雙鏈核酸分子;S32.內(nèi)切酶通過識別第一 anchor上所帶的酶切識別位點,將步驟S2中已得到序列信息的核苷酸部分或完全切除,得到帶有待測序片段的酶切產(chǎn)物。利用該技術(shù)方案實現(xiàn)步驟S3的優(yōu)勢在于,首先利用第一 anchor的延伸末端進行鏈延伸,與原待測核酸片段延伸形成雙鏈核酸分子,能夠保證酶切產(chǎn)物保持雙鏈狀態(tài),便于后續(xù)接頭的連接。在本實施方案的一個優(yōu)選實施例中,原待測核酸片段通過5’端連接固定于微珠上,而結(jié)合于接頭一的第一 anchor上帶有酶切識別位點序列5’ . . . CTGAAG. . . 3’,步驟S3 中利用II型內(nèi)切酶Acu I識別該酶切識別位點并進行酶切,得到待測序片段3’端帶有兩個突出核苷酸的酶切產(chǎn)物。在本實施方案的另一個優(yōu)選實施例中,原待測核酸片段通過5’端連接固定于微珠上,而結(jié)合于接頭一的第一 anchor上帶有酶切識別位點序列5’. . . GCAGC. . . 3’,步驟S3中利用π型內(nèi)切酶I識別該酶切識別位點并進行酶切,得到待測序片段3’端帶有兩個突出核苷酸的酶切產(chǎn)物。在本實施方案的另一個優(yōu)選實施例中,原待測核酸片段通過5’端連接固定于微珠上,而結(jié)合于接頭一的第一 anchor上帶有酶切識別位點序列5’. . . GAGTC. . . 3’,步驟S3中利用II型內(nèi)切酶Mly I識別該酶切識別位點并進行酶切,得到待測序片段3’端帶有平末端的酶切產(chǎn)物。在本實施方案的一個優(yōu)選實施例中,原待測核酸片段通過3’端連接固定于微珠上,而結(jié)合于接頭一的第一 anchor上帶有酶切識別位點序列5’. . . CATCC. . . 3’,步驟S3中利用i^ok I酶識別該酶切識別位點并進行酶切,得到待測序片段5’端帶有4個突出核苷酸的酶切產(chǎn)物。在本實施方案的一個具體實施例中,原待測核酸片段通過5’端連接固定于微珠上,而結(jié)合于接頭一的第一 anchor上帶有酶切識別位點序列5’ . . . CAGCAG. . . 3’,步驟S3 中利用III型內(nèi)切酶Ecopl5I酶識別該酶切識別位點并進行酶切,得到待測序片段3’端帶有兩個突出核苷酸的酶切產(chǎn)物。在本發(fā)明的另一個實施方案中,酶切識別位點通過在第一 anchor的另一端連接帶有至少一個酶切識別位點的接頭三帶入。利用接頭三,步驟S3可以通過如圖10所示的方法實現(xiàn),該方法包括以下步驟
S31’.在第一 anchor的另一端連接雙鏈的接頭三,該接頭三帶有至少一個酶切識別位點;S32’ .利用內(nèi)切酶識別接頭三所帶的酶切識別位點,將步驟B中已得到序列信息的核苷酸部分或完全切除,得到帶有待測序片段的酶切產(chǎn)物。需要說明的是,所述第一 anchor的另一端,是相對步驟S 1中第一 anchor已經(jīng)用于延伸的末端而言的;若第一 anchor的另一端在步驟S3之前是被封閉的,那么在步驟S3 之前需要先進行活化;活化的方法可以利用現(xiàn)有技術(shù)中的任一種,只需將另一端中可用于連接的基團暴露出來即可,如在本發(fā)明的一個優(yōu)選的具體實施方式
中,第一 anchor本身帶有特異性殘基,可直接利用特異性切割劑切割特異性殘基完成活化。所述接頭三,是帶有至少一個酶切識別位點的核酸分子,用于引入內(nèi)切酶的酶切識別位點,以便于后續(xù)步驟中,通過內(nèi)切酶將已得到序列信息的核苷酸部分或完全切除。利用該技術(shù)方案實現(xiàn)步驟S3的優(yōu)勢為適用性廣,對原待測核酸片段無特殊要求,無論原待測核酸片段上結(jié)合的第一 anchor 是否帶有酶切識別位點,均可通過該技術(shù)方案實現(xiàn)。需要進一步說明的是,接頭三可以選用相應(yīng)帶有不同末端的接頭,包括但不限于平末端接頭、突出末端接頭、分叉型接頭和帶莖環(huán)結(jié)構(gòu)的接頭。本發(fā)明中優(yōu)選使用突出末端接頭、分叉型接頭和帶莖環(huán)結(jié)構(gòu)的接頭,這些結(jié)構(gòu)的接頭在連接過程中可以避免出現(xiàn)多個接頭之間自連的現(xiàn)象。針對上述不同的實現(xiàn)方案,接頭三上所述用于酶切的內(nèi)切酶酶切識別位點可以是上述內(nèi)切酶所對應(yīng)的任意一種,只需在設(shè)計合成時將酶切識別位點與酶切位點之間的核苷酸預(yù)先計算好,使得酶切之后恰好將步驟S2中已經(jīng)讀取過序列信息的核苷酸部分或完全切除即可,因此在本發(fā)明中可以選用不同的酶切識別位點及其相應(yīng)的內(nèi)切酶實現(xiàn)對步驟S2中已得到序列信息的核苷酸的切除。在此需要說明的是本發(fā)明中所述平末端接頭是指接頭雙鏈之間的核苷酸數(shù)量相等且完全互補的雙鏈接頭。本發(fā)明中所述突出末端接頭,是指雙鏈核酸分子中的至少一端帶有突出核苷酸序列,而其余核苷酸則完全互補的雙鏈核酸接頭。突出末端接頭可為單突出末端(圖11),也可以是含有兩個突出末端的雙突出末端,這兩個突出末端可在一條核苷酸鏈上(圖12a)或在不同的核苷酸鏈上(圖12b)。本發(fā)明中所述分叉型接頭包括互補區(qū)和分叉區(qū),其基本結(jié)構(gòu)如圖13所示,互補區(qū)雙鏈的核苷酸互補配對,配對的核苷酸對數(shù)不限?;パa區(qū)末端可為平末端或突出末端。該分叉型接頭的互補區(qū)帶有至少一個酶切識別位點。在本實施例的具體實施方式
中,接頭三優(yōu)選互補區(qū)的3’末端為突出末端,且突出末端最后一個堿基為T的T末端分叉接頭;或者優(yōu)選互補區(qū)的3’末端帶有雙脫氧核苷酸的雙脫氧分叉接頭。本發(fā)明中所述帶莖環(huán)結(jié)構(gòu)的接頭,如圖14所示。該接頭為單鏈核酸分子,該單鏈核酸分子包括第一互補配對區(qū)1、莖環(huán)區(qū)2和第二互補配對區(qū)3 (圖14a),第一互補配對區(qū)1 能夠與第二互補配對區(qū)3互補配對,且它們形成的互補配對區(qū)包括至少一個限制性內(nèi)切酶的酶切識別位點,而通過該酶切識別位點,特定的酶能夠?qū)⑶o環(huán)區(qū)切開或切除,從而將單鏈核酸分子變成雙鏈核酸分子,以便于后續(xù)的操作;同時還至少包括一個用于后續(xù)步驟S3進行酶切的酶切識別位點。如圖14b所示,帶莖環(huán)結(jié)構(gòu)的接頭還可帶有突出末端4,該突出末端可位于單鏈核酸分子的5’端或3’端。突出末端4的存在能夠進一步的防止接頭自連現(xiàn)象的發(fā)生。該突出末端優(yōu)選為T。應(yīng)當(dāng)說明的是,上述實施方案僅是本發(fā)明中關(guān)于選用的酶切識別位點及其相應(yīng)的內(nèi)切酶的一些具體實施例,并不用以限制本發(fā)明的保護范圍,換用符合條件的其他酶切識別位點及相應(yīng)的內(nèi)切酶,同樣可實現(xiàn)本發(fā)明的目的。為得到帶有待測序片段的酶切產(chǎn)物,可以在步驟S3的酶切反應(yīng)之后進行純化回收,而純化回收的方法可以利用現(xiàn)有技術(shù)中的多種方式實現(xiàn)。在本發(fā)明的一個實施例中,原待測核酸片段固定于玻片上,酶切之后直接以緩沖液沖洗即可實現(xiàn)有待測序片段的酶切產(chǎn)物與其他物質(zhì)分離純化;在本發(fā)明的另一個具體實施例中,原待測核酸片段固定于磁珠上, 直接利用磁鐵吸附,以緩沖液輕微沖洗,即可實現(xiàn)帶有待測序片段的酶切產(chǎn)物與其他物質(zhì)分離純化。步驟S4中,在連接接頭二之前,根據(jù)步驟S3中得到的酶切產(chǎn)物的不同以及后續(xù)使用的連接方法,可以選擇性的對酶切產(chǎn)物進行修飾處理,如末端補平;也可以直接利用酶切之后得到的突出末端進行接頭二的連接。在本發(fā)明的一個具體實施例中,根據(jù)步驟S3中利用第一 anchor上所帶內(nèi)切酶的酶切識別位點,以i^ok I進行酶切,得到3’端帶有4個核苷酸序列突出末端的酶切產(chǎn)物。對酶切產(chǎn)物先進行末端補平處理,然后再連接接頭二。此實施方式的優(yōu)勢在于可以避免由于過長的突出末端而使得接頭二合成的種類過多,從而降低接頭二的合成成本。在本發(fā)明的另一個具體實施例中,根據(jù)步驟S3中利用第一 anchor上所帶酶切識別位點為Acu I的酶切識別位點,以Acu I進行酶切,得到3’帶有2個核苷酸序列突出末端的酶切產(chǎn)物。針對該突出末端突出的核苷酸較少,只需合成42種接頭二即可實現(xiàn)連接, 因此直接利用酶切之后得到的突出末端進行接頭二的連接。此實施方式的優(yōu)勢在于可以簡化操作步驟,直接加入接頭二進行反應(yīng)即可。步驟S4中,所述接頭二,是用于與帶有待測序片段的酶切產(chǎn)物連接形成新待測核酸片段的雙鏈核酸分子。根據(jù)酶切產(chǎn)物末端以及選用的連接方式不同,接頭二可以選用相應(yīng)帶有不同末端的接頭,包括但不限于平末端接頭、突出末端接頭、分叉型接頭和帶莖環(huán)結(jié)構(gòu)的接頭。本發(fā)明中優(yōu)選使用突出末端接頭、分叉型接頭和帶莖環(huán)結(jié)構(gòu)的接頭,這些結(jié)構(gòu)的接頭在連接過程中可以避免出現(xiàn)多個接頭之間自連的現(xiàn)象。在本發(fā)明的一個具體實施例中,接頭二選用平末端接頭,用于實現(xiàn)與經(jīng)過末端補平修飾之后的酶切產(chǎn)物進行連接。在本發(fā)明的一個優(yōu)選實施例中,酶切產(chǎn)物帶有突出末端,因此接頭二直接選用如圖11所示的突出末端接頭與酶切產(chǎn)物實現(xiàn)連接,該突出末端接頭的突出末端與酶切產(chǎn)物的突出末端相匹配。在本發(fā)明的一個具體實施例中,步驟S3中的內(nèi)切酶為Acu I,此時,接頭二可具體采用如圖15所示的接頭。在本發(fā)明的另一個優(yōu)選實施例中,接頭二采用如圖13所示的分叉型接頭實現(xiàn)與酶切產(chǎn)物的連接。在本實施例的具體實施方式
中,接頭二優(yōu)選互補區(qū)的3’末端為突出末端, 且突出末端最后一個堿基為T的T末端分叉接頭;或者優(yōu)選互補區(qū)的3’末端帶有雙脫氧核苷酸的雙脫氧分叉接頭。在本發(fā)明的另一個優(yōu)選實施例中,接頭二采用如圖14所示的帶莖環(huán)結(jié)構(gòu)的接頭實現(xiàn)與酶切產(chǎn)物的連接。在本實施例的一個優(yōu)選實施方式中,接頭二采用如圖14b所示的帶莖環(huán)結(jié)構(gòu)的接頭實現(xiàn)接頭二與酶切產(chǎn)物的連接,進一步防止接頭自連現(xiàn)象的發(fā)生。應(yīng)當(dāng)說明的是,上述實施例僅是本發(fā)明對于接頭二選用的具體實施方式
,并不用以限制本發(fā)明的保護范圍。步驟S4中,為了便于后續(xù)第二 anchor與接頭二的互補配對能夠順利進行,可以對酶切產(chǎn)物與接頭二連接之后形成的雙鏈核酸連接產(chǎn)物進行處理,形成單鏈形式的新待測核酸片段。將雙鏈核酸連接產(chǎn)物上互補結(jié)合于待測序片段上的核苷酸以及酶切之后保留下來的核苷酸進行處理形成單鏈新待測核酸片段的方法,包括但不限于通過NaOH變性解離或升溫退火的方式進行清除。所述第二 anchor是能與接頭二錨定結(jié)合的單鏈核酸分子,用于在步驟S5中連接熒光探針;所述第二 anchor可以與第一 anchor相同或者不同。若第二 anchor與第一 anchor相同,則后續(xù)繼續(xù)酶切時可使用相同的內(nèi)切酶進行操作,簡化反應(yīng)試劑的種類,同時還能避免因新待測核酸片段中存在相同的內(nèi)切酶序列,導(dǎo)致后續(xù)的酶切步驟得到非目標產(chǎn)物;若第二 anchor與第一 anchor不同,則可以在第二 anchor的合成中弓|入新的設(shè)計,滿足更多的實際需要。第二 anchor與第一 anchor的不同,可以是酶切識別位點的位置和種類不同,也可以是核苷酸數(shù)量的不同。第二 anchor根據(jù)需要可以進行其他處理。在本發(fā)明的一個具體實施例中,根據(jù)需要將第二 anchor的3’端或5’端進行封閉,用以控制連接方向,并避免第二 anchor相互之間的自連。在本實施例的一個具體實施方式
中,對3’端進行封閉的方法包括但不限于雙脫氧、氨基化反應(yīng)、酰胺化,其無法繼續(xù)連接,控制第二 anchor的連接只發(fā)生在5’端;在本實施例的另一個具體實施方式
中,將第二 anchor的5’端進行封閉,通過5’端進行去磷酸化或酰胺化處理將其封閉,從而只保留3’端作為連接的末端。在本發(fā)明的另一個具體實施例中,第二 anchor帶有特異性殘基,可以使得后續(xù)熒光探針的更換以及洗脫更加簡便。在本發(fā)明的一個優(yōu)選實施方式中,第二 anchor所帶的特異性殘基為dU堿基,其核苷酸序列中引入數(shù)個dU堿基,該結(jié)構(gòu)的第二 anchor可以在后續(xù)測序的洗脫過程中直接切除dU堿基形成不同的短片段,便于洗脫的實現(xiàn)。在本發(fā)明的另一個優(yōu)選實施方式中,第二 anchor所帶的特異性殘基為帶有硫代磷酸酯鍵的堿基,在其核苷酸序列中,以一個或多個硫代磷酸酯鍵(p-幻代替原有的P-O 鍵,可以直接利用帶有Ag、Hg、Cu、Mn、Zn和Cd離子的化合物切割P-S鍵實現(xiàn)第二 anchor 的洗脫。在本發(fā)明的另一個優(yōu)選實施方式中,第二 anchor帶有兩個酶切識別位點,其中一個為用于切割雙鏈的限制性內(nèi)切酶酶切識別位點,另一個為用于切割雙鏈中的一條單鏈形成切口的切口酶酶切識別位點。應(yīng)當(dāng)說明的是,上述實施例僅是本發(fā)明中第二 anchor的一些具體實施方式
,并不用以限制本發(fā)明的保護范圍。步驟S5中,得到第二 anchor延伸末端后N個核苷酸的序列信息通過如圖15所示的方法實現(xiàn),該方法包括以下步驟S51.在第二 anchor延伸末端后連接熒光探針,檢測該熒光探針的熒光信號,得到相應(yīng)位置的核苷酸序列信息;
S52.將熒光探針去除,連接標記位置不同的熒光探針,檢測該熒光探針的熒光信號,得到該標記位置的核苷酸序列信息;S53.重復(fù)步驟S52的操作,直至得到第二 anchor延伸末端后N個核苷酸的序列信肩、ο上述技術(shù)方案利用標記位置不同的熒光探針之間的連接和更換,實現(xiàn)對第二 anchor延伸末端后N個核苷酸的序列信息的獲取。其中,步驟S52中所述熒光探針的去除可以有多種方式實現(xiàn)。在本步驟的一個具體實施方式
中,利用NaOH變性將熒光探針以及第二 anchor從新待測核酸片段上解離下來,然后將第二 anchor重新結(jié)合于接頭二上,進行后續(xù)標記位置不同的熒光探針的連接以及信號檢測操作。此實施方式簡單易行,不需要添加另外的試劑。在本步驟的另一個優(yōu)選實施方式中,第二 anchor帶有數(shù)個dU堿基,因此利用UDG 酶直接進行dU堿基的切除,形成短片段,升溫變性解離,重新得到新待測核酸片段,然后將第二 anchor重新結(jié)合于接頭二上,進行后續(xù)標記位置不同的熒光探針的連接以及信號檢測操作。在本步驟的另一個優(yōu)選實施方式中,第二 anchor的核苷酸序列中,幾個硫代磷酸鍵(P-S)代替原有的P-O鍵,因此直接利用帶有Ag、Hg、Cu、Mn、ai和Cd離子的化合物切割 P-S鍵實現(xiàn)第二 anchor以及熒光探針的去除。在本步驟的另一個優(yōu)選實施方式中,第二 anchor延伸末端處帶有一個切口酶的酶切識別位點,因此直接利用切口酶將熒光探針與第二 anchor之間的連接去除,就可以在第二 anchor的延伸末端繼續(xù)連接標記位置不同的熒光探針,實現(xiàn)后續(xù)測序步驟的實施。此實施方式直接將熒光探針去除,而不需要對第二 anchor進行處理,既簡化操作,又降低試劑成本。上述優(yōu)選實施方式利用特異性的物質(zhì)將第二 anchor中的連接切除,形成短小片段,然后利用溫和條件即可去除熒光探針。其中,上述步驟中所述N為正整數(shù),其數(shù)值范圍同樣由本發(fā)明所使用的連接酶決定,優(yōu)選為1 9,更優(yōu)選為1 6。在本發(fā)明的一個實施方案中,利用T4連接酶實現(xiàn)本發(fā)明所述的酶切延伸測序法,N的數(shù)值優(yōu)選為1 6 ;在本發(fā)明的另一個實施方案中,利用Tth 連接酶實現(xiàn)本發(fā)明所述的酶切延伸測序法,N的數(shù)值范圍可優(yōu)選為1 9。在上述優(yōu)選范圍內(nèi),本發(fā)明的酶切延伸測序法不僅能夠增加測序讀長,測序讀長不受限制,還能進一步提高測序過程中的熒光探針與anchor連接的準確性,進而提高核苷酸序列信息讀取的準確性。 其中,當(dāng)利用T4連接酶,將熒光探針連接在anchor的3,端或者5’端時,熒光探針與anchor 發(fā)生連接的那一端的6個堿基需與相應(yīng)的待測序片段完全互補配對,才能實現(xiàn)連接;當(dāng)利用Tth連接酶,將熒光探針連接在anchor的3’端或5’端時,分別要求熒光探針與anchor 連接的那一端的8個或9個堿基與相應(yīng)的待測序片段完全互補配對,才能實現(xiàn)連接。圖16為步驟S5中一個具體實施例中得到第二 anchor延伸末端后N個核苷酸的序列信息的方法示意圖,該圖直觀的展現(xiàn)了得到第二 anchor延伸末端后N個核苷酸的序列信息的過程步驟51.讀取第二 anchor延伸末端后第1位核苷酸序列信息在T4連接酶的作用下,第二 anchor延伸末端后連接標記位置為第1位的熒光探針,然后采圖,收集熒光信號,根據(jù)得到的熒光信號確定第二 anchor延伸末端后第1位的核苷酸序列信息;步驟52.讀取第二 anchor延伸末端后第2位核苷酸序列信息利用第二 anchor 延伸末端處所帶的切口酶酶切識別位點,將熒光探針與第二 anchor之間的連接切掉,通過升溫變性解離將標記位置為第1位的熒光探針洗脫,然后換用標記位置為第2位的熒光探針連接到第二 anchor的延伸末端,采圖成像,收集熒光信號,根據(jù)得到的熒光信號確定第二 anchor延伸末端后第2位的核苷酸序列信息;步驟53.讀取后續(xù)核苷酸重復(fù)步驟52的操作,換用標記位置不同的熒光探針獲取相應(yīng)位置的核苷酸序列信息,直至得到第二 anchor延伸末端后第6位核苷酸的序列信肩、ο上述實施方案中,利用第anchor延伸末端處帶有的切口酶酶切識別位點,直接實現(xiàn)標記位置不同的熒光探針的連接更換,從而實現(xiàn)獲聚第二 anchor延伸末端后6個核苷酸的序列信息。應(yīng)當(dāng)說明的是,上述實施例僅是實現(xiàn)步驟S5中得到第二 anchor延伸末端后N個核苷酸的序列信息的一些具體實施方案,并不用以限制本發(fā)明的保護范圍。例如改變其中N 的數(shù)值,如在本發(fā)明的另一個具體實施例中,取N = 4,同樣可以實現(xiàn)酶切延伸測序的目的。圖17為本發(fā)明一個實施例中利用酶切延伸增加讀長的測序方法示意圖,該圖直觀的展現(xiàn)了酶切延伸增加讀長的測序過程步驟1.第一 anchor雜交結(jié)合將第一 anchor通過堿基互補配對雜交結(jié)合于原待測核酸片段的接頭一上,其中原待測核酸片段的5’端通過連接固定于磁珠表面;其中,第一 anchor帶有序列為序列5’. . . CTGAAG. . . 3’的酶切識別位點,且第一 anchor的核苷酸序列中帶有dU 。步驟2.獲取第一 anchor延伸末端后6個核苷酸的序列信息T4連接酶作用下, 在第一 anchor的延伸末端連接用于檢測的熒光探針,檢測熒光信號得到相應(yīng)位置的核苷酸序列信息,并利用UDG酶切除dU堿基以實現(xiàn)第一 anchor的重置和標記位置不同的熒光探針的更換檢測,采集相應(yīng)探針的熒光信號圖,獲得第1至6位的核苷酸序列信息。步驟3.酶切為便于后續(xù)酶切的進行,當(dāng)?shù)谝?anchor延伸末端后6個核苷酸的序列信息全部被讀取之后,首先在DNA聚合酶的作用下,將原待測核酸片段延伸形成完整的雙鏈核酸分子;然后利用Acu I酶特異性識別并酶切第一 anchor中所攜帶的酶切識別位點,將之前已經(jīng)讀取過的第一 anchor延伸末端的6個核苷酸序列切除,得到3’端帶有兩個核苷酸突出末端的未測序片段;酶切反應(yīng)之后,利用磁鐵吸附磁珠,將帶有未測序片段的酶切產(chǎn)物純化回收。步驟4.酶切產(chǎn)物連接接頭二并結(jié)合第二 anchor 利用其中一端帶有兩個核苷酸突出末端,一共為42 = 16種的接頭二,在T4連接酶的作用下,與酶切產(chǎn)物進行連接得到雙鏈連接產(chǎn)物;連接反應(yīng)結(jié)束之后,將雙鏈連接產(chǎn)物變性解離形成單鏈,得到固定于磁珠上的新待測核酸片段;將第二 anchor通過堿基互補配對結(jié)合于新待測核酸片段的接頭二上。其中,第二 anchor上同樣帶有序列為序列5’ . . . CTGAAG. . . 3’的酶切識別位點,且距離第二 anchor延伸末端處4個核苷酸位置處還帶有序列為5’ . . . GGATC. . . 3’的酶切識別位點。步驟5.獲取第二 anchor延伸末端后6個核苷酸的序列信息按照如圖15所示實施例的方法,利用切口酶Nt. Alw I切割熒光探針與第二 anchor之間的連接,實現(xiàn)不同標記位置熒光探針的更換,從而可以讀取不同位置的核苷酸序列信息,獲取第二 anchor延伸末端后6個核苷酸的序列信息。步驟6.重復(fù)步驟3、步驟4、步驟5中的操作,獲取一定數(shù)量(其數(shù)值范圍優(yōu)選為 1 6)的核苷酸序列信息之后,通過酶切手段切除已經(jīng)讀取過的核苷酸序列,并構(gòu)建新的待測核酸片段,以此實現(xiàn)延伸測序的目的,直至得到原待測核酸片段上所需的全部核苷酸序列信息。針對上述各技術(shù)方案,為進一步說明本發(fā)明所記載技術(shù)方案的技術(shù)效果及優(yōu)越性,本發(fā)明給出具體的操作實施例本實施例以MTHFR基因的一段核酸片段兩端接上接頭作為原待測核酸片段(SEQ ID NO :5),其中原待測核酸片段5’端的固定接頭通過鏈霉親和生物素的作用與磁珠結(jié)合, 原待測核酸片段3’端帶有接頭一序列。測序過程采用深圳華因康基因科技有限公司生產(chǎn)的Pstar II-Plus測序平臺進行,測序過程采集的熒光信號圖像數(shù)據(jù)采用與該測序平臺配套的Image Process by Base(IPB)數(shù)據(jù)處理軟件進行分析。一、第一 anchor錨定結(jié)合于原待測核酸片段的接頭一上第一 anchor (SEQ ID NO 1)與原待測核酸片段的接頭一之間通過堿基互補配對雜交結(jié)合,其中原待測核酸片段通過鏈霉親和生物素的作用被固定于磁珠上,而磁珠本身被固定于玻片表面,第一 anchor延伸末端上帶有Acu I酶的酶切識別位點,該反應(yīng)過程及體系為28°C,400y L 2XSSPE(saline sodium phosphate EDTA)緩沖液對固定于玻片表面的原待測核酸片段進行潤洗;加入第一anchor (15 μ Μ),2 X SSPE 環(huán)境下升溫至 65°C,維持 30s ;降溫至42 °C,Imin 雜交;以磁鐵吸附磁珠,30°C,900 μ L清洗緩沖液進行清洗,將未反應(yīng)的第一 anchor分
離清除。二、獲取第一 anchor延伸末端后6個核苷酸的序列信息1、連接熒光探針在T4連接酶的作用下,將熒光探針(3μΜ)連接到第一 anchor延伸末端之后,連接反應(yīng)過程及體系為30°C,連接緩沖液對雜交分離的產(chǎn)物進行潤洗;加入0. 2U/yL T4連接酶,熒光探針(3 μ M),連接緩沖液中,30°C,20min反應(yīng);連接反應(yīng)結(jié)束之后,以磁鐵吸附磁珠,30°C,900 μ L清洗緩沖液進行清洗,將未反應(yīng)的熒光探針與連接產(chǎn)物進行分離。2、采集熒光信號,讀取相應(yīng)位置的核苷酸序列信息將連接有熒光探針的連接產(chǎn)物放入測序儀,在熒光顯微鏡下進行激發(fā),采集熒光信號,根據(jù)熒光信號判斷讀取該位置的核苷酸序列。3、洗脫第一 anchor及熒光探針在讀取上一步驟中相應(yīng)位置的核苷酸序列信息后,可以利用不同的方法進行洗脫。在本實施例中,利用NaOH直接變性解離,反應(yīng)過程及體系為
測序反應(yīng)體系中加入NaOH(0. 05M),變性Imin ;以磁鐵吸附磁珠,30°C,900 μ L洗脫緩沖液進行清洗,將變性解離的第一 anchor 及熒光探針以及NaOH進行清洗分離。在本發(fā)明的另一個實施例中,利用UDG酶對第一 anchor中的dU堿基進行切割形成小片段,然后將小片段直接洗脫,反應(yīng)過程及體系為酶切緩沖液,20 μ L ;UDG酶,10 μ L ;洗脫緩沖液加至200 μ L ;37°C,5min 進行酶切;酶切結(jié)束后,以磁鐵吸附磁珠,加入900 μ L洗脫緩沖液進行洗脫分離,得到未接第一 anchor的原待測核酸片段。4、重復(fù)上述步驟,通過更換不同標記位置的熒光探針進行連接,從而讀取得到第一 anchor延伸末端后第1至6位的核苷酸序列信息。三、Acu I酶切,得到帶有未測序片段的酶切產(chǎn)物1、延伸形成雙鏈核酸分子為便于后續(xù)酶切的進行,當(dāng)?shù)谝?anchor延伸末端后5位核苷酸序列信息全部被讀取之后,利用之前所述的NaOH變性解離方法除去熒光探針及第一 anchor,并重新結(jié)合第一 anchor于接頭一上,然后在DNA聚合酶的作用下,將原待測核酸片段延伸形成完整雙鏈核酸分子,延伸反應(yīng)體系及過程為30°C條件下,以Klenow酶反應(yīng)緩沖液潤洗第一 anchor與原待測核酸片段的結(jié)合物;加入0. 1 U/μ L 的 Klenow 酶,IXKlenow 酶反應(yīng)緩沖液中,37°C,孵育 IOmin ;延伸反應(yīng)結(jié)束后,以磁鐵吸附磁珠,300C,900 μ L清洗緩沖液進行清洗,將原待測核酸片段延伸形成的完整雙鏈核酸分子進行分離。2、AcuI 酶切得到雙鏈核酸分子后,以Acu I進行酶切,得到帶有待測序片段的酶切產(chǎn)物,酶切的反應(yīng)體系及過程為300C,雙鏈核酸分子中加入 400 μ L IXNEBuffer 2,40 μ M SAM ;加入0. 05U/yL 的 Acu I 酶,37°C 孵育 2h;酶切反應(yīng)結(jié)束后,以磁鐵吸附磁珠,30°C,900 μ L清洗緩沖液進行清洗,分離得到帶有待測序片段的酶切產(chǎn)物,其中帶有待測序片段的核苷酸鏈3’端帶有兩個核苷酸的突出末端。四、酶切產(chǎn)物連接接頭二,并結(jié)合第二 anchor1、酶切產(chǎn)物連接接頭二利用酶切產(chǎn)物所帶的突出末端,以如圖18所示結(jié)構(gòu)的接頭二(SEQ ID NO :2和SEQ ID NO 3)進行連接,其中突出末端的-X堿基為A或G或C或T,接頭二是以種類一共為42 =16種接頭混合的形式加入連接反應(yīng)中,連接反應(yīng)的體系和過程為30°C條件下,在回收的酶切產(chǎn)物中加入IX連接緩沖液;加入濃度為10μΜ的16種接頭混合的接頭二,以及0. 2U/yL的Τ4連接酶,16°C 條件下孵育Ih ;連接反應(yīng)結(jié)束后,以磁鐵吸附磁珠,30°C,900 μ L清洗緩沖液進行清洗,分離得到雙鏈核酸分子形式的新待測核酸片段。2、第二 anchor 的結(jié)合以NaOH變性解離的方法,將雙鏈核酸分子形式的新待測核酸片段轉(zhuǎn)變成帶有未測序片段的單鏈新待測核酸片段。第二 anchor (SEQ ID NO 4)與接頭二的雜交結(jié)合體系及過程為^°C,在單鏈新待測核酸片段中加入400 μ L 2 X SSPE,加入第二 anchor (10 μ Μ), 60°C維持30s ;然后降溫至42°C,雜交孵育anin ;雜交結(jié)束之后,以磁鐵吸附磁珠,30°C,900 μ L清洗緩沖液進行清洗,將未反應(yīng)的第二 anchor分離清除。五、獲取第二 anchor延伸末端后6個核苷酸的序列信息1、連接熒光探針在T4連接酶的作用下,將熒光探針(2. 5 μ Μ)連接到第二 anchor延伸末端之后, 連接反應(yīng)過程及體系為30°C,新待測核酸片段中加入連接緩沖液;加入0. 2U/yL T4連接酶,熒光探針(2. 5 μ M),連接緩沖液中,30°C,20min反應(yīng);連接反應(yīng)結(jié)束之后,以磁鐵吸附磁珠,30°C,900 μ L清洗緩沖液進行清洗,將未反應(yīng)的熒光探針與連接產(chǎn)物進行分離。2、采集熒光信號,讀取相應(yīng)位置的核苷酸序列信息將連接有熒光探針的連接產(chǎn)物放入測序儀,在熒光顯微鏡下進行激發(fā),采集熒光信號,根據(jù)熒光信號判斷讀取該位置的核苷酸序列。3、洗脫第二 anchor及熒光探針在讀取上一步驟中相應(yīng)位置的核苷酸序列信息后,利用UDG酶對第二 anchor中的 dU堿基進行切割形成小片段,然后將小片段直接洗脫,反應(yīng)過程及體系為UDG酶酶切緩沖液,20 μ L ;UDG酶,10 μ L ;洗脫緩沖液加至200 μ L ;37°C,5min 進行酶切;酶切結(jié)束后,以磁鐵吸附磁珠,加入900 μ L洗脫緩沖液進行洗脫分離,得到未接第二 anchor的新待測核酸片段。4、重復(fù)上述步驟,通過更換不同標記位置的熒光探針進行連接,從而讀取得到第二 anchor延伸末端后第1至6位的核苷酸序列信息。六、獲取后續(xù)核苷酸序列信息重復(fù)步驟三至步驟五的操作,通過酶切手段切除已經(jīng)讀取過的核苷酸序列,并構(gòu)建新的待測核酸片段,以此實現(xiàn)延伸測序的目的,直至得到原待測核酸片段上所能讀取的全部核苷酸序列信息。對于測序所得的熒光信號圖像數(shù)據(jù),利用IPB處理軟件以生物信息學(xué)方法進行分析,得到的分析結(jié)果顯示前100個base讀取準確率為99. 99% (Q30),100 200個kise 的讀取準確率為99. 85% (Q20),200 300個kise的讀取準確率為99% (Q20),該300個 base的讀取準確率平均值為99. 82% (Q20) 0因此,根據(jù)上述數(shù)據(jù),在該實施例中本發(fā)明所記載的技術(shù)方案進行連接測序達到的高質(zhì)量讀長為300bp。以本發(fā)明所記載的技術(shù)方案進行連接測序,理論上應(yīng)當(dāng)可以將待測核酸片段所有的核苷酸序列信息讀取出來。但通過所述實施例中得到的數(shù)據(jù),其高質(zhì)量的讀長僅為 300bp,其原因可能是由于在不斷循環(huán)的酶切與連接操作中,內(nèi)切酶的酶切能力以及連接酶的連接能力有所下降而導(dǎo)致。因此,若對于內(nèi)切酶的酶切能力以及連接酶的連接能力進行加強,利用本發(fā)明所記載的技術(shù)方案進行連接測序的話,可以達到更長的讀長。應(yīng)當(dāng)說明的是,本發(fā)明利用酶切延伸增加讀長的測序方法典型的應(yīng)用但不限于核苷酸測序中,任何其他類似的應(yīng)用均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
1.一種利用酶切延伸增加讀長的測序方法,其特征在于,所述方法包括以下步驟A.將第一anchor結(jié)合于原待測核酸片段的接頭一上;B.在第一anchor延伸末端連接熒光探針,檢測其熒光信號,更換熒光探針并重復(fù)連接和檢測操作,得到第一 anchor延伸末端后M個核苷酸的序列信息;C.利用內(nèi)切酶將步驟B中已得到序列信息的核苷酸部分或完全切除,得到帶有待測序片段的酶切產(chǎn)物;D.酶切產(chǎn)物連接接頭二得新待測核酸片段,結(jié)合第二anchor于接頭二上;E.在第二anchor延伸末端連接熒光探針,檢測其熒光信號,更換熒光探針并重復(fù)連接和檢測操作,得到第二 anchr延伸末端后N個核苷酸的序列信息;F.重復(fù)步驟C至E的操作,得到原待測核酸片段中所需的核苷酸序列信息;其中,M、N均為正整數(shù)。
2.根據(jù)權(quán)利要求1所述的利用酶切延伸增加讀長的測序方法,其特征在于,步驟A中所述第一 anchor帶有至少一個酶切識別位點。
3.根據(jù)權(quán)利要求2所述的利用酶切延伸增加讀長的測序方法,其特征在于,所述步驟C 包括以下步驟Cl.將熒光探針與第一 anchor洗脫,重置第一 anchor并進行鏈延伸,與原待測核酸片段形成雙鏈核酸分子;C2.內(nèi)切酶通過識別第一 anchor上所帶的酶切識別位點進行酶切,將步驟B中已得到序列信息的核苷酸部分或完全切除,得帶有待測序片段的酶切產(chǎn)物。
4.根據(jù)權(quán)利要求1所述的利用酶切延伸增加讀長的測序方法,其特征在于,步驟C包括以下步驟Cl’ .在第一 anchor的另一端連接雙鏈的接頭三,該接頭三帶有至少一個酶切識別位占.C2’.利用內(nèi)切酶識別接頭三所帶的酶切識別位點,將步驟B中已得到序列信息的核苷酸部分或完全切除,得到帶有待測序片段的酶切產(chǎn)物。
5.根據(jù)權(quán)利要求4所述的利用酶切延伸增加讀長的測序方法,其特征在于,步驟Cl,中所述接頭三為平末端接頭、突出末端接頭、分叉型接頭或帶莖環(huán)結(jié)構(gòu)的接頭。
6.根據(jù)權(quán)利要求1所述的利用酶切延伸增加讀長的測序方法,所述步驟A中第一 anchor的一端是封閉的。
7.根據(jù)權(quán)利要求6所述的利用酶切延伸增加讀長的測序方法,其特征在于,在步驟C前還包括步驟CO.對第一 anchor的另一端進行活化,使其能夠用于連接和延伸。
8.根據(jù)權(quán)利要求1至7中任一項所述的利用酶切延伸增加讀長的測序方法,其特征在于,所述第一 anchor帶有至少一個特異性殘基。
9.根據(jù)權(quán)利要求8所述的利用酶切延伸增加讀長的測序方法,其特征在于,所述步驟B 包括以下步驟Bi.在帶有特異性殘基的第一 anchor延伸末端連接熒光探針,檢測其熒光信號,得到對應(yīng)位置的核苷酸序列信息;B2.以特異性切割劑切割特異性殘基,將熒光探針及第一 anchor洗脫,重置第一anchor ;B3.在第一 anchor延伸末端重復(fù)熒光探針的連接和檢測操作,得到第一 anchor延伸末端后M個核苷酸的序列信息。
10.根據(jù)權(quán)利要求1所述的利用酶切延伸增加讀長的測序方法,其特征在于,步驟D中所述接頭二為平末端接頭、突出末端接頭、分叉型接頭或帶莖環(huán)結(jié)構(gòu)的接頭。
11.根據(jù)權(quán)利要求1所述的利用酶切延伸增加讀長的測序方法,其特征在于,所述第一 anchor禾口第二 anchor相同或不同。
12.根據(jù)權(quán)利要求11所述的利用酶切延伸增加讀長的測序方法,其特征在于,所述第二 anchor帶有至少一個酶切識別位點。
13.根據(jù)權(quán)利要求11所述的利用酶切延伸增加讀長的測序方法,其特征在于,所述第二 anchor帶有至少一個特異性殘基。
14.根據(jù)權(quán)利要求1至7、10至13中任一項權(quán)利要求所述的利用酶切延伸增加讀長的測序方法,其特征在于,步驟A中所述原待測核酸片段固定于固相載體表面。
全文摘要
本發(fā)明涉及基因工程領(lǐng)域,提供了一種利用酶切延伸增加讀長的測序方法。本發(fā)明所述利用酶切延伸增加讀長的測序方法,首先將第一anchor結(jié)合于原待測核酸片段的接頭一上,使用連接測序法讀取第一anchor延伸末端后的M個核苷酸的序列信息;然后利用內(nèi)切酶識別相應(yīng)的酶切識別位點將已讀取序列信息的核苷酸部分或完全切除,在酶切回收的待測序片段上連接新的接頭二,然后在接頭二上錨定結(jié)合第二anchor,并在第二anchor延伸末端連接熒光探針,向前延伸讀取核苷酸序列信息;通過重復(fù)上述操作,得到原待測核酸片段所需的核苷酸序列信息,從而利用酶切延伸進行測序的方法實現(xiàn)延長測序的讀長且使讀長不受限制的目的。
文檔編號C12Q1/68GK102559918SQ201210047900
公開日2012年7月11日 申請日期2012年2月28日 優(yōu)先權(quán)日2012年2月28日
發(fā)明者盛司潼 申請人:盛司潼