專利名稱:一種檢測嗜酒基因的方法及試劑盒的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及基因工程領(lǐng)域,更具體地說,涉及一種檢測嗜酒基因的方法及試劑盒。
背景技術(shù):
飲酒會導(dǎo)致多種疾病,最常見的為酒精性肝病(alcoholic liver disease,ALD) 0 據(jù)統(tǒng)計,全世界約有1500萬-2000萬人酗酒,其中約10% -20% (150萬 400萬)有不同程度的酒精性肝病。在我國,隨著人民生活水平的不斷提高,經(jīng)濟(jì)條件的改善,近年來ALD 的發(fā)病率也呈逐年上升趨勢,酒精己成為繼病毒之后導(dǎo)致肝損傷的第二大原因。飲酒的健康危害主要由酒精(乙醇)及其中間代謝產(chǎn)物乙醛引起,兩者在體內(nèi)的有效劑量水平和作用時間長短除與酒精攝入量,飲酒頻率相關(guān)外,還與體內(nèi)的代謝酶活性相關(guān)。因此檢測與酒精代謝酶相關(guān)基因的序列信息,再結(jié)合其他的人體狀況檢測以及臨床觀察和實驗技術(shù),可以對人體酒精代謝能力做出預(yù)判,從而提醒ALD易患人群改善生活習(xí)慣,達(dá)到預(yù)防的目的。嗜酒基因是指初步研究可能與人體酒精代謝能力有關(guān)的基因。目前,檢測嗜酒基因的方法最常見的是利用PCR產(chǎn)物直接進(jìn)行測序的Sanger測序法,該方法能對嗜酒基因進(jìn)行區(qū)域檢測,但Sanger測序法每次只能對一個樣品的某一段區(qū)域進(jìn)行測序,因此檢測效率低、成本高;而且由于Sanger測序原理的限制,在檢測帶有雜合子的樣品信號時會出現(xiàn)雙峰乃至多峰,使得該樣品無法被準(zhǔn)確識別出來,導(dǎo)致檢測靈敏度低(20%)。而目前市面上基于該方法形成的檢測試劑盒,存在同樣的缺陷。因此需要一種檢測嗜酒基因的新方法和新試劑盒,能夠提高檢測效率,降低檢測成本;同時還能提高檢測的準(zhǔn)確性和靈敏度。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種檢測嗜酒基因的方法及相應(yīng)的試劑盒,能對嗜酒基因的多個目標(biāo)區(qū)域同時進(jìn)行檢測,提高檢測效率,降低成本,還能提高檢測的準(zhǔn)確性和靈敏度。為了實現(xiàn)發(fā)明目的,一種檢測嗜酒基因的方法,包括以下步驟A.利用嗜酒基因特異性引物,對待測樣品中的多個目標(biāo)區(qū)域進(jìn)行擴(kuò)增得擴(kuò)增產(chǎn)物,并基于擴(kuò)增產(chǎn)物構(gòu)建測序文庫;B.對測序文庫進(jìn)行單分子擴(kuò)增,得到與所述多個目標(biāo)區(qū)域?qū)?yīng)的多個單分子擴(kuò)增產(chǎn)物;C.同時對所述多個單分子擴(kuò)增產(chǎn)物進(jìn)行高通量基因測序,得到所述多個目標(biāo)區(qū)域的序列信息。其中,所述步驟A包括Al.利用嗜酒基因特異性引物,對待測樣品中的多個目標(biāo)區(qū)域進(jìn)行擴(kuò)增,得到與所述多個目標(biāo)區(qū)域?qū)?yīng)的擴(kuò)增產(chǎn)物;A2.利用接頭元件,與所述多個目標(biāo)區(qū)域?qū)?yīng)的擴(kuò)增產(chǎn)物進(jìn)行連接,得到測序文
4庫;所述接頭元件采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。其中,步驟A2包括以下步驟A21.對與所述多個目標(biāo)區(qū)域?qū)?yīng)的擴(kuò)增產(chǎn)物進(jìn)行片段化,得片段化產(chǎn)物;A22.利用接頭元件,與片段化產(chǎn)物進(jìn)行連接,構(gòu)建測序文庫。其中,所述步驟A22包括以下步驟A221.利用第一接頭與片段化產(chǎn)物的兩端連接,得第一連接產(chǎn)物;A222.環(huán)化第一連接產(chǎn)物,得環(huán)化產(chǎn)物;A223. II s型限制性內(nèi)切酶酶切環(huán)化產(chǎn)物,得酶切產(chǎn)物;A224.在酶切產(chǎn)物兩端接上第二接頭和第三接頭,得測序文庫。其中,所述步驟A22包括以下步驟Α22Γ .利用第四接頭與片段化產(chǎn)物連接,得第二連接產(chǎn)物;A222’ . II s型限制性內(nèi)切酶酶切第二連接產(chǎn)物,得帶有第四接頭的酶切片段;A223’ .帶有第四接頭的酶切片段與第五接頭連接,形成測序文庫。其中,步驟A2所述接頭元件中的至少一個接頭包含有第一標(biāo)簽序列,用于在文庫構(gòu)建過程中,對不同待測樣品的測序文庫做上相應(yīng)的標(biāo)記。所述第一標(biāo)簽序列,優(yōu)選為帶有特定序列的核酸分子,其堿基數(shù)不限。進(jìn)一步的,所述第一標(biāo)簽序列堿基數(shù)優(yōu)選為3 20,更優(yōu)選為4 10。其中,步驟A所述的嗜酒基因特異性引物與目標(biāo)區(qū)域完全互補(bǔ)或部分互補(bǔ)。進(jìn)一步的,與每個目標(biāo)區(qū)域?qū)?yīng)的特異性引物中,至少有一條引物與目標(biāo)區(qū)域部分互補(bǔ),且該引物的5’端帶有第二標(biāo)簽序列,用于在擴(kuò)增目標(biāo)區(qū)域過程中,對不同待測樣品的目標(biāo)區(qū)域擴(kuò)增產(chǎn)物做上相應(yīng)的標(biāo)記。所述第二標(biāo)簽序列,優(yōu)選為帶有特定序列的核酸分子,其堿基數(shù)不限。進(jìn)一步的,所述第二標(biāo)簽序列堿基數(shù)不限,優(yōu)選為3 20,更優(yōu)選為4 10。其中,所述嗜酒基因包括ADH2、ADH3、ALDH2和CYP2E1中的至少一個。進(jìn)一步的,所述ADH2的特異性引物為SEQ ID NO 1和SEQ ID NO :2、SEQ ID NO 3和SEQ ID NO :4、SEQ ID NO 5和SEQ ID NO 6中的至少一對;所述ADH3的特異性引物為 SEQ ID NO :7 禾口 SEQ ID NO :8、SEQ ID NO 9 禾口 SEQ ID NO 10,SEQ ID N0:11和 SEQ ID NO 12中的至少一對;所述ALDH2的特異性引物為SEQ ID N0:13禾口 SEQ ID NO 14、SEQ ID NO 15 和 SEQ ID NO :16、SEQ ID NO :17 和 SEQ ID NO :18、SEQ ID NO :19 和 SEQ ID NO 20 中的至少一對;所述CYP2E1的特異性引物為SEQ ID NO 21和SEQ ID NO :22、SEQ ID NO 23 和 SEQ ID NO :24、SEQ ID NO 25 和 SEQ ID NO :26、SEQ ID NO 27 和 SEQ ID NO 28 中的至少一對。一種能夠用于本發(fā)明的任一種檢測嗜酒基因方法的試劑盒,包括嗜酒基因特異性引物,用于對待測樣品中的多個目標(biāo)區(qū)域進(jìn)行擴(kuò)增,得到擴(kuò)增產(chǎn)物;接頭元件,用于與擴(kuò)增產(chǎn)物結(jié)合構(gòu)建測序文庫。其中,所述接頭元件采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。
其中,所述接頭元件中的至少一個接頭包含有第一標(biāo)簽序列,用于在文庫構(gòu)建過程中,對不同待測樣品的測序文庫做上相應(yīng)的標(biāo)記。所述第一標(biāo)簽序列,優(yōu)選為帶有特定堿基序列的核酸分子,其堿基數(shù)不限。進(jìn)一步的,所述第一標(biāo)簽序列堿基數(shù)優(yōu)選為3 20,更優(yōu)選為4 10。其中,所述的待測嗜酒基因有多個,與每個目標(biāo)區(qū)域?qū)?yīng)的特異性引物中,至少有一條引物與目標(biāo)區(qū)域部分互補(bǔ),且該引物的5’端帶有第二標(biāo)簽序列,用于在擴(kuò)增目標(biāo)區(qū)域過程中,對不同待測樣品的目標(biāo)區(qū)域擴(kuò)增產(chǎn)物做上相應(yīng)的標(biāo)記。所述第二標(biāo)簽序列優(yōu)選為帶有特定堿基序列的核酸分子,其堿基數(shù)不限,優(yōu)選的, 第二標(biāo)簽序列的堿基數(shù)為3 20,更優(yōu)選為4 10。其中,所述嗜酒基因包括ADH2、ADH3、ALDH2和CYP2E1中的至少一個。進(jìn)一步的,所述ADH2的特異性引物為SEQ ID NO 1和SEQ ID NO :2、SEQ ID NO 3和SEQ ID NO :4、SEQ ID NO 5和SEQ ID NO 6中的至少一對;所述ADH3的特異性引物為 SEQ ID NO :7 禾口 SEQ ID NO :8、SEQ ID NO 9 禾口 SEQ ID NO 10,SEQ ID N0:11和 SEQ ID NO 12中的至少一對;所述ALDH2的特異性引物為SEQ ID N0:13禾口 SEQ ID NO 14、SEQ ID NO 15 和 SEQ ID NO :16、SEQ ID NO :17 和 SEQ ID NO :18、SEQ ID NO :19 和 SEQ ID NO 20 中的至少一對;所述CYP2E1的特異性引物為SEQ ID NO 21和SEQ ID NO 22, SEQ ID NO 23 和 SEQ ID NO :24、SEQ ID NO 25 和 SEQ ID NO :26、SEQ ID NO 27 和 SEQ ID NO 28 中的至少一對。由上可知,本發(fā)明提供的嗜酒基因檢測方法及其試劑盒,能對嗜酒基因的多個區(qū)域同時進(jìn)行檢測,因此提高了檢測效率,降低了檢測成本;另外該方法也能突破傳統(tǒng)檢測方法的限制,能夠識別出帶有雜合子的樣品,因此提高了檢測的準(zhǔn)確性與靈敏度。
圖1是本發(fā)明一個實施例中檢測嗜酒基因的方法流程圖;圖2是本發(fā)明一個實施例中的單突出末端接頭的結(jié)構(gòu)示意圖;圖3是本發(fā)明一個實施例中的雙突出末端接頭的結(jié)構(gòu)示意圖;圖4是本發(fā)明一個實施例中的帶莖環(huán)結(jié)構(gòu)的接頭的結(jié)構(gòu)示意圖;圖5是本發(fā)明一個實施例中的分叉接頭的結(jié)構(gòu)示意圖;圖6是本發(fā)明一個實施例中的T末端分叉接頭的結(jié)構(gòu)示意圖;圖7是本發(fā)明另一個實施例中的分叉接頭的結(jié)構(gòu)示意圖;圖8是本發(fā)明一個實施例中的雙脫氧分叉接頭的結(jié)構(gòu)示意圖;圖9是本發(fā)明一個實施例中利用片段化產(chǎn)物和接頭元件構(gòu)建測序文庫的方法流程圖;圖10是本發(fā)明另一個實施例中利用片段化產(chǎn)物和接頭元件構(gòu)建測序文庫的方法流程圖;圖11是本發(fā)明另一個實施例中利用片段化產(chǎn)物和接頭元件構(gòu)建測序文庫的方法流程圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。本發(fā)明所述的目標(biāo)區(qū)域,為嗜酒基因上的任意序列,可根據(jù)需要進(jìn)行選擇,包括但不限于嗜酒基因的內(nèi)部序列、嗜酒基因的外部調(diào)控序列,所述嗜酒基因的內(nèi)部序列,包括但不限于嗜酒基因的內(nèi)含子區(qū)域、外顯子區(qū)域、同時含有內(nèi)含子與外顯子的區(qū)域。圖1示出了本發(fā)明的一種檢測嗜酒基因的方法流程,該方法包括以下步驟Si.利用嗜酒基因特異性引物,對待測樣品中的多個目標(biāo)區(qū)域進(jìn)行擴(kuò)增得擴(kuò)增產(chǎn)物,并基于擴(kuò)增產(chǎn)物構(gòu)建測序文庫;S2.對測序文庫進(jìn)行單分子擴(kuò)增,得到與所述多個目標(biāo)區(qū)域?qū)?yīng)的多個單分子擴(kuò)增產(chǎn)物;S3.同時對所述多個單分子擴(kuò)增產(chǎn)物進(jìn)行高通量基因測序,得到所述多個目標(biāo)區(qū)域的序列信息。本方法利用高通量基因測序技術(shù)對嗜酒基因的多個區(qū)域同時進(jìn)行區(qū)域測序,能夠提高檢測效率,降低檢測成本;同時利用高通量基因測序技術(shù)突破傳統(tǒng)檢測技術(shù)的限制,提高檢測的準(zhǔn)確性和靈敏度。通過本方法檢測得到的嗜酒基因序列信息,再結(jié)合其他的人體狀況檢測以及臨床觀察和實驗技術(shù),可以對人體酒精代謝能力做出預(yù)判,從而提醒ALD易患人群改善生活習(xí)慣,達(dá)到預(yù)防的目的。需要說明的是步驟Sl中所述待測樣品為能提取核酸的任意形式的樣品,包括但不限于全血、 血清、血漿和組織樣品;所述組織樣品包括但不限于石蠟包埋組織、新鮮組織和冰凍切片。步驟Sl中所述的多個目標(biāo)區(qū)域,它們可來源于同一個嗜酒基因,也可來源于不同的嗜酒基因。步驟Sl所得測序文庫中,存在多種測序文庫分子,對測序文庫進(jìn)行單分子擴(kuò)增, 即是指,將測序文庫中的多種文庫分子,以極微量(甚至單分子)的形式在空間上隔離(但這些文庫分子整體上還是屬于同一個反應(yīng)體系),并且在各自的空間內(nèi)實現(xiàn)擴(kuò)增?,F(xiàn)有技術(shù)中,Sanger測序技術(shù)每次只能對一個樣品的某一段區(qū)域進(jìn)行測序,要實現(xiàn)對多個目標(biāo)區(qū)域的測序,只能是通過多次反應(yīng)來實現(xiàn)。而在本發(fā)明中,測序文庫中的各個分子經(jīng)過單分子擴(kuò)增后,每個測序文庫分子均形成單分子拷貝陣列,各單分子拷貝陣列在進(jìn)行高通量基因測序時處于不同的位置,使得測序引物與單分子拷貝陣列之間的雜交,以及在酶作用下的延伸反應(yīng)可同時進(jìn)行,相互之間互不干擾。因此,可以同時對大量的(成百萬上千萬,甚至更多的)單分子拷貝陣列同時進(jìn)行測序反應(yīng),然后通過采集相應(yīng)的信號, 進(jìn)而獲得所需的序列信息,且測序的靈敏度較Sanger更高。其中,步驟Sl所述的特異性引物與目標(biāo)區(qū)域完全互補(bǔ)或部分互補(bǔ)。進(jìn)一步的,與每個目標(biāo)區(qū)域?qū)?yīng)的引物中,至少有一條引物與目標(biāo)區(qū)域部分互補(bǔ), 且該引物的5’端帶有第二標(biāo)簽序列。該第二標(biāo)簽序列,用于在擴(kuò)增目標(biāo)區(qū)域過程中,對不同待測樣品的目標(biāo)區(qū)域擴(kuò)增產(chǎn)物做上相應(yīng)的標(biāo)記。該第二標(biāo)簽序列,優(yōu)選為帶有特定序列的核酸分子,其堿基數(shù)不限。該第二標(biāo)簽序列的堿基數(shù)優(yōu)選為3 20,更優(yōu)選為4 10。此外,所述特異性引物還可帶有其它標(biāo)記物,包括但不限于生物素標(biāo)記、多聚組氨酸標(biāo)記、抗原、抗體,從而使得目標(biāo)區(qū)域擴(kuò)增產(chǎn)物的純化極為方便。另外,同一待測樣品的不同目標(biāo)區(qū)域的擴(kuò)增可同時進(jìn)行或分別獨立進(jìn)行或部分同時進(jìn)行。在具體的實驗過程中,可根據(jù)需要選用上述任一種方案進(jìn)行。如果分別對各目標(biāo)區(qū)域進(jìn)行分別擴(kuò)增的話,能夠通過測定擴(kuò)增產(chǎn)物的量來確保步驟Sl中用于構(gòu)建目標(biāo)區(qū)域測序文庫的目標(biāo)區(qū)域擴(kuò)增產(chǎn)物的分子數(shù)保持一致,不會因為擴(kuò)增步驟而導(dǎo)致同一待測樣品的不同目標(biāo)區(qū)域拷貝數(shù)不同,進(jìn)而影響后續(xù)的測序反應(yīng)結(jié)果。當(dāng)然,當(dāng)各目標(biāo)區(qū)域的大小相近,GC含量也相近的時候,通過合理的設(shè)計引物,利用多重PCR技術(shù),步驟Sl可對多個目標(biāo)區(qū)域進(jìn)行同時擴(kuò)增,且保證各目標(biāo)區(qū)域之間的擴(kuò)增效率保持基本一致,這樣就能夠有效的提高實驗效率,降低反應(yīng)的成本。當(dāng)待測樣品有多個時,不同樣品的目標(biāo)區(qū)域的擴(kuò)增必須分別進(jìn)行。其中,步驟Sl所述的嗜酒基因包括ADH2、ADH3、ALDH2和CYP2E1中的至少一個。進(jìn)一步的,所述ADH2的特異性引物為SEQ ID NO 1和SEQ ID NO :2、SEQ ID NO 3和SEQ ID NO :4、SEQ ID NO 5和SEQ ID NO 6中的至少一對;所述ADH3的特異性引物為 SEQ ID NO :7 禾口 SEQ ID NO :8、SEQ ID NO 9 禾口 SEQ ID NO 10,SEQ ID N0:11和 SEQ ID NO 12中的至少一對;所述ALDH2的特異性引物為SEQ ID N0:13禾口 SEQ ID NO 14、SEQ ID NO 15 和 SEQ ID NO :16、SEQ ID NO :17 和 SEQ ID NO :18、SEQ ID NO :19 和 SEQ ID NO 20 中的至少一對;所述CYP2E1的特異性引物為SEQ ID NO 21和SEQ ID NO :22、SEQ ID NO 23 和 SEQ ID NO :24、SEQ ID NO 25 和 SEQ ID NO :26、SEQ ID NO 27 和 SEQ ID NO 28 中的至少一對。在一個實施例中,步驟Sl的具體實現(xiàn)過程是Sll.利用嗜酒基因特異性引物,對待測樣品中的多個目標(biāo)區(qū)域進(jìn)行擴(kuò)增,得到與所述多個目標(biāo)區(qū)域?qū)?yīng)的擴(kuò)增產(chǎn)物;S12.利用接頭元件,與所述多個目標(biāo)區(qū)域?qū)?yīng)的擴(kuò)增產(chǎn)物進(jìn)行連接,得到測序文庫;所述接頭元件采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。需要說明的是步驟Sll中,對同一待測樣品中的多個目標(biāo)區(qū)域的擴(kuò)增,可同時進(jìn)行或分別獨立進(jìn)行或部分同時進(jìn)行??筛鶕?jù)實際情況,如擴(kuò)增所用的嗜酒基因特異性引物的退火溫度, 擴(kuò)增的目標(biāo)區(qū)域的大小、GC含量,擴(kuò)增的目標(biāo)區(qū)域的數(shù)量等,進(jìn)行相應(yīng)的調(diào)整。不同待測樣品的目標(biāo)區(qū)域的擴(kuò)增必須分別進(jìn)行。步驟S12中,所述接頭元件與擴(kuò)增產(chǎn)物的連接方式,可以采用多種方式實現(xiàn),包括接頭元件與擴(kuò)增產(chǎn)物直接連接,或?qū)U(kuò)增產(chǎn)物進(jìn)行處理之后再進(jìn)行連接。步驟S12所述接頭元件,用于構(gòu)建測序文庫,可包括一種或多種接頭。其中,步驟S12所述接頭元件中的至少一個接頭包含有第一標(biāo)簽序列,該第一標(biāo)簽序列,用于在文庫構(gòu)建過程中,對不同待測樣品的測序文庫做上相應(yīng)的標(biāo)記。這樣,在分別獲得目標(biāo)區(qū)域測序文庫后,不同的待測樣品的目標(biāo)區(qū)域測序文庫可以混合在同一個反應(yīng)體系中,進(jìn)行單分子擴(kuò)增反應(yīng),進(jìn)而同時進(jìn)行高通量基因測序。提高測序反應(yīng)的效率,降低了樣品檢測的成本。該第一標(biāo)簽序列優(yōu)選為帶有特定序列的核酸分子,其堿基數(shù)不限。進(jìn)一步的,所述第一標(biāo)簽序列的堿基數(shù)優(yōu)選為3 20,這樣,每次至少能夠?qū)?3個樣品進(jìn)行同時檢測。在綜合考慮各種情況后,如標(biāo)簽的特異性、接頭的成本、接頭的長度等,第一標(biāo)簽序列的堿基數(shù)更優(yōu)選為4 10。通過第二標(biāo)簽和第一標(biāo)簽的結(jié)合,本發(fā)明的發(fā)明每次能夠檢測至少43X43個樣品,即4096個樣品。接頭的修飾方式有多種,包括但不限于被生物素化或甲基化,或同時被生物素化和甲基化。在一個實施例中,該接頭被生物素化,并與未生物素化的片段化產(chǎn)物連接,生物素的存在有利于構(gòu)建的測序文庫的分離純化。在另一個實施例中,該接頭被甲基化,并與未甲基化的片段化產(chǎn)物連接,然后用僅切割甲基化DNA的限制性內(nèi)切酶消化成功連接的連接產(chǎn)物,從而確保酶切產(chǎn)物的單一性。接頭的結(jié)構(gòu)形式也有多種,包括但不限于平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭。構(gòu)建測序文庫過程中可以使用一種或多種接頭。其中,突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭均能夠有效防止在連接過程中,多個接頭自連現(xiàn)象的發(fā)生。針對接頭的上述結(jié)構(gòu)形式,以下將提供多個實施例。在第一實施例中,接頭元件采用平末端接頭,該接頭是雙鏈完全互補(bǔ)的核酸分子。在第二實施例中,接頭元件采用突出末端接頭,該接頭是雙鏈核酸分子,該雙鏈核酸分子至少包括一突出末端。該突出末端的堿基數(shù)無具體限制,優(yōu)選為1 10個堿基。根據(jù)該雙鏈核酸分子的結(jié)構(gòu),突出末端接頭可分成兩類,分別是單突出末端接頭、雙突出末端接頭。如圖2所示的單突出末端接頭,其一端為平末端,另一端為突出末端。其中帶有分叉接頭的單突出末端接頭能夠防止接頭自連。為了防止一端為平末端的單突出末端接頭自連,可對平末端上的3’ OH進(jìn)行修飾(包括但不限于用氨基封閉羥基),或?qū)⑵侥┒松系?’ 磷酸基團(tuán)去除。如圖3所示的雙突出末端接頭,其含有兩個突出末端,這兩個突出末端可在一條核苷酸鏈上(圖3a)或在不同的核苷酸鏈上(圖北)。當(dāng)這兩個突出末端在不同的核酸鏈上時,他們相互之間不互補(bǔ),以防在連接時出現(xiàn)接頭自連。在第三實施例中,接頭元件采用帶莖環(huán)結(jié)構(gòu)的接頭,如圖4所示。該接頭為單鏈核酸分子,該單鏈核酸分子包括第一互補(bǔ)配對區(qū)1、莖環(huán)區(qū)2和第二互補(bǔ)配對區(qū)3(圖如),第一互補(bǔ)配對區(qū)1能夠與第二互補(bǔ)配對區(qū)3互補(bǔ)配對,且它們形成的互補(bǔ)配對區(qū)包括至少一個限制性內(nèi)切酶識別位點,而通過該酶切識別位點,特定的酶能夠?qū)⑶o環(huán)區(qū)切開或切除,從而將單鏈核酸分子變成雙鏈核酸分子,以便于后續(xù)的操作。在本發(fā)明的一個實施例中,如圖 4b所示,帶莖環(huán)結(jié)構(gòu)的接頭還可帶有突出末端4,該突出末端可位于單鏈核酸分子的5’端或3’端。突出末端4的存在能夠進(jìn)一步的防止接頭自連現(xiàn)象的發(fā)生。該突出末端優(yōu)選為 T。在第四實施例中,接頭元件采用分叉接頭,如圖5所示,是雙鏈核酸分子,包括互補(bǔ)區(qū)和分叉區(qū),所述分叉區(qū)的兩條單鏈各包含至少一個擴(kuò)增引物結(jié)合位點。在本發(fā)明的一個實施例中,所述分叉接頭的互補(bǔ)區(qū)包括至少一個限制性內(nèi)切酶識別位點,該酶切識別位點可以在建庫過程中酶切形成末端,以便于進(jìn)行后續(xù)的操作。該分叉接頭的分叉設(shè)計能夠在建庫過程避免多個接頭自連現(xiàn)象的出現(xiàn);所述分叉區(qū)上包含的擴(kuò)增引物結(jié)合位點,可以直接用于結(jié)合擴(kuò)增引物,進(jìn)行擴(kuò)增反應(yīng)。其中,所述分叉接頭的分叉區(qū)的每條鏈各含有N個核苷酸;優(yōu)選的,9 < NS 30。 其中,所述分叉接頭的配對區(qū)互補(bǔ)配對的核苷酸對數(shù)不限;優(yōu)選的,互補(bǔ)配對的核苷酸對數(shù)為7 15,更優(yōu)選的,互補(bǔ)配對的核苷酸對數(shù)為9 13。其中,所述分叉接頭的配對區(qū)的3’末端為突出末端或平末端。優(yōu)選的,所述分叉接頭的配對區(qū)的3’末端為突出末端,該突出末端可與所述片段化產(chǎn)物的粘性末端互補(bǔ)配對, 提高了連接效率,以利于構(gòu)建測序文庫反應(yīng)的順利進(jìn)行。更優(yōu)選的,所述分叉接頭為T末端分叉接頭,該接頭的配對區(qū)的3’末端為突出末端,且突出末端最后一個堿基為T ;例如圖6所示的T末端分叉接頭,圖中N為A、T、C、G堿基中的任一種。更優(yōu)選的,所述分叉接頭的配對區(qū)的3’末端為突出末端,且突出末端的核苷酸包括通用堿基。其中,突出末端的堿基數(shù)無特殊限制,優(yōu)選在1至4之間。例如圖7所示的分叉接頭,圖中N為A、T、C、G堿基中的任一種,X為通用堿基。優(yōu)選的,所述分叉接頭為雙脫氧接頭,該接頭的配對區(qū)的3’末端為平末端,且3’ 末端最后一個核苷酸為帶有雙脫氧堿基的核苷酸;例如圖8所示的雙脫氧分叉接頭,圖中N 為A、T、C、G堿基中的任一種,dd表示該3’末端最后一個核苷酸為帶有雙脫氧堿基的胞嘧啶核苷酸。應(yīng)當(dāng)說明的是,上述接頭元件只是部分實施例,并不用以限制本發(fā)明的保護(hù)范圍。關(guān)于步驟S12的實現(xiàn)方式在一個實施例中,步驟S12采用接頭元件與擴(kuò)增產(chǎn)物直接連接的方式,構(gòu)建出測序文庫。在另一個實施例中,根據(jù)高通量基因測序技術(shù)的需要,當(dāng)目標(biāo)區(qū)域擴(kuò)增產(chǎn)物較大時或者需要構(gòu)建的目標(biāo)區(qū)域測序文庫較小時,則對擴(kuò)增產(chǎn)物進(jìn)行片段化處理之后,再與接頭元件進(jìn)行連接,構(gòu)建測序文庫,如圖9所示,步驟S12包括以下步驟S121.對與所述多個目標(biāo)區(qū)域?qū)?yīng)的擴(kuò)增產(chǎn)物進(jìn)行片段化,得片段化產(chǎn)物;S122.利用接頭元件,與片段化產(chǎn)物進(jìn)行連接,構(gòu)建測序文庫。該步驟通過片段化處理,將不同的擴(kuò)增產(chǎn)物變成長短相似的片段化產(chǎn)物,能夠有助于后續(xù)的統(tǒng)一測序。需要說明的是步驟S121中,所述片段化擴(kuò)增產(chǎn)物的方法有多種,可以根據(jù)需要選擇采用現(xiàn)有技術(shù),包括但不限于霧化、超聲破碎、機(jī)械剪切破碎片段化、酶切片段化、化學(xué)以及熱誘導(dǎo)片段化。所述片段化處理之后還可包括片段化產(chǎn)物的分離純化以及末端修飾的步驟。根據(jù)測序的片段長度需要,對于片段化得到的核酸片段,進(jìn)行目的核酸片段的分離純化,分離方法可以采用常用方法,如凝膠電泳、蔗糖梯度或氯化銫梯度沉降、柱層析分離等。根據(jù)所使用的片段化方法,對所得的目的核酸片段進(jìn)一步的末端修飾,包括但不限于磷酸化或去磷酸化、末端補(bǔ)平和末端加A,以便于后續(xù)的接頭元件連接。上述目的核酸片段長短不限,優(yōu)選為25bp 500bp,更優(yōu)選為30bp 200bp,更優(yōu)選為40bp lOObp。步驟S121所述片段化產(chǎn)物的長度不限,優(yōu)選為25bp 500bp,更優(yōu)選為30bp 200bp,更優(yōu)選為40bp lOObp。在實現(xiàn)對目標(biāo)區(qū)域的測序的前提下,隨著目標(biāo)區(qū)域測序文庫分子中含有的目標(biāo)區(qū)域片段長度的減短,高通量基因測序技術(shù)的對目標(biāo)區(qū)域的測序深度加深;而測序深度越深,即對目標(biāo)區(qū)域的每一個堿基位置的測序次數(shù)越多,測序結(jié)果越準(zhǔn)確,對樣品中的少量突變的檢測就越靈敏;這樣就能夠有效防止因為樣品中帶有突變的目標(biāo)區(qū)域的比例偏低,而導(dǎo)致該突變的測序信號的絕對值偏低,發(fā)生測序結(jié)果不準(zhǔn)確的現(xiàn)象。根據(jù)上述接頭元件,針對步驟S122,本發(fā)明給出不同實施例,下面將通過多個實施例和附圖對本步驟進(jìn)行進(jìn)一步的說明。在本發(fā)明的一個實施例中,直接在片段化產(chǎn)物的兩端接上接頭形成測序文庫。所述接頭可采用上述的平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。在本發(fā)明的另一個實施例中,直接在片段化產(chǎn)物兩端接上分叉接頭,形成測序文庫。本技術(shù)方案可以利用分叉接頭的特性,防止多個接頭之間自連現(xiàn)象的發(fā)生。在本發(fā)明的另一個實施例中,如圖10所示,步驟S122具體可由以下步驟實現(xiàn)S1221.利用第一接頭與片段化產(chǎn)物的兩端連接,得第一連接產(chǎn)物;S1222.環(huán)化第一連接產(chǎn)物,得環(huán)化產(chǎn)物;S1223. II s型限制性內(nèi)切酶酶切環(huán)化產(chǎn)物,得酶切產(chǎn)物;S1224.在酶切產(chǎn)物兩端接上第二接頭和第三接頭,得測序文庫。步驟S1221中,所述第一接頭可采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的一種,所述第一接頭包含有II S型限制性內(nèi)切酶酶切識別位點;所述的 II s型限制性內(nèi)切酶為切割位點在識別序列之外的限制性內(nèi)切酶,包括但不限于Acu I、 Alw I、Bbs I、BbV I、Bcc I、BceA I、BciV I、BfuA I、Bmr I、Bpm I、BpuE I、Bsa I、BseM II、BseR I、Bsg I、BsmA I、BsmB I、BsmF I、BspCN I、BspM I、BspQ I、BtgZ I、Ear I、Eci I、EcoP15 I、Fau I、Fok I、Hga I、Hph I、HpyAV、Mbo II、Mly I、Mme I、Mnl I、NmeAIII、 Ple I、Sap I、SfaN I 禾口 TspDT I,優(yōu)選為 Acu I、Bsg I、EcoP15 I 或 Mme I。當(dāng)所述第一接頭為分叉接頭時,該II s型限制性內(nèi)切酶酶切識別位點位于互補(bǔ)區(qū);當(dāng)所述第一接頭為帶莖環(huán)結(jié)構(gòu)的接頭時,限制性內(nèi)切酶識別位點與莖環(huán)結(jié)構(gòu)之間的距離,較II S型限制性內(nèi)切酶酶切識別位點與莖環(huán)結(jié)構(gòu)之間的距離近。若片段化產(chǎn)物經(jīng)過末端修復(fù)酶修復(fù),以及末端加A反應(yīng),所述第一接頭優(yōu)選為帶T 末端的分叉接頭。若片段化產(chǎn)物只是經(jīng)過末端修復(fù)酶修復(fù),將片段化產(chǎn)物的末端補(bǔ)平,則所述第一接頭優(yōu)選雙脫氧接頭。在步驟S1222中,環(huán)化第一連接產(chǎn)物有多種實現(xiàn)方式。在本發(fā)明的一實施例中,步驟S1222包括以下步驟S12221.利用酶切引物對第一連接產(chǎn)物進(jìn)行擴(kuò)增,得擴(kuò)增產(chǎn)物;S12222.對擴(kuò)增產(chǎn)物進(jìn)行酶切,使得擴(kuò)增產(chǎn)物形成粘性末端,并自身環(huán)化成環(huán)化產(chǎn)物。所述酶切引物的3’端分別與第一連接產(chǎn)物的兩個末端部分互補(bǔ),5’端均含有限制性內(nèi)切酶識別位點。經(jīng)過步驟S12221的擴(kuò)增形成的擴(kuò)增產(chǎn)物,其兩個末端均含有限制性內(nèi)切酶識別位點,然后在相應(yīng)的酶的作用下,使擴(kuò)增產(chǎn)物的兩端形成粘性末端,且這兩個粘性末端互補(bǔ),能夠進(jìn)行自身環(huán)化。在本發(fā)明的另一個實施例中,所述第一接頭包含有2個酶切識別位點,其中一個為限制性內(nèi)切酶識別位點,用于使步驟S1222形成的第一連接產(chǎn)物的兩端在相應(yīng)的酶的作用下,形成粘性末端,且它們之間互補(bǔ),能夠進(jìn)行自身環(huán)化。另一個為II s型限制性內(nèi)切酶酶切識別位點,用于在步驟S1223中,利用識別該酶切位點的酶識別環(huán)化產(chǎn)物,進(jìn)行酶切, 進(jìn)而得到酶切產(chǎn)物。應(yīng)當(dāng)說明,以上兩個實施例僅為本發(fā)明中的兩種實現(xiàn)環(huán)化第一連接產(chǎn)物的實施方案,對于本發(fā)明的保護(hù)范圍不做任何具體的限制。在步驟S1223中,利用能夠識別第一接頭上的酶切識別位點,并切割環(huán)化產(chǎn)物 (DNA)但不切割第一接頭的酶進(jìn)行酶切。所述第一接頭上的酶切識別位點包括但不限于 Mme I酶切識別位點、Acu I酶切識別位點、Bsg I酶切識別位點。在步驟S1224中,所述第二接頭可為平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的一種,可帶有生物素標(biāo)記。所述第三接頭可為平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的一種。第二接頭與第三接頭可相同或不同。優(yōu)選的, 所述第二接頭和第三接頭相同,均為分叉接頭。更優(yōu)選的,所述分叉接頭為T末端分叉接頭或雙脫氧分叉接頭。需要特別說明的是,步驟S1222與S1223之間還可包括步驟S1222A 滾環(huán)擴(kuò)增環(huán)化產(chǎn)物,得滾環(huán)擴(kuò)增產(chǎn)物。通過步驟S1222A,能夠保證后續(xù)的酶切步驟S1223有足夠的原材料。又或者,在步驟S1221與S1222之間還可包括步驟S1221A 利用擴(kuò)增引物對第一連接產(chǎn)物進(jìn)行擴(kuò)增,得擴(kuò)增產(chǎn)物。所述擴(kuò)增引物分別與第一連接產(chǎn)物兩端的接頭序列互補(bǔ)。 通過步驟S1221A,能夠保證后續(xù)的環(huán)化步驟有足夠的原材料。本方案可避免在步驟S1222之后進(jìn)行滾環(huán)擴(kuò)增,而用步驟S1222之前的步驟 S1221A進(jìn)行普通的PCR擴(kuò)增代替,可有效減少后續(xù)酶切步驟中II s型限制性內(nèi)切酶的用量。其中,所述第一接頭優(yōu)選為分叉接頭。其中,所述分叉接頭的互補(bǔ)區(qū)可包含至少一個酶切識別位點。所述酶切識別位點可為普通的限制性內(nèi)切酶識別位點,也可為II S型限制性內(nèi)切酶酶切識別位點。其中,步驟S1221A所述擴(kuò)增引物優(yōu)選為生物素化引物,有利于擴(kuò)增產(chǎn)物的回收純化。其中,步驟S1221A所述擴(kuò)增引物帶有至少一個特異性酶切識別位點。若擴(kuò)增引物上所帶的特異性酶切識別位點是尿嘧啶堿基,則步驟S1222中利用尿嘧啶特異性切除試劑進(jìn)行酶切,然后再進(jìn)行連接環(huán)化;若擴(kuò)增引物所帶特異性酶切識別位點為限制性內(nèi)切酶識別位點,則步驟S1222中利用相應(yīng)的限制性內(nèi)切酶進(jìn)行酶切,然后再進(jìn)行連接環(huán)化。在本發(fā)明的另一個實施例中,如圖11所示,步驟S122具體可由以下步驟實現(xiàn)S1221’ .利用第四接頭與片段化產(chǎn)物連接,得第二連接產(chǎn)物;S1222’ . II s型限制性內(nèi)切酶酶切第二連接產(chǎn)物,得帶有第四接頭的酶切片段;
S1223’ .帶有第四接頭的酶切片段與第五接頭連接,形成測序文庫。在步驟S1221’中,所述第四接頭可采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的一種,所述第四接頭包含有II S型限制性內(nèi)切酶酶切識別位點;當(dāng)所述第四接頭為分叉接頭時,該Π s型限制性內(nèi)切酶酶切識別位點位于互補(bǔ)區(qū);當(dāng)所述第四接頭為帶莖環(huán)結(jié)構(gòu)的接頭時,限制性內(nèi)切酶識別位點與莖環(huán)結(jié)構(gòu)之間的距離,較II s型限制性內(nèi)切酶酶切識別位點與莖環(huán)結(jié)構(gòu)之間的距離近。若片段化產(chǎn)物經(jīng)過末端修復(fù)酶修復(fù),以及末端加A反應(yīng),所述第四接頭優(yōu)選為帶T 末端的分叉接頭。若片段化產(chǎn)物只是經(jīng)過末端修復(fù)酶修復(fù),將片段產(chǎn)物的末端補(bǔ)平,則所述第四接頭優(yōu)選雙脫氧接頭。在步驟S1222’中,利用能夠識別第四接頭上的酶切識別位點,并切割環(huán)化產(chǎn)物 (DNA)但不切割第四接頭的酶進(jìn)行酶切。所述第四接頭上的酶切識別位點包括但不限于 Mme I酶切識別位點、Acu I酶切識別位點、Bsg I酶切識別位點。在步驟S1223’中,所述第五接頭可為平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的一種,可帶有生物素標(biāo)記。在本發(fā)明的另一個實施例中,步驟S122具體包括以下步驟S1221”.直接在片段化產(chǎn)物的兩端接上帶莖環(huán)結(jié)構(gòu)的接頭,形成帶莖環(huán)結(jié)構(gòu)的片段化產(chǎn)物;S1222”.利用限制性內(nèi)切酶,將帶莖環(huán)結(jié)構(gòu)的片段化產(chǎn)物的莖環(huán)區(qū)切開或切除,從而形成測序文庫。本技術(shù)方案利用帶莖環(huán)結(jié)構(gòu)的接頭,防止了多個接頭自連現(xiàn)象的發(fā)生。應(yīng)當(dāng)說明,以上實施例僅為步驟S122的其中幾種具體實施方案,并不用以限制本發(fā)明的保護(hù)范圍。其中,步驟S2所述的單分子擴(kuò)增是指對測序文庫中的每個分子進(jìn)行單獨擴(kuò)增, 以提升各種分子在后續(xù)測序反應(yīng)中的信號。所述單分子擴(kuò)增的方法包括但不限于乳液 PCR(Emulsion PCR,EPCR)、橋式 PCR。所述EPCR將包含PCR所有反應(yīng)成分的水溶液注入到高速旋轉(zhuǎn)的礦物油表面,水溶液瞬間形成無數(shù)個被礦物油包裹的小水滴。這些小水滴就構(gòu)成了獨立的PCR反應(yīng)空間。 理想狀態(tài)下,每個小水滴只含一個DNA模板(測序文庫分子)和一個磁珠,磁珠上含有與測序文庫分子的共有序列(由接頭元件引入)互補(bǔ)的引物,在PCR反應(yīng)后,磁珠表面就固定有拷貝數(shù)目巨大的同來源的DNA模板擴(kuò)增產(chǎn)物。EPCR具體步驟可參考文獻(xiàn)=BEAMing single-molecule PCR on microparticles in water—in—oil emulsions, Frank Diehl, Meng Li, Yiping He, nature methods, Vol. 3, No. 7,July 2006。所述橋式PCR的基本原理是,橋式PCR的引物被固定在固相載體上,PCR過程中 PCR擴(kuò)增產(chǎn)物會被固定在固相載體上,且PCR擴(kuò)增產(chǎn)物能夠與固相載體上的引物互補(bǔ)配對,成橋狀,然后互補(bǔ)配對的引物以與其成橋的擴(kuò)增產(chǎn)物為模板進(jìn)行擴(kuò)增。通過控制初始模板加入的量,橋式PCR反應(yīng)完成后,擴(kuò)增產(chǎn)物在固相載體上以一簇簇的形式存在,且每一簇的擴(kuò)增產(chǎn)物為同來源的DNA模板擴(kuò)增產(chǎn)物。其具體的原理和實施方案可參考以下文獻(xiàn) CN20061009879. X、US6227604。如前所述,現(xiàn)有技術(shù)中,Sanger測序技術(shù)由于自身的技術(shù)限制,每次只能對一個樣品的某一段區(qū)域進(jìn)行測序。為了一次性實現(xiàn)對樣品中多個區(qū)域的同時檢測,本發(fā)明在測序方法上采取高通量基因測序方法。高通量基因測序相對Sanger測序法檢測序列信息更為方便靈敏,測序文庫中的各個分子經(jīng)過單分子擴(kuò)增后,每個測序文庫分子均形成單分子拷貝陣列,各單分子拷貝陣列在進(jìn)行高通量基因測序時處于不同的位置,使得測序引物與單分子拷貝陣列之間的雜交,以及在酶作用下的延伸反應(yīng)可同時進(jìn)行,相互之間互不干擾。因此,可以同時對大量的(成百萬上千萬,甚至更多的)單分子拷貝陣列同時進(jìn)行測序反應(yīng), 然后通過采集相應(yīng)的信號,進(jìn)而準(zhǔn)確的獲得所需的序列信息,且測序的靈敏度較Sanger更高。尤其是對多個目標(biāo)區(qū)域的擴(kuò)增產(chǎn)物進(jìn)行了片段化處理,相當(dāng)于對相同序列的目標(biāo)區(qū)域分子的每個堿基的測序次數(shù)增加了,能夠進(jìn)一步提高測序的靈敏度。其中,步驟S3所述高通量基因測序技術(shù)包括但不限于基于聚合酶的合成測序法和基于連接酶的連接測序法。合成測序法是基于帶可去除標(biāo)記的核苷酸進(jìn)行的,在每次合成反應(yīng)中,每個模板鏈至多只能延伸一次。一種合成測序法的大致流程如下a.測序引物通過互補(bǔ)配對結(jié)合在單分子擴(kuò)增產(chǎn)物共有的已知序列上(該單分子擴(kuò)增產(chǎn)物固定在引物-固相載體復(fù)合物上),在DNA聚合酶的作用下,以帶可去除標(biāo)記的核苷酸進(jìn)行單堿基延伸合成反應(yīng),收集該次加入核苷酸的標(biāo)記信號,即可得到與測序引物3’ 最末端堿基互補(bǔ)的單分子擴(kuò)增產(chǎn)物(固定在引物-固相載體復(fù)合物上)的下一位的堿基序列信息。b.切除可去除標(biāo)記,然后在DNA聚合酶的作用下,以帶可去除標(biāo)記的核苷酸繼續(xù)進(jìn)行單堿基延伸合成反應(yīng),收集加入核苷酸的標(biāo)記信號,即可得到與測序引物3’末端堿基互補(bǔ)的單分子擴(kuò)增產(chǎn)物的下兩位的堿基序列信息。重復(fù)b步驟,直至不能繼續(xù)進(jìn)行合成反應(yīng)為止,從而獲得單分子擴(kuò)增產(chǎn)物的全部序列信息。連接測序法是基于帶有熒光標(biāo)記的寡核苷酸探針進(jìn)行的,該寡核苷酸探針帶有η 個堿基,分為h(h ^ η)組,同一組寡核苷酸探針的不同熒光標(biāo)記對應(yīng)同一特定位置的不同堿基序列,不同組之間的區(qū)別在于不同熒光標(biāo)記對應(yīng)的特定位置不同,因為該寡核苷酸探針的3’端或5’端進(jìn)行了特定的修飾,寡核苷酸探針之間不能直接相互連接,每次連接反應(yīng),每個單分子擴(kuò)增產(chǎn)物只能連接一個寡核苷酸探針。該連接測序法的大致流程如下a.測序引物通過互補(bǔ)配對結(jié)合在單分子擴(kuò)增產(chǎn)物共有的已知序列上(該單分子擴(kuò)增產(chǎn)物固定在引物-固相載體復(fù)合物上)上,利用上述寡核苷酸探針中的一組(熒光標(biāo)記對應(yīng)的堿基位置為x,x < h),在連接酶的作用下,將核酸探針與上述寡核苷酸鏈連接,然后采集熒光信號,即可得到與單鏈擴(kuò)增產(chǎn)物共有的已知序列的3’末端后或5’末端前第X 位堿基序列信息,將測序引物及其所連接的寡核苷酸探針從單分子擴(kuò)增產(chǎn)物上變性洗脫下來。b.然后重新將測序引物結(jié)合在單分子擴(kuò)增產(chǎn)物上,換用與a步驟不同的寡核苷酸探針組(熒光標(biāo)記對應(yīng)的堿基位置為ι, y ( h),在連接酶的作用下,將核酸探針與上述寡核苷酸鏈連接,然后采集熒光信號,即可得到與單鏈擴(kuò)增產(chǎn)物共有的已知序列的3’末端后或5’末端前第y位堿基序列信息,將測序引物及其所連接的寡核苷酸探針從單分子擴(kuò)增產(chǎn)物上變性洗脫下來。
c.重復(fù)步驟b,直至h組寡核苷酸探針均分別進(jìn)行過一次連接反應(yīng),從而獲得單分子擴(kuò)增產(chǎn)物共有的已知序列的3’末端后或5’末端前第1、2.......h位的堿基序列信息。換用與之前的測序引物相比3’末端或5’末端多一個或多個通用堿基的引物按上述原理進(jìn)行反應(yīng),能夠延長獲得的單分子擴(kuò)增產(chǎn)物共有的已知序列的3’末端后或5’末端前的堿基序列的讀長。這種基于連接酶的連接測序法的原理和具體實施方案可參考CN200710170507. 1。基于聚合酶的合成測序法與焦磷酸測序法有一定的相似之處,因此,理論上來說, 焦磷酸測序法同樣能夠適用于本發(fā)明的檢測方法。但是現(xiàn)有的焦磷酸測序法在測序過程中采用的是天然dNTP,使得其在測序過程中,對待測序文庫上可能存在的連續(xù)單堿基重復(fù)序列的測定存在困難;而基于聚合酶的合成測序法中的核苷酸帶有的可去除標(biāo)記,能夠保證每次只延伸一個堿基;基于連接酶的連接測序發(fā)中的帶熒光標(biāo)記的探針的3’端或5’端進(jìn)行了修飾,保證每個單分子擴(kuò)增產(chǎn)物的片段上只連接一個熒光探針;因此本發(fā)明的基于聚合酶的合成測序法和基于連接酶的連接測序法的準(zhǔn)確性較焦磷酸測序高。此外,現(xiàn)有的焦磷酸測序儀器中的蝕刻光纖玻片(PTP板)上的小孔較大 (55 μ mX 44 μ m),用于容納測序之前的乳液PCR所得的擴(kuò)增產(chǎn)物(乳液PCR的擴(kuò)增產(chǎn)物被固定在10 μ m的珠上),這大大限制了焦磷酸測序法的測序通量,使得其測序反應(yīng)的試劑成本較高。此外,焦磷酸測序法在測序過程中還需往蝕刻光纖玻片(PTP板)的小孔內(nèi)加入帶有多種蛋白的復(fù)合物以保證測序反應(yīng)的順利進(jìn)行,而這將大大提高測序反應(yīng)的試劑成本。而基于聚合酶的合成測序法和基于連接酶的連接測序法可通過1 μ m的磁珠或者玻片來固定單分子擴(kuò)增的產(chǎn)物,使其通量更高,且除了需要帶有可去除標(biāo)記的核苷酸以及在3’端或5’端進(jìn)行了修飾的熒光標(biāo)記的探針外,所需的其他試劑無特殊要求,大大降低了測序反應(yīng)的試劑成本。在獲得相同數(shù)據(jù)量的前提下,基于聚合酶的合成測序法和基于連接酶的連接測序法的測序成本為焦磷酸測序法的兩千分之一或更少。因此本發(fā)明方案中采用的是基于聚合酶的合成測序法或基于連接酶的連接測序法對單分子擴(kuò)增產(chǎn)物進(jìn)行測序。本發(fā)明提出的一個實施例中,同時檢測嗜酒基因中的ADH2、ADH3、ALDH2和 CYP2E1。針對ADH2、ADH3、ALDH2和CYP2E1的熱點突變區(qū)域設(shè)計相應(yīng)的特異性引物,其中 ADH2的特異性引物為SEQ ID NO :1和SEQ ID NO :2 ;ADH3的特異性引物為SEQ ID N0:9禾口 SEQ ID NO 10 ;ALDH2 的特異性引物為 SEQ IDNO 13 和 SEQ ID NO :14、SEQ ID NO 19 和 SEQ ID NO 20 ;CYP2E1 的特異性引物為 SEQ ID NO :25 禾口 SEQ ID NO 26,SEQ ID NO :27 禾口 SEQ ID NO :28。一、待測樣品中DNA的提取利用市場上常見的核酸提取試劑盒分別提取全血樣品(1至6)、血清樣品(7至 12)、石蠟組織樣品(13至18)的DNA,并分別做上相應(yīng)的標(biāo)記。二、待測嗜酒基因多個目標(biāo)區(qū)域的擴(kuò)增利用上述待測易感基因的特異性引物,對嗜酒基因的目標(biāo)區(qū)域進(jìn)行擴(kuò)增,得到擴(kuò)增產(chǎn)物。上述待測嗜酒基因的目標(biāo)區(qū)域擴(kuò)增分別進(jìn)行,反應(yīng)體系如下上游引物(10μ Μ)2μ L ;下游引物(10μ Μ)2uL ;
dNTP(各 2.5mM)4μ L ;待測樣品DNA20ng ;Ex Taq(5U/yL)0. 25 μ L ;IOXEx Taq Buffer5μ L ;ddH20 力口至 50μ L。PCR反應(yīng)條件如下95 °C 3min ;94°C 30s, 58°C 30s,72°C 30s ;重復(fù) 25 個循環(huán);72 °C 7min。利用PCR回收試劑盒,分別對各樣品的擴(kuò)增產(chǎn)物進(jìn)行分離,除去未擴(kuò)增的引物和 dNTP,回收擴(kuò)增產(chǎn)物。三、利用擴(kuò)增產(chǎn)物構(gòu)建測序文庫根據(jù)之前所述,本步驟可由多種方式實現(xiàn)。在本發(fā)明的一個實施例中,采用在片段化產(chǎn)物兩端直接連上接頭元件的方法構(gòu)建測序文庫,具體包括1.擴(kuò)增產(chǎn)物的片段化本實施例中采用超聲破碎法進(jìn)行片段化處理,具體操作為測定回收后的擴(kuò)增產(chǎn)物濃度,按等摩爾數(shù)將相同樣品的不同嗜酒基因目標(biāo)區(qū)域擴(kuò)增產(chǎn)物進(jìn)行混合,得混合液,并標(biāo)記加以區(qū)別。將每個樣品的混合液50 μ L加入至400 μ L的TE buffer中,430W功率條件下超聲 4s,間隔10s,反復(fù)5次,得到片段混合物。利用瓊脂糖凝膠進(jìn)行分離純化,選擇40bp IOObp大小的片段切膠回收,得到片段化產(chǎn)物。2.利用片段化產(chǎn)物與接頭元件構(gòu)建測序文庫為便于進(jìn)行接頭元件的連接,對片段化產(chǎn)物進(jìn)行末端修飾。本實施例中,分別進(jìn)行磷酸化、末端補(bǔ)平及加A尾反應(yīng),具體操作如下1)磷酸化以及末端補(bǔ)平反應(yīng)體系為片段化產(chǎn)物約2000ng ;IOmMdNTP1. 5μ L ;T4DNA 聚合酶(5U/ μ L)1 μ L ;Klenow DNA 聚合酶0. 1 μ L ;Τ4 多核苷酸激酶(10U/ μ L) 0. 5 μ L ;IOm MATP1. 5μ L ;T4DNA 連接緩沖液IOyL;力口 ddH20 至 100 μ L。20°C孵育20min,反應(yīng)結(jié)束后利用回收試劑盒進(jìn)行純化回收。2)末端加A尾反應(yīng)體系為磷酸化以及末端補(bǔ)平后的回收產(chǎn)物約IOOOng ;Klenow 緩沖液(NEB Buffer2)10 μ L ;
1OmMdATP2μ L ;Klenow 酶(3,to 5,exo minus, IOU/ μ L) 1 μ L ;力口 ddH20 至 ΙΟΟμ L。37°C孵育30min,反應(yīng)結(jié)束后利用純化試劑盒純化回收。3)連接接頭1本實施例中采用如圖6所示T末端分叉接頭作為接頭1,同一樣品使用相同T末端分叉接頭,不同樣品對應(yīng)不同T末端分叉接頭,根據(jù)其上所帶第一標(biāo)簽序列進(jìn)行區(qū)分,不同樣品對應(yīng)的標(biāo)簽序列如下表1所示。表1.第一標(biāo)簽序列數(shù)據(jù)表
樣本標(biāo)簽序列樣本標(biāo)簽序列樣本標(biāo)簽序列編號 (5,~>3,) 編號 (S,—3,)編號(5,~^3,)
權(quán)利要求
1.一種檢測嗜酒基因的方法,其特征在于,所述方法包括以下步驟A.利用嗜酒基因特異性引物,對待測樣品中的多個目標(biāo)區(qū)域進(jìn)行擴(kuò)增得擴(kuò)增產(chǎn)物,并基于擴(kuò)增產(chǎn)物構(gòu)建測序文庫;B.對測序文庫進(jìn)行單分子擴(kuò)增,得到與所述多個目標(biāo)區(qū)域?qū)?yīng)的多個單分子擴(kuò)增產(chǎn)物;C.同時對所述多個單分子擴(kuò)增產(chǎn)物進(jìn)行高通量基因測序,得到所述多個目標(biāo)區(qū)域的序列信息。
2.根據(jù)權(quán)利要求1所述的檢測嗜酒基因的方法,其特征在于,所述步驟A包括Al.利用嗜酒基因特異性引物,對待測樣品中的多個目標(biāo)區(qū)域進(jìn)行擴(kuò)增,得到與所述多個目標(biāo)區(qū)域?qū)?yīng)的擴(kuò)增產(chǎn)物;A2.利用接頭元件,與所述多個目標(biāo)區(qū)域?qū)?yīng)的擴(kuò)增產(chǎn)物進(jìn)行連接,得到測序文庫;所述接頭元件采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。
3.根據(jù)權(quán)利要求2所述的檢測嗜酒基因的方法,其特征在于,所述步驟A2包括以下步驟A21.對與所述多個目標(biāo)區(qū)域?qū)?yīng)的擴(kuò)增產(chǎn)物進(jìn)行片段化,得片段化產(chǎn)物; A22.利用接頭元件,與所述片段化產(chǎn)物進(jìn)行連接,構(gòu)建測序文庫。
4.根據(jù)權(quán)利要求3所述的檢測嗜酒基因的方法,其特征在于,所述步驟A22包括以下步驟A221.利用第一接頭與片段化產(chǎn)物的兩端連接,得第一連接產(chǎn)物; A222.環(huán)化第一連接產(chǎn)物,得環(huán)化產(chǎn)物; A223. II s型限制性內(nèi)切酶酶切環(huán)化產(chǎn)物,得酶切產(chǎn)物; A224.在酶切產(chǎn)物兩端接上第二接頭和第三接頭,得測序文庫。
5.根據(jù)權(quán)利要求3所述的檢測嗜酒基因的方法,其特征在于,所述步驟A22包括以下步驟Α22Γ .利用第四接頭與片段化產(chǎn)物連接,得第二連接產(chǎn)物;A222’ . II s型限制性內(nèi)切酶酶切第二連接產(chǎn)物,得帶有第四接頭的酶切片段;A223’ .帶有第四接頭的酶切片段與第五接頭連接,形成測序文庫。
6.根據(jù)權(quán)利要求2至5任一項所述的檢測嗜酒基因的方法,其特征在于,步驟A2所述接頭元件中的至少一個接頭包含有第一標(biāo)簽序列,用于在文庫構(gòu)建過程中,對不同待測樣品的測序文庫做上相應(yīng)的標(biāo)記。
7.根據(jù)權(quán)利要求1至5任一項所述的檢測嗜酒基因的方法,其特征在于,步驟A與每個目標(biāo)區(qū)域?qū)?yīng)的特異性引物中,至少有一條引物與目標(biāo)區(qū)域部分互補(bǔ),且該引物的5’端帶有第二標(biāo)簽序列,用于在擴(kuò)增目標(biāo)區(qū)域過程中,對不同待測樣品的目標(biāo)區(qū)域擴(kuò)增產(chǎn)物做上相應(yīng)的標(biāo)記。
8.根據(jù)權(quán)利要求1至5任一項所述的檢測嗜酒基因的方法,其特征在于,所述嗜酒基因包括ADH2、ADH3、ALDH2和CYP2E1中的至少一個。
9.一種嗜酒基因檢測試劑盒,其特征在于,所述試劑盒包括嗜酒基因特異性引物,用于對待測樣品中的多個目標(biāo)區(qū)域進(jìn)行擴(kuò)增,得到擴(kuò)增產(chǎn)物; 接頭元件,用于與擴(kuò)增產(chǎn)物結(jié)合構(gòu)建測序文庫。
10.根據(jù)權(quán)利要求9所述的嗜酒基因檢測試劑盒,其特征在于,所述接頭元件采用平末端接頭、突出末端接頭、帶莖環(huán)結(jié)構(gòu)的接頭和分叉接頭中的至少一種。
11.根據(jù)權(quán)利要求9所述的嗜酒基因檢測試劑盒,其特征在于,所述接頭元件中的至少一個接頭包含有第一標(biāo)簽序列,用于在文庫構(gòu)建過程中,對不同待測樣品的測序文庫做上相應(yīng)的標(biāo)記。
12.根據(jù)權(quán)利要求9所述的嗜酒基因檢測試劑盒,其特征在于,所述待測嗜酒基因有多個,與每個目標(biāo)區(qū)域?qū)?yīng)的特異性引物中,至少有一條引物與目標(biāo)區(qū)域部分互補(bǔ),且該引物的5’端帶有第二標(biāo)簽序列,用于在擴(kuò)增目標(biāo)區(qū)域過程中,對不同待測樣品的目標(biāo)區(qū)域擴(kuò)增產(chǎn)物做上相應(yīng)的標(biāo)記。
13.根據(jù)權(quán)利要求9至12中任一項所述的嗜酒基因檢測試劑盒,其特征在于,所述嗜酒基因包括ADH2、ADH3、ALDH2和CYP2E1中的至少一個。
全文摘要
本發(fā)明涉及基因工程領(lǐng)域,提供一種檢測嗜酒基因的方法及相應(yīng)的試劑盒。所述檢測嗜酒基因的方法包括以下步驟A.利用嗜酒基因特異性引物,對待測樣品中的多個目標(biāo)區(qū)域進(jìn)行擴(kuò)增得擴(kuò)增產(chǎn)物,并基于擴(kuò)增產(chǎn)物構(gòu)建測序文庫;B.對測序文庫進(jìn)行單分子擴(kuò)增,得到與所述多個目標(biāo)區(qū)域?qū)?yīng)的多個單分子擴(kuò)增產(chǎn)物;C.同時對所述多個單分子擴(kuò)增產(chǎn)物進(jìn)行高通量基因測序,得到所述多個目標(biāo)區(qū)域的序列信息。該方法及其相應(yīng)的試劑盒利用高通量基因測序技術(shù)對嗜酒基因的多個區(qū)域同時進(jìn)行區(qū)域測序,提高了檢測效率,降低了檢測成本;另外該方法能夠突破傳統(tǒng)檢測方法的限制,提高了檢測的準(zhǔn)確性與靈敏度。
文檔編號C12Q1/68GK102533991SQ20111044511
公開日2012年7月4日 申請日期2011年12月27日 優(yōu)先權(quán)日2011年12月27日
發(fā)明者盛司潼 申請人:盛司潼