專利名稱:一種高通量基因組甲基化dna富集方法及其所使用標(biāo)簽和標(biāo)簽接頭的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及高通量基因組甲基化DNA富集技術(shù)領(lǐng)域。另外,本發(fā)明還涉及標(biāo)簽技術(shù),以及實現(xiàn)多個樣品在同一反應(yīng)體系中進行構(gòu)建標(biāo)簽文庫,特別是MeDIP-seq文庫的方法。本發(fā)明的方法特別適用于第二代測序技術(shù),尤其是solexa測序技術(shù)。
背景技術(shù):
目前,基因組DNA甲基化是表觀遺傳學(xué)研究領(lǐng)域最為熱點的方向之一,也正逐漸成為哺乳動物發(fā)育和癌癥等多種疾病的表觀遺傳學(xué)標(biāo)記。DNA甲基化不僅對染色質(zhì)結(jié)構(gòu)修飾,基因組穩(wěn)定性具有重要作用,而且在真核生物中,DNA甲基化參與多種生物學(xué)過程,如胚胎發(fā)育,基因組印記,X染色體失活,基因表達的調(diào)節(jié)與沉默,逆轉(zhuǎn)錄轉(zhuǎn)座子的沉默以及哺乳動物腫瘤等多種疾病的發(fā)生[1-2]。DNA甲基化生物標(biāo)記不僅為多種疾病的早期診斷,而且對高危險個體的檢測和評估提供了有利的工具。BS-seq(重亞硫酸鹽處理測序),MeDIP-seq (抗體甲基化DNA免疫富集測序), MBD-seq (甲基化特異結(jié)合蛋白富集甲基化DNA測序和RRBS (全基因組代表性甲基化測序) 等是目前研究基因組甲基化較為流行的測序方法,但是它們不同程度上受到成本、通量和分辨率的限制BS-seq是CpG甲基化分析最常用的方法,可以提供單堿基分辨率的甲基化信息,但需要全基因組經(jīng)重亞硫酸鹽(bisulfite)處理之后結(jié)合測序研究,因此數(shù)據(jù)量龐大,測序及分析成本高[5—]。MeDIP-seq、MBD-seq和RRBS分別在不同程度上選擇性的減少了測序的樣本量。RRBS只能覆蓋基因組約10-20%的區(qū)域,且主要是基因組的CpG島和小部分啟動子區(qū)域,很難在整體水平反應(yīng)基因組甲基化特征[7_8]。MBD-seq和MeDIP-seq 分別利用甲基化特異結(jié)合蛋白(MBD2)和甲基化特異結(jié)合抗體(5mc抗體)與甲基化DNA結(jié)合起到富集的作用。MBD-seq主要富集高CpG區(qū)域的高甲基化DNA。MeDIP-seq主要富集高甲基化,適度CpG密度的區(qū)域。已知的BS-seq結(jié)果顯示,大部分高甲基化的調(diào)節(jié)區(qū)域為較低的CpG密度,因此,MeDIP-seq更適合這種特征的分析[3]。此外,5mC抗體不具有CpG位點的特異性,因此對非CpG位點的胞嘧啶甲基化特征的分析具有重要的意義 ]。目前,已有MeDIP-seq技術(shù)主要缺陷是操作步驟繁瑣不易對大規(guī)模樣本進行研究?,F(xiàn)有方法都是將單個樣品單獨進行免疫反應(yīng)然后對富集得到的DNA結(jié)合高通量測序研究,這種方法使得對大樣本量處理時在時間、人力和資金上的花費極其巨大,可行性大打折扣。
發(fā)明內(nèi)容
本發(fā)明在已有基于高通量測序的MeDIP-seq技術(shù)的基礎(chǔ)上創(chuàng)新性的開發(fā)了一種可以進行大規(guī)模MeDIP-seq文庫構(gòu)建和同時多樣本混合高通量測序的技術(shù)。與已有方法比較主要優(yōu)點是可以將多個樣本混合后同時進行DNA與抗體免疫反應(yīng)(IP反應(yīng))。對獲得的多個樣本的混合文庫可以同時進行高通量測序,對測序獲得的數(shù)據(jù)通過各自標(biāo)簽(也稱為^如》序列進行區(qū)分從而分別進行高通量分析。該發(fā)明方法大大節(jié)省了樣本準(zhǔn)備時間及試劑用量,使得高效、低成本的MeDIP-seq樣品準(zhǔn)備成為現(xiàn)實,使得大樣本量的臨床樣本的MeDIP-seq群體研究成為可能。在本發(fā)明一個方面,提供了大規(guī)模的甲基化MeDIP-seq文庫構(gòu)建和同時多樣本混合高通量測序的方法,所述方法包括步驟一樣品DNA片段化起始目的研究材料可以為任意物種的基因組DNA,片段化常用的方法包括霧化、超聲片段化、HydroShear或酶切處理,將基因組DNA打斷為大小200_400bp的片段。上述眾多常用方法中優(yōu)選地采用超聲片段化法。步驟二 DNA片段末端修復(fù)及3,連接“A”堿基打斷后的片段化DNA在T4DNA聚合酶、Klenow片段和T4多聚核苷酸激酶等酶的作用下,進行末端修復(fù),形成平末端的DNA隨機片段,然后在Klenow (3’ -5’ exo-)酶的作用下,在平末端化的DNA的3’末端連接“A”堿基。步驟三標(biāo)簽接頭(也稱為hdex adapter)的連接及實時定量PCR (也稱為Q-PCR)
定量在T4DNA連接酶的作用下,將末端連接“A”堿基的DNA在末端分別連接上不同的標(biāo)簽接頭(表1)。連接產(chǎn)物采用實時定量PCR(Q-PCR)進行濃度檢測,確定各個樣品的有效濃度。所述實時定量PCR是本領(lǐng)域技術(shù)人員已知的方法。步驟四樣品混合,定量及免疫反應(yīng)取含等量的連接有標(biāo)簽接頭的DNA產(chǎn)物(樣品個數(shù)可根據(jù)實驗確定),進行等量混合,最終總量控制在1. 5-2μ g。如果3種樣品混合,則每種樣品所取的量為含有約為0. 5μ g 的基因組DNA的量,如果6種樣品混合,則每種樣品所取的量為含有約為0. 3μ g的基因組 DNA的量?;旌虾蟮臉悠分锌杉尤胪庠吹募谆年栃詫φ蘸臀醇谆年幮詫φ兆鳛閷φ沾_定捕獲效率?;旌蠘悠愤M行高溫或NaOH變性后加入抗體進行免疫反應(yīng)(IP)。步驟五捕獲DNA進行Q-PCR檢測免疫反應(yīng)(IP)捕獲后的DNA純化后進行Q-PCR檢測富集效率,根據(jù)原混合樣品和捕獲DNA的Ct值檢測抗體對甲基化DNA捕獲效率β]。步驟六PCR擴增和文庫大小選擇對IP捕獲純化后的DNA進行低循環(huán)PCR擴增,擴增后產(chǎn)物即MeDIP-seq多樣品混合測序文庫,對所述PCR擴增產(chǎn)物采用2%瓊脂糖凝膠電泳進行切膠回收選擇目的片段。回收的目的片段即為高通量測序文庫。本發(fā)明還提供上述MeDIP-seq文庫用于同時多樣本混合高通量測序的用途,所述測序可通過任何測序方法進行,包括但不限于雙脫氧鏈終止法,優(yōu)選高通量測序方法包括但不限于第二代測序技術(shù)或者是單分子測序技術(shù)。所述第二代測序技術(shù)包括但不限于S0LEXA、S0LID和妨4測序技術(shù);所述單分子測序技術(shù)包括但不限于True Single Molecule DNAsequencing技術(shù),the single molecule, real-time (SMRT. TM.)技術(shù),以及納米孔測序技術(shù)。本發(fā)明在已有基于高通量測序的MeDIP-seq技術(shù)的基礎(chǔ)上創(chuàng)新性的開發(fā)了一種可以進行大規(guī)模MeDIP-seq文庫構(gòu)建和同時多樣本混合高通量測序的技術(shù)。我們對加了標(biāo)簽接頭的DNA片段采用實時定量PCR檢測濃度,然后根據(jù)混合濃度將多個樣本混合后同時進行DNA與抗體免疫反應(yīng)(IP反應(yīng))。對捕獲的含有多個樣本的混合文庫可以同時進行高通量測序,對測序獲得的數(shù)據(jù)通過各自標(biāo)簽序列進行區(qū)分從而分別進行高通量分析。同時該方法經(jīng)過QPCR定量可以確保不同樣品進行均勻混合,因不同的樣品在同一 IP條件下反應(yīng),確保了 IP反應(yīng)對每種樣品內(nèi)的甲基化DNA片段進行有效的捕獲效率相同,解決了不同樣本間捕獲效率差異。比較已有方法該該發(fā)明方法大大節(jié)省了樣本準(zhǔn)備時間及試劑用量, 使得高效、低成本的MeDIP-seq樣品準(zhǔn)備成為現(xiàn)實,使得大樣本量的臨床樣本的MeDIP-seq 群體研究成為可能。本發(fā)明一方面提供了一組標(biāo)簽,所述標(biāo)簽包括或由如下組成選自表1中標(biāo)簽的至少5個,或至少10個,或至少15個,或全部20個,所述標(biāo)簽優(yōu)選地至少包括表1所示的20個標(biāo)簽的DNA index-l-DNA index-5, 或 DNA index-6-DNA index-10,或 DNA index-1I-DNA index-15,或 DNA index-16-DNA index-20,或者他們?nèi)魏蝺蓚€或多個的組合。在本發(fā)明的一個具體實施方式
中,提供了所述的標(biāo)簽用于構(gòu)建MeDIP-seq文庫的用途。在本發(fā)明的一個具體實施方式
中,提供了通過所述的標(biāo)簽構(gòu)建的MeDIP-seq文庫。本發(fā)明另一方面提供了含有上文所述的標(biāo)簽的一組標(biāo)簽接頭,其中標(biāo)簽接頭包含所述的標(biāo)簽,并且優(yōu)選地同時用作5’和3’接頭,所述一組所述標(biāo)簽接頭包括或由如下組成選自表1中標(biāo)簽接頭的至少5個,或至少10個,或至少15個,或全部20個;所述標(biāo)簽接頭優(yōu)選地至少包括表1所示的20個標(biāo)簽接頭中的DNAindex-IF/ R_adapter-DNA index-5F/R_adapter,或 DNAindex-6F/R_adapter_DNA index_10F/R_ adapter,或 DNAindex-llF/R_adapter_DNA index-15F/R_adapter,或 DNAindex_16F/R_ adapter-DNA index_20F/R_adapter,或者他們?nèi)魏蝺蓚€或多個的組合。在本發(fā)明的一個具體實施方式
中,提供了所述的標(biāo)簽接頭用于構(gòu)建MeDIP-seq文庫的用途,優(yōu)選地所述標(biāo)簽接頭同時用作MeDIP-seq文庫的5’和3’接頭。在本發(fā)明的一個具體實施方式
中,提供了通過上文所述的標(biāo)簽接頭構(gòu)建的 MeDIP-seq 文庫。本發(fā)明另一方面提供了一種MeDIP-seq文庫構(gòu)建的方法,所述方法包括
步驟一樣品DNA片段化起始目的研究材料可以為任意物種,包括各種植物、動物、微生物,例如人,植物, 昆蟲,特別是哺乳動物包括人、小鼠的基因組DNA,片段化的方法包括霧化、超聲片段化、 HydroShear或酶切處理,從而將基因組DNA打斷為大小優(yōu)選為200_400bp的片段;其中片段化方法中優(yōu)選地采用超聲片段化法;步驟二 DNA片段末端修復(fù)及3’端連接“A”堿基打斷后的片段化DNA在包括但不限于T4 DNA聚合酶、Klenow片段和T4多聚核苷酸激酶等酶的作用下,進行末端修復(fù),形成平末端的DNA隨機片段,然后在包括但不限于 Klenow(3' -5’ exo-)酶的作用下,在平末端化的DNA隨機片段的3’末端連接“A”堿基;步驟三標(biāo)簽接頭的連接及定量
在包括但不限于T4DNA連接酶的作用下,將末端連接“A”堿基的DNA隨機片段末端連接不同的標(biāo)簽接頭,優(yōu)選地所述DNA隨機片段5’和3’端同時連接所述標(biāo)簽接頭;然后對連接產(chǎn)物采用包括但不限于實時定量PCR進行濃度檢測,確定各個樣品的有效濃度;步驟四樣品混合,定量及免疫反應(yīng)取含等量的連接有不同標(biāo)簽接頭的連接產(chǎn)物,進行等量混合,總量控制在1-3 μ g, 優(yōu)選1. 5-2 yg ;混合后的樣品中優(yōu)選地加入外源的甲基化的陽性對照和未甲基化的陰性對照作為對照確定捕獲效率;然后混合樣品進行高溫或NaOH變性后加入甲基化特異結(jié)合抗體,優(yōu)選地是5mc抗體進行免疫反應(yīng)(IP);外源的甲基化的陽性對照是指一段已知序列(如200_300bp的一段DNA序列),當(dāng)中的含有的CG位點是確定的(如5個CG位點),陽性對照這些位點都是甲基化的(預(yù)先用甲基化轉(zhuǎn)移酶處理),未甲基化的陰性對照的這些位點都是未甲基化的,所以抗體會富集甲基化的而不富集未甲基化的。因為這200-300的片段都是設(shè)計好引物的,所以可以有此根據(jù)QPCR檢測富集的效果。陽性對照和陰性對照是本領(lǐng)域技術(shù)人員已熟知的技術(shù);任選地,步驟五捕獲DNA進行Q-PCR檢測免疫反應(yīng)(IP)捕獲后的DNA純化后進行Q-PCR檢測富集效率,根據(jù)原混合樣品和捕獲DNA的Ct值檢測抗體對甲基化DNA捕獲效率;步驟六PCR擴增和文庫大小選擇對IP捕獲純化后的DNA進行優(yōu)選的8_10個循環(huán)的低循環(huán)PCR擴增,擴增后產(chǎn)物即MeDIP-seq多樣品混合測序文庫,對所述PCR擴增產(chǎn)物優(yōu)選地采用2%瓊脂糖凝膠電泳進行切膠回收選擇片段大?。粚⒛康臈l帶切下純化后,即為待測序的MeDIP-seq文庫;PCR擴增優(yōu)選地使用熱啟動taq酶。在本發(fā)明的一個具體實施方式
中,所述的方法中所述標(biāo)簽接頭是上文所述的標(biāo)簽接頭。在本發(fā)明的一個具體實施方式
中,提供了通過所述的方法構(gòu)建的MeDIP-seq文庫。本發(fā)明另一方面進一步提供了通過本發(fā)明的方法構(gòu)建的MeDIP-seq文庫用于同時多樣本混合高通量測序的用途,其中包括 Μ^使用所述測序文庫進行高通量測序,所述測序可通過任何測序方法進行, 包括但不限于雙脫氧鏈終止法,優(yōu)選高通量測序方法包括但不限于第二代測序技術(shù)或者是單分子測序技術(shù)。在本發(fā)明的一個具體實施方式
中,所述第二代測序技術(shù)(MetzkerML. kquencing technologies—the next generation. Nat Rev Genet. 2010 Jan ;11 (1) :31-46)
限于SOLEXA、SOLID和454(焦磷酸測序)測序技術(shù)(平臺);所述單分子測序技術(shù)(單分子測序平臺)包括但不限于Helicos公司的True Single Molecule DNA sequencing技術(shù),Pacific Biosciences 公司的 the single molecule,real-time (SMRT. TM.)技術(shù),以及 Oxford Nanopore ^Technologies 公司的納米孔測序技術(shù)等(Rusk,Nicole (2009-04-01). CheapThird-Generation Sequencing. Nature Methods 6(4) :244-245)。
圖1 :MeDIP多樣本大規(guī)模建庫基本流程。圖2 樣品間富集片段的相關(guān)性分析,根據(jù)對不同區(qū)域片段的富集情況比較2個樣品覆蓋的區(qū)域是否一致。
具體實施例方式下面將結(jié)合實施例對本發(fā)明的實施方案進行詳細描述,但是本領(lǐng)域技術(shù)人員將會理解,下列實施例僅用于說明本發(fā)明,而不應(yīng)視為限定本發(fā)明的范圍。使用此發(fā)明方法,我們以6個人外周血基因組DNA(各2yg)樣品起始構(gòu)建了 1個混合6個樣品的混合文庫。采用TA clone檢測了文庫的質(zhì)量,然后進行了高通量測序比較分析。1、實驗部分主要實驗儀器列表
權(quán)利要求
1.一組標(biāo)簽,所述標(biāo)簽包括或由如下組成選自表1中標(biāo)簽的至少5個,或至少10個, 或至少15個,或全部20個,所述標(biāo)簽優(yōu)選地至少包括表1所示的20個標(biāo)簽的DNA index-l-DNA index-5,或DNA index-6-DNA index-10,或DNA index-1I-DNA index-15,或DNA index-16-DNA index-20, 或者他們?nèi)魏蝺蓚€或多個的組合。
2.權(quán)利要求1所述的標(biāo)簽用于構(gòu)建MeDIP-seq文庫的用途。
3.通過權(quán)利要求1所述的標(biāo)簽構(gòu)建的MeDIP-seq文庫。
4.含有權(quán)利要求1所述的標(biāo)簽的一組標(biāo)簽接頭,其中標(biāo)簽接頭包含權(quán)利要求1所述的標(biāo)簽,并且優(yōu)選地同時用作5’和3’接頭,所述一組所述標(biāo)簽接頭包括或由如下組成選自表1中標(biāo)簽接頭的至少5個,或至少10個,或至少15個,或全部20個;所述標(biāo)簽接頭優(yōu)選地至少包括表1所示的20個標(biāo)簽接頭中的DNAindeX-lF/R_ adapter-DNA index-5F/R_adapter, g DNAindex-6F/R_adapter-DNA index-10F/R_ adapter,或 DNAindex-llF/R_adapter_DNA index-15F/R_adapter,或 DNAindex_16F/R_ adapter-DNA index_20F/R_adapter,或者他們?nèi)魏蝺蓚€或多個的組合。
5.權(quán)利要求4所述的標(biāo)簽接頭用于構(gòu)建MeDIP-seq文庫的用途,優(yōu)選地所述標(biāo)簽接頭同時用作MeDIP-seq文庫的5’和3’接頭。
6.通過權(quán)利要求4或5所述的標(biāo)簽接頭構(gòu)建的MeDIP-seq文庫。
7.一種MeDIP-seq文庫構(gòu)建的方法,所述方法包括步驟一樣品DNA片段化起始目的研究材料可以為任意物種,包括各種植物、動物、微生物,例如人,植物,昆蟲,特別是哺乳動物包括人、小鼠的基因組DNA,片段化的方法包括霧化、超聲片段化、 HydroShear或酶切處理,從而將基因組DNA打斷為大小優(yōu)選為200_400bp的片段;其中片段化方法中優(yōu)選地采用超聲片段化法;步驟二 DNA片段末端修復(fù)及3’端連接“A”堿基打斷后的片段化DNA在包括但不限于T4DNA聚合酶、Klenow片段和T4多聚核苷酸激酶等酶的作用下,進行末端修復(fù),形成平末端的DNA隨機片段,然后在包括但不限于 Klenow(3' -5’ exo-)酶的作用下,在平末端化的DNA隨機片段的3’末端連接“A”堿基;步驟三標(biāo)簽接頭的連接及定量在包括但不限于T4 DNA連接酶的作用下,將末端連接“A”堿基的DNA隨機片段末端連接不同的標(biāo)簽接頭,優(yōu)選地所述DNA隨機片段5’和3’端同時連接所述標(biāo)簽接頭;然后對連接產(chǎn)物采用包括但不限于實時定量PCR進行濃度檢測,確定各個樣品的有效濃度;步驟四樣品混合,定量及免疫反應(yīng)取含等量的連接有不同標(biāo)簽接頭的連接產(chǎn)物,進行等量混合,總量控制在1-3 μ g,優(yōu)選 1. 5-2 yg ;混合后的樣品中優(yōu)選地加入外源的甲基化的陽性對照和未甲基化的陰性對照作為對照確定捕獲效率;然后混合樣品進行高溫或NaOH變性后加入甲基化特異結(jié)合抗體,優(yōu)選地是5mc抗體進行免疫反應(yīng)(IP);步驟五PCR擴增和文庫大小選擇對IP捕獲純化后的DNA進行優(yōu)選的8-10個循環(huán)的低循環(huán)PCR擴增,擴增后產(chǎn)物即 MeDIP-seq多樣品混合測序文庫,對所述PCR擴增產(chǎn)物優(yōu)選地采用2 %瓊脂糖凝膠電泳進行切膠回收選擇片段大小;將目的條帶切下純化后,即為待測序的MeDIP-seq文庫;PCR擴增優(yōu)選地使用熱啟動taq酶。
8.權(quán)利要求7所沭的方法,所沭方法在步驟五之前還講一步包括如下步驟:捕獲DNA進行Q-PCR檢測免疫反應(yīng)(IP)捕獲后的DNA純化后進行Q-PCR檢測富集效率,根據(jù)原混合樣品和捕獲 DNA的Ct值檢測抗體對甲基化DNA捕獲效率。
9.權(quán)利要求7或8所述的方法,其中所述標(biāo)簽接頭是權(quán)利要求4所述的標(biāo)簽接頭。
10.通過權(quán)利要求7或8所述的方法構(gòu)建的MeDIP-seq文庫。
11.權(quán)利要求10所述的MeDIP-seq文庫用于同時多樣本混合高通量測序的用途,其中包括使用所述測序文庫進行高通量測序,所述測序可通過任何測序方法進行,包括但不限于雙脫氧鏈終止法,優(yōu)選高通量測序方法包括但不限于第二代測序技術(shù)或者是單分子測序技術(shù)。
12.權(quán)利要求11所述的用途,其中所述第二代測序技術(shù)包括但不限于S0LEXA、S0LID和妨4測序技術(shù);所述單分子測序技術(shù)包括但不限于True Single Molecule DNA sequencing 技術(shù),the singlemolecule,real-time (SMRT. TM.)技術(shù),以及納米孔測序技術(shù)。
全文摘要
本發(fā)明提供一種可以進行大規(guī)模MeDIP-seq文庫構(gòu)建和同時多樣本混合高通量測序的技術(shù)。本發(fā)明提供的方法對獲得的多個樣本的混合文庫可以同時進行高通量測序,對測序獲得的數(shù)據(jù)通過各自標(biāo)簽(也稱為Index)序列進行區(qū)分從而分別進行高通量分析。
文檔編號C12Q1/68GK102409042SQ20101029924
公開日2012年4月11日 申請日期2010年9月21日 優(yōu)先權(quán)日2010年9月21日
發(fā)明者孫繼華, 王君文, 章文蔚, 羅慧娟, 閆淑靜 申請人:深圳華大基因研究院, 深圳華大基因科技有限公司