Dna5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及一種DNA5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方法,屬于基 因測序領(lǐng)域。
【背景技術(shù)】
[0002] DNA不僅由胞嘧啶、胸腺嘧啶、鳥嘌呤、腺嘌呤四種堿基組合而成。5-甲基胞嘧啶與 5-羥甲基胞嘧啶是DNA中的重要修飾修飾堿基是DNA上的第五種與第六種堿基。他們是調(diào)控 生物通路,細(xì)胞生命周期的重要標(biāo)記,起到多重的生物功能,包括轉(zhuǎn)錄調(diào)控,轉(zhuǎn)座子沉默,基 因印記和X染色體失活等。在多種疾病特別是癌癥等重大疾病中呈現(xiàn)特定的基因組分布,在 受精發(fā)育初期過程中呈現(xiàn)明顯的分布變化,被認(rèn)為可能參與與標(biāo)記了這些過程。所以利用 測序技術(shù)全面了解這一過程顯得尤為重要。
[0003] 由于這類5位修飾的胞嘧啶物理化學(xué)性質(zhì)接近,不能直接利用現(xiàn)有的一代或二代 測序技術(shù)進(jìn)行檢測。一類常用的方法是將DNA打斷成片段,再將5位修飾的胞嘧啶特異性結(jié) 合,從而特異性地富集含有5位修飾的胞嘧啶的DNA片段。通過對富集后的片段的測序,可以 得到5位修飾的胞嘧啶在基因組上的分布信息,并藉由此信息進(jìn)行各類定性、半定量、定量 生物信息學(xué)分析。此類方法的優(yōu)點(diǎn)是測序深度要求低,成本低,覆蓋性好。其中普遍使用的 富集手段有兩類,一類是特異性抗體捕獲,另一類是特異性的化學(xué)生物學(xué)標(biāo)記捕獲。兩類手 段均可給出重復(fù)性好的結(jié)果,其中抗體較為昂貴,捕獲的位點(diǎn)序列要求較高,對修飾堿基 分布稀疏的序列結(jié)合性差,可能引入歧視誤差。而特異性的化學(xué)生物學(xué)標(biāo)記可能會因為化 學(xué)生物反應(yīng)的選擇性優(yōu)化不完全導(dǎo)致脫靶副產(chǎn)物,從而引入背景。由于是富集過程,大量的 不含5位修飾胞嘧啶的DNA片段在過程中被棄去,導(dǎo)致在測序應(yīng)用中,兩者均需要大量的DNA 作為起始。這類傳統(tǒng)的測序方法一般只能就1微克以上的DNA作為起始樣品量進(jìn)行測序。在 實際的生物、醫(yī)療應(yīng)用中,往往只能得到1微克以下,甚至1-10納克的DNA樣品,對于此類樣 品的檢測方法將直接獲取有生物與臨床價值的基因調(diào)控信息,因而在生物臨床研發(fā)與檢測 中有著重大意義。
[0004] 根據(jù)上文分析,現(xiàn)有富集手段未獲得重大突破的原因有三:一是富集后的DNA過 少,在測序文庫建立過程中損失太大。傳統(tǒng)建立文庫的流程中涉及到了多步反應(yīng)純化,小量 DNA的純化效率低下;二是富集方法在低濃度的DNA上的效率下降,使用抗體富集時,結(jié)合效 率直接與抗原濃度相關(guān),現(xiàn)報導(dǎo)的的抗原-抗體的結(jié)合能力不能滿足極低的DNA濃度下的反 應(yīng);三是富集后的DNA不能有效地從固相洗脫,固相負(fù)載的DNA在富集過程中只占原始DNA的 5%以內(nèi)。洗脫的過程中涉及的純化或化學(xué)反應(yīng)會極大的損失固相負(fù)載的DNA片段,造成后 續(xù)PCR反應(yīng)失敗或引入大量測序誤差。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的在于提供一種DNA5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方 法,以提高含有5位修飾胞嘧啶的測序效率。
[0006] 本發(fā)明采用了如下技術(shù)方案:
[0007] 一種DNA5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方法,其特征在于,包括以 下步驟:
[0008] (l)DNA的提純與片段化預(yù)處理:
[0009]將目的DNA提取后使用機(jī)械力或消化酶將其打斷至平均50個核苷酸長度到10000 個核苷酸長度的片段;
[0010] (2)微量DNA的修復(fù)與接頭引物連接:
[0011] 將預(yù)處理的DNA片段修復(fù)并與二代測序需要的測序接頭引物連接;
[0012] (3)共價標(biāo)記5-甲基胞嘧啶與5-輕甲基胞嘧啶:
[0013] 將連接好接頭引物的DNA片段中的5位修飾的胞嘧啶進(jìn)行共價標(biāo)記;
[0014] (4)固相富集含有標(biāo)記的5位修飾胞嘧啶的DNA片段:
[0015] 將標(biāo)記的5位修飾的胞嘧啶的DNA片段在結(jié)合緩沖液中結(jié)合到固相上,對固相表面 進(jìn)行反復(fù)洗滌,去除未結(jié)合的DNA片段,
[0016] 在固相上,用對應(yīng)接頭引物的PCR擴(kuò)增引物進(jìn)行擴(kuò)增。取得的PCR產(chǎn)物,經(jīng)純化后即 得到二代測序所需的基因組5位修飾胞嘧啶的分布圖譜。
[0017] 進(jìn)一步,本發(fā)明的DNA5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方法,還可以 具有這樣的特征:其中,步驟(1)中,所述DNA片段來源于體液中游離的DNA片段;或提純于組 織、細(xì)胞及細(xì)胞器的完整的基因組DNA。
[0018] 進(jìn)一步,本發(fā)明的DNA5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方法,還可以 具有這樣的特征:步驟(1)中,DNA片段的體液來自于血液、尿液、汗液、痰液、糞便、腦脊液、 腹水、胸水、膽汁、胰腺液等人體體液。
[0019] 進(jìn)一步,本發(fā)明的DNA5-甲基胞嘧啶與5-羥甲基胞啼啶基因圖譜測序方法,還可以 具有這樣的特征:其中,上述步驟(2)中的DNA片段修復(fù)是指修復(fù)DNA片段中的堿基損壞,并 將DNA的5 '及3 '補(bǔ)齊成平末端。
[0020] 進(jìn)一步,本發(fā)明的DNA5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方法,還可以 具有這樣的特征:步驟(3)中,標(biāo)記的方法包括步驟:i)利用轉(zhuǎn)糖酶將帶有疊氮基團(tuán)修飾的 糖共價連接到5-羥甲基胞嘧啶的羥甲基上,i i)將直接或間接連有生物素的點(diǎn)擊化學(xué)底物 與疊氮糖修飾的5-羥甲基胞嘧啶反應(yīng)。
[0021] 進(jìn)一步,本發(fā)明的DNA5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方法,還可以 具有這樣的特征:所述轉(zhuǎn)糖酶包括但 glucosyl transferase (T4·菌體β-葡糖基轉(zhuǎn)移酶)、T4 bacteriophage enzymea-glucosyl transferase (Τ4·菌體a-葡糖基轉(zhuǎn)移酶)及其衍生物,類似物,或重組酶;疊氮基 團(tuán)修飾的糖包括但不限于6-N3-葡萄糖或其他疊氮修飾的糖類。
[0022] 進(jìn)一步,本發(fā)明的DNA5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方法,還可以 具有這樣的特征:標(biāo)記甲基胞嘧啶的步驟為i)利用鼠 Tet氧化酶或其衍生物、類似物、重組 酶將甲基胞嘧啶氧化為5-羥甲基胞嘧啶ii)同上文所述將5-羥甲基胞嘧啶進(jìn)行生物素標(biāo) 記。
[0023] 進(jìn)一步,本發(fā)明的DNA5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方法,還可 以具有這樣的特征:其中,5-羥甲基胞嘧啶和5-甲基胞嘧啶的標(biāo)記步驟可以按順序進(jìn)行也 可以在一個反應(yīng)中同時進(jìn)行。
[0024] 進(jìn)一步,本發(fā)明的DNA5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方法,還可以 具有這樣的特征:其中,步驟⑷中,固相材料包括直徑lnm至1 OOum的磁性小球,直徑lnm至 100um的瓊脂糖小球,直徑lnm至100um的人工高分子小球,帶有表面修飾的娃片或其他生物 芯片。
[0025] 進(jìn)一步,本發(fā)明的DNA5-甲基胞嘧啶與5-羥甲基胞嘧啶基因圖譜測序方法,還可以 具有這樣的特征:在步驟(5)中,在固相上擴(kuò)增采用直接在固相上經(jīng)1-40個PCR循環(huán)擴(kuò)增得 到合格的測序文庫,或經(jīng)1-40個PCR循環(huán)擴(kuò)增后分離固液相再經(jīng)1-40個PCR循環(huán)擴(kuò)增得到合 格的測序文庫。
[0026] 上述步驟(1)中,DNA片段的體液來源指來自于又不限于血液、尿液、汗液、痰液、糞 便、腦脊液、腹水、胸水、膽汁、胰腺液等人體體液。
[0027] 上述步驟(1)中,組織、細(xì)胞及細(xì)胞器指來自于又不限于活體組織、培養(yǎng)細(xì)胞、脫落 細(xì)胞、血液循環(huán)細(xì)胞、手術(shù)中沖洗下的細(xì)胞等。
[0028] 上述步驟(1)中,提DNA片段或完整的基因組DNA的方法包括常用的純化方法或商 業(yè)化的純化試劑盒。方法中包括但不受限于:使用氯仿-苯酚萃取,Proteinase K消解,硅膠 膜離心柱法,磁珠法,乙醇、異丙醇沉淀等技術(shù)中的一項或多項組合。純化試劑盒包括但不 受限于:QIAamp fast DNA tissue kit(Qiagen) ,ZR Genomic DNA-Tissue Kits(Zymo)。
[0029] 上述步驟(1)中,機(jī)械力包括但不限于劇烈震蕩、超聲等技術(shù)。消化酶包括但不限 于NEBNext dsDNAFragmentase(NEB)〇
[0030] 上述步驟(2)中的DNA片段修復(fù)是指修復(fù)DNA片段中的堿基損壞,并將DNA雙鏈的5 ' 及3'補(bǔ)齊成平末端。DNA的片段與測序接頭引物的連接方法包括但不限于:i)平末端連接; ii)在DNA片段的3'端末尾增加一至多個dA,利用接頭引物中相對應(yīng)的dT進(jìn)行連接。修復(fù)與 連接中涉及的酶包括但不限于T4 polymerase,T4 Kinase,Klenow exo-中的一種或其組 合。修復(fù)與連接也可以使用商業(yè)化的試劑盒,包括但不限于TruSeq Nano DNA Library Prep Kit(11 lumina) ,Kapa Hyper Prep Kit(Kapa), NEBNext? DNALibrary Prep Master Mix Set(NEB)。
[0031] 上述步驟(3)中,使用的化學(xué)生物學(xué)標(biāo)記方法指:標(biāo)記5-羥甲基胞嘧啶的步驟為i) 利用轉(zhuǎn)糖酶將帶有疊氮基團(tuán)修飾的糖共價連接到5-輕甲基胞啼啶的輕甲基上,見下面反應(yīng) 式,連接底物為UDP-6-N3-Glucose。
[0032] 12 5-?甲基胞嘧啶共價標(biāo)記反應(yīng)
2 轉(zhuǎn)糖酶包括但不限于T4 bacteriophage enzymeP-glucosyltransferase、T4 bacteriophage enzymea-glucosyltransferase及其衍生物,類似物,或重組酶。疊氮基團(tuán) 修飾的糖包括但不限于6-N3-葡萄糖或其他化學(xué)修飾包括但不限于羰基,巰基,羥基,羧 基,碳-碳雙鍵,碳-碳三鍵,二硫鍵,胺基,酰胺基,雙烯)的糖類。i i)將直接或間接連有生物 素 (biotin)的點(diǎn)擊化學(xué)底物或相應(yīng)的化學(xué)反應(yīng)底物與疊氮糖修飾的或者其它化學(xué)修飾的 5_羥甲基胞嘧啶反應(yīng)。
[0035]反應(yīng)基團(tuán)包括但不限于以下含三鍵的化合物:
[0036]
[0037] 間接連接生物素的化學(xué)基團(tuán)及反應(yīng)包括但不限于:羰基,巰基,羥基,羧基,碳-碳 雙鍵,碳-碳三鍵,二硫鍵,胺基,酰胺基,雙烯。
[0038] 標(biāo)記甲基胞嘧啶的步驟為i)利用利用轉(zhuǎn)糖酶將不帶有下一步反應(yīng)修飾基團(tuán)修飾 的糖共價連接到5-羥甲基胞嘧啶的羥甲基上,用于掩蔽相對于5-甲基胞嘧啶含量較低的5-輕甲基胞啼啶ii)利用ten-eleven translocation(TET)氧化酶或其衍生物、類似物、重組 酶將5-甲基胞嘧啶
[0039]
1234567 氧化為5-羥甲基胞嘧啶(見5-甲基胞嘧啶氧化反應(yīng)的反應(yīng)式)同上文所述將5-羥 甲基胞嘧啶進(jìn)行生物素標(biāo)記。 2 上述5-羥甲基胞嘧啶和5-甲基胞嘧啶的標(biāo)記步驟可以按順序進(jìn)行也可以在一個 反應(yīng)中同時進(jìn)行。 3 上述步驟(4)中,所使用的固相為