R擴(kuò)增之前和之后所述生物分析儀曲線圖中缺乏特異性DNA2峰所表明。
[0026]圖6示出通過(guò)將酵母基因組DNA應(yīng)用作為使用RePro的載體,對(duì)來(lái)自500個(gè)胚胎干細(xì)胞(ESC)進(jìn)行的ChlP-Seq。圖6A示出示出H3K4me3在來(lái)自107、2000、或500個(gè)ESC上的富集的熱圖。每條線表示一個(gè)基因。該熱圖根據(jù)17個(gè)細(xì)胞樣本中的H3K4me3富集來(lái)劃分等級(jí)。圖6B示出等值線圖,該等值線圖示出在不同測(cè)序深度下,17個(gè)細(xì)胞樣本與2000個(gè)細(xì)胞或500個(gè)細(xì)胞樣本之間,啟動(dòng)子上H3K4me3富集的相關(guān)性。每個(gè)點(diǎn)表示一個(gè)基因。相關(guān)系數(shù)為斯皮爾曼相關(guān)性。圖6C和圖6D以沿染色體17的放大圖(C)和縮小圖(D)示出出H3K4me3在500個(gè)細(xì)胞、2000個(gè)細(xì)胞或17個(gè)細(xì)胞樣本中的ChIP-Seq富集的基因組視圖。峰高度對(duì)應(yīng)于在沿染色體每10bp滑動(dòng)的500bp窗口中計(jì)算的RPKM(每百萬(wàn)讀數(shù)每千堿基讀數(shù))值。
[0027]圖7示出使用三倍歸一化法對(duì)RNA-Seq讀數(shù)的恰當(dāng)處理。將具有已知比率和已知序列的DNA和RNA混合物摻入細(xì)胞的樣本中。使用標(biāo)準(zhǔn)方案執(zhí)行DNA和RNA分離和測(cè)序。DNA-Seq要求檢測(cè)該基因組DNA的一小部分和摻雜(spiked-1n) DNA讀數(shù),因此僅需要極低測(cè)序深度。遵循該標(biāo)準(zhǔn)程序的RNASeq將得到針對(duì)來(lái)自細(xì)胞的RNA和摻雜RNA的讀數(shù)。三倍歸一化方案表明允許精確測(cè)定細(xì)胞RNA讀數(shù),而無(wú)需預(yù)先知曉所用細(xì)胞數(shù)目。
[0028]圖8示出三倍歸一化法的應(yīng)用,其用于恰當(dāng)量化在ESC中通過(guò)Myc抑制劑進(jìn)行的轉(zhuǎn)錄抑制。熱圖示出基于不同歸一化策略的RNASeq折疊改變分析。TMM歸一化(edgeR軟件包中通常使用的歸一化)是基于一種假設(shè),即大多數(shù)基因的表達(dá)在不同樣本之間保持不變,這在諸如Myc的轉(zhuǎn)錄因子受到抑制的情況下是不正確的。雙倍歸一化是使用摻雜RNA的讀數(shù)和來(lái)自樣本基因組DNA的總讀數(shù)的歸一化。為DNA-Seq加載從不同樣本制備的相同百分比的DNAο雖然針對(duì)細(xì)胞基因組DNA的歸一化規(guī)避了細(xì)胞數(shù)量計(jì)數(shù)的需要,但該雙倍歸一化未能避免在文庫(kù)預(yù)備和測(cè)序期間引入變異。三倍歸一化是本專利中所述的標(biāo)準(zhǔn)程序,如上文圖6所示。僅該三倍歸一化法如實(shí)地演示在ESC中由Myc抑制劑(10058-F4)導(dǎo)致的全面轉(zhuǎn)錄抑制,而無(wú)需預(yù)先知曉樣本中的細(xì)胞數(shù)量。
[0029]圖9示出對(duì)切割小鼠晶狀體上皮細(xì)胞的分析以說(shuō)明本發(fā)明的應(yīng)用。繪制草圖來(lái)展示具有晶狀體上皮細(xì)胞的眼睛,所述晶狀體上皮細(xì)胞提供晶狀體纖維并且調(diào)控晶狀體在整個(gè)哺乳動(dòng)物生命中的體內(nèi)穩(wěn)態(tài)。諸如白內(nèi)障之類眼睛疾病大部分與年齡相關(guān),可由晶狀體上皮細(xì)胞的老化相關(guān)改變所引起。表觀遺傳信息(諸如H3K4me3修飾的狀態(tài))將不僅闡明哪個(gè)已知路徑(諸如電解質(zhì)體內(nèi)穩(wěn)態(tài)、細(xì)胞凋亡和細(xì)胞增殖)對(duì)老化敏感,而且將揭露有助于眼睛疾病的新路徑。
[0030]圖10示出表明RePro允許對(duì)從切割自單個(gè)年輕或老年小鼠眼睛的幾個(gè)晶狀體上皮細(xì)胞的H3K4me3進(jìn)行高質(zhì)量定位的圖解。圖1OA示出展示H3K4me3在來(lái)自年輕小鼠(出生后第30天,P30)和老年小鼠(P800)的晶狀體樣本的基因啟動(dòng)子上富集的熱圖。每條線表示一個(gè)基因。該熱圖根據(jù)在P30樣本中的H3K4me3富集來(lái)劃分等級(jí)。圖1OB示出等值線圖,該等值線圖示出在啟動(dòng)子上H3K4me3富集于P30小鼠和P800小鼠的晶狀體樣本之間的良好全面相關(guān)性。每個(gè)點(diǎn)表示一個(gè)基因。相關(guān)系數(shù)為斯皮爾曼相關(guān)性。
[0031]圖11示出在老化晶狀體上皮細(xì)胞中對(duì)老化相關(guān)表觀遺傳改變的鑒別。雖然全面表觀遺傳圖譜是類似的,但高質(zhì)量H3K4me3 ChIP-Seq允許定位特異性基因處的顯著H3K4me3修飾改變。示出了顯示H3K4me3修飾顯著損失或增加的在指定功能群中的基因。
[0032]圖12示出演示所細(xì)胞數(shù)量的模擬的實(shí)例,以便獲得使用RePro和RePam-ChlP-seq的最佳結(jié)果。
[0033]圖 13 不出 RePro-ChlP-seq、LinDA-ChlP-seq 和 Nano-ChlP-seq 之間的比較。
[0034]定義
[0035]為方便起見(jiàn),說(shuō)明書(shū)、實(shí)施例和隨附權(quán)利要求書(shū)中所用的某些術(shù)語(yǔ)和短語(yǔ)的含義提供如下。
[0036]如本文所用,術(shù)語(yǔ)“小數(shù)量細(xì)胞”是指I至100,000個(gè)細(xì)胞。在某些實(shí)施方案中,該術(shù)語(yǔ)用于指I至20,000個(gè)細(xì)胞、或I至10,000個(gè)細(xì)胞、或I至5,000個(gè)細(xì)胞。
[0037]如本文所用,術(shù)語(yǔ)“RePro”或“經(jīng)由保護(hù)來(lái)回收”是指一種方法,其中載體DNA和樣本DNA兩者皆擴(kuò)增(無(wú)偏向),這需要增加測(cè)序深度。
[0038]如本文所用,術(shù)語(yǔ)“RePam”或“經(jīng)由保護(hù)和擴(kuò)增來(lái)回收”是指一種方法,其中將特異性載體DNA (本文稱為DNA2)用于抑制載體DNA的擴(kuò)增,同時(shí)允許所關(guān)注DNA的擴(kuò)增。該有偏向擴(kuò)增降低所需的測(cè)序深度。
[0039]如本文所用,術(shù)語(yǔ)“DNA1 ”是指5’生物素化載體DNA。
[0040]如本文所用,術(shù)語(yǔ)“DNA2”是指還在兩端皆含有額外5’懸突和3’間隔物3修飾的5’生物素化載體DNA。該末端結(jié)構(gòu)對(duì)DNA聚合酶填充所述懸突進(jìn)行阻斷,因此用于PCR的銜接子DNA不能連接這些末端,并且不能發(fā)生擴(kuò)增。
[0041]如本文所用,術(shù)語(yǔ)"表觀遺傳"在本文中是指DNA關(guān)于功能改變而非核苷酸序列改變的狀態(tài)或狀況。此類改變?cè)诒绢I(lǐng)域中稱為“表觀遺傳性修飾”,并且往往導(dǎo)致基因的表達(dá)或沉默。表觀遺傳改變或標(biāo)志(其可由樣本中DNA的修飾所導(dǎo)致)的實(shí)例或與其相關(guān)蛋白質(zhì)(其可使用根據(jù)本發(fā)明的方法分析)的實(shí)例包括但不限于組蛋白蛋白質(zhì)修飾、非組蛋白蛋白質(zhì)修飾和DNA甲基化。
[0042]如本文所用,術(shù)語(yǔ)"表觀遺傳分析"是指確定DNA的狀態(tài)或狀況,和其在分析物樣本中與特異性蛋白質(zhì)和其修飾同種型的相互作用,并且涉及分析或檢測(cè)分析物生物樣本中的表觀遺傳標(biāo)志。
[0043]如本文所用,術(shù)語(yǔ)"染色質(zhì)免疫沉淀法"也將是熟練技術(shù)人員已知的,并且包括以下三個(gè)步驟從細(xì)胞中分離待分析的染色質(zhì);(ii)使用抗體對(duì)染色質(zhì)進(jìn)行免疫沉淀法;以及(iii)DNA分析。經(jīng)受染色質(zhì)免疫沉淀法的分析物生物樣本可包含染色質(zhì)。染色質(zhì)是染色體的物質(zhì)且在真核細(xì)胞內(nèi)包括DNA和蛋白質(zhì)(主要是組蛋白)的復(fù)合物,并且是基因在遺傳上的載體。染色質(zhì)一般以具有不同著色性質(zhì)的兩種狀態(tài)存在,即常染色質(zhì)和異染色質(zhì),并且在細(xì)胞分裂期間,染色質(zhì)盤(pán)繞并折疊而形成中期染色體。因此,分析物生物樣本包括核酸,諸如但不限于DNA,以及任何相關(guān)蛋白質(zhì)。
[0044]分析的染色質(zhì)可以但不必得自至少一個(gè)細(xì)胞。因此,在一個(gè)實(shí)施方案中,生物樣本包括至少一個(gè)細(xì)胞。該細(xì)胞可來(lái)源于組織樣本。在某些實(shí)例中,該細(xì)胞來(lái)源于活性有機(jī)體,并在體外培養(yǎng)中未永生化或繁殖。在某些實(shí)施方案中,分析物生物樣本包括哺乳動(dòng)物細(xì)胞。在特定實(shí)施方案中,分析物生物樣本包括人類或小鼠細(xì)胞。
[0045]如本文所用,術(shù)語(yǔ)“合適引物”是指可以用于種特異性PCR的所選引物,S卩,該引物可以用于使僅來(lái)自分析物生物樣本而非來(lái)自載體DNA的一段核酸擴(kuò)增的PCR。與合適引物的設(shè)計(jì)有關(guān)的其他信息在隨附實(shí)施例中提供。
[0046]如本文所用,術(shù)語(yǔ)“阻斷引物”是指與DNAl的末端互補(bǔ)的DNA序列。通過(guò)在RePro期間退火至DNA1,阻斷引物阻止DNAl的PCR擴(kuò)增。
[0047]如本文所用,術(shù)語(yǔ)“表觀遺傳標(biāo)記”是指具體細(xì)胞類型的細(xì)胞的任何表現(xiàn)或表現(xiàn)型,其被認(rèn)為來(lái)源于或可能歸結(jié)于此類細(xì)胞的染色質(zhì)結(jié)構(gòu)(即由表觀遺傳修飾決定)。
[0048]如本文所用,術(shù)語(yǔ)“3’間隔物3”是指用于將短間隔臂摻入低聚核苷酸中的三碳間隔物。如果需要較長(zhǎng)間隔物,則可將3’間隔物3納入一次或多次連續(xù)添加中。
[0049]如本文所用,術(shù)語(yǔ)“所關(guān)注細(xì)胞”是指含有將使用本文所述ChlP-seq方法進(jìn)行測(cè)序的DNA的細(xì)胞。
[0050]如本文所用,術(shù)語(yǔ)“增量細(xì)胞”是指在ChlP-seq測(cè)定期間將細(xì)胞(例如酵母或大腸桿菌細(xì)胞)加入所關(guān)注細(xì)胞。特定而言,在ChIP測(cè)定中超聲處理和染色質(zhì)斷裂之前,將增量細(xì)胞加入所關(guān)注細(xì)胞。
[0051]如本文所用,術(shù)語(yǔ)“特異性結(jié)合DNA的藥劑”是指結(jié)合所關(guān)注DNA的任何生物學(xué)或化學(xué)部分。特定而言,如本文所用,所關(guān)注DNA為使用本文公開(kāi)的ChlP-seq方法進(jìn)行測(cè)序的 DNA。
[0052]如本文所用,術(shù)語(yǔ)“分析物生物樣本”和“所關(guān)注DNA”是指經(jīng)受研究的DNA。換句話說(shuō),所述術(shù)語(yǔ)是指針對(duì)表觀遺傳修飾、表觀遺傳標(biāo)記和DNA測(cè)序進(jìn)行分析的DNA。
[0053]如本文所用,術(shù)語(yǔ)“染色質(zhì)免疫沉淀法”和“ChIP” 一般指包括以下步驟的方法:
(I)從細(xì)胞中分離待分析的染色質(zhì);(2)使用抗體對(duì)染色質(zhì)進(jìn)行免疫沉淀法;以及(3)DNA分析。
[0054]如本文所用,術(shù)語(yǔ)“染色質(zhì)”是指染色體的物質(zhì),并且在真核細(xì)胞中由DNA和蛋白質(zhì)(主要是組蛋白)的復(fù)合物組成,并且是基因在遺傳上的載體。染色質(zhì)一般以具有不同著色性質(zhì)的兩種狀態(tài)存在,即常染色質(zhì)和異染色質(zhì),并且在細(xì)胞分裂期間,染色質(zhì)盤(pán)繞并折疊而形成中期染色體。
[0055]如本文所用,術(shù)語(yǔ)“載體DNA”是指被添加以充當(dāng)增量劑的DNA。
[0056]發(fā)明詳述
[0057]引言
[0058]在純細(xì)胞群中執(zhí)行轉(zhuǎn)錄因子結(jié)合和表觀遺傳修飾的全基因組定位的能力在基礎(chǔ)性和轉(zhuǎn)化性研究中是關(guān)鍵性的。然而,因?yàn)槿旧|(zhì)免疫沉淀法(ChIP)繼以大規(guī)模平行測(cè)序(ChlP-seq)需要多步驟操作,所以大規(guī)模DNA損失使得不可能使用小數(shù)量細(xì)胞來(lái)執(zhí)行ChlP-seq。目前,可靠的ChlP-seq實(shí)驗(yàn)需要大約50ng的自ChIP回收的DNA,這一般需要至少16個(gè)細(xì)胞。因此,尚不可能使用有限數(shù)量的細(xì)胞(例如,來(lái)自胚胎的細(xì)胞、來(lái)自活檢的細(xì)胞、或來(lái)自眼晶體的細(xì)胞)獲得用于基礎(chǔ)研究和臨床研究的可靠的全基因組轉(zhuǎn)錄因子/染色質(zhì)蛋白結(jié)合或表觀遺傳信息。
[0059]已研發(fā)兩種最新方法來(lái)克服與ChIP有關(guān)的對(duì)表觀遺傳修飾進(jìn)行基因組定位的困難。這兩種方法依靠?jī)?yōu)化ChIP和改良DNA擴(kuò)增程序來(lái)產(chǎn)生用于測(cè)序的足夠量的DNA。所述方法中的第一個(gè)方法據(jù)報(bào)道有能力執(zhí)行10,000-20, 000的ChIP_seq(Adli等人)。然而,Adli等人進(jìn)行的應(yīng)用有限,因?yàn)槠湫枰獛兹f(wàn)個(gè)細(xì)胞并且因過(guò)度DNA擴(kuò)增而引入了偏向性。第二個(gè)方法旨在通過(guò)使用基于T7RNA聚合酶的線性DNA擴(kuò)增(稱為L(zhǎng)inDA)來(lái)減少DNA擴(kuò)增中的偏向性(Shankarananarayanan,2011及2012)。雖然LinDA方法報(bào)道了對(duì)來(lái)自少至5,OOO個(gè)細(xì)胞的位點(diǎn)的全面定位,但結(jié)果是不一致的。此外,5,000個(gè)細(xì)胞的所報(bào)道下限對(duì)ChlP-seq而言仍過(guò)大,該ChlP-seq是在一個(gè)至幾千個(gè)細(xì)胞范圍內(nèi),例如20至100個(gè)細(xì)胞。
[0060]當(dāng)存在有限數(shù)量的細(xì)胞(例如,一個(gè)至幾千個(gè)細(xì)胞)時(shí)存在的防礙使用ChlP-seq的主要問(wèn)題之一為