国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      使用核酸陣列分析甲基化狀態(tài)的制作方法

      文檔序號:427158閱讀:453來源:國知局
      專利名稱:使用核酸陣列分析甲基化狀態(tài)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及擴(kuò)增樣品以保存后生信息的方法以及使用核酸陣列檢測甲基化的方法。
      背景技術(shù)
      高等真核生物的基因組含有修飾的核苷5-甲基胞嘧啶(5-meC)。該修飾通常作為二核苷酸CpG的一部分。將胞嘧啶轉(zhuǎn)化為5-甲基胞嘧啶的反應(yīng)包括將完整雙螺旋中的靶胞嘧啶翻轉(zhuǎn)出來,然后通過甲基轉(zhuǎn)移酶從S-腺苷甲硫氨酸中轉(zhuǎn)移甲基基團(tuán)(Klimasauskas等,Cell76357-369,1994)。這個(gè)酶促轉(zhuǎn)化反應(yīng)是已知的脊椎動物中存在的唯一后生的DNA修飾,對于正常的胚胎發(fā)育是必要的(Bird,Cell 705-8,1992;Laird和Jaenisch,Human Mol.Genet.31487-1495,1994;以及Li等,Cell 69915-926,1992)。
      CpG二核苷酸在人類基因組中的出現(xiàn)頻率僅僅是統(tǒng)計(jì)預(yù)期頻率的大約20%,這可能是因?yàn)?-甲基胞嘧啶到胸腺嘧啶的自發(fā)脫氨基作用(Schoreret等,Proc.Natl.Acad Sci.USA 89957-961,1992)。CpG以大約是預(yù)期的頻率水平出現(xiàn)的區(qū)域被稱為“CpG島”(Bird,A.P.(1986)Nature 321,209-213)。這些區(qū)域占脊椎動物基因組的大約1%,占總的CpG二核苷酸數(shù)量的大約15%。CpG島的長度一般在0.2到1kb之間,并位于許多看家基因和組織特異性基因的上游。CpG島通常位于被轉(zhuǎn)錄區(qū)域的上游,但是也可能延伸到被轉(zhuǎn)錄區(qū)域內(nèi)。大約2-4%的位于鳥嘌呤5’端的胞嘧啶是甲基化的。
      DNA甲基化是基因表達(dá)的后生決定因素。CpG甲基化的模式是可遺傳和組織特異性的,并與基因表達(dá)相關(guān)。DNA甲基化也與其它的細(xì)胞過程相關(guān),這些過程包括染色質(zhì)結(jié)構(gòu)、基因組印記、雌性中體細(xì)胞X染色體的失活和DNA復(fù)制的定時(shí)。當(dāng)基因高度甲基化時(shí),它被表達(dá)的可能性降低,這可能是因?yàn)镃pG甲基化阻止了轉(zhuǎn)錄因子識別它們的同源結(jié)合位點(diǎn)。與甲基化DNA結(jié)合的蛋白也可以召集組蛋白脫乙酰酶以縮合臨近的染色質(zhì)。一般來說,無轉(zhuǎn)錄活性的基因含有5-甲基胞嘧啶,而有轉(zhuǎn)錄活性的基因不含5-甲基胞嘧啶。因此,鑒別基因組中含有5-甲基胞嘧啶的位點(diǎn),對于理解在正常發(fā)育和疾病例如癌癥的過程中,基因表達(dá)的細(xì)胞類型特異性程序以及基因表達(dá)圖如何改變都是非常重要的。CpG島中DNA甲基化模式的精確作圖,對于理解多種多樣的生物過程,例如印記基因的調(diào)控,X染色體的失活,以及在人類癌癥中由甲基化增加而引起的腫瘤抑制基因的沉默,已經(jīng)變得非常重要了。
      胞嘧啶的甲基化可以降低基因的表達(dá),這可以通過例如破壞局部的染色質(zhì)結(jié)構(gòu),抑制轉(zhuǎn)錄因子與DNA的結(jié)合,或者通過召集能夠與甲基化序列發(fā)生特異性相互作用并阻止轉(zhuǎn)錄因子結(jié)合的蛋白來進(jìn)行。甲基化模式的改變已顯示與癌癥相關(guān)。腫瘤抑制基因啟動子中的CpG寡聚核苷酸的甲基化可以導(dǎo)致它們的失活。正常甲基化過程的改變也已顯示與基因組不穩(wěn)定性有關(guān)(Lengauer等Proc.Natl.Acad.Sci.USA942545-2550,1997)。這種異常的后生性改變可以在許多類型的癌癥中發(fā)現(xiàn),并能用作致癌轉(zhuǎn)化的潛在標(biāo)記。
      在本公開中引用的所有文件,即出版物和專利申請,包括上述引用文件,在此為所有的目的以其全文引為參考,其程度如同每個(gè)單獨(dú)的文件被特定和分別地指明在此以其全文引為參考。
      發(fā)明概述本發(fā)明的一個(gè)方面公開了一種擴(kuò)增基因組DNA的方法,它拷貝了胞嘧啶的甲基化。甲基化的基因組DNA樣品被獲得后,使用酶法延伸與DNA雜交的引物來擴(kuò)增,引物可以是隨機(jī)序列,也可以是位點(diǎn)特異性的。引物與甲基化的DNA雜交,并使用DNA聚合酶進(jìn)行延伸,從而產(chǎn)生半甲基化的雜交體,它包括新合成的未甲基化的cDNA鏈和甲基化的模板鏈。然后可以用DNA甲基轉(zhuǎn)移酶在存在甲基供體的情況下對半甲基化的雜交體進(jìn)行處理。DNA甲基轉(zhuǎn)移酶可以對雙鏈DNA中的半甲基化位點(diǎn)進(jìn)行甲基化,產(chǎn)生甲基化的雜交體,它包括新的甲基化的cDNA和甲基化的模板鏈。甲基化的雜交體可以被變性,然后如上述再次擴(kuò)增。獲得的產(chǎn)物是擴(kuò)增的甲基化的樣品。擴(kuò)增的甲基化的樣品可以被直接分析以檢測甲基化的和未甲基化的胞嘧啶。
      DNA聚合酶可以是熱穩(wěn)定的聚合酶或鏈置換聚合酶,例如phi29。在有些方面,DNA甲基轉(zhuǎn)移酶活性包括Dnmt 1酶,其可以是例如人類或小鼠的Dnmt 1,并且可以從生物來源純化,也可以是重組蛋白或融合蛋白。Dnmt 1活性可以是人類或小鼠的Dnmt 1的變體形式,與天然酶相比增加了對半甲基化DNA的特異性。在優(yōu)選情況下,甲基供體是S-腺苷甲硫氨酸。
      在一個(gè)方面,按照上述方法擴(kuò)增的DNA可以用甲基化特異的限制性酶處理以檢測選定的胞嘧啶的甲基化情況。擴(kuò)增的甲基化的DNA可以用第一種限制性酶片段化,然后可以給片段連接上接頭。與接頭連接的片段的等分試樣可以平行地采用對甲基化具有不同敏感性的同裂酶進(jìn)行片段化,例如一種酶對甲基化敏感而另一種酶對甲基化不敏感,或者一種酶是甲基化依賴性的而另一種酶是甲基化不敏感的或甲基化敏感的。在與接頭連接的片段被片段化后,片段可以用接頭序列的引物進(jìn)行擴(kuò)增。在接頭之間被切開的片段將不能被擴(kuò)增。擴(kuò)增的片段可以被標(biāo)記,并與檢測是否存在不同片段的陣列雜交??梢詫﹄s交模式進(jìn)行分析以確定哪個(gè)片段被擴(kuò)增了以及哪個(gè)片段被切開了從而沒有被有效地?cái)U(kuò)增。擴(kuò)增可以使用任何引物介導(dǎo)的延伸方法,例如PCR或MDA。
      在一個(gè)方面,按照上述方法擴(kuò)增DNA樣品,然后使用一種將擴(kuò)增樣品中未甲基化的胞嘧啶轉(zhuǎn)化為尿嘧啶但是對甲基化的胞嘧啶不進(jìn)行修飾的方法來分析胞嘧啶的甲基化。接著通過測定產(chǎn)物在目的位置處的序列來確定特定胞嘧啶的甲基化。如果它仍然是胞嘧啶,它就被甲基化了,而如果它現(xiàn)在是尿嘧啶,它就沒有被甲基化。轉(zhuǎn)化的方法包括化學(xué)和酶學(xué)的方法,或二者的組合。檢測可以通過與探針陣列的雜交。探針可以被設(shè)計(jì)以查詢選定的胞嘧啶。
      在有些方面,使用了針對5-甲基胞嘧啶的抗體或針對與5-甲基胞嘧啶選擇性結(jié)合的蛋白的抗體。樣品中的甲基化DNA可以通過免疫學(xué)的方法富集,例如用針對5-甲基胞嘧啶的抗體或與5-甲基胞嘧啶結(jié)合的蛋白和針對該蛋白的抗體進(jìn)行免疫沉淀。
      在一個(gè)方面,探針陣列包括針對預(yù)計(jì)的片段的探針。生物體的基因組可以通過計(jì)算機(jī)模擬(in silico)消化進(jìn)行分析以預(yù)測限制性片段的大小和序列,并鑒定具有CpG的片段。在陣列上可以包括針對目的片段的探針。在設(shè)計(jì)陣列時(shí)也可以把擴(kuò)增方法考慮在內(nèi)。例如,接頭介導(dǎo)的PCR擴(kuò)增一般來說對大約200到2000堿基對的片段擴(kuò)增最為有效,所以在這個(gè)大小范圍內(nèi)的片段可以作為探針的靶。依賴于被比較的酶的組合可以確定片段中的甲基化。例如,如果在已經(jīng)用甲基化依賴性的酶消化的樣品中存在含有相應(yīng)限制性位點(diǎn)的片段,該片段極可能沒有被甲基化。HpaII和MspI是一對對甲基化具有不同敏感性的同裂酶的例子,而McrBC是一種甲基化依賴性的酶。
      在一個(gè)方面,公開了按照本發(fā)明的方法設(shè)計(jì)的陣列。陣列可以在固相支持物上已知的或可確定的位置處存在超過1,000,000、2,000,000或5,000,000個(gè)不同的探針。陣列中的探針可以被設(shè)計(jì)用來檢測在按照本發(fā)明的方法擴(kuò)增和處理后,在樣品中預(yù)計(jì)會存在的片段。
      按照本發(fā)明的方法擴(kuò)增的基因組樣品可以被分析,以確定樣品中一個(gè)或多個(gè)CpG位點(diǎn)的甲基化狀態(tài)??梢允褂玫姆椒ò▉喠蛩釟溻c處理,然后檢測沒有被處理所修飾仍然保留為C/G堿基對的甲基化的位點(diǎn),以及未被甲基化但被處理所修飾從而導(dǎo)致引入了A/T堿基對的位點(diǎn)。C/G或A/T堿基對的存在可以通過與探針陣列的雜交來檢測,該陣列的探針與帶有或不帶有由亞硫酸氫鈉處理引入的變化的含CpG的區(qū)域完全互補(bǔ)。A/T或C/G的檢測以類似于SNP的等位基因特異性雜交檢測的方式進(jìn)行。
      在另一方面,本方面公開了一種通過用甲基化依賴性的核酸內(nèi)切酶將樣品片段化從而減少復(fù)雜性的方法。樣品用其切割不依賴于甲基化的限制性酶進(jìn)行片段化,然后給片段連接上接頭。連接了接頭的片段再用甲基化依賴性的酶進(jìn)行消化,對甲基化依賴性的核酸內(nèi)切酶的消化具有抗性的那部分片段被擴(kuò)增。擴(kuò)增的片段可以與陣列雜交以產(chǎn)生表明了該樣品甲基化狀態(tài)的特征的雜交圖。來自血液、組織和腫瘤的樣品可以被分析以產(chǎn)生雜交圖。這樣產(chǎn)生的雜交圖可以與從已知樣品同樣產(chǎn)生的雜交圖進(jìn)行比較。通過對雜交圖的比較可以對未知樣品進(jìn)行分類。
      發(fā)明詳述a)總則本發(fā)明有許多優(yōu)選實(shí)施方案,在細(xì)節(jié)方面正如本領(lǐng)域的專業(yè)人員所知依賴于許多專利、申請或其它參考文獻(xiàn)。因此,當(dāng)在下文中引用或重復(fù)專利、申請或其它參考文獻(xiàn)時(shí),應(yīng)該理解它為所有的目的以及被重新引用的命題而以其全部引為參考。
      除非上下文中有清楚的說明,用于本申請中的單數(shù)形式“一個(gè)”,“一種”和“該”包括了復(fù)數(shù)的指稱。例如術(shù)語“一種試劑”包括多種試劑,還包括其混合物。
      個(gè)體不限于人,也可以是其它的生物體,包括但不限于哺乳動物、植物、細(xì)菌或來自上述任何生物體的細(xì)胞。
      貫穿本申請,本發(fā)明的各個(gè)方面以范圍的形式加以陳述。應(yīng)該理解以范圍的形式進(jìn)行的描述僅僅是為了方便和簡便,不應(yīng)該被解釋為對發(fā)明范圍的硬性限制。因此,范圍的描述應(yīng)該被視為特異性地公開了所有可能的子范圍,以及范圍內(nèi)所有單個(gè)數(shù)值。例如,對范圍的描述,從1到6應(yīng)該被視為特異性地公開了子范圍,例如從1到3、從1到4、從1到5、從2到4、從2到6、從3到6等,以及該范圍內(nèi)單個(gè)數(shù)值,例如1、2、3、4、5和6。不論范圍有多寬都是這樣。
      除非特別地說明,本發(fā)明的實(shí)施都可以使用本領(lǐng)域技術(shù)范圍內(nèi)的有機(jī)化學(xué)、聚合物技術(shù)、分子生物學(xué)(包括重組技術(shù))、細(xì)胞生物學(xué)、生物化學(xué)和免疫學(xué)常規(guī)技術(shù)和描述。這樣的常規(guī)技術(shù)包括聚合物陣列合成、雜交、連接和使用標(biāo)記物檢測雜交。適當(dāng)技術(shù)的特別的說明可以參考下面的事實(shí)例。但是,其它等同的常規(guī)步驟當(dāng)然也可以使用。這些常規(guī)的技術(shù)和描述可以在標(biāo)準(zhǔn)的實(shí)驗(yàn)室手冊中發(fā)現(xiàn),例如GenomeAnalysisA Laboratory Manual Series(Vols.I-IV)(基因組分析實(shí)驗(yàn)室手冊叢書,第1-4卷),Using AntibodiesA Laboratory Manual(使用抗體實(shí)驗(yàn)室手冊),CellsA Laboratory Manual(細(xì)胞實(shí)驗(yàn)室手冊),PCR PrimerA Laboratory Manual(PCR引物實(shí)驗(yàn)室手冊)以及Molecular CloningA Laboratory Manual(分子克隆實(shí)驗(yàn)指南)(都來自冷泉港實(shí)驗(yàn)室出版社),Stryer,L.(1995)主編Biochemistry(4th Ed.)(生物化學(xué),第4版)Freeman,New York,Gait,″OligonucleotideSynthesisA Practical Approach″(寡聚核苷酸合成實(shí)用方法)1984,IRL Press,London,Nelson and Cox(2000),Lehninger,Principles ofBiochemistry 3rdEd.(生物化學(xué)原理,第3版),W.H.Freeman Pub.,NewYork,NY以及Berg等(2002)Biochemistry,5thEd.(生物化學(xué),第5版),W.H.Freeman Pub.,New York,NY,所有這些在此為所有目的以其全文引為參考。
      本發(fā)明可以使用固相基底,包括在一些優(yōu)選實(shí)施方案中的陣列??捎糜诰酆衔?包括蛋白)陣列合成的方法和技術(shù)已經(jīng)在下列專利中描述了,包括美國系列號09/536,841、WO 00/58516、美國專利Nos.5,143,854、5,242,974、5,252,743、5,324,633、5,384,261、5,405,783、5,424,186、5,451,683、5,482,867、5,491,074、5,527,681、5,550,215、5,571,639、5,578,832、5,593,839、5,599,695、5,624,711、5,631,734、5,795,716、5,831,070、5,837,832、5,856,101、5,858,659、5,936,324、5,968,740、5,974,164、5,981,185、5,981,956、6,025,601、6,033,860、6,040,193、6,090,555、6,136,269、6,269,846和6,428,752,以及PCT申請?zhí)朠CT/US99/00730(國際公布號WO 99/36760)和PCT/US01/04285(國際公布號WO 01/58593),在此為所有目的以其全文引為參考。
      在特定的實(shí)施方案中描述合成技術(shù)的專利包括美國專利Nos.5,412,087、6,147,205、6,262,216、6,310,189、5,889,165和5,959,098。在許多上述專利中也描述了核酸陣列,但是同樣的技術(shù)也可用于多肽陣列。
      用于本發(fā)明的核酸陣列包括那些可以從Affymetrix公司(SantaClara,CA)購買到的商標(biāo)名為GeneChip的產(chǎn)品。示例的陣列顯示在affymetrix.com的網(wǎng)點(diǎn)上。
      本發(fā)明也考慮了結(jié)合到固相基底上的聚合物的許多應(yīng)用。這些應(yīng)用包括基因表達(dá)監(jiān)控、分布、文庫篩選、基因分型和診斷。基因表達(dá)監(jiān)控和分布的方法示于美國專利Nos.5,800,992、6,013,449、6,020,135、6,033,860、6,040,138、6,177,248和6,309,822中?;蚍中图捌鋺?yīng)用示于美國系列號10/442,021、10/013,598(美國專利申請公布號20030036069),以及美國專利Nos.5,856,092、6,300,063、5,858,659、6,284,460、6,361,947、6,368,799和6,333,179中。其它的應(yīng)用體現(xiàn)在美國專利Nos.5,871,928、5,902,723、6,045,996、5,541,061和6,197,506中。
      本發(fā)明也考慮了某些優(yōu)選實(shí)施方案中的樣品制備方法。在基因分型之前或同時(shí),基因組樣品可以通過多種機(jī)制進(jìn)行擴(kuò)增,其中有些使用了PCR。參見例如PCR TechnologyPrinciples and Applications forDNA Amplification(PCR技術(shù)DNA擴(kuò)增的原理和應(yīng)用)(H.A.Erlich主編,F(xiàn)reeman Press,NY,NY,1992)、PCR ProtocolsA Guide to Methodsand Applications(PCR方案方法和應(yīng)用指南)(Innis等主編,AcademicPress,San Diego,CA,1990)、Mattila等,Nucleic Acids Res.19,4967(1991)、Eckert等,PCR Methods and Applications 1,17(1991)、PCR(McPherson等主編,IRL Press,Oxford)和美國專利Nos.4,683,202、4,683,195、4,800,159、4,965,188和5,333,675,在此每一個(gè)為所有的目的以其全文引為參考。樣品可以在陣列上擴(kuò)增。參見例如美國專利No.6,300,070和美國系列號No.09/513,300,在此引為參考。
      其它適當(dāng)?shù)臄U(kuò)增方法包括連接酶鏈反應(yīng)(LCR)(例如Wu和Wallace,Genomics 4,560(1989),Landegren等,Science 241,1077(1988)和Barringer等Gene 89117(1990))、轉(zhuǎn)錄擴(kuò)增(Kwoh等,Proc.Natl.Acad.Sci.USA 86,1173(1989)和WO88/10315)、自持序列復(fù)制(Guatelli等,Proc.Nat.Acad.Sci.USA,87,1874(1990)和WO90/06995)、靶多核苷酸序列的選擇性擴(kuò)增)(美國專利No.6,410,276)、共有序列引發(fā)的聚合酶鏈反應(yīng)(CP-PCR)(美國專利No.4,437,975)、隨意引發(fā)的聚合酶鏈反應(yīng)(AP-PCR)(美國專利Nos.5,413,909、5,861,245)以及基于核酸的序列擴(kuò)增(NABSA)(參見美國專利Nos.5,409,818、5,554,517和6,063,603,每一個(gè)在此引為參考)。其它可以使用的擴(kuò)增方法在美國專利Nos.5,242,794、5,494,810、4,988,617和美國系列號No.09/854,317中有描述,每一個(gè)在此引為參考。
      其它的樣品制備方法和減少核酸樣品復(fù)雜性的技術(shù)描述在Dong等,Genome Research 11,1418(2001)、美國專利No.6,361,947、6,391,592和6,107,023、以及美國系列號09/916,135、09/920,491(美國專利申請公布20030096235)、09/910,292(美國專利申請公布20030082543)和10/013,598中。
      進(jìn)行多核苷酸雜交分析的方法在本領(lǐng)域已經(jīng)很成熟。雜交分析的步驟和條件依賴于具體的應(yīng)用而變化,并按照公知的通用結(jié)合方法來選擇,包括在下面文獻(xiàn)中提到的方法Maniatis等Molecular CloningALaboratory Manual(分子克隆實(shí)驗(yàn)指南,第2版)(2ndEd.Cold SpringHarbor,N.Y,1989);Berger和Kimmel Methods in Enzymology,Vol.152,Guide to Molecular Cloning Techniques(分子克隆技術(shù)指南)(AcademicPress,Inc.,San Diego,CA,1987);Young和Davism,P.N.A.S,801194(1983)。實(shí)施重復(fù)和可控的雜交反應(yīng)的方法和裝置已經(jīng)在美國專利Nos.5,871,928、5,874,219、6,045,996和6,386,749、6,391,623中有描述,在此將每一個(gè)引為參考。
      本發(fā)明也考慮到在某些優(yōu)選實(shí)施方案中配體間的雜交信號檢測。參見美國專利Nos.5,143,854、5,578,832、5,631,734、5,834,758、5,936,324、5,981,956、6,025,601、6,141,096、6,185,030、6,201,639、6,218,803和6,225,625、美國系列號10/389,194和PCT申請PCT/US99/06097(公布號WO99/47964),在此為所有的目的以其全文引為參考。
      信號檢測和強(qiáng)度數(shù)據(jù)處理的方法和裝置公開在例如美國專利Nos.5,143,854、5,547,839、5,578,832、5,631,734、5,800,992、5,834,758、5,856,092、5,902,723、5,936,324、5,981,956、6,025,601、6,090,555、6,141,096、6,185,030、6,201,639、6,218,803和6,225,625、美國系列號10/389,194、60/493,495和PCT申請PCT/US99/06097(公布號WO99/47964)中,在此為所有的目的以其全文引為參考。儀器和軟件也可以從多種來源購買到,包括Affymetrix。
      本發(fā)明的實(shí)施也可以使用常規(guī)的生物學(xué)方法、軟件和系統(tǒng)。本發(fā)明的計(jì)算機(jī)軟件產(chǎn)品一般包括計(jì)算機(jī)可讀介質(zhì),其中帶有用于執(zhí)行本發(fā)明方法的邏輯步驟的計(jì)算機(jī)可執(zhí)行指令。適當(dāng)?shù)挠?jì)算機(jī)可讀介質(zhì)包括軟盤、CD-ROM/DVD/DVD-ROM、硬盤驅(qū)動器、閃存、ROM/RAM、磁帶等。計(jì)算機(jī)可執(zhí)行指令可以用適當(dāng)?shù)挠?jì)算機(jī)語言或幾種語言的組合來撰寫?;镜挠?jì)算生物學(xué)方法描述在例如Setubal和Meidanis等,Introduction to Computational Biology Methods(計(jì)算生物學(xué)方法導(dǎo)論)(PWS Publishing Company,Boston,1997);Salzberg、Searles、Kasif主編,Computational Methods in Molecular Biology(分子生物學(xué)中的計(jì)算方法)(Elsevier,Amsterdam,1998);Rashidi和Buehler,BioinformaticsBasicsApplication in Biological Science and Medicine(生物信息學(xué)基礎(chǔ)在生物科學(xué)和醫(yī)學(xué)中的應(yīng)用)(CRC Press,London,2000)以及Ouelette和Bzevanis BioinformaticsA Practical Guide for Analysis ofGene and Proteins(生物信息學(xué)基因和蛋白分析實(shí)用指南)(Wiley&amp;Sons,Inc.,第2版,2001)中。參見美國專利No.6,420,108。
      本發(fā)明也可以將各種計(jì)算機(jī)程序產(chǎn)品和軟件應(yīng)用于各種目的,例如探針設(shè)計(jì)、數(shù)據(jù)管理、分析和儀器操作。參見美國專利Nos.5,593,839、5,795,716、5,733,729、5,974,164、6,066,454、6,090,555、6,185,561、6,188,783、6,223,127、6,229,911和6,308,170。
      此外,本發(fā)明在一些優(yōu)選實(shí)施方案中包括了通過網(wǎng)絡(luò)例如英特網(wǎng)提供遺傳信息的方法,如同在美國系列號10/197,621、10/063,559(美國公布號20020183936)、10/065,856、10/065,868、10/328,818、10/328,872、10/423,403和60/482,389中顯示的那樣。
      b)定義
      “接頭序列”或“接頭”一般是長度為至少5、10或15個(gè)堿基的寡核苷酸,在優(yōu)選情況下長度不超過50或60個(gè)堿基,但是它們可以更長,長達(dá)100或200個(gè)堿基。接頭序列可以使用任何本領(lǐng)域?qū)I(yè)人員所熟知的方法進(jìn)行合成。出于本發(fā)明的目的,作為選擇,它們可以含有引物結(jié)合位點(diǎn)、核酸內(nèi)切酶識別位點(diǎn)、常見序列和啟動子。接頭可以是完全或基本上雙鏈的或完全單鏈的。雙鏈接頭可以包含兩個(gè)至少部分互補(bǔ)的寡核苷酸。接頭在一條或兩條鏈上可以是磷酸化或未磷酸化的。
      接頭如果含有基本上是雙鏈的區(qū)域以及與限制性酶消化產(chǎn)生的單鏈區(qū)互補(bǔ)的短的單鏈區(qū)域,則與片段的連接將更有效。例如,當(dāng)DNA用限制性酶EcoR I消化時(shí),產(chǎn)生的雙鏈片段在每端都帶有突出的5’-AATT-3’單鏈,帶有突出的5’-AATT-3’單鏈的接頭將與片段通過突出區(qū)域之間的互補(bǔ)性而雜交。接頭與片段的這種“粘性末端”雜交可以利于接頭與片段的連接,但是平末端的連接也是可能的。使用Klenow片段的核酸外切酶活性可以將平末端轉(zhuǎn)化為粘性末端。例如,當(dāng)DNA用PvuII消化時(shí),通過片段與Klenow在存在dTTP和dCTP的情況下保溫,平末端可以被轉(zhuǎn)化為帶有兩個(gè)堿基對的突出。通過在突出上進(jìn)行填充或去除突出,突出也可以被轉(zhuǎn)化為平末端。
      連接的方法為本領(lǐng)域的專業(yè)人員所熟知,在例如Sambrook等(2001)的文獻(xiàn)和New England BioLabs的目錄中有描述,它們在此為所有的目的引為參考。方法包括使用T4 DNA連接酶,它催化在具有平末端或粘性末端的雙鏈DNA或RNA中毗連的5’磷酸和3’羥基末端之間形成磷酸二酯鍵;Taq DNA連接酶,它催化兩個(gè)相鄰的與互補(bǔ)的靶DNA雜交的寡核苷酸中毗連的5’磷酸和3’羥基末端之間形成磷酸二酯鍵;大腸桿菌(E.Coli)DNA連接酶,它催化在含有粘著末端的雙鏈DNA中毗連的5’磷酸和3’羥基末端之間形成磷酸二酯鍵;以及T4 RNA連接酶,它通過形成3’5’磷酸二酯鍵催化5’-磷?;┒说暮怂峁w與3’-羥基末端的核酸受體的連接,底物包括單鏈RNA和DNA以及二核苷焦磷酸;或者本領(lǐng)域描述的其它任何方法。片段化的DNA在將接頭連接到一個(gè)或兩個(gè)末端之前,可以用一種或多種酶,例如核酸內(nèi)切酶,進(jìn)行處理,以產(chǎn)生與連接相容的末端而方便連接。
      接頭也可以摻有能夠修飾接頭序列性質(zhì)的修飾的核苷酸。例如硫代磷酸酯基團(tuán)可以被引入接頭的一條鏈中。硫代磷酸酯基團(tuán)是一種修飾的磷酸基團(tuán),其中有一個(gè)氧原子被硫原子所取代。在硫代磷酸酯化的寡聚物(通常稱為“S-Oligo”)中,一些或所有的核苷酸間的磷酸基團(tuán)被硫代磷酸酯基團(tuán)取代。S-Oligo的修飾的骨架對大多數(shù)核酸外切酶和核酸內(nèi)切酶的作用具有抗性。硫代磷酸酯可以被引入接頭鏈的所有殘基之間,也可以引入到序列內(nèi)的特定位置處。有用的選擇是僅僅硫化寡聚物每端的最后幾個(gè)殘基。這樣產(chǎn)生的寡聚物對核酸外切酶具有抗性,但是具有天然的DNA中心。
      此處所用的術(shù)語“陣列”是指有意產(chǎn)生的分子的集合體,這些分子是通過合成或生物合成制備的。陣列中的分子彼此之間可以是相同的,也可以是不同的。陣列可以采取各種格式,例如可溶性分子的文庫、束縛在樹脂珠、硅芯片或其它固相支持物上的化合物的文庫。
      此處所用的術(shù)語“陣列板”是指具有多個(gè)陣列并形成區(qū)域或空間的物體,在所述陣列中每個(gè)微陣列被物理障礙分隔開來,以阻擋液體的流動,而所述區(qū)域或空間稱為孔,能夠包含與探針陣列接觸的液體。
      此處所用的術(shù)語“生物單體”是指生物聚合物的單個(gè)單位,它可以與相同的或其它的生物單體連接形成生物聚合物(例如,帶有兩個(gè)連接基團(tuán)的單個(gè)氨基酸或核苷酸,連接基團(tuán)中的一個(gè)或兩個(gè)可以具有可去除的保護(hù)基團(tuán)),或是指不是生物聚合物的一部分的單個(gè)單位。因此,例如在寡核苷酸生物聚合物中核苷酸是生物單體,而在蛋白或肽生物聚合物中氨基酸是生物單體;例如親和素、生物素、抗體、抗體片段等也是生物單體。
      此處所用的術(shù)語“生物聚合物”是指生物或化學(xué)部分的重復(fù)單位。代表性的生物聚合物包括但不限于核酸、寡核苷酸、氨基酸、蛋白、肽、激素、寡糖、脂類、糖脂、脂多糖、磷脂、上述生物聚合物的合成類似物,包括但不限于反向核苷酸、肽核酸、Meta-DNA,以及上述物質(zhì)的組合。
      此處所用的術(shù)語“組合合成策略”指一種組合性合成策略,是通過順序加入試劑平行地合成多種聚合物序列的有序策略,它可以用反應(yīng)物矩陣和轉(zhuǎn)換矩陣來代表,其積是產(chǎn)物矩陣。反應(yīng)物矩陣是待加入積木的l列m行的矩陣。轉(zhuǎn)換矩陣是成列排列的l和m之間的二元數(shù)字的全部或其子集,優(yōu)選情況下是有序的?!岸呗浴笔侵高@樣的策略,其中至少兩個(gè)相連的步驟照亮了基底上目的區(qū)域的一部分,通常是一半。在二元合成策略中,從有序的反應(yīng)物組能夠形成的所有可能的化合物都形成了。在最優(yōu)選實(shí)施方案中,二元合成是指也把以前的加入步驟作為因素考慮在內(nèi)的合成策略。例如,在一個(gè)策略中,掩蔽策略的轉(zhuǎn)換矩陣將以前照亮的區(qū)域分為兩半,照亮大約一半以前照亮的區(qū)域,保護(hù)剩下的一半(同時(shí)也保護(hù)大約一半以前保護(hù)的區(qū)域并照亮大約一半以前保護(hù)的區(qū)域)。應(yīng)該認(rèn)識到二元循環(huán)中可以散布有非二元循環(huán),只有一部分基底可以經(jīng)受二元方案。組合的“掩蔽”策略是合成策略,它使用光或其它空間選擇性去保護(hù)或激活試劑來除去物質(zhì)上的保護(hù)基團(tuán),以便添加其它的物質(zhì)例如氨基酸。
      此處所用的術(shù)語“互補(bǔ)性”是指核苷酸或核酸之間的雜交或堿基配對,例如在雙鏈DNA分子的兩條鏈之間或在寡核苷酸引物和被測序或擴(kuò)增的單鏈核酸上的引物結(jié)合位點(diǎn)之間?;パa(bǔ)的核苷酸一般是A和T(或A和U)或C和G。兩個(gè)單鏈RNA或DNA分子,當(dāng)其中一條鏈的核苷酸通過最適化比對和比較,并進(jìn)行適當(dāng)?shù)暮塑账岵迦牖蛉笔?,與另一條鏈的核苷酸有至少80%配對,通常至少約90%到95%,更優(yōu)選情況下從大約98到100%配對時(shí),它們被說成是互補(bǔ)的。此外,當(dāng)RNA或DNA鏈在選擇性雜交條件下與其互補(bǔ)鏈雜交時(shí),互補(bǔ)性也存在。一般來說,當(dāng)在一段至少14-25個(gè)核苷酸的跨度上存在至少大約65%的互補(bǔ)性,優(yōu)選至少大約75%,更優(yōu)選至少大約90%互補(bǔ)性時(shí),選擇性雜交可以發(fā)生。參見M.Kanehisa,Nucleic Acids Res.12203(1984),在此引為參考。
      此處所用的術(shù)語“后生的”是指除了基因組的一級序列之外影響生物體的發(fā)育或功能的因素,它們可以不改變生物體的基因型而影響其表型。后生的因素包括對由DNA甲基化和染色質(zhì)結(jié)構(gòu)中可遺傳但潛在可逆的變化所控制的基因表達(dá)進(jìn)行修飾。已知甲基化模式與基因表達(dá)相關(guān),并且一般而言,高度甲基化的序列表達(dá)很差。
      此處所用的術(shù)語“基因組”是生物體的染色體中所有的遺傳物質(zhì)。來自特定生物體染色體中的遺傳物質(zhì)的DNA是基因組DNA?;蚪M文庫是從代表生物體完整基因組的一套隨機(jī)產(chǎn)生的重疊DNA片段中制成的克隆的集合。
      此處所用的術(shù)語“雜交”是指兩個(gè)單鏈多核苷酸非共價(jià)地結(jié)合形成穩(wěn)定的雙鏈多核苷酸的過程;三鏈的雜交在理論上也是可能的。產(chǎn)生的(通常)雙鏈多核苷酸是“雜交體”。雜交通常在嚴(yán)謹(jǐn)條件下進(jìn)行,例如在鹽濃度不超過大約1M和溫度至少25C的情況下。例如,對于等位基因特異的探針雜交來說,5X SSPE(750mM NaCl,50mM磷酸鈉,5mM EDTA,pH7.4)和溫度20C-30的條件是適當(dāng)?shù)模蛘呤?00mM MES,1M[Na+],20mM EDTA,0.01%Tween-20和溫度30-50℃,優(yōu)選為大約45-50℃的條件。雜交可以在存在試劑例如大約0.1mg/ml鯡魚精子DNA、大約0.5mg/ml乙?;疊SA的情況下進(jìn)行。因?yàn)槠渌囊蛩匕ɑパa(bǔ)鏈的堿基組成和長度、有機(jī)溶劑的存在和堿基誤配的程度可以影響雜交的嚴(yán)謹(jǐn)性,參數(shù)的組合比單獨(dú)任何一個(gè)參數(shù)的絕對值更為重要。適合于微陣列的雜交條件描述在Gene ExpressionTechnical Manual(基因表達(dá)技術(shù)手冊)2004和GeneChip Mapping AssayManual(基因芯片作圖分析手冊)2004中,可以從Affymetrix.com獲得。
      此處所用的術(shù)語“雜交探針”是指能夠以堿基特異性方式與互補(bǔ)的核酸鏈結(jié)合的寡核苷酸。這樣的探針包括肽核酸,如在Nielsen等,Science 254,1497-1500(1991)中所描述,LNAs,如在Koshkin等,Tetrahedron 543607-3630,1998和美國專利No.6,268,490中所描述,以及其它的核酸類似物和核酸模擬物。
      此處所用的術(shù)語“分離的核酸”是指目的核酸在存在的核酸中居主導(dǎo)地位(即在摩爾基礎(chǔ)上它比組合物中任何其它單獨(dú)核酸種類更豐富)。在優(yōu)選情況下,分離的核酸占存在的所有大分子物質(zhì)的至少大約50、80或90%(在摩爾基礎(chǔ)上)。在更優(yōu)選情況下,目的核酸種類被純化為基本上均一(通過常規(guī)的檢測方法不能在組合物中檢測到污染物質(zhì))。
      此處所用的術(shù)語“標(biāo)記物”是指熒光標(biāo)記物、光散射標(biāo)記物或放射性標(biāo)記物。其中,熒光標(biāo)記物包括可以購買到的亞磷酰胺熒光素,例如Fluoreprime(Pharmacia)、Fluoredite(Millipore)和FAM(ABI)。參見美國專利6,287,778。
      此處所用的術(shù)語“配體”是指被特定的受體識別的分子。與受體結(jié)合或反應(yīng)的試劑被稱為“配體”,該術(shù)語只有根據(jù)其對應(yīng)的受體定義才有意義。除了表明該物質(zhì)能夠與受體結(jié)合或相互作用之外,術(shù)語“配體”不暗含任何特定的分子大小或其它的結(jié)構(gòu)或組成特點(diǎn)。此外,配體既可以用作與受體結(jié)合的天然配體,也可以作為功能類似物用作激動劑或拮抗劑。在本發(fā)明中研究的配體的例子包括但不限于細(xì)胞膜受體的激動劑或拮抗劑、毒素和毒液、病毒表位、激素(例如阿片劑、類固醇等)、激素受體、肽、酶、酶的底物、底物類似物、過渡態(tài)類似物、輔助因子、藥物、蛋白和抗體。
      此處所用的術(shù)語“混合種群”或有時(shí)稱為“復(fù)雜種群”是指任何含有所需和不需核酸的樣品。作為非限制的例子,核酸的復(fù)雜種群可以是總的基因組DNA、總的基因組RNA或其組合。此外,核酸的復(fù)雜種群可以富集了給定的種群但是仍包括其它不需要的種群。例如,核酸的復(fù)雜種群可以是富集了所需的信使RNA(mRNA)序列但是仍包括一些不需要的核糖體RNA序列(rRNA)的樣品。
      此處所用的術(shù)語“mRNA”或有時(shí)稱為“mRNA轉(zhuǎn)錄本”包括但不限于mRNA轉(zhuǎn)錄本前體、轉(zhuǎn)錄本加工中間體、備譯的成熟mRNA以及來自mRNA轉(zhuǎn)錄本的基因或核酸的轉(zhuǎn)錄本。轉(zhuǎn)錄本的加工包括剪接、編輯和降解。如本文所用,來自mRNA轉(zhuǎn)錄本的核酸是指為其合成,mRNA轉(zhuǎn)錄本或其子序列最終用作模板的核酸。因此,從mRNA反轉(zhuǎn)錄得到的cDNA、從cDNA轉(zhuǎn)錄得到的RNA、從cDNA擴(kuò)增得到的DNA、從擴(kuò)增的DNA轉(zhuǎn)錄得到的RNA等都是來自于mRNA轉(zhuǎn)錄本,對這些衍生產(chǎn)物的檢測可以指示樣品中原始轉(zhuǎn)錄本的存在和/或豐度。因此,mRNA衍生樣品包括但不限于基因的mRNA轉(zhuǎn)錄本、從mRNA反轉(zhuǎn)錄得到的cDNA、從cDNA轉(zhuǎn)錄得到的cRNA、從基因擴(kuò)增得到的DNA、從擴(kuò)增的DNA轉(zhuǎn)錄得到的RNA等。
      此處所用的術(shù)語“核酸文庫”是指有意產(chǎn)生的核酸的集合,可以通過合成或生物合成制備,以各種不同的形式用于生物活性的篩選(例如可溶性分子的文庫、束縛在珠、芯片或其它固相支持物上的寡聚物的文庫)。此外,術(shù)語“陣列”的意思包括了那些可以通過將幾乎任何長度的核酸(例如長度從1到大約1000個(gè)核苷酸單體)點(diǎn)樣在基底上所制備的核酸文庫。此處所用的術(shù)語“核酸”是指任何長度的核苷酸的聚合形式,核苷酸可以是核糖核苷酸、脫氧核糖核苷酸或肽核酸(PNAs),它們含有嘌呤和嘧啶堿基,或其它天然的、化學(xué)或生物化學(xué)修飾的、非天然的或衍生的核苷酸堿基。多核苷酸的骨架可以含有在RNA或DNA中通常所能發(fā)現(xiàn)的那些糖和磷酸基團(tuán),或者修飾的或取代的糖或磷酸基團(tuán)。多核苷酸可以含有修飾的核苷酸,例如甲基化的核苷酸和核苷酸類似物。核苷酸的序列可以被非核苷酸的成分所打斷。因此術(shù)語核苷、核苷酸、脫氧核苷、脫氧核苷酸一般都包括例如此處所描述的那些類似物。這些類似物是哪些與天然存在的核苷或核苷酸具有一些相同結(jié)構(gòu)特點(diǎn)的分子,因此當(dāng)它們摻入到核酸或寡核苷序列中時(shí),可以在溶液中與天然存在的核酸序列雜交。一般來說,這些類似物是通過對堿基、核糖或磷酸二酯部分進(jìn)行取代和/或修飾而從天然存在的核苷和核苷酸衍生而來的。這些改變可以被定制以便穩(wěn)定或去穩(wěn)定雜交體的形成,或增強(qiáng)與所需的互補(bǔ)核酸序列雜交的特異性。
      此處所用的術(shù)語“核酸”可以包括任何嘧啶和嘌呤堿基的多聚物或寡聚物,堿基分別優(yōu)選為胞嘧啶、胸腺嘧啶、尿嘧啶以及腺嘌呤和鳥嘌呤。參見Albert L.Lehninger,PRINCIPLES OF BIOCHEMISTRY(生物化學(xué)原理),第793-800頁(Worth Pub.1982)。事實(shí)上,本發(fā)明考慮到了任何脫氧核糖核苷酸、核糖核苷酸或肽核酸成分,以及它們的任何化學(xué)變體,例如這些堿基的甲基化、羥甲基化或糖基化形式等。組合物中的多聚體或寡聚體可以是非均質(zhì)的,也可以是均質(zhì)的,可以從天然存在的來源分離,也可以人工或合成生產(chǎn)。此外,核酸可以是DNA,也可以是RNA或它們的混合物,并且可以永久或暫時(shí)地以單鏈或雙鏈的形式存在,包括同源雙鏈體、異源雙鏈體和雜交體狀態(tài)。
      此處所用的術(shù)語“寡核苷酸”或有時(shí)稱為“多核苷酸”是指長度范圍至少為2、優(yōu)選至少為8、和更優(yōu)選至少為20個(gè)核苷酸的核酸,或能夠與多核苷酸特異性雜交的化合物。本發(fā)明的多核苷酸包括可以從天然來源分離、重組生產(chǎn)或人工合成和模擬的脫氧核糖核酸(DNA)或核糖核酸(RNA)的序列。本發(fā)明的多核苷酸的另一個(gè)例子可以是肽核酸(PNA)。本發(fā)明還包括存在非常規(guī)的堿基配對的情況,例如Hoogsteen堿基配對,它已經(jīng)在某些tRNA分子中被識別并推斷存在于三螺旋中。在本申請中,“多核苷酸”和“寡核苷酸”可以互換使用。
      此處所用的術(shù)語“引物”是指單鏈寡核苷酸,能夠在適當(dāng)?shù)臈l件例如緩沖液和溫度、在存在四種不同的核苷三磷酸以及聚合試劑例如DNA或RNA聚合酶或反轉(zhuǎn)錄酶的情況下,充當(dāng)模板指導(dǎo)的DNA合成的起始點(diǎn)。在任何給定的情況下,引物的長度依賴于例如引物的使用目的,一般來說,范圍從15到30個(gè)核苷酸。短的引物分子通常需要較低的溫度以與模板形成足夠穩(wěn)定的雜交體復(fù)合物。引物不必須反映模板的精確序列,但是必須具有足夠的互補(bǔ)性以與該模板雜交。引物位點(diǎn)是模板上引物雜交的區(qū)域。引物對是一套引物,包括與被擴(kuò)增序列的5’端雜交的5’上游引物和與被擴(kuò)增序列的3’端的互補(bǔ)序列雜交的3’端下游引物。
      此處所用的術(shù)語“探針”是指被固定在表面上的分子,它能夠被特定的靶識別。對于由具有10、12和更多個(gè)堿基的探針的所有可能的組合所構(gòu)成的陣列的例子,參見美國專利No.6,582,908。本發(fā)明所研究的探針的例子包括但不限于細(xì)胞膜受體的激動劑或拮抗劑、毒素和毒液、病毒表位、激素(例如阿片樣肽、類固醇等)、激素受體、肽、酶、酶的底物、輔助因子、藥物、外源凝集素、糖、寡核苷酸、核酸、寡糖、蛋白和單克隆抗體。
      此處所用的術(shù)語“受體”是指與給定的配體具有親和性的分子。受體可以是天然存在的或人造的分子。同樣,它們可以以其未改變的狀態(tài)使用,也可以與其它物質(zhì)結(jié)合使用。受體可以直接地或通過特定的結(jié)合物以共價(jià)或非共價(jià)形式連接到結(jié)合部分上。本發(fā)明中使用的受體的例子包括但不限于抗體、細(xì)胞膜受體、與特定的抗原決定簇(例如位于病毒、細(xì)胞或其它物質(zhì)上)具有反應(yīng)性的單克隆抗體和抗血清、藥物、多核苷酸、核酸、肽、輔助因子、外源凝集素、糖、多糖、細(xì)胞、細(xì)胞膜和細(xì)胞器。受體在本技術(shù)領(lǐng)域中有時(shí)稱為抗配體。在此所用的術(shù)語受體并不打算有不同意義。當(dāng)兩個(gè)大分子通過分子識別結(jié)合形成復(fù)合物時(shí)就形成了“配體受體對”。本發(fā)明中可以使用的其它受體的例子包括但不限于那些在美國專利No.5,143,854中所顯示的分子,該專利在此以其全文引為參考。
      此處所用的術(shù)語“固相支持物”、“支持物”和“基底”可以互換使用,是指一種或一組具有剛性或半剛性表面的材料。在許多實(shí)施方案中,固相支持物的至少一個(gè)表面應(yīng)該是基本上平的,盡管在某些實(shí)施方案中可能希望用例如孔、升高的區(qū)域、針、刻蝕的溝渠等將合成區(qū)域進(jìn)行物理上的分隔用于不同的化合物。按照其它的實(shí)施方案,固相支持物將采取珠子、樹脂、凝膠、微球的形式或其它的幾何構(gòu)型。示例性的基底參見美國專利No.5,744,305。
      此處所用的術(shù)語“靶”是指對給定的探針具有親和性的分子。靶可以是天然存在的或人工制造的分子。同樣,它們可以以其未改變的狀態(tài)使用,也可以與其它物質(zhì)結(jié)合使用。靶可以直接地或通過特定的結(jié)合物以共價(jià)或非共價(jià)方式連接到結(jié)合部分上。本發(fā)明中使用的靶的例子包括但不限于抗體、細(xì)胞膜受體、與特定的抗原決定簇(例如位于病毒、細(xì)胞或其它物質(zhì)上)具有反應(yīng)性的單克隆抗體和抗血清、藥物、寡核苷酸、核酸、肽、輔助因子、外源凝集素、糖、多糖、細(xì)胞、細(xì)胞膜和細(xì)胞器。靶在本技術(shù)領(lǐng)域中有時(shí)稱為抗探針。在此所用的術(shù)語靶并不打算有不同意義。當(dāng)兩個(gè)大分子通過分子識別結(jié)合形成復(fù)合物時(shí)就形成了一個(gè)“探針靶對”。
      此處所用的術(shù)語“晶片”是指具有可結(jié)合多個(gè)陣列的表面的基底。在優(yōu)選實(shí)施方案中,陣列在底物的表面上合成,產(chǎn)生了多個(gè)在物理上分離的陣列。在晶片的一個(gè)優(yōu)選實(shí)施方案中,陣列物理分離的距離為至少大約0.1、0.25、0.5、1或1.5毫米。位于晶片上的陣列可以是相同的,每一個(gè)可以是不同的,或可以是它們的組合。特別優(yōu)選的晶片是大約8”×8”,使用照相平板印刷工藝制造。
      個(gè)體不僅限于人類,它也可以包括其它的生物體,包括但不限于哺乳動物、植物、真菌、細(xì)菌或來源于上述生物體的細(xì)胞。
      甲基化分析DNA中胞嘧啶殘基的甲基化在基因調(diào)控中發(fā)揮重要作用。DNA甲基化為正常的胚胎發(fā)育所必需,甲基化的變化常常與疾病有關(guān)?;蚪M印記、X染色體失活、染色質(zhì)修飾和內(nèi)源的反轉(zhuǎn)錄病毒的沉默都依賴于適當(dāng)?shù)募谆J降慕⒑途S持?;虻谋磉_(dá)可以被甲基化的模式所調(diào)控。甲基化異常是癌細(xì)胞的標(biāo)志,腫瘤抑制基因的沉默被認(rèn)為是許多人類癌癥的因果基礎(chǔ)。使用基于微陣列的方法進(jìn)行甲基化作圖可以被用來例如描述癌細(xì)胞的大體情況,發(fā)現(xiàn)DNA甲基化的模式可以用來例如診斷惡性腫瘤、預(yù)測治療結(jié)果或監(jiān)測疾病的進(jìn)展。真核生物中的甲基化也可以用來抑制病毒和轉(zhuǎn)座子的活性,參見Jones等,EMBO J.176385-6393(1998)。
      在優(yōu)選方面,本發(fā)明公開了利用與核酸探針陣列雜交分析基因組樣品中胞嘧啶的甲基化狀態(tài)的方法。在許多方面,方法包括了辨別甲基化和未甲基化胞嘧啶的步驟。這個(gè)步驟可以是例如化學(xué)或酶法的。例如,在某些方面,含有甲基化胞嘧啶的樣品用亞硫酸氫鹽處理,它可以選擇性地修飾未甲基化的胞嘧啶。在其它方面,使用能夠辨別甲基化和未甲基化DNA的酶,例如,DNA可以平行地用同裂酶消化,其中一種酶是甲基化敏感的,而另一種是甲基化不敏感的。
      在某些方面,本方面公開了擴(kuò)增基因組DNA樣品同時(shí)保留DNA中胞嘧啶甲基化狀態(tài)的信息的方法。然后,可以分析被擴(kuò)增樣品中一個(gè)或多個(gè)胞嘧啶的甲基化狀態(tài)。當(dāng)與例如亞硫酸氫鹽修飾這樣的檢測方法結(jié)合使用時(shí),這種保留甲基化狀態(tài)的擴(kuò)增方法可能特別有用,因?yàn)閬喠蛩釟潲}修飾和其它相似的處理可能損壞DNA,結(jié)果使得在修飾后擴(kuò)增DNA的方法可能是無效的。在修飾或處理前擴(kuò)增樣品可以允許直接檢測被修飾的樣品,而不需要在修飾或處理后擴(kuò)增樣品。此外本方面還公開了檢測胞嘧啶甲基化狀態(tài)的方法。在優(yōu)選實(shí)施方案中,該方法能夠同時(shí)分析大量的胞嘧啶,例如超過1000、5000、10,000或100,000個(gè)胞嘧啶。
      許多分析基因組信息的方法在分析前使用擴(kuò)增步驟,一般來說,這些方法會導(dǎo)致與起始材料的甲基化狀態(tài)有關(guān)的信息的喪失,這是因?yàn)槠鹗嘉镔|(zhì)的序列被再生了,但是后生的信息例如甲基化的存在丟失了。在本發(fā)明的一個(gè)方面,公開了擴(kuò)增核酸同時(shí)保留至少某些后生信息的方法。
      擴(kuò)增可以通過多種方式進(jìn)行,例如聚合酶鏈反應(yīng)(PCR)、滾環(huán)擴(kuò)增(RCA)、多重置換擴(kuò)增(MDA)、或其它全基因組擴(kuò)增方法、代表性的基因組擴(kuò)增或位點(diǎn)特異性擴(kuò)增。方法可以包括例如用一個(gè)或多個(gè)限制性核酸內(nèi)切酶或通過隨機(jī)的片段化方法將核酸樣品片段化,然后連接通用引發(fā)位點(diǎn),這可以通過例如連接接頭、或延伸具有通用5’末端和3’端是隨機(jī)或簡并序列的引物來實(shí)現(xiàn)。
      對許多擴(kuò)增方法來說,引物與基因組模板雜交,然后被延伸產(chǎn)生cDNA鏈,它是基因組DNA的拷貝。第一條鏈cDNA的合成導(dǎo)致在體外合成的cDNA和體內(nèi)合成的基因組DNA鏈之間形成雜交體,但是一般來說,新合成的cDNA是沒有甲基化的,因?yàn)樵隗w內(nèi)負(fù)責(zé)維持甲基化狀態(tài)的系統(tǒng)在體外反應(yīng)中不存在。在本發(fā)明的一個(gè)實(shí)施方案中,基因組DNA的擴(kuò)增是在存在能夠通過識別親本模板鏈上的甲基化并且在新合成的子代鏈的相應(yīng)位點(diǎn)處進(jìn)行甲基化從而保留甲基化的活性的情況下來實(shí)現(xiàn)的。
      在優(yōu)選實(shí)施方案中,第一鏈cDNA在與作為模板產(chǎn)生cDNA的基因組DNA鏈形成復(fù)合物時(shí)被甲基化。然后,這個(gè)現(xiàn)在已經(jīng)甲基化的第一鏈cDNA(子代)和模板基因組DNA鏈(親本)被分開,并且可以被用作模板合成其它的鏈,甲基化的子代作為模板和親本用于隨后新合成的子代鏈。各個(gè)隨后產(chǎn)生的鏈都使用其模板(親本)鏈作為甲基化的指導(dǎo)來進(jìn)行甲基化。
      哺乳動物的甲基化模式是復(fù)雜的,在發(fā)育過程中會變化,參見vanSteensel和Henikoff BioTechniques 35346-357(2003)。甲基化一般發(fā)生在胞嘧啶的5’位置,產(chǎn)生5-甲基胞嘧啶(5-meC)。大多數(shù)甲基胞嘧啶發(fā)現(xiàn)在CpG二核苷酸中。啟動子區(qū)中的甲基化一般伴隨著基因沉默,甲基化的喪失或與甲基化的CpG結(jié)合的蛋白的喪失可以導(dǎo)致人類疾病,例如免疫缺陷性顱面綜合癥和Rett綜合癥,Bestor(2000)Hum.Mol.Genet.92395-2402。
      已經(jīng)進(jìn)化出在多輪的細(xì)胞分裂甚至種系分裂過程中維持甲基化的方法,參見Raykan和Whitelaw(2003)Curr.Biol.13R6。在動物中,甲基CpG由DNA甲基轉(zhuǎn)移酶1(Dnmt 1)維持。Dnmt 1跟隨在復(fù)制叉后面,并且使每個(gè)CpG中未甲基化的胞嘧啶殘基甲基化,所述CpG是與甲基CpG配對的堿基,參見Leonhardt等(1992)Cell 71865-873。Dnmt 1對半甲基化的位點(diǎn)具有特異性,因此通過連續(xù)的細(xì)胞分裂循環(huán)能夠保存甲基化位點(diǎn)。DNA甲基化是基因特異性的,在整個(gè)基因組都可以發(fā)生。
      有兩種不同的過程調(diào)節(jié)甲基化,在DNA復(fù)制后維持甲基化和在以前未甲基化的區(qū)域重新加上甲基基團(tuán)。在哺乳動物中,一類甲基轉(zhuǎn)移酶負(fù)責(zé)對未修飾的DNA進(jìn)行甲基化,被命名為重新合成的酶。另一類酶在DNA復(fù)制過程中維持子代鏈的甲基化狀態(tài),被稱為維持性DNA甲基轉(zhuǎn)移酶。兩類酶都催化甲基基團(tuán)從S-腺苷-L-甲硫氨酸(AdoMet)轉(zhuǎn)移到DNA中的胞嘧啶堿基上。維持性甲基化負(fù)責(zé)為復(fù)制和細(xì)胞分裂后新合成的DNA中的胞嘧啶加上甲基基團(tuán)。親本DNA中的甲基化位點(diǎn)作為模板用來校正在復(fù)制后馬上識別半甲基化的子代鏈的維持性甲基轉(zhuǎn)移酶活性所產(chǎn)生的甲基化,參見Riggs,A.D.(1989)Cell Biophys.151-13。相反,重新合成的甲基化活性產(chǎn)生新的甲基化模式。DNA甲基轉(zhuǎn)移酶(DNMTs)在許多生物體包括哺乳動物、植物和細(xì)菌中發(fā)現(xiàn)(Bestor等Curr.Opin.Cell Biol.,6380-389(1994))。在哺乳動物中,已經(jīng)鑒定了三種活性DNA甲基轉(zhuǎn)移酶,Dnmt 1、Dnmt3a和Dnmt 3b。Dnmt 2最近也已經(jīng)被鑒定。Dnmt 3a和Dnmt 3b的功能主要作為重新合成的甲基轉(zhuǎn)移酶,而Dnmt 1負(fù)責(zé)維持性甲基化。已經(jīng)顯示出Dnmt 1在體外對半甲基化的CpG位點(diǎn)的甲基化具有高度偏好性,參見Pradhan等(1997)Nucl.Acids Res.254666-4673和(1999)J.Biol.Chem.27433002-33010。
      Dnmt 1、Dnmt 3a和Dnmt 3b在存在底物DNA和AdoMet輔助因子的情況下體外具有活性。Dnmt 1是哺乳動物細(xì)胞中最豐富的DNA甲基轉(zhuǎn)移酶,已經(jīng)從天然來源純化。來自幾種生物體包括小鼠和人的重組Dnmt 1也已經(jīng)獲得。該酶在體內(nèi)對半甲基化的底物的活性比對未甲基化的底物的活性高7到20倍。已經(jīng)顯示出Dnmt 1具有幾種天然存在的同工型,包括拼接變體形式Dnmt 1b和卵母細(xì)胞特異形式Dnmt 1o。對Dnmt 1蛋白的突變分析已經(jīng)鑒定出羧基末端的催化結(jié)構(gòu)域和含有核定位信號、復(fù)制叉靶向肽和鋅結(jié)合區(qū)域的調(diào)控結(jié)構(gòu)域。在該蛋白中也已經(jīng)鑒定出了許多特異蛋白相互作用區(qū)域。綜述可參見Pradhan和Esteve,Clinical Immunology 1096-16(2003)。
      人類DNA(胞嘧啶-5)甲基轉(zhuǎn)移酶(Dnmt 1)可以從New EnglandBiolabs購買到。該蛋白使用桿狀病毒表達(dá)系統(tǒng)從人類的cDNA表達(dá)。隨酶同時(shí)提供10x反應(yīng)緩沖液、BSA和S-腺苷甲硫氨酸(SAM)。推薦的反應(yīng)條件是1x Dnmt1反應(yīng)緩沖液(1X是59mM Tris-HCl,1mMDTT,1mM EDTA,5%甘油,pH7.8,25℃),100μg/ml BSA和160μMSAM,在37℃進(jìn)行反應(yīng)。1單位的酶定義為在37℃下,30分鐘內(nèi),在25μl總反應(yīng)體積中將1pmol甲基基團(tuán)催化轉(zhuǎn)移到poly dI.dC底物上所需的酶量。針對該酶的抗體也是可用的。
      對Dnmt3a的最新研究顯示出該酶的催化活性在體外受DMSO的刺激,參見Yokochi和Robertson,Bioorganic Chem.32234-243(2004)。該研究表明DMSO的刺激效應(yīng)依賴于DMSO與酶反應(yīng)底物DNA和AdoMet之間的相互作用,而不是酶本身。在某些方面,DMSO可以包括在Dnmt1反應(yīng)中。
      在本發(fā)明的一個(gè)方面,獲得了含有甲基化胞嘧啶的基因組DNA樣品,并且將一個(gè)或多個(gè)引物與DNA雜交。引物可以是例如一個(gè)或多個(gè)位點(diǎn)特異引物或一個(gè)集合體或隨機(jī)或部分簡并的引物。引物用DNA聚合酶延伸形成雙鏈DNA雜交體。雜交體含有一條模板DNA鏈和一條新合成的cDNA鏈?;蚪M模板鏈可以含有甲基化位點(diǎn),而新合成的鏈可以是未甲基化的。用DNA甲基轉(zhuǎn)移酶活性處理雜交體,該活性識別模板鏈上的甲基化位點(diǎn),并在模板鏈中的甲基化位點(diǎn)處對新合成的鏈進(jìn)行甲基化。甲基轉(zhuǎn)移酶和DNA聚合酶活性可以同時(shí)或不同時(shí)作用。在新合成的鏈的甲基化完成后,這個(gè)新合成的甲基化的鏈可以用作第二輪擴(kuò)增和甲基化中的模板鏈。這個(gè)步驟可以重復(fù)多次,以產(chǎn)生起始許多拷貝的基因組模板,其中包括甲基化位點(diǎn)。在優(yōu)選實(shí)施方案中,模板甲基化的拷貝在下一輪擴(kuò)增前完成。在某些實(shí)施方案中,在下一輪擴(kuò)增之前,反應(yīng)可以用切割半甲基化位點(diǎn)的酶進(jìn)行處理。
      在一個(gè)實(shí)施方案中,PCR用于擴(kuò)增,DNA甲基轉(zhuǎn)移酶活性是熱穩(wěn)定性的,并且在連續(xù)使雙鏈DNA加熱變性的循環(huán)過程中將保持活性。在另一個(gè)實(shí)施方案中,擴(kuò)增使用鏈置換酶例如phi29進(jìn)行(參見例如美國專利Nos.6,617,137和6,323,009),DNA甲基轉(zhuǎn)移酶可以是也可以不是熱穩(wěn)定的。當(dāng)使用鏈置換聚合酶時(shí),在優(yōu)選情況下甲基轉(zhuǎn)移酶活性與聚合酶結(jié)合起作用,以便在子代鏈被隨后的子代鏈取代之前甲基化位點(diǎn)被拷貝到子代鏈中。在一個(gè)方面,擴(kuò)增是等溫的。
      擴(kuò)增后,甲基化狀態(tài)保留下來的擴(kuò)增材料可以被分析,以確定一個(gè)或多個(gè)胞嘧啶的甲基化狀態(tài)。任何可用來確定甲基化狀態(tài)的方法都可以使用。對于檢測甲基化狀態(tài)的方法,參見例如美國專利申請No.10/841,027、美國專利Nos.6,214,556、5,786,146、6,017,704、6,265,171、6,200,756、6,251,594、5,912,147、6,331,393、6,605,432和6,300,071,以及美國專利申請公布20030148327、20030148326、20030143606和20030082609。對于一些甲基化檢測方法的綜述,參見Oakeley,E.J.,Pharmacology&amp;Therapeutics 84389-400(1999)??捎玫姆椒òǚ聪郒PLC、薄層層析、摻入標(biāo)記的甲基基團(tuán)的SssI甲基轉(zhuǎn)移酶、氯乙醛反應(yīng)、不同敏感性的限制性酶、肼或高錳酸鹽處理(5-甲基胞嘧啶被高錳酸鹽處理切割但不被肼處理切割)、亞硫酸氫鈉、組合的亞硫酸氫鹽-限制性分析以及甲基化敏感的單核苷酸引物延伸。這些方法分別描述在Oakeley(1999)中。對于這些方法中的許多來說,擴(kuò)增過程中甲基化狀態(tài)的保留利于下游的分析方法,這些分析方法依賴于對甲基化敏感的處理。許多檢測甲基化的方法在甲基化敏感性修飾步驟之后使用擴(kuò)增步驟,在某些方面,通過在處理前擴(kuò)增的同時(shí)保留甲基化狀態(tài),對修飾后樣品進(jìn)行擴(kuò)增的需要就被消除了。這可以提高擴(kuò)增和檢測的效率。由于在修飾步驟中對DNA的損壞,修飾后的擴(kuò)增可能是無效的。
      在本發(fā)明的一個(gè)方面,胞嘧啶的甲基化狀態(tài)通過限制性消化加以分析,使用兩種識別同樣識別位點(diǎn)但對甲基化具有不同敏感性的限制性酶來進(jìn)行。這樣的酶對的例子是HpaII和MspI。HpaII和MspI是同裂酶,在識別位點(diǎn)CCGG處切割(參見New England Biolab目錄,在此以其全文引為參考)。HpaII的切割被中央C的甲基化所阻斷,而MspI的切割不依賴于中央C的甲基化。在本發(fā)明的一個(gè)方面,具有保留的甲基化信息的被擴(kuò)增樣品用HpaII和MspI進(jìn)行消化,然后可以分析切割產(chǎn)物以確定甲基化狀態(tài)。如果目的位點(diǎn)是甲基化的,則它將不被HpaII切割但是可以被MspI切割。
      在示例性實(shí)施方案中,樣品首先用限制性酶例如XbaI、HindIII或BgIII片段化,然后將接頭連接到片段上。在優(yōu)選的實(shí)施方案中,第一個(gè)限制性酶的識別位點(diǎn)不含有CpG。有多種酶可以用于第一次片段化。在連接了接頭后,樣品被分成組分或等份,然后進(jìn)行不同的處理,可以通過例如平行地與探針陣列雜交來進(jìn)行分析。在一個(gè)方面,一個(gè)組分用Hpa II片段化,而第二個(gè)組分用MspI片段化。也可以包括第三個(gè)組分,它既不用Hpa II也不用MspI片段化。Hpa II消化的組分可以與MspI消化的組分或未消化的組分或二者同時(shí)進(jìn)行比較。此處所用的Hpa II和MspI是作為示例性的酶,但是任何一對能夠識別同樣的限制性位點(diǎn)并對甲基化具有不同敏感性的酶都可以使用。
      具有CCGG識別位點(diǎn)的片段,如果CpG是未甲基化的,它在HpaII和MspI組分中都將被切割,但是如果CpG是甲基化的,它將在MspI組分但不在Hpa II組分中被切割。切割后樣品用一個(gè)或多個(gè)與接頭互補(bǔ)的引物來擴(kuò)增。在這個(gè)擴(kuò)增步驟中,并不必需維持關(guān)于甲基化狀態(tài)的信息。用MspI或HpaII消化過的連接了接頭的片段在PCR反應(yīng)過程中將不會擴(kuò)增,這是因?yàn)槲稽c(diǎn)沒有甲基化。如果片段已經(jīng)被MspI或HpaII切割了,該片段將不能在PCR反應(yīng)中被擴(kuò)增,因?yàn)楫a(chǎn)生的片段只在一端有接頭序列和引發(fā)位點(diǎn)。僅僅具有甲基化的CCGG位點(diǎn)的片段在HpaII反應(yīng)中將不被切割,它們在PCR過程中被擴(kuò)增。在HpaII反應(yīng)中出現(xiàn)但是不在MspI反應(yīng)中出現(xiàn)的片段,可以通過將每一個(gè)PCR擴(kuò)增反應(yīng)的產(chǎn)物與探針陣列雜交來進(jìn)行鑒定。探針只在HpaII反應(yīng)中檢測到高于背景的雜交,是甲基化片段的指示。
      在另一方面,可以使用一種只切割甲基化的DNA但不切割非甲基化的DNA的酶。如上述產(chǎn)生的連接了接頭的片段,用只切割甲基化的DNA的甲基化依賴性酶進(jìn)行消化,未消化的連接了接頭的片段用接頭序列的引物進(jìn)行擴(kuò)增。被甲基化依賴性酶消化的連接了接頭的片段不能被擴(kuò)增,并在隨后的檢測步驟中不能被檢測到。擴(kuò)增的產(chǎn)物與陣列雜交,獲得雜交模式,并與從平行處理的、但沒有用甲基依賴性酶消化的樣品中獲得的雜交模式進(jìn)行比較。兩種模式之間的區(qū)別指示樣品中的片段被甲基化。甲基依賴性酶包括例如McrBC。
      擴(kuò)增產(chǎn)物可以用任何本領(lǐng)域所熟知的方法進(jìn)行檢測,例如通過與探針陣列雜交。陣列可以含有針對選定區(qū)域的探針,也可以含有平鋪的代表完整的染色體、完整的基因組、基因組的一個(gè)或多個(gè)大區(qū)域的探針。陣列也可以被設(shè)計(jì)有針對含有預(yù)計(jì)或已知的甲基化位點(diǎn)的區(qū)域的探針。示例性陣列包括在美國專利申請Nos.10/264,945、09/916,135和60/417,190中所公開的陣列,分別在此引為參考。
      在一個(gè)方面,計(jì)算機(jī)被用來模擬第一次限制性酶消化的產(chǎn)物,以預(yù)測片段的大小和序列。然后計(jì)算機(jī)可用來鑒定那些還含有一個(gè)或多個(gè)甲基化敏感的限制性酶的識別位點(diǎn)的片段。計(jì)算機(jī)還可以用來鑒定在PCR條件下易于擴(kuò)增的片段。在許多實(shí)施方案中,PCR條件優(yōu)選擴(kuò)增有限大小范圍的片段,例如200到2,000個(gè)堿基對或200到1,000個(gè)堿基對。在預(yù)期的大小范圍內(nèi)同時(shí)也含有甲基化敏感性酶位點(diǎn)的片段被鑒定出來,并且可以對陣列進(jìn)行設(shè)計(jì),使之含有與多個(gè)被鑒定的片段互補(bǔ)的探針。
      在示例性方面,第一個(gè)限制性酶是XbaI,計(jì)算機(jī)被用來模擬人類基因組被XbaI的消化,以鑒定200到1,000個(gè)堿基對之間的XbaI片段。計(jì)算機(jī)被用來分析被鑒定的片段的序列,從而鑒定出在片段內(nèi)至少具有一個(gè)CCGG位點(diǎn)的片段的子集。陣列中的探針可以被設(shè)計(jì)用來質(zhì)詢那些滿足這兩個(gè)標(biāo)準(zhǔn)的片段。探針可以針對片段的任何區(qū)域,在優(yōu)選情況下,每個(gè)片段用多個(gè)不同序列探針進(jìn)行質(zhì)詢,這些探針與片段的不同、但任選重疊的區(qū)域完全互補(bǔ)。在一個(gè)方面,來自HpaII消化的片段的雜交模式與MspI消化反應(yīng)相比。含有CCGG位點(diǎn)但是在HpaII消化后可以被擴(kuò)增的片段指示該片段中CCGG位點(diǎn)的甲基化。該片段在MspI消化反應(yīng)中不應(yīng)該被檢測到。在另一方面,HpaII雜交模式被用來與沒有進(jìn)行第二次消化處理的樣品的雜交模式進(jìn)行比較。沒有第二次消化時(shí),甲基化和未甲基化的片段都能被擴(kuò)增,并通過與陣列雜交而被檢測,這可以作為擴(kuò)增的陽性對照。只帶有未甲基化的CCGG序列的片段將在HpaII反應(yīng)中被消化,所以在隨后的擴(kuò)增步驟中將不能被擴(kuò)增,針對那些片段的探針應(yīng)該不產(chǎn)生高于背景的信號。沒有用第二個(gè)消化步驟處理的樣品也可以被用來估計(jì)甲基化的水平。如果片段僅僅是部分被甲基化,并且存在甲基化和未甲基化片段的混合物,信號的強(qiáng)度可以與未處理樣品的信號強(qiáng)度進(jìn)行比較,以估計(jì)甲基化的片段量。
      在一個(gè)方面,基于第一次片段化反應(yīng)的預(yù)計(jì)產(chǎn)物和顯示雜交的探針的序列,計(jì)算機(jī)系統(tǒng)被用來對基因組中的甲基化片段進(jìn)行定位和作圖。此外,計(jì)算機(jī)還可以被用來鑒定被鑒定片段中的CCGG位點(diǎn)。
      在本發(fā)明的一個(gè)方面,探針陣列包括與含有CpG島的基因組區(qū)域互補(bǔ)的探針。探針可以被設(shè)計(jì)成與某區(qū)域互補(bǔ),該區(qū)域與CpG島位于同樣的限制性片段中,但是可以與不含CpG二核苷酸的區(qū)域互補(bǔ)。
      在一個(gè)實(shí)施方案中,擴(kuò)增的甲基化產(chǎn)物中的甲基化狀態(tài)可以用亞硫酸氫鈉處理方法進(jìn)行分析。在亞硫酸氫鈉修飾過程中未甲基化的胞嘧啶通過三步過程轉(zhuǎn)化為尿嘧啶。這些步驟是將胞嘧啶轉(zhuǎn)化為胞嘧啶磺酸鹽的磺化反應(yīng),將胞嘧啶磺酸鹽轉(zhuǎn)化為尿嘧啶磺酸鹽的脫氨基作用,以及將尿嘧啶磺酸鹽轉(zhuǎn)化為尿嘧啶的堿性脫磺酸作用。轉(zhuǎn)化不發(fā)生在甲基化的胞嘧啶上。參見Clark等Nucleic Acids Res.,22(15)2990-7(1994)。如果胞嘧啶被甲基化了,它將保留為胞嘧啶。如果胞嘧啶未甲基化,它將被轉(zhuǎn)化為尿嘧啶。當(dāng)修飾的鏈通過例如位點(diǎn)特異的引物、隨機(jī)或簡并引物或針對接頭的引物的延伸進(jìn)行拷貝時(shí),如果C被甲基化,則在質(zhì)詢位置將摻入G(與質(zhì)詢的C相對),而如果C是未甲基化的,則在質(zhì)詢位點(diǎn)將會摻入A。當(dāng)雙鏈延伸產(chǎn)物被擴(kuò)增時(shí),那些被轉(zhuǎn)化為尿嘧啶并導(dǎo)致在延伸的引物中摻入腺嘌呤的胞嘧啶,將在擴(kuò)增過程中被胸腺嘧啶所代替。那些沒有被修飾并導(dǎo)致鳥嘌呤摻入的胞嘧啶,仍會保留成胞嘧啶。
      用于DNA亞硫酸氫鹽修飾的試劑盒可以商購自,例如HumanGenetic Signatures的Methyleasy和Chemicon的CpGenome修飾試劑盒。也可參見WO04096825A1,它描述了亞硫酸氫鹽修飾方法,以及Olek等Nuc.Acids Res.245064-6(1994),它公開了在包被于瓊脂糖珠中的物質(zhì)上進(jìn)行亞硫酸氫鹽處理和隨后擴(kuò)增的方法。在一個(gè)方面,諸如二亞乙基三胺的催化劑可以與亞硫酸氫鹽處理結(jié)合使用,參見Komiyama和Oshima,Tetrahedron Letters 358185-8188(1994)。二亞乙基三胺已經(jīng)被顯示在pH5時(shí)能有效催化亞硫酸氫鹽離子誘導(dǎo)的從2’-脫氧胞苷到2’-脫氧尿苷的脫氨基作用。其它的催化劑包括氨、亞乙基二胺、3’,3’-二氨基二丙胺和精胺。在某些方面,脫氨基作用的進(jìn)行采用3-5M亞硫酸氫鈉溶液,在大約50℃保溫12-16小時(shí)。更快的步驟也已經(jīng)報(bào)道,使用pH5.4的9-10M亞硫酸氫鹽,在90℃保溫大約10分鐘,參見Hayatsu等,Proc.Jpn.Acad.Ser.B 80189-194(2004)。
      亞硫酸氫鹽處理允許用多種方法檢測胞嘧啶的甲基化狀態(tài)。例如,任何可以被用來檢測SNP的方法都可以使用,例如參見Syvanen,Nature Rev.Gen.2930-942(2001)??梢允褂美鐔螇A基延伸(SBE)的方法,或與等位基因特異性雜交方法相似的序列特異探針的雜交。
      在一個(gè)方面,DNA樣品用一種或多種限制性酶片段化,在用亞硫酸氫鹽處理前與一個(gè)或多個(gè)接頭序列連接。然后,亞硫酸氫鹽處理的樣品使用與接頭互補(bǔ)的引物,可以通過PCR進(jìn)行擴(kuò)增。擴(kuò)增的條件可以被選擇以優(yōu)選擴(kuò)增選定大小的片段,例如200到2000bp的片段,從而減少樣品的復(fù)雜性。
      在一個(gè)方面,接頭在亞硫酸氫鹽處理后與DNA連接。在優(yōu)選的方面,T4 RNA連接酶被用于接頭的連接。對于PCR引物的添加,引物可以連接到5’末端(優(yōu)選情況下,引物是末端保護(hù)的),然后將片段的3’端脫磷酸化,并且將5’磷酸化的引物連接到3’末端。亞硫酸氫鹽處理可以降解DNA,所以在亞硫酸氫鹽處理前連接的接頭可能通過處理被破壞或切割掉,使得片段不能被擴(kuò)增。亞硫酸氫鹽處理也可以使DNA成單鏈,因此為了連接接頭序列可能必需使用T4 RNA連接酶。亞硫酸氫鹽處理也會在DNA中引入誤配。將未甲基化的胞嘧啶轉(zhuǎn)化為尿嘧啶,產(chǎn)生了G:U堿基對代替G:C堿基對,從而導(dǎo)致雙鏈DNA的變性。
      除了未甲基化的胞嘧啶的脫氨基作用外,亞硫酸氫鹽處理可導(dǎo)致DNA的損壞,使得DNA片段化。在某些方面,亞硫酸氫鹽處理在pH大約5時(shí)需要較長的保溫(大約4-16小時(shí))。在這個(gè)步驟中,胞嘧啶被磺化,然后發(fā)生脫氨。這個(gè)步驟也可能有不需要的副反應(yīng),導(dǎo)致DNA的部分脫嘌呤。在脫氨后,硫酸基團(tuán)通過堿處理除去。堿處理可能導(dǎo)致鏈在發(fā)生脫嘌呤的位點(diǎn)斷裂。產(chǎn)生的片段連接到接頭上,但是可能需要對片段進(jìn)行化學(xué)或酶法的處理以產(chǎn)生適合連接的末端。在某些方面,脫嘌呤位點(diǎn)的堿水解可以產(chǎn)生適合于連接接頭的5’磷酸化末端和因?yàn)槿鄙?’羥基而不適合于連接的3’末端。3’末端可以被處理以除去阻礙連接的修飾。在一個(gè)方面,片段在連接接頭前用AP核酸內(nèi)切酶處理。在另一方面,接頭可以通過兩個(gè)反應(yīng)連接到片段上,在第一個(gè)反應(yīng)中將接頭連接到可用于連接的末端,然后用例如激酶處理反應(yīng)液以從3’端除去磷酸,再用于第二個(gè)連接反應(yīng)。在脫嘌呤和鏈斷裂后形成的末端可以根據(jù)切割的機(jī)制而變化。在某些方面,產(chǎn)生3’磷酸化的核糖,但是在某些方面,產(chǎn)生具有不同末端的混合物,包括具有末端核糖的片段。在優(yōu)選的方面,對3’末端進(jìn)行化學(xué)或酶法的加工以產(chǎn)生適合于接頭連接的末端。
      在另一方面,亞硫酸氫鹽處理的DNA的擴(kuò)增可以用隨機(jī)的引物引發(fā),例如隨機(jī)六聚體。其它的擴(kuò)增方法也可以使用,例如恒溫鏈置換擴(kuò)增、滾環(huán)擴(kuò)增(Lizardi等,Nat.Genet.19225-232,1998)、多重置換擴(kuò)增(Dean等,Proc.Natl.Acad.Sci.995261-5266,2002)以及那些在美國專利公布Nos.20040209298和20040209299中所描述的方法。亞硫酸氫鹽處理會破壞DNA,損壞的DNA很難被擴(kuò)增。能使被降解的樣品,例如那些從福爾馬林固定的石蠟包埋的(FFPE)樣品中獲得的樣品擴(kuò)增的方法,可以被用來擴(kuò)增亞硫酸氫鹽處理的DNA。對于被降解的樣品來說,優(yōu)選的擴(kuò)增方法包括那些在美國專利公布Nos.20040209298和20040209299、Wang等,Gen.Res.142357-2366,2004和Wang等,Nuc.Acids Res.32e76,2004中所公開的方法。在優(yōu)選的方面,用于擴(kuò)增的引物對亞硫酸氫鹽轉(zhuǎn)化的DNA有偏好性,因?yàn)樗鼈兙哂袦p少數(shù)量的G/C堿基對。在擴(kuò)增的第一輪中,未甲基化的胞嘧啶一般已經(jīng)被轉(zhuǎn)化為尿嘧啶了,所以引物可以是有偏好的,含有較少的或沒有鳥嘌呤。
      在一個(gè)方面,亞硫酸氫鹽處理的DNA與針對5-meC的抗體或與5-meC結(jié)合蛋白和針對該蛋白的抗體一起保溫,然后分離結(jié)合了抗體的復(fù)合物。從分離的復(fù)合物得到的DNA如上所述通過連接接頭和PCR擴(kuò)增可加以擴(kuò)增。
      在另一方面,活化誘導(dǎo)的胞苷脫氨酶(AID)被用來代替亞硫酸氫鹽處理。AID可以將未甲基化的胞嘧啶脫氨,而甲基化的CpG基元免受AID介導(dǎo)的脫氨作用,參見Larijani等,Mol Immunol.42(5)599-604(2005)。AID處理的DNA可以采用與亞硫酸氫鹽處理的DNA的同樣方法來加以分析。AID分析的優(yōu)點(diǎn)在于,它可以在較短的時(shí)間內(nèi)進(jìn)行,大約30分鐘,而與此相比,典型的亞硫酸氫鹽處理需要12個(gè)小時(shí)以上,此外,它比復(fù)雜的亞硫酸氫鹽處理所用的步驟少,使用的有毒化學(xué)物質(zhì)也較少。在某些方面,DNA可以用AID處理和亞硫酸氫鹽處理相結(jié)合的方法來處理。這兩種方法的組合可以被用來改進(jìn)AID處理的效率,縮短亞硫酸氫鹽處理的時(shí)間,并且減少DNA的降解。
      在一個(gè)方面,特定的胞嘧啶的甲基化水平可以被定量。雜交模式可以被分析以測量甲基化的水平,雜交的強(qiáng)度與甲基化程度相關(guān)。例如,如果特定的胞嘧啶在樣品DNA中有80%是甲基化的,則在亞硫酸氫鹽處理后C“等位基因”的標(biāo)準(zhǔn)化強(qiáng)度應(yīng)該是T“等位基因”的標(biāo)準(zhǔn)化強(qiáng)度的約4倍。使用亞硫酸氫鹽處理對特定胞嘧啶甲基化水平進(jìn)行定量的方法已經(jīng)公開了,例如在Thomassin等,Nuc.Acids Res.32e168(2004)中。
      在優(yōu)選的方面,產(chǎn)物通過與陣列的雜交進(jìn)行分析。在一個(gè)示例性實(shí)施方案中,陣列被設(shè)計(jì)來檢測亞硫酸氫鹽處理的產(chǎn)物,其原理與可商購的Affymetrix 10K作圖陣列相同。10K陣列對超過11,000個(gè)不同的人類SNPs中的每一個(gè)具有探針組。每個(gè)探針組的第一多個(gè)探針與SNP的第一種等位基因完全互補(bǔ),而第二多個(gè)探針與SNP的第二種等位基因完全互補(bǔ)。如果存在第一種等位基因,信號就被第一多個(gè)探針檢測,而如果存在第二種等位基因,信號就被第二多個(gè)探針檢測。雜合子則將被兩者都檢測到。探針組可以包括對照探針,例如錯(cuò)配探針,質(zhì)詢位置相對于探針的中央位置有偏移的探針也可以包括,例如SNP位置可以位于中央位置,也可以偏離探針的中央向5’或3’移動1個(gè)或多個(gè)位置。對于有疑問的甲基化位點(diǎn)也可以設(shè)計(jì)類似的探針組,處理該位置,就好象它是帶有C/G或T/A等位基因的SNP。兩條鏈都可以被分析。示例的探針和陣列在美國專利申請No.10/681,773和美國專利Nos.5,733,729、6,300,063、6,586,186和6,361,947中有描述。亞硫酸氫鹽處理可以修飾片段中任何未甲基化的C,包括引物結(jié)合位點(diǎn)中的C和質(zhì)詢位置周圍區(qū)域中的C。在優(yōu)選實(shí)施方案中,接頭的設(shè)計(jì)應(yīng)將此考慮在內(nèi),例如接頭可以設(shè)計(jì)成在引物結(jié)合位點(diǎn)不含有C,引物也可以用對亞硫酸氫鹽修飾有抗性的修飾堿基進(jìn)行合成以致引物結(jié)合位點(diǎn)的序列不會被處理所改變,例如可以將C甲基化,或者引物可以被設(shè)計(jì)成假定接頭中的C會變成U。
      可以從序列中檢測新的SNPs的重新測序陣列也可以用來檢測亞硫酸氫鹽處理的產(chǎn)物。重新測序陣列和重新測序方法在例如Cutler等Genome Res.2001 Nov;11(11)1913-25和美國專利申請No.20030124539中有描述,在此以其全文引為參考。一般來說,重新測序陣列檢測參比序列中所有可能的單核苷酸變異。與參比序列完全互補(bǔ)的探針被包括在內(nèi),并且逐個(gè)地質(zhì)詢序列中的多個(gè)位點(diǎn)以尋找參比序列中的變異。對于每個(gè)可能的變異來說,與變體序列完全互補(bǔ)的探針都被包括在內(nèi)。陣列可以被平鋪開以檢測一個(gè)或多個(gè)參比序列中所有可能的單核苷酸變異。被陣列質(zhì)詢的參比序列可以是例如一個(gè)或多個(gè)完整的染色體、一個(gè)或多個(gè)完整的基因組、一個(gè)或多個(gè)線粒體基因組、或者是從一個(gè)或多個(gè)基因組內(nèi)選擇的目的區(qū)域。在一個(gè)實(shí)施方案中,重新測序陣列被平鋪有已知或懷疑被甲基化的區(qū)域。在某些實(shí)施方案中,CpG位點(diǎn)可能靠在一起,因此陣列的探針可以與重疊的CpG位點(diǎn)互補(bǔ)。例如,如果探針是25個(gè)聚體,第13位的質(zhì)詢位置與第一個(gè)胞嘧啶位置互補(bǔ),在第一個(gè)胞嘧啶上游12個(gè)堿基對或下游12個(gè)堿基對的范圍內(nèi)可能存在第二個(gè)CpG。第二個(gè)胞嘧啶可以是甲基化的也可以是未甲基化的。探針可以被設(shè)計(jì)來檢測兩種可能性,即都是甲基化的(都是C)、都是未甲基化的(都是T)、一個(gè)是甲基化的(C)另一個(gè)是未甲基化的(T)??梢栽O(shè)計(jì)與每一種可能的結(jié)果完全互補(bǔ)的探針。
      在本發(fā)明的另一方面,擴(kuò)增的甲基化的靶相對于未甲基化的靶得到了富集。在一個(gè)示例的實(shí)施方案中,使用限制性酶將懷疑含有m5C的核酸樣品片段化,并將接頭與片段連接。針對m5C的抗體被用來分離含有m5C的連接了接頭的片段。此外,核酸也可以與能夠特異性結(jié)合m5C的蛋白一起保溫,然后針對那些蛋白的抗體可以被用來分離甲基化的片段。針對5-meC的抗體是可得到的,例如來自Abcam(Cambridge,UK)的ab 1884。使用與接頭互補(bǔ)的引物通過PCR將分離的片段進(jìn)行擴(kuò)增,擴(kuò)增的片段可以與探針陣列雜交。在一種優(yōu)選方面,陣列的探針與基因組的一個(gè)或多個(gè)區(qū)域互補(bǔ)。陣列中示出高于背景的雜交的區(qū)域指明了基因組中被甲基化的區(qū)域。在優(yōu)選實(shí)施方案中,陣列含有針對基因組的富含CpG的區(qū)域、基因內(nèi)區(qū)域或已知或推測是調(diào)控區(qū)的區(qū)域的探針。在另一個(gè)實(shí)施方案中,被免疫沉淀的片段用亞硫酸氫鹽處理,以便可以鑒定甲基化胞嘧啶的精確位置。樣品可以通過與上述的序列特異性探針的陣列雜交來進(jìn)行分析。
      在本發(fā)明的一個(gè)方面,甲基結(jié)合蛋白例如MeCP2和SAP18/30(結(jié)合Sin3的多肽18/30)與基因組DNA樣品混合,用于富集甲基化的序列。針對甲基CpG結(jié)合結(jié)構(gòu)域蛋白(MBDs)例如MBD2和MBD3的抗體可以被用來分離含有甲基化的DNA。抗5-meC結(jié)合蛋白的抗體是可得到的,例如針對MeCP2(IMG-297)的抗體來自Imgenex Corp.(San Diego,CA)。在另一方面,識別5-meC的抗體可以被用來富集甲基化的序列。在優(yōu)選情況下在抗體結(jié)合前將DNA變性。
      在本發(fā)明的另一方面,甲基化被用作以相對可再現(xiàn)的方式使基因組分成亞類的手段,以便在進(jìn)一步分析前減少樣品的復(fù)雜性。基因組的某些區(qū)域穩(wěn)定地被甲基化,同時(shí)其他區(qū)域穩(wěn)定地被未甲基化。區(qū)分甲基化和未甲基化DNA的機(jī)制可以被用來獲得富集了甲基化DNA或未甲基化DNA的樣品的組分。通過這種方法樣品的復(fù)雜性得以減少。如果擴(kuò)增采用的是保留甲基化信息的方法,則分離可以在擴(kuò)增之前進(jìn)行。通常都希望在雜交之前減少含有復(fù)雜的核酸混合物的樣品的復(fù)雜度,以便改善檢測的靈敏度,并使背景最小化。
      在本發(fā)明的一個(gè)方面,公開了在分離甲基化和未甲基化組分之后分析核酸樣品的方法。被分析的組分可以是甲基化的組分也可以是未甲基化的組分,或者可以進(jìn)行甲基化的和未甲基化的組分的比較。在許多實(shí)施方案中,未甲基化的組分通過例如從未甲基化的DNA中分離出甲基化的DNA,或者通過優(yōu)先擴(kuò)增未甲基化的DNA而富集。對富集有亞類起始核酸的組分的分離可以用作減少樣品復(fù)雜性的方法,或者用作測量甲基化組分和未甲基化組分之間區(qū)別的方法。在一個(gè)實(shí)施方案中,該方法尤其用來分析樣品,以鑒定出在未甲基化組分中存在的基因組區(qū)域和甲基化組分中存在的基因組區(qū)域。在許多實(shí)施方案中,分離甲基化和未甲基化核酸的方法與用探針陣列分析核酸的方法相結(jié)合。
      在一個(gè)方面,通過用酶例如Mse I消化DNA樣品,接著大小選擇來富集CpG島。Mse I將基因組DNA切成小片段,但是在CpG島中切割很罕見。較大的富含CpG島的片段可以通過任何現(xiàn)有的大小分離方法從較小的片段中分離出來。
      復(fù)雜性減少了的樣品代表了更復(fù)雜的樣品,例如基因組,它們可以用于多種分析方法,包括那些含有雜交步驟的方法。復(fù)雜性減少了的樣品可以被用于例如測序、基因分型、拷貝數(shù)的定量評估、LOH分析和CGH分析。在許多實(shí)施方案中,分析是通過將復(fù)雜性減少了的樣品與探針陣列雜交來進(jìn)行的。用于表達(dá)分析、重新測序和基因分型的陣列可以得自,例如Affymetrix,Inc.,Santa Clara,CA。
      從未甲基化的核酸分離甲基化核酸的方法已經(jīng)有描述,參見例如美國專利公布Nos.20010046669、20030157546和20030180775,在此分別以其全文引為參考。
      在植物和哺乳動物基因組中重復(fù)序列通常以高的拷貝數(shù)存在,具有高水平的胞嘧啶和低的轉(zhuǎn)錄活性(參見,例如Martienssen,R.A.(1998)Trends Genet.14263;Kass,S.U.等(1997)Trends Genet.13335;SanMiguel,P.等(1996)Science 274765;Timmermans,M.C.,等(1996)Genetics 1431771;Martienssen,R.A.和E.J.Richards,(1995)Curr.Opin.Genet.Dev.5234-242;Bennetzen,J.L.,等(1994)Genome 37565;White,L.F.,等(1994)Proc.Natl.Acad.Sci.U.S.A.9111792;Moore,G.等Genomics 15472)。高拷貝的DNA序列通常是甲基化的,并且一般不出現(xiàn)在表達(dá)的基因的區(qū)域。從文庫或從核酸樣品中消除或減少這樣的高拷貝甲基化DNA的方法可以被用來富集目的靶序列,產(chǎn)生復(fù)雜性被降低的樣品,利于進(jìn)一步分析。通常未甲基化的區(qū)域是含有基因的區(qū)域,是最希望被分析的區(qū)域。
      通過將核酸文庫,例如可能是部分文庫的基因組文庫在甲基化限制性宿主,例如大腸桿菌菌株JM101、JM107和JM109中繁殖,可以從核酸樣品中富集出未甲基化的序列。這種方法、甲基化過濾最近才被用來對玉米的基因組進(jìn)行測序,參見Palmer等Science 3022115-2117(2003)。該方法阻止了帶有甲基化插入物的克隆的繁殖,導(dǎo)致與對照文庫相比基因富集了5到7倍。
      在另一個(gè)實(shí)施方案中,核酸樣品用甲基化敏感的酶,例如只切割未甲基化的DNA或只切割甲基化的DNA的酶,或切割甲基化或未甲基化DNA的甲基化不敏感的酶進(jìn)行消化。不同消化的樣品被擴(kuò)增,擴(kuò)增的片段可以被標(biāo)記,然后使用微陣列進(jìn)行檢測。樣品可以平行地用甲基化敏感和甲基化不敏感的酶消化,并在每種處理后分析以確定存在哪些序列。在第一種樣品中出現(xiàn)但是在第二種樣品中不出現(xiàn)的序列表明該序列是甲基化的。
      在一個(gè)示例的實(shí)施方案中,核酸樣品從某來源,例如從個(gè)體獲得,核酸可以通過例如用一個(gè)或多個(gè)限制性酶消化而片段化,然后接頭序列連接到片段上產(chǎn)生連接了接頭的片段。連接了接頭的片段可以用切割甲基化DNA但是不切割未甲基化DNA的酶,例如McrBC來進(jìn)行消化。接著,樣品可以用與接頭序列雜交的引物進(jìn)行擴(kuò)增。那些已經(jīng)被甲基特異性酶切開的甲基化片段不會被擴(kuò)增,因?yàn)樗鼈冎辉谝欢擞薪宇^,從而使未甲基化的DNA得到選擇性的擴(kuò)增。
      擴(kuò)增的產(chǎn)物可以通過例如與微陣列雜交來檢測。McrBC消化的樣品與沒有用McrBC消化的平行樣品進(jìn)行比較,以鑒定被甲基化的區(qū)域。如果產(chǎn)物平行地與探針陣列雜交,針對樣品中被甲基化的區(qū)域的探針應(yīng)在沒有用McrBC消化的樣品中顯示出雜交,但是在用McrBC消化的樣品中不顯示出雜交。因?yàn)槠沃屑谆拇嬖谑峭ㄟ^檢測是否存在限制性片段來檢測的,在設(shè)計(jì)合適的探針時(shí)有相當(dāng)?shù)撵`活性,這將是合適的。例如,被檢測的片段一般在200和1,000個(gè)堿基對之間,探針可以被靶向到片段的任何區(qū)域。探針無需與甲基化的位點(diǎn)互補(bǔ),但是可以與上游或下游位點(diǎn)互補(bǔ)。探針可以被靶向到片段的一個(gè)區(qū)域或片段中的多個(gè)區(qū)域,它們可以被靶向到片段上的特定特征,例如片段中的SNP或片段中的一個(gè)或多個(gè)CpG。在一個(gè)實(shí)施方案中,可以使用含有均勻分隔在整個(gè)基因組的探針的探針陣列。
      在一個(gè)示例的實(shí)施方案中,擴(kuò)增的產(chǎn)物被標(biāo)記,并且與基因分型陣列,例如作圖的10K或100K陣列(Affymetrix,Santa Clara)雜交。GeneChip作圖陣列(WGSA)可以被用來減少樣品的復(fù)雜性?;痉治霾襟E如下總基因組DNA(250ng)用限制性酶(例如Xba I)消化,與能夠識別4個(gè)粘著堿基對突出的接頭連接。所有的限制性酶消化片段,不論大小,都是接頭連接的底物。識別接頭序列的通用引物被用來擴(kuò)增連接了接頭的DNA片段。擴(kuò)增使用了最適于優(yōu)先擴(kuò)增選定的大小范圍(例如250到2000bp)的片段的PCR條件。對于不同的大小范圍,例如200到1,000堿基對,可以選擇最適化條件。然后,擴(kuò)增的DNA被片段化、標(biāo)記并與作

      圖10K陣列雜交。與由計(jì)算機(jī)模擬消化所預(yù)測的存在于選定大小范圍內(nèi)的片段(例如當(dāng)基因組用Xba I消化時(shí)長度為250到1000bp)中的基因組區(qū)域互補(bǔ)的探針被選擇出來包含在陣列中。通過這種方法,擴(kuò)增富集了亞類片段,同亞類的片段可以被重復(fù)地富集,陣列被設(shè)計(jì)用來質(zhì)詢這些片段中的至少一部分。作圖10K和100K陣列質(zhì)詢存在于預(yù)計(jì)的片段上的已知SNPs的基因型,但是在其他實(shí)施方案中,陣列可以被設(shè)計(jì)用來質(zhì)詢片段是否存在。對于關(guān)于作圖10K陣列和分析的其它信息參見GeneChip人類作圖10K陣列和分析試劑盒數(shù)據(jù)單,零件號碼701366 Rev.4,Affymetrix,Inc.,以及作圖10K手冊。
      在一個(gè)實(shí)施方案中,含有與生物體中的基因互補(bǔ)的探針的陣列可以被用來分析甲基化的或未甲基化的組分。例如,可得自Affymetrix的表達(dá)陣列,例如人類基因組U133 Plus 2.0陣列,可以被使用。有多種生物體,包括小鼠和大鼠的表達(dá)陣列可以獲得,并且對于選擇的生物體,其表達(dá)陣列也可以被定制。含有針對預(yù)測或已知的外顯子或剪接連接(內(nèi)含子-外顯子或外顯子-外顯子剪接點(diǎn))的探針的陣列也可以使用。
      在一個(gè)實(shí)施方案中,平鋪了完整的基因組,一個(gè)或多個(gè)完整的染色體或完整的基因組的代表或一個(gè)或多個(gè)完整的染色體的高密度陣列可以被用來分析通過分離甲基化和未甲基化DNA而制備的樣品。例如,可以使用這樣的陣列,它含有的探針沿著一個(gè)或多個(gè)染色體或完整基因組分隔在平均每35個(gè)堿基對上。參見,例如Kapranov等Science296916-919(2002)。也可參見美國專利申請Nos.10/741,193、10/736,054、10/714,253和10/712,322。在一個(gè)實(shí)施方案中,已經(jīng)被富集了未甲基化的序列的樣品可以通過轉(zhuǎn)錄因子結(jié)合親和性進(jìn)行分析。與轉(zhuǎn)錄因子結(jié)合的序列可以通過與轉(zhuǎn)錄因子的親和而純化,然后通過陣列分析得以鑒定。通過富集甲基化的序列,用僅切割未甲基化DNA的酶消化,同樣可以降低復(fù)雜性。
      眾多甲基依賴的限制性酶對于本領(lǐng)域的專業(yè)技術(shù)人員來說是眾所周知的,可以從例如New England Biolabs商購到。甲基依賴的限制性酶的例子包括McrBC、McrA、MrrA和DpnI。McrBC是核酸內(nèi)切酶,可以切割在一條或兩條鏈上含有甲基胞嘧啶(例如,5-甲基胞嘧啶或5-羥甲基胞嘧啶或N4-甲基胞嘧啶,在Raleigh,E.A.(1992)Mol.Microbiol.6,1079-1086中有綜述)的DNA。McrBC不作用于未甲基化的DNA(Sutherland,E.等(1992)J.Mol.Biol.225,327-334)。McrBC的識別位點(diǎn)是5′...PumC(N40-3000)PumC...3′。被McrBC識別的DNA上的位點(diǎn)由兩個(gè)(G/A)mC形式的半位點(diǎn)組成。這些半位點(diǎn)可以彼此分開多達(dá)3kb,但是最適的分離距離為55-103個(gè)堿基對(Stewart,F(xiàn).J.和Raleigh E.A.(1998)Biol.Chem.379,611-616以及Panne,D.等(1999)J.Mol.Biol.290,49-60.)。McrBC的切割需要GTP,但是在存在非可水解的GTP類似物的情況下,酶將特異性地與甲基化的DNA結(jié)合,但不切割(Stewart,F(xiàn).J.等(2000)J.Mol.Biol.298,611-622)。重組McrBC可以得自例如New England Biolabs。McrBC可以被用來確定CpG二核苷酸的甲基化狀態(tài)。McrBC作用于一對PumCG序列元件,但是不識別內(nèi)部的胞嘧啶被甲基化了的Hpa II/Msp I位點(diǎn)(CCGG)。這個(gè)非常短的半位點(diǎn)共有序列(PumC)使得存在的大部分甲基胞嘧啶能夠被檢測到。
      在一個(gè)實(shí)施方案中,用McrBC消化的條件是50mM NaCl,10mMTris-HCl,10mM MgCl2,1mM二硫蘇糖醇(25℃,pH7.9),以及100μg/ml BSA和1mM GTP。37℃保溫。條件可以改變。NEB定義一個(gè)單位為37℃下在50μl總反應(yīng)體積中,1小時(shí)內(nèi)切割1μg含有單個(gè)McrBC位點(diǎn)的質(zhì)粒所需的酶量。切割基因組DNA時(shí)可以使用5-10倍過量的酶。酶可以通過加熱至65℃20分鐘來失活。McrBC在每一對半位點(diǎn)之間造成一次切割,切割靠近一個(gè)半位點(diǎn)或另一個(gè)半位點(diǎn),但是切割位置分布在距離甲基化的堿基大約30個(gè)堿基對的幾個(gè)堿基對中。也參見,Bird,A.P.(1986)Nature 321,209-213和Gowher,H.等(2000)EMBO J.19,6918-6923。
      對McrBC的研究或利用在文獻(xiàn)中已有報(bào)道,例如Gast等BiolChem.378(9)975-82,(1997),Pieper等,Rabinowicz,Methods Mol Biol.23621-36(2003),Badal等J Virol.77(11)6227-34(2003)以及Chotai和Payne,J Med Genet.35(6)472-5(1998)。也可參見Lyko,F(xiàn).等Nat.Genet.,23,363-366(2000),其中使用了McrBC作為在果蠅中富集未甲基化的DNA的工具。
      在一個(gè)方面,基因組DNA通過本領(lǐng)域所熟知的任何方法被分成甲基化的組分和未甲基化的組分。每個(gè)組分可以單獨(dú)與陣列雜交,或者每個(gè)組分可以用不同的可檢測的標(biāo)記物,例如不同顏色的熒光染料進(jìn)行標(biāo)記(例如,未甲基化的DNA可以用綠色標(biāo)記,而甲基化的DNA可以用紅色標(biāo)記),然后,將上述兩者與同樣的探針陣列雜交。參見,例如美國專利No.6,576,424,在此引為參考。如果基因組的區(qū)域沒有甲基化,那么對應(yīng)于該基因組區(qū)域的特征將以綠色被檢測。如果該區(qū)域是甲基化的,那么這些特征將以紅色被檢測。如果紅色和綠色都被檢測到了,樣品中該區(qū)域可能已被部分甲基化,紅色與綠色的比率可以被用來確定甲基化的程度。
      在一個(gè)方面,公開的方法被用來獲得腫瘤或組織的甲基化特征或分布圖。在癌癥的診斷、治療和結(jié)果預(yù)測方面,甲基化受到特別的關(guān)注,參見Jones和Baylin,Nat.Rev.Genet.3415-428(2002)以及Bird,Genes Dev.166-21(2002)。甲基化的模式可能與特定的腫瘤相關(guān)。來自特定類型腫瘤的樣品可以被分離,并且使用公開的方法進(jìn)行分析,獲得腫瘤類型或腫瘤階段的甲基化模式特征。在一個(gè)實(shí)施方案中,來自個(gè)體或腫瘤的樣品可以與已知類型或階段的腫瘤的甲基化模式進(jìn)行比較,以確定未知的樣品在甲基化模式上是否與一個(gè)或多個(gè)已知的腫瘤類型相似。按照這種方法獲得的模式可以用來診斷疾病、疾病階段、監(jiān)控治療、預(yù)測治療結(jié)果以及監(jiān)控疾病進(jìn)展。在許多實(shí)施方案中,分析通過直接比較雜交模式進(jìn)行,而模式與任何特定序列的存在或不存在無關(guān)。從被分析的未知樣品獲得的模式和從已知樣品獲得的模式之間的不同或相同點(diǎn)可以被用來確定未知樣品是否在甲基化模式上可能與已知樣品相匹配。
      在一個(gè)實(shí)施方案中,血液樣品被分析來檢測脫落到血流中的腫瘤細(xì)胞的甲基化模式的變化。異常的甲基化或脫甲基化模式是腫瘤類型的特征,可通過血樣的分析進(jìn)行鑒定。在一個(gè)示例的實(shí)施方案中,樣品用第一個(gè)限制性酶片段化,并且片段被連接到接頭上。然后,連接了接頭的片段用甲基化依賴或甲基化敏感的酶消化。不被消化的連接了接頭的片段通過PCR使用針對接頭的引物進(jìn)行擴(kuò)增。PCR擴(kuò)增的產(chǎn)物與探針的陣列雜交以產(chǎn)生雜交模式。雜交模式可以與來自另一個(gè)被同樣處理的樣品的雜交模式進(jìn)行比較。雜交模式之間的區(qū)別指示兩個(gè)樣品之間甲基化模式的區(qū)別。疾病狀態(tài)、正常狀態(tài)或組織類型的特征的雜交模式可以產(chǎn)生數(shù)據(jù)庫,并用來比較未知樣品的雜交模式,以鑒定出相似的模式。參見,例如美國專利No.6,228,575,它公開了基于比較雜交模式對樣品表征的方法。有多種陣列可用于這個(gè)目的,陣列沒必要特異地設(shè)計(jì)來檢測來自被分析生物體的特定的基因組序列。
      在一個(gè)實(shí)施方案中,未甲基化的DNA的富集與比較基因組雜交(CGH)相結(jié)合來分析腫瘤細(xì)胞,以鑒定腫瘤DNA和正常DNA之間的區(qū)別。參見,例如Kallioniemi等Methods 9(1)113-121(1996)。等量的不同標(biāo)記的腫瘤DNA和正常的參比DNA(例如一個(gè)可以用生物素標(biāo)記,而另一個(gè)用地高辛標(biāo)記)可以與探針陣列雜交,信號強(qiáng)度被定量,并且腫瘤相對于正常細(xì)胞中的過量或不足信號可以被定量。在一個(gè)實(shí)施方案中,分析甲基化狀態(tài)的方法可以與基因組中一個(gè)或多個(gè)區(qū)域的拷貝數(shù)的估計(jì)方法相結(jié)合。許多癌癥與基因組中一個(gè)或多個(gè)區(qū)域的拷貝數(shù)的增加有關(guān)??截悢?shù)的增加可以通過與陣列的雜交而檢測。拷貝數(shù)的增加被檢測為雜交強(qiáng)度的增加。使用寡聚核苷酸陣列分析拷貝數(shù)的方法已公開在,例如美國專利公布No.20040157243中,其中公開了特定的計(jì)算機(jī)方法,使用例如Affymetrix 10K作圖陣列和分析進(jìn)行拷貝數(shù)分析。
      在另一方面,在存在或不存在甲基化的基礎(chǔ)上,利用組分的分離來減少復(fù)雜性的方法被用來富集樣品中的目的序列,該樣品是宿主和病原基因組DNA的混合物。一些生物體在它們的基因組中缺少5-meC修飾或水平降低的5-meC。例如,病原體如支原體缺少5-meC或水平很低。其它的例子參見,例如Razin和Razin,NAR 81383-1390(1980)。未甲基化的病原體DNA可以通過用甲基依賴性酶如McrBC消化樣品來富集。未甲基化的病原體DNA也可以通過使用針對5-meC的抗體或5-meC結(jié)合蛋白與針對結(jié)合蛋白的抗體相結(jié)合來消耗甲基化的DNA而得以富集。在一個(gè)方面,樣品首先用其識別位點(diǎn)中沒有CpG的限制性酶進(jìn)行片段化,再將接頭連接到片段上。連接有接頭的片段用甲基化依賴性酶消化,以便被甲基化并且含有酶識別位點(diǎn)的片段被片段化。沒有被甲基化依賴性酶片段化的連接了接頭的片段通過PCR使用針對接頭的引物進(jìn)行擴(kuò)增。這樣產(chǎn)生了相對甲基化的DNA來說未甲基化的DNA被富集了的擴(kuò)增產(chǎn)物。
      在一個(gè)實(shí)施方案中,利用那些優(yōu)先擴(kuò)增未甲基化的核酸的方法來減少基因組樣品的復(fù)雜性的方法,可以被用來在復(fù)雜的混合物中富集病原體DNA。例如,如果核酸樣品是從被認(rèn)為感染有病原體的病人中分離出來的,該核酸樣品可能含有病人的DNA和病原體的DNA的混合物。許多原核生物的病原體與它們感染的生物體相比具有較低的甲基化水平,因此在擴(kuò)增前用優(yōu)先降解甲基化DNA的酶處理混合樣品可以被用來相對于宿主DNA來說富集病原體DNA。然后可以通過例如與核酸探針陣列的雜交來分析擴(kuò)增的樣品以檢測病原體DNA。由于宿主DNA的存在而引起的潛在的干擾效應(yīng)被減小了,從而對病原體DNA的檢測得到改善。
      在一個(gè)實(shí)施方案中,被懷疑含有病原體DNA的核酸樣品被片段化以產(chǎn)生片段,以及接頭被連接到片段的末端。然后,接頭修飾的片段用切割甲基化DNA但是不切割未甲基化DNA的酶,例如McrBC進(jìn)行處理。含有McrBC識別位點(diǎn)的片段將被切割為較小的片段,它們只在一個(gè)末端有接頭序列。接著,樣品使用與接頭中的序列互補(bǔ)的引物通過PCR進(jìn)行擴(kuò)增。被McrBC切割的片段將不被擴(kuò)增,因?yàn)樗鼈冎挥幸粋€(gè)接頭,因而只在一個(gè)末端有引發(fā)位點(diǎn)。由于病原體的序列沒有被甲基化,它不被McrBC切割,并會被擴(kuò)增。
      可以被用來檢測甲基化的陣列包括例如平鋪陣列,該陣列中的探針對目的區(qū)域而言,在亞硫酸氫鹽處理后,與多個(gè)可能的CpG和5-meCpG的組合完全互補(bǔ)。兩條鏈或一條鏈上的甲基化都可以被分析。如果探針針對一條鏈設(shè)計(jì),它們也可以被設(shè)計(jì)用來質(zhì)詢?nèi)我庖粭l鏈。在某些方面,選擇有待質(zhì)詢的鏈?zhǔn)呛邪奏さ逆?,但是在其它方面,那條鏈已經(jīng)在修飾后被擴(kuò)增了,以至于得到的擴(kuò)增的雙鏈產(chǎn)物含有A:T堿基對代替了C:G堿基對,任何一條鏈都可以被質(zhì)詢。所有未甲基化的胞嘧啶可以被轉(zhuǎn)化為尿嘧啶,探針和引物在設(shè)計(jì)時(shí)可以將這考慮在內(nèi),例如,在與胞嘧啶位置互補(bǔ)的位置上,探針與基因組中胞嘧啶的位置互補(bǔ)的位置應(yīng)有腺嘌呤。
      據(jù)估計(jì)在人類基因組中有大約2800萬到2900萬個(gè)CpG,其密度在低密度的CpG區(qū)域預(yù)計(jì)是大約每50-100個(gè)堿基對1個(gè)CpG,而在高密度區(qū)域大約是每20個(gè)堿基對1個(gè)CpG。在一個(gè)方面,陣列被設(shè)計(jì)成質(zhì)詢超過50,000、超過100,000、超過500,000、超過1,000,000、超過2,500,000或超過5,000,000個(gè)這些CpG的甲基化狀態(tài)。在某些實(shí)施方案中,陣列還含有質(zhì)詢也能夠在胞嘧啶上被甲基化的CNG位置的探針。質(zhì)詢可以例如類似于檢測胞嘧啶位點(diǎn)的多態(tài)性,反映出由于化學(xué),例如亞硫酸氫鹽或酶學(xué),例如AID的機(jī)制產(chǎn)生的從胞嘧啶到尿嘧啶的變化?;谙噜廋pG二核苷酸的定位可以選擇出特定的CpG來質(zhì)詢。當(dāng)在探針互補(bǔ)的區(qū)域內(nèi),例如探針的25個(gè)堿基中,有多于1個(gè)CpG時(shí),為質(zhì)詢中央CpG所需的探針的完全互補(bǔ)性可能受到探針區(qū)域內(nèi)第二、第三或第四個(gè)CpG的甲基化狀態(tài)的影響。在某些方面,用于質(zhì)詢第一個(gè)CpG(質(zhì)詢的CpG)的探針組可以被設(shè)計(jì)成包含了由于次級(非質(zhì)詢的)CpG的甲基化狀態(tài)的改變而引起的所有可能的序列變化的組合。對于每一個(gè)可能的序列變化來說,這需要附加的探針。在另一方面,在上游或下游12、15、20或30個(gè)堿基內(nèi)沒有另外的CpG被選擇來質(zhì)詢。
      結(jié)論本發(fā)明公開了保留后生信息的基因組DNA擴(kuò)增方法。在一個(gè)方面,DNA甲基轉(zhuǎn)移酶活性被包括在基因組DNA的擴(kuò)增過程中。該甲基轉(zhuǎn)移酶活性識別半甲基化的位點(diǎn),并在擴(kuò)增過程中使用甲基化的模板DNA為指導(dǎo)對新合成的DNA進(jìn)行甲基化。
      上面的描述是說明性的而非限制性的。對于本領(lǐng)域的專業(yè)技術(shù)人員來說,在瀏覽了本公開后,顯然可以對本發(fā)明做出許多修改。因此,本發(fā)明的范圍將不是參照上面的描述而確定,而是參照隨附的權(quán)利要求及其所有等同物的范圍而確定。
      權(quán)利要求
      1.一種擴(kuò)增基因組DNA同時(shí)維持甲基化狀態(tài)的方法,包括(a)獲得含有甲基化基因組DNA的樣品;(b)將一條或多條引物與基因組DNA雜交;(c)用DNA聚合酶延伸所述一條或多條引物,產(chǎn)生含有新合成的未甲基化的cDNA鏈和甲基化的模板鏈的半甲基化的雜合體;(d)用DNA甲基轉(zhuǎn)移酶活性在存在甲基供體的情況下處理雜合體,其中的DNA甲基轉(zhuǎn)移酶活性使雙鏈DNA中的半甲基化位點(diǎn)甲基化,產(chǎn)生含有新合成的甲基化的cDNA鏈和甲基化的模板鏈的甲基化的雜合體;(e)將甲基化的雜合體變性;以及(f)將一條或多條引物與步驟(e)的產(chǎn)物雜交,并且重復(fù)步驟(c)和(d)至少1次以產(chǎn)生甲基化的擴(kuò)增產(chǎn)物。
      2.權(quán)利要求1的方法,其中的DNA聚合酶是熱穩(wěn)定的聚合酶。
      3.權(quán)利要求1的方法,其中的一條或多條引物包含隨機(jī)序列引物的集合。
      4.權(quán)利要求1的方法,其中的一條或多條引物包含多個(gè)位點(diǎn)特異性引物,它們與CpG島的1,000個(gè)堿基中至少15個(gè)堿基的區(qū)域完全互補(bǔ)。
      5.權(quán)利要求1的方法,其中的DNA聚合酶是鏈置換酶。
      6.權(quán)利要求5的方法,其中的鏈置換酶是phi29。
      7.權(quán)利要求1的方法,其中的DNA甲基轉(zhuǎn)移酶活性包括Dnmt 1酶。
      8.權(quán)利要求7的方法,其中的Dnmt 1選自小鼠Dnmt 1和人類Dnmt 1。
      9.權(quán)利要求7的方法,其中的Dnmt 1是重組的。
      10.權(quán)利要求1的方法,其中的甲基供體是S-腺苷甲硫氨酸。
      11.權(quán)利要求1的方法,其中的DNA甲基轉(zhuǎn)移酶活性是人類或小鼠Dnmt 1的變體形式,相對于天然酶它增加了對半甲基化DNA的特異性。
      12.一種在基因組DNA樣品中分析至少一個(gè)基因組區(qū)域的甲基化狀態(tài)以鑒定被甲基化的區(qū)域的方法,包括(a)按照權(quán)利要求1的方法擴(kuò)增基因組DNA樣品,產(chǎn)生含有擴(kuò)增的甲基化產(chǎn)物的擴(kuò)增樣品;(b)將從(a)得到的擴(kuò)增樣品用第一個(gè)限制性酶進(jìn)行片段化,并且將接頭與片段連接產(chǎn)生連接了接頭的片段;(c)用第二個(gè)限制性酶處理從(b)獲得的樣品的第一個(gè)等份試樣,并用第三個(gè)限制性酶處理從(b)獲得的樣品的第二個(gè)等份試樣,其中第二和第三個(gè)限制性酶是同裂酶,其中第二個(gè)限制性酶是甲基化敏感的,而第三個(gè)限制性酶是甲基化不敏感的;(d)通過PCR使用與接頭互補(bǔ)的引物擴(kuò)增從(c)獲得的第一和第二個(gè)等份試樣,以便從第一個(gè)等份試樣產(chǎn)生第一個(gè)擴(kuò)增樣品,而從第二個(gè)等份試樣產(chǎn)生第二個(gè)擴(kuò)增樣品;(e)將(d)的產(chǎn)物進(jìn)行標(biāo)記,并將標(biāo)記的產(chǎn)物平行地與探針陣列雜交,以便從第一個(gè)擴(kuò)增樣品產(chǎn)生第一個(gè)雜交模式,而從第二個(gè)擴(kuò)增樣品產(chǎn)生第二個(gè)雜交模式,其中的陣列含有多個(gè)探針,每個(gè)探針至少15個(gè)堿基長,并且都與選定的生物體基因組的200到2,000個(gè)堿基對的限制性片段完全互補(bǔ),這些限制性片段是選定的生物體的基因組用所述第一個(gè)限制性酶消化產(chǎn)生的;以及(f)將第一個(gè)和第二個(gè)雜交模式進(jìn)行比較,以鑒定在第一個(gè)模式中存在而在第二個(gè)模式中不存在的片段,其中在第一個(gè)模式中存在的那些片段被鑒定為甲基化的區(qū)域。
      13.權(quán)利要求1的方法,進(jìn)一步包括在擴(kuò)增樣品中分析多個(gè)基因組區(qū)域的甲基化狀態(tài)以鑒定多個(gè)沒有被甲基化的區(qū)域,使用的方法包括將擴(kuò)增的樣品片段化產(chǎn)生片段;使接頭連接到片段上產(chǎn)生含有連接了接頭的片段的樣品;把含有連接了接頭的片段的樣品分成至少第一個(gè)和第二個(gè)等份試樣;用甲基化不敏感的限制性酶處理第一個(gè)等份試樣;用甲基化依賴的限制性酶處理第二個(gè)等份試樣;使用與接頭互補(bǔ)的引物擴(kuò)增處理的第一個(gè)和第二個(gè)等份試樣;標(biāo)記擴(kuò)增產(chǎn)物,并將擴(kuò)增產(chǎn)物同含有與已知的基因組區(qū)域互補(bǔ)的探針的探針陣列進(jìn)行雜交,以便對于所述第一個(gè)等份試樣產(chǎn)生第一個(gè)雜交模式,而對于所述第二個(gè)等份試樣產(chǎn)生第二個(gè)雜交模式;將第一個(gè)和第二個(gè)雜交模式進(jìn)行比較,并且通過鑒定在第二個(gè)等份試樣中存在而在第一個(gè)等份試樣中不存在的基因組片段來鑒定未甲基化的基因組區(qū)域。
      14.權(quán)利要求12的方法,其中的第一個(gè)酶的識別位點(diǎn)中不含CpG。
      15.權(quán)利要求12的方法,其中的第一個(gè)酶選自XbaI、HindIII和BglII。
      16.權(quán)利要求12的方法,其中的第二個(gè)限制性酶是HpaII,而第三個(gè)限制性酶是MspI。
      17.權(quán)利要求13的方法,其中的甲基化依賴性酶是McrBC。
      18.權(quán)利要求12的方法,其中的探針陣列含有至少100,000個(gè)不同的連接到固相支持物上的探針,其中探針的位置是確定的或可確定的,以及其中陣列的探針由計(jì)算機(jī)系統(tǒng)選擇,所述計(jì)算機(jī)系統(tǒng)為陣列選擇探針的方法包括模擬擴(kuò)增樣品的片段化,產(chǎn)生來自片段化的第一個(gè)片段列表,其中第一個(gè)列表包括預(yù)計(jì)長度的片段;通過鑒定長度在200到2,000個(gè)堿基對之間的片段從第一個(gè)列表產(chǎn)生第二個(gè)片段列表;通過鑒定含有第二和第三個(gè)限制性酶的識別位點(diǎn)的片段從第二個(gè)列表產(chǎn)生第三個(gè)片段列表;以及選擇與第三個(gè)列表中的多個(gè)片段互補(bǔ)的探針。
      19.權(quán)利要求13的方法,其中的探針陣列含有至少100,000個(gè)不同的連接到固相支持物上的探針,其中探針的位置是確定的或可確定的,以及其中陣列的探針由計(jì)算機(jī)系統(tǒng)選擇,所述計(jì)算機(jī)系統(tǒng)為陣列選擇探針的方法包括模擬擴(kuò)增樣品的片段化,產(chǎn)生來自片段化的第一個(gè)片段列表,其中第一個(gè)列表包括預(yù)計(jì)長度的片段;通過鑒定長度在200到2,000個(gè)堿基對之間的片段從第一個(gè)列表產(chǎn)生第二個(gè)片段列表;通過鑒定含有甲基化依賴性酶的識別位點(diǎn)的片段從所述第二個(gè)列表產(chǎn)生第三個(gè)片段列表;以及選擇與第三個(gè)列表中的多個(gè)片段互補(bǔ)的探針。
      20.權(quán)利要求18的方法,其中的固相支持物是多個(gè)珠子。
      21.權(quán)利要求19的方法,其中的固相支持物是多個(gè)珠子。
      22.權(quán)利要求1的方法,進(jìn)一步包括對擴(kuò)增樣品進(jìn)行分析以鑒定多個(gè)在基因組樣品中被甲基化了的胞嘧啶和多個(gè)在基因組樣品中沒有被甲基化的胞嘧啶,使用的方法包括通過不將甲基化的胞嘧啶轉(zhuǎn)化為尿嘧啶的方法將擴(kuò)增樣品中未甲基化的胞嘧啶轉(zhuǎn)化為尿嘧啶,以及確定存在于多個(gè)胞嘧啶位置上的序列。
      23.權(quán)利要求22的方法,其中所述轉(zhuǎn)化步驟選自亞硫酸氫鹽處理或用胞苷脫氨酶處理。
      24.權(quán)利要求22的方法,其中所述轉(zhuǎn)化步驟包含了亞硫酸氫鹽處理和用胞苷脫氨酶處理。
      25.權(quán)利要求23或24的方法,其中的胞苷脫氨酶是活化誘導(dǎo)的胞苷脫氨酶。
      26.權(quán)利要求22、23、24或25的方法,其中所述確定步驟包括將擴(kuò)增樣品標(biāo)記,并且使標(biāo)記樣品與探針陣列雜交,其中探針陣列含有質(zhì)詢多個(gè)胞嘧啶序列的探針,以確定基因組樣品中正在被質(zhì)詢的胞嘧啶是否被甲基化了。
      27.權(quán)利要求26的方法,其中被質(zhì)詢的胞嘧啶是CpG二核苷酸的一部分。
      28.權(quán)利要求27的方法,其中的陣列質(zhì)詢至少10,000個(gè)胞嘧啶的甲基化。
      29.一種探針陣列,含有至少100,000個(gè)不同的連接到固相支持物上的探針,其中探針的位置是確定的或可確定的,以及其中陣列的探針由計(jì)算機(jī)系統(tǒng)選擇,所述計(jì)算機(jī)系統(tǒng)為陣列選擇探針的方法包括模擬第一個(gè)核酸樣品被第一個(gè)限制性酶的片段化,產(chǎn)生來自片段化的第一個(gè)片段列表,其中第一個(gè)列表包括預(yù)計(jì)長度的片段;通過鑒定在選定的大小范圍內(nèi)的片段從第一個(gè)列表產(chǎn)生第二個(gè)片段列表;通過鑒定第二個(gè)列表中含有第二個(gè)限制性酶的識別位點(diǎn)的片段從所述第二個(gè)列表產(chǎn)生第三個(gè)片段列表,其中所述第二個(gè)限制性酶是甲基化依賴的限制性酶或是甲基化敏感的限制性酶;以及為陣列選擇至少100,000個(gè)不同的探針,其中每個(gè)探針至少15個(gè)堿基,并且與第三個(gè)列表中的片段完全互補(bǔ)。
      30.權(quán)利要求29的陣列,其中第一個(gè)限制性酶是兩種或多種限制性酶的組合。
      31.權(quán)利要求29的陣列,其中第二個(gè)限制性酶是McrBC。
      32.權(quán)利要求29的陣列,其中第二個(gè)限制性酶是Hpa II。
      33.在第一個(gè)含有基因組DNA的核酸樣品中分析多個(gè)不同CpG位點(diǎn)的甲基化的方法,包括(a)按照權(quán)利要求1的方法擴(kuò)增基因組DNA樣品,產(chǎn)生含有擴(kuò)增的甲基化產(chǎn)物的第一個(gè)擴(kuò)增樣品;(b)將第一個(gè)擴(kuò)增樣品用第一個(gè)限制性酶片段化,并且使接頭與片段連接產(chǎn)生含有連接了接頭的片段的第二個(gè)樣品;(c)用亞硫酸氫鈉處理第二個(gè)樣品產(chǎn)生第三個(gè)樣品;(d)通過PCR使用與接頭互補(bǔ)的引物擴(kuò)增第三個(gè)樣品中的至少一些連接了接頭的片段;(e)將步驟(d)的產(chǎn)物片段化,并把片段進(jìn)行末端標(biāo)記;(f)將標(biāo)記的產(chǎn)物與探針陣列雜交產(chǎn)生雜交模式,其中的陣列含有多個(gè)探針對,其中每個(gè)探針對中的第一個(gè)探針在C是甲基化的情況下與亞硫酸氫鈉處理后的第一個(gè)CpG位點(diǎn)互補(bǔ),而第二個(gè)探針在C是未甲基化的情況下與同樣的區(qū)域互補(bǔ);以及(g)對雜交模式進(jìn)行分析,以確定對于多個(gè)CpG位點(diǎn)中的每一個(gè)來說,在第一個(gè)核酸樣品中所述位點(diǎn)是否是未甲基化的。
      34.一種減少第一個(gè)含有甲基化基因組DNA的核酸樣品的復(fù)雜性以產(chǎn)生復(fù)雜性降低的樣品的方法,包括將第一個(gè)核酸樣品用第一個(gè)限制性核酸內(nèi)切酶片段化,產(chǎn)生含有限制性片段的第二個(gè)核酸樣品;將接頭連接到第二個(gè)核酸樣品的限制性片段上,產(chǎn)生含有連接了接頭的片段的第三個(gè)核酸樣品;將第三個(gè)核酸樣品用甲基化依賴性核酸內(nèi)切酶片段化,產(chǎn)生第四個(gè)核酸樣品;以及用與接頭互補(bǔ)的引物通過PCR對第四個(gè)核酸樣品進(jìn)行擴(kuò)增,從而產(chǎn)生復(fù)雜性降低的樣品。
      35.權(quán)利要求34的方法,其中的甲基化依賴性酶是McrBC。
      36.權(quán)利要求34的方法,其中第一個(gè)核酸樣品選自血液樣品、組織樣品和腫瘤樣品。
      37.一種獲得樣品的雜交模式特征的方法,包括從所述樣品獲得基因組DNA樣品;按照權(quán)利要求34的方法減少核酸樣品的復(fù)雜性;將復(fù)雜性減少的樣品片段化,并用可檢測的標(biāo)記物標(biāo)記片段;以及將標(biāo)記的片段與核酸探針陣列雜交,從而獲得雜交模式。
      38.一種將未知核酸樣品與已知核酸樣品進(jìn)行比較的方法,包括按照權(quán)利要求30的方法為所述未知樣品產(chǎn)生第一個(gè)雜交模式;為所述已知樣品獲得第二個(gè)雜交模式,其中的第二個(gè)雜交模式是按照權(quán)利要求37的方法產(chǎn)生的;以及將第一個(gè)雜交模式與第二個(gè)雜交模式進(jìn)行比較。
      39.一種將腫瘤歸類為已知腫瘤類型的方法,包括按照權(quán)利要求37的方法為所述未知樣品產(chǎn)生第一個(gè)雜交模式;從多個(gè)已知類型的腫瘤獲得多個(gè)第二個(gè)雜交模式,其中第二個(gè)雜交模式是分別按照權(quán)利要求37的方法從來自己知類型腫瘤的樣品產(chǎn)生的;將第一個(gè)雜交模式與各種第二個(gè)雜交模式進(jìn)行比較,以鑒定與第一個(gè)雜交模式最匹配的第二個(gè)雜交模式;以及將腫瘤歸類于雜交模式最匹配的已知腫瘤的類型。
      40.一種檢測基因組DNA樣品中甲基化的基因組區(qū)域的方法,包括下列步驟a、用亞硫酸氫鹽處理基因組DNA樣品;b、將基因組DNA樣品片段化;c、將接頭連接到片段上;d、對連接了接頭的片段進(jìn)行擴(kuò)增;e、用可檢測的標(biāo)記物標(biāo)記擴(kuò)增的片段,并將標(biāo)記的片段與陣列雜交,以產(chǎn)生雜交模式;以及f、將上述雜交模式與對照進(jìn)行比較以鑒定甲基化的基因組區(qū)域。
      41.權(quán)利要求40的方法,其中步驟(a)在步驟(b)之前進(jìn)行,以及其中步驟(c)包括使用RNA連接酶將接頭連接到片段的5’末端,除去3’磷酸,并且將接頭連接到片段的3’末端。
      42.權(quán)利要求40的方法,進(jìn)一步包括通過將亞硫酸氫鹽處理的樣品與針對5-甲基胞嘧啶的抗體或與結(jié)合5-甲基胞嘧啶的蛋白和針對所述蛋白的抗體一起保溫,并且分離抗體復(fù)合物,從而使獲得的樣品富集含有5-甲基胞嘧啶的片段,其中所述分離步驟在步驟(c)之前進(jìn)行。
      43.權(quán)利要求40的方法,其中步驟(b)在步驟(a)之前進(jìn)行。
      44.權(quán)利要求40的方法,其中的亞硫酸氫鹽處理包括與8-10M的亞硫酸氫鹽保溫5分鐘到1小時(shí)。
      45.一種分析核酸樣品中一個(gè)或多個(gè)胞嘧啶的甲基化狀態(tài)的方法,所述方法包括擴(kuò)增核酸樣品中的至少一部分序列,其中起始核酸樣品中至少一部分序列的甲基化模式在擴(kuò)增步驟中被拷貝了,從而產(chǎn)生甲基化的擴(kuò)增樣品;將甲基化的擴(kuò)增樣品進(jìn)行區(qū)別修飾甲基化的胞嘧啶和未甲基化的胞嘧啶的處理;以及通過與核酸探針陣列的雜交檢測擴(kuò)增樣品中至少一個(gè)胞嘧啶的甲基化狀態(tài)。
      46.權(quán)利要求45的方法,其中區(qū)別修飾甲基化的胞嘧啶和未甲基化的胞嘧啶的處理是亞硫酸氫鹽處理。
      47.權(quán)利要求45的方法,其中區(qū)別修飾甲基化的胞嘧啶和未甲基化的胞嘧啶的處理是使用活化誘導(dǎo)的胞苷脫氨酶的處理。
      48.權(quán)利要求45的方法,其中區(qū)別修飾甲基化的胞嘧啶和未甲基化的胞嘧啶的處理包括使用活化誘導(dǎo)的胞苷脫氨酶的處理和亞硫酸氫鹽處理。
      49.權(quán)利要求46、47或48的方法,其中所述探針陣列包含與用亞硫酸氫鹽處理或用活化誘導(dǎo)的胞苷脫氨酶處理后產(chǎn)生的多個(gè)不同序列完全互補(bǔ)的探針。
      50.權(quán)利要求49的方法,其中的探針陣列包含與用亞硫酸氫鹽處理或用活化誘導(dǎo)的胞苷脫氨酶處理多個(gè)選定的基因組區(qū)域后產(chǎn)生的所有可能的序列組合完全互補(bǔ)的探針。
      全文摘要
      本方面公開了擴(kuò)增核酸樣品同時(shí)保留胞嘧啶的甲基化狀態(tài)的方法。在某些方面,擴(kuò)增的甲基化樣品被甲基化敏感的修飾方法所修飾,并且通過與陣列雜交來分析,從而鑒定在起始材料中被甲基化的胞嘧啶和在起始材料中沒有被甲基化的胞嘧啶。本發(fā)明還公開了檢測甲基化狀態(tài)的方法。在一個(gè)實(shí)施方案中,在擴(kuò)增反應(yīng)中引入DNA甲基轉(zhuǎn)移酶活性,這種活性使用甲基化的基因組模板鏈作為指導(dǎo),對新合成的DNA進(jìn)行甲基化。
      文檔編號C12Q1/68GK1680594SQ200510009558
      公開日2005年10月12日 申請日期2005年2月16日 優(yōu)先權(quán)日2004年2月13日
      發(fā)明者羅伯特·J·利普舒茨, 史蒂芬·P.A.·福多爾, 希瓦尼·諾蒂亞爾 申請人:阿菲梅特里克斯公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1