国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      染色體構象芯片捕獲(4c)測定的制作方法

      文檔序號:432355閱讀:5517來源:國知局
      專利名稱:染色體構象芯片捕獲(4c)測定的制作方法
      技術領域
      本發(fā)明涉及4C技術(即capture and characterise colocalised chromatin(捕獲和表征共定位的染色質)),其提供了以高通量分析核空間中兩個或更多個核苷酸序列相互作用的頻率的方法。
      4C(捕獲和表征共定位的染色質)技術是3C技術的修改版本,其能在無偏好的基因組廣度上搜索與所選擇的基因座相互作用的DNA片段。簡而言之,3C分析如常進行,但省略了PCR步驟。3C模板包含連接于許多不同的目的核苷酸序列(代表該基因的基因組環(huán)境)上的誘餌(如所選的包含目的基因的限制性片段)。用另一種第二限制性內(nèi)切酶裂解模板并連接。有益的是,用至少一個(優(yōu)選至少2個)寡核苷酸引物擴增連接于靶核苷酸序列的一個或多個目的核苷酸序列,其中至少一個引物與在目的核苷酸序列的側翼的DNA序列雜交。通常,這產(chǎn)生了在獨立擴增反應之間高度可重復的和特異針對給定組織的PCR片段模式。在一個具體實施方式
      中,HindIII和DpnII被用作第一和第二限制性內(nèi)切酶。接下來可標記擴增的片段并任選與陣列雜交,通常相對于含有用相同組合的限制性內(nèi)切酶消化的基因組DNA的對照樣品。
      在本發(fā)明一個優(yōu)選的具體實施方式
      中,用第二限制性內(nèi)切酶切割的連接片段隨后被重新連接以形成小的DNA環(huán)。
      因此修改了3C技術從而使所有與靶核苷酸序列相互作用的目的核苷酸序列被擴增出。這實際是指不用特異于人們所希望分析的片段的引物進行擴增反應,而利用與在目的核苷酸序列的側翼的DNA序列雜交的一個或多個寡核苷酸引物進行擴增。有益的是,4C對包括在PCR擴增步驟中的PCR引物設計沒有偏好,并因此能被用于搜索完整的基因組中的相互作用DNA元件。
      發(fā)明的簡要方面 本發(fā)明的各方面出現(xiàn)在所附的權利要求書中。
      在第一個方面,提供了分析靶核苷酸序列與一個或多個目的核苷酸序列(如一個或多個基因組基因座)相互作用的頻率的方法,其包括以下步驟(a)提供交聯(lián)DNA的樣品;(b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA;(c)連接交聯(lián)的核苷酸序列;(d)解除交聯(lián);(e)用第二限制性內(nèi)切酶消化核苷酸序列;(f)將已知核苷酸組成的一個或多個DNA序列與在一個或多個目的核苷酸序列側翼的可用的一個或多個第二限制性內(nèi)切酶消化位點連接;(g)利用至少兩個寡核苷酸引物擴增一個或多個目的核苷酸序列,其中每個引物與在目的核苷酸序列側翼的DNA序列雜交;(h)將擴增的一個或多個序列與陣列雜交;和(i)確定DNA序列間相互作用的頻率。
      在第二個方面,提供了分析靶核苷酸序列與一個或多個核苷酸序列(如一個或多個基因組基因座)相互作用的頻率的方法,其包括以下步驟(a)提供交聯(lián)DNA的樣品;(b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA;(c)連接交聯(lián)的核苷酸序列;(d)解除交聯(lián);(e)用第二限制性內(nèi)切酶消化核苷酸序列;(f)環(huán)化核苷酸序列;(g)擴增與靶核苷酸序列連接的一個或多個核苷酸序列;(h)任選將擴增的序列與陣列雜交;和(i)確定DNA序列間相互作用的頻率。
      在第三個方面,提供了環(huán)化的核苷酸序列,其包括第一和第二核苷酸序列,其中第一和第二核苷酸序列的每個末端由不同的限制性內(nèi)切酶識別位點分隔,而且其中所述第一核苷酸序列是靶核苷酸序列并且所述第二核苷酸序列是由交聯(lián)基因組DNA而獲得的。
      在第四個方面,提供了制備環(huán)化的核苷酸序列的方法,其包括以下步驟(a)提供交聯(lián)DNA的樣品;(b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA;(c)連接交聯(lián)的核苷酸序列;(d)解除交聯(lián);(e)用第二限制性內(nèi)切酶消化核苷酸序列;和(f)環(huán)化核苷酸序列。
      在第五個方面,提供了分析靶核苷酸序列與一個或多個核苷酸序列(如一個或多個基因組基因座)相互作用的頻率的方法,其包括使用環(huán)化的核苷酸序列。
      在第六個方面,提供了固定于支持物上的探針陣列,其包括與環(huán)化的核苷酸序列雜交或能雜交的一個或多個探針。
      在第七個方面,提供了探針組,所述探針在序列上與基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點的相鄰核酸序列互補。
      在第八個方面,提供了制備探針組的方法,其包括以下步驟(a)鑒定基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點;(b)設計能夠與基因組DNA中每一個第一限制性內(nèi)切酶識別位點的相鄰序列雜交的探針;(c)合成探針;和(d)將探針組合在一起以形成探針組或基本上形成探針組。
      在第九個方面,提供了由或可由本文所述的方法得到的探針組或基本上得到的探針組。
      在第10個方面,提供了陣列,其包括本文所述的探針陣列或基本上包括本文所述的探針組。
      在第11個方面,提供了陣列,其包括本文所述的探針組。
      在第12個方面,提供了制備陣列的方法,其包括將本文所述的探針陣列或主要的探針組固定在固相支持物上的步驟。
      在第13個方面,提供了制備陣列的方法,其包括將本文所述的探針陣列或探針組固定在固相支持物上的步驟。
      在第14個方面,提供了由或可由本文所述的方法得到的陣列。
      在第15個方面,提供了鑒定一種或多種指示特定疾病狀態(tài)的DNA-DNA相互作用的方法,其包括執(zhí)行本發(fā)明第一和第二方面的步驟(a)-(i)的步驟,其中步驟(a)中交聯(lián)DNA的樣品由患病和未患病的細胞提供,而且其中來自患病和未患病的細胞的DNA序列間相互作用的頻率之間的差異表明DNA-DNA相互作用指示特定疾病狀態(tài)。
      在第16個方面,提供了診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的方法,其包括執(zhí)行本發(fā)明第一和第二方面的步驟(a)-(i)的步驟,其中步驟(a)包括提供來自受試者的交聯(lián)DNA的樣品;而且其中步驟(i)包括將DNA序列間相互作用的頻率與未受影響的對照的頻率進行比較;其中得自對照的值和得自受試者的值之間的差異指示受試者正罹患該疾病或綜合征或指示受試者將罹患該疾病或綜合征。
      在第17個方面,提供了診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的方法,其包括以下步驟進行本發(fā)明第一和第二方面的步驟(a)-(i),其中步驟(a)包括由受試者提供交聯(lián)DNA的樣品;而且其中所述方法包括額外步驟(j)鑒定一個或多個經(jīng)歷與疾病相關的基因組重排的基因座。
      在第18個方面,提供了鑒定一種或多種調節(jié)DNA-DNA相互作用的試劑的測試方法,其包括以下步驟(a)將樣品與一種或多種試劑接觸;和(b)進行本發(fā)明第一和第二方面的步驟(a)至(i),其中步驟(a)包括由樣品提供交聯(lián)的DNA;其中(i)在存在試劑的情況下的DNA序列間相互作用的頻率和(ii)在無試劑的情況下的DNA序列間相互作用的頻率之間的差異指示試劑能調節(jié)DNA-DNA相互作用。
      在第19個方面,提供了檢測平衡的和/或不平衡的斷點(如易位)的位置的方法,其包括以下步驟(a)進行本發(fā)明第一和第二方面的步驟(a)至(i);和(b)將DNA序列間相互作用的頻率與對照的頻率進行比較;其中樣品中DNA-DNA相互作用頻率相對于對照從低至高的轉變指示斷點的位置。
      在第20個方面,提供了檢測平衡的和/或不平衡的倒位的位置的方法,其包括以下步驟(a)進行本發(fā)明第一和第二方面的步驟(a)至(i);和(b)將DNA序列間相互作用的頻率與對照的頻率比較;其中樣品的DNA-DNA相互作用頻率相對于對照呈倒轉模式指示倒位。
      在第21個方面,提供了檢測缺失位置的方法,其包括以下步驟(a)進行本發(fā)明第一和第二方面的步驟(a)至(i);和(b)將DNA序列間相互作用的頻率與對照的比較;其中樣品的DNA-DNA相互作用頻率相對于對照降低指示缺失。
      在第22個方面,提供了檢測重復(duplication)的位置的方法,其包括以下步驟(a)進行本發(fā)明第一和第二方面的步驟(a)至(i);和(b)將DNA序列間相互作用的頻率與對照的頻率比較;其中受試者的DNA-DNA相互作用頻率相對于對照增加或減少表明重復或插入。
      在第23個方面,提供了由或可由本文所述的測試方法得到的試劑。
      在第24個方面,提供了環(huán)化的核苷酸序列用于鑒定樣品中一種或多種DNA-DNA相互作用的用途。
      在第25個方面,提供了環(huán)化的核苷酸序列用于診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的用途。
      在第26個方面,提供了本文所述的探針陣列或探針組用于鑒定樣品中一種或多種DNA-DNA相互作用的用途。
      在第27個方面,提供了本文所述的探針陣列或探針組用于診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的用途。
      在第28個方面,提供了本文所述的陣列用于鑒定樣品中一種或多種DNA-DNA相互作用的用途。
      在第29個方面,提供了本文所述的陣列用于診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的用途。
      在第30個方面,提供了基本上如本文所述的和參考任意實施例或附圖的方法、探針陣列、探針組、過程、陣列、測試方法、試劑、或用途。
      優(yōu)選的
      具體實施例方式 優(yōu)選地,步驟(f)中的連接反應能導致DNA環(huán)的形成。
      優(yōu)選地,靶核苷酸序列選自由基因組重排、啟動子、增強子、沉默子、隔離子、基質附著區(qū)、基因座控制區(qū)、轉錄單位、復制起始點、重組熱點、易位斷點、著絲粒、端粒、基因密集區(qū)、基因稀少區(qū)、重復元件和(病毒)整合位點組成的組。
      優(yōu)選地,靶核苷酸序列是與疾病相關的或造成疾病的核苷酸序列,或在線性DNA模板上位于與疾病相關的或造成疾病的基因座相距多至或大于15Mb處。
      優(yōu)選地,靶核苷酸序列選自由AML1,MLL,MYC,BCL,BCR,ABL1,IGH,LYL1,TAL1,TAL2,LMO2,TCRα/δ,TCRβ和HOX或其他與疾病相關的基因座組成的組,所述其他與疾病相關的基因座描述于“Catalogue ofUnbalanced Chromosome Aberrations in Man”第2版.Albert Schinzel.柏林Walter de Gruyter,2001.ISBN 3-11-011607-3中。
      優(yōu)選地,第一限制性內(nèi)切酶是識別6-8bp識別位點的限制性內(nèi)切酶。
      優(yōu)選地,第一限制性內(nèi)切酶選自由BglII、HindIII、EcoRI、BamHI、SpeI、PstI和NdeI組成的組。
      優(yōu)選地,第二限制性內(nèi)切酶是識別4或5bp核苷酸序列識別位點的限制性內(nèi)切酶。
      優(yōu)選地,第二限制性內(nèi)切酶識別位點位于與靶核苷酸序列中第一限制酶位點相距大于約350bp處。
      優(yōu)選地,核苷酸序列是標記的。
      優(yōu)選地,探針在序列上與基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點的每一側的相鄰核酸序列互補。
      優(yōu)選地,探針在序列上與和基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點相距小于300個堿基對的核酸序列互補。
      優(yōu)選地,探針與和基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點相距小于300bp的序列互補。
      優(yōu)選地,探針與和基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點相距200-300bp的序列互補。
      優(yōu)選地,探針與和基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點相距100-200bp或0-100bp的序列互補。
      優(yōu)選地,兩個或更多個探針能夠與基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點的相鄰序列雜交。
      優(yōu)選地,探針重疊或部分重疊。
      優(yōu)選地,重疊少于10個核苷酸。
      優(yōu)選地,探針序列對應于第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點和第二限制性內(nèi)切酶的第一個相鄰的第二限制性內(nèi)切酶識別位點中的每一個之間的所有或部分序列。
      優(yōu)選地,每個探針至少是25聚體。
      優(yōu)選地,每個探針是25-60聚體。
      優(yōu)選地,探針是PCR擴增產(chǎn)物。
      優(yōu)選地,陣列包括約300,000-400,000個探針。
      優(yōu)選地,陣列包括約385,000或更多個探針,優(yōu)選約750,000個探針,更優(yōu)選6×750,000個探針。
      優(yōu)選地,陣列包括給定物種完整基因組的較低解析度的代表或由所述代表組成。
      優(yōu)選地,排列在線性染色體模板上的每2、3、4、5、6、7,8、9或10個探針中的一個被包含于陣列中。
      優(yōu)選地,相互作用頻率從低至高的轉變指示平衡的和/或不平衡的斷點的位置。
      優(yōu)選地,受試者樣品的DNA-DNA相互作用頻率相對于對照的相互作用頻率呈倒轉模式指示平衡的和/或不平衡的倒位。
      優(yōu)選地,受試者樣品的DNA-DNA相互作用頻率相對于對照的相互作用頻率降低,以及與更遠區(qū)域的DNA-DNA相互作用頻率增加的組合,指示平衡的和/或不平衡的缺失。
      優(yōu)選地,受試者樣品的DNA-DNA相互作用頻率相對于對照的相互作用頻率增加或減少指示平衡的和/或不平衡的重復或插入。
      優(yōu)選地,在進行所述方法前使用光譜核型分析和/或FISH。
      優(yōu)選地,疾病是遺傳疾病。
      優(yōu)選地,疾病是癌癥。
      優(yōu)選地,兩個或更多個被擴增的序列是不同標記的。
      優(yōu)選地,當兩個或更多個被擴增的序列位于不同染色體上時,這些序列是被同樣標記的。
      優(yōu)選地,當兩個或多個被擴增的序列序列位于相同染色體上、其距離足夠遠以使得DNA-DNA相互作用信號間的重疊最小時,則這些序列是被同樣標記的。
      優(yōu)選地,其中診斷或預測是產(chǎn)前診斷或預測。
      優(yōu)點 本發(fā)明有許多優(yōu)點。這些優(yōu)點將在以下描述中明確。
      舉例來說,本發(fā)明是有益的,這是因為它提供了特別可商用的核苷酸序列、方法、探針和陣列。
      進一步舉例來說,本發(fā)明是有益的,這是因為它提供了以高通量分析核空間中兩種或多種核苷酸序列的相互作用的頻率的方法。
      進一步舉例來說,本發(fā)明有益的,這是因為利用常規(guī)的3C技術,每種DNA-DNA相互作用必須通過包括獨特引物對的獨特PCR反應來分析。因此,只有PCR是自動的時,高通量分析才有可能,但是如此多的引物的成本會很高。因此,用常規(guī)3C技術進行高通量(基因組范圍的)DNA-DNA相互作用分析是不可行的。相反,本發(fā)明現(xiàn)在能同時篩選上千個DNA-DNA相互作用。本發(fā)明所述的DNA-DNA相互作用的高通量分析將極大增加分析等級和解析度。
      進一步舉例來說,本發(fā)明是有益的,這是因為利用常規(guī)3C技術,篩選將偏向于那些其寡核苷酸引物被設計、被排列和包括在分析中的DNA序列。選擇這些寡核苷酸引物通常是基于對據(jù)信會與正被研究的核苷酸序列交聯(lián)的諸如(遠處的)增強子和/或其他調節(jié)元件/高敏感位點的位置的認識。因此,常規(guī)3C偏向于包括在PCR擴增步驟中的PCR引物的設計,而4C是無偏好的而且能用于對完整的基因組搜索DNA元件相互作用。這是因為在4C中擴增交聯(lián)的序列不是基于對與正在研究的核苷酸序列交聯(lián)的序列的預先認識。更確切地,在一個4C的具體實施方式
      中,利用與該核苷酸序列雜交的PCR引物可擴增與第一(靶)核苷酸序列交聯(lián)的序列。因此,本發(fā)明能無偏好地在基因組廣度篩選DNA-DNA相互作用。
      進一步舉例來說,本發(fā)明是有益的,這是因為利用常規(guī)3C技術僅能選擇性擴增單一DNA-DNA相互作用。這在與陣列雜交時是無法提供出信息的。該技術已被改善,從而使所有與第一(靶)核苷酸序列相互作用的片段在現(xiàn)在被擴增出,如選擇性地擴增出。
      進一步舉例來說,本發(fā)明是有益的,這是因為4C技術能用于檢測核酸(例如,染色體)中平衡的或不平衡的遺傳異?!缢蓄愋偷囊孜弧⑷笔?、倒位、重復和其他基因組重排。4C技術(其測量DNA片段的接近度)甚至能確定受試者獲得某些易位、缺失、倒位、重復和其他基因組重排(如平衡的或不平衡的易位、缺失、倒位、重復和其他基因組重排)的傾向性。較當前策略的優(yōu)勢是它無需知道改變的確切位置,因為4C技術的解析度使它即使在‘4C-誘餌’(如由被分析的第一和第二限制性內(nèi)切酶識別位點所限定的)遠離變化(如多至一百萬個堿基或甚至更多)時也可用于檢測重排。另一個優(yōu)勢是4C技術能對變化進行準確作圖,這是因為它能用于限定改變發(fā)生處之間的兩個(第一)限制酶位點。另一個優(yōu)勢是細胞不需要在固定前被培養(yǎng)。因此,也可分析諸如實體腫瘤的基因組重排。
      進一步舉例來說,本發(fā)明是有益的,這是因為4C技術也能在惡變前狀態(tài)中(即在所有細胞包含這些變化前)檢測改變(如重排)。因此,該技術不僅可用于診斷疾病,而且用于預測疾病。
      進一步舉例來說,本發(fā)明所述的陣列設計比現(xiàn)有的基因組嵌合陣列(如Nimblegen基因組嵌合陣列)尤其有優(yōu)勢,這是因為該設計能在每個單一陣列中代表大得多的基因組部分。舉例來說,對于識別六個核苷酸的序列的限制性內(nèi)切酶,例如,3個陣列(每個帶有約385,000個探針)將足以覆蓋完整的人或小鼠基因組。對于識別超過6bp的限制性內(nèi)切酶,例如,約385,000個探針的單一陣列可用于覆蓋例如完整的人或小鼠基因組。陣列設計的優(yōu)勢有(1)每個探針能提供很多信息,這是因為每個探針分析獨立的連接事件,極大方便了結果的解釋;和(2)基因組的大代表物可在單一陣列上被發(fā)現(xiàn),其是成本低廉的。
      4C技術可有益地用于對最初由細胞生成方法(光學顯微鏡、FISH、SKY等)檢測到而沒有很好表征的重排進行細致作圖。
      4C技術可有益地用于在單一陣列上同時篩選發(fā)生在多個基因座附近的重排的組合。
      附圖簡述

      圖1 3C技術的原理 圖2 (a)4C技術的一個具體實施方式
      的原理。如常用諸如HindIII(H)作為限制性內(nèi)切酶,進行3C分析。解除交聯(lián)后,DNA混合物將包含第一(靶)核苷酸序列,其連于許多不同的片段。用擴增方法(如反向PCR)利用第一(靶)核苷酸序列特異性引物在諸如DpnII環(huán)上擴增并標記這些片段。標記的擴增產(chǎn)物可與本文所述的陣列雜交。以HindIII和DpnII做例子,但也可使用其他限制性內(nèi)切酶組合(如6或8-和4或5-切割酶)。(b)來自兩個獨立的胎兒肝(L1,L2)和腦(B1,B2)樣品的通過凝膠電泳分離的PCR結果。(c)示意性表示微陣列探針位置。探針被設計在HindIII位點的100bp內(nèi)。因此,每個探針分析一個可能的連接配體。
      圖3 4C技術檢測β-球蛋白的基因組環(huán)境(染色體7)。顯示了未處理過的比率(針對β-球蛋白HS2的4C信號除以對照樣品所得的信號),其針對位于小鼠染色體10、11、12、14、15、7和8(從上至下;顯示的區(qū)域處于距離每個相應的著絲粒的相同距離處)上~35Mb基因組區(qū)的探針。注意到染色體7(第6行)上(球蛋白)誘餌周圍有大叢強信號,其證實了4C技術檢測到線性染色體模板附近的基因組片段(符合以下事實,即相互作用頻率基因組位點分隔成反比)。注意到顯示高信號密度的誘餌周圍順式相連的區(qū)域是大的(>5Mb),這暗示諸如易位甚至能用距離斷點超過1MB的誘餌來檢測。
      圖4 4C技術檢測Rad23A的基因組環(huán)境(染色體8)。顯示了未處理過的比率(針對Rad23A的4C信號除以對照樣品所得的信號),其針對位于小鼠染色體10、11、12、14、15、7和8(從上至下;顯示的區(qū)域處于距離每個相應的著絲粒的相同距離處)上~15Mb或更遠的基因組區(qū)的探針。注意到染色體8(第7行)上(Rad23A)誘餌周圍有大叢強信號,其證實了4C技術檢測到線性染色體模板附近的基因組片段(符合以下事實,即相互作用頻率與基因組位點分隔成反比)。注意到顯示高信號密度的誘餌周圍順式相連的區(qū)域是大的(>5Mb),這暗示諸如易位甚至能用距離斷點超過1MB的誘餌來檢測。
      圖5 轉錄組織(胎兒肝)和非轉錄組織(胎兒腦)中染色體7(~135Mb)上β-球蛋白的4C相互作用(由連續(xù)平均(running mean)法分析而得)。注意到與β-球蛋白的長程相互作用在組織間有差異(可能依賴于基因轉錄狀態(tài))。強4C信號在誘餌周圍劃分了大區(qū)域(>5Mb),而與組織無關。
      圖6 在胎兒肝細胞中,Uros和Erαf與β-球蛋白相互作用。4C法揭示兩種基因(Erαf和Uros)與位于~30Mb以外的β-球蛋白基因座相互作用超過>30Mb。這兩種相互作用以前被不同的技術(熒光原位雜交)所發(fā)現(xiàn),其描述于Osborne等.,Nature Genetics 36,1065(2004)中。該例子顯示4C技術檢測到的長程相互作用可通過FISH檢驗并真實地反映了核接近情況。
      圖7 4C技術準確地鑒定出順式相連的不相關基因組區(qū)域間的轉換。對于這些實驗,使用轉基因小鼠,其包含人β-球蛋白基因座控制區(qū)(LCR)表達盒(~20kb),該表達盒(通過同源重組)插入到小鼠染色體8上的Rad23A基因座中。4C技術在轉基因小鼠E14.5胚胎肝上進行,該轉基因小鼠中插入物是純合的。整合表達盒(HS2)內(nèi)的HindIII片段被用作‘4C誘餌’。數(shù)據(jù)顯示,4C技術準確地確定了轉基因表達盒的兩個末端(底下一行僅人LCR(~20kb)中的探針得到4C信號,而余下~380kb人β-球蛋白序列中的探針不行),清楚地揭示了小鼠染色體8上的整合位置(上排將染色體8上的信號(對于整合位置,參見箭頭)與6個其他小鼠染色體上的信號作比較)(完整染色體被描述)。該例子顯示,4C技術可用于檢測異位整合的DNA片段(病毒、轉基因等)的基因組位置。它顯示,順式相連的不相關基因組區(qū)域間的轉換能被準確鑒定出,其可用于鑒定基因組斷點和易位配偶體。
      圖8 4C技術產(chǎn)生了可重復的數(shù)據(jù),這是因為針對HS2和β-球蛋白的圖譜非常相似。4個生物學獨立的4C實驗在E14.5胎兒肝上進行,其使用了β-球蛋白基因β-major(上2行)或β-球蛋白HS2(底下2行)作為誘餌。這些誘餌在線性染色體模板上相距~40kb,但以前顯示在核空間中接近(Tolhuis等,Molecular Cell 10,1453(2002))。所描述的是小鼠染色體7上的~5Mb區(qū)域,其與β-球蛋白基因座相距20-20Mb。數(shù)據(jù)在獨立實驗間顯示出高度可重復性,證實了在核空間中接近的2個片段共有位于基因組其他地方的相互作用配體。
      圖9 4C技術被用于測量在來自健康人(頂部)和帶有易位的患者(A;B)(底部)的細胞中(染色體A上的)序列X的DNA-DNA相互作用頻率。代表DNA-DNA相互作用頻率的信號強度(Y軸)相對于在線性染色體模板上排列的探針(X軸)進行作圖。在正常細胞中,在序列X周圍的染色體A上檢測到了頻繁的DNA-DNA相互作用。在患者細胞中,對于位于斷點(BP)另一邊的染色體A上的探針,相互作用頻率觀察到降低50%(將灰色曲線(患者)與黑線(健康人)作比較)。而且,易位使部分染色體B在物理上接近于序列X,而且對于染色體B上的該區(qū)域,現(xiàn)在觀察到了頻繁的DNA-DNA相互作用。該染色體上的相互作用頻率從低至高的突然轉變標志著其斷點的位置。
      圖10 4C技術可檢測一個或多個(平衡的)倒位。相較于非患病的(點曲線)受試者,DNA-DNA相互作用頻率的倒轉模式(由4C技術以雜交信號強度測量)在患病的(實曲線)受試者中被觀察到了,這揭示了倒位的存在和大小。
      圖11 由4C技術進行的雜合缺失檢測。相比于非患病的(黑曲線)受試者,在患病的(灰曲線)中DNA-DNA相互作用頻率降低(由4C技術以雜交信號強度測量)的探針揭示了缺失區(qū)域的位置和大小。患病的受試者的缺失區(qū)域中的剩余雜交信號來自完整的等位基因(雜合缺失)。缺失通常伴隨著直接位于缺失區(qū)域外的探針的信號強度的增加(注意到灰曲線在缺失的右邊位于黑曲線之上),這是因為這些區(qū)域在物理上更接近于4C序列(誘餌)。
      圖12 由4C技術檢測到的重復。與正常(黑曲線)受試者相比,在患者(灰曲線)中雜交信號增加的探針指明了重復的位置和大小。由4C技術檢測到的重復通常伴隨著與非患病的受試者相比在重復區(qū)域之外的探針的雜交信號的降低(重復增加它們與4C序列的基因組位點分離)。
      圖13 4C技術揭示的與β-球蛋白的長程相互作用。a,4C相對于對照雜交信號的未處理的比率揭示了染色體7內(nèi)的β-球蛋白HS2與2種無關的染色體(8和14)的相互作用。b-c,針對2種獨立的胎兒肝(頂部,紅色)和胎兒腦樣品(底部,藍色)的未處理的數(shù)據(jù)沿著染色體7上2個不同的1-2Mb區(qū)域進行繪圖。在2個胎兒肝樣品(b)或2個腦樣品(c)中觀察到了高度可重復的相互作用群。d-e,針對相同區(qū)域的running mean數(shù)據(jù)。錯誤發(fā)現(xiàn)率被設置在5%(點線)。f,與染色體7上活化的(胎兒肝,頂部)和失活的(胎兒腦,底部)β-球蛋白相互作用的區(qū)域的示意圖。
      圖14 活化的和失活的β-球蛋白分別與活化的和失活的染色體區(qū)域相互作用。a,對胎兒肝中β-球蛋白長程相互作用之間作比較(4C連續(xù)平均,頂部),在胎兒肝中進行微陣列表達分析(對數(shù)坐標,中間)和沿著含基因Uros(距離β-球蛋白~30Mb)的4Mb區(qū)域作圖的基因位置(底部),表明活化的β-球蛋白優(yōu)先與其他活性轉錄基因相互作用。b,同樣比較胎兒腦中距離球蛋白~38Mb處的OR基因束的周圍,顯示失活的β-球蛋白優(yōu)先與失活的區(qū)域相互作用。c,根據(jù)基因成分和活性來表征與胎兒肝(左)和腦(右)中β-球蛋白相互作用的區(qū)域。
      圖15 普遍表達的Rad23A與胎兒肝和腦中非常相似的活性區(qū)域相互作用。a,與胎兒肝(頂部,紅色)和腦(底部,藍色)中活化的Rad23A相互作用的染色體8上區(qū)域的示意圖。b,比較Rad23A長程相互作用(4C連續(xù)平均)和胎兒肝中微陣列表達分析(對數(shù)坐標)作比較(頂部兩排),Rad23A長程相互作用(4C連續(xù)平均)和胎兒腦中微陣列表達分析(對數(shù)坐標)(第3和4排),和沿著染色體8的3Mb區(qū)域作圖的基因位置(底部一排)。c,根據(jù)基因成分和活性來表征與胎兒肝(左)和腦(右)中Rad23A相互作用的區(qū)域。
      圖16 低溫FISH確證了4C技術真正能鑒定出相互作用的區(qū)域。a,部分的低溫切片(200nm)的例子顯示出超過10個核,其中一些含β-球蛋白基因座(綠色)和/或Uros(紅色)。由于切片的緣故,許多核不含針對這兩個基因座的信號。b-d,完全(b)和部分(c)重疊信號和接觸信號(d)的例子,這些都被評為相互作用陽性。e-g,含非接觸性等位基因的核(e-f)和僅含β-球蛋白的核(g)的例子,其將所有相互作用評分為陰性。h-i,低溫FISH結果的示意圖。與β-球蛋白(h)和Rad23A(i)相互作用的百分比在染色體上方用于指示通過4C技術鑒定為陽性(紅色箭頭)和鑒定為陰性(藍色箭頭)的區(qū)域。同一BAC用于兩種組織。通過低溫FISH測量的胎兒肝和腦中兩個遠的OR基因束之間的相互作用頻率寫在染色體下方。
      圖17 4C分析HS2和β-major,得出高度相似的結果。(a)4個獨立E14.5肝樣品的未處理的4C數(shù)據(jù)顯示出與HS2的相互作用(頂部)和與β-major的相互作用(底部)之間非常相似的模式。(b)大量重疊存在于在HS-2實驗中被評為相互作用陽性的探針和β-major實驗中被評為相互作用陽性的探針之間。
      圖18 對順式和反式相互作用作比較。(a)來自2個獨立實驗的未處理的4C數(shù)據(jù)顯示了β-球蛋白與鑒定為陽性的順式區(qū)域(染色體7,頂部)和含α-球蛋白基因座的反式區(qū)域(染色體11,底部)的相互作用。(b)來自2個獨立實驗的未處理的4C數(shù)據(jù)顯示了Rad23A與鑒定為陽性的順式區(qū)域(染色體8,頂部)和根據(jù)最高連續(xù)平均值排列時位于最頂端的反式區(qū)域(染色體11,底部)的相互作用。沒有反式區(qū)域達到能鑒定長相互作用的順式區(qū)域的嚴格條件。
      圖19 與β-球蛋白相互作用的區(qū)域也頻繁互相接觸。包含活躍轉錄的基因、并由4C技術鑒定為能與胎兒肝中β-球蛋白相互作用的2個區(qū)域(幾乎相距60Mb),通過低溫FISH顯示共定位頻率為5.5%,其顯著大于背景共定位頻率。
      發(fā)明詳述 3C技術 3C方法已經(jīng)詳細描述于Dekker等.(2002),Tolhuis等.(2002),Palstra等.(2003),Splinter等.(2004)和Drissen等.(2004)中。簡而言之,3C的進行為用第一限制性內(nèi)切酶消化交聯(lián)的DNA,然后以非常低的DNA濃度進行連接。在這些條件下,交聯(lián)片段的分子內(nèi)連接大大優(yōu)于隨機片段的分子間連接。然后,解除交聯(lián)并通過聚合酶鏈式反應(PCR)利用基因座特異性引物檢測和定量各個連接產(chǎn)物。兩個特異性基因座的交聯(lián)頻率(X)由定量PCR反應利用對照和交聯(lián)模板來確定,而且X被表示為用交聯(lián)模板和用對照模板得到的產(chǎn)物量的比率。
      根據(jù)本發(fā)明,利用Splinter等,(2004)Methods Enzymol.375,493-507所述的方法制備3C模板。(即甲醛固定、(第一)限制性內(nèi)切酶消化、重連接交聯(lián)的DNA片段并純化DNA)。簡而言之,樣品(如細胞、組織或核)利用交聯(lián)劑(如甲醛)固定。然后,進行第一限制性內(nèi)切酶消化,從而在交聯(lián)的核的范圍內(nèi)消化DNA。然后,以低DNA濃度(例如,約3.7ng/μl)進行分子內(nèi)連接,其對交聯(lián)的DNA片段間的連接(即分子內(nèi)連接)勝于非交聯(lián)的DNA片段間的連接(即分子間或隨機連接)。接下來,解除交聯(lián)并純化DNA。產(chǎn)生的3C模板包含被連接的限制性片段,這是因為它們原來在核空間中是接近的。
      由于在分子內(nèi)連接步驟前將第一限制性內(nèi)切酶用于消化DNA,第一限制性內(nèi)切酶的酶識別位點將分隔第一(靶)核苷酸序列和已經(jīng)連接的核苷酸序列。因此,第一識別位點位于第一(靶)核苷酸序列和連接的核苷酸序列(即連接的第二序列)之間。
      核苷酸序列 本發(fā)明涉及核苷酸序列(如3C模板、4C模板、DNA模板、擴增模板、DNA片段和基因組DNA)的用途,其可用于數(shù)據(jù)庫中。
      核苷酸序列可以是基因組的、合成或重組來源的DNA或RNA,如cDNA。例如,重組核苷酸序列可用PCR克隆技術來制備。這將包括制備在需要克隆的序列區(qū)域側翼的引物對,將引物與得自諸如哺乳動物(如動物或人細胞)或非哺乳動物細胞的mRNA或cDNA接觸,在能擴增所需區(qū)域的條件下進行聚合酶鏈式反應(PCR),分離擴增的片段(如通過在瓊脂糖凝膠上純化反應混合物)并收獲擴增的DNA??稍O計引物包含合適的限制性內(nèi)切酶識別位點,從而使擴增的DNA能被克隆進合適的克隆載體中。
      核苷酸序列可以是雙鏈的或單鏈的,無論其代表正義或反義鏈或其組合。
      對于一些方面,優(yōu)選核苷酸序列是單鏈DNA——如單鏈引物和探針。
      對于一些方面,優(yōu)選核苷酸序列是雙鏈DNA——如雙鏈3C和4C模板。
      對于一些方面,優(yōu)選核苷酸序列是基因組DNA——如一個或多個基因組基因座。
      對于一些方面,優(yōu)選核苷酸序列是染色體DNA。
      核苷酸序列可包含第一(靶)核苷酸序列和/或第二核苷酸序列。
      第一和第二限制性內(nèi)切酶識別位點將會互不相同,并通常將在核苷酸序列中只出現(xiàn)一次。
      在一個方面,提供了環(huán)化的核苷酸序列,其包含第一核苷酸序列和(如連接于)第二核苷酸序列,所述第一和第二核苷酸序列由第一和第二限制性內(nèi)切酶識別位點分隔(如分開或分割),其中所述第一核苷酸序列是靶核苷酸序列而且所述第二核苷酸序列可由交聯(lián)基因組DNA(如在體內(nèi)或體外)而得到。第一和第二限制性內(nèi)切酶識別位點將會互不相同并通常將在核苷酸序列中僅出現(xiàn)一次。
      在另一方面,提供了環(huán)化的核苷酸序列,其包含第一核苷酸序列和(如連接于)第二核苷酸序列,所述第一和第二核苷酸序列由第一和第二限制性內(nèi)切酶識別位點分隔(如分開或分割),其中所述第一核苷酸序列是靶核苷酸序列,而且其中所述第一和第二核苷酸序列可由以下過程而得,其包括以下步驟(a)交聯(lián)基因組DNA(如在體內(nèi)或體外);(b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA;(c)連接交聯(lián)的核苷酸序列;(d)解除交聯(lián);和(e)用第二限制性內(nèi)切酶消化核苷酸序列來環(huán)化核苷酸序列。
      優(yōu)選,第二核苷酸序列切分(如對切)第一(靶)核苷酸序列。因此,核苷酸序列包含第二核苷酸序列,其將第一(靶)核苷酸序列分隔成兩個部分或片段——如2個大小大致相等的部分或片段。通常該部分或片段的長度將至少為約16個核苷酸。
      第一核苷酸序列 第一核苷酸序列是靶核苷酸序列。
      本文所用的術語“靶核苷酸序列”指用作誘餌序列的序列,以此鑒定與它交聯(lián)的一個或多個序列(如一個或多個目的核苷酸序列或未知核苷酸序列組成的一個或多個序列)。
      靶核苷酸序列的序列已知。
      交聯(lián)表明,靶核苷酸序列和與其交聯(lián)的序列最初在核空間中接近。通過確定序列相互接近的頻率,例如,可能去理解核空間關系(如在體內(nèi)或體外)中染色體和染色體區(qū)域的構象。而且,例如當增強子或其他轉錄調節(jié)元件與順式或甚至反式定位的啟動子互相聯(lián)絡時,可能理解基因組中復雜的結構組織。此外,甚至可能去理解給定的基因組區(qū)相對于出現(xiàn)在相同染色體上(順式)的核苷酸序列以及在其他染色體上(反式)的核苷酸序列的定位。因此,可能對頻繁共有核空間中位點的不同染色體上的核苷酸序列作圖。此外,甚至可能檢測平衡的和/或不平衡的遺傳異?!缙胶獾暮?或不平衡的易位、缺失、倒位、重復和其他基因組重排(如一個或多個染色體中的缺失或易位)。在這方面,遺傳異常會導致DNA-DNA相互作用在變化發(fā)生的位置上發(fā)生改變,這是可以被檢測的。
      根據(jù)本發(fā)明所述的第一(靶)核苷酸序列可以是任何希望確定其與一個或多個其他序列在核空間中相互作用的頻率的序列。
      在一個具體實施方式
      中,第一(靶)核苷酸序列的長度將大于約350bp,這是因為所選擇的第二限制性內(nèi)切酶在距離第一限制性位點約350bp或更遠處切割第一(靶)核苷酸序列。這可使因拓撲學約束而對環(huán)形成帶來的偏好最小化(Rippe等.(2001)Trends in Biochem.Sciences 26,733-40)。
      適宜的是,擴增后的第一(靶)核苷酸序列包含至少約32bp,這是因為用于擴增第二核苷酸序列的至少2個擴增引物的最小長度分別約為16個堿基。
      在優(yōu)選的具體實施方式
      中,第一(靶)核苷酸序列可包含完整或部分(如其片段)的如下序列或與其接近(如臨近)啟動子、增強子、沉默子、隔離子、基質附著區(qū)、基因座控制區(qū)、轉錄單位、復制起始點、重組熱點、易位斷點、著絲粒、端粒、基因密集區(qū)、基因稀少區(qū)、重復元件、(病毒)整合位點、其缺失和/或突變與某種效應(如疾病、生理學上的、功能性的或結構性的效應——如SNP(單核苷酸多態(tài)性))相關的核苷酸序列、或含這樣的缺失和/或突變的核苷酸序列、或任何其中需要確定核空間中與其他序列相互作用的頻率的序列。
      如上所述,第一(靶)核苷酸序列可包含完整或部分(如片段)的其中遺傳異常(如缺失和/或突變)與某種效應(如疾病)相關的核苷酸序列、與這樣的核苷酸序列接近(如臨近)。因此根據(jù)本發(fā)明的這個具體實施方式
      ,第一(靶核苷酸序列)可以是其中的變化與疾病(如遺傳或先天疾病)相關或有關的核苷酸序列(如基因或基因座),(在實體的DNA模板上)與其鄰近、或處在這樣的基因組區(qū)中。換句話說,第一(靶)核苷酸序列可以是或者以其與臨床表型的關聯(lián)性為基礎來選擇。在優(yōu)選的具體實施方式
      中,變化是在一個或多個染色體中的變化,而且疾病可以是諸如其中一個或多個缺失、一個或多個易位、一個或多個重復、和/或一個或多個倒位等的結果。這些基因/基因座的非限制性例子是AML1、MLL、MYC、BCL、BCR、ABL1、免疫球蛋白基因座、LYL1、TAL1、TAL2、LMO2、TCRα/δ、TCRβ、HOX和其他在各種成淋巴細胞白血病中的基因座。
      其他例子在電子數(shù)據(jù)庫中有描述,如 http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=cancerchromosomes http://cgap.nci.nih.gov/chromosomes/Mitelman http://www.progenetix.net/progenetix/P14603437/ideogram.html http://www.changbioscience.com/cytogenetics/cytol.pl?query=47,xy http://www.possum.net.au/ http://www.lmdatabases.com/ http://www.wiley com/legacy/products/subject/life/borgaonkar/index.html http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=OMIM http://www.sanger.ac.uk/PostGenomics/decipher/ http://agserver01.azn.nl8080/ecaruca/ecaruca.jsp 其他例子描述于“Catalogue of Unbalanced Chromosome Aberrations inMan”第2版.Albert Schinzel.柏林Walter de Gruyter,2001.ISBN3-11-011607-3中。
      在一個具體實施方式
      中,術語“鄰近”指“直接相鄰”,從而使在2個相鄰序列間沒有插入的核苷酸。
      在另一個具體實施方式
      中,在核酸序列和第一限制性內(nèi)切酶識別位點的上下文中的術語“鄰近”指“直接相鄰”,從而使在核酸序列和第一限制性內(nèi)切酶識別位點間沒有插入的核苷酸。
      第二核苷酸序列 第二核苷酸序列是通過交聯(lián)基因組DNA(如體內(nèi)或體外)而可得到、得到、鑒定到、可鑒定到。
      第二核苷酸序列(如目的核苷酸序列)在用交聯(lián)劑處理樣品并消化/連接交聯(lián)的DNA片段后變成與第一(靶)核苷酸序列連接。該序列與第一(靶)核苷酸序列交聯(lián),這是因為它們最初在核空間中接近并連接于第一(靶)核苷酸序列上,因為連接條件相對于隨機連接事件而言更傾向于交聯(lián)DNA片段間的(分子內(nèi))連接。
      基于例如易位、缺失、倒位、重復和其他基因組重排的改變的疾病一般由異常的DNA-DNA相互作用造成。4C技術測量出DNA-DNA相互作用的頻率,其主要是基因組位點分離的函數(shù),即DNA-DNA相互作用頻率與出現(xiàn)在相同實體DNA模板上的2個DNA基因座間的線性距離(以千堿基計)成反比(Dekker等.,2002)。因此,產(chǎn)生新的和/或物理上不同的DNA模板的改變伴隨著DNA-DNA相互作用的改變,而且這可通過4C技術來測量。
      適宜的是,第二核苷酸序列至少有40個堿基對。
      交聯(lián)劑(如甲醛)可用于將蛋白質與其他鄰近蛋白質和核酸交聯(lián)。因此,兩種或多種核苷酸序列可以僅通過結合于這些核苷酸序列(之一)的蛋白質來交聯(lián)。除了甲醛之外的交聯(lián)劑也可根據(jù)本發(fā)明所述而使用,包括那些直接交聯(lián)核苷酸序列的交聯(lián)劑。交聯(lián)DNA的試劑的例子包括但不限于紫外光、絲裂霉素C、氮芥、美法侖、1,3-丁二烯二環(huán)氧化物、順式二氨基二氯鉑(cis diaminedichloroplatinum)(II)和環(huán)磷酰胺。
      適宜的是,交聯(lián)劑將形成連接相對短的距離(如約2)的交聯(lián),由此選出可逆轉的密切相互作用。
      交聯(lián)的進行可以是諸如,于室溫在2%甲醛中孵育細胞——如通過在10ml添加了2%甲醛、10%FCS的DMEM中于室溫孵育1×107個細胞10分鐘。
      第一限制性內(nèi)切酶 本文所用的術語“第一限制性內(nèi)切酶”指用于消化交聯(lián)的DNA的第一限制性內(nèi)切酶。
      第一限制性內(nèi)切酶的選擇取決于要分析的靶序列(如基因座)的類型。希望進行預實驗以優(yōu)化消化條件。
      第一限制性內(nèi)切酶可選自識別至少6bp序列或更多堿基的DNA的限制性內(nèi)切酶。
      識別6個bp序列DNA的限制性內(nèi)切酶包括但不限于,AclI、HindIII、SspI、BspLU11I、AgeI、MluI、SpeI、BglII、Eco47III、StuI、ScaI、ClaI、AvaIII、VspI、MfeI、PmaCI、PvuII、NdeI、NcoI、SmaI、SacII、AvrII、PvuI、XmaIII、SplI、XhoI、PstI、AflII、EcoRI、AatII、SacI、EcoRV、SphI、NaeI、BsePI、NheI、BamHI、NarI、ApaI、KpnI、SnaI、SalI、ApaLI、HpaI、SnaBI、BspHI、BspMII、NruI、XbaI、BclI、MstI、BalI、Bsp1407I、PsiI、AsuII和AhaIII。
      識別超過6bp的序列的DNA的限制性內(nèi)切酶包括但不限于BbvC I、AscI、AsiS I、Fse I、Not I、Pac I、Pme I、Sbf I、SgrA I、Swa I、Sap I、Cci NI、FspA I、Mss I、SgfI、Smi I、SrfI和Sse8387 I。
      對于本發(fā)明的一些方面,對于識別6bp序列的限制性內(nèi)切酶來說,優(yōu)選BglII、HindIII或EcoRI。
      術語“第一限制性內(nèi)切酶識別位點”指被第一限制性內(nèi)切酶識別和切割的核苷酸序列中的位點。
      第二限制性內(nèi)切酶 本文所用的術語“第二限制性內(nèi)切酶”指第一限制性內(nèi)切酶消化、連接交聯(lián)的DNA、去交聯(lián)并(任選)純化DNA之后使用的第二限制性內(nèi)切酶。在一個具體實施方式
      中,第二限制性內(nèi)切酶被用于為目的核苷酸序列提供確定的DNA末端,從而能將已知核苷酸組成的序列與目的核苷酸序列側翼的第二限制性內(nèi)切酶識別位點連接。
      在一個具體實施方式
      中,將已知核苷酸組成的序列與目的核苷酸序列側翼(如在每一側或每一端)的第二限制性內(nèi)切酶識別位點連接,涉及在稀釋的條件下連接以促進在靶核苷酸序列側翼的第二限制性內(nèi)切酶識別位點和連接的目的核苷酸序列之間的分子內(nèi)連接。這有效地導致了DNA環(huán)的形成,其中已知靶核苷酸序列位于目的未知序列的側翼。
      在另一個具體實施方式
      中,將已知核苷酸組成的序列連接于在目的核苷酸序列側翼(如在每一側或每一端)的第二限制性內(nèi)切酶識別位點上涉及添加核苷酸組成已知的獨特DNA序列,然后在促進在目的核苷酸序列側翼的第二限制性內(nèi)切酶識別位點和導入的已知核苷酸組成的獨特DNA序列之間的分子間連接的條件下進行連接。
      在一個具體實施方式
      中,選擇第二限制性內(nèi)切酶從而不使第二限制性內(nèi)切酶位點在距離第一限制性位點約350bp(如350-400bp)以內(nèi)處。
      在另一個具體實施方式
      中,選擇第二限制性內(nèi)切酶從而使同一第二限制性內(nèi)切酶位點很可能位于連接的核苷酸序列(即連接的交聯(lián)序列)中。由于第一(靶)核苷酸序列和連接的核苷酸序列的末端可以是相適應的粘(或平)末端,因此甚至可以連接序列從而使DNA環(huán)化。因此,消化步驟后,在促進分子內(nèi)相互作用的稀釋條件下連接,并任選通過相適應的末端使DNA環(huán)化。
      優(yōu)選地,第二限制性內(nèi)切酶識別位點是4或5bp核苷酸序列識別位點。識別4或5bp序列的DNA的酶包括但不限于TspEI、MaeII、AluI、NlaIII、HpaII、FnuDII、MaeI、DpnI、MboI、HhaI、HaeIII、RsaI、TaqI、CviRI、MseI、Sth132I、AciI、DpnII、Sau3AI和MnlI。
      在優(yōu)選的具體實施方式
      中,第二限制性內(nèi)切酶是NlaIII和/或DpnII。
      術語“第二限制性內(nèi)切酶識別位點”指核苷酸序列中被第二限制性內(nèi)切酶識別和切割的位點。
      用第二限制性內(nèi)切酶消化后,進行進一步的連接反應。在一個具體實施方式
      中,該連接反應將已知核苷酸序列組成的DNA序列與一個或多個與靶核苷酸序列相連的序列上的第二限制性內(nèi)切酶消化位點連接。
      第三限制性內(nèi)切酶 本文所用的術語“第三限制性內(nèi)切酶”指第二限制性內(nèi)切酶步驟后為了在擴增前線性化環(huán)化的DNA而可任選使用的第三限制性內(nèi)切酶。
      第三限制性內(nèi)切酶優(yōu)選是識別6bp或更多的核苷酸識別位點的酶。
      第三限制性內(nèi)切酶優(yōu)選消化第一和第二限制性內(nèi)切酶識別位點之間的第一(靶)核苷酸序列。如普通技術人員所能理解的,希望第三限制性內(nèi)切酶在消化第一(靶)核苷酸序列時不太靠近第一和第二限制性內(nèi)切酶識別位點,以防使擴增的引物不再雜交。因此,優(yōu)選第三限制性內(nèi)切酶識別位點至少與第一和第二限制性內(nèi)切酶識別位點相距與所用的引物長度相同的距離,從而使一個或多個擴增引物仍能雜交。
      在優(yōu)選的具體實施方式
      中,第三限制性內(nèi)切酶是識別6-bpDNA序列的限制性內(nèi)切酶。
      術語“第三限制性內(nèi)切酶識別位點”指核苷酸序列中被第三限制性內(nèi)切酶識別并切割的位點。
      識別位點 限制性內(nèi)切酶是裂解DNA糖-磷酸骨架的酶。在最實用的配置中,給定的限制性內(nèi)切酶切割一段僅幾個堿基長的雙螺旋DNA的兩條鏈。限制性內(nèi)切酶的底物是被稱為識別位點/序列的雙鏈DNA序列。
      限制性識別位點的長度可變化,這取決于所用的限制性內(nèi)切酶。識別序列的長度控制酶將如何頻繁地在DNA序列中進行切割。
      舉例來說,許多限制性內(nèi)切酶識別4bp的DNA序列。序列和識別4bp的DNA序列的酶包括但不限于AATT(TspEI)、ACGT(MaeII)、AGCT(AluI)、CATG(NlaIII)、CCGG(HpaII)、CGCG(FnuDII)、CTAG(MaeI)、GATC(DpnI、DpnII、Sau3AI&MboI)、GCGC(HhaI)、GGCC(HaeIII)、GTAC(RsaI)、TCGA(TaqI)、TGCA(CviRI)、TTAA(MseI)、CCCG(Sth132I)、CCGC(AciI)和CCTC(MnlI) 進一步舉例來說,許多限制性內(nèi)切酶識別6bp的DNA序列。序列和識別6個堿基對的DNA序列的酶包括但不限于AACGTT(AclI)、AAGCTT(HindIII)、AATATT(SspI)、ACATGT(BspLU11I)、ACCGGT(AgeI)、ACGCGT(MluI)、ACTAGT(SpeI)、AGATCT(BglII)、AGCGCT(Eco47III)、AGGCCT(StuI)、AGTACT(ScaI)、ATCGAT(ClaI)、ATGCAT(AvaIII)、ATTAAT(VspI)、CAATTG(MfeI)、CACGTG(PmaCI)、CAGCTG(PvuII)、CATATG(NdeI)、CCATGG(NcoI)、CCCGGG(SmaI)、CCGCGG(SacII)、CCTAGG(AvrII)、CGATCG(PvuI)、CGGCCG(XmaIII)、CGTACG(SplI)、CTCGAG(XhoI)、CTGCAG(PstI)、CTTAAG(AflII)、GAATTC(EcoRI)、GACGTC(AatII)、GAGCTC(SacI)、GATATC(EcoRV)、GCATGC(SphI)、GCCGGC(NaeI)、GCGCGC(BsePI)、GCTAGC(NheI)、GGATCC(BamHI)、GGCGCC(NarI)、GGGCCC(ApaI)、GGTACC(KpnI)、GTATAC(SnaI)、GTCGAC(SalI)、GTGCAC(ApaLI)、GTTAAC(HpaI)、TACGTA(SnaBI)、TCATGA(BspHI)、TCCGGA(BspMII)、TCGCGA(NruI)、TCTAGA(XbaI)、TGATCA(BclI)、TGCGCA(MstI)、TGGCCA(BalI)、TGTACA(Bsp1407I)、TTATAA(PsiI)、TTCGAA(AsuII)和TTTAAA(AhaIII)。
      進一步舉例來說,許多限制性內(nèi)切酶識別7bp的DNA序列。序列和識別7bp的DNA序列的酶包括但不限于CCTNAGG(SauI)、GCTNAGC(EspI)、GGTNACC BstEII和TCCNGGA PfoI。
      進一步舉例來說,許多限制性內(nèi)切酶識別8bp的DNA序列。序列和識別8bp的DNA序列的酶包括但不限于ATTTAAAT(SwaI)、CCTGCAGG(Sse8387I)、CGCCGGCG(Sse232I)、CGTCGACG(SgrDI)、GCCCGGGC(SrfI)、GCGATCGC(SgfI)、GCGGCCGC(NotI)、GGCCGGCC(FseI)、GGCGCGCC(AscI)、GTTTAAAC(PmeI)和TTAATTAA(PacI)。
      許多這些序列包含序列CG,序列CG可在體內(nèi)甲基化。許多限制性內(nèi)切酶對該甲基化敏感,而且將不會切割甲基化的序列,如HpaII不會切割序列CCmGG,而其同裂酶MspI對該修飾不敏感,能切割甲基化的序列。因此,在一些情況下,不使用真核甲基化敏感的酶。
      在一個具體實施方式
      中,識別位點是消化位點。
      在一個具體實施方式
      中,限制性內(nèi)切酶識別位點是限制性內(nèi)切酶消化位點。
      環(huán)化 根據(jù)本發(fā)明的一個具體實施方式
      ,用于4C的材料通過用第二限制性內(nèi)切酶消化3C模板、然后連接、從而產(chǎn)生DNA環(huán)來制備。
      優(yōu)選地,選擇在距離第一限制性位點大于約350bp(如350-400bp)處切割第一(靶)核苷酸序列的第二限制性內(nèi)切酶。有益的是,這使因拓撲學約束而對環(huán)形成的偏好最小化(Rippe等.(2001)Trends in Biochem.Sciences 26,733-40)。
      第二限制性內(nèi)切酶優(yōu)選是識別4或5bp限制性內(nèi)切酶識別位點的頻繁切割分子。因此可能獲得對擴增期間所有連接的片段提供相等擴增效率的最小限制性片段。
      在第二限制性內(nèi)切酶消化和連接之前,DNA模板將包含第一(靶)核苷酸序列中的一個第二酶識別位點,其與第一限制酶位點相距大于約350-400bp,和另一個第二酶識別位點,其位于已經(jīng)連接的核苷酸序列中(即在第二核苷酸序列中)。
      第二限制性內(nèi)切酶消化步驟優(yōu)選進行1小時以上至過夜,然后使酶熱失活。
      該反應混合物中的DNA優(yōu)選用現(xiàn)有已知的常規(guī)方法/試劑盒來純化。
      在第二限制性內(nèi)切酶消化步驟之后,第二限制性內(nèi)切酶位點將與第一(靶)核苷酸序列中的第一限制酶位點相距大于350-400bp,而且另一個第二限制性內(nèi)切酶位點將位于被連接的核苷酸序列(即第二核苷酸序列)中。由于第一(靶)核苷酸序列和被連接的核苷酸序列的末端具有相適應的末端,因此可連接序列以使DNA環(huán)化。
      消化步驟后,在有利于分子內(nèi)相互作用的稀釋的條件下連接,并通過相適應的末端使DNA環(huán)化。
      連接反應優(yōu)選以約1-5ng/μ1的DNA濃度來進行。
      連接反應優(yōu)選在約16-25℃進行超過1小時(如2、3、4或更多小時)。
      因此,連接反應后,可制備環(huán)化的DNA。環(huán)化的DNA將包含至少第二限制性內(nèi)切酶或第一和第二限制性內(nèi)切酶的識別位點。在包含第一(靶)核苷酸序列的環(huán)化的DNA中,第一限制性內(nèi)切酶識別位點和第二限制性內(nèi)切酶識別位點將限定第一(靶)核苷酸序列和被連接的核苷酸序列(即第二核苷酸序列)的末端。因此,第一限制性內(nèi)切酶識別位點和第二限制性內(nèi)切酶識別位點將使第一(靶)核苷酸序列和被連接的核苷酸序列隔開(如分開)。
      擴增 可進行一個或多個擴增反應以擴增4C DNA模板。
      可利用許多現(xiàn)有已知的不同方法來進行DNA擴增。例如,可利用聚合酶鏈式反應(Saiki等.,1988);連接介導的PCR、Qb復制酶擴增(Cahill,F(xiàn)oster和Mahan,1991;Chetverin和Spirin,1995;Katanaev,Kurnasov和Spirin,1995);連接酶鏈式反應(LCR)(Landegren等.,1988;Barany,1991);自動維持序列復制系統(tǒng)(Fahy,Kwoh和Gingeras,1991)和鏈置換擴增(Walker等.,1992)來擴增DNA。
      優(yōu)選用PCR來擴增DNA。“PCR”指K.B.Mullis的美國專利4,683,195、4,683,202、和4,965,188的方法,其描述了一種方法來增加基因組DNA混合物中核苷酸序列片段濃度而不進行克隆或純化。
      在一個具體實施方式
      中,使用反向PCR。(Ochman等(1988)Genetics120(3),621-3所述的)反向PCR(IPCR)是一種用以快速體外擴增已知序列區(qū)域側翼的DNA序列的方法。該方法使用聚合酶鏈式反應(PCR),它具有與常規(guī)方向相反方向的引物。反向引物的模板是自身連接成環(huán)的限制性片段。反向PCR在分子遺傳學中有許多應用,例如,擴增和鑒定在轉座元件側翼的序列。為了增加擴增的有效性和可重復性,優(yōu)選將DNA環(huán)線性化,然后用第三限制性內(nèi)切酶進行擴增。優(yōu)選使用第三限制性內(nèi)切酶,其是識別6bp或更多bp的限制性內(nèi)切酶。第三限制性內(nèi)切酶優(yōu)選切割第一和第二限制性內(nèi)切酶位點之間的第一(靶)核苷酸序列。
      用第二限制性內(nèi)切酶消化3C模板,任選進行環(huán)化,連接(如在稀釋條件下連接)并任選將含第一(靶)核苷酸序列的環(huán)線性化,可產(chǎn)生用于擴增的DNA模板(“4C DNA模板”)。
      對于擴增步驟,使用至少2種寡核苷酸引物,其中每一種引物與在目的核苷酸序列的側翼的DNA序列雜交。在優(yōu)選的具體實施方式
      中,使用至少2種寡核苷酸引物,其中每一種引物與在目的核苷酸序列的側翼的靶序列雜交。
      在一個具體實施方式
      中,在引物雜交的上下文中的術語“側翼”指至少一種引物與和目的核苷酸序列的一個末端(如5’末端)相鄰的DNA序列雜交,而且至少一種引物與在目的核苷酸序列的另一個末端(如3’末端)上的DNA序列雜交。優(yōu)選至少一種正向引物與和目的核苷酸序列的一個末端(如5’末端)相鄰的DNA序列雜交,而且至少一種反向引物與在目的核苷酸序列的另一個末端(如3’末端)上的DNA序列雜交。
      在優(yōu)選的具體實施方式
      中,在引物雜交的上下文中的術語“側翼”指至少一種引物與和目的核苷酸序列的一個末端(如5’末端)相鄰的靶序列雜交,而且至少一種引物與在目的核苷酸序列的另一個末端(如3’末端)上的靶序列雜交。優(yōu)選至少一種正向引物與和目的核苷酸序列的一個末端(如5’末端)相鄰的靶序列雜交,而且至少一種反向引物與在目的核苷酸序列的另一個末端(如3’末端)上的靶序列雜交。
      本文所用的術語“引物”指寡核苷酸,無論是以純化的限制性消化物的形式天然產(chǎn)生的還是合成生產(chǎn)的,其都能在置于能誘導合成與核酸鏈互補的引物延伸產(chǎn)物的條件下(即,在核苷酸和誘導劑(如DNA聚合酶)存在時,并且以合適的溫度和pH)時用作合成起始點。引物優(yōu)選是單鏈的,從而有最大擴增效率,但可以是雙鏈的。如果是雙鏈的,則首先處理引物以分開其鏈,然后用于制備延伸產(chǎn)物。引物優(yōu)選是寡脫氧核糖核苷酸。引物必須足夠長到能在誘導劑存在的條件下引發(fā)合成延伸產(chǎn)物。引物的確切長度將取決于許多因素,包括溫度、引物來源和所用的方法。
      適宜的是,引物長度將是至少15、優(yōu)選至少20、例如至少25、30或40個核苷酸。優(yōu)選擴增引物長度為16至30個核苷酸。
      優(yōu)選將引物設計成盡可能靠近分隔第一(靶)核苷酸序列和第二核苷酸序列的第一和第二限制性內(nèi)切酶識別位點。可設計引物從而使它們相距第一和第二限制性內(nèi)切酶識別位點在約100個核苷酸之內(nèi)——如約90、80、70、60、50、40、30、20、10、9、8、7、6、5、4、3、2或1個核苷酸。
      適宜的是,設計擴增引物以使它們的3’末端向外朝著第一和第二限制性內(nèi)切酶識別位點,從而使延伸立即穿過限制酶位點進入第二核苷酸序列。
      如果所用的擴增方法是反向PCR,則優(yōu)選在約100-400ng 4C模板DNA(每個約50μl PCR反應混合物中)或重復PCR反應能得到可重復的結果(參見圖1)并在每個PCR反應中包括最大數(shù)量的連接事件的其他DNA量上進行擴增反應。
      優(yōu)選根據(jù)廠商說明利用緩沖液1,用Expand Long Template PCR系統(tǒng)(Roche),進行反向PCR擴增反應。
      樣品 本文所用的術語“樣品”具有其正常的含義。樣品可以是任何物質實體,其包含交聯(lián)或能交聯(lián)的DNA。樣品可以是或可以源自生物材料。
      樣品可以是或可以源自一個或多個實體——如一個或多個細胞、一個或多個核、或一個或多個組織樣品。實體可以是或可以源自其中存在DNA,如染色質的任何實體。樣品可以是或可以源自一個或多個分離的細胞或一個或多個分離的組織樣品、或一個或多個分離的核。
      樣品可以是或可以源自活細胞和/或死細胞和/或核溶解產(chǎn)物和/或分離的染色質。
      樣品可以是或可以源自患病和/或沒有患病的受試者。
      樣品可以是或可以源自懷疑罹患疾病的受試者。
      樣品可以是或可以源自要測試他們將來將罹患疾病的可能性的受試者。
      樣品可以是或可以源自活的或不活的患者材料。
      Splinter等.,(2004)Methods Enzymol.375,493-507中詳細描述了固定細胞和組織用于制備3C模板。
      標記 優(yōu)選,核苷酸序列(如擴增的4C DNA模板、引物或探針等)是標記的,從而輔助它們的下游應用——如陣列雜交。舉例來說,4C DNA模板可利用隨機引發(fā)或缺口翻譯來標記。
      可用許多種標記物(如報告分子)來標記本文所述的核苷酸序列,尤其在擴增步驟中。合適的標記包括放射性核素、酶、熒光、化學發(fā)光、或發(fā)色劑以及底物、輔助因子、抑制劑、磁性顆粒等。教導應用這些標記的專利包括US-A-3817837;US-A-3850752;US-A-3939350;US-A-3996345;US-A-4277437;US-A-4275149和US-A-4366241。
      其它標記包括而不限于β-半乳糖苷酶、轉化酶、綠色熒光蛋白、熒光酶、氯霉素、乙酰轉移酶、β-葡糖醛酸酶、外切葡聚糖酶和葡糖淀粉酶。也可用熒光標記、以及帶有特定化學性質的特異合成的熒光試劑??捎迷S多種測量熒光的方式。例如,一些熒光標記展示出激發(fā)或吸收光譜的變化,一些當其中一種熒光報告分子放出熒光而第二種吸收熒光時展示出共振能量轉移,一些展示出熒光喪失(淬滅)或顯示熒光,而一些報告旋轉運動。
      為了獲得足以進行標記的材料,可匯集多次擴增,而不用增加每個反應中的擴增循環(huán)數(shù)量。另外,標記的核苷酸可被整合進最后幾個擴增反應循環(huán)中(如30個循環(huán)的PCR(無標記)+10個循環(huán)的PCR(有標記))。
      陣列 在特別有益的具體實施方式
      中,根據(jù)本文所述方法制備的4C DNA模板可與陣列雜交。因此,可用陣列(如微陣列)技術來鑒定頻繁與第一(靶)核苷酸序列共有核位點的核苷酸序列(如基因組片段)。
      根據(jù)本發(fā)明,可用現(xiàn)有的陣列(如表達和基因組陣列)??墒?,本發(fā)明還尋求提供新的如本文所述的陣列(如DNA陣列)。
      “陣列”是有意產(chǎn)生的核酸集合,其可合成或生物合成制備,并可以各種不同形式(如,可溶性分子文庫;和連在樹脂珠、硅片、或其他固相支持物上的寡聚物文庫)來篩選生物活性。另外,術語“陣列”包括那些通過將幾乎任意長度(如,從1至約1000個核苷酸單體長度)的核酸點樣在基質上而制備的核酸的文庫。
      陣列技術和與其相關的各種技術和應用一般在大量教科書和文獻中有描述。這些包括Lemieux等.,1998,Molecular Breeding 4,277-289,Schena和Davis.Parallel Analysis with Biological Chips.摘自PCR Methods Manual(M.Innis,D.Gelfand,J.Sninsky編),Schena和Davis,1999,Genes,Genomesand Chips.摘自DNA MicroarraysA Practical Approach(M.Schena編),Oxford University Press,Oxford,英國,1999),The Chipping Forecast(NatureGenetics特刊;1999年1月增刊),Mark Schena(編),Microarray BiochipTechnology,(Eaton Publishing Company),Cortes,2000,The Scientist 14[17]25,Gwynne和Page,Microarray analysisthe next revolution in molecularbiology,Science,1999年8月6日;和Eakins和Chu,1999,Trends inBiotechnology,17,217-218。
      陣列技術克服了傳統(tǒng)分子生物學方法的缺點,傳統(tǒng)分子生物學方法一般以“一個實驗中一個基因”為基礎進行作業(yè),是低通量的并且不能形成基因功能的“全景圖”。當前,陣列技術的主要應用包括鑒定序列(基因/基因突變)和確定基因表達水平(豐度)?;虮磉_譜可運用陣列技術,任選還合并運用蛋白質組技術(Celis等,2000,F(xiàn)EBS Lett,480(1)2-16;Lockhart和Winzeler,2000,Nature 405(6788)827-836;Khan等.,1999,20(2)223-9)。陣列技術的其它應用也是現(xiàn)有已知的;例如,基因發(fā)現(xiàn)、癌癥研究(Marx,2000,Science 2891670-1672;Scherf,等,2000,Nat Genet;24(3)236-44;Ross等,2000,Nat Genet.2000 Mar;24(3)227-35)、SNP分析(Wang等,1998,Science,280(5366)1077-82)、藥物發(fā)現(xiàn)、藥物基因組學、疾病診斷(例如,利用微流體學設備Chemical&Engineering News,1999年2月22日,77(8)27-36)、毒理學(Rockett和Dix(2000),Xenobiotica,30(2)155-77;Afshari等.,1999,Cancer Resl;59(19)4759-60)和毒理基因組學(綜合了功能基因組學和分子毒理學的學科)。
      一般而言,任何文庫都可通過在空間上分隔文庫的成員來以有序方式排列成陣列。合適的陣列文庫的例子包括核酸庫(包括DNA、cDNA、寡核苷酸等文庫)、肽、多肽和蛋白質文庫、以及包含任何分子的文庫,如配體庫,以及其它。
      樣品(如,庫的成員)一般被固定或固定化在固相上,優(yōu)選在固體基質上,由此限制樣品的擴散和混合。在優(yōu)選的具體實施方式
      中,可制備結合配體的DNA庫。尤其可將庫固定在基本上平的固相上,包括膜和無孔基質(如塑料和玻璃)上。另外,樣品優(yōu)選以方便標引(即,提供對特定樣品的參考或提取)的方式排列。通常樣品被用作網(wǎng)格形式中的點。為此可修改普通測試系統(tǒng)。例如,陣列可固定在微板表面上,一個孔中有多個樣品,或每個孔中有單個樣品。此外,固體基質可以是膜,如硝化纖維素或尼龍膜(例如,用于印跡實驗中的膜)。其它基質包括基于玻璃或硅的基質。因此,樣品可用任何合適的現(xiàn)有已知的方法來固定,例如,通過電荷相互作用,或通過化學偶聯(lián)于孔壁或底上、或膜表面上??捎闷渌帕泻凸潭ǚ椒?,例如,用吸管點、滴落接觸、壓電法、噴墨和噴泡沫技術、靜電應用等。對于基于硅的芯片來說,可用照相平版印刷來將樣品排列并固定于芯片上。
      通過“點”在固體基質上來排列樣品;這可以手工進行或通過使用機器人技術來點樣樣品。一般而言,陣列可被描述成大陣列或微陣列,其區(qū)別是樣品點的大小。大陣列通常含約300微米或更大的大小的樣品點并可方便地通過現(xiàn)有的凝膠和印跡掃描儀來成像。微陣列中的樣品點直徑大小通常小于200微米,而且這些陣列通常含上千個點。因此,微陣列需要專門的機器人技術和成像設備,其可能需要定制。所用的儀器在Cortese,2000,The Scientist 14[11]26中有一般性的綜述。
      產(chǎn)生固定的DNA分子文庫的技術在現(xiàn)有技術中有過描述。一般而言,大多數(shù)現(xiàn)有技術方法描述了如何合成單鏈核酸分子文庫,其利用諸如隱蔽技術在固體基質上的各種離散位置處產(chǎn)生各種序列改變。美國專利5,837,832描述了一種基于大規(guī)模整合技術的改進的方法來產(chǎn)生固定于硅基質上的DNA陣列。尤其是,美國專利5,837,832描述了一種被稱為“鋪瓦”的策略在基質上空間確定的位置上合成特定探針組,其可用于產(chǎn)生本發(fā)明固定的DNA庫。美國專利5,837,832也提供了所涉及的也可使用的較早技術的參考。
      也可用光沉積化學來制造陣列。
      肽(或肽模擬物)陣列也可以在表面上合成,其方式是將每個獨特的文庫成員(如,獨特的肽序列)置于離散的、預先確定的陣列位置上。每個文庫成員的身份是由陣列中空間位置確定的。確定陣列中預先確定的分子(如,靶或探針)和反應性庫成員之間發(fā)生的結合性相互作用的位置,由此基于空間位置來鑒定反應性庫成員的序列。這些方法描述于美國專利5,143,854;WO90/15070和WO92/10092;Fodor等.(1991)Science,251767;Dower和Fodor(1991)Ann.Rep.Med.Chem.,26271中。
      為了幫助檢測,通常使用(如上所述的)標記,如任何方便檢測的報道分子,例如,熒光、生物發(fā)光、磷光、放射性等報道分子。這些報道分子、其檢測、與靶/探針的偶聯(lián)等在本文的其它地方有討論。探針和靶的標記還公開于Shalon等.,1996,Genome Res6(7)639-45中。
      特定DNA陣列的例子如下 I型利用機器人點樣將探針cDNA(500~5,000個堿基長)固定于固體表面(如玻璃),并將其暴露于一組分離或混合的靶。該方法被廣泛認為是由斯坦福大學開發(fā)的(Ekins和Chu,1999,Trends in BioTechnology,1999,17,217-218)。
      II型寡核苷酸(20-25聚寡聚物,優(yōu)選是40-60聚寡聚物)或肽核酸(PNA)探針陣列被原位(芯片上)合成或常規(guī)合成并之后固定在芯片上。將陣列暴露于標記的樣品DNA,雜交,并確定互補序列的身份/豐度。該DNA芯片由Affymetrix,Inc.以GeneChip商標銷售。Agilent和Nimblegen也提供了合適的陣列(如基因組嵌合陣列)。
      一些可商購的微陣列型號的例子在下表1中列出(也可參見Marshall和Hodgson,1998,Nature Biotechnology,16(1),27-31). 表1當前可用的雜交微陣列型號的例子 為了從基于陣列的測試中產(chǎn)生數(shù)據(jù),檢測表明探針和核苷酸序列間存在或缺少雜交的信號。本發(fā)明還關注直接和間接標記技術。例如,直接標記將熒光染料直接整合到與陣列相連的探針雜交的核苷酸序列上(如,在存在標記的核苷酸或PCR引物情況下通過酶催化合成將染料整合到核苷酸序列)。直接標記方案能產(chǎn)生強雜交信號,其通常利用化學結構和性質相似的熒光染料家族,并易于實現(xiàn)。在優(yōu)選的包括直接標記核酸的具體實施方式
      中,將青色素或alexa類似物用于多重熒光比較陣列分析中。在其它具體實施方式
      中,間接標記方案可用于在與微陣列探針雜交之前或之后將表位整合在核酸上。一種或多種染色過程和試劑可用于標記雜交的復合物(如,結合表位的熒光分子,由此通過與雜交物的表位連接的染料分子可提供熒光信號)。
      數(shù)據(jù)分析也是涉及陣列的實驗中的重要部分。陣列實驗中得到的未加工的數(shù)據(jù)通常是圖像,其需要轉成矩陣——表,其中行代表諸如基因,列代表諸如各種樣品(如組織)或實驗條件,而且每個單元中的數(shù)字表征諸如特定序列(優(yōu)選是與第一(靶)核苷酸序列連接的第二序列)在特定樣品中的表達。如果要提取出任何有關的生物學過程的知識,這些矩陣必須進一步被分析。數(shù)據(jù)分析方法(包括有指導的和無指導的數(shù)據(jù)分析以及生物信息學方法)被公開于Brazma和Vilo J(2000)FEBS Lett 480(1)17-24中。
      如本文所述,標記的并之后與陣列雜交的一個或多個核苷酸序列(如DNA模板)包含富含帶有獨特重要性的小段序列的核苷酸序列,即橫跨在3C過程期間與第一(靶)核苷酸序列相連的第一限制性內(nèi)切酶識別位點和它們各自相鄰的第二限制性內(nèi)切酶識別位點之間的核苷酸序列。
      單個陣列可包含多種(如兩種或多種)誘餌序列。
      探針 本文所用的術語“探針”指分子(如,寡核苷酸,無論其是以純化的限制性消化物形式天然產(chǎn)生的還是合成、重組或通過PCR擴增而產(chǎn)生的),其能夠與另一種目的分子(如,另一種寡核苷酸)雜交。當探針是寡核苷酸時,它們可以是單鏈或雙鏈的。探針可用于檢測、鑒定和分離特定的靶(如,基因序列)。如本文所述,關注的是,本發(fā)明所用的探針可以是用標記物標記的,從而可在任何檢測系統(tǒng)中檢測,其包括但不限于酶(如,ELISA、以及基于酶的組織化學測試)、熒光、放射性、和發(fā)光系統(tǒng)。
      至于陣列和微陣列,術語“探針”被用于指任何為了檢測已經(jīng)與所述探針雜交的核苷酸序列而可固定于陣列上的可雜交材料。這些探針優(yōu)選是25-60聚或更長的。
      探針設計策略被描述于WO95/11995、EP 717,113和WO97/29212中。
      由于4C能對相互作用進行無偏好的基因組廣度的搜索,因此其能有益地制備陣列,其中帶有的探針能探測基因組中每個可能的(如獨特/非重復的)第一限制性內(nèi)切酶識別位點。因此,陣列設計僅依賴于第一限制性內(nèi)切酶的選擇,而不依賴于第一或第二核苷酸的實際序列。
      盡管可根據(jù)本發(fā)明所述使用現(xiàn)有的陣列,優(yōu)選使用其它構型。
      在一種構型中,設計陣列上的一個或多個探針,從而使它們能雜交于由第一限制性內(nèi)切酶消化的位點附近。一個或多個探針更優(yōu)選是在距離第一限制性內(nèi)切酶識別位點約20bp內(nèi)。一個或多個探針更優(yōu)選是在距離第一限制性內(nèi)切酶識別位點約50bp內(nèi)。
      適宜的是,一個或多個探針是在距離第一限制性內(nèi)切酶識別位點約100bp(如約0-100bp、約20-100bp)內(nèi)。
      在一種優(yōu)選的構型中,單個、獨特的探針被設計在由第一限制性內(nèi)切酶消化的位點之每一側的100bp內(nèi)。
      在另一種優(yōu)選的構造中,相對于第一限制性內(nèi)切酶消化的位點位置的第二限制性內(nèi)切酶消化的位點位置也納入考量。在這種構型中,單個、獨特的探針僅被設計在第一限制性內(nèi)切酶消化的位點之每一側上,其與最接近的第二限制性內(nèi)切酶識別位點距離大到足夠在第一和第二限制性內(nèi)切酶識別位點間設計給定長度的探針。例如,在這種構型中,沒有探針被設計成位于與同一側的第二限制性內(nèi)切酶識別位點距離10bp之內(nèi)的特定第一限制性內(nèi)切酶識別位點的一側。
      在另一種構型中,設計陣列上的探針,從而使它們能與第一限制性內(nèi)切酶消化的位點之任一側雜交。適宜的是,可使用第一限制性內(nèi)切酶識別位點每一側上的單個探針。
      在又一種構型中,兩種或多種(如3、4、5、6、7或8或更多)探針可被設計在第一限制性內(nèi)切酶識別位點之每一側上,然后其可用于研究同一連接事件。對于探針相對于每一個第一限制性內(nèi)切酶識別位點的數(shù)量和位置,可考量其相鄰的第二限制性內(nèi)切酶識別位點的確切基因組位置。
      在又一種構造中,兩種或多種(如3、4、5、6、7或8或更多)探針可被設計成位于每個第一限制性內(nèi)切酶識別位點附近,而不考慮最接近的第二限制性內(nèi)切酶識別位點。在這種構型中,所有探針應仍舊靠近第一限制性內(nèi)切酶識別位點(優(yōu)選在限制性位點的300bp內(nèi))。
      有益的是,后者的設計,還有每個第一限制性內(nèi)切酶識別位點(的一邊)1個探針的設計,都能應用不同的第二限制性內(nèi)切酶與給定的第一限制性內(nèi)切酶的組合。
      有益的是,每個第一限制性內(nèi)切酶識別位點應用多個(如2、3、4、5、6、7或8或更多)探針可使由于單個探針的不良表現(xiàn)而得到假陰性結果的問題最小化。而且,它也可增加單個芯片實驗中得到的數(shù)據(jù)的可靠性,并減低得到統(tǒng)計學上可信結論所需的陣列數(shù)量。
      用于陣列中的探針可大于40個核苷酸長而且可以是等溫的。
      優(yōu)選排除含重復DNA序列的探針。
      用于偵測在第一核苷酸序列緊鄰的側翼或附近的限制酶位點的探針預計能帶來非常強的雜交信號,并也可排除出探針設計。
      陣列可涵蓋任何基因組,包括哺乳動物(如人、小鼠(如染色體7))、脊椎動物(如斑馬魚))、或非脊椎動物(如細菌、酵母、真菌或昆蟲(如果蠅))基因組。
      在進一步優(yōu)選的具體實施方式
      中,陣列含在每個獨特的第一限制酶位點周圍、而且盡可能地接近限制性內(nèi)切酶消化位點的2-6個探針。
      距限制性內(nèi)切酶消化位點的最大距離優(yōu)選是約300bp。
      在本發(fā)明進一步優(yōu)選的具體實施方式
      中,提供了針對限制性內(nèi)切酶(如HindIII、EcoRI、BglII和NotI)的陣列,其涵蓋了哺乳動物或非哺乳動物基因組。有益的是,本文所述的陣列設計克服了對每個靶序列重新設計陣列的要求,只要在相同物種中進行分析。
      探針組 本文所用的術語“探針組”指探針組合或集合,所述探針與基因組中第一限制性內(nèi)切酶的第一限制性內(nèi)切酶識別位點之每一個雜交。
      因此,在另一方面,提供了探針組,所述探針在序列上與和基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點相鄰的核酸序列互補。
      適宜的是,探針組在序列上與和基因組DNA中每一個第一限制性內(nèi)切酶識別位點相鄰的最初25-60(如35-60、45-60、或50-60)或更多個核苷酸互補。探針組在序列上可與第一限制性內(nèi)切酶識別位點之(任)一側或兩側互補。因此,探針在序列上可與基因組DNA中每一個第一限制性內(nèi)切酶識別位點之每一側相鄰的核酸序列互補。
      也可能確定其中該組的一個或多個探針可被設計的窗口(如距離第一限制性內(nèi)切酶識別位點300bp或更少,如250bp、200bp、150bp或100bp)。對于確定窗口(在窗口中設計探針)而言重要的因素為諸如GC-含量、缺少能形成發(fā)夾結構的回文序列、單一類型核苷酸區(qū)段的最大尺寸。因此,探針組在序列上可與距離基因組DNA中每一個第一限制性內(nèi)切酶識別位點小于300bp的核酸序列互補。
      也可能確定距離第一限制性內(nèi)切酶識別位點約100bp的窗口以鑒定出在每個限制性位點附近的最優(yōu)探針。
      在本發(fā)明的其它具體實施方式
      中,探針組與距離基因組DNA中每一個第一限制性內(nèi)切酶識別位點小于300bp的序列互補,與距離基因組DNA中每一個第一限制性內(nèi)切酶識別位點200-300bp的序列互補和/或與距離基因組DNA中每一個第一限制性內(nèi)切酶識別位點100-200bp的序列互補。
      在本發(fā)明的其它具體實施方式
      中,探針組與距離基因組DNA中每一個第一限制性內(nèi)切酶識別位點0-300bp的序列互補,與距離基因組DNA中每一個第一限制性內(nèi)切酶識別位點0-200bp的序列互補和/或與距離基因組DNA中每一個第一限制性內(nèi)切酶識別位點0-100bp的序列互補(如距離基因組DNA中每一個第一限制性內(nèi)切酶識別位點約10、20、30、40、50、60、70、80或90bp)。
      甚至可設計兩種或多種能夠與和基因組DNA中每個第一限制性內(nèi)切酶識別位點相鄰的序列雜交的探針。
      探針可重疊或部分重疊的。如果探針重疊,則優(yōu)選重疊小于10個核苷酸。
      也可用代表在每個第一限制性內(nèi)切酶識別位點側翼的最初1-300個核苷酸(如1-20、1-40、1-60、1-80、1-100、1-120、1-140、1-160、1-180、1-200、1-220、1-240、1-260或1-280個核苷酸)的PCR片段。
      PCR片段也可用作探針,其嚴格對應于其兩側分別為第一限制性內(nèi)切酶識別位點和第一個鄰近的第二限制性內(nèi)切酶識別位點的每個基因組位點。因此,探針序列可對應于每一個第一限制性內(nèi)切酶識別位點和每一個第一個相鄰的第二限制性內(nèi)切酶識別位點之間的全部或部分序列。
      通常,探針、探針陣列或探針組將固定于支持物上。支持物(如固相支持物)可由各種材料制成,如玻璃、硅石、塑料、尼龍或硝化纖維素。支持物優(yōu)選是剛性的并具有平坦的表面。支持物通常有約1-10,000,000個離散的可空間編址的區(qū)域、或單元。具有約10-1,000,000或約100-100,000或約1000-100,000個單元的支持物是常見的。單元密度通常至少為每平方厘米約1000、10,000、100,000或1,000,000個單元。在一些支持物中,所有單元都被匯聚的探針或探針組混合物占據(jù)。在另一些支持物中,一些單元被匯聚的探針或探針組混合物占據(jù),而其他單元被至少用合成方法可得的純度程度的單一類型的寡核苷酸占據(jù)。
      本文所述的陣列優(yōu)選每個第一限制性內(nèi)切酶識別位點包含至少一種探針,例如對于識別6bp的限制性內(nèi)切酶而言,其在每個人或小鼠基因組中出現(xiàn)約750,000次。
      例如對于識別>6bp的識別序列的限制性內(nèi)切酶,可用約有2×750,000個探針的單個陣列來涵蓋完整的人或小鼠基因組,在每個限制性位點的每一側上有1個探針。
      在優(yōu)選的陣列設計中,存在于陣列上的給定核苷酸序列的探針分子總數(shù)大大超過4C樣品中存在的要與該陣列雜交的同源片段。考慮到4C技術的性質,代表與線性染色質模板上要分析的核苷酸序列相鄰的基因組區(qū)域的片段將在4C雜交樣品中大大過量(如圖2所述)。為了得到有關該豐富片段雜交效率的定量信息,可能必須減少要雜交的樣品量和/或增加陣列上給定的寡核苷酸序列探針的分子數(shù)。
      因此,為了檢測頻繁接觸諸如基因啟動子元件的DNA調節(jié)元件,可能必須使用其中探針僅代表所選的基因組區(qū)域(如約0.5-10Mb)的陣列,但其中每個特定探針出現(xiàn)在陣列上多個(如約100、200、1000個)位置處。該設計也可優(yōu)選用于診斷目的用于檢測位點(如目的基因)周圍局部(如在約10Mb內(nèi))的基因組重排(如缺失、倒位、重復等)。
      陣列可包含約3×750,000個探針、4×750,000個探針、5×750,000個探針、或優(yōu)選6×750,000個探針。陣列更優(yōu)選包含6×750,000個探針,其中每個限制性位點的每一側上有2、3、4、5、6、7或8或更多個探針。陣列最優(yōu)選包含6×750,000個探針,其中每個限制性位點之每一側有3個探針。
      探針陣列或探針組可在支持物上以按步就班的方式合成,或可以預先合成的形式來附著。一種合成方法是VLSIPS.TM.(如US 5,143,854和EP 476,014所述),其必須用光指導寡核苷酸探針在高密度、小型化的陣列中合成。如US 5,571,639和US.5,593,839所述的算法被用來設計能減少合成周期數(shù)的覆蓋物(mask)。如EP 624,059所述,陣列也可以組合方式通過機械限制的軌道將單體遞送到支持物單元來合成。陣列也可通過用噴墨打印機將試劑點樣到支持物上來合成(例如參見,EP 728,520)。
      在本發(fā)明的內(nèi)容中,術語“基本上的探針組”、“基本上的探針陣列”指探針組或陣列包括至少約50、60、70、80、90、95、96、97、98或99%的全部或完整的探針組或陣列。探針組或陣列優(yōu)選是全部或完整的探針組(即100%)。
      在優(yōu)選的具體實施方式
      中,陣列在每個出現(xiàn)于給定基因組的第一限制性內(nèi)切酶識別位點之每一側包括單個獨特的探針。如果這一探針數(shù)超過單個陣列所能包含的探針數(shù),則陣列可優(yōu)選仍包含給定物種完整基因組的代表,但解析度較低,例如按序排列在線性染色體模板上每2、3、4、5、6、7、8、9、10、102、103或104個等探針中的一個存在于陣列上。例如在要找易位配體的情況下,以次優(yōu)化解析度涵蓋完整的人或其他基因組的陣列可比涵蓋相同基因組的一部分的高解析度陣列更優(yōu)選。
      較低解析度的給定物種完整基因組的代表優(yōu)選可通過陣列上的探針來獲得,所述探針每個代表用第一限制性內(nèi)切酶消化后得到的單個限制性片段。這優(yōu)選通過每隔二個、三個、四個、五個、六個、七個、八個、九個、十個、二十個、三十個、四十個、五十個、六十個、七十個、八十個、九十個或一百個等等與相同限制性片段雜交的探針忽略一個而得到。
      給定物種完整基因組的較低解析度的代表優(yōu)選包括沿線性染色體模板平均分布的探針。這優(yōu)選通過忽略顯示最高探針密度的基因組區(qū)域中一個或多個探針來獲得。
      雜交 本文所用的術語“雜交”應當包括“核酸鏈通過堿基配對與互補鏈結合的過程”以及在聚合酶鏈式反應(PCR)技術中進行的擴增過程。
      能選擇性雜交的核苷酸序列一般將與相應互補核苷酸序列在至少20、優(yōu)選至少25或30、例如至少40、60或100或更多個核苷酸區(qū)域上有至少75%、優(yōu)選至少85或90%和更優(yōu)選至少95%或98%同源性。
      “特異雜交”指在嚴緊條件(如65℃和0.1×SSC{1×SSC=0.15M NaCl,0.015M檸檬酸鈉pH 7.0})下使分子只與特定核苷酸序列結合、二聚、或雜交。嚴緊條件是探針將與其靶序列雜交但不與其它序列雜交的條件。嚴緊條件是序列依賴性的,而且在不同情況下是不同的。較長的序列在較高的溫度時特異雜交。一般而言,在確定的離子強度和pH下,所選的嚴緊條件低于特定序列的熱熔點(Tm)約5℃。Tm是(在確定的離子強度、pH、和核酸濃度的條件下)其中互補于靶序列的探針中50%與靶序列平衡雜交的溫度(因為靶序列一般過量存在,在Tm時,50%的探針被平衡占據(jù))。通常,嚴緊條件包括鹽濃度在pH 7.0-8.3時至少為約0.01-1.0M Na(或其他鹽)離子濃度,而且對于短探針,溫度至少為約30℃。嚴緊條件也可添加去穩(wěn)定劑(如甲酰胺或四烷基季銨鹽)來獲得。
      如所屬領域技術人員將會理解的,可用最大嚴緊度的雜交來鑒定或檢測相同的核苷酸序列,而可用中等(或低)嚴緊度的雜交來鑒定或檢測相似或相關的多核苷酸序列。
      將探針陣列與標記的或未標記的核苷酸序列雜交的方法也有描述。可控制特定雜交反應條件來改變雜交(如,增加或減少探針/靶結合嚴緊度)。例如,反應溫度、陰離子和陽離子濃度、去污劑的加入等都可改變陣列探針和靶分子的雜交特征。
      相互作用頻率 對限制性片段連接頻率定量可測量它們的交聯(lián)頻率。適宜的是,則可利用PCR用如Splinter等.(2004)(見上)所述的常規(guī)3C技術來獲得。簡而言之,通過在溴化乙錠染色的瓊脂糖凝膠上分離、然后用Typhoon 9200成像儀(Molecular Dynamics,Sunnyvale,CA)掃描信號強度來測量PCR產(chǎn)物的形成。適宜的是,也如Splinter等.(2004)(見上)所述,用幾個對照來正確解釋數(shù)據(jù)。
      由于本文所述的4C技術提供了高通量分析核空間中兩個或更多個核苷酸序列相互作用的頻率的方法,因此優(yōu)選利用本文所述的陣列來定量限制性片段的連接頻率。
      為了定量,4C樣品中所得的信號用對照樣品所得的信號來正態(tài)化。4C樣品和一個或多個對照樣品用不同的和可分辨的標記物(如染料)標記,并將同時與陣列雜交。一個或多個對照樣品通常將包含所有等摩爾量的DNA片段(即與第一(靶)核苷酸序列連接了的所有潛在的第二核苷酸序列),并且為了排除雜交效率的偏好,它們應與一個或多個第二核苷酸序列大小相似。因此,對照模板通常將包含(與用于獲得4C模板的基因組DNA具有相同遺傳背景的)基因組DNA,其用第一和第二限制性內(nèi)切酶消化,并用與4C模板相同的方法(如隨機引發(fā))來標記。這樣的對照模板有可能校正雜交效率中探針-與-探針的差異。將4C陣列信號相對于對照陣列信號正態(tài)化使得以富集方式而不是隨機事件方式表述結果成為可能。
      標記的4C模板甚至可以與帶有或不帶有不同標記的對照樣品和帶有或不帶有一個或多個不同標記的其它4C模板的陣列雜交。其他4C模板可與該4C模板無關,例如它可以得自不同的組織和/或用不同組的反向PCR引物來獲得。例如,第一4C模板可以是患者的材料,而第二4C模板可得自健康的受試者或對照樣品。
      考慮到基因重排所預計到的驚人的雜交模式,不總是必須將患病的受試者與健康的受試者作比較。因此,多個(如兩個或多個)4C模板(其每一個都可研究來自相同患者或受試者的不同基因座)可與一個(如一個或多個)陣列雜交。
      4C模板可以是不同標記的(如用兩種或多種顏色雜交),和/或在該基因座正常地位于不同染色體上或在相同染色體上的距離足夠遠使得DNA-DNA相互作用信號間的重疊最小的情況下,可以是相同標記的。例如,可以處理患有T細胞白血病的受試者的材料,以獲得針對TCRα/δ(其用一種顏色標記,從而能檢測易位)、和MLL、TAL1、HOX11和LMO2(每0個用相同的第二種顏色標記從而能檢測其他基因重排)的4C模板。這5種4C模板可與陣列雜交,從而能在多個基因座處同時分析與疾病相關的基因組重排。
      為了定量相互作用的頻率,也可考量相對于對照樣品的絕對信號強度或比率。另外,線性染色體模板上相鄰的探針信號可用于鑒定相互作用的染色體區(qū)域。該位置信息優(yōu)選通過在線性染色體模板上按序排列探針并通過變換窗口法,例如使用連續(xù)平均或連續(xù)中位數(shù)法,來分析絕對信號強度或相對于對照模板信號的比率。
      測試方法 在本發(fā)明的另一方面,提供了鑒定一種或多種調節(jié)DNA-DNA相互作用的試劑的測試方法。
      本文所用的術語“調節(jié)”指防止、減小、抑制、恢復、抬升、增加或以其它方式影響DNA-DNA相互作用。
      在一些情況下,希望評估兩種或多種試劑在一起用于調節(jié)DNA-DNA相互作用。在這些情況下,測試可通過在第一試劑同時或之后加入該一種或多種額外的試劑來方便地修改。
      本發(fā)明的方法也可以是篩選方法,由此測試許多試劑能否調節(jié)DNA-DNA相互作用的活性。
      預計本發(fā)明的測試方法適于小和大規(guī)模篩選試劑以及進行定量測試。
      這些治療劑的醫(yī)學應用包括在本發(fā)明的范圍內(nèi),藥物開發(fā)程序本身和包含這些試劑的藥物組合物也包括在其中。例如,藥物開發(fā)程序可包括取得由或可由本文所述的方法鑒定的試劑,任選修飾它(如修飾它的結構和/或提供包含所述部分的新的組合物)并進行進一步研究(如毒性研究和/或對于活性、結構或功能研究)??稍诜侨藙游锷线M行試驗并最終在人上進行。這些試驗一般會包括確定不同劑量水平的一種或多種效果。藥物開發(fā)程序可利用計算機來分析由篩選方法鑒定的部分(如預測結構和/或功能,鑒定可能的激動劑或拮抗劑,搜索可能具有相似結構或功能的其他部分等)。
      診斷測試 當前,各種基因組重排仍難以通過分子-細胞遺傳技術來檢測。盡管陣列比較基因組雜交技術(陣列-CGH)是新近開發(fā)的技術用以以35-300Kb的解析度檢測染色體擴增和/或缺失,但是該技術不適于檢測平衡的易位和染色體倒位。在另一方面,光譜核型分析(spectral karyotyping,SKY)或常規(guī)核型分析經(jīng)常在患者材料上進行來檢測染色體易位以及數(shù)量改變,但是確定易位斷點的解析度低,通常分別為10-50Mb和5-10Mb。因此,這兩種方法(尤其是SKY)得到的結果將要導致進行費時、費力的驗證實驗,像熒光原位雜交(FISH)和分子斷點克隆策略。
      4C技術包括可基于物理連接的DNA序列間相互作用頻率的改變檢測任何染色體重排的過程。所以,4C技術可用于為大多數(shù)人惡性腫瘤/多種先天畸形或智力遲鈍鑒定(復發(fā)的)染色體重排。4C技術的重要優(yōu)勢是它能非常準確地將斷點作圖在僅幾千個堿基對的區(qū)域上。4C技術的另一個優(yōu)勢是不需要事先知道確切的斷點位置,這是因為即使4C-誘餌序列距離斷點1-5Mb時也能檢測到斷點。這也具有相同的誘餌序列可用于檢測覆蓋大斷點區(qū)域的特定染色體重排的優(yōu)勢。通過4C技術將基因組重排準確作圖將大大方便鑒定涉及疾病或遺傳病的一個或多個異常表達的基因,這對于更好地理解基因型-表型的相互關系將發(fā)揮重要貢獻,幫助做出治療決定,并增加重要的預測信息。
      在本發(fā)明的一個具體實施方式
      中,為了提供診斷或預測疾病的基礎,要建立受試者的正?;驑藴手?。這通過測試取自正常受試者(如動物或人)的樣品來獲得。DNA-DNA相互作用的頻率可通過將它與一系列稀釋度的陽性對照比較來定量。然后,得自正常樣品的正常值可與得自受或潛在將受疾病或病癥影響的受試者樣品的值來比較。標準和受試者值之間的偏差確立了疾病狀態(tài)的存在。
      可修改這些診斷測試來評估特定治療方案的功效并用于動物研究、臨床試驗、或用于監(jiān)測單個患者的治療。為了提供診斷疾病的基礎,要確立DNA-DNA相互作用的正常或標準圖譜。得自正常樣品的標準值可與得自受或潛在將受疾病或病癥影響的受試者樣品的值來比較。標準和受試者值之間的偏差確立了疾病狀態(tài)的存在。如果確定了疾病,則可給藥現(xiàn)有的治療劑,并產(chǎn)生治療圖譜或值。最終,有規(guī)律地重復該方法來評估該值是否朝正?;驑藴誓J竭M行或回歸正常或標準模式。連續(xù)治療圖譜可用于顯示幾天或幾個月內(nèi)治療的功效。
      4C技術準確地檢測了與要分析的核苷酸序列順式連接的至少5Mb的基因組DNA(參見圖2-3和5)。有益的是,4C技術可用于檢測任何伴隨著重排序列和所選的4C序列(誘餌)之間基因組位點分離的改變的基因組異常。例如,該改變可以是基因組位點分離的增加或減小,或可以是與4C序列(誘餌)相鄰(如距離多至或大于15Mb)的序列的不充分代表(如在缺失中)或過度代表(如在復制中)。通常,該基因組異?;蛑嘏攀羌膊?如癌癥(如白血病)和如本文所述的其他遺傳或先天疾病)的成因或與之相關。
      基因異常(如基因組或染色體異?!缙胶獾暮?或不平衡的基因組或染色體異常)包括但不限于核酸(如染色體)的重排、易位、倒位、插入、缺失和其他突變以及丟失或獲得部分或完整的染色體。它們是遺傳病癥或疾病(包括先天疾病和獲得性病癥,如惡性腫瘤)的主要成因。在許多重排中,涉及2條不同的染色體。用這種方式,基因(或基因片段)從特定染色體的正常生理內(nèi)容物中被去除,而且位于受體染色體上,鄰近不相關的基因或基因片段(通常是致癌基因或原癌基因)。
      惡性腫瘤可包括急性白血病、惡性淋巴瘤和實體腫瘤。改變的非限制性實例有t(14;18),其通常發(fā)生在NHL中;t(12;21),其通常在兒童期的前體-B-ALL中找到;和急性白血病中出現(xiàn)的11q23(MLL(骨髓樣-淋巴樣白血病或混合譜系的白血病)基因)異常。
      染色體區(qū)域11q23中的MLL基因涉及ALL和急性髓細胞樣白血病(AML)中的幾種易位。至今,至少鑒定出了10種配偶體基因。這些易位中的一些(如t(4;11)(q21;q23)、t(11;19)(q23;p13)和t(1;11)(p32;q23))主要發(fā)生在ALL中;而其他的,像t(1;11)(q21;q23)、t(2;11)(p21;q23)、t(6;11)(q27;q23)和t(9;11)(p22;q23),則更常在AML中被觀察到。涉及11q23區(qū)域的重排非常頻繁地發(fā)生在嬰兒急性白血病中(約60-70%),并較少地發(fā)生在兒童和成人白血病中(分別約為5%)。
      淋巴樣惡性腫瘤中的重排通常涉及Ig或TCR基因。實例包括三類在Burkitt氏淋巴瘤中發(fā)現(xiàn)的易位(t(8;14),t(2;8),和t(8;22)),其中MYC基因分別與Ig重鏈(IGH)、Igк(IGK)、或Igλ(IGL)基因片段偶聯(lián)。此類中的另一種常見類型的易位是t(14;18)(q32;q21),其在約90%的濾泡狀淋巴瘤(其為主要NHL類型之一)中被觀察到。在該易位中,將BCL2基因重排至JH基因片段內(nèi)或與之相鄰的IGH基因座內(nèi)的區(qū)域。該染色體異常的結果是過量表達BCL2蛋白質,其在生長控制中通過抑制程序性細胞死亡來起存活因子的作用。
      BCL2基因由三個外顯子組成,但這些分散在大區(qū)域中。其中最后一個外顯子編碼大的3′非翻譯區(qū)域(3′UTR)。該3′UTR是2個其中有許多t(14;18)斷點成群聚集的區(qū)域之一,并被稱為“主要斷點區(qū)”;另一個涉及t(14;18)易位的斷點區(qū)域位于BCL2基因座下游20-30kb處,并被稱為“次要成群區(qū)”。第三個BCL2斷點區(qū)——VCR(變體成群區(qū))位于BCL2基因座的5′側,并處于其他涉及變體易位的區(qū)域中,這些其他涉及變體易位的區(qū)域即t(2;18)和t(18;22),IGK和IGL基因片段是其配偶體基因。
      因此,舉例來說,4C技術可用于篩選針對在基因座中或附近的遺傳異常的患者材料,這些基因座基于它們與給定的臨床表型的頻繁相關性而選擇。這些基因座的其它非限制性的例子有AML1、MLL、MYC、BCL、BCR、ABL1、免疫球蛋白基因座、LYL1、TAL1、TAL2、LMO2、TCRα/δ、TCRβ、HOX和各種淋巴母細胞白血病中的其他基因座。
      有益的是,如果懷疑有遺傳異常,則4C技術可用作最初和僅有的篩選方法來驗證本文所解釋的異常的存在并對其作圖。
      檢測基因組重排 在本發(fā)明特別優(yōu)選的具體實施方式
      中,本文所述的方法可用于檢測基因組重排。
      當前,基因組重排(如易位斷點)非常難以檢測。例如,比較基因組雜交(CGH)微陣列能檢測幾類重排,但不能檢測易位,如果懷疑患者中有易位但不知道染色體配偶體,則可進行光譜核型分析(SKY)來找出易位配偶體并粗略估計斷點位置??墒?,解析度非常低(通常不超過~50Mb),通常需要額外的精細作圖(其是費時和昂貴的)。這通常利用熒光原位雜交(FISH)來進行,其也僅提供有限的解析度。利用FISH,斷點可以最大的解析度定位于+/-50kb的區(qū)域中。
      DNA-DNA相互作用的頻率主要是基因組位點分隔距離的函數(shù),即DNA-DNA相互作用的頻率與出現(xiàn)在相同物理DNA模板上的2個DNA基因座之間的線性距離(以千堿基對計)成反比(Dekker等.,2002)。因此,能產(chǎn)生一種或多種新物理DNA模板的易位伴隨著斷點附近的DNA-DNA相互作用的變化,而且這可通過4C技術來測量。基于易位的疾病通常由異常的DNA-DNA相互作用造成,這是因為易位是斷的染色體(DNA)臂物理連接(相互作用)的結果。
      因此,為了檢測易位。4C技術可用于鑒定那些患病和未患病受試者間不同的DNA-DNA相互作用。
      舉例來說,4C技術可用于針對基因座附近的易位篩選患者材料,所述基因座基于它們與如本文所述的給定的臨床表型的頻繁相關性來選擇。
      如果懷疑患者中有易位但不知道染色體配偶體,則可利用當前可用的方法,像光譜核型分析(SKY),來進行初始作圖。這可鑒定易位配偶體并非常粗略地評估斷點位置(通常不優(yōu)于~50Mb的解析度)。然后可用4C技術,例如利用該區(qū)域中位于每2Mb、5Mb、10Mb、20Mb(或如本文所述的其他間隔)處的‘誘餌’-序列來對斷點精細作圖,并鑒定諸如由于易位而錯誤表達的一個或多個基因。
      通常,易位鑒定的方法是通過不含4C-誘餌序列的染色體上、或該相同染色體上其他地方的相互作用頻率從低到高的突然變化來進行。
      在優(yōu)選的具體實施方式
      中,受試者的樣品是處于惡變前的狀態(tài)的。
      在優(yōu)選的具體實施方式
      中,受試者的樣品由羊膜穿刺術獲得的培養(yǎng)的或未培養(yǎng)的羊水細胞組成,用于產(chǎn)前診斷。
      在優(yōu)選的陣列設計中,單個陣列上出現(xiàn)的探針以最大解析度代表給定物種的完整基因組。因此,通過4C技術檢測易位的陣列等包含如本文所述的與給定物種(如人)的基因組中每個第一限制性內(nèi)切酶識別位點之每一側互補的探針。
      在另一個優(yōu)選的陣列設計中,單個陣列上出現(xiàn)的探針代表給定物種的完整基因組,但解析度不是最大的。因此,通過4C技術檢測易位的陣列等包含如本文所述的僅與給定物種(如人)的基因組中每個第一限制性內(nèi)切酶識別位點的一側互補的探針。
      在另一個優(yōu)選的陣列設計中,單個陣列上出現(xiàn)的探針代表給定物種的完整基因組,但解析度不是最大的。因此,通過4C技術檢測易位、缺失、倒位、重復和其他基因組重排的陣列包含如本文所述的與沿給定物種(如人)的基因組線性模板排列的每隔一個第一限制性內(nèi)切酶識別位點的一邊互補的探針。
      因此,通過4C技術檢測易位、缺失、倒位、重復和其他基因組重排的陣列包含如本文所述的其每一個代表用第一限制性內(nèi)切酶消化后得到的單一限制性片段的探針。這優(yōu)選通過在每隔二個、三個、四個、五個、六個、七個、八個、九個、十個、二十個、三十個、四十個、五十個、六十個、七十個、八十個、九十個或一百個等與相同限制性片段雜交的探針中忽略一個來實現(xiàn)。通過4C技術檢測易位、缺失、倒位、重復和其他基因組重排的陣列可包含如本文所述的沿著線性染色體模板平均分布的探針。這優(yōu)選通過忽略那些顯示出最高探針密度的基因組區(qū)中的一個或多個探針來獲得。
      在另一個優(yōu)選的陣列設計中,單個陣列上出現(xiàn)的探針代表給定物種的完整基因組,但不是以最大解析度。因此,通過4C技術檢測易位、缺失、倒位、重復和其他基因組重排的陣列包含如本文所述的與沿著給定物種(如人)基因組線性模板按序排列的每隔三個、四個、五個、六個、七個、八個、九個、十個、二十個、三十個、四十個、五十個、六十個、七十個、八十個、九十個或一百個等第一限制性內(nèi)切酶識別位點中的一個的一邊互補的探針。通過4C技術檢測易位、缺失、倒位、重復和其他基因組重排的陣列可包含如本文所述的代表完整的基因組的探針,每100千堿基一個探針。通過4C技術檢測易位、缺失、倒位、重復和其他基因組重排的陣列可包含如本文所述的代表基因組中可由獨特的探針序列代表的每個單個第一限制性內(nèi)切酶識別位點的探針。
      在另一種優(yōu)選的陣列設計中,如本文所述的在單一陣列上的探針代表已知涉及易位、缺失、倒位、重復和其他基因組重排的所0有基因座周圍的給定大小——如約50kb、100kb、200kb、300kb、400kb、500kb、1Mb、2Mb、3Mb、4Mb、5Mb、6Mb、7Mb、8Mb、9Mb或10Mb(如約50kb-10Mb)——的基因組區(qū)域。
      在另一種優(yōu)選的陣列設計中,如本文所述的在單一陣列上的探針代表已知涉及易位、缺失、倒位、重復和其他基因組重排的所選基因座周圍的給定大小——如約50kb、100kb、200kb、300kb、400kb、500kb、1Mb、2Mb、3Mb、4Mb、5Mb、6Mb、7Mb、8Mb、9Mb或10Mb(如約50kb-10Mb)——的基因組區(qū)域。選擇可以按教導的標準來進行,例如它們可僅代表給定的疾病類型中包含的基因座。
      在另一種優(yōu)選的陣列設計中,如本文所述的在單一陣列上的探針代表(部分)染色體或多個染色體的100kb、200kb、300kb、400kb、500kb、600kb、700kb、800kb、900kb、1Mb、2Mb、3Mb、4Mb、5Mb、6Mb、7Mb、8Mb、9Mb、10Mb、20Mb、30Mb、40Mb、50Mb、60Mb、70Mb、80Mb、90Mb,或100Mb(如100kb-10Mb)感興趣的基因組區(qū)域,其中每個探針被代表多次(如10、100、1000次)從而可以定量測量每個探針序列處的雜交信號強度。
      在優(yōu)選的實驗性設計中,4C序列(誘餌)處于距離實際重排序列(即易位情況下的斷點)約0kb、10kb、20kb、30kb、40kb、50kb、100kb、200kb、300kb、400kb、500kb、1Mb、2Mb、3Mb、4Mb、5Mb、6Mb、7Mb、8Mb、9Mb、10Mb、11Mb、12Mb、13Mb、14Mb或15Mb(如約0-15Mb)或更遠之內(nèi)。
      在優(yōu)選的雜交中,用來自患病和非患病的受試者的1種序列(4C誘餌)得到的2種區(qū)別標記的4C模板與相同的陣列同時雜交。DNA-DNA相互作用中的差異能檢測順式(與4C-誘餌在相同染色體上)和反式(在易位配偶體上)的斷點。
      在優(yōu)選的雜交中,用來自患病和非患病的受試者的1種序列(4C誘餌)得到的多種區(qū)別標記的4C模板與相同的陣列同時雜交。DNA-DNA相互作用中的差異能檢測順式(與4C-誘餌在相同染色體上)和反式(在易位配偶體上)的斷點。
      有益的是,可用微陣列上的多顏色分析代替雙顏色分析來使超過2個樣品同時與單個陣列雜交。因此,可在4C技術中使用多顏色雜交。
      在優(yōu)選的雜交中,用來自患病的受試者的1種序列(4C誘餌)得到的多種區(qū)別標記的4C模板和來自非患病的受試者的1種區(qū)別標記的4C模板與相同的陣列同時雜交。DNA-DNA相互作用中的差異能檢測順式(與4C-誘餌在相同染色體上)和反式(在易位配偶體上)的斷點。
      在另一種優(yōu)選的雜交中,用分別代表另一種可能的易位配偶體的2種不同序列(4C-誘餌)獲得的、來自同一非患病的受試者的2種區(qū)別標記的4C模板能與相同的陣列同時雜交。在與帶有目的序列(4C-誘餌)的染色體無關的染色體線性模板上觀察到的強雜交信號束將鑒定出易位配偶體染色體和在易位配偶體上的斷點。
      在另一種優(yōu)選的雜交中,用分別代表另一種可能的易位配偶體的多種不同序列(4C-誘餌)獲得的、來自相同的非患病的受試者的多種區(qū)別標記的4C模板能與相同的陣列同時雜交。在與帶有目的序列(4C-誘餌)的染色體無關的染色體線性模板上觀察到的強雜交信號束將鑒定出易位配偶體染色體和其針對目的序列的斷點。
      用于通過4C技術檢測易位、缺失、倒位、重復和其他基因組重排的材料可通過交聯(lián)(并如所述的,進一步處理)來自患病和/或非患病的受試者的活細胞和/或死細胞和/或核溶解產(chǎn)物和/或分離(如本文所述)的染色質等來獲得。
      檢測倒位 倒位(如平衡的倒位)不能通過諸如比較基因組雜交技術的方法來檢測,但能通過4C技術來檢測,尤其在(平衡的)倒位接近4C序列(誘餌)(如多至約1-15Mb或更多)的時候能檢測。
      (平衡的)倒位的檢測基于鑒定那些在患病和非患病的受試者之間有差異的DNA-DNA相互作用。倒位將改變重排區(qū)域所有(但除外位于最中心的)序列的物理DNA模板上相對于當作4C序列(誘餌)的相同染色體上的附近序列的相對位置(以千堿基計)。由于DNA-DNA相互作用頻率與基因組位點分隔距離成反比,因此患病的受試者與非患病的受試者相比將給出對于所有位于重排基因組區(qū)域中的探針呈倒轉模式的雜交強度。因此,4C技術能鑒定(平衡的)倒位的位置和大小。
      根據(jù)本發(fā)明的這一方面,優(yōu)選的專門陣列設計包括在單一陣列上的探針,其代表懷疑有倒位和其他重排的基因座周圍給定大小——如約50kb、100kb、200kb、300kb、400kb、500kb、1Mb、2Mb、3Mb、4Mb、5Mb、6Mb、6Mb、7Mb、8Mb、9Mb或10Mb)(如50kb-10Mb)——的基因組區(qū)域。
      在另一種優(yōu)選的專門陣列設計中,在單一陣列上的探針代表懷疑有倒位和其他重排的基因座周圍的給定大小(50kb、100kb、200kb、300kb、400kb、500kb、1Mb、2Mb等)的基因組區(qū)域。為了可靠地定量分析信號強度,存在于陣列上的探針量通常大大過量于與陣列雜交的同類片段的量。所以,可能必須使每種探針在陣列上出現(xiàn)多次(如10、20、50、100、1000次等)。另外,可能必須滴定測量與陣列雜交的模板量。
      檢測缺失 缺失的檢測基于鑒定那些在患病和非患病的受試者之間有差異的DNA-DNA相互作用。缺失將造成與位于缺失區(qū)域附近(如約1、2、3、4、5、6、7、8、9、10、11、12、13、14或15Mb或更多)的4C序列(誘餌)的DNA相互作用的缺少。如果缺失存在于兩個等位基因上(純合),則可造成完全缺少針對位于重排區(qū)域中所有探針的雜交信號,或者如果缺失存在于僅一個等位基因上(雜合),可造成與非患病的受試者相比患病的受試者信號強度減少。缺失將物理DNA模板上更遠處的序列帶到與要分析的4C序列(誘餌)更接近,其將導致針對直接位于缺失區(qū)較遠一邊的探針更強的雜交信號。
      檢測一個或多個重復 重復的檢測通?;阼b定那些在患病和非患病的受試者之間有差異的DNA-DNA相互作用。與來自對照的非患病的受試者的信號相比,在重復區(qū)域中的探針將顯示出與位于重排區(qū)域附近(如約1、2、3、4、5、6、7、8、9、10、11、12、13、14或15Mb或更多)的4C序列(誘餌)的雜交信號增強。重復區(qū)較遠一邊的探針更遠離于4C序列,因此將比來自對照的非患病的受試者的信號顯示出降低的雜交信號。
      受試者樣品與對照相比DNA-DNA相互作用頻率的增加或降低優(yōu)選指示重復或插入。
      受試者樣品與對照相比DNA-DNA相互作用頻率的增加和/或針對更遠距離區(qū)域的DNA-DNA相互作用頻率的降低優(yōu)選指示重復或插入。
      產(chǎn)前診斷 有益的是,4C技術也可用于產(chǎn)前診斷。
      利用各種現(xiàn)有已知的方法可從胎兒中獲得核酸。舉例來說,可用羊膜穿刺來獲得羊水,由其提取胎兒細胞懸浮液并培養(yǎng)幾天(Mercier&Bresson(1995)Ann.Gnt.,38,151-157)。然后從細胞中提取核酸。收集絨毛膜絨毛有可能省卻培養(yǎng)步驟并避免收集羊水。這些技術可更早應用(對于收集絨毛膜絨毛,在懷孕的多至7周時間;而對于羊膜穿刺,在13-14周),但微微增加流產(chǎn)的風險。
      直接在臍帶上收集胎兒血也可用于獲得核酸,但這通常需要在該技術上專業(yè)化的臨床醫(yī)生團隊(Donner等.(1996)Fetal Diagn.Ther.,10,192-199)。
      有益的是,遺傳異常(如基因組或染色體異常)——如染色體和核酸中的重排、易位、倒位、插入、缺失和其他突變——可在該階段被檢測出。
      優(yōu)選可檢測遺傳異常(如基因組或染色體異常)——如染色體21、18、13、X或Y中的重排、易位、倒位、插入、缺失和其他突變以及喪失或獲得部分或完整染色體21、18、13、X或Y,這是因為這些染色體中發(fā)生了大多數(shù)胎兒異常。
      確定基因組整合位點 當多拷貝被插入在基因組不同位置時,4C技術也能確定病毒和轉基因等的基因組整合位點(如圖4所述)。
      確定獲得某種易位的傾向 有益的是,4C技術也可用于非患病的受試者來測量頻繁涉及遺傳異常的基因座的基因組環(huán)境。以這種方式,可能確定受試者獲得某種遺傳異常的傾向。
      因此,除了本文所述的的醫(yī)學應用,本發(fā)明可用于診斷。
      受試者 術語“受試者”包括哺乳動物——如動物和人。
      試劑 試劑可以是有機化合物或其他化學物質。試劑可以是化合物,其由任何合適的、無論是天然的還是人工的來源獲得或產(chǎn)生。試劑可以是氨基酸分子、多肽、或其化學衍生物、或其組合物。試劑甚至可以是多核苷酸分子,其可以是正義或反義分子、或抗體,例如,多克隆抗體、單克隆抗體或單克隆人源化抗體。
      已經(jīng)開發(fā)出了各種策略來產(chǎn)生帶有人特征的單克隆抗體,其不需要產(chǎn)生抗體的人細胞系。例如,有用的小鼠單克隆抗體通過連接嚙齒動物可變區(qū)和人恒定區(qū)來進行“人源化”(Winter,G.和Milstein,C.(1991)Nature 349,293-299)。這降低了抗體的人抗小鼠免疫原性,但殘余的免疫原性仍由外來V區(qū)框架而保留。而且,抗原結合特異性主要是鼠供體的。CDR移植和框架操作(EP 0239400)將抗體操作改進并優(yōu)化到可能產(chǎn)生可在人中進行治療應用的人源化鼠抗體的程度。人源化抗體可利用現(xiàn)有公知的方法獲得(例如US-A-239400中所述的)。
      試劑可以通過可以是水解類型的雙功能接頭的接頭與實體(如有機分子)相連。
      可以設計或由化合物庫中獲取實體,所述化合物庫包括肽、以及其他化合物,如小的有機分子。
      舉例來說,實體可以是天然物質、生物大分子、或由諸如細菌、真菌、或動物(尤其是哺乳動物)細胞或組織中制備的提取物、有機或無機分子、合成劑、半合成劑、結構性或功能性模擬物、肽、肽模擬物、從完整蛋白質中切割的肽、或合成(如,舉例來說,利用肽合成儀或通過重組技術或其組合)的肽、重組劑、抗體、天然或非天然劑、融合蛋白質或其等價物和突變體、衍生物或其組合。
      實體通常會是有機化合物。對于一些情況來說,有機化合物將包含兩種或多種烴基。在本文中,術語“烴基”指基團,其至少包含C和H并任選可包含一種或多種其他合適的取代基。這些取代基的例子可包括鹵素、烷氧基、硝基、烷基、環(huán)基團等。除了取代基可能是環(huán)基團之外,取代基的組合可形成環(huán)基團。如果烴基包含超過一個C,則那些碳不必互相連接。例如,至少可通過合適的元素或基團連接2個碳。因此,烴基可包含雜原子。合適的雜原子對于所屬領域技術人員來說是顯而易見的,例如包括硫、氮和氧。對于一些應用來說,實體優(yōu)選包含至少一個環(huán)基團。環(huán)基團可以是多環(huán)基團,如非稠合的多環(huán)基團。對于一些應用來說,實體至少包含與另一個烴基相連的所述環(huán)基團中的一個。
      實體可包含鹵素基團——如氟、氯、溴或碘基。
      實體可包含一種或多種烷基、烷氧基、烯基、亞烷基和亞鏈烯基——其可以是直鏈或支鏈的。
      前藥 所屬領域技術人員會理解,實體可衍生自前藥。前藥的例子包括某些保護基團,其本身并不具有藥物活性,但在某些情況下可以(如口服或非腸道)給藥并有機會在身體中代謝形成有藥物活性的實體。
      合適的前藥的可包括但不限于,亞德里亞霉素、絲裂霉素、酚芥、甲氨蝶呤、抗葉酸、氯霉素、喜樹堿、5-氟尿嘧啶、氰化物、奎寧、雙嘧達莫和紅豆杉醇。
      可進一步理解的是,某些已知是“前體部分”的部分,例如H.Bundgaard的“Design of Prodrugs”,Elsevier,1985所述的,可置于試劑合適的官能性上。這些前藥也包括在本發(fā)明的范圍內(nèi)。
      試劑可以是藥學上可接受的鹽(如酸加成鹽或堿式鹽)或其溶劑化物的形式,包括其水合物。對于合適的鹽的綜述,可參見Berge等,J.Pharm.Sci.,1977,66,1-19。
      試劑能顯示出其他治療性質。
      試劑可與一種或多種其他藥物活性劑一起使用。
      如果給藥活性試劑的組合,則可同時、分開或順序給藥活性試劑的組合。
      立體和幾何異構體 實體可以立體異構體和/或幾何異構體的形式存在——如實體可擁有一個或多個不對稱和/或幾何中心,由此可以兩種或多種立體異構和/或幾何異構形式存在。本發(fā)明考量了所有那些實體的各立體異構體和幾何異構體以及其混合物的應用。
      藥物鹽 試劑可以藥學上可接受的鹽的形式給藥。
      藥學上可接受的鹽對于所屬領域技術人員來說是公知的,例如包括Berge等的J.Pharm.Sci.,66,1-19(1977)中所述的那些。合適的酸加成鹽是由能形成無毒鹽的酸形成的,包括鹽酸鹽、氫溴酸鹽、氫碘酸鹽、硝酸鹽、硫酸鹽、重硫酸鹽、磷酸鹽、磷酸氫鹽、乙酸鹽、三氟醋酸鹽、葡萄糖酸鹽、乳酸鹽、水楊酸鹽、檸檬酸鹽、酒石酸鹽、抗壞血酸炎、琥珀酸鹽、馬來酸鹽、延胡索酸鹽、葡萄糖酸鹽、甲酸鹽、安息香酸鹽、甲基磺酸鹽、乙基磺酸鹽、苯磺酸鹽和對甲苯磺酸鹽。
      當存在一個或多個酸性部分時,則合適的藥學上可接受的堿加成鹽可由能形成無毒鹽的堿形成,包括鋁、鈣、鋰、鎂、鉀、鈉、鋅、和諸如二乙醇胺的藥物活性胺的鹽。
      試劑的藥學上可接受的鹽可通過將試劑溶液和所需的酸或鹽在合適的條件下混合在一起來方便地制備。鹽可從溶液中沉淀出來并過濾收集,或可通過蒸發(fā)溶劑來收獲。
      試劑可以多晶型而存在。
      試劑可包含一個或多個不對稱碳原子,因此以兩種或更多種立體異構形式存在。當試劑包含烯基或亞鏈烯基時,也可發(fā)生順(E)和反(Z)異構。本發(fā)明包括試劑的各立體異構體,并在合適時包括其各互變異構形式、以及其混合物。
      分離非對映異構體或順和反異構體可通過常規(guī)技術來獲得,如通過試劑或合適的鹽或其衍生物的立體異構混合物的分級結晶、色譜、或H.P.L.C.來獲得。試劑的各對映體也可由相應光學純中間體、或通過解析(如利用合適的手性支持物通過相應消旋體的H.P.L.C.來進行),或通過分級結晶由將相應消旋體與合適的光學活性酸或堿在合適的條件下反應而形成的非對映異構體鹽來進行制備。
      試劑也可包括試劑或其藥學上可接受的鹽的所有合適的同位素變體。試劑或其藥學上可接受的鹽的同位素變體被定義為其中至少一個原子被有相同原子數(shù)而其原子量與通常天然發(fā)現(xiàn)的原子量不同的原子代替的分子。可整合入試劑和其藥學上可接受的鹽的同位素的例子分別包括氫、碳、氮、氧、磷、硫、氟和氯的同位素,如2H、3H、13C、14C、15N、17O、18O、31P、32P、35S、18F和36Cl。某些試劑和其藥學上可接受的鹽的同位素變體,例如整合諸如3H或14C的放射性同位素的那些,可用于藥物和/或基質組織分布研究。含氚的(即,3H)和碳-14(即,14C)同位素是尤其優(yōu)選的,這是因為它們易于制備和檢測。另外,用諸如氘(即,2H)的同位素替代可由于更大的代謝穩(wěn)定性而獲得某些治療優(yōu)勢,例如,增加體內(nèi)半衰期或降低劑量要求,因此在一些情況下是優(yōu)選的。本發(fā)明的試劑和其藥學上可接受的鹽的同位素變體一般可通過常規(guī)方法利用合適試劑的合適的同位素變體來制備。
      藥物活性鹽 試劑可以藥學上可接受的鹽給藥。通常,藥學上可接受的鹽可利用所需的酸或堿在合適時方便地制備。鹽可從溶液中沉淀出并通過過濾來收集,或可通過蒸發(fā)溶劑來收獲。
      化學合成法 試劑可通過化學合成技術制備。
      所屬領域技術人員清楚的是,在合成本發(fā)明的化合物時,敏感的功能性基團需要被保護和脫保護。這可通過常規(guī)技術來獲得,例如T W Greene和PG M Wuts的“Protective Groups in Organic Synthesis”,John Wiley和Sons Inc.(1991)、和P.J.Kocienski的“Protecting Groups”,Georg Thieme Verlag(1994)所述的。
      在一些反應中,可能使存在的任何立體中心在某些條件下被消旋,例如,如果將堿用于與具有包含堿敏感基團的光學中心的底物反應。這在諸如鳥苷酸化步驟中是可能的。如通過選擇反應順序、條件、試劑、保護/脫保護方案等現(xiàn)有公知的方法,應該能克服潛在的問題。
      化合物和鹽可通過常規(guī)方法來分離和純化。
      分離非對映異構體可通過常規(guī)技術來獲得,如通過式(I)化合物或合適的鹽或其衍生物的立體異構混合物的分級結晶、色譜、或H.P.L.C.來獲得。式(I)化合物的各對映體也可由相應的光學純中間體制備,或通過解析,諸如利用合適的手性支持物對相應消旋體進行H.P.L.C.,或通過對由相應消旋體與合適的光學活性酸或堿反應而形成的非對映異構體鹽進行分級結晶來進行。
      試劑可利用化學方法合成完整或部分的試劑來產(chǎn)生。例如,如果試劑含肽,則肽可通過固相技術合成,由樹脂上裂解下來,并用制備級高效液相色譜來純化(如,Creighton(1983)Proteins Structures and MolecularPrinciples,WH Freeman and Co,New York NY)。合成肽的組成可通過氨基酸分析或測序來確認(如,Edman降解過程;Creighton,見上)。
      肽抑制劑(或其變體、同源物、衍生物、片段或模擬物)的合成可利用各種固相技術來進行(Roberge JY等(1995)Science 269202-204),并可進行自動合成,例如,可根據(jù)廠商提供的說明而使用ABI 43 1 A肽合成儀(PerkinElmer)。另外,含試劑的氨基酸序列可在直接合成期間被改變,和/或用化學方法而將之與來自其它亞基、或其任何部分的序列組合起來以產(chǎn)生變體試劑。
      化學衍生物 本文所用的術語“衍生物”或“衍生的”包括試劑的化學修飾。這些化學修飾的例子有通過鹵素基團、烷基、酰基或氨基來替換氫。
      化學修飾 試劑可以是被修飾的試劑——如,但不局限于,化學修飾的試劑。
      試劑的化學修飾可增強或減少氫鍵相互作用、電荷相互作用、疏水相互作用、范德華力相互作用或偶極相互作用。
      在一個方面,試劑可用作模型(例如,模板)來開發(fā)其它化合物。
      藥物組合物 在另一方面,提供了藥物組合物,其包含由本文所述的測試方法鑒定的試劑,并混合有藥學上可接受的載體、稀釋劑、賦形劑或佐劑和/或其組合。
      在另一方面,提供了疫苗組合物,其包含試劑。
      在另一方面,提供了制備藥物組合物的方法,其包括將由測試鑒定的試劑與藥學上可接受的稀釋劑、稀釋劑、賦形劑或佐劑和/或其組合混合。
      在另一方面,提供了預防和/或治療疾病的方法,其包括向受試者給藥試劑或藥物組合物或疫苗。
      藥物組合物可以人和獸藥的形式用于人或動物,其通常將包含一種或多種藥學上可接受的稀釋劑、載體、或賦形劑。可接受的用于治療的載體或稀釋劑在制藥領域是現(xiàn)有已知的,例如在Remington′s PharmaceuticalSciences,Mack Publishing Co.(A.R.Gennaro編,1985)中有描述。藥物載體、賦形劑或稀釋劑的選擇可根據(jù)所預想的給藥途徑和標準藥學實踐來選擇。藥物組合物可包含任何合適的一種或多種粘合劑、一種或多種潤滑劑、一種或多種懸浮劑、一種或多種包被劑、一種或多種溶劑作為載體、賦形劑或稀釋劑,或在載體、賦形劑或稀釋劑之外添加任何合適的粘合劑、潤滑劑、懸浮劑、包被劑、溶劑。
      防腐劑、穩(wěn)定劑、染料甚至是調味劑都可在藥物組合物中被提供。防腐劑的例子包括苯甲酸鈉、山梨酸和對-羥基苯甲酸的酯。也可用抗氧化劑和懸浮劑。
      根據(jù)不同的遞送系統(tǒng)可有不同的組合/配方需求。舉例來說,本發(fā)明的藥物組合物可配制成利用微型泵或通過粘膜途徑來給藥,例如配制成鼻部噴劑或吸入型氣霧劑或可攝入溶液,或通過非腸道途徑,其中組合物被配置成注射形式來遞送,例如通過靜脈內(nèi)、肌肉內(nèi)或皮下途徑來進行??蛇x的是,可設計劑型從而通過若干途徑來給藥。
      如果試劑通過胃腸粘膜來粘膜給藥,則它在通過胃腸道傳送期間應當能保持穩(wěn)定;例如,它應當抗蛋白水解酶降解,在酸性pH下穩(wěn)定并抗膽汁的去污劑效應。
      合適時,藥物組合物可通過吸入、以栓劑或陰道栓劑的形式、以洗液、溶液、面霜、膏劑或隔離劑的形式局部、通過應用皮膚貼劑、以含諸如淀粉或乳糖的賦形劑的片劑形式口服、或以膠囊或丸劑單獨或與賦形劑混合、或以含調味或著色劑的酏劑、溶液或懸浮液給藥,或者可非腸道注射藥物組合物,例如靜脈內(nèi)、肌肉內(nèi)或皮下注射。對于非腸道給藥,組合物最好以無菌水溶液的形式使用,其可含其它物質,例如足夠的鹽或單糖從而使溶液與血液等滲。對于口腔或舌下給藥,組合物可以片劑或錠劑的形式給藥,其能以常規(guī)方式配制。
      試劑可與環(huán)糊精組合使用。已知環(huán)糊精能與藥物分子形成包合和非包合復合物。配制藥物-環(huán)糊精復合物可改變藥物分子的溶解性、分解率、生物利用度和/或穩(wěn)定性。藥物-環(huán)糊精復合物一般用于大多數(shù)制劑形式和給藥途徑。作為與藥物直接復合的替代形式,環(huán)糊精可用作輔助添加劑,如用作載體、稀釋劑或增溶劑。α-、β-和γ-環(huán)糊精是最常用的,合適的例子在WO-A-91/11172、WO-A-94/02518和WO-A-98/55148中有描述。
      如果試劑是蛋白質,則所述蛋白質可在要治療的受試者中原位制備。在這方面,編碼所述蛋白質的核苷酸序列可通過使用非病毒技術(如通過使用脂質體)和/或病毒技術(如通過使用反轉錄病毒)來遞送,從而使所述蛋白質由所述核苷酸序列表達出來。
      本發(fā)明的藥物組合物也可與常規(guī)治療組合使用。
      給藥 術語“給藥”包括通過病毒或非病毒技術來遞送。病毒遞送機制包括而不限于腺病毒載體、腺相關病毒(AAV)載體、皰疹病毒載體、反轉錄病毒載體、慢病毒載體、和桿狀病毒載體。非病毒遞送機制包括脂質介導的轉染、脂質體、免疫脂質體、轉染脂(lipofectin)、陽離子表面兩親分子(CFA)和其組合。
      成份可單獨給藥,但一般作為藥物組合物來給藥(如當成份與根據(jù)所預想的給藥途徑和標準藥學實踐而選擇的合適的藥物賦形劑、稀釋劑或載體混合在一起的時候)。
      例如,成份可以片劑、膠囊、丸劑、酏劑、溶液或懸浮液的形式給藥,其可含調味或著色劑,用于即時、延時、改變、持續(xù)、沖擊或控制釋放應用。
      如果藥物是片劑,則片劑可包含賦形劑(如微晶纖維素、乳糖、檸檬酸鈉、碳酸鈣、磷酸氫二鈣和甘氨酸)、分解劑(如淀粉(優(yōu)選玉米、土豆或木薯淀粉)、淀粉乙醇酸鈉、交聯(lián)羥甲纖維素鈉和某些復合硅酸鹽)、和顆粒粘合劑(如聚乙烯吡咯烷酮、羥基丙甲基纖維素(HPMC)、羥基丙基纖維素(HPC)、蔗糖、明膠和阿拉伯樹膠。另外,可包括潤滑劑,如硬脂酸鎂、硬脂酸、甘油山崳酸酯和滑石。
      相似類型的固體組合物也可用作明膠膠囊中的填充劑。這方面優(yōu)選的賦形劑包括乳糖、淀粉、纖維素、奶糖或高分子量聚乙二醇。對于水溶性懸浮劑和/或酏劑,試劑可與各種甜味或調味劑、著色物質或染料、與乳化和/或懸浮劑并與稀釋劑(如水、乙醇、丙二醇和甘油、和其組合)組合在一起。
      給藥(遞送)的途徑可包括但不限于,口服(如作為片劑、膠囊、或作為可吞咽溶液)、局部、粘膜(如作為鼻部噴劑或吸入型氣霧劑)、經(jīng)鼻、非腸道(如通過可注射形式)、胃腸道、脊柱內(nèi)、腹膜內(nèi)、肌肉內(nèi)、靜脈內(nèi)、子宮內(nèi)、眼內(nèi)、皮內(nèi)、顱內(nèi)、氣管內(nèi)、陰道內(nèi)、腦室內(nèi)、腦內(nèi)、皮下、眼部(包括玻璃體內(nèi)或眼內(nèi)(intracameral))、透皮、直腸、口腔、陰道、硬腦膜外、舌下中的一種或多種。
      劑量水平 通常,醫(yī)生會確定最適于各受試者的實際劑量。對于任何特定患者的特定劑量水平和給藥頻率可以變化并將取決于各種因素,包括所用的特定化合物的活性、代謝穩(wěn)定性和該化合物作用時間的長短、年齡、體重、綜合健康情況、性別、飲食、給藥模式和時間、排泄率、藥物組合、特定病況的嚴重程度、和個體經(jīng)受的療法。
      配方 一種或多種成份可配制成藥物組合物,如通過利用現(xiàn)有已知的技術與一種或多種合適的載體、稀釋劑或賦形劑混合來進行。
      疾病 本發(fā)明的方面可用于治療和/或預防和/或診斷和/或預測疾病——如列于WO-A-98/09985中的那些。
      為了便于參考,現(xiàn)在提供該列表的一部分巨噬細胞抑制和/或T細胞抑制活性以及由此產(chǎn)生的抗炎癥活性;抗免疫活性,即抗細胞和/或體液免疫應答的抑制效應,包括不與炎癥相關的應答;與病毒和/或其他細胞內(nèi)病原體相關的疾??;抑制巨噬細胞和T細胞與細胞外基質成份和纖連蛋白粘附的能力,以及上調T細胞中fas受體表達;抑制不需要的免疫反應和炎癥,包括關節(jié)炎、包括類風濕性關節(jié)炎、與超敏性相關的炎癥、過敏反應、哮喘、全身性紅斑狼瘡、膠原病和其他自身免疫病、與動脈硬化相關的炎癥、動脈硬化、動脈粥樣硬化心臟病、灌注損傷、心搏動停止、心肌梗塞、血管炎癥疾病、呼吸窘迫綜合征或其他心肺疾病、與胃潰瘍相關的炎癥、潰瘍性結腸炎和其他胃腸道疾病、肝纖維化、肝硬化或其他肝病、甲狀腺炎或其他腺體疾病、腎小球性腎炎或其他腎和泌尿疾病、耳炎或其他耳鼻喉病、皮炎或其他皮膚病、牙周病或其他牙齒疾病、睪丸炎或附睪睪丸炎、不孕癥、睪丸損傷或其他免疫相關的睪丸疾病、胎盤機能障礙、胎盤機能不全、習慣性流產(chǎn)、子癇、子癇前期和其他免疫和/或炎癥相關的婦科病、后眼色素層炎、中間眼色素層炎、前眼色素層炎、結膜炎、脈絡膜視網(wǎng)膜炎、眼色素層視網(wǎng)膜炎、視神經(jīng)炎、眼內(nèi)炎癥,如視網(wǎng)膜炎或囊狀黃斑水腫、交感性眼炎、鞏膜炎、色素性視網(wǎng)膜炎、退化性眼底疾病(degenerativefondus disease)的免疫和炎癥成份、眼損傷的炎癥成份、感染造成的眼炎、增殖性透明體視網(wǎng)膜病、急性缺血性眼神經(jīng)病、諸如在青光眼濾過手術后的過度瘢痕、抗眼移植物的免疫和/或炎癥反應和其他免疫和炎癥相關的眼病、與自身免疫病或病況或病癥相關的炎癥(其中無論在中樞神經(jīng)系統(tǒng)(CNS)還是在任何其它器官中抑制免疫和/或炎癥會是有益的)、帕金森氏癥、來自帕金森氏癥治療的并發(fā)癥和/或副作用、AIDS相關性癡呆復合HIV相關性腦病、Devic氏癥、Sydenham舞蹈病、阿爾茨海默病和其他CNS退行性疾病、病況或病癥、中風的炎癥成份、脊髓灰質炎后綜合征、精神病的免疫和炎癥成份、脊髓炎、腦炎、亞急性硬化性全腦炎、腦脊髓炎、急性神經(jīng)病、亞急性神經(jīng)病、慢性神經(jīng)病、Guillaim-Barre綜合征、Sydenham舞蹈病、重癥肌無力、腦假瘤、唐氏綜合征、亨廷頓氏癥、肌萎縮性側索硬化、CNS壓迫或CNS外傷或CNS感染的炎癥成份、肌萎縮和肌營養(yǎng)不良的炎癥成份、和中樞和外周神經(jīng)系統(tǒng)的免疫和炎癥相關疾病、病況或病癥、外傷后的炎癥、敗血病性休克、傳染病、外科手術的炎癥并發(fā)癥或副作用、骨髓移植或其他移植的并發(fā)癥和/或副作用、例如由于病毒載體感染而造成的基因治療的炎癥和/或免疫并發(fā)癥和副作用、或與AIDS相關的炎癥,從而減弱或抑制體液和/或細胞免疫應答,通過降低單核細胞或淋巴細胞的量來治療或改善單核細胞或白細胞增殖性疾病(如白血病),用于在移植天然或人造細胞、組織和器官(如角膜、骨髓、器官、晶狀體、起搏器、天然或人工的皮膚組織)的情況下預防和/或治療移植排斥。特定癌相關性病癥包括但不局限于實體腫瘤;血液產(chǎn)生的腫瘤,如白血病;腫瘤轉移;良性腫瘤,例如血管瘤、聽神經(jīng)瘤、神經(jīng)纖維瘤、沙眼、和生膿性肉芽腫;類風濕性關節(jié)炎;牛皮癬;眼血管生成病,例如糖尿病性視網(wǎng)膜病、早產(chǎn)兒視網(wǎng)膜病變、黃斑變性、角膜移植排斥、新生血管性青光眼、晶狀體后纖維組織生成、潮紅;Osler-Webber綜合征;心肌血管生成;斑塊新生血管化(plaque neovascularization);毛細血管擴張;血友病關節(jié);血管纖維瘤;傷口肉芽形成;冠狀側支;腦側支;動靜脈畸形;缺血性肢體血管形成;新生血管性親光眼;晶狀體后纖維形成;糖尿病性新生血管化;幽門螺旋桿菌相關的疾病、骨折、血管生成、造血作用、排卵、月經(jīng)和胎盤形成。
      疾病優(yōu)選是癌,如急性淋巴細胞白血病(ALL)、急性髓細胞樣白血病(AML)、腎上腺皮質癌、肛門癌、膀胱癌、血癌、骨癌、腦腫瘤、乳腺癌、女性生殖系統(tǒng)癌、男性生殖系統(tǒng)癌、中樞神經(jīng)系統(tǒng)淋巴癌、子宮頸癌、兒童橫紋肌肉瘤、兒童肉瘤、慢性淋巴細胞白血病(CLL)、慢性髓細胞樣白血病(CML)、結腸和直腸癌、結腸癌、子宮內(nèi)膜癌、子宮內(nèi)膜肉瘤、食管癌、眼癌、膽囊癌、胃癌、胃腸道癌、毛細胞白血病、頭和頸癌、肝細胞癌、霍奇金氏病、咽下部癌、Kaposi氏肉瘤、腎癌、喉癌、白血病、肝癌、肺癌、惡性纖維性組織細胞瘤、惡性胸腺瘤、黑素瘤、間皮瘤、多發(fā)性骨髓瘤、骨髓瘤、鼻腔和鼻旁竇癌、鼻咽癌、神經(jīng)系統(tǒng)癌、成神經(jīng)細胞瘤、非霍奇金氏淋巴瘤、口腔癌、口咽癌、骨肉瘤、卵巢癌、胰腺癌、副甲狀腺癌、陰莖癌、咽癌、垂體腫瘤、漿細胞瘤、原發(fā)性CNS淋巴瘤、前列腺癌、直腸癌、呼吸系統(tǒng)、成視網(wǎng)膜細胞瘤、唾液腺癌、皮膚癌、小腸癌、軟組織肉瘤、胃癌、胃癌、睪丸癌、甲狀腺癌、泌尿系統(tǒng)癌、子宮肉瘤、陰道癌、血管系統(tǒng)、瓦爾登斯特倫巨球蛋白血癥和Wilms氏腫瘤。
      試劑盒 用于本發(fā)明方法中的材料是理想地適用于制備試劑盒的。
      該試劑盒可包括容器,各自帶有用于本文所述的方法中的各種試劑(通常以濃縮的形式)中的一種或多種,例如包括,第一限制性內(nèi)切酶、第二限制性內(nèi)切酶、交聯(lián)劑、用于連接的酶(如連接酶)和解交聯(lián)的試劑(如蛋白酶K)。
      寡核苷酸也可在容器中被提供,其可以是任意形式的,如凍干或溶液(如,蒸餾水或緩沖液)等。
      在本發(fā)明優(yōu)選的方面中,提供了試劑盒,其包括如本文所述的探針組、陣列并任選有一種或多種標記。
      通常還包括一套說明書。
      應用 有益的是,為了獲得關于核苷酸序列(如體外或體內(nèi)的基因組基因座)空間組織信息而使用本發(fā)明。
      舉例來說,4C技術可用于研究一個或多個基因座的三維組織。該技術尤其可用于研究一種或多種轉錄因子在一個或多個基因座三維組織中的作用。
      進一步舉例來說,4C技術可用于研究反式作用因子和順式調節(jié)DNA元件的作用。
      進一步舉例來說,4C技術可用于研究體外或體內(nèi)的長程基因調節(jié)。
      進一步舉例來說,4C技術可用于研究染色體內(nèi)鄰近區(qū)域和相互作用。
      進一步舉例來說,4C技術可用于研究染色體間鄰近區(qū)域和相互作用。
      進一步舉例來說,4C技術可用于鑒定與啟動子、增強子、沉默子、隔離子、基因座控制區(qū)、復制起始點、MAR、SAR、著絲粒、端粒或任何其它在調節(jié)網(wǎng)絡中目的序列作用的核苷酸序列。
      進一步舉例來說,4C技術可用于鑒定其中突變和/或缺失碰巧影響遠距離調節(jié)元件并因此對它們作圖不能提供這樣的信息的病例中造成表型(疾病)的基因。
      進一步舉例來說,4C技術可用于最終重建基因座、大基因組區(qū)域或甚至完整染色體的空間構象。
      進一步舉例來說,4C技術可用于確定在核空間中將某些染色體保持在一起的潛在錨定序列。
      進一步舉例來說,4C技術可用于最終以高解析度重建染色體相互間的位置。
      進一步舉例來說,4C技術可用于診斷(如產(chǎn)前診斷)以檢測或鑒定基因組重排和/或異常,如易位、缺失、倒位、重復。
      一般性的重組DNA方法技術 除非另外指名,本發(fā)明使用常規(guī)化學、分子生物學、微生物學、重組DNA和免疫學技術,其在所屬領域普通技術人員的能力范圍內(nèi)。這些技術在文獻中有解釋。例如參見,J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,Molecular CloningA Laboratory Manual,第二版,Books 1-3,Cold SpringHarbor Laboratory Press;Ausubel,F(xiàn).M.等.(1995和定期補錄;CurrentProtocols in Molecular Biology,第9、13、和16章,John Wiley & Sons,NewYork,N.Y.);B.Roe,J.Crabtree,和A.Kahn,1996,DNA Isolation andSequencingEssential Techniques,John Wiley & Sons;M.J.Gait(編者),1984,Oligonucleotide SynthesisA Practical Approach,Irl Press;和,D.M.J.Lilley and J.E.Dahlberg,1992,Methods of EnzymologyDNA Structure PartASynthesis and Physical Analysis of DNA Methods in Enzymology,AcademicPress。這些普通課本中的每一本都納入本文參考。
      本發(fā)明現(xiàn)在將進一步舉例來描述,其目的是用于幫助所屬領域普通技術人員實施發(fā)明,而并不想以任何方式限制本發(fā)明的范圍。
      實施例1 材料與方法 4C技術 3C技術過程的初始步驟如前述(Splinter等(2004).Methods Enzymol375,493-507(2004)進行,在HindIII片段間產(chǎn)生連接產(chǎn)物。該HindIII連接的3C模板(~50μg)以100ng/μl用50U第二、頻繁切割的限制性內(nèi)切酶消化過夜,所述酶是DpnII(HS2,Rad23A)或NlaIII(β-major)。為了避免DNA環(huán)形成受限制(Rippe等.(1995)Trends Biochem Sci 20,500-6),注意選擇第二限制性內(nèi)切酶,其不在距離劃分目的限制性片段(即‘誘餌’)的HindIII限制酶位點約350-400bp內(nèi)切割。第二限制性內(nèi)切酶消化后,用苯酚抽提DNA,用乙醇沉淀,然后以低濃度連接(用200U連接酶(Roche)于16℃連接溶于14ml中的50μg樣品4小時),從而促進DpnII-或DpnII-環(huán)形成。用苯酚抽提連接產(chǎn)物并用乙醇沉淀,將糖原(Roche)用作載體(20μg/ml)。用50U在第一和第二限制性內(nèi)切酶識別位點間切割誘餌的第三限制性內(nèi)切酶消化過夜,使目的環(huán)線性化;第三限制性內(nèi)切酶為SpeI(HS2)、PstI(Rad23A)和PflmI(β-major)。進行該線性化步驟以幫助接下來在第一輪PCR擴增期間進行引物雜交。用QIAquick核苷酸分離(250)柱(Qiagen)純化消化的產(chǎn)物。
      用Expand Long Template PCR系統(tǒng)(Roche)進行PCR反應,使用經(jīng)仔細優(yōu)化的條件來保證最長1.2kb片段的線性擴增(80%的4C-PCR片段小于600bp)。PCR條件如下94℃進行2分鐘,94℃15秒、55℃1分鐘和68℃3分鐘進行30個循環(huán),然后最后步驟為68℃進行7分鐘。確定仍舊顯示線性擴增范圍的最大模板量。為此,向PCR反應中加入連續(xù)稀釋的模板,擴增的DNA材料在瓊脂糖凝膠上分離并用ImageQuant軟件定量PCR產(chǎn)物。通常,每50μl PCR反應中用100-200ng模板能在線性擴增范圍內(nèi)產(chǎn)生出產(chǎn)物。合并16至32個PCR反應,并用QIAquick核苷酸分離(250)系統(tǒng)(Qiagen)純化該4C模板。純化的4C模板被標記并根據(jù)標準ChIP-芯片規(guī)程(Nimblegen Systems of Iceland,LLC)與陣列雜交。區(qū)別標記的基因組DNA(其用4C過程中所用的第一和第二酶消化)用作對照模板來校正雜交效率的差異。對于每個實驗,用交替的染料定位(orientation)標記2個獨立處理的樣品。
      所用的4C-引物序列 HS25’-ACTTCCTACACATTAACGAGCC-3’, 5’-GCTGTTATCCCTTTCTCTTCTAC-3’ Rad23A5’-TCACACGCGAAGTAGGCC-3’, 5’-CCTTCCTCCACCATGATGA-3’ β-major5’-AACGCATTTGCTCAATCAACTACTG-3’, 5’-GTTGCTCCTCACATTTGCTTCTGAC-3’ 4C陣列 基于NCBI建立的m34進行陣列和分析。探針(60-聚體)選自HindIII位點上和下游100bp處的序列。將CG含量朝50%優(yōu)化,用于使雜交信號均一化。為了避免交叉雜交,從探針組中去除與高豐度重復序列(RepBase 10.09)3具有任何相似性的探針。另外,在基因組中能有超過兩個BLAST命中情況的探針也去除出探針組。用MegaBLAST(Zhang等.(2000)J Comput Biol7,203-14)利用標準設置進行序列比對。命中被定義為有30nt或更長的配對排列。
      4C數(shù)據(jù)分析 為每個探針計算4C-樣品/基因組DNA的信號比率,并用Nimblegen系統(tǒng)提供的SignalMap軟件使數(shù)據(jù)可視化。用R軟件包(http://www.r-project.org)、Spotfire和Excel分析數(shù)據(jù)。未處理的雜交比率顯示沿著染色體模板有由20-50個陽性4C-信號組成的束。為了確定這些束,用連續(xù)平均法。使用各種窗口大小,范圍從9-39個探針,其都能鑒定同一束。顯示的結果基于29個探針的窗口大小(平均60kb),并與在隨機數(shù)據(jù)上進行的連續(xù)平均進行比較。每個陣列分別如此進行。因而,所有測量值都相對于特定陣列的振幅和噪聲加以評價。假發(fā)現(xiàn)率(False Discovery Rate,F(xiàn)DR)被定義為(假陽性數(shù))/(假陽性數(shù)+真陽性數(shù)),其以如下公式確定(隨機化組中的陽性數(shù))/(數(shù)據(jù)中的陽性數(shù))。利用由上到下的方法(top downapproach)確立閾值水平,以建立FDR<0.05的最小值。
      接著比較生物學重復實驗。在兩個重復實驗中都達到閾值的窗口被認為是陽性的。當比較隨機化的數(shù)據(jù)時,在兩個重復實驗中都沒有高于閾值的窗口。染色體模板上直接鄰接的陽性窗口被連接的(不允許有缺口),從而產(chǎn)生陽性區(qū)域。
      表達分析 對于每個組織,根據(jù)Affymetrix規(guī)程(小鼠430_2陣列)進行3個獨立微陣列操作。用RMA ca-tools(www.bioconductor.org)使數(shù)據(jù)正態(tài)化,并對于每個探針組將3個微陣列的測量值加以平均。另外,當多個探針組代表相同的基因時,也將它們平均。用Mas5calls(Affy庫www.bioconductor.org)確定“存在”、“不存在”和“邊緣”訪問(call)。在所有3個陣列中都表示為“存在”訪問、表達值大于50的基因被稱為表達的基因。將“胎兒肝特異性基因”歸類為達到我們在胎兒肝中表達的標準、并且表達值超過胎兒腦5倍的基因。為了測量每個基因周圍整體轉錄活性,運用連續(xù)總值。為此,我們使用轉換成對數(shù)的表達值。對于每個基因,我們計算了在基因起點上游100kb處和末端下游100kb處的窗口中發(fā)現(xiàn)的所有基因(包括基因本身)的表達總值。將在陽性4C區(qū)域中找到的活性基因(對于肝中的HS2、腦中的Rad23A和肝中的Rad23A,分別為n=124、123和208)的結果值與陽性4C區(qū)域外活性基因(分別n=153、301和186,其中n=153對應于染色體7中最著絲粒相互作用區(qū)(the most centromeric interacting region)和端粒之間存在的有活性、無相互作用的基因數(shù))而得的值作比較;利用一端拖尾的Wilcoxon秩和檢驗來比較這兩組。
      FISH探針 使用以下BAC克隆(BACPAC Resources Centre);針對Hbb-1的RP23-370E12,針對染色體7的80.1Mb處(OR基因束)的RP23-317H16,針對Uros的RP23-334E9,針對染色體7的118.3Mb處的RP23-32C19,針對染色體7的130.1Mb處的RP23-143F10,針對染色體7的73.1Mb處的RP23-470N5,針對染色體7的135.0Mb處(OR基因束)的RP23-247L11,針對Rad23A的RP23-136A15,針對染色體8的21.8Mb處的RI23-307P24,和針對染色體8的122.4Mb處的RP23-460F21。對于染色體7的著絲粒特異性探針,我們使用P1克隆5279(Genome Systems Inc.),其與DNA區(qū)段D7Mit21退火。用BioPrime Array CGH Genomic Labeling System(Invitrogen)制備隨機引物標記的探針。標記前,用DpnII消化DNA并用DNA clean andconcentrator-5試劑盒(Zymo research)純化。消化的DNA(300ng)用SpectrumGreen dUTP(Vysis)或Alexa fluor 594 dUTP(Molecular probes)標記,并通過GFX PCR DNA and Gel Band Purification試劑盒(AmershamBiosciences)純化,來去除未摻入的核苷酸。在由鼠胚胎干細胞制備的中期涂片上測試標記的探針的特異性。
      低溫FISH 如前所述進行低溫FISH5。簡而言之,E14.5肝和腦固定于4%多聚甲醛/250mM HEPES(pH 7.5)中20分鐘并切成小組織塊,然后在8%多聚甲醛中于4℃再固定2小時。固定的組織塊于室溫浸泡在2.3M蔗糖中20分鐘,裝在樣品座上并在液氮中急速凍結。組織塊儲存于液氮中,直至進行切片。用帶有低溫附件的Reichert超薄切片器E(Leica)切成約200nm厚的超薄低溫切片。用充滿蔗糖的環(huán),將切片轉移至蓋玻片上并儲存于-20℃。為了進行雜交,用PBS洗切片去除蔗糖,于37℃用溶于2xSSC中的250ng/ml RNA酶處理1小時,在0.1M HCL中孵育10分鐘,在連續(xù)稀釋的乙醇中脫水并在70%甲酰胺/2xSSC(pH 7.5)中于80℃變性8分鐘。臨進行探針雜交前,再次對切片脫水,然后。500ng標記的探針與5μg小鼠Cot1DNA(Invitrogen)共沉淀并溶解于雜交混合液(50%甲酰胺,10%硫酸葡聚糖,2×SSC,50mM磷酸鹽緩沖液,pH 7.5)中。探針于95℃變性5分鐘,于37℃重新退火30分鐘并于37℃雜交至少40小時。雜交后洗滌之后,用溶于PBS/0.05%吐溫-20的20ng/ml DAPI(Sigma)復染核,并在ProlongGold抗退色試劑(Molecular Probes)中固定。
      用裝有CCD照相機和Isis FISH Imaging System軟件(Metasystems)的Zeiss Axio Imager Z1落射熒光顯微鏡(x100倍平面復消色差透鏡,1.4倍油物鏡)收集圖像。最少分析250個β-球蛋白或Rad23A等位基因,并由不知道用于切片的探針組合的人將其評為與位于基因組其他地方的BAC重疊或不重疊。進行重復的吻合度測試(G-統(tǒng)計)6來評估4C-陽性相對于4C陰性區(qū)域的測量值之間差異的顯著性。表2中提供了結果的總述。
      盡管我們在背景(0.4-3.9%)和真實的(5-20.4%)相互作用頻率之間發(fā)現(xiàn)了有統(tǒng)計學顯著性,但是清楚的是由低溫FISH測得的頻率比例比其他人用不同的FISH規(guī)程測得的那些頻率更低。切片可能分開了一些相互作用的基因座,因此低溫FISH測量將輕微低估真實的相互作用頻率。在另一方面,由于在z-方向上有限的解析度,因此當前的2D-和3D FISH規(guī)程將高估這些百分比。將來,改進的顯微鏡技術與更特異的FISH探針的組合將更好地揭示真實的相互作用頻率。
      實施例2 基本如所述的(Splinter等.,(2004)Methods Enzymol.375493-507)進行3C過程(即用甲醛固定,用(第一)限制性內(nèi)切酶消化,重新連接交聯(lián)的DNA片段并進行DNA純化),產(chǎn)生含限制性片段的DNA混合物(‘3C模板’),這些限制性片段由于它們原來在核空間中接近而被連接。
      進行反向PCR來擴增所有與給定的限制性片段(“誘餌”;因為它含啟動子、增強子、隔離子、核基質附著區(qū)、復制起始點或任何其他第一(靶)核苷酸序列而被挑選)連接的片段。
      為此,通過用第二限制性內(nèi)切酶(優(yōu)選識別四個或五個核苷酸的序列的頻繁切割的酶)消化3C模板,然后在有利于分子內(nèi)相互作用的稀釋的條件下連接,由此產(chǎn)生DNA環(huán)。為了使由于拓撲學限制而造成的在環(huán)形成中的偏好(Rippe等,(2001)Trends in Biochem.Sciences 26,733-40)最小化,挑選優(yōu)選在距離第一限制性位點>350-400bp處切割誘餌的第二限制性內(nèi)切酶。為了增加反向PCR擴增的效率和可重復性,最好用在診斷性第一和第二限制性位點之間切割誘餌的限制性內(nèi)切酶(如識別6或更多bp的限制性酶)使環(huán)線性化,然后進行PCR擴增。
      用第二限制性內(nèi)切酶消化3C模板,在稀釋條件下連接來環(huán)化,并使含誘餌的環(huán)線性化,這些步驟在這些DNA操作的標準條件下進行,以產(chǎn)生用于進行反向PCR擴增的DNA模板(‘4C模板’)。
      因此,在100μl中用20U第二限制性內(nèi)切酶消化10μg 3C模板(過夜),然后使酶熱失活并純化DNA。在10ml中(1ng/μl DNA)用50U T4連接酶進行連接(于16℃4小時,于RT 30分鐘),然后進行DNA純化。最后,在100μl中用20U限制性內(nèi)切酶使目的環(huán)線性化(過夜),然后再次進行DNA純化。
      對于反向PCR,設計兩個誘餌特異性引物,每個分別盡可能接近第一限制性內(nèi)切酶識別位點并與第二限制性內(nèi)切酶識別位點直接相鄰,每種的3’末端朝外,從而使延伸立即穿過限制酶位點進入與誘餌相連的片段。優(yōu)選(每50μl PCR反應混合物中)使用100-400ng DNA的4C模板實施用這些引物進行的反向PCR,從而使每個PCR反應包括了最大數(shù)量的連接事件。我們根據(jù)廠商的方法利用緩沖液1應用Expand Long Template PCR系統(tǒng)(Roche)進行反向PCR。
      進行以下PCR循環(huán) 1.94℃ 2分鐘 2.94℃ 15秒 3.55℃ 1分鐘 4.68℃ 3分鐘 5.重復步驟2-4共29次(或25-40次間的任意次數(shù)) 6.68℃ 7分鐘 7.結束 進行凝膠電泳來分析各PCR反應間的可重復性。通常應當獲得一致的產(chǎn)物模式。
      為了通過隨機引發(fā)和陣列雜交獲得足以進行標記的材料,合并多個PCR反應(每個都是30個循環(huán)的PCR后所獲得的),(而不是在每個反應中增加PCR循環(huán)數(shù))。作為隨機引發(fā)標記的可選方法,可將標記的核苷酸加入PCR的最后的循環(huán)中(如30個循環(huán)(無標記)+10個循環(huán)(有標記))。
      實施例3 利用4C技術檢測易位 用4C技術測量針對來自健康受試者的細胞中和來自患者的細胞中給定的染色體A上出現(xiàn)的給定的序列X的相互作用頻率,所述患者在染色體A和B間帶有單一的交互易位,其中斷點接近于序列X(如圖9所示)。
      在正常細胞中,該分析揭示出針對(幾乎)每個位于染色體A上序列X的0.2-10Mb內(nèi)的探針的雜交信號(即與X的頻繁相互作用)提高了(顯示出強交聯(lián)信號的染色體區(qū)域的實際大小主要依賴于與陣列雜交的樣品的復雜性)。在相同染色體A上的其他地方以及在其他染色體上,沒有觀察到這樣帶有提高的雜交信號的(在線性DNA模板上)的大的探針區(qū)域。
      可是在患者細胞中,用位于斷點另一邊的所有染色體A探針得到的雜交信號減少了~50%(染色體A的一個拷貝仍舊是完整的,并將產(chǎn)生正常的信號),而對于染色體B上斷點邊緣的探針,則觀察到了提高了的雜交信號的獨特集中(即不存在于正常細胞中)。事實上,染色體B上顯示從無雜交信號探針到強雜交信號探針的突然轉變揭示了染色體B上斷點的位置。
      實施例4 分析4C技術結果 用4C技術表征小鼠β-球蛋白基因座控制區(qū)(locus control region,LCR)的基因組環(huán)境,關注含其超敏位點2(hypersensitive site2,HS2)的限制性片段。LCR是強紅血球特異性轉錄調節(jié)元件,對于高β-球蛋白基因表達水平是必需的。β-球蛋白基因座出現(xiàn)在染色體7上97Mb位置處,其中它位于只在嗅覺神經(jīng)元中轉錄的嗅覺受體基因的大的2.9Mb的束中。分析2種組織中的相互作用E14.5胎兒肝(其中LCR是有活性的而且β-球蛋白基因高度轉錄),和E14.5胎兒腦(其中LCR是無活性的而且球蛋白基因是沉默的)。在兩種組織中,絕大多數(shù)相互作用在染色體7上的序列中被發(fā)現(xiàn),而6個無關的染色體(8、10、11、12、13、14)只檢測到很少的LCR相互作用(圖13a)。染色體7上的最強的信號在以β-球蛋白染色體位置為中心的5-10Mb區(qū)域內(nèi)被發(fā)現(xiàn),符合相互作用頻率與物理相連的DNA序列間的距離(以堿基對計)成反比的觀點。不可能定量說明該區(qū)域中的相互作用。我們的理由是這些鄰近的序列太頻繁地與β-球蛋白在一起,使得它們在我們的雜交樣品中大大地過量表達,使相應探針都飽和了。我們用1∶10和1∶100稀釋的樣品進行雜交,發(fā)現(xiàn)了信號強度對于在外邊和邊緣的探針都降低了,但在該區(qū)域內(nèi)的探針則沒有降低(數(shù)據(jù)未顯示),這確證了這個理由。
      4C過程成生了高度可重復的數(shù)據(jù)。圖2b-c顯示了針對染色體7上兩個1.5Mb區(qū)域(大約距離β-球蛋白基因25Mb和80Mb)的4C-信號相對于對照雜交信號的未處理的比率。在該解析度水平時,獨立處理的樣品的結果幾乎是相同的。在胎兒肝和腦中,都有陽性信號束在染色體7上被鑒定出,其通常位于距離β-球蛋白上千萬堿基的染色體位置上。這些束通常由最少20-50個并列排在染色體模板上的探針組成,所述探針的信號比率增加(圖13b-c)。每個在陣列上的探針分析獨立連接事件。而且,每個細胞僅有2個拷貝的HS2限制性片段,其每一個僅連接于一個其它限制性片段。因此,檢測到與20或更多個鄰近限制性片段的獨立連接事件強有力地顯示了,在多種細胞中,相應基因座與β-球蛋白LCR接觸。
      為了確定這些束的統(tǒng)計學顯著性,各實驗的數(shù)據(jù)按序排列在染色體圖譜上并用窗口大小約為60kb的連續(xù)平均算法分析。用隨機改組的數(shù)據(jù)的連續(xù)平均分布來設定閾值,允許有5%的假發(fā)現(xiàn)率。該分析鑒定了胎兒肝中的66個束和腦中的45個束,它們在重復的實驗中被重復發(fā)現(xiàn)(圖13d-f)。確實,高解析度的FISH確認了這些束真實地代表了頻繁相互作用的基因座(見下)。
      因此,4C技術通過檢測在染色體位置集束的多個限制性片段的獨立連接事件來鑒定長程相互作用基因座。
      用不同的反向PCR引物組進行一系列完全獨立的4C實驗,研究β-major基因的基因組環(huán)境,β-major基因位于HS2下游~50kb處。在胎兒肝中,β-major基因是高度轉錄的并與LCR頻繁接觸。在胎兒肝和腦中,發(fā)現(xiàn)與β-major長程相互作用的束和HS2的幾乎完全相同,進一步證實了這些基因座頻繁與β-球蛋白基因座接觸(圖17)。
      實施例5 活化的和失活的β-球蛋白基因座占據(jù)不同的基因組環(huán)境。
      2種組織間的比較揭示,胎兒肝中活躍轉錄的β-球蛋白基因座和其腦中轉錄沉默的對應物相比與完全不同組的基因座相互作用(τ=-0.03;Spearman氏秩相關)(圖13f)。這排除了結果受探針序列組合的影響。在胎兒肝中,相互作用的DNA片段位于以β-球蛋白基因座為中心的70Mb區(qū)域內(nèi),其大多數(shù)(40/66)朝向染色體7的端粒分布。在胎兒腦中,與胎兒肝相比,相互作用的基因座在距離β-球蛋白相似或甚至更遠處被發(fā)現(xiàn),而且最主要的相互作用(43/45)朝向染色體7的端粒分布。這些數(shù)據(jù)證實了有活性的和無活性的β-球蛋白基因座接觸染色體7的不同部分。
      微陣列上有另外6個染色體(8、10、11、12、13和14)的代表物。這些染色體上的強雜交信號很少,通常顯示為在線性DNA模板上呈分離狀態(tài),并經(jīng)常在重復實驗中不存在。另外,沿著這些染色體的連續(xù)平均水平從未可重復地接近于針對染色體7計分的水平(圖19)。因此,我們的數(shù)據(jù)顯示,β-球蛋白基因座大多與同一染色體上其他地方的基因座接觸,符合該基因座在其自身染色體區(qū)域內(nèi)部的優(yōu)選位置。我們注意到,α-球蛋白基因座也出現(xiàn)在陣列上(染色體11),并沒有呈現(xiàn)出與β-球蛋白的陽性相互作用,符合近來由FISH的證明結果,即小鼠α-和β-球蛋白在核空間中不頻繁相遇(Brown,J.M.等.(2006)J Cell Biol 172,177-87)。
      為了更好地理解染色體7上觀察到的長程相互作用的相關性,我們比較了相互作用的基因座與基因的染色體位置。另外,進行Affymetrix表達陣列分析以確定在兩種組織中在這些位置上的轉錄活性。盡管胎兒肝和腦中相互作用區(qū)域的平均大小是類似的(分別為183kb和159kb),但是在它們的基因成分和活性上觀察到了巨大的差異。在胎兒肝中,80%的β-球蛋白相互作用基因座含一個或多個活躍轉錄的基因,而在胎兒腦中,大多數(shù)(87%)顯示沒有可檢測的基因活性(圖15)。因此在兩種組織中,β-球蛋白基因座包含在非常不同的基因組環(huán)境中。在腦中(其中該基因座是無活性的),它主要接觸朝向染色體7著絲粒分布的轉錄沉默基因座。在胎兒肝中(其中該基因座是有高活性的),它優(yōu)先與更顯著地朝著染色體7端粒側分布的活躍轉錄的區(qū)域相互作用。重要的是,4C技術能將Uros和Eraf距離(β-球蛋白~30Mb)鑒定為在胎兒肝中與有活性的β-球蛋白基因座相互作用的基因,符合以前由FISH得到的觀察結果(Osborne,C.S.等.(2004)Nat Genet36,1065-71(2004))。有趣的是,觀察到在腦中另外兩個嗅覺受體基因束有接觸,其存在于染色體7上,各自位于β-球蛋白的兩邊,并分別距離β-球蛋白17和37Mb。
      在胎兒肝中,并非染色體7上所有的轉錄區(qū)域都與有活性的β-球蛋白基因座相互作用。所以,我們尋找專門由相互作用的基因座共享、而不由胎兒肝中其他活性區(qū)域共享的共同特征。β-球蛋白基因——Uros和Eraf都是可由相同的轉錄因子組調節(jié)的紅細胞特異性基因,而且吸引人的觀點是,這些因子協(xié)調了它們的靶基因在核空間中的表達。我們比較了來自E14.5胎兒肝的與胎兒腦的Affymetrix表達陣列數(shù)據(jù),以此鑒定胎兒肝中優(yōu)先表達(>5倍以上)的基因。由此,染色體7上28%的有活性的基因被歸類為“胎兒肝特異性的”,其中25%在共定位區(qū)域中被發(fā)現(xiàn)。因此,我們發(fā)現(xiàn)在共定位區(qū)域中“胎兒肝特異性”基因并不豐富。更重要的是,66個相互作用的區(qū)域中的49個(74%)不含有“胎兒肝特異性”基因,因此斷定我們的數(shù)據(jù)沒有顯示核空間中組織特異性基因協(xié)調表達的證據(jù)。β-球蛋白基因以異常高的速率被轉錄,而且接下來詢問基因座是否優(yōu)先與其他高轉錄活性區(qū)域相互作用,不管這些區(qū)域是高表達的基因抑或帶有高密度活性基因的區(qū)域。利用Affymetrix計數(shù)來測定基因活性,我們進行連續(xù)總和算法來測量有轉錄活性的基因周圍200kb區(qū)域內(nèi)的總體轉錄活性。該分析揭示在相互作用的基因周圍的轉錄活性不高于在染色體7上無相互作用活性的基因周圍的轉錄活性(p=0.9867;Wilcoxon秩和)。
      實施例6 管家基因的基因組環(huán)境在組織之間很大程度上是保守的 接著研究在兩種組織中相似表達的基因是否也轉換其基因組環(huán)境。Rad23A是普遍表達的基因,其位于染色體8上主要由管家基因組成的基因密集束中。在E14.5胎兒肝和腦中,該基因和其直接相鄰的許多基因都是有活性的。進行4C分析并鑒定與Rad23A距離長達70Mb處的基因座的許多長程相互作用。重要的是,與Rad23A的相互作用在胎兒肝和腦中高度相關(τ=0.73;Spearman氏秩相關)(圖15a)。另外,這些基因座共有的特點是它們含有轉錄活性的基因。因此,在這兩種組織中都約有70%含至少一種有活性的基因(圖15b-c)。如連續(xù)總和算法所確定的(對兩種組織,p<0.001),與染色體其他地方的活性基因相比,相互作用的基因周圍的區(qū)域顯示出統(tǒng)計學上顯著更高的基因活性水平。因此,與β-球蛋白基因座不同,位于基因豐富區(qū)域中的Rad23A基因優(yōu)先與其他增加轉錄活性的染色體區(qū)域跨距離相互作用。通過FISH觀察到,含Rad23A的染色體區(qū)域大多位于其染色體區(qū)域的邊緣(90%)或外邊(10%)(未發(fā)表,D.Noordermeer,M.Branco,A.Pombo和W.de Laat)??墒?,4C分析僅揭示了染色體內(nèi)的相互作用,染色體7、10、11、12、13或14上則沒有區(qū)域能可重復地達到我們的嚴格的相互作用標準。因此,Rad23A主要參與在兩種非常不同的組織中相似的染色體內(nèi)相互作用。如果Rad23A在這些不相關的染色體上有優(yōu)選的鄰近基因座,則它們的相互作用還不足以在本文4C技術所用的條件下被檢測。
      實施例7 通過高解析度顯微鏡驗證4C技術 為了驗證4C技術得到的結果,進行低溫FISH實驗。低溫FISH是近來開發(fā)的顯微鏡技術,其相對于現(xiàn)有3D-FISH規(guī)程的優(yōu)點在于,它更好地保留核超結構,并通過制備超薄低溫切片來改善z軸解析度(Branco,M.R.&Pombo,A(2006).PLoS Biol4,e138)。4C數(shù)據(jù)的驗證是通過在由E14.5肝和腦制備的200nm超薄切片中測量β-球蛋白或Rad23A等位基因(通常n>250)如何頻繁地與15個以上的選擇的染色體區(qū)域共定位而進行的。重要的是,所有通過低溫FISH測量的相互作用頻率完美地符合4C結果(圖17)。例如,通過4C技術鑒定為與β-球蛋白有相互作用的遠距離區(qū)域比未由4C檢測到的介于其間的區(qū)域更頻繁地共定位(分別為7.4%和9.7%,相對于3.6%和3.5%)。另外,由4C技術鑒定出與胎兒腦而不是肝中β-球蛋白相互作用的兩個遠距離嗅覺受體基因束在腦中的共定位頻率分別被評為12.9%和7%,而肝切片中為3.6%和1.9%??傊?C技術鑒定為陽性的基因座所測得的共定位頻率都顯著高于背景基因座所測得的頻率(p<0.05;G-檢驗)。我們斷定4C技術如實地鑒定出相互作用的DNA基因座。最后,我們使用低溫FISH證明被鑒定為與β-球蛋白相互作用的基因座也頻繁地相互接觸。對于胎兒肝中跨越大染色體距離的2個活性區(qū)域來說(圖19)以及對于腦中在染色體上相距較遠的兩個無活性的OR基因束來說(圖17),都是如此。有趣的是,這兩個遠距離OR基因束間頻繁的接觸也在胎兒肝中被發(fā)現(xiàn),在這里它們不與含有被活躍轉錄的β-球蛋白基因座的OR基因束相互作用。這些數(shù)據(jù)顯示,相距較遠的OR基因束間的核相互作用不是所分析的胎兒腦組織所獨有的。這似乎在推測,這種空間接觸對許多OR基因間的聯(lián)系提供了幫助,這種聯(lián)系對于確保每個嗅覺神經(jīng)元中僅一個等位基因被轉錄是必需的(Shykind,B.(2005)Hum Mol Genet 14 Spec No 1,R33-9。
      實施例8 有活性和無活性的染色質結構域的核組織 本文所述的觀察結果證實了不僅有活性的、而且無活性的基因組區(qū)域也在核空間中形成涉及許多長程接觸的獨特區(qū)域,這有力地提示了每種DNA片段具有其自身優(yōu)選的相互作用組。我們的數(shù)據(jù)提示,當β-球蛋白基因座被開啟時,它形成轉錄沉默基因組環(huán)境,并進入有益于與活性結構域相互作用的核區(qū)域。預計這種在轉錄活化后戲劇性的再定位很可能僅為達到了某種表達水平、并且更重要的是在線性染色體模板上與其他活性基因分隔開(如對于β-球蛋白的情況)的組織特異性基因的標志。這提示,在無活性的和有活性的基因組基因座之間都鑒定到的長程相互作用的廣泛網(wǎng)絡反映出細胞與細胞在染色體構象上的差異,而不是間期的動態(tài)移動的結果(Chakalova等.(2005)Nat Rev Genet 6,669-77(2005)。推測起來,細胞分裂后不同程度的去凝聚作用驅使有活性的基因組區(qū)域遠離無活性的染色質(Gilbert,N.等.(2004)Cell 118,555-66(2004)),并通過染色質結合蛋白質間的親和性使具有相似染色質組成的遠距離基因座間的接觸穩(wěn)定。遠距離基因座間的空間相鄰可以是功能性的,但也可簡單地是染色體解折疊模式的結果。盡管單個基因座能在有限的核體積中移動,染色體的一般構象將在整個細胞周期內(nèi)被極大地保持、并需要細胞分裂才能被重置。該觀點符合活細胞成像研究的結果(其顯示帶標簽的DNA基因座在核內(nèi)受限地運動(Chubb等.(2002)Curr Biol 12,439-45(2002))),而且很好地符合以下研究結果,即顯示了核染色質位置信息在細胞分裂過程中被頻繁傳遞而在細胞群體中并不被保存(Essers,J.等.Mol Biol Cell 16,769-75(2005);Gerlich,D.等.Cell 112,751-64(2003))。
      其它方面1 本發(fā)明進一步的方面在以下編號的段落中被提出。
      1.探針組,所述探針與給定物種(如人)基因組中每一個第一限制性內(nèi)切酶識別位點的每一側互補。
      2.探針組,所述探針僅與給定物種(如人)基因組中每一個第一限制性內(nèi)切酶識別位點的一側互補。
      3.探針組,所述探針與沿給定物種(如人)基因組線性模板排列的每隔一個第一限制性內(nèi)切酶識別位點的一側互補。
      4.探針組,所述探針與沿給定物種(如人)基因組線性模板排列的每隔三個、每隔四個、每隔五個、每隔六個、每隔七個、每隔八個、每隔九個、每隔十個、每隔二十個、每隔三十個、每隔四十個、每隔五十個、每隔六十個、每隔七十個、每隔八十個、每隔九十個或每隔一百個第一限制性內(nèi)切酶識別位點的一側互補。
      5.探針組,其代表已知涉及易位、缺失、倒位、重復和其他基因組重排的所有基因座周圍給定大小(如約50kb、100kb、200kb、300kb、400kb、500kb、1Mb、2Mb、3Mb、4Mb、5Mb、6Mb、6Mb、7Mb、8Mb、9Mb或10Mb)(如50kb-10Mb)的基因組區(qū)域。
      6.探針組,其代表已知涉及易位、缺失、倒位、重復和其他基因組重排的所選的基因座周圍給定大小(如約50kb、100kb、200kb、300kb、400kb、500kb、1Mb、2Mb、3Mb、4Mb、5Mb、6Mb、6Mb、7Mb、8Mb、9Mb或10Mb)(如50kb-10Mb)的基因組區(qū)域。
      7.4C序列(誘餌)優(yōu)選在距離實際重排序列(即在易位情況下的斷點)約50kb、100kb、200kb、300kb、400kb、500kb、1Mb、2Mb、3Mb、4Mb、5Mb、6Mb、6Mb、7Mb、8Mb、9Mb、10Mb、11Mb、12Mb、13Mb、14Mb或15Mb或更遠距離的范圍內(nèi)。
      8.探針組,其代表給定物種的完整基因組,其中每個探針代表由第一限制性內(nèi)切酶消化后得到或可得到的單一限制性片段。
      9.探針組,其代表給定物種的完整基因組,其中探針沿著線性染色體模板平均分布。
      10.陣列,其包括根據(jù)段落1-10之任一段所述的探針組。
      11.分析靶核苷酸序列與一個或多個核苷酸序列(如一個或多個基因組基因座)相互作用的頻率的方法,其包括使用如本文所述的核苷酸序列或探針陣列或探針組或陣列。
      12.鑒定一種或多種指示特定疾病狀態(tài)的DNA-DNA相互作用的方法,其包括使用如本文所述的核苷酸序列或探針陣列或探針組或陣列。
      13.診斷或預測由DNA-DNA改變造成的或與DNA-DNA改變相關的疾病或綜合征的方法,其包括使用如本文所述的核苷酸序列或探針陣列或探針組或陣列。
      14.鑒定一種或多種調節(jié)DNA-DNA相互作用的試劑的測試方法,其包括使用如本文所述的核苷酸序列或探針陣列或探針組或陣列。
      15.檢測斷點(如易位)位置的方法,其包括使用如本文所述的核苷酸序列或探針陣列或探針組或陣列。
      16.檢測倒位的位置的方法,其包括使用如本文所述的核苷酸序列或探針陣列或探針組或陣列。
      17.檢測缺失的位置的方法,其包括使用如本文所述的核苷酸序列或探針陣列或探針組或陣列。
      18.檢測重復的位置的方法,其包括使用如本文所述的核苷酸序列或探針陣列或探針組或陣列。
      19.微陣列在鑒定與所選DNA片段空間密切接近的(所有)DNA片段的4C技術中的用途。
      20.微陣列,其包括與DNA序列同源的探針,所述序列直接鄰接于分析中所包括的基因組區(qū)(其可以是完整的基因組或基因組部分)中出現(xiàn)的第一限制性內(nèi)切酶識別位點每個探針優(yōu)選位于距離獨特的第一限制性內(nèi)切酶識別位點100bp內(nèi)、或最多300bp內(nèi),或可選地被設計成在每個第一限制性內(nèi)切酶識別位點與其最接近的第二限制性內(nèi)切酶識別位點之間。
      21.如本文所述的陣列,其包括與所選的基因座序列互補的探針,其中所述陣列代表給定物種的完整基因組。
      22.段落21所述的陣列,其中所述基因座是與一種或多種疾病相關的基因座。
      23.段落21或段落22所述的陣列,其中所選的基因座序列包括距離所述基因座多至20Mb的序列。
      24.分析靶核苷酸序列與一個或多個目的核苷酸序列(如一個或多個基因組基因座)相互作用的頻率的方法,其包括以下步驟 (a)提供交聯(lián)DNA的樣品; (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA; (c)連接交聯(lián)的核苷酸序列; (d)解除交聯(lián); (e)用第二限制性內(nèi)切酶消化核苷酸序列; (f)連接核苷酸序列; (g)利用至少兩個寡核苷酸引物擴增一個或多個與靶核苷酸序列相連的目的核苷酸序列,其中每個引物與在目的核苷酸序列的側翼的已知的DNA序列雜交; (h)將被擴增的一個或多個序列與陣列雜交;和 (i)確定DNA序列間相互作用的頻率。
      其它方面2 本發(fā)明又進一步的方面在以下編號的段落中被提出。
      1.環(huán)化的核苷酸序列,其包含由第一和第二限制性內(nèi)切酶識別位點分隔的第一和第二核苷酸序列,其中所述第一核苷酸序列是靶核苷酸序列而且所述第二核苷酸序列可通過交聯(lián)基因組DNA而獲得。
      2.段落1所述的環(huán)化的核苷酸序列,其中靶核苷酸序列選自由啟動子、增強子、沉默子、隔離子、核基質附著區(qū)、基因座控制區(qū)、轉錄單位、復制起始點、重組熱點、易位斷點、著絲粒、端粒、基因密集區(qū)、基因稀少區(qū)、重復元件和(病毒)整合位點所組成的組。
      3.段落1所述的環(huán)化的核苷酸序列,其中靶核苷酸序列是與疾病相關的或造成疾病的核苷酸序列,或在線性DNA模板上位于距離與疾病相關的或造成疾病的基因座少于15Mb處。
      4.段落1-3之任一段所述的環(huán)化的核苷酸序列,其中靶核苷酸序列選自以下組成的組AML1,MLL,MYC,BCL,BCR,ABL1,IGH,LYL1,TAL1,TAL2,LMO2,TCRα/δ,TCRβ和HOX或其他與疾病相關的基因座,所述其他與疾病相關的基因座如“Catalogue of Unbalanced ChromosomeAberrations in Man”第2版.Albert Schinzel.柏林Walter de Gruyter,2001.ISBN3-11-011607-3中所述。
      5.段落1-4之任一段所述的環(huán)化的核苷酸序列,其中第一限制性內(nèi)切酶識別位點是6-8bp識別位點,優(yōu)選選自由BglII、HindIII、EcoRI、BamHI、SpeI、PstI和NdeI所組成的組。
      6.前述段落之任一段所述的環(huán)化的核苷酸序列,其中第二限制性內(nèi)切酶識別位點是4或5bp核苷酸序列識別位點。
      7.前述段落之任一段所述的環(huán)化的核苷酸序列,其中第二限制性內(nèi)切酶識別位點位于距離第一限制性位點大于約350bp處。
      8.前述段落之任一段所述的環(huán)化的核苷酸序列,其中核苷酸序列是標記的。
      9.核苷酸序列,其包含由第一和第二限制性內(nèi)切酶識別位點分隔的第一和第二核苷酸序列,其中所述第一核苷酸序列是靶核苷酸序列,第二核苷酸序列可通過交聯(lián)基因組DNA而獲得,而且其中所述第二核苷酸序列與靶核苷酸序列相交。
      10.制備環(huán)化的核苷酸序列的方法,其包括以下步驟 (a)提供交聯(lián)DNA的樣品; (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA; (c)連接交聯(lián)的核苷酸序列; (d)解除交聯(lián); (e)用第二限制性內(nèi)切酶消化核苷酸序列;和 (f)環(huán)化核苷酸序列。
      11.制備核苷酸序列的方法,其包括以下步驟 (a)提供交聯(lián)DNA的樣品; (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA; (c)連接交聯(lián)的核苷酸序列; (d)解除交聯(lián); (e) 用第二限制性內(nèi)切酶消化核苷酸序列; (f)環(huán)化核苷酸序列;和 (g)擴增與靶核苷酸序列相連的一個或多個核苷酸序列。
      12.段落11所述的方法,其中在擴增前將環(huán)化的靶核苷酸序列線性化。
      13.段落12所述的方法,其中用識別6bp或更多識別位點的限制性內(nèi)切酶線性化環(huán)化的靶核苷酸序列。
      14.段落10-13之任一段所述的方法,其中用PCR擴增交聯(lián)的核苷酸序列。
      15.段落14所述的方法,其中用反向PCR擴增交聯(lián)的核苷酸序列。
      16.段落14或段落15所述的方法,其中使用Expand Long TemplatePCR System(Roche)。
      17.分析靶核苷酸序列與一個或多個核苷酸序列(如一個或多個基因組基因座)相互作用的頻率的方法,其包括使用段落1-9任一所述的核苷酸序列。
      18.固定于支持物上的探針陣列,其包括與或能與段落1-9所述的核苷酸序列雜交的一個或多個探針。
      19.探針組,所述探針在序列上與基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點附近的核酸序列互補。
      20.段落19所述的探針組,其中探針在序列上與和基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點的每一側相鄰的核酸序列互補。
      21.段落19或段落20所述的探針組,其中所述探針在序列上與距離基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點小于300個堿基對的核酸序列互補。
      22.段落19-21之任一段所述的探針組,其中探針與距離基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點小于300bp的序列互補。
      23.段落19-22之任一段所述的探針組,其中探針與距離基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點200-300bp的序列互補。
      24.段落19-23之任一段所述的探針組,其中探針與距離基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點100-200bp的序列互補。
      25.段落19-24之任一段所述的探針組,其中兩個或多個探針被設計能夠與基因組DNA中第一限制性內(nèi)切酶的每個第一限制性內(nèi)切酶識別位點的相鄰序列雜交。
      26.段落25所述的探針組,其中探針重疊或部分重疊。
      27.段落26的探針組,其中重疊小于10個核苷酸。
      28.段落19-27之任一段所述的探針組,其中探針序列對應于第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點和第二限制性內(nèi)切酶的每一個第一相鄰第二限制性內(nèi)切酶識別位點之間的全部或部分序列。
      29.段落19-28之任一段所述的探針組,其中每種探針至少是25聚體。
      30.段落19-29之任一段所述的探針組,其中每種探針至少是25-60聚體。
      31.制備探針組的方法,其包括以下步驟 (a)鑒定基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點; (b)設計探針,所述探針能夠與基因組DNA中每一個第一限制性內(nèi)切酶識別位點的相鄰序列雜交; (c)合成探針;和 (d)將探針組合在一起形成探針組或基本上形成探針組。
      32.段落31所述的方法,其中探針是PCR擴增產(chǎn)物。
      33.由或可由段落31或段落32的方法得到的探針組或基本上得到的探針組。
      34.陣列,其包括段落18所述的探針陣列或主要包括段落19-30或33之任一段所述的探針組。
      35.陣列,其包括段落19-30或33之任一段所述的探針組。
      36.段落34或段落35所述的陣列,其中陣列包括約300,000-400,000個探針。
      37.段落34-36之任一段所述的陣列,其中陣列包括約385,000或更多探針,優(yōu)選約750,000個探針,更優(yōu)選6×750,000個探針。
      38.段落34-37之任一段所述的陣列,其中如果探針數(shù)超過單個陣列可以包含的探針數(shù),則陣列以較低解析度包含給定物種的完整基因組的代表物或由給定物種的完整基因組的代表物組成。
      39.段落38所述的陣列,其中所述陣列中包含按序排列在線性染色體模板上的每2、3、4、5、6、7,8、9或10個探針中的一個探針。
      40.制備陣列的方法,其包括基本上將段落18所述的探針陣列或基本上將段落19-30或33之任一段所述的探針組固定在固相支持物上的步驟。
      41.制備陣列的方法,其包括基本上將段落18所述的探針陣列或基本上將段落19-30或33之任一段所述的探針組固定在固相支持物上的步驟。
      42.由或可由段落40或段落41所述的方法獲得的陣列。
      43.分析靶核苷酸序列與一個或多個核苷酸序列(如一個或多個基因組基因座)相互作用的頻率的方法,其包括以下步驟 (a)提供交聯(lián)DNA的樣品; (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA; (c)連接交聯(lián)的核苷酸序列; (d)解除交聯(lián); (e)用第二限制性內(nèi)切酶消化核苷酸序列; (f)環(huán)化核苷酸序列; (g)擴增與靶核苷酸序列連接的一個或多個核苷酸序列; (h)任選將擴增的序列與陣列雜交;和 (i)確定DNA序列間相互作用的頻率。
      44.鑒定指示特定疾病狀態(tài)的一種或多種DNA-DNA相互作用的方法,其包括以下步驟 (a)提供來自于患病和非患病的細胞的交聯(lián)DNA的樣品; (b)用第一限制性內(nèi)切酶消化每個樣品中交聯(lián)的DNA; (c)連接交聯(lián)的核苷酸序列; (d)解除交聯(lián); (e)用第二限制性內(nèi)切酶消化核苷酸序列; (f)環(huán)化核苷酸序列; (g)擴增與靶核苷酸序列連接的一個或多個序列; (h)任選將擴增的核苷酸序列與陣列雜交;和 (i)確定DNA序列間相互作用的頻率, 其中來自于患病和非患病的細胞的DNA序列間相互作用的頻率的差異表示DNA-DNA相互作用指示特定疾病狀態(tài)。
      45.診斷或預測由DNS-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的方法,其包括以下步驟 (a)提供來自受試者的交聯(lián)DNA的樣品; (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA; (c)連接交聯(lián)的核苷酸序列; (d)解除交聯(lián); (e)用第二限制性內(nèi)切酶消化核苷酸序列; (f)環(huán)化核苷酸序列; (g)擴增與靶核苷酸序列連接的一個或多個序列; (h)任選將擴增的核苷酸序列與陣列雜交; (i)確定DNA序列間相互作用的頻率;和 (j)比較DNA序列的相互作用頻率與未受影響的對照的相互作用頻率; 其中對照獲得的值和由受試者獲得的值之間的差異表明受試者正罹患疾病或綜合征,或表明受試者將罹患疾病或綜合征。
      46.段落45所述的方法,其中相互作用頻率從低至高的轉換指示斷點的位置。
      47.段落45所述的方法,其中受試者樣品的DNA-DNA相互作用頻率相對于對照呈倒轉模式指示倒位。
      48.段落45所述的方法,其中受試者樣品的DNA-DNA相互作用頻率相對于對照的減少,并組合以更遠區(qū)域的DNA-DNA相互作用頻率的增加,指示缺失。
      49.段落45所述的方法,其中受試者樣品的DNA-DNA相互作用頻率相對于對照增加或減少指示重復或插入。
      50.段落45-49之任一段所述的方法,其中在進行所述方法前使用光譜核型分析和/或FISH。
      51.段落45-50之任一段所述的方法,其中疾病是遺傳疾病。
      52.段落45-51之任一段所述的方法,其中疾病是癌癥。
      53.診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的方法,其包括以下步驟 (a)提供來自受試者的交聯(lián)DNA的樣品; (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA; (c)連接交聯(lián)的核苷酸序列; (d)解除交聯(lián); (e)用第二限制性內(nèi)切酶消化核苷酸序列; (f)環(huán)化核苷酸序列; (g)擴增與一個或多個靶核苷酸序列連接的兩個或更多個序列; (h)標記兩個或更多個被擴增的序列; (i)將核苷酸序列與陣列雜交; (j)確定DNA序列間相互作用的頻率;和 (j)鑒定一個或多個承受與疾病相關的基因組重排的基因座。
      54.段落53所述的方法,其中兩個或更多個被擴增的序列是區(qū)別標記的。
      55.段落54所述的方法,其中當該兩個或更多個被擴增的序列位于不同的染色體上時,其標記是相同的。
      56.段落53所述的方法,其中當該兩個或更多個被擴增的序列位于相同染色體上足夠遠的距離以使DNA-DNA相互作用信號間發(fā)生最小的重疊時,該兩個或更多個被擴增的序列的標記是相同的。
      57.鑒定一種或多種調節(jié)DNA-DNA相互作用的試劑的測試方法,其包括以下步驟 (a)將樣品與一種或多種試劑接觸; (b)提供來自樣品的交聯(lián)的DNA; (c)用第一限制性內(nèi)切酶消化交聯(lián)的DNA; (d)連接交聯(lián)的核苷酸序列; (e)解除交聯(lián); (f)用第二限制性內(nèi)切酶消化核苷酸序列; (g)環(huán)化核苷酸序列; (h)擴增與靶核苷酸序列連接的一個或多個核苷酸序列; (i)任選將擴增的核苷酸序列與陣列雜交;和 (j)確定DNA序列間相互作用的頻率, 其中(i)存在試劑的情況下DNA序列間相互作用的頻率和(ii)在無試劑的情況下DNA序列間相互作用的頻率之間的差異指示該試劑能調節(jié)DNA-DNA相互作用。
      58.檢測斷點(如易位)位置的方法,其包括以下步驟 (a)提供交聯(lián)DNA的樣品; (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA; (c)連接交聯(lián)的核苷酸序列; (d)解除交聯(lián); (e)用第二限制性內(nèi)切酶消化核苷酸序列; (f)環(huán)化核苷酸序列; (g)擴增與靶核苷酸序列相連的一個或多個序列; (h)任選將擴增的核苷酸序列與陣列雜交; (i)確定DNA序列間相互作用的頻率;和 (j)將DNA序列間相互作用的頻率與對照的相互作用頻率比較; 其中樣品中DNA-DNA相互作用頻率相對于對照從低至高的轉變指示斷點的位置。
      59.檢測倒位位置的方法,其包括以下步驟 (a)提供交聯(lián)DNA的樣品; (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA; (c)連接交聯(lián)的核苷酸序列; (d)解除交聯(lián); (e)用第二限制性內(nèi)切酶消化核苷酸序列; (f)環(huán)化核苷酸序列; (g)擴增與靶核苷酸序列相連的一個或多個序列; (h)任選將擴增的核苷酸序列與陣列雜交; (i)確定DNA序列間相互作用的頻率;和 (i)將DNA序列間相互作用的頻率與對照的相互作用頻率比較; 其中樣品的DNA-DNA相互作用頻率相對于對照的相互作用頻率呈倒轉模式指示倒位。
      60.檢測缺失位置的方法,其包括以下步驟 (a)提供交聯(lián)DNA的樣品; (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA; (c)連接交聯(lián)的核苷酸序列; (d)解除交聯(lián); (e)用第二限制性內(nèi)切酶消化核苷酸序列; (f)環(huán)化核苷酸序列; (g)擴增與靶核苷酸序列相連的一個或多個序列; (h)任選將擴增的核苷酸序列與陣列雜交; (i)確定DNA序列間相互作用的頻率;和 (j)將DNA序列間相互作用的頻率與對照的相互作用頻率比較; 其中樣品的DNA-DNA相互作用頻率相對于對照的相互作用頻率減少指示缺失。
      61.檢測重復的位置的方法,其包括以下步驟 (a)提供交聯(lián)DNA的樣品; (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA; (c)連接交聯(lián)的核苷酸序列; (d)解除交聯(lián); (e)用第二限制性內(nèi)切酶消化核苷酸序列; (f)環(huán)化核苷酸序列; (g)擴增與靶核苷酸序列相連的一個或多個序列; (h)任選將擴增的核苷酸序列與陣列雜交; (i)確定DNA序列間相互作用的頻率;和 (j)將DNA序列間相互作用的頻率與對照的比較; 其中受試者樣品的DNA-DNA相互作用頻率相對于對照的DNA-DNA相互作用頻率增加或減少指示重復或插入。
      62.由或可由段落57所述的測試方法得到的試劑。
      63.段落1-9之任一段所述的核苷酸序列用于鑒定樣品中一種或多種DNA-DNA相互作用的用途。
      64.段落1-9之任一段所述的核苷酸序列用于診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的用途。
      65.段落18所述的探針陣列或段落19-30或33之任一段所述的探針組用于鑒定樣品中一種或多種DNA-DNA相互作用的用途。
      66.段落18所述的探針陣列或段落19-30或33之任一段所述的探針組用于診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的用途。
      67.段落34-39或42之任一段所述的陣列用于鑒定樣品中一種或多種DNA-DNA相互作用的用途。
      68.段落34-39或42之任一段所述的陣列用于診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的用途。
      69.段落64、66或68之任一段所述的用途,其中診斷或預測是產(chǎn)前診斷或預測。
      70.基本如本文所述的并參考實施例或附圖之任一段的方法。
      71.基本如本文所述的并參考實施例或附圖之任意的探針陣列。
      72.基本如本文所述的并參考實施例或附圖之任意的探針組。
      73.基本如本文所述的并參考實施例或附圖之任意的方法。
      74.基本如本文所述的并參考實施例或附圖之任意的陣列。
      75.基本如本文所述的并參考實施例或附圖之任意的測試方法。
      76.基本如本文所述的并參考實施例或附圖之任意的試劑。
      77.基本如本文所述的并參考實施例或附圖之任意的用途。
      表2
      參考文獻
      Blanton J,Gaszner M,Schedl P.2003.Proteinprotein interactions and thepairing of boundary elements in vivo.Genes Dev 17664-75.
      Dekker,J.,Rippe,K.,Dekker,M.,和Kleckner,N.2002.Capturingchromosome conformation.Science 2951306-11.
      Drissen R,Palstra RJ,Gillemans N,Splinter E,Grosveld F,Philipsen S,deLaat W.2004.The active spatial organization of the beta-globin locus requiresthe transcription factor EKLF.Genes Dev 182485-90.
      Horike S,Cai S,Miyano M,Cheng JF,Kohwi-Shigematsu T.2005.Loss ofsilent-chromatin looping and impaired imprinting of DLX5 in Rett syndrome.Nat Genet 373l-40.
      Murrell A,Heeson S,Reik W.2004.Interaction between differentiallymethylated regions partitions the imprinted genes Igf2 and H19 intoparent-specific chromatin loops.Nat Genet 36889-93.
      Palstra,R.J.,Tolhuis,B.,Splinter,E.,Nijmeijer,R.,Grosveld,F(xiàn).,and deLaat,W.2003.The beta-globin nuclear compartment in development anderythroid differentiation.Nat Genet 35190-4.
      Patrinos,G.P.,de Krom,M.,de Boer,E.,Langeveld,A.,Imam,A.M.A,Strouboulis,J.,de Laat,W.,and Grosveld,F(xiàn).G.(2004).Multiple interactionsbetween regulatory regions are required to stabilize an active chromatin hub.Genes&Dev.181495-1509.
      Spilianakis CG,F(xiàn)lavell RA.2004.Long-range intrachromosomalinteractions in the T helper type 2 cytokine locus.Nat Immunol 51017-27.
      Tolhuis,B.,Palstra,R.J.,Splinter,E.,Grosveld,F(xiàn).,和de Laat,W.2002.Looping and interaction between hypersensitive sites in the active beta-globinlocus.Molecular Cell 101453-65.
      Vakoc CR,Letting DL,Gheldof N,Sawado T,Bender MA,Groudine M,Weiss MJ,Dekker J,Blobel GA.2005.Proximity among distant regulatoryelements at the beta-globin locus requires GATA-1 and FOG-1.Mol Cell.17453-62 以上說明書所述的所有公開文獻都納入本文參考。在不偏離本發(fā)明范圍和精神的情況下,所述的本發(fā)明方法和系統(tǒng)的各種修改和變型對于所述領域技術人員來說是顯然的。盡管本發(fā)明聯(lián)系特別優(yōu)選的具體實施方式
      來描述,但是應當理解,本發(fā)明所要求保護的內(nèi)容不應被不正當?shù)鼐窒抻谶@些特定具體實施方式
      中。事實上,所述對分子生物學或相關領域技術人員顯而易見的執(zhí)行本發(fā)明的模式的各種修改也要在以下權利要求的范圍內(nèi)。
      權利要求
      1.分析靶核苷酸序列與一個或多個目的核苷酸序列(如一個或多個基因組基因座)相互作用的頻率的方法,其包括以下步驟
      (a)提供交聯(lián)DNA的樣品;
      (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA;
      (c)連接交聯(lián)的核苷酸序列;
      (d)解除交聯(lián);
      (e)用第二限制性內(nèi)切酶消化核苷酸序列;
      (f)將核苷酸組成已知的一個或多個DNA序列與在一個或多個目的核苷酸序列側翼的可用的一個或多個第二限制性內(nèi)切酶消化位點連接;
      (g)利用至少兩個寡核苷酸引物擴增一個或多個目的核苷酸序列,其中每個引物與目的核苷酸序列例翼的DNA序列雜交;
      (h)將一個或多個被擴增的序列與陣列雜交;并
      (i)確定DNA序列間相互作用的頻率。
      2.根據(jù)權利要求1所述的方法,其中步驟(f)中的連接反應導致DNA環(huán)的形成。
      3.根據(jù)權利要求1或權利要求2所述的方法,其中靶核苷酸序列選自由基因組重排、啟動子、增強子、沉默子、隔離子、基質附著區(qū)、基因座控制區(qū)、轉錄單位、復制起始點、重組熱點、易位斷點、著絲粒、端粒、基因密集區(qū)、基因稀少區(qū)、重復元件和(病毒)整合位點組成的組。
      4.根據(jù)前述權利要求之任一項所述的方法,其中靶核苷酸序列是與疾病相關的或造成疾病的核苷酸序列,或在來自與疾病相關的或造成疾病的基因座的線性DNA模板上占據(jù)多至15Mb或大于15Mb。
      5.根據(jù)前述權利要求之任一項所述的方法,其中靶核苷酸序列選自由AML1,MLL,MYC,BCL,BCR,ABL1,IGH,LYL1,TAL1,TAL2,LMO2,TCRα/δ,TCRβ和HOX或其他與疾病相關的基因座組成的組,所述其他與疾病相關的基因座描述于“Catalogue of Unbalanced ChromosomeAberrations in Man”第2版.Albert Schinzel.柏林Walter de Gruyter,2001.ISBN 3-11-011607-3中。
      6.根據(jù)前述權利要求之任一項所述的方法,其中第一限制性內(nèi)切酶是識別6-8bp識別位點的限制性內(nèi)切酶。
      7.根據(jù)權利要求6所述的方法,其中第一限制性內(nèi)切酶選自由BglII、HindIII、EcoRI、BamHI、SpeI、PstI和NdeI組成的組。
      8.根據(jù)前述權利要求之任一項所述的方法,其中第二限制性內(nèi)切酶是識別4或5bp核苷酸序列識別位點的限制性內(nèi)切酶。
      9.根據(jù)前述權利要求之任一項所述的方法,其中第二限制性內(nèi)切酶識別位點在靶核苷酸序列中位于與第一限制酶位點相距大于約350bp處。
      10.根據(jù)前述權利要求之任一項所述的方法,其中將核苷酸序列進行標記。
      11.分析靶核苷酸序列與一個或多個核苷酸序列(如一個或多個基因組基因座)相互作用的頻率的方法,其包括以下步驟
      (a)提供交聯(lián)DNA的樣品;
      (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA;
      (c)連接交聯(lián)的核苷酸序列;
      (d)解除交聯(lián);
      (e)用第二限制性內(nèi)切酶消化核苷酸序列;
      (f)環(huán)化核苷酸序列;
      (g)擴增與靶核苷酸序列連接的一個或多個核苷酸序列;
      (h)任選將擴增的序列與陣列雜交;并
      (i)確定DNA序列間相互作用的頻率。
      12.環(huán)化的核苷酸序列,其包含第一和第二核苷酸序列,其中第一和第二核苷酸序列的每個末端由不同的限制性內(nèi)切酶識別位點分隔,而且其中所述第一核苷酸序列是靶核苷酸序列并且所述第二核苷酸序列是由交聯(lián)基因組DNA而獲得的。
      13.制備環(huán)化的核苷酸序列的方法,其包括以下步驟
      (a)提供交聯(lián)DNA的樣品;
      (b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA;
      (c)連接交聯(lián)的核苷酸序列;
      (d)解除交聯(lián);
      (e)用第二限制性內(nèi)切酶消化核苷酸序列;和
      (f)環(huán)化核苷酸序列。
      14.分析靶核苷酸序列與一個或多個核苷酸序列(如一個或多個基因組基因座)相互作用的頻率的方法,其包括使用根據(jù)權利要求12所述的核苷酸序列。
      15.固定于支持物上的探針陣列,其包括與根據(jù)權利要求12所述的核苷酸序列雜交或能與所述核苷酸序列雜交的一個或多個探針。
      16.探針組,所述探針在序列上與基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點相鄰的核酸序列互補。
      17.根據(jù)權利要求16所述的探針組,其中探針在序列上與基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點的每一側相鄰的核酸序列互補。
      18.根據(jù)權利要求16或權利要求17所述的探針組,其中所述探針在序列上與和基因組DNA中第一限制性內(nèi)切酶的第一限制性內(nèi)切酶識別位點之每一個相距小于300個堿基對的核酸序列互補。
      19.根據(jù)權利要求16-18之任一項所述的探針組,其中所述探針與和基因組DNA中第一限制性內(nèi)切酶的第一限制性內(nèi)切酶識別位點之每一個相距小于300bp的序列互補。
      20.根據(jù)權利要求16-19之任一項所述的探針組,其中探針和與基因組DNA中第一限制性內(nèi)切酶的第一限制性內(nèi)切酶識別位點之每一個相距200-300bp的序列互補。
      21.根據(jù)權利要求16-20之任一項所述的探針組,其中探針與和基因組DNA中第一限制性內(nèi)切酶的第一限制性內(nèi)切酶識別位點之每一個相距100-200bp、或0-100bp的序列互補。
      22.根據(jù)權利要求16-21之任一項所述的探針組,其中兩種或多種探針能夠與基因組DNA中第一限制性內(nèi)切酶的每個第一限制性內(nèi)切酶識別位點相鄰的序列雜交。
      23.根據(jù)權利要求22所述的探針組,其中探針重疊或部分重疊。
      24.權利要求23的探針,其中重疊少于10個核苷酸。
      25.根據(jù)權利要求16-24之任一項所述的探針組,其中探針序列對應于第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點與第二限制性內(nèi)切酶的每一個第一相鄰的第二限制性內(nèi)切酶識別位點之間的所有或部分序列。
      26.根據(jù)權利要求16-25之任一項所述的探針組,其中每種探針至少是25聚體。
      27.根據(jù)權利要求16-26之任一項所述的探針組,其中每種探針是25-60聚體。
      28.制備探針組的方法,其包括以下步驟
      (a)鑒定基因組DNA中第一限制性內(nèi)切酶的每一個第一限制性內(nèi)切酶識別位點;
      (b)設計探針,所述探針能夠與基因組DNA中每一個第一限制性內(nèi)切酶識別位點的相鄰序列雜交;
      (c)合成探針;和
      (d)將探針組合在一起以形成探針組或基本上形成探針組。
      29.根據(jù)權利要求28所述的方法,其中探針是PCR擴增產(chǎn)物。
      30.由或可由根據(jù)權利要求28或權利要求20所述的方法得到的探針組或基本上得到的探針組。
      31.陣列,其包括根據(jù)權利要求15所述的探針陣列或基本上包含根據(jù)權利要求16-27或30之任一項所述的探針組。
      32.陣列,其包括根據(jù)權利要求16-27或30之任一項所述的探針組。
      33.根據(jù)權利要求32或權利要求32所述的陣列,其中所述陣列包括約300,000-400,000個探針。
      34.根據(jù)權利要求32-33之任一項所述的陣列,其中陣列包括約385,000或更多個探針,優(yōu)選約750,000個探針,更優(yōu)選6×750,000個探針。
      35.根據(jù)權利要求31-34之任一項所述的陣列,其中陣列包括給定物種完整基因組的較低解析度的代表或由所述代表組成。
      36.根據(jù)權利要求35所述的陣列,其中所述陣列中包含按序排列在線性染色體模板上的每2、3、4、5、6、7,8、9或10個探針中的一個探針。
      37.制備陣列的方法,其包括將根據(jù)權利要求15所述的探針陣列基本上固定于固相支持物上或將根據(jù)權利要求16-27或30之任一項所述的探針組基本上固定在固相支持物上的步驟。
      38.制備陣列的方法,其包括將根據(jù)權利要求16所述的探針陣列或根據(jù)權利要求16-27或30之任一項所述的探針組固定在固相支持物上的步驟。
      39.由或可由根據(jù)權利要求37或權利要求3 8所述的方法得到的陣列。
      40.鑒定一種或多種對特定疾病狀態(tài)起指示作用的DNA-DNA相互作用的方法,其包括執(zhí)行權利要求1-11步驟(a)-(i)的步驟,其中由患病和未患病的細胞提供步驟(a)中交聯(lián)DNA的樣品,而且其中來自患病和未患病的細胞的DNA序列間相互作用的頻率差異表明該DNA-DNA相互作用指示特定疾病狀態(tài)。
      41.診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的方法,其包括執(zhí)行權利要求1-11之任一項的步驟(a)-(i)的步驟,其中步驟(a)包括提供來自受試者的交聯(lián)的DNA樣品;而且其中步驟(i)包括將DNA序列間相互作用的頻率與未受影響的對照進行比較;其中得自對照的值和得自受試者的值之間的差異指示受試者正罹患所述疾病或綜合征或指示受試者將罹患所述疾病或綜合征。
      42.根據(jù)權利要求41所述的方法,其中相互作用頻率從低向高轉變指示平衡的和/或不平衡的斷點的位置。
      43.根據(jù)權利要求41所述的方法,其中受試者樣品的DNA-DNA相互作用頻率相對于對照呈倒轉模式指示平衡的和/或不平衡的倒位。
      44.根據(jù)權利要求41所述的方法,其中受試者樣品的DNA-DNA相互作用頻率相對于對照的降低與更遠區(qū)域的DNA-DNA相互作用頻率的增加的組合指示平衡的和/或不平衡的缺失。
      45.根據(jù)權利要求41所述的方法,其中受試者樣品的DNA-DNA相互作用頻率相對于對照的增加或減少指示平衡的和/或不平衡的重復或插入。
      46.根據(jù)權利要求41-45之任一項所述的方法,其中在進行所述方法前使用光譜核型分析和/或FISH。
      47.根據(jù)權利要求41-46之任一項所述的方法,其中所述疾病是遺傳疾病。
      48.根據(jù)權利要求41-47之任一項所述的方法,其中所述疾病是癌癥。
      49.診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的方法,其包括以下步驟進行權利要求1-11之任一項的步驟(a)-(i),其中步驟(a)包括提供來自受試者的交聯(lián)DNA的樣品;而且其中所述方法包括額外步驟(j)鑒定一個或多個經(jīng)歷與疾病相關的基因組重排的基因座。
      50.根據(jù)權利要求49所述的方法,其中將兩個或多個被擴增的序列進行不同標記。
      51.根據(jù)權利要求49所述的方法,其中當兩個或多個被擴增的序列位于不同染色體上時,將所述序列進行相同的標記。
      52.根據(jù)權利要求49所述的方法,其中當兩個或多個被擴增的序列位于相同染色體上、其距離足夠遠以使得DNA-DNA相互作用信號間的重疊最小時,將這些被擴增的序列進行相同的標記。
      53.鑒定一種或多種調節(jié)DNA-DNA相互作用的試劑的測試方法,其包括以下步驟
      (a)將樣品與一種或多種試劑接觸;和
      (b)進行權利要求1-11之任一項的步驟(a)至(i),其中步驟(a)包括由樣品提供交聯(lián)的DNA;
      其中(i)在存在試劑的情況下的DNA序列間相互作用的頻率和(ii)在試劑不存在的情況下的DNA序列間相互作用的頻率之間的差異指示試劑能調節(jié)DNA-DNA相互作用。
      54.檢測平衡的和/或不平衡的斷點(如易位)的位置的方法,其包括以下步驟
      (a)進行權利要求1-11之任一項的步驟(a)至(i);和
      (b)將DNA序列間相互作用的頻率與對照的頻率進行比較;
      其中樣品中DNA-DNA相互作用頻率相對于對照從低至高的轉變指示斷點的位置。
      55.檢測平衡的和/或不平衡的倒位的位置的方法,其包括以下步驟
      (a)進行權利要求1-11之任一項的步驟(a)至(i);和
      (b)將DNA序列間相互作用的頻率與對照的頻率進行比較;
      其中樣品相對于對照的DNA-DNA相互作用頻率的倒轉模式指示倒位。
      56.檢測缺失位置的方法,其包括以下步驟
      (a)進行權利要求1-11之任一項的步驟(a)至(i);和
      (b)將DNA序列間相互作用的頻率與對照的頻率進行比較;
      其中樣品相對于對照的DNA-DNA相互作用頻率的降低指示缺失。
      57.檢測發(fā)生重復的位置的方法,其包括以下步驟
      (a)進行權利要求1-11之任一項的步驟(a)至(i);和
      (b)將DNA序列間相互作用的頻率與對照的頻率進行比較;
      其中受試者的DNA-DNA相互作用頻率相對于對照增加或減少指示重復或插入。
      58.由或可由根據(jù)權利要求53所述的測試方法得到的試劑。
      59.根據(jù)權利要求12所述的核苷酸序列用于鑒定樣品中一種或多種DNA-DNA相互作用的用途。
      60.根據(jù)權利要求12所述的核苷酸序列用于診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的用途。
      61.根據(jù)權利要求15所述的探針陣列或根據(jù)權利要求16-27或30之任一項所述的探針組用于鑒定樣品中一種或多種DNA-DNA相互作用的用途。
      62.根據(jù)權利要求15所述的探針陣列或根據(jù)權利要求16-27或30之任一項所述的探針組用于診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的用途。
      63.根據(jù)權利要求31-36或39之任一項所述的陣列用于鑒定樣品中一種或多種DNA-DNA相互作用的用途。
      64.根據(jù)權利要求31-36或39之任一項所述的陣列用于診斷或預測由DNA-DNA相互作用變化造成的或與DNA-DNA相互作用變化相關的疾病或綜合征的用途。
      65.根據(jù)權利要求61、63或65之任一項所述的用途,其中所述診斷或預測是產(chǎn)前診斷或預測。
      66.基本上如本文所述的和參考任一實施例或附圖的方法、探針陣列、探針組、過程、陣列、測試方法、試劑、或用途。
      全文摘要
      本發(fā)明的一個方面涉及分析靶核苷酸序列與一個或多個目的核苷酸序列(如一個或多個基因組基因座)相互作用的頻率的方法,其包括如下步驟(a)提供交聯(lián)的DNA樣品;(b)用第一限制性內(nèi)切酶消化交聯(lián)的DNA;(c)連接交聯(lián)的核苷酸序列;(d)解除交聯(lián);(e)用第二限制性內(nèi)切酶消化核苷酸序列;(f)將已知核苷酸組成的一個或多個DNA序列與在一個或多個目的核苷酸序列側翼的可用的第二限制性內(nèi)切酶消化位點連接;(g)利用至少兩個寡核苷酸引物擴增一個或多個目的核苷酸序列,其中每個引物與在目的核苷酸序列側翼的DNA序列雜交;(h)將擴增的一個或多個序列與陣列雜交;和(i)確定DNA序列間相互作用的頻率。
      文檔編號C12Q1/68GK101238225SQ200680028794
      公開日2008年8月6日 申請日期2006年7月3日 優(yōu)先權日2005年7月4日
      發(fā)明者沃特·德拉特, 弗蘭克·格羅斯維爾德 申請人:伊拉茲馬斯大學醫(yī)療中心
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1