專利名稱:用于通過(guò)轉(zhuǎn)座酶的dna片段化和標(biāo)記的方法和組合物的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及分子生物學(xué)領(lǐng)域。更具體地,本發(fā)明涉及使用轉(zhuǎn)座酶切割DNA分子并通過(guò)用感興趣的預(yù)選擇的序列標(biāo)記分子來(lái)制備用于分析的切割的DNA分子的方法和組合物。尤其,本發(fā)明涉及核酸體外擴(kuò)增、核酸測(cè)序和對(duì)感興趣的序列進(jìn)行DNA文庫(kù)篩選的領(lǐng)域。
相關(guān)技術(shù)描述基因組DNA的片段化是在用于高通量測(cè)序的DNA樣品制備中的關(guān)鍵步驟。傳統(tǒng)使用的方法,例如使用DNase I的DNA片段化是非常不可靠的并通常導(dǎo)致DNA片段化不充分或者太昂貴。在任一情況中,有用尺寸(大約200-800個(gè)堿基對(duì)(bp))的DNA片段的產(chǎn)率都較低。該難點(diǎn)已通過(guò)使用寡核苷酸-轉(zhuǎn)座酶復(fù)合體(例如來(lái)自Epicentre的NEXTERA 體系)控制DNA片段化來(lái)克服。此類復(fù)合體包含經(jīng)修飾的Tn5轉(zhuǎn)座酶的二聚物和含有19bp的轉(zhuǎn)座酶-結(jié)合序列或反向重復(fù)序列(IR)的一對(duì)Tn-5結(jié)合雙鏈DNA(dsDNA)寡核苷酸。在NEXTERA 體系中,使用了經(jīng)工程改造的、非天然的19bp轉(zhuǎn)座酶結(jié)合序列,其比天然Tn5IR序列提供了更有效的DNA片段化。該結(jié)合序列被稱為“嵌合體”。不同于能靠單分子在靶標(biāo)DNA中產(chǎn)生很多斷裂的DNase,轉(zhuǎn)座酶復(fù)合體被認(rèn)為每個(gè)復(fù)合體僅產(chǎn)生一個(gè)DNA切割。因此,不同于使用DNaseI,DNA片段化的程度在轉(zhuǎn)座酶片段化期間容易被控制。而且,與嵌合體序列結(jié)合的特異性核苷酸標(biāo)記在該轉(zhuǎn)座酶-介導(dǎo)的DNA片段化過(guò)程中可被附著,這對(duì)于PCR中的DNA擴(kuò)增和將DNA片段附著至測(cè)序芯片是有用的。典型地,Mg(II)離子(本文中也稱作Mg+2或Mg2+)被用作展示DNA片段化活性的酶的輔因子。這不是令人吃驚地,因?yàn)橥ㄟ^(guò)測(cè)驗(yàn)存在不同的金屬離子時(shí)雙螺旋DNA的融解溫度,已確定對(duì)磷酸鹽締合的偏好被發(fā)現(xiàn)以Mg (I I) > Co (II) > Ni (II) > Mn (II) > Zn(II)> Cd(II) > Cu(II)的順序減小。過(guò)渡金屬?gòu)?fù)合體與多核苷酸的反應(yīng)通常落在以下兩類中(i)包括介導(dǎo)核酸氧化的金屬?gòu)?fù)合體的氧化還原反應(yīng)的那些反應(yīng);和(ii)包括使金屬中心與糖-磷酸鹽骨架配位以介導(dǎo)聚合物水解的那些反應(yīng)。雖然Mg(II)是最強(qiáng)的結(jié)合劑,但未必是最優(yōu)的輔因子。酶促DNA切割可被許多參數(shù)影響,特別是被依賴于與DNA結(jié)合的金屬離子的性質(zhì)的DNA構(gòu)象影響。而且,具體的金屬離子與酶本身的結(jié)合可影響蛋白構(gòu)象、蛋白-蛋白相互作用(例如可能影響活性的蛋白二聚作用);和蛋白-核酸相互作用,即,調(diào)節(jié)反應(yīng)速度和和DNA切割特異性。迄今為止,已知適于DNA片段化和標(biāo)記的僅有的轉(zhuǎn)座酶是經(jīng)修飾的Tn5轉(zhuǎn)座酶。從一開始,Tn5轉(zhuǎn)座酶在若干方面有問(wèn)題。首先,天然轉(zhuǎn)座酶實(shí)際上是不可能產(chǎn)生的,因?yàn)楫?dāng)從強(qiáng)啟動(dòng)子表達(dá)時(shí),其對(duì)E. coli是有毒性的。但是,通過(guò)刪除若干N-末端氨基酸來(lái)克服該難點(diǎn)是可能的(Weinreich et al. , J. Bacterial, 176 :5494-5504,1994)。雖然這解決了毒性問(wèn)題,并且N-末端截短的轉(zhuǎn)座酶被以高產(chǎn)率生產(chǎn),但其具有非常低的活性。因此,若干其他突變被引入,以增大其活性(U.S. Patent 5, 965, 443 ;U. S. Patent 6,406,896B
I;U. S. Patent 7,608,434)。但是,這不會(huì)解決所有的問(wèn)題。突變酶僅在高鹽(例如0. 7MNaCl)中是穩(wěn)定的(Steiniger et al. , Nucl. Acids Res.,34 :2820_2832,2006),但在轉(zhuǎn)座酶反應(yīng)所需的低鹽條件下快速損失其活性,在反應(yīng)混合物中具有僅僅2. 4min的半衰期。因而,使用該轉(zhuǎn)座酶的DNA片段化反應(yīng)典型地在5分鐘內(nèi)進(jìn)行,并使用了非常大的量的酶。盡管事實(shí)上整個(gè)純化過(guò)程保持了高鹽濃度,但純化的酶大量失活;因而,超過(guò)核苷酸9. 4倍過(guò)量的酶典型地被用來(lái)形成Tn5轉(zhuǎn)座酶-寡核苷酸復(fù)合體(Na umann and Reznikoff, J. Bioi.Chem. ,277 :17623-17629,2002)。另外,轉(zhuǎn)座酶容易蛋白水解降解。因此,有降解傾向的位點(diǎn)被突變。令人感興趣地,這些突變導(dǎo)致體內(nèi)活性的劇烈降低,但對(duì)體外活性幾乎沒(méi)有影響(Twining et al.,J. Bioi. Chem.,276 :23135-23143, 2001)??傊琓n5 轉(zhuǎn)座酶難于生產(chǎn),其被大量需要并且其非常昂貴。
發(fā)明內(nèi)容
本發(fā)明改進(jìn)了使用轉(zhuǎn)座酶的DNA片段化和標(biāo)記的現(xiàn)有技術(shù)。在實(shí)施方式中,本發(fā)明提供新的反應(yīng)條件,其包括錳離子代替鎂離子,用于轉(zhuǎn)座酶-介導(dǎo)的靶標(biāo)核酸的切割和伴隨的產(chǎn)生的DNA片段的標(biāo)記。本發(fā)明因而將轉(zhuǎn)座酶反應(yīng)條件放寬至包括鎂離子、錳離子或二者都包括。優(yōu)選地,反應(yīng)條件還包括相對(duì)低的堿性金屬離子(例如鉀離子)濃度。產(chǎn)生的標(biāo)記的DNA片段在許多分子生物學(xué)應(yīng)用領(lǐng)域有用,包括但不限于下一代測(cè)序、聚合酶鏈?zhǔn)椒磻?yīng)(PCR)技術(shù)以及基因克隆和基因組分析。使用本文公開的反應(yīng)條件,天然轉(zhuǎn)座酶(即,具有不是不同于在自然中發(fā)現(xiàn)的氨基酸序列的氨基酸序列的轉(zhuǎn)座酶;例如,非重組的)以及經(jīng)修飾的轉(zhuǎn)座酶(即,具有不同于在自然中發(fā)現(xiàn)的氨基酸序列的氨基酸序列的轉(zhuǎn)座酶;例如,重組的)可在相對(duì)低的濃度和相對(duì)短的反應(yīng)時(shí)間下用于體外DNA片段化和標(biāo)記。天然轉(zhuǎn)座酶可從天然或重組宿主中獲得,而經(jīng)修飾的轉(zhuǎn)座酶僅可從重組宿主中獲得。所述反應(yīng)條件因而提供了優(yōu)于當(dāng)前技術(shù)的改進(jìn)。本發(fā)明還對(duì)制備DNA底物用于下一代測(cè)序的現(xiàn)有技術(shù)進(jìn)行改進(jìn)。本發(fā)明提供制備此類DNA底物的新方法將產(chǎn)生的、連有用于DNA片段擴(kuò)增的單獨(dú)標(biāo)記的引物的每一 DNA片段摻入兩種不同的轉(zhuǎn)座酶識(shí)別序列。所述方法允許僅使用兩條引物來(lái)制備標(biāo)記產(chǎn)物。在第一方面中,本發(fā)明提供了組合物,優(yōu)選地,水性組合物,其包含轉(zhuǎn)座酶和在從約ImM至約IOOmM或者甚至更高的濃度下的錳離子(Mn(II))。已令人吃驚地發(fā)現(xiàn),較之使用典型地用在Tn5轉(zhuǎn)座酶反應(yīng)中的鎂離子(Mg (I I)),使用在這些濃度下的Mn (I I)離子提供了優(yōu)良的轉(zhuǎn)座酶-介導(dǎo)的切割活性。但是,在本發(fā)明使用的條件下,鎂離子可單獨(dú)使用或與錳離子組合使用,以提供相對(duì)于使用含有MG(II)的反應(yīng)組合物的現(xiàn)有技術(shù)的更優(yōu)良的結(jié)果。的確,所述發(fā)現(xiàn)與轉(zhuǎn)座酶的最佳活性在含有Mg+2的組合物中發(fā)現(xiàn)的本領(lǐng)域流行的觀念相反(見,例如,www. epibio. com/item, asp id+292,其指出Tn5轉(zhuǎn)座酶復(fù)合體在無(wú)Mg+2時(shí)無(wú)活性,而存在相對(duì)低的水平下的Mg+2時(shí),有活性)。在優(yōu)選的實(shí)施方式中,Mn(II)濃度、Mg(II)濃度或二者的濃度范圍從約5mM至約40mM,例如從IOmM至約20mM。兩種離子都存在時(shí)每種的濃度范圍可從約ImM至約IOOOmM每種,例如從約5mM至約40mM,包括約IOmM至約20mM。通過(guò)發(fā)明人獲得的數(shù)據(jù)顯示這些濃度范圍對(duì)人DNA和\噬菌體DNA 二者的片段化都同樣適合。因而,看來(lái)在根據(jù)本發(fā)明的轉(zhuǎn)座酶反應(yīng)混合物中的Mn+2離子、Mg+2或二者的有優(yōu)勢(shì)的使用不限于特定類型的DNA的切割,而是相對(duì)廣泛地可應(yīng)用的。當(dāng)然本領(lǐng)域技術(shù)人員會(huì)直接意識(shí)到在所公開范圍內(nèi)的Mn+2和Mg+2離子濃度的每個(gè)具體的值都被本發(fā)明所預(yù)見,而不需要特別列舉各個(gè)值和每一值。雖然各個(gè)值被包括作為本發(fā)明的一部分,為簡(jiǎn)潔起見,省略了值的詳盡列表。此概念可被應(yīng)用至本文公開的所有值的所有范圍令人感興趣地和更令人感興趣地,已發(fā)現(xiàn),Mn+2和Mg+2濃度或二者的組合的相對(duì)寬的范圍,例如每種或總共從約ImM至約IOOmM,降低了轉(zhuǎn)座酶的序列特異性。降低的序 列特異性對(duì)用來(lái)產(chǎn)生用于下一代測(cè)序的DNA片段的轉(zhuǎn)座酶來(lái)而言是一個(gè)重要的特征。在優(yōu)選的實(shí)施方式中,不是Mn+2和Mg+2的鹽,例如堿性金屬鹽(例如K+或Na+谷氨酸鹽)的濃度是相對(duì)低的,例如在約50mM或更小的濃度下。被廣泛接受的是,不是鎂離子鹽的鹽,例如鉀離子(K+),有利地被包括在轉(zhuǎn)座酶反應(yīng)混合物中。已令人吃驚地發(fā)現(xiàn),通過(guò)限制轉(zhuǎn)座酶反應(yīng)混合物中鉀離子的量可進(jìn)一步改進(jìn)轉(zhuǎn)座酶活性。該結(jié)果可被應(yīng)用于其他非-鎂離子鹽。該結(jié)果也是出人意料的,因?yàn)榘l(fā)明人沒(méi)有發(fā)覺報(bào)道在低鉀離子組合物中改進(jìn)轉(zhuǎn)座酶活性的任何研究。較之在Tn5反應(yīng)中典型地使用的較高的鉀離子濃度(為75mM至IOOmM),所述令人吃驚的發(fā)現(xiàn)改進(jìn)了轉(zhuǎn)座酶-介導(dǎo)的切割活性。在示例性實(shí)施方式中,組合物中的非-鎂或非-錳鹽(例如,鉀離子)濃度為約40mM或更小,例如約35mM或更小。優(yōu)選地,該離子濃度為約25mM ;然而,在某些實(shí)施方式中,其濃度小于25mM,例如25mM至ImM或小于ImM。使用本文中的其他濃度或范圍的公開時(shí),技術(shù)人員應(yīng)意識(shí)到本發(fā)明包括在所陳述范圍內(nèi)的這些離子濃度的每個(gè)具體的值。用于本發(fā)明的組合物(和方法)的轉(zhuǎn)座酶可以是具有轉(zhuǎn)座酶活性的任何蛋白。其可以是天然存在的轉(zhuǎn)座酶或重組轉(zhuǎn)座酶。優(yōu)選地,轉(zhuǎn)座酶至少某種程度上從其天然環(huán)境(即,細(xì)胞核或細(xì)胞漿)中分離或純化。對(duì)于重組產(chǎn)生的轉(zhuǎn)座酶,優(yōu)選地,重組轉(zhuǎn)座酶至少某種程度上從重組宿主環(huán)境(即,細(xì)胞核或細(xì)胞漿)中分離或純化。最優(yōu)選地,在包含于本發(fā)明的組合物之前,除去其他細(xì)胞組分,轉(zhuǎn)座酶被純化至90%或更高的水平。優(yōu)選地,轉(zhuǎn)座酶是約95 %或更高的純度水平,例如約98 %純,約99 %純,或高于99 %純?;谟糜跍y(cè)定純度的常用技術(shù),例如通過(guò)蛋白凝膠的考馬斯亮藍(lán)染色、蛋白凝膠的銀染、HPLC或其他檢測(cè)樣品中的蛋白的靈敏技術(shù)來(lái)測(cè)定純度。能使用天然存在的轉(zhuǎn)座酶是本領(lǐng)域中優(yōu)于可用的其他體系的一個(gè)明顯的優(yōu)勢(shì),因?yàn)檫@是下述反應(yīng)條件的第一次公開,在所述反應(yīng)條件下天然存在的轉(zhuǎn)座酶在適于商業(yè)化的DNA片段化和標(biāo)記的水平下在體外是有活性的。在示例性實(shí)施方式中,轉(zhuǎn)座酶是轉(zhuǎn)座酶的IS4家族的成員,例如在Vibrio種中天然發(fā)現(xiàn)的一種,包括但不限于 Vibrio harveyi。本發(fā)明的示例性實(shí)施方式涉及Vibrio harveyi轉(zhuǎn)座酶。該酶通過(guò)搜索公用數(shù)據(jù)庫(kù)發(fā)現(xiàn)。基于作為編碼未知功能的假定蛋白的開放閱讀框的潛在核酸的計(jì)算機(jī)翻譯,其先前在本領(lǐng)域中被鑒定出。本發(fā)明人隨后從DNA表達(dá)了蛋白,純化了蛋白并鑒定其為轉(zhuǎn)座酶。就發(fā)明人的知識(shí)而言,這是這種假定蛋白的酶促活性的表達(dá)、純化和測(cè)定的第一次公開。天然存在的酶序列在NCBI/GenBank登記號(hào)YP_001446289下得到并具有如在AppendixA中指出的序列。如在本文中使用的,該酶有時(shí)被稱為“Vibhar”。本發(fā)明因而在實(shí)施方式中涉及Vibhar作為轉(zhuǎn)座酶的新穎用途。當(dāng)天然存在的Vibhar轉(zhuǎn)座酶在本文中被作為例子時(shí),應(yīng)當(dāng)理解其他天然存在的轉(zhuǎn)座酶被包括在本發(fā)明的范圍內(nèi)。此外,也包括得自天然存在的轉(zhuǎn)座酶而包括一個(gè)或多個(gè)氨基酸缺失、替換或添加的工程改造的轉(zhuǎn)座酶。應(yīng)當(dāng)理解,盡管修飾可能在某些方面改變特異性或活性,但對(duì)天然存在的轉(zhuǎn)座酶所做的這些修飾不會(huì)消除酶的轉(zhuǎn)座酶活性。參考基于轉(zhuǎn)座酶序列比對(duì)的轉(zhuǎn)座酶之間的保守序列,本領(lǐng)域技術(shù)人員可以意識(shí)到對(duì)本發(fā)明包括的各種轉(zhuǎn)座酶的功能而言重要的殘基。優(yōu)選地,工程改造的轉(zhuǎn)座酶與天然存在的轉(zhuǎn)座酶,優(yōu)選地與所述工程改造的酶來(lái)源的轉(zhuǎn)座酶,共有至少50%序列同一性。其他優(yōu)選的同一性水平包括至少60%、至少70%、至少80%、至少90%、至少95%、至少98%和至少99%。再者,本領(lǐng)域技術(shù)人員會(huì)立即意識(shí)到落在這些范圍內(nèi)的百分比同一性的所有具體的值都被本發(fā)明考慮,而不需要申請(qǐng)人在本文中特別列出所有值。例如,殘基D93、D193和E327(基于GenBank登記號(hào)YP_001446289. I的氨基酸序列的氨基酸編號(hào))是活性位點(diǎn)殘基。本領(lǐng)域技術(shù)人員會(huì)立即意識(shí)到,如果制造重組蛋白的 目的是保留酶促活性,應(yīng)當(dāng)保留這些殘基,但如果期望使酶失活或如果期望有改變活性的酶,應(yīng)當(dāng)以這些殘基為靶標(biāo)(例如,通過(guò)在一個(gè)或多個(gè)這些殘基上制造保守性改變或使三維外觀保守的改變)。而且,本領(lǐng)域技術(shù)人員會(huì)意識(shí)到,如果期望重組酶活性很少改變或沒(méi)有改變,下述殘基應(yīng)避免作為突變位點(diǎn),但如果期望改變活性,以這些殘基為靶標(biāo)W9、L19、D21、R23、R28、L29、A56、Y57、R58、N62、170、T78、T94、L108、G109、H124、L127、G137、Q141、R146、K165、E166、W170、R194、E195、D197、R206、R215、L229、R255、L299、L301、L302、P306、A313、Y320、R323、W324、H330、K334、G337、E341、R353、A362、R364、L386、L394、A413、L420、G422、K427、W438和G440。另外,本領(lǐng)域技術(shù)人員應(yīng)知道,保守的“YREK”(SEQ ID NO :1)基序(GenBank登記號(hào)YP_001446289. I的殘基320-334)的重要性,其參與在轉(zhuǎn)座酶的IS4家族的酶促活性;保守的“DDT”基序(GenBank登記號(hào)YP_001446289. I的殘基88-99)的重要性,其參與在轉(zhuǎn)座酶的IS4家族中的轉(zhuǎn)座酶與靶標(biāo)DNA磷酸鹽骨架的催化與接觸;和保守的 “DREAD” (SEQ ID NO 2)基序(GenBank 登記號(hào) YP_001446289. I 的殘基 193-197)的重要性,其參與靶標(biāo)和/或供體DNA結(jié)合。仍再者,本領(lǐng)域技術(shù)人員應(yīng)知道殘基W299的重要性,其牽涉酶的發(fā)夾切割機(jī)制。在制造重組轉(zhuǎn)座酶中就結(jié)構(gòu)-功能考慮而言的感興趣的其他殘基是被Reznikoff等人鑒定的多種殘基(Reznikoff, W. S. et al. , " ComparativeSequenec Analysis of IS50/TN5Transposase" , Journal of Bacteriology, Vol. 186,No. 24,Dec. 2004,p. 8240-8247),其全部通過(guò)引用并入本文??舍槍?duì)許多目的產(chǎn)生本發(fā)明的該方面的組合物,所述組合物不限于本文中特別討論的那些。示例性組合物是用于存儲(chǔ)轉(zhuǎn)座酶(有或沒(méi)有包含轉(zhuǎn)座酶的識(shí)別序列的核酸),用于切割或片段化靶標(biāo)DNA和用于切割和標(biāo)記靶標(biāo)DNA的那些。同樣地,組合物可包含含有轉(zhuǎn)座酶的識(shí)別序列的DNA分子。在特定組合物中的DNA分子可包含特定轉(zhuǎn)座酶的單一識(shí)別序列。不同的ds或ss DNA序列(標(biāo)記)被附著在轉(zhuǎn)座酶識(shí)別序列上,以允許PCR擴(kuò)增,產(chǎn)生的DNA片段附著在測(cè)序芯片,例如Illumina芯片(如本領(lǐng)域中已知的)上,并允許對(duì)靶標(biāo)DNA文庫(kù)的來(lái)源,例如Index序列鑒定。為可應(yīng)用至下一代測(cè)序的目的,下述是優(yōu)選的,大約一半的DNA片段末端用一種類型的標(biāo)記來(lái)標(biāo)記并且另一半用不同的標(biāo)記來(lái)標(biāo)記,而一種標(biāo)記被附著在靶標(biāo)DNA片段的一個(gè)末端,并且另一類型被附著在相反的末端,以允許DNA片段在兩個(gè)方向都閱讀。通過(guò)將兩種不同的轉(zhuǎn)座酶識(shí)別序列(即,在特定的組合物中DNA分子的一些(例如,約50%)包含轉(zhuǎn)座酶的第一識(shí)別序列,剩余的DNA分子包含不同的第二識(shí)別序列)組合,實(shí)現(xiàn)進(jìn)一步的改進(jìn)。識(shí)別序列可以是轉(zhuǎn)座酶的天然存在的序列,或可以是提供DNA分子的額外或備選功能的工程改造的序列。在示例性實(shí)施方式中,對(duì)于將被片段化的靶標(biāo)DNA的每一末端識(shí)別序列是相同的序列。在一些實(shí)施方式中,兩條序列是同一的或基本同一的,彼此具有至少90%(BP,90%-100% )序列同一性。在一些其他實(shí)施方式中,兩個(gè)序列是不同的,彼此具有小于90% ( S卩,89%或更小,最小約30% )的同一性。但是,下述是優(yōu)選的兩種識(shí)別序列都可以被用在連接它們中的轉(zhuǎn)座酶識(shí)別。在示例性實(shí)施方式中,識(shí)別序列是針對(duì) V. harveyi 的一種,并包含序列5 ' _ctgtctcttgatcacaagt_3 1 (SEQ ID NO :3);5' -acttgtgatcaagagacag-3' (SEQ ID NO :4) ;5' -agatgtgatcaagagacag-3' (SEQIDNO 5);或5' -ctgtctcttgatcacatct-3' (SEQ ID NO :6)。在一些實(shí)施方式中,第一識(shí)別序列、第二識(shí)別序列、或二者是包含SEQ ID NO :4、SEQ ID NO :5和/或SEQ ID NO 6的一條鏈的序列的雙鏈DNA序列。在一些實(shí)施方式中,第一識(shí)別序列包含一條鏈為SEQ ID NO: 4的序列,且第二識(shí)別序列是來(lái)自Vibrio harveyi的轉(zhuǎn)座酶的經(jīng)修飾的識(shí)別序列,其包含一條鏈為SEQ ID NO 5的序列。許多額外的物質(zhì)可被包括在本發(fā)明的該方面的組合物中。通常可通過(guò)組合物的應(yīng)用或?yàn)榱颂囟ㄞD(zhuǎn)座酶最優(yōu)活性的的具體需求規(guī)定多種額外的組分的同一性、數(shù)目和量。在一些實(shí)施方式中,組合物包含已與連接體(adaptor,或稱“接頭”)共價(jià)結(jié)合的切割的或片段化的靶標(biāo)DNA。此類DNA分子從轉(zhuǎn)座酶的作用中產(chǎn)生,所述轉(zhuǎn)座酶將含有(一個(gè)或多個(gè))轉(zhuǎn)座酶識(shí)別序列的DNA分子與靶標(biāo)DNA化學(xué)結(jié)合,導(dǎo)致初始靶標(biāo)DNA切割和在它們的末端具有轉(zhuǎn)座酶識(shí)別序列的DNA片段形成。在某些實(shí)施方式中,連接體/靶標(biāo)DNA分子還包含一條或多條引物,其與和引物雜交的一條或兩條鏈和/或單鏈的連接體/靶標(biāo)DNA分子雜交。引物適于用作擴(kuò)增或測(cè)序引物。在優(yōu)選的實(shí)施方式中,用于PCR擴(kuò)增的引物包括3'序列區(qū)域,所述3'序列區(qū)域包括(一個(gè)或多個(gè))轉(zhuǎn)座酶識(shí)別序列的一部分的序列。優(yōu)選地,這些引物包括5'序列,所述5'序列不包括(一個(gè)或多個(gè))轉(zhuǎn)座酶識(shí)別序列的一部分的序列。而且,下述是優(yōu)選的,一種或兩種(優(yōu)選地,兩種)包括允許從引物(多種)擴(kuò)增核酸的序列,從而包含允許擴(kuò)增的產(chǎn)物與固體支持物雜交用于測(cè)序的序列。如本文中使用的,此類序列有時(shí)被稱為“標(biāo)記”序列,用于附著至在芯片上的特異性寡核苷酸。優(yōu)選地,使用了兩種PCR擴(kuò)增引物,其在它們的5'區(qū)域中具有在兩條引物之間不同的序列;這些序列可作為連接體序列。在此類實(shí)施方式中,可實(shí)現(xiàn)針對(duì)靶標(biāo)DNA的擴(kuò)增或測(cè)序的高的特異性。優(yōu)選地,引物包括適于用作可檢測(cè)信號(hào)(例如用于“Illumina”檢測(cè)方案的標(biāo)記)的序列。在非常優(yōu)選的實(shí)施方式中,一條鏈的標(biāo)記不同于另一條鏈的標(biāo)記,導(dǎo)致具有獨(dú)特標(biāo)記符號(hào)的標(biāo)記核酸。在示例性實(shí)施方式中,引物包含序列5' -aatgatacggcgaccaccgagatctacacgctgacgtcgagacttgtga-3' (SEQ ID NO 7)—caagcagaagacggcatacgagatcggtggagctgtgcgtagatgtga-3' (SEQ ID NO :8)。本發(fā)明還提供了編碼本發(fā)明的轉(zhuǎn)座酶的核酸。一般而言,本發(fā)明的該方面涉及天然存在或工程改造的/重組的所有核酸,所述核酸編碼具有轉(zhuǎn)座酶活性并在根據(jù)本發(fā)明的組合物中顯示活性的蛋白。根據(jù)本發(fā)明的該方面的示例性核酸包括,如上文所討論的編碼V. harveyi轉(zhuǎn)座酶的顯示與天然存在的核酸至少約50%序列同一'丨生的那些序列、公眾可獲得的序列。優(yōu)選地,核酸顯示至少約60 %序列同一性、至少約70 %序列同一性、至少約80 %序列同一性、至少90%序列同一性、至少95%序列同一性、至少約96%序列同一性、至少約97%序列同一性、至少約98%序列同一性或至少約99%序列同一性。就該文檔所敘述的其他范圍而言,本領(lǐng)域技術(shù)人員立即明白本發(fā)明考慮在本段落中具體敘述的范圍包括的每個(gè)和所有數(shù)值,不需要申請(qǐng)人分別具體敘述每個(gè)數(shù)值。優(yōu)選地,在核酸用于制備本發(fā)明的轉(zhuǎn)座酶之前,核酸從一種或多種其他細(xì)胞組分中分離或純化。在本發(fā)明的一個(gè)方面中,提供了試劑盒。一般而言,根據(jù)本發(fā)明的試劑盒含有本發(fā)明的組合物的一些或所有組分,或包含對(duì)本發(fā)明的方法實(shí)施而言必須的一些或所有物質(zhì)。如本領(lǐng)域中理解的,組分可被一起包裝,以提供用于組分的遞送和/或組織的單個(gè)的、可運(yùn)輸?shù)暮?或可儲(chǔ)存的單元。在另一方面中,提供了轉(zhuǎn)座酶-介導(dǎo)的靶標(biāo)DNA片段化和標(biāo)記的方法。在一種實(shí) 施方式中,所述方法包括=(A)使I)包含至少一個(gè)雙鏈部分的第一 DNA分子,其中雙鏈部分包含轉(zhuǎn)座酶的識(shí)別序列并且DNA分子還包含這樣的部分,所述部分不包含轉(zhuǎn)座酶的識(shí)別序列的部分;2)包含至少一個(gè)雙鏈部分的第二 DNA分子,其中雙鏈部分包含所述轉(zhuǎn)座酶的識(shí)別序列并且DNA分子還包含這樣的部分,所述部分不包含所述轉(zhuǎn)座酶的識(shí)別序列,其中序列的非識(shí)別部分不同于第一 DNA分子的非識(shí)別部分序列;和3)所述轉(zhuǎn)座酶組合,其中三種物質(zhì)的組合允許它們相互作用;和(B)使這些相互作用的物質(zhì)與靶標(biāo)DNA分子和Mn+2離子、Mg+2離子或兩種離子在下述條件下組合使得相互作用的物質(zhì)與靶標(biāo)DNA締合并通過(guò)轉(zhuǎn)座酶-介導(dǎo)的切割來(lái)切割靶標(biāo)DNA分子以提供切割的DNA產(chǎn)物。還在另一實(shí)施方式中,所述方法包括(A)使I)靶標(biāo)DNA分子;2)包含至少一個(gè)雙鏈部分的第一 DNA分子,其中雙鏈部分包含轉(zhuǎn)座酶的第一識(shí)別序列;3)包含至少一個(gè)雙鏈部分的第二 DNA分子,其中雙鏈部分包含所述轉(zhuǎn)座酶的第二識(shí)別序列;和4)所述轉(zhuǎn)座酶組合;和(B)使組合物經(jīng)受下述條件使得第一 DNA分子、第二 DNA分子和轉(zhuǎn)座酶可與靶標(biāo)DNA分子締合并通過(guò)轉(zhuǎn)座酶-介導(dǎo)的切割來(lái)切割靶標(biāo)DNA分子以提供切割的DNA產(chǎn)物,其中所述條件包括I-IOOmM的Mn+2、I-IOOmM的Mg+2或I-IOOmM的Mn+2和Mg+2離子的組合。在某些實(shí)施方式中,第二 DNA分子包含至少一個(gè)雙鏈部分,并且在轉(zhuǎn)座酶識(shí)別部分和非-轉(zhuǎn)座酶識(shí)別部分二者中均與第一 DNA序列不同。同樣地,本發(fā)明包括其中第一識(shí)別序列不同于第二識(shí)別序列的實(shí)施方式。而在一些實(shí)施方式中,將要組合的組分同時(shí)一起組合,在優(yōu)選的實(shí)施方式中,使第一 DNA分子、第二 DNA分子和轉(zhuǎn)座酶組合,以制得復(fù)合體,之后使復(fù)合體與靶標(biāo)DNA分子組合。所述方法可用任何天然存在的(即,野生型)轉(zhuǎn)座酶或用工程改造的轉(zhuǎn)座酶實(shí)施。在本發(fā)明的上下文中使用野生型轉(zhuǎn)座酶提供了優(yōu)于現(xiàn)有技術(shù)的優(yōu)勢(shì)。更進(jìn)一步地且獨(dú)立地,在實(shí)施方式中,本發(fā)明的反應(yīng)條件提供了較之現(xiàn)有技術(shù)方法的優(yōu)良的結(jié)果。在示例性實(shí)施方式中,轉(zhuǎn)座酶是IS4家族轉(zhuǎn)座酶,例如Vibrio種中天然發(fā)現(xiàn)的一種,包括但不限于Vibrio harveyi。同樣地,轉(zhuǎn)座酶的識(shí)別序列可以是天然存在的序列。其還可以是這樣的序列,所述序列經(jīng)工程改造以具有天然存在的序列所展示的那些性質(zhì)之外的性質(zhì),例如對(duì)天然存在的轉(zhuǎn)座酶或經(jīng)工程改造的轉(zhuǎn)座酶的更強(qiáng)(或更弱)的結(jié)合性。
在實(shí)施方式中,第一識(shí)別序列、第二識(shí)別序列或二者是來(lái)自Vibrio harveyi的轉(zhuǎn)座酶的識(shí)別序列。例如,第一識(shí)別序列、第二識(shí)別序列或二者可以是包含一條鏈為5' -acttgtgatcaagagacag-3' (SEQ ID NO :4)的序列的雙鏈DNA序列。備選地或額外地,第一識(shí)別可包含一條鏈為5' -acttgtgatcaagagacag-3' (SEQ ID NO :4)的序列,且第二識(shí)別序列可以是包含一條鏈為:5' -agatgtgatcaagagacag-3' (SEQ ID NO :5)的序列、來(lái)自Vibrio harveyi的轉(zhuǎn)座酶的經(jīng)修飾的識(shí)別序列。備選地或額外地,第一識(shí)別、第二識(shí)別序列或二者可以是包含一條鏈為5' -agatgtgatcaagagacag-3' (SEQ ID NO :5)的序列的雙鏈DNA序列。在實(shí)施方式中,第一識(shí)別序列、第二識(shí)別序列或二者是與天然存在的識(shí)別序列相差至少一個(gè)核苷酸、優(yōu)選地少于10個(gè)核苷酸的來(lái)自Vibrio harveyi的轉(zhuǎn)座酶的經(jīng)修飾的識(shí)別序列。在本發(fā)明的一些實(shí)施方式中,Mn+2離子和/或Mg+2離子用來(lái)改進(jìn)通過(guò)轉(zhuǎn)座酶的靶標(biāo)DNA的片段化/切割和/或標(biāo)記。在這些實(shí)施方式中,在切割和/或標(biāo)記條件中單獨(dú)的或組合的Mn+2和/或Mg+2離子濃度在約ImM和約IOOmM之間,例如在約5mM和約40mM之 間,或在約IOmM和約20mM之間。在一些實(shí)施方式中,非-Mn+2和/或非-Mg+2離子鹽,例如堿性金屬鹽,以相對(duì)低的濃度存在,例如低于50mM,例如約25mM或更低。存在鉀鹽時(shí),它們優(yōu)選地以約25mM的濃度存在。本發(fā)明的方法還可包括將連接體添加至片段化的和標(biāo)記的DNA靶標(biāo)。同樣地,本發(fā)明還涉及另一方面,其是使標(biāo)記的轉(zhuǎn)座酶-片段化的DNA分子適于隨后分析的方法。用于將連接體添加至片段化的和標(biāo)記的DNA靶標(biāo)的方法使本領(lǐng)域中已知的,并且根據(jù)本發(fā)明,可使用任何可用技術(shù),以得出適于用在隨后的分析(例如下一代測(cè)序、微陣列分析等等)中的DNA。DNA可在直接與轉(zhuǎn)座酶反應(yīng)后或PCR擴(kuò)增后經(jīng)受此類分析,這視起始材料的量和分析需求而定。在實(shí)施方式中,本發(fā)明的連接體包含I)可與片段化的和標(biāo)記的DNA靶標(biāo)的至少一部分雜交的3'區(qū)域;和2)不與片段化的和標(biāo)記的DNA靶標(biāo)雜交的5'區(qū)域。3'區(qū)域優(yōu)選地包括在適于體外擴(kuò)增(例如PCR)的條件下與片段化的和標(biāo)記的靶標(biāo)DNA的一條鏈雜交的核苷酸序列。在非常優(yōu)選的實(shí)施方式中,3'區(qū)域包含在DNA靶標(biāo)的轉(zhuǎn)座酶識(shí)別位點(diǎn)內(nèi)與片段化的和標(biāo)記的DNA靶標(biāo)雜交的核苷酸序列。另一方面,連接體的5'區(qū)域包括在允許3/區(qū)域雜交的條件下不與DNA靶標(biāo)雜交的序列。相反,5'區(qū)域包括允許擴(kuò)增產(chǎn)物(連接體可被認(rèn)為是用于DNA靶標(biāo)擴(kuò)增的引物)與另一核酸,例如與固相支持物結(jié)合的核酸(例如,在芯片上的核酸)締合的序列。此類序列的非限制性例子是用于將DNA靶標(biāo)與Illumina底物或Roche454底物結(jié)合的序列。在實(shí)施方式中,兩個(gè)連接體與片段化的和標(biāo)記的DNA靶標(biāo)結(jié)合。優(yōu)選地,每個(gè)連接體的5'區(qū)域包含不同于另一連接體的核苷酸序列。但是下述是優(yōu)選的兩個(gè)5'序列(例如,都包括可被附著在Illumina芯片、Roche芯片等等上的序列)都適于用在用于分析的相同的格式中。當(dāng)然,如本領(lǐng)域中已知的,連接體可包括“條形碼”。附圖簡(jiǎn)述并入本說(shuō)明書并組成本說(shuō)明書一部分的附圖闡釋本發(fā)明的實(shí)施方式,并和書面說(shuō)明一起用來(lái)解釋本發(fā)明的某些原理和特性。
圖1,板A和B顯示了表達(dá)多種轉(zhuǎn)座酶的E. coli細(xì)胞的粗制提取物的SDS-PAGE凝膠結(jié)果。對(duì)應(yīng)于轉(zhuǎn)座酶的蛋白帶由箭頭指出。板A:在37°C下培養(yǎng)。泳道I——假定
蛋白 VIBHAR_03113,Vibrio harveyi ATCC BAA-1116, YP_001446289 ;泳道 2-標(biāo)記 12
分子量標(biāo)記物(Invitrogen);泳道3-來(lái)自 Photobacterium profundum SS9 的轉(zhuǎn)座
酶,YP_133439 ;泳道 4-來(lái)自 Vibrionales 細(xì)菌 SWAT-3 的轉(zhuǎn)座酶,ZP_01815141. I ;泳
道5—來(lái)自Vibrio cholerae V51的保守假定蛋白,ZP_04918286. I ;泳道6——如泳道5的相同的材料但是未經(jīng)誘導(dǎo)的細(xì)胞(陰性對(duì)照)。板B:在25°C (泳道2、3、5、7)下和在
370C (泳道4、8)下培養(yǎng)的對(duì)照。泳道I—標(biāo)記12分子量標(biāo)記物(Invitrogen);泳道2-
假定蛋白 VIBHAR_03113.m,Vibrio harveyi ATCC BAA-1116,YP_001446289,未誘導(dǎo)的細(xì) 胞(陰性對(duì)照);泳道3 和 4-假定蛋白 VIBHAR_03113,Vibrioharveyi ATCC BAA-1116,
YP_001446289 ;泳道5 和 6-假定蛋白 lpg0647[Legionella pneumophila 亞種,軍團(tuán)
菌,嗜肺軍團(tuán)菌I型],YP_094683. I ;泳道7和8——IS4家族轉(zhuǎn)座酶TnpA[Legionellapneumophila亞種,軍團(tuán)菌,嗜肺軍團(tuán)菌I型],YP_094196. I。圖2是存在鎂離子或錳離子時(shí)用天然存在的轉(zhuǎn)座酶消化的\ DNA的瓊脂糖凝膠電泳運(yùn)行30分鐘(左邊板)或2. 5小時(shí)(右邊板)的圖片。數(shù)據(jù)顯示存在錳離子時(shí)轉(zhuǎn)座酶活性的顯著改進(jìn)和降低的特異性。將在20mMPIPES pH 7. 5、0. 25M KC1、50%甘油中的具有3mg/ml蛋白濃度的經(jīng)純化的Vibhar轉(zhuǎn)座酶與在50 U M濃度下的等體積的接頭78混合并在室溫下孵育I小時(shí),導(dǎo)致接頭/轉(zhuǎn)座酶復(fù)合體或“負(fù)載轉(zhuǎn)座酶”的形成。將I. 2 Ul的負(fù)載的轉(zhuǎn)座酶轉(zhuǎn)移至含有以IOii g/ml濃度的X DNA、以3 ii M濃度的接頭78、IOmM MnCl2或IOmMMgCl2,25mM Tris-乙酸鹽pH 7. 5、75mM谷氨酸鉀的19 的反應(yīng)混合物中。反應(yīng)混合物在37°C下孵育30min或2. 5小時(shí),使用引物7在PCR中擴(kuò)增,在I. 8%瓊脂糖中分離并用溴化乙錠染色。圖3是Epicentre的NEXTERA 技術(shù)和目前公開的技術(shù)的比較,顯示了本發(fā)明相對(duì)于本領(lǐng)域中可用的技術(shù)的簡(jiǎn)易性。圖4顯示了使用示例性天然存在的轉(zhuǎn)座酶和所述轉(zhuǎn)座酶的任一種識(shí)別序列或兩種不同的識(shí)別序列進(jìn)行、DNA片段化和標(biāo)記的瓊脂糖凝膠電泳運(yùn)行,所述運(yùn)行顯示了利用兩個(gè)識(shí)別序列的設(shè)計(jì)的切割、標(biāo)記和擴(kuò)增效率是優(yōu)異的。如在使用Vibhar的DNA片段化和標(biāo)記的詳細(xì)方案中所述的,使DNA片段化,使用PicoMaxx andPfuUltra 聚合酶進(jìn)行PCR擴(kuò)增,并對(duì)產(chǎn)生的片段進(jìn)行分析。PCR后,不從寡核苷酸中純化片段。Ikb加DNA梯度(lkb Plus DNA ladder)來(lái)自 Invitrogen Inc. , Carlsbad, CA 并被用于比較。圖5顯示了使用示例性天然存在的轉(zhuǎn)座酶和所述轉(zhuǎn)座酶的兩種不同的識(shí)別序列進(jìn)行\(zhòng) DNA片段化和標(biāo)記的瓊脂糖凝膠電泳運(yùn)行,顯示僅當(dāng)兩條識(shí)別序列都被摻進(jìn)靶標(biāo)DNA時(shí)發(fā)生擴(kuò)增。如在使用Vibhar的DNA片段化和標(biāo)記的詳細(xì)方案中所述的,使DNA片段化,使用PicoMaxx 聚合酶進(jìn)行PCR擴(kuò)增,并對(duì)產(chǎn)生的片段進(jìn)行分析。PCR后,不從寡核苷酸中純化片段。Ikb加DNA梯度(Invitrogen Inc. , Carlsbad, CA)被用于比較。圖6顯示了將改變Mn (II)濃度時(shí)的天然存在的轉(zhuǎn)座酶的活性與Mg (II)對(duì)照比較的其他結(jié)果,并顯示對(duì)靶標(biāo)X DNA和人DNA觀察的片段化、標(biāo)記和PCR擴(kuò)增是相當(dāng)?shù)摹3耸褂貌煌瑵舛鹊腗n++或Mg++代替Mn++外,如在使用Vibhar的DNA片段化和標(biāo)記的詳細(xì)方案中所述的,使DNA片段化,使用PfuUltra 聚合酶進(jìn)行PCR擴(kuò)增并對(duì)產(chǎn)生的片段進(jìn)行分析。PCR后,不從寡核苷酸中純化片段。使用了 Ikb加DNA梯度(Invitrogen Inc.,Carlsbad, CA)用于比較。本發(fā)明的多種實(shí)施方式的詳細(xì)描述現(xiàn)詳細(xì)說(shuō)明本發(fā)明的多種示例性實(shí)施方式、在附圖中闡釋的支持此類實(shí)施方式的數(shù)據(jù)。該詳細(xì)描述不應(yīng)被認(rèn)為是本發(fā)明的限制,而應(yīng)確切地被理解為給讀者提供本發(fā)明的某些方面、特性和實(shí)施方式的更詳細(xì)的描述的公開。在本發(fā)明的實(shí)施方式被詳細(xì)描述之前,應(yīng)當(dāng)理解本文中使用的術(shù)語(yǔ)僅為描述特 別的實(shí)施方式的目的,并不意圖限制。而且,提供一個(gè)數(shù)值范圍時(shí),應(yīng)理解為也具體公開了該范圍上限和下限之間的每個(gè)中間值(除非上下文另有清楚說(shuō)明,到下限單位的十分之一為止)。在任何陳述值或陳述范圍內(nèi)的中間值和任何其他陳述值或在所述范圍內(nèi)的中間值之間的每個(gè)較小的范圍也包括在本發(fā)明內(nèi)。這些較小范圍的上限和下限可獨(dú)立地包括或排除在范圍內(nèi),和在較小范圍內(nèi)包括任一界限、兩個(gè)界限或兩個(gè)界限都不包括的每個(gè)范圍也包括在本發(fā)明內(nèi),受制于所述范圍內(nèi)任何明確排除的界限。當(dāng)所述范圍包括界限之一或二者時(shí),排除這些包括在內(nèi)的界限之一或二者的范圍也包括在本發(fā)明內(nèi)。除非另有說(shuō)明,本文使用的所有技術(shù)和科學(xué)術(shù)語(yǔ)具有本發(fā)明所述領(lǐng)域的常規(guī)技術(shù)人員通常理解的相同含義。盡管在本發(fā)明的實(shí)踐或測(cè)試中也可以使用與本文所述相似或等同的任何方法和材料,現(xiàn)描述了優(yōu)選的方法和材料。本說(shuō)明書中提到的所有出版物通過(guò)引用并入,用以公開和描述與所述出版物相關(guān)的方法和/或材料。在與任何并入的出版物的沖突時(shí),本公開起決定作用。在本文和附帶的權(quán)利要求中使用時(shí),單數(shù)形式("a"," an"和"the")包括復(fù)數(shù)形式,除非上下文另行明確指出。因而,例如提及“轉(zhuǎn)座酶”包括此類轉(zhuǎn)座酶的復(fù)數(shù)并且提及“樣品”包括提及一種或多種樣品和為本領(lǐng)域技術(shù)人員所已知的其等同物等等。而且,使用可使用等同術(shù)語(yǔ)描述的術(shù)語(yǔ)包括使用那些等同術(shù)語(yǔ)。改講的轉(zhuǎn)座酶反應(yīng)條件天然轉(zhuǎn)座酶被認(rèn)為是固有失活的。但是,必須承認(rèn)不是所有可能的反應(yīng)條件已被完全嘗試過(guò)。這里,公開了下述事實(shí)可通過(guò)將一種或多種過(guò)渡金屬離子(包括Mg(II)和Mn(II) 二者,但優(yōu)選地至少M(fèi)n(II))引進(jìn)轉(zhuǎn)座酶反應(yīng)混合物來(lái)實(shí)現(xiàn)在未經(jīng)修飾的轉(zhuǎn)座酶的天然DNA片段化活性的引人注目的改進(jìn)。通過(guò)相同的途徑也實(shí)現(xiàn)了 DNA片段化特異性的引人注目的降低。必須強(qiáng)調(diào),低特異性對(duì)消除偏好并實(shí)現(xiàn)最優(yōu)的可能的DNA文庫(kù)序列覆蓋度的下一代測(cè)序而言是優(yōu)選的。通過(guò)示例的方式,在這些實(shí)驗(yàn)中鑒定并使用了 Vibrio harveyi轉(zhuǎn)座酶。使用并公開了該酶的天然和經(jīng)修飾的DNA識(shí)別序列。還公開了寡核苷酸設(shè)計(jì)和當(dāng)DNA文庫(kù)在相同的芯片上測(cè)序時(shí)的有用的索引,所述寡核苷酸設(shè)計(jì)和用于片段化DNA和用于提供特異性標(biāo)記的轉(zhuǎn)座酶的組合在下一代測(cè)序中是有用的。如上文討論的,由于多種原因,Tn5轉(zhuǎn)座酶是有問(wèn)題的。同樣地,本發(fā)明人評(píng)估了來(lái)自在NCBI網(wǎng)站上可得到的不同基因組的多種轉(zhuǎn)座酶。它們中的一些被NCBI注釋為轉(zhuǎn)座酶,但其他的被它們的生物信息學(xué)專家漏掉,臨時(shí)被標(biāo)記為“假定蛋白”。通過(guò)分析與已知轉(zhuǎn)座酶具有序列同一性的蛋白,鑒定了用于DNA片段化和標(biāo)記的通過(guò)“剪切和粘貼”起作用的似乎是轉(zhuǎn)座酶的實(shí)體的集合。在這些之中,基于每一基因組的拷貝的數(shù)目和在有機(jī)體之中的分布(不同于Tn5的特點(diǎn),其受限于拷貝數(shù)目和宿主),對(duì)蛋白進(jìn)行排序。原理是此類“普遍存在的”轉(zhuǎn)座酶可能更有活性。天然存在的Vibrio harveyi轉(zhuǎn)座酶被用在大多數(shù)的實(shí)驗(yàn)中并且本文中被稱為“Vibhar”。Vibhar轉(zhuǎn)座酶基因以至少21個(gè)拷貝存在于Vibrioharveyi基因組中,且高度類似的基因在其他Vibrio基因組中廣泛分布,而Tn5轉(zhuǎn)座酶基因在每個(gè)基因組中以一個(gè)拷貝存在,并且僅在非常少數(shù)的細(xì)菌菌株中存在。使用生物信息學(xué)手段,該轉(zhuǎn)座酶的IRL序列被鑒定為 5 ' -ctgtctcttatacacaat-3 ' (SEQ ID NO :9) IRR 序列被鑒定為5 ' -acttgtgatcaagagacag-3 ' (SEQ ID NO :4)。通過(guò)實(shí)驗(yàn),經(jīng)修飾的 19bp IRR 序列5' -agatgtgatcaagagacag-3' (SEQ ID NO :5)證明更有效并被用在大多數(shù)實(shí)驗(yàn)中。下文中該序列的雙鏈寡核苷酸被稱為接頭78。除了 “普遍存在”之外,關(guān)注Vibhar轉(zhuǎn)座酶的其他原因是其非常易于生產(chǎn),這是由于其在E. coli中作為溶解蛋白的非常高的表達(dá)水平,具有遠(yuǎn)遠(yuǎn)優(yōu)于Tn5和大多數(shù)評(píng)估的轉(zhuǎn)座酶的表達(dá)水平(見圖1,其顯示了測(cè)試的多種轉(zhuǎn)座酶的表達(dá)水平的比較)。而且,不同于Tn5轉(zhuǎn)座酶,事實(shí)上沒(méi)有觀察到Vibhar轉(zhuǎn)座酶的蛋白水解降解。最初測(cè)試時(shí),純化的Vibhar轉(zhuǎn)座酶在傳統(tǒng)用于DNA片段化的條件中僅具有弱的活性。而且,在下一代DNA測(cè)序中最有用的約200-800bp的DNA片段的產(chǎn)率不令人滿意。大 多數(shù)產(chǎn)生的片段是大得多的尺寸。而且,觀察到表示相當(dāng)大的序列特異性的顯著的DNA片段帶,這在用于DNA測(cè)序的樣品中是不被期望的。使用轉(zhuǎn)座酶并增加孵育時(shí)間沒(méi)有緩和上述問(wèn)題。。但是,通過(guò)Mn (II)離子代替Mg (I I)或通過(guò)用Mn(II)補(bǔ)充Mg (II),解決了這些問(wèn)題,注意Mg(II)被常規(guī)用在轉(zhuǎn)座酶反應(yīng)中(圖2)。另外,發(fā)現(xiàn)了涉及Mg(II)離子的先前提到的問(wèn)題可通過(guò)本方法克服。通過(guò)將谷氨酸鉀濃度從75-100mM(其被常規(guī)用于使用Tn5轉(zhuǎn)座酶的反應(yīng))降低至25mM并通過(guò)將反應(yīng)溫度升高至47°C來(lái)實(shí)現(xiàn)進(jìn)一步的改進(jìn)。通過(guò)示例的方式,下述條件可用來(lái)實(shí)現(xiàn)令人滿意的DNA片段化將在20mM PIPESpH 7.5,0. 25M KCl,50%甘油中的具有3mg/ml蛋白濃度的的純化的轉(zhuǎn)座酶與以50 ii M濃度下的等體積的接頭78混合并在室溫下孵育lh,導(dǎo)致接頭/轉(zhuǎn)座酶復(fù)合體的形成,或“負(fù)載的轉(zhuǎn)座酶”。將I. 2 ill負(fù)載的轉(zhuǎn)座酶轉(zhuǎn)移至含有10 u g/ml濃度的DNA、3 ii M濃度的接頭78、IOmM MnCl2,25mM Tris-乙酸鹽pH 7. 5、25mM谷氨酸鉀的19 的反應(yīng)混合物。相等濃度的MgCl2替代MnCl2或可被添加至MnCl2 (以實(shí)現(xiàn)追加的摩爾濃度或共同的摩爾濃度)。在47°C下孵育反應(yīng)混合物20min。使用StrataPrep PCR純化試劑盒(Agilent, La Jolla,CA)去除寡核苷酸。使用4 ii M濃度下的具有序列5' -agatgtgatcaagagacag-3' (SEQ IDNO :5)的引物、83 單位/ml 濃度下的Pfu Ultra HF (Agilent Technologies, La Jolla,CA)、ImM濃度下的dNTPs、l X PfuUltra 緩沖液,用PCR擴(kuò)增DNA片段。應(yīng)用72°C下4min的一個(gè)循環(huán);隨后20個(gè)循環(huán)94°C 40秒,56°C 45秒,72°C 2分鐘;隨后在72°C下IOmin的一個(gè)循環(huán)。該設(shè)計(jì)允許令人滿意的DNA片段化,但其不會(huì)提供將不同的多核苷酸序列附著到DNA片段的各個(gè)末端。但是,下一代DNA測(cè)序需要提供具有在各個(gè)末端上具有不同的DNA序列的每一 DNA片段(S卩,提供標(biāo)記)。最初11 lumina (San Diego, CA)開發(fā)了用于下一代DNA測(cè)序的DNA片段化和標(biāo)記DNA片段的技術(shù)(Nature Methods,5,p887_893,2008)。但是,用于DNA片段化和標(biāo)記的Illumina 方法相當(dāng)復(fù)雜且費(fèi)勁。因此,Epicentre Biotechnologies, Madison, WI 開發(fā)了使用Tn5轉(zhuǎn)座酶的用于DNA片段化和標(biāo)記的簡(jiǎn)單得多的方法。但是,這導(dǎo)致了寡核苷酸設(shè)計(jì)中的一些妥協(xié),因?yàn)門n5轉(zhuǎn)座酶識(shí)別序列不得不被添加。結(jié)果,附著到DNA片段的寡核苷酸比在Illumina設(shè)計(jì)中長(zhǎng)的多。因此,不得不利用PCR擴(kuò)增的更復(fù)雜的方案,S卩,代替如在
11Iumina設(shè)計(jì)中的兩條PCR引物,在Epicentre設(shè)計(jì)中使用了四條PCR引物,所述弓I物具有對(duì)人DNA的錯(cuò)誤引 發(fā)的可能性。圖3A中列出的寡核苷酸設(shè)計(jì)與Epicentre使用的設(shè)計(jì)非常相似(并被標(biāo)為E)。與Epicentre設(shè)計(jì)的不同之處在于轉(zhuǎn)座酶識(shí)別序列是不同的。Epicentre設(shè)計(jì)使用19bp “嵌合體”Tn5轉(zhuǎn)座酶識(shí)別序列,而本發(fā)明使用了經(jīng)修飾的19bp Vibrio harveyi轉(zhuǎn)座酶識(shí)別序列(標(biāo)為“78”),這是由于在本文公開的實(shí)驗(yàn)中使用了 Vibhar轉(zhuǎn)座酶的事實(shí)?,F(xiàn)有設(shè)計(jì)的缺點(diǎn)是在PCR中利用4條引物,所述4條引物在圖中被標(biāo)為引物1*(SEQ ID NO :10)(又叫Nxpl*)、引物 2* (SEQ ID 勵(lì)14)(又叫版口2*)、接頭1(5£0 ID NO : 11)(又叫 Nxal)和接頭
2(SEQ ID N0:15)(又叫Nxa2)。在若干最初的PCR循環(huán)下,僅使用了接頭I和接頭2,因?yàn)橐颕*和引物2*在這些循環(huán)期間在含有轉(zhuǎn)座酶識(shí)別序列的寡核苷酸上不具有著落位點(diǎn)(landing sites)。這些最初的循環(huán)是較少有效的,因?yàn)榻宇^I和接頭2的濃度小于在PCR反應(yīng)中典型的推薦的濃度的約20倍。稍后,引物I*和引物2*具有著落位點(diǎn)并參與在PCR反應(yīng)中。這些引物以PCR擴(kuò)增的最佳濃度存在并在循環(huán)結(jié)束時(shí)以最佳濃度存在,使用這些較短的引物,產(chǎn)生了壓倒多數(shù)的PCR產(chǎn)物。但是,使用引物3程序?qū)@些較短引物的簡(jiǎn)單分析顯示了它們是亞最佳的,有高3'端穩(wěn)定性和對(duì)人DNA的錯(cuò)誤引發(fā)的高可能性(圖3A)。由于此類錯(cuò)誤引發(fā)產(chǎn)生的片段會(huì)錯(cuò)過(guò)閱讀引物的著落位點(diǎn)(圖3A)。例如,如果通過(guò)引物2*產(chǎn)生了錯(cuò)誤引發(fā),不會(huì)從閱讀2引物(SEQ ID NO 16)和索引閱讀引物E獲得測(cè)序信息,但是“錯(cuò)誤引發(fā)的”片段會(huì)占據(jù)Illumina芯片上有價(jià)值的位置,因?yàn)橐?*提供了附著至芯片的所有必要的DNA序列。不幸地,不能設(shè)計(jì)更好的引物I*和更好的引物2*,因?yàn)樗鼈兊闹湮稽c(diǎn)在Illumina標(biāo)記序列內(nèi)部。這實(shí)際上沒(méi)有留下調(diào)整的空間,除非芯片被重新設(shè)計(jì)。強(qiáng)調(diào)最初的Illumina設(shè)計(jì)不會(huì)具有此類問(wèn)題是重要的。用于通過(guò)轉(zhuǎn)座酶的DNA片段化和標(biāo)記的改講的體系本公開部分補(bǔ)充先前公開部分并提供寡核苷酸設(shè)計(jì)以實(shí)現(xiàn)較之現(xiàn)有技術(shù)設(shè)計(jì)的改進(jìn)的DNA片段產(chǎn)率。與現(xiàn)有技術(shù)設(shè)計(jì)不同,根據(jù)本發(fā)明的該部分的PCR擴(kuò)增的引物的3'端位于轉(zhuǎn)座酶識(shí)別序列內(nèi)部。這通過(guò)使用兩種不同的寡核苷酸轉(zhuǎn)座酶識(shí)別序列而容易實(shí)現(xiàn),所述識(shí)別序列被用來(lái)附著兩種不同的Illumina標(biāo)記,這與其中僅一種轉(zhuǎn)座酶序列被用來(lái)附著不同的標(biāo)記的現(xiàn)有技術(shù)設(shè)計(jì)相反。而且,應(yīng)當(dāng)理解,在實(shí)施方式中,根據(jù)上文討論的關(guān)于轉(zhuǎn)座酶反應(yīng)條件的條件,本發(fā)明包括標(biāo)記條件。在一些應(yīng)用中,此類條件是優(yōu)選的并且在實(shí)施方式中,提供了較之現(xiàn)有技術(shù)的此類條件的改進(jìn)的條件。結(jié)果,實(shí)現(xiàn)了較之在現(xiàn)有技術(shù)設(shè)計(jì)中較不有效的4-引物擴(kuò)增的更有效的2-引物擴(kuò)增。較之現(xiàn)有技術(shù)設(shè)計(jì)的Nextera試劑盒(Epicentre),本發(fā)明的2_引物方案導(dǎo)致了 DNA片段的產(chǎn)率更好,并較之現(xiàn)有技術(shù)設(shè)計(jì),導(dǎo)致對(duì)人DNA文庫(kù)的錯(cuò)誤引發(fā)降低。該設(shè)計(jì)和Epicentre設(shè)計(jì)的主要不同之處在于前者設(shè)計(jì)使用了在本文的示例性實(shí)施方式被稱為“78”和“34”的、每種附著至不同的Illumina標(biāo)記的2種不同的轉(zhuǎn)座酶識(shí)別序列,而在后者的設(shè)計(jì),僅一種轉(zhuǎn)座酶識(shí)別序列被用于兩種標(biāo)記(見圖3)。該設(shè)計(jì)允許將PCR引物3'移進(jìn)轉(zhuǎn)座酶識(shí)別DNA序列中并允許使用總體上更短的寡核苷酸和實(shí)際上對(duì)人DNA沒(méi)有錯(cuò)誤引發(fā)可能性的更有效的2-引物PCR擴(kuò)增。為克服現(xiàn)有技術(shù)的問(wèn)題同時(shí)簡(jiǎn)化設(shè)計(jì),發(fā)明人提出了這樣的設(shè)計(jì),所述設(shè)計(jì)允許將附著至DNA片段的核苷酸的組合的尺寸降至與在Illumina的“末端配對(duì)設(shè)計(jì)”中大約相同的尺寸。所述設(shè)計(jì)還避免了使用在Illumina標(biāo)記內(nèi)部具有著落點(diǎn)的短的引物的4-引物PCR0通過(guò)使用2種Vibhar轉(zhuǎn)座酶識(shí)別序列(“78”和“34”)并重新設(shè)計(jì)在Illumina標(biāo)記和轉(zhuǎn)座酶識(shí)別序列之間的區(qū)域,對(duì)人DNA的錯(cuò)誤引發(fā)被減至最小。任一設(shè)計(jì)允許約1-8核苷酸“索引”的插入,在圖3中被標(biāo)為三角形。當(dāng)在相同的芯片上對(duì)若干文庫(kù)測(cè)序時(shí),此類索引被用于鑒定來(lái)自特異性DNA文庫(kù)的序列閱讀。為實(shí)現(xiàn)DNA片段化和標(biāo)記,寡核苷酸3ilb (SEQ ID NO : 17)與寡核苷酸3ilt (SEQID NO 18)雜交,并且寡核苷酸8ilb (SEQ ID NO :19)與寡核苷酸8ilt (SEQ ID NO :20)雜交。除了寡核苷酸不同之外,雜交的寡核苷酸的等摩爾的混合物被用來(lái)負(fù)載Vibhar轉(zhuǎn)座酶 并如上文所述使曬菌體X DNA準(zhǔn)確片段化。從未混合的寡核苷酸的旋轉(zhuǎn)柱(spin-column)純化之后,使用AgPl (SEQ ID NO 7)和AgP2 (SEQ ID NO 8)引物(每種以2 y M) 20個(gè)循環(huán)擴(kuò)增片段化的和標(biāo)記的DNA。根據(jù)制造商的指導(dǎo)(Agilent, La Jolla, CA)使用PicoMaxx DNA聚合酶用于擴(kuò)增。與Epicentre設(shè)計(jì)比較,寡核苷酸N8t (SEQ ID NO :13)或者與寡核苷酸閱讀I引物(SEQ ID NO 12)雜交或者或與閱讀2引物(SEQ ID NO 16)(圖3B)雜交。雜交的寡核苷酸的等摩爾的混合物被用來(lái)負(fù)載Vibhar轉(zhuǎn)座酶并如上文所述使噬菌體\ DNA準(zhǔn)確片段化。從未混合的寡核苷酸的旋轉(zhuǎn)柱(spin-column)純化之后,使用引物I*、引物2* (每種以
2U M濃度)、接頭I、接頭2 (每種以0. I ii M濃度),20個(gè)循環(huán)擴(kuò)增片段化的和標(biāo)記的DNA。根據(jù)制造商的指導(dǎo)(Agilent, La Jolla, CA)使用PicoMaxx 或PfuUltra 熱穩(wěn)定聚合酶用于擴(kuò)增。擴(kuò)增的DNA片段在2%瓊脂糖-TBE凝膠中分離并用溴化乙錠染色(圖4)。從圖中得出的數(shù)據(jù)可知,使用該設(shè)計(jì)的擴(kuò)增顯然提供更好的DNA片段產(chǎn)率。所述片段是用在下一代DNA測(cè)序中的尺寸范圍。當(dāng)存在兩種PCR引物時(shí),DNA被唯一擴(kuò)增,表示每種片段在其末端被標(biāo)記有不同的Illumina標(biāo)記(圖5)。用入DNA和人DNA獲得了類似的結(jié)果,表示該設(shè)計(jì)可被用于不同的基因組,并且也證實(shí),關(guān)于適于下一代DNA測(cè)序的該設(shè)計(jì),使用Mn+2離子的DNA片段化比在典型濃度下的Mg+2的片段化更有效(圖6)。除了在圖3中列出的寡核苷酸設(shè)計(jì),還可使用其他設(shè)計(jì)。例如,兩種Illumina標(biāo)記都可被摻進(jìn)相同的接頭中,導(dǎo)致“分枝的”接頭。這應(yīng)用于可被本領(lǐng)域技術(shù)人員設(shè)計(jì)的Roche或其他標(biāo)記。全部或部分Ilumina、Roche或其他標(biāo)記可在PCR反應(yīng)中被添加至接頭78或延伸的接頭78或類似接頭,而不是從一開始便被摻進(jìn)接頭,這可被應(yīng)用至如圖3中描繪的2種接頭的混合物以及分枝的接頭。而且,2種接頭可與間隔物連接,以確保用不同的接頭(即2種接頭)負(fù)載每一轉(zhuǎn)座酶二聚物,每個(gè)轉(zhuǎn)座酶二聚物I個(gè)不同的接頭拷貝。使用Vibhar的DNA片段化和標(biāo)記的詳細(xì)方案A.使寡核苷酸雜交以產(chǎn)生用于負(fù)載Vibhar轉(zhuǎn)座酶的部分ds接頭。將在圖3上描繪的寡核苷酸在去離子無(wú)菌水中溶解為IOOii M濃度(每nm寡核苷酸添加10 ill水)。I.將等體積的 N8t(SEQ ID NO :13)與 N8b (SEQ ID NO : 12)、N8it (SEQ ID NO :13)與 N8ib(SEQ ID NO : 16)、3ilt(SEQ ID NO :18)與 3ilb(SEQ ID NO : 17)、8ilt (SEQ ID NO:20)與 8ilb(SEQ ID NO :19)混合。2.將1/19體積的0. 2M Tris-乙酸鹽pH 7. 5,0. 5M谷氨酸添加至每一混合物。3.在500ml的燒杯中將約400ml水加熱至72 °C,將混合物放進(jìn)在燒杯中的漂浮物(floatie)中,在塑料袋中包裹并在試驗(yàn)臺(tái)上在若干小時(shí)中緩慢冷卻至室溫。4.產(chǎn)生的接頭被標(biāo)為N8 (得自寡核苷酸N8t和N8b)、N8i (來(lái)自N8it和N8ib)、3il (來(lái)自 3ilt 和 3ilb)、8il (來(lái)自 8ilt 和 8ilt)。見圖 3。5 在-20°C下存儲(chǔ)接頭。 B.制備Vibhar緩沖液(當(dāng)IX時(shí),25mM Tris-乙酸鹽pH7. 5、25mM谷氨酸鉀、IOmMMnCl2)?;旌舷率鲆灾苽銲ml的4X緩沖液I. 200 ii I 的 0. 5M Tris-乙酸鹽 pH 7. 52. 100 U I的IM谷氨酸鉀3. 80 U I 的 0. 5M MnCl24. 620 U I的去離子水。C.用接頭負(fù)載Vibhar轉(zhuǎn)座酶I. IOu I的接頭N8與10 ill接頭N8i混合,10 U I的接頭3il與10 iU的接頭8il混合。2. 4 ii I 的 Vibhar 轉(zhuǎn)座酶(在 20mM PIPES pH 7. 5,0. 25M KC1,50%甘油中 3mg/ml)與4iil的N8/N8i混合物混合或與4 的3il/8il接頭混合物混合。3.在室溫下孵育70_80min。D. DNA 片段化將I. 20 U I 的 4 X Vibhar 緩沖液2. 20 U I 入 DNA@40 U g/ml3. IOu I 的 N8/N8i 混合物或 3il/8il 混合物4. 30 U I 水混合將70 ill的混合物添加至8 U I的負(fù)載的轉(zhuǎn)座酶。在47°C下孵育20_25min。E.旋轉(zhuǎn)柱純化將等體積(78 ii I)的結(jié)合緩沖液(4M鹽酸胍)添加至片段化的DNA的每一樣品,振蕩并將混合物在 Single GFF layer Retainer Ring Versa 旋轉(zhuǎn)柱(AbsolutelyRNA Nanoprep試劑盒,Agilent的一部分)上應(yīng)用。將柱放進(jìn)2ml無(wú)帽插座管(cap-lessreceptacle tube)。I 在 Beckman-Coulter MicrofUge 16的內(nèi)環(huán)中在 14800RPM 下旋轉(zhuǎn) 34 秒。2.從插座管中完全去除流經(jīng)的液體,重新插入柱,應(yīng)用200 ii I的洗滌緩沖液(80% Absolute Ethanol,200proof, Molecular biology grade, Fischer Scientific)。
3.如之前的旋轉(zhuǎn)。4 重復(fù)步驟2和3。5.從插座管中完全去除流經(jīng)的液體,重新插入柱并如之前的旋轉(zhuǎn)。6.將柱移進(jìn)無(wú)帽的 1.5ml Eppendorf 管中,將 30 ii I 的 IOmM pH 8. 46 的 Tris-HCl緩沖液應(yīng)用至柱的頂部并在室溫下孵育5min。7.如之前的旋轉(zhuǎn)。8.應(yīng)用30 U I水并如之前的旋轉(zhuǎn)。9.將合在一起的洗脫液轉(zhuǎn)移至有帽的管。
F. PCR 擴(kuò)增引物混合物:將在水中的所有引物(圖3)溶解為IOOii M濃度。引物混合物A(Agilent 設(shè)計(jì))。將 100 iU 的 AgPl (SEQ ID N0:7)與 IOOyl 的AgP2 (SEQ ID NO :8)混合。引物混合物E (Epicentre 設(shè)計(jì))。將 100 U I 的 Nxpl*、100 U I 的 Nxp2*、5 U I Nxal和65 ill的Nxa2混合。表I :反應(yīng)混合物
八個(gè)20 ul的反應(yīng)(過(guò)量)混合物兩個(gè)20 ul反應(yīng)
20 |il IOXPicoMaxxw緩沖液*5 |il IOXPicoMaxxw緩沖液
2 ^il 100 mM dNTPs5 ^il 10 mM dNTPs
8 (il的引物混合物A或引物混合物E 2 引物混合物A或引物混合物E6.7 (xl PicoMaxx(R)聚合酶*1.7 [il PicoMaxx(R)聚合酶
113.3 |il 水23.8 0 水*也可使用PfuUltra和其緩沖液。產(chǎn)率大約是相同的,用PfuUltra有更多的引物-二聚物(圖4)。將來(lái)自步驟E的片段DNA的5 ill等分部分加入PCR板的孔中。將15 yl的上述混合物加進(jìn)孔中。使用下述參數(shù)在Agilent SureCycler 8800上擴(kuò)增修復(fù)72°C 2min 22sec變性95°C 3min19個(gè)循環(huán)變性93°C40sec退火59°C Imin延伸72°C3min結(jié)束循環(huán)延伸72°C IOmin冷卻4°C不限時(shí)使用2%瓊脂糖TBE凝膠分析。就克隆進(jìn)質(zhì)粒載體或在Illumina芯片上測(cè)序而言,根據(jù)制造商的指導(dǎo),使用StrataPrep PCR純化試劑盒(Agilent, La Jolla, CA)從未反應(yīng)的寡核苷酸中純化。
可在本發(fā)明的實(shí)施中做多種改進(jìn)和變化而不會(huì)背離本發(fā)明的范圍或精神,這對(duì)本領(lǐng)域技術(shù)人員而言是顯而易見的。從本發(fā)明的說(shuō)明書和實(shí)施考慮的本發(fā)明的其他實(shí)施方式對(duì)技術(shù)人員而言是顯而易見得的。期望說(shuō)明書和實(shí)施例僅是示例性的。
權(quán)利要求
1.用于靶標(biāo)DNA分子的DNA片段化的體外方法,所述方法包括 使 包含至少一個(gè)雙鏈部分的第一 DNA分子, 其中所述雙鏈部分包含轉(zhuǎn)座酶的識(shí)別序列并且該DNA分子還包含不包含該轉(zhuǎn)座酶的識(shí)別序列的部分; 包含至少一個(gè)雙鏈部分的第二 DNA分, 其中雙鏈部分包含上述轉(zhuǎn)座酶的識(shí)別序列并且該DNA分子還包含不包含該轉(zhuǎn)座酶識(shí)別序列的部分,其中所述序列的非識(shí)別部分不同于第一 DNA分子的非識(shí)別部分;和上述轉(zhuǎn)座酶組合; 其中上述三種物質(zhì)的組合允許它們相互作用;以及 使這些相互作用的物質(zhì)與靶標(biāo)DNA分子和Mg+2離子、Mn+2離子、或Mg+2離子與Mn+2離子兩者在使得相互作用的物質(zhì)與靶標(biāo)DNA締合并通過(guò)轉(zhuǎn)座酶-介導(dǎo)的切割來(lái)切割靶標(biāo)DNA分子的條件下組合,以提供切割的DNA產(chǎn)物。
2.根據(jù)權(quán)利要求I的方法,其中所述第二DNA分子與所述第一 DNA分子的轉(zhuǎn)座酶識(shí)別部分和非-轉(zhuǎn)座酶識(shí)別部分都不相同。
3.根據(jù)權(quán)利要求I的方法,其中所述轉(zhuǎn)座酶是IS4家族轉(zhuǎn)座酶。
4.根據(jù)權(quán)利要求3的方法,其中所述轉(zhuǎn)座酶是在Vibrio種中天然發(fā)現(xiàn)的。
5.根據(jù)權(quán)利要求4的方法,其中所述轉(zhuǎn)座酶是來(lái)自Vibrioharveyi的轉(zhuǎn)座酶。
6.根據(jù)權(quán)利要求I的方法,其中所述第一識(shí)別序列、所述第二識(shí)別序列、或二者都是來(lái)自Vibrio harveyi的轉(zhuǎn)座酶的識(shí)別序列。
7.根據(jù)權(quán)利要求6的方法,其中所述第一識(shí)別序列、所述第二識(shí)別序列、或二者都、是與天然存在的識(shí)別序列相差至少一個(gè)核苷酸的來(lái)自Vibrio harveyi的經(jīng)修飾的轉(zhuǎn)座酶的識(shí)別序列。
8.根據(jù)權(quán)利要求I的方法,其中在切割條件中的Mn+2濃度、Mg+2濃度或相加的Mn+2濃度和Mg+2濃度在約ImM和約IOOmM之間。
9.根據(jù)權(quán)利要求I的方法,其中在切割條件中的Mn+2濃度,theMg+2濃度,或相加的Mn+2濃度和Mg+2濃度在約5mM和約40mM之間。
10.根據(jù)權(quán)利要求I的方法,其還是對(duì)靶標(biāo)DNA分子進(jìn)行DNA片段化和標(biāo)記的組合方法。
11.對(duì)靶標(biāo)DNA分子進(jìn)行DNA片段化和標(biāo)記的組合的體外方法,所述方法包括 使 革巴標(biāo)DNA分子; 包含至少一個(gè)雙鏈部分的第一 DNA分子, 其中所述雙鏈部分包含轉(zhuǎn)座酶的第一識(shí)別序列; 包含至少一個(gè)雙鏈部分的第二 DNA分子, 其中所述雙鏈部分包含上述轉(zhuǎn)座酶的第二識(shí)別序列;和上述轉(zhuǎn)座酶 組合;使上述組合經(jīng)受使得第一 DNA分子、第二 DNA分子和上述轉(zhuǎn)座酶可與靶標(biāo)DNA分子締合并通過(guò)轉(zhuǎn)座酶-介導(dǎo)的切割來(lái)切割靶標(biāo)DNA分子的條件,以提供切割的并標(biāo)記的DNA產(chǎn)物, 其中所述條件包括I-IOOmM的Mn+2、Mg+2或二者皆有。
12.根據(jù)權(quán)利要求11的方法,其中所述第一識(shí)別序不同于所述第二識(shí)別序列。
13.根據(jù)權(quán)利要求11的方法,其中使所述第一DNA分子、所述第二DNA分子和所述轉(zhuǎn)座酶組合而得到一復(fù)合體,之后使該復(fù)合體與靶標(biāo)DNA分子組合。
14.根據(jù)權(quán)利要求11的方法,其中所述轉(zhuǎn)座酶是IS4家族轉(zhuǎn)座酶。
15.根據(jù)權(quán)利要求11的方法,其中所述轉(zhuǎn)座酶是在Vibrio種中天然發(fā)現(xiàn)的。
16.根據(jù)權(quán)利要求15的方法,其中所述轉(zhuǎn)座酶是來(lái)自Vibrioharveyi的轉(zhuǎn)座酶。
17.根據(jù)權(quán)利要求11的方法,其中所述轉(zhuǎn)座酶是天然存在轉(zhuǎn)座酶的突變體形式。
18.根據(jù)權(quán)利要求11的方法,其中在切割條件中的鉀離子濃度小于50mM。
19.根據(jù)權(quán)利要求11的方法,其中在切割條件中的所述Mn+2濃度、Mg+2濃度或相加的Mn+2濃度和Mg+2濃度在約5mM和約40mM之間。
20.根據(jù)權(quán)利要求11的方法,其中在切割條件中的所述Mn+2濃度、Mg+2濃度或相加的Mn+2濃度和Mg+2濃度在約IOmM和約20mM之間。
全文摘要
本發(fā)明涉及用于通過(guò)轉(zhuǎn)座酶的DNA片段化和標(biāo)記的方法和組合物。本發(fā)明提供了轉(zhuǎn)座酶-介導(dǎo)的使DNA靶標(biāo)片段化和標(biāo)記的新組合物。本發(fā)明涉及在轉(zhuǎn)座酶反應(yīng)中使用錳離子(Mn2+)來(lái)改進(jìn)轉(zhuǎn)座酶反應(yīng)的令人吃驚的發(fā)現(xiàn)。本發(fā)明還涉及Mg2+離子可以比先前預(yù)想的高很多的水平用于具有野生型和/或工程改造的轉(zhuǎn)座酶的轉(zhuǎn)座酶反應(yīng)中的令人吃驚的發(fā)現(xiàn)。本發(fā)明提供了在體外反應(yīng)中使用天然存在的轉(zhuǎn)座酶,以及用于切割、標(biāo)記和擴(kuò)增靶標(biāo)DNA的改進(jìn)的方案。
文檔編號(hào)C12N15/10GK102796728SQ20121016697
公開日2012年11月28日 申請(qǐng)日期2012年5月23日 優(yōu)先權(quán)日2011年5月23日
發(fā)明者亞歷山大·S·貝爾亞夫 申請(qǐng)人:安捷倫科技有限公司