本發(fā)明涉及核酸克隆和組裝方法,更具體涉及脫氧核糖核酸(dna)克隆和組裝的新方法。
發(fā)明背景
dna克隆是分子生物學(xué)和生物技術(shù)的核心內(nèi)容,是進(jìn)行基因功能研究的關(guān)鍵技術(shù)。隨著dna測序技術(shù)的不斷進(jìn)步和測序成本的不斷降低,全基因組測序變得越來越容易。人們發(fā)現(xiàn)基因組中蘊(yùn)藏著豐富的尚未開發(fā)的資源。短的dna片段可以很容易通過pcr或者化學(xué)合成獲得,但是克隆大于10kb的dna片段傳統(tǒng)方法則要依賴于dna文庫的構(gòu)建和篩選。傳統(tǒng)的文庫構(gòu)建和篩選的方法不但操作復(fù)雜、耗時、費力,而且目的dna片段經(jīng)常分散的位于幾個不同的克隆上,在進(jìn)行基因功能研究時往往需要對其進(jìn)行亞克隆,刪除多余序列或者需要將其縫合成一個完整地生物合成途徑,因此傳統(tǒng)的文庫構(gòu)建和篩選的方法已經(jīng)不能滿足時代發(fā)展的需要,研究者們迫切需要簡單、高效和快捷的基因組dna克隆和修飾技術(shù)。隨著合成生物學(xué)技術(shù)的進(jìn)步,大于10kb的dna大片段還可以通過gibson體外組裝1或者dnaassembler體內(nèi)組裝2等方式由小片段組裝而成。但是上述dna組裝需要pcr或者化學(xué)合成來制備小片段,容易引入隨機(jī)突變并為后期基因功能研究帶來不便。同時,上述方式對于要組裝的dna片段的量要求較高,需要采用純度和濃度相對較高的目標(biāo)dna片段,不能用于直接從酶解的基因組dna片段混合物中組裝目的dna片段。
直接從基因組dna中將特定的dna區(qū)域克隆到載體中,在本文中稱為“直接克隆”。recet直接克隆技術(shù)的原理是:rac噬菌體重組蛋白——全長的rece和rect能夠在大腸桿菌細(xì)胞內(nèi)高效地介導(dǎo)線性dna分子之間發(fā)生同源重組——線線重組。其中rece是5’-3’核酸外切酶,rect是單鏈dna退火蛋白,rece和rect之間的蛋白-蛋白相互作用是線線重組所必須的,recet聯(lián)合作用的線線重組效率是單獨作用的1000倍。recet直接克隆技術(shù)能將大于10kb的基因組dna片段直接捕獲到表達(dá)載體上,而且還能實現(xiàn)2~5個dna片段的組裝。在基因組上一般都能找到合適的限制性酶切位點將目的dna片段釋放出來,然后將限制性酶切的基因組dna和線性載體通過電轉(zhuǎn)化導(dǎo)入表達(dá)了recet重組酶的大腸桿菌細(xì)胞內(nèi),在細(xì)胞內(nèi)目的dna片段和線性載體通過兩端的同源臂發(fā)生同源重組并形成環(huán)狀質(zhì)粒,最后通過抗生素篩選和限制性酶切分析可以獲得含有重組dna分子的菌落。在線性載體和基因組dna都制備好了的情況下,完成目的dna片段的直接克隆只需要3天的時間。目前該技術(shù)已被廣泛應(yīng)用于細(xì)菌天然產(chǎn)物生物合成途徑的克隆和異源表達(dá)研究。比如來源于發(fā)光桿菌發(fā)光光桿狀菌的10個10-52kb的聚酮合酶(pks)/非核糖體多肽合成酶(nrps)基因簇3,來源于類芽孢桿菌paenibacilluslarvae中的12kbsevadicin基因簇4,來源于丁香假單胞菌pseudomonassyringae中的19kbsyringolin基因簇5,來源于伯克氏菌burkholderiadsm7029中的25kbglidobactin基因簇6,以及來源于大腸桿菌e.colinissle1917中的50kbcolibactin基因簇7。
與文庫構(gòu)建和篩選相比,直接克隆所具有的優(yōu)勢驅(qū)動了該領(lǐng)域的很多相關(guān)研究。larionov等人建立了依靠酵母重組系統(tǒng)的tar克隆技術(shù)8,然后他們將tar與cas9切割結(jié)合起來提高了tar克隆的效率使其應(yīng)用起來更方便9,10。最近建立的catch(cas9-assistedtargetingofchromosomesegments)技術(shù)利用cas9體外切割和gibson組裝將dna大片段克隆到bac上11。該方法目前只被應(yīng)用于原核生物基因組,而且在對重組dna進(jìn)行限制性酶切鑒定之前需要先對菌落進(jìn)行pcr預(yù)篩選。據(jù)發(fā)明人所知包括上述兩種方法在內(nèi)的所有目前已知的直接克隆方法都局限于某些專家才能操作。
盡管recet直接克隆技術(shù)在從細(xì)菌基因組上克隆50kb以下的dna片段時操作方便3-6,12,但是卻很難從細(xì)菌基因組上克隆更大的dna片段,也無法從哺乳動物基因組上克隆dna片段。這是由于recet直接克隆技術(shù)依賴于細(xì)胞內(nèi)表達(dá)的recet重組酶,只有當(dāng)克隆載體和目的dna片段同時進(jìn)入一個大腸桿菌細(xì)胞內(nèi)并相遇才能發(fā)生同源重組,這就導(dǎo)致了該技術(shù)的局限性:(1)受到基因組dna片段大小的限制,比如無法從從細(xì)菌基因組中克隆大于50kb的dna片段或者從哺乳動物(比如老鼠和人)中克隆大于10kb的基因組片段。這是因為某一段dna在基因組中的濃度是很低的,這就導(dǎo)致了目的dna片段與克隆載體在轉(zhuǎn)化時同時進(jìn)入一個細(xì)胞的概率是很小的。而且由于受到基因組dna制備過程中物理剪切力的影響的影響,要克隆的目的dna片段越大,其在基因組中的濃度就越低,最終導(dǎo)致目的dna片段與克隆載體共同進(jìn)入一個細(xì)胞的幾率也就越低。老鼠(2800mb)和人(3200mb)的基因組比細(xì)菌基因組(5mb)大了將近3個數(shù)量級,所以相同大小的基因組dna片段在哺乳動物基因組中的濃度要比細(xì)菌低得多,因此在進(jìn)行哺乳動物基因組dna片段直接克隆時,目的dna片段與克隆載體同時進(jìn)入一個大腸桿菌細(xì)胞的幾率也低得多。(2)受到dna片段數(shù)目的影響,對于多片段組裝來說,當(dāng)dna片段數(shù)量超過4個以上時,組裝效率急劇降低,目前recet直接克隆技術(shù)最多只能組裝5個dna片段。對于多片段組裝來說,dna片段的數(shù)量越多,它們共同進(jìn)入一個細(xì)胞的幾率就越低,因此組裝效率也就越低。因此業(yè)界特別需要一個不受dna片段大小和基因組復(fù)雜性限制的易于操作而又應(yīng)用廣泛的直接克隆技術(shù)。
為了解決從基因組中直接克隆大片段的技術(shù)問題,發(fā)明人在體外先用核酸外切酶處理基因組dna和克隆載體,然后再將體外反應(yīng)產(chǎn)物在recet重組酶的存在下進(jìn)行同源重組,從而建立了exocet克隆技術(shù)。exocet技術(shù)不但能夠從細(xì)菌基因組上直接克隆>100kb的dna片段,而且能夠從哺乳動物細(xì)胞和人血中克隆>50kb的dna片段。exocet技術(shù)還能高效的組裝至少20個以上的dna片段,使其形成一個完整的質(zhì)粒。
與recet直接克隆技術(shù)一樣,exocet與pcr相比的優(yōu)勢在于保真性高,不會破壞dna的單倍型,而且目的dna直接克隆到質(zhì)粒載體上以利于表達(dá)研究。此外,exocet比gibson組裝更高效,因為gibson依賴于體外組裝產(chǎn)生的環(huán)狀dna分子。而且,gibson組裝在直接克隆中會產(chǎn)生很嚴(yán)重的由空載體自身環(huán)化產(chǎn)生的背景,這也許是為什么jiang等人11在對重組dna進(jìn)行鑒定之前要進(jìn)行pcr預(yù)篩選的原因;也是zhou等人13在利用gibson組裝從鏈霉菌streptomycesconglobatus基因組上克隆要通過conglobatin基因簇時,需要通過瓊脂糖凝膠電泳去除限制性酶切產(chǎn)生的20kb以下的基因組dna片段的原因。
exocet還可以用于從包括血液,疾病相關(guān)細(xì)胞系等來源的哺乳動物基因組上直接克隆dna片段以助于snps的單倍型研究以及為核酸酶介導(dǎo)的人類干細(xì)胞打靶來快速構(gòu)建單倍型同基因(hit)打靶載體。從病人、臍帶血或體細(xì)胞重編程分離到的人類干細(xì)胞在生物醫(yī)學(xué)研究的重要性越來越受到人們的重視,對干細(xì)胞基因組的精確修飾方法的研究也受到人們的廣泛關(guān)注。改造人類基因組比改造實驗鼠的基因組要更有挑戰(zhàn)性,因為人類的遺傳多樣性很復(fù)雜。同基因性(序列相似性)對同源重組的重要性在很多年前人們對老鼠胚胎干細(xì)胞進(jìn)行基因打靶的時候就意識到了14。但是,序列錯配對同源重組的影響還未研究清楚,比如單個錯配(一個snp或一個indel)到底能降低多少重組效率
exocet具有的從復(fù)雜基因組上選擇性捕獲dna大片段的能力使其成為疾病診斷和病理學(xué)檢驗的手段,比如為個體化醫(yī)療直接捕獲dna序列或者從病人樣本中分離dna病毒。exocet將會廣泛應(yīng)用于功能基因組學(xué)和比較基因組學(xué)研究中,尤其是直接克隆原核生物合成途徑或者為合成生物學(xué)組裝多個dna分子。
技術(shù)實現(xiàn)要素:
在一個方面,本發(fā)明提供了一種同源重組的方法,所述方法包括使用第一核酸外切酶處理兩個或兩個以上目標(biāo)核酸分子,然后使處理后的目標(biāo)核酸分子在第二核酸外切酶和退火蛋白的存在下進(jìn)行同源重組,其中發(fā)生同源重組的目標(biāo)核酸分子之間共享至少一段序列同源區(qū)域。
在一個方面,本發(fā)明提供了一種同源重組的方法,其中所述方法包括使用第一核酸外切酶處理第一核酸分子與第二核酸分子,然后使處理后的第一核酸分子與第二核酸分子在第二核酸外切酶和退火蛋白的存在下進(jìn)行同源重組,其中第一核酸分子和第二核酸分子之間共享至少一段序列同源區(qū)域。
在一個方面,本發(fā)明提供了一種組裝線性核酸分子的方法,所述方法包括使用第一核酸外切酶處理兩個或兩個以上的核酸分子,然后使處理后的核酸分子混合物在第二核酸外切酶和退火蛋白的存在下進(jìn)行同源重組,其中每個核酸分子與在所產(chǎn)生的組裝產(chǎn)物中形成鄰近物的核酸分子共享至少一段序列同源區(qū)域。
在一個方面,本發(fā)明提供了一種克隆基因組dna的方法,其中方法包括使用第一核酸外切酶處理基因組dna片段混合物和線性克隆載體,然后使處理后的基因組dna片段混合物中的目標(biāo)dna片段和線性克隆載體在第二核酸外切酶和退火蛋白的存在下進(jìn)行同源重組,其中基因組dna片段混合物中目標(biāo)dna片段與線性克隆載體之間共享至少一段序列同源區(qū)域。
根據(jù)前述方面任一項的方法,其中所述序列同源區(qū)域可以在目標(biāo)核酸分子內(nèi)部或末端,優(yōu)選至少一個同源區(qū)域在目標(biāo)核酸分子末端,更優(yōu)選同源區(qū)域均在目標(biāo)核酸分子末端。
根據(jù)權(quán)利要求前述方面任一項的方法,其中所述同源區(qū)域的長度為至少6、至少10、至少20、至少25、至少30、至少40、至少50、至少60、至少70、至少80個核苷酸,優(yōu)選25個、40個或80個,最優(yōu)選80個核苷酸。
根據(jù)前述方面任一項的方法,其中所述第一核酸外切酶可以是5’到3’核酸外切酶或是3’到5’核酸外切酶,優(yōu)選t4dna聚合酶、dna聚合酶i的klenow片段、t5核酸外切酶、t7核酸外切酶,最優(yōu)選t4dna聚合酶或t5核酸外切酶。
根據(jù)前述方面任一項的方法,其中所述第一核酸外切酶處理包括體外連接步驟,所述體外連接步驟使兩個或兩個以上目標(biāo)核酸分子或者所述第一核酸分子與所述第二核酸分子連接起來,或者使處理后的線性克隆載體和基因組dna片段混合物中的目標(biāo)dna片段連接起來。
根據(jù)前述方面任一項的方法,其中所述第一核酸外切酶處理包括酶切和退火步驟,其中不同核酸分子的酶切可以是單獨進(jìn)行也可以是同時進(jìn)行,諸如在單個樣品中的混合物中。
根據(jù)前述方面任一項的方法,其中所述第一核酸外切酶處理還包括加入dna聚合酶,dntp和dna連接酶的步驟。
根據(jù)前述方面任一項的方法,其中所述第一核酸外切酶處理還包括加入具有3'-5'核酸外切酶活性的dna聚合酶。
根據(jù)前述方面任一項的方法,其中所述第一核酸外切酶處理排除添加dntps。
根據(jù)前述方面任一項的方法,其中所述第一核酸外切酶處理是t4dna聚合酶處理或gibson組裝。
根據(jù)前述方面任一項的方法,其中所述第二核酸外切酶是rece,優(yōu)選地,所述rece是重組表達(dá)的。
根據(jù)前述方面任一項的方法,其中所述單鏈退火蛋白包括reca、rad51、redβ、rect、pluβ或rad52,優(yōu)選其中所述退火蛋白是rect,更優(yōu)選地,所述rect是重組表達(dá)的。
根據(jù)前述方面任一項的方法,其中所述退火蛋白是rect,優(yōu)選地,所述rect是重組表達(dá)的。
根據(jù)前述方面任一項的方法,其中所述同源重組在體外或宿主細(xì)胞中進(jìn)行。
根據(jù)前述方面任一項的方法,其中所述宿主細(xì)胞可以是酵母細(xì)胞,優(yōu)選酵母細(xì)胞是釀酒酵母細(xì)胞;或者是細(xì)菌細(xì)胞,優(yōu)選細(xì)菌細(xì)胞是枯草芽孢桿菌或大腸桿菌。
根據(jù)前述方面任一項的方法,其中所述宿主細(xì)胞表達(dá)核酸外切酶,優(yōu)選第二核酸外切酶、和退火蛋白。
根據(jù)前述方面任一項的方法,其中所述其中所述宿主細(xì)胞表達(dá)核酸外切酶、退火蛋白和redγ,優(yōu)選地,所述宿主細(xì)胞還表達(dá)reca,最優(yōu)選地,所述宿主細(xì)胞表達(dá)rece、rect、redγ和reca。
根據(jù)前述方面任一項的方法,其中所述宿主細(xì)胞是表達(dá)全長rece和rect的大腸桿菌細(xì)胞,優(yōu)選地,所述宿主細(xì)胞是表達(dá)全長rece、rect和redγ的大腸桿菌細(xì)胞,最優(yōu)選地,所述宿主細(xì)胞是表達(dá)全長rece、rect、redγ和reca的大腸桿菌細(xì)胞。
根據(jù)前述方面任一項的方法,其中所述宿主細(xì)胞是表達(dá)截短的rece和rect的大腸桿菌細(xì)胞。
根據(jù)前述方面任一項的方法,其中所述宿主細(xì)胞是表達(dá)redα和redβ的大腸桿菌細(xì)胞。
根據(jù)根據(jù)前述方面任一項的方法,其中所述宿主細(xì)胞通過在質(zhì)粒載體和/或染色體上表達(dá)核酸外切酶,優(yōu)選第二核酸外切酶、退火蛋白、redγ和/或reca,優(yōu)選地,通過質(zhì)粒載體表達(dá),最優(yōu)選地,通過質(zhì)粒載體和染色體同時表達(dá)。
根據(jù)前述方面任一項的方法,其中所述目標(biāo)核酸分子或目標(biāo)dna片段是線性的,優(yōu)選選自用核酸內(nèi)切酶切割的dna片段、pcr擴(kuò)增的dna片段、基因組dna片段、cdna文庫成員、源自bac的片段和克隆載體片段。
根據(jù)前述方面任一項的方法,其中所述核酸內(nèi)切酶可以是限制性內(nèi)切酶或可編程的核酸內(nèi)切酶,例如cas9。
根據(jù)前述方面任一項的方法,其中所述目標(biāo)核酸分子或dna片段的個數(shù)是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個或更多個。
根據(jù)前述方面任一項的方法,其中所述目標(biāo)核酸分子包括長度為0.5kb或更長(例如,1kb或更長、2.5kb或更長、4kb或更長、5kb或更長、7.5kb或更長、10kb或更長、15kb或更長、20kb或更長、25kb或更長、40kb或更長、50kb或更長、75kb或更長或100kb或更長)的序列。
根據(jù)前述方面任一項的方法,其中:
-所述兩種或更多種目標(biāo)核酸分子、第一目標(biāo)核酸分子和第二目標(biāo)核酸分子或目標(biāo)dna片段包括一種或多種pcr擴(kuò)增的dna片段、基因組dna片段、cdna文庫成員、和/或衍生自bac的片段;
-所述第一核酸外切酶具有3'-5'核酸外切酶活性,優(yōu)選是t4dna聚合酶;
-所述核酸外切酶處理在體外在不存在dntps的情況下進(jìn)行;
-所述第二核酸外切酶是全長rece;
-所述退火蛋白是rect;和
-所述同源重組在表達(dá)所述全長rece和rect的細(xì)菌宿主細(xì)胞中進(jìn)行,優(yōu)選大腸桿菌。
根據(jù)前述方面任一項的方法,其中:
-所述兩種或更多種目標(biāo)核酸分子包括一種或多種pcr擴(kuò)增的dna片段、基因組dna片段、cdna文庫成員、和/或衍生自bac的片段,線性質(zhì)粒和/或克隆載體片段,優(yōu)選三種或更多種線性質(zhì)粒和/或克隆載體片段;
-所述第一核酸外切酶包括gibson組裝;
-所述第二核酸外切酶是全長rece;
-所述退火蛋白是rect;和
-所述同源重組在表達(dá)所述全長rece和rect的細(xì)菌宿主細(xì)胞中進(jìn)行,優(yōu)選大腸桿菌。
根據(jù)前述方面任一項的方法,其中:
-所述兩種或更多種目標(biāo)核酸分子包括三種或多種pcr擴(kuò)增的dna片段、基因組dna片段、cdna文庫成員、或衍生自bac、線性質(zhì)粒和/或克隆載體的片段,優(yōu)選三種或更多種線性質(zhì)粒和/或克隆載體片段;
-所述第一核酸外切酶處理包括gibson組裝;
-所述第二核酸外切酶是全長rece;
-所述退火蛋白是rect;和
-所述同源重組在表達(dá)所述全長rece和rect的細(xì)菌宿主細(xì)胞中進(jìn)行,優(yōu)選大腸桿菌。
試劑盒,其包括前述任一項的方法中所述的第一核酸外切酶和第二核酸外切酶或編碼前述任一項的方法中所述第一核酸外切酶和第二核酸外切酶的核酸。
試劑盒,其包括前述任一項的方法中所述的第一核酸外切酶和第二核酸外切酶或編碼所述第一核酸外切酶和第二核酸外切酶的核酸,優(yōu)選地,所述試劑盒還包括表達(dá)第二核酸外切酶的宿主細(xì)胞,優(yōu)選地,所述宿主細(xì)胞表達(dá)核酸外切酶、退火蛋白和redγ,優(yōu)選地,所述宿主細(xì)胞還表達(dá)reca,最優(yōu)選地,所述宿主細(xì)胞表達(dá)rece、rect、redγ和reca,所述宿主細(xì)胞可以是酵母細(xì)胞,優(yōu)選酵母細(xì)胞是釀酒酵母細(xì)胞;或者是細(xì)菌細(xì)胞,優(yōu)選細(xì)菌細(xì)胞是枯草芽孢桿菌或大腸桿菌,所述宿主細(xì)胞通過在質(zhì)粒載體和/或染色體上表達(dá)核酸外切酶、退火蛋白、redγ和/或reca,優(yōu)選地,通過質(zhì)粒載體表達(dá),最優(yōu)選地,通過質(zhì)粒載體和染色體同時表達(dá),進(jìn)一步優(yōu)選地,所述試劑盒還可包括一個或多個預(yù)先制備的線性載體。
根據(jù)前述任一項的試劑盒,其中所述第一核酸外切酶是具有3'-5'核酸外切酶活性的dna聚合酶,諸如t4dna聚合酶、dna聚合酶i的klenow片段、t5核酸外切酶或t7核酸外切酶,所述第二核酸外切酶是全長rece。
根據(jù)前述任一項的試劑盒,其中所述試劑盒還包括表達(dá)第二核酸外切酶的宿主細(xì)胞,優(yōu)選地所述宿主細(xì)胞中包含編碼全長rece、rect、redγ和reca的核酸。
根據(jù)前述任一項的試劑盒,其中所述試劑盒還可包括一個或多個預(yù)先制備的線性載體。
根據(jù)前述任一項的方法或試劑盒在構(gòu)建打靶載體中的用途。
根據(jù)前述任一項的方法或試劑盒在對哺乳動物細(xì)胞進(jìn)行基因分型中的用途。
根據(jù)前述任一項的方法或試劑盒在合成dna中的用途。
附圖說明
圖1.聯(lián)合使用體外組裝和rece/rect促進(jìn)了直接克隆的效率。(a)從明亮發(fā)光桿菌(p.phosphoreum)ant-2200基因組上直接克隆14kblux基因簇的示意圖。p15a-cm載體和目的基因組dna片段在最末端具有相同序列。(b)同源臂越長克隆效率越高。具有25bp,40bp或80bp同源臂的線性載體分別與基因組dna混合,并且在退火和轉(zhuǎn)化到阿拉伯糖誘導(dǎo)的e.coligb05-dir之前用0.02uμl-1的t4pol在25℃下反應(yīng)20分鐘。誤差線,s.d.;n=3.(c)優(yōu)化t4pol的濃度。具有80bp同源臂的線性載體與基因組dna采用與(b)中相同的方式進(jìn)行處理,唯一不同的t4pol的濃度。(d)t4pol的溫育時間對克隆效率的影響。與(c)相同,使用0.02uμl-1的t4pol,但是采用不同的溫育時間。(e)etga拷貝數(shù)越高克隆效率越高。與(d)相同,溫育時間為1小時,然后將體外組裝產(chǎn)物分別電轉(zhuǎn)化到阿拉伯糖誘導(dǎo)的e.coligb05-dir(在染色體上帶有1個etga的拷貝),含有psc101-bad-etga-tet的gb2005(在psc101質(zhì)粒上帶有~5個etga的拷貝)或者含有psc101-bad-etga-tet的gb05-dir(帶有~6個etga的拷貝)。(f)exocet提高了直接克隆的效率。與(e)相同,使用含有psc101-bad-etga-tet的gb05-dir(exocet),或者不用t4pol處理(etga),或者不用阿拉伯糖誘導(dǎo)(t4pol)。
圖2.不同核酸外切酶對lux基因簇直接克隆的影響。p15a-cm載體和明亮發(fā)光桿菌基因組dna用核酸外切酶處理、退火后電轉(zhuǎn)化到阿拉伯糖誘導(dǎo)的e.coligb05-dir中。(a)初始檢測不同的核酸外切酶。(b-d)優(yōu)化kle,t5exo和t7exo的濃度。(e)用最優(yōu)濃度的t4pol,kle,t5exo和t7exo酶切20min后的克隆效率比較。(f)優(yōu)化t4pol的酶切溫度和時間(0.02uμl-1)。誤差線,s.d.;n=3。
圖3.退火速率對lux基因簇直接克隆的影響.誤差線,s.d.;n=3.p15a-cm載體和明亮發(fā)光桿菌基因組dna用0.02uμl-1t4pol酶切之后采用不同的方式(a,b,c)退火之后電轉(zhuǎn)化到阿拉伯糖誘導(dǎo)的e.coligb05-dir中。
圖4.線性克隆載體的制備和exocet直接克隆技術(shù)的流程圖。(a)通過pcr擴(kuò)增制備p15a-cm載體,所用引物帶有80個核苷酸的同源臂。(b)exocet直接克隆的標(biāo)準(zhǔn)策略。體外組裝產(chǎn)物轉(zhuǎn)化到阿拉伯糖誘導(dǎo)的含有psc101-bad-etga-tet的gb05-dir中,通過抗生素篩選獲得正確的重組子。
圖5.(a)p15a-cm和14kblux基因組dna片段之間的80bp同源臂的位置:(a)兩個同源臂都位于最末端;(b,c)一個位于距離末端1kb的位置,另一個位于最末端;(d)都位于距離末端1kb的位置。反應(yīng)條件與圖1f相同。(b)利用上述四種同源臂通過etga,t4pol或exocet獲得到菌落數(shù)。(c)在gb2005中利用exocet和末端同源臂通過psc101質(zhì)粒表達(dá)的不同重組蛋白組合獲得的14kblux基因簇直接克隆效率:etg-不表達(dá)reca;eg-不表達(dá)reca和rect;tg-不表達(dá)reca和rece;psc101-tet–空載體。誤差線,s.d.;n=3.
圖6.利用ecorv或cas9酶切的白色鏈霉菌s.albus基因組dna直接克隆106kb的鹽霉素基因簇。(a)利用exocet從ecorv或cas9grna2/cas9-grna7酶切的基因組dna上將鹽霉素基因簇克隆到pbelobac11載體上。同源臂(藍(lán)色)先被插入bac載體上并通過bamhi酶切將bac載體線性化作為直接克隆載體。同源臂長度標(biāo)示于基因組dna片段的末端。(b)重組dna的pvuii限制性酶切分析,正確的克隆用箭頭標(biāo)示。
圖7exocet和gibson組裝的效率比較.(a)從老鼠基因組上利用末端同源臂直接克隆含有wnt4基因的45kbdna片段的示意圖。(b)通過exocet和gibson方法獲得的菌落數(shù)。p15a-cm和swai酶切的老鼠基因組dna分別通過exocet和gibson處理,然后轉(zhuǎn)化到阿拉伯糖誘導(dǎo)(exocet或gibson+etga)或不誘導(dǎo)(t4pol或gibson)的含有psc101-bad-etga-tet的gb05-dir中。(c)通過t4pol、exocet、gibson和gibson+etga將多個dna片段組裝成質(zhì)粒的示意圖。dna片段大小為1.0kb~5.4kb,組裝成的p5a質(zhì)粒大小為29.8kb~54.9kb,而且?guī)в新让顾乜剐裕╟m)。(d)多片段組裝實驗得到的克隆數(shù)及正確率。體外組裝的產(chǎn)物轉(zhuǎn)化到阿拉伯糖誘導(dǎo)(exocet或gibson+etga)或不誘導(dǎo)(t4pol或gibson)的含有psc101-bad-etga-tet的gb05-dir中。
圖8.利用哺乳動物基因組dna為dpy30構(gòu)建hit(單倍型同基因打靶)載體。(a)利用spei酶切的人類基因組dna克隆dpy30終止密碼子區(qū)域的示意圖。直接克隆完成后,通過redαβ重組工程mvenus元件16,17標(biāo)記到dpy30的c端。(b)對利用從人血中分離的基因組dna通過exocet進(jìn)行直接克隆獲得的重組dna進(jìn)行ecori酶切分析。(c)對利用從人類胚胎腎臟293t細(xì)胞中分離的基因組dna通過exocet進(jìn)行直接克隆獲得的重組dna進(jìn)行ecori酶切分析。(d)對通過redαβ重組工程插入mvenus元件后獲得的重組dna進(jìn)行pvuii酶切分析。獲得的所有克隆都是正確的,其中11泳道是對照。正確的克隆用箭頭標(biāo)示。
圖9.利用老鼠細(xì)胞基因組dna為dpy30構(gòu)建hit(單倍型同基因打靶)載體。(a)利用bamhi+kpni酶切的老鼠基因組dna克隆dpy30終止密碼子區(qū)域的示意圖。直接克隆完成后,通過redαβ重組工程mvenus元件16,17標(biāo)記到dpy30的c端。(b)對利用從老鼠黑色素瘤b16細(xì)胞中分離的基因組dna通過exocet進(jìn)行直接克隆獲得的重組dna進(jìn)行ecori酶切分析。(c)對通過redαβ重組工程插入mvenus元件后獲得的重組dna進(jìn)行nhei酶切分析。獲得的所有克隆都是正確的,其中11泳道是對照。正確的克隆用箭頭標(biāo)示。
圖10利用exocet對哺乳動物細(xì)胞進(jìn)行基因分型。(a)利用exocet進(jìn)行基因分型的原理圖。限制性酶切位點分別位于打靶元件的上游和下游。(b)利用exocet對具有卡那霉素抗性的kmt2d-aid-neo打靶老鼠胚胎干細(xì)胞進(jìn)行基因分型。利用sspi和spei從基因組上釋放含有打靶元件的dna片段。使用10ug酶切的基因組dna和pcr擴(kuò)增的p15a-cm載體進(jìn)行exocet克隆??寺〉絧15a載體中的打靶片段和野生型片段可以通過雙劃線和限制性酶切區(qū)分開。
圖11.對klf4-venus-neo打靶的老鼠胚胎干細(xì)胞進(jìn)行exocet基因分型得到的氯霉素抗性菌落的ecorv+psti限制性酶切分析。
具體實施方案
dna重組工程是在大腸桿菌(e.coli)細(xì)胞內(nèi)利用噬菌體syn/exo蛋白(主要是redα和redβ)18-22介導(dǎo)的同源重組對dna分子進(jìn)行修飾的基因工程技術(shù)。dna重組工程技術(shù)最開始是在e.colisbca(recbc抑制子)菌株中發(fā)現(xiàn)的,該菌株具有高效介導(dǎo)帶有同源臂(homologyboxes)的dna分子之間發(fā)生同源重組的活性23。sbca菌株是由ajclark在e.coli中尋找同源重組途徑的經(jīng)典試驗中發(fā)現(xiàn)的。他利用對dna損傷非常敏感的recbc菌株來篩選其抑制子時發(fā)現(xiàn)了具有rece和rect表達(dá)活性的sbca突變菌株24-26。隨后研究發(fā)現(xiàn)rece和rect是由整合在染色體上的rac噬菌體表達(dá)的,它們與噬菌體的redα和redβ的功能相同27,而且在sbca突變菌株只表達(dá)了rece蛋白c端的280個氨基酸28-30。截短的rece與redα(266個氨基酸)相似,是一個5’-3’核酸外切酶31,rect與redβ類似,是一個單鏈dna退火蛋白(ssap,singlestrandannealingprotein)32。rece/rect和redα/redβ屬于5’-3’核酸外切酶/ssapsyn/exo蛋白對21,33,而且每對蛋白之間特異性的蛋白-蛋白相互作用勢雙鏈dna的同源重組所必需的29,34,35。redα/redβ介導(dǎo)的同源重組主要發(fā)生在復(fù)制叉上而且要求復(fù)制進(jìn)行36,37。雖然一開始發(fā)明人是通過截短的rece/rect發(fā)現(xiàn)的重組工程技術(shù),但是后來發(fā)明人主要利用redα/redβ來修飾dna分子,因為后者的效率更高16,38-42。盡管如此,發(fā)明人還是在不停地研究rece/rect的特性,而且發(fā)現(xiàn)recen端的600個氨基酸殘基將其重組活性由復(fù)制依賴型變成了復(fù)制不依賴型3。因此,兩個線性dna分子可以通過很短的同源臂發(fā)生高效的同源重組而形成環(huán)狀質(zhì)粒。與redα/redβ重組工程相比,這種線線重組機(jī)制具有不同的應(yīng)用范圍,比如從基因組上直接克隆dna大片段3-6,12或者進(jìn)行dna的多片段組裝15,43。
本發(fā)明提供了一種用于在共享至少一段序列同源區(qū)域的兩個或兩個以上的目標(biāo)線性核酸分子之間進(jìn)行同源重組(線線重組)的方法,其中所述方法包括使用第一核酸外切酶處理目標(biāo)線性核酸分子的混合物;然后使處理后的目標(biāo)線性核酸分子在第二核酸外切酶和退火蛋白的存在下進(jìn)行同源重組。其中所述第二核酸外切酶可以是rece,來自大腸桿菌k12的全長rece的氨基酸序列在wo2011/154927中公開。其中所述第二核酸外切酶也可以是截短的rece,這些截短形式的rece包括第588-866、595-866、602-866或606-866位氨基酸構(gòu)成的rece蛋白29。
所述第二核酸外切酶與退火蛋白共同介導(dǎo)同源重組。在一些實施方案中,在本發(fā)明的方法中使用的退火蛋白是wo2011/154927中公開的退火蛋白。優(yōu)選的,所述退火蛋白是rect或其片段(源自rac噬菌體)。更優(yōu)選的,所述退火蛋白是全長rect并且所述第二核酸外切酶是全長rece。但是,可以使用任何其它合適的退火蛋白,只要該退火蛋白與所使用的核酸外切酶共同作用。其它合適的噬菌體退火蛋白的實例提供于wo02/062988。線線重組可以在缺乏rect表達(dá)的某些宿主細(xì)胞如大腸桿菌菌株gb2005中發(fā)生,可能是由于存在某些內(nèi)源rect-樣活性。但是,由全長rece介導(dǎo)的線線重組的效率在rect的存在下顯著升高。
本發(fā)明的方法在宿主細(xì)胞中可受到全部或部分的影響。合適的宿主細(xì)胞包括許多物種的細(xì)胞,包括寄生蟲、原核生物和真核生物,但是細(xì)菌如革蘭氏陰性細(xì)菌是優(yōu)選的宿主。更優(yōu)選的,宿主細(xì)胞是腸細(xì)菌細(xì)胞,如沙門氏菌(salmonella)、克雷伯氏菌(klebsiella)、芽孢桿菌(bacillus)、奈瑟氏菌(neisseria)、發(fā)光桿菌(photorhabdus)或大腸桿菌(escherichiacoli)細(xì)胞(本發(fā)明的方法在已檢測的所有大腸桿菌菌株中都起著有效的作用)。優(yōu)選的宿主細(xì)胞是大腸桿菌k12。然而應(yīng)當(dāng)注意,本發(fā)明的方法同樣適用于真核細(xì)胞或生物體中,如真菌、酵母、植物或動物細(xì)胞。該系統(tǒng)已經(jīng)證實在小鼠es細(xì)胞中具有功能,并且有理由推測在其他真核細(xì)胞細(xì)胞中也有功能。典型地,宿主細(xì)胞是分離的宿主細(xì)胞,但是同樣可以使用未分離的宿主細(xì)胞。
本發(fā)明所述宿主細(xì)胞包含編碼核酸外切酶(優(yōu)選全長rece)、退火蛋白(優(yōu)選rect)和redγ的核酸。在一些實施方案中,所述宿主細(xì)胞還包含編碼reca的核酸。優(yōu)選地,所述宿主細(xì)胞表達(dá)rece、rect和redγ、以及任選的reca。最優(yōu)選的,所述宿主細(xì)胞表達(dá)rece、rect、redγ和reca。
本發(fā)明所述核酸外切酶、退火蛋白、redγ和/或reca可以由外源dna在宿主細(xì)胞中重組表達(dá),例如,由轉(zhuǎn)化進(jìn)宿主細(xì)胞中的載體表達(dá)。一個合適載體的實例是psc101質(zhì)粒,但是也可以使用其它合適的載體。任何合適的啟動子都可以用來驅(qū)動這些蛋白的表達(dá)。但是,在表達(dá)rece時,優(yōu)選誘導(dǎo)型啟動子,如阿拉伯糖誘導(dǎo)型啟動子(pbad)或鼠李糖誘導(dǎo)啟動子(prhasr)。這些啟動子都是本領(lǐng)域公知的。
本發(fā)明所述宿主細(xì)胞通過在質(zhì)粒載體或者染色體上由誘導(dǎo)型啟動子表達(dá)核酸外切酶、退火蛋白、redγ和/或reca。優(yōu)選地,核酸外切酶、退火蛋白、redγ和/或reca通過質(zhì)粒載體在宿主細(xì)胞中表達(dá)。最優(yōu)選地,核酸外切酶、退火蛋白、redγ和/或reca通過質(zhì)粒載體和染色體同時在宿主細(xì)胞中表達(dá)。
大腸桿菌k12宿主細(xì)胞的基因組中包括全長rece基因和rect基因的內(nèi)源性拷貝,它們存在于已整合到宿主基因組中的rac噬菌體。但是,由于該基因是沉默的,因此全長rece的表達(dá)并不能由該整合基因自然發(fā)生。因此,在5’到3’核酸外切酶由外源dna表達(dá)的實施方案中,可在不存在內(nèi)源性rece基因情況下實施所述方法。
還提供轉(zhuǎn)化了編碼如上所述核酸外切酶的核酸分子的宿主細(xì)胞。優(yōu)選地,所述核酸外切酶由所述核酸分子表達(dá),因此本發(fā)明還提供了表達(dá)本發(fā)明的方法中列舉的核酸外切酶的宿主細(xì)胞。核酸外切酶優(yōu)選地在誘導(dǎo)性啟動子的控制下表達(dá),如阿拉伯糖誘導(dǎo)型啟動子(pbad)或鼠李糖誘導(dǎo)型啟動子(prhasr)。
還設(shè)想在前述實施方案中,本發(fā)明的方法在體外受到全部或者部分的影響。例如,可以使用純化的5’到3’核酸外切酶和退火蛋白(優(yōu)選純化的rece和rect蛋白),或者使用表達(dá)所述5’到3’核酸外切酶和退火蛋白的大腸桿菌細(xì)胞的提取物。當(dāng)在體外實施該方法時,對所述第一和第二線性目標(biāo)核酸分子進(jìn)行預(yù)處理以暴露單鏈同源末端是有利的。
線線重組需要目標(biāo)線性核酸分子之間必須共享至少一個序列同源區(qū)域,通過所述區(qū)域發(fā)生同源重組。在一些實施方案中,所述第一目標(biāo)核酸分子與所述第二目標(biāo)核酸分子共享一個序列同源區(qū)域,以使第一和第二目標(biāo)核酸分子之間的線線重組產(chǎn)生線性產(chǎn)物。在所述第一和第二線性核酸和一個或多個額外的線性核酸之間發(fā)生線線重組以形成線性產(chǎn)物的實施方案中,每個線性核酸與在線線重組反應(yīng)的線性產(chǎn)物中形成其鄰近物的線性核酸共享一個序列同源區(qū)域。在所述第一和第二線性核酸和一個或多個額外的線性目標(biāo)核酸分子之間發(fā)生線線重組以形成環(huán)狀產(chǎn)物的實施方案中,每個線性核酸與在線線重組反應(yīng)的環(huán)狀產(chǎn)物中形成其鄰近物的線性核酸共享一個序列同源區(qū)域。在一些實施方案中,所述第一目標(biāo)核酸分子和所述第二目標(biāo)核酸分子共享兩個序列同源區(qū)域,以使第一和第二目標(biāo)核酸分子之間的線線重組形成環(huán)狀分子。本領(lǐng)域技術(shù)人員知道如何設(shè)計同源區(qū)域以形成線性分子或環(huán)狀分子。
優(yōu)選的,至少一個同源臂在每個線性片段的最末端。當(dāng)同源臂在每個線性片段的最末端并且不同的同源臂在另一端時,這些序列同源區(qū)域或“同源臂”產(chǎn)生最佳構(gòu)型,如此構(gòu)造這些同源臂以使重組產(chǎn)生環(huán)。當(dāng)同源臂不位于末端時可以發(fā)生線線重組,但是效率會降低。因此,在優(yōu)選的實施方案中,所述同源的至少一個區(qū)域位于所述目標(biāo)核酸分子的一個或兩個末端的最外端。在一些實施方案中,所述同源區(qū)域位于所述某一目標(biāo)核酸分子的內(nèi)部。
本發(fā)明所述的序列同源區(qū)域的長度為至少4、至少6、至少10、至少20、至少30個、至少40、至少50、至少60、至少70、至少80、至少90、至少100個核苷酸。例如,在一些實施方案中,序列同源區(qū)域為4-6、6-9、6-30、6-100、10-20、20-29、20-40、20-50、10-100、25-30、25-40、25-50、30-40、30-50、40-50、40-80個或80個以上核苷酸。同源重組的效率通常會隨著使用的同源臂的長度而增加,因此可以使用較長的同源臂。
兩個核酸分子之間的“同源”是指對兩個核酸分子的序列進(jìn)行比對時,有許多核苷酸殘基在所述序列的相同位置上是相同的。同源的程度很容易計算出來(computationalmolecularbiology,lesk,a.m.,ed.,oxforduniversitypress,newyork,1988;biocomputing.informaticsandgenomeprojects,smith,d.w.,ed.,academicpress,newyork,1993;computeranalysisofsequencedata,part1,griffin,a.m.,andgriffin,h.g.,eds.,humanapress,newjersey,1994;sequenceanalysisinmolecularbiology,vonheinje,g.,academicpress,1987;andsequenceanalysisprimer,gribskov,m.anddevereux,j.,eds.,mstocktonpress,newyork,1991)。
在一些實施方案中,本發(fā)明的方法包括將多個線性核酸分子連在一起形成環(huán)狀核酸分子,例如環(huán)狀質(zhì)粒。其中每個目標(biāo)核酸分子與在所產(chǎn)生的環(huán)狀產(chǎn)物中形成鄰近物的目標(biāo)核酸分子共享一段同源區(qū)域,并按照本發(fā)明的方法進(jìn)行線線重組。目標(biāo)核酸分子個數(shù)是2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個或更多個。
在一些實施方案中,至少一個目標(biāo)線性核酸分子包含選擇標(biāo)志物以允許選擇正確的重組體。本發(fā)明中可以使用任意合適的選擇標(biāo)志物。在一些實施方案中,選擇標(biāo)志物是抗生素抗性基因,例如,氯霉素,氨芐青霉素,卡那霉素,或殺稻瘟菌素的抗性基因。
所述目標(biāo)線性核酸分子可以源自任意合適的來源。例如,可以包括來自真核生物或原核生物的核酸序列。在一些實施方案中,所述第一目標(biāo)線性核酸分子是基因組dna。典型的,所述基因組dna是基因組dna的片段。所述基因組dna優(yōu)選包括感興趣的序列。在一些實施方案中,基因組dna片段可以通過剪切或消化基因組dna(例如使用限制性內(nèi)切酶)獲得包含感興趣的完整序列。在一些實施方案中,所述第一目標(biāo)線性核酸分子(例如,基因組dna片段、cdna文庫成員或源自bac的片段)包括2kb或更長(例如,2.5kb或更長、4kb或更長、5kb或更長、7.5kb或更長、10kb或更長、15kb或更長、20kb或更長、25kb或更長、40kb或更長、50kb或更長、75kb或更長或100kb或更長)的感興趣的序列。優(yōu)選的,感興趣的序列是在第一目標(biāo)線性核酸分子的任一端的同源臂之間的全部區(qū)域。例如,編碼次級代謝產(chǎn)物途徑或脂肪酸合成途徑的基因簇。在一些實施方案中,本發(fā)明方法可用于從人類或者非人類動物基因組中直接克隆dna區(qū)域,例如,用于健康研究或通過基因打靶進(jìn)行修正的再生治療。例如,在一些實施方案中,所述第一目標(biāo)核酸分子包括或由來自人或非人類動物的基因組dna片段組成。所述基因組dna片段可以包括感興趣的序列,如包含突變的基因,其中該突變導(dǎo)致疾病或者病癥并且將該突變修正為野生型序列可以治療或預(yù)防該疾病或病癥。在所述第一目標(biāo)核酸分子是基因組dna片段的實施方案中,所述第二目標(biāo)核酸分子優(yōu)選線性化的克隆載體。
在所述第一目標(biāo)核酸分子是基因組dna片段的實施方案中,所述方法包括通過消化或剪切基因組dna來生成第一目標(biāo)核酸分子以獲得包含感興趣的序列的線性基因組dna片段,接著使用第一核酸外切酶處理基因組dna片段與線性克隆載體的混合物,處理包括酶切目標(biāo)核酸分子和退火使酶切后的目標(biāo)核酸分子連接的步驟,然后將處理后的核酸分子的混合物共電轉(zhuǎn)化至宿主細(xì)胞中。所述第二目標(biāo)核酸分子優(yōu)選包含選擇標(biāo)志物。
在一個實施方案中,本公開的方法包括體外連接dna分子的步驟。
在一個優(yōu)選實施方案中,所述體外連接步驟包括核酸外切酶消化隨后是退火。
在另一個優(yōu)選實施方案中,所述核酸外切酶是t4聚合酶。
在另一個優(yōu)選實施方案中,所述體外連接步驟包括gibson組裝。
在另一個優(yōu)選實施方案中,所述體外連接步驟包括通過dna聚合酶的dna合成,所述dna合成使用或不使用核酸外切酶,隨后是退火。
在另一個優(yōu)選實施方案中,所述體外連接步驟包括由單鏈退火蛋白促進(jìn)的退火,所述單鏈退火蛋白諸如reca/rad51、redβ、rect、pluβ或rad52。
在另一個優(yōu)選實施方案中,用于同源重組的宿主細(xì)胞是大腸桿菌細(xì)胞。
在另一個優(yōu)選實施方案中,用于同源重組的宿主細(xì)胞是表達(dá)全長rece和/或rect的大腸桿菌細(xì)胞。
在另一個優(yōu)選實施方案中,用于同源重組的宿主細(xì)胞是表達(dá)全長rece、rect和/或redγ的大腸桿菌細(xì)胞。
在另一個優(yōu)選實施方案中,用于同源重組的宿主細(xì)胞是表達(dá)截短的rece、rect和/或redγ的大腸桿菌細(xì)胞。
在另一個優(yōu)選實施方案中,用于同源重組的宿主細(xì)胞是表達(dá)全長rece和/或rect的任何細(xì)菌宿主細(xì)胞。
在另一個優(yōu)選實施方案中,用于同源重組的宿主細(xì)胞是表達(dá)redα、redβ和/或redγ的大腸桿菌細(xì)胞。
在另一個優(yōu)選實施方案中,用于同源重組的宿主細(xì)胞是釀酒酵母細(xì)胞。
提供了用于本發(fā)明的試劑盒。在一些實施方案中,所述試劑盒包括編碼本文描述的核酸外切酶的核酸。在一些實施方案中,所述試劑盒包括在此處描述的核酸外切酶。優(yōu)選的,所述第一核酸外切酶是t4dna聚合酶(t4dnapolymerase;t4pol)、dna聚合酶i的klenow片段(klenowfragmentofdnapolymerasei;kle)、t7dna聚合酶(t7dnapolymerase;t7pol)、核酸外切酶iii(exonucleaseiii;exoiii)、phusiondna聚合酶(phusiondnapolymerase;phu)、t5核酸外切酶(t5exonuclease;t5exo)、t7核酸外切酶(t7exonuclease;t7exo)和lambda核酸外切酶(lambdaexonuclease;λexo),所述第二核酸外切酶是全長rece。更優(yōu)選的,所述試劑盒包括本文描述的宿主細(xì)胞。例如,在一些實施方案中,試劑盒中的宿主細(xì)胞包括在可誘導(dǎo)啟動子控制下編碼本文所述的全長rece、rect、redγ和reca的核酸。所述試劑盒還可包括一個或多個預(yù)先制備的線性克隆載體。
本發(fā)明的另一優(yōu)選應(yīng)用涉及合成生物學(xué)中的線性核酸分子的組裝,所述線性核酸分子優(yōu)選線性dna。因此,在一些實施方案中,所述第一和第二目標(biāo)核酸分子是線性的,并且所述方法進(jìn)一步包括在5’到3’核酸外切酶和退火蛋白的存在下將所述第一和第二目標(biāo)核酸分子與一個或多個其它線性目標(biāo)核酸分子(例如,1、2、3、4、5、6、7、8、9、至少10、至少20個其它目標(biāo)核酸分子)接觸以產(chǎn)生線性或環(huán)狀產(chǎn)物。在優(yōu)選的實施方案中,第一和第二目標(biāo)核酸分子以及一個或多個其它目標(biāo)核酸分子之間的同源重組導(dǎo)致基因、操縱子、染色體或整個基因組的產(chǎn)生。dna核酸的合成生物學(xué)組裝已經(jīng)用來產(chǎn)生基因、操縱子、染色體,或在最近用來產(chǎn)生整個基因組。在本發(fā)明實施方案中,基于第一核酸外切酶和第二核酸外切酶的聯(lián)合作用使線性核酸分子組裝效率顯著提高,本發(fā)明將成為商業(yè)上和研究中合成生物學(xué)dna組裝的一種優(yōu)選方法。
本發(fā)明的另一優(yōu)選應(yīng)用是構(gòu)建單倍型同基因打靶載體,利用本發(fā)明的方法從哺乳動物基因組上直接克隆5至10kb的dna片段作為同基因同源臂,這些dna片段不僅是相同的基因而且維持了多態(tài)性的單倍型,所以發(fā)明人稱之為單倍型同基因打靶載體,即“hit”(haplotypicisogenictargeting)載體。然后通過重組工程將篩選標(biāo)記以及其它功能元件插入到hit載體上獲得用于打靶的載體。本發(fā)明的另一優(yōu)選應(yīng)用是對哺乳動物細(xì)胞進(jìn)行基因分型。應(yīng)用本發(fā)明的方法從可能的打靶胚胎干細(xì)胞的基因組上克隆含有完整打靶元件的dna片段,對克隆獲得的重組質(zhì)粒進(jìn)行限制性酶切分析和dna測序,根據(jù)結(jié)果判斷細(xì)胞是否打靶成功。
實施例
材料和方法
菌株和質(zhì)粒
e.coligb2005在dh10b基礎(chǔ)上敲除了fhua,ybcc和recet3,16,44.gb05-dir是在gb2005的染色體上整合了pbad-etga操縱子(pbad啟動子調(diào)控下的rece,rect,redγ和reca)3.gb08-red是在gb2005的染色體上整合了pbad-gbaa操縱子(pbad啟動子調(diào)控下的redγ,redβ,redα和reca)16.psc101-bad-etga-tet3帶有四環(huán)素抗性基因和pbad-etga操縱子的溫度敏感型質(zhì)粒,它可以在30℃復(fù)制,但是卻不能在37℃復(fù)制,因此在無選擇壓力下通過改變溫度就能輕易將其消除。
基因組dna的制備和酶切
革蘭陰性細(xì)菌明亮發(fā)光桿菌(photobacteriumphosphoreum)ant-2200和發(fā)光光桿狀菌(photorhabdusluminescens)dsm15139在50ml培養(yǎng)基中培養(yǎng)過夜。離心收集的細(xì)胞懸浮在8ml10mmtris-hcl(ph8.0)中,然后加500ul20mgml-1蛋白酶k和1ml10%sds,50度溫浴2h直至溶液變澄清。酚氯仿抽提和乙醇沉淀獲得基因組dna,最后溶于10mmtris-hcl(ph8.0)中。
革蘭陽性細(xì)菌白色鏈霉菌(streptomycesalbus)dsm41398在50mltsb培養(yǎng)基中30度培養(yǎng)2天。根據(jù)參考文獻(xiàn)45的方法提取基因組dna,主要流程如下:菌體重懸于8mlset(75mmnacl,25mmedta,20mmtris,ph8.0)中,添加10mg溶菌酶,37度溫浴1h,然后加500ul20mgml-1蛋白酶k和1ml10%sds,50度溫浴2h直至溶液變澄清,然后加3.5ml5mnacl。酚氯仿抽提和乙醇沉淀獲得基因組dna,最后溶于10mmtris-hcl(ph8.0)中。
老鼠黑色素瘤細(xì)胞b16、人胚胎腎細(xì)胞293t和人血的基因組使用qiagenblood&cellculturedna試劑盒提取,步驟略加改動,裂解細(xì)胞用蛋白酶k處理后用酚氯仿抽提和乙醇沉淀獲得基因組dna,最后溶于10mmtris-hcl(ph8.0)中。
明亮發(fā)光桿菌ant-2200的基因組dna用bamhi+kpni酶切以克隆lux基因簇。p.luminescensdsm15139的基因組dna用xbai酶切以克隆plu3535-plu3532;用xbai+xmai酶切以克隆plu2670。白色鏈霉菌s.albus的基因組dna用ecorv或cas9-grna酶切以克隆鹽霉素基因簇。老鼠細(xì)胞b16的基因組dna用hpai酶切以克隆prkar1a,用bamhi+kpni酶切以克隆dpy30,用swai酶切以克隆wnt4或lmbr1l-tuba1a。人的基因組dna用ndei+bstz17i酶切以克隆igflr1-lin37,用spei酶切以克隆dpy30,用bstz17i酶切以克隆igflr1-arhgap33,用ndei酶切以克隆zbtb32-lin37。酶切的基因組用酚氯仿抽提和乙醇沉淀,最后溶于ddh2o,濃度大約1ug/ul。
白色鏈霉菌s.albus基因組dna的cas9酶切
s.pyogenescas9蛋白購自newenglandbiolab公司。白色鏈霉菌s.albus基因組dna的cas9酶切在含有80ul10×cas9反應(yīng)緩沖液(neb)(neb),80μg基因組dna,40μggrna-2,40μggrna-7和20μgcas9的800ul反應(yīng)體系中進(jìn)行。由于cas9的切割效率受到dna底物純度的嚴(yán)重影響,所以在此試驗中,白色鏈霉菌s.albus基因組dna需要利用酚-氯仿-異戊醇(25:24:1,ph8.0)抽提三次,以保證cas9切割的效率。37℃溫育6小時后,加入100μgrnasea(thermoscientific),37℃溫育1小時后加入100μg蛋白酶k(roche),繼續(xù)50℃溫育1h。然后將基因組dna再用酚-氯仿-異戊醇(25:24:1,ph8.0)抽提一次,經(jīng)乙醇沉淀后,溶于適量ddh2o中,使其終濃度在1μgul-1左右。最后將10μgcas9切割后的基因組dna用于本發(fā)明方法的克隆實驗。
線性克隆載體的制備
pcr擴(kuò)增(圖4)p15a-cm載體的模板質(zhì)粒為p15a-pamp-luxabecd(購自genebridge公司),使用primestarmaxdna聚合酶(takara),所用引物(表1)含有80個核苷酸的同源臂并通過page純化。pcr產(chǎn)物通過膠回收來排除引物對后續(xù)實驗的干擾,所用試劑盒為qiaquick凝膠提取試劑盒(qiagen),最后dna用ddh2o洗脫,濃度大約200ng/ul,使用200ng進(jìn)行exocet克隆實驗。
用來克隆106kb鹽霉素基因簇的pbelobac11載體和克隆plu3535-3532的pbac2015載體的構(gòu)建方法如文獻(xiàn)43和文獻(xiàn)46所述。通過bamhi酶切暴露出兩端的同源臂,然后通過酚-氯仿-異戊醇(25:24:1,ph8.0)抽提和異丙醇沉淀收集dna,最后溶于ddh2o,濃度大約1ug/ul。使用1μgbac載體進(jìn)行exocet克隆實驗。
表1p15a-cm線性載體擴(kuò)增的寡核苷酸
小寫字母為同源臂序列。
多片段組裝的pcr產(chǎn)物制備
以p.luminescensdsm15139基因組dna為模板,用primestarmaxdna聚合酶(takara)擴(kuò)增的pcr產(chǎn)物相互之間帶有40bp的同源臂。pcr產(chǎn)物用膠回收純化,所用試劑盒為qiaquick凝膠提取試劑盒(qiagen),最后用ddh2o洗脫,濃度大約200ng/ul。每個片段使用250ng進(jìn)行組裝實驗。
mvenus-pgk-neodna元件的制備
以pr6k-2ty1-2pres-mvenus-biotin-pgk-em7-neo17為模板,利用primestarmaxdna聚合酶(takara)pcr擴(kuò)增mvenus-pgk-neo元件。所用引物如表s7所示。pcr產(chǎn)物經(jīng)試劑盒qiaquickpcr純化試劑盒(qiagen)純化后,用ddh2o,濃度大約為100ngul-1.使用200ng進(jìn)行同源重組實驗。
體外組裝
在0.2mlpcr管中加入10ugdna分子,200ng2.2kbp15a-cm線性載體(或者1ug8kbpbelobac11載體),2ul10×ne緩沖液2.1和0.13ul3uul-1t4dna聚合酶(t4pol),用水補(bǔ)至20ul。然后再pcr儀中進(jìn)行如下循環(huán):25度1h,75度20min,50度30min,最后4度保溫。在多片段組裝實驗中,25度反應(yīng)時間為20分鐘。反應(yīng)產(chǎn)物在轉(zhuǎn)化之前用millipore膜過濾器(merck-millipore,cat.no.vswp01300)脫鹽,室溫30min。
其他核酸外切酶的反應(yīng)程序如下:t5核酸外切酶(t5exo):50度30min,4度保溫;t7核酸外切酶(t7exo):25度20min,50度30min,最后4度保溫;klenow大片段(kle)、t7dna聚合酶(t7pol)、lambda核酸外切酶(lamexo):25度20min,75度20min,50度30min,最后4度保溫;核酸外切酶iii(exoiii):37度20min,75度20min,50度30min,最后4度保溫;phusiondna聚合酶(phu):37度20min,50度30min,最后4度保溫;gibson組裝(neb,cat.e2611)的反應(yīng)程序如下:50度30min,最后4度保溫。
電轉(zhuǎn)化感受態(tài)大腸桿菌細(xì)胞的制備
含有質(zhì)粒psc101-bad-etga-tet的e.coligb05-dir在加有4ug/ml四環(huán)素的lb中30度培養(yǎng)過夜(od600=3~4)。將40ul過夜培養(yǎng)物(od600=3~4)轉(zhuǎn)接到加有合適抗生素的1.4mllb中,置于eppendorf熱混合器上30度,950rpm培養(yǎng)2h(od600=0.35~0.4)。加入35ul10%l-arabinose(w/v,inddh2o)來誘導(dǎo)重組酶(etga或gbaa)表達(dá),37度繼續(xù)培養(yǎng)40min(od600=0.7~0.8)。離心收集細(xì)胞,9,400g30sec,2℃。棄上清,沉淀用1ml冰ddh2o懸浮。離心收集細(xì)胞,9,400g30sec,2℃。棄上清,沉淀用1ml冰ddh2o懸浮。重復(fù)離心、重懸、再離心,用20ul冰ddh2o懸浮細(xì)胞。加入5ul脫鹽的體外組裝產(chǎn)物,而在mvenus-pgk-neo元件插入實驗中則加入200ng質(zhì)粒和200ngpcr產(chǎn)物的混合物。將細(xì)胞和dna的混合液轉(zhuǎn)入1mm電激杯中,用eppendorf電穿孔儀2510進(jìn)行電擊,電壓1350v,電容10uf,電阻600ω。加1mllb至電激杯中,洗滌細(xì)胞并將其轉(zhuǎn)移至扎孔的1.5ml管中,置于eppendorf熱混合器上37度,950rpm培養(yǎng)1h。最后將適量的菌液涂布到加有合適抗生素(15ug/ml的氯霉素或15ug/ml的卡那霉素)的lb平板上,37度過夜培養(yǎng)。
實施例1體外組裝和全長rece/rect的共同作用提高了直接克隆的效率
發(fā)明人以明亮發(fā)光桿菌ant-220047中14kblux基因簇的直接克隆(圖1a)作為模型實驗測試了一系列核酸外切酶以及退火方法。在這個克隆實驗中,發(fā)明人將10μg經(jīng)過bamhi+kpni酶切的ant-2200基因組dna和200ng2.2kb的p15a-cm線性載體混合,其中線性載體兩端帶有與限制性酶切產(chǎn)生的含有lux基因簇的基因組片段兩端一致的序列(同源臂),線性載體通過兩端的同源臂與目的基因組dna片段發(fā)生同源重組,形成最終的環(huán)狀質(zhì)粒。首先用不同的核酸外切酶在體外處理克隆載體和bamhi+kpni酶切的基因組dna,然后將體外反應(yīng)產(chǎn)物轉(zhuǎn)化到表達(dá)了rece/rect重組酶的e.coli細(xì)胞內(nèi)。測試的核酸外切酶包括:t4dna聚合酶(t4dnapolymerase;t4pol),dna聚合酶i的klenow片段(klenowfragmentofdnapolymerasei;kle),t7dna聚合酶(t7dnapolymerase;t7pol),核酸外切酶iii(exonucleaseiii;exoiii);phusiondna聚合酶(phusiondnapolymerase;phu),t5核酸外切酶(t5exonuclease;t5exo);t7核酸外切酶(t7exonuclease;t7exo)和lambda核酸外切酶(lambdaexonuclease;λexo)(圖2a)。結(jié)果顯示t4pol,kle,t5exo和t7exo都能顯著提高直接克隆的效率(圖2a-e)。核酸外切酶消化之后的退火速率對克隆效率幾乎沒有影響,發(fā)明人選用eppendorfmcnexuspcr儀的默認(rèn)降溫速率(2℃s-1)(圖3)。經(jīng)過測試t4pol的濃度、處理溫度和時間對直接克隆效率的影響(圖1c,d和圖2f)。
發(fā)明人分別比較了單獨使用全長rece/rect、單獨使用t4pol體外退火以及聯(lián)合使用t4pol體外退火和全長rece/rect這三種情況下的直接克隆效率(圖1f)。在單獨使用rece/rect時,也能以很高的正確率將14kb的lux基因簇從發(fā)光細(xì)菌染色體中直接克隆p15a載體上(427)。但是將t4pol體外組裝的反應(yīng)產(chǎn)物轉(zhuǎn)化到一個標(biāo)準(zhǔn)的e.coli工程菌中得到的直接克隆效率要高的多(427vs4,880)。這表明:(1)e.coli內(nèi)源的dna修復(fù)體系能夠嫻熟的將質(zhì)粒骨架封閉起來;(2)t4pol體外組裝的效率很高(4880);(3)將t4pol體外組裝和rece/rect細(xì)胞內(nèi)重組結(jié)合起來的exocet技術(shù)卻比其中任何一種技術(shù)單獨作用時都要高效(32500)。
實施例2同源臂對克隆效率的影響
同源臂越長,克隆效率越高(圖1b)。在圖5a中,發(fā)明人將克隆載體一端的80bp同源臂置于基因簇內(nèi)部1kb,或者兩端均位于基因簇內(nèi)部1kb,然后對exocet的效率與t4pol和recet的效率進(jìn)行了比較(圖5b)。當(dāng)載體的兩個同源臂均位于最末端時,發(fā)明人得到了與之前一樣的結(jié)果。但是,當(dāng)一個同源臂或者兩個同源臂位于基因簇內(nèi)部1kb時,只用t4pol進(jìn)行處理的克隆效率是很低的,這表明t4pol核酸外切酶處理后的退火依賴于末端的dna序列互補(bǔ)配對。值得注意的是,recet重組的效率與同源臂的位置幾乎沒有關(guān)系。當(dāng)一個同源臂位于末端,而另一個同源臂位于內(nèi)部時得到的實驗結(jié)果令人深思。當(dāng)載體和基因組dna片段之間只有一個末端同源臂時,exocet的效率是recet的12倍,這表明在電轉(zhuǎn)化和recet重組之前,t4pol體外處理能使兩個dna分子通過一端退火而高效的結(jié)合在一起。以上數(shù)據(jù)表明t4pol只能作用于末端同源臂,而內(nèi)部同源臂的重組需要recet的作用。因此,發(fā)明人得出的結(jié)論是t4pol對exocet的主要貢獻(xiàn)是通過兩個線性dna分子一端的退火而顯著提高它們的共轉(zhuǎn)化效率。然后,再用recet來促進(jìn)另一端的重組。在14kblux基因簇的克隆實驗中,當(dāng)兩個同源臂均位于目的基因組酶切片段最末端時,exocet的克隆效率是t4pol的6~8倍(圖1f和5b)。這說明大部分體外組裝產(chǎn)物只有一端結(jié)合在了一起(>85%),而且體外組裝的環(huán)狀產(chǎn)物和兩個線性dna分子共轉(zhuǎn)化后完全由recet產(chǎn)生的重組質(zhì)粒對exocet高效率的貢獻(xiàn)很小。在設(shè)計exocet直接克隆實驗時,同源臂位置對克隆效率非常重要。為了獲得最高的克隆效率,兩個同源臂都要置于目的dna片段的最末端。實際上,為了發(fā)揮體外t4pol核酸外切酶和退火的作用,至少一個同源臂要置于末端。但是另一個同源臂可以置于目的dna片段的內(nèi)部,因為rece/rect能夠?qū)ζ涠ㄎ徊l(fā)生重組。這非常有利于利用直接克隆來構(gòu)建表達(dá)載體,因為其中一個同源臂可以置于目的片段3’端的最末端,而5’端的目的基因可以利用內(nèi)部同源臂直接置于啟動子和核糖體結(jié)合位點的控制之下。
實施例3rece和rect都是exocet必需的
因為rect是一個單鏈dna退火蛋白,所以發(fā)明人猜測rect有可能會跟t4pol(3’核酸外切酶)產(chǎn)生的單鏈dna區(qū)域退火,因此在exocet技術(shù)體系可能不需要rece的參與。為了驗證這個猜想,發(fā)明人將t4pol處理過的dna底物轉(zhuǎn)化到表達(dá)rect和redγ(psc101-tg)而且不表達(dá)rece的大腸桿菌細(xì)胞內(nèi),并沒有發(fā)現(xiàn)rect和t4pol之間發(fā)生相互作用,因此rece和rect都是exocet必需的(圖5c)。reca對直接克隆效率有一定的提高。
實施例4dna大片段直接克隆的驗證
為了驗證exocet技術(shù)的優(yōu)越性,發(fā)明人利用它來做了一些之前用recet技術(shù)很難做的實驗。發(fā)光光桿狀菌(photorhabdusluminescens)基因組上存在兩個大的基因簇:37.5kb的plu3535-3532和52.6kb的plu2670,之前發(fā)明人用recet技術(shù)對這兩個基因簇進(jìn)行直接克隆的時候非常困難,其效率分別只有2/12和0/483,而利用exocet技術(shù)發(fā)明人卻分別獲得了10/12和11/17的正確率(表2)。
表2利用exocet從細(xì)菌、哺乳動物細(xì)胞和人血中直接克隆的基因組dna大片段。
再有就是發(fā)明人之前嘗試從白色鏈霉菌(streptomycesalbus)基因組上一步直接克隆106kb的鹽霉素基因簇沒有成功,因此發(fā)明人不得不將其分為三個片段分步克隆,然后再將其拼接成一個完整的基因簇43。但是通過exocet,利用一個帶有同源臂的bac載體和ecorv酶切的基因組dna,發(fā)明人可以直接將106kb的鹽霉素基因簇克隆到該bac載體上,而且獲得了2/24的正確率(表2和圖6)。因為在106kb鹽霉素基因簇的兩側(cè)各有一個ecorv酶切位點,所以發(fā)明人可以將其從染色體上釋放出來并克隆到載體上。在dna大片段克隆的時候,有時候在目的dna片段的兩側(cè)很難找到合適的限制性酶切位點,但是利用可編程的核酸酶則可以擺脫對限制性酶切位點的限制,尤其是rna介導(dǎo)的核酸內(nèi)切酶--cas948,49。為了檢測該想法,發(fā)明人利用cas9在很靠近ecorv的位置將106kb的鹽霉素基因簇從染色體上釋放出來,然后利用同一個bac載體上將相同的106kbdna片段克隆到bac載體上,最終獲得相近的克隆效率(表2和圖6)。因此,與recet相比,exocet在dna大片段的直接克隆上具有顯著優(yōu)越的表現(xiàn)。
接下來發(fā)明人測試了exocet的效率能否達(dá)到從哺乳動物基因組上直接克隆dna大片段的要求。發(fā)明人利用swai從老鼠基因組上釋放了一個45kb的含有wnt4基因的片段(圖7a),通過exocet發(fā)明人獲得了8/25的正確率(圖7b)。發(fā)明人同時也測試了利用gibson組裝1來克隆這一dna片段。gibson組裝是在體外利用t5exo,phusiondna聚合酶和taqdna連接酶將相互之間帶有同源臂的dna分子組裝起來。通過將gibson組裝的dna產(chǎn)物轉(zhuǎn)化到阿拉伯糖誘導(dǎo)和不誘導(dǎo)的含有psc101-bad-etga-tet的e.coligb05-dir中,發(fā)明人獲得了大量菌落(181,000和257,000),而且檢測了60個菌落也沒有得到一個正確的克?。▓D7b),而且全是自身環(huán)化的p15a空載體的。
實施例5利用exocet組裝dna片段
gibson是為多片段dna組裝建立的方法,所以發(fā)明人通過一些dna多片段組裝實驗(圖7c)對exocet和gibson進(jìn)行了比較。這些dna片段都是通過pcr擴(kuò)增的,而且末端帶有40bp的同源臂。在7片段和10片段組裝實驗中,exocet和gibson組裝的效率都是不錯的。當(dāng)gibson體外組裝的產(chǎn)物轉(zhuǎn)化到表達(dá)rece、rect、redγ和reca的大腸桿菌細(xì)胞中時(gibson+etga),組裝的效率和正確率均得到了顯著提高(圖7d)。exocet不能組裝13個以上的dna片段,gibson不能組裝16個以上的dna片段,而gibson+etga卻能夠?qū)⒅辽?0個dna片段組裝成一個54.9kb的質(zhì)粒。因此,將體外組裝和recet重組結(jié)合起來,對于dna組裝的優(yōu)勢是很明顯的。
實施例6利用exocet構(gòu)建單倍型同基因打靶載體
exocet還可以用于從包括血液,疾病相關(guān)細(xì)胞系等來源的哺乳動物基因組上直接克隆dna片段以助于snps的單倍型研究以及為核酸酶介導(dǎo)的人類干細(xì)胞打靶來快速構(gòu)建單倍型同基因(hit)打靶載體。從病人、臍帶血或體細(xì)胞重編程分離到的人類干細(xì)胞在生物醫(yī)學(xué)研究的重要性越來越受到人們的重視,對干細(xì)胞基因組的精確修飾方法的研究也受到人們的廣泛關(guān)注。改造人類基因組比改造實驗鼠的基因組要更有挑戰(zhàn)性,因為人類的遺傳多樣性很復(fù)雜。同基因性(序列相似性)對同源重組的重要性在很多年前人們對老鼠胚胎干細(xì)胞進(jìn)行基因打靶的時候就意識到了14。但是,序列錯配對同源重組的影響還未研究清楚,比如單個錯配(一個snp或一個indel)到底能降低多少重組效率
發(fā)明人利用exocet來構(gòu)建同基因打靶載體來對哺乳動物基因組進(jìn)行改造。鑒于在老鼠胚胎干細(xì)胞研究中的經(jīng)驗50,發(fā)明人旨在從人或老鼠基因組上直接克隆5至10kb的dna片段作為同基因同源臂(圖8a和圖9a)。值得關(guān)注的是這些dna片段不僅是相同的基因而且維持了多態(tài)性的單倍型,所以發(fā)明人稱之為“hit”(haplotypicisogenictargeting)載體。通過exocet發(fā)明人從人(體外培養(yǎng)的細(xì)胞系和人血)和老鼠(體外培養(yǎng)的細(xì)胞系)基因組中直接克隆了8~9kb的dna片段(圖8b和圖9b),然后通過redαβ重組工程將篩選標(biāo)記以及其它功能元件16插入到hit載體上(圖8c和圖9c)。
實施例7利用exocet對哺乳動物細(xì)胞進(jìn)行基因分型
exocet還可以作為一種對修飾后的基因組進(jìn)行基因分型的最可靠方法,而southern雜交和連接pcr會產(chǎn)生假陽性信號。由于在哺乳動物基因分型研究中,長片段(longrange)pcr很容易產(chǎn)生假陽性信號,所以發(fā)明人之前想通過southern雜交對通過長片段pcr篩選到的kmt2d-aid-neo打靶的老鼠胚胎干細(xì)胞進(jìn)行確認(rèn)。但是,發(fā)明人始終得不到好的探針。因此,發(fā)明人就用圖10a所示的exocet方法,從其中4個可能的kmt2d-aid-neo打靶老鼠胚胎干細(xì)胞的基因組上克隆含有完整打靶元件的dna片段。對exocet克隆獲得的重組質(zhì)粒進(jìn)行限制性酶切分析和dna測序,結(jié)果表明這4個細(xì)胞都打靶成功了,而且是單打靶(圖10b)。此外,發(fā)明人還成功利用exocet對之前研究獲得的oct4-venus-neo,nanog-cherry-neo,gata2-venus-neo和set1b-tc-neo打靶老鼠胚胎干細(xì)胞進(jìn)行了再次驗證(表3),這些打靶細(xì)胞在之前都是已經(jīng)通過southern雜交驗證過的。這些結(jié)果表明,exocet基因分型沒有位點限制。發(fā)明人之前對一個klf4-venus-neo打靶的老鼠胚胎干細(xì)胞一直無法確定其是否打靶成功,因為長片段pcr和southern雜交一直得不到確切的信號。利用exocet克隆,發(fā)明人在基因組上的相應(yīng)區(qū)域并沒有克隆到具有卡那霉素抗性的dna片段(表3)。對克隆到的氯霉素抗性質(zhì)粒進(jìn)行限制性酶切分析發(fā)現(xiàn),其中50%帶有野生型的dna序列(圖11)。因此,發(fā)明人才確切的知道此細(xì)胞并沒有被正確打靶。
表3exocet基因分型實驗數(shù)據(jù)
*經(jīng)過限制性酶切分析。
**其余10個是分子內(nèi)重組(在克隆目的序列中含有11個>40bp的直接重復(fù)序列)。
表4優(yōu)化exocet基因分型中需要的oct4-venus-neo打靶的老鼠胚胎干細(xì)胞基因組dna的量
*經(jīng)過限制性酶切分析。
與長片段pcr相比,exocet基因分型不會產(chǎn)生假陽性信號。而與southern雜交相比,其操作更簡單,不需要繁瑣的篩選雜交探針過程。在exocet基因分型中,用于釋放含有完整打靶元件的限制性酶切位點很容易就能找到,而且在基因組制備好的情況下,只要三天就得到基因分型的結(jié)果。更重要的是,exocet從來不會產(chǎn)生假陽性信號。由于打靶元件上具有篩選標(biāo)記,只要500ng限制性酶切的基因組dna就足以獲得較好的克隆效率(表4)。為了提高exocet基因分型的通量,可以使用96孔板培養(yǎng)的細(xì)胞。
實施例8exocet克隆技術(shù)應(yīng)用于宏基因組樣品
對海量基因組測序結(jié)果進(jìn)行功能分析需要簡單快速的表達(dá)載體構(gòu)建方法。根據(jù)本發(fā)明的方法,發(fā)明人可以將長達(dá)~50kb的dna片段從3.0x109bp的基因組中克隆出來。為此,發(fā)明人將1ng的明亮發(fā)光桿菌基因組dna稀釋到10μg芽胞桿菌bacillussubtilis基因組dna中來模仿宏基因組,通過exocet成功將14kb的lux基因簇成功克隆了出來,并獲得了可觀的效率(表5)。環(huán)境樣品通常含有104以上的物種51-53,所以該結(jié)果可以激勵發(fā)明人將exocet克隆技術(shù)應(yīng)用于宏基因組樣品中。
表5利用exocet從稀釋的發(fā)光桿菌明亮發(fā)光桿菌基因組上直接克隆14kb的lux基因簇。
參考文獻(xiàn)
1.gibson,d.g.等人enzymaticassemblyofdnamoleculesuptoseveralhundredkilobases.nat.methods6,343-345(2009).
2.shao,z.&zhao,h.dnaassembler,aninvivogeneticmethodforrapidconstructionofbiochemicalpathways.nucleicacidsres.37,e16(2009).
3.fu,j.等人full-lengthreceenhanceslinear-linearhomologousrecombinationandfacilitatesdirectcloningforbioprospecting.natbiotechnol30,440-446(2012).
4.tang,y.等人heterologousexpressionofanorphannrpsgeneclusterfrompaenibacilluslarvaeinescherichiacolirevealedproductionofsevadicin.j.biotechnol.194,112-114(2015).
5.bian,x.等人directcloning,geneticengineering,andheterologousexpressionofthesyringolinbiosyntheticgeneclusterine.colithroughred/etrecombineering.chembiochem13,1946-1952(2012).
6.bian,x.等人heterologousproductionofglidobactins/luminmycinsinescherichiacolinisslecontainingtheglidobactinbiosyntheticgeneclusterfromburkholderiadsm7029.chembiochem15,2221-2224(2014).
7.bian,x.等人invivoevidenceforaprodrugactivationmechanismduringcolibactinmaturation.chembiochem14,1194-1197(2013).
8.larionov,v.等人specificcloningofhumandnaasyeastartificialchromosomesbytransformation-associatedrecombination.proc.natl.acad.sci.usa93,491-496(1996).
9.lee,n.c.,larionov,v.&kouprina,n.highlyefficientcrispr/cas9-mediatedtarcloningofgenesandchromosomallocifromcomplexgenomesinyeast.nucleicacidsres.43,e55(2015).
10.kouprina,n.&larionov,v.transformation-associatedrecombination(tar)cloningforgenomicsstudiesandsyntheticbiology.chromosoma(2016).
11.jiang,w.等人cas9-assistedtargetingofchromosomesegmentscatchenablesone-steptargetedcloningoflargegeneclusters.nat.commun.6,8101(2015).
12.bian,x.,plaza,a.,zhang,y.&müller,r.luminmycinsa-c,crypticnaturalproductsfromphotorhabdusluminescensidentifiedbyheterologousexpressioninescherichiacoli.j.nat.prod.75,1652-1655(2012).
13.zhou,y.等人iterativemechanismofmacrodiolideformationintheanticancercompoundconglobatin.chem.biol.22,745-754(2015).
14.teriele,h.,maandag,e.r.&berns,a.highlyefficientgenetargetinginembryonicstemcellsthroughhomologousrecombinationwithisogenicdnaconstructs.proc.natl.acad.sci.usa89,5128-5132(1992).
15.baker,o.等人rac-tagging:recombineeringandcas9-assistedtargetingforproteintaggingandconditionalanalyses.sci.rep.6,25529(2016).
16.fu,j.,teucher,m.,anastassiadis,k.,skarnes,w.&stewart,a.f.arecombineeringpipelinetomakeconditionaltargetingconstructs.methodsenzymol.477,125-144(2010).
17.hofemeister,h.等人recombineering,transfection,western,ipandchipmethodsforproteintaggingviagenetargetingorbactransgenesis.methods53,437-452(2011).
18.copeland,n.g.,jenkins,n.a.&court,d.l.recombineering:apowerfulnewtoolformousefunctionalgenomics.nat.rev.genet.2,769-779(2001).
19.muyrers,j.p.,zhang,y.&stewart,a.f.techniques:recombinogenicengineering--newoptionsforcloningandmanipulatingdna.trendsbiochem.sci.26,325-331(2001).
20.narayanan,k.&chen,q.bacterialartificialchromosomemutagenesisusingrecombineering.j.biomed.biotechnol.2011,971296(2011).
21.murphy,k.c.phagerecombinasesandtheirapplications.adv.virusres.83,367-414(2012).
22.murphy,k.c.lambdarecombinationandrecombineering.ecosalplus7(2016).
23.zhang,y.,buchholz,f.,muyrers,j.p.&stewart,a.f.anewlogicfordnaengineeringusingrecombinationinescherichiacoli.nat.genet.20,123-128(1998).
24.clark,a.j.等人genesofthereceandrecfpathwaysofconjugationalrecombinationinescherichiacoli.coldspringharb.symp.quant.biol.49,453-462(1984).
25.hall,s.d.,kane,m.f.&kolodner,r.d.identificationandcharacterizationoftheescherichiacolirectprotein,aproteinencodedbythereceregionthatpromotesrenaturationofhomologoussingle-strandeddna.j.bacteriol.175,277-287(1993).
26.clark,a.j.,satin,l.&chu,c.c.transcriptionoftheescherichiacolirecegenefromapromoterintn5andis50.j.bacteriol.176,7024-7031(1994).
27.kuzminov,a.recombinationalrepairofdnadamageinescherichiacoliandbacteriophagelambda.microbiol.mol.biol.rev.63,751-813(1999).
28.chu,c.c.,templin,a.&clark,a.j.suppressionofaframeshiftmutationintherecegeneofescherichiacolik-12occursbygenefusion.j.bacteriol.171,2101-2109(1989).
29.muyrers,j.p.,zhang,y.,buchholz,f.&stewart,a.f.rece/rectandreda/redbinitiatedouble-strandedbreakrepairbyspecificallyinteractingwiththeirrespectivepartners.genesdev.14,1971-1982(2000).
30.chang,h.w.&julin,d.a.structureandfunctionoftheescherichiacolireceprotein,amemberoftherecbnucleasedomainfamily.j.biol.chem.276,46004-46010(2001).
31.zhang,j.,xing,x.,herr,a.b.&bell,c.e.crystalstructureofe.colireceproteinrevealsatoroidaltetramerforprocessingdouble-strandeddnabreaks.structure17,690-702(2009).
32.zhang,y.,muyrers,j.p.,rientjes,j.&stewart,a.f.phageannealingproteinspromoteoligonucleotide-directedmutagenesisinescherichiacoliandmouseescells.bmcmol.biol.4,1(2003).
33.szczepanska,a.k.bacteriophage-encodedfunctionsengagedininitiationofhomologousrecombinationevents.crit.rev.microbiol.35,197-220(2009).
34.kolodner,r.,hall,s.d.&luisi-deluca,c.homologouspairingproteinsencodedbytheescherichiacolireceandrectgenes.molmicrobiol11,23-30(1994).
35.iyer,l.m.,koonin,e.v.&aravind,l.classificationandevolutionaryhistoryofthesingle-strandannealingproteins,rect,redbeta,erfandrad52.bmcgenomics3,8(2002).
36.maresca,m.等人single-strandedheteroduplexintermediatesinlambdaredhomologousrecombination.bmcmol.biol.11,54(2010).
37.poteete,a.r.involvementofescherichiacolidnareplicationproteinsinphagelambdared-mediatedhomologousrecombination.plosone8,e67440(2013).
38.muyrers,j.p.,zhang,y.,testa,g.&stewart,a.f.rapidmodificationofbacterialartificialchromosomesbyet-recombination.nucleicacidsres.27,1555-1557(1999).
39.zhang,y.,muyrers,j.p.,testa,g.&stewart,a.f.dnacloningbyhomologousrecombinationinescherichiacoli.nat.biotechnol.18,1314-1317(2000).
40.testa,g.等人engineeringthemousegenomewithbacterialartificialchromosomestocreatemultipurposealleles.nat.biotechnol.21,443-447(2003).
41.sarov,m.等人arecombineeringpipelineforfunctionalgenomicsappliedtocaenorhabditiselegans.nat.methods3,839-844(2006).
42.bird,a.w.等人high-efficiencycounterselectionrecombineeringforsite-directedmutagenesisinbacterialartificialchromosomes.nat.methods9,103-109(2012).
43.yin,j.等人directcloningandheterologousexpressionofthesalinomycinbiosyntheticgeneclusterfromstreptomycesalbusdsm41398instreptomycescoelicolora3(2).sci.rep.5,15081(2015).
44.wang,h.等人improvedseamlessmutagenesisbyrecombineeringusingccdbforcounterselection.nucleicacidsres42,e37(2014).
45.pospiech,a.&neumann,b.aversatilequick-prepofgenomicdnafromgram-positivebacteria.trendsgenet.11,217-218(1995).
46.wang,h.等人recetdirectcloningandredalphabetarecombineeringofbiosyntheticgeneclusters,largeoperonsorsinglegenesforheterologousexpression.nat.protoc.11,1175-1190(2016).
47.zhang,s.d.等人genomesequenceofluminouspiezophilephotobacteriumphosphoreumant-2200.genomeannounc.2,e0009614(2014).
48.jinek,m.等人aprogrammabledual-rna-guideddnaendonucleaseinadaptivebacterialimmunity.science337,816-821(2012).
49.gasiunas,g.,barrangou,r.,horvath,p.&siksnys,v.cas9-crrnaribonucleoproteincomplexmediatesspecificdnacleavageforadaptiveimmunityinbacteria.proc.natl.acad.sci.usa109,e2579-2586(2012).
50.skarnes,w.c.等人aconditionalknockoutresourceforthegenome-widestudyofmousegenefunction.nature474,337-342(2011).
51.torsvik,v.,goksoyr,j.&daae,f.l.highdiversityindnaofsoilbacteria.appl.environ.microbiol.56,782-787(1990).
52.rappe,m.s.&giovannoni,s.j.theunculturedmicrobialmajority.annu.rev.microbiol.57,369-394(2003).
53.charlop-powers,z.,milshteyn,a.&brady,s.f.metagenomicsmallmoleculediscoverymethods.curr.opin.microbiol.19,70-75(2014)。