在受體細(xì)胞的目的基因組序列引入變異的系統(tǒng)和方法
【專利摘要】本發(fā)明提供了一種在受體細(xì)胞的目的基因組序列引入變異的系統(tǒng),所述系統(tǒng)包括:a)一個基因組DNA誘變序列GSMS表達(dá)盒,其中所述的GSMS表達(dá)盒包括一段和所述目的基因組序列同源的多聚核苷酸序列和一個引物結(jié)合序列,其中所述的GSMS表達(dá)盒產(chǎn)生GSMS RNAs;b)一個反轉(zhuǎn)錄酶表達(dá)盒,其中所述的反轉(zhuǎn)錄酶表達(dá)盒包括一段編碼反轉(zhuǎn)錄酶的多聚核苷酸序列。本發(fā)明還提供了在受體細(xì)胞目的基因組序列引入變異的方法以及獲得在目的基因組序列有隨機(jī)變異的細(xì)胞群的方法。利用本發(fā)明所提供的系統(tǒng)和方法,可以在一段相對長的時間內(nèi)在受體細(xì)胞中大量且持續(xù)的提供基因改造序列,提高靶向基因變異成功率。并且能夠在靶向基因組區(qū)域引入大量隨機(jī)突變。
【專利說明】在受體細(xì)胞的目的基因組序列引入變異的系統(tǒng)和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明基于分子遺傳領(lǐng)域,具體說,是利用瞬時表達(dá)和反轉(zhuǎn)錄系統(tǒng)在受體細(xì)胞基因組序列中引入特定變異。
【背景技術(shù)】
[0002]遺傳修飾技術(shù)為在由活體細(xì)胞或組織的基因組核糖核酸序列編碼的遺傳信息中引入變異提供了可能。傳統(tǒng)的基因改造技術(shù)涉及將一段外源核酸序列整合到受體基因組的隨機(jī)位點(diǎn)。這些方法是基于將含有外源序列的載體引入受體細(xì)胞,外源DNA隨機(jī)整合到受體基因組,并分離含有外源序列的細(xì)胞。這些遺傳信息在受體基因組的非自然整合有一些局限性。外源序列的隨機(jī)整合,整合位點(diǎn)可能在組織存活必須的基因內(nèi),而擾亂其功能。就算外源基因的插入沒有損壞宿主基因,外源基因的表達(dá)也會受到周圍基因DNA的影響(位點(diǎn)效應(yīng))。在某些情形下,周圍基因組環(huán)境的負(fù)面影響如此之大,以至于外源基因無法表達(dá)。在另一些情形下,周圍基因組環(huán)境可能導(dǎo)致外源基因的過渡表達(dá)從而損害受體細(xì)胞。外源基因的多位點(diǎn)整合有時會導(dǎo)致RNA干擾(RNAi)。這些方法的另一個問題是在受體基因組中加入不必要或無用的遺傳物質(zhì),例如病毒或其他載體殘余,調(diào)控序列和標(biāo)記基因。這些無用遺傳物質(zhì)可能在長時期內(nèi)對受體組織產(chǎn)生不可知的影響,并且標(biāo)記基因,比如抗除草劑基因和抗抗生素基因?qū)】岛铜h(huán)境的可能的影響,值得擔(dān)憂。
[0003]為解決這些傳統(tǒng)基因改造技術(shù)的問題,發(fā)展了在宿主基因組特定位點(diǎn)上引入變異的靶向基因改造技術(shù)。這些技術(shù)是通過特異位點(diǎn)校正或定點(diǎn)突變修飾游離體或染色體中的目標(biāo)序列。其中一些技術(shù)利用不同類型的寡聚或多聚核苷酸,如:雙鏈DNA(dsDNA),單鏈DNA(ssDNA),含有5’和/或3’端修飾以抵御細(xì)胞內(nèi)核酸酶降解的寡聚核苷酸(Campbell et al., 1989),雜合 RNA/DNA 或 DNA/DNA 分子(Igoucheva et al., 2004a ;Parekh-Olmedo et al., 2005),RNA寡聚核苷酸(Storici, 2008),和三合寡聚核苷酸(Simonet al.,2008)。Campbell及其同事用單鏈核酸成功地在由共同轉(zhuǎn)化的質(zhì)粒編碼的卡那霉素磷酸轉(zhuǎn)移酶基因中誘導(dǎo)了一個變異。Zorin及其同事將一段外源單鏈DNA插入到藍(lán)藻(Chlamydomonas reinhardti)基因組的特定位點(diǎn)并報道單鏈DNA非同源重組的幾率明顯小于雙鏈DNA (Zorin et al.,2005)。Kmeic及其同事研發(fā)了利用雜合RNA/DNA 二元寡聚核苷酸在高等真核細(xì)胞目的基因的特定位點(diǎn)誘導(dǎo)變異,并報道雜合RNA/DNA 二元引物的變異轉(zhuǎn)化率高于未修飾的單鏈寡聚核苷酸(美國專利,專利號5,565,350)。同源基因改造的分子機(jī)制并不完全清楚。一種可能的機(jī)制是變異誘導(dǎo)序列與目的基因序列雜交,從而產(chǎn)生觸發(fā)DNA修復(fù)機(jī)制的錯配泡,DNA修復(fù)機(jī)制利用變異誘導(dǎo)序列為模板“糾正”受體細(xì)胞目的基因組序列。其他機(jī)制可能涉及鏈入侵(strand invas1n)或同源重組。
[0004]基于寡聚核苷酸的靶向修飾技術(shù)的一個主要缺陷是成功率低,部分原因可以歸咎于外源寡聚/多聚核苷酸的降解和有限供應(yīng)(Zorin et al.,2005)。Kmeic et al.描述了一個利用經(jīng)過抗核酸酶修飾的單鏈寡聚核苷酸進(jìn)行靶向修飾的技術(shù)。經(jīng)抗核酸酶修飾如硫代磷酸酯鍵(phosphoroth1ate linkage), LNA鍵,和2_0_甲基修飾的寡聚核苷酸和未經(jīng)修飾的單鏈寡聚核苷酸相比,胞內(nèi)降解度低,誘變成功率高。經(jīng)優(yōu)化修飾的單鏈寡聚核苷酸的誘變成功率可比RNA/DNA 二元雜合引物高2-3倍(美國專利,專利號6,936,497)。但化學(xué)修飾對參與變異誘導(dǎo)的酶的影響并不十分清楚。盡管經(jīng)過優(yōu)化修飾,在多數(shù)情況下,變異誘導(dǎo)率仍然相對較低,大約在Ix 10_4左右(Zhu,2000)。靶向基因改造的另一個問題是來自外源DNA非同源整合的競爭。同源整合和非同源整合的比率隨不同組織和細(xì)胞類型而變化。例如酵母同源整合和幾率相對較高,而高等真核生物如植物和動物的非同源整合頻率顯著高于同源整合。Zorin et al.發(fā)現(xiàn)單鏈(ssDNA)和雙鏈(dsDNA)DNA同源重組的效率相似,但單鏈DNA(ssDNA)相對于雙鏈DNA (dsDNA),非同源重組的傾向性要小得多(Zorin, 2005),這項發(fā)明為減少非同源整合提供了一個簡單的解決方法。
[0005]其他靶向基因技術(shù)涉及利用靶向核酸內(nèi)切酶,如轉(zhuǎn)錄激活因子樣效應(yīng)因子核酸酶(transcript1nal activator-like effector nucleases) (Miller, et al.,2010),鋒指核酸酶(zinc finger nuclease) (Bibikova, Beumer, Trautman, &Carroll, 2003),歸位內(nèi)切酶(homing endonucleases) (Grizot, et al.,2009),與含有和革巴向基因同源的序列的基因改造載體結(jié)合使用。載體同時含有報告和/或選擇標(biāo)記基因。其機(jī)制據(jù)信是同源重組。這些技術(shù)相當(dāng)有效,但一次處理只能產(chǎn)生一個特定變異。
[0006]就靶向基因改造來說,需要一項能在相對長的時間內(nèi)大量并且持續(xù)地提供基因改造序列,從而提高靶向基因變異成功率的技術(shù)。本發(fā)明不僅滿足了這些需求并且提供了在靶向基因組區(qū)域引入隨機(jī)突變的可能。
【發(fā)明內(nèi)容】
[0007]本發(fā)明的第一個目的在于提供一種在基因組特異位點(diǎn)產(chǎn)生預(yù)先確定的或隨機(jī)產(chǎn)生的變異的系統(tǒng)。
[0008]本發(fā)明的第二個目的在于提供一種在受體細(xì)胞目的基因組序列引入變異的方法。
[0009]本發(fā)明的第三個目的在于獲得在目的基因組序列有隨機(jī)變異的細(xì)胞群的方法。
[0010]為了達(dá)到本發(fā)明的第一個目的,本發(fā)明提供了一種在受體細(xì)胞的目的基因組序列引入變異的系統(tǒng),所述系統(tǒng)包括:a) —個基因組DNA誘變序列GSMS表達(dá)盒,其中所述的GSMS表達(dá)盒包括一段和所述目的基因組序列同源的多聚核苷酸序列和一個引物結(jié)合序列,其中所述的GSMS表達(dá)盒產(chǎn)生GSMS RNAs ;b) 一個反轉(zhuǎn)錄酶表達(dá)盒,其中所述的反轉(zhuǎn)錄酶表達(dá)盒包括一段編碼反轉(zhuǎn)錄酶的多聚核苷酸序列,所編碼的反轉(zhuǎn)錄酶可以是天然的或工程改造的反轉(zhuǎn)錄酶,并且所述反轉(zhuǎn)錄酶可以是有較好的校對功能或較差的校對功能;(圖10)以及在受體細(xì)胞中,所述GSMS RNAs被所述反轉(zhuǎn)錄酶反轉(zhuǎn)錄為ssGSMS cDNAs (圖7),并且所述ssGSMS cDNAs在細(xì)胞核中通過細(xì)胞DNA修復(fù)或同源重組機(jī)制導(dǎo)致目的基因組序列的改變。目的基因組序列可以是受體細(xì)胞的任意基因組序列,包括像外顯子序列,內(nèi)含子序列,未轉(zhuǎn)錄調(diào)控序列,直接或反轉(zhuǎn)重復(fù)序列,和重組熱點(diǎn)序列。
[0011]在一些實(shí)施方式中,GSMS和反轉(zhuǎn)錄酶可以被連接在一起放入同一個表達(dá)盒中,反轉(zhuǎn)錄酶在近5’端,反轉(zhuǎn)錄酶和GSMS之間由一段在被轉(zhuǎn)錄為RNA后形成發(fā)卡型結(jié)構(gòu)的序列隔開,發(fā)卡型的二級結(jié)構(gòu)可以終止反轉(zhuǎn)錄(圖12)。
[0012]在一些實(shí)施方式中,所述的GSMS包括一段與所述目的基因組序列完全互補(bǔ)的序列在被引入到受體細(xì)胞中后所述GSMS可與受體細(xì)胞基因組序列配對雜交;或者,除在所述GSMS預(yù)先設(shè)定的位置有一個或幾個核苷酸的區(qū)別外,所述的GSMS包括一段與所述目的基因組序列完全互補(bǔ)的序列,所述的核苷酸的區(qū)別是錯配、刪除、插入或以上所列的組合。在一些實(shí)施方式中,所述GSMS包括一段非同源多聚核苷酸序列,夾在與受體細(xì)胞基因組序列同源的序列間;優(yōu)選的,所述的非同源多聚核苷酸序列編碼一個選擇標(biāo)記基因。在一些實(shí)施方式中,所述的GSMS包括一段與目的基因組序列的同源重組熱點(diǎn)區(qū)域同源的序列,或者,所述的GSMS包括一段與含有正向和反向重復(fù)的目的基因組序列同源的序列。
[0013]在一些實(shí)施方式中,與目的基因組序列完全吻合的GSMS和糾錯功能較弱的反轉(zhuǎn)錄酶被同時引入到受體細(xì)胞中。由于反轉(zhuǎn)錄酶的糾錯能力較弱,在反轉(zhuǎn)錄過程中,隨機(jī)突變被引入到GSMS cDNA中。這些具有隨機(jī)突變的單鏈GSMS cDNA可以通過DNA修復(fù)或同源重組整合結(jié)合到目的基因組序列,從而得到一個在目的基因組序列有隨機(jī)突變的細(xì)胞庫。這個隨機(jī)突變庫可以被用來篩選在目的基因組區(qū)域的有價值的突變。在一些實(shí)施方式中,所述反轉(zhuǎn)錄酶具有較好的校對功能。
[0014]在一些實(shí)施方式中,GSMS RNA的5’端可以形成二級結(jié)構(gòu),當(dāng)反轉(zhuǎn)錄酶到達(dá)二級結(jié)構(gòu)時反轉(zhuǎn)錄被終止(圖9)。
[0015]在一些實(shí)施方式中,本發(fā)明所提供的系統(tǒng)還包括引物表達(dá)盒,其中所述的引物表達(dá)盒產(chǎn)生天然的或人工的引物tRNA,弓丨物tRNA與所述GSMS RNAs上的所述弓丨物結(jié)合序列結(jié)合,起始反轉(zhuǎn)錄。
[0016]GSMS有一個引物結(jié)合位點(diǎn)可以和引物結(jié)合啟動反轉(zhuǎn)錄。在一些實(shí)施方式中,引物結(jié)合位點(diǎn)序列和天然或人工tRNA 3’端序列互補(bǔ)。GSMS RNA可以利用天然tRNA或與之同時表達(dá)的合成tRNA為引物啟動反轉(zhuǎn)錄(圖9)。在一些實(shí)施方式中,GSMS RNA 3’端包括一個poly(U)尾巴。在真核生物中,一個poly (A)尾巴會被加到已轉(zhuǎn)錄的RNA的3’端。具有poly(U)-poly(A)尾巴的GSMS RNA可以自身退火啟動反轉(zhuǎn)錄(圖8)。
[0017]在一些實(shí)施方式中,反轉(zhuǎn)錄酶是一個天然的具有依賴于RNA的DNA聚合酶活性的反轉(zhuǎn)錄酶,如HIV,M_MLV和AMV反轉(zhuǎn)錄酶。天然存在的反轉(zhuǎn)錄酶一般不具備或只有很少的校對活性,因此可以用來產(chǎn)生攜帶隨機(jī)突變的GSMS cDNA。如果GSMS cDNA上的隨機(jī)突變并非所需,則應(yīng)使用具有高校對活性的經(jīng)過改造的工程反轉(zhuǎn)錄酶或天然反轉(zhuǎn)錄酶。
[0018]在一些實(shí)施方式中,所述系統(tǒng)可以包括一個單鏈DNA(ssDNA)結(jié)合蛋白表達(dá)盒,所表達(dá)的ssDNA結(jié)合蛋白可結(jié)合到ssGSMS cDNA,保護(hù)它們不被降解并協(xié)助轉(zhuǎn)移ssGSMS cDNA進(jìn)入細(xì)胞核。更或者,ssDNA結(jié)合蛋白會在DNA修復(fù)和同源重組中起到重要作用。這些ssDNA結(jié)合蛋白包括,復(fù)制酶A(replicat1n protein A)、RecA的同源蛋白、Rad51、Rad51的同源蛋白、DMCUDMC1的同源蛋白、ICP8、ICP8的同源蛋白、SSB和SSB的同源蛋白等。其中,Rad5和DMCl可以結(jié)合到ssDNA上形成核酸蛋白絲從而參與到諸如同源搜索,DNA鏈入侵及同源序列配對等同源重組的重要步驟(Holthausen, 2010)(圖3)。
[0019]在一些實(shí)施方式中,所述系統(tǒng)包括一個編碼革巴向核酸內(nèi)切酶的革巴向核酸內(nèi)切酶表達(dá)盒。(圖2)靶向核酸內(nèi)切酶攻擊目的基因組序列中與GSMS同源的區(qū)域。靶向核酸內(nèi)切酶是經(jīng)過工程改造的內(nèi)切酶包括一個用以識別預(yù)先設(shè)定的DNA序列的序列識別結(jié)構(gòu)域,和一個DNA核酸內(nèi)切酶結(jié)構(gòu)域。并且其中所述靶向核酸內(nèi)切酶和所述GSMS指向所述目的基因組序列的同一同源區(qū)域;所述DNA序列識別結(jié)構(gòu)域可來自鋅指蛋白DNA序列識別結(jié)構(gòu)域,轉(zhuǎn)錄激活因子樣效應(yīng)因子DNA識別結(jié)構(gòu)域(TALE),和大型核酸酶(meganuclease)的序列識別結(jié)構(gòu)域。DNA內(nèi)切酶結(jié)構(gòu)域具有內(nèi)切酶活性,所述靶向核酸內(nèi)切酶的所述DNA核酸內(nèi)切酶結(jié)構(gòu)域能夠切割一段雙鏈多聚核苷酸序列產(chǎn)生雙鏈斷裂,或者,只切割雙鏈DNA中的一條鏈從而在雙鏈DNA上造成一個缺口。
[0020]在一些實(shí)施方式中,所述系統(tǒng)包括一個SiRNA表達(dá)盒,所述SiRNA表達(dá)盒產(chǎn)生的siRNA促使從目的基因組序列轉(zhuǎn)錄產(chǎn)生的mRNA的降解,但siRNA與GSMS RNAs無同源區(qū)域。所述siRNA能夠保持所述目的基因組序列處于解旋狀態(tài),從而增加所述ssGSMS cDNA與目的基因組序列互相作用的機(jī)會。siRNA也可經(jīng)由化學(xué)合成然后與所述GSMS及反轉(zhuǎn)錄酶表達(dá)盒一同引入受體細(xì)胞。
[0021]在一些實(shí)施方式中,GSMS反轉(zhuǎn)錄酶表達(dá)盒,ssDNA結(jié)合蛋白表達(dá)盒,革巴向核酸內(nèi)切酶表達(dá)盒等可以是RNA形態(tài)被直接翻譯為蛋白質(zhì)或作為cDNA合成模板。
[0022]在一些實(shí)施方式中,所述GSMS表達(dá)盒、反轉(zhuǎn)錄酶表達(dá)盒、引物表達(dá)盒,ssDNA結(jié)合蛋白表達(dá)盒,祀向核酸內(nèi)切酶表達(dá)盒和siRNA表達(dá)盒可以位于不同的表達(dá)載體或者同時在同一載體上,并且反轉(zhuǎn)錄酶編碼序列,ssDNA結(jié)合蛋白編碼序列和靶向核酸內(nèi)切酶編碼序列中至少兩個序列可以同時存在于一個表達(dá)盒中,形成合并表達(dá)盒;其中一個單一操縱子被連接到兩個或更多個蛋白編碼序列,其中相鄰蛋白編碼序列被翻譯跳躍序列分隔開;或者,其中一個單一操縱子被連接到兩個或更多個蛋白編碼序列并且繼續(xù)連接到GSMS,其中相鄰蛋白編碼序列被翻譯跳躍序列分隔開,并且GSMS和上游蛋白編碼序列被能編碼一段發(fā)卡型RNA結(jié)構(gòu)的序列分隔開。例如,反轉(zhuǎn)錄酶和ssDNA結(jié)合蛋白序列可以被線性鏈接到GSMS序列由同一個啟動子操縱。蛋白質(zhì)編碼序列在近5’端,而GSMS在近3’端,一個翻譯跳躍序列被插入到兩個蛋白質(zhì)編碼序列之間,同時在GSMS5’端插入一個轉(zhuǎn)錄后可以形成發(fā)卡型RNA的序列,用來終止反轉(zhuǎn)錄(圖12)。
[0023]本發(fā)明所提供的系統(tǒng)能夠大量和持續(xù)地產(chǎn)生與目的基因組同源的單鏈DNA,這些單鏈DNA可以被轉(zhuǎn)移到細(xì)胞核內(nèi),通過DNA修復(fù)或同源重組路徑,改變目的基因組序列的遺傳信息。
[0024]為了達(dá)到本發(fā)明的第二個目的,本發(fā)明提供了一種在受體細(xì)胞目的基因組序列引入變異的方法,包括a)構(gòu)建一個GSMS表達(dá)盒,其中所述GSMS含有一段與所述目的基因組序列同源的多聚核苷酸序列和一個引物結(jié)合序列,并且其中所述GSMS表達(dá)盒產(chǎn)生GSMSRNAs ;b)構(gòu)建一個反轉(zhuǎn)錄酶表達(dá)盒,其中所述反轉(zhuǎn)錄酶表達(dá)盒編碼一個反轉(zhuǎn)錄酶;并且,c)將所述GSMS表達(dá)盒和所述反轉(zhuǎn)錄酶表達(dá)盒同時引入受體細(xì)胞,其中所述GSMS RNAs被反轉(zhuǎn)錄酶反轉(zhuǎn)錄為ssGSMS cDNAs,并且所述ssGSMS cDNAs在目的基因組序列導(dǎo)致變異;d)選擇目的基因組序列被改變的受體細(xì)胞。
[0025]在一些實(shí)施方式中,本發(fā)明所提供的方法還包括從下列一組表達(dá)盒中選出的一個或多個表達(dá)盒將它們同時引入到受體細(xì)胞中,他們包括引物表達(dá)盒,ssDNA結(jié)合蛋白表達(dá)盒,靶向核酸內(nèi)切酶表達(dá)盒和siRNA表達(dá)盒。
[0026]其中,基因組被改變的細(xì)胞可以通過傳統(tǒng)方式來選擇;例如,基因組改變導(dǎo)致的生長優(yōu)勢,抗藥性,代謝改變和熒光等特別的可用作選擇的變異。另外,目的基因組序列的PCR和DNA測序也可用來選擇具有變異的細(xì)胞克隆。
[0027]為了達(dá)到本發(fā)明的第三個目的,本發(fā)明提供了獲得在目的基因組序列有隨機(jī)變異的細(xì)胞群的方法,包括以下步驟:a)構(gòu)建一個GSMS表達(dá)盒,其中所述GSMS含有一段與所述目的基因組序列完全同源的多聚核苷酸序列和一個引物結(jié)合序列,并且其中所述GSMS表達(dá)盒產(chǎn)生GSMS RNAs ;b)構(gòu)建一個反轉(zhuǎn)錄酶表達(dá)盒,其中所述反轉(zhuǎn)錄酶表達(dá)盒編碼一個糾錯功能弱的反轉(zhuǎn)錄酶;c)將所述GSMS表達(dá)盒和所述反轉(zhuǎn)錄酶表達(dá)盒同時引入受體細(xì)胞,其中所述GSMS RNAs被糾錯功能弱的反轉(zhuǎn)錄酶反轉(zhuǎn)錄為含有隨機(jī)變異的ssGSMS cDNAs,并且所述ssGSMS cDNAs導(dǎo)致隨機(jī)變異被整合到所述的目的基因組序列;并且,d)選擇在所述目的基因組序列具有隨機(jī)變異的細(xì)胞。
[0028]在本發(fā)明的一些實(shí)施方式中,所述方法還包括從下列一組表達(dá)盒中選出的一個或多個表達(dá)盒將它們同時引入到受體細(xì)胞中,他們包括引物表達(dá)盒,ssDNA結(jié)合蛋白表達(dá)盒,靶向核酸內(nèi)切酶表達(dá)盒和siRNA表達(dá)盒。
[0029]本發(fā)明提供了一個可以持續(xù)大量地產(chǎn)生和供給單鏈cDNA的瞬時表達(dá)系統(tǒng),所產(chǎn)生的單鏈cDNA至少有一部分與目的基因組同源,并且可以被轉(zhuǎn)移到細(xì)胞核內(nèi)改變基因組序列。本發(fā)明同時提供了一個生成在靶向基因組區(qū)域含有隨機(jī)突變的細(xì)胞庫的方法。本發(fā)明另外還將ssGSMS cDNA和轉(zhuǎn)錄激活因子樣效應(yīng)因子核酸酶(transcript1nalactivator-like effector nucleases)(Miller, et al., 2010),鋒指核酸酶(zincfinger nuclease) (Bibikova, Beumer, Trautman, &Carroll, 2003),歸位內(nèi)切酶(homingendonucleases) (Grizot, et al., 2009)等革巴向核酸內(nèi)切酶的使用結(jié)合到一起,在特定序列中引入突變。同時提供的還有細(xì)胞學(xué)和分子生物學(xué)組件來提高靶向基因組改造的效率。
[0030]本發(fā)明的核心是一個模仿反轉(zhuǎn)錄病毒和反轉(zhuǎn)錄轉(zhuǎn)座子復(fù)制系統(tǒng)的瞬時表達(dá)系統(tǒng),它可以在細(xì)胞內(nèi)通過轉(zhuǎn)錄和反轉(zhuǎn)錄擴(kuò)增基因組DNA誘變序列(Genomic SequenceModificat1n Sequence) (GSMS)。由于有兩輪擴(kuò)增,它能持續(xù)提供大量的ssGSMS cDNA,ssGSMS cDNA與細(xì)胞基因組互做導(dǎo)致目的基因組產(chǎn)生需要的變異。幾天后,細(xì)胞內(nèi)的瞬時表達(dá)系統(tǒng)會被完全降解,除目的序列中的變異外,沒有任何外源遺傳物質(zhì)的殘留。與寡聚核苷酸技術(shù)相比較,本發(fā)明可以在幾天,甚至幾星期,而不是幾小時內(nèi)提供相對持續(xù)的和高水平的ssGSMS cDNA。本發(fā)明特別適用于難轉(zhuǎn)化(hard-to_transfect)的細(xì)胞,如植物細(xì)胞。極少量被轉(zhuǎn)入細(xì)胞的表達(dá)載體可以提供大量的以同源重組為方式進(jìn)行基因改造的ssGSMScDNA。此外,由于雙鏈DNA參與同源重組的幾率較單鏈DNA高100倍(Zorin et al.,2005),利用單鏈DNA進(jìn)行基因改造的本發(fā)明同利用雙鏈DNA(如質(zhì)粒)進(jìn)行基因改造的方法相比可以極大地減低異常變異的發(fā)生。
[0031]本發(fā)明還利用了校對能力差的反轉(zhuǎn)錄酶。采用校對能力差的反轉(zhuǎn)錄酶可以在細(xì)胞內(nèi)持續(xù)產(chǎn)生具有隨機(jī)突變的ssGSMS cDNA,這些ssGSMS cDNA可以以同源重組機(jī)制將隨機(jī)突變整合到目的基因中。目的基因組隨機(jī)突變細(xì)胞庫可用來篩選所需的表現(xiàn)型和性狀。
[0032]發(fā)明的系統(tǒng)同時提供了能夠穩(wěn)定和協(xié)助ssGSMS cDNA進(jìn)入細(xì)胞核的單鏈DNA結(jié)合蛋白,以及在希望變異的位點(diǎn)產(chǎn)生單鏈或雙鏈斷裂的靶向核酸內(nèi)切酶。本發(fā)明還提供了一個利用siRNA迫使靶向序列處于松弛狀態(tài)以利DNA雜交和酶處理。本發(fā)明可以用來在特定內(nèi)源基因中引入變異,也可將一段外源DNA插入到染色體或游離體的特定位點(diǎn)。
【專利附圖】
【附圖說明】
[0033]圖1.GSMS瞬時表達(dá)基礎(chǔ)系統(tǒng)。質(zhì)粒包含一個GSMS表達(dá)盒,一個反轉(zhuǎn)錄酶表達(dá)盒,和一個ssDNA結(jié)合蛋白表達(dá)盒,每一個表達(dá)盒都有各自的啟動子和終結(jié)子。
[0034]圖2.攜帶靶向核酸內(nèi)切酶的GSMS瞬時表達(dá)系統(tǒng)。質(zhì)粒包含一個GSMS表達(dá)盒,一個反轉(zhuǎn)錄酶表達(dá)盒,一個ssDNA結(jié)合蛋白表達(dá)盒,一個tRNA表達(dá)盒,和一個革巴向核酸內(nèi)切酶表達(dá)盒,每一個表達(dá)盒都有各自的啟動子和終結(jié)子。
[0035]圖3.圖示ssGSMS cDNAs在細(xì)胞中的產(chǎn)生過程。GSMS首先被轉(zhuǎn)錄為RNA然后以同時表達(dá)的tRNA為引物,被同時表達(dá)的反轉(zhuǎn)錄酶反轉(zhuǎn)錄為sscDNA。ssGSMS cDNA與ssDNA結(jié)合蛋白結(jié)合進(jìn)入細(xì)胞核。靶向核酸內(nèi)切酶可以參與到此過程中。
[0036]圖4.當(dāng)靶向核酸內(nèi)切酶被包括在系統(tǒng)中時,ssGSMS cDNA進(jìn)入細(xì)胞核后可能的用途。ssGSMS cDNA結(jié)合蛋白不僅保護(hù)ssGSMS cDNA不受降解和形成二級結(jié)構(gòu),還幫助ssGSMScDNA搜尋同源基因組區(qū)域并與之對齊。在列隊找齊的時候,ssGSMS cDNA上無論預(yù)先設(shè)定的還是由易錯反轉(zhuǎn)錄酶引入的單核苷酸變異會與基因組序列形成錯配泡,錯配泡會觸發(fā)受體細(xì)胞的錯配修復(fù)系統(tǒng)(Mismatch Repair, MMR)從而將突變引入到基因組DNA。ssGSMS cDNA也可以通過同源重組或相類似的方式,如鏈侵入(Strand Invas1n)和鏈交換(StrandExchange)被整合進(jìn)入受體細(xì)胞基因組。
[0037]圖5.當(dāng)靶向雙鏈核酸內(nèi)切酶被包含在系統(tǒng)中時,ssGSMS cDNA進(jìn)入細(xì)胞核后可能的用途。ssGSMS cDNA結(jié)合蛋白不僅保護(hù)ssGSMS cDNA不受降解和形成二級結(jié)構(gòu),還幫助ssGSMS cDNA搜尋同源基因組區(qū)域并與之對齊。靶向核酸內(nèi)切酶切割基因組靶向位點(diǎn)產(chǎn)生雙鏈斷裂(DSB),ssGSMS cDNA與靶向基因組序列雜交。雜交配對后,ssGSMS cDNA可以被用作模板來合成靶向基因組序列或者通過同源鏈交叉整合到基因組序列中。
[0038]圖6.當(dāng)靶向單鏈核酸內(nèi)切酶被包含在系統(tǒng)中時,ssGSMS cDNA進(jìn)入細(xì)胞核后可能的用途。ssGSMS cDNA結(jié)合蛋白不僅保護(hù)ssGSMS cDNA不受降解和形成二級結(jié)構(gòu),還幫助ssGSMS cDNA搜尋同源基因組區(qū)域并與之對齊。靶向核酸內(nèi)切酶切割基因組靶向位點(diǎn)產(chǎn)生單鏈斷裂(SSB),ssGSMS cDNA與靶向基因組序列雜交。雜交配對后,ssGSMS cDNA可以被用作模板來合成靶向基因組序列或者通過同源鏈交叉整合到基因組序列中。相對于靶向雙鏈核酸內(nèi)切酶,使用靶向單鏈核酸內(nèi)切酶較少產(chǎn)生異位突變或染色體重排。
[0039]圖7.展示利用tRNA為引物產(chǎn)生ssGSMS cDNA。在GSMS RNA 3’端有一個引物結(jié)合位點(diǎn),與tRNA的3’端互補(bǔ)。tRNA結(jié)合到GSMS RNA的引物結(jié)合位點(diǎn)并被用作反轉(zhuǎn)錄的引物。
[0040]圖8.展示ssGSMS cDNA合成中多聚T/A,poly(T/A)引物。在設(shè)計中,一段多聚T,poly(dT)被加到GSMS正鏈的3’端,因此在GSMS RNA的3’端包括一段多聚U,poly (U)。轉(zhuǎn)錄時一段多聚A,poly(A)尾巴被加到GSMS RNA3’端多聚U,poly (U)的后面。Poly(A)尾巴可以反轉(zhuǎn)互補(bǔ)結(jié)合到poly (U)上并被用作反轉(zhuǎn)錄過程的引物,合成ssGSMS cDNA。
[0041]圖9.展示GSMS RNA 5’端的二級結(jié)構(gòu)被用來終止反轉(zhuǎn)錄。GSMS設(shè)計使得在GSMSRNA的5’端形成一個發(fā)卡型的二級結(jié)構(gòu)。當(dāng)反轉(zhuǎn)錄酶抵達(dá)GSMS RNA 5’端的二級結(jié)構(gòu)時,反轉(zhuǎn)錄過程被終止。
[0042]圖10.展示具有好的和差的校對性能的反轉(zhuǎn)錄酶的行為。如果使用校對性能較好的反轉(zhuǎn)錄酶,GSMS RNA被反轉(zhuǎn)錄為與設(shè)計一致的ssGSMS cDNA。而當(dāng)使用校對性能差的反轉(zhuǎn)錄酶時,隨機(jī)突變經(jīng)常會被引入到ssGSMS cDNA中,導(dǎo)致產(chǎn)生一個ssGSMS cDNA的受體細(xì)胞隨機(jī)突變庫。
[0043]圖11.可以包括在系統(tǒng)中的,協(xié)助目的基因組改造的一些表達(dá)盒。
[0044]表達(dá)盒1:操縱子/GSMS/終結(jié)子
[0045]表達(dá)盒2:操縱子/指向GSMS目的基因的siRNA/終結(jié)子
[0046]表達(dá)盒3:操縱子/反轉(zhuǎn)錄酶/終結(jié)子
[0047]表達(dá)盒4:操縱子/能互補(bǔ)結(jié)合到GSMS上引物結(jié)合位點(diǎn)的人工tRNA/終結(jié)子
[0048]表達(dá)盒5:操縱子/能互補(bǔ)結(jié)合到GSMS上引物結(jié)合位點(diǎn)的天然tRNA/終結(jié)子
[0049]表達(dá)盒6:熒光蛋白表達(dá)盒
[0050]表達(dá)盒7:其他干擾RNA運(yùn)輸,降解的RNAi表達(dá)盒
[0051]表達(dá)盒8:操縱子/鋅指核酸酶或轉(zhuǎn)錄激活因子樣效應(yīng)因子核酸酶/終結(jié)子
[0052]表達(dá)盒9:操縱子/單鏈DNA (ssDNA)結(jié)合蛋白/終結(jié)子
[0053]圖12.展示一個合并表達(dá)盒的設(shè)計,在這個合并表達(dá)盒中,超過一種蛋白質(zhì)編碼序列(如反轉(zhuǎn)錄酶,單鏈DNA結(jié)合蛋白)和GSMS被線性連接在一起并由同一個操縱子控制。蛋白編碼序列靠近表達(dá)盒的5’端,GSMS靠近3’端。一個翻譯跳躍序列被插入到兩個相鄰蛋白編碼序列之間,同時一個在被翻譯成RNA時能形成發(fā)卡結(jié)構(gòu)的序列被加在GSMS的5’端。表達(dá)盒被轉(zhuǎn)錄為RNA后,核糖體開始從RNA的5’端開始合成蛋白質(zhì)并在遇到終止碼時停止,而反轉(zhuǎn)錄酶從RNA的3’端開始合成cDNA并在遇到發(fā)卡型二級結(jié)構(gòu)時停止,很少進(jìn)入RNA蛋白質(zhì)編碼區(qū)域。翻譯跳躍序列編碼一個自剪多肽保證生成獨(dú)立的反轉(zhuǎn)錄酶和單鏈DNA結(jié)合蛋白而不是二者結(jié)合在一起的大融合蛋白。
【具體實(shí)施方式】
[0054]在本文中,除非另有定義,所使用的技術(shù)和科學(xué)術(shù)語均能夠被一個在與本發(fā)明相關(guān)領(lǐng)域工作的掌握一般技能的人員所理解。如本文所用,以下術(shù)語具有指定含義,除非在文中對所使用的不同定義另有清晰的表述。
[0055]術(shù)語“基因組DNA改造序列,,(genomic sequence modifying sequence - GSMS)。如本文所用,指一段可以在受體染色體或游離體特定位點(diǎn)序列引發(fā)改變的核酸。改變可以指一個或多個核苷酸變異,核苷酸插入,刪除,或以上的任意組合。改變還可以指插入一段可以導(dǎo)致所需表現(xiàn)型的外源DNA。術(shù)語“游離體DNA”指細(xì)胞中獨(dú)立于染色體外的可以獨(dú)立復(fù)制的DNA,如質(zhì)粒,粘粒,細(xì)菌人工染色體(BAC)和酵母人工染色體(YAC)。基因組DNA改造序列(GSMS)含有一個引物結(jié)合序列和與受體染色體或游離體目的序列同源的序列。GSMS的同源序列可以是除一個或幾個堿基外與目的序列完全互補(bǔ)的序列。GSMS也可以和目的序列有不同程度的互補(bǔ),如10-20%,30-40%,50-60%, 70%, 80%, 90%, 95%的同源互補(bǔ)。在有些實(shí)施方式中,GSMS包括一段外源序列,它和與目的序列同源的序列從一端或兩端相連接;GSMS的同源序列應(yīng)該有足夠的長度讓它能夠確認(rèn)受體細(xì)胞的目的序列并與其雜交。同源序列的長度可以是,例如10個堿基,但也可以是40-60個堿基長,或幾百,幾千堿基長。目的序列可以是任何感興趣的需要改變和改造的序列,包括編碼序列,非編碼序列(調(diào)控序列,內(nèi)含子和重復(fù)序列)。目的序列還可以是重組熱點(diǎn)序列或正向或反向重復(fù)序列等有較高同源重組率的序列。
[0056]在本文中使用的術(shù)語,如“異源DNA”,“外源多聚核苷酸”,“外源核酸”,或“外源序列”,指那些對于特定受體細(xì)胞起源于外源的序列,或者起于同源但處于受體細(xì)胞非天然所見的位點(diǎn)。外源DNA表達(dá)產(chǎn)生外源多肽,如標(biāo)記基因。
[0057]如本文所用,術(shù)語“同源序列”,“同源核酸”,或“同源多聚核苷酸”指特定受體細(xì)胞的內(nèi)源性核苷酸序列(如DNA或RNA)。同源序列可以從受體細(xì)胞中提取和克隆,或者根據(jù)序列資料化學(xué)合成。同源序列可以和受體細(xì)胞內(nèi)源DNA或RNA完全互補(bǔ)。同源序列也可以和內(nèi)源序列存在某些堿基差異,但它應(yīng)該與相對應(yīng)的內(nèi)源序列有足夠高的同源性,以至于當(dāng)被引入到受體細(xì)胞中能夠確認(rèn)并和相對應(yīng)的內(nèi)源序列雜交。同源基因改變指利用同源核苷酸序列改變受體細(xì)胞相對應(yīng)的內(nèi)源基因。
[0058]本文所用的“表達(dá)盒”指一個載體的部分核酸序列,它包括指導(dǎo)細(xì)胞機(jī)器生產(chǎn)RNA或蛋白所需的遺傳組件。一個DNA表達(dá)盒的基本組件包括操縱子序列,編碼RNA或蛋白的序列,和一個轉(zhuǎn)錄終止序列。操縱子是一個與啟動特定基因轉(zhuǎn)錄所需蛋白(如RNA聚合酶,轉(zhuǎn)錄因子)結(jié)合的DNA區(qū)域。根據(jù)受體細(xì)胞類型的不同(如原核細(xì)胞,真核細(xì)胞),多個操縱子可以應(yīng)用于表達(dá)盒中。原核細(xì)胞操縱子包括,如Lac操縱子,Trp操縱子,Tac操縱子和T7操縱子。高效病毒操縱子可以應(yīng)用于真核細(xì)胞中,如CMV-1E操縱子,SV40操縱子,RSV-LTR操縱子,(MoMLV) LTR操縱子,和(CaMV) 35S操縱子。真核生物操縱子一般來說弱于病毒操縱子,但有利的一面是有組織表達(dá)特異性,如Apo A-1操縱子(De Geest et al.,2000)和ApoE操縱子(Kim et al., 2001)是肝臟特異操縱子,MCK操縱子(Hauser et al.,2000)和肌球重鏈操縱子(myosin heavy-chain promoter, Skarli et al., 1998)是肌肉特異操縱子。轉(zhuǎn)錄終止子是造成RNA聚合酶終止轉(zhuǎn)錄的一段DNA序列。原核和真核生物有不同的轉(zhuǎn)錄終止信號系統(tǒng),因此使用不同的終止序列。一個表達(dá)盒中的操縱子和終止子可以來源于同一個或不同的基因。例如,T7終止子和T7操縱子用于細(xì)菌細(xì)胞的表達(dá)盒,CMV-1E操縱子和兔β球蛋白終止子用于動物細(xì)胞表達(dá)盒(如pTandem-Ι載體,Navagen, Madison, WI)。有時,可以用一段合成的多聚(A)終止序列(如pTargeTTM載體,Promega, Madison, WI)。
[0059]除了用串聯(lián)在一起的表達(dá)盒表達(dá)多個蛋白,2到3個蛋白可以被合并到一個表達(dá)單位中由同一個操縱子驅(qū)動;在這種情形下,編碼不同蛋白的DNA序列被翻譯跳躍序列分隔開來,翻譯跳躍序列編碼一個具有自切功能的2A多肽(Halpin et al.,1999)(Zhang, 2013)。2A多肽是一個18-22個氨基酸的具有自切功能的小核糖核酸病毒多肽。在翻譯蛋白的時候,核糖體跳過合成一個2A蛋白C端的肽鍵,導(dǎo)致2A間肽鍵斷裂,下游多肽分離(Kim, 2011)。如圖12所示,一個或多個蛋白編碼序列可以和GSMS序列合并放入同一個表達(dá)盒中。蛋白編碼序列被翻譯跳躍序列分隔。GSMS在表達(dá)盒內(nèi)靠近3’端并由一個發(fā)卡結(jié)構(gòu)形成序列與上游蛋白編碼序列隔開,例如,當(dāng)反轉(zhuǎn)錄酶和單鏈DNA結(jié)合蛋白與GSMS合并放入同一個表達(dá)盒中,表達(dá)盒的轉(zhuǎn)錄生成一個RNA分子(從5’端到3’端)依次為反轉(zhuǎn)錄酶編碼序列,翻譯跳躍序列,單鏈DNA結(jié)合蛋白編碼序列,發(fā)卡結(jié)構(gòu)形成序列,GSMS序列(圖12)。翻譯跳躍序列翻譯為一個自切多肽,導(dǎo)致生成一個獨(dú)立的反轉(zhuǎn)錄酶和一個獨(dú)立的單鏈DNA結(jié)合蛋白。在單鏈DNA結(jié)合蛋白末端的終止碼阻止下游GSMS RNA被翻譯,而GSMS 5’端的發(fā)卡結(jié)構(gòu)阻礙反轉(zhuǎn)錄進(jìn)入蛋白編碼區(qū)。這種構(gòu)造可以讓多個蛋白或蛋白亞基在冋一表達(dá)盒中表達(dá),簡化表達(dá)盒構(gòu)建,促成相關(guān)蛋白的協(xié)調(diào)表達(dá)。
[0060]表達(dá)盒用來生成RNA或有功能的蛋白質(zhì)。例如,GSMS表達(dá)盒用來生成GSMS RNA,然后被反轉(zhuǎn)錄為ssGSMS cDNA。反轉(zhuǎn)錄酶表達(dá)盒,ssDNA結(jié)合蛋白表達(dá)盒,以及革巴向核酸內(nèi)切酶表達(dá)盒被用來表達(dá)功能蛋白。這些蛋白表達(dá)盒用以生成所需功能的蛋白或多肽,而沒有具體蛋白/多肽序列的限制。反轉(zhuǎn)錄酶表達(dá)盒用以生成能夠以RNA為模板合成互補(bǔ)DNA的天然的或經(jīng)人工改造的反轉(zhuǎn)錄酶。反轉(zhuǎn)錄酶可以具備或不具備RNA酶H(RNase H)活性,RNase H活性是指剪切RNA-DNA雜合體中的RNA分子,和依賴于DNA模板的DNA合成酶活性。反轉(zhuǎn)錄酶可以從反轉(zhuǎn)錄病毒中獲取,如莫洛尼鼠白血病病毒(M-MuLV),人類免疫缺陷病毒(HIV)和禽成髓細(xì)胞瘤病毒(AMV)。天然存在的反轉(zhuǎn)錄酶一般只有很少的或不具備校對功能,因此在反轉(zhuǎn)錄中易出錯。人工改造的工程反轉(zhuǎn)錄酶具有較好的校對功能,可從商業(yè)渠道獲得,如 Superscript? 反轉(zhuǎn)錄酶(Life Technologies, Carlsbad, CA)和 AccuScript 高保真反轉(zhuǎn)錄酶(Agilent Technologies, Santa Clara, CA)。在 ssGSMS cDNA 中需要維持特定變異時,需要使用高保真反轉(zhuǎn)錄酶。校對能力差的反轉(zhuǎn)錄酶可以用來在ssGSMS cDNA中制造隨機(jī)突變。
[0061]ssDNA結(jié)合蛋白表達(dá)盒用來生成能夠和單鏈DNA結(jié)合的天然的或人工改造的ssDNA結(jié)合蛋白,用以保護(hù),穩(wěn)定單鏈DNA并協(xié)助將單鏈DNA轉(zhuǎn)運(yùn)至細(xì)胞核。這些ssDNA結(jié)合蛋白還有可能是細(xì)胞同源重組機(jī)制的一部分,參與到GSMS的同源重組。ssDNA結(jié)合蛋白可以包括,如復(fù)制蛋白 A (replicat1n protein A), Rec A, Rad51, DMC I, ICP8, SSB 以及任何具有相似功能的同源蛋白。大腸桿菌(E.colDRecA蛋白及其同系物是同源重組的重要蛋白,參與同源確認(rèn),同源DNA配對,和鏈交換。RecA及其真核生物中的同系物RAD51可以結(jié)合到單鏈DNA上形成動態(tài)核酸蛋白絲,在雙鏈DNA上尋找同源區(qū),然后協(xié)助同源DNA鏈入侵(Li,2008)。RecA及其相似蛋白的過度表達(dá)可能增加由GSMS主導(dǎo)的同源基因改造的效率。靶向核酸內(nèi)切酶表達(dá)盒用來生成能夠識別預(yù)先指定的特異核酸序列的核酸內(nèi)切酶。靶向核酸內(nèi)切酶是經(jīng)過工程改造的內(nèi)切酶,它將一個DNA序列識別結(jié)構(gòu)域鏈接到一個DNA核酸內(nèi)切酶結(jié)構(gòu)域。序列識別結(jié)構(gòu)域可包括轉(zhuǎn)錄激活因子樣效應(yīng)因子(TALE)DNA序列識別結(jié)構(gòu)域,鋅指蛋白DNA序列識別結(jié)構(gòu)域,和大型核酸酶的序列識別結(jié)構(gòu)域。
[0062]在某些實(shí)施方式中,siRNA表達(dá)盒用來生成能夠引起目的基因轉(zhuǎn)錄產(chǎn)物RNA降解的小干擾RNA(SiRNA)。siRNA被設(shè)計成識別GSMS同源區(qū)域以外的序列,從而引起目的基因轉(zhuǎn)錄RNA的降解而不是GSMS RNA的降解。目的基因RNA的降解可以向細(xì)胞核發(fā)出信號,維持目的基因轉(zhuǎn)錄活躍,致使目的基因序列處于解旋或半解旋狀態(tài)。這為GSMS與目的位點(diǎn)同源序列的雜交提供了方便。siRNA表達(dá)盒有多種構(gòu)建方式。例如,它可以由RNA聚合酶III操縱子驅(qū)動一小段發(fā)卡型siRNA,并由一段鳥苷酸終止轉(zhuǎn)錄而無需多聚腺嘌呤信號(Sui etal., 2002 ;Brummelkamp et al., 2002)。siRNA表達(dá)質(zhì)粒和病毒載體可以從商業(yè)渠道如LifeTechnologies, Gene Script, BMC B1technology 等獲得。
[0063]表達(dá)盒最好是DNA但也可以是RNA形式。RNA表達(dá)盒中的蛋白編碼序列可以被直接翻譯為蛋白質(zhì),而RNA表達(dá)盒中的GSMS RNA可以被直接用作模板合成ssGSMS cDNA。例如,含有GSMS和反轉(zhuǎn)錄酶表達(dá)盒的非整合型慢病毒載體(integrat1n deficient lentiviralvector) (Chick, 2012)可以被用來產(chǎn)生ssGSMS cDNA。非整合型反轉(zhuǎn)錄病毒載體,因其能降低反轉(zhuǎn)錄病毒載體自身的非常規(guī)整合,因此更加適合。含有由同一個操縱子驅(qū)動的多個蛋白編碼序列以及一段GSMS序列的人工合成的RNA可以被引入受體細(xì)胞并以協(xié)調(diào)的方式生成蛋白質(zhì)和ssGSMS cDNA。
[0064]GSMS的產(chǎn)牛:GSMS首先與一個操縱子和一個終結(jié)子一同被克隆到一個表達(dá)盒中,然后和一個在同一個載體或不同載體上的反轉(zhuǎn)錄酶表達(dá)盒一同被引入受體細(xì)胞(圖1)。GSMS也可與反轉(zhuǎn)錄酶合并入同一個表達(dá)盒中(圖12)。同時被引入到受體細(xì)胞的還有在同一個或不同載體上的一個單鏈DNA結(jié)合蛋白表達(dá)盒(如RecA,Rad51, RPA)。一旦進(jìn)入受體細(xì)胞,GSMS先被轉(zhuǎn)錄為RNA,GSMS RNA然后被同時表達(dá)的反轉(zhuǎn)錄酶反轉(zhuǎn)錄為ssGSMS cDNA (例如用tRNA作引物)。ssGSMS cDNA隨后與同時表達(dá)的單鏈DNA結(jié)合蛋白結(jié)合形成核酸蛋白復(fù)合體或核酸蛋白絲。單鏈DNA結(jié)合蛋白保護(hù)ssGSMS cDNA,抵御降解,減少二級結(jié)構(gòu)的形成,協(xié)助ssGSMS cDNA進(jìn)入細(xì)胞核并與同源基因組序列對準(zhǔn)(Robyn L.Maher, 2013)。在隨后的幾天或幾周內(nèi),只要載體存在,GSMS就會通過轉(zhuǎn)錄和反轉(zhuǎn)錄被擴(kuò)增成千上萬倍。
[0065]上述過程提供了持續(xù)的和大量的ssGSMS cDNA進(jìn)入受體細(xì)胞的細(xì)胞核中,配對受體細(xì)胞基因組的特定區(qū)域,促成特定基因的改變。基于同源的基因改造的細(xì)胞機(jī)制并不完全清楚??赡艿臋C(jī)制包括不同類型的同源重組過程和DNA修復(fù)路徑。一個可能的通過DNA錯配修復(fù)(MMR)路徑的DNA改造機(jī)制是ssGSMS cDNA首先與受體細(xì)胞基因組DNA特定區(qū)域的同源序列雜交,如果ssGSMS cDNA含有變異,變異或者是事先設(shè)計的或者是由易出錯的反轉(zhuǎn)錄酶隨機(jī)引入的,ssGSMS cDNA和目的序列對準(zhǔn)時就會產(chǎn)生錯配的堿基對。錯配的堿基對會觸發(fā)受體細(xì)胞的基因修復(fù)或糾錯系統(tǒng),修復(fù)時有時會錯誤地以ssGSMS cDNA為模板而改變受體細(xì)胞基因組序列從而引入突變(圖4)。GSMS中與目的基因組序列同源的部分可以參與到不同的同源重組的過程,特別是當(dāng)目的基因組序列被靶向核酸內(nèi)切酶或其他自然因素?fù)p壞。同源重組過程一般涉及到同源搜索,DNA鏈入侵,和模板指導(dǎo)的DNA合成而導(dǎo)致的目的序列的基因改造。同源重組包括但并不局限于下列路徑,雙鏈斷裂修復(fù)路徑(DSBR),基于合成的單鏈退火路徑(SDSA),單鏈退火路徑(SSA),斷鏈誘導(dǎo)的復(fù)制路徑(BIR),RecB⑶路徑和RecF路徑。
[0066]不同應(yīng)用目的的GSMS設(shè)計:如果本發(fā)明系統(tǒng)被用來改變目的基因預(yù)先設(shè)定的堿基對,則除預(yù)先設(shè)定的核苷酸變異外GSMS應(yīng)和目的基因完全互補(bǔ)。變異核苷酸最好位于GSMS同源序列的中心或靠近中心。應(yīng)當(dāng)使用高保真反轉(zhuǎn)錄酶以減少在ssGSMS cDNA合成過程中隨機(jī)弓I入的非所需的變異的幾率。
[0067]本發(fā)明的一個有吸引力的地方是可以將隨機(jī)突變引入目的基因從而構(gòu)建在目的基因區(qū)域含有隨機(jī)突變的細(xì)胞庫。如以此為目的,可以使用與目的基因完全互補(bǔ)的GSMS序列以及校對能力差的反轉(zhuǎn)錄酶生成含有隨機(jī)突變的ssGSMS cDNA。
[0068]本發(fā)明還可以用來將外源DNA整合到受體基因組的目的位點(diǎn)。例如,它可以以插入一段無用DNA序列的方式敲除一個內(nèi)源基因,或在預(yù)先設(shè)定的基因組位點(diǎn)上插入一個所需的基因。如以此為目的,GSMS包括一段外源序列和與目的序列同源的序列,同源序列可在一端或兩端與外源序列相連。位于兩端的同源序列一般來說和目的序列100%互補(bǔ),并且具有足夠的長度以支持同源重組(圖5,圖6)。目的位點(diǎn)可以是基因組的任何位點(diǎn),例如,為增加靶向整合的幾率,目的序列可以是重組熱點(diǎn)序列,以及直向或反向重復(fù)序列。
[0069]GSMS DNA序列可以設(shè)計成在被轉(zhuǎn)錄為RNA時,在GSMS RNA的5’端會形成一個發(fā)卡型二級結(jié)構(gòu),反轉(zhuǎn)錄時,當(dāng)反轉(zhuǎn)錄酶遭遇這個二級結(jié)構(gòu)會從RNA上脫落從而終止cDNA合成。這樣不需要的核苷酸不會被添加到ssGSMS cDNA的5’端(圖9)。
[0070]ssGSMS cDNA合成中的引物:牛成ssGSMS cDNA常用的引物是天然tRNA和人工tRNA。其它如Poly(T/A)引物也可以使用。cDNA合成的引物可以是天然tRNA或人工tRNA。tRNA的3’端一直被反轉(zhuǎn)錄病毒和反轉(zhuǎn)錄轉(zhuǎn)座子用作引物(Kleiman,1997)(R Marquet, 1995) (Voytas, 1993) (S.B.Sandmeyer, 1996) (Wakefield, 1995)。一般情況下,tRNA3’端的10-18個堿基對被反轉(zhuǎn)錄病毒和反轉(zhuǎn)錄轉(zhuǎn)座子用作反轉(zhuǎn)錄的起始引物(Kleiman, 1997)。不同的反轉(zhuǎn)錄病毒的反轉(zhuǎn)錄酶使用不同的tRNA作為反轉(zhuǎn)錄的起始引物。例如,人類免疫缺陷病毒(HIV),莫洛尼鼠白血病病毒(M-MuLV)和禽成髓細(xì)胞瘤病毒(AMV)的反轉(zhuǎn)錄酶分別使用tRNA31ys,tRNApro,和tRNAtrp作為cDNA合成的起始引物(Kleiman, 1997)。GSMS上的引物結(jié)合序列可以被設(shè)計成完全與所選反轉(zhuǎn)錄酶所需的tRNA的3’端互補(bǔ)。GSMS RNA可以直接使用受體細(xì)胞的tRNA起始反轉(zhuǎn)錄。天然tRNA表達(dá)盒可以加入到含有GSMS和反轉(zhuǎn)錄酶表達(dá)盒的瞬時表達(dá)系統(tǒng)中,增加引物tRNA的量,以提高ssGSMScDNA的產(chǎn)量。
[0071]除使用受體細(xì)胞本身的tRNA作引物外,可以設(shè)計使用(如A.H.Lund, 1997)所描述的與GSMS引物結(jié)合位點(diǎn)完全互補(bǔ)的人工tRNA。人工tRNA表達(dá)盒可以與GSMS和反轉(zhuǎn)錄酶表達(dá)盒構(gòu)建在同一或不同的載體上同時導(dǎo)入受體細(xì)胞。人工tRNA被用作起始ssGSMS cDNA合成的引物如圖9所示(圖9)。
[0072]Poly (T/A)引物法是以加在mRNA 3’端的Poly(A)尾巴為引物。要實(shí)現(xiàn)這個目的,一段poly (U)必須加到GSMS RNA的3’端,相應(yīng)的,一段dT序列要被加到GSMS DNA有意義鏈的3’端。當(dāng)poly⑷尾巴被加在GSMS RNA 3’端的poly⑶區(qū)域后,poly⑷尾巴折回與poly(U)區(qū)段退火作為引物起始cDNA的合成(圖8)。一個可能的問題是,添加poly (U)可能會妨礙RNA轉(zhuǎn)移到細(xì)胞質(zhì)。如果情況屬實(shí),一個核定位序列(NLS)可以被添加到反轉(zhuǎn)錄酶上將其轉(zhuǎn)移至細(xì)胞核中合成GSMS cDNA。
[0073]反轉(zhuǎn)錄酶的選擇:本發(fā)明系統(tǒng)最好采用具有RNase H活性的反轉(zhuǎn)錄酶,用來將ssGSMS cDNA從RNA/cDNA雜合分子中游離出來。如以改變目的序列特定核苷酸或在目的位點(diǎn)插入外源基因?yàn)槟繕?biāo),需要在轉(zhuǎn)錄和反轉(zhuǎn)錄中嚴(yán)格保持原有GSMS序列,應(yīng)當(dāng)使用高保真反轉(zhuǎn)錄酶以避免在反轉(zhuǎn)錄中不需要的變異被引入到ssGSMS cDNA中。由于大多數(shù)天然反轉(zhuǎn)錄酶不具有3’ -5’核酸外切酶活性(即校對功能),因此容易出錯。具有較好校對功能的工程反轉(zhuǎn)錄酶如Life Technologies的Superscript反轉(zhuǎn)錄酶可被用作此目的。
[0074]校對能力較差的反轉(zhuǎn)錄酶(BattulaN, 1974) (Battula N, 1976) (KunkelTA, 1981)另有用途。例如,易出錯HIV反轉(zhuǎn)錄酶的出錯率約為1/1500堿基。對于一個2kb長的GSMS DNA來說,平均每個ssGSMS cDNA分子會含有一個隨機(jī)變異。在反轉(zhuǎn)錄中易出錯反轉(zhuǎn)錄酶可以用來在ssGSMS cDNA上生成隨機(jī)變異,含有隨機(jī)變異的ssGSMS cDNA可以將隨機(jī)變異引入到目的基因,從而產(chǎn)生一個在目的基因區(qū)域含有隨機(jī)突變的細(xì)胞庫,這個細(xì)胞庫可被用來篩選所需要的基因突變。
[0075]ssGSMS cDNA的應(yīng)用:無論是否有靶向核酸內(nèi)切酶的協(xié)助,ssGSMS cDNA都可被用來修飾目的基因。在某些實(shí)施例中,如果靶向核酸內(nèi)切酶沒有被包括在瞬時表達(dá)系統(tǒng)中,ssGSMS cDNA仍可進(jìn)入到細(xì)胞核中并與受體細(xì)胞的同源基因組序列雜交。如果ssGSMS cDNA含有預(yù)先設(shè)計的或是由易出錯反轉(zhuǎn)錄酶引入的變異,ssGSMS cDNA和目的序列對準(zhǔn)時就會產(chǎn)生錯配的堿基對。錯配的堿基對會觸發(fā)受體細(xì)胞的基因修復(fù)或糾錯系統(tǒng)如MMR,受體細(xì)胞的基因修復(fù)或糾錯系統(tǒng)會錯誤地以ssGSMS cDNA為模板而改變受體細(xì)胞基因組序列從而引入突變(圖4)。還有可能ssGSMS cDNA與同源目的序列雜交,主導(dǎo)祀向修飾或通過同源重組將外源DNA序列整合進(jìn)受體細(xì)胞基因組中。
[0076]在某些實(shí)施方式中,瞬時表達(dá)系統(tǒng)包括一個革巴向核酸內(nèi)切酶表達(dá)盒。革巴向核酸內(nèi)切酶是經(jīng)過工程改造的內(nèi)切酶,它將一個定制的DNA序列識別結(jié)構(gòu)域和一個非特異DNA核酸內(nèi)切酶結(jié)構(gòu)域連接在一起。DNA序列識別結(jié)構(gòu)域可被設(shè)計成能夠識別一段10到50個堿基的特異基因組序列,靶向核酸內(nèi)切酶因此能夠在靠近期望引入變異的靶向位點(diǎn)切割DNA。當(dāng)有大量的ssGSMS cDNA進(jìn)入細(xì)胞核中,靶向序列的DNA鏈斷裂會激活同源重組路徑對DNA進(jìn)行修復(fù)。ssGSMS cDNA與單鏈DNA結(jié)合蛋白形成核酸蛋白復(fù)合體或核酸蛋白絲,通過同源搜索發(fā)現(xiàn)靶向同源區(qū)的DNA斷裂,很可能在單鏈DNA結(jié)合蛋白如RecA及相似蛋白的協(xié)助下,入侵同源區(qū)域并作為模板指導(dǎo)DNA合成,從而將變異整合到靶向位點(diǎn)。聯(lián)合ssGSMScDNA和靶向核酸內(nèi)切酶可以極大地提高通過同源重組在特異位點(diǎn)修飾基因的效率。可能介入的同源重組的機(jī)制包括(但不局限于),雙鏈斷裂修復(fù)路徑(DSBR),基于合成的單鏈退火路徑(SDSA),單鏈退火路徑(SSA),斷裂誘導(dǎo)復(fù)制路徑(BIR),RecBCD路徑和RecF路徑。
[0077]靶向核酸內(nèi)切酶的例子包括轉(zhuǎn)錄激活因子樣效應(yīng)因子核酸酶(TALEN),鋅指核酸酶(ZFN)和大型核酸酶等。這些靶向核酸內(nèi)切酶可以經(jīng)工程改造而能夠辨認(rèn)和切割一段10到15個堿基長的特異雙鏈核苷酸序列,這使它們成為靶向基因修飾的卓越工具。TALEN是一個很不錯的選擇,因?yàn)門ALEN的DNA識別結(jié)構(gòu)域含有和單個核苷酸相關(guān)的微基序重復(fù),使得設(shè)計一個能夠識別所需序列的微基序組合成為可能(美國專利,專利號8440431和8440432)。TALEN和ZFN可以經(jīng)過進(jìn)一步工程改造以切割雙鏈DNA或者產(chǎn)生雙鏈斷裂(DSB),或者在雙鏈DNA的一條鏈上產(chǎn)生缺刻(Kim, et al.,2012)。Kim發(fā)現(xiàn),和雙鏈DNA斷裂(DSB)核酸內(nèi)切酶相比,缺刻核酸內(nèi)切酶的整合效率較低。但缺刻核酸內(nèi)切酶所引發(fā)的的非特異整合和染色體重排率也較低。如果避免非特異整合和染色體重排是較為重要的方面,如基因療法,則靶向缺刻核酸內(nèi)切酶是更好的選擇。在某些實(shí)施例中,具有高親和性的多肽可以分別與靶向核酸內(nèi)切酶(如ZFN,TALEN)和單鏈DNA結(jié)合蛋白連接在一起。通過親和多肽間的互作,與單鏈DNA結(jié)合蛋白一起的ssGSMS cDNA可以被吸引到靶向位點(diǎn)的切害I]點(diǎn)和缺刻點(diǎn)。
[0078]修飾目的基因的瞬時表達(dá)系統(tǒng)的組件:
[0079]以上描述的系統(tǒng)的一些基本組件,可以根據(jù)不同的目的加入其它表達(dá)盒(圖11)。系統(tǒng)的表達(dá)盒包括但并不局限于:
[0080]表達(dá)盒1:啟動子/GSMS/終結(jié)子;表達(dá)盒2:啟動子/SiRNA-用以降解目的基因的RNA/終結(jié)子;表達(dá)盒3:啟動子/反轉(zhuǎn)錄酶/終結(jié)子;表達(dá)盒4:啟動子/用作反轉(zhuǎn)錄引物的人工tRNA/終結(jié)子;表達(dá)盒5:啟動子/用作反轉(zhuǎn)錄引物的天然tRNA/終結(jié)子;表達(dá)盒6:啟動子/熒光蛋白基因/終結(jié)子(熒光蛋白表達(dá)盒被用來監(jiān)測轉(zhuǎn)化,瞬時表達(dá)和選擇被轉(zhuǎn)化的細(xì)胞;表達(dá)盒7:其它RNAi表達(dá)盒用來干擾RNA運(yùn)輸,降解等過程。其他RNA干擾方法如siRNA也可以采用;表達(dá)盒8:啟動子/ZFN或TALEN/終結(jié)子;表達(dá)盒9:啟動子/單鏈DNA結(jié)合蛋白/終結(jié)子。
[0081]這個瞬時表達(dá)系統(tǒng)發(fā)明的最基本的組件是GSMS和反轉(zhuǎn)錄酶表達(dá)盒,它們可以在同一個或不同的表達(dá)載體上,也可以在同一個表達(dá)盒中。最好在同一個載體或不同載體上加上一個天然或人工tRNA表達(dá)盒,產(chǎn)生起始反轉(zhuǎn)錄所需的引物tRNA。一個單鏈DNA結(jié)合蛋白表達(dá)盒也可以被加入到系統(tǒng)中,所產(chǎn)生的單鏈DNA結(jié)合蛋白與ssGSMS cDNA結(jié)合,穩(wěn)定ssGSMS cDNA并協(xié)助ssGSMS cDNA向細(xì)胞核的運(yùn)輸。加入特別設(shè)計的能夠降解目的基因但同時不干擾ssGSMS cDNA的RNAi表達(dá)盒也是有益的。目的基因的降解可能會反饋信息給細(xì)胞核,刺激目的基因的轉(zhuǎn)錄,使目的基因區(qū)域維持解旋或松弛狀態(tài)。這會為ssGSMS cDNA接近染色體中的目的基因提供更多機(jī)會。另外,靶向核酸內(nèi)切酶表達(dá)盒可以被包括在系統(tǒng)中增加基于同源的基因修飾的效率。如圖12所示,一個或更多蛋白也可以和GSMS—起整合到一個表達(dá)盒中。
[0082]以上提到的表達(dá)盒可以構(gòu)建在一個載體上,也可以構(gòu)建在不同的載體上同時引入受體細(xì)胞。瞬時表達(dá)系統(tǒng)的載體可以是任何適于RNA轉(zhuǎn)錄和蛋白表達(dá)的載體。它可以是DNA或RNA,環(huán)狀或直線型,病毒或非病毒載體。將載體轉(zhuǎn)化進(jìn)入細(xì)胞的方法,這一領(lǐng)域的研究者都已知曉。這些方法的例子包括電擊法,PEG轉(zhuǎn)化,DEAE-detran或CaPO4沉淀法,脂質(zhì)體轉(zhuǎn)化,納米微粒轉(zhuǎn)化,病毒感染和直接注射法。受體細(xì)胞可以是適合的原核及真核生物,如哺乳動物,植物,昆蟲,藍(lán)藻,真菌,酵母,細(xì)菌,培養(yǎng)的細(xì)胞等。被修飾和改變的可以是受體細(xì)胞的任意基因組序列,包括外顯子,內(nèi)含子,啟動子,終結(jié)子,UTRs和調(diào)控序列或基序。
[0083]這項技術(shù)或許能夠用于治療傳染性疾病,遺傳疾病和如癌癥等其它疾?。慌嘤魑?,林木,家畜,和魚類的新性狀;產(chǎn)生細(xì)菌,酵母,藍(lán)藻和動物新的培養(yǎng)細(xì)胞類型用于藥物和性狀篩選;及用于發(fā)酵,油料,蛋白和其它醫(yī)藥,生物的工業(yè)原料的生產(chǎn)和科學(xué)研究。
[0084]實(shí)施例
[0085]以下的實(shí)施例只做說明用途而不對發(fā)明起限制或限定作用。
[0086]實(shí)施例1.利用GSMS ssDNAs恢復(fù)GFP熒光。
[0087]在本實(shí)施例中,一個GFP GSMS ssDNA被用來校正已經(jīng)穩(wěn)定整合到酵母細(xì)胞基因組中的刪除移碼GFP變異基因。一個完整的GFP編碼序列在靠近5’端處由于單堿基刪除造成移碼,將這個刪除移碼的GFP序列穩(wěn)定地整合到酵母細(xì)胞中。利用測序方法核實(shí)酵母基因組中GFP的變異。證實(shí)刪除移碼導(dǎo)致了 GFP失效。
[0088]本實(shí)施例中所利用的系統(tǒng)包括GSMS表達(dá)盒、反轉(zhuǎn)錄酶表達(dá)盒、ssDNA結(jié)合蛋白表達(dá)盒和引物表達(dá)盒。
[0089]首先構(gòu)建GSMS表達(dá)盒,將一段包含變異GFP堿基刪除點(diǎn)的野生型GFP與一個酵母強(qiáng)組成型啟動子TEFl連接,再與引物結(jié)合序列和酵母轉(zhuǎn)錄終止子連接。400bp長的野生型GFP編碼序列缺乏起始密碼子因此不能被翻譯成蛋白。只有當(dāng)酵母基因組中的變異GFP被校正后才可以產(chǎn)生正常發(fā)光的GFP蛋白。GSMS的引物結(jié)合序列有18個堿基與tRNApix)3’端序列互補(bǔ),tRNApro被M-MuLV反轉(zhuǎn)錄酶用作tRNA引物。由于這個例子需要一段準(zhǔn)確的野生型GFP編碼序列來校正變異GFP序列,使用高保真反轉(zhuǎn)錄酶SuperScriptTMII構(gòu)建反轉(zhuǎn)錄酶表達(dá)盒。反轉(zhuǎn)錄酶表達(dá)盒有一個強(qiáng)酵母啟動子TEFl,編碼SuperScriptTMII M-MuLV反轉(zhuǎn)錄酶的序列和一個酵母轉(zhuǎn)錄終止序列(酵母ADHl終止子)。一個tRNApro表達(dá)盒由一個連接到編碼tRNAproDNA序列的酵母啟動子(酵母ADH啟動子)和一個緊隨其后的轉(zhuǎn)錄終止序列(酵母ADHl終止子)構(gòu)建而成。
[0090]在合并表達(dá)盒中,一個酵母啟動子首先被連接到RAD51編碼序列,隨后是一個發(fā)卡二級結(jié)構(gòu)形成序列,然后是GSMS序列,和一個3’端的轉(zhuǎn)錄終止序列。RAD51和GSMS合并表達(dá)盒可以使RAD51蛋白和ssGSMS cDNA幾乎同時同地一起表達(dá),有利于GSMS-RAD51核酸蛋白絲的形成,GFP序列同源搜索,和GSMS鏈入侵以及變異GFP基因的校正。
[0091]以上表達(dá)盒在同一個酵母載體上,或分別在不同載體上。酵母載體可以是環(huán)形的或是直線型的,但不要使用可整合載體以避免整個載體被整合到酵母基因組中,本實(shí)施例中使用的是直線型酵母載體。包含有SuperScriptTMII反轉(zhuǎn)錄酶,利用LiAc/SS CarrierDNA/PEG將RAD51和GSMS表達(dá)盒的載體引入含有變異GFP的酵母細(xì)胞中。校正后的變異基因組GFP基因可以產(chǎn)生能發(fā)出熒光的GFP蛋白,利用熒光顯微鏡進(jìn)行檢測;利用流式細(xì)胞儀捕獲到含有正確GFP基因的細(xì)胞;通過DNA測序鑒定證實(shí)GFP序列正確。
[0092]實(shí)施例2.利用單鏈GSMS DNA和GFP siRNA敲除受體細(xì)胞GFP基因。
[0093]本實(shí)施例演示利用GSMS ssDNA敲除動物細(xì)胞中具正常功能的GFP基因。
[0094]本實(shí)施例中所使用的系統(tǒng)包括GSMS表達(dá)盒、反轉(zhuǎn)錄酶表達(dá)盒、ssDNA結(jié)合蛋白表達(dá)盒,引物表達(dá)盒和siRNA表達(dá)盒。
[0095]選擇具有正常功能的和被整合到細(xì)胞核中的GFP cDNA的能產(chǎn)生綠色熒光的293T-GFP細(xì)胞系。GSMS是一段300堿基長的靠近GFP cDNA 5’端的GFP編碼序列,它含有一個移碼刪除和兩個提早終止密碼子(ATG)。GSMS(+)鏈的引物結(jié)合序列是在3’端的20個dT轉(zhuǎn)錄后形成GSMS RNA中的20個U。在轉(zhuǎn)錄終止后,將一段多聚A尾巴加到GSMS RNA的3’端,它與在其之前的20個U序列自身退火,成為反轉(zhuǎn)錄的引物。同樣靠近GFP cDNA5’端,但在這300堿基GFP cDNA區(qū)域之外的GFP序列被用來設(shè)計雙鏈GFP siRNA,并克隆到表達(dá)盒中。GFP siRNA誘導(dǎo)GFP mRNA的降解,發(fā)出信號維持GFP基因活躍轉(zhuǎn)錄,并使GFP基因所在的基因組位點(diǎn)處于解旋或半解旋狀態(tài)。SuperScriptTMII反轉(zhuǎn)錄酶表達(dá)盒的構(gòu)建如實(shí)施例1。
[0096]化學(xué)合成的GFP siRNA和含有GSMS和SuperScriptTMII反轉(zhuǎn)錄酶表達(dá)盒的載體用脂體轉(zhuǎn)染劑(Iipofectamine)導(dǎo)入293T-GFP細(xì)胞中。轉(zhuǎn)化后正常培養(yǎng)293T-GFP,并尋找沒有GFP熒光的細(xì)胞。利用細(xì)胞流量儀分離無熒光細(xì)胞,再通過PCR和DNA測序證實(shí)了GFP基因已經(jīng)被敲除。
[0097]實(shí)施例3.利用GSMS ssDNA的GFP基因的同源重組熱點(diǎn)的靶向整合。
[0098]本實(shí)施例中所使用的系統(tǒng)包括GSMS表達(dá)盒、反轉(zhuǎn)錄酶表達(dá)盒、ssDNA結(jié)合蛋白表達(dá)盒,靶向核酸內(nèi)切酶表達(dá)盒和弓I物表達(dá)盒。
[0099]本實(shí)施例利用GSMS ssDNA將一段外源DNA弓丨入到受體細(xì)胞中的特定位點(diǎn),具體說就是同源重組熱點(diǎn)區(qū)域。首先確認(rèn)將要靶擊的基因組同源重組熱點(diǎn)。GSMS設(shè)計是一個具正常功能的GFP編碼序列和啟動子以及兩端100堿基長的和基因組同源重組熱點(diǎn)序列互補(bǔ)的序列。如同在實(shí)施例1中的描述,GSMS的引物結(jié)合序列是與tRNAPro3’端互補(bǔ)的18個堿基序列。一個SuperScriptTMII反轉(zhuǎn)錄酶表達(dá)盒和一個如上所述的GSMS及動物GAD51蛋白編碼序列的合并表達(dá)盒按實(shí)施例1所述構(gòu)建。將含有上述表達(dá)盒的載體轉(zhuǎn)入到HEK293胞系中并培養(yǎng)一周,直至瞬時表達(dá)載體被降解和消失。尋找和分離有GFP熒光的細(xì)胞克隆,通過DNA測序確認(rèn)發(fā)生了同源重組。
[0100]實(shí)施例4.利用GSMS ssDNA和TALEN構(gòu)建一個在目的基因組序列含有隨機(jī)突變的細(xì)胞庫
[0101]本實(shí)施例演示利用GSMS ssDNA,校對功能差的反轉(zhuǎn)錄酶和靶向核酸內(nèi)切酶TALEN構(gòu)建一個在目的基因組序列含有隨機(jī)突變的細(xì)胞庫的方法。本實(shí)施例中所使用的系統(tǒng)包括GSMS表達(dá)盒、校對功能差的反轉(zhuǎn)錄酶表達(dá)盒、ssDNA結(jié)合蛋白表達(dá)盒,和引物表達(dá)盒。
[0102]這個方法可以用來在目的基因組位點(diǎn)的DNA序列中導(dǎo)入隨機(jī)突變,構(gòu)建隨機(jī)突變細(xì)胞庫用以篩選新的性狀或所需要的表現(xiàn)型。需要改變的目的基因組位點(diǎn)可以是連續(xù)的外顯子序列,調(diào)控區(qū)域,或者整合到基因組中的cDNA序列。在本實(shí)施例改變的目的基因組位點(diǎn)為已經(jīng)整合到受體細(xì)胞基因組的正常GFP基因編碼序列。變異細(xì)胞可因減弱的GFP或失效GFP (無熒光)被容易地篩選。
[0103]GSMS和目的基因組序列完全相同,易出錯的HIV反轉(zhuǎn)錄酶(平均出錯率1/1500堿基)用來在反轉(zhuǎn)錄時將隨機(jī)突變引入到ssGSMS cDNA中。迎合HIV反轉(zhuǎn)錄酶自用的tRNA3Lys,GSMS引物結(jié)合序列含有18個堿基與tRNA3Lys3’端互補(bǔ)。TELEN的DNA結(jié)合結(jié)構(gòu)域被定制成能夠確認(rèn)在目的基因組序列中GFP蛋白編碼區(qū)域,并用來在此區(qū)域內(nèi)進(jìn)行雙鏈切割。利用TALEN在受體細(xì)胞內(nèi)產(chǎn)生雙鏈斷裂可以極大地提高同源整合的效率,促成產(chǎn)生一個細(xì)胞群體,每一個細(xì)胞含有不同變異。GSMS,HIV反轉(zhuǎn)錄酶,GAD51,和TALEN表達(dá)盒如實(shí)施例1所述。含有GSMS,HIV反轉(zhuǎn)錄酶,和TALEN的表達(dá)盒用電擊方法導(dǎo)入受體細(xì)胞。進(jìn)入細(xì)胞后GSMS表達(dá)盒表達(dá)GSMS RNA,GSMS RNA然后被反轉(zhuǎn)錄為含有隨機(jī)突變的ssGSMScDNA, ssGSMS cDNA與GAD51蛋白結(jié)合形成核蛋白絲并被轉(zhuǎn)運(yùn)至細(xì)胞核。被同時表達(dá)的TALEN酶進(jìn)入細(xì)胞核,在靶向基因組序列造成雙鏈斷裂,GSMS-GAD51核蛋白絲進(jìn)行同源搜索并與目的基因組序列的同源區(qū)域退火,促成含有隨機(jī)突變的GSMS的同源整合。利用熒光細(xì)胞流量儀檢測培養(yǎng)幾天后的細(xì)胞并挑選熒光減弱或無熒光的活細(xì)胞。培養(yǎng)這些細(xì)胞并對GFP編碼區(qū)域進(jìn)行測序,確定造成GFP失效或功能減弱的基因突變的位點(diǎn)。
[0104]本發(fā)明盡管出于闡述明確和方便理解對某些細(xì)節(jié)進(jìn)行了描述,任何在這一領(lǐng)域具有一般技能的人都能認(rèn)同對本發(fā)明在形式和細(xì)節(jié)上的諸多改變?nèi)匀缓w于本發(fā)明。所有有關(guān)的圖,表,附錄,專利,專利申請及出版物均包括在參考文獻(xiàn)中。
【權(quán)利要求】
1.一種在受體細(xì)胞的目的基因組序列引入變異的系統(tǒng),所述系統(tǒng)包括: a)一個基因組DNA誘變序列GSMS表達(dá)盒,其中所述的GSMS表達(dá)盒包括一段和所述目的基因組序列同源的多聚核苷酸序列和一個引物結(jié)合序列,其中所述的GSMS表達(dá)盒產(chǎn)生GSMS RNAs ; b)一個反轉(zhuǎn)錄酶表達(dá)盒,其中所述的反轉(zhuǎn)錄酶表達(dá)盒包括一段編碼反轉(zhuǎn)錄酶的多聚核苷酸序列,所編碼的反轉(zhuǎn)錄酶可以是天然的或工程改造的反轉(zhuǎn)錄酶,并且所述反轉(zhuǎn)錄酶可以是有較好的校對功能或較差的校對功能;以及 所述GSMS表達(dá)盒與反轉(zhuǎn)錄酶表達(dá)盒通過同一表達(dá)載體或不同表達(dá)載體導(dǎo)入到受體細(xì)胞中,在受體細(xì)胞中,所述GSMS RNAs被所述反轉(zhuǎn)錄酶反轉(zhuǎn)錄為ssGSMS cDNAs,并且所述ssGSMS cDNAs在所述目的基因組序列導(dǎo)致變異。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述的GSMS包括一段與所述目的基因組序列完全互補(bǔ)的序列在被引入到受體細(xì)胞中后所述GSMS可與受體細(xì)胞基因組序列配對雜交;或者,除在所述GSMS預(yù)先設(shè)定的位置有一個或幾個核苷酸的區(qū)別外,所述的GSMS包括一段與所述目的基因組序列完全互補(bǔ)的序列,所述的核苷酸的區(qū)別是錯配、刪除、插入或以上所列的組合。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其中,所述GSMS包括一段非同源多聚核苷酸序列,夾在與受體細(xì)胞基因組序列同源的序列間;優(yōu)選的,所述的非同源多聚核苷酸序列編碼一個選擇標(biāo)記基因。
4.根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述的GSMS包括一段與目的基因組序列的同源重組熱點(diǎn)區(qū)域同源的序列,或者,所述的GSMS包括一段與含有正向和反向重復(fù)的目的基因組序列同源的序列。
5.根據(jù)權(quán)利要求1-4中任意一項所述的系統(tǒng),其中所述GSMS的引物結(jié)合序列與天然或人工tRNA序列的3’端互補(bǔ)。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其中GSMSRNA的5’端可以形成二級結(jié)構(gòu),當(dāng)所述反轉(zhuǎn)錄酶遇到所述二級結(jié)構(gòu)時終止反轉(zhuǎn)錄。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),還包括一個引物表達(dá)盒,其中所述的引物表達(dá)盒產(chǎn)生天然的或人工的引物tRNA,引物tRNA與所述GSMS RNAs上的所述引物結(jié)合序列結(jié)合,起始反轉(zhuǎn)錄。
8.根據(jù)權(quán)利要求1_4、6或7所述的系統(tǒng),還包括 ssDNA結(jié)合蛋白表達(dá)盒,其中所述的ssDNA結(jié)合蛋白表達(dá)盒編碼一個ssDNA結(jié)合蛋白; 其中,所述的ssDNA結(jié)合蛋白包括:RecA、RecA的同源蛋白、Rad51、Rad51的同源蛋白、DMCl、DMCl的同源蛋白、ICP8、ICP8的同源蛋白、SSB和SSB的同源蛋白。
9.根據(jù)權(quán)利要求1-4、6-8中任意一項所述的系統(tǒng),還包括 一個靶向核酸內(nèi)切酶表達(dá)盒,所述靶向核酸內(nèi)切酶表達(dá)盒編碼一個靶向核酸內(nèi)切酶,而且所述靶向核酸內(nèi)切酶包括一個DNA序列識別結(jié)構(gòu)域和一個DNA核酸內(nèi)切酶結(jié)構(gòu)域,并且所述靶向核酸內(nèi)切酶和所述GSMS指向所述目的基因組序列的同一同源區(qū)域; 其中,所述的靶向核酸內(nèi)切酶的所述DNA序列識別結(jié)構(gòu)域選自這樣一組蛋白,這組蛋白包括,鋅指蛋白DNA序列識別結(jié)構(gòu)域,轉(zhuǎn)錄激活因子樣效應(yīng)因子DNA序列識別結(jié)構(gòu)域,和大型核酸酶的序列識別結(jié)構(gòu)域。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其中所述靶向核酸內(nèi)切酶的所述DNA核酸內(nèi)切酶結(jié)構(gòu)域能夠切割一段雙鏈多聚核苷酸序列產(chǎn)生雙鏈斷裂,或者,只切割雙鏈DNA中的一條鏈從而在雙鏈DNA上造成一個缺口。
11.根據(jù)權(quán)利要求1-4和6-10中任意一項所述的系統(tǒng),還包括一個siRNA表達(dá)盒,其中所述的siRNA表達(dá)盒產(chǎn)生siRNA引發(fā)所述目的基因組序列的mRNA的降解,并且siRNA與所述GSMS RNAs沒有同源序列。
12.根據(jù)權(quán)利要求6-11中任意一項所述的系統(tǒng),其中,所述系統(tǒng)包括引物表達(dá)盒,ssDNA結(jié)合蛋白表達(dá)盒,革巴向核酸內(nèi)切酶表達(dá)盒和siRNA表達(dá)盒中的至少一種; 其中,所述GSMS表達(dá)盒、反轉(zhuǎn)錄酶表達(dá)盒、引物表達(dá)盒,ssDNA結(jié)合蛋白表達(dá)盒,祀向核酸內(nèi)切酶表達(dá)盒和siRNA表達(dá)盒可以位于不同的表達(dá)載體或者同時在同一載體上,并且反轉(zhuǎn)錄酶編碼序列,ssDNA結(jié)合蛋白編碼序列和靶向核酸內(nèi)切酶編碼序列中至少兩個序列可以同時存在于一個表達(dá)盒中,形成合并表達(dá)盒; 在所述合并表達(dá)盒中,一個單一操縱子被連接到兩個或更多個蛋白編碼序列,其中相鄰蛋白編碼序列被翻譯跳躍序列分隔開;或者,其中一個單一操縱子被連接到兩個或更多個蛋白編碼序列并且繼續(xù)連接到GSMS,其中相鄰蛋白編碼序列被翻譯跳躍序列分隔開,并且GSMS和上游蛋白編碼序列被能編碼一段發(fā)卡型RNA結(jié)構(gòu)的序列分隔開。
13.一個在受體細(xì)胞目的基因組序列引入變異的方法,包括以下步驟: a)構(gòu)建一個GSMS表達(dá)盒,其中所述GSMS含有一段與所述目的基因組序列同源的多聚核苷酸序列和一個引物結(jié)合序列,并且其中所述GSMS表達(dá)盒產(chǎn)生GSMS RNAs ; b)構(gòu)建一個反轉(zhuǎn)錄酶表達(dá)盒,其中所述反轉(zhuǎn)錄酶表達(dá)盒編碼一個反轉(zhuǎn)錄酶;并且 c)將所述GSMS表達(dá)盒和所述反轉(zhuǎn)錄酶表達(dá)盒同時引入受體細(xì)胞,其中所述GSMSRNAs被反轉(zhuǎn)錄酶反轉(zhuǎn)錄為ssGSMS cDNAs,并且所述ssGSMS cDNAs在目的基因組序列導(dǎo)致變異; d)選擇目的基因組序列被改變的受體細(xì)胞。
14.根據(jù)權(quán)利要求13所述的方法,還包括從下列一組表達(dá)盒中選出的一個或多個表達(dá)盒將它們同時引入到受體細(xì)胞中,他們包括引物表達(dá)盒,ssDNA結(jié)合蛋白表達(dá)盒,靶向核酸內(nèi)切酶表達(dá)盒和siRNA表達(dá)盒。
15.獲得在目的基因組序列有隨機(jī)變異的細(xì)胞群的方法,包括以下步驟: a)構(gòu)建一個GSMS表達(dá)盒,其中所述GSMS含有一段與所述目的基因組序列完全同源的多聚核苷酸序列和一個引物結(jié)合序列,并且其中所述GSMS表達(dá)盒產(chǎn)生GSMS RNAs ; b)構(gòu)建一個反轉(zhuǎn)錄酶表達(dá)盒,其中所述反轉(zhuǎn)錄酶表達(dá)盒編碼一個糾錯功能弱的反轉(zhuǎn)錄酶; c)將所述GSMS表達(dá)盒和所述反轉(zhuǎn)錄酶表達(dá)盒同時引入受體細(xì)胞,其中所述GSMSRNAs被糾錯功能弱的反轉(zhuǎn)錄酶反轉(zhuǎn)錄為含有隨機(jī)變異的ssGSMS cDNAs,并且所述ssGSMS cDNAs導(dǎo)致隨機(jī)變異被整合到所述的目的基因組序列;并且 d)選擇在所述目的基因組序列具有隨機(jī)變異的細(xì)胞。
16.根據(jù)權(quán)利要求15所述的方法,還包括從下列一組表達(dá)盒中選出的一個或多個表達(dá)盒將它們同時引入到受體細(xì)胞中,他們包括引物表達(dá)盒,ssDNA結(jié)合蛋白表達(dá)盒,靶向核酸內(nèi)切酶表達(dá)盒和siRNA表達(dá)盒。
【文檔編號】C12N15/63GK104372016SQ201410559802
【公開日】2015年2月25日 申請日期:2014年10月20日 優(yōu)先權(quán)日:2013年10月19日
【發(fā)明者】劉立新 申請人:劉立新