專利名稱::用于基因定點修飾的tale重復(fù)片段的高效合成方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及生物基因工程技術(shù),具體地說涉及應(yīng)用于基因(特別是真核基因)定點修飾的TALE重復(fù)片段的合成方法。
背景技術(shù):
:TALEs(Transcriptionactivatorlikeeffectors)在自然界中,是多種黃單胞菌屬(Xanthomonas)產(chǎn)生的用于激活宿主基因表達(dá)或促進(jìn)自身群落化的第三類分泌蛋白(BochandBonas,2010;Bogdanoveetal.,2010;ScholzeandBoch,2011)0有報道證明TALEs蛋白核酸結(jié)合域的氨基酸序列與其靶位點的核酸序列有較恒定的關(guān)系,TALEs蛋白中含有高度保守、以33-35個氨基酸為單元組成的串聯(lián)重復(fù)序列,每個單元中第12、13位氨基酸負(fù)責(zé)識別和結(jié)合特異的一位核苷酸序列(比如NI識別A,HD識別C,NG識別T,NN識別G以及A,等等)。通過這種關(guān)系,TALEs可以特異性結(jié)合祀點DNA(Bochetal.,2009;MoscouandBogdanove,2009)。TALEs成功解決了鋅指蛋白不能識別任意目標(biāo)基因序列,以及識別序列經(jīng)常受上下游序列影響識別特性的問題,是目前將效應(yīng)蛋白帶到特定核酸序列的最有效方法之一(BogdanoveandVoytas,2011)?;赥ALE的這一特性,已經(jīng)發(fā)展出多種應(yīng)用,用于定點修飾或編輯真核基因表達(dá),包括TALE-nucleasechimeras(TALENs)技術(shù)(用于基因敲除)(Milleretal.,2011)、TALE介導(dǎo)的特定基因的轉(zhuǎn)錄激活(Milleretal.,2011)或者抑制(Congetal.,2012;Gargetal.,2012;Mahfouzetal.,2012)。由于任一定制的TALE通常包含大約十個以上的高度重復(fù)片段(34a.a./段),其表達(dá)載體的合成難度很大。在近期的研究中,已有多個科研機(jī)構(gòu)利用這種氨基酸與核酸序列的對應(yīng)關(guān)系,模塊化組裝TALEs,特異性結(jié)合目的核酸序列(Briggsetal.,2012;Cermaketal.,2011;Gargetal.,2012;Huangetal.,2011;Lietal.,2012;Lietal.,2011;Morbitzeretal.,2011;Reyonetal.,2012;Sanjanaetal.,2012;Weberetal.,2011;Zhangetal.,2011),但依然存在效率低、周期長、操作繁瑣、前體材料種類繁多或花費(fèi)大等各種不同的問題。具體來說,2011年TomasCermak發(fā)表在NucleicAcidsResearch上的文章借助亞克隆手段通過不同載體構(gòu)建粘性末端,根據(jù)TALE的不同重復(fù)單元所處不同位置選擇亞克隆的載體,通過酶切制造唯一位置上特異的粘性末端,這樣就可以實現(xiàn)不同的重復(fù)單元按照一定順序進(jìn)行連接。由于受到連接效率和載體構(gòu)建的限制只能設(shè)計1-10位置的重復(fù)單元,所以合成TALE只能分兩步進(jìn)行。另外,此方法準(zhǔn)備工作非常復(fù)雜,至少需要五天時間(Cermaketal.,2011)oReneGeibler小組在上一方法的基礎(chǔ)上建立了名為“GoldenTALETechnology”的合成方法,將利用亞克隆制造特定位置粘性末端的載體數(shù)量縮減為六個,而優(yōu)化了不同分組之間的克隆載體,從而實現(xiàn)更加高效率更加準(zhǔn)確而又不延長時間的方法(Geissleretal.,2011)。北京大學(xué)張博教授發(fā)表了一個名為“單元合成”的方法,該方法利用SpeI和NheI兩個核酸酶的位點特性設(shè)計了兩兩一組的合成單元,此法準(zhǔn)確性高,但是耗時較長(Huangetal.,2011)。BingYang小組提出了名為“modularassembly”的合成方法,該方法利用密碼子的簡并性通過BsmBI酶切的方法使得每個重復(fù)單元可以獲得八個不同的粘性末端,所以TALE合成就以位置互相區(qū)別的八個組的重復(fù)單元為基礎(chǔ)進(jìn)行,一定程度上提高了效率(Lietal.,2011)。以上方法均有各自不同的優(yōu)缺點,但是同時面臨的一個問題就是難以實現(xiàn)TALE的大批量生產(chǎn)。2012年4月,《自然一生物技術(shù)》刊登了來自美國麻省總醫(yī)院研究人員的最新研究成果,Joung和同事開發(fā)了一種稱為FLASH(fastligationbasedautomatablesolid-phasehigh-throughput)的快速鏈接自動化固相高通量的系統(tǒng),通過在磁珠上裝配編碼TALEN的基因片段,借助外部磁鐵保持位置實現(xiàn)固定化的鏈接,所需要時間大大縮短,有利于合成的自動化。該方法具有前期準(zhǔn)備工作量非常大和前處理比較麻煩等劣勢(Reyonetal.,2012)。
發(fā)明內(nèi)容本發(fā)明目的是提供一種用于基因(特別是真核基因)定點修飾的TALE重復(fù)序列的合成方法,可用于高通量生產(chǎn)。本發(fā)明使用尿喃唳脫氧核糖核苷酸切除法用尿喃唳切除試劑(uracil-specificexcisionreagent:USER)制造DNA片段兩端的粘性末端,通過對用于PCR擴(kuò)增的DNA模板以及引物的設(shè)計,將含單個、二個或三個TALE重復(fù)單位的多個DNA片段按正確順序連接進(jìn)載體,獲得能表達(dá)特異性結(jié)合靶基因的TALE蛋白的重組載體,并利用重組載體在細(xì)胞中完成靶基因敲除、敲入或過表達(dá)、抑制表達(dá)。本發(fā)明中,術(shù)語“TALE重復(fù)序列”除了中間DNA堿基識別區(qū)域(RVDsregionofvariabledi-nucleotides)外,每個TALE重復(fù)序列的氨基酸序列都相同。術(shù)語“TALE重復(fù)片段”用于編碼TALE重復(fù)序列的DNA片段。術(shù)語“DNA模板”,用于合成連接單體的模板,本發(fā)明利用密碼子簡并性的特點,設(shè)計了四種DNA單體模板,分別命名為W,X,Y和Z類型。在RVDs編碼區(qū)域外,這四種序列有較大的差異,但是它們所編碼的氨基酸序列則完全相同。術(shù)語“連接單體”,用于合成TALE重復(fù)序列的單體,所述連接單體利用本發(fā)明設(shè)計的16對引物,PCR擴(kuò)增上述四種DNA單體模板,得到含有尿嘧啶酶切位點的核苷酸序列。術(shù)語“二聯(lián)體”“三聯(lián)體”“多聯(lián)體”,上述兩個連接單體按順序連接形成二聯(lián)體;上述三個單體按順序連接形成三聯(lián)體;上述四個及以上單體按順序連接形成多聯(lián)體。術(shù)語“TALE三重復(fù)單元”、“預(yù)組裝三體”,作為PCR擴(kuò)增的模板,包含三聯(lián)體組合的可能種類,這些TALE三體滿足以下條件在任意一個TALE三體中同樣的DNA序列類型(W,X,Y或Z)不能重復(fù)出現(xiàn)以保證PCR產(chǎn)物的唯一性。本發(fā)明提供用于合成TALE重復(fù)序列的連接單體,所述連接單體為編碼TALE重復(fù)序列的DNA片段,所述DNA片段兩端具有尿嘧啶酶切位點;所述尿嘧啶酶切后,相鄰兩連接單體間具有唯一匹配的粘性末端。所述TALE重復(fù)序列除了中間DNA喊基識別區(qū)域(RVDs:regionofvariabledi-nucleotides)外,每個TALE序列的氨基酸序列都相同,所以按順序串聯(lián)及合成編碼TALE的DNA序列極其困難。本發(fā)明利用密碼子簡并性的特點,設(shè)計了四種DNA序列,分別命名為W,X,Y和Z類型。在RVDs編碼區(qū)域外,這四種序列有較大的差異,但是它們所編碼的氨基酸序列則完全相同(見表I)。所述DNA模板核苷酸序列如SEQIDNO1-16任一所不;WtypemoduleSEQIDNO1-4;XtypemoduleSEQIDNO5-8;YtypemoduleSEQIDNO9-12;ZtypemoduleSEQIDNO13-16。表IW、X、Y和Z四種單體模板的序列表權(quán)利要求1.用于合成TALE重復(fù)序列的連接單體,所述連接單體為編碼TALE重復(fù)序列的DNA片段,所述DNA片段兩端具有尿嘧啶酶切位點。2.根據(jù)權(quán)利要求I所述的連接單體,其特征在于,根據(jù)密碼子簡并性,除RVDs以外,所述連接單體編碼相同的氨基酸序列。3.根據(jù)權(quán)利要求2所述的連接單體,其特征在于,所述連接單體經(jīng)尿嘧啶酶切后,相鄰兩連接單體間具有唯一匹配的粘性末端。4.根據(jù)權(quán)利要求1-3任一項所述的連接單體,其特征在于,其為以下引物的擴(kuò)增產(chǎn)物下游引物任選SEQIDNO17-20、上游引物任選SEQIDN021-24,其中SEQIDNO17和SEQIDNO21引物對除外;所述引物的DNA模板為SEQIDNO1_4任一所示;或下游引物任選SEQIDNO25-28、上游引物任選SEQIDNO.29_3,其中SEQIDNO25和SEQIDNO29引物對除外;所述引物的DNA模板為SEQIDNO5-8任一所示;或下游引物任選SEQIDNO33-36、上游引物任選SEQIDN037-40,其中SEQIDNO33和SEQIDNO37引物對除外;所述引物的DNA模板為SEQIDNO9-12任一所示;或下游引物任選SEQIDNO41-44、上游引物任選SEQIDN045-48,其中SEQIDNO41和SEQIDNO45引物對除外;所述引物的DNA模板為SEQIDNO13-16任一所示。5.由權(quán)利要求1-4任一項所述連接單體組裝的二聯(lián)體、三聯(lián)體或多聯(lián)體。6.含有權(quán)利要求1-4任一項所述連接單體或權(quán)利要求5所述二聯(lián)體、三聯(lián)體或多聯(lián)體的載體。7.利用權(quán)利要求1-4任一項所述連接單體合成TALE重復(fù)片段的方法,其特征在于,包括如下步驟1)PCR擴(kuò)增任意連接單體;2)用尿嘧啶酶切試劑切割任意連接單體,再將切割的任意連接單體通過匹配的粘性末端相連;3)重復(fù)采用步驟2)所述的酶切-連接的操作組裝成含有任意重復(fù)單元、任意排列順序的單體串聯(lián)重復(fù)序列。8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述PCR擴(kuò)增條件為PfuTurboCx或Taq聚合酶,95°C變性30s;60°C退火20s;72°C延伸20s,30個循環(huán)。9.根據(jù)權(quán)利要求7所述的方法,其特征在于,利用生物素-磁珠偶聯(lián)的鏈霉親和素進(jìn)行DNA片段的連接。10.權(quán)利要求1-4任一項所述連接單體、權(quán)利要求5所述三聯(lián)體或權(quán)利要求6所述載體在基因敲除、基因敲入、過表達(dá)或抑制表達(dá)中的應(yīng)用。全文摘要本發(fā)明涉及一種TALE重復(fù)片段的合成方法。本發(fā)明通過對用于PCR擴(kuò)增的DNA模板以及引物的設(shè)計,使用尿嘧啶脫氧核糖核苷酸切除法用尿嘧啶切除試劑(uracil-specificexcisionreagentUSER)制造DNA片段兩端的粘性末端,將含單個、二個或三個TALE重復(fù)單位的多個DNA片段按正確順序連接進(jìn)載體,獲得能表達(dá)特異性結(jié)合靶基因的TALE蛋白的重組載體,并利用重組載體在細(xì)胞中完成靶基因敲除、敲入或過表達(dá)、抑制表達(dá)。本發(fā)明方法省時、簡便、正確率高,能夠?qū)崿F(xiàn)高通量、自動化需求。文檔編號C12R1/64GK102864158SQ20121038020公開日2013年1月9日申請日期2012年9月29日優(yōu)先權(quán)日2012年9月29日發(fā)明者魏文勝,楊君嬌,袁鵬飛申請人:北京大學(xué)