專利名稱:在植物中從蛋白片段重構(gòu)靶蛋白的方法
本申請是國際申請日為2000年5月23日,國際申請?zhí)枮镻CT/US00/14122,名稱為“產(chǎn)生能夠表達(dá)活性蛋白產(chǎn)物的斷裂、不可傳遞的基因的方法”的中國專利申請No.00807542.5的分案申請。
背景技術(shù):
過去的幾年中,由于轉(zhuǎn)基因農(nóng)作物的出現(xiàn)使美國的農(nóng)業(yè)發(fā)生了一場革命,這些轉(zhuǎn)基因作物能抵抗特定的疾病、昆蟲及除草劑,或者其營養(yǎng)價(jià)值得到改善。與此同時(shí),人們又更多地?fù)?dān)心這些基因修飾的農(nóng)產(chǎn)品對(duì)其消費(fèi)者產(chǎn)生損害,并且這些轉(zhuǎn)基因可能被轉(zhuǎn)移到相關(guān)的植物品系中,甚至形成對(duì)昆蟲或除草劑抵抗的“超級(jí)種子”(Ferber,D.科學(xué)Science2861662(1999))或被其他微生物消耗后造成損害(Losey等,自然Nature399214(1999))。但是目前幾乎沒有對(duì)擔(dān)心“轉(zhuǎn)基因”食物有害的科學(xué)依據(jù),轉(zhuǎn)基因被轉(zhuǎn)移到其它植物并且對(duì)生態(tài)產(chǎn)生負(fù)面效應(yīng)的可能性并非完全沒有根據(jù)(Bergelson等,自然Nature39525(1998))。這種轉(zhuǎn)移可通過密切相關(guān)的種屬傳粉,或者通過病毒或質(zhì)粒載體將基因片段轉(zhuǎn)入不相關(guān)的植物,這些病毒或質(zhì)粒載體的轉(zhuǎn)移可通過植物相關(guān)真菌、細(xì)菌或昆蟲介導(dǎo)。
已經(jīng)討論過預(yù)防轉(zhuǎn)基因傳播的幾種技術(shù),然而這些方法要么象一連串構(gòu)建物一樣,被設(shè)計(jì)成對(duì)新的雜交植物有負(fù)面影響(Gressel,TrendsBiotechnol.,17361-366(1999)),要么不能排除通過水平基因轉(zhuǎn)移進(jìn)行傳播的可能性(Bertolla和Simonet,Res.Microbiol.,150375-384(1999))。
在本發(fā)明中,我們介紹一種新型的轉(zhuǎn)基因方法,能夠高效表達(dá)蛋白質(zhì)而不需要基因復(fù)制過程并且極少有機(jī)會(huì)通過水平基因轉(zhuǎn)移進(jìn)行傳播。
發(fā)明概要本發(fā)明公開了一種能夠在靶宿主,如一種植物,內(nèi)高效表達(dá)蛋白質(zhì)的新型轉(zhuǎn)基因系統(tǒng),同時(shí)又能避免通過花粉將這種轉(zhuǎn)基因帶入相關(guān)的宿主系統(tǒng)和/或環(huán)境。這里描述的方法同樣適用于真核細(xì)胞生物(酵母、昆蟲、哺乳動(dòng)物細(xì)胞等)和原核微生物(如大腸桿菌等)內(nèi)任何目的蛋白(如一種毒性蛋白)的表達(dá)。
在每一種情況下,目標(biāo)基因至少被分裂成兩個(gè)片段,每一片段都能與intein編碼序列的一部分融合。每一融合基因以無活性蛋白形式表達(dá),并且這些獨(dú)立表達(dá)的融合蛋白被重新拼裝成一個(gè)活性形式。這些基因片段的區(qū)室化使得目標(biāo)蛋白在所希望的部位重新組合,能防止將功能基因轉(zhuǎn)移至其他微生物。
需要指出的是,盡管本發(fā)明主要針對(duì)農(nóng)業(yè)和植物生物技術(shù)的實(shí)施例,但該方法應(yīng)用范圍十分廣闊,可用于任何微生物中任何基因表達(dá),防止基因意外地轉(zhuǎn)移到其它微生物中去。
附圖詳細(xì)說明
圖1A-蛋白剪接機(jī)理。蛋白剪接是翻譯后過程,該過程涉及從具有側(cè)向N末端和C末端區(qū)域(exteins)連接的蛋白前體切割內(nèi)部蛋白片段,即intein。序列排列顯示在兩個(gè)剪接結(jié)合點(diǎn)處存在高度保守的殘基intein N末端有一個(gè)半胱氨酸或絲氨酸殘基,intein的C末端有His-Asn,extein的C末端處有Cys,Ser或Thr作為第一殘基。這些保守的剪接連接殘基直接參與催化肽鍵斷裂和蛋白剪接反應(yīng)的連接作用。N末端有半胱氨酸殘基和與之C末端相連的intein剪接的化學(xué)機(jī)理如圖1所示步驟1-在intein的N末端對(duì)cys1的N-S acyl重排,形成一個(gè)線性硫酯中間產(chǎn)物;步驟2-在步驟1形成的硫酯上intein C末端形成后,迅速用Cys攻擊進(jìn)行酯化,形成分支狀的中間產(chǎn)物;步驟3-在intein C末端Asn殘基上通過肽鍵斷裂同時(shí)伴有琥珀酰亞胺的形成來切除intein;步驟4-短暫形成的連接物自動(dòng)進(jìn)行s-N Acyl重排,從硫酯變成穩(wěn)定的氨基鍵。其他intein的剪接過程除圖1所示的Cys殘基可能被Ser或Thr替代外,都類似于上述4個(gè)化學(xué)步驟。因此,步驟1到4分別為N-O和O-N?;霓D(zhuǎn)換。
圖1B-蛋白剪接的卡通畫圖2-反式剪接。
圖2A-intein片段的N末端和C末端與兩個(gè)為融合N-extein和C-extein序列的剪接結(jié)合的相互關(guān)系。推測這種剪接反應(yīng)是通過如以前介紹的同樣的順式剪接通路來完成的。
圖2B-可選擇的是,在無剪接時(shí),intein能通過隨后酶活性的產(chǎn)生而促進(jìn)兩個(gè)extein序列的連接。這被稱之謂intein介導(dǎo)的互補(bǔ)作用。
圖3-Ssp DnaE intein基因在集胞藻屬PCC6803中的排列。藍(lán)-綠海藻集胞藻屬PCC6803基因組包含斷裂的dnaE基因,該基因在745kb位點(diǎn)有多個(gè)片段存在。天然的反式剪接的intein與兩個(gè)基因產(chǎn)物片段融合形成一個(gè)活性聚合酶。
圖4A-斷裂靶基因。用融合在C末端和N末端區(qū)域的部分intein基因能將靶基因分裂成兩個(gè)片段。這些斷裂基因可被置入植物染色體內(nèi)以便下述表達(dá)重新進(jìn)行。
圖4B-轉(zhuǎn)基因的內(nèi)容。將目的基因,此處是指一種除草劑抗性基因,分裂成兩個(gè)片段(靶N和靶C),并將一種intein(INn和INc)融合到每個(gè)片段基因內(nèi)。兩個(gè)融合基因單獨(dú)放置在基因組的遠(yuǎn)端位置上。一個(gè)基因可能在葉綠體內(nèi),而另一個(gè)基因可能在核基因組內(nèi)。葉綠體內(nèi)的轉(zhuǎn)基因在葉綠體內(nèi)發(fā)生轉(zhuǎn)錄和翻譯,而核內(nèi)的轉(zhuǎn)基因在細(xì)胞核內(nèi)轉(zhuǎn)錄,在細(xì)胞漿內(nèi)翻譯。核基因翻譯完畢后在葉綠體轉(zhuǎn)運(yùn)肽的協(xié)助下被轉(zhuǎn)運(yùn)進(jìn)入葉綠體,在葉綠體內(nèi)它可利用intein作為連接或剪接成分與其他基因片段相互聯(lián)系。
圖5-大腸桿菌菌株ER2744內(nèi)乙酰乳酸合酶(ALS)的反式剪接。靶基因被intein片段(INn和INc)分裂,表達(dá)成兩種無活性的蛋白質(zhì)。在宿主細(xì)胞內(nèi)蛋白的反式剪接能產(chǎn)生一種活性靶蛋白。
圖6-乙酰乳酸合酶(ALS)基因的排序(SEQ ID NO42,SEQ ID NO43,SEQ IDNO44,SEQ ID NO45,SEQ ID NO46)。大腸桿菌乙酰乳酸合酶II(ALSII)的空白區(qū)域用下劃線表示。箭頭表示大腸桿菌乙酰乳酸合酶II的斷裂位點(diǎn)。星狀標(biāo)志代表玉米ALS的斷裂位點(diǎn)。
圖7-平皿實(shí)驗(yàn)顯示ALSIIm-14使大腸桿菌ER2744對(duì)纈氨酸和除草劑產(chǎn)生抵抗,SM.大腸桿菌ER2744細(xì)胞用表達(dá)ALSII蛋白(1)、ALSIIm(2)、ALSIIm-14(3)的質(zhì)粒DNA進(jìn)行轉(zhuǎn)化,并置于在含0.3mMIPTG,100ug/ml纈氨酸(a),或100ug/ml纈氨酸和50ug/ml SM(b)M9培養(yǎng)基的平皿中。平皿實(shí)驗(yàn)在30℃條件下進(jìn)行50小時(shí)。
圖8-通過SSp DnaE intein介導(dǎo)的反式剪接產(chǎn)生重組ALSIIm-14。用表達(dá)質(zhì)粒轉(zhuǎn)化而來的細(xì)胞作為對(duì)照(泳道1),ALSII(泳道2),ALSIIm(N)-INn(泳道3),ALSIIm(C)-INc(泳道4),ALSIIm(N)-INn和ALSIIm(C)-INc(泳道5),2ul細(xì)胞提取物在12%的SDS-聚丙烯酰胺凝膠上電泳,然后轉(zhuǎn)移到一張S&S硝基纖維素膜上,用抗ALSII N末端(圖8A)或ALSIIC末端(圖8B)抗體探查。(圖8C)反式剪接的效率是溫度敏感性的,用抗ALSIIm N末端抗血清進(jìn)行Western雜交。從表達(dá)質(zhì)粒轉(zhuǎn)化的細(xì)胞中制造蛋白提取物,成為含有與以下抗血清反應(yīng)的非特異蛋白的大腸桿菌提取物對(duì)照(泳道1),ALSII(泳道2),ALSIIm(N)-INn和ALSIIm(C)-INc(泳道3-6),這些。細(xì)胞培養(yǎng)溫度為泳道1至泳道3為37℃,泳道4為30℃,泳道5為25℃,泳道6為15℃。
圖9-乙酰乳酸合酶(ALSII)活性的測定圖9A-ALSIIm(N)-INn和ALSIIm(C)-INc共同表達(dá)能保證細(xì)胞在加有纈氨酸和除草劑的培養(yǎng)基中生長。通過ALSII(1),ALSII(2),ALSIIm(N)-INn和ALSIIm(C)-INc(3),ALSIIm(N)-INn(4),ALSIIm(C)-INc(5),ALSIIm(N)和ALSIIm(C)(6)的表達(dá)質(zhì)粒轉(zhuǎn)化的大腸桿菌ER2744在37℃條件下(a),37℃條件下添加100ug/ml纈氨酸(b),30℃條件下100ug/ml的纈氨酸(C),和37℃條件下添加100ug/ml的纈氨酸和50ug/ml的甲基sulfometuron(SM)(d)置于M9培養(yǎng)基中。培養(yǎng)基內(nèi)含有0.3mM IPTG。
圖9B-ALSIIm(N)-INn和ALSIIm(C)-INc共同表達(dá)能保證細(xì)胞在加有纈氨酸和除草劑的培養(yǎng)基中生長。為融合蛋白(圖下所示)用表達(dá)質(zhì)粒轉(zhuǎn)化的大腸桿菌ER2744在含有0.3mM IPTG的M9培養(yǎng)基中培養(yǎng),如指示培養(yǎng)基內(nèi)可有或無100ug/ml的纈氨酸和50ug/ml的甲基sulfometuron(SM)。細(xì)胞在30℃條件下培養(yǎng)40小時(shí)后以O(shè)D600確定細(xì)胞生長率。
圖9C-表達(dá)ALSIIm(N)-INn和ALSIIm(C)-INc細(xì)胞生長率的時(shí)間過程研究。用指定蛋白表達(dá)質(zhì)粒轉(zhuǎn)化的大腸桿菌ER2744,在30℃,含有0.3mM IPTG和100ug/ml纈氨酸的M9培養(yǎng)基中培養(yǎng)。細(xì)胞密度用OD600在指定的幾個(gè)時(shí)間點(diǎn)上測量確定。
圖10-Western斑點(diǎn)雜交檢測反式剪接產(chǎn)物,玉米ALS-14。2ul表達(dá)質(zhì)粒轉(zhuǎn)化的大腸桿菌ER2744細(xì)胞的碎解物,作為對(duì)照(泳道1)(請注意抗體與大腸桿菌內(nèi)非特異性蛋白的反應(yīng)),cALS(泳道2),cALS(N)-INn(泳道3),cALS(C)INc(泳道4),cALS(N)-INn和cALS(C)-INc(泳道5),在12%SDS聚丙烯酰胺凝膠上電泳,然后轉(zhuǎn)移到一張S&S硝基纖維素膜上,用抗cALS N末端(A)或cALS C末端(B)的抗血清進(jìn)行探測,cALS代表玉米ALS蛋白。
圖11-平皿實(shí)驗(yàn)測定Ssp DnaE intein順式剪接的構(gòu)建物。編碼5’-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)蛋白并有完整長度的Ssp DnaEintein的質(zhì)粒pCE182DnaE,pCE215DnaE,pCE235DnaE DnaE,pCE267DnaE分別在氨基酸位點(diǎn)182,215,235和267處插入。并將它們轉(zhuǎn)化到ER2799大腸桿菌細(xì)胞內(nèi)(為在限制性M9培養(yǎng)基中生存,需要EPSPS蛋白),接種于M9限制性平皿中。37℃孵育過夜后,將每一平皿中的單個(gè)克隆挑出并將其種植在一個(gè)單獨(dú)的限制性M9培養(yǎng)基中。然后主要培養(yǎng)平皿在37℃孵育過夜或RT 2-3天。pCYB3質(zhì)粒作為對(duì)照,因?yàn)樗粩y帶EPSPS基因,在選擇的平皿中不能生長。PC+E2是一個(gè)含有全長野生型EPSPS(具有一個(gè)Pro101Ser突變),在M9選擇性平皿中生長并傳遞鎮(zhèn)草寧抗性的質(zhì)粒。
圖12-平皿實(shí)驗(yàn)測定在215和235位點(diǎn)的Ssp DnaE intein反式剪接構(gòu)建物。
每一5’-enolpyruvyl-3-phosphoshikimate合成酶(EPSPS)反式剪接構(gòu)建物的活性通過將匹配的構(gòu)建物共同轉(zhuǎn)化到大腸桿菌ER2799細(xì)胞中并將其接種于在一個(gè)選擇性M9培養(yǎng)平皿的方法進(jìn)行測定。pCYB3或pKYB1(New England Biolabs,Inc.,Beverly,MA)都無EPSPS基因,可用于測定EPSPS基因每一半活性時(shí)提供氨芐青霉素或卡那霉素抗性。
所用質(zhì)粒分別為pC+E2,含有完整長度的EPSPS突變基因;p215EN2,含有與Ssp DnaE intein N末端剪接區(qū)域融合的EPSPS基因第一個(gè)215氨基酸;p235EN2,含有與Ssp DnaE intein N末端剪接區(qū)域融合的EPSPS第一個(gè)235氨基酸;pEPS#28,含有與Ssp DnaE intein C末端剪接區(qū)域融合的EPSPS基因的216-427氨基酸;pEPS#29,含有與Ssp DnaE intein C末端剪接區(qū)域融合的EPSPS基因的236-427氨基酸;pEPS#33,含有與Ssp DnaE intein N末端剪接缺陷區(qū)域融合的EPSPS基因第一個(gè)235氨基酸;pEPS#37,含有與Ssp DnaE intein C末端剪接缺陷區(qū)域融合的EPSPS基因的236-427氨基酸;pEPS#34,具有EPSPS的第一個(gè)235氨基酸,但無intein片段;pEPS#36,具有EPSPS的236-427氨基酸,但無intein片段。這些質(zhì)粒以不同的組合方式共同轉(zhuǎn)化到大腸桿菌ER2799細(xì)胞中,并接種在LB平皿和M9平皿中,每一平皿中都補(bǔ)充100ug/ml的氨芐青霉素和50ug/ml的卡那霉素以及0.3mM IPTG。37℃孵育過夜或RT 2-3天后,將每一LB平皿中的單個(gè)克隆挑出并將其接種在M9選擇培養(yǎng)平皿中。M9限制性培養(yǎng)基選擇平皿含有100ug/ml的氨芐青霉素和50ug/ml的卡那霉素以及0.3mM IPTG。使用的質(zhì)粒組合有WT,pC+E2和pKYB;215NC,p215EN2和pEPS#28;215C,pEPS#28和pCYB3;235NC-Dead,pEPS#33和pEPS#37;235NC,p235EN2和pEPS#29,235N,p235EN2和pKYB1,235C,pEPS#29和pCYB3;235N-215C,p235EN2和pEPS#28和235互補(bǔ)體,pEPS#34和pEPS#36。
圖13-235反式剪接構(gòu)建物的草甘膦抗性液相實(shí)驗(yàn)。質(zhì)粒構(gòu)建物如圖12所述。組合方式為WT,pC+E2和pKYB,235NC-Dead,pEPS#33和pEPS#37,235NC,p235EN2和pEPS#29,215N,p235EN2和pKYB1;235C,pEPS#29和pCYB3;235互補(bǔ)體,pEPS#34和pEPS#36。這些質(zhì)粒被共同轉(zhuǎn)化到大腸桿菌ER2799細(xì)胞中并接種于LB平皿中,加入100ug/ml的氨芐青霉素和50ug/ml的卡那霉素;pCYB3/pKYB共同轉(zhuǎn)化到大腸桿菌ER2744中并接種于LB平皿中,添加物如前所述。每次轉(zhuǎn)化前將新鮮的集落接種于含100ug/ml的氨芐青霉素和50ug/ml的卡那霉素的LB培養(yǎng)基中,30℃過夜制備預(yù)培養(yǎng)物。等量的預(yù)培養(yǎng)物(根據(jù)細(xì)胞密度一般為10-11ul)接種于新鮮制備的含有100ug/ml的氨芐青霉素和50ug/ml的卡那霉素以及0.3mMIPTG,含有或無草甘膦的M9限制性培養(yǎng)基中。在OD值600nm時(shí)測定每一構(gòu)建物的生長。圖13A,在37℃條件下生長。圖13B,在30℃條件下生長。
圖14-順式剪接235構(gòu)建物在M9液體限制性培養(yǎng)基的生長。完整長度SspDnaE intein插入5’-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)的235位點(diǎn)后構(gòu)建一個(gè)質(zhì)粒。構(gòu)建兩個(gè)質(zhì)粒載體(pCE235 DnaE和pEPS#31),一個(gè)質(zhì)粒載體帶有一個(gè)剪接的感受態(tài)Ssp DnaE intein(235cis),而另一個(gè)具有剪接的非感受態(tài)intein(235dead)。這些質(zhì)粒與pKEB12一起被共同轉(zhuǎn)化到大腸桿菌ER2799細(xì)胞中并接種于LB平皿中,加入100ug/ml的氨芐青霉素和50ug/ml的卡那霉素。每次轉(zhuǎn)化前將新鮮的集落置于LB培養(yǎng)基中在30℃過夜。等量的預(yù)培養(yǎng)物(根據(jù)細(xì)胞密度一般為10-11ul)接種在新鮮制備的含有100ug/ml氨芐青霉素和50ug/ml的卡那霉素以及0.3mM IPTG的M9限制性培養(yǎng)基中。細(xì)胞密度在不同時(shí)間點(diǎn)在OD值600nm測定。
圖15是一個(gè)顯示5-烯醇丙酮基-3-磷酸莽草酸合酶(5-enolpyruvyl-3-phosphoshikimate(EPSPS))蛋白中能夠插入一個(gè)5氨基酸而仍能保證蛋白活性的位點(diǎn)的圖。
圖16是一個(gè)顯示5-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)蛋白中能夠插入一個(gè)5氨基酸而使蛋白活性消失的位點(diǎn)的圖。
圖17是一個(gè)pIH976的基因圖譜。環(huán)狀雙鏈DNA具有一個(gè)多克隆位點(diǎn)。標(biāo)明了限制酶位點(diǎn)。帶有括號(hào)的限制位點(diǎn)不是唯一的。Ptac代表tac啟動(dòng)子。復(fù)制的起點(diǎn)是ori。這個(gè)質(zhì)粒具有四環(huán)素藥物抗性標(biāo)志物(Tetr)。
圖18是一個(gè)pAGR3的基因圖譜。環(huán)狀雙鏈DNA(SEQ ID NO76)具有一個(gè)多克隆位點(diǎn)。下面顯示限制酶位點(diǎn)。Ptac代表tac啟動(dòng)子。復(fù)制的起點(diǎn)是ori。這個(gè)質(zhì)粒具有氨芐青霉素藥物抗性標(biāo)志(ampr)。標(biāo)明了Lac操縱子和核糖體的結(jié)合位點(diǎn)。質(zhì)粒pAGR3是一個(gè)帶有下述幾種元件的表達(dá)載體;(1)一個(gè)合成tac啟動(dòng)子連接一個(gè)對(duì)稱的合成Lac操縱子序列;(2)一個(gè)Lac核糖體結(jié)合位點(diǎn);(3)一個(gè)在NcoI位點(diǎn)內(nèi)部帶有ATG的克隆聚合連接子,NcoI位點(diǎn)在核糖體結(jié)合點(diǎn)下游大約7個(gè)核苷酸處;(4)LacIq基因的一個(gè)拷貝,對(duì)tac啟動(dòng)子起抑制作用;(5)自pBR322起源的復(fù)制;(6)氨芐青霉素抗性基因;和(7)tac啟動(dòng)子核糖體轉(zhuǎn)錄終止子上游的四倍拷貝。轉(zhuǎn)錄終止子通過降低上游啟動(dòng)子的閱讀-通過轉(zhuǎn)錄過程來減少轉(zhuǎn)錄的基礎(chǔ)水平。
圖19用Ssp DnaE intein作為剪接元件,在大腸桿菌內(nèi)將兩個(gè)不相關(guān)的基因產(chǎn)物進(jìn)行反式剪接。
圖19A,質(zhì)粒pIHaadE-N代表aadA基因(黑體處)融合到Ssp DnaE intein(INn呈灰色)N末端剪接區(qū)域。質(zhì)粒pAGRE-CsmGFP代表Ssp DnaE intein的C末端剪接區(qū)域(INc呈灰色)和smGFP(呈黑色)。每一參與者的計(jì)算分子量在下方用kDa表示。箭頭表示反式剪接事件產(chǎn)生一個(gè)aadA-smGFP(57kDa)融合蛋白。
圖19B,在大腸桿菌細(xì)胞內(nèi)用氨芐青霉素和硫酸壯觀霉素選擇pIHaadE-N和AGRE-CsmGFP質(zhì)粒。大腸桿菌被用右邊所示的質(zhì)粒轉(zhuǎn)化,集落數(shù)在上方顯示。
圖19C,通過反式剪接表達(dá)和檢測aadA-smGFP雜合體蛋白。用單克隆smGFP特異性抗體通過western斑點(diǎn)分析表達(dá)構(gòu)建物的大腸桿菌細(xì)胞提取物(在圖上標(biāo)明)。生物素化的MW標(biāo)志物(76,57,46,37,28和20)的相對(duì)位置以kDa表示。與aadA-smGFP雜合體和INc-smGFP相對(duì)應(yīng)的蛋白帶也被標(biāo)明。
圖20,是一個(gè)pNCT114/224的基因圖譜。具有一個(gè)多克隆位點(diǎn)的環(huán)狀雙鏈DNA能夠定位基因,預(yù)先確定部位。指出了限制酶位點(diǎn)。PpsbA和TpsbA分別代表光合成多肽D1基因啟動(dòng)子和終止子。復(fù)制的起點(diǎn)是ori。這個(gè)質(zhì)粒具有氨芐青霉素藥物抗性標(biāo)志(ampr)。同源重組序列如左邊所示(pNCT114與orf228,pNCT224與16SrDNA-trnaV)和右邊所示(pNCT114與orf1244,pNCT224與rps7/12)。CS代表克隆位點(diǎn)。
圖21植物啟動(dòng)子PpsbA在大腸桿菌內(nèi)活性和aadA及smGFP的反式剪接。
圖21A質(zhì)粒p115ag/p225ag代表aadA基因(黑體表示)融合到Ssp DanE inteinN末端區(qū)域(INn灰色表示)和Ssp DanE intein C末端區(qū)域(INn灰色表示)融合到smGFP(用黑色表示)。兩個(gè)雜合基因在相反的方向轉(zhuǎn)錄。兩者的計(jì)算分子量在下面用KDa表示。箭頭表示反式剪接發(fā)生后形成一個(gè)融合aadA-smGFP(57Kda)蛋白。
圖21B在大腸桿菌細(xì)胞內(nèi)用氨芐青霉素和硫酸壯觀霉素選擇p115ag和p225ag質(zhì)粒。大腸桿菌被右邊所示的質(zhì)粒轉(zhuǎn)化,集落數(shù)在上方顯示。質(zhì)粒后的阿拉伯?dāng)?shù)字是獨(dú)立的數(shù)字,加號(hào)(+)表示質(zhì)粒在指定抗生素中的生長。
圖21C通過反式剪接表達(dá)和檢測雜交aadA-smGFP蛋白。用單克隆抗smGFP特異性抗體通過Western斑點(diǎn)分析表達(dá)上圖所示構(gòu)建物的大腸桿菌細(xì)胞提取物。生物素化MW標(biāo)志物的相關(guān)位置在左邊用Kda表示。與aad-smGFP雜合體和Inc-smGFP相關(guān)的蛋白帶也被標(biāo)明。
圖22植物細(xì)胞漿內(nèi)順式剪接。5-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)和乙酰乳酸合成酶(ALS)基因被插入到雙重載體pBI121中。EPSPS或ALS的氨基和羧基末端片段用黑體表示。Ssp DnaE intein基因用EPSPS/ALS片段在兩邊相連接。Agrobacterium的右邊和左邊表示為LB和RB。CaMV35S啟動(dòng)子、NOS啟動(dòng)子(pNOS)和NOS終止子(TNOS)被標(biāo)明。
圖23核轉(zhuǎn)移載體pBITPEC或pBITPECsmGFP。這種雙重載體具有驅(qū)動(dòng)核酮糖二磷酸羥化酶3A轉(zhuǎn)運(yùn)肽(TP)的CaMV35S啟動(dòng)子,該啟動(dòng)子被融合到Ssp DnaEintein C末端剪接區(qū)域(INc)。在INc之后標(biāo)明為細(xì)胞器轉(zhuǎn)運(yùn)而被克隆的基因。在pBITPECsmGFP存在時(shí)將smGFP基因克隆到多克隆位點(diǎn)。
圖24為PsbA啟動(dòng)子(PpsbA)序列(SEQ ID NO59)。
圖25為PsbA終止子(TpsbA)(SEQ ID NO60)。
圖26為核酮糖二磷酸羥化酶3轉(zhuǎn)運(yùn)肽(SEQ ID NO61)。下方的核苷代表密碼子優(yōu)化后的單位。
圖27葉綠體基因目標(biāo)載體(pNCT114)(SEQ ID NO62)。pNCT114的特征包括(1)載體主要部分pLITMUS28;(2)在BssHII到BsiWI左側(cè)邊界插入葉綠體基因組目標(biāo)片段(orf228-ssb,1210bp);(3)在AvrII到KpnI右邊界插入葉綠體基因組目標(biāo)片段(orf1244,1550bp);和(4)在BsiWI和pstI之間加入PpsbA和TpsbA,而其他配對(duì)是在AvrII和NcoI位點(diǎn)。
圖28葉綠體基因目標(biāo)載體(pNCT224)(SEQ ID NO63)。pNCT114的特征包括((1)載體主要部分pLITMUS28;(2)在BssHII到BsiWI左邊界插入葉綠體基因組目標(biāo)片段(165SrDNA-trnaV,1680bp);(3)在AvrII到KpnI右邊界插入葉綠體基因組目標(biāo)片段(rps7/12,1310bp);和(4)在BsiWI和pstI之間加入PpsbA和TpsbA,而其他配對(duì)是在AvrII和NcoI位點(diǎn)。
發(fā)明的詳述蛋白的剪接是將插入序列從多肽上切割下來,并同時(shí)連接側(cè)向序列形成一種新的多肽的過程(Chong等,生物化學(xué)雜志J Biol Chem.,27122159-22168(1996)),如圖1A和1B所示。闡明蛋白剪接的機(jī)制可產(chǎn)生數(shù)種以intein為基礎(chǔ)的應(yīng)用(Comb等,美國專利第5,496,714;Comb等,美國專利第5,834,247;Camarero和muir,J.Amer.Chem.Soc.,1215597-5598(1999);Chong等,Gene,192271-281(1997),Chong等,核酸研究Nucleic Acids Res.,265109-5115(1998);Chong等,生物化學(xué)雜志J.Biol.Chem.,27310567-10577(1998);Cotton等,美國化學(xué)學(xué)會(huì)雜志J.Am.Chem.Soc.,1211100-1101(1999);Evans等,生物化學(xué)雜志J.Biol.Chem.,27418359-18363(1999);Evans等,生物化學(xué)雜志J.Biol.Chem.,2743923-3926(1999);Evans等,蛋白質(zhì)科學(xué)Protein Sci.,72256-2264(1998);Evans等,生物化學(xué)雜志J.Bioi.Chem.,2759091-9094(2000);Iwai和Pluckthun,F(xiàn)EBS Lett.459166-172(1999);Mathys等,基因Gene,2311-13(1999);Mills等,Proc.Natl.Acad.Sci.USA 953543-3548(1998);Muir等,Proc.Natl.Acad.Sci.USA 956705-6710(1998);Otomo等,生物化學(xué)Biochemistry3816040-16044(1999);Otomo等,J.Biolmo.NMR 14105-114(1999);Scott等,Proc.Natl.Acad.Sci USA 9613638-13643(1999);Severinov和Muir,生物化學(xué)雜志J.Biol.Chem.,27316205-16209(1998);Shingledecker等,基因Gene,207187-195(1998);Southworth等,EMBO J.17918-926(1998);Southworth等,生物技術(shù)Biotechnique,27110-120(1999);Wood等,國家生物技術(shù)Natl.Biotechnol.,17889-892(1999);Wu等,Proc.Natl.Acad.Sci.USA 959226-9231(1998a);Wu等,Biochim Biophys Acta 1387422-432(1998b);Xu等,Proc..Natl.Acad.Sci USA96388-393(1999);Yamazaki等,美國化學(xué)協(xié)會(huì)雜志J.Am.Chem.Soc.,1205591-5592(1998))。
最近體內(nèi)和體外都有對(duì)蛋白反式剪接的描述(Shingledecker等,基因Gene207187(1998),Southworth等,EMBO J.17918(1998);Mills等,Proc.Natl.Acad.Sci.USA,953543-3548(1998);Lew等,生物化學(xué)雜志J.Biol.Chem.,27315887-15890(1998);Wu等,Biochim.Biophys.Acta 1387422-432(1998b),Yamazaki等,美國化學(xué)協(xié)會(huì)雜志J.Am.Chem.Soc.1205591(1998),Evans等,生物化學(xué)雜志J.Biol.Chem.2759091(2000);Otomo等,生物化學(xué)Biochemistry3816040-16044(1999);Otomo等,J.Biomol.NMR 14105-114(1999);Scott等,Proc.Natl.Acad.Sci.USA 9613638-13643(1999)),提供了將一種蛋白表達(dá)成兩個(gè)無活性片段,之后這兩個(gè)片段連接形成一個(gè)功能產(chǎn)物的機(jī)會(huì)(圖2)。
反式蛋白剪接在集胞藻屬PCC6803中也能自然發(fā)生(Wu,H.等,Proc.Natl.Acad.Sci.959226(1998)),它是將DnaE蛋白的兩個(gè)片段連接形成具有功能的DNA多聚酶III所必須的,而DnaE蛋白是由被750Kb染色體DNA分割的兩個(gè)基因所編碼(圖3)這些發(fā)現(xiàn)使本項(xiàng)目的發(fā)明者進(jìn)一步探索是否能通過將感興趣基因分裂為兩個(gè)片段并且將intein片段融合到每個(gè)目標(biāo)基因片段中來形成一個(gè)功能基因產(chǎn)物。通過反式剪接后表達(dá)的兩個(gè)蛋白片段、intein介導(dǎo)的互補(bǔ)作用或蛋白互補(bǔ)作用能夠產(chǎn)生一種活性形式的靶蛋白(圖4)。在此處靶基因片段可位于宿主基因組的任何位置,包括廣泛分布在細(xì)胞核內(nèi)、葉綠體內(nèi)、線粒體內(nèi)、質(zhì)粒內(nèi)、細(xì)菌人工染色體內(nèi)、酵母人工染色體內(nèi)或上述任何部位的組合。此外,將基因片段安放在不同的細(xì)胞器官或質(zhì)粒內(nèi),如一半在細(xì)胞核內(nèi)而另一半在植物的葉綠體或線粒體內(nèi),重構(gòu)具有完整活性的目標(biāo)蛋白需要兩個(gè)部分基因的傳遞,例如,通過受粉向遠(yuǎn)屬轉(zhuǎn)運(yùn)或通過細(xì)菌、真菌或病毒載體進(jìn)行水平基因轉(zhuǎn)移的現(xiàn)象都將被從根本上消除。這樣將極大的減少和有可能消除轉(zhuǎn)基因向其相關(guān)的環(huán)境外傳播的危險(xiǎn)。
分裂靶基因并用一個(gè)蛋白剪接元件重建活性的兩個(gè)實(shí)施例描述如下。被研究的兩個(gè)基因分別是來自大腸桿菌的乙酰乳酸合成酶(ALS)基因的突變體和來自鼠傷寒沙門氏菌的5-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)基因,它們分別傳遞磺脲和草甘膦除草劑抗性。兩種酶都參與蛋白構(gòu)件的生物合成過程。ALS是支鏈氨基酸生物合成時(shí)的第一個(gè)普通酶(LaRossa和Schloss,生物化學(xué)雜志J.Biol.Chem.,2598753-8757(1984);Chaleff和Ray,科學(xué)Science,2231148-1151(1984);Falco和Dumas,遺傳學(xué)Genetics,10921-35(1985)),而EPSPS是合成芳香族氨基酸所必需的(Stalker等,生物化學(xué)雜志J.Biol.Chem.2604724-4728(1985))。用化合物抑制這兩種酶可導(dǎo)致微生物的死亡。
常用的磺脲除草劑(SU),如甲基sulfometuron(SM)(Short和Colburn,Toxicol Ind.Health,15240-275(1999))通過抑制乙酰乳酸合成酶(ALS)(EC 4.1.3.18)阻止細(xì)菌、酵母和高等植物的生長。為了制造除草劑抗性的植物,需努力分辨ALS基因突變體,這種基因能使植物在存在SM時(shí)也能生長。首先報(bào)道的是能夠使細(xì)菌、酵母對(duì)SM發(fā)生抵抗的突變基因(Hill等,生物化學(xué)雜志Biochem.J.,335653-661(1998))。隨后,在工自然產(chǎn)生的抗性作物、玉米、牛旁和煙草中(Lee等,EMBO J.71241-1248(1988);Bernasconi等,生物化學(xué)雜志J.Biol.Chem.,27017381-17385(1995))分離的ALS基因中都證實(shí)了類似的點(diǎn)突變。某些對(duì)SU耐受的作物如ICI8532IT和先鋒3180IR都已經(jīng)商品化。
在下面的實(shí)施例1中,除草劑抗性基因被分裂并且將一個(gè)intein片段在結(jié)構(gòu)上融合到每一部分基因中。斷裂的基因被證實(shí)在大腸桿菌中具有對(duì)除草劑SM的抗性。大腸桿菌被當(dāng)作模型系統(tǒng),因?yàn)樗谢钚缘腁LSI和乙酰乳酸合成酶III(ALSIII)酶,而不是活性的ALSII酶。ALSI和ALSIII是大腸桿菌內(nèi)ALS基因的兩個(gè)同型異構(gòu)體,它們在合成纈氨酸,異亮氨酸,亮氨酸中起關(guān)鍵性作用(DeFelice等,微生物學(xué)年報(bào)Ann.Microbiol.(Paris)133A251-256(1982))。其活性對(duì)纈氨酸的反饋抑制敏感。因此,只要用纈氨酸飽和培養(yǎng)基,ALSI和ALSIII將被抑制,細(xì)胞就會(huì)停止生長。由于ALSII對(duì)纈氨酸的抑制作用具有抵抗性,將重組的ALSII導(dǎo)入大腸桿菌細(xì)胞內(nèi),這些細(xì)胞將恢復(fù)生長。由于這種特性使得大腸桿菌ER2744菌株成為研究(通過插入連接物或intein的反式剪接元件)基因修飾后的大腸桿菌ALSII基因活性的良好體內(nèi)模型系統(tǒng)。
第二個(gè)檢測的除草劑抗性基因來自鼠傷寒沙門氏菌aroA基因,它有一個(gè)C301到T的突變(Stalker等,生物化學(xué)雜志J.Biol.Chem.2604724(1985))。該基因編碼5-enolpyruvyl-3-phosphoshikimate合酶(EPSPS)(EC2.5.1.19)蛋白,具有一個(gè)Pro101到Ser的改變,已知具有除草劑草甘膦的抗性(市售商品名為Round-Up)。在這個(gè)實(shí)施方案中,EPSPS基因的一個(gè)N末端片段與Ssp DnaE intein的N末端剪接區(qū)相融合,而EPSPS基因的一個(gè)C末端片段與Ssp DnaE intein的C末端剪接區(qū)相融合。為確定EPSPS蛋白中能插入一個(gè)intein的位點(diǎn),進(jìn)行連接子掃描實(shí)驗(yàn)(Biery等,核酸Nucleic Acids Res.,281067-1077(2000))(GPS-LS,New England Biolabs,Inc.,Beverly,MA),該實(shí)驗(yàn)在整個(gè)蛋白序列中隨機(jī)插入5個(gè)氨基酸。將intein插入能耐受氨基酸插入的位點(diǎn)。將編碼EPSPS的N末端片段的基因與一條質(zhì)粒上Ssp DnaEintein的N末端區(qū)域相融合,將EPSPS的C末端部分與在另一質(zhì)粒上的Ssp DnaEintein的C末端剪接區(qū)相融合,建立了反式剪接構(gòu)建物。比如,EPSPS蛋白能夠在Gly235對(duì)應(yīng)的位點(diǎn)被斷裂。有人發(fā)現(xiàn),兩種質(zhì)粒共同轉(zhuǎn)化進(jìn)缺乏功能性EPSPS蛋白的大腸桿菌細(xì)胞內(nèi),細(xì)胞在存在或不存在除草劑草甘膦的M9限制性培養(yǎng)基中生長的現(xiàn)象。
觀察斷裂ALS和EPSPS除草劑抵抗基因的活性,是否intein未修飾或催化的殘基發(fā)生改變,并因此消除了反式剪接活性。這說明盡管剪接能產(chǎn)生一種共價(jià)結(jié)合的蛋白質(zhì)產(chǎn)物,但并不是在所有情況下都需要進(jìn)行剪接。此時(shí)intein作為主要的親和區(qū)能將兩個(gè)蛋白片段按正確的方向組合在一起。在這些實(shí)驗(yàn)中斷裂蛋白的活性絕對(duì)需要intein的存在。因?yàn)橛袑?shí)驗(yàn)觀察到當(dāng)沒有intein融合時(shí),斷裂的ALS和EPSPS基因都無法使大腸桿菌在適當(dāng)?shù)某輨┥仙L。
在該發(fā)明的一個(gè)實(shí)施方案中,融合在intein剪接區(qū)的兩個(gè)基因片段用選擇性的標(biāo)志物(如對(duì)抗生素抵抗或其他生長抑制劑來證實(shí)基因轉(zhuǎn)移)分別引入核染色體內(nèi)。兩種融合基因的分別轉(zhuǎn)移能確保被轉(zhuǎn)移的基因位于植物基因組的不同位置,可能是在不同的染色體上,由此排除了一種病毒或質(zhì)粒載體在向其他微生物傳遞時(shí)同時(shí)獲得兩種基因的可能性。如此,利用已知的DNA序列,用同源重組的方法靶向特定的部位就能夠保證兩個(gè)基因相距很遠(yuǎn)。
在該發(fā)明的另一個(gè)實(shí)施方案中,兩個(gè)融合蛋白中的一個(gè)被轉(zhuǎn)化到細(xì)胞核內(nèi),另一個(gè)被轉(zhuǎn)化到葉綠體體內(nèi),這樣就可以根本杜絕基因通過任何可能的機(jī)制(包括相關(guān)種屬的交叉?zhèn)鞣郏?傳遞到相關(guān)植物中的可能性,因?yàn)橹挥谢虻姆腔钚云未嬖谠诨ǚ壑?。位于葉綠體內(nèi)的基因片段是通過母系傳播,而不能通過花粉進(jìn)行傳播,這同樣也適合于線粒體內(nèi)表達(dá)的基因片段。
該技術(shù)也可應(yīng)用于非植物系統(tǒng)。例如,一個(gè)被封閉的轉(zhuǎn)基因可以被分裂并且將intein融合到基因片段中。在細(xì)菌中,斷裂基因優(yōu)選采用標(biāo)準(zhǔn)的染色體轉(zhuǎn)化技術(shù)放置在與細(xì)菌染色體相距很遠(yuǎn)的部位。將基因片段反方向排列可作為進(jìn)一步的控制措施。該方法的另一描述是將一個(gè)目標(biāo)轉(zhuǎn)基因分裂成兩部分,并且在將斷裂基因插入真核細(xì)胞前與適當(dāng)?shù)膇ntein區(qū)域結(jié)合,主要目的是阻止轉(zhuǎn)基因的活性向環(huán)境或臨近的細(xì)胞傳遞。斷裂基因也可以被安放在原核細(xì)胞染色體上相距很遠(yuǎn)的部位或單獨(dú)的染色體上。此外,這些基因片段也可位于不同的細(xì)胞器內(nèi)如細(xì)胞核和線粒體內(nèi)。位于線粒體內(nèi)的基因片段是通過母系傳遞的。
本發(fā)明的用途之一是阻止完整轉(zhuǎn)基因由轉(zhuǎn)基因植物向環(huán)境中傳播。它能通過將轉(zhuǎn)基因融合分裂成兩個(gè)或更多的片段并且進(jìn)一步與intein片段融合來完成。部分轉(zhuǎn)基因融合體分別位于單獨(dú)的小室中,例如一部分位于細(xì)胞核DNA內(nèi)而第二部分則位于葉綠體DNA內(nèi)。隨著部分基因的表達(dá),蛋白片段向活性部位移動(dòng)并且在此處重構(gòu)靶蛋白活性。只有在細(xì)胞核內(nèi)的轉(zhuǎn)基因片段是通過花粉傳播的,因?yàn)槿~綠體DNA只通過母系傳播方式向下一代傳播。這就明顯減少了完整的轉(zhuǎn)基因向周圍環(huán)境的傳播。
本發(fā)明的另一優(yōu)勢是僅僅表達(dá)非活性融合蛋白種屬的宿主細(xì)胞處理起來非常安全,因而減少了靶蛋白與人和環(huán)境接觸的風(fēng)險(xiǎn),這些靶蛋白可能是一個(gè)毒素。此外,將靶基因分裂成兩個(gè)獨(dú)立部分后也顯著降低了通過DNA載體(質(zhì)粒、病毒,粘粒等)或其它方式(如細(xì)胞融合等)將整個(gè)蛋白編碼序列轉(zhuǎn)移到其他微生物中去的機(jī)率。一個(gè)設(shè)想的例子是表達(dá)一個(gè)毒性基因如白喉毒素。白喉毒素蛋白是一種對(duì)人和動(dòng)物細(xì)胞具有很強(qiáng)毒性的蛋白質(zhì),在處理時(shí)應(yīng)十分小心。這種蛋白質(zhì)已經(jīng)作為殺滅腫瘤細(xì)胞的藥物進(jìn)行過臨床前和I期臨床研究(Kelley,Proc.Natl.Acad.Sci USA 85(11)3980-3984(1988);Alexander,神經(jīng)元Neuron3(1)133-139(1989);Maxwell等,癌癥研究Cancer Res.51(16)4299-4304(1991);Madshus,生物化學(xué)雜志J.Biol.Chem.,269(26)17723-17729(1994);Murphy和vanderSpeck,Semin Cancer Biol.6(5)259-267(1995);Rozemuller和Rombouts,白血病Leukemia,12(5)710-717(1998);Veggeberg,Mol.Med.Today 4(3)93(1988);Kreitman,Current Opin.Immunol.,11(5)570-578(1999);Vallera等,蛋白質(zhì)工程Protein Eng.12(9)779-785(1999))。因此,將白喉毒素基因分裂成兩個(gè)intein融合DNA片段并且在兩個(gè)不同的細(xì)菌或酵母菌株中表達(dá)是有益處的。這兩種融合蛋白在需要時(shí)可以被混合起來組合成毒素。
第三,至少將靶基因的一個(gè)片段限制在一個(gè)經(jīng)母系遺傳的細(xì)胞器內(nèi)(如葉綠體或線粒體),就可避免相關(guān)微生物的功能基因通過交叉受粉進(jìn)行基因轉(zhuǎn)移。
本發(fā)明也可用于轉(zhuǎn)基因動(dòng)物中表達(dá)任何目的基因的手段。轉(zhuǎn)基因動(dòng)物模型被廣泛作為科研工具進(jìn)行生物醫(yī)學(xué)研究或制造需要的蛋白質(zhì)。為研究和商業(yè)目的(如生產(chǎn)疫苗或治療藥物或作為人類疾病模型)(Alexander,神經(jīng)元Neuron3(1)133-139(1989);Groner等,生理學(xué)雜志J.Physiol.84(1)53-77(1990);Patil等,神經(jīng)元Neuron 4(3)437-447(1990);Aloe等,生長因子Growth Factors9(2)149-155(1993);Aguzzi等,大腦病理學(xué)Brain Pathol.4(1)3-20(1994);Groner等,Biomed.Pharmacother.48(5-6)231-240(1994);Schorderet,Experientia51(2)99-105(1995)),轉(zhuǎn)基因小鼠和其他轉(zhuǎn)基因動(dòng)物如轉(zhuǎn)基因魚、青蛙、大鼠、牛、豬等已經(jīng)顯示可以表達(dá)人類基因(或一種外源基因)。擔(dān)心的問題之一是轉(zhuǎn)基因動(dòng)物可能獲得一種意外的外源基因并將其傳遞到下一代和繼續(xù)往下傳遞。這將導(dǎo)致基因改變的動(dòng)物株,由此可產(chǎn)生無法預(yù)計(jì)的社會(huì)和倫理后果。根據(jù)本發(fā)明,這種轉(zhuǎn)基因能夠被分裂成兩個(gè)無活性的融合DNA片段。其中的一個(gè)片段整合到動(dòng)物的基因組內(nèi),而另一個(gè)片段可能由DNA載體(如病毒等)提供,該載體無法融合到基因組內(nèi)。因此,當(dāng)一個(gè)來源于動(dòng)物和另一個(gè)來源于DNA載體的融合蛋白共同表達(dá)時(shí),融合蛋白將重新組裝,進(jìn)行反式剪接并形成一個(gè)活性蛋白。這種基因排列能阻止動(dòng)物獲得一個(gè)完整的外源性基因,因而避免了基因污染的發(fā)生。
兩個(gè)基因片段的小室限制是對(duì)反式剪接的擴(kuò)展。有問題的蛋白被分裂成片段并將適當(dāng)?shù)臄嗔鸦蚍謩e放置在同一個(gè)或不同的DNA分子上。例如,集胞藻屬PCC6803(含有Ssp DnsE或Ssp DnaE intein剪接區(qū)域)中DnaE蛋白的兩部分基因融合到合適的片段后就被分開(Wu等,Proc.Natl.Acad.Sci USA,959226-9231(1998a);Wu等,Biochim biophys Acta 1387422-432(1998b)),其中一部分位于細(xì)胞核內(nèi),而第二部分位于某一特定微生物的線粒體內(nèi)。
在執(zhí)行本發(fā)明時(shí),必須遵照下列一種或多種方法(1)在目標(biāo)轉(zhuǎn)基因上確定合適的分裂位點(diǎn);(2)斷裂基因?yàn)閮蓚€(gè)或更多片段并且將每一片段與一個(gè)斷裂intein融合的方法學(xué);(3)成功將斷裂基因產(chǎn)物轉(zhuǎn)變?yōu)橐粋€(gè)功能性酶或蛋白質(zhì)的方法學(xué);(4)篩選宿主細(xì)胞內(nèi)活性基因產(chǎn)物或微生物的方法學(xué);(5)確定在相關(guān)的細(xì)胞器內(nèi)斷裂基因序列的位置;(6)將靶基因分裂成兩個(gè)以上片段的方法;(7)采用蛋白互補(bǔ)作用來代表轉(zhuǎn)基因傳播;并且(8)引入轉(zhuǎn)基因。
(1)任何轉(zhuǎn)基因上尋找合適斷裂位點(diǎn)的方法在轉(zhuǎn)基因上尋找斷裂位點(diǎn)一個(gè)優(yōu)選的方法是根據(jù)對(duì)目標(biāo)蛋白或其類似物及同源序列的結(jié)構(gòu)分析來進(jìn)行。該過程包括研究已知的生物化學(xué)和X線、NMR或有關(guān)的結(jié)構(gòu)信息,進(jìn)一步確定優(yōu)選的intein插入位點(diǎn)和或?qū)⒌鞍追至殉善蔚奈稽c(diǎn)。特別是應(yīng)確定哪一個(gè)是持久的活性氨基酸殘基以及它們空間結(jié)構(gòu)和在蛋白質(zhì)內(nèi)的空間排列。如果可能,最好將靶基因分裂以便催化性氨基酸被分配安裝到每一個(gè)片段。這樣每一片段不具有活性的可能性將增加。蛋白分裂片段可以在蛋白的任何位置上,但最初檢測的位點(diǎn)應(yīng)在位于二級(jí)結(jié)構(gòu)之間的畔部或連接部如β-片層和α-折疊。第一個(gè)選擇的畔部不應(yīng)是催化部位的部分,盡管最終的分裂位點(diǎn)可能位于此處。作為第一步,優(yōu)選的分裂部位應(yīng)是蛋白質(zhì)內(nèi)兩個(gè)折疊區(qū)域之間的畔部或連接處。這將使當(dāng)?shù)鞍灼畏謩e表達(dá)時(shí)正確折疊的可能性增加。
如果沒有目標(biāo)蛋白的生物化學(xué)或結(jié)構(gòu)資料,那么來自不同微生物或來自同一微生物的相似蛋白序列的排列方式可能提供一些信息。蛋白的排列可通過傳統(tǒng)的序列比較方法或應(yīng)用任意一種計(jì)算機(jī)程序如GCG(Genetics Computer Group,Madison,WI.)進(jìn)行。所有可能代表重要區(qū)域的相似蛋白的高度保守區(qū)和在高度保守區(qū)內(nèi)分裂蛋白可在以后進(jìn)行測試。我們不應(yīng)去確定低度保守區(qū)域,位于高度保守區(qū)之間的優(yōu)選區(qū)域內(nèi)氨基酸的數(shù)目也不相同。低度保守提示出現(xiàn)催化殘基的可能性降低,氨基酸殘基長度的變化提示保守區(qū)域之間的確切空間并不由氨基酸的這種延伸所指示。這些特性將有利于在某一位點(diǎn)插入intein并將靶蛋白分裂。
此外,在目的蛋白質(zhì)中選擇位點(diǎn)插入intein時(shí),應(yīng)當(dāng)檢測具有適合被測intein發(fā)揮剪接活性的氨基酸殘基位點(diǎn)。在研究中在目標(biāo)蛋白中優(yōu)選與自然生成的intein的extein殘基相似或相同的位點(diǎn)。此外,已知能夠促進(jìn)高效剪接的殘基可與intein一起插入。此時(shí),隨著剪接反應(yīng)的繼續(xù),這些殘基將在剪接產(chǎn)物序列中出現(xiàn)并且能改變靶蛋白的活性。靶蛋白上這些外部殘基的作用通過將外部氨基酸插入靶蛋白進(jìn)行測定并檢測所需的特性或活性。
另一種優(yōu)選的方法是通過隨機(jī)連接子的插入對(duì)目標(biāo)蛋白進(jìn)行系統(tǒng)掃描來進(jìn)行。連接子掃描能通過多種方法進(jìn)行(Gustin等,分子生物學(xué)方法MethodsMol.Biol.13085-90(2000);Hobson等,分子生物學(xué)方法Methods Mol.Biol.57279-285(1996);Biery,核酸研究Nucleic Acids Res.281067-1077(2000))。這種方法可生成帶有側(cè)枝的隨機(jī)全程插入DNA基因文庫。當(dāng)翻譯這些文庫后能產(chǎn)生不同位置插入的帶有額外氨基酸殘基的一系列蛋白質(zhì)。然后在文庫中篩選靶蛋白的所需特性。例如,如果靶蛋白具有除草劑抗性,則篩選文庫確定那一個(gè)帶有額外氨基酸殘基的蛋白質(zhì)能夠在除草劑存在時(shí)允許目標(biāo)微生物的生長。建立蛋白質(zhì)中能容納額外氨基酸的多個(gè)位點(diǎn)目錄。如果有結(jié)構(gòu)或生物化學(xué)資料,將該目錄與已知的資料相比較。理想的情況是選擇一個(gè)能夠容納額外氨基酸插入并且位于連接子或畔部區(qū)域的分裂位點(diǎn),進(jìn)而催化位于不同片段的殘基。如果沒有結(jié)構(gòu)資料,優(yōu)選從位于靠近目標(biāo)蛋白中段的插入部位基因開始斷裂基因,并從此開始繼續(xù)向外檢測斷裂位點(diǎn)直至重構(gòu)所需的活性。在兩種方法中,優(yōu)選的插入位點(diǎn)也應(yīng)具有所用intein的天然intein序列,盡管不需如此。在剪接連接處,融合蛋白可以優(yōu)化氨基酸殘基使得功能產(chǎn)物得以評(píng)價(jià)。
(2)一種裂解基因并將每個(gè)基因片斷在結(jié)構(gòu)上融合進(jìn)一個(gè)斷裂的編碼intein的序列中的方法一旦一個(gè)要斷裂目的基因的位點(diǎn)被確定(見上),靶基因就采用普通的基因技術(shù)(Sambrook等,分子克隆實(shí)驗(yàn)室手冊,第二版,Cold Spring Harbor Laboratory,NYCold Spring Harbor Laboratory Press(1989))斷裂成兩個(gè)或更多的片斷。例如,可以設(shè)計(jì)具有合適限制性位點(diǎn)的PCR引物,使之一個(gè)對(duì)應(yīng)于靶基因的起點(diǎn),另一個(gè)對(duì)應(yīng)于斷裂位點(diǎn)的序列??梢栽O(shè)計(jì)另一類PCR引物使之對(duì)應(yīng)于斷裂位點(diǎn)和靶基因的另一端。兩個(gè)靶基因片斷然后通過PCR進(jìn)行擴(kuò)增(Sambrook等,見上),并克隆進(jìn)一個(gè)具有與PCR引物相同的單一克隆位點(diǎn)的質(zhì)粒載體中。一旦克隆進(jìn)獨(dú)立的載體中,intein片斷將與靶基因融合。在一種方法中,編碼靶蛋白N-端部分的DNA的C-末端將與編碼intein N-端部分的DNA的N-末端融合,在另一個(gè)融合中,編碼靶蛋白C-端部分的DNA的N-末端將與編碼intein C-端部分的DNA的C-末端融合。
然后,這些基因片斷的融合物轉(zhuǎn)移到相同或不同的表達(dá)載體中,并轉(zhuǎn)化進(jìn)入以單或多細(xì)胞生物體存在的細(xì)菌或真核細(xì)胞中,以便篩選所期望的靶蛋白活性。應(yīng)該注意的是所述的基因片斷將可用限制位點(diǎn)被克隆,該位點(diǎn)在天然的或通過突變添加的intein基因內(nèi)部或外部。而且,為了通過重組轉(zhuǎn)移基因,可用重組位點(diǎn)替代限制性酶切位點(diǎn)。然后基因或基因片斷將轉(zhuǎn)移和/或從質(zhì)粒載體、病毒基因組、或細(xì)菌、真核細(xì)胞或原始生物體(archeal organism)基因組中表達(dá)。一個(gè)優(yōu)選的方法是應(yīng)用天然存在的反式剪接intein,例如來自集胞藻菌屬PCC6803(Wu等,Proc.Natl.Acad.Sci.USA 959226-9231(1998))dnaE基因的intein。但是,任何已知的intein都可以使用(見http//www.neb.com/neb/frame tech.html上的InBase;Perler等,核酸研究Nucleic Acid Res.,28344-345(2000))。這將涉及斷裂全長intein以產(chǎn)生所期望的親和性或反式剪接的區(qū)域。一種方法是在蛋白剪接區(qū)的B和F單元之間的連接區(qū)斷裂全長intein(Petrokovshi,蛋白質(zhì)科學(xué)Protein Sci.764-71(1998);Perler等,核酸研究Nucleic Acid Res.251087-1093(1997);Perler等,核酸研究Nucleic AcidRes.,28344-345(2000))。
(3)從表達(dá)的斷裂片斷中產(chǎn)生一個(gè)功能蛋白下一步是采用intein作為一個(gè)親和區(qū)加速蛋白N-和C-末端部分的互補(bǔ)和重建成為一個(gè)功能性的酶。蛋白斷裂位點(diǎn)的確定可如上面(1)中所述,靶基因片斷的克隆和intein區(qū)的添加可如(2)中所述。如此,intein片斷不需要導(dǎo)致兩個(gè)蛋白片斷的剪接以重建酶活性。在一個(gè)優(yōu)選的實(shí)施方案中,intein區(qū)將被變化以消除剪接活性的可能性,并將僅作為蛋白互補(bǔ)的加速器。Intein的剪接活性可通過改變涉及剪接反應(yīng)的氨基酸殘基來消除(Xu等,EMBO J.155146-5153(1996);Chong等,生物化學(xué)雜志J.Biol.Chem.27122159-22168(1996);Chong等,Biochem.BiophysRes.Commun.,259136-140(1999);Chong等,基因Gene,192271-281(1997);Chong等,核酸研究Nucleic Acids Res.,265109-5115(1998);Chong等,生物化學(xué)雜志J.Biol.Chem.,27310567-10577(1998);Chong和Xu,生物化學(xué)雜志J.Biol.Chem.,27215587-15590(1997);Evans等,J.Biol.Chem.,27418359-18363(1999);Evans等,生物化學(xué)雜志J.Biol.Chem.,2743923-3926(1999);Evans等,蛋白質(zhì)科學(xué)Protein Sci.,72256-2264(1998);Evans等,生物化學(xué)雜志J.Biol.Chem.,2759091-9094(2000);Mathys等,基因Gene,2311-13(1999);Paulus,化學(xué)協(xié)會(huì)雜志Chem.Soc.Rev.,27375-386(1998);Perler等,核酸研究Nucleic Acids Res.,251087-1093(1997);Pietrokovski等,蛋白質(zhì)科學(xué)Protein Sci.,32340-2350(1994);Pietrokovski等,蛋白質(zhì)科學(xué)Protein Sci.,764-71(1998),Scott,Proc.Natl.Acad.Sci.USA,9613638-13648(1999),Shingledecker等,Arch Biochem.Biophys.375138-144(2000);Southworth等,生物技術(shù)Biotechniques 27110-120(1999);Telenti等,細(xì)菌學(xué)雜志J.Bacteriol.,1796378-6382(1997);Wood等,國家生物技術(shù)Nat.Biotechnol.,17889-892(1999);Wu等,Biochim Biophys Acta 1387422-432(1998b);Wu等,Proc.Natl.Acad.Sci.USA 959226-9231(1998a))。
在另一個(gè)實(shí)施方案中,intein親和區(qū)可以保留其正常的催化殘基。此外,intein可以包括一個(gè)缺失或變化的形式,與其原始基本序列相比,明顯更小或更大或含有非天然的氨基酸殘基。Intein的缺失形式可通過按順序地在基因水平或蛋白水解減少intein的大小,然后檢測親和活性來建立。親和活性可如下檢測,采用斷裂的除草劑抗性基因,將新的缺失變異體與合適的除草劑抗性基因片斷融合,觀察在所述除草劑上的生長。Intein片斷的突變體可通過傾向差錯(cuò)PCR、連接子掃描、位點(diǎn)直接誘變、或致突變化合物來形成,intein片斷的活性用上述方法測定。注意除草劑抗性基因可用藥物抗性基因、綠熒光蛋白或其他選擇性標(biāo)記來代替。Intein片斷的親和性檢測也可通過在一個(gè)固體支持物上固定一個(gè)片斷,檢測第二個(gè)片斷與第一個(gè)片斷的結(jié)合。
(4)一種在合適的宿主細(xì)胞或生物體中篩選產(chǎn)生目的活性蛋白的構(gòu)件的方法靶基因活性的篩選依靶基因的不同而異,但可在表達(dá)和純化后或在粗的細(xì)胞溶解產(chǎn)物中通過體外實(shí)驗(yàn)來進(jìn)行,或在體內(nèi)通過細(xì)胞表現(xiàn)型來確定蛋白活性,如存活能力、形態(tài)學(xué)、對(duì)一種藥物或一種化合物敏感或不敏感、外觀,或與一種特異的分子或化合物結(jié)合或不結(jié)合的能力。一個(gè)優(yōu)選的方法是采用大腸桿菌作為宿主細(xì)胞進(jìn)行檢測,例如一個(gè)斷裂基因的重組產(chǎn)物的耐除草劑活性。大腸桿菌必須對(duì)所述的除草劑敏感。與intein融合的靶基因片斷存在于一個(gè)或幾個(gè)質(zhì)粒中,并用標(biāo)準(zhǔn)的方法轉(zhuǎn)入大腸桿菌細(xì)胞中。
基因融合體結(jié)構(gòu)性表達(dá)或通過一個(gè)可誘導(dǎo)的啟動(dòng)子表達(dá)。然后在選擇的條件下檢測大腸桿菌的生長情況,即在除草劑存在的情況下,存在或缺乏合適的基因片斷。在基因片斷存在時(shí)生長表明靶蛋白活性的重建。大腸桿菌細(xì)胞可采用本領(lǐng)域熟知的技術(shù)被任何細(xì)菌、原始或真核細(xì)胞(單或多細(xì)胞)以及病毒替代。
此外,兩個(gè)靶基因片斷都可存在于生物體基因組中,或一個(gè)片斷位于基因組中,另一個(gè)在質(zhì)?;蚰硞€(gè)其他載體中。靶蛋白片斷可在一個(gè)生物體中一起或分別表達(dá),并加入到另一個(gè)細(xì)胞類型中以供檢測。融合可在植物細(xì)胞或其他多細(xì)胞生物體中直接檢測,將轉(zhuǎn)基因片斷置入宿主生物體核、葉綠體或線粒體基因組中,并測定是否存在所需要的活性。靶基因或蛋白片斷可通過細(xì)菌、真菌、病毒、微膠粒、機(jī)械的(biolistic)或相似的載體傳遞到被檢測的細(xì)胞或生物體中。
(5)斷裂基因的定位本發(fā)明也包括在不同的細(xì)胞小室中斷裂靶基因序列的定位,在染色體或不同載體上的不同定位。一個(gè)優(yōu)選的方法是將兩個(gè)斷裂的基因序列置于核、葉綠體、線粒體、細(xì)菌人工染色體、酵母人工染色體、質(zhì)粒內(nèi),優(yōu)選地,兩個(gè)不共同存在于上述任一載體中。片段的定位可按標(biāo)準(zhǔn)的分子生物學(xué)技術(shù)來完成。為了從其片段重構(gòu)基因產(chǎn)物,必須將合適的基因片段與靶/定位的序列融合,使得其蛋白產(chǎn)物被轉(zhuǎn)運(yùn)進(jìn)細(xì)胞小室中(如葉綠體),在此可發(fā)生功能重建。
(6)將靶基因斷裂成兩個(gè)或更多片段的方法本發(fā)明也表達(dá)了將靶基因分裂成兩個(gè)或更多片段,以及通過反式剪接、所有必需片段的intein介導(dǎo)的互補(bǔ)或蛋白互補(bǔ)重建所需活性的方法。例如,不同活性的inteins可被附著于靶蛋白片段,以前述的方式(Otomo等,生物化學(xué)Biochemistry,3816040-16044(1999);Otomo等,分子生物學(xué)雜志J.Biomol.NMR,14105-114(1999))使其重新裝配活性蛋白。這樣,除位置的數(shù)目與蛋白分裂的片段數(shù)目相當(dāng)外,每個(gè)片段可位于染色體上的遠(yuǎn)隔部位,在單獨(dú)的染色體上或在上述的多個(gè)位置上。
(7)在防止轉(zhuǎn)基因傳播中采用蛋白互補(bǔ)作用本方案采用兩個(gè)蛋白片段的天然互補(bǔ)活性來重建所需的蛋白特性。編碼蛋白兩部分的兩個(gè)基因可能定位在核、葉綠體、線粒體、細(xì)菌人工染色體、酵母人工染色體、質(zhì)粒或那些細(xì)胞器或載體的任何組合。在表達(dá)后,兩個(gè)蛋白片段都可靶向到蛋白作用的部位,通過蛋白片段的互補(bǔ)作用產(chǎn)生所需的蛋白特性。蛋白的互補(bǔ)作用以前曾被報(bào)道過(Rossi等,Trends Cell Biol.10119-122(2000)),因此使應(yīng)用intein作為互補(bǔ)區(qū)成為可行的選擇。進(jìn)行這個(gè)實(shí)驗(yàn)的必須步驟與已經(jīng)討論的步驟相似,除了沒有采用intein融合體以外。斷裂靶基因的位點(diǎn)的確定如(1)中所述。轉(zhuǎn)基因片段的克隆如(2)所述,除了不用intein作為融合參與者以外。斷裂蛋白活性的篩選如(4)所述進(jìn)行。
(8)通過病毒感染將一個(gè)轉(zhuǎn)基因?qū)肷矬w中在另一個(gè)實(shí)施方案中,兩個(gè)轉(zhuǎn)基因片段,是或不是intein融合體,可能分別包裝在病毒顆粒中。這些病毒共同感染一個(gè)生物體,兩個(gè)轉(zhuǎn)基因都表達(dá)。所需的蛋白特性在蛋白剪接、intein介導(dǎo)的互補(bǔ)作用、或蛋白互補(bǔ)作用后產(chǎn)生。一個(gè)優(yōu)選的方法包括選擇斷裂位點(diǎn),克隆片段,并檢查轉(zhuǎn)移的活性,如(1),(2)和(4)中所述。合適的斷裂轉(zhuǎn)基因或轉(zhuǎn)基因intein融合體被包裝進(jìn)腺病毒中。含有合適轉(zhuǎn)基因的腺病毒可被導(dǎo)入目標(biāo)生物體中,經(jīng)過轉(zhuǎn)染過程引導(dǎo)兩個(gè)基因片段使靶蛋白活性得以表達(dá)。
實(shí)施例的簡單描述在實(shí)施例I中,我們說明了通過intein斷裂一個(gè)除草劑抗性基因的方法。顯示了如何根據(jù)序列同源分析和目的蛋白或其類似物的晶體結(jié)構(gòu),在編碼乙酰乳酸合酶(ALS)的大腸桿菌除草劑抗性基因中選擇潛在的斷裂位點(diǎn)。編碼ALS蛋白N-端327個(gè)氨基酸殘基的DNA片段在結(jié)構(gòu)上與Ssp DnaE intein N-端的123個(gè)氨基酸融合,同時(shí),編碼C-端221個(gè)氨基酸殘基的DNA片段在結(jié)構(gòu)上與Ssp DnaE intein C-端的36個(gè)氨基酸融合。帶有融合基因之一的質(zhì)粒載體表達(dá)為一個(gè)無活性的ALS蛋白片段。當(dāng)兩個(gè)融合基因載體被導(dǎo)入同一個(gè)宿主細(xì)胞并共表達(dá)時(shí),兩個(gè)無活性的融合蛋白在體內(nèi)進(jìn)行反式剪接產(chǎn)生一個(gè)功能性的酶,使大腸桿菌宿主細(xì)胞具有除草劑抗性。這種方法可用于在任何基因內(nèi)選擇合適的位點(diǎn),以與intein序列融合。
在實(shí)施例II中,我們說明了如何根據(jù)玉米ALS基因和其大腸桿菌對(duì)應(yīng)體——ALSII基因的序列同源性,在玉米ALS基因中選擇斷裂位點(diǎn)。編碼玉米ALS基因N-端397個(gè)氨基酸殘基的DNA在結(jié)構(gòu)上與編碼Ssp DnaE intein N-端123個(gè)氨基酸殘基的DNA序列融合,同時(shí),編碼C-端241個(gè)氨基酸殘基的DNA片段在結(jié)構(gòu)上與編碼Ssp DnaE intein C-端36個(gè)氨基酸的DNA融合。我們顯示,當(dāng)兩個(gè)融合基因共表達(dá)時(shí),兩個(gè)融合蛋白進(jìn)行反式剪接,產(chǎn)生一個(gè)成熟蛋白的期望大小的蛋白產(chǎn)物。
在實(shí)施例III中,我們說明了一個(gè)在轉(zhuǎn)座子隨機(jī)連接子插入的基礎(chǔ)上,在編碼5-enolpyruvyl-3-phosphoshikimate合成酶(EPSPS)的突變體S.typhimurium aroA基因中識(shí)別潛在的斷裂位點(diǎn)的方法。在所有42個(gè)潛在位點(diǎn)中,位于EPSPS 215和235氨基酸位的兩個(gè)位點(diǎn)被選來斷裂EPSPS基因。編碼EPSPS蛋白N-端215或235個(gè)氨基酸殘基的DNA片段在結(jié)構(gòu)上與Ssp DnaE intein N-端的123個(gè)氨基酸融合,同時(shí),編碼EPSPS C-端212或192個(gè)氨基酸殘基的DNA片段在結(jié)構(gòu)上與編碼SspDnaE intein C-端36個(gè)氨基酸的DNA融合。當(dāng)在ER2799中僅導(dǎo)入與intein融合或不融合的半個(gè)EPSPS基因,以及沒有intein的互補(bǔ)的兩半時(shí),EPSPS表達(dá)為一個(gè)無功能的蛋白。但當(dāng)與活性或無活性intein融合的兩半個(gè)EPSPS都引入ER2799時(shí),EPSPS表達(dá)為一個(gè)功能性蛋白并賦予宿主對(duì)除草劑草甘磷的抗性,表明SspDnaE intein的N-和C-端部分通過將EPSPS兩部分靠近而加速EPSPS蛋白N-和C-端部分的互補(bǔ)和重組。
在實(shí)施例IV中,我們描述了一種方法,其中兩個(gè)不相關(guān)的基因產(chǎn)物如氨基糖苷-3-乙?;D(zhuǎn)移酶(該酶負(fù)責(zé)藥物壯觀霉素或鏈霉素的代謝)和AequoreaVictoria可溶性修飾的綠色熒光蛋白,可在大腸桿菌細(xì)胞中被反式剪接成一個(gè)雜交蛋白。兩個(gè)基因位于兩個(gè)不同的質(zhì)粒中,各自從Ssp DnaE intein具有反式剪接元件。質(zhì)粒有兩個(gè)獨(dú)立的表達(dá)系統(tǒng)。雜交蛋白賦予宿主對(duì)硫酸壯觀霉素的抗性。
在實(shí)施例V中,我們描述了一種方法,其中兩個(gè)不相關(guān)基因,如aadA(編碼氨基糖苷-3-乙酰基轉(zhuǎn)移酶)和smGFP(可溶性修飾的綠色熒光蛋白),可在葉綠體啟動(dòng)子(PpsbA)控制的轉(zhuǎn)錄和翻譯水平下位于一個(gè)單一大腸桿菌-植物雙重載體上。兩個(gè)基因當(dāng)表達(dá)時(shí),能夠產(chǎn)生一個(gè)雜交的氨基糖苷-3-乙?;D(zhuǎn)移酶-可溶性修飾的綠色熒光蛋白。因此這種方法可在采用能被大腸桿菌和植物細(xì)胞結(jié)構(gòu)共同識(shí)別的啟動(dòng)子導(dǎo)入植物細(xì)胞之前,進(jìn)行蛋白/蛋白片片段的快速反式剪接篩選。
在實(shí)施例VI中,我們描述了一種方法,其中含有5-enolpyruvyl-3-phosphoshikimate合成酶(EPSPS)或乙酰乳酸合酶(ALS)兩個(gè)片段及Ssp DnaE intein的順式剪接結(jié)構(gòu)能在植物細(xì)胞漿中剪接成一個(gè)成熟蛋白。這個(gè)實(shí)驗(yàn)將加強(qiáng)在細(xì)胞漿中順/反式剪接的觀點(diǎn)。這項(xiàng)技術(shù)對(duì)于需要在細(xì)胞漿環(huán)境中進(jìn)行活性/折疊特異修飾的蛋白質(zhì)是有用的。一部分具有必須的轉(zhuǎn)運(yùn)信號(hào)和剪接元件的靶蛋白基因?qū)⒁郧绑w多肽的形式置于一個(gè)細(xì)胞器內(nèi)以進(jìn)行細(xì)胞漿轉(zhuǎn)運(yùn)。
在實(shí)施例VII第一部份中,我們描述了一種方法,其中兩個(gè)不相關(guān)基因,如aadA(編碼氨基糖苷-3-乙?;D(zhuǎn)移酶)和smGFP(可溶性修飾綠色熒光蛋白),可位于葉綠體基因組上,并通過蛋白反式剪接產(chǎn)生一個(gè)雜交蛋白。此方法的成功將導(dǎo)致蛋白/蛋白片段的區(qū)域化和功能性蛋白的反式剪接。而且,在一個(gè)載體中轉(zhuǎn)化幾個(gè)不同的基因以形成多功能蛋白,簡化了新特性的設(shè)計(jì)。
在實(shí)施例VII第二部分中,我們描述了一種方法,其中兩個(gè)不相關(guān)的基因/基因片段可位于植物細(xì)胞的兩個(gè)不同小室中,如葉綠體和核,并表達(dá)各自的蛋白/多肽。由核編碼的成分具有三部分,含有一個(gè)葉綠體轉(zhuǎn)運(yùn)肽,該肽將幫助蛋白片段在細(xì)胞漿中被合成,并游走到葉綠體中以便進(jìn)行反式剪接。葉綠體部分將在細(xì)胞器的循環(huán)基因組中成為一個(gè)完整的部分。得到的植物將不能將新導(dǎo)入的轉(zhuǎn)基因的新特性傳遞給任何緊密相關(guān)的種屬。
本發(fā)明通過下面的實(shí)施例進(jìn)一步進(jìn)行描述。這些實(shí)施例為了幫助理解本發(fā)明,并不能視為其限制條件。
上下引用的文獻(xiàn)在此一并作為參考。
實(shí)施例I通過蛋白反式剪接在大腸桿菌中產(chǎn)生功能性的除草劑抗性乙酰乳酸合酶在此實(shí)施例中,我們說明了一種斷裂基因的方法,該基因編碼大腸桿菌乙酰乳酸合酶II(ALSII;EC 4.1.3.18;乙酰醇酸合酶),通過與編碼Ssp DnaE intein序列的融合(Evans等,生物化學(xué)雜志J.Biol.Chem.2759091-9094(2000);Scott等,pro.Natl.Acad.Sci.USA,9613638-13643(1999))具有了除草劑抗性變異性(Yadav等,Proc.Natl.Acad.Sci.USA,834418-4422(1986);Hill等,生物化學(xué)雜志J.Bio chem,335653-661(1998))。我們能夠經(jīng)過在細(xì)菌大腸桿菌ER2744(fhuA2 glnV44el4-rfbD1?relA1?endA1 spoT1?thi-1Δ(mcrC-mrr)114::IS10 lacZ::T7gene1)(圖5)中的蛋白反式剪接重建功能活性的ALSII酶。首先,我們顯示如何根據(jù)序列和結(jié)構(gòu)同源性的分析,在乙酰乳酸合酶II基因中選擇潛在的斷裂位點(diǎn)。然后我們顯示了如何設(shè)計(jì)和進(jìn)行試驗(yàn)以分析斷裂的ALS蛋白的蛋白反式剪接活性,和如何分析重組ALS的酶活性。我們說明了從兩個(gè)獨(dú)立質(zhì)粒載體產(chǎn)生的ALS融合蛋白的兩個(gè)部分,經(jīng)過反式剪接以產(chǎn)生一個(gè)成熟蛋白的期望大小的蛋白產(chǎn)物。此外,斷裂ALS基因片段的共表達(dá)使大腸桿菌ER2744具有了對(duì)除草劑的抗性。這種方法可以應(yīng)用于使用反式剪接inteins的任何目的蛋白的生產(chǎn)。
1.野生型大腸桿菌ALSII克隆及其除草劑抗性突變體第一步是克隆野生型ALSII,產(chǎn)生一個(gè)除草劑抗性的ALSII突變體,其攜帶丙胺酸26至纈氨酸的替代(Yadav等,Proc.Natl.Acad.Sci.USA,834418-4422(1986);Hill等,生物化學(xué)雜志Biochem.J.,335653-661(1998))。含有一個(gè)酶活性拷貝ALSII的大腸桿菌株MI162是從CGSC,E.coli Genetic Stock Center(耶魯大學(xué),New Haven,CT)獲得的?;蚪MDNA采用QIAamp組織試劑盒(Qiagen,Inc.,Studio City,CA)從大腸桿菌株MI162中提取。采用引物5’-GGACGGGGAACTAACTATG-3’(SEQ IDNO1),和5’-CCACGATGACGCACCACGCG-3’(SEQ ID NO2)和VentDNA聚合酶(New England Biolabs,Beverly,MA)對(duì)大腸桿菌DNA樣品進(jìn)行DNA聚合酶鏈?zhǔn)椒磻?yīng)(PCR),以克隆全長ALSII。編碼ALSII的序列進(jìn)一步采用引物5’-GGAGGGGGCATATGAATGGCGCACAGTGGG-3’(SEQ ID NO3),和5’-GGGGGGTCATGATAATTTCTCCAAC-3’(SEQ ID NO4)擴(kuò)增,并克隆進(jìn)pTYB1質(zhì)粒(New England Biolabs,Beverly,MA)的NdeI和PstI位點(diǎn)中,建立一個(gè)載體,pALSII。通過從pALSII中去掉一個(gè)3kb的非必需序列得到一個(gè)更短的結(jié)構(gòu),pTYBT-ALSII,即用PmeI和BstZ172限制性消化,然后自身連接。除草劑抗性變異性,丙胺酸26至纈氨酸,通過采用Quickchange Site-Directed Mutagenesis試劑盒(Stratagene,La Jolla,CA)的位點(diǎn)定向誘變引入pTYBT-ALSII中。誘變的引物是5’-CCGGGTGGCGTAATTATGCCGGTTTACG-3’(SEQ ID NO5)和5’-CGTAAACCGGCATAATTACGCCACCCGG-3’(SEQ ID NO6)。通過部分NdeI和PstI消化pTYBT-ALSIIm產(chǎn)生的編碼突變ALSII(ALSIIm)的序列與pTYB1連接產(chǎn)生一個(gè)ALSIIm表達(dá)載體,pALSIIm。
2.斷裂位點(diǎn)的選擇在任何基因內(nèi)識(shí)別一個(gè)合適斷裂位點(diǎn)的一個(gè)優(yōu)選方法是,分析一個(gè)蛋白家族的序列同源性并檢查其蛋白結(jié)構(gòu)或其同源物的結(jié)構(gòu)(Ibdah等,Biochemistry,3516282-16291(1996))。序列排列和結(jié)構(gòu)比較發(fā)現(xiàn)細(xì)菌、酵母和更高等植物的ALS基因具有高度保守的區(qū)域(圖6,這里僅顯示部分序列排列)。而且,在蛋白中存在高度可變區(qū),如在大腸桿菌乙酰乳酸合酶的異構(gòu)體II中(圖6)中,氨基酸殘基Q327和C328周圍的區(qū)域。與其他同源物相比,大腸桿菌ALSII在此區(qū)具有一個(gè)10個(gè)氨基酸的缺口,來自不同種屬的ALS基因間在側(cè)向序列上有較少的同源性(圖6)。而且,同源物,丙酮酸氧化酶的晶體結(jié)構(gòu)分析提示,Q327和C328似乎定位于兩個(gè)分子內(nèi)區(qū)的連接子結(jié)構(gòu)中,遠(yuǎn)離催化核心(Ibdah等,生物化學(xué)Biochemistry,3516282-16291(1996))。因此我們推測,ALSII在此區(qū)通過一個(gè)intein的斷裂可能保留必要的彈性,允許進(jìn)行有效的蛋白反式剪接。另外,一個(gè)外源蛋白序列插入至此位點(diǎn)對(duì)ALSII的催化區(qū)結(jié)構(gòu)及其酶活性影響較小或沒有影響。因此氨基酸殘基Q327和C328被選作大腸桿菌ALSII的斷裂位點(diǎn)之一(圖6,由箭頭指示)。
3.大腸桿菌檢測系統(tǒng)大腸桿菌乙酰乳酸合酶的異構(gòu)體II具有Ala26Val突變,稱為ALSIIm,使大腸桿菌株ER2744具有對(duì)磺酰脲類除草劑(SU),如甲基sulfometuron(SM)的抗性。大腸桿菌ER2744株被用作檢測除草劑抗性大腸桿菌ALSII基因活性的體內(nèi)模型系統(tǒng),通過在Q327和C328間的連接子插入進(jìn)行基因修飾。大腸桿菌ER2744來源于野生型大腸桿菌K12,后者含有活性ALSI和ALSIII酶,但沒有活性ALSII。ALSI和ALSIII是大腸桿菌中ALS基因的兩個(gè)異構(gòu)體,對(duì)纈氨酸、異亮氨酸和亮氨酸的合成很重要(LaRossa和Schloss,生物化學(xué)雜志J.Biol.Chem.2598753-8757(1984))。它們的活性對(duì)纈氨酸反饋抑制敏感。因此,用100μg/ml纈氨酸(Sigma,St.Louis,MO)飽和生長培養(yǎng)基,ALSI和III將被抑制,細(xì)胞將停止生長。通過在大腸桿菌細(xì)胞中導(dǎo)入一個(gè)重組除草劑抗性ALSII(ALSIIm),因?yàn)锳LSII對(duì)纈氨酸的抑制有抵抗力,可以挽救它們的生長。
4.產(chǎn)生一個(gè)修飾的除草劑抗性ALS基因Inteins經(jīng)常需要某些氨基酸殘基排在其N-和C-端側(cè)面以達(dá)到最佳的剪接或反式剪接活性。例如,當(dāng)5個(gè)天然殘基存在于其N-和C-端時(shí),來自集胞藻屬PCC6803的dnaE基因的intein有效地剪接,而去除這些殘基則不同程度的抑制剪接活性(Evans等,生物化學(xué)雜志J.Biol.Chem.2759091-9094(2000))。在剪接結(jié)合點(diǎn)處包含這些最佳的氨基酸殘基可能是精細(xì)的剪接活性所需要的。因而得到的產(chǎn)物可在兩個(gè)蛋白序列的連接結(jié)合點(diǎn)處含有這些殘基。因此,對(duì)于每個(gè)intein插入點(diǎn),必須評(píng)價(jià)是否這些額外的氨基酸殘基將對(duì)產(chǎn)物的活性具有負(fù)面作用。
ALSIIm-14通過在Q327和C328A之間將一個(gè)合成的DNA連接子(NewEngland Biolabs,Beverly,MA)插入編碼ALSIIm的序列中而構(gòu)建,該連接子編碼下面14個(gè)氨基酸殘基(NH2-LEKFAEYCFNKSTG-COOH(SEQ ID NO7))。ALSIIm-14的除草劑抗性用表達(dá)ALSIIm-14蛋白的質(zhì)粒轉(zhuǎn)化的大腸桿菌ER2744宿主細(xì)胞進(jìn)行檢測。用表達(dá)野生型ALSII和除草劑抗性ALSII(ALSIIm)的質(zhì)粒轉(zhuǎn)化的大腸桿菌ER2744細(xì)胞被用作對(duì)照。
平板檢測被用來檢查ALSIIm-14從纈氨酸(100μg/ml)或纈氨酸加除草劑SM(50μg/ml,Supelco Park,Bellefonte,PA)飽和的M9限制性培養(yǎng)平板(Sambrook等,(1989))中挽救大腸桿菌ER2744的能力。M9培養(yǎng)基含有2μg/ml硫胺素、2mMMgSO4、0.1mM CaCl2、0.2%葡萄糖、50μg/ml卡那霉素、100μg/ml氨芐青霉素和0.3mM IPTG。為了進(jìn)行平板實(shí)驗(yàn),100μl 25mg/ml的纈氨酸加或不加50μl 25μg/ml的甲基Sulfometuron(SM)分散于M9選擇平板上。為了檢測細(xì)菌的生長,過夜培養(yǎng)物在有或沒有纈氨酸和/或SM的M9平板上劃痕。平板在各種溫度下孵育(如圖7指示)48到72小時(shí),然后照相。在添加纈氨酸的平板上,表達(dá)ALSII,ALSIIm或ALSIIm-14的細(xì)胞能夠生長(圖7-a)。但是,當(dāng)纈氨酸和SM都應(yīng)用時(shí),只有表達(dá)除草劑抗性ALSIIm或ALSIIm-14的菌株可以生長(圖7-b)。這些體內(nèi)結(jié)果表明,在建議的斷裂位點(diǎn)插入了14個(gè)氨基酸殘基的ALSIIm,可以使大腸桿菌ER2744在纈氨酸和SM的存在下生長。因此,ALSIIm-14是有功能活性的,插入14個(gè)氨基酸不影響其酶活性。
5.ALSII-Intein融合基因的構(gòu)建下一步,大腸桿菌ALSIIm基因被分割,并在結(jié)構(gòu)上融合到Ssp DnaE intein編碼區(qū)的N-和C-末端部分。融合基因采用兩個(gè)相容的大腸桿菌表達(dá)載體——pMEB10和pKEB1來產(chǎn)生,兩者能夠在同一個(gè)大腸桿菌宿主細(xì)胞內(nèi)共表達(dá)兩種intein融合基因,如以前Evans等所描述的(生物化學(xué)雜志J.Biol.Chem.2759091-9094(2000))。編碼除草劑抗性ALSII(ALSIIM)基因N-末端片段327個(gè)氨基酸的DNA序列在結(jié)構(gòu)上與Ssp DnaE intein N-末端側(cè)面7個(gè)氨基酸殘基的編碼區(qū)融合,后接intein N-末端的123個(gè)氨基酸殘基(INn)(圖5)。編碼ALSIIm C-末端221個(gè)氨基酸殘基的DNA序列在結(jié)構(gòu)上與編碼Ssp DnaE intein C-末端36個(gè)氨基酸殘基(INc)和intein C-末端側(cè)面7個(gè)氨基酸殘基的DNA序列融合(圖5)。ALSII N-末端片段用引物5’-GGGGGTCATGAATGGCGCACAGTGGG-3’(SEQ ID NO10)和5’-GCGCGCTCGAGTTGATTTAACGGCTG CTGTAATG-3’(SEQ ID NO11)從pALSIIm中擴(kuò)增。擴(kuò)增片段被消化并克隆進(jìn)pMEB16的NcoI和XhoI位點(diǎn)中,pMEB16含有編碼Ssp DnaE intein N-末端123個(gè)氨基酸殘基的序列。得到的載體pEA(N)表達(dá)一個(gè)由ALSIIm N-末端片段和DnaE N-末端片段(ALSIIm(N)-INn)組成的融合蛋白。ALSII C-末端片段用引物5’-GCGCGACCGGTTGTGACTGGCAGCAACACTGC-3’(SEQ ID NO12)和5’-GGGGGGCTGCAGTCATGATAATTTCTCCAAC-3’(SEQ ID NO13)擴(kuò)增。片段用AgeI和PstI消化然后克隆進(jìn)pMEB9的AgeI和PstI位點(diǎn)。得到的質(zhì)粒pEA(C)表達(dá)一個(gè)由Ssp DnaE intein C-末端片段和ALSII C-末端片段(ALSIIm(C)-INc)組成的融合蛋白。一個(gè)含ALSIIm(C)-Inc融合基因的1kb XbaI-PstI片段從pEA(C)中亞克隆進(jìn)pKEB1質(zhì)粒的XbaI和PstI位點(diǎn)中,以形成一個(gè)卡那霉素抗性的表達(dá)載體pKEC3。
當(dāng)pEA(N)和pKEC3在大腸桿菌ER2744中共表達(dá)時(shí),預(yù)測兩種融合蛋白的反式剪接將導(dǎo)致大腸桿菌ALSIIm兩個(gè)斷裂部分的連接,在連接結(jié)合處有14個(gè)氨基酸。
6.蛋白反式剪接活性的評(píng)定為確定ALSII-DnaE intein融合蛋白是否能夠在大腸桿菌細(xì)胞中反式剪接以產(chǎn)生ALSIIm-14,用ALSII N-或C-末端片段特異性兔抗血清進(jìn)行Western斑點(diǎn)雜交。
收集兩種分別對(duì)抗來源于ALSII N-末端區(qū)和C-末端區(qū)肽的兔抗血清(COVANCE)。這兩種肽是1)來自ALSII N-末端序列(氨基酸殘基Ala4至Tyr23)的NH2-CAQWVVHALRAQGVNTVFGYG-COOH(SEQ ID NO8)和2)來自ALSII C-末端序列(氨基酸殘基Val 530V至Ser548)的NH2-CVWPLVPPGASNSEMLEKLS-COOH(SEQ ID NO9)。一個(gè)單獨(dú)的細(xì)菌菌落接種于加有100μg/ml氨芐青霉素的LB培養(yǎng)基中37℃孵育4小時(shí)。然后加入IPTG至終濃度0.3mM進(jìn)行誘導(dǎo)。細(xì)胞在15℃繼續(xù)培養(yǎng)2-16小時(shí)。移出20μl細(xì)胞培養(yǎng)物,與3×SDS負(fù)載緩沖液(New England Biolabs,Beverly,MA)混合,煮沸5分鐘,取2μl加于12%Tris-甘氨酸凝膠(Novex,San Diego,CA)上。隨后蛋白轉(zhuǎn)移至一個(gè)硝酸纖維素膜上,并用5%奶粉室溫封閉1小時(shí)(Sambrook,等,分子克隆,(1989))。采用抗血清(1∶20000稀釋)在1%奶粉存在下4℃過夜進(jìn)行免疫斑點(diǎn)雜交。斑點(diǎn)然后清洗3次,每次15分鐘,并與1∶10000稀釋的辣根過氧化物酶交聯(lián)的抗兔二抗室溫孵育1小時(shí)。用化學(xué)發(fā)光Western檢測試劑盒(New England Biolabs,Beverly,MA)進(jìn)行顯色。
在15℃培養(yǎng)的對(duì)照細(xì)胞中,ALSII的表達(dá)(圖8A,8B&8C,2泳道)被所有的抗體特異地別。在載有一個(gè)單一ALSII-intein融合載體和另一個(gè)賦予氨芐青霉素和卡那霉素抗性的對(duì)照載體的細(xì)胞中,僅有ALS(N)-INn或ALS(C)-INc蛋白被抗-ALS(N)或抗-ALS(C)血清檢測到(圖8A,3泳道,圖8B,4泳道)。當(dāng)ALS(N)-INn和ALS(C)-INc共同表達(dá)時(shí),如同所期望的剪接產(chǎn)物ALSIIm-14,一個(gè)60kD條帶與對(duì)抗ALSII N-末端和C-末端的抗體發(fā)生反應(yīng)(圖8A&8B,5泳道)。如所預(yù)測的,ALSIIm-14的這個(gè)條帶比天然ALSII具有稍高的分子量。數(shù)據(jù)表明在兩個(gè)ALSII-intein融合蛋白間發(fā)生了反式剪接。觀察到一個(gè)與抗-ALS(N)反應(yīng)的非特異蛋白(圖8A和圖8C,1泳道至5泳道)。
Ssp DnaE intein的反式剪接活性以前顯示是溫度敏感的(Evans等,J.Biol.Chem.2759091-9094(2000))。ALSII-Ssp DnaE intein蛋白的反式剪接溫度敏感性通過采用對(duì)抗ALSII N-末端片段的抗血清進(jìn)行western斑點(diǎn)雜交分析來確定(圖8C)。細(xì)胞被表達(dá)ALSII或ALSIIm(N)-INn和ALSIIm(C)-INc的質(zhì)粒轉(zhuǎn)化。ALSII蛋白的表達(dá)在37℃誘導(dǎo)3小時(shí)。ALSIIm(N)-INn和ALSIIm(C)-INc共同表達(dá)的誘導(dǎo)條件為37℃3小時(shí),30℃3小時(shí),25℃6小時(shí)或15℃16小時(shí)。細(xì)胞提取物用SDS樣品緩沖液處理,在95℃到100℃變性5分鐘,然后在12%SDS-PAGE上進(jìn)行凝膠電泳。用對(duì)抗ALSII N-末端片段的抗血清作為探針進(jìn)行western斑點(diǎn)雜交。圖8C包括下列樣品無ALSII的細(xì)胞(1泳道,對(duì)照),ALSII(2泳道),ALSIIm(N)-INn和ALSIIm(C)-INc(3泳道至6泳道)。細(xì)胞培養(yǎng)的溫度為1泳道至3泳道37℃,4泳道30℃,5泳道25℃,6泳道15℃。
在37℃生長的細(xì)胞中,ALSIIm-14沒有檢測到(圖8C,3泳道)。但在30℃培養(yǎng)的細(xì)胞中,觀察到剪接產(chǎn)物帶有大量N-末端融合蛋白聚集(圖8C,4泳道)。在25℃和15℃培養(yǎng)的細(xì)胞中(圖8C,5泳道和6泳道),僅檢測到剪接產(chǎn)物,表明N-末端融合蛋白完全轉(zhuǎn)變成剪接產(chǎn)物。在所有表達(dá)條件下ALSIIm(C)-INc蛋白均過量產(chǎn)生。數(shù)據(jù)顯示Ssp DnaE intein能夠介導(dǎo)N-和C-末端ALSIIm蛋白片段的反式剪接以形成ALSIIm-14。當(dāng)實(shí)驗(yàn)在37℃進(jìn)行時(shí),剪接反應(yīng)被抑制。當(dāng)細(xì)胞在15-25℃而不是30℃培養(yǎng)時(shí),剪接似乎更為有效。
7.含有斷裂ALS基因的細(xì)胞中的除草劑抗性下一步是確定剪接產(chǎn)物作為ALSIIm(ALSIIm(N)-INn和ALSIIm(C)-INc)融合蛋白反式剪接的結(jié)果,是否使大腸桿菌ER2744對(duì)纈氨酸和SM具有抗性。第一個(gè)實(shí)驗(yàn)是檢測ALSIIm(N)-INn和ALSIIm(C)-INc融合蛋白的共同表達(dá)對(duì)纈氨酸飽和的M9限制培養(yǎng)基中細(xì)胞生長的影響。在一個(gè)平板實(shí)驗(yàn)中(見第四節(jié)),所有轉(zhuǎn)化細(xì)胞在無纈氨酸的M9培養(yǎng)基中均生長良好(圖9A-a)。但在纈氨酸存在的條件下,僅有ALSII及其除草劑抗性突變體ALSIIm可以使細(xì)胞在30℃和37℃下生長(圖9A-b,9A-c)。很明顯,ALSIIm(N)-INn和ALSIIm(C)-INc的共同表達(dá)在30℃(圖9A-c)或更低的溫度(數(shù)據(jù)未顯示)下,從纈氨酸平板中挽救了細(xì)胞的生長。此外,ALSIIm或ALSIIm(N)-INn和ALSIIm(C)-INc的表達(dá)從另外的除草劑抑制中挽救了細(xì)胞的生長(圖9A-d)。而且,野生型ALSII的轉(zhuǎn)化不能從除草劑抑制中使細(xì)胞恢復(fù)生長(圖9A-d)。單獨(dú)表達(dá)ALSIIm(N)-INn或ALSIIm(C)-INc的對(duì)照細(xì)胞在纈氨酸平板中不生長(圖9A-b,9A-c);沒有與intein融合的天然ALSII N-和C-末端片段的共同表達(dá)也不能使細(xì)胞生長(圖9A-b,9A-c)。數(shù)據(jù)表明ALSIIm(N)-INn和ALSIIm(C)-INc片段的共同表達(dá)對(duì)于反式剪接和產(chǎn)生功能性的ALSII是需要的,ALSII可以使細(xì)胞在纈氨酸和除草劑抑制下生長。
進(jìn)行定量液體培養(yǎng)實(shí)驗(yàn)以證明平板實(shí)驗(yàn)獲得的結(jié)果。液體實(shí)驗(yàn)按如下進(jìn)行。將一個(gè)單菌落接種于添加了卡那霉素和氨芐青霉素的LB培養(yǎng)基中,37℃4小時(shí)。用0.3M的IPTG誘導(dǎo)表達(dá),細(xì)胞培養(yǎng)物轉(zhuǎn)換到30℃繼續(xù)培養(yǎng)2小時(shí)。然后,200μl相當(dāng)于OD6008.0的培養(yǎng)物被離心下來,用M9培養(yǎng)基清洗1次,并在200μl M9培養(yǎng)基中重懸。40μl培養(yǎng)物等分入2ml合適的培養(yǎng)基中,在測定OD600前生長24-72小時(shí)。纈氨酸的濃度為100μg/ml,SM的濃度為50μg/ml。在30℃時(shí),所有轉(zhuǎn)化細(xì)胞在M9限制培養(yǎng)基中均同樣生長良好(圖9B)。在纈氨酸飽和的M9培養(yǎng)基中,野生型ALS使細(xì)胞生長,但當(dāng)加入SM時(shí),則觀察不到生長。但是,表達(dá)ALSIIm或ALSIIm(N)-INn和ALSIIm(C)-INc共同表達(dá)使細(xì)胞在纈氨酸M9培養(yǎng)基以及含有SM的培養(yǎng)基中生長。在對(duì)照實(shí)驗(yàn)中,ALSIIm(N)-INn或ALSIIm(C)-Inc單獨(dú)表達(dá),或ALSIIm N-和ALSIIm C-末端共同表達(dá)但不與intein融合,均不能使細(xì)胞在含有纈氨酸的培養(yǎng)基中生長。這個(gè)數(shù)據(jù)與平板實(shí)驗(yàn)的結(jié)果是一致的。為了進(jìn)一步比較反式剪接介導(dǎo)的細(xì)胞生長與野生型ALSII介導(dǎo)的細(xì)胞生長的生長動(dòng)力學(xué),進(jìn)行了一個(gè)時(shí)程研究(圖9C)。數(shù)據(jù)顯示表達(dá)ALSII的細(xì)胞具有最快的生長率,其次是表達(dá)ALSIIm的細(xì)胞。與ALSII野生型表達(dá)細(xì)胞相比,轉(zhuǎn)化ALS(N)-INn和ALS(C)-INc的細(xì)胞生長速率較慢,但不顯著慢于ALSIIm表達(dá)細(xì)胞的生長速率。表達(dá)斷裂ALSII并不與intein融合的細(xì)胞,生長非常緩慢。因此,我們從平板和液體實(shí)驗(yàn)證明Ssp DnaE可以介導(dǎo)ALSII反式剪接,引起體內(nèi)功能性抗除草劑的ALSIIm-14的產(chǎn)生。
總之,數(shù)據(jù)表明從兩個(gè)不同位置產(chǎn)生的兩種ALS-intein融合蛋白,以溫度依賴的方式進(jìn)行反式剪接,形成全長的功能性的ALSIIm蛋白。具有兩種ALSIIm融合基因片段的大腸桿菌宿主細(xì)胞顯示為抗除草劑表現(xiàn)型。
實(shí)施例II大腸桿菌中一個(gè)玉米乙酰乳酸合成酶的反式剪接在這個(gè)實(shí)施例中,我們說明一個(gè)在大腸桿菌中通過蛋白反式剪接產(chǎn)生全長玉米乙酰乳酸合成酶的方法。我們說明如何根據(jù)玉米ALS基因及其大腸桿菌對(duì)應(yīng)體ALSII基因的序列同源性,在玉米ALS基因中選擇斷裂位點(diǎn)。我們顯示,當(dāng)斷裂的玉米ALS-intein融合基因共同表達(dá)時(shí),兩種融合蛋白經(jīng)過反式剪接產(chǎn)生成熟玉米ALS蛋白的期望大小的蛋白產(chǎn)物。
1.斷裂位點(diǎn)的選擇說明其他除草劑抗性基因,如玉米乙酰乳酸合成酶(cALS)基因的反式剪接是重要的,該基因的除草劑抗性突變形式已被用于對(duì)植物進(jìn)行遺傳修飾(Bernasconi等,J.Biol.Chem.27017381-17385(1995))。在任何基因內(nèi)鑒定合適的斷裂位點(diǎn)的一個(gè)優(yōu)選方法是分析來自不同生物體的同源基因的反式剪接活性。我們在實(shí)施例I中已經(jīng)描述,大腸桿菌ALSII基因,在Q327和C328之間被斷裂后能夠通過體內(nèi)Ssp DnaEintein的反式剪接活性進(jìn)行重組。進(jìn)行了大腸桿菌ALSII和玉米ALS之間的序列排列,以尋找玉米ALS基因中與大腸桿菌ALSII基因斷裂位點(diǎn)相應(yīng)的區(qū)域。結(jié)果提示絲氨酸397和蘇氨酸398與大腸桿菌ALSII的斷裂位點(diǎn)(谷氨酸327和半胱氨酸328)相匹配。將玉米ALS在絲氨酸397和蘇氨酸398之間斷裂,如星號(hào)所示(圖6),可以產(chǎn)生兩個(gè)玉米ALS-intein融合蛋白,將能精于剪接。
2.玉米ALS基因的克隆進(jìn)行逆轉(zhuǎn)錄酶聚合酶鏈?zhǔn)椒磻?yīng)(RT-PCR)以克隆玉米ALS cDNA。
用RNAqueous試劑盒(Ambion,Inc.,Texas)從玉米葉中分離總RNA。然后采用反向引物3-3(5’-AT CAGTACACAGTCCTGCCATC-3’(SEQ ID NO14))和Superscript逆轉(zhuǎn)錄酶(LTI-GIBCOBRL,Rockville,MD)將RNA用來合成第一股cDNA。然后,在被用作PCR反應(yīng)的模板之前,用RNaseH(LTI-GIBCO BRL,Rockville,MD)處理第一股cDNAs。采用Expand Long Template PCR系統(tǒng)(寶靈曼(Boehringer Mannheim),德國)進(jìn)行PCR反應(yīng)。在此反應(yīng)中使用的引物是反向引物3-3和cALS 5-4引物(5’GAGACAGCCGCCGCAACCAT-3’(SEQ ID NO15))。
一份PCR產(chǎn)物在瓊脂糖凝膠上進(jìn)行電泳,觀察到大約2kb的條帶。這個(gè)片段被克隆至TOPO 2.1載體(Invitrogen,San Diego,CA,廠商規(guī)程)中制成pCALS1。pCALS1的序列采用M13正向和反向引物證實(shí)。
3.玉米ALS-intein融合體的構(gòu)建編碼玉米ALS基因N-末端397個(gè)氨基酸殘基的DNA通過PCR進(jìn)行擴(kuò)增,采用正向引物5’-GGGCCCATATGGCCACCGCCGCCGCCGCG-3’(SEQ ID NO16),反向引物5’-GGGCCCTCGAGGCTTCCTTCAAGAAGAGC-3’;(SEQ ID NO17),和模板pCALS1(Sambrook等,分子克隆,(1989))。1.2kb的PCR產(chǎn)物被克隆進(jìn)TOPO-鈍性載體(Invitrogen,San Diego,CA廠商規(guī)程)中,產(chǎn)生TOPO-cALS(N)。然后TOPO-cALS(N)用NdeI和XhoI被消化。1.2kb消化的DNA片段從低熔點(diǎn)瓊脂糖凝膠中回收,并在結(jié)構(gòu)上與編碼Ssp DnaE intein N-末端123個(gè)氨基酸的DNA序列融合,產(chǎn)生表達(dá)cALS-intein融合蛋白N-末端,cALS(N)-IN-n,的載體(MEB10-cALS(N))。編碼玉米ALS基因C-末端241個(gè)氨基酸殘基的DNA片段被用正向引物5’-GGGCCACCGGTACATCAAAGAAGAGCTTG-3’(SEQ ID NO18),反向引物5’-GGG GCTGCATTCAGTACACAGTCCTGCCATC-3’(SEQ ID NO19),和模板pCALS4進(jìn)行PCR擴(kuò)增。0.8kb的PCR產(chǎn)物克隆進(jìn)TOPO-鈍性載體(見上述操作)中,形成TOPO-cALS(N)。然后將TOPO-cALS(N)用AgeI和PstI消化。700bp的DNA片段從低熔點(diǎn)瓊脂糖凝膠中回收,并在結(jié)構(gòu)上融合到編碼Ssp DnaE inteinC-末端36個(gè)氨基酸的DNA上,形成載體MEB9-cALS(C)。MEB9-cALS(C)進(jìn)一步被XbaI和PstI切割,釋放一個(gè)1kb的片斷。這個(gè)1kb片段克隆進(jìn)pKEB1載體中,形成一個(gè)cALS-intein C-末端融合蛋白,cALS(C)-INc,的卡那霉素抗性表達(dá)載體。同樣的額外7個(gè)氨基酸,NH2-LEKFAEY-COOH(SEQ ID NO20)和NH2-CFNKSTG-COOH(SEQ ID NO21),也分別存在于cALS-intein融合蛋白的N-和C-末端連接處。
4.玉米ALS-intein融合蛋白的反式剪接兩個(gè)在第三節(jié)描述的ALS-intein融合蛋白片斷,cALS(N)-INn和cALS(C)-INc,在實(shí)施例1第6節(jié)所描述的相同條件下,都在大腸桿菌ER2744中共同表達(dá)。進(jìn)行Western斑點(diǎn)雜交以檢測反式剪接產(chǎn)物(方法見實(shí)施例1第6節(jié))。在斑點(diǎn)上,對(duì)應(yīng)于野生型cALS大小的69kD片段(圖10A,和圖10B,2泳道)在兩種融合蛋白表達(dá)的細(xì)胞中均可檢測到,并且被特異性對(duì)抗來源于玉米ALS N-和C-末端序列兩種肽的兔抗血清所識(shí)別(圖10A和圖10B,5泳道)。也觀察到與玉米ALS N-末端抗血清反應(yīng)的非特異蛋白(圖10A,1泳道至5泳道)。用來生產(chǎn)抗體的肽是1)對(duì)應(yīng)于從賴氨酸66至丙氨酸85序列,NH2-CKGADILVESLERCGVRDVFA-COOH(SEQ IDNO22),的ALS-N肽,和2)對(duì)應(yīng)于從異亮氨酸619至酪氨酸638的序列,NH2-CIPSGGAFKDMILDGDGRTVY-COOH(SEQ ID NO23),的ALS-C肽。全長cALS在表達(dá)N-或C-末端融合蛋白的細(xì)胞中均未檢測到(圖10A和圖10B,3泳道和4泳道)。這說明同大腸桿菌ALSII一樣,斷裂的玉米ALS當(dāng)與Ssp DnaE intein融合時(shí),也能夠進(jìn)行反式剪接以產(chǎn)生全長ALS。
總之,玉米ALS基因被Ssp DnaE intein斷裂,并克隆進(jìn)兩個(gè)單獨(dú)的質(zhì)粒載體中。當(dāng)兩個(gè)融合基因載體被導(dǎo)入同一個(gè)宿主細(xì)胞并共同表達(dá)時(shí),兩個(gè)融合蛋白經(jīng)過反式剪接產(chǎn)生一個(gè)全長cALS。盡管還需要功能測試來確定植物中斷裂的玉米ALS蛋白的活性,但卻提高了將一個(gè)植物除草劑抗性或抗病基因成功分裂成兩個(gè)無活性基因片段的可能性。這兩個(gè)基因片段可以被限制在兩個(gè)單獨(dú)的細(xì)胞小區(qū)中,如葉綠體和核,或染色體上兩個(gè)不同的位置,或兩個(gè)不同的DNA載體。這種基因表達(dá)的新模式可極大地減少一個(gè)完整的活性轉(zhuǎn)基因傳播至其他種屬的可能性。
實(shí)施例III本實(shí)施例詳細(xì)描述了應(yīng)用intein斷裂a(bǔ)roA基因并重建所需蛋白活性的可行性。實(shí)驗(yàn)包括在不同位點(diǎn)斷開編碼突變體aroA基因的基因,并將編碼Ssp DnaE intein(INn)N-末端剪接區(qū)的基因融合到編碼EPSPS蛋白N-末端片段的基因上。同時(shí),編碼Ssp DnaE intein(INc)C-末端剪接區(qū)的基因融合到編碼EPSPS蛋白C-末端片段的基因上。當(dāng)融合基因被置于兩個(gè)不同的質(zhì)粒中,并在同一個(gè)細(xì)菌細(xì)胞中共同轉(zhuǎn)化和共同表達(dá)時(shí),顯示那些細(xì)菌細(xì)胞對(duì)除草劑草甘磷具有抗性。
可獲得草甘磷抗性的鼠傷寒沙門氏菌aroA基因的克隆1.質(zhì)粒pEPS#1的建立具有從C301至T變異的鼠傷寒沙門氏菌aroA基因,以豬霍亂沙門菌亞型choleraesuis細(xì)菌(ATCC No.39256)中的裝配型質(zhì)粒的形式,從American TypeCulture Center獲得。來自裝配型質(zhì)粒的被修飾的aroA基因采用引物EPSP#1(5’-GGATCCTAAGAAGGAGATATACCCATGGAATCCCTGACGTTACA-3’(SEQ ID NO24)),和EPSP#2(5’-GTCGACGCTCTCCTGCAGTTAGGCAGGCGTACTCATTC-3’(SEQ ID NO25))通過聚合酶鏈?zhǔn)椒磻?yīng)擴(kuò)增。PCR產(chǎn)物被插入質(zhì)粒LITMUS 28(New England Biolabs,Inc.,Beverly,MA)的StuI位點(diǎn)中。在轉(zhuǎn)化和質(zhì)粒制備后,測序發(fā)現(xiàn)了一個(gè)意料之外的突變(C103至G),采用Stratagene’s(La Jolla,CA)快速位點(diǎn)定向誘變試劑盒(Quick Change Site DirectedMutagenesis Kit)和引物EPSP#10(5’-GCTTTGCTCCTGGCGGCTTTACCTTGTGGTAAAACCGC-3’(SEQ ID NO26)EPSP#11(5’-GCGGITTTACCACAAGGTAAAGCCGCCAGGAGCAAAGC-3’(SEQID NO27))使之復(fù)原。對(duì)所得集落的DNA進(jìn)行測序發(fā)現(xiàn)意料外的突變已經(jīng)恢復(fù)為所期望的C。這個(gè)質(zhì)粒被命名為pEPS#8,并用作隨后的轉(zhuǎn)位連接子掃描反應(yīng)中的受體質(zhì)粒。
2.一個(gè)用于檢測aroA基因構(gòu)建物的大腸桿菌株,ER2799的描述一個(gè)大腸桿菌株從耶魯大腸桿菌儲(chǔ)存中心獲得(大腸桿菌株AB2829,CGSC#2829,ID#8215),該菌株的aroA基因從其染色體上被去除。此菌株被制成hsdR-,并命名為ER2799。由于ER2799缺失合成芳香族氨基酸所必需的aroA基因,因此它不能在M9限制培養(yǎng)基上生長。這個(gè)菌株用于檢測各種aroA基因構(gòu)建物,以觀察新的aroA基因是否能夠挽救細(xì)菌并使之在存在或不存在草甘磷的情況下,在限制性培養(yǎng)基上生長。
3.通過轉(zhuǎn)座子為基礎(chǔ)的連接子掃描發(fā)現(xiàn)斷開aroA靶基因的位點(diǎn)進(jìn)行這個(gè)實(shí)驗(yàn)的第一步是確定在5-烯醇丙酮酸基-3-phosphoshikimate合成酶(EPSPS)蛋白中的位點(diǎn),使得intein可以整體插入。整體是指完整的intein插入到完整的EPSPS蛋白中。但是,不知道EPSPS蛋白本身的哪一部分可接受額外的氨基酸殘基。因此,為了確定EPSPS蛋白何處能夠接受氨基酸插入,一項(xiàng)新的技術(shù),GPS-LS試劑盒(可從New England Biolabs,Inc.,Beverly,MA購得)被用來在整個(gè)EPSPS蛋白序列中隨機(jī)地插入5個(gè)氨基酸殘基。用隨機(jī)插入了5個(gè)氨基酸的EPSPS基因構(gòu)建一個(gè)表達(dá)質(zhì)粒文庫。該文庫轉(zhuǎn)化進(jìn)大腸桿菌株ER2799中,并應(yīng)用于含有M9限制培養(yǎng)基的平板中。ER2799缺乏aroA基因,將不能在M9限制培養(yǎng)基上生長,除非通過質(zhì)粒轉(zhuǎn)化提供了一個(gè)活性的EPSPS基因。在用文庫轉(zhuǎn)化后生長的ER2799大腸桿菌應(yīng)該含有一個(gè)EPSPS蛋白,后者在插入5個(gè)氨基酸的情況下保持活性。經(jīng)過測序以確定5個(gè)氨基酸的插入部位,在EPSPS蛋白中發(fā)現(xiàn)了42個(gè)使ER2799在M9限制培養(yǎng)平板上生長的獨(dú)特位點(diǎn)(圖15)。此外,發(fā)現(xiàn)另外19個(gè)獨(dú)特位點(diǎn)不能接受5個(gè)氨基酸的插入(圖16)。
4.轉(zhuǎn)位反應(yīng)加入6μl 20ng/μl的pEPS#8(靶DNA),1.5μl 20ng/μl的PmeI供體DNA,3μl蒸餾水,3μl 10×GPS-LS緩沖液和1.5μl Tn*ABC,在37℃混合15分鐘進(jìn)行反應(yīng)。加入1μl起始溶液,反應(yīng)在37℃孵育1小時(shí)20分鐘。通過在75℃熱滅活15分鐘終止反應(yīng)。在反應(yīng)混合物冷卻至室溫并水透析2小時(shí)后,反應(yīng)混合物通過電穿孔轉(zhuǎn)化進(jìn)新鮮制備的ER2685(fhuA2 glnV44 el4-rfbD1?relA1?endA1 spoT1?thi-1Δ(mcrC-mrr)114::IS10Δ(lacI-lacA)200 F’proA+B+lacIq D1(lacZ)M15 zzfTn10(TetR))細(xì)胞中。細(xì)胞在37℃孵育1小時(shí),然后接種在含有氨芐青霉素和卡那霉素的LB平板上。細(xì)胞繼續(xù)在37℃過夜生長。發(fā)現(xiàn)在轉(zhuǎn)化后10μl反應(yīng)混合物獲得超過10,000個(gè)菌落(足以包括所有可能的轉(zhuǎn)座子插入位點(diǎn),在pEPS#8中有2840個(gè)位點(diǎn),3.3倍)。
5.分離含有EPSPS基因加轉(zhuǎn)座子的DNA片段(3.0kb)用LB培養(yǎng)基回收從轉(zhuǎn)位反應(yīng)中得到的所有轉(zhuǎn)化體,66%的細(xì)胞加入20%甘油保存在-70℃。其余細(xì)胞在500ml含有100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB液體培養(yǎng)基中,37℃過夜生長。通過離心收獲細(xì)胞,用Qiagen Midi試劑盒(Qiagen,Studio City,CA)純化質(zhì)粒DNA(共508μg)。通過用PstI、NcoI和AhdI消化DNA(58μg)釋放出3.0kb的aroA基因-轉(zhuǎn)座子DNA片段,并在乙醇沉淀后用瓊脂糖通過凝膠純化進(jìn)行分離(回收4μg DNA)。
6.將aroA基因-轉(zhuǎn)座子3.0kb片段克隆進(jìn)pCYB3載體凝膠純化的3.0kb aroA基因-轉(zhuǎn)座子DNA片段連接進(jìn)pCYB3(5.2kb)的NcoI至PstI位點(diǎn)中,在微量透析2小時(shí)后通過電穿孔轉(zhuǎn)化進(jìn)ER2685。電穿孔的細(xì)胞在LB培養(yǎng)基中孵育1小時(shí)。250μl上述細(xì)胞懸液接種于含有100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB平板上,另外5.5ml則接種于1升含有100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB液體培養(yǎng)基中,37℃過夜生長。在aroA基因內(nèi)含有轉(zhuǎn)座子的質(zhì)粒DNA文庫用Qiagen(Studio City,CA)Midi試劑盒(750μg)分離。
7.篩選具有5個(gè)氨基酸連接子的活性文庫EPSPS蛋白105μg的文庫DNA用PmeI消化以從aroA基因中去除轉(zhuǎn)座子。這樣在轉(zhuǎn)座子差入位點(diǎn)處遺留了15個(gè)堿基(或5個(gè)氨基酸殘基)?;厥找粋€(gè)7kb片段(在400μl EB的終容積中),自身連接(在100μl rxn中從400μl 7kb片段中得到86μl),轉(zhuǎn)化(100μlrxn中的30μl)進(jìn)大腸桿菌株ER2799,并接種于LB及M9限制培養(yǎng)平板上,兩個(gè)平板中均含有100μg/ml氨芐青霉素和0.3mM IPTG。在37℃孵育過夜后,與LB平板相比,在M9限制平板上大約20%的初始細(xì)胞存活。在M9限制培養(yǎng)平板上生長的獨(dú)立菌落通過DraI消化和DNA測序進(jìn)行分析,以確定連接子在aroA基因中插入位點(diǎn)的位置。
在72個(gè)有活性的獨(dú)立集落中識(shí)別了42個(gè)不同的插入位點(diǎn),它們可以接受5個(gè)氨基酸殘基插入aroA基因中,不能在M9限制培養(yǎng)基選擇平板上生長的39個(gè)無活性集落中識(shí)別出19個(gè)不同的插入位點(diǎn)(見圖15和圖16)。質(zhì)粒pCE-5-22、pCE-5-21、pCE-5-35和pCE-5-23是有活性的集落,它們分別在182、215、235和267位置處有5個(gè)氨基酸殘基摻入進(jìn)EPSPS蛋白(aroA基因產(chǎn)物)中。這4個(gè)位點(diǎn)被選作進(jìn)一步研究。
Ssp DnaE順式和反式剪接載體的構(gòu)建1.用于順式剪接的載體pCE182DnaE、pCE215DnaE、pCE235DnaE和pCE267DnaE的建立這涉及將intein插入靶蛋白內(nèi)的位點(diǎn),后者被發(fā)現(xiàn)能夠接受5個(gè)氨基酸的插入。
4個(gè)位點(diǎn)被選擇用于進(jìn)一步研究(位點(diǎn)182、215、235和267)。全長Ssp DnaEintein被插進(jìn)這些位點(diǎn),EPSPS-intein的融合以其能夠使ER2799細(xì)胞在M9限制平板上生長而被檢測。所有4個(gè)位點(diǎn)被發(fā)現(xiàn)在M9平板上生長,表明EPSPS蛋白能夠接受intein插入這些位點(diǎn)(見圖11和圖14)。
CE182或CE215,除在182或215位點(diǎn)被去除了5個(gè)氨基酸連接子以外,是pCE-5-22或pCE-5-21的線性DNA,通過聚合酶鏈?zhǔn)椒磻?yīng)從模板pCE-5-22或pCE-5-21產(chǎn)生,采用的引物CE182為5’-GCCCCTAAAGACACAATTATTCGCG-3’(SEQ ID NO28)和5’-CAGCGGCGCCGTCATCAGCAGAGCG-3’(SEQ ID NO29),或CE215為5’-GCGAACCACCACTACCAACAATTTG-3’(SEQ ID NO30)和5’-TATCTCCACGCCAAAGGTTTTCATT-3’(SEQ ID NO31)。含有兩個(gè)天然N-extein殘基和三個(gè)天然C-extein殘基的Ssp DnaE intein基因通過PCR采用引物5’-GAATATTGCCTGTCTTTTGGT-3’(SEQ ID NO32)和5’-GTTAAAGCAGTTAGCAGCGAT-3’(SEQ ID NO33)從pMEB8(Evans等,J.Biol.Chem.,2759091(2000))擴(kuò)增。得到的PCR片段用T4多聚核苷激酶磷酸化,通過QIAquick柱(Qiagen,Inc.,Studio City,CA)純化,并分別連接進(jìn)CE182或CE215中以產(chǎn)生pCE182DnaE或pCE215DnaE。
含有4個(gè)天然N-extein殘基和三個(gè)天然C-extein殘基的Ssp DnaE intein基因通過PCR采用引物5’-TGCTGAATATTGCCTGTCTTTTGG-3’(SEQ ID NO34)和5’-CCGTTAAAGCAG TTAGCAGCGATAGC-3’(SEQ ID NO35)從pMEB8擴(kuò)增。得到的PCR片段通過QIAquick柱(Qiagen,Inc.,Studio City,CA)純化,并分別連接進(jìn)凝膠純化的、PmeI切割的pCE-5-35或pCE-5-23載體DNA中以產(chǎn)生pCE235DnaE或pCE267DnaE。
2.用于反式剪接的載體p215EN2/pEPS#28和p235EN2/pEPS#29的建立用相容的復(fù)制來源構(gòu)建了兩個(gè)質(zhì)粒。合適EPSPS蛋白的N-末端與N-末端SspDnaE剪接區(qū)(INn)的N-末端融合,并插入一個(gè)質(zhì)粒中。剩余的合適EPSPS蛋白C-末端部分與Ssp DnaE intein C-末端剪接區(qū)(INc)的C-末端融合,并插入第二個(gè)質(zhì)粒中。質(zhì)粒通過電穿孔共同轉(zhuǎn)染進(jìn)ER2799內(nèi)。在IPTG誘導(dǎo)性pTac啟動(dòng)子的控制下表達(dá)融合蛋白。轉(zhuǎn)化的細(xì)胞在M9限制性平板、液體M9限制性培養(yǎng)基或添加了草甘磷的液體M9限制性培養(yǎng)基中生長(圖11、12、13和14)。這表明當(dāng)在同一個(gè)細(xì)胞中共同表達(dá)時(shí),蛋白的兩半可以產(chǎn)生一個(gè)活性的EPSPS蛋白。
PMEB4的0.6kb XhoI至PstI片段被采用QIAquick提取試劑盒凝膠純化,并連接進(jìn)pCYB3(New England Biolabs,Inc.,Beverly,MA)載體的XhoI至PstI位點(diǎn)內(nèi)以產(chǎn)生pCEN1。在Ssp DnaE intein和殼多糖結(jié)合區(qū)(CBD)之間的NcoI位點(diǎn),經(jīng)過pCEN2的PacI和SapI消化而被去除,隨后經(jīng)過T4 DNA聚合酶處理和自身連接,產(chǎn)生質(zhì)粒pCEN2。在pTac啟動(dòng)子的控制下,這個(gè)載體含有Ssp DnaE intein(INn)N-末端的123個(gè)氨基酸殘基,并具有氨芐青霉素抗性。
通過將pCE215DnaE或pCE235DnaE的NcoI至KpnI片段連接進(jìn)pCEN2的相同位點(diǎn)構(gòu)建p215EN2或p235EN2。P215EN2或p235EN2具有與INn融合的EPSPS的N-末端(p215EN2為1-215殘基,p235為1-235殘基)。
PCYB3的NcoI至FspI片段被連接進(jìn)pKEB1的NcoI至DraI位點(diǎn)以產(chǎn)生pKEB12(NEB#1282)。在大腸桿菌株ER2566中轉(zhuǎn)化的質(zhì)粒pKEB12樣品在2000年5月23日根據(jù)布達(dá)佩斯條約的條款和條件,在美國典型培養(yǎng)物保藏中心保藏,并收到ATCC保藏號(hào)PTA-1898。這個(gè)載體含有與CBD融合的Ssp DnaE intein(INn)C-末端的36個(gè)氨基酸殘基,并具有卡那霉素抗性。
通過將pCE215DnaE和pCE235DnaE的Bg/II至PstI片段連接進(jìn)pKEB12的相同位點(diǎn)構(gòu)建pEPS#28或pEPS#29。pEPS#28或pEPS#29具有EPSPS的C-末端(pEPS#28為216-427殘基,pEPS#29為236-427殘基),取代了pKEB12中的CBD并附著于INc的C-末端。
3.EPSPS互補(bǔ)構(gòu)建物pEPS#34和pEPS#36的建立當(dāng)缺乏intein區(qū)的EPSPS蛋白片段在ER2799細(xì)胞中共表達(dá)時(shí),細(xì)胞不能在M9限制平板、液體M9限制培養(yǎng)基、或添加了草甘磷的液體M9限制性培養(yǎng)基中生長(圖12和圖13)。這表明EPSPS的活性絕對(duì)依賴于intein兩部分的存在。
編碼EPSPS蛋白N-末端1-235殘基(EPS235N)的DNA采用引物5’-GGATCCTAAGAAGGAGATATACCCATGGAATCCCTGACGTTACA-3’(SEQ IDNO36)和5’-GATATCCTGCAGTTAACCTGGAGAGTGATACTGTTGACC-3’(SEQID NO37)從pCE235DnaE通過PCR擴(kuò)增。得到的PCR產(chǎn)物采用QIAquick PCR試劑盒純化,用NcoI和PstI消化,采用QIAquick提取試劑盒從瓊脂糖凝膠中純化,并連接進(jìn)質(zhì)粒pCYB3的NcoI至PstI位點(diǎn)中,以產(chǎn)生pEPS#34。
質(zhì)粒pEPS#36是采用引物5’-GATATCCCATGGGACGCTATCTGGTCGAGGGCGATG-3’(SEQ ID NO38)和5’-GTCGACGCTCTCCTGCAGTTAGGCAGGCGTACTCATTC-3’(SEQ ID NO39),通過PCR從pC+E2擴(kuò)增編碼EPSPS C-末端236-427個(gè)殘基(EPS235C)的DNA建立的。得到的PCR產(chǎn)物采用QIAquick PCR試劑盒純化,用NcoI和PstI消化,從瓊脂糖凝膠中純化,并連接進(jìn)質(zhì)粒pKEB12的NcoI至PstI位點(diǎn)中。為了克隆的NcoI位點(diǎn),兩個(gè)額外的殘基Met-Gly也在EPS235C的N-末端摻入。
4.在位點(diǎn)235處含有順式或反式“無活性”Ssp DnaE intein的載體(pEPS#31,peps#33,peps#37)的建立有趣地是,反式剪接并不是活性所必須的,因?yàn)槿绻鸖sp DnaE intein最高度保守的催化殘基中的三個(gè)改變?yōu)楸彼幔厕D(zhuǎn)化的ER2799細(xì)胞仍然生長。這個(gè)事實(shí)表明intein可以作為親和區(qū)將兩個(gè)EPSPS intein片段帶到一起(圖12和圖13)。
含有4個(gè)天然N-extein殘基和3個(gè)天然C-extein殘基的Ssp DnaE intein基因采用引物5’-TGCTGAATATGCGCTGTCTTTTGGTACCGAA-3’(SEQ ID NO40)和5’-CCGTTAAACGCCGCAGCAGCGATAGCGCC-3’(SEQ ID NO41)通過PCR從pMEB8擴(kuò)增。得到的PCR產(chǎn)物被QIAquick柱(Qiagen Inc.,Studio City,CA)純化,并連接進(jìn)質(zhì)粒pCE-5-35的PmeI位點(diǎn)中,以產(chǎn)生pEPS#31。這個(gè)Ssp DnaE intein在催化殘基內(nèi)含有3個(gè)突變,Cys1→Ala/Cys+1→Ala/Asn159→Ala,消除了其剪接活性。
5.檢測EPSPS活性的方法EPSPS活性的平板檢測法。功能性EPSPS蛋白的存在可以用大腸桿菌株ER2799在體內(nèi)確定,該菌株缺乏內(nèi)源性活性EPSPS(見上)。ER2799細(xì)胞本身不能在M9限制性平板(添加了0.3mM的IPTG)上生長。在后面的描述中,當(dāng)提及M9限制性平板時(shí),它們也含有0.3mM IPTG。質(zhì)粒pC+E2,含具有C301至T突變的全長野生型EPSPS基因,當(dāng)通過轉(zhuǎn)化導(dǎo)入時(shí),能夠使ER2799在M9限制性平板上生長。
檢測Ssp DnaE順式剪接構(gòu)建物。質(zhì)粒pCE182DnaE、pCE215DnaE、pCE235DnaE、pCE267DnaE(每個(gè)0.05μg)通過電穿孔轉(zhuǎn)化進(jìn)大腸桿菌ER2799細(xì)胞中(Sambrook等,分子克隆實(shí)驗(yàn)室手冊,第二版,Cold Spring Harbor Laboratory,NYCold Spring Harbor Laboratory Press(1989)),見圖11。0.8ml LB培養(yǎng)基加至轉(zhuǎn)化的細(xì)胞中,并在37℃振蕩孵育1小時(shí)。200μl此溶液接種在添加了0.1mg/ml氨芐青霉素的LB或M9限制平板上(Sambrook等,分子克隆實(shí)驗(yàn)室手冊,第二版,Cold Spring Harbor Laboratory,NYCold Spring Harbor Laboratory Press(1989))。平板在不同的時(shí)間長度和不同的溫度下孵育。最常用的是在37℃過夜。
檢測Ssp DnaE反式剪接構(gòu)建物。每個(gè)EPSPS反式構(gòu)建物活性的檢測,是通過共轉(zhuǎn)化待測的構(gòu)建物進(jìn)入ER2799,并接種于含有0.3mM IPTG的M9限制平板或LB平板,兩者均添加了0.1mg/ml的氨芐青霉素和0.05mg/ml的卡那霉素。在只有一個(gè)質(zhì)粒含有EPSPS基因或一部分EPSPS基因的情況下,補(bǔ)充的抗生素抗性是通過用不含EPSPS基因的pCYB3或pKYB1(新英格蘭生物實(shí)驗(yàn)室New EnglandBiolabs,Beverly,MA)共同轉(zhuǎn)化大腸桿菌提供的。
采用的質(zhì)粒是pC+E2、p215EN2、p235EN2、pEPS#28、pEPS#29、pEPS#33、pEPS#37、pEPS#34和pEPS#36。這些質(zhì)粒采用0.1μg合適的質(zhì)粒、以各種聯(lián)合方式被共轉(zhuǎn)化進(jìn)ER2799大腸桿菌細(xì)胞中(Sambrook等,分子克隆實(shí)驗(yàn)室手冊,第二版,Cold Spring Harbor Laboratory,NYCold Spring Harbor LaboratoryPress(1989)),并接種于LB平板及M9限制培養(yǎng)基平板上,兩者均含有100μg/ml氨芐青霉素和50μg/ml卡那霉素。M9限制平板還含有0.3mM IPTG。在37℃孵育過夜或室溫下2-3天后,從每個(gè)LB平板中挑出單一集落,并在M9限制培養(yǎng)選擇平板上劃痕。所采用的聯(lián)合是WT,pC+E2和pKYB1(新英格蘭生物實(shí)驗(yàn)室NewEngland Biolabs,Beverly,MA);215NC,p215EN2和pEPS#28;215C,pEPS#28和pCYB3;235NC-死的,pEPS#33和pEPS#37;235NC,p235EN2和pEPS#29;235N,p235EN2和pKYB1;235C,pEPS#29和pCYB3;235N-215C,p235EN2和pEPS#28;和235互補(bǔ)物,pEPS#34和pEPS#36(見圖12)。
在存在和缺乏草甘磷的條件下,在液體培養(yǎng)中測定ER2799的生長。235反式構(gòu)建物草甘磷抗性的檢測采用下列質(zhì)粒組合進(jìn)行WT,pC+E2和pKYB1;215NC-死的,pEPS#33和pEPS#37;235NC,p235EN2和pEPS#29;235N,p235EN2和pKYB1;235C,pEPS#29和pCYB3;和235互補(bǔ)物,pEPS#34和pEPS#36。這些質(zhì)粒如上所述共轉(zhuǎn)化進(jìn)ER2799大腸桿菌細(xì)胞中,并接種在含100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB平板上。作為對(duì)照,pCYB3/pKYB被共轉(zhuǎn)化進(jìn)大腸桿菌株ER2744中,并接種在含100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB平板上。每次轉(zhuǎn)化均進(jìn)行預(yù)培養(yǎng),將新鮮菌落接種于添加100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB培養(yǎng)基中,30℃過夜。在缺乏或存在不同量草甘磷的條件下,等量的預(yù)培養(yǎng)物(10-11μl,根據(jù)細(xì)胞密度)被接種進(jìn)新鮮制備的含有100μg/ml氨芐青霉素、50μg/ml卡那霉素和0.3mM IPTG的M9限制培養(yǎng)基中。每個(gè)構(gòu)建物的生長用600nm處的OD值測定,見圖13。
順式235構(gòu)建物在M9液體限制培養(yǎng)基中的生長。兩個(gè)質(zhì)粒載體,一個(gè)具有能剪接的Ssp DnaE intein(235順式),另一個(gè)具有不能剪接的intein(235無活性),分別為pCE235DnaE和pEPS#31,被轉(zhuǎn)化進(jìn)不同的ER2799大腸桿菌細(xì)胞中,并接種在添加100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB平板上。每次轉(zhuǎn)化均進(jìn)行預(yù)培養(yǎng),將新鮮菌落接種于添加100μg/ml氨芐青霉素和50μg/ml卡那霉素的LB培養(yǎng)基中,30℃過夜。等量的預(yù)培養(yǎng)物(10-11μl,根據(jù)細(xì)胞密度)被接種進(jìn)新鮮制備的含有100μg/ml氨芐青霉素、50μg/ml卡那霉素和0.3mM IPTG的M9限制培養(yǎng)基中。在不同時(shí)間用600nm處的OD值確定細(xì)胞的密度(見圖14)。
pEPS#31的NcoI至KpnI片段被連接進(jìn)質(zhì)粒pCEN2的相同位點(diǎn),以產(chǎn)生pEPS#33。質(zhì)粒pEPS#37通過將pEPS#31的Bg/II至PstI片段克隆進(jìn)質(zhì)粒pKEB12中的相同位點(diǎn)而建立。
實(shí)施例IV兩種不相關(guān)基因產(chǎn)物氨基糖苷-3-乙?;D(zhuǎn)移酶(aadA)和可溶性修飾的綠色熒光蛋白(smGFP)的反式剪接,以在大腸桿菌內(nèi)產(chǎn)生一個(gè)功能性雜交蛋白氨基糖苷-3-乙?;D(zhuǎn)移酶基因與Ssp DnaE intein N-片斷(INn)融合。Ssp DnaEintein的C-末端(INc)與smGFP基因融合。融合蛋白可以從各自的構(gòu)建物中翻譯成為獨(dú)立的多肽。這些融合蛋白的編碼DNA序列被克隆進(jìn)pIH976(圖17)或pAGR3(圖18)質(zhì)粒中。兩種質(zhì)粒(pIHaadE-N(pIH976含有aadA和INc末端)和pAGRE-CsmGFP(pAGR3含有INc和smGFP))被共轉(zhuǎn)化進(jìn)大腸桿菌(圖19A)。轉(zhuǎn)化的大腸桿菌具有壯觀霉素/硫酸鏈霉素抗性(圖19B)。細(xì)胞提取物在生長16小時(shí)后制備。提取物中的蛋白在SDS tris甘氨酸凝膠上分離,并點(diǎn)樣于PVDF膜上。此膜用抗GFP單克隆抗體探測。反式剪接在兩種質(zhì)粒都被導(dǎo)入的大腸桿菌提取物中觀察到。作為反式剪接的結(jié)果,融合產(chǎn)物具有與計(jì)算的兩種蛋白的累計(jì)質(zhì)量相同的分子量(圖19C)。
下面的方案描述了基因盒的產(chǎn)生,pIHaadE-N(與編碼INn的DNA融合的氨基糖苷-3-乙?;D(zhuǎn)移酶基因),pAGRE-CsmGFP(編碼INc的DNA與smGFP基因融合),Western斑點(diǎn)雜交和檢測。
聚合酶鏈?zhǔn)椒磻?yīng)被用來將開放的閱讀結(jié)構(gòu)(ORFs)克隆成所期望的質(zhì)粒。反應(yīng)在有2單位VentDNA聚合酶的50μl總體積中含有添加了2mM硫酸鎂的VentDNA聚合酶緩沖液、200μM dNTPs、每個(gè)引物各1μM和100ng質(zhì)粒DNA。采用Perkin-Elmer gene amp PCR 2400系統(tǒng)(Emeryville,CA)進(jìn)行10到20個(gè)周期的擴(kuò)增。下面的引物用于aadA基因的擴(kuò)增(aadA正向引物GCCTTAATTAACCATGAGGGAAGCGGTGATCGCCG(SEQ ID NO47),aadA反向引物TGCGGTCGACTTTGCCGACTACCTTGGTGATCTC(SEQ ID NO48)。PCR產(chǎn)物用Qiagen(Valencia,CA)的PCR純化試劑盒(QIAquick PCR pruification)純化。純化的PCR產(chǎn)物用PacI和SalI限制性酶消化,并克隆進(jìn)pNEB193(New EnglandBiolabs,Inc.,Beverly,MA)質(zhì)粒中。含有aadA基因的克隆被命名為pNEBaad3。相似的步驟,采用特異引物(smGFP正向引物CCCAAGCTTGGCGCCATGAGTAAAGGAGAAGAACTTTTCAC(SEQ ID NO49)和smGFP反向引物GCGACCGGTTTATTTGTATAGTTCATCCATGCCATG(SEQ ID NO50)用于smGFP基因的擴(kuò)增,并克隆進(jìn)pLITMUS28(New England Biolabs,Inc.,Beverly,MA)。含有smGFP基因的克隆被命名為psmGFP7。aadA和smGFP基因的序列都通過DNA測序證實(shí)。
來自集胞藻屬PCC6803 dnaE基因的intein被PCR擴(kuò)增。Intein的氨基末端部分(氨基酸1-123)被稱為INn,羧基末端被稱為INc(氨基酸124-159)。INn和INc片段被分別克隆進(jìn)pLITMUS28和pNEB193中。擴(kuò)增INn和INc的引物對(duì)如下(INn正向引物AGGGAATTCGTCGACAAATTTGCTGA ATATTGCCTGTCT(SEQ IDNO51),INn反向引物GGCCTCGAGTTATTTAATTGTCCCAGCGTCAAGTAATG(SEQ ID NO52),INc正向引物AGCTTTGTTTAAACCATGGTTAAAGTTATCGGTCGTAGATC(SEQ ID NO53),INc反向引物CAGCGTCGACGGCGCCGTGGGATTTGTTAAAGCAGTTAGCAGC(SEQ IDNO54)。含有INn和INc片段的質(zhì)粒分別是pLitDnaE-N1和pNEBDnaE-C2。
Intein片段和aadA或smGFP基因產(chǎn)物的融合構(gòu)建物以下述方法制備來自pNEBaad3的BamHI和SalI片段(800bp)被連接進(jìn)BamHI-SalI消化的pLitDnaE-N1,以產(chǎn)生pAEN1。以相似的方式,150bp的插入物(用PstI和KasI消化的pNEBIN-c)被連接進(jìn)PstI和KasI消化的pLitSmGFP5,以產(chǎn)生pGFPEC。質(zhì)粒pAEN含有在結(jié)構(gòu)上有INn的aadA基因,pGFPEC含有在結(jié)構(gòu)上有INc的smGFP基因。
融合基因被PCR擴(kuò)增,并克隆進(jìn)大腸桿菌表達(dá)載體中。pAEN和pGFPEC的插入物被克隆進(jìn)pIH976(NcoI和SacI位點(diǎn))和pAGR3(EcoRI和SacII位點(diǎn))載體中。引物如下(aadA-INn的正向引物CATGCCATGGGGGAAGCGGTGATCGCCGAAG(SEQ ID NO55),aadA-INn的反向引物ACGCGAGCTCTTATTTAATTGTCCCAGCGTCAAGTAATG(SEQ IDNO56),INc-smGFP的正向引物CGAATTCTATGGTTAAAGTTATCGGTCGTAGATC(SEQ ID NO57),INc-smGFP的反向引物AGCCCGCGGTTATTTGTATAGTTCATCCATGCCATG(SEQ ID NO58))。在宿主Ptac啟動(dòng)子的控制下,大腸桿菌表達(dá)質(zhì)粒是pIH976-aadE-N和pAGR-Nc-smGFP。兩種質(zhì)粒各自或一起被轉(zhuǎn)化進(jìn)大腸桿菌ER1992(New England Biolabs,Inc.,Beverly,MA)中,并接種于LB瓊脂-氨芐青霉素平板以及LB瓊脂氨芐青霉素和壯觀霉素平板上。
為了進(jìn)行western斑點(diǎn)雜交,大腸桿菌細(xì)胞提取物與含1mM DTT的SDS上樣染料混合,在95℃煮沸5分鐘,并裝載在10%-20%的Tris-甘氨酸-SDS梯度凝膠上。蛋白在Immobilin-P膜上形成斑點(diǎn),并用抗GFP單克隆抗體(Roche MolecularBiochemicals,Indianapolis,IN)探測,然后進(jìn)行GFP和aadA-GFP融合蛋白的化學(xué)發(fā)光檢測。
實(shí)施例V為反式剪接兩種不相關(guān)的基因產(chǎn)物,氨基糖苷-3-乙?;D(zhuǎn)移酶(aadA)和可溶性修飾的綠色熒光蛋白(smGFP),了在大腸桿菌中應(yīng)用植物啟動(dòng)子以產(chǎn)生一個(gè)功能性雜交蛋白上述DNA片段在葉綠體特異啟動(dòng)子PpsbA(SEQ ID NO59)的下游被克隆。相同基因的終止序列(TpsbA(SEQ ID NO60)置于被克隆基因的下游。兩個(gè)基因以相反的方向表達(dá)以避免讀穿。植物啟動(dòng)子在轉(zhuǎn)化進(jìn)大腸桿菌時(shí)是有功能性的,反式剪接的產(chǎn)物(aadA-smGFP融合蛋白,57kDa)采用抗GFP抗體在Western斑點(diǎn)實(shí)驗(yàn)中被觀察到。因此葉綠體特異啟動(dòng)子在大腸桿菌中是功能性的,能夠用作基因表達(dá)研究。
下面的方案描述了一個(gè)大腸桿菌/植物穿梭載體(pNCT114/pNCT224)的產(chǎn)生,它能夠在體內(nèi)進(jìn)行相似的轉(zhuǎn)基因再結(jié)合。
一個(gè)穿梭載體包括可使其在大腸桿菌和植物細(xì)胞中都具有功能的元件。質(zhì)粒pLITMUS28(New England Biolabs,Inc.,Beverly,MA)是pNCT114和pNCT224基因靶向載體的主鏈。載體DNA至少包括(1)兩個(gè)與質(zhì)體基因組同源的DNA序列(也指靶序列/片段),(2)一個(gè)或多個(gè)啟動(dòng)子元件,(3)轉(zhuǎn)錄終止元件,和(4)一個(gè)或多個(gè)選擇性/藥物抗性(非致命性的)的標(biāo)記基因。
啟動(dòng)子元件(PpsbA)DNA序列用PCR從基因組DNA中擴(kuò)增,該基因組是按Murray和Thompson(核酸研究Nucleic Acids Res.,84321-4325(1980))所述,采用CTAB方法從7天的老煙苗中提取的。擴(kuò)增使用的引物如下(PpsbA正向引物AACTGCAGGAATAGATCTACATAC ACCTTGG(SEQ ID NO64),PpsbA反向引物CCGCTCGAGCTTAATTAAGGTAAAATCTT GGTTTATTTAATC(SEQ ID NO65))。同樣,終止子序列(TpsbA)通過PCR擴(kuò)增并克隆。用于擴(kuò)增的引物如下(TpsbA正向引物GCGACCGGTGATCCTGGCCTAGTCTATAGGAGG(SEQ ID NO66),TpsbA反向引物AGGCCTAGGAGAATACTCAATCATGAATAAATGC(SEQ ID NO67)。具有psbA啟動(dòng)子和終止子DNA序列的載體使基因可以被克隆進(jìn)這些引物之間以表達(dá)蛋白。靶向DNA序列被擴(kuò)增并以側(cè)向的方式插入啟動(dòng)子和終止子外(圖20),因而在預(yù)先確定的位置促使轉(zhuǎn)基因的同源性再結(jié)合。pNCT114含有16SrDNA-trnaV和rps7/12靶向序列(SEQ ID NO61),而pNCT224則含有orf228-ssb作為左側(cè)邊界,orf1244作為右側(cè)邊界(SEQ ID NO62)。下列引物用于靶向序列的PCR擴(kuò)增。
pNCT114的引物左邊界正向引物TTGGCGCGCTTGACGATATAGCAATTTTGCTTGG(SEQ ID NO68)左邊界反向引物TTGCGTACGATTTATCTCAGATTAGATGGTCTAG(SEQ ID NO69)右邊界正向引物TTGCCTAGGCGTATTGATAATGCCGTCTTAACCAG(SEQ ID NO70)右邊界反向引物AGGGGTACCGAATTCAAGATTCTAGAGTCTAGAG(SEQ ID NO71)pNCT224的引物左邊界正向引物TTGGCGCGCAATTCACCGCCGTATGGCTGACCGG(SEQ ID NO72)左邊界反向引物TTGCGTACGCCTTTGACTTAGGATTAGTCAGTTC(SEQ ID NO73)右邊界正向引物TTGCCTAGGGTCGAGAAACTCAACGCCACTATTC(SEQ ID NO74)右邊界反向引物AGGGGTACCATCACGATCTTATATATAAGAAGAAC(SEQ ID NO75)pNCT114/224的詳細(xì)圖式見圖20A。兩個(gè)質(zhì)粒都含有兩個(gè)啟動(dòng)子和兩個(gè)終止子DNA片段。為了定向克隆,摻入了獨(dú)特的限制性酶切位點(diǎn)。質(zhì)粒pNCT114和pNCT224具有獨(dú)特的限制性酶切位點(diǎn)(PmeI-AgeI和PacI-XhoI位點(diǎn))。來自pAEN質(zhì)粒(aadA基因在結(jié)構(gòu)上具有INn)的插入物通過用PacI-XhoI消化獲得,通過用PmeI-AgeI消化獲得pGFPEC(smGFP在結(jié)構(gòu)上具有INc)的插入物,隨后連接進(jìn)pNCT114或pNCT224。質(zhì)粒被命名為p115ag和p225ag(圖21A)。質(zhì)粒被轉(zhuǎn)化進(jìn)大腸桿菌并用氨芐青霉素和壯觀霉素篩選(圖21B)。從過夜的培養(yǎng)物中制備細(xì)胞提取物,在10-20%Tris-甘氨酸-SDS梯度凝膠中分離。蛋白點(diǎn)樣在Immobilin-P膜上,并用抗GFP單克隆抗體(Roche Molecular Biochemicals,Indianapolis,IN)探測,然后進(jìn)行GFP和aadA-GFP融合蛋白的化學(xué)發(fā)光檢測。
實(shí)施例VI從整合進(jìn)分子DNA的DNA盒中表達(dá)的EPSPS和ALS基因產(chǎn)物在植物細(xì)胞漿中的順式剪接將DNA導(dǎo)入植物細(xì)胞核可用多種不同的方法實(shí)現(xiàn),如,電穿孔、聚乙二醇介導(dǎo)、土壤桿菌介導(dǎo)、微注射和biolistic轉(zhuǎn)化。依照本發(fā)明,應(yīng)該確定是否植物細(xì)胞漿將以順式或反式介導(dǎo)蛋白質(zhì)的剪接。這在植物中對(duì)于進(jìn)一步的反式剪接技術(shù)是必備條件。如果靶蛋白為獲得活性需要特異的細(xì)胞漿修飾,這種技術(shù)就有用處了。上述每一項(xiàng)技術(shù)都可用于將EPSPS和/或ALS基因盒導(dǎo)入煙草或其他合適的植物組織或細(xì)胞中。一般的基因盒包括(1)藥物選擇/退化標(biāo)記基因,如卡那霉素或其他任何合適的選擇標(biāo)記物;(2)一個(gè)強(qiáng)啟動(dòng)子元件如35sCMV(花椰菜花葉病毒);和(3)土壤桿菌的右和左邊界T DNA重復(fù)區(qū)。這樣的基因盒可通過biolistic過程或土壤桿菌介導(dǎo)的基因轉(zhuǎn)移導(dǎo)入植物中(Horsch等,Science 2271229-1231(1985))。該基因盒以pBI121基因轉(zhuǎn)移載體(Jefferson等,EMBO J.,63901-3907(1987))為基礎(chǔ)。最終基因盒的設(shè)計(jì)圖示于圖22中。
在biolistic過程中,待轉(zhuǎn)化的DNA被包被在精細(xì)金微粒的表面,通過一個(gè)粒子加速槍(PDS 1000/He gun,Biorad,Richmond,CA)導(dǎo)入植物細(xì)胞內(nèi)。對(duì)于土壤桿菌介導(dǎo)的基因轉(zhuǎn)移,待轉(zhuǎn)化的DNA盒被導(dǎo)入細(xì)菌中。載有基因盒的土壤桿菌與一個(gè)圓盤或來自煙草或其他合適植物葉子的組織切片接觸。這加速了DNA基因盒向植物細(xì)胞核的轉(zhuǎn)移。在上述的任何方法中,DNA最終整合進(jìn)植物細(xì)胞核中。假設(shè)的轉(zhuǎn)化細(xì)胞被用作標(biāo)記基因(藥物)選擇。在選擇藥物存在的情況下再生的植物是強(qiáng)有力的轉(zhuǎn)基因侯選物。在植物成熟后,制備細(xì)胞提取物,與含1mM DTT的SDS上樣染料混合,在95℃煮沸5分鐘,并裝載于10-20%的Tris-甘氨酸-SDS梯度凝膠上。分離的蛋白點(diǎn)樣在Immobilin-P膜上,并用抗ALS或抗EPSPS抗體探測。然后可進(jìn)行PCR以確定基因是否以預(yù)期的方式被整合而沒有發(fā)生重排。
這種技術(shù)對(duì)于需要在細(xì)胞漿環(huán)境中進(jìn)行特異修飾以獲得活性/重疊的蛋白是有用的。一部分具有必要的轉(zhuǎn)運(yùn)信號(hào)和剪接元件的靶蛋白基因?qū)⒈恢糜谝粋€(gè)細(xì)胞器中,以便以前體多肽的方式進(jìn)行細(xì)胞漿轉(zhuǎn)運(yùn)。
使這些植物在溫室中生長至其成熟,并收集種子。然后將收集的種子發(fā)芽,F(xiàn)1代植物檢測除草劑抗性。可進(jìn)行一個(gè)小規(guī)模的試驗(yàn)看是否導(dǎo)入的轉(zhuǎn)基因的分離模式遵循孟德爾的遺傳模式。整合進(jìn)核DNA將產(chǎn)生孟德爾遺傳,而整合進(jìn)葉綠體DNA將產(chǎn)生非孟德爾母系遺傳。
實(shí)施例VII斷裂基因,如EPSPS/ALS或兩種不相關(guān)的基因產(chǎn)物,如氨基糖苷-3-乙?;D(zhuǎn)移酶(aadA)和可溶性修飾的綠色熒光蛋白(smGFP),的反式剪接,以在植物葉綠體中產(chǎn)生一個(gè)功能性雜交蛋白這些實(shí)驗(yàn)的目的是調(diào)查是否反式剪接在植物葉綠體中是可行的。就轉(zhuǎn)錄和翻譯的機(jī)制來說,植物葉綠體與細(xì)菌是相似的。在實(shí)施例IV-VI中,我們使用了從集胞藻屬PCC6803的dnaE基因中獲得的天然intein,集胞藻屬PCC6803是一種藻青菌。藻青菌是光合細(xì)菌,與植物的葉綠體相似。因此intein應(yīng)該有可能在植物葉綠體中剪接或反式剪接。這些計(jì)劃的實(shí)驗(yàn)分為兩個(gè)部分第一部分,證明兩個(gè)不相關(guān)基因產(chǎn)物aadA和smGFP在植物葉綠體中的反式剪接,該兩種基因均被整合進(jìn)葉綠體基因組中;和第二部分,在葉綠體中的反式剪接,其中smGFP基因盒被整合進(jìn)核基因組中,含有轉(zhuǎn)運(yùn)肽(核酮糖-1,5-二磷酸羥化酶3A-INc-smGFP)的翻譯蛋白被運(yùn)輸進(jìn)葉綠體中,以使反應(yīng)進(jìn)行。葉綠體將含有與INn片段融合的aadA基因。詳細(xì)步驟在下面敘述。
證明葉綠體中經(jīng)過轉(zhuǎn)錄和翻譯,兩種不相關(guān)基因產(chǎn)物,氨基糖苷-3-乙?;D(zhuǎn)移酶(aadA)和可溶性修飾的綠色熒光蛋白(smGFP),的反式剪接如實(shí)施例V,質(zhì)粒被命名為p115ag和p225ag。這些質(zhì)粒將采用biolistic裝置輸送到植物細(xì)胞器中。煙草或其他任何合適的植物組織將以無菌的方式從溫室生長的植物或組織培養(yǎng)的植物細(xì)胞中獲得。植物組織將在植物生長培養(yǎng)基和山梨醇或其他任何合適的滲壓劑中平衡過夜。植物細(xì)胞將用上述包被在金微粒上的質(zhì)粒轟擊。經(jīng)過合適的恢復(fù)時(shí)間后,細(xì)胞將被置于含植物生長素和500μg/ml硫酸壯觀霉素的植物生長培養(yǎng)基中。壯觀霉素抗性的胼胝組織將被獲取,并置于新芽分化培養(yǎng)基中。當(dāng)新芽大約2厘米長時(shí),將被切下并置入根莖培養(yǎng)基。轉(zhuǎn)基因植物或植物的一部分將通過手持紫外線燈(正常(非轉(zhuǎn)基因)植物將在紫外線下發(fā)出紅色熒光,而轉(zhuǎn)基因植物呈現(xiàn)綠色熒光)進(jìn)行鑒別。轉(zhuǎn)基因整合和拷貝的數(shù)目將通過Southern斑點(diǎn)雜交分析和PCR證實(shí)。轉(zhuǎn)基因部分將采用抗GFP抗體檢測aadA和smGFP的反式剪接。這些部分可進(jìn)一步用來產(chǎn)生純的反式-plastomic系。F1代植物將檢測壯觀霉素抗性。
葉綠體中的反式剪接。SmGFP基因盒整合進(jìn)核基因組,含有核酮糖-1,5-二磷酸羥化酶3A-INc-smGFP轉(zhuǎn)運(yùn)肽的翻譯蛋白,被輸入至葉綠體中以使反應(yīng)繼續(xù)進(jìn)行。
這種方法將使任何斷裂蛋白(如EPSPS或ALS),以與INn或INc融合蛋白的方式,在葉綠體或核中表達(dá)。核編碼的成分將與一個(gè)葉綠體轉(zhuǎn)運(yùn)肽融合,以加速其翻譯后在細(xì)胞漿中移行進(jìn)入葉綠體。aadA和GFP的詳細(xì)方法見下??梢詫?duì)任何其他的蛋白/斷裂基因采用類似的方法。
這種方法將需要一個(gè)載有一個(gè)藥物選擇標(biāo)記和目的靶基因的核轉(zhuǎn)化載體,如pBI121。我們實(shí)驗(yàn)的基因?qū)⑹且粋€(gè)具有三部分的融合蛋白,含有核酮糖-1,5-二磷酸羥化酶和后接的INc及smGFP(其他蛋白/肽,如EPSPS或ALS的一半可以代替smGFP)。轉(zhuǎn)運(yùn)肽是為煙草優(yōu)化的密碼子(圖26)。這個(gè)融合基因?qū)⒃谝粋€(gè)強(qiáng)力的植物啟動(dòng)子,35SCMV的控制下。這個(gè)基因盒的圖示見圖23。這個(gè)DNA將導(dǎo)入植物的核中。將選擇穩(wěn)定的轉(zhuǎn)基因系和對(duì)F1后代檢測轉(zhuǎn)基因整合。
上述轉(zhuǎn)基因植物的葉部分將用作葉綠體DNA轉(zhuǎn)化。葉綠體基因靶向載體是以含有壯觀霉素抗性基因和驅(qū)動(dòng)轉(zhuǎn)基因的PpsbA啟動(dòng)子的p114和p224為基礎(chǔ)的。轉(zhuǎn)基因可以是蛋白的其他一半(以前被導(dǎo)入核基因組)以及必須的剪接元件。作為一個(gè)模型系統(tǒng),我們將采用aadA-INn融合基因進(jìn)行葉綠體轉(zhuǎn)化。Transplastomic系將采用兩種藥物(例如,葉綠體特異的藥物壯觀霉素和核特異的藥物卡那霉素)進(jìn)行選擇。PCR和Western斑點(diǎn)雜交分析將進(jìn)一步建立純的植物系。
對(duì)于轉(zhuǎn)基因植物,F(xiàn)1代將檢測(1)轉(zhuǎn)基因/片段的孟德爾遺傳模式;(2)轉(zhuǎn)基因的穩(wěn)定性;和(3)可能的通過花粉的轉(zhuǎn)基因脫落。
ALS/EPSPS轉(zhuǎn)基因植物將被檢測對(duì)磺脲和Roundup的抗性。
應(yīng)當(dāng)理解,在此描述的實(shí)施例和實(shí)施方案僅作為說明的目的,因而對(duì)于本領(lǐng)域的技術(shù)人員來說,各種修飾或變化很明顯地可以進(jìn)行,并包含在本申請的精神和范圍以及附加權(quán)利要求的范圍內(nèi)。
序列表<110>徐明群T·C·埃文斯S·普拉丹D·G·科姆H·保盧斯L·孫陳立新I·高希新英格蘭生物實(shí)驗(yàn)室公司波士頓生物醫(yī)學(xué)研究所<120>在植物中從蛋白片段重構(gòu)靶蛋白的方法<130>NEB-163-PCT<140>
<141>
<150>60/135,677<151>1999-05-24<160>134<170>PatentIn Ver.2.0<210>1<211>19<212>DNA<213>大腸桿菌(Escherichia coli)<400>1ggacggggaa ctaactatg 19<210>2<211>20<212>DNA<213>大腸桿菌<400>2ccacgatgac gcaccacgcg 20<210>3
<211>30<212>DNA<213>大腸桿菌<400>3ggagggggca tatgaatggc gcacagtggg 30<210>4<211>25<212>DNA<213>大腸桿菌<400>4ggggggtcat gataatttct ccaac 25<210>5<211>28<212>DNA<213>大腸桿菌<400>5ccgggtggcg taattatgcc ggtttacg28<210>6<211>28<212>DNA<213>大腸桿菌<400>6cgtaaaccgg cataattacg ccacccgg28<210>7<211>14<212>PRT<213>集胞藻屬PCC6803(Synechocystis PCC6803)<400>7Leu Glu Lys Phe Ala Glu Tyr Cys Phe Asn Lys Ser Thr Gly1 5 10<210>8<211>21<212>PRT<213>大腸桿菌
<400>8Cys Ala Gln Trp Val Val His Ala Leu Arg Ala Gln Gly Val Asn Thr1 5 10 15Val Phe Gly Tyr Gly20<210>9<211>20<212>PRT<213>大腸桿菌<400>9Cys Val Trp Pro Leu Val Pro Pro Gly Ala Ser Asn Ser Glu Met Leu1 5 10 15Glu Lys Leu Ser20<210>10<211>26<212>DNA<213>大腸桿菌<400>10gggggtcatg aatggcgcac agtggg 26<210>11<211>34<212>DNA<213>大腸桿菌<400>11gcgcgctcga gttgatttaa cggctgctgt aatg 34<210>12<211>32<212>DNA<213>大腸桿菌<400>12gcgcgaccgg ttgtgactgg cagcaacact gc 32
<210>13<211>31<212>DNA<213>大腸桿菌<400>13ggggggctgc agtcatgata atttctccaa c31<210>14<211>22<212>DNA<213>玉米(MAIZE)<400>14atcagtacac agtcctgcca tc 22<210>15<211>20<212>DNA<213>玉米<400>15gagacagccg ccgcaaccat 20<210>16<211>29<212>DNA<213>玉米<400>16gggcccatat ggccaccgcc gccgccgcg 29<210>17<211>29<212>DNA<213>玉米<400>17gggccctcga ggcttccttc aagaagagc 29<210>18<211>29<212>DNA<213>玉米
<400>18gggccaccgg tacatcaaag aagagcttg 29<210>19<211>31<212>DNA<213>玉米<400>19ggggctgcat tcagtacaca gtcctgccat c31<210>20<211>7<212>PRT<213>集胞藻屬PCC6803<400>20Leu Glu Lys Phe Ala Glu Tyr1 5<210>21<211>7<212>PRT<213>集胞藻屬PCC6803<400>21Cys Phe Asn Lys Ser Thr Gly1 5<210>22<211>21<212>PRT<213>玉米<400>22Cys Lys Gly Ala Asp Ile Leu Val Glu Ser Leu Glu Arg Cys Gly Val1 5 10 15Arg Asp Val Phe Ala20<210>23
<211>21<212>PRT<213>玉米<400>23Cys Ile Pro Ser Gly Gly Ala Phe Lys Asp Met Ile Leu Asp Gly Asp1 5 10 15Gly Arg Thr Val Tyr20<210>24<211>44<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>24ggatcctaag aaggagatat acccatggaa tccctgacgt taca 44<210>25<211>38<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>25gtcgacgctc tcctgcagtt aggcaggcgt actcattc 38<210>26<211>38<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>26gctttgctcc tggcggcttt accttgtggt aaaaccgc 38
<210>27<211>38<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>27gcggttttac cacaaggtaa agccgccagg agcaaagc 38<210>28<211>25<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>28gcccctaaag acacaattat tcgcg 25<210>29<211>25<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>29cagcggcgcc gtcatcagca gagcg 25<210>30<211>25<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>30gcgaaccacc actaccaaca atttg 25<210>31
<211>25<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>31tatctccacg ccaaaggttt tcatt 25<210>32<211>21<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>32gaatattgcc tgtcttttgg t 21<210>33<211>21<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>33gttaaagcag ttagcagcga t 21<210>34<211>24<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>34tgctgaatat tgcctgtctt ttgg24<210>35<211>26
<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>35ccgttaaagc agttagcagc gatagc 26<210>36<211>44<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>36ggatcctaag aaggagatat acccatggaa tccctgacgt taca 44<210>37<211>39<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>37gatatcctgc agttaacctg gagagtgata ctgttgacc39<210>38<211>36<212>DNA<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>38gatatcccat gggacgctat ctggtcgagg gcgatg 36<210>39<211>38<212>DNA
<213>人工序列<220>
<223>人工序列的描述合成的基于鼠傷寒沙門氏菌<400>39gtcgacgctc tcctgcagtt aggcaggcgt actcattc 38<210>40<211>31<212>DNA<213>人工序列<220>
<223>人工序列的描述從集胞藻屬PCC6803株合成的<400>40tgctgaatat gcgctgtctt ttggtaccga a31<210>41<211>29<212>DNA<213>人工序列<220>
<223>人工序列的描述從集胞藻屬PCC6803株合成的<400>41ccgttaaacg ccgcagcagc gatagcgcc 29<210>42<211>178<212>PRT<213>大腸桿菌<400>42Tyr Ala Val Asp Lys Ala Asp Leu Leu Leu Ala Leu Gly Val Arg Phe1 5 10 15Asp Asp Arg Val Thr Lys Ile Glu Ala Phe Ala Ser Arg Ala Lys Ile20 25 30Val His Val Asp Ile Asp Pro Ala Glu Ile Gly Lys Asn Lys Gln Pro35 40 45
His Val Ser Ile Cys Ala Asp Val Lys Leu Ala Leu Gln Gly Met Asn50 55 60Ala Leu Leu Glu Gly Ser Thr Ser Lys Lys Ser Phe Asp Phe Gly Ser65 70 75 80Trp Asn Asp Glu Leu Asp Gln Gln Lys Arg Glu Phe Pro Leu Gly Tyr85 90 95Lys Thr Ser Asn Glu Glu Ile Gln Pro Gln Tyr Ala Ile Gln Val Leu100 105 110Asp Glu Leu Thr Lys Gly Glu Ala Ile Ile Gly Thr Gly Val Gly Gln115 120 125His Gln Met Trp Ala Ala Gln Tyr Tyr Thr Tyr Lys Arg Pro Arg Gln130 135 140Trp Leu Ser Ser Ala Gly Leu Gly Ala Met Gly Phe Gly Leu Pro Ala145 150 155 160Ala Ala Gly Ala Ser Val Ala Asn Pro Gly Val Thr Val Val Asp Ile165 170 175Asp Gly<210>43<211>179<212>PRT<213>大腸桿菌<400>43Tyr Ala Val Asp Ser Ser Asp Leu Leu Leu Ala Phe Gly Val Arg Phe1 5 10 15Asp Asp Arg Val Thr Gly Lys Leu Glu Ala Phe Ala Ser Arg Ala Lys20 25 30Ile Val His Ile Asp Ile Asp Ser Ala Glu Ile Gly Lys Asn Lys Gln35 40 45Pro His Val Ser Ile Cys Ala Asp Ile Lys Leu Ala Leu Gln Gly Leu
50 55 60Asn Ser Ile Leu Glu Ser Lys Glu Gly Lys Leu Lys Leu Asp Phe Ser65 70 75 80Ala Trp Arg Gln Glu Leu Thr Glu Gln Lys Val Lys His Pro Leu Asn85 90 95Phe Lys Thr Phe Gly Asp Ala Ile Pro Pro Gln Tyr Ala Ile Gln Val100 105 110Leu Asp Glu Leu Thr Asn Gly Asn Ala Ile Ile Ser Thr Gly Val Gly115 120 125Gln His Gln Met Trp Ala Ala Gln Tyr Tyr Lys Tyr Arg Lys Pro Arg130 135 140Gln Trp Leu Thr Ser Gly Gly Leu Gly Ala Met Gly Phe Gly Leu Pro145 150 155 160Ala Ala Ile Gly Ala Ala Val Gly Arg Pro Asp Glu Val Val Val Asp165 170 175Ile Asp Gly<210>44<211>179<212>PRT<213>大腸桿菌<400>44Tyr Ala Val Asp Ser Ser Asp Leu Leu Leu Ala Phe Gly Val Arg Phe1 5 10 15Asp Asp Arg Val Thr Gly Lys Leu Glu Ala Phe Ala Ser Arg Ala Lys20 25 30Ile Val His Ile Asp Ile Asp Ser Ala Glu Ile Gly Lys Asn Lys Gln35 40 45Pro His Val Ser Ile Cys Ala Asp Ile Lys Leu Ala Leu Gln Gly Leu50 55 60
Asn Ser Ile Leu Glu Ser Lys Glu Gly Lys Leu Lys Leu Asp Phe Ser65 70 75 80Ala Trp Arg Gln Glu Leu Thr Val Gln Lys Val Lys Tyr Pro Leu Asn85 90 95Phe Lys Thr Phe Gly Asp Ala Ile Pro Pro Gln Tyr Ala Ile Gln Val100 105 110Leu Asp Glu Leu Thr Asn Gly Ser Ala Ile Ile Ser Thr Gly Val Gly115 120 125Gln His Gln Met Trp Ala Ala Gln Tyr Tyr Lys Tyr Arg Lys Pro Arg130 135 140Gln Trp Leu Thr Ser Gly Gly Leu Gly Ala Met Gly Phe Gly Leu Pro145 150 155 160Ala Ala Ile Gly Ala Ala Val Gly Arg Pro Asp Glu Val Val Val Asp165 170 175Ile Asp Gly<210>45<211>180<212>PRT<213>大腸桿菌<400>45Met Thr Met His Asn Ala Asp Val Ile Phe Ala Val Gly Val Arg Phe1 5 10 15Asp Asp Arg Thr Thr Asn Asn Leu Ala Lys Tyr Cys Pro Asn Ala Thr20 25 30Val Leu His Ile Asp Ile Asp Pro Thr Ser Ile Ser Lys Thr Val Thr35 40 45Ala Asp Ile Pro Ile Val Gly Asp Ala Arg Gln Val Leu Glu Gln Met50 55 60Leu Glu Leu Leu Ser Gln Glu Ser Ala His Gln Pro Leu Asp Glu Ile65 70 75 80
Arg Asp Trp Trp Gln Gln Ile Glu Gln Trp Arg Ala Arg Gln Cys Leu85 90 95Lys Tyr Asp Thr His Ser Glu Lys Ile Lys Pro Gln Ala Val Ile Glu100 105 110Thr Leu Trp Arg Leu Thr Lys Gly Asp Ala Tyr Val Thr Ser Asp Val115 120 125Gly Gln His Gln Met Phe Ala Ala Leu Tyr Tyr Pro Phe Asp Lys Pro130 135 140Arg Arg Trp Ile Asn Ser Gly Gly Leu Gly Thr Met Gly Phe Gly Leu145 150 155 160Pro Ala Ala Leu Gly Val Lys Met Ala Leu Pro Glu Glu Thr Val Val165 170 175Cys Val Thr Gly180<210>46<211>170<212>PRT<213>大腸桿菌<400>46Phe Ala Val Gln Glu Cys Asp Leu Leu Ile Ala Val Gly Ala Arg Phe1 5 10 15Asp Asp Arg Val Thr Gly Lys Leu Asn Thr Ser Ala Pro His Ala Ser20 25 30Val Ile His Met Asp Ile Asp Pro Ala Glu Met Asn Lys Leu Arg Gln35 40 45Ala His Val Ala Leu Gln Gly Asp Leu Asn Ala Leu Leu Pro Ala Leu50 55 60Gln Gln Pro Leu Asn Gln Cys Asp Trp Gln Gln His Cys Ala Gln Leu65 70 75 80Arg Asp Glu His Ser Trp Arg Tyr Asp His Pro Gly Asp Ala Ile Tyr
85 90 95Ala Pro Leu Leu Leu Lys Gln Leu Ser Asp Arg Lys Pro Ala Asp Cys100 105 110Val Val Thr Thr Asp Val Gly Gln His Gln Met Trp Ala Ala Gln His115 120 125Ile Ala His Thr Arg Pro Glu Asn Phe Ile Thr Ser Ser Gly Leu Gly130 135 140Thr Met Gly Phe Gly Leu Pro Ala Ala Val Gly Ala Gln Val Ala Arg145 150 155 160Pro Asn Asp Thr Val Val Cys Ile Ser Gly165 170<210>47<211>35<212>DNA<213>大腸桿菌<400>47gccttaatta accatgaggg aagcggtgat cgccg35<210>48<211>34<212>DNA<213>大腸桿菌<400>48tgcggtcgac tttgccgact accttggtga tctc 34<210>49<211>41<212>DNA<213>大腸桿菌<400>49cccaagcttg gcgccatgag taaaggagaa gaacttttca c 41<210>50<211>36<212>DNA
<213>大腸桿菌<400>50gcgaccggtt tatttgtata gttcatccat gccatg 36<210>51<211>39<212>DNA<213>大腸桿菌<400>51agggaattcg tcgacaaatt tgctgaatat tgcctgtct39<210>52<211>38<212>DNA<213>大腸桿菌<400>52ggcctcgagt tatttaattg tcccagcgtc aagtaatg 38<210>53<211>41<212>DNA<213>大腸桿菌<400>53agctttgttt aaaccatggt taaagttatc ggtcgtagat c 41<210>54<211>43<212>DNA<213>大腸桿菌<400>54cagcgtcgac ggcgccgtgg gatttgttaa agcagttagc agc 43<210>55<211>31<212>DNA<213>大腸桿菌<400>55catgccatgg gggaagcggt gatcgccgaa g31
<210>56<211>39<212>DNA<213>大腸桿菌<400>56acgcgagctc ttatttaatt gtcccagcgt caagtaatg39<210>57<211>34<212>DNA<213>大腸桿菌<400>57cgaattctat ggttaaagtt atcggtcgta gatc 34<210>58<211>36<212>DNA<213>大腸桿菌<400>58agcccgcggt tatttgtata gttcatccat gccatg 36<210>59<211>154<212>DNA<213>煙草(Nicotiana tabacum)<400>59gaatagatct acatacacct tggttgacac gagtatataa gtcatgttat actgttgaat 60aacaagcctt ccattttcta ttttgatttg tagaaaacta gtgtgcttgg gagtccctga 120tgattaaata aaccaagatt ttaccttaat taag 154<210>60<211>151<212>DNA<213>煙草<400>60gatcctggcc tagtctatag gaggttttga aaagaaagga gcaataatca ttttcttgtt 60ctatcaagag ggtgctattg ctcctttctt tttttctttt tatttattta ctagtatttt 120acttacatag acttttttgt ttacgtattc t151<210>61
<211>185<212>DNA<213>煙草<400>61catatggcgt ccatgatctc ctcgtccgcg gtgaccacgg tcagccgcgc gtccacggtg 60cagtcggccg cggtggcccc gttcggcggc ctcaagtcca tgaccggctt cccggtcaag 120aaggtcaaca cggacatcac gtccatcacg agcaacggcg gcagggtgaa gtgcatgcga 180agagc 185<210>62<211>6232<212>DNA<213>未知<220>
<223>核苷酸1-2492大腸桿菌載體pLITMUS28(New England Biolabs,Inc.)<220>
<223>核苷酸2493-5993煙草(Nicotiana tabaceum)<220>
<223>核苷酸5993-6232大腸桿菌載體pLITMUS28(New England Biolabs,Inc.)<400>62gttaactacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 60tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 120ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 180ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 240tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 300gatccttgag agttttcgcc ccgaagaacg ttctccaatg atgagcactt ttaaagttct 360gctatgtggc gcggtattat cccgtgttga cgccgggcaa gagcaactcg gtcgccgcat 420acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 480tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 540caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 600gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 660cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 720tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 780agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 840tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 900ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 960acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 1020ctcatatata ctttagattg atttaccccg gttgataatc agaaaagccc caaaaacagg 1080aagattgtat aagcaaatat ttaaattgta aacgttaata ttttgttaaa attcgcgtta 1140
aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1200aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1260ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1320ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 1380aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcg aacgtggcga 1440gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt gtagcggtca 1500cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gcgtaaaagg 1560atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 1620ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 1680ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 1740ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 1800ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 1860ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 1920tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 1980tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 2040tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 2100tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 2160gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 2220tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 2280ttcctggcct tttgctggcc ttttgctcac atgtaatgtg agttagctca ctcattaggc 2340accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg tgagcggata 2400acaatttcac acaggaaaca gctatgacca tgattacgcc aagctacgta atacgactca 2460ctagtgggca gatcttcgaa tgcatcgcgc gcttgacgat atagcaattt tgcttggatt 2520tatcagtcga agcaggagac aatatacctt gatattctcg atcattcttt gattcaaagc 2580atcgttccat ctcaattgaa aaagcaaata acgtttcaag aacaaatcta gttctgcttc 2640cgtgttgctt ttgtattgtt ttttcttttt acccttcttt gtgtctgatt ccgcgtaatc 2700ttttttaaga gcgttttgat gttttgagag aacagggccc agatttcctt tgttttctat 2760atctgatcca cgctcttttt ctccttgact tgcgggttct tttgcttctt gaattcgatt 2820ctttattttt ttatttgatc gtagaaaaaa gttttgtttt tggtttttat tgatgttttt 2880attttgacta acattttcat ttgtattcaa atttaaaaga agtaatttgc ttggtataat 2940ccacggtttt attttatata cattataaag tggtacaaat tctgggaaga accaaaattc 3000cagattcaat atgggacgat ttaatatttt ttcattcatt cccatccaat caaaaaaggc 3060ttttttcgaa tttttttgat tgttttctgg attttgatga atcgtaagat aaaaaaagcc 3120ttttttatca attttatcaa ttatttgata attattaata ccaattttag tatttggatt 3180actgttggta tcgatcttaa cccaggcctc aatatcttct ttttgtctaa gagaaaaatg 3240gataattttc caatcaaaat attttctatc gagatttctt tctatatata gaatattgcc 3300ttttcttaga taattattga tatgaagatt gccgagcata tcaaaaaggt tgtgtttgga 3360cgtgttggaa ttagaagaaa tttcgaggtt cttatttact tgaaagggta atctagaaat 3420aaaagagtca tttttttttt cataattaat cgatttatat gctaaaagat catatctata 3480acatttttga aaattatctt tttggtttgc taatgaatag agctcagaat cattttcttt 3540tttgtaatga attaattggt ctttttcata tgaattccat ttgtttaaat ttcgattttg 3600agccatacaa ccttgattaa ccctatttcg ccatttttgt ggcattaatc tagaccatct 3660aatctgagat aaatcgtacg agaatactca atcatgaata aatgcaagaa aataacctct 3720ccttcttttt ctataatgta aacaaaaaag tctatgtaag taaaatacta gtaaataaat 3780aaaaagaaaa aaagaaagga gcaatagcac cctcttgata gaacaagaaa atgattattg 3840
ctcctttctt ttcaaaacct cctatagact aggccaggat cctcgagctt aattaaggta 3900aaatcttggt ttatttaatc atcagggact cccaagcaca ctagttttct acaaatcaaa 3960atagaaaata gaaaatggaa ggctttttat tcaacagtat aacatgactt atatactcgt 4020gtcaaccaag gtgtatgtag atctattcct gcaggatatc tggatccacg aagcttccca 4080tgggaataga tctacataca ccttggttga cacgagtata taagtcatgt tatactgttg 4140aataaaaagc cttccatttt ctattttgat ttgtagaaaa ctagtgtgct tgggagtccc 4200tgatgattaa ataaaccaag attttaccgt ttaaacaccg gtgatcctgg cctagtctat 4260aggaggtttt gaaaagaaag gagcaataat cattttcttg ttctatcaag agggtgctat 4320tgctcctttc tttttttctt tttatttatt tactagtatt ttacttacat agactttttt 4380gtttacatta tagaaaaaga aggagaggtt attttcttgc atttattcat gattgagtat 4440tctcctaggc gtattgataa tgccgtctta accagttttt ccattgattg attctataac 4500tctgaagttt cttatgtttt aattcagaat gaaatattcc tagtgttcga aaatagtcct 4560ttattttagt cttaaggaaa aaagacgttc tgttatattg aagaacagat cttaatttag 4620acaaattaat aacttggggt tgtgataatt tgtaaaatac atatgcttgt gataagtagg 4680ataaatcaaa aaaaatatgt gaatttttct tactaatatt ataaagtgac ttttttatag 4740tcgaaataaa gtgaattttt ttttgattat taattttttc ttgatttatt tcattattgg 4800aaatgtattt atcaatcaat ttgtttgttg attcaagaaa gagttgtgta ttaattctgg 4860gaatattaat gatagataaa aatagatcga tgtataatct ttgaatgaat aattttagaa 4920aataatggaa tttccatatt aatcgagtat ttcttctttt taatatttgg aaaatctttt 4980ttggcgattc gaatttttta atattatttg ttttattagg actaatgtct atttctggag 5040ttactttctt tttctctttt gtaattcttt ctatttgatt tttgattgta cttgttctat 5100cagtcaaatc cttcattttg ctttctatca gtgaagaatt tggccaattt ccagattcaa 5160tttgactaaa tgattcgtta attatctgat tactcattag agaatctttt tcttttttcg 5220tttcattcga ttcatctatt tctttgagtc taaataatac aattggattt acttttgaaa 5280gttctttttt catttttttt ataaatagac tacttttgat aagccatttt ttggtttctt 5340ttgaaattct tcgaaataat tttatttttc ctttgaaaac ttttagagtt ataaaatatt 5400tctttttgaa ttttccaatt tttttttcga gttccttaaa aatgggctca aaaaaagaag 5460ggcgttttcg gggagaacca aagggaagtt cagcttccat tccccaaact gttaaaaaac 5520aaaaatcatc tttttgtttt ttctttttca ttagctctcc acgggaggag tacagtttag 5580atatatgcca aggtttcaga caaaaaggaa ataatatttt gatctgaatg ccatctttca 5640accaattttt tggaaattct gtttctgata attgaacacc attataagta catttaatat 5700gcatttctct attccattcc tgcaaatctt cagaccattc aggaagttgc aagactaaca 5760tacgcccgag atttttggct attatcaatg aaggtaatac aatatatttt cgaagaattg 5820attgagttat taacatgtaa cctcttatta tttgcgcaaa aggaatggta tcccaggctt 5880ctgctatctc tatccgtgct ttttcctttc ttttgttctc cccttttttg tccttttcct 5940ttttctcttc tctttttgtt tgttcttctc tagactctag aatcttgaat tcggtaccct 6000ctagtcaagg ccttaagtga gtcgtattac ggactggccg tcgttttaca acgtcgtgac 6060tgggaaaacc ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc 6120tggcgtaata gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat 6180ggcgaatggc gcttcgcttg gtaataaagc ccgcttcggc gggctttttt tt 6232<210>63<211>6477<212>DNA<213>未知
<220>
<223>核苷酸1-2482大腸桿菌載體pLITMUS28(NewEngland Biolabs,Inc.)<220>
<223>核苷酸2493-6242核苷酸<220>
<223>核苷酸6243-6477大腸桿菌載體pLITMUS28(New England Biolabs,Inc.)<400>63gttaactacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 60tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 120ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 180ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 240tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 300gatccttgag agttttcgcc ccgaagaacg ttctccaatg atgagcactt ttaaagttct 360gctatgtggc gcggtattat cccgtgttga cgccgggcaa gagcaactcg gtcgccgcat 420acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 480tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 540caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 600gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 660cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 720tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 780agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 840tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 900ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 960acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 1020ctcatatata ctttagattg atttaccccg gttgataatc agaaaagccc caaaaacagg 1080aagattgtat aagcaaatat ttaaattgta aacgttaata ttttgttaaa attcgcgtta 1140aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa aatcccttat 1200aaatcaaaag aatagcccga gatagggttg agtgttgttc cagtttggaa caagagtcca 1260ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca gggcgatggc 1320ccactacgtg aaccatcacc caaatcaagt tttttggggt cgaggtgccg taaagcacta 1380aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcg aacgtggcga 1440gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt gtagcggtca 1500cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gcgtaaaagg 1560atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 1620ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 1680ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 1740ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 1800ccaaatactg ttcttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 1860ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 1920
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 1980tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 2040tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 2100tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 2160gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 2220tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 2280ttcctggcct tttgctggcc ttttgctcac atgtaatgtg agttagctca ctcattaggc 2340accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg tgagcggata 2400acaatttcac acaggaaaca gctatgacca tgattacgcc aagctacgta atacgactca 2460ctagtgggca gatcttcgaa tgcatcgcgc gcaattcacc gccgtatggc tgaccggcga 2520ttactagcga ttccggcttc atgcaggcga gttgcagcct gcaatccgaa ctgaggacgg 2580gtttttgggg ttagctcacc ctcgcgggat cgcgaccctt tgtcccggcc attgtagcac 2640gtgtgtcgcc cagggcataa ggggcatgat gacttgacgt catcctcacc ttcctccggc 2700ttatcaccgg cagtctgttc agggttccaa actcaacgat ggcaactaaa cacgagggtt 2760gcgctcgttg cgggacttaa cccaacacct tacggcacga gctgacgaca gccatgcacc 2820acctgtgtcc gcgttcccga aggcacccct ctctttcaag aggattcgcg gcatgtcaag 2880ccctggtaag gttcttcgct ttgcatcgaa ttaaaccaca tgctccaccg cttgtgcggg 2940cccccgtcaa ttcctttgag tttcattctt gcgaacgtac tccccaggcg ggatacttaa 3000cgcgttagct acagcactgc acgggtcgat acgcacagcg cctagtatcc atcgtttacg 3060gctaggacta ctggggtatc taatcccatt cgctccccta gctttcgtct ctcagtgtca 3120gtgtcggccc agcagagtgc tttcgccgtt ggtgttcttt ccgatctcta cgcatttcac 3180cgctccaccg gaaattccct ctgcccctac cgtactccag cttggtagtt tccaccgcct 3240gtccagggtt gagccctggg atttgacggc ggacttaaaa agccacctac agacgcttta 3300cgcccaatca ttccggataa cgcttgcatc ctctgtatta ccgcggctgc tggcacagag 3360ttagccgatg cttattcccc agataccgtc attgcttctt ctccgggaaa agaagttcac 3420gacccgtggg ccttctacct ccacgcggca ttgctccgtc agctttcgcc cattgcggaa 3480aattccccac tgctgcctcc cgtaggagtc tgggccgtgt ctcagtccca gtgtggctga 3540tcatcctctc ggaccagcta ctgatcatcg ccttggtaag ctattgcctc accaactagc 3600taatcagacg cgagcccctc ctcgggcgga ttcctccttt tgctcctcag cctacggggt 3660attagcagcc gtttccagct gttgttcccc tcccaagggc aggttcttac gcgttactca 3720cccgtccgcc actggaaaca ccacttcccg tccgacttgc atgtgttaag catgccgcca 3780gcgttcatcc tgagccagga tcgaactctc catgagattc atagttgcat tacttatagc 3840ttccttgttc gtagacaaag cggattcgga attgtctttc attccaaggc ataacttgta 3900tccatgcgct tcatattcgc ccggagttcg ctcccagaaa tatagccatc cctgccccct 3960cacgtcaatc ccacgagcct cttatccatt ctcattgaac gacggcgggg gagcaaatcc 4020aactagaaaa actcacattg ggcttaggga taatcaggct cgaactgatg acttccacca 4080cgtcaaggtg acactctacc gctgagttat atcccttccc cgccccatcg agaaatagaa 4140ctgactaatc ctaagtcaaa ggcgtacgag aatactcaat catgaataaa tgcaagaaaa 4200taacctctcc ttctttttct ataatgtaaa caaaaaagtc tatgtaagta aaatactagt 4260aaataaataa aaagaaaaaa agaaaggagc aatagcaccc tcttgataga acaagaaaat 4320gattattgct cctttctttt caaaacctcc tatagactag gccaggatcc tcgagcttaa 4380ttaaggtaaa atcttggttt atttaatcat cagggactcc caagcacact agttttctac 4440aaatcaaaat agaaaataga aaatggaagg ctttttattc aacagtataa catgacttat 4500atactcgtgt caaccaaggt gtatgtagat ctattcctgc aggatatctg gatccacgaa 4560gcttcccatg ggaatagatc tacatacacc ttggttgaca cgagtatata agtcatgtta 4620
tactgttgaa taaaaagcct tccattttct attttgattt gtagaaaact agtgtgcttg 4680ggagtccctg atgattaaat aaaccaagat tttaccgttt aaacaccggt gatcctggcc 4740tagtctatag gaggttttga aaagaaagga gcaataatca ttttcttgtt ctatcaagag 4800ggtgctattg ctcctttctt tttttctttt tatttattta ctagtatttt acttacatag 4860acttttttgt ttacattata gaaaaagaag gagaggttat tttcttgcat ttattcatga 4920ttgagtattc tcctagggtc gagaaactca acgccactat tcttgaacaa cttggagccg 4980ggccttcttt tcgcactatt acggatatga aaataatggt caaaatcgga ttcaattgtc 5040aactgcccct atcggaaata ggattgacta ccgattccga aggaactgga gttacatctc 5100ttttccattc aagagttctt atgcgtttcc acgccccttt gagaccccga aaaatggaca 5160aattcctttt cttaggaaca catacaagat tcgtcactac aaaaaggata atggtaaccc 5220taccattaac tacttcattt atgaatttca tagtaataga aatacatgtc ctaccgagac 5280agaatttgga acttgctatc ctcttgccta gcaggcaaag atttacctcc gtggaaagga 5340tgattcattc ggatcgacat gagagtccaa ctacattgcc agaatccatg ttgtatattt 5400gaaagaggtt gacctccttg cttctctcat ggtacactcc tcttcccgcc gagccccttt 5460tctcctcggt ccacagagac aaaatgtagg actggtgcca acaattcatc agactcacta 5520agtcgggatc actaactaat actaatctaa tataatagtc taatatatct aatataatag 5580aaaatactaa tataatagaa aagaactgtc ttttctgtat actttccccg gttccgttgc 5640taccgcgggc tttacgcaat cgatcggatt agatagatat cccttcaaca taggtcatcg 5700aaaggatctc ggagacccac caaagtacga aagccaggat ctttcagaaa acggattcct 5760attcaaagag tgcataaccg catggataag ctcacactaa cccgtcaatt tgggatccaa 5820attcgagatt ttccttggga ggtatcggga aggatttgga atggaataat atcgattcat 5880acagaagaaa aggttctcta ttgattcaaa cactgtacct aacctatggg atagggatcg 5940aggaagggga aaaaccgaag atttcacatg gtacttttat caatctgatt tatttcgtac 6000ctttcgttca atgagaaaat gggtcaaatt ctacaggatc aaacctatgg gacttaagga 6060atgatataaa aaaaagagag ggaaaatatt catattaaat aaatatgaag tagaagaacc 6120cagattccaa atgaacaaat tcaaacttga aaaggatctt ccttattctt gaagaatgag 6180gggcaaaggg attgatcaag aaagatcttt tgttcttctt atatataaga tcgtgatggt 6240accctctagt caaggcctta agtgagtcgt attacggact ggccgtcgtt ttacaacgtc 6300gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 6360ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 6420tgaatggcga atggcgcttc gcttggtaat aaagcccgct tcggcgggct ttttttt6477<210>64<211>31<212>DNA<213>煙草<400>64aactgcagga atagatctac atacaccttg g31<210>65<211>42<212>DNA<213>煙草
<400>65ccgctcgagc ttaattaagg taaaatcttg gtttatttaa tc42<210>66<211>33<212>DNA<213>煙草<400>66gcgaccggtg atcctggcct agtctatagg agg 33<210>67<211>34<212>DNA<213>煙草<400>67aggcctagga gaatactcaa tcatgaataa atgc 34<210>68<211>34<212>DNA<213>煙草<400>68ttggcgcgct tgacgatata gcaattttgc ttgg 34<210>69<211>34<212>DNA<213>煙草<400>69ttgcgtacga tttatctcag attagatggt ctag 34<210>70<211>35<212>DNA<213>煙草<400>70ttgcctaggc gtattgataa tgccgtctta accag35<210>71<211>34
<212>DNA<213>煙草<400>71aggggtaccg aattcaagat tctagagtct agag 34<210>72<211>34<212>DNA<213>煙草<400>72ttggcgcgca attcaccgcc gtatggctga ccgg 34<210>73<211>34<212>DNA<213>煙草<400>73ttgcgtacgc ctttgactta ggattagtca gttc 34<210>74<211>34<212>DNA<213>煙草<400>74ttgcctaggg tcgagaaact caacgccact attc 34<210>75<211>35<212>DNA<213>煙草<400>75aggggtacca tcacgatctt atatataaga agaac35<210>76<211>250<212>DNA<213>煙草<400>76gaattgtgag cgctcacaat tctaggatgt taattgcgcc gacatcataa cggttctggc 60
aaatattctg aaatgagctg ttgacaatta atcatcggct cgtataatgt gtggaattgt 120gagcggataa caatttcaca caggaaacag accatggtga attctagagc tcgaggatcc 180gcggtacccg ggcatgcatt cgaagcttcc ttaagcggcc gtcgaccgat gcccttgaga 240gccttcaacc250<210>77<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>77Cys Leu Asn Ile Gln1 5<210>78<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>78Val Phe Lys His Ala1 5<210>79<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>79Leu Phe Lys Gln Pro1 5<210>80
<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>80Cys Leu Asn Ser Asp1 5<210>81<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>81Cys Leu Asn Ile Ser1 5<210>82<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>82Cys Leu Asn Thr Asp1 5<210>83<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端
<400>83Cys Leu Asn Asn Arg1 5<210>84<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>84Cys Leu Asn Ser Cys1 5<210>85<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>85Cys Leu Asn Ser Asp1 5<210>86<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>86Cys Leu Asn Thr Leu1 5
<210>87<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>87Val Phe Lys Gln Pro1 5<210>88<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>88Cys Leu Asn Ser Met1 5<210>89<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>89Cys Leu Asn Asn Tyr1 5<210>90<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>90Cys Leu Asn Met Ala1 5<210>91<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>91Val Phe Lys His Lys1 5<210>92<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>92Cys Leu Asn Thr Lys1 5<210>93<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>93Cys Leu Asn Lys Asp1 5
<210>94<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>94Met Phe Lys Gln Ile1 5<210>95<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>95Cys Leu Asn Ile Ile1 5<210>96<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>96Leu Phe Lys His Glu1 5<210>97<211>5<212>PRT<213>人工序列
<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>97Val Phe Lys His Phe1 5<210>98<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>98Cys Leu Asn Ser Val1 5<210>99<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>99Val Phe Lys Gln Ile1 5<210>100<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>100Met Phe Lys Gln Ala1 5
<210>101<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>101Leu Phe Lys His His1 5<210>102<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>102Leu Phe Lys His Gln1 5<210>103<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>103Met Phe Lys His Val1 5<210>104<211>5<212>PRT<213>人工序列
<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>104Val Phe Lys Gln Lys1 5<210>105<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>105Leu Phe Lys Gln Gln1 5<210>106<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>106Leu Phe Lys His Ser1 5<210>107<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>107Cys Leu Asn Thr Gly
1 5<210>108<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>108Cys Leu Asn Ser Arg1 5<210>109<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>109Val Phe Lys His Leu1 5<210>110<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>110Cys Leu Asn Asn Ile1 5<210>111<211>5<212>PRT
<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>111Leu Phe Lys His Gln1 5<210>112<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>112Cys Leu Asn Lys His1 5<210>113<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>113Met Phe Lys Gln Tyr1 5<210>114<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>114
Cys Leu Asn Lys Gln1 5<210>115<211>5<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>115Cys Leu Asn Met Ser1 5<210>116<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>116Leu Cys Leu Asn Ile Leu Ala1 5<210>117<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>117Asn Cys Leu Asn Ile Asn Ala1 5<210>118<211>7
<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>118Leu Met Phe Lys His Leu Ser1 5<210>119<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>119Thr Leu Phe Lys His Thr Arg1 5<210>120<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>120Lys Val Phe Lys Gln Lys Glu1 5<210>121<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端
<400>121His Leu Val Phe Lys His Leu1 5<210>122<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>122Leu Cys Leu Asn Thr Leu Leu1 5<210>123<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>123Leu Cys Leu Asn Asn Leu Val1 5<210>124<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>124Glu Val Phe Lys His Glu Gly1 5<210>125
<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>125Lys Val Phe Lys Gln Lys Gly1 5<210>126<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>126Thr Cys Leu Asn Thr Thr Ile1 5<210>127<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>127Met Cys Leu Asn Asn Met Asn1 5<210>128<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端
<400>128Leu Leu Phe Lys Gln Leu Arg1 5<210>129<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>129Arg Cys Leu Asn Asn Arg Leu1 5<210>130<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>130Met Val Phe Lys Gln Met Ala1 5<210>131<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>131Ala Met Phe Lys Gln Ala Thr1 5
<210>132<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>132Leu Val Phe Lys His Leu Asp1 5<210>133<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>133Lys Met Phe Lys Gln Lys Thr1 5<210>134<211>7<212>PRT<213>人工序列<220>
<223>人工序列的描述基于Tn7轉(zhuǎn)座子的末端<400>134Tyr Cys Leu Asn Asn Tyr Phe1 權(quán)利要求
1.在植物中從蛋白片段重構(gòu)靶蛋白的方法,包括a)將編碼靶蛋白的基因斷裂成至少兩個(gè)DNA片斷;b)通過將步驟a)中的DNA片斷分離以抑制基因向其它植物傳送,其中至少一種編碼靶蛋白一部分的DNA片段被區(qū)室化進(jìn)入細(xì)胞核中,編碼靶蛋白另一部分的其它DNA片段被區(qū)室化進(jìn)入葉綠體;c)在植物中表達(dá)步驟b)中的DNA片斷,以產(chǎn)生相應(yīng)的靶蛋白片斷;d)在植物中從蛋白片斷重構(gòu)靶蛋白。
2.一種防止在第一種植物中編碼靶蛋白的基因向第二種植物傳送的方法,包括a)將編碼靶蛋白的基因斷裂成至少兩個(gè)DNA片斷;b)通過將步驟a)中的DNA片斷分離,其中至少一種編碼靶蛋白一部分的DNA片段被區(qū)室化進(jìn)入第一種植物的宿主細(xì)胞的細(xì)胞核中,編碼靶蛋白另一部分的其它DNA片段被區(qū)室化進(jìn)入宿主細(xì)胞的葉綠體中;c)抑制編碼靶蛋白的基因傳送至第二種植物。
3.根據(jù)權(quán)利要求1所述的方法,其中DNA片段的至少一種融合到編碼轉(zhuǎn)運(yùn)肽的DNA序列上用于運(yùn)輸進(jìn)葉綠體或核中。
4.如權(quán)利要求1或2所述的方法,其中DNA片段的至少一種融合到編碼intein或其部分的DNA上。
5.如權(quán)利要求4所述的方法,其中DNA片斷之一是通過連接編碼靶蛋白的N-端部分DNA的5‘-末端與編碼intein N-端部分DNA的3’-端形成的,另一個(gè)所述DNA片斷是通過連接編碼靶蛋白C-端部分DNA的5‘-末端與編碼intein C-端部分DNA的3’-端形成的。
6.根據(jù)權(quán)利要求1或2所述的方法,其中所述的編碼靶蛋白的DNA通過編碼一種或多種親合區(qū)的DNA的方法被斷裂形成兩種或兩種以上DNA片段。
7.如權(quán)利要求6所述的方法,其中所述的親和區(qū)選自inteins或intein片斷、亮氨酸拉鏈或c-Jun/c-Fos。
8.如權(quán)利要求4所述的方法,其中至少一個(gè)編碼靶蛋白的DNA片斷與編碼轉(zhuǎn)運(yùn)肽的DNA序列融合,從而使DNA片斷的蛋白產(chǎn)物被轉(zhuǎn)運(yùn)至單獨(dú)的區(qū)室,在該區(qū)室中進(jìn)行功能性重構(gòu)。
9.如權(quán)利要求4所述的方法,其中靶蛋白片斷的重構(gòu)包括intein介導(dǎo)的剪接。
10.如權(quán)利要求4所述的方法,其中靶蛋白片斷的重構(gòu)包括intein介導(dǎo)的蛋白互補(bǔ)。
11.如權(quán)利要求1所述的方法,其中靶蛋白片斷的重構(gòu)包括蛋白質(zhì)互補(bǔ)。
12.如權(quán)利要求11所述的方法,其中蛋白質(zhì)互補(bǔ)在存在親合區(qū)時(shí)發(fā)生。
13.如權(quán)利要求11所述的方法,其中蛋白質(zhì)互補(bǔ)在不存在親合區(qū)時(shí)發(fā)生。
14.如權(quán)利要求1或2所述的方法,其中所述的基因斷裂包括a)確定靶蛋白的一個(gè)或多個(gè)潛在斷裂位點(diǎn)區(qū);和b)在潛在的斷裂位點(diǎn)區(qū)斷裂編碼靶蛋白的DNA。
15.如權(quán)利要求14所述的方法,其中通過靶蛋白非保守區(qū)的初級(jí)氨基酸序列分析確定所述的靶蛋白的潛在斷裂位點(diǎn)區(qū)。
16.如權(quán)利要求14所述的方法,其中通過在靶蛋白內(nèi)連接子插入的耐受性確定所述的潛在的斷裂位點(diǎn)區(qū)。
17.如權(quán)利要求14所述的方法,其中通過分析靶蛋白存在的彈性環(huán)結(jié)構(gòu)確定所述的潛在的斷裂位點(diǎn)區(qū)。
18.如權(quán)利要求14所述的方法,其中分析靶蛋白的結(jié)構(gòu)是否存在靶蛋白折疊區(qū)之間的氨基酸序列確定所述的潛在的斷裂位點(diǎn)區(qū)。
全文摘要
本發(fā)明披露一種能夠在靶宿主,如一種植物內(nèi)高效表達(dá)蛋白質(zhì)的新型轉(zhuǎn)基因系統(tǒng),又能避免經(jīng)花粉將這種轉(zhuǎn)基因帶入相關(guān)的宿主系統(tǒng)和/或環(huán)境。該方法同樣適用于真核細(xì)胞生物(酵母、昆蟲、哺乳動(dòng)物細(xì)胞等)和原核生物(如大腸桿菌等)內(nèi)任何目的蛋白(如一種毒性蛋白)的表達(dá)。
文檔編號(hào)C07K19/00GK1676606SQ200510064390
公開日2005年10月5日 申請日期2000年5月23日 優(yōu)先權(quán)日1999年5月24日
發(fā)明者徐明群, T·C·埃文斯, S·普拉丹, D·G·科姆, H·保盧斯, L·孫, 陳立新, I·高希 申請人:新英格蘭生物實(shí)驗(yàn)室公司, 波士頓生物醫(yī)學(xué)研究所