玉米非翻譯區(qū)域用于植物中轉(zhuǎn)基因表達(dá)的用圖
【專利說(shuō)明】玉米非翻譯區(qū)域用于植物中轉(zhuǎn)基因表達(dá)的用途 發(fā)明領(lǐng)域
[0001] 本發(fā)明一般地涉及基因工程領(lǐng)域,更具體地涉及植物中轉(zhuǎn)基因表達(dá)的領(lǐng)域。
[0002] 發(fā)明背景
[0003] 重組DNA技術(shù)和基因工程已經(jīng)使得將期望的DNA序列導(dǎo)入植物細(xì)胞以便表達(dá)感興 趣的蛋白質(zhì)常規(guī)上成為可能。但是,為了獲得產(chǎn)業(yè)上可行的轉(zhuǎn)化事件,獲得重要作物中穩(wěn)定 和可預(yù)測(cè)的表達(dá)的理想水平仍然是具有挑戰(zhàn)性的。
[0004] 在作物中以期望水平表達(dá)異源基因的方法之一包括對(duì)控制植物中的表達(dá)的調(diào)節(jié) 機(jī)制進(jìn)行操作。該調(diào)節(jié)可以是轉(zhuǎn)錄調(diào)節(jié)或轉(zhuǎn)錄后調(diào)節(jié),可以包括,例如,增強(qiáng)、限制或防止 DNA轉(zhuǎn)錄的機(jī)制,以及限制或增加 mRNA產(chǎn)生后的壽命的機(jī)制。這些調(diào)節(jié)過(guò)程中涉及的DNA 序列可以維護(hù)編碼基因的蛋白質(zhì)產(chǎn)生的結(jié)構(gòu)DNA序列的上游、下游、或者甚至內(nèi)部。
[0005] 為了調(diào)節(jié)轉(zhuǎn)基因植物中的轉(zhuǎn)錄,可以使用多種多樣的啟動(dòng)子。啟動(dòng)子可以用來(lái)控 制外來(lái)基因在轉(zhuǎn)基因植物中的表達(dá),其表達(dá)模式與該啟動(dòng)子原始來(lái)源的基因的表達(dá)模式類 似。一般而言,啟動(dòng)子分為兩類:"組成型"啟動(dòng)子在大多數(shù)組織中大多數(shù)時(shí)間表達(dá),而"受 調(diào)節(jié)型"啟動(dòng)子通常僅在特定的組織類型(組織特異性啟動(dòng)子)或僅在發(fā)育過(guò)程中的特定 時(shí)間(時(shí)序性啟動(dòng)子)表達(dá)。來(lái)自組成型啟動(dòng)子的表達(dá)通常在整個(gè)發(fā)育過(guò)程中大致處于穩(wěn) 態(tài)的水平。編碼具有看家功能的蛋白質(zhì)的基因通常是由組成型啟動(dòng)子驅(qū)動(dòng)的。玉米中組成 型表達(dá)的基因的實(shí)例包括肌動(dòng)蛋白和泛素(ubiquitin) (Ubi)。
[0006] 通過(guò)將"增強(qiáng)子"序列置于啟動(dòng)子的上游(5')可以獲得轉(zhuǎn)基因植物中轉(zhuǎn)錄的進(jìn) 一步提高。增強(qiáng)子元件是順式作用的,可以相對(duì)獨(dú)立于增強(qiáng)子的上游位置和朝向的方式增 加其啟動(dòng)子對(duì)其鄰近基因的轉(zhuǎn)錄水平。人們已經(jīng)從多種來(lái)源,包括病毒、細(xì)菌和植物基因, 分離了此類序列。良好表征的增強(qiáng)子序列的一個(gè)實(shí)例是來(lái)自根癌土壤桿菌的章魚(yú)堿合酶 (OCS),如美國(guó)專利號(hào)5, 837, 849, 5, 710, 267和5, 573, 932所述。已經(jīng)證明這種短(40bp) 的序列可以在單子葉和雙子葉植物,包括玉米中以顯著的水平增加基因表達(dá)。已經(jīng)證明這 種增強(qiáng)子的串聯(lián)重復(fù)可在玉米中增加 GUS基因的表達(dá)至8倍。這些增強(qiáng)子序列如何發(fā)揮功 能仍然不清楚。有可能的是,增強(qiáng)子結(jié)合激活子蛋白,從而易化RNA聚合酶II對(duì)TATA框的 結(jié)合。W095/14098描述了對(duì)ocs增強(qiáng)子和mas (甘露堿合酶)增強(qiáng)子的多種多個(gè)組合的測(cè) 試,導(dǎo)致GUS基因在轉(zhuǎn)基因煙草愈傷組織中基因表達(dá)的數(shù)百倍增加。
[0007] 然而,使用特定的啟動(dòng)子,同時(shí)有或沒(méi)有一個(gè)或多個(gè)增強(qiáng)子,并不一定保證植物中 期望的基因表達(dá)水平。除了期望的轉(zhuǎn)錄水平之外,其他因素如不恰當(dāng)?shù)募艚?、多聚腺苷酸?和核輸出可能影響mRNA和感興趣的蛋白質(zhì)的積累。因此,通過(guò)轉(zhuǎn)錄后調(diào)節(jié)機(jī)制增加 RNA穩(wěn) 定性和翻譯效率的方法是本領(lǐng)域中需要的。
[0008] 關(guān)于轉(zhuǎn)錄后調(diào)節(jié),已經(jīng)證明真核mRNA的特定5'和3'非翻譯區(qū)(UTR)分別在翻譯 效率和RNA穩(wěn)定性方面扮演主要角色。例如,煙草花葉病毒(TMV)和苜蓿花葉病毒(AMV)衣 殼蛋白mRNA的5'和3' UTR已知可增強(qiáng)煙草植物中的基因表達(dá)。玉米醇脫氫酶-I (adhl) 基因的5'和3' UTR已知涉及低氧原生質(zhì)體中的高效翻譯。
[0009] 對(duì)多種5' UTR前導(dǎo)序列的實(shí)驗(yàn)顯示5' UTR的不同結(jié)構(gòu)特征可能與翻譯效率水 平相關(guān)。某些5' UTR已經(jīng)被發(fā)現(xiàn)含有這樣的AUG密碼子,當(dāng)40S核糖體亞單位掃描起 始位點(diǎn)的AUG密碼子時(shí),這些密碼子可能與40S核糖體亞單位相互作用,從而降低翻譯 速度(Kozak,Mol.Cell.Biol.7:3438(1987);Kozak,J.Cell Biol.l08,209(1989))。此 外,mRNA上的AUG起始位點(diǎn)兩側(cè)的5' UTR核苷酸序列可能對(duì)翻譯效率有影響。如果兩 側(cè)5' UTR的環(huán)境不是有利的,40S核糖體亞單位的一部分可能無(wú)法識(shí)別翻譯起始位點(diǎn), 這樣多肽合成的速率會(huì)減慢(1(〇231^18丨〇1.〇16111.266,19867-19870(1991) ;?3丨113111·· J.Biochem. 236, 747-771(1996))。5'UTR的二級(jí)結(jié)構(gòu)(例如發(fā)夾形成)也可能會(huì)阻礙 40S核糖體亞單位在其掃描過(guò)程中的運(yùn)動(dòng),從而對(duì)翻譯效率造成不利影響(Sonenberg et al. ,Nature 334:320(1988) ;Kozak, Cell 44:283-292,(1986))。5'UTR 序列的相 對(duì)GC含量已經(jīng)被顯示可指示潛在二級(jí)結(jié)構(gòu)的穩(wěn)定性,GC水平越高越不穩(wěn)定。(Kozak, J. Biol. Chem. 266, 19867-19870(1991)。較長(zhǎng)的5' UTR可能展現(xiàn)更多數(shù)量的抑制性二級(jí)結(jié) 構(gòu)。因此,任何給定的5' UTR的翻譯效率高度依賴于它的具體結(jié)構(gòu),而且已經(jīng)證明通過(guò)優(yōu) 化前導(dǎo)序列可增加基因表達(dá),這是翻譯起始效率提高的直接結(jié)果。此外,有人通過(guò)加入來(lái) 自植物病毒或熱激基因的前導(dǎo)序列顯著增加了基因表達(dá)(Raju et al. ,Plant Science 94:139-149(1993)) 〇
[0010] 除了 5'UTR之外,mRNA的3'UTR(后隨)序列也與基因表達(dá)有關(guān)。3'UTR(又 稱聚腺苷酸化元件或腺苷化控制元件)已知能夠控制核輸出、聚腺苷酸化狀態(tài)、亞細(xì)胞 靶向、和RNA酶對(duì)mRNA的翻譯和降解的速率。尤其是,3' UTR可能含有一個(gè)或多個(gè)倒序 重復(fù)(inverted repeats),它們能夠折疊成莖環(huán)結(jié)構(gòu),莖環(huán)結(jié)構(gòu)不但構(gòu)成對(duì)外切核酸酶 的屏障,還與已知促進(jìn)RNA穩(wěn)定性的蛋白質(zhì)(例如RNA結(jié)合蛋白)相互作用(Barkan et al. , A Look Beyond Transcription:Mechanisms Determining mRNA Stability and Translation in Plants, American Society of Plant Physiologists, Rockville, Md. ,pp. 162-213(1998))。然而,3'UTR中發(fā)現(xiàn)的某些元件可能是RNA去穩(wěn)定性的。植物中 出現(xiàn)的此類實(shí)例之一是DST元件,它可以在小生長(zhǎng)素上升RNA(small auxin up RNAs, SAURs)中發(fā)現(xiàn)(Gil et al.,EMBO J. 15, 1678-1686(1996))。某些 3' UTR 中的另一種導(dǎo)致 去穩(wěn)定的特征是 AUUUA 五聚體的存在(Ohme-Takagi et al. ,Pro. Nat. Acad. Sci. USA 90 11811-11815(1993))〇
[0011] 已經(jīng)證明3'UTR在數(shù)種玉米基因的基因表達(dá)中扮演顯著的角色。具體 地,已經(jīng)顯示,一種200堿基對(duì)的3'序列負(fù)責(zé)玉米葉肉細(xì)胞中核酮糖-1,5-二磷酸 羧化酶基因的小m3亞單位的光誘導(dǎo)的抑制(Viret et al. ,Proc Natl Acad Sci USA. 91 (18) : 8577-81 (1994))。在植物,尤其是玉米中,這種序列不是非常好地保守的。在植 物基因工程中經(jīng)常使用的一種3'瓜1?源自胭脂堿合酶基因(3'11 〇8)(17&?的&1.,?1&拉 Mol Biol 22(5):731-49(1993))〇
[0012] 在某些植物病毒,如苜蓿花葉病毒(AMV)和煙草花葉病毒(TMV)中,它們高度結(jié)構(gòu) 化的3' UTR對(duì)復(fù)制是必不可少的,可以折疊成為含有數(shù)個(gè)高親和力衣殼蛋白結(jié)合位點(diǎn)的莖 環(huán)結(jié)構(gòu)的線性排列,或折疊成為被RNA依賴性RNA聚合酶識(shí)別的tRNA樣位點(diǎn)(Olsthoorn et al.,EMB0 J 1 ; 18 (17) : 4856-64 (1999) ;Zeyenko et al.,1994))〇
[0013] 然而,仍然有需要鑒定其他的5'和3'UTR是否可用于調(diào)節(jié)轉(zhuǎn)基因植物中重組核酸 的表達(dá),因?yàn)椴⒎侨我环N應(yīng)用都有最優(yōu)的UTR序列可供使用。 發(fā)明概要
[0014] 提供了用于提高轉(zhuǎn)基因植物和植物組織中重組核酸序列表達(dá)的方法、載體和基因 構(gòu)建體。根據(jù)本發(fā)明,從編碼泛素蛋白的基因的3'非翻譯區(qū)獲得和/或衍生核酸序列,并 將其工程化到載體的選定編碼區(qū)域的各自部分的側(cè)翼。載體構(gòu)建體可以通過(guò)常規(guī)或基因打 靶程序?qū)胫参锖?或植物組織,導(dǎo)致選定的編碼區(qū)域的表達(dá)提高。在某些實(shí)施方案中,選 定的編碼區(qū)域是嵌合基因或基因片段,其編碼一種或多種已知對(duì)轉(zhuǎn)基因植物和/或植物組 織賦予一定水平的殺昆蟲(chóng)活性的蛋白質(zhì)。
[0015] 在一個(gè)方面,提供了一種核酸構(gòu)建體,其包含至少一個(gè)感興趣的結(jié)構(gòu)基因,所述基 因功能連接于異源啟動(dòng)子和一個(gè)或多個(gè)控制序列,所述控制序列與選自SEQ ID NO: 1-3、它 們的互補(bǔ)物、或其組合的核酸序列有至少80%的同一性。
[0016] 在一個(gè)實(shí)施方案中,所述至少一個(gè)感興趣的結(jié)構(gòu)基因包括賦予植物中的非天然表 型的基因。在另一個(gè)實(shí)施方案中,所述至少一個(gè)感興趣的結(jié)構(gòu)基因包括賦予植物中的昆蟲(chóng) 抗性或除草劑抗性的基因。在一個(gè)實(shí)施方案中,所述異源啟動(dòng)子不包括病毒啟動(dòng)子。在另 一個(gè)實(shí)施方案中,所述異源啟動(dòng)子不包括植物啟動(dòng)子。在另一個(gè)實(shí)施方案中,所述異源啟動(dòng) 子包括病毒啟動(dòng)子。在另一個(gè)實(shí)施方案中,所述異源啟動(dòng)子包括植物啟動(dòng)子。
[0017] 在一個(gè)實(shí)施方案中,所述一個(gè)或多個(gè)控制序列與選自SEQ ID NO: 1-3、它們的互 補(bǔ)物、或其組合的核酸序列有至少85%,90%,95%,98%,或100%的同一性。在一個(gè) 進(jìn)一步的實(shí)施方案中,所述一個(gè)或多個(gè)控制序列選自SEQ ID N0:l-3、它們的互補(bǔ)物、或其 組合的核酸序列。在另一個(gè)實(shí)施方案中,所述一個(gè)或多個(gè)控制序列是能夠利用選自SEQ ID NO :4-15的寡核苷酸擴(kuò)增的。
[0018] 在一個(gè)實(shí)施方案中,所述核酸構(gòu)建體包括用于土壤桿菌介導(dǎo)轉(zhuǎn)化的雙元載體。在 另一個(gè)實(shí)施方案中,所述核酸構(gòu)建體被穩(wěn)定轉(zhuǎn)化到轉(zhuǎn)基因植物中。在一個(gè)進(jìn)一步的實(shí)施方 案中,所述植物是單子葉植物。在另一個(gè)進(jìn)一步的實(shí)施方案中,所述植物是雙子葉植物。在 另一個(gè)實(shí)施方案中,所述植物不是單子葉植物。在另一個(gè)實(shí)施方案中,所述植物不是雙子葉 植物。在一個(gè)實(shí)施方案中,所述核酸構(gòu)建體包含可選擇標(biāo)記。在另一個(gè)實(shí)施方案中,所述可 選擇標(biāo)記包括芳基氧基鏈烷酸雙加氧酶。在另一個(gè)實(shí)施方案中,所述芳基氧基鏈烷酸雙加 氧酶是AAD -I或AAD_12。
[0019] 在另一方面,提供一種載體,其包含本文中提供的核酸構(gòu)建體。在另一個(gè)方面,提 供經(jīng)本文提供的核酸構(gòu)建體轉(zhuǎn)化的植物或植物細(xì)胞。在一個(gè)實(shí)施方案中,所述植物或植物 細(xì)胞包含與所述至少一種感興趣的基因疊加的其他感興趣的結(jié)構(gòu)基因。
[0020] 在另一方面,提供一種重組產(chǎn)生肽或蛋白質(zhì)的方法,所述方法包括將異源啟動(dòng)子 與一個(gè)或多個(gè)如下所述的控制序列功能連接,所述控制序列與選自SEQ ID NO: 1-3、它們的 互補(bǔ)物、或其組合的核酸序列具有至少80%同一性。在另一方面,提供一種增加植物或植物 細(xì)胞中的基因表達(dá)的方法,所述方法包括將異源啟動(dòng)子與一個(gè)或多個(gè)如下所述的控制序列 功能連接,所述控制序列與選自SEQ ID N0:l-3、它們的互補(bǔ)物、或其組合的核酸序列具有 至少80 %同一*性。
[0021] 在所提供的方法的一個(gè)實(shí)施方案中,所述異源啟動(dòng)子不包括病毒啟動(dòng)子。在另一 個(gè)實(shí)施方案中,所述異源啟動(dòng)子不包括植物啟動(dòng)子。在另一個(gè)實(shí)施方案中,所述異源啟動(dòng)子 包括病毒啟動(dòng)子。在另一個(gè)實(shí)施方案中,所述異源啟動(dòng)子包括植物啟動(dòng)子。在所提供的方 法的一個(gè)實(shí)施方案中,所述一個(gè)或多個(gè)控制序列與選自SEQ ID N0:l-3、它們的互補(bǔ)物、或 其組合的核酸序列具有85%,90%,95%,98%或100%同一性。在另一個(gè)實(shí)施方案中,所 述一個(gè)或多個(gè)控制序列選自SEQ ID NO: 1-3、它們的互補(bǔ)物、或其組合。在另一個(gè)實(shí)施方案 中,所述一個(gè)或多個(gè)控制序列是能夠利用選自SEQ ID N0:4-15的寡核苷酸擴(kuò)增的。
[0022] 在另一方面,提供了選自SEQ ID N0:l-3、它們的互補(bǔ)物、或其組合的至少一個(gè) 控制序列用于在植物中表達(dá)轉(zhuǎn)基因的用途。在另一方面,提供了能夠利用選自SEQ ID N0:4-15的寡核苷酸擴(kuò)增的一個(gè)或多個(gè)控制序列用于在植物中表達(dá)轉(zhuǎn)基因的用途。
[0023] 附圖簡(jiǎn)要說(shuō)明
[0024] 圖IA顯示了本發(fā)明的一個(gè)示例性控制序列,玉米Ubil 3'UTR(SEQ ID N0