專利名稱::來自浮萍科的表達控制元件的制作方法來自浮萍科的表達控制元件發(fā)明領域本發(fā)明涉及用于增強基因在植物中的表達的組合物和方法。
背景技術:
:浮萍是單子葉浮萍科(Lemnaceae)唯一的成員。5個屬和38個物種都是小的、自由浮動的淡水植物,它的地理分布范圍遍及全球(Landolt(1986)BiosystematicInvestigationontheFamilyofDuckweeds:TheFamilyofLemnaceae—AMonographStudy(GeobatanischenInstitutETH,StiftungRubel,Zurich))。盡管已知浮萍為在形態(tài)學上最簡化的植物,但大多數(shù)浮萍種具有大很多的植物所具有的所有組織和器官,包括根、莖、花、種子和葉。已經(jīng)對浮萍物種進行了廣泛的研究并且存在大量文獻對它們的生態(tài)學、系統(tǒng)學、生活周期、代謝、疾病和蟲害易感性、它們的生殖生物學、遺傳結(jié)構(gòu)和細胞生物學進行了詳細的描述(Hillman(1961)Bot.Review27:221;Landolt(1986)BiosystematicInvestigationontheFamilyofDuckweeds:TheFamilyofLemnaceae—AMonographStudy(GeobatanischenInstitutETH,StiftungRubel,Zurich))。浮萍的生長習性對于微生物培養(yǎng)方法來說是理想的。該植物通過新葉的營養(yǎng)性出芽,以類似于酵母的無性繁殖的宏觀方式迅速增殖。這種增殖通過分生細胞的營養(yǎng)性出芽完成。分生組織區(qū)很小并且發(fā)現(xiàn)是在葉狀體的腹側(cè)表面上。分生細胞位于兩個嚢中,葉的中脈的每一側(cè)上各有一個。該小的中脈區(qū)也是根起源和莖產(chǎn)生的位點,其將每一葉與其母葉連接。分生組織的嚢通過組織瓣保護。葉從這些嚢交替地出芽。倍增時間因種而不同并且短至20-24個小時(Landolt(1957)Ber.Schweiz.Bot.Ges.67:271;Chang等,(1977)Bull.Inst.Chem.Acad.Sin.24:19;Datko和Mudd(1970)PlantPhysiol.65:16;Venkataraman等,(1970)ZPflanzenphysiol.62:316)。浮萍的集約培養(yǎng)導致每單位時間最高速率的生物量積累(Landolt和Kandeler(1987)TheFamilyofLemnaceae—AMonographicStudyVol.2:Phytochemistry,Physiology,Application,Bibliography(VeroffentlichungendesGeobotanischenInstitutesETH,StiftungRubel,Zurich)),干物質(zhì)積累量的范圍是鮮重的6-15%(Tillberg等,(1979)Physiol.Plant.46:5;Landolt(1957)Ber.Schweiz.Bot.Ges.67:271;Stomp,數(shù)據(jù)未公開)。據(jù)報道,在不同條件下生長的許多浮萍物種的蛋白質(zhì)含量的范圍是干重的15-45%(Chang等,(1977)Bull.Inst.Chem.Acad.Sin.24:19;Chang和Chui(1978)Z.Pflanzenphysiol.89:91,.Porath等,(1979)AquaticBotany7:272、Appenroth等,(1982)Biochem.Physiol.Pflanz.177:251)。利用這些值,在浮萍中每升培養(yǎng)基的蛋白質(zhì)生產(chǎn)水平在與酵母基因表達系統(tǒng)相同的數(shù)量級上。浮萍植物或浮萍結(jié)節(jié)培養(yǎng)物(noduleculture)可以用含有所關注的核苷酸序列的表達盒,通過多種方法的任意一種進行有效地轉(zhuǎn)化,所述方法包括農(nóng)桿菌介導的基因轉(zhuǎn)移、基因槍轟擊(ballisticbombardment)或電穿孔。穩(wěn)定的浮萍轉(zhuǎn)化體可以通過這樣分離用所關注的核苷酸序列和賦予對選擇試劑抗性的基因兩者轉(zhuǎn)化浮萍細胞,之后在含有該選擇試劑的培養(yǎng)基中培養(yǎng)轉(zhuǎn)化的細胞。參見Stomp等的美國專利No.6,040,498。浮萍基因表達系統(tǒng)提供了應該可用于許多研究和商業(yè)應用的關鍵技術。總的來說,對于植物分子生物學研究,可以以酵母的實驗室便利性進行操作的分化植物系統(tǒng)提供了在其中分析分離的基因的發(fā)育和生理學作用的非常快速的系統(tǒng)。對于有價值的多肽的商業(yè)生產(chǎn),基于浮萍的系統(tǒng)具有許多優(yōu)于現(xiàn)存的微生物培養(yǎng)系統(tǒng)或細胞培養(yǎng)系統(tǒng)的優(yōu)點。植物顯示了類似于哺乳動物細胞的翻譯后加工,克服了一個與生物學上活性哺乳動物多肽在微生物細胞中生產(chǎn)相關的主要問題,并且已經(jīng)通過其它研究顯示,植物系統(tǒng)具有在微生物系統(tǒng)中常常缺乏的組裝多亞基蛋白質(zhì)的能力(Hiatt(1990)Nature334:469)。增大浮萍生物量至商業(yè)化生產(chǎn)重組蛋白質(zhì)所需的水平比類似增大哺乳動物細胞更快且成本更劃算,并且與其它提出的植物生產(chǎn)系統(tǒng)(例如大豆和煙草)不同,浮萍可以在完全裝滿和可控的生物量生產(chǎn)容器中生長,使得將該系統(tǒng)整合進現(xiàn)存的蛋白質(zhì)生產(chǎn)工業(yè)基礎結(jié)構(gòu)更容易。因此,仍然需要用于在浮萍中表達所關注的蛋白質(zhì)的最優(yōu)化的組合物和方法。發(fā)明簡述提供了用于在植物中調(diào)節(jié)基因表達的組合物和方法。組合物包含新的表達控制元件(如啟動子和內(nèi)含子)的核苷酸序列,該表達控制元件分離自浮萍科的泛素、置換型(r)-組蛋白和幾丁質(zhì)酶基因。本發(fā)明的表達控制元件在植物中起始有效連接的異源核苷酸序列的轉(zhuǎn)錄。更具體來講,本發(fā)明組合物包含在SEQIDN0:1-3、N0:13和N0:14中示出的表達控制元件及其變體和片段。組合物還包含這些浮萍科表達控制元件內(nèi)的新的內(nèi)含子序列,尤其是在SEQIDNO:7-9中示出的內(nèi)含子序列及其變體和片段。這些內(nèi)含子序列可以有效連接至所關注的啟動子以增強有效連接的異源核苷酸序列在植物中的表達。還提供了在SEQIDNO:16中示出的新的浮萍科幾丁質(zhì)酶信號肽及其變體和片段,該信號肽由SEQIDNO:15中示出的序列編碼。該信號肽編碼序列可以有效連接至所關注的多肽的編碼序列以引導編碼的多肽的細胞外分泌。本發(fā)明提供了表達構(gòu)建體(如表達盒和載體),其包含有效連接至所關注的異源核苷酸序列的本發(fā)明的表達控制元件和/或內(nèi)含子和/或信號肽-編碼序列。還提供了具有本發(fā)明的表達構(gòu)建體的穩(wěn)定轉(zhuǎn)化的植物、4直物細胞和結(jié)節(jié)。本發(fā)明的組合物可用于引導所關注的核苷酸序列在植物或植物細胞或結(jié)節(jié)中表達的方法。本發(fā)明的方法包括將表達構(gòu)建體引入植物或植物細胞或結(jié)節(jié)中,該表達構(gòu)建體具有有效連接至所關注的核苷酸序列的浮萍科泛素、r-組蛋白或幾丁質(zhì)酶表達控制元件(例如,如在SEQIDNO:1-3、NO:13和NO:14中示出的)或其變體或片段。本發(fā)明的方法還包含將表達構(gòu)建體引入植物或植物細胞或結(jié)節(jié)中,該表達構(gòu)建體包含分離自膨脹浮萍(Lemnagibba)核酮糖-1,5-二磷酸羧化酶小亞基基因(RbcS;例如,如SEQIDNO:10-12中示出的)的表達控制元件。在其它實施方案中,本發(fā)明的方法包括將表達構(gòu)建體引入植物或植物細胞或結(jié)節(jié)中,該表達構(gòu)建體具有有效連接至所關注的多肽的編碼序列的浮萍科幾丁質(zhì)酶信號肽-編碼序列(例如,如在SEQIDNO:15中示出的)或其變體或片段。在一些實施方案中,本發(fā)明的方法涉及由所關注的核苷酸序列編碼的多肽在植物表達系統(tǒng)(如,浮萍表達系統(tǒng))中的產(chǎn)生。本發(fā)明的植物表達系統(tǒng)經(jīng)優(yōu)化而產(chǎn)生了高水平的所關注的多肽序列。因而,本發(fā)明包括用于在植物中表達所關注的核苷酸序列的方法,該植物用表達所關注的核苷酸序列的表達構(gòu)建體轉(zhuǎn)化,其中這些核苷酸序列經(jīng)過修飾而增強了它們在植物中的表達。本發(fā)明的這些和其它方面在下面給出的"發(fā)明詳述"中得到了更詳細的7>開。發(fā)明詳述本發(fā)明提供了涉及新的植物表達控制元件的核酸的組合物和方法,該植物表達控制元件調(diào)節(jié)異源核苷酸序列在植物中的轉(zhuǎn)錄。具體而言,本發(fā)明的組合物包含分離自浮萍科的泛素、r-組蛋白和幾丁質(zhì)酶基因的表達控制元件,包括在SEQIDNO:1-3、NO:13和NO:14中示出的表達控制元件及其變體和片段,如本文在下面所定義的。在這些表達控制元件內(nèi)的各個啟動子序列(SEQIDN0:4-6、N0:13和NO:14)和內(nèi)含子序列(SEQIDNO:7-9)也可用于調(diào)節(jié)植物中的轉(zhuǎn)錄。本發(fā)明還提供了新的浮萍(L.minor)幾丁質(zhì)酶信號肽(SEQIDNO:16)和對應的編碼序列(SEQIDNO:15),及其變體和片段。如本文所用的,"核酸"包括單鏈或雙鏈形式的脫氧核糖核酸或核糖核酸聚合物,并且除非另作限制,否則涵蓋已知的具有天然核苷酸的基本特性的類似物(如肽核酸),因為它們以類似于天然存在的核苷酸的方式與單鏈核酸雜交。本發(fā)明涵蓋了分離的或基本純化的核酸組合物。"分離的"或"純化的"核酸分子大體上或基本上不含這樣的組分,所述的組分如在它們天然存在的環(huán)境中所發(fā)現(xiàn)的,通常伴隨所述核酸分子或蛋白質(zhì)或者與其相互作用。因而,"分離的"或"純化的,,核酸分子在通過重組技術生成時基本上無其它細胞物質(zhì)或培養(yǎng)基,或者在化學合成時基本上無化學前體或其它的化學試劑。優(yōu)選地,"分離的"核酸不含在該核酸源自的生物體的基因組DNA中,天然位于該核酸旁側(cè)的序列(即,位于核酸的5'末端和3'末端的序列)(優(yōu)選為蛋白質(zhì)編碼序列)。例如,在多個實施方案中,分離的核酸分子可含有少于約5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在該核酸源自的細胞的基因組DM中天然位于該核酸分子旁側(cè)的核苷酸序列。本發(fā)明的組合物包含分離的核酸分子,該核酸分子包含SEQIDNO:1-3、NO:13和NO:14中示出的表達控制元件的核苷酸序列及其變體和片段,如本文在下面所描述的。"表達控制元件"意指DNA的調(diào)控區(qū),其通常包含能夠引導RNA聚合酶11在特定編碼序列的合適轉(zhuǎn)錄起始位點起始RNA合成的TATA盒。表達控制元件可另外包含通常位于TATA盒的上游或5'端的其它識別序列,其影響(如增強)轉(zhuǎn)錄起始速率。此外,表達控制元件可另外包含通常位于TATA盒的下游或3'端的序列,其影響(如增強)轉(zhuǎn)錄起始速率。應當認識到,一旦已經(jīng)確定了本文所公開的表達控制元件區(qū)域的核苷酸序列,則分離和確定本文所確定的具體表達控制元件區(qū)域上游的5'非翻譯區(qū)(UTR)中的其它調(diào)控元件是在現(xiàn)有技術的范圍內(nèi)。因而,(例如)本文所公開的表達控制元件區(qū)域還可包含另外的調(diào)控元件,例如負責編碼序列的組織表達和時間表達的那些調(diào)控元件、增強子等。具體參見澳大利亞專利No.AU-A-77751/94和美國專利No.5,466,785及No.5,635,618(將這兩者均以引用方式并入本文)。本發(fā)明的表達控制元件分離自浮萍科數(shù)個成員的泛素、r-組蛋白和幾丁質(zhì)酶基因,并因而稱為"浮萍科表達控制元件"。SEQIDNO:1示出了全長的浮萍Ue咖a邁/加r)泛素表達控制元件,其包括啟動子加5'UTR(核苷酸1-1625)和內(nèi)含子(核苷酸1626-2160)兩者。SEQIDNO:2示出了全長的紫萍(Spirodellapolyrrhiza)泛素表達控制元件,其包括啟動子加5'UTR(核普酸l-1041)和內(nèi)含子(核普酸1042-2021)兩者。SEQIDNO:3示出了全長的稀脈萍(Lemnaaequinoctialis)泛素表達控制元件,其包括啟動子加5'UTR(核苷酸l-964)和內(nèi)含子(核苷酸965-2068)。SEQIDNO:4示出了浮萍泛素表達控制元件的啟動子加5'UTR部分。SEQIDNO:5示出了紫萍泛素表達控制元件的啟動子加5'UTR部分。SEQIDNO:6示出了稀脈萍泛素表達控制元件的啟動子加5'UTR部分。SEQIDNO:7示出了浮萍泛素表達控制元件的內(nèi)含子部分。SEQIDNO:8示出了紫萍泛素表達控制元件的內(nèi)含子部分。SEQIDNO:9示出了稀脈萍泛素表達控制元件的內(nèi)含子部分。SEQIDNO:13示出了全長的浮萍r-組蛋白表達控制元件,其包括啟動子加5'UTR。SEQIDNO:14示出了全長的浮萍幾丁質(zhì)酶表達控制元件,其包括啟動子加5'UTR。SEQIDNO:15示出了浮萍幾丁質(zhì)酶的信號肽-編碼序列。SEQIDNO:16示出了浮萍幾丁質(zhì)酶的信號肽。應當認識到,在SEQIDNO:4-6、NO:13和NO:14中示出的單獨的啟動子加5'UTR序列,及其生物學上的活性變體和片段可用于調(diào)節(jié)有效連接的所關注的核苷酸序列在植物中的轉(zhuǎn)錄。類似地,在SEQIDNO:7-9中示出的一個或多個內(nèi)含子序列及其生物學上的活性片段或變體可有效地連接至所關注的啟動子(包括在SEQIDNO:4、5、6、13或14中示出的啟動子),以便增強有效連接至該啟動子的核苷酸序列的表達。所公開的表達控制元件、信號肽-編碼序列以及編碼的信號肽的片段和變體也由本發(fā)明所涵蓋。本文中表達控制元件的"片段"意指全長表達控制元件的一部分,例如在SEQIDNO:1-3、NO:13和NO:14中示出的任意一個表達控制元件的一部分。表達控制元件的片段保留了生物學活性并因而包括能起始或增強有效連接的核苷酸序列的表達的片段。因而,(例如)短于本文所公開的全長表達控制元件的片段可用來驅(qū)動連接的所關注的核苷酸序列(例如編碼異源蛋白質(zhì)的核苷酸序列)的表達。表達控制元件的這種片段的具體的非限制性實例包括(i)在SEQIDN0M-9任意之一中示出的核苷酸序列(如上文中所述的);(ii)浮萍泛素表達控制元件(SEQIDNO:l)的5'截短形式,例如SEQIDNO:1的核苷酸1288-2160(截短的LmUbq的啟動子No.1,如下文所述的Egs22構(gòu)建體中存在的)和SEQIDNO:1的核普酸1132-2160(截短的LmUbq的啟動子No.2,如下文所述的Egs23構(gòu)建體中存在的);(iii)浮萍r-組蛋白表達控制元件(SEQIDNO:13)的5'截短形式,例如SEQIDNO:13的核普酸461-1808(LmHIS(461-1808),如下文所述的Egsl9構(gòu)建體中存在的)和SEQIDNO:13的核苷酸805-1808(LmHIS(805-1808),如下文所述的Egs20構(gòu)建體中存在的);以及(iv)浮萍幾丁質(zhì)酶表達控制元件(SEQIDN0:14)的5'截短形式,例如SEQIDNO:14的核苷酸51-1338(LmCHT(51-1338),如下文所述的Egs24和Egs25構(gòu)建體中存在的)。如本文所用的,對于指定的核苷酸序列,"全長序列"表示具有天然序列的全部核酸序列。"天然序列"意指內(nèi)源序列,即在生物體基因組中發(fā)現(xiàn)的非工程序列。因而,浮萍科表達控制元件的片段可用作表達控制元件的生物學上的活性部分。表達控制元件的生物學上的活性部分可以通過這樣制備分離本發(fā)明的表達控制元件之一的一部分并評估該表達控制元件的該部分的活性(如起始或增強轉(zhuǎn)錄的能力)。作為表達控制元件的片段的核酸分子包含至少15、20、25、30、35、40、45、50、75、100、325、350、375、400、425、450、500、550、600、650、700、800、900、1200、1500、1800或2000個連續(xù)的核苷酸,或直至本文所公開的全長表達控制元件中存在的核苷酸數(shù)(即,對于SEQIDNO:1為2160個核苷酸,對于SEQIDNO:2為2021個核苷酸,對于SEQIDNO:3為2068個核苷酸,對于SEQIDNO:13為1808個核苷酸,而對于SEQIDNO:14為1338個核香酸)。這樣的片段的核苷酸將通常包含特定表達控制元件的TATA識別序列。這樣的片段可以通過利用限制性內(nèi)切酶切割本文所公開的天然存在的表達控制元件獲得;可以通過合成表達控制元件DNA序列的天然存在的序列的核苷酸序列獲得;或者可以通過利用聚合酶鏈式反應(PCR)技術獲得。具體參見Mullis等,(1987)MethodsEnzymol.155:335-350,以及Erlich等,(1989)PCRTechnology(StocktonPress,NewYork)。這些表達控制元件片段的變體(例如通過定點誘變產(chǎn)生的那些變體)也包含在本發(fā)明的組合物中。本文中信號肽編碼序列和編碼的信號肽的"片段"旨在表示編碼序列的一部分或由其編碼的信號肽的一部分。對于編碼序列,核苷酸序列的片段可編碼保留了天然多肽(在該情況下,為天然的浮萍幾丁質(zhì)酶信號肽)的生物學活性的多肽片段。因而,浮萍幾丁質(zhì)酶信號肽的功能性片段可引導所關注的成熟蛋白質(zhì)通過植物細胞的分泌途徑移出。核苷酸編碼序列的片段的范圍是至少約20個核苷酸、約25個核苷酸、約50個核苷酸、約75個核苷酸,并且直至編碼浮萍幾丁質(zhì)酶信號肽的整個核苷酸序列(即,直至SEQIDNO:15的84個核苷酸)。"變體,,意指與本文所公開的表達控制元件(如SEQIDNO:1-3、NO:13和NO:14)或其片段(如在SEQIDNO:4-9中示出的序列),或與信號肽-編碼序列(如SEQIDNO:15)或信號肽(如SEQIDN0:16)或其片段具有基本相似性的序列。對于核苷酸序列,天然存在的變體(例如上述這些)可以用熟知的分子生物學技術,例如用如下文概述的PCR和雜交技術鑒定。核苷酸序列變體還包括通過合成衍生的核苷酸序列,例如那些如通過利用定點誘變產(chǎn)生的序列。一般而言,本發(fā)明的具體核苷酸序列的變體(包括SEQIDNO:1-9和13-15任意一個的變體)應該與該核苷酸序列具有至少40%、50%、60%、65%、70%,通常至少75%、80%、85°/。,優(yōu)選約90%、91°/。、92%、93°/。、94%至95°/。、96°/。、97%,并且更優(yōu)選98%、99%或更大的序列同一性,序列同一性通過下文所描述的序列比對程序采用默認參數(shù)測定。生物學上的活性變體也由本發(fā)明所涵蓋。生物學上的活性變體包括(例如)具有一個或多個核苷酸取代、缺失或插入的本發(fā)明的天然表達控制元件或天然信號肽-編碼序列。如本文所用的,兩個核酸序列或兩個多肽序列的"序列同一性"或"同一性"涉及在這兩個序列中當在特定比較窗口上以最大的對應性比對時其中相同的殘基。"比較窗口"意指連續(xù)且確定的多核苷酸/多肽序列的片段,其中比較窗口中的多核苷酸/多肽序列與用于這兩個序列的最佳比對的參考序列(其不包含添加或缺失)比較可包含添加或缺失(即空位)。通常,比較窗口的長度為至少20個連續(xù)的核苷酸/氨基酸,并且可任選為30、40、50、100個核苷酸/氨基酸或更長。用于比較的序列的比對方法是本領域熟知的。因而,任意兩個序列之間的百分比序列同一性的測定可用數(shù)學算法完成。這種數(shù)學算法的非限制性實例是Myers和Miller的算法((1988)"BIOS4:11-17);Smith等的局部比對算法((1981)Adv.Appl.Math.2:482)、Needleman和Wunsch的全局比對算法((1970)J.Mol.Biol.48:443-453);Pearson和Lipman的搜索-局部比對法(search-for-localalignmentmethod)((1988)Proc.Natl.Acad.Sci.85:2444-2448);Karlin和Altschul的算法((1990)Proc.Natl.Acad.Sci.USA87:2264),其在Karlin和Altschul(1993)Proc.Natl.Acad.SciUSA90:5873-5877中得到改進。這些數(shù)學算法的計算機實現(xiàn)可用于進行序列比較以測定序列同一性。這些實現(xiàn)包括但不限于PC/Gene程序中的CLUSTAL(可從Intelligenetics,MountainView,California獲得);ALIGN程序(2.0版)和GCGsconsinGenetics軟件包(10版)中的GAP、BESTFIT、BLAST、FASTA和TFASTA(可從Accelrys公司,9685ScrantonRoad,SanDiego,California,USA獲得)。用這些程序進行比對可采用默認參數(shù)進行。CLUSTAL程序由Higgins等,(1988)Gene73:237-244(1988);Higgins等,(1989)CABIOS5:151-153;Corpet等,(1988)NucleicAcidsRes.16:10881-90;Huang等,(1992)CABIOS8:155-65;以及Pearson等,(1994)Meth.Mol.Biol.24:307-331進行了充分的描述。ALIGN程序是基于Myers和Miller的算法(1988)CABIOS4:11-17。當比較氨基酸序列時,用ALIGN程序可釆用下列參數(shù):PAM120殘基權重表、空位長度罰分-12以及空位罰分=4。Altschul等的BLAST程序((1990)J.Mol.Biol.215:403)是基于Karlin和Altschul的算法((1990)Proc.Natl.Acad.Sci.USA87:2264)。BLAST核苷酸搜索可用BLASTN程序(得分-lOO,字串長度=12)進行,以獲得與本發(fā)明的核苷酸序列同源的核苷酸序列。BLAST蛋白質(zhì)搜索可用BLASTX程序(得分-50,字串長度-3)進行,以獲得與本發(fā)明的蛋白質(zhì)或多肽同源的氨基酸序列。對于為了比較目的而獲得帶空位的比對,可以如在Altschul等,(1997)NucleicAcidsRes.25:3389中所描述的利用GappedBLAST(在BLAST2.0中)。可選擇地,PSI-BLAST(在BLAST2.0中)可用于進行檢測分子之間的親緣關系的迭代搜索。參見Altschul等,(1997)NucleicAcidsRes.25:3389。當使用BLAST、GappedBLAST、PSI-BLAST時,可以采用各自程序的默認參數(shù)(如,對于核苷酸序列用BLASTN而對于蛋白質(zhì)用BLASTX)。GAP采用了Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453),用以得到兩個完整序列的匹配數(shù)最大而空位數(shù)最小的比對。GAP考慮所有可能的比對和空位位置并且產(chǎn)生具有最大數(shù)量的匹配堿基和最少空位的比對。它允許提供匹配的堿基單位中的空位產(chǎn)生罰分和空位延伸罰分。GAP必須考慮它插入的每個空位的匹配的空位產(chǎn)生罰分數(shù)。如果選擇大于0的空位延伸罰分,對于插入的每個空位,GAP必須另外算上空位的長度與空位延伸罰分的積。GCGWisconsinGenetics軟件包版本10中的默認的用于蛋白質(zhì)序列的空位產(chǎn)生罰分值和空位延伸罰分值分別為8和2。對于核苷酸序列,默認的空位產(chǎn)生罰分是50,而默認的空位延伸罰分為3??瘴划a(chǎn)生罰分和空位延伸罰分可以表示為選自0至200的整數(shù)。因而,(例如)空位產(chǎn)生罰分和空位延伸罰分可以是O、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65或更大。GAP代表了多種最佳比對方法的其中一種。這類最佳比對方法可能有許多,但是其它成員不具有更好的性質(zhì)。GAP顯示了用于比對的四個準則質(zhì)量、比率、同一性和相似性。質(zhì)量指為了比對序列而最大化了的尺度。比率指質(zhì)量除以短片段中的堿基數(shù)。百分比同一性指實際匹配符號的百分比。百分比相似性指相似符號的百分比。在空位對面的符號忽略不計。當一對符號的打分矩陣值大于或等于0.50(相似性閥值)時,相似性被打分。在GCGWisconsinGenetics軟件包版本10中使用的打分矩陣是BLOSUM62(參見HenikoffandHenikoff(1992)Proc.Natl.Acad.Sci.USA89:10915)。比對也可以通過目測手動進行。兩個核酸分子是密切相關的的替代指示是這兩個分子可以在嚴格條件下互相雜交。嚴格條件是序列依賴性的并且在不同的環(huán)境參數(shù)下不同。通常,在確定的離子強度和pH下,選擇嚴格條件為比特定序列的熱解鏈溫度(Tm)約低5-20。C。L是50%的靶序列雜交至完全匹配的探針時的溫度(在確定的離子強度和pH下)。核酸雜交的條件和嚴格性的計算可以在(例如)Sambrook等,(2001)MolecularCloning:ALaboratoryManual(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY)和Tijssen(1993)HybridizationWithNucleicAcidProbes,PartI:TheoryandNucleicAcidPreparation(LaboratoryTechniquesinBiochemistryandMolecularBiology,ElsevierScienceLtd.,NY,NY)中找到。對于本發(fā)明而言,"嚴格條件"包括如果雜交分子和靶序列之間存在低于25%的錯配雜交在其下才會發(fā)生的條件。"嚴格條件"可分成具體的嚴格水平以便更精確的定義。因而,如本文所用的,"適度嚴格性"條件指具有多于25%序列錯配的分子不會在其下雜交的那些條件;"中度嚴格性,,條件指具有多于15%錯配的分子不會在其下雜交的那些條件;而"高嚴格性"條件指具有多于10%錯配的序列不會在其下雜交的那些條件。"非常高的嚴格性"條件指具有多于6%錯配的序列不會在其下雜交的那些條件,可用多種本領域技術人員所熟知的技術測定,所述的技術包括(例如)RNA印跡分析、遭受轉(zhuǎn)錄融合的報告子活性測量等。參見(例如)Sambrook等(2001)MolecularCloning:ALaboratoryManual(ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY)。可選擇地,表達控制元件的測定可以基于對在表達控制元件或其片段或變體的控制下產(chǎn)生的報告基因(例如P-葡萄糖醛酸酶(GUS)、綠色焚光蛋白(GFP)等)的水平來測量。參見,例如,美國專利No.6,072,050,將其以引用方式并入本文。浮萍幾丁質(zhì)酶信號肽或其片段或變體的活性同樣可以用多種本領域技術人員所熟知的技術測定,包括檢測幾丁質(zhì)酶信號肽或其片段或變體引導所關注多肽的細胞外分泌的能力的那些技術。用于誘變和核苷酸序列變更的方法是本領域所熟知的。參見,例如Kunkel(1985)Proc.Nat1.Acad.Scl.USA82:488-492、Kunkel等,(1987)MethodsinEnzymol.154:367-382;美國專利No.4,873,192(將其以引用方式并入本文);Walker和Gaastra,eds.(1983)TechniquesinMolecularBiology(MacMillanPublishingCompany,NY)以及其中所引用的參考文獻。本發(fā)明的浮萍科表達控制元件及其變體或片段在組裝于核苷酸構(gòu)建體內(nèi)使得該表達控制元件有效連接至所關注的核苷酸序列時,使得能在植物或植物細胞或結(jié)節(jié)(如,(例如)來自紫萍屬、蕪萍(/^//773)屬、/To/i7e//a屬、Za/^/〃a屬或浮萍ae范/za)列。二有效連i:意指所關注;核苷酸序列的轉(zhuǎn)錄或翻譯是表達控制元件的影響下。以這種方式,本發(fā)明表達控制元件的核苷酸序列與用于在植物或植物細胞或結(jié)節(jié)中表達的所關注的核苷酸序列(通常為異源核苷酸序列)一起在表達盒或載體中提供。"異源核苷酸序列"意指不是天然與表達控制元件有效連接的序列。雖然該核苷酸序列對所述表達控制元件來說是異源的,但對植物宿主來說它可以是同源的、或天然的、或異源的、或外來的。應當認識到,本發(fā)明的表達控制元件或其變體或片段可用于驅(qū)動各自天然編碼序列的表達。這種構(gòu)建體可改變天然的多肽在植物或植物細胞中的表達水平。因而,可以改變植物或植物細胞的表型。如本文所用的,"載體"指用于將核苷酸構(gòu)建體(例如表達盒)引入宿主細胞中的DM分子例如質(zhì)粒、粘?;蚴删w??寺≥d體通常含有一個或少量的限制性核酸內(nèi)切酶識別位點以及如本文在下面所描述的標記基因,在該識別位點外源DM序列可以以可測定的方式插入而不會喪失載體的基本生物學功能,該標記基因適合用于鑒定和選擇用克隆載體轉(zhuǎn)化的細胞。如本文所用的,術語"植物"包括整林植物、植物器官(如,葉、莖、根等)、種子、植物細胞和植物的后代。轉(zhuǎn)基因植物的部分在本發(fā)明的范圍內(nèi)應該理解為包括(例如)植物細胞、原生質(zhì)體、組織、愈傷組織、胚以及花、胚珠、莖、果實、葉、根、根尖等,其源自預先用本發(fā)明的DM分子轉(zhuǎn)化的轉(zhuǎn)基因植物或它們的后代并因而由至少一部分轉(zhuǎn)基因細胞組成。如本文所用,術語"植物細胞"包括而不限于種子、胚、分生組織區(qū)、愈傷組織、葉、根、芽、配子體、孢子體、花粉和小孢子的細胞??捎糜诒景l(fā)明方法的植物類型大致與可用于轉(zhuǎn)化技術的高等植物的類型一樣廣泛,包括單子葉植物和雙子葉植物兩者。這樣的植物包括(例如)浮萍。術語"浮萍,,指浮萍科的成員。該科通常分成如下5個屬和38個浮萍種浮萍屬(稀脈萍、L.disperma、L.ecuadoriensis、膨脹浮萍、L.japonica、浮萍、L.miniscula、L.obscura、稀脈浮萍(L.perpusilla)、Ltenera、品藻(Ltrisulca)、L.turionifera、L.valdiviana);紫萍屬(Spirodela)(S.intermedia,紫萍(S.polyrrhiza)、S.punctata);蕪萍屬(WolffU)(Wa.angusta、蕪萍(Wa.arrhiza)、Wa.australina、Wa.borealis、Wa.brasiliensis、Wa.columMana、Wa.elongata、微萍(Wa.globosa)、Wa.microscopica、Wa.neglecta);Wolfiella屬(W1.caudata、Wl.denticulata、Wl.gladiata、Wl.hyalina、Wl.lingulata、Wl.repunda、Wl.rotunda和Wl.neotropica)和Landoltia屬(L.punctata)。浮萍科的任何其它屬或種(如果它們存在的話)也是本發(fā)明的方面。浮萍屬物種可以用Landolt(1986)BiosystematicInvestigationontheFamilyofDuckweeds:ThefamilyofLemnaceae—AMonographStudy(GeobatanischenInstitutETH,StiftungRubel,Zurich)所描述的分類學方法進行分類。如本文所用的,術語"浮萍結(jié)節(jié)"指包含的浮萍細胞中至少約50%、55%、60°/。、65%、70%、75%、80%、85%、90%、95%或100%的細胞是分化細胞的浮萍組織。如本文所用的,"分化細胞"是具有至少一種表型特征(如截然不同的細胞形態(tài)學或標記核酸或蛋白質(zhì)的表達)的細胞,該表型特征可將該細胞與未分化細胞或存在于其它組織類型中的細胞區(qū)分開來。本文所述的浮萍結(jié)節(jié)培養(yǎng)物的分化細胞形成了在它們鄰近的細胞壁處與結(jié)節(jié)融合的互連細胞的平整光滑表面,其中結(jié)節(jié)已經(jīng)開始構(gòu)成散布于整個組織的葉原基。結(jié)節(jié)培養(yǎng)物的組織的表面具有通過胞間連絲(Plasmadesmata)相互連接的表皮細胞。在一些實施方案中,提供了包含有效連接至所關注的核苷酸序列的浮萍科表達控制元件或其變體或片段的表達盒或載體,用于在植物或植物細胞或結(jié)節(jié)中表達由所關注的核苷酸序列編碼的多肽。有效連接的所關注的核苷酸序列可以是其在植物或植物細胞或結(jié)節(jié)中的表達是期望的任何序列。所關注的核苷酸序列將通常是如本文中定義的異源核苷酸序列。示例性的所關注的異源核苷酸序列包括(但不限于)編碼例如下列哺乳動物多肽的序列胰島素、生長激素、ot-干擾素、P-干擾素、P-葡糖腦苷脂酶、p-葡萄糖醛酸酶、視網(wǎng)膜母細胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細胞生成素、粒細胞巨噬細胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細胞因子、受體、人疫苗、動物疫苗、肽和血清白蛋白。術語"多肽"、"肽"和"蛋白質(zhì),,在本文中可交換地使用來指氨基酸殘基的聚合物。該術語適用于其中一個或多個氨基酸殘基是對應的天然存在的氨基酸的人造化學類似物的氨基酸聚合物,以及適用于天然存在的氨基酸聚合物。如本文所用的,術語"編碼"或"編碼的"在用于具體核酸時表示該核酸包含必需的信息來引導核苷酸序列翻譯成特定蛋白質(zhì)。編碼蛋白質(zhì)的信息通過利用密碼子確定。編碼蛋白質(zhì)的核酸可以包含非翻譯序列(如內(nèi)含子)于核酸的翻譯區(qū)中或者可以缺少這種插入的非翻譯序列(例如,如在cDNA中)。在一個具體的非限制性實例中,轉(zhuǎn)化的浮萍通過用表達盒轉(zhuǎn)化獲得,該表達盒包含有效連接至所關注的異源核苷酸序列的浮萍科泛素表達控制元件(例如,如在SEQIDN0:l-3中示出的)、它的片段(例如,如在SEQIDNO:4-9中示出的)、浮萍科r-組蛋白表達控制元件(例如,如在SEQIDNO:13中示出的)、浮萍科幾丁質(zhì)酶表達控制元件(例如,如在SEQIDNO:14中示出的),或這些序列的變體。轉(zhuǎn)化的浮萍還可以通過用含有有效連接至所關注的異源核苷酸序列的下列元件的表達盒轉(zhuǎn)化獲得膨脹浮萍RbcS表達控制元件(例如,如在SEQIDNO:10-12中示出的;參見GenBank登記號S4S165(SSU13;核苷酸694-757)、S45166(SSU5A;核苷酸698-755)和S45167(SSU5B;核苷酸690-751)),或其變體或片段。與沒有該元件的表達比較,在SEQIDNO:10-12中示出的表達控制元件有利地增強了有效連接的異源核苷酸序列在轉(zhuǎn)化的浮萍中的表達。本發(fā)明的表達盒提供有多個限制性酶切位點,其用于插入將在表達控制元件的轉(zhuǎn)錄調(diào)節(jié)下的編碼所關注的蛋白質(zhì)的核苷酸序列。表達盒可以編碼單個所關注的基因??蛇x擇地,表達盒可編碼兩個或多個所關注的基因。本文所述的表達盒在5'-3'的轉(zhuǎn)錄方向上包括在植物中起作用的轉(zhuǎn)錄和翻譯起始區(qū)(如本發(fā)明的表達控制元件或其生物學上的活性變體或片段)、所關注的核苷酸序列以及轉(zhuǎn)錄和翻譯終止區(qū)。本領域已知的任何合適的終止序列都可以根據(jù)本發(fā)明使用。終止區(qū)可以是天然與轉(zhuǎn)錄起始區(qū)一起的,可以是天然與所關注的核苷酸序列一起的,或者可以源自另外的來源。實用的終止區(qū)可從根癌農(nóng)桿菌的Ti-質(zhì)粒獲得,例如章魚堿合成酶和胭脂堿合成酶終止區(qū)。還可以參見Guerineau等,(1991)Mol.Gen.Genet.262:141;Proudfoot(1991)Cell64:671;Sanfacon等,(1991)GenesDev.5:141;Mogen等,(1990)PlantCell2:1261;Munroe等,(1990)Gene91:151;Ballas等,(1989)NucleicAcidsRes.17:7891以及Joshi等(1987)NucleicAcidsRes.15:9627。另外的示例性終止序列是豌豆RubP羧化酶小亞基終止序列、花椰菜花葉病毒35S終止序列,以及來自許多植物物種的泛素終止子。其它合適的終止序列對本領域技術人員來說將是顯而易見的。通常,表達盒將包含用于選擇轉(zhuǎn)化的細胞或組織的選擇標記基因。選擇標記基因包括編碼抗生素抗性的基因,例如編碼新霉素磷酸轉(zhuǎn)移酶II(NEO)、新霉素磷酸轉(zhuǎn)移酶III和潮霉素磷酸轉(zhuǎn)移酶(HPT)的那些基因,以及賦予除草化合物抗性的基因。除草劑抗性基因通常編碼對除草劑不敏感的經(jīng)修飾的靶蛋白質(zhì)或者編碼在除草劑可作用之前將其在植物中的降解或去毒的酶。參見,DeBlock等,(l987)EMBOJ.6:2513;DeBlock等,(1989)PlantPhysiol.91:691、Fromm等,(1990)BioTechnology8:833;Gordon-Kamm等,(1990)PlantCell2:603和Frisch等,(1995)PlantMol.Biol.27:405-9。例如,草甘膦除草劑抗性或碘酰脲類除草劑抗性已經(jīng)用編碼突變的靶標酶5-烯醇丙酮酰莽草酸-3-砩酸合成酶(EPSPS)和乙酰乳酸合成酶(ALS)的基因獲得。對草銨膦、溴草腈(boromoxynil)和2,4-二氯苯氧乙酸(2,4-D)的抗性已經(jīng)通過用編碼使相應的除草劑去毒的膦絲菌素乙酰轉(zhuǎn)移酶、腈水解酶或2,4-二氯苯氧乙酸單氧化酶的細菌基因獲得。對于本發(fā)明而言,選擇標記基因包括(但不限于)編碼新霉素磷酸轉(zhuǎn)移酶II(Fraley等,(1986)CRCCriticalReviewsin植物Science4:l)的基因;編碼新霉素磷酸轉(zhuǎn)移酶III(Frisch等,(1995)植物Mol.Biol.27:405-9)的基因;編碼氰酰胺水合酶(Maier-Greiner等,(1991)Proc.Natl.Acad.Sci.USA88:4250)的基因;編碼天冬氨酸激酶、二氫吡啶二羧酸合成酶(Perl等,(1993)BioTechnology11:715)的基因;bar基因(Toki等,(1992)PlantPhysiol.100:1503;Meagher等,(1996)CropSci.36:1367);編碼色氨酸脫羧酶(Goddijn等,(1993)PlantMol.Biol.22:907)的基因;編碼新霉素磷酸轉(zhuǎn)移酶(NE0;Southern等,(1982)J.Mol.Appl.Gen.1:327)的基因;編碼潮霉素磷酸轉(zhuǎn)移酶(HPT或HYG;Shimizu等,(1986)Mol.Cell.Biol.6:1074)的基因;編碼二氬葉酸還原酶(DHFR;Kwok等,(1986)Proc.Natl.Acad.Sci.USA83:4552)的基因;編碼膦絲菌素乙酰轉(zhuǎn)移酶(DeBlock等,(1987)EMBOJ.6:2513)的基因;編碼2,2-二氯丙酸脫囟素酶(Buchanan-Wollatron等,(1989)J.Cell.Biochem.13D:330)基因;編碼乙酰羥酸合成酶(Anderson等的美國專利No.4,761,373、Haughn等,(1988)Mol.Gen.Genet.221:266)的基因;編碼5-烯醇丙酮酰莽草酸-磷酸合成酶(aroA;Comai等,(1985)Nature317:741)基因;編碼囟代芳基腈水解酶(haloarylnitrilase)(Stalker等的W087/04181)的基因;編碼乙酰輔酶A羧化酶(Parker等,(1990)PlantPhysiol.92:1220)的基因;編碼二氫蝶酸合成酶(sull;Guerineau等,(1990)PlantMol.Biol.15:127)和32kDa光系統(tǒng)II多肽(psbA;Hirschberg等,(1983)Science222:1346(1983)的基因。還包括編碼下列抗性的基因慶大霉素抗性(例如aacCl,髓lleben等,(1989)Mol.Gen.Genet.217:202-208)、氯霉素抗性(Herrera-Estrella等,(1983)EMBOJ.2:987)、曱氨蝶呤抗性(Herrera-Estrella等,(1983)Nature303:209;Meijer等,(1991)PlantMol.Biol.16:807)、潮霉素抗性(Waldron等,(1985)PlantMol.Biol.5:103;Zhijian等,(1995)PlantScience108:219;Meijer等,(1991)PlantMol.Bio.16:807)、鏈霉素抗性(Jones等,(1987)Mol.Gen.Genet.210:86)、大觀霉素抗性(Bretagne-Sagnard等,(1996)TransgenicRes.5:131)、博來霉素抗性(Hille等,(1986)PlantMol.Biol.7:171)、磺胺藥物抗性(Guerineau等,(1990)PlantMol.Bio.15:127)、溴草腈抗性(Stalker等,(1988)Science242:419)、2,4-D(Streber等,(1989)BioTechnology7:811)、膦絲菌素抗性(DeBlock等,(1987)EMB0J.6:2513)、大觀霉素抗性(Bretagne-Sagnard和Chupeau,TransgenicResearch5:131)。Bar基因賦予了對草銨膦類殺蟲劑例如膦絲菌素(PPT)或雙丙氨膦等等的抗性??捎糜诒磉_構(gòu)建體的其它選擇標記包括(但不限于)還負責雙丙氨膦抗性和膦絲菌素抗性的PAT基因、負責咪唑啉酮抗性的ALS基因、負責潮霉素抗性的HPH或HYG基因、負責草甘膦抗性的EPSP合成酶基因、負責Hc-毒素抗性的Hml基因,以及其它常規(guī)使用的且本領域技術人員已知的選擇劑。參見Yarranton(1992)Curr.Opin.Biotech.3:506、Chistopherson等,(1992)Proc.Natl.Acad.Sci.USA89:6314、Yao等,(1992)Cell71:63、Reznikoff(1992)Mol.Microbiol.6:2419、Barkley等,(1980)TheOperon177-220、Hu等,(1987)Cell48:555、Brown等,(1987)Cell49:603、Figge等,(1988)Cell52:713、Deuschle等,(1989)Proc.Natl.Acad.Sci.USA86:5400、Fuerst等,(1989)Proc.Natl.Acad.Sci.USA86:2549、Deuschle等,(1990)Science248:480、Labow等,(1990)Mol.Cell.Biol.10:3343、Zambretti等,(1992)Proc.Nati.Acad.Sci.USA89:3952、Baim等,(1991)Proc.Natl.Acad.Sci.USA88:5072、Wyborski等,(1991)Nuc.AcidsRes.19:4647、Hille訓d-Wissman(1989)TopicsinMol.AndStruc.Biol.10:143、Degenkolb等,(1991)Antimicrob.AgentsChemother.35:1591、Kleinschnidt等,(1988)Biochemistry27:1094、Gatz等,(1992)PlantJ.2:397、Gossen等,(1992)Proc.Natl.Acad.Sci.USA89:5547、Oliva等,(1992)Antimicrob.AgentsChemother.36:913、Hlavka等,(1985)HandbookofExperimentalPharmacology78和Gill等,(1988)Nature334:721。將這些公開以引用方式并入本文。上面列出的選擇標記基因不意味著作為限制。任何致命性或非致命性的選擇標記基因都可用于本發(fā)明。在一些實施方案中,本發(fā)明提供了對所關注的表達的核苷酸序列的修飾以便增強它在所關注的植物中的表達。用于合成具有植物優(yōu)選的密碼子的核苷酸序列的方法是本領域中可獲得的。參見,例如,美國專利No.5,380,831和No.5,436,391(它們兩者以引用方式并入本文)、Periak等,(1991)Proc.Natl.Acad.Sci.USA15:3324、Iannacome等,(1997)PlantMol.Biol.34:485和Murray等,(1989)NucleicAcids.Res.17:477。例如,如果所關注的植物是浮萍,則一種這樣的修飾是用浮萍-優(yōu)選的密碼子合成所關注的核苷酸序列。優(yōu)選的密碼子可以從浮萍中表達的蛋白質(zhì)中最高頻率的密碼子確定。因而,浮萍中具體密碼子的使用頻率可以通過分析一組浮萍編碼序列中的密碼子使用情況來測定。許多浮萍編碼序列是本領域技術人員已知的;參見(例如)GenBank數(shù)據(jù)庫中所包括的序列,其可以通過位于馬里蘭州的貝塞斯達(Bethesda,Maryland)的美國國家生物技術信息中心(NationalCenterforBiotechnologyInformation)(美國國家醫(yī)學圖書館(NationalLibraryofNedicine)的一部分)的網(wǎng)站評估?;诎谧钚翯enBanl^版本中的序列,示出了密碼子使用頻率的表可以在日本千葉的網(wǎng)站KazusaDNAResearchInstitute上找到。該數(shù)據(jù)庫在Nakamura等,(2000)NucleicAcidsRes.28:292中有描述。應當認識到,可以將對于在浮萍和其它單子葉植物或雙子葉植物中表達來說已經(jīng)最優(yōu)化的基因用于本發(fā)明的方法。參見,例如EP0359472、EP0385962、W091/16432、Periak等,(1991)Proc.Natl.Acad.Sci.USA88:3324、Iannacome等,(1997)PlantMol.Biol.34:485、Murray等,(1989)NucleicAcidsRes.17:477等。還應當認識到,基因序列的全部或任何部分可以是優(yōu)化的或合成的。換而言之,也可以使用完全優(yōu)化的或部分優(yōu)化的序列。例如,40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、87%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的密碼子可以是植物優(yōu)選的密碼子(例如浮萍優(yōu)選的密碼子)。因而,在一些實施方案中,編碼所關注的多肽的核苷酸序列包含50-100%之間的浮萍優(yōu)選的密碼子或70-100%之間的浮萍優(yōu)選的密碼子。在一個實施方案中,90%和96%之間的密碼子是浮萍優(yōu)選的密碼子。所關注的核苷酸序列的編碼序列可以包含在浮萍中使用頻率為至少17%的密碼子。膨脹浮萍中的密碼子使用情況(表1)和浮萍中的密碼子使用情況(表2)在下面示出。在一些實施方案中,表1或表2用于選擇浮萍優(yōu)選的密碼子。表l:來自GenBanl^第139版*的膨脹浮萍密碼子使用情況氨基酸密碼子數(shù)量/1000分數(shù)GlyGGG57.0028.890.35GlyGGA8.004.050.05GlyGGT3.001.520.02GlyGGC93.0047.140.58GluGAG123.0062.340.95GluGAA6.003.040.05AspGAT6.003.040.08AspGAC72.0036.490.92ValGTG62.0031.420.47ValGTA0.000.000.00ValGTT18.009.120.14ValGTC51.0025.850.39AlaGCG44.0022.300.21AlaGCA14.007.100.07AlaGCT14.007.100.07AlaGCC139.0070.450.66ArgAGG16.008.110.15ArgAGA11.005.580.10SerAGT1.000.510.01SerAGC44.0022.300.31LysAAG116.0058.791.00LysAAA0.000.000.00AsnAAT2.001.010.03AsnAAC70.0035.480.97MetATG67.0033.961.00lieATA4.002.030.06lieATT0.000.000.00lieATC63.0031.930.94ThrACG19.009.630.25ThrACA1.000.510.01ThrACT6.003.040.08ThrACC50.0025.340.66TrpTGG45.0022.811.00EndTGA4.002.030.36CysTGT0.000.000.00CysTGC34.0017.231.00EndTAG0.000.000.00EndTAA7.003.550.64TyrTAT4.002.030.05TyrTAC76.0038.520.95LeuTTG5.002.530,04LeuTTA0.000.000.00PheTTT4.002.030.04PheTTC92.0046.630.96SerTCG34.0017.230.24SerTCA2.001.010.01SerTCT1.000.510.01SerTCC59.0029.900.42ArgCGG23.0011.660.22ArgCGA3.001.520.03ArgCGT2.001.010.02ArgCGC50.0025.340.48GinCAG59.0029.900.86GinCAA10.005.070.14HisCAT5.002.530.26HisCAC14.007.100.74LeuCTG43.0021.790.35LeuCTA2.001.010.02LeuCTT1.000.510.01LeuCTC71.0035.990.58ProCCG44.0022.300.31ProCCA6.003.040.04ProCCT13.006.590.09ProCCC80.0040.550.56表2:得自GenBank⑧第139版*的浮萍的密碼子使用情況氨基酸密碼子數(shù)量/1000分數(shù)GlyGGG8.0017.390.22GlyGGA11,0023.910.31GlyGGT1.002.170.03GlyGGC16.0034.780.44GluGAG25.0054.350.78GluGAA7.0015.220.22AspGAT8.0017.390.33AspGAC16.0034.780.67ValGTG21,0045.650.53ValGTA3.006.520.07ValGTT6.0013.040.15ValGTC10.0021.740.25AlaGCG13.0028.260.32AlaGCA8.0017.390.20AlaGCT6.0013.040.15AlaGCC14.0030.430.34ArgAGG9.0019.570.24ArgAGA11.0023.910.30SerAGT2.004.350.05SerAGC11.0023.910.26LysAAG13.0028.260.68LysAAA6.0013.040.32AshAAT0.000.000.00AshAAC12.0026.091.00MetATG9.0019.571.00lieATA1.002.170.08lieATT2.004.350.15lieATC10.0021.740.77ThrACG5.0010.870.28ThrACA2.004.350.11ThrACT2.004.350.11ThrACC9.0019.570.50TrpTGG8.0017.391.00EndTGA1.002.171.00CysTGT1.002.170.12CysTGC7.0015.220.88EndTAG0.000.000.00EndTAA0.000.000.00TyrTAT1.002.170.12TyrTAC7.0015.220.88LeuTTG3.006.520.08LeuTTA1.002.170.03PheTTT6.0013.040.25PheTTC18.0039.130.75SerTCG11.0023.910.26SerTCA4.008.700.09SerTCT6.0013.040.14SerTCC9.0019.570.21ArgCGG4.008.700.11ArgCGA4.008.700.11ArgCGT0.000.000.00ArgCGC9.0019.570.24GinCAG11.0023.910.73GinCAA4.008.700.27HisCAT0.000.000.00HisCAC6.0013.041.00LeuCTG9.0019.570.24EeuCTA4.008.700.11LeuCTT4.008.700.11LeuCTC17.0036.960.45ProCCG8.0017.390.29ProCCA7.0015.220.25ProCCT5.0010.870.18ProCCC8.0017.390.29還可以對所關注的核苷酸序列進行其它修飾來優(yōu)化其在植物中的表達。這些修飾包括(但不限于)刪除編碼假多腺苷酸化信號、外顯子-內(nèi)含子剪接位點信號的序列、類似轉(zhuǎn)座子的重復,以及其它像這樣詳細表征了的可能對基因表達有害的序列??梢詫⑿蛄械腉-C含量調(diào)節(jié)至所給定細胞宿主的平均水平,這通過參考在宿主細胞中表達的已知基因來計算。如果可能,可以修飾序列來避免預測的mRNA發(fā)卡二級結(jié)構(gòu)。動物和植物中翻譯起始密碼子的最佳翻譯起始區(qū)核苷酸序列之間存在已知的差異,并且這些翻譯起始區(qū)核苷酸序列的組成可以影響翻譯起始的效率。參見,例如Lukaszewicz等,(2000)PlantScience154:89-98和Joshi等,(1997)PlantMol.Biol.35:993-1001。在本發(fā)明的一些實施方案中,可以修飾所關注的核苷酸序列的翻譯起始密碼子的翻譯起始區(qū)核苷酸序列來增強在浮萍中的表達。在一個實施方案中,修飾核苷酸序列使得所關注的核苷酸序列的翻譯起始密碼子正上游的三個核苷酸為"ACC"。在另一個實施方案中,這些核苷酸是"ACA"。除了本文所述的用于起始或增強異源核苷酸序列在植物中的表達的表達控制元件,所關注的核苷酸序列的表達還可以通過任選使用多種調(diào)控元件來增強。如本文所用的"調(diào)控元件"指通常在結(jié)構(gòu)基因的編碼序列上游(5')的核苷酸序列(DM或RNA),包括轉(zhuǎn)錄控制序列例如前導序列、啟動子、翻譯和轉(zhuǎn)錄增強子或抑制子,以及mRNA穩(wěn)定性和不穩(wěn)定性決定子(determinant)。存在于內(nèi)含子中的序列也可以調(diào)節(jié)所關注的編碼區(qū)的表達。調(diào)控元件也可以存在于3'端至轉(zhuǎn)錄起始位點之間,或存在于轉(zhuǎn)錄區(qū)內(nèi)??梢詫⒍喾N調(diào)控元件有效地連接至其它的調(diào)控元件。如本文所用的"前導序列"指位于mRNA的5'端處的核酸的部分,其從5'CAP位點延伸到AUG蛋白質(zhì)翻譯起始密碼子。前導序列在翻譯起始和基因表達調(diào)控中很重要。例如,一個或多個前導序列可以另外組合使用來增強靶標核苷酸序列的表達。翻譯前導序列是本領域已知的并且包括(但不限于)小RNA病毒前導序列,如EMCV前導序列(腦心肌炎病毒^非編碼區(qū);Elroy-Stein等,(1989)Proc.Natl.Acad.SciUSA86:6126)、馬鈴薯Y病毒前導序列,如TEV前導序列(煙草蝕刻病毒;Gallie等,(1995)Gene165:233)、人免疫球蛋白重鏈結(jié)合蛋白(BiP;Macajak和Sarnow(1991)Nature353:90)、來自苜?;ㄈ~病毒外殼蛋白的mRNA的非翻譯前導序列(AMVRNA4;Jobling和Gehrke(1987)Nature325:622)、煙草花葉病毒前導序列(TMV;GalHe(1989)MolecularBiologyofRNA,23:56)、馬鈴薯蝕刻病毒前導序列(Tomashevskaya等,(1993)J.Gen.Virol.74:2717—2724)、Fed-1非翻譯區(qū)(Dickey(1992)EMB0J.11:2311-2317)、RbcS5'非翻譯區(qū)(Silverthorne等,(1990)J.Plant.Mol.Biol.15:49-58)和玉米褪綠斑駁病毒前導序列(MCMV;Lommel等,(1991)Virology81:382)。還可以參見Delia-Cioppa等,(1987)PlantPhysiology84:965。包含植物內(nèi)含子序列的前導序列也已經(jīng)顯示增強植物中的翻譯效率,所述植物內(nèi)含子序列包括來自玉米脫氫酶1基因、蓖麻過氧化氬酶基因或擬南芥色氨酸途徑基因PAT1的內(nèi)含子序列(Callis等,(1987)GenesDev.1:1183-1200、Mascarenhas等,(1990)PlantMol.Biol.15:913-920)。如本文在上面所述的浮萍科泛素內(nèi)含子(即,如在SEQIDNO:7-9中示出的)可以與不同于它們相應的泛素啟動子的啟動子一起使用,以便增強有效連接的所關注的核苷酸序列的表達。與泛素內(nèi)含子一起使用的啟動子可以是任何適用于所關注的植物的啟動子,包括分別在SEQIDNO:13和NO:14中/>開的新的浮萍科r-組蛋白啟動子和幾丁質(zhì)酶啟動子。其它合適的啟動子可以從多種來源獲得,例如從植物或植物DNA病毒獲得??捎玫膯幼影ǚ蛛x自花椰菜花葉病毒組的那些,例如花椰菜花葉病毒19S和35S(CaMV19S和C藩35S)的轉(zhuǎn)錄啟動子。其它可用的啟動子包括如Kat等,(1987)Science236:1299-1302描述的增強的CaMV35S啟動子(eCaMV35S)和核酮糖1,5-二磷酸羧化酶加氧酶(RUBISCO)的小亞基啟動子。其它合適的啟動子的實例是水稻肌動蛋白啟動子、親環(huán)素(cyclophilin)啟動子、ADH1啟動子(Callis等,(1987)GeneDev.1:1183-1200)、I類patatin啟動子(Bevan等,(1986)Nucl.AcidsRes.14:4675-4638)、ADP葡萄糖焦磷酸化酶啟動子、p-伴大豆球蛋白啟動子(Tiemey等,(1987)Planta172:356-363)、E8啟動子(Deibnan等,(1988)EmboJ.7:3315-3320)、2AII啟動子(Pear等,(1989)PlantMol.Biol.13:639-651)和酸性幾丁質(zhì)酶啟動子(Samac等,(1990)PlantPhysiol.93:907-914)。應當認識到,上述任何增強表達的核苷酸序列修飾都可用于本發(fā)明,包括任意的單一修飾或修飾的任何可能的組合。在一些實施方案中,將本發(fā)明的組合物和方法用于植物表達系統(tǒng)(例如浮萍表達系統(tǒng)),并且所關注的異源核苷酸序列是分泌性蛋白。分泌性蛋白通常從包含"信號肽"的前體多肽轉(zhuǎn)變而來,該信號肽與內(nèi)質(zhì)網(wǎng)(ER)膜上的受體蛋白相互作用而引導生長的多肽鏈轉(zhuǎn)位跨過膜并進入內(nèi)質(zhì)網(wǎng)中以從細胞分泌。這種信號肽通常從前體多肽切除以產(chǎn)生不含信號肽的"成熟"多肽。以這種方式,生物學上的活性多肽得以在植物(例如浮萍)中從表達構(gòu)建體表達,該表達構(gòu)建體具有有效連接至所關注的核苷酸序列的本發(fā)明表達控制元件或其生物學上的活性變體或片段,所關注的核苷酸序列還與編碼引導多肽分泌進培養(yǎng)基中的信號肽的核苷酸序列有效連接。"生物學上的活性多肽,,指具有執(zhí)行一種或多種生物學功能的能力或具有在生物學背景中通常歸因于該多肽的一組活性的多肽。靶向蛋白質(zhì)轉(zhuǎn)移至內(nèi)質(zhì)網(wǎng)(以便向細胞外分泌)的植物信號肽是本領域已知的。參見例如,美國專利No.6,020,169,將其以引用方式并入本文。在一個實施方案中,信號肽是在SEQIDNO:16中示出的新的浮萍幾丁質(zhì)酶信號肽,或其變體或片段,并且表達構(gòu)建體包含有效連接至所關注的核苷酸序列的編碼該信號肽的核苷酸序列。在一些實施方案中,該信號肽編碼序列是在SEQIDNO:U中示出的序列。應當認識到,本發(fā)明的浮萍幾丁質(zhì)酶信號肽,或其變體或片段可用于引導任何所關注的編碼的多肽的細胞外分泌。以這種方式,可以將SEQIDNO:15的信號肽編碼序列或其變體或片段整合進任何表達構(gòu)建體中,使得它能在正確的閱讀框架中有效地連接至所關注的啟動子和所關注的編碼多肽的核苷酸序列。可以將這種表達構(gòu)建體引入植物泌??蛇x擇地,可將哺乳動物信號肽用于靶向在遺傳工程化植物(例如浮萍)中表達的重組多肽以便分泌。已經(jīng)證實植物細胞識別靶向內(nèi)質(zhì)網(wǎng)的哺乳動物信號肽,而且這些信號肽不僅可以引導多肽通過質(zhì)膜分泌而且還可以引導多肽通過植物細胞壁分泌。參見,例如美國專利No.5,202,422和No.5,639,947,將它們兩者以引用方式并入本文。分泌的多肽可以通過本領域已知的常規(guī)手段從培養(yǎng)基收獲并且可以通過色鐠、電泳、透析、溶劑-溶劑萃取等純化。本發(fā)明的方法涉及將表達構(gòu)建體引入植物或植物細胞或結(jié)節(jié)中。"引入"旨在表示以使構(gòu)建體得以進入植物細胞內(nèi)的方式將表達構(gòu)建體給予植物。本發(fā)明的方法不依賴于將表達構(gòu)建體引入植物中的具體方法,僅僅是為了使表達構(gòu)建體獲得進入至少一個植物細胞的內(nèi)部。用于將表達構(gòu)建體引入植物中的方法是本領域已知的,包括(但不限于)穩(wěn)定轉(zhuǎn)化方法、瞬時轉(zhuǎn)化方法以及病毒介導的方法。"穩(wěn)定轉(zhuǎn)化"意指引入植物中的核苷酸序列整合進植物的基因組中,并能夠遺傳給它的后代。"瞬時轉(zhuǎn)化"意指引入植物中的核苷酸序列(如,包含于表達構(gòu)建體中的核苷酸序列)沒有整合進植物的基因組中。本發(fā)明的核苷酸序列可以通過將植物或植物細胞或結(jié)節(jié)與病毒或病毒核酸接觸而被引入植物或植物細胞或結(jié)節(jié)中。一般而言,這種方法涉及將本發(fā)明的核苷酸序列整合進病毒DNA或RNA分子中。用于將核苷酸序列引入植物或植物細胞或結(jié)節(jié)中并在其中表達編碼的蛋白質(zhì)的方法(涉及病毒DNA或RM分子)是本領域已知的。參見例如美國專利No.5,889,191、No.5,889,190、No.5,866,785、No.5,589,367和No.5,316,931,將這幾個專利以引用方式并入本文。轉(zhuǎn)化方法以及用于將核苷酸序列引入植物中的方法可以不同,這取決于作為轉(zhuǎn)化目標的植物或植物細胞或結(jié)節(jié)的類型,即單子葉植物或雙子葉植物。將核苷酸序列引入植物或植物細胞或結(jié)節(jié)中的合適方法包括顯微注射(Crossway等,(1986)Biotechniques4:320-334)、電穿孑L(Riggs等,(1986)Proc.Natl.Acad.Sci.USA83:5602-5606)、農(nóng)桿菌介導的轉(zhuǎn)化(美國專利No.5,563,055和No.5,981,840,這兩個專利以引用方式并入本文)、直接基因轉(zhuǎn)移(Paszkowski等,(1984)EMBOJ.3:2717-2722),以及基因槍粒子加速(ballisticparticleacceleration)(參見例如美國專利No.4,945,050、No.5,879,918、No.5,886,244和5,932,782(將每個專利以引用方式并入本文),以及Tomes等,(1995)"DirectDNATransferintoIntactPlantCellsviaMicroprojectileBombardment,"inPlantCell,Tissue,andOrganCulture:FundamentalMethods,ed.GamborgandPhi11ips(Springer-Verlag,Berlin)、McCabe等,(1988)Biotechnology6:923-926)。根據(jù)常規(guī)的方法,可使已轉(zhuǎn)化的細胞成長為植林。參見,例如McCormick爭,(1986)戶/a/^Ce"We,"5:81-84。在一些實施方案中,穩(wěn)定轉(zhuǎn)化的浮萍植物或浮萍植物細胞或結(jié)節(jié)表達了由于費用或邏輯限制或這兩種原因而不能通過現(xiàn)有基因表達系統(tǒng)進行有效商業(yè)化生產(chǎn)的生物學上的活性多肽。例如,一些蛋白質(zhì)不能在哺乳動物系統(tǒng)中表達,因為該蛋白質(zhì)干擾細胞生存力、細胞增殖、細胞分化,或哺乳動物細胞中的蛋白質(zhì)組裝。這樣的蛋白質(zhì)包括(但不限于)視網(wǎng)膜母細胞瘤蛋白、p53、制管張素和瘦素。本發(fā)明可有利地用于產(chǎn)生哺乳動物調(diào)節(jié)蛋白;考慮到高等植物和哺乳動物之間的大的進化距離,這些蛋白質(zhì)干擾浮萍中的調(diào)節(jié)過程是不可能的。轉(zhuǎn)基因浮萍還可用于產(chǎn)生大量的蛋白質(zhì)例如血清白蛋白(特別是人血清白蛋白)、血紅蛋白和膠原,這挑戰(zhàn)了現(xiàn)存的表達系統(tǒng)的生產(chǎn)能力。另外,可以工程化高等植物系統(tǒng)來比哺乳動物系統(tǒng)更容易地產(chǎn)生生物學上的活性多聚體蛋白質(zhì)(如,單克隆抗體、血紅蛋白、P450氧化酶和膠原等)。用于在浮萍中產(chǎn)生生物學上的活性多聚體蛋白質(zhì)的一個示例性方法利用了含有編碼所有多肽亞基的基因的表達構(gòu)建體。參見,例如During等,(1990)PlantMol.Biol.15:281和vanEngelen等,(1994)PlantMol.Biol.26:1701。然后將該構(gòu)建體用任何已知的轉(zhuǎn)化方法(例如基因槍轟擊或農(nóng)桿菌介導的轉(zhuǎn)化)引入浮萍細胞中。該方法產(chǎn)生了克隆細胞系,該細胞系表達組裝該多聚體蛋白質(zhì)所需的所有多肽。對該方法的改變形式是制備單基因構(gòu)建體,將這些構(gòu)建體的DNA混合在一起,然后用基因槍轟擊或農(nóng)桿菌介導的轉(zhuǎn)化將該DNA混合物遞送進植物細胞中。作為另外的變型,一些或所有構(gòu)建體可以編碼多聚體蛋白質(zhì)的多于一個的亞基(即,以便待雜交的浮萍克隆比多聚體蛋白質(zhì)中的亞基數(shù)少)??蛇x擇地,每個浮萍克隆表達多聚體蛋白質(zhì)的至少一個亞基,并且將分泌每個亞基的浮萍克隆一起培養(yǎng)并且多聚體蛋白質(zhì)在培養(yǎng)基中從多個分泌的亞基組裝。在一些情況下,可能期望在轉(zhuǎn)化的浮萍植物或浮萍結(jié)節(jié)中產(chǎn)生少于多聚體蛋白質(zhì)的全部的亞基,或者甚至產(chǎn)生單個蛋白質(zhì)亞基,例如用于工業(yè)或化工工藝或者為了診斷、治療或疫苗接種目的。下面的實施例是以舉例說明的目的而不是以限定的方式提供。實驗實施例1:表達栽體在下面描述的實施例中使用的表達載體包括Egs05、Egs07、Egsll、Egs22、Egs23、Egs46、Egs50、Egs51、Egsl9、Egs20、Egs24、Egs25、IFN53和IFN54。Egs05和Egs07是含有有效連接至大腸桿菌p-葡萄糖趁酸酶(GUS)的編碼序列的控制啟動子的未經(jīng)修飾的表達載體,它們各自具有不同的選擇標記基因。Egsll包含有效連接至GUS編碼序列的全長的浮萍泛素表達控制元件(SEQIDNO:1),具有選擇標記基因。Egs22和Egs23是類似的構(gòu)建體,但使用了截短形式的浮萍泛素表達控制元件。在Egs22中,SEQIDNO:1的核苷酸l288-2160驅(qū)動有效連接的GUS編碼序列的表達。在Egs23中,SEQIDNO:l的核苷酸1132-2160驅(qū)動該GUS編碼序列的表達。Egs46類似于Egsll,但包含不同的選擇標記基因。Egs50包含有效連接至GUS編碼序列的全長的紫萍泛素表達控制元件(SEQIDNO:2),具有選擇標記基因。類似地,Egs51包含有效連接至GUS編碼序列的全長的稀脈萍泛素表達控制元件(SEQIDNO:3),具有選擇標記基因。Egsl9包含有效連接至GUS編碼序列的浮萍r-組蛋白表達控制元件(SEQIDNO:13)的核苷酸461-1808,具有選擇標記基因。在Egs20中,SEQIDNO:13的核苷酸805-1808驅(qū)動GUS編碼序列的表達。Egs24包含有效連接至GUS編碼序列的浮萍幾丁質(zhì)酶表達控制元件(SEQIDNO:14)的核苷酸51-1338,具有選擇標記基因。Egs25包制元件(SEQIDNO:14)的核苦酸51-1338,具有選擇標記基因。IFN53和IFN54表達載體每個均含有有效連接至密碼子優(yōu)化的干擾素oc-卩b基因的AmasPmas超強啟動子、膨脹浮萍RbcSSSU5B表達控制元件(SEQIDNO:12)以及玉米ADH1內(nèi)含子,并且或者具有密碼子優(yōu)化的ot淀粉酶信號序列(IFN53)或者具有浮萍幾丁質(zhì)酶信號序列(SEQIDNO:15;IFN54)。實施例2:浮萍的轉(zhuǎn)化采用農(nóng)桿菌介導的轉(zhuǎn)化方法,將浮萍葉或浮萍結(jié)節(jié)培養(yǎng)物(在這些實例中源自浮萍林8627)用上述表達構(gòu)建體轉(zhuǎn)化。在這些實例中,4尋才艮癌農(nóng)桿菌(J^ro6a"er/i/邁"邁e尸ac/e/7s)抹C58Z707,—種去-丈擊的廣宿主范圍的C58林(Hepburn等,(1985)J.Gen.Microbiol.131:2961-2969)用于轉(zhuǎn)化。將上述表達構(gòu)建體通過電穿孔或通過利用具有誘動質(zhì)粒(Mobilizingplasmid)pRK2013的大腸桿菌匪294的三親雜交方法誘動轉(zhuǎn)移進根癌農(nóng)桿菌中(Hoekema等,(1983)Nature303:179-180、Ditta等,(1980)Pro"Natl.Acad.Sci.USA77:7347-7350)。將含有上述表達構(gòu)建體的C58Z707林在含500mg/L鏈霉素、50mg/L大觀霉素和50mg/L硫酸卡那霉素的AB基本培養(yǎng)基上(Chilton等,(1974)Proc.Nat.Acad.Sci.USA71:3672-3676)或者YEB或LB培養(yǎng)基(1g/L酵母提取物、5g/L牛肉提取物、5g/L蛋白胨、5g/L蔗糖、0.5g/LMgS04)中劃線接種并讓其在28C下生長過夜。如下制備用于轉(zhuǎn)化的浮萍結(jié)節(jié)培養(yǎng)物。將浮萍葉分離,用無菌解剖刀將根切除,并將葉腹側(cè)朝下放置在pH5.6的MS培養(yǎng)基(MurashigeandSkoogmedium)(產(chǎn)品目錄號M-5519;SigmaChemical公司,St.Louis,MO)上,該培養(yǎng)基補充有5yM2,4-二氯苯氧乙酸、0.5jliM1-苯基-3(1,2,3-噻二唑-5-基)脲噻二唑苯基脲(SigmaP6186)、3%蔗糖、0.4DifcoBacto-瓊月旨(FisherScientific)和0.15%GelrUe(Sigma)。讓葉生長5-6周。此時,出現(xiàn)了結(jié)節(jié)(小的淡黃色細胞群),通常出現(xiàn)在腹側(cè)中心部分。將該結(jié)節(jié)組織與母葉分離并培養(yǎng)于補充有3%蔗糖、0.4%DifcoBacto-瓊脂、0.15%Gelrite、l|aM2,4-二氯苯氧乙酸和2jaM節(jié)腺嘌呤的MS培養(yǎng)基中。如下轉(zhuǎn)化浮萍結(jié)節(jié)培養(yǎng)物。讓合適的根癌農(nóng)桿菌抹在具有50mg/L卡那霉素和100pM乙酰丁香酮的馬玲薯右旋醣瓊脂或YEB或LB瓊脂上生長,并讓其再懸浮于補充有0.6M甘露醇和100jiM乙酰丁香酮的MS培養(yǎng)基中。將結(jié)節(jié)培養(yǎng)物組織通過浸沒在再懸浮的細菌溶液中1-2分鐘接種,吸千除去過量的液體,并將其涂布于由MS培養(yǎng)基組成的共培養(yǎng)培養(yǎng)基上,該MS培養(yǎng)基補充有經(jīng)優(yōu)化用于促進結(jié)節(jié)生長的植物生長素和細胞分裂素以及100nM的乙酰丁香酮。參見,Yamamoto等,(2001)InVitroCellDev.Biol.Plant37:349-353。為了選擇,將結(jié)節(jié)培養(yǎng)物組織轉(zhuǎn)移至再生培養(yǎng)基(補充有1%蔗沖唐、0.4%DifcoBacto-瓊脂、0.15%Gelrite、500mg/L頭孢噢將和6mg/L遺傳霉素的0.5XSchenkandHildebrandt培養(yǎng)基),并在持續(xù)光照(20-40jjM/m2(秒)下培養(yǎng)大約6-8周。將結(jié)節(jié)組織每7天轉(zhuǎn)移至新鮮的培養(yǎng)基中。當結(jié)節(jié)組織顯示在選擇試劑上健壯生長時,選擇完成。實施例3:大腸桿菌GUS在浮萍中的瞬時表達在用Egs05、Egs07、Egsll、Egs22、Egs23、Egs46、Egs50、Egs51、Egsl9、Egs20、Egs24和Egs25構(gòu)建體轉(zhuǎn)化的浮萍結(jié)節(jié)培養(yǎng)物中評估GUS的瞬時表達。所有構(gòu)建體都能夠驅(qū)動強的GUS表達,這通過"小時染色測定(表3)。另外,在用Egs07、Egs46、Egs50和Egs51構(gòu)建體轉(zhuǎn)化的浮萍結(jié)節(jié)培養(yǎng)物上進行GUS酶測定法。36個Egs07轉(zhuǎn)基因系的平均值是1.345%的GUS,29個Egs46轉(zhuǎn)基因系的平均值是2.32(T/。的GUS,4個Egs50轉(zhuǎn)基因系的平均值是4.008%的GUS,并且8個Egs51轉(zhuǎn)基因系的平均值是6.682%的GUS。表3:愈傷組織中的GUS瞬時表達<table>tableseeoriginaldocumentpage42</column></row><table>24小時染色;按1至4評定等級。實施例4:千擾素在浮萍中的表達用IFN53和IFN54構(gòu)建體制備數(shù)百個轉(zhuǎn)基因浮萍品系,隨后通過ELISA根據(jù)千擾素表達對它們進行篩選。觀察到這兩種構(gòu)建體具有相似水平的干擾素表達。IFN53:最高表達者為1735.66ng/ml;平均表達為362.04ng/ml。IFN54:最高表達者為1173.81ng/ml;平均表達為347.40ng/ml。領域的技術人員的水平。所有出版物和專利申請均以相同程度以引用方式并入本文,就如同每一出版物或?qū)@暾埍幻鞔_且單獨地表明將其以引用的方式并入本文一樣。盡管為了理解的清楚,已經(jīng)通過說明和實施例的方式相當詳細地描述了上述發(fā)明,但是顯然可以實踐某些改變和修飾而不脫離附帶的權利要求的范圍。權利要求1.一種分離的核酸分子,包含選自下面的核苷酸序列a)包含在SEQIDNO1、2、3、4、5、6、13或14中示出的序列的核苷酸序列;b)包含在SEQIDN01、2、3、4、5、6、13或14中示出的序列的至少50個連續(xù)核苷酸的核苷酸序列,其中所述核苷酸序列起始在植物細胞中的轉(zhuǎn)錄;c)包含在SEQIDNO1、2、3、4、5、6、13或14中示出的序列的功能性片段的核苷酸序列,其中所述片段起始在植物細胞中的轉(zhuǎn)錄;d)包含與在SEQIDNO1、2、3、4、5、6、13或14中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所述核苷酸序列起始在植物細胞中的轉(zhuǎn)錄;和e)在嚴格條件下與a)的核苷酸序列的互補序列雜交的核苷酸序列,其中所述核苷酸序列起始在植物細胞中的轉(zhuǎn)錄。2.—種表達構(gòu)建體,包含根據(jù)權利要求1所述的核酸分子。3.根據(jù)權利要求2所述的表達構(gòu)建體,.還包含有效連接的所關注的異源核苷酸序列。4.根據(jù)權利要求3所述的表達構(gòu)建體,還包含有效連接的信號肽的編碼序列,所述信號肽引導由所述所關注的異源核苷酸序列編碼的多肽分泌進培養(yǎng)基中。5.根據(jù)權利要求4所述的表達構(gòu)建體,其中所述信號肽包含選自下面的氨基酸序列a)SEQIDNO:16中示出的序列;b)與SEQIDNO:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引導所述多肽分泌進培養(yǎng)基中;和c)SEQIDNO:16中示出的序列的功能性片段,其中所述序列引導所述多肽分泌進培養(yǎng)基中。6.根據(jù)權利要求5所述的表達構(gòu)建體,其中所述信號肽的所述編碼序列包含選自下面的核苷酸序列a)SEQIDNO:15中示出的序列;b)與SEQIDNO:15中示出的序列具有至少90°/的序列同一性的序列;和c)SEQIDNO:15中示出的序列的片段;7.根據(jù)權利要求3至6中任意一項所述的表達構(gòu)建體,其中所述所關注的異源核苷酸序列編碼哺乳動物多肽。8.根據(jù)權利要求7所述的表達構(gòu)建體,其中所述哺乳動物多肽選自胰島素、生長激素、ot-干擾素、p-干擾素、p-葡糖腦苷脂酶、葡萄糖醛酸酶、視網(wǎng)膜母細胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細胞生成素、粒細胞巨噬細胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細胞因子、受體、人疫苗、動物疫苗、肽、血清白蛋白及其組合。9.一種轉(zhuǎn)化的植物或植物細胞或結(jié)節(jié),含有根據(jù)權利要求2所述的表達構(gòu)建體。10.根據(jù)權利要求9所述的轉(zhuǎn)化的植物或植物細胞或結(jié)節(jié),其中所述植物或植物細胞或結(jié)節(jié)是單子葉植物。11.根據(jù)權利要求10所述的轉(zhuǎn)化的植物或植物細胞或結(jié)節(jié),其中所述單子葉植物來自選自下列屬的屬紫萍(Spirodela)屬、蕪萍(Wolffia)屬、Wolfiella屬、Landoltia屬和浮萍Lemna屬。12.根據(jù)權利要求所述10的轉(zhuǎn)化的植物或植物細胞或結(jié)節(jié),其中所述單子葉植物是選自下面物種的成員浮萍"e邁"a邁/"or)、丄e邁"a/z7/7z/scw/a、稀脈萍Ue/zmaae,./70"/a//51)和膨脹浮萍。13.根據(jù)權利要求9所述的轉(zhuǎn)化的植物或植物細胞或結(jié)節(jié),其中所述植物或植物細胞或結(jié)節(jié)是雙子葉植物。14.一種分離的核酸分子,包含選自下面的核苷酸序列a)包含在SEQIDNO:7、8或9中示出的序列的核苷酸序列;和b)包含在SEQIDNO:7、8或9中示出的序列的功能性片段的核苷酸序列,其中所述片段增強在植物細胞中的轉(zhuǎn)錄;15.—種表達構(gòu)建體,包含根據(jù)權利要求14所述的核酸分子。16.根據(jù)權利要求l5所述的表達構(gòu)建體,還包含有效連接的所關注的啟動子。17.根據(jù)權利要求16所述的表達構(gòu)建體,其中所述的所關注的啟動子選自含有在SEQIDNO:4、SEQIDNO:5、SEQIDNO:6、SEQIDNO:13和SEQIDNO:14中示出的序列的核苷酸序列。18.—種分離的核酸分子,包含選自下面的核苷酸序列a)包含在SEQIDNO:15中示出的序列的核苷酸序列;b)包含在SEQIDNO:15中示出的序列的至少25個連續(xù)核苷酸的核苷酸序列,其中所述核苷酸序列編碼信號肽;c)包含在SEQIDNO:15中示出的序列的功能性片段的核普酸序列,其中所述核苷酸序列編碼信號肽;和d)包含與在SEQIDNO:15中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所述核苷酸序列編碼信號肽。19.一種表達構(gòu)建體,包含有效連接至所關注的異源核苷酸序列的根據(jù)權利要求18所述的核酸分子。20.根據(jù)權利要求19所述的表達構(gòu)建體,還包含有效連接的所關注的啟動子。21.根據(jù)權利要求20所述的表達構(gòu)建體,其中所述的所關注的啟動子選自含有在SEQIDNO:4、SEQIDNO:5、SEQIDNO:6、SEQIDNO:13和SEQIDNO:14中示出的序列的核苷酸序列。22.根據(jù)權利要求19至21中任意一項所述的表達構(gòu)建體,其中所述的所關注的異源核苷酸序列編碼哺乳動物多肽。23.根據(jù)權利要求22所述的表達構(gòu)建體,其中所述哺乳動物多肽選自胰島素、生長激素、a-干擾素、P-干擾素、p-葡糖腦苷脂酶、P-葡萄糖醛酸酶、視網(wǎng)膜母細胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細胞生成素、粒細胞巨噬細胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細胞因子、受體、人疫苗、動物疫苗、肽、血清白蛋白及其組合。24.—種用于在植物或植物細胞或結(jié)節(jié)中表達核苷酸序列的方法,所述方法包括將表達構(gòu)建體引入所述植物或植物細胞或結(jié)節(jié)中,所述表達構(gòu)建體包含有效連接至所關注的異源核苷酸序列的表達控制元件,其中所述表達控制元件包含選自下面的核苷酸序列a)包含在SEQIDNO:1、2、3、13或14中示出的序列的核苷酸序列;b)包含在SEQIDNO:1、2、3、13或14中示出的序列的至少50個連續(xù)核苷酸的核苷酸序列,其中所述核苷酸序列起始在植物細胞中的轉(zhuǎn)錄;c)包含在SEQIDNO:1、2、3、13或14中示出的序列的功能性片段的核苷酸序列,其中所述片段起始在植物細胞中的轉(zhuǎn)錄;d)包含與在SEQIDNO:1、2、3、13或14中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所迷核苷酸序列起始在植物細胞中的轉(zhuǎn)錄;和e)在嚴格條件下與a)的核苷酸序列的互補序列雜交的核苷酸序列,其中所述核苷酸序列起始在植物細胞中的轉(zhuǎn)錄。25.根據(jù)權利要求24所述的方法,其中所述植物或植物細胞或結(jié)節(jié)是單子葉植物。26.根據(jù)權利要求25所述的方法,其中所述單子葉植物來自選自下列屬的屬紫萍屬、蕪萍屬、/^//7^"屬、h/^o/〃a屬和浮萍屬。27.根據(jù)權利要求25所述的方法,其中所述單子葉植物是選自下面物種的成員浮萍、Ze/zwa邁/z7/"iz/a、稀脈萍和膨脹浮萍。28.根據(jù)權利要求24所述的方法,其中所述植物或植物細胞或結(jié)節(jié)是雙子葉植物。29.根據(jù)權利要求24所述的方法,其中所述表達構(gòu)建體還包含有效連接的信號肽的編碼序列,所述信號肽引導由所述所關注的異源核苷酸序列編碼的多肽分泌進培養(yǎng)基中。30.根據(jù)權利要求29所述的方法,其中所述信號肽包含選自下面的氨基酸序列a)在SEQIDNO:16中示出的序列;b)與在SEQIDNO:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引導所述多肽分泌進培養(yǎng)基中;和c)在SEQIDNO:16中示出的序列的功能性片段,其中所述序列引導所述多肽分泌進培養(yǎng)基中。31.根據(jù)權利要求30所迷的方法,其中所述的所述信號肽的編碼序列包含選自下面的核苷酸序列a)在SEQIDNO:15中示出的序列;b)與在SEQIDNO:15中示出的序列具有至少90%的序列同一性的序列;和c)在SEQIDNO:15中示出的序列的片段。32.根據(jù)權利要求24至31中任意一項所述的方法,其中所述的所關注的異源核普酸序列編碼哺乳動物多肽。33.根據(jù)權利要求32所述的方法,其中所述哺乳動物多肽選自胰島素、生長激素、a-干擾素、p-干擾素、p-葡糖腦苷脂酶、p-葡萄糖醛酸酶、視網(wǎng)膜母細胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細胞生成素、粒細胞巨噬細胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細胞因子、受體、人疫苗、動物疫苗、肽、血清白蛋白及其組合。34.根據(jù)權利要求27所述的方法,其中所述所關注的異源核苷酸序列在所述所關注的異源核苷酸序列的編碼序列中包含浮萍優(yōu)選的密碼子。35.根據(jù)權利要求34所述的方法,其中所述所關注的異源核苷酸序列包含在70-100%之間的浮萍優(yōu)選的密碼子。36.—種用于在植物或植物細胞或結(jié)節(jié)中表達核苷酸序列的方法,所述方法包括將表達構(gòu)建體引入所述植物或植物細胞或結(jié)節(jié)中,所述表達構(gòu)建體包含有效連接至所關注的異源核苷酸序列的表達控制元件,其中所述表達控制元件包含選自下面的核苷酸序列a)包含在SEQIDN0:10、11或12中示出的序列的核苷酸序列;b)包含與在SEQIDNO:10、11或12中示出的序列具有至少90%序列同一性的序列的核苷酸序列,其中所述核苷酸序列增強在植物細胞中的基因表達;和c)在嚴格條件下與a)的核苷酸序列的互補序列雜交的核普酸序列,其中所述核苷酸序列增強在植物細胞中的基因表達。37.根據(jù)權利要求36所述的方法,其中所述植物或植物細胞或結(jié)節(jié)是單子葉植物。38.根據(jù)權利要求37所述的方法,其中所述單子葉植物來自選自下列屬的屬紫萍屬、蕪萍屬、^7/7e77a屬、Za/^o/〃a屬和浮萍屬。39.根據(jù)權利要求37所述的方法,其中所迷單子葉植物是選自下面物種的成員浮萍、Ze/MS邁/"/"i;/a、稀脈萍和膨脹浮萍。40.根據(jù)權利要求36所述的方法,其中所述植物或植物細胞或結(jié)節(jié)是雙子葉植物。41.根據(jù)權利要求.36所述的方法,其中所述表達構(gòu)建體還包含有效連接的信號肽的編碼序列,所述信號肽引導由所述所關注的異源核苷酸序列編碼的多肽分泌進培養(yǎng)基中。42.根據(jù)權利要求41所述的方法,其中所述信號肽包含選自下面的氨基酸序列a)在SEQIDNO:16中示出的序列;b)與在SEQIDN0:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引導所述多肽分泌進培養(yǎng)基中;和c)在SEQIDNO:16中示出的序列的功能性片段,其中所述序列引導所述多肽分泌進培養(yǎng)基中。43.根據(jù)權利要求42所述的方法,其中所述的所述信號肽的編碼序列包含選自下面的核苷酸序列a)在SEQIDNO:15中示出的序列;b)與在SEQIDNO:15中示出的序列具有至少90%的序列同一性的序列;和c)在SEQIDN0:15中示出的序列的片段;44.根據(jù)權利要求36至43中任意一項所述的方法,其中所述的所關注的異源核苷酸序列編碼哺乳動物多肽。45.根據(jù)權利要求44所述的方法,其中所述哺乳動物多肽選自胰島素、生長激素、a-干擾素、P-干擾素、葡糖腦苷脂酶、P-葡萄糖醛酸酶、視網(wǎng)膜母細胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細胞生成素、粒細胞巨噬細胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細胞因子、受體、人疫苗、動物疫苗、肽、血清白蛋白及其組合。46.根據(jù)權利要求39所述的方法,其中所述所關注的異源核苷酸序列在所述所關注的異源核苷酸序列的編碼序列中包含浮萍優(yōu)選的密碼子。47.根據(jù)權利要求46所述的方法,其中所述所關注的異源核苷酸序列包含在70-100%之間的浮萍優(yōu)選的密碼子。48.—種用于在植物或植物細胞或結(jié)節(jié)中表達和分泌異源多肽的方法,所述方法包括將表達構(gòu)建體引入植物或植物細胞或結(jié)節(jié)中,所述表達構(gòu)建體包含有效連接至核苷酸序列的表達控制元件,所述核苷酸序胞外分泌的信^肽的編碼序一列,其中所述信號多肽選自:;'、'a)在SEQIDNO:16中示出的序列;b)與在SEQIDNO:16中示出的序列具有至少90%的序列同一性的序列,其中所述序列引導所述多肽的細胞外分泌;和c)在SEQIDNO:16中示出的序列的功能性片段,其中所述序列引導所述多肽的細胞外分泌。49.根據(jù)權利要求48所述的方法,其中所述的所述信號肽的編碼序列包含選自下面的核苷酸序列a)在SEQIDNO:15中示出的序列;b)與在SEQIDNO:15中示出的序列具有至少90%的序列同一性的序列;和c)在SEQIDNO:15中示出的序列的片段。50.根據(jù)權利要求48或49中任意一項所述的方法,其中所迷所關注的異源核苷酸序列編碼哺乳動物多肽。51.根據(jù)權利要求50所述的方法,其中所述哺乳動物多肽選自胰島素、生長激素、a-干擾素、p-干擾素、P-葡糖腦苷脂酶、P-葡萄糖醛酸酶、視網(wǎng)膜母細胞瘤蛋白、p53蛋白質(zhì)、制管張素、瘦素、促紅細胞生成素、粒細胞巨噬細胞集落刺激因子、纖維蛋白溶酶原、單克隆抗體、Fab片段、單鏈抗體、細胞因子、受體、人疫苗、動物疫苗、肽、血清白蛋白及其組合。52.根據(jù)權利要求48至51中任意一項所述的方法,其中所述表達控制元件選自含有在SEQIDN0:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:13和SEQIDNO:14中示出的序列的核普酸序列。全文摘要本發(fā)明提供了用于調(diào)節(jié)所關注的核苷酸序列在植物中的表達的組合物和方法。所述組合物包括新的核酸分子及其變體和片段,如分離自浮萍科(Lemnaceae)的泛素、r-組蛋白和幾丁質(zhì)酶(chinatase)基因的表達控制元件。另外提供了利用本文所公開的表達控制元件在植物中表達所關注的核苷酸序列的方法。還提供了新的浮萍科信號肽編碼序列和由其編碼的信號肽。在本發(fā)明的表達構(gòu)建體設計用于表達所關注的多肽之處,可以將該新的信號肽-編碼序列包含于本發(fā)明的表達構(gòu)建體中,以提供編碼的所關注的多肽的細胞外分泌。文檔編號A01H5/00GK101395177SQ200780007583公開日2009年3月25日申請日期2007年1月17日優(yōu)先權日2006年1月17日發(fā)明者C·G·皮勒,K·M·寇克斯,L·F·迪凱申請人:比洛克西治療公司