專利名稱:轉(zhuǎn)基因的高色氨酸植物的制作方法
本申請(qǐng)要求于2002年5月3日提交的,美國(guó)臨時(shí)申請(qǐng)系列號(hào)為60/377,727的權(quán)利。
許多重要的農(nóng)作物,包括大豆和玉米的種子不包含營(yíng)養(yǎng)完全的充足數(shù)量的幾種氨基酸。這些氨基酸包括但不限于色氨酸、異亮氨酸、纈氨酸、精氨酸、賴氨酸、甲硫氨酸和蘇氨酸。因此,這些氨基酸的生物合成途徑,和/或進(jìn)入那些途徑的代謝產(chǎn)物的生物合成途徑,是用于增加這些植物的氨基酸含量的潛在的操作目標(biāo)。
鄰氨基苯甲酸合酶(AS,EC4.1.3.27)催化植物、真菌和細(xì)菌中從芳香氨基酸途徑到生物合成色氨酸分出支路的第一反應(yīng)。
鄰氨基苯甲酸合酶(例如玉米鄰氨基苯甲酸合酶)的最普遍形式是由2個(gè)亞基,α或TrpE亞基和β或TrpG亞基組成的異四聚體酶。2個(gè)α-亞基和2個(gè)β-亞基裝配形成異四聚體的鄰氨基苯甲酸合酶。也已經(jīng)發(fā)現(xiàn)″單體″形式的AS包括具有TrpE和TrpG亞基活性的單個(gè)多肽鏈(例如苜蓿中華根瘤菌(Rhizobium meliloti))。當(dāng)單體的鄰氨基苯甲酸合酶只包括一類多肽時(shí),單體鄰氨基苯甲酸合酶的酶促活性形式一般是由2個(gè)這種單體多肽的同型二聚體組成的。異四聚體和單體的鄰氨基苯甲酸合酶都在利用谷氨酰胺和分支酸的反應(yīng)中催化形成鄰氨基苯甲酸。在α-亞基(在此指″α-結(jié)構(gòu)域″)上發(fā)現(xiàn)的結(jié)構(gòu)域結(jié)合分支酸并除去烯醇丙酮酸側(cè)鏈,而在β-亞基(在此指″β-結(jié)構(gòu)域″)上發(fā)現(xiàn)的結(jié)構(gòu)域?qū)被鶑墓劝滨0穫鬟f到羧酸和烯醇丙酮酸部分間的分支酸苯基環(huán)上的位置。
合成色氨酸的下一個(gè)反應(yīng)是將磷酸核糖焦磷酸的磷酸核糖基部分傳遞到鄰氨基苯甲酸上。吲哚環(huán)在2個(gè)步驟形成,包括將核糖基團(tuán)異構(gòu)轉(zhuǎn)化為核酮糖,然后是環(huán)化反應(yīng)以產(chǎn)生吲哚磷酸甘油。該途徑中的最后反應(yīng)由可能包含1個(gè)或2個(gè)亞基的單個(gè)酶催化。該反應(yīng)實(shí)現(xiàn)吲哚甘油醛-3-磷酸的切割和吲哚基團(tuán)與絲氨酸的縮合(Umbarger,Ann.Rev.Biochem.,47555(1978))。
在較高等的植物和微生物中流入色氨酸途徑的代謝產(chǎn)物顯然受到色氨酸的鄰氨基苯甲酸合酶反饋抑制的調(diào)節(jié)。色氨酸可阻斷需要活化β-結(jié)構(gòu)域和產(chǎn)生相對(duì)于α-結(jié)構(gòu)域活性部位的氨通道途徑的構(gòu)像重排。這種色氨酸的反饋抑制被認(rèn)為降低了經(jīng)鄰氨基苯甲酸合酶的色氨酸的生產(chǎn)。參見(jiàn)Li J.和Last,R.L.,擬南芥(Arabidopsis thaliana)trp5突變株具有抗反饋的鄰氨基苯甲酸合酶和升高的可溶解色氨酸The Arabidopsis thaliana trp5 mutant has afeedback-resistant anthranilate synthase and elevated soluble tryptophan(植物生理學(xué)Plant Physiol.,11051-59(1996))。
已經(jīng)鑒定幾個(gè)氨基酸殘基涉及來(lái)自鼠傷寒沙門(mén)氏菌(Salmonellatyphimurium)的鄰氨基苯甲酸合酶復(fù)合物的反饋調(diào)節(jié)。這種信息提供了氨基末端調(diào)節(jié)位點(diǎn)的證據(jù)(生物化學(xué)雜志J.Biol.Chem.,2668328-8335(1991))。Niyogi等人已經(jīng)使用分子的方法進(jìn)一步表征來(lái)自某些植物的鄰氨基苯甲酸合酶。參見(jiàn),Niyogi和Fink,植物細(xì)胞Plant Cell,4721(1992)和Niyogi等人,植物細(xì)胞Plant Cell,51011(1993)。他們發(fā)現(xiàn)擬南芥鄰氨基苯甲酸合酶的α-亞基是由2個(gè)緊密相關(guān)的、分別調(diào)節(jié)的非等位基因編碼的。這些α-亞基基因中的一個(gè),ASA1,是由創(chuàng)傷和細(xì)菌性病原體浸潤(rùn)誘導(dǎo)的,暗示其涉及防御反應(yīng),而另一個(gè)α-亞基基因,ASA2是以組成性的基礎(chǔ)水平表達(dá)的。兩種預(yù)測(cè)的蛋白質(zhì)共用與細(xì)菌和真菌的鄰氨基苯甲酸合酶蛋白質(zhì)同源的區(qū)域,并且在已經(jīng)被證明描述涉及細(xì)菌中色氨酸反饋抑制的位置包含保守的氨基酸殘基(Caligiuri等人,生物化學(xué)雜志J.Biol.Chem.,2668328(1991))。
色氨酸的氨基酸類似物和色氨酸生物合成途徑中的中間體的類似物(例如5-甲基色氨酸、4-甲基色氨酸、5-氟基色氨酸、5-羥色氨酸、7-氮雜色氨酸、3β-吲哚基乙酸、3-甲基鄰氨基苯甲酸)已經(jīng)顯示抑制原核和真核生物的生長(zhǎng)。可對(duì)植物細(xì)胞培養(yǎng)物進(jìn)行抗這些氨基酸類似物的篩選。例如,已經(jīng)選擇抗5-甲基色氨酸(5-MT)、色氨酸的氨基酸類似物的生長(zhǎng)抑制所培養(yǎng)的煙草、胡蘿卜、馬鈴薯、谷物和毛曼陀羅(Datura innoxia)細(xì)胞系,其生長(zhǎng)抑制是由于表達(dá)改變的鄰氨基苯甲酸合酶。
Ranch等人,植物生理學(xué)Plant Physiol.71136(1983)在雙子葉植物雜草,毛曼陀羅的細(xì)胞培養(yǎng)物中選擇5-MT抗性,并且報(bào)道抗性的細(xì)胞培養(yǎng)物包含增加的色氨酸水平(比野生型水平高出8-30倍)并具有對(duì)色氨酸反饋抑制靈敏度較小的鄰氨基苯甲酸合酶。再生的植物也是對(duì)5-MT有抗性的,包含改變的鄰氨基苯甲酸合酶,并且在葉片中具有比對(duì)照植物的葉片更大的游離色氨酸濃度(4-44倍)。與在煙草(N.tabacum)中的研究相比,改變的酶不在從抗性細(xì)胞系再生的植物中表達(dá),這些結(jié)果表明氨基酸過(guò)量產(chǎn)生的表型可在細(xì)胞水平選擇并且在從毛曼陀羅中所選擇的細(xì)胞再生的完整植株中表達(dá)。
Hibberd等人(美國(guó)專利號(hào)4,581,847)描述了5-MT抗性的玉米細(xì)胞系包含比野生型的鄰氨基苯甲酸合酶對(duì)反饋抑制較少敏感的鄰氨基苯甲酸合酶。一種5-MT抗性細(xì)胞系比非轉(zhuǎn)化的細(xì)胞系積聚大于幾乎二十倍水平的游離色氨酸。
P.C.Anderson等人(美國(guó)專利號(hào)6,118,047)公開(kāi)了利用來(lái)自C28玉米的鄰氨基苯甲酸合酶的色氨酸不敏感的α-結(jié)構(gòu)域在轉(zhuǎn)基因中制備顯示種子中游離色氨酸水平升高的轉(zhuǎn)基因玉米植株(玉米(Zea mays))。
雖然有可能在某些細(xì)胞培養(yǎng)物和植物中選擇5-MT抗性,這些特性不一定與完整植株中過(guò)量生產(chǎn)的游離色氨酸相關(guān)。另外,再生自5-MT抗性系的植物經(jīng)常不表達(dá)酶的改變形式。也不能預(yù)測(cè)該特性將在一段時(shí)間內(nèi)穩(wěn)定并且將會(huì)作為可遺傳的性狀延續(xù)下去。還已經(jīng)從高等植物的細(xì)胞培養(yǎng)物的粗提物中部分地純化鄰氨基苯甲酸合酶(Hankins等人,植物生理學(xué)Plant Physiol.,57101(1976);Widholm,Biochim.Biophys.Acta,320217(1973))。然而,發(fā)現(xiàn)它是很不穩(wěn)定的。因此,必須提供具有可增加植物色氨酸含量的鄰氨基苯甲酸合酶源的植物。
發(fā)明概述本發(fā)明提供編碼可用于產(chǎn)生轉(zhuǎn)基因植物的鄰氨基苯甲酸合酶(AS)的核酸。當(dāng)這種鄰氨基苯甲酸合酶在轉(zhuǎn)基因植物中表達(dá)時(shí),可在植物細(xì)胞內(nèi)獲得升高水平的色氨酸。在一個(gè)實(shí)施方案中,本發(fā)明涉及編碼單體鄰氨基苯甲酸合酶的DNA分子,其中這種單體的鄰氨基苯甲酸合酶是天然的或是鄰氨基苯甲酸合酶的α-和β-結(jié)構(gòu)域的遺傳工程嵌合融合體。來(lái)自幾個(gè)種屬(例如,一些細(xì)菌及其他微生物)的鄰氨基苯甲酸合酶基因,天然地產(chǎn)生組成單個(gè)多肽鏈的單體鄰氨基苯甲酸合酶。然而,大多種屬具有由在分開(kāi)亞基上發(fā)現(xiàn)的2個(gè)α和2個(gè)β結(jié)構(gòu)域組成的異四聚體鄰氨基苯甲酸合酶。本發(fā)明也預(yù)期形成包括連接任何β-結(jié)構(gòu)域的任何鄰氨基苯甲酸合酶α-結(jié)構(gòu)域的嵌合鄰氨基苯甲酸合酶的融合蛋白質(zhì)。
通常,天然存在的單體鄰氨基苯甲酸合酶與多數(shù)植物的鄰氨基苯甲酸合酶序列的同一性是相當(dāng)?shù)偷?。然而,根?jù)本發(fā)明,盡管與植物內(nèi)源的鄰氨基苯甲酸合酶的序列同一性很低,當(dāng)在植物中表達(dá)時(shí),這種單體鄰氨基苯甲酸合酶可提供高水平的色氨酸。因此,本發(fā)明提供可具有差異(divergent)的序列而且能夠在植物宿主中有效提供高水平的色氨酸的單體鄰氨基苯甲酸合酶。例如,包含單體根瘤農(nóng)桿菌(Agrobacterium tumefaciens)鄰氨基苯甲酸合酶的轉(zhuǎn)基因的大豆植株可在種子中產(chǎn)生達(dá)到大約10,000-大約12,000ppm的色氨酸,而平均的trp水平范圍達(dá)到大約7,000-大約8,000ppm。相反,非轉(zhuǎn)基因的大豆植株通常在種子中只具有達(dá)到大約100-大約200ppm的色氨酸。
因此,本發(fā)明提供編碼單體鄰氨基苯甲酸合酶的分離的DNA序列,其中單體的鄰氨基苯甲酸合酶具有鄰氨基苯甲酸α-結(jié)構(gòu)域和鄰氨基苯甲酸β-結(jié)構(gòu)域,并且其中單體的鄰氨基苯甲酸合酶是在植物中表達(dá)的。這種表達(dá)可提高植物中L-色氨酸的水平。
單體的鄰氨基苯甲酸合酶可以是天然單體的??蓮闹蟹蛛x天然單體鄰氨基苯甲酸合酶核酸的生物體的實(shí)例,包括但不限于例如根瘤農(nóng)桿菌、苜蓿中華根瘤菌(例如,Genbank登記號(hào)GI 95177)、Mesorhizobium loti(例如,Genbank登記號(hào)GI 13472468)、馬爾他布魯氏菌(Brucella melitensis)(例如,Genbank登記號(hào)GI 17982357)、念珠藻屬(Nostoc sp.)PCC7120(例如,Genbank登記號(hào)GI 17227910或GI 17230725)、巴西固氮螺菌(Azospirillum brasilense)(例如,Genbank登記號(hào)GI1174156)和魚(yú)腥藻屬(Anabaena)M22983(例如,Genbank登記號(hào)GI152445)的生物體。在一些實(shí)施方案中,分離的DNA編碼具有例如,SEQ ID NO4的氨基酸序列或SEQ ID NOs1或75中任何一個(gè)核苷酸序列的根瘤農(nóng)桿菌鄰氨基苯甲酸合酶。
可選地,單體的鄰氨基苯甲酸合酶可以是任何適用的鄰氨基苯甲酸合酶的α和β結(jié)構(gòu)域的融合體。這種α和β結(jié)構(gòu)域可來(lái)源于玉米、蕓香(Rutagraveolens)、硫磺礦硫化葉菌(Sulfolobus solfataricus)、鼠傷寒沙門(mén)氏菌、粘質(zhì)沙雷氏桿菌(Serratia marcescens)、大腸桿菌(Escherichia coli)、根瘤農(nóng)桿菌、擬南芥、苜蓿中華根瘤菌(例如,Genbank登記號(hào)GI 95177)、百脈根根瘤菌(Mesorhizobiun loti)(例如,Genbank登記號(hào)GI 13472468)、馬爾他布魯氏菌(例如,Genbank登記號(hào)GI 17982357)、念珠藻屬PCC7120(例如,Genbank登記號(hào)GI17227910或GI 17230725)、巴西固氮螺菌(例如,Genbank登記號(hào)GI 1174156)和魚(yú)腥藻屬(Anabaena)M22983(例如,Genbank登記號(hào)GI 152445)、大豆、稻、棉花、小麥、煙草或任何編碼鄰氨基苯甲酸合酶的亞基或結(jié)構(gòu)域的基因。例如,編碼α或β結(jié)構(gòu)域的核酸可利用任何SEQ ID NOs1-70,75-113和116-137中的序列信息獲得。
在另一個(gè)實(shí)施方案中,本發(fā)明提供編碼來(lái)自玉米(Zea mays)的鄰氨基苯甲酸合酶的α結(jié)構(gòu)域,包括SEQ ID NOs5或66的分離DNA。這種分離的DNA可具有核苷酸序列SEQ ID NOs2,67或68??蓪⒎蛛x的DNA可操作地連接啟動(dòng)子,并且當(dāng)在植物中表達(dá)時(shí)可在植物中提供升高水平的L-色氨酸。
在另一實(shí)施方案中,本發(fā)明提供編碼鄰氨基苯甲酸合酶的分離的DNA分子,其中DNA分子編碼基本上與由SEQ ID NOs66,108-111,133和137所例證說(shuō)明的鄰氨基苯甲酸合酶蛋白質(zhì)同源的蛋白質(zhì)。編碼鄰氨基苯甲酸合酶的分離DNA包括基本上與由SEQ ID NOs67,68,104-107和134-136所例證說(shuō)明的DNA分子同源的DNA分子。
在另一個(gè)實(shí)施方案中,本發(fā)明提供包括表達(dá)盒的DNA構(gòu)建體,其中該可操作連接的表達(dá)盒包括(i)異源啟動(dòng)子;(ii)編碼單體鄰氨基苯甲酸合酶蛋白質(zhì)的DNA分子,其中單體的鄰氨基苯甲酸合酶包括包含鄰氨基苯甲酸合酶α-結(jié)構(gòu)域和鄰氨基苯甲酸合酶β-結(jié)構(gòu)域的單個(gè)多肽,以及(iii)轉(zhuǎn)錄終止子。單體的鄰氨基苯甲酸合酶蛋白質(zhì)可包括與由SEQ ID NOs4,7,43,57,77-82和130-132所例證說(shuō)明的蛋白質(zhì)基本上同源的蛋白質(zhì)。DNA分子可包括與由SEQ ID NOs1,75,76,83和121-129所例證說(shuō)明的DNA分子基本上同源的DNA分子。
在進(jìn)一步的實(shí)施方案中,本發(fā)明提供包括第一表達(dá)盒的DNA構(gòu)建體,其中第一表達(dá)盒可操作的連接,包括(i)異源啟動(dòng)子;(ii)編碼鄰氨基苯甲酸合酶α-結(jié)構(gòu)域蛋白質(zhì)的DNA分子和(iii)轉(zhuǎn)錄終止子。
上述的DNA構(gòu)建體可進(jìn)一步包括第二表達(dá)盒,包括可操作的連接(i)異源啟動(dòng)子;(ii)編碼鄰氨基苯甲酸合酶β-結(jié)構(gòu)域蛋白質(zhì)的DNA分子和(iii)轉(zhuǎn)錄終止子。DNA構(gòu)建體可包括與由SEQ ID NOs5,6,8,44,45,66,99,100,101,102,103,108,109,110,111,117,118,133或137所例證說(shuō)明的蛋白質(zhì)基本上同源的α-結(jié)構(gòu)域或β-結(jié)構(gòu)域蛋白質(zhì)。編碼鄰氨基苯甲酸合酶α-結(jié)構(gòu)域或β-結(jié)構(gòu)域蛋白質(zhì)的DNA分子可包括與由SEQ ID NOs2,3,67,94,95,96,97,98,104,105,106,112,116,119,120,134,135或136所例證說(shuō)明的DNA分子基本上同源的DNA分子。具體的實(shí)例包括其中α-結(jié)構(gòu)域鄰氨基苯甲酸合酶蛋白質(zhì)是SEQ ID NO66和β-結(jié)構(gòu)域蛋白質(zhì)是SEQ ID NO118的DNA構(gòu)建體。
分離的DNA也可編碼突變的鄰氨基苯甲酸合酶或突變的鄰氨基苯甲酸合酶結(jié)構(gòu)域。這種突變的鄰氨基苯甲酸合酶或其結(jié)構(gòu)域可具有一種或多種突變。本領(lǐng)域的技術(shù)人員已知,突變可以是沉默的,可產(chǎn)生具有與野生型類似的酶活性的變異基因產(chǎn)物,或可產(chǎn)生具有改變的酶活性的衍生基因產(chǎn)物。本發(fā)明包括所有這類的突變。
可在體外或體內(nèi)從野生型鄰氨基苯甲酸合酶核酸產(chǎn)生突變的分離DNA,并且可編碼例如,一種或多種氨基酸的取代、缺失或插入。產(chǎn)生具有增加活性的、更大穩(wěn)定性的或?qū)ι彼峄蛏彼犷愃莆锏姆答佉种戚^少靈敏性的突變鄰氨基苯甲酸合酶的突變的分離DNAs是合乎需要的。在一個(gè)實(shí)施方案中,鄰氨基苯甲酸合酶或其結(jié)構(gòu)域抗內(nèi)源L-色氨酸或色氨酸類似物的抑制。例如,鄰氨基苯甲酸合酶可在色氨酸-結(jié)合袋或減少鄰氨基苯甲酸合酶靈敏性的其它地方,或其對(duì)于色氨酸抑制的結(jié)構(gòu)域具有一種或多種突變。預(yù)期用于突變的氨基酸殘基是例如在大約48,51,52,293,和298位置的殘基。例如,突變可以是
a)在大約48位用Phe替換Val;b)在大約48位用Tyr替換Val;c)在大約51位用Phe替換Ser;d)在大約51位用Cys替換Ser;e)在大約52位用Phe替換Asn;f)在大約293位用Ala替換Pro;g)在大約293位用Gly替換Pro;或h)在大約298位用Trp替換Phe;其中突變的位置由所選擇的鄰氨基苯甲酸合酶的氨基酸序列與根瘤農(nóng)桿菌鄰氨基苯甲酸合酶氨基酸序列的序列對(duì)比決定。具有這種突變的鄰氨基苯甲酸合酶的實(shí)例包括具有SEQ ID NOs58-65,69,70和84-94的鄰氨基苯甲酸合酶。
分離的DNA可編碼其他元件和功能。本領(lǐng)域的技術(shù)人員所預(yù)期的任何元件或功能都可包括在內(nèi)。例如,分離的DNA也可包括在植物細(xì)胞中有功能的啟動(dòng)子,其可操作地連接到編碼鄰氨基苯甲酸合酶的DNA上。分離的DNA可進(jìn)一步編碼質(zhì)體運(yùn)輸肽。分離的DNA也可編碼選擇性的標(biāo)記或報(bào)道基因。這種選擇性的標(biāo)記可賦予所述植物細(xì)胞除草劑抗性、高蛋白含量、高含油量、高賴氨酸含量、高異亮氨酸含量、高生育酚含量等。DNA序列也可包括編碼一種或多種來(lái)源于蘇云金桿菌(Bacillus thuringiensis)的殺蟲(chóng)劑蛋白質(zhì)的序列。
本發(fā)明進(jìn)一步提供包括本發(fā)明的分離DNA的載體。這種載體可用于在原核和真核細(xì)胞中表達(dá)鄰氨基苯甲酸合酶多肽,用于轉(zhuǎn)化植物細(xì)胞并產(chǎn)生轉(zhuǎn)基因植物。
本發(fā)明也提供包括本發(fā)明的分離DNA的轉(zhuǎn)基因植物。這些分離DNAs在轉(zhuǎn)基因植物中的表達(dá)可導(dǎo)致轉(zhuǎn)基因植物,例如植物的種子或其他部分中的L-色氨酸,優(yōu)選游離的L-色氨酸水平的升高。該水平增至高于不同于轉(zhuǎn)基因大豆植物的,缺乏該DNA的,例如相應(yīng)的未轉(zhuǎn)化細(xì)胞或具有相同遺傳背景的未轉(zhuǎn)化植株的植物細(xì)胞中L-色氨酸的水平。DNA優(yōu)選是可遺傳的,其優(yōu)選通過(guò)可繁殖植物的完全正常的生殖周期傳遞給其后代以及進(jìn)一步傳給下一代。
可具有這種分離的DNA的轉(zhuǎn)基因植物包括雙子葉植物(雙子葉),例如大豆或Canola。可選地,轉(zhuǎn)基因植物可以是單子葉植物(單子葉),例如玉米、稻、小麥、大麥或高粱。
本發(fā)明也提供包含任何本發(fā)明的分離DNAs、鄰氨基苯甲酸合酶多肽、轉(zhuǎn)基因或載體的任何轉(zhuǎn)基因植物的種子。
本發(fā)明進(jìn)一步提供包含具有本發(fā)明的分離DNA或DNA構(gòu)建體的植物的至少一部分的動(dòng)物飼料或人的食品??杀粴w入動(dòng)物飼料或人食品的植物的部分包括例如,種子、葉片、莖、根、塊莖或果實(shí)。所需要的植物部分具有由本發(fā)明的分離DNA編碼的鄰氨基苯甲酸合酶表達(dá)所提供的增加的色氨酸水平。
本發(fā)明進(jìn)一步提供通過(guò)將本發(fā)明的分離DNA導(dǎo)入植物的可再生細(xì)胞用于改變、優(yōu)選增加植物(雙子葉植物或單子葉植物)中色氨酸含量的方法。優(yōu)選地,DNA序列可操作地連接至少一種在植物細(xì)胞中可操作的啟動(dòng)子。鑒定或選擇轉(zhuǎn)化的細(xì)胞,然后再生以產(chǎn)生包括可表達(dá)功能性的鄰氨基苯甲酸合酶多肽的植物。在一些實(shí)施方案中,編碼鄰氨基苯甲酸合酶或其結(jié)構(gòu)域的DNA是突變的DNA。導(dǎo)入的DNA優(yōu)選是可遺傳的并且該植物優(yōu)選是可繁殖的植物。例如,導(dǎo)入的DNA優(yōu)選可通過(guò)完全的性周期傳遞給子代植株,并且可賦予子代的后代高色氨酸的表型。
編碼鄰氨基苯甲酸合酶的DNAs,優(yōu)選整合到也可包括編碼運(yùn)輸肽、例如質(zhì)體運(yùn)輸肽的DNA序列和選擇性標(biāo)記或報(bào)道基因的,可操作地連接一種或多種在靶植物細(xì)胞中有功能的啟動(dòng)子的載體或″轉(zhuǎn)化基因″中。啟動(dòng)子可以是例如,可誘導(dǎo)的啟動(dòng)子、組織特異的啟動(dòng)子、強(qiáng)啟動(dòng)子或弱啟動(dòng)子。其他的轉(zhuǎn)錄本或翻譯調(diào)控元件,例如增強(qiáng)子或終止子,也可功能性地連接編碼鄰氨基苯甲酸合酶的DNA片段。
懸浮培養(yǎng)物中的細(xì)胞或胚胎、完整的組織或器官可通過(guò)多種轉(zhuǎn)化技術(shù)轉(zhuǎn)化,例如通過(guò)微粒子轟擊、電穿孔和根瘤農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化,及其他本領(lǐng)域適用的方法。
因此,轉(zhuǎn)化植物的細(xì)胞,包括天然的鄰氨基苯甲酸合酶基因和轉(zhuǎn)化基因或其他編碼外源鄰氨基苯甲酸合酶的DNA片段。植物細(xì)胞中外源鄰氨基苯甲酸合酶的表達(dá)可導(dǎo)致色氨酸及其次級(jí)代謝產(chǎn)物的水平增加。在一些實(shí)施方案中,這種表達(dá)賦予對(duì)一定數(shù)量的內(nèi)源L-色氨酸類似物的耐受性,例如比具有野生型或色氨酸敏感的鄰氨基苯甲酸合酶的植物細(xì)胞存在至少大約10%多的鄰氨基苯甲酸合酶活性。
本發(fā)明也提供用于改變植物中色氨酸含量的方法,包括(a)將包括可操作地連接到在植物細(xì)胞中有功能的啟動(dòng)子上、編碼鄰氨基苯甲酸合酶結(jié)構(gòu)域和質(zhì)體運(yùn)輸肽的分離DNA的轉(zhuǎn)化基因?qū)胫参锏目稍偕?xì)胞;以及(b)從所述的轉(zhuǎn)化植物細(xì)胞再生轉(zhuǎn)化植株,其中植物的細(xì)胞表達(dá)由分離的DNA編碼的鄰氨基苯甲酸合酶,相對(duì)于同樣遺傳背景的未轉(zhuǎn)化植物中的色氨酸含量,該合酶表達(dá)的數(shù)量有效增加了所述植物中的色氨酸含量。結(jié)構(gòu)域可以是鄰氨基苯甲酸合酶α-結(jié)構(gòu)域。鄰氨基苯甲酸合酶結(jié)構(gòu)域可具有一種或多種突變,例如,減少結(jié)構(gòu)域?qū)ι彼嵋种频撵`敏性的突變。這種突變可以是例如在色氨酸結(jié)合袋(pocket)中。這種結(jié)構(gòu)域可以是,例如,來(lái)自根瘤農(nóng)桿菌、魚(yú)腥藻M22983、擬南芥、巴西固氮螺菌、馬爾他布魯氏菌、大腸桿菌、薄肌眼蟲(chóng)藻(Euglena gracilis)、百脈根根瘤菌、念珠藻屬PCC7120、苜蓿中華根瘤菌、蕓香、血色紅假單胞菌、鼠傷寒沙門(mén)氏菌、粘質(zhì)沙雷氏桿菌、硫磺礦硫化葉菌、大豆、稻、棉花或玉米的鄰氨基苯甲酸合酶結(jié)構(gòu)域。蕓香具有它自己的葉綠體轉(zhuǎn)運(yùn)序列,其可與鄰氨基苯甲酸合酶轉(zhuǎn)基因一起使用。因此,當(dāng)利用蕓香DNA時(shí),本領(lǐng)域的技術(shù)人員不必增加質(zhì)體轉(zhuǎn)運(yùn)序列。
本發(fā)明也提供包括編碼單體鄰氨基苯甲酸合酶或其結(jié)構(gòu)域的DNA的,新的分離和純化的DNA分子。當(dāng)在植物內(nèi)表達(dá)時(shí),這種鄰氨基苯甲酸合酶DNA可提供高水平的色氨酸。在一些實(shí)施方案中,鄰氨基苯甲酸合酶基本上抗游離的L-色氨酸或其類似物的抑制。本發(fā)明包括的新的DNA序列的實(shí)例包括但不限于,從根瘤農(nóng)桿菌、魚(yú)腥藻M22983、擬南芥、巴西固氮螺菌;大豆慢生根瘤菌(Bradyrhizobium japonicum)、馬爾他布魯氏菌、大腸桿菌、薄肌眼蟲(chóng)藻、百脈根根瘤菌、念珠藻屬PCC7120、苜蓿中華根瘤菌、蕓香、血色紅假單胞(Rhodopseudomonas palustris)、深紅紅螺菌(Rhodospirillum rubrum)、鼠傷寒沙門(mén)氏菌、粘質(zhì)沙雷氏桿菌、高粱(Sorghum bicolor)、硫磺礦硫化葉菌、Thermobifida fusca或玉米(Zea mays王蜀黍)或其他鄰氨基苯甲酸合酶分離的DNA分子。
這些DNA序列包括具有在單個(gè)多肽鏈上連接至少另一個(gè)鄰氨基苯甲酸合酶結(jié)構(gòu)域的鄰氨基苯甲酸合酶α-結(jié)構(gòu)域的,合成的或天然存在的單體形式的鄰氨基苯甲酸合酶。單體的鄰氨基苯甲酸合酶可以例如,是鄰氨基苯甲酸合酶α或β結(jié)構(gòu)域的融合體。這種鄰氨基苯甲酸合酶α或β結(jié)構(gòu)域可來(lái)源于根瘤農(nóng)桿菌、魚(yú)腥藻M22983、擬南芥、巴西固氮螺菌、大豆慢生根瘤菌、馬爾他布魯氏菌、大腸桿菌、薄肌眼蟲(chóng)藻、百脈根根瘤菌、念珠藻屬PCC7120、苜蓿中華根瘤菌、蕓香、血色紅假單胞菌、深紅紅螺菌、鼠傷寒沙門(mén)氏菌、粘質(zhì)沙雷氏桿菌、高粱(sorghum bicolor)、硫磺礦硫化葉菌、Thermobifidafusca、高粱屬(sorghum)、大豆、稻、棉花、小麥、煙草或玉米(王蜀黍),或編碼鄰氨基苯甲酸合酶的亞基或結(jié)構(gòu)域的任何基因。這種鄰氨基苯甲酸合酶及其結(jié)構(gòu)域在此也由分離自根瘤農(nóng)桿菌,(SEQ ID NOs175或84-94)、玉米,(SEQ ID NOs2,67,68,96,116或136)、蕓香(SEQ ID NO3)、魚(yú)腥藻M22983、擬南芥(SEQ ID NO45)、巴西固氮螺菌(SEQ ID NO122)、馬爾他布魯氏菌(SEQ ID NO123)、百脈根根瘤菌(SEQ ID NO121)、念珠藻屬PCC7120(SEQ ID NOs124或125)、苜蓿中華根瘤菌、血色紅假單胞菌(SEQID NO126)、硫磺礦硫化葉菌、稻(SEQ ID NOs94,95,119或120)、小麥(SEQID NO97)、煙草(SEQ ID NO98)、陸地棉(Gossypium hirsutum)(SEQ ID NOs104或105)、大豆(Glycine max)(SEQ ID NOs106,107,112或113)、大豆慢生根瘤菌(SEQ ID NO127)、深紅紅螺菌(SEQ ID NO128)、Thermobifidafusca(SEQ ID NO129)或高粱(SEQ ID NOs134或135)的鄰氨基苯甲酸合酶的核酸例證說(shuō)明。這些核苷酸序列從根瘤農(nóng)桿菌(SEQ ID NOs4,58-65,69或70);玉米(SEQ ID NOs5,66,101,118或137)和蕓香(SEQ ID NO6),魚(yú)腥藻M22983、巴西固氮螺菌(SEQ ID NO78)、馬爾他布魯氏菌(SEQ ID NO79)、百脈根根瘤菌(SEQ ID NO77)、念珠藻屬PCC7120(SEQ ID NOs80或81)、苜蓿中華根瘤菌(SEQ ID NOs7或43)、血色紅假單胞菌(SEQ ID NOs57或82)、硫磺礦硫化葉菌(SEQ ID NOs8或44)、稻(SEQ ID NOs99,100或117)、小麥(SEQ ID NO102)、煙草(SEQ ID NO103)、陸地棉(SEQ ID NOs108或109)、大豆(SEQ ID NOs110或111)、大豆慢生根瘤菌(SEQ ID NO130)、深紅紅螺菌(SEQ ID NO131)、Thermobifida fusca(SEQ ID NO132)或高粱(SEQ IDNO133)編碼鄰氨基苯甲酸合酶或其α-結(jié)構(gòu)域或β結(jié)構(gòu)域。
本發(fā)明也提供包括編碼具有酶活性的根瘤農(nóng)桿菌鄰氨基苯甲酸合酶或其結(jié)構(gòu)域的DNA序列的分離DNA分子。這種DNA分子可編碼具有SEQ IDNOs4,58-65,69或70的鄰氨基苯甲酸合酶,具有鄰氨基苯甲酸合酶活性的結(jié)構(gòu)域或其變體。DNA分子也可具有包括SEQ ID NOs1,75或84-93,或其結(jié)構(gòu)域或變體的序列。在此所提供的任何DNA的編碼區(qū)也可被優(yōu)化,用于在所選擇的生物體,例如所選擇的植物或微生物中表達(dá)。具有用于所選擇植物的優(yōu)化密碼子的DNA分子的實(shí)例是具有SEQ ID NO75的根瘤農(nóng)桿菌鄰氨基苯甲酸合酶的DNA分子。
本發(fā)明也提供包括編碼玉米鄰氨基苯甲酸合酶結(jié)構(gòu)域的DNA序列的分離和純化的DNA分子。這種DNA分子可編碼具有SEQ ID NOs5或66的鄰氨基苯甲酸合酶結(jié)構(gòu)域,或具有鄰氨基苯甲酸合酶活性的其變體或衍生物。DNA分子也可具有包括SEQ ID NOs2,67,或68的序列,或其結(jié)構(gòu)域或變體。
本發(fā)明進(jìn)一步提供與包括SEQ ID NOs1,75或84-94中的任何一個(gè)的互補(bǔ)DNA分子在嚴(yán)謹(jǐn)條件下雜交的,至少8個(gè)核苷酸的分離的DNA分子。這種DNA分子可以是探針或引物、例如具有SEQ ID NOs9-42,47-56或138-143中任何一個(gè)的核酸??蛇x地,DNA可包括所選擇的鄰氨基苯甲酸合酶或其結(jié)構(gòu)域的全部編碼區(qū)。這種DNA也可包括編碼在植物細(xì)胞中可操作的啟動(dòng)子的DNA序列和/或編碼質(zhì)體運(yùn)輸肽的DNA序列。本發(fā)明進(jìn)一步涉及用于在植物和/或微生物中轉(zhuǎn)化和表達(dá)這類DNA分子的載體。
與在此所明確描述的DNA序列和氨基酸序列顯示50%、優(yōu)選60%、更優(yōu)選70%、更優(yōu)選80%、最優(yōu)選90%,例如95%-99%的序列同一性的,功能性的鄰氨基苯甲酸合酶DNA序列和功能性的鄰氨基苯甲酸合酶多肽也在本發(fā)明的范疇內(nèi)。例如85%同一性,指當(dāng)2個(gè)序列對(duì)比進(jìn)行最大匹配時(shí),85%的氨基酸是相同的。在最大化匹配中容許缺口(gap)(在任何一個(gè)待匹配的2個(gè)序列中);5個(gè)或較少的間隙(gap)長(zhǎng)度是優(yōu)選的,而2個(gè)或更少是更優(yōu)選的。
可選地和優(yōu)選地,如在此所使用的術(shù)語(yǔ),如果當(dāng)利用具有突變數(shù)據(jù)矩陣以及6分或更大的缺口罰分的ALIGN程序時(shí),它們具有大于5的序列對(duì)比積分(alignmentscore)(在標(biāo)準(zhǔn)偏差單位中),則這2種多肽序列是同源的。參見(jiàn)Dayhoff,M.O.,″蛋白質(zhì)序列和結(jié)構(gòu)的圖譜Atlas of Protein Sequence andStructure″,1972,第5卷,國(guó)家生物醫(yī)學(xué)研究基金會(huì),pp.101-110,以及該卷的增刊2,pp.1-10。更優(yōu)選地當(dāng)利用ALIGN程序進(jìn)行優(yōu)化序列對(duì)比時(shí),如果它們的氨基酸大于或等于50%相同,則2個(gè)序列或其部分是同源的。本發(fā)明進(jìn)一步提供用于產(chǎn)生具有高種子水平的色氨酸的轉(zhuǎn)基因植物的載體,包括編碼單體鄰氨基苯甲酸合酶的分離DNA序列,其中包含連接有鄰氨基苯甲酸合酶β-結(jié)構(gòu)域和質(zhì)體運(yùn)輸肽,并可操作地連接在植物細(xì)胞中有功能的啟動(dòng)子的鄰氨基苯甲酸合酶α-結(jié)構(gòu)域。這種單體的鄰氨基苯甲酸合酶可例如是,根瘤農(nóng)桿菌,苜蓿中華根瘤菌、百脈根根瘤菌,馬爾他布魯氏菌,念珠藻屬PCC7120,巴西固氮螺菌,魚(yú)腥藻M22983,大豆慢生根瘤菌,深紅紅螺菌或Thermobifida fusca的鄰氨基苯甲酸合酶。單體的鄰氨基苯甲酸合酶也可來(lái)源于根瘤農(nóng)桿菌,魚(yú)腥藻M22983,擬南芥,巴西固氮螺菌,馬爾他布魯氏菌、百脈根根瘤菌,念珠藻屬PCC7120,苜蓿中華根瘤菌,血色紅假單胞菌,蕓香,硫磺礦硫化葉菌,鼠傷寒沙門(mén)氏菌,粘質(zhì)沙雷氏桿菌,大豆慢生根瘤菌,深紅紅螺菌,Thermobifida fusca,高粱,大豆,稻,棉花,小麥,煙草,玉米或編碼鄰氨基苯甲酸合酶的亞基或結(jié)構(gòu)域的任何基因的鄰氨基苯甲酸合酶α-和β-結(jié)構(gòu)域的融合體。
提供增加水平的色氨酸的,分離和純化的鄰氨基苯甲酸合酶DNA的轉(zhuǎn)化可在分子水平評(píng)估,例如,Southern或Northern印跡分析,基于PCR的方法學(xué),鄰氨基苯甲酸合酶的生物化學(xué)或免疫學(xué)檢測(cè),或通過(guò)表型分析,即,轉(zhuǎn)化后代的細(xì)胞是否可在存在抑制未轉(zhuǎn)化植物細(xì)胞生長(zhǎng)的大量色氨酸的氨基酸類似物時(shí)生長(zhǎng)。
本發(fā)明也提供在原核或真核宿主細(xì)胞,例如酵母、昆蟲(chóng)細(xì)胞或細(xì)菌中生產(chǎn)鄰氨基苯甲酸合酶的方法,其可以是培養(yǎng)物,優(yōu)選是商業(yè)規(guī)模的。該方法包括將包含編碼鄰氨基苯甲酸合酶或其結(jié)構(gòu)域,例如單體鄰氨基苯甲酸合酶,至少包括α和β鄰氨基苯甲酸合酶的結(jié)構(gòu)域,或其功能性變體的DNA片段的轉(zhuǎn)化基因?qū)胨拗骷?xì)胞,并在宿主細(xì)胞中表達(dá)鄰氨基苯甲酸合酶,以產(chǎn)生功能性的鄰氨基苯甲酸合酶或其結(jié)構(gòu)域的步驟。轉(zhuǎn)化基因通常包括轉(zhuǎn)錄本和翻譯調(diào)控元件,例如在真核或原核起源的宿主細(xì)胞中有功能的啟動(dòng)子。優(yōu)選地,轉(zhuǎn)基因被導(dǎo)入已知可用于生產(chǎn)重組蛋白質(zhì)的,例如大腸桿菌的原核細(xì)胞,或例如酵母或昆蟲(chóng)細(xì)胞的真核細(xì)胞。培養(yǎng)轉(zhuǎn)化細(xì)胞可導(dǎo)致增加色氨酸及其衍生物的生產(chǎn),可從細(xì)胞或培養(yǎng)基中回收該產(chǎn)物。色氨酸的累積也可導(dǎo)致在微生物和植物中增加次級(jí)代謝產(chǎn)物的生產(chǎn),例如包含吲哚的代謝產(chǎn)物,例如植物中的單個(gè)的吲哚,吲哚共軛物,吲哚生物堿,吲哚植物抗毒素和吲哚芥子油苷(glucosinalates)。
對(duì)色氨酸不敏感的鄰氨基苯甲酸合酶具有增加多種分支酸衍生代謝產(chǎn)物的潛能,包括來(lái)自由于色氨酸通過(guò)分支酸變位酶刺激苯基丙氨酸所合成的苯基丙氨酸。參見(jiàn)Siehl,D.來(lái)自植物氨基酸的分支酸的色氨酸、酪氨酸和苯丙氨酸的生物合成生物化學(xué)和生物工藝學(xué),(The biosynthesis of tryptophan,tyrosine and phenylalanine from chorismate in Plant Amino AcidsBiochemistryand Biotechnology),ed.BK Singh,第171-204頁(yè)。當(dāng)反饋不敏感的鄰氨基苯甲酸合酶存在時(shí),可能增加的其他分支酸衍生的代謝產(chǎn)物包括,苯丙酮(phenylpropanoid)、類黃酮和異類黃酮,以及來(lái)源于鄰氨基苯甲酸的代謝產(chǎn)物,例如吲哚、吲哚生物堿和吲哚異硫氰酸鹽。許多化合物是重要的植物激素、植物防御化合物、各種健康狀況的化學(xué)保護(hù)劑(chemopreventive agents)、和/或藥物學(xué)活性的化合物。這些化合物的合成可能由于鄰氨基苯甲酸合酶的表達(dá)而增加,其范圍取決于表達(dá)鄰氨基苯甲酸合酶的生物體。本發(fā)明涉及在多種原核和真核細(xì)胞或生物體,包括植物細(xì)胞、微生物、真菌、酵母、細(xì)菌、昆蟲(chóng)細(xì)胞和哺乳動(dòng)物細(xì)胞中的色氨酸及其他有用化合物的合成。
因此,本發(fā)明提供用于生產(chǎn)色氨酸的方法,包括在足夠表達(dá)由該分離DNA編碼的單體鄰氨基苯甲酸合酶的條件下,培養(yǎng)包括分離的DNA的原核或真核的宿主細(xì)胞,其中單體的鄰氨基苯甲酸合酶包括鄰氨基苯甲酸合酶α結(jié)構(gòu)域和鄰氨基苯甲酸合酶β結(jié)構(gòu)域,并且其中足夠表達(dá)單體的鄰氨基苯甲酸合酶的條件包括,宿主細(xì)胞足以利用單體的鄰氨基苯甲酸合酶合成色氨酸的養(yǎng)分和前體。
可在多種宿主細(xì)胞和/或生物體中表達(dá)產(chǎn)生的有用化合物的實(shí)例包括,吲哚乙酸及其他生長(zhǎng)素;對(duì)心血管健康重要的、存在于大豆中的異類黃酮化合物;在玉米中對(duì)食草昆蟲(chóng)的天敵起信號(hào)作用的揮發(fā)性的吲哚化合物;抗癌劑,例如在十字花科植物家族中發(fā)現(xiàn)的吲哚芥子油苷(吲哚-3-甲醇);以及吲哚生物堿,例如由某些種屬的真菌生產(chǎn)的麥角化合物。(Barnes等人,Adv Exp MedBiol.,40187(1996);Frey等人,Proc Natl Acad.Sci.,9714801(2000);Muller等人,生物化學(xué)Biol.Chem.,381679(2000);Mantegani等人,F(xiàn)armaco,54288(1999);Zeligs,醫(yī)藥食品雜志J Med Food,167(1998);Mash等人,AnnNY Acad Sci.,844274(1998);Melanson等人,Proc Natl Acad.Sci.,9413345(1997);Broadbent等人,Curr Med Chem.,5469(1998))。
本發(fā)明也提供在中度以及優(yōu)選高嚴(yán)謹(jǐn)條件下,與編碼鄰氨基苯甲酸合酶的DNA分子的互補(bǔ)序列雜交的、至少7個(gè)核苷酸堿基的分離和純化的DNA分子。這種分離和純化的DNA分子包括編碼鄰氨基苯甲酸合酶或其結(jié)構(gòu)域或突變體的新的DNA片段。突變的DNA可編碼基本上抗游離L-色氨酸或色氨酸的氨基酸類似物抑制的鄰氨基苯甲酸合酶。這種鄰氨基苯甲酸合酶DNA分子可與例如,根瘤農(nóng)桿菌、血色紅假單胞菌或蕓香的鄰氨基苯甲酸合酶,或其α-結(jié)構(gòu)域,包括其功能性的突變體雜交。當(dāng)這些DNA分子編碼功能性的鄰氨基苯甲酸合酶或鄰氨基苯甲酸合酶結(jié)構(gòu)域時(shí),它們定義為編碼鄰氨基苯甲酸合酶、鄰氨基苯甲酸合酶結(jié)構(gòu)域或其突變體的主要DNA分子的″變體″。較短的DNA分子或寡聚核苷酸可用作PCR擴(kuò)增靶DNA序列的引物,或作為合成全長(zhǎng)基因的中間產(chǎn)物。
也提供雜交探針,包括至少7個(gè)核苷酸堿基的新的分離和純化的DNA片段,其被可檢測(cè)地標(biāo)記或結(jié)合可檢測(cè)的標(biāo)記物,該DNA片段在中度或優(yōu)選高嚴(yán)謹(jǐn)條件下,與包括編碼鄰氨基苯甲酸合酶,例如編碼單體的鄰氨基苯甲酸合酶或其結(jié)構(gòu)域,例如α-結(jié)構(gòu)域,包括基本上抗色氨酸的氨基酸類似物抑制的、其功能性突變體的DNA片段的DNA分子的非編碼鏈雜交。中度和嚴(yán)謹(jǐn)雜交條件是本領(lǐng)域已知的,參見(jiàn),例如Sambrook等人,分子克隆實(shí)驗(yàn)指南Molecular CloningA Laboratory Manual,第2版(1989);也參見(jiàn),Sambrook和Russell,分子克隆實(shí)驗(yàn)室指南,第3版(2001年1月15日)的第0.47-9.51節(jié)。例如,嚴(yán)謹(jǐn)條件是(1)使用低離子強(qiáng)度和高溫進(jìn)行洗滌,例如,50℃,0.015MNaCl/0.0015M檸檬酸鈉(SSC);0.1%十二烷基硫酸鈉(SDS),或(2)在雜交期間使用例如甲酰胺的變性劑,例如,在42℃,50%甲酰胺和0.1%牛血清白蛋白/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/含750mM NaCl,75mM檸檬酸鈉的50mM pH6.5的磷酸鈉緩沖液。另一個(gè)使用的實(shí)例是,在42℃,50%甲酰胺,5×SSC(0.75M NaCl,0.075M檸檬酸鈉),50mM磷酸鈉(pH6.8),0.1%焦磷酸鈉,5×Denhardt′s溶液,超聲處理的鮭魚(yú)精DNA(50μg/ml),0.1%十二烷基磺酸鈉SDS),和10%葡聚糖硫酸酯,并在42℃,0.2×SSC和0.1%SDS中洗滌。
附圖簡(jiǎn)述
圖1是質(zhì)粒pMON61600的限制性圖譜。
圖2表明根瘤農(nóng)桿菌鄰氨基苯甲酸合酶DNA序列(上面的序列)(SEQ IDNO4)的翻譯序列和苜蓿中華根瘤菌的鄰氨基苯甲酸合酶DNA序列(下面的序列)(SEQ ID NO7)的翻譯序列。
圖3是質(zhì)粒pMON34692的限制性圖譜。
圖4是質(zhì)粒pMON34697的限制性圖譜。
圖5是質(zhì)粒pMON34705的限制性圖譜。
圖6A-B表明比較根瘤農(nóng)桿菌α-結(jié)構(gòu)域序列(SEQ ID NO4)和硫磺礦硫化葉菌α-結(jié)構(gòu)域序列(SEQ ID NO8)的鄰氨基苯甲酸合酶氨基酸序列的序列對(duì)比。
圖7A-B表明用于突變SEQ ID NO1的34個(gè)引物的序列(SEQ ID NOs9-42)。突變密碼子是加下劃線的,而變化的堿基是小寫(xiě)字體的。
圖8表明質(zhì)粒pMON13773的限制性圖譜。
圖9表明質(zhì)粒pMON58044的限制性圖譜。
圖10表明質(zhì)粒pMON53084的限制性圖譜。
圖11表明質(zhì)粒pMON58045的限制性圖譜。
圖12表明質(zhì)粒pMON58046的限制性圖譜。
圖13表明質(zhì)粒pMON38207的限制性圖譜。
圖14表明質(zhì)粒pMON58030的限制性圖譜。
圖15表明質(zhì)粒pMON58006的限制性圖譜。
圖16表明質(zhì)粒pMON58041的限制性圖譜。
圖17表明質(zhì)粒pMON58028的限制性圖譜。
圖18表明質(zhì)粒pMON58042的限制性圖譜。
圖19表明質(zhì)粒pMON58029的限制性圖譜。
圖20表明質(zhì)粒pMON58043的限制性圖譜。
圖21A-D表明具有SEQ ID NOs4和43(分別來(lái)源于根瘤農(nóng)桿菌和苜蓿中華根瘤菌)的單體″TrpEG″鄰氨基苯甲酸合酶,與來(lái)自硫磺礦硫化葉菌(SEQID NO44)和擬南芥(SEQ ID NO45)的異四聚體鄰氨基苯甲酸合酶的TrpE(α)和TrpG(β)結(jié)構(gòu)域的多重序列對(duì)比。接頭區(qū)域是加下劃線的。
圖22是質(zhì)粒pMON52214的限制性圖譜。
圖23是質(zhì)粒pMON53901的限制性圖譜。
圖24是質(zhì)粒pMON39324的限制性圖譜。
圖25是質(zhì)粒pMON39322的限制性圖譜。
圖26是質(zhì)粒pMON39325的限制性圖譜。
圖27是表明用pMON39325轉(zhuǎn)化的大豆種子中游離的色氨酸水平的圖表。存在5個(gè)來(lái)自各事件的觀察結(jié)果。NT表示非轉(zhuǎn)基因的大豆種子。
圖28是質(zhì)粒pMON25997的限制性圖譜。
圖29是質(zhì)粒pMON62000的限制性圖譜。
圖30表明大腸桿菌EMG2(K-12 wt F+)的截短的trpE基因序列(SEQ IDNO46)。該trpE核酸的最初30bp和最后的150bp通過(guò)EcoRI限制酶切位點(diǎn)連接。該trpG基因的開(kāi)始部分緊隨trpE的終止密碼子。
圖31圖解表明大腸桿菌trpE基因中框內(nèi)缺失的構(gòu)建體。
圖32A-C表明分離自根瘤農(nóng)桿菌的鄰氨基苯甲酸合酶基因的α-結(jié)構(gòu)域的DNA(SEQ ID NO1)和氨基酸(SEQ ID NO4)序列。
圖33A-C表明分離自玉米的鄰氨基苯甲酸合酶基因的α-結(jié)構(gòu)域的DNA(SEQ ID NO2)序列。圖33D表明分離自玉米的鄰氨基苯甲酸合酶基因的α-結(jié)構(gòu)域的氨基酸(SEQ ID NO5)序列。
圖34是質(zhì)粒pMON58120的限制性圖譜。
圖35A-E提供來(lái)自根瘤農(nóng)桿菌(AgrTu_15889565)(SEQ ID NO4)、苜蓿中華根瘤菌(RhiMe_136328)(SEQ ID NO7)、百脈根根瘤菌(MesLo_13472468)(SEQ ID NO77)、巴西固氮螺菌(AzoBr-1717765)(SEQ IDNO78)、馬爾他布魯氏菌(BruMe_17986732)(SEQ ID NO79)、念珠藻屬(Nostoc_17227910)(SEQ ID NO80)、念珠藻屬(Nostoc_17230725)(SEQ IDNO81)和血色紅假單胞菌(RhoPa_TrpEG)(SEQ ID NO82)的鄰氨基苯甲酸合酶氨基酸序列的序列比較。
圖36A-B提供用于根瘤農(nóng)桿菌鄰氨基苯甲酸合酶的優(yōu)化核苷酸序列(SEQ ID NO75)。
圖37A-C提供野生型(上面的鏈)和優(yōu)化的(下面的鏈)根瘤農(nóng)桿菌鄰氨基苯甲酸合酶核苷酸序列(SEQ ID NOs1和75)的序列對(duì)比。這2個(gè)序列由中間的鏈證明是94%相同的。
圖38是質(zhì)粒pMON66877的限制性圖譜。
圖39是質(zhì)粒pMON66878的限制性圖譜。
圖40是質(zhì)粒pMON66879的限制性圖譜。
圖41是質(zhì)粒pMON66595的限制性圖譜。
圖42是質(zhì)粒pMON66599的限制性圖譜。
圖43是質(zhì)粒pMON66598的限制性圖譜。
圖44是質(zhì)粒pMON66596的限制性圖譜。
圖45是質(zhì)粒pMON79951的限制性圖譜。
圖46是質(zhì)粒pMON79955的限制性圖譜。
圖47是質(zhì)粒pMON79956的限制性圖譜。
圖48是質(zhì)粒pMON36524的限制性圖譜。
圖49是質(zhì)粒pMON30167的限制性圖譜。
發(fā)明詳述本發(fā)明提供分離的DNAs,載體,宿主細(xì)胞和含有編碼能夠在植物中表達(dá)高水平的色氨酸的鄰氨基苯甲酸合酶的分離核酸的轉(zhuǎn)基因植物。在一個(gè)實(shí)施方案中,分離的核酸編碼單體鄰氨基苯甲酸合酶(AS)。在另一個(gè)實(shí)施方案中,分離的核酸編碼鄰氨基苯甲酸合酶,或其結(jié)構(gòu)域,其基本上抗游離的L-色氨酸或色氨酸的氨基酸類似物的抑制。鄰氨基苯甲酸合酶或其結(jié)構(gòu)域的表達(dá),可以提高色氨酸例如種子中游離色氨酸的水平,而超過(guò)在缺乏這種表達(dá)的植物中的水平。
提供生產(chǎn)含有增強(qiáng)的鄰氨基苯甲酸合酶活性的相關(guān)核酸的轉(zhuǎn)基因植物的方法,和生產(chǎn)培養(yǎng)細(xì)胞,植物組織,植物,植物部分和產(chǎn)生高水平色氨酸的種子。這種轉(zhuǎn)基因植物將產(chǎn)生高水平色氨酸的能力優(yōu)先地性傳遞給其后代。也描述了產(chǎn)生編碼突變鄰氨基苯甲酸合酶的分離DNAs,和細(xì)胞培養(yǎng)物的篩選技術(shù)以挑選出過(guò)量表達(dá)色氨酸和/或?qū)ι彼犷愃莆镉锌剐宰饔玫男卤硇?。例如,產(chǎn)生能夠生產(chǎn)高水平色氨酸的大豆品系,制備和表征含有至少一種本發(fā)明的分離核酸的轉(zhuǎn)基因大豆細(xì)胞,然后在植物中再生。其中一些分離的DNAs對(duì)色氨酸類似物的生長(zhǎng)抑制有抗性作用。本發(fā)明也提供用于在雙子葉植物,例如其他的豆類,以及例如谷粒的單子葉植物中產(chǎn)生升高的游離色氨酸水平的方法。
定義如在此所用的,轉(zhuǎn)化植物、植物組織、植物部分或植物細(xì)胞中的色氨酸的“改變”水平是相應(yīng)于未轉(zhuǎn)化的植物、植物組織、植物部分或植物細(xì)胞增強(qiáng)或減少的水平。
正如在此所用的“α-結(jié)構(gòu)域”是結(jié)合分支酸和消除烯醇丙酮酸側(cè)鏈的酶或酶復(fù)合物的一部分。TrpE基因編碼這種α-結(jié)構(gòu)域。在一些情況中,α-結(jié)構(gòu)域是只具有結(jié)合分支酸和消除分支酸的烯醇丙酮酸側(cè)鏈功能的單個(gè)多肽。在其他情況中,α-結(jié)構(gòu)域是除了結(jié)合分支酸和消除分支酸的烯醇丙酮酸側(cè)鏈外,還可執(zhí)行其他酶功能的較大多肽的一部分。
術(shù)語(yǔ)“β-結(jié)構(gòu)域”是指將谷氨酸的氨基傳遞到羧酸酯和烯醇丙酮酸部分之間的分支酸環(huán)的位置的酶或酶復(fù)合物的一部分。TrpG基因編碼這種β-結(jié)構(gòu)域。在一些情況中,β-結(jié)構(gòu)域是只具有將谷氨酸的氨基傳遞到羧酸酯和烯醇丙酮酸部分之間的分支環(huán)位置的功能的單個(gè)多肽。在其他情況中,β-結(jié)構(gòu)域是除了將谷氨酸的氨基傳遞到羧酸酯和烯醇丙酮酸部分之間的分支酸環(huán)位置外,還可執(zhí)行其他酶功能的較大多肽的一部分。
正如在此所用的,“色氨酸的氨基酸類似物”是指結(jié)構(gòu)上與色氨酸相關(guān)的氨基酸,并且可以與野生型鄰氨基苯甲酸合酶的色氨酸結(jié)合位點(diǎn)結(jié)合。這些類似物包括但不限于,6-甲基苯甲酸甲酯、5-甲基色氨酸、4-甲基色氨酸、5-氟色氨酸、5-羥色氨酸、7-氮雜色氨酸、3β-吲哚丙烯酸、3-甲基鄰氨基苯甲酸等。
術(shù)語(yǔ)“基本上由...組成”與涉及出現(xiàn)的DNA分子、序列或片段一起使用,是指編碼鄰氨基苯甲酸合酶的DNA分子、序列或片段的主要部分。除非另有注明,DNA分子、序列或片段只編碼鄰氨基苯甲酸合酶。
在此使用的術(shù)語(yǔ)“互補(bǔ)”指能與參照的核苷酸序列的全部、或部分雜交的核酸鏈的序列。例如,核苷酸序列“TATAC”具有與參照序列5′-TATAC-3′100%的相同性,但也與參照序列5′-GTATA-3′100%互補(bǔ)。
正如在此所用的,“外源的”鄰氨基苯甲酸合酶是由導(dǎo)入到宿主細(xì)胞中的分離DNA編碼的鄰氨基苯甲酸合酶,優(yōu)選地與天然的未轉(zhuǎn)化狀態(tài)的細(xì)胞中的任何DNA序列都不相同。“內(nèi)源的”或“天然的”鄰氨基苯甲酸合酶是天然存在于宿主細(xì)胞或生物體內(nèi)的鄰氨基苯甲酸合酶。
正如在此所用的,植物細(xì)胞、植物組織、植物一部分或植物中游離L-色氨酸“增強(qiáng)的”或“升高的”水平與未轉(zhuǎn)化的植物細(xì)胞、植物組織、植物部分或植物,即未由存在外源的鄰氨基苯甲酸合酶核酸或其結(jié)構(gòu)域而改變基因組的植物中的水平相比大約是2-200倍,優(yōu)選為5-150倍,更優(yōu)選為10-100倍。例如,在轉(zhuǎn)化的植物種子中游離色氨酸的水平與未轉(zhuǎn)化的植物種子(“起始材料”)相比較。
編碼鄰氨基苯甲酸合酶的DNA分子和編碼運(yùn)輸肽的DNA分子或標(biāo)記/報(bào)道基因是從天然來(lái)源中“分離的”,不再存在于其通常存在的細(xì)胞中。這樣分離的DNA分子至少是部分制備或在體外操作的,例如,從其通常發(fā)現(xiàn)的細(xì)胞中分離,純化和擴(kuò)增。這樣分離的DNA分子也可以是“重組的”,將其與外源DNA分子或片段結(jié)合。例如,重組的DNA可以是將分離的DNA可操作地連接外源啟動(dòng)子,或連接對(duì)宿主細(xì)胞來(lái)說(shuō)是內(nèi)源的啟動(dòng)子。
在此與鄰氨基苯甲酸合酶相關(guān)使用的術(shù)語(yǔ)“單體”指兩個(gè)或更多個(gè)鄰氨基苯甲酸合酶結(jié)構(gòu)域結(jié)合形成單個(gè)多肽鏈的功能形式。單體鄰氨基苯甲酸合酶可在體內(nèi)組裝成二聚體形式。單體鄰氨基苯甲酸合酶核酸和多肽可分離自各種生物體,例如根瘤農(nóng)桿菌,魚(yú)腥藻M22983,巴西固氮螺菌,馬爾他布魯氏菌,薄肌眼蟲(chóng)藻,百脈根根瘤菌,念珠藻屬PCC7120或苜蓿中華根瘤菌??蛇x地,可將選自任何方便的單體或多聚體鄰氨基苯甲酸合酶基因的結(jié)構(gòu)域結(jié)合,構(gòu)建單體鄰氨基苯甲酸合酶的核酸和多肽。這種生物體包括,例如,根瘤農(nóng)桿菌,魚(yú)腥藻M22983,擬南芥,巴西固氮螺菌,馬爾他布魯氏菌,百脈根根瘤菌,念珠藻屬PCC7120,苜蓿中華根瘤菌,血色紅假單胞菌,蕓香,硫磺礦硫化葉菌,鼠傷寒沙門(mén)氏菌,粘質(zhì)沙雷氏桿菌,大豆,稻,棉花,玉米或任何編碼鄰氨基苯甲酸合酶的亞基或結(jié)構(gòu)域的基因。編碼所選擇區(qū)域的核酸可以重組連接。例如,編碼α-結(jié)構(gòu)域的C端的核酸可通過(guò)形成磷酸二酯鍵與編碼β-結(jié)構(gòu)域的N端的核酸連接?;蛘撸@種多肽的單個(gè)結(jié)構(gòu)域可化學(xué)連接。例如α-結(jié)構(gòu)域C端通過(guò)形成肽鍵與β-結(jié)構(gòu)域的N端相連,或者相反。
正如在此所用的,“天然的”基因指在體外沒(méi)有改變,也就是說(shuō)在體外沒(méi)有突變的“野生型”基因。
術(shù)語(yǔ)“質(zhì)體”值得是植物細(xì)胞器類型,包括造粉體,葉綠體,色質(zhì)體,油質(zhì)體,eoplast,黃化質(zhì)體,白色體和前質(zhì)體。這些細(xì)胞器可自我復(fù)制,含有通常稱為“葉綠體基因組”的,根據(jù)植物的種類大小為大約120-大約217kb的環(huán)狀DNA分子,其通常含有反向的重復(fù)區(qū)域。
正如在此所用的,“多肽”指除了分別具有氨基和羧基,而不用肽鍵連接的N端和C端外,通過(guò)肽鍵連接的所有氨基酸的連續(xù)鏈。多肽可以是任何長(zhǎng)度的,并且可進(jìn)行例如糖基化或磷酸化的翻譯后修飾,。
正如在此所用的,“對(duì)色氨酸的氨基酸類似物的抑制有抗性或耐受的”植物細(xì)胞,植物組織或植物,是在L-色氨酸類似物存在時(shí)與相應(yīng)的野生型的鄰氨基苯甲酸合酶相比,至少含有約10%多的鄰氨基苯甲酸合酶活性的植物細(xì)胞,植物組織或植物。通常,“對(duì)色氨酸的氨基酸類似物的抑制有抗性或耐受的”植物細(xì)胞,植物組織或植物可在一定數(shù)量的色氨酸的氨基酸類似物下生長(zhǎng),而該數(shù)量通??梢种莆崔D(zhuǎn)化的植物細(xì)胞,植物組織或植物的生長(zhǎng),這可通過(guò)本領(lǐng)域已知的方法確定。例如,用編碼基本上抗或耐受色氨酸的氨基酸類似物的抑制的鄰氨基苯甲酸合酶的DNA分子轉(zhuǎn)化的,同型純合回交轉(zhuǎn)變的近交植物生長(zhǎng)在一定數(shù)量的色氨酸的氨基酸類似物下,而該數(shù)量的類似物抑制相應(yīng)的,即基本上等基因的輪回的近交植物的生長(zhǎng)。
正如在此所用的,當(dāng)耐受/抗性的和野生型的鄰氨基苯甲酸合酶處于等量的色氨酸或色氨酸的氨基酸類似物時(shí),“對(duì)色氨酸或色氨酸的氨基酸類似物的抑制有抗性或耐受的”鄰氨基苯甲酸合酶保持比相應(yīng)的野生型或天然易感的鄰氨基苯甲酸合酶的活性高出大約10%多。優(yōu)選地,抗性或耐受性的鄰氨基苯甲酸合酶比相應(yīng)于野生型的或天然易感型的鄰氨基苯甲酸合酶,保持大于20%多的活性。
在此使用的涉及鄰氨基苯甲酸合酶的術(shù)語(yǔ)“其結(jié)構(gòu)域”包括全長(zhǎng)鄰氨基苯甲酸合酶的結(jié)構(gòu)或功能性片段。結(jié)構(gòu)區(qū)域包括鄰氨基苯甲酸合酶內(nèi)已鑒定的結(jié)構(gòu)。結(jié)構(gòu)區(qū)域的一個(gè)實(shí)例包括α螺旋,β折疊,活性位點(diǎn),底物或抑制劑結(jié)合位點(diǎn)等。功能區(qū)域包括具有確定功能的鄰氨基苯甲酸合酶的片段,例如色氨酸結(jié)合袋,活性位點(diǎn)或底物或抑制劑結(jié)合位點(diǎn)。鄰氨基苯甲酸合酶的功能性結(jié)構(gòu)域包括可催化色氨酸生物合成途徑中的一個(gè)步驟的鄰氨基苯甲酸合酶部分。例如,α-結(jié)構(gòu)域是由TrpE編碼的區(qū)域,可將NH3傳遞到分支酸上而形成氨基苯甲酸。β-結(jié)構(gòu)域是由TrpG編碼的區(qū)域,可除去谷氨酸的氨基而形成氨。因此,功能結(jié)構(gòu)域包括鄰氨基苯甲酸合酶的酶活性片段和結(jié)構(gòu)域。也包括鄰氨基苯甲酸合酶的突變結(jié)構(gòu)域。用于制備突變結(jié)構(gòu)域的野生型鄰氨基苯甲酸合酶的核酸包括,例如,編碼根瘤農(nóng)桿菌,魚(yú)腥藻M22983,擬南芥,巴西固氮螺菌,馬爾他布魯氏菌,百脈根根瘤菌,念珠藻屬PCC7120,苜蓿中華根瘤菌,血色紅假單胞菌,蕓香,硫磺礦硫化葉菌,鼠傷寒沙門(mén)氏菌,粘質(zhì)沙雷氏桿菌,大豆,稻,棉花,玉米的結(jié)構(gòu)域的任何核酸,或任何編碼鄰氨基苯甲酸合酶的亞基或結(jié)構(gòu)域的基因,其可在編碼區(qū)包含至少一個(gè)氨基酸的取代。突變或相連的、以形成具有增強(qiáng)的色氨酸生物合成活性,更好的穩(wěn)定性,降低對(duì)色氨酸或其類似物的敏感性等的單體鄰氨基苯甲酸合酶的結(jié)構(gòu)域,是特別感興趣的。
術(shù)語(yǔ)“5′UTR”指DNA上游未翻譯的區(qū)域,或基因編碼區(qū)的5′未翻譯的區(qū)域。
術(shù)語(yǔ)“3′UTR”指DNA下游未翻譯的區(qū)域,或基因編碼區(qū)的3′未翻譯的區(qū)域。
術(shù)語(yǔ)“基本上同源”指兩個(gè)序列在序列上至少90%相同,其通過(guò)(Version10;Genetics Computer Group,Inc.,University of Wiconsin BiotechnologyCenter,Madison,WI)中所描述的BestFit程序,使用默認(rèn)的參數(shù)進(jìn)行測(cè)定。
序列相同性的百分?jǐn)?shù)優(yōu)選使用″Best Fit″或″Gap″序列分析軟件包的程序(Version 10;Genetics Computer Group,Inc.,University of WisconsinBiotechnology Center,Madison,WI)測(cè)定?!錑ap″使用Needleman和Wunsch(1970)算法,以發(fā)現(xiàn)兩個(gè)序列的序列對(duì)比中最大的匹配數(shù)和最小的缺口(gap)。
″Best Fit″在兩個(gè)序列間對(duì)相似性最好的片段進(jìn)行優(yōu)化的序列對(duì)比,并且利用Smith和Waterman(Smith and Waterman,1981;Smith等人,1983)的同源性算法插入缺口(gap)以最大化匹配的數(shù)目。優(yōu)選使用默認(rèn)參數(shù)的″Best Fit″程序測(cè)定同一性的百分?jǐn)?shù)。在此使用的術(shù)語(yǔ)“可操作地連接”指啟動(dòng)子與編碼區(qū)是以通過(guò)啟動(dòng)子來(lái)控制和調(diào)節(jié)編碼區(qū)翻譯的方式連接??刹僮鞯剡B接啟動(dòng)子和編碼區(qū)的方法是本領(lǐng)域已知的。
通用概念本發(fā)明涉及用于獲得產(chǎn)生升高水平的游離L-色氨酸的植物的新的核酸和方法。過(guò)量生產(chǎn)是由于導(dǎo)入和表達(dá)編碼鄰氨基苯甲酸合酶或其結(jié)構(gòu)域的核酸。這種鄰氨基苯甲酸合酶核酸包括鄰氨基苯甲酸合酶的野生型或突變的α-結(jié)構(gòu)域,或單體形式。鄰氨基苯甲酸合酶的單體形式在單個(gè)多肽鏈上含有至少兩個(gè)鄰氨基苯甲酸合酶區(qū)域,例如,α-結(jié)構(gòu)域連接β-結(jié)構(gòu)域。
天然植物的鄰氨基苯甲酸合酶通常對(duì)L-色氨酸和其類似物的抑制反饋敏感。這種抑制構(gòu)成調(diào)控色氨酸合成途徑的關(guān)鍵機(jī)制。因此,鄰氨基苯甲酸合酶或其結(jié)構(gòu)域是高度活性的、更加有效的或較少程度地受到色氨酸或其類似物的抑制,從而可能產(chǎn)生升高水平的色氨酸。根據(jù)本發(fā)明,根瘤農(nóng)桿菌鄰氨基苯甲酸合酶對(duì)于產(chǎn)生高水平的色氨酸特別有用。
為了在植物或所選擇的宿主細(xì)胞中產(chǎn)生高水平色氨酸,分離所選擇的鄰氨基苯甲酸合酶核酸,并可在體外操作,以包括在植物細(xì)胞或其他細(xì)胞類型中基因表達(dá)所需的調(diào)控信號(hào)。因?yàn)閳?bào)道植物中的色氨酸合成途徑在質(zhì)體中進(jìn)行,可將外源鄰氨基苯甲酸合酶的核酸導(dǎo)入質(zhì)體中或通過(guò)加上編碼質(zhì)體運(yùn)輸肽的氨基末端的核酸片段進(jìn)行修飾。這種質(zhì)體運(yùn)輸肽可直接引導(dǎo)鄰氨基苯甲酸合酶基因產(chǎn)物進(jìn)入質(zhì)體。在一些情況中鄰氨基苯甲酸合酶已經(jīng)含有質(zhì)體運(yùn)輸序列,這樣就沒(méi)有必要增加片段了。
為了改變色氨酸的生物合成,編碼鄰氨基苯甲酸合酶活性的核酸必須導(dǎo)入植物細(xì)胞或其他宿主細(xì)胞,然后直接或間接地驗(yàn)證這些轉(zhuǎn)化細(xì)胞??墒褂猛暾泥彴被郊姿岷厦富蚱溆杏玫牟糠只蚪Y(jié)構(gòu)域。鄰氨基苯甲酸合酶穩(wěn)定地整合在植物細(xì)胞基因組上??刂凄彴被郊姿岷厦副磉_(dá)的轉(zhuǎn)錄信號(hào)必須在植物細(xì)胞或其他宿主細(xì)胞內(nèi)被識(shí)別并發(fā)揮作用。也就是說(shuō)鄰氨基苯甲酸合酶必須轉(zhuǎn)錄成信使RNA(mRNA),而mRNA必須在植物細(xì)胞核中穩(wěn)定、完整地運(yùn)輸?shù)郊?xì)胞質(zhì)中翻譯。鄰氨基苯甲酸合酶mRNA必須含有可被植物細(xì)胞核糖體識(shí)別和合適翻譯的合適的翻譯信號(hào)。多肽基因產(chǎn)物必須基本上逃脫細(xì)胞質(zhì)內(nèi)蛋白水解的攻擊,而被轉(zhuǎn)運(yùn)到正確的細(xì)胞內(nèi)部分(例如,質(zhì)體),并且能夠呈現(xiàn)賦予酶活性的三維構(gòu)像。鄰氨基苯甲酸合酶必須進(jìn)一步能夠在色氨酸和其衍生物的生物合成中發(fā)揮作用;也就是說(shuō),必須定位在催化生物合成中旁側(cè)步驟的天然植物酶的附近(大概在質(zhì)體中),以獲得所需要的底物并傳遞合適的產(chǎn)物。
即使?jié)M足所有的條件,色氨酸的成功過(guò)量產(chǎn)生也不是一個(gè)可以預(yù)料的事情。一些轉(zhuǎn)基因的表達(dá)可能受到附近染色體元件的負(fù)影響,如果通過(guò)突變減少反饋抑制而獲得高水平的色氨酸,存在其他的控制機(jī)制來(lái)補(bǔ)償鄰氨基苯甲酸合酶步驟減少的調(diào)控??赡苡刑岣咚罘e氨基酸降解率的機(jī)制。色氨酸和相關(guān)氨基酸的過(guò)量表達(dá)的水平也不能對(duì)植物有毒性。最后,導(dǎo)入性狀必須是穩(wěn)定的和可以遺傳的,以提供商業(yè)上的發(fā)展和使用。
編碼鄰氨基苯甲酸合酶的DNA的分離和鑒定可通過(guò)標(biāo)準(zhǔn)的方法鑒定和分離編碼鄰氨基苯甲酸合酶的核酸,例如,如Sambrook等在“分子克隆實(shí)驗(yàn)指南”,第二版(1989);Sambrook和Russell,在“分子克隆實(shí)驗(yàn)指南”,第三版(2001.1.15)中所描述的。例如,編碼鄰氨基苯甲酸合酶或其結(jié)構(gòu)域的DNA序列可以通過(guò)篩選來(lái)源于特定細(xì)胞種類、細(xì)胞系、初級(jí)細(xì)胞或組織的核酸所產(chǎn)生的DNA或cDNA文庫(kù)而鑒定。用于鑒定和分離鄰氨基苯甲酸合酶的文庫(kù)的實(shí)例包括,但不限于,來(lái)源于根瘤農(nóng)桿菌菌株A348,玉米自交系B73(Stratagene,La Jolla,加利福尼亞,Cat.#937005,Clontech,Palo Alto,加利福尼亞,Cat.#FL1032a,#FL1032b,和FL1032n)的cDNA文庫(kù),來(lái)源于玉米自交系Mo17(Stratagene,Cat.#946102)的基因組文庫(kù),來(lái)源于玉米自交系B73(Clontech,Cat.#FL1032d)的基因組文庫(kù),來(lái)源于魚(yú)腥藻M22983(例如,Genbank登錄號(hào)GI 152445),擬南芥,巴西固氮螺菌(例如,Genbank登錄號(hào)GI 1174156),馬爾他布魯氏菌(GI17982357),大腸桿菌,薄肌眼蟲(chóng)藻(Euglena gracilis),百脈根根瘤菌(例如,Genbank登錄號(hào)GI 13472468),念珠藻屬PCC7120(例如,Genbank登錄號(hào)GI 17227910或GI 17230725),苜蓿中華根瘤菌(例如,Genbank登錄號(hào)GI95177),蕓香,血色紅假單胞菌,鼠傷寒沙門(mén)氏菌,粘質(zhì)沙雷氏桿菌,硫磺礦硫化葉菌,大豆,稻,棉花,小麥,煙草,玉米(玉蜀黍),或其他種類的基因組DNA。而且,可采用分離自任何這些種類的基因組DNA,mRNA或cDNA,通過(guò)核酸擴(kuò)增方法分離鄰氨基苯甲酸合酶核酸。
篩選編碼鄰氨基苯甲酸合酶的全長(zhǎng)或其部分序列的DNA片段可通過(guò)篩選與來(lái)源于從其他生物體的鄰氨基苯甲酸合酶基因探針雜交的基因組或cDNA文庫(kù)的噬菌斑,或篩選與特異性識(shí)別鄰氨基苯甲酸合酶的抗體結(jié)合的cDNA表達(dá)文庫(kù)的噬菌斑而實(shí)現(xiàn)。將與來(lái)自其他生物體的鄰氨基苯甲酸合酶探針雜交的DNA片段和/或攜帶鄰氨基苯甲酸合酶抗體免疫活性的DNA片段的噬菌斑亞克隆到載體中,并進(jìn)行測(cè)序和/或作為探針用于鑒定編碼所需要的鄰氨基苯甲酸合酶基因的全長(zhǎng)或部分的其他cDNA或基因組序列。用于篩選玉米或植物文庫(kù)的優(yōu)選cDNA探針可從質(zhì)??寺DPG600或pDPG602獲得。
cDNA文庫(kù)可例如,通過(guò)隨機(jī)寡引物或寡dT引物引發(fā)制備。含有DNA片段的噬菌斑可以用特異于鄰氨基苯甲酸合酶的探針或抗體篩選。將編碼鄰氨基苯甲酸合酶基因部分的DNA片段亞克隆,并測(cè)序,以及用作鑒定基因組鄰氨基苯甲酸合酶基因的探針。編碼細(xì)菌或植物鄰氨基苯甲酸合酶的DNA片段可通過(guò)確定與其他已知的鄰氨基苯甲酸合酶基因的同源性而驗(yàn)證,或通過(guò)與鄰氨基苯甲酸合酶特異的信使RNA雜交而驗(yàn)證。一旦獲得編碼鄰氨基苯甲酸合酶的5′,中間和3′端部分的cDNA片段,則可將其作為探針,從基因組文庫(kù)中鑒定和克隆完整的鄰氨基苯甲酸合酶基因的基因組拷貝。
對(duì)部分基因組拷貝或鄰氨基苯甲酸合酶基因的拷貝測(cè)序,并通過(guò)標(biāo)準(zhǔn)方法鑒定基因的5′端,包括通過(guò)與其他鄰氨基苯甲酸合酶基因的DNA序列同源或RNA酶保護(hù)分析,例如,Sambrook等在“分子克隆實(shí)驗(yàn)指南”,第二版(1989);Sambrook和Russell,在“分子克隆實(shí)驗(yàn)指南”,第三版(2001.1.15)中所描述的。靶基因的3′和5′端可通過(guò)利用已知的AS編碼區(qū)計(jì)算機(jī)搜索基因組序列數(shù)據(jù)庫(kù)來(lái)定位。一旦鑒定基因的5′端,鄰氨基苯甲酸合酶基因的完整拷貝可通過(guò)標(biāo)準(zhǔn)方法獲得,包括克隆或利用與基因DNA序列的5′末端互補(bǔ)的寡核苷引物的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)。分離的鄰氨基苯甲酸合酶基因的全長(zhǎng)拷貝的存在可通過(guò)雜交,部分序列分析或通過(guò)表達(dá)玉米鄰氨基苯甲酸合酶來(lái)驗(yàn)證。
本發(fā)明例證性分離的DNAs包括具有下面核苷酸SEQ ID NO的DNAsSEQ ID NO1根瘤農(nóng)桿菌(野生型)SEQ ID NO2玉米(野生型,α2)SEQ ID NO3蕓香SEQ ID NO46大腸桿菌EMG2(K-12 wt F+)的截短的TrpE基因SEQ ID NO67玉米(C28突變)SEQ ID NO68玉米(C28+終止子)SEQ ID NO71葉綠體靶肽(g)SEQ ID NO73葉綠體靶肽(a)SEQ ID NO75根瘤農(nóng)桿菌(優(yōu)化的)SEQ ID NO76血色紅假單胞菌SEQ ID NO83血色紅假單胞菌(RhoPa_TrpEG)SEQ ID NO84根瘤農(nóng)桿菌V48F突變體SEQ ID NO85根瘤農(nóng)桿菌V48Y突變體SEQ ID NO86根瘤農(nóng)桿菌S51F突變體SEQ ID NO87根瘤農(nóng)桿菌S51C突變體SEQ ID NO88根瘤農(nóng)桿菌N52F突變體SEQ ID NO89根瘤農(nóng)桿菌P293A突變體SEQ ID NO90根瘤農(nóng)桿菌P293G突變體SEQ ID NO91根瘤農(nóng)桿菌F298W突變體SEQ ID NO92根瘤農(nóng)桿菌S50K突變體SEQ ID NO93根瘤農(nóng)桿菌F298A突變體SEQ ID NO94稻
SEQ ID NO95稻的同功酶SEQ ID NO96玉米(Anderson的美國(guó)專利No.6,118,047)SEQ ID NO97小麥SEQ ID NO98煙草SEQ ID NO104陸地棉(Gossypium hirsutum)(α)SEQ ID NO105陸地棉(β)SEQ ID NO106大豆(Glycine max)(α)SEQ ID NO107大豆(β)SEQ ID NO112具有5′和3′UTRs的大豆(α)SEQ ID NO113具有5′和3′UTRs的大豆(β)SEQ ID NO116玉米(β)SEQ ID NO119稻(Oryza sativa)(β1)SEQ ID NO120稻(β2)SEQ ID NO121百脈根根瘤菌SEQ ID NO122巴西固氮螺菌SEQ ID NO123馬爾他布魯氏菌SEQ ID NO124念珠藻屬SEQ ID NO125念珠藻屬SEQ ID NO126血色紅假單胞菌SEQ ID NO127大豆慢生根瘤菌SEQ ID NO128深紅紅螺菌SEQ ID NO129 Thermobifida fuscaSEQ ID NO134高粱(Sorghum bicolor)(β1)SEQ ID NO135高粱(β2)SEQ ID NO136玉米(α1)某些引物也可以用于實(shí)現(xiàn)本發(fā)明,例如具有SEQ ID NOs9-42,47-56,或138-143的引物。
本發(fā)明也包括編碼具有例如下述任何氨基酸序列的鄰氨基苯甲酸合酶的任何分離核酸。
SEQ ID NO4根瘤農(nóng)桿菌(野生型)SEQ ID NO5玉米(野生型)
SEQ ID NO6蕓香SEQ ID NO7苜蓿中華根瘤菌SEQ ID NO8硫磺礦硫化葉菌SEQ ID NO43苜蓿中華根瘤菌SEQ ID NO44硫磺礦硫化葉菌SEQ ID NO45擬南芥SEQ ID NO57血色紅假單胞菌SEQ ID NO58根瘤農(nóng)桿菌V48F突變體SEQ ID NO59根瘤農(nóng)桿菌V48Y突變體SEQ ID NO60根瘤農(nóng)桿菌S51F突變體SEQ ID NO61根瘤農(nóng)桿菌S51C突變體SEQ ID NO62根瘤農(nóng)桿菌N52F突變體SEQ ID NO63根瘤農(nóng)桿菌P293A突變體SEQ ID NO64根瘤農(nóng)桿菌P293G突變體SEQ ID NO65根瘤農(nóng)桿菌F298W突變體SEQ ID NO66玉米C28突變體SEQ ID NO69根瘤農(nóng)桿菌S50K突變體SEQ ID NO70根瘤農(nóng)桿菌F298A突變體SEQ ID NO74葉綠體靶肽(a)SEQ ID NO72葉綠體靶肽(g)SEQ ID NO77百脈根根瘤菌(MesLo_13472468)SEQ ID NO78巴西固氮螺菌(AzoBr_1717765)SEQ ID NO79馬爾他布魯氏菌(BruMe_17986732)SEQ ID NO80念珠藻屬(Nostoc_17227910)SEQ ID NO81念珠藻屬(Nostoc_17230725)SEQ ID NO82血色紅假單胞菌RhoPa_TrpEGSEQ ID NO99稻SEQ ID NO100稻的同功酶SEQ ID NO101玉米(Anderson的美國(guó)專利No.6,118,047)SEQ ID NO102小麥SEQ ID NO103煙草
SEQ ID NO108陸地棉(α)SEQ ID NO109陸地棉(β)SEQ ID NO110大豆(α)SEQ ID NO111大豆(β)SEQ ID NO114玉米(ASα2)葉綠體靶肽SEQ ID NO115玉米(ASα1)葉綠體靶肽SEQ ID NO117稻(β)SEQ ID NO118玉米(β)SEQ ID NO130大豆慢生根瘤菌SEQ ID NO131深紅紅螺菌SEQ ID NO132 Thermobifida fuscaSEQ ID NO133高粱(β)SEQ ID NO137玉米(ASα1)任何這些核酸和多肽以及其任何突變體,變異體或衍生物都可用于實(shí)現(xiàn)本發(fā)明。
單體的鄰氨基苯甲酸合酶根據(jù)本發(fā)明,來(lái)源于植物和非植物類的單體鄰氨基苯甲酸合酶在植物中都有可以提供高水平色氨酸的功能。出乎意料的是非植物類來(lái)源的單體鄰氨基苯甲酸合酶在植物中有很好的作用效果,盡管這些單體鄰氨基苯甲酸合酶序列與大多數(shù)植物鄰氨基苯甲酸合酶的同源性很低。例如,成功使用來(lái)源于如細(xì)菌,原生生物和微生物一樣多樣的物種的單體鄰氨基苯甲酸合酶。特別是來(lái)源于下述細(xì)菌類的單體鄰氨基苯甲酸合酶根瘤農(nóng)桿菌,苜蓿中華根瘤菌,百脈根根瘤菌,馬爾他布魯氏菌,念珠藻屬PCC7120,巴西固氮螺菌,魚(yú)腥藻M22983,大豆慢生根瘤菌(Bradyrhizobium janonicum),深紅紅螺菌,和Thermobidfida fusca,在植物中都有提供高水平色氨酸的功能,盡管這些單體鄰氨基苯甲酸合酶序列與大多數(shù)植物鄰氨基苯甲酸合酶的同源性很低。
包含例如野生型單體根瘤農(nóng)桿菌鄰氨基苯甲酸合酶的轉(zhuǎn)基因植物可以在種子中產(chǎn)生高達(dá)約10,000-約12,000ppm的色氨酸,平均的trp水平為約7,000-約8,000ppm。非轉(zhuǎn)基因大豆植物的種子中通常只能達(dá)到約100-約200ppm的色氨酸。比較含有添加突變的玉米α-結(jié)構(gòu)域的轉(zhuǎn)基因植物產(chǎn)生較低水平的色氨酸(例如,平均達(dá)到約3000-約4000ppm)。
單體酶相對(duì)于多聚酶具有一些優(yōu)點(diǎn)。例如,雖然本發(fā)明并不僅限于特定的機(jī)制,單體酶可以提供更好的穩(wěn)定性,協(xié)同表達(dá)等。當(dāng)在體內(nèi)合成異源的四聚體鄰氨基苯甲酸合酶的結(jié)構(gòu)域或亞基時(shí),這些結(jié)構(gòu)域/亞基必須在酶具有活性之前就適當(dāng)?shù)亟M裝成異源四聚體形式。通過(guò)轉(zhuǎn)基因方法在植物中增加單個(gè)的鄰氨基苯甲酸合酶結(jié)構(gòu)域不能提供過(guò)量產(chǎn)生的異源四聚體酶,因?yàn)闆](méi)有足夠的內(nèi)源非轉(zhuǎn)基因結(jié)構(gòu)域來(lái)從實(shí)質(zhì)上增強(qiáng)功能四聚體的水平。因此,編碼單體鄰氨基苯甲酸合酶的核酸、載體和酶可有利地用于過(guò)量產(chǎn)生鄰氨基苯甲酸合酶的所有酶功能。
根據(jù)本發(fā)明,當(dāng)在植物細(xì)胞、植物組織或種子中表達(dá)時(shí),可融合或連接來(lái)源于天然產(chǎn)生異源四聚體鄰氨基苯甲酸合酶的種屬的鄰氨基苯甲酸合酶結(jié)構(gòu)域,以提供能產(chǎn)生高水平色氨酸的單體鄰氨基苯甲酸合酶。例如,單體鄰氨基苯甲酸合酶可通過(guò)融合或連接鄰氨基苯甲酸合酶的α和β-結(jié)構(gòu)域,以使得α-β融合體與天然單體的鄰氨基苯甲酸合酶的序列排列比對(duì)而制備。單體和四聚體鄰氨基苯甲酸合酶的序列排列的實(shí)例如圖21和35所示。采用這種序列排列,可以調(diào)整鄰氨基苯甲酸合酶結(jié)構(gòu)域的間隔和定位或修飾,以從異源四聚體區(qū)域產(chǎn)生任選地與天然鄰氨基苯甲酸合酶的排列比對(duì)的單體鄰氨基苯甲酸合酶結(jié)構(gòu)。這種融合蛋白可用于升高植物組織中的色氨酸水平。
異源四聚體鄰氨基苯甲酸合酶,例如硫磺礦硫化葉菌鄰氨基苯甲酸合酶(例如,Genbank登錄號(hào)GI 1004323),與其他植物或微生物的異源四聚體鄰氨基苯甲酸合酶的同源性大約為30%-87%。單體鄰氨基苯甲酸合酶,例如根瘤農(nóng)桿菌鄰氨基苯甲酸合酶與其他單體酶,例如苜蓿中華根瘤菌(Genbank登錄號(hào)GI 15966140)和巴西固氮螺菌(Genbank登錄號(hào)1717765)的同源性分別為大約83%和約52%。Bae等人,苜蓿中華根瘤菌鄰氨基苯甲酸合酶基因克隆,測(cè)序和在大腸桿菌中表達(dá),細(xì)菌學(xué)雜志J.Bacteriol.,1713471-3478(1989);De Troch等人,分離和純化巴西固氮螺菌trpE(G)基因,編碼鄰氨基苯甲酸合酶.Curr.Microbiol.,3427-32(1997)。
然而,全序列與天然單體和天然四聚體鄰氨基苯甲酸合酶的同源性可以小于30%。因此,不是計(jì)算機(jī)產(chǎn)生的排列而是視覺(jué)排列,以優(yōu)化排列單體和四聚體的鄰氨基苯甲酸合酶。鄰氨基苯甲酸合酶內(nèi)的界標(biāo)(landmark)結(jié)構(gòu)和序列有助于序列排列。例如,基序″LLES″是形成鄰氨基苯甲酸合酶的色氨酸結(jié)合袋的β-夾層的β-折疊的一部分。這種界標(biāo)序列可用于更加確信地排列差異的鄰氨基苯甲酸合酶序列,特別是用于確定涉及色氨酸結(jié)合的關(guān)鍵殘基。
為了實(shí)現(xiàn)鄰氨基苯甲酸合酶結(jié)構(gòu)域的融合或連接,所選擇的TrpE或α-結(jié)構(gòu)域的C末端與TrpG結(jié)構(gòu)域或β-結(jié)構(gòu)域的N末端連接。在一些方案中,可在結(jié)構(gòu)域間使用接頭肽,以提供合適的間隔和/或靈活性。通過(guò)單體和四聚體鄰氨基苯甲酸合酶的序列對(duì)比來(lái)鑒定合適的接頭序列。
例如通過(guò)雜交,PCR擴(kuò)增或如Anderson等人在美國(guó)專利No.6,118,047中所描述的,克隆所選擇的β-結(jié)構(gòu)域。質(zhì)體傳遞肽序列可通過(guò)標(biāo)準(zhǔn)方法與鄰氨基苯甲酸合酶編碼區(qū)連接。例如可以使用擬南芥小亞基(SSU)的葉綠體靶肽(CTP,SEQ ID NOs71-74)。也參見(jiàn)Stark等人,科學(xué)Science,258287(1992)。然后可將融合的基因插入在此所描述的用于轉(zhuǎn)化植物的合適載體中。
鄰氨基苯甲酸合酶的突變體本發(fā)明所包括的突變的鄰氨基苯甲酸合酶,可具有任何類型的突變,包括例如,氨基酸取代、缺失、和/或重排。這種突變體可以是鄰氨基苯甲酸合酶核酸和在此所特異性鑒定的多肽的衍生物或變異體。突變的鄰氨基苯甲酸合酶也可從任何可得到的種類中獲得,包括沒(méi)有在此明確鑒定的種類。突變體、衍生物和變異體可具有與SEQ ID NOs4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137序列中任何一個(gè)的氨基酸位點(diǎn)至少約30%的同一性,并且具有鄰氨基苯甲酸合酶活性。在優(yōu)選的實(shí)施方案中,多肽衍生物和變異體的氨基酸具有與SEQ ID NOs4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一個(gè)的氨基酸位點(diǎn)至少約50%的同一性,并且具有鄰氨基苯甲酸合酶活性。在更優(yōu)選的實(shí)施方案中,多肽衍生物和變異體的氨基酸具有與SEQ ID NOs4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一個(gè)的氨基酸位點(diǎn)至少約60%的同一性,并且具有鄰氨基苯甲酸合酶活性。在更優(yōu)選的實(shí)施方案中,多肽衍生物和變異體的氨基酸具有與SEQ ID NOs4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一個(gè)的氨基酸位點(diǎn)至少約70%的同一性,并且具有鄰氨基苯甲酸合酶活性。在更加優(yōu)選的實(shí)施方案中,多肽衍生物和變異體的氨基酸具有與SEQ ID NOs4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一個(gè)的氨基酸位點(diǎn)至少約80%的同一性,并且具有鄰氨基苯甲酸合酶活性。在更加優(yōu)選的實(shí)施方案中,多肽衍生物和變異體的氨基酸具有與SEQ ID NOs4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一個(gè)的氨基酸位點(diǎn)至少約90%的同一性,并且具有鄰氨基苯甲酸合酶活性。在更加優(yōu)選的實(shí)施方案中,多肽衍生物和變異體的氨基酸具有與SEQ ID NOs4-8,43-45,57-66,69-70,77-82,99-111,117-118,130-133,和137中任何一個(gè)的氨基酸位點(diǎn)至少約95%的同一性,并且具有鄰氨基苯甲酸合酶活性。
在一個(gè)實(shí)施方案中,鄰氨基苯甲酸合酶突變體、變異體和衍生物可通過(guò)將SEQ ID NOs1-3,9-42,46,47-56,67-68,75-76,83-98,104-107,112,113,116,119-129,134-136,和138-143,或其片段或引物中任何一個(gè),在中等的或優(yōu)選高嚴(yán)謹(jǐn)條件下與所選擇的核酸源雜交來(lái)鑒定。雜交的中等或嚴(yán)謹(jǐn)條件在本領(lǐng)域是已知的,參見(jiàn),例如Sambrook等人,分子克隆實(shí)驗(yàn)指南,第二版(1989)的第0.47-9.51節(jié);也參見(jiàn)Sambrook和Russell,“分子克隆實(shí)驗(yàn)指南,第三版(2001.1.15)。例如,嚴(yán)謹(jǐn)條件是(1)采用低離子強(qiáng)度和高溫洗滌,例如0.015M NaCl/0.0015M檸檬酸鈉(SSC);0.1%十二烷基硫酸鈉(SDS),于50℃,或(2)雜交過(guò)程中使用例如甲酰胺的變性試劑,例如,50%甲酰胺,0.1%小牛血清/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/50mM磷酸鈉緩沖液pH6.5和750mM NaCl,75mM檸檬酸鈉,于42℃。另外一個(gè)實(shí)例是采用50%甲酰胺,5×SSC(0.75M NaCl,0.075M檸檬酸鈉),50mM磷酸鈉(pH6.8),0.1%焦磷酸鈉,5×Denhardt′s溶液,超聲的鮭精DNA(50μg/ml),0.1%十二烷基硫酸鈉(SDS),和10%葡聚糖硫酸酯于42℃,和在42℃下用0.2×SSC和0.1%SDS洗滌。
本發(fā)明進(jìn)一步提供雜交探針和包含至少7個(gè)核苷酸堿基的新分離和純化的DNA片段的引物,其可被可檢測(cè)地標(biāo)記或結(jié)合可檢測(cè)的標(biāo)記。這種雜交探針或引物可在中等或高嚴(yán)謹(jǐn)條件下與編碼鄰氨基苯甲酸合酶的DNA分子的任何一條鏈雜交。這種雜交探針和引物的實(shí)例包括SEQ ID NOs9-42,47-56,和138-143中的任何一個(gè)。
鄰氨基苯甲酸合酶可以是任何鄰氨基苯甲酸合酶,或其突變體或結(jié)構(gòu)域,例如α-結(jié)構(gòu)域。鄰氨基苯甲酸合酶可以是單體鄰氨基苯甲酸合酶。功能性的突變體是優(yōu)先的,特別是那些能夠在植物中產(chǎn)生高水平色氨酸的突變體,例如,對(duì)色氨酸的氨基酸類似物的抑制有基本抗性的突變體。
產(chǎn)生編碼突變的鄰氨基苯甲酸合酶的核酸可產(chǎn)生自任何方便的種類,例如,編碼根瘤農(nóng)桿菌,魚(yú)腥藻M22983(例如Genbank登錄號(hào)GI 152445),擬南芥,巴西固氮螺菌(例如,Genbank登錄號(hào)GI 1174156),馬爾他布魯氏菌(例如,Genbank登錄號(hào)GI 17982357),大腸桿菌,薄肌眼蟲(chóng)藻,百脈根根瘤菌(例如,Genbank登錄號(hào)GI 13472468),念珠藻屬PCC7120(例如,Genbank登錄號(hào)GI 17227910或GI 17230725),苜蓿中華根瘤菌(例如,Genbank登錄號(hào)GI 95177),蕓香,血色紅假單胞菌,鼠傷寒沙門(mén)氏菌,粘質(zhì)沙雷氏桿菌,硫磺礦硫化葉菌,大豆慢生根瘤菌,深紅紅螺菌,Thermobifidafusca,Sorghum bicolor,大豆,稻,棉花,小麥,煙草,玉米(玉蜀黍)的任何結(jié)構(gòu)域,或編碼鄰氨基苯甲酸合酶亞基或區(qū)域的任何基因的核酸。
所需要的突變包括升高鄰氨基苯甲酸合酶的活性,減少對(duì)色氨酸或其類似物的反饋抑制的敏感性,和/或在植物中產(chǎn)生升高量的色氨酸。這種突變?cè)谄滹@示的活性的水平或類型上具有功能性改變,并且有時(shí)被稱為在此所提供的鄰氨基苯甲酸合酶核酸和多肽的“衍生物”。
然而,本發(fā)明也包括鄰氨基苯甲酸合酶變異體和帶“沉默”突變的鄰氨基苯甲酸合酶。正如在此所用的,沉默突變是一種改變鄰氨基苯甲酸合酶核苷酸序列但并不改變鄰氨基苯甲酸合酶編碼的氨基酸序列的突變。突變核酸編碼變異體鄰氨基苯甲酸合酶,與相應(yīng)的野生型鄰氨基苯甲酸合酶相比,變異體具有一個(gè)或更多個(gè)氨基酸的改變但并沒(méi)有從基本上改變它的活性。本發(fā)明指所有這種衍生物、變異體和帶有沉默突變的鄰氨基苯甲酸合酶核酸。
可通過(guò)幾種方法獲得編碼對(duì)L-色氨酸或色氨酸的氨基酸類似物有抗性和/或耐受性的突變的鄰氨基苯甲酸合酶的DNA。該方法包括但不限于1.培養(yǎng)物中的自發(fā)變異和直接的突變篩選;2.任何細(xì)胞種類或組織,種子或植物的組織培養(yǎng)物中的直接或間接的突變方法;3.通過(guò)下述方法突變所克隆的鄰氨基苯甲酸合酶基因,例如通過(guò)化學(xué)突變;特異性點(diǎn)或定點(diǎn)誘變(Sambrook等人,在前引用的),轉(zhuǎn)位子介導(dǎo)的突變(Berg等人,生物技術(shù)Biotechnology,1417(1983)),和缺失突變(Mitra等人,Molec.Gen.Genetic.,215294(1989));4.在關(guān)鍵殘基中設(shè)計(jì)合理的突變;以及5.DNA移碼以將感興趣的突變整合到多種鄰氨基苯甲酸合酶核酸中。
例如,可使用能夠得到的鄰氨基苯甲酸合酶蛋白的蛋白結(jié)構(gòu)信息合理地設(shè)計(jì)可能具有增強(qiáng)的活性,或減少對(duì)色氨酸或色氨酸類似物敏感性的鄰氨基苯甲酸合酶突變。這種蛋白結(jié)構(gòu)信息是可以得到的,例如,從硫磺礦硫化葉菌(solfulobus solfataricus)鄰氨基苯甲酸合酶(Knochel等人,Proc.Natl.Acad.Sci.(U.S.A.),969479-9484(1999))。合理設(shè)計(jì)的突變可以通過(guò)對(duì)所選擇的鄰氨基苯甲酸合酶氨基酸與已知結(jié)構(gòu)的,如硫磺礦硫化葉菌的鄰氨基苯甲酸合酶氨基酸序列進(jìn)行序列對(duì)比而實(shí)現(xiàn)。參見(jiàn)附圖6、21和35。通過(guò)結(jié)合結(jié)構(gòu)信息和序列同源性的知識(shí)來(lái)預(yù)測(cè)鄰氨基苯甲酸合酶蛋白的色氨酸結(jié)合和催化區(qū)域。例如,確定色氨酸結(jié)合袋的殘基可作為突變的候選物來(lái)改變酶對(duì)色氨酸反饋抑制的抗性。使用這種結(jié)構(gòu)信息,在涉及色氨酸結(jié)合的位點(diǎn)或區(qū)域,合理設(shè)計(jì)幾種根瘤農(nóng)桿菌鄰氨基苯甲酸合酶的突變體。
使用這種序列和結(jié)構(gòu)分析,與單體根瘤農(nóng)桿菌鄰氨基苯甲酸合酶在大約25-60或200-225或290-300或370-375位類似的區(qū)域,可在單體根瘤農(nóng)桿菌鄰氨基苯甲酸合酶中,作為產(chǎn)生具有對(duì)色氨酸反饋抑制敏感性降低的活性的鄰氨基苯甲酸合酶的潛在的有用突變而鑒定出來(lái)。更具體地,與單體根瘤農(nóng)桿菌鄰氨基苯甲酸合酶中的P29,E30,S31,I32,S42,V43,V48,S50,S51,N52,N204,P205,M209,F(xiàn)210,G221,N292,P293,F(xiàn)298,和A373類似的氨基酸是產(chǎn)生具有對(duì)色氨酸反饋抑制敏感性降低的活性的鄰氨基苯甲酸合酶的潛在的有用突變殘基。本發(fā)明包括在這些位點(diǎn)的任何氨基酸的取代或插入。可選地,任何這些位點(diǎn)的氨基酸也可被缺失。
定點(diǎn)誘變可用于在各種位點(diǎn)產(chǎn)生氨基酸取代、缺失和插入。在根瘤農(nóng)桿菌鄰氨基苯甲酸合酶編碼區(qū)內(nèi)的具體突變實(shí)例包括下列在大約48位用Phe替換Val(見(jiàn)例如,SEQ ID NO58);在大約48位用Tyr替換Val(見(jiàn)例如,SEQ ID NO59);在大約51位用Phe替換Ser(見(jiàn)例如,SEQ ID NO60);在大約51位用Cys替換Ser(見(jiàn)例如,SEQ ID NO61);在大約52位用Phe替換Asn(見(jiàn)例如,SEQ ID NO62);在大約293位用Ala替換Pro(見(jiàn)例如,SEQ ID NO63);在大約293位用Gly替換Pro(見(jiàn)例如,SEQ ID NO64);或在大約298位用Trp替換Phe(見(jiàn)例如,SEQ ID NO65)。
通過(guò)對(duì)比待突變的鄰氨基苯甲酸合酶的氨基酸序列和根瘤農(nóng)桿菌鄰氨基苯甲酸合酶的氨基酸序列,可在任何鄰氨基苯甲酸合酶的類似位置產(chǎn)生相似的突變??捎糜谛蛄袑?duì)比的根瘤農(nóng)桿菌鄰氨基苯甲酸合酶的一個(gè)實(shí)例是SEQ ID NO4。
可通過(guò)經(jīng)典的突變和遺傳篩選鑒定有用的突變體。通過(guò)將酶暴露在游離的L-色氨酸或色氨酸的氨基酸類似物下,測(cè)定基因編碼的酶的活性來(lái)檢測(cè)功能性變化,或通過(guò)限制性酶切圖譜或DNA序列分析檢測(cè)DNA分子中的變化。
例如,編碼基本上耐受5-甲基色氨酸(5-MT)的鄰氨基苯甲酸合酶的基因可以從5-甲基色氨酸耐受細(xì)胞系中分離。見(jiàn)美國(guó)專利No.4,581,847,其所公開(kāi)的內(nèi)容在此引入作為參考。簡(jiǎn)而言之,使部分分化的植物細(xì)胞培養(yǎng)物生長(zhǎng),并暴露于連續(xù)低水平的5-甲基色氨酸進(jìn)行繼代培養(yǎng)。然后在幾次繼代培養(yǎng)的期間逐步增加5-甲基色氨酸的濃度。在通常有毒性的5-甲基色氨酸水平存在下生長(zhǎng)的細(xì)胞或組織,在5-甲基色氨酸存在下重復(fù)地傳代培養(yǎng)和表征。所培養(yǎng)細(xì)胞的耐受5-甲基色氨酸性特性的穩(wěn)定性可通過(guò)使所選擇的細(xì)胞系在不含5-甲基色氨酸時(shí)生長(zhǎng)不同的時(shí)間段,然后將組織暴露于5-甲基色氨酸后分析其生長(zhǎng)來(lái)評(píng)估。由于鄰氨基苯甲酸合酶改變而具有耐受性優(yōu)點(diǎn)的細(xì)胞系可通過(guò)在通常有毒性的,即生長(zhǎng)抑制劑水平的5-甲基色氨酸下鑒定具有酶活性的細(xì)胞系而選擇出來(lái)。
從5-MT-或6-甲基鄰氨基苯甲酸(6-MA)-抗性的細(xì)胞系中克隆的鄰氨基苯甲酸合酶基因可以用標(biāo)準(zhǔn)方法評(píng)估對(duì)5-MY,6-MA,或色氨酸的其他氨基酸類似物的耐受性,如美國(guó)專利No.4,581,847所描述的,其所公開(kāi)的內(nèi)容在此引入作為參考。
對(duì)5-甲基色氨酸抑制的敏感性降低的鄰氨基苯甲酸合酶的細(xì)胞系可以用于分離5-甲基色氨酸-抗性的鄰氨基苯甲酸合酶。可從耐受5-甲基色氨酸的細(xì)胞系產(chǎn)生DNA文庫(kù),并且編碼鄰氨基苯甲酸合酶基因的全長(zhǎng)或部分DNA片段可通過(guò)與編碼鄰氨基苯甲酸合酶基因的cDNA探針雜交而鑒定。改變基因的完整拷貝可通過(guò)克隆和連接或利用合適引物的PCT獲得。編碼鄰氨基苯甲酸合酶的改變基因的分離可在轉(zhuǎn)化的植物細(xì)胞中通過(guò)測(cè)定表達(dá)的鄰氨基苯甲酸合酶在通常有毒性的5-甲基色氨酸水平下是否保留酶活性而驗(yàn)證。見(jiàn)Anderson等人,美國(guó)專利號(hào)6,118,047。
可優(yōu)化在此提供的任何DNA分子的編碼區(qū),用于在所選擇的生物體中例如,所選擇的植物或其他宿主細(xì)胞類型中表達(dá)。對(duì)于所選擇的植物具有優(yōu)化的密碼子使用的DNA分子的實(shí)例是具有SEQ ID NO75的根瘤農(nóng)桿菌鄰氨基苯甲酸合酶的DNA分子。該優(yōu)化的根瘤農(nóng)桿菌鄰氨基苯甲酸合酶DNA(SEQ ID NO75)與SEQ ID NO1有94%的同一性。
轉(zhuǎn)基因和載體一旦獲得和擴(kuò)增編碼鄰氨基苯甲酸合酶或其結(jié)構(gòu)域的核酸,就可以可操作地與啟動(dòng)子,任選地與其他元件結(jié)合形成轉(zhuǎn)基因。
大多數(shù)基因具有已知作為啟動(dòng)子并調(diào)控基因表達(dá)的DNA序列的區(qū)域。在真核和原核細(xì)胞中,通常在編碼序列上游的DNA序列側(cè)翼找到啟動(dòng)子區(qū)域。啟動(dòng)子序列提供對(duì)下游基因序列轉(zhuǎn)錄的調(diào)控,一般包括約50-約2,000個(gè)核苷酸堿基對(duì)。啟動(dòng)子序列也包含調(diào)控序列,例如可影響基因表達(dá)水平的增強(qiáng)子序列。一些分離的啟動(dòng)子序列可提供外源基因的基因表達(dá),即不同于天然或同源基因的基因表達(dá)。已知啟動(dòng)子序列可以是強(qiáng)的或弱的或可誘導(dǎo)的。強(qiáng)啟動(dòng)子可以提供高水平的基因表達(dá),而弱啟動(dòng)子提供低水平的基因表達(dá)。可誘導(dǎo)的啟動(dòng)子是對(duì)于外源所加的試劑或?qū)τ诃h(huán)境或發(fā)育的刺激可打開(kāi)或關(guān)閉基因表達(dá)的啟動(dòng)子。啟動(dòng)子可以提供組織特異性或發(fā)育的調(diào)控。對(duì)于異源基因是強(qiáng)啟動(dòng)子的分離啟動(dòng)子是有利的,因?yàn)樗峁┳銐蛩降幕虮磉_(dá)以便容易檢測(cè)和篩選出轉(zhuǎn)化細(xì)胞,在需要時(shí)提供高水平的基因表達(dá)。
可提供本發(fā)明的轉(zhuǎn)基因中的啟動(dòng)子用于從編碼鄰氨基苯甲酸合酶的DNA序列表達(dá)鄰氨基苯甲酸合酶。優(yōu)選地,編碼序列的表達(dá)導(dǎo)致植物組織,例如植物種子中色氨酸水平的增強(qiáng)。在另一個(gè)實(shí)施方案中,編碼序列的表達(dá)導(dǎo)致對(duì)色氨酸的氨基酸類似物的反饋抑制或生長(zhǎng)抑制的耐受性增強(qiáng)或?qū)е录?xì)胞中色氨酸總量的增加。也可誘導(dǎo)啟動(dòng)子以使得基因表達(dá)可以在加入外源試劑時(shí)開(kāi)放或關(guān)閉。例如,如Ptac啟動(dòng)子的細(xì)菌啟動(dòng)子可根據(jù)加入到轉(zhuǎn)化的細(xì)菌細(xì)胞中的異硫丙基半乳糖苷的水平被誘導(dǎo)而改變基因表達(dá)的水平。也可優(yōu)選結(jié)合具有提供在植物中組織特異性表達(dá)或發(fā)育地調(diào)控基因表達(dá)的啟動(dòng)子的基因。用于實(shí)現(xiàn)本發(fā)明的許多啟動(dòng)子對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)是可獲得的。
優(yōu)選的啟動(dòng)子一般包括但不限于,在細(xì)菌、細(xì)菌噬菌體、質(zhì)體或植物細(xì)胞中起作用的啟動(dòng)子。有用的啟動(dòng)子包括CaMV 35S啟動(dòng)子(Odell等人,自然Nature,313810(1985)),CaMV 19S(Lawton等人,Plant Mol.Biol.,931F(1987)),nos(Ebert等人,Proc.Nat.Acad.Sci.(U.S.A.),845745(1987)),Adh(Walker等人,Proc.Nat.Acad.Sci.(U.S.A.),846624(1987)),蔗糖合酶(Yang等人,Proc.Nat.Acad Sci.(U.S.A.),874144(1990)),α-微管蛋白,napin,肌動(dòng)蛋白(Wang等人,Mol.Cell.Biol.,123399(1992)),cab(Sullivan等人,Mol.Gen.Genet.,215431(1989)),PEPCase啟動(dòng)子(Hudspeth等人,Plant Mol.Biol.,12579(1989)),7S-α′-大豆伴球蛋白啟動(dòng)子(Beachy等人,EMBO J,43047(1985))或與R基因復(fù)合物相關(guān)的啟動(dòng)子(Chandler等人,The Plant Cell,11175(1989))。其他有用的啟動(dòng)子包括噬菌體SP6,T3,和T7啟動(dòng)子。
也可使用質(zhì)體啟動(dòng)子。大多數(shù)的質(zhì)體基因含有可用于多亞基質(zhì)體編碼的RNA聚合酶(PEP)以及單亞基核編碼的RNA聚合酶的啟動(dòng)子。核編碼的聚合酶(NEP)啟動(dòng)子的共有序列和幾種天然質(zhì)體基因的特異性啟動(dòng)子序列的列表可在Hajdukiewicz等人,EMBO J.,164041-4048,(1997)中找到,在此將其全部引入作為參考。
可使用的質(zhì)體啟動(dòng)子的實(shí)例包括玉米質(zhì)體RRN(ZMRRN)啟動(dòng)子。ZMRRN啟動(dòng)子在擬南芥質(zhì)體RNA聚合酶存在時(shí)可驅(qū)使基因表達(dá)。可用于本發(fā)明的相似啟動(dòng)子有甘氨酸最大質(zhì)體RRN(SOYRRN)和煙草(Nicotianatabacum)質(zhì)體RRN(NTRRN)啟動(dòng)子。所有這三種啟動(dòng)子都可被擬南芥(Arabidopsis)質(zhì)體RNA聚合酶識(shí)別。RRN啟動(dòng)子的普遍特征在Hajdukiewicz等人和美國(guó)專利6,218,145中有描述。
而且,來(lái)源于特定啟動(dòng)子的轉(zhuǎn)錄增強(qiáng)子或復(fù)制增強(qiáng)子也可用于增強(qiáng)表達(dá)。這種增強(qiáng)子的實(shí)例包括但不限于,來(lái)源于CaMV 35S啟動(dòng)子和章魚(yú)氨酸(octopine)合酶基因(Last等人,美國(guó)專利5,290,924)的元件。例如,根據(jù)本發(fā)明可構(gòu)建包括ocs增強(qiáng)子元件的載體。這個(gè)元件首次是從農(nóng)桿菌屬(Ellis等人,EMBO J.,63203(1987))的章魚(yú)氨酸合酶(ocs)基因中確定的16bp回文(palindromic)增強(qiáng)子,并且存在至少10個(gè)其他的啟動(dòng)子(Bouchez等人,EMBOJ.,84197(1989))。當(dāng)在單子葉植物轉(zhuǎn)化中使用時(shí),建議使用增強(qiáng)子元件,例如ocs元件和特別是多拷貝的元件,將有助于增強(qiáng)鄰近啟動(dòng)子的轉(zhuǎn)錄水平。組織特異性啟動(dòng)子,包括但不限于,根細(xì)胞啟動(dòng)子(Conkling等人,PlantPhysiol.,931203(1990)),并且也包括特別有用的組織特異性增強(qiáng)子(Fromm等人,The Plant Cell,1977(1989)),以及例如ABA-和膨壓誘導(dǎo)的啟動(dòng)子等的可誘導(dǎo)的啟動(dòng)子。
轉(zhuǎn)錄起始位點(diǎn)和編碼序列起始之間的DNA序列,即未翻譯的前導(dǎo)序列可影響基因表達(dá),也希望采用特定的前導(dǎo)序列??刹捎帽绢I(lǐng)域技術(shù)人員可獲得的任何前導(dǎo)序列。優(yōu)選的前導(dǎo)序列直接優(yōu)化所連接基因的表達(dá)水平,例如,通過(guò)增強(qiáng)或維持mRNA的穩(wěn)定性和/或防止不合適的翻譯起始(Joshi,Nucl.Acid Res.,156643(1987))。本領(lǐng)域技術(shù)人員謹(jǐn)慎考慮選擇這種序列。也可以考慮使用來(lái)源于在雙子葉植物,特別是大豆中高表達(dá)基因的序列。
在一些情況下,不必要極端高表達(dá)鄰氨基苯甲酸合酶或其結(jié)構(gòu)域。例如,使用本發(fā)明的方法可產(chǎn)生這種高水平的鄰氨基苯甲酸合酶,可產(chǎn)生的底物而不是酶可能限制色氨酸產(chǎn)生的水平。在這種時(shí)候,本領(lǐng)域的技術(shù)人員可采用更加適度或調(diào)控水平的表達(dá)。這樣技術(shù)人員可容易地調(diào)節(jié)和調(diào)控表達(dá)的水平,例如,通過(guò)使用弱啟動(dòng)子或發(fā)育調(diào)控或組織特異性的啟動(dòng)子。
編碼感興趣的鄰氨基苯甲酸合酶的核酸也包括質(zhì)體運(yùn)輸肽(例如SEQ IDNOs72,74,114,或115),有助于運(yùn)輸鄰氨基苯甲酸合酶多肽進(jìn)入質(zhì)體,例如,進(jìn)入葉綠體。通常編碼所選擇的質(zhì)體運(yùn)輸肽(例如,SEQ ID NOs71或73)的核酸在框內(nèi)與編碼鄰氨基苯甲酸合酶的序列連接。然而,質(zhì)體運(yùn)輸肽也可位于鄰氨基苯甲酸合酶的N末端或C末端。
構(gòu)建體也包括感興趣的核酸(例如編碼鄰氨基苯甲酸合酶的DNA)和作為轉(zhuǎn)錄終止信號(hào)和允許所得mRNA的多聚腺苷酸化的核酸序列。這種轉(zhuǎn)錄終止信號(hào)位于感興趣的編碼區(qū)的3′或下游。優(yōu)選的轉(zhuǎn)錄終止信號(hào)包括來(lái)源于根瘤農(nóng)桿菌胭脂氨酸合酶基因的轉(zhuǎn)錄終止信號(hào)(Bevan等人,Nucl.AcidRes.,11369(1983)),來(lái)源于根瘤農(nóng)桿菌章魚(yú)氨酸(octopine)合酶的終止子,和馬鈴薯和番茄中編碼蛋白酶抑制劑I和II的3′末端基因,盡管也可以使用其他本領(lǐng)域技術(shù)人員已知的轉(zhuǎn)錄終止信號(hào)。根據(jù)需要進(jìn)一步包括調(diào)控元件,例如Adh內(nèi)含子1(Callis等人,Genes Develop.,11183(1987)),蔗糖合酶內(nèi)含子(Vasil等人,Plant Physiol.,915175(1989))或TMVω元件(Gallie等人,ThePlant Cell,1301(1989))。可以根據(jù)An,Methods in Enzymology,153292(1987)描述的方法獲得這些3′非翻譯的調(diào)控序列,或已經(jīng)存在可從商業(yè)上,例如Clontech,(Palo Alto,加利福尼亞)獲得的質(zhì)體上。3′非翻譯的調(diào)控序列可按標(biāo)準(zhǔn)方法可操作地與鄰氨基苯甲酸合酶基因的3末端相連。本發(fā)明也可以使用其他本領(lǐng)域技術(shù)人員已知的調(diào)控元件。
DNA構(gòu)建體可包含第一表達(dá)盒,包括,可操作地連接,異源啟動(dòng)子,編碼鄰氨基苯甲酸合酶α-結(jié)構(gòu)域蛋白的DNA分子和轉(zhuǎn)錄終止子。這種DNA構(gòu)建體可進(jìn)一步包含可操作連接的第二表達(dá)盒,其包括異源啟動(dòng)子,編碼鄰氨基苯甲酸合酶β-結(jié)構(gòu)域蛋白的DNA分子和轉(zhuǎn)錄終止子。
在本發(fā)明中也使用可選擇的標(biāo)記基因或報(bào)道基因。這種基因可賦予表達(dá)標(biāo)記基因的細(xì)胞明顯的表型,這樣可以在沒(méi)有標(biāo)記的細(xì)胞中區(qū)分出轉(zhuǎn)化細(xì)胞??蛇x擇的標(biāo)記基因賦予一個(gè)可通過(guò)化學(xué)方法,即通過(guò)使用選擇性試劑(例如,殺蟲(chóng)劑,抗生素等)進(jìn)行“選擇”的性狀。報(bào)道基因或可篩選的基因賦予可通過(guò)觀察或檢測(cè)確定的性狀,即通過(guò)“篩選”(例如,R-基因座性狀)。當(dāng)然,本領(lǐng)域已知許多合適標(biāo)記基因的實(shí)例,都可用于實(shí)現(xiàn)本發(fā)明。
本發(fā)明中涉及使用的可選擇標(biāo)記包括但不限于,編碼新霉素抗性的neo基因(Potrykus等人,Mol Gen.Genet.,199183(1985)),可用卡那霉素,G418等選擇;編碼bialaphos抗性的bar基因;編碼改變的DPSP合酶蛋白的基因(Hinchee等人,Biotech.,6915(1988))可賦予草甘膦抗性;腈水解酶基因,例如來(lái)源于臭鼻克雷白氏桿菌(Klebsiella ozaenae)的bxn,可賦予bromoxynil抗性(Stalker等人,Science,242419(1988));突變的乙酰乳酸合酶基因(ALS)可賦予咪唑啉酮、磺酰尿或其他ALS-抑制化學(xué)試劑(EP 154 204(1985))的抗性;氨甲喋呤抗性DHFR基因(Thillet等人,J.Biol.Chem.,26312500(1988));茅草枯(dalapon)脫鹵素酶基因可賦予對(duì)殺蟲(chóng)劑茅草枯的抗性;或突變的鄰氨基苯甲酸合酶基因可賦予對(duì)5-甲基色氨酸的抗性。使用突變的EPSP合酶基因時(shí),通過(guò)整合合適的質(zhì)體運(yùn)輸肽(CTP)可實(shí)現(xiàn)額外的益處。
能夠在選擇轉(zhuǎn)化體的系統(tǒng)中使用的可選擇標(biāo)記基因的說(shuō)明性的實(shí)施方案是編碼phosphinothricin乙?;D(zhuǎn)移酶的基因,例如來(lái)源于吸水鏈霉菌(Streptomyces hygroscopicus)的bar基因或來(lái)源于綠色產(chǎn)色鏈霉菌(Streptomyces viridochromogenes)的pat基因(美國(guó)專利5,550,318,其在此引入作為參考)。Phosphinothricin乙?;D(zhuǎn)移酶(PAT)使殺蟲(chóng)劑bialaphos,phosphinothricin(PPT)中的活性成分失活。PPT抑制谷氨酰胺合酶,(Murakami等人,Mol.Gen.Genet.,20542(1986);Twell等人,Plant Physiol.,911270(1989))導(dǎo)致氨的迅速積累和細(xì)胞死亡。
可使用的選擇性標(biāo)記包括但不限于,β-葡醛糖酸糖苷酶或uidA基因(GUS),已知其編碼各種發(fā)色底物的酶;R-基因座基因,其編碼的產(chǎn)物調(diào)控植物組織中花色素苷色素(紅色)的產(chǎn)量(Dellaporta等人,染色體結(jié)構(gòu)和功能,第263-282頁(yè)(1988));β-內(nèi)酰胺酶基因(Sutcliffe,Proc.Nat.Acad.Sci.(U.S.A.),753737(1978)),已知其編碼各種發(fā)色底物的酶(例如,PADAC,生色的頭孢菌素);xylE基因(Zukowsky等人,Proc.Nat.Acad.Sci.(U.S.A.),801101(1983))編碼兒茶酚雙加氧酶可轉(zhuǎn)換生色的兒茶酚;α-淀粉酶基因(Ikuta等人,Biotech.,8241(1990));酪氨酸酶基因(Katz等人,J.Gen.Microbiol.,1292703(1983)),其編碼的酶可以氧化酪氨酸為DOPA和多巴醌,其依次可濃縮形成易檢測(cè)的化合物黑色素;β-半乳糖苷酶基因,已知其編碼各種發(fā)色底物的酶;螢光素酶(lux)基因(Ow等人,Science,234856(1986)),其可用生物發(fā)光檢測(cè);或甚至是水母發(fā)光蛋白質(zhì)基因(Prasher等人,Biochem.Biophys.Res.Comm.,1261259(1985)),它可用于鈣敏感的生物發(fā)光檢測(cè),或綠色熒光蛋白基因(Niedz等人,Plant Cell Reports,14403(1995))。轉(zhuǎn)化細(xì)胞中l(wèi)ux基因的存在可使用例如X射線膠片,閃爍計(jì)數(shù),熒光分光光度測(cè)定法,低光視頻照相機(jī),光子計(jì)數(shù)照相機(jī),或多維發(fā)光儀(multiwell luminometry)檢測(cè)。預(yù)想也可發(fā)展這個(gè)系統(tǒng)以用于生物發(fā)光的群體篩選,例如在組織培養(yǎng)平板上,或甚至在整個(gè)植株中篩選。
另外,也可構(gòu)建轉(zhuǎn)基因,用于提供將基因產(chǎn)物導(dǎo)向植物細(xì)胞內(nèi)的胞內(nèi)部分或指導(dǎo)蛋白進(jìn)入胞外環(huán)境。這通常通過(guò)連接編碼運(yùn)輸或信號(hào)肽的DNA序列和編碼特定基因的序列而實(shí)現(xiàn)。所得的運(yùn)輸或信號(hào)肽將分別把蛋白運(yùn)輸?shù)教囟ǖ募?xì)胞內(nèi)或細(xì)胞外的目的地,并且可在翻譯后除去。運(yùn)輸或信號(hào)肽有助于運(yùn)輸?shù)鞍淄ㄟ^(guò)細(xì)胞內(nèi)的膜,例如,液泡、小泡、質(zhì)體和線粒體膜,而信號(hào)肽指導(dǎo)蛋白通過(guò)胞外膜。通過(guò)協(xié)助蛋白進(jìn)入細(xì)胞內(nèi)或細(xì)胞外的區(qū)室,這些序列增強(qiáng)了基因產(chǎn)物的積累。
這種用法的特定實(shí)例是關(guān)于指導(dǎo)鄰氨基苯甲酸合酶進(jìn)入,例如質(zhì)體而非細(xì)胞質(zhì)的特定的細(xì)胞器。使用擬南芥SSU 1A運(yùn)輸肽賦予蛋白特異性導(dǎo)向質(zhì)體作為例證性說(shuō)明??蛇x地,轉(zhuǎn)基因也可包括編碼質(zhì)體運(yùn)輸肽的DNA序列或編碼rbcS(RuBISCO)運(yùn)輸肽的DNA序列,其可操作地連接啟動(dòng)子和編碼鄰氨基苯甲酸合酶的DNA序列。(關(guān)于質(zhì)體導(dǎo)向肽的綜述,見(jiàn)Heijne等人,Eur.J.Biochem.,180535(1989);Keegstra等人,Ann.Rev.Plant Physiol.PlantMol.Biol.,40471(1989))。如果轉(zhuǎn)基因被導(dǎo)入植物細(xì)胞,轉(zhuǎn)基因也可包含植物轉(zhuǎn)錄終止和多聚腺苷酸化信號(hào)和翻譯信號(hào),以及連接植物鄰氨基苯甲酸合酶基因的3′末端的翻譯信號(hào)。
可以使用外源質(zhì)體運(yùn)輸肽,其不在天然的植物鄰氨基苯甲酸合酶基因內(nèi)被編碼。質(zhì)體運(yùn)輸肽一般長(zhǎng)度為40-70個(gè)氨基酸,功能是翻譯后指導(dǎo)蛋白進(jìn)入質(zhì)體。運(yùn)輸肽在進(jìn)入質(zhì)體產(chǎn)生成熟蛋白的過(guò)程中或之后切除。編碼植物鄰氨基苯甲酸合酶的基因的完整拷貝含有質(zhì)體運(yùn)輸肽。那種情況下,就沒(méi)必要將外源獲得的質(zhì)體運(yùn)輸肽序列結(jié)合到轉(zhuǎn)基因中。
可以從各種植物核基因中獲得外源運(yùn)輸肽編碼序列,只要基因的產(chǎn)物表達(dá)為含有氨基端運(yùn)輸肽的前蛋白并運(yùn)輸?shù)劫|(zhì)體中。已知的植物基因產(chǎn)物的實(shí)例包括這種運(yùn)輸肽序列,包括但不限于,核酮糖二磷酸羧化酶的小亞基,葉綠素a/b結(jié)合蛋白,由核基因編碼的質(zhì)體核糖體蛋白,某些熱休克蛋白,氨基酸生物合酶,例如乙酰乳酸合酶,3-烯醇丙酮磷酸莽草鹽(3-enolpyruvylphosphos hikimate)合酶,二氫吡啶二羧酸合酶,鄰氨基苯甲酸合酶等的氨基酸。在一些情況中,質(zhì)體運(yùn)輸肽蛋白可能在感興趣的鄰氨基苯甲酸合酶基因中編碼,其中就不必要添加這種質(zhì)體運(yùn)輸序列??蛇x地,編碼運(yùn)輸肽的DNA片段可從例如上面所列出的運(yùn)輸肽的已知序列整個(gè)地或部分地化學(xué)合成,。
不管編碼運(yùn)輸肽的DNA片段的來(lái)源,它必須包括例如ATG密碼子的翻譯起始密碼子,和表達(dá)在宿主植物的質(zhì)體中可識(shí)別的和發(fā)揮合適作用的氨基酸序列。也必須關(guān)注運(yùn)輸肽和鄰氨基苯甲酸合酶之間連接的氨基酸序列,其可切除產(chǎn)生成熟的酶。已經(jīng)鑒別了一些保守的氨基酸序列,并可作為指導(dǎo)路線。運(yùn)輸肽編碼序列和鄰氨基苯甲酸合酶編碼序列的精確融合可能需要處理一個(gè)或兩個(gè)DNA序列以引入,例如方便的限制性酶切位點(diǎn)。這可通過(guò)定點(diǎn)突變,化學(xué)合成的寡核苷接頭的插入等方法實(shí)現(xiàn)。
編碼質(zhì)體運(yùn)輸肽的核酸的精確融合是不必要的,只要編碼質(zhì)體運(yùn)輸肽的序列在編碼鄰氨基苯甲酸合酶的序列框內(nèi)。例如,經(jīng)??梢园ǜ郊拥碾幕虬被岫鴮?duì)感興趣的蛋白的表達(dá)或定位無(wú)反作用。
一旦獲得質(zhì)體運(yùn)輸肽序列,可適宜地與啟動(dòng)子和鄰氨基苯甲酸合酶編碼區(qū)根據(jù)標(biāo)準(zhǔn)方法在轉(zhuǎn)基因中連接。可構(gòu)建在植物細(xì)胞中起作用和在下游具有多克隆位點(diǎn)的質(zhì)?;驈纳虡I(yè)來(lái)源獲得。采用限制性酶將質(zhì)體運(yùn)輸肽序列插入啟動(dòng)子的下游。鄰氨基苯甲酸合酶的編碼區(qū)可在翻譯后融合或立即插入質(zhì)體運(yùn)輸肽序列的3′末端的下游和框架內(nèi)。因此,質(zhì)體運(yùn)輸肽優(yōu)先與鄰氨基苯甲酸合酶的氨基端連接。一旦形成,將轉(zhuǎn)基因亞克隆到其他的質(zhì)?;蜉d體中。
除了核植物轉(zhuǎn)化以外,本發(fā)明也提供植物質(zhì)體基因組的轉(zhuǎn)化。因此,將基因產(chǎn)物導(dǎo)向植物細(xì)胞內(nèi)的胞內(nèi)區(qū)室,可通過(guò)指導(dǎo)基因進(jìn)入胞內(nèi)部分獲得。質(zhì)體基因組的直接轉(zhuǎn)化比核轉(zhuǎn)化更好。例如,直接的質(zhì)體轉(zhuǎn)化鄰氨基苯甲酸合酶相對(duì)于核轉(zhuǎn)化消除了對(duì)質(zhì)體靶肽和翻譯后的運(yùn)輸以及前體蛋白的處理過(guò)程的需要。在P.Maliga,Current Opinion in Plant Biology,5164-172(2002),P.B.Heifetz,Biochimie,82655-666(2000),R.Bock.,J.Mol.Biol.,312425-438(2001),和H.Daniell等人,Trends in Plant Science,784-91(2002)中描述了植物的質(zhì)體轉(zhuǎn)化,在此作為參考。
構(gòu)建了含有鄰氨基苯甲酸合酶基因的轉(zhuǎn)基因后,將盒導(dǎo)入植物細(xì)胞中。根據(jù)植物細(xì)胞的類型,基因表達(dá)的水平和基因編碼酶的活性,將編碼鄰氨基苯甲酸合酶的DNA導(dǎo)入植物細(xì)胞可導(dǎo)致色氨酸的過(guò)量產(chǎn)生,賦予對(duì)色氨酸的氨基酸類似物,例如5-甲基色氨酸或6-甲基鄰氨基苯甲酸的耐受性,和/或另外改變植物細(xì)胞中的色氨酸含量。
宿主細(xì)胞的轉(zhuǎn)化將包含鄰氨基苯甲酸合酶基因的轉(zhuǎn)基因亞克隆到已知的表達(dá)載體中,檢測(cè)和/或定量AS的表達(dá)。這種篩選方法對(duì)于鑒定提供鄰氨基苯甲酸合酶基因的表達(dá)的轉(zhuǎn)基因,和鄰氨基苯甲酸合酶在轉(zhuǎn)化植物細(xì)胞的質(zhì)體中的表達(dá)是有用的。
質(zhì)粒載體包括附加的DNA序列,其提供簡(jiǎn)便的篩選,擴(kuò)增和在原核和真核細(xì)胞中轉(zhuǎn)化轉(zhuǎn)基因,例如,pUC-衍生載體,pSK-衍生載體,pGEM-衍生載體,pSP-衍生載體,或pBS-衍生載體。附加的DNA序列包括提供載體自我復(fù)制的復(fù)制原點(diǎn),可選擇的標(biāo)記基因,優(yōu)選編碼抗生素或殺蟲(chóng)劑抗性,提供多位點(diǎn)以便在轉(zhuǎn)基因中插入DNA序列或編碼的基因的獨(dú)特的多克隆位點(diǎn),以及增強(qiáng)原核和真核細(xì)胞轉(zhuǎn)化的序列。
可用于植物和原核細(xì)胞中表達(dá)的另外的載體是二元的Ti質(zhì)粒(如在Schilperoort等人,美國(guó)專利4,940,838中所公開(kāi)的),以載體pGA582例證說(shuō)明。二元的Ti質(zhì)粒已經(jīng)被在前引用的An鑒定。二元的Ti質(zhì)粒可在原核細(xì)菌,例如大腸桿菌和農(nóng)桿菌中復(fù)制。衣桿菌質(zhì)粒載體可用于傳遞轉(zhuǎn)基因進(jìn)入植物細(xì)胞中。二元的Ti載體優(yōu)選包括提供有效的植物細(xì)胞轉(zhuǎn)化的胭脂氨酸TDNA的左右邊界,可選擇標(biāo)記基因,T邊界區(qū)獨(dú)特的多克隆位點(diǎn),colE1復(fù)制原點(diǎn)和野生型宿主區(qū)域的復(fù)制子。攜帶本發(fā)明的轉(zhuǎn)基因的二元Ti載體可用于原核和真核細(xì)胞的轉(zhuǎn)化,但優(yōu)選用于轉(zhuǎn)化植物細(xì)胞。參見(jiàn)例如,Glassman等人,美國(guó)專利5,258,300。
通過(guò)適用的方法將表達(dá)載體導(dǎo)入原核或真核細(xì)胞。對(duì)于單子葉和雙子葉植物特別有效的轉(zhuǎn)化方法,包括但不限于,微粒轟擊未成熟胚胎(美國(guó)專利5,990,390)或II型胚胎發(fā)生的愈傷組織細(xì)胞,如W.J.Gordon-Kamm等人(Plant Cell,2603(1990)),M.E.Fromm等人Bio/Technology,8833(1990))和D.A.Walters等人(Plant Molecular Biology,18189(1992))所描述的,或電穿孔I型胚胎發(fā)生的愈傷組織,如D′Halluin等人(The Plant Cell,41495(1992)),或Krzyzek(美國(guó)專利5,384,253)所描述的。通過(guò)與DNA包被的鎢須漩渦轉(zhuǎn)化植物細(xì)胞(Coffee等人,美國(guó)專利5,302,523)和使用含有DNA的脂質(zhì)體轉(zhuǎn)化細(xì)胞。
所選擇的鄰氨基苯甲酸合酶構(gòu)建體轉(zhuǎn)化細(xì)胞后,宿主細(xì)胞可用于由轉(zhuǎn)基因的鄰氨基苯甲酸合酶結(jié)合宿主酶促機(jī)制產(chǎn)生有用產(chǎn)物的生產(chǎn)。培養(yǎng)轉(zhuǎn)化細(xì)胞導(dǎo)致升高的色氨酸產(chǎn)量和其他有用的化合物,其可以從細(xì)胞或培養(yǎng)基中獲得。在各種宿主細(xì)胞和/或生物體中表達(dá)產(chǎn)生的有用化合物的實(shí)例,包括色氨酸,吲哚乙酸和其他植物激素,在大豆中發(fā)現(xiàn)的對(duì)心血管健康很重要的異類黃酮化合物,玉米中作為食草昆蟲(chóng)天敵的信號(hào)的揮發(fā)性吲哚,抗癌劑,例如十字花科(cruciferae)植物家族中的吲哚芥子油苷(glucosinolate)(吲哚-3-甲醇),和吲哚生物堿,例如某些真菌產(chǎn)生的麥角化合物。(Barnes等人,Adv ExpMed Biol,40187(1996);Frey等人,Proc Natl Acad. Sci.,9714801(2000);Muller等人,Biol.Chem.,381679(2000);Mantegani等人,F(xiàn)armaco,54288(1999);Zeligs,J Med Food,167(1998);Mash等人,Ann NY Acad Sci.,844274(1998);Melanson等人,Proc Natl Acad.Sci.,9413345(1997);Broadbent等人,Curr Med Chem.,5469(1998))。
色氨酸的積累導(dǎo)致微生物和植物中次級(jí)代謝產(chǎn)物增加,例如,含有例如植物中簡(jiǎn)單的吲哚,吲哚共軛物,吲哚生物堿,吲哚植物抗毒素和吲哚芥子油苷的代謝產(chǎn)物的吲哚。
對(duì)色氨酸不敏感的鄰氨基苯甲酸合酶有可能由于色氨酸經(jīng)分支酸變位酶刺激合成苯基丙氨酸,而增加各種分支酸衍生的代謝物,包括那些衍生自苯基丙氨酸的代謝物。參見(jiàn)Siehl,D.來(lái)自分支酸的色氨酸、酪氨酸和苯基丙氨酸的生物合成,″植物氨基酸生物化學(xué)和生物技術(shù)″,BK Singh編輯,第171-204頁(yè)。當(dāng)存在反饋不敏感的鄰氨基苯甲酸合酶時(shí),其他分支酸衍生的代謝物可能增加,包括苯丙醇,類黃酮和異類黃酮,以及衍生自鄰氨基苯甲酸的代謝物,例如吲哚,吲哚生物堿和吲哚芥子油苷。這些化合物中的許多種是重要的植物激素,植物防御化合物,各種健康狀態(tài)的化學(xué)防護(hù)試劑,和/或藥物活性的化合物。
由于鄰氨基苯甲酸合酶的表達(dá)而增強(qiáng)合成的這些化合物的范圍依賴于表達(dá)鄰氨基苯甲酸合酶的生物體。本領(lǐng)域的技術(shù)人員可輕易地評(píng)估哪種和/或測(cè)定生物體和宿主細(xì)胞可用于產(chǎn)生所需要的化合物。本發(fā)明也包括在各種生物體,包括植物,微生物,真菌,酵母,細(xì)菌,昆蟲(chóng)細(xì)胞和哺乳動(dòng)物細(xì)胞中合成色氨酸和其他有用的化合物。
篩選色氨酸過(guò)量產(chǎn)生的細(xì)胞系的策略利用組織培養(yǎng)技術(shù)對(duì)所需要的色氨酸類似物抗性,色氨酸過(guò)量產(chǎn)生的變異體的有效篩選,需要仔細(xì)的確定篩選的條件。優(yōu)化這些條件以容許在培養(yǎng)物中生長(zhǎng)和積累色氨酸類似物抗性的、色氨酸過(guò)量產(chǎn)生的細(xì)胞,同時(shí)抑制大量細(xì)胞群的生長(zhǎng)。由于個(gè)體細(xì)胞在種群中的存活力高度依賴于鄰近細(xì)胞的存活力,這使得情況變得復(fù)雜。
通過(guò)化合物與組織相互作用的特征確定細(xì)胞培養(yǎng)物暴露于色氨酸類似物下的狀況。要考慮例如毒性的程度和抑制的速率這類因素。培養(yǎng)物中細(xì)胞化合物的積累,培養(yǎng)基和細(xì)胞中化合物的持續(xù)和穩(wěn)定,都需要同吸收和傳遞給所需要的細(xì)胞部分的程度一起考慮??蛇x地,測(cè)定加入色氨酸是否逆轉(zhuǎn)化合物的作用也很重要。
要仔細(xì)評(píng)價(jià)類似物對(duì)于培養(yǎng)物的存活力和形態(tài)學(xué)的影響。特別重要的是選擇對(duì)培養(yǎng)的植物再生能力沒(méi)有影響的暴露于類似物的條件。對(duì)類似物暴露條件的選擇也受到類似物是否殺死細(xì)胞或只是抑制細(xì)胞分化的影響。
篩選方案的選擇依賴于上面提到的考慮因素。下面簡(jiǎn)要描述的方案可用于篩選過(guò)程。例如,為了選擇對(duì)色氨酸類似物的生長(zhǎng)抑制有抗性的細(xì)胞,將在培養(yǎng)物的懸浮液中很好分化的細(xì)胞在短時(shí)間內(nèi)暴露在高水平的色氨酸類似物下?;厥蘸托罘e存活的細(xì)胞,并隨后再暴露更長(zhǎng)時(shí)間??蛇x地,有組織的部分分化的細(xì)胞培養(yǎng)物伴隨連續(xù)的暴露在最初低水平的色氨酸類似物下生長(zhǎng)和傳代培養(yǎng)。經(jīng)過(guò)幾次傳代培養(yǎng)間隔后濃度逐漸增加。在篩選過(guò)程中使用這些方案時(shí),本發(fā)明并不僅限于這些過(guò)程。
植物修飾的基因如上所描述的,在本發(fā)明的轉(zhuǎn)基因,載體和植物中,作為可選擇的標(biāo)記基因和報(bào)道基因的基因可操作地與編碼鄰氨基苯甲酸合酶或其結(jié)構(gòu)域的DNA序列連接。另外,可以將其他農(nóng)藝學(xué)的性狀加到本發(fā)明的轉(zhuǎn)基因,載體和植物中。這些性狀包括但不限于,昆蟲(chóng)抗性或耐受性;疾病抗性或耐受性(病毒,細(xì)菌,真菌,線蟲(chóng)類);脅迫抗性或耐受性,例證說(shuō)明的有抗或耐受干旱,熱,冷,冰凍,過(guò)量潮濕,鹽脅迫,氧化脅迫,增加的產(chǎn)量,食物含量和組成,物理表現(xiàn),雄性不育,干燥,群從能力(standability),繁殖力,淀粉特性,油的數(shù)量和質(zhì)量等。可整合一個(gè)或多個(gè)賦予本發(fā)明的植物這些性狀的基因。
昆蟲(chóng)抗性或耐受性蘇云金芽孢桿菌(Bacillus thuringiensis或″Bt″)包括近20種已知亞類的細(xì)菌,其產(chǎn)生的內(nèi)毒素多肽被多種昆蟲(chóng)攝入時(shí)是有毒的。內(nèi)毒素蛋白(Bt蛋白)和相應(yīng)的基因(Bt基因)的生物學(xué)和分子生物學(xué)在H.R.Whitely等人,Ann.Rev.Microbiol.,40549(1986)和H.Hofte等人,Microbiol.Rev.,53242(1989)中有評(píng)述。已經(jīng)克隆和測(cè)序了各種Bt蛋白的編碼基因。Bt多肽的片段對(duì)于各種鱗翅目(Lepidoptera)害蟲(chóng)的毒性是本質(zhì)上的,并占大約Bt多肽分子首要(first)的50%。因此,截短的Bt基因編碼的截短的Bt多肽在多數(shù)時(shí)候保留了對(duì)多種鱗翅目昆蟲(chóng)的毒性。例如HD73和HD1 Bt多肽顯示對(duì)美國(guó)植物中的重要鱗翅類害蟲(chóng)幼蟲(chóng)的毒性,例如歐洲玉米螟(borer),切根蟲(chóng)(cut worms)和螟蛉(earworms)。M.Geiser等人,Gene,48109(1986)和M.J.Adang等人,Gene,36289(1985)各自克隆和測(cè)序了編碼HD73和HD1 Bt多肽的編碼基因,其可從采用標(biāo)準(zhǔn)方法收集的培養(yǎng)物(例如,Bacillus Genetic Stock Center,Columbus,OH or USDA Bt stock collection Peoria,IL)中獲得的HD73和HD1菌株中克隆。例如在美國(guó)專利6,329,574;6,303,364;6,320,100和6,331,655中描述了Bt基因和多肽。
編碼新的、以前未表征的Bt毒素的DNA可從宿主芽孢桿菌(Bacillus)生物體中采用以前克隆Bt基因的步驟克隆得到,也可以產(chǎn)生Bt毒素的新的合成形式。
用于本發(fā)明的Bt基因包括5′DNA序列,其含有在植物中允許下游的Bt序列轉(zhuǎn)錄和翻譯起始的DNA序列。Bt基因也包含3′DNA序列,它包括來(lái)源于可在感興趣植物中表達(dá)的基因的3′非編碼區(qū)的序列。Bt基因也包括編碼蘇云金芽孢桿菌產(chǎn)生的毒性Bt多肽或其毒性部分或具有的基本氨基序列的同源物的DNA序列。Bt編碼序列可包括(i)編碼與Bt內(nèi)毒素基本上同源的殺蟲(chóng)劑蛋白的DNA序列,它對(duì)感興趣植物的有害昆蟲(chóng)有活性,例如HD73或HD1 Bt序列;(ii)編碼Bt內(nèi)毒素多肽的殺蟲(chóng)劑活性的片段的序列,例如殺蟲(chóng)劑活性的HD73或HD1多肽的從羧基和/或氨基端截短的形式;和/或(iii)在框內(nèi)與編碼提供附加優(yōu)點(diǎn)的多肽融合的截短的Bt序列,所附加的優(yōu)點(diǎn)例如(a)可選擇的基因,例如,賦予抗生素或殺蟲(chóng)劑抗性的基因,(b)其產(chǎn)物易檢測(cè)和分析的報(bào)道基因,例如,熒光蛋白或β-葡萄糖苷酶;(c)編碼具有一些附加用途的多肽序列的DNA序列,該附加用途是穩(wěn)定Bt蛋白不被降解或增強(qiáng)Bt蛋白對(duì)昆蟲(chóng)的有效性,例如蛋白酶抑制劑;和(d)協(xié)助指導(dǎo)Bt蛋白進(jìn)入植物細(xì)胞特定的部分內(nèi)或外的序列,例如信號(hào)序列。
為了在植物中獲得Bt蛋白的優(yōu)化合成,也可以適當(dāng)調(diào)節(jié)Bt基因的DNA序列,使基因在感興趣的植物中更加有效的表達(dá)。由于Bt基因的密碼子使用與感興趣植物中表達(dá)的基因所使用的不同,可以通過(guò)使用在植物中,例如經(jīng)常在感興趣的植物中使用的(見(jiàn)E.Murray等人,Nucl Acids Res.,l7477(1989))更加有效表達(dá)的密碼子來(lái)取代這些密碼子而增加Bt基因在植物細(xì)胞中的表達(dá)。這種密碼子取代需要取代堿基但不改變最終Bt多肽的序列。Bt多肽序列可與細(xì)菌基因或其片段相同。含有比原始細(xì)菌的基因更加優(yōu)選的密碼子的完整的Bt編碼序列或其部分,可通過(guò)采用標(biāo)準(zhǔn)的化學(xué)合成方法合成,并且采用標(biāo)準(zhǔn)方法導(dǎo)入或組裝Bt基因,例如定點(diǎn)突變或DNA聚合和連接等。
蛋白酶抑制劑可提供昆蟲(chóng)抗性。例如,使用來(lái)源于馬鈴薯或番茄的蛋白酶抑制劑II基因,pinII是非常有用的。組合使用pinII基因和Bt毒素基因也是有好處的。編碼昆蟲(chóng)消化系統(tǒng)抑制劑的其他基因,或編碼酶或有助于抑制劑產(chǎn)生的輔助因子的基因也很有用。這包括例如來(lái)源于小麥和大麥的水稻半胱氨酸蛋白酶(oryzacystatin)抑制劑和淀粉酶抑制劑。
編碼凝集素的基因可賦予附加的或備選的殺蟲(chóng)劑特性。(Murdock等,Phytochemistry,29 85(1990);Czapla和Lang,J.Econ.Entomol.,832480(1990)。也包括有用的外源凝集素基因,例如,大麥和小麥的胚凝集素(WGA)以及稻的外源凝集素(Gatehouse等人,J Sci Food Agric.,35373(1984))。
當(dāng)被導(dǎo)入有害昆蟲(chóng)時(shí),控制針對(duì)昆蟲(chóng)的大的或小的活性多肽,例如溶解酶的肽,肽激素和毒素和毒液的產(chǎn)量的基因都是很有用的。例如,保幼激素酯酶的表達(dá)直接導(dǎo)向特異性的有害昆蟲(chóng),也可導(dǎo)致殺蟲(chóng)劑活性,或可導(dǎo)致變態(tài)的停止(Hammock等人,Nature,344458(1990))。
表達(dá)編碼影響昆蟲(chóng)外皮(cutide)完整性的基因的轉(zhuǎn)基因植物也是有用的。這些基因包括編碼幾丁質(zhì)酶,蛋白酶,脂肪酶和產(chǎn)生三國(guó)霉素的基因。編碼影響昆蟲(chóng)蛻皮活性的基因,如影響蛻皮素UDP-葡萄糖基轉(zhuǎn)移酶產(chǎn)量的基因也是有用的。
編碼促進(jìn)減少植物對(duì)有害昆蟲(chóng)的營(yíng)養(yǎng)品質(zhì)的化合物的生產(chǎn)的酶的基因也是有用的。通過(guò)改變固醇成分可例如賦予植物殺蟲(chóng)劑活性。本發(fā)明進(jìn)一步的實(shí)施方案涉及具有增強(qiáng)的脂肪氧化酶活性的轉(zhuǎn)基因植物。
本發(fā)明也提供用于改變次級(jí)代謝物的方法和化合物。一個(gè)實(shí)例涉及改變植物產(chǎn)生DIMBOA,預(yù)期其可賦予對(duì)歐洲玉米螟,根蟲(chóng)和幾種其他有害昆蟲(chóng)的抗性。參見(jiàn)例如,美國(guó)專利6,331,880。DIMBOA來(lái)源于吲哚相關(guān)的化合物。本發(fā)明提供的方法用于增強(qiáng)植物細(xì)胞和組織內(nèi)類似色氨酸的吲哚相關(guān)地化合物含量。因此,根據(jù)本發(fā)明在此提供的方法也可增加DIMBOA的水平,因而增強(qiáng)對(duì)昆蟲(chóng)的抗性。
導(dǎo)入調(diào)控玉米可凝性球蛋白(maysin)產(chǎn)生的基因和涉及高粱中蜀黍苷產(chǎn)生的基因,都可分別用于促進(jìn)對(duì)有害幼蟲(chóng)(earworm)和根蟲(chóng)的抗性。
也可使用編碼具有潛在的殺蟲(chóng)劑活性的蛋白的更多基因。這種基因包括,例如,可用作根蟲(chóng)抑制劑的豇豆胰蛋白酶抑制劑(CpTI;Hilder等人,Nature,330160(1987));證實(shí)可用于玉米根蟲(chóng)抑制劑(deterrent)的編碼除蟲(chóng)菌素的基因(除蟲(chóng)菌素和阿巴美丁(Abamectin),Campbell,W.C.,編輯.,1989;Ikeda等人,J Bacteriol,1695615 1987);核糖體滅活蛋白基因;和調(diào)控植物結(jié)構(gòu)的基因。轉(zhuǎn)基因植物包括抗昆蟲(chóng)抗體基因和編碼可將植物外用為非毒性殺蟲(chóng)劑(前殺蟲(chóng)劑)轉(zhuǎn)化為植物內(nèi)殺蟲(chóng)劑的酶的基因。
環(huán)境或脅迫抗性或耐受性可通過(guò)基因的表達(dá)影響植物對(duì)各種環(huán)境脅迫的耐受能力的提高。例如,對(duì)霜凍溫度的增強(qiáng)抗性可通過(guò)導(dǎo)入“抗凍”蛋白,例如美洲擬鰈(WinterFlounder)(Cutler等人,J Plant Physiol.,135351(1989))或合成其基因衍生物而賦予。改善質(zhì)體中甘油-3-磷酸乙?;D(zhuǎn)移酶的表達(dá)可賦予增強(qiáng)的耐寒性(Wolter等人,The EMBO J.,114685(1992))。超氧化物歧化酶的表達(dá)可賦予對(duì)氧化脅迫的抗性(Gupta等人,Proc.Natl.Acad.Sci(U.S.A.),901629(1993)),谷胱甘肽還原酶可改善對(duì)氧化脅迫的抗性(Bowler等人,Ann Rev.Plant Physiol.,4383(1992))。
預(yù)期影響植物的含水量,總的水壓,滲透壓和膨壓的基因的表達(dá)增強(qiáng)植物對(duì)干旱的耐受性,并因此將是有用的。建議使用例如,編碼用于滲透壓活性溶質(zhì)的生物合成的基因的表達(dá)可賦予抗干旱的保護(hù)。這類基因中有編碼甘露醇脫氫酶(Lee和Saier,J.Bacteriol.,258,10761(1982))和海藻糖-6-磷酸合酶(Kaasen等人,J.Bacteriology,174889(1992))的基因。
類似地,其他代謝產(chǎn)物也可保護(hù)酶的功能或膜的完整性(Loomis等人,J.Expt.Zoology,2529(1989)),因此編碼用于這些化合物的生物合成的基因可賦予以類似或補(bǔ)充甘露醇的方式的干旱抗性。天然產(chǎn)生的其他代謝物的實(shí)例是滲透壓活性的,和/或在干旱和/或脫水過(guò)程中提供一些直接保護(hù)作用的,包括果糖,赤蘚糖醇,山梨醇,衛(wèi)矛醇,葡糖基甘油,蔗糖,水蘇糖,棉子糖,脯氨酸,甘氨酸,甜菜堿,ononitol和松醇。參見(jiàn)例如,美國(guó)專利6,281,411。
根據(jù)結(jié)構(gòu)的相似性可分為三種后期胚胎發(fā)生蛋白(見(jiàn)Dure等人,PlantMolecular Biology,12475(1989))。所有三種LEA組的結(jié)構(gòu)基因的表達(dá)可賦予干旱耐受性。水脅迫過(guò)程中誘導(dǎo)的其他類型的蛋白可能是有用的,包括硫醇蛋白酶,醛縮酶和跨膜運(yùn)輸?shù)鞍?,在干旱脅迫中其可賦予各種保護(hù)性和/或修復(fù)功能。參見(jiàn)例如,PCT/CA99/00219(Na+/H+交換多肽基因)。影響脂質(zhì)生物合成的基因也可用于賦予干旱抗性。
涉及特異的形態(tài)學(xué)性狀,容許從干燥的土壤中增強(qiáng)水的提取的基因表達(dá)也是有用的。在脅迫過(guò)程中增強(qiáng)復(fù)制適應(yīng)性的基因表達(dá)也是有用的。建議在脅迫過(guò)程中最小化核發(fā)育不全的基因表達(dá)將提高所收獲的谷物的數(shù)量,因此是有價(jià)值的。
即使當(dāng)土壤中的水不受限制時(shí),通過(guò)導(dǎo)入和表達(dá)基因可使植物更有效地利用水從而增加總的產(chǎn)量。通過(guò)導(dǎo)入基因提高植物最大化利用水的能力,可克服涉及水的可獲得性的所有脅迫范圍,也可實(shí)現(xiàn)產(chǎn)量性能的穩(wěn)定性或產(chǎn)量的連續(xù)性。
疾病抗性或耐受性可通過(guò)表達(dá)基因產(chǎn)生對(duì)病毒的抗性。例如,表達(dá)針對(duì)基本的病毒功能的反義基因或表達(dá)編碼病毒外殼蛋白的基因可賦予對(duì)病毒的抗性。
通過(guò)導(dǎo)入基因賦予對(duì)細(xì)菌和真菌導(dǎo)致的疾病的抗性。例如,編碼稱作“肽抗生素”的基因,編碼病原相關(guān)(PR)蛋白,毒素抗性和影響宿主病原體相互作用,例如形態(tài)學(xué)特征的蛋白的基因都是有用的。
真菌毒素的減少/消除由植物相關(guān)的真菌產(chǎn)生的真菌毒素,包括黃曲霉毒素和煙曲霉毒素(fumonisin),是使得谷粒無(wú)用的一個(gè)重要因素。抑制這些真菌的生長(zhǎng)可減少毒素物質(zhì)的合成,從而減少由于真菌毒素污染造成的谷粒損失??稍谥参镏袑?dǎo)入基因抑制真菌毒素的合成而不妨礙真菌的生長(zhǎng)。此外,為了獲得減少真菌毒素污染的谷粒,表達(dá)編碼使得真菌毒素?zé)o毒性的酶的新基因也是有用的。
植物組合物或品質(zhì)可以改變植物組合物,例如,通過(guò)各種方式改善氨基酸的平衡,包括增加天然蛋白的表達(dá),降低不良組合物的表達(dá),改變天然蛋白的組成,或?qū)刖幋a完整的具有優(yōu)越組成的新蛋白的基因。參見(jiàn)例如,美國(guó)專利6,160,208(種子儲(chǔ)存蛋白表達(dá)的改變)。導(dǎo)入基因改變植物中油的含量是有價(jià)值的。參見(jiàn)例如,美國(guó)專利6,069,289和6,268,550(ACCase基因)。導(dǎo)入的基因可例如通過(guò)增加分枝的程度,通過(guò)延遲代謝導(dǎo)致母牛中增加對(duì)淀粉的利用,從而增強(qiáng)植物中淀粉含量的營(yíng)養(yǎng)價(jià)值,。
植物農(nóng)藝學(xué)的性狀決定植物在何處生長(zhǎng)的兩個(gè)因素是生長(zhǎng)季節(jié)過(guò)程中的平均日溫度和霜凍間的時(shí)間長(zhǎng)短。表達(dá)涉及調(diào)控植物發(fā)育的基因也許是有用的,例如,已經(jīng)在谷物(corn)中鑒定的非舌葉(liguleless)和粗糙鞘基因。
導(dǎo)入玉米的基因?qū)⒃鰪?qiáng)站立性和其他植物的生長(zhǎng)特性。賦予更強(qiáng)壯的莖,改善的根系或防止或減少抽穗的額外損耗的基因表達(dá)對(duì)于農(nóng)民來(lái)說(shuō)都是有價(jià)值的。
營(yíng)養(yǎng)利用利用可獲得營(yíng)養(yǎng)的能力是植物生長(zhǎng)的一個(gè)限制因素。通過(guò)導(dǎo)入基因可改變營(yíng)養(yǎng)的吸收,耐受pH的極限,植物中的流動(dòng),儲(chǔ)存庫(kù),和代謝活動(dòng)的有效性。這些修飾使得植物更加有效利用可獲得的營(yíng)養(yǎng)。例如,通常存在于植物中并涉及營(yíng)養(yǎng)利用的酶的活性的增強(qiáng)可增強(qiáng)營(yíng)養(yǎng)的有用性。這種酶的一個(gè)實(shí)例是植酸酶。
雄性不育雄性不育在生產(chǎn)雜交中有用,雄性不育可通過(guò)表達(dá)基因產(chǎn)生??赏ㄟ^(guò)轉(zhuǎn)化導(dǎo)入TURF-13而從疾病敏感性中分離出雄性不育。參見(jiàn)Levings,Science,250942-947,(1990)。對(duì)于育種的目的,有必要恢復(fù)雄性不育,可導(dǎo)入編碼恢復(fù)雄性不育的基因。
抗性細(xì)胞系的篩選和表征當(dāng)細(xì)胞或組織恢復(fù)到在通常的色氨酸類似物水平抑制存在下觀察到生長(zhǎng)良好就可以進(jìn)行篩選。這些細(xì)胞“系”在色氨酸類似物存在下傳代培養(yǎng)幾次以去除非抗性細(xì)胞,然后進(jìn)行表征。通過(guò)比較在各種濃度的色氨酸類似物存在下這些細(xì)胞系和未篩選細(xì)胞或組織的生長(zhǎng)可確定所獲得的抗性量。將所篩選的細(xì)胞系在沒(méi)有色氨酸類似物存在下,簡(jiǎn)單培養(yǎng)不同的時(shí)間階段,然后分析將組織再暴露在色氨酸類似物下的生長(zhǎng)就可以評(píng)估培養(yǎng)細(xì)胞抗性的穩(wěn)定性。也可以使用體外化學(xué)研究評(píng)估抗性細(xì)胞系來(lái)證實(shí)改變類似物的作用位點(diǎn)可形成對(duì)色氨酸類似物抑制的較少的敏感性。
在轉(zhuǎn)化細(xì)胞中可測(cè)定和定量鄰氨基苯甲酸合酶的瞬時(shí)表達(dá)?;虮磉_(dá)可通過(guò)RT-PCR分析,使用克隆的鄰氨基苯甲酸合酶特異性抗體的Western印跡或通過(guò)檢測(cè)在色氨酸或色氨酸的氨基酸類似物存在下酶的活性而定量。測(cè)定克隆的鄰氨基苯甲酸合酶的組織和亞細(xì)胞定位可通過(guò)使用克隆的鄰氨基苯甲酸合酶特異性抗體的免疫化學(xué)染色法或亞細(xì)胞的分級(jí)以及隨后的生物化學(xué)和/或免疫學(xué)分析。也可以評(píng)估克隆的鄰氨基苯甲酸合酶對(duì)試劑的敏感性。提供鄰氨基苯甲酸合酶的表達(dá)或鄰氨基苯甲酸合酶對(duì)色氨酸的氨基酸類似物或游離的L-色氨酸的抑制的耐受性的轉(zhuǎn)基因可用于轉(zhuǎn)化單子葉和/或雙子葉植物組織細(xì)胞并產(chǎn)生轉(zhuǎn)化的植物和種子。轉(zhuǎn)化細(xì)胞可通過(guò)檢測(cè)選擇性標(biāo)記基因或報(bào)道基因的存在,例如,通過(guò)檢測(cè)選擇性的除草劑抗性標(biāo)記而篩選。鄰氨基苯甲酸合酶基因在轉(zhuǎn)基因的胚胎發(fā)生愈傷組織中的瞬時(shí)表達(dá)可使用對(duì)鄰氨基苯甲酸合酶特異性的抗體或通過(guò)RT-PCR分析來(lái)檢測(cè)。
植物再生和種子的生產(chǎn)轉(zhuǎn)化的胚胎發(fā)生愈傷組織,分生組織,胚,葉盤(pán)等都可用于產(chǎn)生顯示轉(zhuǎn)化的鄰氨基苯甲酸合酶基因穩(wěn)定遺傳的轉(zhuǎn)基因植物。顯示對(duì)色氨酸的氨基酸類似物的令人滿意水平耐受性的植物細(xì)胞系可通過(guò)本領(lǐng)域已知的方法實(shí)行植物再生方案以獲得成熟植物和表達(dá)耐受性性狀的種子(例如,參見(jiàn)美國(guó)專利5,990,390和5,489,520;和Laursen等人,Plant Mol.Biol.,2451(1994))。植物再生方案可使體細(xì)胞胚發(fā)育并隨后生長(zhǎng)成根和苗。為了確定耐受性性狀在植物分化器官中,而不僅只是在未分化的細(xì)胞培養(yǎng)物中表達(dá),可分析再生植物相對(duì)于再生的非轉(zhuǎn)化植物的植物各個(gè)部分的色氨酸存在水平。轉(zhuǎn)基因植物和種子可從采用標(biāo)準(zhǔn)的方法顯示出色氨酸含量或?qū)ι彼犷愃莆锏目剐宰兓募?xì)胞和組織中產(chǎn)生。尤其優(yōu)選色氨酸含量增強(qiáng)的葉片和種子。在抑制量的色氨酸或其類似物的存在下,酶特定活性的變化可通過(guò)檢測(cè)轉(zhuǎn)化細(xì)胞中的酶活性來(lái)測(cè)定,如Widholm,Biochimica et Biophysica Acta,27948(1972)中所描述的。通過(guò)如Jones等人,Analyst,106968(1981)所描述的標(biāo)準(zhǔn)方法檢查總色氨酸含量的變化。
從已知表達(dá)性狀的細(xì)胞系獲得成熟的植物。如果可能的話,使再生植物自花授粉。另外,將來(lái)源于再生植物的花粉與具有農(nóng)藝學(xué)上重要的自交系的種子所生長(zhǎng)的植物進(jìn)行雜交。在一些情況中,使用來(lái)源于自交系的花粉給再生植物授粉。通過(guò)評(píng)價(jià)第一代和后代的性狀分離來(lái)遺傳表征該性狀。如果該性狀是商業(yè)上有用的,組織培養(yǎng)物中所選擇的植物性狀的遺傳可能性和表達(dá)是特別重要的。
如果各種不同雜交組合都可以得到的話,色氨酸過(guò)量產(chǎn)生的大豆,谷類和其他植物的商業(yè)價(jià)值是巨大的。農(nóng)民一般根據(jù)成熟度,站立性或其他農(nóng)藝學(xué)性狀的差異種植多種雜交品種。另外,由于成熟度,疾病,和昆蟲(chóng)抗性的性狀的差異,適應(yīng)一部分地區(qū)的雜種并不適于其他部分。因此,有必要培育色氨酸過(guò)量產(chǎn)生的大量的親本自交系以產(chǎn)生許多雜交組合。
通過(guò)雜交原始過(guò)量產(chǎn)生的品系與正常的原種品系以及將雜交后代與正常的親本回交來(lái)進(jìn)行轉(zhuǎn)換過(guò)程(回交)。這種雜交的后代將進(jìn)行分離以至于攜帶基因的植物負(fù)責(zé)過(guò)量生產(chǎn),而另外一些則沒(méi)有。攜帶這種基因的植物再次與正常的親本雜交,導(dǎo)致在后代中再次分離出過(guò)量產(chǎn)生和正常產(chǎn)量的性狀。不停重復(fù)直到原始正常的親本轉(zhuǎn)變成過(guò)量產(chǎn)生的品系,也具有在正常親本中原始就有的其他重要的特性。對(duì)于每種原種品系都實(shí)現(xiàn)分離的回交方案,則可將其轉(zhuǎn)換成色氨酸過(guò)量生產(chǎn)的品系。
回交后,新的過(guò)量產(chǎn)生的品系和合適品系的組合是具有很好的商業(yè)價(jià)值的雜種,評(píng)價(jià)其過(guò)量生產(chǎn)和其他一系列重要的農(nóng)藝學(xué)性狀。生產(chǎn)過(guò)量產(chǎn)生的品系和雜種,其是原始正常品系和雜種的純種類型。這需要在一系列環(huán)境條件中評(píng)估哪些品系或雜種通常將用于大規(guī)模地生長(zhǎng)。對(duì)于高水平色氨酸大豆的產(chǎn)生,需要雜種種子的兩個(gè)親本是純合的高色氨酸的特征。增加表現(xiàn)令人滿意的雜種的親本品系并采用標(biāo)準(zhǔn)的雜種種子生產(chǎn)試驗(yàn)用于雜種的制備。
預(yù)計(jì)在此產(chǎn)生的轉(zhuǎn)基因植物有益于各種商業(yè)和研究目的??僧a(chǎn)生轉(zhuǎn)基因植物用于傳統(tǒng)的農(nóng)藝學(xué)以具有對(duì)從植物中收獲的谷粒的消費(fèi)者有利的性狀(例如,在人食物或動(dòng)物飼料中增加營(yíng)養(yǎng)含量)。在這種用途中,植物通常是為了人或動(dòng)物食物中的谷物的用途而生長(zhǎng)。然而,植物的其他部分,例如莖,外殼,營(yíng)養(yǎng)性部分等都是有用的,包括用作動(dòng)物飼料,發(fā)酵飼料,生物催化的一部分或觀賞性的用途。
轉(zhuǎn)基因植物也可用于商業(yè)上的蛋白或其他分子的生產(chǎn),其中從植物部分,種子等中提取或純化感興趣的分子。也可體外培養(yǎng)、生長(zhǎng)植物的細(xì)胞或組織,或發(fā)酵制備這種分子。
轉(zhuǎn)基因植物也可用于商業(yè)上的育種項(xiàng)目,或雜交或培育相關(guān)農(nóng)作物種類的植株??梢詡鬟f重組DNA編碼的改進(jìn),例如,通過(guò)原生質(zhì)體融合從大豆細(xì)胞傳遞到其他種類的細(xì)胞。
在一個(gè)實(shí)施方案中,含有玉米鄰氨基苯甲酸α-結(jié)構(gòu)域的轉(zhuǎn)基因分離自對(duì)5-MT耐受的玉米品系,與35S CaMV啟動(dòng)子連接并且采用微粒轟擊的方法導(dǎo)入5-MT敏感的單子葉或雙子葉組織中。篩選出轉(zhuǎn)化的胚胎或分生組織用于產(chǎn)生轉(zhuǎn)基因植物。評(píng)估轉(zhuǎn)化的愈傷組織和轉(zhuǎn)基因的植物對(duì)5-MT或6-MA的耐受性和耐受性狀的穩(wěn)定遺傳性。
下面的實(shí)施例進(jìn)一步闡述了本發(fā)明,但并不是為了限制本發(fā)明。
實(shí)施例1來(lái)自根瘤農(nóng)桿菌的鄰氨基苯甲酸合酶的分離和大腸桿菌表達(dá)該實(shí)施例描述了來(lái)自根瘤農(nóng)桿菌的鄰氨基苯甲酸合酶的分離及其在大腸桿菌中的表達(dá)。
根瘤農(nóng)桿菌AS的克隆使用來(lái)自苜蓿中華根瘤菌(Rhizobium meliloti)的鄰氨基苯甲酸合酶編碼區(qū)的核苷酸和氨基酸序列(GenBank登錄號(hào)P15395)檢索根瘤農(nóng)桿菌C58基因組序列數(shù)據(jù)庫(kù)(Goodner等人,科學(xué)Science,2942323-2328(2001))。該檢索由利用blosum62矩陣的tblastn組成(Altschul等人,核酸研究Nucleic Acid Res.,253389-3402(1997))。
在根瘤農(nóng)桿菌C58基因組序列數(shù)據(jù)庫(kù)中鑒定的AS同系物,通過(guò)利用來(lái)自根瘤農(nóng)桿菌菌株C58(ATCCNo.33970)的基因組DNA作為模板的PCR克隆。初級(jí)的PCR反應(yīng)利用下列引物進(jìn)行5′-TTATGCCGCCTGTCATCG-3′(SEQ ID NO47);和5′-ATAGGCTTAATGGTAACCG-3′(SEQ ID NO48)。
基因擴(kuò)增參數(shù)如下(a)95℃變性30秒,(b)50℃退火30秒,以及(c)根據(jù)制造商的指導(dǎo),利用擴(kuò)展高保真PCR(Roche Biochemicals)在72℃延伸2分鐘。
附加一輪的PCR擴(kuò)增產(chǎn)生大約2.3Kb長(zhǎng)度的產(chǎn)物,該反應(yīng)利用上述的擴(kuò)增模板和下列成套引物5′-CTGAACAACAGAAGTACG-3′(SEQ ID NO49);和5′-TAACCGTGTCATCGAGCG-3′(SEQ ID NO50)。
將純化的PCR產(chǎn)物連接到pGEM-Teasy(Promega Biotech)中從而得到質(zhì)粒pMON61600(圖1)。pMON61600利用標(biāo)準(zhǔn)的測(cè)序方法測(cè)序。正確序列的確認(rèn)是通過(guò)與苜蓿中華根瘤菌鄰氨基苯甲酸合酶的序列(圖2)比較而獲得的。來(lái)自分離克隆的翻譯的氨基酸序列(SEQ ID NO4)與苜蓿中華根瘤菌酶(SEQID NO7)(圖2)享有88%的同一性??s寫(xiě)″AgroAS″或根瘤農(nóng)桿菌AS有時(shí)在此用于指根瘤農(nóng)桿菌的鄰氨基苯甲酸合酶。
根瘤農(nóng)桿菌AS的大腸桿菌表達(dá)構(gòu)建下列載體以便于將根瘤農(nóng)桿菌AS基因亞克隆到合適的表達(dá)載體中。
利用pMON61600作為模板和下列引物產(chǎn)生2215堿基對(duì)的PCR片段5′-AAAAAGATCTCCATGGTAACGATCATTCAGG-3′(SEQ ID NO51);和5′-AAAAGAATTCTTATCACGCGGCCTTGGTCTTCGCC-3′(SEQ ID NO52)。
質(zhì)粒pMON61600用限制性內(nèi)切酶NcoI和RsrII消化。另外,將409bp的片段(通過(guò)用NcoI和RsrII消化2215堿基對(duì)的PCR產(chǎn)物產(chǎn)生)隨后連接到消化的pMON61600質(zhì)粒中,從而替換NcoI/RsrII片段,并在具有根瘤農(nóng)桿菌AS翻譯起始密碼子(ATG)的框內(nèi)得到NcoI位點(diǎn),以產(chǎn)生質(zhì)粒pMON34692(圖3)。
堿基T7大腸桿菌表達(dá)質(zhì)粒,pMON34697(圖4),是通過(guò)用SphI和BamHI限制性消化pET30a(NoVogen公司)而產(chǎn)生的。純化所得到的4,969bp片段并用來(lái)自pET11d(NoVogen公司)的338bp的SphI和BamHI片段亞克隆。
質(zhì)粒pMON34705(圖5)通過(guò)用NcoI和SacI限制性消化pMON34697而產(chǎn)生。然后純化所得到的5,263bp片段并連接來(lái)自包含根瘤農(nóng)桿菌AS的pMON34692的2,256bp的NcoI和SacI片段。
根據(jù)制造商的指導(dǎo)說(shuō)明(Novogen公司),將質(zhì)粒pMON34705轉(zhuǎn)化入大腸桿菌BL21(DE3)(F-ompTHsdSb(rB-mB-)gal dcm(DE3))。DE3是包含受控制于異丙基-1-硫代-D-半乳糖苷(IPTG)誘導(dǎo)的lacUV5的T7 RNA聚合酶的染色體拷貝的λDE3的宿主溶菌原。
在已經(jīng)于37℃培養(yǎng)過(guò)夜(10小時(shí))的卡那霉素平板上篩選轉(zhuǎn)化細(xì)胞。將單克隆轉(zhuǎn)入2ml的LB(Luria液體培養(yǎng)基;每升10g胰蛋白胨,5g酵母提取物,10gNaCl,和1g葡萄糖(任選的))或2×-YT液體培養(yǎng)基(每升16g胰蛋白胨,10g酵母提取物,5gNaCl),然后放入37℃的培養(yǎng)箱中在225rpm搖動(dòng)3小時(shí)。移出細(xì)胞并在培養(yǎng)物中加入4μL的100mM IPTG,再放回37℃培養(yǎng)箱補(bǔ)充培養(yǎng)2-3小時(shí)。移出1mL等分的細(xì)胞,并在超聲緩沖液(50mM磷酸鉀(pH7.3),10%甘油,10mM 2-巰基乙醇和10mM MgCl2)中超聲處理。所得到的裂解細(xì)胞提取物是用于如下所述的標(biāo)準(zhǔn)AS分析的原材料。結(jié)果證實(shí)以質(zhì)粒pMON34705為基礎(chǔ)的表達(dá)體系能夠生產(chǎn)可溶解的和酶促活性的根瘤農(nóng)桿菌AS蛋白質(zhì),其數(shù)量是總的可溶解的提取蛋白質(zhì)的大約50%。
實(shí)施例2通過(guò)用野生型的農(nóng)桿菌鄰氨基苯甲酸合酶轉(zhuǎn)化植物獲得高Trp種子水平。
表達(dá)載體pMON58120載體pMON58120(圖34)編碼264堿基對(duì)的擬南芥小亞基(SSU)葉綠體靶肽(CTP,SEQ ID NO71)和2187堿基對(duì)的野生型農(nóng)桿菌(Agrobacterium)鄰氨基苯甲酸合酶(AgroAS)開(kāi)放閱讀框(SEQ ID NO1)間的融合體。參見(jiàn),Stark等人,(1992)科學(xué)Science,258287。開(kāi)放閱讀框的表達(dá)是由大豆7Sα初級(jí)(7Sα′)啟動(dòng)子驅(qū)動(dòng)的。
當(dāng)在細(xì)胞質(zhì)核糖體上翻譯時(shí),融合體(不成熟的蛋白質(zhì))進(jìn)入到葉綠體中,其中除去了葉綠體靶序列。在CTP1中存在2個(gè)切割位點(diǎn)。第一個(gè)位點(diǎn)是CDS起始(C/M)上游的30個(gè)堿基對(duì),而另一個(gè)是起始的甲硫氨酸(C/M)。第二切割位點(diǎn)看來(lái)不進(jìn)行有效地加工。預(yù)測(cè)該切割產(chǎn)生通過(guò)酶活性數(shù)據(jù)和trp效能數(shù)據(jù)所顯示的具有AS活性的大約70Kd的成熟蛋白質(zhì)。
AS基因用賦予草甘膦抗性的合成CP4基因轉(zhuǎn)化,然而CP4基因是從AS基因單獨(dú)加工出來(lái)的。CP4基因的表達(dá)由FMV啟動(dòng)子驅(qū)動(dòng),該啟動(dòng)子是來(lái)自玄參(Figwort)花葉病毒的35S啟動(dòng)子。草甘膦抗性提供了轉(zhuǎn)化植物的篩選。
AS蛋白質(zhì)的Western分析分析pMON58120的35個(gè)轉(zhuǎn)化事件中AgroAS蛋白質(zhì)的存在。AgroAS蛋白質(zhì)用兔抗純化的His標(biāo)記的AgroAS激發(fā)的多克隆抗體檢測(cè)。使用His-標(biāo)記的全長(zhǎng)Agro-AS多肽作為抗原,由CoCalico Biological公司在兔中產(chǎn)生多克隆抗體群。將重組His標(biāo)記的Agro-AS DNA置入pMON34701(pet-30a-agroAS)表達(dá)載體。His-AgroAS融合蛋白質(zhì)在大腸桿菌BL21(DE3)中表達(dá),并通過(guò)Ni-NTA樹(shù)脂系統(tǒng)(Qiagen方法)純化。對(duì)于western分析,使用1∶5,000稀釋的兔抗-AgroAS初級(jí)抗體。其次使用1∶5,000稀釋的山羊抗-兔堿性磷酸酶-共軛的抗體。在攜帶7Sα′-Agro AS基因的轉(zhuǎn)基因品系中,western印跡分析一致顯示存在特異地與抗-AgroAS抗體交叉反應(yīng)的單個(gè)條帶。沒(méi)有在非轉(zhuǎn)基因的對(duì)照品系中檢測(cè)到該條帶。
大豆和擬南芥種子的游離氨基酸分析氨基酸提取將大約50mg碾碎的大豆種子(5mg擬南芥)材料置于各自的離心管中。將1毫升的5%三氯乙酸加入各個(gè)樣品(對(duì)于擬南芥為100μl)。渦旋樣品,并在室溫下擱置攪動(dòng)15分鐘。然后在14000rpm微離心15分鐘。除去一些上清液,放入HPLC管并密封。樣品在4℃保存有待排列分析。
氨基酸分析用于氨基酸分析的試劑包括硼酸鹽緩沖液(水中0.4N,pH10.2)中的OPA試劑(含鄰苯二醛和3-巰基丙酸的硼酸鹽緩沖液Hewlett-Packard,PN 5061-3335))。利用如2000年3月17日的Agilent技術(shù)出版物,″利用Zorbax Eclipse-AAA柱和Agilent 1100系列HPLC的氨基酸分析″所描述的Agilent 1100系列HPLC系統(tǒng)進(jìn)行分析。最初,用10μl硼酸鹽緩沖液中的2.5μl OPA試劑誘導(dǎo)(derivatized)0.5μl的樣品。其次,將該誘導(dǎo)衍生物用1.2ml/min的流速注射到Eclipse XDB-C18 5μm,4.6×150mm柱上。利用在340nm激發(fā),在450nm發(fā)射的熒光測(cè)量氨基酸濃度。用HPLC緩沖液A和B的梯度根據(jù)表A進(jìn)行洗提,其中HPLC緩沖液A是40mM Na2HPO4,pH=7.8,而HPLC緩沖液B是9∶9∶2∷甲醇∶乙腈∶水。
表A氨基酸洗提
從干的化學(xué)藥品,利用感興趣的所有氨基酸制備氨基酸標(biāo)準(zhǔn)。脯氨酸分析需要使用9-芴甲基-氯甲酸酯(FMOC)的附加衍生步驟。氨基酸標(biāo)準(zhǔn)有時(shí)也以0-100μg/ml的濃度范圍購(gòu)買(mǎi)。樣品以μg/g的種子粉末報(bào)告。
野生型農(nóng)桿菌鄰氨基苯甲酸合酶在擬南芥中的表達(dá)將載體pMON58120通過(guò)次級(jí)熒光的真空滲入轉(zhuǎn)化擬南芥植株,并且容許植株產(chǎn)生轉(zhuǎn)基因的種子。收集種子并以存在可選擇的標(biāo)記物(草甘膦抗性)進(jìn)行篩選。草甘膦抗性植物生長(zhǎng)成熟并且從各個(gè)植物收集種子,其中該植株指明為轉(zhuǎn)化事件,并且分析色氨酸含量(表B)。如表B所示,也在成熟種子中通過(guò)Western印跡分析,分析所選擇轉(zhuǎn)化事件中表達(dá)農(nóng)桿菌鄰氨基苯甲酸合酶蛋白質(zhì)的存在。
表B轉(zhuǎn)化體的分析
野生型農(nóng)桿菌鄰氨基苯甲酸合酶在大豆(Glycine Max)中的表達(dá)分析35個(gè)大豆轉(zhuǎn)化事件中,33個(gè)具有增加的種子trp水平,例如,從上述的500ppm達(dá)到12,000ppm。在非轉(zhuǎn)基因的大豆種子中,trp水平小于200ppm。包含高數(shù)量trp的所有種子通過(guò)western印跡證明鄰氨基苯甲酸合酶蛋白質(zhì)的表達(dá)。表C顯示包含高trp水平以及通過(guò)western印跡分析鄰氨基苯甲酸合酶蛋白質(zhì),同時(shí)也為鄰氨基苯甲酸合酶陽(yáng)性的19個(gè)大豆事件的數(shù)據(jù)。
表C具有pMON58120的19個(gè)大豆轉(zhuǎn)基因事件中AgroAS蛋白質(zhì)的存在和色氨酸水平之間的相關(guān)性
Agro AS的酶測(cè)定在攜帶pMON58120構(gòu)建體的11個(gè)轉(zhuǎn)化事件中測(cè)量鄰氨基苯甲酸合酶的特異活性。利用基于HPLC的終點(diǎn)分析根據(jù)C.Paulsen(J.Chromatogr.,547155-160(1991))所描述的方法分析個(gè)別的大豆未成熟種子。簡(jiǎn)要地,從碾磨緩沖液(100mM Tris pH7.5,10%甘油,1mM EDTA,1mM DTT)中的單個(gè)種子產(chǎn)生脫鹽提取物并用反應(yīng)緩沖液(100mM tris pH7.5,1mM分支酸,20mM谷氨酰胺和10mM MgCl2)培育30分鐘。在存在或缺少25mM trp時(shí)測(cè)量AgroAS活性。反應(yīng)用磷酸終止并且通過(guò)HPLC利用設(shè)置在340nm/激發(fā)和410nm/發(fā)射的熒光檢測(cè)器定量所形成的鄰氨基苯甲酸的數(shù)值。
不成熟的分離的轉(zhuǎn)基因種子中AS的特異活性與非轉(zhuǎn)基因?qū)φ障啾?,增?.5倍到70倍,達(dá)到高達(dá)6,000pmoles/mg/min。如表D的最后一列所示,轉(zhuǎn)基因植物中的鄰氨基苯甲酸合酶活性是抗色氨酸抑制的(參見(jiàn)表D)。
表D轉(zhuǎn)基因事件20576中的Agro AS酶活性
實(shí)施例3用包含玉米鄰氨基苯甲酸合酶α-亞基基因的載體轉(zhuǎn)化大豆玉米鄰氨基苯甲酸合酶α-亞基的編碼序列通過(guò)用XbaI組合部分的NcoI消化而從pMON52214(圖22)分離(參見(jiàn)Anderson等人,美國(guó)專利號(hào)6,118,047)。所得到的表示鄰氨基苯甲酸合酶α編碼區(qū)的1952bp的DNA片段用凝膠純化,并制備成平末端。質(zhì)粒pMON53901(圖23)用BglII和EcoRI消化,以產(chǎn)生6.8Kb的片段。分離后,使6.8Kb片段的末端鈍化并脫磷酸化。然后將包含ASα基因的1952Kb的片段連接平末端的6.8Kbp的MON53901片段以產(chǎn)生pMON39324,玉米7S啟動(dòng)子-玉米ASα-NOS3′UTR表達(dá)載體(圖24)。
該pMON39324,玉米7S啟動(dòng)子-玉米ASα-NOS3′UTR盒,隨后用BamHI消化獲得包含7S啟動(dòng)子和玉米ASα編碼序列的2.84Kb的DNA片段。質(zhì)粒pMON39322(圖25)用BamHI消化獲得5.88kb的DNA片段。然后將這2個(gè)片段連接在一起以產(chǎn)生pMON39325(圖26),亞克隆成為pMON39322的包含7S啟動(dòng)子-玉米ASα-NOS3′UTR盒的轉(zhuǎn)化載體。
利用類似的方法,從USP啟動(dòng)子的下游克隆玉米鄰氨基苯甲酸合酶α-亞基的編碼序列,以產(chǎn)生pMON58130表達(dá)載體,從Arc5啟動(dòng)子的下游克隆產(chǎn)生pMON69662表達(dá)載體,從Lea9啟動(dòng)子下游克隆產(chǎn)生pMON69650表達(dá)載體,以及從Per1啟動(dòng)子的下游克隆產(chǎn)生pMON69651表達(dá)載體。這些表達(dá)載體的列表如表E所示。
表EC28-玉米鄰氨基苯甲酸合酶的構(gòu)建體
這些載體用于植物轉(zhuǎn)化和繁殖實(shí)驗(yàn)。如在此所描述的,大豆植株用包含玉米AS的載體利用微粒子轟擊技術(shù)轉(zhuǎn)化。對(duì)于每種類型的載體分別建立幾個(gè)轉(zhuǎn)基因的大豆品系,并且通過(guò)表E中所標(biāo)明的世代數(shù)目來(lái)繁殖。
例如,建立3個(gè)攜帶pMON39325的7Sα′-玉米AS轉(zhuǎn)化基因的純合系。這3個(gè)系在2個(gè)不同的場(chǎng)所隨機(jī)分組設(shè)計(jì)生長(zhǎng)。產(chǎn)生成熟的種子并且分析游離氨基酸的含量。包括對(duì)照以建立基線的trp水平,即3個(gè)相應(yīng)陰性的等值線和非轉(zhuǎn)基因的對(duì)照。
表F提供pMON39325轉(zhuǎn)化體和對(duì)照系的R4種子中ppm的色氨酸,顯示非轉(zhuǎn)基因大豆平均包含大約100-200μg色氨酸種子粉末,而pMON39325轉(zhuǎn)化體基本上包含更多的Trp。也參見(jiàn),圖27。
表F用C28玉米突變體(pMON39325)轉(zhuǎn)化的大豆植株種子中的色氨酸水平
用在5個(gè)不同啟動(dòng)子的控制下表達(dá)C28玉米鄰氨基苯甲酸合酶的5個(gè)其他構(gòu)建體轉(zhuǎn)化大豆(表E),并獲得轉(zhuǎn)基因植株。各個(gè)構(gòu)建體都產(chǎn)生高trp的結(jié)果。由Per1-C28玉米鄰氨基苯甲酸合酶產(chǎn)生的實(shí)施例說(shuō)明的結(jié)果顯示在表G和H中。
表G3個(gè)具有Per1-C28玉米AS(pMON69651)的轉(zhuǎn)基因事件中C28玉米AS蛋白質(zhì)表達(dá)與增加的Trp水平相關(guān)
表H說(shuō)明用pMON69651表達(dá)載體轉(zhuǎn)化大豆植株,R1種子中C28玉米AS的酶活性。
表HpMON69651轉(zhuǎn)化體的R1種子中C28玉米AS的特異活性
這些結(jié)果表明當(dāng)大豆植物組織用C28玉米AS基因轉(zhuǎn)化時(shí),色氨酸有顯著的增加。
表G中顯示的高色氨酸水平與AS蛋白質(zhì)的存在和轉(zhuǎn)基因酶的增加的特異活性(比非轉(zhuǎn)基因?qū)φ罩懈?.5倍)有關(guān)(表H)。如表H所示-以及根據(jù)C28玉米AS酶的生物化學(xué)特性所預(yù)測(cè)的-轉(zhuǎn)基因事件的特異活性是色氨酸-抗性的。
實(shí)施例4根瘤農(nóng)桿菌鄰氨基苯甲酸合酶色氨酸反饋不敏感的突變體的合理設(shè)計(jì)該實(shí)施例描述包含對(duì)色氨酸或色氨酸類似物的反饋抑制具有各種靈敏度或不敏感的突變的根瘤農(nóng)桿菌鄰氨基苯甲酸合酶的載體。
根瘤農(nóng)桿菌突變的鄰氨基苯甲酸合酶基因的產(chǎn)生利用硫磺礦硫化葉菌(Solfulobus solfataricus)的鄰氨基苯甲酸合酶蛋白質(zhì)結(jié)構(gòu)信息作為指導(dǎo)(Knochel等人,Proc.Natl.Acad.Sci.(美國(guó)),969479-9484(1999)),利用蛋白質(zhì)信息學(xué)確信指定幾個(gè)涉及色氨酸結(jié)合的殘基,合理設(shè)計(jì)幾個(gè)根瘤農(nóng)桿菌鄰氨基苯甲酸合酶突變體。這通過(guò)將根瘤農(nóng)桿菌鄰氨基苯甲酸合酶基因與硫磺礦硫化葉菌的鄰氨基苯甲酸合酶氨基酸序列進(jìn)行序列對(duì)比而實(shí)現(xiàn)(圖6)。根瘤農(nóng)桿菌假定的色氨酸結(jié)合和催化域是通過(guò)結(jié)合對(duì)序列同源性的結(jié)構(gòu)信息的認(rèn)識(shí)而指定的。確定結(jié)合袋中的殘基是可用于改變以提供對(duì)色氨酸反饋抑制的抗性的潛在候選物。
根據(jù)硫磺礦硫化葉菌鄰氨基苯甲酸合酶的結(jié)構(gòu)分析,表明氨基酸E30,S31,I32,S42,V43,N204,P205,M209,F(xiàn)210,G221和A373涉及色氨酸結(jié)合。根據(jù)成對(duì)地序列對(duì)比,硫磺礦硫化葉菌的N204,P205和F210在單體的根瘤農(nóng)桿菌鄰氨基苯甲酸合酶中分別為殘基N292,P293和F298,也是保守的。
然而,由于多重插入和缺失,硫磺礦硫化葉菌和根瘤農(nóng)桿菌酶的N-末端區(qū)是高度離散的。因此,必須在根瘤農(nóng)桿菌鄰氨基苯甲酸合酶涉及色氨酸調(diào)控的N-末端區(qū)域人工指定殘基(圖6)。結(jié)構(gòu)分析表明基序″LLES″在色氨酸結(jié)合袋中形成β折疊(β-sheet)。該結(jié)構(gòu)在異四聚體酶中看來(lái)似乎是高度保守的。然后將已知的單體酶利用″LLES″基序作為界標(biāo)人工序列對(duì)比于硫磺礦硫化葉菌序列(圖21)。根據(jù)蛋白質(zhì)信息學(xué)分析,根瘤農(nóng)桿菌AS中的氨基酸殘基V48,S50,S51和N52也可能涉及色氨酸結(jié)合。
隨著在根瘤農(nóng)桿菌單體的酶中指定假定的色氨酸結(jié)合殘基,合理化幾個(gè)獨(dú)特策略以用于減少該酶對(duì)色氨酸抑制的敏感性。這些置換包括例如,擴(kuò)大色氨酸-結(jié)合袋(F298A),窄化結(jié)合袋(V48F,V48Y,S51F,S51C,N52F,F(xiàn)298W),增加結(jié)合袋的極性(S50K),或通過(guò)改變蛋白質(zhì)主鏈的構(gòu)象扭曲結(jié)合袋的形狀(P293A,P29G)。
根瘤農(nóng)桿菌AS的定點(diǎn)誘變使用定點(diǎn)誘變產(chǎn)生10個(gè)單一氨基酸置換的6個(gè)位點(diǎn)。利用QuikChangeTM定點(diǎn)誘變?cè)噭┖?Stratagene)將突變導(dǎo)入pMON34705中的根瘤農(nóng)桿菌AS。用于定點(diǎn)誘變的引物是SEQ ID NOs9-42(圖7;F=正向,R=反向)。每個(gè)引物序列特異地用于在序列中的特異位點(diǎn)改變核酸,并因此改變編碼的密碼子,用于編碼新的氨基酸。例如,S51C指明在根瘤農(nóng)桿菌AS肽序列51位的氨基酸,從絲氨酸變化為半胱氨酸。
誘變后再確認(rèn)全部基因的序列并且表達(dá)變體以及如下列用于野生型酶所描述的,從大腸桿菌純化。將所得到的包括突變的根瘤農(nóng)桿菌AS的質(zhì)粒利用如實(shí)施例1所描述的T7表達(dá)系統(tǒng),合適地克隆到用于過(guò)量生產(chǎn)蛋白質(zhì)的質(zhì)粒中。
根瘤農(nóng)桿菌AS蛋白質(zhì)的表達(dá)和純化如實(shí)施例中所描述的,在大腸桿菌中表達(dá)根瘤農(nóng)桿菌AS野生型和突變的酶。所有的根瘤農(nóng)桿菌AS酶,包括野生型和其突變體的純化,在4℃進(jìn)行。將細(xì)胞(大約1g濕重)懸浮在20ml的純化緩沖液(50mM磷酸鉀,pH7.3,10mMMgCl2,10mM2-巰基乙醇,10%甘油)中,并且通過(guò)超聲處理(Branson SonifierCell Disruptor,W185)裂解。勻漿物在20,000×g離心15分鐘后收集上清液。上清液進(jìn)行硫酸銨分級(jí)分離(30-65%飽和)。在20,000×g離心15分鐘后收集沉淀物,并溶于3ml的純化緩沖液,然后整個(gè)地加載到用相同的緩沖液預(yù)平衡的Econo-Pac 10DG脫鹽柱上。通過(guò)進(jìn)一步分析檢測(cè)包含酶的級(jí)分并加以收集。將收集的酶(4.3mls)加載到用相同的緩沖液平衡的10ml DEAESephacel(Pharmacia Biotech)柱(1.5×7.5cm)上。該柱用30ml的純化緩沖液洗滌并且用相同緩沖液中的30ml的50mM NaCl洗提酶。收集包含高AS活性的級(jí)分并且通過(guò)65%的硫酸銨飽和液沉淀,以及如上所述分離和脫鹽。收集包含酶的級(jí)分并貯藏在-80℃。
鄰氨基苯甲酸合酶的酶測(cè)定和動(dòng)力學(xué)分析根瘤農(nóng)桿菌AS的標(biāo)準(zhǔn)分析于25℃,在包含100mM磷酸鉀,pH7.0,10mMMgCl2,1mM二硫蘇糖醇,200μM分支酸和10mM L-谷氨酰胺的分析緩沖液中進(jìn)行。通過(guò)將30μl的酶加入反應(yīng)混合物并混合而開(kāi)始反應(yīng)。鄰氨基苯甲酸的形成直接通過(guò)320m處3分鐘的吸光率增加而監(jiān)測(cè)。根據(jù)吸光率對(duì)反應(yīng)時(shí)間變化的斜率,以每秒增加的單位吸光率計(jì)算反應(yīng)的初速度。在總體積為1ml的包含100mM磷酸鉀,pH7.0,10mM MgCl2,1mM二硫蘇糖醇和10mM L-谷氨酰胺,并且分支酸濃度在2.5-100μM分支酸之間變化的分析緩沖液中確定分支酸的Km(KmCho)。在總體積為1ml的包含100mM磷酸鉀,pH7.0,10mM MgCl2,1mM二硫蘇糖醇和200μM分支酸,并且L-谷氨酰胺濃度在0.1-2mM L-谷氨酰胺之間變化的分析緩沖液中確定谷氨酰胺的Km(KmGln)。在總體積為1ml,包含100mM磷酸鉀,pH7.0,10mM MgCl2,1mM二硫蘇糖醇,10mM L-谷氨酰胺,200μM分支酸,并且L-色氨酸的濃度在0.1-10mM色氨酸之間變化的分析緩沖液中確定色氨酸的IC50(IC50Trp)。在使數(shù)據(jù)適合非線性回歸程序(GraFit)后計(jì)算AS的動(dòng)力學(xué)參數(shù)和IC50。
幾個(gè)突變體證明對(duì)色氨酸抑制的敏感性降低,同時(shí)與野生型酶相比仍然保持酶活性(表I)。這些結(jié)果表明可例如通過(guò)在鄰氨基苯甲酸合酶的色氨酸結(jié)合袋中突變氨基酸和通過(guò)優(yōu)化證明為反饋不敏感的突變來(lái)減少對(duì)色氨酸抑制的靈敏性的程度。
表I鄰氨基苯甲酸合酶活性以及色氨酸對(duì)根瘤農(nóng)桿菌AS突變體的作用
實(shí)施例5隨機(jī)誘變根瘤農(nóng)桿菌AS以產(chǎn)生色氨酸反饋不敏感的突變體除在實(shí)施例4中所描述的合理設(shè)計(jì)方法外,其他產(chǎn)生鄰氨基苯甲酸合酶的反饋不敏感突變體的策略包括但不限于隨機(jī)誘變。根瘤農(nóng)桿菌AS的隨機(jī)誘變,可例如通過(guò)化學(xué)誘變(分離的DNA或完整的生物體)、易錯(cuò)PCR和DNA移碼實(shí)現(xiàn)。該實(shí)施例描述化學(xué)誘變及其后的遺傳選擇的使用。遺傳選擇方法也對(duì)選擇來(lái)源于其他誘變方法的所需要的突變體有用。
包含根瘤農(nóng)桿菌AS的大腸桿菌表達(dá)質(zhì)粒的產(chǎn)生通過(guò)利用包含正向引物5′末端上的Ncol位點(diǎn)和反向引物3′末端上的XbaI位點(diǎn)的引物,PCR擴(kuò)增來(lái)自根瘤農(nóng)桿菌AS克隆pMON61600(在實(shí)施例1中所描述的(SEQ ID NO1)的開(kāi)放閱讀框5′-CATCCCATGGATGGTAACGATCATTCAGGAT-3′(SEQ ID NO55);和5′-GATGTCTAGAGACACTATAGAATACTCAAGC-3′(SEQ ID NO56)。
將所得到的PCR產(chǎn)物連接到pMON25997(圖28)中,pMON25997用BspH1和Xba1消化除去bktB開(kāi)放閱讀框(Slater等人,細(xì)菌學(xué)雜志J.Bact.,1801979-1987(1998))而得到質(zhì)粒pMON62000(圖29)。pMON62000是用于誘變和互補(bǔ)色氨酸營(yíng)養(yǎng)缺陷型(EMG2ΔtrpE)的基礎(chǔ)質(zhì)粒。
大腸桿菌色氨酸營(yíng)養(yǎng)缺陷型EMG2ΔtrpE的產(chǎn)生大腸桿菌菌株Ec-8(EMG2ΔtrpE)利用自殺載體pKO3構(gòu)建,以從大腸桿菌菌株EMG2(K-12 wt F+)(大腸桿菌遺傳原種中心)的染色體的trpE基因缺失1,383個(gè)堿基對(duì)。PCR擴(kuò)增大腸桿菌基因組DNA的2個(gè)擴(kuò)增子。第一個(gè)擴(kuò)增子大約1.5kb,并在3′末端包含trpE ORF的前30bp。該擴(kuò)增子在5′末端包含BamHI位點(diǎn),并且在3’末端包含EcoR1位點(diǎn)。第二個(gè)擴(kuò)增子大約1kb,并且在5’末端包含trpE ORF的最后150bp。該擴(kuò)增子在5’末端包含EcoR1位點(diǎn),并且在3’末端包含Sal1位點(diǎn)。2個(gè)擴(kuò)增子用適當(dāng)?shù)拿赶?,并且在EcoR1位點(diǎn)連接在一起以產(chǎn)生trpE的框內(nèi)缺失。圖30顯示所得到的截短基因的序列(SEQ IDNO46)。將trpE缺失擴(kuò)增子在BamH1和Sal1位點(diǎn)連接到pKO3中。如A.J.Link等人,J.Bacteriol.,1796228(1997)所描述的進(jìn)行基因斷裂。
大腸桿菌色氨酸營(yíng)養(yǎng)缺陷型EMG2ΔtrpE與pMON62000的互補(bǔ)用pMON62000轉(zhuǎn)化大腸桿菌菌株Ec-8(EMG2ΔtrpE)并且接種在M9基本培養(yǎng)基上以確定缺失是否通過(guò)加入pMON62000而互補(bǔ)。對(duì)照質(zhì)粒(減去根瘤農(nóng)桿菌AS插入)和對(duì)照菌株Ec-8也接種在M9基本培養(yǎng)基和具有40μg/ml色氨酸的M9基本培養(yǎng)基上。觀察到在沒(méi)有色氨酸的M9上生長(zhǎng)用pMON62000轉(zhuǎn)化的菌株Ec-8,而對(duì)照都沒(méi)有觀察到有生長(zhǎng),表明菌株Ec-8中trpE缺失通過(guò)pMON62000互補(bǔ)。
pMON62000的羥胺誘變和突變體的遺傳選擇為了產(chǎn)生鄰氨基苯甲酸合酶的突變體,pMON62000用化學(xué)誘變劑羥胺突變。將下列成分在eppendorf管中化合20μg pMON62000質(zhì)粒DNA和40μl2.5M羥胺,pH6.0。用0.1M NaH2PO4,pH6.0+5mM EDTA,pH6.0使體積變?yōu)?00μl。該試管在70℃孵育。1.5小時(shí)后,將100μl的反應(yīng)混合物在浮于大約500ml H2O上的硝酸纖維素濾膜上透析。15分鐘后,利用Qiagen PCR純化試劑盒濃縮DNA。3小時(shí)后,將剩余的100μl反應(yīng)混合物移出并以同樣的方式純化。
然后大腸桿菌菌株Ec-8用已經(jīng)用羥胺誘變處理1.5或3小時(shí)的100ngpMON62000通過(guò)電穿孔轉(zhuǎn)化。對(duì)于各個(gè)時(shí)間點(diǎn)進(jìn)行2種轉(zhuǎn)化方法。容許轉(zhuǎn)化細(xì)胞在SOC介質(zhì)(20g/L細(xì)菌用胰化胨(Bacto-Tryptone),5g/L細(xì)菌用酵母提取物,10ml/L 1M NaCl,2.5ml/L 1M KCl,18g葡萄糖)中恢復(fù)4或6小時(shí)。
制備2個(gè)245mm正方形的生物檢測(cè)平板,包含M9基本培養(yǎng)基,加2%瓊脂和50μg/ml 5-甲基-DL-色氨酸(5-MT)。將一等分的900μl 1.5小時(shí)誘變處理的轉(zhuǎn)化混合物接種到1個(gè)50μg/ml 5-MT的平板上。將剩余的100μl接種到M9對(duì)照平板上。對(duì)于包含3.0小時(shí)誘變處理的質(zhì)粒的轉(zhuǎn)化混合物進(jìn)行相同的步驟。
然后平板在37℃孵育大約2.5天。從5-MT平板分離抗性克隆并接種到LB-卡那霉素(50μg/ml)平板上以驗(yàn)證質(zhì)粒的存在。所有選擇的集落都在這些平板上生長(zhǎng)。將來(lái)自每一抗性克隆的個(gè)別克隆分成兩份以分離質(zhì)粒。進(jìn)行限制性消化和PCR并且證實(shí)所有的克隆都包含所需的根瘤農(nóng)桿菌AS插入。
然后將挽救質(zhì)粒轉(zhuǎn)化回菌株Ec-8。通過(guò)劃線接種到新的LB-卡那霉素平板上純化來(lái)自每個(gè)轉(zhuǎn)化子的一個(gè)克隆。為了證實(shí)對(duì)5-MT的抗性,將個(gè)別純化的克隆接種到包含M9加50μg/ml 5-MT和2%瓊脂的平板上,然后在37℃生長(zhǎng)3天。大部分克隆證實(shí)有抗性。為了確定抗性突變體是否在5-MT的更高濃度保持抗性,將它們接種到M9加300μg/ml 5-MT和2%瓊脂上。大多數(shù)克隆證明在此高濃度也有抗性。
分離來(lái)自所有抗性克隆的質(zhì)粒并對(duì)兩條鏈都測(cè)序。這個(gè)實(shí)驗(yàn)的一些突變體在表J中進(jìn)行圖解。
表J5-MT抗性克隆中根瘤農(nóng)桿菌trpEG序列的變化。
如表J中的數(shù)據(jù)所表明的,幾個(gè)突變體對(duì)突變酶的Kmcho和IC50trp的作用很小,表明這些突變可能不是抗色氨酸反饋抑制的來(lái)源。例如,在核苷酸35位的C到T的突變,它將氨基酸12位的蘇氨酸殘基變化為異亮氨酸(Thr12Ile),而在Kmcho和IC50trp值中產(chǎn)生微小的變化。類似地,核苷酸2068位的C到T的變化,將脯氨酸變化為絲氨酸,也在Kmcho和IC50trp值中產(chǎn)生微小的變化。這些突變可能因此,也許是產(chǎn)生具有如同野生型酶特性的變體基因產(chǎn)物的″沉默的″突變。
實(shí)施例6高色氨酸轉(zhuǎn)基因的大豆植物。
該實(shí)施例說(shuō)明由用來(lái)自根瘤農(nóng)桿菌的鄰氨基苯甲酸合酶的色氨酸反饋不敏感突變體轉(zhuǎn)化產(chǎn)生的,具有升高的色氨酸水平的轉(zhuǎn)基因大豆植物的制備。
載體構(gòu)建質(zhì)粒pMON34711,具有來(lái)自根瘤農(nóng)桿菌的,包含在實(shí)施例4中所描述的F298W突變的鄰氨基苯甲酸合酶克隆,將其用限制性內(nèi)切酶NotI消化。使所得到片段的末端鈍化,然后用NcoI消化。然后質(zhì)粒pMON13773(圖8)用限制性內(nèi)切酶EcoRI消化,使末端鈍化,然后用NcoI消化。將所得到片段連接質(zhì)粒pMON58044,該質(zhì)粒包含在7S啟動(dòng)子和NOS3′UTR控制下的AS基因(圖9)。
然后用限制性內(nèi)切酶BglII和NcoI切割質(zhì)粒pMON58044,并連接通過(guò)用BglII和NcoI消化pMON53084(圖10)所產(chǎn)生的片段。所得到的片段命名為pMON58045(圖11)并且包含用于擬南芥SSU1A運(yùn)輸肽的序列。
最后,通過(guò)連接由用限制性內(nèi)切酶NotI消化pMON58045(圖11)和pMON38207(圖13)所產(chǎn)生的片段構(gòu)建質(zhì)粒pMON58046(圖12)。這產(chǎn)生了用于大豆轉(zhuǎn)化的pMON58046載體(圖12)。
經(jīng)微粒子轟擊的大豆轉(zhuǎn)化對(duì)于粒子轟擊轉(zhuǎn)化法,將市場(chǎng)上可買(mǎi)到的大豆種子(即,Asgrow A3244,A4922)發(fā)芽大約18-24小時(shí)過(guò)夜,并切下分生組織外植體。移去初生葉暴露分生組織并將外植體置于目標(biāo)培養(yǎng)基中,同時(shí)分生組織垂直于粒子遞送的方向。
將如上所述的pMON58046轉(zhuǎn)化載體用CaCl2和亞精胺沉淀到顯微的金粒子上,并且隨后再懸浮在乙醇中。將懸浮液包涂到Mylar片層上,然后放置到放電裝置上。將顆粒以大約60%的電容經(jīng)放電加速進(jìn)入植物組織。
轟擊后,將外植體置于選擇性培養(yǎng)基(WPM+0.075mM草甘膦)(WPM=木本植物(woody plant)培養(yǎng)基(McCown和Lloyd,Proc.International PlantPropagation Soc.,30421,(1981)minus BAP))中5-7周,以供選擇和生長(zhǎng)轉(zhuǎn)基因苗用。轟擊大約5-7周后收獲表型陽(yáng)性的苗,并且放入選擇性的根培養(yǎng)基中(BPM+0.025mM草甘膦)(參見(jiàn),下列用于BRM的配方)2-3周。將產(chǎn)根苗轉(zhuǎn)入溫室并盆栽到土壤中。將在選擇中保持健康,但不生根的苗轉(zhuǎn)入非選擇性的根培養(yǎng)基中(無(wú)草甘膦的BRM)附加培養(yǎng)2周。在轉(zhuǎn)入溫室并盆栽到土壤中之前,檢測(cè)來(lái)自任何不在選定區(qū)域生根的苗的根中,植物選擇性標(biāo)記物的表達(dá)。在標(biāo)準(zhǔn)溫室條件下保持植株直到收獲R1種子。
用于豆生根培養(yǎng)基的配方(BRM)提供如下。
*SBRM/TSG激素原液(每1L的BRM)3.0ml IAA(0.033mg/ml),2.0ml無(wú)菌蒸餾水。原液在4℃避光儲(chǔ)存。
**SBRM維生素原液(每1L的原液)甘氨酸(1.0g),煙酸(0.25g),吡哆醇HCl(0.25g),硫胺HCl(0.25g)。
***3×MInorMS鹽(每1L原液)H2BO3(1.86g),MnSO4(5.07g),ZnSO4-H2O(2.58g),KI(0.249g),7.5ul NaMoO-2H2O(1.0mg/ml),7.5ulCoSO4-5H2O(1.0mg/ml),7.5ulCoCl2-6H2O(1.0mg/ml)。
每次加入并溶解1個(gè)成分,用無(wú)菌蒸餾水使體積達(dá)到1升,并且該溶液保存在箔覆蓋的瓶子中,在冰箱中保存不超過(guò)1個(gè)月。
利用根瘤農(nóng)桿菌轉(zhuǎn)化大豆對(duì)于農(nóng)桿菌轉(zhuǎn)化法,將市場(chǎng)上可買(mǎi)到的大豆種子(Asgrow A3244,A4922)發(fā)芽過(guò)夜(大約10-12小時(shí)),并且切下分生組織外植體??梢迫セ虿灰迫コ跎~暴露分生組織并且將外植體置于創(chuàng)傷導(dǎo)管中。
使包含感興趣質(zhì)粒的農(nóng)桿菌菌株ABI生長(zhǎng)到對(duì)數(shù)期。通過(guò)離心收獲細(xì)胞并且再懸浮在含有誘導(dǎo)物的接種培養(yǎng)基中。從種子開(kāi)始萌芽和利用超聲處理創(chuàng)傷以來(lái)不遲于14小時(shí),混合大豆外植體和誘導(dǎo)的農(nóng)桿菌培養(yǎng)物。
創(chuàng)傷后,在農(nóng)桿菌中培養(yǎng)外植體大約1個(gè)小時(shí)。該接種步驟后,通過(guò)移液管移出農(nóng)桿菌并且將外植體置于共培養(yǎng)2-4天。此時(shí),將它們轉(zhuǎn)入選擇性培養(yǎng)基(WPM+0.075mM草甘膦+抗生素以控制農(nóng)桿菌過(guò)度生長(zhǎng))5-7周以容許選擇并生長(zhǎng)轉(zhuǎn)基因的苗。
轟擊后大約5-7周后,收獲表型陽(yáng)性的苗并置于選擇性的根培養(yǎng)基中(BRM+0.025mM草甘膦)2-3周。將產(chǎn)生根的苗轉(zhuǎn)入溫室并盆栽到土壤中。將在選擇中保持健康,但不生根的苗轉(zhuǎn)入非選擇性的根培養(yǎng)基中(無(wú)草甘膦的BRM)附加培養(yǎng)2星期。在轉(zhuǎn)入溫室并盆栽到土壤中之前,檢測(cè)來(lái)自任何不在選定區(qū)域生根的苗的根中,植物選擇性標(biāo)記草甘膦抗性的表達(dá)。在標(biāo)準(zhǔn)溫室條件下保持植株直到收獲R1種子。
R1種子的氨基酸含量的分析生產(chǎn)成熟的R1種子并且利用如Agilent Technologies Technical BulletinREV14所描述的熒光檢測(cè)分析游離氨基酸的含量。從每個(gè)事件選擇5個(gè)種子用于單個(gè)種子分析。表達(dá)AgroAS F298W,AgroAS S51F,AgroAS V48F,AgroAS V48Y或AgroAS S51C的突變體蛋白質(zhì)的大豆種子產(chǎn)生高數(shù)量的色氨酸。最高水平的色氨酸對(duì)萌芽具有負(fù)影響。結(jié)果顯示在表K,L和M中。
表K用pMON58046轉(zhuǎn)化的種子中蛋白質(zhì)的表達(dá)
表LAS蛋白質(zhì)表達(dá)與pMON58123轉(zhuǎn)化相關(guān)
表M攜帶下列AgroAS等位基因中的一個(gè)的大豆中,平均和最大的色氨酸水平V48F(pMON66877)、V48Y(pMON66878)和S51C(pMON66879)。
用AgroAS轉(zhuǎn)化的R1種子中的AS酶活性生產(chǎn)成熟的R1種子并且分析鄰氨基苯甲酸合酶活性。在攜帶AgroASF298W(SEQ ID NOs65或91)或AgroAS S51F(SEQ ID NOs60或86)突變體等位基因的R1大豆種子中確定鄰氨基苯甲酸合酶的酶活性。觀察到非常高水平的色氨酸-抗性鄰氨基苯甲酸合酶活性,與由這些種子所產(chǎn)生的高數(shù)量的色氨酸一致。結(jié)果顯示在表N和O中。
表N用pMON58046轉(zhuǎn)化的R1種子中AS的特異活性
表O用pMON58123轉(zhuǎn)化的R1種子中AS的特異活性
實(shí)施例7包括蕓香鄰氨基苯甲酸合酶α-亞基的轉(zhuǎn)化載體的制備來(lái)自蕓香(Ruta graveolens)的鄰氨基苯甲酸合酶α基因(Genbank登記號(hào)GI960291)提供另一個(gè)對(duì)本發(fā)明有用的鄰氨基苯甲酸合酶結(jié)構(gòu)域(Bohlmann,J等人,Plant Phys.,111507-514(1996))。存在于蕓香基因組中的鄰氨基苯甲酸合酶的一個(gè)同工酶顯示對(duì)L-色氨酸的反饋抑制的敏感度較低。該等位基因也可用于本發(fā)明以提高轉(zhuǎn)基因植物中游離的L-色氨酸的水平。載體pMON58030(圖14)包含對(duì)色氨酸抑制較少敏感的蕓香鄰氨基苯甲酸合酶α-亞基。從pMON58030 PCR擴(kuò)增蕓香的鄰氨基苯甲酸合酶α基因,以提供在蕓香鄰氨基苯甲酸合酶α基因片段的5′末端的BamHI位點(diǎn)和在3末端的BglII位點(diǎn),其中利用包含這2個(gè)限制性內(nèi)切酶位點(diǎn)的引物5′-CAAAAGCTGGATCCCCACC-3′(SEQ ID NO53);和
5′-CCTATCCGAGATCTCTCAACTCC-3′(SEQ ID NO54)。
純化PCR片段,用分別的限制性內(nèi)切酶消化以形成pMON58041,其中包含蕓香ASα至napin啟動(dòng)子的轉(zhuǎn)錄融合體。產(chǎn)生農(nóng)桿菌介導(dǎo)的植物轉(zhuǎn)化質(zhì)粒,pMON58043,包括napin啟動(dòng)子,蕓香AS,NOS終止子,草甘膦抗性(CP4)可選擇的標(biāo)記和適合于所述盒的固有染色體整合的邊界。使用所得到的植物轉(zhuǎn)化載體利用如實(shí)施例2,3和6中所描述的標(biāo)準(zhǔn)的植物轉(zhuǎn)化技術(shù)轉(zhuǎn)化植物。
實(shí)施例8轉(zhuǎn)化多個(gè)多肽鄰氨基苯甲酸合酶成為單體的單個(gè)多肽鄰氨基苯甲酸合酶需要通過(guò)融合所選擇的多亞基酶產(chǎn)生單體的鄰氨基苯甲酸合酶,例如為了優(yōu)化催化的效率,為了穩(wěn)定酶,為了獲得例如包括TrpE和TrpG活性的亞基,以及2個(gè)亞基間有效傳遞的協(xié)同表達(dá)。在有些情況下,可能對(duì)使用植物或微生物來(lái)源的TrpE或α-亞基有用,其中該植物或微生物通過(guò)標(biāo)準(zhǔn)誘變方法或通過(guò)如前文的實(shí)施例,例如實(shí)施例4中所描述的合理設(shè)計(jì)而不受有關(guān)反饋抑制的調(diào)控。在其他情況下,使用植物或微生物來(lái)源的野生型TrpE或α-亞基。
所選擇的TrpE或α-亞基的C-末端連接TrpG亞基或β-亞基的N-末端,優(yōu)選使用肽接頭連接。可合理設(shè)計(jì)接頭以提供合適的間隔和使兩個(gè)亞基適當(dāng)定位排列的靈活性??蛇x地接頭可通過(guò)單體的和異四聚體的鄰氨基苯甲酸合酶的序列對(duì)比確定。單體的和異四聚體的鄰氨基苯甲酸合酶所形成的序列對(duì)比的實(shí)例顯示在圖21和35中。也可設(shè)想可能必須產(chǎn)生包括異源亞基的單體鄰氨基苯甲酸合酶以便優(yōu)化效益。例如,α-亞基可從例如大腸桿菌的細(xì)菌來(lái)源獲得,并與例如擬南芥的植物來(lái)源的β-亞基融合。
可將產(chǎn)生的新蛋白質(zhì)導(dǎo)入植物,例如如實(shí)施例2,3或6中所描述的。本發(fā)明不限于所顯示和描述的精確細(xì)節(jié),因?yàn)閼?yīng)該理解可在保持在權(quán)利要求所定義的本發(fā)明的精神和范圍內(nèi)的同時(shí),產(chǎn)生許多變化和改進(jìn)。
實(shí)施例9來(lái)自基因組序列數(shù)據(jù)庫(kù)的鄰氨基苯甲酸合酶的鑒定。
對(duì)本發(fā)明有用的單體鄰氨基苯甲酸合酶以及α和β結(jié)構(gòu)域可經(jīng)生物信息分析,通過(guò)利用BLAST(www.ncbi.nlm.nih.gov/blast/)搜索例如genbank和/或swisprot數(shù)據(jù)庫(kù)鑒定。鑒定單體鄰氨基苯甲酸合酶的有用的查詢序列包括,例如鄰氨基苯甲酸合酶的結(jié)構(gòu)域,例如硫磺礦硫化葉菌的α-結(jié)構(gòu)域(GI1004323)或β-結(jié)構(gòu)域(GI 1004324),或單體的鄰氨基苯甲酸合酶,例如根瘤農(nóng)桿菌AS(GI 15889565)。推定的單體鄰氨基苯甲酸合酶將具有與詢問(wèn)序列50%和100%之間的同源性,并且應(yīng)最低限度地包含700個(gè)氨基酸。如果使用AS-α-結(jié)構(gòu)域查詢基因組數(shù)據(jù)庫(kù),除鑒定推定的鄰氨基苯甲酸合酶基因外,它也可能鑒定涉及PABA合成,例如4-氨基-4-脫氧分支酸(ADC)合酶的基因。單體的ADC合酶基因可根據(jù)觀察ADC合酶的酰胺轉(zhuǎn)移酶結(jié)構(gòu)域(β-結(jié)構(gòu)域)存在于蛋白質(zhì)的N-末端,而AS的酰胺轉(zhuǎn)移酶結(jié)構(gòu)域(β-結(jié)構(gòu)域)存在于C-末端,從而將推定的單體AS基因輕易地鑒定出來(lái)。對(duì)本發(fā)明有用的單體鄰氨基苯甲酸合酶通過(guò)生物信息分析鑒定,包括但不限于,例如苜蓿中華根瘤菌(Rhizobiummeliloti)(GI 95177),百脈根根瘤菌(Mesorhizo biumloti)(GI 13472468),馬爾他布魯氏菌(Brwella melitensis)(GI 17982357),念珠藻屬(NostoaSP.)PCC7120(GI 17227910,GI 17230725),巴西固氮螺菌(Azospirillumbrasilense)(GI 1174156),血色紅假單胞菌(Rhodopseudomonas palustris),魚(yú)腥藻(Anabaena)M22983(GI 152445)。圖21是本發(fā)明中所使用的2個(gè)單體鄰氨基苯甲酸合酶(根瘤農(nóng)桿菌和苜蓿中華根瘤菌)與2個(gè)異四聚體鄰氨基苯甲酸合酶(硫磺礦硫化葉菌和擬南芥)的序列對(duì)比的實(shí)例。圖35是幾個(gè)單體的鄰氨基苯甲酸合酶與血色紅假單胞菌異四聚體鄰氨基苯甲酸合酶的序列對(duì)比的實(shí)例。
實(shí)施例10優(yōu)化密碼子的使用該實(shí)施例說(shuō)明通過(guò)優(yōu)化密碼子的使用改進(jìn)植物種子中鄰氨基苯甲酸合酶基因表達(dá)的方法。
檢驗(yàn)野生型根瘤農(nóng)桿菌的鄰氨基苯甲酸合酶(AS)基因的核苷酸序列(SEQ ID NO1)中存在的不表達(dá)密碼子。為了鑒定低表達(dá)的密碼子,從谷物和大豆中尋找高度表達(dá)的種子蛋白質(zhì)的序列以獲得相對(duì)的密碼子頻率。相對(duì)的密碼子使用頻率顯示在表P中,表示為預(yù)期值的形式。預(yù)期值形式可例證說(shuō)明如下假定存在4個(gè)編碼給定氨基酸的密碼子,并且假定它們同樣使用,然后預(yù)期每個(gè)密碼子占氨基酸25%(0.25)的頻率。然而,由于冗余,將0.25規(guī)范化到1.0,以對(duì)每個(gè)密碼子相比較于編碼該氨基酸的密碼子產(chǎn)生相對(duì)的積分。對(duì)于這個(gè)分析,如果該密碼子比另一個(gè)對(duì)于給定的氨基酸選擇更占優(yōu)勢(shì),則它受到大于1.0的計(jì)數(shù)。相應(yīng)地,如果密碼子是較少占優(yōu)勢(shì)的,它受到小于1.0的計(jì)數(shù)。對(duì)于這個(gè)研究,如果其相對(duì)的密碼子使用頻率低于0.5,則認(rèn)為該特定的密碼子未被充分表示。
利用表P所產(chǎn)生的結(jié)果,在谷物和大豆中,野生型農(nóng)桿菌AS序列的緊密檢查顯示認(rèn)為125個(gè)密碼子未被充分表示(低于0.5的閾值)(表Q)。這些未被充分表示的密碼子被如上所定義的更占優(yōu)勢(shì)的密碼子替代。改變的核苷酸序列顯示在圖36中。利用生物信息工具,裝配所得到的序列并且通過(guò)翻譯以及與相應(yīng)的野生型AS序列的核苷酸和蛋白質(zhì)的序列對(duì)比分析完整性。雖然未改變蛋白質(zhì)序列,但優(yōu)化序列的核苷酸序列與野生型的農(nóng)桿菌AS序列(圖37)具有94%的同一性。分別利用Lasergene EditSeq(DNASTAR公司,Madison,WI)和Grail2(國(guó)立橡樹(shù)嶺實(shí)驗(yàn)室,OakRidge,TN)分析優(yōu)化的核苷酸序列中隱藏的多聚腺苷酸化信號(hào)(AATAAA,AATAAT)和隱藏的內(nèi)含子的缺乏。沒(méi)有發(fā)現(xiàn)隱藏的信號(hào)。
改變的核苷酸序列利用本領(lǐng)域中公知的技術(shù)或由例如EgeaBiosciencesces公司(SanDiego,加利福尼亞)的商業(yè)供應(yīng)者合成。將所得到的核苷酸克隆到適當(dāng)?shù)谋磉_(dá)載體中,并且利用本說(shuō)明書(shū)的上述實(shí)施例中所詳細(xì)記載的方法,測(cè)試在谷物,大豆和擬南芥中的效能。
表P玉米和大豆種子-表達(dá)基因1中相對(duì)的密碼子使用頻率。
1相對(duì)的密碼子頻率以預(yù)期值的形式表示。這指如果存在4個(gè)編碼給定氨基酸的密碼子,并且它們是同樣使用的,預(yù)期每個(gè)密碼子占25%(0.25)。由于冗余,將0.25規(guī)格化為1,以對(duì)于每個(gè)密碼子相比較于所有編碼該氨基酸的密碼子產(chǎn)生相對(duì)的積分。如果密碼子比另一個(gè)對(duì)于給定的氨基酸選擇更占優(yōu)勢(shì),則它將得到>1的計(jì)數(shù)。而如果它比另一個(gè)對(duì)于該氨基酸較少優(yōu)選,它將得到<1的計(jì)數(shù)。
表Q未被充分表示的AgroAS密碼子和用于改善種子表達(dá)2的改進(jìn)
2標(biāo)題為″作物中未充分表示″欄表明作物(玉米或大豆)中特定的密碼子是未被充分表示的。
實(shí)施例11包括單體的苜蓿中華根瘤菌鄰氨基苯甲酸合酶的轉(zhuǎn)化載體的制備。
苜蓿中華根瘤菌的基因克隆使用獲得自ATCC的苜蓿中華根瘤菌1021的穿刺培養(yǎng)物,接種到Y(jié)M培養(yǎng)基(每1L含10g甘露醇,0.5g K2HPO4,0.2g MgSO4-7H2O,1.0g酵母提取物,0.2g NaCl,88mg FeCl3-6H2O,15g瓊脂)平板上。該平板在30℃生長(zhǎng)2天。使用單個(gè)克隆接種到1升的YM培養(yǎng)基中。該培養(yǎng)物在30℃生長(zhǎng)過(guò)夜。在5,000×g旋轉(zhuǎn)10分鐘沉下細(xì)胞顆粒并且在-20℃冷凍。使用Qiagen Genomic-tip DNA試劑盒(Qiagen公司,Valencia,加利福尼亞)根據(jù)1999年8月的Qiagen基因組DNA手冊(cè)(第42頁(yè))提取基因組DNA。
使用PCR反應(yīng)擴(kuò)增基因。所使用的引物是Rhizo F2ATGGCAGCGGTAATTCTGGAAG(SEQ ID NO138)和Rhizo R8
TCAGGCTGCCTTGGTCTTC(SEQ ID NO139)。
將所得到的PCR片段克隆到pGEM(Promega公司,Madison,WI.)載體中。
最后,利用PCR擴(kuò)增pGEM中的PCR產(chǎn)物,使用下列引物Rhizo NcoI ACTGACTCCATGGCAGCGGTAATTCTGGAA(SEQ ID NO140)和Rhizo SpeICTGACTAGTTCAGGCTGCTT(SEQ ID NO141),并且將產(chǎn)物克隆到TOPO 2.1 PCR載體中(Invitrogen公司,Grand Island,N.Y.)。
載體構(gòu)建用SpeI消化在TOPO 2.1載體中包含根瘤菌基因的載體,并且進(jìn)行klenow反應(yīng)以使該位點(diǎn)鈍化。PCR純化DNA(Qiagen PCR純化試劑盒和MinElute手冊(cè),2001),然后用NcoI消化。將該片段克隆到pET30a的EcoRV和NcoI位點(diǎn),從而產(chǎn)生pMON66595(圖41)。
通過(guò)幾個(gè)步驟產(chǎn)生擬南芥轉(zhuǎn)化載體,最初用NcoI/EcoRI消化pMON13773(圖8)以產(chǎn)生骨架片段。用NcoI和EcoRI消化pMON66595并除去根瘤菌AS基因的較大的部分(大約2000堿基對(duì))。然后將兩段連接在一起。用EcoRI消化陽(yáng)性克隆并用小牛腸磷酸酶(CIP)處理。通過(guò)用EcoRI消化pMON66595除去根瘤菌基因的第二個(gè)片段,并且保持大約200堿基對(duì)的片段。將2個(gè)片段連接在一起,并且對(duì)所合成的克隆測(cè)序以檢查根瘤菌小片段的正確方向。
用BglII和NcoI消化具有正確的序列和方向的上述一個(gè)克隆。然后用BglII和NcoI消化pMON58046(圖12),并且除去CTP2運(yùn)輸肽片段。將這些片段連接在一起以完成該盒。
連接片段用NotI消化以移出該盒。然后在CIP處理的NotI位點(diǎn)將它們連接成為pMON36524(圖48)。消化這些克隆以發(fā)現(xiàn)以與NPTII基因產(chǎn)生pMON66599(圖42)相同的方向插入的盒。
然后將載體pMON66599轉(zhuǎn)化農(nóng)桿菌并用于轉(zhuǎn)化擬南芥。該實(shí)驗(yàn)中的對(duì)照構(gòu)建體是pMON66598(圖43),其與pMON66599所描述的盒插入方式相同,只是包含農(nóng)桿菌AS野生型基因。
互補(bǔ)分析用BamHI和NcoI切下來(lái)自pMON66595的根瘤菌AS基因,并克隆到pSE280載體(Invitrogen)的相應(yīng)位點(diǎn),產(chǎn)生pMON66596(圖44)。然后將pMON66596轉(zhuǎn)化突變的大腸桿菌菌株,EMG2ΔtrpE(產(chǎn)生自EMG菌株WTK12,F(xiàn)+,獲得自ATCC)顯示同數(shù)的基因互補(bǔ)于trp-菌株的基因組。
活性分析將pMON66596轉(zhuǎn)化BL-21細(xì)胞并用IPTG誘導(dǎo)表達(dá)蛋白質(zhì)。通過(guò)HPLC分析粗細(xì)胞提取物,并發(fā)現(xiàn)具有活性和大約10μM trp的IC50(Poulson,色譜法雜志Journal of Chromatography,547155-160(1991))。
蛋白質(zhì)表達(dá)和純化通過(guò)用IPTG誘導(dǎo)His-標(biāo)記的蛋白質(zhì)表達(dá)。利用QIAexpressionist 2002手冊(cè)和鎳樹(shù)脂(Ni-NTA Spin手冊(cè),2000)中所列出的天然條件完成蛋白質(zhì)純化。兔血清顯示識(shí)別純化的蛋白質(zhì)。
如在實(shí)施例2,3和6中,用包含根瘤菌鄰氨基苯甲酸合酶基因的載體轉(zhuǎn)化植物,并且在種子中顯示升高的色氨酸水平。
實(shí)施例12用包含玉米鄰氨基苯甲酸合酶α-亞基基因和玉米鄰氨基苯甲酸合酶β-亞基基因的載體轉(zhuǎn)化谷物。
為了產(chǎn)生包含玉米鄰氨基苯甲酸合酶α-亞基的編碼序列的穿梭載體,用EcoRI和SacII消化pMON65150。凝膠純化所得到的6195堿基對(duì)的片段,然后脫磷酸化。質(zhì)粒pMON66604用EcoRI和SacII消化,以產(chǎn)生凝膠純化的1077堿基對(duì)的片段。然后將1077堿基對(duì)的片段連接包含玉米ASα編碼序列的粘末端的6195堿基對(duì)片段,以產(chǎn)生pMON67149,玉米L3(油質(zhì)蛋白)啟動(dòng)子-玉米hsp70內(nèi)含子-玉米ASα-Tr7 3′UTR表達(dá)載體。隨后用XhoI消化這個(gè)載體,產(chǎn)生包含玉米油質(zhì)蛋白啟動(dòng)子、玉米熱休克蛋白70內(nèi)含子、玉米鄰氨基苯甲酸α-亞基編碼序列和Tr7 3’UTR的4364堿基對(duì)的DNA片段。
用XhoI消化質(zhì)粒pMON30167,產(chǎn)生8.89Kb的DNA片段。然后將這個(gè)片段連接4964堿基對(duì)的片段以產(chǎn)生pMON79951(圖45),轉(zhuǎn)化載體包含L3啟動(dòng)子-zmhsp70內(nèi)含子-玉米ASα-Tr7 3′UTR。
通過(guò)PCR從Monsanto所有的cDNA文庫(kù)分離玉米鄰氨基苯甲酸合酶β-亞基的編碼序列,其中利用下列引物5′引物5″TGCTGACCATGGCCTGCTCCCACATCGTCG3′(SEQ ID NO142),其包含NcoI限制酶切位點(diǎn)(以粗體顯示),和3′引物5′CAGTGAATTCCTACGAACGCTGCTTCTCCAGTTC3′
(SEQ ID NO143),其包含EcoRI限制酶切位點(diǎn)(以粗體顯示)。
所使用的PCR參數(shù)是,2°/秒到95°;95°5分鐘;2°/秒到95;95°30秒;2°/秒到55°;55°45秒;2°/秒到72°;72°55秒;循環(huán)25次,在第三步開(kāi)始;2°/秒到72°;72°10分鐘;2°/秒到4°保持。(所有的溫度顯示為℃,除非另作說(shuō)明)。PCR混合物包含1μl從pMON79952小量制備(Qiagen方法)的DNA,1.5μl的各種引物(10μM原液)5μl含氯化鎂的Roche 10×PCR緩沖液,2μl 10mM dNTP混合物,1μL高保真(Hi-Fi)Taq混合物(Roche擴(kuò)展高保真PCR系統(tǒng)#1732650)和水,總體積為50μl。所得到的PCR產(chǎn)物連接到pGEM-T載體(Promega pGEM-T載體系統(tǒng)I#A3600)中。對(duì)上述片段測(cè)序顯示其丟失限制性酶切位點(diǎn)。利用pGEM克隆作為模板再進(jìn)行PCR,并且將產(chǎn)物克隆到TOPO 2.1 PCR載體中(Invitrogen TOPO TA克隆試劑盒pCR2.1-TOPO載體#45-0641)。該克隆通過(guò)測(cè)序證實(shí)。所得到的包含玉米ASβ的載體稱為pMON66592。然后用NcoI和EcoRI消化該載體,以產(chǎn)生850堿基對(duì)(bp)的片段。分離后,鈍化850bp片段的末端并脫去磷酸。用BamHI和SmaI消化質(zhì)粒pMON79953,以產(chǎn)生5353bp的片段。分離后,鈍化5353bp片段的末端。然后將包含ASβ基因的850bp片段連接到平末端的5353bppMON79953片段中以產(chǎn)生pMON79954,玉米L3啟動(dòng)子-zmhsp70內(nèi)含子-玉米ASβ-Tr7 3′UTR載體。
隨后用XhoI消化載體pMON79954以產(chǎn)生包含玉米油質(zhì)蛋白啟動(dòng)子,玉米hsp70內(nèi)含子,玉米ASβ編碼序列和Tr7 3′UTR的2907堿基對(duì)的DNA片段。質(zhì)粒pMON30167(圖49)用XhoI消化以產(chǎn)生8.89Kb的片段。將2個(gè)片段連接在一起以產(chǎn)生pMON79955(圖46),轉(zhuǎn)化載體包含L3啟動(dòng)子-zmhsp70內(nèi)含子-玉米ASβ-Tr7 3′UTR。
為了產(chǎn)生玉米ASα和ASβ疊加(stacking)載體,用HindIII消化pMON79955以產(chǎn)生16.57Kb的片段。產(chǎn)生鈍化的片段并且脫去磷酸。質(zhì)粒pMON67149用XhoI消化,以產(chǎn)生4364堿基對(duì)的DNA片段,隨后變?yōu)槠侥┒恕?個(gè)片段連接在一起以產(chǎn)生pMON79956(圖47),最后的轉(zhuǎn)化載體包含玉米L3啟動(dòng)子-zmhsp70內(nèi)含子-玉米ASα-Tr73′UTR,與玉米L3啟動(dòng)子-zmhsp70內(nèi)含子-玉米ASβ-Tr7 3′UTR疊加。
利用根瘤農(nóng)桿菌轉(zhuǎn)化玉米玉米植株(自交系LH198/Hi11)在標(biāo)準(zhǔn)實(shí)驗(yàn)下生長(zhǎng)在溫室中。當(dāng)胚為1.5-2.0mm長(zhǎng)度,通常在授粉后10-15天收獲植物的穗。通過(guò)噴霧或滲入80%的乙醇對(duì)穗進(jìn)行表面殺菌。
利用本領(lǐng)域技術(shù)人員公知的方法從個(gè)體的種仁分離不成熟的胚胎。轉(zhuǎn)化前,將不成熟的胚胎在包含16.9mg/L AgNO3(指定為培養(yǎng)基2112V)的培養(yǎng)基211(N6鹽,2%蔗糖,1mg/l 2,4-二氯苯氧乙酸(2,4-D),0.5mg/L煙酸,1.0mg/L硫胺HCl,0.91g/L L-天冬酰胺,100mg/L肌醇,0.5g/L MES,100mg/L酪蛋白水解物,1.6g/L MgCl2,0.69g/L L-脯氨酸,2g/L GELGRO tm,pH5.8)上培養(yǎng)3-6天。
農(nóng)桿菌介導(dǎo)的轉(zhuǎn)化玉米細(xì)胞及其他單子葉植物的方法是已知的(美國(guó)專利號(hào)5,591,616和5,981,840;以及EP0 672 752)。使用農(nóng)桿菌菌株ABI和根瘤農(nóng)桿菌二元載體系統(tǒng)進(jìn)行轉(zhuǎn)化。
在與玉米胚胎細(xì)胞共培養(yǎng)前,農(nóng)桿菌細(xì)胞生長(zhǎng)在28℃,包含大約50μg/ml卡那霉素和100μg/ml壯觀霉素的LB(DIFCO)液體培養(yǎng)基中,以選擇保持改變的Ti質(zhì)粒和二元載體。在接種玉米細(xì)胞前,農(nóng)桿菌細(xì)胞在室溫下,在包括用于保持質(zhì)粒的適當(dāng)抗生素和200μM乙酰丁香酮的AB培養(yǎng)基(Chilton等人,Proc.Nat.Acad.Sci.(美國(guó)),713672-3676(1974))中生長(zhǎng)過(guò)夜。在馬上接種前,農(nóng)桿菌細(xì)胞通過(guò)離心沉淀,在包含200μM乙酰丁香酮的1/2 MSVI培養(yǎng)基(2.2g/L GIBCO MS(Murashige和Skoog,Physiol.Plant 15473-497(1962)基本(basal)鹽,2mg/L甘氨酸,0.5g/L煙酸,0.5g/LL-吡哆醇-HCl,0.1mg/L硫胺,115g/L L-脯氨酸,10g/L D-葡萄糖和10g/L蔗糖,pH5.4)中洗滌。
切下不成熟的玉米胚,浸于1/2MSPL培養(yǎng)基的農(nóng)桿菌懸浮液中并且在室溫下與農(nóng)桿菌培養(yǎng)大約5分鐘。
農(nóng)桿菌感染和共培養(yǎng)后,將胚轉(zhuǎn)入類型II的延遲培養(yǎng)基中5-7天并且在27℃黑暗培養(yǎng)。延遲培養(yǎng)基由包含2.0mg/L 2,4-D(GIBCO),100mg/L-酪蛋白氨基酸,12mM脯氨酸,500mg/L羧芐青霉素和20μM硫代硫酸銀的MS基礎(chǔ)鹽組成。所有的培養(yǎng)基化學(xué)試劑是組織培養(yǎng)級(jí)的。一旦從不成熟的胚胎觀察到類型II的愈傷組織開(kāi)始的標(biāo)志,正如Selman等人,在玉米手冊(cè)The MaizeHandbook,F(xiàn)reeling和Walbot編輯,Springer Verlag,第672頁(yè)(1994)中所定義的,從胚胎除去胚芽鞘。然后將胚胎轉(zhuǎn)入包含2.0mg/L 2,4-D,12mM脯氨酸,20μM硫代硫酸銀,500mg/L羧芐青霉素和0.5mM草甘膦(Monsanto公司,St.Louis,Mo.)的MS培養(yǎng)基并且在27℃黑暗培養(yǎng)2周。
如上所述將胚形成的愈傷組織轉(zhuǎn)入MS培養(yǎng)基,但是培養(yǎng)基另外包含1.0mM草甘膦。然后培養(yǎng)物在黑暗中于27℃培養(yǎng)2周。然后將仍然具有愈傷組織的胚轉(zhuǎn)入包含3.0mM草甘膦的MS培養(yǎng)基另外培養(yǎng)2周。
通過(guò)將愈傷組織轉(zhuǎn)入包含0.1mg/L 2,4-D和0.1μM脫落酸(ABA)的MS培養(yǎng)基2周,然后轉(zhuǎn)入包含6%蔗糖而無(wú)2,4-D的MS培養(yǎng)基再培養(yǎng)2周實(shí)現(xiàn)植物再生。培育在黑暗中于27℃進(jìn)行以容許體細(xì)胞胚成熟并在再生過(guò)程中轉(zhuǎn)化。
將準(zhǔn)備發(fā)芽的體細(xì)胞胚轉(zhuǎn)入無(wú)激素的MS培養(yǎng)基,并且在光照下培養(yǎng)直到產(chǎn)生附著根的苗。大約2-3周后,產(chǎn)生小植株。
然后將小植株轉(zhuǎn)入溫室并且在標(biāo)準(zhǔn)溫室條件下生長(zhǎng)。
R1種子氨基酸含量的分析對(duì)于各個(gè)載體建立幾個(gè)轉(zhuǎn)基因谷物的品系并通過(guò)世代的數(shù)目繁殖。這些品系是生長(zhǎng)的,并且自花受粉以產(chǎn)生純合系。在各個(gè)世代,利用在未成熟種子上進(jìn)行western印跡分析確定轉(zhuǎn)化基因的表達(dá),產(chǎn)生成熟的R1種子并利用如Agilent Technologies Technical Bulletin REV14所描述的熒光檢測(cè)分析游離氨基酸的含量。表達(dá)ASα蛋白質(zhì)的玉米種子相對(duì)于基線水平(相當(dāng)于陰性等值線和非轉(zhuǎn)基因?qū)φ?產(chǎn)生升高數(shù)量的色氨酸。谷物的基線游離色氨酸水平的范圍是從大約5-大約25ppm。
所有的出版物和專利在此引入作為參考,并且逐一地引入作為參考。本發(fā)明不限于所顯示和描述的精確細(xì)節(jié),因?yàn)閼?yīng)該理解在保持在由權(quán)利要求所定義的本發(fā)明的精神和范圍之內(nèi)的同時(shí)可產(chǎn)生許多變化和改進(jìn)。
序列表<110>孟山都技術(shù)公司(Monsanto Technology,LLC)Weaver,LisaOulmassov,TimVaduva,GabrielaLiang,JihongVaragona,RitaVenkatesh,Tyamagondlu<120>轉(zhuǎn)基因的高色氨酸植物<130>51857R<160>143<170>PatentIn version 3.1<210>1<211>2190<212>DNA<213>根瘤農(nóng)桿菌(Agrobacterium tumefaciens)<400>1atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200
gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga 2190<210>2<211>1815<212>DNA<213>玉米(Zea mays)<400>2atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg 60cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga 120accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg 180agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg 240cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc 300acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc 360ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg 420gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac 480cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc 540atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga 600tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc 660
tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat 720gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac 780cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta 840tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca 900cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct 960gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag 1020aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg 1080aatcctagcc catacatggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt 1140cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact 1200gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat 1260gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag 1320gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat 1380gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat 1440gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg 1500gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga 1560atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca 1620gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc 1680gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt 1740gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt 1800gtagacaaag aatag 1815<210>3<211>1993<212>DNA<213>蕓香(Ruta graveolens)<400>3aaaaaatctg tctgtttttc gtgtttggac atttcagcgg cactgggtgc catcagttga 60ttcgactcat ttgatttatt ttgtttgttg gccatgagtg cagcggcaac gtcgatgcaa 120tcccttaaat tctccaaccg tctggtccca cccagtcgcc gtctgtctcc ggttccgaac 180aatgtcacct gcaataacct ccccaagtct gcagctcccg tccggacagt caaatgctgc 240gcttcttcct ggaacagtac catcaacggc gcggccgcca cgaccaacgg tgcgtccgcc 300gccagtaacg gcgcatccac gaccaccact acatatgtta gtgatgcaac cagatttatc 360gactcttcta aaagggcaaa tctagtgcca ttataccgtt gcatattcgc ggatcatctc 420acgccggtgc ttgcctatag atgtttggtt caagaagacg ataaagagac tccaagtttt 480
ttattcgaat cagtagagcc gggtcggatt tctactgttg ggaggtatag tgtggttgga 540gctcatcccg tgatggaagt tatagctaaa gataatatgg ttacggtgat ggatcatgag 600aaagggagct tagttgagga ggtggtcgat gatcccatgg agattcctag aagaatttcc 660gaggattgga agcctcaaat aatcgatgat cttcctgaag ctttttgcgg tggttgggtt 720ggtttcttct catacgatac agttcgatat gtggagaaga aaaagttacc attctcaaag 780gcacctcagg atgataggaa tcttgcagat atgcatctag gtctctataa cgatgttatt 840gtgtttgatc atgtggaaaa gaaagtatat gttattcatt gggtgaggct aaatcaacag 900tcttctgaag aaaaagcata tgccgagggt ctggaacact tggagagact agtatccaga 960gtacaggatg agaacacgcc aaggctcgcc ccaggttcca tagacttaca cactggtcat 1020tttggacctc cattaaaaaa gtcaaacatg acatgtgaag aatacaaaat ggctgtacta 1080gcggcaaaag aacatattca ggctggggat atttttcaaa tcgtactaag ccaacgtttt 1140gaacgtcgaa catttgctga tccatttgaa gtttataggg cactgagagt tgttaatccg 1200agtccctata tgacgtatat gcaggcaaga gggtgtgttc tggtagcttc aagtccagaa 1260attcttactc gagtaaagaa gaataagatt gtgaatcgac ctttggctgg aacagcccga 1320agagggagga ctactgaaga agatgagatg ttggaaacac agttgctaaa agacgcaaag 1380caatgtgctg agcatgttat gctggtcgat ttgggacgga atgatgttgg caaggtttca 1440aaatctggtt ctgtgaaagt ggaaaagctg atgaatgttg aacgatattc acatgttatg 1500cacataagct ctacggtcac aggtgagttg caagataatc tcagttgctg ggatgccctg 1560cgtgctgcac tgcctgtcgg gactgttagt ggagcaccaa aggtgaaggc aatggagtta 1620atcgatgaat tggaggtaaa tagacgtggc ccctacagtg gtgggtttgg cggtatctcc 1680ttcaccggag atatggacat tgccctggct ctaaggacca ttgttttcca aaccggtaca 1740cgctatgaca caatgtactc gtacaagaat gctaccaaac gccggcagtg ggtggcatac 1800cttcaagccg gggctggcat tgttgctgat agtgatccag acgacgagca tcgtgagtgc 1860cagaacaaag ccgccggact ggcccgtgcc atcgacctag ctgagtctgc ttttgtgaac 1920aaatcaagta gctaaagttt tggatttgga agtggagttg agtctcggat aggatttaga 1980gtaaaaaaag agg 1993<210>4<211>729<212>PRT<213>根瘤農(nóng)桿菌(Agrobacterium tumefaciens)<400>4Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255
Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510
Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>5<211>604<212>PRT<213>玉米(Zea mays)<400>5
Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala1 5 10 15Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr20 25 30Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser Ala35 40 45Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala50 55 60Ala Lys Ala Ala Glu Glu Asp Lys Arg Arg Phe Phe Glu Ala Ala Ala65 70 75 80Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile Val85 90 95Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro Glu100 105 110Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln Gly115 120 125Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala His130 135 140Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met Asp145 150 155 160His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met Gln165 170 175Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp Glu180 185 190Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr Asp195 200 205Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala Pro210 215 220Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Asp225 230 235 240Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His Trp245 250 255
Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp Gly260 265 270Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn Val275 280 285Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe Gly290 295 300Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn Ala305 310 315 320Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln Ile325 330 335Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe Glu340 345 350Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Ala Tyr355 360 365Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile Leu370 375 380Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly Thr385 390 395 400Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln Gln405 410 415Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val Asp420 425 430Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Lys435 440 445Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile450 455 460Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp Asp465 470 475 480Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys485 490 495Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg Gly
500 505 510Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Gln515 520 525Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser His530 535 540Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp Val545 550 555 560Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro Asp565 570 575Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala580 585 590Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu595 600<210>6<211>613<212>PRT<213>蕓香(Ruta graveolens)<400>6Met Ser Ala Ala Ala Thr Ser Met Gln Ser Leu Lys Phe Ser Asn Arg1 5 10 15Leu Val Pro Pro Ser Arg Arg Leu Ser Pro Val Pro Asn Asn Val Thr20 25 30Cys Asn Asn Leu Pro Lys Ser Ala Ala Pro Val Arg Thr Val Lys Cys35 40 45Cys Ala Ser Ser Trp Asn Ser Thr Ile Asn Gly Ala Ala Ala Thr Thr50 55 60Asn Gly Ala Ser Ala Ala Ser Asn Gly Ala Ser Thr Thr Thr Thr Thr65 70 75 80Tyr Val Ser Asp Ala Thr Arg Phe Ile Asp Ser Ser Lys Arg Ala Asn85 90 95Leu Val Pro Leu Tyr Arg Cys Ile Phe Ala Asp His Leu Thr Pro Val100 105 110Leu Ala Tyr Arg Cys Leu Val Gln Glu Asp Asp Lys Glu Thr Pro Ser
115 120 125Phe Leu Phe Glu Ser Val Glu Pro Gly Arg Ile Ser Thr Val Gly Arg130 135 140Tyr Ser Val Val Gly Ala His Pro Val Met Glu Val Ile Ala Lys Asp145 150 155 160Asn Met Val Thr Val Met Asp His Glu Lys Gly Ser Leu Val Glu Glu165 170 175Val Val Asp Asp Pro Met Glu Ile Pro Arg Arg Ile Ser Glu Asp Trp180 185 190Lys Pro Gln Ile Ile Asp Asp Leu Pro Glu Ala Phe Cys Gly Gly Trp195 200 205Val Gly Phe Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys210 215 220Leu Pro Phe Ser Lys Ala Pro Gln Asp Asp Arg Asn Leu Ala Asp Met225 230 235 240His Leu Gly Leu Tyr Asn Asp Val Ile Val Phe Asp His Val Glu Lys245 250 255Lys Val Tyr Val Ile His Trp Val Arg Leu Asn Gln Gln Ser Ser Glu260 265 270Glu Lys Ala Tyr Ala Glu Gly Leu Glu His Leu Glu Arg Leu Val Ser275 280 285Arg Val Gln Asp Glu Asn Thr Pro Arg Leu Ala Pro Gly Ser Ile Asp290 295 300Leu His Thr Gly His Phe Gly Pro Pro Leu Lys Lys Ser Asn Met Thr305 310 315 320Cys Glu Glu Tyr Lys Met Ala Val Leu Ala Ala Lys Glu His Ile Gln325 330 335Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg340 345 350Thr Phe Ala Asp Pro Phe Glu Val Tyr Arg Ala Leu Arg Val Val Asn335 360365
Pro Ser Pro Tyr Met Thr Tyr Met Gln Ala Arg Gly Cys Val Leu Val370 375 380Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys Lys Asn Lys Ile Val385 390 395 400Asn Arg Pro Leu Ala Gly Thr Ala Arg Arg Gly Arg Thr Thr Glu Glu405 410 415Asp Glu Met Leu Glu Thr Gln Leu Leu Lys Asp Ala Lys Gln Cys Ala420 425 430Glu His Val Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val435 440 445Ser Lys Ser Gly Ser Val Lys Val Glu Lys Leu Met Asn Val Glu Arg450 455 460Tyr Ser His Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Gln465 470 475 480Asp Asn Leu Ser Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly485 490 495Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu500 505 510Leu Glu Val Asn Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile515 520 525Ser Phe Thr Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Ile Val530 535 540Phe Gln Thr Gly Thr Arg Tyr Asp Thr Met Tyr Ser Tyr Lys Asn Ala545 550 555 560Thr Lys Arg Arg Gln Trp Val Ala Tyr Leu Gln Ala Gly Ala Gly Ile565 570 575Val Ala Asp Ser Asp Pro Asp Asp Glu His Arg Glu Cys Gln Asn Lys580 585 590Ala Ala Gly Leu Ala Arg Ala Ile Asp Leu Ala Glu Ser Ala Phe Val595 600 605Asn Lys Ser Ser Ser610
<210>7<211>729<212>PRT<213>苜蓿中華根瘤菌(Rhizobium meliloti)<400>7Met Ala Ala Val Ile Leu Glu Asp Gly Ala Glu Ser Tyr Thr Thr Lys1 5 10 15Gly Gly Ile Val Val Thr Arg Arg Arg Arg Glu Ala Ser Tyr Ser Asp20 25 30Ala Ile Ala Gly Tyr Val Asp Arg Leu Asp Glu Arg Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Val Val Asp Pro Pro Leu Ala Ile Ser Ser Phe Gly Arg Ser Leu65 70 75 80Trp Ile Glu Ala Tyr Asn Glu Arg Gly Glu Val Leu Leu Ala Leu Ile85 90 95Ala Glu Asp Leu Lys Ser Val Ala Asp Ile Thr Leu Gly Ser Leu Ala100 105 110Ala Arg Arg Leu Asp Leu Thr Ile Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Met Pro Thr Val Phe Thr Val Leu Arg Ala130 135 140Val Thr Asn Leu Phe His Ser Glu Glu Asp Ser Asn Leu Gly Leu Tyr145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Glu Leu165 170 175Lys Leu Ser Arg Pro Asp Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ala Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Ala Arg Glu Asn Leu Ser Thr Glu Gly Lys Ala Ala210 215 220
Asp Ile Ala Pro Glu Pro Phe Arg Ser Val Asp Ser Ile Pro Pro His225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ala Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Tyr Glu Arg Cys Glu Ser Arg Pro Ser Glu Ile Ser Asn Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asn290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Lys Val Ile Gly Arg370 375380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Ser His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465 470 475 480Ala Thr Leu Leu Tyr Asp Ser Asn Pro Glu Glu Glu Glu Ala Glu Thr485 490495Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Ile Arg Asp Ala Lys Ser500 505 510Ala Asn Ser Ala Lys Ser Ala Arg Asp Val Ala Ala Val Gly Ala Gly515 520 525Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Ser Val Thr Thr Val Arg Thr545 550 555 560Pro Val Ala Glu Glu Ile Phe Asp Arg Val Lys Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Lys Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Asp Leu Arg Gln Leu610 615 620Ala Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Ile Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ser Asn Leu Pro Arg Glu Phe Val Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ser Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gly Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Ala His Leu705 710 715 720
Ala Lys Arg Ala Lys Thr Lys Ala Ala725<210>8<211>421<212>PRT<213>硫磺礦硫化葉菌(Sulfolobus solfataricus)<400>8Met Glu Val His Pro Ile Ser Glu Phe Ala Ser Pro Phe Glu Val Phe1 5 10 15Lys Cys Ile Glu Arg Asp Phe Lys Val Ala Gly Leu Leu Glu Ser Ile20 25 30Gly Gly Pro Gln Tyr Lys Ala Arg Tyr Ser Val Ile Ala Trp Ser Thr35 40 45Asn Gly Tyr Leu Lys Ile His Asp Asp Pro Val Asn Ile Leu Asn Gly50 55 60Tyr Leu Lys Asp Leu Lys Leu Ala Asp Ile Pro Gly Leu Phe Lys Gly65 70 75 80Gly Met Ile Gly Tyr Ile Ser Tyr Asp Ala Val Arg Phe Trp Glu Lys85 90 95Ile Arg Asp Leu Lys Pro Ala Ala Glu Asp Trp Pro Tyr Ala Glu Phe100 105 110Phe Thr Pro Asp Asn Ile Ile Ile Tyr Asp His Asn Glu Gly Lys Val115 120 125Tyr Val Asn Ala Asp Leu Ser Ser Val Gly Gly Cys Gly Asp Ile Gly130 135 140Glu Phe Lys Val Ser Phe Tyr Asp Glu Ser Leu Asn Lys Asn Ser Tyr145 150 155 160Glu Arg Ile Val Ser Glu Ser Leu Glu Tyr Ile Arg Ser Gly Tyr Ile165 170 175Phe Gln Val Val Leu Ser Arg Phe Tyr Arg Tyr Ile Phe Ser Gly Asp180 185 190Pro Leu Arg Ile Tyr Tyr Asn Leu Arg Arg Ile Asn Pro Ser Pro Tyr195 200 205
Met Phe Tyr Leu Lys Phe Asp Glu Lys Tyr Leu Ile Gly Ser Ser Pro210 215 220Glu Leu Leu Phe Arg Val Gln Asp Asn Ile Val Glu Thr Tyr Pro Ile225 230 235 240Ala Gly Thr Arg Pro Arg Gly Ala Asp Gln Glu Glu Asp Leu Lys Leu245 250 255Glu Leu Glu Leu Met Asn Ser Glu Lys Asp Lys Ala Glu His Leu Met260 265 270Leu Val Asp Leu Ala Arg Asn Asp Leu Gly Lys Val Cys Val Pro Gly275 280 285Thr Val Lys Val Pro Glu Leu Met Tyr Val Glu Lys Tyr Ser His Val290 295 300Gln His Ile Val Ser Lys Val Ile Gly Thr Leu Lys Lys Lys Tyr Asn305 310 315 320Ala Leu Asn Val Leu Ser Ala Thr Phe Pro Ala Gly Thr Val Ser Gly325 330 335Arg Pro Lys Pro Met Ala Met Asn Ile Ile Glu Thr Leu Glu Glu Tyr340 345 350Lys Arg Gly Pro Tyr Ala Gly Ala Val Gly Phe Ile Ser Ala Asp Gly355 360 365Asn Ala Glu Phe Ala Ile Ala Ile Arg Thr Ala Phe Leu Asn Lys Glu370 375 380Leu Leu Arg Ile His Ala Gly Ala Gly Ile Val Tyr Asp Ser Asn Pro385 390 395 400Glu Ser Glu Tyr Phe Glu Thr Glu His Lys Leu Lys Ala Leu Lys Thr405 410 415Ala Ile Gly Val Arg420<210>9<211>32<212>DNA<213>人工序列<220>
<223>引物.
<400>9ccatcgcggc gcgttttttt cgtccaacta tg 32<210>10<211>32<212>DNA<213>人工序列<220>
<223>引物.
<400>10catagttgga cgaaaaaaac gcgccgcgat gg 32<210>11<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>11ccatcgcggc gcgtattttt cgtccaacta tgaatatcc 39<210>12<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>12ggatattcat agttggacga aaaatacgcg ccgcgatgg 39<210>13<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>13ccatcgcggc gcgtggtttt cgtccaacta tgaatatcc 39<210>14<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>14
ggatattcat agttggacga aaaccacgcg ccgcgatgg 39<210>15<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>15ccatcgcggc gcggttttta agtccaacta tgaatatcc 39<210>16<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>16ggatattcat agttggactt aaaaaccgcg ccgcgatgg 39<210>17<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>17gcgcggtttt ttcgtgcaac tatgaatatc cggg34<210>18<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>18cccggatatt catagttgca cgaaaaaacc gcgc34<210>19<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>19cgcggttttt tcgttcaact atgaatatcc gggc34
<210>20<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>20gcccggatat tcatagttga acgaaaaaac cgcg34<210>21<211>37<212>DNA<213>人工序列<220>
<223>引物.
<400>21cggcgcggtt ttttcgatca actatgaata tccgggc 37<210>22<211>37<212>DNA<213>人工序列<220>
<223>引物.
<400>22gcccggatat tcatagttga tcgaaaaaac cgcgccg 37<210>23<211>36<212>DNA<213>人工序列<220>
<223>引物.
<400>23ggcgcggttt tttcgctcaa ctatgaatat ccgggc 36<210>24<211>36<212>DNA<213>人工序列<220>
<223>引物.
<400>24gcccggatat tcatagttga gcgaaaaaac cgcgcc 36<210>25<211>39
<212>DNA<213>人工序列<220>
<223>引物.
<400>25cggcgcggtt ttttcgatga actatgaata tccgggccg 39<210>26<211>39<212>DNA<213>人工序列<220>
<223>引物.
<400>26cggcccggat attcatagtt catcgaaaaa accgcgccg 39<210>27<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>27cgcggttttt tcgaccaact atgaatatcc gggc34<210>28<211>34<212>DNA<213>人工序列<220>
<223>引物.
<400>28gcccggatat tcatagttgg tcgaaaaaac cgcg34<210>29<211>36<212>DNA<213>人工序列<220>
<223>引物.
<400>29ggcgcggttt tttcggtcaa ctatgaatat ccgggc 36<210>30<211>36<212>DNA<213>人工序列
<220>
<223>引物.
<400>30gcccggatat tcatagttga ccgaaaaaac cgcgcc 36<210>31<211>35<212>DNA<213>人工序列<220>
<223>引物.
<400>31gcgcggtttt ttcgtacaac tatgaatatc cgggc 35<210>32<211>35<212>DNA<213>人工序列<220>
<223>引物.
<400>32gcccggatat tcatagttgt acgaaaaaac cgcgc 35<210>33<211>36<212>DNA<213>人工序列<220>
<223>引物.
<400>33cggcgcggtt ttttcgtcct tctatgaata tccggg 36<210>34<211>36<212>DNA<213>人工序列<220>
<223>引物.
<400>34cccggatatt catagaagga cgaaaaaacc gcgccg 36<210>35<211>29<212>DNA<213>人工序列<220>
<223>引物.
<400>35ctgaaggcga tcaacgcgtc gccctattc 29<210>36<211>29<212>DNA<213>人工序列<220>
<223>引物.
<400>36gaatagggcg acgcgttgat cgccttcag 29<210>37<211>31<212>DNA<213>人工序列<220>
<223>引物.
<400>37cctgaaggcg atcaacgggt cgccctattc c 31<210>38<211>31<212>DNA<213>人工序列<220>
<223>引物.
<400>38ggaatagggc gacccgttga tcgccttcag g 31<210>39<211>33<212>DNA<213>人工序列<220>
<223>引物.
<400>39cgtcgcccta ttccgccttc atcaatctcg gcg33<210>40<211>33<212>DNA<213>人工序列<220>
<223>引物.
<400>40cgccgagatt gatgaaggcg gaatagggcg acg 33
<210>41<211>33<212>DNA<213>人工序列<220>
<223>引物.
<400>41cgtcgcccta ttcctggttc atcaatctcg gcg 33<210>42<211>33<212>DNA<213>人工序列<220>
<223>引物.
<400>42cgccgagatt gatgaaccag gaatagggcg acg 33<210>43<211>729<212>PRT<213>苜蓿中華根瘤菌(Rhizobium meliloti)<400>43Met Ala Ala Val Ile Leu Glu Asp Gly Ala Glu Ser Tyr Thr Thr Lys1 5 10 15Gly Gly Ile Val Val Thr Arg Arg Arg Arg Glu Ala Ser Tyr Ser Asp20 25 30Ala Ile Ala Gly Tyr Val Asp Arg Leu Asp Glu Arg Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Val Val Asp Pro Pro Leu Ala Ile Ser Ser Phe Gly Arg Ser Leu65 70 75 80Trp Ile Glu Ala Tyr Asn Glu Arg Gly Glu Val Leu Leu Ala Leu Ile85 90 95Ala Glu Asp Leu Lys Ser Val Ala Asp Ile Thr Leu Gly Ser Leu Ala100 105 110Ala Arg Arg Leu Asp Leu Thr Ile Asn Glu Pro Asp Arg Val Phe Thr115 120 125
Glu Glu Glu Arg Ser Lys Met Pro Thr Val Phe Thr Val Leu Arg Ala130 135 140Val Thr Asn Leu Phe His Ser Glu Glu Asp Ser Asn Leu Gly Leu Tyr145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Glu Leu165 170 175Lys Leu Ser Arg Pro Asp Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ala Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Ala Arg Glu Asn Leu Ser Thr Glu Gly Lys Ala Ala210 215 220Asp Ile Ala Pro Glu Pro Phe Arg Ser Val Asp Ser Ile Pro Pro His225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ala Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Tyr Glu Arg Cys Glu Ser Arg Pro Ser Glu Ile Ser Asn Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asn290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425430Arg Phe Ile Glu Ser His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Tyr Asp Ser Asn Pro Glu Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Ile Arg Asp Ala Lys Ser500 505 510Ala Asn Ser Ala Lys Ser Ala Arg Asp Val Ala Ala Val Gly Ala Gly515 520 525Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Ser Val Thr Thr Val Arg Thr545 550 555 560Pro Val Ala Glu Glu Ile Phe Asp Arg Val Lys Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Lys Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Asp Leu Arg Gln Leu610 615 620Ala Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625 630 635 640Gly Ile Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ser Asn Leu Pro Arg Glu Phe Val Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ser Lys675 680685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gly Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Ala His Leu705 710 715 720Ala Lys Arg Ala Lys Thr Lys Ala Ala725<210>44<211>616<212>PRT<213>硫磺礦硫化葉菌(Sulfolobus solfataricus)<400> 44Met Glu Val His Pro Ile Ser Glu Phe Ala Ser Pro Phe Glu Val Phe1 5 10 15Lys Cys Ile Glu Arg Asp Phe Lys Val Ala Gly Leu Leu Glu Ser Ile20 25 30Gly Gly Pro Gln Tyr Lys Ala Arg Tyr Ser Val Ile Ala Trp Ser Thr35 40 45Asn Gly Tyr Leu Lys Ile His Asp Asp Pro Val Asn Ile Leu Asn Gly50 55 60Tyr Leu Lys Asp Leu Lys Leu Ala Asp Ile Pro Gly Leu Phe Lys Gly65 70 75 80Gly Met Ile Gly Tyr Ile Ser Tyr Asp Ala Val Arg Phe Trp Glu Lys85 90 95Ile Arg Asp Leu Lys Pro Ala Ala Glu Asp Trp Pro Tyr Ala Glu Phe100 105 110Phe Thr Pro Asp Asn Ile Ile Ile Tyr Asp His Asn Glu Gly Lys Val
115 120 125Tyr Val Asn Ala Asp Leu Ser Ser Val Gly Gly Cys Gly Asp Ile Gly130 135 140Glu Phe Lys Val Ser Phe Tyr Asp Glu Ser Leu Asn Lys Asn Ser Tyr145 150 155 160Glu Arg Ile Val Ser Glu Ser Leu Glu Tyr Ile Arg Ser Gly Tyr Ile165 170 175Phe Gln Val Val Leu Ser Arg Phe Tyr Arg Tyr Ile Phe Ser Gly Asp180 185 190Pro Leu Arg Ile Tyr Tyr Asn Leu Arg Arg Ile Asn Pro Ser Pro Tyr195 200 205Met Phe Tyr Leu Lys Phe Asp Glu Lys Tyr Leu Ile Gly Ser Ser Pro210 215 220Glu Leu Leu Phe Arg Val Gin Asp Asn Ile Val Glu Thr Tyr Pro Ile225 230 235 240Ala Gly Thr Arg Pro Arg Gly Ala Asp Gln Glu Glu Asp Leu Lys Leu245 250 255Glu Leu Glu Leu Met Asn Ser Glu Lys Asp Lys Ala Glu His Leu Met260 265 270Leu Val Asp Leu Ala Arg Asn Asp Leu Gly Lys Val Cys Val Pro Gly275 280 285Thr Val Lys Val Pro Glu Leu Met Tyr Val Glu Lys Tyr Ser His Val290 295 300Gln His Ile Val Ser Lys Val Ile Gly Thr Leu Lys Lys Lys Tyr Asn305 310 315 320Ala Leu Asn Val Leu Ser Ala Thr Phe Pro Ala Gly Thr Val Ser Gly325 330 335Arg Pro Lys Pro Met Ala Met Asn Ile Ile Glu Thr Leu Glu Glu Tyr340 345 350Lys Arg Gly Pro Tyr Ala Gly Ala Val Gly Phe Ile Ser Ala Asp Gly355 360 365
Asn Ala Glu Phe Ala Ile Ala Ile Arg Thr Ala Phe Leu Asn Lys Glu370 375 380Leu Leu Arg Ile His Ala Gly Ala Gly Ile Val Tyr Asp Ser Asn Pro385 390 395 400Glu Ser Glu Tyr Phe Glu Thr Glu His Lys Leu Lys Ala Leu Lys Thr405 410 415Ala Ile Gly Val Arg Met Asp Leu Thr Leu Ile Ile Asp Asn Tyr Asp420 425 430Ser Phe Val Tyr Asn Ile Ala Gln Ile Val Gly Glu Leu Gly Ser Tyr435 440 445Pro Ile Val Ile Arg Asn Asp Glu Ile Ser Ile Lys Gly Ile Glu Arg450 455 460Ile Asp Pro Asp Arg Leu Ile Ile Ser Pro Gly Pro Gly Thr Pro Glu465 470 475 480Lys Arg Glu Asp Ile Gly Val Ser Leu Asp Val Ile Lys Tyr Leu Gly485 490 495Lys Arg Thr Pro Ile Leu Gly Val Cys Leu Gly His Gln Ala Ile Gly500 505 510Tyr Ala Phe Gly Ala Lys Ile Arg Arg Ala Arg Lys Val Phe His Gly515 520 525Lys Ile Ser Asn Ile Ile Leu Val Asn Asn Ser Pro Leu Ser Leu Tyr530 535 540Tyr Gly Ile Ala Lys Glu Phe Lys Ala Thr Arg Tyr His Ser Leu Val545 550 555 560Val Asp Glu Val His Arg Pro Leu Ile Val Asp Ala Ile Ser Ala Glu565 570 575Asp Asn Glu Ile Met Ala Ile His His Glu Glu Tyr Pro Ile Tyr Gly580 585 590Val Gln Phe His Pro Glu Ser Val Gly Thr Ser Leu Gly Tyr Lys Ile595 600 605Leu Tyr Asn Phe Leu Asn Arg Val610 615
<210>45<211>897<212>PRT<213>擬南芥(Arabidopsis thaliana)<400> 45Met Ser Ala Val Ser Ile Ser Ala Val Lys Ser Asp Phe Phe Thr Val1 5 10 15Glu Ala Ile Ala Val Thr His His Arg Thr Pro His Pro Pro His Phe20 25 30Pro Ser Leu Arg Phe Pro Leu Ser Leu Lys Ser Pro Pro Ala Thr Ser35 40 45Leu Asn Leu Val Ala Gly Ser Lys Leu Leu His Phe Ser Arg Arg Leu50 55 60Pro Ser Ile Lys Cys Ser Tyr Thr Pro Ser Leu Asp Leu Ser Glu Glu65 70 75 80Gln Phe Thr Lys Phe Lys Lys Ala Ser Glu Lys Gly Asn Leu Val Pro85 90 95Leu Phe Arg Cys Val Phe Ser Asp His Leu Thr Pro Ile Leu Ala Tyr100 105 110Arg Cys Leu Val Lys Glu Asp Asp Arg Asp Ala Pro Ser Phe Leu Phe115 120 125Glu Ser Val Glu Pro Gly Ser Gln Ser Ser Asn Ile Gly Arg Tyr Ser130135 140Val Val Gly Ala Gln Pro Thr Ile Glu Ile Val Ala Lys Gly Asn Val145 150 155 160Val Thr Val Met Asp His Gly Ala Ser Leu Arg Thr Glu Glu Glu Val165 170 175Asp Asp Pro Met Met Val Pro Gln Lys Ile Met Glu Glu Trp Asn Pro180 185 190Gln Gly Ile Asp Glu Leu Pro Glu Ala Phe Cys Gly Gly Trp Val Gly195 200 205Tyr Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro210 215 220
Phe Ser Asn Ala Pro Glu Asp Asp Arg Ser Leu Pro Asp Val Asn Leu225 230 235240Gly Leu Tyr Asp Asp Val Ile Val Phe Asp His Val Glu Lys Lys Ala245 250 255Tyr Val Ile His Trp Val Arg Ile Asp Lys Asp Arg Ser Val Glu Glu260 265 270Asn Phe Arg Glu Gly Met Asn Arg Leu Glu Ser Leu Thr Ser Arg Ile275 280 285Gln Asp Gln Lys Pro Pro Lys Met Pro Thr Gly Phe Ile Lys Leu Arg290 295 300Thr Gln Leu Phe Gly Pro Lys Leu Glu Lys Ser Thr Met Thr Ser Glu305 310 315 320Ala Tyr Lys Glu Ala Val Val Glu Ala Lys Glu His Ile Leu Ala Gly325 330 335Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Phe340 345350Ala Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser355 360 365Pro Tyr Met Ala Tyr Leu Gln Val Arg Gly Cys Ile Leu Val Ala Ser370 375 380Ser Pro Glu Ile Leu Leu Arg Ser Lys Asn Arg Lys Ile Thr Asn Arg385 390 395 400Pro Leu Ala Gly Thr Val Arg Arg Gly Lys Thr Pro Lys Glu Asp Leu405 410415Met Leu Glu Lys Glu Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His420 425 430Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys435 440 445Pro Gly Ser Val Glu Val Lys Lys Leu Lys Asp Ile Glu Trp Phe Ser450 455 460His Val Met His Ile Ser Ser Thr Val Val Gly Glu Leu Leu Asp His
465 470 475 480Leu Thr Ser Trp Asp Ala Leu Arg Ala Val Leu Pro Val Gly Thr Val485 490 495Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu500 505 510Val Thr Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser Phe515 520 525Asn Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Met Val Phe Pro530 535 540Thr Asn Thr Arg Tyr Asp Thr Leu Tyr Ser Tyr Lys His Pro Gln Arg545 550 555 560Arg Arg Glu Trp Ile Ala His Ile Gln Ala Gly Ala Gly Ile Val Ala565 570 575Asp Ser Asn Pro Asp Asp Glu His Arg Glu Cys Glu Asn Lys Ala Ala580 585 590Ala Leu Ala Arg Ala Ile Asp Leu Ala Glu Ser Ser Phe Leu Glu Ala595 600 605Pro Glu Phe Thr Thr Ile Thr Pro His Ile Asn Asn Ile Met Ala Ala610 615 620Ser Thr Leu Tyr Lys Ser Cys Leu Leu Gln Pro Lys Ser Gly Ser Thr625 630 635 640Thr Arg Arg Leu Asn Pro Ser Leu Val Asn Pro Leu Thr Asn Pro Thr645 650 655Arg Val Ser Val Leu Gly Lys Ser Arg Arg Asp Val Phe Ala Lys Ala660 665 670Ser Ile Glu Met Ala Glu Ser Asn Ser Ile Pro Ser Val Val Val Asn675 680 685Ser Ser Lys Gln His Gly Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser690 695 700Phe Thr Tyr Asn Leu Cys Gln Tyr Met Gly Glu Leu Gly Cys His Phe705 710 715 720
Glu Val Tyr Arg Asn Asp Glu Leu Thr Val Glu Glu Leu Lys Lys Lys725 730 735Asn Pro Arg Gly Val Leu Ile Ser Pro Gly Pro Gly Thr Pro Gln Asp740 745 750Ser Gly Ile Ser Leu Gln Thr Val Leu Glu Leu Gly Pro Leu Val Pro755 760 765Leu Phe Gly Val Cys Met Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly770 775 780Gly Lys Ile Val Arg Ser Pro Phe Gly Val Met His Gly Lys Ser Ser785 790 795 800Met Val His Tyr Asp Glu Lys Gly Glu Glu Gly Leu Phe Ser Gly Leu805 810 815Ser Asn Pro Phe Ile Val Gly Arg Tyr His Ser Leu Val Ile Glu Lys820 825 830Asp Thr Phe Pro Ser Asp Glu Leu Glu Val Thr Ala Trp Thr Glu Asp835 840 845Gly Leu Val Met Ala Ala Arg His Arg Lys Tyr Lys His Ile Gln Gly850 855 860Val Gln Phe His Pro Glu Ser Ile Ile Thr Thr Glu Gly Lys Thr Ile865 870 875 880Val Arg Asn Phe Ile Lys Ile Val Glu Lys Lys Glu Ser Glu Lys Leu885 890 895Thr<210>46<211>252<212>DNA<213>人工序列<220>
<223>截短的基因<400>46atgcaaacac aaaaaccgac tctcgaactg gaattcctgg tggaaaacgg tatcgccacc 60gtgcaagcgg gtgctggtgt agtccttgat tctgttccgc agtcggaagc cgacgaaacc 120cgtaacaaag cccgcgctgt actgcgcgct attgccaccg cgcatcatgc acaggagact 180
ttctgatggc tgacattctg ctgctcgata atatcgactc ttttacgtac aacctggcag 240atcagttgcg ca 252<210>47<211>18<212>DNA<213>人工序列<220>
<223>引物.
<400>47ttatgccgcc tgtcatcg 18<210>48<211>19<212>DNA<213>人工序列<220>
<223>引物.
<400>48ataggcttaa tggtaaccg 19<210>49<211>18<212>DNA<213>人工序列<220>
<223>引物.
<400>49ctgaacaaca gaagtacg 18<210>50<211>18<212>DNA<213>人工序列<220>
<223>引物.
<400>50taaccgtgtc atcgagcg 18<210>51<211>31<212>DNA<213>人工序列<220>
<223>引物.
<400>51
aaaaagatct ccatggtaac gatcattcag g 31<210>52<211>35<212>DNA<213>人工序列<220>
<223>引物.
<400>52aaaagaattc ttatcacgcg gccttggtct tcgcc 35<210>53<211>19<212>DNA<213>人工序列<220>
<223>引物.
<400>53caaaagctgg atccccacc 19<210>54<211>23<212>DNA<213>人工序列<220>
<223>引物.
<400>54cctatccgag atctctcaac tcc23<210>55<211>31<212>DNA<213>人工序列<220>
<223>引物.
<400>55catcccatgg atggtaacga tcattcagga t 31<210>56<211>31<212>DNA<213>人工序列<220>
<223>引物.
<400>56gatgtcraga gacactatag aatactcaag c 31
<210>57<211>719<212>PRT<213>血色紅假單胞菌(Rhodopseudomonas palustris)<400>57Met Asn Arg Thr Val Phe Ser Leu Pro Ala Thr Ser Asp Tyr Lys Thr1 5 10 15Ala Ala Gly Leu Ala Val Thr Arg Ser Ala Gln Pro Phe Ala Gly Gly20 25 30Gln Ala Leu Asp Glu Leu Ile Asp Leu Leu Asp His Arg Arg Gly Val35 40 45Met Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe Asp50 55 60Leu Gly Phe Ala Asp Pro Pro Leu Ala Leu Thr Thr Arg Ala Glu Lys65 70 75 80Phe Thr Ile Glu Ala Leu Asn Pro Arg Gly Arg Val Leu Ile Ala Phe85 90 95Leu Ser Asp Lys Leu Glu Glu Pro Cys Val Val Val Glu Gln Ala Cys100 105 110Ala Thr Lys Ile Arg Gly His Ile Val Arg Gly Glu Ala Pro Val Asp115 120 125Glu Glu Gln Arg Thr Arg Arg Ala Ser Ala Ile Ser Leu Val Arg Ala130 135 140Val Ile Ala Ala Phe Ala Ser Pro Ala Asp Pro Met Leu Gly Leu Tyr145 150 155 160Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Phe Glu Asp Leu Lys Gln165 170 175Lys Arg Ala Arg Glu Ala Asp Gln Arg Asp Ile Val Leu Tyr Val Pro180 185 190Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Asp Ile195 200 205Ser Tyr Glu Phe Ala Trp Lys Gly Gln Ser Thr Ala Gly Leu Pro Asn210 215 220
Glu Thr Ala Glu Ser Val Tyr Thr Gln Thr Gly Arg Gln Gly Phe Ala225 230 235 240Asp His Ala Pro Gly Asp Tyr Pro Lys Val Val Glu Lys Ala Arg Ala245 250 255Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu Phe260 265 270Gly Glu Pro Cys Glu Arg Ser Pro Ala Glu Val Phe Lys Arg Leu Cys275 280 285Arg Ile Asn Pro Ser Pro Tyr Gly Gly Leu Leu Asn Leu Gly Asp Gly290 295 300Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp Gly305 310 315 320Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly Val325 330335Asp Ala Ile Ser Asp Ala Glu Gln Ile Gln Lys Leu Leu Asn Ser Glu340 345 350Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn Asp355 360 365Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg Arg370 375 380Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val Glu385 390 395 400Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr His405 410 415Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met Gln420 425 430Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly Ala435 440 445Phe Gly Val Val Gly Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr Ile450 455 460Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly Ala465 470 475 480
Thr Cys Leu Phe Asp Ser Asn Pro Val Ala Glu Asp Lys Glu Cys Gln485 490 495Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Ala Lys500 505 510Pro Leu Ser Ala Val Ala Pro Asp Ala Thr Gly Ser Gly Lys Lys Val515 520 525Leu Leu Val Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp Tyr530 535 540Phe Arg Gln Val Gly Ala Gln Val Thr Val Val Arg Tyr Val His Gly545 550 555 560Leu Lys Met Leu Ala Glu Asn Ser Tyr Asp Leu Leu Val Leu Ser Pro565 570 575Gly Pro Gly Arg Pro Glu Asp Phe Lys Ile Lys Asp Thr Ile Asp Ala580 585 590Ala Leu Ala Lys Lys Leu Pro Ile Phe Gly Val Cys Leu Gly Val Gln595 600 605Ala Met Gly Glu Tyr Phe Gly Gly Thr Leu Gly Gln Leu Ala Gln Pro610 615 620Ala His Gly Arg Pro Ser Arg Ile Gln Val Arg Gly Gly Ala Leu Met625 630 635 640Arg Gly Leu Pro Asn Glu Val Thr Ile Gly Arg Tyr Hi s Ser Leu Tyr645 650 655Val Asp Met Arg Asp Met Pro Lys Glu Leu Thr Val Thr Ala Ser Thr660 665 670Asp Asp Gly Ile Ala Met Ala Ile Glu His Lys Thr Leu Pro Val Gly675 680 685Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu Val690 695 700Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Gly Gln Ala Ala705 710 715<210>58<211>729
<212>PRT<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>58Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Phe35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 15 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220
Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly
465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720
Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>59<211>729<212>PRT<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>59Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Tyr35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190
Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445
Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700
Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>60<211>729<212>PRT<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>60Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Phe Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175
Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430
Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670
Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720ThrArg Lys Ala Lys Thr Lys Ala Ala725<210>61<211>729<212>PRT<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>61Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Cys Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe
145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400
Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655
His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser ILe Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>62<211>729<212>PRT<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>62Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Phe Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125
Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro
625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>63<211>729<212>PRT<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>63Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110
Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Ala Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn
355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Aa Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605
Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>64<211>729<212>PRT<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>64Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile
85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Gly Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335
Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590
Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>65<211>729<212>PRT<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>65Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60
Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Trp Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser
305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560
Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu Hi s Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val Hi s Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>66<211>604<212>PRT<213>人工序列<220>
<223>玉米突變體.
<400>66Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala1 5 10 l5Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr20 25 30Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser Ala
35 40 45Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala50 55 60Ala Lys Ala Ala Glu Glu Asp Lys Arg Arg Phe Phe Glu Ala Ala Ala65 70 75 80Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile Val85 90 95Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro Glu100 105 110Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln Gly115 120 125Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala His130 135 140Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met Asp145 150 155 160His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met Gln165 170 175Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp Glu180 185 190Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr Asp195 200 205Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala Pro210 215 220Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Asp225 230 235 240Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His Trp245 250 255Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp Gly260 265 270Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn Val275 280 285
Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe Gly290 295 300Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn Ala305 310 315 320Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln Ile325 330 335Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe Glu340 345 350Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Lys Ala Tyr355 360 365Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile Leu370 375 380Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly Thr385 390 395 400Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln Gln405 410 415Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val Asp420 425 430Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Lys435 440 445Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile450 455 460Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp Asp465 470 475 480Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys485 490 495Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg Gly500 505 510Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Gln515 520 525Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser His530 535 540
Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp Val545 550 555 560Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro Asp565 570 575Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala580 585 590Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu595 600<210>67<211>1815<212>DNA<213>人工序列<220>
<223>玉米突變體.
<400>67atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg60cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga l20accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg 180agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg 240cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc 300acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc 360ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg 420gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac 480cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc 540atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga 600tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc 660tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat 720gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac 780cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta 840tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca 900cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct 960gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag 1020aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg 1080
aatcctagcc catacaaggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt 1140cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact 1200gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat 1260gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag 1320gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat 1380gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat 1440gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg 1500gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga 1560atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca 1620gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc 1680gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt 1740gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt 1800gtagacaaag aatag 1815<210>68<211>2204<212>DNA<213>人工序列<220>
<223>玉米突變體.
<400>68atggaatccc tagccgccac ctccgtgttc gcgccctccc gcgtcgccgt cccggcggcg 60cgggccctgg ttagggcggg gacggtggta ccaaccaggc ggacgagcag ccggagcgga 120accagcgggg tgaaatgctc tgctgccgtg acgccgcagg cgagcccagt gattagcagg 180agcgctgcgg cggcgaaggc ggcggaggag gacaagaggc ggttcttcga ggcggcggcg 240cgggggagcg ggaaggggaa cctggtgccc atgtgggagt gcatcgtgtc ggaccatctc 300acccccgtgc tcgcctaccg ctgcctcgtc cccgaggaca acgtcgacgc ccccagcttc 360ctcttcgagt ccgtcgagca ggggccccag ggcaccacca acgtcggccg ctatagcatg 420gtgggagccc acccagtgat ggagattgtg gccaaagacc acaaggttac gatcatggac 480cacgagaaga gccaagtgac agagcaggta gtggacgacc cgatgcagat cccgaggacc 540atgatggagg gatggcaccc acagcagatc gacgagctcc ctgaatcctt ctccggtgga 600tgggttgggt tcttttccta tgatacggtt aggtatgttg agaagaagaa gctaccgttc 660tccagtgctc ctcaggacga taggaacctt cctgatgtgc acttgggact ctatgatgat 720gttctagtct tcgataatgt tgagaagaaa gtatatgtta tccattgggt caatgtggac 780
cggcatgcat ctgttgagga agcataccaa gatggcaggt cccgactaaa catgttgcta 840tctaaagtgc acaattccaa tgtccccaca ctctctcctg gatttgtgaa gctgcacaca 900cgcaagtttg gtacaccttt gaacaagtcg accatgacaa gtgatgagta taagaatgct 960gttctgcagg ctaaggaaca tattatggct ggggatatct tccagattgt tttaagccag 1020aggttcgaga gacgaacata tgccaaccca tttgaggttt atcgagcatt acggattgtg 1080aatcctagcc catacaaggc gtatgtacag gcaagaggct gtgtattggt tgcgtctagt 1140cctgaaattc ttacacgagt cagtaagggg aagattatta atcgaccact tgctggaact 1200gttcgaaggg gcaagacaga gaaggaagat caaatgcaag agcagcaact gttaagtgat 1260gaaaaacagt gtgccgagca cataatgctt gtggacttgg gaaggaatga tgttggcaag 1320gtatccaaac caggatcagt gaaggtggag aagttgatga acattgagag atactcccat 1380gttatgcaca tcagctcaac ggttagtgga cagttggatg atcatctcca gagttgggat 1440gccttgagag ctgccttgcc cgttggaaca gtcagtggtg caccaaaggt gaaggccatg 1500gagttgattg ataagttgga agttacgagg cgaggaccat atagtggtgg tctaggagga l560atatcgtttg atggtgacat gcaaattgca ctttctctcc gcaccatcgt attctcaaca 1620gcgccgagcc acaacacgat gtactcatac aaagacgcag ataggcgtcg ggagtgggtc 1680gctcatcttc aggctggtgc aggcattgtt gccgacagta gcccagatga cgaacaacgt 1740gaatgcgaga ataaggctgc tgcactagct cgggccatcg atcttgcaga gtcagctttt 1800gtagacaaag aatagtgtgc tatggttatc gtttagttct tgttcatgtt tcttttaccc 1860actttccgtt aaaaaaagat gtcattagtg ggtggagaaa agcaataaga ctgttctcta 1920gaattcgagc tcggtaccgg atccaattcc cgatcgttca aacatttggc aataaagttt 1980cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc tgttgaatta 2040cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat gggtttttat 2100gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat agcgcgcaaa 2160ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gatc 2204<210>69<211>729<212>PRT<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400> 69Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15
Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Lys Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270
Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525
Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>70<211>729<212>PRT<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>70
Met Val Thr Ile Ile Gln Asp Asp Gly Ala Glu Thr Tyr Glu Thr Lys1 5 10 15Gly Gly Ile Gln Val Ser Arg Lys Arg Arg Pro Thr Asp Tyr Ala Asn20 25 30Ala Ile Asp Asn Tyr Ile Glu Lys Leu Asp Ser His Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Leu Gly Ile Ser Cys Phe Gly Arg Lys Met65 70 75 80Trp Ile Glu Ala Tyr Asn Gly Arg Gly Glu Val Leu Leu Asp Phe Ile85 90 95Thr Glu Lys Leu Lys Ala Thr Pro Asp Leu Thr Leu Gly Ala Ser Ser100 105 110Thr Arg Arg Leu Asp Leu Thr Val Asn Glu Pro Asp Arg Val Phe Thr115 120 125Glu Glu Glu Arg Ser Lys Ile Pro Thr Val Phe Thr Ala Leu Arg Ala130 135 140Ile Val Asp Leu Phe Tyr Ser Ser Ala Asp Ser Ala Ile Gly Leu Phe145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Ala Ile Lys Leu165 170 175Ser Leu Ala Arg Pro Glu Asp Gln Arg Asp Met Val Leu Phe Leu Pro180 185 190Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys Ala Trp Ile Asp195 200 205Arg Tyr Asp Phe Glu Lys Asp Gly Met Thr Thr Asp Gly Lys Ser Ser210 215 220Asp Ile Thr Pro Asp Pro Phe Lys Thr Thr Asp Thr Ile Pro Pro Lys225 230 235 240Gly Asp His Arg Pro Gly Glu Tyr Ser Glu Leu Val Val Lys Ala Lys
245 250 255Glu Ser Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Lys260 265 270Phe Met Glu Arg Cys Glu Ser Asn Pro Ser Ala Ile Ser Arg Arg Leu275 280 285Lys Ala Ile Asn Pro Ser Pro Tyr Ser Ala Phe Ile Asn Leu Gly Asp290 295 300Gln Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Ser305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Asp Asp Pro Ile Ala Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg370 375 380Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Asp Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Ile Glu Gly His Glu Lys Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Val Gly Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu Val Arg Ala Gly465 470 475 480Ala Thr Leu Leu Asn Asp Ser Asn Pro Gln Glu Glu Glu Ala Glu Thr485 490 495
Glu Leu Lys Ala Ser Ala Met Ile Ser Ala Ile Arg Asp Ala Lys Gly500 505 510Thr Asn Ser Ala Ala Thr Lys Arg Asp Ala Ala Lys Val Gly Thr Gly515 520 525Val Lys Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Thr Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Ala Asp Val Phe Asp Arg Phe Gln Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Thr Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Lys Ala Ala Arg Ala Arg Asp Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu Leu Arg Gln Leu610 615 620Ala Val Pro Met His Gly Lys Pro Ser Arg Ile Arg Val Leu Glu Pro625 630 635 640Gly Leu Val Phe Ser Gly Leu Gly Lys Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Ala Thr Leu Pro Arg Asp Phe Ile Ile660 665 670Thr Ala Glu Ser Glu Asp Gly Thr Ile Met Gly Ile Glu His Ala Lys675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly Gln Asp Ala Gly Met Arg Met Ile Glu Asn Val Val Val His Leu705 710 715 720Thr Arg Lys Ala Lys Thr Lys Ala Ala725<210>71<211>264<212>DNA
<213>人工序列<220>
<223>CTP的序列.
<400>71atggcttcct ctatgctctc ttccgctact atggttgcct ctccggctca ggccactatg60gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac 120aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggtgtggcct 180ccgattggaa agaagaagtt tgagactctc tcttaccttc ctgaccttac cgattccggt 240ggtcgcgtca actgcatgca ggcc 264<210>72<211>88<212>PRT<213>人工序列<220>
<223>CTP的序列.
<400>72Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala1 5 10 15Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala20 25 30Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser35 40 45Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys50 55 60Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly65 70 75 80Gly Arg Val Asn Cys Met Gln Ala85<210>73<211>264<212>DNA<213>人工序列<220>
<223>CTP的序列.
<400>73atggcttcct ctatgctctc ttccgctact atggttgcct ctccggctca ggccactatg 60gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac 120
aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggtgtggcct 180ccgattgaaa agaagaagtt tgagactctc tcttaccttc ctgaccttac cgattccggt 240ggtcgcgtca actgcatgca ggcc 264<210>74<211>88<212>PRT<213>人工序列<220>
<223>CTP的序列.
<400>74Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala1 5 10 15Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala20 25 30Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser35 40 45Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Glu Lys50 55 60Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly65 70 75 80Gly Arg Val Asn Cys Met Gln Ala85<210>75<211>2190<212>DNA<213>人工序列<220>
<223>優(yōu)化的根瘤農(nóng)桿菌(An optimized A.tumefaciens.)<400>75atggtgacca tcattcagga tgacggtgcc gagacctacg agaccaaggg cggcatccag 60gtgagccgca agcgccgccc caccgattac gccaacgcca tcgataacta catcgaaaag 120cttgattccc atcgcggtgc cgtgttctcc tccaactacg aatacccagg ccgctacacc 180cgctgggata ccgccatcgt cgatccacca ctcggcattt cctgcttcgg ccgcaagatg 240tggatcgaag cctacaacgg ccgcggcgaa gtgctgctcg atttcattac cgaaaagctg 300aaggccacac ccgatctcac cctcggcgct tcctccaccc gccgcctcga tcttaccgtc 360
aacgaaccag accgcgtctt caccgaagaa gaacgctcca aaatcccaac cgtcttcacc420gctctcaggg ccatcgtcga cctcttctac tccagcgccg attccgccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcca tcaagctttc cctggcccgc540ccagaagacc agcgcgacat ggtgctgttc ctgcccgatg aaatcctcgt cgttgatcac600tactccgcca aggcctggat cgaccgctac gatttcgaga aggacggcat gaccaccgac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccacccaag720ggcgatcacc gccccggcga atactccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgctg cgaaagcaac840ccatccgcca tttcccgccg cctgaaggcc atcaacccat ccccctactc cttcttcatc900aacctcggcg atcaggaata cctggtcggc gcctccccag aaatgttcgt gcgcgtctcc960ggccgccgca tcgagacctg cccaatctca ggcaccatca agcgcggcga cgatccaatt 1020gccgacagcg agcagatttt gaaactgctc aactccaaaa aggacgaatc cgaactgacc 1080atgtgctccg acgtggaccg caacgacaag agccgcgtct gcgagccagg ttccgtgaag 1140gtcattggcc gccgccagat cgagatgtac tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc ttcgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccacgcg cctggtacgg cggtgccatc ggcatggtcg gcttcaacgg cgacatgaac 1380accggcctga ccctgcgcac catccgcatc aaggacggta ttgccgaagt gcgcgccggc 1440gccaccctgc tcaacgattc caacccacag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tctcagccat tcgcgacgca aaaggcacca actctgccgc caccaagcgc 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacaccc tggccaacta cttccgccag accggcgcca ccgtctccac cgtcaggtca 1680ccagtcgcag ccgacgtgtt cgatcgcttc cagccagacc tcgttgtcct gtcccccggt 1740cccggcagcc caaccgattt cgactgcaag gcaaccatca aggccgcccg cgcccgcgat 1800ctgccaatct tcggcgtttg cctcggtctg caggcattgg cagaagccta cggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttccc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcaccgtcg gtcgctacca ttccatcttc 1980gccgatcccg ccaccctgcc acgcgatttc atcatcaccg cagaaagcga ggacggcacc 2040atcatgggca tcgaacacgc caaggaacca gtggccgccg ttcagttcca cccagaatcc 2100atcatgaccc tcggtcagga cgccggcatg cgcatgatcg agaacgtcgt ggtgcatctg 2160acccgcaagg ccaagaccaa ggccgcctga2190
<210>76<211>2160<212>DNA<213>血色紅假單胞菌(Rhodopseudomonas palustris)<400>76atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc60gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat 120ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac 180gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa 240ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag 300cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc 360gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc 420ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac 480ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc 540gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc 600gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc 660ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc 720gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc 780ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg 840gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat 900ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc 960cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc 1020gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg 1080tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt 1140ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag 1200ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc 1260accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc 1320ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc 1380ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc 1440acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg 1500gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac 1560gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg 1620ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc 1680ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg 1740
ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc 1800ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag 1860ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg 1920cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc 1980gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc 2040gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc 2100ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa 2160<210>77<211>733<212>PRT<213>百脈根根瘤菌(Mesorhizobium loti)<400>77Met Glu Thr Ala Met Thr Met Lys Val Leu Glu Asn Gly Ala Glu Ser1 5 10 15Phe Val Thr Ala Gly Gly Ile Thr Ile Thr Arg Glu Arg His Asp Arg20 25 30Pro Tyr Ala Gly Ala Ile Asp Ala Tyr Val Asp Gly Leu Asn Ser Arg35 40 45Arg Gly Ala Val Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr50 55 60Arg Trp Asp Thr Ala Ile Ile Asp Pro Pro Leu Val Ile Ser Ala Arg65 70 75 80Gly Arg Ala Met Arg Ile Glu Ala Leu Asn Arg Arg Gly Glu Ala Leu85 90 95Leu Pro Val Ile Gly Lys Thr Leu Gly Gly Leu Ala Asp Ile Thr Ile100 105 110Ala Glu Thr Thr Lys Thr Leu Ile Arg Leu Asp Val Ala Lys Pro Gly115 120 125Arg Val Phe Thr Glu Glu Glu Arg Ser Arg Val Pro Ser Val Phe Thr130 135 140Val Leu Arg Ala Ile Thr Ala Leu Phe Lys Thr Asp Glu Asp Ala Asn145 150 155 160
Leu Gly Leu Tyr Gly Ala Phe Gly Tyr Asp Leu Ser Phe Gln Phe Asp165170 175Pro Val Asp Tyr Lys Leu Glu Arg Lys Pro Ser Gln Arg Asp Leu Val180 185 190Leu Phe Leu Pro Asp Glu Ile Leu Val Val Asp His Tyr Ser Ala Lys195 200 205Ala Trp Thr Asp Arg Tyr Asp Tyr Ser Gly Glu Gly Phe Ser Thr Glu210 215 220Gly Leu Pro Arg Asp Ala Ile Ala Glu Pro Phe Lys Thr Ala Asp Arg225 230 235 240Ile Pro Pro Arg Gly Asp His Glu Pro Gly Glu Tyr Ala Asn Leu Val245 250 255Arg Arg Ala Met Asp Ser Phe Lys Arg Gly Asp Leu Phe Glu Val Val260 265 270Pro Gly Gln Met Phe Tyr Glu Arg Cys Glu Thr Gln Pro Ser Asp Ile275 280 285Ser Arg Lys Leu Lys Ser Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile290 295 300Asn Leu Gly Glu Asn Glu Tyr Leu Ile Gly Ala Ser Pro Glu Met Phe305 310 315 320Val Arg Val Asn Gly Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr325 330 335Ile Lys Arg Gly Asp Asp Ala Ile Ser Asp Ser Glu Gln Ile Leu Lys340 345 350Leu Leu Asn Ser Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp355 360 365Val Asp Arg Asn Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Arg370 375 380Val Ile Gly Arg Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr385 390 395 400Val Asp His Ile Glu Gly Arg Leu Arg Glu Gly Met Asp Ala Phe Asp405 410 415
Ala Phe Leu Ser His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys420 425 430Leu Trp Ala Met Arg Phe Ile Glu Gln Asn Glu Lys Ser Pro Arg Ala435 440 445Trp Tyr Gly Gly Ala Ile Gly Met Val Asn Phe Asn Gly Asp Met Asn450 455 460Thr Gly Leu Thr Leu Arg Thr Ile Arg Ile Lys Asp Gly Ile Ala Glu465 470 475 480Val Arg Ala Gly Ala Thr Leu Leu Phe Asp Ser Ile Pro Glu Glu Glu485 490 495Glu Ala Glu Thr Glu Leu Lys Ala Ser Ala Met Leu Ser Ala Ile Arg500 505 510Asp Ala Lys Thr Gly Asn Ser Ala Ser Thr Glu Arg Thr Thr Ala Arg515 520 525Val Gly Asp Gly Val Asn Ile Leu Leu Val Asp His Glu Asp Ser Phe530 535 540Val His Thr Leu Ala Asn Tyr Phe Arg Gln Thr Gly Ala Asn Val Ser545 550 555 560Thr Val Arg Thr Pro Val Pro Asp Glu Val Phe Glu Arg Leu Lys Pro565 570 575Asp Leu Val Val Leu Ser Pro Gly Pro Gly Thr Pro Lys Asp Phe Asp580 585 590Cys Ala Ala Thr Ile Arg Arg Ala Arg Ala Arg Asp Leu Pro Ile Phe595 600 605Gly Val Cys Leu Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Glu610 615 620Leu Arg Gln Leu His Ile Pro Met His Gly Lys Pro Ser Arg Ile Arg625 630 635 640Val Ser Lys Pro Gly Ile Ile Phe Ser Gly Leu Pro Lys Glu Val Thr645 650 655Val Gly Arg Tyr His Ser Ile Phe Ala Asp Pro Val Arg Leu Pro Asp
660 665 670Asp Phe Ile Val Thr Ala Glu Thr Glu Asp Gly Ile Ile Met Ala Phe675 680 685Glu His Arg Lys Glu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser690 695 700Ile Met Thr Leu Gly His Asn Ala Gly Met Arg Ile Ile Glu Asn Ile705 710 715 720Val Ala His Leu Pro Arg Lys Ala Lys Glu Lys Ala Ala725 730<210>78<211>732<212>PRT<213>巴西固氮螺菌(Azospirillum brasilense)<400>78Met Tyr Pro Ala Asp Leu Leu Ala Ser Pro Asp Leu Leu Glu Pro Leu1 5 10 15Arg Phe Gln Thr Arg Gly Gly Val Thr Val Thr Arg Arg Ala Thr Ala20 25 30Leu Asp Pro Arg Thr Ala Leu Asp Pro Val Ile Asp Ala Leu Asp Arg35 40 45Arg Arg Gly Leu Leu Leu Ser Ser Gly Val Glu Ala Pro Gly Arg Tyr50 55 60Arg Arg His Ala Leu Gly Phe Thr Asp Pro Ala Val Ala Leu Thr Ala65 70 75 80Arg Gly Arg Thr Leu Arg Ile Asp Ala Leu Asn Gly Arg Gly Gln Val85 90 95Leu Leu Pro Ala Val Ala Glu Ala Leu Arg Gly Leu Glu Ala Leu Ala100 105 110Gly Leu Glu Glu Ala Pro Ser Arg Val Thr Ala Ser Ser Ala Ser Pro115 120 125Ala Pro Leu Pro Gly Glu Glu Arg Ser Arg Gln Pro Ser Val Phe Ser130 135 140
Val Leu Arg Ala Val Leu Asp Leu Phe Ala Ala Pro Asp Asp Pro Leu145 150 155 160Leu Gly Leu Tyr Gly Ala Phe Ala Tyr Asp Leu Ala Phe Gln Phe Glu165 170 175Pro Ile Arg Gln Arg Leu Glu Arg Pro Asp Asp Gln Arg Asp Leu Leu180 185 190Leu Tyr Leu Pro Asp Arg Leu Val Ala Leu Asp Pro Ile Ala Gly Leu195 200 205Ala Arg Leu Val Ala Tyr Glu Phe Ile Thr Ala Ala Gly Ser Thr Glu210 215 220Gly Leu Glu Cys Gly Gly Arg Asp His Pro Tyr Arg Pro Asp Thr Asn225 230 235 240Ala Glu Ala Gly Cys Asp His Ala Pro Gly Asp Tyr Gln Arg Val Val245 250 255Glu Ser Ala Lys Ala Ala Phe Arg Arg Gly Asp Leu Phe Glu Val Val260 265 270Pro Gly Gln Thr Phe Ala Glu Pro Cys Ala Asp Ala Pro Ser Ser Val275 280 285Phe Arg Arg Leu Arg Ala Ala Asn Pro Ala Pro Tyr Glu Ala Phe Val290 295 300Asn Leu Gly Arg Gly Glu Phe Leu Val Ala Ala Ser Pro Glu Met Tyr305 310 315 320Val Arg Val Ala Gly Gly Arg Val Glu Thr Cys Pro Ile Ser Gly Thr325 330 335Val Ala Arg Gly Ala Asp Ala Leu Gly Asp Ala Ala Gln Val Leu Arg340 345 350Leu Leu Thr Ser Ala Lys Asp Ala Ala Glu Leu Thr Met Cys Thr Asp355 360 365Val Asp Arg Asn Asp Lys Ala Arg Val Cys Glu Pro Gly Ser Val Arg370 375 380Val Ile Gly Arg Arg Met Ile Glu Leu Tyr Ser Arg Leu Ile His Thr385 390 395 400
Val Asp His Val Glu Gly Arg Leu Arg Ser Gly Met Asp Ala Leu Asp405 410 415Ala Phe Leu Thr His Ser Trp Ala Val Thr Val Thr Gly Ala Pro Lys420 425 430Arg Trp Ala Met Gln Phe Leu Glu Asp Thr Glu Gln Ser Pro Arg Arg435 440 445Trp Tyr Gly Gly Ala Phe Gly Arg Leu Gly Phe Asp Gly Gly Met Asp450 455 460Thr Gly Leu Thr Leu Arg Thr Ile Arg Met Ala Glu Gly Val Ala Tyr465 470 475 480Val Arg Ala Gly Ala Thr Leu Leu Ser Asp Ser Asp Pro Asp Ala Glu485 490 495Asp Ala Glu Cys Arg Leu Lys Ala Ala Ala Phe Arg Asp Ala Ile Arg500 505 510Gly Thr Ala Ala Gly Ala Ala Pro Thr Leu Pro Ala Ala Pro Arg Gly515 520 525Gly Glu Gly Arg Arg Val Leu Leu Val Asp His Asp Asp Ser Phe Val530 535 540His Thr Leu Ala Asp Tyr Leu Arg Gln Thr Gly Ala Ser Val Thr Thr545 550 555 560Leu Arg His Ser His Ala Arg Ala Ala Leu Ala Glu Arg Arg Pro Asp565 570 575Leu Val Val Leu Ser Pro Gly Pro Gly Arg Pro Ala Asp Phe Asp Val580 585 590Ala Gly Thr Ile Asp Ala Ala Leu Ala Leu Gly Leu Pro Val Phe Gly595 600 605Val Cys Leu Gly Leu Gln Gly Met Val Glu Arg Phe Gly Gly Ala Leu610 615 620Asp Val Leu Pro Glu Pro Val His Gly Lys Ala Thr Glu Val Arg Val625 630 635 640Leu Gly Gly Ala Leu Phe Ala Gly Leu Pro Glu Arg Leu Thr Val Gly
645 650 655Arg Tyr His Ser Leu Val Ala Arg Arg Asp Arg Leu Pro Ala Asp Leu660 665 670Thr Val Thr Ala Glu Thr Ala Asp Gly Leu Val Met Ala Val Glu His675 680 685Arg Arg Leu Pro Leu Ala Ala Val Gln Phe His Pro Glu Ser Ile Leu690 695 700Ser Leu Asp Gly Gly Ala Gly Leu Ala Leu Leu Gly Asn Val Met Asp705 710 715 720Arg Leu Ala Ala Gly Ala Leu Thr Asp Ala Ala Ala725 730<210>79<211>731<212>PRT<213>馬爾他布魯氏菌(Brucella melitensis)<400>79Met Asn Ala Lys Thr Ala Asp Ser Glu Ile Phe Gln His Glu Thr Ala1 5 10 15Gly Gly Ile Ile Val Glu Arg Val Arg His Leu Thr Ala Tyr Lys Gly20 25 30Ala Ile Glu Ser Tyr Ile Asp Val Leu Asn Glu Trp Arg Gly Ala Val35 40 45Phe Ser Ser Asn Tyr Glu Tyr Pro Gly Arg Tyr Thr Arg Trp Asp Thr50 55 60Ala Ile Val Asp Pro Pro Val Val Ile Thr Ser Arg Ala Arg Thr Met65 70 75 80Arg Ile Glu Ala Leu Asn Ala Arg Gly Val Ile Leu Leu Arg Pro Ile85 90 95Leu Asp Thr Val Lys Ala Leu Ser Glu Val Lys Ile Asp Gln Ser Gly100 105 110Glu Asn Arg Ile Asp Leu Thr Ile Val Glu Pro Val Gly Thr Phe Thr115 120 125
Glu Glu Glu Arg Ser Arg Met Pro Ser Val Phe Thr Val Leu Arg Ala130 135 140Ile Val Gly Leu Phe Phe Ser Glu Glu Asp Ala Asn Leu Gly Leu Tyr145 150 155 160Gly Ala Phe Gly Tyr Asp Leu Ala Phe Gln Phe Asp Pro Ile Gln Tyr165 170 175Lys Leu Lys Arg Pro Asp Asp Gln Arg Asp Leu Val Leu Phe Ile Pro180 185 190Asp Glu Ile Phe Val Ala Asp His Tyr Ala Ala Arg Ala Trp Val Asp195 200 205Arg Tyr Glu Phe Arg Cys Gly Gly Ser Ser Thr His Gly Leu Asp Arg210 215 220Ala Thr Pro Val Val Pro Phe Lys Pro Ser Glu Arg Lys Leu Ala Arg225 230 235 240Gly Asp His Asn Pro Gly Glu Tyr Ala Arg Leu Val Glu Arg Ala Lys245 250 255Glu Ser Phe Lys Arg Gly Asp Leu Phe Glu Val Val Pro Gly Gln Thr260 265 270Phe Tyr Glu Arg Cys His Thr Ala Pro Ser Glu Ile Phe Arg Arg Leu275 280 285Lys Ser Ile Asn Pro Ser Pro Tyr Ser Phe Phe Ile Asn Leu Gly Glu290 295 300Ser Glu Tyr Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Asn305 310 315 320Gly Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys Arg Gly325 330 335Glu Asp Ala Ile Ser Asp Ser Glu Gln Ile Leu Lys Leu Leu Asn Ser340 345 350Lys Lys Asp Glu Ser Glu Leu Thr Met Cys Ser Asp Val Asp Arg Asn355 360 365Asp Lys Ser Arg Val Cys Glu Pro Gly Ser Val Arg Val Ile Gly Arg370 375 380
Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp His Ile385 390 395 400Glu Gly Arg Leu Arg Asp Gly Met Asp Ala Phe Asp Gly Phe Leu Ser405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Arg Phe Leu Glu Glu Asn Glu Arg Ser Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Met Met His Phe Asn Gly Asp Met Asn Thr Gly Leu Thr450 455 460Leu Arg Thr Ile Arg Ile Lys Asp Gly Val Ala Glu Ile Arg Ala Gly465 470 475 480Ala Thr Leu Leu Phe Asp Ser Asn Pro Asp Glu Glu Glu Ala Glu Thr485 490 495Glu Leu Lys Ala Ser Ala Met Ile Ala Ala Val Arg Asp Ala Gln Lys500 505 510Ser Asn Gln Ile Ala Glu Glu Ser Val Ala Ala Lys Val Gly Glu Gly515 520 525Val Ser Ile Leu Leu Val Asp His Glu Asp Ser Phe Val His Thr Leu530 535 540Ala Asn Tyr Phe Arg Gln Thr Gly Ala Lys Val Ser Thr Val Arg Ser545 550 555 560Pro Val Ala Glu Glu Ile Phe Asp Arg Val Asn Pro Asp Leu Val Val565 570 575Leu Ser Pro Gly Pro Gly Ser Pro Gln Asp Phe Asp Cys Lys Ala Thr580 585 590Ile Asp Lys Ala Arg Lys Arg Gln Leu Pro Ile Phe Gly Val Cys Leu595 600 605Gly Leu Gln Ala Leu Ala Glu Ala Tyr Gly Gly Ala Leu Arg Gln Leu610 615 620Arg Val Pro Val His Gly Lys Pro Ser Arg Ile Arg Val Ser Lys Pro
625 630 635 640Glu Arg Ile Phe Ser Gly Leu Pro Glu Glu Val Thr Val Gly Arg Tyr645 650 655His Ser Ile Phe Ala Asp Pro Glu Arg Leu Pro Asp Asp Phe Leu Val660 665 670Thr Ala Glu Thr Glu Asp Gly Ile Ile Met Ala Phe Glu His Lys His675 680 685Glu Pro Val Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr Leu690 695 700Gly His Asn Ala Gly Met Arg Met Ile Glu Asn Ile Val Thr His Leu705 710 715 720Ala Gly Lys His Lys Ala Arg Arg Thr Asn Tyr725 730<210>80<211>735<212>PRT<213>念珠藻屬(Nostoc sp.)<400>80Met Ile Ala Asp Ser His Ser Tyr Arg Thr Asn Gly Asn Val Arg Val1 5 10 15Ser Arg Ser Ile Thr Gln Val Lys Met Glu Thr Ala Leu Glu Glu Ile20 25 30Leu Phe Tyr Leu Asn Ser Gln Arg Gly Gly Leu Leu Thr Ser Ser Tyr35 40 45Glu Tyr Pro Gly Arg Tyr Lys Arg Trp Ala Ile Gly Phe Val Asn Pro50 55 60Pro Val Glu Leu Ser Thr Ser Gly Asn Thr Phe Thr Leu Thr Ala Leu65 70 75 80Asn Glu Arg Gly Tyr Val Leu Leu Pro Val Ile Phe Glu Cys Leu Ser85 90 95Lys Ser Glu Gln Leu Gln Lys Leu Thr Glu His His His Lys Ile Thr100 105 110Gly Leu Val Lys Ser Thr Pro Glu Phe Phe Ala Glu Glu Glu Arg Ser
115 120 125Lys Gln Pro Ser Thr Phe Thr Val Ile Arg Glu Ile Leu His Ile Phe130 135 140Ser Ser Gln Glu Asp Glu His Leu Gly Leu Tyr Gly Ala Phe Gly Tyr145 150 155 160Asp Leu Val Phe Gln Phe Glu Gln Ile Thr Gln Cys Leu Glu Arg Pro165 170 175Gln Asp Gln Arg Asp Leu Val Leu Tyr Leu Pro Asp Glu Leu Ile Val180 185 190Val Asp Tyr Tyr Gln Gln Gln Ala Phe Arg Leu Glu Tyr Asp Phe Ile195 200 205Thr Ala His Gly Ser Thr Tyr Asp Leu Pro Arg Thr Gly Glu Ser Val210 215 220Asp Tyr Arg Gly Gln Cys Leu Thr Pro Pro Gln Asn Ala Asp His Lys225 230 235 240Ile Gly Glu Tyr Ala Lys Leu Val Glu Phe Ala Leu Asp Tyr Phe Arg245 250 255Arg Gly Asp Leu Phe Glu Val Val Pro Ser Gln Asn Phe Phe Thr Ala260 265 270Cys Glu Ala Pro Pro Ser G1n Leu Phe Glu Thr Leu Lys Gln Ile Asn275 280 285Pro Ser Pro Tyr Gly Phe Ile Phe Asn Leu Gly Gly Glu Tyr Ile Ile290 295 300Gly Ala Ser Pro Glu Met Phe Val Arg Val Glu Gly Arg Arg Val Glu305 310 315 320Thr Cys Pro Ile Ser Gly Thr Ile Thr Arg Gly His Asp Ala Ile Asp325 330 335Asp Ala Val Gln Ile Arg Gln Leu Leu Asn Ser His Lys Asp Glu Ala340 345 350Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn Asp Lys Ser Arg Ile355 360 365
Cys Glu Pro Gly Ser Val Lys Val Ile Gly Arg Arg Gln Ile Glu Leu370 375 380Tyr Ser His Leu Ile His Thr Val Asp His Val Glu Gly Ile Leu Arg385 390 395 400Pro Glu Phe Asp Ala Leu Asp Ala Phe Leu Ser His Thr Trp Ala Val405 410 415Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Ile Gln Phe Ile Glu Lys420 425 430Asn Glu Arg Ser Val Arg Arg Trp Tyr Gly Gly Ala Val Gly Tyr Leu435 440 445Asn Phe Asn Gly Asn Leu Asn Thr Gly Leu Ile Leu Arg Thr Ile Arg450 455 460Leu Gln Asp Ser Ile Ala Glu Val Arg Val Gly Ala Thr Leu Leu Tyr465 470 475 480Asp Ser Ile Pro Gln Ala Glu Glu Gln Glu Thr Ile Thr Lys Ala Ala485 490 495Ala Ala Phe Glu Thr Ile Arg Arg Ala Lys Gln Ile Asp Pro Gln Ile500 505 510Glu Glu Ser Ser Thr Arg Lys Leu Ser Lys Tyr Leu Pro Asp Gly Gln515 520 525Ser Gly Lys His Ile Leu Leu Ile Asp His Glu Asp Ser Phe Val His530 535 540Thr Leu Ala Asn Tyr Ile Arg Ser Thr Gly Ala Thr Val Thr Thr Leu545 550 555 560Arg His Gly Phe Ser Glu Ser Leu Phe Asp Thr Glu Arg Pro Asp Leu565 570 575Val Val Leu Ser Pro Gly Pro Gly Arg Pro Ser Glu Phe Lys Val Gln580 585 590Glu Thr Val Ala Ala Cys Val Arg Arg Gln Ile Pro Leu Phe Gly Val595 600 605Cys Leu Gly Leu Gln Gly Ile Val Glu Ala Phe Gly Gly Glu Leu Gly610 615 620
Val Leu Asn Tyr Pro Gln His Gly Lys Ser Ser Arg Ile Phe Val Thr625 630 635 640Ala Pro Asp Ser Val Met Phe Gln Asp Leu Pro Glu Ser Phe Thr Val645 650655Gly Arg Tyr His Ser Leu Phe Ala Leu Ser Gln Arg Leu Pro Lys Glu660 665 670Leu Lys Val Thr Ala Ile Ser Asp Asp Glu Val Ile Met Ala Ile Glu675 680 685His Gln Thr Leu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser Ile690 695 700Met Thr Leu Ala Gly Glu Val Gly Leu Met Met Ile Lys Asn Val Val705 710 715 720Gln Lys Tyr Thr Gln Ser Gln Gln Ser Thr Val Pro Ile Tyr Asp725 730 735<210>81<211>715<212>PRT<213>念珠藻屬(Nostoc sp.)<400>81Met Arg Val Ser Arg Ser Thr Thr Glu Val Lys Met Asp Thr Ala Leu1 5 10 15Asp Glu Ile Leu Phe His Leu Asn Gln Val Arg Gly Gly Leu Leu Thr20 25 30Ser Ser Tyr Glu Tyr Pro Gly Arg Tyr Lys Arg Trp Ala Ile Gly Phe35 40 45Ile Asn Pro Pro Leu Gln Leu Thr Thr Arg Glu Asn Ala Phe Thr Ile50 55 60Ser Ser Leu Asn Pro Arg Gly Gln Val Leu Leu Pro Thr Leu Phe Gln65 70 75 80His Leu Ser Ala Gln Ser Gln Leu Gln Gln Ile Ser Leu Asn His Asp85 90 95Tyr Ile Thr Gly Glu Ile Arg Pro Thr Lys Gln Leu Phe Thr Glu Glu100 105 110
Gln Arg Ser Lys Gln Pro Ser Ala Phe Thr Val Ile Arg Glu Ile Leu115 120 125Gln Ile Phe Ala Ser Asp Glu Asp Glu His Leu Gly Leu Tyr Gly Ala130 135 140Phe Gly Tyr Asp Leu Val Phe Gln Phe Glu Pro Ile Pro Gln Lys Ile145 150 155 160Ala Arg Pro Ala Asp Gln Arg Asp Leu Val Leu Tyr Leu Pro Asp Glu165 170 175Leu Ile Val Val Asp Tyr Tyr Leu Gln Lys Ala Tyr Arg His Gln Tyr180 185 190Glu Phe Ala Thr Glu His Gly Asn Thr Glu His Leu Pro Arg Thr Gly195 200 205Gln Ser Ile Asp Tyr Gln Gly Lys His Leu Leu Pro Asn Gln Thr Ala210 215 220Asp His Gln Pro Gly Glu Tyr Ala Asn Leu Val Glu Gln Ala Leu Asp225 230 235 240Tyr Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Ser Gln Asn Phe245 250 255Phe Thr Ala Cys Glu Gln Ser Pro Ser Gln Leu Phe Gln Thr Leu Arg260 265 270Gln Ile Asn Pro Ser Pro Tyr Gly Phe Leu Leu Asn Leu Gly Gly Glu275 280 285Tyr Leu Ile Gly Ala Ser Pro Glu Met Phe Val Arg Val Asp Gly Arg290 295 300Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Arg Arg Gly Glu Asp305 310 315 320Ala Leu Gly Asp Ala Val Gln Ile Arg Gln Leu Leu Ash Ser His Lys325 330 335Asp Glu Ala Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn Asp Lys340 345 350Ser Arg Ile Cys Glu Pro Gly Ser Val Arg Val Ile Gly Arg Arg Gln355 360 365
Ile Glu Leu Tyr Ser His Leu Ile His Thr Val Asp His Val Glu Gly370 375 380Ile Leu Arg Pro Glu Phe Asp Ala Leu Asp Ala Phe Leu Ser His Thr385 390 395 400Trp Ala Val Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Met Gln Phe405 410 415Ile Glu Gln His Glu Arg Ser Ala Arg Arg Trp Tyr Gly Gly Ala Val420 425 430Gly Tyr Leu Gly Phe Asn Gly Asn Leu Asn Thr Gly Leu Thr Leu Arg435 440 445Thr Ile Arg Leu Gln Asp Ser Ile Ala Glu Val Arg Val Gly Ala Thr450 455 460Val Leu Tyr Asp Ser Ile Pro Ser Ala Glu Glu Glu Glu Thr Ile Thr465 470 475 480Lys Ala Thr Ala Leu Phe Glu Thr Ile Arg Arg His Thr Thr Ala Asn485 490 495Lys Thr Gln Gly Asn Asp Ser His Arg Pro Gly Asp Ile Ala His Asn500 505 510Lys Arg Ile Leu Leu Ile Asp Tyr Glu Asp Ser Phe Val His Thr Leu515 520 525Ala Asn Tyr Ile Arg Thr Thr Gly Ala Thr Val Thr Thr Leu Arg His530 535 540Gly Phe Ala Glu Ser Tyr Phe Asp Ala Glu Arg Pro Asp Leu Val Val545 550 555 560Leu Ser Pro Gly Pro Gly Arg Pro Ser Asp Phe Arg Val Pro Gln Thr565 570 575Val Ala Ala Leu Val Gly Arg Glu Ile Pro Ile Phe Gly Val Cys Leu580 585 590Gly Leu Gln Gly Ile Val Glu Ala Phe Gly Gly Glu Leu Gly Val Leu595 600 605
Asp Tyr Pro Gln His Gly Lys Pro Ala Arg Ile Ser Val Thr Ala Pro610 615 620Asp Ser Val Leu Phe Gln Asn Leu Pro Ala Ser Phe Ile Val Gly Arg625 630 635 640Tyr His Ser Leu Phe Ala Gln Pro Gln Thr Ile Pro Gly Glu Leu Lys645 650 655Val Thr Ala Ile Ser Glu Asp Asn Val Ile Met Ala Ile Glu His Gln660 665 670Thr Leu Pro Ile Ala Ala Val Gln Phe His Pro Glu Ser Ile Met Thr675 680 685Leu Ala Gly Glu Val Gly Gln Thr Ile Ile Lys Asn Val Val Gln Thr690 695 700Tyr Thr Gln Thr Leu Glu Thr Ser Ile Tyr Ser705 710 715<210>82<211>719<212>PRT<213>血色紅假單胞菌(Rhodopseudomonas palustris)<400>82Met Asn Arg Thr Val Phe Ser Leu Pro Ala Thr Ser Asp Tyr Lys Thr1 5 10 15Ala Ala Gly Leu Ala Val Thr Arg Ser Ala Gln Pro Phe Ala Gly Gly20 25 30Gln Ala Leu Asp Glu Leu Ile Asp Leu Leu Asp His Arg Arg Gly Val35 40 45Met Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe Asp50 55 60Leu Gly Phe Ala Asp Pro Pro Leu Ala Leu Thr Thr Arg Ala Glu Lys65 70 75 80Phe Thr Ile Glu Ala Leu Asn Pro Arg Gly Arg Val Leu Ile Ala Phe85 90 95Leu Ser Asp Lys Leu Glu Glu Pro Cys Val Val Val Glu Gln Ala Cys100 105 110
Ala Thr Lys Ile Arg Gly His Ile Val Arg Gly Glu Ala Pro Val Asp115 120 125Glu Glu Gln Arg Thr Arg Arg Ala Ser Ala Ile Ser Leu Val Arg Ala130 135 140Val Ile Ala Ala Phe Ala Ser Pro Ala Asp Pro Met Leu Gly Leu Tyr145 150 155 160Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Phe Glu Asp Leu Lys Gln165 170 175Lys Arg Ala Arg Glu Ala Asp Gln Arg Asp Ile Val Leu Tyr Val Pro180 185 190Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Asp Ile195 200 205Ser Tyr Glu Phe Ala Trp Lys Gly Gln Ser Thr Ala Gly Leu Pro Asn210 215 220Glu Thr Ala Glu Ser Val Tyr Thr Gln Thr Gly Arg Gln Gly Phe Ala225 230 235 240Asp His Ala Pro Gly Asp Tyr Pro Lys Val Val Glu Lys Ala Arg Ala245 250 255Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu Phe260 265 270Gly Glu Pro Cys Glu Arg Ser Pro Ala Glu Val Phe Lys Arg Leu Cys275 280 285Arg Ile Ash Pro Ser Pro Tyr Gly Gly Leu Leu Asn Leu Gly Asp Gly290 295 300Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp Gly305 310 315 320Arg Arg Ile Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly Val325 330 335Asp Ala Ile Ser Asp Ala Glu Gln Ile Gln Lys Leu Leu Asn Ser Glu340 345 350Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn Asp355 360 365
Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg Arg370 375 380Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val Glu385 390 395 400Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr His405 410 415Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met Gln420 425 430Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly Ala435 440 445Phe Gly Val Val Gly Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr Ile450 455 460Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly Ala465 470 475 480Thr Cys Leu Phe Asp Ser Asn Pro Val Ala Glu Asp Lys Glu Cys Gln485 490 495Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Ala Lys500 505 510Pro Leu Ser Ala Val Ala Pro Asp Ala Thr Gly Ser Gly Lys Lys Val515 520 525Leu Leu Val Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp Tyr530 535 540Phe Arg Gln Val Gly Ala Gln Val Thr Val Val Arg Tyr Val His Gly545 550 555 560Leu Lys Met Leu Ala Glu Asn Ser Tyr Asp Leu Leu Val Leu Ser Pro565 570 575Gly Pro Gly Arg Pro Glu Asp Phe Lys Ile Lys Asp Thr Ile Asp Ala580 585 590Ala Leu Ala Lys Lys Leu Pro Ile Phe Gly Val Cys Leu Gly Val Gln595 600 605Ala Met Gly Glu Tyr Phe Gly Gly Thr Leu Gly Gln Leu Ala Gln Pro610 615 620
Ala His Gly Arg Pro Ser Arg Ile Gln Val Arg Gly Gly Ala Leu Met625 630 635 640Arg Gly Leu Pro Ash Glu Val Thr Ile Gly Arg Tyr His Ser Leu Tyr645 650 655Val Asp Met Arg Asp Met Pro Lys Glu Leu Thr Val Thr Ala Ser Thr660 665 670Asp Asp Gly Ile Ala Met Ala Ile Glu His Lys Thr Leu Pro Val Gly675 680 685Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu Val690 695 700Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Gly Gln Ala Ala705 710 715<210>83<211>2160<212>DNA<213>血色紅假單胞菌(Rhodopseudomonas palustris)<400>83atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc 60gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat120ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac180gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa240ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag300cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc360gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc420ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac480ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc540gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc600gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc660ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc720gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc780ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg840gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat900ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc960
cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc 1020gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg 1080tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt 1140ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag 1200ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc 1260accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc 1320ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc 1380ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc 1440acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg 1500gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac 1560gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg 1620ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc 1680ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg 1740ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc 1800ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag 1860ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg 1920cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc 1980gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc 2040gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc 2100ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa 2160<210>84<211>2190<212>DNA<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>84atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc gtttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190
<210>85<211>2190<212>DNA<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>85atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc gtatttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>86<211>2190<212>DNA<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>86atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg ttcaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>87<211>2190<212>DNA<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>87atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tgcaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190
<210>88<211>2190<212>DNA<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>88atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccttctatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>89<211>2190<212>DNA<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>89atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacgcgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>90<211>2190<212>DNA<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>90atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacgggt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190
<210>91<211>2190<212>DNA<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>91atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc ctggttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620
gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>92<211>2190<212>DNA<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>92atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggtttttaag tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cttcttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020
gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190<210>93<211>2190<212>DNA<213>人工序列<220>
<223>根瘤農(nóng)桿菌突變體.
<400>93atggtaacga tcattcagga tgacggagcg gagacctacg agacgaaagg cggcatccag 60gtcagccgaa agcgccggcc caccgattat gccaacgcca tcgataatta catcgaaaag120cttgattccc atcgcggcgc ggttttttcg tccaactatg aatatccggg ccgttacacc180cgctgggata cggccatcgt cgatccgccg ctcggcattt cctgttttgg ccgcaagatg240tggatcgaag cctataatgg ccgcggcgaa gtgctgctcg atttcattac ggaaaagctg300aaggcgacac ccgatctcac cctcggcgct tcctcgaccc gccggctcga tcttaccgtc360
aacgaaccgg accgtgtctt caccgaagaa gaacgctcga aaatcccgac ggtcttcacc420gctctcagag ccatcgtcga cctcttctat tcgagcgcgg attcggccat cggcctgttc480ggtgccttcg gttacgatct cgccttccag ttcgacgcga tcaagctttc gctggcgcgt540ccggaagacc agcgtgacat ggtgctgttt ctgcccgatg aaatcctcgt cgttgatcac600tattccgcca aggcctggat cgaccgttac gatttcgaga aggacggcat gacgacggac660ggcaaatcct ccgacattac ccccgatccc ttcaagacca ccgataccat cccgcccaag720ggcgatcacc gtcccggcga atattccgag cttgtggtga aggccaagga aagcttccgc780cgcggcgacc tgttcgaggt cgttcccggc cagaaattca tggagcgttg cgaaagcaat840ccgtcggcga tttcccgccg cctgaaggcg atcaacccgt cgccctattc cgccttcatc900aatctcggcg atcaggaata tctggtcggc gcctcgccgg aaatgttcgt gcgcgtctcc960ggccgtcgca tcgagacctg cccgatatca ggcaccatca agcgcggcga cgatccgatt 1020gccgacagcg agcagatttt gaaactgctc aactcgaaaa aggacgaatc cgaactgacc 1080atgtgctcgg acgtggaccg caacgacaag agccgcgtct gcgagccggg ttcggtgaag 1140gtcattggcc gccgccagat cgagatgtat tcacgcctca tccacaccgt cgatcacatc 1200gaaggccgcc tgcgcgacga tatggacgcc tttgacggtt tcctcagcca cgcctgggcc 1260gtcaccgtca ccggtgcacc aaagctgtgg gccatgcgct tcatcgaagg tcatgaaaag 1320agcccgcgcg cctggtatgg cggtgcgatc ggcatggtcg gcttcaacgg cgacatgaat 1380accggcctga cgctgcgcac catccggatc aaggacggta ttgccgaagt gcgcgccggc 1440gcgaccctgc tcaatgattc caacccgcag gaagaagaag ccgaaaccga actgaaggcc 1500tccgccatga tatcagccat tcgtgacgca aaaggcacca actctgccgc caccaagcgt 1560gatgccgcca aagtcggcac cggcgtcaag atcctgctcg tcgaccacga agacagcttc 1620gtgcacacgc tggcgaatta tttccgccag acgggcgcga cggtctcgac cgtcagatca 1680ccggtcgcag ccgacgtgtt cgatcgcttc cagccggacc tcgttgtcct gtcgcccgga 1740cccggcagcc cgacggattt cgactgcaag gcaacgatca aggccgcccg cgcccgcgat 1800ctgccgatct tcggcgtttg cctcggtctg caggcattgg cagaagccta tggcggcgag 1860ctgcgccagc ttgctgtgcc catgcacggc aagccttcgc gcatccgcgt gctggaaccc 1920ggcctcgtct tctccggtct cggcaaggaa gtcacggtcg gtcgttacca ttcgatcttc 1980gccgatcccg ccaccctgcc gcgtgatttc atcatcaccg cagaaagcga ggacggcacg 2040atcatgggca tcgaacacgc caaggaaccg gtggccgccg ttcagttcca cccggaatcg 2100atcatgacgc tcggacagga cgcgggcatg cggatgatcg agaatgtcgt ggtgcatctg 2160acccgcaagg cgaagaccaa ggccgcgtga2190
<210>94<211>1821<212>DNA<213>稻(0ryza sativa)<400>94atggagtcca tcgccgccgc cacgttcacg ccctcgcgcc tcgccgcccg ccccgccact 60ccggcggcgg cggcggcccc ggttagagcg agggcggcgg tagcggcagg agggaggagg120aggacgagta ggcgcggcgg cgtgaggtgc tccgcgggga agccagaggc aagcgcggtg180atcaacggga gcgcggcggc gcgggcggcg gaggaggaca ggaggcgctt cttcgaggcg240gcggagcgtg ggagcgggaa gggcaacctg gtgcccatgt gggagtgcat cgtctccgac300cacctcaccc ccgtgctcgc ctaccgctgc ctcgtccccg aggacaacat ggagacgccc360agcttcctct tcgagtccgt cgagcagggg cccgagggca ccaccaacgt cggtcgctat420agcatggtgg gagcccaccc agtgatggag gtcgtggcaa aggagcacaa ggtcacaatc480atggaccacg agaagggcaa ggtgacggag caggtcgtgg atgatcctat gcagatcccc540aggagcatga tggaaggatg gcacccgcag cagatcgatc agctccccga ttccttcacc600ggtggatggg tcgggttctt ttcctatgat acagtccgtt atgttgaaaa gaagaagctg660cccttctccg gtgctcccca ggacgatagg aaccttcctg atgttcacct tgggctttat720gatgatgttc tcgtcttcga caatgtcgag aagaaagtat atgtcatcca ttgggtaaat780cttgatcggc atgcaaccac cgaggatgca ttccaagatg gcaagtcccg gctgaacctg840ttgctatcta aagtgcacaa ttcaaatgta cccaagcttt ctccaggatt tgtaaagtta900cacactcggc agtttggtac acctttgaac aaatcaacca tgacaagtga tgagtacaag960aatgctgtta tgcaggctaa ggagcatatt atggctggtg atattttcca gattgtttta 1020agccagaggt ttgagaggca gacatacgcc aatccatttg aagtctatcg agctttacga 1080attgtgaacc caagtccata catggcatat gtacaggcaa gaggctgtgt cctggtagca 1140tctagtccag aaattcttac tcgtgtgagg aagggtaaaa ttattaaccg tccacttgct 1200gggactgttc gaaggggcaa gacagagaag gaagatgaaa tgcaagagca acaactacta 1260agtgatgaaa aacagtgtgc tgaacatatt atgcttgtag atttgggaag gaatgatgtt 1320ggaaaggtct ccaaacctgg atctgtgaag gtggagaaat taatgaacat tgaacgctac 1380tcccatgtca tgcacatcag ttccacggtg agtggagagt tggatgatca tctccaaagt 1440tgggatgccc tgcgagccgc gttgcctgtt ggaacagtta gtggagcacc aaaggtgaaa 1500gccatggagc tgatagacga gctagaggtc acaagacgag gaccatacag tggcggcctt 1560ggagggatat catttgacgg ggacatgctt atcgctcttg cactccgcac cattgtgttc 1620tcaacagcgc caagccacaa cacgatgtac tcatacaaag acaccgagag gcgccgggag 1680tgggtcgctc accttcaggc tggtgctggc attgtcgctg atagcagccc agacgacgag 1740
caacgtgaat gcgagaacaa ggcagccgct ctggctcgag ccatcgatct tgctgaatca 1800gctttcgtag acaaggaata g 1821<210>95<211>1498<212>DNA<213>稻(Oryza sativa)<400>95gaattcaaat tttttatata gagtatttct atacatgaat ttttctaact ttttgttttt 60taaaaaaaat ttgtgtggtg tactgtaata ggaagagaag aaggggagga ggaaggaggg120agaagaggga ggagtatatg gggagggggg gatgaactga tcgcccagcg tgatagctgg180cgatcgagca cccattagaa gggcccaata aaccctggat aattgtcatt gagtggcacc240tttcattgag aagacgttat taggaattgt agaagtggat aattatgcta tctgttgtat300tgagtgtcac tgtcaccgat aaagctttgc tggttaatgc attgtatttc tccatcaacg360cttcatgata caatggtatt tggacgtgtt tataaaataa tatacgtata atgtgggtgg420cctagcggcg gccggttaca catagcagcg atcggtccga tgctagtctt cattcattca480ggtatgtatt caggtatcag tgtgtgggtg atagtttttt tttttcgttt ttctagttac540gatatctcat atctcatagt tgtgatctta taaacttttt catgtttatc aatataaatt600tcgtgttatc tagtcgttaa aagaaccgta taatgtggca aaaaaaatgt ataatgtgtc660agagtttgca cgtgtttatc ttgctgcccc gaaacgatta attcagtgat ttggcaacaa720caaaatgtcg tggcggataa gcatatccgt cccaaaagga aaaaaagaaa aggaaaaata780atctttagaa ataaagccct tactttttcc aagaagcaga ggtaaccgta gctggtattc840cgcggctaac tcaatccctt tctctggagt cttggagcgg cacggcggct gcgcacccga900cctcgcccac cacctgctcg gcgaaacgcc cggctcggcc gcgacgtgtc ccaccgcacc960gcgcgcgcac ccgcgcgccc cgagcccctc gccgcctccg cgcgggcgcc gcacctattt 1020aaatgcggcc ccgatcccgc attctctcaa ctgcactagt ccccaccaac ggctcggtcc 1080agtagagttt atcccccacc tatggccagc ctcgtgctct ccctgcgcat cgcccgttcc 1140acgccgccgc tggggctggg cggggggcga ttccgcggcc gacgaggggc cgtcgcctgc 1200cgcgccgcca cgttccagca gctcgacgcc gtcggtgagt ctccgtatca aatgtggggg 1260ggcatgtctt ggtttgcgga ttggtgggtt gatttgaatg tgtgttctcg tggccgcagc 1320ggtgagggag gaggagtcca agttcaaggc gggggcggcg gagggttgca acatcctgcc 1380gctcaagcga tgcatcttct ccgaccacct cacgccggtg ctcgcgtacc gctgcctcgt 1440cagggaggac gaccgcgagg cgcccagctt cctgtttgag tccgtcgagc agggatcc 1498
<210>96<211>2073<212>DNA<213>玉米(Zea mays)<400>96gaattccgcc aaatcgggct atagatcaaa cgctgcactg tagggagcgt gaagccagcg 60gcgaatggaa tccctagccg ccacctccgt gttcgcgccc tcccgcgtcg ccgtcccggc120ggcgcgggcc ctggttaggg cggggacggt ggtaccaacc aggcggacga gcagccggag180cggaaccagc ggggtgaaat gctctgctgc cgtgacgccg caggcgagcc cagtgattag240caggagcgct gcggcggcga aggcggcgga ggaggacaag aggcggttct tcgaggcggc300ggcgcggggg agcgggaagg ggaacctggt gcccatgtgg gagtgcatca aggggaacct360ggtgcccatg tgggagtgca tcgtgtcgga ccatctcacc cccgtgctcg cctaccgctg420cctcgtcccc gaggacaacg tcgacgcccc cagcttcctc ttcgagtccg tcgagcaggg480gccccagggc accaccaacg tcggccgcta tagcatggtg ggagcccacc cagtgatgga540gattgtggcc aaagaccaca aggttacgat catggaccac gagaagagcc aagtgacaga600gcaggtagtg gacgacccga tgcagatccc gaggaccatg atggagggat ggcacccaca660gcagatcgac gagctccctg aatccttctc cggtggatgg gttgggttct tttcctatga720tacggttagg tatgttgaga agaagaagct accgttctcc agtgctcctc aggacgatag780gaaccttcct gatgtgcact tgggactcta tgatgatgtt ctagtcttcg ataatgttga840gaagaaagta tatgttatcc attgggtcaa tgtggaccgg catgcatctg ttgaggaagc900ataccaagat ggcaggtccc gactaaacat gttgctatct aaagtgcaca attccaatgt960ccccacactc tctcctggat ttgtgaagct gcacacacgc aagtttggta cacctttgaa 1020caagtcgacc atgacaagtg atgagtataa gaatgctgtt ctgcaggcta aggaacatat 1080tatggctggg gatatcttcc agattgtttt aagccagagg ttcgagagac gaacatatgc 1140caacccattt gaggtttatc gagcattacg gattgtgaat cctagcccat acatggcgta 1200tgtacaggca agaggctgtg tattggttgc gtctagtcct gaaattctta cacgagtcag 1260taaggggaag attattaatc gaccacttgc tggaactgtt cgaaggggca agacagagaa 1320ggaagatcaa atgcaagagc agcaactgtt aagtgatgaa aaacagtgtg ccgagcacat 1380aatgcttgtg gacttgggaa ggaatgatgt tggcaaggta tccaaaccag gaggatcagt 1440gaaggtggag aagttgatta ttgagagata ctcccatgtt atgcacataa gctcaacggt 1500tagtggacag ttggatgatc atctccagag ttgggatgcc ttgagagctg ccttgcccgt 1560tggaacagtc agtggtgcac caaaggtgaa ggccatggag ttgattgata agttggaagt 1620tacgaggcga ggaccatata gtggtggtct aggaggaata tcgtttgatg gtgacatgca 1680aattgcactt tctctccgca ccatcgtatt ctcaacagcg ccgagccaca acacgatgta 1740
ctcatacaaa gacgcagata ggcgtcggga gtgggtcgct catcttcagg ctggtgcagg 1800cattgttgcc gacagtagcc cagatgacga acaacgtgaa tgcgagaata aggctgctgc 1860actagctcgg gccatcgatc ttgcagagtc agcttttgtg aacaaagaat agtgtgctat 1920ggttatcgtt tagttcttgt tcatgtttct tttacccact ttccgttaaa aaaagatgtc 1980attagtgggt ggagaaaagc aataagactg ttctctagag aaccgaagaa atatggaaat 2040tgaggttatg gccggaattc ctgcagcccg ggg2073<210>97<211>504<212>DNA<213>小麥(Triticum aestivum)<400>97cccaaacagt ggtggcttag gagggatatc atttgatggt gacatgctta tcgctcttgc 60tctccgcacc attgtgtttt caacagctcc aagccccaat aggatgtact catacaaaag120ctcagatagg ccccgagagt gggttgctca tcttcaggct ggtgcgggca ttgttgctga180tagtatccca gacgatgagc aaaaagaatt tgagaataag gcggctgccc tagctcgggc240aattgatctt gcagagtcgg cttttttaga caaagaatag agtgtctatt aaattatttt300ttttagttgt tcatcatttt tcacccagtt cattttggaa agttgttcat cgttttttca360ccgagttcat attggggaaa aaaagcaata ccgttttgtt gtcctttgaa atgaataaat420ttgagctata ataagatgta ttttgctcat cgggcaaaaa aaaaaaaaaa aatataaaaa480aaaaaaaaaa aaaaaaaaaa aata 504<210>98<211>2161<212>DNA<213>煙草(Nicotiana tabacum)<400>98gtcaaaaatc cccatttcac cgtttcctcg tttctcctcc tcactaattt tgtctctttc 60tcttggtttg ctattgtgct cttgtaggaa tgcagtcgtt acctatctca taccggttgt120ttccggccac ccaccggaaa gttctgccat tcgccgtcat ttctagccgg agctcaactt180ctgcacttgc gcttcgtgtc cgtacactac aatgccgctg ccttcactct tcatctctag240ttatggatga ggacaggttc attgaagctt ctaaaagcgg gaacttgatt ccgctgcaca300aaaccatttt ttctgatcat ctgactccgg tgctggctta ccggtgtttg gtgaaagaag360acgaccgtga agctccaagc tttctctttg aatccgttga acctggtttt cgaggttcta420gtgttggtcg ctacagcgtg gtgggggctc aaccatctat ggaaattgtg gctaaggaac480acaatgtgac tatattggac caccacactg gaaaattgac ccagaagact gtccaagatc540
ccatgacgat tccgaggagt atttctgagg gatggaagcc cagactcatt gatgaacttc600ctgatacctt ttgtggtgga tgggttggtt atttctcata tgacacagtt cggtatgtag660agaacaggaa gttgccattc ctaagggctc cagaggatga ccggaacctt gcagatattc720aattaggact atacgaagat gtcattgtgt ttgatcatgt tgagaagaaa gcacatgtga780ttcactgggt gcagttggat cagtattcat ctcttcctga ggcatatctt gatgggaaga840aacgcttgga aatattagtg tctagagtac aaggaattga gtctccaagg ttatctcccg900gttctgtgga tttctgtact catgcttttg gaccttcatt aaccaaggga aacatgacaa960gtgaggagta caagaatgct gtcttacaag caaaggagca cattgctgca ggagacatat 1020ttcaaatcgt tttaagtcaa cgctttgaga gaagaacatt tgctgaccca tttgaagtgt 1080acagagcatt aagaattgtg aatccaagcc catatatgac ttacatacaa gccagaggct 1140gtattttagt tgcatcgagc ccagaaattt tgacacgtgt gaagaagaga agaattgtta 1200atcgaccact ggctgggaca agcagaagag ggaagacacc tgatgaggat gtgatgttgg 1260aaatgcagat gttaaaagat gagaaacaac gcgcagagca catcatgctg gttgatttag 1320gacgaaatga tgtaggaaag gtgtcaaaac ctggttctgt gaatgtcgaa aagctcatga 1380gcgttgagcg gtattcccat gtgatgcaca taagctccac ggtctctgga gagttgcttg 1440atcatttaac ctgttgggat gcactacgtg ctgcattgcc tgttgggacc gtcagtggag 1500caccaaaggt aaaggccatg gagttgattg atcagctaga agtagctcgg agagggcctt 1560acagtggtgg gtttggaggc atttcctttt caggtgacat ggacatcgca ctagctctaa 1620ggacgatggt attcctcaat ggagctcgtt atgacacaat gtattcatat acagatgcca 1680gcaagcgtca ggaatgggtt gctcatctcc aatccggggc tggaattgtg gctgatagta 1740atcctgatga ggaacagata gaatgcgaga ataaagtagc cggtctgtgc cgagccattg 1800acttggccga gtcagctttt gtaaagggaa gacacaaacc gtcagtcaag ataaatggtt 1860ctgtgccaaa tctattttca agggtacaac gtcaaacatc tgttatgtcg aaggacagag 1920tacatgagaa aagaaactag cgaatatgaa gatgtacata aattctaaag tggttttctt 1980gttcagttta atcttttact ggattgagac tgtagttgct gaagatagtt gtttagaatg 2040accttcattt tggtgttcct gaaaggacag tgcacatata tagcaaattg atcaaatgtt 2100taatccttgt atgcgggtga gaatcaatgc catcagcaat ttggaaaaaa aaaaaaaaaa 2160a 2161<210>99<211>606<212>PRT<213>稻(Oryza sativa)
<400>99Met Glu Ser Ile Ala Ala Ala Thr Phe Thr Pro Ser Arg Leu Ala Ala1 5 10 15Arg Pro Ala Thr Pro Ala Ala Ala Ala Ala Pro Val Arg Ala Arg Ala20 25 30Ala Val Ala Ala Gly Gly Arg Arg Arg Thr Ser Arg Arg Gly Gly Val35 40 45Arg Cys Ser Ala Gly Lys Pro Glu Ala Ser Ala Val Ile Asn Gly Ser50 55 60Ala Ala Ala Arg Ala Ala Glu Glu Asp Arg Arg Arg Phe Phe Glu Ala65 70 75 80Ala Glu Arg Gly Ser Gly Lys Gly Asn Leu Val Pro Met Trp Glu Cys85 90 95Ile Val Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val100 105 110Pro Glu Asp Asn Met Glu Thr Pro Ser Phe Leu Phe Glu Ser Val Glu115 120 125Gln Gly Pro Glu Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly130 135 140Ala His Pro Val Met Glu Val Val Ala Lys Glu His Lys Val Thr Ile145 150 155 160Met Asp His Glu Lys Gly Lys Val Thr Glu Gln Val Val Asp Asp Pro165 170 175Met Gln Ile Pro Arg Ser Met Met Glu Gly Trp His Pro Gln Gln Ile180 185 190Asp Gln Leu Pro Asp Ser Phe Thr Gly Gly Trp Val Gly Phe Phe Ser195 200 205Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Gly210 215 220Ala Pro Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr225 230 235 240Asp Asp Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile
245 250 255His Trp Val Asn Leu Asp Arg His Ala Thr Thr Glu Asp Ala Phe Gln260 265 270Asp Gly Lys Ser Arg Leu Ash Leu Leu Leu Ser Lys Val His Asn Ser275 280 285Asn Val Pro Lys Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Gln290 295 300Phe Gly Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys305 310 315 320Asn Ala Val Met Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe325 330 335Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Gln Thr Tyr Ala Asn Pro340 345 350Phe Glu Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met355 360 365Ala Tyr Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu370 375 380Ile Leu Thr Arg Val Arg Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala385 390 395 400Gly Thr Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Glu Met Gln Glu405 410 415Gln Gln Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu420 425 430Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Ser435 440 445Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His Val Met450 455 460His Ile Ser Ser Thr Val Ser Gly Glu Leu Asp Asp His Leu Gln Ser465 470 475 480Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala485 490 495
Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu Val Thr Arg500 505 510Arg Gly Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp515 520 525Met Leu Ile Ala Leu Ala Leu Arg Thr Ile Val Phe Ser Thr Ala Pro530 535 540Ser His Asn Thr Met Tyr Ser Tyr Lys Asp Thr Glu Arg Arg Arg Glu545 550 555 560Trp Val Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser565 570 575Pro Asp Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala580 585 590Arg Ala Ile Asp Leu Ala Glu Ser Ala Phe Val Asp Lys Glu595 600 605<210>100<211>67<212>PRT<213>稻(Oryza sativa)<400>100Met Cys Val Leu Val Ala Ala Ala Val Arg Glu Glu Glu Ser Lys Phe1 5 10 15Lys Ala Gly Ala Ala Glu Gly Cys Asn Ile Leu Pro Leu Lys Arg Cys20 25 30Ile Phe Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val35 40 45Arg Glu Asp Asp Arg Glu Ala Pro Ser Phe Leu Phe Glu Ser Val Glu50 55 60Gln Gly Ser65<210>101<211>525<212>PRT<213>玉米(Zea mays)<400>101Met Trp Glu Cys Ile Lys Gly Asn Leu Val Pro Met Trp Glu Cys Ile
1 5 10 15Val Ser Asp His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Pro20 25 30Glu Asp Asn Val Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Gln35 40 45Gly Pro Gln Gly Thr Thr Asn Val Gly Arg Tyr Ser Met Val Gly Ala50 55 60His Pro Val Met Glu Ile Val Ala Lys Asp His Lys Val Thr Ile Met65 70 75 80Asp His Glu Lys Ser Gln Val Thr Glu Gln Val Val Asp Asp Pro Met85 90 95Gln Ile Pro Arg Thr Met Met Glu Gly Trp His Pro Gln Gln Ile Asp100 105 110Glu Leu Pro Glu Ser Phe Ser Gly Gly Trp Val Gly Phe Phe Ser Tyr115 120 125Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe Ser Ser Ala130 135 140Pro Gln Asp Asp Arg Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp145 150 155 160Asp Val Leu Val Phe Asp Asn Val Glu Lys Lys Val Tyr Val Ile His165 170 175Trp Val Asn Val Asp Arg His Ala Ser Val Glu Glu Ala Tyr Gln Asp180 185 190Gly Arg Ser Arg Leu Asn Met Leu Leu Ser Lys Val His Asn Ser Asn195 200 205Val Pro Thr Leu Ser Pro Gly Phe Val Lys Leu His Thr Arg Lys Phe210 215 220Gly Thr Pro Leu Asn Lys Ser Thr Met Thr Ser Asp Glu Tyr Lys Asn225 230 235 240Ala Val Leu Gln Ala Lys Glu His Ile Met Ala Gly Asp Ile Phe Gln245 250 255
Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Tyr Ala Asn Pro Phe260 265 270Glu Val Tyr Arg Ala Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Ala275 280 285Tyr Val Gln Ala Arg Gly Cys Val Leu Val Ala Ser Ser Pro Glu Ile290 295 300Leu Thr Arg Val Ser Lys Gly Lys Ile Ile Asn Arg Pro Leu Ala Gly305 310 315 320Thr Val Arg Arg Gly Lys Thr Glu Lys Glu Asp Gln Met Gln Glu Gln325 330 335Gln Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu His Ile Met Leu Val340 345 350Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Pro Gly Gly Ser355 360 365Val Lys Val Glu Lys Leu Ile Ile Glu Arg Tyr Ser His Val Met His370 375 380Ile Ser Ser Thr Val Ser Gly Gln Leu Asp Asp His Leu Gln Ser Trp385 390 395 400Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro405 410 415Lys Val Lys Ala Met Glu Leu Ile Asp Lys Leu Glu Val Thr Arg Arg420 425 430Gly Pro Tyr Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met435 440 445Gln Ile Ala Leu Ser Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser450 455 460His Asn Thr Met Tyr Ser Tyr Lys Asp Ala Asp Arg Arg Arg Glu Trp465 470 475 480Val Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ser Pro485 490 495Asp Asp Glu Gln Arg Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg500 505 510
Ala Ile Asp Leu Ala Glu Ser Ala Phe Val Asn Lys Glu515 520 525<210>102<211>92<212>PRT<213>小麥(Triticum aestivum)<400>102Pro Asn Ser Gly Gly Leu Gly Gly Ile Ser Phe Asp Gly Asp Met Leu1 5 10 15Ile Ala Leu Ala Leu Arg Thr Ile Val Phe Ser Thr Ala Pro Ser Pro20 25 30Asn Arg Met Tyr Ser Tyr Lys Ser Ser Asp Arg Pro Arg Glu Trp Val35 40 45Ala His Leu Gln Ala Gly Ala Gly Ile Val Ala Asp Ser Ile Pro Asp50 55 60Asp Glu Gln Lys Glu Phe Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala65 70 75 80Ile Asp Leu Ala Glu Ser Ala Phe Leu Asp Lys Glu85 90<210>103<211>616<212>PRT<213>煙草(Nicotiana tabacum)<400>103Met Gln Ser Leu Pro Ile Ser Tyr Arg Leu Phe Pro Ala Thr His Arg1 5 10 15Lys Val Leu Pro Phe Ala Val Ile Ser Ser Arg Ser Ser Thr Ser Ala20 25 30Leu Ala Leu Arg Val Arg Thr Leu Gln Cys Arg Cys Leu His Ser Ser35 40 45Ser Leu Val Met Asp Glu Asp Arg Phe Ile Glu Ala Ser Lys Ser Gly50 55 60Asn Leu Ile Pro Leu His Lys Thr Ile Phe Ser Asp His Leu Thr Pro65 70 75 80
Val Leu Ala Tyr Arg Cys Leu Val Lys Glu Asp Asp Arg Glu Ala Pro85 90 95Ser Phe Leu Phe Glu Ser Val Glu Pro Gly Phe Arg Gly Ser Ser Val100 105 110Gly Arg Tyr Ser Val Val Gly Ala Gln Pro Ser Met Glu Ile Val Ala115 120 125Lys Glu His Asn Val Thr Ile Leu Asp His His Thr Gly Lys Leu Thr130 135 140Gln Lys Thr Val Gln Asp Pro Met Thr Ile Pro Arg Ser Ile Ser Glu145 150 155 160Gly Trp Lys Pro Arg Leu Ile Asp Glu Leu Pro Asp Thr Phe Cys Gly165 170 175Gly Trp Val Gly Tyr Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Asn180 185 190Arg Lys Leu Pro Phe Leu Arg Ala Pro Glu Asp Asp Arg Asn Leu Ala195 200 205Asp Ile Gln Leu Gly Leu Tyr Glu Asp Val Ile Val Phe Asp His Val210 215 220Glu Lys Lys Ala His Val Ile His Trp Val Gln Leu Asp Gln Tyr Ser225 230 235 240Ser Leu Pro Glu Ala Tyr Leu Asp Gly Lys Lys Arg Leu Glu Ile Leu245 250 255Val Ser Arg Val Gln Gly Ile Glu Ser Pro Arg Leu Ser Pro Gly Ser260 265 270Val Asp Phe Cys Thr His Ala Phe Gly Pro Ser Leu Thr Lys Gly Asn275 280 285Met Thr Ser Glu Glu Tyr Lys Asn Ala Val Leu Gln Ala Lys Glu His290 295 300Ile Ala Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu305 310 315 320Arg Arg Thr Phe Ala Asp Pro Phe Glu Val Tyr Arg Ala Leu Arg Ile325 330 335
Val Asn Pro Ser Pro Tyr Met Thr Tyr Ile Gln Ala Arg Gly Cys Ile340 345 350Leu Val Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys Lys Arg Arg355 360 365Ile Val Asn Arg Pro Leu Ala Gly Thr Ser Arg Arg Gly Lys Thr Pro370 375 380Asp Glu Asp Val Met Leu Glu Met Gln Met Leu Lys Asp Glu Lys Gln385 390 395 400Arg Ala Glu His Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly405 410 415Lys Val Ser Lys Pro Gly Ser Val Asn Val Glu Lys Leu Met Ser Val420 425 430Glu Arg Tyr Ser His Val Met His Ile Ser Ser Thr Val Ser Gly Glu435 440 445Leu Leu Asp His Leu Thr Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro450 455 460Val Gly Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile465 470 475 480Asp Gln Leu Glu Val Ala Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly485 490 495Gly Ile Ser Phe Ser Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr500 505 510Met Val Phe Leu Asn Gly Ala Arg Tyr Asp Thr Met Tyr Ser Tyr Thr515 520 525Asp Ala Ser Lys Arg Gln Glu Trp Val Ala His Leu Gln Ser Gly Ala530 535 540Gly Ile Val Ala Asp Ser Asn Pro Asp Glu Glu Gln Ile Glu Cys Glu545 550 555 560Asn Lys Val Ala Gly Leu Cys Arg Ala Ile Asp Leu Ala Glu Ser Ala565 570 575Phe Val Lys Gly Arg His Lys Pro Ser Val Lys Ile Asn Gly Ser Val
580 585 590Pro Asn Leu Phe Ser Arg Val Gln Arg Gln Thr Ser Val Met Ser Lys595 600 605Asp Arg Val His Glu Lys Arg Asn610 615<210>104<211>1776<212>DNA<213>陸地棉(Gossypium hirsutum)<220>
<221>misc_feature<223>α亞基.
<400>104atgcaggcat ccatgtcggt tacctcgacg aactccacat taccaatgcc agtgcaaagc 60agccttggat tctctcaccg cttccttcct tcatctcatc ggttttctca acttccgatc120acccgctttt ctcccgctcc tacttcactc aaatgcaggg gctctctttc aagctttcca180cttgttaatg atgaaaagaa gtttgtggag gcggccaaaa aagcaaattt agtccccctt240tatcgttgca ttttctctga tcaactgact ccagtgcttg cataccggtg tttggttaaa300gaagatgata gagaggctcc aagttttctc tttgagtcag tggagcctgg ttctcgggtt360tctagtgttg gtcgatatag cgtggttgga gctcaaccga caatggaaat tgtggcaaaa420gaaaacaaag ttatgattat ggatcatgag gcagggaatt tgactgagga ggtcgttgag480gatccgatgt gtattcccaa gagaatctca gagacttgga aaccccgact tgttgaagat540cttcctgatg cgttttgtgg tggatgggtt ggttatttct cctatgatac agttcgttat600gtggagaaga aaaagcttcc gttcactaag gcaccacgtg atgacagaaa cctgccagat660atacatctag gactctacaa cgacgtgatt gtatttgatc atgtggaaaa gaaagcatat720ataattcact gggtgaggct agataaacac tcgtctgttg agaaagctta taatgaagga780gttgaacacc tagagaaatt ggtagctaga gtacaagatg ttgagctacc aaagctatct840ccaggctctg tagcattaca aacccatcac tttggccctt ctttaaagaa ctcaaatatg900gaaaaggaag agttcaagaa agctgtactg aaagcgaaag agcatattct ggcaggggat960attttccaga ttgtattaag ccaacgtttt gaacggagaa catttgctga cccctttgaa 1020atatatagag ctttgcgagt tgtgaatcca agtccatata tggcctactt gcaagctaga 1080ggaagtattc tagttgcttc aagtcccgaa attcttacca gggtaaagaa gaataagatt 1140gtgaataggc cattggctgg aacaacaagg agaggaaaga ctcaggctga agatgagctg 1200gcagaaaagc tattgctaag taatgaaaag gaatgtgcag aacacatcat gcttgttgat 1260
ttgggtcgca atgatgttgg aaaggtctcc aaatatggtt ctgtaaaggt ggagaagctg 1320atgaatattg aacgatattc ccatgtgatg cacataagct ccacggttac tggtgagttg 1380caggatcatc tcactagttg ggatgtcctc cgtgctgcac ttcccgttgg aactgttagt 1440ggagcaccaa aggtgaaggc gatggagcta atcgatgagt tagaggtgtc aagacgaggt 1500ccttatagcg gaggatttgg gggcatttcc ttcactgggg atatggatat tgcgttggct 1560ctcaggacca tggtattccc tacaggtagc cgctatgaca caatgtactc atacaaaggt 1620tccagcagac gccaagaatg ggtagcttat cttcaagccg gcgctggtgt agttgcagac 1680agtgatcctg atgccgagca cctcgaatgt caaaacaaag ctgctggcct tgctcgttcc 1740attgacctag cggaggctgc attcgttcat aaatga 1776<210>105<211>843<212>DNA<213>陸地棉(Gossypium hirsutum)<220>
<221>misc_feature<223>β亞基.
<400>105atggcagcta atattataac ccaatcatct ctgcttcagc caaaacctgc actttctgct 60aaaacccttc aaatcccatc tctgcatcgc ttatccggcc tccctcctcc atcaagggtt120ggcttttttc tggaaaagaa aacggggatt gttggaaaag ctccattaaa atcggctgta180tcggactcaa cctcgtcagt tttggagaac aagaaaaaca gcaagaatcc cattgtcgtc240attgacaatt acgacagttt cacttacaat ctttgccagt atattggaga gcttggatgt300tacttcgagg tttttcgaaa tgacgaatta actgtagaag acttaaaaat gaaaaaccct360aggggagtgc ttatctctcc tggtccagga acaccccaag attccggaat atcactgcag420actgttttgg aacttggacc tactgtacct ttgtttggtg tttgtatggg tttgcagtgc480attggtgagg cttttggagg aaagatagtg cgttctccct atggtgttat gcatggcaaa540agttcccctg tatattatga cgaaaagggg gaagacggtt tgttatctgg attgtcaaac600cctttcaatg ctggcagata tcatagcctc gtgattgaaa aggacagttt ccctgaggaa660gcacttgagg ttactgcttg gacagaagat ggactgataa tggctgctag gcacaaagtt720tataagcatc tgcagggtgt tcaattccat ccagagagca tcataacctc tgaaggaaaa780acaattgttc ggaatttcat caaactaatc gagagaaagg aggtggcagg atccaagaat840tag 843
<210>106<211>1704<212>DNA<213>大豆(Glycine max)<220>
<221>misc_feature<223>α亞基.
<400>106atggcgactg ttccgcaccc attatccctc gcaagtgtag gttttgctaa ccgaacctcc 60tccatctcca gatccactct caaatgctgc gctcaatctc cttctccttc actagttgac120aacgcccaga agtttctcga agcttccaag aaggggaacg tcattcctct cttccgctgc180atattttccg atcacctcac tccggtgctt gcgtaccggt gcctggttaa ggaggacgag240agagatgctc cgagttttct ctttgaatcg gtcgagccag gccaaatttc tagcatcgga300cggtacagtg tggttggagc acagccgtgt atggaaattg tggcgaaaga gaacgtggtt360actattatgg accacgtgga agggcgcagg agtgaggaaa ttgtagagga tcctctggtg420attcctcgta ggatcatgga gaagtggacg cctcaactct tagatgaact tcctgaagcg480ttttgtggtg gttgggtagg gtatttctct tatgatacaa tgcgctatgt agaaaagaag540aaacttccat tttctaatgc cccagtagat gacagaaacc ttcctgatgt tcatctgggc600ctttatgaca gtgtgattgt gtttgatcat gttgaaaaga aagcatatgt gattcattgg660gttcgggtgg atcgatattc ttcagctgag gaggccttcg aagatggaag gaaccggctg720gaaactctag tatctcgggt gcatgatata attaccccaa ggctgcctac aggttcgata780aagttataca ctcgtctctt tggtcctaaa ctggagatgt caaacatgac aaatgaggag840tataagaggg cagtattgaa ggctaaagag cacatacggg ctggtgatat ttttcaaatt900gtactaagtc aacgttttga acagagaact tttgcagacc catttgaaat ctacagagca960ttgaggattg ttaatcctag tccatatatg acttatttac aggccagagg aagtattttg 1020gttgcttcaa gtccagaaat tcttacacgg gtgaagaaga gaaagatcac caatcggccc 1080cttgctggta ctgttagaag aggaaaaaca ccaaaagaag atatcatgtt ggagaaacaa 1140cttttgaatg atgaaaagca atgtgcagag cacgtaatgc tagttgattt ggggagaaat 1200gatgttggaa aggtctccaa accgggttct gttcaagttg aaaagcttat gaatattgag 1260cgctattccc atgttatgca catcagctca acagtcacag gggagttatt agatcactta 1320acaagctggg atgcattgcg tgctgcttta cctgttggta cagttagcgg agcaccgaag 1380gtcaaagcca tgcagttgat tgatgagttg gaagtcgcaa gaagggggcc ctatagtggg 1440ggatttggag gtatatcatt caatggcgat atggacatag cccttgctct gaggaccata 1500gttttcccta caaatgctcg ttatgacaca atgtactcct acaaggataa gaacaaacgc 1560
agagaatggg ttgcccatct ccaggctgga gcgggaattg tggctgacag tgatcctgct 1620gatgaacaaa gagagtgcga gaacaaagct gcagctcttg ctcgtgccat tgatcttgca 1680gaatcttcat ttgttgataa ataa 1704<210>107<21l>837<212>DNA<213>大豆(Glycine max)<220>
<221>misc_feature<223>β亞基.
<400>107atggctgcca cattcttctc tcacttgtcg cttcttcaat ccaacaacaa cccttctctc 60tctcacacac cctctcgctt ccctcattct ctcaccaacc gtgtcaaacc ctccctcggt120gtggtatctg tggccaaaag ggtaagtgga gtggtgccaa aggccaattt gaatgccttg180gaggccaatt cgggtttccc catttcggct aagaagtcca acaacaaccc cattgttgtt240attgacaact atgacagttt cacctataat ctttgccagt atatggggga gttagggttt300cactttgagg tctaccgcaa tgatgagttg acagtggagg agttaagaag gaaaaatccc360agaggagtgc tgatatcacc tgggccagga gaacctcaag attcaggcat atctttgcaa420acggttttgg aacttggacc aactgtgcca ttgtttggtg tgtgcatggg tttgcaatgc480attggagagg cttttggagg gaagattgtt cgttctcctc atggtgttat gcatggaaaa540agctctatgg tttactatga tgagaaagga gaagatggat tacttgctgg actatcaaat600cctttcttgg ctggtagata tcacagcctt gtaattgaaa aagagagctt tcctcatgat660gaacttgagg caacagcatg gacagaagat ggtcttataa tggctgctcg tcataagaaa720tataagcatc tacagggtgt tcagtttcat ccagagagca tcataacccc agaaggcaag780acaattgtcc gtaattttgt caagcttatc gagaaaaggg aggctggtgg ctcttga 837<210>108<211>591<212>PRT<213>陸地棉(Gossypium hirsutum)<220>
<221>MISC_FEATURE<223>α亞基.
<400>108Met Gln Ala Ser Met Ser Val Thr Ser Thr Asn Ser Thr Leu Pro Met1 5 10 15
Pro Val Gln Ser Ser Leu Gly Phe Ser His Arg Phe Leu Pro Ser Ser20 25 30His Arg Phe Ser Gln Leu Pro Ile Thr Arg Phe Ser Pro Ala Pro Thr35 40 45Ser Leu Lys Cys Arg Gly Ser Leu Ser Ser Phe Pro Leu Val Asn Asp50 55 60Glu Lys Lys Phe Val Glu Ala Ala Lys Lys Ala Asn Leu Val Pro Leu65 70 75 80Tyr Arg Cys Ile Phe Ser Asp Gln Leu Thr Pro Val Leu Ala Tyr Arg85 90 95Cys Leu Val Lys Glu Asp Asp Arg Glu Ala Pro Ser Phe Leu Phe Glu100 105 110Ser Val Glu Pro Gly Ser Arg Val Ser Ser Val Gly Arg Tyr Ser Val115 120 125Val Gly Ala Gln Pro Thr Met Glu Ile Val Ala Lys Glu Asn Lys Val130 135 140Met Ile Met Asp His Glu Ala Gly Asn Leu Thr Glu Glu Val Val Glu145 150 155 160Asp Pro Met Cys Ile Pro Lys Arg Ile Ser Glu Thr Trp Lys Pro Arg165 170 175Leu Val Glu Asp Leu Pro Asp Ala Phe Cys Gly Gly Trp Val Gly Tyr180 185 190Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Lys Lys Lys Leu Pro Phe195 200 205Thr Lys Ala Pro Arg Asp Asp Arg Asn Leu Pro Asp Ile His Leu Gly210 215 220Leu Tyr Asn Asp Val Ile Val Phe Asp His Val Glu Lys Lys Ala Tyr225 230 235 240Ile Ile His Trp Val Arg Leu Asp Lys His Ser Ser Val Glu Lys Ala245 250 255Tyr Asn Glu Gly Val Glu His Leu Glu Lys Leu Val Ala Arg Val Gln260 265 270
Asp Val Glu Leu Pro Lys Leu Ser Pro Gly Ser Val Ala Leu Gln Thr275 280 285His His Phe Gly Pro Ser Leu Lys Asn Ser Asn Met Glu Lys Glu Glu290 295 300Phe Lys Lys Ala Val Leu Lys Ala Lys Glu His Ile Leu Ala Gly Asp305 310 315 320Ile Phe Gln Ile Val Leu Ser Gln Arg Phe Glu Arg Arg Thr Phe Ala325 330 335Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Val Val Asn Pro Ser Pro340 345 350Tyr Met Ala Tyr Leu Gln Ala Arg Gly Ser Ile Leu Val Ala Ser Ser355 360 365Pro Glu Ile Leu Thr Arg Val Lys Lys Asn Lys Ile Val Asn Arg Pro370 375 380Leu Ala Gly Thr Thr Arg Arg Gly Lys Thr Gln Ala Glu Asp Glu Leu385 390 395 400Ala Glu Lys Leu Leu Leu Ser Asn Glu Lys Glu Cys Ala Glu His Ile405 410 415Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser Lys Tyr420 425 430Gly Ser Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr Ser His435 440 445Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Gln Asp His Leu450 455 460Thr Ser Trp Asp Val Leu Arg Ala Ala Leu Pro Val Gly Thr Val Ser465 470 475 480Gly Ala Pro Lys Val Lys Ala Met Glu Leu Ile Asp Glu Leu Glu Val485 490 495Ser Arg Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser Phe Thr500 505 510Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Met Val Phe Pro Thr515 520 525
Gly Ser Arg Tyr Asp Thr Met Tyr Ser Tyr Lys Gly Ser Ser Arg Arg530 535 540Gln Glu Trp Val Ala Tyr Leu Gln Ala Gly Ala Gly Val Val Ala Asp545 550 555 560Ser Asp Pro Asp Ala Glu His Leu Glu Cys Gln Asn Lys Ala Ala Gly565 570 575Leu Ala Arg Ser Ile Asp Leu Ala Glu Ala Ala Phe Val His Lys580 585 590<210>109<211>280<212>PRT<213>陸地棉(Gossypium hirsutum)<220>
<221>MISC_FEATURE<223>β亞基.
<400>109Met Ala Ala Asn Ile Ile Thr Gln Ser Ser Leu Leu Gln Pro Lys Pro1 5 10 15Ala Leu Ser Ala Lys Thr Leu Gln Ile Pro Ser Leu His Arg Leu Ser20 25 30Gly Leu Pro Pro Pro Ser Arg Val Gly Phe Phe Leu Glu Lys Lys Thr35 40 45Gly Ile Val Gly Lys Ala Pro Leu Lys Ser Ala Val Ser Asp Ser Thr50 55 60Ser Ser Val Leu Glu Asn Lys Lys Asn Ser Lys Asn Pro Ile Val Val65 70 75 80Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys Gln Tyr Ile Gly85 90 95Glu Leu Gly Cys Tyr Phe Glu Val Phe Arg Asn Asp Glu Leu Thr Val100 105 110Glu Asp Leu Lys Met Lys Asn Pro Arg Gly Val Leu Ile Ser Pro Gly115 120 125Pro Gly Thr Pro Gln Asp Ser Gly Ile Ser Leu Gln Thr Val Leu Glu
130 135 140Leu Gly Pro Thr Val Pro Leu Phe Gly Val Cys Met Gly Leu Gln Cys145 150 155 160Ile Gly Glu Ala Phe Gly Gly Lys Ile Val Arg Ser Pro Tyr Gly Val165 170 175Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu Lys Gly Glu Asp180 185 190Gly Leu Leu Ser Gly Leu Ser Asn Pro Phe Asn Ala Gly Arg Tyr His195 200 205Ser Leu Val Ile Glu Lys Asp Ser Phe Pro Glu Glu Ala Leu Glu Val210 215 220Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg His Lys Val225 230 235 240Tyr Lys His Leu Gln Gly Val Gln Phe His Pro Glu Ser Ile Ile Thr245 250 255Ser Glu Gly Lys Thr Ile Val Arg Asn Phe Ile Lys Leu Ile Glu Arg260 265 270Lys Glu Val Ala Gly Ser Lys Asn275 280<210>110<211>567<212>PRT<213>大豆(Glycine max)<220>
<221>MISC_FEATURE<223>α亞基.
<400>110Met Ala Thr Val Pro His Pro Leu Ser Leu Ala Ser Val Gly Phe Ala1 5 10 15Asn Arg Thr Ser Ser Ile Ser Arg Ser Thr Leu Lys Cys Cys Ala Gln20 25 30Ser Pro Ser Pro Ser Leu Val Asp Asn Ala Gln Lys Phe Leu Glu Ala35 40 45
Ser Lys Lys Gly Asn Val Ile Pro Leu Phe Arg Cys Ile Phe Ser Asp50 55 60His Leu Thr Pro Val Leu Ala Tyr Arg Cys Leu Val Lys Glu Asp Glu65 70 75 80Arg Asp Ala Pro Ser Phe Leu Phe Glu Ser Val Glu Pro Gly Gln Ile85 90 95Ser Ser Ile Gly Arg Tyr Ser Val Val Gly Ala Gln Pro Cys Met Glu100 105 110Ile Val Ala Lys Glu Asn Val Val Thr Ile Met Asp His Val Glu Gly115 120 125Arg Arg Ser Glu Glu Ile Val Glu Asp Pro Leu Val Ile Pro Arg Arg130 135 140Ile Met Glu Lys Trp Thr Pro Gln Leu Leu Asp Glu Leu Pro Glu Ala145 150 155 160Phe Cys Gly Gly Trp Val Gly Tyr Phe Ser Tyr Asp Thr Met Arg Tyr165 170 175Val Glu Lys Lys Lys Leu Pro Phe Ser Asn Ala Pro Val Asp Asp Arg180 185 190Asn Leu Pro Asp Val His Leu Gly Leu Tyr Asp Ser Val Ile Val Phe195 200 205Asp His Val Glu Lys Lys Ala Tyr Val Ile His Trp Val Arg Val Asp210 215 220Arg Tyr Ser Ser Ala Glu Glu Ala Phe Glu Asp Gly Arg Asn Arg Leu225 230 235 240Glu Thr Leu Val Ser Arg Val His Asp Ile Ile Thr Pro Arg Leu Pro245 250 255Thr Gly Ser Ile Lys Leu Tyr Thr Arg Leu Phe Gly Pro Lys Leu Glu260 265 270Met Ser Asn Met Thr Asn Glu Glu Tyr Lys Arg Ala Val Leu Lys Ala275 280 285Lys Glu His Ile Arg Ala Gly Asp Ile Phe Gln Ile Val Leu Ser Gln290 295 300
Arg Phe Glu Gln Arg Thr Phe Ala Asp Pro Phe Glu Ile Tyr Arg Ala305 310 315 320Leu Arg Ile Val Asn Pro Ser Pro Tyr Met Thr Tyr Leu Gln Ala Arg325 330 335Gly Ser Ile Leu Val Ala Ser Ser Pro Glu Ile Leu Thr Arg Val Lys340 345 350Lys Arg Lys Ile Thr Asn Arg Pro Leu Ala Gly Thr Val Arg Arg Gly355 360 365Lys Thr Pro Lys Glu Asp Ile Met Leu Glu Lys Gln Leu Leu Asn Asp370 375 380Glu Lys Gln Cys Ala Glu His Val Met Leu Val Asp Leu Gly Arg Asn385 390 395 400Asp Val Gly Lys Val Ser Lys Pro Gly Ser Val Gln Val Glu Lys Leu405 410 415Met Asn Ile Glu Arg Tyr Ser His Val Met His Ile Ser Ser Thr Val420 425 430Thr Gly Glu Leu Leu Asp His Leu Thr Ser Trp Asp Ala Leu Arg Ala435 440 445Ala Leu Pro Val Gly Thr Val Ser Gly Ala Pro Lys Val Lys Ala Met450 455 460Gln Leu Ile Asp Glu Leu Glu Val Ala Arg Arg Gly Pro Tyr Ser Gly465 470 475 480Gly Phe Gly Gly Ile Ser Phe Asn Gly Asp Met Asp Ile Ala Leu Ala485 490 495Leu Arg Thr Ile Val Phe Pro Thr Asn Ala Arg Tyr Asp Thr Met Tyr500 505 510Ser Tyr Lys Asp Lys Asn Lys Arg Arg Glu Trp Val Ala His Leu Gln515 520 525Ala Gly Ala Gly Ile Val Ala Asp Ser Asp Pro Ala Asp Glu Gln Arg530 535 540Glu Cys Glu Asn Lys Ala Ala Ala Leu Ala Arg Ala Ile Asp Leu Ala545 550 555 560
Glu Ser Ser Phe Val Asp Lys565<210>111<211>278<212>PRT<213>大豆(Glycine max)<220>
<221>MISC_FEATURE<223>β亞基.
<400>111Met Ala Ala Thr Phe Phe Ser His Leu Ser Leu Leu Gln Ser Asn Asn1 5 10 15Asn Pro Ser Leu Ser His Thr Pro Ser Arg Phe Pro His Ser Leu Thr20 25 30Asn Arg Val Lys Pro Ser Leu Gly Val Val Ser Val Ala Lys Arg Val35 40 45Ser Gly Val Val Pro Lys Ala Asn Leu Asn Ala Leu Glu Ala Asn Ser50 55 60Gly Phe Pro Ile Ser Ala Lys Lys Ser Asn Asn Asn Pro Ile Val Val65 70 75 80Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys Gln Tyr Met Gly85 90 95Glu Leu Gly Phe His Phe Glu Val Tyr Arg Asn Asp Glu Leu Thr Val100 105 110Glu Glu Leu Arg Arg Lys Asn Pro Arg Gly Val Leu Ile Ser Pro Gly115 120 125Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln Thr Val Leu Glu130 135 140Leu Gly Pro Thr Val Pro Leu Phe Gly Val Cys Met Gly Leu Gln Cys145 150 155 160Ile Gly Glu Ala Phe Gly Gly Lys Ile Val Arg Ser Pro His Gly Val165 170 175Met His Gly Lys Ser Ser Met Val Tyr Tyr Asp Glu Lys Gly Glu Asp
180 185 190Gly Leu Leu Ala Gly Leu Ser Asn Pro Phe Leu Ala Gly Arg Tyr His195 200 205Ser Leu Val Ile Glu Lys Glu Ser Phe Pro His Asp Glu Leu Glu Ala210 215 220Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg His Lys Lys225 230 235 240Tyr Lys His Leu Gln Gly Val Gln Phe His Pro Glu Ser Ile Ile Thr245 250 255Pro Glu Gly Lys Thr Ile Val Arg Asn Phe Val Lys Leu Ile Glu Lys260 265 270Arg Glu Ala Gly Gly Ser275<210>112<211>2210<212>DNA<213>大豆(Glycine max)<220>
<221>3′UTR<222>(1919)..(2210)<223>
<220>
<221>misc_feature<223>α亞基.
<220>
<221>5′UTR<222>(1)..(214)<223>
<400>112aaagaaatga cctgaagtct ctatatattc caggtaacga agaccttagc aacccaatga 60acgcgtcccc atgaacggca cgtgtagcgg agtactaggc cgccgttaca cgctactgct120gtccgtcgtc accgtttgaa ttacccaccg ctactttgtc gtcattcttc ttcttcttcc180cttttcattg accttttcct tccttcgtcc tccaatggcg actgttccgc acccattatc240cctcgcaagt gtaggttttg ctaaccgaac ctcctccatc tccagatcca ctctcaaatg300ctgcgctcaa tctccttctc cttcactagt tgacaacgcc cagaagtttc tcgaagcttc360caagaagggg aacgtcattc ctctcttccg ctgcatattt tccgatcacc tcactccggt420gcttgcgtac cggtgcctgg ttaaggagga cgagagagat gctccgagtt ttctctttga480
atcggtcgag ccaggccaaa tttctagcat cggacggtac agtgtggttg gagcacagcc540gtgtatggaa attgtggcga aagagaacgt ggttactatt atggaccacg tggaagggcg600caggagtgag gaaattgtag aggatcctct ggtgattcct cgtaggatca tggagaagtg660gacgcctcaa ctcttagatg aacttcctga agcgttttgt ggtggttggg tagggtattt720ctcttatgat acaatgcgct atgtagaaaa gaagaaactt ccattttcta atgccccagt780agatgacaga aaccttcctg atgttcatct gggcctttat gacagtgtga ttgtgtttga840tcatgttgaa aagaaagcat atgtgattca ttgggttcgg gtggatcgat attcttcagc900tgaggaggcc ttcgaagatg gaaggaaccg gctggaaact ctagtatctc gggtgcatga960tataattacc ccaaggctgc ctacaggttc gataaagtta tacactcgtc tctttggtcc 1020taaactggag atgtcaaaca tgacaaatga ggagtataag agggcagtat tgaaggctaa 1080agagcacata cgggctggtg atatttttca aattgtacta agtcaacgtt ttgaacagag 1140aacttttgca gacccatttg aaatctacag agcattgagg attgttaatc ctagtccata 1200tatgacttat ttacaggcca gaggaagtat tttggttgct tcaagtccag aaattcttac 1260acgggtgaag aagagaaaga tcaccaatcg gccccttgct ggtactgtta gaagaggaaa 1320aacaccaaaa gaagatatca tgttggagaa acaacttttg aatgatgaaa agcaatgtgc 1380agagcacgta atgctagttg atttggggag aaatgatgtt ggaaaggtct ccaaaccggg 1440ttctgttcaa gttgaaaagc ttatgaatat tgagcgctat tcccatgtta tgcacatcag 1500ctcaacagtc acaggggagt tattagatca cttaacaagc tgggatgcat tgcgtgctgc 1560tttacctgtt ggtacagtta gcggagcacc gaaggtcaaa gccatgcagt tgattgatga 1620gttggaagtc gcaagaaggg ggccctatag tgggggattt ggaggtatat cattcaatgg 1680cgatatggac atagcccttg ctctgaggac catagttttc cctacaaatg ctcgttatga 1740cacaatgtac tcctacaagg ataagaacaa acgcagagaa tgggttgccc atctccaggc 1800tggagcggga attgtggctg acagtgatcc tgctgatgaa caaagagagt gcgagaacaa 1860agctgcagct cttgctcgtg ccattgatct tgcagaatct tcatttgttg ataaataatt 1920tggattgatc catcatcagt gatgctcctt gataactgag gggcatcctt tttaaatggt 1980agagaggaag tttgtggtgt gggcagatga taggggatat gaattacgga gaatctgaaa 2040ctttgataat gttatgacag aagtgatgaa cataataagg tatttaatga taatgacagc 2100tttgtgactt tagttaagtc gtcgtttaag agacttcaat agccatttcc gtcggtccat 2160cttaaaccaa agaaaggtgc ctttgacgga gtttcttttg ctatcataaa 2210<210>113<211>988<212>DNA
<213>大豆(Glycine max)<220>
<221>3′UTR<222>(926)..(988)<223>
<220>
<221>misc_feature<223>β亞基.
<220>
<221>5′UTR<222>(1)..(88)<223>
<400>113actcggctat gcatccaacg cgttgggagc tctcccatat ggtcgacctg caggcggccg 60cgaattcact agtgattaac atttgaacat ggctgccaca ttcttctctc acttgtcgct120tcttcaatcc aacaacaacc cttctctctc tcacacaccc tctcgcttcc ctcattctct180caccaaccgt gtcaaaccct ccctcggtgt ggtatctgtg gccaaaaggg taagtggagt240ggtgccaaag gccaatttga atgccttgga ggccaattcg ggtttcccca tttcggctaa300gaagtccaac aacaacccca ttgttgttat tgacaactat gacagtttca cctataatct360ttgccagtat atgggggagt tagggtttca ctttgaggtc taccgcaatg atgagttgac420agtggaggag ttaagaagga aaaatcccag aggagtgctg atatcacctg ggccaggaga480acctcaagat tcaggcatat ctttgcaaac ggttttggaa cttggaccaa ctgtgccatt540gtttggtgtg tgcatgggtt tgcaatgcat tggagaggct tttggaggga agattgttcg600ttctcctcat ggtgttatgc atggaaaaag ctctatggtt tactatgatg agaaaggaga660agatggatta cttgctggac tatcaaatcc tttcttggct ggtagatatc acagccttgt720aattgaaaaa gagagctttc ctcatgatga acttgaggca acagcatgga cagaagatgg780tcttataatg gctgctcgtc ataagaaata taagcatcta cagggtgttc agtttcatcc840agagagcatc ataaccccag aaggcaagac aattgtccgt aattttgtca agcttatcga900gaaaagggag gctggtggct cttgaaaatc gaattcccgc ggccgccatg gcggccggga960gcatgcgacg tcgggccbaw kcggmgtt 988<210>114<211>47<212>PRT<213>玉米(Zea mays)<220>
<221>misc_feature<223>CTP的序列.
<400>114Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala1 5 10 15Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr20 25 30Arg Arg Thr Ser Ser Arg Ser Gly Thr Ser Gly Val Lys Cys Ser35 40 45<210>115<211>32<212>PRT<213>玉米(Zea mays)<220>
<221>misc_feature<223>CTP的序列.
<400>115Met Ala Thr Ala Ser Leu Ala Leu Ser Leu Arg Leu Ala Pro Ser Ser1 5 10 15Arg Pro Leu Ser Leu Arg Arg Arg Gly Ala Ala Gly Val Thr Cys Arg20 25 30<210>116<211>849<212>DNA<213>玉米(Zea mays)<400>116atggcctgct cccacatcgt cgccgccgcg ggggtctcct cccccgccgc agcggcggct 60cgttccccgg cgcattctcc cgctgccgcc ttcgcgcgcc tccggtcgac gcctcgtttc120gcgagcgctg gcttgtcggt taagggaaac ggagcggcgt tcccgttggt cgccgccgcg180gggccggccg cggcggcacc ggtggccgac ctggacggcc gcccggccac ggagaagcag240cccatcatcg tcatcgacaa ctacgacagc ttcacataca acctctgcca gtatatgggg300gagcttggat tgaacttcga agtataccgc aatgatgaac tgaccataga agatgtgaga360aggaagaacc caaggggaat acttatttct ccaggacctg gtgaaccaca agattcggga420atatcattgc agactgttct tgaattaggc ccaaccatcc caatttttgg agtttgcatg480ggtctgcaat gcattggaga ggcatttgga ggaaagatta tccgtgctcc ttctggagtg540atgcatggga aaagctctcc agtttattac gatgaggaat taggaaaggc attgttcaat600ggcttgccaa acccttttac tgccgcgagg taccacagct tggtcattga gcaagaaacc660
ttcccacatg atgctttgga ggctactgca tggactgaag atggacttat catggctgct720cgccacaaga agtacaaaca catccagggt gtccaattcc acccggagag catcatcacc780cctgaaggca agaaaatcat cctcaacttt gtcagattca ttgaggaact ggagaagcag840cgttcgtag849<210>117<211>273<212>PRT<213>稻(0ryza sativa)<400>117Met Ala Thr Ala Ala Arg Leu Leu Pro Lys Ile Gln Ser Pro Ala Ser1 5 10 15Pro Ala Val Ala Glu Ala Arg Arg Arg Arg Pro Ser Ser Leu Arg Leu20 25 30Gly Val Thr Ser Gly Pro Ala Arg Thr Leu Lys Gln Lys Leu Val Ala35 40 45Lys Ser Ala Val Ser Val Val Glu Gly Glu Asn Ala Phe Asp Gly Val50 55 60Lys Gln Asp Thr Arg Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser Phe65 70 75 80Thr Tyr Asn Leu Cys Gln Tyr Met Gly Glu Val Gly Ala Asn Phe Glu85 90 95Val Tyr Arg Asn Asp Asp Ile Thr Val Glu Glu Ile Lys Lys Ile Ser100 105 110Pro Arg Gly Ile Leu Ile Ser Pro Gly Pro Gly Thr Pro Gln Asp Ser115 120 125Gly Ile Ser Leu Gln Thr Val Gln Asp Leu Gly Pro Ser Thr Pro Leu130 135 140Phe Gly Val Cys Met Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly145 150 155 160Lys Val Val Arg Ser Pro Tyr Gly Val Val His Gly Lys Gly Ser Leu165 170 175Val His Tyr Glu Glu Lys Leu Asp Gly Thr Leu Phe Ser Gly Leu Pro180 185 190
Asn Pro Phe Gln Ala Gly Arg Tyr His Ser Leu Val Ile Glu Lys Asp195 200 205Ser Phe Pro His Asp Ala Leu Glu Ile Thr Ala Trp Thr Asp Asp Gly210 215 220Leu Ile Met Ala Ala Arg His Arg Lys Tyr Lys His Ile Gln Gly Val225 230 235 240Gln Phe His Pro Glu Ser Ile Ile Thr Thr Glu Gly Arg Leu Met Val245 250 255Lys Asn Phe Ile Lys Ile Ile Glu Gly Tyr Glu Ala Leu Asn Cys Leu260 265 270Pro<210>118<211>282<212>PRT<213>玉米(Zea mays)<400>118Met Ala Cys Ser His Ile Val Ala Ala Ala Gly Val Ser Ser Pro Ala1 5 10 15Ala Ala Ala Ala Arg Ser Pro Ala His Ser Pro Ala Ala Ala Phe Ala20 25 30Arg Leu Arg Ser Thr Pro Arg Phe Ala Ser Ala Gly Leu Ser Val Lys35 40 45Gly Asn Gly Ala Ala Phe Pro Leu Val Ala Ala Ala Gly Pro Ala Ala50 55 60Ala Ala Pro Val Ala Asp Leu Asp Gly Arg Pro Ala Thr Glu Lys Gln65 70 75 80Pro Ile Ile Val Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Asn Leu Cys85 90 95Gln Tyr Met Gly Glu Leu Gly Leu Asn Phe Glu Val Tyr Arg Asn Asp100 105 110Glu Leu Thr Ile Glu Asp Val Arg Arg Lys Asn Pro Arg Gly Ile Leu
115 120 125Ile Ser Pro Gly Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln130 135 140Thr Val Leu Glu Leu Gly Pro Thr Ile Pro Ile Phe Gly Val Cys Met145 150 155 160Gly Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly Lys Ile Ile Arg Ala165 170 175Pro Ser Gly Val Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu180 185 190Glu Leu Gly Lys Ala Leu Phe Asn Gly Leu Pro Asn Pro Phe Thr Ala195 200 205Ala Arg Tyr His Ser Leu Val Ile Glu Gln Glu Thr Phe Pro His Asp210 215 220Ala Leu Glu Ala Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala225 230 235 240Arg His Lys Lys Tyr Lys His Ile Gln Gly Val Gln Phe His Pro Glu245 250 255Ser Ile Ile Thr Pro Glu Gly Lys Lys Ile Ile Leu Asn Phe Val Arg260 265 270Phe Ile Glu Glu Leu Glu Lys Gln Arg Ser275 280<210>119<211>822<212>DNA<213>稻(Oryza sativa)<400>119atggccaccg ccgcgcggct cctccccaag atccagtccc ccgcctcccc ggccgtcgcg 60gaggcgcgga ggcgccgccc ctccagtctc cgattaggag ttactagtgg acccgcaaga120actctgaagc aaaagcttgt tgctaagagt gctgtttctg tggtggaagg tgaaaacgca180tttgatggag taaagcaaga tactagacca atcatagtta tagataacta cgatagcttc240acgtataatt tatgccagta catgggtgag gtgggagcta actttgaggt gtaccgcaat300gatgatatca ccgtggaaga aattaagaag atttctccta gaggaatact catctcccct360ggccctggca cacctcaaga ttcaggaata tcattgcaaa cagttcaaga tcttggacct420
tctacacctt tgtttggggt ttgcatgggt ttgcagtgta ttggggaggc atttggaggg480aaggttgttc gttctcctta tggagttgtg catgggaaag gatcccttgt tcactatgag540gagaaacttg atggaacact gttttctggt ctcccaaacc cattccaagc gggaagatac600cacagccttg taattgagaa ggatagcttc ccacatgatg ccctggaaat tactgcttgg660acagacgatg ggctgatcat ggctgctcgc cacaggaagt acaaacatat acagggtgtg720cagttccatc cagagagcat cataacaaca gaagggaggc tcatggtcaa gaatttcatc780aagattattg aaggctacga ggccttgaat tgcttaccgt ga 822<210>120<211>867<212>DNA<213>稻(Oryza sativa)<400>120atggcgtgct cccacctggc cgccgccgcc gccgcggcct ccccggcggc cgcgcgttca 60ccggcggcct ccagcgccgc aaccgcgagc gccttcgcgc gcctctcggc gacgccccgg120gtcgcgagcg gcgggttggc cgttaggggc cagaggggtg tagccgctgt tgtcgccgcc180gccgccgggg ccgccgcggc gacgcccgtg gccgacatcg aggaacgccg ggccaccgag240aagcagccca tcattgtcat cgataactac gacagcttta cctacaacct ctgccagtat300atgggggagc ttggattgaa ctttgaggta tatcgcaatg atgaacttac catagaggat360gtaaagagga agaacccaag aggaatactt atttctccag ggcctggtga gccacaagat420tcaggtatat cattgcagac tgttctggaa cttggaccta ccatcccaat ttttggtgtc480tgcatgggtc tgcagtgtat cggggaagct tttggaggaa agattatccg tgctccttct540ggtgtcatgc atggaaaaag ctctccagtt cgctacgatg aggagctagg gaaggccttg600ttcaatggct tgccaaaccc atttaccgct gcaagatacc atagcttggt gatcgagcag660gagaccttcc cccatgacgc tctggaagcc accgcgtgga ctgaagatgg ccttatcatg720gctgctcgcc acaagaagta caggcacatc cagggagtcc aattccaccc agagagcatc780atcaccccag aaggcaagag gatcattctc aacttcgtga ggttcatcga ggagctggag840aagcagcgtg ccggagagaa gaactag867<210>121<211>2202<212>DNA<213>百脈根根瘤菌(Mesorhizobium loti)<400>121atggagacgg caatgacgat gaaggttctg gaaaacggcg ctgaaagctt cgtgaccgcg 60ggtggcatca ccattacgcg tgagcgccac gaccggccct atgcgggtgc gatcgacgct120tatgtcgatg gcttgaactc gcgccgcggc gcggtgtttt cctccaacta cgaatatccc180
ggccgctata cgcgctggga caccgccatc atcgatccgc cgctggtcat ttccgcgcgg240ggccgcgcca tgcgcatcga agcgctgaac cgccgcggcg aggcgctgtt gccggtgatc300ggcaaaacgc tgggcggcct tgccgacatc accatcgccg agacgacgaa gacgctcatc360cgcctcgacg tcgccaagcc cggccgcgtc ttcacggagg aagagcgcag ccgcgtgccc420tcggtcttca ccgtgctgcg cgccatcacc gctttgttca aaaccgacga ggacgccaat480ctcggcctct atggcgcctt cggctacgac ctctccttcc agttcgaccc ggtcgactac540aagctcgagc gcaagcccag ccagcgcgac ctcgtgctgt tcctgcccga cgagatcctg600gtcgtcgacc actattccgc caaagcctgg accgaccgct acgactattc gggcgaagga660ttttcgaccg aaggtctgcc gcgcgacgca atcgccgagc cgttcaagac cgccgaccgc720atcccgccgc gcggtgacca tgagccgggc gaatacgcta atctggtgcg gcgtgccatg780gactcgttca agcgcggcga cctgttcgag gtcgtgcccg gccagatgtt ctacgagcgc840tgcgagacgc agccctccga catttcgcgc aagctgaaat cgatcaaccc ctcgccttat900tcgttcttca tcaacctcgg cgaaaacgaa tatctgatcg gcgcctcgcc cgaaatgttc960gtgcgcgtca atggccgccg cgtcgaaacc tgcccgattt cgggcaccat caaacgcggc 1020gacgacgcca tttccgatag cgagcagatc ctgaagctgc tcaattcgaa gaaggacgaa 1080tccgagctca caatgtgctc ggacgtcgac cgcaacgaca agtcgcgggt ctgcgagccc 1140ggctcggtgc gcgtcatcgg ccgccgccag atcgagatgt attcgcgcct catccacacc 1200gtcgatcaca tcgaaggccg gctgcgcgaa ggcatggacg ctttcgacgc cttcctgtcg 1260catgcctggg cggtcactgt caccggcgcg ccgaaactgt gggccatgcg cttcatcgag 1320cagaacgaga agagcccgcg cgcctggtat ggcggcgcaa tcggcatggt caacttcaac 1380ggcgacatga acaccggcct gacgctgcgc accatccgca tcaaggacgg cattgccgaa 1440gtgcgggccg gcgcgacatt gctgttcgac agcattcccg aggaagaaga agccgaaacc 1500gaactgaagg catccgccat gctctccgcc atccgcgacg ccaagacggg caactccgcc 1560agcaccgagc gcaccaccgc gcgggtcggc gacggcgtca acatcctgct cgtcgaccac 1620gaggactctt tcgtccacac gctggccaac tacttccgcc agaccggcgc caatgtctcg 1680accgtgcgca cgccggtgcc ggacgaagtg ttcgagcggc tgaagccgga ccttgtcgtg 1740ctctcacccg gaccgggtac gccgaaggat ttcgattgcg ccgcgaccat cagacgagcg 1800cgcgcccgcg acctgccgat cttcggcgtc tgcctaggcc tgcaggcgct ggccgaggcc 1860tatggcgggg aactgcgcca gctgcatatt cccatgcacg gcaagccctc gcgcatccgc 1920gtctccaagc ccggcatcat cttctccggc ctgcccaagg aagtcactgt cggccgttac 1980cactcgatct tcgccgatcc ggtgcgcttg cccgatgatt tcattgtcac ggcagagact 2040
gaggacggca tcatcatggc tttcgagcac cgcaaggagc cgatcgcggc ggtgcagttc 2100cacccggaat cgatcatgac gctcggccac aatgccggca tgcgcatcat cgagaacatc 2160gtcgcccatt tgccgcgcaa ggccaaggaa aaggcagcct ga 2202<210>122<211>2199<212>DNA<213>巴西固氮螺菌(Azospirillum brasilense)<400>122atgtaccccg ccgaccttct tgcctcgccc gacctcctcg aaccgctgcg tttccagacg 60cgcggcggcg tcaccgtcac gcggcgggcg acggcgctcg acccgcggac cgccctcgac120ccggtgatcg acgcgctgga ccgccgccgc ggcctgctgc tgtccagcgg ggtggaggcg180ccgggccgct accgccgtca cgcgctgggc ttcaccgacc ccgcggtggc gctcacggcg240cgtgggcgga cgctgcgcat cgacgcgctg aacgggcggg ggcaagtgct gctgcccgcc300gtcgccgagg ccctgcgtgg cctggaggcc ctggccggtc tagaggaggc gccgtcgcgg360gtcactgcct cgtccgcaag cccagcaccc cttcccggag aggagcggag ccgccagccc420tccgttttct cggtcctgcg ggcggtgctg gatctgtttg ccgcccccga cgacccgttg480ctcgggctct acggggcctt cgcctacgac ctcgccttcc agttcgagcc gatccgccag540cggttggagc ggcccgacga ccagcgcgat ctgctgctct acctgccgga ccggctcgtc600gcgctggacc ccatcgcagg actcgcccgg ctcgtcgcgt atgagttcat cacggcggcg660ggcagcaccg aggggctgga gtgcggcggg cgcgaccacc cctaccgtcc cgacaccaac720gccgaggccg gctgcgacca cgcgcccggt gactatcagc gcgtcgtcga gagcgccaag780gccgccttcc gccgcggcga cctgttcgag gtggtgcccg gccagacctt cgccgagccc840tgcgccgacg cgccttcgtc ggtgttccgg cggctgcgcg ccgccaaccc ggcgccttac900gaggccttcg tcaacctcgg gcggggcgag ttcctcgtcg ccgccagccc ggagatgtat960gtgcgggtgg cgggcgggcg ggtggaaacc tgcccgatct ccggcaccgt ggcgcgcggg 1020gccgacgcgc tgggcgacgc cgcgcaggtc ctgcgcctgc tgacctcggc caaggacgcg 1080gcggagctga ccatgtgcac cgacgtggac cgcaacgaca aggcgcgggt gtgcgagccg 1140ggatccgtcc gggtgatcgg gcggcggatg atcgagctgt actcccgtct gatccacacg 1200gtggaccatg tggagggacg gctgcggtcc ggaatggacg cgctggacgc cttcctcacc 1260cacagctggg cggtgacggt gaccggcgcg cccaagcgct gggccatgca gttcctggag 1320gatacggagc aatcgccgcg ccgctggtac ggcggggcct tcggccggct gggcttcgac 1380ggcgggatgg acaccggcct gaccctgcgc accatccgca tggccgaggg cgttgcctac 1440gtgcgggcgg gggcgacgct gctgtccgac agcgatccgg acgcggagga cgcggagtgc 1500
cgcctgaagg ccgccgcctt ccgcgacgcc atccgcggga cggcggcggg tgcggcgccc 1560acgctgccgg cggctccccg tggcggggag ggcaggcggg tgctgctggt ggatcacgac 1620gacagcttcg tccacacgct ggccgactat ctgcgccaga cgggcgcttc ggtgacgacg 1680ctgcgtcaca gtcacgcacg ggcggcgctg gcggagcgga ggccggatct ggtcgtgctg 1740tcccccggtc cggggcgccc ggcggatttc gacgtggcgg gcaccatcga cgcggcgctg 1800gcgctcggcc tgccggtgtt cggcgtctgc ctgggcctgc aagggatggt ggagcgcttc 1860ggcggcgcgc tggacgtgct gccggagccc gtccacggca aggcgacgga ggtccgggtg 1920ctgggcggcg cgctgttcgc cggcctgccg gagcggctga cggtcgggcg ctaccactct 1980ctggtggccc ggcgcgaccg gctgccggcg gacctcacgg tgaccgcgga gaccgccgac 2040ggtctggtga tggcggtcga gcaccggcgg cttccgctcg ccgccgtgca gttccacccc 2100gagtcgatcc tgtcgctcga cggtggggcc ggtcttgccc tgctgggcaa cgtgatggac 2160cggctggccg ccggcgccct gacggacgct gcggcttga 2199<210>123<211>2196<212>DNA<213>馬爾他布魯氏菌(Brucella melitensis)<400>123atgaatgcga agactgcgga tagcgagata ttccagcacg aaacggcagg cggtatcatc 60gtcgagcggg tgcgccacct cacggcctat aagggcgcca ttgaaagcta tatcgatgtg120ctgaacgaat ggcgcggtgc ggtgttctcg tccaattacg aatatccggg ccgctatacg180cgatgggata ccgcaattgt cgatccgccg gtcgtcatca cgtcgcgtgc ccgcacgatg240cgcatcgagg cgctgaacgc gcgcggcgtc atcctgcttc ggcccattct ggataccgtc300aaggcgcttt cggaagtaaa gatcgaccag tccggcgaaa accgtatcga tctgacgatt360gtggaaccgg tcggcacctt cacggaagaa gaacgctcgc gcatgccctc ggtctttacg420gtgctgcgcg ccatagtcgg gcttttcttc tcggaggagg atgccaatct cggcctttat480ggcgcctttg gctatgatct ggcgttccag ttcgatccca tccagtacaa gctgaagcgc540ccggacgacc agcgtgacct cgtgctgttc attcccgacg aaatcttcgt cgccgaccat600tatgcggcgc gcgcctgggt ggaccgttat gaatttcgct gcggcggttc gtccacgcac660ggtcttgatc gcgcgacgcc ggtggtgcct ttcaagccat cggagcgcaa gcttgcgcgc720ggcgatcata atccgggtga atatgccagg cttgtcgagc gcgccaagga aagcttcaag780cgcggcgacc tgttcgaggt tgtgccgggc cagaccttct atgagcgctg ccacacggcg840ccgtcggaga ttttccgccg gctgaagtcg atcaatcctt cgccctattc ctttttcatc900aatctgggcg agagcgaata tctggtcggc gcatcgccgg aaatgtttgt gcgcgtcaat960
gggcggcgca tcgagacctg cccgatttcc ggcaccatca agcgcggtga agatgcaatt 1020tcggattctg agcagatatt gaaactgctt aattccaaga aggacgaatc cgagctgacc 1080atgtgttcgg atgtggaccg caacgacaag agccgcgttt gcgagccggg ttcggtgcgt 1140gttatcggtc gccgccagat cgagatgtat tcccgcctga tccatacggt cgatcatatc 1200gaaggccgcc tgcgtgacgg catggatgcg tttgacggct tcctcagcca tgcatgggct 1260gtgacggtga caggcgcgcc gaagctgtgg gcaatgcgct ttcttgagga aaacgaacgc 1320agcccgcgcg catggtatgg cggcgcgatc ggcatgatgc atttcaatgg cgatatgaat 1380acagggctga cgctgcgcac catccgcatc aaggatggtg tggcggaaat ccgtgcaggg 1440gcgacgcttc tgttcgattc caaccctgac gaggaagaag ccgagaccga attgaaggca 1500tcggccatga ttgcggctgt gcgggacgca cagaagagca atcagatcgc ggaagaaagt 1560gtggcggcaa aggtgggtga gggggtttcg atcctgctgg tcgatcacga ggattccttc 1620gtccatacgc ttgccaatta tttccgccag acgggcgcca aggtttccac cgtgcgttca 1680ccggtggcag aggagatatt cgaccgcgtc aatcccgatc tggtggtgtt atcgccggga 1740ccgggctcgc cgcaggattt cgattgcaag gcgaccatcg ataaggcgcg caagcgccag 1800cttccgattt ttggcgtctg cctcggcctt caggccctgg cggaagccta tggcggggcg 1860ttgcgccagc ttcgcgttcc ggtgcatggc aagccttcac gcatccgcgt atcaaagccg 1920gagcgcattt tctccggctt gccggaggaa gtgacggtgg ggcgttatca ttcgatcttc 1980gccgatcctg aacgcctgcc ggatgatttt ctcgtcacag ccgaaacgga agacgggatc 2040atcatggctt ttgaacataa acatgaaccg gtggcagccg ttcaattcca tcccgaatcc 2100atcatgacgc ttggccataa tgccggtatg cgcatgatcg agaatatcgt gacgcatctt 2160gcaggcaagc acaaggcgcg ccgcaccaac tattga 2196<210>124<211>2148<212>DNA<213>念珠藻屬(Nostoc sp.)<400>124gtgcgcgtat ctcgtagcac aaccgaggtg aagatggaca ctgcactaga tgaaattctc 60tttcacctaa atcaagtacg tggaggtttg ttaaccagta gttacgaata tccagggcga120tacaaaagat gggcgattgg attcattaat cccccattac aactgacaac aagagagaac180gcatttacca tctcttcact caatcctcgc ggacaggtgc tactaccaac cttgttccag240catctatcag cccagtcgca actacaacaa atcagcctca atcatgacta catcacaggt300gaaattcgac ccacaaaaca gttattcaca gaagaacaac ggagtaaaca accgtcagcc360tttacagtca tccgcgaaat tctccagatt tttgcgagtg atgaagacga gcatttaggg420
ttatatggtg catttggtta cgacttagta tttcaatttg aaccaattcc ccaaaaaatt480gctcgtcccg cagaccaacg ggatttagtc ctgtatctac ccgatgaact catagttgta540gattactatc tacaaaaagc atatcgtcac cagtatgaat ttgccacaga acatggcaac600accgagcatc ttccacggac aggccagtcc atcgactacc agggtaaaca tcttctacca660aaccaaactg ctgaccatca accaggagaa tatgccaacc tagttgagca agcactcgac720tacttccgcc ggggtgactt atttgaagta gttcctagtc aaaacttttt tacagcctgt780gaacaatcac ccagtcaact attccagacc ttaaggcaaa ttaatcctag tccttatgga840tttctgttga atttgggtgg tgaatatctc ataggtgcat caccagaaat gtttgtgcga900gttgatggta ggcgagtgga aacctgtccc attagtggca ctattagacg gggagaagat960gctttaggcg acgctgtaca aattcgtcag ttgcttaact cccataaaga tgaagccgag 1020ttaacaatgt gtactgacgt agaccgcaac gataaatcgc ggatttgtga acccggttca 1080gtcagggtga ttggtcgtcg ccagattgaa ctgtacagcc acctcattca tacagtagac 1140catgtagaag ggatactgag gccggaattt gacgctttag atgccttctt gagtcatact 1200tgggcagtta cagtcacagg cgcacccaaa cgagccgcca tgcagttcat cgaacagcat 1260gaacgcagcg cccgtcgttg gtatggggga gcagttggtt atttaggctt taatggtaac 1320ttgaataccg gattaacctt gcggacaatt cgtttacaag actccatcgc cgaagtgcga 1380gttggtgcaa cagtccttta cgactccatt ccgtcagccg aagaagagga aacaattact 1440aaagcgactg cattatttga gaccattcgc cgtcatacca ctgccaataa aactcaagga 1500aacgatagtc atcgccctgg ggatatcgcc cacaataagc gtatcctcct catcgactac 1560gaagattcat ttgttcacac attagccaat tacatccgca ccaccggcgc aaccgtcacc 1620accctacgtc atggttttgc tgaatcatat tttgatgcag aacgcccaga cttagtggta 1680ttgtctcccg gccctggtag acccagtgac ttccgagttc cccaaacggt tgcagccttg 1740gtaggtcgag aaatccccat ttttggcgtt tgtctgggat tacaaggcat agtggaagct 1800tttggcggag aattaggcgt gcttgattat ccccaacacg gtaaacccgc acggatttca 1860gtgactgcac ctgattctgt gctgtttcaa aatttaccag catccttcat cgtgggtaga 1920taccattcct tatttgccca accccaaact atacccggtg aactcaaagt cacagcgatt 1980tctgaggaca atgtaattat ggcaattgaa caccaaacac tacctatagc cgccgtccaa 2040tttcatccag agtcaatcat gaccctagca ggagaagttg gtcagacaat cattaaaaat 2100gtggtgcaga catataccca aactttagaa acatcaattt actcttag2148<210>125<211>2208<212>DNA
<213>念珠藻屬(Nostoc sp.)<400>125atgattgccg attcccacag ctacagaact aatggtaacg tgcgtgtctc tcgctccatc 60acacaagtta aaatggagac agctttagaa gagattcttt tctacttaaa ctctcagcgt120ggtggattgc tgactagtag ctatgaatat ccaggaagat ataaaagatg ggcaattggt180tttgttaatc cacctgtaga attatccaca agcggaaata cttttactct cacagcatta240aatgagcgtg gctatgtact tttaccagtg atctttgagt gtttatcaaa atcagaacaa300ctccagaaac tcactgaaca tcatcataaa attactggat tagttaaatc tacaccagaa360ttttttgccg aagaagaacg tagtaaacaa ccttctacat ttacggttat tcgggaaata420ctacatatct tctctagtca agaagacgaa catttaggat tatatggtgc gtttggttat480gacttagttt tccaatttga gcaaataacc caatgcttag aacgtccaca agaccaacga540gatttagttc tatatttacc cgacgaattg atagttgtag actactatca acaacaagca600tttcggctag agtatgactt catcacagcg catggtagta cttatgattt gccccgcacg660ggagaatctg ttgattatcg aggtcaatgt ttaacacctc ctcaaaatgc tgaccataaa720ataggtgagt atgccaaact agtagaattt gcccttgatt atttccgtcg gggtgactta780tttgaagtgg ttcccagtca gaattttttc acagcttgcg aagcaccacc aagccaacta840tttgaaactt taaaacaaat aaatcctagt ccctatggat ttatttttaa tcttggtgga900gaatacatca ttggcgcttc accagaaatg tttgtacggg tggaaggtag gcgtgtagaa960acttgtccta ttagtggcac tattactaga gggcatgatg ctatagatga tgctgtgcag 1020attcgtcagt tactcaactc ccacaaagac gaagcagagt tgactatgtg tactgacgta 1080gaccgtaacg ataagtctcg catctgtgaa cccggttcag tcaaggtgat tggtcgccgg 1140caaattgaat tatatagcca cttaattcat acggtagacc atgtagaagg cattctccga 1200ccagagtttg atgctttaga tgctttcctc agtcacactt gggctgttac agtcacaggc 1260gcaccgaaaa gggctgctat tcaattcatc gaaaagaacg aacgcagcgt cagacgttgg 1320tatggtggcg cggttgggta tttgaatttt aacgggaatt taaatactgg gttaatttta 1380aggacaatca gattgcaaga ctcaattgct gaagtgcgag ttggtgctac tctactgtat 1440gactccatac cccaagcaga agaacaagaa accatcacta aagctgcggc tgcttttgaa 1500acgattcggc gtgctaaaca aatagaccca cagattgaag aatctagtac tagaaagtta 1560agcaaatatc ttcccgatgg acaatcaggt aaacacatct tactaattga ccatgaagac 1620tcatttgttc ataccctagc taactacatc cgttccactg gtgcaactgt caccacactg 1680cgtcacggct tctcagaatc cctatttgat acagaacgcc cagacttagt agtattatct 1740cctggccccg gtagaccgag tgaatttaaa gtacaggaaa ccgtcgccgc ctgcgtccgt 1800
cgccaaatac ctctgtttgg tgtctgttta ggactgcaag gtattgtgga agctttcggt 1860ggagaattgg gagtattgaa ttatccccaa catggtaaat cttcgcggat ttttgttaca 1920gcacccgatt ctgtgatgtt tcaagatttg cccgaatctt ttacagtcgg gagatatcat 1980tcattatttg cactatcaca acgcttacca aaagaactga aggtgacagc gatttctgat 2040gatgaggtga ttatggcgat tgaacatcag acactaccta tcgccgccgt ccagtttcat 2100ccagaatcaa tcatgactct agctggagaa gttggtttaa tgatgatcaa aaatgtggtg 2160caaaaatata cacaaagtca acagtcaaca gttcccatct atgactaa2208<210>126<211>2160<212>DNA<213>血色紅假單胞菌(Rhodopseudomonas palustris)<400>126atgaacagga ccgttttctc gcttcccgcg accagcgact ataagaccgc cgcgggcctc 60gcggtgacgc gcagcgccca gccttttgcc ggcggccagg cgctcgacga gctgatcgat120ctgctcgacc accgccgcgg cgtgatgctg tcgtccggca caaccgtgcc gggccgctac180gagagcttcg acctcggctt tgccgatccg ccgctggcgc tcaccactag ggccgaaaaa240ttcaccatcg aggcgctcaa tccgcgcggc cgggtgctga tcgcgttcct gtccgacaag300cttgaagagc cctgcgtggt ggtggagcag gcctgcgcca ccaagatcag gggccacatc360gtccgcggcg aggccccggt cgacgaagaa caacgcaccc gccgcgccag cgcgatctcc420ctggtgcgcg cggtgattgc tgccttcgcc tcgccggccg atccgatgct cgggctgtac480ggcgccttcg cctacgacct tgtgttccag ttcgaggatc tgaagcagaa gcgtgcccgc540gaagccgacc agcgcgacat cgtgctgtac gtgccggatc gcctgctggc ctacgatcgc600gccaccggcc gcggcgtcga catttcctac gaattcgcct ggaagggcca gtccaccgcc660ggcctgccga acgagaccgc cgagagcgtc tacacccaga ccggccggca gggtttcgcc720gaccacgccc cgggcgacta tcccaaggtg gtcgagaagg cccgcgcggc gttcgcccgc780ggcgacctgt tcgaggcggt gccgggccag ctgttcggcg agccatgcga gcggtcgccg840gccgaagtgt tcaagcggtt gtgccggatc aacccgtcgc cctatggcgg cctgctcaat900ctcggcgacg gcgaattcct ggtgtcggcc tcgccggaaa tgttcgtccg ctcggacggc960cgccggatcg agacctgccc gatctccggc actatcgccc gcggcgtcga tgcgatcagc 1020gatgctgagc agatccagaa gctcttgaac tccgagaagg acgagttcga gctgaatatg 1080tgcaccgacg tcgaccgcaa cgacaaggcg cgggtctgcg tgccgggcac gatcaaagtt 1140ctcgcgcgcc gccagatcga gacctattcg aagctgttcc acaccgtcga tcacgtcgag 1200ggcatgctgc gaccgggttt cgacgcgctc gacgccttcc tcacccacgc ctgggcggtc 1260
accgtcaccg gcgcgccgaa gctgtgggcg atgcagttcg tcgaggatca cgagcgtagc 1320ccgcggcgct ggtatgccgg cgcgttcggc gtggtcggct tcgatggctc gatcaacacc 1380ggcctcacca tccgcaccat ccggatgaag gacggcctcg ccgaagttcg cgtcggcgcc 1440acctgcctgt tcgacagcaa tccggtcgcc gaggacaagg aatgccaggt caaggccgcg 1500gcactgttcc aggcgctgcg cggcgatccc gccaagccgc tgtcggcggt ggcgccggac 1560gccactggct cgggcaagaa ggtgctgctg gtcgaccacg acgacagctt cgtgcacatg 1620ctggcggact atttcaggca ggtcggcgcc caggtcaccg tggtgcgcta cgttcacggc 1680ctgaagatgc tggccgaaaa cagctatgat cttctggtgc tgtcgcccgg tcccggccgg 1740ccggaggact tcaagatcaa ggatacgatc gacgccgcgc tcgccaagaa gctgccgatc 1800ttcggcgtct gcctcggcgt ccaggcgatg ggcgaatatt ttggcggtac gctcggccag 1860ctcgcgcagc cggctcacgg ccgcccgtcg cggattcagg tgcgcggcgg cgcgctgatg 1920cgcggtctcc cgaacgaggt caccatcggc cgctaccact cgctctatgt cgacatgcgc 1980gacatgccga aggagctgac cgtcaccgcc tccaccgatg acggcatcgc gatggcgatc 2040gagcacaaga ccctgccggt cggcggcgtg cagttccacc ccgagtcgct gatgtcgctc 2100ggcggcgagg tcgggctgcg gatcgtcgaa aacgccttcc ggctcggcca ggcggcctaa 2160<210>127<211>2166<212>DNA<213>大豆慢生根瘤菌(Bradyrhizobium japonicum)<400>127atgaacagga cagtctttgc cctcccggcc agaagcgatt acgtgacccg cggcggtctc 60gcgatcacgc gcgtggcgga gcagtttacc ggcggcgcga gccggctcga cgatctcgtc120aacctgctcg accgccgccg cggcgtggtg ctgtcctcgg gcacgaccgt gccgggccgc180tacgagagct tcgacctcgg cttctccgat ccgccgctca agctcgagac cacaggcgtc240aatttcaagc tggaagccct gaacgagcgc ggccaggtgc tgatcgcctt ccttgccgat300gtcctgcgcg agccctgcgt ggtgatatcc gaaaagaccg cttcgcgcct cgccggccac360atcatccgcg gcgatgcccc ggtcgaggaa gaccagcgca cccggcgcgc cagcgtggtg420tcgctggtgc gcgacctcgt cgccgccttc tccgccaatg acgacgggct gctcggcctg480ttcggcgcct tcgcctacga tctcgtgttc cagatcgagg atctcgtgca gaagcgcgcg540cgcgagagcg accagcgcga catcgtgctc tacgttcccg atcgcctgct ggcctatgac600cgcgccaccg gccgcggcgt cgtgctcagc tacgacttca cgtggaaggg cagatccacc660gagggcctgc cgcgcgagac cgccgacagc ccgtacatga agacaccgcg ccagggcttt720gccgatcatg cgcccggcga ataccaggcc accgtcgaga ccgcgcgcgc ggcctttgcc780
cgcggcgatc tgttcgaggc cgtgccgggc cagctgttcg ccgagccctg cgatcgttct840ccggcggaag tgttccagcg cctctgtgtc atcaacccgt cgccctacgg cgcgctgatg900aatctcggcg acggcgagtt tctcgtctcc gcctcgcccg agatgttcgt gcgttcggac960ggccgccgcg tcgagacctg cccgatctcg ggcaccatcg cgcgcggcac cgatgcgatc 1020ggcgatgccg agcagatccg ccagctcctg aattcggaga aggacgagtt cgagctcaac 1080atgtgcaccg acgttgatcg caacgacaag gcgcgcgtct gcgtccccgg caccatcaag 1140gtgctggcgc gccggcagat cgagacctac tcaaaactgt tccacaccgt cgaccacgtc 1200gagggcatgc tgcgtcccgg cttcgacgcg ctcgatgcct tcctcaccca tgcctgggcc 1260gtcaccgtga caggtgcgcc gaagctctgg gcgatgcagt tcgtcgagga tcacgagcgg 1320tcgccgcggc gctggtatgc gggtgcgatc ggcgcggtga atttcgacgg cagcatcaat 1380accggcctca ccatccgcac catccgcatg aaggatggtc tcgccgaggt gcgcgtcggc 1440gccacctgcc tgttcgattc cgatcccgct gccgaggacc gcgaatgcca ggtcaaggcg 1500gcggcgctgt tccaggcgct gcgcggcgat ccgccaaaac cgctctcgac ctttgcgccc 1560gatgcgaccg gaagcggcaa gcgggtgctg ctgatcgacc acgacgacag cttcgtgcac 1620atgctcgccg actatttccg ccaggtcggc gccagcgtca ccgtggtccg ctatgtgcat 1680gcgctcgaca tgctcaagca gaagaggtgg gatttgctgg tgctgtcgcc cggcccgggc 1740aggcccgaag atttcgggat caggaagacg atcgatgcgg cgctggagaa caagctgccg 1800gtgttcggcg tctgcctcgg cgtgcaggcg atcggcgaat attttggcgg cgagctcggc 1860cagctcacgc atcccgccca cggccggccc tcgcgggtgc aggtgcgcgg cggccgcctg 1920atgcgcaatt tgccgagcga gatcgtgatc ggccgctatc actcgctcta tgtcgagcgc 1980gacagcatgc cggaggtttt gtccgtcacc gccagcaccg aggacggcgt cgctatggcg 2040ctggagcaca agaccctgcc ggtcgcgggc gtgcaattcc acccggagtc gctgatgtcg 2100ctcggcggcg aggtgggctt gaggattgtc gagaacgcgt tccggctgga tgcgcgtgtt 2160gattga 2166<210>128<211>2187<212>DNA<213>深紅紅螺菌(Rhodospirillum rubrum)<400>128atgcaaacat cgaccttcac caccgccggc ggttttacca tcagcagttg cctacgcccg 60cttgccgggg cggatggcgc cttcgaggcg ctgatcgacc gactcgatcg ccatcgcggc120atggtgatcg cctcgaccta tgagtatccc ggccgctatc gccgccacgc cctggggttt180tgcgatccgc cgctggtgct ggagggcaag gggcgcgagg cccatctgct ggcgctcaat240
cgccgggggc gggccctgct gccggccctg gccgttggct tggagggggc ggccgggctg300gagggcctgc gccgcgaggc cgaccggctg gtcttgcgtg tcaaggccat ggcgccctgg360ttccccgagg aggagcgctc gcgccaaccc tcgctgatgt cggtggtgcg cgccctcgcc420gggctgttcg ccgccgaaaa cgacccgttt ttcgggcttg tcggcgcctt tggctatgac480ctgggcttgg ctttcgagcg cctgccccat gcccggccgc gatcggccga tcaccgcgat540ctggtgcttt acctgcccga ccgtctgctg atcgacgatc ccgaagccgg cggccttgcc600gaacgccttt acgacatcac cgcggccgat ggggcaagca ccgccggctt ggcgcgggaa660accgccgctt acaccgccga ccaccccgcc ggcggcgtgc cgatcgagga tgatatgccc720ccgggcgctt acggggcgat cgtccgtggg ctgaaggagg ccttcgccgc cggggatctg780ttcgaggcgg tgccctcgcg cgccctgcgc cggccttgcg ccgaggcgcc gagccgtttg840taccggcggc tgcgcgcggc caatccggcg ccctatctgt tcctggccaa tctgggggcg900ggcgaacatc tgatcggcgc ctcgcccgaa atgttcgtgc gcgtcggtgg agcgccgggg960gcgcggcggg tggaaacctg cccgatctcg ggcaccatcg cccgggggcc cgacgccctg 1020ggcgatgccg aggccatccg caccctgctc aattcgacca aggacgaggc cgaattgacc 1080atgtgcaccg atgtcgaccg caacgacaag gcgcgggtct gcgtggccgg cagcgttacc 1140gtcatcggtc gccgccagat cgagctatat tcccggctga tccacacggt cgaccatgtg 1200gagggccggc tgcgccccga gcttgacgcc cttgacgcct ttctcagcca ctgctgggcg 1260gtgacggtga ccggagcgcc caagcgcgcc gccatggccg ccgtcgaagc cgtggagcgg 1320gcgccgcgcg cctggtatgg cggcgccatc ggccgcctgg gcttcgacgg taccctcgac 1380accggactgg tgctgcgcac catccgcctg cgtcacggcg tcgccgaggt gcgggtgggg 1440gcgacgctgc tccaccgttc cgatcccgag gaggaggagg ccgaaaccct gctcaaggcc 1500tcggccctgc tcgccctgct cgatgccacc accccggcca agccgaatgc cccgcatctt 1560ccgttgcgcg gccgggcgcc gcgcgtgctg gtcatcgacc acgaggacag cttcgtccat 1620accctggcgt cttatctgcg caatgccggg gccgagacca ccgtgctgcg ctgggacgtg 1680ccggcggcgg tgcgcgccgg cgtcgaggcc gatctgctgg tgctgtcgcc gggaccgggc 1740acgccgtcgc gcttcgccct gggggccagc ctggactggg cggtggcgcg cggcttgccg 1800gtcttcggcg tctgcctggg gctgcagggc atcgtcgaac aggccggggg ccgccttgcc 1860cggctggcgg ttcccgccca tggcatggcc tcgacgctgc ggctggtcgc ccccggggac 1920ccgctgttcg ccggcctgcc cacgaccatg agagtgggcc gctaccacag cctgcacgcc 1980gagcgcgcca gcctgcccga cagcctggag atcctggccg aaagcgacga cggggtgatc 2040atggcgctgc gccaccgcct gctgcccttc agcgccgtgc aattccaccc cgaaagcctg 2100
atgaccctgg acggcggcgc cggaccccga ttgatcgcca atcttctgga aaccctaagc 2160gtcccgcgaa cgcgccacgc cgcctaa 2187<210>129<211>2181<212>DNA<213>Thermobifida fusca<400>129gtggacgaca actcctacac caccagtggt ggtatcaccg tgcaccgcac ggcagtgccg 60tgcgatcccc gtgcgctcgc cgatctgacg gtcaacgtgg aacagcgccg aggcggcgtg120ctctcctccg ggatggagta tcccggccgc tacagccgtt ggcatttggg atacgtggac180ccgtgcctgg aagttgtcgc gcgcggccgc acgatcgggg cgacggccct caacgaccgc240ggccgtgtcc tgctgcccgc ggtagcccgg gcgctcaccg cgcacggcgc ggtggtggag300cacaccgacg acacggtcgc tgtcacggtc cctgaaccgg atcccaccga gttcttcact360gaggaagagc gcagccgccg gctcagtgtt ttttctgcgc tccgcgccct cgtgggcgtg420ttcttccacg cggaagaacc ccacctgggg ttgtacgggg cgttcggcta cgatctggcg480ttccagttcg aaccgatcga gcaggtgctg ccgcgcgacc cggaggaccg ggacctggtg540ttgcacctgc ccgacgagat catcgtccac gaccggaaac gggagatctg ccagcgctac600tcctacgact tcacgctgcc ggaggagttg cgcggcccgg caggggcgac cacgcggggc660ctgccacgcc acaccgagcc cacacccccg gtgaccccgg ctgccgaggt gccgccgcag720ccggaacccg ggtcgtatgc gcggatcgtg gctgaggcca aggagcggtt ccgccgcggc780gacttgttcg aagtggtgcc cagccaccgc ttgtacgcgc cgtgtgcgtc gcctgcgcgg840ttctacgagc ggctgcggga acgcaaccct gccccgtacg agttcttcct caacctgggg900gagggcgagt acctggtcgg cgcgtccccg gaaatgtttg tgcgggtcac gggccgtccc960ggagaggggc agcgggtgga gacctgcccg atctccggca cgatcaagcg tggcgcggac 1020gcggtcggcg acgcggagaa catcaaggag ctgctgtcgt ccgcgaagga agagtcggag 1080ctgaccatgt gcaccgacgt ggaccgcaac gacaagtccc gggtgtgcgt gccaggcagt 1140gtgcgggtga tcggccgccg gcagatcgaa atgtacagtc ggctcatcca cacggtcgac 1200cacattgagg ggattctgcg ccccgagttg gacgctattg acgcgttcct cacccacatg 1260tgggcggtga ccgtgacggg ggcgccgaag acgtgggcga tgcggttcat cgaacagcat 1320gagagttcgc cgcgccgctg gtatgggggc gcggtcggtg tcatcaattt tgatggttcg 1380atgaacaccg ggttgacgtt gcggaccgcg cacatccggg acggggtggc gacggtgcgg 1440gcgggcgcca cactgctgta cgactctgat ccggaagctg aagagcggga gactttcctc 1500aaagcccgtg ccctgttgga gaccctcacc gacgagggtg aggaaacctc caaggctgcg 1560
cctgcggtgg agcaggtggg ggcggggatg cgggtgctgc tcgtcgacca cgaagactcg 1620ttcgtcaaca cgctcgcgga ctacgtccgg cggcacggcg ccgaggtcac cacggtgcgc 1680tacgggttcg acccggccct gctcgaccag atgcgtcccg acctggtggt gctctccccg 1740gggccggggc tgcccgccga tttcgcgatg agcgcgctgt tgaaggagtt ggacgcgcgc 1800ggcctgcctg tgttcggggt gtgcctgggg ctgcaggcga tggtggagta cgcgggcggg 1860gagctgctca ctttggacac gccggtgcac ggtaaacccg gccgggttcg ggtcaccggg 1920ggcgcgctgc tggctgggct gggagaggac ggggagttca ccgcggcccg ctaccactcc 1980gtgtacgcga ccccggaccg ggtgaaaggg ttcgaggtga cggcggtgac ggaggacgac 2040ggtttccccg tggtcatggc gatcgagaat gctgaggcgc ggcggtgggc ggtccagttc 2100caccccgagt cgatcctcac cggccgggtg ggggagcaga tcgtggcgaa cgtgctgcgc 2160ttggccaggg agagcagctg a 2181<210>130<211>721<212>PRT<213>大豆慢生根瘤菌(Bradyrhizobium japonicum)<400>130Met Asn Arg Thr Val Phe Ala Leu Pro Ala Arg Ser Asp Tyr Val Thr1 5 10 15Arg Gly Gly Leu Ala Ile Thr Arg Val Ala Glu Gln Phe Thr Gly Gly20 25 30Ala Ser Arg Leu Asp Asp Leu Val Asn Leu Leu Asp Arg Arg Arg Gly35 40 45Val Val Leu Ser Ser Gly Thr Thr Val Pro Gly Arg Tyr Glu Ser Phe50 55 60Asp Leu Gly Phe Ser Asp Pro Pro Leu Lys Leu Glu Thr Thr Gly Val65 70 75 80Asn Phe Lys Leu Glu Ala Leu Asn Glu Arg Gly Gln Val Leu Ile Ala85 90 95Phe Leu Ala Asp Val Leu Arg Glu Pro Cys Val Val Ile Ser Glu Lys100 105 110Thr Ala Ser Arg Leu Ala Gly His Ile Ile Arg Gly Asp Ala Pro Val115 120 125Glu Glu Asp Gln Arg Thr Arg Arg Ala Ser Val Val Ser Leu Val Arg
130 135 140Asp Leu Val Ala Ala Phe Ser Ala Asn Asp Asp Gly Leu Leu Gly Leu145 150 155 160Phe Gly Ala Phe Ala Tyr Asp Leu Val Phe Gln Ile Glu Asp Leu Val165 170 175Gln Lys Arg Ala Arg Glu Ser Asp Gln Arg Asp Ile Val Leu Tyr Val180 185 190Pro Asp Arg Leu Leu Ala Tyr Asp Arg Ala Thr Gly Arg Gly Val Val195 200 205Leu Ser Tyr Asp Phe Thr Trp Lys Gly Arg Ser Thr Glu Gly Leu Pro210 215 220Arg Glu Thr Ala Asp Ser Pro Tyr Met Lys Thr Pro Arg Gln Gly Phe225 230 235 240Ala Asp His Ala Pro Gly Glu Tyr Gln Ala Thr Val Glu Thr Ala Arg245 250 255Ala Ala Phe Ala Arg Gly Asp Leu Phe Glu Ala Val Pro Gly Gln Leu260 265 270Phe Ala Glu Pro Cys Asp Arg Ser Pro Ala Glu Val Phe Gln Arg Leu275 280 285Cys Val Ile Asn Pro Ser Pro Tyr Gly Ala Leu Met Asn Leu Gly Asp290 295 300Gly Glu Phe Leu Val Ser Ala Ser Pro Glu Met Phe Val Arg Ser Asp305 310 315 320Gly Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly325 330 335Thr Asp Ala Ile Gly Asp Ala Glu Gln Ile Arg Gln Leu Leu Asn Ser340 345 350Glu Lys Asp Glu Phe Glu Leu Asn Met Cys Thr Asp Val Asp Arg Asn355 360 365Asp Lys Ala Arg Val Cys Val Pro Gly Thr Ile Lys Val Leu Ala Arg370 375 380
Arg Gln Ile Glu Thr Tyr Ser Lys Leu Phe His Thr Val Asp His Val385 390 395 400Glu Gly Met Leu Arg Pro Gly Phe Asp Ala Leu Asp Ala Phe Leu Thr405 410 415His Ala Trp Ala Val Thr Val Thr Gly Ala Pro Lys Leu Trp Ala Met420 425 430Gln Phe Val Glu Asp His Glu Arg Ser Pro Arg Arg Trp Tyr Ala Gly435 440 445Ala Ile Gly Ala Val Asn Phe Asp Gly Ser Ile Asn Thr Gly Leu Thr450 455 460Ile Arg Thr Ile Arg Met Lys Asp Gly Leu Ala Glu Val Arg Val Gly465 470 475 480Ala Thr Cys Leu Phe Asp Ser Asp Pro Ala Ala Glu Asp Arg Glu Cys485 490 495Gln Val Lys Ala Ala Ala Leu Phe Gln Ala Leu Arg Gly Asp Pro Pro500 505 510Lys Pro Leu Ser Thr Phe Ala Pro Asp Ala Thr Gly Ser Gly Lys Arg515 520 525Val Leu Leu Ile Asp His Asp Asp Ser Phe Val His Met Leu Ala Asp530 535 540Tyr Phe Arg Gln Val Gly Ala Ser Val Thr Val Val Arg Tyr Val His545 550 555 560Ala Leu Asp Met Leu Lys Gln Lys Arg Trp Asp Leu Leu Val Leu Ser565 570 575Pro Gly Pro Gly Arg Pro Glu Asp Phe Gly Ile Arg Lys Thr Ile Asp580 585 590Ala Ala Leu Glu Asn Lys Leu Pro Val Phe Gly Val Cys Leu Gly Val595 600 605Gln Ala Ile Gly Glu Tyr Phe Gly Gly Glu Leu Gly Gln Leu Thr His610 615 620Pro Ala His Gly Arg Pro Ser Arg Val Gln Val Arg Gly Gly Arg Leu625 630 635 640
Met Arg Asn Leu Pro Ser Glu Ile Val Ile Gly Arg Tyr His Ser Leu645 650 655Tyr Val Glu Arg Asp Ser Met Pro Glu Val Leu Ser Val Thr Ala Ser660 665 670Thr Glu Asp Gly Val Ala Met Ala Leu Glu His Lys Thr Leu Pro Val675 680 685Ala Gly Val Gln Phe His Pro Glu Ser Leu Met Ser Leu Gly Gly Glu690 695 700Val Gly Leu Arg Ile Val Glu Asn Ala Phe Arg Leu Asp Ala Arg Val705 710 715 720Asp<210>131<211>728<212>PRT<213>深紅紅螺菌(Rhodospirillum rubrum)<400>131Met Gln Thr Ser Thr Phe Thr Thr Ala Gly Gly Phe Thr Ile Ser Ser1 5 10 15Cys Leu Arg Pro Leu Ala Gly Ala Asp Gly Ala Phe Glu Ala Leu Ile20 25 30Asp Arg Leu Asp Arg His Arg Gly Met Val Ile Ala Ser Thr Tyr Glu35 40 45Tyr Pro Gly Arg Tyr Arg Arg His Ala Leu Gly Phe Cys Asp Pro Pro50 55 60Leu Val Leu Glu Gly Lys Gly Arg Glu Ala His Leu Leu Ala Leu Asn65 70 75 80Arg Arg Gly Arg Ala Leu Leu Pro Ala Leu Ala Val Gly Leu Glu Gly85 90 95Ala Ala Gly Leu Glu Gly Leu Arg Arg Glu Ala Asp Arg Leu Val Leu100 105 110Arg Val Lys Ala Met Ala Pro Trp Phe Pro Glu Glu Glu Arg Ser Arg115 120 125
Gln Pro Ser Leu Met Ser Val Val Arg Ala Leu Ala Gly Leu Phe Ala130 135 140Ala Glu Asn Asp Pro Phe Phe Gly Leu Val Gly Ala Phe Gly Tyr Asp145 150 155 160Leu Gly Leu Ala Phe Glu Arg Leu Pro His Ala Arg Pro Arg Ser Ala165 170 175Asp His Arg Asp Leu Val Leu Tyr Leu Pro Asp Arg Leu Leu Ile Asp180 185 190Asp Pro Glu Ala Gly Gly Leu Ala Glu Arg Leu Tyr Asp Ile Thr Ala195 200 205Ala Asp Gly Ala Ser Thr Ala Gly Leu Ala Arg Glu Thr Ala Ala Tyr210 215 220Thr Ala Asp His Pro Ala Gly Gly Val Pro Ile Glu Asp Asp Met Pro225 230 235 240Pro Gly Ala Tyr Gly Ala Ile Val Arg Gly Leu Lys Glu Ala Phe Ala245 250 255Ala Gly Asp Leu Phe Glu Ala Val Pro Ser Arg Ala Leu Arg Arg Pro260 265 270Cys Ala Glu Ala Pro Ser Arg Leu Tyr Arg Arg Leu Arg Ala Ala Asn275 280 285Pro Ala Pro Tyr Leu Phe Leu Ala Asn Leu Gly Ala Gly Glu His Leu290 295 300Ile Gly Ala Ser Pro Glu Met Phe Val Arg Val Gly Gly Ala Pro Gly305 310 315 320Ala Arg Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Ala Arg Gly325 330 335Pro Asp Ala Leu Gly Asp Ala Glu Ala Ile Arg Thr Leu Leu Asn Ser340 345 350Thr Lys Asp Glu Ala Glu Leu Thr Met Cys Thr Asp Val Asp Arg Asn355 360 365Asp Lys Ala Arg Val Cys Val Ala Gly Ser Val Thr Val Ile Gly Arg370 375 380
Arg Gln Ile Glu Leu Tyr Ser Arg Leu Ile His Thr Val Asp His Val385 390 395 400Glu Gly Arg Leu Arg Pro Glu Leu Asp Ala Leu Asp Ala Phe Leu Ser405 410 415His Cys Trp Ala Val Thr Val Thr Gly Ala Pro Lys Arg Ala Ala Met420 425 430Ala Ala Val Glu Ala Val Glu Arg Ala Pro Arg Ala Trp Tyr Gly Gly435 440 445Ala Ile Gly Arg Leu Gly Phe Asp Gly Thr Leu Asp Thr Gly Leu Val450 455 460Leu Arg Thr Ile Arg Leu Arg His Gly Val Ala Glu Val Arg Val Gly465 470 475 480Ala Thr Leu Leu His Arg Ser Asp Pro Glu Glu Glu Glu Ala Glu Thr485 490 495Leu Leu Lys Ala Ser Ala Leu Leu Ala Leu Leu Asp Ala Thr Thr Pro500 505 510Ala Lys Pro Asn Ala Pro His Leu Pro Leu Arg Gly Arg Ala Pro Arg515 520 525Val Leu Val Ile Asp His Glu Asp Ser Phe Val His Thr Leu Ala Ser530 535 540Tyr Leu Arg Asn Ala Gly Ala Glu Thr Thr Val Leu Arg Trp Asp Val545 550 555 560Pro Ala Ala Val Arg Ala Gly Val Glu Ala Asp Leu Leu Val Leu Ser565 570 575Pro Gly Pro Gly Thr Pro Ser Arg Phe Ala Leu Gly Ala Ser Leu Asp580 585 590Trp Ala Val Ala Arg Gly Leu Pro Val Phe Gly Val Cys Leu Gly Leu595 600 605Gln Gly Ile Val Glu Gln Ala Gly Gly Arg Leu Ala Arg Leu Ala Val610 615 620Pro Ala His Gly Met Ala Ser Thr Leu Arg Leu Val Ala Pro Gly Asp
625 630 635 640Pro Leu Phe Ala Gly Leu Pro Thr Thr Met Arg Val Gly Arg Tyr His645 650 655Ser Leu His Ala Glu Arg Ala Ser Leu Pro Asp Ser Leu Glu Ile Leu660 665 670Ala Glu Ser Asp Asp Gly Val Ile Met Ala Leu Arg His Arg Leu Leu675 680 685Pro Phe Ser Ala Val Gln Phe His Pro Glu Ser Leu Met Thr Leu Asp690 695 700Gly Gly Ala Gly Pro Arg Leu Ile Ala Asn Leu Leu Glu Thr Leu Ser705 710 715 720Val Pro Arg Thr Arg His Ala Ala725<210>132<211>726<212>PRT<213>Thermobifida fusca<400>132Val Asp Asp Asn Ser Tyr Thr Thr Ser Gly Gly Ile Thr Val His Arg1 5 10 15Thr Ala Val Pro Cys Asp Pro Arg Ala Leu Ala Asp Leu Thr Val Asn20 25 30Val Glu Gln Arg Arg Gly Gly Val Leu Ser Ser Gly Met Glu Tyr Pro35 40 45Gly Arg Tyr Ser Arg Trp His Leu Gly Tyr Val Asp Pro Cys Leu Glu50 55 60Val Val Ala Arg Gly Arg Thr Ile Gly Ala Thr Ala Leu Asn Asp Arg65 70 75 80Gly Arg Val Leu Leu Pro Ala Val Ala Arg Ala Leu Thr Ala His Gly85 90 95Ala Val Val Glu His Thr Asp Asp Thr Val Ala Val Thr Val Pro Glu100 105 110Pro Asp Pro Thr Glu Phe Phe Thr Glu Glu Glu Arg Ser Arg Arg Leu
115 120 125Ser Val Phe Ser Ala Leu Arg Ala Leu Val Gly Val Phe Phe His Ala130 135 140Glu Glu Pro His Leu Gly Leu Tyr Gly Ala Phe Gly Tyr Asp Leu Ala145 150 155 160Phe Gln Phe Glu Pro Ile Glu Gln Val Leu Pro Arg Asp Pro Glu Asp165 170 175Arg Asp Leu Val Leu His Leu Pro Asp Glu Ile Ile Val His Asp Arg180 185 190Lys Arg Glu Ile Cys Gln Arg Tyr Ser Tyr Asp Phe Thr Leu Pro Glu195 200 205Glu Leu Arg Gly Pro Ala Gly Ala Thr Thr Arg Gly Leu Pro Arg His210 215 220Thr Glu Pro Thr Pro Pro Val Thr Pro Ala Ala Glu Val Pro Pro Gln225 230 235 240Pro Glu Pro Gly Ser Tyr Ala Arg Ile Val Ala Glu Ala Lys Glu Arg245 250 255Phe Arg Arg Gly Asp Leu Phe Glu Val Val Pro Ser His Arg Leu Tyr260 265 270Ala Pro Cys Ala Ser Pro Ala Arg Phe Tyr Glu Arg Leu Arg Glu Arg275 280 285Asn Pro Ala Pro Tyr Glu Phe Phe Leu Asn Leu Gly Glu Gly Glu Tyr290 295 300Leu Val Gly Ala Ser Pro Glu Met Phe Val Arg Val Thr Gly Arg Pro305 310 315 320Gly Glu Gly Gln Arg Val Glu Thr Cys Pro Ile Ser Gly Thr Ile Lys325 330 335Arg Gly Ala Asp Ala Val Gly Asp Ala Glu Asn Ile Lys Glu Leu Leu340 345 350Ser Ser Ala Lys Glu Glu Ser Glu Leu Thr Met Cys Thr Asp Val Asp355 360 365
Arg Asn Asp Lys Ser Arg Val Cys Val Pro Gly Ser Val Arg Val Ile370 375 380Gly Arg Arg Gln Ile Glu Met Tyr Ser Arg Leu Ile His Thr Val Asp385 390 395 400His Ile Glu Gly Ile Leu Arg Pro Glu Leu Asp Ala Ile Asp Ala Phe405 410 415Leu Thr His Met Trp Ala Val Thr Val Thr Gly Ala Pro Lys Thr Trp420 425 430Ala Met Arg Phe Ile Glu Gln His Glu Ser Ser Pro Arg Arg Trp Tyr435 440 445Gly Gly Ala Val Gly Val Ile Asn Phe Asp Gly Ser Met Asn Thr Gly450 455 460Leu Thr Leu Arg Thr Ala His Ile Arg Asp Gly Val Ala Thr Val Arg465 470 475 480Ala Gly Ala Thr Leu Leu Tyr Asp Ser Asp Pro Glu Ala Glu Glu Arg485 490 495Glu Thr Phe Leu Lys Ala Arg Ala Leu Leu Glu Thr Leu Thr Asp Glu500 505 510Gly Glu Glu Thr Ser Lys Ala Ala Pro Ala Val Glu Gln Val Gly Ala515 520 525Gly Met Arg Val Leu Leu Val Asp His Glu Asp Ser Phe Val Asn Thr530 535 540Leu Ala Asp Tyr Val Arg Arg His Gly Ala Glu Val Thr Thr Val Arg545 550 555 560Tyr Gly Phe Asp Pro Ala Leu Leu Asp Gln Met Arg Pro Asp Leu Val565 570 575Val Leu Ser Pro Gly Pro Gly Leu Pro Ala Asp Phe Ala Met Ser Ala580 585 590Leu Leu Lys Glu Leu Asp Ala Arg Gly Leu Pro Val Phe Gly Val Cys595 600 605Leu Gly Leu Gln Ala Met Val Glu Tyr Ala Gly Gly Glu Leu Leu Thr610 615 620
Leu Asp Thr Pro Val His Gly Lys Pro Gly Arg Val Arg Val Thr Gly625 630 635 640Gly Ala Leu Leu Ala Gly Leu Gly Glu Asp Gly Glu Phe Thr Ala Ala645 650 655Arg Tyr His Ser Val Tyr Ala Thr Pro Asp Arg Val Lys Gly Phe Glu660 665 670Val Thr Ala Val Thr Glu Asp Asp Gly Phe Pro Val Val Met Ala Ile675 680 685Glu Asn Ala Glu Ala Arg Arg Trp Ala Val Gln Phe His Pro Glu Ser690 695 700Ile Leu Thr Gly Arg Val Gly Glu Gln Ile Val Ala Asn Val Leu Arg705 710 715 720Leu Ala Arg Glu Ser Ser725<210>133<211>281<212>PRT<213>高粱(Sorghum bicolor)<400>133Met Val Cys Ser Gln Leu Thr Ala Ala Gly Ala Ser Ser Leu Ala Ala1 5 10 15Ala Ala Val Arg Ser Arg Ala His Ser Pro Ala Ala Ala Phe Ala Gln20 25 30Leu Arg Ser Thr Pro Arg Ile Ala Ser Ala Gly Leu Ser Val Lys Gly35 40 45Asn Arg Ala Ala Leu Pro Leu Val Ala Ala Ala Gly Pro Ala Ala Ala50 55 60Ala Pro Val Ala Asp Leu Asp Gly Pro Pro Ala Thr Glu Lys Gln Pro65 70 75 80Ile lle Val Ile Asp Asn Tyr Asp Ser Phe Thr Tyr Ash Leu Cys Gln85 90 95Tyr Met Gly Glu Leu Gly Leu Asn Phe Glu Val Tyr Arg Asn Asp Glu100 105 110
Leu Thr Ile Glu Asp Val Lys Arg Lys Asn Pro Arg Gly Ile Leu Ile115 120 125Ser Pro Gly Pro Gly Glu Pro Gln Asp Ser Gly Ile Ser Leu Gln Ala130 135 140Val Leu Glu Leu Gly Pro Thr Ile Pro Ile Phe Gly Val Cys Met Gly145 150 155 160Leu Gln Cys Ile Gly Glu Ala Phe Gly Gly Lys Ile Ile Arg Ala Pro165 170 175Ser Gly Val Met His Gly Lys Ser Ser Pro Val Tyr Tyr Asp Glu Glu180 185 190Leu Gly Lys Ala Leu Phe Asn Gly Leu Pro Asn Pro Phe Thr Ala Ala195 200 205Arg Tyr His Ser Leu Val Ile Glu Glu Glu Thr Phe Pro His Asp Ala210 215 220Leu Glu Ala Thr Ala Trp Thr Glu Asp Gly Leu Ile Met Ala Ala Arg225 230 235 240His Lys Lys Tyr Lys His Ile Gln Gly Val Gln Phe His Pro Glu Ser245 250 255Ile Ile Thr Pro Asp Gly Lys Lys Ile Ile Leu Asn Phe Val Arg Phe260 265 270Ile Glu Glu Leu Glu Lys Gln Arg Ser275 280<210>134<211>1122<212>DNA<213>高粱(Sorghum bicolor)<400>134gtcgacccac gcgtccgccg cctccccacc ctcgctccct ctcaccgccc gccaccgccg 60agatggtctg ctcccagctc accgccgcgg gggcctcctc cctcgccgcc gcagcggttc120gttcccgggc gcattcccca gccgccgcct tcgcgcaact acggtcgacg cctcgcattg180cgagcgctgg cttgtcggtt aagggaaaca gggcggctct tccgttggtc gccgccgcgg240ggccggccgc ggcggcgccg gtggccgacc tggacggccc cccggccacg gagaagcagc300ccatcattgt catcgataac tacgacagct tcacctacaa cctctgccag tatatggggg360
agcttggatt gaactttgaa gtataccgca atgatgaact gaccatagaa gatgtaaaga420ggaagaaccc aagaggaata cttatttctc cagggcctgg tgaaccacaa gattcaggaa480tatcattgca ggctgttctt gaattaggcc caaccatccc aatttttgga gtttgcatgg540gcctgcagtg cattggggag gcatttgggg gaaagattat ccgtgctcct tctggagtga600tgcatgggaa aagctctcca gtttattacg acgaggaatt aggaaaggcc ttattcaatg660gcttgccaaa cccttttacc gctgcgaggt accacagctt ggtcattgag gaagaaacct720tcccgcatga tgctttagag gccactgcat ggactgaaga tggacttatc atggctgctc780gccacaagaa gtacaaacac atccagggtg tccaattcca cccggagagc atcatcaccc840ctgacggcaa gaaaatcatc ctcaatttcg tcagattcat tgaggaactg gagaagcagc900gttcctaggg aggtagatgc caccggtggc ttcatagatc agtcagaagc agagacaaag960gcgcttgaag ctgcgtagta ccgggtctgg cagtggaagt tagctaggaa acagcctttt 1020tcctccctta attcgttgtg ctcgtggtaa tataatctgt gtggactgaa tttcgaataa 1080agtccagctg ttcaaataaa aaaaaaaaaa aagggcggcc gc 1122<210>135<211>1934<212>DNA<213>高粱(Sorghum bicolor)<400>135gtcgacccac gcgtccgcgt gacaccccgc gcggcacctc cgcctcccca ccctcgctcc 60ctctcaccgc ccgccaccgc cgagatggtc tgctcccagc tcaccgccgc gggggcctcc120tccctcgccg ccgcagcggt tcgttcccgg gcgcattccc cagccgccgc cttcgcgcaa180ctacggtcga cgcctcgcat tgcgagcgct ggcttgtcgg ttaagggaaa cagggcggct240cttccgttgg tcgccgccgc ggggccggcc gcggcggcgc cggtggccga cctggacggc300cccccggcca cggagaagca gcccatcatt gtcatcgata actacgacag cttcacctac360aacctctgcc agtatatggg ggagcttgga ttgaactttg aagtataccg caatgatgaa420ctgaccatag aagatgtaaa gaggaagaac ccaagaggaa tacttatttc tccagggcct480ggtgaaccac aagattcagg aatatcattg caggctgttc ttgaattagg cccaaccatc540ccaatttttg gagtttgcat gggcctgcag tgcattgggg aggcatttgg gggaaagatt600atccgtgctc cttctggagt gatgcatggg aaaagctctc cagtttatta cgacgaggaa660ttaggaaagg ccttattcaa tggcttgcca aaccctttta ccgctgcgag gtaccacagc720ttggtcattg aggaagaaac cttcccgcat gatgctttag aggccactgc atggactgaa780gatggactta tcatggctgc tcgccacaag aagtacaaac acatccaggg tgtccaattc840cacccggaga gcatcatcac ccctgacggc aagaaaatca tcctcaattt cgtcagattc900
attgaggaac tggagaagca gcgttcctag ggaggtagat gccaccggtg gcttcataga960tcagtcagaa gcagagacaa aggcgcttga agctgcgtag taccgggtct ggcagtggaa 1020gttagctagg aaacagcctt tttcctccct taattcgttg tgctcgtggt aatataatct 1080gtgtggactg aatttcgaat aaagtccagc tgttcaaata aaaaaaaaaa aaaagggcgg 1140ccgctaccct cgaggccggc cgggccggga agccgcgatg ttaaatgtgt ggtccttagc 1200aatcaaatct gcgtacaaga tggaatctct attattttca gcgaaaccaa gggattccgt 1260gagcgcatcc gagggaggaa ggtgggcgta cctttaggct tctttccgac ctccgggaag 1320tgcggcgagg gtttcatggc gatgttggcg gctgcaaggc cggcgcgccg gatagaggcg 1380ggggcagggg aactgacaag ggtttaacta cgcgaacgcg cactgcagga atggacgagc 1440tcgctctctc aaatcggccg aatgcgctcg tcccaccgag acgccgtctt gctccgtctc 1500cctgtctcgc tcacgcggac gctccacgcg agcagggcag gccgaggagg gcgacggcgc 1560agccgggcga cggcgcgagg agagcgatgg cgcgaagagt gcagaacgcg cggctcggcg 1620gcggcgcagc tgtgcggcgg cgcggttggg ccgcggtggc ggagaacggt gaacggaaga 1680acgaagaaga aagggaaaga agcctttgta tgacacgtgg gtcccgcagt tagaagggtt 1740aaatctgttg tctcatccat cacgtagtct taattttttt ttcactagtc tgtgttaatg 1800ctacgatctt aagaagccag cgacaataag agtagctcta ataaaaaaaa aaaaaaaaag 1860aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaacaaaaa aaaaaaaaaa aaaggcccct 1920agggccctcg agct 1934<210>136<211>2055<212>DNA<213>玉米(Zea mays)<400>136ggccggccgg gactccactc cactccactc gcccgcgccc gccgcccgcg tgctcctccc 60tcgcgcccgc cccgccccgc tccgccccta tctatatcca ttcccgctcg tccccctcaa120caaccctcct cacggcgcac tcgtgttcgt gtcatcccgc ccgcaggccg cagtccatgg180ccaccgccag cctcgcgctc tcgctgcgcc tcgcgccgta ctcgcacccg ctgagcctcc240gccgccgggg ggccgccggc gtcacctgcc gcgccaccac cgccacgttc caccagcttg300acgccgtcgc ggtgagggag gaggagtcca ggttccggac ggcggcggcg gagggccgca360acctgctgcc gctcacgagg tgcatcttct ccgatcacct cacgcccgtg ctcgcctacc420gctgcctcgt caaggaggac gaacgcgagg cgcccagctt tctattcgag tctgtcgagc480aggggtccga gggcaccaat gtggggaggt acagcgtggt cggggcgcag ccttctatgg540aggtcgtggc caaggctaac catgtgacgg tcatggacca tgagatgaag tcgaggaggg600
agcacttcgt gcctgatccc atgaggatcc ccaggacaat catggagcag tggaacccgc660agattgctga cagcctccct gatgcatttt gtggaggatg ggttggattc ttctcatatg720atacagtgcg ttatgttgaa acaaagaagc ttcctttcag taaggcacca catgatgata780ggaaccttcc tgatattcat ttaggcctct atagtgacgt cattgtgttt gatcatgttg840aaaagaaaac acatgttatt cattgggtga ggacagactg ctatcgttct gttgatgaag900catatgaaga tggaagaaat cggcttgaag ctttgttatc aagattacat tgcctcaatg960tcccaacact ttcttctggt tctataaaac tcaatgttga aaactttggc ccagtaatgc 1020aaaaatcaac gatgtcaagc gaagaatata aaaatatcgt tgtccaagct aaagaacaca 1080tcttggccgg tgacattttc caagttgttt taagccagcg ttttgagaga cggacattcg 1140ccgacccctt tgaaatctat cgtgcattgc gcatcgtaaa tcctagtcca tatatggcct 1200atctacaggc acgaggttgt attctcgtgg catcgagtcc tgaaattctt acccgggtac 1260aaaagaggac aataatcaat cgtccgcttg ctggaaccat aagaagaggc aaaacaaaag 1320cagaagacaa aactttagaa caattgcttt tgagtgacga aaagcagtgt gctgaacata 1380ttatgctagt agatcttggc cgaaatgatg ttgggaaggt gtccaaacca ggttcagtaa 1440aggtagagaa attgatgaat atcgaacgat attctcatgt catgcacatc agctcaacag 1500taactggaga gctacgcgat gatcttacgt gttgggatgc gctacgagcc gcattgccag 1560ttggaaccgt tagtggcgct ccaaaggtga gagcaatgga gttgattgat cagctagaag 1620tgagtatgcg tgggccgtat agtggtggct ttggagggat ttcctttcgc ggcgacatgg 1680acattgcact ggctcttcgc actatcgtct tccccaccgc atctcggttt gataccatgt 1740actcgtacac agacagtaag tcccgacagg agtgggtggc tcacctccag gccggagctg 1800gcatagttgc tgatagcaaa ccggatgacg agcaccaaga gtgtataaac aaggctgcag 1860gtgttgctcg tgccattgac cttgctgaat ctacatttct tgaagactag tctagtctaa 1920tgaaggaaat gtatgtttaa gttctctgta caattatgga ttgtcctaga aaacaggctt 1980tcttaggccg aataaaaact caattgtaat aaagttaata aatggacaac tttagctaaa 2040aaaaaaaaaa aaaaa2055<210>137<211>577<212>PRT<213>玉米(Zea mays)<400>137Met Ala Thr Ala Ser Leu Ala Leu Ser Leu Arg Leu Ala Pro Tyr Ser1 5 10 15His Pro Leu Ser Leu Arg Arg Arg Gly Ala Ala Gly Val Thr Cys Arg
20 25 30Ala Thr Thr Ala Thr Phe His Gln Leu Asp Ala Val Ala Val Arg Glu35 40 45Glu Glu Ser Arg Phe Arg Thr Ala Ala Ala Glu Gly Arg Asn Leu Leu50 55 60Pro Leu Thr Arg Cys Ile Phe Ser Asp His Leu Thr Pro Val Leu Ala65 70 75 80Tyr Arg Cys Leu Val Lys Glu Asp Glu Arg Glu Ala Pro Ser Phe Leu85 90 95Phe Glu Ser Val Glu Gln Gly Ser Glu Gly Thr Asn Val Gly Arg Tyr100 105 110Ser Val Val Gly Ala Gln Pro Ser Met Glu Val Val Ala Lys Ala Asn115 120 125His Val Thr Val Met Asp His Glu Met Lys Ser Arg Arg Glu His Phe130 135 140Val Pro Asp Pro Met Arg Ile Pro Arg Thr Ile Met Glu Gln Trp Asn145 150 155 160Pro Gln Ile Ala Asp Ser Leu Pro Asp Ala Phe Cys Gly Gly Trp Val165 170 175Gly Phe Phe Ser Tyr Asp Thr Val Arg Tyr Val Glu Thr Lys Lys Leu180 185 190Pro Phe Ser Lys Ala Pro His Asp Asp Arg Asn Leu Pro Asp Ile His195 200 205Leu Gly Leu Tyr Ser Asp Val Ile Val Phe Asp His Val Glu Lys Lys210 215 220Thr His Val Ile His Trp Val Arg Thr Asp Cys Tyr Arg Ser Val Asp225 230 235 240Glu Ala Tyr Glu Asp Gly Arg Asn Arg Leu Glu Ala Leu Leu Ser Arg245 250 255Leu His Cys Leu Ash Val Pro Thr Leu Ser Ser Gly Ser Ile Lys Leu260 265 270
Asn Val Glu Asn Phe Gly Pro Val Met Gln Lys Ser Thr Met Ser Ser275 280 285Glu Glu Tyr Lys Asn Ile Val Val Gln Ala Lys Glu His Ile Leu Ala290 295 300Gly Asp Ile Phe Gln Val Val Leu Ser Gln Arg Phe Glu Arg Arg Thr305 310 315 320Phe Ala Asp Pro Phe Glu Ile Tyr Arg Ala Leu Arg Ile Val Asn Pro325 330 335Ser Pro Tyr Met Ala Tyr Leu Gln Ala Arg Gly Cys Ile Leu Val Ala340 345 350Ser Ser Pro Glu Ile Leu Thr Arg Val Gln Lys Arg Thr Ile Ile Asn355 360 365Arg Pro Leu Ala Gly Thr Ile Arg Arg Gly Lys Thr Lys Ala Glu Asp370 375 380Lys Thr Leu Glu Gln Leu Leu Leu Ser Asp Glu Lys Gln Cys Ala Glu385 390 395 400His Ile Met Leu Val Asp Leu Gly Arg Asn Asp Val Gly Lys Val Ser405 410 415Lys Pro Gly Ser Val Lys Val Glu Lys Leu Met Asn Ile Glu Arg Tyr420 425 430Ser His Val Met His Ile Ser Ser Thr Val Thr Gly Glu Leu Arg Asp435 440 445Asp Leu Thr Cys Trp Asp Ala Leu Arg Ala Ala Leu Pro Val Gly Thr450 455 460Val Ser Gly Ala Pro Lys Val Arg Ala Met Glu Leu Ile Asp Gln Leu465 470 475 480Glu Val Ser Met Arg Gly Pro Tyr Ser Gly Gly Phe Gly Gly Ile Ser485 490 495Phe Arg Gly Asp Met Asp Ile Ala Leu Ala Leu Arg Thr Ile Val Phe500 505 510Pro Thr Ala Ser Arg Phe Asp Thr Met Tyr Ser Tyr Thr Asp Ser Lys515 520 525
Ser Arg Gln Glu Trp Val Ala His Leu Gln Ala Gly Ala Gly Ile Val530 535 540Ala Asp Ser Lys Pro Asp Asp Glu His Gln Glu Cys Ile Asn Lys Ala545 550 555 560Ala Gly Val Ala Arg Ala Ile Asp Leu Ala Glu Ser Thr Phe Leu Glu565 570 575Asp<210>138<211>22<212>DNA<213>人工的<220>
<223>引物.
<400>138atggcagcgg taattctgga ag 22<210>139<211>19<212>DNA<213>人工的<220>
<223>引物.
<400>139tcaggctgcc ttggtcttc 19<210>140<211>30<212>DNA<213>人工的<220>
<223>引物.
<400>140actgactcca tggcagcggt aattctggaa 30<210>141<211>20<212>DNA<213>人工的<220>
<223>引物.
<400>141ctgactagtt caggctgctt20
<210>142<211>30<212>DNA<213>人工的<220>
<223>引物.
<400>142tgctgaccat ggcctgctcc cacatcgtcg 30<210>143<211>34<212>DNA<213>人工的<220>
<223>引物.
<400>143cagtgaattc ctacgaacgc tgcttctcca gttc3權(quán)利要求
1.編碼鄰氨基苯甲酸合酶的分離的DNA分子,其中該DNA分子編碼與選自SEQ ID NOs66、108、109、110、111、133或137的蛋白質(zhì)基本上同源的蛋白質(zhì)。
2.權(quán)利要求1的分離的DNA分子,其中該DNA分子與選自SEQ ID NOs67、68、104、105、106、107、134、135或136的DNA分子基本上同源。
3.包括表達(dá)盒的DNA構(gòu)建體,其中該可操作連接的表達(dá)盒包括(i)異源啟動(dòng)子;(ii)編碼單體鄰氨基苯甲酸合酶蛋白質(zhì)的DNA分子,其中該單體的鄰氨基苯甲酸合酶包括包含鄰氨基苯甲酸合酶α-結(jié)構(gòu)域和鄰氨基苯甲酸合酶β-結(jié)構(gòu)域的單個(gè)多肽;和(iii)轉(zhuǎn)錄終止子。
4.權(quán)利要求3的DNA構(gòu)建體,其中單體的鄰氨基苯甲酸合酶蛋白質(zhì)是與選自SEQ ID NOs4、7、43、57、77、78、79、80、81、82、130、131或132的蛋白質(zhì)基本上同源的。
5.權(quán)利要求3的DNA構(gòu)建體,其中該蛋白質(zhì)是SEQ ID NO4。
6.權(quán)利要求3的DNA構(gòu)建體,其中該DNA分子是與選自SEQ ID NOs1、75、76、83、121、122、123、124、125、126、127、128或129的DNA分子基本上同源的。
7.權(quán)利要求3的DNA構(gòu)建體,其中該表達(dá)盒進(jìn)一步編碼質(zhì)體運(yùn)輸肽。
8.權(quán)利要求7的DNA構(gòu)建體,其中該質(zhì)體運(yùn)輸肽選自SEQ ID NOs72、74、114或115。
9.包括第一表達(dá)盒的DNA構(gòu)建體,其中可操作連接的第一表達(dá)盒,包括(i)異源啟動(dòng)子;(ii)編碼鄰氨基苯甲酸合酶α-結(jié)構(gòu)域蛋白質(zhì)的DNA分子;和(iii)轉(zhuǎn)錄終止子。
10.權(quán)利要求9的DNA構(gòu)建體,進(jìn)一步包括可操作連接的第二表達(dá)盒,包括(i)異源啟動(dòng)子;(ii)編碼鄰氨基苯甲酸合酶β-結(jié)構(gòu)域蛋白質(zhì)的DNA分子;和iii)轉(zhuǎn)錄終止子。
11.權(quán)利要求10的DNA構(gòu)建體,其中該α-結(jié)構(gòu)域或β-結(jié)構(gòu)域蛋白質(zhì)是與選自SEQ ID NOs5、6、8、44、45、66、99、100、101、102、103、108、109、110、111、117、118、133或137的蛋白質(zhì)基本上同源的。
12.權(quán)利要求10的DNA構(gòu)建體,其中編碼鄰氨基苯甲酸合酶α-結(jié)構(gòu)域或β-結(jié)構(gòu)域蛋白質(zhì)的DNA分子是與選自SEQ ID NOs2、3、67、94、95、96、97、98、104、105、106、112、116、119、120、134、135或136的DNA分子基本上同源的。
13.權(quán)利要求10的DNA構(gòu)建體,其中編碼鄰氨基苯甲酸合酶α-結(jié)構(gòu)域或β-結(jié)構(gòu)域蛋白質(zhì)的DNA分子選自SEQ ID NOs2、3、67、94、95、96、97、98、104、105、106、112、116、119、120、134、135或136。
14.權(quán)利要求10的DNA構(gòu)建體,其中α-結(jié)構(gòu)域蛋白質(zhì)是SEQ ID NO66,而β-結(jié)構(gòu)域蛋白質(zhì)是SEQ ID NO118。
15.用于改變植物中色氨酸含量的方法,包括a.將包括編碼鄰氨基苯甲酸合酶的分離DNA分子的轉(zhuǎn)基因?qū)肟稍偕闹参锛?xì)胞,其中該分離的DNA被可操作地連接到在植物細(xì)胞中有功能的啟動(dòng)子上,以產(chǎn)生轉(zhuǎn)化的植物細(xì)胞;以及b.從轉(zhuǎn)化的植物細(xì)胞再生植物,其中該植物細(xì)胞表達(dá)由分離的DNA編碼的鄰氨基苯甲酸合酶,相對(duì)于不包括轉(zhuǎn)化基因的具有相同或相似遺傳背景的第二植物中的色氨酸含量,該合酶的數(shù)量有效增加了該植物中的色氨酸含量。
16.權(quán)利要求15的方法,其中鄰氨基苯甲酸合酶是與選自根瘤農(nóng)桿菌(Agrobacterium tumefaciens)、魚(yú)腥藻屬(Anabaena)M22983、巴西固氮螺菌(Azospirillum brasilense)、大豆慢生根瘤菌(Bradyrhizobium japonicum)、馬爾他布魯氏菌(Brucella melitensis)、Mesorhizobium loti、念珠藻屬的種(Nostocsp.)PCC7120、苜蓿中華根瘤菌(Rhizobium meliloti)、深紅紅螺菌(Rhodospirillum rubrum)、血色紅假單胞菌(Rhodopseudomonas palustris)或Thermobifida fusca的單體鄰氨基苯甲酸合酶基本上同源的。
17.權(quán)利要求15的方法,其中鄰氨基苯甲酸合酶選自SEQ ID NOs4、7、43、57、77、78、79、80、81、82、130、131或132。
18.權(quán)利要求15的方法,其中鄰氨基苯甲酸合酶是由與選自SEQ ID NOs1、75、76、83、121、122、123、124、125、126、127、128或129的DNA分子基本上同源的DNA分子編碼的。
19.權(quán)利要求15的方法,其中鄰氨基苯甲酸合酶包括嵌合的單體鄰氨基苯甲酸合酶,其包括第一種屬的鄰氨基苯甲酸合酶α-結(jié)構(gòu)域和來(lái)自第二種屬的鄰氨基苯甲酸合酶β-結(jié)構(gòu)域的融合體,其中第一種屬和第二種屬選自根瘤農(nóng)桿菌、魚(yú)腥藻屬M(fèi)22983、擬南芥(Arabidopsis thaliana)、巴西固氮螺菌、大豆慢生根瘤菌、馬爾他布魯氏菌、大腸桿菌(Escherichia coli)、薄肌眼蟲(chóng)藻(Euglena gracilis)、Mesorhizobium loti、念珠藻屬的種PCC7120、苜蓿中華根瘤菌、深紅紅螺菌、蕓香(Ruta graveolens)、血色紅假單胞菌、鼠傷寒沙門(mén)氏菌(Salmonella typhimurium)、粘質(zhì)沙雷氏桿菌(Serratia marcescens)、硫磺礦硫化葉菌(Sulfolobus solfataricus)、Thermobifida fusca、高粱、大豆、稻、棉花、小麥、煙草或玉米。
20.權(quán)利要求19的方法,其中α-結(jié)構(gòu)域或β-結(jié)構(gòu)域至少是部分的SEQ IDNOs4、5、6、7、8、43、44、45、57、66、77、78、79、80、81、82、99、100、101、102、103、108、109、110、111、117、118、130、131、132、133或137。
21.權(quán)利要求15的方法,其中DNA分子進(jìn)一步編碼質(zhì)體運(yùn)輸肽。
22.權(quán)利要求21的方法,其中該質(zhì)體運(yùn)輸肽選自SEQ ID NOs72、74、114或115。
23.權(quán)利要求15的方法,其中植物是雙子葉植物。
24.權(quán)利要求33的方法,其中雙子葉植物選自大豆、棉花或canola。
25.權(quán)利要求20的方法,其中植物是單子葉植物。
26.權(quán)利要求25的方法,其中單子葉植物選自玉米、稻、小麥、大麥或高粱。
27.用于制備動(dòng)物飼料或人食品的方法,包括a.將包括編碼鄰氨基苯甲酸合酶的分離DNA分子的轉(zhuǎn)基因?qū)肟稍偕闹参锛?xì)胞,其中該分離的DNA分子被可操作地連接到在植物細(xì)胞中有功能的啟動(dòng)子上,以產(chǎn)生轉(zhuǎn)化的植物細(xì)胞;以及b.從轉(zhuǎn)化的植物細(xì)胞再生植物,其中該植物細(xì)胞表達(dá)由分離的DNA分子編碼的鄰氨基苯甲酸合酶,相對(duì)于不包括轉(zhuǎn)化基因的具有相同或相似遺傳背景的第二植物中的色氨酸含量,該合酶的數(shù)量有效增加了該植物中的色氨酸含量。
28.權(quán)利要求27的方法,其中鄰氨基苯甲酸合酶選自SEQ ID NOs4、7、43、57、77、78、79、80、81、82、130、131或132。
29.權(quán)利要求27的方法,其中鄰氨基苯甲酸合酶包括嵌合的單體鄰氨基苯甲酸合酶,其包括第一種屬的鄰氨基苯甲酸合酶α-結(jié)構(gòu)域和第二種屬的鄰氨基苯甲酸合酶β-結(jié)構(gòu)域的融合體,其中第一種屬和第二種屬選自根瘤農(nóng)桿菌、魚(yú)腥藻屬M(fèi)22983、擬南芥、巴西固氮螺菌、大豆慢生根瘤菌、馬爾他布魯氏菌、大腸桿菌、薄肌眼蟲(chóng)藻、Mesorhizobium loti、念珠藻屬的種PCC7120、苜蓿中華根瘤菌、深紅紅螺菌、蕓香、血色紅假單胞菌、鼠傷寒沙門(mén)氏菌、粘質(zhì)沙雷氏桿菌、硫磺礦硫化葉菌、Thermobifida fusca、高粱、大豆、稻、棉花、小麥、煙草或玉米。
30.通過(guò)權(quán)利要求27的方法所制備的動(dòng)物飼料或人食品。
31.包括權(quán)利要求10的DNA構(gòu)建體的動(dòng)物飼料或人食品。
32.通過(guò)權(quán)利要求27的方法所制備的轉(zhuǎn)基因植物。
33.包括權(quán)利要求10的DNA構(gòu)建體的轉(zhuǎn)基因植物。
全文摘要
本發(fā)明提供通過(guò)在植物細(xì)胞中導(dǎo)入和表達(dá)編碼鄰氨基苯甲酸合酶的分離DNA片段來(lái)改變植物的色氨酸含量的方法。也提供用編碼鄰氨基苯甲酸合酶的分離DNA片段轉(zhuǎn)化的轉(zhuǎn)基因植物,以及來(lái)源于這些植物的人或動(dòng)物的食物、種子和后代。
文檔編號(hào)C12N15/82GK1852975SQ03815614
公開(kāi)日2006年10月25日 申請(qǐng)日期2003年5月5日 優(yōu)先權(quán)日2002年5月3日
發(fā)明者莉薩·M·韋弗, 蒂姆·N·奧爾馬索夫, 加布里拉·瓦杜瓦, 梁繼紅, 瑪格麗特·J·瓦拉戈納, 蒂亞馬岡德魯·V·文卡蒂什, 西瓦林加納·曼朱納思 申請(qǐng)人:孟山都技術(shù)公司