專利名稱:用于產(chǎn)生l-賴氨酸的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通過(guò)培養(yǎng)微生物產(chǎn)生L-賴氨酸的方法,所述的微生物是通過(guò)借助基于基因工程的技術(shù)修飾用于發(fā)酵生產(chǎn)氨基酸的棒狀桿菌等獲得的。
作為飼料添加劑的賴氨酸通常通過(guò)利用屬于棒狀桿菌的L-賴氨酸-產(chǎn)生突變菌株用發(fā)酵法產(chǎn)生?,F(xiàn)在已知各種L-賴氨酸-產(chǎn)生菌是從屬于棒狀桿菌的野生型菌株開(kāi)始經(jīng)人工突變產(chǎn)生的那些。
就棒狀桿菌而言,公開(kāi)了載體質(zhì)粒,這種質(zhì)粒是在細(xì)菌細(xì)胞中可自主復(fù)制的,并具有藥物抗性標(biāo)記基因(參見(jiàn)美國(guó)專利4,514,502),并公開(kāi)了用于把基因引入細(xì)菌細(xì)胞的方法(例如日本專利申請(qǐng)公開(kāi)2207791)。也公開(kāi)了通過(guò)利用以上所述的技術(shù)培養(yǎng)L-蘇氨酸-或L-異亮氨酸-產(chǎn)生菌的可能性(參見(jiàn)美國(guó)專利4,452,890和4,442,208)。培養(yǎng)L-賴氨酸-產(chǎn)生菌的技術(shù)是已知的,在其中參與L-賴氨酸生物合成的基因摻入到載體質(zhì)粒中,以便在細(xì)菌細(xì)胞中擴(kuò)增該基因(例如,日本專利申請(qǐng)公開(kāi)56-160997)。
L-賴氨酸生物合成的已知基因包括,例如,二氫二吡啶甲酸還原酶基因(日本專利申請(qǐng)公開(kāi)7-75578)和天冬氨酸轉(zhuǎn)氨酶基因(日本專利申請(qǐng)公開(kāi)6-102028)(其中參與L-賴氨酸生物合成的基因被克隆),以及磷酸烯醇丙酮酸羧酶基因(日本專利申請(qǐng)公開(kāi)60-87788),二氫二吡啶甲酸合酶基因(日本專利出版物6-55149)和二氨基庚二酸脫羧酶基因(日本專利申請(qǐng)公開(kāi)60-62994)(其中擴(kuò)增基因影響L-賴氨酸產(chǎn)量)。
就參與L-賴氨酸生物合成的酶而言,在以野生型使用時(shí),經(jīng)歷反饋抑制的酶的情況是已知的。在這種情況下,L-賴氨酸產(chǎn)量通過(guò)這樣一種方法得到提高,即引入具有脫敏反饋抑制之突變的基因。具體地說(shuō),已知這樣的基因包括天冬氨酸激酶基因(國(guó)際出版物WO 94/25605)。
如上所述,借助L-賴氨酸生物合成系統(tǒng)的基因擴(kuò)增或突變基因的引入獲得了成功的結(jié)果。例如,具有突變天冬氨酸激酶基因(脫敏了由賴氨酸和蘇氨酸引起的固有抑制)的棒狀桿菌產(chǎn)生大量的L-賴氨酸(大約25g/L)。然而,這種細(xì)菌與不具有突變天冬氨酸激酶基因的細(xì)菌比較生長(zhǎng)速度降低。也報(bào)道了通過(guò)除了引入突變天冬氨酸激酶基因之外進(jìn)一步引入二氫二吡啶甲酸合酶基因可提高L-賴氨酸產(chǎn)量(應(yīng)用的和環(huán)境的微生物學(xué),57(6),1746-1752(1991))。然而,這種細(xì)菌生長(zhǎng)速度進(jìn)一步降低。
就二氫二吡啶甲酸還原酶基因而言,已有人指出,二氫二吡啶甲酸還原酶的活性在引入了該基因的棒狀桿菌中增加,然而,沒(méi)有報(bào)道對(duì)L-賴氨酸產(chǎn)量的影響(日本專利申請(qǐng)公開(kāi)775578)。
目前,對(duì)棒狀桿菌,沒(méi)有出現(xiàn)任何人已成功地通過(guò)組合L-賴氨酸生物合成的多種基因明顯改善L-賴氨酸產(chǎn)量而不抑制生長(zhǎng)的情況。也沒(méi)有報(bào)道通過(guò)增強(qiáng)L-賴氨酸生物合成基因改善生長(zhǎng)的情況。
本發(fā)明的目的是通過(guò)使用編碼以下酶的各種遺傳物質(zhì)DNA序列改善棒狀桿菌L-賴氨酸產(chǎn)量天冬氨酸激酶(如果必要,在下文中稱為"AK",前提是編碼AK蛋白質(zhì)的基因在下文中稱為"lysC"),二氫二吡啶甲酸還原酶(如果必要,在下文中稱為"DDPR",前提是編碼DDPR蛋白質(zhì)的基因在下文中稱為為"dapB"),二氫二吡啶甲酸合酶(如果必要,在下文中簡(jiǎn)化為"DDPS",前提是編碼DDPS蛋白質(zhì)的基因在下文中稱為"dapA"),二氨基庚二酸脫羧酶(如果必要,在下文中稱為"DDC",前提是編碼DDC蛋白質(zhì)的基因在下文中稱為"lysA"),和天冬氨酸轉(zhuǎn)氨酶(如果必要,在下文中稱為"AAT",前提是編碼AAT蛋白質(zhì)的基因在下文中稱為"aspC"),這些酶在棒狀桿菌細(xì)胞中是L-賴氨酸生物合成的重要酶。
本發(fā)明的原理基于這樣一種事實(shí)L-賴氨酸產(chǎn)量可以通過(guò)增強(qiáng)突變lysC(如果必要,在下文中簡(jiǎn)稱為"突變lysC")、dapA、dapB、lysA和aspC組合得到提高,所述lysC編碼突變AK(如果必要,在下文中簡(jiǎn)稱為"突變AK"),其中由賴氨酸和蘇氨酸產(chǎn)生的固有抑制被脫敏。
即,本發(fā)明提供了在棒狀桿菌細(xì)胞中可自主復(fù)制的重組DNA,該DNA包含編碼天冬氨酸激酶(其中實(shí)質(zhì)上脫敏了L-蘇氨酸L-賴氨酸的反饋抑制)的DNA序列,編碼二氫二吡啶甲酸還原酶的DNA序列,編碼二氫二吡啶甲酸合酶的DNA序列,編碼二氨基庚二酸脫羧酶的DNA序列和編碼天冬氨酸轉(zhuǎn)氨酶的DNA序列。
在另一方面,本發(fā)明提供了一種具有天冬氨酸激酶的棒狀桿菌(其中L-蘇氨酸和L-賴氨酸的反饋抑制實(shí)質(zhì)上被脫敏),該棒狀桿菌包含編碼二氫二吡啶甲酸還原酶的增強(qiáng)DNA序列、編碼二氫吡啶甲酸還原酶的增強(qiáng)DNA序列、編碼二氫吡啶甲酸合酶的增強(qiáng)DNA序列、編碼二氨基庚二酸脫羧酶的增強(qiáng)DNA序列、編碼天冬氨酸轉(zhuǎn)氨酶的增強(qiáng)DNA序列。
在另一方面,本發(fā)明提供了一種用于產(chǎn)生L-賴氨酸的方法,該方法包括以下步驟在適當(dāng)?shù)呐囵B(yǎng)基中培養(yǎng)以上所述的任一棒狀桿菌使得在所說(shuō)的細(xì)菌的培養(yǎng)物中產(chǎn)生并積累L-賴氨酸,并從培養(yǎng)物收集L-賴氨酸。
本發(fā)明也提供了編碼包含SEQ ID NO31所示氨基酸序列之蛋白質(zhì)的DNA序列。所述DNA的實(shí)例是包含SEQ ID NO30所示的879-2178位核苷酸的核苷酸序列的DNA。
本發(fā)明還提供了載體pVK7,其是在大腸桿菌和乳發(fā)酵短桿菌細(xì)胞中可自主復(fù)制的,包含一個(gè)多克隆位點(diǎn)和lacZ’。
在本發(fā)明中所稱的棒狀桿菌是在Bergey’s細(xì)菌學(xué)手冊(cè)(第8版p.599(1974))中限定的一組微生物,其是無(wú)孢子-形成能力的需氧革蘭氏-陽(yáng)性-非抗酸棒桿狀菌。棒狀桿菌包括屬于棒桿菌屬的細(xì)菌,屬于短桿菌短的細(xì)菌(迄今為止分類為短桿菌屬但現(xiàn)在與棒桿菌屬細(xì)菌合并在一起)和與屬于棒桿菌的細(xì)菌密切相關(guān)的短桿菌屬的細(xì)菌。
按照本發(fā)明,棒狀桿菌的L-賴氨酸產(chǎn)量可以得到提高。
附圖簡(jiǎn)要說(shuō)明
圖1說(shuō)明包含突變lysC的質(zhì)粒p399AK9B和p399AKYB的構(gòu)建方法。
圖2說(shuō)明包含dapB和Brevi.-ori質(zhì)粒pDPRB的構(gòu)建方法。
圖3說(shuō)明包含dapA和Brevi.-ori質(zhì)粒pDPSB的構(gòu)建方法。
圖4說(shuō)明的包含lysA的質(zhì)粒p299LYSA的構(gòu)建方法。
圖5說(shuō)明包含lysA和Brevi.-ori的質(zhì)粒pLYSAB的構(gòu)建方法。
圖6說(shuō)明包含lysC,dapB和Brevi.-ori的質(zhì)粒pCRCAB的構(gòu)建方法。
圖7說(shuō)明包含突變lysC和dapB的質(zhì)粒pCB的構(gòu)建方法。
圖8說(shuō)明包含dapAl dapB和Brevi.-ori的質(zhì)粒pAB的構(gòu)建方法。
圖9說(shuō)明包含突變lysC,dapA,dapB和Brevi.-ori的質(zhì)粒pCAB的構(gòu)建方法。
圖10說(shuō)明包含突變lysC,dapA,aapB,lysA和Brevi.-ori的質(zhì)粒PCABL的構(gòu)建方法。
圖11說(shuō)明棒狀桿菌新克隆載體pVKG和pVK7的構(gòu)建方法。
圖12說(shuō)明包含aspC的質(zhì)粒pOm的構(gòu)建方法。
圖13說(shuō)明ATCC 13869染色體DNA片段上的兩個(gè)ORF。
圖14說(shuō)明pORF1的構(gòu)建方法。
1制備用于本發(fā)明的L-賴氨酸生物合成的基因用于本發(fā)明的L-賴氨酸生物合成的基因分別通過(guò)以下方法獲得從DNA供體細(xì)菌染色體DNA用質(zhì)粒載體或類似物構(gòu)建染色體DNA文庫(kù),選擇具有所需基因的菌株,和從所選擇的菌株回收已插入了所述基因的重組DNA。對(duì)用于本發(fā)明的L-賴氨酸生物合成的基因的DNA供體沒(méi)有特別的限制,只要L-賴氨酸生物合成的所需基因表達(dá)酶蛋白質(zhì)(其在棒狀桿菌細(xì)胞中起作用)。然而,DNA供體優(yōu)選地是棒狀桿菌。
來(lái)源于棒狀桿菌的lysC,aapA,dapB和lysA的所有基因具有已知的序列。因此,可以通過(guò)按照聚合酶鏈反應(yīng)方法(PCR;see White,T.J.等,Trends Genet.,5,185(1989))進(jìn)行擴(kuò)增來(lái)獲得它們。
用于本發(fā)明的L-賴氨酸生物合成的各種基因可以按照以下例舉的方法獲得(1)突變lysC的制備包含突變lysC的DNA片段可以從突變菌株制備,在所述菌株中由L-蘇氨酸和L-賴氨酸產(chǎn)生的AK活性的協(xié)同反饋抑制實(shí)質(zhì)上被脫敏(國(guó)際出版物WO94/25605)。這樣一種突變菌株可以通過(guò)例如用誘變劑如紫外光和N-甲基-N-硝基-N-亞硝基胍(NTG)對(duì)來(lái)源于棒狀桿菌野生型菌株的一組細(xì)胞進(jìn)行常規(guī)突變處理獲得。AK活性可以通過(guò)用由Miyajima,R.等在生物化學(xué)雜志(1968),63(2),139-148中描述的方法測(cè)量。最優(yōu)選的這樣的突變菌株由L-賴氨酸-產(chǎn)生菌AJ3445(FERM 1944)代表,其來(lái)源于突變處理乳發(fā)酵短桿菌ATCC 13869野生型菌株(現(xiàn)在其改變的名稱是Corynebacterium alutamicum)。
另外,突變lysC也可由包含野生型lysC的質(zhì)粒DNA體外突變處理獲得。另一方面,突變脫敏L-賴氨酸和L-蘇氨酸產(chǎn)生的對(duì)AK活性的協(xié)同反饋抑制的信息是十分清楚的(國(guó)際出版物WO 94/25605)。因此,在該信息的基礎(chǔ)上按照定點(diǎn)突變方法也可以制備突變lysC。
可以按照例如Saito和Miura(H.Saito和K.Miura,生物化學(xué)生物物理學(xué)報(bào),72,619(1963))的方法通過(guò)制備染色體DNA或按照聚合酶鏈反應(yīng)方法(PCR;參見(jiàn)White,T.J.等Trends Genet.,5,185(1989))擴(kuò)增lysC從棒狀桿菌分離包含lysC的片段。
以單鏈DNA例證性地說(shuō)明DNA引物,所說(shuō)單鏈DNA是具有SEQ ID NO1和2所示的核苷酸序列的23鏈節(jié)和21鏈節(jié)的,以便擴(kuò)增例如基于谷氨酸棒桿菌已知序列(參見(jiàn)分子微生物學(xué)(1991),5(5),1197-1204;Mel.Gen.Genet.(1990),224,317-324)的編碼lysC的約1,643bp的區(qū)域??梢酝ㄟ^(guò)采用AppliedBiosystems生產(chǎn)的DNA合成儀380B型和采用phosphoamidite法(參見(jiàn)Tetrahedron Letters(1981),22,1859)按照常規(guī)方法合成DNA??梢酝ㄟ^(guò)用由Takara Shuzo生產(chǎn)的DNA熱循環(huán)器PJ2000型按照供給者指定的方法和尾端DNA聚合酶進(jìn)行PCR。
優(yōu)選的是將經(jīng)PCR擴(kuò)增的lysC與在大腸桿菌和/和/或棒狀桿菌細(xì)胞中可自主復(fù)制的載體DNA連接制備重組DNA,把重組DNA引入預(yù)先的大腸桿菌細(xì)胞中。這一過(guò)程使隨后的操作容易進(jìn)行。在大腸桿菌細(xì)胞中可自主復(fù)制的載體優(yōu)選地是質(zhì)粒載體,其是在宿主的細(xì)胞中優(yōu)選的可自主復(fù)制的,包括例如,pUC19、pUC18、pBR322、pHSG299、pHSG399、pHSG398和RSF1010。
當(dāng)具有使得質(zhì)??梢栽诎魻顥U菌中自主復(fù)制的能力的DNA片段插入到這些載體中時(shí),它們可以用作在大腸桿菌和棒狀桿菌中可自主復(fù)制的穿梭載體。
這樣穿梭載體包括以下載體。含有各載體的微生物和其在國(guó)際保藏單位中的保藏號(hào)(在括號(hào))顯示如下pHCA 大腸桿菌AJ12617(FERM BP-3532)pAJ655 大腸桿菌AJ11882(FERM BP-136)谷氨酸棒桿菌SR8201(ATCC39135)pAJ1844大腸桿菌AJ11883(FERMBP-137)谷氨酸棒桿菌SR8202(ATCC39136)PAJ611 大腸桿菌AJ11884(FERM BP-138)pAJ3148谷氨酸棒桿菌SR8203(ATCC39137)pAJ440 枯草芽孢桿菌AJ11901(FERM BP-140)
這些載體可從其后的保藏的微生物獲得。采用溶菌酶和SDS裂解在對(duì)數(shù)的生長(zhǎng)期所收集的細(xì)胞,接著在30,000×g下從裂解物分離以獲得上清液。將聚乙二醇添加到上清液中,借助氯化銫-溴化乙錠均衡密度梯度離心進(jìn)行分級(jí)分離和純化。
可以通過(guò)按照以下方法將質(zhì)粒引入來(lái)轉(zhuǎn)化大腸桿菌,所述方法例如D.M.Morrison(酶學(xué)方法,68,326(1979))的方法或其中用氯化鈣處理受體細(xì)胞以增加DNA滲透性的方法(Mandel,M.和Higa,A.,分子生物學(xué)雜志,53,159(1970))。
當(dāng)按照以上所述的方法從AK野型菌株分離lysC時(shí),獲得野生型lysC,而從AK突變菌株分離lysC時(shí),獲得突變lysC。
包含野生型lysC的DNA片段的核苷酸序列的例子在序列表中SEQ ID NO3中顯示。野生型AK蛋白質(zhì)的α亞單位的氨基酸序列是從核苷酸序列推定的,其與DNA序列一起在序列表SEQ ID NO4中顯示。單獨(dú)的氨基酸序列在SEQID NO5中顯示。野生型AK蛋白質(zhì)的β亞單位的氨基酸序列是從DNA的核苷酸序列推定的,其與DNA序列一起在序列表SEQ ID NO6中顯示。單獨(dú)的氨基酸序列在SEQ ID NO7中顯示。在各亞單位中,GTG用作起始密碼子,相應(yīng)的氨基酸由甲硫氨酸代表。然而,這種代表涉及到甲硫氨酸、纈氨酸或甲酰甲硫氨酸。
對(duì)用于本發(fā)明的突變lysC沒(méi)有特別的限制,只要其編碼AK(其中由L-蘇氨酸和L-賴氨酸產(chǎn)生的協(xié)同反饋抑制被脫敏)。然而,突變lysC的一個(gè)例證性例子包括這樣的突變,其中與279位(從N-末端開(kāi)始計(jì)算)丙氨酸殘基相應(yīng)的氨基酸殘基改變成為非丙氨酸和非非野生型AK氨基酸序列中的β亞單位中的酸性氨基酸的氨基酸殘基,與30位(從N-末端開(kāi)始計(jì)數(shù))丙氨酸殘基相應(yīng)的氨基酸殘基改變成為非丙氨酸和非野生型AK氨基酸序列中的β亞單位中的酸性氨基酸的氨基酸殘基。野生型AK的氨基酸序列具體來(lái)說(shuō)包括作為α亞單位的在序列表中SEQ ID NO5所示的氨基酸序列,作為β亞單位的在序列表中SEQ IDNO7所示的氨基酸序列。
稱為非丙氨酸和非酸性氨基酸的那些氨基酸殘基優(yōu)選的包括蘇氨酸、精氨酸、半胱氨酸、苯丙氨酸、脯氨酸、絲氨酸、酪氨酸和纈氨酸殘基。
對(duì)相應(yīng)于所要替代的氨基酸殘基的密碼子沒(méi)有特別的限制,只要它編碼所說(shuō)的氨基酸殘基??梢灶A(yù)計(jì),依據(jù)細(xì)菌物種和細(xì)菌菌株的不同,野生型AK的氨基酸序列可以稍微不同。具有基于在一個(gè)或多個(gè)位置上取代,缺失或插入一個(gè)或多個(gè)氨基酸殘基而不影響以上所述活性的突變的AK也可以用于本發(fā)明中。具有自發(fā)突變的編碼AK的DNA可以通過(guò)分離這樣一種DNA獲得,該DNA在嚴(yán)格條件與例如具有SEQ ID NO3所示的一部分核苷酸序列的DNA雜交。本文所說(shuō)的"嚴(yán)格條件"意指形成特異性雜交而不形成非特異性雜交的條件。用數(shù)值難于清楚表達(dá)所述條件。然而,例舉性的條件是這樣一種條件,在該條件下,具有高同源性的核酸(例如具有不低于90%同源性的DNA)相互雜交或者是這樣一種條件,其溫度是從熔點(diǎn)溫度Tm到(Tm-30)C,優(yōu)選地是從Tm到(Tm-20)C,鹽濃度相當(dāng)于1×SSC,優(yōu)選地相當(dāng)于0.1×SSC。
基于例如,取代、缺失或插入一個(gè)或多個(gè)氨基酸殘基進(jìn)行過(guò)人工突變的其它AK也可以使用,只要對(duì)AK活性實(shí)質(zhì)上沒(méi)有影響和對(duì)L-賴氨酸和L-蘇氨酸的協(xié)同反饋抑制的脫敏沒(méi)有影響??梢酝ㄟ^(guò)例如定點(diǎn)突變修飾核苷酸序列,產(chǎn)生特定位點(diǎn)的缺失或插入,由此來(lái)獲得編碼具有人工突變的AK的DNA。也可以通過(guò)已知誘變處理方法獲得具有突變的lysC。誘變處理包括用羥胺或類似物體外處理包含lysC的DNA,用誘變?nèi)缱贤夤饣蛘T變劑(其是用于常規(guī)人工誘變的,如N-甲基-N-硝基-N-亞硝基胍(NTG)或硝酸)處理具有包含lysC之DNA的微生物的。誘變處理后,可以通過(guò)選擇編碼或產(chǎn)生AK(其具有AK活性,其氨基酸序列從經(jīng)歷誘變處理的DNA或者經(jīng)歷誘變處理的微生物突變)的DNA或微生物測(cè)定引入了突變或者發(fā)生了突變的位點(diǎn)。對(duì)所引入突變的位點(diǎn)沒(méi)有特定的限制,只要對(duì)AK活性實(shí)質(zhì)上沒(méi)有影響和對(duì)反饋抑制的脫敏沒(méi)有影響。所引入的突變的數(shù)目隨在蛋白質(zhì)的立體結(jié)構(gòu)中的氨基酸的位置和種類變化,并且沒(méi)有特定的限制,只要對(duì)AK活性實(shí)質(zhì)上沒(méi)有影響和對(duì)反饋抑制的脫敏沒(méi)有影響。該數(shù)目通常是1至20,優(yōu)選地是1至10。
本領(lǐng)域技術(shù)人員易于測(cè)定具有以上所述的突變的相應(yīng)于氨基酸序列中特定丙氨酸的殘基的氨基酸殘基。
通過(guò)將突變lysC質(zhì)粒p399AK9B引入乳發(fā)酵短桿菌野生型菌株AJ12036菌株(FERM BP-734)獲得的AJ12691菌株已于1992年4月10日以保藏號(hào)FERM P-12918保藏在國(guó)際貿(mào)易和工業(yè)部工業(yè)科學(xué)和技術(shù)機(jī)構(gòu)的國(guó)立生命科學(xué)和人體技術(shù)研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本),基于布達(dá)佩斯條約于1995年2月10日轉(zhuǎn)變成國(guó)際保藏,以保藏號(hào)FERM BP-4999保藏。(2)dapB的制備可以借助PCR從棒狀桿菌的染色體制備包含dapB的DNA片段。對(duì)DNA供體沒(méi)有特別的限制,然而,由乳發(fā)酵短桿菌ATCC 13869菌株所例證。
對(duì)乳發(fā)酵短桿菌編碼DDPR的DNA序列是已知的(生物技術(shù)雜志,175(9),2743-2749(1993)),基于該序列可以制備PCR的DNA引物。這樣的DNA引物由分別具有序列表SEQ ID NO8和9中所示的核苷酸序列的23-鏈節(jié)DNA所具體例證??梢砸耘c以上所述的有關(guān)lysC的那些相同的方式進(jìn)行DNA的合成、PCR和包含獲得的dapB的質(zhì)粒的制備。
包含dapB之DNA片段的核苷酸序列和由所述核苷酸序列編碼的推斷的氨基酸序列在SEQ ID NO10中顯示。單獨(dú)的氨基酸序列在SEQ ID NO11中顯示。除編碼這種氨基酸序列的DNA片段之外,如果對(duì)DDPR活性實(shí)質(zhì)上沒(méi)有影響,本發(fā)明可以等同地使用編碼實(shí)質(zhì)上與SEQ ID NO11所示的氨基酸序列相同的氨基酸序列(即具有基于例如取代、缺失或插入一個(gè)或多個(gè)氨基酸之突變的氨基酸序列)的DNA片段??梢杂门c編碼具有突變(只要對(duì)AK活性實(shí)質(zhì)上沒(méi)有影響和對(duì)L-賴氨酸和L-蘇氨酸的協(xié)同反饋抑制的脫敏沒(méi)有影響)的AK的DNA的那些相同的方式獲得具有自發(fā)和人工突變的dapB。
基于布達(dá)佩斯條約,通過(guò)將包含以下實(shí)施例中所獲得的dapB的質(zhì)粒pCRDAPB引入到大腸桿菌JM109菌株中獲得的轉(zhuǎn)化菌株AJ13107已從1995年5月26日以保藏號(hào)FERM BP-5114國(guó)際保藏在國(guó)際貿(mào)易和工業(yè)部工業(yè)科學(xué)和技術(shù)機(jī)構(gòu)的國(guó)立生命科學(xué)和人體技術(shù)研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本)。(3)dapA的制備可以借助PCR從棒狀桿菌的染色體制備包含dapA的DNA片段。對(duì)DNA供體沒(méi)有特別的限制,然而,由乳發(fā)酵短桿菌ATCC 13869菌株所例證。
對(duì)乳發(fā)酵短桿菌編碼DDPS的DNA序列是已知的(參見(jiàn)核酸研究,18(21),6421,(1990);EMBL保藏號(hào)X53993),基于該序列可以制備PCR的DNA引物。這樣的DNA引物由分別具有序列表SEQ ID NO12和13中所示的核苷酸序列的23-鏈節(jié)DNA所具體例證??梢砸耘c以上所述的有關(guān)lysC的那些相同的方式進(jìn)行DNA的合成、PCR和包含獲得的dapA的質(zhì)粒的制備。
包含dapA和從核苷酸序列推斷的氨基酸序列之DNA片段的核苷酸序列在SEQ ID NO14中顯示。單獨(dú)的氨基酸序列在SEQ ID NO15中顯示。除編碼這種氨基酸序列的DNA片段之外,如果對(duì)DDPS活性實(shí)質(zhì)上沒(méi)有影響,本發(fā)明可以等同地使用編碼實(shí)質(zhì)上與SEQ ID NO15所示的氨基酸序列相同的氨基酸序列(即具有基于例如取代、缺失或插入一個(gè)或多個(gè)氨基酸之突變的氨基酸序列)的DNA片段。可以用與編碼具有突變(只要對(duì)AK活性實(shí)質(zhì)上沒(méi)有影響和對(duì)L-賴氨酸和L-蘇氨酸的協(xié)同反饋抑制的脫敏沒(méi)有影響)的AK的DNA的那些相同的方式獲得具有自發(fā)和人工突變的dapA。
基于布達(dá)佩斯條約,通過(guò)將包含以下實(shí)施例中所獲得的dapA的質(zhì)粒pCRDAPA引入到大腸桿菌JM109菌株中獲得的轉(zhuǎn)化菌株AJ13106已從1995年5月26日以保藏號(hào)FERM BP-5113國(guó)際保藏在國(guó)際貿(mào)易和工業(yè)部工業(yè)科學(xué)和技術(shù)機(jī)構(gòu)的國(guó)立生命科學(xué)和人體技術(shù)研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本)。(4)lysA的制備可以借助PCR從棒狀桿菌的染色體制備包含lysA的DNA片段。對(duì)DNA供體沒(méi)有特別的限制,然而,由乳發(fā)酵短桿菌ATCC 13869菌株所例證。
在棒狀桿菌中,lysA與argS一道形成操縱子(精氨酰-tRNA合酶基因),lysA存在于argS下游。lysA的表達(dá)由存在于argS上游的啟動(dòng)子調(diào)節(jié)(參見(jiàn)生物技術(shù)雜志,Nov.,7356-7362(1993))。谷氨酸棒桿菌的這些基因的DNA序列是已知的(參見(jiàn)分子微生物學(xué),4(11),1819-1830(1990);分子和普通遺傳學(xué),212,112-119(1988)),基于該序列可以制備PCR的DNA引物。這樣的DNA引物由分別具有序列表SEQ ID NO16(相應(yīng)于在分子微生物學(xué)4(11),1819-1830(1990)中描述的核苷酸序列中的11至33位核苷酸)和SEQ ID NO17(相應(yīng)于在分子和普通遺傳學(xué),212,112-119(1988)中描述的核苷酸序列中的1370至1392位核苷酸)中所示的核苷酸序列的23-鏈節(jié)DNA所具體例證??梢砸耘c以上所述的有關(guān)lysC的那些相同的方式進(jìn)行DNA的合成、PCR和包含獲得的lysA的質(zhì)粒的制備。
在以下描述的實(shí)施例中,包含啟動(dòng)子、argS和lysA的DNA片段用來(lái)增強(qiáng)lysA。然而,argS對(duì)本發(fā)明不是必要的。其允許使用在其中l(wèi)ysA就連接在啟動(dòng)子下游的DNA片段。
包含argS和lysA以及由核苷酸序列編碼的推斷的氨基酸序列的DNA片段的核苷酸序列在SEQ ID NO18中例證。由argS編碼的氨基酸序列的實(shí)例在SEQ ID NO19中顯示,由lysA編碼的氨基酸序列的實(shí)例在SEQ ID NO20中顯示。除編碼這些氨基酸序列的DNA片段之外,如果對(duì)DDC活性實(shí)質(zhì)上沒(méi)有影響,本發(fā)明可以等同地使用編碼實(shí)質(zhì)上與SEQ ID NO20所示的氨基酸序列相同的氨基酸序列(即具有基于例如取代、缺失或插入一個(gè)或多個(gè)氨基酸之突變的氨基酸序列)的DNA片段??梢杂门c編碼具有突變(只要對(duì)AK活性實(shí)質(zhì)上沒(méi)有影響和對(duì)L-賴氨酸和L-蘇氨酸的協(xié)同反饋抑制的脫敏沒(méi)有影響)的AK的DNA的那些相同的方式獲得具有自發(fā)和人工突變的lysA。(5)aspC的制備通過(guò)采用互補(bǔ)于AAT-缺失菌株的營(yíng)養(yǎng)缺陷性質(zhì)為指示,可以從微生物(如棒狀桿菌和屬于埃希氏桿菌屬的細(xì)菌)染色體制備的基因文庫(kù)制備包含aspC的DNA片段。對(duì)棒狀桿菌的DNA供體沒(méi)有特別的限制,然而,以乳發(fā)酵短桿菌ATCC 13869菌株例證。對(duì)屬于埃希氏桿菌屬的細(xì)菌的DNA供體沒(méi)有特別的限制,然而,以大腸桿菌JM109菌株例證。
具體地說(shuō),用于棒狀桿菌的aspC制備的方法是已知的(日本專利出版物6-102028),可以根據(jù)這種方法制備aspC。
對(duì)大腸桿菌,編碼AAT的DNA序列是已知的(Kuramitsu,S等,生物化學(xué)雜志,97(4),1259-1262(1985)),基于該序列可以制備PCR的DNA引物。這樣的DNA引物由分別具有序列表SEQ ID NO21和22中所示的核苷酸序列的20-鏈節(jié)DNA所具體例證??梢砸耘c以上所述的有關(guān)lysC的那些相同的方式進(jìn)行DNA的合成、PCR和包含獲得的aspC的質(zhì)粒的制備。
包含aspC和以及從核苷酸序列推斷的氨基酸序列的DNA片段的核苷酸序列在SEQ ID NO23中說(shuō)明。單獨(dú)的氨基酸序列在SEQ ID NO24中顯示。另一包含aspC和以及從核苷酸序列推斷的氨基酸序列的DNA片段的核苷酸序列在SEQ ID NO30中說(shuō)明。單獨(dú)的氨基酸序列在SEQ ID NO31中顯示。除編碼這些氨基酸序列的DNA片段之外,如果對(duì)AAT活性實(shí)質(zhì)上沒(méi)有影響,本發(fā)明可以等同地使用編碼實(shí)質(zhì)上與SEQ ID NO24或31所示的氨基酸序列相同的氨基酸序列(即具有基于例如取代、缺失或插入一個(gè)或多個(gè)氨基酸之突變的氨基酸序列)的DNA片段??梢杂门c編碼具有突變(只要對(duì)AK活性實(shí)質(zhì)上沒(méi)有影響和對(duì)L-賴氨酸和L-蘇氨酸的協(xié)同反饋抑制的脫敏沒(méi)有影響)的AK的DNA的那些相同的方式獲得具有自發(fā)和人工突變的aspC。
按照本發(fā)明以下所述的實(shí)施例9的方法已首先獲得了來(lái)源于乳發(fā)酵短桿菌的具有SEQ ID NO30所示的核苷酸序列的aspC。這樣,本發(fā)明提供了編碼包含SEQ ID NO31所示的氨基酸序列的蛋白質(zhì)的DNA。所述DNA的例子包括含有SEQ ID NO30所示的核苷酸序列中的879至2174位核苷酸DNA。2本發(fā)明的重組DNA和棒狀桿菌本發(fā)明的棒狀桿菌含有天冬氨酸激酶(突變AK),在其中由L-賴氨酸和L-蘇氨酸產(chǎn)生的反饋抑制實(shí)質(zhì)上被脫敏,其中所說(shuō)的編碼二氫二吡啶甲酸還原酶的DNA序列,編碼二氫二吡啶甲酸合酶的DNA序列,編碼天冬氨酸轉(zhuǎn)氨酶的DNA序列和編碼二氨基庚二酸脫羧酶的DNA序列被增強(qiáng)。
術(shù)語(yǔ)"增強(qiáng)"本文指這一事實(shí)通過(guò)例如,增加基因的拷貝數(shù),用強(qiáng)啟動(dòng)子,使用編碼具有高比活性的酶的基因或者組合這些方法,由所說(shuō)DNA編碼的酶的胞內(nèi)活性得到提高。
含有突變AK的棒狀桿菌可以是作為突變的結(jié)果產(chǎn)生突變天冬氨酸激酶的那些或通過(guò)引入突變lysC轉(zhuǎn)化的那些。
用以引入以上所述的DNA棒狀桿菌的例子包括,例如,下列賴氨酸-產(chǎn)生野生型菌株Corynebacterium acetoacidophilum ATCC 13870;Corynebacterium acetocrlutamicum ATCC 15806;美棒桿菌ATCC 15991;谷氨酸棒桿菌ATCC 13032;(Brevibacterium divaricatum)ATCC 14020;(乳發(fā)酵短桿菌)ATCC 13869;(Corynebacterium lilium)ATCC 15990;(Brevibacterium flavum)ATCC 14067;Corynebacterium melassecola ATCC 17965;Brevibacterium saccharolvticum ATCC 14066;Brevibacterium immariophilum ATCC 14068;Brevibacterium roseum ATCC 13825;Brevibacterium thioaenitalis ATCC 19240;Microbacterium ammoniaphilum ATCC 15354;Corynebacterium thermoaminoaenes AJ12340(FERM BP-1539)除了以上所述的細(xì)菌菌株外,其他可用的宿主包括,例如,來(lái)源于以上所述菌株的具有L-賴氨酸-產(chǎn)生能力的突變菌株。這樣的的人工突變菌株包括如下菌株(2-氨乙基)-半胱氨酸(在下文中簡(jiǎn)稱為"AEC")抗性突變菌株,如乳發(fā)酵短桿菌AJ11082(NRRL B-1147),日本專利出版物56-1914、56-1915、57-14157、57-14158、57-30474、58-10075、594993、61-35840、62-24074、62-36673、5-11958、7-112437和7-112438);突變菌株,其生長(zhǎng)需要氨基酸(如L-高絲氨酸)的突變菌株(日本專利出版物48-28078和56-6499);顯示出對(duì)AEC的抗性并需要氨基酸如L-亮氨酸、L-高絲氨酸、L-脯氨酸、L-絲氨酸、L-精氨酸、L-丙氨酸和L-纈氨酸的突變菌株(美國(guó)專利3,708,395和3,825,472);顯示出對(duì)DL-α-氨基-ε-己內(nèi)酰胺、α-氨基-月桂內(nèi)酰胺、天冬氨酸-類似物、磺胺類藥、醌型和N-月桂酰亮氨酸抗性的L-賴氨酸-產(chǎn)生突變菌株;顯示出對(duì)oxyaloacetate脫羧酶抑制劑或呼吸系統(tǒng)酶抗性的L-賴氨酸-產(chǎn)生突變菌株(日本專利申請(qǐng)公開(kāi)50-53588、50-31093、52-102498、53-9394、53-86089、55-9783、55-9759、56-32995和56-39778,以及日本專利出版物53-43591和53-1833);需要肌醇或醋酸的L-賴氨酸-產(chǎn)生突變菌株(日本專利申請(qǐng)55-9784和56-8692);對(duì)氟丙酮酸或不低于34℃的溫度表現(xiàn)出敏感性的L-賴氨酸-產(chǎn)生突變菌株(日本專利申請(qǐng)公開(kāi)55-9783和53-86090);屬于短桿菌屬或棒桿菌屬的表現(xiàn)出對(duì)乙二醇抗性并產(chǎn)生L-賴氨酸的產(chǎn)生突變菌株(美國(guó)專利4,411,997)。
在一個(gè)特定的實(shí)施方案中,為了如上所述在宿主中增強(qiáng)L-賴氨酸生物合成基因,通過(guò)采用質(zhì)粒載體、轉(zhuǎn)座子或噬菌體載體或類似物將所述基因引入到宿主中。一旦引入,就預(yù)期會(huì)有某種程度的增強(qiáng),即使使用低拷貝型載體。然而,優(yōu)選地是采用多拷貝型載體。這樣載體包括,例如以上所述的質(zhì)粒載體,pAJ655、pAJ1844、pAJG11、pAJ3148和pAJ440。此外,在以下文獻(xiàn)中描述了來(lái)源于棒狀桿菌的轉(zhuǎn)座子國(guó)際出版物W002/02627和W093/18151,歐洲專利出版物445385,日本專利申請(qǐng)公開(kāi)6-46867;Vertes,A.A.等,分子微生物學(xué),11,739-746(1994),;Bonamy,C.,等,分子微生物學(xué),14,571-581(1994);Vertes,A.A.等,Mel.Gen.Genet.,245,397-405(1994);Jagar,W.等,F(xiàn)EMS微生物學(xué)通訊,126,1-6(1995),日本專利申請(qǐng)公開(kāi)7-107976;日本專利申請(qǐng)公開(kāi)7-327680等。
在本發(fā)明中,不可缺少的是突變lysC必需被增強(qiáng)。允許使用在染色體DNA上的lysC的突變的那些或者其中突變lysC摻入到染色體DNA中從那些。另外,突變lysC可以通過(guò)用質(zhì)粒載體引入。另一方面,為了有效地產(chǎn)生L-賴氨酸,優(yōu)選地是增強(qiáng)dapA、dapB、lysA和aspC。
通過(guò)分別采用不同的載體,可以成功地將lysC、dapA、dapB、lysA和aspC各基因引入宿主中。另外,可以用單一載體將二、三、四或五種基因一起引入。當(dāng)使用不同的載體時(shí),基因可以以任何秩序引入,然而,優(yōu)選地使用這樣一些載體,它們具有在宿主細(xì)胞中的穩(wěn)定參與和隱藏機(jī)制,并且能夠相互共存。
特別是,用于把a(bǔ)spC引入棒狀桿菌的載體優(yōu)選地是載體pVK7。載體pVK7是本發(fā)明提供的棒狀桿菌的克隆載體,其是在大腸桿菌和乳發(fā)酵短桿菌的細(xì)胞中可自主復(fù)制的,包含一個(gè)多克隆位點(diǎn)和lacZ’。載體pVK7可以按照以下實(shí)施例8所描述的方法構(gòu)建。
通過(guò)例如向宿主棒狀桿菌引入在棒狀桿菌細(xì)胞中可自主復(fù)制的包含突變lysC和dapB、dapA、lysA和aspC的重組DNA,獲得含有突變AK并包含增強(qiáng)的dapB、dapA、lysA和aspC的棒狀桿菌。
可以通過(guò)例如把以上所述的參與L-賴氨酸生物合成的各基因插入到載體(如質(zhì)粒載體,轉(zhuǎn)座子或噬菌體載體)中獲得上述重組DNA。
在其中質(zhì)粒用作載體情況下,按照電脈沖方法(Sugimoto等,日本專利申請(qǐng)公開(kāi)2207791)可以將重組DNA引入宿主。用轉(zhuǎn)座子的基因擴(kuò)增可以通過(guò)引入質(zhì)粒進(jìn)行,該質(zhì)粒把轉(zhuǎn)座子攜帶至宿主細(xì)胞,并誘導(dǎo)轉(zhuǎn)座子轉(zhuǎn)座。
在用于本發(fā)明的棒狀桿菌中,除了以上提到的基因外,參與L-賴氨酸生物合成的基因(如編碼磷酸烯醇丙酮酸羧酶的DNA序列和編碼二氨基庚二酸脫氫酶的DNA序列)也可以增強(qiáng)。3用于產(chǎn)生L-賴氨酸的方法通過(guò)在合適的培養(yǎng)基中培養(yǎng)棒狀桿菌(包含如上所述的L-賴氨酸生物合成的增強(qiáng)的基因),使得L-賴氨酸在細(xì)菌培養(yǎng)物中產(chǎn)生和積累,并從培養(yǎng)物收集L-賴氨酸,由此可以有效地產(chǎn)生L-賴氨酸。
所用的培養(yǎng)基的例舉性例子是包含碳源、氮源、無(wú)機(jī)離子和可有可無(wú)的其它有機(jī)組分的普通培養(yǎng)基。
作為碳源,可以用食糖,如葡萄糖、果糖、蔗糖、糖蜜和淀粉水解物;和有機(jī)酸,如富馬酸、檸檬酸和琥珀酸。
作為氮源,可以用無(wú)機(jī)銨鹽,如硫酸銨、氯化銨和磷酸銨;有機(jī)氮,如大豆水解物;氨氣和氨水。
作為有機(jī)微量營(yíng)養(yǎng)源,以合適的量包含所需物質(zhì)(如維生素B1和L-高絲氨酸或酵母提取物等)是合乎需要的。此外,如果需要,少量添加磷酸鉀、硫酸鎂、鐵離子、錳離子等。
培養(yǎng)優(yōu)選地在需氧條件下進(jìn)行大約30至90小時(shí)。在培養(yǎng)期間培養(yǎng)溫度優(yōu)選地控制在25℃到37℃,pH優(yōu)選地控制在5至8。無(wú)機(jī)或有機(jī),酸性或堿性物質(zhì)或氨氣等可以用于調(diào)節(jié)pH。可以用普通的離子交換樹(shù)脂法、沉淀法和其它已知方法結(jié)合起來(lái)從培養(yǎng)物收集賴氨酸。
實(shí)施例以下參照實(shí)施例更詳細(xì)地解釋本發(fā)明。實(shí)施例1從乳發(fā)酵短桿菌制備野生型lysC基因和突變lysC基因1制備野生型和突變lysC和制備含有它們的質(zhì)粒將乳發(fā)酵短桿菌ATCC 13869菌株和通過(guò)突變處理從ATCC 13869菌株獲得的L-賴氨酸-產(chǎn)生突變菌株AJ3445(FERM P-1944)用作染色體DNA供體。AJ3445菌株已經(jīng)歷突變,使lysC改變得實(shí)質(zhì)上脫敏了由賴氨酸和蘇氨酸產(chǎn)生的協(xié)同抑制(生物化學(xué)雜志,68,701-710(1970))。
用PCR法(聚合酶鏈反應(yīng);參見(jiàn)White,T.J.等,Trends Genet,5,185(1989))從染色體DNA擴(kuò)增包含lysC的DNA片段,就用于擴(kuò)增的DNA引物而言,為了擴(kuò)增編碼lysC的1,643bp的區(qū),基于谷氨酸棒桿菌已知的序列(參見(jiàn)分子微生物學(xué)(1991),5(5),1197-1204;和Mel.Gen.Genet(1990),224,317-324)合成23鏈節(jié)和21鏈節(jié)(具有SEQ ID NO1和2所示的核苷酸序列)的單鏈DNA序列。經(jīng)Applied Biosystems生產(chǎn)的DNA合成儀380B型用普通方法和用phosphoamidite法(參見(jiàn)Tetrahedron Letters(1981),22,1859)合成DNA。
通過(guò)用Takara Shuzo生產(chǎn)的DNA熱循環(huán)儀PJ2000型按照供給者指定的方法和用尾端DNA聚合酶經(jīng)PCR擴(kuò)增所說(shuō)的基因。由瓊脂糖凝膠電泳確認(rèn)1,643kb的擴(kuò)增的基因片段。之后,用普通的方法純化從凝膠上切下的片段,用限制酶NruI(由Takara Shuzo生產(chǎn))和EcoRI(由Takara Shuzo生產(chǎn))消化該片段。
將pHSG399(參見(jiàn),S等,基因(1987),61 63-74)用作基因片段的克隆載體。用限制酶SmaI(由Takara Shuzo生產(chǎn))和EcoRI消化pHSG399,將其與擴(kuò)增的lysC片段連接。按照指定的方法用DNA連接試劑盒(由Takara Shuzo生產(chǎn))連接DNA。由此制備質(zhì)粒,其中從乳發(fā)酵短桿菌染色體擴(kuò)增的lysC片段分別與pHSG399連接。包含ATCC 13869(野生型菌株)lysC的質(zhì)粒命名為p399AKY,包含AJ3463(L-賴氨酸-產(chǎn)生菌)lysC的質(zhì)粒命名為p399AK9將具有使細(xì)菌在屬于棒桿菌屬的細(xì)菌中可自主復(fù)制能力的DNA片段(在下文中稱為“Brevi.-ori”)分別引入到p399AKY和p399AK9中,以制備攜帶有l(wèi)ysC的在屬于棒桿菌屬的細(xì)菌中可自主復(fù)制的質(zhì)粒。從包含Brevi.-ori并且在大腸桿菌和屬于棒桿菌屬的細(xì)菌兩種細(xì)胞中可自主復(fù)制的質(zhì)粒載體pHK4制備Brevi.-ori。pHK4通過(guò)以下方法構(gòu)建pHK4用KpnI(由Takara Shuzo生產(chǎn))和BamHI(由Takara Shuzo生產(chǎn))消化pHC4,提取Brevi.-ori片段,與pHSG298(也已由KprI和BamHI消化)連接(參見(jiàn)日本專利申請(qǐng)公開(kāi)5-7491)。pHK4使宿主具有卡那霉素抗性。含有pHK4的大腸桿菌稱命名為大腸桿菌AJ13136,該菌株已于1995年8月1日以保藏號(hào)FERM BP-5186保藏在國(guó)際貿(mào)易和工業(yè)部工業(yè)科學(xué)和技術(shù)機(jī)構(gòu)的國(guó)立生命科學(xué)和人體技術(shù)研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本)。
用限制酶KpnI和BamHI消化pHK4,使切開(kāi)的末端平端化。按照指定的方法用平端化試劑盒(由Takara Shuzo生產(chǎn))進(jìn)行平端的形成。形成平端后,連接上磷酸化BamHI接頭(由Takara Shuzo生產(chǎn))進(jìn)行修飾,使相應(yīng)于Brevi.-ori部分的DNA片段可以僅經(jīng)BamHI消化從pHK4切下。用BamHI消化這一質(zhì)粒,將所產(chǎn)生的Brevi.-ori DNA片段與p399AKY和p399AK9(也已分別用BamHI消化)連接,以制備各自含有在屬于棒桿菌屬的細(xì)菌中可自主復(fù)制的lysC基因的質(zhì)粒。
包含源于p399AKY的野生型lysC基因的質(zhì)粒命名為p399AKYB,包含源于p399AK9的突變lysC基因的質(zhì)粒命名為p399AK9B。p399AK9B和p399AKYB的構(gòu)建方法在圖1中顯示。通過(guò)把突變lysC質(zhì)粒p399AK9B引入乳發(fā)酵短桿菌野生型菌株所獲得的菌株AJ12691(AJ12036菌株,F(xiàn)ERM 734)已于1992年4月10日以保藏號(hào)FERM P-12918保藏在國(guó)際貿(mào)易和工業(yè)部工業(yè)科學(xué)和技術(shù)機(jī)構(gòu)的國(guó)立生命科學(xué)和人體技術(shù)研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本),基于布達(dá)佩斯條約于1995年2月10日轉(zhuǎn)變成國(guó)際保藏,以保藏號(hào)FERM BP-4999保藏。2測(cè)定乳發(fā)酵短桿菌野生型lysC和突變lysC的核苷酸序列從各自的轉(zhuǎn)化體制備包含野生型lysC的質(zhì)粒p399AKY和包含突變lysC的質(zhì)粒p399AK9,以測(cè)定野生型與突變lysC的核苷酸序列。核苷酸序列測(cè)定按照Sanger等(例如F.Sanger等,美國(guó)科學(xué)院學(xué)報(bào),74,5463(1977))的方法進(jìn)行。
由p399AKY編碼的野生型lysC的核苷酸序列在序列表SEQ ID NO3中顯示。另一方面,由p399AK9編碼的突變lysC的核苷酸序列僅具有一個(gè)核苷酸突變,這樣與野生型lysC比較,在SEQ ID NO3中的1051位G改變成A。已知谷氨酸棒桿菌的lysC有兩個(gè)在同一DNA鏈上的同一讀框中編碼的亞單位(α,β)(參見(jiàn),Kalinowski,J.等,分子微生物學(xué)(1991)5(5),1197-1204)。從同源性判斷,假定此處測(cè)序的基因也具有兩個(gè)在同一DNA鏈上的同一讀框中編碼的亞單位(α,β)。
從DNA的核苷酸序列推斷的野生型AK蛋白質(zhì)α-亞單位的氨基酸序列與DNA序列一起在SEQ ID NO4中顯示。單獨(dú)的氨基酸序列在SEQ ID NO5中顯示。從DNA的核苷酸序列推斷的野生型AK蛋白質(zhì)β-亞單位的氨基酸序列與DNA序列一起在SEQ ID NO6中顯示。單獨(dú)的氨基酸序列在SEQ ID NO7中顯示。在每一亞單位中,GTG用作起始密碼子,相應(yīng)的氨基酸由甲硫氨酸代表。然而,這種代表指甲硫氨酸、纈氨酸或甲酰甲硫氨酸。
另一方面,在突變lysC序列上的突變指出現(xiàn)氨基酸殘基取代,以便在野生型AK蛋白質(zhì)氨基酸序列中α-亞單位的279位丙氨酸殘基改變成為蘇氨酸殘基,β-亞單位的30位丙氨酸殘基改變成為蘇氨酸殘基(SEQ ID NO5、7)。實(shí)施例2從短桿菌屬制備dapB1制備dapB和構(gòu)建含有dapB的質(zhì)粒乳發(fā)酵短桿菌野生型菌株ATCC 13869用作染色體DNA供體。按照普通方法從ATCC 13869菌株制備染色體DNA。按照PCR從染色體DNA擴(kuò)增包含dapB的DNA片段。就用于擴(kuò)增的DNA引物而言,為了擴(kuò)增編碼DDPR的2.0kb的區(qū),基于乳發(fā)酵短桿菌已知的序列(參見(jiàn)細(xì)菌學(xué)雜志,175(9),2743-2749(1993))分別合成23鏈節(jié)(分別具有序列表中SEQ ID NO8和9所示的核苷酸序列)的DNA,DNA合成和PCR以與實(shí)施例1所描述的相同的方式進(jìn)行。將pCR-Script(由Invitrogen生產(chǎn))用作擴(kuò)增2,001bp的基因片段的克隆載體,將其與擴(kuò)增的dapB片段連接。由此構(gòu)建質(zhì)粒,其中從乳發(fā)酵短桿菌染色體擴(kuò)增的2,001bp dapB片段與pCR-Script連接。具有源于ATCC13869的dapB的如上所述獲得的質(zhì)粒命名為pCRDAPB。基于布達(dá)佩斯條約,通過(guò)把pCRDAPB引入大腸桿菌JM109菌株獲得的轉(zhuǎn)化菌株AJ13107已從1995年5月26日以保藏號(hào)FERMBP-5114國(guó)際保藏在國(guó)際貿(mào)易和工業(yè)部工業(yè)科學(xué)和技術(shù)機(jī)構(gòu)的國(guó)立生命科學(xué)和人體技術(shù)研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本)。
通過(guò)以EcoRV和SphI消化pCRDAPB提取包含DDPR結(jié)構(gòu)基因的1,101bp片段。將這一片段與pHSG399(已由HincII和SghI消化)以制備質(zhì)粒。該制備的質(zhì)粒命名為p399DPR。
將Brevi.-ori引入到制備的p399DPR中以構(gòu)建在棒狀桿菌中可自主復(fù)制的攜帶dapB的質(zhì)粒。用限制酶KpnI(由Takara Shuzo生產(chǎn))消化pHK4,使切開(kāi)的末端平端化。按照指定的方法用平端化試劑盒(由Takara Shuzo生產(chǎn))進(jìn)行平端的形成。形成平端后,連接上磷酸化BamHI接頭(由Takara Shuzo生產(chǎn))進(jìn)行修飾,使相應(yīng)于Brevi.-ori部分的DNA片段可以僅經(jīng)BamHI消化從pHK4切下。用BamHI消化這一質(zhì)粒,將所產(chǎn)生的Brevi.-ori DNA片段與p399DPR(也已用BamHI消化)連接,以制備含有在棒狀桿菌中可自主復(fù)制的dapB基因的質(zhì)粒。所制備的質(zhì)粒命名為pDPRB。pDPRB的構(gòu)建方法在圖2中顯示。2測(cè)定乳發(fā)酵短桿菌dapB的核苷酸序列從含有p399DPR的AJ13107菌株制備質(zhì)粒DNA,以與實(shí)施例1中描述的相同的方式測(cè)定其核苷酸序列。
所測(cè)定的核苷酸序列和從該核苷酸序列推斷的氨基酸序列在SEQ ID NO10中顯示,單獨(dú)的氨基酸序列在SEQ ID NO11中顯示。實(shí)施例3從短桿菌屬制備dapA1制備dapA和構(gòu)建含有dapA的質(zhì)粒乳發(fā)酵短桿菌野生型菌株ATCC 13869用作染色體DNA供體。按照普通方法從ATCC 13869菌株制備染色體DNA。按照PCR從染色體DNA擴(kuò)增包含dapA的DNA片段。就用于擴(kuò)增的DNA引物而言,為了擴(kuò)增編碼DDPS的1.5kb的區(qū),基于谷氨酸棒桿菌已知的序列(核酸研究,18(21),6421(1990);EMBL保藏號(hào)X53993)合成23鏈節(jié)的分別具有序列表中SEQ ID NO12和13所示的核苷酸序列的DNA,DNA合成和PCR以與實(shí)施例1所描述的相同的方式進(jìn)行。將pCR-1000(由Invitrogen生產(chǎn),參見(jiàn)生物技術(shù),9,657-663(1991))用作擴(kuò)增1,411bp的基因片段的克隆載體,將其與擴(kuò)增的dapA片段連接。DNA的連接按照指定的方法用DNA連接試劑盒進(jìn)行。由此構(gòu)建質(zhì)粒,其中從乳發(fā)酵短桿菌染色體擴(kuò)增的1,411bp dapA片段與pCR-1000連接。具有源于ATCC13869的dapA的如上所述獲得的質(zhì)粒命名為pCRDAPA?;诓歼_(dá)佩斯條約,通過(guò)把pCRDAPA引入大腸桿菌JM109菌株獲得的轉(zhuǎn)化菌株AJ13106已從1995年5月26日以保藏號(hào)FERM BP-5113國(guó)際保藏在國(guó)際貿(mào)易和工業(yè)部工業(yè)科學(xué)和技術(shù)機(jī)構(gòu)的國(guó)立生命科學(xué)和人體技術(shù)研究所(1-3,Higashi L-chome,Tsukuba-shi,Ibaraki-ken,305,日本)。
將Brevi.-ori引入到制備的pCRDAPA中以構(gòu)建在棒狀桿菌中可自主復(fù)制的攜帶dapA的質(zhì)粒。用限制酶KpnI和BamHI(由Takara Shuzo生產(chǎn))消化pHK4,使切開(kāi)的末端平端化。按照指定的方法用平端化試劑盒(由Takara Shuzo生產(chǎn))進(jìn)行平端的形成。形成平端后,連接上磷酸化SmaI接頭(由Takara Shuzo生產(chǎn))進(jìn)行修飾,使相應(yīng)于Brevi.-ori部分的DNA片段可以僅經(jīng)SmaI消化從pHK4切下。用SmaI消化這一質(zhì)粒,將所產(chǎn)生的Brevi.-ori DNA片段與pCRDAPA(也已用SmaI消化)連接,以制備含有在棒狀桿菌中可自主復(fù)制的dapA基因的質(zhì)粒。所制備的質(zhì)粒命名為pDPSB。pDPSB(Kmr)的構(gòu)建方法在圖3中顯示。2測(cè)定乳發(fā)酵短桿菌dapA的核苷酸序列從含有pCRDAPA的AJ13107菌株制備質(zhì)粒DNA,以與實(shí)施例1中描述的相同的方式測(cè)定其核苷酸序列。所測(cè)定的核苷酸序列和從該核苷酸序列推斷的氨基酸序列在SEQ ID NO14中顯示,單獨(dú)的氨基酸序列在SEQ ID NO15中顯示。實(shí)施例4從短桿菌屬制備lysA1制備lysA和構(gòu)建含有l(wèi)ysA的質(zhì)粒乳發(fā)酵短桿菌野生型菌株ATCC 13869用作染色體DNA供體。按照普通方法從ATCC 13869菌株制備染色體DNA。按照PCR從染色體DNA擴(kuò)增包含argS、lysA和操縱子的啟動(dòng)子的DNA片段。就用于擴(kuò)增的DNA引物而言,為了擴(kuò)增編碼精氨酰-tRNA合酶和DDC的3.6kb的區(qū),基于谷氨酸棒桿菌已知的序列(參見(jiàn)分子微生物學(xué),4(11),1819-1830(1990);分子和普通遺傳學(xué),212,112-119(1988)),使用23鏈節(jié)(分別具有序列表中SEQ ID NO16和17所示的核苷酸序列)的合成DNA,DNA合成和PCR以與實(shí)施例1所描述的相同的方式進(jìn)行。將pHSG399用作擴(kuò)增3,579bp的基因片段的克隆載體,用限制酶SmaI(由Takara Shuzo生產(chǎn))消化pHSG399,該質(zhì)粒與包含擴(kuò)增的lysA的DNA片段連接。具有源于ATCC13869的lysA的如上所述獲得的質(zhì)粒命名為p399LYSA。
通過(guò)以KpnI(由Takara Shuzo生產(chǎn))和BamHI(由Takara Shuzo生產(chǎn))消化p399LYSA提取包含lysA的DNA片段。將這一片段與pHSG299(已由KpnI和BamHI消化)。構(gòu)建p399LYSA的方法在圖4中顯示。
將Brevi.-ori引入到制備的p399LYSA中以構(gòu)建在棒狀桿菌中可自主復(fù)制的攜帶lysA的質(zhì)粒。用限制酶KpnI和BamHI消化pHK4,使切開(kāi)的末端平端化。按照指定的方法用平端化試劑盒(由Takara Shuzo生產(chǎn))進(jìn)行平端的形成。形成平端后,連接上磷酸化KpnI接頭(由Takara Shuzo生產(chǎn))進(jìn)行修飾,使相應(yīng)于Brevi.-ori部分的DNA片段可以僅經(jīng)KpnI消化從pHK4切下。用KpnI消化這一質(zhì)粒,將所產(chǎn)生的Brevi.-ori DNA片段與p299LYSA(也已用KpnI消化)連接,以制備含有在棒狀桿菌中可自主復(fù)制的lysA基因的質(zhì)粒。所制備的質(zhì)粒命名為pLYSAB。pLYSAB的構(gòu)建方法在圖5中顯示。2測(cè)定乳發(fā)酵短桿菌lysA的核苷酸序列制備質(zhì)粒p299LYSA的DNA,以與實(shí)施例1中描述的相同的方式測(cè)定其核苷酸序列。所測(cè)定的核苷酸序列和從該核苷酸序列推斷的氨基酸序列在SEQID NO18中顯示,有關(guān)核苷酸序列,由lysA編碼的氨基酸序列和由argS編碼的氨基酸序列分別在SEQ ID NO19和20中顯示。實(shí)施例5從大腸桿菌制備aspC和構(gòu)建含有aspC的質(zhì)粒大腸桿菌JM109菌株用作染色體DNA的供體。按照普通方法從大腸桿菌JM109菌株制備染色體DNA。按照PCR從染色體DNA擴(kuò)增包含aspC的DNA片段。就用于擴(kuò)增DNA引物而言,基于大腸桿菌已知的序列(參見(jiàn)Kuramitsu,S等,生物化學(xué)雜志,94(4),1259-1262(1985)),使用20鏈節(jié)(分別具有序列表中SEQ ID NO21和22所示的核苷酸序列)的合成DNA,DNA合成和PCR以與實(shí)施例1所描述的相同的方式進(jìn)行。將1,331bp的擴(kuò)增片段克隆進(jìn)TA克隆載體pCR1000。所構(gòu)建的質(zhì)粒命名為pCRASPC。
包含aspC的擴(kuò)增DNA的核苷酸序列和從該核苷酸序列推斷的氨基酸序列在SEQ ID NO23中顯示。單獨(dú)的氨基酸序列在SEQ ID NO24中顯示。比較實(shí)施例1構(gòu)建包含組合的突變lysC和dapA的質(zhì)粒從包含dapA的質(zhì)粒pCRDAPA和包含突變lysC和Brevi.-ori的質(zhì)粒p399AK9B構(gòu)建包含突變lysC、dapA和棒狀桿菌復(fù)制源的質(zhì)粒。以SalI完全消化p399AK9B,然后平端化,并與EcoRI接頭連接,以構(gòu)建其中SalI位點(diǎn)修飾成EcoRI位點(diǎn)的質(zhì)粒。所獲得的質(zhì)粒命名為p399AK9BSE。通過(guò)以EcoRI部分消化p399AK9BSE作為一個(gè)片段切下突變lysC和Brevi.-ori。將這一片段與已用EcoRI消化的pCRDAPA連接。所獲得的質(zhì)粒命名為pCRCAB。這一質(zhì)粒在大腸桿菌和棒狀桿菌中可自主復(fù)制,其使宿主具有對(duì)卡那霉素的抗性,該質(zhì)粒包含組合的突變lysC和dapA。pRCAB的構(gòu)建方法在圖6中顯示。比較實(shí)施例2構(gòu)建包含組合的突變lysC和dapB的質(zhì)粒從具有突變lysC的質(zhì)粒p399AK9和具有dapB的質(zhì)粒p399DPR構(gòu)建包含突變lysC和dapB的質(zhì)粒。通過(guò)以EcoRV和SphI消化p399DPR提取包含DDPR結(jié)構(gòu)基因的1,101bp的片段。將這一片段與已用SalI消化,然后平端化,并進(jìn)一步由SphI消化的p399AK9連接,以構(gòu)建包含組合的突變lysC和dapB的質(zhì)粒。這一質(zhì)粒命名為p399AKDDPR。
其次,將Brevi.-ori引入所獲得的p399AKDDPR。以限制酶KpnI(由TakaraShuzo生產(chǎn))消化包含Brevi.-ori的質(zhì)粒pHK4,使切下的邊緣平端化。按照指定的方法用平端化試劑盒(由Takara Shuzo生產(chǎn))進(jìn)行平端的形成。形成平端后,連接上磷酸化BamHI接頭(由Takara Shuzo生產(chǎn))進(jìn)行修飾,使相應(yīng)于Brevi.-ori部分的DNA片段可以僅經(jīng)BamHI消化從pHK4切下。用BamHI消化這一質(zhì)粒,將所產(chǎn)生的Brevi.-ori DNA片段與p399AKDDPR(也已用BamHI消化)連接,以構(gòu)建在棒狀桿菌中可自主復(fù)制的含有突變lysC和dapB的質(zhì)粒。構(gòu)建的質(zhì)粒命名為pCB。pCB的構(gòu)建方法在圖7中顯示。比較實(shí)施例3構(gòu)建包含組合的dapA和dapB的質(zhì)粒用KpnI和EcoRI消化包含dapA的質(zhì)粒pCRDAPA,以提取包含dapA的DNA片段,將其與已用KpnI和EcoRI消化的載體質(zhì)粒pHSG399連接。所獲得的質(zhì)粒命名為p399DPS。
另一方面,以SacII和EcoRI消化包含dapB的質(zhì)粒pCRDAPB,以提取包含編碼DDPR區(qū)的2.0kb的DNA片段,將其與已用SacH和EcoRI消化的p399DPS連接,以構(gòu)建包含組合的dapA和dapB的質(zhì)粒。所獲得的質(zhì)粒命名為p399AB。
其次,將Brevi.-ori引入p399AB。以限制酶BamHI(由Takara Shuzo生產(chǎn))消化包含Brevi.-ori的質(zhì)粒pHK4,使切下的邊緣平端化。按照指定的方法用平端化試劑盒(由Takara Shuzo生產(chǎn))進(jìn)行平端的形成。形成平端后,連接上磷酸化KpnI接頭(由Takara Shuzo生產(chǎn))進(jìn)行修飾,使相應(yīng)于Brevi.-ori部分的DNA片段可以僅經(jīng)KpnI消化從pHK4切下。用KpnI消化這一質(zhì)粒,將所產(chǎn)生的Brevi.-ori DNA片段與p399AB(也已用KpnI消化)連接,以構(gòu)建在棒狀桿菌中可自主復(fù)制的含有突變dapA和dapB的質(zhì)粒。構(gòu)建的質(zhì)粒命名為pAB。pAB的構(gòu)建方法在圖8中顯示。實(shí)施例6構(gòu)建包含組合的突變lysC、dapA和dapB的質(zhì)粒以EcoRI和SphI消化p399DPS,平端化,其后提取dapA基因片段。將這一片段與已用SalI消化并平端化的p399AK9連接。以構(gòu)建其中突變lysC和dapA共存的質(zhì)粒p399CA。
用EcoRI消化包含dapB的質(zhì)粒pCRDAPB,平端化,接著用SacI消化,以抽提包含dapB的2.0kb的DNA片段。用SpeI消化包含dapA和突變lysC的質(zhì)粒p399CA,平端化,之后用SacI消化,并與抽提的dapB片段連接,以便獲得包含突變lysC、dapA和dapB的質(zhì)粒。這一質(zhì)粒命名為p399CAB。
其次,將Brevi.-ori引入p399CAB。以限制酶BamHI(由Takara Shuzo生產(chǎn))消化包含Brevi.-ori的質(zhì)粒pHK4,使切下的邊緣平端化。按照指定的方法用平端化試劑盒(由Takara Shuzo生產(chǎn))進(jìn)行平端的形成。形成平端后,連接上磷酸化KpnI接頭(由Takara Shuzo生產(chǎn))進(jìn)行修飾,使相應(yīng)于Brevi.-ori部分的DNA片段可以僅經(jīng)KpnI消化從pHK4切下。用KpnI消化這一質(zhì)粒,將所產(chǎn)生的Brevi.-ori DNA片段與p399CAB(也已用KpnI消化)連接,以構(gòu)建在棒狀桿菌中可自主復(fù)制的含有突變lysA、dapA和dapB的質(zhì)粒。構(gòu)建的質(zhì)粒命名為pCAB。pCAB的構(gòu)建方法在圖9中顯示。實(shí)施例7構(gòu)建包含組合的突變lysC、dapA、dapB和lysA的質(zhì)粒用KpnI和BamHI消化包含lysA的質(zhì)粒p299LYSA,平端化,然后提取lysA基因片段。將這一片段與已用HpaI(由Takara Shuzo生產(chǎn))消化并平端化的質(zhì)粒pCAB連接,以構(gòu)建包含組合的突變lysC、dapA、dapB和lysA的并且在棒狀桿菌中可自主復(fù)制的質(zhì)粒。構(gòu)建的質(zhì)粒命名為pCABL。pCABL的構(gòu)建方法在圖10中顯示。值得注意的是,在pCABL中l(wèi)ysA基因片段以包含dapB基因的DNA片段插入到HpaI位點(diǎn)中,然而,HpaI位點(diǎn)位于dapB基因(SEQIDNO10中611至616位核苷酸)啟動(dòng)子上游,dapB基因不被分離。實(shí)施例8構(gòu)建包含aspC的質(zhì)粒作為用于把a(bǔ)spC引入棒狀桿菌的載體,使用新構(gòu)建的棒狀桿菌的克隆載體pVK7。如以下描述通過(guò)將大腸桿菌的載體pFHSG299(Kmr;Takeshita,S.等,基因,61,63-74(1987))與乳發(fā)酵短桿菌的隱蔽性質(zhì)粒pAM330構(gòu)建pVK7。從乳發(fā)酵短桿菌ATCC 13869菌株制備pAM330。以形成一個(gè)切割位點(diǎn)的限制酶AvaII(由Takara Shuzo生產(chǎn))消化pHSG299,用T4 DNA聚合酶平端化,并與已用HindIII(由Takara Shuzo生產(chǎn))消化和用T4 DNA聚合酶平端化的pAM330連接。根據(jù)在pHSG299中所插入的pAM330的方向,兩個(gè)獲得的質(zhì)粒命名為pVK6和pVK7,pVK7用于下列實(shí)驗(yàn)中。pVK7是在大腸桿菌和乳發(fā)酵短桿菌兩者中可自主復(fù)制的,并且具有來(lái)源于pHSG299和lacZ’的多克隆位點(diǎn)。pVKG和pVK7的構(gòu)建方法在圖11中顯示。
將aspC與構(gòu)建的穿梭載體pVK7連接。以限制酶EcoRI(由Takara Shuzo生產(chǎn))消化pCRASPC,并與已用EcoRI消化的pVK7連接。用DNA連接試劑盒(由Takara Shuzo生產(chǎn))進(jìn)行DNA的連接。在其中aspC片段與pVK7連接的哪些中,其中所述片段以與pVK7所具有的lac啟動(dòng)子的轉(zhuǎn)錄方向相同的方向插入的一個(gè)命名為pOm。pOm的構(gòu)建方法在圖12中顯示。實(shí)施例9從短桿菌屬制備aspC1制備源于乳發(fā)酵短桿菌的aspC屬于棒桿菌屬的天冬氨酸營(yíng)養(yǎng)缺陷菌株缺乏aspC活性(AAT活性),是天冬氨酸營(yíng)養(yǎng)缺陷的(I.Shiio和K.Ujikawa,生物化學(xué)雜志,84,647(1978)),通過(guò)引入基因文庫(kù)(國(guó)際出版物WO 95/23224)轉(zhuǎn)化該菌株,所述文庫(kù)是經(jīng)將乳發(fā)酵短桿菌野生型ATCC 13869菌株的染色體DNA的各種片段與在屬于棒桿菌屬的細(xì)菌細(xì)胞中起作用的載體連接制備的。收集所獲得的轉(zhuǎn)化體,以蒸餾水洗滌兩次。將幾千個(gè)轉(zhuǎn)化體中的幾十個(gè)平板接種到最小培養(yǎng)基(不含有非氨氮源的培養(yǎng)基10(I.Shiio和K.Ujikawa,生物化學(xué)雜志84,647(1978)))瓊脂平板上,以獲得恢復(fù)天冬氨酸營(yíng)養(yǎng)缺陷和在平板上顯示出極好的生長(zhǎng)的轉(zhuǎn)化體。從獲得的恢復(fù)天冬氨酸營(yíng)養(yǎng)缺陷的菌株回收質(zhì)粒DNA,所獲得的質(zhì)粒命名為pAC。當(dāng)乳發(fā)酵短桿菌野生型ATCC 13869菌株用pAC轉(zhuǎn)化時(shí),轉(zhuǎn)化體的aspC活性增加(第1表)。按照已知方法(參見(jiàn)Sizer,I.W.和Jenkins,W.T.,酶學(xué)方法vol.5,677-679(1962))進(jìn)行活性測(cè)定。
從這些結(jié)果可以證實(shí),在質(zhì)粒DNA上,ATCC 13869菌株染色體DNA的大約2.5kb片段包含乳發(fā)酵短桿菌的aspC。
表1菌株/質(zhì)粒 aspC活性(相對(duì)值)ATCC13869 1.0ATCC13869/pCABL8.92分析來(lái)源于乳發(fā)酵短桿菌的aspC根據(jù)Sangar等的雙脫氧方法(美國(guó)科學(xué)院學(xué)報(bào),74,5463(1977))測(cè)定2.5kb DNA片段的核苷酸序列,測(cè)定的核苷酸序列在SEQ ID NO25中顯示。用GENETYX-MAC版本7.3個(gè)程序(軟件Kaihatsu KK)分析核苷酸序列。ORF(開(kāi)放讀框)研究顯示如圖13中所示的兩個(gè)以相反方向重疊的ORF。432個(gè)氨基酸或426個(gè)氨基酸的ORF(其在SEQ ID NO25所示的核苷酸序列中在作為起始密碼子的579至881或897至899位核苷酸的ATG和作為終止密碼子的2175至2177位核苷酸的TAG之間以正方向被編碼)命名為ORF1。393個(gè)氨基酸的ORF(其在SEQ ID NO25所示的核苷酸序列中在作為起始密碼子的互補(bǔ)于2163至2165核苷酸的CAC的GTG和作為終止密碼子的2163至2165位核苷酸的CAC之間以反方向被編碼)命名為ORF2。3測(cè)定編碼aspC的ORF經(jīng)PCR從pAC擴(kuò)增不包含全長(zhǎng)ORF2和編碼全長(zhǎng)ORF1的DNA片段,以證實(shí)在兩個(gè)ORF中ORF是否編碼AAT蛋白質(zhì)。就用于擴(kuò)增的DNA引物而言,基于SEQ ID NO25所示的序列分別使用具有SEQ ID NO26和27所示的核苷酸序列的23-鏈節(jié)合成DNA。DNA合成和PCR以與實(shí)施例1中描述的相同的方式進(jìn)行。將在SEQ ID NO25中所示的核苷酸序列中的126至2,187位核苷酸的2,062bp擴(kuò)增片段克隆進(jìn)TA克隆載體pCR2.1(由Invitrogen產(chǎn)生)。所構(gòu)建的質(zhì)粒命名為pCRORF1。
按相同的方式,擴(kuò)增和克隆SEQ ID NO25中所示的核苷酸序列中的975至2,517位核苷酸的1,543bp基因片段,其僅編碼全長(zhǎng)ORF2。構(gòu)建的質(zhì)粒命名為pCRORF2。
為了將克隆DNA片段引入到屬于棒桿菌屬的細(xì)菌細(xì)胞中,將所述DNA片段與實(shí)施例8中所描述的穿梭載體連接。以限制酶EcoRI(由Takara Shuzo生產(chǎn))消化pCRORF1,與已用限制酶EcoRI消化的pVK7連接。用DNA連接試劑盒(由Takara Shuzo生產(chǎn))進(jìn)行DNA的連接。構(gòu)建的質(zhì)粒命名為pORF1。pORF1的構(gòu)建方法在圖14中顯示。
按相同的方式,從pCRORF2和pVK7構(gòu)建pORF2。
以與實(shí)施例9中相同的方式將制備的pORF1和pORF2引入乳發(fā)酵短桿菌野生型ATCC 13869菌株細(xì)胞中。測(cè)定ATCC 13869和質(zhì)粒-引入菌株ATCC13869/pORF1和ATCC 13869/pORF2的aspC活性。活性測(cè)定以與實(shí)施例1中描述的相同的方式進(jìn)行。如表2所示,僅ATCC 13869/pORF1觀察到aspC活性增加,表明aspC由ORF1編碼。
由以上提到的實(shí)驗(yàn)測(cè)定的乳發(fā)酵短桿菌aspC的核苷酸序列和由該核苷酸序列編碼的推斷的氨基酸序列在SEQ ID NO30中顯示。單獨(dú)的氨基酸序列在SEQ ID NO31中顯示。在GENEBANK上的同源性檢索顯示與來(lái)源于其它有機(jī)體的已知氨基酸序列(包括AAT蛋白質(zhì))無(wú)同源性。
表2菌株/質(zhì)粒 aspC活性(相對(duì)值)ATTC13869 1.0ATTC13869/pORF110.1ATTC13869/pORF21.2實(shí)施例10將包含L-賴氨酸生物合成基因的質(zhì)粒引入到乳發(fā)酵短桿菌L-賴氨酸-產(chǎn)生菌中將在實(shí)施例7中構(gòu)建的pCABL(Cmr)引入乳發(fā)酵短桿菌L-賴氨酸-產(chǎn)生菌AJ11082(NRRL B-11470)中。AJ11082菌株具有AEC抗性。按照電脈沖方法引入質(zhì)粒(Sugimoto等,日本專利申請(qǐng)公開(kāi)2-207791),基于質(zhì)粒具有的藥物抗性標(biāo)記選擇轉(zhuǎn)化體,當(dāng)包含氯霉素抗性基因的質(zhì)粒被引入時(shí),在包含5μg/ml氯霉素完全培養(yǎng)基上選擇轉(zhuǎn)化體,當(dāng)包含卡那霉素抗性基因的質(zhì)粒被引入時(shí),在包含25μg/ml卡那霉素完全培養(yǎng)基上選擇轉(zhuǎn)化體。
用具有大腸桿菌aspC的質(zhì)粒pOm(Kmr)或具有乳發(fā)酵短桿菌aspC的pORF1(Kmr)轉(zhuǎn)化如上所獲得的轉(zhuǎn)化體AJ11082/pCABL。因?yàn)樵谌榘l(fā)酵短桿菌細(xì)胞中pCABL用pHM1519為復(fù)制起點(diǎn),用Cm抗性基因?yàn)闃?biāo)記,在乳發(fā)酵短桿菌細(xì)胞中,pOm用pAM330為復(fù)制起點(diǎn),用Km抗性基因?yàn)闃?biāo)記,所以兩種質(zhì)粒都穩(wěn)定地包含在乳發(fā)酵短桿菌細(xì)胞中這樣,獲得了菌株AJ11082/pCABL/pOm和AJ11082/pCABL/pORF1,其中質(zhì)粒包含參與L-賴氨酸生物合成的基因和含有aspC。
以與以上所述相同的方式,將p399AK9B(Cmr)、pDPSB(Kmr)、pDPRB(Cmr)、pLYSAB(Cmr)、pOm、pCRCAB(Kmr)、pAB(Cmr)、pCB(Cmr)和pCAB(Cmr)引入AJ11082菌株中,以獲得其中l(wèi)ysC、dapA、dapB、lysA或aspC單獨(dú)被增強(qiáng)或者這些基因的兩種或多種同時(shí)被增強(qiáng)的轉(zhuǎn)化體。實(shí)施例11測(cè)定轉(zhuǎn)化體活性測(cè)定轉(zhuǎn)化體AJ11082/pCABL、AJ11082/pCABL/pOm和AJ11082/pCABL/pORF1的aspC活性。以與實(shí)施例9的3中描述的相同的方法進(jìn)行活性測(cè)定。如表3所示,觀察到在pOm載體上的lac啟動(dòng)子也在乳發(fā)酵短桿菌中起作用,AJ11082/pCABL/pOm的aspC活性增加約三倍,觀察到AJ11082/pCABL/pORF1的aspC活性進(jìn)一步增加約九倍。
表3菌株/質(zhì)粒 aspC活性(相對(duì)值)AJ110821.0AJ11082/pOm3.2AJ11082/pORF1 10.1AJ11082/pCABL 0.9AJ11082/pCABL/pOm 2.9AJ11082/pCABL/pORF111.5實(shí)施例12L-賴氨酸的產(chǎn)生在L-賴氨酸-產(chǎn)生培養(yǎng)基中培養(yǎng)實(shí)施例10中所獲得的各種轉(zhuǎn)化體,以估價(jià)L-賴氨酸產(chǎn)量。L-賴氨酸-產(chǎn)生培養(yǎng)基具有下列組成。[L-賴氨酸-產(chǎn)生培養(yǎng)基]除了碳酸鈣外,溶解下列組分(在1升中),用KOH調(diào)節(jié)pH為8.0。于115℃滅菌15分鐘,將已經(jīng)以干燥狀態(tài)在熱氣流中分別滅菌過(guò)的碳酸鈣(50g)加入其中。
葡萄糖 100g(NH4)2SO455gKH2PO41gMgSO4·7H2O 1g生物素 500μg
硫胺 2000μgFeSO4·7H2O0.01gMnSO4·7H2O0.01g煙酰胺 5mg蛋白質(zhì)水解物(Mamenou)30ml碳酸鈣 50g將各種類型的轉(zhuǎn)化體和親本菌株接種到具有以上組成的培養(yǎng)基中,以進(jìn)行在31.5℃下的往復(fù)振蕩培養(yǎng)。在培養(yǎng)40或72小時(shí)和生長(zhǎng)72小時(shí)(OD562)后產(chǎn)生的L-賴氨酸的量在表4中顯示。在表中,lysC*代表突變lysC。通過(guò)在10倍稀釋后在562nm測(cè)量OD定量測(cè)定生長(zhǎng)。
表4在40或72小時(shí)培養(yǎng)后積累的L-賴氨酸細(xì)菌菌株/質(zhì)粒 引入的基因 產(chǎn)生的L-賴氨酸量(g/l) 生長(zhǎng)40h后 72h后 (OD562/101)AJ 11082 22.029.8 0.450AJ 11082/p399AK9B lysC* 16.834.5 0.398AJ 11082/pDPSB dapA18.733.8 0.410AJ 11082/pDPRB dapB19.929.9 0.445AJ 11082/pLYSABlysA19.832.5 0.356AJ 11082/pOm aspC(E)[注1]21.830.9 0.457AJ 11082/pOm aspC(B)[注2]21.531.2 0.450AJ 11082/pCRCABlysC*,dapB 19.736.5 0.360AJ 11082/pAB dapA,dapB 19.034.8 0.390AJ 11082/pCB lysC*,dapB 23.335.0 0.440AJ 11082/pCAB lysC*,dapA,dapB 23.045.0 0.425AJ 11082/pCABL lysC*,dapA,dapB,lysA 26.246.5 0.379AJ 11082/pCABL/pOm lysC*,dapA,dapB,lysA,aspC(E)26.747.6 0.415AJ 11082/pCABL/pORF1 lysC*,dapA,dapB,lysA,aspC(B)27.148.8 0.410注1大腸桿菌的aspC注2乳發(fā)酵短桿菌的aspC
如上所示,當(dāng)突變lysC,dapA,dapB,lysA或aspC單獨(dú)增強(qiáng)時(shí),培養(yǎng)72小時(shí)后產(chǎn)生的L-賴氨酸的量大于或等于由親本菌株產(chǎn)生的量,然而,培養(yǎng)40小時(shí)后產(chǎn)生的L-賴氨酸的量低于由親本菌株產(chǎn)生的量。即,在短的培養(yǎng)時(shí)間內(nèi),L-賴氨酸-產(chǎn)生速度降低。同樣地,當(dāng)突變lysC和dapA或者dapA和daB一起增強(qiáng)時(shí),培養(yǎng)72小時(shí)后產(chǎn)生的L-賴氨酸的量大于由親本菌株產(chǎn)生的量,然而,培養(yǎng)40小時(shí)后產(chǎn)生的L-賴氨酸的量小于由親本菌株產(chǎn)生的量。這樣,L-賴氨酸-產(chǎn)生速度降低。
相反,在其中dapB與突變lysC一道增強(qiáng)的菌株,其中三種突變lysC、dapA和dapB增強(qiáng)的菌株,以及其中四種突變lysC、dapA、dapB和lysA增強(qiáng)的菌株的情況下,在短的和長(zhǎng)的培養(yǎng)時(shí)間內(nèi)所積累的L-賴氨酸的量都得到提高。
在其中五種突變lysC,dapA,dapB,lysA和aspC增強(qiáng)的大腸桿菌菌株,以及其中五種突變lysC,dapA,dapB,lysA和aspC增強(qiáng)的乳發(fā)酵短桿菌菌株的情況下,在任何培養(yǎng)時(shí)間內(nèi)L-賴氨酸的產(chǎn)量都得到提高。后者提高的程度高于前者。
序列表(1)一般信息(i)申請(qǐng)人AJINOMOTO有限公司(ii)發(fā)明名稱用于產(chǎn)生L-賴氨酸的方法(iii)序列數(shù)31個(gè)(iv)通訊地址(A)收信人(B)街道(C)城市(E)國(guó)家(F)ZIP(v)計(jì)算機(jī)可讀形式(A)介質(zhì)類型軟盤(pán)(B)計(jì)算機(jī)IBM PC兼容機(jī)(C)操作系統(tǒng)PC-DOS/MS-DOS(D)軟件Patentln Release#,版本#1.30(vi)當(dāng)前申請(qǐng)的數(shù)據(jù)(A)申請(qǐng)?zhí)?B)申請(qǐng)日(C)分類號(hào)(vii)在先申請(qǐng)的數(shù)據(jù)(A)申請(qǐng)?zhí)朖P 8-325659(B)申請(qǐng)日1996年12月5日(viii)律師/代理人信息(A)姓名(B)登記號(hào)(ix)電信信息(A)電話(B)傳真(2)SEQ ID NO1的信息(i)序列特征(A)長(zhǎng)度23個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述/desc="合成的DNA"(iv)反義否(xi)序列描述SEQ ID NO1TCGAAGTAGCACCTGTCACTT23(2)SEQ ID NO2的信息(i)序列特征(A)長(zhǎng)度21個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA"(iv)反義是(xi)序列描述SEQ ID NO2ACGGAATTCAATCTTACGGCC21(2)SEQ ID NO3的信息(i)序列特征(A)長(zhǎng)度1643個(gè)堿基(B)類型核酸(C)鏈型雙鏈
(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型基因組DNA(vi)原始來(lái)源(A)有機(jī)體乳發(fā)酵短桿菌(B)菌株ATCC 13869(xi)序列描述 SEQ ID NO3TCGCGAAGTA GCACCTGTCA CTTTTGTCTC AAATATTAAA TCGAATATCA ATATACGGTC 60TGTTTATTGG AACGCATCCC AGTGGCTGAG ACGCATCCGC TAAAGCCCCA GGAACCCTGT120GCAGAAAGAA AACACTCCTC TGGCTAGGTA GACACAGTTT ATAAAGGTAG AGTTGAGCGG180GTAACTGTCA GCACGTAGAT CGAAAGGTGC ACAAAGGTGG CCCTGGTCGT ACAGAAATAT240GGCGGTTCCT CGCTTGAGAG TGCGGAACGC ATTAGAAACG TCGCTGAACG GATCGTTGCC300ACCAAGAAGG CTGGAAATGA TGTCGTGGTT GTCTGCTCCG CAATGGGAGA CACCACGGAT360GAACTTCTAG AACTTGCAGC GGCAGTGAAT CCCGTTCCGC CAGCTCGTGA AATGGATATG420CTCCTGACTG CTGGTGAGCG TATTTCTAAC GCTCTCGTCG CCATGGCTAT TGAGTCCCTT480GGCGCAGAAG CTCAATCTTT CACTGGCTCT CAGGCTGGTG TGCTCACCAC CGAGCGCCAC540GGAAACGCAC GCATTGTTGA CGTCACACCG GGTCGTGTGC GTGAAGCACT CGATGAGGGC600AAGATCTGCA TTGTTGCTGG TTTTCAGGGT GTTAATAAAG AAACCCGCGA TGTCACCACG660TTGGGTCGTG GTGGTTCTGA CACCACTGCA GTTGCGTTGG CAGCTGCTTT GAACGCTGAT720GTGTGTGAGA TTTACTCGGA CGTTGACGGT GTGTATACCG CTGACCCGCG CATCGTTCCT780AATGCACAGA AGCTGGAAAA GCTCAGCTTC GAAGAAATGC TGGAACTTGC TGCTGTTGGC840TCCAAGATTT TGGTGCTGCG CAGTGTTGAA TACGCTCGTG CATTCAATGT GCCACTTCGC900GTACGCTCGT CTTATAGTAA TGATCCCGGC ACTTTGATTG CCGGCTCTAT GGAGGATATT960CCTGTGGAAG AAGCAGTCCT TACCGGTGTC GCAACCGACA AGTCCGAAGC CAAAGTAACC 1020GTTCTGGGTA TTTCCGATAA GCCAGGCGAG GCTGCCAAGG TTTTCCGTGC GTTGGCTGAT 1080GCAGAAATCA ACATTGACAT GGTTCTGCAG AACGTCTCCT CTGTGGAAGA CGGCACCACC 1140GACATCACGT TCACCTGCCC TCGCGCTGAC GGACGCCGTG CGATGGAGAT CTTGAAGAAG 1200CTTCAGGTTC AGGGCAACTG GACCAATGTG CTTTACGACG ACCAGGTCGG CAAAGTCTCC 1260CTCGTGGGTG CTGGCATGAA GTCTCACCCA GGTGTTACCG CAGAGTTCAT GGAAGCTCTG 1320CGCGATGTCA ACGTGAACAT CGAATTGATT TCCACCTCTG AGATCCGCAT TTCCGTGCTG 1380ATCCGTGAAG ATGATCTGGA TGCTGCTGCA CGTGCATTGC ATGAGCAGTT CCAGCTGGGC 1440GGCGAAGACG AAGCCGTCGT TTATGCAGGC ACCGGACGCT AAAGTTTTAA AGGAGTAGTT 1500TTACAATGAC CACCATCGCA GTTGTTGGTG CAACCGGCCA GGTCGGCCAG GTTATGCGCA 1560CCCTTTTGGA AGAGCGCAAT TTCCCAGCTG ACACTGTTCG TTTCTTTGCT TCCCCGCGTT 1620CCGCAGGCCG TAAGATTGAA TTC 1643(2)SEQ ID NO4的信息(i)序列特征(A)長(zhǎng)度1643個(gè)堿基(B)類型核酸(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型基因組DNA(vi)原始來(lái)源(A)有機(jī)體乳發(fā)酵短桿菌(B)菌株 ATCC 13869(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置217..1482(xi)序列描述 SEQ ID NO4TCGCGAAGTA GCACCTGTCA CTTTTGTCTC AAATATTAAA TCGAATATCA ATATACGGTC 60TGTTTATTGG AACGCATCCC AGTGGCTGAG ACGCATCCGC TAAAGCCCCA GGAACCCTGT120GCAGAAAGAA AACACTCCTC TGGCTAGGTA GACACAGTTT ATAAAGGTAG AGTTGAGCGG180GTAACTGTCA GCACGTAGAT CGAAAGGTGC ACAAAG GTG GCC CTG GTC GTA CAG 234Met Ala Leu Val Val Gln1 5AAA TAT GGC GGT TCC TCG CTT GAG AGT GCG GAA CGC ATT AGA AAC GTC 282Lys Tyr Gly Gly Ser Ser Leu Glu Ser Ala Glu Arg Ile Arg Asn Val
10 15 20GCT GAA CGG ATC GTT GCC ACC AAG AAG GCT GGA AAT GAT GTC GTG GTT330Ala Glu Arg Ile Val Ala Thr Lys Lys Ala Gly Asn Asp Val Val Val25 30 35GTC TGC TCC GCA ATG GGA GAC ACC ACG GAT GAA CTT CTA GAA CTT GCA378Val Cys Ser Ala Met Gly Asp Thr Thr Asp Glu Leu Leu Glu Leu Ala40 45 50GCG GCA GTG AAT CCC GTT CCG CCA GCT CGT GAA ATG GAT ATG CTC CTG426Ala Ala Val Asn Pro Val Pro Pro Ala Arg Glu Met Asp Met Leu Leu55 60 65 70ACT GCT GGT GAG CGT ATT TCT AAC GCT CTC GTC GCC ATG GCT ATT GAG474Thr Ala Gly Glu Arg Ile Ser Asn Ala Leu Val Ala Met Ala Ile Glu75 80 85TCC CTT GGC GCA GAA GCT CAA TCT TTC ACT GGC TCT CAG GCT GGT GTG522Ser Leu Gly Ala Glu Ala Gln Ser Phe Thr Gly Ser Gln Ala Gly Val90 95 100CTC ACC ACC GAG CGC CAC GGA AAC GCA CGC ATT GTT GAC GTC ACA CCG570Leu Thr Thr Glu Arg His Gly Asn Ala Arg Ile Val Asp Val Thr Pro105 110 115GGT CGT GTG CGT GAA GCA CTC GAT GAG GGC AAG ATC TGC ATT GTT GCT618Gly Arg Val Arg Glu Ala Leu Asp Glu Gly Lys Ile Cys Ile Val Ala120 125 130GGT TTT CAG GGT GTT AAT AAA GAA ACC CGC GAT GTC ACC ACG TTG GGT666Gly Phe Gln Gly Val Asn Lys Glu Thr Arg Asp Val Thr Thr Leu Gly135 140 145 150CGT GGT GGT TCT GAC ACC ACT GCA GTT GCG TTG GCA GCT GCT TTG AAC714Arg Gly Gly Ser Asp Thr Thr Ala Val Ala Leu Ala Ala Ala Leu Asn155 160 165GCT GAT GTG TGT GAG ATT TAC TCG GAC GTT GAC GGT GTG TAT ACC GCT762Ala Asp Val Cys Glu Ile Tyr Ser Asp Val Asp Gly Val Tyr Thr Ala170 175 180GAC CCG CGC ATC GTT CCT AAT GCA CAG AAG CTG GAA AAG CTC AGC TTC810Asp Pro Arg Ile Val Pro Asn Ala Gln Lys Leu Glu Lys Leu Ser Phe185 190 195GAA GAA ATG CTG GAA CTT GCT GCT GTT GGC TCC AAG ATT TTG GTG CTG858Glu Glu Met Leu Glu Leu Ala Ala Val Gly Ser Lys Ile Leu Val Leu200 205 210CGC AGT GTT GAA TAC GCT CGT GCA TTC AAT GTG CCA CTT CGC GTA CGC906Arg Ser Val Glu Tyr Ala Arg Ala Phe Asn Val Pro Leu Arg Val Arg215 220 225 230TCG TCT TAT AGT AAT GAT GCC GGC ACT TTG ATT GCC GGC TCT ATG GAG954Ser Ser Tyr Ser Asn Asp Pro Gly Thr Leu Ile Ala Gly Ser Met Glu235 240 245GAT ATT CCT GTG GAA GAA GCA GTC CTT ACC GGT GTC GCA ACC GAC AAG 1002Asp Ile Pro Val Glu Glu Ala Val Leu Thr Gly Val Ala Thr Asp Lys250 255 260TCC GAA GCC AAA GTA ACC GTT CTG GGT ATT TCC GAT AAG CCA GGC GAG 1050Ser Glu Ala Lys Val Thr Val Leu Gly Ile Ser Asp Lys Pro Gly Glu265 270 275GCT GCC AAG GTT TTC CGT GCG TTG GCT GAT GCA GAA ATC AAC ATT GAC 1098Ala Ala Lys Val Phe Arg Ala Leu Ala Asp Ala Glu Ile Asn Ile Asp280 285 290ATG GTT CTG CAG AAC GTC TCC TCT GTG GAA GAC GGC ACC ACC GAC ATC 1146Met Val Leu Gln Asn Val Ser Ser Val Glu Asp Gly Thr Thr Asp Ile295 300 305 310ACG TTC ACC TGC CCT CGC GCT GAC GGA CGC CGT GCG ATG GAG ATC TTG 1194Thr Phe Thr Cys Pro Arg Ala Asp Gly Arg Arg Ala Met Glu Ile Leu315 320 325AAG AAG CTT CAG GTT CAG GGC AAC TGG ACC AAT GTG CTT TAC GAC GAC1242Lys Lys Leu GLn Val GLn Gly Asn Trp Thr Asn Val Leu Tyr Asp Asp330 335 340CAG GTC GGC AAA GTC TCC CTC GTG GGT GCT GGC ATG AAG TCT CAC CCA1290Gln Val Gly Lys Val Ser Leu Val Gly Ala Gly Met Lys Ser His Pro345 350 355GGT GTT ACC GCA GAG TTC ATG GAA GCT CTG CGC GAT GTC AAC GTG AAC1338Gly Val Thr Ala Glu Phe Met Glu Ala Leu Arg Asp Val Asn Val Asn360 365 370ATC GAA TTG ATT TCC ACC TCT GAG ATC CGC ATT TCC GTG CTG ATC CGT1386Ile Glu Leu Ile Ser Thr Ser Glu Ile Arg Ile Ser Val Leu Ile Arg375 380 385 390GAA GAT GAT CTG GAT GCT GCT GCA CGT GCA TTG CAT GAG CAG TTC CAG1434Glu Asp Asp Leu Asp Ala Ala Ala Arg Ala Leu His Glu Gln Phe Gln395 400 405CTG GGC GGC GAA GAC GAA GCC GTC GTT TAT GCA GGC ACC GGA CGC TAA1482Leu Gly Gly Glu Asp Glu Ala Val Val Tyr Ala Gly Thr Gly Arg410 415 420AGTTTTAAAG GAGTAGTTTT ACAATGACCA CCATCGCAGT TGTTGGTGCA ACCGGCCAGG 1542TCGGCCAGGT TATGCGCACC CTTTTGGAAG AGCGCAATTT CCCAGCTGAC ACTGTTCGTT 1602TCTTTGCTTC CCCGCGTTCC GCAGGCCGTA AGATTGAATT C 1643(2)SEQ ID NO5的信息(i)序列特征(A)長(zhǎng)度421個(gè)氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO5Met Ala Leu Val Val Gln Lys Tyr Gly Gly Ser Ser Leu Glu Ser Ala1 5 10 15Glu Arg Ile Arg Asn Val Ala Glu Arg Ile Val Ala Thr Lys Lys Ala20 25 30Gly Asn Asp Val Val Val Val Cys Ser Ala Met Gly Asp Thr Thr Asp35 40 45Glu Leu Leu Glu Leu Ala Ala Ala Val Asn Pro Val Pro Pro Ala Arg50 55 60Glu Met Asp Met Leu Leu Thr Ala Gly Glu Arg Ile Ser Asn Ala Leu65 70 75 80Val Ala Met Ala Ile Glu Ser Leu Gly Ala Glu Ala Gln Ser Phe Thr85 90 95Gly Ser Gln Ala Gly Val Leu Thr Thr Glu Arg His Gly Asn Ala Arg100 105 110Ile Val Asp Val Thr Pro Gly Arg Val Arg Glu Ala Leu Asp Glu Gly115 120 125Lys Ile Cys Ile Val Ala Gly Phe Gln Gly Val Asn Lys Glu Thr Arg130 135 140Asp Val Thr Thr Leu Gly Arg Gly Gly Ser Asp Thr Thr Ala Val Ala145 150 155 160Leu Ala Ala Ala Leu Asn Ala Asp Val Cys Glu Ile Tyr Ser Asp Val165 170 175Asp Gly Val Tyr Thr Ala Asp Pro Arg Ile Val Pro Asn Ala Gln Tys180 185 190Leu Glu Lys Leu Ser Phe Glu Glu Met Leu Glu Leu Ala Ala Val Gly195 200 205Ser Lys Ile Leu Val Leu Arg Ser Val Glu Tyr Ala Arg Ala Phe Asn210 215 220Val Pro Leu Arg Val Arg Ser Ser Tyr Ser Asn Asp Pro Gly Thr Leu225 230 235 240Ile Ala Gly Ser Met Glu Asp Ile Pro Val Glu Glu Ala Val Leu Thr245 250 255Gly Val Ala Thr Asp Lys Ser Glu Ala Lys Val Thr Val Leu Gly Ile260 265 270Ser Asp Lys Pro Gly Glu Ala Ala Lys Val Phe Arg Ala Leu Ala Asp275 280 285Ala Glu Ile Asn Ile Asp Met Val Leu Gln Asn Val Ser Ser Val Glu290 295 300Asp Gly Thr Thr Asp Ile Thr Phe Thr Cys Pro Arg Ala Asp Gly Arg305 310 315 320Arg Ala Met Glu Ile Leu Lys Lys Leu Gln Val Gln Gly Asn Trp Thr325 330 335Asn Val Leu Tyr Asp Asp Gln Val Gly Lys Val Ser Leu Val Gly Ala340 345 350Gly Met Lys Ser His Pro Gly Val Thr Ala Glu Phe Met Glu Ala Leu355 360 365Arg Asp Val Asn Val Asn Ile Glu Leu Ile Ser Thr Ser Glu Ile Arg370 375 380Ile Ser Val Leu Ile Arg Glu Asp Asp Leu Asp Ala Ala Ala Arg Ala385 390 395 400Leu His Glu Gln Phe Gln Leu Gly Gly Glu Asp Glu Ala Val Val Tyr405 410 415Ala Gly Thr Gly Arg420(2)SEQ ID NO6的信息(i)序列特征(A)長(zhǎng)度1643個(gè)堿基(B)類型核酸(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型基因組DNA(vi)原始來(lái)源(A)有機(jī)體乳發(fā)酵短桿菌(B)菌株ATCC13869(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置964..1482(xi)序列描述SEQ ID NO6TCGCGAAGTA GCACCTGTCA CTTTTGTCTC AAATATTAAA TCGAATATCA ATATACGGTC 60TGTTTATTGG AACGCATCCC AGTGGCTGAG ACGCATCCGC TAAAGCCCCA GGAACCCTGT120GCAGAAAGAA AACACTCCTC TGGCTAGGTA GACACAGTTT ATAAAGGTAG AGTTGAGCGG180GTAACTGTCA GCACGTAGAT CGAAAGGTGC ACAAAGGTGG CCCTGGTCGT ACAGAAATAT240GGCGGTTCCT CGCTTGAGAG TGCGGAACGC ATTAGAAACG TCGCTGAACG GATCGTTGCC300ACCAAGAAGG CTGGAAATGA TGTCGTGGTT GTCTGCTCCG CAATGGGAGA CACCACGGAT360GAACTTCTAG AACTTGCAGC GGCAGTGAAT CCCGTTCCGC CAGCTCGTGA AATGGATATG420CTCCTGACTG CTGGTGAGCG TATTTCTAAC GCTCTCGTCG CCATGGCTAT TGAGTCCCTT480GGCGCAGAAG CTCAATCTTT CACTGGCTCT CAGGCTGGTG TGCTCACCAC CGAGCGCCAC540GGAAACGCAC GCATTGTTGA CGTCACACCG GGTCGTGTGC GTGAAGCACT CGATGAGGGC600AAGATCTGCA TTGTTGCTGG TTTTCAGGGT GTTAATAAAG AAACCCGCGA TGTCACCACG660TTGGGTCGTG GTGGTTCTGA CACCACTGCA GTTGCGTTGG CAGCTGCTTT GAACGCTGAT720GTGTGTGAGA TTTACTCGGA CGTTGACGGT GTGTATACCG CTGACCCGCG CATCGTTCCT780AATGCACAGA AGCT GAAAA GCTCAGCTTC GAAGAAATGC TGGAACTTGC TGCTGTTGGC840TCCAAGATTT TGGTGCTGCG CAGTGTTGAA TACGCTCGTG CATTCAATGT GCCACTTCGC900GTACGCTCGT CTTATAGTAA TGATCCCGGC ACTTTGATTG CCGGCTCTAT GGAGGATATT960CCT GTG GAA GAA GCA GTC CTT ACC GGT GTC GCA ACC GAC AAG TCC GAA1008Met Glu Glu Ala Val Leu Thr Gly Val Ala Thr Asp Lys Ser Glu1 5 10 15GCC AAA GTA ACC GTT CTG GGT ATT TCC GAT AAG CCA GGC GAG GCT GCC1056Ala Lys Val Thr Val Leu Gly Ile Ser Asp Lys Pro Gly Glu Ala Ala20 25 30AAG GTT TTC CGT GCG TTG GCT GAT GCA GAA ATC AAC ATT GAC ATG GTT1104Lys Val Phe Arg Ala Leu Ala Asp Ala Glu Ile Asn Ile Asp Met Val35 40 45CTG CAG AAC GTC TCC TCT GTG GAA GAC GGC ACC ACC GAC ATC ACG TTC1152Leu Gln Asn Val Ser Ser Val Glu Asp Gly Thr Thr Asp Ile Thr Phe50 55 60ACC TGC CCT CGC GCT GAC GGA CGC CGT GCG ATG GAG ATC TTG AAG AAG1200Thr Cys Pro Arg Ala Asp Gly Arg Arg Ala Met Glu Ile Leu Lys Lys65 70 75CTT CAG GTT CAG GGC AAC TGG ACC AAT GTG CTT TAC GAC GAC CAG GTC1248Leu Gln Val Gln Gly Asn Trp Thr Asn Val Leu Tyr Asp Asp Gln Val80 85 90 95GGC AAA GTC TCC CTC GTG GGT GCT GGC ATG AAG TCT CAC CCA GGT GTT1296Gly Lys Val Ser Leu Val Gly Ala Gly Met Lys Ser His Pro Gly Val100 105 110ACC GCA GAG TTC ATG GAA GCT CTG CGC GAT GTC AAC GTG AAC ATC GAA1344Thr Ala Glu Phe Met Glu Ala Leu Arg Asp Val Asn Val Asn Ile Glu115 120 125TTG ATT TCC ACC TCT GAG ATC CGC ATT TCC GTG CTG ATC CGT GAA GAT1392Leu Ile Ser Thr Ser Glu Ile Arg Ile Ser Val Leu Ile Arg Glu Asp130 135 140GAT CTG GAT GCT GCT GCA CGT GCA TTG CAT GAG CAG TTC CAG CTG GGC1440Asp Leu Asp Ala Ala Ala Arg Ala Leu His Glu Gln Phe Gln Leu Gly145 150 155GGC GAA GAC GAA GCC GTC GTT TAT GCA GGC ACC GGA CGC TAAAGTTTTAA1490Gly Glu Asp Glu Ala Val Val Tyr Ala Gly Thr Gly Arg160 165 170AGGAGTAGTT TTACAATGAC CACCATCGCA GTTGTTGGTG CAACCGGCCA GGTCGGCCAG 1550GTTATGCGCA CCCTTTTGGA AGAGCGCAAT TTCCCAGCTG ACACTGTTCG TTTCTTTGCT 1610TCCCCGCGTT CCGCAGGCCG TAAGATTGAA TTC 1643(2)SEQ ID NO7的信息(i)序列特征(A)長(zhǎng)度172個(gè)氨基酸
(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO7Met Glu Glu Ala Val Leu Thr Gly Val Ala Thr Asp Lys Ser Glu Ala1 5 10 15Lys Val Thr Val Leu Gly Ile Ser Asp Lys Pro Gly Glu Ala Ala Lys20 25 30Val Phe Arg Ala Leu Ala Asp Ala Glu Ile Asn Ile Asp Met Val Leu35 40 45Gln Asn Val Ser Ser Val Glu Asp Gly Thr Thr Asp Ile Thr Phe Thr50 55 60Cys Pro Arg Ala Asp Gly Arg Arg Ala Met Glu Ile Leu Lys Lys Leu65 70 75 80Gln Val Gln Gly Asn Trp Thr Asn Val Leu Tyr Asp Asp Gln Val Gly85 90 95Lys Val Ser Leu Val Gly Ala Gly Met Lys Ser His Pro Gly Val Thr100 105 110Ala Glu Phe Met Glu Ala Leu Arg Asp Val Asn Val Asn Ile Glu Leu115 120 125Ile Ser Thr Ser Glu Ile Arg Ile Ser Val Leu Ile Arg Glu Asp Asp130 135 140Leu Asp Ala Ala Ala Arg Ala Leu His Glu Gln Phe Gln Leu Gly Gly145 150 155 160Glu Asp Glu Ala Val Val Tyr Ala Gly Thr Gly Arg165 170(2)SEQ ID NO8的信息(i)序列特征(A)長(zhǎng)度23個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA"(iv)反義否(xi)序列描述SEQ ID NO8GGATCCCCAATCGATACCTGGAA 23(2)SEQ ID NO9的信息(i)序列特征(A)長(zhǎng)度23個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA"(iV)反義是(i)序列描述SEQ ID NO9CGGTTCATCGCCAAGTTTTT CTT(2)SEQ ID NO10的信息(i)序列特征(A)長(zhǎng)度2001個(gè)堿基(B)類型核酸(C)鏈型雙鏈(D)撲結(jié)構(gòu)線性(ii)分子類型基因組DNA(vi)原始來(lái)源(A)有機(jī)體乳發(fā)酵短桿菌(B)菌株ATCC13869(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置730..1473(xi)序列描述SEQ ID NO10GGATCCCCAA TCGATACCTG GAACGACAAC CTGATCAGGA TATCCAATGC CTTGAATATT 60GACGTTGAGG AAGGAATCAC CAGCCATCTC AACTGGAAGA CCTGACGCCT GCTGAATTGG120ATCAGTGGCC CAATCGACCC ACCAACCAGG TTGGCTATTA CCGGCGATAT CAAAAACAAC180TCGCGTGAAC GTTTCGTGCT CGGCAACGCG GATGCCAGCG ATCGACATAT CGGAGTCACC240AACTTGAGCC TGCTGCTTCT GATCCATCGA CGGGGAACCC AACGGCGGCA AAGCAGTGGG300GGAAGGGGAG TTGGTGGACT CTGAATCAGT GGGCTCTGAA GTGGTAGGCG ACGGGGCAGC360ATCTGAAGGC GTGCGAGTTG TGGTGACCGG GTTAGCGGTT TCAGTTTCTG TCACAACTGG420AGCAGGACTA GCAGAGGTTG TAGGCGTTGA GCCGCTTCCA TCACAAGCAC TTAAAAGTAA480AGAGGCGGAA ACCACAAGCG CCAAGGAACT ACCTGCGGAA CGGGCGGTGA AGGGCAACTT540AAGTCTCATA TTTCAAACAT AGTTCCACCT GTGTGATTAA TCTCCAGAAC GGAACAAACT600GATGAACAAT CGTTAACAAC ACAGACCAAA ACGGTCAGTT AGGTATGGAT ATCAGCACCT660TCTGAATGGG TACGTCTAGA CTGGTGGGCG TTTGAAAAAC TCTTCGCCCC ACGAAAATGA720AGGAGCATA ATG GGA ATC AAG GTT GGC GTT CTC GGA GCC AAA GGC CGT768Met Gly Ile Lys Val Gly Val Leu Gly Ala Lys Gly Arg1 5 10GTT GGT CAA ACT ATT GTG GCA GCA GTC AAI GAG TCC GAC GAT CTG GAG 816Val Gly Gln Thr Ile Val Ala Ala Val Asn Glu Ser Asp Asp Ieu Glu15 20 25CTT GTT GCA GAG ATC GGC GTC GAC GAT GAT TTG AGC CTT CTG GTA GAC 864Leu Val Ala Glu Ile Gly Val Asp Asp Asp Leu Ser Leu Leu Val Asp30 35 40 45AAC GGC GCT GAA GTT GTC GTT GAC TTC ACC ACT CCT AAC GCT GTG ATG 912Asn Gly Ala Glu Val Val Val Asp Phe Thr Thr Pro Asn Ala Val Met50 55 60GGC AAC CTG GAG TTC TGC ATC AAC AAC GGC ATT TCT GCG GTT GTT GGA 960Gly Asn Leu Glu Phe Cys Ile Asn Asn Gly Ile Ser Ala Val Val Gly65 70 75ACC ACG GGC TTC GAT GAT GCT CGT TTG GAG CAG GTT CGC GCC TGG CTT1008Thr Thr Gly Phe Asp Asp Ala Arg Leu Glu Gln Val Arg Ala Trp Leu80 85 90GAA GGA AAA GAC AAT GTC GGT GTT CTG ATC GCA CCT AAC TTT GCT ATC1056Glu Gly Lys Asp Asn Val Gly Val Leu Ile Ala Pro Asn Phe Ala Ile95 100 105TCT GCG GTG TTG ACC ATG GTC TTT TCC AAG CAG GCT GCC CGC TTC TTC1104Ser Ala Val Leu Thr Met Val Phe Ser Lys Gln Ala Ala Arg Phe Phe110 115 120 125GAA TCA GCT GAA GTT ATT GAG CTG CAC CAC CCC AAC AAG CTG GAT GCA1152Glu Ser Ala Glu Val Ile Glu Leu His His Pro Asn Lys Leu Asp Ala130 135 140CCT TCA GGC ACC GCG ATC CAC ACT GCT CAG GGC ATT GCT GCG GCA CGC1200Pro Ser Gly Thr Ala Ile His Thr Ala Gln Gly Ile Ala Ala Ala Arg145 150 155AAA GAA GCA GGC ATG GAC GCA CAG CCA GAT GCG ACC GAG CAG GCA CTT1248Lys Glu Ala Gly Met Asp Ala Gln Pro Asp Ala Thr Glu Gln Ala Leu160 165 170GAG GGT TCC CGT GGC GCA AGC GTA GAT GGA ATC CCA GTT CAC GCA GTC1296Glu Gly Ser Arg Gly Ala Ser Val Asp Gly Ile Pro Val His Ala Val175 180 185CGC ATG TCC GGC ATG GTT GCT CAC GAG CAA GTT ATC TTT GGC ACC CAG1344Arg Met Ser Gly Met Val Ala His Glu Gln Val Ile Phe Gly Thr Gln190 195 200 205GGT CAG ACC TTG ACC ATC AAG CAG GAC TCC TAT GAT CGC AAC TCA TTT1392Gly Gln Thr Leu Thr Ile Lys Gln Asp Ser Tyr Asp Arg Asn Ser Phe210 215 220GCA CCA GGT GTC TTG GTG GGT GTG CGC AAC ATT GCA CAG CAC CCA GGC1440Ala Pro Gly Val Leu Val Gly Val Arg Asn Ile Ala Gln His Pro Gly225 230 235CTA GTC GTA GGA CTT GAG CAT TAC CTA GGC CTG TAAAGGCTCA TTTCAGCAGC 1493Leu Val Val Gly Leu Glu His Tyr Leu Gly Leu240 245GGGTGGAATT TTTTAAAAGG AGCGTTTAAA GGCTGTGGCC GAACAAGTTA AATTGAGCGT 1553GGAGTTGATA GCGTGCAGTT CTTTTACTCC ACCCGCTGAT GTTGAGTGGT CAACTGATGT 1613TGAGGGCGCG GAAGCACTCG TCGAGTTTGC GGGTCGTGCC TGCTACGAAA CTTTTGATAA 1673GCCGAACCCT CGAACTGCTT CCAATGCTGC GTATCTGCGC CACATCATGG AAGTGGGGCA 1733CACTGCTTTG CTTGAGCATG CCAATGCCAC GATGTATATC CGAGGCATTT CTCGGTCCGC 1793GACCCATGAA TTGGTCCGAC ACCGCCATTT TTCCTTCTCT CAACTGTCTC AGCGTTTCGT 1853GCACAGCGGA GAATCGGAAG TAGTGGTGCC CACTCTCATC GATGAAGATC CGCAGTTGCG 1913TGAACTTTTC ATGCACGCCA TGGATGAGTC TCGGTTCGCT TTCAATGAGC TGCTTAATGC 1973GCTGGAAGAA AAACTTGGCG ATGAACCG 2001(2)SEQ ID NO11的信息(i)序列特征(A)長(zhǎng)度248個(gè)氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO11Met Gly Ile Lys Val Gly Val Leu Gly Ala Lys Gly Arg Val Gly Gln1 5 10 15Thr Ile Val Ala Ala Val Asn Glu Ser Asp Asp Leu Glu Leu Val Ala20 25 30Glu Ile Gly Val Asp Asp Asp Leu Ser Leu Leu Val Asp Asn Gly Ala35 40 45Glu Val Val Val Asp Phe Thr Thr Pro Asn Ala Val Met Gly Asn Leu50 55 60Glu Phe Cys Ile Asn Asn Gly Ile Ser Ala Val Val Gly Thr Thr Gly65 70 75 80Phe Asp Asp Ala Arg Leu Glu Gln Val Arg Ala Trp Leu Glu Gly Lys85 90 95Asp Asn Val Gly Val Leu Ile Ala Pro Asn Phe Ala Ile Ser Ala Val100 105 110Leu Thr Met Val Phe Ser Lys Gln Ala Ala Arg Phe Phe Glu Ser Ala1l5 120 125Glu Val Ile Glu Leu His His Pro Asn Lys Leu Asp Ala Pro Ser Gly130 135 140Thr Ala Ile His Thr Ala Gln Gly Ile Ala Ala Ala Arg Lys Glu Ala145 150 155 160Gly Met Asp Ala Gln Pro Asp Ala Thr Glu Gln Ala Leu Glu Gly Ser165 170 175Arg Gly Ala Ser Val Asp Gly Ile Pro Val His Ala Val Arg Met Ser180 185 190Gly Met Val Ala His Glu Gln Val Ile Phe Gly Thr Gln Gly Gln Thr195 200 205Leu Thr Ile Lys Gln Asp Ser Tyr Asp Arg Asn Ser Phe Ala Pro Gly210 215 220Val Leu Val Gly Val Arg Asn Ile Ala Gln His Pro Gly Leu Val Val225 230 235 240Gly Leu Glu His Tyr Leu Gly Leu245(2)SEQ ID NO12的信息(i)序列特征(A)長(zhǎng)度23個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA"(iv)反義否(xi)序列描述SEQ ID NO12CTCGACGGATCGCAAATGGC AAC 23(2)SEQ ID NO13的信息(i)序列特征
(A)長(zhǎng)度23個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA″(iv)反義是(xi)序列描述 SEQ ID NO13GGATCCTTGA GCACCTTGCG CAG 23(2)SEQ ID NO14的信息(i)序列特征(A)長(zhǎng)度1411個(gè)堿基(B)類型核酸(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型基因組DNA(vi)原始來(lái)源(A)有機(jī)體乳發(fā)酵短桿菌(B)菌株ATCC 13869(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置311..1213(xi)序列描述 SEQ ID NO14CTCTCGATAT CGAGAGAGAA GCAGCGCCAC GGTTTTTCGG TGATTTTGAG ATTGAAACTT 60TGGCAGACGG ATCGCAAATG GCAACAAGCC CGTATGTCAT GGACTTTTAA CGCAAAGCTC120ACACCCACGA GCTAAAAATT CATATAGTTA AGACAACATT TTTGGCTGTA AAAGACAGCC180GTAAAAACCT CTTGCTCATG TCAATTGTTC TTATCGGAAT GTGGCTTGGG CGATTGTTAT240GCAAAAGTTG TTAGGTTTTT TGCGGGGTTG TTTAACCCCC AAATGAGGGA AGAAGGTAAC300CTTGAACTCT ATG AGC ACA GGT TTA ACA GCT AAG ACC GGA GTA GAG CAC 349
Met Ser Thr Gly Leu Thr Ala Lys Thr Gly Val Glu His1 5 10TTC GGC ACC GTT GGA GTA GCA ATG GTT ACT CCA TTC ACG GAA TCC GGA 397Phe Gly Thr Val Gly Val Ala Met Val Thr Pro Phe Thr Glu Ser Gly15 20 25GAC ATC GAT ATC GCT GCT GGC CGC GAA GTC GCG GCT TAT TTG GTT GAT 445Asp Ile Asp Ile Ala Ala Gly Arg Glu Val Ala Ala Tyr Leu Val Asp30 35 40 45AAG GGC TTG GAT TCT TTG GTT CTC GCG GGC ACC ACT GGT GAA TCC CCA 493Lys Gly Leu Asp Ser Leu Val Leu Ala Gly Thr Thr Gly Glu Ser Pro50 55 60ACG ACA ACC GCC GCT GAA AAA CTA GAA CTG CTC AAG GCC GTT CGT GAG 541Thr Thr Thr Ala Ala Glu Lys Leu Glu Leu Leu Lys Ala Val Arg Glu65 70 75GAA GTT GGG GAT CGG GCG AAC GTC ATC GCC GGT GTC GGA ACC AAC AAC 589Glu Val Gly Asp Arg Ala Asn Val Ile Ala Gly Val Gly Thr Asn Asn80 85 90ACG CGG ACA TCT GTG GAA CTT GCG GAA GCT GCT GCT TCT GCT GGC GCA 637Thr Arg Thr Ser Val Glu Leu Ala Glu Ala Ala Ala Ser Ala Gly Ala95 100 105GAC GGC CTT TTA GTT GTA ACT CCT TAT TAC TCC AAG CCG AGC CAA GAG 685Asp Gly Leu Leu Val Val Thr Pro Tyr Tyr Ser Lys Pro Ser Gln Glu110 115 120 125GGA TTG CTG GCG CAC TTC GGT GCA ATT GCT GCA GCA ACA GAG GTT CCA 733Gly Leu Leu Ala His Phe Gly Ala Ile Ala Ala Ala Thr Glu Val Pro130 135 140ATT TGT CTC TAT GAC ATT CCT GGT CGG TCA GGT ATT CCA ATT GAG TCT 781Ile Cys Leu Tyr Asp Ile Pro Gly Arg Ser Gly Ile Pro Ile Glu Ser145 150 155GAT ACC ATG AGA CGC CTG AGT GAA TTA CCT ACG ATT TTG GCG GTC AAG 829Asp Thr Met Arg Arg Leu Ser Glu Leu Pro Thr Ile Leu Ala Val Lys160 165 170GAC GCC AAG GGT GAC CTC GTT GCA GCC ACG TCA TTG ATC AAA GAA ACG 877Asp Ala Lys Gly Asp Leu Val Ala Ala Thr Ser Leu Ile Lys Glu Thr175 180 185GGA CTT GCC TGG TAT TCA GGC GAT GAC CCA CTA AAC CTT GTT TGG CTT 925Gly Leu Ala Trp Tyr Ser Gly Asp Asp Pro Leu Asn Leu Val Trp Leu190 195 200 205GCT TTG GGC GGA TCA GGT TTC ATT TCC GTA ATT GGA CAT GCA GCC CCC 973Ala Leu Gly Gly Ser Gly Phe Ile Ser Val Ile Gly His Ala Ala Pro210 215 220ACA GCA TTA CGT GAG TTG TAC ACA AGC TTC GAG GAA GGC GAC CTC GTC1021Thr Ala Leu Arg Glu Leu Tyr Thr Ser Phe Glu Glu Gly Asp Leu Val225 230 235CGT GCG CGG GAA ATC AAC GCC AAA CTA TCA CCG CTG GTA GCT GCC CAA1069Arg Ala Arg Glu Ile Asn Ala Lys Leu Ser Pro Leu Val Ala Ala Gln240 245 250GGT CGC TTG GGT GGA GTC AGC TTG GCA AAA GCT GCT CTG CGT CTG CAG1117Gly Arg Leu Gly Gly Val Ser Leu Ala Lys Ala Ala Leu Arg Leu Gln255 260 265GGC ATC AAC GTA GGA GAT CCT CGA CTT CCA ATT ATG GCT CCA AAT GAG1165Gly Ile Asn Val Gly Asp Pro Arg Leu Pro Ile Met Ala Pro Asn Glu270 275 280 285CAG GAA CTT GAG GCT CTC CGA GAA GAC ATG AAA AAA GCT GGA GTT CTA1213Gln Glu Leu Glu Ala Leu Arg Glu Asp Met Lys Lys Ala Gly Val Leu290 295 300TAAATATGAA TGATTCCCGA AATCGCGGCC GGAAGGTTAC CCGCAAGGCG GCCCACCAGA1273AGCTGGTCAG GAAAACCATC TGGATACCCC TGTCTTTCAG GCACCAGATG CTTCCTCTAA1333CCAGAGCGCT GTAAAAGCTG AGACCGCCGG AAACGACAAT CGGGATGCTG CGCAAGGTGC1393TCAAGGATCC CAACATTC 1411(2)SEQ ID NO15的信息(i)序列特征(A)長(zhǎng)度301個(gè)氨基酸(B)類型氨基酸(D拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述 SEQ ID NO15Met Ser Thr Gly Leu Thr Ala Lys Thr Gly Val Glu His Phe Gly Thr1 5 10 15Val Gly Val Ala Met Val Thr Pro Phe Thr Glu Ser Gly Asp Ile Asp20 25 30Ile Ala Ala Gly Arg Glu Val Ala Ala Tyr Leu Val Asp Lys Gly Leu35 40 45Asp Ser Leu Val Leu Ala Gly Thr Thr Gly Glu Ser Pro Thr Thr Thr50 55 60Ala Ala Glu Lys Leu Glu Leu Leu Lys Ala Val Arg Glu Glu Val Gly65 70 75 80Asp Arg Ala Asn Val Ile Ala Gly Val Gly Thr Asn Asn Thr Arg Thr85 90 95Ser Val Glu Leu Ala Glu Ala Ala Ala Ser Ala Gly Ala Asp Gly Leu100 105 110Leu Val Val Thr Pro Tyr Tyr Ser Lys Pro Ser Gln Glu Gly Leu Leu115 120 125Ala His Phe Gly Ala Ile Ala Ala Ala Thr Glu Val Pro Ile Cys Leu130 135 140Tyr Asp Ile Pro Gly Arg Ser Gly Ile Pro Ile Glu Ser Asp Thr Met145 150 155 160Arg Arg Leu Ser Glu Leu Pro Thr Ile Leu Ala Val Lys Asp Ala Lys165 170 175Gly Asp Leu Val Ala Ala Thr Ser Leu Ile Lys Glu Thr Gly Leu Ala180 185 190Trp Tyr Ser Gly Asp Asp Pro Leu Asn Leu Val Trp Leu Ala Leu Gly195 200 205Gly Ser Gly Phe Ile Ser Val Ile Gly His Ala Ala Pro Thr Ala Leu210 215 220Arg Glu Leu Tyr Thr Ser Phe Glu Glu Gly Asp Leu Val Arg Ala Arg225 230 235 240Glu Ile Asn Ala Lys Leu Ser Pro Leu Val Ala Ala Gln Gly Arg Leu245 250 255Gly Gly Val Ser Leu Ala Lys Ala Ala Leu Arg Leu Gln Gly Ile Asn260 265 270Val Gly Asp Pro Arg Leu Pro Ile Met Ala Pro Asn Glu Gln Glu Leu275 280 285Glu Ala Leu Arg Glu Asp Met Lys Lys Ala Gly Val Leu290 295 300(2)SEQ ID NO的信息16(i)序列特征(A)長(zhǎng)度23個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA"(iv)反義否(xi)序列描述SEQ ID NO16GTGGAGCCGACCATTCCGCG AGG 23(2)SEQ ID NO17的信息(i)序列特征(A)長(zhǎng)度23個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA"(iv)反義是(xi)序列描述SEQ ID NO17CCAAACCGC CCTCCACGGC GAA23(2)SEQ ID NO18的信息(i)序列特征(A)長(zhǎng)度3579個(gè)堿基(B)類型核酸
(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型基因組DNA(vi)原始來(lái)源(A)有機(jī)體乳發(fā)酵短桿菌(B)菌株ATCC 13869(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置533..2182(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置2188..3522(xi)序列描述SEQ ID NO18GTGGAGCCGA CCATTCCGCG AGGCTGCACT GCAACGAGGT CGTAGTTTTG GTACATGGCT 60TCTGGCCAGT TCATGGATTG GCTGCCGAAG AAGCTATAGG CATCGCACCA GGGCCACCCA120GTTACCGAAG ATGGTGCCGT GCTTTTCGCC TTGGGCAGGG ACCTTGACAA AGCCCACGCT180GATATCGCCA AGTGAGGGAT CAGAATAGTG CATGGGCACG TCGATGCTGC CACATTGAGC240GGAGGCAATA TCTACCTGAG GTGGGCATTC TTCCCAGCGG ATGTTTTCTT GCGCTGCTGC300AGTGGGCATT GATACCAAAA AGGGGCTAAG CGCAGTCGAG GCGGCAAGAA CTGCTACTAC 360CCTTTTTATT GTCGAACGGG GCATTACGGC TCCAAGGACG TTTGTTTTCT GGGTCAGTTA 420CCCCAAAAAG CATATACAGA GACCAATGAT TTTTCATTAA AAAGGCAGGG ATTTGTTATA 480AGTATGGGTC GTATTCTGTG CGACGGGTGT ACCTCGGCTA GAATTTCTCC CC ATG 535Met1ACA CCA GCT GAT CTC GCA ACA TTG ATT AAA GAG ACC GCG GTA GAG GTT583Thr Pro Ala Asp Leu Ala Thr Leu Ile Lys Glu Thr Ala Val Glu Val5 10 15TTG ACC TCC CGC GAG CTC GAT ACT TCT GTT CTT CCG GAG CAG GTA GTT631Leu Thr Ser Arg Glu Leu Asp Thr Ser Val Leu Pro Glu Gln Val Val20 25 30GTG GAG CGT CCG CGT AAC CCA GAG CAC GGC GAT TAC GCC ACC AAC ATT679Val Glu Arg Pro Arg Asn Pro Glu His Gly Asp Tyr Ala Thr Asn Ile35 40 45GCA TTG CAG GTG GCT AAA AAG GTC GGT CAG AAC CCT CGG GAT TTG GCT727Ala Leu Gln Val Ala Lys Lys Val Gly Gln Asn Pro Arg Asp Leu Ala50 55 60 65ACC TGG CTG GCA GAG GCA TTG GCT GCA GAT GAC GCC ATT GAT TCT GCT775Thr Trp Leu Ala Glu Ala Leu Ala Ala Asp Asp Ala Ile Asp Ser Ala70 75 80GAA ATT GCT GGC CCA GGC TTT TTG AAC ATT CGC CTT GCT GCA GCA GCA823Glu Ile Ala Gly Pro Gly Phe Leu Asn Ile Arg Leu Ala Ala Ala Ala85 90 95CAG GGT GAA ATT GTG GCC AAG ATT CTG GCA CAG GGC GAG ACT TTC GGA871Gln Gly Glu Ile Val Ala Lys Ile Leu Ala Gln Gly Glu Thr Phe Gly100 105 110AAC TCC GAT CAC CTT TCC CAC TTG GAC GTG AAC CTC GAG TTC GTT TCT919Asn Ser Asp His Leu Ser His Leu Asp Val Asn Leu Glu Phe Val Ser115 120 125GCA AAC CCA ACC GGA CCT ATT CAC CTT GGC GGA ACC CGC TGG GCT GCC967Ala Asn Pro Thr Gly Pro Ile His Leu Gly Gly Thr Arg Trp Ala Ala130 135 140 145GTG GGT GAC TCT TTG GGT CGT GTG CTG GAG GCT TCC GGC GCG AAA GTG 1015Val Gly Asp Ser Leu Gly Arg Val Leu Glu Ala Ser Gly Ala Lys Val150 155 160ACC CGC GAA TAC TAC TTC AAC GAT CAC GGT CGC CAG ATC GAT CGT TTC 1063Thr Arg Glu Tyr Tyr Phe Asn Asp His Gly Arg Gln Ile Asp Arg Phe165 170 175GCT TTG TCC CTT CTT GCA GCG GCG AAG GGC GAG CCA ACG CCA GAA GAC 1111Ala Leu Ser Leu Leu Ala Ala Ala Lys Gly Glu Pro Thr Pro Glu Asp180 185 190GGT TAT GGC GGC GAA TAC ATT AAG GAA ATT GCG GAG GCA ATC GTC GAA 1159Gly Tyr Gly Gly Glu Tyr Ile Lys Glu Ile Ala Glu Ala Ile Val Glu195 200 205AAG CAT CCT GAA GCG TTG GCT TTG GAG CCT GCC GCA ACC CAG GAG CTT 1207Lys His Pro Glu Ala Leu Ala Leu Glu Pro Ala Ala Thr Gln Glu Leu210 215 220 225TTC CGC GCT GAA GGC GTG GAG ATG ATG TTC GAG CAC ATC AAA TCT TCC 1255Phe Arg Ala Glu Gly Val Glu Met Met Phe Glu His Ile Lys Ser Ser230 235 240CTG CAT GAG TTC GGC ACC GAT TTC GAT GTC TAC TAC CAC GAG AAC TCC 1303Leu His Glu Phe Gly Thr Asp Phe Asp Val Tyr Tyr His Glu Asn Ser245 250 255CTG TTC GAG TCC GGT GCG GTG GAC AAG GCC GTG CAG GTG CTG AAG GAC 1351Leu Phe Glu Ser Gly Ala Val Asp Lys Ala Val Gln Val Leu Lys Asp260 265 270AAC GGC AAC CTG TAC GAA AAC GAG GGC GCT TGG TGG CTG CGT TCC ACC 1399Asn Gly Asn Leu Tyr Glu Asn Glu Gly Ala Trp Trp Leu Arg Ser Thr275 280 285GAA TTC GGC GAT GAC AAA GAC CGC GTG GTG ATC AAG TCT GAC GGC GAC1447Glu Phe Gly Asp Asp Lys Asp Arg Val Val Ile Lys Ser Asp Gly Asp290 295 300 305GCA GCC TAC ATC GCT GGC GAT ATC GCG TAC GTG GCT GAT AAG TTC TCC1495Ala Ala Tyr Ile Ala Gly Asp Ile Ala Tyr Val Ala Asp Lys Phe Ser310 315 320CGC GGA CAC AAC CTA AAC ATC TAC ATG TTG GGT GCT GAC CAC CAT GGT1543Arg Gly His Asn Leu Asn Ile Tyr Met Leu Gly Ala Asp His His Gly325 330 335TAC ATC GCG CGC CTG AAG GCA GCG GCG GCG GCA CTT GGC TAC AAG CCA1591Tyr Ile Ala Arg Leu Lys Ala Ala Ala Ala Ala Leu Gly Tyr Lys Pro340 345 350GAA GGC GTT GAA GTC CTG ATT GGC CAG ATG GTG AAC CTG CTT CGC GAC1639Glu Gly Val Glu Val Leu Ile Gly Gln Met Val Asn Leu Leu Arg Asp355 360 365GGC AAG GCA GTG CGT ATG TCC AAG CGT GCA GGC ACC GTG GTC ACC CTA1687Gly Lys Ala Val Arg Met Sar Lys Arg Ala Gly Thr Val Val Thr Leu370 375 380 385GAT GAC CTC GTT GAA GCA ATC GGC ATC GAT GCG GCG CGT TAC TCC CTG1735Asp Asp Leu Val Glu Ala Ile Gly Ile Asp Ala Ala Arg Tyr Ser Leu390 395 400ATC CGT TCC TCC GTG GAT TCT TCC CTG GAT ATC GAT CTC GGC CTG TGG1783Ile Arg Ser Ser Val Asp Ser Ser Leu Asp Ile Asp Leu Gly Leu Trp405 410 415GAA TCC CAG TCC TCC GAC AAC CCT GTG TAC TAC GTG CAG TAC GGA CAC1831Glu Ser Gln Ser Ser Asp Asn Pro Val Tyr Tyr Val Gln Tyr Gly His420 425 430GCT CGT CTG TGC TCC ATC GCG CGC AAG GCA GAG ACC TTG GGT GTC ACC1879Ala Arg Leu Cys Ser Ile Ala Arg Lys Ala Glu Thr Leu Gly Val Thr435 440 445GAG GAA GGC GCA GAC CTA TCT CTA CTG ACC CAC GAC CGC GAA GGC GAT1927Glu Glu Gly Ala Asp Leu Ser Leu Leu Thr His Asp Arg Glu Gly Asp450 455 460 465CTC ATC CGC ACA CTC GGA GAG TTC CCA GCA GTG GTG AAG GCT GCC GCT1975Leu Ile Arg Thr Leu Gly Glu Phe Pro Ala Val Val Lys Ala Ala Ala470 475 480GAC CTA CGT GAA CCA CAC CGC ATT GCC CGC TAT GCT GAG GAA TTA GCT2023Asp Leu Arg Glu Pro His Arg Ile Ala Arg Tyr Ala Glu Glu Leu Ala485 490 495GGA ACT TTC CAC CGC TTC TAC GAT TCC TGC CAC ATC CTT CCA AAG GTT2071Gly Thr Phe His Arg Phe Tyr Asp Ser Cys His Ile Leu Pro Lys Val500 505 510GAT GAG GAT ACG GCA CCA ATC CAC ACA GCA CGT CTG GCA CTT GCA GCA2119Asp Glu Asp Thr Ala Pro Ile His Thr Ala Arg Leu Ala Leu Ala Ala515 520 525GCA ACC CGC CAG ACC CTC GCT AAC GCC CTG CAC CTG GTT GGC GTT TCC2167Ala Thr Arg Gln Thr Leu Ala Asn Ala Leu His Leu Val Gly Val Ser530 535 540 545GCA CCG GAG AAG ATG TAACA ATG GCT ACA GTT GAA AAT TTC AAT GAA 2214Ala Pro Glu Lys Met Met Ala Thr Val Glu Asn Phe Asn Glu550 1 5CTT CCC GCA CAC GTA TGG CCA CGC AAT GCC GTG CGC CAA GAA GAC GGC2262Leu Pro Ala His Val Trp Pro Arg Asn Ala Val Arg Gln Glu Asp Gly10 15 20 25GTT GTC ACC GTC GCT GGT GTG CCT CTG CCT GAC CTC GCT GAA GAA TAC2310Val Val Thr Val Ala Gly Val Pro Leu Pro Asp Leu Ala Glu Glu Tyr
30 35 40GGA ACC CCA CTG TTC GTA GTC GAC GAG GAC GAT TTC CGT TCC CGC TGT2358Gly Thr Pro Leu Phe Val Val Asp Glu Asp Asp Phe Arg Ser Arg Cys45 50 55CGC GAC ATG GCT ACC GCA TTC GGT GGA CCA GGC AAT GTG CAC TAC GCA2406Arg Asp Met Ala Thr Ala Phe Gly Gly Pro Gly Asn Val His Tyr Ala60 65 70TCT AAA GCG TTC CTG ACC AAG ACC ATT GCA CGT TGG GTT GAT GAA GAG2454Ser Lys Ala Phe Leu Thr Lys Thr Ile Ala Arg Trp Val Asp Glu Glu75 80 85GGG CTG GCA CTG GAC ATT GCA TCC ATC AAC GAA CTG GGC ATT GCC CTG2502Gly Leu Ala Leu Asp Ile Ala Ser Ile Asn Glu Leu Gly Ile Ala Leu90 95 100 105GCC GCT GGT TTC CCC GCC AGC CGT ATC ACC GCG CAC GGC AAC AAC AAA2550Ala Ala Gly Phe Pro Ala Ser Arg Ile Thr Ala His Gly Asn Asn Lys110 115 120GGC GTA GAG TTC CTG CGC GCG TTG GTT CAA AAC GGT GTG GGA CAC GTG2598Gly Val Glu Phe Leu Arg Ala Leu Val Gin Asn Gly Val Gly His Val125 130 135GTG CTG GAC TCC GCA CAG GAA CTA GAA CTG TTG GAT TAC GTT GCC GCT2646Val Leu Asp Ser Ala Gln Glu Leu Glu Leu Leu Asp Tyr Val Ala Ala140 145 150GGT GAA GGC AAG ATT CAG GAC GTG TTG ATC CGC GTA AAG CCA GGC ATC2694Gly Glu Gly Lys Ile Gln Asp Val Leu Ile Arg Val Lys Pro Gly Ile155 160 165GAA GCA CAC ACC CAC GAG TTC ATC GCC ACT AGC CAC GAA GAC CAG AAG2742Glu Ala His Thr His Glu Phe Ile Ala Thr Ser His Glu Asp Gln Lys170 175 180 185TTC GGA TTC TCC CTG GCA TCC GGT TCC GCA TTC GAA GCA GCA AAA GCC2790Phe Gly Phe Ser Leu Ala Ser Gly Ser Ala Phe Glu Ala Ala Lys Ala190 195 200GCC AAC AAC GCA GAA AAC CTG AAC CTG GTT GGC CTG CAC TGC CAC GTT2838Ala Asn Asn Ala Glu Asn Leu Asn Leu Val Gly Leu His Cys His Val205 210 215GGT TCC CAG GTG TTC GAC GCC GAA GGC TTC AAG CTG GCA GCA GAA CGC2886Gly Ser Gln Val Phe Asp Ala Glu Gly Phe Lys Leu Ala Ala Glu Arg220 225 230GTG TTG GGC CTG TAC TCA CAG ATC CAC AGC GAA CTG GGC GTT GCC CTT2934Val Leu Gly Leu Tyr Ser Gln Ile His Ser Glu Leu Gly Val Ala Leu235 240 245CCT GAA CTG GAT CTC GGT GGC GGA TAC GGC ATT GCC TAT ACC GCA GCT2982Pro Glu Leu Asp Leu Gly Gly Gly Tyr Gly Ile Ala Tyr Thr Ala Ala250 255 260 265GAA GAA CCA CTC AAC GTC GCA GAA GTT GCC TCC GAC CTG CTC ACC GCA3030Glu Glu Pro Leu Asn Val Ala Glu Val Ala Ser Asp Leu Leu Thr Ala270 275 280GTC GGA AAA ATG GCA GCG GAA CTA GGC ATC GAC GCA CCA ACC GTG CTT3078Val Gly Lys Met Ala Ala Glu Leu Gly Ile Asp Ala Pro Thr Val Leu285 290 295GTT GAG CCC GGC CGC GCT ATC GCA GGC CCC TCC ACC GTG ACC ATC TAC3126Val Glu Pro Gly Arg Ala Ile Ala Gly Pro Ser Thr Val Thr Ile Tyr300 305 310GAA GTC GGC ACC ACC AAA GAC GTC CAC GTA GAC GAC GAC AAA ACC CGC3174Glu Val Gly Thr Thr Lys Asp Val His Val Asp Asp Asp Lys Thr Arg315 320 325CGT TAC ATC GCC GTG GAC GGA GGC ATG TCC GAC AAC ATC CGC CCA GCA3222Arg Tyr Ile Ala Val Asp Gly Gly Met Ser Asp Asn Ile Arg Pro Ala330 335 340 345CTC TAC GGC TCC GAA TAC GAC GCC CGC GTA GTA TCC CGC TTC GCC GAA3270Leu Tyr Gly Ser Glu Tyr Asp Ala Arg Val Val Ser Arg Phe Ala Glu350 355 360GGA GAC CCA GTA AGC ACC CGC ATC GTG GGC TCC CAC TGC GAA TCC GGC3318Gly Asp Pro Val Ser Thr Arg Ile Val Gly Ser His Cys Glu Ser Gly365 370 375GAT ATC CTG ATC AAC GAT GAA ATC TAC CCA TCT GAC ATC ACC AGC GGC3366Asp Ile Leu Ile Asn Asp Glu Ile Tyr Pro Ser Asp Ile Thr Ser Gly380 385 390GAC TTC CTT GCA CTC GCA GCC ACC GGC GCA TAC TGC TAC GCC ATG AGC3414Asp Phe Leu Ala Leu Ala Ala Thr Gly Ala Tyr Cys Tyr Ala Met Ser395 400 405TCC CGC TAC AAC GCC TTC ACA CGG CCC GCC GTC GTG TCC GTC CGC GCT3462Ser Arg Tyr Asn Ala Phe Thr Arg Pro Ala Val Val Ser Val Arg Ala410 415 420 425GGC AGC TCC CGC CTC ATG CTG CGC CGC GAA ACG CTC GAC GAC ATC CTC3510Gly Ser Ser Arg Leu Met Leu Arg Arg Glu Thr Leu Asp Asp Ile Leu430 435 440TCA CTA GAG GCA TAACGCTTTT CGACGCCTGA CCCCGCCCTT CACCTTCGCC3562Ser Leu Glu Ala445GTGGAGGGCG GTTTTGG 3579(2)SEQ ID NO19的信息(i)序列特征(A)長(zhǎng)度550個(gè)氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO19Met Thr Pro Ala Asp Leu Ala Thr Leu lle Lys Glu Thr Ala Val Glu1 5 10 15Val Leu Thr Ser Arg Glu Leu Asp Thr Ser Val Leu Pro Glu Gln Val20 25 30Val Val Glu Arg Pro Arg Asn Pro Glu His Gly Asp Tyr Ala Thr Asn35 40 45Ile Ala Leu Gln Val Ala Lys Lys Val Gly Gln Asn Pro Arg Asp Leu50 55 60Ala Thr Trp Leu Ala Glu Ala Leu Ala Ala Asp Asp Ala Ile Asp Ser65 70 75 80Ala Glu Ile Ala Gly Pro Gly Phe Leu Asn Ile Arg Leu Ala Ala Ala85 90 95Ala Gln Gly Glu Ile Val Ala Lys Ile Leu Ala Gln Gly Glu Thr Phe100 105 110Gly Asn Ser Asp His Leu Ser His Leu Asp Val Asn Leu Glu Phe Val115 120 125Ser Ala Asn Pro Thr Gly Pro Ile His Leu Gly Gly Thr Arg Trp Ala130 135 140Ala Val Gly Asp Ser Leu Gly Arg Val Leu Glu Ala Ser Gly Ala Lys145 150 155 160Val Thr Arg Glu Tyr Tyr Phe Asn Asp His Gly Arg Gln Ile Asp Arg165 170 175Phe Ala Leu Ser Leu Leu Ala Ala Ala Lys Gly Glu Pro Thr Pro Glu
180 185 190Asp Gly Tyr Gly Gly Glu Tyr Ile Lys Glu Ile Ala Glu Ala Ile Val195 200 205Glu Lys His Pro Glu Ala Leu Ala Leu Glu Pro Ala Ala Thr Gln Glu210 215 220Leu Phe Arg Ala Glu Gly Val Glu Met Met Phe Glu His Ile Lys Ser225 230 235 240Ser Leu His Glu Phe Gly Thr Asp Phe Asp Val Tyr Tyr His Glu Ash245 250 255Ser Leu Phe Glu Ser Gly Ala Val Asp Lys Ala Val Gln Val Leu Lys260 265 270Asp Ash Gly Asn Leu Tyr Glu Asn Glu Gly Ala Trp Trp Leu Arg Ser275 280 285Thr Glu Phe Gly Asp Asp Lys Asp Arg Val Val Ile Lys Ser Asp Gly290 295 300Asp Ala Ala Tyr Ile Ala Gly Asp Ile Ala Tyr Val Ala Asp Lys Phe305 310 315 320Ser Arg Gly His Asn Leu Asn Ile Tyr Met Leu Gly Ala Asp His His325 330 335Gly Tyr Ile Ala Arg Leu Lys Ala Ala Ala Ala Ala Leu Gly Tyr Lys340 345 350Pro Glu Gly Val Glu Val Leu Ile Gly Gln Met Val Asn Leu Leu Arg355 360 365Asp Gly Lys Ala Val Arg Met Ser Lys Arg Ala Gly Thr Val Val Thr370 375 380Leu Asp Asp Leu Val Glu Ala Ile Gly Ile Asp Ala Ala Arg Tyr Ser385 390 395 400Leu Ile Arg Ser Ser Val Asp Ser Ser Leu Asp Ile Asp Leu Gly Leu405 410 415Trp Glu Ser Gln Ser Ser Asp Ash Pro Val Tyr Tyr Val Gln Tyr Gly420 425 430His Ala Arg Leu Cys Ser Ile Ala Arg Lys Ala Glu Thr Leu Gly Val435 440 445Thr Glu Glu Gly Ala Asp Leu Ser Leu Leu Thr His Asp Arg Glu Gly450 455 460Asp Leu Ile Arg Thr Leu Gly Glu Phe Pro Ala Val Val Lys Ala Ala465 470 475 480Ala Asp Leu Arg Glu Pro His Arg Ile Ala Arg Tyr Ala Glu Glu Leu485 490 495Ala Gly Thr Phe His Arg Phe Tyr Asp Ser Cys His Ile Leu Pro Lys500 505 510Val Asp Glu Asp Thr Ala Pro Ile His Thr Ala Arg Leu Ala Leu Ala515 520 525Ala Ala Thr Arg Gln Thr Leu Ala Asn Ala Leu His Leu Val Gly Val530 535 540Ser Ala Pro Glu Lys Met545 550(2)SEQ ID NO20的信息(i)序列特征(A)長(zhǎng)度445個(gè)氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO20Met Ala Thr Val Glu Asn Phe Asn Glu Leu Pro Ala His Val Trp Pro1 5 10 15Arg Asn Ala Val Arg Gln Glu Asp Gly Val Val Thr Val Ala Gly Val20 25 30Pro Leu Pro Asp Leu Ala Glu Glu Tyr Gly Thr Pro Leu Phe Val Val35 40 45Asp Glu Asp Asp Phe Arg Ser Arg Cys Arg Asp Met Ala Thr Ala Phe50 55 60Gly Gly Pro Gly Asn Val His Tyr Ala Ser Lys Ala Phe Leu Thr Lys65 70 75 80Thr Ile Ala Arg Trp Val Asp Glu Glu Gly Leu Ala Leu Asp Ile Ala85 90 95Ser Ile Asn Glu Leu Gly Ile Ala Leu Ala Ala Gly Phe Pro Ala Ser100 105 110Arg Ile Thr Ala His Gly Asn Asn Lys Gly Val Glu Phe Leu Arg Ala115 120 125Leu Val Gln Asn Gly Val Gly His Val Val Leu Asp Ser Ala Gln Glu130 135 140Leu Glu Leu Leu Asp Tyr Val Ala Ala Gly Glu Gly Lys Ile Gln Asp145 150 155 160Val Leu Ile Arg Val Lys Pro Gly Ile Glu Ala His Thr His Glu Phe165 170 175Ile Ala Thr Ser His Glu Asp Gln Lys Phe Gly Phe Ser Leu Ala Ser180 185 190Gly Ser Ala Phe Glu Ala Ala Lys Ala Ala Asn Asn Ala Glu Asn Leu195 200 205Asn Leu Val Gly Leu His Cys His Val Gly Ser Gln Val Phe Asp Ala210 215 220Glu Gly Phe Lys Leu Ala Ala Glu Arg Val Leu Gly Leu Tyr Ser Gln225 230 235 240Ile His Ser Glu Leu Gly Val Ala Leu Pro Glu Leu Asp Leu Gly Gly245 250 255Gly Tyr Gly Ile Ala Tyr Thr Ala Ala Glu Glu Pro Leu Asn Val Ala260 265 270Glu Val Ala Ser Asp Leu Leu Thr Ala Val Gly Lys Met Ala Ala Glu275 280 285Leu Gly Ile Asp Ala Pro Thr Val Leu Val Glu Pro Gly Arg Ala Ile290 295 300Ala Gly Pro Ser Thr Val Thr Ile Tyr Glu Val Gly Thr Thr Lys Asp305 310 315 320Val His Val Asp Asp Asp Lys Thr Arg Arg Tyr Ile Ala Val Asp Gly325 330 335Gly Met Ser Asp Asn Ile Arg Pro Ala Leu Tyr Gly Ser Glu Tyr Asp340 345 350Ala Arg Val Val Ser Arg Phe Ala Glu Gly Asp Pro Val Ser Thr Arg355 360 365Ile Val Gly Ser His Cys Glu Ser Gly Asp Ile Leu Ile Asn Asp Glu370 375 380Ile Tyr Pro Ser Asp Ile Thr Ser Gly Asp Phe Leu Ala Leu Ala Ala385 390 395 400Thr Gly Ala Tyr Cys Tyr Ala Met Ser Ser Arg Tyr Asn Ala Phe Thr405 410 415Arg Pro Ala Val Val Ser Val Arg Ala Gly Ser Ser Arg Leu Met Leu420 425 430Arg Arg Glu Thr Leu Asp Asp Ile Leu Ser Leu Glu Ala435 440 445(2)SEQ ID NO21的信息(i)序列特征(A)長(zhǎng)度20個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA"(iv)反義是(xi)序列描述SEQ ID NO21AACCTCGTCATGTTTGAGAA20(2)SEQ ID NO22的信息(i)序列特征(A)長(zhǎng)度20個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA"(iv)反義是(xi)序列描述SEQ ID NO22CCGGCCTACAAAATCGTGCA20(2)SEQ ID NO23的信息(i)序列特征(A)長(zhǎng)度1331個(gè)堿基(B)類型核酸(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型基因組DNA(vi)原始來(lái)源(A)有機(jī)體大腸桿菌(B)菌株JM109(ix)特征(A)名稱/關(guān)鍵詞 CDS(B)位置10..1197(xi)序列描述SEQ ID NO23AACCTCGTC ATG TTT GAG AAC ATT ACC GCC GCT CCT GCC GAC CCG ATT 48Met Phe Glu Asn Ile Thr Ala Ala Pro Ala Asp Pro Ile1 5 10CTG GGC CTG GCC GAT CTG TTT CGT GCC GAT GAA CGT CCC GGC AAA ATT 96Leu Gly Leu Ala Asp Leu Phe Arg Ala Asp Glu Arg Pro Gly Lys Ile15 20 25AAC CTC GGG ATT GGT GTC TAT AAA GAT GAG ACG GGC AAA ACC CCG GTA144Asn Leu Gly Ile Gly Val Tyr Lys Asp Glu Thr Gly Lys Thr Pro Val30 35 40 45CTG ACC AGC GTG AAA AAG GCT GAA CAG TAT CTG CTC GAA AAT GAA ACC192Leu Thr Ser Val Lys Lys Ala Glu Gln Tyr Leu Leu Glu Asn Glu Thr50 55 60ACC AAA AAT TAC CTC GGC ATT GAC GGC ATC CCT GAA TTT GGT CGC TGC240Thr Lys Asn Tyr Leu Gly Ile Asp Gly Ile Pro Glu Phe Gly Arg Cys65 70 75ACT CAG GAA CTG CTG TTT GGT AAA GGT AGC GCC CTG ATC AAT GAC AAA288Thr Gln Glu Leu Leu Phe Gly Lys Gly Ser Ala Leu Ile Asn Asp Lys80 85 90CGT GCT CGC ACG GCA CAG ACT CCG GGG GGC ACT GGC GCA CTA CGC GTG336Arg Ala Arg Thr Ala Gln Thr Pro Gly Gly Thr Gly Ala Leu Arg Val95 100 105GCT GCC GAT TTC CTG GCA AAA AAT ACC AGC GTT AAG CGT GTG TGG GTG384Ala Ala Asp Phe Leu Ala Lys Asn Thr Ser Val Lys Arg Val Trp Val110 115 120 125AGC AAC CCA AGC TGG CCG AAC CAT AAG AGC GTC TTT AAC TCT GCA GGT432Ser Asn Pro Ser Trp Pro Asn His Lys Ser Val Phe Asn Ser Ala Gly130 135 140CTG GAA GTT CGT GAA TAC GCT TAT TAT GAT GCG GAA AAT CAC ACT CTT480Leu Glu Val Arg Glu Tyr Ala Tyr Tyr Asp Ala Glu Asn His Thr Leu145 150 155GAC TTC GAT GCA CTG ATT AAC AGC CTG AAT GAA GCT CAG GCT GGC GAC528Asp Phe Asp Ala Leu Ile Asn Ser Leu Asn Glu Ala Gln Ala Gly Asp160 165 170GTA GTG CTG TTC CAT GGC TGC TGC CAT AAC CCA ACC GGT ATC GAC CCT576Val Val Leu Phe His Gly Cys Cys His Asn Pro Thr Gly Ile Asp Pro175 180 185ACG CTG GAA CAA TGG CAA ACA CTG GCA CAA CTC TCC GTT GAG AAA GGC624Thr Leu Glu Gln Trp Gln Thr Leu Ala Gln Leu Ser Val Glu Lys Gly190 195 200 205TGG TTA CCG CTG TTT GAC TTC GCT TAC CAG GGT TTT GCC CGT GGT CTG672Trp Leu Pro Leu Phe Asp Phe Ala Tyr Gln Gly Phe Ala Arg Gly Leu210 215 220GAA GAA GAT GCT GAA GGA CTG CGC GCT TTC GCG GCT ATG CAT AAA GAG720Glu Glu Asp Ala Glu Gly Leu Arg Ala Phe Ala Ala Met His Lys Glu225 230 235CTG ATT GTT GCC AGT TCC TAC TCT AAA AAC TTT GGC CTG TAC AAC GAG768Leu Ile Val Ala Ser Ser Tyr Ser Lys Asn Phe Gly Leu Tyr Asn Glu240 245 250CGT GTT GGC GCT TGT ACT CTG GTT GCT GCC GAC AGT GAA ACC GTT GAT816Arg Val Gly Ala Cys Thr Leu Val Ala Ala Asp Ser Glu Thr Val Asp255 260 265CGC GCA TTC AGC CAA ATG AAA GCG GCG ATT CGC GCT AAC TAC TCT AAC864Arg Ala Phe Ser Gln Met Lys Ala Ala Ile Arg Ala Asn Tyr Ser Asn270 275 280 285CCA CCA GCA CAC GGC GCT TCT GTT GTT GCC ACC ATC CTG AGC AAC GAT912Pro Pro Ala His Gly Ala Ser Val Val Ala Thr Ile Leu Ser Asn Asp290 295 300GCG TTA CGT GCG ATT TGG GAA CAA GAG CTG ACT GAT ATG CGC CAG CGT960Ala Leu Arg Ala Ile Trp Glu Gln Glu Leu Thr Asp Met Arg Gln Arg305 310 315ATT CAG CGT ATG CGT CAG TTG TTC GTC AAT ACG CTG CAG GAA AAA GGC 1008Ile Gln Arg Met Arg Gln Leu Phe Val Asn Thr Leu Gln Glu Lys Gly320 325 330GCA AAC CGC GAC TTC AGC TTT ATC ATC AAA CAG AAC GGC ATG TTC TCC 1056Ala Asn Arg Asp Phe Ser Phe Ile Ile Lys Gln Asn Gly Met Phe Ser335 340 345TTC AGT GGC CTG ACA AAA GAA CAA GTG CTG CGT CTG CGC GAA GAG TTT 1104Phe Ser Gly Leu Thr Lys Glu Gln Val Leu Arg Leu Arg Glu Glu Phe350 355 360 365GGC GTA TAT GCG GTT GCT TCT GGT CGC GTA AAT GTG GCC GGG ATG ACA 1152Gly Val Tyr Ala Val Ala Ser Gly Arg Val Asn Val Ala Gly Met Thr370 375 380CCA GAT AAC ATG GCT CCG CTG TGC GAA GCG ATT GTG GCA GTG CTG 1197Pro Asp Asn Met Ala Pro Leu Cys Glu Ala Ile Val Ala Val Leu385 390 395TAAGCATTAA AAACAATGAA CGCGCTGAAA AGCGGGCTGA GACTGATGAC AAACGCAACA 1257TTGCCTGATG GCTACGCTTA TCAGGCCTAC GCGTCCCCTG CAATATTTTG AATTTGCACG 1317ATTTTGTAGG CCGG 1331(2)SEQ ID NO24的信息(i)序列特征(A)長(zhǎng)度396個(gè)氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO24Met Phe Glu Asn Ile Thr Ala Ala Pro Ala Asp Pro Ile Leu Gly Leu15 10 15Ala Asp Leu Phe Arg Ala Asp Glu Arg Pro Gly Lys Ile Asn Leu Gly20 25 30Ile Gly Val Tyr Lys Asp Glu Thr Gly Lys Thr Pro Val Leu Thr Ser35 40 45VaI Lys Lys Ala Glu Gln Tyr Leu Leu Glu Asn Glu Thr Thr Lys Asn50 55 60Tyr Leu Gly Ile Asp Gly Ile Pro Glu Phe Gly Arg Cys Thr Gln Glu65 70 75 80Leu Leu Phe Gly Lys Gly Ser Ala Leu Ile Asn Asp Lys Arg Ala Arg85 90 95Thr Ala Gln Thr Pro Gly Gly Thr Gly Ala Leu Arg Val Ala Ala Asp100 105 110Phe Leu Ala Lys Asn Thr Ser Val Lys Arg Val Trp Val Ser Asn Pro115 120 125Ser Trp Pro Asn His Lys Ser Val Phe Asn Ser Ala Gly Leu Glu Val130 135 140Arg Glu Tyr Ala Tyr Tyr Asp Ala Glu Asn His Thr Leu Asp Phe Asp145 150 155 160Ala Leu Ile Asn Ser Leu Asn Glu Ala Gln Ala Gly Asp Val Val Leu165 170 175Phe His Gly Cys Cys His Asn Pro Thr Gly Ile Asp Pro Thr Leu Glu180 185 190Gln Trp Gln Thr Leu Ala Gln Leu Aer Val Glu Lys Gly Trp Leu Pro195 200 205Leu Phe Asp Phe Ala Tyr Gln Gly Phe Ala Arg Gly Leu Glu Glu Asp210 215 220Ala Glu Gly Leu Arg Ala Phe Ala Ala Met His Lys Glu Leu Ile Val225 230 235 240Ala Ser Ser Tyr Ser Lys Asn Phe Gly Leu Tyr Asn Glu Arg Val Gly245 250 255Ala Cys Thr Leu Val Ala Ala Asp Ser Glu Thr Val Asp Arg Ala Phe260 265 270Ser Gln Met Lys Ala Ala Ile Arg Ala Asn Tyr Ser Asn Pro Pro Ala275 280 285His Gly Ala Ser Val Val Ala Thr Ile Leu Ser Asn Asp Ala Leu Arg290 295 300Ala Ile Trp Glu Gln Glu Leu Thr Asp Met Arg Gln Arg Ile Gln Arg305 310 315 320Met Arg Gln Leu Phe Val Asn Thr Leu Gln Glu Lys Gly Ala Asn Arg325 330 335Asp Phe Ser Phe Ile Ile Lys Gln Asn Gly Met Phe Ser Phe Ser Gly340 345 350Leu Thr Lys Glu Gln Val Leu Arg Leu Arg Glu Glu Phe Gly Val Tyr355 360 365Ala Val Ala Ser Gly Arg Val Asn Val Ala Gly Met Thr Pro Asp Asn370 375 380Met Ala Pro Leu Cys Glu AlaIle Val Ala Val Leu385 390395(2)SEQ ID NO25的信息(i)序列特征(A)長(zhǎng)度2517個(gè)堿基(B)類型核酸(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性
(ii)分子類型基因組DNA(vi)原始來(lái)源(A)有機(jī)體乳發(fā)酵短桿菌(B)菌株ATCC 13869(xi)序列描述SEQ ID NO25GATCAGCTTC GGGTGTTGAA GGGGCCGAAT AAGGAACTCG CGCAGTTGGG TCGTAGTTTG 60TTTAAACGAC TTGGTGATGT GTTGGCGTAT TTCGATGTTG GTGTCTCCAA CGGTCCGGTC 120GAAGCGATCA ACGGACGGTT GGAGCATTTG CGTGGGATTG CTCTAGGTTT CCGTAATTTG 180AACCACTACA TTCTGCGGTG CCTTATCCAT TCAGGGCAGT TGGTCCATAA GATCAATGCA 240CTCTAAAACA GGAAGAGCCC CTTTACAAGC GGCAAGACCA AACTGGGTGA CCGAAAATCT 300TCAGGCCAAT CAGTTTTGGT CATATGGGAT GGTTTTTAGA CCTCGAAACC ATCCCATATG 360ACCGAAGCCC GCGAAACTCT GTGTTCGTTG GTCGCCTGGT TCGGTCTCAA TGCCTTGCCG 420AAACCACAAC GCCCCGAAAC CCAAAACTCC CCAATACATG AAAAAACCAG CTTCCCACCG 480AAGTGAGAAG CTGGTTTAGT TTGCGGAGGA TAGGGGATTT GAACCCCTGA GGGATTGCTC 540CCAACCCGCG TTCCAGGCGA GCGACATAGG CCGCTAGTCG AATCCTCCAG CTAGAACGGC 600TGCAACGCAT GGCTGCTTTG TTCTGGGGAT TAGATTACAC AAAAGTCGTT TAGAAACTCA 660AATCCGCTCG CAGTTGGCGT TTTCTGGGGC GGTTCAGCTA GAGTTATGCG AAGGATCCCG 720TGCGGCGTTT ATCTTGTGAA CTCCCCCAGG GCAGGAATGC AGCAAGGGTC AGCGAGCTCT 780GACGGGTGCG CGGGGTCCCC TAAAACGTCT AGAGTAGTGG CTTGAGGTCA CTGCTCTTTT 840TTTGTGCCCT TTTTTTGGTC CGTCTATTTT GCCACCACAT GCGGAGGTAC GCAGTTATGA 900GTTCAGTTTC GCTGCAGGAT TTTGATGCAG AGCGAATTGG TCTGTTCCAC GAGGACATTA 960AACGCAAGTT TGATGAGCTC AAGTCAAAAA ATCTGAAGCT GGATCTTACT CGCGGTAAGC1020CTTCGTCGGA GCAGTTGGAT TTCGCTGATG AGCTGTTGGC GTTGCCTGGT AAGGGCGATT1080TCAAGGCTGC GGATGGTACT GATGTCCGTA ACTATGGCGG GCTGGATGGC ATTGTTGATA1140TTCGTCAGAT TTGGGCGGAT TTGCTGGGTG TTCCTGTGGA GCAGGTGCTG GCGGGGGATG1200CTTCGAGCTT GAACATCATG TTTGATGTGA TCAGCTGGTC GTACATTTTT GGTAACAATG1260ATTCGGTTCA GCCTTGGTCG AAGGAAGAAA CTGTTAAGTG GATTTGTCCT GTTCCGGGAT1320ATGATCGCCA TTTCTCCATC ACGGAGCGTT TCGGCTTTGA GATGATTTCT GTGCCAATGA1380ATGAAGACGG CCCTGATATG GATGCTGTTG AGGAATTGGT CAAGGATCCG CAGGTTAAGG1440GCATGTGGGT TGTGCCGGTA TTTTCTAACC CGACTGGTTT CACGGTGTCG GAGGACGTCG1500CAAAGCGTCT GAGCACGATG GAAACTGCGG CGCCGGACTT CCGCGTGGTG TGGGATAACG1560CTTACGCCGT TCATACTCTG ACCGATGAGT TCCCTGAGGT CATCGACATC GTTGGGCTTG1620GTGAGGCGGC GGGTAACCCG AACCGTTTCT GGGCGTTCAC TTCTACTTCG AAGATCACTC1680TCGCGGGTGC GGGCGTGTCC TTCTTCATGA CTTCTGCGGA GAACCGTAAG TGGTACTCCG1740GTCATGCGGG TATCCGTGGC ATTGGCCCTA ACAAGGTCAA TCAGTTGGCT CATGCGCGTT1800ACTTTGGCGA TGCTGAGGGA GTGCGCGCGG TGATGCGTAA GCATGCTGCG TCGTTGGCTC1860CGAAGTTCAA CAAGGTTCTG GAGATCCTGG ATTCTCGCCT TGCTGAGTAC GGTGTCGCGC1920AGTGGACTGT CCCTGCGGGC GGTTACTTCA TTTCCCTTGA TGTGGTTCCT GGTACGGCAT1980CTCGTGTGGC TGAGTTGGCT AAGGAAGCCG GCATTGCGTT GACGGGTGCG GGTTCTTCTT2040ACCCGCTGCG TCAGGATCCG GAGAACAAGA ACCTCCGTTT GGCGCCTTCT CTGCCTCCTG2100TTGAGGAACT TGAGGTTGCC ATGGATGGCG TGGCTACGTG TGTTTTGCTG GCAGCTGCGG2160AGCACTACGC TAGCTAGAGT GAATACCGCG GAAACTGCAC ATTGGATTAA CCGTTTGCTG2220CCGGGTCAGC CGGAGTTTCA CCAGGTTGGC GCGTTTAAAG TGGCGGGTTA CACGCTTGAT2280GATGAGTCAA TTGCGTGTTC TGTCAATTTC GGGCGCGTCA ACACGGGCCT GGTCACCGAG2340ACAGGCGCGG AAACCGTCGA TGTGCGAAGT GAGATTTTGA GCCTGGCCAG GGCCGACGTG2400TCCGTGCCTG GGCGCGCCGT CGGCGCTGCT GCAACAATGC TTCTCGACGC CTCCCTCTCC2460TTCAAATCCG CCACCGATTC CAGTGTCACT CCCATGCATG CCCAACCGGG ACAGATC 2517(2)SEQ ID NO26的信息(i)序列特征(A)長(zhǎng)度23個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA"(iv)反義否(xi)序列描述SEQ ID NO26GATCAACGGACGGTTGGAGC ATT 23(2)SEQ ID NO27的信息(i)序列特征(A)長(zhǎng)度23個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述dese="合成的DNA"(iv)反義是(xi)序列描述SEQ ID NO27GGTATTCACTCTAGCTAGCG TAG 23(2)SEQ ID NO28的信息(i)序列特征(A)長(zhǎng)度23個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA"(iv)反義否(xi)序列描述SEQ ID NO28GAGCTCAAGTCAAAAAATCT GAA 23(2)SEQ ID NO29的信息(i)序列特征(A)長(zhǎng)度23個(gè)堿基(B)類型核酸(C)鏈型單鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型其它核酸(A)描述desc="合成的DNA"(iv)反義是(xi)序列描述SEQ ID NO29GATCTGTCCCGGTTGGGCAT GCA 23(2)SEQ ID NO30的信息(i)序列特征(A)長(zhǎng)度2517個(gè)堿基(B)類型核酸(C)鏈型雙鏈(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型基因組DNA(vi)原始來(lái)源(A)有機(jī)體乳發(fā)酵短桿菌(B)菌株ATCC 13869(ix)特征(A)名稱/關(guān)鍵詞CDS(B)位置 879..2174(xi)序列描述SEQ ID NO30GATCAGCTTC GGGTGTTGAA GGGGCCGAAT AAGGAACTCG CGCAGTTGGG TCGTAGTTTG 60TTTAAACGAC TTGGTGATGT GTTGGCGTAT TTCGATGTTG GTGTCTCCAA CGGTCCGGTC120GAAGCGATCA ACGGACGGTT GGAGCATTTG CGTGGGATTG CTCTAGGTTT CCGTAATTTG180AACCACTACA TTCTGCGGTG CCTTATCCAT TCAGGGCAGT TGGTCCATAA GATCAATGCA240CTCTAAAACA GGAAGAGCCC CTTTACAAGC GGCAAGACCA AACTGGGTGA CCGAAAATCT300TCAGGCCAAT CAGTTTTGGT CATATGGGAT GGTTTTTAGA CCTCGAAACC ATCCCATATG360ACCGAAGCCC GCGAAACTCT GTGTTCGTTG GTCGCCTGGT TCGGTCTCAA TGCCTTGCCG420AAACCACAAC GCCCCGAAAC CCAAAACTCC CCAATACATG AAAAAACCAG CTTCCCACCG480AAGTGAGAAG CTGGTTTAGT TTGCGGAGGA TAGGGGATTT GAACCCCTGA GGGATTGCTC540CCAACCCGCG TTCCAGGCGA GCGACATAGG CCGCTAGTCG AATCCTCCAG CTAGAACGGC600TGCAACGCAT GGCTGCTTTG TTCTGGGGAT TAGATTACAC AAAAGTCGTT TAGAAACTCA660AATCCGCTCG CAGTTGGCGT TTTCTGGGGC GGTTCAGCTA GAGTTATGCG AAGGATCCCG720TGCGGCGTTT ATCTTGTGAA CTCCCCCAGG GCAGGAATGC AGCAAGGGTC AGCGAGCTCT780GACGGGTGCG CGGGGTCCCC TAAAACGTCT AGAGTAGTGG CTTGAGGTCA CTGCTCTTTT840TTTGTGCCCT TTTTTTGGTC CGTCTATTTT GCCACCAC ATG CGG AGG TAC GCA893Met Arg Arg Tyr Ala1 5GTT ATG AGT TCA GTT TCG CTG CAG GAT TTT GAT GCA GAG CGA ATT GGT 941Val Met Ser Ser Val Ser Leu Gln Asp Phe Asp Ala Glu Arg Ile Gly10 15 20CTG TTC CAC GAG GAC ATT AAA CGC AAG TTT GAT GAG CTC AAG TCA AAA 989Leu Phe His Glu Asp Ile Lys Arg Lys Phe Asp Glu Leu Lys Ser Lys25 30 35AAT CTG AAG CTG GAT CTT ACT CGC GGT AAG CCT TCG TCG GAG CAG TTG 1037Asn Leu Lys Leu Asp Leu Thr Arg Gly Lys Pro Ser Ser Glu Gln Leu40 45 50GAT TTC GCT GAT GAG CTG TTG GCG TTG CCT GGT AAG GGC GAT TTC AAG 1085Asp Phe Ala Asp Glu Leu Leu Ala Leu Pro Gly Lys Gly Asp Phe Lys55 60 65GCT GCG GAT GGT ACT GAT GTC CGT AAC TAT GGC GGG CTG GAT GGC ATT 1133Ala Ala Asp Gly Thr Asp Val Arg Asn Tyr Gly Gly Leu Asp Gly Ile70 75 80 85GTT GAT ATT CGT CAG ATT TGG GCG GAT TTG CTG GGT GTT CCT GTG GAG 1181Val Asp Ile Arg Gln Ile Trp Ala Asp Leu Leu Gly Val Pro Val Glu90 95 100CAG GTG CTG GCG GGG GAT GCT TCG AGC TTG AAC ATC ATG TTT GAT GTG 1229Gln Val Leu Ala Gly Asp Ala Ser Ser Leu Asn Ile Met Phe Asp Val105 110 115ATC AGC TGG TCG TAC ATT TTT GGT AAC AAT GAT TCG GTT CAG CCT TGG 1277Ile Ser Trp Ser Tyr Ile Phe Gly Asn Asn Asp Ser Val Gln Pro Trp120 125 130TCG AAG GAA GAA ACT GTT AAG TGG ATT TGT CCT GTT CCG GGA TAT GAT 1325Ser Lys Glu Glu Thr Val Lys Trp Ile Cys Pro Val Pro Gly Tyr Asp135 140 145CGC CAT TTC TCC ATC ACG GAG CGT TTC GGC TTT GAG ATG ATT TCT GTG 1373Arg His Phe Ser Ile Thr Glu Arg Phe Gly Phe Glu Met Ile Ser Val150 155 160 165CCA ATG AAT GAA GAC GGC CCT GAT ATG GAT GCT GTT GAG GAA TTG GTC 1421Pro Met Asn Glu Asp Gly Pro Asp Met Asp Ala Val Glu Glu Leu Val170 175 180AAG GAT CCG CAG GTT AAG GGC ATG TGG GTT GTG CCG GTA TTT TCT AAC 1469Lys Asp Pro Gln Val Lys Gly Met Trp Val Val Pro Val Phe Ser Asn185 190 195CCG ACT GGT TTC ACG GTG TCG GAG GAC GTC GCA AAG CGT CTG AGC ACG 1517Pro Thr Gly Phe Thr Val Ser Glu Asp Val Ala Lys Arg Leu Ser Thr200 205 210ATG GAA ACT GCG GCG CCG GAC TTC CGC GTG GTG TGG GAT AAC GCT TAC 1565Met Glu Thr Ala Ala Pro Asp Phe Arg Val Val Trp Asp Asn Ala Tyr215 220 225GCC GTT CAT ACT CTG ACC GAT GAG TTC CCT GAG GTC ATC GAC ATC GTT 1613Ala Val His Thr Leu Thr Asp Glu Phe Pro Glu Val Ile Asp Ile Val230 235 240 245GGG CTT GGT GAG GCG GCG GGT AAC CCG AAC CGT TTC TGG GCG TTC ACT 1661Gly Leu Gly Glu Ala Ala Gly Asn Pro Asn Arg Phe Trp Ala Phe Thr250 255 260TCT ACT TCG AAG ATC ACT CTC GCG GGT GCG GGC GTG TCC TTC TTC ATG 1709Ser Thr Ser Lys Ile Thr Leu Ala Gly Ala Gly Val Ser Phe Phe Met265 270 275ACT TCT GCG GAG AAC CGT AAG TGG TAC TCC GGT CAT GCG GGT ATC CGT 1757Thr Ser Ala Glu Asn Arg Lys Trp Tyr Ser Gly His Ala Gly Ile Arg280 285 290GGC ATT GGC CCT AAC AAG GTC AAT CAG TTG GCT CAT GCG CGT TAC TTT 1805Gly Ile Gly Pro Asn Lys Val Asn Gln Leu Ala His Ala Arg Tyr Phe295 300 305GGC GAT GCT GAG GGA GTG CGC GCG GTG ATG CGT AAG CAT GCT GCG TCG 1853Gly Asp Ala Glu Gly Val Arg Ala Val Met Arg Lys His Ala Ala Ser310 315 320 325TTG GCT CCG AAG TTC AAC AAG GTT CTG GAG ATC CTG GAT TCT CGC CTT 1901Leu Ala Pro Lys Phe Asn Lys Val Leu Glu Ile Leu Asp Ser Arg Leu330 335 340GCT GAG TAC GGT GTC GCG CAG TGG ACT GTC CCT GCG GGC GGT TAC TTC 1949Ala Glu Tyr Gly Val Ala Gln Trp Thr Val Pro Ala Gly Gly Tyr Phe345 350 355ATT TCC CTT GAT GTG GTT CCT GGT ACG GCA TCT CGT GTG GCT GAG TTG 1997Ile Ser Leu Asp Val Val Pro Gly Thr Ala Ser Arg Val Ala Glu Leu360 365 370GCT AAG GAA GCC GGC ATT GCG TTG ACG GGT GCG GGT TCT TCT TAC CCG 2045Ala Lys Glu Ala Gly Ile Ala Leu Thr Gly Ala Gly Ser Ser Tyr Pro375 380 385CTG CGT CAG GAT CCG GAG AAC AAG AAC CTC CGT TTG GCG CCT TCT CTG 2093Leu Arg Gln Asp Pro Glu Asn Lys Asn Leu Arg Leu Ala Pre Ser Leu390 395 400 405CCT CCT GTT GAG GAA CTT GAG GTT GCC ATG GAT GGC GTG GCT ACG TGT 2141Pro Pro Val Glu Glu Leu Glu Val Ala Met Asp Gly Val Ala Thr Cys410 415 420GTT TTG CTG GCA GCT GCG GAG CAC TAC GCT AGC TAGAGTGAAT ACCGCGGAAA 2194Val Leu Leu Ala Ala Ala Glu His Tyr Ala Ser425 430CTGCACATTG GATTAACCGT TTGCTGCCGG GTCAGCCGGA GTTTCACCAG GTTGGCGCGT 2254TTAAAGTGGC GGGTTACACG CTTGATGATG AGTCAATTGC GTGTTCTGTC AATTTCGGGC 2314GCGTCAACAC GGGCCTGGTC ACCGAGACAG GCGCGGAAAC CGTCGATGTG CGAAGTGAGA 2374TTTTGAGCCT GGCCAGGGCC GACGTGTCCG TGCCTGGGCG CGCCGTCGGC GCTGCTGCAA 2434CAATGCTTCT CGACGCCTCC CTCTCCTTCA AATCCGCCAC CGATTCCAGT GTCACTCCCA 2494TGCATGCCCA ACCGGGACAG ATC 2517(2)SEQ ID NO31的信息(i)序列特征(A)長(zhǎng)度432個(gè)氨基酸(B)類型氨基酸(D)拓?fù)浣Y(jié)構(gòu)線性(ii)分子類型蛋白質(zhì)(xi)序列描述SEQ ID NO31Met Arg Arg Tyr Ala Val Met Ser Ser Val Ser Leu Gln Asp Phe Asp1 5 10 15Ala Glu Arg Ile Gly Leu Phe His Glu Asp Ile Lys Arg Lys Phe Asp20 25 30Glu Leu Lys Ser Lys Asn Leu Lys Leu Asp Leu Thr Arg Gly Lys Pro35 40 45Ser Ser Glu Gln Leu Asp Phe Ala Asp Glu Leu Leu Ala Leu Pro Gly50 55 60Lys Gly Asp Phe Lys Ala Ala Asp Gly Thr Asp Val Arg Asn Tyr Gly65 70 75 80Gly Leu Asp Gly Ile Val Asp Ile Arg Gln Ile Trp Ala Asp Leu Leu85 90 95Gly Val Pro Val Glu Gln Val Leu Ala Gly Asp Ala Ser Ser Leu Asn100 105 110Ile Met Phe Asp Val Ile Ser Trp Ser Tyr Ile Phe Gly Asn Asn Asp
115 120 125Ser Val Gln Pro Trp Ser Lys Glu Glu Thr Val Lys Trp Ile Cys Pro130 135 140Val Pro Gly Tyr Asp Arg His Phe Ser Ile Thr Glu Arg Phe Gly Phe145 150 155 160Glu Met Ile Ser Val Pro Met Asn Glu Asp Gly Pro Asp Met Asp Ala165 170 175Val Glu Glu Leu Val Lys Asp Pro Gln Val Lys Gly Met Trp Val Val180 185 190Pro Val Phe Ser Asn Pro Thr Gly Phe Thr Val Ser Glu Asp Val Ala195 200 205Lys Arg Leu Ser Thr Met Glu Thr Ala Ala Pro Asp Phe Arg Val Val210 215 220Trp Asp Asn Ala Tyr Ala Val His Thr Leu Thr Asp Glu Phe Pro Glu225 230 235 240Val Ile Asp Ile Val Gly Leu Gly Glu Ala Ala Gly Asn Pro Asn Arg245 250 255Phe Trp Ala Phe Thr Ser Thr Ser Lys Ile Thr Leu Ala Gly Ala Gly260 265 270Val Ser Phe Phe Met Thr Ser Ala Glu Asn Arg Lys Trp Tyr Ser Gly275 280 285His Ala Gly Ile Arg Gly Ile Gly Pro Asn Lys Val Asn Gln Leu Ala290 295 300His Ala Arg Tyr Phe Gly Asp Ala Glu Gly Val Arg Ala Val Met Arg305 310 315 320Lys His Ala Ala Ser Leu Ala Pro Lys Phe Asn Lys Val Leu Glu Ile325 330 335Leu Asp Ser Arg Leu Ala Glu Tyr Gly Val Ala Gln Trp Thr Val Pro340 345 350Ala Gly Gly Tyr Phe Ile Ser Leu Asp Val Val Pro Gly Thr Ala Ser355 360 365Arg Val Ala Glu Leu Ala Lys Glu Ala Gly Ile Ala Leu Thr Gly Ala370 375 380Gly Ser Ser Tyr Pro Leu Arg Gln Asp Pro Glu Asn Lys Asn Leu Arg385 390 395 400Leu Ala Pro Ser Leu Pro Pro Val Glu Glu Leu Glu Val Ala Met Asp405 410 415Gly Val Ala Thr Cys Val Leu Leu Ala Ala Ala Glu His Tyr Ala Ser420 425 430
權(quán)利要求
1.一種在棒狀桿菌細(xì)胞中可自主復(fù)制的重組DNA,該DNA包含編碼天冬氨酸激酶(其中L-蘇氨酸和L-賴氨酸的反饋抑制實(shí)質(zhì)上被脫敏)的DNA序列、編碼二氫二吡啶甲酸還原酶的DNA序列、編碼二氫二吡啶甲酸合酶的DNA序列、編碼二氨基庚二酸脫羧酶的DNA序列以及編碼天冬氨酸轉(zhuǎn)氨酶的DNA序列。
2.按照權(quán)利要求1的重組DNA,其中所說(shuō)的天冬氨酸激酶(其中L-蘇氨酸和L-賴氨酸的反饋抑制實(shí)質(zhì)上被脫敏)是來(lái)源于棒狀桿菌的天冬氨酸激酶,并且其中所說(shuō)的天冬氨酸激酶是突變天冬氨酸激酶,在該突變天冬氨酸激酶中,相應(yīng)于279位(在SEQ ID NO5所示的氨基酸序列中從N-末端開(kāi)始計(jì)數(shù))丙氨酸殘基的氨基酸殘基改變成非丙氨酸和非其α-亞單位中的酸性氨基酸的氨基酸殘基,相應(yīng)于30位(在SEQ ID NO7所示的氨基酸序列中從N-末端開(kāi)始計(jì)數(shù))丙氨酸殘基的氨基酸殘基改變成非丙氨酸和非其β-亞單位中的酸性氨基酸的氨基酸殘基。
3.按照權(quán)利要求1的重組DNA,其中所說(shuō)的編碼二氫吡啶甲酸還原酶的DNA序列編碼SEQ ID NO15所示的氨基酸序列或與SEQ ID NO15所示的氨基酸序列實(shí)質(zhì)上相同的氨基酸序列。
4.按照權(quán)利要求1的重組DNA,其中所說(shuō)的編碼二氫吡啶甲酸合酶的DNA序列編碼SEQ ID NO11所示的氨基酸序列或與SEQ ID NO11所示的氨基酸序列實(shí)質(zhì)上相同的氨基酸序列。
5.按照權(quán)利要求1的重組DNA,其中所說(shuō)的編碼二氨基庚二酸脫羧酶的DNA序列編碼SEQ ID NO19所示的氨基酸序列或與SEQ ID NO19所示的氨基酸序列實(shí)質(zhì)上相同的氨基酸序列。
6.按照權(quán)利要求1的重組DNA,其中所說(shuō)的編碼天冬氨酸轉(zhuǎn)氨酶的DNA序列編碼SEQ ID NO24或31所示的氨基酸序列或與SEQ ID NO24或31所示的氨基酸序列實(shí)質(zhì)上相同的氨基酸序列。
7.一種具有天冬氨酸激酶(其中L-蘇氨酸和I-賴氨酸的反饋抑制實(shí)質(zhì)上被脫敏)的棒狀桿菌,該棒狀桿菌包含編碼二氫二吡啶甲酸還原酶的增強(qiáng)DNA序列、編碼二氫吡啶甲酸還原酶的增強(qiáng)DNA序列、編碼二氫吡啶甲酸合酶的增強(qiáng)DNA序列、編碼二氨基庚二酸脫羧酶的增強(qiáng)DNA序列、編碼天冬氨酸轉(zhuǎn)氨酶的增強(qiáng)DNA序列。
8.按照權(quán)利要求7的棒狀桿菌,該棒狀桿菌是通過(guò)引入如權(quán)利要求1所限定的重組DNA轉(zhuǎn)化過(guò)的。
9.一種用于產(chǎn)生L-賴氨酸的方法,該方法包括以下步驟在適當(dāng)?shù)呐囵B(yǎng)基中培養(yǎng)如權(quán)利要求8所限定的棒狀桿菌,使得在所說(shuō)的細(xì)菌的培養(yǎng)物中產(chǎn)生并積累L-賴氨酸,并從培養(yǎng)物收集L-賴氨酸。
10.一種編碼包含SEQ ID NO31所示的氨基酸序列之蛋白質(zhì)的DNA。
11.按照權(quán)利要求10的DNA,該DNA包含SEQ ID NO30所示的核苷酸序列中的879至2147位核苷酸的核苷酸序列。
12.載體pVK7,該載體在大腸桿菌和乳發(fā)酵短桿菌細(xì)胞中是可自主復(fù)制的,并且包含一個(gè)多克隆位點(diǎn)和lacZ’。
全文摘要
一種具有天冬氨酸激酶的棒狀桿菌(其中L-蘇氨酸和L-賴氨酸的反饋抑制實(shí)質(zhì)上被脫敏),其包含編碼二氫二吡啶甲酸還原酶的增強(qiáng)DNA序列、編碼二氫吡啶甲酸還原酶的增強(qiáng)DNA序列、編碼二氫吡啶甲酸合酶的增強(qiáng)DNA序列、編碼二氨基庚二酸脫羧酶的增強(qiáng)DNA序列、編碼天冬氨酸轉(zhuǎn)氨酶的增強(qiáng)DNA序列;一種用于產(chǎn)生L-賴氨酸的方法,該方法包括以下步驟:在適當(dāng)?shù)呐囵B(yǎng)基中培養(yǎng)棒狀桿菌使得在所說(shuō)的細(xì)菌的培養(yǎng)物中產(chǎn)生并積累L-賴氨酸,并從培養(yǎng)物收集L-賴氨酸;以及一種可用于產(chǎn)生棒狀桿菌的重組DNA。
文檔編號(hào)C12N15/77GK1187540SQ97120820
公開(kāi)日1998年7月15日 申請(qǐng)日期1997年12月5日 優(yōu)先權(quán)日1996年12月5日
發(fā)明者荒木政行, 杉本雅一, 吉原康彥, 中松亙 申請(qǐng)人:味之素株式會(huì)社