国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      從2-脫氫-3-脫氧-d-葡糖酸生產(chǎn)2‘-脫氧核苷和2‘-脫氧核苷前體的制作方法

      文檔序號(hào):551479閱讀:670來(lái)源:國(guó)知局
      專利名稱:從2-脫氫-3-脫氧-d-葡糖酸生產(chǎn)2‘-脫氧核苷和2‘-脫氧核苷前體的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及使用2-脫氫-3-脫氧-D-葡糖酸(通??s寫(xiě)為KDG)或它的鹽作為原料,制備2′-脫氧核苷化合物或2′-脫氧核苷前體的方法。許多2′-脫氧核苷和它們的類似物可作為生產(chǎn)抗病毒劑、抗癌劑或反義試劑的合成或藥物制劑原料使用。
      更具體地,本發(fā)明涉及一種方法,其中對(duì)KDG或KDG的衍生物進(jìn)行脫羧基步驟,以去除KDG的原始羧基。在一個(gè)優(yōu)選的實(shí)施方案中,在根據(jù)本發(fā)明的方法中使用的KDG是從D-葡糖酸(鹽)或D-葡糖胺(鹽)酶促生產(chǎn)的。
      包含2-脫氧-D-核糖的2′-脫氧核苷和2′-脫氧核苷前體可用作合成或藥物制劑原料,例如,在抗病毒劑和抗癌劑的生產(chǎn)中。2′-脫氧核苷或其衍生物和2′-脫氧核苷前體也可用作治療性反義分子的研究、診斷和合成的試劑。
      在現(xiàn)有技術(shù)的一種方法中,從睪丸(WO 99/49074)或酵母或魚(yú)精子等生物材料,通過(guò)酶促剪切DNA而生成脫氧核苷。但是,該方法有幾個(gè)缺點(diǎn),尤其是難以得到足夠數(shù)量和質(zhì)量的原料。
      2-脫氧-D-核糖的主要生產(chǎn)方法目前包括化學(xué)水解DNA。在該情況下,脫氧核糖基部分源自核糖核苷酸還原酶活性。尚未公開(kāi)從KDG合成2-脫氧-D-核糖。
      在大多數(shù)活細(xì)胞中,脫氧核糖核苷是由核苷酸代謝的“補(bǔ)救途徑”來(lái)源的。在核糖核苷酸還原酶催化下,通過(guò)將核糖基團(tuán)還原成核糖核苷二磷酸鹽或三磷酸鹽,得到脫氧核糖核苷的脫氧核糖基團(tuán)。但是,脫氧核糖基團(tuán)不被回收,而是通過(guò)下面的中心代謝反應(yīng)降解成D-甘油醛-3-磷酸和乙醛●通過(guò)能編碼胸苷磷酸化酶(deoA)、嘌呤核苷磷酸化酶(deoD)、尿苷磷酸化酶(udp)或黃苷磷酸化酶(xapA)的基因的產(chǎn)物介導(dǎo)的磷酸解作用,將脫氧核苷剪切成脫氧核糖-1-磷酸和核堿基,●通過(guò)脫氧核糖磷酸變位酶(deoB)催化的反應(yīng),將脫氧核糖-1-磷酸轉(zhuǎn)化成脫氧核糖-5-磷酸,●通過(guò)脫氧核糖-5-磷酸醛縮酶(deoC)催化的反應(yīng),將其進(jìn)一步降解成D-甘油醛-3-磷酸和乙醛。
      已經(jīng)證實(shí),deo酶也能體外催化逆向合成代謝反應(yīng)在有純化的大腸桿菌或植物乳桿菌(Lactobacillus plantarum)脫氧核糖醛縮酶存在的情況下,可以體外地從乙醛和D-甘油醛-3-磷酸得到脫氧核糖-5-磷酸(Rosen等,J.Biol.Chem.,240,(1964),1517-1524;Pricer,J.Biol.Chem.,235,(1960),1292-1298)。使用乙醛和甘油醛作為酶底物也可以得到脫氧核糖,但是產(chǎn)率非常低(Barbas,J.Am.Chem.Soc.112(1990),2013-2014)。
      專利申請(qǐng)WO 01/14566公開(kāi)了通過(guò)在一鍋反應(yīng)(one-pot reaction)中的deo操縱子的3種酶(即脫氧核糖醛縮酶、脫氧核變位酶和磷酸化酶(胸苷或嘌呤核苷磷酸化酶))的組合活性,使用甘油醛-3-磷酸、乙醛和核堿基作為起始底物,從脫氧核糖-1-磷酸酶促合成脫氧核苷。通過(guò)酶促方法,可以從果糖-1,6-二磷酸得到D-甘油醛-3-磷酸。
      專利申請(qǐng)EP 1179598公開(kāi)了磷酸化酶在從脫氧核糖-1-磷酸和核堿基開(kāi)始酶促生產(chǎn)脫氧核苷中的應(yīng)用。通過(guò)磷酸鹽沉淀,可以提高脫氧核苷合成的產(chǎn)率。
      但是,與它們的生物學(xué)功能相比,使用反向工作的deo操縱子的酶的方法表現(xiàn)出較低的產(chǎn)率,這表明它們的應(yīng)用有嚴(yán)重缺陷。
      考慮到目前使用的生產(chǎn)脫氧核苷和脫氧核苷前體的方法的上述缺點(diǎn),本發(fā)明的一個(gè)目的是,提供從便宜的市售化合物開(kāi)始生物合成生產(chǎn)脫氧核苷和脫氧核苷前體的手段和方法,無(wú)需依賴于不可靠的自然資源。
      更具體地,需要生產(chǎn)脫氧核苷和脫氧核苷前體的替代方法,其能有效地和經(jīng)濟(jì)地合成脫氧核糖核苷,從而消除現(xiàn)有技術(shù)方法的缺點(diǎn)。
      本發(fā)明涉及從2-脫氫-3-脫氧-D-葡糖酸(KDG)或它的鹽開(kāi)始生產(chǎn)2′-脫氧核苷和其前體的方法,其包括脫羧基步驟。
      更具體地,該方法可以用于生產(chǎn)作為2′-脫氧核苷前體的2-脫氧-D-核糖(DRI)以及合成上多用途的DRI的烯胺衍生物。
      通過(guò)直接反應(yīng)KDG或它的鹽,或KDG的衍生物,通常是剪切KDG的C1-C2鍵,進(jìn)行脫羧基步驟。
      在本發(fā)明的一個(gè)實(shí)施方案中,KDG或它的一種鹽經(jīng)歷(氧化)脫羧基作用,生成2-脫氧-D-核糖酸(DRN)或它的鹽,其本身被進(jìn)一步轉(zhuǎn)化成2-脫氧-D-核糖(DRI)或2-脫氧-D-核糖醇(DRL)。
      在本發(fā)明的另一個(gè)實(shí)施方案中,通過(guò)使KDG或它的鹽與胺反應(yīng),發(fā)生脫羧基作用,產(chǎn)生烯胺衍生物。通過(guò)水解,可以將該高能烯胺衍生物進(jìn)一步轉(zhuǎn)化成DRI。
      在本發(fā)明的另一個(gè)實(shí)施方案中,使用3-脫氧-D-葡糖酸(DGN)或它的鹽和/或3-脫氧-D-甘露糖酸(DMN)或它的鹽作為KDG的衍生物,進(jìn)行(氧化)脫羧基作用,生成DRI。通過(guò)還原KDG,可生產(chǎn)DGN和DMN的混合物。優(yōu)選地,通過(guò)與過(guò)氧化氫的反應(yīng),進(jìn)行脫羧基作用。
      在本發(fā)明的另一個(gè)實(shí)施方案中,對(duì)3-脫氧-D-氨基葡糖酸(DGM)或它的鹽和/或3-脫氧-D-甘露氨酸(DMM)或它的鹽進(jìn)行(氧化)脫羧基作用,生成DRI。通過(guò)還原性胺化作用,可以從KDG生產(chǎn)DGM和DMM的混合物。
      本發(fā)明的另一個(gè)方面是制備上述方法中使用的KDG或它的鹽的方便的、且成本較低的方法。該方法從D-葡糖酸(鹽)或D-氨基葡糖酸(鹽)開(kāi)始,并使用重組酶。本發(fā)明提供了一種新的能編碼具有D-葡糖酸脫水酶活性的多肽的核苷酸序列和編碼具有D-氨基葡糖酸(鹽)脫氨酶活性的多肽的核苷酸序列。
      在本發(fā)明的方法中使用的原料是下面式(I)所示的KDG或它的一種鹽,或其被保護(hù)的衍生物,其中在位置4,5和/或6處的一個(gè)或多個(gè)羥基被本領(lǐng)域已知的保護(hù)基團(tuán)所保護(hù)。
      如本文所使用的,術(shù)語(yǔ)″2′-脫氧核苷″涉及2′-脫氧核糖核苷,它是N-糖苷,且其中核堿基或核堿基類似物的堿性N-原子結(jié)合到2-脫氧-D-核糖或它的一種衍生物的異頭碳原子上。合適的核堿基的實(shí)例是腺嘌呤,胞嘧啶,鳥(niǎo)嘌呤,胸腺嘧啶,尿嘧啶,2,6-二氨基嘌呤,和次黃嘌呤。核堿基類似物的實(shí)例是5-氮雜胞嘧啶,2-氯-腺嘌呤,5-碘-胞嘧啶,8-氮雜-鳥(niǎo)嘌呤,5-碘-尿嘧啶,5-溴-尿嘧啶,5-氟-尿嘧啶,5-乙基-尿嘧啶和5-三氟甲基-尿嘧啶。
      如本文所使用的,術(shù)語(yǔ)″2′-脫氧核苷前體″涉及可以通過(guò)本領(lǐng)域已知的方法容易地轉(zhuǎn)化成2′-脫氧核苷的化合物。優(yōu)選的2′-脫氧核苷前體是2-脫氧-D-核糖(DRI)或可以轉(zhuǎn)化成2′-脫氧核苷的2-脫氧-D-核糖基團(tuán)的碳水化合物,例如,在現(xiàn)有技術(shù)中建立的那些,例如1-磷酸-2-脫氧-D-核糖,5-磷酸-2-脫氧-D-核糖,以及本發(fā)明建立的那些,例如2-脫氧-D-核糖醇,2-脫氧-D-核糖酸,2-脫氧-D-核糖-1,4-內(nèi)酯,1-N-嗎啉代-3,4,5-三羥基-戊烯-1,和它們的衍生物。
      本發(fā)明的方法包括這樣的方法,其中直接對(duì)KDG或它的鹽或者源自KDG的化合物進(jìn)行脫羧基步驟。優(yōu)選的KDG衍生物是3-脫氧-D-葡糖酸,3-脫氧-D-甘露糖酸,3-脫氧-D-氨基葡糖酸和3-脫氧-D-甘露胺酸以及它們各自的鹽。
      另外,KDG和它的鹽或它們的被保護(hù)形式(其中在位置4,5和/或6處的一個(gè)或多個(gè)羥基被本領(lǐng)域已知的用于該目的的保護(hù)基團(tuán)保護(hù))也是合適的進(jìn)行本發(fā)明脫羧基反應(yīng)的原料。除非另有說(shuō)明,在下面的說(shuō)明書(shū)中提及的KDG都包括KDG的被保護(hù)形式,如同提及KDG衍生物時(shí)也意圖包括這些衍生物的被保護(hù)形式一樣。類似地,提及在本發(fā)明的方法中得到的產(chǎn)物時(shí)均意在包括這些產(chǎn)物的被保護(hù)形式。優(yōu)選的用于本發(fā)明目的的保護(hù)基團(tuán)是這樣的,它們能以醋酸酯、苯甲酸酯、烯丙醚、苯甲基醚、三苯甲基醚、叔丁基二甲基甲硅烷基(TBDMS)醚、亞異丙基或亞芐基縮醛形式代替相應(yīng)的羥基。
      應(yīng)當(dāng)明白,根據(jù)本發(fā)明的實(shí)施方案的合適反應(yīng)條件,包含在用作反應(yīng)物或作為產(chǎn)物得到的的有機(jī)酸中的羧基可以是質(zhì)子化的形式或它們的鹽形式,或可以平衡地存在。這些酸的示例性鹽是這樣的,其具有金屬或銨離子作為抗衡離子,尤其是堿金屬離子,例如鈉和/或鉀。
      大多數(shù)本發(fā)明所述的碳水化合物和它們的衍生物以幾種環(huán)狀形式存在,但是出于簡(jiǎn)化的原因,已經(jīng)將它們表示為開(kāi)鏈?zhǔn)?。?yīng)當(dāng)明白,本發(fā)明包括所有這樣的同分異構(gòu)的或互變異構(gòu)的形式。
      在本發(fā)明的第一個(gè)實(shí)施方案中,使KDG或它的鹽與過(guò)氧化氫反應(yīng),并經(jīng)歷向式(II)化合物2-脫氧-D-核糖酸(DRN)或它的鹽的(氧化)脫羧基作用。
      可以進(jìn)一步將該產(chǎn)物轉(zhuǎn)化成式(IV)代表的2-脫氧-D-核糖醇(DRL) 或式(III)代表的2-脫氧-D-核糖(DRI),
      DRN、DRL、尤其是DRI均是優(yōu)選的用于本發(fā)明目的的2′-脫氧核苷前體??梢灾苯拥鼗蛲ㄟ^(guò)作為中間體的DRL,進(jìn)行DRN向DRI的轉(zhuǎn)化。
      優(yōu)選地,如實(shí)施例5所述,通過(guò)2-脫氫-3-脫氧-D-葡糖酸鈉或鉀的水溶液與過(guò)氧化氫在室溫下的氧化脫羧基作用,進(jìn)行DRN的制備。通過(guò)2-酮醛糖酸的氧化脫羧基作用制備醛糖酸的一般方法,記載在專利EP 1 038 860 A1中。
      優(yōu)選地,如實(shí)施例6所述,在80巴的壓力下,在130℃的溫度下,在碳上的銠催化劑作用下,通過(guò)2-脫氧-D-核糖內(nèi)酯水溶液的氫化,進(jìn)行DRL的制備。通過(guò)將2-脫氧-D-核糖酸鹽(DRN鹽)轉(zhuǎn)化成2-脫氧-D-核糖酸(其與水溶液中的內(nèi)酯形式處于平衡),可以容易地制備出2-脫氧-D-核糖內(nèi)酯(Han,Tetrahedron.1993.49,349-362;Han,Tetrahedron Asymmetry.1994.5,2535-62)。
      優(yōu)選地,通過(guò)2-脫氧-D-核糖醇(DLR)的氧化,例如利用吡啶中的氧化鉻,進(jìn)行2-脫氧-D-核糖(DRI)的制備。
      在本發(fā)明的另一個(gè)實(shí)施方案中,通過(guò)使(KDG)或它的鹽與含氨基的試劑Y-H反應(yīng),發(fā)生脫羧基作用,生成式(V)化合物。
      或它的相應(yīng)反式異構(gòu)體或其受保護(hù)形式,作為2′-脫氧核苷前體。Y-H代表著胺,它含有結(jié)合到氨基的氮上的氫原子H。
      在本發(fā)明的一個(gè)優(yōu)選的實(shí)施方案中,由Y-H代表的含氨基的試劑是線性的或環(huán)狀的仲胺;具有β-羰基的伯胺,優(yōu)選3-氨基-2-吲哚酮(indolinone),發(fā)現(xiàn)其能有效地實(shí)現(xiàn)α-酮酸的脫羧基作用(Hanson,J.Chem.Education,1987,591-595)。在每種情況下,式(V)中的-Y代表著源自這些含氨基的試劑的相應(yīng)含氮?dú)埢?br> 優(yōu)選地,式(V)化合物代表著通過(guò)以線性的或環(huán)狀的仲胺作為Y-H的反應(yīng)生成的烯胺。
      優(yōu)選的環(huán)狀仲胺是嗎啉,吡咯烷,哌啶,或N-甲基哌嗪;優(yōu)選的非環(huán)狀胺是式R1-NH-R2的那些,其中R1和R2獨(dú)立地代表1-8個(gè)、優(yōu)選1-4個(gè)碳原子的線性或分支烷基。特別優(yōu)選地,二乙基胺作為非環(huán)狀胺。
      特別優(yōu)選地,嗎啉作為環(huán)狀胺。
      式(V)化合物或它的反式異構(gòu)體或其被保護(hù)形式可以進(jìn)一步與Z-H反應(yīng),其中H代表著氫原子,且Z代表著離去基團(tuán),以生成式(VI)化合物 或它的對(duì)應(yīng)反式異構(gòu)體或其被保護(hù)形式,作為2′-脫氧核苷前體。Z-H優(yōu)選地是水,在該情況下,式(VI)化合物是DRI或其被保護(hù)形式(酮-烯醇-互變異構(gòu)現(xiàn)象)。
      優(yōu)選地,使用如實(shí)施例7所述的方法,在回流下,通過(guò)使苯中的KDG與胺(例如嗎啉)反應(yīng),制備式(V)化合物,生成1-N-嗎啉代-3,4,5-三羥基-戊烯-1。酸催化的用水水解生成2-脫氧-D-核糖(DRI)。
      Stamos(Tetrahedron Lett.23(1982),459-462)描述了從攜帶β-氫的α-氧代羧酸通過(guò)烯胺生成醛的一般途徑。制備和水解烯胺的其它方法已經(jīng)記載在其它地方(Stork,J.Am.Chem.Soc.85(1963),207-222;Stamhuis,J.Org.Chem.30(1965),2156-2160)。
      在本發(fā)明的另一個(gè)實(shí)施方案中,將KDG或它的鹽轉(zhuǎn)化成式(VII)代表的3-脫氧-D-葡糖酸(DGN)和/或3-脫氧-D-甘露糖酸(DMN)或這些化合物的鹽 使從該反應(yīng)得到的產(chǎn)物經(jīng)歷(氧化性)脫羧基作用,優(yōu)選地使用過(guò)氧化氫,生成DRI。通過(guò)還原,從KDG或它的鹽生產(chǎn)出DGN和DMN或它們的鹽的混合物。
      優(yōu)選地,使用Weissbach(J.Biol.Chem.234(1959),705-709)中針對(duì)2-酮-3-脫氧庚酸所述的方法,通過(guò)在室溫用硼氫化鈉非立體選擇性地還原在水中的2-脫氫-3-脫氧-D-葡糖酸,隨后如例如美國(guó)專利3,312,683;Richards J.Chem.Soc.(1954),3638-3640;SowdenJ.Am.Chem.Soc.76(1954),3541-3542所述,用過(guò)氧化氫對(duì)3-脫氧-D-葡糖酸鹽(酯)和3-脫氧-D-甘露糖酸鹽(酯)(mannonate)進(jìn)行氧化脫羧基作用,制備2-脫氧-D-核糖(DRI)。
      在另一個(gè)優(yōu)選的實(shí)施方案中,在6巴的壓力下,在室溫,用6%mol阮內(nèi)鎳催化劑或氧化鉑氫化水溶液中的2-脫氫-3-脫氧-D-葡糖酸鹽(酯),制備出DGN和DMN的混合物。
      在本發(fā)明的另一個(gè)實(shí)施方案中,將KDG或它的鹽轉(zhuǎn)化成式(VIII)代表的3-脫氧-D-氨基葡糖酸(DGM)或3-脫氧-D-甘露糖胺酸(DMM)或這些化合物的鹽 使由該反應(yīng)得到的產(chǎn)物經(jīng)歷(氧化性)脫羧基作用,優(yōu)選地使用茚三酮,生成DRI。通過(guò)還原性胺化作用,從KDG或它的鹽生產(chǎn)DGM和DMM或它們的鹽的混合物。
      優(yōu)選地,通過(guò)在室溫用氨和氰基硼氫化鈉非立體選擇性地還原性胺化在水溶液中的2-脫氫-3-脫氧-D-葡糖酸鈉或鉀,隨后使用Shelton(J.Am.Chem.Soc.118(1996),2117-2125;和Borch,J.Am.Chem.Soc.93(1971),2897;Durrwachter,J.Am.Chem.Soc.108(1986),7812referenced therein)中針對(duì)2-脫氧-D-阿洛糖的合成所述的方法,用茚三酮對(duì)3-脫氧-D-2-氨基葡糖酸(鹽)和3-脫氧-D-2-甘露糖胺酸(鹽)進(jìn)行氧化脫羧基作用,制備2-脫氧-D-核糖。
      另外,本發(fā)明提供了一種生產(chǎn)式(III)化合物(2-脫氧-D-核糖)的方法,這是通過(guò)在單個(gè)步驟中,轉(zhuǎn)化式(I)化合物或它的一種鹽(KDG)而實(shí)現(xiàn)的。優(yōu)選地,該轉(zhuǎn)化是通過(guò)酶促催化作用實(shí)現(xiàn)的。該轉(zhuǎn)化優(yōu)選地由酮酸脫羧酶催化。優(yōu)選的酮酸脫羧酶是硫胺素焦磷酸(TPP)依賴性的酮酸脫羧酶。TPP依賴性的酮酸脫羧酶的實(shí)例是丙酮酸脫羧酶(EC4.1.1.1),苯甲?;姿崦擊让?EC 4.1.1.7),吲哚丙酮酸脫羧酶(EC4.1.1.74),膦酰基丙酮酸脫羧酶,磺基丙酮酸脫羧酶(EC 4.1.1.79),草酰-輔酶A脫羧酶(EC 4.1.1.8),氧代戊二酸脫羧酶(EC 4.1.1.71)或苯基丙酮酸脫羧酶(EC 4.1.1.43)。已經(jīng)證實(shí),來(lái)自不同生物的酮酸脫羧酶(例如,丙酮酸脫羧酶)可以將KDG轉(zhuǎn)化成2-脫氧--D-核糖(見(jiàn)實(shí)施例8-12)。原則上,在本發(fā)明中可以使用任何酮酸脫羧酶。
      在根據(jù)本發(fā)明的方法的優(yōu)選的實(shí)施方案中,使用具有丙酮酸脫羧酶活性的酶,將KDG轉(zhuǎn)化成2-脫氧-D-核糖。
      丙酮酸脫羧酶能催化下面的反應(yīng)
      已經(jīng)表征了幾種丙酮酸脫羧酶(PDC)和對(duì)應(yīng)的pdc基因,例如來(lái)自運(yùn)動(dòng)發(fā)酵單胞菌(Zymomonas mobilis)的PDC(Genbank登記號(hào)AAD19711;Neale等,J.Bacteriol.1987,1691024-1028),來(lái)自釀酒酵母(Saccharomyces cerevisiae)的PDC(Genbank登記號(hào)NP013145;Candy等,J.Gen.Microbiol.1991,1372811-2815),來(lái)自巴氏醋桿菌(Acetobacter pasteurianus)的PDC(Genbank登記號(hào)AAM21208;Raj等,Arch.Microbiol.2001,176443-451),來(lái)自棕櫚發(fā)酵細(xì)菌(Zymobacter palmae)的PDC(Genbank登記號(hào)AAM49566;Raj等,Appl.Environ.Microbiol.2002,682869-2876),來(lái)自胃八疊球菌(Sarcina ventriculi)的PDC(Genbank登記號(hào)AAL18557;Lowe等,J.Gen.Microbiol.1992,138803-807)。許多其它的丙酮酸脫羧酶好像也存在于植物、真菌和細(xì)菌中,如在這些生物中存在與已確立的pdc基因享有序列同源性的基因所證實(shí)的。這些推定的丙酮酸脫羧酶的實(shí)例是來(lái)自植物的PDC擬南芥(Arabidopsis thaliana)(Genbank登記號(hào)T48155)稗草(Echinochloa crus-gall)(Genbank登記號(hào)AAM18119)水稻(Oryza sativa)(Genbank登記號(hào)NP922014)米根霉(Rhizopus oryzae)(Genbank登記號(hào)AAM73540)百脈根(Lotus corniculatus)(Genbank登記號(hào)AAO72533)玉米(Zea mays)(Genbank登記號(hào)BAA03354)豌豆(Pisum sativum)(Genbank登記號(hào)CAA91445)青豆(Garden pea)(Genbank登記號(hào)S65470)煙草(Nicotiana tabaccum)(Genbank登記號(hào)CAA57447)馬鈴薯(Solanum tuberosum)(Genbank登記號(hào)BAC23043)草莓(Fragaria ananassa)(Genbank登記號(hào)AAL37492)香瓜(Cucumis melo)(Genbank登記號(hào)AAL33553)葡萄(Vitis vinifera)(Genbank登記號(hào)AAG22488)來(lái)自真菌的PDC甘蔗(Saccharum officinarum)(Genbank登記號(hào)CAB61763)米曲霉(Aspergillus orizae)(Genbank登記號(hào)AAD16178)寄生曲霉(Aspergillus parasiticus)(Genbank登記號(hào)P51844)釀酒酵母(Saccharomyces cerevisiae)(Genbank登記號(hào)NP013145)金針菇(Flammulina velutipes)(Genbank登記號(hào)AAR00231)
      Saccharomyces kluyveri(Genbank登記號(hào)AAP75899)粟酒裂殖酵母(Schizosaccharomyces pombe)(Genbank登記號(hào)CAB75873)光滑假絲酵母(Candida glabrata)(Genbank登記號(hào)AAN77243)粗糙鏈孢霉(Neurospora crassa)(Genbank登記號(hào)JN0782)Pichia stipis(Genbank登記號(hào)AAC03164)乳酸克魯維酵母(Kuyveromyces lactis)(Genbank登記號(hào)CAA61155)Emericella nidulans(Genbank登記號(hào)AAB63012)來(lái)自原核生物的PDC牛分枝桿菌(Mycobacterium bovis)(Genbank登記號(hào)CAD93738)麻風(fēng)分枝桿菌(Mycobacterium leprae)(Genbank登記號(hào)CAC31122)結(jié)核分枝桿菌(Mycobacterium tuberculosis)(Genbank登記號(hào)NP215368)穿透枝原體(Mycoplasma penetrans)(Genbank登記號(hào)NP758077)丙酮丁醇梭菌(Clostridium acetobutylicum)(Genbank登記號(hào)NP149189)巴氏醋桿菌(Acetobacter pasteurianus)(Genbank登記號(hào)AAM21208)棕櫚發(fā)酵細(xì)菌(Zymobacter palmae)(Genbank登記號(hào)AAM49566)運(yùn)動(dòng)發(fā)酵單胞菌(Zymomonas mobilis)(Genbank登記號(hào)AAD19711)胃八疊球菌(Sarcina ventriculi)(Genbank登記號(hào)AAL18557)點(diǎn)型念珠藍(lán)細(xì)菌(Nostoc punctiforme)(Genbank登記號(hào)ZP00110850)可以通過(guò)過(guò)表達(dá)對(duì)應(yīng)基因的重組微生物容易地生成這樣的酶。編碼TPP依賴性的酮酸脫羧酶的基因的實(shí)例是來(lái)自運(yùn)動(dòng)發(fā)酵單胞菌的pdc(Genbank登記號(hào)AF124349),來(lái)自釀酒酵母的pdc(Genbank登記號(hào)NC001144),來(lái)自巴氏醋桿菌的pdc(Genbank登記號(hào)AF368435),來(lái)自Zymobacter palmae的pdc(Genbank登記號(hào)AF474145),來(lái)自胃八疊球菌的pdc(Genbank登記號(hào)AF354297)。在Genbank中可以發(fā)現(xiàn)與上列推定的丙酮酸脫羧酶對(duì)應(yīng)的其它pdc基因。
      在一個(gè)優(yōu)選的實(shí)施方案中,丙酮酸脫羧酶是真核生物源的,更優(yōu)選地,它來(lái)自酵母,且最優(yōu)選地,它來(lái)自釀酒酵母。
      在一個(gè)特別優(yōu)選的實(shí)施方案中,丙酮酸脫羧酶來(lái)自釀酒酵母的丙酮酸脫羧酶,其具有如SEQ ID NO21所示的氨基酸序列(也見(jiàn)GenBank登記號(hào)NP013145)。
      在另一個(gè)優(yōu)選的實(shí)施方案中,丙酮酸脫羧酶是原核生物源的,更優(yōu)選來(lái)自發(fā)酵單胞菌屬的生物,最優(yōu)選來(lái)自運(yùn)動(dòng)發(fā)酵單胞菌。在一個(gè)特別優(yōu)選的實(shí)施方案中,丙酮酸脫羧酶來(lái)自運(yùn)動(dòng)發(fā)酵單胞菌的丙酮酸脫羧酶,其具有如SEQ ID NO19所示的氨基酸序列(也見(jiàn)GenBank登記號(hào)AAD 19711)。
      在另一個(gè)優(yōu)選的實(shí)施方案中,所述原核生物的丙酮酸脫羧酶來(lái)自醋桿菌屬的生物,更優(yōu)選來(lái)自巴氏醋桿菌。特別優(yōu)選的丙酮酸脫羧酶是具有如SEQ ID NO25所示氨基酸序列的巴氏醋桿菌酶(也見(jiàn)GenBank登記號(hào)AAM21208)。
      在另一個(gè)優(yōu)選的實(shí)施方案中,丙酮酸鹽脫羧酶來(lái)自發(fā)酵單胞菌屬的生物,更優(yōu)選來(lái)自棕櫚發(fā)酵細(xì)菌(Zymobacter palmae)。
      特別優(yōu)選的是具有如SEQ ID NO29所示氨基酸序列的來(lái)自zlv棕櫚發(fā)酵細(xì)菌的丙酮酸脫羧酶(也見(jiàn)GenBank登記號(hào)AAM49566)。
      在另一個(gè)優(yōu)選的根據(jù)本發(fā)明方法的實(shí)施方案中,使用具有苯甲?;姿崦擊让富钚缘拿笇DG轉(zhuǎn)化成2-脫氧-D-核糖。
      苯甲?;姿崦擊让复呋旅娴姆磻?yīng)
      已經(jīng)表征了來(lái)自惡臭假單胞菌的苯甲?;姿崦擊让?BDC)(Genbank登記號(hào)AAC15502;Tsou等,Biochemistry.1990,299856-9862)以及對(duì)應(yīng)的基因mdlC(Genbank登記號(hào)AY143338)。已經(jīng)證實(shí),該酶能將2-酮-4,5-二羥基戊酸的D和L異構(gòu)體轉(zhuǎn)化成各自的3,4-二羥基丁醛異構(gòu)體(Niu等,J.Am.Chem.Soc.125(2003),12998-12999)。許多其它的苯甲?;姿崦擊让负孟褚泊嬖谟诩?xì)菌和古細(xì)菌中,如這些生物中存在與編碼確立的BDC的基因享有序列同源性的基因所證實(shí)的。這樣推定的苯甲?;姿崦擊让傅膶?shí)例是來(lái)自細(xì)菌的BDC銅綠假單胞菌(Pseudomonas aeruginosa)(Genbank登記號(hào)NP253588)血色紅假單胞菌(Rhodopseudomonas palustris)(Genbank登記號(hào)NP_946955)天藍(lán)色鏈霉菌(Streptomyces coelicolor)(Genbank登記號(hào)NP_631486)青色素桿菌(Chromobacterium violaceum)(Genbank登記號(hào)NP_902771)大豆慢生根瘤菌(Bradyrhizobium japonicum)(Genbank登記號(hào)NP_774243)來(lái)自古細(xì)菌的BDC硫磺礦硫化葉菌(Sulfolobus solfataricus)(Genbank登記號(hào)NP_343070)嗜酸熱原體(Thermoplasma acidophilum)(Genbank登記號(hào)NP_393976)火山熱原體(Thermoplasma volcanium)(Genbank登記號(hào)NP_111716)可以由過(guò)表達(dá)對(duì)應(yīng)的bdc基因的重組微生物容易地生成這樣的酶。在與上列推定的苯甲?;姿崦擊让笇?duì)應(yīng)的Genbank中,可以發(fā)現(xiàn)這樣的基因。
      可以在根據(jù)本發(fā)明的方法中使用的硫胺依賴性脫羧酶的另一個(gè)實(shí)例是膦?;崦擊让浮R呀?jīng)表征了幾種膦?;崦擊让?PPD)以及對(duì)應(yīng)的基因,例如來(lái)自脆弱擬桿菌(Bacteroides fragilis)的PPD(Genbank登記號(hào)AAG26466;Zhang等,J.Biol.Chem.2003,27841302-41308),來(lái)自威德摩爾鏈球菌(Streptomyces wedmorensis)的PPD(Genbank登記號(hào)BAA32496;Nakashita等,J.Antibiot.1997,50212-219)。許多其它的膦酰基丙酮酸脫羧酶好像也存在于細(xì)菌中,如在這些生物中存在與編碼確立的PPD的基因享有序列同源性的基因所證實(shí)的。這樣推定的膦酰基丙酮酸脫羧酶的實(shí)例是來(lái)自多形擬桿菌(Bacteroides thetaiotaomicron)的PPD(Genbank登記號(hào)NP 810632),來(lái)自東方擬無(wú)枝酸菌(Amycolatopsis orientais)的PPD(Genbank登記號(hào)CAB45023),來(lái)自破傷風(fēng)梭菌(Clostridium tetani)E88的PPD(Genbank登記號(hào)NP_782297),來(lái)自綠色產(chǎn)色鏈霉菌(Streptomycesviridochromogene)的PPD(Genbank登記號(hào)CAA74722),來(lái)自吸水鏈霉菌(Streptomyces hygroscopicus)的PPD(Genbank登記號(hào)BAA07055),來(lái)自天藍(lán)色鏈霉菌A3的PPD(Genbank登記號(hào)NP733715),來(lái)自利尿鏈霉菌(Streptomyces rishiriensis)的PPD(Genbank登記號(hào)AAG29796),來(lái)自百日咳桿菌(Bordetella pertussis)的PPD(Genbank登記號(hào)CAE 41214)。可以由過(guò)表達(dá)對(duì)應(yīng)基因的重組微生物容易地生成這樣的酶。
      可以在根據(jù)本發(fā)明的方法中使用的硫胺素依賴性脫羧酶的另一個(gè)實(shí)例是磺基丙酮酸脫羧酶。已經(jīng)表征了由2個(gè)亞基ComD(Genbank登記號(hào)P58415)和ComE(Genbank登記號(hào)P58416)組成的來(lái)自詹氏甲烷球菌(Methanococcus jannaschii)的磺基丙酮酸脫羧酶(SPD)(Graupner等,J.Bacteriol.2000.1824862-4867)以及對(duì)應(yīng)的基因。許多其它的磺基丙酮酸脫羧酶好像也存在于古細(xì)菌和細(xì)菌中,如這些生物中存在與編碼確立的SPD的基因享有序列同源性的基因所證實(shí)的。
      可以在根據(jù)本發(fā)明的方法中使用的硫胺素依賴性脫羧酶的另一個(gè)實(shí)例是吲哚丙酮酸脫羧酶。已經(jīng)表征了幾種吲哚丙酮酸脫羧酶(IPD)以及對(duì)應(yīng)的基因,例如來(lái)自陰溝腸桿菌(Enterobacter cloacae)的IPD(Genbank登記號(hào)BAA14242;Scutz等,2003,Eur.J.Biochem.2702322-2331),來(lái)自巴西固氮螺菌(Azospirillum brasilense)的IPD(Genbank登記號(hào)AAC36886;Costacurta等,Mol.Gen.Genet.1994,243463-472),來(lái)自草生歐文氏菌(Erwinia herbicola)的IPD(Genbank登記號(hào)AAB06571;Brandi等,Appl.Environ.Microbioi.1996,624121-4128)。許多其它的吲哚丙酮酸脫羧酶好像也存在于細(xì)菌中,如這些生物中存在與編碼確立的IPD的基因享有序列同源性的基因所證實(shí)的。
      可以在根據(jù)本發(fā)明的方法中使用的硫胺素依賴性脫羧酶的另一個(gè)實(shí)例是苯基丙酮酸脫羧酶。已經(jīng)表征了來(lái)自酵母的苯基丙酮酸脫羧酶(Genbank登記號(hào)NP010668;Vuralhan等,Appl.Environ.Microbiol.2003,694534-41)以及對(duì)應(yīng)的基因ARO10(Genbank登記號(hào)NC001136)。
      在根據(jù)本發(fā)明的方法的優(yōu)選實(shí)施方案中,通過(guò)酶促反應(yīng)實(shí)現(xiàn)脫羧基步驟,通過(guò)加酸,將pH值調(diào)節(jié)至pH5至pH9,優(yōu)選pH6至pH8。原則上,所有合適的酸都可以用于該目的。優(yōu)選的酸是HCl,H2SO4,D-葡糖酸或2-脫氫-3-脫氧-D-葡糖酸。
      本發(fā)明的另一個(gè)方面是通過(guò)重組酶的應(yīng)用,從D-葡糖酸(GCN)或D-氨基葡糖酸制備KDG的方便的、且成本低廉的方法。
      在本發(fā)明的方法的優(yōu)選的實(shí)施方案中,在一個(gè)初步步驟中,通過(guò)D-葡糖酸脫水酶活性的應(yīng)用,從D-葡糖酸鹽生產(chǎn)式(I)化合物。優(yōu)選的鹽是D-葡糖酸鉀或鈉。優(yōu)選地,該D-葡糖酸脫水酶由包含選自下述的核苷酸序列的多核苷酸編碼(a)編碼包含SEQ ID NO2所示氨基酸序列的多肽的核苷酸序列;(b)包含SEQ ID NO1所示編碼序列的核苷酸序列;(c)核苷酸序列編碼由(a)或(b)所示核苷酸序列編碼的片段的核苷酸序列;(d)與(a)至(c)中任一項(xiàng)的核苷酸序列雜交的核苷酸序列;和(e)由于遺傳密碼的簡(jiǎn)并性而不同于(d)所示核苷酸序列的核苷酸序列。
      根據(jù)下面的反應(yīng),使用D-葡糖酸脫水酶進(jìn)行KDG或它的鹽的酶促合成通過(guò)消除一分子水,將D-葡糖酸轉(zhuǎn)化成KDG。已經(jīng)在不同的細(xì)菌物種中表征了D-葡糖酸脫水酶的活性,例如在產(chǎn)堿桿菌屬(Kersters,Methods in Enzymology 42(1975),301-304);巴氏固氮梭菌,(Gottschalk,Methods in Enzymology 90(1982),283-287);嗜酸熱原體(Budgen,F(xiàn)EBS Letters 196(1986),207-210)和硫磺礦硫化葉菌(Nicolaus,Biotechnology Letters 8(7)(1986),497-500)。通過(guò)篩選幾種收集菌的D-葡糖酸脫水酶活性,鑒別出了優(yōu)選的D-葡糖酸脫水酶。從根癌土壤桿菌菌株C58的基因組文庫(kù)中選擇出了編碼D-葡糖酸脫水酶的基因,被命名為gcnD,將其進(jìn)一步插入優(yōu)化表達(dá)的多拷貝載體中。已經(jīng)證實(shí),來(lái)自過(guò)表達(dá)gcnD基因的大腸桿菌細(xì)胞的粗提物會(huì)催化D-葡糖酸完全轉(zhuǎn)化成KDG(見(jiàn)實(shí)施例2)。
      在本發(fā)明的方法的另一個(gè)優(yōu)選的實(shí)施方案中,通過(guò)D-氨基葡糖酸脫氨酶活性的應(yīng)用,在初步步驟中從D-氨基葡糖酸生產(chǎn)式(I)化合物。優(yōu)選地,D-氨基葡糖酸脫氨酶由包含選自下述的核苷酸序列的多核苷酸編碼(f)編碼包含SEQ ID NO4所示氨基酸序列的多肽的核苷酸序列;(g)包含SEQ ID NO3所示編碼序列的核苷酸序列;(h)編碼由(a)或(b)所示核苷酸序列編碼的片段的核苷酸序列;(i)與(a)至(c)中任一項(xiàng)的核苷酸序列雜交的核苷酸序列;和(j)由于遺傳密碼的簡(jiǎn)并性而不同于(d)所示核苷酸序列的核苷酸序列。
      根據(jù)下面的反應(yīng),使用D-氨基葡糖酸脫氨酶進(jìn)行KDG或它的鹽的酶促合成通過(guò)消除一分子水和一分子氨,將D-氨基葡糖酸轉(zhuǎn)化成KDG。已經(jīng)在不同的細(xì)菌種中表征了D-氨基葡糖酸脫氨酶的活性,例如在熒光假單胞菌(Pseudomonas fluorescens)(Iwamoto,Agric.Biol.Chem.53(1989),2563-2569)、放射形土壤桿菌(Agrobacterium radiobacter)(Iwamoto,F(xiàn)EBS Letters 104(1979),131-134;Iwamoto,J.Biochem.91(1982),283-289)中,且證實(shí)了它需要Mn2+離子(Iwamoto,Biosci.Biotech.Biochem.59(1995),408-411)。
      通過(guò)篩選幾種收集菌的D-氨基葡糖酸脫氨酶活性,鑒別出了優(yōu)選的D-氨基葡糖酸脫氨酶。通過(guò)克隆推定為D-絲氨酸脫氨酶的基因,從根癌土壤桿菌菌株C58分離出了編碼D-氨基葡糖酸脫氨酶的命名為gmaA的基因。將gmaA基因進(jìn)一步插入優(yōu)化表達(dá)的多拷貝載體中。已經(jīng)證實(shí),來(lái)自過(guò)表達(dá)gmaA基因的大腸桿菌細(xì)胞的粗提物會(huì)催化D-氨基葡糖酸向KDG的轉(zhuǎn)化(見(jiàn)實(shí)施例4)。
      在優(yōu)選的實(shí)施方案中,本發(fā)明涉及通過(guò)酶促反應(yīng),從D-葡糖酸或D-氨基葡糖酸開(kāi)始生產(chǎn)式III化合物、尤其是2-脫氧-D-核糖的方法,在該方法中,在第一步中,如上所述將D-葡糖酸或D-氨基葡糖酸轉(zhuǎn)化成KDG,在第二步中,如上所述將KDG轉(zhuǎn)化成2-脫氧-D-核糖。
      因而,通過(guò)D-葡糖酸脫水酶的應(yīng)用,可以實(shí)現(xiàn)D-葡糖酸向KDG的酶促轉(zhuǎn)化。通過(guò)D-氨基葡糖酸脫氨酶的應(yīng)用,可以實(shí)現(xiàn)D-氨基葡糖酸向KDG的酶促轉(zhuǎn)化。關(guān)于優(yōu)選的實(shí)施方案,上面所述同樣適用。通過(guò)酮酸脫羧酶的應(yīng)用,可以實(shí)現(xiàn)得到的KDG向2-脫氧-D-核糖的酶促轉(zhuǎn)化。關(guān)于優(yōu)選的實(shí)施方案,上面所述同樣適用。
      使用表達(dá)對(duì)應(yīng)酶的細(xì)胞的細(xì)胞提取物,或者使用純化的或部分純化的酶,可以體外進(jìn)行酶促二步方法,將D-葡糖酸或D-氨基葡糖酸經(jīng)過(guò)KDG轉(zhuǎn)化成2-脫氧-D-核糖。所述酶可以是在生物中自然表達(dá)的酶,或者可以重組地生產(chǎn)它們。制備和分離對(duì)應(yīng)的(重組的)酶的方法是本領(lǐng)域的技術(shù)人員眾所周知的。
      在優(yōu)選的實(shí)施方案中,體內(nèi)進(jìn)行將D-葡糖酸或D-氨基葡糖酸經(jīng)過(guò)KDG轉(zhuǎn)化成2-脫氧-D-核糖的酶促二步方法,即使用合適的能表達(dá)所需酶活性的生物體。該生物體可以是任意種類的生物,優(yōu)選地,它是細(xì)胞,例如植物、動(dòng)物、真菌細(xì)胞或細(xì)菌細(xì)胞。最優(yōu)選地,使用真菌或細(xì)菌細(xì)胞。優(yōu)選的真菌是酵母,例如釀酒酵母;優(yōu)選的細(xì)菌細(xì)胞是例如大腸桿菌,運(yùn)動(dòng)發(fā)酵單胞菌,棕櫚發(fā)酵細(xì)菌,巴氏醋桿菌,醋酸鈣不動(dòng)桿菌,根癌土壤桿菌和枯草芽孢桿菌。所述生物體可以是已經(jīng)內(nèi)源地表達(dá)所述酶促活性之一的生物,所述的酶促活性即生產(chǎn)KDG的D-葡糖酸脫水酶或D-氨基葡糖酸脫氨酶,或者將KDG轉(zhuǎn)化成2-脫氧-D-核糖的酮酸脫羧酶,并且其中由于編碼對(duì)應(yīng)酶的對(duì)應(yīng)外源核酸分子的導(dǎo)入而表達(dá)了各自的其它酶促活性?;蛘?,該生物體也可以是不能自然地表達(dá)將D-葡糖酸或D-氨基葡糖酸轉(zhuǎn)化成KDG、并進(jìn)一步轉(zhuǎn)化成2-脫氧-D-核糖所需要的酶活性的生物,其中已經(jīng)導(dǎo)入了分別編碼D-葡糖酸脫水酶或D-氨基葡糖酸脫氨酶和酮酸脫羧酶的對(duì)應(yīng)外來(lái)核酸分子。
      在一個(gè)特別優(yōu)選的實(shí)施方案中,該生物體是不能表達(dá)KDG激酶(kdgK)活性的生物。這樣的酶活性會(huì)導(dǎo)致KDG向KDPG的磷酸化,后者繼而被醛縮酶剪切成丙酮酸和甘油醛-磷酸,由此使KDG轉(zhuǎn)向不同的不需要的代謝途徑。在根據(jù)本發(fā)明的方法中,可以使用不能自然地表達(dá)kdgK基因的生物體。如果使用的生物體自然表達(dá)kdgK,本領(lǐng)域的技術(shù)人員熟知生產(chǎn)這種生物體的突變體或變體(其中對(duì)應(yīng)的kdgK基因被滅活)的方法和方式。
      如果使用表達(dá)用于將D-葡糖酸轉(zhuǎn)化成KDG的D-葡糖酸脫水酶和用于將KDG轉(zhuǎn)化成2-脫氧-D-核糖的酮酸脫羧酶的生物體體內(nèi)進(jìn)行所述的根據(jù)本發(fā)明的方法,這具有一個(gè)優(yōu)點(diǎn),即可以提供D-葡糖酸作為用于培養(yǎng)生物體的培養(yǎng)基中的底物。該生物體會(huì)吸收D-葡糖酸,并轉(zhuǎn)化成2-脫氧-D-核糖。
      在另一個(gè)特別優(yōu)選的實(shí)施方案中,該生物體是不表達(dá)KDG醛縮酶(由大腸桿菌中的eda基因編碼)活性的生物體。這樣的酶活性會(huì)導(dǎo)致KDG被剪切成丙酮酸和甘油醛,由此使KDG轉(zhuǎn)向不同的、并非所需要的代謝途徑。在根據(jù)本發(fā)明的方法中,可以使用不自然地表達(dá)eda基因的生物體。如果使用的生物體表達(dá)eda基因,本領(lǐng)域的技術(shù)人員熟知生產(chǎn)這種生物體的突變體或變體(其中對(duì)應(yīng)的eda基因被滅活)的方式和方法。
      在另一個(gè)特別優(yōu)選的實(shí)施方案中,該生物體是不表達(dá)2-脫氧-D-核糖醛縮酶(由大腸桿菌中的deoC基因編碼)活性的生物體。這樣的酶活性會(huì)導(dǎo)致2-脫氧-D-核糖被剪切成乙醛和甘油醛,由此使2-脫氧-D-核糖轉(zhuǎn)向不同的、并非所需要的代謝途徑。在根據(jù)本發(fā)明的方法中,可以使用不自然地表達(dá)deoC基因的生物體。如果使用的生物體表達(dá)deoC基因,本領(lǐng)域的技術(shù)人員熟知生產(chǎn)這種生物體的突變體或變體(其中對(duì)應(yīng)的deoC基因被滅活)的方式和方法。例如,已經(jīng)報(bào)道了大腸桿菌的deoC突變體(Valentin-Hansen,EMBO J.1(1982),317-322)以及缺失大腸桿菌中的deo操縱子的方法(Kaminski,J.Biol.Chem.277(2002),14400-14407;Valentin-Hansen,Molec.Gen.基因t.159(1978),191-202)。
      本發(fā)明也涉及由于D-葡糖酸脫水酶的表達(dá)而能將D-葡糖酸酶促地轉(zhuǎn)化成KDG和/或由于D-氨基葡糖酸脫氨酶的表達(dá)而能將D-氨基葡糖酸酶促地轉(zhuǎn)化成KDG、并且另外能通過(guò)酮酸脫羧酶催化的脫羧基反應(yīng)而將KDG酶促地轉(zhuǎn)化成2-脫氧-D-核糖的生物體。該生物體原則上可以是任意合適的生物體,優(yōu)選地,它是細(xì)胞,例如植物細(xì)胞、動(dòng)物細(xì)胞、真菌細(xì)胞或細(xì)菌細(xì)胞。更優(yōu)選地,它是真菌或細(xì)菌細(xì)胞。優(yōu)選的真菌是酵母,例如釀酒酵母。優(yōu)選的細(xì)菌是大腸桿菌,運(yùn)動(dòng)發(fā)酵單胞菌,棕櫚發(fā)酵細(xì)菌,巴氏醋桿菌,醋酸鈣不動(dòng)桿菌(Acinetobactercalcoaceticus),根癌土壤桿菌(Agrobacterium tumefaciens)和枯草芽孢桿菌。一方面,所述生物體是已經(jīng)內(nèi)源地表達(dá)D-葡糖酸脫水酶或D-氨基葡糖酸脫氨酶的生物體,其中已經(jīng)導(dǎo)入了編碼酮酸脫羧酶的外來(lái)核酸分子,所述的酮酸脫羧酶能催化KDG向2-脫氧-D-核糖的脫羧基作用。關(guān)于優(yōu)選的酮酸脫羧酶的實(shí)施方案,前面所述同樣適用。
      另一方面,所述生物體是已經(jīng)表達(dá)能通過(guò)脫羧基反應(yīng)而將KDG轉(zhuǎn)化成2-脫氧-D-核糖的酮酸脫羧酶的生物體,但是其不會(huì)自然地表達(dá)D-葡糖酸鹽脫水酶或D-氨基葡糖酸脫氨酶,其中已經(jīng)導(dǎo)入了編碼D-葡糖酸脫水酶和/或編碼D-葡糖胺脫氨酶的外來(lái)核酸分子。即,可以遺傳地修飾該生物體,使其表達(dá)D-葡糖酸脫水酶或D-氨基葡糖酸脫氨酶或這兩種酶。
      另一方面,所述生物體是不能自然地表達(dá)D-葡糖酸脫水酶、D-氨基葡糖酸脫氨酶和酮酸脫羧酶的生物體,所述的酮酸脫羧酶能通過(guò)脫羧基作用將KDG轉(zhuǎn)化成2-脫氧-D-核糖,且其中已經(jīng)導(dǎo)入了編碼D-葡糖酸脫水酶或D-氨基葡糖酸脫氨酶或二者的外來(lái)核酸分子以及編碼能通過(guò)脫羧基作用將KDG轉(zhuǎn)化成2-脫氧-D-核糖的酮酸脫羧酶的核酸分子。
      關(guān)于待在根據(jù)本發(fā)明的生物體中表達(dá)的D-葡糖酸脫水酶、D-葡糖胺脫氨酶和酮酸脫羧酶的優(yōu)選實(shí)施方案,上面針對(duì)本發(fā)明的方法已經(jīng)闡述的那些同樣適用。
      在一個(gè)特別優(yōu)選的實(shí)施方案中,根據(jù)本發(fā)明的生物體并不表達(dá)KDG激酶(kdgK)活性。它可以是不能自然地表達(dá)kdgK的生物體,或者它可以是能自然地表達(dá)kdgK、但是其中對(duì)應(yīng)的基因已經(jīng)被滅活(例如通過(guò)基因破壞或本領(lǐng)域的普通技術(shù)人員眾所周知的其它合適的方法)的生物體。
      本發(fā)明還涉及具有酮酸脫羧酶活性的酶或編碼這種酶的多核苷酸在將KDG轉(zhuǎn)化成2-脫氧-D-核糖的方法中的應(yīng)用。關(guān)于優(yōu)選的實(shí)施方案,上面根據(jù)本發(fā)明的方法已經(jīng)闡述的那些同樣適用。
      這些和其它實(shí)施方案公開(kāi)在、且包含在本發(fā)明的說(shuō)明書(shū)和實(shí)施例中。在上面或下面引用的任何文獻(xiàn)中公開(kāi)的內(nèi)容都在這里并入本申請(qǐng)中。使用例如電子設(shè)施,可以從公共圖書(shū)館得到關(guān)于要根據(jù)本發(fā)明采用的方法、用途和化合物中的任一項(xiàng)的其它文獻(xiàn)。例如,可以使用公共數(shù)據(jù)庫(kù)″Medline″,它可以在因特網(wǎng)上得到,例如在http://www.ncbi.nem.nlh.gov/PubMed/medline.html。本領(lǐng)域的普通技術(shù)人員已知其它數(shù)據(jù)庫(kù)和地址,例如http://www.ncbi.nlm.nih.gov/,http://www.infobiogen.fr/,http://www.fmi.ch/biology/research-_tools.html,http://www.tigr.org/,也可以使用例如http://www.google.de得到。
      Berks,TIBTECH 12(1994),352-364提供了關(guān)于生物技術(shù)專利信息的綜述和可用于追溯搜索和最近資料通報(bào)的相關(guān)專利信息資源的調(diào)查。
      另外,當(dāng)在本文中出現(xiàn)時(shí),術(shù)語(yǔ)″和/或″包括“和”、“或”以及“所述術(shù)語(yǔ)涉及的要素的所有或任意其它組合”的含義。
      實(shí)施例實(shí)施例1從根癌土壤桿菌菌株C58(CIP 104333)克隆編碼D-葡糖酸脫水酶的基因從Institut Pasteur Collection(CIP,Paris,F(xiàn)rance)得到根癌土壤桿菌菌株C58(CIP 104333)。提取染色體DNA,并使用下述引物,根據(jù)標(biāo)準(zhǔn)方法,通過(guò)PCR擴(kuò)增D-葡糖酸脫水酶基因5′-CCCTTAATTAATGACGACATCTGATAATCTTC-3′,見(jiàn)SEQ IDNO 5;5′-TTTGCGGCCGCTTAGTGGTTATCGCGCGGC-3′,見(jiàn)SEQ IDNO 6;5′-CCCGGTACCATGACGACATCTGATAATCTTC-3′,見(jiàn)SEQ IDNO 7;將使用SEQ ID NO 5和SEQ ID NO 6所述的2個(gè)引物擴(kuò)增第一個(gè)DNA片段連接進(jìn)事先用PacI和NotI消化過(guò)的pUC18-衍生載體中,生成質(zhì)粒pVDM80。將使用SEQ ID NO 6和SEQ ID NO 7所述的2個(gè)引物擴(kuò)增的第二個(gè)DNA片段連接進(jìn)事先用KpnI和NotI消化過(guò)的pET29a載體(Novagen)中,生成質(zhì)粒pVDM82。克隆的基因的核苷酸序列如SEQ ID NO 1所示,由該基因編碼的多肽的序列如SEQ ID NO2所示。
      實(shí)施例2在大腸桿菌中表達(dá)D-葡糖酸脫水酶活性以及從D-葡糖酸制備2-脫氫-3-脫氧-D-葡糖酸使用如實(shí)施例1所述構(gòu)建的pVDM82質(zhì)粒轉(zhuǎn)化大腸桿菌BL21的感受態(tài)細(xì)胞,生成菌株+1289。在30℃,在含有30mg/l卡那霉素的Luria-Bertani(LB)培養(yǎng)基(Difco)中培養(yǎng)菌株+1289,直到OD值(600nm)達(dá)到0.6。然后,加入異丙基-β-D-硫代吡喃型半乳糖苷(IPTG),至0.5mM終濃度。進(jìn)一步培養(yǎng)2小時(shí)30分鐘后,離心收集細(xì)胞,用20mM磷酸鈉緩沖液pH7.2洗滌1次。通過(guò)將約5g細(xì)胞懸浮到含有10000單位溶菌酶(Ready-Lyse,Epicentre,Madison,Wisconsin)和1mM EDTA的10ml Tris-HCl 50mM pH8.5緩沖液中,并在30℃孵育懸浮液15分鐘,制備細(xì)胞提取物。然后,將10000千單位脫氧核糖核酸酶I(DNase I,Sigma)以及5mM MgCl2加入制品中,在30℃孵育另外的15分鐘。在使用前,將這樣得到的細(xì)胞提取物冷凍保藏在-20℃。
      混合1.5ml細(xì)胞提取物與2M D-葡糖酸鈉或鉀,至總體積10ml。在已經(jīng)將pH調(diào)節(jié)至8.5后,在37℃孵育該制品。通過(guò)在孵育遞增的時(shí)間后分析等分試樣追蹤2-脫氫-3-脫氧-D-葡糖酸(KDG)合成。將這些等分試樣的幾個(gè)稀釋部分置于二氧化硅平板上,并在下面的溶劑系統(tǒng)中進(jìn)行色譜異丙醇/水(90/10)。用對(duì)茴香醛顯色后,檢測(cè)到了KDG(Rf約0.40)的黃斑。
      另外,如Mac Gee(J.Biol.Chem.1954.210,617-626)所述,使用基于鹽酸氨基脲反應(yīng)的分光光度實(shí)驗(yàn),對(duì)KDG進(jìn)行了定量。典型地,在孵育30小時(shí)后,并使用分光光度實(shí)驗(yàn),KDG濃度范圍為1.5至2M。
      這樣得到的2-脫氫-3-脫氧-D-葡糖酸鈉或鉀溶液可以原樣用于進(jìn)一步的合成步驟。使用公開(kāi)的方法(Bender,Anal.Biochem.1974.61,275-279),也可以從這樣的溶液制備出2-脫氫-3-脫氧-D-葡糖酸。通過(guò)將1當(dāng)量的HCl加入2-脫氫-3-脫氧-D-葡糖酸鉀溶液中,然后蒸發(fā),也可以得到2-脫氫-3-脫氧-D-葡糖酸和KCl的混合物的粗制品。
      實(shí)施例3從根癌土壤桿菌菌株C58(CIP 104333)克隆編碼D-氨基葡糖酸脫氨酶的基因從Institut Pasteur Collection(CIP,Paris,F(xiàn)rance)得到根癌土壤桿菌菌株C58(CIP 104333)。提取染色體DNA,并使用下述引物,根據(jù)標(biāo)準(zhǔn)方法,通過(guò)PCR擴(kuò)增D-氨基葡糖酸脫氨酶基因5′CCCTTAATTAATGCAGTCTTCTTCAGCTCTTC-3′,見(jiàn)SEQ IDNO 8;
      5′-TTTGCGGCCGCCTAGTGAAAGAAGGTTGTGTAGAT-3′,見(jiàn)SEQ ID NO 9;5′-AAATCATGACTATGCAGTCTTCTTCAGCTCTTCG-3′,見(jiàn)SEQID NO 10;5′-TATAGATCTCTAGTGAAAGAAGGTTGTGTAGAT-3′,見(jiàn)SEQID NO 11;將使用SEQ ID NO 8和SEQ ID NO 9所述的2個(gè)引物擴(kuò)增的第一個(gè)DNA片段連接進(jìn)事先用PacI和NotI消化過(guò)的pUC18-衍生的載體中,生成質(zhì)粒pKDGb1。將使用SEQ ID NO 10和SEQ ID NO 11所述的2個(gè)引物擴(kuò)增的第二個(gè)DNA片段連接進(jìn)事先用BspH1和BglII消化過(guò)的pQE60載體(Qiagen)中,生成質(zhì)粒pEP18。所克隆的基因的核苷酸序列如SEQ ID NO 3所示,由該基因編碼的多肽的序列如SEQ ID NO4所示。
      實(shí)施例4在大腸桿菌中表達(dá)D-氨基葡糖酸脫氨酶和從D-氨基葡糖酸制備2-脫氫-3-脫氧-D-葡糖酸使用如實(shí)施例1所述構(gòu)建的pEP18質(zhì)粒和pREP4(Qiagen)轉(zhuǎn)化大腸桿菌MG1655的感受態(tài)細(xì)胞,生成菌株+1068。在37℃,在含有30mg/l卡那霉素和100mg/l氨芐青霉素的LB培養(yǎng)基中培養(yǎng)菌株+1068,直到OD值(600nm)達(dá)到0.6。然后,加入IPTG至0.5mM終濃度。進(jìn)一步培養(yǎng)2小時(shí)30分鐘后,離心收集細(xì)胞,用20mM磷酸鈉緩沖液pH7.2洗滌1次。使用實(shí)施例2所述的方法制備細(xì)胞提取物。
      混合2ml細(xì)胞提取物與100mM D-氨基葡糖酸鈉或鉀和0.1mM磷酸吡哆醛,至總體積5ml。在已經(jīng)將pH調(diào)節(jié)至7.5后,在37℃孵育該制品。
      使用實(shí)施例2所述的方法追蹤2-脫氫-3-脫氧-D-葡糖酸(KDG)合成的進(jìn)程。典型地,在孵育30小時(shí)后,使用實(shí)施例2所述的分光光度實(shí)驗(yàn),KDG濃度范圍為50至100mM。
      實(shí)施例5從2-脫氫-3-脫氧-D-葡糖酸制備2-脫氧-D-ribonate在25℃,將0.5ml 31%過(guò)氧化氫溶液加入5ml 1M 2-脫氫-3-脫氧-D-葡糖酸鉀(KDG)溶液中。通過(guò)觀察二氧化碳的釋放形成的起泡和通過(guò)使用如實(shí)施例2所述的薄層色譜方法觀察KDG的消失,追蹤KDG脫羧基化的進(jìn)展。典型地,在反應(yīng)3小時(shí)后,殘余KDG的濃度小于10mM。
      實(shí)施例6從2-脫氧-D-核糖內(nèi)酯(ribonolactone)制備2-脫氧-D-核糖醇將0.2g銠(5%,在碳上)催化劑加入按照Deriaz(J.Chem.Soc.(1949),1879-1883)中針對(duì)2-脫氧-L-核糖內(nèi)酯的合成所述的方法制備的1g 2-脫氧-D-核糖內(nèi)酯的水溶液中。在130℃,在80巴壓力下,進(jìn)行2-脫氧-D-核糖內(nèi)酯的氫化。過(guò)濾反應(yīng)化合物后,蒸發(fā)所得到的溶液。將殘余物溶于乙酸乙酯中,并通過(guò)二氧化硅柱上的色譜進(jìn)一步純化。真空去除溶劑,得到黃色油狀物(產(chǎn)率85%)。這樣得到的化合物與如Rabow(J.Am.Chem.Soc.122(1999),3196-3203)所述通過(guò)還原2-脫氧-D-核糖得到的2-脫氧-D-核糖醇相同。
      實(shí)施例7從2-脫氫-3-脫氧-D-葡糖酸制備1-N-嗎啉代-3,4,5-三羥基戊烯-1將2g 2-脫氫-3-脫氧-D-葡糖酸懸浮于150ml苯中。將1.1ml嗎啉和100mg對(duì)甲苯磺酸加入懸浮液中,回流反應(yīng)混合物3小時(shí)。蒸餾去除該反應(yīng)產(chǎn)生的水。傾析出苯。收集粘附到罐上的固體化合物,用丙酮洗滌,并干燥。使用甲醇在氯仿中的梯度,通過(guò)二氧化硅柱上的柱色譜進(jìn)一步純化存在于該產(chǎn)品中的主要化合物(產(chǎn)率40%)。收集含有1-N-嗎啉代-3,4,5-三羥基戊烯-1的級(jí)分,真空去除溶劑。
      1H-NMR(D2O)δ=3.15ppm(4H,t,嗎啉),3.8ppm(4H,t,嗎啉),3.4-4ppm,(4H,m,5a-H,5b-H,4-H,3-H),6.3和6.8ppm(2H,2d,1-H和2-H,J=4Hz)。
      實(shí)施例8從運(yùn)動(dòng)發(fā)酵單胞菌克隆編碼丙酮酸脫羧酶的基因從Institut Pasteur Collection(CIP,Paris,F(xiàn)rance)得到運(yùn)動(dòng)發(fā)酵單胞菌菌株B-806(CIP 102538T)。提取染色體DNA,并使用下述引物,根據(jù)標(biāo)準(zhǔn)方法,通過(guò)PCR擴(kuò)增丙酮酸脫羧酶基因5′-GCGTTAATTAATGAGTTATACTGTCGGTACC-3′,見(jiàn)SEQ IDNO 12;5′-TATGCGGCCGCTTAGAGGAGCTTGTTAACAGG-3′,見(jiàn)SEQID NO 13;將使用SEQ ID NO 12和SEQ ID NO 13所述的2個(gè)引物擴(kuò)增的DNA片段連接進(jìn)事先用PacI和NotI消化過(guò)的pSP100或pEVL5(分別是pUC18-衍生的或pQE70-衍生的載體,如下所述)中,分別生成質(zhì)粒pEVL107和質(zhì)粒pEVL420。所克隆的基因的核苷酸序列以及編碼的對(duì)應(yīng)多肽的序列可以在GenBank(登記號(hào)AF124349)中找到,分別如SEQ ID NO18和SEQ ID NO19所示。
      使用標(biāo)準(zhǔn)方法,將核糖體結(jié)合位點(diǎn)、PacI和NotI限制位點(diǎn)導(dǎo)入事先用EcoRI和BamHI消化過(guò)的pUC18載體中,得到質(zhì)粒pSP100。pSP100的完整的核苷酸序列如SEQ ID NO 14所示。
      使用標(biāo)準(zhǔn)方法,將核糖體結(jié)合位點(diǎn)、PacI和NotI限制位點(diǎn)導(dǎo)入事先用EcoRI和BamHI消化過(guò)的pQE70載體(Qiagen)中,得到質(zhì)粒pEVL5。pEVL5的完整的核苷酸序列如SEQ ID NO 15所示。
      實(shí)施例9從釀酒酵母克隆編碼丙酮酸脫羧酶的基因提取釀酒酵母菌株S288C(ATCC 204508)的染色體DNA,并使用下述引物,根據(jù)標(biāo)準(zhǔn)方法,通過(guò)PCR擴(kuò)增丙酮酸脫羧酶基因5′-ATATTTAATTAATGTCTGAAATTACTTTGG-3′,見(jiàn)SEQ ID NO16;5′-ATATGCGGCCGCTTATTGCTTAGCGTTGGT-3′,見(jiàn)SEQ IDNO 17;將使用SEQ ID NO 16和SEQ ID NO 17所述的2個(gè)引物擴(kuò)增的DNA片段連接進(jìn)事先用PacI和NotI消化過(guò)的pSP100或pEVL5(分別是pUC18-衍生的或pQE70-衍生的載體,如實(shí)施例8所述)中,分別生成質(zhì)粒pVDM61和質(zhì)粒pEVL419。所克隆的基因的核苷酸序列以及編碼的對(duì)應(yīng)多肽的序列可以在GenBank(登記號(hào)NC001144)中找到,分別如SEQ ID NO20和SEQ ID NO21所示。
      實(shí)施例10在大腸桿菌中表達(dá)丙酮酸脫羧酶活性以及從2-脫氫-3-脫氧-D-葡糖酸酶促合成2-脫氧-D-核糖丙酮酸脫羧酶的表達(dá)和無(wú)細(xì)胞提取物的制備使用pEVL107或pVDM61(如實(shí)施例8和9所述構(gòu)建的)轉(zhuǎn)化大腸桿菌MG1655的感受態(tài)細(xì)胞,分別生成菌株+1735和菌株+844。在37℃,在含有100mg/l氨芐青霉素的Luria-Bertani(LB)培養(yǎng)基(Difco)中培養(yǎng)這些菌株,直到OD值(600nm)達(dá)到1.5左右。
      使用pEVL420或pEVL419(如實(shí)施例8和9所述構(gòu)建的)轉(zhuǎn)化攜帶pREP4質(zhì)粒(Qiagen)的大腸桿菌MG1655的感受態(tài)細(xì)胞,分別生成菌株+3150和+3148。在37℃,在含有100mg/l氨芐青霉素和30mg/l卡那霉素的Luria-Bertani(LB)培養(yǎng)基(Difco)中培養(yǎng)這些菌株,直到OD值(600nm)達(dá)到0.6。然后,加入異丙基-β-D-硫代吡喃型半乳糖苷(IPTG)至0.5mM終濃度。進(jìn)一步培養(yǎng)2小時(shí)30分鐘后,離心收集細(xì)胞,用20mM磷酸鈉緩沖液pH7.2洗滌1次。
      對(duì)于每種菌株,使用與實(shí)施例2所述相同的方法制備無(wú)細(xì)胞的提取物。然后,使粗制的無(wú)細(xì)胞提取物穿過(guò)用50mM Tris-醋酸鹽緩沖液pH6平衡的PD-10柱(Amersham),并保藏在-20℃。
      從2-脫氫-3-脫氧-D-葡糖酸酶促合成2-脫氧-D-核糖在1.5ml總體積的50mM tris-醋酸鹽緩沖液pH6中,將1.0ml無(wú)細(xì)胞提取物與20mM 2-脫氫-3-脫氧-D-葡糖酸鈉、0.5mM硫胺素焦磷酸鹽和5mM MgCl2混合。通過(guò)分析在37℃孵育遞增的時(shí)間后所取的等分試樣,追蹤2-脫氧-D-核糖(DRI)合成的進(jìn)程。將約1ul每種等分試樣(事先已經(jīng)通過(guò)蒸發(fā)濃縮了5倍)置于二氧化硅平板上,并在下面的溶劑系統(tǒng)中進(jìn)行色譜丁醇/三乙胺/水(10/2/5)。當(dāng)使用菌株+3150或+3148的無(wú)細(xì)胞提取物時(shí),在孵育65小時(shí)后,用苔黑酚顯色后檢測(cè)到了DRI(Rf約0.50)的藍(lán)斑。濃縮含有與DRI相對(duì)應(yīng)的斑點(diǎn)的粗制品,使其穿過(guò)用異丙醇平衡的1.5ml二氧化硅柱。合并含有所期望的DRI化合物的級(jí)分,濃縮,并通過(guò)質(zhì)譜分析得到的樣品。這一分析的結(jié)果證實(shí)了分離的化合物與DRI是一致的,以及由來(lái)自運(yùn)動(dòng)發(fā)酵單胞菌(Zymomonas mobilis)或釀酒酵母的丙酮酸脫羧酶催化的從KDG生產(chǎn)DRI。
      實(shí)施例11從巴氏醋桿菌克隆編碼丙酮酸脫羧酶的基因,所編碼的丙酮酸脫羧酶活性在大腸桿菌中的表達(dá),和從2-脫氫-3-脫氧-D-葡糖酸酶促合成2-脫氧-D-核糖從DSMZ Collection(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH,Braunschweig,Germany)得到巴氏醋桿菌菌株NCIB 8618(DSMZ 2347)。從細(xì)胞提取染色體DNA,并使用下述引物,根據(jù)標(biāo)準(zhǔn)方法,通過(guò)PCR擴(kuò)增丙酮酸脫羧酶基因5′-TCTTTAATTAATGGGTTGTCCGTCATTCATATA-3′,見(jiàn)SEQID NO 22;5′-CTAAAGCTTTTAGGCCAGAGTGGTCTTGCGCG-3′,見(jiàn)SEQID NO 23;,將使用SEQ ID NO 22和SEQ ID NO 23所述的2個(gè)引物擴(kuò)增的DNA片段連接進(jìn)事先用PacI和NotI消化過(guò)的pSP100或pEVL5(分別是pUC18-衍生的或pQE70-衍生的載體,如實(shí)施例8所述),分別生成質(zhì)粒pEVL541和質(zhì)粒pEVL560。所克隆的基因的核苷酸序列SEQ IDNO 24以及編碼的對(duì)應(yīng)多肽的序列SEQ ID NO 25可以在GenBank(登記號(hào)AF368435)中找到。
      用pEVL541轉(zhuǎn)化了大腸桿菌MG1655菌株的感受態(tài)細(xì)胞,生成菌株+3559。用pEVL560轉(zhuǎn)化攜帶pREP4質(zhì)粒(Qiagen)的大腸桿菌MG1655菌株的感受態(tài)細(xì)胞,生成菌株+3924。如實(shí)施例10所述,培養(yǎng)這些菌株,并制備無(wú)細(xì)胞的提取物。如實(shí)施例10所述,將無(wú)細(xì)胞的提取物與KDG一起孵育,追蹤2-脫氧-D-核糖(DRI)合成的進(jìn)程。觀察到與DRI對(duì)應(yīng)的斑點(diǎn),表明來(lái)自巴氏醋桿菌的丙酮酸脫羧酶能將KDG脫羧基成DRI。
      實(shí)施例12從棕櫚發(fā)酵細(xì)菌克隆編碼丙酮酸脫羧酶的基因,編碼的丙酮酸脫羧酶活性在大腸桿菌中的表達(dá),和從2-脫氫-3-脫氧-D-葡糖酸酶促合成2-脫氧-D-核糖從DSMZ Collection(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH,Braunschweig,Germany)得到了棕櫚發(fā)酵細(xì)菌菌株T109(DSMZ10491)。從細(xì)胞提取染色體DNA,并使用下述引物,根據(jù)標(biāo)準(zhǔn)方法,通過(guò)PCR擴(kuò)增丙酮酸脫羧酶基因5′-ATCTTAATTAATGTATACCGTTGGTATGTACT-3′,見(jiàn)SEQ IDNO 26;5′-TATGCGGCCGCTTACGCTTGTGGTTTGCGAGAGT-3′,見(jiàn)SEQ ID NO 27;將使用SEQ ID NO 26和SEQ ID NO 27所述的2個(gè)引物擴(kuò)增的DNA片段連接進(jìn)事先用PacI和NotI消化過(guò)的pSP100或pEVL5(分別是pUC18-衍生的或pQE70-衍生的載體,如實(shí)施例8所述),分別生成質(zhì)粒pEVL546和質(zhì)粒pEVL561。所克隆的基因的核苷酸序列以及編碼的對(duì)應(yīng)多肽的序列分別如SEQ ID NO28和29所述,且可以在GenBank(登記號(hào)AF474145)中找到。
      用pEVL546轉(zhuǎn)化了大腸桿菌MG1655菌株的感受態(tài)細(xì)胞,生成菌株+3568。用pEVL560轉(zhuǎn)化攜帶pREP4質(zhì)粒(Qiagen)的大腸桿菌MG1655菌株感受態(tài)細(xì)胞,生成菌株+3923。如實(shí)施例10所述,培養(yǎng)這些菌株,并制備無(wú)細(xì)胞提取物。如實(shí)施例10所述,將無(wú)細(xì)胞提取物與KDG一起孵育,并追蹤2-脫氧-D-核糖(DRI)合成的進(jìn)程。觀察到了與DRI對(duì)應(yīng)的斑點(diǎn),表明來(lái)自棕櫚發(fā)酵細(xì)菌的丙酮酸脫羧酶能將KDG脫羧化成DRI。
      實(shí)施例13從惡臭假單胞菌克隆編碼苯甲酰基甲酸脫羧酶的基因,所編碼的苯甲酰基甲酸脫羧酶活性在大腸桿菌中的表達(dá),和從2-脫氫-3-脫氧-D-葡糖酸酶促合成2-脫氧-D-核糖從DSMZ Collection(Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH,Braunschweig,Germany)得到了惡臭假單胞菌菌株Migula(DSMZ 291)。從細(xì)胞提取染色體DNA,并使用下述引物,根據(jù)標(biāo)準(zhǔn)方法,通過(guò)PCR擴(kuò)增苯甲?;姿崦擊让富?′-CTATTAATTAATGGCTTCGGTACACGGCACCA-3′,見(jiàn)SEQID NO 30;5′-TATGCGGCCGCTTACTTCACCGGGCTTACGGTGC-3′,見(jiàn)SEQ ID NO 31;將使用SEQ ID NO 30和SEQ ID NO 31所述的2個(gè)引物擴(kuò)增的DNA片段連接進(jìn)事先用PacI和NotI消化過(guò)的pSP100或pEVL5(分別是pUC18-衍生的或pQE70-衍生的載體,如實(shí)施例8所述),分別生成質(zhì)粒pEVL681和質(zhì)粒pEVL670。所克隆的基因的核苷酸序列SEQ IDNO 32以及編碼的對(duì)應(yīng)多肽的序列SEQ ID NO 33可以在GenBank(登記號(hào)AY143338)中找到。
      用pEVL681轉(zhuǎn)化大腸桿菌MG1655菌株的感受態(tài)細(xì)胞,生成菌株+4050。用pEVL670轉(zhuǎn)化攜帶pREP4質(zhì)粒(Qiagen)的大腸桿菌MG1655菌株感受態(tài)細(xì)胞,生成菌株+3927。如實(shí)施例10所述,培養(yǎng)這些菌株,并制備無(wú)細(xì)胞提取物。如實(shí)施例10所述,將無(wú)細(xì)胞提取物與KDG一起孵育,并追蹤2-脫氧-D-核糖(DRI)合成的進(jìn)程。觀察到了與DRI對(duì)應(yīng)的斑點(diǎn),表明來(lái)自惡臭假單胞菌的苯甲?;姿崦擊让改軐DG脫羧化成DRI。
      酶促合成制備2-脫氧-D-核糖在0.5ml總體積的80mM磷酸鉀緩沖液pH6中,將100ul來(lái)自菌株+3927的無(wú)細(xì)胞提取物(含有2.5mg細(xì)菌蛋白)與300mM 2-脫氫-3-脫氧-D-葡糖酸鈉、0.5mM硫胺素焦磷酸鹽和5mM MgCl2混合。在孵育16和40小時(shí)后,向孵育混合物中加入數(shù)微升HCl 2N溶液,直到pH值達(dá)到6。分析在37℃孵育遞增的時(shí)間后取出的等分試樣,追蹤2-脫氧-D-核糖(DRI)合成的進(jìn)程。將約1ul每種等分試樣置于二氧化硅平板上,并如實(shí)施例10所述進(jìn)行色譜。通過(guò)與標(biāo)準(zhǔn)溶液進(jìn)行對(duì)比,估計(jì)2-脫氧-D-核糖的濃度為約200mM。對(duì)粗制混合物的13CNMR分析證實(shí)了從2-脫氫-3-脫氧-D-葡糖酸鹽形成的化合物是2-脫氧-D-核糖,且2-脫氧-D-核糖的濃度接近25g/l。在相同的條件下進(jìn)行了另一個(gè)制備性酶促合成,但是在孵育階段沒(méi)有加入酸。在那些條件下,2-脫氧-D-核糖的濃度接近10g/l,遠(yuǎn)低于前面的控制pH、并規(guī)則地調(diào)整到pH6的實(shí)驗(yàn)所達(dá)到的濃度。
      實(shí)施例14.從D-葡糖酸酶促合成2-脫氧-D-核糖使用由根癌土壤桿菌的gcnD基因編碼的D-葡糖酸脫水酶和來(lái)自運(yùn)動(dòng)發(fā)酵單胞菌的丙酮酸脫羧酶,如下實(shí)現(xiàn)了從D-葡糖酸單點(diǎn)酶促合成2-脫氧-D-核糖在0.5ml 50mM N-(2-羥乙基)哌嗪-N′-(2-乙烷磺酸)(HEPES)緩沖液pH7中,將分別如實(shí)施例2和實(shí)施例10所述制備的50ul來(lái)自菌株+1289的無(wú)細(xì)胞提取物(含有1.5mg細(xì)菌蛋白)和400ul來(lái)自菌株+3150的無(wú)細(xì)胞提取物(超濾濃縮后,含有17mg細(xì)菌蛋白)與50mMD-葡糖酸鉀、0.5mM硫胺素焦磷酸鹽和5mM MgCl2一起混合。在37℃孵育遞增的時(shí)間后取出等分試樣,進(jìn)行分析,追蹤2-脫氧-D-核糖(DRI)合成的進(jìn)程。孵育18小時(shí)后,將約1ul孵育混合物置于二氧化硅平板上,并如實(shí)施例10所述進(jìn)行色譜。通過(guò)與標(biāo)準(zhǔn)溶液進(jìn)行對(duì)比,估計(jì)2-脫氧-D-核糖的濃度為約1g/l。
      序列表&lt;110&gt;Evologic S.A.
      Maliere Technologies SociétéCivileRhodia ChimieMarliere,Phillipe&lt;120&gt;克隆葡糖酸脫水酶gcnD基因&lt;130&gt;G 3111 PCT S3&lt;160&gt;33&lt;170&gt;PatentIn version 3.1&lt;210&gt;1&lt;211&gt;1812&lt;212&gt;DNA&lt;213&gt;根癌土壤桿菌(Agrobacterium tumefaciens)&lt;220&gt;
      &lt;221&gt;CDS&lt;222&gt;(1)..(1809)&lt;223&gt;
      &lt;400&gt;1atg acg aca tct gat aat ctt cct gca act cag ggc aag ctc cgt tcg 48Met Thr Thr Ser Asp Asn Leu Pro Ala Thr Gln Gly Lys Leu Arg Ser1 5 10 15cgc gcc tgg ttc gac aac cca gcc aat gcg gac atg acc gcg ctt tat 96Arg Ala Trp Phe Asp Asn Pro Ala Asn Ala Asp Met Thr Ala Leu Tyr20 25 30ctc gag cgt tac atg aac ttc ggt ctc agc cag gcc gag ctt cag tcc144Leu Glu Arg Tyr Met Asn Phe Gly Leu Ser Gln Ala Glu Leu Gln Ser
      35 40 45gac cgc ccg att atc ggt att gcg cag acc ggt tcc gac ctt tcg ccc 192Asp Arg Pro Ile Ile Gly Ile Ala Gln Thr Gly Ser Asp Leu Ser Pro50 55 60tgc aac cgt cat cat ctg gaa ctc gcc aac cgt ctg cgt gaa ggc att 240Cys Asn Arg His His Leu Glu Leu Ala Asn Arg Leu Arg Glu Gly Ile65 70 75 80cgt gaa gcc ggc ggc atc gcc atc gaa ttc ccg gtg cat ccg atc cag 288Arg Glu Ala Gly Gly Ile Ala Ile Glu Phe Pro Val His Pro Ile Gln85 90 95gaa acc ggt aag cgt ccg aca gcg ggc ctt gat cgc aac ctg gct tac 336Glu Thr Gly Lys Arg Pro Thr Ala Gly Leu Asp Arg Asn Leu Ala Tyr100 105 110ctc ggc ctc gtg gaa gtg ctt tat ggc tat ccg ctc gac ggc gtt gtt 384Leu Gly Leu Val Glu Val Leu Tyr Gly Tyr Pro Leu Asp Gly Val Val115 120 125ctg acc atc ggc tgc gac aag acc acg cct gcc tgt ctt atg gcg gcg 432Leu Thr Ile Gly Cys Asp Lys Thr Thr Pro Ala Cys Leu Met Ala Ala130 135 140gcc acc gtc aac att ccg gcc atc gcc ctt tcc gtc ggt ccc atg ctg 480Ala Thr Val Asn Ile Pro Ala Ile Ala Leu Ser Val Gly Pro Met Leu145 150 155 160aac ggc tgg ttc cgc ggt gag cgc acc ggt tcc ggc acc atc gtc tgg 528Asn Gly Trp Phe Arg Gly Glu Arg Thr Gly Ser Gly Thr Ile Val Trp165 170 175aag gcc cgc gaa ctg ctg gcg aag ggc gag atc gat tac cag ggc ttc 576Lys Ala Arg Glu Leu Leu Ala Lys Gly Glu Ile Asp Tyr Gln Gly Phe180 185 190gtc aag ctc gtt gcc tcg tct gcc ccg tcc acc ggc tat tgc aac acc 624Val Lys Leu Val Ala Ser Ser Ala Pro Ser Thr Gly Tyr Cys Asn Thr195 200 205atg ggc acg gca aca acc atg aac tcg ctc gcc gaa gcg ctc ggc atg 672Met Gly Thr Ala Thr Thr Met Asn Ser Leu Ala Glu Ala Leu Gly Met210 215 220cag ctt ccc ggc tcc gcc gcc att ccg gcg cct tac cgt gac cgt cag 720Gln Leu Pro Gly Ser Ala Ala Ile Pro Ala Pro Tyr Arg Asp Arg Gln225 230 235 240gaa gtc tct tac ctc acc ggc ctg cgc atc gtc gac atg gtc agg gaa 768Glu Val Ser Tyr Leu Thr Gly Leu Arg Ile Val Asp Met Val Arg Glu245 250 255gac ctg aaa cca tca gac atc atg acc aag gat gcc ttc atc aac gcc 816Asp Leu Lys Pro Ser Asp Ile Met Thr Lys Asp Ala Phe Ile Asn Ala260 265 270atc cgc gtt aat tcg gcg atc ggc ggt tcc acc aac gcg ccg atc cat 864Ile Arg Val Asn Ser Ala Ile Gly Gly Ser Thr Asn Ala Pro Ile His
      275 280 285cta aac ggc ctt gcc cgc cat gtc ggc gtc gag ctg acg gtg gat gac 912Leu Asn Gly Leu Ala Arg His Val Gly Val Glu Leu Thr Val Asp Asp290 295 300tgg cag acc tat ggc gaa gac gtg ccg ctg ctc gtc aac ctg cag ccg 960Trp Gln Thr Tyr Gly Glu Asp Val Pro Leu Leu Val Asn Leu Gln Pro305 310 315 320gca ggc gaa tat ctc ggc gag gac tat tac cat gcc ggc ggc gtt ccc 1008Ala Gly Glu Tyr Leu Gly Glu Asp Tyr Tyr His Ala Gly Gly Val Pro325 330 335gct gtc gtc aat cag ctg atg acc caa ggg ctg atc atg gaa gac gcc 1056Ala Val Val Asn Gln Leu Met Thr Gln Gly Leu Ile Met Glu Asp Ala340 345 350atg acc gtc aac ggc aag acc atc ggc gac aat tgc cgt ggc gcg atc 1104Met Thr Val Asn Gly Lys Thr Ile Gly Asp Asn Cys Arg Gly Ala Ile355 360 365atc gaa gac gag aag gtc atc cgc ccc tat gag cag ccg ctc aag gag 1152Ile Glu Asp Glu Lys Val Ile Arg Pro Tyr Glu Gln Pro Leu Lys Glu370 375 380cgt gcc ggc ttc cgc gtt ctg cgc ggc aat ctg ttc tcc tcg gcc atc 1200Arg Ala Gly Phe Arg Val Leu Arg Gly Asn Leu Phe Ser Ser Ala Ile385 390 395 400atg aag aca agc gtg att tcg gaa gaa ttc cgc ggt cgt tac ctc tcc 1248Met Lys Thr Ser Val Ile Ser Glu Glu Phe Arg Gly Arg Tyr Leu Ser405 410 415aac cct gat gat ccg gaa gcc ttc gaa ggc cgc gcc gtg gtg ttc gat 1296Asn Pro Asp Asp Pro Glu Ala Phe Glu Gly Arg Ala Val Val Phe Asp420 425 430ggt ccg gag gat tac cat cat cgc atc gac gat ccg tcg ctt ggc atc 1344Gly Pro Glu Asp Tyr His His Arg Ile Asp Asp Pro Ser Leu Gly Ile435 440 445gac gcc aac acc gtc ctg ttc atg cgc ggc gcc ggt ccg atc ggt tac 1392Asp Ala Asn Thr Val Leu Phe Met Arg Gly Ala Gly Pro Ile Gly Tyr450 455 460ccg ggc gca gcg gaa gtg gtg aac atg cgc gcg ccg gat tac ctt ctg 1440Pro Gly Ala Ala Glu Val Val Asn Met Arg Ala Pro Asp Tyr Leu Leu465 470 475 480aag caa ggc gtc agt tcg ctg ccc tgc atc ggc gat ggc cgc cag tcc 1488Lys Gln Gly Val Ser Ser Leu Pro Cys Ile Gly Asp Gly Arg Gln Ser485 490 495ggc acg tcg ggc agc cca tcc atc ctc aat gcc tcg ccg gaa gcg gcg 1536Gly Thr Ser Gly Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ala Ala500 505 510gcc ggc ggc ggt ctg tct att ctg cag acg ggt gac cgc gtc cgc atc 1584
      Ala Gly Gly Gly Leu Ser Ile Leu Gln Thr Gly Asp Arg Val Arg Ile515 520 525gat gtg ggc cgc ggc aag gcc gat atc ctg ata tca ggt gaa gag ctc1632Asp Val Gly Arg Gly Lys Ala Asp Ile Leu Ile Ser Gly Glu Glu Leu530 535 540gcc aag cgt tac gag gcg ctg gca gct cag ggc ggt tat aag ttc ccc1680Ala Lys Arg Tyr Glu Ala Leu Ala Ala Gln Gly Gly Tyr Lys Phe Pro545 550 555 560gac cac cag acg ccg tgg cag gaa atc cag cgc ggt atc gtc agc cag1728Asp His Gln Thr Pro Trp Gln Glu Ile Gln Arg Gly Ile Val Ser Gln565 570 575atg gaa acc ggc gcg gtt ctg gaa ccg gcc gta aag tat cag cgc atc1776Met Glu Thr Gly Ala Val Leu Glu Pro Ala Val Lys Tyr Gln Arg Ile580 585 590gcc cag acc aag ggc ctg ccg cgc gat aac cac tga1812Ala Gln Thr Lys Gly Leu Pro Arg Asp Asn His595 600&lt;210&gt;2&lt;211&gt;603&lt;212&gt;PRT&lt;213&gt;根癌土壤桿菌&lt;400&gt;2Met Thr Thr Ser Asp Asn Leu Pro Ala Thr Gln Gly Lys Leu Arg Ser1 5 10 15Arg Ala Trp Phe Asp Asn Pro Ala Asn Ala Asp Met Thr Ala Leu Tyr20 25 30Leu Glu Arg Tyr Met Asn Phe Gly Leu Ser Gln Ala Glu Leu Gln Ser35 40 45Asp Arg Pro Ile Ile Gly Ile Ala Gln Thr Gly Ser Asp Leu Ser Pro50 55 60Cys Asn Arg His His Leu Glu Leu Ala Asn Arg Leu Arg Glu Gly Ile65 70 75 80Arg Glu Ala Gly Gly Ile Ala Ile Glu Phe Pro Val His Pro Ile Gln85 90 95
      Glu Thr Gly Lys Arg Pro Thr Ala Gly Leu Asp Arg Ash Leu Ala Tyr100 105 110Leu Gly Leu Val Glu Val Leu Tyr Gly Tyr Pro Leu Asp Gly Val Val115 120 125Leu Thr Ile Gly Cys Asp Lys Thr Thr Pro Ala Cys Leu Met Ala Ala130 135 140Ala Thr Val Asn Ile Pro Ala Ile Ala Leu Ser Val Gly Pro Met Leu145 150 155 160Asn Gly Trp Phe Arg Gly Glu Arg Thr Gly Ser Gly Thr Ile Val Trp165 170 175Lys Ala Arg Glu Leu Leu Ala Lys Gly Glu Ile Asp Tyr Gln Gly Phe180 185 190Val Lys Leu Val Ala Ser Ser Ala Pro Ser Thr Gly Tyr Cys Asn Thr195 200 205Met Gly Thr Ala Thr Thr Met Asn Ser Leu Ala Glu Ala Leu Gly Met210 215 220Gln Leu Pro Gly Ser Ala Ala Ile Pro Ala Pro Tyr Arg Asp Arg Gln225 230 235 240Glu Val Ser Tyr Leu Thr Gly Leu Arg Ile Val Asp Met Val Arg Glu245 250 255Asp Leu Lys Pro Ser Asp Ile Met Thr Lys Asp Ala Phe Ile Asn Ala260 265 270Ile Arg Val Asn Ser Ala Ile Gly Gly Ser Thr Asn Ala Pro Ile His275 280 285Leu Asn Gly Leu Ala Arg His Val Gly Val Glu Leu Thr Val Asp Asp290 295 300Trp Gln Thr Tyr Gly Glu Asp Val Pro Leu Leu Val Asn Leu Gln Pro305 310 315 320Ala Gly Glu Tyr Leu Gly Glu Asp Tyr Tyr His Ala Gly Gly Val Pro325 330 335
      Ala Val Val Asn Gln Leu Met Thr Gln Gly Leu Ile Met Glu Asp Ala340 345 350Met Thr Val Asn Gly Lys Thr Ile Gly Asp Asn Cys Arg Gly Ala Ile355 360 365Ile Glu Asp Glu Lys Val Ile Arg Pro Tyr Glu Gln Pro Leu Lys Glu370 375 380Arg Ala Gly Phe Arg Val Leu Arg Gly Asn Leu Phe Ser Ser Ala Ile385 390 395 400Met Lys Thr Ser Val Ile Ser Glu Glu Phe Arg Gly Arg Tyr Leu Ser405 410 415Asn Pro Asp Asp Pro Glu Ala Phe Glu Gly Arg Ala Val Val Phe Asp420 425 430Gly Pro Glu Asp Tyr His His Arg Ile Asp Asp Pro Ser Leu Gly Ile435 440 445Asp Ala Asn Thr Val Leu Phe Met Arg Gly Ala Gly Pro Ile Gly Tyr450 455 460Pro Gly Ala Ala Glu Val Val Asn Met Arg Ala Pro Asp Tyr Leu Leu465 470 475 480Lys Gln Gly Val Ser Ser Leu Pro Cys Ile Gly Asp Gly Arg Gln Ser485 490 495Gly Thr Ser Gly Ser Pro Ser Ile Leu Asn Ala Ser Pro Glu Ala Ala500 505 510Ala Gly Gly Gly Leu Ser Ile Leu Gln Thr Gly Asp Arg Val Arg Ile515 520 525Asp Val Gly Arg Gly Lys Ala Asp Ile Leu Ile Ser Gly Glu Glu Leu530 535 540Ala Lys Arg Tyr Glu Ala Leu Ala Ala Gln Gly Gly Tyr Lys Phe Pro545 550 555 560Asp His Gln Thr Pro Trp Gln Glu Ile Gln Arg Gly Ile Val Ser Gln
      565 570 575Met Glu Thr Gly Ala Val Leu Glu Pro Ala Val Lys Tyr Gln Arg Ile580 585 590Ala Gln Thr Lys Gly Leu Pro Arg Asp Asn His595 600&lt;210&gt;3&lt;211&gt;1272&lt;212&gt;DNA&lt;213&gt;根癌土壤桿菌&lt;220&gt;
      &lt;221&gt;CDS&lt;222&gt;(1)..(1269)&lt;223&gt;
      &lt;400&gt;3atg cag tct tct tca gct ctt cgg caa tca acc ggc gat cag tcg gaa 48Met Gln Ser Ser Ser Ala Leu Arg Gln Ser Thr Gly Asp Gln Ser Glu1 5 10 15tac cat gcc cag tcg aat atg atc ggc tct agc ccg gcg gac ggt ttg 96Tyr His Ala Gln Ser Asn Met Ile Gly Ser Ser Pro Ala Asp Gly Leu20 25 30ctc gca ttg ccg ctt ctg acc gtc gat ctt gcc gtc tat cgc ggt aat 144Leu Ala Leu Pro Leu Leu Thr Val Asp Leu Ala Val Tyr Arg Gly Asn35 40 45cgg gat cgc ttt ctt gcg ctt gtc tcg gcc cat gga gcg aag gcg gct 192Arg Asp Arg Phe Leu Ala Leu Val Ser Ala His Gly Ala Lys Ala Ala50 55 60cca cat gcc aag acg ccg atg tgc ccg gag atc gcg atc gat ctg att 240Pro His Ala Lys Thr Pro Met Cys Pro Glu Ile Ala Ile Asp Leu Ile65 70 75 80gaa gcc ggt gcc tgg ggc gcg acg gtc gcc gat ctc ttc cag gcg gaa 288Glu Ala Gly Ala Trp Gly Ala Thr Val Ala Asp Leu Phe Gln Ala Glu85 90 95gtc ctg ctc aag gcc ggc gtg tcg aac ata ttg atc gcc aac cag atc 336Val Leu Leu Lys Ala Gly Val Ser Asn Ile Leu Ile Ala Asn Gln Ile100 105 110
      ggc gga ttg aca tcc gcc aga cgc cta cgc atg ctc gca gat gct ttt 384Gly Gly Leu Thr Ser Ala Arg Arg Leu Arg Met Leu Ala Asp Ala Phe115 120 125ccg aaa gcc gag att atc tgc tgt gtc gat tct gtt cag gcc tcg gcc 432Pro Lys Ala Glu Ile Ile Cys Cys Val Asp Ser Val Gln Ala Ser Ala130 135 140aat ctg gtt cag gcc ttt caa ggg cgt gtg gat gcc cca ttc aag gtc 480Asn Leu Val Gln Ala Phe Gln Gly Arg Val Asp Ala Pro Phe Lys Val145 150 155 160ttc atc gaa gtc ggt gtc ggc cgc act ggc gcc cgt acg ttg aat gtt 528Phe Ile Glu Val Gly Val Gly Arg Thr Gly Ala Arg Thr Leu Asn Val165 170 175gca aag gat atc atc gac acc atc tcg aca agt gca gaa atc gta ctg 576Ala Lys Asp Ile Ile Asp Thr Ile Ser Thr Ser Ala Glu Ile Val Leu180 185 190gcc ggt gtg tcg acc tat gaa ggc tcc gtc tcc ggg gaa acg tcg gaa 624Ala Gly Val Ser Thr Tyr Glu Gly Ser Val Ser Gly Glu Thr Ser Glu195 200 205gca ctc gat gca aac atg gcg gcc ctg ttc gat ctc ctg acc gac agt 672Ala Leu Asp Ala Asn Met Ala Ala Leu Phe Asp Leu Leu Thr Asp Ser210 215 220ctt gca tcg ata cgc gaa aaa gat ccc ggg cgc ccg cta acg gtt tca 720Leu Ala Ser Ile Arg Glu Lys Asp Pro Gly Arg Pro Leu Thr Val Ser225 230 235 240gcc ggc ggt tcg atc cat ttc gac cgc gtg ctc gcg gcg ctt gtg ccc 768Ala Gly Gly Ser Ile His Phe Asp Arg Val Leu Ala Ala Leu Val Pro245 250 255gtt tgc gag gcg gat ggc aat gcg acg ttg ttg ctg cgc agc ggc gcc 816Val Cys Glu Ala Asp Gly Asn Ala Thr Leu Leu Leu Arg Ser Gly Ala260 265 270atc ttc ttc tct gat cac ggt gta tat cag cgc ggt ttc cag gca gtc 864Ile Phe Phe Ser Asp His Gly Val Tyr Gln Arg Gly Phe Gln Ala Val275 280 285gac gcc cgc aac cta ctc gca tcc ggc aag gtt gtc ttc aag gca tcc 912Asp Ala Arg Asn Leu Leu Ala Ser Gly Lys Val Val Phe Lys Ala Ser290 295 300gag gca ttt cag ccc tca atg cga atc tgg gcg gag gtc atc tcc gtt 960Glu Ala Phe Gln Pro Ser Met Arg Ile Trp Ala Glu Val Ile Ser Val305 310 315 320cct gag ccg ggg ctg gcg atc gtc ggc atg ggc atg cgg gat gta tcg 1008Pro Glu Pro Gly Leu Ala Ile Val Gly Met Gly Met Arg Asp Val Ser325 330 335ttc gat cag gac ctg ccc gtg gcg ctt cgg ctc cat agg gac gga cat 1056Phe Asp Gln Asp Leu Pro Val Ala Leu Arg Leu His Arg Asp Gly His
      340 345 350ctg gtc gaa gct gat ctc tct tca tcc gcg aag gtc ggc aag ctc aat1104Leu Val Glu Ala Asp Leu Ser Ser Ser Ala Lys Val Gly Lys Leu Asn355 360 365gac cag cat gcc ttc ttg tcc ttc ggg aac ggc agc agt ctg gca atc1152Asp Gln His Ala Phe Leu Ser Phe Gly Asn Gly Ser Ser Leu Ala Ile370 375 380ggc gat gtc ata gaa ttc ggc atc tcg cat ccc tgc acg tgc ttc gat1200Gly Asp Val Ile Glu Phe Gly Ile Ser His Pro Cys Thr Cys Phe Asp385 390 395 400cgc tgg cgc gtc ttt cac gga atc gat gga tca ggc cgg atc cag cgc1248Arg Trp Arg Val Phe His Gly Ile Asp Gly Ser Gly Arg Ile Gln Arg405 410 415atc tac aca acc ttc ttt cac tag1272Ile Tyr Thr Thr Phe Phe His420&lt;210&gt;4&lt;211&gt;423&lt;212&gt;PRT&lt;213&gt;根癌土壤桿菌&lt;400&gt;4Met Gln Ser Ser Ser Ala Leu Arg Gln Ser Thr Gly Asp Gln Ser Glu1 5 10 15Tyr His Ala Gln Ser Asn Met Ile Gly Ser Ser Pro Ala Asp Gly Leu20 25 30Leu Ala Leu Pro Leu Leu Thr Val Asp Leu Ala Val Tyr Arg Gly Asn35 40 45Arg Asp Arg Phe Leu Ala Leu Val Ser Ala His Gly Ala Lys Ala Ala50 55 60Pro His Ala Lys Thr Pro Met Cys Pro Glu Ile Ala Ile Asp Leu Ile65 70 75 80Glu Ala Gly Ala Trp Gly Ala Thr Val Ala Asp Leu Phe Gln Ala Glu85 90 95
      Val Leu Leu Lys Ala Gly Val Ser Asn Ile Leu Ile Ala Asn Gln Ile100 105 110Gly Gly Leu Thr Ser Ala Arg Arg Leu Arg Met Leu Ala Asp Ala Phe115 120 125Pro Lys Ala Glu Ile Ile Cys Cys Val Asp Ser Val Gln Ala Ser Ala130 135 140Asn Leu Val Gln Ala Phe Gln Gly Arg Val Asp Ala Pro Phe Lys Val145 150 155 160Phe Ile Glu Val Gly Val Gly Arg Thr Gly Ala Arg Thr Leu Asn Val165 170 175Ala Lys Asp Ile Ile Asp Thr Ile Ser Thr Ser Ala Glu Ile Val Leu180 185 190Ala Gly Val Ser Thr Tyr Glu Gly Ser Val Ser Gly Glu Thr Ser Glu195 200 205Ala Leu Asp Ala Asn Met Ala Ala Leu Phe Asp Leu Leu Thr Asp Ser210 215 220Leu Ala Ser Ile Arg Glu Lys Asp Pro Gly Arg Pro Leu Thr Val Ser225 230 235 240Ala Gly Gly Ser Ile His Phe Asp Arg Val Leu Ala Ala Leu Val Pro245 250 255Val Cys Glu Ala Asp Gly Asn Ala Thr Leu Leu Leu Arg Ser Gly Ala260 265 270Ile Phe Phe Ser Asp His Gly Val Tyr Gln Arg Gly Phe Gln Ala Val275 280 285Asp Ala Arg Asn Leu Leu Ala Ser Gly Lys Val Val Phe Lys Ala Ser290 295 300Glu Ala Phe Gln Pro Ser Met Arg Ile Trp Ala Glu Val Ile Ser Val305 310 315 320Pro Glu Pro Gly Leu Ala Ile Val Gly Met Gly Met Arg Asp Val Ser325 330 335
      Phe Asp Gln Asp Leu Pro Val Ala Leu Arg Leu His Arg Asp Gly His340 345 350Leu Val Glu Ala Asp Leu Ser Ser Ser Ala Lys Val Gly Lys Leu Asn355 360 365Asp Gln His Ala Phe Leu Ser Phe Gly Asn Gly Ser Ser Leu Ala Ile370 375 380Gly Asp Val Ile Glu Phe Gly Ile Ser His Pro Cys Thr Cys Phe Asp385 390 395 400Arg Trp Arg Val Phe His Gly Ile Asp Gly Ser Gly Arg Ile Gln Arg405 410 415Ile Tyr Thr Thr Phe Phe His420&lt;210&gt;5&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;寡核苷酸引物&lt;400&gt;5cccttaatta atgacgacat ctgataatct tc 32&lt;210&gt;6&lt;211&gt;30&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;寡核苷酸引物&lt;400&gt;6tttgcggccg cttagtggtt atcgcgcggc 30
      &lt;210&gt;7&lt;211&gt;31&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;寡核苷酸引物&lt;400&gt;7cccggtacca tgacgacatc tgataatctt c 31&lt;210&gt;8&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;寡核苷酸引物&lt;400&gt;8cccttaatta atgcagtctt cttcagctct tc 32&lt;210&gt;9&lt;211&gt;35&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;寡核苷酸引物&lt;400&gt;9tttgcggccg cctagtgaaa gaaggttgtg tagat 35&lt;210&gt;10&lt;211&gt;34
      &lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;寡核苷酸引物&lt;400&gt;10aaatcatgac tatgcagtct tcttcagctc ttcg34&lt;210&gt;11&lt;211&gt;33&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;寡核苷酸引物&lt;400&gt;11tatagatctc tagtgaaaga aggttgtgta gat 33&lt;210&gt;12&lt;211&gt;31&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;人工序列&lt;400&gt;12gcgttaatta atgagttata ctgtcggtac c 31&lt;210&gt;13&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;人工序列
      &lt;220&gt;
      &lt;223&gt;人工序列&lt;400&gt;13tatgcggccg cttagaggag cttgttaaca gg 32&lt;210&gt;14&lt;211&gt;2665&lt;212&gt;DNA&lt;213&gt;載體&lt;400&gt;14gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60cttagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt120tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat180aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt240ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg300ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga360tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc420tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac480actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg540gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca600acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg660gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg720acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg780gcgaactact tactctagct tcccggcaac aattaataga ctggatggag gcggataaag840ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg900gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct960cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac 1020agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac caagtttact 1080catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga 1140
      tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt1200cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct1260gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc1320taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgtcc1380ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc1440tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg1500ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt1560cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg1620agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg1680gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt1740atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag1800gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt1860gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta1920ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt1980cagtgagcga ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc2040cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca2100acgcaattaa tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc2160cggctcgtat gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg2220accatgatta cgaattcgag gttaattaac cccgcggccg caagcttggc actggccgtc2280gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg ccttgcagca2340catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg cccttcccaa2400cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct tacgcatctg2460tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga tgccgcatag2520ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc ttgtctgctc2580ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg tcagaggttt2640tcaccgtcat caccgaaacg cgcga 2665&lt;210&gt;15&lt;211&gt;3433&lt;212&gt;DNA
      &lt;213&gt;載體&lt;400&gt;15ctcgagaaat cataaaaaat ttatttgctt tgtgagcgga taacaattat aatagattca 60attgtgagcg gataacaatt tcacacagaa ttcttaaaga ggagaaatta attaaccccg 120cggccgcgga tccagatctc atcaccatca ccatcactaa gcttaattag ctgagcttgg 180actcctgttg atagatccag taatgacctc agaactccat ctggatttgt tcagaacgct 240cggttgccgc cgggcgtttt ttattggtga gaatccaagc tagcttggcg agattttcag 300gagctaagga agctaaaatg gagaaaaaaa tcactggata taccaccgtt gatatatccc 360aatggcatcg taaagaacat tttgaggcat ttcagtcagt tgctcaatgt acctataacc 420agaccgttca gctggatatt acggcctttt taaagaccgt aaagaaaaat aagcacaagt 480tttatccggc ctttattcac attcttgccc gcctgatgaa tgctcatccg gaatttcgta 540tggcaatgaa agacggtgag ctggtgatat gggatagtgt tcacccttgt tacaccgttt 600tccatgagca aactgaaacg ttttcatcgc tctggagtga ataccacgac gatttccggc 660agtttctaca catatattcg caagatgtgg cgtgttacgg tgaaaacctg gcctatttcc 720ctaaagggtt tattgagaat atgtttttcg tctcagccaa tccctgggtg agtttcacca 780gttttgattt aaacgtggcc aatatggaca acttcttcgc ccccgttttc accatgggca 840aatattatac gcaaggcgac aaggtgctga tgccgctggc gattcaggtt catcatgccg 900tttgtgatgg cttccatgtc ggcagaatgc ttaatgaatt acaacagtac tgcgatgagt 960ggcagggcgg ggcgtaattt ttttaaggca gttattggtg cccttaaacg cctggggtaa1020tgactctcta gcttgaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt1080cgttttatct gttgtttgtc ggtgaacgct ctcctgagta ggacaaatcc gccctctaga1140gctgcctcgc gcgtttcggt gatgacggtg aaaacctctg acacatgcag ctcccggaga1200cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca agcccgtcag ggcgcgtcag1260cgggtgttgg cgggtgtcgg ggcgcagcca tgacccagtc acgtagcgat agcggagtgt1320atactggctt aactatgcgg catcagagca gattgtactg agagtgcacc atatgcggtg1380tgaaataccg cacagatgcg taaggagaaa ataccgcatc aggcgctctt ccgcttcctc1440gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa1500ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa1560aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct1620
      ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac1680aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc1740gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc1800tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg1860tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga1920gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag1980cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta2040cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag2100agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg2160caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac2220ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc2280aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag2340tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc2400agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac2460gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc2520accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg2580tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag2640tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc2700acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac2760atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag2820aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac2880tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg2940agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc3000gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact3060ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg3120atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa3180tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt3240tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg3300tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga3360cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc3420
      ctttcgtctt cac 3433&lt;210&gt;16&lt;211&gt;30&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;人工序列&lt;400&gt;16atatttaatt aatgtctgaa attactttgg 30&lt;210&gt;17&lt;211&gt;30&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;人工序列&lt;400&gt;17atatgcggcc gcttattgct tagcgttggt 30&lt;210&gt;18&lt;211&gt;1707&lt;212&gt;DNA&lt;213&gt;運(yùn)動(dòng)發(fā)酵單胞菌(Zymomonas mobilis)&lt;220&gt;
      &lt;221&gt;CDS&lt;222&gt;(1)..(1707)&lt;223&gt;
      &lt;400&gt;18atg agt tat act gtc ggt acc tat tta gcg gag cgg ctt gtc cag att 48Met Ser Tyr Thr Val Gly Thr Tyr Leu Ala Glu Arg Leu Val Gln Ile1 5 10 15ggt ctc aag cat cac ttc gca gtc gcg ggc gac tac aac ctc gtc ctt 96Gly Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu20 25 30ctt gac aac ctg ctt ttg aac aaa aac atg gag cag gtt tat tgc tgt 144Leu Asp Asn Leu Leu Leu Asn Lys Asn Met Glu Gln Val Tyr Cys Cys35 40 45aac gaa ctg aac tgc ggt ttc agt gca gaa ggt tat gct cgt gcc aaa 192Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Lys50 55 60ggc gca gca gca gcc gtc gtt acc tac agc gtc ggt gcg ctt tcc gca 240Gly Ala Ala Ala Ala Val Val Thr Tyr Ser Val Gly Ala Leu Set Ala65 70 75 80ttt gat gct atc ggt ggc gcc tat gca gaa aac ctt ccg gtt atc ctg 288Phe Asp Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu85 90 95atc tcc ggt gct ccg aac aac aat gat cac gct gct ggt cac gtg ttg 336Ile Ser Gly Ala Pro Asn Asn Asn Asp His Ala Ala Gly His Val Leu100 105 110cat cac gct ctt ggc aaa acc gac tat cac tat cag ttg gaa atg gcc 384His His Ala Leu Gly Lys Thr Asp Tyr His Tyr Gln Leu Glu Met Ala115 120 125aag aac atc acg gcc gcc gct gaa gcg att tac acc ccg gaa gaa gct 432Lys Asn Ile Thr Ala Ala Ala Glu Ala Ile Tyr Thr Pro Glu Glu Ala130 135 140ccg gct aaa atc gat cac gtg att aaa act gct ctt cgt gag aag aag 480Pro Ala Lys Ile Asp His Val Ile Lys Thr Ala Leu Arg Glu Lys Lys145 150 155 160ccg gtt tat ctc gaa atc gct tgc aac att gct tcc atg ccc tgc gcc 528Pro Val Tyr Leu Glu Ile Ala Cys Asn Ile Ala Ser Met Pro Cys Ala165 170 175gct cct gga ccg gca agc gca ttg ttc aat gac gaa gcc agc gac gaa 576Ala Pro Gly Pro Ala Ser Ala Leu Phe Asn Asp Glu Ala Ser Asp Glu180 185 190gct tct ttg aat gca gcg gtt gaa gaa acc ctg aaa ttc atc gcc aac 624Ala Ser Leu Asn Ala Ala Val Glu Glu Thr Leu Lys Phe Ile Ala Asn195 200 205cgc gac aaa gtt gcc gtc ctc gtc ggc agc aag ctg cgc gca gct ggt 672Arg Asp Lys Val Ala Val Leu Val Gly Ser Lys Leu Arg Ala Ala Gly210 215 220gct gaa gaa gct gct gtc aaa ttt gct gat gct ctc ggt ggc gca gtt 720
      Ala Glu Glu Ala Ala Val Lys Phe Ala Asp Ala Leu Gly Gly Ala Val225 230 235 240gct acc atg gct gct gca aaa agc ttc ttc cca gaa gaa aac ccg cat 768Ala Thr Met Ala Ala Ala Lys Ser Phe Phe Pro Glu Glu Asn Pro His245 250 255tac atc ggc acc tca tgg ggt gaa gtc agc tat ccg ggc gtt gaa aag 816Tyr Ile Gly Thr Ser Trp Gly Glu Val Ser Tyr Pro Gly Val Glu Lys260 265 270acg atg aaa gaa gcc gat gcg gtt atc gct ctg gct cct gtc ttc aac 864Thr Met Lys Glu Ala Asp Ala Val Ile Ala Leu Ala Pro Val Phe Asn275 280 285gac tac tcc acc act ggt tgg acg gat att cct gat cct aag aaa ctg 912Asp Tyr Ser Thr Thr Gly Trp Thr Asp Ile Pro Asp Pro Lys Lys Leu290 295 300gtt ctc gct gaa ccg cgt tct gtc gtc gtt aac ggc att cgc ttc ccc 960Val Leu Ala Glu Pro Arg Ser Val Val Val Asn Gly Ile Arg Phe Pro305 310315 320agc gtc cat ctg aaa gac tat ctg acc cgt ttg gct cag aaa gtt tcc 1008Ser Val His Leu Lys Asp Tyr Leu Thr Arg Leu Ala Gln Lys Val Ser325 330 335aag aaa acc ggt gca ttg gac ttc ttc aaa tcc ctc aat gca ggt gaa 1056Lys Lys Thr Gly Ala Leu Asp Phe Phe Lys Ser Leu Asn Ala Gly Glu340 345 350ctg aag aaa gcc gct ccg gct gat ccg agt gct ccg ttg gtc aac gca 1104Leu Lys Lys Ala Ala Pro Ala Asp Pro Ser Ala Pro Leu Val Asn Ala355 360 365gaa atc gcc cgt cag gtc gaa gct ctt ctg acc ccg aac acg acg gtt 1152Glu Ile Ala Arg Gln Val Glu Ala Leu Leu Thr Pro Asn Thr Thr Val370 375 380att gct gaa acc ggt gac tct tgg ttc aat gct cag cgc atg aag ctc 1200Ile Ala Glu Thr Gly Asp Ser Trp Phe Asn Ala Gln Arg Met Lys Leu385 390 395 400ccg aac ggt gct cgc gtt gaa tat gaa atg cag tgg ggt cac att ggt 1248Pro Asn Gly Ala Arg Val Glu Tyr Glu Met Gln Trp Gly His Ile Gly405 410 415tgg tcc gtt cct gcc gcc ttc ggt tat gcc gtc ggt gct ccg gaa cgt 1296Trp Ser Val Pro Ala Ala Phe Gly Tyr Ala Val Gly Ala Pro Glu Arg420 425 430cgc aac atc ctc atg gtt ggt gat ggt tcc ttc cag ctg acg gct cag 1344Arg Asn Ile Leu Met Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln435 440 445gaa gtc gct cag atg gtt cgc ctg aaa ctg ccg gtt atc atc ttc ttg 1392Glu Val Ala Gln Met Val Arg Leu Lys Leu Pro Val Ile Ile Phe Leu450 455 460
      atc aat aac tat ggt tac acc atc gaa gtt atg atc cat gat ggt ccg 1440Ile Asn Asn Tyr Gly Tyr Thr Ile Glu Val Met Ile His Asp Gly Pro465 470 475 480tac aac aac atc aag aac tgg gat tat gcc ggt ctg atg gaa gtg ttc 1488Tyr Asn Asn Ile Lys Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe485 490 495aac ggt aac ggt ggt tat gac agc ggt gct ggt aaa ggc ctg aag gct 1536Asn Gly Asn Gly Gly Tyr Asp Ser Gly Ala Gly Lys Gly Leu Lys Ala500 505 510aaa acc ggt ggc gaa ctg gca gaa gct atc aag gtt gct ctg gca aac 1584Lys Thr Gly Gly Glu Leu Ala Glu Ala Ile Lys Val Ala Leu Ala Asn515 520 525acc gac ggc cca acc ctg atc gaa tgc ttc atc ggt cgt gaa gac tgc 1632Thr Asp Gly Pro Thr Leu Ile Glu Cys Phe Ile Gly Arg Glu Asp Cys530 535 540act gaa gaa ttg gtc aaa tgg ggt aag cgc gtt gct gcc gcc aac agc 1680Thr Glu Glu Leu Val Lys Trp Gly Lys Arg Val Ala Ala Ala Asn Ser545 550 555 560cgt aag cct gtt aac aag ctc ctc tag 1707Arg Lys Pro Val Asn Lys Leu Leu565&lt;210&gt;19&lt;211&gt;568&lt;212&gt;PRT&lt;213&gt;運(yùn)動(dòng)發(fā)酵單胞菌&lt;400&gt;19Met Ser Tyr Thr Val Gly Thr Tyr Leu Ala Glu Arg Leu Val Gln Ile1 5 10 15Gly Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu20 25 30Leu Asp Asn Leu Leu Leu Asn Lys Asn Met Glu Gln Val Tyr Cys Cys35 40 45Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Lys50 55 60Gly Ala Ala Ala Ala Val Val Thr Tyr Ser Val Gly Ala Leu Ser Ala65 70 75 80
      Phe Asp Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu85 90 95Ile Ser Gly Ala Pro Asn Asn Asn Asp His Ala Ala Gly His Val Leu100 105 110His His Ala Leu Gly Lys Thr Asp Tyr His Tyr Gln Leu Glu Met Ala115 120 125Lys Asn Ile Thr Ala Ala Ala Glu Ala Ile Tyr Thr Pro Glu Glu Ala130 135 140Pro Ala Lys Ile Asp His Val Ile Lys Thr Ala Leu Arg Glu Lys Lys145 150 155 160Pro Val Tyr Leu Glu Ile Ala Cys Asn Ile Ala Ser Met Pro Cys Ala165 170 175Ala Pro Gly Pro Ala Ser Ala Leu Phe Asn Asp Glu Ala Ser Asp Glu180 185 190Ala Ser Leu Asn Ala Ala Val Glu Glu Thr Leu Lys Phe Ile Ala Asn195 200 205Arg Asp Lys Val Ala Val Leu Val Gly Ser Lys Leu Arg Ala Ala Gly210 215 220Ala Glu Glu Ala Ala Val Lys Phe Ala Asp Ala Leu Gly Gly Ala Val225 230 235 240Ala Thr Met Ala Ala Ala Lys Ser Phe Phe Pro Glu Glu Asn Pro His245 250 255Tyr Ile Gly Thr Ser Trp Gly Glu Val Ser Tyr Pro Gly Val Glu Lys260 265 270Thr Met Lys Glu Ala Asp Ala Val Ile Ala Leu Ala Pro Val Phe Asn275 280 285Asp Tyr Ser Thr Thr Gly Trp Thr Asp Ile Pro Asp Pro Lys Lys Leu290 295 300Val Leu Ala Glu Pro Arg Ser Val Val Val Asn Gly Ile Arg Phe Pro
      305 310 315 320Ser Val His Leu Lys Asp Tyr Leu Thr Arg Leu Ala Gln Lys Val Ser325 330 335Lys Lys Thr Gly Ala Leu Asp Phe Phe Lys Ser Leu Asn Ala Gly Glu340 345 350Leu Lys Lys Ala Ala Pro Ala Asp Pro Ser Ala Pro Leu Val Asn Ala355 360 365Glu Ile Ala Arg Gln Val Glu Ala Leu Leu Thr Pro Asn Thr Thr Val370 375 380Ile Ala Glu Thr Gly Asp Ser Trp Phe Asn Ala Gln Arg Met Lys Leu385 390 395 400Pro Asn Gly Ala Arg Val Glu Tyr Glu Met Gln Trp Gly His Ile Gly405 410 415Trp Ser Val Pro Ala Ala Phe Gly Tyr Ala Val Gly Ala Pro Glu Arg420 425 430Arg Asn Ile Leu Met Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln435 440 445Glu Val Ala Gln Met Val Arg Leu Lys Leu Pro Val Ile Ile Phe Leu450 455 460Ile Asn Asn Tyr Gly Tyr Thr Ile Glu Val Met Ile His Asp Gly Pro465 470 475 480Tyr Asn Asn Ile Lys Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe485 490 495Asn Gly Asn Gly Gly Tyr Asp Ser Gly Ala Gly Lys Gly Leu Lys Ala500 505 510Lys Thr Gly Gly Glu Leu Ala Glu Ala Ile Lys Val Ala Leu Ala Asn515 520 525Thr Asp Gly Pro Thr Leu Ile Glu Cys Phe Ile Gly Arg Glu Asp Cys530 535 540
      Thr Glu Glu Leu Val Lys Trp Gly Lys Arg Val Ala Ala Ala Asn Ser545 550 555 560Arg Lys Pro Val Asn Lys Leu Leu565&lt;210&gt;20&lt;211&gt;1692&lt;212&gt;DNA&lt;213&gt;釀酒酵母(Saccharomyces cerevisiae)&lt;220&gt;
      &lt;221&gt;CDS&lt;222&gt;(1)..(1692)&lt;223&gt;
      &lt;400&gt;20atg tct gaa att act ttg ggt aaa tat ttg ttc gaa aga tta aag caa 48Met Ser Glu Ile Thr Leu Gly Lys Tyr Leu Phe Glu Arg Leu Lys Gln1 5 10 15gtc aac gtt aac acc gtt ttc ggt ttg cca ggt gac ttc aac ttg tcc 96Val Asn Val Asn Thr Val Phe Gly Leu Pro Gly Asp Phe Asn Leu Ser20 25 30ttg ttg gac aag atc tac gaa gtt gaa ggt atg aga tgg gct ggt aac144Leu Leu Asp Lys Ile Tyr Glu Val Glu Gly Met Arg Trp Ala Gly Asn35 40 45gcc aac gaa ttg aac gct gct tac gcc gct gat ggt tac gct cgt atc192Ala Asn Glu Leu Asn Ala Ala Tyr Ala Ala Asp Gly Tyr Ala Arg Ile50 55 60aag ggt atg tct tgt atc atc acc acc ttc ggt gtc ggt gaa ttg tct240Lys Gly Met Ser Cys Ile Ile Thr Thr Phe Gly Val Gly Glu Leu Ser65 70 75 80gct ttg aac ggt att gcc ggt tct tac gct gaa cac gtc ggt gtt ttg288Ala Leu Asn Gly Ile Ala Gly Ser Tyr Ala Glu His Val Gly Val Leu85 90 95cac gtt gtt ggt gtc cca tcc atc tct gct caa gct aag caa ttg ttg336His Val Val Gly Val Pro Ser Ile Ser Ala Gln Ala Lys Gln Leu Leu100 105 110ttg cac cac acc ttg ggt aac ggt gac ttc act gtt ttc cac aga atg384Leu His His Thr Leu Gly Asn Gly Asp Phe Thr Val Phe His Arg Met
      115 120 125tct gcc aac att tct gaa acc act gct atg atc act gac att gct acc 432Ser Ala Asn Ile Ser Glu Thr Thr Ala Met Ile Thr Asp Ile Ala Thr130 135 140gcc cca gct gaa att gac aga tgt atc aga acc act tac gtc acc caa 480Ala Pro Ala Glu Ile Asp Arg Cys Ile Arg Thr Thr Tyr Val Thr Gln145 150 155 160aga cca gtc tac tta ggt ttg cca gct aac ttg gtc gac ttg aac gtc 528Arg Pro Val Tyr Leu Gly Leu Pro Ala Asn Leu Val Asp Leu Asn Val165 170 175cca gct aag ttg ttg caa act cca att gac atg tct ttg aag cca aac 576Pro Ala Lys Leu Leu Gln Thr Pro Ile Asp Met Ser Leu Lys Pro Asn180 185 190gat gct gaa tcc gaa aag gaa gtc att gac acc atc ttg gct ttg gtc 624Asp Ala Glu Ser Glu Lys Glu Val Ile Asp Thr Ile Leu Ala Leu Val195 200 205aag gat gct aag aac cca gtt atc ttg gct gat gct tgt tgt tcc aga 672Lys Asp Ala Lys Asn Pro Val Ile Leu Ala Asp Ala Cys Cys Ser Arg210 215 220cac gac gtc aag gct gaa act aag aag ttg att gac ttg act caa ttc 720His Asp Val Lys Ala Glu Thr Lys Lys Leu Ile Asp Leu Thr Gln Phe225 230 235 240cca gct ttc gtc acc cca atg ggt aag ggt tcc att gac gaa caa cac 768Pro Ala Phe Val Thr Pro Met Gly Lys Gly Ser Ile Asp Glu Gln His245 250 255cca aga tac ggt ggt gtt tac gtc ggt acc ttg tcc aag cca gaa gtt 816Pro Arg Tyr Gly Gly Val Tyr Val Gly Thr Leu Ser Lys Pro Glu Val260 265 270aag gaa gcc gtt gaa tct gct gac ttg att ttg tct gtc ggt gct ttg 864Lys Glu Ala Val Glu Ser Ala Asp Leu Ile Leu Ser Val Gly Ala Leu275 280 285ttg tct gat ttc aac acc ggt tct ttc tct tac tct tac aag acc aag 912Leu Ser Asp Phe Asn Thr Gly Ser Phe Ser Tyr Ser Tyr Lys Thr Lys290 295 300aac att gtc gaa ttc cac tcc gac cac atg aag atc aga aac gcc act 960Asn Ile Val Glu Phe His Ser Asp His Met Lys Ile Arg Asn Ala Thr305 310 315 320ttc cca ggt gtc caa atg aaa ttc gtt ttg caa aag ttg ttg acc act 1008Phe Pro Gly Val Gln Met Lys Phe Val Leu Gln Lys Leu Leu Thr Thr325 330 335att gct gac gcc gct aag ggt tac aag cca gtt gct gtc cca gct aga 1056Ile Ala Asp Ala Ala Lys Gly Tyr Lys Pro Val Ala Val Pro Ala Arg340 345 350act cca gct aac gct gct gtc cca gct tct acc cca ttg aag caa gaa 1104
      Thr Pro Ala Asn Ala Ala Val Pro Ala Ser Thr Pro Leu Lys Gln Glu355 360 365tgg atg tgg aac caa ttg ggt aac ttc ttg caa gaa ggt gat gtt gtc 1152Trp Met Trp Asn Gln Leu Gly Asn Phe Leu Gln Glu Gly Asp Val Val370 375 380att gct gaa acc ggt acc tcc gct ttc ggt atc aac caa acc act ttc 1200Ile Ala Glu Thr Gly Thr Ser Ala Phe Gly Ile Asn Gln Thr Thr Phe385 390 395 400cca aac aac acc tac ggt atc tct caa gtc tta tgg ggt tcc att ggt 1248Pro Asn Asn Thr Tyr Gly Ile Ser Gln Val Leu Trp Gly Ser Ile Gly405 410 415ttc acc act ggt gct acc ttg ggt gct gct ttc gct gct gaa gaa att 1296Phe Thr Thr Gly Ala Thr Leu Gly Ala Ala Phe Ala Ala Glu Glu Ile420 425 430gat cca aag aag aga gtt atc tta ttc att ggt gac ggt tct ttg caa 1344Asp Pro Lys Lys Arg Val Ile Leu Phe Ile Gly Asp Gly Ser Leu Gln435 440 445ttg act gtt caa gaa atc tcc acc atg atc aga tgg ggc ttg aag cca 1392Leu Thr Val Gln Glu Ile Ser Thr Met Ile Arg Trp Gly Leu Lys Pro450 455 460tac ttg ttc gtc ttg aac aac gat ggt tac acc att gaa aag ttg att 1440Tyr Leu Phe Val Leu Asn Asn Asp Gly Tyr Thr Ile Glu Lys Leu Ile465 470 475 480cac ggt cca aag gct caa tac aac gaa att caa ggt tgg gac cac cta 1488His Gly Pro Lys Ala Gln Tyr Asn Glu Ile Gln Gly Trp Asp His Leu485 490 495tcc ttg ttg cca act ttc ggt gct aag gac tat gaa acc cac aga gtc 1536Ser Leu Leu Pro Thr Phe Gly Ala Lys Asp Tyr Glu Thr His Arg Val500 505 510gct acc acc ggt gaa tgg gac aag ttg acc caa gac aag tct ttc aac 1584Ala Thr Thr Gly Glu Trp Asp Lys Leu Thr Gln Asp Lys Ser Phe Asn515 520 525gac aac tct aag atc aga atg att gaa atc atg ttg cca gtc ttc gat 1632Asp Asn Ser Lys Ile Arg Met Ile Glu Ile Met Leu Pro Val Phe Asp530 535 540gct cca caa aac ttg gtt gaa caa gct aag ttg act gct gct acc aac 1680Ala Pro Gln Asn Leu Val Glu Gln Ala Lys Leu Thr Ala Ala Thr Asn545 550 555 560gct aag caa taa 1692Ala Lys Gln&lt;210&gt;21&lt;211&gt;563
      &lt;212&gt;PRT&lt;213&gt;釀酒酵母&lt;400&gt;21Met Ser Glu Ile Thr Leu Gly Lys Tyr Leu Phe Glu Arg Leu Lys Gln1 5 10 15Val Asn Val Asn Thr Val Phe Gly Leu Pro Gly Asp Phe Asn Leu Ser20 25 30Leu Leu Asp Lys Ile Tyr Glu Val Glu Gly Met Arg Trp Ala Gly Asn35 40 45Ala Asn Glu Leu Asn Ala Ala Tyr Ala Ala Asp Gly Tyr Ala Arg Ile50 55 60Lys Gly Met Ser Cys Ile Ile Thr Thr Phe Gly Val Gly Glu Leu Ser65 70 75 80Ala Leu Asn Gly Ile Ala Gly Ser Tyr Ala Glu His Val Gly Val Leu85 90 95His Val Val Gly Val Pro Ser Ile Ser Ala Gln Ala Lys Gln Leu Leu100 105 110Leu His His Thr Leu Gly Asn Gly Asp Phe Thr Val Phe His Arg Met115 120 125Ser Ala Asn Ile Ser Glu Thr Thr Ala Met Ile Thr Asp Ile Ala Thr130 135 140Ala Pro Ala Glu Ile Asp Arg Cys Ile Arg Thr Thr Tyr Val Thr Gln145 150 155 160Arg Pro Val Tyr Leu Gly Leu Pro Ala Asn Leu Val Asp Leu Asn Val165 170 175Pro Ala Lys Leu Leu Gln Thr Pro Ile Asp Met Ser Leu Lys Pro Asn180 185 190Asp Ala Glu Ser Glu Lys Glu Val Ile Asp Thr Ile Leu Ala Leu Val195 200 205
      Lys Asp Ala Lys Asn Pro Val Ile Leu Ala Asp Ala Cys Cys Ser Arg210 215 220His Asp Val Lys Ala Glu Thr Lys Lys Leu Ile Asp Leu Thr Gln Phe225 230 235 240Pro Ala Phe Val Thr Pro Met Gly Lys Gly Ser Ile Asp Glu Gln His245 250 255Pro Arg Tyr Gly Gly Val Tyr Val Gly Thr Leu Ser Lys Pro Glu Val260 265 270Lys Glu Ala Val Glu Ser Ala Asp Leu Ile Leu Ser Val Gly Ala Leu275 280 285Leu Ser Asp Phe Asn Thr Gly Ser Phe Ser Tyr Ser Tyr Lys Thr Lys290 295 300Asn Ile Val Glu Phe His Ser Asp His Met Lys Ile Arg Asn Ala Thr305 310 315 320Phe Pro Gly Val Gln Met Lys Phe Val Leu Gln Lys Leu Leu Thr Thr325 330 335Ile Ala Asp Ala Ala Lys Gly Tyr Lys Pro Val Ala Val Pro Ala Arg340 345 350Thr Pro Ala Asn Ala Ala Val Pro Ala Ser Thr Pro Leu Lys Gln Glu355 360 365Trp Met Trp Asn Gln Leu Gly Asn Phe Leu Gln Glu Gly Asp Val Val370 375 380Ile Ala Glu Thr Gly Thr Ser Ala Phe Gly Ile Asn Gln Thr Thr Phe385 390 395 400Pro Asn Asn Thr Tyr Gly Ile Ser Gln Val Leu Trp Gly Ser Ile Gly405 410 415Phe Thr Thr Gly Ala Thr Leu Gly Ala Ala Phe Ala Ala Glu Glu Ile420 425 430Asp Pro Lys Lys Arg Val Ile Leu Phe Ile Gly Asp Gly Ser Leu Gln
      435 440 445Leu Thr Val Gln Glu Ile Ser Thr Met Ile Arg Trp Gly Leu Lys Pro450 455 460Tyr Leu Phe Val Leu Asn Asn Asp Gly Tyr Thr Ile Glu Lys Leu Ile465 470 475 480His Gly Pro Lys Ala Gln Tyr Asn Glu Ile Gln Gly Trp Asp His Leu485 490 495Ser Leu Leu Pro Thr Phe Gly Ala Lys Asp Tyr Glu Thr His Arg Val500 505 510Ala Thr Thr Gly Glu Trp Asp Lys Leu Thr Gln Asp Lys Ser Phe Asn515 520 525Asp Asn Ser Lys Ile Arg Met Ile Glu Ile Met Leu Pro Val Phe Asp530 535 540Ala Pro Gln Asn Leu Val Glu Gln Ala Lys Leu Thr Ala Ala Thr Asn545 550 555 560Ala Lys Gln&lt;210&gt;22&lt;211&gt;33&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;人工序列&lt;400&gt;22tctttaatta atgggttgtc cgtcattcat ata 33&lt;210&gt;23&lt;211&gt;32&lt;212&gt;DNA
      &lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;人工序列&lt;400&gt;23ctaaagcttt taggccagag tggtcttgcg cg 32&lt;210&gt;24&lt;211&gt;1674&lt;212&gt;DNA&lt;213&gt;巴氏醋桿菌(Acetobacter pasteurianus)&lt;220&gt;
      &lt;221&gt;CDS&lt;222&gt;(1)..(1674)&lt;223&gt;
      &lt;400&gt;24gtg acc tat act gtt ggc atg tat ctt gca gaa cgc ctt gta cag atc 48Val Thr Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Val Gln Ile1 5 10 15ggg ctg aag cat cac ttc gcc gtg ggc ggc gac tac aat ctc gtt ctt 96Gly Leu Lys His His Phe Ala Val Gly Gly Asp Tyr Asn Leu Val Leu20 25 30ctg gat cag ttg ctc ctc aac aag gac atg aaa cag atc tat tgc tgc144Leu Asp Gln Leu Leu Leu Asn Lys Asp Met Lys Gln Ile Tyr Cys Cys35 40 45aat gag ttg aac tgt ggc ttc agc gcg gaa ggc tac gcc cgt tct aac192Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ser Asn50 55 60ggg gct gcg gca gcg gtt gtc acc ttc agc gtt ggc gcc att tcc gcc240Gly Ala Ala Ala Ala Val Val Thr Phe Ser Val Gly Ala Ile Ser Ala65 70 75 80atg aac gcc ctc ggc ggc gcc tat gcc gaa aac ctg ccg gtt atc ctg288Met Asn Ala Leu Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu85 90 95att tcc ggc gcg ccc aac agc aat gat cag ggc aca ggt cat atc ctg336Ile Ser Gly Ala Pro Asn Ser Asn Asp Gln Gly Thr Gly His Ile Leu
      100 105 110cat cac aca atc ggc aag acg gat tac agc tac cag ctt gaa atg gcc 384His His Thr Ile Gly Lys Thr Asp Tyr Ser Tyr Gln Leu Glu Met Ala115 120 125cgt cag gtc acc tgt gcc gcc gaa agc att acc gac gct cac tcc gcc 432Arg Gln Val Thr Cys Ala Ala Glu Ser Ile Thr Asp Ala His Ser Ala130 135 140ccg gcc aag att gac cac gtc att cgc acg gcg ctg cgc gag cgt aag 480Pro Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys145 150 155 160ccg gcc tat ctg gac atc gcg tgc aac att gcc tcc gag ccc tgc gtg 528Pro Ala Tyr Leu Asp Ile Ala Cys Asn Ile Ala Ser Glu Pro Cys Val165 170 175cgg cct ggc cct gtc agc agc ctg ctg tcc gag cct gaa atc gac cac 576Arg Pro Gly Pro Val Ser Ser Leu Leu Ser Glu Pro Glu Ile Asp His180 185 190acg agc ctg aag gcc gca gtg gac gcc acg gtt gcc ttg ctg aaa aat 624Thr Ser Leu Lys Ala Ala Val Asp Ala Thr Val Ala Leu Leu Lys Asn195 200 205cgg cca gcc ccc gtc atg ctg ctg ggc agc aag ctg cgg gcc gcc aac 672Arg Pro Ala Pro Val Met Leu Leu Gly Ser Lys Leu Arg Ala Ala Asn210 215 220gca ctg gcc gca acc gaa acg ctg gca gac aag ctg caa tgc gcg gtg 720Ala Leu Ala Ala Thr Glu Thr Leu Ala Asp Lys Leu Gln Cys Ala Val225 230 235 240acc atc atg gcg gcc gcg aaa ggc ttt ttc ccc gaa gac cac gcg ggt 768Thr Ile Met Ala Ala Ala Lys Gly Phe Phe Pro Glu Asp His Ala Gly245 250 255ttc cgc ggc ctg tac tgg ggc gaa gtc tcg aac ccc ggc gtg cag gaa 816Phe Arg Gly Leu Tyr Trp Gly Glu Val Ser Asn Pro Gly Val Gln Glu260 265 270ctg gtg gag acc tcc gac gca ctg ctg tgc atc gcc ccc gta ttc aac 864Leu Val Glu Thr Ser Asp Ala Leu Leu Cys Ile Ala Pro Val Phe Asn275 280 285gac tat tca aca gtc ggc tgg tcg ggc atg ccc aag ggc ccc aat gtg 912Asp Tyr Ser Thr Val Gly Trp Ser Gly Met Pro Lys Gly Pro Asn Val290 295 300att ctg gct gag ccc gac cgc gta acg gtc gat ggc cgc gcc tat gac 960Ile Leu Ala Glu Pro Asp Arg Val Thr Val Asp Gly Arg Ala Tyr Asp305 310 315 320ggc ttt acc ctg cgc gcc ttc ctg cag gct ctg gcg gaa aaa gcc ccc 1008Gly Phe Thr Leu Arg Ala Phe Leu Gln Ala Leu Ala Glu Lys Ala Pro325 330 335gcg cgc ccg gcc tcc gca cag aaa agc agc gtc ccg acg tgc tcg ctc 1056
      Ala Arg Pro Ala Ser Ala Gln Lys Ser Ser Val Pro Thr Cys Ser Leu340 345 350acc gcg aca tcc gat gaa gcc ggt ctg acg aat gac gaa atc gtc cgt 1104Thr Ala Thr Ser Asp Glu Ala Gly Leu Thr Asn Asp Glu Ile Val Arg355 360 365cat atc aac gcc ctg ctg aca tca aac acg acg ctg gtg gca gaa acc 1152His Ile Asn Ala Leu Leu Thr Ser Asn Thr Thr Leu Val Ala Glu Thr370 375 380ggc gat tca tgg ttc aat gcc atg cgc atg acc ctg gcc ggt gcg cgc 1200Gly Asp Ser Trp Phe Asn Ala Met Arg Met Thr Leu Ala Gly Ala Arg385 390 395 400gtg gaa ctg gaa atg cag tgg ggc cat atc ggc tgg tcc gtg ccc tcc 1248Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser405 410 415gcg ttc ggc aat gcc atg ggc tcg cag gac cgc cag cat gtg gtg atg 1296Ala Phe Gly Asn Ala Met Gly Ser Gln Asp Arg Gln His Val Val Met420 425 430gta ggc gat ggc tcc ttc cag ctt acc gcg cag gaa gtg gct cag atg 1344Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met435 440 445gtg cgc tac gaa ctg ccc gtc att atc ttt ctg atc aac aac cgt ggc 1392Val Arg Tyr Glu Leu Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly450 455 460tat gtc att gaa atc gcc att cat gac ggc ccg tac aac tat atc aag 1440Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys465 470 475 480aac tgg gat tac gcc ggc ctg atg gaa gtc ttc aac gcc gga gaa ggc 1488Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe Asn Ala Gly Glu Gly485 490 495cat gga ctt ggc ctg aaa gcc acc acc ccg aag gaa ctg aca gaa gcc 1536His Gly Leu Gly Leu Lys Ala Thr Thr Pro Lys Glu Leu Thr Glu Ala500 505 510atc gcc agg gca aaa gcc aat acc cgc ggc ccg acg ctg atc gaa tgc 1584Ile Ala Arg Ala Lys Ala Asn Thr Arg Gly Pro Thr Leu Ile Glu Cys515 520 525cag atc gac cgc acg gac tgc acg gat atg ctg gtt caa tgg ggc cgc 1632Gln Ile Asp Arg Thr Asp Cys Thr Asp Met Leu Val Gln Trp Gly Arg530 535 540aag gtt gcc tca acc aac gcg cgc aag acc act ctg gcc tga 1674Lys Val Ala Ser Thr Asn Ala Arg Lys Thr Thr Leu Ala545 550 555&lt;210&gt;25&lt;211&gt;557
      &lt;212&gt;PRT&lt;213&gt;巴氏醋桿菌&lt;400&gt;25Val Thr Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Val Gln Ile1 5 10 15Gly Leu Lys His His Phe Ala Val Gly Gly Asp Tyr Asn Leu Val Leu20 25 30Leu Asp Gln Leu Leu Leu Asn Lys Asp Met Lys Gln Ile Tyr Cys Cys35 40 45Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ser Asn50 55 60Gly Ala Ala Ala Ala Val Val Thr Phe Ser Val Gly Ala Ile Ser Ala65 70 75 80Met Asn Ala Leu Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu85 90 95Ile Ser Gly Ala Pro Asn Ser Asn Asp Gln Gly Thr Gly His Ile Leu100 105 110His His Thr Ile Gly Lys Thr Asp Tyr Ser Tyr Gln Leu Glu Met Ala115 120 125Arg Gln Val Thr Cys Ala Ala Glu Ser Ile Thr Asp Ala His Ser Ala130 135 140Pro Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys145 150 155 160Pro Ala Tyr Leu Asp Ile Ala Cys Asn Ile Ala Ser Glu Pro Cys Val165 170 175Arg Pro Gly Pro Val Ser Ser Leu Leu Ser Glu Pro Glu Ile Asp His180 185 190Thr Ser Leu Lys Ala Ala Val Asp Ala Thr Val Ala Leu Leu Lys Asn195 200 205
      Arg Pro Ala Pro Val Met Leu Leu Gly Ser Lys Leu Arg Ala Ala Asn210 215 220Ala Leu Ala Ala Thr Glu Thr Leu Ala Asp Lys Leu Gln Cys Ala Val225 230 235 240Thr Ile Met Ala Ala Ala Lys Gly Phe Phe Pro Glu Asp His Ala Gly245 250 255Phe Arg Gly Leu Tyr Trp Gly Glu Val Ser Asn Pro Gly Val Gln Glu260 265 270Leu Val Glu Thr Ser Asp Ala Leu Leu Cys Ile Ala Pro Val Phe Asn275 280 285Asp Tyr Ser Thr Val Gly Trp Ser Gly Met Pro Lys Gly Pro Asn Val290 295 300Ile Leu Ala Glu Pro Asp Arg Val Thr Val Asp Gly Arg Ala Tyr Asp305 310 315 320Gly Phe Thr Leu Arg Ala Phe Leu Gln Ala Leu Ala Glu Lys Ala Pro325 330 335Ala Arg Pro Ala Ser Ala Gln Lys Ser Ser Val Pro Thr Cys Ser Leu340 345 350Thr Ala Thr Ser Asp Glu Ala Gly Leu Thr Asn Asp Glu Ile Val Arg355 360 365His Ile Asn Ala Leu Leu Thr Ser Asn Thr Thr Leu Val Ala Glu Thr370 375 380Gly Asp Ser Trp Phe Asn Ala Met Arg Met Thr Leu Ala Gly Ala Arg385 390 395 400Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser405 410 415Ala Phe Gly Asn Ala Met Gly Ser Gln Asp Arg Gln His Val Val Met420 425 430Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met
      435 440 445Val Arg Tyr Glu Leu Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly450 455 460Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys465 470 475 480Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe Asn Ala Gly Glu Gly485 490 495His Gly Leu Gly Leu Lys Ala Thr Thr Pro Lys Glu Leu Thr Glu Ala500 505 510Ile Ala Arg Ala Lys Ala Asn Thr Arg Gly Pro Thr Leu Ile Glu Cys515 520 525Gln Ile Asp Arg Thr Asp Cys Thr Asp Met Leu Val Gln Trp Gly Arg530 535 540Lys Val Ala Ser Thr Asn Ala Arg Lys Thr Thr Leu Ala545 550 555&lt;210&gt;26&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;人工序列&lt;400&gt;26atcttaatta atgtataccg ttggtatgta ct 32&lt;210&gt;27&lt;211&gt;34&lt;212&gt;DNA&lt;213&gt;人工序列
      &lt;220&gt;
      &lt;223&gt;人工序列&lt;400&gt;27tatgcggccg cttacgcttg tggtttgcga gagt34&lt;210&gt;28&lt;211&gt;1671&lt;212&gt;DNA&lt;213&gt;棕櫚發(fā)酵細(xì)菌(Zymobacter palmae)&lt;220&gt;
      &lt;221&gt;CDS&lt;222&gt;(1)..(1671)&lt;223&gt;
      &lt;400&gt;28atg tat acc gtt ggt atg tac ttg gca gaa cgc cta gcc cag atc ggc 48Met Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Ala Gln Ile Gly1 5 10 15ctg aaa cac cac ttt gcc gtg gcc ggt gac tac aac ctg gtg ttg ctt 96Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu Leu20 25 30gat cag ctc ctg ctg aac aaa gac atg gag cag gtc tac tgc tgt aac144Asp Gln Leu Leu Leu Asn Lys Asp Met Glu Gln Val Tyr Cys Cys Asn35 40 45gaa ctt aac tgc ggc ttt agc gcc gaa ggt tac gct cgt gca cgt ggt192Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Arg Gly50 55 60gcc gcc gct gcc atc gtc acg ttc agc gta ggt gct atc tct gca atg240Ala Ala Ala Ala Ile Val Thr Phe Ser Val Gly Ala Ile Ser Ala Met65 70 75 80aac gcc atc ggt ggc gcc tat gca gaa aac ctg ccg gtc atc ctg atc288Asn Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu Ile85 90 95tct ggc tca ccg aac acc aat gac tac ggc aca ggc cac atc ctg cac336Ser Gly Ser Pro Asn Thr Asn Asp Tyr Gly Thr Gly His Ile Leu His100 105 110cac acc att ggt act act gac tat aac tat cag ctg gaa atg gta aaa384His Thr Ile Gly Thr Thr Asp Tyr Asn Tyr Gln Leu Glu Met Val Lys
      115 120 125cac gtt acc tgc gca cgt gaa agc atc gtt tct gcc gaa gaa gca ccg 432His Val Thr Cys Ala Arg Glu Ser Ile Val Ser Ala Glu Glu Ala Pro130 135 140gca aaa atc gac cac gtc atc cgt acg gct cta cgt gaa cgc aaa ccg 480Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys Pro145 150 155 160gct tat ctg gaa atc gca tgc aac gtc gct ggc gct gaa tgt gtt cgt 528Ala Tyr Leu Glu Ile Ala Cys Asn Val Ala Gly Ala Glu Cys Val Arg165 170 175ccg ggc ccg atc aat agc ctg ctg cgt gaa ctc gaa gtt gac cag acc 576Pro Gly Pro Ile Asn Ser Leu Leu Arg Glu Leu Glu Val Asp Gln Thr180 185 190agt gtc act gcc gct gta gat gcc gcc gta gaa tgg ctg cag gac cgc 624Ser Val Thr Ala Ala Val Asp Ala Ala Val Glu Trp Leu Gln Asp Arg195 200 205cag aac gtc gtc atg ctg gtc ggt agc aaa ctg cgt gcc gct gcc gct 672Gln Asn Val Val Met Leu Val Gly Ser Lys Leu Arg Ala Ala Ala Ala210 215 220gaa aaa cag gct gtt gcc cta gcg gac cgc ctg ggc tgc gct gtc acg 720Glu Lys Gln Ala Val Ala Leu Ala Asp Arg Leu Gly Cys Ala Val Thr225 230 235 240atc atg gct gcc gaa aaa ggc ttc ttc ccg gaa gat cat ccg aac ttc 768Ile Met Ala Ala Glu Lys Gly Phe Phe Pro Glu Asp His Pro Asn Phe245 250 255cgc ggc ctg tac tgg ggt gaa gtc agc tcc gaa ggt gca cag gaa ctg 816Arg Gly Leu Tyr Trp Gly Glu Val Ser Ser Glu Gly Ala Gln Glu Leu260 265 270gtt gaa aac gcc gat gcc atc ctg tgt ctg gca ccg gta ttc aac gac 864Val Glu Asn Ala Asp Ala Ile Leu Cys Leu Ala Pro Val Phe Asn Asp275 280 285tat gct acc gtt ggc tgg aac tcc tgg ccg aaa ggc gac aat gtc atg 912Tyr Ala Thr Val Gly Trp Asn Ser Trp Pro Lys Gly Asp Asn Val Met290 295 300gtc atg gac acc gac cgc gtc act ttc gca gga cag tcc ttc gaa ggt 960Val Met Asp Thr Asp Arg Val Thr Phe Ala Gly Gln Ser Phe Glu Gly305 310 315 320ctg tca ttg agc acc ttc gcc gca gca ctg gct gag aaa gca cct tct 1008Leu Ser Leu Ser Thr Phe Ala Ala Ala Leu Ala Glu Lys Ala Pro Ser325 330 335cgc ccg gca acg act caa ggc act caa gca ccg gta ctg ggt att gag 1056Arg Pro Ala Thr Thr Gln Gly Thr Gln Ala Pro Val Leu Gly Ile Glu340 345 350gcc gca gag ccc aat gca ccg ctg acc aat gac gaa atg acg cgt cag 1104
      Ala Ala Glu Pro Asn Ala Pro Leu Thr Asn Asp Glu Met Thr Arg Gln355 360 365atc cag tcg ctg atc act tcc gac act act ctg aca gca gaa aca ggt1152Ile Gln Ser Leu Ile Thr Ser Asp Thr Thr Leu Thr Ala Glu Thr Gly370 375 380gac tct tgg ttc aac gct tct cgc atg ccg att cct ggc ggt gct cgt1200Asp Ser Trp Phe Asn Ala Ser Arg Met Pro Ile Pro Gly Gly Ala Arg385 390 395 400gtc gaa ctg gaa atg caa tgg ggt cat atc ggt tgg tcc gta cct tct1248Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser405 410 415gca ttc ggt aac gcc gtt ggt tct ccg gag cgt cgc cac atc atg atg1296Ala Phe Gly Asn Ala Val Gly Ser Pro Glu Arg Arg His Ile Met Met420 425 430gtc ggt gat ggc tct ttc cag ctg act gct caa gaa gtt gct cag atg1344Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met435 440 445atc cgc tat gaa atc ccg gtc atc atc ttc ctg atc aac aac cgc ggt1392Ile Arg Tyr Glu Ile Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly450 455 460tac gtc atc gaa atc gct atc cat gac ggc cct tac aac tac atc aaa1440Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys465 470 475 480aac tgg aac tac gct ggc ctg atc gac gtc ttc aat gac gaa gat ggt1488Asn Trp Asn Tyr Ala Gly Leu Ile Asp Val Phe Asn Asp Glu Asp Gly485 490 495cat ggc ctg ggt ctg aaa gct tct act ggt gca gaa cta gaa ggc gct1536His Gly Leu Gly Leu Lys Ala Ser Thr Gly Ala Glu Leu Glu Gly Ala500 505 510atc aag aaa gca ctc gac aat cgt cgc ggt ccg acg ctg atc gaa tgt1584Ile Lys Lys Ala Leu Asp Asn Arg Arg Gly Pro Thr Leu Ile Glu Cys515 520 525aac atc gct cag gac gac tgc act gaa acc ctg att gct tgg ggt aaa1632Asn Ile Ala Gln Asp Asp Cys Thr Glu Thr Leu Ile Ala Trp Gly Lys530 535 540cgt gta gca gct acc aac tct cgc aaa cca caa gcg taa1671Arg Val Ala Ala Thr Asn Ser Arg Lys Pro Gln Ala545 550 555&lt;210&gt;29&lt;211&gt;556&lt;212&gt;PRT&lt;213&gt;棕櫚發(fā)酵細(xì)菌
      &lt;400&gt;29Met Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Ala Gln Ile Gly1 5 10 15Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu Leu20 25 30Asp Gln Leu Leu Leu Asn Lys Asp Met Glu Gln Val Tyr Cys Cys Asn35 40 45Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Arg Gly50 55 60Ala Ala Ala Ala Ile Val Thr Phe Ser Val Gly Ala Ile Ser Ala Met65 70 75 80Asn Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu Ile85 90 95Ser Gly Ser Pro Asn Thr Asn Asp Tyr Gly Thr Gly His Ile Leu His100 105 110His Thr Ile Gly Thr Thr Asp Tyr Asn Tyr Gln Leu Glu Met Val Lys115 120 125His Val Thr Cys Ala Arg Glu Ser Ile Val Ser Ala Glu Glu Ala Pro130 135 140Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys Pro145 150 155 160Ala Tyr Leu Glu Ile Ala Cys Asn Val Ala Gly Ala Glu Cys Val Arg165 170 175Pro Gly Pro Ile Asn Ser Leu Leu Arg Glu Leu Glu Val Asp Gln Thr180 185 190Ser Val Thr Ala Ala Val Asp Ala Ala Val Glu Trp Leu Gln Asp Arg195 200 205Gln Asn Val Val Met Leu Val Gly Ser Lys Leu Arg Ala Ala Ala Ala210 215 220
      Glu Lys Gln Ala Val Ala Leu Ala Asp Arg Leu Gly Cys Ala Val Thr225 230 235 240Ile Met Ala Ala Glu Lys Gly Phe Phe Pro Glu Asp His Pro Asn Phe245 250 255Arg Gly Leu Tyr Trp Gly Glu Val Ser Ser Glu Gly Ala Gln Glu Leu260 265 270Val Glu Asn Ala Asp Ala Ile Leu Cys Leu Ala Pro Val Phe Asn Asp275 280 285Tyr Ala Thr Val Gly Trp Asn Ser Trp Pro Lys Gly Asp Asn Val Met290 295 300Val Met Asp Thr Asp Arg Val Thr Phe Ala Gly Gln Ser Phe Glu Gly305 310 315 320Leu Ser Leu Ser Thr Phe Ala Ala Ala Leu Ala Glu Lys Ala Pro Ser325 330 335Arg Pro Ala Thr Thr Gln Gly Thr Gln Ala Pro Val Leu Gly Ile Glu340 345 350Ala Ala Glu Pro Asn Ala Pro Leu Thr Asn Asp Glu Met Thr Arg Gln355 360 365Ile Gln Ser Leu Ile Thr Ser Asp Thr Thr Leu Thr Ala Glu Thr Gly370 375 380Asp Ser Trp Phe Asn Ala Ser Arg Met Pro Ile Pro Gly Gly Ala Arg385 390 395 400Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser405 410 415Ala Phe Gly Asn Ala Val Gly Ser Pro Glu Arg Arg His Ile Met Met420 425 430Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met435 440 445Ile Arg Tyr Glu Ile Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly
      450 455 460Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys465 470 475 480Asn Trp Asn Tyr Ala Gly Leu Ile Asp Val Phe Asn Asp Glu Asp Gly485 490 495His Gly Leu Gly Leu Lys Ala Ser Thr Gly Ala Glu Leu Glu Gly Ala500 505 510Ile Lys Lys Ala Leu Asp Asn Arg Arg Gly Pro Thr Leu Ile Glu Cys515 520 525Asn Ile Ala Gln Asp Asp Cys Thr Glu Thr Leu Ile Ala Trp Gly Lys530 535 540Arg Val Ala Ala Thr Asn Ser Arg Lys Pro Gln Ala545 550 555&lt;210&gt;30&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;人工序列&lt;400&gt;30ctattaatta atggcttcgg tacacggcac ca 32&lt;210&gt;31&lt;211&gt;34&lt;212&gt;DNA&lt;213&gt;人工序列&lt;400&gt;31tatgcggccg cttacttcac cgggcttacg gtgc34&lt;210&gt;32&lt;211&gt;1587
      &lt;212&gt;DNA&lt;213&gt;惡臭假單胞菌(Pseudomonas putida)&lt;220&gt;
      &lt;221&gt;CDS&lt;222&gt;(1)..(1584)&lt;223&gt;
      &lt;400&gt;32atg gct tcg gta cac ggc acc aca tac gaa ctc ttg cga cgt caa ggc 48Met Ala Ser Val His Gly Thr Thr Tyr Glu Leu Leu Arg Arg Gln Gly1 5 10 15atc gat acg gtc ttc ggc aat cct ggc tcg aac gag ctc ccg ttt ttg 96Ile Asp Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu20 25 30aag gac ttt cca gag gac ttt cga tac atc ctg gct ttg cag gaa gcg 144Lys Asp Phe Pro Glu Asp Phe Arg Tyr Ile Leu Ala Leu Gln Glu Ala35 40 45tgt gtg gtg ggc att gca gac ggc tat gcg caa gcc agt cgg aag ccg 192Cys Val Val Gly Ile Ala Asp Gly Tyr Ala Gln Ala Ser Arg Lys Pro50 55 60gct ttc att aac ctg cat tct gct gct ggt acc ggc aat gct atg ggt 240Ala Phe Ile Asn Leu His Ser Ala Ala Gly Thr Gly Asn Ala Met Gly65 70 75 80gca ctc agt aac gcc tgg aac tca cat tcc ccg ctg atc gtc act gcc 288Ala Leu Ser Asn Ala Trp Asn Ser His Ser Pro Leu Ile Val Thr Ala85 90 95ggc cag cag acc agg gcg atg att ggc gtt gaa gct ctg ctg acc aac 336Gly Gln Gln Thr Arg Ala Met Ile Gly Val Glu Ala Leu Leu Thr Asn100 105 110gtc gat gcc gcc aac ctg cca cga cca ctt gtc aaa tgg agc tac gag 384Val Asp Ala Ala Asn Leu Pro Arg Pro Leu Val Lys Trp Ser Tyr Glu115 120 125ccc gca agc gca gca gaa gtc cct cat gcg atg agc agg gct atc cat 432Pro Ala Ser Ala Ala Glu Val Pro His Ala Met Ser Arg Ala Ile His130 135 140atg gca agc atg gcg cca caa ggc cct gtc tat ctt tcg gtg cca tat 480Met Ala Ser Met Ala Pro Gln Gly Pro Val Tyr Leu Ser Val Pro Tyr145 150 155 160gac gat tgg gat aag gat gct gat cct cag tcc cac cac ctt ttt gat 528Asp Asp Trp Asp Lys Asp Ala Asp Pro Gln Ser His His Leu Phe Asp
      165 170 175cgc cat gtc agt tca tca gta cgc ctg aac gac cag gat ctc gat att 576Arg His Val Ser Ser Ser Val Arg Leu Asn Asp Gln Asp Leu Asp Ile180 185 190ctg gtg aaa gct ctc aac agc gca tcc aac ccg gcg atc gtc ctg ggc 624Leu Val Lys Ala Leu Asn Ser Ala Ser Asn Pro Ala Ile Val Leu Gly195 200 205ccg gac gtc gac gca gca aat gcg aac gca gac tgc gtc atg ttg gcc 672Pro Asp Val Asp Ala Ala Asn Ala Asn Ala Asp Cys Val Met Leu Ala210 215 220gaa cgc ctc aaa gct ccg gtt tgg gtt gcg cca tcc gct cca cgc tgc 720Glu Arg Leu Lys Ala Pro Val Trp Val Ala Pro Ser Ala Pro Arg Cys225 230 235 240cca ttc cct acc cgt cat cct tgc ttc cgt gga ttg atg cca gct ggc 768Pro Phe Pro Thr Arg His Pro Cys Phe Arg Gly Leu Met Pro Ala Gly245 250 255atc gca gcg att tct cag ctg ctc gaa ggt cac gat gtg gtt ttg gta 816Ile Ala Ala Ile Ser Gln Leu Leu Glu Gly His Asp Val Val Leu Val260 265 270atc ggc gct cca gtg ttc cgt tac cac caa tac gac cca ggt caa tat 864Ile Gly Ala Pro Val Phe Arg Tyr His Gln Tyr Asp Pro Gly Gln Tyr275 280 285ctc aaa cct ggc acg cga ttg att tcg gtg acc tgc gac ccg ctc gaa 912Leu Lys Pro Gly Thr Arg Leu Ile Ser Val Thr Cys Asp Pro Leu Glu290 295 300gct gca cgc gcg cca atg ggc gat gcg atc gtg gca gac att ggt gcg 960Ala Ala Arg Ala Pro Met Gly Asp Ala Ile Val Ala Asp Ile Gly Ala305 310 315 320atg gct agc gct ctt gcc aac ttg gtt gaa gag agc agc cgc cag ctc 1008Met Ala Ser Ala Leu Ala Asn Leu Val Glu Glu Ser Ser Arg Gln Leu325 330 335cca act gca gct ccg gaa ccc gcg aag gtt gac caa gac gct ggc cga 1056Pro Thr Ala Ala Pro Glu Pro Ala Lys Val Asp Gln Asp Ala Gly Arg340 345 350ctt cac cca gag aca gtg ttc gac aca ctg aac gac atg gcc ccg gag 1104Leu His Pro Glu Thr Val Phe Asp Thr Leu Asn Asp Met Ala Pro Glu355 360 365aat gcg att tac ctg aac gag tcg act tca acg acc gcc caa atg tgg 1152Asn Ala Ile Tyr Leu Asn Glu Ser Thr Ser Thr Thr Ala Gln Met Trp370 375 380cag cgc ctg aac atg cgc aac cct ggt agc tac tac ttc tgt gca gct 1200Gln Arg Leu Asn Met Arg Asn Pro Gly Ser Tyr Tyr Phe Cys Ala Ala385 390 395 400ggc gga ctg ggc ttc gcc ctg cct gca gca att ggc gtt caa ctc gca 1248
      Gly Gly Leu Gly Phe Ala Leu Pro Ala Ala Ile Gly Val Gln Leu Ala405 410 415gaa ccc gag cga caa gtc atc gcc gtc att ggc gac gga tcg gcg aac 1296Glu Pro Glu Arg Gln Val Ile Ala Val Ile Gly Asp Gly Ser Ala Asn420 425 430tac agc att agt gcg ttg tgg act gca gct cag tac aac atc ccc act 1344Tyr Ser Ile Ser Ala Leu Trp Thr Ala Ala Gln Tyr Asn Ile Pro Thr435 440 445atc ttc gtg atc atg aac aac ggc acc tac ggt gcg ttg cga tgg ttt 1392Ile Phe Val Ile Met Asn Asn Gly Thr Tyr Gly Ala Leu Arg Trp Phe450 455 460gcc ggc gtt ctc gaa gca gaa aac gtt cct ggg ctg gat gtg cca ggg 1440Ala Gly Val Leu Glu Ala Glu Asn Val Pro Gly Leu Asp Val Pro Gly465 470 475 480atc gac ttc cgc gca ctc gcc aag ggc tat ggt gtc caa gcg ctg aaa 1488Ile Asp Phe Arg Ala Leu Ala Lys Gly Tyr Gly Val Gln Ala Leu Lys485 490 495gcc gac aac ctt gag cag ctc aag ggt tcg cta caa gaa gcg ctt tct 1536Ala Asp Asn Leu Glu Gln Leu Lys Gly Ser Leu Gln Glu Ala Leu Ser500 505 510gcc aaa ggc ccg gta ctt atc gaa gta agc acc gta agc ccg gtg aag 1584Ala Lys Gly Pro Val Leu Ile Glu Val Ser Thr Val Ser Pro Val Lys515 520 525tga 1587&lt;210&gt;33&lt;211&gt;528&lt;212&gt;PRT&lt;213&gt;惡臭假單胞菌&lt;400&gt;33Met Ala Ser Val His Gly Thr Thr Tyr Glu Leu Leu Arg Arg Gln Gly1 5 10 15Ile Asp Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu20 25 30Lys Asp Phe Pro Glu Asp Phe Arg Tyr Ile Leu Ala Leu Gln Glu Ala35 40 45Cys Val Val Gly Ile Ala Asp Gly Tyr Ala Gln Ala Ser Arg Lys Pro
      50 55 60Ala Phe Ile Asn Leu His Ser Ala Ala Gly Thr Gly Asn Ala Met Gly65 70 75 80Ala Leu Ser Asn Ala Trp Asn Ser His Ser Pro Leu Ile Val Thr Ala85 90 95Gly Gln Gln Thr Arg Ala Met Ile Gly Val Glu Ala Leu Leu Thr Asn100 105 110Val Asp Ala Ala Asn Leu Pro Arg Pro Leu Val Lys Trp Ser Tyr Glu115 120 125Pro Ala Ser Ala Ala Glu Val Pro His Ala Met Ser Arg Ala Ile His130 135 140Met Ala Ser Met Ala Pro Gln Gly Pro Val Tyr Leu Ser Val Pro Tyr145 150 155 160Asp Asp Trp Asp Lys Asp Ala Asp Pro Gln Ser His His Leu Phe Asp165 170 175Arg His Val Ser Ser Ser Val Arg Leu Asn Asp Gln Asp Leu Asp Ile180 185 190Leu Val Lys Ala Leu Asn Ser Ala Ser Asn Pro Ala Ile Val Leu Gly195 200 205Pro Asp Val Asp Ala Ala Asn Ala Asn Ala Asp Cys Val Met Leu Ala210 215 220Glu Arg Leu Lys Ala Pro Val Trp Val Ala Pro Ser Ala Pro Arg Cys225 230 235 240Pro Phe Pro Thr Arg His Pro Cys Phe Arg Gly Leu Met Pro Ala Gly245 250 255Ile Ala Ala Ile Ser Gln Leu Leu Glu Gly His Asp Val Val Leu Val260 265 270Ile Gly Ala Pro Val Phe Arg Tyr His Gln Tyr Asp Pro Gly Gln Tyr275 280 285
      Leu Lys Pro Gly Thr Arg Leu Ile Ser Val Thr Cys Asp Pro Leu Glu290 295 300Ala Ala Arg Ala Pro Met Gly Asp Ala Ile Val Ala Asp Ile Gly Ala305 310 315 320Met Ala Ser Ala Leu Ala Asn Leu Val Glu Glu Ser Ser Arg Gln Leu325 330 335Pro Thr Ala Ala Pro Glu Pro Ala Lys Val Asp Gln Asp Ala Gly Arg340 345 350Leu His Pro Glu Thr Val Phe Asp Thr Leu Asn Asp Met Ala Pro Glu355 360 365Asn Ala Ile Tyr Leu Asn Glu Ser Thr Ser Thr Thr Ala Gln Met Trp370 375 380Gln Arg Leu Asn Met Arg Asn Pro Gly Ser Tyr Tyr Phe Cys Ala Ala385 390 395 400Gly Gly Leu Gly Phe Ala Leu Pro Ala Ala Ile Gly Val Gln Leu Ala405 410 415Glu Pro Glu Arg Gln Val Ile Ala Val Ile Gly Asp Gly Ser Ala Asn420 425 430Tyr Ser Ile Ser Ala Leu Trp Thr Ala Ala Gln Tyr Asn Ile Pro Thr435 440 445Ile Phe Val Ile Met Asn Asn Gly Thr Tyr Gly Ala Leu Arg Trp Phe450 455 460Ala Gly Val Leu Glu Ala Glu Asn Val Pro Gly Leu Asp Val Pro Gly465 470 475 480Ile Asp Phe Arg Ala Leu Ala Lys Gly Tyr Gly Val Gln Ala Leu Lys485 490 495Ala Asp Asn Leu Glu Gln Leu Lys Gly Ser Leu Gln Glu Ala Leu Ser500 505 510Ala Lys Gly Pro Val Leu Ile Glu Val Ser Thr Val Ser Pro Val Lys515 520 52權(quán)利要求
      1.在包含脫羧基化步驟的工藝中,從式(I)化合物或它的鹽或其被保護(hù)形式生產(chǎn)2′-脫氧核苷或2′-脫氧核苷前體的方法。
      2.權(quán)利要求1的方法,其中脫羧基化步驟會(huì)切割式(I)化合物或它的鹽或其被保護(hù)形式的C1-C2鍵。
      3.權(quán)利要求1或2的方法,其中脫羧基化步驟直接對(duì)式(I)化合物或它的鹽或其被保護(hù)形式進(jìn)行。
      4.權(quán)利要求1-3中任一項(xiàng)的方法,其中脫羧基化步驟是通過(guò)使式(I)化合物或它的鹽或其被保護(hù)形式與過(guò)氧化氫反應(yīng)而進(jìn)行的,生成式(II)化合物或它的鹽或其被保護(hù)形式作為2′-脫氧核苷前體。
      5.權(quán)利要求4的方法,其中還包含將式(II)化合物或它的鹽或其被保護(hù)形式轉(zhuǎn)化成作為2′-脫氧核苷前體的式(IV)化合物或其被保護(hù)形式
      6.權(quán)利要求4的方法,其中還包含將式(II)化合物或它的鹽或其被保護(hù)形式轉(zhuǎn)化成作為2′-脫氧核苷前體的式(III)化合物或其被保護(hù)形式。
      7.權(quán)利要求6的方法,其中包含將式(II)化合物或它的鹽或其被保護(hù)形式轉(zhuǎn)化成作為中間體的式(IV)化合物或其被保護(hù)形式,然后再將其轉(zhuǎn)化成式(III)化合物或它的被保護(hù)形式。
      8.權(quán)利要求1-3中任一項(xiàng)的方法,其中脫羧基化步驟通過(guò)使式(I)化合物或它的鹽或其被保護(hù)形式與胺Y-H反應(yīng)而進(jìn)行,其中H代表著與氨基的氮原子相結(jié)合的氫原子,以生成式(V)化合物 或它的各反式異構(gòu)體或其被保護(hù)形式,作為2′-脫氧核苷前體。
      9.權(quán)利要求8的方法,其中Y-H代表著線性的或環(huán)狀的仲胺。
      10.權(quán)利要求8或9的方法,其中Y-H是嗎啉,吡咯烷,哌啶,N-甲基哌嗪或二乙基胺。
      11.權(quán)利要求8-10中任一項(xiàng)的方法,其中還包含使式(V)化合物或它的反式異構(gòu)體或其被保護(hù)形式與Z-H反應(yīng)的步驟,其中H代表著氫原子,且Z代表著離去基團(tuán),以生成式(VI)化合物 或它的各反式異構(gòu)體或其被保護(hù)形式,作為2′-脫氧核苷前體。
      12.權(quán)利要求11的方法,其中Z-H是水,以生成作為2′-脫氧核苷前體的式(III)化合物或其被保護(hù)形式。
      13.權(quán)利要求1或2的方法,其中將式(I)化合物或它的鹽或其被保護(hù)形式轉(zhuǎn)化成式(VII)化合物或它的鹽或其被保護(hù)形式或者各自的差向異構(gòu)體的混合物, 然后將其脫羧基化,生成作為2′-脫氧核苷前體的式(III)化合物或其被保護(hù)形式。
      14.權(quán)利要求13的方法,其中通過(guò)硼氫化鈉的還原或者使用阮內(nèi)鎳或氧化鉑催化劑的氫化,將式(I)化合物或它的鹽或其被保護(hù)形式轉(zhuǎn)化成式(VII)化合物或其被保護(hù)形式。
      15.權(quán)利要求13-14的方法,其中通過(guò)與過(guò)氧化氫的反應(yīng)進(jìn)行脫羧基化步驟。
      16.權(quán)利要求1或2的方法,其中將式(I)化合物或它的鹽或其被保護(hù)形式轉(zhuǎn)化成式(VIII)化合物或它的鹽或其被保護(hù)形式或者各自的差向異構(gòu)體的混合物, 然后將其脫羧基化,生成作為2′-脫氧核苷前體的式(III)化合物或其被保護(hù)形式。
      17.權(quán)利要求16的方法,其中使式(VIII)化合物或其被保護(hù)形式或者各自的差向異構(gòu)體的混合物與茚三酮反應(yīng),由此生成化合物(III)或其被保護(hù)形式。
      18.權(quán)利要求16或17的方法,其中通過(guò)氨和氰基硼氫化鈉的還原性胺化作用,將式(I)化合物或它的鹽或其被保護(hù)形式轉(zhuǎn)化成式(VIII)化合物或其被保護(hù)形式。
      19.權(quán)利要求1-18中任一項(xiàng)的方法,其中保護(hù)基團(tuán)獨(dú)立地選自醋酸酯,苯甲酸酯,烯丙醚,苯甲基醚,三苯甲基醚,叔丁基二甲基甲硅烷基(TBDMS)醚,亞異丙基或亞芐基縮醛。
      20.權(quán)利要求1-3中任一項(xiàng)的方法,其中通過(guò)包含單一步驟的酶促反應(yīng)實(shí)現(xiàn)脫羧基化步驟。
      21.權(quán)利要求20的方法,其中酶促反應(yīng)由具有酮酸脫羧酶活性的酶催化。
      22.權(quán)利要求21的方法,其中具有酮酸脫羧酶活性的酶是硫胺素焦磷酸(TPP)依賴性的酮酸脫羧酶。
      23.權(quán)利要求22的方法,其中TPP依賴性的酮酸脫羧酶是丙酮酸脫羧酶(EC 4.1.1.1),苯甲?;姿崦擊让?EC 4.1.1.7),吲哚丙酮酸脫羧酶(EC 4.1.1.74),膦?;崦擊让福腔崦擊让?EC4.1.1.79),草酰-輔酶A脫羧酶(EC 4.1.1.8),酮戊二酸脫羧酶(EC4.1.1.71)或苯基丙酮酸脫羧酶(EC 4.1.1.43)。
      24.權(quán)利要求23的方法,其中丙酮酸脫羧酶是真核生物來(lái)源的。
      25.權(quán)利要求24的方法,其中真核生物是酵母生物。
      26.權(quán)利要求25的方法,其中酵母是釀酒酵母(Saccharomycescerevisiae)。
      27.權(quán)利要求23的方法,其中丙酮酸脫羧酶是原核生物來(lái)源的。
      28.權(quán)利要求27的方法,其中所述原核生物是發(fā)酵單胞菌屬(Zymomonas),發(fā)酵桿菌屬(Zymobacter)或醋桿菌屬(Acetobacter)生物。
      29.權(quán)利要求28的方法,其中所述生物是運(yùn)動(dòng)發(fā)酵單胞菌(Zymomonas mobilis),棕櫚發(fā)酵細(xì)菌(Zymobacter plamae)或巴氏醋桿菌(Acetobacter pasteurianus)生物。
      30.權(quán)利要求23的方法,其中苯甲?;姿崦擊让甘窃松飦?lái)源的。
      31.權(quán)利要求30的方法,其中所述原核生物是假單胞菌屬(Pseudomonas)生物。
      32.權(quán)利要求31的方法,其中所述生物是惡臭假單胞菌(Pseudomonas putida)生物。
      33.權(quán)利要求20-32中任一項(xiàng)的方法,其中通過(guò)加入酸將pH調(diào)節(jié)至pH5-pH9。
      34.權(quán)利要求33的方法,其中將pH調(diào)節(jié)至pH6-pH8。
      35.權(quán)利要求33或34的方法,其中所述酸是HCl,H2SO4,D-葡糖酸或2-脫氫-3-脫氧-D-葡糖酸。
      36.權(quán)利要求1-35中任一項(xiàng)的方法,其中包含通過(guò)利用葡糖酸脫水酶活性而從D-葡糖酸或D-葡糖酸鹽生產(chǎn)式(I)化合物的初始步驟。
      37.權(quán)利要求36的方法,其中D-葡糖酸鹽是D-葡糖酸鉀或鈉。
      38.權(quán)利要求36或37的方法,其中葡糖酸脫水酶由包含選自下述的核苷酸序列的多核苷酸編碼(a)編碼包含SEQ ID NO2所示氨基酸序列的多肽的核苷酸序列;(b)包含SEQ ID NO1所示編碼序列的核苷酸序列;(c)編碼由(a)或(b)所述核苷酸序列編碼的片段的核苷酸序列;(d)與(a)至(c)中任一項(xiàng)的核苷酸序列雜交的核苷酸序列;和(e)由于遺傳密碼的簡(jiǎn)并性而不同于(d)所述核苷酸序列的核苷酸序列。
      39.權(quán)利要求1-35中任一項(xiàng)的方法,其中包含通過(guò)利用葡糖胺脫氨酶活性而從D-氨基葡糖酸生產(chǎn)式(I)化合物的初始步驟。
      40.權(quán)利要求39的方法,其中氨基葡糖酸脫氨酶由包含選自下述的核苷酸序列的多核苷酸編碼(a)編碼包含SEQ ID NO4所示氨基酸序列的多肽的核苷酸序列;(b)包含SEQ ID NO3所示編碼序列的核苷酸序列;(c)編碼由(a)或(b)所述核苷酸序列編碼的片段的核苷酸序列;(d)與(a)至(c)中任一項(xiàng)的核苷酸序列雜交的核苷酸序列;和(e)由于遺傳密碼的簡(jiǎn)并性而不同于(d)所述核苷酸序列的核苷酸序列。
      41.一種生物體,其由于D-葡糖酸脫水酶的表達(dá)而能將D-葡糖酸酶促地轉(zhuǎn)化成2-脫氫-3-脫氧-D-葡糖酸,和/或由于D-氨基葡糖酸脫氨酶的表達(dá)而能將D-氨基葡糖酸酶促地轉(zhuǎn)化成2-脫氫-3-脫氧-D-葡糖酸,并且其由于酮酸脫羧酶的表達(dá)而能通過(guò)脫羧基化反應(yīng)將2-脫氫-3-脫氧-D-葡糖酸酶促地轉(zhuǎn)化成2-脫氧-D-核糖。
      42.權(quán)利要求41的生物,其不表達(dá)2-脫氫-3-脫氧-D-葡糖酸激酶活性。
      43.權(quán)利要求41或42的生物,其不表達(dá)2-脫氫-3-脫氧-D-葡糖酸醛縮酶活性。
      44.權(quán)利要求41-43中任一項(xiàng)的生物,其不表達(dá)2-脫氧-D-核糖醛縮酶活性。
      45.權(quán)利要求20-40中任一項(xiàng)的方法,其使用根據(jù)權(quán)利要求41-44中任一項(xiàng)的生物體來(lái)實(shí)現(xiàn)。
      46.權(quán)利要求38的多核苷酸或由這樣的多核苷酸編碼的葡糖酸脫水酶在權(quán)利要求36或37的方法中的應(yīng)用。
      47.權(quán)利要求40的多核苷酸或由這樣的多核苷酸編碼的氨基葡糖酸脫氨酶在權(quán)利要求39的方法中的應(yīng)用。
      48.具有酮酸脫羧酶活性的酶或編碼這樣的酶的多核苷酸在將式(I)化合物轉(zhuǎn)化成2-脫氧-D-核糖的方法中的應(yīng)用。
      全文摘要
      本發(fā)明涉及使用2-脫氫-3-脫氧-D-葡糖酸(通常縮寫(xiě)為KDG)或它的鹽作為原料,制備2′-脫氧核苷化合物或2′-脫氧核苷前體的方法。許多2′-脫氧核苷和它們的類似物可作為生產(chǎn)抗病毒劑、抗癌劑或反義試劑的合成原料或藥物配方使用。
      文檔編號(hào)C12N9/88GK1832954SQ200480020229
      公開(kāi)日2006年9月13日 申請(qǐng)日期2004年6月24日 優(yōu)先權(quán)日2003年6月24日
      發(fā)明者菲利普·馬利埃, 福爾克爾·多林, 丹尼斯·蒂博, 阿內(nèi)·克賴邁爾 申請(qǐng)人:愛(ài)沃邏輯股份有限公司, 馬利埃科技公司, 羅狄亞化學(xué)公司, 菲利普·馬利埃
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1