国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      具有β-葡糖苷酶活性的多肽和編碼該多肽的多核苷酸的制作方法

      文檔序號(hào):391987閱讀:362來(lái)源:國(guó)知局

      專利名稱::具有β-葡糖苷酶活性的多肽和編碼該多肽的多核苷酸的制作方法
      技術(shù)領(lǐng)域
      :本發(fā)明涉及具有葡糖苷酶活性的分離的多肽和編碼所述多肽的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細(xì)胞,以及用于產(chǎn)生和使用所述多肽的方法。相關(guān)領(lǐng)域描述纖維素是葡萄糖通過(guò)β-1,4-鍵連接的聚合物。許多微生物產(chǎn)生水解β-連接的葡聚糖的酶。這些酶包括內(nèi)切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。內(nèi)切葡聚糖酶在隨機(jī)位置消化纖維素聚合物,將其打開(kāi)(openingit)以受到纖維二糖水解酶攻擊(attack)。纖維二糖水解酶繼而從纖維素聚合物的末端釋放纖維二糖的分子。纖維二糖是水溶性的β-1,4-連接的葡萄糖二聚體。葡糖苷酶將纖維二糖水解成葡萄糖。將含木素纖維素原料(lignocellulosicfeedstock)轉(zhuǎn)化為乙醇具有以下優(yōu)勢(shì)大量原料現(xiàn)成可用,避免燃燒或填埋材料的合意性和乙醇燃料的清潔性。木材、農(nóng)業(yè)殘余物、草本作物和城市固體廢物被認(rèn)為是用于乙醇生產(chǎn)的原料。這些材料主要由纖維素、半纖維素和木質(zhì)素組成。一旦將纖維素轉(zhuǎn)化成葡萄糖,葡萄糖將容易地由酵母發(fā)酵成乙醇。因?yàn)槠咸烟侨菀椎赜啥喾N酵母發(fā)酵為乙醇,而纖維二糖則否,所以任何在水解結(jié)束時(shí)殘留的纖維二糖代表乙醇產(chǎn)量的損失。更重要的是,纖維二糖是內(nèi)切葡聚糖酶和纖維二糖水解酶的強(qiáng)力抑制劑。在水解過(guò)程中纖維二糖的累積對(duì)于乙醇產(chǎn)生是不受歡迎的。纖維二糖累積在酶水解中為主要問(wèn)題,因?yàn)楫a(chǎn)生纖維素酶的微生物可能產(chǎn)生極少的β-葡糖苷酶。該β-葡糖苷酶的低量導(dǎo)致將纖維二糖水解為葡萄糖的能力的短缺。已使用了幾種方法在纖維素轉(zhuǎn)化中增加β-葡糖苷酶的量。一種方法是使用產(chǎn)生極少纖維素酶的微生物產(chǎn)生β-葡糖苷酶,并將所述β-葡糖苷酶外源地添加至內(nèi)切葡聚糖酶和纖維二糖水解酶以增強(qiáng)水解。第二種方法是將纖維素水解與發(fā)酵同時(shí)進(jìn)行。該工藝稱作同時(shí)糖化和發(fā)酵(SFF)。在SFF系統(tǒng)中,葡萄糖的發(fā)酵將其從溶液移除。第三種克服β-葡糖苷酶的短缺的方法是在宿主中過(guò)表達(dá)β-葡糖苷酶,由此增加β-葡糖苷酶的產(chǎn)量。在本領(lǐng)域提供用于降解纖維素材料的新β-葡糖苷酶會(huì)是有利的。本發(fā)明提供了具有β-葡糖苷酶活性的多肽和編碼該多肽的多核苷酸。發(fā)明概述本發(fā)明涉及具有葡糖苷酶活性的分離的多肽,所述多肽選自下組(a)多肽,其包含氨基酸序列,所述氨基酸序列與SEQIDNO2的成熟多肽具有至少60%序列同一性;(b)多肽,其由多核苷酸編碼,所述多核苷酸在至少中嚴(yán)格條件下與以下雜交(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含SEQIDNO1的成熟多肽編碼序列的基因組DNA序列,或(iii)⑴或(ii)的全長(zhǎng)互補(bǔ)鏈;(c)多肽,其由包含核苷酸序列的多核苷酸編碼,所述核苷酸序列與SEQIDNO=I的成熟多肽編碼序列具有至少60%序列同一性;和(d)SEQIDNO2的包含取代、缺失和/或插入一個(gè)或多個(gè)(幾個(gè))氨基酸的成熟多肽的變體。本發(fā)明還涉及編碼具有β-葡糖苷酶活性的多肽的分離的多核苷酸,所述多核苷酸選自下組(a)多核苷酸,其編碼包含氨基酸序列的多肽,所述氨基酸序列與SEQIDNO2的成熟多肽具有至少60%序列同一性;(b)多核苷酸,其在至少中嚴(yán)格條件下與以下雜交(i)SEQIDN0:1的成熟多肽編碼序列,(ii)包含SEQIDNO1的成熟多肽編碼序列的基因組DNA序列或(iii)(i)或(ii)的全長(zhǎng)互補(bǔ)鏈;(c)多核苷酸,其包含核苷酸序列,所述核苷酸序列與SEQIDNO1的成熟多肽編碼序列具有至少60%序列同一性;和(d)多核苷酸,其編碼SEQIDNO2的成熟多肽的包含取代、缺失和/或插入一個(gè)或多個(gè)(幾個(gè))氨基酸的變體。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、重組表達(dá)載體和重組宿主細(xì)胞,并涉及產(chǎn)生具有葡糖苷酶活性的多肽的方法。本發(fā)明還涉及抑制具有β-葡糖苷酶活性的多肽在細(xì)胞中表達(dá)的方法,所述方法包括對(duì)細(xì)胞施用或在細(xì)胞中表達(dá)雙鏈RNA(dsRNA)分子,其中所述dsRNA包括本發(fā)明的多核苷酸的亞序列。本發(fā)明還涉及這種雙鏈抑制性RNA(dsRNA)分子,其中任選地dsRNA是siRNA或miRNA分子。本發(fā)明還涉及用于降解或轉(zhuǎn)化纖維素材料的方法,其包括在存在具有葡糖苷酶活性的多肽的情況下,用酶組合物處理纖維素材料。本發(fā)明還涉及產(chǎn)生發(fā)酵產(chǎn)物的方法,其包括(a)在存在具有葡糖苷酶活性的多肽的情況下用酶組合物糖化纖維素材料;(b)用一種或多種(幾種)發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和(c)從發(fā)酵回收發(fā)酵產(chǎn)物。本發(fā)明還涉及發(fā)酵纖維素材料的方法,其包括用一種或多種(幾種)發(fā)酵微生物發(fā)酵纖維素材料,其中在存在具有葡糖苷酶活性的多肽的情況下,用酶組合物糖化纖維素材料。本發(fā)明還涉及包含分離的多核苷酸的植物,所述多核苷酸編碼具有β-葡糖苷酶活性的多肽。本發(fā)明還涉及用于產(chǎn)生具有β-葡糖苷酶活性的多肽的方法,其包括(a)在有助于產(chǎn)生該多肽的條件下培養(yǎng)包含多核苷酸的轉(zhuǎn)基因植物或植物細(xì)胞,所述多核苷酸編碼具有葡糖苷酶活性的多肽;和(b)回收所述多肽。本發(fā)明還涉及編碼信號(hào)肽的分離的多核苷酸,所述信號(hào)肽包含SEQIDNO2的氨基酸1至19,或由SEQIDNO2的氨基酸1至19組成;涉及包含所述多核苷酸的核酸構(gòu)建體、表達(dá)載體和重組宿主細(xì)胞;并涉及產(chǎn)生蛋白的方法。附圖簡(jiǎn)述圖IA和IB顯示TrichophaeasaccataCBS804.70β-葡糖苷酶基因的cDNA序列和推定的氨基酸序列(分別為SEQIDNO1和2)。圖2顯示pAHYG-33的限制圖譜。定義β-葡糖苷酶術(shù)語(yǔ)“β-葡糖苷酶”在本文中定義為β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(Ε.C.No.3.2.1.21),其催化末端非還原β-D-葡萄糖殘基的水解,并釋放β-D-葡萄糖。就本發(fā)明而言,根據(jù)Venturi等,2002,ExtracelIularbeta-D-glucosidasefromChaetomiumthermophilumvar.coprophilum!production,purificationandsomebiochemicalproperties,J.BasicMicrobiol.42:55-66^基本方法確定葡糖苷酶活性。一個(gè)單位的葡糖苷酶活性定義為在50°C,pH5,在50mM乙酸鈉,0.01%TWEEN20中從作為底物的ImM對(duì)硝基苯基-β-D-葡糖吡喃糖苷每分鐘產(chǎn)生1.0微摩爾對(duì)硝基苯酚。本發(fā)明的多肽具有SEQIDNO:2的成熟多肽的β-葡糖苷酶活性的優(yōu)選至少20%,更優(yōu)選至少40%,更優(yōu)選至少50%,更優(yōu)選至少60%,更優(yōu)選至少70%,更優(yōu)選至少80%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,且甚至最優(yōu)選至少100%。家族3或家族GH3或CEL3術(shù)語(yǔ)“家族3”或“家族GH3”或“CEL3”在本文中定義為根據(jù)HenrissatB·,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309-316,及HenrissatB.,禾口BairochΑ.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696屬于糖苷水解酶家族3的多肽。纖維素分解活性術(shù)語(yǔ)“纖維素分解活性”在本文中定義為水解纖維素材料的生物學(xué)活性。測(cè)量纖維素分解活性的兩種基本方法包括(1)測(cè)量總纖維素分解活性,和(2)測(cè)量單獨(dú)的纖維素分解活性(內(nèi)切葡聚糖酶、纖維二糖水解酶和葡糖苷酶),如^iang等,Outlookforcellulaseimprovement-Screeningandselectionstrategies,2006,BiotechnologyAdvancesM:452-481所綜述的??偫w維素分解活性通常是使用不溶性底物來(lái)測(cè)定的,所述底物包括WhatmanNo.1濾紙、微晶纖維素、細(xì)菌纖維素、藻類纖維素、棉花、經(jīng)預(yù)處理的木素纖維素等。最常見(jiàn)的總纖維素分解活性測(cè)定法是使用WhatmanNo.1濾紙作為底物的濾紙測(cè)定法。該測(cè)定法是由hternationalUnionofPureandAppliedChemistry(IUPAC)(Ghose,1987,Measurementofcellulaseactivities,PureApp1.Chem.59:257-68)確立的。就本發(fā)明而言,纖維素分解活性通過(guò)測(cè)量在下述條件下由纖維素分解酶進(jìn)行的纖維素材料水解的增加來(lái)確定l_20mg的纖維素分解蛋白/g的PCS中纖維素在50-65°C進(jìn)行3-7日,與未添加纖維素分解蛋白的對(duì)照水解相比較。通常條件為1ml反應(yīng)液,經(jīng)洗滌或未洗滌的PCS,5%不溶性固形物,50mM乙酸鈉pH5,ImMMnSO4,50-65°C,72小時(shí),通過(guò)AMINEXHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)進(jìn)行糖分析。內(nèi)切葡聚糖酶術(shù)語(yǔ)“內(nèi)切葡聚糖酶”在本文中定義為內(nèi)切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(endo-l,4-0-D-glucan4-glucanohydrolase)(Ε.C.3.2.1.4),其催化纖維素、纖維素衍生物(例如羧甲基纖維素和羥乙基纖維素)、地衣淀粉(Iichenin)中的1,4-β-D-糖苷鍵、混合的β-1,3葡聚糖例如谷類β-D-葡聚糖或木葡聚糖和含有纖維素組分的其它植物材料中的β_1,4鍵的內(nèi)水解(endohydrolysis)。內(nèi)切葡聚糖酶活性可基于底物粘度的減少或由還原糖測(cè)定法(Zhang等,2006,BiotechnologyAdvances24:452-481)確定的還原端增加來(lái)確定。就本發(fā)明而言,根據(jù)(ihose,1987,PureandApp1.Chem.59:257-268的方法,使用羧甲基纖維素(CMC)水解來(lái)確定內(nèi)切葡聚糖酶活性。纖維二糖水解酶術(shù)語(yǔ)“纖維二糖水解酶”在本文中定義為l,4-i3_D-葡聚糖纖維二糖水解酶(1,4-beta-D-glucancellobiohydrolase)(Ε.C.No.3.2.1.91),其催化纖維素、纖維素寡糖,或任何包含β_1,4-連接的葡萄糖的聚合物中的l,4-i3-D-糖苷鍵的水解,從鏈的還原或非還原末端釋放纖維二糖(Teeri,1997,Crystallinecellulosedegradation:NewinsightintothefunctionofeellobiohydroIases,TrendsinBiotechnology15:160-167;Teeri等,1998,Trichodermareeseieellobiohydrolaseswhysoefficientoncrystallinecellulose?,Biochem.Soc.Trans.26:173-178)。就本發(fā)明而言,根據(jù)vanTilbeurgh等,1982,F(xiàn)EBSLetters149152-156和vanTilbeurgh和Claeyssens,1985,F(xiàn)EBSLetters187:283-288描述的方法使用熒光性二糖衍生物4_甲基傘形基-β-D-乳糖苷來(lái)測(cè)定纖維二糖水解酶活性。纖維素分解增強(qiáng)活性術(shù)語(yǔ)“纖維素分解增強(qiáng)活性”在本文中定義為增強(qiáng)具有纖維素分解活性的多肽水解纖維素材料的生物學(xué)活性。就本發(fā)明而言,通過(guò)測(cè)量由纖維素分解蛋白在下述條件下水解纖維素材料所導(dǎo)致的還原糖增加或纖維二糖與葡萄糖的總量增加來(lái)確定纖維素分解增強(qiáng)活性l_50mg總蛋白/gPCS中的纖維素,其中總蛋白包含50-99.5%w/w的纖維素分解蛋白,及0.5-50%w/w的具有纖維素分解增強(qiáng)活性的蛋白質(zhì),在50-65°C歷時(shí)1-7天,與用等量的總蛋白加載量而無(wú)纖維素分解增強(qiáng)活性(l-50mg纖維素分解蛋白/gPCS中的纖維素)所進(jìn)行的對(duì)照水解相比。在一個(gè)優(yōu)選的方面,使用在總蛋白重量的3%的米曲霉β-葡糖苷酶(根據(jù)WO02/095014在米曲霉中重組產(chǎn)生)或者總蛋白質(zhì)量的3%的煙曲霉β-葡糖苷酶(如WO2002/095014所述在米曲霉中重組產(chǎn)生)的纖維素酶蛋白加載量存在下的CELLUCLAST1.5L(NovozymesA/S,Bagsvaerd,Denmark)的混合物作為纖維素分解活性的來(lái)源。本發(fā)明的具有纖維素分解增強(qiáng)活性的多肽具有GH61多肽的成熟多肽的纖維素分解增強(qiáng)活性的優(yōu)選至少20%,更優(yōu)選至少40%,更優(yōu)選至少50%,更優(yōu)選至少60%,更優(yōu)選至少70%,更優(yōu)選至少80%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,并且甚至最優(yōu)選至少100%。具有纖維素分解增強(qiáng)活性的多肽通過(guò)降低達(dá)到相同水解水平所需的纖維素分解酶的量而增強(qiáng)由具有纖維素分解活性的蛋白質(zhì)催化的纖維素材料的水解,優(yōu)選降低至少1.01倍,更優(yōu)選至少1.05倍,更優(yōu)選至少1.10倍,更優(yōu)選至少1.25倍,更優(yōu)選至少1.5倍,更優(yōu)選至少2倍,更優(yōu)選至少3倍,更優(yōu)選至少4倍,更優(yōu)選至少5倍,甚至更優(yōu)選至少10倍,并且最優(yōu)選至少20倍。7家族61糖苷水解酶術(shù)語(yǔ)“家族61糖苷水解酶”或“家族GH61”在本文中定義為根據(jù)HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316,及HenrissatB.JfIBairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696屬于糖苷水解酶家族61的多肽。目前,Henrissat將GH61家族列為未分類的,表明尚未知屬于該家族的多肽的性質(zhì)如機(jī)理,催化親核體/堿和催化質(zhì)子供體。木聚糖降解活性術(shù)語(yǔ)“木聚糖降解活性”或“木聚糖分解活性”在本文中定義為水解含木聚糖材料的生物學(xué)活性。兩種測(cè)定木聚糖分解活性的基礎(chǔ)方法包括(1)測(cè)定總木聚糖分解活性,和(測(cè)定單獨(dú)的木聚糖分解活性(內(nèi)切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(α-glucuronylesterase)).最近在木聚糖分解酶測(cè)定法的進(jìn)展總結(jié)于幾個(gè)公開(kāi)文獻(xiàn)中,包括Biely禾ΠPuchard,Recentprogressintheassaysofxylanolyticenzymes,2006,JournaloftheScienceofFoodandAgriculture86(11):1636-1647;Spanikova禾口Biely,2006,Glucuronoylesterase-NovelcarbohydrateesteraseproducedbySchizophyllumcommune,F(xiàn)EBSLetters580(19):4597-4601;Herrmann,Vrsanska,Jurickova,Hirsch,Biely禾口Kubicek,1997,Thebeta-D-xylosidaseofTrichodermareeseiisamultifunctionalbeta-D-xylanxylohydroIase,BiochemicalJournal321:375-381o總木聚糖降解活性可通過(guò)確定從多種類型的木聚糖形成的還原糖來(lái)測(cè)量,所述木聚糖包括燕麥小麥(oatspelt)、山毛櫸木(beechwood)和落葉松木(Iarchwood)木聚糖,或者可通過(guò)光度法確定從多種共價(jià)染色的木聚糖釋放出的染色的木聚糖片段來(lái)測(cè)量。最常見(jiàn)的總木聚糖分解活性測(cè)定法基于從多聚的4-0-甲基葡糖醛酸木聚糖產(chǎn)生還原糖,如Bailey,Biely,Poutanen,1992,Interlaboratorytestingofmethodsforassayofxylanaseactivity,JournalofBiotechnology23(3):257-270中所述。就本發(fā)明而言,木聚糖降解活性是通過(guò)測(cè)量由木聚糖降解酶在下述通常條件下造成的樺木木聚糖(SigmaChemicalCo.,Inc.,St.Louis,MO,USA)水解的增加來(lái)確定的Iml反應(yīng)液,5mg/ml底物(總固形物),5mg木聚糖分解蛋白質(zhì)/g底物,50mM乙酸鈉,pH5,50°C,24小時(shí),如Lever,1972,Anewreactionforcolorimetricdeterminationofcarbohydrates,Anal.Biochem47:273-279所述使用對(duì)羥基苯甲酸酰胼(PHBAH)測(cè)定法進(jìn)行糖分析。木聚糖酶活性術(shù)語(yǔ)“木聚糖酶活性”在本文中定義為l,4-i3_D-木聚糖-木糖水解酶(1,4-β-D-xylan-xylohydrolase)活性(Ε.C.3.2.1.8),其催化木聚糖中1,4-β-D-木糖苷鍵的內(nèi)水解。就本發(fā)明而言,木聚糖酶活性是使用樺木木聚糖作為底物確定的。一個(gè)單位的木聚糖酶活性定義為在50°C,pH5從每升2g樺木木聚糖作為底物在含有0.01%TWEEN20的50mM乙酸鈉中水解的起始時(shí)間過(guò)程中每分鐘產(chǎn)生1.Oμmol還原糖(以葡萄糖當(dāng)量(glucoseequivalents)測(cè)定,如Lever,1972,Anewreactionforcolorimetricdeterminationofcarbohydrates,Anal.Biochem47:273-279所述)。β-木糖苷酶活性術(shù)語(yǔ)“β-木糖苷酶活性”在本文中定義為β-D木糖苷木糖水解酶(β-D-xylosidexylohydrolase)(Ε.C.3.2.1.37),其催化短β(1—4)木寡糖(xylooligosaccharide)的外水解以從非還原端去除連續(xù)的D-木糖殘基。就本發(fā)明而言,一個(gè)單位的β-木糖苷酶活性定義為在40°C,pH5從ImM對(duì)硝基苯基-β-D-木糖苷作為底物在含有0.01%TWEEN20的IOOmM檸檬酸鈉中每分鐘產(chǎn)生l.Oymol對(duì)硝基苯酚。乙酰木聚糖酯酶活性術(shù)語(yǔ)“乙酰木聚糖酯酶活性”在本文中定義為羧基酯酶活性(EC3.1.1.72),其催化乙?;鶑木酆夏揪厶?、乙酰化木糖、乙?;咸烟?、乙酸α-萘酯(alpha-napthylacetate)禾口乙酸對(duì)石肖基苯酉旨(p—nitrophenylacetate)的水角軍。就本發(fā)明而言,乙酰木聚糖酯酶活性是使用0.5mM乙酸對(duì)硝基苯酯作為底物,在含有0.01%TWEEN20的50mM乙酸鈉pH5.0中確定的。一個(gè)單位的乙酰木聚糖酯酶活性定義為能夠在pH5,25°C每分鐘釋放1微摩爾對(duì)硝基苯酚陰離子(p-nitrophenolateanion)的酶量。阿魏酸酯酶活性術(shù)語(yǔ)“阿魏酸酯酶(feruloylesterase)活性”在本文中定義為4-羥基-3-甲氧基肉桂酰-糖水解酶酶活性(EC3.1.1.73),其催化4-羥基-3-甲氧基肉桂酰(阿魏酰)基團(tuán)從酯化的糖(其在“天然”底物中通常為阿拉伯糖)的水解,以產(chǎn)生阿魏酸(4-羥基-3-甲氧基肉桂酸)。阿魏酸酯酶也稱作阿魏酸酯酶(ferulicacidesterase)、FAE-III、肉桂酸酯水解酶、FAEA,cinnAE、FAE-I或FAE-II。就本發(fā)明而言,阿魏酸酯酶活性是使用50mM乙酸鈉pH5.0中的0.5mM阿魏酸對(duì)硝基苯酯作為底物確定的。一個(gè)單位的阿魏酸酯酶活性等于能夠在PH5,25°C每分鐘釋放出Iymol對(duì)硝基苯酚陰離子的酶量。α-葡糖醛酸糖苷酶活性術(shù)語(yǔ)“α-葡糖醛酸糖苷酶活性”在本文中定義為α-D-葡Ρ酸葡Hil酸水角軍Bligti(alpha-D-glucosiduronateglucuronohydrolaseactivity)(EC3.2.1.139),其催化α-D-葡糖醛酸糖苷水解為D-葡糖醛酸和醇。就本發(fā)明而言,α-葡糖醛酸糖苷酶活性是根據(jù)deVries,1998,J.Bacteriol.180:243-249確定的。一個(gè)單位的α-葡糖醛酸糖苷酶活性等于能夠在pH5,40°C每分鐘釋放出Iymol葡糖醛酸或4-0-甲基葡糖醛酸的酶量。α-L-阿拉伯呋喃糖苷酶活性術(shù)語(yǔ)“α_L_阿拉伯呋喃糖苷酶活性”在本文中定義為α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶活性(EC3.2.1.55),其催化對(duì)α_L_阿拉伯糖苷中的末端非還原性α-L-阿拉伯呋喃糖苷殘基的水解。該酶活性對(duì)α-L-阿拉伯呋喃糖苷、含有(1,3)_和/或(1,5)_鍵的α-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也稱為阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或α-L-阿拉伯聚糖酶。就本發(fā)明而言,α-L-阿拉伯呋喃糖苷酶活性是使用總體積200μ1中的每ml的IOOmM乙酸鈉pH5中5mg的中等粘性小麥阿拉伯木聚糖(MegazymeInternationalIreland,Ltd.,Bray,Co.Wicklow,Ireland)在40°C進(jìn)行30分鐘,接著通過(guò)AMINEXHPX-87H柱層析(Bio-IadLaboratories,Inc.,Hercules,CA,USA)的阿拉伯糖分析來(lái)確定的。纖維素材料纖維素材料可以是包含纖維素的任何材料。生物質(zhì)的初生細(xì)胞壁(primarycellwall)中的主要多糖是纖維素,其次最豐富的是半纖維素,而第三是果膠。次生細(xì)胞壁(secondarycellwall)在細(xì)胞停止生長(zhǎng)后產(chǎn)生,其同樣含有多糖并通過(guò)共價(jià)交聯(lián)至半纖維素的聚合木質(zhì)素而加強(qiáng)。纖維素是脫水纖維二糖的均聚物,并且因此是直鏈β-(1-4)-D-葡聚糖,而半纖維素包括多種化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的復(fù)雜分支結(jié)構(gòu)。盡管通常是多形的,存在于植物組織中的纖維素主要是平行葡聚糖鏈的不溶晶體基質(zhì)。半纖維素通常與纖維素以及其它半纖維素以氫鍵相連,其幫助穩(wěn)定細(xì)胞壁基質(zhì)。纖維素通常見(jiàn)于例如植物的莖、葉、殼、皮和穗軸,或樹(shù)的葉、枝和木材。纖維素材料可以是,但不限于,草本材料、農(nóng)業(yè)殘余物、林業(yè)殘余物、城市固體廢物、廢紙和紙漿與造紙廠殘余物(參見(jiàn),例如,Wiselogel等,1995,于HandbookonBioethanol(CharlesΕ·Wyman編),pp.105-118,Taylor&Francis,WashingtonD.C.;ffyman,1994,BioresourceTechnology50:3-16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25695-719;Mosier等,,1999,RecentProgressinBioconversionofLignocellulosics,于AdvancesinBiochemicalEngineering/Biotechnology,T.Scheper主編,Volume65,pp.23-40,Springer-Verlag,NewYork)。在本文中應(yīng)理解的是,纖維素可以是任何形式的木素纖維素,在混合基質(zhì)中包含木質(zhì)素、纖維素和半纖維素的植物細(xì)胞壁材料。在一個(gè)優(yōu)選的方面,纖維素材料是木素纖維素。在一個(gè)方面,纖維素材料是草本材料。在另一個(gè)方面,纖維素材料是農(nóng)業(yè)殘余物。在另一個(gè)方面,纖維素材料是林業(yè)殘余物。在另一個(gè)方面,纖維素材料是城市固體廢物。在另一個(gè)方面,纖維素材料是廢紙。在另一個(gè)方面,纖維素材料是紙漿和造紙廠殘余物。在另一個(gè)方面,纖維素材料是玉米秸稈。在另一個(gè)方面,纖維素材料是玉米纖維。在另一個(gè)方面,纖維素材料是玉米穗軸。在另一個(gè)方面,纖維素材料是橙皮。在另一個(gè)方面,纖維素材料是稻桿。在另一個(gè)方面,纖維素材料是麥桿。在另一個(gè)方面,纖維素材料是柳枝稷(switchgrass)。在另一個(gè)方面,纖維素材料是芒草屬。在另一個(gè)方面,纖維素材料是甘蔗渣。在另一個(gè)方面,纖維素材料是微晶纖維素。在另一個(gè)方面,纖維素材料是細(xì)菌纖維素。在另一個(gè)方面,纖維素材料是藻類纖維素。在另一個(gè)方面,纖維素材料是棉線頭(cotton1inter)0在另一個(gè)方面,纖維素材料是無(wú)定形的磷酸處理的纖維素。在另一個(gè)方面,纖維素材料是濾紙。纖維素材料可以直接使用或進(jìn)行預(yù)處理,使用本領(lǐng)域已知的常規(guī)方法,如本文所述。在一個(gè)優(yōu)選的方面,預(yù)處理纖維素材料。預(yù)處理的玉米秸稈術(shù)語(yǔ)“PCS”或“預(yù)處理的玉米秸稈“在本文中定義為通過(guò)用熱和稀硫酸處理的源自玉米秸稈的纖維素材料。分離的多肽術(shù)語(yǔ)“分離的多肽”用于本文中指從來(lái)源分離的多肽。在一個(gè)優(yōu)選的方面,多肽如通過(guò)SDS-PAGE測(cè)定的,為至少純,優(yōu)選至少5%純,更優(yōu)選至少10%純,更優(yōu)選至少20%純,更優(yōu)選至少40%純,更優(yōu)選至少60%純,甚至更優(yōu)選至少80%純,并且最優(yōu)選至少90%純?;旧霞兊亩嚯男g(shù)語(yǔ)“基本上純的多肽”在本文表示多肽制備物,所述多肽制備物含有按重量計(jì)至多10%,優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多5%,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1%,并且甚至最優(yōu)選至多0.5%的與其天然或重組結(jié)合的(associated)的其它多肽材料。因此,優(yōu)選所述基本上純的多肽是按存在于制備物中的全部多肽材料的重量計(jì)至少92%純,優(yōu)選至少94%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少97%純,更優(yōu)選至少98%純,甚至更優(yōu)選至少99%純,最優(yōu)選至少99.5%純,并且甚至最優(yōu)選100%純。本發(fā)明的多肽優(yōu)選是基本上純的形式。具體而言,優(yōu)選所述多肽是“基本上(essentially)純的形式”,即,所述多肽制備物基本上(essentially)不含與其天然或重組結(jié)合的其它多肽材料。例如,這能夠通過(guò)以下實(shí)現(xiàn)通過(guò)公知的重組方法或由經(jīng)典純化方法制備多肽。成熟多肽術(shù)語(yǔ)“成熟多肽”在本文中定義為以其在翻譯和任何翻譯后修飾之后的最終形式存在的多肽,所述修飾例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一個(gè)方面,根據(jù)預(yù)測(cè)SEQIDNO2的氨基酸1至19是信號(hào)肽的SignalP軟件(Nielsen等,1997,ProteinEngineering10:1_6),成熟多肽是SEQIDNO2的氨基酸20至856。成熟多肽編碼序列術(shù)語(yǔ)“成熟多肽編碼序列”在本文中定義為編碼具有β-葡糖苷酶活性的成熟多肽的核苷酸序列。在一個(gè)方面,根據(jù)預(yù)測(cè)SEQIDNO1的核苷酸1至57編碼信號(hào)肽的SignalP軟件(Nielsen等,1997,見(jiàn)上),成熟多肽編碼序列是SEQIDNO1的核苷酸58至2568。序列同一性參數(shù)“序列同一性”描述兩個(gè)氨基酸序列之間或兩個(gè)核苷酸序列之間的相關(guān)性。就本發(fā)明而言,兩個(gè)氨基酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMBOSSTheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276-277),優(yōu)選3.0.0版或更高版本的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)來(lái)測(cè)定。使用的可選參數(shù)為缺口罰分(gappenalty)10,缺口延伸罰分(gapextensionpenalty)0.5和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩陣。使用Needle標(biāo)記為“最高同一性(longestidentity)”的輸出結(jié)果(使用-nobrief選項(xiàng)獲得)作為同一性百分比,并計(jì)算如下(同樣的殘基X100)/(比對(duì)長(zhǎng)度-比對(duì)中缺口的總數(shù))就本發(fā)明而言,兩個(gè)核苷酸序列之間的序列同一性程度使用如EMBOSS軟件包(EMB0SS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,見(jiàn)上文),優(yōu)選3.0.0版或更高版本的Needle程序中所執(zhí)行的Needleman-Wunsch算法(Needleman和mmsch,1970,見(jiàn)上文)來(lái)測(cè)定。使用的可選參數(shù)為缺口罰分10,缺口延伸罰分0.5和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩陣。使用Needle標(biāo)記為“最高同一性”的輸出結(jié)果(使用-nobrief選項(xiàng)獲得)作為同一性百分比,并計(jì)算如下(同樣的脫氧核糖核苷酸X100)/(比對(duì)長(zhǎng)度-比對(duì)中缺口的總數(shù))同源序列術(shù)語(yǔ)“同源序列”在本文中定義為在用SEQIDNO:2的"Trichophaeasaccataβ—葡糖昔醇進(jìn)亍的tfasty搜索(Pearson,W.R.,1999,于BioinformaticsMethodsandProtocols中,S.Misener禾口S.A.Krawetz編,pp.185—219)中E值(或期望值)小于0.001的預(yù)測(cè)蛋白質(zhì)。多肽片段術(shù)語(yǔ)“多肽片段”在本文中定義為從SEQIDNO:2的成熟多肽或其同源序列的氨基和/或羧基末端缺失一個(gè)或多個(gè)(幾個(gè))氨基酸的多肽;其中所述片段具有β-葡糖苷酶活性。在一個(gè)方面,所述片段含有SEQIDNO2,SEQIDNO:2的成熟多肽或其同源序列的至少740個(gè)氨基酸殘基,更優(yōu)選至少770個(gè)氨基酸殘基,并且最優(yōu)選至少800個(gè)氨基酸殘基。亞序列術(shù)語(yǔ)“亞序列(subsequence)”在本文中定義為從SEQIDNO1或其同源序列的5’和/或3’端缺失一個(gè)或多個(gè)(幾個(gè))核苷酸的核苷酸序列;其中所述亞序列編碼具有β-葡糖苷酶活性的多肽片段。在一個(gè)方面,所述亞序列含有SEQIDΝ0:1的成熟多肽編碼序列或其同源序列的至少2220個(gè)核苷酸,更優(yōu)選至少2310個(gè)核苷酸,并且最優(yōu)選至少M(fèi)OO個(gè)核苷酸。等位變體(allelicvariant)術(shù)語(yǔ)“等位變體”在本文中表示占據(jù)相同染色體基因座的基因的任何兩種或更多種(幾種)可選形式。等位變異通過(guò)突變天然地發(fā)生,并且可導(dǎo)致種群內(nèi)的多態(tài)性?;蛲蛔兛梢允浅聊?在編碼的多肽中無(wú)變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。分離的多核苷酸術(shù)語(yǔ)“分離的多核苷酸”用于本文中指從來(lái)源分離的多核苷酸。在一個(gè)優(yōu)選的方面,多核苷酸如通過(guò)瓊脂糖電泳測(cè)定的,為優(yōu)選至少純,更優(yōu)選至少5%純,更優(yōu)選至少10%純,更優(yōu)選至少20%純,更優(yōu)選至少40%純,更優(yōu)選至少60%純,甚至更優(yōu)選至少80%純,并且最優(yōu)選至少90%純?;旧霞兊亩嗪塑账嵝g(shù)語(yǔ)“基本上純的多核苷酸”用于本文指不含其它外來(lái)的或不期望的核苷酸的多核苷酸制備物,并且所述多核苷酸制備物處于適合于在遺傳工程的蛋白質(zhì)生產(chǎn)體系中使用的形式。因此,基本上純的多核苷酸含有按重量計(jì)優(yōu)選至多10%,更優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多5%,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1%,并且甚至最優(yōu)選至多0.5%的與其天然或重組結(jié)合的其它多核苷酸材料。然而,基本上純的多核苷酸可以包括天然存在的5’和3’非翻譯區(qū),例如啟動(dòng)子和終止子。優(yōu)選基本上純的多核苷酸是按重量計(jì)優(yōu)選至少90%純,更優(yōu)選至少92%純,更優(yōu)選至少94%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少97%純,甚至更優(yōu)選至少98%純,最優(yōu)選至少99%,并且甚至最優(yōu)選至少99.5%純的。本發(fā)明所述多核苷酸優(yōu)選為基本上純的形式。具體而言,優(yōu)選在本文公開(kāi)的多核苷酸是“基本上(essentially)純的形式”,即,所述多核苷酸制備物基本上不含與其天然或重組結(jié)合的其它多核苷酸材料。所述多核苷酸可以是基因組、cDNA、RNA、半合成、合成來(lái)源的,或它們的任何組合。編碼序列當(dāng)用于本文時(shí)術(shù)語(yǔ)“編碼序列”的意思是直接指定其蛋白產(chǎn)物的氨基酸序列的核苷酸序列。編碼序列的邊界通常由開(kāi)讀框決定,所述開(kāi)讀框通常以ATG起始密碼子或可供選擇的起始密碼子例如GTG和TTG開(kāi)始,并且以終止密碼子例如TAA、TAG和TGA結(jié)束。編碼序列可以是DNA、cDNA、合成的或重組的核苷酸序列。cDNA:術(shù)語(yǔ)“cDNA”在本文中定義為能夠通過(guò)反轉(zhuǎn)錄從得自真核細(xì)胞的成熟的、已剪接的mRNA分子制備的DNA分子。cDNA缺少通常存在于相應(yīng)基因組DNA中的內(nèi)含子序列。起始的(initial)、初級(jí)的RNA轉(zhuǎn)錄物是mRNA的前體,其通過(guò)一系列的步驟加工然后作為成熟的已剪接的mRNA出現(xiàn)。這些步驟包括通過(guò)稱為剪接的過(guò)程去除內(nèi)含子序列。因而源自mRNA的cDNA沒(méi)有任何內(nèi)含子序列。核酸構(gòu)建體術(shù)語(yǔ)“核酸構(gòu)建體”用于本文指分離自天然存在的基因的單鏈或雙鏈的核酸分子,所述核酸分子受修飾以本來(lái)不存在于(nototherwiseexist)自然界中的方式含有核酸的區(qū)段。所述核酸構(gòu)建體亦可為“合成的”。當(dāng)所述核酸構(gòu)建體含有表達(dá)本發(fā)明的編碼序列所需的調(diào)控序列時(shí),術(shù)語(yǔ)核酸構(gòu)建體與術(shù)語(yǔ)“表達(dá)盒”同義。調(diào)控序列(controlsequence)術(shù)語(yǔ)“調(diào)控序列”在本文定義為包括對(duì)編碼本發(fā)明多肽的多核苷酸表達(dá)是必需的或有利的所有成分。各個(gè)調(diào)控序列對(duì)于編碼所述多肽的核苷酸序列可以是天然的或外源的,或各個(gè)調(diào)控序列對(duì)于彼此可以是天然的或外源的。這些調(diào)控序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、啟動(dòng)子、信號(hào)肽序列和轉(zhuǎn)錄終止子。最少的情況,調(diào)控序列包括啟動(dòng)子和轉(zhuǎn)錄和翻譯的終止信號(hào)。調(diào)控序列可以和用于引入特異性限制位點(diǎn)的接頭一起提供,所述特異性限制位點(diǎn)促進(jìn)調(diào)控序列與編碼多肽的核苷酸序列編碼區(qū)的連接??刹僮鞯剡B接術(shù)語(yǔ)“可操作地連接”在本文表示這樣的構(gòu)型,其中將調(diào)控序列置于相對(duì)于多核苷酸序列的編碼序列的適當(dāng)位置,使得調(diào)控序列指導(dǎo)多肽編碼序列的表達(dá)。表達(dá)術(shù)語(yǔ)“表達(dá)”包括涉及多肽產(chǎn)生的任何步驟,其包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。表達(dá)載體術(shù)語(yǔ)“表達(dá)載體”在本文定義為線性的或環(huán)狀的DNA分子,其包含編碼本發(fā)明多肽的多核苷酸,并且所述多核苷酸與提供用于其表達(dá)的額外核苷酸可操作地連接。宿主細(xì)胞如本文中所使用的術(shù)語(yǔ)“宿主細(xì)胞”包括任何細(xì)胞類型,所述細(xì)胞類型對(duì)于使用包含本發(fā)明多核苷酸的核酸構(gòu)建體或表達(dá)載體的轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等是易感的(susceptible)0修飾術(shù)語(yǔ)“修飾”在本文的意思是,對(duì)包含SEQIDNO2的成熟多肽的多肽,或由SEQIDNO:2的成熟多肽組成的多肽或其同源序列的任何化學(xué)修飾,以及對(duì)編碼所述多肽的DNA的遺傳操作。所述修飾可以是一個(gè)或多個(gè)(幾個(gè))氨基酸的取代、缺失和/或插入,以及一個(gè)或多個(gè)(幾個(gè))氨基酸側(cè)鏈的置換。人工變體當(dāng)用在本文時(shí),術(shù)語(yǔ)“人工變體”的意思是具有β-葡糖苷酶活性的多肽,所述多肽由表達(dá)SEQIDNO:1的成熟多肽編碼序列或其同源序列的修飾的核苷酸序列的生物體產(chǎn)生。所述修飾的核苷酸序列通過(guò)人為干預(yù)(humanintervention),通過(guò)修飾公開(kāi)于SEQIDNO:1或它們的同源序列的核苷酸序列來(lái)獲得。發(fā)明詳述具有β-葡糖苷酶活性的多肽在第一個(gè)方面,本發(fā)明涉及包含氨基酸序列的分離的多肽,所述氨基酸序列與SEQIDNO2的成熟多肽具有優(yōu)選至少60%,更優(yōu)選至少65%,更優(yōu)選至少70%,更優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,并且甚至最優(yōu)選至少96%、至少97%、至少98%或至少99%的序列同一性程度,所述多肽具有β-葡糖苷酶活性(下文中的“同源多肽”)。在一個(gè)優(yōu)選的方面,所述同源多肽包含氨基酸序列,其與SEQIDNO2的成熟多肽相差十個(gè)氨基酸,優(yōu)選相差五個(gè)氨基酸,更優(yōu)選相差四個(gè)氨基酸,甚至更優(yōu)選相差三個(gè)氨基酸,最優(yōu)選相差兩個(gè)氨基酸,并且甚至最優(yōu)選相差一個(gè)氨基酸。本發(fā)明的多肽優(yōu)選包含SEQIDNO2的氨基酸序列或其等位變體;或它們的具有β-葡糖苷酶活性的片段。在一個(gè)優(yōu)選的方面,多肽包含SEQIDNO:2的氨基酸序列。在另一個(gè)優(yōu)選方面,多肽包含SEQIDNO:2的成熟多肽。在另一個(gè)優(yōu)選方面,多肽包含SEQIDNO:2的氨基酸20至856,或其等位變體;或它們的具有β-葡糖苷酶活性的片段。在另一個(gè)優(yōu)選方面,多肽包含SEQIDNO:2的氨基酸20至856。在另一個(gè)優(yōu)選方面,多肽由SEQIDNO2的氨基酸序列或其等位變體;或它們的具有β-葡糖苷酶活性的片段組成。在另一個(gè)優(yōu)選方面,多肽由SEQIDNO2的氨基酸序列組成。在另一個(gè)優(yōu)選方面,多肽由SEQIDNO2的成熟多肽組成。在另一個(gè)優(yōu)選方面,多肽由SEQIDNO2的氨基酸20至856或其等位變體;或它們的具有β-葡糖苷酶活性的片段組成。在另一個(gè)優(yōu)選方面,多肽由SEQIDNO2的氨基酸20至856組成。在第二個(gè)方面,本發(fā)明涉及具有葡糖苷酶活性的分離的多肽,所述分離的多肽由多核苷酸編碼,所述多核苷酸在優(yōu)選非常低嚴(yán)格條件下,優(yōu)選低嚴(yán)格條件下,更優(yōu)選中嚴(yán)格條件下,更優(yōu)選中-高嚴(yán)格條件下,甚至更優(yōu)選高嚴(yán)格條件下,并且最優(yōu)選非常高嚴(yán)格條件下,與以下雜交(i)SEQIDNO:1的成熟多肽編碼序列,(ii)包含SEQIDN0:1的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的全長(zhǎng)互補(bǔ)鏈(J.Sambrook,Ε·F.Fritsch,禾口Τ·Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO:1的核苷酸序列或其亞序列,以及SEQIDNO2的氨基酸序列或其片段,可用于設(shè)計(jì)核酸探針,以根據(jù)本領(lǐng)域內(nèi)公知的方法從不同屬和種的菌株鑒定和克隆編碼具有β-葡糖苷酶活性的多肽的DNA。具體而言,根據(jù)標(biāo)準(zhǔn)的Southern印跡方法,可將這些探針用于與感興趣的屬或種的基因組或cDNA雜交,以鑒定和從其中分離相應(yīng)的基因。這些探針可明顯短于完整序列,但長(zhǎng)度上應(yīng)為至少14,優(yōu)選至少25,更優(yōu)選至少35,并且最優(yōu)選至少70個(gè)核苷酸。然而,優(yōu)選所述核酸探針是至少100個(gè)核苷酸長(zhǎng)度。例如,所述核酸探針的長(zhǎng)度可為至少200個(gè)核苷酸,優(yōu)選至少300個(gè)核苷酸,更優(yōu)選至少400個(gè)核苷酸,或最優(yōu)選至少500個(gè)核苷酸??墒褂蒙踔粮L(zhǎng)的探針,例如長(zhǎng)度為優(yōu)選至少600個(gè)核苷酸,更優(yōu)選至少700個(gè)核苷酸,甚至更優(yōu)選至少800個(gè)核苷酸,或最優(yōu)選至少900個(gè)核苷酸的核酸探針。DNA和RNA探針二者均可使用。通常將探針標(biāo)記以探測(cè)相應(yīng)的基因(例如,用%P、3H、35S、生物素或抗生物素蛋白(avidin)標(biāo)記)。這些探針涵蓋于本發(fā)明中。因而,可從由這些其它生物體制備的基因組DNA或cDNA文庫(kù)中篩選DNA,所述DNA與上述探針雜交并且編碼具有β-葡糖苷酶活性的多肽??梢酝ㄟ^(guò)瓊脂糖或聚丙烯酰胺凝膠電泳,或通過(guò)其它分離技術(shù)分離來(lái)自這些其它生物體的基因組或其它DNA。可以將來(lái)自文庫(kù)的DNA或分離的DNA轉(zhuǎn)移至硝化纖維素(nitrocellulose)或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDNO:1或其亞序列同源的克隆或DNA,將所述載體材料優(yōu)選用在Sounthern印跡中。就本發(fā)明而言,雜交表示核苷酸序列在非常低至非常高的嚴(yán)格條件下與標(biāo)記的核酸探針雜交,所述核酸探針對(duì)應(yīng)于SEQIDNO:1的成熟多肽編碼序列;包含SEQIDN0:1的成熟多肽編碼序列的基因組DNA序列;其全長(zhǎng)互補(bǔ)鏈;或它們的亞序列??墒褂美鏧射線片(X-rayfilm)檢測(cè)在這些條件下與核酸探針雜交的分子。在一個(gè)優(yōu)選的方面,核酸探針是SEQIDNO:1的成熟多肽編碼序列。在另一個(gè)優(yōu)選方面,核酸探針是SEQIDNO:1的核苷酸58至2568。在另一個(gè)優(yōu)選方面,核酸探針是編碼SEQIDNO:2的多肽的多核苷酸序列,或其亞序列。在另一個(gè)優(yōu)選方面,核酸探針是SEQIDNO:1。在另一個(gè)優(yōu)選方面,核酸探針是包含在大腸桿菌(E.coli)NRRLB-50214中的質(zhì)粒pAHYG-33中含有的多核苷酸序列,其中所述其多核苷酸序列編碼具有β-葡糖苷酶活性的多肽。在另一個(gè)優(yōu)選方面,核酸探針是包含在大腸桿菌NRRLΒ-50214中的質(zhì)粒pAHYG-33中含有的成熟多肽編碼區(qū)。對(duì)于長(zhǎng)度至少100個(gè)核苷酸的長(zhǎng)探針,將非常低至非常高的嚴(yán)格條件定義為在42°C,在5XSSPE、0.3%SDS、200yg/ml已剪切并且變性的鮭精DNA中,并且對(duì)于非常低和低嚴(yán)格性為25%的甲酰胺、對(duì)于中和中-高嚴(yán)格性為35%的甲酰胺、或?qū)τ诟吆头浅8邍?yán)格性為50%的甲酰胺,根據(jù)標(biāo)準(zhǔn)的Southern印跡法進(jìn)行預(yù)雜交和雜交最佳12至M小時(shí)。對(duì)于長(zhǎng)度為至少100個(gè)核苷酸的長(zhǎng)探針,使用2XSSC、0.2%SDS優(yōu)選至少在450C(非常低嚴(yán)格性),更優(yōu)選至少在50°C(低嚴(yán)格性),更優(yōu)選至少在55°C(中嚴(yán)格性),更優(yōu)選至少在60°C(中-高嚴(yán)格性),甚至更優(yōu)選至少在65°C(高嚴(yán)格性),并且最優(yōu)選至少在70°C(非常高嚴(yán)格性)將載體材料最終洗滌三次,每次15分鐘。對(duì)于長(zhǎng)度大約15個(gè)核苷酸至大約70個(gè)核苷酸的短探針,將嚴(yán)格條件定義為在比牛艮據(jù)Bolton禾口McCarthy計(jì)算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)得出的Tm低大約5°C至大約10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,1XDenhardt溶液,ImM焦磷酸鈉(sodiumpyrophosphate),ImM舞酸二S1I內(nèi)(sodiummonobasicphosphate),0.ImMATP禾口0.2mg每ml的酵母RNA中,根據(jù)標(biāo)準(zhǔn)的Southern印跡步驟進(jìn)行預(yù)雜交、雜交和雜交后洗滌最佳12至M小時(shí)。對(duì)于長(zhǎng)度大約15個(gè)核苷酸至大約70個(gè)核苷酸的短探針,將所述載體材料在6XSSC加0.1%SDS中洗滌一次15分鐘,并用6XSSC在比計(jì)算的Tm低5°C至10°C的溫度洗滌兩次,每次15分鐘。在第三個(gè)方面,本發(fā)明涉及由包含核苷酸序列或由核苷酸序列組成的多核苷酸編碼的具有β-葡糖苷酶活性的分離的多肽,所述核苷酸序列與SEQIDNO1的成熟多肽編碼序列具有優(yōu)選至少60%,更優(yōu)選至少65%,更優(yōu)選至少70%,更優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,并且甚至最優(yōu)選至少96%,至少97%,至少98%,或者至少99%的序列同一性程度,其編碼具有β-葡糖苷酶活性的多肽。參見(jiàn)本文的多核苷酸部分。在第四個(gè)方面,本發(fā)明涉及SEQIDNO:2的成熟多肽或其同源序列的包含取代、缺失和/或插入一個(gè)或多個(gè)(幾個(gè))氨基酸的人工變體。優(yōu)選地,氨基酸改變對(duì)性質(zhì)是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質(zhì)的折疊和/或活性;通常為1至大約30個(gè)氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸殘基;多至大約20-25個(gè)殘基的小接頭肽;或通過(guò)改變凈電荷或其它功能來(lái)促進(jìn)純化的小延伸,如多組氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)結(jié)合域(bindingdomain)。保守取代的實(shí)例是在以下組之內(nèi)堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領(lǐng)域已知的,并且由例如H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/^er、Val/Ile、Asp/Glu、Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val、Ser/Gly,Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu禾口Asp/Gly。除了20個(gè)基本氨基酸,非基本氨基酸(例如4-羥脯氨酸、6-N-甲基賴氨酸、2_氨基異丁酸、異纈氨酸和α-甲基絲氨酸)可以取代野生型多肽的氨基酸殘基。有限數(shù)量的非保守氨基酸、不由遺傳密碼編碼的氨基酸和非天然氨基酸可以取代氨基酸殘基?!胺翘烊话被帷痹诘鞍踪|(zhì)合成后已經(jīng)過(guò)修飾,和/或在它們的側(cè)鏈具有不同于基本氨基酸的化學(xué)結(jié)構(gòu)。非天然氨基酸能夠以化學(xué)方法合成,并且優(yōu)選是商業(yè)上能夠獲得的,包括六氫吡啶羧酸(pipecolicacid)、噻唑燒羧酸(thiazolidinecarboxylicacid)、脫氫脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸??晒┻x擇的是,氨基酸改變具有這樣的性質(zhì)以使多肽的物理化學(xué)性質(zhì)改變。例如,氨基酸改變可改進(jìn)多肽的熱穩(wěn)定性,改變底物特異性,改變最適PH等。能夠根據(jù)本領(lǐng)域已知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(Cunningham和Wells,1989,ScienceM41081-1085)來(lái)鑒定親本多肽中的必需氨基酸。在后一技術(shù)中,將單一丙氨酸突變引入到分子中的每個(gè)殘基,并且測(cè)試所得突變分子的生物活性(即,β-葡糖苷酶活性)以鑒定對(duì)于所述分子的活性關(guān)鍵的氨基酸殘基。同樣參見(jiàn)Hilton等,1996,J.Biol.Chem.271=4699-47080酶的活性部位或其它的生物相互作用也能夠通過(guò)結(jié)構(gòu)的物理分析而測(cè)定,如通過(guò)以下這些技術(shù)如核磁共振、晶體學(xué)、電子衍射或光親和標(biāo)記,連同推定的接觸位點(diǎn)氨基酸的突變來(lái)測(cè)定。參見(jiàn)例如deVos等,1992,Science255306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,F(xiàn)EBSLett.30959-64。必需氨基酸的身份(identity)也能夠從與多肽的同一性分析來(lái)推斷,所述多肽與根據(jù)本發(fā)明的多肽相關(guān)。能夠使用已知的誘變、重組和/或改組(shuffling)方法,然后是有關(guān)的篩選方法,例如那些由Reidhaar-Olson禾ΠSauer,1988,Science241:53-57;Bowie禾ΠSauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;或W095/2^25公開(kāi)的那些方法來(lái)進(jìn)行并測(cè)試單個(gè)或多個(gè)氨基酸取代。能夠使用的其它方法包括易錯(cuò)PCR、噬菌體展示(例如,Lowman等,1991,Biochem.30:10832-10837;美國(guó)專利No.5,223,409;WO92/06204)和區(qū)域定向的誘變(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7127)。誘變/改組方法能夠與高通量、自動(dòng)化的篩選方法組合以檢測(cè)由宿主細(xì)胞表達(dá)的克隆的、誘變的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能夠從宿主細(xì)胞回收編碼活性多肽的誘變的DNA分子,并且使用本領(lǐng)域內(nèi)標(biāo)準(zhǔn)方法快速測(cè)序。這些方法允許快速測(cè)定感興趣的多肽中單個(gè)氨基酸殘基的重要性,并且能夠應(yīng)用于未知結(jié)構(gòu)的多肽。SEQIDNO:2的成熟多肽的氨基酸取代、缺失和/或插入的總數(shù)是10,優(yōu)選9,更優(yōu)選8,更優(yōu)選7,更優(yōu)選6,更優(yōu)選5,更優(yōu)選4,甚至更優(yōu)選3,最優(yōu)選2,并且甚至最優(yōu)選1。本發(fā)明的多肽還包括融合多肽或可切割的融合多肽,其中將另外的多肽融合到所述多肽或其片段的N末端或C末端。通過(guò)將編碼另一個(gè)多肽的核苷酸序列(或其部分)融合于本發(fā)明的核苷酸序列(或其部分)來(lái)產(chǎn)生融合的多肽。產(chǎn)生融合多肽的技術(shù)是本領(lǐng)域已知的,并包括連接編碼多肽的編碼序列以使它們?cè)陂喿x框中,并且使融合多肽的表達(dá)在相同啟動(dòng)子和終止子的控制下。融合多肽還可以包括切割位點(diǎn)。一旦分泌了融合多肽,就切割所述位點(diǎn),從融合蛋白質(zhì)釋放具有葡糖苷酶活性的多肽。切割位點(diǎn)的實(shí)例包括,但不限于,編碼二肽Lys-Arg的Kex2位點(diǎn)(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina,2000,J.Biotechnol.76:245-251;Rasmussen-ffilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381);Ile_(Glu或Asp)-Gly-Arg位點(diǎn),其在精氨酸殘基后通過(guò)lectorXa蛋白酶切害Ij(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位點(diǎn),其在賴氨酸后通過(guò)腸激酶切割(Collins-Racie等,1995,Biotechnology13:982-987);His-Tyr-Glu位點(diǎn)或His-Tyr-Asp位點(diǎn),其通過(guò)GenenaseI切割(Carter等,1989,ProteinsStructure,Function,andGenetics6:240-248);Leu-Val-Pro-Arg-Gly-Ser位點(diǎn),其在Arg后通過(guò)凝血酶切割Gtevens,2003,DrugDiscoveryWorld4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位點(diǎn),其在Gln后通過(guò)TEV蛋白酶切割6tevens,2003,見(jiàn)上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位點(diǎn),其在Gln后通過(guò)基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,見(jiàn)上文)。具有β-葡糖苷酶活性的多肽的來(lái)源本發(fā)明的具有β-葡糖苷酶活性的多肽可以獲得自任何屬的微生物。就本發(fā)明而言,用于本文與給定的來(lái)源有關(guān)的術(shù)語(yǔ)“獲得自”,意思是核苷酸序列編碼的多肽由所述來(lái)源產(chǎn)生,或由其中插入了來(lái)自所述來(lái)源的核苷酸序列的菌株產(chǎn)生。在一個(gè)優(yōu)選的方面,獲得自給定來(lái)源的多肽是胞外分泌的。本發(fā)明具有葡糖苷酶活性的多肽可以是細(xì)菌多肽。例如,所述多肽可以是具有葡糖苷酶活性的革蘭氏陽(yáng)性細(xì)菌多肽例如芽孢桿菌屬(Bacillus)、鏈球菌屬(Streptococcus)、鏈霉菌屬(Streptomyces)、葡萄球菌屬(Staphylococcus)、腸球菌屬(Enterococcus)、乳桿菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、梭菌屬(Clostridium)、地芽孢桿菌屬(Geobacillus)或海洋芽孢桿菌屬(Oceanobacillus)多肽;或具有β-葡糖苷酶活性的革蘭氏陰性細(xì)菌多肽,如大腸桿菌(E.coli)、假單胞菌屬(Pseudomonas)、沙門(mén)氏菌屬(Salmonella)、彎曲桿菌屬(Campylobacter)、螺桿菌屬(Helicobacter)、黃桿菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)、泥桿菌屬(Ilyobacter)、奈瑟氏菌屬(Neisseria)或脲原體屬(Ureaplasma)屬多肽。在一個(gè)優(yōu)選方面,所述多肽是具有β-葡糖苷酶活性的嗜堿芽孢桿菌(Bacillusalkalophilus)λt^i^^^ifelfS"(Bacillusamyloliquefaciens)、失豆Ii包|干胃(Bacillusbrevis)、環(huán)狀芽孢桿菌(Bacilluscirculans)、克勞氏芽孢桿菌(Bacillusclausii)、凝結(jié)芽孢桿菌(Bacilluscoagulms)、堅(jiān)強(qiáng)芽孢桿菌(Bacillusfirmus)、燦爛芽孢桿菌(Bacilluslautus)、遲緩芽孢桿菌(Bacilluslentus)、地衣芽孢桿菌(Bacilluslicheniformis)、巨大芽孢桿菌(Bacillusmegaterium)、短小芽孢桿菌(Bacilluspumilus)、嗜熱月旨肪芽孢桿菌(Bacillusstearothermophilus)、枯草芽孢桿菌(Bacillussubtilis)或蘇云金芽孢桿菌(Bacillusthuringiensis)多肽。在另一個(gè)優(yōu)選的方面,所述多肽是具有β_葡糖苷酶活性的似馬鏈球菌(Streptococcusequisimilis)、酉良月農(nóng)鏈球菌(Streptococcuspyogenes)、乳房鏈球菌(Streptococcusuberis)或馬鏈球菌獸痕亞禾中(Streptococcusequisubsp.Zooepidemicus)多月太。CN102388134A說(shuō)明書(shū)15/60在另一個(gè)優(yōu)選的方面,所述多肽是具有葡糖苷酶活性的不產(chǎn)色鏈霉菌(Streptomycesachromogenes)、除蟲(chóng)鏈霉菌(Streptomycesavermitilis)、天藍(lán)鏈霉菌(Streptomycescoelicolor)、灰色鏈霉菌(Streptomycesgriseus)或淺青紫鏈霉菌(Streptomyceslividans)多月太。本發(fā)明具有纖維素分解增強(qiáng)活性的多肽也可以是真菌多肽,并且更優(yōu)選具有β-葡糖苷酶活性的酵母多肽如假絲酵母屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Picha)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)或西洋蓍霉屬(Yarrowia)多肽;或更優(yōu)選具有β_葡糖苷酶活性的絲狀真菌多肽如枝頂孢霉屬(Acremonium)、傘菌屬(Agaricus)、鏈格孢屬(Alternaria)、曲霉屬(Aspergillus)>短梗霉屬(Aureobasidium)、Botryospaeria、擬賭菌屬(Ceriporiopsis)、毛_殼屬(Chaetomidium)>金包子菌屬(Chrysosporium)>Claviceps>Cochliobolus、鬼傘屬(Coprinopsis)>Coptotermes、棒囊殼屬(Corynascus)、β急叢赤殼菌屬(Cryphonectria)>隱球菌屬(Cryptococcus)、色二孢屬(Diplodia)、黑耳屬(Exidia)、Filibasidium、鐮孢屬(Fusarium)、赤霉屬(Gibberella)、全鞭毛蟲(chóng)屬(Holomastigotoides)、腐質(zhì)霄屬(Humicola)、奉巴齒菌屬(Irpex)、蘑范屬(Lentinula)、Leptospaeria、梨抱菌屬(Magnaporthe)、Melanocarpus、多孑L菌屬(Meripilus)、毛霄屬(Mucor)、毀絲霄屬(Myceliophthora)、新考瑪脂霉屬(Neocallimastix)、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、平革菌屬(Phanerochaete)、瘤胃壺菌屬(Piromyces)、Poitrasia>j[xHlifM(Pseudoplectania)、Pseudotrichonympha>根毛霉屬(Rhizomucor)、裂褶菌屬(Schizophyllum)、柱頂孢屬(Scytalidium)、踝節(jié)菌屬(Talaromyces)、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬CThielavia)、彎頸霉屬(Tolypocladium)、木霉屬(Trichoderma)、長(zhǎng)毛盤(pán)菌屬(Trichophaea)、輪枝孢屬(Verticillium)、包腳菇屬(Volvariella)或炭角菌屬(Xylaria)多肽。在一個(gè)優(yōu)選的方面,所述多肽是具有β-葡糖苷酶活性的卡爾酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克魯弗酵母(Saccharomyceskluyveri)、諾地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一個(gè)優(yōu)選的方面,所述多肽是具有葡糖苷酶活性的解纖維枝頂孢霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、煙曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、構(gòu)巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角質(zhì)金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、熱帶金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChrysosporiumzonatum、桿抱狀德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、庫(kù)威,廉抱(Fusariumcrookwellense)、大刀,廉抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、異抱德抱(Fusariumheterosporum)、合歡木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉紅德抱(Fusariumroseum)、接骨木德抱(Fusariumsambucinum)、膚色德抱(Fusariumsarcochroum)、擬分枝抱德抱(Fusariumsporotrichioides)、硫色,廉抱(Fusariumsulphureum)、圓德抱(Fusariumtorulosum)、擬絲抱,廉抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰腐質(zhì)霉(Humicolagrisea)、特異腐質(zhì)毒(Humicolainsolens)、疏棉狀腐質(zhì)毒(Humicolalanuginosa)、白奉巴齒菌(Irpexlacteus)、^■€#(Mucormiehei)、口f%gig_(Myceliophthorathermophila)、粗糙脈孢菌(Neurosporacrassa)、繩狀青霉(Penicilliumfuniculosum)、產(chǎn)紫青霉(Penicilliumpurpurogenum)、黃包平革菌(Phanerochaetechrysosporium)、無(wú)色梭包殼(Thielaviaachromatica)、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭抱殼(Thielaviaaustraleinsis)、Thielaviafimeti、小抱梭抱殼(Thielaviamicrospora)、卵抱梭抱殼(Thielaviaovispora)、Thielaviaperuviana、瘤抱梭抱殼(Thielaviaspededonium))^(Thielaviasetosa)、Thielaviasubthermophila、zhtMJfe_(Thielaviaterrestris)λ3^^7^(Trichodermaharzianum)(Trichodermakoningii)、長(zhǎng)枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或綠色木霉(Trichodermaviride)多肽。在另一個(gè)優(yōu)選的方面,所述多肽是具有β-葡糖苷酶活性的iTrichophaeaabundans、TrichophaeaTrichophaeacontradict^、TrichophaeahemisphaerioidesΛTrichophaeaminutaTrichophaeasaccata^SX在一個(gè)更優(yōu)選的方面,所述多肽是具有β-葡糖苷酶活性的Trichophaeasaccata多肽。在一個(gè)最優(yōu)選的方面,所述多肽是具有β_葡糖苷酶活性的TrichophaeasaccataCBS804.70多肽,例如包含SEQIDNO2的氨基酸序列的多肽??衫斫獾氖菍?duì)于前述的種,本發(fā)明包含完全和不完全階段(perfectandimperfectstates),和其它分類學(xué)的等同物(equivalent),例如無(wú)性型(anamorph),而無(wú)論它們已知的種名。本領(lǐng)域熟練技術(shù)人員將容易地識(shí)別適合的等同物的同一性。這些種的菌株在許多培養(yǎng)物保藏中心對(duì)于公眾能夠容易地取得,所述保藏中心諸如美國(guó)典型培養(yǎng)物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和細(xì)胞培養(yǎng)物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農(nóng)業(yè)研究機(jī)構(gòu)專利培養(yǎng)物保藏中心北區(qū)研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探針從其它來(lái)源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物鑒定和獲得這些多肽。用于從天然生境(habitat)分離微生物的技術(shù)是本領(lǐng)域內(nèi)公知的。隨后可通過(guò)相似地篩選這種微生物的基因組或cDNA文庫(kù)來(lái)獲得所述多核苷酸。一旦用所述探針檢測(cè)到編碼多肽的多核苷酸,就能夠使用本領(lǐng)域普通技術(shù)人員熟知的技術(shù)將所述多核苷酸分離或克隆(參見(jiàn),例如,Sambrook等,1989,見(jiàn)上文)。多核苷酸本發(fā)明還涉及分離的多核苷酸,其包含編碼本發(fā)明具有葡糖苷酶活性的多肽的核苷酸序列,或由編碼本發(fā)明具有β-葡糖苷酶活性的多肽的核苷酸序列組成。在一個(gè)優(yōu)選的方面,核苷酸序列包含SEQIDNO1或由SEQIDNO1組成。在另一個(gè)更優(yōu)選的方面,核苷酸序列包含大腸桿菌NRRLΒ-50214中所含質(zhì)粒pAHYG_33中所含的序列,或由大腸桿菌NRRLB-50214中所含質(zhì)粒pAHYG-33中所含的序列組成。在另一個(gè)優(yōu)選方面,核苷酸序列包含SEQIDNO1的成熟多肽編碼序列或由SEQIDNO=I的成熟多肽編碼序列組成。在另一個(gè)優(yōu)選方面,核苷酸序列包含SEQIDNO:1的核苷酸58至2568或由SEQIDNO1的核苷酸58至2568組成。在另一個(gè)更優(yōu)選的方面,核苷酸序列包含大腸桿菌NRRLB-50214中所含質(zhì)粒pAHYG-33中含有的成熟多肽編碼序列或由大腸桿菌NRRLB-50214中所含質(zhì)粒pAHYG-33中含有的成熟多肽編碼序列組成。本發(fā)明還涵蓋編碼多肽的核苷酸序列,所述多肽包含SEQIDNO:2的氨基酸序列或其成熟多肽,或由SEQIDNO2的氨基酸序列或其成熟多肽組成;由于遺傳密碼的簡(jiǎn)并性,所述核苷酸序列分別不同于SEQIDNO:1或其成熟多肽編碼序列。本發(fā)明還涉及SEQIDNO1的亞序列,所述亞序列編碼具有β-葡糖苷酶活性的SEQIDNO2的片段。本發(fā)明還涉及突變多核苷酸,所述突變多核苷酸在SEQIDNO1的成熟多肽編碼序列中包含至少一個(gè)突變,或由在SEQIDNO:1的成熟多肽編碼序列中具有至少一個(gè)突變的核苷酸組成,其中所述突變核苷酸序列編碼SEQIDNO2的成熟多肽。用于分離或克隆編碼多肽的多核苷酸的技術(shù)是本領(lǐng)域內(nèi)已知的,包括從基因組DNA分離,從cDNA制備,或其組合??赏ㄟ^(guò)例如使用熟知的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或表達(dá)文庫(kù)的抗體篩選來(lái)檢測(cè)具有共有結(jié)構(gòu)特性的克隆DNA片段,從而實(shí)現(xiàn)從這種基因組DNA克隆本發(fā)明的多核苷酸。參見(jiàn),例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork??梢允褂闷渌怂釘U(kuò)增方法,如連接酶鏈?zhǔn)椒磻?yīng)(LCR)、連接活化轉(zhuǎn)錄(ligatedactivatedtranscription;LAT)和基于核苷酸序列的擴(kuò)增(NASBA)??梢詮拈L(zhǎng)毛盤(pán)菌屬(Trichophaea)菌株,或其它或相關(guān)生物體克隆多核苷酸,并且因此可為例如所述核苷酸序列的多肽編碼區(qū)的等位基因變體或種變體(speciesvariant)0本發(fā)明還涉及包含核苷酸序列或由核苷酸序列組成的分離的多核苷酸,所述核苷酸序列與SEQIDNO:1的成熟多肽編碼序列具有優(yōu)選至少60%,更優(yōu)選至少65%,更優(yōu)選至少70%,更優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,并且甚至最優(yōu)選至少96%,至少97%,至少98%,或者至少99%的序列同一性程度,其編碼具有葡糖苷酶活性的多肽。修飾編碼本發(fā)明多肽的核苷酸序列對(duì)于合成與所述多肽基本上相似的多肽可為必需的。術(shù)語(yǔ)與所述多肽“基本上相似”指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于從其天然來(lái)源分離的多肽,例如,比活性、熱穩(wěn)定性、最適PH等方面不同的人工變體??梢栽谧鳛镾EQIDNO:1的多肽編碼序列存在的核苷酸序列,例如其亞序列的基礎(chǔ)上,和/或通過(guò)引入如下核苷酸取代來(lái)構(gòu)建變體序列所述取代不產(chǎn)生由核苷酸序列編碼的多肽的另外的氨基酸序列,但是符合意欲產(chǎn)生酶的宿主生物體的密碼子選擇;或者所述取代可產(chǎn)生不同的氨基酸序列。關(guān)于核苷酸取代的概述,參見(jiàn),例如,F(xiàn)ord等,1991,ProteinExpressionandPurification2:95一107。對(duì)于本領(lǐng)域技術(shù)人員顯而易見(jiàn)的是,這些取代能夠在對(duì)于分子功能重要的區(qū)域之外進(jìn)行,并且仍然產(chǎn)生活性多肽。對(duì)于由本發(fā)明的分離的多核苷酸編碼的多肽活性關(guān)鍵的并且因此優(yōu)選不進(jìn)行取代的氨基酸殘基,可以根據(jù)本領(lǐng)域公知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(參見(jiàn),例如,Cunningham和Wells,1989,見(jiàn)上文)來(lái)鑒定。在后一技術(shù)中,將突變引入到分子中的每個(gè)荷正電的殘基處,并且測(cè)試所得突變分子的葡糖苷酶活性,以鑒定對(duì)于所述分子的活性關(guān)鍵的氨基酸殘基。底物-酶相互作用的位點(diǎn)也能夠通過(guò)分析三維結(jié)構(gòu)測(cè)定,通過(guò)如核磁共振分析、晶體學(xué)或光親和標(biāo)記這樣的技術(shù)來(lái)測(cè)定(參見(jiàn),例如,deVos等,1992,見(jiàn)上文;Smith等,1992,見(jiàn)上文;Wlodaver等,1992,見(jiàn)上文)。本發(fā)明還涉及編碼本發(fā)明多肽的分離的多核苷酸,所述分離的多核苷酸在優(yōu)選非常低嚴(yán)格條件下,更優(yōu)選低嚴(yán)格條件,更優(yōu)選中等嚴(yán)格條件,更優(yōu)選中-高嚴(yán)格條件,甚至更優(yōu)選高嚴(yán)格條件,并且最優(yōu)選非常高的嚴(yán)格條件下,與以下序列雜交(i)SEQIDNO1的成熟多肽編碼序列,(ii)包含SEQIDNO:1的成熟多肽編碼序列的基因組DNA序列,或(iii)⑴或()的全長(zhǎng)互補(bǔ)鏈;或它們的等位變體和亞序列(Sambrook等,1989,見(jiàn)上文),如本文所定義的。本發(fā)明還涉及分離的多核苷酸,所述分離的多核苷酸通過(guò)以下方法獲得(a)在優(yōu)選非常低嚴(yán)格條件下,更優(yōu)選低嚴(yán)格條件,更優(yōu)選中等嚴(yán)格條件,更優(yōu)選中-高嚴(yán)格條件,甚至更優(yōu)選高嚴(yán)格條件,并且最優(yōu)選非常高的嚴(yán)格條件下,將DNA群體與以下雜交(i)SEQIDNO:1的成熟多肽編碼序列,(ii)包含SEQIDNO:1的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的全長(zhǎng)互補(bǔ)鏈;和(b)分離雜交的多核苷酸,其編碼具有β-葡糖苷酶活性的多肽。核酸構(gòu)建體本發(fā)明還涉及包含本發(fā)明的分離的多核苷酸的核酸構(gòu)建體,所述分離的多核苷酸與一個(gè)或多個(gè)(幾個(gè))調(diào)控序列可操作地連接,所述調(diào)控序列在合適的宿主細(xì)胞中在與該調(diào)控序列相容的條件下指導(dǎo)編碼序列的表達(dá)??梢杂迷S多方式操作編碼本發(fā)明多肽的分離的多核苷酸以提供多肽的表達(dá)。依賴于表達(dá)載體,在將多核苷酸的序列插入載體之前對(duì)其進(jìn)行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸序列的技術(shù)是本領(lǐng)域熟知的。調(diào)控序列可以是適當(dāng)?shù)膯?dòng)子序列,其是由用于表達(dá)編碼本發(fā)明多肽的多核苷酸的宿主細(xì)胞識(shí)別的核苷酸序列。啟動(dòng)子序列含有介導(dǎo)多肽的表達(dá)的轉(zhuǎn)錄調(diào)控序列。啟動(dòng)子可以是在所選的宿主細(xì)胞中顯示轉(zhuǎn)錄活性的任何核苷酸序列,包括突變的、截短的和雜合的啟動(dòng)子,并且可以從編碼與宿主細(xì)胞同源或異源的胞外或胞內(nèi)多肽的基因獲得。用于指導(dǎo)本發(fā)明的核酸構(gòu)建體轉(zhuǎn)錄,特別是在細(xì)菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動(dòng)子的實(shí)例是從下述獲得的啟動(dòng)子大腸桿菌Iac操縱子、天藍(lán)鏈霉菌瓊脂糖酶基因(dagA)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽淀粉酶基因(amyM)、解淀粉芽孢桿菌α_淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因和原核β-內(nèi)酰胺酶基因(ViIla-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),\)JsRtac(DeBoerφ,1983,ProceedingsoftheNationalAcademyofSciencesUSA80:21—25)。另外的啟動(dòng)子在〃Usefulproteinsfromrecombinantbacteria"TScientificAmerican,1980,242:74-94中;和在Sambrook等,1989,見(jiàn)上文中描述。用于指導(dǎo)本發(fā)明的核酸構(gòu)建體在絲狀真菌宿主細(xì)胞中轉(zhuǎn)錄的合適啟動(dòng)子的實(shí)例是從下列酶的基因獲得的啟動(dòng)子米曲霉TAKA淀粉酶、曼赫根毛霉(lihizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構(gòu)酶、構(gòu)巢曲霉乙酰胺酶、鑲片鐮孢淀粉葡糖苷酶(W000/56900)、鑲片鐮孢Daria(WC)00/56900)、鑲片鐮孢Quirm(W000/56900)、尖鐮孢胰蛋白酶樣蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內(nèi)切葡聚糖酶I、里氏木霉內(nèi)切葡聚糖酶II、里氏木霉內(nèi)切葡聚糖酶III、里氏木霉內(nèi)切葡聚糖酶IV、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi啟動(dòng)子(一種修飾的啟動(dòng)子,其包含在曲霉屬中編碼中性α-淀粉酶的基因,其中未翻譯的前導(dǎo)序列由在曲霉屬中編碼丙糖磷酸異構(gòu)酶的基因的未翻譯的前導(dǎo)序列所替代;非限制性實(shí)例包括修飾的啟動(dòng)子,其包含在黑曲霉中編碼中性α-淀粉酶的基因,其中未翻譯的前導(dǎo)序列由在構(gòu)巢曲霉和米曲霉中編碼丙糖磷酸異構(gòu)酶的基因的未翻譯的前導(dǎo)序列所替代);和它們的突變的、截短的和雜合的啟動(dòng)子。在酵母宿主中,有用的啟動(dòng)子從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母半乳糖激酶(GALl)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構(gòu)酶(TPI)、釀酒酵母金屬硫蛋白(CUPl)和釀酒酵母3-磷酸甘油酸激酶。對(duì)于酵母宿主細(xì)胞其它有用的啟動(dòng)子由Romanos等,1992Jeast8:423-488描述。調(diào)控序列也可以是合適的轉(zhuǎn)錄終止子序列,是由宿主細(xì)胞識(shí)別以終止轉(zhuǎn)錄的序列。所述終止子序列與編碼所述多肽的核苷酸序列的3’末端可操作地連接??梢詫⒃谒x宿主細(xì)胞中有功能的任何終止子用在本發(fā)明中。對(duì)于絲狀真菌宿主細(xì)胞優(yōu)選的終止子從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖鐮孢胰蛋白酶樣蛋白酶。對(duì)于酵母宿主細(xì)胞優(yōu)選的終止子從如下酶的基因獲得釀酒酵母烯醇化酶、釀酒酵母細(xì)胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氫酶。對(duì)于酵母宿主細(xì)胞其它有用的終止子由Romanos等,1992,見(jiàn)上文描述。調(diào)控序列還可以是合適的前導(dǎo)序列,當(dāng)被轉(zhuǎn)錄時(shí)其為對(duì)于宿主細(xì)胞的翻譯重要的mRNA非翻譯區(qū)。前導(dǎo)序列可操作地連接于編碼多肽的核苷酸序列的5’-末端??梢詫⒃谒x宿主細(xì)胞中有功能的任何前導(dǎo)序列用在本發(fā)明中。對(duì)于絲狀真菌宿主細(xì)胞優(yōu)選的前導(dǎo)序列從如下酶的基因獲得米曲霉TAKA淀粉酶和構(gòu)巢曲霉丙糖磷酸異構(gòu)酶。對(duì)于酵母宿主細(xì)胞合適的前導(dǎo)序列從如下酶的基因獲得釀酒酵母烯醇化酶(ΕΝ0-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)。調(diào)控序列也可以是聚腺苷酸化序列,其是與核苷酸序列的3,末端可操作地連接的序列,并且在轉(zhuǎn)錄時(shí),宿主細(xì)胞將其識(shí)別為將聚腺苷殘基添加至轉(zhuǎn)錄的mRNA的信號(hào)??梢詫⒃谒x宿主細(xì)胞中有功能的任何聚腺苷酸化序列在本發(fā)明中使用。對(duì)于絲狀真菌宿主細(xì)胞優(yōu)選的聚腺苷酸化序列從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶和黑曲霉α-葡糖苷酶。對(duì)于酵母宿主細(xì)胞有用的聚腺苷酸化序列由Guo和aierman,1995,MolecularCellularBiology15:5983-5990描述。調(diào)控序列還可以是信號(hào)肽編碼區(qū),其編碼與多肽的氨基末端相連的信號(hào)肽,并且指導(dǎo)編碼的多肽進(jìn)入細(xì)胞分泌途徑。核苷酸序列的編碼序列5’端可固有地包含信號(hào)肽編碼區(qū),其與編碼分泌多肽的編碼區(qū)片段一起天然地連接在翻譯閱讀框中??晒┻x擇的是,編碼序列5’端可含有對(duì)于所述編碼序列異源的信號(hào)肽編碼區(qū)。異源信號(hào)肽編碼區(qū)在編碼序列不天然地含有信號(hào)肽編碼區(qū)時(shí)可為必需的?;蛘?,外源信號(hào)肽編碼區(qū)可以簡(jiǎn)單地取代天然信號(hào)肽編碼區(qū)以增強(qiáng)多肽的分泌。然而,指導(dǎo)表達(dá)的多肽進(jìn)入所選宿主細(xì)胞的分泌途徑(即,分泌至培養(yǎng)基中)的任何信號(hào)肽編碼區(qū)可在本發(fā)明中使用。對(duì)于細(xì)菌宿主細(xì)胞有效的信號(hào)肽編碼區(qū)是從如下酶的基因獲得的信號(hào)肽編碼區(qū)芽孢桿菌屬NCIB11837產(chǎn)麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶(subtilisin)、地衣芽孢桿菌β-內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢桿菌prsA。另外的信號(hào)肽由Simonen和Palva,1993,MicrobiologicalReviews57:109-137描述。對(duì)于絲狀真菌宿主細(xì)胞有效的信號(hào)肽編碼區(qū)是從如下酶的基因獲得的信號(hào)肽編碼區(qū)米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特異腐質(zhì)霉纖維素酶、特異腐質(zhì)霉內(nèi)切葡聚糖酶V和疏棉狀腐質(zhì)霉脂肪酶。對(duì)于酵母宿主細(xì)胞有用的信號(hào)肽從釀酒酵母α因子和釀酒酵母轉(zhuǎn)化酶的基因獲得。其它有用的信號(hào)肽編碼區(qū)由Romanos等,1992,見(jiàn)上文描述。在一個(gè)優(yōu)選的方面,信號(hào)肽包含SEQIDNO:2的氨基酸1至19,或者由SEQIDΝ0:2的氨基酸1至19組成。在另一個(gè)優(yōu)選方面,信號(hào)肽編碼序列包含SEQIDNO1的核苷酸1至57,或者由SEQIDNO1的核苷酸1至57組成。調(diào)控序列還可以是前肽編碼區(qū),其編碼位于多肽氨基末端的前肽。所得多肽稱為酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情況下稱為酶原(zymogen))。前多肽通常是無(wú)活性的并且能夠通過(guò)前肽的催化或自催化切割從前多肽轉(zhuǎn)化為成熟活性多肽??梢詮目莶菅挎邨U菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、釀酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉漆酶(W095/33836)的基因獲得前肽編碼區(qū)。當(dāng)信號(hào)肽和前肽區(qū)二者均出現(xiàn)在多肽的氨基末端時(shí),將前肽區(qū)置于緊接著(nextto)多肽氨基末端,并且將信號(hào)肽區(qū)置于緊接著前肽區(qū)的氨基末端。同樣理想的是添加調(diào)節(jié)序列,其允許相對(duì)于宿主細(xì)胞的生長(zhǎng)來(lái)調(diào)節(jié)多肽的表達(dá)。調(diào)節(jié)系統(tǒng)的實(shí)例是引起基因表達(dá)響應(yīng)化學(xué)或物理刺激物,包括調(diào)節(jié)化合物的存在而開(kāi)啟或關(guān)閉的那些系統(tǒng)。原核系統(tǒng)中的調(diào)節(jié)系統(tǒng)包括lac、tac和trp操縱基因系統(tǒng)。在酵母中,可以使用ADH2系統(tǒng)或GALl系統(tǒng)。在絲狀真菌中,可以使用TAKAα-淀粉酶啟動(dòng)子、黑曲霉葡糖淀粉酶啟動(dòng)子和米曲霉葡糖淀粉酶啟動(dòng)子作為調(diào)節(jié)序列。調(diào)節(jié)序列的其它實(shí)例是那些允許基因擴(kuò)增的序列。在真核系統(tǒng)中,這些序列包括在氨甲蝶呤(methotrexate)存在下擴(kuò)增的二氫葉酸還原酶基因,和以重金屬(withheavymetal)擴(kuò)增的金屬硫蛋白基因。在這些情況下,編碼多肽的核苷酸序列將與調(diào)節(jié)序列可操作地連接。表達(dá)載體本發(fā)明還涉及重組表達(dá)載體,所述重組表達(dá)載體包含本發(fā)明的多核苷酸、啟動(dòng)子和轉(zhuǎn)錄和翻譯終止信號(hào)。本文所述的多種核酸和調(diào)控序列可以結(jié)合在一起以產(chǎn)生重組表達(dá)載體,所述表達(dá)載體可以包括一個(gè)或多個(gè)(幾個(gè))方便的限制位點(diǎn)以允許在這些位點(diǎn)插入或取代編碼多肽的核苷酸序列??晒┻x擇的是,可以通過(guò)在適當(dāng)?shù)挠糜诒磉_(dá)的載體中插入包含所述序列的核苷酸序列或核酸構(gòu)建體來(lái)表達(dá)本發(fā)明的核苷酸序列。在制備表達(dá)載體的過(guò)程中,將編碼序列置于載體中,從而將該編碼序列與適當(dāng)?shù)谋磉_(dá)調(diào)控序列可操作地連接。重組表達(dá)載體可以是任何載體(例如,質(zhì)?;虿《?,其能夠方便地進(jìn)行重組DNA步驟,并且能夠產(chǎn)生核苷酸序列的表達(dá)。載體的選擇將通常依賴于載體與將引入該載體的宿主細(xì)胞的相容性。載體可以是線狀或閉合環(huán)狀質(zhì)粒。載體可以是自主復(fù)制載體,即,作為染色體外實(shí)體(entity)存在的載體,其復(fù)制獨(dú)立于染色體復(fù)制,例如,質(zhì)粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復(fù)制的手段(means)。或者,載體可以是一種當(dāng)被引入宿主細(xì)胞中時(shí),整合到基因組中并且與整合了該載體的染色體一起復(fù)制的載體。此外,可以使用單獨(dú)的載體或質(zhì)?;騼蓚€(gè)或更多個(gè)載體或質(zhì)粒,其共同含有待引入宿主細(xì)胞基因組的完整DNA(totalDNA),或可以使用轉(zhuǎn)座子(transposon)。本發(fā)明的載體優(yōu)選地含有一個(gè)或多個(gè)(幾個(gè))選擇性標(biāo)記,其允許簡(jiǎn)單選擇經(jīng)轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等的細(xì)胞。選擇性標(biāo)記是基因,其產(chǎn)物提供殺生物劑或病毒抗性、對(duì)重金屬的抗性、對(duì)營(yíng)養(yǎng)缺陷型的原養(yǎng)性(prototrophytoauxotrophs)等。細(xì)菌選擇性標(biāo)記的實(shí)例是來(lái)自枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或賦予抗生素抗性的標(biāo)記,所述抗生素抗性例如氨芐青霉素、卡那霉素、氯霉素或四環(huán)素抗性。對(duì)于酵母宿主細(xì)胞合適的標(biāo)記是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于絲狀真菌宿主細(xì)胞的選擇性標(biāo)記包括但不限于amdS(乙酰胺酶)、argB(鳥(niǎo)氨酸氨甲?;D(zhuǎn)移酶)、bar(草銨膦(phosphinothricin)乙酰轉(zhuǎn)移酶)、hph(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸還原酶)(nitratereductase)、pyrG(乳清酸核苷-5,-磷酸脫羧酶)(orotidine-5,-phosphatedecarboxylase),sC(硫酸腺苷酰轉(zhuǎn)移酶)和trpC(鄰氨基苯甲酸合酶(anthranilatesynthase))以及它們的等同物。優(yōu)選用在曲霉屬細(xì)胞中的是構(gòu)巢曲霉或米曲霉的amdS和pyrG基因禾口吸水鏈霄菌(Streptomyceshygroscopicus)的bar基因。本發(fā)明的載體優(yōu)選含有元件,其允許載體整合入宿主細(xì)胞基因組或載體在細(xì)胞中獨(dú)立于基因組的自主復(fù)制。為了整合入宿主細(xì)胞基因組,載體可依賴編碼多肽的多核苷酸的序列或用于通過(guò)同源或非同源重組整合入基因組的任何其它載體元件?;蛘撸d體可以含有額外的核苷酸序列,用于指導(dǎo)通過(guò)同源重組整合入宿主細(xì)胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應(yīng)優(yōu)選含有足夠數(shù)量的核酸,如100至10,000堿基對(duì),優(yōu)選400至10,000堿基對(duì),并且最優(yōu)選800至10,000堿基對(duì),其與相應(yīng)的目標(biāo)序列具有高度序列同一性以增強(qiáng)同源重組的概率。整合元件可以是任何序列,其與宿主細(xì)胞基因組中的目標(biāo)序列同源。此外,整合元件可以是非編碼或編碼的核苷酸序列。另一方面,可以將載體通過(guò)非同源重組整合到宿主細(xì)胞的基因組中。為了自主復(fù)制,載體可以進(jìn)一步包含復(fù)制起點(diǎn),其使載體能夠在所述的宿主細(xì)胞中自主地復(fù)制。復(fù)制起點(diǎn)可以是介導(dǎo)自主復(fù)制的任何質(zhì)粒復(fù)制子(r印licator),其在細(xì)胞中發(fā)揮功能。術(shù)語(yǔ)“復(fù)制起點(diǎn)”或“質(zhì)粒復(fù)制子”在本文定義為能夠使質(zhì)?;蜉d體體內(nèi)復(fù)制的核苷酸序列。細(xì)菌復(fù)制起點(diǎn)的實(shí)例是允許在大腸桿菌中復(fù)制的質(zhì)粒pBR322、pUC19、pACYC177和pACYC184的復(fù)制起點(diǎn),和允許在芽孢桿菌屬中復(fù)制的質(zhì)粒pUBllO、pE194、pTA1060和ρΑΜβ1的復(fù)制起點(diǎn)。用于酵母宿主細(xì)胞中的復(fù)制起點(diǎn)的實(shí)例是2微米復(fù)制起點(diǎn),ARSl,ARS4,ARSl和CEN3的組合,和ARS4和CEN6的組合。在絲狀真菌細(xì)胞中有用的復(fù)制起點(diǎn)的實(shí)例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch15:9163-9175;WO00/24883)。分離AMAl基因和構(gòu)建包含該基因的質(zhì)?;蜉d體能夠根據(jù)公開(kāi)于WO00/24883中的方法完成。可以將多于一個(gè)拷貝的本發(fā)明的多核苷酸插入宿主細(xì)胞以增加基因產(chǎn)物的產(chǎn)生。多核苷酸拷貝數(shù)的增加可通過(guò)如下方法獲得將至少一個(gè)額外拷貝的序列整合入宿主細(xì)胞基因組,或?qū)⒖蓴U(kuò)增的選擇性標(biāo)記基因包括于多核苷酸,其中可通過(guò)在合適的選擇劑(selectableagent)存在下培養(yǎng)細(xì)胞來(lái)選擇含有選擇性標(biāo)記基因的擴(kuò)增拷貝,且由此含有多核苷酸的額外拷貝的細(xì)胞。用于連接上述元件以構(gòu)建本發(fā)明的重組表達(dá)載體的方法是本領(lǐng)域技術(shù)人員熟知的(參見(jiàn),例如,Sambrook等,1989,見(jiàn)上文)。宿主細(xì)胞本發(fā)明還涉及重組宿主細(xì)胞,其包含本發(fā)明的分離的多核苷酸可操作地連接于一個(gè)或多個(gè)(幾個(gè))指導(dǎo)具有葡糖苷酶活性的多肽的產(chǎn)生的調(diào)控序列。將包含本發(fā)明多核苷酸的構(gòu)建體或載體導(dǎo)入宿主細(xì)胞,使構(gòu)建體或載體如前所述作為染色體整體或者作為自復(fù)制的染色體外載體維持。術(shù)語(yǔ)“宿主細(xì)胞”包括親本細(xì)胞的任何后代,其由于復(fù)制過(guò)程中發(fā)生的突變而不同于親本細(xì)胞。宿主細(xì)胞的選擇將在很大程度上依賴于編碼多肽的基因及其來(lái)源。宿主細(xì)胞可以是在本發(fā)明的多肽的重組產(chǎn)生中有用的任何細(xì)胞,例如,原核或真核細(xì)胞。原核宿主細(xì)胞可以是任何革蘭氏陽(yáng)性細(xì)菌或革蘭氏陰性細(xì)菌。革蘭氏陽(yáng)性細(xì)菌包括但不限于,芽孢桿菌屬、鏈球菌屬、鏈霉菌屬、葡萄球菌屬、腸球菌屬、乳酸菌屬、乳球菌屬、梭菌屬、地芽孢桿菌屬和海洋芽孢桿菌屬。革蘭氏陰性細(xì)菌包括但不限于,大腸桿菌、假單胞菌屬、沙門(mén)氏菌屬、彎曲桿菌屬、螺桿菌屬、黃桿菌屬、梭桿菌屬、泥桿菌屬、奈瑟氏菌屬和脲原體屬。細(xì)菌宿主細(xì)胞可以是任何芽孢桿菌屬細(xì)胞。在本發(fā)明的實(shí)施中有用的芽孢桿菌屬細(xì)胞包括但不限于,嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結(jié)芽孢桿菌、堅(jiān)強(qiáng)芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌細(xì)胞。在一個(gè)優(yōu)選的方面,細(xì)菌宿主細(xì)胞是解淀粉芽孢桿菌。在另一個(gè)更優(yōu)選的方面,細(xì)菌宿主細(xì)胞是克勞氏芽孢桿菌細(xì)胞。在另一個(gè)更優(yōu)選的方面,細(xì)菌宿主細(xì)胞是遲緩芽孢桿菌。在另一個(gè)更優(yōu)選的方面,細(xì)菌宿主細(xì)胞是地衣芽孢桿菌細(xì)胞。在另一個(gè)更優(yōu)選的方面,細(xì)菌宿主細(xì)胞是嗜熱脂肪芽孢桿菌。在另一個(gè)更優(yōu)選的方面,細(xì)菌宿主細(xì)胞是枯草芽孢桿菌細(xì)胞。細(xì)菌宿主細(xì)胞還可以是任何鏈球菌屬細(xì)胞。在本發(fā)明的實(shí)施中有用的鏈球菌屬細(xì)胞包括但不限于,似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌和馬鏈球菌獸瘟亞種細(xì)胞。在一個(gè)優(yōu)選的方面,細(xì)菌宿主細(xì)胞是似馬鏈球菌細(xì)胞。在另一個(gè)優(yōu)選的方面,細(xì)菌宿主細(xì)胞是釀膿鏈球菌細(xì)胞。在另一個(gè)優(yōu)選的方面,細(xì)菌宿主細(xì)胞是乳房鏈球菌細(xì)胞。在另一個(gè)優(yōu)選的方面,細(xì)菌宿主細(xì)胞是馬鏈球菌獸瘟亞種細(xì)胞。細(xì)菌宿主細(xì)胞還可以是任何鏈霉菌屬細(xì)胞。在本發(fā)明的實(shí)施中有用的鏈霉菌屬細(xì)胞包括但不限于,不產(chǎn)色鏈霉菌、除蟲(chóng)鏈霉菌、天藍(lán)鏈霉菌、灰色鏈霉菌和淺青紫鏈霉菌細(xì)胞。在一個(gè)優(yōu)選的方面,細(xì)菌宿主細(xì)胞是不產(chǎn)色鏈霉菌細(xì)胞。在另一個(gè)優(yōu)選的方面,細(xì)菌宿主細(xì)胞是除蟲(chóng)鏈霉菌細(xì)胞。在另一個(gè)優(yōu)選的方面,細(xì)菌宿主細(xì)胞是天藍(lán)鏈霉菌細(xì)胞。在另一個(gè)優(yōu)選的方面,細(xì)菌宿主細(xì)胞是灰色鏈霉菌細(xì)胞。在另一個(gè)優(yōu)選的方面,細(xì)菌宿主細(xì)胞是淺青紫鏈霉菌細(xì)胞??赏ㄟ^(guò)如下方法實(shí)現(xiàn)將DNA引入到芽孢桿菌屬細(xì)胞例如原生質(zhì)體轉(zhuǎn)化(參見(jiàn),例如,Chang和Cohen,1979,MolecularGeneralGenetics168:111-115),使用感受態(tài)細(xì)胞(參見(jiàn),例如,Young禾口Spizizen,1961,JournalofBacteriology81:823-829或Dubnau和Davidoff-Abelson,1971,JournalofMolecularBiology56:209-221),電穿孔(參見(jiàn),例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(參見(jiàn),例如,Koehler和Thorne,1987,JournalofBacteriology169:5771—5278)??赏ㄟ^(guò)如下方法實(shí)現(xiàn)將DNA引入到大腸桿菌細(xì)胞例如原生質(zhì)體轉(zhuǎn)化(參見(jiàn),例如,Hanahan,1983,J.Mol.Biol.166:557-580)或電穿孔(參見(jiàn),例如,Dower等,1988,NucleicAcidsRes.166127-6145)??赏ㄟ^(guò)如下方法實(shí)現(xiàn)將DNA引入到鏈霉菌屬細(xì)胞例如原生質(zhì)體轉(zhuǎn)化和電穿孔(參見(jiàn),例如,Gong等,2004,R)liaMicrobiol.(Praha)49:399-405),接合(參見(jiàn),例如,Mazodier等,1989,J.Bacteriol.171:;3583_3585),或轉(zhuǎn)導(dǎo)(參見(jiàn),例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)??赏ㄟ^(guò)如下方法實(shí)現(xiàn)將DNA引入到假單胞菌屬細(xì)胞例如電穿孔(參見(jiàn),例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(參見(jiàn),例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)??赏ㄟ^(guò)如下方法實(shí)現(xiàn)將DNA引入到鏈球菌屬細(xì)胞例如天然感受態(tài)(naturalcompetence)(參見(jiàn),例如,Perry和Kuramitsu,1981,hfect.Immun.321295_1四7),原生質(zhì)體轉(zhuǎn)化(參見(jiàn),例如,Catt和Jollick,1991,Microbios.68:189-207),電穿孔(參見(jiàn),例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(參見(jiàn),例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用本領(lǐng)域已知的將DNA引入宿主細(xì)胞的任何方法。宿主細(xì)胞還可以是真核生物,如哺乳動(dòng)物、昆蟲(chóng)、植物或真菌細(xì)胞。在一個(gè)優(yōu)選的方面,宿主細(xì)胞是真菌細(xì)胞?!罢婢庇迷诒疚陌ㄒ韵麻T(mén)子囊菌門(mén)(Ascomycota)、擔(dān)子菌門(mén)(Basidiomycota)、壺菌門(mén)(Chytridiomycota)禾口接合菌門(mén)(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)以及卵菌門(mén)(Oomycota)(如Hawksworth等,1995,見(jiàn)上,171頁(yè)中所引用),和所有有絲分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,見(jiàn)上文)。在一個(gè)更優(yōu)選的方面,真菌宿主細(xì)胞是酵母細(xì)胞?!敖湍浮庇迷诒疚陌óa(chǎn)子囊酵母(ascosporogenousyeast)(內(nèi)孢霉目(Endomycetales))、產(chǎn)擔(dān)子酵母(basidiosporogenousyeast)禾口屬于半知菌類(FungiImperfecti)(芽抱綱(Blastomycetes))的酵母。由于酵母的分類在未來(lái)可能改變,就本發(fā)明而言,將酵母定義為如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,禾口Davenport,R.R.編,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。在一個(gè)甚至更加優(yōu)選的方面,酵母宿主細(xì)胞是假絲酵母屬、漢遜酵母屬(Hansenula)、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬細(xì)胞。在一個(gè)最優(yōu)選的方面,酵母宿主細(xì)胞是卡爾酵母細(xì)胞。在另一個(gè)最優(yōu)選的方面,酵母宿主細(xì)胞是釀酒酵母細(xì)胞。在另一個(gè)最優(yōu)選的方面,酵母宿主細(xì)胞是糖化酵母細(xì)胞。在另一個(gè)最優(yōu)選的方面,酵母宿主細(xì)胞是道格拉氏酵母細(xì)胞。在另一個(gè)最優(yōu)選的方面,酵母宿主細(xì)胞是克魯弗酵母細(xì)胞。在另一個(gè)最優(yōu)選的方面,酵母宿主細(xì)胞是諾地酵母細(xì)胞。在另一個(gè)最優(yōu)選的方面,酵母宿主細(xì)胞是卵形酵母細(xì)胞。在另一個(gè)最優(yōu)選的方面,酵母宿主細(xì)胞是乳酸克魯維酵母(Kluyveromyceslactis)細(xì)胞。在另一個(gè)最優(yōu)選的方面,酵母宿主細(xì)胞是解脂西洋蓍霉(Yarrowialipolytica)細(xì)胞。在另一個(gè)更優(yōu)選的方面,真菌宿主細(xì)胞是絲狀真菌細(xì)胞。“絲狀真菌”包括真菌門(mén)(Eumycota)和卵菌門(mén)的亞門(mén)(如由Hawksworth等,1995,見(jiàn)上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復(fù)雜多糖組成的菌絲體壁。通過(guò)菌絲延伸進(jìn)行營(yíng)養(yǎng)生長(zhǎng),而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營(yíng)養(yǎng)生長(zhǎng)通過(guò)單細(xì)胞菌體的出芽生殖(budding)進(jìn)行,而碳分解代謝可以是發(fā)酵的。在甚至更優(yōu)選的方面,絲狀真菌宿主細(xì)胞是枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬蠟菌屬、金孢子菌屬、鬼傘屬(Coprinus)、革蓋菌屬(Coriolus)、隱球菌屬、Filikisidium、鐮孢屬、腐質(zhì)霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬(Wianerochaete)、射脈菌屬(Phlebia)、瘤胃壺菌屬、側(cè)耳屬(Pleurotus)、裂褶菌屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細(xì)胞。在最優(yōu)選的方面,絲狀真菌宿主細(xì)胞是泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉或米曲霉細(xì)胞。在另一個(gè)最優(yōu)選方面,絲狀真菌宿主細(xì)胞是桿孢狀鐮孢、禾谷鐮孢、庫(kù)威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢細(xì)胞。在另一個(gè)最優(yōu)選的方面,絲狀真菌宿主細(xì)胞是黑刺煙管菌(Bjerkanderaadusta)>zFiffllif(Ceriporiopsisaneirina)>zFifa|1>Ceriporiopsiscaregiea>Ceriporiopsisgilvescens>Ceriporiopsispannocinta>Ceriporiopsisrivulosa、Ceriporiopsissubrufa、蟲(chóng)擬M菌(Ceriporiopsissubvermispora)、B譽(yù)角質(zhì)金包子菌、Chrysosporiumlucknowense、熱帶金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、|£金包子菌、Chrysosporiumqueenslandicum>Chrysosporiumzonatum、灰蓋鬼傘(Coprmuscinereus)、毛革蓋菌(Coriolushirsutus)、特異腐質(zhì)霉、疏棉狀腐質(zhì)霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、產(chǎn)紫青霉、黃孢平革菌(Wianer0Chaetechrysosporium)、輻射射脈菌(Phlebiaradiata)、刺芹側(cè)耳(Pleurotuseryngii)、土生梭孢霉、長(zhǎng)絨毛栓菌(Trametesvillosa)、變色栓菌CTrametesversicolor)、哈茨木霉、康寧木霉、長(zhǎng)枝木霉、里氏木霉或綠色木霉細(xì)胞。在另一個(gè)優(yōu)選實(shí)施方案中,所述絲狀真菌宿主細(xì)胞是黑曲霉細(xì)胞。在另一個(gè)最優(yōu)選的方面,所述絲狀真菌宿主細(xì)胞是米曲霉細(xì)胞。在另一個(gè)最優(yōu)選的方面,所述絲狀真菌宿主細(xì)胞是Chrysosporiumlucknowense細(xì)胞。在另一個(gè)最優(yōu)選的方面,所述絲狀真菌宿主細(xì)胞是鑲片鐮孢細(xì)胞。在另一個(gè)最優(yōu)選的方面,所述絲狀真菌宿主細(xì)胞是嗜熱毀絲霉細(xì)胞。在另一個(gè)最優(yōu)選的方面,所述絲狀真菌宿主細(xì)胞是里氏木霉細(xì)胞??梢詫⒄婢?xì)胞通過(guò)涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化和細(xì)胞壁重建的方法以本身公知的方式轉(zhuǎn)化。用于轉(zhuǎn)化曲霉屬和木霉屬宿主細(xì)胞的合適方法在EP238023和Yelton等,1984,ProceedingsoftheNationalAcademyofSciencesUSA81:1470-1474中描述。用于轉(zhuǎn)化鐮孢屬菌種的合適方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文獻(xiàn)描述的方法轉(zhuǎn)化酵母=Becker和Guarente,于Abelson,J.N.禾口Simon,Μ.I.編,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,pp182—187,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriology153:163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920o產(chǎn)生方法本發(fā)明還涉及用于產(chǎn)生本發(fā)明多肽的方法,其包括(a)在有助于產(chǎn)生多肽的條件下培養(yǎng)細(xì)胞,所述細(xì)胞以其野生型形式產(chǎn)生所述多肽;和(b)回收所述多肽。在一個(gè)優(yōu)選的方面,所述細(xì)胞是長(zhǎng)毛盤(pán)菌屬的細(xì)胞。在更優(yōu)選的方面,所述細(xì)胞是TrichophaeaSaccata0在最優(yōu)選的方面,所述細(xì)胞是iTrichophaeasaccataCBS804.70。本發(fā)明還涉及用于產(chǎn)生本發(fā)明的多肽的方法,其包括(a)如本文所述,在有助于產(chǎn)生多肽的條件下培養(yǎng)重組宿主細(xì)胞;和(b)回收所述多肽。本發(fā)明還涉及用于產(chǎn)生本發(fā)明的多肽的方法,包括(a)在有助于產(chǎn)生多肽的條件下培養(yǎng)重組宿主細(xì)胞,其中所述宿主細(xì)胞包含突變核苷酸序列,其在SEQIDN0:1的成熟多肽編碼序列中具有至少一個(gè)突變,其中所述突變核苷酸序列編碼多肽,該多肽包含SEQIDNO2的成熟多肽或由SEQIDNO2的成熟多肽組成,和(b)回收所述多肽。在本發(fā)明的產(chǎn)生方法中,使用本領(lǐng)域熟知的方法在適合于產(chǎn)生所述多肽的營(yíng)養(yǎng)培養(yǎng)基中培養(yǎng)細(xì)胞。例如,可以通過(guò)在合適培養(yǎng)基中和允許表達(dá)和/或分離所述多肽的條件下進(jìn)行的搖瓶培養(yǎng),和實(shí)驗(yàn)室或工業(yè)發(fā)酵罐中的小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù)、分批、補(bǔ)料分批或固態(tài)發(fā)酵)來(lái)培養(yǎng)細(xì)胞。使用本領(lǐng)域已知的方法在合適的營(yíng)養(yǎng)培養(yǎng)基中進(jìn)行培養(yǎng),所述營(yíng)養(yǎng)培養(yǎng)基包含碳源和氮源和無(wú)機(jī)鹽。合適的培養(yǎng)基能夠從商業(yè)供應(yīng)商獲得或可以根據(jù)公開(kāi)的組成制備(例如,在美國(guó)典型培養(yǎng)物保藏中心的目錄中)。如果多肽分泌到營(yíng)養(yǎng)培養(yǎng)基中,該多肽能夠從所述培養(yǎng)基中直接回收。如果多肽不分泌到培養(yǎng)基中,其能夠從28細(xì)胞裂解物(Iysate)回收??梢允褂帽绢I(lǐng)域已知的對(duì)于所述多肽是特異性的方法來(lái)檢測(cè)多肽。這些檢測(cè)方法可包括特異性抗體的使用、酶產(chǎn)物的形成或酶底物的消失。例如,酶試驗(yàn)(enzymeassay)可用于測(cè)定如本文所述的多肽的活性。所得多肽可以使用本領(lǐng)域已知的方法回收。例如,多肽可以通過(guò)常規(guī)方法從營(yíng)養(yǎng)培養(yǎng)基中回收,所述常規(guī)方法包括但不限于離心、過(guò)濾、提取、噴霧干燥、蒸發(fā)或沉淀。本發(fā)明的多肽可以通過(guò)多種本領(lǐng)域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(pr印arative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS-PAGE或提取(參見(jiàn),例如,ProteinPurification,J.-C.Janson禾口LarsRyden,editors,VCHPublishers,NewYork,1989)。植物本發(fā)明還涉及植物,例如,轉(zhuǎn)基因植物、植物部分或植物細(xì)胞,其包含分離的多核苷酸,所述多核苷酸編碼本發(fā)明具有葡糖苷酶活性的多肽,從而以可回收的量表達(dá)和產(chǎn)生所述多肽。多肽可從植物或植物部分回收?;蛘?,同樣可以將含有該重組多肽的植物或植物部分用于改進(jìn)食品或飼料的質(zhì)量,例如,改進(jìn)營(yíng)養(yǎng)價(jià)值、適口性(palatability)和流變性質(zhì)(rheologicalproperties),或用于破壞抗?fàn)I養(yǎng)因子。轉(zhuǎn)基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實(shí)例是草(grasses),如草地早熟禾(meadowgrass)(藍(lán)草(bluegrass),早熟禾屬(Poa));飼用牧草(foragegrass)如羊茅屬(Festuca)、黑麥草屬(Lolium);寒地型牧草(temperategrass),如Agrostis(剪股穎屬);和谷類,例如,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。雙子葉植物的實(shí)例是煙草(tcAacco),豆類(legumes),如羽扇豆(lupins),馬鈴薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和緊密相關(guān)的模型生物體擬南芥(Arabidopsisthaliana)。植物部分的實(shí)例是莖(stem)、愈傷組織(calIus)、葉(leaf)、根(root)、果實(shí)(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨(dú)立組織,例如,表皮(epidermis)、葉肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的植物細(xì)胞區(qū)室(compartments),如葉綠體(chloroplast)、質(zhì)夕卜體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過(guò)氧化物酶體(peroxisome)禾口細(xì)胞質(zhì)(cytoplasm)也被認(rèn)為是植物部分。此外,任何植物細(xì)胞,無(wú)論什么組織來(lái)源,都被認(rèn)為是植物部分。同樣地,植物部分,如分離以促進(jìn)本發(fā)明的應(yīng)用的具體組織和細(xì)胞也被認(rèn)為是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和種皮(seedcoat)。同樣包含于本發(fā)明范圍內(nèi)的還有這些植物、植物部分和植物細(xì)胞的子代。表達(dá)本發(fā)明多肽的轉(zhuǎn)基因植物或植物細(xì)胞可以依照本領(lǐng)域已知方法構(gòu)建。簡(jiǎn)而言之,通過(guò)如下方法構(gòu)建所述植物或植物細(xì)胞將編碼本發(fā)明多肽的一個(gè)或多個(gè)(幾個(gè))表達(dá)構(gòu)建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細(xì)胞繁殖為轉(zhuǎn)基因植物或植物細(xì)胞。是包含編碼本發(fā)明多肽的多核苷酸的核酸構(gòu)建體,所述多核苷酸與在選擇的植物或植物部分中表達(dá)該多核苷酸序列所需的適當(dāng)?shù)恼{(diào)節(jié)序列可操作地連接。此外,表達(dá)構(gòu)建體可以包含對(duì)于鑒定宿主細(xì)胞有用的選擇性標(biāo)記,在所述宿主細(xì)胞中整合了表達(dá)構(gòu)建體和將該構(gòu)建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。調(diào)節(jié)序列的選擇,例如啟動(dòng)子和終止子序列和任選地信號(hào)或轉(zhuǎn)運(yùn)序列的選擇,舉例來(lái)說(shuō),基于期望何時(shí)、何處以及如何表達(dá)多肽而確定。例如,編碼本發(fā)明多肽的基因的表達(dá)可以是組成型的或誘導(dǎo)型的,或可以是發(fā)育、階段或組織特異性的,并且基因產(chǎn)物可以靶向特定的組織或植物部分例如種子或葉。調(diào)節(jié)序列由例如Tague等,1988,PlantPhysiology86:506所述。對(duì)于組成性表達(dá),可以使用35S_CaMV、玉米泛素1和稻肌動(dòng)蛋白1啟動(dòng)子(Franck等,1980,Cell21:285_294,Christensen等,1992,PlantMo.Biol.18:675-689;Zhang等,1991,PlantCell3:1155-1165)。器官特異性啟動(dòng)子可以是例如來(lái)自貯藏庫(kù)組織(storagesinktissue)例如種子、馬鈴薯塊莖和果實(shí)的啟動(dòng)子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或來(lái)自代謝庫(kù)組織(metabolicsinktissue)例如分生組織的啟動(dòng)子(Ito等,1994,PlantMol.Biol.24:863-878),種子特異性啟動(dòng)子諸如來(lái)自稻的谷蛋白(gluteiin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)啟動(dòng)子(Wu等,1998,PlantandCellPhysiology39:885-889),來(lái)自豆球蛋白(legumin)B4和蠶豆(Viciafaba)的未知的種子蛋白基因的蠶豆啟動(dòng)子(Conrad等,1998,JournalofPlantPhysiologyl52:708-711)、來(lái)自種子油體蛋白(oilbodyprotein)的啟動(dòng)子(Chen等,1998,PlantandCellPhysiology39:935-941),來(lái)自歐洲油菜(Brassicanapus)的貯藏蛋白napA啟動(dòng)子,或本
      技術(shù)領(lǐng)域
      公知的任何其他種子特異性的啟動(dòng)子,例如,在W091/14772中所描述的。此外,啟動(dòng)子可為葉特異性的啟動(dòng)子,如來(lái)自稻或番茄的rbcs啟動(dòng)子(Kyozuka等,1993,PlantPhysiology102:991-1000),小球藻病毒(chlorellavirus)腺嘌呤甲基轉(zhuǎn)移酶(adeninemethyltransferase)基因啟動(dòng)子(Mitra和Higgins,1994,PlantMolecularBiology洸85-93),或來(lái)自稻的aldP基因啟動(dòng)子(Kagaya等,1995,Molecularandgeneralgenetics248:668-674),或傷口誘導(dǎo)的啟動(dòng)子,如馬鈴薯pin2啟動(dòng)子(Xu等,1993,PlantMolecularBiology22:573-588)。同樣地,所述啟動(dòng)子可通過(guò)非生物的處理誘導(dǎo),所述非生物的處理諸如溫度、干旱或鹽度變化,或通過(guò)外源施加的激活所述啟動(dòng)子的物質(zhì)誘導(dǎo),例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脫落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金屬。啟動(dòng)子增強(qiáng)子元件也可以用于實(shí)現(xiàn)本發(fā)明多肽在植物中的較高表達(dá)。例如,啟動(dòng)子增強(qiáng)子元件可以是內(nèi)含子,其置于啟動(dòng)子和編碼本發(fā)明多肽的核苷酸序列之間。例如Xu等,1993,見(jiàn)上,公開(kāi)了使用稻肌動(dòng)蛋白1基因的第一內(nèi)含子以增強(qiáng)表達(dá)。選擇性標(biāo)記基因和表達(dá)構(gòu)建體的任何其它部分可以選自本領(lǐng)域內(nèi)可用的那些。將核酸構(gòu)建體根據(jù)本領(lǐng)域已知的常規(guī)技術(shù)并入植物基因組,所述常規(guī)技術(shù)包括土壤桿菌屬(Agrobacterium)介導(dǎo)的轉(zhuǎn)化、病毒介導(dǎo)的轉(zhuǎn)化、顯微注射(microinjection)、粒子轟擊、生物射彈轉(zhuǎn)化和電穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤桿菌(Agrobacteriumtumefaciens)介導(dǎo)的基因轉(zhuǎn)移(genetransfer),是產(chǎn)生轉(zhuǎn)基因雙子葉植物的優(yōu)選方法(為了參考,見(jiàn)Hooykas和khilperoort,1992,PlantMolecularBiology19:15-38),而且它也可以用于轉(zhuǎn)化單子葉植物,雖然對(duì)于這些植物其他的轉(zhuǎn)化方法是常用的。目前,產(chǎn)生轉(zhuǎn)基因單子葉植物的優(yōu)選的方法,是用粒子(用轉(zhuǎn)化DNA涂覆的微觀的金或鎢粒子)轟擊胚愈傷組織(embryoniccalli)或發(fā)育中的胚(developingembryos)(Christou,1992,PlantJournal2:275-281;Shimamoto,1994,CurrentOpinionBiotechnology5:158-162;Vasilφ,1992,Bio/Technology10667-674)。轉(zhuǎn)化單子葉植物的可供選擇的方法是基于原生質(zhì)體轉(zhuǎn)化,如由Omirulleh等,1993,PlantMolecularBiology21:415-4所描述的。其他用于依照本公開(kāi)使用的轉(zhuǎn)化方法包括那些描述于美國(guó)專利6,395,966和7,151,204的那些(兩者均通過(guò)全文提述并入本文)。轉(zhuǎn)化之后,根據(jù)本領(lǐng)域熟知的方法選擇具有并入的表達(dá)構(gòu)建體的轉(zhuǎn)化體并且再生成為完整植物。通常設(shè)計(jì)轉(zhuǎn)化方法用于通過(guò)如下方法在再生期間或在后續(xù)世代中選擇性消除選擇基因例如,使用帶有兩個(gè)獨(dú)立的T-DNA構(gòu)建體的共轉(zhuǎn)化或通過(guò)特異性重組酶位點(diǎn)特異性地切除選擇基因。本發(fā)明還涉及用于產(chǎn)生本發(fā)明多肽的方法,其包括(a)在有助于產(chǎn)生多肽的條件下培養(yǎng)包含多核苷酸的轉(zhuǎn)基因植物或植物細(xì)胞,所述多核苷酸編碼本發(fā)明具有β-葡糖苷酶活性的多肽;和(b)回收所述多肽。除了直接用根據(jù)本發(fā)明制備的構(gòu)建體直接轉(zhuǎn)化具體植物基因型之外,還可通過(guò)將具有本發(fā)明的構(gòu)建體的植物與缺乏該構(gòu)建體的第二植物雜交來(lái)制備轉(zhuǎn)基因植物。舉例而言,可將編碼具有β-葡糖苷酶活性的多肽的構(gòu)建體或其部分通過(guò)雜交而引入特定植物品種,而根本無(wú)需直接轉(zhuǎn)化該給定品種的植物。因此,本發(fā)明不僅涵蓋從依照本發(fā)明經(jīng)轉(zhuǎn)化的細(xì)胞直接再生的植物,還包括此類植物的后裔(progeny)。如用于本文,后裔可指依照本發(fā)明制備的親本植物任何世代的后代(offspring)。此種后裔可包含依據(jù)本發(fā)明制備的DNA構(gòu)建體,或依據(jù)本發(fā)明制備的DNA構(gòu)建體的一部分。雜交導(dǎo)致本發(fā)明的轉(zhuǎn)基因通過(guò)將起始種系與包含本發(fā)明的轉(zhuǎn)基因的供體植物種系交叉授粉而引入植物種系。此類步驟的非限制性實(shí)例進(jìn)一步闡述于美國(guó)專利7,151,204號(hào)。涵蓋了包含本發(fā)明的具有葡糖苷酶活性的多肽的植物包括通過(guò)回交轉(zhuǎn)化方法生成的植物。舉例而言,本發(fā)明的植物包括稱作回交轉(zhuǎn)化的基因型、種系、近交體(inbred)或雜交體(hybrid)的植物??墒褂眠z傳標(biāo)記以協(xié)助本發(fā)明的一種或多種轉(zhuǎn)基因從一個(gè)遺傳背景基因滲入(introgression)至另一個(gè)。標(biāo)記協(xié)助的選擇提供了相對(duì)于常規(guī)育種的優(yōu)勢(shì),在于其可用于避免由表型變異導(dǎo)致的錯(cuò)誤。進(jìn)一步,遺傳標(biāo)記可在特定雜交的個(gè)體后裔中提供有關(guān)良種種質(zhì)相對(duì)程度的數(shù)據(jù)。舉例而言,當(dāng)本不(otherwise)具有非農(nóng)藝學(xué)所需的遺傳背景但具有所需性狀的植物與良種親本雜交時(shí),可使用遺傳標(biāo)記來(lái)選擇不僅具有目標(biāo)性狀,還具有相對(duì)較大比例所需種質(zhì)的后裔。以此方式,使一種或多種性狀基因滲入特定遺傳背景所需的世代數(shù)得到最小化。去除或減少β-葡糖苷酶活性本發(fā)明還涉及用于產(chǎn)生親本細(xì)胞突變體的方法,其包括破壞或缺失編碼本發(fā)明的多肽的多核苷酸或其部分,所述方法導(dǎo)致在相同條件下培養(yǎng)時(shí),與親本細(xì)胞相比突變的細(xì)胞產(chǎn)生較少的所述多肽??梢允褂帽绢I(lǐng)域熟知的方法(例如,插入、破壞、替代或缺失)通過(guò)減少或消除編碼本發(fā)明多肽的核苷酸序列的表達(dá)來(lái)構(gòu)建突變細(xì)胞。在一個(gè)優(yōu)選的方面,所述核苷酸序列是失活的。待修飾或失活的核苷酸序列可以是,例如,編碼區(qū)或其對(duì)活性關(guān)鍵的部分,或表達(dá)編碼區(qū)所需的調(diào)節(jié)元件。這種調(diào)節(jié)或調(diào)控序列的實(shí)例可以是啟動(dòng)子序列或其功能部分,即,足以影響核苷酸序列表達(dá)的部分。用于可能的修飾的其它調(diào)控序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、信號(hào)肽序列、轉(zhuǎn)錄終止子和轉(zhuǎn)錄激活子??梢酝ㄟ^(guò)向親本細(xì)胞施以誘變,并且選擇其中已將所述核苷酸序列的表達(dá)減少或消除的突變細(xì)胞來(lái)進(jìn)行核苷酸序列的修飾或失活。誘變可能是特異性的或隨機(jī)的,可以通過(guò)例如使用合適的物理或化學(xué)誘變劑進(jìn)行,通過(guò)使用合適的寡核苷酸進(jìn)行,或通過(guò)將所述DNA序列進(jìn)行PCR產(chǎn)生的誘變。此外,可以通過(guò)使用這些誘變劑的任何組合來(lái)進(jìn)行誘變。適合于本發(fā)明目的的物理或化學(xué)誘變劑的實(shí)例包括紫外線(UV)照射、羥胺、N-甲基-N'-硝基-N-亞硝基胍(MNNG)、0_甲基羥胺、亞硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亞硫酸氫鈉、甲酸和核苷酸類似物。當(dāng)使用這些試劑時(shí),通常通過(guò)如下方法來(lái)進(jìn)行所述誘變?cè)诤线m條件下存在優(yōu)選的誘變劑時(shí)溫育待誘變的親本細(xì)胞,并篩選和/或選擇顯示基因表達(dá)減少的或無(wú)基因表達(dá)的突變體細(xì)胞。通過(guò)導(dǎo)入、取代或去除基因中的一個(gè)或多個(gè)(幾個(gè))核苷酸或其轉(zhuǎn)錄或翻譯所需的調(diào)控元件可以實(shí)現(xiàn)所述核苷酸序列的修飾或失活。例如,可以插入或去除核苷酸從而導(dǎo)致引入終止密碼子,去除起始密碼子,或改變開(kāi)放閱讀框。按照本領(lǐng)域已知的方法通過(guò)定位誘變或PCR產(chǎn)生的誘變可以實(shí)現(xiàn)這種修飾或失活。盡管在理論上所述修飾可以在體內(nèi)進(jìn)行,即,直接在表達(dá)待修飾核苷酸序列的細(xì)胞上進(jìn)行,但優(yōu)選如下面所示例的那樣在體外進(jìn)行所述修飾。消除或減少核苷酸序列通過(guò)細(xì)胞表達(dá)的便利方式的例子是基于基因取代,基因缺失,或基因破壞的技術(shù)。例如,在基因破壞方法中,將相應(yīng)于內(nèi)源核苷酸序列的核酸序列在體外進(jìn)行誘變以產(chǎn)生缺陷性的核酸序列,然后將其轉(zhuǎn)化入親本細(xì)胞中以產(chǎn)生缺陷基因。通過(guò)同源重組,所述缺陷性核酸序列替代了內(nèi)源性核苷酸序列。理想的是所述缺陷性核苷酸序列還編碼標(biāo)記,其可用于選擇其中核苷酸序列被修飾或破壞的轉(zhuǎn)化子。在特別優(yōu)選的方面,用可選擇的標(biāo)記(如本文所述的那些)來(lái)破壞所述核苷酸序列?;蛘?,可以使用與所述核苷酸序列互補(bǔ)的序列通過(guò)確定的反義或RNAi技術(shù)來(lái)進(jìn)行所述核苷酸序列的修飾或失活。更具體地,通過(guò)導(dǎo)入與所述基因的核苷酸序列互補(bǔ)的序列可以減少或消除所述核苷酸序列通過(guò)細(xì)胞的表達(dá),所述序列可以在細(xì)胞中轉(zhuǎn)錄并且能夠與細(xì)胞中產(chǎn)生的mRNA雜交。由此在允許所述互補(bǔ)反義核苷酸序列與mRNA雜交的條件下,減少或消除翻譯的蛋白質(zhì)的量。本發(fā)明進(jìn)一步涉及親本細(xì)胞的突變體細(xì)胞,其包含編碼多肽的核苷酸序列或其調(diào)控序列的破壞或缺失,這導(dǎo)致與親本細(xì)胞相比突變體細(xì)胞產(chǎn)生更少的多肽或不產(chǎn)生多肽。這樣生成的多肽缺陷型突變細(xì)胞作為表達(dá)天然和/或異源多肽的宿主細(xì)胞特別有用。所以,本發(fā)明進(jìn)一步涉及生產(chǎn)天然或異源多肽的方法,其包括(a)在有助于生產(chǎn)多肽的條件下培養(yǎng)突變細(xì)胞;和(b)回收所述多肽。術(shù)語(yǔ)“異源多肽”在本文中定義為對(duì)宿主細(xì)胞不是天然的多肽,進(jìn)行了修飾以改變天然序列的天然蛋白,或作為通過(guò)重組DNA技術(shù)對(duì)宿主細(xì)胞操作的結(jié)果其表達(dá)在量上改變的天然蛋白。在另一方面,本發(fā)明涉及通過(guò)發(fā)酵可產(chǎn)生本發(fā)明的多肽以及目標(biāo)蛋白產(chǎn)物的細(xì)胞來(lái)生產(chǎn)基本上無(wú)葡糖苷酶活性的蛋白質(zhì)產(chǎn)品的方法在發(fā)酵之前、過(guò)程中或發(fā)酵完成之后向發(fā)酵液(fermentationbroth)中添加有效量的能夠抑制β-葡糖苷酶活性的試劑,從發(fā)酵液中回收目標(biāo)產(chǎn)物,并且任選地將回收的產(chǎn)物進(jìn)行進(jìn)一步純化。在另一方面,本發(fā)明涉及如下生產(chǎn)基本上無(wú)葡糖苷酶活性的蛋白質(zhì)產(chǎn)品的方法在允許產(chǎn)物表達(dá)的條件下培養(yǎng)細(xì)胞,將得到的培養(yǎng)液進(jìn)行組合的PH和溫度處理以基本上減少葡糖苷酶活性,和從發(fā)酵液中回收產(chǎn)物?;蛘?,可以將從培養(yǎng)液回收的酶制備物進(jìn)行組合的PH和溫度處理。所述組合的ρΗ和溫度處理可任選地與用β-葡糖苷酶抑制劑處理組合使用。依照本發(fā)明的這個(gè)方面,可能去除至少60%,優(yōu)選至少75%,更優(yōu)選至少85%,還更優(yōu)選至少95%,并且最優(yōu)選至少99%的β-葡糖苷酶活性。可使用此方法獲得葡糖苷酶活性的完全去除。組合的ρΗ和溫度處理優(yōu)選在2-4或9-11范圍內(nèi)的ρΗ和至少60_70°C范圍內(nèi)的溫度進(jìn)行一段足夠的時(shí)間以達(dá)到期望的效果,通常30至60分鐘是足夠的。用于培養(yǎng)和純化感興趣的產(chǎn)物的方法可以通過(guò)本領(lǐng)域已知的方法進(jìn)行。本發(fā)明用于產(chǎn)生基本上無(wú)葡糖苷酶活性的產(chǎn)物的方法在真核多肽,特別是真菌蛋白質(zhì)例如酶的產(chǎn)生中是特別令人有興趣的。所述酶可以選自,例如,淀粉分解酶(anxiolyticenzyme)、脂肪分解酶、蛋白水解酶、纖維素分解酶(cellulolyticenzyme)、氧化還原酶或植物細(xì)胞壁降解酶。這些酶的實(shí)例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、過(guò)氧化氫酶、纖維二糖水解酶、纖維素酶、幾丁質(zhì)酶(chitinase)、角質(zhì)酶(cutinase)、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、內(nèi)切葡聚糖酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、商素過(guò)氧化物酶、半纖維素酶、轉(zhuǎn)化酶、異構(gòu)酶、漆酶、連接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果膠分解酶、過(guò)氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)移酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶。β-葡糖苷酶-缺陷細(xì)胞也可以用于表達(dá)在制藥上感興趣的異源蛋白質(zhì)例如激素、生長(zhǎng)因子、受體等??衫斫獾氖切g(shù)語(yǔ)“真核多肽”不僅包括天然多肽,也包括多肽例如酶,其通過(guò)氨基酸取代、缺失或添加或其它這樣的修飾而被修飾以增強(qiáng)活性、熱穩(wěn)定性、PH耐受性等。在另外的方面,本發(fā)明涉及基本上無(wú)葡糖苷酶活性的蛋白質(zhì)產(chǎn)物,其通過(guò)本發(fā)明的方法產(chǎn)生。抑制具有β-葡糖苷酶活性的多肽表達(dá)的方法本發(fā)明還涉及抑制具有β-葡糖苷酶活性的多肽在細(xì)胞中表達(dá)的方法,其包括對(duì)細(xì)胞施用雙鏈RNA(dsRNA)分子或者在細(xì)胞中表達(dá)雙鏈RNA(dsRNA)分子,其中dsRNA包含本發(fā)明多核苷酸的亞序列。在一個(gè)優(yōu)選的方面,dsRNA長(zhǎng)約15、16、17、18、19、20、21、22、23、24,25或更多的雙鏈體核苷酸。dsRNA優(yōu)選是小干擾RNA(siRNA)或微RNA(miRNA)。在一個(gè)優(yōu)選的方面,dsRNA是用于抑制轉(zhuǎn)錄的小干擾RNA(SiRNA)。在另一個(gè)優(yōu)選的方面,dsRNA是用于抑制翻譯的小RNA(miRNA)。本發(fā)明還涉及用于抑制細(xì)胞中具有葡糖苷酶活性的多肽表達(dá)的這些雙鏈RNA(dsRNA)分子,其包含SEQIDNO=I的成熟多肽編碼序列的部分。本發(fā)明不受限于任何特定作用機(jī)制,dsRNA能進(jìn)入細(xì)胞,并引起相似或相同序列的單鏈RNA(ssRNA)的降解,所述RNA包括內(nèi)源mRNA。當(dāng)細(xì)胞接觸dsRNA時(shí),來(lái)自同源基因的mRNA選擇性地受到稱為RNA干擾(RNAi)的過(guò)程的降解。本發(fā)明的dsRNA可以用于基因沉默。在一個(gè)方面,本發(fā)明提供使用本發(fā)明的dsRNAi選擇性地降解RNA的方法。所述過(guò)程可以在體外、在活體外或離體(exvivo)或在體內(nèi)進(jìn)行。在一個(gè)方面,dsRNA分子能夠用于產(chǎn)生細(xì)胞、器官或動(dòng)物中的功能缺失突變(loss-of-functionmutation)。制備或使用選擇性降解RNA的dsRNA分子的方法在本領(lǐng)域中公知,參見(jiàn),例如,美國(guó)專利No.6,506,559;美國(guó)專利No.6,511,824;美國(guó)專利No.6,515,109;和美國(guó)專利No.6,489,127。組合物本發(fā)明還涉及包含本發(fā)明的多肽的組合物。優(yōu)選地,所述組合物富含這種多肽。術(shù)語(yǔ)“富含”表示所述組合物的β-葡糖苷酶活性,例如,以至少1.1的富集因數(shù)(enrichmentfactor)±曾力口。所述組合物可以包含本發(fā)明的多肽作為主要酶成分,例如,單成分組合物?;蛘撸鼋M合物可以包含多種酶活性,如氨肽酶、淀粉酶、糖酶、羧肽酶、過(guò)氧化氫酶、纖維素酶、幾丁質(zhì)酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、鹵素過(guò)氧化物酶、轉(zhuǎn)化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠分解酶、肽谷氨酰胺酶(peptidoglutaminase)、過(guò)氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶。額外的酶可以通過(guò)例如屬于以下屬或種的微生物產(chǎn)生曲霉屬,優(yōu)選棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉或米曲霉;鐮孢屬,優(yōu)選桿孢狀鐮孢、禾谷鐮孢、庫(kù)威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢;腐質(zhì)霉屬,優(yōu)選特異腐質(zhì)霉或疏棉狀腐質(zhì)霉;或木霉屬,優(yōu)選哈茨木霉、康寧木霉、長(zhǎng)枝木霉、里氏木霉或綠色木霉??梢砸勒毡绢I(lǐng)域內(nèi)已知的方法制備多肽組合物,并且可以是液體或干組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或微粒(microgranulate)的形式??梢砸勒毡绢I(lǐng)域內(nèi)已知方法將包括于所述組合物中的多肽穩(wěn)定化。下面給出的是本發(fā)明多肽組合物的優(yōu)選的用途的實(shí)例。本發(fā)明的多肽組合物的劑量和使用該組合物的其它條件可以基于本領(lǐng)域內(nèi)已知的方法確定。纖維素材料的加工本發(fā)明還涉及降解或轉(zhuǎn)化纖維素材料的方法,其包括在存在本發(fā)明的具有β-葡糖苷酶活性的多肽的情況下,用酶組合物處理纖維素材料。在一個(gè)優(yōu)選方面,所述方法還包括回收已降解或轉(zhuǎn)化的纖維素材料。本發(fā)明還涉及產(chǎn)生發(fā)酵產(chǎn)物的方法,其包括(a)在存在本發(fā)明的具有葡糖苷酶活性的多肽的條件下,用酶組合物糖化纖維素材料;(b)用一種或多種(幾種)發(fā)酵微生物發(fā)酵經(jīng)糖化的纖維素材料以產(chǎn)生發(fā)酵產(chǎn)物;和(C)從發(fā)酵回收發(fā)酵產(chǎn)物。本發(fā)明還涉及發(fā)酵纖維素材料的方法,其包括用一種或多種(幾種)發(fā)酵微生物發(fā)酵纖維素材料,其中在存在具有葡糖苷酶活性的多肽的條件下,用酶組合物糖化纖維素材料。在一個(gè)優(yōu)選的方面,纖維素材料的發(fā)酵產(chǎn)生發(fā)酵產(chǎn)物。在另一個(gè)優(yōu)選的方面,方法進(jìn)一步包括從發(fā)酵回收發(fā)酵產(chǎn)物。本發(fā)明的方法可以用于將纖維素材料糖化成可發(fā)酵糖,并且將可發(fā)酵糖轉(zhuǎn)化成很多有用的物質(zhì),例如燃料、飲用乙醇和/或發(fā)酵產(chǎn)物(例如酸、醇、酮、氣體等)。從纖維素材料產(chǎn)生期望的發(fā)酵產(chǎn)物通常涉及預(yù)處理、酶水解(糖化)和發(fā)酵。根據(jù)本發(fā)明的纖維素材料的處理可以使用本領(lǐng)域的常規(guī)過(guò)程完成。此外,本發(fā)明的方法能使用經(jīng)配置以依照發(fā)明操作的任何常規(guī)生物質(zhì)處理設(shè)備進(jìn)行。水解(糖化)和發(fā)酵,分別或同時(shí),包括但不限于,分離的水解和發(fā)酵(SHF)、同步糖化和發(fā)酵(SSF)、同步糖化和共發(fā)酵(SSCF)、混合的水解和發(fā)酵(HHF)、分離的水解和共發(fā)酵(SHCF)、混合的水解和共發(fā)酵(HHCF),和直接微生物轉(zhuǎn)化(DMC)。SHF使用分離的處理步驟以首先將纖維素材料酶水解為可發(fā)酵糖,例如,葡萄糖,纖維二糖、纖維三糖和戊糖,然后將可發(fā)酵糖發(fā)酵成為乙醇。在SSF中,纖維素材料的酶水解和糖變?yōu)橐掖嫉陌l(fā)酵在一個(gè)步驟中組合(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanolProductionandUtilization,ffyman,C.E編,Taylor&Francis,Washington,DC,179-212)。SSCF包括多種糖的共發(fā)酵(Sheehan,J.,和Himmel,Μ.,1999,Enzymes,energyandtheenvironment:AstrategicperspectiveontheU.S.DepartmentofEnergy'sresearchanddevelopmentactivitiesforbioethanol,Biotechnol.Prog.15:817-827)。HHF在同步糖化和水解步驟之外,還涉及單獨(dú)的水解步驟,所述步驟可以在同一個(gè)反應(yīng)器中進(jìn)行。HHF過(guò)程中的步驟可以在不同的溫度,S卩,高溫酶糖化,然后在發(fā)酵菌株能夠耐受的較低溫度進(jìn)行SSF。DMC在一個(gè)或多個(gè)(幾個(gè))步驟中組合了所有三個(gè)過(guò)程(酶產(chǎn)生、水解和發(fā)酵),其中使用相同的生物體產(chǎn)生用于將木素纖維素轉(zhuǎn)化成可發(fā)酵糖并將可發(fā)酵糖轉(zhuǎn)化成終產(chǎn)物的酶(Lynd,L.R.,ffeimer,P.J.,vanZyl,W.H.,禾口Pretorius,I.S.,2002,Microbialcelluloseutilization!Fundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66:506-577)。在本文可以理解的是,本領(lǐng)域中任何已知的方法,包括預(yù)處理、酶水解(糖化)、發(fā)酵,或它們的組合,可用于實(shí)施本發(fā)明的方法。常規(guī)設(shè)備包括補(bǔ)料批式攪拌反應(yīng)器、批式攪拌反應(yīng)器、具有超濾的連續(xù)流攪拌反應(yīng)器和/或連續(xù)活塞流柱式反應(yīng)器(FernandadeCastilhosCorazza,FlavioFariadeMoraes,GisellaMariaZanin禾口IvoNeitzel,2003,Optimalcontrolinfed-batchreactorforthecellobiosehydrolysis,ActaScientiarum.Technology25:33-38;Gusakov,A.V.,禾口Sinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose1.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346-352)、研磨反應(yīng)器(Ryu,S.K.,和Lee,J.Μ.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.25:53-65),或者具有由電磁場(chǎng)引起的強(qiáng)烈攪拌的反應(yīng)器(Gusakov,Α.V.,Sinitsyn,Α.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,0.V.,1996,Enhancementofenzymaticcellulose3hydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56:141-153)。其它反應(yīng)器類型包括流化床、升流層(upflowblrnket)、固定化和用于水解和/或發(fā)酵的擠出機(jī)型的反應(yīng)器。預(yù)處理。在本發(fā)明的方法的實(shí)施中,可以使用本領(lǐng)域已知的任何預(yù)處理過(guò)程破壞植物細(xì)胞壁的纖維素材料組分(Chmdra等,2007,SubstratepretreatmentThekeytoeffectiveenzymatichydrolysisoflignocellulosics?Adv.Biochem.Engin./Biotechnol.108:67-93;Galbe禾口Zacchi,2007,Pretreatmentoflignocellulosicmaterialsforefficientbioethanolproduction,Adv.Biochem.Engin./Biotechnol.108:41-65;Hendriks禾口Zeeman,2009,Pretreatmentstoenhancethedigestibilityoflignocellulosicbiomass,BioresourceTechnol.10010-18;Mosier等,2005,F(xiàn)eaturesofpromisingtechnologiesforpretreatmentoflignocellulosicbiomass,BioresourceTechnol.96:673-686;Taherzadeh禾口Karimi,2008,Pretreatmentoflignocellulosicwastestoimproveethanolandbiogasproduction:Areview,Int.J.ofMol.Sci.9:1621-1651;Yang禾口Wyman,2008,Pretreatment:thekeytounlockinglow-costcellulosicethanol,BiofuelsBioproductsandBiorefining-Biofpr.2:26-40)。纖維素材料也可以在預(yù)處理之前使用本領(lǐng)域中已知的方法進(jìn)行粒度減小、預(yù)浸泡、潤(rùn)濕、洗滌或調(diào)節(jié)。常規(guī)的預(yù)處理包括但不限于,蒸汽預(yù)處理(伴隨或不伴隨爆炸)、稀酸預(yù)處理、熱水預(yù)處理、堿性預(yù)處理、石灰預(yù)處理、濕氧化、濕爆炸、氨纖維爆炸、有機(jī)溶劑預(yù)處理和生物預(yù)處理。其它預(yù)處理包括氨滲濾、超聲、電穿孔、微波、超臨界CO2、超臨界吐0、臭氧和、輻射預(yù)處理??梢栽谒夂?或發(fā)酵之前預(yù)處理纖維素材料。預(yù)處理優(yōu)選在水解前進(jìn)行?;蛘撸A(yù)處理可以與酶水解同時(shí)進(jìn)行以釋放可發(fā)酵糖,如葡萄糖、木糖和/或纖維二糖。在大多數(shù)情況下,預(yù)處理步驟本身使一些生物質(zhì)轉(zhuǎn)化成可發(fā)酵糖(甚至在不存在酶的情況下)。蒸汽預(yù)處理。在蒸汽預(yù)處理中,加熱纖維素材料以破壞植物細(xì)胞壁成分,包括木質(zhì)素、半纖維素和纖維素,使酶可接觸纖維素和其它部分,例如,半纖維素。將纖維素材料通過(guò)或穿過(guò)反應(yīng)容器,其中注入蒸汽以增加溫度至需要的溫度和壓力,并且在其中保持期望的反應(yīng)時(shí)間。蒸汽預(yù)處理優(yōu)選在140-230°C,更優(yōu)選160-200°C,并且最優(yōu)選170-190°C進(jìn)行,其中最優(yōu)的溫度范圍依賴于加入的任何化學(xué)催化劑。蒸汽預(yù)處理的停留時(shí)間優(yōu)選1-15分鐘,更優(yōu)選3-12分鐘,并且最優(yōu)選4-10分鐘,其中最優(yōu)的停留時(shí)間依賴于溫度范圍和加入的任何化學(xué)催化劑。蒸汽預(yù)處理允許相對(duì)較高的固體加載量,使纖維素材料在預(yù)處理過(guò)程中通常僅僅變得潮濕。蒸汽預(yù)處理經(jīng)常與預(yù)處理后的物質(zhì)的爆炸放料(explosivedischarge)組合,這稱為蒸汽爆炸,即,快速閃變至大氣壓和物質(zhì)的湍流,以通過(guò)破碎增加可接觸的表面積(Duff禾口Murray,1996,BioresourceTechnology8551-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美國(guó)專利申請(qǐng)No.20020164730)。在蒸汽預(yù)處理過(guò)程中,切割半纖維素乙酰基團(tuán),并且得到的酸自催化纖維素部分水解成單糖和寡糖。去除木質(zhì)素至有限的程度。經(jīng)常在蒸汽預(yù)處理之前加入催化劑如H2SO4或SO2(通常0.3至3%w/w),其可減少時(shí)間,降低溫度,增加回收率,并改進(jìn)酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga^,2004,Appl.Biochem.Biotechnol.113-116509-523;Sassner等·,2006,EnzymeMicrob.Technol.39:756-762)?;瘜W(xué)預(yù)處理術(shù)語(yǔ)“化學(xué)處理“指能促進(jìn)纖維素、半纖維素和/或木質(zhì)素分離和/或釋放的任何化學(xué)處理。合適的化學(xué)預(yù)處理步驟的實(shí)例包括例如稀酸預(yù)處理、石灰預(yù)處理、濕氧化、氨纖維/冷凍爆炸(AFEX)、氨滲濾(APR)和有機(jī)溶劑預(yù)處理。在稀酸預(yù)處理中,將纖維素材料與稀酸(通常是吐504)和水混合以形成漿料,由蒸汽加熱至期望的溫度,并在一段停留時(shí)間后閃變至大氣壓??梢杂煤芏喾磻?yīng)器設(shè)計(jì)進(jìn)行稀酸預(yù)處理,例如,活塞流式反應(yīng)器、逆流反應(yīng)器或連續(xù)逆流收縮床反應(yīng)器(Duff和Murray,1996,supra;Schell等,2004,BioresourceTechnol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。還可以使用堿性條件下的幾種預(yù)處理方法。這些堿預(yù)處理包括,但不限于,石灰預(yù)處理、濕氧化、氨滲濾(APR)和氨纖維/冷凍爆炸(AFEX)。用碳酸鈣、氫氧化鈉或氨,在85_150°C的低溫進(jìn)行石灰預(yù)處理,停留時(shí)間從1小時(shí)到幾天(Wyman等,2005,BioresourceTechnol.96:1959-1966;Mosier等,2005,BioresourceTechnol.96:673-686)WO2006/11089UW02006/110899,WO2006/110900和WO2006/110901公開(kāi)了使用氨的預(yù)處理方法。濕法氧化是熱預(yù)處理,通常在180-200°C進(jìn)行5_15分鐘,加入氧化劑如過(guò)氧化氫或過(guò)壓氧(Schmidt禾口Thomsen,1998,BioresourceTechnol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.1171-17;Varga^,2004,Biotechnol.Bioeng.88567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。預(yù)處理以優(yōu)選1-40%干物質(zhì),更優(yōu)選2-30%干物質(zhì),并且最優(yōu)性5-20%干物質(zhì)進(jìn)行,并且由于加入堿如碳酸鈉,初始PH經(jīng)常會(huì)增加。濕法氧化預(yù)處理方法的修改方法,稱為濕爆炸(濕氧化和蒸汽爆炸的組合),能夠處理高達(dá)30%的干物質(zhì)。在濕爆炸中,在預(yù)處理過(guò)程中,在一定的停留時(shí)間后引入氧化劑。然后通過(guò)閃變至大氣壓而結(jié)束預(yù)處理(W02006/032282)。氨纖維爆炸(AFEX)涉及在溫和溫度如90-100°C和高壓如17_20bar,用液體或氣體氨將纖維素材料處理5-10分鐘,其中干物質(zhì)含量可以高達(dá)60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,BioresourceTechnol.96:2014-2018)。AFEX預(yù)處理導(dǎo)致纖維素解聚,和半纖維素的部分水解。木質(zhì)素-糖復(fù)合物得到切割。有機(jī)溶劑預(yù)處理通過(guò)用含水乙醇00-60%乙醇)在160_200°C提取30-60分鐘而將纖維素材料去木質(zhì)素化(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,Biotechnol.Bioeng.94:851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121219-230)。經(jīng)常加入硫酸作為催化劑。在有機(jī)溶劑預(yù)處理中,去除大部分半纖維素。合適的預(yù)處理方法的其他實(shí)例如Schell等,2003,Appl.BiochemandBiotechn.Vol.105-108:69-85,和Mosier等,2005,BioresourceTechnology96:673_686,和美國(guó)專利公開(kāi)申請(qǐng)2002/0164730所述。在一個(gè)方面,化學(xué)預(yù)處理優(yōu)選作為酸處理,并且更優(yōu)選作為連續(xù)稀酸和/或弱酸(mildacid)處理進(jìn)行。酸通常是硫酸,但也可以使用其它酸,如乙酸、檸檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氫或其混合物。弱酸處理在優(yōu)選1-5,更優(yōu)選1-4,并且最優(yōu)選1-3的PH范圍內(nèi)進(jìn)行。在一個(gè)方面,酸濃度在優(yōu)選0.01至20wt%酸,更優(yōu)選0.05至IOwt%酸,甚至更優(yōu)選0.1至5wt%酸,并且最優(yōu)選0.2至2.Owt%酸的范圍內(nèi)。酸與纖維素材料接觸,并在優(yōu)選160-220°C,和更優(yōu)選165-195°C范圍內(nèi)的溫度保持?jǐn)?shù)秒到數(shù)分鐘,例如1秒-60分鐘的時(shí)間。在另一個(gè)方面,預(yù)處理作為氨纖維爆炸步驟(AFEX預(yù)處理步驟)進(jìn)行。在另一個(gè)方面,預(yù)處理發(fā)生在含水漿料中。在優(yōu)選的方面,在預(yù)處理過(guò)程中纖維素材料以優(yōu)選10-80wt%,更優(yōu)選20-70wt%,并且最優(yōu)性30-60wt%,如約50wt%的量存在。預(yù)處理的纖維素材料可以不洗滌或者使用本領(lǐng)域任何已知的方法洗滌,例如,用水洗滌。機(jī)械預(yù)處理術(shù)語(yǔ)“機(jī)械預(yù)處理”指各種類型的磨制(grinding)或粉碎(milling)(例如,干磨、濕磨或振動(dòng)球磨)。物理預(yù)處理術(shù)語(yǔ)“物理預(yù)處理”指促進(jìn)纖維素、半纖維素和/或木質(zhì)素從纖維素材料分離和/或釋放的任何預(yù)處理。例如,物理預(yù)處理可涉及輻射(例如,微波輻射)、汽蒸/蒸汽爆炸、水熱解(hydrothermolysis)和它們的組合。物理預(yù)處理可以涉及高壓和/或高溫(蒸汽爆炸)。在一個(gè)方面,高壓指優(yōu)選約300至約600psi,更優(yōu)選約350至約550psi,并且最優(yōu)選約400至約500psi,如約450psi的壓力。在另一個(gè)方面,高溫指約100至300°C,優(yōu)選約140至235°C的溫度。在一個(gè)優(yōu)選的方面,機(jī)械預(yù)處理在使用如上所定義的高溫和高壓的分批過(guò)程、蒸汽槍水解器系統(tǒng),例如來(lái)自SundsDefiratorAB,Sweden的SundsHydrolyzer中進(jìn)行。組合的物理和化學(xué)預(yù)處理可以對(duì)纖維素材料進(jìn)行物理和化學(xué)預(yù)處理。例如,預(yù)處理步驟可以涉及稀酸或弱酸處理和高的溫度和/或壓力處理。根據(jù)需要,可以順序或同時(shí)進(jìn)行物理和化學(xué)預(yù)處理。還可以包括機(jī)械預(yù)處理。因此,在一個(gè)優(yōu)選的方面,對(duì)纖維素材料進(jìn)行機(jī)械、化學(xué)或物理預(yù)處理,或者它們的任何組合,以促進(jìn)纖維素、半纖維素和/或木質(zhì)素的分離和/或釋放。生物預(yù)處理術(shù)語(yǔ)“生物預(yù)處理”指可以促進(jìn)纖維素、半纖維素和/或木質(zhì)素從纖維素材料分離和/或釋放的任何生物預(yù)處理。生物預(yù)處理技術(shù)可以包括應(yīng)用溶解木質(zhì)素的微生物(參見(jiàn),例如,Hsu,T.-A.,1996,Pretreatmentofbiomass,于HandbookonBioethanol-ProductionandUtilization,Wyman,C.E編,Taylor&Francis,Washington,DC,179-212;Ghosh禾口Singh,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomass:areview,于EnzymaticConversionofBiomassforFuelsProduction,Himmel,Μ.E.,Baker,J.0.,禾口Overend,R.P.,編,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.,禾口Tsao,G.Τ.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.,編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Olsson禾口Hahn—Hagerdal,1996,F(xiàn)ermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18:312_331;禾口Vallander禾口Eriksson,1990,Productionofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.Biochem.Eng./Biotechnol.42:63-95)。糖化。在水解(也稱作糖化)步驟中,將例如經(jīng)預(yù)處理的纖維素材料水解以將纖維素和任選地也將半纖維素分解成可發(fā)酵糖,如葡萄糖、纖維二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的寡糖。水解由酶組合物以酶法在本發(fā)明具有葡糖苷酶活性的多肽的存在下進(jìn)行。所述組合物可以進(jìn)一步包含一種或多種(幾種)半纖維素分解酶。組合物的酶還可以順序加入。酶水解優(yōu)選在易于由本領(lǐng)域技術(shù)人員確定的條件下,在合適的含水環(huán)境中進(jìn)行。在一個(gè)優(yōu)選的方面,水解在適于酶的活性,即對(duì)于酶最優(yōu)的條件下進(jìn)行。水解可以以補(bǔ)料批式或連續(xù)的過(guò)程進(jìn)行,其中將預(yù)處理的纖維素材料(底物)逐漸補(bǔ)入,例如,含酶的水解溶液中。糖化通常在攪拌釜反應(yīng)器或發(fā)酵罐中,在受控的ρΗ、溫度和混合條件下進(jìn)行。合適的處理時(shí)間、溫度和PH條件可以由本領(lǐng)域技術(shù)人員容易地確定。例如,糖化可以持續(xù)長(zhǎng)達(dá)200小時(shí),但是通常優(yōu)選進(jìn)行約12至約96小時(shí),更優(yōu)選約16至約72小時(shí),并且最優(yōu)選約24至約48小時(shí)。溫度優(yōu)選約25°C至約70°C,更優(yōu)選約30°C至約65°C,并且最優(yōu)選約40°C至約60°C,特別是約50°C。ρΗ優(yōu)選約3至約8,更優(yōu)選約3.5至約7,并且最優(yōu)選約4至約6,特別是約ρΗ5。干燥固體含量?jī)?yōu)選約5至約50wt%,更優(yōu)選約10至約40wt%,并且最優(yōu)選約20至約30wt%。所述酶組合物優(yōu)選包含具有纖維素分解活性和/或木聚糖降解活性。在一個(gè)方面,所述酶組合物包含一種或多種(幾種)纖維素分解酶。在另一個(gè)方面,所述酶組合物包含一種或多種(幾種)木聚糖降解酶。在另一個(gè)方面,所述酶組合物包含一種或多種(幾種)纖維素分解酶和一種或多種(幾種)木聚糖降解酶。所述一種或多種(幾種)纖維素分解酶優(yōu)選選自下組內(nèi)切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶。所述一種或多種(幾種)木聚糖降解酶優(yōu)選選自下組木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。在另一個(gè)方面,所述酶組合物另外或甚至還包含具有纖維素分解增強(qiáng)活性的多肽(參見(jiàn),例如WO2005/074647、WO2005/074656和WO2007/089290)。在另一個(gè)方面,所述酶組合物可進(jìn)一步或甚至進(jìn)一步包含一種或多種(幾種)其他酶活性以改善含纖維素材料的降解。其他優(yōu)選的酶為半纖維素酶(例如α-D-葡糖醛酸糖苷酶、α-L-阿拉伯呋喃糖苷酶、內(nèi)切甘露聚糖酶、β-甘露糖苷酶、α-半乳糖苷酶、內(nèi)切-a-L-阿拉伯聚糖酶、β-半乳糖苷酶),糖酯酶(例如乙酰木聚糖酯酶、乙酰甘露聚糖酯酶、阿魏酸酯酶、香豆酸酯酶、葡糖醛酸酯酶(glucuronoylesterases)),果膠酶,蛋白酶,木質(zhì)素水解酶(ligninolyticenzyme)(例如漆酶、錳過(guò)氧化物酶、木質(zhì)素過(guò)氧化物酶、H2O2產(chǎn)生酶、氧化還原酶),棒曲霉素(expansin)、膨脹素(swollenin)或其組合。在本發(fā)明的方法中,其他酶可在發(fā)酵之前或之中添加,例如在糖化之中或在發(fā)酵微生物繁殖之中或之后添加。所述酶組合物的一種或多種(幾種)組分可為野生型蛋白、重組蛋白或野生型蛋白和重組蛋白的組合。舉例而言,一種或多種(幾種)組分可為細(xì)胞的天然蛋白,其用作宿主細(xì)胞以重組表達(dá)一種或多種(幾種)酶組合物的其他組分。酶組合物的一種或多種(幾種)組分可作為單組分產(chǎn)生,然后將其組合以形成酶組合物。所述酶組合物可為多組分和單組分蛋白制備物的組合。用于本發(fā)明方法中的酶可為任何適用于本文中所述工藝的形式,如例如去除或未去除細(xì)胞的粗發(fā)酵液,含或不含細(xì)胞碎片的細(xì)胞裂解液,半純化或純化的酶制備物,或宿主細(xì)胞,作為酶的來(lái)源。所述酶組合物可為干粉或顆粒,無(wú)粉塵的顆粒,液體,穩(wěn)定化液體或穩(wěn)定化受保護(hù)的酶。液體酶制備物可根據(jù)確立的工藝,例如通過(guò)添加穩(wěn)定劑如糖、糖醇或其他多元醇,和/或乳酸或其他有機(jī)酸來(lái)穩(wěn)定化。具有β-葡糖苷酶活性的酶和多肽的最適量取決于幾個(gè)因素,其包括但不限于,組分纖維素分解酶的混合物、含纖維素底物、含纖維素底物的濃度、含纖維素底物的預(yù)處理、溫度、時(shí)間、PH和包括發(fā)酵生物體(例如,同步糖化和發(fā)酵的酵母)。在一個(gè)優(yōu)選的方面,纖維素分解酶對(duì)于纖維素材料的有效量是約0.5至約50mg,優(yōu)選約0.5至約40mg,更優(yōu)選約0.5至約25mg,更優(yōu)選約0.75至約20mg,更優(yōu)選約0.75至約15mg,甚至更優(yōu)選約0.5至約10mg,并且最優(yōu)選約2.5至約IOmg每g纖維素材料。在另一個(gè)優(yōu)選的方面,具有β-葡糖苷酶活性的多肽對(duì)于纖維素材料的有效量是約0.01至約50.Omg,優(yōu)選約0.01至約40mg,更優(yōu)選約0.01至約30mg,更優(yōu)選約0.01至約20mg,更優(yōu)選約0.01至約10mg,更優(yōu)選約0.01至約5mg,更優(yōu)選約0.025至約1.5mg,更優(yōu)選約0.05至約1.25mg,更優(yōu)選約0.075至約1.25mg,更優(yōu)選約0.1至約1.25mg,甚至更優(yōu)選約0.15至約1.25mg,并且最優(yōu)選約0.25至約1.Omg每g纖維素材料。在另一個(gè)優(yōu)選的方面,具有β-葡糖苷酶活性的多肽對(duì)于纖維素分解酶的有效量是約0.005至約1.Og,優(yōu)選約0.01至約1.Og,更優(yōu)選約0.15至約0.75g,更優(yōu)選約0.15至約0.5g,更優(yōu)選約0.1至約0.5g,甚至更優(yōu)選約0.1至約0.5g,并且最優(yōu)選約0.05至約0.2g每g纖維素分解酶。酶可源自或獲得自任何合適的來(lái)源,包括細(xì)菌、真菌、酵母、植物或哺乳動(dòng)物來(lái)源。術(shù)語(yǔ)“獲得”在本文中意指該酶可從天然產(chǎn)生該酶作為天然酶的生物分離。術(shù)語(yǔ)“獲得”在本文中還意指該酶可在宿主生物中使用本文中所述的方法重組產(chǎn)生,其中經(jīng)重組產(chǎn)生的酶對(duì)于宿主生物是天然的或異源的,或具有修飾的氨基酸序列,例如,具有一個(gè)或多個(gè)(幾個(gè))缺失、插入和/或取代的氨基酸,即重組產(chǎn)生的酶,其為天然氨基酸序列的片段和/或突變體或通過(guò)本領(lǐng)域已知的氨基酸改組方法產(chǎn)生的酶。天然酶的含義中涵蓋的是天然變體,而外來(lái)酶的含義中涵蓋的是重組(如通過(guò)定位誘變或重排)獲得的變體具有纖維素分解酶活性或木聚糖降解活性的多肽可以是細(xì)菌多肽。例如,所述多肽可以是革蘭氏陽(yáng)性細(xì)菌多肽如芽孢桿菌屬(Bacillus)、鏈球菌屬(Sti^ptococcus)JjI霉菌屬(Streptomyces)、葡萄球菌屬(Staphylococcus)、腸球菌屬(Enterococcus)菌屬(Lactobacillus)、乳球菌屬(Lactococcus)、梭菌屬(Clostridium)、地芽孢桿菌屬(Geobacillus)或海洋芽孢桿菌屬(Oceanobacillus)多肽,所述多肽具有纖維素分解酶活性或木聚糖降解活性;或革蘭氏陰性細(xì)菌多肽,如大腸桿菌、假單胞菌屬O^eudomonas)、沙門(mén)氏菌屬(Salmonella)、彎曲桿菌屬(Campylobacter)、螺桿菌屬(Helicobacter)菌屬(Flavobacterium)、梭桿菌屬(Fusobacterium)>iMlfliiM(Ilyobacter)、奈瑟氏菌屬(Neisseria)或脲原體屬(toeaplasma)多肽,所述多肽具有纖維素分解酶活性或木聚糖降解活性。在一個(gè)優(yōu)選的方面,所述多肽是具有纖維素分解活性或木聚糖降解活性的嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結(jié)芽孢桿菌、堅(jiān)強(qiáng)芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌或蘇云金芽孢桿菌多肽。在另一個(gè)優(yōu)選的方面,所述多肽是具有纖維素分解活性或木聚糖降解活性的似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌或馬鏈球菌獸瘟亞種多肽。在另一個(gè)優(yōu)選的方面,所述多肽是具有纖維素分解活性或木聚糖降解活性的不產(chǎn)色鏈霉菌、除蟲(chóng)鏈霉菌、天藍(lán)鏈霉菌、灰色鏈霉菌或淺青紫鏈霉菌多肽。具有纖維素分解活性或木聚糖降解活性的多肽也可以是真菌多肽,并且更優(yōu)選酵母多肽如假絲酵母屬、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬多肽,其具有纖維素分解活性或木聚糖降解活性;或更優(yōu)選絲狀真菌多肽如枝頂孢霉屬、傘菌屬、鏈格孢屬、曲霉屬、短梗霉屬、Botryospaeria、擬蠟菌屬、Chaetomidium、金孢子菌屬、Claviceps、Cochliobolus、鬼傘屬、Coptotermes、棒囊殼屬、隱叢赤殼菌屬、隱球菌屬、色二孢屬、黑耳屬、Filikisidium、鐮孢屬、赤霉屬、全鞭毛蟲(chóng)屬、腐質(zhì)霉屬、耙齒菌屬、蘑菇屬、L印tospaeria、梨孢菌屬、Melanocarpus、多孔菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬、瘤胃壺菌屬、Poitrasia、假黑盤(pán)菌屬、I^seudotrichonympha、根毛霉屬、裂褶菌屬、柱頂孢屬、踝節(jié)菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、木霉屬、長(zhǎng)毛盤(pán)菌屬、輪枝孢屬、包腳菇屬或炭角菌屬多肽,其具有纖維素分解活性或木聚糖降解活性。在一個(gè)優(yōu)選的方面,所述多肽是具有纖維素分解活性或木聚糖降解活性的卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卵形酵母多肽。在另一個(gè)優(yōu)選的方面,所述多肽是具有纖維素分解活性或木聚糖降解活性的解纖維枝頂孢霉、棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉、米曲霉、嗜角質(zhì)金抱子菌、Chrysosporiumlucknowense、熱帶金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌、Chrysosporiumqueenslandicum>Chrysosporimzonatum、桿孢狀鐮孢、禾谷鐮孢、庫(kù)威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、灰腐質(zhì)霉、特異腐質(zhì)霉、疏棉狀腐質(zhì)霉、白耙齒菌、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、繩狀青霉、產(chǎn)紫青霉、黃孢平革菌、Thielaviaachromatica,Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭抱殼、Thielaviafimeti、小孢梭孢殼、卵孢梭孢殼、Thielaviaperuviana、瘤孢梭孢殼、毛梭孢殼、Thielaviasubthermophila、土生梭孢霉、哈茨木霉、康寧木霉、長(zhǎng)枝木霉、里氏木霉、綠色木霉或Trichophaeasaccata$1^。還可以使用具有纖維素分解酶活性或木聚糖降解活性的多肽經(jīng)化學(xué)修飾或蛋白質(zhì)工程改造的突變體。所述纖維素分解酶組合物的一種或多種(幾種)組分可以是重組組分,亦即,通過(guò)克隆編碼所述單獨(dú)組分的DNA序列并隨后用該DNA序列轉(zhuǎn)化細(xì)胞并在宿主中表達(dá)(參見(jiàn),例如,W091/17243和W091/17M4)產(chǎn)生。所述宿主優(yōu)選是異源宿主(酶對(duì)宿主是異源的),但該宿主在一定條件下也可以是同源宿主(酶對(duì)宿主是同源的)。單組分纖維素分解蛋白還可以通過(guò)從發(fā)酵液中提純這樣的蛋白質(zhì)來(lái)制備。適用于本發(fā)明的商業(yè)的纖維素分解蛋白制備物的實(shí)例包括,例如,CELLICTMCtec(NovozymesA/S)、CELLUCLAST(NovozymesA/S)、NOVOZYMtm188(NovozymesA/S)、CELLUZYME(NovozymesA/S)、CEREFLO(NovozymesA/S)禾口ULTRAFLO(NovozymesA/S),ACCELERASE(GenencorInt.)、LAMINEX(GenencorInt.)、SPEZYMECP(GenencorInt.),R0HAMENT7069ff(RohmGmbH),F(xiàn)IBREZYMELDI(DyadicInternational,Inc.)>FIBREZYMELBR(DyadicInternational,Inc.)或VISCOSTAR150L(DyadicInternational,Inc.)。所述纖維素酶以固體的約0.001到約5.Owt.%,更優(yōu)選固體的0.025到約4.Owt.%,且最優(yōu)選固體的約0.005到約2.Owt.%的有效量添加。所述纖維素酶以固體的約0.001到約5.Owt.%,更優(yōu)選固體的0.025到約4.Owt.%,且最優(yōu)選固體的約0.005到約2.Owt.%的有效量添加??梢杂糜诒景l(fā)明的方法的細(xì)菌內(nèi)切葡聚糖酶的實(shí)例包括但不僅限于,解纖維熱酸菌(Acidothermuscellulolyticus)內(nèi)切葡聚糖酶(W091/05039;W093/15186;美國(guó)專利5,275,944;WO96/02551;美國(guó)專利5,536,655,W000/70031,WO05/093050);Thermobifidafusca內(nèi)切葡聚糖酶III(W005/093050);和Thermobifidafusca內(nèi)切葡聚糖酶V(W005/093050)??梢杂糜诒景l(fā)明的方法的真菌內(nèi)切葡聚糖酶的實(shí)例包括但不僅限于,里氏木霉內(nèi)切葡聚糖酶I(Penttila等,1986,Gene45:253-263;GENBANK登錄號(hào)M15665);里氏木霉內(nèi)切葡聚糖酶II(Saloheimo等,1988,Gene63:11-22;GENBANK登錄號(hào)M19373);里氏木霉內(nèi)切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GENBANK登錄號(hào)AB003694);里氏木霉內(nèi)切葡聚糖酶IV(Saloheimo等,1997,Eur.J.Biochem.249584-591;GENBANK登錄號(hào)Y11113);以及里氏木霉內(nèi)切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiology13:219-2;GENBANK登錄號(hào)Z33381);棘孢曲霉內(nèi)切葡聚糖酶(Ooi等,1990,NucleicAcidsResearchl8:5884);川地曲霉(Aspergilluskawachii)內(nèi)切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27:435-439);胡蘿卜軟腐歐文氏菌(Erwiniacarotovara)內(nèi)切葡聚糖酶(Saarilahti等,1990,Gene90:9-14);尖鐮孢內(nèi)切葡聚糖酶(GENBANK登錄號(hào)U9381);灰腐質(zhì)霉thermoidea變種內(nèi)切葡聚糖酶(GENBANK登錄號(hào)AB003107);Melanocarpusalbomyces內(nèi)切葡聚糖酶(GENBANK登錄號(hào)MAL515703);粗糙脈孢菌內(nèi)切葡聚糖酶(GENBANK登錄號(hào)XM324477);特異腐質(zhì)霉內(nèi)切葡聚糖酶V(SEQIDNO4);嗜熱毀絲霉CBS117.65內(nèi)切葡聚糖酶(SEQIDNO6);擔(dān)子菌綱(basidiomycete)CBS495.95內(nèi)切葡聚糖酶(SEQIDNO8);擔(dān)子菌綱CBS494.95內(nèi)切葡聚糖酶(SEQIDNO10);土生梭孢霉NRRL8U6CEL6B內(nèi)切葡聚糖酶(SEQIDNO12);土生梭孢霉NRRL8U6CEL6C內(nèi)切葡聚糖酶(SEQIDNO14);土生梭孢霉NRRL8126CEL7C內(nèi)切葡聚糖酶(SEQIDNO16);土生梭孢霉NRRL8U6CEL7E內(nèi)切葡聚糖酶(SEQIDNO18);土生梭孢霉NRRL8U6CEL7F內(nèi)切葡聚糖酶(SEQIDNO20);CladorrhinumfoecundissimumATCC62373CEL7A內(nèi)切葡聚糖酶(SEQIDNO22);以及里氏木霉菌株VTT-D-80133內(nèi)切葡聚糖酶(SEQIDNO:24;GENBANK登錄號(hào)M15665)。上述SEQIDN0:4、SEQIDN0:6、SEQIDNO:8,SEQIDNO:10、SEQIDNO:12、SEQIDNO:14、SEQIDNO:16、SEQIDNO:18、SEQIDNO:20,SEQIDNO:22和SEQIDNO:24的內(nèi)切葡聚糖酶分別由SEQIDNO:3、SEQID42NO:5、SEQIDNO:7、SEQIDNO:9、SEQIDNO11、SEQIDNO:13、SEQIDNO:15、SEQIDNO17,SEQIDNO19,SEQIDN0:21、SEQIDNO:23的成熟多肽編碼序列編碼??捎糜诒景l(fā)明的方法的纖維二糖水解酶的示例包括但不僅限于,里氏木霉纖維二糖水解酶I(SEQIDNO26);里氏木霉纖維二糖水解酶II(SEQIDNO28);特異腐質(zhì)霉纖維二糖水解酶I(SEQIDNO:30)、嗜熱毀絲霉纖維二糖水解酶II(SEQIDNO32和SEQIDNO34)、土生梭孢霉纖維二糖水解酶II(CEL6A)(SEQIDNO36)、嗜熱毛殼菌(Chaetomiumthermophilum)纖維二糖水解酶I(SEQIDNO38)以及嗜熱毛殼菌纖維二糖水解酶II(SEQIDNO40)。上述SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO32,SEQIDNO34,SEQIDNO36,SEQIDNO38和SEQIDNO40的纖維二糖水解酶分別由SEQIDNO23,SEQIDNO25,SEQIDNO27,SEQIDNO29,SEQIDN0:31、SEQIDNO:33、SEQIDNO:35、SEQIDNO37和SEQIDNO39的成熟多肽編碼序列編碼??捎糜诒景l(fā)明的方法的葡糖苷酶的實(shí)例包括但不僅限于米曲霉葡糖苷酶(SEQIDNO42);煙曲霉β-葡糖苷酶(SEQIDNO44);巴西青霉(Penicilliumbrasilianum)IBT20888β-葡糖苷酶(SEQIDNO46);黑曲霉β-葡糖苷酶(SEQIDNO:48);以及棘孢曲霉β-葡糖苷酶(SEQIDΝ0:50)。上述SEQIDNO40、SEQIDNO:42、SEQIDNO44,SEQIDNO46、SEQIDN0:48禾口SEQIDNO:50的β-葡糖苷酶分別由SEQIDNO39,SEQIDN0:41、SEQIDNO43,SEQIDNO45,SEQIDNO47禾口SEQIDNO49的成熟多肽編碼序列編碼。具有β-葡糖苷酶活性的米曲霉多肽可根據(jù)WO2002/095014獲取。具有β-葡糖苷酶活性的煙曲霉多肽可根據(jù)WO2005/047499獲取。具有β-葡糖苷酶活性的巴西青霉多肽可根據(jù)WO2007/019442獲取。具有β_葡糖苷酶活性的黑曲霉多肽可根據(jù)Dan等,2000,J.Biol.Chem.275:4973-4980獲取。具有β-葡糖苷酶活性的棘孢曲霉多肽可根據(jù)Kawaguchi等,1996,Gene173:287-288獲取。所述β-葡糖苷酶可以是融合蛋白。在一個(gè)方面,所述β-葡糖苷酶是SEQIDNO52的米曲霉β-葡糖苷酶變體BG融合蛋白或SEQIDNO:54的米曲霉β-葡糖苷酶融合蛋白。在另一個(gè)方面,所述米曲霉β-葡糖苷酶變體BG融合蛋白由SEQIDΝ0:51的多核苷酸編碼,或所述米曲霉β-葡糖苷酶融合蛋白由SEQIDΝ0:53的多核苷酸編碼。其它內(nèi)切葡聚糖酶、纖維二糖水解酶和β-葡糖苷酶使用根據(jù)HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino—acidsequencesimilarities,Biochem.J.280:309-316禾口HenrissatB.禾口BairochΑ.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695-696的分類公開(kāi)于許多糖基水解酶家族中。其它可用于本發(fā)明的纖維素分解酶描述于EP495,257、EP531,315、EP531,372、WO89/09259、WO94/07998、WO95/24471、WO96/11262、W096/29397、WO96/034108、WO97/14804、WO98/08940、WO98/012307、W098/13465、WO98/015619、WO98/015633、WO98/02841UWO99/06574、WO99/10481、WO99/025846、WO99/025847、WO99/031255、W02000/009707,WO2002/050245、WO2002/0076792、WO2002/101078、W02003/027306、WO2003/052054、WO2003/052055、WO2003/052056,W02003/052057,WO2003/052118、WO2004/016760、WO2004/043980、W02004/048592、WO2005/001065、WO2005/028636、WO2005/093050,W02005/093073,WO2006/074005,WO2006/117432、WO2007/071818、W02007/071820、WO2008/008070、WO2008/008793、美國(guó)專利No.4,435,307、美國(guó)專利No.5,457,046、美國(guó)專利No.5,648,洸3、美國(guó)專利No.5,686,593、美國(guó)專利No.5,691,178、美國(guó)專利No.5,763,254以及美國(guó)專利No.5,776,757。在本發(fā)明的方法中,可使用任何具有纖維素分解增強(qiáng)活性的多肽。在一個(gè)方面,所述具有纖維素分解增強(qiáng)活性的多肽包含下述基序[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]禾口[Fff]-[TF]-K-[AIV],其中X為任意氨基酸,X0,5)為在4或5個(gè)連續(xù)位置的任意氨基酸,而X(4)是在4個(gè)連續(xù)位置的任意氨基酸。具有上述所示的基序的多肽可進(jìn)一步包含H-X(l,2)-G-P-X(3)-[Yff]-[AILMV],[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]或H-X(l,2)-G-P-X(3)-[Yff]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],其中X為任意氨基酸,X(l,2)為在1個(gè)位置或2個(gè)連續(xù)位置的任意氨基酸,X(3)為3個(gè)連續(xù)位置的任意氨基酸,而XQ)為2個(gè)連續(xù)位置的任意氨基酸。在上述基序中,采用公認(rèn)的IUPAC單字母氨基酸縮寫(xiě)。在一個(gè)優(yōu)選的方面,所述具有纖維素分解增強(qiáng)活性的多肽進(jìn)一步包含H-X(l,2)-G-P-X(3)-[Yff]-[AILMV]。在另一個(gè)優(yōu)選的方面,具有纖維素分解增強(qiáng)活性的分離的多肽包含[Εζ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一個(gè)優(yōu)選的方面,具有纖維素分解增強(qiáng)活性的多肽進(jìn)一步包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[Εζ]-Χ-Υ-Χ⑵-C-X-[EHQN]-[FILV]-X-[ILV]。在第二個(gè)方面,所述具有纖維素分解增強(qiáng)活性的多肽包含下述基序[ILMV]-P-X(4,5)—G—x—Y—[ILMV]-χ-R—x-[EQ]-χ(3)~A~[HNQ],其中χ為任意氨基酸,χ(4,5)為在4或5個(gè)連續(xù)位置的任意氨基酸,而χ(3)為3個(gè)連續(xù)位置的任意氨基酸。在上述基序中,采用公認(rèn)的IUPAC單字母氨基酸縮寫(xiě)。具有纖維素分解增強(qiáng)活性的分離的多肽的實(shí)例包括具有纖維素分解增強(qiáng)活性的土生梭孢霉(SEQIDNO56,SEQIDNO:58,SEQIDNO:60,SEQIDNO:62,SEQIDNO64或SEQIDN0:66的成熟多肽);桔橙熱子囊菌(SEQIDNO:68的成熟多肽);或里氏木霉(SEQIDNO70的成熟多肽)。上述具有SEQIDNO:56、SEQIDNO:58、SEQIDNO:60、SEQIDNO62,SEQIDNO64、SEQIDNO66、SEQIDNO68禾口SEQIDNO:70的具有纖維素分解增強(qiáng)活性的多肽分別由SEQIDNO:55、SEQIDNO:57、SEQIDNO:59、SEQIDNO6USEQIDN0:63、SEQIDNO:65、SEQIDNO:67禾口SEQIDNO:69的成熟多肽編碼序列編碼。參見(jiàn),例如W02005/074647、W02005/074656和W02007/089^0。適用于本發(fā)明的商業(yè)性木聚糖降解酶制備物的實(shí)例包括,例如SHEARZYME(NovozymesA/S)、CELLICHtec(NovozymesA/S)、VISCOZYME(NovozymesA/S)、ULTRAFLO(NovozymesA/S)、PULPZYMEHC(NovozymesA/S)、MULTIFECTXylanase(Genencor)、ECOPULPTX-200A(ABEnzymes)、HSP6000Xylanase(DSM),DEP0L333P(BiocatalystsLimit,Wales,UK)、DEPOL740L.(BiocatalystsLimit,Wales,UK)和DEPOL762P(BiocatalystsLimit,Wales,UK)可用于本發(fā)明方法的木聚糖酶的實(shí)例包括但不限于棘孢曲霉(Aspergillusaculeatus)木聚糖酶(GeneSeqP:AAR63790;WO94/21785)、煙曲霉(Aspergillusfumigatus)木聚糖酶(W02006/078256)和土生梭孢霉(Thielaviaterrestris)NRRL8126木聚糖酶(W02009/079210)??捎糜诒景l(fā)明方法的β-木糖苷酶的實(shí)例包括但不限于里氏木霉(Trichodermareesei)β-木糖苷酶(UniProtKB/TrEMBL登錄號(hào)Q92458),埃默森踝節(jié)菌(Talaromycesemersonii)(SwissProt登錄號(hào)Q8X212)和粗糙脈孢菌(Neurosporacrassa)(SwissProt登錄號(hào)Q7S0W4)??捎糜诒景l(fā)明方法的乙酰木聚糖酯酶的實(shí)例包括但不限于紅褐肉座菌(Hypocreajecorina)乙酰木聚糖酯酶(W02005/001036)、粗糙脈孢菌乙酰木聚糖酯酶(UniProt登錄號(hào)q7s259)、土生梭孢霉NRRL8126乙酰木聚糖酯酶(W02009/042846)、球毛殼菌(Chaetomiumglobosum)乙酰木聚糖酯酶(Uniprot登錄號(hào)Q2GWX4)、細(xì)麗毛殼菌(Chaetomiumgracile)乙酰木聚糖酯酶(GenekqP登錄號(hào)AAB82124)、穎枯殼針孢(Phaeosphaerianodorum)乙酰木聚糖酯酶(Uniprot登錄號(hào)Q0UHJ1)和特異腐質(zhì)霉(Humicolainsolens)DSM1800乙酰木聚糖酯酶(W02009/073709)??捎糜诒景l(fā)明方法的阿魏酸酯酶的實(shí)例包括但不限于特異腐質(zhì)霉DSM1800阿魏酸酯酶(W02009/076122)、粗糙脈孢菌阿魏酸酯酶(UniProt登錄號(hào)Q9HGR3)和費(fèi)希新薩托菌(Neosartoryafischer)阿魏酸酯酶(UniProt登錄號(hào)A1D9T4)??捎糜诒景l(fā)明方法的阿拉伯呋喃糖苷酶的實(shí)例包括但不限于特異腐質(zhì)霉(Humicolainsolens)DSM1800阿拉伯呋喃糖苷酶(W02009/073383)和黑曲霉(Aspergillusniger)阿拉伯呋喃糖苷酶(GeneSeqP登錄號(hào)AAR94170)??捎糜诒景l(fā)明方法的α-葡糖醛酸糖苷酶的實(shí)例包括但不限于棒曲霉(Aspergillusclavatus)α-葡糖醛酸糖苷酶(UniProt登錄號(hào)alccl2)、里氏木霉(Trichodermareesei)α-葡糖醛酸糖苷酶(Uniprot登錄號(hào)Q99024)、埃默森踝節(jié)菌(Talaromycesemersonii)α-葡糖醛酸糖苷酶(UniProt登錄號(hào)Q8X211)、黑曲霉(Aspergillusniger)α-葡糖醛酸糖苷酶(Uniprot登錄號(hào)Q96WX9)、土曲霉(Aspergillusterreus)α-葡糖醛酸糖苷酶(SwissProt登錄號(hào)Q0CJP9)和煙曲霉(Aspergillusfumigatus)α-葡糖醛酸糖苷酶(SwissProt登錄號(hào)Q4WW45)。用于本發(fā)明方法的酶和蛋白可通過(guò)在含有合適碳源和氮源和無(wú)機(jī)鹽,使用本領(lǐng)域己知方法(參見(jiàn),例如Bennett,J.W.禾口LaSure,L.(編),MoreGeneManipulationsinFungi,AcademicPress,CA,1991)的營(yíng)養(yǎng)培養(yǎng)基上發(fā)酵上述指出的微生物菌株來(lái)產(chǎn)生。合適的培養(yǎng)基可從供應(yīng)商獲得,或可根據(jù)已公開(kāi)組合物制備(例如美國(guó)典型培養(yǎng)物保藏中心的目錄)。適于生長(zhǎng)和酶產(chǎn)生的溫度范圍和其他條件在本領(lǐng)域是已知的(參見(jiàn),例如Bailey,J.E.禾口Ollis,D.F.,BiochemicalEngineeringFundamentals,McGraw-Hi11BookCompany,NY,1986)。所述發(fā)酵可以是任何其結(jié)果為酶表達(dá)或分離的培養(yǎng)細(xì)胞的方法。因此,發(fā)酵可以理解為包括在合適的培養(yǎng)基中并在允許所述酶得以表達(dá)或分離的條件下進(jìn)行的搖瓶培養(yǎng),或在實(shí)驗(yàn)室或工業(yè)發(fā)酵罐中的小-或大規(guī)模發(fā)酵(包括連續(xù)、分批、補(bǔ)料分批或固態(tài)發(fā)酵)。通過(guò)上述方法產(chǎn)生的所得的酶可從發(fā)酵培養(yǎng)基回收并通過(guò)常規(guī)方法純化。發(fā)璧??赏ㄟ^(guò)一種或多種(幾種)能將糖直接或間接發(fā)酵成所需發(fā)酵產(chǎn)物的發(fā)酵微生物發(fā)酵自經(jīng)預(yù)處理和水解的纖維素材料獲得的可發(fā)酵糖?!鞍l(fā)酵”或“發(fā)酵方法”指任何發(fā)酵方法或包含發(fā)酵步驟的任何方法。發(fā)酵方法還包括用于消費(fèi)品醇工業(yè)(例如,啤酒和葡萄酒)、乳品業(yè)(例如,發(fā)酵乳產(chǎn)品)、皮革業(yè)和煙草業(yè)的發(fā)酵方法。發(fā)酵條件依賴于期望的發(fā)酵產(chǎn)物和發(fā)酵生物體,并且能由本領(lǐng)域的技術(shù)人員容易地確定。在發(fā)酵步驟中,作為預(yù)處理和酶水解步驟的結(jié)果從纖維素材料釋放的糖,通過(guò)發(fā)酵生物體(如酵母)發(fā)酵成為產(chǎn)物,例如,乙醇。如上所述,水解(糖化)和發(fā)酵可以是單獨(dú)或同時(shí)的。在本發(fā)明的發(fā)酵步驟中可以使用任何合適的經(jīng)水解的纖維素材料。通常根據(jù)所需發(fā)酵產(chǎn)品(即,要從發(fā)酵獲得的物質(zhì))和使用的方法來(lái)選擇所述材料,如本領(lǐng)域中所公知的。術(shù)語(yǔ)“發(fā)酵培養(yǎng)基”在本文中可理解為指加入發(fā)酵微生物之前的培養(yǎng)基,如,由糖化過(guò)程產(chǎn)生的培養(yǎng)基,以及同步的糖化和發(fā)酵方法(SSF)中使用的培養(yǎng)基?!鞍l(fā)酵微生物”指適用于理想的發(fā)酵方法產(chǎn)生發(fā)酵產(chǎn)物的任何微生物,包括細(xì)菌和真菌生物體。發(fā)酵生物體可以是(;和/或C5發(fā)酵生物體,或它們的組合。C6和C5發(fā)酵生物體均在本領(lǐng)域公知。合適的發(fā)酵微生物能將糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麥芽糖、甘露糖、半乳糖或寡糖)直接或間接地發(fā)酵(即,轉(zhuǎn)化)成所需的發(fā)酵產(chǎn)品??僧a(chǎn)生乙醇的細(xì)菌和真菌發(fā)酵生物體的實(shí)例如Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642所述。能發(fā)酵C6糖的發(fā)酵微生物的實(shí)例包括細(xì)菌和真菌生物體,如酵母。優(yōu)選的酵母包括酵母屬菌種,優(yōu)選釀酒酵母。能發(fā)酵C5糖的發(fā)酵生物體的實(shí)例包括細(xì)菌和真菌生物體,如酵母。優(yōu)選的C5發(fā)酵酵母包括畢赤酵母屬,優(yōu)選樹(shù)干畢赤酵母(Pichiastipitis)的菌株,如樹(shù)干畢赤酵母CBS5773;假絲酵母屬,優(yōu)選博伊丁假絲酵母(Candidaboidinii)、蕓薹假絲酵母(Candidabrassicae)、休哈塔假絲酵母(Candidasheatae)、迪丹斯假絲酵母(Candidadiddensii)、假熱帶假絲酵母(Candidapseudotropicalis)或產(chǎn)朊假絲酵母(Candidautilis)的菌株。其它發(fā)酵生物體包括發(fā)酵單胞菌屬(Zymomonas),如運(yùn)動(dòng)發(fā)酵單胞菌(Zymomonasmobilis);漢遜酵母屬,如異常漢遜酵母(Hansenulaanomala);克魯維酵母屬,如脆壁克魯維酵母;裂殖酵母屬,如粟酒裂殖酵母(S.pombe);和大腸桿菌的菌株,特別是已經(jīng)經(jīng)過(guò)遺傳修飾而改進(jìn)乙醇產(chǎn)量的大腸桿菌菌株。在一個(gè)優(yōu)選的方面,酵母是酵母屬菌種。在一個(gè)更優(yōu)選的方面,酵母是釀酒酵母。在另一個(gè)更優(yōu)選的方面,酵母是糖化酵母(Saccharomycesdistaticus)。在另一個(gè)更優(yōu)選的方面,酵母是葡萄汁酵母(Saccharomycesuvarum)。在另一個(gè)優(yōu)選的方面,酵母是克魯維酵母屬。在另一個(gè)更優(yōu)選的方面,酵母是馬克斯克魯維酵母(Kluyveromycesmarxianus)0在另一個(gè)更優(yōu)選的方面,酵母是脆壁克魯維酵母。在另一個(gè)優(yōu)選的方面,酵母是假絲酵母屬。在另一個(gè)更優(yōu)選的方面,酵母是博伊丁假絲酵母。在另一個(gè)更優(yōu)選的方面,酵母是蕓薹假絲酵母。在另一個(gè)更優(yōu)選的方面,酵母是迪丹斯假絲酵母。在另一個(gè)更優(yōu)選的方面,酵母是假熱帶假絲酵母。在另一個(gè)更優(yōu)選的方面,酵母是產(chǎn)朊假絲酵母。在另一個(gè)優(yōu)選的方面,酵母是棒孢酵母屬(Clavispora)。在另一個(gè)更優(yōu)選的方面,酵母是葡萄牙棒孢酵母(Clavisporalusitaniae)。在另一個(gè)更優(yōu)選的方面,酵母是仙人掌棒孢酵母(Clavisporaopuntiae)。在另一個(gè)優(yōu)選的方面,酵母是管囊酵母屬(Pachysolen)。在另一個(gè)更優(yōu)選的方面,酵母是嗜鞣管囊酵母(Pachysolentannophilus)0在另一個(gè)優(yōu)選的方面,酵母是畢赤酵母屬。在另一個(gè)更優(yōu)選的方面,酵母是樹(shù)干畢赤酵母。在另一個(gè)優(yōu)選的方面,酵母是酒香酵母屬(Bretarmomyces)。在另一個(gè)更優(yōu)選的方面,酵母是克勞森酒香酵母(Bretannomycesclausenii)(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,于HandbookonBioethanolProductionandUtilization,ffyman,C.E.編,Taylor&Francis,Washington,DC,179-212)。能有效地將己糖和戊糖發(fā)酵成乙醇的細(xì)菌包括,例如,運(yùn)動(dòng)發(fā)酵單胞菌和熱纖維梭菌(Clostridiumthermocellum)(Philippidis,1996,見(jiàn)上文)。在一個(gè)優(yōu)選的方面,細(xì)菌是發(fā)酵單胞菌屬。在更優(yōu)選的方面,細(xì)菌是運(yùn)動(dòng)發(fā)酵單胞菌。在另一個(gè)優(yōu)選的方面,細(xì)菌是梭菌屬。在另一個(gè)更優(yōu)選的方面,細(xì)菌是熱纖維梭菌。商業(yè)上可得到的適合乙醇產(chǎn)生的酵母包括,例如ETHANOLRED酵母(可從RedMar/Lesaffre,USA獲得)、FALI(可從Fleischmann,sYeast,BurnsPhilpFoodInc.,USA的部門(mén)獲得)、SUPERSTART和THERMOSACC新鮮酵母(可從KhanolTechnology,WI,USA獲得)、BIOFERMAFT和XR(可從NABC-NorthAmericanBioproductsCorporation,GA,USA獲得)、GERTSTRAND(可從GertStrandAB,Sweden獲得)和FERMI0L(可從DSMSpecialties獲得)。在一個(gè)優(yōu)選的方面,發(fā)酵微生物已經(jīng)經(jīng)過(guò)遺傳修飾,提供發(fā)酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。通過(guò)將異源基因克隆入多種發(fā)酵微生物已經(jīng)構(gòu)建了能將己糖和戊糖轉(zhuǎn)化成乙醇(共發(fā)酵)的生物體(Chen禾口Ho,1993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,App1.Biochem.Biotechnol.39-40135-147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,App1.Environ.Microbiol.64:1852-1859;Kotter禾口Ciriacy,1993,XylosefermentationbySaccharomycescerevisiae,App1.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentation:aproofofprinciple,F(xiàn)EMSYeastResearch4655-664;Beall1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58:204-214;Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240-243;Deanda等,1996,Developmentofanarabinose-fermentingZymomonasmobilistrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.62:4465-4470;WO2003/062430,xyloseisomerase)0在一個(gè)優(yōu)選的方面,經(jīng)過(guò)遺傳修飾的發(fā)酵微生物是釀酒酵母。在另一個(gè)優(yōu)選的方面,經(jīng)過(guò)遺傳修飾的發(fā)酵微生物是運(yùn)動(dòng)發(fā)酵單胞菌。在另一個(gè)優(yōu)選的方面,經(jīng)過(guò)遺傳修飾的發(fā)酵微生物是大腸桿菌。在另一個(gè)優(yōu)選的方面,經(jīng)過(guò)遺傳修飾的發(fā)酵微生物是產(chǎn)酸克雷伯氏菌(Klebsiellaoxytoca)0在另一個(gè)優(yōu)選的方面,所述經(jīng)遺傳修飾的發(fā)酵微生物是克魯維酵母菌種。本領(lǐng)域中公知的是,上述生物體還能用于產(chǎn)生其它物質(zhì),如本文所述。通常向降解的木素纖維素或水解物加入發(fā)酵微生物,并進(jìn)行約8至約96小時(shí),如約M至約60小時(shí)發(fā)酵。溫度通常為約至約60°C,特別是約32°C或50°C,并且在約pH3至約pH8,如約pH4-5,6或7。在一個(gè)優(yōu)選的方面,對(duì)降解的纖維素材料施用酵母和/或另一種微生物,并進(jìn)行約12至約96小時(shí),如通常為M-60小時(shí)發(fā)酵。在一個(gè)優(yōu)選的方面,溫度優(yōu)選為約20°C至約60°C,更優(yōu)選約25°C至約50°C,并且最優(yōu)選約32°C至約50°C,特別是約32°C或50°C,并且PH通常為約pH3至約pH7,優(yōu)選約pH4_7。然而,一些發(fā)酵生物體例如細(xì)菌,具有更高的最適發(fā)酵溫度。酵母或另一種微生物優(yōu)選以約IO5-IO12,優(yōu)選約IO7-IOiq,特別是約&IO8活細(xì)胞計(jì)數(shù)每ml發(fā)酵液的量施用。關(guān)于使用酵母進(jìn)行發(fā)酵的進(jìn)一步指導(dǎo)可以在例如“TheAlcoholTextbook,,(K.Jacques,Τ.P.Lyons禾口D.R.Kelsall編,NottinghamUniversityPress,UnitedKingdom1999)中找到,其通過(guò)提述并入本文。對(duì)于乙醇生產(chǎn),在發(fā)酵后蒸餾發(fā)酵的漿料以提取乙醇。根據(jù)本發(fā)明的方法獲得的乙醇可以用作,例如燃料乙醇;飲料乙醇,即,中性飲料酒,或工業(yè)乙醇。發(fā)酵刺激劑可以與本文所述的任何方法組合使用,以進(jìn)一步改進(jìn)發(fā)酵工藝,而且特定地,改進(jìn)發(fā)酵微生物的性能,如,速率增加和乙醇得率?!鞍l(fā)酵刺激劑”指用于發(fā)酵微生物(特別是酵母)生長(zhǎng)的刺激劑。優(yōu)選的用于生長(zhǎng)的發(fā)酵刺激劑包括維生素和礦物質(zhì)。維生素的實(shí)例包括多種維生素、生物素、泛酸(鹽)、煙酸、內(nèi)消旋肌醇(meso-inositol)、硫胺素、吡哆醇(pyridoxine)、對(duì)氨基苯甲酸、葉酸、核黃素和維生素A、B、C、D禾口E。參見(jiàn),例如,Alfenore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag(2002),其通過(guò)提述并入本文。礦物質(zhì)的實(shí)例包括能夠提供營(yíng)養(yǎng)物的礦物質(zhì)和礦物質(zhì)鹽,所述營(yíng)養(yǎng)物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。發(fā)酵產(chǎn)物發(fā)酵產(chǎn)物可以是源自發(fā)酵的任何物質(zhì)。發(fā)酵產(chǎn)物可以是,不限于,醇(例如,阿拉伯醇、丁醇、乙醇、甘油、甲醇、1,3_丙二醇、山梨醇和木糖醇);有機(jī)酸(例如,乙酸、醋酮酸、己二酸、抗壞血酸、檸檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羥基丙酸、衣康酸、乳酸、蘋(píng)果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、賴氨酸、絲氨酸和蘇氨酸);和氣體(例如,甲烷、氫氣(H2)、二氧化碳(CO2)和一氧化碳(C0))。發(fā)酵產(chǎn)物還可以是作為高價(jià)值產(chǎn)品的蛋白質(zhì)。在一個(gè)優(yōu)選的方面,發(fā)酵產(chǎn)物是醇??衫斫獾氖牵g(shù)語(yǔ)“醇”包括包含一個(gè)或多個(gè)羥基基團(tuán)的物質(zhì)。在更優(yōu)選的方面,所述醇是阿拉伯醇。在另一個(gè)更優(yōu)選的方面,所述醇是丁醇。在另一個(gè)更優(yōu)選的方面,所述醇是乙醇。在另一個(gè)更優(yōu)選的方面,所述醇是甘油。在另一個(gè)更優(yōu)選的方面,所述醇是甲醇。在另一個(gè)更優(yōu)選的方面,所述醇是1,3_丙二醇。在另一個(gè)更優(yōu)選的方面,所述醇是山梨醇。在另一個(gè)更優(yōu)選的方面,所述醇是木糖醇。參見(jiàn),例如,Gong,C.S.,Cao,N.J.,Du,J.,禾口Tsao,G.Τ.,1999,Ethanolproductionfromrenewableresources,于AdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.編,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Silveira,Μ.Μ.,禾口Jonas,R.,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,禾口Singh,D.,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2):117-124;Ezeji,T.C.,Qureshi,N.禾口Blaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBAlOlandinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnology19(6):595_603o在另一個(gè)優(yōu)選的方面,所述物質(zhì)是有機(jī)酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是乙酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是醋酮酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是己二酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是抗壞血酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是檸檬酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是2,5-二酮-D-葡糖酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是甲酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是反丁烯二酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是葡糖二酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是葡糖酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是葡糖醛酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是戊二酸。在另一個(gè)優(yōu)選的方面,所述有機(jī)酸是3-羥基丙酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是衣康酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是乳酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是蘋(píng)果酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是丙二酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是草酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是丙酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是琥珀酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是木糖酸。參見(jiàn),例如,Chen,R.,禾口Lee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63-65:435_4480在另一個(gè)優(yōu)選的方面,所述物質(zhì)是酮??衫斫獾氖切g(shù)語(yǔ)“酮”涵蓋含有一個(gè)或多個(gè)酮基的物質(zhì)。在另一個(gè)更優(yōu)選的方面,所述酮是丙酮。參見(jiàn),例如,Qureshi和Blaschek,2003,見(jiàn)上文。在另一個(gè)優(yōu)選的方面,所述物質(zhì)是氨基酸。在另一個(gè)更優(yōu)選的方面,所述有機(jī)酸是天冬氨酸。在另一個(gè)更優(yōu)選的方面,所述氨基酸是谷氨酸。在另一個(gè)更優(yōu)選的方面,所述氨基酸是甘氨酸。在另一個(gè)更優(yōu)選的方面,所述氨基酸是賴氨酸。在另一個(gè)更優(yōu)選的方面,所述氨基酸是絲氨酸。在另一個(gè)更優(yōu)選的方面,所述氨基酸是蘇氨酸。參見(jiàn),例如,Richard,A.,禾口Margaritis,A.,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4):501_515o在另一個(gè)優(yōu)選的方面,所述物質(zhì)是氣體。在另一個(gè)更優(yōu)選的方面,所述氣體是甲烷。在另一個(gè)更優(yōu)選的方面,所述氣體是H2。在另一個(gè)更優(yōu)選的方面,所述氣體是C02。在另一個(gè)更優(yōu)選的方面,所述氣體是CO。參見(jiàn),例如,Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7)41-47;禾口GunaseelanV.N.于BiomassandBioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobicdigestionofbiomassformethaneproduction:Areview?!隹梢允褂帽绢I(lǐng)域已知的任何方法,任選地從發(fā)酵培養(yǎng)基回收發(fā)酵產(chǎn)物,所述方法包括,但不限于,層析、電泳方法、差示溶解度、蒸餾或提取。例如,通過(guò)常規(guī)蒸餾方法從發(fā)酵的纖維素材料分離并純化醇??梢垣@得純度高達(dá)約96ν01%的乙醇,其能用作,例如,燃料乙醇、飲用乙醇,即,中性飲料酒,或工業(yè)乙醇。信號(hào)月太本發(fā)明還涉及編碼信號(hào)肽的分離的多核苷酸,所述信號(hào)肽包含SEQIDNO2的氨基酸1至19,或由SEQIDNO2的氨基酸1至19組成。本發(fā)明還涉及包含編碼蛋白的基因的核酸構(gòu)建體,其中所述基因可操作地連接于編碼信號(hào)肽的分離的多核苷酸和編碼前多肽的分離的多核苷酸之一或二者,其中所述基因?qū)幋a所述信號(hào)肽和前肽的多核苷酸是外源的。在一個(gè)優(yōu)選的方面,所述編碼信號(hào)肽的分離的多核苷酸包含SEQIDNO1的核苷酸1至57,或者由SEQIDNO1的核苷酸1至57組成。本發(fā)明還涉及包含這種核酸構(gòu)建體的重組表達(dá)載體和重組宿主細(xì)胞。本發(fā)明還涉及用于產(chǎn)生蛋白質(zhì)的方法,包括(a)在有助于產(chǎn)生所述蛋白質(zhì)的條件下培養(yǎng)這樣的重組宿主細(xì)胞,所述宿主細(xì)胞包含編碼蛋白的基因,所述基因可操作地連接于此種編碼信號(hào)肽的多核苷酸,其中所述基因?qū)幋a所述信號(hào)肽的多核苷酸是外源的;和(b)回收所述蛋白質(zhì)。所述蛋白質(zhì)對(duì)于宿主細(xì)胞可以是天然的或異源的。術(shù)語(yǔ)“蛋白質(zhì)”在本文的意思不是指特定長(zhǎng)度的編碼產(chǎn)物,并且因此包含肽、寡肽和蛋白質(zhì)。術(shù)語(yǔ)“蛋白質(zhì)”還包含組合以形成編碼產(chǎn)物的兩種以上多肽。所述蛋白質(zhì)還包括雜合多肽,其包含部分或全部多肽序列的組合,所述多肽序列從至少兩種不同的蛋白質(zhì)獲得,其中一個(gè)或多個(gè)(幾個(gè))對(duì)于宿主細(xì)胞可以是異源或天然的。蛋白質(zhì)進(jìn)一步包括上述蛋白質(zhì)和雜合蛋白質(zhì)的天然存在的等位基因變異和工程改造的變異。優(yōu)選蛋白質(zhì)是激素或其變體、酶、受體或其部分、抗體或其部分,或報(bào)告蛋白(reporter)。在一個(gè)更優(yōu)選的方面,所述蛋白質(zhì)是氧化還原酶、轉(zhuǎn)移酶、水解酶、裂合酶(lyase)、異構(gòu)酶或連接酶。在一個(gè)更加優(yōu)選的方面,所述蛋白質(zhì)是氨肽酶、淀粉酶、糖酶、羧肽酶、過(guò)氧化氫酶、纖維素酶、幾丁質(zhì)酶、角質(zhì)酶、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、轉(zhuǎn)化酶、漆酶、另外的脂肪酶、甘露糖苷酶、變聚糖酶(mutanase)、氧化酶、果膠分解酶、過(guò)氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶?;蚩梢詮娜魏卧?、真核或其它來(lái)源獲得。通過(guò)以下實(shí)施例進(jìn)一步對(duì)本發(fā)明進(jìn)行描述,但不應(yīng)將其理解為對(duì)本發(fā)明范圍的限制。50實(shí)施例作為緩沖液和底物使用的化學(xué)品是至少試劑等級(jí)的商業(yè)產(chǎn)品。材料作為緩沖液和底物使用的化學(xué)品是至少試劑等級(jí)的商業(yè)產(chǎn)品。菌株將Trichophaeasaccata菌株CBS804.70用作編碼家族GH3A0-葡糖苷酶的基因的來(lái)源。將米曲霉Jal250菌株(W099/61651)用于表達(dá)TrichophaeasaccataCBS804.70β-葡糖苷酶。培養(yǎng)基MEX-I培養(yǎng)基由20g大豆粉、15g的麥麩(wheatbran)、IOg的微晶纖維素(AVICEL;FMC,Philadelphia,PA,USA),5g的麥芽糊精,3g的細(xì)菌蛋白胨,0.2g的Pluronic,Ig的橄欖油和去離子水加至1升組成。PDA平板由39克的馬鈴薯右旋糖瓊脂和去離子水加至1升組成。LB培養(yǎng)基由IOg的胰蛋白胨、5g的酵母提取物、5g的氯化鈉和去離子水加至1升組成。LB平板由LB培養(yǎng)基和每升15g的細(xì)菌瓊脂組成。SOC培養(yǎng)基由2%胰蛋白胨、0.5%酵母提取物、IOmMNaCl,2.5mMKClUOmMMgCl2和IOmMMgSO4和去離子水加至1升組成;通過(guò)高壓滅菌來(lái)除菌,然后添加經(jīng)過(guò)濾滅菌的葡萄糖至20mM。MDU2BP培養(yǎng)基由45g的麥芽糖、Ig的MgSO4WH2OUg的NaCl、2g的K2HS04、12g的KH2PO4,2g的尿素、500μ1的AMG微量金屬溶液、和去離子水加至1升組成。將ρΗ調(diào)整至5.0,然后使用0.22μm過(guò)濾單元進(jìn)行過(guò)濾滅菌。AMG微量金屬溶液由14.3g的ZnSO4·7H20、2.5g的CuSO4·5H20、0.5g的NiCl2·6Η20、13·8g的FeSO4·7Η20、8·5g的MnSO4·7H20、3g的檸檬酸和去離子水加至1升組成。2XYT平板由每升的16g的胰蛋白胨、IOg的酵母提取物、5g的NaCl、15g的細(xì)菌瓊脂和去離子水加至1升組成。YPG培養(yǎng)基由4g的酵母提取物、Ig的K2HP04、0.5g的MgS04、15.Og的葡萄糖和去離子水加至1升(ρΗ6.0)組成。YPM培養(yǎng)基由IOg的酵母提取物、20g的細(xì)菌蛋白胨、20g的麥芽糖和去離子水加至1升組成。M410培養(yǎng)基由50g的葡萄糖、50g的麥芽糖、2g的MgSO4·7H20、2g的KH2P04、4g的檸檬酸、8g的酵母提取物、2g的尿素、0.5g的CaCl2、0.5ml的AMG微量金屬溶液和去離子水加至1升(ρΗ6.0)組成。實(shí)施例1制備Trichophaeasaccata菌株CBS804.70菌絲體用于cDNA文庫(kù)產(chǎn)生將Trichophaeasaccata菌株CBS804.70接種至PDA平板上,并在溫育7日。將幾個(gè)菌絲體-PDA瓊脂栓接種入含有100mlMEX-I培養(yǎng)基的750ml搖瓶。將燒瓶在37°C以150rpm攪拌溫育9日。通過(guò)經(jīng)由MIRACLOTH(Calbiochem,SanDiego,CA,USA)過(guò)濾來(lái)收獲真菌菌絲體,然后將其凍結(jié)于液氮中。然后通過(guò)將凍結(jié)的菌絲體與相同體積的干冰在經(jīng)液氮預(yù)冷卻的咖啡磨(coffeegrinder)中一同研磨來(lái)將菌絲體粉碎為粉末。將粉碎的菌絲體物質(zhì)維持在-80°C直至使用。實(shí)施例2=Trichophaeasaccata菌株CBS804.70RNA分離根據(jù)Chirgwin等,1979,Biochemistry18=5294-5299從凍結(jié)的、粉末狀Trichophaeasaccata菌絲體通過(guò)用硫氰酸胍提取然后通過(guò)5.7MCsCl墊(cushion)超離心來(lái)制備總RNA。根據(jù)Aviv等,1972,Proc.Natl.Acad.Sci.USA69:1408-1412通過(guò)寡聚(dT)-纖維素親和層析來(lái)分離富含polyA的RNA。實(shí)施例3=Trichophaeasaccata菌株CBS804.70cDNA文庫(kù)的構(gòu)建雙鏈cDNA是根據(jù)Gubler和Hoffman,1983,Gene25:263-269;Sambrook,J.,F(xiàn)ritsch,Ε.F.禾口Maniantis,Τ·MolecularCloning:ALaboratoryManual,第2版,1989,ColdSpringHarborLaboratory,ColdSpringHarbor,NewYork;以及Kofod等,1994,J.Biol.Chem.洸9:29182-29189的一般方法,使用多聚A-NotI引物(PromegaCorp.,Madison,Wisconsin,USA)合成的。在合成之后,cDNA用綠豆核酸酶處理,用T4DNA聚合酶平端化,并連接于50倍摩爾過(guò)量的EcoRI銜接頭(InvitrogenCorp.,Carlsbad,CA,USA)將cDNA用NotI切害ij,并將cDNA通過(guò)0.8%瓊脂糖凝膠電泳使用44mMTris堿、44mM硼酸和0.5mMEDTA(TBE)緩沖液進(jìn)行大小分級(jí)。將700bp和更大的cDNA級(jí)分從凝膠切出,并使用GFXPCRDNA和GelBandPurificationKit(GEHealthcareLifeSciences,UnitedKingdom)依照生產(chǎn)商的指示進(jìn)行純化。然后對(duì)制備的cDNA進(jìn)行定向克隆,即使用RapidLigationKit(RocheDiagnosticsGmbH,Penzberg,Germany)依照生產(chǎn)商的指示將其連接入經(jīng)EcoRI-NotI切割的pMHas5(WO03/044049)。將連接混合物使用GENEPULSER和PulseController(Bio-RadLaboratories,Inc.,Hercules,CA,USA)以50μF,25mAmp,1.8kV禾口2mm間隙(gap)小杯依照生產(chǎn)商的指示電穿孔入大腸桿菌DHlOB細(xì)胞(InvitrogenCorp.,Carlsbad,CA,USA)。將經(jīng)電穿孔的細(xì)胞鋪板于補(bǔ)充每ml50yg卡那霉素的LB平板。從起始cDNA-pMHas5載體連接液的總共大約30000個(gè)轉(zhuǎn)化體制備cDNA質(zhì)粒匯集庫(kù)(pool)。直接從菌落的匯集庫(kù)使用QIAPREPSpinMidi/Maxipr印Kit(QIAGENGmbHCorporation,Hilden,Germany)制備質(zhì)粒DNA。cDNA文庫(kù)命名為SBL521-2。實(shí)施例4構(gòu)建含有β-內(nèi)酰胺酶報(bào)道基因的SigA4轉(zhuǎn)座子從含有WO01/77315中描述的質(zhì)粒的pSigA2轉(zhuǎn)座子構(gòu)建含有命名為pSigA4的質(zhì)粒的轉(zhuǎn)座子,以創(chuàng)建具有減少的選擇背景的信號(hào)俘獲轉(zhuǎn)座子(signaltrappingtransposon)pSigA2的改善形式。所述pSigA2轉(zhuǎn)座子含有在該轉(zhuǎn)座子自身上編碼的無(wú)信號(hào)的β-內(nèi)酰胺酶構(gòu)建體。使用校正讀碼的PROOFSTARTDNA聚合酶OiIAGENGmbHCorporation,Hilden,Germany)和下述5,磷酸化的引物(TAGCopenhagen,Denmark)采用PCR以產(chǎn)生存在于質(zhì)粒骨架上的完整β-內(nèi)酰胺酶基因的缺失SigA2NotU-P5,-TCGCGATCCGTTTTCGCATTTATCGTGAAACGCT-3,(SEQIDNO71)SigA2NotD-P5,-CCGCAAACGCTGGTGAAAGTAAAAGATGCTGAA-3,(SEQIDNO72)所述擴(kuò)增反應(yīng)物由Ιμ的pSigA2(10ng/y1)、5μ1的IOXPR00FSTARTBuffer(QIAGENGmbHCorporation,Hilden,Germany)、2·5μ1的dNTP混合物(20mM)、0·5μ1的SigA2NotU_P(IOmM)、0·5μ1的SigA2NotD_P(IOmM)、10μ1的Q溶液(QIAGENGmbHCorporation,Hilden,Germany)和31.25μ1的去離子水。使用DNAENGINEThermalCycler(MJResearchInc.,ffaltham,MA,USA)進(jìn)行擴(kuò)增,其程序?yàn)?循環(huán),在95°C進(jìn)行5分鐘;和20個(gè)循環(huán),每循環(huán)在94°C進(jìn)行30秒,62°C進(jìn)行30秒和72°C進(jìn)行4分鐘。通過(guò)0.8%瓊脂糖凝膠電泳使用40mMTris堿_20mM乙酸鈉-ImMEDTA二鈉(TAE)緩沖液和每升0.1μg的溴乙錠分離3.9kbPCR反應(yīng)產(chǎn)物。DNA條帶用fegleEyeImagingSystem(Stratagene,LaJolla,CA,USA)協(xié)助在360nm顯現(xiàn)。將3.9kbDNA條帶從凝膠切出,并使用GFXPCRDNA和GelBandPurificationKit依照生產(chǎn)商的指示進(jìn)行純化。將該3.9kb片段在16°C用10單位T4DNA連接酶(NewEnglandBiolabs,Inc.,Beverly,MA,USA)、9μ1的該3.9kbPCR片段禾口1μ1的10Χ連接緩沖液(NewEnglandBiolabs,Inc.,Beverly,MA,USA)自連接過(guò)夜。將連接物在65°C熱失活10分鐘,然后用DpnI在37°C消化2小時(shí)。在溫育之后,使用GFXPCRDNA和GelBandPurificationKit純化消化液。然后將純化的物質(zhì)依照生產(chǎn)商的指示轉(zhuǎn)化入大腸桿菌T0P10感受態(tài)細(xì)胞(InvitrogenCorp.,Carlsbad,CA,USA)將轉(zhuǎn)化混合物鋪板于補(bǔ)充每ml25μg的氯霉素的LB平板之上。從幾個(gè)轉(zhuǎn)化體制備質(zhì)粒小量制備物,并用BglII消化。選擇一個(gè)具有正確構(gòu)建的質(zhì)粒并命名為pSigA4。質(zhì)粒pSigA4含有與WO01/77315中公開(kāi)的相同的側(cè)翼為BglII的轉(zhuǎn)座子SigA2(SEQIDNO:71)。將質(zhì)粒pSigA4DNA(0.3μg/μ1)的60μ1樣品用BglII消化,并使用TAE緩沖液通過(guò)0.8%瓊脂糖凝膠電泳進(jìn)行分離。將21Λ的SigA2轉(zhuǎn)座子DNA條帶用200μ1的EB緩沖液QIAGENGmbHCorporation,Hilden,Germany)洗脫,并使用GFXPCRDNA和GelBandPurificationKit依照生產(chǎn)商的指示進(jìn)行純化,并在200μ1的EB緩沖液中洗脫。將SigA2用于轉(zhuǎn)座子協(xié)助的信號(hào)俘獲。實(shí)施例5=TrichophaeasaccataCBS804.70的轉(zhuǎn)座子協(xié)助的信號(hào)俘獲對(duì)于轉(zhuǎn)座子協(xié)助的信號(hào)俘獲的完整描述可見(jiàn)于WO2001/77315。從起始cDNA-pMHas5載體連接液的總共30000個(gè)轉(zhuǎn)化體制備cDNA質(zhì)粒匯集庫(kù)。質(zhì)粒DNA是從由固體LB選擇性培養(yǎng)基回收的菌落匯集物使用QIAPREPSpinMidi/MaxiprepKit直接制備的。用轉(zhuǎn)座子SigA2和MuA轉(zhuǎn)座酶(Finnzymes0Y,Espoo,Finland)依照生產(chǎn)商的指示處理所述質(zhì)粒匯集庫(kù)。對(duì)于TrichophaeasaccataCBS804.70cDNA文庫(kù)的體外轉(zhuǎn)座子標(biāo)記,將含有大約2.6μg的DNA的4或8μ1SigA2轉(zhuǎn)座子與含有2μg的DNA,2μ1的MuA轉(zhuǎn)座酶(0.22μg/μ1)禾口5μ1的5X緩沖液(Finnzymes0Y,Espoo,Finland)的TrichophaeasaccataCBS804.70cDNA文庫(kù)的1μ1質(zhì)粒DNA匯集庫(kù)在總體積50μ1中混合,并在30°C溫育3.5小時(shí),然后在75°C熱失活10分鐘。將DNA通過(guò)添加5μ1的3M乙酸鈉ρΗ5和110μ1的96%乙醇沉淀,并以IOOOOxg離心30分鐘。將沉淀在70%乙醇中洗滌,并在室溫干燥,并重懸于10μ1的IOmMTris,ρΗ8,ImMEDTA(TE)緩沖液。將1.5μ1體積的轉(zhuǎn)座子標(biāo)記質(zhì)粒匯集庫(kù)依照生產(chǎn)商的指示使用GENEPULSER禾口PulseController(Bio-RadLaboratories,Inc.,Hercules,CA,USA)以50μF,25mAmp,1.8kV用2mm間隔小杯電穿孔入20μ1的大腸桿菌DH10B超感受態(tài)(ultracompetent)細(xì)胞(Gibco-BRL,GaithersburgMD,USA)。將經(jīng)電穿孔的細(xì)胞在在SOC培養(yǎng)基中以250rpm攪拌溫育2小時(shí),然后鋪板于下述選擇培養(yǎng)基補(bǔ)充了50μg每ml卡那霉素的LB培養(yǎng)基;補(bǔ)充了50μg每ml卡那霉素和15μg每ml氯霉素的LB培養(yǎng)基;和/或補(bǔ)充了50μg每ml卡那霉素、15μg每ml氯霉素和12.5μg每ml氨芐青霉素的LB培養(yǎng)基。從將電穿孔液稀釋鋪板于補(bǔ)充了卡那霉素和氯霉素培養(yǎng)基的LB培養(yǎng)基,確定了每個(gè)電穿孔液存在大約72000個(gè)含有具SigA2轉(zhuǎn)座子的cDNA質(zhì)粒文庫(kù)的菌落,并在三重選擇(LB,卡那霉素,氯霉素,氨芐青霉素)下回收了大約69個(gè)菌落。進(jìn)行進(jìn)一步的電穿孔和鋪板實(shí)驗(yàn)直至從該三重選擇下回收了總共445個(gè)菌落。使用QIAPREP96TurboMiniprepKit(QIAGENGmbHCorporation,Hilden,Germany)小量制備所述菌落。用下述所示的轉(zhuǎn)座子正向和反向引物(引物A和B)依照WO2001/77315(頁(yè))公開(kāi)的步驟對(duì)質(zhì)粒進(jìn)行測(cè)序。引物A:5,-AGCGTTTGCGGCCGCGATCC-3,(SEQIDNO73)引物B:5,-TTATTCGGTCGAAAAGGATCC-3,(SEQIDNO74)實(shí)施例6序列匯編(assembly)和注釋(annotataion)獲取DNA序列以供使用ABIPRISMAutomatedDNASequencerModel3700(AppliedBiosystems,FosterCity,CA,USA)的反應(yīng)。修整對(duì)于每個(gè)質(zhì)粒讀取的(readsforeachplasmid)引物A和引物B序列以去除載體和轉(zhuǎn)座子序列。這產(chǎn)生了225個(gè)經(jīng)匯編的序列,通過(guò)使用程序PhredPhrap(Ewing等,1998,GenomeResearch8:175-185;Ewing和Green,1998,GenomeResearch8:186-194)將其分組為148個(gè)重疊群(contig)。隨后將所有148個(gè)重疊群與在標(biāo)準(zhǔn)的公共DNA和蛋白序列數(shù)據(jù)庫(kù)(TrEMBL,SffALL,PDB,EnsemblP印,GeneSeqP)可獲得的序列通過(guò)使用程序BLASTX2.0al9MP-ffashU[14-Jul-1998][Buildlinux_x8618:51:4430-Jul_1998](Gish等,1993,Nat.Genet.3:266-72)進(jìn)行比較。通過(guò)分析BlastX結(jié)果直接鑒定了家族GH3Aβ-葡糖苷酶。從隨機(jī)位于沿編碼區(qū)的15個(gè)獨(dú)立轉(zhuǎn)座事件的匯編提取所述DNA重疊群的開(kāi)讀框。Trichophaeasaccataβ-葡糖苷酶的核苷酸序列(SEQIDNO1)和推定的氨基酸序列(SEQIDNO2)示于圖IA和1Β。所述cDNA片段編碼856個(gè)氨基酸的多肽。所述基因的%G+C含量為58.1%ο使用SignalP軟件程序(Nielsen等,1997,ProteinEngineering101-6),預(yù)測(cè)了19個(gè)殘基的單個(gè)肽。該預(yù)測(cè)的成熟蛋白包含具有90.35kDa的分子量的837個(gè)氨基酸。β-葡糖苷酶家族3序列的比較性比對(duì)是使用如EMBOSS的Needle程序中執(zhí)行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)以缺口開(kāi)放罰分為10,缺口延伸罰分為0.5和EBL0SUM62矩陣來(lái)確定的。該比對(duì)顯示Trichophaea54saccataCel3A成熟多肽的推定的氨基酸序列與來(lái)自核盤(pán)菌(Sclerotiniasclerotiorum)的假設(shè)預(yù)測(cè)的蛋白的推定氨基酸序列⑴niprotaccessionnumberA7EI88)共享59.3%的同一性(排除缺口)。實(shí)施例7將Trichophaeasaccata家族GH3A基因克隆入米曲霉表達(dá)載體設(shè)計(jì)了如下所示的兩個(gè)合成寡核苷酸引物以從cDNAPCR擴(kuò)增Trichophaeasaccatagh3a基因。使用IN-FUSIONPCRCloningKit(ClontechLaboratories,Inc.,MountainView,CA,USA)將片段直接克隆入表達(dá)載體pAILo2(WO2005/074647)。正向引物5,-ACTGGATTTACCATGTTTGGCATCACCTCGACTGCG-3,(SEQIDNO:75)反向引物5,-TCACCTCTAGTTAATTATCMTMTGATCACTCGG-3,(SEQIDNO:76)粗體字母代表編碼序列。剩余序列與PAlLo2的插入位點(diǎn)同源。將五十皮摩爾的每種上述引物用于含有1μK239μg)的SBL521_2cDNA文庫(kù),含MgCl2WIXEXPANDHighFidelity緩沖液(RocheDiagnosticsCorp.,Indianapolis,IN,USA),1μ1的IOmMdATP、dTTP、dGTP和dCTP的混合物和2.6單位的EXPANDHighFidelity酶混合物(Roche,Indianapolis,IN,USA),最終體積為50μ1的PCR反應(yīng)。使用EPPENDORFMASTERCYCLER印gradientS(EppendorfScientific,Inc.,Westbury,NY,USA)擴(kuò)增片段,程序?yàn)橐粋€(gè)循環(huán)94°C進(jìn)行2分鐘,10個(gè)循環(huán),每個(gè)循環(huán)在94°C進(jìn)行15秒,58°C進(jìn)行30秒和72°C進(jìn)行2分鐘;20個(gè)循環(huán),每個(gè)在94°C進(jìn)行15秒,58°C進(jìn)行30秒和72°C進(jìn)行120秒(每個(gè)后續(xù)循環(huán)加5秒)。然后將加熱塊維持在72°C進(jìn)行7分鐘,然后進(jìn)行4°C浸泡循環(huán)。將反應(yīng)產(chǎn)物通過(guò)使用TAE緩沖液的1.0%瓊脂糖凝膠電泳分離,并將大約2.51Λ產(chǎn)物條帶從凝膠切出,并使用MINELUTEGelExtractionKit(QIAGENInc.,Valencia,CA,USA)依照生產(chǎn)商的指示進(jìn)行純化。然后將純化的PCR片段使用IN-FUSIONPCRCloningKit克隆入pAlLo2。用NcoI和heI消化載體。將經(jīng)消化的片段通過(guò)如上所述的凝膠電泳純化,從凝膠切出,并使用QIAQUICKGelExtractionKit(QIAGENHie.,Valencia,CA,USA)純化。將基因片段和經(jīng)消化的載體在反應(yīng)中合并,得到表達(dá)質(zhì)粒PAG39,其中g(shù)h3a基因的轉(zhuǎn)錄是處于NA2-tpi啟動(dòng)子(來(lái)自黑曲霉中性α-淀粉酶和構(gòu)巢曲霉丙糖磷酸異構(gòu)酶的基因的啟動(dòng)子的雜合體)的控制下。重組反應(yīng)物(20μ1)是由IXIN-FUSI0NBuffer(Clontech,MountainView,CA,USA),IXBSA(Clontech,MountainView,CA,USA),1μ1的IN-FUSION酶(1:10稀釋)(Clontech,MountainView,CA,USA),249ng的經(jīng)NcoI和PacI消化的pAlLo2和82.5ng的純化的iTrichophaeasaccatagh3aPCR產(chǎn)物組成的。將所述反應(yīng)物在37°C溫育15分鐘,然后在50°C溫育15分鐘。將反應(yīng)物用40μ1的TE緩沖液稀釋,并將2.5μ1的經(jīng)稀釋的反應(yīng)物用于轉(zhuǎn)化大腸桿菌TOP10感受態(tài)細(xì)胞(Invitrogen,Carlsbad,CA,USA)。使用BIOROBOT9600(QIAGENInc.,Valencia,CA,USA)制備質(zhì)粒DNA,并用BamHI消化推定的pAG39克隆。然后對(duì)來(lái)自這些克隆的質(zhì)粒DNA進(jìn)行測(cè)序以鑒定不含PCR誘導(dǎo)的錯(cuò)誤的克隆。測(cè)序反應(yīng)物含有ι.5μ1的質(zhì)粒DNA,4.5μ1的水和4μ1的測(cè)序主混合物(sequencingmaster-mix),所述主混合物含有1μ1的5Χ測(cè)序緩沖液(Millipore,Billerica,MA,USA),1μ1的BIGDYE終止物(terminator)(AppliedBiosystems,Inc.,F(xiàn)osterCity,CA,USA),1μ1的水和每反應(yīng)3.2皮摩爾的下述引物之一。引物pAlLo25,5,-TGTCCCTTGTCGATGCG-3,(SEQIDNO77)引物pAlLo23,5,-CACATGACTTGGCTTCC-3,(SEQIDNO78)引物jTsSAFI:5,-GTCTACCTCTGGCCATTCCA-3,(SEQIDNO79)引物I1S3AF2:5,-TACCGCAATCCTCCAGAACA-3,(SEQIDNO80)弓I物Tsacgh3a1675_17000Rev5,-ACGCTTGTCGGCCCATTTCTCCATGA-3,(SEQIDNO:81)弓丨物Tsacgh3a925_950Rev:5,-TGGGCCCAGCAAGGGCACACGATCAT-3,(SEQIDNO:82)實(shí)施例8:在米曲霉JaL355中表達(dá)編碼具有β-葡糖苷酶活性的GH3A多肽的TrichophaeasaccatacDNA米曲霉JaL355原生質(zhì)體是根據(jù)Christensen等,1988,Bio/Technology61419-1422的方法制備的。將五μg的pAG39用于轉(zhuǎn)化米曲霉JaL355。將二十四個(gè)轉(zhuǎn)化體分離至單個(gè)PDA平板。將M個(gè)轉(zhuǎn)化體的匯合的PDA平板用5ml的0.01%TWEEN20洗滌,并收集孢子。將八μ1的每個(gè)孢子儲(chǔ)備分別添加至M孔板中Iml的YPG、YPM和Μ410培養(yǎng)基,并在;34°C溫育。在溫育三日之后,使用CRITERION無(wú)染色,8-16%梯度SDS-PAGE凝膠(BioRadLaboratories,Inc.,Hercules,CA,USA)依照生產(chǎn)商的指示分析7·5μ1來(lái)自培養(yǎng)的上清。培養(yǎng)的SDS-PAGE分布顯示幾個(gè)轉(zhuǎn)化體具有大約IOOkDa的新的主要條帶,并在Μ410培養(yǎng)基中具有最佳表達(dá)。在總共五日的溫育之后,對(duì)所有Μ410培養(yǎng)進(jìn)行取樣,并如上所述通過(guò)SDS-PAGE進(jìn)行分析,此時(shí)選擇顯示最佳表達(dá)的轉(zhuǎn)化體。用5ml的0.01%TWEEN20洗滌最佳轉(zhuǎn)化體的匯集PDA平板,并接種入五個(gè)含有100mlM410培養(yǎng)基的500ml搖瓶以生成用于表征該酶的培養(yǎng)液。在第5日收獲燒瓶。使用0.22μmstericup吸濾器(Millipore,Bedford,MA,USA)過(guò)濾培養(yǎng)液。實(shí)施例9表征iTrichophaeasaccataGH3β-葡糖苷酶對(duì)纖維二糖和4-硝基苯基-β-D-葡萄糖吡喃糖苷將纖維二糖溶解于50mM乙酸鈉-0.01%TWEEN20pH5緩沖液至2g/L。使用相同緩沖液將酶以多種濃度稀釋。向50μ1的酶稀釋物(0.04-5μg/ml)添加100μ1的纖維二糖溶液(2g/L緩沖液)。將反應(yīng)在50°C溫育30分鐘,接著用50μ1的0.5Μ氫氧化鈉停止反應(yīng)。使用GlucoseOxidase試劑(PointeScientific,Inc.,Canton,MI,USA)依照生產(chǎn)商的指示測(cè)量產(chǎn)生的葡萄糖。將4-硝基苯基-β-D-葡萄糖吡喃糖苷溶解于DMSO至100mM。在即將進(jìn)行測(cè)定前,將IOOmM4-硝基苯基-β-D-葡萄糖吡喃糖苷儲(chǔ)液在50mM乙酸鈉-0.01%TWEEN20緩沖液中稀釋100X(lmM4-硝基苯基-β-D-葡萄糖吡喃糖苷)。使用相同緩沖液將酶以多種濃度稀釋。向20μ1的每個(gè)酶稀釋物,添加100μ1的4-硝基苯基-β-D-葡萄糖吡喃糖苷溶液。將反應(yīng)在40°C溫育20分鐘,然后用50μ1的IM碳酸鈉pH10緩沖液停止反應(yīng)。在405nm處通過(guò)分光光度法確定釋放的4-硝基苯酚。結(jié)果說(shuō)明1TrichophaeasaccataGH3β-葡糖苷酶對(duì)兩種底物均具有活性。熱穩(wěn)定件將TrichophaeasaccataGH3Aβ-葡糖苷酶在50mM乙酸鈉-0.01%TWEEN20pH5緩沖液中稀釋至lg/L,然后在50°C溫育72小時(shí),和在60°C溫育3小時(shí)或?qū)πr(shí)。將相同的樣品儲(chǔ)藏于4°C充當(dāng)對(duì)照。在溫育之后,使用4-硝基苯基-β-D-葡萄糖吡喃糖苷作為底物根據(jù)上述測(cè)定法,但使用在該測(cè)定法中給出少于5%轉(zhuǎn)化的一種酶加載量來(lái)測(cè)量樣品的殘余活性。在4°C的樣品的活性標(biāo)準(zhǔn)化為100%,而將在其他溫育條件的樣品的活性與4°C活性相比較。TrichophaeasaccataGH3Aβ-葡糖苷酶的熱穩(wěn)定性示于下述表I。表I:TrichophaeasaccataGH3Aβ-葡糖苷酶的熱穩(wěn)定性權(quán)利要求Val545ValValValHisSer550YalGlyProlielie555MetGluLysTipAla560AspLysArgGlnVal565ArgSerlieLeuTrp570AlaIIisLeuProGly575MetGluSerGlyAsn580AlaLeuValAspVal585LeuTrpGlySerThr590AsnProSerGlyLys595LeuProTyrThrlie600GlyLysSerLeuAla605AspTyrGlyProAlaAlaGlyValLcuTyr615ThrGluAsnAlaGln620ProProGlnGlnAsp625PheThrAspGlyVal630PhelieAspTyrArg635HisPheAspAlaAsn640LyslieGluProArg645TyrGluPheGlyPhe650GlyLeuSerTyrThr655ThrPheSerTyrSer660AsnLeuValLysVal665LysLysGlyAlaPhe670ThrProLeuProAla675ProArgProLysAsp680SerAlaThrProPro685LysTyrAspSerLys690LeuProIysProGluG95(;luCysThrPhePro700AspGlyPheIysLys705lieAsnArgMetlie710TyrProTyrLeuGlu715SerAlaAspThrVal720LysValGlyProTyr725ProTyrProGluGly730TyrAspThrLysGln735ThrProSerGlnAla740GlyGlyAlaGlnGly745GlyAsnProAlaLeu750TrpGluValLeuAla755GluValSerYalThr760ValLysAsnThrGly765LysValAlaGlyAla770GluValAlaGlnLeu775TyrLeuGlyPhePro780GlnAsnGlyProVal785ProPheProProLys790GlnLeuArgGlyPhe795GluLysValPheLeu800GlnProGlyGluSer805LysArgValThrPhe810ProLeuThrArgArg815AspLeuSerTyrTrp820AspValThrLysGln825AsnTrpValliePro830LysGlyGlyPheGly835ValMetValGlyThr840SerSerArgLyslie845LysAlaGlnGlyTyr850lieProSerAspHis855Tyr<210>3<211>923<212〉DNA<213>特異腐質(zhì)霉(Humicolainsolens)<400>3atgcgttcctcccccctcctccgctccgccgttgtggccgccctgccggtgttggccctt60gccgctgatggcaggtccacccgctactgggactgctgcaagccttcgtgcggctgggcc120aagaaggctcccgtgaaccagcctgtcttttcctgcaacgccaacttccagcgtatcacg180gacttcgacgccaagtccggctgcgagccgggcggtgtcgcctactcgtgcgccgaccagZ40accccatgggctgtgaacgacgacttcgcgctcggttttgctgccacctctattgccggc300agcaiiLgaggcgggcLggLgcLgcgccIgcLacgagじLcaccLLcacaLじcggLcじしgLL3G0gctggcaagaagatggtcgtccagtccaccagcactggcggtgatcttggcagcaaccac420ttcgatctcaacatccccggcggcggcgtcggcatcttcgacggatgcactccccagttc480ggcggtctgcccggccagcgctacggcggcatctcgtcccgcaacgagtgcgatcggttc540cccgacgccctcaagcccggctgctactggcgcttcgactggttcaagaacgccgacaat600ccgagcttcagcttccgtcaggtccagtgcccagccgagctcgtcgctcgcaccggatgc660cgccgcaacgacgacggcaacttccctgccgtccagatcccctccagcagcaccagctct(20ccggtcaaccagcctaccagcaccagcaccacgtccacctccaccacctcgagcccgcca(80gtccagcctacgactcccagcggctgcactgctgagaggtgggctcagtgcggcggcaat840ggctggagcggctgcaccacctgcgtcgctggcagcacttgcacgaagattaatgactgg900taccatcagtgcctfftagaattc923<210>4<211>305<212>PRT<213>特異腐質(zhì)霉(Humicolainsolens)<400>4MetArgberSerProLeuLeuArgberAlaValValAlaAlaLeuPro151015ValLeuAlaLeuAlaAlaAspGlyArgSerThrArgTyrTrpAspCvs202530CysLysProSerCysGlyTrpAlaLysLysAlaProValAsnbinPro“35‘4045ValPheSerCysAsnAlaAsnPheGlnArglieThrAspPheAspAla505560LysSerirlyCysb丄uProyjlyGlyValAlaTyrSerCysAlaAspGlnThrProTrpAlaValAsnAspAspPheAlaLeuGlyPheAlaAlaThr859095SerlieA丄aGlySerAsnIjIuAlairlyTrpCysCysAlaCysTyrGlu100105110LeuThrPheThrSerGlyProValAlaGlyLysLysMetValValGln115120125SerThrSerThrGlyGlyAspLeuGlySerAsnHisPheAspLeuAsn130‘135140lieProGlyGlyGlyValGlyliePheAspGlyCysThrProGlnPhe145150155160GlyGlyLeuProGlyGlnArgTyrGlyGlylieSerSerArgAsnGlu165170175CysAspArgPheProAspAlaLeuLysProしIyCysTyrTrpArgPhe“180185190AspTrpPheLysAsnAlaAspAsnProSerPheSerPheArgGlnVal19520020545Ly:GlnAlaGlyGly40ThrProLeuHii60IeAspAlaPheGlnArjProLeu7555ValGlyGlProProThrLy35SerlieVa:50ThiGlyValAspTyrAlaSerTrp9095AlaLeuGluVa70Cy;85ProSer65SerCysAlaGluIylieLysTlirGluGlyAspAlaLeuTlirLeuAsnGlnTrpMetPro100105110ArgThrTyrThrThrThrGlyGlnTyrProAlaAsnLeuValAlaGluAspGlyLysAsnTyrGluAspValLysLeuLeuAla130135140AsriLeuProCysGlyMel155160IeSerPheAspAlaAspValSejIyGlyArgGly175AspLeu170Glu50LeuGlyAlaPheTy]65IyThrGlyTyrCysAspAlaProAlaGlyAlaGluTyr18018590IeAspGln45AspLeuAsiLysLeuAspPhelieAsnGlyGluAlaAsn200205InCy:AsnGluMetAsp丄丄ePheGlu220he95IyAlaHis210ArgAlaLysThrPheValProHisProCysAsnlieThrGlnValTyr225230235240ValCys255ValGlGln250GlGluGlyGlu245GlIyPheAsnGluTyrLysTrpGlyValGluSerPhe265270TrpGlyCy;85:60IeAspSerSerLysLysPheThrGlyArgGlySerGlnPheAla275280LyTyiIleTrpAlaAsp.370AsnGlyProCys.385AsnLysProAspValGlySerThr.420Leu380AspLysGluThrPheSerAsnlieArg410TyrAlaProGlyGlyLysCysGlyVal.425AspSerGly.375SerAlaThr.390AlaArgVal405PheMetAsnTrpGluGlyAlaGluGlylieValLys400lieGlyGlu.415LysSerArgPro.395ValaAr,.43.IyLeuThrAlaSer.440<210>23<211>1380<212>DNA<213>里氏木霉(Trichodermareesei)atggcgccctcagttacactgccgttgaccacggccatcctggccattgcccggctcgtc60gccgcccagcaaccgggtaccagcacccccgaggtccatcccaagttgacaacctacaag120tgtacaaagtccggggggtgcgtggcccaggacacctcggtggtccttgactggaactac180cgctggatgcacgacgcaaactacaactcgtgcaccgtcaacggcggcgtcaacaccacg240ctctgccctgacgaggcgacctgtggcaagaactgcttcatcgagggcgtcgactacgcc300gcctcgggcgtcacgacctcgggcagcagcctcaccatgaaccagtacatgcccagcagc360tctggcggctacagcagcgtctctcctcggctgtatctcctggactctgacggtgagtac420gtgatgctgaagctcaacggccaggagctgagcttcgacgtcgacctctctgctctgccg.180tgtggagagaacggctcgctctacctgtctcagatggacgagaacgggggcgccaaccag540tataacacggccggtgccaactacgggagcggctactgcgatgctcagtgccccgtccag600acatggaggaacggcaccctcaacactagccaccagggcttctgctgcaacgagatggat660atcctggagggcaactcgagggcgaatgccttgacccctcactcttgcacggccacggcc720tgcgactctgCCggttgCggcttcaacccctatggcagcggctacaaaagctactacggc780cccggagataccgttgacacctccaagaccttcaccatcatcacccagttcaacacggac840aacggclegeCCLcgggcéiaccllglgagcalcacccgcaaglaccagcaaaacggcglx900gacatccccagcgcccagcccggcggcgacaccatctcgtcctgcccgtccgcctcagcc960tacggcggcctcgccaccatgggcaaggccctgagcagcggcatggtgctcgtgttcagc1020atttggaacgacaacagccagtacatgaactggctcgacagcggcaacgcCggCCCCtgC1080agcagcaccgagggcaacccatccaacatcctggccaacaaccccaacacgcacgtcgtc1140ttctccaacatccgctggggagacattgggtctactacgaactcgactgcgcccccgccc1200ccgcctgcgtccagcacgacgttttcgactacacggaggagctcgacgacttcgagcagc1260ccgagctgcacgcagactcactgggggcagtgcggtggcattgggtacagcgggtgcaag上320acgtgcacgtcgggcactacgtgccagtatagcaacgactactactcgcaatgcctttag1380<210>24<211>459<212>PRT全文摘要本發(fā)明涉及具有β-葡糖苷酶活性的分離的多肽和編碼所述多肽的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構(gòu)建體、載體和宿主細(xì)胞,以及用于制備和使用所述多肽的方法。文檔編號(hào)C12P19/14GK102388134SQ201080015374公開(kāi)日2012年3月21日申請(qǐng)日期2010年1月28日優(yōu)先權(quán)日2009年1月28日發(fā)明者K.施諾爾,M.雷申請(qǐng)人:諾維信公司,諾維信股份有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1