專利名稱::具有內(nèi)切葡聚糖酶活性的多肽和編碼該多肽的多核苷酸的制作方法具有內(nèi)切葡聚糖酶活性的多肽和編碼該多肽的多核苷酸涉及序列表本申請包含計算機可讀形式的序列表。該計算機可讀形式通過引用并入本文。涉及生物材料的保藏本申請包含對生物材料的保藏的涉及,所述保藏已經(jīng)依據(jù)布達佩斯條約在北區(qū)研究中心(NorthernRegionalResearchCenter)(NRRL)進行,并指定了登錄號NRRLB-30900N、NRRLB-30902、NRRLB-30903和NRRLB-30904,所述微生物保藏通過引用并入本文。
背景技術:
:發(fā)明領域本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽和編碼所述多肽的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及用于產(chǎn)生和使用所述多肽的方法。相關領域描述纖維素是單糖葡萄糖通過(3-1,4-鍵共價連接的聚合物。許多微生物產(chǎn)生水解(3-連接的葡聚糖的酶。這些酶包括內(nèi)切葡聚糖酶、纖維二糖水解酶和P-葡糖苷酶。內(nèi)切葡聚糖酶在隨機位置消化纖維素聚合物,將其打開(openingit)以受到纖維二糖水解酶攻擊(attack)。纖維二糖水解酶繼而從纖維素聚合物的末端釋放纖維二糖的分子。纖維二糖水解酶I是1,4-D-葡聚糖纖維二糖水解酶(RC.3.2.1,91)活性,其催化纖維素、纖維四糖(cellotetriose)或任何含有(3-1,4-連接的葡萄糖的聚合物中1,4-(3-D-糖苷鍵的水解,從鏈的還原性末端釋放纖維二糖。纖維二糖水解酶II是1,4-D-葡聚糖纖維二糖水解酶(E.C3.2丄91)活性,其催化纖維素、纖維四糖或任何含有(3-1,4-連接的葡萄糖的聚合物中1,4-P-D-糖苷鍵的水解,從鏈的非還原性末端釋放纖維二糖。纖維二糖是水溶性的j3-l,4-連接的葡萄糖二聚體。(3-葡糖苷酶將纖維二糖水解成葡萄糖。將含纖維素原料(cdlulosicfeedstock)轉化為乙醇具有以下優(yōu)勢大量原料現(xiàn)成可用,避免燃燒或填埋材料的合意性和乙醇燃料的清潔性。木材、農(nóng)業(yè)殘余物、草本作物和城市固體廢物被認為是用于乙醇生產(chǎn)的原料。這些材料主要由纖維素、半纖維素和木質素組成。一旦將纖維素轉化成葡萄糖,葡萄糖將容易地由酵母發(fā)酵成乙醇。Roy等,1990,Jow腦/o/Ge"era/M;'cra^o/ogv136:1967-1972公開了來自嗜熱毀絲霉(MFe/Zc^/^oraAermop/n7a)ATCC48104的胞外內(nèi)切葡聚糖酶的純化和性質。Chernoglazov等,1988,傷o狄/,;ya53:475-482公開了來自嗜熱毀絲霉的內(nèi)切葡聚糖酶的分離、純化和底物特異性。Klyosov等,1988,/Wo&c/mo/ogvZ^"ew10:351-354公開了來自嗜熱毀絲霉的熱穩(wěn)定性內(nèi)切葡聚jf唐!錄。Guzhova牙口Loginova,1987,尸n'A:/aciwqyaB/oA:/n.wi[ya23:820-825公開了來自嗜熱毀絲霉的纖維素分解酶。Rabinovich等,1986,/大Vwr伊m'c/^^;;a尺/'而>12:1549-1560公開了來自嗜熱毀絲霉的內(nèi)切葡聚糖酶的純化和表征。Svistova等,1986,A/汰rWw/og7;y"55:49-54公開了嗜熱毀絲霉中纖維素生物合成的調(diào)控。Bhat和Maheshwari,1987,J/;//^/A'"v/rawme"Za/M'cra&o/ogy53:2175-2182公開了嗜熱毀絲霉的胞外纖維素系統(tǒng)中組分的活性。Klyosov等,1987,/V汰/"(iw"3/fl歷o腸/w,;ya/M/'Aro6/o/og(yo23:44-50公開了來自嗜熱毀絲霉的熱穩(wěn)定內(nèi)切葡聚糖酶。Jorgensen等,2003,AV2zywefl"c/M/crc^/a/rec/zo/ogy32:851-861矛口Thygesen等,2003,tw<iM/c廠o6/a/rec/w7o/ogy32:606-615乂〉開了來自巴西青審(/^"/(^///"附^"os7//awziw)IBT20888的纖維素降解酶。水解速率、更好的熱穩(wěn)定性、對木質素的吸附減少,和除水解纖維素之外水解生物質的非纖維素成分例如半纖維素的能力。對半纖維素具有廣泛副活性(sideaclivity)的內(nèi)切葡聚糖酶能夠特別有益于改進復雜的、富含半纖維素的生物質底物的總水解產(chǎn)率。本發(fā)明的目的是提供改進的具有內(nèi)切葡聚糖酶活性的多肽和編碼該多肽的多核苷酸。發(fā)明概述本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,所述多肽選自下組中的一種或多種(a)包含氨基酸序列的多肽,所述氨基酸序列與SEQIDNO:4或SEQIDNO:10的成熟多肽具有至少80%同一性,與SEQIDNO:6的成熟多肽具有至少85%同一性,或與SEQIDNO:8的成熟多肽具有至少75%同一性;(b)由多核苷酸編碼的多肽,所述多核苷酸在至少高嚴緊條件下與以下雜交(i)SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列,(ii)包含于SEQIDNO:3或SEQIDNO:9的成熟多肽編碼序列中的cDNA序列,或包含SEQIDNO:5或SEQIDNO:7的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的全長互補鏈;(c)由多核苷酸編碼的多肽,所述多核苷酸與SEQIDNO:3或SEQIDNO:9的成熟多肽編碼序列具有至少80%同一性,與SEQIDNO:5的成熟多肽編碼序列具有至少85%同一性,或與SEQIDNO:7的成熟多肽編碼序列具有至少75%同一性;和(d)變體,其包含取代、缺失和/或插入一個或幾個氨基酸的SEQIDNO:4、SP:QIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽。本發(fā)明還涉及編碼具有內(nèi)切葡聚糖酶活性的多肽的分離的多核苷酸,所述多核苦酸選自下組中的一種或多種(a)編碼包含氨基酸序列的多肽的多核苷酸,所述氨基酸序列與SEQIDNO:4或SEQIDNO:10的成熟多肽具有至少80%同一性,與SEQIDNO:6的成熟多肽具有至少85%同一性,或與SEQIDNO:8的成熟多肽具有至少75%同一性;(b)多核苷酸,其在至少高嚴緊條件下與以下雜交(i)SEQIDNO:3、SKQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列,(ii)包含于SEQIDNO:3或SEQIDNO:9的成熟多肽編碼序列中的cDNA序列,或包含SEQIDNO:5或SEQIDNO:7的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的互4M連;(c)多核香酸,其與SEQIDNO:3或SEQIDNO:9的成熟多肽編碼序列具有至少80%同一性,與SEQIDNO:5的成熟多肽編碼序列具有至少85%同一性,或與SEQIDNO:7的成熟多肽編碼序列具有至少75%同一性;和(d)編碼變體的多核香酸,所述變體包含取代、缺失和/或插入一個或幾個氨基酸的SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽。在優(yōu)選的方面,所述成熟多肽是SEQIDNO:4的氨基酸17至389。在另一個優(yōu)選的方面,所述成熟多肽是SEQIDNO:6的氨基酸16至397。在另一個優(yōu)選的方面,所述成熟多肽是SEQIDNO:8的氨基酸22至429。在另一個優(yōu)選的方面,所迷成熟多肽是SEQIDNO:10的氨基酸25至421。在另一個優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:3的核苦酸67至1185。在另一個優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:5的核苷酸84至1229。在另一個優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:7的核苷酸77至1300。在另一個優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:9的核苷酸73至1468。本發(fā)明還涉及包含所述多核苷酸的核酸構建體、重組表達載體和重組宿主細胞,和產(chǎn)生具有內(nèi)切葡聚糖酶活性的多肽的方法。包括本發(fā)明的多核苷酸的亞序列。本發(fā)明還涉及這種雙鏈抑制性RNA(dsRNA)分子,其中任選地dsRNA是siRNA或mi脂A分子。本發(fā)明還涉及在纖維素到葡萄糖和各種物質的轉化中^f吏用具有內(nèi)切葡聚糖酶活性的多肽的方法。本發(fā)明還涉及包含分離的多核苷酸的植物,所述多核苷酸編碼這樣的具有內(nèi)切葡聚糖酶活性的多肽。本發(fā)明還涉及用于產(chǎn)生這樣的具有內(nèi)切葡聚糖酶活性的多肽的方法,其包括(a)在有益于產(chǎn)生該多肽的條件下培養(yǎng)包含多核苷酸的轉基因植物或植物細胞,所述多核苷酸編碼這樣的具有內(nèi)切葡聚糖酶的多肽;和(b)回收所述多肽。本發(fā)明進一步涉及包含編碼蛋白質的基因的核酸構建體,其中將所述基因可操作地連接于編碼信號肽的第一核普酸序列和編碼前肽(propeptide)的第二核苷酸序列,所述信號肽包含SEQIDNO:4的氨基酸1至16,SEQIDNO:6的氨基酸1至15,SEQIDNO:8的氨基酸1至21,或SEQIDNO:10的氨基酸1至16或由SEQIDNO:4的氨基酸1至16,SEQIDNO:6的氨基酸1至15,SEQIDNO:8的氨基酸1至21,或SEQIDNO:10的氨基酸1至16組成,且所述前肽包含SEQIDNO:10的氨基S臾17至24或由SEQIDNO:10的氨基酸17至24組成,其中所述基因對于第一和第二核苷酸序列是外源的。附圖簡述圖1顯示pCIC161的限制圖譜(restrictionmap)。圖2顯示嗜熱毀絲霉CBS117.65內(nèi)切葡聚糖酶的基因組DNA序列和推導的氨基酸序列(分別為SEQIDNO:3和4)。圖3顯示pA2C161的限制圖譜。圖4顯示pCIC453的限制圖譜。圖5顯示pA2C453的限制圖譜。圖6顯示擔子菌(basidiomycete)CBS495.95內(nèi)切葡聚糖酶的cDNA序列和推導的氨基酸序歹ll(分別為SEQIDNO:5和6)。圖7顯示pCIC486的限制圖譜。圖8顯示pA2C486的限制圖谞。圖9顯示擔子菌CBS494.95內(nèi)切葡聚糖酶的cDNA序列和推導的氨基酸序列(分別為SEQIDNO:7和8)。圖10A和10B顯示巴西青霉菌抹IBT20888內(nèi)切葡聚糖酶的基因組DNA序列和推導的氨基酸序列(分別為SEQIDNO:9和10)。圖11顯示pKBK03的限制圖語。圖12顯示pPBCel5C的限制圖語。圖13顯示在不同的pH值和50°C,巴西青霉IBT20888CEL5C內(nèi)切葡聚糖酶的比活性(n二2)。圖14顯示在不同的溫度和pH4.8,巴西青霉IBT20888CEL5C內(nèi)切葡聚糖酶的比活性(n-2)。圖15顯示在不同的pH值和25。C和50。C溫育20小時之后(11=2),巴西青霉IBT20888CEL5C內(nèi)切葡聚糖酶的殘余活性(n-2)。圖16顯示在pH5.0,擔子菌CBS494.95和擔子菌CBS495.95對于PASC(2mg/ml)的相對活性作為溫度的函數(shù)。圖17顯示在pH5.0,擔子菌CBS494.95和擔子菌CBS495.95(0.5mg蛋白質每gPASC)水解45小時之后,PASC(2mg/ml)的相對轉化率作為溫度的函數(shù)。圖18顯示來自嗜熱毀絲霉CBS117.65、擔子菌CBS494.95、擔子菌CBS495.95和里氏木霉的內(nèi)切葡聚糖酶在pH5.5和60。C水解反應2小時之后,從卩-葡聚糖(1%w/v)產(chǎn)生還原糖的比較。圖19顯示來自嗜熱毀絲霉CBS117.65、擔子菌CBS494.95、擔子菌CBS495.95和里氏木霉的內(nèi)切葡聚糖酶在pH5.5和60。C水解反應2小時之后,從卩-葡聚糖(1%w/v)產(chǎn)生還原糖的比較。定義內(nèi)切葡聚糖酶活性術語"內(nèi)切葡聚糖酶活性"在本文中定義為內(nèi)切-1,4-(3-D-葡聚糖4-葡聚糖水解酶(endo-l,4-(3-D-glucan4-glucanohydrolase)(E.C.No.3.2丄4),其催化纖維素、纖維素衍生物(例如羧曱基纖維素和羥乙基纖維素)、地衣淀粉(lichenin)中的1,4-|3-D-糖普鍵、混合的卩-1,3葡聚糖例如谷類|3-D-葡聚糖或木葡聚糖中的(3-1,4鍵和含有纖維素成分的其它植物材料的內(nèi)水解(endohydrolysis)。就本發(fā)明而言,#4居Ghose,1987,a"J/i///.C77ew.59:257-268的方法,使用羧曱基纖維素(CMC)水解來測定內(nèi)切葡聚糖酶活性。將一單位的內(nèi)切葡聚糖酶活性定義為在50°C、pH4.8,每分鐘產(chǎn)生L0微摩爾還原糖。在優(yōu)選的方面,具有內(nèi)切葡聚糖酶活性的本發(fā)明的多肽還對選自下組的一種或多種底物具有酶活性木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖(arabinoxylan)、1,4-P-D-甘露聚糖和半乳甘露聚糖(galactomannan)。將具有內(nèi)切葡聚糖酶活性的多肽對于這些多糖底物的活性測定為將所述底物(5mg每升)與本發(fā)明的具有內(nèi)切葡聚糖酶活性的多肽(5mg蛋白質每g底物)一起在pll5.0(50mM乙酸鈉)和50。C及間歇攪拌溫育24小時之后,底物水解為還原糖的百分比。水解混合物中的還原糖通過對羥基苯曱酸酰肼(PHBAH)方法確定。在更優(yōu)選的方面,本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽進一步對木聚糖具有酶活性。在另一個更優(yōu)選的方面,本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽進一步對木葡聚糖具有酶活性。在另一個更優(yōu)選的方面,本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽進一步對阿拉伯木聚糖具有酶活性。在另一個更優(yōu)選的方面,本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽進一步對1,4-P-D-甘露聚糖具有酶活性。在另一個更優(yōu)選的方面,本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽進一步對半乳甘露聚糖具有酶活性。在另一個更優(yōu)選的方面,本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽進一步對木聚糖、木葡聚糖、阿拉伯木聚糖、1,4-P-D-甘露聚糖和/或半乳甘露聚糖具有酶活性。本發(fā)明的多肽具有SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽的內(nèi)切葡聚糖酶活性的至少20%,優(yōu)選至少40%,更優(yōu)選至少50%,更優(yōu)選至少60%,更優(yōu)選至少70%,更優(yōu)選至少80%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,并且甚至最優(yōu)選至少100%。家族5糖苦水解酶或家族GH5:術語"家族5糖普水解酶"或"家族GH5"在本文中定義為才艮據(jù)HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,所oc/z,.■/280:309-316,及HenrissatB.,和BairochA.,1996,Updatingthesequence-basedclassificationofgycosylhydrolases,歷oc/^附.J.316:695-696屬于糖苷水解酶家族5的多肽。分離的多肽術語"分離的多肽"用于本文中指,如通過SDS-PAGE測定的,其為至少20°/。純,優(yōu)選至少40%純,更優(yōu)選至少60%純,甚至更優(yōu)選至少80%純,最優(yōu)選至少90%純,并且甚至最優(yōu)選至少95%純的多肽?;旧霞兊亩嚯男g語"基本上純的多肽"在本文表示多肽制備物,所述多肽制備物含有按重量計至多10%,優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多50/。,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1。/。,并且甚至最優(yōu)選至多0.5。/。的與其天然或重組結合的(associated)的其它多肽材料。因此,優(yōu)選所述基本上純的多肽是按存在于制備物中的全部多肽材料的重量計至少92%純,優(yōu)選至少94%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少96%純,更優(yōu)選至少97%純,更優(yōu)選至少98%純,甚至更優(yōu)選至少99%純,最優(yōu)選至少99.5°/。純,并且甚至最優(yōu)選100%純。本發(fā)明的多肽優(yōu)選是基本上純的形式。具體而言,優(yōu)選所述多肽是"基本上(essentially)純的形式",即,所述多肽制備物基本上(essentially)不含與其天然或重組結合的其它多肽材料。例如,這能夠通過以下實現(xiàn)通過公知的重組方法或由經(jīng)典純化方法制備多肽。在本文中,術語"基本上純的多肽"與術語"分離的多肽"和"分離形式的多肽"同義。成熟多肽術語"成熟多肽"在本文中定義為具有內(nèi)切葡聚糖酶活性的多肽,所述多肽以其在翻譯和任何翻譯后修飾之后的最終形式存在,所述修飾例如N-末端加工、C-末端截斷、糖基化等。成熟多肽編碼序列術語"成熟多肽編碼序列"在本文中定義為編碼具有內(nèi)切葡聚糖酶活性的成熟多肽的核普酸序列。同一性參數(shù)"同一性"描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。就本發(fā)明而言,兩個氨基酸序列之間的同一性程度通過Ncedleman-Wunsch算法(Needleman和Wunsch,1970,JAfo/,歷o/.48:443-453)使用EMBOSS的Needle程序來測定,使用缺口罰分(gappenalty)10,缺口延伸罰分(gapextensionpenalty)0.5和EBLOSUM62矩陣。使用Needle標記為"最高同一性(longestidentity)"的輸出結果作為同一性百分比,并計算如下(同樣的殘基xiooy(比對長度-比對中缺口的數(shù)目)就本發(fā)明而言,兩個核苷酸序列之間的同一性程度通過Nccdleman-Wimsch算法(Needleman和Wunsch,1970,>/M/.腸/.48:443-453)使用EMBOSS的Needle程序來測定,使用參數(shù)缺口罰分IO,缺口延伸罰分0.5和EDNAFULL矩陣。使用Needle標記為"最高同一性"的輸出結果作為同一性百分比,并計算如下(同樣的殘基x100)/(比對長度-比對中缺口的數(shù)目)同源序列術語"同源序列"在本文中定義為在用SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟內(nèi)切葡聚糖酶進行的fasta搜索(Pearson,W.R.,1999,于所o〖wybma/csM^/cxis1a"c/尸ratoco/s中,S.Misener和S.A.Krawetz,ed.,pp.185-219)中E值(或期望值)小于0.001的預測蛋白質。多肽片段術語"多肽片段"在本文中定義為從SEQIDNO:4、SEQIDN():6、SEQIDNO:8或SEQIDNO:10的成熟多肽的氨基和/或羧基末端缺失一個或幾個氨基酸的多肽,或其同源序列;其中所述片段具有內(nèi)切葡聚糖酶活性。在優(yōu)選方面,片段含有SEQIDNO:4的成熟多肽或其同源序列的至少295個氨基酸殘基,更優(yōu)選至少315個氨基酸殘基,并且最優(yōu)選至少335個氨基酸殘基。在另一個優(yōu)選的方面,片段含有SEQIDNO:6的成熟多肽或其同源序列的至少320個氨基酸殘基,更優(yōu)選至少340個氨基酸殘基,并且最優(yōu)選至少360個氨基酸殘基。在另一個優(yōu)選的方面,片段含有SEQIDNO:8的成熟多肽或其同源序列的至少325個氨基酸殘基,更優(yōu)選至少345個氨基酸殘基,并且最優(yōu)選至少365個氨基酸殘基。在另一個優(yōu)選方面,片段含有SEQIDNO:10的成熟多肽或其同源序列的至少335個氨基酸殘基,更優(yōu)選至少355個氨基酸殘基,并且最優(yōu)選至少375個氨基酸殘基。亞序列術語"亞序列(subsequence)"在本文中定義為從SEQIDNO:3、SKQIDNO:5、SEQIDNO:7或SEQIDNO:9的5,和/或3'端缺失一個或幾個核苷酸的核苷酸序列,或其同源序列;其中所述亞序列編碼具有內(nèi)切葡聚糖酶活性的多肽片段。在優(yōu)選方面,亞序列含有SEQIDNO:3的成熟多肽編碼序列或其同源序列的至少885個核苷酸,更優(yōu)選至少945個核苷酸,并且最優(yōu)選至少1005個核苷酸。在另一個優(yōu)選方面,亞序列含有SEQIDNO:5的成熟多肽編碼序列或其同源序列的至少960個核苷酸,更優(yōu)選至少1020個核普酸,并且最優(yōu)選至少1080個核苷酸。在另一個優(yōu)選方面,亞序列含有Sl':QIDNO:7的成熟多肽編碼序列或其同源序列的至少975個核苷酸,更優(yōu)選至少1035個核苦酸,并且最優(yōu)選至少1095個核香酸。在另一個優(yōu)選方面,亞序列含有SEQIDNO:9的成熟多肽編碼序列或其同源序列的至少1005個核苷酸,更優(yōu)選至少1065個核苷酸,并且最優(yōu)選至少1125個核苷酸。等位變體(allelicvariant):術語"等位變體"在本文中表示占據(jù)相同染色發(fā)生,并且可導致種群內(nèi)的多態(tài)性?;蛲蛔兛梢允浅聊?在編碼的多肽中無變化)或可以編碼具有改變的氨基酸序列的多肽。多肽的等位變體是由基因的等位變體編碼的多肽。分離的多核苷酸術語"分離的多核苷酸"用于本文中指,如通過瓊脂糖電泳測定的,其為至少20%純,優(yōu)選至少40%純,更優(yōu)選至少60%純,甚至更優(yōu)選至少80%純,最優(yōu)選至少90%純,并且甚至最優(yōu)選至少95%純的多核苷酸。基本上純的多核苷酸術語"基本上純的多核苷酸"用于本文指不含其它外來的或不期望的核苷酸的多核苦酸制備物,并且所述多核苷酸制備物處于適合于在遺傳工程的蛋白質生產(chǎn)體系中使用的形式。因此,基本上純的多核苷酸含有按重量計至多10%,優(yōu)選至多8%,更優(yōu)選至多6%,更優(yōu)選至多5%,更優(yōu)選至多4%,更優(yōu)選至多3%,甚至更優(yōu)選至多2%,最優(yōu)選至多1%,并且甚至最優(yōu)選至多0.5%的與其天然或重組結合的其它多核苷酸材料。然而,基本上純的多核苷酸可以包括天然存在的5'和3,非翻譯區(qū),例如啟動子和終止子。優(yōu)選基本上純的多核苷酸是按重量計至少90%純,優(yōu)選至少92%純,更優(yōu)選至少94%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少97%純,甚至更優(yōu)選至少98%純,最優(yōu)選至少99%,并且甚至最優(yōu)選至少99.5%純的。本發(fā)明所述多核苷酸優(yōu)選為基本上純的形式。具體而言,優(yōu)選在本文公開的多核苷酸是"基本上(essentially)純的形式",即,所述多核香酸制備物基本上不含與其天然或重組結合的其它多核苦酸材料。在本文中,術語"基本上純的多核苷酸"與術語"分離的多核苷酸"和"分離形式的多核苷酸"同義。所述多核苦酸可以是基因組、cDNA、RNA、半合成、合成來源的,或它們的任何組合。編碼序列當用于本文時術語"編碼序列"的意思是直接指定其蛋白產(chǎn)物的氨基酸序列的核苷酸序列。編碼序列的邊界通常由開讀框決定,所述開讀框通常以ATG起始密碼子或可供選擇的起始密碼子例如GTG和TTG開始,并且以終止密碼子例如TAA、TAG和TGA結束。編碼序列可以是DNA、cDNA或重組核芬酸序列。成熟多肽編碼序列術語"成熟多肽編碼序列"在本文中定義為核苷酸序列,其編碼具有內(nèi)切葡聚糖酶活性的成熟多肽。cDNA:術語"cDNA,,在本文中定義為能夠通過反轉錄從得自真核細胞的成熟的、已剪接的mRNA分子制備的DNA分子。cDNA缺少通常存在于相應基因組DNA中的內(nèi)含子序列。起始的(initial)、初級的RNA轉錄物是mRNA的前體,其通過一系列的步驟加工然后作為成熟的已剪4妻的mRNA出現(xiàn)。這些步驟包括通過稱為剪接的過程去除內(nèi)含子序列。因而源自mRNA的cDNA沒有任何內(nèi)含子序列。核酸構建體術語"核酸構建體"用于本文指單鏈或雙鏈的核酸分子,所述核酸分子分離自天然存在的基因,或將所述核酸分子以本來不存在于(nototherwiseexist)自然界中的方式修飾以含有核酸的區(qū)段。當所述核酸構建體含有表達本發(fā)明的編碼序列所需的調(diào)控序列時,術語核酸構建體與術語"表達盒"同義。調(diào)控序列(controlsequence):術語"調(diào)控序列"在本文定義為包括對編碼本發(fā)明多肽的多核苷酸表達是必需的或有利的所有成分。各個調(diào)控序列對于編碼所述多肽的核苷酸序列可以是天然的或外源的,或各個調(diào)控序列對于彼此可以是天然的或外源的。這些調(diào)控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉錄終止子。最少的情況,調(diào)控序列包括啟動子和轉錄和翻譯的終止信號。調(diào)控序列可以和用于引入特異性限制位點的接頭一起提供,所述特異性限制位點促進調(diào)控序列與編碼多肽的核苦酸序列編碼區(qū)的連接??刹僮鞯剡B接術語"可操作地連接"在本文表示這樣的構型,其中將調(diào)控序列置于相對于多核苷酸序列的編碼序列的適當位置,使得調(diào)控序列指導多肽編碼序列的表達。表達術語"表達"包括涉及多肽產(chǎn)生的任何步驟,其包括但不限于轉錄、轉錄后修飾、翻譯、翻譯后修飾和分泌。表達載體術語"表達載體"在本文定義為線性的或環(huán)狀的DNA分子,其包含編碼本發(fā)明多肽的多核苷酸,并且所述多核苷酸與提供用于其表達的額外核苦酸可操作地連接。宿主細胞如本文中所使用的術語"宿主細胞"包括任何細胞類型,所述細胞類型對于使用包含本發(fā)明多核苷酸的核酸構建體或表達載體的轉化、轉染、轉導等是易感的(susceptible)。修飾術語"修飾"在本文的意思是,對由SEQIDNO:4、SEQIDNO:6、SHQIDNO:8或SEQIDNO:10的成熟多肽組成的多肽或其同源序列的任何化學修飾,以及對編碼所述多肽的DNA的遺傳操作。所述修飾可以是一個或幾個氨基酸的取代、缺失和/或插入,以及一個或幾個氨基酸側鏈的置換。人工變體當用在本文時,術語"人工變體,,的意思是具有內(nèi)切葡聚糖酶活性的多肽,所述多肽由表達SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列或其同源序列的修飾的核苷酸序列的生物體產(chǎn)生。所述i"奮飾的核苷酸序列通過人為干預(humanintervention),通過修飾公開于SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9或它們的同源序列的核苷酸序列來獲得。發(fā)明詳述具有內(nèi)切葡聚糖酶活性的多肽在第一個方面,本發(fā)明涉及包含氨基酸序列的分離的多肽,所述氨基酸序列與SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽具有至少60%,優(yōu)選至少65%,更優(yōu)選至少70%,更優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,并且甚至最優(yōu)選至少96%、97%、98%或99%的同一性程度,所述多肽具有內(nèi)切葡聚糖酶活性(下文中的"同源多肽")。在優(yōu)選的方面,所述同源多肽具有氨基酸序列,其與SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽相差十個氨基酸,優(yōu)選相差五個氨基酸,更優(yōu)選相差四個氨基酸,甚至更優(yōu)選相差三個氨基酸,最優(yōu)選相差兩個氨基酸,并且甚至最優(yōu)選相差一個氨基酸。本發(fā)明的多肽優(yōu)選包含SEQIDNO:4的氨基酸序列或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段。在優(yōu)選的方面,多肽包含SEQIDNO:4的氨基酸序列。在另一個優(yōu)選方面,多肽包含SEQIDNO:4的成熟多肽。在另一個優(yōu)選方面,多肽包含SEQIDNO:4的氨基酸17至389,或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段。在另一個優(yōu)選方面,多肽包含SEQIDNO:4的氨基酸17至389。在另一個優(yōu)選方面,多肽由SEQIDNO:4的氨基酸序列或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段組成。在另一個優(yōu)選方面,多肽由SEQIDNO:4的氨基酸序列組成。在另一個優(yōu)選方面,多肽由SEQIDNO:4的成熟多肽組成。在另一個優(yōu)選方面,多肽由SEQIDNO:4的氨基酸17至389或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段組成。在另一個優(yōu)選方面,多肽由SEQIDNO:4的氨基酸17至389組成。本發(fā)明的多肽優(yōu)選還包含SEQIDNO:6的氨基酸序列或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段。在優(yōu)選的方面,多肽包含SEQIDN():6的氨基酸序列。在另一個優(yōu)選方面,多肽包含SEQIDNO:6的成熟多肽。在另一個優(yōu)選方面,多肽包含SEQIDNO:6的氨基酸16至397,或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段。在另一個優(yōu)選方面,多肽包含SHQIDN():6的氨基酸16至397。在另一個優(yōu)選方面,多肽由SEQIDNO:6的氨基酸序列或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段組成。在另一個優(yōu)選方面,多肽由SEQIDNO:6的氨基酸序列組成。在另一個優(yōu)選方面,多肽由SEQIDNO:6的成熟多肽組成。在另一個優(yōu)選方面,多肽由S':QIDNO:6的氨基酸16至397或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段組成。在另一個優(yōu)選方面,多肽由SEQIDNO:6的氨基酸16至397組成。本發(fā)明的多肽優(yōu)選還包含SEQIDNO:8的氨基酸序列或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段。在優(yōu)選的方面,多肽包含SEQIDNO:8的氨基酸序列。在另一個優(yōu)選方面,多肽包含SEQIDNO:8的成熟多肽。在另一個優(yōu)選方面,多肽包含SEQIDNO:8的氨基酸22至429,或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段。在另一個優(yōu)選方面,多肽包含SHQIDNO:8的氨基酸22至429。在另一個優(yōu)選方面,多肽由SEQIDNO:8的氨基酸序列或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段組成。在另一個優(yōu)選方面,多肽由SEQIDNO:8的氨基酸序列組成。在另一個優(yōu)選方面,多肽由SEQIDNO:8的成熟多肽組成。在另一個優(yōu)選方面,多肽由SliQIDNO:8的氨基酸22至429或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段組成。在另一個優(yōu)選方面,多肽由SEQIDNO:8的氨基酸22至429組成。本發(fā)明的多肽優(yōu)選還包含SEQIDNO:10的氨基酸序列或其等位變體;或其具有內(nèi)切葡聚糖酶活性的片段。在優(yōu)選的方面,多肽包含SEQIDNO:10的氨基酸序列。在另一個優(yōu)選方面,多肽包含SEQIDNO:IO的成熟多肽。在另一個優(yōu)選方面,多肽包含SEQIDNO:10的氨基酸25至421,或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段。在另一個優(yōu)選方面,多肽包含SBQIDNO:10的氨基酸25至421。在另一個優(yōu)選方面,多肽由SEQIDNO:10的氨基酸序列或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段組成。在另一個優(yōu)選方面,多肽由SEQIDNO:10的氨基酸序列組成。在另一個優(yōu)選方面,多肽由SEQIDNO:10的成熟多肽組成。在另一個伊乙選方面,多肽由SEQIDNO:10的氨基酸25至421或其等位變體;或它們的具有內(nèi)切葡聚糖酶活性的片段組成。在另一個優(yōu)選方面,多肽由SEQIDNO:10的氨基酸25至421組成。在第二個方面,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽,所述分離的多肽由多核香酸編碼,所述多核苷酸在非常低嚴緊條件下,優(yōu)選低嚴緊條件下,更優(yōu)選中嚴緊條件下,更優(yōu)選中-高嚴緊條件下,甚至更優(yōu)選高嚴緊條件下,并且最優(yōu)選非常高嚴緊條件下,與以下雜交(i)SEQIDNO:3、Sh:QIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列,(ii)包含于SEQIDNO:3或SEQIDNO:9的成熟多肽編碼序列中的cDNA序列,或包含SEQIDNO:5或SEQIDNO:7的成熟多肽編碼序列的基因組DNA序列,(iii)(i)或(ii)的亞序列,或(iv)(i)、(ii)或(iii)的互補《連(J.Sambrook,E.F.I',ritsch,禾口T.Maniatis,1989,7Vfo/ecw/"rC7o"/"g,J丄"Zj0r"/cv7Afa"wfl/,2deditionColdSpringHarbor,NewYork)。SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列的亞序列含有至少IOO個連續(xù)的核苦酸或優(yōu)選至少200個連續(xù)的核苷酸。此外,所述亞序列可編碼具有內(nèi)切葡聚糖酶活性的多肽片段。在優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:3的核苷酸67至1185。在另一個優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:5的核苷酸84至1229。在另一個優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:7的核普酸77至1300。在另一個優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:9的核苷酸73至1468。在另一個優(yōu)選的方面,所述互補鏈是SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列的全長互補^i。SEQII)NO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的核苷酸序列或其亞序列,以及SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的氨基酸序列或其片段,可用于設計核酸探針,以根據(jù)本領域內(nèi)公知的方法從不同屬和種的菌抹鑒定和克隆編碼具有內(nèi)切葡聚糖酶活性的多肽的DNA。具體而言,根據(jù)標準的Southern印跡方法,可將這些4笨針用于與感興趣的屬或種的基因組或cDNA雜交,以鑒定和從其中分離相應的基因。這些探針可明顯短于完整序列,但長度上應為至少14,優(yōu)選至少25,更優(yōu)選至少35,并且最優(yōu)選至少70個核苷酸。然而,優(yōu)選所述核酸探針是至少100個核苷酸長度。例如,所述核酸探針的長度可為至少200個核苷酸,優(yōu)選至少300個核普酸,更優(yōu)選至少400個核普酸,或最優(yōu)選至少500個核苷酸。甚至可以使用更長的探針,例如,長度是至少600個核苷酸,至少優(yōu)選至少700個核芬酸,更優(yōu)選至少800個核苷酸,或最優(yōu)選至少900個核苷酸的核酸探針。DNA和RNA探針二者均可使用。通常將探針標記以探測相應的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)標記)。將這些探針包含于本發(fā)明中。因而,可從由這些其它生物體制備的基因組DNA或cDNA文庫中篩選DNA,所述DNA與上述探針雜交并且編碼具有內(nèi)切葡聚糖酶活性的多肽??梢酝ㄟ^瓊脂糖或聚丙烯酰胺凝膠電泳,或通過其它分離技術分離來自這些其它生物體的基因組或其它DNA??梢詫碜晕膸斓腄NA或分離的DNA轉移至硝化纖維素(nitrocellulose)或其它合適的載體材料并且固定于其上。為了鑒定與SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9或其亞序列同源的克隆或DNA,將所述載體材料優(yōu)選用在Sounthem印跡中。就本發(fā)明而言,雜交表示核苷酸序列在非常低至非常高的嚴緊條件下與標記的核酸探針雜交,所述核酸探針對應于SEQIDNO:3、SEQIDNO:5、S1':QIDNO:7或SEQIDNO:9的成熟多肽編碼序列;包含于SEQIDNO:3或SEQIDNO:9的成熟多肽編碼序列中的cDNA序列,或包含SEQIDNO:5或SEQIDNO:7的基因組DNA序列;其互補《連;或它們的亞序列??伞嚼粲迷趦?yōu)選的方面,核酸探針是SEQIDNO:3的成熟多肽編碼序列。在另一個優(yōu)選方面,核酸4笨針是SEQIDNO:3的核苷酸67至1185。在另一個優(yōu)選方面,核酸探針是編碼SEQIDNO:4的多肽的多核苦酸序列,或其亞序列。在另一個優(yōu)選方面,核酸探針是SEQIDNO:3。在另一個優(yōu)選方面,核酸探針是包含在大腸桿菌CE.co//)NRRLB-30902中的質粒pCIC161中含有的多核苷酸序列,其中所述其多核苷酸序列編碼具有內(nèi)切葡聚糖酶活性的多肽。在另一個優(yōu)選方面,核酸探針是包含在大腸桿菌NRRLB-30902中的質粒pCIC161中含有的成熟多肽編碼序列區(qū)域。在另一個優(yōu)選的方面,核酸探針是SEQIDNO:5的成熟多肽編碼序列。在另一個優(yōu)選方面,核酸探針是SEQIDNO:5的核苷酸84至1229。在另一個優(yōu)選方面,核酸探針是編碼SEQIDNO:6的多肽的多核苷酸序列,或其亞序列。在另一個優(yōu)選方面,核酸探針是SEQIDNO:5。在另一個優(yōu)選方面,核酸探針是包含在大腸桿菌NRRLB-30903中的質粒pCIC453中含有的多核苷酸序列,其中所述其多核苷酸序列編碼具有內(nèi)切葡聚糖酶活性的多肽。在另一個優(yōu)選方面,核酸探針是包含在大腸桿菌NRRLB-30903中的質粒pCIC453中含有的成熟多肽編碼區(qū)。在另一個優(yōu)選的方面,核酸探針是SEQIDNO:7的成熟多肽編碼序列。在另一個優(yōu)選方面,核酸探針是SEQIDNO:7的核苷酸77至1300。在另一個優(yōu)選方面,核酸探針是編碼SEQIDNO:8的多肽的多核普酸序列,或其亞序列。在另一個優(yōu)選方面,核酸探針是SEQIDNO:7。在另一個優(yōu)選方面,核酸探針是包含在大腸桿菌NRRLB-30904中的質粒pCIC486中含有的多核苷酸序列,其中所述其多核苷酸序列編碼具有內(nèi)切葡聚糖酶活性的多肽。在另一個優(yōu)選方面,核酸探針是包含在大腸桿菌NRRLB-30904中的質粒p(〕IC486中含有的成熟多肽編碼區(qū)。在另一個優(yōu)選的方面,核S吏探針是SEQIDNO:9的成熟多肽編碼序列。在另一個優(yōu)選方面,核酸探針是SEQIDNO:9的核苷酸73至1468。在另一個優(yōu)選方面,核酸探針是編碼SEQIDNO:10的多肽的多核香酸序列,或其亞序列。在另一個優(yōu)選方面,核酸探針是SEQIDNO:9。在另一個優(yōu)選方面,核酸探針是包含在大腸桿菌NRRLB-30900N中的質粒pPBCel5C中含有的多核苷酸序列,其中所述其多核苦酸序列編碼具有內(nèi)切葡聚糖酶活性的多肽。在另一個優(yōu)選方面,核酸探針是包含在大腸桿菌NRRLB-30900N中的質粒pPBCel5C中含有的成熟多肽編碼區(qū)。對于長度至少100個核苷酸的長探針,將非常低至非常高的嚴緊條件定義為在42°C,在5XSSPE、0.3%SDS、200|ig/ml已剪切并且變性的鮭精DNA中,并且對于非常低和低嚴緊性為25%的曱酰胺、對于中和中-高嚴緊性為35%的曱酰胺、或對于高和非常高嚴緊性為50%的曱酰胺,根據(jù)標準的Southern印跡法進行預雜交和雜交最佳12至24小時。對于長度為至少100個核苷酸的長探針,使用2XSSC、0.2%SDS優(yōu)選至少在45。C(非常低嚴緊性),更優(yōu)選至少在50。C(低嚴緊性),更優(yōu)選至少在55。C(中嚴緊性),更優(yōu)選至少在60°C(中-高嚴緊性),甚至更優(yōu)選至少在65°C(高嚴緊性),并且最優(yōu)選至少在70。C(非常高嚴緊性)將載體材料最終洗滌三次,每次15分鐘。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將嚴緊條件定義為在比才艮才居Bolton和McCarthy計算法(1962,Praceed/"g^o/AeA^f/o"a//lca&m少o/&/e"cey48:1390)得出的Tm低大約5°C至大約10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,1xDenhardt溶液,1mM焦、石粦西殳4內(nèi)(sodiumpyrophosphate),1mM石粦酉l二氬4內(nèi)(sodiummonobasicphosphate),0.1mMATP和0.2mg每ml的酵母RNA中,根據(jù)標準的Southern印跡步驟進行預雜交、雜交和雜交后洗滌最佳12至24小時。對于長度大約15個核苷酸至大約70個核苷酸的短探針,將所述載體材料在6xSSC力口0.1%SDS中洗滌一次15分鐘,并用6xSSC在比計算的Tm低5°C至10°C的溫度洗滌兩次,每次15分鐘。在第三個方面,本發(fā)明涉及由包含核苷酸序列或由核苷酸序列組成的多核苷酸編碼的分離的多肽,所述核苷酸序列與SEQIDNO:3、SEQIDNO:5、Sh:QIDNO:7或SEQIDNO:9的成熟多肽編碼序列具有至少60%,優(yōu)選至少65%,更優(yōu)選至少70%,更優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85%,更優(yōu)選至少90%,甚至更優(yōu)選至少95%,并且甚至優(yōu)選至少97%同一性的同一性程度,其編碼活性多肽。在優(yōu)選方面,所述成熟多肽編碼序列是SEQIDNO:3的核普酸67至1185。在另一個優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:5的核苷酸84至1229。在另一個優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:7的核苷酸77至1300。在另一個優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:9的核香酸73至1468。參見本文的多核苷酸部分。在第四個方面,本發(fā)明涉及人工變體,所述人工變體包含取代、缺失和/或插入一個或幾個氨基酸的SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或Sh:QIDNO:10的成熟多肽;或其同源序列。優(yōu)選地,氨基酸改變對性質是較不重要的(ofaminornature),即保守的氨基酸取代或插入,其不顯著影響蛋白質的折疊和/或活性;通常為1至大約30個氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端曱硫氨酸殘基;多至大約20-25個殘基的小接頭肽;或通過改變凈電荷或其它功能來促進純化的小延伸,如多組氨酸序列(polyhistidinetract)、^ty^表4立(antigenieepitope)或纟吉合i或(bindingdomain)。保守取代的實例是在以下組之內(nèi)堿性氨基酸組(精氨酸、賴氨酸和組氨酸)、酸性氨基酸組(谷氨酸和天冬氨酸)、極性氨基酸組(谷氨酰胺和天冬酰胺)、疏水性氨基酸組(亮氨酸、異亮氨酸和纈氨酸)、芳族氨基酸組(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸組(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和曱硫氨酸)。通常不改變比活性(specificactivity)的氨基酸取代是本領域已知的,并且由例如H.Neurath和R丄.Hill,1979,于TTzePrate/m,AcademicPress,NewYork中描述。最普遍發(fā)生的交換是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Lcu/Ile、Lcu/Val、Ala/Glu和Asp/Gly。除了20個基本氨基酸,非基本氨基酸(例如4-羥脯氨酸、6-W-曱基賴氨酸、2-氨基異丁酸、異纈氨酸和a-甲基絲氨酸)可以取代野生型多肽的氨基酸殘基。有限數(shù)量的非保守氨基酸、不由遺傳密碼編碼的氨基酸和非天然氨基酸可以取代氨基酸殘基。"非天然氨基酸,,在蛋白質合成后已經(jīng)過修飾,和/或在它們的側鏈具有不同于基本氨基酸的化學結構。非天然氨基酸能夠以化學方法合成,并且優(yōu)選是商業(yè)上能夠獲得的,包括六氫吡啶羧酸(pipecolicacid)、,塞唑烷羧酸(thiazolidinecarboxylicacid)、脫氬脯氨酸、3-和4-曱基脯氨酸,和3,3-二曱基脯氨酸。可供選擇的是,氨基酸改變具有這樣的性質以使多肽的物理化學性質改變。例如,氨基酸改變可改進多肽的熱穩(wěn)定性,改變底物特異性,改變最適pll等。能夠根據(jù)本領域已知的方法,例如定位誘變或丙氨酸分區(qū)誘變法(Cunningham和Wells,1989,5We"ce244:1081-1085)來鑒定親本多肽中的必需氨基酸。在后一技術中,將單一丙氨酸突變引入到分子中的每個殘基,并且測試所得突變分子的生物活性(即,內(nèi)切葡聚糖酶活性)以鑒定對于所述分子的活性關鍵的氨基酸殘基。同樣參見Hilton等,1996,JS/o/.C7zew.271:4699-4708。酶的活性部位或其它的生物相互作用也能夠通過結構的物理分析而測定,如通過以下這些技術如核磁共振、晶體學、電子衍射或光親和標記,連同推定的接觸位點氨基酸的突變來測定。參見例如deVos等,1992,5We"ce255:306-312;Smith等,1992,/7Wo/.S/o/.224:899-904;Wlodaver等,1992,,HS丄e".309:59-64。必需氨基酸的同一性也能夠從與多肽的同一性分析來推斷,所述多肽與根據(jù)本發(fā)明的多肽相關。能夠使用已知的誘變、重組和/或改組(shuffling)方法,然后是有關的篩選方法,例如那些由Reidhaar-Olson和Sauer,1988,&&歸241:53-57;Bowie和Sauer,1989,尸rac.AW/.爿cadSW."&486:2152-2156;WO95/17413;或WO95/22625公開的那些方法來進行并測試單個或多個氨基酸取代。能夠使用的其它方法包括易錯PCR、噬菌體展示(例如,Lowman等,1991,A》c/ze附.30:10832-10837;美國專利號5,223,409;WO92/06204)和區(qū)域定向的誘變(Derbyshire等,1986,46:145;Ner等,1988,D7VJ7:127)。誘變/改組方法能夠與高通量、自動化的篩選方法組合以檢測由宿主細胞表達的克隆的、誘變的多肽的活性(Ness等,1999,A^we所otec/z"o/ogy17:893-896)。能夠從宿主細胞回收編碼活性多肽的誘變的DNA分子,并且使用本領域內(nèi)標準方法快速測序。這些方法允許快速測定感興趣的多肽中單個氨基酸殘基的重要性,并且能夠應用于未知結構的多肽。SEQII)NO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽,如SEQIDNO:2的氨基酸17至389、SEQIDNO:6的氨基酸16至397、S1<:QIDNO:8的氨基酸22至429,或SEQIDNO:10的氨基酸25至421的氨基酸取代、缺失和/或插入的總數(shù)是10,優(yōu)選9,更優(yōu)選8,更優(yōu)選7,更優(yōu)選至多6,更優(yōu)選5,更優(yōu)選4,甚至更優(yōu)選3,最優(yōu)選2,并且甚至最優(yōu)選l。具有內(nèi)切葡聚糖酶活性的多肽的來源本發(fā)明的多肽可以獲得自任何屬的微生物。就本發(fā)明而言,用于本文與給定的來源有關的術語"獲得自",意思是核芬酸序列編碼的多肽由所述來源產(chǎn)生,或由其中插入了來自所述來源的核苷酸序列的菌抹產(chǎn)生。在優(yōu)選的方面,獲得自給定來源的多肽是胞外分泌的。本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽可以是細菌多肽。例如,所述多肽可以是革蘭氏陽性細菌多肽例如芽孢桿菌屬C6a"7/m力、鏈球菌屬(5"/r一。cocn)、鏈審菌屬(iSy尸e/7/o"cas)、葡萄球菌屬(5y,/^/ococcws)、腸球菌屬(/二V7feracoccus1)、乳酉交菌屬(Xacto6ac/〃i^)、專'LJ求菌屬(丄actococcz^)、沖炎菌屬(C7aWW(i/Mm)、Geo6ac/〃w或(9ceawo6fl"7/ws多肽,所述多肽具有[酶]活性;或革蘭氏陰性細菌多肽,如大腸桿菌(五.co//)、假單胞菌(尸化MJowo"a力、沙門氏菌(&;/mo"e〃a)、彎曲桿菌屬(Cawpy/o6ac/er)、螺#干菌(/^//<^^""^)、黃桿菌眉7(/7avo6"cten'mw)、才炎牙干菌屬(FMTOZwcte〃'm附)、;尼才干菌屬(7/少o6"cter)、奈瑟氏菌屬(A^Men'a)或脲原體屬(t/w,/ayma)屬多肽,其具有內(nèi)切葡聚糖酶活性。在優(yōu)選方面,所述多肽是嗜堿芽孢桿菌(^7c/〃Ma儀a/o;Mw)、解淀粉芽孑包4干菌(Zflc/〃w5o/w_y/o//wey^c/era)、4豆芽孑包^干菌(Sac/〃ms6rev/s)、玉不^)大芽孑包4干菌(/ad〃Mscz>cw/ara)、克勞氏芽孑包沖干菌CBac/〃船c/a附//)、)疑結芽孑包才干菌(/^3c/〃ic'oagw/om')、堅強芽孑包才干菌(5ac/〃1^,/-附^0、火山'爛芽孑包一干菌C6ac/〃iM、/aw/仏"、遲纟爰芽孑包才干菌(Sac/〃ws/ewfw力、i也衣芽孑包4干菌(5ac/〃ws//c/zemyb廠m/力、巨大芽孑包4干菌(/"c/〃ms、4豆小芽孑包4干菌(^3c/〃ms/mw//1^)、口耆熱月旨/沐芽孑包4干菌(5ac/〃wWeflraf/zerwop/n7船)、一古草芽孑包4干菌(5ac/〃船m6/77/力或蘇云金芽孢桿菌(5ac/〃Mf/7wr/"g/m^)具有內(nèi)切葡聚糖酶活性的多肽。在另一個優(yōu)選的方面,所述多肽是具有內(nèi)切葡聚糖酶活性的似馬鏈球菌(iS/廠e/toC(9ccw5e《w/w7w7/力、酉良膿M^求菌(5^e/tococc^/_yogewe5)、享L房纟連;求菌(&,tococcw51M6er/力或馬鏈球菌獸瘋亞種(浙eptococcwse,'subsp.Zooe//cfe/w'ci^)多肽。在另一個優(yōu)選的方面,所述多肽是不產(chǎn)色鏈霉菌(5^印tomyc"ac/zra附oge"e力、阿維鏈霉菌(5^eptowyceym^e環(huán)/"'to)、天藍鏈霉菌(》eptom;;cescoe//co/—、灰色鏈霉菌(浙印to考cesgn'se—或淺青紫鏈霉菌(浙e/to,ces//vWara)多肽,其具有內(nèi)切葡聚糖酶活性。本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽也可以是真菌多肽,并且更優(yōu)選酵母多肽如念珠菌屬(Cam^/fl)、克魯維酵母屬(A7M"erawycM)、畢赤酵母屬(/)/'c/7/'o)、酵母屬(&cc/70To附y(tǒng)ce力、裂殖酵母屬(;Sc/n'zaacc/7araw^ycas)或西洋蓍霉屬()^row/a)多肽,其具有內(nèi)切葡聚糖酶活性;或更優(yōu)選絲狀真菌多肽如枝丁貞孑包-霉屬(v4cremom'izm)、曲霉屬(y^/erg7'〃w力、鄉(xiāng)豆才更霉屬(/^06057'^"7)、金孑包子菌眉3(C72/7^osp9n'i/m)、隱3求菌屬(CV7/toc0ccMS)、F/Z/6aw'(i/ww、鐮孑包屬(/^"a;n'M附)、腐質審屬(Z/w附/co/a)、梨孑包菌屬(A/agwapor^ze)、毛審屬(7Wwcor)、毀絲霉屬(綺ce/fe/7似/wra)、新考瑪脂霉屬(A^c"〃/w"幼:x)、3永孢菌屬(/Vewra^pora)、擬青霉屬(尸ae"7o附少ces)、青霉屬(戶em'c/'〃z'Mm)、瘤胃壺菌屬(P/ramycas1)、裂褶菌屬(iSc/7/zop/zy〃M附)、3果節(jié)菌屬(ra/aramyc&s1)、熱子嚢菌屬(777&rmo(XS'cw力、斗復孑包殼屬(77z/e/aWa)、彎頸霉屬(7b(y/oc/aWwm)或木霉屬(7Wc/7Werwfl)多肽,其具有內(nèi)切葡聚糖酶活性。在優(yōu)選的方面,所述多肽是卡爾酵母(5"acc/wrawycesrarAs6ergera/s)、酉良酒酵母(^acc/2ara附y(tǒng)cescerev/s/ae)、4唐l"匕酵母()5"acc/zan9,"yces1c//as"to"'CM"、道才各拉氏酵母《Sb6'c'/ara",^y^/c>wg/a7)、克魯弗酵母(S"cc/2"ra,ce5A:—ver/)、諾地酵母(&cc/zar簡少ces1worZms7'力或卵開j酵母(&cc/2(2ram少cesovi/b環(huán)&)多肽,其具有內(nèi)切葡聚糖酶活性。在另外的優(yōu)選方面,所述多肽是棘孢曲霉(7^/^^///^acM/eafw力、泡盛曲霉(As^erg/〃z^a而附on')、煙曲霉(A/3ergz7/us^m/g(3加)、臭曲霉(y^e尸g7.〃M5./W油s)、日本曲霉(/l5/^g7'〃w^s7'opo"/"")、構巢曲霉(y^/^g7'〃us油/"—、黑曲審(/^perg/〃us、米曲審(y^/erg7'〃w《、口耆角質金孑包子菌(C77r>was/7or/wwAera!/7'"c>/3/2//ww)、C/zr_)Asas/on'ww/wcA^cwem^e,熱帶金孑包子菌祖金孑包子菌(C/w》wcw7on.ww/%wm'co/<3)、C7w"j^as7or/wmgweera/awcZ/cww、Orj^cw/wn'MW、4干孑包a犬嫌孑包(Ft^an'wm6acfnWozVie)、禾谷嫌孑包(,,Msan'wmc'erea/Z力、/牟威嫌孑包(Fwsan'wwcrao^we〃e"se)、大刀嫌孑包(Fwsarz'wmc'w/mo廠wm)、禾本一牛嫌3包(^Fksan-"mgramz.wearMm)、禾赤嫌孑包(尸Msan'wmgrcm/"wm)、異孑包嫌孑包(/^sar/M附/7gfera577。rw附)、合?欠木嫌孑包(尸w^"n'w附wegw7(i/〕、尖嫌孑包(Fw5an'w附(Xvys/onw7)、多4支嫌孑包(Fi^"n'wmrefew/a/ww)、4分纟工鐮孑包(Fwsan'MWroew附)、才妾骨木鐮孑包(Fwsar/wwsof附6wc/"ww)、月夫色鐮孑包(Fwran-wmsarcoc/zrowm)、4以分4支孑包鐮孑包(Fwsa"'ww5poraWc/n'o/tfes)、石危色鐮孑包(f"ky",/w附5M/z/we蘭)、圓嫌孑包(Fu^n'應torw/osw附)、擬絲孑包嫌孑包(Fusflr/wm/Wc/7c^/zec/ozV/as1)、《裏片鐮孑包(Fwsan'wmvewewafww)、特異腐質霉(//wm/co/a/m'o/e"力、發(fā)i;才帛^l犬腐質霉(77w附Zco/a/owMg7'"cw2)、米黑毛霉(Mwcwm/e/ze/)、口耆熱毀絲霉(Afyce/—楊。raf/zer附o/Mi3)、粗模脈孑包菌(A^wms戶ra、T72/e/av/a/erwv/朋(3、77z/e/avfas/e(ie(io"/膽、毛梭孑包殼(77n.e/"W"setora)、77n'e/av/(3sw6/'/7e;7wo/7/H7a、土生才炎孑包審(777/e/av/(2ferre5tr/力、哈茨木審(7Hc/zofifermi3/zorz/flww附)、康于木零(7Hc/70t^rwaA:o"/wg//)、長沖支木審(7>/c/zc(ierma/owgi/^ac/n'afwm)、里氏木審(7Hc/20(ie/-wareese/)或纟錄色木審(7WAoAwwWr/afe)多肽,其具有內(nèi)切葡聚糖酶活性。在另外的優(yōu)選方面,所述多肽是巴西青霉、沙門柏干酪青霉(/^m'c/〃/wwc(3memZer"/)、月交嚢青霉(尸e77/c〖〃/wwc"/wm/"/^附)、產(chǎn)黃青霉(尸em'c/〃,Mmc/7,ogew讓)、尸ew,".〃〖訓"?ra9mgr訓、枯青審(Pem'c遊"附c"n'w聽)、棒形青'霉(尸em,c7,〃/Mmc/avzybr附e)、了貞青霉(戶e/7/c〃/Zwmco/^/opAZ/ww)、皮落青霉(Pe"z,c/〃/wmc廠MWai/w)、才旨卄大青霉(Pew.c/〃/wmd/g7.tofw附)、Pew'"'〃/w附ex/(37Mwm>Pe"/c/〃z,Mw/^7/cM/osM附、平)骨青霉(戶ew'cz'〃/Mmg/a6rwm)、jfei;l犬青霉(/)(//c'/〃/m/wg/YWiz/a/w/w)、灰黃青霉(Pewz'c/〃/wwgWseo/w/vwm)、島青霉(尸ew/c/〃/'zw7z:s7m(^cw附)、意大矛J青霉CPew/c/〃/ww/to//cww)、^汰紫青霉(尸em'c/〃/:M/i./cmf/nVze〃Mm)、4§色青霉(Pem.c〃/〖MW/〖v〖ciMm)、大孑包青霉(Pem'c〖〃Zw"7附egasp。r'm附)、對每4木青霉(戶e"/c/肌MW/we//"http://)、凈+異青霉(尸e"/"'〃/〃附"oto/M附)、草酸青霉CPe"/c/〃/wwoxa//cww)、軟毛青霉(尸em'c/〃/ww/M&n//ww)、變紫青霉(尸em'c/〃/ww7pMrpwmsx'em1)、產(chǎn)紫青霉(Pem'c,〃/wm/w77wragewwm)、婁i也青霉(/)em'c/〃/wmra《Me^W")、鈹福7青霉(尸emW〃/wwrwg^/owm)、小刺青霉(/)em.c/,〃/wwat/"m/o5ww)、瓦克曼青霉(尸em.c/〃/www"fom"m7)或青霉屬菌種多肽,其具有內(nèi)切葡聚糖酶活性。在更優(yōu)選的方面,所述多肽是嗜熱毀絲霉(Myce"op/^oraf/zemK;/n7a)多肽,并且最優(yōu)選嗜熱毀絲霉CBS111.65多肽,例如SEQIDNO:4的多肽,或其成熟多肽。在另一個更優(yōu)選的方面,所述多肽是擔子菌CBS495.95多肽,例如SEQIDNO:6的多肽,或其成熟多肽。在另一個更優(yōu)選的方面,所述多肽是擔子菌CBS494.95多肽,例如SEQIDNO:8的多肽,或其成熟多肽。在另一個更優(yōu)選的方面,所述多肽是巴西青霉多肽,并且最優(yōu)選巴西青霉1BT20888多肽,例如SEQIDNO:10的多肽或其成熟多肽??衫斫獾氖菍τ谇笆龅姆N,本發(fā)明包含完全和不完全階段(perfectandimperfectstates),和其它分類學的等同物(equivalent),例長口無'l"生型(anamorph),而無論它們已知的種名。本領域熟練技術人員將容易地識別適合的等同物的同一性。這些種的菌株在許多培養(yǎng)物保藏中心對于公眾能夠容易地取得,所述保藏中心諸如美國典型培養(yǎng)物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和細胞培養(yǎng)物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌種保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和農(nóng)業(yè)研究機構專利培養(yǎng)物保藏中心北區(qū)》開究中'"(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探針從其它來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物鑒定和獲得這些多肽。用于從天然生境(habitat)分離微生物的技術是本領域內(nèi)公知的。隨后可通過相似地篩選這種微生物的基因組或cDNA文庫來獲得所述多核苷酸。一旦用所述探針檢測到編碼多肽的多核苷酸序列,就能夠使用本領域普通技術人員熟知的技術將所述多核芬酸分離或克隆(參見,例如,Sambrook等,1989,見上文)。本發(fā)明的多肽還包括融合多肽或可切割的融合多肽,其中將另外的多肽融合到所述多肽或其片段的N末端或C末端。通過將編碼另一個多肽的核芬酸序列(或其部分)融合于本發(fā)明的核苷酸序列(或其部分)來產(chǎn)生融合的多肽。產(chǎn)生融合多肽的技術是本領域已知的,并包括連接編碼多肽的編碼序列以使它們在閱讀框中,并且使融合多肽的表達在相同啟動子和終止子的控制下。融合多肽還可以包括切割位點。一旦分泌了融合多肽,就切割所述位點,從融合蛋白質釋放具有內(nèi)切葡聚糖酶活性的多肽。切割位點的實例包括,但不限于,編碼二肽Lys-Arg的Kex2位點(Martin等,2003,嵐Mc油'o/.腸tec/mo/.3:568-76;Svetina等,2000,J腸tec/mo/.76:245-251;Rasmussen-Wilson等,1997,五謂'raw,Mcra&'o/.63:3488-3493;Ward等,1995,所otec/z"o/ogy13:498-503;和Contreras等,1991,歷ofec/z"o/ogF9:378-381);Ile-(Glu或Asp)-Gly-Arg位點,其在精氨酸殘基后通過FactorXa蛋白酶切割(Eaton等,1986,5/oc/^m.25:505-512);Asp-Asp-Asp-Asp陽Lysj立點,其在賴氨酉交后通過腸;敫酶"t刀割(Collins-Racie等,〗995,歷ofec/zw/ogy13:982-987);His-Tyr-Glu位點或His-Tyr-Asp位點,其通過GenenaseI切害寸(Carter等,1989,Prafe/mv^S^wc/^re,/^""/o","<i6:240-248);Leu-Val-Pro-Arg-Gly-Ser位點,其在Arg后通過凝血酶切割(Stevens,2003,/>wgD/"ove^yfforW4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位點,其在Gin后通過TEV蛋白酶切割(Stevens,2003,見上文);和Lcu-Glu-Val-Leu-Phe-Gln-Gly-Pro位點,其在Gin后通過基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,見上文)。多核苷酸本發(fā)明還涉及分離的多核苷酸,其包含編碼本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽的核香酸序列,或由編碼本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽的核芬酸序列組成。在優(yōu)選的方面,核苷酸序列包含SEQIDNO:3或由SEQIDNO:3組成。在另一個更優(yōu)選的方面,核苷酸序列包含大腸桿菌NRRLB-30902中所含質粒pCIC161中所含的序歹'j,或由大腸桿菌NRRLB-30902中所含質粒pCIC161中所含的序列組成。在另一個優(yōu)選方面,核苷酸序列包含SEQIDNO:3的成熟多肽編碼區(qū)或由SEQIDNO:3的成熟多肽編碼區(qū)組成。在另一個優(yōu)選方面,核苷酸序列包含SEQIDNO:3的核苷酸67至1185或由SEQIDNO:3的核苦酸67至1185組成。在另一個更優(yōu)選的方面,核苷酸序列包含大腸桿菌NRRLB-30902中所含質粒pCIC161中所含的成熟多肽編碼區(qū)或由大腸桿菌NRRLB-30902中所含質粒pCIC161中所含的成熟多肽編碼區(qū)組成。本發(fā)明還包含編碼多肽的核苷酸序列,所述多肽包含SEQIDNO:4的氨基酸序列或其成熟多肽,或由SEQIDNO:4的氨基酸序列或其成熟多肽組成;由于遺傳密碼的簡并性,所述核苷酸序列不同于SEQIDNO:3或其成熟多肽編碼序列。本發(fā)明還涉及SEQIDNO:3的亞序列,所述亞序列編碼具有內(nèi)切葡聚糖酶活性的SEQIDNO:4的片段。在另一個優(yōu)選的方面,核苷酸序列包含SEQIDNO:5或由SEQIDNO:5組成。在另一個更優(yōu)選的方面,核苷酸序列包含大腸桿菌NRRLB-30903中所含質粒pCIC453中所含的序列,或由大腸桿菌NRRLB-30903中所含質粒pCIC453中所含的序列組成。在另一個優(yōu)選方面,核苷S臾序列包含SEQIDNO:5的成熟多肽編碼區(qū)或由SEQIDNO:5的成熟多肽編碼區(qū)組成。在另一個伊乙選方面,核苷酸序列包含SEQIDNO:5的核苷酸84至1229或由SEQIDNO:5的核香酸84至1229組成。在另一個更優(yōu)選的方面,核香^^序列包含大腸桿菌NRRLB-30903中所含質粒pCIC453中所含的成熟多肽編碼區(qū)或由大腸桿菌NRRLB-30903中所含質粒pCIC453中所含的成熟多肽編碼區(qū)組成。本發(fā)明還包含編碼多肽的核苷酸序列,所述多肽包含SEQIDNO:6的氨基酸序列或其成熟多肽,或由SEQIDNO:6的氨基酸序列或其成熟多肽組成;由于遺傳密碼的簡并性,所述核香酸序列不同于SEQIDNO:5或其成熟多肽編碼序列。本發(fā)明還涉及SEQIDNO:5的亞序列,所述亞序列編碼具有內(nèi)切葡聚糖酶活性的SEQIDNO:6的片段。在另一個優(yōu)選的方面,核苷酸序列包含SEQIDNO:7或由SEQIDNO:7組成。在另一個更優(yōu)選的方面,核苷酸序列包含大腸桿菌NRRLB-30904中所含質粒pCIC486中所含的序列,或由大腸桿菌NRRLB-30卯4中所含質粒pClC486中所含的序列組成。在另一個優(yōu)選方面,核苷酸序列包含SEQIDNO:7的成熟多肽編碼區(qū)或由SEQIDNO:7的成熟多肽編碼區(qū)組成。在另一個優(yōu)選方面,核苦酸序列包含SEQIDNO:7的核普酸77至1300或由SEQIDNO:7的核芬酸77至1300組成。在另一個更優(yōu)選的方面,核苷酸序列包含大腸桿菌NRRLB-30904中所含質粒pCIC486中所含的成熟多肽編碼區(qū)或由大腸桿菌NRRLB-30卯4中所含質粒pCIC486中所含的成熟多肽編碼區(qū)組成。本發(fā)明還包含編碼多肽的核苷酸序列,所述多肽包含SEQIDNO:8的氨基酸序列或其成熟多肽,或由SEQIDNO:8的氨基酸序列或其成熟多肽組成;由于遺傳密碼的簡并性,所述核苷酸序列不同于SEQIDNO:7或其成熟多肽編碼序列。本發(fā)明還涉及SEQIDNO:7的亞序列,所述亞序列編碼具有內(nèi)切葡聚糖酶活性的SEQIDNO:8的片段。在另一個優(yōu)選的方面,核苷酸序列包含SEQIDNO:9或由SEQIDNO:9組成。在另一個更優(yōu)選的方面,核芬酸序列包含大腸桿菌NRRLB-30900N中所含質粒pPBCel5C中所含的序列,或由大腸桿菌NRRLB-30900N中所含質粒pPBCel5C中所含的序列組成。在另一個優(yōu)選方面,核芬酸序列包含SEQIDNO:9的成熟多肽編碼區(qū)或由SEQIDNO:9的成熟多肽編碼區(qū)組成。在另一個優(yōu)選方面,核苷酸序列包含SEQIDNO:9的核苷酸73至1468或由SEQIDNO:9的核苷酸73至1468組成。在另一個更優(yōu)選的方面,核香酸序列包含大腸桿菌NRRLB-30900N中所含質粒pPBCel5C中所含的成熟多肽編石馬區(qū)或由大腸桿菌NRRLB-30900N中所含質粒pPBCel5C中所含的成熟多肽編碼區(qū)組成。本發(fā)明還包含編碼多肽的核苷酸序列,所述多肽包含SEQIDNO:10的氨基酸序列或其成熟多肽,或由SEQIDNO:10的氨基酸序列或其成熟多肽組成;由于遺傳密碼的簡并性,所述核苷酸序列不同于SEQIDNO:9或其成熟多肽編碼序列。本發(fā)明還涉及SEQIDNO:9的亞序列,所述亞序列編碼具有內(nèi)切葡聚糖酶活性的SEQIDNO:10的片段。本發(fā)明還涉及突變多核苷酸,所迷突變多核苷酸在SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列中包含至少一個突變,或由在SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列中具有至少一個突變的核苷酸組成,其中所述突變核苷酸序列編碼SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽。在優(yōu)選的方面,所述成熟多肽是SEQIDNO:4的氨基酸17至389。在另一個優(yōu)選的方面,所述成熟多肽是SEQIDNO:6的氨基酸16至397。在另一個優(yōu)選的方面,所述成熟多肽是SEQIDNO:8的氨基酸22至429。在另一個優(yōu)選的方面,所述成熟多肽是SEQIDNO:10的氨基酸25至421。用于分離或克隆編碼多肽的多核苷酸的技術是本領域內(nèi)已知的,包括從基因組DNA分離,從cDNA制備,或其組合??赏ㄟ^例如使用熟知的聚合DNA片段,從而實現(xiàn)從這種基因組DNA克隆本發(fā)明的多核苷酸。參見,例im,Innis等,1990,尸C7.'爿G"w/<ietoMef/zcxiw<i^4/7/9/&"http://0",AcademicPress,NcwYork??梢允褂闷渌怂釘U增方法,如連接酶鏈式反應(LCR)、連接活化轉錄(ligatedactivatedtranscription;LAT)和基于核苷酸序列的擴增(NASBA)??梢詮氖葻釟Ыz霉CBS117.65、擔子菌CBS494.95或擔子菌CBS495.95菌抹,或其它或相關生物體克隆多核苷酸,并且因此可以是例如所述核苷酸序列的多肽編碼區(qū)的等位基因變體或種變體(speciesvariant)。本發(fā)明還涉及包含核苷酸序列或由核苷酸序列組成的分離的多核苦酸,所迷核苷酸序列與SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列具有至少60%,優(yōu)選至少65%,更l尤選至少70%,更優(yōu)選至少75%,更優(yōu)選至少80%,更優(yōu)選至少85°/。,更優(yōu)選至少90%,甚至更優(yōu)選至少95%,并且最優(yōu)選至少97%同一性的同一性程度,其編碼活性多肽。在優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:3的核香酸67至1185。在另一個優(yōu)選的方面,所迷成熟多肽編碼序列是SEQIDNO:5的核普酸84至1229。另一個優(yōu)選的方面,所述成熟多肽編碼序列是SEQIDNO:7的核苷酸77至1300。另一個優(yōu)選的方面,所述成熟多肽編石馬序列是SEQIDNO:9的核苷酸73至1468。修飾編碼本發(fā)明多肽的核苷酸序列對于合成與所述多肽基本上相似的多肽可為必需的。術語與所述多肽"基本上相似"指多肽的非天然存在的形式。這些多肽可能以一些工程改造的方式而不同于,人其天然來源分離的多肽,例如,比活性、熱穩(wěn)定性、最適pH等方面不同的人工變體??梢栽谧鳛镾EQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的多肽編碼區(qū)存在的核苷酸序列,例如其亞序列的基礎上,和/或通過引入如下核苷酸取代來構建變體序列所述取代不產(chǎn)生由核苷酸序列編碼的多肽的另外的氨基酸序列,但是符合意欲產(chǎn)生酶的宿主生物體的密碼子選擇;或者所述取代可產(chǎn)生不同的氨基酸序列。關于核苷酸取代的概述,參見,例如,F(xiàn)ord等,1991,/ix/pmw/w/W折ca/z'cw2:95-107。對于本領域技術人員顯而易見的是,這些取代能夠在對于分子功能重要的區(qū)域之外進行,并且仍然產(chǎn)生活性多肽。對于由本發(fā)明的分離的多核苷酸編碼的多肽活性關鍵的并且因此優(yōu)選不進行取代的氨基酸殘基,可以根據(jù)本領域公知的方法,例如定位誘變或丙氨酸分區(qū)i秀變法(參見,例如,Cunningham和Wells,1989,見上文)來鑒定。在后一技術中,將突變引入到分子中的每個荷正電的殘基處,并且測試所得突變分子的內(nèi)切葡聚糖酶活性,以鑒定對于所述分子的活性關鍵的氨基酸殘基。底物-酶相互作用的4立點也能夠通過分析三維結構測定,通過如核磁共振分析、晶體學或光親和標記這樣的技術來測定(參見,例如,deVos等,1992,見上文;Smith等,1992,見上文;Wlodaver等,1992,見上文)。本發(fā)明還涉及編碼本發(fā)明多肽的分離的多核苷酸,所述分離的多核苷酸在非常低嚴緊條件下,優(yōu)選低嚴緊條件,更優(yōu)選中等嚴緊條件,更優(yōu)選中-高嚴緊條件,甚至更優(yōu)選高嚴緊條件,并且最優(yōu)選非常高的嚴緊條ff下,與以下序列雜交(i)SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列,(ii)包含于SEQIDNO:3或SEQIDNO:9的成熟多肽編碼序列中的cDNA序列或包含SEQIDNO:5或SEQIDNO:7的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的互補鏈;或它們的等位變體和亞序列(Sambrook等,1989,見上文),如本文所定義的。在優(yōu)選的方面,SEQIDN():3的所述成熟多肽編碼序列是核苷酸67至1185。在另一個優(yōu)選的方面,SP:QIDNO:5的所述成熟多肽編碼序列是核苷酸84至1229。在另一個優(yōu)選的方面,SEQIDNO:7的所述成熟多肽編碼序列是核苷酸77至1300。在另一個優(yōu)選的方面,SEQIDNO:9的所述成熟多肽編碼序列是核香酸73至768。本發(fā)明還涉及分離的多核苷酸,所述分離的多核苷酸通過以下方法獲得(a)在非常低、低、中、中-高、高或非常高嚴緊條件下,將DNA的群體與以下序列雜交(i)SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列,(ii)包含于SEQIDNO:3或SEQIDNO:9的成熟多肽編碼序列中的cDNA序列或包含SEQIDNO:5或SEQIDNO:7的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的互補鏈;和(b)分離雜交的多核苷酸,其編碼具有內(nèi)切葡聚糖酶活性的多肽。在優(yōu)選的方面,SEQIDNO:3的所述成熟多肽編碼序列是核苷酸67至1185。在另一個優(yōu)選的方面,SEQIDNO:5的所述成熟多肽編碼序列是核苷酸84至1229。在另一個優(yōu)選的方面,SEQIDNO:7的所述成熟多肽編碼序列是核苷酸77至1300。在另一個優(yōu)選的方面,SEQIDNO:9的所述成熟多肽編碼序列是核苷酸73至1768。核酸構建體本發(fā)明還涉及包含本發(fā)明的分離的多核苷酸的核酸構建體,所述分離的多核普酸與一個或幾個調(diào)控序列可操作地連4^,所述調(diào)控序列在合適的宿主細胞中在與該調(diào)控序列相容的條件下指導編碼序列的表達。可以用許多方式操作編碼本發(fā)明多肽的分離的多核苷酸以提供多肽的表達。依賴于表達載體,在將多核苷酸的序列插入載體之前對其進行操作可能是理想的或必需的。使用重組DNA方法修飾多核苷酸序列的技術是本領域熟知的。調(diào)控序列可以是適當?shù)膯幼有蛄?,其是由用于表達編碼本發(fā)明多肽的多核苷酸的宿主細胞識別的核苷酸序列。啟動子序列含有介導多肽的表達的轉錄調(diào)控序列。啟動子可以是在所選的宿主細胞中顯示轉錄活性的任何核苦酸序列,包括突變的、截斷的和雜合的啟動子,并且可以乂人編碼與宿主細胞同源或異源的胞外或胞內(nèi)多肽的基因獲得。用于指導本發(fā)明的核酸構建體轉錄,特別是在細菌宿主細胞中轉錄的合適啟動子的實例是從下述獲得的啟動子大腸桿菌/"c操縱子、天藍色鏈霉菌(S^/tow)'ca^/^)瓊脂糖酶基因(^^」)、枯草芽孢桿菌果聚糖蔗糖酶基因(Mc/;)、地衣芽孢桿菌a-淀粉酶基因(a,;丄)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽淀粉酶基因(ow少M)、解淀粉芽孢桿菌a-淀粉酶基因(flwyg)、地衣芽孢桿菌青霉素酶基因(pe"尸)、枯草芽孢桿菌xyM和矽/B基因和原核(3-內(nèi)酰胺酶基因(Villa-Kamaroff等,1978,/V。cgW"g5<//zeAto/o""/^c"de,<5WecasJ75/i75:3727-3731),以及tac啟動子(DeBoer等,1983,尸raceed/"^/7/evVaz/o"a/q/\Sc/e"c&s7&480:21-25)。另外的啟動子在"Usefulproteinsfromrecombinantbacteria"于5We油/c爿wen,c朋,1980,242:74-94中;和在Sambrook等,1989,見上文中描述。用于指導本發(fā)明的核酸構建體在絲狀真菌宿主細胞中轉錄的合適啟動子的實例是從下列酶的基因獲得的啟動子米曲霉TAKA淀粉酶、曼赫根毛霉(W/zi加mwcor/mWe/)天冬氨酸蛋白酶、黑曲霉中性a-淀粉酶、黑曲霉酸穩(wěn)定性a-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(g/"J)、曼赫根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶、構巢曲霉乙酰胺酶、鑲片鐮孢淀粉葡糖苷酶(WO00/56900)、鑲片鐮孢Daria(WO00/56900)、4裏片鐮孑包Quinn(WO00/56900)、尖鐮孢胰蛋白酶樣蛋白酶(WO96/00787)、里氏木霉p-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內(nèi)切葡聚糖酶I、里氏木霉內(nèi)切葡聚糖酶II、里氏木霉內(nèi)切葡聚糖酶III、里氏木霉內(nèi)切葡聚糖酶IV、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉p-木糖苷酶,以及NA2-tpi啟動子(來自黑曲霉中性a-淀粉酶基因和米曲霉丙糖磷酸異構酶基因的啟動子的雜合體);和它們的突變的、截斷的和雜合的啟動子。在酵母宿主中,有用的啟動子從如下酶的基因獲得釀酒酵母烯醇化酶(ENO-l)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母醇脫氬酶/甘油醛-3-磷酸脫氫酶(ADH1,ADH2/GAP)、釀酒酵母丙糖磷酸異構酶(TPI)、釀酒酵母金屬碌,蛋白(CUP1)和釀酒酵母3-磷酸甘油酸激酶。對于酵母宿主細胞其它有用的啟動子由Romanos等,1992,腸W8:423-488描述。調(diào)控序列也可以是合適的轉錄終止子序列,是由宿主細胞識別以終止轉錄的序列。所述終止子序列與編碼所述多肽的核香酸序列的3'末端可操作地連接??梢詫⒃谒x宿主細胞中有功能的任何終止子用在本發(fā)明中。對于絲狀真菌宿主細胞優(yōu)選的終止子從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯曱酸合酶、黑曲霉a-葡糖苷酶和尖鐮孢胰蛋白酶樣蛋白酶。對于酵母宿主細胞優(yōu)選的終止子從如下酶的基因獲得釀酒酵母烯醇化酶、S良酒酵母細胞色素C(CYCl)和釀酒酵母甘油醛-3-磷酸脫氳酶。對于酵母宿主細胞其它有用的終止子由Romanos等,1992,見上文描述。調(diào)控序列還可以是合適的前導序列,其是對于宿主細胞的翻譯重要的mRNA非翻譯區(qū)。前導序列可操作地連接于編碼多肽的核苷酸序列的5,-末端??梢詫⒃谒x宿主細胞中有功能的任何前導序列用在本發(fā)明中。對于絲狀真菌宿主細胞優(yōu)選的前導序列從如下酶的基因獲得米曲霉丁AKA淀粉酶和構巢曲霉丙糖磷酸異構酶。對于酵母宿主細胞合適的前導序列從如下酶的基因獲得釀酒酵母烯醇化酶(ENO-l)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母a因子和釀酒酵母醇脫氬酶/甘油醛-3-磷酸脫氬酶(ADH2/GAP)。調(diào)控序列也可以是聚腺苷酸化序列,其是與核苷酸序列的3'末端可操作地連接的序列,并且在轉錄時,宿主細胞將其識別為信號以將聚腺苷殘基添加至轉錄的mRNA。可以將在所選宿主細胞中有功能的任何聚腺苷酸化序列在本發(fā)明中使用。對于絲狀真菌宿主細胞優(yōu)選的聚腺苷酸化序列從如下酶的基因獲得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯曱酸合酶、尖鐮孢胰蛋白酶樣蛋白酶和黑曲霉a-葡糖苷酶。對于酵母宿主細胞有用的聚腺普酸化序列由Guo和Sherman,1995,A/o/ecw/a,'0//w/w歷o/ogy15:5983-5990描述。調(diào)控序列還可以是信號肽編碼區(qū),其編碼與多肽的氨基末端相連的氨基酸序列,并且指導編碼的多肽進入細胞分泌途徑。核芬酸序列的編碼序列5,端可固有地包含信號肽編碼區(qū),其與編碼分泌多肽的編碼區(qū)片段一起天然地連接在翻譯閱讀框中。可供選擇的是,編碼序列5'端可含有對于所述編碼序列異源的信號肽編碼區(qū)。異源信號肽編碼區(qū)在編碼序列不天然地含有信號肽編碼區(qū)時可為必需的?;蛘撸庠葱盘栯木幋a區(qū)可以簡單地取代天然信號肽編碼區(qū)以增強多肽的分泌。然而,指導表達的多肽進入所選宿主細胞的分泌對于細菌宿主細胞有效的信號肽編碼區(qū)是從如下酶的基因獲得的信號肽編碼區(qū)芽孢桿菌屬NCIB11837產(chǎn)麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌a-淀粉酶、地衣芽孢桿菌枯草蛋白酶(subtilisin)、地衣芽孢桿菌(3-內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(",7;",竭和枯草芽孢桿菌/r^。另外的信號肽由Simonen和Palva,1993,Mt'cra^/o/ogic"/57:109-137描述。對于絲狀真菌宿主細胞有效的信號肽編碼區(qū)是從如下酶的基因獲得的信號肽編碼區(qū)米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特異腐質霉纖維素酶、特異腐質霉內(nèi)切葡聚糖酶V和疏棉狀腐質霉脂肪酶。對于酵母宿主細胞有用的信號肽從釀酒酵母a因子和釀酒酵母轉化酶的基因獲得。其它有用的信號肽編碼區(qū)由Romanos等,1992,見上文描述。在優(yōu)選的方面,信號肽包含SEQIDNO:4的氨基酸1至16,或者由SEQ1DNO:4的氨基酸1至16組成。在另一個優(yōu)選方面,信號肽編碼區(qū)是SEQIDNO:3的核香酸19至69。在另一個優(yōu)選方面,信號肽包含SEQIDNO:6的氨基S交1至15,或者由Sh:QIDNO:6的氨基酸1至15組成。在另一個優(yōu)選方面,信號肽編碼區(qū)包含SQIDNO:5的核苷酸39至83,或者由SEQIDNO:5的核苷酸39至83組成。在另一個優(yōu)選方面,信號肽包含SEQIDNO:8的氨基酸1至21,或者由Sl;QIDNO:8的氨基酸1至21組成。在另一個優(yōu)選方面,信號肽編碼區(qū)包含SEQIDNO:7的核苷酸14至76,或者由SEQIDNO:7的核苷酸14至76組成。在另一個優(yōu)選方面,信號肽包含SEQIDNO:10的氨基酸1至16,或者由SEQIDNO:10的氨基酸1至16組成。在另一個優(yōu)選方面,信號肽編碼區(qū)包含SEQIDNO:9的核苷酸1至48,或者由SEQIDNO:9的核苷酸1至48組成。調(diào)控序列還可以是前肽編碼區(qū),其編碼位于多肽氨基末端的氨基S吏序列。所得多肽稱為酶原(proenzyme)或前多肽(propolypeptide)(或在某些情況下稱為酶原(zymogen))。前多肽通常是無活性的并且能夠通過前肽的催化或自催化切割從前多肽轉化為成熟活性多肽??梢詮目莶菅挎邨U菌^咸性蛋白酶(a/r五)、枯草芽孢桿菌中性蛋白酶(",T)、釀酒酵母ot因子、曼赫根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉漆酶(WO95/33836)的基因獲得前肽編碼區(qū)。在優(yōu)選的方面,前肽包含SEQIDNO:10的氨基酸17至24,或者由SEQl[)NO:10的氨基酸17至24組成。在另一個優(yōu)選方面,前肽編碼區(qū)包含SEQIDNO:9的核苷酸49至72,或者由SEQIDNO:9的核苦酸49至72組成。當信號肽和前肽區(qū)二者均出現(xiàn)在多肽的氨基末端時,將前肽區(qū)置于緊接著(nextto)多肽氨基末端,并且將信號肽區(qū)置于緊接著前肽區(qū)的氨基末端。同樣理想的是添加調(diào)節(jié)序列,其允許相對于宿主細胞的生長來調(diào)節(jié)多肽的表達。調(diào)節(jié)系統(tǒng)的實例是引起基因表達響應化學或物理刺激物,包括調(diào)節(jié)化合物的存在而開啟或關閉的那些系統(tǒng)。原核系統(tǒng)中的調(diào)節(jié)系統(tǒng)包括/ac、toe和/zp操縱基因系統(tǒng)。在酵母中,可以使用ADH2系統(tǒng)或GAL1系統(tǒng)。在絲狀真菌中,可以使用TAKAa-淀粉酶啟動子、黑曲霉葡糖淀粉酶啟動子和來曲霉葡糖淀粉酶啟動子作為調(diào)節(jié)序列。調(diào)節(jié)序列的其它實例是那些允許基因擴增的序列。在真核系統(tǒng)中,這些序列包括在氨曱蝶呤(methotrexate)存在下擴增的二氪葉酸還原酶基因,和以重金屬(w他heavymetal)擴增的金屬硫蛋白基因。在這些情況下,編碼多肽的核苷酸序列將與調(diào)節(jié)序列可操作地連接。表達載體本發(fā)明還涉及重組表達載體,所述重組表達載體包含本發(fā)明的多核苷酸、啟動子和轉錄和翻譯終止信號。本文所述的多種核酸和調(diào)控序列可以結合在一起以產(chǎn)生重組表達載體,所述表達載體可以包括一個或幾個方便的限制位點以允許在這些位點插入或取代編碼多肽的核苷酸序列??晒┻x擇的是,可以通過在適當?shù)挠糜诒磉_的載體中插入包含所述序列的核苷酸序列或核酸構建體來表達本發(fā)明的核苷酸序列。在制備表達栽體的過程中,將編碼序列置于栽體中,從而將該編碼序列與適當?shù)谋磉_調(diào)控序列可操作地連接。重組表達載體可以是任何載體(例如,質?;虿《?,其能夠方便地進行重組DNA步驟,并且能夠產(chǎn)生核苷酸序列的表達。載體的選擇將通常依賴于載體與將引入該載體的宿主細胞的相容性。載體可以是線狀或閉合環(huán)狀質粒。載體可以是自主復制載體,即,作為染色體外實體(entity)存在的載體,其復制獨立于染色體復制,例如,質粒、染色體外元件、微型染色體(minichromosome)或人工染色體。載體可以含有任何用于確保自復制的手段(means)。或者,載體可以是一種當被引入宿主細胞中時,整合到基因組中并且與整合了該載體的染色體一起復制的載體。此外,可以使用單獨的載體或質粒或兩個或更多個載體或質粒,其共同含有待引入宿主細胞基因組的完整DNA(totalDNA),或可以使用轉座子(transposon)。本發(fā)明的載體優(yōu)選地含有一個或幾個選擇性標記,其允許簡單選擇經(jīng)轉化、轉染、轉導等的細胞。選擇性標記是基因,其產(chǎn)物提供殺生物劑或病毒抗性、對重金屬的抗性、對營養(yǎng)缺陷型的原養(yǎng)性(prototrophytoauxotrophs)等。細菌選擇性標記的實例是來自枯草芽孢桿菌或地衣芽孢桿菌的&/基因,或賦予抗生素抗性的標記,所述抗生素抗性例如氨節(jié)青霉素、卡那霉素、氯霉素或四環(huán)素抗性。對于酵母宿主細胞合適的標記是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于絲狀真菌宿主細胞的選擇性標記包括但不限于am必(乙酰胺酶)、(鳥氨酸氨曱?;D移酶)、(草銨膦(phosphinothricin)乙酰轉移酶)、/^/z(潮霉素磷酸轉移酶)、m'aD(賄酸還原酶)(nitratereductase)、/>rG(專'L清酉臾才亥芬-5,-石粦酉臾月兌羧酶)(orotidine-5'-phosphatedecarboxylase)、((硫酸腺苷酰轉移酶)和^C(鄰氨基苯曱酸合酶(anthranilatesynthasc))以及它們的等價物。優(yōu)選用在曲霉屬細胞中的是構巢曲霉或米曲霉的amcLS"和pyrG基因和吸水寺連霉菌(5^eptom少c'ra/^grcwco//cws)的基因。本發(fā)明的載體優(yōu)選含有元件,其允許載體整合入宿主細胞基因組或栽體在細胞中獨立于基因組的自主復制。為了整合入宿主細胞基因組,栽體可依賴編碼多肽的多核苷酸的序列或用于通過同源或非同源重組整合入基因組的任何其它載體元件?;蛘?,載體可以含有額外的核苷酸序列,用于指導通過同源重組整合入宿主細胞基因組染色體中的精確位置。為了增加在精確位置整合的可能性,整合元件應優(yōu)選含有足夠數(shù)量的核酸,如100至IO,OOO^成基對,優(yōu)逸400至10,000堿基對,并且最優(yōu)選800至10,000堿基對,其與相應的目標序列具有高度同一性以增強同源重組的概率。整合元件可以是任何序列,其與宿主細胞基因組中的目標序列同源。此外,整合元件可以是非編碼或編碼的核苷酸序列。另一方面,可以將載體通過非同源重組整合到宿主細胞的基因組中。為了自主復制,載體可以進一步包含復制起點,其使載體能夠在所述的宿主細胞中自主地復制。復制起點可以是介導自主復制的任何質粒復制子(replicator),其在細胞中發(fā)揮功能。術語"復制起點"或"質粒復制子,,在本文定義為能夠卩吏質?;蜉d體體內(nèi)復制的核香S交序列。細菌復制起點的實例是允許在大腸桿菌中復制的質粒pBR322、pUC19、pACYC177和pACYC184的復制起點,和允許在芽孢桿菌屬中復制的質粒pUB110、pE194、pTA1060和pAMBl的復制起點。用于酵母宿主細胞中的復制起點的實例是2微米復制起點,ARS1,ARS4,ARS1和CEN3的組合,和ARS4和CEN6的組合。在絲狀真菌細胞中有用的復制起點的實例是AMA1和ANSI(Gems等,1991,Ge"e98:61-67;Cullen等,1987,A^c/e/c爿c/Aie"wc/15:9163-9175;WO00/24883)。分離AMA1基因和構建包含該基因的質?;蜉d體能夠根據(jù)公開于WO00/24883中的方法完成??梢詫⒍嘤谝粋€拷貝的本發(fā)明的多核苷酸插入宿主細胞以增加基因產(chǎn)物的產(chǎn)生。多核苷酸拷貝數(shù)的增加可通過如下方法獲得將至少一個額外拷貝的序列整合入宿主細胞基因組,或將可擴增的選擇性標記基因包括于多核苷酸,其中可通過在合適的選擇劑(selectableagent)存在下培養(yǎng)細胞來選擇含有選擇性標記基因的擴增拷貝的細胞,和由此得到多核苷酸的額外拷貝。用于連接上述元件以構建本發(fā)明的重組表達載體的方法是本領域技術人員熟知的(參見,例如,Sambrook等,1989,見上文)。宿主細胞宿主細胞可以是在本發(fā)明的多肽的重組產(chǎn)生中有用的任何細胞,例如,原核或真核細胞。原核宿主細胞可以是任何革蘭氏陽性細菌或革蘭氏陰性細菌。革蘭氏陽性細菌包括但不限于,芽孢桿菌屬、鏈球菌屬、鏈霉菌屬、葡萄球菌屬、腸球菌屬、乳酸菌屬、乳球菌屬、梭菌屬、Geo/""'〃tw和Ocea"o6a"7/ws。革蘭氏陰性細菌包括但不限于,大腸桿菌、假單胞菌屬、沙門氏菌屬、彎曲桿菌屬、螺桿菌屬、黃桿菌屬、梭桿菌屬、泥桿菌屬、奈瑟氏菌屬和脲原體屬。細菌宿主細胞可以是任何芽孢桿菌屬細胞。在本發(fā)明的實施中有用的芽孢桿菌屬細胞包括但不限于,嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結芽孢桿菌、堅強芽孢桿菌、杣爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌細胞。在優(yōu)選的方面,細菌宿主細胞是解淀粉芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌或枯草芽孢桿菌細胞。在更優(yōu)選的方面,細菌宿主細胞是解淀粉芽孢桿菌細胞。在另一個更優(yōu)選的方面,細菌宿主細胞是克勞氏芽孢桿菌細胞。在另一個更優(yōu)選的方面,細菌宿主細胞是地衣芽孢桿菌細胞。在另一個更優(yōu)選的方面,細菌宿主細胞是枯草芽孢桿菌細胞。細菌宿主細胞還可以是任何鏈球菌細胞。在本發(fā)明的實施中有用的鏈球菌細胞包括但不限于,似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌和馬鏈球菌獸痘亞種。在優(yōu)選的方面,細菌宿主細胞是似馬鏈球菌細胞。在另一個優(yōu)選的方面,細菌宿主細胞是釀膿鏈球菌細胞。在另一個優(yōu)選的方面,細菌宿主細胞是乳房鏈球菌細胞。在另一個優(yōu)選的方面,細菌宿主細胞是馬鏈球菌獸瘟亞種細胞。細菌宿主細胞還可以是任何鏈霉菌細胞。在本發(fā)明的實施中有用的鏈霉菌細胞包括但不限于,不產(chǎn)色鏈霉菌、阿維鏈霉菌、天藍鏈霉菌、灰色鏈霉菌和淺青紫鏈霉菌。在優(yōu)選的方面,細菌宿主細胞是不產(chǎn)色鏈霉菌細胞。在另一個優(yōu)選的方面,細菌宿主細胞是阿維鏈霉菌細胞。在另一個優(yōu)選的方面,細菌宿主細胞是天藍鏈霉菌細胞。在另一個優(yōu)選的方面,細菌宿主細胞是灰色鏈霉菌細胞。在另一個優(yōu)選的方面,細菌宿主細胞是淺青紫鏈霉菌細胞??赏ㄟ^如下方法實現(xiàn)將DNA引入到芽孢桿菌屬細胞例如原生質體轉化(參見,例如,Chang和Cohen,1979,M/腦/"rC7隱ra/C/to168:111-115),4吏用感受態(tài)纟田月包(參見,例詿口,Young牙口Spizizen,1961,Jow,"a/o/J5acte"'o/ogy81:823-829或Dubnau和Davidoff陽Abelson,1971,Jowma/o/Mo/ecw/ar歷o/。gy56:209-221),電穿孑L(參見,侈'H口,Shigekawa禾口Dower,1988,B/ofec/zm'^^s6:742-751)或才妄合(參見,例如,Koehler和Thome,1987,Jo"r"a/^acfeWo/ogy169:5771-5278)??赏ㄟ^如下方法實現(xiàn)將DNA引入到大腸桿菌細胞例如原生質體轉化(參見,例如,Hanahan,1983,J7kfo/,166:557-580)或電穿孔(參見,例如,Dower等,1988,M/c/e/"c^to.16:6127-6145)??赏ㄟ^如下方法實現(xiàn)將DNA引入到鏈霉菌細胞例如原生質體轉化和電穿孔(參見,例如,Gong等,2004,Fo//aM/craZnW.(Pra/7aj49:399-405),接合(參見,例如,Mazodier等,1989,J.BacteWo/.171:3583-3585),或轉導(參見,例如,Burke等,2001,Ato/.Jc^/.5W.t/S^98:6289-6294)??赏ㄟ^如下方法實現(xiàn)將DNA引入到假單胞菌細胞例如電穿孔(參見,例如,Choi等,2006,/7Wcw&'o/.MeZ/zoA64:391-397)或接合(參見,例如,Pinedo和Smets,2005,v^p/.五;w,ra".M/cra&'o/.71:51-57)??赏ㄟ^如下方法實現(xiàn)將DNA引入到鏈球菌細胞例如天然感受態(tài)(naturalcompetence)(參見,例如,Perry和Kuramitsu,1981,/"/e".,"畫".32:295-1297),原生質體轉化(參見,例如,Catt和Jollick,1991,/V//cra6/as'.68:189-2070),電穿孔(參見,例如,Buckley等,1999,/^//.£"v/'ra".M'c油'o/.65:3800-3804)或接合(參見,例如,Clewell,1981,綠油'o/.Wev.45:409-436)。然而,可以使用任何已知的將DNA引入宿主細胞的方法。宿主細胞還可以是真核生物,如哺乳動物、昆蟲、植物或真菌細胞。在優(yōu)選的方面,宿主細胞是真菌細胞。"真菌,,用在本文包括以下門子囊菌門(Ascomycota)、4旦子菌門(Basidiomycota)、壺菌門(Chytridiomycota)禾口4妄合菌門(Zygomycota)(^口由Hawksworth等,于J,Vwwor決SA'Z7j/i1D/c〃'o/雰jq/772eF,gV,8thedition,1995,CABInternational,UniversityPress,Cambridge,UK中所定義)以及卵菌門(Oomycota)(如Hawksworth等,1995,見上,171頁中所引用),和所有有絲分裂孢子真菌(mitosporicfongi)(Hawksworth等,1995,見上)。在更優(yōu)選的方面,真菌宿主細胞是酵母細胞。"酵母"用在本文包括產(chǎn)子嚢酵母(ascosporogenousyeast)(內(nèi)孢霉目(Endomycetales))、產(chǎn)擔子酵母(basidiosporogenousyeast)和屬于半知菌類(FungiImperfecti)(芽孑包纟岡(Blastomycetes))的酵母。由于酵母的分類在未來可能改變,就本發(fā)明而言,將酵母定義為如說o/ogyflw^Mc/iv/riesq/Teosf(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.,eds,S。c./^/7/7.6"c/enb/.iS戶/os7'調(diào)Ser/ayNo.9,1980)中所述。在甚至更加優(yōu)選的方面,酵母宿主細胞是念珠菌屬、漢遜酵母屬(〃"memz/")、克魯維酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬或西洋蓍霉屬細月包。在最優(yōu)選的方面,酵母宿主細胞是卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母或卯形酵母細胞。在另一個最優(yōu)選的方面,酵母宿主細胞是乳酸克魯維酵母(A7i^yveramyc^/ac他)細胞。在另一個最優(yōu)選的方面,酵母宿主細月包是J^rovw'a/一o/;^/ca細月包。在另一個更優(yōu)選的方面,真菌宿主細胞是絲狀真菌細胞。"絲狀真菌"包括真菌門(E職ycota)和卵菌門的亞門(如由Hawksworth等,1995,見上文,所定義)的所有絲狀形式。絲狀真菌通常的特征在于由殼多糖(chitin)、纖維素、葡聚糖、殼聚糖(chitosan)、甘露聚糖和其它復雜多糖組成的菌絲體壁。通過菌絲延伸進行營養(yǎng)生長,而碳分解代謝是專性需氧的。相反,酵母例如釀酒酵母的營養(yǎng)生長通過單細胞菌體的出芽生殖(budding)進行,而碳分解代謝可以是發(fā)酵的。在甚至更優(yōu)選的方面,絲狀真菌宿主細胞是枝頂孢霉屬、曲霉屬、短梗霉屬、煙管審屬(6)erA;aw(iera;)、Cen》on'opw's、金孑包子菌屬、鬼傘屬(Cbpn'"ws)、革蓋菌屬(Con'o/M)、隱球菌屬、Fz7AcwWwm、鐮孢屬、腐質霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新考瑪脂霉屬、脈孢菌屬、擬青霉屬、青霉屬、平革菌屬(尸/z"恥rac/7"ete)、射脈菌屬CPWA/")、瘤胃壺菌屬、側耳屬CP/eMrofw"、裂褶菌屬、踝節(jié)菌屬、嗜熱子嚢菌屬、梭孢殼屬、彎頸霉屬、栓菌屬(rrawete力或木霉屬細胞。在最優(yōu)選的方面,絲狀真菌宿主細胞是泡盛曲霉、煙曲霉、臭曲霉、曰本曲霉、構巢曲霉、黑曲霉或米曲霉細胞。在另一個最優(yōu)選方面,絲狀真菌宿主細胞是桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢細胞。在另一個最優(yōu)選的方面,絲狀真菌宿主細胞是黑刺煙管菌(^/e^3"&raCer/p9n'(9/〕57、、ra6ra^7、Cen》on'o/57^sw6ver附/s/ora、嗜角質金孑包子菌、C72r少vos'/7or/ww/wcA^owewse、tA帶金;包子菌、C7zrj^cw/on'wmwerdar/wm、CTzrj^c^/wn.i/m/wo/w、氈金孑包子菌、C/^jvwaspon'w/w^weews/awWcMm、C7z廠少ms/7on.應zo福wm、灰蓋鬼傘(Copr/聽51c/werews)、毛革蓋菌(Cbn'o/w/7/"""")、特異腐質霉、疏棉狀腐質霉、米黑毛霉、嗜熱毀絲霉、粗糙脈孢菌、巴西青霉、產(chǎn)紫青霉、黃孢平革菌CP/wmrac/za^ec/iowM/x>n'mw)、輻射射月永菌(/)//e//(3A3ii/ato)、尸/ewrafMSery"g"、土生斗臾孑包霉、7>awefesv/〃a<3、7ham"ewrWco/w、哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉細胞??梢詫⒄婢毎ㄟ^涉及原生質體形成、原生質體轉化和細胞壁重建的方法以本身公知的方式轉化。用于轉化曲霉屬和木霉屬宿主細胞的合適方法在EP238023和Yelton等,1984,尸raceW,7V"^wa/^cO(ie"iy5Wewca"M81:1470-1474中描述。用于轉化鐮孢屬菌種的合適方法由Malardier等,1989,Ge"e78:147-156和WO96/00787描述??梢允褂糜扇缦挛墨I4苗述的方法豐爭^i酵母Becker矛口Guarente,于Abelson,J.N.禾口Simon,M.l.(編者'),GWcfeto]^as^Ge"Wcsa/WMo/ecw/ar所o/ogy,M^/z。(is/:,w:,o/c^,Volume194,pp182-187,AcademicPress,Inc.,NewYork;Ito等,1983,J。w/7a/iac曾/o/ogv153:163;和Hinnen等,1978,〃犯/V""'o憩/」ca(iewjvq/'5Wewces(T51/175:1920。產(chǎn)生方法
技術領域:
:本發(fā)明還涉及用于產(chǎn)生本發(fā)明多肽的方法,其包括(a)在有益于產(chǎn)生多肽的條件下培養(yǎng)細胞,所述細胞以其野生型形式能夠產(chǎn)生所述多肽;和(b)回收所述多肽。在優(yōu)選的方面,所述細胞是毀絲霉屬的細胞。在更優(yōu)選的方面,所述細胞是嗜熱毀絲霉。在最優(yōu)選的方面,所述細胞是嗜熱毀絲霉CBS117.65。在另一個優(yōu)選的方面,細胞是擔子菌CBS494.95。在另一個優(yōu)選的方面,細胞是擔子菌CBS495.95。在另一個優(yōu)選的方面,細胞是青霉屬的。在另一個更優(yōu)選的方面,細胞是巴西青霉。在另一個最優(yōu)選的方面,細胞是巴西青霉IBT20888。本發(fā)明還涉及用于產(chǎn)生本發(fā)明的多肽的方法,其包括(a)在有益于產(chǎn)生多肽的條件下培養(yǎng)宿主細胞;和(b)回收所述多肽。本發(fā)明還涉及用于產(chǎn)生本發(fā)明的多肽的方法,包括(a)在有益于產(chǎn)生多肽的條件下培養(yǎng)宿主細胞,其中所述宿主細胞包含突變核苷酸序歹'J,其在SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列中具有至少一個突變,其中所述突變核苷酸序列編碼多肽,該多肽包含SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽或由SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽組成,和(b)回收所述多肽。在優(yōu)選的方面,SEQIDNO:4的成熟多肽是氨基酸"至389。在另一個優(yōu)選的方面,SEQIDNO:6的成熟多肽是氨基酸16至397。在另一個優(yōu)選的方面,SEQIDNO:8的成熟多肽是氨基酸22至429。在另一個優(yōu)選的方面,SEQIDNO:10的成熟多肽是氨基酸25至421。在另一個優(yōu)選的方面,成熟多肽編碼序列是SEQIDNO:3的核苷酸67至1185。在另一個優(yōu)選的方面,成熟多肽編碼序列是SEQIDNO:5的核苷酸84至1229。在另一個優(yōu)選的方面,成熟多肽編碼序列是SEQIDNO:7的核芬酸77至1300。在另一個優(yōu)選的方面,成熟多肽編碼序列是SEQIDNO:9的核香酸73至1468。在本發(fā)明的產(chǎn)生方法中,使用本領域熟知的方法在適合于產(chǎn)生所述多肽的營養(yǎng)培養(yǎng)基中培養(yǎng)細胞。例如,可以通過在合適培養(yǎng)基中和允許表達和/或分離所述多肽的條件下進行的搖瓶培養(yǎng),和實驗室或工業(yè)發(fā)酵罐中的小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù)、分批、補料分批或固態(tài)發(fā)酵)來培養(yǎng)細胞。使用本領域已知的方法在合適的營養(yǎng)培養(yǎng)基中進行培養(yǎng),所述營養(yǎng)培養(yǎng)基包含碳源和氮源和無機鹽。合適的培養(yǎng)基能夠從商業(yè)供應商獲得或可以根據(jù)公開的組成制備(例如,在美國典型培養(yǎng)物保藏中心的目錄中)。如果多肽分泌到營養(yǎng)培養(yǎng)基中,該多肽能夠從所述培養(yǎng)基中直接回收。如果多肽不分泌到培養(yǎng)基中,其能夠從細胞裂解物(lysate)回收??梢允褂帽绢I域已知的對于所述多肽是特異性的方法來檢測多肽。這些檢測方法可包括特異性抗體的使用、酶產(chǎn)物的形成或酶底物的消失。例如,酶試一險(enzymeassay)可用于測定如本文所述的多肽的活性。所得多肽可以使用本領域已知的方法回收。例如,多肽可以通過常規(guī)方法從營養(yǎng)培養(yǎng)基中回收,所述常規(guī)方法包括但不限于離心、過濾、提取、噴本發(fā)明的多肽可以通過多種本領域已知的方法純化以獲得基本上純的多肽,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型(preparative)等電聚焦)、差示溶解度(例如,硫酸銨沉淀)、SDS-PAGE或提取(參見,例如,尸rafe/"Pwn)ca"'o",J,C.Janson和LarsRyden,editors,VCHPublishers,NewYork,1989)。植物本發(fā)明還涉及植物,例如,轉基因植物、植物部分或植物細胞,其包含分離的多核苷酸,所述多核苷酸編碼本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽,從而以可回收的量表達和產(chǎn)生所述多肽。多肽可從植物或植物部分回收。或者,同樣可以將含有該重組多肽的植物或植物部分用于改進食品或飼料的質量,例如,改進營養(yǎng)價值、適口性(palatability)和流變性質(rheologicalproperties),或用于石皮壞抗營養(yǎng)因子。轉基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉才直物的實例是草(grasses),如草i也早熟禾(meadowgrass)(藍草(bluegrass),早熟禾屬(尸oa));飼用牧草(foragegrass)如羊茅屬(Fe^wra)、黑麥草屬(丄o/Zww);寒i也型斗文草(temperategrass),長口Agrostis(剪月殳穎屬);禾口谷類,例長口,小麥、燕麥、黑麥、大麥、稻(rice)、高粱和玉蜀黍(maize)(玉米)。雙子葉植物的實例是煙草(tobacco),豆類(legumes),如習習扇豆(lupins),馬鈐薯,糖《t菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)才直凈勿(十字花一斗(familyBrassicaceae)),^口花浙卩菜(cauliflower),油菜籽(rapeseed)和緊密相關的模型生物體擬南芥(」raZnWo/w^//z"http://a"a)。植物部分的實例是莖(stem)、愈傷組織(callus)、。十(leaf)、根(root)、果實(fruit)、種子(seed)和塊莖(tuber),以及包含這些部分的獨立組織,例如,表皮(epidermis)、。十肉(mesophyll)、薄壁組織(parenchyme)、維管組織(vasculartissue)、分生組織(meristem)。具體的才直物細月包區(qū)室(compartments),如葉綠體(chloroplast)、質夕卜體(apoplast)、線粒體(mitochondria)、液泡(vacuole)、過氧化物酶體(peroxisome)和細胞質(cytoplasm)也被認為是植物部分。此外,任何植物細胞,無論什么組織來源,都被認為是植物部分。同樣地,植物部分,如分離以促進本發(fā)明的應用的具體組織和細胞也被認為是植物部分,例如胚(cmbryo)、胚乳(endosperm)、糊斗分(aleurone)和種皮(seedcoat)。同樣包含于本發(fā)明范圍內(nèi)的還有這些植物、植物部分和植物細胞的子代。建。簡而言之,通過如下方法構建所述植物或植物細胞將編碼本發(fā)明多肽的一個或幾個表達構建體并入植物宿主基因組或葉綠體基因組,并且將所得的修飾植物或植物細胞繁殖為轉基因植物或植物細胞。表達載體便利地是包含編碼本發(fā)明多肽的多核苷酸的核酸構建體,所述多核苷酸與在選擇的植物或植物部分中表達該多核苷酸序列所需的適當?shù)恼{(diào)節(jié)序列可操作地連接。此外,表達構建體可以包含對于鑒定宿主細胞有用的選擇性標記,在所述宿主細胞中整合了表達構建體和將該構建體引入到所述植物中所必需的DNA序列(后者依賴于使用的DNA引入方法)。調(diào)節(jié)序列的選4奪,例如啟動子和終止子序列和任選地信號或轉運序列的選擇,舉例來說,基于期望何時、何處以及如何表達多肽而確定。例如,編碼本發(fā)明多肽的基因的表達可以是組成型的或誘導型的,或可以是發(fā)育、階段或組織特異性的,并且基因產(chǎn)物可以靶向特定的組織或植物部分例如種子或葉。調(diào)節(jié)序列由例如Tague等,1988,P/a"fP/z,/o/o"86:506所述。對于組成性表達,可以使用35S-CaMV、玉米泛素1和稻肌動蛋白1啟動子(Franck等,1980,Ce〃21:285-294,Christensen等,1992,尸/a"fMa5w/.18:675-689;Zhang等,1991,P/a"fCe〃3:1155-1165)。器官特異性啟動子可以是例如來自ti藏庫組織(storagesinktissue)例如種子、馬鈴薯塊莖和果實的啟動子(Edwards&Coruzzi,1990,爿朋.Wev.24:275-303),或來自代謝庫組織(metabolicsinktissue)例如分生組織的啟動子(Ito等,1994,/7朋/Mo/.24:863-878),種子特異性啟動子諸如來自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(alb飄in)啟動子(Wu等,1998,Ce〃P/7"/o/ogv39:885-889),來自豆球蛋白(legumin)B4和蠶豆(K/c/a/a/w)的未知的種子蛋白基因的蠶豆啟動子(Conrad等,1998,/owma/o/P/a"http://)/y^/o/ogy152:708-711)、來自種子油體蛋白(oilbodyprotein)的啟動子(Chen等,1998,PlantandCellPhysiology39:935-941),來自歐洲油菜(&腦.ca"a戸)的貯藏蛋白napA啟動子,或本
技術領域:
公知的任何其他種子特異性的啟動子,例如,在WO91/14772中所描述的。此外,啟動子可為葉特異性的啟動子,如來自稻或番茄的A"啟動子(Kyozuka等,1993,P/a"fP/zjw'o/ogy102:991-1000),小球藻病毒(chlorellavims)腺嘌呤曱基轉移酶(adeninemethyltransferase)基因啟動子(Mitra牙口Higgins,1994,P/aw/Mo/ecM/arB/o/ogy26:85-93),或來自稻的a/J尸基因啟動子(Kagaya等,1995,Mo/ecw/w朋t/ge肥ra/248:668-674),或傷口誘導的啟動子,如馬鈴薯pin2啟動子(Xu等,1993,尸/a"zMo/ecM/arAo/ogy22:573-588)。同樣地,所述啟動子可通過非生物的處理誘導,所述非生物的處理諸如溫度、干旱或鹽度變化,或通過外源施加的激活所述啟動子的物質"i秀導,例如乙醇、辨tj敫素(oestrogens)、才直物激素(planthormones)如乙歸、脫落酸(abscisicacid)和赤霉酸(gibberdlicacid),和重金屬。啟動子增強子元件也可以用于實現(xiàn)本發(fā)明多肽在植物中的較高表達。例如,啟動子增強子元件可以是內(nèi)含子,其置于啟動子和編碼本發(fā)明多肽的核苷酸序列之間。例如Xu等,1993,見上,公開了使用稻肌動蛋白l基因的第一內(nèi)含子以增強表達。選擇性標記基因和表達構建體的任何其它部分可以選自本領域內(nèi)可用的那些。將核酸構建體根據(jù)本領域已知的常規(guī)技術并入植物基因組,所述常規(guī)技術包括土壤桿菌屬04gra^cfen'Mw)介導的轉化、病毒介導的轉化、顯微注射(microinjection)、粒子轟擊、生物射彈轉化和電穿孑L(Gasser等,1990,5Wewce244:1293;Potrykus,1990,歷o/rec/mo/ogv8:535;Shimamoto等,1989,Atow"338:274)。目前,才艮癌土i裏才干菌(爿graZ^c/en'ww^w《/a"'e似)介導的基因4爭移(genetransfer),是產(chǎn)生轉基因雙子葉植物的優(yōu)選方法(為了參考,見Hooykas和Schilperoort,1992,P/""/Mo/ecw/arB/o/o^19:15-38),而且它也可以用于轉化單子葉植物,雖然對于這些植物其他的轉化方法是常用的。目前,產(chǎn)生轉基因單子葉植物的優(yōu)選的方法,是用粒子(用轉化DNA涂覆的微觀的金或鎢粒子)轟擊胚愈傷組織(embryoniccalli)或發(fā)育中的胚(developingembryos)(Christou,1992,尸/朋/1Jo固a/2:275-281;Shimamoto,1994,CwreW(9—'w/從乂ec/z脂/ogy5:158-162;Vasil等,1992,歷o/7^^m/ogv10:667-674)。轉化單子葉植物的可供選擇的方法是基于原生質體轉化,如由Omirulleh等,1993,/)/flWAfo/ecw/w21:415-428所描述的。轉化之后,根據(jù)本領域熟知的方法選擇具有并入的表達構建體的轉化體并且再生成為完整植物。通常設計轉化方法用于通過如下方法在再生期間或在后續(xù)世代中選擇性消除選擇基因例如,使用帶有兩種獨立的T-DNA構建體的共轉化或通過特異性重組酶位點特異性地切除選擇基因。本發(fā)明還涉及用于產(chǎn)生本發(fā)明多肽的方法,其包括(a)在有益于產(chǎn)生多肽的條件下培養(yǎng)包含多核苷酸的轉基因植物或植物細胞,所述多核苷酸編碼本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽;和(b)回收所述多肽。去除或減少內(nèi)切葡聚糖酶活性本發(fā)明還涉及用于產(chǎn)生親本細胞突變體的方法,其包括破壞或缺失編碼本發(fā)明的多肽的多核苷酸序列或其部分,所述方法導致在相同條件下培養(yǎng)時,與親本細胞相比突變的細胞產(chǎn)生較少的所述多肽。可以使用本領域熟知的方法通過減少或消除編碼本發(fā)明多肽的核苷酸序列的表達,所述方法例如,插入、破壞、替代或缺失來構建突變細胞。在優(yōu)選的方面,所述核苷酸序列是失活的。待修飾或失活的核苷酸序列可以是,例如,編碼區(qū)或其對活性關鍵的部分,或表達編碼區(qū)所需的調(diào)節(jié)元件。這種調(diào)節(jié)或調(diào)控序列的實例可以是啟動子序列或其功能部分,即,足以影響核香酸序列表達的部分。用于可能的修飾的其它調(diào)控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、信號肽序列、轉錄終止子和轉錄激活子??梢酝ㄟ^向親本細胞施以誘變,并且選#^其中已將所迷核苷酸序列的表達減少或消除的突變細胞來進行核苷酸序列的修飾或失活。誘變可能是特異性的或隨機的,可以通過例如使用合適的物理或化學誘變劑進行,通過使用可以通過使用這些誘變劑的任何組合來進行誘變。適合于本發(fā)明目的的物理或化學誘變劑的實例包括紫外線(UV)照射、羥胺、N-甲基-N'-硝基-N-亞硝基胍(MNNG)、O-曱基羥胺、亞硝酸、乙基曱烷磺酸酯(ethylmethanesulphonate)(EMS)、亞疏酸氫鈉、曱酸和核香酸類似物。當使用這些試劑時,通常通過如下方法來進行所述誘變在合適條件下存在優(yōu)選的誘變劑時溫育待誘變的親本細胞,并篩選和/或選擇顯示基因表達減少的或無基因表達的突變體細胞。通過導入、取代或去除基因中的一個或幾個核苷酸或其轉錄或翻譯所需的調(diào)控元件可以實現(xiàn)所述核苷酸序列的^"飾或失活。例如,可以插入或去除核芬酸從而導致引入終止密碼子,去除起始密碼子,或改變開放閱讀框。按照本領域已知的方法通過定位誘變或PCR產(chǎn)生的誘變可以實現(xiàn)這種修飾或失活。盡管在理論上所述修飾可以在體內(nèi)進行,即,直接在表達待修飾核苦酸序列的細胞上進行,但優(yōu)選如下面所示例的那樣在體外進行所述修飾。消除或減少核苦酸序列通過細胞表達的便利方式的例子是基于基因取代,基因缺失,或基因破壞的技術。例如,在基因破壞方法中,將相應于內(nèi)源核苷酸序列的核酸序列在體外進行誘變以產(chǎn)生缺陷性的核酸序列,隨后將其轉化入親本細胞中以產(chǎn)生缺陷基因。通過同源重組,所述缺陷性核酸序列替代了內(nèi)源性核苷酸序列。理想的是所述缺陷性核苷酸序列還編碼標記,其可用于選擇其中核苷S吏序列被修飾或破壞的轉化子。在特別優(yōu)選的方面,用可選擇的標記(如本文所述的那些)來破壞所述核芬酸序列。或者,可以使用與所述核苷酸序列互補的序列通過確定的反義或RNAi技術來進行所述核苷酸序列的修飾或失活。更具體地,通過導入與所述基因的核苷酸序列互補的序列可以減少或消除所述核苦酸序列通過細胞的表達,所述序列可以在細胞中轉錄并且能夠與細胞中產(chǎn)生的mRNA雜交。在允許所述互補反義核苷酸序列與mRNA雜交的條件下,由此減少或消除翻譯的蛋白質的量。本發(fā)明進一步涉及親本細胞的突變體細胞,其包含編碼多肽的核苦酸序列或其調(diào)控序列的破壞或缺失,這導致與親本細胞相比突變體細胞產(chǎn)生更少的多肽或不產(chǎn)生多肽。這樣生成的多肽缺陷型突變細胞作為表達同源和/或異源多肽的宿主細胞特別有用。所以,本發(fā)明進一步涉及生產(chǎn)同源或異源多肽的方法,其包括(a)益于生產(chǎn)多肽的條件下培養(yǎng)突變細胞;和(b)回收所述多肽。術語"異源多肽"在本文中定義為對宿主細胞不是天然的多肽,進行了修飾以改變天然序列的天然蛋白,或作為通過重組DNA技術對宿主細胞操作的結果其表達在量上改變的天然蛋白。在另一方面,本發(fā)明涉及通過發(fā)酵可產(chǎn)生本發(fā)明的多肽以及目標蛋白產(chǎn)物的細胞來生產(chǎn)基本上無內(nèi)切葡聚糖酶活性的蛋白質產(chǎn)品的方法在發(fā)酵之前、之中或發(fā)酵完成之后向發(fā)酵液(fermentationbroth)中添加有效量的能夠抑制內(nèi)切葡聚糖酶活性的試劑,從發(fā)酵液中回收目標產(chǎn)物,并且任選地將回收的產(chǎn)物進行進一步純化。在另一方面,本發(fā)明涉及如下生產(chǎn)基本上無內(nèi)切葡聚糖酶活性的蛋白質產(chǎn)品的方法在允許產(chǎn)物表達的條件下培養(yǎng)細胞,將得到的培養(yǎng)液進行組合的pH和溫度處理以基本上減少內(nèi)切葡聚糖酶活性,和從發(fā)酵液中回收產(chǎn)物。或者,可以將從培養(yǎng)液回收的酶制備物進行組合的pH和溫度處理。所述組合的pH和溫度處理可任選地與內(nèi)切葡聚糖酶抑制劑處理組合使用。依照本發(fā)明的這個方面,可能去除至少60%,優(yōu)選至少75%,更優(yōu)選至少85%,還更優(yōu)選至少95%,并且最優(yōu)選至少99%的內(nèi)切葡聚糖酶活性。可使用此方法獲得內(nèi)切葡聚糖酶活性的完全去除。組合的pH和溫度處理優(yōu)選在2-3或10-11范圍內(nèi)的pH和至少75-85°C范圍內(nèi)的溫度進行一段足夠的時間以達到期望的效果,通常1至3小時是足夠的。用于培養(yǎng)和純化感興趣的產(chǎn)物的方法可以通過本領域已知的方法進行。用于產(chǎn)生基本上無內(nèi)切葡聚糖酶產(chǎn)物的本發(fā)明的方法在真核多肽,特別是真菌蛋白質例如酶的產(chǎn)生中是特別令人有興趣的。所述酶可以選自,例如,淀粉分解酶(amylolyticenzyme)、脂肪分解酶、蛋白水解酶、纖維素分解酶(cellulolyticenzyme)、氧化還原酶或植物細胞壁降解酶。這些酶的實例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶(chitinase)、角質酶(cutinase)、環(huán)糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、半乳糖苦酶、(3-半乳糖苦酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、卣素過氧化酶、半纖維素酶、轉化酶、異構酶、漆酶、連接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉移酶、轉谷氨酰胺酶或木聚糖酶。內(nèi)切葡聚糖酶缺陷細胞也可以用于表達在制藥上引起興趣的異源蛋白質例如激素、生長因子、受體等??衫斫獾氖切g語"真核多肽"不僅包括天然多肽,也包括多肽例如酶,其通過氨基酸取代、缺失或添加或其它這樣的修飾而被修飾以增強活性、熱穩(wěn)定性、pH耐受性等。在另外的方面,本發(fā)明涉及基本上無內(nèi)切葡聚糖酶活性的蛋白質產(chǎn)物,其通過本發(fā)明的方法產(chǎn)生。抑制多肽表達的方法
技術領域:
:本發(fā)明還涉及抑制多肽在細胞中表達的方法,其包括對細胞施用雙鏈RNA(dsRNA)分子或者在細胞中表達雙鏈RNA(dsRNA)分子,其中dsRNA包含本發(fā)明多核苷酸的亞序列或部分。在優(yōu)選的方面,dsRNA長約15、16、17、18、19、20、21、22、23、24、25或更多的雙鏈體核苷酸。在另一個優(yōu)選的方面,多肽具有內(nèi)切葡聚糖活性。dsRNA優(yōu)選是小千擾RNA(siRNA)或微RNA(miRNA)。在優(yōu)選的方面,dsRNA是用于抑制轉錄的小干擾RNA(siRNA)。在另一個優(yōu)選的方面,dsRNA是用于抑制翻譯的微RNA(miRNA)。本發(fā)明還涉及用于抑制細胞中多肽表達的這些雙《連RNA(dsRNA)分子,其中dsRNA包含編碼SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽的多核苷酸的亞序列或部分。本發(fā)明不受到任何特定作用機制的限制,dsRNA能進入細胞,并引起相似或相同序列的單鏈RNA(ssRNA)的降解,所述RNA包括內(nèi)源mRNA。當細胞接觸dsRNA時,來自同源基因的mRNA選擇性地受到稱為RNA干擾(RNAi)的過程的降解。本發(fā)明的dsRNA可以用于基因沉默療法。在一個方面,本發(fā)明提供使用本發(fā)明的dsRNAi選4奪性地降解RNA的方法。所述過程可以在體外、在活體夕卜(exv/w)或在體內(nèi)進行。在一個方面,dsRNA分子能夠用于產(chǎn)生細胞、器官或動物中的功能缺失突變(loss-of-fiinctionmutation)。制備或使用選擇性降解RNA的dsRNA分子的方法在本領域中^^知,參見,例如,美國專利號6,506,559;美國專利號6,511,824;美國專利號6,515,109;和美國專利號6,489,127。組合物本發(fā)明還涉及包含本發(fā)明的多肽的組合物。優(yōu)選地,所述組合物富含這種多肽。術語"富含"表示所述組合物的內(nèi)切葡聚糖酶活性,例如,以至少1.1的富集因數(shù)(enrichmentfactor)增力口。所述組合物可以包含本發(fā)明的多肽作為主要酶成分,例如,單成分組合物。或者,所述組合物可以包含多種酶活性,例如氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶、角質酶、環(huán)糊精糖基轉移酶、脫氣核糖核酸酶、酯酶、a-半乳糖苷酶、J3-半乳糖苷酶、葡糖淀粉酶、a-葡糖苷酶、P-葡糖苷酶、卣素過氧化物酶、轉化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果膠分解酶、肽谷氨酰胺酶(peptidoglutaminase)、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶或木聚糖酶。額外的酶可以通過例如屬于以下屬或種的農(nóng)i生物產(chǎn)生曲霉屬,優(yōu)選棘孢曲霉、泡盛曲霉、煙曲霉、臭曲霉、日本曲霉、構巢曲霉、黑曲霉或米曲霉;鐮孢屬,優(yōu)選桿孢狀鐮孢、禾谷鐮孢、庫威鐮孢、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢或鑲片鐮孢;腐質霉屬,優(yōu)選特異腐質霉或疏棉狀腐質霉;或木霉屬,優(yōu)選哈茨木霉、康寧木霉、長枝木霉、里氏木霉或綠色木霉??梢砸勒毡绢I域內(nèi)已知的方法制備多肽組合物,并且可以是液體或千組合物的形式。例如,所述多肽組合物可以是顆粒(granulate)或微粒(microgranulate)的形式??梢砸勒毡绢I域內(nèi)已知方法將包括于所述組合物中的多肽穩(wěn)定化。下面給出的是本發(fā)明多肽組合物的優(yōu)選的用途的實例。本發(fā)明的多肽組合物的劑量和使用該組合物的其它條件可以基于本領域內(nèi)已知的方法確定。用途本發(fā)明還涉及降解或轉化含纖維素物質的方法,其包括用組合物處理含纖維素物質,所述組合物包含有效量的本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽。在優(yōu)選方面,所述方法還包括回收已降解或轉化的含纖維素物質。本發(fā)明的多肽和宿主細胞可用于單糖、二糖和多糖的生產(chǎn)中,所述糖類作為來自含纖維素生物質的化學或發(fā)酵原料用于產(chǎn)生乙醇、塑料或其它產(chǎn)品或中間物。包含具有內(nèi)切葡聚糖酶活性的多肽的組合物可以是去除或不去除細胞的粗發(fā)酵液形式,或是半純化或純化的酶制劑形式。組合物還可以包含在處理生物質中有用的其它蛋白質和酶,例如,纖維二糖水解酶、p-葡糖苷酶、半纖維素分解酶、增強劑(WO2005/074647,WO2005/074656)等?;蛘撸M合物可以包含本發(fā)明的宿主細胞,所述宿主細胞在使用生物質的發(fā)酵方法中作為具有內(nèi)切葡聚糖酶活性的多肽的來源。具體地,本發(fā)明的多肽和宿主細胞可以通過部分或全部降解纖維素或半纖維素而增加加工殘余物(干燥的蒸餾殘渣、釀酒酒糟、甘蔗渣等)的價值。宿主細胞還可以包含編碼在生物質加工中有用的上述其它蛋白質和酶的天然或異源基因。在本發(fā)明的方法中,可以使用任何含纖維素物質,如生物質。在本文中可理解的是,術語"含纖維素物質"包括木質纖維素。生物質可以包括但不限于木材資源、城市固體廢物、廢紙、作物和作物殘余物(參見,例如Wiselogel等,1995,在//""^wiowB/oeA朋o/(編者CharlesE.Wyman)中,第105-118頁,Taylor&Francis,WashingtonD.C.;Wyman,1994,^omscwce7fec/z"c/ogy50:3-〗6;Lynd,1990,萬/0c/2ew/W^yB/o/ec/zwo/o"24/25:695-719;Mosier等,1999,7ece"f/Vogms^Wocom^s7'o"Zigwoce〃w/ow'cs,在/Wv朋c'e,s'/歷oc/zem/ca/五"g/ween'"g/6/ofec/wo/ogy中,總編T.Scheper,第65巻,第23-40頁,Springer-Verlag,NewYork)。生物質初生細胞壁(primarycellwall)中的主要多糖是纖維素,其次最豐富的是半纖維素,而第三是果膠。次生細胞壁(secondarycellwall)在細胞停止生長后產(chǎn)生,其同樣含有多糖并通過聚合木質素共價交聯(lián)至半纖維素而加強。纖維素是脫水纖維二糖的均聚物,并且因此是線性p-(l-4)-D-葡聚糖,而半纖維素包括多種化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的復雜分支結構。盡管通常是多形的,存在于植物組織中的纖維素主要作為平行葡聚糖鏈的不溶晶體基質。半纖維素通常與纖維素以及其它半纖維素以氫鍵相連,其幫助穩(wěn)定細胞壁基質。將三種主要類別的酶用于分解含纖維素生物質(1)"內(nèi)切-l,4-P-葡聚糖酶"或1,4-卩-D-葡聚糖-4-葡聚糖水解酶(EC3.2丄4),其隨機作用于可溶和不溶的1,4-(3-葡聚糖底物。(2)"外切-l,4-f3-葡聚糖酶"包括1,4_(3-D-葡聚糖葡糖水解酶(EC3.2.1.74),其從],4-(3-D-葡聚糖釋放D-葡萄糖并且緩慢水解D-纖維二糖;和纖維二糖水解酶(l,4—p-[)-葡聚糖纖維二糖水解酶,EC3.2.1.91),其從1,4-(3-葡聚糖釋放D-纖維二糖。(3)"卩-D-葡糖苷酶"或卩-D-葡糖苷葡糖水解酶(EC3.2丄21),其作用于從纖維二糖和可溶的纖維糊精以及一系列糖苷釋放D-葡萄糖單位。本發(fā)明具有內(nèi)切葡聚糖酶活性的多肽可以與其它纖維素分解蛋白質,例如,外切-1,4-P-D-葡聚糖酶和(3-D-葡糖苷酶,一同使用以降解生物質底物的纖維素成分(參見,例如,Brigham等,1995,于T/a"必ooA:o"所od/7a/w/(編者CharlesE.Wyman)中,第119-141頁,Taylor&Francis,WashingtonD.C.;Lee,1997,Jowr"a/。/5/ofec/wo/(9gv56:1-24)。外切—i,4—(3-D-葡聚糖酶和(3-D-葡糖苷酶可以通過本領域已知的任何已知方法產(chǎn)生(參見,例如,Bennett,J.W.和LaSure,L.(編者),Mo"Ge"eM"—2^//f駕ZwFw一,AcademicPress,CA,1991)。具有內(nèi)切葡聚糖酶活性的多肽和其它纖維素分解蛋白質的最適量取決于幾個因素,其包括但不限于,組分纖維素分解蛋白質的混合物、含纖維素底物、含纖維素底物的濃度、含纖維素底物的預處理、溫度、時間、pH和包括發(fā)酵生物體(例如,同步糖化和發(fā)酵的酵母)。術語"纖維素分解蛋白質"在本文中定義為顯示出能夠在測試條件下水解或轉化或降解纖維素的那些蛋白質或蛋白質的混合物。在優(yōu)選的方面,每克含纖維素物質的具有內(nèi)切葡聚糖酶活性的多肽的量是約0.5至約50mg,優(yōu)選約0.5至約40mg,更優(yōu)選約0.5至約25mg,更優(yōu)選約0.75至約20mg,更優(yōu)選約0.75至約15mg,甚至更優(yōu)選約0.5至約10mg,并且最優(yōu)選約2.5至約10mg每g含纖維素物質。在另一個優(yōu)選的方面,每克含纖維素物質的纖維素分解蛋白質的量是約0.5至約50mg,優(yōu)選約0.5至約40mg,更優(yōu)選約0.5至約25mg,更優(yōu)選約0.75至約20mg,更優(yōu)選約0.75至約15mg,甚至更優(yōu)選約0.5至約10mg,并且最優(yōu)選約2.5至約10mg每g含纖維素物質。在本發(fā)明的方法中,組合物可補充一種或幾種的其它酶活性,以促進含纖維素物質的降解。優(yōu)選的其它酶是半纖維素酶、酯酶(例如,脂肪酶、磷脂酶和/或角質酶)、蛋白酶、漆酶、過氧化物酶或它們的混合物。在本發(fā)明的方法中,可以在發(fā)酵前或過程中(包括在發(fā)酵微生物的繁殖的過程中或之后)加入其它酶。酶可以源自或獲得自任何合適的來源,包括細菌、真菌、酵母或哺乳動物來源。術語"獲得"在本文中表示酶可以從自然地產(chǎn)生所述酶作為天然酶的生物體分離。術語"獲得"在本文中還表示酶可以在宿主生物體中重組產(chǎn)生,其中重組產(chǎn)生的酶對宿主生物體是天然或外源的,或具有修飾的氨基酸序列,例如,具有缺失的、插入的和/或取代的一個或幾個氨基酸,即,突變的重組產(chǎn)生的酶和/或天然氨基酸序列的片段或由本領域已知的核苷酸改組方法產(chǎn)生的酶。天然酶的意義中包含天然變體,而外源酶的意義中包含通過重組獲得的變體,如通過定向誘變或改組。還可以將酶純化。本文中使用的術語"純化"包括不含來自其所源自的生物體中其它成分的酶。術語"純化"還包括不含來自其所獲得自的天然生物體的組分的酶??蓪⒚讣兓瑑H存在少量的其它蛋白質。表述"其它蛋白質"具體涉及其它酶。本文使用的術語"純化"還指去除其它組分,特別是存在于本發(fā)明的酶的起源細胞中的其它蛋白質,最特別是存在于本發(fā)明的酶的起源細胞中的其它酶。酶可為"基本上純的",即,不含來自產(chǎn)生所述酶的生物體的其它組分,即,例如,用于重組產(chǎn)生酶的宿主生物體。在優(yōu)選的方面,酶是至少75%(w/w)純,優(yōu)選至少80%純,更優(yōu)選至少85%純,更優(yōu)選至少90%純,更優(yōu)選至少95%純,更優(yōu)選至少96%純,更優(yōu)選至少97°/。純,甚至更優(yōu)選至少98%純的,或者最優(yōu)選至少99%純。在另一個優(yōu)選的方面,酶是100%純的。本發(fā)明使用的酶可以是示于本文所述方法的任何形式,如,例如,含有或者不含細胞的粗發(fā)酵液、干粉或顆粒、無粉塵顆粒、液體、穩(wěn)定化的液體或受保護的酶。顆??梢酝ㄟ^,例如美國專利號4,106,991和4,661,452中公開的方法產(chǎn)生,或者可任選地通過本領域已知的方法包覆??梢裕?,根據(jù)已確立的方法通過加入穩(wěn)定劑(如糖、糖醇或另一種多羥基化合物(polyol),和/或乳酸或另一種有機酸)將液體酶制劑穩(wěn)定化。受保護的酶可以根據(jù)EP238,216中7>開的方法制備??梢允褂帽景l(fā)明的方法將含纖維素物質處理成為^f艮多有用的有機產(chǎn)品、化學品和燃料。除乙醇外,一些可以由纖維素產(chǎn)生的用品和專門化學品包括木糖、丙酮、乙酸、甘氨酸、賴氨酸、有機酸(例如,乳酸)、1,3-丙二醇、丁二醇、甘油、乙二醇、糠醛、多羥基鏈坑酸(polyhydroxyalkanoates)、順式、順式-粘康酸和動物飼料(Lynd,L.R.,Wyman,C.E.,和Gemgross,T.U.,1999,/;,.(96'ommo(i/(y£>7g/ween>7g,肌o/ec/zwo/.尸rag.,15:777-793;Philippidis,G.R,1996,Cellulosebioconversiontechnology,于Z/aw必ooA:owjB/oe^mo/../)ra血c"cw朋(i6Wfe"&cw中,Wyman,C.E.,編,Taylor&Francis,Washington,DC,179-212;及Ryu,D.D.Y,,和Mandels,M.,1980,Cellulases:biosynthesisandapplications,M/cra6.rec/zo/.,2:91-102)。可能的共生產(chǎn)有助于擴展從可發(fā)酵糖合成的多種有機產(chǎn)物的范圍。生物處理后殘留的富含木質素的殘余物可以轉化成木質素衍生的化學品,或者用于產(chǎn)生能量。人員充分理解。述設備設定為根據(jù)本發(fā)明操作。這種設備可以包括批式攪拌反應器、具有超濾的連續(xù)流攪拌反應器、連續(xù)活塞流柱式反應器(Gusakov,A.V.,和Sinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose:1.Amathematicalmodelforabatchreactorprocess,Tkfora/.r"'/wo/.7:346-352)、研磨反應器(Ryu,S.K.,和Lee,J.M.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,B/o/ec/wo/.25:53-65),或者具有由電磁場引起的強烈攪拌的反應器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y"Davydkin,V.Y.,Protas,O.V"1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,4ppA"6〖oc/zem.腸fec/zm/.56:141-153)。常規(guī)方法包括但不限于,糖化、發(fā)酵、分離的水解和發(fā)酵(SHF)、同步糖化和發(fā)酵(SSF)、同步糖化和共發(fā)酵(SSCF)、混合的水解和發(fā)酵(HHF),和直接微生物轉化(DMC)。SIIF使用分離的處理步驟,首先將纖維素用酶水解為葡萄糖,然后將葡萄糖發(fā)酵成為乙醇。在SSF中,纖維素的酶水解和葡萄糖到乙醇的發(fā)酵組合在一個步驟中(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,in//awt/Z)ooA"cwBz.oe決awo/:/Vocwcrt'o"-awc/C/^7/z"f/o",Wyman,C.E.,ed.,Taylor&Francis,Washington,DC,179-212)。SSCF包括多種糖的共發(fā)酵(Sheehan,J.,和Himmel,M,1999,Enzymes,energyandtheenvironment:AstrategicperspectiveontheU.S.DepartmentofEnergy'sresearchanddevelopmentactivitiesforbioethanol,所她c/,/.尸,15:817-827)。HHF包括在同一個反應器但不同的溫度進行的兩個分開的步驟,即,高溫酶糖化,然后在發(fā)酵菌抹能夠耐受的較低溫度進行SSF。DMC在一個步驟中組合了所有三個過程(纖維素酶產(chǎn)生、纖維素水解和發(fā)酵)(Lynd,L.R.,Weimer,RJ.,vanZyl,W.H.,和Prctorius,I.S.,2002,Microbialcelluloseutilization:Fundamentalsandbiotechnology,緒cra6Zo/.Mq/.所o/.Wev/e鄉(xiāng)66:506-577)。"發(fā)酵"或"發(fā)酵過程"指任何發(fā)酵過程或包含發(fā)酵步驟的任何過程。發(fā)酵過程無限制地包括,用于產(chǎn)生發(fā)酵產(chǎn)品的發(fā)酵過程,所述發(fā)酵產(chǎn)品包括醇(例如,阿拉伯醇、丁醇、乙醇、甘油、曱醇、1,3-丙二醇、山梨醇和木糖醇);有^=幾酸(例如,乙酸、丙酮酸、己二酸、抗壞血酸、4寧^f蒙酸、2,5-二酮-D-葡萄糖酸、蟻酸、反丁烯二酸、葡萄糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羥基丙酸、衣康酸、乳酸、蘋果酸、丙二酸、草酸、丙酸、丁二酸和木質酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、賴氨酸、絲氨酸和蘇氨酸);氣體(例如,曱烷、氫氣(H2)、二氧化石友(C02)和一氧化碳(CO))。發(fā)酵過程還包括在消費品醇工業(yè)(例如,啤酒和酒)、乳制品業(yè)(例如,發(fā)酵乳制品)、皮革業(yè)和煙草業(yè)中使用的發(fā)酵過程。本發(fā)明進一步涉及產(chǎn)生物質的方法,其包括(a)用組合物糖化含纖維素物質,所述組合物包含有效量的具有內(nèi)切葡聚糖酶活性的多肽;(b)用一種或幾種(more)的發(fā)酵微生物發(fā)酵步驟(a)的糖化的含纖維素物質;和(c)從發(fā)酵回收物質。包含具有內(nèi)切葡聚糖酶活性的多肽的組合物可以是去除或不去除細胞的粗發(fā)酵液的形式,或者是半純化或純化的酶制劑形式,或者組合物可以包含本發(fā)明的宿主細胞,作為具有生物質的發(fā)酵過程中有內(nèi)切葡聚糖酶活性的多肽的來源。物質可以是任何源自發(fā)酵的物質。在優(yōu)選的實施方案中,物質是醇。可理解的是,術語"醇"包括包含一個或幾個羥基基團的物質。在更優(yōu)選的實施方案中,所述醇是阿拉伯醇。在另一個更優(yōu)選的實施方案中,所述醇是丁醇。在另一個更優(yōu)選的實施方案中,所述醇是乙醇。在另一個更優(yōu)選的實施方案中,所述醇是甘油。在另一個更優(yōu)選的實施方案中,所述醇是曱醇。在另一個更優(yōu)選的實施方案中,所述醇是1,3-丙二醇。在另一個更優(yōu)選的實施方案中,所述醇是山梨醇。在另一個更優(yōu)選的實施方案中,所述醇是木糖醇。參見,例如,Gong,C.S.,Cao,N.丄,Du,J.,和Tsao,G.T"1999,Ethanolproductionfromrenewableresources,inJc/rawce/w所oc/e脂'ca//i>7g7>e6r—/歷o/ec/z朋/ogy,Scheper,T.,e.d.,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Silveira,M.M.,和Jonas,R.,2002,Thebiotechnologicalproductionofsorbitol,McraZ7/0/.5/她c/mo/.59:400-408;Nigam,P.,和Singh,D.,1995,Processesforfermentativeproductionofxylitol—asugarsubstitute,/VocewB/oc/zem^/T^30(2):117-124;Ezeji,T,C.,Qureshi,N.禾口Blaschek,I-LP.,2003,Productionofacetone,butanolandethanolbyCYa^n'tZ/wm6e,)'e".wd'/BA101andrecoverybygasstripping,Jowtw/0/在另一個優(yōu)選的實施方案中,所述物質是有機酸。在另一個更優(yōu)選的實施方案中,所述有機酸是乙酸。在另一個更優(yōu)選的實施方案中,所述有機酸是丙酮酸。在另一個更優(yōu)選的實施方案中,所述有機酸是己二酸。在另一個更優(yōu)選的實施方案中,所述有機酸是抗壞血酸。在另一個更優(yōu)選的實施方案中,所述有機酸是檸檬酸。在另一個更優(yōu)選的實施方案中,所述有機酸是2,5-二酮-D-葡糖酸。在另一個更優(yōu)選的實施方案中,所述有機酸是蟻酸。在另一個更優(yōu)選的實施方案中,所述有機酸是反丁烯二酸。在另一個更優(yōu)選的實施方案中,所述有機酸是葡萄糖二酸。在另一個更優(yōu)選的實施方案中,所述有機酸是葡糖酸。在另一個更優(yōu)選的實施方案中,所述有機酸是葡糖醛酸。在另一個更優(yōu)選的實施方案中,所述有機酸是戊二酸。在另一個優(yōu)選的實施方案中,所述有機酸是3-羥基丙酸。在另一個更優(yōu)選的實施方案中,所述有機酸是衣康酸。在另一個更優(yōu)選的實施方案中,所述有機酸是乳酸。在另一個更優(yōu)選的實施方案中,所述有機酸是蘋果酸。在另一個更優(yōu)選的實施方案中,所述有機酸是丙二酸。在另一個更優(yōu)選的實施方案中,所述有機酸是草酸。在另一個更優(yōu)選的實施方案中,所述有機酸是丙酸。在另一個更優(yōu)選的實施方案中,所述有機酸是丁二酸。在另一個更優(yōu)選的實施方案中,所述有機酸是木質酸。參見,例如,Chen,R.,和Lee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,腸c/7置腸fe由o/.63-65:435-448。在另一個優(yōu)選的實施方案中,所述物質是酮。可理解的是術語"酮"包括含有一個或幾個酮基的物質。在另一個更優(yōu)選的方面,所述酮是丙酮。參見,例如,Qureshi和Blaschek,2003,見上文。在另一個優(yōu)選的實施方案中,所述物質是氨基酸。在另一個更優(yōu)選的實施方案中,所述有機酸是天冬氨酸。在另一個更優(yōu)選的實施方案中,所述氨基酸是谷氨酸。在另一個更優(yōu)選的實施方案中,所述氨基酸是甘氨酸。在另一個更優(yōu)選的實施方案中,所述氨基酸是賴氨酸。在另一個更優(yōu)選的實施方案中,所述氨基酸是絲氨酸。在另一個更優(yōu)選的實施方案中,所述氨基酸是蘇氨酉^。參見,例長口,Richard,A.,禾口Margaritis,A,,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,所她c/w7o/ogy朋JS/oewg7'wee"'"g87(4):501-515。在另一個優(yōu)選的實施方案中,所述物質是氣體。在另一個更優(yōu)選的實施方案中,所述氣體是甲烷。在另一個更優(yōu)選的實施方案中,所述氣體是H2。在另一個更優(yōu)選的實施方案中,所述氣體是C02。在另一個更優(yōu)選的實施方案中,所述氣體是CO。參見,例如,Kataoka,N"A.Miya,和K.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,5We"ce7fec/mo/ogy36(6-7):41—47;禾口GimaseelanV.N.in萬/ow"^"wdS/oewe/^y,Vol.13(1-2),pp.83-114,1997,Anaerobicdigestionofbiomassformethaneproduction:Areview。從含纖維素物質產(chǎn)生物質通常需要四個主要步驟。這四個步驟是預處理、酶水解、發(fā)酵和回收。下面示例的是產(chǎn)生乙醇的過程,但可理解的是,可以使用相似的過程產(chǎn)生其它物質,例如,上述物質。預處理。在預處理或預水解步驟中,將含纖維素物質加熱以分解木質素和碳水化合物結構,溶解大部分半纖維素,并使纖維素分解酶能夠到達纖維素部分。加熱或者直接用蒸汽進行,或者在漿料中進行,可以向物質加入催化劑以加速反應的進行。催化劑包括強酸,如硫酸和so2,或堿,如氫氧化鈉。預處理階段的目的是促進酶和微生物的滲透。含纖維素生物質還可以經(jīng)過熱蒸汽噴發(fā)的預處理(參見美國專利申請?zhí)?0020164730)。糖化。在酶水解步驟中,所述步驟也稱作糖化,將本文所述酶加入預處理的物質中,將纖維素部分轉化成葡萄糖和/或其它糖。糖化通常在攪拌釜反應器或發(fā)酵罐中,在控制pH、溫度和混合條件下進行。糖化步驟可以持續(xù)長達200小時。糖化可以在約30。C至約65°C,特別是約50。C的溫度,和在約4-約5,尤其是約pH4.5的pH進行。為了產(chǎn)生能由酵母代謝的葡萄糖,通常在存在(3-葡糖苷酶時進行水解。發(fā)酵。在發(fā)酵步驟中,作為預處理和酶水解步驟的結果從含纖維素物質釋放的糖,通過發(fā)酵生物體(如酵母)發(fā)酵成為乙醇。發(fā)酵還可與酶水解在同一個容器中,同樣在控制pH、溫度和混合條件下同時進行。當糖化和發(fā)酵在同一個容器中同時進行時,過程通常稱作同步的糖化和發(fā)酵或SSF。在本發(fā)明的發(fā)酵過程中可以使用任何合適的含纖維素底物或原材料。通常根據(jù)理想的發(fā)酵產(chǎn)品(即,要從發(fā)酵獲得的物質)和使用的方法來選擇底物,如木材或植物殘渣或獲得自能夠由發(fā)酵微生物代謝的經(jīng)處理的含纖維素物質的低分子量糖DPl-3,所述物質可以通過直接向發(fā)酵培養(yǎng)基中加入而提供。術語"發(fā)酵培養(yǎng)基"可理解為指加入發(fā)酵微生物之前的培養(yǎng)基,如,由糖化過程產(chǎn)生的培養(yǎng)基,以及同步的糖化和發(fā)酵過程(SSF)中使用的培養(yǎng)基。"發(fā)酵微生物"指適用于理想的發(fā)酵過程中的任何^:生物。根據(jù)本發(fā)明的合適的發(fā)酵微生物能將糖(如葡萄糖、木糖、阿拉伯糖、甘露糖、半乳糖或寡糖)直接或間接地發(fā)酵(即,轉化)成理想的發(fā)酵產(chǎn)品。發(fā)酵微生物的實例包括真菌生物體,如酵母。優(yōu)選的酵母包括酵母屬菌種,且具體為釀酒酵母。商業(yè)上可得到的酵母包括,例如RedStar⑧/TM/LesaffreEthanolRed(可從RedStar/Lesaffre,USA獲得)、FALI(可乂人Fleischmann,sYeast,BurnsPhilpFoodInc.,USA的部門獲得)、SUPERSTART(可從Alltech獲得)、GERTSTRAND(可從GertStrandAB,Sweden獲得)和FERMIOL(可從DSMSpecialties獲得)。在優(yōu)選的實施方案中,所述酵母是酵母屬。在更優(yōu)選的實施方案中,所述酵母是釀酒酵母。在另一個更優(yōu)選的實施方案中,所述酵母是糖化酵母(S"cc/^raw少caycfoto/Zcw"。在另一個更優(yōu)選的實施方案中,所述酵母是&cc/zarawycasMvan/m。在另一個優(yōu)選的實施方案中,所述酵母是克魯維酵母。在另一個更優(yōu)選的實施方案中,所述酵母是^7w"eraw;/c&swarx/"""s。在另一個更優(yōu)選的實施方案中,所述酵母是A7Myverwwycey/rag/to。在另一個優(yōu)選的實施方案中,所述酵母是念珠菌屬。在另一個更優(yōu)選的實施方案中,所述酵母是假熱帶念珠菌(Caw/Wa戸e"^^^/cafe)。在另一個更優(yōu)選的實施方案中,所述酵母是0^&&6ra^/cae。在另一個優(yōu)選的實施方案中,所述酵母是C7aWwora。在另一個更優(yōu)選的實施方案中,所述酵母是C/av&pora/z^/tow'fle。在另一個更優(yōu)選的實施方案中,所述酵母是C7aW^oraop,"ae。在另一個優(yōu)選的實施方案中,所述酵母是管嚢酵母屬CPac/7,o/w)。在另一個更優(yōu)選的實施方案中,所述酵母是管嚢酵母(尸ac/7,o/e"tom7o;^7ws)。在另一個優(yōu)選的實施方案中,所述酵母是酒香酵母屬CS"ta朋wwj;c")。在另一個更優(yōu)選的實施方案中,所述酵母是克勞森酒香酵母c/flw^w7)(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,in//a"必oo;t/i/oeZ/zawo/:尸廠c^mc"ow<3dC/^7&a"o",Wyman,C.E.,ed"Taylor&Francis,Washington,DC,179-212)??梢杂行У貙⑵咸烟前l(fā)酵成乙醇的細菌包括,例如,運動發(fā)酵單胞菌禾口纟千纟*斗炎菌(C/o^nW/wmAermoce〃Mm)(Philippidis,1996,見上文)。在本領域中公知上述生物體還能用于產(chǎn)生其它物質,如本文所述。在酉良酒酵母(Chen,Z.,Ho,N.W.Y"1993,Cloningandimprovingtheexpressionof尸/c/7/ax/7)7/fcxylosereductasegeneinSacc/zwomyes1cerev/w'ae,如/.腸c/zem.腸/ec/z"o/.39-40:135-147;Ho,N.W.Y.,Chen,Z,Brainard,A.P.,998,Geneticallyengineered&ifcc/7arcw_yc&syeastcapableofeffectivelycofbrmentingglucoseandxylose,寺//.£""v/raw.Mr'crah/o/.64:1852-1859)或纟田菌々口大腸4干菌(Bea11,D.S.,Ohta,K.,Ingram,L.O.,1991,Parametricstudiesofcthanolproductionfromxyloseandothersugarsbyrecombinant£ls'c'/w/c/〃."co//,/^Wec/z.38:296-303)、產(chǎn)酸克雷伯氏菌(《/efc/e〃ao砂toco)(Ingram,L.O,,Gomes,P.F.,Lai,X.,Moni認zaman,M.,Wood,B.E.,Yomano,L.R,York,S.W.,1998,Metabolicengineeringofbacteriaforethanolproduction,所她c/w10/.歷oe"g.58:204-214)和運動發(fā)酵單胞菌(Zhang,M,,Eddy,C.,Deanda,K.,Finkelstein,M.,和Picataggio,S.,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZ少附o附owoywo&7&,iSc/ewce267:240-243;Deanda,K.,Zhang,M.,Eddy,C.,和Picataggio,S.,1996,Developmentofanarabinose-fermentingZ;^wo附owasmo^7hstrainbymetabolicpathwayengineering,智/.£謂.謂.M.cra軀62:4465-4470)中克隆異源基因導致構建能將己糖和戊糖轉化成乙醇(共發(fā)酵)的生物體。通常向降解的纖維素或水解產(chǎn)物中加入酵母或另一種微生物,進行約24至96小時的發(fā)酵,如約35至約60小時。溫度通常在約26。C-約40°C,特別是約32。C,并在約pH3至約pH6,特別是約pH4-5進行。在優(yōu)選的實施方案中,將酵母或另一種微生物施用于降解的纖維素或水解產(chǎn)物,發(fā)酵進行約24至約96小時,如通常35-60小時。在優(yōu)選的實施方案中,溫度通常在約26至約40。C之間,特別是約32。C,而pH通常在約pH3至約pl16、優(yōu)選約pH4-5。優(yōu)選以大約105至1012,優(yōu)選大約107至10'°,特別是大約5x107活菌數(shù)每ml發(fā)酵液的量加入酵母或另一種微生物。在乙醇產(chǎn)生過程階段中,酵母細胞計數(shù)應該優(yōu)選在大約107至101Q,尤其是約2x108的范圍中。關于使用酵母進行發(fā)酵的其它指導可見于例如"TheAlcoholTextbook"(KditorsK.Jacques,T.RLyons和D.R.Kelsall,NottinghamUniversityI)rcss,UnitedKingdom1999)中,所述文獻通過引用并入本文。本領域最廣泛使用的方法是同步的糖化和發(fā)酵(SSF)方法,其中沒有糖化的保留階段,意味著酵母和酶一起添加。對于乙醇產(chǎn)生,在發(fā)酵后蒸餾醪(mash)以提取乙醇。根據(jù)本發(fā)明的方法獲得的乙醇可以用作,例如燃料乙醇;飲料乙醇,即,中性飲料酒,或工業(yè)乙醇。發(fā)酵刺激劑可以與本文所述的任何酶過程結合使用,以進一步改進發(fā)酵過程,而且特定地,改進發(fā)酵微生物的性能,如,速率增加和乙醇得率。"發(fā)酵刺激劑"指用于發(fā)酵微生物(特別是酵母)生長的刺激劑。優(yōu)選的用于生長的發(fā)酵刺激劑包括維生素和礦物質。維生素的實例包括多種維生素、生物素、泛酸、煙酸、內(nèi)消旋肌醇(meso-inositol)、硫胺、維生素B6(pyridoxine)、對氨基笨甲酸、葉酸、核黃素和維生素A、B、C、D和E。參見,例如,Alfenore等,ImprovingethanolproductionandviabilityofSacc/wrawjceycerev/s/flebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag(2002),其通過引用并入本文。礦物質的實例包括能夠提供營養(yǎng)的礦物質和礦物質鹽,所述營養(yǎng)包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。從發(fā)酵的含纖維素物質中分離醇,并通過蒸餾的常規(guī)方法純化。能夠獲得純度高達約96vo1.%的乙醇,其可以用作,例如,燃料乙醇、飲料乙醇(即,中性^:料酒)或工業(yè)乙醇。對于其它物質,可以使用本領域已知的任何方法,所述方法包括但不限于層析(例如,離子交換、親和、疏水、層析聚焦和大小排阻)、電泳方法(例如,制備型等電聚焦)、差示溶解度(例如,石克酸銨沉淀)、SDS-PAGE、蒸餾或提取。在本發(fā)明的方法中,可以向具有內(nèi)切葡聚糖酶活性的多肽和其它纖維素分解蛋白質補充一種或幾種其它酶活性,以改進含纖維素物質的降解。優(yōu)選的其它酶是半纖維素酶、酯酶(例如,脂肪酶、磷脂酶和/或角質酶)、蛋白酶、漆酶、過氧化物酶,或它們的混合物。在本發(fā)明的方法中,可以在發(fā)酵前或發(fā)酵過程中(包括在繁殖發(fā)酵微生物的過程中或之后)加入其它酶。前肽和信號肽本發(fā)明還涉及核酸構建體,所述核酸構建體包含編碼蛋白質的基因,該基因與第一核苷酸序列和第二核苷酸序列中的一個或兩個可操作地連接,其中第一核苷酸序列編碼信號肽,所述信號肽包含SEQIDNO:4的氨基酸1至16、SEQIDNO:6的氨基酸1至15、SEQIDNO:8的氨基酸1至21,或SEQIDNO:10的氨基酸1至16;或由SEQIDNO:4的氨基酸1至16、SEQIDNO:6的氨基酸1至15、SEQIDNO:8的氨基酸l至21,或SEQIDNO:10的氨基酸l至16組成;而第二核苷酸序列編碼前肽,所述前肽包含SEQIDNO:10的氨基酸17至24或由SEQIDNO:10的氨基酸17至24組成,其中基因對于第一個和第二核苷酸序列是外源的。在優(yōu)選的方面,第一核苷酸序列包含SEQIDNO:3的核苷酸19至69,或者由SEQIDNO:3的核苷酸19至69組成。在另一個優(yōu)選的方面,第一核苷酸序列包含SEQIDNO:5的核苷酸39至83,或者由SEQIDNO:5的核苷酸39至83組成。在另一個優(yōu)選的方面,第一核苷S拼列包含SEQIDNO:7的核苷酸M至76,或者由SEQIDNO:7的核苷酸14至76組成。在另一個優(yōu)選的方面,第一核苷酸序列包含SEQIDNO:9的核芬酸1至48,或者由SEQIDNO:9的核苷酸1至48組成。在另一個優(yōu)選的方面,第二核香酸序列包含SEQIDNO:9的核苷酸49至72,或者由SEQIDNO:9的核芬酸49至72組成。本發(fā)明還涉及包含這種核酸構建體的重組表達載體和重組宿主細胞。本發(fā)明還涉及用于產(chǎn)生蛋白質的方法,包括(a)在適合于產(chǎn)生所述蛋白質的條件下培養(yǎng)這樣的重組細胞;和(b)回收所述蛋白質。所述蛋白質對于宿主細胞可以是天然的或異源的。術語"蛋白質"在本文的意思不是指特定長度的編碼產(chǎn)物,并且因此包含肽、寡肽和蛋白質。術語"蛋白質"還包含組合以形成編碼產(chǎn)物的兩種或兩種以上多肽。所述蛋白質還包括雜合多肽,其包含部分或全部多肽序列的組合,所述多肽序列從至少兩種不同的蛋白質獲得,其中一個或幾個對于宿主細胞可以是異源或天然的。蛋白質進一步包括上述蛋白質和雜合蛋白質天然存在的等位基因變異和工程的變異。優(yōu)選蛋白質是激素或其變體、酶、受體或其部分、抗體或其部分,或報告蛋白(reporter)。在更優(yōu)選的方面,所述蛋白質是氣化還原酶、轉移酶、水解酶、裂合酶(lyase)、異構酶或連接酶。在更加優(yōu)選的方面,所述蛋白質是氨肽酶、淀粉酶、糖酶、羧肽酶、過氧化氫酶、纖維素酶、幾丁質酶、角質酶、環(huán)糊精糖基轉移酶、脫氧核糖核酸酶、酯酶、a-半乳糖苷酶、卩-半乳糖苷酶、葡糖淀粉酶、a-葡糖苷酶、)3-葡糖苷酶、轉化酶、漆酶、另外的脂肪酶、甘露糖芬酶、變位酶(mutanase)、氧化酶、果膠分解酶、過氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉谷氨酰胺酶或木聚糖酶。基因可以從任何原核、真核或其它來源獲得。通過以下實施例進一步對本發(fā)明進行描述,但不應將其理解為對本發(fā)明范圍的限制。實施例材料作為緩沖液和底物使用的化學品是至少試劑等級的商業(yè)產(chǎn)品。菌抹將嗜熱毀絲霉CBS117.65、擔子菌CBS494.95、擔子菌CBS495.95和巴西青霉菌株IBT20888(IBT真菌保藏中心,丹麥科技大學,哥本哈根,丹麥)用作內(nèi)切葡聚糖酶基因的來源。將釀酒酵母菌抹W3124(MATa;ura3-52;leu2-3,112;his3-D200;pep4-1137;prcl::HIS3;prbl::LEU2;cir+)用于篩選嗜熱毀絲霉CBS117.65的內(nèi)切葡聚糖酶活性表達庫。米曲霉HowB104(a-淀粉酶陰性)用于表達ce/5a基因。培養(yǎng)基和溶液LB培養(yǎng)基由如下物質組成每升10g胰蛋白胨、5g酵母提取物和5g氯化鈉。LB氨千青霉素培養(yǎng)基由如下物質組成每升10g胰蛋白胨、5g酵母提取物、5g氯化鈉和每毫升50呢氨芐青霉素(過濾器滅菌,高壓滅菌后加入)。LB氨芐青霉素平板由如下物質組成每升LB氨芐青霉素培養(yǎng)基和15g細菌用瓊脂(BactoAgar)。YPD培養(yǎng)基由如下物質組成1%酵母提取物、2%蛋白胨和高壓滅菌后加入的過濾滅菌的2%葡萄糖。YPM培養(yǎng)基由如下物質組成1%酵母提取物、2%蛋白胨和高壓滅菌后加入的過濾滅菌的2%麥芽糖糊精。含有半乳糖的SC-URA培養(yǎng)基由如下物質組成每升100ml10xBasal鹽、28ml20。/o不含維生素的酪蛋白氨基酸、10mll。/。色氨酸、3.6ml5。/。蘇氨酸(過濾滅菌,高壓滅菌后加入),和100ml20%半乳糖(過濾滅菌,高壓滅菌后力口入)。含有葡萄糖的SC-URA培養(yǎng)基由如下物質組成每升100ml10xBasal鹽溶液、28ml20。/。不含維生素的酪蛋白氨基酸、10mll。/。色氨酸、3.6ml5%蘇氨酸(過濾滅菌,高壓滅菌后加入),和100ml20。/。葡萄糖(過濾滅菌,高壓滅菌后力口入)。10xBasal鹽溶液由下述物質組成每升75g酵母氮石咸基(yeastnitrogenbase)、113g丁二酸和68gNaOH。SC-瓊脂由下述物質組成每升SC-URA培養(yǎng)基(如上所述含有葡萄糖或半乳糖)和20g瓊脂。含有半乳糖的0.1%AZCLHE纖維素SC瓊脂平板由下述物質組成每升含有半乳糖的SC-URA培養(yǎng)基,20g瓊脂和0.1%AZCLHE纖維素(Megazyme,Wicklow,Ireland)。BA培養(yǎng)基由下述物質組成每升10g玉米漿干物質、10gNH4NO3、10gKH2P()4、0.75gMgS04-7H20、0.1ml普盧蘭尼克(pluronic)和0.5gCaC〇3。高壓滅菌前將pH調(diào)至6.5。COVE平板由下述物質組成每升342.3g蔗糖、25gNoble瓊脂、20mlCOVE鹽溶液、10mM乙酰胺和20mMCsCl。高壓滅菌前將溶液調(diào)至pH7.0。COVE鹽溶液由下述物質組成每升26gKCl、26gMgS04'7H20、76gKII2P04和50mlCOVE痕量金屬。Cove痕量金屬溶液由如下物質組成每升0.04gNa2B4O7'10H2O、0.4gCuS04-5H20、1.2gFeS04-7H20、0.7gMnS04H20、0.8gNa2Mo02.2H20和10gZnS04'7H20。由10mMTrispH7.4和0.1mMEDTA組成。實施例1:釀酒酵母中嗜熱毀絲霉CBS117.65cDNA表達文庫的構建將嗜熱毀絲霉CBS117.65在200mlBA培養(yǎng)基中,在30。C、200rpm培養(yǎng)5天。通過經(jīng)襯以Miracloth(Ca舊iochem,SanDiego,CA,USA)的漏斗過濾內(nèi)容物,來收獲來自所述搖瓶培養(yǎng)物的菌絲體。然后將菌絲體夾在兩片Miracloth中間,并用吸水紙巾吸干。然后將菌絲體團轉移至Falcon1059塑料離心管并在液氮中冷凍。將冷凍的菌絲體保存于-8(TC水箱中直至使用。用硫氰酸胍進行總RNA提取,然后通過5.7MCsCl緩沖(cushion)超速離心,并使用WO94/14953中所述的方法,通過oligo(dT)-纖維素親和層析來進行poly(A)+RNA的分離。通過RNaseH方法(Gubler和Hoffman,1983,G匿25:263-269,Sambrook等,1989,Mo/ecwAarc/函'wgv」/a/)ora/ory廳《腦八ColdSpringHarborlab.,ColdSpringHarbor,NY,USA)從5叱poly(A)+RNA合成雙鏈cDNA。在預先珪化、不含RNase的Eppendorf管中,將poly(A)+RNA(5嗎于5piDEPC(0.1%焦碳酸二乙酯(diethylpyrocarbonate))處理過的水中)在"70。C加熱8分鐘,在冰上冷淬,并與反轉錄酶緩沖液混合,終體積為50(11,所述反轉錄酶緩沖液由下述物質組成50mMTris-HCl,pH8.3,75mMKCl,3mMMgCl2,10mM二石克蘇糖醇(DTT)(BethesdaResearchLaboratories,Bethesda,MD,USA),1mMdATP、dGTP和dTTP,和0.5mM5-曱基-dCTP(Pharmacia,Uppsala,Sweden),40單位的人胎盤核糖核酸酶抑制劑(RNasin,Promega,Madison,WI,USA),1.45嗎oligo(dT)l8-A^I引物(Pharmacia),和1000單位的SuperscriptIIRNaseII反轉錄酶(BethesdaResearchLaboratories)。通過在45。C將反應混合物溫育1小時而合成第一鏈cDNA。合成后,根據(jù)制造商的說明書,通過MicroSpinS-400HR旋轉柱(Pharmacia)將mRNA:cDNA雜合混合物凝膠過濾。凝膠過濾后,在250|il第二鏈緩沖液(20mMTris-HCl,pH7.4,90mMKCl,4.6mMMgCI2,10mM(NH4)2S04,0.16mMNAD)中稀釋雜合物,所述緩沖液包含200(iM每種dNTP,60單位大腸桿菌DNA聚合酶(Pharmacia),5.25單位RNaseII(Promega),和15單位大腸桿菌DNA連才妄酶(BoehringerMannheim,Manhcim,Germany)。通過將反應管在16。C溫育2小時和在25。C再溫育15分鐘,進行第二鏈cDNA合成。通過加入EDTA至終濃度20mM而終止反應,然后進行笨酚和氯仿提取。通過加入2體積96%乙醇和0.2體積10M乙酸銨,在-20。C將雙鏈cDNA沉淀20小時,然后13,000xg離心,用700/o乙醇清洗,干燥,并在30}il綠豆(Mungbean)核酸酶緩沖液(30mM乙酸鈉pH4.6,300mMNaCl,1mMZnS04,0.35mMDTT,2%甘油)中重懸,所述緩沖液包含25單位綠豆核酸酶(Pharmacia)。通過在30。C將反應物溫育30分鐘,使單鏈發(fā)夾DNA形成發(fā)夾結構(clip),然后加入70(il10mMTris-HCl-1mMEDTApH7.5,酚提取,并用2體積96%乙醇和0.1體積3M乙酸鈉pH5.2在冰上沉淀30分鐘。通過在13,000xg離心回收雙鏈cDNA,并通過將反應混合物在16。C溫育1小時,在30)alT4DNA聚合酶緩沖液(20mMTris-乙酸,pH7.9,10mM乙酸鎂,50mM乙酸鉀,1mMDTT)中將cDNA平端化,所述緩沖液中包含0.5mM每種dNTP和5單位T4DNA聚合酶(NewEnglandBiolabs,Ipswich,MA,USA)。通過加入EDTA至終濃度20mM而終止反應,然后進行苯酚和氯仿提取,并通過加入2體積96%乙醇和0.1體積3M乙酸鈉pH5.2,在-20。C沉淀12小時。填充反應后,通過在13,000xg離心而回收cDNA,在70%乙醇中清洗,并干燥。將cDNA沉淀重懸于25^包含下面所示2.5|ig非-回文SwXI銜接頭(Invitrogen,Carlsbad,CA,USA)和30單位T4連接酶(Promega)的連"l妄緩沖液(30mMTris-HCl,pH7.8,10mMMgCl2,10mMDTT,0.5mMATP)中,然后在16。C溫育12小時。通過在65。C加熱20分鐘而終止反應,然后在冰上冷卻5分鐘。5'-CTTTCCAGCACA-3'(SEQIDNO:1)3'-GAAAGGTC-5'(SEQIDNO:2)將連4妾的cDNA用AWI消化,然后在37。C溫育2.5小時。通過在65°C加熱10分鐘而終止反應。通過在44mMTris堿、44mM硼酸、0.5mMEDTA(TBE)緩沖液中的0.8%S叫PlaqueGTG低熔點瓊脂凝膠(CambrexCorporation,I-:astRutherford,NJ,USA)上進行凝膠電泳而將cDNA按大小分級,從而分離未連接的銜接頭。用0.7kb為截止點選擇cDNA的大小,并根據(jù)制造商的說明書,通過使用(3-瓊脂糖(NewEnglandBiolabs,Ipswich,MA,USA)將cDNA從凝膠中回收(rescue),并通過加入2體積96%乙醇和0.1體積3M乙酸鈉pH5.2,在-20。C沉淀12小時。通過在13,000xg離心而回收定向的大小經(jīng)過選擇的cDNA,在70%乙醇中清洗,干燥,然后重懸于300mMTris-HC1-1mMEDTApH7.5中。根據(jù)制造商的說明書,通過MicroSpinS-300HR旋轉柱,用凝膠過濾將cDNA脫鹽。在10i!l連接緩沖液(30mMTris-HCl,pH7.8,10mMMgCl2,10mMDTT,0.5mMATP)中進行三個測試連接,所述緩沖液包含5}il雙鏈cDNA(反應管/H和#2)、15單位的T4連接酶(Promega)和30ng(管#1)、40ng(管#2)和40ng(管#3,載體背景對照)的經(jīng)XI-W/I切割的pYES2,0載體(Invitrogen,Carlsbad,CA,USA)。通過在16。C溫育12小時而進行連接反應,然后在70°C加熱20分鐘,最后向每管中加入10^水。如Sambrook等,1989,見上文所述,將1|il每個連接混合物電穿孔入40jil大腸桿菌DH10B電感受態(tài)細胞(BcthcsdaResearchLaboratories)中。在由匯集物(pool)組成的大腸桿菌DH10B中建立嗜熱毀絲霉CBS117.65cDNA文庫。通過下述制備匯集物將轉化的大腸桿菌涂布于LB氨芐青霉素平板上,在37。C溫育24小時后,得率為15,000-30,000菌落/平板。向平板加入20mlLB氨卡青霉素培養(yǎng)基,并將細胞懸浮于其中。在50ml管中,在100rpm、37。C將細胞懸浮液振蕩1小時。得到的嗜熱毀絲霉CBS117.65cDNA文庫由約106個單獨克隆組成,載體背景占1%。根據(jù)制造商的說明書,使用PlasmidMidiKit(QIAGENInc.,Valencia,CA,USA)分離來自一些文庫匯集物的質粒DNA,并在-20。C保存。實施例2:篩選嗜熱毀絲霉CBS117.65表達文庫的內(nèi)切葡聚糖酶活性將來自一些文庫匯集物的純化的質粒DNA(100ng/ml)的1ml等分試樣(實施例l)通過電穿孑L(Becker和Guarante,1991,iWef/zoA£"2>wo/.194:182-187)轉化入釀酒酵母W3124,將轉化子涂布到包含2%葡萄糖的SC瓊脂上,并在30。C溫育??傮w地,從每個匯集物中獲得包含250-400個酵母克隆的50-100個平板。在3-5天溫育后,將SC瓊脂平板影印到含有半乳糖的一組0.1%AZCLHE纖維素SCURA瓊脂平板上。在30。C溫育平板2-4天,并將被藍色暈圏環(huán)繞的菌落鑒定為內(nèi)切葡聚糖酶陽性的克隆。實施例3:表征嗜熱毀絲霉CBS117.65ce/5a基因將表達內(nèi)切葡聚糖酶的酵母菌落接種到50ml玻璃試管中的20mlYPD培養(yǎng)基中。在30。C、200rpm,將試管振蕩培養(yǎng)2天。在具有75002252轉子(IIanau,Ge醒ny)的HeraeusMegafugel.OR離心機中,通過3000rpm離心10分鐘收獲細胞。根據(jù)WO94/14953分離DNA,并將DNA溶于50pi去離子水中。根據(jù)Sambrook等,1989,見上文,使用標準程序將DNA轉化到大腸桿菌DH10B細胞中。隨后將顯示出包含嗜熱毀絲霉CBS117.65ce/5a基因的大腸桿菌轉化子命名為pCIC161(圖1),并用作生物材料保藏的材料。將大腸桿菌菌抹pCIC161于2006年2月23日保藏為大腸桿菌NRRLB-30902。根據(jù)Sambrook等,1989,見上文,使用標準程序從大腸桿菌轉化子中分離質粒DNA。根據(jù)制造商的說明書,用TaqDyeDeoxyTerminatorCycleSequencingKit(PerkinElmer,Wellesley,MA,USA),用AppliedBiosystemsABIPRISM377DNASequencer(ABI,FosterCity,CA,USA)和合成的寡核苷酸引物,將來自嗜熱毀絲霉CBS117.65的"/5a基因的全長cDNA序列測序。嗜熱毀絲霉ce/5a基因的核苷酸序列(SEQIDNO:3)和推導的氨基酸序列(SIQIDNO:4)示于圖2中。編碼序列1170bp,其中包括終止密碼子。編碼的預計蛋白質包含389個氨基酸。基因的編碼區(qū)域的。/。G+C是63.6%,而成熟多肽編碼區(qū)域的。/。G+C是63.6%。使用第三版的SignalP程序(Nielsen等,1997,尸rafe/"五"g/"eer^g10:l-6)預測了16個殘基的信號肽。預測的成熟蛋白質包含373個氨基酸,分子量為40.9kDa。用Interproscan禾呈序(Zdobnov禾口Apweiler,2001,B/o/"/wma"cs17:847-848)分析ce/5a基因的推導的氨基酸序列,顯示CEL5A蛋白質包含家族5糖基水解酶的核心序列類型,從約氨基酸殘基77延伸至預測的成熟多肽的殘基350。CKL5A蛋白質還包含I型真菌纖維素結合域(CBMI)的序列標記。這個稱為Prosite型PS00562(Sigrist等,2002,Sn'e/傷o/"/om7.3:265-274)的序列標記存在于預測的成熟多肽的氨基酸殘基8至殘基35。使用Needleman-Wunsch算法(Needleman和Wunsch,1970,/Mo/.5/。/,48:443-453)如在具有缺口開放罰分10、缺口延伸罰分0.5和EBLOSUM62矩陣l;MBOSS的Needle軟件中所實施的,來確定氨基酸序列的比較配對全局比對(comparativepairwiseglobalalignment)。比對顯示,編碼CEL5A成熟多肽的嗜熱毀絲霉基因的推導氨基酸序列與來自粗糙脈孢菌和特異腐質霉的兩個家族5糖基水解酶蛋白的推導氨基酸序列(登錄號分別為Q7SDR1和Q12624)分別具有75%和72%的同一性(缺口除外)。實施例4:在米曲霉中表達嗜熱毀絲霉CBS117.65ce/5a基因使用〃,'WIII和W"I,將嗜熱毀絲霉CBS117.65ce/5"基因從pYES2.0載體上切下,使用標準方法(Sambrook等,,見上文)連接到曲霉屬表達載體pIID414(EP238023,WO93/11249)中。曲霉屬表達載體pHD414是p775(EP238023)的衍生物。得到的質粒命名為pA2C161(圖3)。如WO95/02043所述制備米曲霉HowB104的原生質體。將一百孩i升原生質體懸浮液與10)ilSTC中的5-25嗎曲霉屬表達載體pA2C161混合,所述STC由1.2M山梨醇、10mMTris-HCl,pH7.5、10mMCaCl2組成;進一步與5-25fig攜帶構巢曲霉"附必基因的質粒p3SR2混合(Christensen等,l988,/^'o/Tec/mo/ogy6:1419-1422)。將混合物在室溫放置25分鐘。加入兩百微升60%P1(G4000(BDH,Poole,England)(聚乙二醇,分子量4000)、10mMCaCl2,和10mMTris-HClpH7.5,溫和混合,最后加入0.85ml同樣的:;容液并溫和混合。將混合物在室溫放置25分鐘,以2,500xg離心15分鐘,并將沉淀重懸于2ml1.2M山梨醇中。重復沉淀過程,并將原生質體涂布于COVE平板上。在37。C溫育4-7天后,挑選孢子并涂布,以分離單菌落。重復這個過程,并保存第二次重分離之后的單菌落孢子。在10mlYPM培養(yǎng)基中接種每個轉化子。在30°C、200rpm溫育2-5天后,去除上清液。通過下述方法鑒定內(nèi)切葡聚糖酶活性向0.P/。AZCLHE纖維素SC-瓊脂平板中打孔形成的4mm直徑的孔施加20pl培養(yǎng)液,并在30。C過夜溫育。然后通過菌落周圍的藍色暈圈鑒定內(nèi)切葡聚糖酶活性。幾個轉化子培養(yǎng)液具有的內(nèi)切葡聚糖酶活性顯著高于來自未轉化米曲霉背景對照的培養(yǎng)液的活性,這證明來自嗜熱毀絲霉CBS117.65的CEL5A內(nèi)切葡聚糖酶在米曲霉中有效表達。實施例5:在釀酒酵母中構建擔子菌CBS495.95cDNA表達文庫如實施例1中所述,在大腸桿菌中構建來自擔子菌CBS495.95由約106個單獨克隆組成的cDNA文庫,具有1%的載體背景。實施例6:篩選擔子菌CBS495.95cDNA表達文庫的內(nèi)切葡聚糖酶活性如實施例2所述進行cDNA文庫(實施例5)的篩選。實施例7:表征來自擔子菌CBS495.95的CEL5A編碼基因如實施例3所述從擔子菌CBS495.95克隆ce/5"基因。然后將顯示出包含ce/5a基因的一個大腸桿菌轉化子命名為pCIC453(圖4),并用作生物材料保藏的材料。將大腸桿菌菌抹pCIC453于2006年2月23日保藏為大腸桿菌NRRLB-30903。使用////WIII和laI將擔子菌CBS495.95ce/5a基因從pCIC453剪切下來,并連接到曲霉屬表達載體pHD414中。將得到的質粒命名為pA2C453(圖5)。圖6中顯示了CBS495.95ce/5a基因的核苷酸序列(SEQIDNO:5)和推定的氨基酸序列(SEQIDNO:6)。編碼序列為1194bp,其中包括終止密碼子。所述基因的編碼區(qū)域的。/。G+C是59.8%,而成熟多肽編碼區(qū)域的。/oG+C是60.1%。編碼的預測蛋白質包含397個氨基酸。使用第三版的SignalP軟件(Nielsen等,1997,見上文)預測了15個殘基的信號肽。預測的成熟蛋白質包含382個氨基酸,分子量為40,1kDa。用Interproscan程序(Zdobnov和Apweiler,2001,見上文)分析ce/5"基因的推導的氨基酸序列,顯示CEL5A蛋白質包含家族5糖基水解酶的核心序列類型,從預測的成熟多肽的約殘基81延伸至殘基359。CEL5A蛋白質還包含I型真菌纖維素結合域(CBMI)的序列標記。這個稱為Prosite型PS00562(Sigrist等,2002,見上文)的序列標記存在于預測的成熟多肽的氨基酸殘基8至殘基36。4吏用Needleman-Wunsch算'法(Needleman禾口Wunsch,1970,見上文)長口在具有缺口開放罰分10、缺口延伸罰分0.5和EBLOSUM62矩陣的EMBOSS的Needle程序中所實施的來確定氨基酸序列的比較配對全局比對。比對顯示,編碼CEL5A成熟多肽的CBS495.95基因的推導的氨基酸序列與來自/rpex/a"ew和rrawe/w/z/rwto的兩個家族5糖基水解酶蛋白的推導氨基酸序列(登錄號分別為Q5W7K4和Q75UV6)分別具有82%和79%的同一性(缺口除外)。實施例8:來自擔子菌CBS495.95的ce/5a基因在米曲霉中表達如實施例4中所述,表達來自擔子菌CBS495.95的ce/5a基因,并進行內(nèi)切葡聚糖酶活性的分析。實施例9:在釀酒酵母中構建擔子菌CBS494.95cDNA表達文庫如實施例1中所述,在大腸桿菌中構建來自擔子菌CBS494.95由約106個單獨的克隆組成的cDNA文庫,載體背景為1%。實施例10:篩選擔子菌CBS494.95cDNA表達文庫的內(nèi)切葡聚糖酶活性如實施例2中所述,進行cDNA文庫(實施例9)的篩選。實施例11:來自擔子菌CBS494.95的CEL5B編碼基因的表征如實施例3中所述,進行來自擔子菌CBS494.95的ce/56基因的克隆。然后將顯示出包含CBS494.95ce/M基因的一個大腸桿菌轉化子命名為pCIC486(圖7),并用作生物材料保藏的材料。將大腸桿菌菌抹pCIC486于2006年2月23日保藏為大腸桿菌NRRLB-30904。使用K戶I和屈oI將擔子菌CBS494,95ce/M基因從pYES2,0剪切下來,并連接到曲霉屬表達載體pHD423中(Lassen等,2001,Em^'ra"M,'cro/^/67:4701~4707),所述載體是在多接頭中具有I位點的pHD414衍生物。將獲得的質粒命名為pA2C486(圖8)。圖9中顯示了CBS494.95ce/56基因的核苷酸序列(SEQIDNO:7)和推導的氨基酸序列(SEQIDNO:8)。編碼序列為1290bp,其中包括終止密碼子。所述基因的編碼區(qū)域的。/。G+C是56.0%,而成熟多肽編碼區(qū)域的。/。G+C是56.1%。編碼的預測蛋白質包含429個氨基酸。使用第三版的SignalP軟件(Nielsen等,1997,見上文)預測了21個殘基的信號肽。預測的成熟蛋白質包含408個氨基酸,分子量為43.1kDa。用Interproscan程序(Zdobnov和Apweiler,2001,見上文)分析ce/56基因的推導的氨基酸序列,顯示CEL5B蛋白質包含核心序列類型的家族5糖基水解酶,從預測的成熟多肽的約氨基酸殘基106延伸至殘基385。CEL5A蛋白質還包舍I型真菌纖維素結合域(CBMI)的序列標記。這個稱為Prosite型PS00562(Sigrist等,2002,見上文)的序列標記存在于預測的成熟多肽的氨基酸殘基7至殘基34。使用Ncedleman-Wunsch算法(Needleman和Wunsch,1970,見上文)如在具有缺口開放罰分io、缺口延伸罰分0.5和EBLOSUM62矩陣的EMBOSS的Needle程序中所實施的來確定氨基酸序列的比較配對全局比對。比對顯示,編碼CEL5A成熟多肽的CBS495.95基因的推導氨基酸序列與來自/rpex/a"ew和rra附efes、的兩個家族5糖基水解酶蛋白的推導的氨基酸序列(登錄號分別為Q5W7K4和Q75UV6)分別具有69%和67%的同一性(缺口除外)。實施例12:在米曲霉中表達來自擔子菌CBS494.95的CELSB如實施例4中所述,進行來自擔子菌CBS494.94的ce/J^基因的表達,和內(nèi)切葡聚糖酶活性的分析。實施例13:來自嗜熱毀絲霉CBS117.65、擔子菌CBS49(95和擔子菌CBS495.95的重組內(nèi)切葡聚糖酶的純化使用基本如Otzen等,1999,iVoto'"8:1878-87所述的頭見程,將如實施例4、8和12中所述,在米曲霉中重組產(chǎn)生的來自嗜熱毀絲霉CBS1l7.65、擔子菌CBS494.95和擔子菌CBS495.95的內(nèi)切葡聚糖酶純化成為均質。才艮4居BCAProteinAssayReagentKit(PierceChemicalCo.,Rockford,IL,USA)的制造商的說明,使用雙辛可寧酸(Bicinchoninicacid)(BCA)微孔板試驗確定酶制劑中的蛋白質濃度。在每次實驗前,從保存的酶溶液中新鮮制備酶稀釋液,所述保存的酶溶液在-20。C保存。實施例14:從巴西青霉IBT20888分離基因組DNA才艮才居Carlsen,1994,Ph.D.thesis,DepartmentofBiotechnology,TheTechnicalUniversityofDenmark,以稻繁殖巴西青霉菌抹IBT20888的孢子。用20ml0.1%Tween20回收孢子,并以口106孢子每毫升的濃度接種入100mlMandels和Weber培養(yǎng)基(Mandels和Weber,1969,/Wv.C/zem.95:394-414)中,所述培養(yǎng)基在500ml帶擋板的搖瓶中包含1%葡萄糖,每升補充0.25g酵母提取物和0.75g細菌用蛋白胨。在30。C、150rpm好氧生長24小時后收獲真菌菌絲體。通過NalgeneDS0281-5000過濾器(NalgeNuncInternationalCorporation,Rochester,NY,USA)過濾收集菌絲體,直到干燥并在液氮中凍存。在干冰冷凍研磨臼中將冷凍的菌絲體研磨成粉,并分配于有螺旋帽的管中。將粉懸浮于總體積40ml的50mMCAPS(3-(環(huán)己基氨基)-l-丙磺酸)-NaOHpH11緩沖液中,所述緩沖液包含0.5。/。十二烷基^L酸鋰和0.5mMEDTA。將懸浮液在60°C放置2小時,定時地倒置重懸。向懸浮液中加入用0.1MTris堿中和的等體積笨酚:氯仿(l:l體積比),將管在轉輪上在37。C混合2小時。在SorvallH1000B轉頭中在2500rpm離心10分鐘后,用苯酚:氯仿(l:1體積比)重新萃取水相(上層相),并在15,000xg離心5分鐘。在第二次萃取得到的水相中加入2.5M乙酸銨(10M儲液),并置于-20。C至冷凍。融化后,在冷凍轉頭中15,000xg將萃取液(extract)離心20分鐘。去除沉淀(主要是rRNA),通過加入0.7體積的異丙醇使上清液中的核酸沉淀。15,000xg離心15分鐘后,用5ml0。/o乙醇將沉淀沖洗三次(不重懸),幾乎完全風千,并溶于l.OmlO.lxTE中。將溶解的沉淀轉移至兩個1.5ml的微離心管中。通過加入乙酸4妄(0.125ml)至2.0M和乙醇至63%(1.07ml),使核酸沉淀,并在SorvallMC12V微離心機(KendroLaboratoryProducts,Asheville,NC,USA)中以最大速度離心10分鐘。用70%乙醇沖洗沉淀兩次,完全風干,并溶于500pi0.1xTE中。實施例15:制備巴西青霉IBT20888的基因組DNA文庫使用TOPOShotgunSubcloningKit(Invitrogen,Carlsbad,CA,USA)構建基因組文庫。簡而言之,在10psi氮氣中將總細胞DNA通過霧化(nebulization)進行15秒剪切,并使用40mMTris石成-20mM乙酸鈉-lmMEDTA二鈉(TAE)緩沖液,在lQ/。瓊脂糖凝膠上進行大小分級(size-fractionate)。將在大小范圍3-6kb遷移的DNA片段剪切并使用MidEluteTMGelExtractionKit(QIAGENInc,Valencia,CA,USA)洗脫。使用如上的1%瓊脂糖將洗脫的片段再次進行大小分級,將在大小范圍3-6kb中遷移的DNA片段剪切并使用MiniEluteGelExtractionKit洗脫。<吏用蟲下石威'性石粦酉交酶(RocheAppliedScience,Manheim,Germany),4尋;先脫的DNA片段平端修復并去磷酸化。根據(jù)制造商的說明書,將平端DNA片段克隆到pCR4Blunt-TOPO載體(Invitrogen,Carlsbad,CA,USA)中,通過電穿孔轉化到電感受態(tài)大腸桿菌TOP10細胞中,并涂布于LB氨芐青霉素平板上。電穿孔得到15,300個克隆。實施例16:來自巴西青霉IBT20888的天然CEL5C內(nèi)切葡聚糖酶的純化^口j0rgensen等,2003(五"zymeM;fcra6.Tec/zm/.32:851—861)聲斤述,4奪內(nèi)士刀葡聚糖酶純化并進行實驗。底物是氮-羧曱基纖維素(azo-carboxymethylcellulose)(MegazymeInternationalIrelandLtd.,Bray,Ireland),i咅育時間是15分鐘。將純化的酶在-20。C凍存。實施例17:來自巴西青霉IBT20888的CEL5C內(nèi)切葡聚糖酶的N端測序將巴西青霉CEL5C內(nèi)切葡聚糖酶的純化樣品(實施例16)解凍。將樣品的100}il等份試樣加入Eppendorf管中的100^SDS-PAGE樣品緩沖液(4ml0.5MTRJS-HC1,pH6.8,20ml10%SDS,20ml甘油(87%),56mlMilli-Q⑧超純水和15粒溴酚藍),并加熱至95。C4分鐘。加熱后,將稀釋樣品的四個20jil等份試樣分別施用于預制的4-20%SDS聚丙烯酰胺凝膠(Invitrogen,Carlsbad,CA,USA)。除了四個包含樣品的泳道外,還將Mark12蛋白質標準混合物(Invitrogen,Carlsbad,CA,USA)施加于凝膠。在XcellSureLockTM凝膠設備(Invitrogen,Carlsbad,CA,USA)中跑膠90分鐘,起始的能量設定為40mA于最大135V。電泳后,在印跡溶液中將凝膠溫育5分鐘,所述溶液由包含6%曱醇的10mMCAPSpH11組成。將ProBlott膜(AppliedBiosystems,FosterCity,CA,USA)在純曱醇中浸濕1分鐘,然后在印跡溶液中放置5分鐘從而用含6%曱醇的10mMCAPSpH11使膜飽和。如下在SemiDryBlotterII設備(KemEnTec,Copenhagen,DK)中進行電印跡。將在印跡溶液中浸濕的六張Whatman1號紙置于印跡設備的陽極上,然后加入ProBlott膜、聚丙烯酰胺凝膠和六張在印跡溶液中浸濕的Whatman1號紙。因此使陰性電極接觸上層Whatman1號紙,從而組裝印跡設備。在印跡設備頂端放置11.3kg的重量。在175mA的電流進行180分鐘的電印跡。電印跡后,將ProBlott膜在溶于60。/o曱醇、1%乙酸、39%水的0.1%(重量/體積)考馬斯亮藍R—250中染色1分鐘。在40%含水的甲醇中進行ProBlott膜脫色5分鐘,然后在去離子水中沖洗膜。最后,將ProBlott膜風干。對于N端氨基酸測序,剪出由65kDa條帶組成的兩片ProBlott膜,并置于AppliedBiosystemsProciseProteinSequencer(AppliedBiosystems,FosterCity,CA,USA)的印跡筒中。根據(jù)制造商的說明書,使用用于PVDF膜樣品(脈沖液體PVDF)的方法操作文件(methodrunfile)進4亍N端測序。通過比較色語圖中峰的保留時間和標準色譜圖中PTH-氨基酸的保留時間,從得到的色譜圖推定N端氨基酸序列。使用Procise494HTSequencingSystem(AppliedBiosystems,FosterCity,CA,USA),直接確定純化的巴西青霉CEL5C內(nèi)切葡聚糖酶的N端氨基酸序列。將N端序列確定為Ala-Ser-Ser-Phe-Val-Trp-Phe-Gly-Thr-Ser-Glu-Ser-Gly-Ala-Glu-Phe-Gly-Asn-Gln-Asn(SEQIDNO:10的氨基酸25至44)。實施例18:來自巴西青霉IBT20888的ce/5c內(nèi)切葡聚糖酶基因的PCR擴增根據(jù)純化的巴西青霉內(nèi)切葡聚糖酶的N端氨基酉^列,使用CODEHOP策略(Rose等,1998,M/c/e/c/te^26:1628-35)設計正向引物。從關于其它內(nèi)切葡聚糖酶的數(shù)據(jù)庫信息,使用CODEHOP策略設計如下所示兩個反向引物。正向引物,F(xiàn)wd:5'-TTCGGTACCTCTGAGTCTGGNGCNGARTT-3'(SEQIDNO:11)反向引物,Revl:5'-TGATCCATATCGTGGTACTCGTTRTTNGTRTCRAA-3'(SEQIDNO:12)反向引物,Rev2:5'-CCGTTGTAGCGACCGTARTTRTGNGGRTC-3'(SEQIDNO:13)其中R^A或G,Y-C或T,K-G或T,并且N-A、C、G或T使用約1(ig巴西青霉基因組DNA作為模板制備擴增反應物(30W)。此外,每個反應包含下述組分30pmol正向引物,30pmol反向引物,200fiMdATP、dCTP、dGTP和dTTP,1xAmpliTaq聚合酶緩沖液(AppliedBiosystems,I'osterCity,CA,USA),和0.5單位AmpliTaq聚合酶(5.0U/卜l,AppliedBi()systems,FosterCity,CA,USA)。在Robocycler(Stratagene,LaJolla,CA,USA)中溫育反應物,程序為96°C3分鐘和72°C3分鐘的1個循環(huán);34個循環(huán),每個循環(huán)為95°C0.5分鐘,56°C0.5分鐘,和72°C1.5分鐘;72°C7分鐘的1個循環(huán);和6。C的浸入循環(huán)(soakcycle)。在第一個循環(huán)中于72。C加入Taq聚合酶。使用TAE緩沖液,在2。/。瓊脂糖凝膠(Amresco,Solon,OH,USA)上分離PCR反應產(chǎn)物。從凝膠上切下約650bp的條帶(Fwd和Revl引物)和約320和380bp的條帶(Fwd和Rev2引物),并根據(jù)制造商的說明使用MiniEluteGelExtractionKit(QIAGENInc.,Valencia,CA,USA)將其純化。然后通過DNA測序分析純化的PCR產(chǎn)物。發(fā)現(xiàn)320bp的產(chǎn)物編碼部分糖基水解酶家族5多肽,所述多肽命名為CEL5C。實施例19:篩選巴西青霉IBT20888的基因組文庫進行實施例15所述文庫的菌落轉移檢測(colonylift)(Maniatis等,1982,Mo/ec'w/arC7函,"g,J丄a60rato7她麗a/,ColdSpringHarborPress,ColdSpringHarbor,NewYork),并在80。C將DNA交聯(lián)到HybondN+膜(Amersham,ArlingtonHeights,IL,USA)上2小時。使用0.2xSSC(30mMNaCl,3mM檸檬酸鈉)、0.2%SDS將來自菌落轉移檢測的膜預潤濕。將預潤濕的過濾器置于燒杯中,每個過濾器使用7.5ml6xSSPE(0.9MNaCl,0.06MNaH2P04,和6mMEDTA)和7%SDS,在振蕩水浴中在68°C放置30分鐘。根據(jù)制造商的i兌明書,使用StratagenePrime-ItIIKit(Stratagene,LaJolla,CA),將實施例18中所述的約40ngPCR產(chǎn)物用隨機引物標記。使用MinElutePCRPurificationKit(QIAGENInc.,Valencia,CA,USA),將放射性標記的基因片段與未并入的核苷酸分離。通過加入5.0MNaOH至終濃度0.5M,使放射性探針變性,并將所述探針以約0.5x106cpm每毫升雜交溶液的活性加入雜交溶液中。將混合物在振蕩水浴中68。C溫育IO小時。溫育后,在0.2xSSC、0.2%SDS中在68。C清洗膜三次。然后在印跡紙上將膜千燥15分鐘,包上SamnWrapTM,并用增強屏(Kodak,Rochester,NY,USA)在-80。CX射線過夜照射。將與探針產(chǎn)生雜交信號的克隆接種到1mlLB氨千青霉素培養(yǎng)基中,并在37。C過夜培養(yǎng)。產(chǎn)生每個溶液的稀釋液,并將100pl涂布于LB氨千青霉素平板上。選擇在每個平板上產(chǎn)生約40個菌落的每個陽性的稀釋液進行二次轉移檢測(secondarylift)。如上制備、雜交并用探針篩選。將來自每個陽性平板的兩個菌落接種到3mlLB氨節(jié)青霉素培養(yǎng)基中,并在37。C過夜培養(yǎng)。根據(jù)制造商的說明書,使用BioRobot9600(QIAGENInc,Valencia,CA,USA)從每個菌落制備微量DNA。通過£coRI限制酶切和瓊脂糖凝膠電泳確定每個插入物的大小。兩個克隆中,每個都包含約5.5kb的插入物。測序結果表明,兩個克隆是同一的,因此將它們稱作pKKAHl(參見實施例20)。實施例20:來自巴西青.霉IBT20888的編碼CEL5C內(nèi)切葡聚糖酶的"/5c基因組序列的表征使用引物步移技術及染料-終止子化學(Giesecke等,1992,J.Wra/.臉〃Ws38:47-60),用AppliedBiosystemsModel3700AutomatedDNASequencer(AppliedBiosystems,FosterCity,CA,USA)進4亍來自pKKAHl的巴西青霉內(nèi)切葡聚糖酶基因的DNA測序。圖10A和10B顯示了巴西青霉ce/5c基因的核苷酸序列(SEQIDNO:9)和推導的氨基酸序列(SEQIDNO:10)。1471bp的基因組編碼序歹'K包括終止密碼子)編碼421個氨基酸的多肽,其中插入51bp(89-139bp)、47bp(352-398bp)、55bp(464-518bp)和52bp(617-668bp)的4個內(nèi)含子。所述基因的編碼區(qū)域的。/。G+C含量是51.2%,而成熟多肽編碼區(qū)域的。/。G+C含量是50.8%。使用SignalP軟件程序(Nielsen等,1997,尸rafe/"10:1-6)預測了16個殘基的信號肽。根據(jù)內(nèi)切葡聚糖酶的N端序列,殘基17到24看起來組成前區(qū)域(pro-region),所述區(qū)域在成熟過程中通過蛋白水解而^f皮切割。預測的成熟蛋白質包含397個氨基酸,預測的分子量為42.6kDa。用Inte卬roscan程序(Zdobnov和Apweiler,2001,見上文)分析ce/5c基因的推導氨基酸序列,顯示CEL5C蛋白質包含核心序列類型的家族5糖基水解酶,從預測的全長多肽的大約殘基32延伸至殘基307。CEL5C蛋白質還包含I型真菌纖維素結合域(CBMI)的序列標記。這個稱為Prosite類型的PS00562(Sigrist等,2002,見上文)的序列標記存在于預測多肽的氨基酸殘基393至殘基420。使用Needleman-Wunsch算法(Needleman和Wunsch,1970,見上文)如在具有缺口開放罰分10、缺口延伸罰分0.5和EBLOSUM62矩陣的EMBOSS的Needle程序中所實施的來確定公共數(shù)據(jù)庫中氨基S殳序列的比較配對全局比對。比對顯示,編碼CEL5C成熟多肽的巴西青霉ce/5c基因的推導氨基酸序列與來自A^wartoo^/^c/2en'和煙曲霉的兩個預測的家族5糖基水解酶蛋白的推導氨基酸序列(登錄號分別為A1DAP7和Q4WM09)分別共有74.9%和74.5%的同一性(缺口除外)。實施例21:構建來自巴西青霉IBT20888的"/5c內(nèi)切葡聚糖酶基因的米曲霉表達質粒曲霉表達質粒pJaL721(WO03/008575)由表達盒組成,所述表達盒基于與構巢曲霉磷酸丙糖異構酶未翻譯前導序列(NA2-tpi)融合的黑曲霉中性淀粉酶Il啟動子和黑曲霉淀粉葡糖苷酶終止子。質粒上還存在來自構巢曲霉的選擇性標記am必,其能以乙酰胺作為唯一氮源生長,和來自釀酒酵母的URA3標記,其能使pjrF缺陷的大腸桿菌菌抹DB6507(ATCC35673)生長。如下所述,使用釀酒酵母URA3基因作為選擇性標記進行大腸桿菌DB6507的轉化。通過Mandel和Higa,1970,JAfo/.45:154的方法將大腸桿菌DB6507制成感受態(tài)。在固體M9培養(yǎng)基上選擇轉化子(J.Sambrook,E.F.Fritsch,,'口T.Maniatis,1989,7Wo/ecw/<arC7ow'"g,^^t^orarto/jAfo"w"/,2dedition,ColdSpringHarbor,NewYork),所述培養(yǎng)基每升補充1g酪蛋白氨基酸、500(ig硫胺素(thiamine)和10mg卡那霉素。如下所述將內(nèi)切葡聚糖酶基因克隆到pJaL721中。使用下述兩個寡核苷酸引物通過PCR擴增來自巴西青霉的ce/5c內(nèi)切葡聚糖酶基因正向引物IDNO:14)反向引物5,-TTAACTCGAGTTACAGACACTGCGAATAATACGCATTC-3,(SEQIDNO:15)為了促進克隆,在每個引物的5'端插入限制性酶切位點,其中正向引物包含S"wHI位點,而反向引物包含屈ol位點。在PCR反應中使用如實施例14中制備的基因組DNA作為模板。反應在50fil的體積中進行,其中包含1.0單位Phusion(FinnzymesOy,Espoo,F(xiàn)inland),1xPhusion緩沖液HF(FinnzymesOy,Espoo,Finland),500ng基因組,250)iM每種dNTP,和50pmol上述兩種引物的每種。在PTC-220DNAEngineDyadPeltierThermalCycler(MJResearch,Inc.,Waltham,MA,USA)中進行擴增,程序為95°C5分鐘的1個循環(huán);24個循環(huán),每個循環(huán)為94°C0.5分鐘、58°C0.5分鐘和68°C4.0分鐘;和68°C15分鐘的1個循環(huán)。使用熱啟動PCR技術(Chou等,1992,WMc/e/c/k'/A20:1717),并在第一個循環(huán)1分鐘后加入Phusion聚合酶。PCR反應產(chǎn)生長約1500bp的單DNA片段。將所述片段用5""zHI和A7wl消化,并通過瓊脂糖凝膠電泳分離,將其純化,并克隆到用S"mHl和A7wl消化的pJaL721中,得到的質粒命名為pKBK03(圖11)。通過用AppliedBiosystems3730x1DNAAnalyzer測序,確認pKBK03中內(nèi)切葡聚糖酶基因的序列。為了產(chǎn)生用于生物材料保藏的質粒,用SamHI和lol消化pKBK03并纟屯4匕。<吏用Klenow酶(RocheAppliedScience,Manheim,Germany)在25。C只于片段進行平端修復30分鐘。用Smal消化質粒pUC13,并用小牛腸蛋白酶(RocheAppliedScience,Manheim,Germany;CIP)在37。C去磷酸化1小時,通過將樣品加熱至80°C!5分鐘而使CIP失活。4吏用T4DNA連才妄酶(RocheAppliedScience,Manheim,Germany),將平端修復的片段和去磷酸化的pUC13片段在16。C過夜連接。將連接產(chǎn)物的0.25叱樣品轉化到大腸桿菌DH5a(Invitrogen,Carlsbad,CA,USA)中。在LB氨芐青霉素平板上在37。C過夜培養(yǎng)后,將轉化子轉移到2mlLB培養(yǎng)基,并在37。Ci咅養(yǎng)。4吏用JetquickPlasmidMiniprep(Genomed,L6hne,Germany)纟屯^f匕命名為pPBCd5C的質粒(圖12)。通過用AppliedBiosystems3730x1DNAAnalyzer測序確認內(nèi)切葡聚糖酶基因的序列。將包含質粒pPBCel5C的大腸桿菌TOP10細胞(Invitrogen,Carlsbad,CA)(菌抹名PBCel5C)作為NRRLB-30900N保藏于農(nóng)業(yè)研究機構保藏中心北區(qū)研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter),1815UniversityStreet,Peoria,Illinois,61604,保藏日為2006年2月23日。實施例22:在米曲霉中表達巴西青霉IBT20088CEL5C內(nèi)切葡聚糖酶如Christensen等,1988,S,》fec/z,/ogv6:1419-1422所述,用5嗎pKBK03轉化米曲霉BECh2(WO00/30322)。在50m管中,于30°C、10mlYPM培養(yǎng)基中將轉化子培養(yǎng)4天。在12,100xg離心全培養(yǎng)液并去除上清。根據(jù)制造商的說明書,使用XTMES緩沖液(BioRadLaboratories,Hercules,CA,USA)中的CriterionXTPrecastGel、10%Bis-Tris凝膠,通過SDS-PAGE分析上清液。將10)til體積的上清液與9jal樣品緩沖液(0.125MTris-HClpH6.8,20%甘油和4.6%SDS)和11M二石危蘇糖醇混合,并加熱至96°C5分鐘。在20份上清液中的16份中,通過SDS-PAGE,可以在標準品35kDa至150kDa范圍中見到約65kDa的一個條帶。SDS-PAGE后得到可見條帶的上清液還包含內(nèi)切葡聚糖酶活性,如實施例3中所測定。所述條帶的強度越高,同樣的上清液中測得的內(nèi)切葡聚糖酶活性就越高。將一個轉化子命名為米曲霉KBK03。實施例23:重組巴西青霉舊T20888CEL5C內(nèi)切葡聚糖酶的產(chǎn)生和純化米曲霉轉化子KBK03在20個500ml搖瓶中生長,搖瓶中含有200mlYPM培養(yǎng)基。通過離心和過濾從4.0升發(fā)酵液中去除生物質。如實施例9中所述進行SDS-PAGE分析。將內(nèi)切葡聚糖酶溶液加載于XK50柱(AmershamBiosciences,Uppsala,Sweden),該斗主包含110gAvicelPh101(MerckKGaA,Darmstadt,Germany),其在加載前用25mMTrispH7.5預平衡,并用25mMTris、1%三乙醇胺在pH11.6洗脫結合的酶。在280nm監(jiān)測內(nèi)切葡聚糖酶的洗脫液。立即匯集包含洗脫蛋白質的級分,并將pH調(diào)至7.5。匯集包含內(nèi)切葡聚糖酶的級分。由280nm處的吸光度和由內(nèi)切葡聚糖酶一級結構計算的消光系數(shù),確定蛋白質含量。純化之后進行SDS-PAGE。將樣品與同樣體積的2x樣品緩沖液和1/5體積的1%PMSF煮沸2分鐘,并加載于4-20%Tris-甘氨酸凝膠(Invitrogen,Carlsbad,CA,USA)上。用GelCodeBlueStainReagent(Pierce,Rockford,IL,USA)將凝膠染色,并用水脫色。SDS-PAGE顯示一條約65kDa的條帶。實施例24:純化的重組巴西青霉IBT20888CEL5C內(nèi)切葡聚糖酶的表征用最適pH、最適溫度和溫度穩(wěn)定性表征實施例23中所述的純化的重組巴西青霉CEL5C內(nèi)切葡聚糖酶。如實施例16中所述,在/人20。C到80。C的溫度和3.0至10.0的pH值測定內(nèi)切葡聚糖酶活性。在Milli-Q⑧超純水(Millipore,Billerica,MA,USA)中稀釋純化的內(nèi)切葡聚糖酶,以確?;钚栽跇藴是€范圍內(nèi)。對于最適pH,將底物溶于調(diào)至理想pH的Bri加n-Robinson緩沖液(50mM硼酸、50mM乙酸、50mM磷酸)中。在4.0至6.0的pH范圍內(nèi)在50。C確定溫度穩(wěn)定性20小時。所有實驗重復兩次進行。最適pll的確定結果示于圖13中。在50。C時最適pH接近4.0,而在pH3.0活性非常小,在pH5.0為峰活性的約80%。最適溫度的確定結果示于圖14中。pH4.8時的最適溫度為約70°C,從6()。C至80。C為峰活性的超過75%。溫度穩(wěn)定性的測定結果示于圖15中。從4.0至6.0的pH范圍中在25°C和50。C在不存在底物時預培育20小時,內(nèi)切葡聚糖酶保留其起始活性的超過80%。實施例25:底物的制備使用稀釋的硫酸,由美國能源部國家可再生能源實驗室(U.S.Departmentofr:nergyNationalRenewableEnergyLaboratory,NREL)制備經(jīng)過預處理的玉米秸(PCS)。使用下述條件進行預處理按重量計1.4%硫酸,在165。C和107psi,8分鐘。在NREL進行組成分析。通過兩階段硫酸水解測定纖維素和半纖維素,然后使用NREL標準分析程序糾02,通過高效液相色譜(HPLC)進行糖分析。在用硫酸水解纖維素和半纖維素部分(NREL標準分析程序#003)后,通過重量測定木質素。確定經(jīng)預處理的玉米秸(PCS)中不溶于水的固體為56.5%纖維素、4.6%半纖維素和28.4%木質素。用大體積的去離子水在具有粗糙孔隙的玻璃濾紙(FisherScientific,Pittsburg,PA,USA)的Kimax漏斗上洗滌PCS。將水洗過的PCS在咖啡磨具中碾磨,并又用去離子水在具有6PExpressMembrane(Millipore,Bedford,MA,USA)的22}imMilliporeFilter上洗滌。碾磨的PCS的干重是32.4%。使用下述步驟制備去離子水中磷酸-溶脹纖維素(PASC)的10mg/ml儲存懸浮液。向用水浸濕的5gAvicelPH101(FMCCorp.,Philadelphia,PA,USA)中加入一百五十毫升冰凍的85。/。o-磷酸。將懸浮液在水浴中緩慢攪拌一小時,在恒定攪拌中向懸浮液加入100ml冰凍的丙酮。將漿料轉移至具有粗糙孔隙的玻璃濾紙的Kimax漏斗中,用100ml水凍的丙酮清洗三次,每次清洗后盡可能完全排干。最后,用500ml水清洗漿料兩次,仍然在每次清洗后盡可能排干。將PASC與水混合至總體積500ml。加入疊氮化鈉(sodiumazide)至終濃度0.02。/。以防止微生物生長。使用混合器將漿料均質化,并在4。C儲存多至一個月。從AqualonDivisionofHerculesInc.,Wilmington,DE,USA獲《尋平均取4戈度(DS)為0.7的羧甲基纖維素(CMC,鈉鹽,7L2型)。通過向劇烈攪拌的緩沖液中緩慢加入CMC,制備50mM乙酸鈉pH5.0中的6.25mg/mlCMC溶液。在連續(xù)攪拌下將漿料加熱至約60°C,直至CMC完全溶解。如Boisset等,1999,腸c/z謹WJow簡/,340:829-835中所述,從NatadeCoco,一種食品級的商品纖維素(FujiccoCo.,Kobe,Japan)制備細菌纖維素(BC)。將含有0.01%(w/v)疊氮化鈉的去離子水中的1mg/ml細菌纖維素懸浮液在4。C儲存。AvicelPHI01獲得自FMCCorporation,Philadelphia,PA,USA。來自樺樹(birchwood)的木聚糖獲得自Sigma,St.Louis,MO,USA。來自羅望子種子(Tamarindseed)的木葡聚糖(淀粉質,貨號00401)、小麥阿拉伯木聚糖(中等粘度,27cSt,貨號90601),l,4-p-D-甘露聚糖(硼氫化物還原,Man:Gal二97:3,聚合度DP15,貨號90302)和長角豆(carob)半乳甘露聚糖(低粘度,硼氫化物還原,貨號9030l)獲得自Megazyme,Bray,Ireland實施例26:用于測定還原糖的對羥基苯甲酸酰阱法通過對羥基苯曱酸酰阱(PHBAH)法(Lever,1972,^^/.S/oc/zem.47:273-279)測定還原糖(RS),所述方法適合于96孔微孔板形式。將90^等分試樣的稀釋樣品置于96孔錐形底微孔板(Costar,clearpolycarbonate,CorningInc.,Acton,MA,USA)的每個孔中。通過向每個孑L中力口入60(il的2%氬氧化鈉中的1.25%PHBAH而開始測定。將未加蓋的板在定制的加熱塊上在95。C加熱10分鐘。加熱后,將微孔^1冷卻至室溫,并向每個孔中加入35pl去離子水。從每個孔移出100jal等分試樣的樣品,并轉移至平底的96孑L^反(Costar,mediumbindingpolystyrene,ComingInc.,Acton,MA,(JSA)。使用SpectraMAXMicroplateReader(MolecularDevices,Sunnyvale,CA,USA)測定在410nm處的吸光度(A柳)。使用標準曲線將八41()值轉換成葡萄糖當量。用六個葡萄糖標準品(0.005、0.010、0.025、0.050、0.075和0,100mg/ml)獲得標準曲線,用與處理樣品相似的方法處理標準品。通過用去離子水稀釋10mg/ml葡萄糖儲存溶液而制備葡萄糖標準品。對于除了木聚糖和阿拉伯木聚糖之外的所有底物,^f吏用下述公式計算轉化的程度(o/o):轉化率(。/。嚴RS(mg/mUx100x162/(起始底物濃度(mg/m,)x180)=RS(mg/ml)xio(V(起始底物濃度(mg闊xi.m)對于木聚糖和阿拉伯木聚糖,使用下述公式計算水解成RS的底物的百分數(shù)轉化率(二RS(mg/ml)x100x132/(起始底物濃度(噸闊x150)=RS(mg,,ml)x100/(起始底物濃度(mg/一x1.136)在這些公式中,RS是以葡萄糖當量(mg/ml)測定的溶液中還原糖的濃度,而因子1.111和1.136反映的是將相應的多糖轉化成己糖(MW180)或戊糖(MW150)引起的重量增加。實施例27:在5(TC內(nèi)切葡聚糖酶對羧甲基纖維素的相對活性表1顯示來自嗜熱毀絲霉CBS117.65、擔子菌CBS494.95和擔子菌CBS495.95的純化內(nèi)切葡聚糖酶對于羧甲基纖維素(CMC)的可溶鈉鹽的相對活性。相對活性以擔子菌CBS495.95內(nèi)切葡聚糖酶活性的百分#:顯示。通過50。C在50mM乙酸鈉pH5.0中水解30分鐘后測定從CMC(5mg/ml)產(chǎn)生的還原糖(RS)的濃度來測定活性。在存在0.5mg/ml牛血清白蛋白(BSA,Sigma,St.Louis,MO,USA)的情況下無需攪拌而進行水解。使用實施例26中所述的對羥基苯曱酸酰阱(PHBAH)試驗法測定還原糖。表1.在pH5.0和50°C內(nèi)切葡聚糖酶對于羧曱基纖維素(5mg/ml)的相對活性<table>tableseeoriginaldocumentpage85</column></row><table>實施例28:內(nèi)切葡聚糖酶在40。C-8(TC的熱穩(wěn)定性通過下述方法測定來自嗜熱毀絲霉CBS117.65、擔子菌CBS494.95和擔子菌CBS495.95的純化內(nèi)切葡聚糖酶的熱穩(wěn)定性在五個溫度(40。C,50°C,60。C,70。C和80。C)培育酶溶液,并測定酶對羧曱基纖維素(CMC)的殘余活性。在50mM乙酸鈉pH5.0中稀釋酶,所述乙酸鈉中包含3.0mg/mlBSA,并將酶在以8x12微孔板形式(Pierce,Rockford,IL,USA)放置的1.1-mlImmunoWareMicrotubes中培育3小時。加入BSA以防止《毀管的塑料壁上可能的酶吸收。選擇培育混合物中的蛋白質濃度,使每種酶在隨后對于CMC酶(CMCase)活性的實驗中CMC的轉化率小于1%。在3小時培育后,使用8道移液器移出15pl的等份試樣,并將其加入96孔錐形底微孔板(Costar,透明的聚碳酸酯,ComingInc.,Acton,MA,USA)的75[a1CMC溶液(50mM乙酸鈉pH5.0中6mg/ml)中。然后如實施例27所述測定殘余的CMC酶活性,并表示為起始CMC酶活性的百分lt(表2)。在40。C和5(TC,3小時培育后,全部三種內(nèi)切葡聚糖酶都是穩(wěn)定的,并保留有起始CMC酶活性的98-100%。在60。C和70。C,嗜熱毀絲霉Ce^A表現(xiàn)出的穩(wěn)定性優(yōu)于另外兩種內(nèi)切葡聚糖酶,3小時培育后分別保留起始CMC酶活性的100%和49.3%。在80。C所有內(nèi)切葡聚糖酶都不穩(wěn)定。表2.在pH5.0和40-80。C培育3小時后,內(nèi)切葡聚糖酶的殘余CMC酶活性<table>tableseeoriginaldocumentpage85</column></row><table>實施例29:在40-70°C內(nèi)切葡聚糖酶對于磷酸-溶脹纖維素的相對活性通過測定在50mM乙酸鈉pH5.0中PASC(2mg/ml)的起始水解過程中釋放的還原糖(RS)的濃度,確定來自擔子菌CBS494.95和擔子菌CBS495.95的純化內(nèi)切葡聚糖酶對于磷酸-溶脹纖維素(PASC)的活性。在存在0.5mg/ml牛血清白蛋白(BSA,Sigma,St.Louis,MO,USA)的情況下無攪拌而進行水解。將酶稀釋使得RS濃度在水解的最初30至卯分鐘過程中線性增加,而這段時間中,PASC轉化程度不超過2%。使用實施例26中所述的對鞋基苯甲酸酰阱(PHBAH)實驗法測定還原糖。相對活性作為來自擔子菌CBS494.95和擔子菌CBS495.95的內(nèi)切葡聚糖酶的溫度的函數(shù),示于圖16中。將活性表示為在60。C來自擔子菌CBS495.95的內(nèi)切葡聚糖酶活性的百分數(shù)。對于兩種內(nèi)切葡聚糖酶,在T。pt.=60°C對于PASC的活性達到最大值。實施例30:在40-70。C磷酸-溶脹纖維素的長期水解在四個溫度,40°C、50°C、6(TC和70°C,在包含0.5mg/mlBSA的50mM乙酸鈉pH5.0中由來自擔子菌CBS494.95和擔子菌CBS495.95的純化內(nèi)切葡聚糖酶對磷酸-溶脹纖維素(PASC,2mg/ml)進行45小時的水解。在三種蛋白質負載使用內(nèi)切葡聚糖酶0.056、0.167或0.5mg每gPASC。在以8x12微孔板形式(Pierce,Rockford,IL,USA)放置的1.1-mlImmunoWareMicrotube中無攪拌地以1ml的初始體積進行反應。在不同時間點(l、1,5、3、6、21、27和45小時),使用8道的移液器從反應物中移出一百微升等分試樣,并將其加入到MultiscreenHV96孔過濾板(Millipore,Bedford,MA,USA)中的25pi2%NaOH中。收集的樣品通過真空過濾入平底微孔板中,以去除PASC殘余物。通過實施例26中所述的對羥基笨曱酸酰阱(PHBAH)試驗法分析過濾液的還原糖。圖17顯示與來自擔子菌CBS494.95和擔子菌CBS495.95的內(nèi)切葡聚糖酶(0.5mg蛋白質每gPASC)溫育45小時后,PASC的相對轉化率作為溫度的函數(shù)。相對轉化率顯示為在50。C與擔子菌CBS495.95溫育45小時后獲得的轉化率的百分數(shù)。在兩種其它蛋白質負載(0.056和0.167mg蛋白質每gPASC)獲得的溫度曲線具有相似的形狀。對于兩種內(nèi)切葡聚4唐酶,PASC長期水解的最優(yōu)溫度是5(TC。實施例31:在50。C內(nèi)切葡聚糖酶對各種多糖底物的表征在pH5.0(50mM乙酸鈉緩沖液)和50。C在各種多if唐的水解中評價來自嗜熱毀絲霉CBS117.65、擔子菌CBS494.95和擔子菌CBS495.95的純化的內(nèi)切葡聚糖酶。將結果與重組里氏木霉Cel7B(EGI)內(nèi)切葡聚糖酶比較。由米曲霉產(chǎn)生的重組里氏木霉Cel7B(EGI)內(nèi)切葡聚糖酶可以根據(jù)Takashima等,998,J。歸a/0/紐fer油w65:163-171制備。多糖包括預處理的玉米秸(PCS)、磷酸-溶脹纖維素(PASC)、羧曱基纖維素(CMC)、細菌纖維素(BC)、Avicel、木聚糖、木葡聚糖、阿拉伯木聚糖、甘露聚糖和半乳甘露聚糖。所有底物以5mg/ml使用,除了細菌纖維素,其在0.9mg/ml使用。在用Eppendorf96深孔板蓋(VWRScientific,WestChester,PA,USA)封蓋的Eppendorf96深孔板(1.2ml,VWRScientific,WestChester,PA,USA)中間歇攪拌,以1ml的初始體積進行24小時的反應。除非另外指出,酶以5mg蛋白質每g固體的量載入。在24小時后,使用8道移液器從水解反應物中移出20^的等分試樣,并將其加入MultiscreenHV96孔過濾板(Millipore,Bedford,MA,USA)中的180(il102mMNa2COr58mMNaHC03中以終止水解。將樣品通過真空過濾加入平底微孔板中。在適當?shù)南♂尯?,使用如實施?6中所述的對羥基笨曱酸酰阱(PHBAH)試驗法分析過濾液中的還原糖。表3顯示24小時培育后內(nèi)切葡聚糖酶對各種多糖的相對轉化率。將相對轉化率計算為擔子菌CBS495.95Cd5A內(nèi)切葡聚糖酶水解1,4-(3-D-甘露聚糖24小時后獲得的轉化率的百分數(shù)。來自糖苷水解酶(GH)家族5的內(nèi)切葡聚糖酶對甘露聚糖和半乳甘露聚糖具有相對高的活性,但是對于木聚糖、木葡聚糖和阿拉伯木聚糖的活性低。相反,里氏木霉Cel7B對木聚糖、木葡聚糖和阿拉伯木聚糖具有相對高的活性,但是對甘露聚糖和半乳甘露聚糖的活性低。GII5內(nèi)切葡聚糖酶顯示對PASC(不溶的未取代無定形纖維素)的水解優(yōu)于對CMC(可溶取代纖維素衍生物)的水解。GH5內(nèi)切葡聚糖酶對具有高度結晶的不溶底物(細菌纖維Avicel和PCS)具有低活性。表3.內(nèi)切葡聚糖酶(5mg蛋白質每g固體)對各種多糖底物的相對轉化率;pi-15.0,50°C,24小時<table>tableseeoriginaldocumentpage87</column></row><table><table>tableseeoriginaldocumentpage88</column></row><table>*細菌纖維素的初始濃度是0.9mg/ml**所有用于PASC和CMC水解的內(nèi)切葡聚糖酶以0.25mg蛋白質每g固體的量使用實施例32:在60。C由內(nèi)切葡聚糖酶水解來自大麥的可溶(3-葡聚糖在pH5.5(含有0.02%疊氮化鈉的50mM乙酸鈉)和60°C,確定來自嗜熱毀絲霉CBS117.65、擔子菌CBS494.95和擔子菌CBS495,95的內(nèi)切葡聚糖酶對于來自大麥的可溶P-葡聚糖(中等粘度,230kDa,MegazymeInternationalIrelandLtd.,Bray,Ireland)的活性。將結果與里氏木霉Cel7B(EGI)內(nèi)切葡聚糖酶的結果比較??梢匀鐚嵤├?1所迷制備重組里氏木霉Cel7B(EGI)內(nèi)切葡聚糖酶。在水解反應中(3-葡聚糖的初始濃度是1.0%(w/v)。在Eppendorf96深孔板(1.2ml,VWRScientific,WestChester,PA,USA)中無攪拌進行一毫升體積的反應。以三個蛋白質負載使用酶0.05、0,l和0.2mg每g葡聚糖。在緩沖液對照中,用包含0.02%疊氮化鈉的50mM乙酸鈉pH5.5代替內(nèi)切葡聚糖酶。在2小時和24小時從水解反應物中移出等份試樣,將其用去離子水稀釋,并使用如實施例26中所述的對羥基苯曱酸酰阱(PHBAH)試驗法分析還原糖。,-葡聚糖的相對轉化率作為兩個溫育時間(2小時和24小時)的蛋白質負載的函數(shù),分別示于圖18和19中。將相對轉化率顯示為用嗜熱毀絲霉CBS117.65Ccl5A內(nèi)切葡聚糖酶(0.2mg蛋白質每g葡聚糖)水解f3-葡聚糖24小時后獲得的轉化率的百分數(shù)。來自擔子菌CBS494.95和擔子菌CBS495.95的內(nèi)切葡聚糖酶在水解(3-葡聚糖時顯示相似的性能,并在2小時水解后沒有產(chǎn)生還原糖濃度的額外增加。相反,來自嗜熱毀絲霉和里氏木霉的內(nèi)切葡聚糖酶在2小時培育時間后繼續(xù)產(chǎn)生新的還原性端基。嗜熱毀絲霉內(nèi)切葡聚糖酶在水解P-葡聚糖時顯示比擔子菌CBS494.95Cel5B內(nèi)切葡聚糖酶和擔子菌CBS495.95Cel5A內(nèi)切葡聚糖酶更優(yōu)的性能。生物材料的保藏依據(jù)布達佩斯條約的條款,下述的生物材料已經(jīng)保藏于農(nóng)業(yè)研究機構專利培養(yǎng)物保藏中心(AgriculturalResearchServicePatentCultureCollection),北區(qū)研咒中心(NorthernRegionalResearchCenter),1815UniversityStreet,Peoria,Illinois,61604,并給予下述的登錄號保藏物大腸桿菌菌抹PBCel5C大腸桿菌菌抹pCIC161大腸桿菌菌抹pCIC453大腸桿菌菌抹pCIC486登錄號NRRLB-30900NNRRLB-30902NRRLB-30903NRRLB-30904保藏日期2006年2月23日2006年2月23日2006年2月23日2006年2月23曰所述菌抹于下述條件下保藏確保在本專利申請未決期間,由專利與商標委員依據(jù)37C.F.R.§1.14和35U.S.C.§122授權的人能夠獲得所述培養(yǎng)物。所述保藏物為所保藏菌抹的基本上純的培養(yǎng)物。在提交了該申請的副本,或其后續(xù)文本的國家,依據(jù)該外國專利法律的要求,可以獲得所述保藏物。然而,應當理解,保藏物的獲得并不構成對實施本發(fā)明的許可,實施本發(fā)明是對政府行為所授予的專利權的侵犯。本文描述和要求保護的本發(fā)明并不受限于本文所公開的具體方面的范圍,因為這些方面意欲作為本發(fā)明幾個方面的說明。任何等價的方面意欲在本發(fā)明的范圍之內(nèi)。實際上,從前面的說明中,除本文所顯示和描述的之外,本發(fā)明的多種修改對于本領域的技術人員來說是顯而易見的。這些修改也意欲落入所附的權利要求的范圍內(nèi)。在沖突的情況下,將以包括定義部分的本公開為準。本文引用了多篇參考文獻,其公開的內(nèi)容通過引用整體并入。權利要求1.具有內(nèi)切葡聚糖酶活性的分離的多肽,其選自下組中的一種或多種(a)包含氨基酸序列的多肽,所述氨基酸序列與SEQIDNO4或SEQIDNO10的成熟多肽具有至少80%同一性,與SEQIDNO6的成熟多肽具有至少85%同一性,或與SEQIDNO8的成熟多肽具有至少75%同一性;(b)由多核苷酸編碼的多肽,所述多核苷酸在至少高嚴緊條件下與以下雜交(i)SEQIDNO3、SEQIDNO5、SEQIDNO7或SEQIDNO9的成熟多肽編碼序列,(ii)包含于SEQIDNO3或SEQIDNO9的成熟多肽編碼序列中的cDNA序列,或包含SEQIDNO5或SEQIDNO7的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的全長互補鏈;(c)由多核苷酸編碼的多肽,所述多核苷酸與SEQIDNO3或SEQIDNO9的成熟多肽編碼序列具有至少80%同一性,與SEQIDNO5的成熟多肽編碼序列具有至少85%同一性,或者與SEQIDNO7的成熟多肽編碼序列具有至少75%同一性;和(d)變體,其包含取代、缺失和/或插入一個或幾個氨基酸的SEQIDNO4、SEQIDNO6、SEQIDNO8或SEQIDNO10的成熟多肽。2.權利要求1的多肽,其包含與SEQIDNO:4的成熟多肽具有優(yōu)選至少80o/。同一性,更優(yōu)選至少85%同一性,甚至更優(yōu)選至少90%同一性,并且最優(yōu)選至少95%同一性的氨基酸序列;與SEQIDNO:6的成熟多肽具有優(yōu)選至少85%同一性,更優(yōu)選至少90%同一性,并且甚至最優(yōu)選至少95%同一性的氨基酸序列;與SEQIDNO:8的成熟多肽具有優(yōu)選至少75%同一性,更優(yōu)選至少80%同一性,甚至更優(yōu)選至少85%同一性,最優(yōu)選至少90%同一性,并且甚至最優(yōu)選至少95%同一性的氨基酸序列;或者與SEQIDNO:10的成熟多肽具有優(yōu)選至少80%同一性,更優(yōu)選至少85%同一性,甚至更優(yōu)選至少90%同一性,并且最優(yōu)選至少95%同一性的氨基酸序列。3.權利要求1的多肽,其包含SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的氨基酸序列,或由SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的氨基酸序列組成;或其具有內(nèi)切葡聚糖酶活性的片段。4.權利要求3的多肽,其包含SEQIDNO:4、SEQIDNO:6、SEQIDN():8或SEQIDNO:10的氨基酸序列或由SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的氨基酸序列組成。5.權利要求3的多肽,其包含SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽或由SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽組成。6.權利要求l的多肽,其由多核苷酸編碼,所述多核芬酸在至少高嚴緊條件下與以下序列雜交(i)SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列,(ii)包含于SEQIDNO:3或SEQIDNO:9的成熟多肽編碼序列中的cDNA序列,或包含SEQIDNO:5或SEQIDNO:7的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的互補鏈。7.權利要求1的多肽,其由如下多核苷酸編碼與SEQIDNO:3的成熟多肽編碼序列具有優(yōu)選至少80%同一性,更優(yōu)選至少85%同一性,甚至更優(yōu)選至少90%同一性,并且最優(yōu)選至少95%同一性的多核苷酸;與SEQIDNO:5的成熟多肽編碼序列具有優(yōu)選至少85%同一性,更優(yōu)選至少90%同一性,并且最優(yōu)選至少95%同一性的多核苷酸;與SEQIDNO:7的成熟多肽編碼序列具有優(yōu)選至少75%同一性,更優(yōu)選至少80%同一性,甚至更優(yōu)選至少85%同一性,最優(yōu)選至少卯%同一性,并且甚至最優(yōu)選至少95%同一性的多核苷酸;或與SEQIDNO:9的成熟多肽編碼序列具有優(yōu)選至少80%同一性,更優(yōu)選至少85%同一性,甚至更優(yōu)選至少90%同一性,并且最優(yōu)選至少95%同一性的多核香酸。8.權利要求l的多肽,所述多肽由多核苷酸或其編碼具有內(nèi)切葡聚糖酶活性的多肽片段的亞序列編碼,所述多核苷酸包含SEQIDNO:3、SEQIDNO:5、SRQIDNO:7或SEQIDNO:9,或由SEQIDNO:3、SEQIDNO:5、SI':QIDNO:7或SEQIDNO:9組成。9.權利要求8的多肽,其由多核苷酸編碼,所述多核苷酸包含SEQIDN〇:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9或由SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9組成。10.權利要求8的多肽,其由多核苷酸編碼,所述多核苷酸包含SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列或由SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列組成。11.權利要求1的多肽,其中所述多肽是變體,該變體包含取代、缺失'和/或插入一個或幾個氨基酸的SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽。12.權利要求1的多肽,所述多肽由下述質粒中所含的多核苷酸編碼包含在大腸桿菌NRRLB-30902中的質粒pCIC161,包含在大腸桿菌NRRLB-30903中的質粒pCIC453,包含在大腸桿菌NRRLB-30904中的質粒pCIC486,或者包含在大腸桿菌NRRLB-30900N中的質粒pPBCel5C。13.權利要求l、2、5或11的多肽,其中所述成熟多肽是SEQIDNO:4的氨基酸17至389,SEQIDNO:6的氨基酸16至397,SEQIDNO:8的氨基酸22至429,或SEQIDNO:10的氨基酸25至421。14.權利要求l、6、7或10的多肽,其中所述成熟多肽編碼序列是SEQII)NO:3的核苦酸67至U85,SEQIDNO:5的核苷酸84至1229,SEQIDNO:7的核苷酸77至1300,或SEQIDNO:9的核苷酸73至1468。15.權利要求1-14中任一項的多肽,其還對一種或多種選自下組的底物具有酶活性木聚糖、木葡聚糖、阿拉伯木聚糖、l,4-(3-D-甘露聚糖和半乳甘露聚糖。16.分離的多核苷酸,其包含編碼權利要求1-15中任一項的多肽的核苷酸序列。17.權利要求16的分離的多核苷酸,其在SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列中包含至少一個突變,其中突變的核苷酸序列分別編碼SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽。18.核酸構建體,其包含權利要求16或17的多核苷酸,所述多核苷酸與一個或幾個調(diào)控序列可操作地連接,所述調(diào)控序列指導多肽在表達宿主中產(chǎn)生。19.重組表達載體,其包含權利要求18的核酸構建體。20.重組宿主細胞,其包含權利要求18的核酸構建體。21.用于產(chǎn)生權利要求1-15中任一項的多肽的方法,其包括(a)在有益于所述多肽產(chǎn)生的條件下培養(yǎng)細胞,所述細胞以其野生型形式能夠產(chǎn)生所迷多肽;和(b)回收所述多肽。22.用于產(chǎn)生權利要求1-15中任一項的多肽的方法,其包括(a)在有益于所述多肽產(chǎn)生的條件下培養(yǎng)包含核酸構建體的宿主細胞,所述核酸構建體包含編碼所述多肽的核苷酸序列;和(b)回收所述多肽。23.用于產(chǎn)生親本細胞的突變體的方法,所述方法包括^:壞或缺失編碼權利要求1-15中任一項的多肽的核苷酸序列,其導致突變體與親本細胞相比產(chǎn)生較少的所述多肽。24.通過權利要求23的方法產(chǎn)生的突變細胞。25.權利要求24的突變細胞,所述突變細胞還包含編碼天然或異源蛋白質的基因。26.用于產(chǎn)生蛋白質的方法,其包括(a)在有益于所述蛋白質產(chǎn)生的條件下培養(yǎng)權利要求25的突變細胞;和(b)回收所述蛋白質。27.通過以下方法獲得的分離的多核苷酸(a)在至少高嚴緊條件下將DNA的群體與以下雜交(i)SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列,(ii)包含于SEQIDNO:3或SEQIDNO:9的成熟多肽編碼序列中的cDNA序列,或包含SEQIDNO:5或SEQIDNO:7的成熟多肽編碼序列的基因組DNA序列,或(iii)(i)或(ii)的互補鏈;和(b)分離所述雜交多核苷酸,其編碼具有內(nèi)切葡聚糖酶活性的多肽。28.權利要求27的分離的多核苷酸,其中所述成熟多肽編碼序列是SEQIDNO:3的核香酸67至1185,SEQIDNO:5的核苷酸84至1229,SEQIDNO:7的核苦酸77至1300,或SEQIDNO:9的核普酸73至1468。29.用于產(chǎn)生包含突變核苷酸序列的多核苷酸的方法,其包括(a)將至少一個突變引入SEQIDNO:3、SEQIDNO:5、SEQIDNO:7或SEQIDNO:9的成熟多肽編碼序列中,其中所述突變的核苷酸序列編碼由SEQIDNO:4、Sl':QIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽組成的多肽;和(b)回收包含突變核香酸序列的多核苷酸。30.^l利要求29的方法,其中所述成熟多肽編碼序列是SEQIDNO:3的核苦酸67至1185,SEQIDNO:5的核苷酸84至1229,SEQIDNO:7的核苷酸77至1300,或SEQIDNO:9的核苷酸73至1468。31.由權利要求29或30的方法產(chǎn)生的突變多核苷酸。32.用于產(chǎn)生多肽的方法,其包括(a)在有益于多肽產(chǎn)生的條件下培養(yǎng)細胞,所述細胞包含編碼多肽的權利要求31的突變多核苷酸;和(b)回收所述多肽。33.核酸構建體,其包含編碼蛋白質的基因,所述基因與編碼信號肽的第一核苷酸序列和編碼前肽的第二核苷酸序列中的一個或兩者可搡作地連接,所述信號肽包含SEQIDNO:4的氨基酸l至17,SEQIDNO:6的氨基酸1至15,SEQIDNO:8的氨基酸1至21,或SEQIDNO:10的氨基酸1至16或由SEQIDNO:4的氨基酸l至17,SEQIDNO:6的氨基酸l至15,SEQIDNO:8的氨基酸1至21,或SEQIDNO:10的氨基酸1至16組成,所述前肽包含SEQIDNO:10的氨基酸17至24或由SEQIDNO:10的氨基酸17至24組成,其中所述基因對于所述核苷酸序列是外源的。34.包含權利要求33的核酸構建體的重組表達載體。35.包含權利要求33的核酸構建體的重組宿主細胞。36.用于產(chǎn)生蛋白質的方法,其包括(a)在有益于蛋白質產(chǎn)生的條件下培養(yǎng)權利要求35的重組宿主細胞;和(b)回收所述蛋白質。37.用于產(chǎn)生權利要求1-15中任一項的多肽的方法,其包括(a)在有益物細胞包含編碼具有內(nèi)切葡聚糖酶活性的多肽的多核苷酸;和(b)回收所述多肽。38.轉基因植物、植物部分或植物細胞,其已經(jīng)用編碼權利要求1-15中任一項的多肽的多核香酸轉化。39.降解或轉化含纖維素物質的方法,其包括用組合物處理含纖維素物質,所述組合物包含有效量的權利要求1-15中任一項的具有內(nèi)切葡聚糖酶活性的多肽。40.權利要求39的方法,其中所述組合物還包含有效量的內(nèi)切-1,4-(3-葡聚糖酶、外切-l,4-(3-D-葡聚糖酶和/或(3-D-葡糖苷酶。41.權利要求39或40的方法,其中所述組合物還包含有效量的選自下組的一種或多種酶半纖維素酶、酯酶、蛋白酶、漆酶和過氧化物酶。42.權利要求39-41中任一項的方法,其中所述方法是預處理過程;同步糖化和發(fā)酵過程(SSF)中的步驟;或者混合水解和發(fā)酵過程(HHF)中的步驟。43.權利要求39-42中任一項的方法,還包括回收已降解或已轉化的含纖維素物質。44.降解或轉化含纖維素物質的方法,所述方法包括用包含權利要求20的宿主細爿包的組合物處理生物質。45.權利要求44的方法,其中所述組合物還包含有效量的內(nèi)切-1,4-P-葡聚糖酶、外切-1,4-(3-D-葡聚糖酶和/或p-D-葡糖苷酶。46.權利要求44或45的方法,其中所述組合物還包含有效量的選自下組的一種或多種酶半纖維素酶、酯酶、蛋白酶、漆酶和過氧化物酶。47.權利要求44-46中任一項的方法,還包括回收已降解或已轉化的含纖維素物質。48.產(chǎn)生物質的方法,其包括(a)用組合物糖化含纖維素物質,所述組合物包含有效量的權利要求1-15中任一項的具有內(nèi)切葡聚糖酶活性的多肽,(b)用一種或多種發(fā)酵微生物發(fā)酵步驟(a)的糖化的含纖維素物質;和(c)從發(fā)酵中回收所述物質。49.權利要求48的方法,其中所述組合物還包含有效量的內(nèi)切-l,4-(3-葡聚糖酶、外切-l,4-p-D-葡聚糖酶和/或p-D-葡糖苷酶。50.權利要求48或49的方法,其中所述組合物還包含有效量的選自下組的一種或多種酶半纖維素酶、酯酶、蛋白酶、漆酶和過氧化物酶。51.權利要求48-50中任一項的方法,其中步驟(a)和(b)在同步糖化和發(fā)酵中同時進行。52.權利要求48-51中任一項的方法,其中所述物質是醇、有機酸、酮、氨基酸或氣體。53.抑制細胞中多肽的表達的方法,所述方法包括對細胞施用雙鏈RNA(dsRNA)分子或者在細胞中表達雙鏈RNA分子,其中所述dsRNA包含編碼SKQIDNO:4、SEQ1DN0:6、SEQIDNO:8或SEQIDNO:10的成熟多肽的多核苷酸的亞序列或部分。54.權利要求53的方法,其中所述dsRNA長度為約15、16、17、18、19、20、21、22、23、24、25或更多的雙鏈體核苷酸。55.用于抑制多肽在細胞中表達的雙鏈RNA(dsRNA)分子,其中所述dsRNA包括編碼SEQIDNO:4、SEQIDNO:6、SEQIDNO:8或SEQIDNO:10的成熟多肽的多核苷酸的亞序列或部分。全文摘要本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的分離的多肽和編碼所述多肽的分離的多核苷酸。本發(fā)明還涉及包含所述多核苷酸的核酸構建體、載體和宿主細胞,以及用于制備和使用所述多肽的方法。文檔編號C12N9/42GK101454444SQ200780018204公開日2009年6月10日申請日期2007年3月9日優(yōu)先權日2006年3月20日發(fā)明者保羅·哈里斯,克里斯琴·B·R·M·克羅,埃琳娜·弗拉森科,索倫·F·拉森申請人:諾維信股份有限公司;諾維信公司