本申請包括計算機可讀形式的序列表,將其通過引用結(jié)合在此。
發(fā)明背景
發(fā)明領域
本發(fā)明涉及具有內(nèi)切葡聚糖酶活性的多肽,特別涉及具有內(nèi)切葡聚糖酶活性并對用黃原膠裂解酶預處理的黃原膠具有活性的多肽,和編碼這些多肽的多核苷酸。本發(fā)明還涉及包括這些多核苷酸的核酸構(gòu)建體、載體、和宿主細胞連同產(chǎn)生和使用這些多肽的方法。本發(fā)明進一步涉及包括用于洗滌劑和用于鉆井和石油工業(yè)的多肽和任選的黃原膠裂解酶的組合物。
相關技術說明
黃原膠是一種來源于野油菜黃單胞菌的細菌包被的多糖。黃原膠通過由野油菜黃單胞菌細菌發(fā)酵葡萄糖、蔗糖或乳糖而產(chǎn)生。在發(fā)酵周期后,用異丙醇將該多糖從生長培養(yǎng)基中沉淀,干燥,并磨成細粉。稍后,將該粉末添加至液體介質(zhì)中,以形成膠質(zhì)。
黃原膠由五糖亞基組成,形成纖維素主鏈,其三糖側(cè)鏈由通過α1,3鍵附接到主鏈中的交替葡萄糖殘基的甘露糖(β1,4)葡萄糖醛酸(β1,2)甘露糖組成。該生物聚合物由于其優(yōu)異的假塑性,觸變性和粘度而具有巨大的商業(yè)意義。目前,其廣泛用作食品和非食品工業(yè)中的增稠劑或增粘劑,并且用作多種多樣的懸浮液,乳液和泡沫的穩(wěn)定劑。
近年來,黃原膠已經(jīng)被用作許多消費品中的成分,包括食品(例如在沙拉醬(salat dressing)和乳制品中作為增稠劑)和化妝品(例如在牙膏和化妝品中作為穩(wěn)定劑和增稠劑,以阻止成分分離)和化妝品(例如防曬霜)。另外的黃原膠已經(jīng)在石油工業(yè)中發(fā)現(xiàn)用途,其中黃原膠被大量使用以增稠鉆井泥漿。這些流體用于將由鉆頭切割的固體攜帶回表面。當循環(huán)停止時,固體仍保持懸浮在鉆井流體中。水平鉆井的廣泛使用和對鉆井固體的良好控制的需求已經(jīng)導致其擴大使用。它還被添加到自固化混凝土中,包括倒在水下的混凝土,以增加其粘度。
黃原膠的廣泛使用已導致希望降解和/或改性黃原膠的溶液或凝膠。黃原膠的完全酶降解需要若干酶活性,包括黃原膠裂解酶活性和內(nèi)切-β-1,4-葡聚糖酶活性。
黃原膠裂解酶是切割黃原膠的β-D-甘露糖基-β-D-1,4-葡萄糖醛酸基鍵,由此去除末端丙酮酸甘露糖的酶。兩種分離自溶藻弧菌類芽孢桿菌XL-1的黃原膠裂解酶(例如,Ruijssenaars(魯基森納斯)等人.(1999)‘A pyruvated mannose-specific xanthan lyase involved in xanthan degradation by Paenibacillus alginolyticus XL-1(在由溶藻弧菌類芽孢桿菌XL-1降解黃原膠中涉及的一種丙酮酸甘露糖特異性黃原膠裂解酶)’,Appl.Environ.Microbiol.(應用與環(huán)境微生物)65(6):2446-2452,和Ruijssenaars(魯基森納斯)等人.(2000),‘A novel gene encoding xanthan lyase of Paenibacillus alginolyticus strain XL-1(一種編碼溶藻弧菌類芽孢桿菌菌株XL-1的黃原膠降解酶的新穎基因)’,Appl.Environ.Microbiol.(應用與環(huán)境微生物)66(9):3945-3950)。
具有內(nèi)切-β-1,4-葡聚糖酶活性的酶在去除末端丙酮酸甘露糖后必須能夠切割黃原膠的高度取代的主鏈。已知這類酶來自糖基水解酶家族GH9(WO 2013/167581)。
發(fā)明概述
諸位發(fā)明人已經(jīng)驚奇地發(fā)現(xiàn)了一個新組的酶,該新組的酶具有內(nèi)切-β-1,4-葡聚糖酶活性并且能夠切割黃原膠的高度取代的骨架–并且其不屬于已知包括這種酶活性的糖基水解酶家族。這些酶與具有黃原酸降解活性的任何已知的酶沒有顯著的序列相似性,并且不能分配至已知的糖基水解酶家族。新組的內(nèi)切葡聚糖酶通過與專利申請?zhí)朎P14170186.2的SEQ ID NO 2中披露的和本文SEQ ID NO 42中顯示的多肽的氨基酸序列比對來鑒定。
本發(fā)明提供了用于降解黃原膠的新的且改進的酶以及此類酶用于清潔目的(例如去除黃原膠污物)以及在鉆探和石油工業(yè)中的用途。由于酶對纖維素也具有顯著的活性,所以酶也可以用于降解纖維素材料的過程中,例如,在纖維素生物質(zhì)的降解中用于生產(chǎn),例如,可發(fā)酵糖。
因此,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠具有活性的多肽,這些多肽選自下組,該組由以下各項組成:
(a)與SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽;
(b)由多核苷酸編碼的多肽,該多核苷酸在中嚴格條件下與(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項的成熟多肽編碼序列,(ii)(i)的全長補體雜交;
(c)由多核苷酸編碼的多肽,該多核苷酸與SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項的成熟多肽編碼序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(d)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽的變體,該變體在一個或多個位置包括取代、缺失、和/或插入;和
(e)(a)、(b)、(c)、或(d)的多肽的片段,該片段具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠具有活性。
本發(fā)明還涉及編碼本發(fā)明的多肽的多核苷酸;核酸構(gòu)建體;重組表達載體;包括這些多核苷酸的重組宿主細胞;以及產(chǎn)生這些多肽的方法。
本發(fā)明還涉及包括這些多肽的組合物,以及包括這些多肽的全發(fā)酵液配制品或細胞培養(yǎng)組合物。
本發(fā)明還涉及多肽和組合物用于降解黃原膠的用途,例如用于洗滌或清潔紡織品和/或硬表面如餐具洗滌。
本發(fā)明還涉及多肽和組合物用于降解纖維素材料的用途。
附圖簡要說明
圖1示出氨基酸序列SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40的多重比對。還包括與專利申請?zhí)朎P14170186.2的SEQ ID NO:2具有一致性的SEQ ID NO:42。
序列簡要說明
SEQ ID 來源于
SEQ ID NO 01/02 分解雨林土壤宏基因組B
SEQ ID NO 03/04 生物反應器富集廢水宏基因組
SEQ ID NO 05/06 Lewinella cohaerens
SEQ ID NO 07/08 Chthoniobacter flavus
SEQ ID NO 09/10 嗜常溫稻草/堆肥富集宏基因組
SEQ ID NO 11/12 人類糞便微生物組
SEQ ID NO 13/14 閃爍桿菌屬細菌
SEQ ID NO 15/16 豐佑菌科細菌
SEQ ID NO 17/18 豐佑菌科細菌
SEQ ID NO 19/20 Paludibacterium yongneupense
SEQ ID NO 21/22 迪克亞桿菌屬物種
SEQ ID NO 23/24 閃爍桿菌屬細菌
SEQ ID NO 25/26 Teredinibacter turnerae
SEQ ID NO 27/28 Teredinibacter turnerae
SEQ ID NO 29/30 Diplosphaera colitermitum
SEQ ID NO 31/32 Teredinibacter turnerae
SEQ ID NO 33/34 Teredinibacter turnerae
SEQ ID NO 35/36 Teredinibacter turnerae
SEQ ID NO 37/38 Teredinibacter turnerae
SEQ ID NO 39/40 牛瘤胃微生物群落
SEQ ID NO 41/42 浮霉狀菌屬(專利申請?zhí)朎P14170186.2的SEQ ID NO:2)
定義
等位基因變體:術語“等位基因變體”意指占用同一染色體位點的一種基因的兩個或更多個替代形式中的任一者。等位基因變異由突變天然產(chǎn)生,并且可以導致群體內(nèi)多態(tài)性?;蛲蛔兛梢允浅聊?在所編碼的多肽中沒有改變)或可編碼具有改變的氨基酸序列的多肽。多肽的等位基因變體是由基因的等位基因變體編碼的多肽。
纖維素結(jié)合結(jié)構(gòu)域:術語“纖維素結(jié)合結(jié)構(gòu)域”是指介導酶結(jié)合至纖維素底物的非晶區(qū)域的酶的區(qū)域。
催化結(jié)構(gòu)域:術語“催化結(jié)構(gòu)域”意思指酶的包含該酶的催化機器的區(qū)域。
cDNA:術語“cDNA”意指可以通過從得自真核或原核細胞的成熟的、剪接的mRNA分子進行反轉(zhuǎn)錄而制備的DNA分子。cDNA缺乏可以存在于對應基因組DNA中的內(nèi)含子序列。早先的初始RNA轉(zhuǎn)錄本是mRNA的前體,其在呈現(xiàn)為成熟的剪接的mRNA之前要經(jīng)一系列的步驟進行加工,包括剪接。
清潔或洗滌劑應用:術語“清潔或洗滌劑應用”意指將本發(fā)明的多肽施用于在任何組合物中,用于手動、機械或自動化清潔或洗滌硬表面或紡織品的目的。
清潔或洗滌劑組合物:術語“清潔或洗滌劑組合物”是指用于從有待清潔的物品(例如紡織品、餐具和硬表面)去除不希望的化合物的組合物。這些術語涵蓋選擇用于希望的具體類型的清潔組合物和產(chǎn)品的形式(例如、液體、凝膠、粉末、顆粒、糊狀、或噴霧組合物)的任何材料/化合物,并且包括但不限于洗滌劑組合物(例如,液體和/或固體衣物洗滌劑和精細織物洗滌劑;硬表面清潔配制品,如用于玻璃、木材、陶瓷和金屬臺面以及窗戶;地毯清潔劑;爐灶清潔劑;織物清新劑;織物柔軟劑;和紡織品和衣物預洗滌劑,連同餐具洗滌劑)。除了本發(fā)明的多肽之外,該洗滌劑配制品還可以包含一種或多種另外的酶(例如蛋白酶、淀粉酶、脂肪酶、角質(zhì)酶、纖維素酶、內(nèi)切葡聚糖酶、木葡聚糖酶、果膠酶、果膠裂解酶、黃原膠酶、黃原膠裂解酶、過氧化物酶、鹵代過氧合酶、過氧化氫酶以及甘露聚糖酶,或其任何混合物),和/或組分,例如表面活性劑、助洗劑、螯合劑(chelator)或螯合試劑(chelating agent)、漂白系統(tǒng)或漂白組分、聚合物、織物調(diào)理劑、增泡劑、抑泡劑、染料、香料、晦暗抑制劑、光學增亮劑、殺細菌劑、殺真菌劑、污垢懸浮劑、防蝕劑、酶抑制劑或穩(wěn)定劑、酶激活劑、一種或多種轉(zhuǎn)移酶、水解酶、氧化還原酶、上藍劑和熒光染料、抗氧化劑以及增溶劑。
編碼序列:術語“編碼序列”意指直接指定一個多肽的氨基酸序列的多核苷酸。編碼序列的邊界一般由開放閱讀框架決定,該開放閱讀框架從起始密碼子(如ATG、GTG或TTG)開始并且以終止密碼子(如TAA、TAG或TGA)結(jié)束。編碼序列可以是基因組DNA、cDNA、合成DNA或其組合。
控制序列:術語“控制序列”意指對于表達編碼本發(fā)明的成熟多肽的多核苷酸所必需的核酸序列。每個控制序列對于編碼該多肽的多核苷酸來說可以是天然的(即,來自相同基因)或外源的(即,來自不同基因),或相對于彼此是天然的或外源的。這些調(diào)控序列包括但不限于前導序列、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列和轉(zhuǎn)錄終止子。至少,控制序列包括啟動子,以及轉(zhuǎn)錄和翻譯終止信號。出于引入有利于將這些控制序列與編碼多肽的多核苷酸的編碼區(qū)連接的特異性限制酶切位點的目的,這些控制序列可以提供有多個接頭。
降解黃原膠:在此將術語“降解黃原膠”或“黃原膠降解活性”定義為將黃原膠解聚、降解或分解為更小的組分。黃原膠的降解可以是去除一個或多個側(cè)鏈糖,將黃原膠的骨架切成更小的組分,或去除一個或多個側(cè)鏈糖并且將黃原膠的骨架切成更小的組分。黃原膠的降解優(yōu)選地可以使用如描述于實例5中的粘度降低方法來測量??商娲兀S原膠的降解可以使用如實例6中所描述的還原末端方法來測量。
洗滌劑組合物:術語“洗滌劑組合物”是指用于從有待清潔的物品(例如紡織品、餐具和硬表面)去除不希望的化合物的組合物。該洗滌劑組合物可以用于例如清潔紡織品、餐具以及硬表面,用于家用清潔劑和工業(yè)清潔二者。這些術語涵蓋選擇用于希望的具體類型的清潔組合物和產(chǎn)品的形式(例如、液體、凝膠、粉末、顆粒、糊狀、或噴霧組合物)的任何材料/化合物,并且包括但不限于洗滌劑組合物(例如,液體和/或固體衣物洗滌劑和精細織物洗滌劑;硬表面清潔配制品,如用于玻璃、木材、陶瓷和金屬臺面以及窗戶;地毯清潔劑;爐灶清潔劑;織物清新劑;織物柔軟劑;和紡織品和衣物預洗滌劑,連同餐具洗滌劑)。除了包含本發(fā)明的多肽之外,該洗滌劑配制品還可以包含一種或多種另外的酶(例如,黃原膠裂解酶、蛋白酶、淀粉酶、脂肪酶、角質(zhì)酶、纖維素酶、內(nèi)切葡聚糖酶、木葡聚糖酶、果膠酶、果膠裂解酶、黃原膠酶、過氧化物酶、鹵代過氧合酶、過氧化氫酶以及甘露聚糖酶,或其任何混合物),和/或組分,例如表面活性劑、助洗劑、螯合劑(chelator)或螯合試劑(chelating agent)、漂白系統(tǒng)或漂白組分、聚合物、織物調(diào)理劑、增泡劑、抑泡劑、染料、香料、晦暗抑制劑、光學增亮劑、殺細菌劑、殺真菌劑、污垢懸浮劑、防蝕劑、酶抑制劑或穩(wěn)定劑、酶激活劑、一種或多種轉(zhuǎn)移酶、水解酶、氧化還原酶、上藍劑和熒光染料、抗氧化劑以及增溶劑。
餐具洗滌:術語“餐具洗滌”是指所有形式的洗滌餐具,例如手動或自動餐具洗滌。洗滌餐具包括但不限于,清潔所有形式的陶器,例如盤子、杯子、玻璃杯、碗,所有形式的用餐工具,例如匙、刀、叉,以及上菜用具連同陶瓷,塑料,金屬,瓷器,玻璃及丙烯酸酯。
餐具洗滌組合物:術語“餐具洗滌組合物”是指用于清潔硬表面的所有形式的組合物。本發(fā)明不局限于任何具體類型的餐具洗滌組合物或任何具體洗滌劑。
內(nèi)切葡聚糖酶:術語“內(nèi)切葡聚糖酶”意指一種內(nèi)切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.3.2.1.4),其催化纖維素、纖維素衍生物(如羧甲基纖維素和羥乙基纖維素)、地衣多糖中的1,4-β-D-糖苷鍵和混合β-1,3葡聚糖如谷類β-D-葡聚糖、木葡聚糖、黃原膠以及含有纖維素組分的其他植物材料中的β-1,4鍵的內(nèi)切水解??梢酝ㄟ^測量底物粘度的降低或通過還原糖測定所確定的還原末端的增加來確定內(nèi)切葡聚糖酶活性(張(Zhang)等人,2006,生物技術進展(Biotechnology Advances)24:452-481)。
對用黃原膠裂解酶預處理的黃原膠具有活性的內(nèi)切葡聚糖酶:術語“對用黃原膠裂解酶預處理的黃原膠具有活性的內(nèi)切葡聚糖酶”或“具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠具有活性的多肽”定義為對用黃原膠裂解酶預處理的黃原膠具有活性的內(nèi)切葡聚糖酶。本發(fā)明的內(nèi)切葡聚糖酶對用黃原膠裂解酶預處理的黃原膠具有活性。在本發(fā)明的一個方面中,對用黃原膠裂解酶預處理的黃原膠具有活性的內(nèi)切葡聚糖酶是具有以下項中任一項中所示序列的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。可以如實例6中所披露地確定對用黃原膠裂解酶預處理的黃原膠的活性。
酶洗滌益處:在此將術語“酶洗滌益處”定義為將一種酶添加至洗滌劑中與不具有該酶的同一洗滌劑相比的有利效果。可以由酶提供的重要的洗滌益處是在洗滌和或清潔之后沒有或有非常少的可見污垢的污物去除,預防或減少在洗滌過程中釋放的污垢的再沉積(一種也被稱作抗再沉積的效果),完全或部分恢復紡織品的白度(一種也被稱作增白的效果),這些紡織品初始是白色的但是在重復使用和洗滌后獲得淺灰色或淺黃色的外觀。不直接與污垢的催化去污或其再沉積的預防相關的紡織品護理益處對于酶洗滌益處而言也是重要的。此類紡織品護理益處的實例是預防或減少染料從一織物轉(zhuǎn)移至另一織物或同一織物的另一部分(一種也被稱作染料轉(zhuǎn)移抑制或抗返染的效果),從織物表面去除突出或斷裂的纖維以減少起球傾向或去除已經(jīng)存在的絨球或絨毛(一種也被稱作抗起球的效果),改進織物柔軟性,織物的顏色澄清以及去除陷在織物或服裝的纖維中的微粒狀污垢。酶漂白是一種另外的酶洗滌益處,其中通常將催化活性用于催化漂白組分(例如過氧化氫或其他過氧化物)的形成。
表達:術語“表達”包括涉及多肽產(chǎn)生的任何步驟,包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾以及分泌。
表達載體:術語“表達載體”意指線性或環(huán)狀DNA分子,該分子包含編碼多肽的多核苷酸并且該多核苷酸可操作地與提供用于其表達的控制序列相連接。
片段:術語“片段”意指在成熟多肽的氨基和/或羧基末端缺失一個或多個(例如,若干個)氨基酸的多肽;其中該片段具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠預處理的黃原膠具有活性。
糖苷水解酶家族:糖苷水解酶是催化糖基鍵水解以釋放更小的糖的酶。存在超過100類的糖苷水解酶,這些糖苷水解酶已被分類為糖基水解酶(GH)家族,參見漢麗塞塔(Henrissat)等人(1991)‘基于氨基酸序列相似性的糖基水解酶分類(A classification of glycosyl hydrolases based on amino-acid sequence similarities)’,生物化學雜志(J.Biochem.)280:309-316和Uniprot網(wǎng)站,www.cazy.org。
硬表面清潔:在此將術語“硬表面清潔”定義為清潔硬表面,其中硬表面可以包括地板、桌子、墻壁、屋頂?shù)?,連同硬物體的表面,例如汽車(汽車洗滌)和餐具(餐具洗滌)。餐具洗滌包括但不限于,清潔盤子、杯子、玻璃杯、碗、及刀具(例如匙、刀、叉)、上菜用具、陶瓷、塑料、金屬、瓷器、玻璃及丙烯酸酯。
宿主細胞:術語“宿主細胞”意指易于用包含本發(fā)明的多核苷酸的核酸構(gòu)建體或表達載體轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導等的任何細胞類型。術語“宿主細胞”涵蓋由于復制期間發(fā)生的突變而與親本細胞不同的親本細胞的任何后代。
改進的洗滌性能:在此將術語“改進的洗滌性能”定義為一種(變體)酶(還有酶的共混物,不只是變體還有骨架,以及與某種清潔組合物組合,等)相對于親本蛋白酶變體的洗滌性能展示出一種蛋白質(zhì)變體的洗滌性能的改變,例如增加的去污。術語“洗滌性能”包括在衣物洗滌并且例如在餐具洗滌中的洗滌性能。
分離的:術語“分離的”意指處于自然界中不存在的形式或環(huán)境中的物質(zhì)。分離的物質(zhì)的非限制性實例包括(1)任何非天然發(fā)生的物質(zhì),(2)包括但不限于任何酶、變體、核酸、蛋白質(zhì)、肽或輔因子的任何物質(zhì),該物質(zhì)至少部分地從與其本質(zhì)相關的一種或多種或所有天然發(fā)生的成分中去除;(3)相對于天然發(fā)現(xiàn)的物質(zhì)通過人工修飾的任何物質(zhì);或(4)通過相對于與其天然相關的其他組分,增加物質(zhì)的量而修飾的任何物質(zhì)(例如宿主細胞中的重組產(chǎn)生;編碼該物質(zhì)的基因的多個拷貝;以及使用比與編碼該物質(zhì)的基因天然相關的啟動子更強的啟動子)。分離的物質(zhì)可以存在于發(fā)酵液樣品中,例如,可以將宿主細胞進行遺傳修飾來表達本發(fā)明的多肽。來自宿主細胞的發(fā)酵液將包括分離的多肽。
洗衣:術語“洗衣”涉及家用洗衣和工業(yè)洗衣兩者并且意指用包含本發(fā)明的清潔或洗滌劑組合物的溶液處理紡織品的過程。洗衣過程可以例如使用例如家用或工業(yè)洗衣機進行或可以手動進行。
成熟多肽:術語“成熟多肽”意指在翻譯和任何翻譯后修飾如N末端加工、C末端截短、糖基化作用、磷酸化作用等之后處于其最終形式的多肽。內(nèi)切葡聚糖酶的成熟肽是:SEQ ID NO:2中的位置1至813,SEQ ID NO:4中的位置1至836,SEQ ID NO:6中的位置1至949,SEQ ID NO:8中的位置1至830,SEQ ID NO:10中的位置1至866,SEQ ID NO:12中的位置1至827,SEQ ID NO:14中的位置1至903,SEQ ID NO:16中的位置1至932,SEQ ID NO:18中的位置1至920,SEQ ID NO:20中的位置1至844,SEQ ID NO:22中的位置1至849,SEQ ID NO:24中的位置1至903,SEQ ID NO:26中的位置1至894,SEQ ID NO:28中的位置1至894,SEQ ID NO:30中的位置1至955,SEQ ID NO:32中的位置1至894,SEQ ID NO:34中的位置1至893,SEQ ID NO:36中的位置1至894,SEQ ID NO:38中的位置1至894,和SEQ ID NO:40中的位置1至867。
本領域中已知的是,一個宿主細胞可以產(chǎn)生由同一多核苷酸表達的兩種或更多種不同成熟多肽(即,具有不同C末端和/或N末端氨基酸)的混合物。本領域還已知,不同的宿主細胞不同地加工多肽,并且因此一個表達多核苷酸的宿主細胞當與另一個表達相同多核苷酸的宿主細胞相比時可以產(chǎn)生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。
成熟多肽編碼序列:術語“成熟多肽編碼序列”意指編碼具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠具有活性的成熟多肽的多核苷酸。內(nèi)切葡聚糖酶基因的成熟肽編碼部分是:SEQ ID NO:1中的位置67至2508,SEQ ID NO:3中的位置76至2583,SEQ ID NO:5中的位置67至2913,SEQ ID NO:7中的位置73至2562,SEQ ID NO:9中的位置115至2712,SEQ ID NO:11中的位置103至2565,SEQ ID NO:13中的位置1至2712,SEQ ID NO:15中的位置1至2799,SEQ ID NO:17中的位置1至2763,SEQ ID NO:19中的位置1至2535,SEQ ID NO:21中的位置1至2550,SEQ ID NO:23中的位置1至2712,SEQ ID NO:25中的位置1至2685,SEQ ID NO:27中的位置1至2685,SEQ ID NO:29中的位置1至2868,SEQ ID NO:31中的位置1至2685,SEQ ID NO:33中的位置1至2682,SEQ ID NO:35中的位置1至2685,SEQ ID NO:37中的位置1至2685,和SEQ ID NO:39中的位置1至2604。
核酸構(gòu)建體:術語“核酸構(gòu)建體”意指單鏈或雙鏈的核酸分子,該核酸分子是從天然存在的基因中分離的,或以本來不存在于自然界中的方式被修飾成含有核酸的區(qū)段,或是合成的,該核酸分子包括一個或多個控制序列。
可操作地連接:術語“可操作地連接”意指如下的構(gòu)造,其中,控制序列相對于多核苷酸的編碼序列安置在適當位置,從而使得該控制序列指導該編碼序列的表達。
序列一致性:用參數(shù)“序列一致性”來描述兩個氨基酸序列之間或兩個核苷酸序列之間的相關性。
出于本發(fā)明的目的,使用如在EMBOSS包(EMBOSS:歐洲分子生物學開放軟件套件(The European Molecular Biology Open Software Suite),賴斯(Rice)等人,2000,遺傳學趨勢(Trends Genet.)16:276-277)(優(yōu)選5.0.0版或更新版本)的尼德爾(Needle)程序中所實施的尼德爾曼-翁施(Needleman-Wunsch)算法(尼德爾曼(Needleman)和翁施(Wunsch),1970,分子生物學雜志(J.Mol.Biol.)48:443-453)來確定兩個氨基酸序列之間的序列一致性。所使用的參數(shù)是空位開放罰分10,空位延伸罰分0.5,以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩陣。將標記為“最長同一性”的Needle輸出(使用-nobrief選項獲得)用作百分比同一性并且是如下計算的:
(一致的殘基X 100)/(比對長度-比對中的空位總數(shù))
出于本發(fā)明的目的,使用如在EMBOSS包(EMBOSS:歐洲分子生物學開放軟件套件,賴斯等人,2000,同上)(優(yōu)選5.0.0版或更新版本)的尼德爾程序中所實施的尼德爾曼-翁施算法(尼德爾曼和翁施,1970,同上)來確定兩個脫氧核糖核苷酸序列之間的序列一致性。所使用的參數(shù)是空位開放罰分10,空位拓展罰分0.5,和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩陣。將標記為“最長同一性”的Needle輸出(使用-nobrief選項獲得)用作百分比同一性并且是如下計算的:
(一致的脫氧核糖核苷酸X 100)/(比對長度-比對中的空位總數(shù))
嚴格條件:術語“非常低嚴格條件”是指對于長度為至少100個核苷酸的探針而言,遵循標準DNA印跡程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并變性的鮭魚精子DNA和25%甲酰胺中預雜交和雜交12至24小時。最后在45℃下使用2X SSC、0.2%SDS將載體材料洗滌三次,每次15分鐘。
術語“低嚴格條件”意指對于至少100個核苷酸長度的探針,按照標準DNA印跡程序在42℃于5X SSPE、0.3%SDS、200微克/ml剪切和變性的鮭精DNA和25%甲酰胺中預雜交和雜交12至24小時。最后在50℃下使用2X SSC、0.2%SDS將載體材料洗滌三次,每次15分鐘。
術語“中嚴格條件”是指對于長度為至少100個核苷酸的探針而言,遵循標準DNA印跡程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并變性的鮭精DNA和35%甲酰胺中預雜交和雜交12至24小時。最后在55℃下使用2X SSC、0.2%SDS將載體材料洗滌三次,每次15分鐘。
術語“中-高嚴格條件”意指對于長度為至少100個核苷酸的探針而言,遵循標準DNA印跡程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并變性的鮭精DNA和35%甲酰胺中預雜交和雜交12至24小時。最后在60℃下使用2X SSC、0.2%SDS將載體材料洗滌三次,每次15分鐘。
術語“高嚴格條件”意指對于長度為至少100個核苷酸的探針而言,遵循標準DNA印跡程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并變性的鮭精DNA和50%甲酰胺中預雜交和雜交12至24小時。最后在65℃下使用2X SSC、0.2%SDS將載體材料洗滌三次,每次15分鐘。
術語“非常高嚴格條件”是指對于長度為至少100個核苷酸的探針而言,遵循標準DNA印跡程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并變性的鮭精DNA和50%甲酰胺中預雜交和雜交12至24小時。最后在70℃下使用2X SSC、0.2%SDS將載體材料洗滌三次,每次15分鐘。
子序列:術語“子序列”是指具有從成熟多肽編碼序列的5’和/或3’端缺失的一個或多個(例如,若干個)核苷酸的多核苷酸;其中該子序列編碼具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠具有活性的片段。
紡織品:術語“紡織品”意指包括紗線、紗線中間體、纖維、非機織物材料、天然材料、合成材料、以及任何其他紡織品材料的任何紡織品材料,這些材料制造的織物和由這些織物制成的產(chǎn)品(例如服裝和其他物品)。該紡織品或織物可以處于針織品、機織物、牛仔布、非機織物、氈、紗線、以及毛巾布的形式。這些紡織品可以是纖維素基的,如天然纖維素,包括棉布、亞麻/亞麻布、黃麻、苧麻、劍麻或椰殼纖維或者人造纖維素(例如,來源于木漿),包括纖維膠/人造絲、苧麻、醋酸纖維素纖維(三胞)、萊賽爾纖維(lyocell)或其共混物。紡織品或織物也可以不基于纖維素,如天然聚酰胺,包括羊毛、駝毛、羊絨、馬海毛、兔毛和蠶絲或合成聚合物如尼龍、芳族聚酰胺、聚酯、丙烯酸、聚丙烯和氨綸/彈性纖維(spandex/elastane)、或其共混物其以及基于纖維素和不基于纖維素的纖維的共混物。共混物的例子是棉和/或人造絲/纖維膠與一種或多種伴隨材料的共混物,該伴隨材料例如是羊毛、合成纖維(例如聚酰胺纖維、丙烯酸纖維、聚酯纖維、聚乙烯醇纖維、聚氯乙烯纖維、聚亞胺酯纖維、聚脲纖維、芳族聚酰胺纖維)以及含纖維素的纖維(例如人造絲/纖維膠、苧麻、亞麻/亞麻布、黃麻、醋酸纖維素纖維、萊賽爾纖維)。織物可以是常規(guī)的可洗滌衣物,例如弄臟的家居衣物。當使用術語織物或衣服時,旨在也包括廣義術語紡織品。
紡織品護理益處:不直接與污垢的催化去污或其再沉積的預防相關的紡織品護理益處對于酶洗滌益處而言也是重要的。此類紡織品護理益處的實例是預防或減少染料從一紡織品轉(zhuǎn)移至另一紡織品或同一紡織品的另一部分(一種也被稱作染料轉(zhuǎn)移抑制或抗返染的效果),從紡織品表面去除突出或斷裂的纖維以減少起球傾向或去除已經(jīng)存在的絨球或絨毛(一種也被稱作抗起球的效果),改進紡織品柔軟性,紡織品的顏色澄清以及去除陷在紡織品的纖維中的微粒狀污垢。酶漂白是一種另外的酶洗滌益處,其中通常將催化活性用于催化漂白組分(例如過氧化氫或其他過氧化物或其他漂白種類)的形成。
變體:術語“變體”意指具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠活性的多肽,并且在一個或多個(例如,若干個)位置包括改變,即取代、插入和/或缺失。取代意指占據(jù)位置的氨基酸替換不同的氨基酸;缺失意指去除占據(jù)一個位置的氨基酸;并且插入意指在鄰接并且緊隨占據(jù)位置的氨基酸之后添加氨基酸。
洗滌性能:術語“洗滌性能”被用作酶在例如洗滌或硬表面清潔過程中去除存在于有待清潔的物體上的污漬的能力??梢酝ㄟ^計算如‘用于衣物洗滌的自動機械應力測定(AMSA)’中的所謂的強度值(Int)或如WO2013/167581中所定義的反射值(Rem)來量化洗滌性能的改進。
白度:在此將術語“白度”定義為在不同領域并且針對不同顧客具有不同含義的廣義術語。白度的損失可以例如歸因于灰化、黃化、或光學增亮劑/調(diào)色劑的去除。灰化和黃化可歸因于污垢再沉積、身體污垢、來自例如鐵和銅離子或染料轉(zhuǎn)移的著色。白度可包括來自以下列表的一個或若干個問題:著色劑或染料作用;不完全污物去除(例如身體污垢、皮脂等);再沉積(物體的灰化、黃化或其他變色)(去除的污垢與紡織品的其他部分(弄臟的或未弄臟的)再關聯(lián));在應用過程中紡織品的化學變化;以及顏色的澄清或淡色化。
黃原膠裂解酶:在此將術語“黃原膠裂解酶”定義為一種切割黃原膠中的β-D-甘露糖基-β-D-1,4-葡萄糖醛酸基鍵的酶(EC 4.2.2.12)。出于本發(fā)明的目的,根據(jù)實例6中所述的程序確定黃原膠裂解酶活性。
發(fā)明詳述
本發(fā)明提供了對用黃原膠裂解酶預處理的黃原膠具有活性的內(nèi)切葡聚糖酶以及編碼這些多肽的多核苷酸。內(nèi)切葡聚糖酶不屬于已知包括降解黃原膠的酶的GH家族。另外,黃原膠裂解酶與對用黃原膠裂解酶預處理的黃原膠具有活性的本發(fā)明的內(nèi)切葡聚糖酶的組合示出超過單獨使用黃原膠裂解酶或?qū)τ命S原膠裂解酶預處理的黃原膠具有活性的內(nèi)切葡聚糖酶的協(xié)同的改進洗滌性能。此外,酶可以對任何底物纖維素,凝膠多糖和β-葡聚糖具有活性。
對用黃原膠裂解酶預處理的黃原膠具有活性的內(nèi)切葡聚糖酶
在一個實施例中,本發(fā)明涉及與以下項中任一項的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,該多肽具有對用黃原膠裂解酶預處理的黃原膠具有活性的內(nèi)切葡聚糖酶。在一個方面中,這些多肽與SEQ ID NO:14的成熟多肽的區(qū)別不超過50個氨基酸,例如1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、31個、32個、33個、34個、35個、36個、37個、38個、39個、40個、41個、42個、43個、44個、45個、46個、47個、48個、或49個。在一個優(yōu)選方面中,該多肽與以下項中任一項的成熟多肽相差高達10個氨基酸,例如1、2、3、4、5、6、7、8、9、或10個:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一個具體的實施例中,本發(fā)明涉及與以下項中任一項的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中該多肽具有以下項中任一項的成熟多肽的內(nèi)切葡聚糖酶活性和/或黃原膠降解活性的至少70%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一個具體的實施例中,本發(fā)明涉及與以下項中任一項的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中該多肽具有以下項中任一項的成熟多肽的內(nèi)切葡聚糖酶活性和/或黃原膠降解活性的至少75%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一個具體的實施例中,本發(fā)明涉及與以下項中任一項的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中該多肽具有以下項中任一項的成熟多肽的內(nèi)切葡聚糖酶活性和/或黃原膠降解活性的至少80%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一個具體的實施例中,本發(fā)明涉及與以下項中任一項的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中該多肽具有以下項中任一項的成熟多肽的內(nèi)切葡聚糖酶活性和/或黃原膠降解活性的至少85%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一個具體的實施例中,本發(fā)明涉及與以下項中任一項的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中該多肽具有以下項中任一項的成熟多肽的內(nèi)切葡聚糖酶活性和/或黃原膠降解活性的至少90%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一個具體的實施例中,本發(fā)明涉及與以下項中任一項的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中該多肽具有以下項中任一項的成熟多肽的內(nèi)切葡聚糖酶活性和/或黃原膠降解活性的至少95%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一個具體的實施例中,本發(fā)明涉及與以下項中任一項的成熟多肽具有至少60%、至少65%、至少75%、至少70%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40,并且其中該多肽具有以下項中任一項的成熟多肽的內(nèi)切葡聚糖酶活性和/或黃原膠降解活性的至少100%:SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40。
在一個實施例中,該多肽已經(jīng)被分離。
本發(fā)明的多肽優(yōu)選地包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的氨基酸1至846或其等位基因變體,或由其組成;或者是其具有內(nèi)切葡聚糖酶活性和/或黃原膠降解活性的片段。在另一個方面中,該多肽包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽,或由其組成。
在另一個實施例中,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠活性的多肽,該多肽由多核苷酸編碼,該多核苷酸在高嚴格條件下與(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39的成熟多肽編碼序列,或(ii)(i)的全長補體雜交(薩姆布魯克(Sambrook)等人,1989,分子克隆實驗手冊(Molecular Cloning,A Laboratory Manual),第2版,冷泉港,紐約)。在一個實施例中,該多肽已經(jīng)被分離。
可以根據(jù)本領域中熟知的方法,使用SEQ ID NO:1的多核苷酸或其子序列,連同SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的多肽或其片段來設計核酸探針,以鑒定并且克隆編碼多肽的DNA,這些多肽具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠具有活性。具體地,可以遵循標準DNA印跡程序,使用此類探針與來自不同屬或物種的菌株的感興趣的細胞的基因組DNA或cDNA雜交,以便鑒定和分離其中的對應基因。此類探針可以明顯短于完整序列,但是長度應為至少15,例如至少25、至少35、或至少70個核苷酸。優(yōu)選地,核酸探針的長度為至少100個核苷酸,例如長度為至少200個核苷酸、至少300個核苷酸、至少400個核苷酸、至少500個核苷酸、至少600個核苷酸、至少700個核苷酸、至少800個核苷酸、或至少900個核苷酸。DNA和RNA探針兩者都可使用。典型地將探針進行標記(例如,用32P、3H、35S、生物素、或抗生物素蛋白),以檢測相應的基因。本發(fā)明涵蓋此類探針。
可以篩選從此類其他菌株制備的基因組DNA或cDNA文庫的與上述探針雜交并且編碼本發(fā)明的多肽的DNA。來自此類其他菌株的基因組DNA或其他DNA可以通過瓊脂糖或聚丙烯酰胺凝膠電泳、或其他分離技術來分離。來自文庫的DNA或分離的DNA可轉(zhuǎn)移到并固定在硝酸纖維素或其他適合的載體材料上。為了鑒定與SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項、或其子序列雜交的克隆或DNA,在DNA印跡中使用載體材料。
出于本發(fā)明的目的,雜交指示多核苷酸在非常低至非常高嚴格條件下與對應于以下項的標記的核酸探針雜交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項;(ii)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項的成熟多肽編碼序列;(iii)其全長補體;或(iv)其子序列。在這些條件下與該核酸探針雜交的分子可以使用例如X射線薄膜或本領域中已知的任何其他檢測手段進行檢測。
在一個方面中,該核酸探針是核苷酸,該核苷酸是SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項的子序列。在另一個方面中,該核酸探針是多核苷酸,該多核苷酸編碼SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的多肽;其成熟肽;或其片段。在另一個方面中,該核酸探針是SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項。
在另一個實施例中,本發(fā)明涉及具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠具有活性的多肽,該多肽由多核苷酸編碼,該多核苷酸與SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項的成熟多肽編碼序列具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在另外的實施例中,該多肽已經(jīng)被分離。
在另一個實施例中,本發(fā)明涉及SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽的變體,該變體在一個或多個(例如,若干個)位置包括取代、缺失、和/或插入。在一個實施例中,引入SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽中的氨基酸取代、缺失和/或插入的數(shù)量高達10個,例如,1、2、3、4、5、6、7、8、9、或10個。這些氨基酸變化可以具有微小性質(zhì),即,不會顯著地影響蛋白的折疊和/或活性的保守氨基酸取代或插入;小缺失,典型地為1-30個氨基酸;小氨基或羧基-末端延伸,如氨基末端甲硫氨酸殘基;高達20-25個殘基的小連接肽;或便于通過改變凈電荷或另一種功能來純化的較小延伸,例如His-標記(聚組氨酸段)、抗原表位或結(jié)合結(jié)構(gòu)域。
保守取代的實例是在下組的范圍內(nèi):堿性氨基酸(精氨酸、賴氨酸及組氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、極性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、異亮氨酸及纈氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、絲氨酸、蘇氨酸及甲硫氨酸)。一般不會改變比活性的氨基酸取代是本領域已知的并且例如由H.諾伊拉特(Neurath)和R.L.希爾(Hill),1979,在蛋白質(zhì)(The Proteins),學術出版社(Academic Press),紐約中描述。常見的取代為Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。
可替代地,氨基酸改變具有這樣一種性質(zhì):改變多肽的物理化學特性。例如,氨基酸改變可以提高多肽的熱穩(wěn)定性、改變底物特異性、改變最適pH,等等。
可以根據(jù)本領域中已知的程序,如定點誘變或丙氨酸掃描誘變(坎寧漢(Cunningham)和威爾斯(Wells),1989,科學(Science)244:1081-1085)來鑒定多肽中的必需氨基酸。在后一技術中,在分子中的每個殘基處引入單一的丙氨酸突變,并對得到的分子測試內(nèi)切葡聚糖酶活性和/或黃原膠降解活性從而鑒定對分子活性至關重要的氨基酸殘基。還參見希爾頓(Hilton)等人,1996,生物化學雜志(J.Biol.Chem.)271:4699-4708。也可結(jié)合假定接觸位點氨基酸的突變,如通過以下技術例如核磁共振、結(jié)晶學、電子衍射、或光親和標記進行確定的對結(jié)構(gòu)進行物理學分析,從而確定酶的活性位點或其他生物學相互作用。參見,例如德·沃斯(de Vos)等人,1992,科學(Science)255:306-312;史密斯(Smith)等人,1992,分子生物學雜志(J.Mol.Biol.)224:899-904;Wlodaver等人,1992,歐洲生物化學學會聯(lián)盟通訊(FEBS Lett.)309:59-64。還可以從與相關多肽的比對推斷鑒定必需氨基酸。
可以做出單個或多個氨基酸取代、缺失和/或插入并且使用誘變、重組和/或改組的已知方法進行測試,隨后進行相關篩選程序,如由里德哈爾-奧爾森(Reidhaar-Olson)和薩奧爾(Sauer),1988,科學(Science)241:53-57;博維(Bowie)和薩奧爾,1989,美國科學院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625所披露的那些。可以使用的其他方法包括易錯PCR、噬菌體展示(例如,羅曼(Lowman)等人,1991,生物化學(Biochemistry)30:10832-10837;美國專利號5,223,409;WO 92/06204)和區(qū)域定向誘變(德比舍爾(Derbyshire)等人,1986,基因(Gene)46:145;內(nèi)爾(Ner)等人,1988,DNA 7:127)。
可以結(jié)合誘變/改組方法與高通量自動化篩選方法來檢測由宿主細胞表達的克隆的、誘變的多肽的活性(內(nèi)斯(Ness)等人,1999,自然生物技術(Nature Biotechnology)17:893-896)。編碼活性多肽的誘變的DNA分子可以回收自宿主細胞,并且使用本領域的標準方法對其進行迅速測序。這些方法允許迅速確定多肽中單個氨基酸殘基的重要性。
多肽可以是雜合多肽,其中一個多肽的區(qū)域融合在另一多肽的區(qū)域的N末端或C末端。
多肽還可以是融合多肽或可切割的融合多肽,其中另一多肽融合在本發(fā)明的多肽的N-末端或C-末端。通過將編碼另一多肽的多核苷酸融合到本發(fā)明的多核苷酸而產(chǎn)生融合多肽。用于產(chǎn)生融合多肽的技術在本領域是已知的,并且包括連接編碼多肽的編碼序列,這樣使得它們在框內(nèi)并且使得融合多肽的表達處于相同的一個或多個啟動子和終止子的控制下。融合多肽還可以使用內(nèi)含肽技術來構(gòu)建,其中融合多肽在翻譯后產(chǎn)生(庫珀(Cooper)等人,1993,歐洲分子生物學學會雜志(EMBO J.)12:2575-2583;道森(Dawson)等人,1994,科學(Science)266:776-779)。
融合多肽可以在兩種多肽之間進一步包括切割位點。在融合蛋白分泌之時,該位點被切割,從而釋放出這兩種多肽。切割位點的實例包括但不限于在如下文獻中披露的位點:馬丁(Martin)等人,2003,工業(yè)微生物學生物技術雜志(J.Ind.Microbiol.Biotechnol.)3:568-576;Svetina等人,2000,生物技術雜志(J.Biotechnol.)76:245-251;拉斯馬森-威爾遜(Rasmussen-Wilson)等人,1997,應用與環(huán)境微生物學(Appl.Environ.Microbiol.)63:3488-3493;沃德(Ward)等人,1995,生物技術(Biotechnology)13:498-503;以及孔特雷拉斯(Contreras)等人,1991,生物技術9:378-381;伊頓(Eaton)等人,1986,生物化學(Biochemistry)25:505-512;Collins-Racie等人,1995,生物技術13:982-987;卡特(Carter)等人,1989,蛋白質(zhì):結(jié)構(gòu)、功能和遺傳學(Proteins:Structure,Function,and Genetics)6:240-248;和史蒂文斯(Stevens),2003,世界藥物發(fā)現(xiàn)(Drug Discovery World)4:35-48。
具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠具有活性的多肽的來源
本發(fā)明的多肽可獲得自任何屬的微生物。出于本發(fā)明的目的,如在此結(jié)合給定的來源使用的術語“從…中獲得”應意指由多核苷酸編碼的多肽是由該來源或者由其中已經(jīng)插入來自該來源的多核苷酸的菌株產(chǎn)生的。在一個方面中,獲得自給定來源的多肽被分泌到細胞外。
在一個方面中,該多肽是細菌多肽。在一個方面中,該多肽是真菌多肽。在一個方面中,該多肽是從以下項中任一項獲得的多肽:賴文氏菌屬(Lewinella)物種、Chthoniobacter物種、閃爍桿菌屬(Fervidibacteria)物種、豐佑菌科(Opitutaceae)物種、迪克亞桿菌屬(Dickeya)物種、Teredinibacter物種、和Diplosphaera物種,這些包括以下物種:Lewinella cohaerens、Chthoniobacter flavus、Teredinibacter turnerae、和Diplosphaera colitermitum。
這種以及相關物種的菌株可以容易地在許多培養(yǎng)物保藏中心為公眾所獲得,如美國典型培養(yǎng)物保藏中心(ATCC)、德國微生物菌種保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSMZ)、荷蘭菌種保藏中心(Centraalbureau Voor Schimmelcultures,CBS)以及美國農(nóng)業(yè)研究服務專利培養(yǎng)物保藏中心北方地區(qū)研究中心(NRRL)。
可以使用以上提到的探針從其他來源,包括從自然界(例如,土壤、堆肥、水等)分離的微生物或直接從自然材料(例如,土壤、堆肥、水等)獲得的DNA樣品鑒定和獲得該多肽。用于從自然生活環(huán)境中直接分離微生物和DNA的技術是本領域熟知的。然后可以通過類似地篩選另一微生物的基因組DNA或cDNA文庫或混合的DNA樣品來獲得編碼該多肽的多核苷酸。一旦用一種或多種探針檢測到編碼多肽的多核苷酸,就可以通過使用本領域普通技術人員已知的技術分離或克隆該多核苷酸(參見,例如,薩姆布魯克(Sambrook)等人,1989,見上文)。
多核苷酸
本發(fā)明還涉及編碼本發(fā)明的多肽的多核苷酸,如在此所述。在一個實施例中,編碼本發(fā)明的多肽的多核苷酸已經(jīng)被分離。
用于分離或克隆多核苷酸的技術是本領域中已知的并且包括從基因組DNA或cDNA,或其組合進行分離。來自基因組DNA的多核苷酸的克隆可以例如通過使用眾所周知的聚合酶鏈反應(PCR)或用以對具有共有的結(jié)構(gòu)特征的克隆的DNA片段進行檢測的表達庫抗體篩選來實現(xiàn)。參見例如,伊尼斯(Innis)等人,1990,PCR:方法和應用指南(PCR:A Guide to Methods and Application),學術出版社(Academic Press),紐約。可以使用其他核酸擴增程序例如連接酶鏈式反應(LCR)、連接激活轉(zhuǎn)錄(LAT)和基于多核苷酸的擴增(NASBA)。這些多核苷酸可以克隆自賴文氏菌屬物種、Chthoniobacter物種、閃爍桿菌屬物種、豐佑菌科物種、迪克亞桿菌屬物種、Teredinibacter物種、和Diplosphaera物種,包括以下物種:Lewinella cohaerens、Chthoniobacter flavus、Teredinibacter turnerae、和Diplosphaera colitermitum,或者相關有機體的菌株,并且因此例如可以是多核苷酸的多肽編碼區(qū)域的等位基因的或物種的變體。
修飾編碼本發(fā)明的多肽的多核苷酸對于合成與所述多肽基本上類似的多肽可為必需的。術語“基本上類似”于該多肽是指該多肽的非天然存在的形式。這些多肽可能以某種工程化方式而不同于從其天然來源分離的多肽,例如在比活性、熱穩(wěn)定性、最適pH等方面不同的變體。這些變體可以基于以SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項的成熟多肽編碼序列,例如,其子序列形式呈現(xiàn)的多核苷酸,和/或通過引入不會改變該多肽的氨基酸序列,但對應于預定用于產(chǎn)生該酶的宿主生物體的密碼子用法的核苷酸取代,或通過引入可以產(chǎn)生不同氨基酸序列的核苷酸取代來構(gòu)建。對于核苷酸取代的一般描述,參見例如福德(Ford)等人,1991,蛋白質(zhì)表達與純化(Protein Expression and Purification)2:95-107。
核酸構(gòu)建體
本發(fā)明還涉及核酸構(gòu)建體,這些核酸構(gòu)建體包含可操作地連接至一個或多個控制序列的本發(fā)明的多核苷酸,在與控制序列相容的條件下,這些控制序列指導編碼序列在適合的宿主細胞中表達。
可以用許多方式操作所述多核苷酸以便于多肽的表達。取決于表達載體,在其插入載體以前操縱多核苷酸可以是希望的或必需的。用于利用重組DNA方法修飾多核苷酸的技術是本領域熟知的。
該控制序列可以是啟動子,即,被宿主細胞識別以對編碼本發(fā)明的多肽的多核苷酸進行表達的多核苷酸。該啟動子包含轉(zhuǎn)錄控制序列,這些序列介導該多肽的表達。該啟動子可以是在宿主細胞中顯示出轉(zhuǎn)錄活性的任何多核苷酸,包括變體、截短型及雜合型啟動子,并且可以由編碼與該宿主細胞同源或異源的細胞外或細胞內(nèi)多肽的基因獲得。
用于在細菌宿主細胞中指導本發(fā)明的核酸構(gòu)建體的轉(zhuǎn)錄的適合啟動子的實例是從以下基因中獲得的啟動子:解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌α-淀粉酶基因(amyL)、地衣芽孢桿菌青霉素酶基因(penP)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽糖淀粉酶基因(amyM)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、枯草芽孢桿菌xylA和xylB基因、蘇云金桿菌cryIIIA基因(阿蓋塞(Agaisse)和勒爾克呂(Lereclus),1994,分子微生物學(Molecular Microbiology)13:97-107)、大腸桿菌lac操縱子、大腸桿菌trc啟動子(埃貢(Egon)等人,1988,基因(Gene)69:301-315)、天藍鏈霉菌瓊脂水解酶基因(dagA)、以及原核β-內(nèi)酰胺酶基因(維拉-卡馬洛夫(Villa-Kamaroff)等人,1978,美國國家科學院院刊(Proc.Natl.Acad.Sci.USA)75:3727-3731)以及tac啟動子(德波爾(DeBoer)等人,1983,美國國家科學院院刊80:21-25)。其他啟動子描述在吉爾伯特(Gilbert)等人,1980,科學美國人(Scientific American)242:74-94的“來自重組細菌的有用蛋白質(zhì)(Useful proteins from recombinant bacteria)”;以及在薩姆布魯克(Sambrook)等人,1989,同上。串聯(lián)啟動子的實例披露在WO 99/43835中。
在絲狀真菌宿主細胞中,用于指導本發(fā)明的核酸構(gòu)建體的轉(zhuǎn)錄的合適啟動子的實例是獲得自以下各項的基因的啟動子:構(gòu)巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構(gòu)酶、尖鐮孢胰蛋白酶–樣蛋白酶(WO 96/00787)、鑲片鐮孢菌淀粉葡糖苷酶(WO 00/56900)、鑲片鐮孢菌Daria(達莉亞)(WO 00/56900)、鑲片鐮孢菌Quinn(奎恩)(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內(nèi)切葡聚糖酶I、里氏木霉內(nèi)切葡聚糖酶II、里氏木霉內(nèi)切葡聚糖酶III、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻譯延伸因子,連同NA2-tpi啟動子(來自編碼中性α-淀粉酶的曲霉屬基因的修飾的啟動子,其中已經(jīng)用來自編碼丙糖磷酸異構(gòu)酶的曲霉屬基因的未翻譯的前導子替換未翻譯的前導子;非限制性實例包括來自編碼中性α-淀粉酶的黑曲霉基因的修飾的啟動子,其中已經(jīng)用來自編碼丙糖磷酸異構(gòu)酶的構(gòu)巢曲霉或米曲霉基因的未翻譯的前導子替換未翻譯的前導子);及其變體、截短型及雜合型啟動子。其他啟動子描述于美國專利號6,011,147中。
在酵母宿主中,有用的啟動子獲得自以下各項的基因:釀酒酵母烯醇酶(ENO-1)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母醇去氫酶/甘油醛-3-磷酸去氫酶(ADH1、ADH2/GAP)、釀酒酵母丙糖磷酸異構(gòu)酶(TPI)、釀酒酵母金屬硫蛋白(CUP1)、以及釀酒酵母3-磷酸甘油酸激酶。羅馬諾斯(Romanos)等人,1992,酵母(Yeast)8:423-488描述了酵母宿主細胞的其他有用的啟動子。
控制序列還可以是由宿主細胞識別以終止轉(zhuǎn)錄的轉(zhuǎn)錄終止子。該終止子可操作地連接到編碼該多肽的多核苷酸的3'末端。在該宿主細胞中起作用的任何終止子都可以用于本發(fā)明中。
用于細菌宿主細胞的優(yōu)選終止子是從克勞氏芽孢桿菌堿性蛋白酶(aprH)、地衣芽孢桿菌α-淀粉酶(amyL)以及大腸桿菌核糖體RNA(rrnB)的基因獲得。
用于絲狀真菌宿主細胞的優(yōu)選終止子是從以下各項的基因獲得:構(gòu)巢曲霉乙酰胺酶、構(gòu)巢曲霉鄰氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖鐮孢胰蛋白酶樣蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纖維二糖水解酶I、里氏木霉纖維二糖水解酶II、里氏木霉內(nèi)切葡聚糖酶I、里氏木霉內(nèi)切葡聚糖酶II、里氏木霉內(nèi)切葡聚糖酶III、里氏木霉內(nèi)切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻譯延長因子。
用于酵母宿主細胞的優(yōu)選終止子是從釀酒酵母烯醇化酶、釀酒酵母細胞色素C(CYC1)、以及釀酒酵母甘油醛-3-磷酸脫氫酶的基因獲得。用于酵母宿主細胞的其他有用的終止子由羅馬諾斯(Romanos)等人,1992,見上文描述。
該控制序列還可以是在啟動子下游并且在基因編碼序列上游的mRNA穩(wěn)定子區(qū)域,它增加該基因的表達。
適合的mRNA穩(wěn)定子區(qū)的實例是從以下獲得的:蘇云金桿菌cryIIIA基因(WO 94/25612)和枯草芽孢桿菌SP82基因(化(Hue)等人,1995,細菌學雜志(Journal of Bacteriology)177:3465-3471)。
該控制序列還可以是前導子,一種對宿主細胞翻譯很重要的非翻譯mRNA區(qū)域。該前導子可操作地連接到編碼該多肽的多核苷酸的5'末端。可以使用在宿主細胞中起作用的任何前導子。
用于絲狀真菌宿主細胞的優(yōu)選前導子是從米曲霉TAKA淀粉酶和構(gòu)巢曲霉丙糖磷酸異構(gòu)酶的基因獲得。
酵母宿主細胞的適合的前導子是從以下各項的基因中獲得的:釀酒酵母烯醇酶(ENO-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α-因子、和釀酒酵母醇去氫酶/甘油醛-3-磷酸去氫酶(ADH2/GAP)。
控制序列還可以是一種多腺苷酸化序列,可操作地連接至該多核苷酸的3’-末端并且當轉(zhuǎn)錄時由宿主細胞識別為將聚腺苷酸殘基添加至所轉(zhuǎn)錄的mRNA的信號的序列??梢允褂迷谒拗骷毎衅鹱饔玫娜魏尉巯佘账峄蛄?。
用于絲狀真菌宿主細胞的優(yōu)選聚腺苷酸化序列是從以下各項的基因中獲得的:構(gòu)巢曲霉鄰氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖鐮孢胰蛋白酶樣蛋白酶。
有用于酵母宿主細胞的多腺苷酸化序列在郭(Guo)和謝爾曼(Sherman),1995,分子細胞生物學(Mol.Cellular Biol.)15:5983-5990中描述。
控制序列還可以是編碼連接至多肽的N-末端的信號肽并指導該多肽進入細胞的分泌途徑的信號肽編碼區(qū)域。多核苷酸的編碼序列的5’端本身可包含在翻譯閱讀框中天然與編碼多肽的編碼序列區(qū)段相連接的信號肽編碼序列??商娲兀摼幋a序列的5’末端可以包含對于該編碼序列來說是外來的信號肽編碼序列。在編碼序列不天然地包含信號肽編碼序列的情況下,可能需要外源信號肽編碼序列??商娲兀庠葱盘栯木幋a序列可簡單地替換天然的信號肽編碼序列以便增強該多肽的分泌。然而,可以使用指導所表達多肽進入宿主細胞的分泌通路的任何信號肽編碼序列。
用于細菌宿主細胞的有效信號肽編碼序列是從以下各項的基因獲得的信號肽編碼序列:芽孢桿菌屬NCIB 11837產(chǎn)麥芽糖淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶、地衣芽孢桿菌β-內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌α-淀粉酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprT、nprS、nprM)以及枯草芽孢桿菌prsA。西蒙納(Simonen)和帕爾瓦(Palva),1993,微生物學評論(Microbiological Reviews)57:109-137描述了另外的信號肽。
用于絲狀真菌宿主細胞的有效信號肽編碼序列是獲得自以下各項的基因的信號肽編碼序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特異腐質(zhì)霉纖維素酶、特異腐質(zhì)霉內(nèi)切葡聚糖酶V、柔毛腐質(zhì)霉脂肪酶以及米黑毛霉天冬氨酸蛋白酶。
對于酵母宿主細胞有用的信號肽獲得自以下項的基因:釀酒酵母α-因子和釀酒酵母轉(zhuǎn)化酶。羅馬諾斯(Romanos)等人,1992,見上文,描述了其他有用的信號肽編碼序列。
控制序列還可以是編碼位于多肽的N-末端的前肽的前肽編碼序列。生成的多肽被稱為前體酶(proenzyme)或多肽原(或在一些情況下被稱為酶原(zymogen))。多肽原通常是無活性的并且可以通過催化切割或自身催化切割來自多肽原的前肽而轉(zhuǎn)化為活性多肽。前肽編碼序列可以從以下各項的基因獲得:枯草芽孢桿菌堿性蛋白酶(aprE)、枯草芽孢桿菌中性蛋白酶(nprT)、嗜熱毀絲霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、以及釀酒酵母α-因子。
當信號肽和前肽序列同時存在時,前肽序列的位置緊鄰于多肽的N-末端,且信號肽序列的位置緊鄰于前肽序列的N-末端。
還可能希望地是添加調(diào)節(jié)序列,這些調(diào)節(jié)序列相對于宿主細胞的生長來調(diào)節(jié)多肽的表達。調(diào)節(jié)序列的實例是使得基因的表達響應于化學或物理刺激(包括調(diào)節(jié)化合物的存在)而開啟或關閉的那些。原核系統(tǒng)中的調(diào)節(jié)序列包括lac、tac以及trp操縱子系統(tǒng)。在酵母中,可以使用ADH2系統(tǒng)或GAL1系統(tǒng)。在絲狀真菌中,可以使用黑曲霉葡糖淀粉酶啟動子、米曲霉TAKAα-淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子、里氏木霉纖維二糖水解酶I啟動子以及里氏木霉纖維二糖水解酶II啟動子。調(diào)控序列的其他實例是允許基因擴增的那些。在真核系統(tǒng)中,這些調(diào)控序列包括在甲氨蝶呤存在下被擴增的二氫葉酸還原酶基因以及用重金屬擴增的金屬硫蛋白基因。在這些情況中,編碼多肽的多核苷酸將與調(diào)控序列可操作地連接。
表達載體
本發(fā)明還涉及包含本發(fā)明的多核苷酸、啟動子、以及轉(zhuǎn)錄和翻譯終止信號的重組表達載體。不同的核苷酸和控制序列可以連接在一起以產(chǎn)生重組表達載體,該重組表達載體可以包括一個或多個便利的限制酶切位點以允許在這些位點處插入或取代編碼該多肽的多核苷酸??商娲?,該多核苷酸可以通過將該多核苷酸或包括該多核苷酸的核酸構(gòu)建體插入用于表達的適當載體中來表達。在產(chǎn)生該表達載體時,該編碼序列位于該載體中,這樣使得該編碼序列與該供表達的適當控制序列可操作地連接。
重組表達載體可以是任何載體(例如,質(zhì)?;虿《?,其能夠方便地進行重組DNA程序,并且能夠引起多核苷酸的表達。載體的選擇將典型地取決于該載體與有待引入該載體的宿主細胞的相容性。該載體可以是線性的或閉合的環(huán)狀質(zhì)粒。
該載體可以是自主復制載體,即,作為染色體外實體存在的載體,其復制獨立于染色體復制,例如,質(zhì)粒、染色體外元件、微染色體或人工染色體。該載體可以包含任何用以保證自我復制的要素??商娲兀撦d體可以是這樣載體,當它被引入該宿主細胞中時,被整合到基因組中并且與其中已整合了它的一個或多個染色體一起復制。此外,可以使用單一載體或質(zhì)?;騼蓚€或更多個載體或質(zhì)粒(這些載體或質(zhì)粒共同包含待引入宿主細胞的基因組中的總DNA)或轉(zhuǎn)座子。
該載體優(yōu)選包含允許方便地選擇轉(zhuǎn)化細胞、轉(zhuǎn)染細胞、轉(zhuǎn)導細胞等細胞的一個或多個選擇性標記。選擇性標記是這樣一種基因,該基因的產(chǎn)物提供了殺生物劑抗性或病毒抗性、重金屬抗性、營養(yǎng)缺陷型的原養(yǎng)型等。
細菌性選擇性標記的實例是地衣芽孢桿菌或枯草芽孢桿菌dal基因,或賦予抗生素抗性(如氨比西林、氯霉素、卡那霉素、新霉素、大觀霉素或四環(huán)素抗性)的標記。用于酵母宿主細胞的適合的標記包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1、以及URA3。用于在絲狀真菌宿主細胞中使用的選擇性標記包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉(zhuǎn)移酶)、bar(草丁膦乙酰轉(zhuǎn)移酶)、hph(潮霉素磷酸轉(zhuǎn)移酶)、niaD(硝酸還原酶)、pyrG(乳清酸核苷-5'磷酸脫羧酶)、sC(硫酸腺苷基轉(zhuǎn)移酶)、以及trpC(鄰氨基苯甲酸合酶)、連同其等效物。優(yōu)選在曲霉屬細胞中使用的是構(gòu)巢曲霉或米曲霉amdS和pyrG基因以及吸水鏈霉菌bar基因。優(yōu)選在木霉屬細胞中使用的是adeA、adeB、amdS、hph以及pyrG基因。
選擇性標記可以是如在WO 2010/039889中描述的雙選擇性標記系統(tǒng)。在一個方面中,雙選擇性標記是hph-tk雙選擇性標記系統(tǒng)。
載體優(yōu)選包含允許載體整合到宿主細胞的基因組中或載體在細胞中獨立于基因組自主復制的一個或多個元件。
對于整合到該宿主細胞基因組中,該載體可以依靠編碼該多肽的多核苷酸序列或者用于通過同源或非同源重組整合到該基因組中的該載體的任何其他元件??商娲兀撦d體可以包含用于指導通過同源重組而整合到宿主細胞基因組中的一個或多個染色體中的一個或多個精確位置的另外的多核苷酸。為了增加在精確位置整合的可能性,這些整合元件應包含足夠數(shù)量的核酸,例如100至10,000個堿基對、400至10,000個堿基對、以及800至10,000個堿基對,這些堿基對與對應的靶序列具有高度的序列一致性以提高同源重組的可能性。這些整合元件可以是與宿主細胞的基因組內(nèi)的靶序列同源的任何序列。此外,這些整合元件可以是非編碼多核苷酸或編碼多核苷酸。另一方面,該載體可以通過非同源重組整合到宿主細胞的基因組中。
對于自主復制,該載體可以進一步包括使該載體能夠在所討論的宿主細胞中自主復制的復制起點。復制起點可以是在細胞中起作用的介導自主復制的任何質(zhì)粒復制子。術語“復制起點(origin of replication)”或“質(zhì)粒復制子(plasmid replicator)”意指使得質(zhì)粒或載體可在體內(nèi)復制的多核苷酸。
細菌復制起點的實例是允許在大腸桿菌中復制的質(zhì)粒pBR322、pUC19、pACYC177、以及pACYC184的復制起點,以及允許在芽孢桿菌屬中復制的質(zhì)粒pUB110、pE194、pTA1060、以及pAMβ1的復制起點。
用于在酵母宿主細胞中使用的復制起點的實例是2微米復制起點ARS1、ARS4、ARS1與CEN3的組合以及ARS4與CEN6的組合。
在絲狀真菌細胞中有用的復制起點的實例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡倫(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。AMA1基因的分離和包括該基因的質(zhì)?;蜉d體的構(gòu)建可以根據(jù)披露于WO00/24883中的方法完成。
可以將本發(fā)明的多核苷酸的多于一個拷貝插入宿主細胞中以增加多肽的產(chǎn)生。通過將序列的至少一個另外的拷貝整合到宿主細胞基因組中或者通過包含與該多核苷酸一起的可擴增的選擇性標記基因可以獲得多核苷酸的增加的拷貝數(shù)目,其中通過在適當?shù)倪x擇性試劑的存在下培養(yǎng)細胞可以選擇包含選擇性標記基因的經(jīng)擴增的拷貝的細胞、以及由此該多核苷酸的另外的拷貝。
用于連接以上所描述的元件以構(gòu)建本發(fā)明的重組表達載體的程序是本領域的普通技術人員熟知的(參見,例如,薩姆布魯克(Sambrook)等人,1989,同上)。
宿主細胞
本發(fā)明還涉及重組宿主細胞,這些宿主細胞包含可操作地連接到一個或多個控制序列的本發(fā)明的多核苷酸,這些控制序列指導本發(fā)明的多肽的產(chǎn)生。將包括多核苷酸的構(gòu)建體或載體引入宿主細胞中,這樣使得該構(gòu)建體或載體被維持作為染色體整合體或作為自主復制的染色體外載體,如早前所述。術語“宿主細胞”涵蓋由于復制過程中發(fā)生的突變與親本細胞不同的親本細胞的任何后代。宿主細胞的選擇在很大程度上取決于編碼該多肽的基因及其來源。
該宿主細胞可以是有用于重組產(chǎn)生本發(fā)明的多肽的任何細胞,例如原核細胞或真核細胞。
原核宿主細胞可以是任何革蘭氏陽性或革蘭氏陰性細菌。革蘭氏陽性細菌包括但不限于芽孢桿菌屬、梭菌屬、腸球菌屬、土芽孢桿菌屬、乳桿菌屬、乳球菌屬、海洋芽孢桿菌屬、葡萄球菌屬、鏈球菌屬、以及鏈霉菌屬。革蘭氏陰性細菌包括但不限于:彎曲桿菌屬、大腸桿菌、黃桿菌屬、梭桿菌屬、螺桿菌屬、泥桿菌屬、奈瑟氏菌屬、假單胞菌屬、沙門氏菌屬、以及脲原體屬。
細菌宿主細胞可以是任何芽孢桿菌細胞,包括但不限于:嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、克勞氏芽孢桿菌、凝結(jié)芽孢桿菌、堅硬芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌、以及蘇云金桿菌細胞。
細菌宿主細胞還可以是任何鏈球菌屬細胞,包括但不限于:似馬鏈球菌、釀膿鏈球菌、乳房鏈球菌以及馬鏈球菌獸瘟亞種細胞。
細菌宿主細胞還可以是任何鏈霉菌細胞,包括但不局限于不產(chǎn)色鏈霉菌、除蟲鏈霉菌、天藍鏈霉菌、灰鏈絲菌、以及淺青紫鏈霉菌細胞。
將DNA引入芽孢桿菌屬細胞中可通過以下來實現(xiàn):原生質(zhì)體轉(zhuǎn)化(參見例如,張(Chang)和科恩(Cohen),1979,分子遺傳學與基因組學(Mol.Gen.Genet.)168:111-115)、感受態(tài)細胞轉(zhuǎn)化(參見,例如,楊格(Young)和斯皮宰曾(Spizizen),1961,細菌學雜志(J.Bacteriol.)81:823-829;或杜拜努(Dubnau)以及大衛(wèi)杜夫-阿貝爾森(Davidoff-Abelson),1971,分子生物學雜志(J.Mol.Biol.)56:209-221)、電穿孔(參見,例如,茂川(Shigekawa)和道爾(Dower),1988,生物技術(Biotechniques)6:742-751)、或者接合(參見,例如克勒(Koehler)和索恩(Thorne),1987,細菌學雜志169:5271-5278)。將DNA引入大腸桿菌細胞中可通過以下來實現(xiàn):原生質(zhì)體轉(zhuǎn)化(參見例如,哈納汗(Hanahan),1983,分子生物學雜志(J.Mol.Biol.)166:557-580)或電穿孔(參見例如,道爾(Dower)等人,1988,核酸研究(Nucleic Acids Res.)16:6127-6145)。將DNA引入鏈霉菌屬細胞中可通過以下來實現(xiàn):原生質(zhì)體轉(zhuǎn)化、電穿孔(參見例如,貢(Gong)等人,2004,葉線形微生物學(Folia Microbiol.)(Praha(布拉格))49:399-405)、接合(參見例如,馬佐迪耶(Mazodier)等人,1989,細菌學雜志(J.Bacteriol.)171:3583-3585)、或轉(zhuǎn)導(參見例如,伯克(Burke)等人,2001,美國國家科學院院刊(Proc.Natl.Acad.Sci.USA)98:6289-6294)。將DNA引入假單孢菌屬細胞中可通過以下來實現(xiàn):電穿孔(參見例如,蔡(Choi)等人,2006,微生物學方法雜志(J.Microbiol.Methods)64:391-397)或接合(參見例如,皮內(nèi)多(Pinedo)和斯梅茨(Smets),2005,應用與環(huán)境微生物學(Appl.Environ.Microbiol.)71:51-57)。將DNA引入鏈球菌屬細胞中可通過以下來實現(xiàn):天然感受態(tài)(參見,例如,佩里(Perry)和藏滿(Kuramitsu),1981,感染與免疫(Infect.Immun.)32:1295-1297)、原生質(zhì)體轉(zhuǎn)化(參見,例如,凱特(Catt)和喬力克(Jollick),1991,微生物學(Microbios)68:189-207)、電穿孔(參見,例如,巴克利(Buckley)等人,1999,應用與環(huán)境微生物學(Appl.Environ.Microbiol.)65:3800-3804)、或者接合(參見,例如,克萊威爾(Clewell),1981,微生物學評論(Microbiol.Rev.)45:409-436)。然而,可以使用本領域已知的用于將DNA引入宿主細胞中的任何方法。
宿主細胞還可以是真核細胞,如哺乳動物、昆蟲、植物、或真菌細胞。
宿主細胞可以是真菌細胞。如在此使用的“真菌”包括子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)、以及接合菌門(Zygomycota)、連同卵菌門(Oomycota)和全部有絲分裂孢子真菌(如由霍克斯沃思(Hawksworth)等人在安斯沃思和拜斯比真菌詞典(Ainsworth and Bisby’s Dictionary of The Fungi),第8版,1995,國際應用生物科學中心(CAB International),大學出版社(University Press),英國劍橋(Cambridge,UK)中進行定義的)。
該真菌宿主細胞可以是酵母細胞。如在此使用的“酵母”包括產(chǎn)子嚢酵母(內(nèi)孢霉目)、產(chǎn)擔子酵母和屬于半知菌類(芽孢綱)的酵母。由于酵母的分類在將來可能有變化,出于本發(fā)明的目的,酵母應如酵母生物學和活動性(Biology and Activities of Yeast)(斯金納(Skinner)、帕斯莫爾(Passmore)、以及達文波特(Davenport)編輯,應用細菌學學會討論會(Soc.App.Bacteriol.Symposium)系列第9期,1980)所述地進行定義。
酵母宿主細胞可以是假絲酵母屬、漢遜酵母屬、克魯弗酵母屬、畢赤酵母屬、酵母屬、裂殖酵母屬、或耶氏酵母屬細胞,如乳酸克魯弗酵母(Kluyveromyces lactis)、卡爾酵母、釀酒酵母、糖化酵母、道格拉氏酵母、克魯弗酵母、諾地酵母、卵形酵母、或解脂耶氏酵母(Yarrowia lipolytica)細胞。
真菌宿主細胞可以是絲狀真菌細胞?!敖z狀真菌”包括真菌門(Eumycota)和卵菌門的亞門(如由霍克斯沃思等人,1995,見上文所定義)的所有絲狀形式。絲狀真菌通常的特征在于由幾丁質(zhì)、纖維素、葡聚糖、殼聚糖、甘露聚糖、以及其他復雜多糖構(gòu)成的菌絲體壁。營養(yǎng)生長是通過菌絲延伸,而碳分解代謝是專性需氧的。相反,酵母(如釀酒酵母)的營養(yǎng)生長是通過單細胞菌體的出芽(budding),而碳分解代謝可以是發(fā)酵的。
絲狀真菌宿主細胞可以是枝頂孢霉屬、曲霉屬、短梗霉屬、煙管霉屬(Bjerkandera)、擬臘菌屬、金孢子菌屬、鬼傘屬、革蓋菌屬(Coriolus)、隱球菌屬、線黑粉菌科(Filibasidium)、鐮孢屬、腐質(zhì)霉屬、梨孢菌屬、毛霉屬、毀絲霉屬、新美鞭菌屬、鏈孢菌屬、擬青霉屬、青霉屬、平革菌屬、射脈菌屬(Phlebia)、瘤胃壺菌屬、側(cè)耳屬(Pleurotus)、裂褶菌屬、籃狀菌屬、嗜熱子囊菌屬、梭孢殼屬、彎頸霉屬、栓菌屬(Trametes)或木霉屬細胞。
例如,絲狀真菌宿主細胞可以是泡盛曲霉、臭曲霉、煙曲霉、日本曲霉、構(gòu)巢曲霉、黑曲霉、米曲霉、黑刺煙管菌(Bjerkandera adusta)、干擬蠟菌(Ceriporiopsis aneirina)、卡內(nèi)基擬蠟菌(Ceriporiopsis caregiea)、淺黃擬蠟孔菌(Ceriporiopsis gilvescens)、潘諾希塔擬蠟菌(Ceriporiopsis pannocinta)、環(huán)帶擬蠟菌(Ceriporiopsis rivulosa)、微紅擬蠟菌(Ceriporiopsis subrufa)、蟲擬蠟菌(Ceriporiopsis subvermispora)、狹邊金孢子菌(Chrysosporium inops)、嗜角質(zhì)金孢子菌、盧克諾文思金孢子菌(Chrysosporium lucknowense)、糞狀金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、熱帶金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰蓋鬼傘(Coprinus cinereus)、毛革蓋菌(Coriolus hirsutus)、桿孢狀鐮孢、谷類鐮孢、庫威鐮孢、大刀鐮孢、禾谷鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢、尖鐮孢、多枝鐮孢、粉紅鐮孢、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、硫色鐮孢、圓鐮孢、擬絲孢鐮孢、鑲片鐮孢、特異腐質(zhì)霉、柔毛腐質(zhì)霉、米黑毛霉、嗜熱毀絲霉、粗糙鏈孢菌、產(chǎn)紫青霉、黃孢平革菌(Phanerochaete chrysosporium)、射脈菌(Phlebia radiata)、刺芹側(cè)耳(Pleurotus eryngii)、土生梭孢殼霉、長域毛栓菌(Trametes villosa)、變色栓菌(Trametes versicolor)、哈茨木霉、康寧木霉、長枝木霉、里氏木霉、或綠色木霉細胞。
可以通過涉及原生質(zhì)體形成、原生質(zhì)體轉(zhuǎn)化、以及以本身已知的方式進行細胞壁再生的過程來轉(zhuǎn)化真菌細胞。用于轉(zhuǎn)化曲霉屬和木霉屬宿主細胞的適合程序在EP 238023和約爾頓(Yelton)等人,1984,美國國家科學院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及科里蒂森(Christensen)等人,1988,生物/技術(Bio/Technology)6:1419-1422中描述。用于轉(zhuǎn)化鐮刀菌屬物種的適合方法由馬拉迪爾(Malardier)等人,1989,基因(Gene)78:147-156、以及WO 96/00787描述??梢允褂糜扇缫韵挛墨I描述的程序轉(zhuǎn)化酵母:貝克爾(Becker)和瓜倫特(Guarente),在阿貝爾森(Abelson),J.N.和西蒙(Simon),M.I.編,酵母遺傳學與分子生物學指南(Guide to Yeast Genetics and Molecular Biology),酶學方法(Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology),第194卷,第182-187頁,學術出版社有限公司(Academic Press,Inc.),紐約;伊藤(Ito)等人,1983,細菌學雜志(J.Bacteriol.)153:163;以及Hinnen等人,1978,美國國家科學院院刊(Proc.Natl.Acad.Sci.USA)75:1920。
生產(chǎn)方法
本發(fā)明還涉及產(chǎn)生本發(fā)明的多肽的方法,包含(a)在有益于產(chǎn)生該多肽的條件下培養(yǎng)細胞,該細胞以其野生型形式產(chǎn)生該多肽;并且可任選地(b)回收該多肽。在一個方面中,該細胞是浮霉狀菌屬細胞。在另一個方面中,該細胞是來自浮霉狀菌屬物種R1菌株的細胞。
本發(fā)明還涉及產(chǎn)生本發(fā)明的多肽的方法,這些方法包括(a)在有益于產(chǎn)生該多肽的條件下培養(yǎng)本發(fā)明的重組宿主細胞;并且可任選地(b)回收該多肽。
這些宿主細胞是在適合于使用本領域中已知的方法產(chǎn)生該多肽的一種營養(yǎng)培養(yǎng)基中培養(yǎng)的。例如,可以通過在適合的培養(yǎng)基中和在允許表達和/或分離該多肽的條件下,進行搖瓶培養(yǎng),或者在實驗室或工業(yè)發(fā)酵罐中進行小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù),分批,分批補料,或固態(tài)發(fā)酵)來培養(yǎng)細胞。該培養(yǎng)是使用本領域中已知的程序,在一種適合營養(yǎng)培養(yǎng)基中發(fā)生,該培養(yǎng)基包括碳和氮來源及無機鹽。合適的培養(yǎng)基可從商業(yè)供應商獲得或可以根據(jù)公開的組成(例如,在美國典型培養(yǎng)物保藏中心的目錄中)制備。如果多肽分泌到該營養(yǎng)培養(yǎng)基中,那么可直接從培養(yǎng)基中回收多肽。如果多肽不被分泌,那么其可從細胞裂解液中進行回收。
可以使用特異性針對這些多肽的本領域已知的方法來檢測該多肽。這些檢測方法包括但不限于,特異性抗體的使用、酶產(chǎn)物的形成或酶底物的消失。例如,可以使用酶測定來確定該多肽的活性。
可以使用本領域已知的方法來回收多肽。例如,該多肽可以通過常規(guī)程序,包括但不限于,收集、離心、過濾、提取、噴霧干燥、蒸發(fā)或沉淀,從該營養(yǎng)培養(yǎng)基回收。在一個方面中,回收包括該多肽的發(fā)酵液。
可以通過本領域中已知的多種程序來純化該多肽以獲得基本上純的多肽,這些程序包括但不限于:色譜法(例如,離子交換色譜、親和色譜、疏水作用色譜、色譜聚焦、以及尺寸排阻色譜)、電泳程序(例如,制備型等電點聚焦)、差別溶解度(例如,硫酸銨沉淀)、SDS-PAGE、或提取(參見例如,蛋白純化(Protein Purification),詹森(Janson)和賴登(Ryden)編輯,VCH出版社(VCH Publishers),紐約,1989)。
在替代性方面中,沒有回收該多肽,而是將表達該多肽的本發(fā)明的宿主細胞用作該多肽的來源。
植物
本發(fā)明還涉及分離的植物,例如轉(zhuǎn)基因植物、植物部分或植物細胞,這些植物包括本發(fā)明的多肽,從而表達并且產(chǎn)生可回收的量的多肽。該多肽可以從植物或植物部分回收??商娲?,可以按原樣將包含該多肽的植物或植物部分用于改進食品或飼料的質(zhì)量,例如,改進營養(yǎng)價值、適口性、以及流變性質(zhì),或用以破壞抗營養(yǎng)因子。
轉(zhuǎn)基因植物可以是雙子葉的(雙子葉植物)或單子葉的(單子葉植物)。單子葉植物的實例是草,如草甸草(藍草,早熟禾屬);飼草,如羊茅屬(Festuca)、黑麥草屬(Lolium);溫帶草,如翦股穎屬(Agrostis);以及谷類,例如小麥、燕麥、黑麥、大麥、稻、高粱、以及玉蜀黍(玉米)。
雙子葉植物的實例是煙草、豆類(如羽扇豆(lupins)、馬鈴薯、糖甜菜(sugar beet)、豌豆、豆(bean)和大豆(soybean))、以及十字花科植物(十字花科(family Brassicaceae))(如花椰菜、油菜籽、以及緊密相關的模式生物擬南芥)。
植物部分的實例是莖、愈傷組織、葉、根、果實、種子、以及塊莖、以及包括這些部分的獨立組織,例如,表皮、葉肉、薄壁組織(parenchyme)、維管組織、分生組織。特定植物細胞區(qū)室,如葉綠體、質(zhì)外體(apoplast)、線粒體、液泡、過氧化物酶體以及細胞質(zhì)也被認為是植物部分。此外,任何植物細胞,無論是何種組織來源,都被認為是植物部分。同樣地,植物部分,如分離以有助于本發(fā)明的利用的特定組織和細胞也被認為是植物部分,例如胚、胚乳、糊粉和種皮。
同樣包括于本發(fā)明范圍內(nèi)的是此類植物、植物部分以及植物細胞的子代。
表達多肽的轉(zhuǎn)基因植物或植物細胞可以根據(jù)本領域已知的方法構(gòu)建。
本發(fā)明還涉及產(chǎn)生本發(fā)明的多肽的方法,這些方法包括(a)在有益于產(chǎn)生該多肽的條件下培養(yǎng)轉(zhuǎn)基因植物或植物細胞,該轉(zhuǎn)基因植物或植物細胞包括編碼該多肽的多核苷酸;以及(b)回收該多肽。
發(fā)酵液配制品或細胞組合物
本發(fā)明還涉及包含本發(fā)明的多肽的發(fā)酵液配制品或細胞組合物。發(fā)酵液產(chǎn)物進一步包括在發(fā)酵過程中使用的另外的成分,例如像,細胞(包括含有編碼本發(fā)明的多肽的基因的宿主細胞,這些宿主細胞被用于產(chǎn)生感興趣的多肽)、細胞碎片、生物質(zhì)、發(fā)酵介質(zhì)和/或發(fā)酵產(chǎn)物。在一些實施例中,該組合物是含有一種或多種有機酸、殺滅的細胞和/或細胞碎片以及培養(yǎng)基的細胞殺滅的全培養(yǎng)液。
如在此使用的術語“發(fā)酵液”是指由細胞發(fā)酵產(chǎn)生、不經(jīng)歷或經(jīng)歷最低限的回收和/或純化的制劑。例如,當微生物培養(yǎng)物生長至飽和,在碳限制條件下孵育以允許蛋白質(zhì)合成(例如,由宿主細胞進行酶的表達)并且分泌到細胞培養(yǎng)基中時,產(chǎn)生發(fā)酵液。發(fā)酵液可以包含在發(fā)酵結(jié)束時得到的發(fā)酵材料的未分級的或分級的內(nèi)容物。典型地,發(fā)酵液是未分級的并且包括用過的培養(yǎng)基以及例如通過離心去除微生物細胞(例如,絲狀真菌細胞)之后存在的細胞碎片。在一些實施例中,發(fā)酵液包含用過的細胞培養(yǎng)基、胞外酶以及有活力的和/或無活力的微生物細胞。
在一個實施例中,該發(fā)酵液配制品和細胞組合物包括第一有機酸組分(包括至少一種1-5碳的有機酸和/或其鹽)以及第二有機酸組分(包括至少一種6碳或更多碳的有機酸和/或其鹽)。在一個具體實施例中,該第一有機酸組分是乙酸、甲酸、丙酸、其鹽、或兩種或更多種前述酸的混合物并且該第二有機酸組分是苯甲酸、環(huán)己烷羧酸、4-甲基戊酸、苯乙酸、其鹽、或兩種或更多種前述酸的混合物。
在一個方面中,該組合物包含一種或多種有機酸,并且任選地進一步包含殺死的細胞和/或細胞碎片。在一個實施例中,從細胞殺滅的全培養(yǎng)液中去除這些殺死的細胞和/或細胞碎片,以提供不含這些組分的組合物。
這些發(fā)酵液配制品或細胞組合物可以進一步包含一種防腐劑和/或抗微生物(例如抑菌)劑,包括但不限于山梨醇、氯化鈉、山梨酸鉀、以及本領域中已知的其他試劑。
該細胞殺滅的全培養(yǎng)液或組合物可以包含在發(fā)酵結(jié)束時得到的發(fā)酵材料的未分級的內(nèi)容物。典型地,該細胞殺滅的全培養(yǎng)液或組合物包含用過的培養(yǎng)基以及在微生物細胞(例如,絲狀真菌細胞)生長至飽和、在碳限制條件下孵育以允許蛋白合成之后存在的細胞碎片。在一些實施例中,細胞殺滅的全培養(yǎng)液或組合物含有用過的細胞培養(yǎng)基、胞外酶和殺滅的絲狀真菌細胞。在一些實施例中,可以使用本領域已知的方法來使細胞殺滅的全培養(yǎng)液或組合物中存在的微生物細胞透性化和/或裂解。
如在此描述的全培養(yǎng)液或細胞組合物典型地是液體,但是可以含有不溶性組分,例如殺滅的細胞、細胞碎片、培養(yǎng)基組分和/或一種或多種不溶性酶。在一些實施例中,可以去除不溶性組分以提供澄清的液體組合物。
可以通過WO 90/15861或WO 2010/096673所述的方法產(chǎn)生本發(fā)明的全培養(yǎng)液配制品和細胞組合物。
洗滌劑組合物
在一個實施例中,本發(fā)明涉及包括分離的內(nèi)切葡聚糖酶的洗滌劑組合物,該分離的內(nèi)切葡聚糖酶對用黃原膠裂解酶預處理的黃原膠具有活性,并且與SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽具有至少60%,例如,至少65%、至少70%、至少70%、至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一個實施例中,本發(fā)明針對洗滌劑組合物,該洗滌劑組合物包含結(jié)合一種或多種額外的清潔組合物組分的本發(fā)明的酶。另外的組分的選擇在普通技術人員技術內(nèi)并且包括常規(guī)成分,包括以下列出的示例性、非限制性組分。
對于紡織品護理,組分的選擇可以包括以下考慮:有待清潔的紡織品的類型、污物的類型和/或程度、進行清潔時的溫度以及洗滌劑產(chǎn)品的配制。盡管根據(jù)一種具體的功能性將以下提及的組分通過一般標題進行了分類,但是由于該組分可能具有熟練的業(yè)內(nèi)人士將領會的一種或多種另外的功能,因此不應該將這理解為限制。
洗滌劑組合物可以適于洗滌紡織品,例如像織物、衣服或亞麻布,或用于清潔硬表面,例如像地板、桌子、或餐具洗滌。
本發(fā)明的酶-在本發(fā)明的一個實施例中,可以將本發(fā)明的多肽以對應于以下的量添加至一種洗滌劑組合物中:每升的洗滌液0.0001-200mg的酶蛋白,例如0.0005-100mg的酶蛋白,優(yōu)選0.001-30mg的酶蛋白,更優(yōu)選0.005-8mg的酶蛋白,甚至更優(yōu)選0.01-2mg的酶蛋白。
用于在自動洗碗機(ADW)中使用的組合物例如可以包括按該組合物的重量計0.0001%-50%,例如0.001%-20%,例如0.01%-10%,例如0.05%-5%的酶蛋白。
用于在洗衣造粒(laundry granulation)中使用的組合物例如可以包含按該組合物的重量計0.0001%-50%,例如0.001%-20%,例如0.01%-10%,例如0.05%-5%的酶蛋白。
用于在洗衣液中使用的組合物例如可以包括按該組合物的重量計0.0001%-10%,例如0.001%-7%,例如0.1%-5%的酶蛋白。
可以使用常規(guī)穩(wěn)定劑穩(wěn)定本發(fā)明的洗滌劑組合物的一種或多種酶,這些常規(guī)穩(wěn)定劑例如是多元醇,例如丙二醇或甘油、糖或糖醇、乳酸、硼酸或硼酸衍生物,例如芳香族硼酸酯,或苯基硼酸衍生物,例如4-甲酰苯基硼酸,并且可以如在例如WO 92/19709和WO 92/19708中所述配制該組合物。
在某些市場中,不同洗滌條件并且就其本身而言,使用不同類型的洗滌劑。這披露于例如EP 1 025 240中。例如,在亞洲(日本)使用低的洗滌劑濃度體系,而美國使用中等洗滌劑濃度體系,并且歐洲使用高的洗滌劑濃度體系。
低的洗滌劑濃度體系包含以下洗滌劑,其中在洗滌水中存在少于約800ppm的洗滌劑組分。日本洗滌劑典型地被認為是低的洗滌劑濃度體系,因為它們具有存在于洗滌水中的大約667ppm的洗滌劑組分。
中等洗滌劑濃度體系包含以下洗滌劑,其中在洗滌水中存在約800ppm與約2000ppm之間的洗滌劑組分。北美洗滌劑通常被認為是中等洗滌劑濃度體系,因為它們具有存在于洗滌水中的大約975ppm的洗滌劑組分。
高的洗滌劑濃度體系包含以下洗滌劑,其中在洗滌水中存在多于約2000ppm的洗滌劑組分。歐洲洗滌劑通常被認為是高的洗滌劑濃度體系,因為在洗滌水中它們具有大約4500-5000ppm的洗滌劑組分。
拉丁美洲洗滌劑通常是高泡沫磷酸鹽助洗劑洗滌劑并且在拉丁美洲使用的洗滌劑的范圍可以落入中等和高的洗滌劑濃度兩者中,因為在洗滌水中它們的洗滌劑組分的范圍從1500ppm至6000ppm。此類洗滌劑組合物都是本發(fā)明的實施例。
本發(fā)明的多肽還可以結(jié)合到WO 97/07202中所披露的洗滌劑配制品中,通過引用將其結(jié)合在此。
表面活性劑-洗滌劑組合物可以包括一種或多種表面活性劑,它們可以是陰離子的和/或陽離子的和/或非離子的和/或半極性的和/或兼性離子的或其混合物。在一個具體實施例中,洗滌劑組合物包括一種或多種非離子型表面活性劑和一種或多種陰離子表面活性劑的混合物。這種或這些表面活性劑典型地以按重量計從約0.1%至60%的水平存在,例如約1%至約40%、或約3%至約20%、或約3%至約10%。基于所希望的清潔應用來選擇這種或這些表面活性劑,并且這種或這些表面活性劑包括本領域中已知的任何一種或多種常規(guī)表面活性劑??梢岳帽绢I域中已知的用于在洗滌劑中使用的任何表面活性劑。
當包含在其中時,所述去污劑通常將會含有按重量計約1%至約40%,例如約5%至約30%,包括約5%至約15%,或約20%至約25%的陰離子型表面活性劑。陰離子表面活性劑的非限制性實例包括硫酸鹽和磺酸鹽,具體地,直鏈烷基苯磺酸鹽(LAS),LAS的異構(gòu)體,支鏈烷基苯磺酸鹽(BABS),苯基鏈烷磺酸鹽,α-烯烴磺酸鹽(AOS),烯烴磺酸鹽,鏈烯烴磺酸鹽,鏈烷-2,3-二基雙(硫酸鹽),羥基鏈烷磺酸鹽以及二磺酸鹽,烷基硫酸鹽(AS)(例如十二烷基硫酸鈉(SDS)),脂肪醇硫酸鹽(FAS),伯醇硫酸鹽(PAS),醇醚硫酸鹽(AES或AEOS或FES,也被稱為醇乙氧基硫酸鹽或脂肪醇醚硫酸鹽),仲鏈烷磺酸鹽(SAS),石蠟烴磺酸鹽(PS),酯磺酸鹽,磺化的脂肪酸甘油酯,α-磺酸基脂肪酸甲酯(α-SFMe或SES)(包括甲酯磺酸鹽(MES)),烷基琥珀酸或烯基琥珀酸,十二烯基/十四烯基琥珀酸(DTSA),氨基酸的脂肪酸衍生物,磺酸基琥珀酸或皂的二酯和單酯,以及它們的組合。
當被包括在其中時,洗滌劑將通常包含按重量計從約0%至約10%的陽離子表面活性劑。陽離子表面活性劑的非限制性實例包括烷基二甲基乙醇季胺(ADMEAQ)、十六烷基三甲基溴化銨(CTAB)、二甲基二硬脂酰氯化銨(DSDMAC)、以及烷基芐基二甲基銨、烷基季銨化合物、烷氧基化季銨(AQA)化合物及其組合。
當被包括在其中時,洗滌劑將通常包含按重量計從約0.2%至約40%的非離子型表面活性劑,例如從約0.5%至約30%,特別是從約1%至約20%、從約3%至約10%,例如從約3%至約5%、或從約8%至約12%。非離子型表面活性劑的非限制性實例包括醇乙氧基化物(AE或AEO)、醇丙氧基化物、丙氧基化的脂肪醇(PFA),烷氧基化的脂肪酸烷基酯(例如乙氧基化的和/或丙氧基化的脂肪酸烷基酯),烷基酚乙氧基化物(APE),壬基酚乙氧基化物(NPE),烷基多糖苷(APG),烷氧基化胺,脂肪酸單乙醇酰胺(FAM),脂肪酸二乙醇酰胺(FADA),乙氧基化的脂肪酸單乙醇酰胺(EFAM),丙氧基化的脂肪酸單乙醇酰胺(PFAM),多羥基烷基脂肪酸酰胺,或葡萄糖胺的N-?;鵑-烷基衍生物(葡糖酰胺(GA),或脂肪酸葡糖酰胺(FAGA)),連同在SPAN和TWEEN商品名下可獲得的產(chǎn)品及其組合。
當被包括在其中時,洗滌劑將通常包含按重量計從約0%至約10%的半極性表面活性劑。半極性表面活性劑的非限制性實例包括氧化胺(AO),例如烷基二甲基氧化胺、N-(椰油基烷基)-N,N-二甲基氧化胺和N-(牛油-烷基)-N,N-雙(2-羥乙基)氧化胺、脂肪酸鏈烷醇酰胺和乙氧基化的脂肪酸鏈烷醇酰胺及其組合。
當被包括在其中時,洗滌劑將通常包含按重量計從約0%至約10%的兼性離子表面活性劑。兼性離子表面活性劑的非限制性實例包括甜菜堿、烷基二甲基甜菜堿、磺基甜菜堿及其組合。
助水溶劑-助水溶劑是如下化合物,該化合物在水性溶液中溶解疏水化合物(或相反地,在非極性環(huán)境中的極性物質(zhì))。一般地,助水溶物具有親水和疏水兩種特征(所謂的兩親性質(zhì),如由表面活性劑已知的);然而,助水溶劑的分子結(jié)構(gòu)一般不利于自發(fā)性自聚集,參見例如通過霍奇登(Hodgdon)和卡勒(Kaler)(2007),膠體&界面科學新見(Current Opinion in Colloid&Interface Science)12:121-128的綜述。助水溶劑并不顯示臨界濃度,高于該濃度就會發(fā)生如對表面活性劑而言所發(fā)現(xiàn)的自聚集以及脂質(zhì)形成膠束、薄層或其他很好地定義的中間相。相反,許多助水溶物顯示連續(xù)類型的聚集過程,其中聚集物的大小隨著濃度增加而增長。然而,很多助水溶劑改變了包括極性和非極性特征的物質(zhì)的系統(tǒng)(包括水、油、表面活性劑、和聚合物的混合物)的相行為、穩(wěn)定性、和膠體特性。經(jīng)典地從制藥、個人護理、食品跨行業(yè)至技術應用使用助水溶劑。助水溶劑在洗滌劑組合物中的使用允許例如更濃的表面活性劑配制品(如在通過去除水而壓縮液體洗滌劑的過程中)而不引起不希望的現(xiàn)象,例如相分離或高粘度。
洗滌劑可以包含按重量計0-5%,例如約0.5%至約5%、或約3%至約5%的助水溶劑??梢岳帽绢I域中已知的用于在洗滌劑中使用的任何助水溶劑。助水溶劑的非限制性實例包括苯磺酸鈉、對甲苯磺酸鈉(STS)、二甲苯磺酸鈉(SXS)、枯烯磺酸鈉(SCS)、傘花烴磺酸鈉、氧化胺、醇和聚乙二醇醚、羥基萘甲酸鈉、羥基萘磺酸鈉、乙基己基磺酸鈉及其組合。
助洗劑或共助洗劑-該洗滌劑組合物可以包含按重量計約0-65%,例如約5%至約45%的洗滌劑助洗劑或共助洗劑、或其混合物。在洗滌餐具洗滌劑中,助洗劑的水平典型地是40%-65%,特別是50%-65%。助洗劑和/或共助洗劑可以具體是形成具有Ca和Mg的水溶性復合物的螫合劑??梢岳帽绢I域中已知的用于在衣物洗滌劑中使用的任何助洗劑和/或共-助洗劑。助洗劑的非限制性實例包括沸石、二磷酸鹽(焦磷酸鹽)、三磷酸鹽例如三磷酸鈉(STP或STPP)、碳酸鹽例如碳酸鈉、可溶性硅酸鹽例如硅酸鈉、層狀硅酸鹽(例如,來自赫斯特公司(Hoechst)的SKS-6)、乙醇胺例如2-氨基乙-1-醇(MEA)、二乙醇胺(DEA,也稱為亞氨基二乙醇)、三乙醇胺(TEA,也稱為2,2’,2”-次氨基三乙醇)、以及羧甲基菊粉(CMI)及其組合。
洗滌劑組合物還可以包含按重量計0-20%,例如約5%至約10%的洗滌劑共助洗劑或其混合物。洗滌劑組合物可以單獨地包括一種共助洗劑,或與一種助洗劑,例如沸石助洗劑組合。共助洗劑的非限制性實例包括聚丙烯酸酯的均聚物或其共聚物,例如聚(丙烯酸)(PAA)或共聚(丙烯酸/馬來酸)(PAA/PMA)。另外的非限制性實例包括檸檬酸鹽,螯合劑,例如氨基羧酸鹽、氨基多羧酸鹽和膦酸鹽,以及烷基-或烯基琥珀酸。另外的具體實例包括2,2’,2”-次氨基三乙酸(NTA)、乙二胺四乙酸(EDTA)、二亞乙基三胺五乙酸(DTPA)、亞氨基二丁二酸(iminodisuccinic acid)(IDS)、乙二胺-N,N’-二丁二酸(EDDS)、甲基甘氨酸二乙酸(MGDA)、谷氨酸-N,N-二乙酸(GLDA)、1-羥基乙烷-1,1-二膦酸(HEDP)、乙二胺四-(亞甲基膦酸)(EDTMPA)、二亞乙基三胺五(亞甲基膦酸)(DTPMPA或DTMPA)、N-(2-羥乙基)亞氨基二乙酸(EDG)、天冬氨酸-N-單乙酸(ASMA)、天冬氨酸-N,N-二乙酸(ASDA)、天冬氨酸-N-單丙酸(ASMP)、亞氨基二丁二酸(iminodisuccinic acid)(IDA)、N-(2-磺甲基)-天冬氨酸(SMAS)、N-(2-磺乙基)-天冬氨酸(SEAS)、N-(2-磺甲基)-谷氨酸(SMGL)、N-(2-磺乙基)-谷氨酸(SEGL)、N-甲基亞氨基二乙酸(MIDA)、α-丙氨酸-N,N-二乙酸(α-ALDA)、絲氨酸-N,N-二乙酸(SEDA)、異絲氨酸-N,N-二乙酸(ISDA)、苯丙氨酸-N,N-二乙酸(PHDA)、鄰氨基苯甲酸-N,N-二乙酸(ANDA)、磺胺酸-N,N-二乙酸(SLDA)、牛磺酸-N,N-二乙酸(TUDA)以及磺甲基-N,N-二乙酸(SMDA)、N-(2-羥乙基)-亞乙基二胺-N,N’,N’-三乙酸鹽(HEDTA)、二乙醇甘氨酸(DEG)、二亞乙基三胺五(亞甲基膦酸)(DTPMP)、氨基三(亞甲基膦酸)(ATMP)及其組合和鹽。其他示例性助洗劑和/或共助洗劑描述于例如WO 09/102854、US 5977053中
漂白系統(tǒng)-該洗滌劑可以包括按重量計0-50%,例如約0.1%至約25%的漂白系統(tǒng)??梢岳帽绢I域中已知的用于在衣物洗滌劑中使用的任何漂白系統(tǒng)。適合的漂白系統(tǒng)組分包括漂白催化劑、光漂白劑、漂白活化劑、過氧化氫源如過碳酸鈉和過硼酸鈉、預成型過酸及其混合物。適合的預成型過酸包括,但不限于:過氧羧酸及鹽,過碳酸及鹽,過亞氨酸(perimidic acid)及鹽,過氧單硫酸及鹽(例如過硫酸氫鉀(Oxone(R)),及其混合物。漂白系統(tǒng)的非限制性實例包括基于過氧化物的漂白系統(tǒng),這些系統(tǒng)可以包括例如與過酸形成漂白活化劑組合的無機鹽,包括堿金屬鹽,如過硼酸鹽(通常是單水合物或四水合物)、過碳酸鹽、過硫酸鹽、過磷酸鹽、過硅酸鹽的鈉鹽。術語漂白活化劑在此意指一種與過氧化物漂白劑(像過氧化氫)反應以形成過酸的化合物。以此方式形成的過酸構(gòu)成活化的漂白劑。有待在此使用的適合漂白活化劑包括屬于酯酰胺、酰亞胺或酸酐類別的那些。適合的實例是四乙?;叶?TAED)、4-[(3,5,5-三甲基己酰)氧基]苯磺酸鈉(ISONOBS)、二過氧月桂酸、4-(十二酰基氧基)苯磺酸鹽(LOBS)、4-(癸?;趸?苯磺酸鹽、4-(癸?;趸?苯甲酸鹽(DOBS)、4-(壬?;趸?-苯磺酸鹽(NOBS)、和/或披露于WO 98/17767中的那些。感興趣的漂白活化劑的具體家族披露于EP 624154中并且在那個家族中特別優(yōu)選的是乙酰檸檬酸三乙酯(ATC)。ATC或短鏈甘油三酸酯(像三醋汀)具有以下優(yōu)點,它是環(huán)境友好的,因為它最終降解為檸檬酸和醇。此外,乙酰檸檬酸三乙酯和三醋汀在儲存時在產(chǎn)品中具有良好的水解穩(wěn)定性,并且它是一種有效的漂白活化劑。最后,ATC為洗衣添加劑提供一種良好的助洗能力。可替代地,漂白系統(tǒng)可以包括例如酰胺、酰亞胺、或砜型的過氧酸。漂白系統(tǒng)還可以包括過酸,例如6-(苯二甲酰亞氨基)過己酸(PAP)。漂白系統(tǒng)還可以包括漂白催化劑。在一些實施例中,漂白組分可以是選自下組的有機催化劑,該組由以下各項組成:具有下式的有機催化劑:
(iii)及其混合物;其中每個R1獨立地是包含從9至24個碳的支鏈烷基基團或包含從11至24個碳的直鏈烷基基團,優(yōu)選地,每個R1獨立地是包含從9至18個碳的支鏈烷基基團或包含從11至18個碳的直鏈烷基基團,更優(yōu)選地,每個R1獨立地選自下組,該組由以下各項組成:2-丙基庚基、2-丁基辛基、2-戊基壬基、2-己基癸基、正-十二烷基、正-十四烷基、正-十六烷基、正-十八烷基、異-壬基、異-癸基、異-十三基和異-十五烷基。其他示例性漂白系統(tǒng)描述于例如WO 2007/087258、WO 2007/087244、WO 2007/087259以及WO 2007/087242中。適合的光漂白劑可以例如是磺化的酞菁鋅。
聚合物-該洗滌劑可以包含按重量計0-10%,例如0.5%-5%、2%-5%、0.5%-2%或0.2%-1%的聚合物??梢岳帽绢I域中已知的用于在洗滌劑中使用的任何聚合物。聚合物可以作為如以上提到的共助洗劑起作用,或可以提供抗再沉積、纖維保護、污垢釋放、染料轉(zhuǎn)移抑制、油污清潔和/或防沫特性。一些聚合物可以具有多于一種的以上提到的特性和/或多于一種的以下提到的基序(motif)。示例性聚合物包括(羧甲基)纖維素(CMC)、聚(乙烯醇)(PVA)、聚(乙烯吡咯烷酮)(PVP)、聚(乙二醇)或聚(環(huán)氧乙烷)(PEG)、乙氧基化的聚(亞乙基亞胺)、羧甲基菊粉(CMI)、和聚羧化物,例如PAA、PAA/PMA、聚-天冬氨酸、和甲基丙烯酸月桂酯/丙烯酸共聚物、疏水修飾CMC(HM-CMC)和硅酮、對苯二甲酸和低聚乙二醇的共聚物、聚(對苯二甲酸乙二酯)和聚(氧乙烯對苯二甲酸乙二酯)的共聚物(PET-POET)、PVP、聚(乙烯基咪唑)(PVI)、聚(乙烯吡啶-N-氧化物)(PVPO或PVPNO)以及聚乙烯吡咯烷酮-乙烯基咪唑(PVPVI)。另外的示例性聚合物包括磺化的聚羧酸酯、聚環(huán)氧乙烷和聚環(huán)氧丙烷(PEO-PPO)以及乙氧基硫酸二季銨鹽。其他示例性聚合物披露于例如WO 2006/130575中。也考慮了以上提到的聚合物的鹽。
織物調(diào)色劑-本發(fā)明的洗滌劑組合物還可以包括織物調(diào)色劑,例如當配制在洗滌劑組合物中時,可以在織物與包括所述洗滌劑組合物的洗滌液體接觸時沉積在所述織物上,并且從而通過可見光吸收/反射來改變所述織物色彩的染料或色素。熒光增白劑發(fā)射至少一些可見光。相比之下,因為它們吸收至少一部分可見光光譜,所以織物調(diào)色劑改變表面的色彩。適合的織物調(diào)色劑包括染料和染料-粘土軛合物,并且還可以包括色素。適合的染料包括小分子染料和聚合物染料。適合的小分子染料包括選自下組的小分子染料,該組由落入顏色索引(Colour Index)(C.I.)分類的以下染料組成:直接藍、直接紅、直接紫、酸性藍、酸性紅、酸性紫、堿性藍、堿性紫和堿性紅、或其混合物,例如描述于WO 2005/03274、WO 2005/03275、WO 2005/03276和EP 1876226中(將其通過引用而特此結(jié)合)。洗滌劑組合物優(yōu)選包括從約0.00003wt%至約0.2wt%、從約0.00008wt%至約0.05wt%、或甚至從約0.0001wt%至約0.04wt%的織物調(diào)色劑。該組合物可以包括從0.0001wt%至0.2wt%的織物調(diào)色劑,當該組合物處于單位劑量袋的形式時,這可以是特別優(yōu)選的。適合的調(diào)色劑還披露于例如WO 2007/087257和WO 2007/087243中。
另外的酶-洗滌劑添加劑連同洗滌劑組合物可以包括一種或多種額外的酶,例如蛋白酶、脂肪酶、角質(zhì)酶、淀粉酶、糖酶、纖維素酶、果膠酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,例如漆酶、過氧化物酶和/或黃原膠裂解酶。
一般而言,一種或多種所選酶的特性應與選定的洗滌劑相容(即,最適pH,與其他酶和非酶成分的相容性,等等),并且該一種或多種酶應以有效量存在。
纖維素酶:適合的纖維素酶包括細菌或真菌來源的那些。包括經(jīng)化學修飾的或蛋白質(zhì)工程改造的變體。適合的纖維素酶包括來自芽孢桿菌屬、假單胞菌屬、腐質(zhì)霉屬、鐮刀菌屬、梭孢殼菌屬、支頂孢屬的纖維素酶,例如披露于US 4,435,307、US 5,648,263、US 5,691,178、US 5,776,757以及WO 89/09259中的由特異腐質(zhì)霉、嗜熱毀絲霉和尖孢鐮刀菌產(chǎn)生的真菌纖維素酶。
尤其適合的纖維素酶是具有顏色護理益處的堿性或中性纖維素酶。此類纖維素酶的實例是描述于EP 0 495 257、EP 0 531 372、WO 96/11262、WO 96/29397、WO 98/08940中的纖維素酶。其他實例為纖維素酶變體,例如在WO 94/07998、EP 0 531 315、US 5,457,046、US 5,686,593、US 5,763,254、WO 95/24471、WO 98/12307以及PCT/DK 98/00299中描述的那些。
表現(xiàn)出內(nèi)切-β-1,4-葡聚糖酶活性的纖維素酶(EC 3.2.1.4)的實例是已經(jīng)描述于WO 02/099091中的那些。
纖維素酶的其他實例包括描述于WO 96/29397中的家族45纖維素酶,并且特別是在對應于WO 02/099091的SEQ ID NO:8中的以下位置的一個或多個位置具有取代、插入和/或缺失的其變體:2、4、7、8、10、13、15、19、20、21、25、26、29、32、33、34、35、37、40、42、42a、43、44、48、53、54、55、58、59、63、64、65、66、67、70、72、76、79、80、82、84、86、88、90、91、93、95、95d、95h、95j、97、100、101、102、103、113、114、117、119、121、133、136、137、138、139、140a、141、143a、145、146、147、150e、150j、151、152、153、154、155、156、157、158、159、160c、160e、160k、161、162、164、165、168、170、171、172、173、175、176、178、181、183、184、185、186、188、191、192、195、196、200、和/或20,優(yōu)選選自P19A、G20K、Q44K、N48E、Q119H或Q146R。
可商購的纖維素酶包括CelluzymeTM、和CarezymeTM(諾維信公司(Novozymes A/S))、ClazinaseTM、和Puradax HATM(杰能科國際有限公司(Genencor International Inc.))、以及KAC-500(B)TM(花王株式會社(Kao Corporation))。
蛋白酶:另外的酶可以是另一種蛋白酶或蛋白酶變體。該蛋白酶可以是動物、植物或微生物來源的,包括化學或基因修飾的變體。優(yōu)選微生物來源。它可以是一種堿性蛋白酶,例如絲氨酸蛋白酶或金屬蛋白酶。絲氨酸蛋白酶可以例如是S1家族(如胰蛋白酶)或S8家族(如枯草桿菌蛋白酶)。金屬蛋白酶的蛋白酶可以例如是來自例如家族M4、M5、M7或M8的嗜熱菌蛋白酶。
術語“枯草桿菌酶”是指根據(jù)斯艾森(Siezen)等人,蛋白質(zhì)工程學(Protein Engng.)4(1991)719-737和斯艾森等人,蛋白質(zhì)科學(Protein Science)6(1997)501-523的絲氨酸蛋白酶亞組。絲氨酸蛋白酶是特征為在活性位點具有與底物形成共價加合物的絲氨酸的蛋白酶的一個亞組。枯草桿菌酶可以劃分為6個亞部,即,枯草桿菌蛋白酶家族、嗜熱蛋白酶家族、蛋白酶K家族、羊毛硫抗生素肽酶家族、Kexin家族和Pyrolysin家族。在本發(fā)明的一個方面,該蛋白酶可以是一種類枯草桿菌蛋白酶,例如枯草桿菌蛋白酶或其變體。另外,類枯草桿菌蛋白酶(以及絲氨酸蛋白酶)的特征為除了絲氨酸以外,還具有兩個活性位點氨基酸殘基,即一個組氨酸和一個天冬氨酸殘基。
枯草桿菌蛋白酶的實例是來源于芽孢桿菌的那些,如枯草桿菌蛋白酶lentus、芽孢桿菌lentus、枯草桿菌蛋白酶Novo、嘉士伯枯草桿菌蛋白酶(subtilisin Carlsberg)、地衣芽孢桿菌、枯草桿菌蛋白酶BPN’、枯草桿菌蛋白酶309、枯草桿菌蛋白酶147以及枯草桿菌蛋白酶168(描述于WO 89/06279中)以及蛋白酶PD138(WO 93/18140)。另外的絲氨酸蛋白酶實例描述于WO 98/020115、WO 01/44452、WO 01/58275、WO 01/58276、WO 03/006602以及WO 04/099401中??莶輻U菌酶變體的實例可以是在以下任意位置中具有突變的那些:3、4、9、15、27、36、68、76、87、95、96、97、98、99、100、101、102、103、104、106、118、120、123、128、129、130、160、167、170、194、195、199、205、217、218、222、232、235、236、245、248、252以及274,使用BPN’編號。更優(yōu)選地,這些枯草桿菌酶變體可以包含以下突變:S3T、V4I、S9R、A15T、K27R、*36D、V68A、N76D、N87S,R、*97E、A98S、S99G,D,A、S99AD、S101G,M,R S103A、V104I,Y,N、S106A、G118V,R、H120D,N、N123S、S128L、P129Q、S130A、G160D、Y167A、R170S、A194P、G195E、V199M、V205I、L217D、N218D、M222S、A232V、K235L、Q236H、Q245R、N252K、T274A(使用BPN’進行編號)。另外的優(yōu)選的蛋白酶是來自遲緩芽孢桿菌DSM 5483的堿性蛋白酶(如在(例如)WO 95/23221中所述)、以及其變體(在WO 92/21760、WO 95/23221、EP 1921147以及EP 1921148中描述的)。
胰蛋白酶樣蛋白酶的實例為胰蛋白酶(例如,豬或牛來源的),以及在WO 89/06270和WO 94/25583中描述的鐮孢屬蛋白酶。有用的蛋白酶的實例為在WO 92/19729、WO 98/20115、WO 98/20116、以及WO 98/34946中描述的變體,尤其是在一個或多個以下位置中具有取代的變體:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235、以及274。
金屬蛋白酶的實例是如描述于WO 07/044993中的中性金屬蛋白酶。
優(yōu)選的可商購的蛋白酶酶類包括AlcalaseTM、CoronaseTM、DuralaseTM、DurazymTM、EsperaseTM、EverlaseTM、KannaseTM、LiquanaseTM、Liquanase UltraTM、OvozymeTM、PolarzymeTM、PrimaseTM、RelaseTM、SavinaseTM和Savinase UltraTM(諾維信公司(Novozymes A/S)),AxapemTM(Gist-Brocases N.V.公司),BLAP和BLAP X(Henkel AG&Co.KGaA),ExcellaseTM、FN2TM、FN3TM、FN4TM、MaxacaTM、MaxapemTM、MaxataseTM、ProperaseTM、PurafastTM、PurafectTM、Purafect OxPTM、Purafect PrimeTM和PuramaxTM(杰能科有限公司(Genencor int.))。
脂肪酶和角質(zhì)酶:適合的脂肪酶和角質(zhì)酶包括細菌或真菌來源的那些。包括化學修飾的或蛋白質(zhì)工程化的變體酶。實例包括來自嗜熱真菌屬的脂肪酶,例如如描述于EP 258068和EP 305216中的來自疏綿狀嗜熱絲孢菌(早先命名為疏棉狀腐質(zhì)霉);來自腐質(zhì)霉屬的角質(zhì)酶,例如特異腐質(zhì)霉(WO 96/13580);來自假單胞菌屬的菌株的脂肪酶(這些中的一些現(xiàn)在改名為伯克霍爾氏菌屬),例如產(chǎn)堿假單胞菌或類產(chǎn)堿假單胞菌(EP 218272)、洋蔥假單胞菌(EP 331376)、假單胞菌屬菌株SD705(WO 95/06720&WO 96/27002)、威斯康星假單胞菌(P.wisconsinensis)(WO 96/12012);GDSL-型鏈霉菌屬脂肪酶(WO 10/065455);來自稻瘟病菌的角質(zhì)酶(WO 10/107560);來自門多薩假單胞菌的角質(zhì)酶(US 5,389,536);來自褐色嗜熱裂孢菌(Thermobifida fusca)的脂肪酶(WO 11/084412);嗜熱脂肪土芽孢桿菌脂肪酶(WO 11/084417);來自枯草芽孢桿菌的脂肪酶(WO 11/084599);以及來自灰色鏈霉菌(WO 11/150157)和始旋鏈霉菌(S.pristinaespiralis)的脂肪酶(WO 12/137147)。
另外的實例是有時被稱為?;D(zhuǎn)移酶或過水解酶(perhydrolase)的脂肪酶,例如與南極假絲酵母脂肪酶A具有同源性的?;D(zhuǎn)移酶(WO 10/111143)、來自恥垢分枝桿菌的酰基轉(zhuǎn)移酶(WO 05/56782)、來自CE 7家族的過水解酶(WO 09/67279)、以及恥垢分枝桿菌過水解酶的變體,特別是用于在來自亨斯邁紡織染化私人有限公司(Huntsman Textile Effects Pte Ltd)的商業(yè)化產(chǎn)品Gentle Power Bleach(柔和漂白劑)中使用的S54V變體(WO 10/100028)。
其他實例是脂肪酶變體,例如描述于EP 407225、WO 92/05249、WO 94/01541、WO 94/25578、WO 95/14783、WO 95/30744、WO 95/35381、WO 95/22615、WO 96/00292、WO 97/04079、WO 97/07202、WO 00/34450、WO 00/60063、WO 01/92502、WO 07/87508以及WO 09/109500中的那些。
優(yōu)選的商業(yè)化脂肪酶產(chǎn)品包括LipolaseTM、LipexTM;LipolexTM和LipocleanTM(諾維信公司),Lumafast(來自杰能科公司(Genencor))以及Lipomax(來自吉斯特布羅卡德斯公司(Gist-Brocades))。
淀粉酶-淀粉酶可以是一種α-淀粉酶、β-淀粉酶或葡糖淀粉酶并且可以是細菌或真菌來源的。包括經(jīng)化學修飾的或蛋白質(zhì)工程改造的變體。淀粉酶包括例如獲得自芽孢桿菌屬的α-淀粉酶,例如GB 1,296,839中更詳細描述的地衣芽孢桿菌具體株系的α-淀粉酶。
淀粉酶的實例是具有WO 95/10603中的SEQ ID NO:3的那些或與SEQ ID NO:3具有90%序列一致性的其變體。優(yōu)選的變體描述于WO 94/02597、WO 94/18314、WO 97/43424以及WO 99/019467的SEQ ID NO:4中,例如在WO 95/10603中的SEQ ID NO:3的一個或多個以下位置具有取代的變體:15、23、105、106、124、128、133、154、156、178、179、181、188、190、197、201、202、207、208、209、211、243、264、304、305、391、408以及444。
可以使用的另外的淀粉酶是具有WO 02/010355中的SEQ ID NO:6的淀粉酶或其與SEQ ID NO:6具有90%序列一致性的變體。SEQ ID NO:6的優(yōu)選變體是在位置181和182中具有缺失并且在位置193中具有取代的那些。
其他淀粉酶實例是包含示于WO 2006/066594的SEQ ID NO:6中的來源于解淀粉芽孢桿菌的α-淀粉酶的殘基1-33和示于WO 2006/066594的SEQ ID NO:4中的地衣芽孢桿菌α-淀粉酶的殘基36-483的雜合α-淀粉酶或具有90%序列一致性的其變體。這一雜合α-淀粉酶的優(yōu)選變體是在以下位置中的一個或多個中具有取代、缺失或插入的那些:G48、T49、G107、H156、A181、N190、M197、I201、A209以及Q264。包括示于WO 2006/066594的SEQ ID NO:6中的來源于解淀粉芽孢桿菌的α-淀粉酶的殘基1-33和SEQ ID NO:4的殘基36-483的雜合α-淀粉酶的最優(yōu)選變體是具有以下取代的那些:
M197T;
H156Y+A181T+N190F+A209V+Q264S;或
G48+T49+G107+H156+A181+N190+I201+A209+Q264。
另外的淀粉酶實例是具有WO 99/019467中的SEQ ID NO:6的淀粉酶或其與SEQ ID NO:6具有90%序列一致性的變體。SEQ ID NO:6的優(yōu)選變體是在以下位置中的一個或多個中具有取代、缺失或插入的那些:R181、G182、H183、G184、N195、I206、E212、E216以及K269。特別優(yōu)選的淀粉酶是在位置G182和H183或位置H183和G184中具有缺失的那些。
另外的淀粉酶是具有WO 96/023873的SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:7的那些或其與SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:7具有90%序列一致性的變體。SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:7的優(yōu)選變體是在以下位置中的一個或多個中具有取代、缺失或插入的那些:140、181、182、183、184、195、206、212、243、260、269、304以及476。更優(yōu)選的變體是在位置182和183或位置183和184中具有缺失的那些。SEQ ID NO:1、SEQ ID NO:2或SEQ ID NO:7的最優(yōu)選的淀粉酶變體是在位置183和184中具有缺失并且在位置140、195、206、243、260、304以及476中具有取代的那些。
可以使用的其他淀粉酶是具有WO 08/153815中的SEQ ID NO:2、WO 01/66712中的SEQ ID NO:10的淀粉酶或其與WO 08/153815的SEQ ID NO:2具有90%序列一致性或與WO 01/66712中的SEQ ID NO:10具有90%序列一致性的變體。WO 01/66712中的SEQ ID NO:10的優(yōu)選變體是在以下位置中的一個或多個中具有取代、缺失或插入的那些:176、177、178、179、190、201、207、211以及264。
可以使用的另外的淀粉酶是具有WO 09/061380的SEQ ID NO:2的淀粉酶或其與SEQ ID NO:2具有90%序列一致性的變體。SEQ ID NO:2的優(yōu)選變體是在以下位置中的一個或多個中具有取代、缺失或插入的那些:Q87、Q98、S125、N128、T131、T165、K178、R180、S181、T182、G183、M201、F202、N225、S243、N272、N282、Y305、R309、D319、Q320、Q359、K444以及G475。SEQ ID NO:2的最優(yōu)選的變體是在以下位置中的一個或多個中具有取代:Q87E,R、Q98R、S125A、N128C、T131I、T165I、K178L、T182G、M201L、F202Y、N225E,R、N272E,R、S243Q,A,E,D、Y305R、R309A、Q320R、Q359E、K444E以及G475K,和/或在位置R180和/或S181具有缺失的那些。SEQ ID NO:2的最優(yōu)選的淀粉酶變體是具有以下取代的那些:
N128C+K178L+T182G+Y305R+G475K;
N128C+K178L+T182G+F202Y+Y305R+D319T+G475K;
S125A+N128C+K178L+T182G+Y305R+G475K;或
S125A+N128C+T131I+T165I+K178L+T182G+Y305R+G475K,其中該變體任選地進一步在位置243處包括取代和/或在位置180和/或位置181處包括缺失。
淀粉酶的其他實例是具有WO 01/66712中的SEQ ID NO:12的α-淀粉酶或與SEQ ID NO:12具有至少90%,例如至少95%序列一致性的變體。優(yōu)選的淀粉酶變體是在WO 01/66712中的SEQ ID NO:12的以下位置中的一個或多個中具有取代、缺失或插入的那些:R28,R118,N174;R181,G182,D183,G184,G186,W189,N195,M202,Y298,N299,K302,S303,N306,R310,N314;R320,H324,E345,Y396,R400,W439,R444,N445,K446,Q449,R458,N471,N484。特別優(yōu)選的淀粉酶包括具有D183和G184的缺失并且具有R118K、N195F、R320K及R458K的取代的變體,以及另外在選自下組的一個或多個位置中具有取代的變體:M9、G149、G182、G186、M202、T257、Y295、N299、M323、E345以及A339,最優(yōu)選的是另外在所有這些位置中具有取代的變體。
可商購的淀粉酶是DuramylTM、TermamylTM、FungamylTM、StainzymeTM、Stainzyme PlusTM、NatalaseTM和BANTM(諾維信公司),RapidaseTM和PurastarTM(來自杰能科國際有限公司)。
過氧化物酶/氧化酶:適合的過氧化物酶/氧化酶包括植物、細菌或真菌來源的那些。包括經(jīng)化學修飾的或蛋白質(zhì)工程改造的變體。有用的過氧化物酶的實例包括來自鬼傘屬,例如來自灰蓋鬼傘的過氧化物酶,及其變體,如在WO 93/24618、WO 95/10602、以及WO 98/15257中描述的那些。
可商購的過氧化物酶包括GuardzymeTM(諾維信公司)。
該一種或多種酶可以通過添加包含一種或多種酶的單獨的添加劑,或通過添加包括所有這些酶的組合添加劑而被包括于洗滌劑組合物中。本發(fā)明的洗滌劑添加劑,即單獨的或組合的添加劑,可以配制成例如顆粒、液體、漿液等,優(yōu)選的洗滌劑添加劑劑型為顆粒,特別是無粉塵顆粒;液體,特別是穩(wěn)定化液體;或者漿液。
非塵顆??梢岳缛缭赨S 4,106,991和4,661,452中所披露而產(chǎn)生,并且可以任選地通過本領域已知的方法進行包衣。蠟狀包衣材料的實例為具有1000至20000的平均摩爾重量的聚(環(huán)氧乙烷)產(chǎn)物(聚乙二醇,PEG);具有從16至50個環(huán)氧乙烷單元的乙氧化壬基苯酚;乙氧化脂肪醇,其中該醇包含從12至20個碳原子,并且其中具有15至80個環(huán)氧乙烷單元;脂肪醇;脂肪酸;以及脂肪酸的甘油單酯和甘油二酯以及甘油三酯。適用于通過流化床技術應用的成膜包衣材料的實例在GB 1483591中給出。液體酶制品可以例如通過根據(jù)已確立的方法添加多元醇(如丙二醇)、糖或糖醇、乳酸或硼酸而穩(wěn)定化。受保護的酶可以根據(jù)EP 238,216中披露的方法來制備。
輔料-還可以利用本領域中已知的用于在衣物洗滌劑中使用的任何洗滌劑組分。其他任選的洗滌劑組分包括防腐劑、防縮劑、抗污垢再沉積劑、抗皺劑、殺細菌劑、粘合劑、腐蝕抑制劑、崩解劑(disintegrant)/崩解試劑(disintegration agent)、染料、酶穩(wěn)定劑(包括硼酸、硼酸鹽、CMC和/或多元醇如丙二醇)、織物整理劑(包括粘土)、填充劑/加工助劑、熒光增白劑/光學增亮劑、增泡劑、泡沫(泡)調(diào)節(jié)劑、香料、污垢助懸劑、軟化劑、抑泡劑、晦暗抑制劑以及芯吸劑,單獨抑或組合使用??梢岳帽绢I域中已知的用于在衣物洗滌劑中使用的任何成分。此類成分的選擇完全在普通技術人員的技術內(nèi)。
分散劑:本發(fā)明的洗滌劑組合物還可以包含分散劑。具體地說,粉狀洗滌劑可以包括分散劑。適合的水溶性有機材料包括均聚合或共聚合的酸或其鹽,其中聚羧酸包括至少兩個羧基,這兩個羧基被不超過兩個碳原子彼此分開。適合的分散劑例如描述于粉狀洗滌劑,表面活性劑科學系列(Surfactant Science Series),第71卷中,馬塞爾·德克爾公司(Marcel Dekker)。
染料轉(zhuǎn)移抑制劑:本發(fā)明的洗滌劑組合物還可以包括一種或多種染料轉(zhuǎn)移抑制劑。適合的聚合物染料轉(zhuǎn)移抑制劑包括但不限于聚乙烯吡咯烷酮聚合物、多胺N-氧化物聚合物、N-乙烯吡咯烷酮與N-乙烯基咪唑的共聚物、聚乙烯噁唑烷酮以及聚乙烯咪唑或其混合物。當存在于主題組合物中時,染料轉(zhuǎn)移抑制劑可以按組合物重量計的以下水平存在:從約0.0001%至約10%、從約0.01%至約5%或甚至從約0.1%至約3%。
熒光增白劑:本發(fā)明的洗滌劑組合物還將優(yōu)選地包含另外的組分,這些組分可以給正清潔的物品著色,例如熒光增白劑或光學增亮劑。其中增亮劑優(yōu)選以約0.01%至約0.5%的水平存在。在本發(fā)明的組合物中可以使用適合用于在衣物洗滌劑組合物中使用的任何熒光增白劑。最常用的熒光增白劑是屬于以下類別的那些:二氨芪-磺酸衍生物、二芳基吡唑啉衍生物和二苯基-聯(lián)苯乙烯基衍生物。熒光增白劑的二氨芪-磺酸衍生物型的實例包括以下各項的鈉鹽:4,4'-雙-(2-二乙醇氨基-4-苯胺基-s-三嗪-6-基氨基)芪-2,2'-二磺酸鹽;4,4'-雙-(2,4-二苯胺基-s-三嗪-6-基氨基)芪-2.2'-二磺酸鹽;4,4'-雙-(2-苯胺基-4(N-甲基-N-2-羥基-乙氨基)-s-三嗪-6-基氨基)芪-2,2'-二磺酸鹽,4,4'-雙-(4-苯基-2,1,3-三唑-2-基)芪-2,2'-二磺酸鹽;4,4'-雙-(2-苯胺基-4(1-甲基-2-羥基-乙氨基)-s-三嗪-6-基氨基)芪-2,2'-二磺酸鹽和2-(二苯乙烯基-4"-萘-1.,2':4,5)-1,2,3-三唑-2"-磺酸鹽。優(yōu)選的熒光增白劑是可從汽巴–嘉基股份有限公司(Ciba-Geigy AG)(巴塞爾,瑞士)獲得的天來寶(Tinopal)DMS和天來寶CBS。天來寶DMS是4,4'-雙-(2-嗎啉基-4苯胺基-s-三嗪-6-基氨基)芪二磺酸鹽的二鈉鹽。天來寶CBS是2,2'-雙-(苯基-苯乙烯基)二磺酸鹽的二鈉鹽。還優(yōu)選熒光增白劑,是可商購的Parawhite KX,由派拉蒙礦物與化學(Paramount Minerals and Chemicals),孟買,印度供應。適合用于在本發(fā)明中使用的其他熒光劑包括1-3-二芳基吡唑啉和7-烷氨基香豆素。適合的熒光增亮劑水平包括從約0.01wt%、從0.05wt%、從約0.1wt%或甚至從約0.2wt%的較低水平至0.5wt%或甚至0.75wt%的較高水平。
污垢釋放聚合物:本發(fā)明的洗滌劑組合物還可以包括一種或多種污垢釋放聚合物,這些污垢釋放聚合物幫助從織物,例如棉或聚酯基織物上去除污垢,特別是從聚酯基織物上去除疏水污垢。污物釋放聚合物可以例如是非離子型或陰離子型對苯二甲酸基聚合物、聚乙烯基己內(nèi)酰胺和相關共聚物、乙烯基接枝共聚物、聚酯聚酰胺,參見例如粉狀洗滌劑,表面活性劑科學系列第71卷第7章,馬塞爾·德克爾公司(Marcel Dekker,Inc.)。另一種類型的污物釋放聚合物是包括一個芯結(jié)構(gòu)和連接至該芯結(jié)構(gòu)的多個烷氧基化基團的兩親性烷氧基化油污清潔聚合物。核心結(jié)構(gòu)可以包括聚烷基亞胺結(jié)構(gòu)或聚烷醇胺結(jié)構(gòu),如WO 2009/087523中詳細描述的(將其通過引用而特此結(jié)合)。此外,任意接枝共聚物是適合的污物釋放聚合物。適合的接枝共聚物更詳細地描述于WO 2007/138054、WO 2006/108856以及WO 2006/113314中(將其通過引用而特此結(jié)合)。其他污垢釋放聚合物是取代的多糖結(jié)構(gòu),尤其是取代的纖維素結(jié)構(gòu),例如改性纖維素衍生物,例如EP 1867808或WO 2003/040279中描述的那些(將二者都通過引用而特此結(jié)合)。適合的纖維素聚合物包括纖維素、纖維素醚、纖維素酯、纖維素酰胺及其混合物。適合的纖維素聚合物包括陰離子改性的纖維素、非離子改性的纖維素、陽離子改性的纖維素、兼性離子改性的纖維素及其混合物。適合的纖維素聚合物包括甲基纖維素、羧甲基纖維素、乙基纖維素、羥乙基纖維素、羥丙基甲基纖維素、酯羧甲基纖維素及其混合物。
抗再沉積劑:本發(fā)明的洗滌劑組合物還可以包括一種或多種抗再沉積劑,例如羧甲基纖維素(CMC)、聚乙烯醇(PVA)、聚乙烯吡咯烷酮(PVP)、聚環(huán)氧乙烷和/或聚乙二醇(PEG)、丙烯酸的均聚物、丙烯酸與馬來酸的共聚物以及乙氧基化聚乙亞胺。以上在污垢釋放聚合物下描述的纖維素基聚合物還可以用作抗再沉積劑。
其他適合的輔料包括但不限于防縮劑、抗皺劑、殺細菌劑、粘合劑、載體、染料、酶穩(wěn)定劑、織物軟化劑、填充劑、泡沫調(diào)節(jié)劑、助水溶劑、香料、色素、抑泡劑、溶劑以及用于液體洗滌劑的結(jié)構(gòu)劑和/或結(jié)構(gòu)彈性劑。
洗滌劑產(chǎn)品的配制
本發(fā)明的洗滌劑組合物可以處于任何常規(guī)形式,例如條、均勻的片劑、具有兩個或更多個層的片劑、具有一個或多個室的袋、規(guī)則的或壓縮的粉末、顆粒、膏、凝膠、或規(guī)則的、壓縮的或濃縮的液體。存在多種洗滌劑配制品形式,例如層(相同或不同相)、袋以及用于機械給料裝置的形式。
可以將小袋配置為單一隔室或多隔室。它可以具有適合保存該組合物的任何形式、形狀和材料,例如在與水接觸之前,不允許該組合物從袋中釋放出來。袋由封裝內(nèi)體積的水溶性膜制成??梢詫⑺鰞?nèi)體積分為袋的室。優(yōu)選的膜是形成膜或片的聚合材料,優(yōu)選是聚合物。優(yōu)選的聚合物、共聚物或其衍生物選自聚丙烯酸酯、和水溶性丙烯酸酯共聚物、甲基纖維素、羧甲基纖維素、糊精鈉、乙基纖維素、羥乙基纖維素、羥丙基甲基纖維素、麥芽糊精、聚甲基丙烯酸酯,最優(yōu)選地是聚乙烯醇共聚物和羥丙基甲基纖維素(HPMC)。優(yōu)選地,在膜中的聚合物(例如PVA)的水平是至少約60%。優(yōu)選的平均分子量將典型地是約20,000至約150,000。膜還可以是共混物組合物,該共混物組合物包括可水解降解并且水可溶的聚合物共混物,例如聚乳酸和聚乙烯醇(已知在貿(mào)易參考M8630下,如由美國印第安納州蓋里(Gary,Ind.,US)的克里斯克拉夫特工業(yè)產(chǎn)品公司(Chris Craft In.Prod.)銷售)加增塑劑,像甘油、乙二醇、丙二醇、山梨醇及其混合物。這些袋可以包括固體衣物清潔組合物或部分組分和/或液體清潔組合物或由水溶性膜分開的部分組分。用于液體組分的室在構(gòu)成上可以與包含固體的室不同。參考文獻:(US 2009/0011970A1)。
可以由水可溶的袋中或片劑的不同層中的室來將洗滌劑成分物理地彼此分開。由此可以避免組分之間的負面的存儲相互作用。在洗滌溶液中,每個室的不同溶解曲線還可以引起選擇的組分的延遲溶解。
非單位劑量的液體或凝膠洗滌劑可以是水性的,典型地包含按重量計至少20%并且最高達95%的水,例如高達約70%的水、高達約65%的水、高達約55%的水、高達約45%的水、高達約35%的水。包括但不限于鏈烷醇、胺、二醇、醚以及多元醇的其他類型的液體可以被包括在水性液體或凝膠中。含水液體或凝膠洗滌劑可以包含從0-30%的有機溶劑。液體或凝膠洗滌劑可以是非水性的。
本發(fā)明的酶可以被添加至洗衣皂條中并且用于手洗洗衣、織物和/或紡織品。術語洗衣皂條包括洗衣條、皂條、組合條(combo bar)、合成洗滌劑條以及洗滌劑條。條的類型通常區(qū)別在于它們包含的表面活性劑的類型,并且術語洗衣皂條包括包含來自脂肪酸的皂和/或合成皂的那些。洗衣皂條具有在室溫下為固體而非液體、凝膠或粉末的物理形式。術語固體被定義為不隨著時間顯著變化的物理形式,即如果將一固體物體(例如洗衣皂條)放置于一個容器內(nèi)部,該固體物體不發(fā)生改變來填充它被放置于其中的容器。條典型地是處于條形的固體但是可以處于其他固體形狀,例如圓形或卵形。
洗衣皂條可以包含一種或多種另外的酶,蛋白酶抑制劑例如肽醛類(或次硫酸鹽加合物或半縮醛加合物),硼酸,硼酸鹽,硼砂和/或苯基硼酸衍生物例如4-甲酰苯基硼酸,一種或多種肥皂或合成表面活性劑,多元醇例如甘油,pH控制化合物例如脂肪酸、檸檬酸、乙酸和/或甲酸,和/或一價陽離子和有機陰離子的鹽,其中該一價陽離子可以是例如Na+、K+或NH4+并且該有機陰離子可以是例如甲酸鹽、乙酸鹽、檸檬酸鹽或乳酸鹽,這樣使得一價陽離子和有機陰離子的鹽可以是例如甲酸鈉。
洗衣皂條還可以包含絡合劑像EDTA和HEDP,香料和/或不同類型的填充劑,表面活性劑例如陰離子型合成表面活性劑,助洗劑,聚合的污垢釋放劑,洗滌劑螯合劑,穩(wěn)定劑,填充劑,染料,著色劑,染料轉(zhuǎn)移抑制劑,烷氧基化的聚碳酸酯,抑泡劑,結(jié)構(gòu)劑,粘合劑,浸出劑,漂白活化劑,粘土去污劑,抗再沉積劑,聚合分散劑,增白劑,織物柔軟劑,香料和/或本領域已知的其他化合物。
洗衣皂條可以在常規(guī)的洗衣皂條制造設備中進行加工,例如但不限制于:混合器、壓條機例如雙級真空壓條機、擠出機、切割機、標識壓模機(logo-stamper)、冷卻隧道以及包裝機。本發(fā)明不局限于通過任何單一方法制備洗衣皂條。可以在過程的不同階段向肥皂中添加本發(fā)明的預混料。例如,可以制備包含肥皂、酶、任選地一種或多種另外的酶、蛋白酶抑制劑以及一價陽離子和有機陰離子的鹽的預混料并且然后將該混合物壓條。可以同時添加作為例如處于液態(tài)的蛋白酶抑制劑的酶以及任選的另外的酶。除了混合步驟和壓條步驟以外,該工藝還可以進一步包括研磨、擠出、切割、壓模、冷卻和/或包裝的步驟。
用于降解黃原膠的用途
已經(jīng)將黃原膠用作許多消費品(包括食品和化妝品)中的成分并且已經(jīng)用于石油工業(yè)中。因此,黃原膠的降解可以導致改進的清潔過程,例如更容易去除包含膠質(zhì)(例如黃原膠)的污物,連同通常用于石油與鉆探工業(yè)中的黃原膠的降解。因此,本發(fā)明針對本發(fā)明的內(nèi)切葡聚糖酶或其組合物用于降解黃原膠的用途。本發(fā)明還針對黃原膠裂解酶或其組合物用于降解黃原膠的用途。一個實施例是本發(fā)明的內(nèi)切葡聚糖酶與黃原膠裂解酶一起或其組合物用于降解黃原膠的用途??梢詢?yōu)選地使用如描述于實例5中的粘度減小測定(ViPr測定)或可替代地,如描述于實例6中的還原末端測定測量黃原膠的降解。
在一個實施例中,可以使用如有關黃原膠的在此描述的粘度減小測定測量黃原膠的降解。一個優(yōu)選實施例是黃原膠(0.25%或0.5%)在緩沖液或水中的用途,其中在5分鐘、30分鐘、1小時、1.5小時、2小時、2.5小時、3小時、3.5小時或4小時后測量粘度的下降。一個更優(yōu)選的實施例是黃原膠(0.25%)在水中的用途,其中在3小時后測量粘度的下降。
當使用粘度減小測定時,用于降解黃原膠的粘度的下降是至少200Pa。當使用粘度減小測定時,用于降解黃原膠的粘度的下降是至少250Pa。當使用粘度減小測定時,用于降解黃原膠的粘度的下降是至少300Pa。當使用粘度減小測定時,用于降解黃原膠的粘度的下降是至少350Pa。當使用粘度減小測定時,用于降解黃原膠的粘度的下降是至少400Pa。當使用粘度減小測定時,用于降解黃原膠的粘度的下降是至少450Pa。當使用粘度減小測定時,用于降解黃原膠的粘度的下降是至少500Pa。當使用粘度減小測定時,用于降解黃原膠的粘度的下降是至少550Pa。當使用粘度減小測定時,用于降解黃原膠的粘度的下降是至少600Pa。
可替代地,可以使用由萊韋爾(Lever)(1972),Lever(Lever)47:273-279,1972研發(fā)的比色測定,將黃原膠降解活性測量為用黃原膠裂解酶預處理的黃原膠上的還原末端。一個優(yōu)選實施例是用黃原膠裂解酶預處理的0.1%黃原膠的用途??梢酝ㄟ^計算空白與樣品之間的差異確定用黃原膠裂解酶預處理的黃原膠的降解,其中大于0.1mAU,大于0.15mAU,大于0.2mAU,大于0.25mAU,大于0.5mAU,優(yōu)選大于0.6mAU,更優(yōu)選大于0.7mAU或甚至更優(yōu)選大于0.8mAU的差異示出用黃原膠裂解酶預處理的黃原膠的降解。
在去污劑中的用途。
本發(fā)明針對本發(fā)明的內(nèi)切葡聚糖酶或其組合物在清潔過程中的用途,例如紡織品和織物的濕洗,例如家用衣物洗滌和工業(yè)衣物洗滌,以及家用和工業(yè)硬表面清潔,例如餐具洗滌??梢詫⒈景l(fā)明的內(nèi)切葡聚糖酶添加至包括一種或多種洗滌劑組分的洗滌劑組合物中。
一個實施例是本發(fā)明的內(nèi)切葡聚糖酶連同黃原膠裂解酶或其組合物在清潔過程中的用途,例如紡織品和織物的濕洗(例如家用衣物洗滌和工業(yè)衣物洗滌)以及家用和工業(yè)硬表面清潔,例如餐具洗滌??梢詫⒈景l(fā)明的內(nèi)切葡聚糖酶連同黃原膠裂解酶添加至包括一種或多種洗滌劑組分的洗滌劑組合物中。
可以將本發(fā)明的多肽添加至洗滌劑組合物中并且因此變成洗滌劑組合物的組分。本發(fā)明的洗滌劑組合物可以配制為例如用于家用和工業(yè)衣物清潔兩者的手洗或機洗衣物洗滌劑組合物,包括適用于預處理有污物的織物的洗衣添加劑組合物和漂洗添加的織物軟化劑組合物,或者配制為用于一般家用或工業(yè)硬表面清潔操作的洗滌劑組合物,或者配制用于手洗或機洗(家用和工業(yè)兩者)餐具洗滌操作。在一個特定的方面中,本發(fā)明提供了一種洗滌劑添加劑,該添加劑包括如在此描述的本發(fā)明的多肽。
在一個實施例中,可以如WO 2013/167581中所述,使用AMAS,對黃原膠與碳黑小塊布樣測量ΔInt酶值。一個優(yōu)選實施例是黃原膠與碳黑(DN31、DN31C或DN31D)小塊布樣在20℃或40℃下的使用。一個更優(yōu)選的實施例是黃原膠與碳黑(DN31C或DN31D)小塊布樣在40℃下的使用。一個甚至更優(yōu)選的實施例是黃原膠與碳黑(DN31D)小塊布樣在40℃下的使用。用于對用黃原膠裂解酶預處理的黃原膠具有活性的內(nèi)切葡聚糖酶和用于黃原膠裂解酶的優(yōu)選的酶濃度分別為0.5mg EP/L和1.0mg EP/L。
如通過AMSA所確定,黃原膠與碳黑小塊布樣的δ強度值是至少3個單位。如通過AMSA所確定,黃原膠與碳黑小塊布樣的δ強度值是至少3.5個單位。如通過AMSA所確定,黃原膠與碳黑小塊布樣的δ強度值是至少4個單位。如通過AMSA所確定,黃原膠與碳黑小塊布樣的δ強度值是至少4.5個單位。如通過AMSA所確定,黃原膠與碳黑小塊布樣的δ強度值是至少5個單位。如通過AMSA所確定,黃原膠與碳黑小塊布樣的δ強度值是至少5.5個單位。如通過AMSA所確定,黃原膠與碳黑小塊布樣的δ強度值是至少6個單位。如通過AMSA所確定,黃原膠與碳黑小塊布樣的δ強度值是至少7個單位。如通過AMSA所確定,黃原膠與碳黑小塊布樣的δ強度值是至少8個單位。如通過AMSA所確定,黃原膠與碳黑小塊布樣的δ強度值是至少9個單位。如通過AMSA所確定,黃原膠與碳黑小塊布樣的δ強度值是至少10個單位。
在一個實施例中,可以如WO 2013/167581中所述,使用MiniLOM測定,對黃原膠與碳黑小塊布樣測量ΔRem酶值。一個優(yōu)選實施例是黃原膠與碳黑(DN31、DN31C或DN31D)小塊布樣在20℃或40℃下的使用。一個更優(yōu)選的實施例是黃原膠與碳黑(DN31C或DN31D)小塊布樣在40℃下的使用。一個甚至更優(yōu)選的實施例是黃原膠與碳黑(DN31D)小塊布樣在40℃下的使用。優(yōu)選地在460nm測量反射值。用于對用黃原膠裂解酶預處理的黃原膠具有活性的內(nèi)切葡聚糖酶和用于黃原膠裂解酶的優(yōu)選的酶濃度分別為0.5mg EP/L和1.0mg EP/L。
如通過MiniLOM所確定,黃原膠與碳黑小塊布樣的ΔRem酶值是至少1.5個單位。如通過MiniLOM所確定,黃原膠與碳黑小塊布樣的ΔRem酶值是至少1.75個單位。如通過MiniLOM所確定,黃原膠與碳黑小塊布樣的ΔRem酶值是至少2個單位。如通過MiniLOM所確定,黃原膠與碳黑小塊布樣的ΔRem酶值是至少2.25個單位。如通過MiniLOM所確定,黃原膠與碳黑小塊布樣的ΔRem酶值是至少2.5個單位。如通過MiniLOM所確定,黃原膠與碳黑小塊布樣的ΔRem酶值是至少2.75個單位。如通過MiniLOM所確定,黃原膠與碳黑小塊布樣的ΔRem酶值是至少3個單位。如通過MiniLOM所確定,黃原膠與碳黑小塊布樣的ΔRem酶值是至少3.5個單位。如通過MiniLOM所確定,黃原膠與碳黑小塊布樣的ΔRem酶值是至少4個單位。如通過MiniLOM所確定,黃原膠與碳黑小塊布樣的ΔRem酶值是至少4.5個單位。如通過MiniLOM所確定,黃原膠與碳黑小塊布樣的ΔRem酶值是至少5個單位。
本發(fā)明還涉及用于降解紡織品的表面或硬表面上的黃原膠的方法,這些方法包括向黃原膠施用包括一種或多種本發(fā)明的內(nèi)切葡聚糖酶的組合物。本發(fā)明進一步涉及用于降解紡織品的表面或硬表面上的黃原膠的方法,這些方法包括向黃原膠施用包括一種或多種黃原膠裂解酶的組合物。一個實施例是一種用于紡織品的表面或硬表面上的降解黃原膠的方法(例如餐具洗滌),該方法包括向黃原膠施用包括一種或多種本發(fā)明的內(nèi)切葡聚糖酶連同一種或多種黃原膠裂解酶的組合物。一個實施例是包括如在此描述的一種或多種洗滌劑組分的組合物。
在地下地層的壓裂(石油和/或天然氣鉆探)中的用途
使用水力壓裂來創(chuàng)造自鉆孔延伸至巖層的地下壓裂,以便增加通過地層可以產(chǎn)生的流體的流速。通常,將高粘度壓裂液以足夠壓裂地下地層的壓力泵入井中。為了維持向地層的增加的暴露,將固體支撐劑添加至壓裂液中,通過施加至流體的高壓將其帶進壓裂處。一旦高粘度壓裂液將該支撐劑帶進地層中,破碎物用于減少流體的粘度,這允許該支撐劑停留在壓裂處中并且由此增加地層向井的暴露。破碎物通過減少聚合物的分子量而工作,以此方式‘破碎’或降解聚合物。壓裂處然后變?yōu)橐环N高滲透性管道,用于有待產(chǎn)生的流體和空氣回至井中。此類過程進一步披露于美國專利號7,360,593、5,806,597、5,562,160、5,201,370以及5,067,566中。
因此,本發(fā)明涉及本發(fā)明的內(nèi)切葡聚糖酶作為酶破碎物的用途。本發(fā)明的一個實施例是本發(fā)明的內(nèi)切葡聚糖酶連同黃原膠裂解酶作為酶破碎物的用途。
因此,本發(fā)明提供了一種用于破碎鉆井孔中的黃原膠的方法,該方法包括:(i)將包括水性流體的可膠凝壓裂液、一種或多種能水合的聚合物、用于交聯(lián)能水合的聚合物以形成一種聚合物凝膠的適合的交聯(lián)劑,以及一種或多種本發(fā)明的酶(即,酶破碎物)共混在一起;(ii)將交聯(lián)聚合物凝膠在足夠壓裂周圍地層的壓力下泵入鉆井孔中;并且(iii)允許酶破碎物降解交聯(lián)聚合物,以減少流體的粘度,這樣使得可以將流體從地層泵回至井表面。因此,本發(fā)明的內(nèi)切葡聚糖酶可以用于控制壓裂液的粘度。此外,一種或多種本發(fā)明的內(nèi)切葡聚糖酶連同一種或多種黃原膠裂解酶可以用于控制壓裂液的粘度。
本發(fā)明的酶破碎物可以是壓裂液或破碎物-交聯(lián)劑-聚合物復合物的一種成分,該壓裂液或復合物進一步包括一種能水合的聚合物和一種交聯(lián)劑。壓裂液或復合物可以是一種凝膠或可以是可膠凝化的。該復合物在以下方法中是有用的,該方法用于在一種壓裂液中使用該復合物以將鉆井孔周圍的地下地層壓裂,這是通過在足夠?qū)⒅車牡叵碌貙訅毫训膲毫ο聦⒃摿黧w泵至鉆井孔中的所希望的位置。該復合物可以通過維持特定條件的pH和溫度來維持基本上非反應的狀態(tài),直到該流體被放置在鉆井孔中的時刻并且完成所希望的壓裂。一旦壓力完成,該復合物維持無活性的特定條件便不再維持。當這些條件顯著變化時,該復合物變得有活性并且破碎物開始催化聚合物降解,從而導致壓裂液變得足夠流動,以從地下地層泵至井表面。
降解黃原膠的方法,其中黃原膠用于壓裂由鉆井孔形成的地下地層
當鉆井時,儲層鉆井液(RDF)在鉆探設備內(nèi)循環(huán)以冷卻并清潔鉆頭,去除鉆井孔外的鉆屑,減少鉆柱與鉆孔的側(cè)邊之間的摩擦力,并且形成濾餅以便阻止流體滲漏進入地層中。用于形成濾餅的驅(qū)動力是應用以維持鉆孔穩(wěn)定性的較高的鉆井孔壓力。這一濾餅限制儲層流體在鉆探以及完井設備的放置過程中流入鉆井孔。如果在井竣工之前或過程中未去除在鉆探過程中造成的濾餅損傷,則當該井投入生產(chǎn)時可以出現(xiàn)一系列問題,即完井設備失敗和受損的儲層生產(chǎn)力。
鉆井液(泥漿)(也稱為儲層鉆井液(RDF))可以是合成/油基的或水基的。為了使鉆井液對地層的侵入最小化,油基和水基泥漿濾餅兩者都典型地包含一種橋接劑或增重劑,通常是碳酸鈣顆粒、重晶石或兩者的混合物,其橋接在地層的孔喉處并且由此形成相對低滲透性濾餅。油基和水基泥漿濾餅兩者還都包含在鉆探過程中帶出的稱作鉆屑的固體,與添加在鉆井液的配制品中的橋接/增重劑截然相反。這些固體可以是石英(砂)、粉砂和/或頁巖,取決于儲層地層以及由鉆探路徑至儲層穿過的地層。另外,油基鉆井泥漿包含陷于濾餅的孔域中的水滴,而水基泥漿濾餅包含聚合物,例如淀粉和黃原膠,以及其他無機鹽。
形成泥漿濾餅對于鉆探而言通常是必須的,特別是在具有鉆井孔穩(wěn)定性問題并且典型地具有高滲透性的疏松地層中。然后將濾餅用不同化學品處理,例如螯合劑或酸,以溶解方解石組分;和/或酶或氧化劑,以降解聚合物組分,從而恢復滲透性。
在一個方面中,本發(fā)明提供了一種用于降解黃原膠的方法,其中黃原膠用于壓裂由鉆井孔造成的地下地層,該方法是通過應用包括一種或多種本發(fā)明的酶的組合物。該方法可以包括以下步驟:(i)將包括一種或多種本發(fā)明的酶的處理流體泵入與有待去除的濾餅接觸的鉆孔中,以在該處理流體與鄰接該濾餅的地層之間建立不同的壓力并且(ii)在不同的壓力周期過程中均勻地傳播濾餅的處理,以通過該處理流體延遲突破。
在一個實施例中,該方法包括在地層與鉆孔之間通過處理的濾餅建立滲透性。在另一個實施例中,該濾餅可以包括鉆井固體和黏土,并且可以形成自水性鉆井液。如果希望的話,用于處理水性鉆井液濾餅的處理流體還可以包括一種氧化劑和/或螯合劑,或它可以是基本上不含螯合劑和氧化劑添加劑的。在另一個實例中,該濾餅可以形成自油或反相乳化鉆井液。如果希望的話,用于處理油或反相乳化鉆井液濾餅的處理流體還可以包括互溶劑、水潤濕劑或其組合,從而將疏水性組分分散在濾餅中。
在一個實施例中,該處理流體包括一種或多種本發(fā)明的內(nèi)切葡聚糖酶。在另一個實施例中,該處理流體包括一種或多種黃原膠裂解酶。在一個優(yōu)選實施例中,該處理流體包括一種或多種內(nèi)切葡聚糖酶以及一種或多種黃原膠裂解酶。
降解黃原膠的方法,其中黃原膠是鉆孔濾餅中的一種組分
在一個方面中,本發(fā)明提供了一種一旦鉆孔濾餅被泵至表面,用于清潔該濾餅的方法,該濾餅包括聚合物,例如黃原膠和鉆井液固體。鉆井泥漿從泥漿池泵至鉆頭然后再泵出至表面,在該過程中帶出除其他東西之外的破碎的或切碎的巖石(鉆屑)。將鉆屑濾出并且將泥漿返回至泥漿池,在泥漿池中細??梢猿恋砗?或可以將添加化學品或酶(破碎物)進行添加。
用于降解黃原膠的方法(其中黃原膠是鉆孔濾餅中的一種組分)可以包括以下步驟:(i)用一種處理流體處理該鉆孔濾餅,該處理流體包括一種或多種本發(fā)明的酶并且(ii)將固體與流體分離。在一個實施例中,該處理流體包括一種或多種本發(fā)明的內(nèi)切葡聚糖酶。在另一個實施例中,該處理流體包括一種或多種黃原膠裂解酶。在一個優(yōu)選實施例中,該處理流體包括一種或多種本發(fā)明的內(nèi)切葡聚糖酶以及一種或多種黃原膠裂解酶。
可以將鉆孔濾餅在泥漿池中用一種或多種本發(fā)明的酶處理并且可以再循環(huán)鉆井液??商娲?,一旦濾餅已經(jīng)被一種或多種本發(fā)明的酶處理,使用固液分離方法(例如離心)將固體與流體分離。
在加工纖維素材料中的用途
本發(fā)明的多肽的內(nèi)切葡聚糖酶活性也可用于降解或轉(zhuǎn)化纖維素材料,包括:用包括本發(fā)明的多肽的酶組合物處理纖維素材料。在一個優(yōu)選方面,該方法進一步包括對降解的或轉(zhuǎn)化的纖維素材料進行回收。
本發(fā)明還涉及產(chǎn)生一種發(fā)酵產(chǎn)物的方法,這些方法包括:(a)在本發(fā)明的多肽的存在下,用一種酶組合物使纖維素材料糖化;(b)用一種或多種(若干種)發(fā)酵微生物發(fā)酵該糖化的纖維素材料,以產(chǎn)生該發(fā)酵產(chǎn)物;并且(c)從該發(fā)酵中回收該發(fā)酵產(chǎn)物。
本發(fā)明還涉及發(fā)酵纖維素材料的方法,這些方法包括:用一種或多種(若干種)發(fā)酵微生物發(fā)酵該纖維素材料,其中在本發(fā)明的多肽的存在下,用一種酶組合物糖化該纖維素材料。在一個優(yōu)選方面,發(fā)酵該纖維素材料產(chǎn)生一種發(fā)酵產(chǎn)物。在另一個優(yōu)選方面,該方法進一步包括從發(fā)酵中回收發(fā)酵產(chǎn)物。
本發(fā)明的方法可被用于將一種纖維素材料糖化成可發(fā)酵糖,并且將這些可發(fā)酵糖轉(zhuǎn)化成許多有用的物質(zhì),例如燃料、飲用乙醇、和/或發(fā)酵產(chǎn)物(例如酸類、醇類、酮類、氣體等)。由該纖維素材料產(chǎn)生所希望的發(fā)酵產(chǎn)物典型地涉及預處理、酶水解(糖化)、以及發(fā)酵。
根據(jù)本發(fā)明,可以使用本領域常規(guī)的過程來完成纖維素材料的加工。此外,可以使用被配置為根據(jù)本發(fā)明進行操作的常規(guī)生物質(zhì)加工裝置來實施本發(fā)明的方法。
分開或同時的水解(糖化)和發(fā)酵包括但不限于:分開水解和發(fā)酵(SHF)、同時糖化和發(fā)酵(SSF)、同時糖化和共發(fā)酵(SSCF)、雜合的水解和發(fā)酵(HHF)、分開水解和共發(fā)酵(SHCF)、雜合的水解和共發(fā)酵(HHCF),以及直接微生物轉(zhuǎn)化(DMC)。
常規(guī)裝置可以包括補料分批攪拌反應器、分批攪拌反應器、具有超過濾的連續(xù)流攪拌反應器、和/或連續(xù)活塞流動柱反應器(柯瑞芝(Corazza)等人,2003,用于纖維二糖水解的補料分批反應器中的最佳控制(Optimal control in fed-batch reactor for the cellobiose hydrolysis),技術學報(Acta Scientiarum.Technology)25:33-38;古薩科夫(Gusakov)和辛涅特西(Sinitsyn),1985,纖維素酶水解動力學:1.用于分批反應器過程的數(shù)學模型(Kinetics of the enzymatic hydrolysis of cellulose:1.Amathematicalmodel for a batch reactor process),酶與微生物技術(Enz.Microb.Technol.)7:346-352),研磨反應器(隆(Ryu)和李(Lee),1983,通過使用研磨生物反應器,生物轉(zhuǎn)化廢物纖維素(Bioconversion of waste cellulose by using an attrition bioreactor),生物技術和生物工程(Biotechnol.Bioeng)25:53-65),或具有電場誘導的有力攪拌的反應器(古薩科夫(Gusakov)等人,1996,使用具有電場誘導的有力攪拌的新穎類型的生物反應器的纖維素酶水解的增強(Enhancement of enzymatic cellulose hydrolysis using anovel type of bioreactor with intensive stirring induced by electromagnetic field),應用生物化學與生物技術(Appl.Biochem.Biotechnol.)56:141-153)。另外的反應器類型包括:流化床,升流包覆層(blanket),固定化、以及用于水解和/或發(fā)酵的擠出機類型的反應器。
預處理。在實踐本發(fā)明的方法中,可以使用本領域已知的任何預處理過程來破壞纖維素材料的細胞壁組分(錢德拉(Chandra)等人,2007,底物預處理:木質(zhì)纖維素的有效酶水解的關鍵?(The key to effective enzymatic hydrolysis of lignocellulosics?)《生物化學工程/生物技術進展》(Adv.Biochem.Engin./Biotechnol.)108:67-93;加爾布(Galbe)和朱奇(Zacchi),2007,用于生物乙醇有效生產(chǎn)的不是纖維素材料的預處理(Pretreatment of lignocellulosic materials for efficient bioethanol production),《生物化學工程/生物技術進展》(Adv.Biochem.Engin./Biotechnol.)108:41-65;亨德里克斯(Hendriks)和塞曼(Zeeman),2009,預處理以增強木質(zhì)纖維素生物質(zhì)的可消化性(Pretreatments to enhance the digestibility of lignocellulosic biomass),《生物資源技術》(Bioresource Technol.)100:10-18;莫熱(Mosier)等人,2005,用于預處理木質(zhì)纖維素生物質(zhì)前景技術的特征(Features of promising technologies for pretreatment of lignocellulosic biomass),《生物資源技術》(Bioresource Technol.)96:673-686;塔赫扎德(Taherzadeh)和卡里米(Karimi),2008,預處理木質(zhì)纖維素廢物來改進乙醇和生物氣生產(chǎn):綜述(Pretreatment of lignocellulosic wastes to improve ethanol and biogas production:A review)《分子科學國際期刊》(Int.J.of Mol.Sci.)9:1621-1651;楊(Yang)和懷曼(Wyman),2008,預處理:用來解鎖低成本纖維素乙醇的關鍵(Pretreatment:the key to unlocking low-cost cellulosic ethanol),《生物燃料、生物產(chǎn)品與生物精煉》(Biofuels Bioproducts and Biorefining-Biofpr.)2:26-40)。
纖維素材料也可以在預處理之前使用本領域中已知的方法進行顆粒尺寸減縮、預浸泡、潤濕、洗滌、或調(diào)理。
常規(guī)預處理包括但不限于:蒸汽預處理(伴隨或不伴隨爆炸)、稀酸預處理、熱水預處理、堿預處理、石灰預處理、濕氧化、濕爆炸、氨纖維爆炸、有機溶劑預處理、以及生物預處理。另外的預處理包括氨滲濾、超聲、電穿孔、微波、超臨界CO2、超臨界H2O、臭氧、以及γ輻射預處理。
可以在水解和/或發(fā)酵前預處理纖維素材料。優(yōu)選在水解前進行預處理??商娲?,預處理可以與酶水解同時進行,以釋放可發(fā)酵的糖,例如葡萄糖、木糖、和/或纖維二糖。在多數(shù)情況下,預處理步驟自身導致將生物質(zhì)轉(zhuǎn)化為可發(fā)酵糖(即使在沒有酶的情況下)。
蒸汽預處理。在蒸汽預處理中,加熱纖維素材料以破壞植物細胞壁組分,包括木質(zhì)素、半纖維素、以及纖維素,以使酶可接觸纖維素和其他級分,例如,半纖維素。使纖維素材料經(jīng)過或通過反應容器,其中注入蒸汽以將溫度增加至所需的溫度和壓力,并且在其中保持所希望的反應時間。蒸汽預處理優(yōu)選在140℃-230℃,更優(yōu)選160℃-200℃,并且最優(yōu)選170℃-190℃下進行,其中最優(yōu)的溫度范圍取決于任何化學催化劑的添加。蒸汽預處理的停留時間優(yōu)選1-15分鐘,更優(yōu)選3-12分鐘,并且最優(yōu)選4-10分鐘,其中最優(yōu)的停留時間依賴于溫度范圍和任何化學催化劑的添加。蒸汽預處理允許相對較高的固體加載量,這樣使得纖維素材料在預處理過程中通常僅變得潮濕。蒸汽預處理經(jīng)常與預處理后的材料的爆發(fā)放料(explosive discharge)合并,這被稱為蒸汽爆炸,即,快速急驟蒸發(fā)至大氣壓和材料的湍流,以通過破碎增加可接觸的表面積(Duff(迪福)和Murray(默里),1996,生物資源技術855:1-33;蓋爾貝和賽琪,2002,Appl.Microbiol.Biotechnol.(應用微生物學與生物技術)59:618-628;美國專利申請?zhí)?0020164730)。在蒸汽預處理過程中,半纖維素乙?;涣呀?,并且得到的酸自催化半纖維素部分水解成單糖和寡糖。僅在有限的程度上去除木質(zhì)素。
經(jīng)常在蒸汽預處理之前添加催化劑(例如H2SO4或SO2)(典型地是0.3%至3%w/w),該催化劑減少時間并降低溫度、增加回收率、并改進酶水解(巴列斯特羅斯(Ballesteros)等人,2006,應用生物化學與生物技術129-132:496-508;瓦爾加(Varga)等人,2004,應用生物化學與生物技術113-116:509-523;塞斯尼爾(Sassner)等人,2006,酶與微生物技術(Enzyme Microb.Technol.)39:756-762)。
化學預處理:術語“化學處理”是指促進纖維素、半纖維素和/或木質(zhì)素的分離和/或釋放的任何化學預處理。適合的化學預處理方法的實例包括(例如稀酸預處理、石灰預處理、濕氧化、氨纖維/冷凍爆炸(AFEX)、氨滲濾(APR)、以及有機溶劑預處理。
在稀酸預處理中,纖維素材料與稀酸(典型地是H2SO4)和水混合,以形成漿液,由蒸汽加熱至希望的溫度,并且在停留時間后急驟蒸發(fā)至大氣壓。可以用多種反應器設計進行稀酸預處理,例如塞流反應器、逆流反應器、或連續(xù)逆流收縮床反應器(達夫(Duff)和默里(Murray),1996,見上文;謝爾(Schell)等人,2004,生物資源技術(BioresourceTechnol.)91:179-188;李(Lee)等人,1999,生物化學工程與生物技術進展(Adv.Biochem.Eng.Biotechnol.)65:93-115)。
還可以使用在堿性條件下的若干種預處理方法。這些堿性預處理包括但不限于:石灰預處理、濕氧化、氨滲濾(APR)、以及氨纖維/冷凍爆炸(AFEX)。
用碳酸鈣、氫氧化鈉、或氨,在85℃-150℃的低溫下進行石灰預處理,并且停留時間為從1小時到幾天(懷曼(Wyman)等人,2005,生物資源技術(Bioresource Technol.)96:1959-1966;莫熱(Mosier)等人,2005,生物資源技術96:673-686)。WO 2006/110891、WO 2006/110899、WO 2006/110900以及WO 2006/110901披露了使用氨的預處理方法。
濕氧化是典型地在加入如過氧化氫等氧化劑或過壓的氧氣、在180℃-200℃下進行5-15分鐘的熱預處理(施密特(Schmidt)和湯姆森(Thomsen),1998,生物資源技術(Bioresource Technol.)64:139-151;帕隆恩(Palonen)等人,2004,應用生物化學與生物技術(Appl.Biochem.Biotechnol.)117:1-17;瓦爾加(Varga)等人,2004,生物技術與生物工程(Biotechnol.Bioeng.)88:567-574;馬丁(Martin)等人,2006,化學技術與生物技術雜志(J.Chem.Technol.Biotechnol.)81:1669-1677)。預處理優(yōu)選以1%至40%干物質(zhì),更優(yōu)選2%至30%干物質(zhì),并且最優(yōu)選5%至20%干物質(zhì)進行,并且經(jīng)常通過添加堿如碳酸鈉來增加初始pH。
被稱為濕爆炸(濕氧化和蒸汽爆炸的組合)的濕氧化預處理方法的修改方案能夠處理高達30%的干物質(zhì)。在濕爆炸中,在某一停留時間后,在預處理過程中引入氧化劑。然后通過急驟蒸發(fā)至大氣壓結(jié)束預處理(WO 2006/032282)。
氨纖維爆炸(AFEX)涉及用液態(tài)或氣態(tài)氨在中等溫度(例如90℃-100℃)和高壓(例如17-20巴)下處理纖維素材料,持續(xù)5-10分鐘,其中干物質(zhì)含量可以高達60%(戈拉帕里(Gollapalli)等人,2002,應用生物化學與生物技術(Appl.Biochem.Biotechnol.)98:23-35;丘恩達瓦特(Chundawat)等人,2007,生物技術與生物工程(Biotechnol.Bioeng.)96:219-231;阿里扎德(Alizadeh)等人,2005,應用生物化學與生物技術(Appl.Biochem.Biotechnol.)121:1133-1141;泰莫里(Teymouri)等人,2005,生物資源技術(Bioresource Technol.)96:2014-2018)。AFEX預處理導致纖維素的解聚和半纖維素的部分水解。木質(zhì)素-碳水化合物復合物被裂解。
有機溶劑預處理通過使用含水乙醇(40%-60%乙醇)在160℃-200℃下萃取30-60分鐘而將纖維素材料脫木質(zhì)素(潘(Pan)等人,2005,生物技術與生物工程(Biotechnol.Bioeng.)90:473-481;潘等人,2006,生物技術與生物工程94:851-861;庫拉比(Kurabi)等人,2005,應用生物化學與生物技術(Appl.Biochem.Biotechnol.)121:219-230)。通常加入硫酸作為催化劑。在有機溶劑預處理中,大部分半纖維素被去除。
適合的預處理方法的其他實例由謝爾(Schell)等人,2003,應用生物化學與生物技術(Appl.Biochem.and Biotechnol.)105-108:69-85,和馬塞爾(Mosier)等人,2005,生物資源技術(Bioresource Technology)96:673-686,以及美國公開申請?zhí)?002/0164730進行描述。
在一個方面中,化學預處理優(yōu)選是以酸處理進行,并且更優(yōu)選持續(xù)稀酸和/或弱酸處理。酸通常是硫酸,但也可以使用其他酸,如乙酸、檸檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氫、或其混合物。弱酸處理優(yōu)選在1-5,更優(yōu)選1-4,并且最優(yōu)選1-3的pH范圍內(nèi)進行。在一個方面中,該酸濃度在優(yōu)選從0.01wt%至20wt%酸,更優(yōu)選0.05wt%至10wt%酸,甚至更優(yōu)選0.1wt%至5wt%酸,并且最優(yōu)選0.2wt%至2.0wt%酸的范圍中。使酸與纖維素材料相接觸,并在優(yōu)選160℃-220℃,并且更優(yōu)選165℃-195℃范圍內(nèi)的溫度下保持從幾秒到幾分鐘,例如1秒至60分鐘范圍內(nèi)的時間。
在另一個方面中,預處理是作為氨纖維爆炸步驟(AFEX預處理步驟)進行。
在另一個方面中,預處理在水性漿料中進行。在優(yōu)選的方面,在預處理過程中纖維素材料以優(yōu)選10wt%-80wt%之間,更優(yōu)選20wt%-70wt%之間,并且最優(yōu)選30wt%-60wt%之間,例如50wt%左右的量存在??梢允褂帽绢I域已知的任何方法不洗滌或洗滌預處理的纖維素材料,例如用水洗滌。
機械預處理:術語“機械預處理”是指各種類型的研磨或碾磨(例如,干磨、濕磨、或振動球磨)。
物理預處理:術語“物理預處理”是指促進纖維素、半纖維素、和/或木質(zhì)素從纖維素材料中分離和/或釋放的任何預處理。例如,物理預處理可包括輻射(例如微波輻射)、汽蒸/蒸汽爆炸、水熱解及其組合。
物理預處理可以包括高壓和/或高溫(蒸汽爆炸)。在一個方面中,高壓意指在優(yōu)選約300至約600psi,更優(yōu)選約350至約550psi,并且最優(yōu)選約400至約500psi,例如450psi左右的范圍中的壓力。在另一個方面中,高溫意指在約100℃至約300℃,優(yōu)選約140℃至約235℃范圍內(nèi)的溫度。在一個優(yōu)選方面,在分批過程中,以蒸汽槍水解器系統(tǒng)(例如從順智公司(Sunds Defibrator AB),瑞典(Sweden)可獲得的Sunds水解器(Sunds Hydrolyzer))來進行機械預處理,該系統(tǒng)使用如上所定義的高壓和高溫。
組合的物理和化學預處理:纖維素材料可以物理地并且且化學地預處理。例如,該預處理步驟可包括稀酸或弱酸預處理以及高溫和/或高壓處理。這些物理預處理和化學預處理可以根據(jù)需要順序地進行或同時進行。也可以包括機械預處理。
因此,在一個優(yōu)選方面中,使纖維素材料經(jīng)受機械、化學或物理預處理、或其任何組合,以促進纖維素、半纖維素、和/或木質(zhì)素的分離和/或釋放。
生物預處理:術語“生物預處理”是指促進纖維素、半纖維素、和/或木質(zhì)素從纖維素材料中分離和/或釋放的任何生物預處理。生物預處理技術可以涉及應用溶解木質(zhì)素的微生物(參見,例如,舒·T.-A.(Hsu,T.-A.),1996,生物質(zhì)的預處理(Pretreatment of biomass),生物乙醇手冊:生產(chǎn)和利用,懷曼·C.E.編輯,泰勒-弗朗西斯出版集團,華盛頓特區(qū),179-212;高希(Ghosh)和辛格(Singh),1993,用于纖維素生物質(zhì)的酶/微生物轉(zhuǎn)化的物理化學與生物處理(Physicochemical and biological treatments for enzymatic/microbial conversion of cellulosic biomass),應用微生物學進展(Adv.Appl.Microbiol.)39:295-333;麥克米蘭·J.D.(McMillan,J.D.),1994,預處理木質(zhì)纖維素生物質(zhì):綜述(Pretreating lignocellulosic biomass:a review),用于燃料生產(chǎn)的生物質(zhì)的酶轉(zhuǎn)化(Enzymatic Conversion of Biomass for Fuels Production),希默爾·M.E.、貝克·J.O.、以及奧弗倫·R.P.(Overend,R.P.)編輯,美國化學學會討論會系列566(ACS Symposium Series 566),美國化學學會(American Chemical Society),華盛頓特區(qū),第15章;貢·C.S.(Gong,C.S.)、卡奧·N.J.(Cao,N.J.)、杜·J.(Du,J.)、以及曹·G.T.(Tsao,G.T.),1999,由可再生資源生產(chǎn)乙醇(Ethanol production from renewable resources),生物化學工程/生物技術的進展,舍佩爾·T.編輯,施普林格出版社德國海德堡柏林(Berlin Heidelberg,Germany),65:207-241);奧爾森(Olsson)和哈恩-哈格達爾(Hahn-Hagerdal),1996,用于乙醇生產(chǎn)的木質(zhì)纖維素水解物的發(fā)酵(Fermentation of lignocellulosic hydrolysates for ethanol production),酶與微生物技術(Enz.Microb.Tech.)18:312-331;以及瓦藍德(Vallander)和埃里克松(Eriksson),1990,由木質(zhì)纖維素材料生產(chǎn)乙醇:技術現(xiàn)狀(Production of ethanol from lignocellulosic materials:State of the art),生物化學工程/生物技術的進展42:63-95)。
糖化。在水解步驟(還稱為糖化)中,將(例如預處理的)纖維素材料水解,以將纖維素以及可替代地還有半纖維素分解成可發(fā)酵糖,如葡萄糖、纖維二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖、和/或可溶性寡糖。水解由酶組合物在本發(fā)明的多肽的存在下酶促進行。該組合物可進一步包括一種或多種(若干種)半纖維素分解酶或木聚糖降解酶。還可順序地添加這些組合物的酶。
酶水解優(yōu)選在易于由本領域技術人員確定的條件下、在合適的含水環(huán)境中執(zhí)行。在一個優(yōu)選方面中,水解在適合于一種或多種酶的活性,即對于該一種或多種酶而言最佳的條件下進行。水解可以作為分批補料過程或連續(xù)過程進行,其中將預處理的纖維素材料(底物)逐漸補料至例如含酶的水解溶液中。
糖化通常在受控的pH、溫度以及混合條件下在攪拌釜反應器或發(fā)酵罐中進行。適合的處理時間、溫度以及pH條件可以由本領域技術人員容易地確定。例如,糖化可以持續(xù)長達200小時,但是典型地進行優(yōu)選約12至約96小時,更優(yōu)選約16至約72小時,并且最優(yōu)選約24至約48小時。溫度優(yōu)選約25℃至約70℃,更優(yōu)選約30℃至約65℃,并且最優(yōu)選約40℃至約60℃,特別是約50℃。pH在優(yōu)選約3至約8,更優(yōu)選約3.5至約7,并且最優(yōu)選約4至約6、具體地約pH 5的范圍中。干燥固體含量在優(yōu)選約5wt%至約50wt%,更優(yōu)選約10wt%至約40wt%,并且最優(yōu)選約20wt%至約30wt%的范圍中。
該酶組合物優(yōu)選地包括多種具有纖維素分解活性和/或木聚糖降解活性的酶。在一個方面中,該酶組合物包括一種或多種(若干種)纖維素分解酶。在另一個方面中,該酶組合物包括一種或多種(若干種)木聚糖降解酶。在另一個方面中,該酶組合物包括一種或多種(若干種)纖維素分解酶和一種或多種(若干種)木聚糖降解酶。
該一種或多種(若干種)纖維素分解酶優(yōu)選是選自下組,該組由以下各項組成:內(nèi)切葡聚糖酶、纖維二糖水解酶、以及β-葡糖苷酶。該一種或多種(若干種)木聚糖降解酶優(yōu)選是選自下組,該組由以下各項組成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
在另一個方面中,該酶組合物進一步或甚至進一步包括具有纖維素分解增強活性的多肽(參見,例如WO 2005/074647、WO 2005/074656、以及WO 2007/089290)。在另一個方面中,該酶組合物可以進一步或甚至進一步包括一種或多種(若干種)另外的酶活性以改進含纖維素材料的降解。優(yōu)選的另外的酶是半纖維素酶(例如α-D-葡糖醛酸糖苷酶、α-L-阿拉伯呋喃糖苷酶、內(nèi)切-甘露聚糖酶、β-甘露糖苷酶、α-半乳糖苷酶、內(nèi)切-α-L-阿拉伯聚糖酶、β-半乳糖苷酶)、碳水化合物-酯酶(例如乙?;?木聚糖酯酶、乙?;?甘露聚糖酯酶、阿魏酸酯酶、香豆酸酯酶、葡萄糖醛酸酯酶)、果膠酶、蛋白酶、木質(zhì)素分解酶(例如漆酶、錳過氧化物酶、木質(zhì)素過氧化物酶、H2O2生產(chǎn)酶、氧化還原酶)、擴張蛋白、膨脹素、或其混合物。在本發(fā)明的方法中,可以在發(fā)酵之前或過程中,例如在糖化過程中,或在發(fā)酵微生物的繁殖過程中或之后添加這一種或多種另外的酶。
該酶組合物的一種或多種(若干種)組分可以是野生型蛋白、重組蛋白、或野生型蛋白與重組蛋白的組合。例如,一種或多種(若干種)組分可以是用作宿主細胞以重組表達該酶組合物的一種或多種(若干種)其他組分的細胞的原生蛋白質(zhì)。該酶組合物的一種或多種(若干種)組分可以作為單組分產(chǎn)生,然后將這些單組分組合以形成該酶組合物。酶組合物可以是多組分和單組分蛋白制劑的組合。
用于本發(fā)明的方法中的酶可以處于適合用于此處所述的過程中的任何形式,例如像去除或未去除細胞的粗發(fā)酵液、具有或不具有細胞碎片的細胞裂解液、半純化的或純化的酶制劑、或作為酶來源的宿主細胞。酶組合物可以是干粉或顆粒、非塵顆粒、液體、穩(wěn)定化的液體、或穩(wěn)定化的受保護的酶??梢愿鶕?jù)已建立的方法例如通過添加穩(wěn)定劑(如糖、糖醇或其他多元醇)、和/或乳酸或另一種有機酸,對液體酶制劑進行穩(wěn)定化。
在下面各段中對本發(fā)明進行了進一步的概述:
1.一種具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠具有活性的多肽,該多肽選自下組,該組由以下各項組成:
(a)與SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽;
(b)由多核苷酸編碼的多肽,該多核苷酸在中嚴格條件下與(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項的成熟多肽編碼序列,(ii)(i)的全長補體雜交;
(c)由多核苷酸編碼的多肽,該多核苷酸與SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項的成熟多肽編碼序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(d)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽的變體,該變體在一個或多個位置包括取代、缺失、和/或插入;和
(e)(a)、(b)、(c)、或(d)的多肽的片段,該片段具有內(nèi)切葡聚糖酶活性并且對用黃原膠裂解酶預處理的黃原膠具有活性。
2.如段落1所述的多肽,與SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
3.如段落1或2中任一項所述的多肽,該多肽由多核苷酸編碼,該多核苷酸在中-高嚴格條件下與(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項的成熟多肽編碼序列,或(ii)(i)的全長補體雜交;
4.如段落1-3中任一項所述的多肽,該多肽由多核苷酸編碼,該多核苷酸與SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、和SEQ ID NO:39中任一項的成熟多肽編碼序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
5.如段落1-4中任一項所述的多肽,由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項或SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽組成。
6.如段落1-4中任一項所述的多肽,包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項或SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽。
7.如段落1-4中任一項所述的多肽,該多肽是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的成熟多肽的一種變體,該變體在一個或多個位置,例如高達10個,例如,1、2、3、4、5、6、7、8、9、或10個位置包括取代、缺失、和/或插入。
8.如段落1至7所述的多肽,該多肽是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、和SEQ ID NO:40中任一項的片段,其中該片段具有內(nèi)切葡聚糖酶活性并且對用黃原膠裂解酶預處理的黃原膠具有活性。
9.如段落1至8中任一項所述的多肽,其中該成熟多肽是SEQ ID NO:2中位置1至813中所示的多肽,SEQ ID NO:4中位置1至836中所示的多肽,SEQ ID NO:6中位置1至949中所示的多肽,SEQ ID NO:8中位置1至830中所示的多肽,SEQ ID NO:10中位置1至866中所示的多肽,SEQ ID NO:12中位置1至827中所示的多肽,SEQ ID NO:14中位置1至903中所示的多肽,SEQ ID NO:16中位置1至932中所示的多肽,SEQ ID NO:18中位置1至920中所示的多肽,SEQ ID NO:20中位置1至844中所示的多肽,SEQ ID NO:22中位置1至849中所示的多肽,SEQ ID NO:24中位置1至903中所示的多肽,SEQ ID NO:26中位置1至894中所示的多肽,SEQ ID NO:28中位置1至894中所示的多肽,SEQ ID NO:30中位置1至955中所示的多肽,SEQ ID NO:32中位置1至894中所示的多肽,SEQ ID NO:34中位置1至893中所示的多肽,SEQ ID NO:36中位置1至894中所示的多肽,SEQ ID NO:38中位置1至894中所示的多肽,和SEQ ID NO:40中位置1至867中所示的多肽中的任一項。
10.一種編碼如段落1-9中任一項所述的多肽的多核苷酸。
11.一種核酸構(gòu)建體或表達載體,該核酸構(gòu)建體或表達載體包括如段落10所述的多核苷酸,該多核苷酸可操作地連接至指導多肽在表達宿主內(nèi)產(chǎn)生的一個或多個控制序列。
12.一種重組宿主細胞,該重組宿主細胞包括如段落10所述的多核苷酸,該多核苷酸可操作地連接至指導多肽的產(chǎn)生的一個或多個控制序列。
13.一種產(chǎn)生如段落1-9中任一項所述的多肽的方法,該方法包括:在有益于產(chǎn)生該多肽的條件下培養(yǎng)細胞,該細胞以其野生型形式產(chǎn)生該多肽。
14.如段落13所述的方法,該方法進一步包括回收該多肽。
15.一種產(chǎn)生具有內(nèi)切葡聚糖酶活性和/或?qū)τ命S原膠裂解酶預處理的黃原膠具有活性的多肽的方法,該方法包括在有益于產(chǎn)生該多肽的條件下培養(yǎng)如段落12所述的宿主細胞。
16.一種用編碼如段落1-9中任一項所述的多肽的多核苷酸轉(zhuǎn)化的轉(zhuǎn)基因植物、植物部分或植物細胞。
17.一種產(chǎn)生對用黃原膠裂解酶預處理的黃原膠具有內(nèi)切葡聚糖酶活性和/或具有活性的多肽的方法,該方法包括在有益于產(chǎn)生該多肽的條件下培養(yǎng)如段落16所述的轉(zhuǎn)基因植物或植物細胞。
18.如段落17所述的方法,該方法進一步包括回收該多肽。
19.一種包括如段落1-9中任一項所述的多肽的全培養(yǎng)液配制品或細胞培養(yǎng)組合物。
20.一種包括如段落1-9中任一項所述的多肽的組合物。
21.如段落20所述的組合物,該組合物進一步包括具有黃原膠裂解酶活性的多肽。
22.如段落20或21中任一項所述的組合物,該組合物是洗滌劑組合物,該洗滌劑組合物包括一種或多種洗滌劑組分。
23.如段落20-22中任一項所述的組合物,其中這些洗滌劑組分選自下組,該組包括表面活性劑、助洗劑、助水溶劑、漂白系統(tǒng)、聚合物、織物調(diào)色劑、輔料、分散劑、染料轉(zhuǎn)移抑制劑、熒光增白劑以及污垢釋放聚合物,或其任何混合物。
24.如段落20-23中任一項所述的組合物,其中該洗滌劑組合物處于以下形式:棒,均勻的片劑,具有兩個或更多個層的片劑,具有一個或多個室的袋,規(guī)則的或壓縮的粉末,顆粒,膏,凝膠,或規(guī)則的、壓縮的或濃縮的液體。
25.如段落20-23中任一項所述的組合物用于降解黃原膠的用途。
26.如段落25所述的用途,用于控制鉆井液的粘度。
27.如段落24所述的用途,用于洗滌或清潔紡織品和/或硬表面,例如餐具洗滌。
28.如段落24所述的用途,其中該洗滌劑組合物具有酶洗滌益處。
29.一種用于降解黃原膠的方法,該方法包括向黃原膠施用根據(jù)段落20-24中任一項所述的組合物。
30.如段落29所述的方法,其中該黃原膠在紡織品的表面上或硬表面上,例如餐具洗滌。
31.如段落29所述的方法,其中該黃原膠在由鉆井孔穿透的地下地層的壓裂中使用。
32.如段落29所述的方法,其中該黃原膠是鉆孔濾餅中的組分。
33.一種用于降解或轉(zhuǎn)化纖維素材料的方法,該方法包括:用根據(jù)段落20-24中任一項所述的酶組合物或在如段落1-9中任一項所述的多肽的存在下處理纖維素材料。
34.如段落33所述的方法,其中該纖維素材料是經(jīng)預處理的。
35.如段落32或33所述的方法,其中該酶組合物包括選自下組的一種或多種酶,該組由以下各項組成:纖維素酶、具有纖維素分解增強活性的多肽、半纖維素酶、酯酶、蛋白酶、漆酶、或過氧化物酶。
36.如段落35所述的方法,其中該纖維素酶是選自下組的一種或多種酶,該組由以下各項組成:內(nèi)切葡聚糖酶、纖維二糖水解酶、以及β-葡糖苷酶。
37.如段落35所述的方法,其中該半纖維素酶是選自下組的一種或多種酶,該組由以下各項組成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
38.如段落33-37中任一項所述的方法,其進一步包括回收降解的纖維素材料。
39.如段落38所述的方法,其中該降解的纖維素材料是糖,該糖優(yōu)選地選自下組,該組由以下各項組成:葡萄糖、木糖、甘露糖、半乳糖\以及阿拉伯糖。
40.一種用于產(chǎn)生發(fā)酵產(chǎn)物的方法,包括:
(a)在如段落1-9中任一項所述的多肽的存在下,用酶組合物對纖維素材料進行糖化;
(b)用一種或多種發(fā)酵微生物對該糖化的纖維素材料進行發(fā)酵,以產(chǎn)生該發(fā)酵產(chǎn)物;和
(c)從該發(fā)酵中回收該發(fā)酵產(chǎn)物。
通過以下實例進一步描述本發(fā)明,這些實例不應當解釋為限制本發(fā)明的范圍。
實例
實例1:搜索和鑒定假定的內(nèi)切葡聚糖酶基因
基于專利申請?zhí)朎P14170186.2的SEQ ID NO 2中披露的內(nèi)切葡聚糖酶和UniProt release2013_04(貝羅奇(Bairoch)等人,2005)以及內(nèi)部數(shù)據(jù)庫中最接近的同系物,通過提取每種纖維素酶的C末端部分,使用MAFFT(加藤(Katoh),2002)創(chuàng)建多重比對,并使用HMMER3的hmmbuild(埃迪(Eddy),2011)構(gòu)建HMM,來產(chǎn)生隱馬爾科夫模型(HMM)。保守結(jié)構(gòu)域的HMMER3的hmmsearch(埃迪,2011)發(fā)現(xiàn)了從DOE聯(lián)合基因組研究所(DOE Joint Genome Institute),NCBI(國家生物技術信息中心(National Center for Biotechnology Information),核酸研究(Nucleic Acids Res.)2009年1月)和歐洲核苷酸檔案(萊諾寧(Leinonen),核酸研究,2011年1月)可獲得的公眾可獲得的基因組的和宏基因組的組裝中的334個同系物。使用以下參數(shù)對blast命中(Blast hit)進行分類:覆蓋>50%,二進制值>50和E值<1e-05。
實例2:內(nèi)切葡聚糖酶編碼基因的生物信息學分析
通過針對Pfam數(shù)據(jù)庫(M.蓬塔(Punta),P.C.可希爾(Coggill),R.Y.埃伯哈特(Eberhardt),J.米斯特里(Mistry),J.塔特(Tate),C.博斯耐爾(Boursnell),N.龐(Pang),K.福斯盧德(Forslund),G.賽利克(Ceric),J.克萊門茨(Clements),A.赫格爾(Heger),L.霍爾姆(Holm),E.L.L.梭哈摩爾(Sonnhammer),S.R.埃迪,A.貝特曼(Bateman),R.D.費恩(Finn).Pfam:蛋白質(zhì)家族數(shù)據(jù)庫(the protein families database),核酸研究(Nucleic Acids Research)(2014)數(shù)據(jù)庫問題(Database Issue)42:D222-D230)的氨基酸序列(SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40)的blast搜索和通過與專利申請?zhí)朎P14170186.2的SEQ ID NO 2中披露的內(nèi)切葡聚糖酶的氨基酸序列比對,來進一步將通過實例1中描述的程序選擇的二十個分子分類。在一些情況下,針對Pfam數(shù)據(jù)庫的blast搜索鑒定了相關性非常遠的Pfam PF00150結(jié)構(gòu)域,該結(jié)構(gòu)域具有剛好高于由Pfam定義的噪聲截止值的%序列一致性和HMM得分(%序列截止值為20.7%,并且HMM得分截止值為20.7)。在大多數(shù)情況下,%序列一致性低于噪聲截止值。此外,相關性遠的PF00150結(jié)構(gòu)域僅是部分的,跨越在定義為在監(jiān)管下的模型長度和在Pfam主頁(pfam.sanger.ac.uk)可獲得的模型區(qū)段的281個殘基中的大約150個殘基。此外,在SEQ ID NO 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40中鑒定了PF02018結(jié)構(gòu)域或長度與PF02018結(jié)構(gòu)域相等的非注釋區(qū)域(non-annotated region)。Pf00150的假定的催化結(jié)構(gòu)域由靠近β-鏈的羧基末端的兩個谷氨酸四和七組成,其中一個充當質(zhì)子供體,并且另一個作為親核體(詹金斯(Jenkins)J,羅萊焦(Lo Leggio)L,哈里斯(Harris)G,和皮克斯吉爾(Pickersgill)R.,β-葡糖苷酶,β-半乳糖苷酶,家族A纖維素酶,家族F木聚糖酶和兩種大麥葡聚糖酶形成具有8倍β/a結(jié)構(gòu)并且具有靠近β-鏈的羧基末端的兩個保守谷氨酸四和七的酶的超家族(Beta-glucosidase,beta-galactosidase,family A cellulases,family F xylanases and two barley glycanases form a superfamily of enzymes with 8-fold beta/alpha architecture and with two conserved glutamates near the carboxy-terminal ends of beta-strands four and seven.)歐洲生化學會聯(lián)合會快報(FEBS Lett.)1995年4月10;362(3):281-5)。基于氨基酸序列比對,不管相關性遠的PF00150結(jié)構(gòu)域的存在,在所有分子(SEQ ID NO 2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40)中鑒定了假定的谷氨酸質(zhì)子供體和假定的谷氨酸親核體(圖1)。在高度保守區(qū)域中催化殘基的存在強烈地表明分子之間的密切關系。假定的谷氨酸質(zhì)子供體位于部分PF00150結(jié)構(gòu)域中,并且假定的親核體(E566)位于PF02018結(jié)構(gòu)域之后(或在一些情況下,非注釋區(qū)域長度等于PF02018結(jié)構(gòu)域)。這表示PF02018結(jié)構(gòu)域已經(jīng)被引入谷氨酸催化殘基之間,生成新穎的結(jié)構(gòu)域結(jié)構(gòu)。
實例3:內(nèi)切葡聚糖酶的克隆和表達
獲得內(nèi)切葡聚糖酶基因的成熟肽編碼部分(SEQ ID NO:1中位置67至2508,SEQ ID NO:3中位置76至2583,SEQ ID NO:5中位置67至2913,和SEQ ID NO:7中位置73至2562),作為合成基因。鑒定內(nèi)切葡聚糖酶基因的成熟肽編碼部分并將其插入大腸桿菌中。從大腸桿菌轉(zhuǎn)化體純化包含插入片段的表達質(zhì)粒,并將其轉(zhuǎn)化到枯草芽孢桿菌宿主細胞中。轉(zhuǎn)化的宿主細胞在液體培養(yǎng)基中生長。通過SDS-PAGE和活性測試驗證內(nèi)切葡聚糖酶的表達。
實例4:內(nèi)切葡聚糖酶的表征
將培養(yǎng)液在臺式離心機中以20,000g離心20分鐘,并將上清液直接用于內(nèi)切葡聚糖酶的表征。AZCL-HE-纖維素(交聯(lián)和染色纖維素)測定用于檢測內(nèi)切葡聚糖酶活性。通過溫和攪拌,將1%AZCL-HE-纖維素(來自麥格酶公司(Megazyme))懸浮于0.01%Triton X-100中。將200微升的這種懸浮液和200微升測定緩沖液在艾本德管中混合并且置于冰上。添加20微升內(nèi)切葡聚糖酶樣品。通過將艾本德管轉(zhuǎn)移至設定為測定溫度的艾本德恒溫混勻儀來啟動測定。將管在艾本德恒溫混勻儀上在其最高振搖速率(1400rpm)下孵育高達60min。通過轉(zhuǎn)移該管返回至冰浴停止孵育。然后將管在冰冷離心機中離心2min,將200微升上清液轉(zhuǎn)移至微量滴定板,并且讀取OD590。枯草芽孢桿菌宿主菌株包括在該測定中。將ΔOD590=OD590(酶)–OD590(枯草芽孢桿菌宿主菌株)用于內(nèi)切葡聚糖酶活性的測量。
可變測定條件
溫度:30℃-80℃
底物:AZCL-HE-纖維素,AZCL-支鏈淀粉,AZCL-木葡聚糖和AZCL-凝膠多糖。
測定緩沖液:100mM琥珀酸,100mM HEPES,100mM CHES,100mM CABS,1mM CaCl2,150mM KCl,0.01%Triton X-100,調(diào)節(jié)至pH 3-11。
將上述內(nèi)切葡聚糖酶測定用于獲得pH活性曲線,溫度-活性曲線連同底物特異性曲線。
實例5:黃原膠降解活性粘度測定
本發(fā)明的多肽的黃原膠降解活性可以當與內(nèi)切葡聚糖酶一起孵育時,通過測量黃原膠溶液或改性黃原膠溶液的粘度的降低來測定。使用描述于WO 2011/107472中的粘度壓力測定法進行粘度測量。
底物改性黃原膠(mXG)是用去除末端丙酮酸甘露糖的黃原膠裂解酶處理的黃原膠(XG),并且使用在南海(Nankai),橋本(Hashimoto)等人,1999,應用與環(huán)境微生物學(Appl.Environ.Microbiol)65(6):2520-2526中描述的方法的改編版來制備:在2L燒杯中將2.5g黃原膠(斯比凱可(CP Kelco))用5mL的96%乙醇潤濕。添加500mL的100mM ACES緩沖液pH 7.00,并且將溶液在環(huán)境溫度下攪拌2h。添加250μL黃原膠裂解酶(麥格酶公司產(chǎn)品E-XANLB,芽胞桿菌屬物種),并且將溶液在50℃下孵育20h。在水解后,在攪拌下,將1400mL的96%乙醇添加到500mL樣品中。發(fā)生沉淀,并且在大約5min后,傾析出乙醇,由此去除丙酮酸甘露糖殘余物。將500mL的96%乙醇再次添加到剩余的溶液中,并在任何沉淀后傾析。將樣品在華特門(Whatman)過濾器GF/C上在蒸發(fā)漏斗上干燥。將過濾器在50℃下干燥20h。收集樣品,研磨并通過300μM篩過篩。
水解條件如下:50℃,0.6%黃原膠(XG)或0.3%改性黃原膠(mXG),在50mM HEPES緩沖液+0.01%triton X-100(pH 7.0)中。在熱平衡時添加酶。在熱平衡后并且在酶添加之前測量初始粘度。對照與代替酶的添加的緩沖液相同。
粘度的降低是酶活性的量度。當內(nèi)切葡聚糖酶和黃原膠裂解酶與黃原膠一起孵育時,或當內(nèi)切葡聚糖酶與改性黃原膠單獨孵育時,觀察到粘度的顯著下降。這表明一旦去除丙酮酸甘露糖,底物現(xiàn)在是空間可用的并且被內(nèi)切葡聚糖酶降解。
改性黃原膠:底物改性黃原膠(mXG)是用去除末端丙酮酸甘露糖的黃原膠裂解酶處理的黃原膠(XG),并且使用在南海(Nankai),橋本(Hashimoto)等人,1999,應用與環(huán)境微生物學(Appl.Environ.Microbiol)65(6):2520-2526中描述的方法的改編版來制備:在2L燒杯中將2.5g黃原膠(斯比凱可(CP Kelco))用5mL的96%乙醇潤濕。添加500mL的100mM ACES緩沖液pH 7.00,并且將溶液在環(huán)境溫度下攪拌2h。添加250μL黃原膠裂解酶(麥格酶公司產(chǎn)品E-XANLB,芽胞桿菌屬物種),并且將溶液在50℃下孵育20h。在水解后,在攪拌下,將1400mL的96%乙醇添加到500mL樣品中。發(fā)生沉淀,并且在大約5min后,傾析出乙醇,由此去除丙酮酸甘露糖殘余物。將500mL的96%乙醇再次添加到剩余的溶液中,并在任何沉淀后傾析。將樣品在華特門(Whatman)過濾器GF/C上在蒸發(fā)漏斗上干燥。將過濾器在50℃下干燥20h。收集樣品,研磨并通過300μM篩過篩。
實例6:還原末端測定
使用由萊韋爾(Lever)(1972),分析化學(Anal.Biochem.)47:273-279,1972研發(fā)的比色測定,通過用黃原膠裂解酶預處理的黃原膠(mXG,如實例5中制備)上的還原末端,確定內(nèi)切葡聚糖酶活性。產(chǎn)生的任何還原末端都將與PAHBAH反應,從而產(chǎn)生顏色的變化,該顏色變化在用于該測定的條件下與酶活性成比例。
如以上描述的通過還原末端確定黃原膠裂解酶活性,除了將0.1%黃原膠用作底物以外。
材料和化學品:0.1%底物:24ml Milli-Q水中的用黃原膠裂解酶預處理的6ml(5mg/ml)黃原膠。
活性緩沖液:100mM乙酸鈉,100mM MES,1mM CaCl2,在0.01%曲通X100中,pH 7。
Ka-Na-酒石酸鹽/NaOH緩沖液:將Ka-Na-酒石酸鹽(50g)和NaOH(20g)溶解于水中,至總體積為1升。儲存在4℃下。
終止溶液:將PAHBAH(西格瑪H-9882)溶解于Ka-Na-酒石酸鹽/NaOH溶液中,至濃度為15mg/ml(例如,將500mg PAHBAH溶解于33ml Ka-Na-酒石酸鹽/NaOH溶液中)
樣品制備:使用BioMek液體處理機器人,將酶樣品在柯仕達條(costarstrip)中的活性緩沖液中稀釋至0.1mg/ml。將50μl的底物和50μl的每種稀釋的樣品轉(zhuǎn)移至96孔PCR-MTP板,向每個樣品中添加50μl活性緩沖液并將溶液混合。將密封的PCR-板在37℃下、在PCR機中孵育15min,然后立即冷卻至10℃。向每個樣品中添加75μl的終止溶液,將混合物振蕩,并且將75μl的每個樣品丟棄。將這些樣品在95℃下孵育10min,然后在10℃下孵育1min。將150μl的每種樣品轉(zhuǎn)移至新的96孔PCR-MTP并且測量405nm處的吸光度。
比色反應與產(chǎn)生的還原末端的量成比例,并且因此與存在的內(nèi)切葡聚糖酶的量成比例。
序列表
<110> 諾維信公司
<120> 具有內(nèi)切葡聚糖酶活性的多肽
<130> 12789-WO-PCT
<160> 42
<170> PatentIn版本3.5
<210> 1
<211> 2511
<212> DNA
<213> 土壤宏基因組
<220>
<221> 信號肽
<222> (1)..(66)
<220>
<221> CDS
<222> (1)..(2508)
<220>
<221> 成熟肽
<222> (67)..(2508)
<400> 1
atg ctt cgc gcg gct ttg gcg gca atg gtt atg gcg ggc gct ctg acg 48
Met Leu Arg Ala Ala Leu Ala Ala Met Val Met Ala Gly Ala Leu Thr
-20 -15 -10
gcg ggt tcg gcc gcg ggc gag atg ttc ccc ttc acc atg cca tgg aac 96
Ala Gly Ser Ala Ala Gly Glu Met Phe Pro Phe Thr Met Pro Trp Asn
-5 -1 1 5 10
gac gcc ggc acc ggc aat atc acc gac ctg tcg gcg tgg aac gat aag 144
Asp Ala Gly Thr Gly Asn Ile Thr Asp Leu Ser Ala Trp Asn Asp Lys
15 20 25
ccg gcg ggg gcg agc ggc ttc gtc acc gtc gcg ggc ggc cat ctg gtg 192
Pro Ala Gly Ala Ser Gly Phe Val Thr Val Ala Gly Gly His Leu Val
30 35 40
gcg ggc ggc aaa cgg ctg caa ctc ctc ggc gtc aac gtg acc ttc ggc 240
Ala Gly Gly Lys Arg Leu Gln Leu Leu Gly Val Asn Val Thr Phe Gly
45 50 55
tcc aac gcg cct gag cat gcc gat gcc gat atc gtg gcg cgc cgg atg 288
Ser Asn Ala Pro Glu His Ala Asp Ala Asp Ile Val Ala Arg Arg Met
60 65 70
gcc cgc ttc ggc atc aat atc gtg cgg ctg cac cat atg gac acc tat 336
Ala Arg Phe Gly Ile Asn Ile Val Arg Leu His His Met Asp Thr Tyr
75 80 85 90
gag gcg ccg ttc ggg att ctg gaa aag gat cgc gtc acc ctc aac ccc 384
Glu Ala Pro Phe Gly Ile Leu Glu Lys Asp Arg Val Thr Leu Asn Pro
95 100 105
gac tat ctc gac aag ctg gac tat ttc gtc gcc gcg ctg aag cgg cag 432
Asp Tyr Leu Asp Lys Leu Asp Tyr Phe Val Ala Ala Leu Lys Arg Gln
110 115 120
ggc att tat gtc gac atc aac ctg cat gtc ggc cgc gcc tat ccg ggc 480
Gly Ile Tyr Val Asp Ile Asn Leu His Val Gly Arg Ala Tyr Pro Gly
125 130 135
ttt gcg agt tgg ccg ggc ggc gac agc tat ttc aag ggc gtc gat cac 528
Phe Ala Ser Trp Pro Gly Gly Asp Ser Tyr Phe Lys Gly Val Asp His
140 145 150
ttc gag ccg cag atg atc cgc ttg cag aag gat ttc gcc cgc gac ctg 576
Phe Glu Pro Gln Met Ile Arg Leu Gln Lys Asp Phe Ala Arg Asp Leu
155 160 165 170
ctc cac cat cgc aat ccc tat acc ggc acc cgt tat gcc gac gaa ccg 624
Leu His His Arg Asn Pro Tyr Thr Gly Thr Arg Tyr Ala Asp Glu Pro
175 180 185
gcg gtc gcc atc gtc gag atc aac aac gag aac ggc ctg atc cgc gaa 672
Ala Val Ala Ile Val Glu Ile Asn Asn Glu Asn Gly Leu Ile Arg Glu
190 195 200
tgg ggc gcc ggg gcg ctc gac gcc atg acc gag ccg ctg cgc ggt gag 720
Trp Gly Ala Gly Ala Leu Asp Ala Met Thr Glu Pro Leu Arg Gly Glu
205 210 215
atg acc cgg caa tgg aat gtc tgg ctg aag cag cgc tat ggc agc gat 768
Met Thr Arg Gln Trp Asn Val Trp Leu Lys Gln Arg Tyr Gly Ser Asp
220 225 230
gcg gca ctg cgc caa gcg tgg ggc gcg cgc agc gaa ccg ctc ggc aac 816
Ala Ala Leu Arg Gln Ala Trp Gly Ala Arg Ser Glu Pro Leu Gly Asn
235 240 245 250
gag atg ttc acc acc ggc tgg caa ttg cag acg ctt ggc ggt gcg cac 864
Glu Met Phe Thr Thr Gly Trp Gln Leu Gln Thr Leu Gly Gly Ala His
255 260 265
gca acg ctg acg ccg acc gcg gtc ggg ctc gcc ctg acc atg acc ggc 912
Ala Thr Leu Thr Pro Thr Ala Val Gly Leu Ala Leu Thr Met Thr Gly
270 275 280
aaa ggc caa gag agc tgg cac acg cag atg cac caa ggc ggg ctg aat 960
Lys Gly Gln Glu Ser Trp His Thr Gln Met His Gln Gly Gly Leu Asn
285 290 295
ttc acc gcc gaa cga ccc tac acc ctg acg ctg cgg ctt cgg gcc gat 1008
Phe Thr Ala Glu Arg Pro Tyr Thr Leu Thr Leu Arg Leu Arg Ala Asp
300 305 310
cac ccg atg aaa gtc gcg gtg cag gcg atg cag acc cac gaa ccg tgg 1056
His Pro Met Lys Val Ala Val Gln Ala Met Gln Thr His Glu Pro Trp
315 320 325 330
aaa tgg ttg ttg tcc gat acc att tcg gtc ggc acc gaa tgg aag acg 1104
Lys Trp Leu Leu Ser Asp Thr Ile Ser Val Gly Thr Glu Trp Lys Thr
335 340 345
gtg cat ttc acg ttt gtg ccc gcc ttc ggc gag acc ggc gcg cgg ctg 1152
Val His Phe Thr Phe Val Pro Ala Phe Gly Glu Thr Gly Ala Arg Leu
350 355 360
acg ctg ggc ggt ctc ggg ttt gag acc ggc aca ctg gag att gcc gaa 1200
Thr Leu Gly Gly Leu Gly Phe Glu Thr Gly Thr Leu Glu Ile Ala Glu
365 370 375
gcg agt ttg cgg ccc ggc ggc acg tcg ggg ctg aaa ccg ggc gaa aat 1248
Ala Ser Leu Arg Pro Gly Gly Thr Ser Gly Leu Lys Pro Gly Glu Asn
380 385 390
ctc gac cgc ggc agc gtc gcg atc agc gaa tat agt tcc cgc ttc agc 1296
Leu Asp Arg Gly Ser Val Ala Ile Ser Glu Tyr Ser Ser Arg Phe Ser
395 400 405 410
cgc acg ccg gcg gcg caa cgc gat tgg ctg aat ttc ctg tgg gat acc 1344
Arg Thr Pro Ala Ala Gln Arg Asp Trp Leu Asn Phe Leu Trp Asp Thr
415 420 425
gaa acc cac tat tgg gcc gag atg cag cgg ttc ctg aag gcc gat ctc 1392
Glu Thr His Tyr Trp Ala Glu Met Gln Arg Phe Leu Lys Ala Asp Leu
430 435 440
ggc gtc aaa tcg ctg ctc gtc ggg acg cag acg gtg tac agc ccg gcg 1440
Gly Val Lys Ser Leu Leu Val Gly Thr Gln Thr Val Tyr Ser Pro Ala
445 450 455
cca atc caa tcc ggc ctc gat gtc gtc gac gat cac gcc tat tgg cag 1488
Pro Ile Gln Ser Gly Leu Asp Val Val Asp Asp His Ala Tyr Trp Gln
460 465 470
cat ccg cat ttc ccc ggc cgc gcc tgg gat ccg ggc aac tgg cgg atc 1536
His Pro His Phe Pro Gly Arg Ala Trp Asp Pro Gly Asn Trp Arg Ile
475 480 485 490
aac aat ctg ccg atg gcg ggc ctc gaa ggc ggc ggc acg att gcc gat 1584
Asn Asn Leu Pro Met Ala Gly Leu Glu Gly Gly Gly Thr Ile Ala Asp
495 500 505
ctg gcg ctg cgc cgc gtg ccc ggc aag ccg ttc atc gtg acg gaa tac 1632
Leu Ala Leu Arg Arg Val Pro Gly Lys Pro Phe Ile Val Thr Glu Tyr
510 515 520
aac gcg cca gcg ccg aac gac tac caa ggc gag gcc atg ccg ctg gtt 1680
Asn Ala Pro Ala Pro Asn Asp Tyr Gln Gly Glu Ala Met Pro Leu Val
525 530 535
gcg gcg tat ggc gcg cta cag gat tgg gac ggc att ttc ctg ttc gac 1728
Ala Ala Tyr Gly Ala Leu Gln Asp Trp Asp Gly Ile Phe Leu Phe Asp
540 545 550
tac ggc ggc tgg gac aac aac tgg cac acc gat cat atc gac agc ttc 1776
Tyr Gly Gly Trp Asp Asn Asn Trp His Thr Asp His Ile Asp Ser Phe
555 560 565 570
ttc gac agc cgc tcc aat ccg gtg aaa ctg gcg agc ttg atc gcg acc 1824
Phe Asp Ser Arg Ser Asn Pro Val Lys Leu Ala Ser Leu Ile Ala Thr
575 580 585
gcc gcg atg ctg cgg cgg ggc gat gtc gcg gcg gcc gct ccg acg cgt 1872
Ala Ala Met Leu Arg Arg Gly Asp Val Ala Ala Ala Ala Pro Thr Arg
590 595 600
gca agc atg ccg gac cgc gcg gcg tgg atc gaa gcg ctg cgc caa tcg 1920
Ala Ser Met Pro Asp Arg Ala Ala Trp Ile Glu Ala Leu Arg Gln Ser
605 610 615
gcg tat ccg ccc agc gga gcc aat ttc ggc atg gcg aaa gac gcg gcc 1968
Ala Tyr Pro Pro Ser Gly Ala Asn Phe Gly Met Ala Lys Asp Ala Ala
620 625 630
ttg gcg cgc tcg gtc ggc gcg atc gcg ggc aac ggg gtg gcg ccg tca 2016
Leu Ala Arg Ser Val Gly Ala Ile Ala Gly Asn Gly Val Ala Pro Ser
635 640 645 650
tgg ccg gtc aag agc gag acg ggt gaa ctc act tgg ggt ctc ggc ggc 2064
Trp Pro Val Lys Ser Glu Thr Gly Glu Leu Thr Trp Gly Leu Gly Gly
655 660 665
aag acc gtg gtg atc gat gcg cct cgc agc aag ggt ctg atc ggc ccg 2112
Lys Thr Val Val Ile Asp Ala Pro Arg Ser Lys Gly Leu Ile Gly Pro
670 675 680
cgg ctc ggc cat gaa tat gac gcg cat ggc gtc ggg ctg gaa ctg acc 2160
Arg Leu Gly His Glu Tyr Asp Ala His Gly Val Gly Leu Glu Leu Thr
685 690 695
gaa gcg caa ggc gat tgg ggc gtg gtg acc gcg acc gtc gtt cag ggt 2208
Glu Ala Gln Gly Asp Trp Gly Val Val Thr Ala Thr Val Val Gln Gly
700 705 710
acg gat ttt tcg tcg ccg ggg cgc att ctg gtg acg acg ctc ggc cgc 2256
Thr Asp Phe Ser Ser Pro Gly Arg Ile Leu Val Thr Thr Leu Gly Arg
715 720 725 730
gaa gag aat acc gga cag caa tgg acc gac gcg acg cgg act tcg gtt 2304
Glu Glu Asn Thr Gly Gln Gln Trp Thr Asp Ala Thr Arg Thr Ser Val
735 740 745
ggc cgc aat tgg ggc gca gcg ccg gtg ctg gtc gag ggt ttg ggc gcg 2352
Gly Arg Asn Trp Gly Ala Ala Pro Val Leu Val Glu Gly Leu Gly Ala
750 755 760
cgc atc acc ctg ccc gtt ccg gca gcg cgg gtg tcg gcg ttt gcg ctc 2400
Arg Ile Thr Leu Pro Val Pro Ala Ala Arg Val Ser Ala Phe Ala Leu
765 770 775
gat gcg ctg ggc aat cgt acc acg gca ctg ccg gtg agc ggt tcg agt 2448
Asp Ala Leu Gly Asn Arg Thr Thr Ala Leu Pro Val Ser Gly Ser Ser
780 785 790
cgc gcc aca atc gaa ctc ggc gcg cgg tat cag acg ctg tgg tat gag 2496
Arg Ala Thr Ile Glu Leu Gly Ala Arg Tyr Gln Thr Leu Trp Tyr Glu
795 800 805 810
gtg gtg gtg aag tag 2511
Val Val Val Lys
<210> 2
<211> 836
<212> PRT
<213> 土壤宏基因組
<400> 2
Met Leu Arg Ala Ala Leu Ala Ala Met Val Met Ala Gly Ala Leu Thr
-20 -15 -10
Ala Gly Ser Ala Ala Gly Glu Met Phe Pro Phe Thr Met Pro Trp Asn
-5 -1 1 5 10
Asp Ala Gly Thr Gly Asn Ile Thr Asp Leu Ser Ala Trp Asn Asp Lys
15 20 25
Pro Ala Gly Ala Ser Gly Phe Val Thr Val Ala Gly Gly His Leu Val
30 35 40
Ala Gly Gly Lys Arg Leu Gln Leu Leu Gly Val Asn Val Thr Phe Gly
45 50 55
Ser Asn Ala Pro Glu His Ala Asp Ala Asp Ile Val Ala Arg Arg Met
60 65 70
Ala Arg Phe Gly Ile Asn Ile Val Arg Leu His His Met Asp Thr Tyr
75 80 85 90
Glu Ala Pro Phe Gly Ile Leu Glu Lys Asp Arg Val Thr Leu Asn Pro
95 100 105
Asp Tyr Leu Asp Lys Leu Asp Tyr Phe Val Ala Ala Leu Lys Arg Gln
110 115 120
Gly Ile Tyr Val Asp Ile Asn Leu His Val Gly Arg Ala Tyr Pro Gly
125 130 135
Phe Ala Ser Trp Pro Gly Gly Asp Ser Tyr Phe Lys Gly Val Asp His
140 145 150
Phe Glu Pro Gln Met Ile Arg Leu Gln Lys Asp Phe Ala Arg Asp Leu
155 160 165 170
Leu His His Arg Asn Pro Tyr Thr Gly Thr Arg Tyr Ala Asp Glu Pro
175 180 185
Ala Val Ala Ile Val Glu Ile Asn Asn Glu Asn Gly Leu Ile Arg Glu
190 195 200
Trp Gly Ala Gly Ala Leu Asp Ala Met Thr Glu Pro Leu Arg Gly Glu
205 210 215
Met Thr Arg Gln Trp Asn Val Trp Leu Lys Gln Arg Tyr Gly Ser Asp
220 225 230
Ala Ala Leu Arg Gln Ala Trp Gly Ala Arg Ser Glu Pro Leu Gly Asn
235 240 245 250
Glu Met Phe Thr Thr Gly Trp Gln Leu Gln Thr Leu Gly Gly Ala His
255 260 265
Ala Thr Leu Thr Pro Thr Ala Val Gly Leu Ala Leu Thr Met Thr Gly
270 275 280
Lys Gly Gln Glu Ser Trp His Thr Gln Met His Gln Gly Gly Leu Asn
285 290 295
Phe Thr Ala Glu Arg Pro Tyr Thr Leu Thr Leu Arg Leu Arg Ala Asp
300 305 310
His Pro Met Lys Val Ala Val Gln Ala Met Gln Thr His Glu Pro Trp
315 320 325 330
Lys Trp Leu Leu Ser Asp Thr Ile Ser Val Gly Thr Glu Trp Lys Thr
335 340 345
Val His Phe Thr Phe Val Pro Ala Phe Gly Glu Thr Gly Ala Arg Leu
350 355 360
Thr Leu Gly Gly Leu Gly Phe Glu Thr Gly Thr Leu Glu Ile Ala Glu
365 370 375
Ala Ser Leu Arg Pro Gly Gly Thr Ser Gly Leu Lys Pro Gly Glu Asn
380 385 390
Leu Asp Arg Gly Ser Val Ala Ile Ser Glu Tyr Ser Ser Arg Phe Ser
395 400 405 410
Arg Thr Pro Ala Ala Gln Arg Asp Trp Leu Asn Phe Leu Trp Asp Thr
415 420 425
Glu Thr His Tyr Trp Ala Glu Met Gln Arg Phe Leu Lys Ala Asp Leu
430 435 440
Gly Val Lys Ser Leu Leu Val Gly Thr Gln Thr Val Tyr Ser Pro Ala
445 450 455
Pro Ile Gln Ser Gly Leu Asp Val Val Asp Asp His Ala Tyr Trp Gln
460 465 470
His Pro His Phe Pro Gly Arg Ala Trp Asp Pro Gly Asn Trp Arg Ile
475 480 485 490
Asn Asn Leu Pro Met Ala Gly Leu Glu Gly Gly Gly Thr Ile Ala Asp
495 500 505
Leu Ala Leu Arg Arg Val Pro Gly Lys Pro Phe Ile Val Thr Glu Tyr
510 515 520
Asn Ala Pro Ala Pro Asn Asp Tyr Gln Gly Glu Ala Met Pro Leu Val
525 530 535
Ala Ala Tyr Gly Ala Leu Gln Asp Trp Asp Gly Ile Phe Leu Phe Asp
540 545 550
Tyr Gly Gly Trp Asp Asn Asn Trp His Thr Asp His Ile Asp Ser Phe
555 560 565 570
Phe Asp Ser Arg Ser Asn Pro Val Lys Leu Ala Ser Leu Ile Ala Thr
575 580 585
Ala Ala Met Leu Arg Arg Gly Asp Val Ala Ala Ala Ala Pro Thr Arg
590 595 600
Ala Ser Met Pro Asp Arg Ala Ala Trp Ile Glu Ala Leu Arg Gln Ser
605 610 615
Ala Tyr Pro Pro Ser Gly Ala Asn Phe Gly Met Ala Lys Asp Ala Ala
620 625 630
Leu Ala Arg Ser Val Gly Ala Ile Ala Gly Asn Gly Val Ala Pro Ser
635 640 645 650
Trp Pro Val Lys Ser Glu Thr Gly Glu Leu Thr Trp Gly Leu Gly Gly
655 660 665
Lys Thr Val Val Ile Asp Ala Pro Arg Ser Lys Gly Leu Ile Gly Pro
670 675 680
Arg Leu Gly His Glu Tyr Asp Ala His Gly Val Gly Leu Glu Leu Thr
685 690 695
Glu Ala Gln Gly Asp Trp Gly Val Val Thr Ala Thr Val Val Gln Gly
700 705 710
Thr Asp Phe Ser Ser Pro Gly Arg Ile Leu Val Thr Thr Leu Gly Arg
715 720 725 730
Glu Glu Asn Thr Gly Gln Gln Trp Thr Asp Ala Thr Arg Thr Ser Val
735 740 745
Gly Arg Asn Trp Gly Ala Ala Pro Val Leu Val Glu Gly Leu Gly Ala
750 755 760
Arg Ile Thr Leu Pro Val Pro Ala Ala Arg Val Ser Ala Phe Ala Leu
765 770 775
Asp Ala Leu Gly Asn Arg Thr Thr Ala Leu Pro Val Ser Gly Ser Ser
780 785 790
Arg Ala Thr Ile Glu Leu Gly Ala Arg Tyr Gln Thr Leu Trp Tyr Glu
795 800 805 810
Val Val Val Lys
<210> 3
<211> 2586
<212> DNA
<213> 廢水宏基因組
<220>
<221> CDS
<222> (1)..(2583)
<220>
<221> 信號肽
<222> (1)..(75)
<220>
<221> 成熟肽
<222> (76)..(2583)
<400> 3
ttg cgt tta aat ttc gcc tcc ttt cag ttg tta gct tgg tta atg ttt 48
Leu Arg Leu Asn Phe Ala Ser Phe Gln Leu Leu Ala Trp Leu Met Phe
-25 -20 -15 -10
tcc gtc tca gtg gat gca ttg tcc gct gac agt gat ttt ttt cct tac 96
Ser Val Ser Val Asp Ala Leu Ser Ala Asp Ser Asp Phe Phe Pro Tyr
-5 -1 1 5
aaa gtc cga tgg gac gaa gct tct gtt agt gca gtt aat ctg cgc gac 144
Lys Val Arg Trp Asp Glu Ala Ser Val Ser Ala Val Asn Leu Arg Asp
10 15 20
tgg aat cat aga ccc gct ggt agg ctc ggt tgg gtt acg gct cgt gat 192
Trp Asn His Arg Pro Ala Gly Arg Leu Gly Trp Val Thr Ala Arg Asp
25 30 35
ggg cat ctt tat gtt gga aag tct agg cta cgt ttc ttt ggc gtt aat 240
Gly His Leu Tyr Val Gly Lys Ser Arg Leu Arg Phe Phe Gly Val Asn
40 45 50 55
gtt gtc ttt cgg gga gca atg cct gag cgt gat gag gcg gag aaa att 288
Val Val Phe Arg Gly Ala Met Pro Glu Arg Asp Glu Ala Glu Lys Ile
60 65 70
gca gca cgt ttg gct aag tta ggc ttc aat gtg gtc cga ttt cat cat 336
Ala Ala Arg Leu Ala Lys Leu Gly Phe Asn Val Val Arg Phe His His
75 80 85
atg gat acg ctt gtt agt ccc aat ggt ctg ctc aag gat gat ctg cgt 384
Met Asp Thr Leu Val Ser Pro Asn Gly Leu Leu Lys Asp Asp Leu Arg
90 95 100
act ttt gat cca gct cag cta gat aaa ctg gat tac ttt att gca gct 432
Thr Phe Asp Pro Ala Gln Leu Asp Lys Leu Asp Tyr Phe Ile Ala Ala
105 110 115
ttg aag cga gaa ggt atc tac agc gat ctt aat ctt cat gta ggg cgt 480
Leu Lys Arg Glu Gly Ile Tyr Ser Asp Leu Asn Leu His Val Gly Arg
120 125 130 135
ctt tat cct ggt ttt gat cgt tgg cgt gat gcc gct gga aat cag cag 528
Leu Tyr Pro Gly Phe Asp Arg Trp Arg Asp Ala Ala Gly Asn Gln Gln
140 145 150
cct gag gct tgg aaa ggg gtt gat gtt ttc tat cct cct atg gtc gat 576
Pro Glu Ala Trp Lys Gly Val Asp Val Phe Tyr Pro Pro Met Val Asp
155 160 165
cag cag aaa gag tac gca aaa gag ttg ctg act cat gta aat cct tat 624
Gln Gln Lys Glu Tyr Ala Lys Glu Leu Leu Thr His Val Asn Pro Tyr
170 175 180
tta ggt aag cga tat tta gat gag cct gct gtc gcc att gtc gag ctc 672
Leu Gly Lys Arg Tyr Leu Asp Glu Pro Ala Val Ala Ile Val Glu Leu
185 190 195
aat aat gag aat ggg ctg atc tat agt tgg agg cgc ggc gat ctt gac 720
Asn Asn Glu Asn Gly Leu Ile Tyr Ser Trp Arg Arg Gly Asp Leu Asp
200 205 210 215
ctg atg agt gag ccg tat cgt gga gag ttg caa cgt cta tgg aac tct 768
Leu Met Ser Glu Pro Tyr Arg Gly Glu Leu Gln Arg Leu Trp Asn Ser
220 225 230
tgg ctt gtt acc cac tat aag agt gac gct ggc ttg cgt ttg gcg tgg 816
Trp Leu Val Thr His Tyr Lys Ser Asp Ala Gly Leu Arg Leu Ala Trp
235 240 245
gag aca aaa gaa gta cct atg ggt atg gag atg ctg gtc agt ccc gga 864
Glu Thr Lys Glu Val Pro Met Gly Met Glu Met Leu Val Ser Pro Gly
250 255 260
gca cct acc ggg ctt gtt cgt gag tgg acg ctg cag tct gtg ggg cag 912
Ala Pro Thr Gly Leu Val Arg Glu Trp Thr Leu Gln Ser Val Gly Gln
265 270 275
gcg aga gcg ata ctt gat ggg tat gag gat ggg atc cag cat ctt aac 960
Ala Arg Ala Ile Leu Asp Gly Tyr Glu Asp Gly Ile Gln His Leu Asn
280 285 290 295
gtt ctt cag cca ggt act gag cgt tgg cac gtt cag gtt cat caa aaa 1008
Val Leu Gln Pro Gly Thr Glu Arg Trp His Val Gln Val His Gln Lys
300 305 310
tct ttg tcg ttt aag gct ggc gaa ctc tac acc cta cat ttg cga ttg 1056
Ser Leu Ser Phe Lys Ala Gly Glu Leu Tyr Thr Leu His Leu Arg Leu
315 320 325
cgc gct aat aag cct cgg tct gta cgt ctc atg gct gtg caa aac cat 1104
Arg Ala Asn Lys Pro Arg Ser Val Arg Leu Met Ala Val Gln Asn His
330 335 340
gct ccg ttt cgg tct ttg tgg gag cag agg ctc aag ctt gat tct gag 1152
Ala Pro Phe Arg Ser Leu Trp Glu Gln Arg Leu Lys Leu Asp Ser Glu
345 350 355
tgg cag gag ttc gta ttt gtt ttt agt tcc cct atc gat gaa gcg ctt 1200
Trp Gln Glu Phe Val Phe Val Phe Ser Ser Pro Ile Asp Glu Ala Leu
360 365 370 375
gca cgg cta act ttg ggt gat ctg gga gct gac tca gga gag att tgg 1248
Ala Arg Leu Thr Leu Gly Asp Leu Gly Ala Asp Ser Gly Glu Ile Trp
380 385 390
att gca ggc agt agt tta aga gcg ggc ggt gat ttt aag ttt ggc gaa 1296
Ile Ala Gly Ser Ser Leu Arg Ala Gly Gly Asp Phe Lys Phe Gly Glu
395 400 405
agc gac tcg tta gtg aag cgc aat gtt ccg att ttt act agc agt gac 1344
Ser Asp Ser Leu Val Lys Arg Asn Val Pro Ile Phe Thr Ser Ser Asp
410 415 420
ttt gga agt cgt tcg ttg cgc gct cag aga gac tgg ctg aac ttt ctg 1392
Phe Gly Ser Arg Ser Leu Arg Ala Gln Arg Asp Trp Leu Asn Phe Leu
425 430 435
tgg gac gtt gag gcg caa tat tgg tcg gaa atg cag ggt tat tta aaa 1440
Trp Asp Val Glu Ala Gln Tyr Trp Ser Glu Met Gln Gly Tyr Leu Lys
440 445 450 455
aat aag ctg ggt gta aag tct ttg gtc att ggg acg caa cta aat cat 1488
Asn Lys Leu Gly Val Lys Ser Leu Val Ile Gly Thr Gln Leu Asn His
460 465 470
agt ccc tcg ctg att cag aga aat atg gat gtg ctg gat gcc cat gct 1536
Ser Pro Ser Leu Ile Gln Arg Asn Met Asp Val Leu Asp Ala His Ala
475 480 485
tat tgg gat cat ccg cgt ttt ccg gat ggt tta tgg agc cct atc aat 1584
Tyr Trp Asp His Pro Arg Phe Pro Asp Gly Leu Trp Ser Pro Ile Asn
490 495 500
tgg ctc att gat aat aag gct atg gcc ggt gtt gat ggg gga ggg gct 1632
Trp Leu Ile Asp Asn Lys Ala Met Ala Gly Val Asp Gly Gly Gly Ala
505 510 515
att tcc cgc ctc gca ttg atg cgg ctg ccg gga aag cca ttt gtt gtt 1680
Ile Ser Arg Leu Ala Leu Met Arg Leu Pro Gly Lys Pro Phe Val Val
520 525 530 535
acg gaa tat aat cat cct gca cct aat gag ttt gca gct gag act ttt 1728
Thr Glu Tyr Asn His Pro Ala Pro Asn Glu Phe Ala Ala Glu Thr Phe
540 545 550
ccg ctt gtt gct gca tac gcg gcg atg caa gac tgg gat ggt gtt ttt 1776
Pro Leu Val Ala Ala Tyr Ala Ala Met Gln Asp Trp Asp Gly Val Phe
555 560 565
cta ttc agc tat ggg act cat agc aga agt tgg aaa agg gat tat gtt 1824
Leu Phe Ser Tyr Gly Thr His Ser Arg Ser Trp Lys Arg Asp Tyr Val
570 575 580
gat aat ttt ttc gac ata aat gct aat cca aat aaa ttt acg agt act 1872
Asp Asn Phe Phe Asp Ile Asn Ala Asn Pro Asn Lys Phe Thr Ser Thr
585 590 595
ttg gcg gcg gcg gcg ctt ttt cgc cgt ggt gac gtt tct tcc caa cga 1920
Leu Ala Ala Ala Ala Leu Phe Arg Arg Gly Asp Val Ser Ser Gln Arg
600 605 610 615
ggt gct ttt tcc acc gtt cta cca agt cga tcc gca ttt ata gat gct 1968
Gly Ala Phe Ser Thr Val Leu Pro Ser Arg Ser Ala Phe Ile Asp Ala
620 625 630
ctg cgc cag ata aat aaa aac tat ctt ccg tct ggg ggg gat ttt ggc 2016
Leu Arg Gln Ile Asn Lys Asn Tyr Leu Pro Ser Gly Gly Asp Phe Gly
635 640 645
gtt agc agt aat tct gcg atg cgc gag cct gtt gct ttg act ggg cct 2064
Val Ser Ser Asn Ser Ala Met Arg Glu Pro Val Ala Leu Thr Gly Pro
650 655 660
gtt cgt gtt gat tct ctt ctg cca ata aag agc ctg aca ggg cag ctt 2112
Val Arg Val Asp Ser Leu Leu Pro Ile Lys Ser Leu Thr Gly Gln Leu
665 670 675
gtc tgg ggt gtt gat aaa agc cca aca gta agt ata aat acg cct ttg 2160
Val Trp Gly Val Asp Lys Ser Pro Thr Val Ser Ile Asn Thr Pro Leu
680 685 690 695
agt aaa ggc ttg att ggt gcc agt ctt gct gaa cca ttt gat gca tct 2208
Ser Lys Gly Leu Ile Gly Ala Ser Leu Ala Glu Pro Phe Asp Ala Ser
700 705 710
gga gta cat ttg caa ctg ttg ggt tca gat act ggg agt ggg gtt gtt 2256
Gly Val His Leu Gln Leu Leu Gly Ser Asp Thr Gly Ser Gly Val Val
715 720 725
ttt ctt acg ctt ata gat gga tca agt ttt tct ggc ccc gga aga tta 2304
Phe Leu Thr Leu Ile Asp Gly Ser Ser Phe Ser Gly Pro Gly Arg Leu
730 735 740
tta att act gcg ctt ggt aac agt aaa aat acc aat caa gtc tgg gtg 2352
Leu Ile Thr Ala Leu Gly Asn Ser Lys Asn Thr Asn Gln Val Trp Val
745 750 755
gat aag acg cgt gca agc ctt ggg ggg aag tgg ggg caa gcc cct gtt 2400
Asp Lys Thr Arg Ala Ser Leu Gly Gly Lys Trp Gly Gln Ala Pro Val
760 765 770 775
ctt gtc gaa ggt gtt cgt agt cgt att act ttg cct atc tca agc tct 2448
Leu Val Glu Gly Val Arg Ser Arg Ile Thr Leu Pro Ile Ser Ser Ser
780 785 790
caa gtt cgt gct tgg gct tta gat gag gag ggc cgc cgc aag gag att 2496
Gln Val Arg Ala Trp Ala Leu Asp Glu Glu Gly Arg Arg Lys Glu Ile
795 800 805
gtt gtg gtt cgc gga aat gaa aat gcg gta att gaa acg gga cct aaa 2544
Val Val Val Arg Gly Asn Glu Asn Ala Val Ile Glu Thr Gly Pro Lys
810 815 820
tat aag agt ttg tgg tac gag gtg gaa gtt ctt gca aat tga 2586
Tyr Lys Ser Leu Trp Tyr Glu Val Glu Val Leu Ala Asn
825 830 835
<210> 4
<211> 861
<212> PRT
<213> 廢水宏基因組
<400> 4
Leu Arg Leu Asn Phe Ala Ser Phe Gln Leu Leu Ala Trp Leu Met Phe
-25 -20 -15 -10
Ser Val Ser Val Asp Ala Leu Ser Ala Asp Ser Asp Phe Phe Pro Tyr
-5 -1 1 5
Lys Val Arg Trp Asp Glu Ala Ser Val Ser Ala Val Asn Leu Arg Asp
10 15 20
Trp Asn His Arg Pro Ala Gly Arg Leu Gly Trp Val Thr Ala Arg Asp
25 30 35
Gly His Leu Tyr Val Gly Lys Ser Arg Leu Arg Phe Phe Gly Val Asn
40 45 50 55
Val Val Phe Arg Gly Ala Met Pro Glu Arg Asp Glu Ala Glu Lys Ile
60 65 70
Ala Ala Arg Leu Ala Lys Leu Gly Phe Asn Val Val Arg Phe His His
75 80 85
Met Asp Thr Leu Val Ser Pro Asn Gly Leu Leu Lys Asp Asp Leu Arg
90 95 100
Thr Phe Asp Pro Ala Gln Leu Asp Lys Leu Asp Tyr Phe Ile Ala Ala
105 110 115
Leu Lys Arg Glu Gly Ile Tyr Ser Asp Leu Asn Leu His Val Gly Arg
120 125 130 135
Leu Tyr Pro Gly Phe Asp Arg Trp Arg Asp Ala Ala Gly Asn Gln Gln
140 145 150
Pro Glu Ala Trp Lys Gly Val Asp Val Phe Tyr Pro Pro Met Val Asp
155 160 165
Gln Gln Lys Glu Tyr Ala Lys Glu Leu Leu Thr His Val Asn Pro Tyr
170 175 180
Leu Gly Lys Arg Tyr Leu Asp Glu Pro Ala Val Ala Ile Val Glu Leu
185 190 195
Asn Asn Glu Asn Gly Leu Ile Tyr Ser Trp Arg Arg Gly Asp Leu Asp
200 205 210 215
Leu Met Ser Glu Pro Tyr Arg Gly Glu Leu Gln Arg Leu Trp Asn Ser
220 225 230
Trp Leu Val Thr His Tyr Lys Ser Asp Ala Gly Leu Arg Leu Ala Trp
235 240 245
Glu Thr Lys Glu Val Pro Met Gly Met Glu Met Leu Val Ser Pro Gly
250 255 260
Ala Pro Thr Gly Leu Val Arg Glu Trp Thr Leu Gln Ser Val Gly Gln
265 270 275
Ala Arg Ala Ile Leu Asp Gly Tyr Glu Asp Gly Ile Gln His Leu Asn
280 285 290 295
Val Leu Gln Pro Gly Thr Glu Arg Trp His Val Gln Val His Gln Lys
300 305 310
Ser Leu Ser Phe Lys Ala Gly Glu Leu Tyr Thr Leu His Leu Arg Leu
315 320 325
Arg Ala Asn Lys Pro Arg Ser Val Arg Leu Met Ala Val Gln Asn His
330 335 340
Ala Pro Phe Arg Ser Leu Trp Glu Gln Arg Leu Lys Leu Asp Ser Glu
345 350 355
Trp Gln Glu Phe Val Phe Val Phe Ser Ser Pro Ile Asp Glu Ala Leu
360 365 370 375
Ala Arg Leu Thr Leu Gly Asp Leu Gly Ala Asp Ser Gly Glu Ile Trp
380 385 390
Ile Ala Gly Ser Ser Leu Arg Ala Gly Gly Asp Phe Lys Phe Gly Glu
395 400 405
Ser Asp Ser Leu Val Lys Arg Asn Val Pro Ile Phe Thr Ser Ser Asp
410 415 420
Phe Gly Ser Arg Ser Leu Arg Ala Gln Arg Asp Trp Leu Asn Phe Leu
425 430 435
Trp Asp Val Glu Ala Gln Tyr Trp Ser Glu Met Gln Gly Tyr Leu Lys
440 445 450 455
Asn Lys Leu Gly Val Lys Ser Leu Val Ile Gly Thr Gln Leu Asn His
460 465 470
Ser Pro Ser Leu Ile Gln Arg Asn Met Asp Val Leu Asp Ala His Ala
475 480 485
Tyr Trp Asp His Pro Arg Phe Pro Asp Gly Leu Trp Ser Pro Ile Asn
490 495 500
Trp Leu Ile Asp Asn Lys Ala Met Ala Gly Val Asp Gly Gly Gly Ala
505 510 515
Ile Ser Arg Leu Ala Leu Met Arg Leu Pro Gly Lys Pro Phe Val Val
520 525 530 535
Thr Glu Tyr Asn His Pro Ala Pro Asn Glu Phe Ala Ala Glu Thr Phe
540 545 550
Pro Leu Val Ala Ala Tyr Ala Ala Met Gln Asp Trp Asp Gly Val Phe
555 560 565
Leu Phe Ser Tyr Gly Thr His Ser Arg Ser Trp Lys Arg Asp Tyr Val
570 575 580
Asp Asn Phe Phe Asp Ile Asn Ala Asn Pro Asn Lys Phe Thr Ser Thr
585 590 595
Leu Ala Ala Ala Ala Leu Phe Arg Arg Gly Asp Val Ser Ser Gln Arg
600 605 610 615
Gly Ala Phe Ser Thr Val Leu Pro Ser Arg Ser Ala Phe Ile Asp Ala
620 625 630
Leu Arg Gln Ile Asn Lys Asn Tyr Leu Pro Ser Gly Gly Asp Phe Gly
635 640 645
Val Ser Ser Asn Ser Ala Met Arg Glu Pro Val Ala Leu Thr Gly Pro
650 655 660
Val Arg Val Asp Ser Leu Leu Pro Ile Lys Ser Leu Thr Gly Gln Leu
665 670 675
Val Trp Gly Val Asp Lys Ser Pro Thr Val Ser Ile Asn Thr Pro Leu
680 685 690 695
Ser Lys Gly Leu Ile Gly Ala Ser Leu Ala Glu Pro Phe Asp Ala Ser
700 705 710
Gly Val His Leu Gln Leu Leu Gly Ser Asp Thr Gly Ser Gly Val Val
715 720 725
Phe Leu Thr Leu Ile Asp Gly Ser Ser Phe Ser Gly Pro Gly Arg Leu
730 735 740
Leu Ile Thr Ala Leu Gly Asn Ser Lys Asn Thr Asn Gln Val Trp Val
745 750 755
Asp Lys Thr Arg Ala Ser Leu Gly Gly Lys Trp Gly Gln Ala Pro Val
760 765 770 775
Leu Val Glu Gly Val Arg Ser Arg Ile Thr Leu Pro Ile Ser Ser Ser
780 785 790
Gln Val Arg Ala Trp Ala Leu Asp Glu Glu Gly Arg Arg Lys Glu Ile
795 800 805
Val Val Val Arg Gly Asn Glu Asn Ala Val Ile Glu Thr Gly Pro Lys
810 815 820
Tyr Lys Ser Leu Trp Tyr Glu Val Glu Val Leu Ala Asn
825 830 835
<210> 5
<211> 2916
<212> DNA
<213> Lewinella cohaerens
<220>
<221> CDS
<222> (1)..(2913)
<220>
<221> 信號肽
<222> (1)..(66)
<220>
<221> 成熟肽
<222> (67)..(2913)
<400> 5
atg acc att cat ttc cgc ata cag cta tcc cta ttt gcc ctt gta ttt 48
Met Thr Ile His Phe Arg Ile Gln Leu Ser Leu Phe Ala Leu Val Phe
-20 -15 -10
agc tcg ctc ctc ttt ggt caa aac ttc tcg aat ggc ttt cct ttt gca 96
Ser Ser Leu Leu Phe Gly Gln Asn Phe Ser Asn Gly Phe Pro Phe Ala
-5 -1 1 5 10
ttg cct gtc gat gac aat acc tct tct gta ttt cta ccg gca ttc cct 144
Leu Pro Val Asp Asp Asn Thr Ser Ser Val Phe Leu Pro Ala Phe Pro
15 20 25
gcc agc cct ata aca gaa gcg aaa aga gta gta cct gag ggt agg caa 192
Ala Ser Pro Ile Thr Glu Ala Lys Arg Val Val Pro Glu Gly Arg Gln
30 35 40
ttc gtg cgc caa ggt gaa gcc atc cgt ttt tgg ggt gtc aat atc acg 240
Phe Val Arg Gln Gly Glu Ala Ile Arg Phe Trp Gly Val Asn Ile Thr
45 50 55
tct tca gct tgt ttc cct acc cat acc gag gca gaa acc atc gct cga 288
Ser Ser Ala Cys Phe Pro Thr His Thr Glu Ala Glu Thr Ile Ala Arg
60 65 70
cgc ctt aga aag atg ggg atc aac ctt gtc cgt ttt cat cac ctt gac 336
Arg Leu Arg Lys Met Gly Ile Asn Leu Val Arg Phe His His Leu Asp
75 80 85 90
aac ccc gca tgg gca ggt aat gag ggt aca atc ttc ctc aat agc caa 384
Asn Pro Ala Trp Ala Gly Asn Glu Gly Thr Ile Phe Leu Asn Ser Gln
95 100 105
gac aat acc ctc caa att gac cct gta agc atg gat cgc ctc aac tat 432
Asp Asn Thr Leu Gln Ile Asp Pro Val Ser Met Asp Arg Leu Asn Tyr
110 115 120
ttc att tct cgc ctc aaa caa gaa ggc gtc tat gtc aat tta aac ctc 480
Phe Ile Ser Arg Leu Lys Gln Glu Gly Val Tyr Val Asn Leu Asn Leu
125 130 135
cat gtt acg cgt act ttt cgg tta aac gac ggt gtc ccc ctc gct gat 528
His Val Thr Arg Thr Phe Arg Leu Asn Asp Gly Val Pro Leu Ala Asp
140 145 150
tca atc gct gac ttt ggt aaa gta gtc acg cta tac gac cct cag cta 576
Ser Ile Ala Asp Phe Gly Lys Val Val Thr Leu Tyr Asp Pro Gln Leu
155 160 165 170
caa gct cta caa aaa gaa tat gct aat gaa tta ctg gcc caa gtc aac 624
Gln Ala Leu Gln Lys Glu Tyr Ala Asn Glu Leu Leu Ala Gln Val Asn
175 180 185
ccc tac act gga ata aca ctt gca cta gat cct gtc gta gta atg gta 672
Pro Tyr Thr Gly Ile Thr Leu Ala Leu Asp Pro Val Val Val Met Val
190 195 200
gag atg aac aac gaa aat agc atc tac ggc tgg tgg aaa agc aac gcc 720
Glu Met Asn Asn Glu Asn Ser Ile Tyr Gly Trp Trp Lys Ser Asn Ala
205 210 215
ttg cgc cct ttt aac caa gga ggc cga ctg acg gtc tat cat cat gaa 768
Leu Arg Pro Phe Asn Gln Gly Gly Arg Leu Thr Val Tyr His His Glu
220 225 230
atg ctc aat gac cgt tgg cat acc ttc tta gga caa gaa tat gcc gat 816
Met Leu Asn Asp Arg Trp His Thr Phe Leu Gly Gln Glu Tyr Ala Asp
235 240 245 250
gat gaa agc cta gca gcc agt tgg aac aac gga acc atc ccc gct ggc 864
Asp Glu Ser Leu Ala Ala Ser Trp Asn Asn Gly Thr Ile Pro Ala Gly
255 260 265
acc gag gaa aac ctc acc aac ccc gac ctc gaa gag gga cta tta caa 912
Thr Glu Glu Asn Leu Thr Asn Pro Asp Leu Glu Glu Gly Leu Leu Gln
270 275 280
gcc cct tgg tta ttg gaa acc cat gac att gca caa gct aat att act 960
Ala Pro Trp Leu Leu Glu Thr His Asp Ile Ala Gln Ala Asn Ile Thr
285 290 295
ctc gac aat acc aat cct caa tca ggt aat caa tgt gtt gct tta cag 1008
Leu Asp Asn Thr Asn Pro Gln Ser Gly Asn Gln Cys Val Ala Leu Gln
300 305 310
gtt aca cag gcg acg gga aca gaa tgg cat ata cag ttc aag caa aac 1056
Val Thr Gln Ala Thr Gly Thr Glu Trp His Ile Gln Phe Lys Gln Asn
315 320 325 330
gac ctc aac ttc caa cgc gac tct acc tat gaa ttg cgg ttt tgg gca 1104
Asp Leu Asn Phe Gln Arg Asp Ser Thr Tyr Glu Leu Arg Phe Trp Ala
335 340 345
cgg act gac acc gaa cgg gat ttt tcc att tcc ttc ctt cgt gat gat 1152
Arg Thr Asp Thr Glu Arg Asp Phe Ser Ile Ser Phe Leu Arg Asp Asp
350 355 360
gcc ccc tat acc tgg tac agt ggt cga aca ttt acg gcc aac act cag 1200
Ala Pro Tyr Thr Trp Tyr Ser Gly Arg Thr Phe Thr Ala Asn Thr Gln
365 370 375
tgg cag gaa ttc cgc tta ctg ttt aca gct tct gaa agt act acc gct 1248
Trp Gln Glu Phe Arg Leu Leu Phe Thr Ala Ser Glu Ser Thr Thr Ala
380 385 390
ggc cga ctc agt atc agc cca ctt ggt ggc aat ggc acc tat tgg ttt 1296
Gly Arg Leu Ser Ile Ser Pro Leu Gly Gly Asn Gly Thr Tyr Trp Phe
395 400 405 410
gat aac ttc tca tta tct aat cca gcg gtg gat ggc ctg cta cca ggc 1344
Asp Asn Phe Ser Leu Ser Asn Pro Ala Val Asp Gly Leu Leu Pro Gly
415 420 425
gaa agc ctc aat acc gcc agc atc aaa cgt atc cct tgg agc caa cgc 1392
Glu Ser Leu Asn Thr Ala Ser Ile Lys Arg Ile Pro Trp Ser Gln Arg
430 435 440
cta agt tac acc cct gcc agg gta gct gac cta agc cgc ttt tac gta 1440
Leu Ser Tyr Thr Pro Ala Arg Val Ala Asp Leu Ser Arg Phe Tyr Val
445 450 455
gct ctt caa gcg gag cac ttc cgt gaa atg aaa gaa tac ctc acg gat 1488
Ala Leu Gln Ala Glu His Phe Arg Glu Met Lys Glu Tyr Leu Thr Asp
460 465 470
cag ttg ctt gtg agt gct gct att acc ggc acc aat gcg cta gtt ggt 1536
Gln Leu Leu Val Ser Ala Ala Ile Thr Gly Thr Asn Ala Leu Val Gly
475 480 485 490
cct gcc gat gtg gta cat caa ttg gat ctc gac tat ttg gat gat cat 1584
Pro Ala Asp Val Val His Gln Leu Asp Leu Asp Tyr Leu Asp Asp His
495 500 505
agc tac tgg gat cat cct cac ttt cct aat act gcc tgg gat agc tac 1632
Ser Tyr Trp Asp His Pro His Phe Pro Asn Thr Ala Trp Asp Ser Tyr
510 515 520
gac tgg ctc att aac aac caa ccg cag gtg cta gac cct aac ttt gaa 1680
Asp Trp Leu Ile Asn Asn Gln Pro Gln Val Leu Asp Pro Asn Phe Glu
525 530 535
gcc atc acc cat gct ttt tct gga ctg gca cgc acc gat caa cct ttc 1728
Ala Ile Thr His Ala Phe Ser Gly Leu Ala Arg Thr Asp Gln Pro Phe
540 545 550
aca ctt tcc gaa tac aac cac ggt gct cct aat cgc tac cgc gtt gag 1776
Thr Leu Ser Glu Tyr Asn His Gly Ala Pro Asn Arg Tyr Arg Val Glu
555 560 565 570
atg ccc cat agc ata ttg gcc tat gct gcc ttt cag ggg gca gat ggc 1824
Met Pro His Ser Ile Leu Ala Tyr Ala Ala Phe Gln Gly Ala Asp Gly
575 580 585
atc atg ttt tat act tac gcc gga gag cgc aat caa gac aac gat ctt 1872
Ile Met Phe Tyr Thr Tyr Ala Gly Glu Arg Asn Gln Asp Asn Asp Leu
590 595 600
gtt aat aat ttc ttt gac ttg cac cgt gac cat tcc ata atg gcc caa 1920
Val Asn Asn Phe Phe Asp Leu His Arg Asp His Ser Ile Met Ala Gln
605 610 615
ttt cca ggg gtc gcg atg gct tac cga cga ggg tac ctt cag gaa gca 1968
Phe Pro Gly Val Ala Met Ala Tyr Arg Arg Gly Tyr Leu Gln Glu Ala
620 625 630
caa caa ccc tta atg gcc aat tac aaa gaa gaa gat atc cat agg ttt 2016
Gln Gln Pro Leu Met Ala Asn Tyr Lys Glu Glu Asp Ile His Arg Phe
635 640 645 650
cct atc gta gac aat caa ggc cgc tgg ggg cgt tat aca cct tat gac 2064
Pro Ile Val Asp Asn Gln Gly Arg Trp Gly Arg Tyr Thr Pro Tyr Asp
655 660 665
aaa agg tta att ttg aca aca ggc gta cag acg ggt agt tac gac gct 2112
Lys Arg Leu Ile Leu Thr Thr Gly Val Gln Thr Gly Ser Tyr Asp Ala
670 675 680
cca caa acc agt aat ttt acg gag tgg cct tct cct cca gaa gag gta 2160
Pro Gln Thr Ser Asn Phe Thr Glu Trp Pro Ser Pro Pro Glu Glu Val
685 690 695
ttt aca aca ttc aat gga gaa aca acg ctg aac act act gaa ggg cta 2208
Phe Thr Thr Phe Asn Gly Glu Thr Thr Leu Asn Thr Thr Glu Gly Leu
700 705 710
tta acc acc aat acc gat aaa ttt tgt agt gtt aca ggt ttc ttt tct 2256
Leu Thr Thr Asn Thr Asp Lys Phe Cys Ser Val Thr Gly Phe Phe Ser
715 720 725 730
acc gcc aca gat atg aca ttg gat gcc ttg acc ata aat tct ggc aat 2304
Thr Ala Thr Asp Met Thr Leu Asp Ala Leu Thr Ile Asn Ser Gly Asn
735 740 745
gac ttt ggg act ttg caa tgg atc agt ctt gat gat caa cca cta cct 2352
Asp Phe Gly Thr Leu Gln Trp Ile Ser Leu Asp Asp Gln Pro Leu Pro
750 755 760
gaa gct aaa aaa tct tta atc acc tta act gct gcc cag caa aac aca 2400
Glu Ala Lys Lys Ser Leu Ile Thr Leu Thr Ala Ala Gln Gln Asn Thr
765 770 775
aac atg act tgg aat ggc acc aat acc att cac aac aat tgg ggt aac 2448
Asn Met Thr Trp Asn Gly Thr Asn Thr Ile His Asn Asn Trp Gly Asn
780 785 790
gca ccg acg gaa caa aaa cca cta cag gtg gca ata gag atg gca tta 2496
Ala Pro Thr Glu Gln Lys Pro Leu Gln Val Ala Ile Glu Met Ala Leu
795 800 805 810
aat gcc gat tat ata aaa ctt tac cct tta gat gtt tat gcc aca cct 2544
Asn Ala Asp Tyr Ile Lys Leu Tyr Pro Leu Asp Val Tyr Ala Thr Pro
815 820 825
acg gac tct atc cta gta tta cca aat agt caa ggc cat ttt cct att 2592
Thr Asp Ser Ile Leu Val Leu Pro Asn Ser Gln Gly His Phe Pro Ile
830 835 840
ctc tta gat caa tac caa tac gaa acc cta tgg ttt ggc att aat act 2640
Leu Leu Asp Gln Tyr Gln Tyr Glu Thr Leu Trp Phe Gly Ile Asn Thr
845 850 855
ttt att ggc cca gtc agc act ctt gaa agc gac cag cca act cca ttt 2688
Phe Ile Gly Pro Val Ser Thr Leu Glu Ser Asp Gln Pro Thr Pro Phe
860 865 870
cac ttc tac cct aat ccg gta tta agt gga caa cct gtg caa att aca 2736
His Phe Tyr Pro Asn Pro Val Leu Ser Gly Gln Pro Val Gln Ile Thr
875 880 885 890
gga cca gaa aaa agc act ata ctg ctt ttc aac atc tta ggg cag ttg 2784
Gly Pro Glu Lys Ser Thr Ile Leu Leu Phe Asn Ile Leu Gly Gln Leu
895 900 905
gtt aat caa caa gaa atc aat acc cct ttt tat cgc tta gat acc act 2832
Val Asn Gln Gln Glu Ile Asn Thr Pro Phe Tyr Arg Leu Asp Thr Thr
910 915 920
ggc tta aca gct ggc act tac caa tta gtg ttc cta aac gaa aat agg 2880
Gly Leu Thr Ala Gly Thr Tyr Gln Leu Val Phe Leu Asn Glu Asn Arg
925 930 935
caa cga cta aat aat acc cta ttg atc atc aaa taa 2916
Gln Arg Leu Asn Asn Thr Leu Leu Ile Ile Lys
940 945
<210> 6
<211> 971
<212> PRT
<213> Lewinella cohaerens
<400> 6
Met Thr Ile His Phe Arg Ile Gln Leu Ser Leu Phe Ala Leu Val Phe
-20 -15 -10
Ser Ser Leu Leu Phe Gly Gln Asn Phe Ser Asn Gly Phe Pro Phe Ala
-5 -1 1 5 10
Leu Pro Val Asp Asp Asn Thr Ser Ser Val Phe Leu Pro Ala Phe Pro
15 20 25
Ala Ser Pro Ile Thr Glu Ala Lys Arg Val Val Pro Glu Gly Arg Gln
30 35 40
Phe Val Arg Gln Gly Glu Ala Ile Arg Phe Trp Gly Val Asn Ile Thr
45 50 55
Ser Ser Ala Cys Phe Pro Thr His Thr Glu Ala Glu Thr Ile Ala Arg
60 65 70
Arg Leu Arg Lys Met Gly Ile Asn Leu Val Arg Phe His His Leu Asp
75 80 85 90
Asn Pro Ala Trp Ala Gly Asn Glu Gly Thr Ile Phe Leu Asn Ser Gln
95 100 105
Asp Asn Thr Leu Gln Ile Asp Pro Val Ser Met Asp Arg Leu Asn Tyr
110 115 120
Phe Ile Ser Arg Leu Lys Gln Glu Gly Val Tyr Val Asn Leu Asn Leu
125 130 135
His Val Thr Arg Thr Phe Arg Leu Asn Asp Gly Val Pro Leu Ala Asp
140 145 150
Ser Ile Ala Asp Phe Gly Lys Val Val Thr Leu Tyr Asp Pro Gln Leu
155 160 165 170
Gln Ala Leu Gln Lys Glu Tyr Ala Asn Glu Leu Leu Ala Gln Val Asn
175 180 185
Pro Tyr Thr Gly Ile Thr Leu Ala Leu Asp Pro Val Val Val Met Val
190 195 200
Glu Met Asn Asn Glu Asn Ser Ile Tyr Gly Trp Trp Lys Ser Asn Ala
205 210 215
Leu Arg Pro Phe Asn Gln Gly Gly Arg Leu Thr Val Tyr His His Glu
220 225 230
Met Leu Asn Asp Arg Trp His Thr Phe Leu Gly Gln Glu Tyr Ala Asp
235 240 245 250
Asp Glu Ser Leu Ala Ala Ser Trp Asn Asn Gly Thr Ile Pro Ala Gly
255 260 265
Thr Glu Glu Asn Leu Thr Asn Pro Asp Leu Glu Glu Gly Leu Leu Gln
270 275 280
Ala Pro Trp Leu Leu Glu Thr His Asp Ile Ala Gln Ala Asn Ile Thr
285 290 295
Leu Asp Asn Thr Asn Pro Gln Ser Gly Asn Gln Cys Val Ala Leu Gln
300 305 310
Val Thr Gln Ala Thr Gly Thr Glu Trp His Ile Gln Phe Lys Gln Asn
315 320 325 330
Asp Leu Asn Phe Gln Arg Asp Ser Thr Tyr Glu Leu Arg Phe Trp Ala
335 340 345
Arg Thr Asp Thr Glu Arg Asp Phe Ser Ile Ser Phe Leu Arg Asp Asp
350 355 360
Ala Pro Tyr Thr Trp Tyr Ser Gly Arg Thr Phe Thr Ala Asn Thr Gln
365 370 375
Trp Gln Glu Phe Arg Leu Leu Phe Thr Ala Ser Glu Ser Thr Thr Ala
380 385 390
Gly Arg Leu Ser Ile Ser Pro Leu Gly Gly Asn Gly Thr Tyr Trp Phe
395 400 405 410
Asp Asn Phe Ser Leu Ser Asn Pro Ala Val Asp Gly Leu Leu Pro Gly
415 420 425
Glu Ser Leu Asn Thr Ala Ser Ile Lys Arg Ile Pro Trp Ser Gln Arg
430 435 440
Leu Ser Tyr Thr Pro Ala Arg Val Ala Asp Leu Ser Arg Phe Tyr Val
445 450 455
Ala Leu Gln Ala Glu His Phe Arg Glu Met Lys Glu Tyr Leu Thr Asp
460 465 470
Gln Leu Leu Val Ser Ala Ala Ile Thr Gly Thr Asn Ala Leu Val Gly
475 480 485 490
Pro Ala Asp Val Val His Gln Leu Asp Leu Asp Tyr Leu Asp Asp His
495 500 505
Ser Tyr Trp Asp His Pro His Phe Pro Asn Thr Ala Trp Asp Ser Tyr
510 515 520
Asp Trp Leu Ile Asn Asn Gln Pro Gln Val Leu Asp Pro Asn Phe Glu
525 530 535
Ala Ile Thr His Ala Phe Ser Gly Leu Ala Arg Thr Asp Gln Pro Phe
540 545 550
Thr Leu Ser Glu Tyr Asn His Gly Ala Pro Asn Arg Tyr Arg Val Glu
555 560 565 570
Met Pro His Ser Ile Leu Ala Tyr Ala Ala Phe Gln Gly Ala Asp Gly
575 580 585
Ile Met Phe Tyr Thr Tyr Ala Gly Glu Arg Asn Gln Asp Asn Asp Leu
590 595 600
Val Asn Asn Phe Phe Asp Leu His Arg Asp His Ser Ile Met Ala Gln
605 610 615
Phe Pro Gly Val Ala Met Ala Tyr Arg Arg Gly Tyr Leu Gln Glu Ala
620 625 630
Gln Gln Pro Leu Met Ala Asn Tyr Lys Glu Glu Asp Ile His Arg Phe
635 640 645 650
Pro Ile Val Asp Asn Gln Gly Arg Trp Gly Arg Tyr Thr Pro Tyr Asp
655 660 665
Lys Arg Leu Ile Leu Thr Thr Gly Val Gln Thr Gly Ser Tyr Asp Ala
670 675 680
Pro Gln Thr Ser Asn Phe Thr Glu Trp Pro Ser Pro Pro Glu Glu Val
685 690 695
Phe Thr Thr Phe Asn Gly Glu Thr Thr Leu Asn Thr Thr Glu Gly Leu
700 705 710
Leu Thr Thr Asn Thr Asp Lys Phe Cys Ser Val Thr Gly Phe Phe Ser
715 720 725 730
Thr Ala Thr Asp Met Thr Leu Asp Ala Leu Thr Ile Asn Ser Gly Asn
735 740 745
Asp Phe Gly Thr Leu Gln Trp Ile Ser Leu Asp Asp Gln Pro Leu Pro
750 755 760
Glu Ala Lys Lys Ser Leu Ile Thr Leu Thr Ala Ala Gln Gln Asn Thr
765 770 775
Asn Met Thr Trp Asn Gly Thr Asn Thr Ile His Asn Asn Trp Gly Asn
780 785 790
Ala Pro Thr Glu Gln Lys Pro Leu Gln Val Ala Ile Glu Met Ala Leu
795 800 805 810
Asn Ala Asp Tyr Ile Lys Leu Tyr Pro Leu Asp Val Tyr Ala Thr Pro
815 820 825
Thr Asp Ser Ile Leu Val Leu Pro Asn Ser Gln Gly His Phe Pro Ile
830 835 840
Leu Leu Asp Gln Tyr Gln Tyr Glu Thr Leu Trp Phe Gly Ile Asn Thr
845 850 855
Phe Ile Gly Pro Val Ser Thr Leu Glu Ser Asp Gln Pro Thr Pro Phe
860 865 870
His Phe Tyr Pro Asn Pro Val Leu Ser Gly Gln Pro Val Gln Ile Thr
875 880 885 890
Gly Pro Glu Lys Ser Thr Ile Leu Leu Phe Asn Ile Leu Gly Gln Leu
895 900 905
Val Asn Gln Gln Glu Ile Asn Thr Pro Phe Tyr Arg Leu Asp Thr Thr
910 915 920
Gly Leu Thr Ala Gly Thr Tyr Gln Leu Val Phe Leu Asn Glu Asn Arg
925 930 935
Gln Arg Leu Asn Asn Thr Leu Leu Ile Ile Lys
940 945
<210> 7
<211> 2565
<212> DNA
<213> Chthoniobacter flavus
<220>
<221> CDS
<222> (1)..(2562)
<220>
<221> 信號肽
<222> (1)..(72)
<220>
<221> 成熟肽
<222> (73)..(2562)
<400> 7
atg aat ctt cgc caa act ctc ccc gtc ctc tcc gtt gcg gcc gcc tta 48
Met Asn Leu Arg Gln Thr Leu Pro Val Leu Ser Val Ala Ala Ala Leu
-20 -15 -10
ctt acg gcg cca gtc gtt cgc gct gcc gat ttg ttc cct ttc gtc ctg 96
Leu Thr Ala Pro Val Val Arg Ala Ala Asp Leu Phe Pro Phe Val Leu
-5 -1 1 5
ccg tgg gac gat gcc agc cct tcc atc acc aac gtc agc tcc tgg ctg 144
Pro Trp Asp Asp Ala Ser Pro Ser Ile Thr Asn Val Ser Ser Trp Leu
10 15 20
gac aag ccg gcc ggg aaa gac ggc ttc gtc tac acg cac gat gga cat 192
Asp Lys Pro Ala Gly Lys Asp Gly Phe Val Tyr Thr His Asp Gly His
25 30 35 40
ctt ttc gcc ggc aag aag cgc atc cgt ttc ttt ggg gtc aac ctc gcc 240
Leu Phe Ala Gly Lys Lys Arg Ile Arg Phe Phe Gly Val Asn Leu Ala
45 50 55
ttc gcc gga aat ttc ccc aat cac aac gat gcc gac ccc gtg gcg gct 288
Phe Ala Gly Asn Phe Pro Asn His Asn Asp Ala Asp Pro Val Ala Ala
60 65 70
cgc atg gca aaa ttt ggc atc aac tgt gtc cgc ttt cac cac atg gat 336
Arg Met Ala Lys Phe Gly Ile Asn Cys Val Arg Phe His His Met Asp
75 80 85
acg ggc ttt gcg ccg gcc gga ttg ctg aag aag gac aag aag acc ttc 384
Thr Gly Phe Ala Pro Ala Gly Leu Leu Lys Lys Asp Lys Lys Thr Phe
90 95 100
gac gag gac tcg ctc gac cgg ctc gat tac ttc att gcc cag ctc aaa 432
Asp Glu Asp Ser Leu Asp Arg Leu Asp Tyr Phe Ile Ala Gln Leu Lys
105 110 115 120
aag aac ggg atc tat gcc gac ctg aat ctc cac gtc ggc ctc gaa tat 480
Lys Asn Gly Ile Tyr Ala Asp Leu Asn Leu His Val Gly Leu Glu Tyr
125 130 135
ccc ggc ttc aag aaa tgg gaa ggc gct tcg aac ttc ttc aag ggc gtg 528
Pro Gly Phe Lys Lys Trp Glu Gly Ala Ser Asn Phe Phe Lys Gly Val
140 145 150
gac aat ttt ttt cca ccg ttc atc gag cag cag cgc gag tac gcg cgc 576
Asp Asn Phe Phe Pro Pro Phe Ile Glu Gln Gln Arg Glu Tyr Ala Arg
155 160 165
atg ctg ctc acg cac gtc aat gct tat acc cac aag cct tat acc gat 624
Met Leu Leu Thr His Val Asn Ala Tyr Thr His Lys Pro Tyr Thr Asp
170 175 180
gaa tcg gcc gtc gcc ttc atc gag atc aac aat gag aat ggg ctg atc 672
Glu Ser Ala Val Ala Phe Ile Glu Ile Asn Asn Glu Asn Gly Leu Ile
185 190 195 200
atg gaa tgg aac aac ggg acg ctc gat gcc atg ccc gat cct ttc gcc 720
Met Glu Trp Asn Asn Gly Thr Leu Asp Ala Met Pro Asp Pro Phe Ala
205 210 215
gcc gag ttg cga aag cag tgg aac gac tgg ttg aaa aag aaa tac gac 768
Ala Glu Leu Arg Lys Gln Trp Asn Asp Trp Leu Lys Lys Lys Tyr Asp
220 225 230
acc ccg gcc aag ctc gcc ggg gca tgg gga aaa ggc gcg gag ccg ctc 816
Thr Pro Ala Lys Leu Ala Gly Ala Trp Gly Lys Gly Ala Glu Pro Leu
235 240 245
ggt cag gag atg ctc aag ccc acg cat acc gcc tgg cat ctc gag caa 864
Gly Gln Glu Met Leu Lys Pro Thr His Thr Ala Trp His Leu Glu Gln
250 255 260
cac ggc gag gcc aag tcg gag ttg agt tcc gaa ccc ggc gaa ggg tcc 912
His Gly Glu Ala Lys Ser Glu Leu Ser Ser Glu Pro Gly Glu Gly Ser
265 270 275 280
gcg ggg gaa acc ctg cac gtc cac gta acc caa ccg ggc cag gaa agc 960
Ala Gly Glu Thr Leu His Val His Val Thr Gln Pro Gly Gln Glu Ser
285 290 295
tgg cat gtg cag ttg gga cag gcg ggg cta aag ctg gcc gcc ggc aag 1008
Trp His Val Gln Leu Gly Gln Ala Gly Leu Lys Leu Ala Ala Gly Lys
300 305 310
acc tac acg ctg cac ttg cgc gcc aag gcg gac gct ccc cgg cgg att 1056
Thr Tyr Thr Leu His Leu Arg Ala Lys Ala Asp Ala Pro Arg Arg Ile
315 320 325
agc atc ggg ctg agc cag gct cat gaa ccg tgg aag aca ctt ggc agc 1104
Ser Ile Gly Leu Ser Gln Ala His Glu Pro Trp Lys Thr Leu Gly Ser
330 335 340
cag agt gtc cgg ctc acc acg gag tgg cag gac gtc cat ttc tcc ata 1152
Gln Ser Val Arg Leu Thr Thr Glu Trp Gln Asp Val His Phe Ser Ile
345 350 355 360
ccg gtc gcg aat acc gag gaa aat gcc cgc ttc tcc ttc acc agt ctc 1200
Pro Val Ala Asn Thr Glu Glu Asn Ala Arg Phe Ser Phe Thr Ser Leu
365 370 375
ggc agc gcg gtc ggt gac tac tgg ttt tcc gac gcg tcg ctg cgt cct 1248
Gly Ser Ala Val Gly Asp Tyr Trp Phe Ser Asp Ala Ser Leu Arg Pro
380 385 390
ggc ggg gtc atc gcg ctg caa gcg ggt gaa tcg gtc ggg aac att cct 1296
Gly Gly Val Ile Ala Leu Gln Ala Gly Glu Ser Val Gly Asn Ile Pro
395 400 405
ttc ttc cgc aag aaa gaa atc ggc atg cgc acc ctc acc gca caa cgc 1344
Phe Phe Arg Lys Lys Glu Ile Gly Met Arg Thr Leu Thr Ala Gln Arg
410 415 420
gat tgg aac gct ttc ctc gtc gac acc gag gtg aac tat tgg acg ggc 1392
Asp Trp Asn Ala Phe Leu Val Asp Thr Glu Val Asn Tyr Trp Thr Gly
425 430 435 440
atg cgc cat ttc gtc cgc gaa gag ttg cat gcg cac agc cag gtc gtc 1440
Met Arg His Phe Val Arg Glu Glu Leu His Ala His Ser Gln Val Val
445 450 455
ggc tcg gcc acc ggc ttc agc cca tgg ctg gcg cag gcg aag ctc gat 1488
Gly Ser Ala Thr Gly Phe Ser Pro Trp Leu Ala Gln Ala Lys Leu Asp
460 465 470
gtc gtc gat gcg cac agc tat tgg cag cat ccg cat ttt ccc cac aaa 1536
Val Val Asp Ala His Ser Tyr Trp Gln His Pro His Phe Pro His Lys
475 480 485
cca tgg gac ccg ggc gac tgg acg gtg caa aac gtc tcg atg gcc ggc 1584
Pro Trp Asp Pro Gly Asp Trp Thr Val Gln Asn Val Ser Met Ala Gly
490 495 500
gcg ccc gac gga ggc aca ctc ccg ggc ctc gca cta cgg cgc gtg gcc 1632
Ala Pro Asp Gly Gly Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Ala
505 510 515 520
ggc aag cct ttc atc gtc acc gaa tat aac gcc tcc gca ccg aac acc 1680
Gly Lys Pro Phe Ile Val Thr Glu Tyr Asn Ala Ser Ala Pro Asn Thr
525 530 535
tat tcg agt gag gct ttc ctc gaa ctc tgc gcc atc gcg ggc ttg cag 1728
Tyr Ser Ser Glu Ala Phe Leu Glu Leu Cys Ala Ile Ala Gly Leu Gln
540 545 550
gac tgg gac ggg gtc ttt gct ttt gcc tac agc cac cgc gaa aac gat 1776
Asp Trp Asp Gly Val Phe Ala Phe Ala Tyr Ser His Arg Glu Asn Asp
555 560 565
tgg aac acc gag cac atc atg ggc ttt ttc gat atc gac cag cac ccg 1824
Trp Asn Thr Glu His Ile Met Gly Phe Phe Asp Ile Asp Gln His Pro
570 575 580
acg aag atg gcc acg cta ccc gcg gcg ctc gcg ctc ttt atg cgg ggc 1872
Thr Lys Met Ala Thr Leu Pro Ala Ala Leu Ala Leu Phe Met Arg Gly
585 590 595 600
gat atc aaa ccc ccg ggc gaa ccc gtc atc gcg gac acc acc tgg aac 1920
Asp Ile Lys Pro Pro Gly Glu Pro Val Ile Ala Asp Thr Thr Trp Asn
605 610 615
gac gcg ctt gaa tcg gtc cgc aaa gga gga tcg tgg gtc gat gcc aat 1968
Asp Ala Leu Glu Ser Val Arg Lys Gly Gly Ser Trp Val Asp Ala Asn
620 625 630
acc tac ggc att ccg aaa gag gaa gcg ttt cgg cgc gcc atc ggc atg 2016
Thr Tyr Gly Ile Pro Lys Glu Glu Ala Phe Arg Arg Ala Ile Gly Met
635 640 645
cgc atc ggc cag gcc acc aaa gtc aac gtg ccg ccg cca tcc gga gat 2064
Arg Ile Gly Gln Ala Thr Lys Val Asn Val Pro Pro Pro Ser Gly Asp
650 655 660
tcg tcg gtg att cgc agt gac aac ggc cag ttc acc tgg gac acc gtt 2112
Ser Ser Val Ile Arg Ser Asp Asn Gly Gln Phe Thr Trp Asp Thr Val
665 670 675 680
tcg cac cgc atg ctc ctc gcg agt ccg cgt tca gcg ggc gtg atc ggc 2160
Ser His Arg Met Leu Leu Ala Ser Pro Arg Ser Ala Gly Val Ile Gly
685 690 695
tcg ctc aaa gag ggc gaa acg atc gac ctc ggc agt gtg cga atc atc 2208
Ser Leu Lys Glu Gly Glu Thr Ile Asp Leu Gly Ser Val Arg Ile Ile
700 705 710
ccg ggt ccc acg cgg cag aac tgg gcg acg atc aat gcc acg gtc atc 2256
Pro Gly Pro Thr Arg Gln Asn Trp Ala Thr Ile Asn Ala Thr Val Ile
715 720 725
gcc ggc ccg gat ttt gaa cac gcg aag cgc att ctc atc acg gcc acg 2304
Ala Gly Pro Asp Phe Glu His Ala Lys Arg Ile Leu Ile Thr Ala Thr
730 735 740
ggt ctg gcc gaa aac acc ggc atg aag tgg aag gat gcg cag aag tcg 2352
Gly Leu Ala Glu Asn Thr Gly Met Lys Trp Lys Asp Ala Gln Lys Ser
745 750 755 760
agc gta ggc gcc gac tgg ggc cac gag cct tcg ctc gtc gag ggg atc 2400
Ser Val Gly Ala Asp Trp Gly His Glu Pro Ser Leu Val Glu Gly Ile
765 770 775
tcc gcc aag atc ggc gtg cct ttc cag aaa ggc gct cag gcg tgg tct 2448
Ser Ala Lys Ile Gly Val Pro Phe Gln Lys Gly Ala Gln Ala Trp Ser
780 785 790
ctc gac gcg cgc ggg cag cgc caa acc gag atc cct gtg aag cga ggg 2496
Leu Asp Ala Arg Gly Gln Arg Gln Thr Glu Ile Pro Val Lys Arg Gly
795 800 805
aca ggc aaa acg gag atc gag att tcc ccc aat caa cag acg ctc tgg 2544
Thr Gly Lys Thr Glu Ile Glu Ile Ser Pro Asn Gln Gln Thr Leu Trp
810 815 820
tgg gag atc gag atc ccg taa 2565
Trp Glu Ile Glu Ile Pro
825 830
<210> 8
<211> 854
<212> PRT
<213> Chthoniobacter flavus
<400> 8
Met Asn Leu Arg Gln Thr Leu Pro Val Leu Ser Val Ala Ala Ala Leu
-20 -15 -10
Leu Thr Ala Pro Val Val Arg Ala Ala Asp Leu Phe Pro Phe Val Leu
-5 -1 1 5
Pro Trp Asp Asp Ala Ser Pro Ser Ile Thr Asn Val Ser Ser Trp Leu
10 15 20
Asp Lys Pro Ala Gly Lys Asp Gly Phe Val Tyr Thr His Asp Gly His
25 30 35 40
Leu Phe Ala Gly Lys Lys Arg Ile Arg Phe Phe Gly Val Asn Leu Ala
45 50 55
Phe Ala Gly Asn Phe Pro Asn His Asn Asp Ala Asp Pro Val Ala Ala
60 65 70
Arg Met Ala Lys Phe Gly Ile Asn Cys Val Arg Phe His His Met Asp
75 80 85
Thr Gly Phe Ala Pro Ala Gly Leu Leu Lys Lys Asp Lys Lys Thr Phe
90 95 100
Asp Glu Asp Ser Leu Asp Arg Leu Asp Tyr Phe Ile Ala Gln Leu Lys
105 110 115 120
Lys Asn Gly Ile Tyr Ala Asp Leu Asn Leu His Val Gly Leu Glu Tyr
125 130 135
Pro Gly Phe Lys Lys Trp Glu Gly Ala Ser Asn Phe Phe Lys Gly Val
140 145 150
Asp Asn Phe Phe Pro Pro Phe Ile Glu Gln Gln Arg Glu Tyr Ala Arg
155 160 165
Met Leu Leu Thr His Val Asn Ala Tyr Thr His Lys Pro Tyr Thr Asp
170 175 180
Glu Ser Ala Val Ala Phe Ile Glu Ile Asn Asn Glu Asn Gly Leu Ile
185 190 195 200
Met Glu Trp Asn Asn Gly Thr Leu Asp Ala Met Pro Asp Pro Phe Ala
205 210 215
Ala Glu Leu Arg Lys Gln Trp Asn Asp Trp Leu Lys Lys Lys Tyr Asp
220 225 230
Thr Pro Ala Lys Leu Ala Gly Ala Trp Gly Lys Gly Ala Glu Pro Leu
235 240 245
Gly Gln Glu Met Leu Lys Pro Thr His Thr Ala Trp His Leu Glu Gln
250 255 260
His Gly Glu Ala Lys Ser Glu Leu Ser Ser Glu Pro Gly Glu Gly Ser
265 270 275 280
Ala Gly Glu Thr Leu His Val His Val Thr Gln Pro Gly Gln Glu Ser
285 290 295
Trp His Val Gln Leu Gly Gln Ala Gly Leu Lys Leu Ala Ala Gly Lys
300 305 310
Thr Tyr Thr Leu His Leu Arg Ala Lys Ala Asp Ala Pro Arg Arg Ile
315 320 325
Ser Ile Gly Leu Ser Gln Ala His Glu Pro Trp Lys Thr Leu Gly Ser
330 335 340
Gln Ser Val Arg Leu Thr Thr Glu Trp Gln Asp Val His Phe Ser Ile
345 350 355 360
Pro Val Ala Asn Thr Glu Glu Asn Ala Arg Phe Ser Phe Thr Ser Leu
365 370 375
Gly Ser Ala Val Gly Asp Tyr Trp Phe Ser Asp Ala Ser Leu Arg Pro
380 385 390
Gly Gly Val Ile Ala Leu Gln Ala Gly Glu Ser Val Gly Asn Ile Pro
395 400 405
Phe Phe Arg Lys Lys Glu Ile Gly Met Arg Thr Leu Thr Ala Gln Arg
410 415 420
Asp Trp Asn Ala Phe Leu Val Asp Thr Glu Val Asn Tyr Trp Thr Gly
425 430 435 440
Met Arg His Phe Val Arg Glu Glu Leu His Ala His Ser Gln Val Val
445 450 455
Gly Ser Ala Thr Gly Phe Ser Pro Trp Leu Ala Gln Ala Lys Leu Asp
460 465 470
Val Val Asp Ala His Ser Tyr Trp Gln His Pro His Phe Pro His Lys
475 480 485
Pro Trp Asp Pro Gly Asp Trp Thr Val Gln Asn Val Ser Met Ala Gly
490 495 500
Ala Pro Asp Gly Gly Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Ala
505 510 515 520
Gly Lys Pro Phe Ile Val Thr Glu Tyr Asn Ala Ser Ala Pro Asn Thr
525 530 535
Tyr Ser Ser Glu Ala Phe Leu Glu Leu Cys Ala Ile Ala Gly Leu Gln
540 545 550
Asp Trp Asp Gly Val Phe Ala Phe Ala Tyr Ser His Arg Glu Asn Asp
555 560 565
Trp Asn Thr Glu His Ile Met Gly Phe Phe Asp Ile Asp Gln His Pro
570 575 580
Thr Lys Met Ala Thr Leu Pro Ala Ala Leu Ala Leu Phe Met Arg Gly
585 590 595 600
Asp Ile Lys Pro Pro Gly Glu Pro Val Ile Ala Asp Thr Thr Trp Asn
605 610 615
Asp Ala Leu Glu Ser Val Arg Lys Gly Gly Ser Trp Val Asp Ala Asn
620 625 630
Thr Tyr Gly Ile Pro Lys Glu Glu Ala Phe Arg Arg Ala Ile Gly Met
635 640 645
Arg Ile Gly Gln Ala Thr Lys Val Asn Val Pro Pro Pro Ser Gly Asp
650 655 660
Ser Ser Val Ile Arg Ser Asp Asn Gly Gln Phe Thr Trp Asp Thr Val
665 670 675 680
Ser His Arg Met Leu Leu Ala Ser Pro Arg Ser Ala Gly Val Ile Gly
685 690 695
Ser Leu Lys Glu Gly Glu Thr Ile Asp Leu Gly Ser Val Arg Ile Ile
700 705 710
Pro Gly Pro Thr Arg Gln Asn Trp Ala Thr Ile Asn Ala Thr Val Ile
715 720 725
Ala Gly Pro Asp Phe Glu His Ala Lys Arg Ile Leu Ile Thr Ala Thr
730 735 740
Gly Leu Ala Glu Asn Thr Gly Met Lys Trp Lys Asp Ala Gln Lys Ser
745 750 755 760
Ser Val Gly Ala Asp Trp Gly His Glu Pro Ser Leu Val Glu Gly Ile
765 770 775
Ser Ala Lys Ile Gly Val Pro Phe Gln Lys Gly Ala Gln Ala Trp Ser
780 785 790
Leu Asp Ala Arg Gly Gln Arg Gln Thr Glu Ile Pro Val Lys Arg Gly
795 800 805
Thr Gly Lys Thr Glu Ile Glu Ile Ser Pro Asn Gln Gln Thr Leu Trp
810 815 820
Trp Glu Ile Glu Ile Pro
825 830
<210> 9
<211> 2715
<212> DNA
<213> 堆肥宏基因組
<220>
<221> CDS
<222> (1)..(2712)
<220>
<221> 信號肽
<222> (1)..(75)
<220>
<221> 成熟肽
<222> (115)..(2706)
<220>
<221> prot_結(jié)構(gòu)域
<222> (115)..(804)
<220>
<221> prot_結(jié)構(gòu)域
<222> (1504)..(2706)
<220>
<221> prot_結(jié)構(gòu)域
<222> (1516)..(2043)
<400> 9
atg gtc cac ccc cgc ctg cgc aga ccc ctc ctc cga ctg ctc ctc gcc 48
Met Val His Pro Arg Leu Arg Arg Pro Leu Leu Arg Leu Leu Leu Ala
-35 -30 -25
gtt tct ccc gtc ttt tcc gcc ctc gct gcg tcg gcc gcg gac ggc gtc 96
Val Ser Pro Val Phe Ser Ala Leu Ala Ala Ser Ala Ala Asp Gly Val
-20 -15 -10
ccc ttc gac ggc ttc ccc ttt cac atc ccg ccc acc ggc acc gtc ccc 144
Pro Phe Asp Gly Phe Pro Phe His Ile Pro Pro Thr Gly Thr Val Pro
-5 -1 1 5 10
ggc acc gcg ccc gcc gcc ctc ggc ctc ccc gcc cgc ccc gcc gac agc 192
Gly Thr Ala Pro Ala Ala Leu Gly Leu Pro Ala Arg Pro Ala Asp Ser
15 20 25
ccg atc gtc atc cgc ggc gac cag ttc atc cgg gcc gac acc ggc gaa 240
Pro Ile Val Ile Arg Gly Asp Gln Phe Ile Arg Ala Asp Thr Gly Glu
30 35 40
ccc atc cgc ttc tgg ggc gtc aac ctc tcc ttc gcc ggc gcg ttc ccc 288
Pro Ile Arg Phe Trp Gly Val Asn Leu Ser Phe Ala Gly Ala Phe Pro
45 50 55
gat cac gaa aac gcc gat cgc atc gcc gcc cgc ctg gcc agc ctc ggc 336
Asp His Glu Asn Ala Asp Arg Ile Ala Ala Arg Leu Ala Ser Leu Gly
60 65 70
gtc aac atc gtg cgc ttc cac cac atc gac cag cgc cgc ttc ccc ggc 384
Val Asn Ile Val Arg Phe His His Ile Asp Gln Arg Arg Phe Pro Gly
75 80 85 90
ggc ctc tgg cac cgc gac gcc ccc ggc gcc tcc gcc aat ccc cgc gag 432
Gly Leu Trp His Arg Asp Ala Pro Gly Ala Ser Ala Asn Pro Arg Glu
95 100 105
gac gac atc gag cac cgc gtc ttc gac ccc gaa tcc ctc gac cgc ctc 480
Asp Asp Ile Glu His Arg Val Phe Asp Pro Glu Ser Leu Asp Arg Leu
110 115 120
gac tac ctc gtc gcc cgc ctg aag gcg cac ggc atc tac gcc aat ctc 528
Asp Tyr Leu Val Ala Arg Leu Lys Ala His Gly Ile Tyr Ala Asn Leu
125 130 135
aac ctc aag gtc tcc cgc acc ttc agc acc tac gac ggc ccc gcc ttc 576
Asn Leu Lys Val Ser Arg Thr Phe Ser Thr Tyr Asp Gly Pro Ala Phe
140 145 150
ccc gcg ccc gcc gcc gac gaa ttc acc ccc cgc aaa ggc aaa ggc ttc 624
Pro Ala Pro Ala Ala Asp Glu Phe Thr Pro Arg Lys Gly Lys Gly Phe
155 160 165 170
gac cag ttc tac acg ccg gcc atc gag gcc cag aaa acc ttc gcc cgc 672
Asp Gln Phe Tyr Thr Pro Ala Ile Glu Ala Gln Lys Thr Phe Ala Arg
175 180 185
ctc ctc ctc acc cac cgc aac ccc tac acc ggc tcc acc tac gcc gcc 720
Leu Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Ser Thr Tyr Ala Ala
190 195 200
gag ccc gcc gtc gcc caa gtc gag atc aac aac gag aac ggc atc ctc 768
Glu Pro Ala Val Ala Gln Val Glu Ile Asn Asn Glu Asn Gly Ile Leu
205 210 215
tgg gcc tgg aac tac aac ctc ctc gac cgc ctc ccc gcc ccc tat ctc 816
Trp Ala Trp Asn Tyr Asn Leu Leu Asp Arg Leu Pro Ala Pro Tyr Leu
220 225 230
gcc gaa ctc tcc tcc cgc tgg aac acc tgg ctg cgc gcc cgc tac ccc 864
Ala Glu Leu Ser Ser Arg Trp Asn Thr Trp Leu Arg Ala Arg Tyr Pro
235 240 245 250
gac acc gcc gcc ctc cgc gcc gcc tgg gcg gac ggc tcg gcc gcc gca 912
Asp Thr Ala Ala Leu Arg Ala Ala Trp Ala Asp Gly Ser Ala Ala Ala
255 260 265
tcc tcc gtc ctt tcc ccc ggc gcg ccc gcg agc acc gat ctt ctc gcc 960
Ser Ser Val Leu Ser Pro Gly Ala Pro Ala Ser Thr Asp Leu Leu Ala
270 275 280
ggc gtc gcc ccg gaa ctc cgc acc gcc aga aga gcc cgc gcc acg ctc 1008
Gly Val Ala Pro Glu Leu Arg Thr Ala Arg Arg Ala Arg Ala Thr Leu
285 290 295
ctc ccc ccg ccc gcg cgc gac acc ggc gac gcg gac gcc gac gac acc 1056
Leu Pro Pro Pro Ala Arg Asp Thr Gly Asp Ala Asp Ala Asp Asp Thr
300 305 310
acc gcg ctg cgc ctc acc gtg gac gaa gtc ccc gac gcc gcc tcg tgg 1104
Thr Ala Leu Arg Leu Thr Val Asp Glu Val Pro Asp Ala Ala Ser Trp
315 320 325 330
aac gtc cgc tgc aac tac ccg ctc acc ctc tcc ccc ggc gcg acc tac 1152
Asn Val Arg Cys Asn Tyr Pro Leu Thr Leu Ser Pro Gly Ala Thr Tyr
335 340 345
ctc gcc acc ctc cgc ctc cgg gcc aac cgt gag gaa aaa atc gcc ctg 1200
Leu Ala Thr Leu Arg Leu Arg Ala Asn Arg Glu Glu Lys Ile Ala Leu
350 355 360
cgc ctg cgc gac ccc gac aac caa aac ctc gcc gcg ccg cgc acg ctc 1248
Arg Leu Arg Asp Pro Asp Asn Gln Asn Leu Ala Ala Pro Arg Thr Leu
365 370 375
aac ctc gag acc gac tgg aaa cgg cac acc ctc acc ttt gcc gtc ccc 1296
Asn Leu Glu Thr Asp Trp Lys Arg His Thr Leu Thr Phe Ala Val Pro
380 385 390
gcc ggc gac cac ccc gcc gac acg ctc gcc gcc ctg ctc tcc ctc gaa 1344
Ala Gly Asp His Pro Ala Asp Thr Leu Ala Ala Leu Leu Ser Leu Glu
395 400 405 410
gcg ggc cgc ccc ggt ctc gtc ctc gac atc gac gcc gcc tcc ttc cgc 1392
Ala Gly Arg Pro Gly Leu Val Leu Asp Ile Asp Ala Ala Ser Phe Arg
415 420 425
ctc aac ctc ctc gcc ggc ctg ccc tcc ggc caa ggc atc gac ccc ggc 1440
Leu Asn Leu Leu Ala Gly Leu Pro Ser Gly Gln Gly Ile Asp Pro Gly
430 435 440
gac cgc ccc gtc gcc tgg gtg ctc cgc cgc gac ctg ccc gac cgc acc 1488
Asp Arg Pro Val Ala Trp Val Leu Arg Arg Asp Leu Pro Asp Arg Thr
445 450 455
ccc gcc acc gtc acc gac atc atg cgc ttc ctg cgc gac acc gag gtc 1536
Pro Ala Thr Val Thr Asp Ile Met Arg Phe Leu Arg Asp Thr Glu Val
460 465 470
gcc tac tgg cgc gag atg cac gcc tat ctc cgc gac gaa ctc ggc gtc 1584
Ala Tyr Trp Arg Glu Met His Ala Tyr Leu Arg Asp Glu Leu Gly Val
475 480 485 490
gtc gcc ccc atc gcc ggc acc gcc gtc ggc tac tcc acc ccg cag atc 1632
Val Ala Pro Ile Ala Gly Thr Ala Val Gly Tyr Ser Thr Pro Gln Ile
495 500 505
cag gcc gag acc ggc gac ttc gtg gac acc cac cgc tac tgg ggc gcg 1680
Gln Ala Glu Thr Gly Asp Phe Val Asp Thr His Arg Tyr Trp Gly Ala
510 515 520
ccg cgt ttc ccc agg ttc gac cgc tcc aag ccc tgg acc gtc gaa cag 1728
Pro Arg Phe Pro Arg Phe Asp Arg Ser Lys Pro Trp Thr Val Glu Gln
525 530 535
aag gcc atg gtc gcg cat ccc ggc tca tcc aca ttc gaa cgc atg gcc 1776
Lys Ala Met Val Ala His Pro Gly Ser Ser Thr Phe Glu Arg Met Ala
540 545 550
gcc cgt cgc gtc ttc ggg cgt cct ttc acc gtc acc gaa tac aac cac 1824
Ala Arg Arg Val Phe Gly Arg Pro Phe Thr Val Thr Glu Tyr Asn His
555 560 565 570
ccg ccc tcc agc gac cat cac gcc gag gcc ttc ccg ctg ctc gcc ctc 1872
Pro Pro Ser Ser Asp His His Ala Glu Ala Phe Pro Leu Leu Ala Leu
575 580 585
tac ggc tcc gcg cag gat tgg gac gcg ctc ttc caa ttc gcc tac gcc 1920
Tyr Gly Ser Ala Gln Asp Trp Asp Ala Leu Phe Gln Phe Ala Tyr Ala
590 595 600
cac tcc ccc gac gcc tgg gaa ggc gac acg ctc cgg ggc ttc ttc gac 1968
His Ser Pro Asp Ala Trp Glu Gly Asp Thr Leu Arg Gly Phe Phe Asp
605 610 615
acc gcg ccc aac ccc gcg cac acc gtc gcc gcg ctg gcc gca tcc gac 2016
Thr Ala Pro Asn Pro Ala His Thr Val Ala Ala Leu Ala Ala Ser Asp
620 625 630
atc ttc cga aaa cgc cgc gtc gcc ccg ttc tcc gaa gcc gtc gcc gtc 2064
Ile Phe Arg Lys Arg Arg Val Ala Pro Phe Ser Glu Ala Val Ala Val
635 640 645 650
cac gtt cct ctc gaa cgc cag ctc gaa cgg cag aac aac tac gcc ttc 2112
His Val Pro Leu Glu Arg Gln Leu Glu Arg Gln Asn Asn Tyr Ala Phe
655 660 665
ccg cga ctc gtc gag gcc tgc gcc gtc ttc ggc ggc ctc ccc gcc gac 2160
Pro Arg Leu Val Glu Ala Cys Ala Val Phe Gly Gly Leu Pro Ala Asp
670 675 680
gcc tgg ctg cac cgc cgc gtc ggt ctc gcg ctc cac ccc ggc gaa caa 2208
Ala Trp Leu His Arg Arg Val Gly Leu Ala Leu His Pro Gly Glu Gln
685 690 695
ccc gcg tcg ctc cct ccc gcc gcc tct ggc cat cac ctt gtc tgg gac 2256
Pro Ala Ser Leu Pro Pro Ala Ala Ser Gly His His Leu Val Trp Asp
700 705 710
gcc gcg cac gcc ggc tcc gcc cac gtc cgc ttc gtc ggc gac ggc gcc 2304
Ala Ala His Ala Gly Ser Ala His Val Arg Phe Val Gly Asp Gly Ala
715 720 725 730
gcc ggc ctc gtc ggt ttc gtc gcc ggc cgg aca ctc gac ctc ggc tgg 2352
Ala Gly Leu Val Gly Phe Val Ala Gly Arg Thr Leu Asp Leu Gly Trp
735 740 745
ctg cgt atc act cca ggc act aca tcg ctc gac ggt ttc tcc gtc gtc 2400
Leu Arg Ile Thr Pro Gly Thr Thr Ser Leu Asp Gly Phe Ser Val Val
750 755 760
atg ctc aac gcc gtc gac ggc cag ccc ctc ggc gcg ccc ggc cgc cac 2448
Met Leu Asn Ala Val Asp Gly Gln Pro Leu Gly Ala Pro Gly Arg His
765 770 775
ctg ctc acc gtc gtc gtg cgc gcc gcc aac cgc cac atg gga tgg aac 2496
Leu Leu Thr Val Val Val Arg Ala Ala Asn Arg His Met Gly Trp Asn
780 785 790
gcc gac cgc acc ggc ttc ggc acc gcg tgg ggc gaa ggc ccc gcc ctc 2544
Ala Asp Arg Thr Gly Phe Gly Thr Ala Trp Gly Glu Gly Pro Ala Leu
795 800 805 810
gtc gag acc gcc ccc gtc gac ctc gcc ttc ctc aag ccg gcg cgc gtc 2592
Val Glu Thr Ala Pro Val Asp Leu Ala Phe Leu Lys Pro Ala Arg Val
815 820 825
cac gcg ctc gcg ccc gac ggc acg cgc cgc gtc gag ctc gcg ccc gcg 2640
His Ala Leu Ala Pro Asp Gly Thr Arg Arg Val Glu Leu Ala Pro Ala
830 835 840
gag ggt tcc ggc tcc gcc gtc cgg ttc cgc gcc ggc ccg gaa tac cgc 2688
Glu Gly Ser Gly Ser Ala Val Arg Phe Arg Ala Gly Pro Glu Tyr Arg
845 850 855
acc ctc tgg tat gag att tcc ctc tga 2715
Thr Leu Trp Tyr Glu Ile Ser Leu
860 865
<210> 10
<211> 904
<212> PRT
<213> 堆肥宏基因組
<400> 10
Met Val His Pro Arg Leu Arg Arg Pro Leu Leu Arg Leu Leu Leu Ala
-35 -30 -25
Val Ser Pro Val Phe Ser Ala Leu Ala Ala Ser Ala Ala Asp Gly Val
-20 -15 -10
Pro Phe Asp Gly Phe Pro Phe His Ile Pro Pro Thr Gly Thr Val Pro
-5 -1 1 5 10
Gly Thr Ala Pro Ala Ala Leu Gly Leu Pro Ala Arg Pro Ala Asp Ser
15 20 25
Pro Ile Val Ile Arg Gly Asp Gln Phe Ile Arg Ala Asp Thr Gly Glu
30 35 40
Pro Ile Arg Phe Trp Gly Val Asn Leu Ser Phe Ala Gly Ala Phe Pro
45 50 55
Asp His Glu Asn Ala Asp Arg Ile Ala Ala Arg Leu Ala Ser Leu Gly
60 65 70
Val Asn Ile Val Arg Phe His His Ile Asp Gln Arg Arg Phe Pro Gly
75 80 85 90
Gly Leu Trp His Arg Asp Ala Pro Gly Ala Ser Ala Asn Pro Arg Glu
95 100 105
Asp Asp Ile Glu His Arg Val Phe Asp Pro Glu Ser Leu Asp Arg Leu
110 115 120
Asp Tyr Leu Val Ala Arg Leu Lys Ala His Gly Ile Tyr Ala Asn Leu
125 130 135
Asn Leu Lys Val Ser Arg Thr Phe Ser Thr Tyr Asp Gly Pro Ala Phe
140 145 150
Pro Ala Pro Ala Ala Asp Glu Phe Thr Pro Arg Lys Gly Lys Gly Phe
155 160 165 170
Asp Gln Phe Tyr Thr Pro Ala Ile Glu Ala Gln Lys Thr Phe Ala Arg
175 180 185
Leu Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Ser Thr Tyr Ala Ala
190 195 200
Glu Pro Ala Val Ala Gln Val Glu Ile Asn Asn Glu Asn Gly Ile Leu
205 210 215
Trp Ala Trp Asn Tyr Asn Leu Leu Asp Arg Leu Pro Ala Pro Tyr Leu
220 225 230
Ala Glu Leu Ser Ser Arg Trp Asn Thr Trp Leu Arg Ala Arg Tyr Pro
235 240 245 250
Asp Thr Ala Ala Leu Arg Ala Ala Trp Ala Asp Gly Ser Ala Ala Ala
255 260 265
Ser Ser Val Leu Ser Pro Gly Ala Pro Ala Ser Thr Asp Leu Leu Ala
270 275 280
Gly Val Ala Pro Glu Leu Arg Thr Ala Arg Arg Ala Arg Ala Thr Leu
285 290 295
Leu Pro Pro Pro Ala Arg Asp Thr Gly Asp Ala Asp Ala Asp Asp Thr
300 305 310
Thr Ala Leu Arg Leu Thr Val Asp Glu Val Pro Asp Ala Ala Ser Trp
315 320 325 330
Asn Val Arg Cys Asn Tyr Pro Leu Thr Leu Ser Pro Gly Ala Thr Tyr
335 340 345
Leu Ala Thr Leu Arg Leu Arg Ala Asn Arg Glu Glu Lys Ile Ala Leu
350 355 360
Arg Leu Arg Asp Pro Asp Asn Gln Asn Leu Ala Ala Pro Arg Thr Leu
365 370 375
Asn Leu Glu Thr Asp Trp Lys Arg His Thr Leu Thr Phe Ala Val Pro
380 385 390
Ala Gly Asp His Pro Ala Asp Thr Leu Ala Ala Leu Leu Ser Leu Glu
395 400 405 410
Ala Gly Arg Pro Gly Leu Val Leu Asp Ile Asp Ala Ala Ser Phe Arg
415 420 425
Leu Asn Leu Leu Ala Gly Leu Pro Ser Gly Gln Gly Ile Asp Pro Gly
430 435 440
Asp Arg Pro Val Ala Trp Val Leu Arg Arg Asp Leu Pro Asp Arg Thr
445 450 455
Pro Ala Thr Val Thr Asp Ile Met Arg Phe Leu Arg Asp Thr Glu Val
460 465 470
Ala Tyr Trp Arg Glu Met His Ala Tyr Leu Arg Asp Glu Leu Gly Val
475 480 485 490
Val Ala Pro Ile Ala Gly Thr Ala Val Gly Tyr Ser Thr Pro Gln Ile
495 500 505
Gln Ala Glu Thr Gly Asp Phe Val Asp Thr His Arg Tyr Trp Gly Ala
510 515 520
Pro Arg Phe Pro Arg Phe Asp Arg Ser Lys Pro Trp Thr Val Glu Gln
525 530 535
Lys Ala Met Val Ala His Pro Gly Ser Ser Thr Phe Glu Arg Met Ala
540 545 550
Ala Arg Arg Val Phe Gly Arg Pro Phe Thr Val Thr Glu Tyr Asn His
555 560 565 570
Pro Pro Ser Ser Asp His His Ala Glu Ala Phe Pro Leu Leu Ala Leu
575 580 585
Tyr Gly Ser Ala Gln Asp Trp Asp Ala Leu Phe Gln Phe Ala Tyr Ala
590 595 600
His Ser Pro Asp Ala Trp Glu Gly Asp Thr Leu Arg Gly Phe Phe Asp
605 610 615
Thr Ala Pro Asn Pro Ala His Thr Val Ala Ala Leu Ala Ala Ser Asp
620 625 630
Ile Phe Arg Lys Arg Arg Val Ala Pro Phe Ser Glu Ala Val Ala Val
635 640 645 650
His Val Pro Leu Glu Arg Gln Leu Glu Arg Gln Asn Asn Tyr Ala Phe
655 660 665
Pro Arg Leu Val Glu Ala Cys Ala Val Phe Gly Gly Leu Pro Ala Asp
670 675 680
Ala Trp Leu His Arg Arg Val Gly Leu Ala Leu His Pro Gly Glu Gln
685 690 695
Pro Ala Ser Leu Pro Pro Ala Ala Ser Gly His His Leu Val Trp Asp
700 705 710
Ala Ala His Ala Gly Ser Ala His Val Arg Phe Val Gly Asp Gly Ala
715 720 725 730
Ala Gly Leu Val Gly Phe Val Ala Gly Arg Thr Leu Asp Leu Gly Trp
735 740 745
Leu Arg Ile Thr Pro Gly Thr Thr Ser Leu Asp Gly Phe Ser Val Val
750 755 760
Met Leu Asn Ala Val Asp Gly Gln Pro Leu Gly Ala Pro Gly Arg His
765 770 775
Leu Leu Thr Val Val Val Arg Ala Ala Asn Arg His Met Gly Trp Asn
780 785 790
Ala Asp Arg Thr Gly Phe Gly Thr Ala Trp Gly Glu Gly Pro Ala Leu
795 800 805 810
Val Glu Thr Ala Pro Val Asp Leu Ala Phe Leu Lys Pro Ala Arg Val
815 820 825
His Ala Leu Ala Pro Asp Gly Thr Arg Arg Val Glu Leu Ala Pro Ala
830 835 840
Glu Gly Ser Gly Ser Ala Val Arg Phe Arg Ala Gly Pro Glu Tyr Arg
845 850 855
Thr Leu Trp Tyr Glu Ile Ser Leu
860 865
<210> 11
<211> 2586
<212> DNA
<213> 人類糞便宏基因組
<220>
<221> CDS
<222> (1)..(2583)
<220>
<221> 信號肽
<222> (1)..(72)
<220>
<221> 成熟肽
<222> (103)..(2565)
<220>
<221> prot_結(jié)構(gòu)域
<222> (103)..(768)
<220>
<221> prot_結(jié)構(gòu)域
<222> (886)..(1209)
<220>
<221> prot_結(jié)構(gòu)域
<222> (1297)..(2565)
<400> 11
atg aca cga aaa ttc ttt att cca ctc acg ctc ggc ggg ctg ttg ctc 48
Met Thr Arg Lys Phe Phe Ile Pro Leu Thr Leu Gly Gly Leu Leu Leu
-30 -25 -20
gga agt ccg ctt aca gcc gcg aac acg gat gcc gtt ccg gag ggc tat 96
Gly Ser Pro Leu Thr Ala Ala Asn Thr Asp Ala Val Pro Glu Gly Tyr
-15 -10 -5
cag ccg ttc ccg ttg caa tgg gat gac aca ctc gcc ggg aca gca acc 144
Gln Pro Phe Pro Leu Gln Trp Asp Asp Thr Leu Ala Gly Thr Ala Thr
-1 1 5 10
gat gtt tct ttc ctc aac gaa aaa cct gcc gga aaa aac ggg cgt ctg 192
Asp Val Ser Phe Leu Asn Glu Lys Pro Ala Gly Lys Asn Gly Arg Leu
15 20 25 30
atc gtt cgc gac gcc cat ttt gtc gaa agt tcc aca gga aaa cgt gtc 240
Ile Val Arg Asp Ala His Phe Val Glu Ser Ser Thr Gly Lys Arg Val
35 40 45
cgt ctg att gga atc ggg att ggc ggt gat gcg ctt ttc gaa atg gat 288
Arg Leu Ile Gly Ile Gly Ile Gly Gly Asp Ala Leu Phe Glu Met Asp
50 55 60
cac gct gcg gca gaa aag gct gca cgg cgt ctt gca aaa gcc ggt gtc 336
His Ala Ala Ala Glu Lys Ala Ala Arg Arg Leu Ala Lys Ala Gly Val
65 70 75
aac gtg gtc cgt ttc cac aat ctt gat ggt tcc gat cga gac cgg gat 384
Asn Val Val Arg Phe His Asn Leu Asp Gly Ser Asp Arg Asp Arg Asp
80 85 90
act ctc att gat ttc aag caa ccg ggc tcc gag cac ttc aat ccc aga 432
Thr Leu Ile Asp Phe Lys Gln Pro Gly Ser Glu His Phe Asn Pro Arg
95 100 105 110
cac ctt gat att ctg gac tat ttc ttc gcc tgt ctg aaa aag gag gga 480
His Leu Asp Ile Leu Asp Tyr Phe Phe Ala Cys Leu Lys Lys Glu Gly
115 120 125
atc tat act gtg atg ggt ctg aaa gtc aac cgg act ctc cgg aaa ggg 528
Ile Tyr Thr Val Met Gly Leu Lys Val Asn Arg Thr Leu Arg Lys Gly
130 135 140
gat gat ctt ccg gaa ggc gtc gac aac gcc gga aaa cgg gtt gac cgc 576
Asp Asp Leu Pro Glu Gly Val Asp Asn Ala Gly Lys Arg Val Asp Arg
145 150 155
ttc aac cgc gca tgg atc gaa tcg cag aaa cgc tgg gcg aaa aac ctg 624
Phe Asn Arg Ala Trp Ile Glu Ser Gln Lys Arg Trp Ala Lys Asn Leu
160 165 170
ctg acc cgt caa aat ccc tat acg aag aca acg ctg gcg gaa gat ccc 672
Leu Thr Arg Gln Asn Pro Tyr Thr Lys Thr Thr Leu Ala Glu Asp Pro
175 180 185 190
gcc gtt ctg agt gtg gaa ctc aac aac gaa agt gcg ctt ctg ttt gaa 720
Ala Val Leu Ser Val Glu Leu Asn Asn Glu Ser Ala Leu Leu Phe Glu
195 200 205
aat ctg aac tgg atc gac acg ctt ccc gct ccc tac aaa cgg gag ctg 768
Asn Leu Asn Trp Ile Asp Thr Leu Pro Ala Pro Tyr Lys Arg Glu Leu
210 215 220
acc gcc ctc tgg aat gac ttc ctt tcc cgc aaa tac aaa aac gac aaa 816
Thr Ala Leu Trp Asn Asp Phe Leu Ser Arg Lys Tyr Lys Asn Asp Lys
225 230 235
gcc ctc ctt gcc gcc tgg aac cgg gac acc agt ctc ccc gga gcc tct 864
Ala Leu Leu Ala Ala Trp Asn Arg Asp Thr Ser Leu Pro Gly Ala Ser
240 245 250
ctc ctg aat ccg gaa ggc cga tgg ggc ttc gaa cag ccg gac gca ttg 912
Leu Leu Asn Pro Glu Gly Arg Trp Gly Phe Glu Gln Pro Asp Ala Leu
255 260 265 270
aag gtt ttc cgc aat acc gcc gac tcg gtt tcg gca acc gta aca cgg 960
Lys Val Phe Arg Asn Thr Ala Asp Ser Val Ser Ala Thr Val Thr Arg
275 280 285
cgc agt aat cag gac tgg cag atc cag ttt cag cgt tcc gga ctc tcc 1008
Arg Ser Asn Gln Asp Trp Gln Ile Gln Phe Gln Arg Ser Gly Leu Ser
290 295 300
ctt gaa aac gga aaa acc tac acg ctg gag ttc gac gtg cga ggc gaa 1056
Leu Glu Asn Gly Lys Thr Tyr Thr Leu Glu Phe Asp Val Arg Gly Glu
305 310 315
ggc gac ccg atc cgc atc gtt ctg tcc cag gac cgt ccc gac tgg cac 1104
Gly Asp Pro Ile Arg Ile Val Leu Ser Gln Asp Arg Pro Asp Trp His
320 325 330
aac tgc gga ctc gaa gcc tcc tta tcc ctg acc tcc gaa tgg aga cac 1152
Asn Cys Gly Leu Glu Ala Ser Leu Ser Leu Thr Ser Glu Trp Arg His
335 340 345 350
cag cgc tac agc ttc cag gca aag aat gcg gat ccc gga cac gtc cgg 1200
Gln Arg Tyr Ser Phe Gln Ala Lys Asn Ala Asp Pro Gly His Val Arg
355 360 365
atc tct ttc ggt gtc gga cat gca cgg aaa gtg gaa atc gcc gcc gtc 1248
Ile Ser Phe Gly Val Gly His Ala Arg Lys Val Glu Ile Ala Ala Val
370 375 380
cgc ctt ttc cct gga acg aaa ccg gtc tcc gcc cgt ctc tcc tcc ggc 1296
Arg Leu Phe Pro Gly Thr Lys Pro Val Ser Ala Arg Leu Ser Ser Gly
385 390 395
agc att ccg ctt ccc gtt gcg ccg aac gat gcc atg agc gct gac tta 1344
Ser Ile Pro Leu Pro Val Ala Pro Asn Asp Ala Met Ser Ala Asp Leu
400 405 410
ctg gag ttt atg gtc gaa ctt gac acc cgc tat gcg gag gag atg ctg 1392
Leu Glu Phe Met Val Glu Leu Asp Thr Arg Tyr Ala Glu Glu Met Leu
415 420 425 430
gac tac ctg cgg aag gat ctc aac gta aaa agt ctg gtg atc gac acg 1440
Asp Tyr Leu Arg Lys Asp Leu Asn Val Lys Ser Leu Val Ile Asp Thr
435 440 445
cag atc gac tgg ggc gga ctc tcc gga ctc cgc cgc gaa aaa cgg atg 1488
Gln Ile Asp Trp Gly Gly Leu Ser Gly Leu Arg Arg Glu Lys Arg Met
450 455 460
gat tac gtt gat gcc cat gcc tac tgg ggg cat ccg gaa ttc acc gga 1536
Asp Tyr Val Asp Ala His Ala Tyr Trp Gly His Pro Glu Phe Thr Gly
465 470 475
gga agc tgg gag ttc aaa ccg ggt tgc tgg aag att ctc aac cag tca 1584
Gly Ser Trp Glu Phe Lys Pro Gly Cys Trp Lys Ile Leu Asn Gln Ser
480 485 490
cag att ccc cgc att gta cac ggc ggc tgg tgt ccg ctg gag cag ttc 1632
Gln Ile Pro Arg Ile Val His Gly Gly Trp Cys Pro Leu Glu Gln Phe
495 500 505 510
agc cga tac cgg atc agc acc aag cct ttt tcc att tcc gaa cac gat 1680
Ser Arg Tyr Arg Ile Ser Thr Lys Pro Phe Ser Ile Ser Glu His Asp
515 520 525
tat ccc tat ccg cac gac tac gcg gtt gag atg atg ccg ctt ctg gtc 1728
Tyr Pro Tyr Pro His Asp Tyr Ala Val Glu Met Met Pro Leu Leu Val
530 535 540
agc gtg gct ctg cgg cag gac tgg gac atg ctt cag ctc ttc atc cac 1776
Ser Val Ala Leu Arg Gln Asp Trp Asp Met Leu Gln Leu Phe Ile His
545 550 555
ggg acc ttc ctt acc cgc gga aaa tcc gcc ggc atc agc cac atg ttt 1824
Gly Thr Phe Leu Thr Arg Gly Lys Ser Ala Gly Ile Ser His Met Phe
560 565 570
gat cag acc aat cat ccc ggc aag atc ggt ttc ttt ccg gct gct gcg 1872
Asp Gln Thr Asn His Pro Gly Lys Ile Gly Phe Phe Pro Ala Ala Ala
575 580 585 590
ctg att ttc cgt cgc ggt atg ttc gaa ccc gct ccg aaa acg gtg gaa 1920
Leu Ile Phe Arg Arg Gly Met Phe Glu Pro Ala Pro Lys Thr Val Glu
595 600 605
ctc cgt ctt ccg gag cag ccg tgg cgc tgg ttc ggc aat cgc ttt gac 1968
Leu Arg Leu Pro Glu Gln Pro Trp Arg Trp Phe Gly Asn Arg Phe Asp
610 615 620
cgg gcg tgg gcg gag acc gga gta cgg cgc agt ctt ctt gac tcc cgg 2016
Arg Ala Trp Ala Glu Thr Gly Val Arg Arg Ser Leu Leu Asp Ser Arg
625 630 635
atg aca atc gtt ccc gat gcg ctg aaa acg ccc ggt cgg gct gag gca 2064
Met Thr Ile Val Pro Asp Ala Leu Lys Thr Pro Gly Arg Ala Glu Ala
640 645 650
tgc gtc tcc gct ccc gat gaa ccg gac cgc ccg atg cgc gga tgg acc 2112
Cys Val Ser Ala Pro Asp Glu Pro Asp Arg Pro Met Arg Gly Trp Thr
655 660 665 670
gaa gga gag aaa aac ttc ttt aca gcg gtc gct ccg cag tgt att gtt 2160
Glu Gly Glu Lys Asn Phe Phe Thr Ala Val Ala Pro Gln Cys Ile Val
675 680 685
ctc tgc ggt cat ttc ggc gga agg acg atg gat gtc ggc gat ctc cgt 2208
Leu Cys Gly His Phe Gly Gly Arg Thr Met Asp Val Gly Asp Leu Arg
690 695 700
ctc cgg gca cgt cca ttc ccc ggc gat ttc ggc gcg gca gtt ctg gtc 2256
Leu Arg Ala Arg Pro Phe Pro Gly Asp Phe Gly Ala Ala Val Leu Val
705 710 715
tcc cgc gat gaa cgt cct ctt ccg gca tcc gga gat att ctc ttc acg 2304
Ser Arg Asp Glu Arg Pro Leu Pro Ala Ser Gly Asp Ile Leu Phe Thr
720 725 730
att gca ggg cgc ttc gaa aac tcc ggg gtt atc tgg aac aag gag cgt 2352
Ile Ala Gly Arg Phe Glu Asn Ser Gly Val Ile Trp Asn Lys Glu Arg
735 740 745 750
gat gcg ctc ctc aac cgt tct cca tgg tgg ggc aat cct ccg gtt ctc 2400
Asp Ala Leu Leu Asn Arg Ser Pro Trp Trp Gly Asn Pro Pro Val Leu
755 760 765
ggt aca aaa acc gat gct gcc atc cgt ttc aaa acc gat ggg ccg cgc 2448
Gly Thr Lys Thr Asp Ala Ala Ile Arg Phe Lys Thr Asp Gly Pro Arg
770 775 780
acg gtc tac gcc ctt gat tcc aat gga aag cgg act gcc gaa ctg ccg 2496
Thr Val Tyr Ala Leu Asp Ser Asn Gly Lys Arg Thr Ala Glu Leu Pro
785 790 795
tcc gca tgg aag gac ggg cat ctc tcc ttc cat gtt cat ccg tca cac 2544
Ser Ala Trp Lys Asp Gly His Leu Ser Phe His Val His Pro Ser His
800 805 810
cgt tcc atg cac tac gaa atc gtc aaa gga gaa aac ctg tga 2586
Arg Ser Met His Tyr Glu Ile Val Lys Gly Glu Asn Leu
815 820 825
<210> 12
<211> 861
<212> PRT
<213> 人類糞便宏基因組
<400> 12
Met Thr Arg Lys Phe Phe Ile Pro Leu Thr Leu Gly Gly Leu Leu Leu
-30 -25 -20
Gly Ser Pro Leu Thr Ala Ala Asn Thr Asp Ala Val Pro Glu Gly Tyr
-15 -10 -5
Gln Pro Phe Pro Leu Gln Trp Asp Asp Thr Leu Ala Gly Thr Ala Thr
-1 1 5 10
Asp Val Ser Phe Leu Asn Glu Lys Pro Ala Gly Lys Asn Gly Arg Leu
15 20 25 30
Ile Val Arg Asp Ala His Phe Val Glu Ser Ser Thr Gly Lys Arg Val
35 40 45
Arg Leu Ile Gly Ile Gly Ile Gly Gly Asp Ala Leu Phe Glu Met Asp
50 55 60
His Ala Ala Ala Glu Lys Ala Ala Arg Arg Leu Ala Lys Ala Gly Val
65 70 75
Asn Val Val Arg Phe His Asn Leu Asp Gly Ser Asp Arg Asp Arg Asp
80 85 90
Thr Leu Ile Asp Phe Lys Gln Pro Gly Ser Glu His Phe Asn Pro Arg
95 100 105 110
His Leu Asp Ile Leu Asp Tyr Phe Phe Ala Cys Leu Lys Lys Glu Gly
115 120 125
Ile Tyr Thr Val Met Gly Leu Lys Val Asn Arg Thr Leu Arg Lys Gly
130 135 140
Asp Asp Leu Pro Glu Gly Val Asp Asn Ala Gly Lys Arg Val Asp Arg
145 150 155
Phe Asn Arg Ala Trp Ile Glu Ser Gln Lys Arg Trp Ala Lys Asn Leu
160 165 170
Leu Thr Arg Gln Asn Pro Tyr Thr Lys Thr Thr Leu Ala Glu Asp Pro
175 180 185 190
Ala Val Leu Ser Val Glu Leu Asn Asn Glu Ser Ala Leu Leu Phe Glu
195 200 205
Asn Leu Asn Trp Ile Asp Thr Leu Pro Ala Pro Tyr Lys Arg Glu Leu
210 215 220
Thr Ala Leu Trp Asn Asp Phe Leu Ser Arg Lys Tyr Lys Asn Asp Lys
225 230 235
Ala Leu Leu Ala Ala Trp Asn Arg Asp Thr Ser Leu Pro Gly Ala Ser
240 245 250
Leu Leu Asn Pro Glu Gly Arg Trp Gly Phe Glu Gln Pro Asp Ala Leu
255 260 265 270
Lys Val Phe Arg Asn Thr Ala Asp Ser Val Ser Ala Thr Val Thr Arg
275 280 285
Arg Ser Asn Gln Asp Trp Gln Ile Gln Phe Gln Arg Ser Gly Leu Ser
290 295 300
Leu Glu Asn Gly Lys Thr Tyr Thr Leu Glu Phe Asp Val Arg Gly Glu
305 310 315
Gly Asp Pro Ile Arg Ile Val Leu Ser Gln Asp Arg Pro Asp Trp His
320 325 330
Asn Cys Gly Leu Glu Ala Ser Leu Ser Leu Thr Ser Glu Trp Arg His
335 340 345 350
Gln Arg Tyr Ser Phe Gln Ala Lys Asn Ala Asp Pro Gly His Val Arg
355 360 365
Ile Ser Phe Gly Val Gly His Ala Arg Lys Val Glu Ile Ala Ala Val
370 375 380
Arg Leu Phe Pro Gly Thr Lys Pro Val Ser Ala Arg Leu Ser Ser Gly
385 390 395
Ser Ile Pro Leu Pro Val Ala Pro Asn Asp Ala Met Ser Ala Asp Leu
400 405 410
Leu Glu Phe Met Val Glu Leu Asp Thr Arg Tyr Ala Glu Glu Met Leu
415 420 425 430
Asp Tyr Leu Arg Lys Asp Leu Asn Val Lys Ser Leu Val Ile Asp Thr
435 440 445
Gln Ile Asp Trp Gly Gly Leu Ser Gly Leu Arg Arg Glu Lys Arg Met
450 455 460
Asp Tyr Val Asp Ala His Ala Tyr Trp Gly His Pro Glu Phe Thr Gly
465 470 475
Gly Ser Trp Glu Phe Lys Pro Gly Cys Trp Lys Ile Leu Asn Gln Ser
480 485 490
Gln Ile Pro Arg Ile Val His Gly Gly Trp Cys Pro Leu Glu Gln Phe
495 500 505 510
Ser Arg Tyr Arg Ile Ser Thr Lys Pro Phe Ser Ile Ser Glu His Asp
515 520 525
Tyr Pro Tyr Pro His Asp Tyr Ala Val Glu Met Met Pro Leu Leu Val
530 535 540
Ser Val Ala Leu Arg Gln Asp Trp Asp Met Leu Gln Leu Phe Ile His
545 550 555
Gly Thr Phe Leu Thr Arg Gly Lys Ser Ala Gly Ile Ser His Met Phe
560 565 570
Asp Gln Thr Asn His Pro Gly Lys Ile Gly Phe Phe Pro Ala Ala Ala
575 580 585 590
Leu Ile Phe Arg Arg Gly Met Phe Glu Pro Ala Pro Lys Thr Val Glu
595 600 605
Leu Arg Leu Pro Glu Gln Pro Trp Arg Trp Phe Gly Asn Arg Phe Asp
610 615 620
Arg Ala Trp Ala Glu Thr Gly Val Arg Arg Ser Leu Leu Asp Ser Arg
625 630 635
Met Thr Ile Val Pro Asp Ala Leu Lys Thr Pro Gly Arg Ala Glu Ala
640 645 650
Cys Val Ser Ala Pro Asp Glu Pro Asp Arg Pro Met Arg Gly Trp Thr
655 660 665 670
Glu Gly Glu Lys Asn Phe Phe Thr Ala Val Ala Pro Gln Cys Ile Val
675 680 685
Leu Cys Gly His Phe Gly Gly Arg Thr Met Asp Val Gly Asp Leu Arg
690 695 700
Leu Arg Ala Arg Pro Phe Pro Gly Asp Phe Gly Ala Ala Val Leu Val
705 710 715
Ser Arg Asp Glu Arg Pro Leu Pro Ala Ser Gly Asp Ile Leu Phe Thr
720 725 730
Ile Ala Gly Arg Phe Glu Asn Ser Gly Val Ile Trp Asn Lys Glu Arg
735 740 745 750
Asp Ala Leu Leu Asn Arg Ser Pro Trp Trp Gly Asn Pro Pro Val Leu
755 760 765
Gly Thr Lys Thr Asp Ala Ala Ile Arg Phe Lys Thr Asp Gly Pro Arg
770 775 780
Thr Val Tyr Ala Leu Asp Ser Asn Gly Lys Arg Thr Ala Glu Leu Pro
785 790 795
Ser Ala Trp Lys Asp Gly His Leu Ser Phe His Val His Pro Ser His
800 805 810
Arg Ser Met His Tyr Glu Ile Val Lys Gly Glu Asn Leu
815 820 825
<210> 13
<211> 2712
<212> DNA
<213> 閃爍桿菌屬細菌
<400> 13
atgcggtggt ggatgttggt catcttggcg ttcatctctg gctttggggg ttggtggact 60
atgaggcaag ggttatcgca ggaaggcaaa caggatgcct tgcttttccc tttcgtttta 120
ccttgggacg atgcttctcc atcggtcacc aacatcagtc actggttgca caaacctgct 180
ggcaagtttg ggcatatccg tatcggcgct gacggtcgcc tttacgctgg caagcagcga 240
attcgtttcc tgggcgtgaa cttgtgtttc ggggcatgtt tcccgcgcaa agaggactct 300
gaaaaaattg cggcaaggat ggcgaagttc ggcatcaaca ttgttcgctt ccaccacatg 360
gacatgcaag aatttcccaa cggcatccgc cgtcggggcg tcccccacac ccgcgacctt 420
gaccctgaag cccttgacag acttgactac ctgattgccc aactgaaacg caacggcatc 480
tatgtcaact tgaacttgct cgtttcccgt cccttcaatg ccgccgacgg tttgcccaaa 540
gaaattgagc aactcggttg gaaggagcga cacatcgttg gcttcttcta cgaaccatgc 600
cttgagttgc aaaaggaata tgctcgcaag ttgctgacgc accgcaatcc ttacacgggg 660
ctcacctatg ctgaagaccc tgtcgtcgct ttcgtggaaa tcaacaacga gaacggtctc 720
attcacgctt ggcttagtgg ctctattgac cggatgccaa aagtttttca ggatgagttg 780
caacggcagt ggcatgcttg gctgaaagcc cgatacggca caacggagaa gttgcgcaaa 840
gcgtggggtg tcaaggaaga gcccttgggc aatgaaatgc tgaggaacac gaactttgag 900
gcagggttgc aaaattgggt tttggagcga cacgcgggtg ctgaagcaac agcggaagtt 960
gtcgctgaac ccatccctga actcaaaggt cttcgcttcg tccgcatcaa tgtcaccaaa 1020
cgaggacaag caggctggca tgtccaattc catcaaccga acctgaaagt ccaacccgac 1080
cgaccatata cgctttcctt ctgggcgcga gcggaacgac cttgcaccat ttcagtcgga 1140
atttcgcaag cccacgaacc ttggcagaac cttggcttca gtgccgaagt caaattgaca 1200
caggaatggc gtgaatatcg gttcaccttt accctcaaca ggggtgacga caacgctcgc 1260
gttatcttca gcaacttggg cgctcaaacg acaacttact ggttcgccgc cccctccctt 1320
cgccctggcg gaattgttgg cttggcagcc aacgaacgcc ttgaagatgg cactgtcccg 1380
attttccttc gcgctcgttt cggtgagcgc acacccgaag cgcaacggga ctggatgcga 1440
tttttgtggg agacggaaga tcgctattgg caaacaatct accgctacct caaggacgag 1500
ttggaagtta aggcattggt catcggcaca atcgtcggat gcagcacacc caacatgatg 1560
gcaaaacttg actgcgtgga cacacacgct tattggcaac atccgatgtt cccctcccga 1620
ccttgggatc ctgaggattg gattgtgccc aaccgaacga tggtcaacga acgaggcggg 1680
acgctgccag gtctggcgct gcgacgggtc ttaggcaaac ctcactccgt caccgaatac 1740
aatcatccag caccaaacac atactgcagc gaagccttcc ttttgctggc agcatatgca 1800
gccttgcagg attgggatgc tatctacgcc ttcagttact cgcaccgacg agatggttgg 1860
gacttaaggc gcattcccaa cttctttgac attgaccaac atcccacgaa gatggttacc 1920
cttatccctg cagcagcgat gtttgttcgg ggcgatgtga agcctgccaa gcagcaagtg 1980
gttgtcaggt tgacgaaaga gcaagaggtt gacttgttgc ggcgcagttg ggcttggttg 2040
ctcgtccacg caggtcatgt cggagttccc aacgaagcag cactcgtcca tcgggttgca 2100
attgcgacag atgggaagcg agttccgcca actgctctca agcccgaaca agtgaaaatt 2160
ggcggcaacc gatttgtgtc cgacactggc gaattgattt gggacttgac ggaaaaaggg 2220
cgcggggttg tcatcgttaa cgcccaaaac agcaaagccg ttatcgggtt cgtaggtggc 2280
aagcggtttg agttgagcag cgtcgtgatt gaacctgggc aaactatgca agacggttgg 2340
tgcgccatca cagtcacggc gatggaaggg aacttgccaa ctcgtccctt gcttcgtatc 2400
cttcgtccca tccgtttgct catcactgct acaggctacg cagagaacac cgacatgggt 2460
tggaaagaag ttcccggtta cccacccaaa tcaagttgcg gtcgcaactg gggcaaacca 2520
ccttcgttgg tggaaggcat ctctgccagc atcaccttgc cgttacccgc caagcgagtg 2580
caagcgtggg ctttggacga acggggtcaa cggaaatccc aaatcccagt cactgccgac 2640
ccatcaggca acgccgtcat ccgcatcagt ccccaatggc aaacgctttg gtatgaagtt 2700
gaggcgcggt aa 2712
<210> 14
<211> 903
<212> PRT
<213> 閃爍桿菌屬細菌
<400> 14
Met Arg Trp Trp Met Leu Val Ile Leu Ala Phe Ile Ser Gly Phe Gly
1 5 10 15
Gly Trp Trp Thr Met Arg Gln Gly Leu Ser Gln Glu Gly Lys Gln Asp
20 25 30
Ala Leu Leu Phe Pro Phe Val Leu Pro Trp Asp Asp Ala Ser Pro Ser
35 40 45
Val Thr Asn Ile Ser His Trp Leu His Lys Pro Ala Gly Lys Phe Gly
50 55 60
His Ile Arg Ile Gly Ala Asp Gly Arg Leu Tyr Ala Gly Lys Gln Arg
65 70 75 80
Ile Arg Phe Leu Gly Val Asn Leu Cys Phe Gly Ala Cys Phe Pro Arg
85 90 95
Lys Glu Asp Ser Glu Lys Ile Ala Ala Arg Met Ala Lys Phe Gly Ile
100 105 110
Asn Ile Val Arg Phe His His Met Asp Met Gln Glu Phe Pro Asn Gly
115 120 125
Ile Arg Arg Arg Gly Val Pro His Thr Arg Asp Leu Asp Pro Glu Ala
130 135 140
Leu Asp Arg Leu Asp Tyr Leu Ile Ala Gln Leu Lys Arg Asn Gly Ile
145 150 155 160
Tyr Val Asn Leu Asn Leu Leu Val Ser Arg Pro Phe Asn Ala Ala Asp
165 170 175
Gly Leu Pro Lys Glu Ile Glu Gln Leu Gly Trp Lys Glu Arg His Ile
180 185 190
Val Gly Phe Phe Tyr Glu Pro Cys Leu Glu Leu Gln Lys Glu Tyr Ala
195 200 205
Arg Lys Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Leu Thr Tyr Ala
210 215 220
Glu Asp Pro Val Val Ala Phe Val Glu Ile Asn Asn Glu Asn Gly Leu
225 230 235 240
Ile His Ala Trp Leu Ser Gly Ser Ile Asp Arg Met Pro Lys Val Phe
245 250 255
Gln Asp Glu Leu Gln Arg Gln Trp His Ala Trp Leu Lys Ala Arg Tyr
260 265 270
Gly Thr Thr Glu Lys Leu Arg Lys Ala Trp Gly Val Lys Glu Glu Pro
275 280 285
Leu Gly Asn Glu Met Leu Arg Asn Thr Asn Phe Glu Ala Gly Leu Gln
290 295 300
Asn Trp Val Leu Glu Arg His Ala Gly Ala Glu Ala Thr Ala Glu Val
305 310 315 320
Val Ala Glu Pro Ile Pro Glu Leu Lys Gly Leu Arg Phe Val Arg Ile
325 330 335
Asn Val Thr Lys Arg Gly Gln Ala Gly Trp His Val Gln Phe His Gln
340 345 350
Pro Asn Leu Lys Val Gln Pro Asp Arg Pro Tyr Thr Leu Ser Phe Trp
355 360 365
Ala Arg Ala Glu Arg Pro Cys Thr Ile Ser Val Gly Ile Ser Gln Ala
370 375 380
His Glu Pro Trp Gln Asn Leu Gly Phe Ser Ala Glu Val Lys Leu Thr
385 390 395 400
Gln Glu Trp Arg Glu Tyr Arg Phe Thr Phe Thr Leu Asn Arg Gly Asp
405 410 415
Asp Asn Ala Arg Val Ile Phe Ser Asn Leu Gly Ala Gln Thr Thr Thr
420 425 430
Tyr Trp Phe Ala Ala Pro Ser Leu Arg Pro Gly Gly Ile Val Gly Leu
435 440 445
Ala Ala Asn Glu Arg Leu Glu Asp Gly Thr Val Pro Ile Phe Leu Arg
450 455 460
Ala Arg Phe Gly Glu Arg Thr Pro Glu Ala Gln Arg Asp Trp Met Arg
465 470 475 480
Phe Leu Trp Glu Thr Glu Asp Arg Tyr Trp Gln Thr Ile Tyr Arg Tyr
485 490 495
Leu Lys Asp Glu Leu Glu Val Lys Ala Leu Val Ile Gly Thr Ile Val
500 505 510
Gly Cys Ser Thr Pro Asn Met Met Ala Lys Leu Asp Cys Val Asp Thr
515 520 525
His Ala Tyr Trp Gln His Pro Met Phe Pro Ser Arg Pro Trp Asp Pro
530 535 540
Glu Asp Trp Ile Val Pro Asn Arg Thr Met Val Asn Glu Arg Gly Gly
545 550 555 560
Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Leu Gly Lys Pro His Ser
565 570 575
Val Thr Glu Tyr Asn His Pro Ala Pro Asn Thr Tyr Cys Ser Glu Ala
580 585 590
Phe Leu Leu Leu Ala Ala Tyr Ala Ala Leu Gln Asp Trp Asp Ala Ile
595 600 605
Tyr Ala Phe Ser Tyr Ser His Arg Arg Asp Gly Trp Asp Leu Arg Arg
610 615 620
Ile Pro Asn Phe Phe Asp Ile Asp Gln His Pro Thr Lys Met Val Thr
625 630 635 640
Leu Ile Pro Ala Ala Ala Met Phe Val Arg Gly Asp Val Lys Pro Ala
645 650 655
Lys Gln Gln Val Val Val Arg Leu Thr Lys Glu Gln Glu Val Asp Leu
660 665 670
Leu Arg Arg Ser Trp Ala Trp Leu Leu Val His Ala Gly His Val Gly
675 680 685
Val Pro Asn Glu Ala Ala Leu Val His Arg Val Ala Ile Ala Thr Asp
690 695 700
Gly Lys Arg Val Pro Pro Thr Ala Leu Lys Pro Glu Gln Val Lys Ile
705 710 715 720
Gly Gly Asn Arg Phe Val Ser Asp Thr Gly Glu Leu Ile Trp Asp Leu
725 730 735
Thr Glu Lys Gly Arg Gly Val Val Ile Val Asn Ala Gln Asn Ser Lys
740 745 750
Ala Val Ile Gly Phe Val Gly Gly Lys Arg Phe Glu Leu Ser Ser Val
755 760 765
Val Ile Glu Pro Gly Gln Thr Met Gln Asp Gly Trp Cys Ala Ile Thr
770 775 780
Val Thr Ala Met Glu Gly Asn Leu Pro Thr Arg Pro Leu Leu Arg Ile
785 790 795 800
Leu Arg Pro Ile Arg Leu Leu Ile Thr Ala Thr Gly Tyr Ala Glu Asn
805 810 815
Thr Asp Met Gly Trp Lys Glu Val Pro Gly Tyr Pro Pro Lys Ser Ser
820 825 830
Cys Gly Arg Asn Trp Gly Lys Pro Pro Ser Leu Val Glu Gly Ile Ser
835 840 845
Ala Ser Ile Thr Leu Pro Leu Pro Ala Lys Arg Val Gln Ala Trp Ala
850 855 860
Leu Asp Glu Arg Gly Gln Arg Lys Ser Gln Ile Pro Val Thr Ala Asp
865 870 875 880
Pro Ser Gly Asn Ala Val Ile Arg Ile Ser Pro Gln Trp Gln Thr Leu
885 890 895
Trp Tyr Glu Val Glu Ala Arg
900
<210> 15
<211> 2799
<212> DNA
<213> 豐佑菌科細菌
<400> 15
atgttccccc cgatcgtccg aagcagcttt tacctcctcc ttgccgccgc gctgatcccg 60
gcctccgtca ccaccgcgcc tgccgcgacg cctgcggatg atctcccttt tgccaacggt 120
ttcccctttc acatccctcc caccggcacc gtcgccggca cggcgcccgc cgccctcgcc 180
atccccgctc gtcccgccgg agccgacggt cgggtcatcg tccgcggcga ccagttcctc 240
cttgccgata ccgggacccc catccgtttc tggggcgtca acctctgctt ctccggcgct 300
ttccccgacc acgccaccgc cgaccgcatc gccgcccgtc tcgccagtct cggcgtcaac 360
atcgtccgct tccaccacat cgaccagcgc cgctttcccg gcggcctgtg gcatcgcgat 420
tcccccggcg ccaccaacaa cccccgcgag gacaacatcg cgcaccgcac gctcgacccc 480
gaagcgctcg accgcctcga ctacctcgtc gcccgactca aggaacacgg catctacacc 540
aacctcaacc tgaaggtctc ccggatcttc agcaccttcg acgatcccgc gttcccggcc 600
cccgcgcctg gcgaaatcct tccgaagaaa ggcaaaggct tcgaccagtt ttacacgccc 660
gccatcgaag cgcagaaagc ctacgcccgc ctcctcctca cccgtcgcaa tgcctggacc 720
ggcctgacct gggccgaaga ccccgccgtc gcccaggtcg agatcaacaa cgaaaacggc 780
atcctctggg cctggaacta caacctgctc gatcgcctgc ccgcccccta cctcgccgag 840
ctcgccgcgc gctggaacac ctggctgcgc gcccgttaca cggacaccgc ggctctccgg 900
acagcctggg atccggcgag tggcgcgggc gtctcgcccg catccgacgt ggcacgggca 960
tccctgcccg tgagcgttgc ctcccggccc acctccgccg ccggtaacgc aaacgccgcc 1020
gccgcggacg ccgacctcct cgccgggatc agcccggctc ttttcaccgc gaagaaagcc 1080
cgggccacgc ttgcgcccct gcccgcgccc gacaccggcg atgccgacgc cgccgaatcc 1140
gccggcctgc gcctggccgt caacaacgtc cccggcgacg caacctggaa cgtccgttgc 1200
agttactccc tcacgcttcc cgcgctttcc tccggtgcgc cctggaccgt cacccttcgc 1260
cttcgcgcca acaaacccga aaaaatccgt ctgcgcctcc gttcccccga gcaaaacaag 1320
gatatcgccc cgccccgcac gctcaatctc gccaccacct ggaagaccca caccgtcact 1380
tttgccatcc ccgagcatgc cgctcccctc gccgcgcaac tgacgctcga agccggcctc 1440
cccggcctcg ttctcgacat cgcctccgcc agcctccgct cccacacccg ttcggggctc 1500
ccgcgcggcg agggacttgc ctccgacgag cgccccgtca cctggattcc gcgccgcgac 1560
ctctccgggc gaaccgatgc cgtcgtccgc gatgtcatgc acttcctgcg cgacaccgag 1620
atcgcctact ggcgtgaaat gcacgcgttc cttcgtgatg aactccgcgt cgccgctccc 1680
atcacgacca cggccgtcgg ttacaccacg tcgcagatcg ccgccgaaac cgctgacttc 1740
atcgacaccc atcgctactg gggcgcgcct cgctttcccg gtttcaaccg cagcaaaccc 1800
tggaccgtcg aacaaaaagc catggtcgcc cgtcccggcg aatccgccat cgaacgcatg 1860
gccgcccgcc gcgtcttcgg cctccctttc accgtcaccg aatacaacca cccgccctcc 1920
agcgatcacc acgccgaagg cttccccctc ctcgccctct ggggcgctgc gcaggattgg 1980
aacggcctct tcgaattcgc ctactcccac agcgacgcct gggaaagcga caccatgacc 2040
ggcttcttcg acaccgctcc caaccctgtt cacaccgtcg ccgctctcgc cgcctccgac 2100
ctcttccgca accgccgcct cgcccccctc gctcccgcga aatccggata cgtgcccctc 2160
gatcgccagc tcgaacggca aaacaacgac accttccctc gcctcatcga ggccgacgcc 2220
gttttcggcg gactcccgcc cgacgcctgg ctcgccaatc gtgtcggcct cgttcgccgc 2280
gccgatgaac agccggaaac gctcccgccg ccgccggcca gccagcaact cgcctggacc 2340
gccaccgatc ccgccaccgc ccacgtccgc tacacaggcg agggcgtcgc cggcctcgtc 2400
ggcttcgttt ccggccagac cctcgatctc ggctggctcc gtatcacccc cggagataca 2460
tcgctcggcg gtttttccgt cgtcatgctc aactccgtgg acggtcagcc cctcggcgca 2520
tccggccgct atctgctcac cacggcggtg cgcgccgcca accgcggcat gggctggaac 2580
gccgaccgca ccggcttcga caaaaaatgg ggatccggcc ccgcccaggc cgaatccgct 2640
ccggtcacgc tcgacttcgc ctccgcctcc ggcgtccgtg tgtatccgct gaatcccgac 2700
ggaacacgcc gcccggaact cccgcccgcc tccaccccgg gccgcttcga agccacaccc 2760
gccagcaaaa ccctctggtt tgaaatcaca ttcccgtaa 2799
<210> 16
<211> 932
<212> PRT
<213> 豐佑菌科細菌
<400> 16
Met Phe Pro Pro Ile Val Arg Ser Ser Phe Tyr Leu Leu Leu Ala Ala
1 5 10 15
Ala Leu Ile Pro Ala Ser Val Thr Thr Ala Pro Ala Ala Thr Pro Ala
20 25 30
Asp Asp Leu Pro Phe Ala Asn Gly Phe Pro Phe His Ile Pro Pro Thr
35 40 45
Gly Thr Val Ala Gly Thr Ala Pro Ala Ala Leu Ala Ile Pro Ala Arg
50 55 60
Pro Ala Gly Ala Asp Gly Arg Val Ile Val Arg Gly Asp Gln Phe Leu
65 70 75 80
Leu Ala Asp Thr Gly Thr Pro Ile Arg Phe Trp Gly Val Asn Leu Cys
85 90 95
Phe Ser Gly Ala Phe Pro Asp His Ala Thr Ala Asp Arg Ile Ala Ala
100 105 110
Arg Leu Ala Ser Leu Gly Val Asn Ile Val Arg Phe His His Ile Asp
115 120 125
Gln Arg Arg Phe Pro Gly Gly Leu Trp His Arg Asp Ser Pro Gly Ala
130 135 140
Thr Asn Asn Pro Arg Glu Asp Asn Ile Ala His Arg Thr Leu Asp Pro
145 150 155 160
Glu Ala Leu Asp Arg Leu Asp Tyr Leu Val Ala Arg Leu Lys Glu His
165 170 175
Gly Ile Tyr Thr Asn Leu Asn Leu Lys Val Ser Arg Ile Phe Ser Thr
180 185 190
Phe Asp Asp Pro Ala Phe Pro Ala Pro Ala Pro Gly Glu Ile Leu Pro
195 200 205
Lys Lys Gly Lys Gly Phe Asp Gln Phe Tyr Thr Pro Ala Ile Glu Ala
210 215 220
Gln Lys Ala Tyr Ala Arg Leu Leu Leu Thr Arg Arg Asn Ala Trp Thr
225 230 235 240
Gly Leu Thr Trp Ala Glu Asp Pro Ala Val Ala Gln Val Glu Ile Asn
245 250 255
Asn Glu Asn Gly Ile Leu Trp Ala Trp Asn Tyr Asn Leu Leu Asp Arg
260 265 270
Leu Pro Ala Pro Tyr Leu Ala Glu Leu Ala Ala Arg Trp Asn Thr Trp
275 280 285
Leu Arg Ala Arg Tyr Thr Asp Thr Ala Ala Leu Arg Thr Ala Trp Asp
290 295 300
Pro Ala Ser Gly Ala Gly Val Ser Pro Ala Ser Asp Val Ala Arg Ala
305 310 315 320
Ser Leu Pro Val Ser Val Ala Ser Arg Pro Thr Ser Ala Ala Gly Asn
325 330 335
Ala Asn Ala Ala Ala Ala Asp Ala Asp Leu Leu Ala Gly Ile Ser Pro
340 345 350
Ala Leu Phe Thr Ala Lys Lys Ala Arg Ala Thr Leu Ala Pro Leu Pro
355 360 365
Ala Pro Asp Thr Gly Asp Ala Asp Ala Ala Glu Ser Ala Gly Leu Arg
370 375 380
Leu Ala Val Asn Asn Val Pro Gly Asp Ala Thr Trp Asn Val Arg Cys
385 390 395 400
Ser Tyr Ser Leu Thr Leu Pro Ala Leu Ser Ser Gly Ala Pro Trp Thr
405 410 415
Val Thr Leu Arg Leu Arg Ala Asn Lys Pro Glu Lys Ile Arg Leu Arg
420 425 430
Leu Arg Ser Pro Glu Gln Asn Lys Asp Ile Ala Pro Pro Arg Thr Leu
435 440 445
Asn Leu Ala Thr Thr Trp Lys Thr His Thr Val Thr Phe Ala Ile Pro
450 455 460
Glu His Ala Ala Pro Leu Ala Ala Gln Leu Thr Leu Glu Ala Gly Leu
465 470 475 480
Pro Gly Leu Val Leu Asp Ile Ala Ser Ala Ser Leu Arg Ser His Thr
485 490 495
Arg Ser Gly Leu Pro Arg Gly Glu Gly Leu Ala Ser Asp Glu Arg Pro
500 505 510
Val Thr Trp Ile Pro Arg Arg Asp Leu Ser Gly Arg Thr Asp Ala Val
515 520 525
Val Arg Asp Val Met His Phe Leu Arg Asp Thr Glu Ile Ala Tyr Trp
530 535 540
Arg Glu Met His Ala Phe Leu Arg Asp Glu Leu Arg Val Ala Ala Pro
545 550 555 560
Ile Thr Thr Thr Ala Val Gly Tyr Thr Thr Ser Gln Ile Ala Ala Glu
565 570 575
Thr Ala Asp Phe Ile Asp Thr His Arg Tyr Trp Gly Ala Pro Arg Phe
580 585 590
Pro Gly Phe Asn Arg Ser Lys Pro Trp Thr Val Glu Gln Lys Ala Met
595 600 605
Val Ala Arg Pro Gly Glu Ser Ala Ile Glu Arg Met Ala Ala Arg Arg
610 615 620
Val Phe Gly Leu Pro Phe Thr Val Thr Glu Tyr Asn His Pro Pro Ser
625 630 635 640
Ser Asp His His Ala Glu Gly Phe Pro Leu Leu Ala Leu Trp Gly Ala
645 650 655
Ala Gln Asp Trp Asn Gly Leu Phe Glu Phe Ala Tyr Ser His Ser Asp
660 665 670
Ala Trp Glu Ser Asp Thr Met Thr Gly Phe Phe Asp Thr Ala Pro Asn
675 680 685
Pro Val His Thr Val Ala Ala Leu Ala Ala Ser Asp Leu Phe Arg Asn
690 695 700
Arg Arg Leu Ala Pro Leu Ala Pro Ala Lys Ser Gly Tyr Val Pro Leu
705 710 715 720
Asp Arg Gln Leu Glu Arg Gln Asn Asn Asp Thr Phe Pro Arg Leu Ile
725 730 735
Glu Ala Asp Ala Val Phe Gly Gly Leu Pro Pro Asp Ala Trp Leu Ala
740 745 750
Asn Arg Val Gly Leu Val Arg Arg Ala Asp Glu Gln Pro Glu Thr Leu
755 760 765
Pro Pro Pro Pro Ala Ser Gln Gln Leu Ala Trp Thr Ala Thr Asp Pro
770 775 780
Ala Thr Ala His Val Arg Tyr Thr Gly Glu Gly Val Ala Gly Leu Val
785 790 795 800
Gly Phe Val Ser Gly Gln Thr Leu Asp Leu Gly Trp Leu Arg Ile Thr
805 810 815
Pro Gly Asp Thr Ser Leu Gly Gly Phe Ser Val Val Met Leu Asn Ser
820 825 830
Val Asp Gly Gln Pro Leu Gly Ala Ser Gly Arg Tyr Leu Leu Thr Thr
835 840 845
Ala Val Arg Ala Ala Asn Arg Gly Met Gly Trp Asn Ala Asp Arg Thr
850 855 860
Gly Phe Asp Lys Lys Trp Gly Ser Gly Pro Ala Gln Ala Glu Ser Ala
865 870 875 880
Pro Val Thr Leu Asp Phe Ala Ser Ala Ser Gly Val Arg Val Tyr Pro
885 890 895
Leu Asn Pro Asp Gly Thr Arg Arg Pro Glu Leu Pro Pro Ala Ser Thr
900 905 910
Pro Gly Arg Phe Glu Ala Thr Pro Ala Ser Lys Thr Leu Trp Phe Glu
915 920 925
Ile Thr Phe Pro
930
<210> 17
<211> 2763
<212> DNA
<213> 豐佑菌科細菌
<400> 17
atgatcgccc atcgccccct gtttctcgtc tgtcgcctcc tgttcagcgg actggttgcc 60
tgttgcattt ccccaaacct cctgaacgcc gcctccccgc ccggcctctt tcccttcacc 120
atcgcctggg actctccgcc caccgccgtc acggacgcca gcgtcgctga tctcaccggc 180
tggctcgacg cccccgcagg caaacacggc tacatccgcg ccgaaggctc cgacttcatc 240
accaccgaca ccggccaacg catccgtttt ctcggcgtca acctcgcctt tgccgccaat 300
ttccccgagc acgccgacgc cgaaaaactc gccgcccgcc tcgcccgcct cggcgtcaac 360
tgcgtccgct tccaccacat ggacaggacc ggtctcctgc gcaacgccgc cggtcgccgc 420
tccagcatct ggagcgaaaa cgccgacggc cagaccctcg atcccgcgca actcgaccgc 480
ctcgactacc tcttcgccca actcaaggcg cgcggcattt acgccaacat caacctccac 540
gtctcccgca cctaccccgg tttccccgcc ggctccagat accacaaggc gctcgacatg 600
tttgtccccg gcatgatcgc cctccagaaa caatacgccc gcgacctcct gcatcacaaa 660
aacaactaca ccgggctccg ctacgccgac gaccccgccg tggccatcgt cgaaatcaac 720
aacgaaaacg gagtcgttgg acgctggtgg cgcggcaacc tcgacacgct cgatccgctt 780
tacgttggcg aactcaacac ccgctggaac gcttggctca cccgcaacca cggctcacct 840
gccgccgcgc tcgtcgcctg gaaaaacgcc gccgccgccg attccacgcc caccggcccc 900
gaactcctca aaaatcaccg tctcgccaat ctcgccaaaa actggacgct ccaaaactcc 960
tccccctccc ccctgctcgc cctcgaaccg cccgccagcc ccggccccgg catcgaaccg 1020
caaggcatcg tcctgcgcgt cctccccgac gctgccaaaa actcccgcgc ctcccttttg 1080
caacccgtct ccctcaagcc cggcgcgcgc cacaccttgc gcatcaccct cgaggccgat 1140
tctcccgccg aactcatcct cgacatcaag gacgcgcgtc cgccctggcg cacccacctc 1200
tccataaaaa ttcccgccac cgacaccctt cgtaccgtcg aaaacacctt cgtctataag 1260
gaaaacgccc cggcctccgg catccgcctc gccctcaacc tccgcgccac cgccagcccc 1320
gcctcgaaca atttccgcgt tcaggaaatc tcgctccgcg aaggcggctc ctccgcgaaa 1380
ctccccgcct tcgttgacgc ggaaaacgcc aacaattccg ccaacgccgc cgcttccgcc 1440
gccgctccca cttcggcgca ccgcgccctc gcctacctcc gtcgcgacgg ctttgaaacc 1500
ttctcgcccg ccgcctgcga cgactggctc cgcttcctct gggaaaccga ggacgactac 1560
tggaccgaca tgcgcgaata cctccgccgc gacctcggca tccgctccat actcgtcggc 1620
tcacaactcg gcgcctacag cctgctcccc ctccagcaga aattcgacgc ccttgaccac 1680
cacgcctact ggcagcaccc gcaaacccag gacaacgggc gcaggatcgt ccaaaacctc 1740
tccatggtca acgagcccgg cggagcctac gccgcctcgc ccgcgtttta ccgcgctgcc 1800
ggaaagccgt atctgctcac cgaatacaat cactcgtcgc ccaacacctt tggcgcggag 1860
gccttcccca tcatctccgc ctacggcgcg ttccaggact ggagcggcat cttcgtttac 1920
tcttacgcgc acggcaccgc gccgtgggac gccggatacc agcgcggcca gttcgacatt 1980
gaccagcatc ccctcaagct tgcgaccctt cccattgccg ccgccctttt cctgcgtggc 2040
gacaccgacg cccctgcggg tgtcaccacc aaaaccacca ccatcactcc ggaggaatac 2100
ctgcgccaga tgcgccgtgt cggccccaac gtttcggcga tcaccgccgg agccacccgc 2160
accgacgccc ttcgccaccg cgtcgccttc gccctcgccg aaaacaaaag tggcgcgggc 2220
gtcccgcccg caaccgttgc cactccgtct gccggaccca tcaccaccga gggcggcgca 2280
ctcacttggg acgccgcgcc caacgcgggc attttcacca ttcgctcacc tcgcaccaag 2340
gcagccatcg gcttcgcctg cggacgctcc tttgacctcg acggcctcgt cattacgccc 2400
ggccaaaccc tccaggactg gtcaaccatt gccgtctccc aaatgagcgg cgaccgcgtc 2460
ggctctcccg gacgcgccct gctcgtcgcc tgcggctaca tcgaaaacac cgggcaaatc 2520
tggcacgacc ccgtagccaa aaacagcgtc aaggaatcgg gtcgcgcccc aacgctcgtc 2580
gagggcattc ccgcgaaaat caccctcact cccgcccccg gcgtcaccgc cgtcgaagtc 2640
tggtcgctcg acgaacacgg acgccgcgcc cgctccgtcc ccgtcacccg cgatggcccc 2700
gccgccacct ttcacatcgg acccgattac cggaccatct ggtatgaagt catcactcaa 2760
taa 2763
<210> 18
<211> 920
<212> PRT
<213> 豐佑菌科細菌
<400> 18
Met Ile Ala His Arg Pro Leu Phe Leu Val Cys Arg Leu Leu Phe Ser
1 5 10 15
Gly Leu Val Ala Cys Cys Ile Ser Pro Asn Leu Leu Asn Ala Ala Ser
20 25 30
Pro Pro Gly Leu Phe Pro Phe Thr Ile Ala Trp Asp Ser Pro Pro Thr
35 40 45
Ala Val Thr Asp Ala Ser Val Ala Asp Leu Thr Gly Trp Leu Asp Ala
50 55 60
Pro Ala Gly Lys His Gly Tyr Ile Arg Ala Glu Gly Ser Asp Phe Ile
65 70 75 80
Thr Thr Asp Thr Gly Gln Arg Ile Arg Phe Leu Gly Val Asn Leu Ala
85 90 95
Phe Ala Ala Asn Phe Pro Glu His Ala Asp Ala Glu Lys Leu Ala Ala
100 105 110
Arg Leu Ala Arg Leu Gly Val Asn Cys Val Arg Phe His His Met Asp
115 120 125
Arg Thr Gly Leu Leu Arg Asn Ala Ala Gly Arg Arg Ser Ser Ile Trp
130 135 140
Ser Glu Asn Ala Asp Gly Gln Thr Leu Asp Pro Ala Gln Leu Asp Arg
145 150 155 160
Leu Asp Tyr Leu Phe Ala Gln Leu Lys Ala Arg Gly Ile Tyr Ala Asn
165 170 175
Ile Asn Leu His Val Ser Arg Thr Tyr Pro Gly Phe Pro Ala Gly Ser
180 185 190
Arg Tyr His Lys Ala Leu Asp Met Phe Val Pro Gly Met Ile Ala Leu
195 200 205
Gln Lys Gln Tyr Ala Arg Asp Leu Leu His His Lys Asn Asn Tyr Thr
210 215 220
Gly Leu Arg Tyr Ala Asp Asp Pro Ala Val Ala Ile Val Glu Ile Asn
225 230 235 240
Asn Glu Asn Gly Val Val Gly Arg Trp Trp Arg Gly Asn Leu Asp Thr
245 250 255
Leu Asp Pro Leu Tyr Val Gly Glu Leu Asn Thr Arg Trp Asn Ala Trp
260 265 270
Leu Thr Arg Asn His Gly Ser Pro Ala Ala Ala Leu Val Ala Trp Lys
275 280 285
Asn Ala Ala Ala Ala Asp Ser Thr Pro Thr Gly Pro Glu Leu Leu Lys
290 295 300
Asn His Arg Leu Ala Asn Leu Ala Lys Asn Trp Thr Leu Gln Asn Ser
305 310 315 320
Ser Pro Ser Pro Leu Leu Ala Leu Glu Pro Pro Ala Ser Pro Gly Pro
325 330 335
Gly Ile Glu Pro Gln Gly Ile Val Leu Arg Val Leu Pro Asp Ala Ala
340 345 350
Lys Asn Ser Arg Ala Ser Leu Leu Gln Pro Val Ser Leu Lys Pro Gly
355 360 365
Ala Arg His Thr Leu Arg Ile Thr Leu Glu Ala Asp Ser Pro Ala Glu
370 375 380
Leu Ile Leu Asp Ile Lys Asp Ala Arg Pro Pro Trp Arg Thr His Leu
385 390 395 400
Ser Ile Lys Ile Pro Ala Thr Asp Thr Leu Arg Thr Val Glu Asn Thr
405 410 415
Phe Val Tyr Lys Glu Asn Ala Pro Ala Ser Gly Ile Arg Leu Ala Leu
420 425 430
Asn Leu Arg Ala Thr Ala Ser Pro Ala Ser Asn Asn Phe Arg Val Gln
435 440 445
Glu Ile Ser Leu Arg Glu Gly Gly Ser Ser Ala Lys Leu Pro Ala Phe
450 455 460
Val Asp Ala Glu Asn Ala Asn Asn Ser Ala Asn Ala Ala Ala Ser Ala
465 470 475 480
Ala Ala Pro Thr Ser Ala His Arg Ala Leu Ala Tyr Leu Arg Arg Asp
485 490 495
Gly Phe Glu Thr Phe Ser Pro Ala Ala Cys Asp Asp Trp Leu Arg Phe
500 505 510
Leu Trp Glu Thr Glu Asp Asp Tyr Trp Thr Asp Met Arg Glu Tyr Leu
515 520 525
Arg Arg Asp Leu Gly Ile Arg Ser Ile Leu Val Gly Ser Gln Leu Gly
530 535 540
Ala Tyr Ser Leu Leu Pro Leu Gln Gln Lys Phe Asp Ala Leu Asp His
545 550 555 560
His Ala Tyr Trp Gln His Pro Gln Thr Gln Asp Asn Gly Arg Arg Ile
565 570 575
Val Gln Asn Leu Ser Met Val Asn Glu Pro Gly Gly Ala Tyr Ala Ala
580 585 590
Ser Pro Ala Phe Tyr Arg Ala Ala Gly Lys Pro Tyr Leu Leu Thr Glu
595 600 605
Tyr Asn His Ser Ser Pro Asn Thr Phe Gly Ala Glu Ala Phe Pro Ile
610 615 620
Ile Ser Ala Tyr Gly Ala Phe Gln Asp Trp Ser Gly Ile Phe Val Tyr
625 630 635 640
Ser Tyr Ala His Gly Thr Ala Pro Trp Asp Ala Gly Tyr Gln Arg Gly
645 650 655
Gln Phe Asp Ile Asp Gln His Pro Leu Lys Leu Ala Thr Leu Pro Ile
660 665 670
Ala Ala Ala Leu Phe Leu Arg Gly Asp Thr Asp Ala Pro Ala Gly Val
675 680 685
Thr Thr Lys Thr Thr Thr Ile Thr Pro Glu Glu Tyr Leu Arg Gln Met
690 695 700
Arg Arg Val Gly Pro Asn Val Ser Ala Ile Thr Ala Gly Ala Thr Arg
705 710 715 720
Thr Asp Ala Leu Arg His Arg Val Ala Phe Ala Leu Ala Glu Asn Lys
725 730 735
Ser Gly Ala Gly Val Pro Pro Ala Thr Val Ala Thr Pro Ser Ala Gly
740 745 750
Pro Ile Thr Thr Glu Gly Gly Ala Leu Thr Trp Asp Ala Ala Pro Asn
755 760 765
Ala Gly Ile Phe Thr Ile Arg Ser Pro Arg Thr Lys Ala Ala Ile Gly
770 775 780
Phe Ala Cys Gly Arg Ser Phe Asp Leu Asp Gly Leu Val Ile Thr Pro
785 790 795 800
Gly Gln Thr Leu Gln Asp Trp Ser Thr Ile Ala Val Ser Gln Met Ser
805 810 815
Gly Asp Arg Val Gly Ser Pro Gly Arg Ala Leu Leu Val Ala Cys Gly
820 825 830
Tyr Ile Glu Asn Thr Gly Gln Ile Trp His Asp Pro Val Ala Lys Asn
835 840 845
Ser Val Lys Glu Ser Gly Arg Ala Pro Thr Leu Val Glu Gly Ile Pro
850 855 860
Ala Lys Ile Thr Leu Thr Pro Ala Pro Gly Val Thr Ala Val Glu Val
865 870 875 880
Trp Ser Leu Asp Glu His Gly Arg Arg Ala Arg Ser Val Pro Val Thr
885 890 895
Arg Asp Gly Pro Ala Ala Thr Phe His Ile Gly Pro Asp Tyr Arg Thr
900 905 910
Ile Trp Tyr Glu Val Ile Thr Gln
915 920
<210> 19
<211> 2535
<212> DNA
<213> Paludibacterium yongneupense
<400> 19
atgacgctac gtttgcgcgt gctgctatgc ctgtttgcag cctgcggcgc gcatgccgcc 60
gacgcaccgc tgttccccta tcatttgccc tgggatgacg cttcgctgaa cctcagtaat 120
ctgcatgcct ggaatcctgc gcctgccggg cgttccggtt ttgtcggcgt ccgcaacggg 180
catctgtacg ccgagggccg ccgcctgcgc ttgctggggg tcaactgcgt attcggcggc 240
gcgctgcccg agcatgacgt cgccgagcgc atcgccgcgc gcatggcccg cttcggcatc 300
aatgccgtcc gcttccatca tatggacacc cggccggctc cggatggcct gctgctggcg 360
gaccgcctga ccttggatcc gaaagcactc gaccgtctcg actacttcat cgcggccctg 420
aaacgggtgg gcatttacag cgatctgaat ctgcatgtcg gtcgcagcta tccggggttc 480
gcaccctgga gcgacgcgca aggcaggccg cagcctcagt actggaaggg cgtcgacctg 540
ttctacccgc ccatgatcgc gatgcagcgc gattatgccc gcaccctgct gtcgcatcgc 600
aacccgtata ccgggcatca ataccgcgac gagcccgcgc tggcgctggt cgagatcaat 660
aatgaggacg gtttgatacg ggagtggcag gatggggcgc ttgaccgtat gagcgagccc 720
tatcgttccg aattaagaca gcgctggaat cgctggctgt cggcgcatta ccggtcgacc 780
gccgagctgg cccgcgcctg gagcgcacgt gacgacgtgc agggagacga gcgcttcgat 840
acgggtggca atggctggaa tctgcaggtg gtggagccgg cgcgtgcgcg ccagcagacg 900
gagggcgacg gctcgctgcg ggtgacggtc gaggcgacag acagcgagaa ctggcatgtg 960
cagctgcacc agctgcggca aagcttcgcg gccgggcaac cctacacctt gcgactgcgg 1020
ctgcgtgccg accgtccgct gcgggtgcgg ctggcggcga tgcaggcgca cccgccctgg 1080
cagtcgctgt ggcaaacggc ggtggatgtc gacacccgat ggcgcgacta tcgttttacc 1140
tttgcccccg tcgctgggga tggtgtggcg cgttttacgc tgggcggcct cggggaacag 1200
cgctccaccc tgtggttggg catggcgagc ctgaagacag gagggcgcct gggactgctg 1260
gctggcgagt cgctcgaggg gagcggagtc gacatctttg cgcgtggcga cgagggcgcc 1320
cgcagcgcgc aggggcagcg cgactggtta cagtttctat gggacacaga aacagaatac 1380
tgggatggca tgcgtaattt tctgcgccag accgtgggcc tgcgttcctt gctgattgga 1440
acgcaggtcg ggtatagccc ggccccgatc caggcgcgga tggatgtcgt ggatggccat 1500
gcttactggc agcatccgcg ctttcccggc cggccgtggg atcccgcaga ctggagtgtg 1560
gccaatacgc ccatggcggg catcgatggc ggcggcaccc tggccgacct ggctctgcgt 1620
cgcatggccg gcaagccttt tgtcgtcacc gagtacaatc atcccgcgcc gggtgagttc 1680
gtcgccgagg gactgccgct tctggccgcc tatgccgccc tgcaggactg ggatggcgta 1740
tttgttttcg attatggtgc cggcgatcac gatccgggtt tcattgcttc gtatttcgac 1800
attcaggccg atcccggcaa gatgagtgcg ctgccggccg cggccgcctt gttccggcgc 1860
ggtgacgttg cgacgcccgg gagcgcgggc ggcgccttac cttcgcccgc ggccatgatc 1920
gaggccatgc gtgccgggaa taccatgccg gcggcggatc agtttggcac cgcgcgcaac 1980
gaagcgctga ggcggccggt cgcgctcggc agcacgcctg ccggtccgcg gccgttaccg 2040
gtgcgtgcga tcggcgggca attggtatgg ggcgaggacg gccggaagac ggtcgtgatc 2100
gacactccgc gcagcaaggg attggtcggt gccggattgg gacgggacgt cgatgccggc 2160
ggcgtgggct tgcgtctgct gcaggcccgc cacaatagcg gcgtgctgct ggccacactg 2220
atggacgggc gtgacttttc gcacccgggc cgggttctgc tgacggcgat cggaagcgag 2280
gaaaacagcg ggcagcgctg gctggacgag gcgcacacca cgctcggacg gcaatggggg 2340
caggcgccgg tatgggtcga gggtattgcc gcccgcatcg tattgccggt cgcggcggcg 2400
cgggtcggcg cctgggcgct cgacgagcgc ggacaacggc ggcaggccct gccggtggct 2460
ggcgaccacg cgcatgcggt attcgaaacc agccccggct accgcgctct ttggtatgag 2520
cttgaaatcc gctga 2535
<210> 20
<211> 844
<212> PRT
<213> Paludibacterium yongneupense
<400> 20
Met Thr Leu Arg Leu Arg Val Leu Leu Cys Leu Phe Ala Ala Cys Gly
1 5 10 15
Ala His Ala Ala Asp Ala Pro Leu Phe Pro Tyr His Leu Pro Trp Asp
20 25 30
Asp Ala Ser Leu Asn Leu Ser Asn Leu His Ala Trp Asn Pro Ala Pro
35 40 45
Ala Gly Arg Ser Gly Phe Val Gly Val Arg Asn Gly His Leu Tyr Ala
50 55 60
Glu Gly Arg Arg Leu Arg Leu Leu Gly Val Asn Cys Val Phe Gly Gly
65 70 75 80
Ala Leu Pro Glu His Asp Val Ala Glu Arg Ile Ala Ala Arg Met Ala
85 90 95
Arg Phe Gly Ile Asn Ala Val Arg Phe His His Met Asp Thr Arg Pro
100 105 110
Ala Pro Asp Gly Leu Leu Leu Ala Asp Arg Leu Thr Leu Asp Pro Lys
115 120 125
Ala Leu Asp Arg Leu Asp Tyr Phe Ile Ala Ala Leu Lys Arg Val Gly
130 135 140
Ile Tyr Ser Asp Leu Asn Leu His Val Gly Arg Ser Tyr Pro Gly Phe
145 150 155 160
Ala Pro Trp Ser Asp Ala Gln Gly Arg Pro Gln Pro Gln Tyr Trp Lys
165 170 175
Gly Val Asp Leu Phe Tyr Pro Pro Met Ile Ala Met Gln Arg Asp Tyr
180 185 190
Ala Arg Thr Leu Leu Ser His Arg Asn Pro Tyr Thr Gly His Gln Tyr
195 200 205
Arg Asp Glu Pro Ala Leu Ala Leu Val Glu Ile Asn Asn Glu Asp Gly
210 215 220
Leu Ile Arg Glu Trp Gln Asp Gly Ala Leu Asp Arg Met Ser Glu Pro
225 230 235 240
Tyr Arg Ser Glu Leu Arg Gln Arg Trp Asn Arg Trp Leu Ser Ala His
245 250 255
Tyr Arg Ser Thr Ala Glu Leu Ala Arg Ala Trp Ser Ala Arg Asp Asp
260 265 270
Val Gln Gly Asp Glu Arg Phe Asp Thr Gly Gly Asn Gly Trp Asn Leu
275 280 285
Gln Val Val Glu Pro Ala Arg Ala Arg Gln Gln Thr Glu Gly Asp Gly
290 295 300
Ser Leu Arg Val Thr Val Glu Ala Thr Asp Ser Glu Asn Trp His Val
305 310 315 320
Gln Leu His Gln Leu Arg Gln Ser Phe Ala Ala Gly Gln Pro Tyr Thr
325 330 335
Leu Arg Leu Arg Leu Arg Ala Asp Arg Pro Leu Arg Val Arg Leu Ala
340 345 350
Ala Met Gln Ala His Pro Pro Trp Gln Ser Leu Trp Gln Thr Ala Val
355 360 365
Asp Val Asp Thr Arg Trp Arg Asp Tyr Arg Phe Thr Phe Ala Pro Val
370 375 380
Ala Gly Asp Gly Val Ala Arg Phe Thr Leu Gly Gly Leu Gly Glu Gln
385 390 395 400
Arg Ser Thr Leu Trp Leu Gly Met Ala Ser Leu Lys Thr Gly Gly Arg
405 410 415
Leu Gly Leu Leu Ala Gly Glu Ser Leu Glu Gly Ser Gly Val Asp Ile
420 425 430
Phe Ala Arg Gly Asp Glu Gly Ala Arg Ser Ala Gln Gly Gln Arg Asp
435 440 445
Trp Leu Gln Phe Leu Trp Asp Thr Glu Thr Glu Tyr Trp Asp Gly Met
450 455 460
Arg Asn Phe Leu Arg Gln Thr Val Gly Leu Arg Ser Leu Leu Ile Gly
465 470 475 480
Thr Gln Val Gly Tyr Ser Pro Ala Pro Ile Gln Ala Arg Met Asp Val
485 490 495
Val Asp Gly His Ala Tyr Trp Gln His Pro Arg Phe Pro Gly Arg Pro
500 505 510
Trp Asp Pro Ala Asp Trp Ser Val Ala Asn Thr Pro Met Ala Gly Ile
515 520 525
Asp Gly Gly Gly Thr Leu Ala Asp Leu Ala Leu Arg Arg Met Ala Gly
530 535 540
Lys Pro Phe Val Val Thr Glu Tyr Asn His Pro Ala Pro Gly Glu Phe
545 550 555 560
Val Ala Glu Gly Leu Pro Leu Leu Ala Ala Tyr Ala Ala Leu Gln Asp
565 570 575
Trp Asp Gly Val Phe Val Phe Asp Tyr Gly Ala Gly Asp His Asp Pro
580 585 590
Gly Phe Ile Ala Ser Tyr Phe Asp Ile Gln Ala Asp Pro Gly Lys Met
595 600 605
Ser Ala Leu Pro Ala Ala Ala Ala Leu Phe Arg Arg Gly Asp Val Ala
610 615 620
Thr Pro Gly Ser Ala Gly Gly Ala Leu Pro Ser Pro Ala Ala Met Ile
625 630 635 640
Glu Ala Met Arg Ala Gly Asn Thr Met Pro Ala Ala Asp Gln Phe Gly
645 650 655
Thr Ala Arg Asn Glu Ala Leu Arg Arg Pro Val Ala Leu Gly Ser Thr
660 665 670
Pro Ala Gly Pro Arg Pro Leu Pro Val Arg Ala Ile Gly Gly Gln Leu
675 680 685
Val Trp Gly Glu Asp Gly Arg Lys Thr Val Val Ile Asp Thr Pro Arg
690 695 700
Ser Lys Gly Leu Val Gly Ala Gly Leu Gly Arg Asp Val Asp Ala Gly
705 710 715 720
Gly Val Gly Leu Arg Leu Leu Gln Ala Arg His Asn Ser Gly Val Leu
725 730 735
Leu Ala Thr Leu Met Asp Gly Arg Asp Phe Ser His Pro Gly Arg Val
740 745 750
Leu Leu Thr Ala Ile Gly Ser Glu Glu Asn Ser Gly Gln Arg Trp Leu
755 760 765
Asp Glu Ala His Thr Thr Leu Gly Arg Gln Trp Gly Gln Ala Pro Val
770 775 780
Trp Val Glu Gly Ile Ala Ala Arg Ile Val Leu Pro Val Ala Ala Ala
785 790 795 800
Arg Val Gly Ala Trp Ala Leu Asp Glu Arg Gly Gln Arg Arg Gln Ala
805 810 815
Leu Pro Val Ala Gly Asp His Ala His Ala Val Phe Glu Thr Ser Pro
820 825 830
Gly Tyr Arg Ala Leu Trp Tyr Glu Leu Glu Ile Arg
835 840
<210> 21
<211> 2550
<212> DNA
<213> 迪克亞桿菌屬物種
<400> 21
atgatgcgaa tccgtagggt agtactggcg ctggcgttgt ctctgacctt ccccgctatc 60
gccggtgagc tgtttccctt tactttgccg ctggatgtcc gctccgacgg cagccttacc 120
gacctttcgt catggaacga caaaccggca ggcgcacgcg ggtttgtgac ggtcgacggc 180
agccacctga cagttggcgg caaacggctg cgattcctcg gcgttaatat cgtctttggt 240
tcgaccgcgc cgacacatgc cgacacagac gctatcgccc gccgcctggc acgcttcggc 300
atcaatctgg tgcgttttca tctgatggac gcccgccctg cgcccgacgg catcctgcag 360
cgcgatctgc gcacccttga cccagacacc ctcgaccgcg tcgattattt tatctcgacg 420
ctggcgcgag aaggcatcta cgccgatctc aacttgcacg tcggccgaca atatcccggc 480
atgggagaga gttgggcgga tgggcccaaa tactggaaag gcgtcgacct gttttatccg 540
ccgatgtttg tacagcagca ggagtatgcc cgcgccctgc tgacgcaccg caatccttac 600
accggtcatc gctatactga agaacccgcc gtggcgttcg tcgagatcaa taacgaagac 660
ggattgatcc gggaatggcg gtctggctcg ctcgacatga tgcccgcgcc gtttcgcact 720
gagctcgccc gccaatggcg tgtctggctc ggacatcgtt atgctggtga cgacgcgtta 780
cgcgcgggct ggggcgtgcg ggaagagcct tacggcgcgg aaatgctgtc agagcggatc 840
gggtcgaaaa gcagcgaccc aggctgggtg ctgcaaaccc ttggcggcgc caacgcgacg 900
ctcgccacaa cagattccgg actgatgctg tcgatgacga caccggggca gctcggctgg 960
catacgcagt tgcactacaa tcacctctcg ttccagaccc gccacgccta tacattgtcg 1020
ctccggttac gtgccgatca cccgctgacg ctgtccgtac aggcgatgca atcgcacgcc 1080
ccctggcaaa cgttgtggtc gcagaaaatc ccggtcggca ccgactggca ggatgtcacg 1140
gtgacattta tgccgcagca ggacgacgcg acggcacggc tcacactggg tggcctcggg 1200
ctggataccg gtcgtctgga tatcgcccat gcgcggcttc gtaccggcgg gttgctcgga 1260
ctacaacccg gcgaaagcct cacgcacggc acgctcgata tcattccgtt tgcctcccgg 1320
ttgaaccgaa ccgtcgcggc acagcgcgac tggctgagtt ttctgtggga caccgaagcg 1380
cagtattggc gaagcatgcg ggactttctg aaaggtgaac tgggcgtacg ctcgccagtc 1440
atcggaacgc aggtctccta cagcccggcg gccatccagc agacgctgga cgtggttgac 1500
ggccacgcct actggcagca cccgcgtttt ccgggcaaac cctgggatcg caacaactgg 1560
tttatcggca actcgccaat ggccggtatt cccggcggcg gcacgcttgc cgacctagca 1620
ttgcatcgtg tccccggcaa gccgtttatc gtcagcgagt acaaccatcc tgcgcccagc 1680
ctctggcaag gcgaggcgat gccgctggcc gccgcctatg gcgccctgca ggactgggat 1740
ggcatcgccg tttacaacta tggcgccagt aagcgtaact ggcaggccga ctttatcacc 1800
gactacttcg acagcgtcgc taacccggtc aagatgacca gtctggtggc tgccgccgcg 1860
ctgctgcggc gtgaggatgt gcgcgccgac aagccgcaac cacagccgat gccggatcgc 1920
accgtcttta tcgacgcgct gcgtcagggc ggccgcctgc cgggtgcgga cagcctgggc 1980
gcgccacgtg acgccgcgct ggcgggatgg gtcagcatcg ccacgccagc gggcgaaccg 2040
ccgtcatggc cggtacgtag ccgcaccggg caactgatct ggggtgtgga cggcatcggc 2100
ggcaaaaccg tggtggtcga tacgccgcgc agtaaagggc ttatcggcgc ccggctcggt 2160
caggtttatg acgcgcacgg cgtcgggctg gaagtgacgg cggcgcgcaa cgactgggga 2220
gtcctgctgg cgaccgtact ggacgggcag agtttcaccg cgccgagccg cattctgctg 2280
acgacgctgg ggcaggagga aaacaccggc cagcgctggc ttgatgccgc aaaaaccacc 2340
attggcagcc atttcggcac cggcccggtg ctggtcgaag gcatcggcgc ccgcatcacc 2400
ctgccggttg cgccgtcccg ggtcagcgcc tgggcgcttg acgcgcgcgg ccagcggcag 2460
acgccgatac cggtcggcgg cacgcaacat gccacactgg acgtcgatga gcgctatcgt 2520
actctgtggt atgaaatcga cattcgataa 2550
<210> 22
<211> 849
<212> PRT
<213> 迪克亞桿菌屬物種
<400> 22
Met Met Arg Ile Arg Arg Val Val Leu Ala Leu Ala Leu Ser Leu Thr
1 5 10 15
Phe Pro Ala Ile Ala Gly Glu Leu Phe Pro Phe Thr Leu Pro Leu Asp
20 25 30
Val Arg Ser Asp Gly Ser Leu Thr Asp Leu Ser Ser Trp Asn Asp Lys
35 40 45
Pro Ala Gly Ala Arg Gly Phe Val Thr Val Asp Gly Ser His Leu Thr
50 55 60
Val Gly Gly Lys Arg Leu Arg Phe Leu Gly Val Asn Ile Val Phe Gly
65 70 75 80
Ser Thr Ala Pro Thr His Ala Asp Thr Asp Ala Ile Ala Arg Arg Leu
85 90 95
Ala Arg Phe Gly Ile Asn Leu Val Arg Phe His Leu Met Asp Ala Arg
100 105 110
Pro Ala Pro Asp Gly Ile Leu Gln Arg Asp Leu Arg Thr Leu Asp Pro
115 120 125
Asp Thr Leu Asp Arg Val Asp Tyr Phe Ile Ser Thr Leu Ala Arg Glu
130 135 140
Gly Ile Tyr Ala Asp Leu Asn Leu His Val Gly Arg Gln Tyr Pro Gly
145 150 155 160
Met Gly Glu Ser Trp Ala Asp Gly Pro Lys Tyr Trp Lys Gly Val Asp
165 170 175
Leu Phe Tyr Pro Pro Met Phe Val Gln Gln Gln Glu Tyr Ala Arg Ala
180 185 190
Leu Leu Thr His Arg Asn Pro Tyr Thr Gly His Arg Tyr Thr Glu Glu
195 200 205
Pro Ala Val Ala Phe Val Glu Ile Asn Asn Glu Asp Gly Leu Ile Arg
210 215 220
Glu Trp Arg Ser Gly Ser Leu Asp Met Met Pro Ala Pro Phe Arg Thr
225 230 235 240
Glu Leu Ala Arg Gln Trp Arg Val Trp Leu Gly His Arg Tyr Ala Gly
245 250 255
Asp Asp Ala Leu Arg Ala Gly Trp Gly Val Arg Glu Glu Pro Tyr Gly
260 265 270
Ala Glu Met Leu Ser Glu Arg Ile Gly Ser Lys Ser Ser Asp Pro Gly
275 280 285
Trp Val Leu Gln Thr Leu Gly Gly Ala Asn Ala Thr Leu Ala Thr Thr
290 295 300
Asp Ser Gly Leu Met Leu Ser Met Thr Thr Pro Gly Gln Leu Gly Trp
305 310 315 320
His Thr Gln Leu His Tyr Asn His Leu Ser Phe Gln Thr Arg His Ala
325 330 335
Tyr Thr Leu Ser Leu Arg Leu Arg Ala Asp His Pro Leu Thr Leu Ser
340 345 350
Val Gln Ala Met Gln Ser His Ala Pro Trp Gln Thr Leu Trp Ser Gln
355 360 365
Lys Ile Pro Val Gly Thr Asp Trp Gln Asp Val Thr Val Thr Phe Met
370 375 380
Pro Gln Gln Asp Asp Ala Thr Ala Arg Leu Thr Leu Gly Gly Leu Gly
385 390 395 400
Leu Asp Thr Gly Arg Leu Asp Ile Ala His Ala Arg Leu Arg Thr Gly
405 410 415
Gly Leu Leu Gly Leu Gln Pro Gly Glu Ser Leu Thr His Gly Thr Leu
420 425 430
Asp Ile Ile Pro Phe Ala Ser Arg Leu Asn Arg Thr Val Ala Ala Gln
435 440 445
Arg Asp Trp Leu Ser Phe Leu Trp Asp Thr Glu Ala Gln Tyr Trp Arg
450 455 460
Ser Met Arg Asp Phe Leu Lys Gly Glu Leu Gly Val Arg Ser Pro Val
465 470 475 480
Ile Gly Thr Gln Val Ser Tyr Ser Pro Ala Ala Ile Gln Gln Thr Leu
485 490 495
Asp Val Val Asp Gly His Ala Tyr Trp Gln His Pro Arg Phe Pro Gly
500 505 510
Lys Pro Trp Asp Arg Asn Asn Trp Phe Ile Gly Asn Ser Pro Met Ala
515 520 525
Gly Ile Pro Gly Gly Gly Thr Leu Ala Asp Leu Ala Leu His Arg Val
530 535 540
Pro Gly Lys Pro Phe Ile Val Ser Glu Tyr Asn His Pro Ala Pro Ser
545 550 555 560
Leu Trp Gln Gly Glu Ala Met Pro Leu Ala Ala Ala Tyr Gly Ala Leu
565 570 575
Gln Asp Trp Asp Gly Ile Ala Val Tyr Asn Tyr Gly Ala Ser Lys Arg
580 585 590
Asn Trp Gln Ala Asp Phe Ile Thr Asp Tyr Phe Asp Ser Val Ala Asn
595 600 605
Pro Val Lys Met Thr Ser Leu Val Ala Ala Ala Ala Leu Leu Arg Arg
610 615 620
Glu Asp Val Arg Ala Asp Lys Pro Gln Pro Gln Pro Met Pro Asp Arg
625 630 635 640
Thr Val Phe Ile Asp Ala Leu Arg Gln Gly Gly Arg Leu Pro Gly Ala
645 650 655
Asp Ser Leu Gly Ala Pro Arg Asp Ala Ala Leu Ala Gly Trp Val Ser
660 665 670
Ile Ala Thr Pro Ala Gly Glu Pro Pro Ser Trp Pro Val Arg Ser Arg
675 680 685
Thr Gly Gln Leu Ile Trp Gly Val Asp Gly Ile Gly Gly Lys Thr Val
690 695 700
Val Val Asp Thr Pro Arg Ser Lys Gly Leu Ile Gly Ala Arg Leu Gly
705 710 715 720
Gln Val Tyr Asp Ala His Gly Val Gly Leu Glu Val Thr Ala Ala Arg
725 730 735
Asn Asp Trp Gly Val Leu Leu Ala Thr Val Leu Asp Gly Gln Ser Phe
740 745 750
Thr Ala Pro Ser Arg Ile Leu Leu Thr Thr Leu Gly Gln Glu Glu Asn
755 760 765
Thr Gly Gln Arg Trp Leu Asp Ala Ala Lys Thr Thr Ile Gly Ser His
770 775 780
Phe Gly Thr Gly Pro Val Leu Val Glu Gly Ile Gly Ala Arg Ile Thr
785 790 795 800
Leu Pro Val Ala Pro Ser Arg Val Ser Ala Trp Ala Leu Asp Ala Arg
805 810 815
Gly Gln Arg Gln Thr Pro Ile Pro Val Gly Gly Thr Gln His Ala Thr
820 825 830
Leu Asp Val Asp Glu Arg Tyr Arg Thr Leu Trp Tyr Glu Ile Asp Ile
835 840 845
Arg
<210> 23
<211> 2712
<212> DNA
<213> 閃爍桿菌屬細菌
<400> 23
atgcggtggt ggatgttggt catcttggcg ttcatctctg gctttggggg ttggtggact 60
atgaggcaag ggttatcgca ggaaggcaaa caggatgcct tgcttttccc tttcgtttta 120
ccttgggacg atgcttctcc atcggtcacc aacatcagtc actggttgca caaacctgcg 180
ggcaagtttg ggcacatccg tatcggcgct gacggtcgcc tttacgctgg caagcagcga 240
attcgtttcc tgggcgtgaa cttgtgtttc ggggcatgtt tcccgcgcaa agaggactct 300
gaaaaaattg cggcaaggat ggcgaagttc ggcatcaaca ttgttcgctt ccaccacatg 360
gacatgcaag aatttcccaa tggcatccgc cgtcggggcg tcccccacac ccgcgacctt 420
gacccagaag cccttgacag acttgactac ctgattgccc aactgaaacg caacggcatc 480
tatgtcaact tgaacttgct cgtttctcgc cccttcaatg ctgccgacgg tttgcccaaa 540
gaaattgagc aactcggatg gaaggagcga cacatcgttg gcttcttcta cgagccatgt 600
cttgagttgc aaaaggaata tgctcgcaag ttgctgacgc accgcaatcc ttacacgggg 660
ctcacctatg ctgaagaccc tgtcgtcgct ttcgtggaaa tcaacaacga gaacggtctc 720
attcacgctt ggcttagtgg ctctattgac cggatgccaa aagtttttca ggatgagttg 780
caacggcagt ggcatgcttg gctgaaagcc cgatacggca caacggagaa gttgcgcaaa 840
gcgtggggtg tcaaggaaga gcccttgggc aatgaaatgc tgaggaacac gaactttgag 900
gcagggttgc aaaattgggt tttggagcga cacgcgggtg ctgaagcaac agcggaagtt 960
gtcgctgaac ccatccctga acttaaaggt cttcgcttcg tccgcattaa tgtcacaaaa 1020
ctgggacagg caggctggca tgtccaattc catcaaccga acttgaaagt tcaacctgat 1080
cgcccataca cactttcgtt ctgggcgcga gcggaacgac cttgcaccat ttcagtcgga 1140
atttcgcaag cccacgaacc ttggcagaac cttggcttca gtgccgaagt caaattgaca 1200
caggaatggc gtgaatatcg gttcaccttc attctcaaca ggggtgacga caacgctcgc 1260
gttatcttca gcaacttggg cgctcaaacg acaacttact ggttcgccgc cccctccctt 1320
cgccctggcg gaattgttgg cttggcagtc aacgagcgcc ttgaagatgg cactgtcccg 1380
attttccttc gcggtcgttt cggtgagcgc acacccgaag cacaacggga ctggatgcga 1440
tttttgtggg agacggaaga tcgctattgg caaacaatct accgctacct caaggacgag 1500
ttgaaagtca aggcattggt catcggcaca atcgtcggat gcagcacacc caacatgatg 1560
gcaaaacttg actgcgtgga cacacacgct tattggcaac atccgatgtt tccctcccga 1620
ccatgggacc ctgaggattg gattgtgcct aaccgaacga tggtcaacga acgaggcggg 1680
actttgcctg gcttagcatt gcgacgggtt ttgggcaaac cccattcttg caccgaatac 1740
aaccaccccg caccaaacac atacagcagc gaagccttcc ttttgctggc agcatatgca 1800
gccttgcagg attgggatgc catctatgcc ttcagttact cgcaccgacg agatggttgg 1860
gacttaaggc gcattcccaa cttctttgac attgaccaac atcccacgaa gatggttacc 1920
cttatccctg cagcagcgat gtttgttcgg ggcgatgtga aacctgccaa gcagcaagtg 1980
gttgtcaagt tgacgaaaga gcaagaagtt gacttgttgc ggcgcagttg ggcttggtta 2040
ctcgtccacg caggtcatgt cggagttcct aacgaagcag cactcgtcca tcgggttgca 2100
attgcgacag atgggaagcg agttccgcca actgctctca agcccgaaca agtgaaaatt 2160
gacggcaacc gatttgtgtc cgatactggc gaattgattt gggacttgac ggaaaaaggg 2220
cgcggggttg ttatcgttaa tgcccagaac agcaaagccg ttatcgggtt cgcaggtggc 2280
aagcggtttg agttgagcag cgtcgtgatt gaacctgggc aaactatgca agacggttgg 2340
tgcgccatca cactcaccgt catggacggc tccttgccaa ctcgcccctc gtcccgcgtc 2400
cctcgtcccg tccgtttgct catcacggca acaggctatg cggagaacac cgacatgggt 2460
tggaaggaag tgcctggtta cccacccaaa tcaagttgcg gtcgcaactg gggcaaacca 2520
ccttcgttgg tggaaggcat ctttgccagc atcaccttgc cgttacccgc caagcgagtg 2580
caagcgtggg ctttggacga acggggtcaa cggaaatccc aaatcccagt cactgccgac 2640
ccatcaggca acgccgtcat ccgcatcagt ccccaatggc aaacgctttg gtatgaagtt 2700
gaggcgcggt aa 2712
<210> 24
<211> 903
<212> PRT
<213> 閃爍桿菌屬細菌
<400> 24
Met Arg Trp Trp Met Leu Val Ile Leu Ala Phe Ile Ser Gly Phe Gly
1 5 10 15
Gly Trp Trp Thr Met Arg Gln Gly Leu Ser Gln Glu Gly Lys Gln Asp
20 25 30
Ala Leu Leu Phe Pro Phe Val Leu Pro Trp Asp Asp Ala Ser Pro Ser
35 40 45
Val Thr Asn Ile Ser His Trp Leu His Lys Pro Ala Gly Lys Phe Gly
50 55 60
His Ile Arg Ile Gly Ala Asp Gly Arg Leu Tyr Ala Gly Lys Gln Arg
65 70 75 80
Ile Arg Phe Leu Gly Val Asn Leu Cys Phe Gly Ala Cys Phe Pro Arg
85 90 95
Lys Glu Asp Ser Glu Lys Ile Ala Ala Arg Met Ala Lys Phe Gly Ile
100 105 110
Asn Ile Val Arg Phe His His Met Asp Met Gln Glu Phe Pro Asn Gly
115 120 125
Ile Arg Arg Arg Gly Val Pro His Thr Arg Asp Leu Asp Pro Glu Ala
130 135 140
Leu Asp Arg Leu Asp Tyr Leu Ile Ala Gln Leu Lys Arg Asn Gly Ile
145 150 155 160
Tyr Val Asn Leu Asn Leu Leu Val Ser Arg Pro Phe Asn Ala Ala Asp
165 170 175
Gly Leu Pro Lys Glu Ile Glu Gln Leu Gly Trp Lys Glu Arg His Ile
180 185 190
Val Gly Phe Phe Tyr Glu Pro Cys Leu Glu Leu Gln Lys Glu Tyr Ala
195 200 205
Arg Lys Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Leu Thr Tyr Ala
210 215 220
Glu Asp Pro Val Val Ala Phe Val Glu Ile Asn Asn Glu Asn Gly Leu
225 230 235 240
Ile His Ala Trp Leu Ser Gly Ser Ile Asp Arg Met Pro Lys Val Phe
245 250 255
Gln Asp Glu Leu Gln Arg Gln Trp His Ala Trp Leu Lys Ala Arg Tyr
260 265 270
Gly Thr Thr Glu Lys Leu Arg Lys Ala Trp Gly Val Lys Glu Glu Pro
275 280 285
Leu Gly Asn Glu Met Leu Arg Asn Thr Asn Phe Glu Ala Gly Leu Gln
290 295 300
Asn Trp Val Leu Glu Arg His Ala Gly Ala Glu Ala Thr Ala Glu Val
305 310 315 320
Val Ala Glu Pro Ile Pro Glu Leu Lys Gly Leu Arg Phe Val Arg Ile
325 330 335
Asn Val Thr Lys Leu Gly Gln Ala Gly Trp His Val Gln Phe His Gln
340 345 350
Pro Asn Leu Lys Val Gln Pro Asp Arg Pro Tyr Thr Leu Ser Phe Trp
355 360 365
Ala Arg Ala Glu Arg Pro Cys Thr Ile Ser Val Gly Ile Ser Gln Ala
370 375 380
His Glu Pro Trp Gln Asn Leu Gly Phe Ser Ala Glu Val Lys Leu Thr
385 390 395 400
Gln Glu Trp Arg Glu Tyr Arg Phe Thr Phe Ile Leu Asn Arg Gly Asp
405 410 415
Asp Asn Ala Arg Val Ile Phe Ser Asn Leu Gly Ala Gln Thr Thr Thr
420 425 430
Tyr Trp Phe Ala Ala Pro Ser Leu Arg Pro Gly Gly Ile Val Gly Leu
435 440 445
Ala Val Asn Glu Arg Leu Glu Asp Gly Thr Val Pro Ile Phe Leu Arg
450 455 460
Gly Arg Phe Gly Glu Arg Thr Pro Glu Ala Gln Arg Asp Trp Met Arg
465 470 475 480
Phe Leu Trp Glu Thr Glu Asp Arg Tyr Trp Gln Thr Ile Tyr Arg Tyr
485 490 495
Leu Lys Asp Glu Leu Lys Val Lys Ala Leu Val Ile Gly Thr Ile Val
500 505 510
Gly Cys Ser Thr Pro Asn Met Met Ala Lys Leu Asp Cys Val Asp Thr
515 520 525
His Ala Tyr Trp Gln His Pro Met Phe Pro Ser Arg Pro Trp Asp Pro
530 535 540
Glu Asp Trp Ile Val Pro Asn Arg Thr Met Val Asn Glu Arg Gly Gly
545 550 555 560
Thr Leu Pro Gly Leu Ala Leu Arg Arg Val Leu Gly Lys Pro His Ser
565 570 575
Cys Thr Glu Tyr Asn His Pro Ala Pro Asn Thr Tyr Ser Ser Glu Ala
580 585 590
Phe Leu Leu Leu Ala Ala Tyr Ala Ala Leu Gln Asp Trp Asp Ala Ile
595 600 605
Tyr Ala Phe Ser Tyr Ser His Arg Arg Asp Gly Trp Asp Leu Arg Arg
610 615 620
Ile Pro Asn Phe Phe Asp Ile Asp Gln His Pro Thr Lys Met Val Thr
625 630 635 640
Leu Ile Pro Ala Ala Ala Met Phe Val Arg Gly Asp Val Lys Pro Ala
645 650 655
Lys Gln Gln Val Val Val Lys Leu Thr Lys Glu Gln Glu Val Asp Leu
660 665 670
Leu Arg Arg Ser Trp Ala Trp Leu Leu Val His Ala Gly His Val Gly
675 680 685
Val Pro Asn Glu Ala Ala Leu Val His Arg Val Ala Ile Ala Thr Asp
690 695 700
Gly Lys Arg Val Pro Pro Thr Ala Leu Lys Pro Glu Gln Val Lys Ile
705 710 715 720
Asp Gly Asn Arg Phe Val Ser Asp Thr Gly Glu Leu Ile Trp Asp Leu
725 730 735
Thr Glu Lys Gly Arg Gly Val Val Ile Val Asn Ala Gln Asn Ser Lys
740 745 750
Ala Val Ile Gly Phe Ala Gly Gly Lys Arg Phe Glu Leu Ser Ser Val
755 760 765
Val Ile Glu Pro Gly Gln Thr Met Gln Asp Gly Trp Cys Ala Ile Thr
770 775 780
Leu Thr Val Met Asp Gly Ser Leu Pro Thr Arg Pro Ser Ser Arg Val
785 790 795 800
Pro Arg Pro Val Arg Leu Leu Ile Thr Ala Thr Gly Tyr Ala Glu Asn
805 810 815
Thr Asp Met Gly Trp Lys Glu Val Pro Gly Tyr Pro Pro Lys Ser Ser
820 825 830
Cys Gly Arg Asn Trp Gly Lys Pro Pro Ser Leu Val Glu Gly Ile Phe
835 840 845
Ala Ser Ile Thr Leu Pro Leu Pro Ala Lys Arg Val Gln Ala Trp Ala
850 855 860
Leu Asp Glu Arg Gly Gln Arg Lys Ser Gln Ile Pro Val Thr Ala Asp
865 870 875 880
Pro Ser Gly Asn Ala Val Ile Arg Ile Ser Pro Gln Trp Gln Thr Leu
885 890 895
Trp Tyr Glu Val Glu Ala Arg
900
<210> 25
<211> 2685
<212> DNA
<213> Teredinibacter turnerae
<400> 25
atgtttttgt ttatctcaac gcactcacca cgcctgtgcc tgtaccgggc acttctcttt 60
ccgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gctttgcgca atcaccgata 120
aagtctttca cgcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggaacg 180
ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccactcact 240
atcgattccg atgggcattt ctccgttgcc gggaataggt ttaggctttg gggcgtgaac 300
attacgggtg actcagcttt tccgtcacac gaagacgccg aaaaaatcgc cgggcgctta 360
gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420
ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggacaa tctcgataag 480
ctcgattact ttattgccgc tctaaaattg cgtggaatct acagcaatat aaacctgctt 540
accgcgcggg aatttttacc tgctgatgga ttacccgcat cgattactca gattgactgg 600
aaggcgcggc agatgctcgg cgcgatttcg catgcggttc gcaatctgga aaaagcctac 660
gcgaaaaaac ttctgcacca tgtgaacccc tacacgcgcc tggcataccg gacagacccg 720
gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780
aatatagatc gctggccaaa ggagtttaaa cggccactgg cgcaagagtg gaatgcttgg 840
ttgactcgca agtataaaga tcagaatgca ctcgagcgcg cttggcaggt gattgataaa 900
cctctgggta acaatctgtt aaaaaatgcg aattttgtgg ccgggttaca ggggtggcat 960
ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc tggtttgcgt 1020
attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaatttacct 1080
gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140
aaaattacac cgctggtgat gcagcgtgcg gaaccctggc tggtggttga atcgtttcct 1200
gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260
caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattagg 1320
gatctgcgct tgcagcccgg cgggaccgtc ggtgaacttg ccgcgaacca aacgcttgaa 1380
cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcgggaagat 1440
tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgctatctg 1500
gctgaggaac tcaaggttaa aagcaatatc tatgggacta tcgcgagcct gagtccgcct 1560
tcaattcagc gcgaatttgg atttatcgat agccatatct attgggcgca cccacatttc 1620
cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680
tttccaaaca acacgttgag cgcgctggcg cgccagcgag ttgccggcct gccttttgtt 1740
gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800
gcggcctatg cgggtttgca ggattgggac ggcgtttatc tgttttctta cgaccagggg 1860
gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920
gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980
cagggcaaac gctggttgaa tttttcgcga tcccgcgagc tcgcacaaat tgcaagcgcc 2040
ggtgcatcct ggagcgtgag tccggcggac ttcccggcgg actggcgtgg ctacgcattt 2100
catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160
gatgttaaca aggtaactgc agatacagga gcgctcacct gggatacgtc tgtccaagcg 2220
cagggcaggg tgacaataaa cacggcgaaa tctgctggcg tagtgggctt tattgcagat 2280
caaggcttcc agctcggtgc gctcgaattg agagtgggcg atttgcagat gggttgggcc 2340
agttggatga tcactgcaca agagggaagt ttgcaggatc ttgccccagg cgcatcgctg 2400
ttggcggttg cgacggcaaa aattgagaac agtaaaatgc gttggaacga cgcgcataat 2460
tcgcttggcc gcaattgggg tgaagcgccg acgagggttg aggttgtgcc ctttagtctc 2520
acgctgccag ttgcttccag gcgggtaaat gcctggtgtc tggatgagcg tgggcagcga 2580
ttgcaggcgt tgaaggtcga gcaaacagcc acgggcagtc gtatcgacgt ggatagcaaa 2640
gcgcgaacat tgtggtatga gatagccatc gcccccaaaa tctaa 2685
<210> 26
<211> 894
<212> PRT
<213> Teredinibacter turnerae
<400> 26
Met Phe Leu Phe Ile Ser Thr His Ser Pro Arg Leu Cys Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu
20 25 30
Glu Arg Phe Ala Gln Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu
35 40 45
Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Thr Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp
100 105 110
Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser His Ala Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Leu
210 215 220
Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Thr Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Pro
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp Gln
275 280 285
Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Lys Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Lys Ile Thr Pro
370 375 380
Leu Val Met Gln Arg Ala Glu Pro Trp Leu Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His
405 410 415
Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Ile Arg Asp Leu Arg Leu Gln Pro Gly Gly
435 440 445
Thr Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met
485 490 495
His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Arg
660 665 670
Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asp Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile
690 695 700
Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu
705 710 715 720
Asp Val Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr
725 730 735
Ser Val Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala
740 745 750
Gly Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu
755 760 765
Glu Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile
770 775 780
Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Pro Gly Ala Ser Leu
785 790 795 800
Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn
805 810 815
Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg
820 825 830
Val Glu Val Val Pro Phe Ser Leu Thr Leu Pro Val Ala Ser Arg Arg
835 840 845
Val Asn Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Leu Gln Ala Leu
850 855 860
Lys Val Glu Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys
865 870 875 880
Ala Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile
885 890
<210> 27
<211> 2685
<212> DNA
<213> Teredinibacter turnerae
<400> 27
atgttttggt ttacctctgc gtactcgcga agcttgtgtc tgtaccgggc acttctgttt 60
ccggtgttgc tcttctgtgt tgatgctccg gcagcagagc gtctttcgca accaccaaca 120
aaatcggtaa atcacacagg gttagcaccg ttcgtgcttc ccttcgacga tgatggtacg 180
ggtattaccg cttttaataa cggatcgcac cagcgagggg aggggcttgc tccgctcact 240
atcgattccg ccggacattt ctccgtcgcc gggaataggt ttaggctttg gggcgtaaat 300
ataacggggg actccgcctt cccctcacac aaggatgcgg aaaaagttgc cggacgttta 360
gcaaaattcg gcgtgaacat tgttcggttt catcatttgg acaataactg gggtggtgcg 420
ggcctaattg attatcgacg gggagactcc cgtcatttga gtaaggaaaa tctcgataag 480
ctcgattatt ttattgccgc tttaaaattg cgtggaatct acagcaatat aaacctgctt 540
actgcgcgcg aatttttacc tgctgacgga ttgcctgcat cgattactca aatcgattgg 600
aaggcgcggc aaatgctcgg cgcgatttct ccctcggtcc gcaatttgga aaaagcctac 660
gcgaaacaaa ttctgaagca tgtaaatccg tacacgcgcc tggcgtaccg ggtagatccg 720
gccatcgcat ttgttgaaat aaacaatgaa aacagcctgt ttcaacagtt ttttgacggc 780
aatatagacc gctggccgga agcgtttagt cagccactgg cgcaagagtg gaatgcttgg 840
ttggctcgca agtataaaga tcacgctgca ctcgagcgtg cctggcaggt gattgataaa 900
cctctgggca acaatctgtt aaaaaatgcg gattttgtgg cgggcttaca gggttggcat 960
ttagaccaga tcgacggcgc aaaggcgcag gccaatccgc tcgcatccgc tggtttgcgt 1020
atccaaatag ataccgtagg gcctgcgtta tggaacattc aactttccca aaacttacct 1080
gaactcaaag acggtgagat ttacacattg tcgtttgccg cacgctcgca gtcgcacagc 1140
agaattacac ctctgctgat gcagagtgtg gaaccctggc aggtggtcga atccttccct 1200
gtgaagctcg attctgaatg gcgggaattc aggtttcagt atgtgcatac tggatcagcg 1260
caaccgttgc gcttaacgtt gggtgaattg ggttcggtaa taggggcaat agatgttagg 1320
gatcttcgcc tgcagtctgg cggaactgtc ggtgaacttg ctaagaacca gactctcgaa 1380
cgccgttcta taggattaaa ccgtaacgat gaatcctatc tcgcgcagcg gcgggaagac 1440
tggtttgcat ttttgtacag ccttgagctg gcgtactggc aggatatgca cagctatttg 1500
gctgatgaac tcaaggttaa aaacaatatt tatgggacta tcgcgagctt gagtccgcct 1560
tcaattcagc gcgaatttgg atttatcgat agtcatatct attgggcgca cccacatttt 1620
cccgctggag cctgggatgc acagcagtgg agtgtcgata tgtcgtccat ggttaacgcc 1680
ttcccaaaca acacgttaag cgctctggcg cgccagcgcg tggccgggct gccttttgta 1740
gtctctgaat atcagcatgc tatgccaaat ccctattctg cagaaggccc gctgctggta 1800
gcggcctatg cgggtttgca ggattgggat ggcgtttatc tgttttcgta cgatcagggg 1860
gaactgggtt ggcaacagga atttatcgac ggattcttta aaactaattt gaacccagcg 1920
gcaatggtta attttgccgt cggcgggaat ctgtttcgac gtggagatgt gcagcctgcg 1980
cagggcaaac gctggttaaa tttttctcga tccggcgagc tcgcacaaat tacaaacgcc 2040
ggtgcatctt ggagtgtgag tccggcggac ttccctccgg aatggcgtgg ctacgctttt 2100
cacgagcaaa tgggcttgca gttgggtatg tcaacgacgg agtctaaacc gccggtgctt 2160
gatgttaaca aagtgactgc cgagacgggc gaactcagtt gggatacaac tagccaagcg 2220
cagggtaggg tgacaataaa cacagaaaaa tccgctggcg tagtgggctt tgttgcagat 2280
caacacttcc agctcggtgc gttggggttg accttgggcg atctacagat gggctgggcc 2340
agctggatgg tcactgcgca agagggtagt ttgcaggatc ttgcagcagg cgcttcgctg 2400
ttggcagttg cgaccgcaaa aattgaaaac agtaaaatgc gctggaacga cgctcataat 2460
tcgctcggcc gcaattgggg tgaagcgccg acgagggttg aagttgtgcc ttttagtctc 2520
tcgttgccaa ttgctgccag gcgggttagt gcctggtgtt tggatgagcg tggtcagcga 2580
atgcggtcgt tgaaggttgt gcaaacagcg acaggcagtc gtatcgatgt ggatagcaaa 2640
gcgcgaacat tatggtacga gatcgtcata accccgaaaa tataa 2685
<210> 28
<211> 894
<212> PRT
<213> Teredinibacter turnerae
<400> 28
Met Phe Trp Phe Thr Ser Ala Tyr Ser Arg Ser Leu Cys Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Pro Val Leu Leu Phe Cys Val Asp Ala Pro Ala Ala
20 25 30
Glu Arg Leu Ser Gln Pro Pro Thr Lys Ser Val Asn His Thr Gly Leu
35 40 45
Ala Pro Phe Val Leu Pro Phe Asp Asp Asp Gly Thr Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Ala Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Lys Asp
100 105 110
Ala Glu Lys Val Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Glu Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser Pro Ser Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Gln Ile
210 215 220
Leu Lys His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Val Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Glu Ala Phe Ser Gln Pro
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Ala Arg Lys Tyr Lys Asp His
275 280 285
Ala Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Lys Asn Ala Asp Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Asn Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Ile Asp Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Gln Ser His Ser Arg Ile Thr Pro
370 375 380
Leu Leu Met Gln Ser Val Glu Pro Trp Gln Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Glu Trp Arg Glu Phe Arg Phe Gln Tyr Val His
405 410 415
Thr Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Val Arg Asp Leu Arg Leu Gln Ser Gly Gly
435 440 445
Thr Val Gly Glu Leu Ala Lys Asn Gln Thr Leu Glu Arg Arg Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Ala Tyr Trp Gln Asp Met
485 490 495
His Ser Tyr Leu Ala Asp Glu Leu Lys Val Lys Asn Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Gly
660 665 670
Glu Leu Ala Gln Ile Thr Asn Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asp Phe Pro Pro Glu Trp Arg Gly Tyr Ala Phe His Glu Gln Met
690 695 700
Gly Leu Gln Leu Gly Met Ser Thr Thr Glu Ser Lys Pro Pro Val Leu
705 710 715 720
Asp Val Asn Lys Val Thr Ala Glu Thr Gly Glu Leu Ser Trp Asp Thr
725 730 735
Thr Ser Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Glu Lys Ser Ala
740 745 750
Gly Val Val Gly Phe Val Ala Asp Gln His Phe Gln Leu Gly Ala Leu
755 760 765
Gly Leu Thr Leu Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Val
770 775 780
Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Ala Gly Ala Ser Leu
785 790 795 800
Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn
805 810 815
Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg
820 825 830
Val Glu Val Val Pro Phe Ser Leu Ser Leu Pro Ile Ala Ala Arg Arg
835 840 845
Val Ser Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Met Arg Ser Leu
850 855 860
Lys Val Val Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys
865 870 875 880
Ala Arg Thr Leu Trp Tyr Glu Ile Val Ile Thr Pro Lys Ile
885 890
<210> 29
<211> 2868
<212> DNA
<213> Diplosphaera colitermitum
<400> 29
atgtctcccc agattgcctc tttcgcacgt cgctgccgcc tcgtccacac actatctggt 60
gcactgcttg ccatcgcatt tgcgtccggc ccgctgacgg cgatcatcgc caacgctggc 120
gcatctgaac tcacggcggc cacggccaac caactcccct tcgccaacgg cttccccttt 180
cacatccccc ccaccggcac ccaaccgggc accgcgccct acgacctcgc gatcccgccg 240
tccgccaaca caaaaatcga cagccccatc agcattcgcg gcgaccaatt catcgttcgc 300
catttgacat caaacaccag ccccgacacc ggcgaaccca tccgcttctg gggcaccaac 360
ctttgctttt ccggcgtatt ccccgaacac gacatcgctg accgcatggc cgcgcgcatg 420
gccacactcg gcatcaacat cgtccgcctt caccacttcg accaacgccg tttccccggc 480
ggcatctggc atcgcgacgc ccccggcgcc tccaaatctc ccaacgaaga cgacatcgcc 540
caccaaacct tcgacccaga atcccttgac cgcctcgact acctcatcgc cgccctcaaa 600
aaacgcggca tctacaccaa cctaaacctc aaagtctccc gcatattcag tcccgaccac 660
gacggccccg acttcccgaa acccgatcct gccaaaaacg aaatcctgcc caaaaaaggc 720
aaaggctttg accaatttta cacccccgcc atcgccgcgc aaaaagacta cgcccgccgc 780
ctcctcaccc atcgcaaccc ctacaccggc ctcacctaca ccgaagaccc cgccgtcgcg 840
atggtggaga tcaacaacga aaacggcatc ctctgggcct ggaactaccg aatccttgac 900
cgcattccct cccgtttcat tgacgaactc gccgcccgct ggaacacctg gcttcgtaac 960
caatattcca ctaccgacgc actccgcgcc gcatggaatc cggcgagtgg cgcgggcgtc 1020
ccacccgcaa ccggaaccgt agcctcccgg tccgttccct ccaccggtgg caacctcttg 1080
gaaaacatcc cccccgccct cttcaccgcc aaaaaagccc gcgccaccct cgccccgctc 1140
accgccgccg ccgacgccga cgattccacc ccggcctccc gtcgcctcac cgttgccgaa 1200
gtccctgctg ccaccgcttg gaatgtccgc tgcaactggc ccctcccgac cgcgcttccc 1260
gccgacgcca cctacaccgc cacccttcgc ctccgcgcaa accaacccca caaaatcaaa 1320
ctccgcctcc gctccccgtc cgacaacaag gacctcgcgc ccgtccgcac cctcaacctc 1380
gccaccgagt ggaaaaacca cagcaccacc tttgccatcc cgccgggtga cgccgccgtc 1440
gccgcccaac tcaccctcga agcgggcatc cccggcctcg tcctcgacat cgactccgct 1500
tcccttcaac cgctcaccag caaaaacctc ctcggcctcc cagcgggcca aggtctcgtc 1560
tcccaaagtg gcgcgggcgg gacgcccgcg ccacgccccg tcgaatgggt attccgccgc 1620
gatctcccct cccgcacacc cgccgtcgtc accgacgtca tgcgcttcct ccgcgacacc 1680
gaaatcgcct actggcgcga aatgcacgct ttcttacgca acgacctccg cgtcgccgca 1740
cccataacca ccaccgccgt tggctacacc acgccgcaaa tcgccgccga aaccgccgac 1800
ttcatcgaca cccaccgcta ctggggatca ccccgctttc ccgcctttga ccggacaaaa 1860
ccctggaccg tgcaacaaaa acccatggtc tcccaccccg cccagtccac catcgaacgc 1920
atgtccgccc gacgtgtatt cggaaaacca ttcaccatca ccgaatacaa ccacccgccc 1980
tccaccgacc accacgccga ggccttcccc ctcgtcggcg tctggggcgc cgcgcaaggc 2040
tgggacggcc tcttccagtt cgcctactcc cacagccgcg cttgggaagc tgacatcatg 2100
accggcttct tcgacaccga gcccaacccc gcgcacaccg tcgccgccct cgccgcctcc 2160
gacatcttcc gtcaccgccg catcaccccc tttgcctcca caaaaaccgg ctacgtcacc 2220
ctagaccgcc aactcgaacg ccagaacaac tacgccttcc ctcgcgaaat cgaggccgac 2280
gccatctacg gaggactccc gcccgacgcc tggcttacca accgcgtcgg cctcgcgcca 2340
agtgacgcgg gcgtcccgcc cgcaaccctt gcccctccgc cctccgtctc ccaaagcctc 2400
gtctgggacg ccgccaaccc cgccaccgcc cacgtccgtt acacgggcga cggcgttgct 2460
ggcctcatcg gattcgtttc cggccagacc ctcgatctcg gatggctccg tatcacaccc 2520
ggcactacat cactcaacgg cttctcaatt gtcatgctca ataccgttga ccgccaagcc 2580
ctcggagccc ccggacgcta cctgctcact gtggccgtcc gagcctccaa cctcggcatg 2640
ggctggaacg ctgaccgcac cggcttcggc aaaaaatggg gcactggtcc cacccatgcc 2700
gaaaccgccc cgatcgcgct cgatttcgcc tctgccaccg gcgtccgggt gtatccgctc 2760
aatcccgacg gaacacgtcg cccggaactc ccgccggtct ccctcccggg tcgcttcgaa 2820
gccactcctg ccagcaaaac tctctggtac gaaatcatcc tcccgtaa 2868
<210> 30
<211> 955
<212> PRT
<213> Diplosphaera colitermitum
<400> 30
Met Ser Pro Gln Ile Ala Ser Phe Ala Arg Arg Cys Arg Leu Val His
1 5 10 15
Thr Leu Ser Gly Ala Leu Leu Ala Ile Ala Phe Ala Ser Gly Pro Leu
20 25 30
Thr Ala Ile Ile Ala Asn Ala Gly Ala Ser Glu Leu Thr Ala Ala Thr
35 40 45
Ala Asn Gln Leu Pro Phe Ala Asn Gly Phe Pro Phe His Ile Pro Pro
50 55 60
Thr Gly Thr Gln Pro Gly Thr Ala Pro Tyr Asp Leu Ala Ile Pro Pro
65 70 75 80
Ser Ala Asn Thr Lys Ile Asp Ser Pro Ile Ser Ile Arg Gly Asp Gln
85 90 95
Phe Ile Val Arg His Leu Thr Ser Asn Thr Ser Pro Asp Thr Gly Glu
100 105 110
Pro Ile Arg Phe Trp Gly Thr Asn Leu Cys Phe Ser Gly Val Phe Pro
115 120 125
Glu His Asp Ile Ala Asp Arg Met Ala Ala Arg Met Ala Thr Leu Gly
130 135 140
Ile Asn Ile Val Arg Leu His His Phe Asp Gln Arg Arg Phe Pro Gly
145 150 155 160
Gly Ile Trp His Arg Asp Ala Pro Gly Ala Ser Lys Ser Pro Asn Glu
165 170 175
Asp Asp Ile Ala His Gln Thr Phe Asp Pro Glu Ser Leu Asp Arg Leu
180 185 190
Asp Tyr Leu Ile Ala Ala Leu Lys Lys Arg Gly Ile Tyr Thr Asn Leu
195 200 205
Asn Leu Lys Val Ser Arg Ile Phe Ser Pro Asp His Asp Gly Pro Asp
210 215 220
Phe Pro Lys Pro Asp Pro Ala Lys Asn Glu Ile Leu Pro Lys Lys Gly
225 230 235 240
Lys Gly Phe Asp Gln Phe Tyr Thr Pro Ala Ile Ala Ala Gln Lys Asp
245 250 255
Tyr Ala Arg Arg Leu Leu Thr His Arg Asn Pro Tyr Thr Gly Leu Thr
260 265 270
Tyr Thr Glu Asp Pro Ala Val Ala Met Val Glu Ile Asn Asn Glu Asn
275 280 285
Gly Ile Leu Trp Ala Trp Asn Tyr Arg Ile Leu Asp Arg Ile Pro Ser
290 295 300
Arg Phe Ile Asp Glu Leu Ala Ala Arg Trp Asn Thr Trp Leu Arg Asn
305 310 315 320
Gln Tyr Ser Thr Thr Asp Ala Leu Arg Ala Ala Trp Asn Pro Ala Ser
325 330 335
Gly Ala Gly Val Pro Pro Ala Thr Gly Thr Val Ala Ser Arg Ser Val
340 345 350
Pro Ser Thr Gly Gly Asn Leu Leu Glu Asn Ile Pro Pro Ala Leu Phe
355 360 365
Thr Ala Lys Lys Ala Arg Ala Thr Leu Ala Pro Leu Thr Ala Ala Ala
370 375 380
Asp Ala Asp Asp Ser Thr Pro Ala Ser Arg Arg Leu Thr Val Ala Glu
385 390 395 400
Val Pro Ala Ala Thr Ala Trp Asn Val Arg Cys Asn Trp Pro Leu Pro
405 410 415
Thr Ala Leu Pro Ala Asp Ala Thr Tyr Thr Ala Thr Leu Arg Leu Arg
420 425 430
Ala Asn Gln Pro His Lys Ile Lys Leu Arg Leu Arg Ser Pro Ser Asp
435 440 445
Asn Lys Asp Leu Ala Pro Val Arg Thr Leu Asn Leu Ala Thr Glu Trp
450 455 460
Lys Asn His Ser Thr Thr Phe Ala Ile Pro Pro Gly Asp Ala Ala Val
465 470 475 480
Ala Ala Gln Leu Thr Leu Glu Ala Gly Ile Pro Gly Leu Val Leu Asp
485 490 495
Ile Asp Ser Ala Ser Leu Gln Pro Leu Thr Ser Lys Asn Leu Leu Gly
500 505 510
Leu Pro Ala Gly Gln Gly Leu Val Ser Gln Ser Gly Ala Gly Gly Thr
515 520 525
Pro Ala Pro Arg Pro Val Glu Trp Val Phe Arg Arg Asp Leu Pro Ser
530 535 540
Arg Thr Pro Ala Val Val Thr Asp Val Met Arg Phe Leu Arg Asp Thr
545 550 555 560
Glu Ile Ala Tyr Trp Arg Glu Met His Ala Phe Leu Arg Asn Asp Leu
565 570 575
Arg Val Ala Ala Pro Ile Thr Thr Thr Ala Val Gly Tyr Thr Thr Pro
580 585 590
Gln Ile Ala Ala Glu Thr Ala Asp Phe Ile Asp Thr His Arg Tyr Trp
595 600 605
Gly Ser Pro Arg Phe Pro Ala Phe Asp Arg Thr Lys Pro Trp Thr Val
610 615 620
Gln Gln Lys Pro Met Val Ser His Pro Ala Gln Ser Thr Ile Glu Arg
625 630 635 640
Met Ser Ala Arg Arg Val Phe Gly Lys Pro Phe Thr Ile Thr Glu Tyr
645 650 655
Asn His Pro Pro Ser Thr Asp His His Ala Glu Ala Phe Pro Leu Val
660 665 670
Gly Val Trp Gly Ala Ala Gln Gly Trp Asp Gly Leu Phe Gln Phe Ala
675 680 685
Tyr Ser His Ser Arg Ala Trp Glu Ala Asp Ile Met Thr Gly Phe Phe
690 695 700
Asp Thr Glu Pro Asn Pro Ala His Thr Val Ala Ala Leu Ala Ala Ser
705 710 715 720
Asp Ile Phe Arg His Arg Arg Ile Thr Pro Phe Ala Ser Thr Lys Thr
725 730 735
Gly Tyr Val Thr Leu Asp Arg Gln Leu Glu Arg Gln Asn Asn Tyr Ala
740 745 750
Phe Pro Arg Glu Ile Glu Ala Asp Ala Ile Tyr Gly Gly Leu Pro Pro
755 760 765
Asp Ala Trp Leu Thr Asn Arg Val Gly Leu Ala Pro Ser Asp Ala Gly
770 775 780
Val Pro Pro Ala Thr Leu Ala Pro Pro Pro Ser Val Ser Gln Ser Leu
785 790 795 800
Val Trp Asp Ala Ala Asn Pro Ala Thr Ala His Val Arg Tyr Thr Gly
805 810 815
Asp Gly Val Ala Gly Leu Ile Gly Phe Val Ser Gly Gln Thr Leu Asp
820 825 830
Leu Gly Trp Leu Arg Ile Thr Pro Gly Thr Thr Ser Leu Asn Gly Phe
835 840 845
Ser Ile Val Met Leu Asn Thr Val Asp Arg Gln Ala Leu Gly Ala Pro
850 855 860
Gly Arg Tyr Leu Leu Thr Val Ala Val Arg Ala Ser Asn Leu Gly Met
865 870 875 880
Gly Trp Asn Ala Asp Arg Thr Gly Phe Gly Lys Lys Trp Gly Thr Gly
885 890 895
Pro Thr His Ala Glu Thr Ala Pro Ile Ala Leu Asp Phe Ala Ser Ala
900 905 910
Thr Gly Val Arg Val Tyr Pro Leu Asn Pro Asp Gly Thr Arg Arg Pro
915 920 925
Glu Leu Pro Pro Val Ser Leu Pro Gly Arg Phe Glu Ala Thr Pro Ala
930 935 940
Ser Lys Thr Leu Trp Tyr Glu Ile Ile Leu Pro
945 950 955
<210> 31
<211> 2685
<212> DNA
<213> Teredinibacter turnerae
<400> 31
atgttttggt ttacctatgc gtactcgcga agcttgtgtc tgtaccgggc actcctgttt 60
ccgttgttgc tcttctgtgt tgatgctccg gcagcagagc gtctttcgca atcaccgaca 120
aaatcggtaa atcacacagg gttagcaccg ttcgtgcttc ccttcgacga tgatggtacg 180
ggtattaccg cttttaataa cgggtcgcac cagcgagggg agaggcttgc tccgctcact 240
atcgattccg ccggacattt ctccgtcgcc gggaataggt ttaggctttg gggcgtaaat 300
ataacagggg attccgcctt cccctcacac aaggatgcgg aaaaagttgc cggacgttta 360
gcaaaatttg gcgtgaacat tgttcggttt catcatttgg acaataactg gggtggtgcg 420
ggcctaattg attatcgacg gggagactcc cgtcatttga gtaaggaaaa tctcgataag 480
ctcgattatt ttattgccgc tttaaaatcg cgtggaatct acagcaatat aaacctgctt 540
accgcgcgcg aatttttacc tgctgacgga ttgcctgcat cgattactca aatcgattgg 600
aaggcgcggc aaatgctcgg cgcgatttct cccgcggtcc gcaatttgga aaaagcctac 660
gcgaaacaaa ttctgcaaca tgtaaatccg tacacgcgct tggcgtatcg ggtagatccg 720
gccatcgctt ttgttgaaat aaacaatgaa aacagcctgt ttcaacagtt ttttgacggc 780
aatatagacc gctggccgga agcgtttagt cagccactgg cgcaagagtg gaatgcttgg 840
ttggctcgca agtataaaga tcacgctgca ctcgagcgtg cctggcaggt gattgataaa 900
cctctgggca acaatctgtt aaaaaatgcg gattttgtgg cgggcttaca gggttggcat 960
ttagaccaga tcgacggcgc aaaggcgcag gccaatccgc tcgcatccgc tggtttgcgt 1020
atccaaataa ataccgtagg gcctgcgtta tggaacattc aactttctca aaacttacct 1080
gaactcaaag acggtgagat ttacacattg tcgtttgccg cacgctcgca gtcgcacagc 1140
agaattacac ctctgctgat gcagagtgtg gcaccctggc aggtggtcga atctttccct 1200
gtgaagctcg attccgaatg gcaggaattc aggtttcagt atgtgcatac tggatcagcg 1260
caaccgttgc gcctaacgtt gggtgaattg ggttcggtaa taggggcaat agatgttagg 1320
gatcttcgcc tgcagtctgg cggaactgtt ggtgaacttg ctaagaacca gactctcgaa 1380
cgccgttcta taggattaaa ccgtaacgat gaatcctatc tcgcgcagcg gcgggaagac 1440
tggtttgcat ttttgtacag ccttgagctg gcgtactggc aggatatgca cagctatttg 1500
gctgatgaac tcaaggttaa aaacaatatt tatgggacta tcgcgagctt gagtccgcct 1560
tcaatacagc gcgaatttgg atttatcgat agtcatatct attgggcgca cccacatttt 1620
cccgctggag cctgggatgc acagcagtgg agtgtcgata tgtcgtccat ggttaacgcc 1680
ttcccaaaca acacgttaag cgctctggcg cgccagcgcg tggccgggct gccttttgta 1740
gtctctgaat atcagcatgc tatgccaaat ccctattctg cagaaggccc gctgctggta 1800
gcggcctatg cgggtttgca ggattgggac ggcgtttatc tgttttcgta cgatcagggg 1860
gaactgggtt ggcaacagga atttatcgat ggattcttta aaaccaattt gaacccagcg 1920
gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggagatgt gcagcctgcg 1980
catggcaaac gctggttaaa tttttcgcga tccggcgagc tcgcacgaat tacaaacgcc 2040
ggtgcatctt ggagtgtgag tccggcggac ttccctccgg aatggcgtgg ctacgctttt 2100
cacgagcaaa tgggcttgca gttggatatg tcagggaggg agtctaaacc gccggtgctt 2160
gatgttaaca aagtgactgc cgagacgggc gaactcagtt gggatacaac tatccaagcg 2220
cagggtaggg tgacaataaa cacagcgaaa tccgctggcg tagtgggctt tgttgcagat 2280
caacacttcc agctcggtgc gttggggttg accttgggcg atctacagat gggttgggcc 2340
agttggatgg tcactgcgca agagggtagt ttgcaggatc ttgcagcagg cgcttcgctg 2400
ttggcagttg cgaccgcaaa aattgaaaac agtaaaatgc gttggaacga cgctcataat 2460
tcgctcggcc gcaattgggg ggaagcgccg acgagagttg aagttgtgcc ttttagtctc 2520
tcgttgccaa ttgctgccag gcgggttagt gcctggtgtt tggatgagcg tggtcagcga 2580
atgcagtcgc tgagggttgt gcaaacagcg acaggcagtc gtatcgatgt ggatagcaaa 2640
gcgcgaacat tatggtacga gatcgtcata accccgaaaa tataa 2685
<210> 32
<211> 894
<212> PRT
<213> Teredinibacter turnerae
<400> 32
Met Phe Trp Phe Thr Tyr Ala Tyr Ser Arg Ser Leu Cys Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Pro Ala Ala
20 25 30
Glu Arg Leu Ser Gln Ser Pro Thr Lys Ser Val Asn His Thr Gly Leu
35 40 45
Ala Pro Phe Val Leu Pro Phe Asp Asp Asp Gly Thr Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Arg Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Ala Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Lys Asp
100 105 110
Ala Glu Lys Val Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Glu Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Ser Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser Pro Ala Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Gln Ile
210 215 220
Leu Gln His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Val Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Glu Ala Phe Ser Gln Pro
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Ala Arg Lys Tyr Lys Asp His
275 280 285
Ala Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Lys Asn Ala Asp Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Asn Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Ile Asn Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Gln Ser His Ser Arg Ile Thr Pro
370 375 380
Leu Leu Met Gln Ser Val Ala Pro Trp Gln Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Glu Trp Gln Glu Phe Arg Phe Gln Tyr Val His
405 410 415
Thr Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Val Arg Asp Leu Arg Leu Gln Ser Gly Gly
435 440 445
Thr Val Gly Glu Leu Ala Lys Asn Gln Thr Leu Glu Arg Arg Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Ala Tyr Trp Gln Asp Met
485 490 495
His Ser Tyr Leu Ala Asp Glu Leu Lys Val Lys Asn Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala His Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Gly
660 665 670
Glu Leu Ala Arg Ile Thr Asn Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asp Phe Pro Pro Glu Trp Arg Gly Tyr Ala Phe His Glu Gln Met
690 695 700
Gly Leu Gln Leu Asp Met Ser Gly Arg Glu Ser Lys Pro Pro Val Leu
705 710 715 720
Asp Val Asn Lys Val Thr Ala Glu Thr Gly Glu Leu Ser Trp Asp Thr
725 730 735
Thr Ile Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala
740 745 750
Gly Val Val Gly Phe Val Ala Asp Gln His Phe Gln Leu Gly Ala Leu
755 760 765
Gly Leu Thr Leu Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Val
770 775 780
Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Ala Gly Ala Ser Leu
785 790 795 800
Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn
805 810 815
Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg
820 825 830
Val Glu Val Val Pro Phe Ser Leu Ser Leu Pro Ile Ala Ala Arg Arg
835 840 845
Val Ser Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Met Gln Ser Leu
850 855 860
Arg Val Val Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys
865 870 875 880
Ala Arg Thr Leu Trp Tyr Glu Ile Val Ile Thr Pro Lys Ile
885 890
<210> 33
<211> 2682
<212> DNA
<213> Teredinibacter turnerae
<400> 33
atgtttttgt ttatctcaac gcactcacca agcctgtgcc tgtaccgggc acttctcttt 60
ccgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gccttgcaca atcaccgata 120
aagtctttca cgcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggagcg 180
ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccgctcact 240
atcgattccg acgggcattt ctccgttgcc gggaataggt ttaggctttg gggcgtgaac 300
attacgggtg actcagcttt tccgtcacac gaagacgccg aaaaaatcgc cgggcgttta 360
gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420
ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggacaa tctcgataag 480
ctcgattact ttattgccgc tttaaaattg cgtggaatct acagcaatat aaacctgctt 540
accgcgcggg aatttttacc tgctgatgga ttacccgcat cgattactca gattgactgg 600
aaggcgcggc agatgctcgg cgcgatttcg cctgcggttc gcaatctgga aaaagcctac 660
gcgaaaaaaa ttctgcatca tgtgaacccc tacacgcgcc tggcataccg ggcagacccg 720
gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780
aatatagatc gctggccaaa ggagtttaaa cggccactgg cgcaagagtg gaatgcttgg 840
ttgactcgaa agtataaaga tcagaatgca ctcgagcgcg cctggcaggt gattgataaa 900
cctctgggta acaatctgtt aaaaaatgcg aattttgtgg ccgggttaca ggggtggcat 960
ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc gggtttgcgt 1020
attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaacttacct 1080
gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140
caaattacac cgctggtgat gcagcgtgcg gaaccctggc aggtggttga atcgtttcct 1200
gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260
caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattagg 1320
gatctgcgct tgcagcccgg cgggaccgtc ggtgaacttg ccgcgaacca aacgcttgaa 1380
cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcgggaagat 1440
tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgctatctg 1500
gctgaggaac tcaaggttaa aagcaatatc tatgggacta tcgcgagcct gagtccgcct 1560
tcaattcagc gcgaatttgg atttatcgat agccatatct attgggcgca cccacatttc 1620
cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680
tttccaaaca acacgttgag cgcgctggcg cgccagcgag ttgccggcct gccttttgtt 1740
gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800
gcggcctatg cgggtttgca ggattgggac ggcgtttatc tgttttctta cgaccagggg 1860
gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920
gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980
cagggcaaac gctggttaaa tttttcgcga tcccgcgagc tcgcacaaat tgcaagcgcc 2040
ggtgcatcct ggagcgtgag tccggcggac ttcccggcgg actggcgtgg ctacgcattt 2100
catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160
gataacaagg taactgcaga tacaggagcg ctcacctggg atacgtctgt ccaagcgcag 2220
ggcagggtga caataaacac ggcgaaatct gctggcgtag tgggctttat tgcagatcaa 2280
ggcttccagc tcggtgcgct cgaattgaga gtgggcgatt tgcagatggg ttgggccagt 2340
tggatgatca ctgcacaaga gggaagtttg caggatcttg ccccaggcgc atcgctgttg 2400
gcggttgcga cggcaaaaat tgagaacagt aaaatgcgtt ggaacgacgc gcataattcg 2460
cttggccgca attggggtga agcgccgacg agggttgagg ttgtgccctt tagtctcacg 2520
ctgccagttg cttccaggcg ggtaaatgcc tggtgtctgg atgagcgtgg gcagcgattg 2580
cacgcgttga aggtcgagca aacagccacg ggcagtcgta tcgacgtgga tagcaaagcg 2640
cgaacattgt ggtatgagat agccatcgcc cccaaaatct aa 2682
<210> 34
<211> 893
<212> PRT
<213> Teredinibacter turnerae
<400> 34
Met Phe Leu Phe Ile Ser Thr His Ser Pro Ser Leu Cys Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu
20 25 30
Glu Arg Leu Ala Gln Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu
35 40 45
Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Ala Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp
100 105 110
Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser Pro Ala Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Ile
210 215 220
Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Ala Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Pro
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp Gln
275 280 285
Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Lys Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Gln Ile Thr Pro
370 375 380
Leu Val Met Gln Arg Ala Glu Pro Trp Gln Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His
405 410 415
Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Ile Arg Asp Leu Arg Leu Gln Pro Gly Gly
435 440 445
Thr Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met
485 490 495
His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Arg
660 665 670
Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asp Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile
690 695 700
Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu
705 710 715 720
Asp Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr Ser
725 730 735
Val Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala Gly
740 745 750
Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu Glu
755 760 765
Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile Thr
770 775 780
Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Pro Gly Ala Ser Leu Leu
785 790 795 800
Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn Asp
805 810 815
Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg Val
820 825 830
Glu Val Val Pro Phe Ser Leu Thr Leu Pro Val Ala Ser Arg Arg Val
835 840 845
Asn Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Leu His Ala Leu Lys
850 855 860
Val Glu Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys Ala
865 870 875 880
Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile
885 890
<210> 35
<211> 2685
<212> DNA
<213> Teredinibacter turnerae
<400> 35
atgtttttgt ttatctcaac gcactcacca cgcctgcgcc tgtaccgggc acttctcttt 60
ccgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gccttgcgca atcaccgata 120
aagtctttca ctcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggagcg 180
ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccactcact 240
atcgattccg atgggcattt ctccgttgcc gggaataggt ttaggctttg gggcgtgaac 300
attacgggtg actcagcttt tccgtcacac gaagacgccg aaaaaatcgc cgggcgttta 360
gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420
ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggacaa tctcgataag 480
ctcgattact ttattgccgc tctaaaattg cgtggaatct acagcaatat aaacctgctt 540
accgcgcggg aatttttacc tgctgatgga ttacccgcat cgattactca gattgactgg 600
aaggcgcggc agatgctcgg cgcgatttcg cctgcgattc gcaatctgga aaaagcctac 660
gcgaaaaaac ttctgcacca tgtgaacccc tacacgcgcc tggcataccg gacagacccg 720
gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780
aatatagatc gctggccaaa ggagtttaaa cggcaactgg cgcaagagtg gaatgcttgg 840
ttgactcgca agtataaaga tcacaatgca ctcgagcgcg cctggcaggt gattgataaa 900
cctctgggta acaatctgtt aaaaaatgcg aactttgtgg ccgggttaca gggttggcat 960
ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc gggtttgcgt 1020
attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaacttacct 1080
gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140
caatttacac cgctggtgat gcagcgtgcg gaaccctggc aggtggttga atcgtttcct 1200
gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260
caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattatg 1320
gatctgcgct tgcagcccgg cgggagcgtc ggtgaacttg ccgctaacca aacgcttgaa 1380
cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcggaaagat 1440
tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgttatctg 1500
gctgaggaac tcaaggttaa aagcaatatt tatgggacta tcgcgagctt gagtccgcct 1560
tcaattcagc gcgaatttgg atttatcgat agtcatatct attgggcgca cccacatttc 1620
cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680
tttccaaaca atacgttgag cgcgctggcg cgccaacgag ttgccggcct gccttttgtt 1740
gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800
gcggcctatg cgggtttaca ggattgggac ggcgtttatc tgttttctta cgaccagggt 1860
gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920
gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980
cagggcaaac gctggttaaa tttttcgcga tcccgcgagc tcgcacaaat tgcaagcgcc 2040
ggtgcatcct ggagcgtgag tccggcggac ttcccggcgg actggcgtgg ctacgcattt 2100
catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160
gatgttaaca aggtaactgc agatacagga gcgctcacct gggatacgtc tgtccaagcg 2220
cagggcaggg tgaaaataaa cacggcgaaa tccgctggcg tagtgggctt tattgcagat 2280
caaggcttcc agctcggtgc gctcgaattg agagtgggcg atttgcagat gggttgggcc 2340
agttggatga tcactgcaca agagggaagt ttgcaggatc tcgcccaagg cgcatcgctg 2400
ttggcggttg cgacggcaaa aattgagaac agtaaaatgc gctggaacgg cgcgcataat 2460
tcgcttggcc gcaattgggg tgaagcgccg acgagggttg aggttgtgcc ttttagtctc 2520
acgctgccaa ttgcttccag gcgggtaaat gcttggtctc tggatgagcg tgggcagcga 2580
ttgcacgcgt tgaaggtcga gcaaatagcc acgggcagtc gtatcgacgt ggatagcaaa 2640
gcgcgaacat tgtggtatga gatagccatc gcccccaaaa tctaa 2685
<210> 36
<211> 894
<212> PRT
<213> Teredinibacter turnerae
<400> 36
Met Phe Leu Phe Ile Ser Thr His Ser Pro Arg Leu Arg Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Pro Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu
20 25 30
Glu Arg Leu Ala Gln Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu
35 40 45
Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Ala Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp
100 105 110
Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Gly Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser Pro Ala Ile Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Leu
210 215 220
Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Thr Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Gln
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp His
275 280 285
Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Lys Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Gln Phe Thr Pro
370 375 380
Leu Val Met Gln Arg Ala Glu Pro Trp Gln Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His
405 410 415
Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Ile Met Asp Leu Arg Leu Gln Pro Gly Gly
435 440 445
Ser Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Lys Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met
485 490 495
His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Arg Ser Arg
660 665 670
Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asp Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile
690 695 700
Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu
705 710 715 720
Asp Val Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr
725 730 735
Ser Val Gln Ala Gln Gly Arg Val Lys Ile Asn Thr Ala Lys Ser Ala
740 745 750
Gly Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu
755 760 765
Glu Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile
770 775 780
Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Gln Gly Ala Ser Leu
785 790 795 800
Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn
805 810 815
Gly Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg
820 825 830
Val Glu Val Val Pro Phe Ser Leu Thr Leu Pro Ile Ala Ser Arg Arg
835 840 845
Val Asn Ala Trp Ser Leu Asp Glu Arg Gly Gln Arg Leu His Ala Leu
850 855 860
Lys Val Glu Gln Ile Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys
865 870 875 880
Ala Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile
885 890
<210> 37
<211> 2685
<212> DNA
<213> Teredinibacter turnerae
<400> 37
atgtttttgt ttatctcaac gcactcacca cgcctgcgcc tgtaccgggc acttctcttt 60
ctgttgttgc tcttctgtgt tgatgcgctg gcggaagagc gccttgcgga atcaccgata 120
aagtctttca ctcaaaccgg gttggtgccc ttcgtgcttc ccttcgacga caatggagcg 180
ggtattaccg cttttaataa tggttcgcac cagcgcgggg aggggcttgc cccactcact 240
atcgattccg acgggcattt ctccgtcgcc gggaataggt ttaggctttg gggcgtgaac 300
attacgggtg actcagcttt tccatcacac gaagacgccg aaaaaattgc cgggcgttta 360
gcaaaatttg gcgtgaacat tgttcgtttt catcacttgg acaataactg gggcggtgcg 420
ggcctaatcg attatcggcg gggagactcc cgacatttga gcaaggataa tctcgataag 480
ctcgattact ttattgccgc tttaaaattg cgtggaatct acagcaatat aaacctgctt 540
accgcgcggg aatttttacc tgctgatgaa ttacccgcat cgattactca gattgactgg 600
aaggcgcggc agatgcttgg cgcgatttcg cctacggttc gcaatctgga aaaagcctac 660
gcgaaaaaac ttctgcacca tgtgaacccc tacacgcgcc ttgcataccg ggcagacccg 720
gccatcgcgt ttgttgaaat aaacaatgaa aacagtctgt ttcaacagtt ttttgacggc 780
aatatagatc gctggccaaa ggagtttaaa cggccactgg cgcaagagtg gaatgcttgg 840
ttgactcgca agtataaaga tcagaatgca ctcgagcgcg cctggcaggt gattgataaa 900
cctctgggta acaatctgtt aacaaatgcg aattttgtgg ccgggttaca ggggtggcac 960
ttagaccaga tcgacggcgc aaaggcgcag gcgagtccgc tcgcatccgc gggtttgcgt 1020
attcaagtag ataccgtagg gcctgcgttg tggaacattc aactatccca aaacttacct 1080
gaactaaaag acggtgagat ttacacactg tcgtttgccg cacgatcggc gtcgcacagt 1140
caaattacac cgctggtgat gcagcgtgcg gaaccctggc aggtggttga atcgtttcct 1200
gtaaagctcg attcgaaatg gcaggaattc agatttcggt ttgtgcacag tggatcggcg 1260
caaccattgc gtctgacgtt aggtgaattg ggttcggtaa taggagcgat agacattagg 1320
gatctgcgtt tgcagcccgg cgggactgtc ggtgaacttg ccgcgaacca aacgcttgaa 1380
cgccattcta ttgggttaaa ccgcaacgat gaatcctatc tcgcgcagcg gcgggaagat 1440
tggtttgcat ttttgtacag ccttgagttg acgtactggc aggatatgca ccgctatctg 1500
gctgaggaac tcaaggttaa aagcaatatc tatgggacta tcgcgagcct gagtccgcct 1560
tcaattcagc gcgaatttgg atttatcgat agccatatct attgggcgca cccacatttc 1620
cccgctgggg cctgggacgc gcagcagtgg agtgttgata tgtcgtccat ggttaatgct 1680
tttccaaaca acacgttgag cgcgctggcg cgccagcgag ttgccggcct gccttttgtt 1740
gtctctgaat accagcatgc tatgccaaat ccctattctg cagaagggcc gcttctggta 1800
gcggcctatg cgggtttgca ggattgggac ggtgtttatc tgttttctta cgaccagggg 1860
gaactgggtt ggcaacagga atttattgac ggattcttta aaaccaattt gaatcccgcg 1920
gcaatggtta attttgccgt cggcggtaat ctgtttcgac gtggtgatgt gcagcctgcg 1980
cagggcaaac gctggttaaa tttttcgcca tcccgcgagc tcgcacaaat tgcaagcgcc 2040
ggtgcatcct ggagcgtgag tccggcgaac ttcccggcgg actggcgtgg ctacgcattt 2100
catgagcaaa taggcttgca gttggaggcg ccagcagcgg agcctaaact gcctgtgctt 2160
gatgttaaca aggtaactgc agatacagga gcgctcacct gggatacgtc tgtccaagcg 2220
cagggcaggg tgacaataaa cacggcgaaa tctgctggcg tagtgggctt tattgcagat 2280
caaggcttcc agctcggtgc gctcgaattg agagtgggcg atttgcagat gggttgggcc 2340
agttggatga tcactgcaca agagggaagt ttgcaggatc ttgccccagg cgcatcgctg 2400
ttggcggttg cgacggcaaa aattgagaac agtaaaatgc gttggaacga cgcgcataat 2460
tcgcttggcc gcaattgggg tgaagcgccg acgagggttg aggttgtgcc ctttagtctc 2520
acgctgccag ttgcttccag gcgggtaaat gcctggtgtc tggatgagcg tgggcagcga 2580
ttgcacgcgt tgaaggtcga gcaaacagcc acgggcagtc gtatcgacgt ggatagcaaa 2640
gcgcgaacat tgtggtatga gatagcgatc gcccccaaaa tctaa 2685
<210> 38
<211> 894
<212> PRT
<213> Teredinibacter turnerae
<400> 38
Met Phe Leu Phe Ile Ser Thr His Ser Pro Arg Leu Arg Leu Tyr Arg
1 5 10 15
Ala Leu Leu Phe Leu Leu Leu Leu Phe Cys Val Asp Ala Leu Ala Glu
20 25 30
Glu Arg Leu Ala Glu Ser Pro Ile Lys Ser Phe Thr Gln Thr Gly Leu
35 40 45
Val Pro Phe Val Leu Pro Phe Asp Asp Asn Gly Ala Gly Ile Thr Ala
50 55 60
Phe Asn Asn Gly Ser His Gln Arg Gly Glu Gly Leu Ala Pro Leu Thr
65 70 75 80
Ile Asp Ser Asp Gly His Phe Ser Val Ala Gly Asn Arg Phe Arg Leu
85 90 95
Trp Gly Val Asn Ile Thr Gly Asp Ser Ala Phe Pro Ser His Glu Asp
100 105 110
Ala Glu Lys Ile Ala Gly Arg Leu Ala Lys Phe Gly Val Asn Ile Val
115 120 125
Arg Phe His His Leu Asp Asn Asn Trp Gly Gly Ala Gly Leu Ile Asp
130 135 140
Tyr Arg Arg Gly Asp Ser Arg His Leu Ser Lys Asp Asn Leu Asp Lys
145 150 155 160
Leu Asp Tyr Phe Ile Ala Ala Leu Lys Leu Arg Gly Ile Tyr Ser Asn
165 170 175
Ile Asn Leu Leu Thr Ala Arg Glu Phe Leu Pro Ala Asp Glu Leu Pro
180 185 190
Ala Ser Ile Thr Gln Ile Asp Trp Lys Ala Arg Gln Met Leu Gly Ala
195 200 205
Ile Ser Pro Thr Val Arg Asn Leu Glu Lys Ala Tyr Ala Lys Lys Leu
210 215 220
Leu His His Val Asn Pro Tyr Thr Arg Leu Ala Tyr Arg Ala Asp Pro
225 230 235 240
Ala Ile Ala Phe Val Glu Ile Asn Asn Glu Asn Ser Leu Phe Gln Gln
245 250 255
Phe Phe Asp Gly Asn Ile Asp Arg Trp Pro Lys Glu Phe Lys Arg Pro
260 265 270
Leu Ala Gln Glu Trp Asn Ala Trp Leu Thr Arg Lys Tyr Lys Asp Gln
275 280 285
Asn Ala Leu Glu Arg Ala Trp Gln Val Ile Asp Lys Pro Leu Gly Asn
290 295 300
Asn Leu Leu Thr Asn Ala Asn Phe Val Ala Gly Leu Gln Gly Trp His
305 310 315 320
Leu Asp Gln Ile Asp Gly Ala Lys Ala Gln Ala Ser Pro Leu Ala Ser
325 330 335
Ala Gly Leu Arg Ile Gln Val Asp Thr Val Gly Pro Ala Leu Trp Asn
340 345 350
Ile Gln Leu Ser Gln Asn Leu Pro Glu Leu Lys Asp Gly Glu Ile Tyr
355 360 365
Thr Leu Ser Phe Ala Ala Arg Ser Ala Ser His Ser Gln Ile Thr Pro
370 375 380
Leu Val Met Gln Arg Ala Glu Pro Trp Gln Val Val Glu Ser Phe Pro
385 390 395 400
Val Lys Leu Asp Ser Lys Trp Gln Glu Phe Arg Phe Arg Phe Val His
405 410 415
Ser Gly Ser Ala Gln Pro Leu Arg Leu Thr Leu Gly Glu Leu Gly Ser
420 425 430
Val Ile Gly Ala Ile Asp Ile Arg Asp Leu Arg Leu Gln Pro Gly Gly
435 440 445
Thr Val Gly Glu Leu Ala Ala Asn Gln Thr Leu Glu Arg His Ser Ile
450 455 460
Gly Leu Asn Arg Asn Asp Glu Ser Tyr Leu Ala Gln Arg Arg Glu Asp
465 470 475 480
Trp Phe Ala Phe Leu Tyr Ser Leu Glu Leu Thr Tyr Trp Gln Asp Met
485 490 495
His Arg Tyr Leu Ala Glu Glu Leu Lys Val Lys Ser Asn Ile Tyr Gly
500 505 510
Thr Ile Ala Ser Leu Ser Pro Pro Ser Ile Gln Arg Glu Phe Gly Phe
515 520 525
Ile Asp Ser His Ile Tyr Trp Ala His Pro His Phe Pro Ala Gly Ala
530 535 540
Trp Asp Ala Gln Gln Trp Ser Val Asp Met Ser Ser Met Val Asn Ala
545 550 555 560
Phe Pro Asn Asn Thr Leu Ser Ala Leu Ala Arg Gln Arg Val Ala Gly
565 570 575
Leu Pro Phe Val Val Ser Glu Tyr Gln His Ala Met Pro Asn Pro Tyr
580 585 590
Ser Ala Glu Gly Pro Leu Leu Val Ala Ala Tyr Ala Gly Leu Gln Asp
595 600 605
Trp Asp Gly Val Tyr Leu Phe Ser Tyr Asp Gln Gly Glu Leu Gly Trp
610 615 620
Gln Gln Glu Phe Ile Asp Gly Phe Phe Lys Thr Asn Leu Asn Pro Ala
625 630 635 640
Ala Met Val Asn Phe Ala Val Gly Gly Asn Leu Phe Arg Arg Gly Asp
645 650 655
Val Gln Pro Ala Gln Gly Lys Arg Trp Leu Asn Phe Ser Pro Ser Arg
660 665 670
Glu Leu Ala Gln Ile Ala Ser Ala Gly Ala Ser Trp Ser Val Ser Pro
675 680 685
Ala Asn Phe Pro Ala Asp Trp Arg Gly Tyr Ala Phe His Glu Gln Ile
690 695 700
Gly Leu Gln Leu Glu Ala Pro Ala Ala Glu Pro Lys Leu Pro Val Leu
705 710 715 720
Asp Val Asn Lys Val Thr Ala Asp Thr Gly Ala Leu Thr Trp Asp Thr
725 730 735
Ser Val Gln Ala Gln Gly Arg Val Thr Ile Asn Thr Ala Lys Ser Ala
740 745 750
Gly Val Val Gly Phe Ile Ala Asp Gln Gly Phe Gln Leu Gly Ala Leu
755 760 765
Glu Leu Arg Val Gly Asp Leu Gln Met Gly Trp Ala Ser Trp Met Ile
770 775 780
Thr Ala Gln Glu Gly Ser Leu Gln Asp Leu Ala Pro Gly Ala Ser Leu
785 790 795 800
Leu Ala Val Ala Thr Ala Lys Ile Glu Asn Ser Lys Met Arg Trp Asn
805 810 815
Asp Ala His Asn Ser Leu Gly Arg Asn Trp Gly Glu Ala Pro Thr Arg
820 825 830
Val Glu Val Val Pro Phe Ser Leu Thr Leu Pro Val Ala Ser Arg Arg
835 840 845
Val Asn Ala Trp Cys Leu Asp Glu Arg Gly Gln Arg Leu His Ala Leu
850 855 860
Lys Val Glu Gln Thr Ala Thr Gly Ser Arg Ile Asp Val Asp Ser Lys
865 870 875 880
Ala Arg Thr Leu Trp Tyr Glu Ile Ala Ile Ala Pro Lys Ile
885 890
<210> 39
<211> 2604
<212> DNA
<213> 牛腸宏基因組
<400> 39
atgatacgga attgtttttt gccggctgcg gcactaatga tcggttgcgc atttggggcg 60
gacgacgcca tgttcccctt cgtaccgtcg tacgacgcgc cgatgaacgt ggttaacatg 120
agccatctgc tggacgcgcc cgccggcagc catgggcgca tccgtgttaa agacggacac 180
ttcgtgaacg accagggccg ggtcagactg cacgcgacga atcttacggg accggcgaac 240
tttccgtcgc acgaagaggc ggagcgcctt gcggcgcgtc tggcccgttt cggcatcaac 300
tgcgtccgac tgcactattt cgacagttcc tacggcacgt tcatgcttcc ggccgagcag 360
ggtatcttta cggataaaac cggagaactc cgacgtctcg atcccaagca gcgcgaccgg 420
caggactatc tgatcgccca gttcaagaaa cgcggcattt atgtggatat caacctgcac 480
gtcgcccgta ccctggacgc aagcgacggt ttcgagccgg gaaccccatg ggccaacaag 540
ggcgtggacc agtttgaccc gcgggtgatc gcggcagaaa aagcgtatgc ccgcgaattg 600
ctttcgcacg tcaatcccta taccggactc agttacctga aagaccccgt tgtcgccatc 660
gtggaactca acaacgagga tgcgctgtgg aatcaatacc ttaggggcgg gattgaccag 720
cttggaaaac cgtacgcgaa agaattccaa cgccaatgga acgattggct gcgtaaaaaa 780
tacggcaacg acgaacgaat gcgcgcggct tggcgggtaa agacgcagcc gctgggcgac 840
gaaatgattc aggagggttc gtttgaagag aacgtggtgc cggacggatc gcggtggatt 900
ctcgaccttg agcgtacgaa agcgtctgcc gcttcccaaa acggctcgct ccgcatcacg 960
gtcgaaaaga agtcctccga ccgttttttc cccaagctct accgccgcgt atccgtaaaa 1020
aagaatgtcc catacacggt gtcgttccga atccgccaag cggagggaga gcctggcgaa 1080
gtgggtttcg ccgtggccga ccgcggcaag ggctgggaat cgctgggcat ccacaccgtc 1140
cttaagccta ccaaaaactg gacgaaacgg aagttcacgt tttatgccgc aaaggattgc 1200
cagcaagcgg aaatccagtt cacgcgcttc gaggttggcg cttacgagat tgacgacctt 1260
tcgttccgaa ccggcaacga accggaaaat ctttccaccc tttccgccga aaagggcgag 1320
gtggcaatcg tgaagacgaa agactccgta gtgccggaga tgaaacgcga cttctaccgg 1380
tttgtaatgg atacggaaca cgcctattgg acgggtatgc gcgattatct gcaaaaagag 1440
ctcggactgg aagcaccagt ctccgccacc cagctcgact attcgccgcc gcatctgcag 1500
gcggagatgg acttcgtgga caaccacgcc tactggtgcc acccgagcgt gcggaaagac 1560
tggtcgatcc gcaacaaggc gatggtaaac gcgcgcggcg ggtgcattct cggcctcgcg 1620
gggcaacgtg tggcgggcaa accctacacg gtaagcgagt acaaccaccc ctacccgatt 1680
tactacggcg cggaggggca acctatgcta cgcgcctacg gggcgttgca gggatgggac 1740
ggcgtattcg aatattccta caacaaccgg cagaacgccg agccggacca caacgagtat 1800
ttcttcagca tggcggcacg gaccgacgtg ctggcgcatt tcccggcatg cgcggcgatg 1860
tatctgcggg gcgatgtcaa agagagcgca acgcgtatcg tcgcgaatct tccgcttgag 1920
gaatatttcg aacggttggt gaaagccaac aaggtaagcc aaggcatcac cacggcaacc 1980
gacgggaaac tgtccgccga actgggattg gttcacagcg tggccgtgga tgtgacgggg 2040
caaaccccgc gcacaacgga taatattccg ccgcccggca agataatcgc tagcgacacg 2100
ggggaaatcg tttggaacaa cgatatcgac ggcgcgggcg tttggacggt ggacacgcca 2160
aacacgaaaa tcttctccgg tttcccgaag gggcgcgtgt tcaatctaag cggagtaaaa 2220
ctggcggttg gagagactaa actcggttgg gcgacggtgt cgctgacctc gcacgacgcg 2280
accgggtttg gcggggacgg aaagcccgcg cgtattctgc ttacggcgac cggactttct 2340
cacaacggcg gagcaaagtt cgtcgcaaag ggaaaagagg cgatttttgc ttccgagtgg 2400
ggcaacggta aaacggtgaa cgaaggtatt cccgcgacag tcaccctacc cgcgccgacg 2460
gcaaagacca gctgctgggc acttgacgaa cgcggtgaac ggaaagcgaa agtacccgtg 2520
acggccgacg ccgacggtca tgccgtcatc gcgatcggcc caacctggca aacggtgtgg 2580
tacgaaatca acgttgaggg atga 2604
<210> 40
<211> 867
<212> PRT
<213> 牛腸宏基因組
<400> 40
Met Ile Arg Asn Cys Phe Leu Pro Ala Ala Ala Leu Met Ile Gly Cys
1 5 10 15
Ala Phe Gly Ala Asp Asp Ala Met Phe Pro Phe Val Pro Ser Tyr Asp
20 25 30
Ala Pro Met Asn Val Val Asn Met Ser His Leu Leu Asp Ala Pro Ala
35 40 45
Gly Ser His Gly Arg Ile Arg Val Lys Asp Gly His Phe Val Asn Asp
50 55 60
Gln Gly Arg Val Arg Leu His Ala Thr Asn Leu Thr Gly Pro Ala Asn
65 70 75 80
Phe Pro Ser His Glu Glu Ala Glu Arg Leu Ala Ala Arg Leu Ala Arg
85 90 95
Phe Gly Ile Asn Cys Val Arg Leu His Tyr Phe Asp Ser Ser Tyr Gly
100 105 110
Thr Phe Met Leu Pro Ala Glu Gln Gly Ile Phe Thr Asp Lys Thr Gly
115 120 125
Glu Leu Arg Arg Leu Asp Pro Lys Gln Arg Asp Arg Gln Asp Tyr Leu
130 135 140
Ile Ala Gln Phe Lys Lys Arg Gly Ile Tyr Val Asp Ile Asn Leu His
145 150 155 160
Val Ala Arg Thr Leu Asp Ala Ser Asp Gly Phe Glu Pro Gly Thr Pro
165 170 175
Trp Ala Asn Lys Gly Val Asp Gln Phe Asp Pro Arg Val Ile Ala Ala
180 185 190
Glu Lys Ala Tyr Ala Arg Glu Leu Leu Ser His Val Asn Pro Tyr Thr
195 200 205
Gly Leu Ser Tyr Leu Lys Asp Pro Val Val Ala Ile Val Glu Leu Asn
210 215 220
Asn Glu Asp Ala Leu Trp Asn Gln Tyr Leu Arg Gly Gly Ile Asp Gln
225 230 235 240
Leu Gly Lys Pro Tyr Ala Lys Glu Phe Gln Arg Gln Trp Asn Asp Trp
245 250 255
Leu Arg Lys Lys Tyr Gly Asn Asp Glu Arg Met Arg Ala Ala Trp Arg
260 265 270
Val Lys Thr Gln Pro Leu Gly Asp Glu Met Ile Gln Glu Gly Ser Phe
275 280 285
Glu Glu Asn Val Val Pro Asp Gly Ser Arg Trp Ile Leu Asp Leu Glu
290 295 300
Arg Thr Lys Ala Ser Ala Ala Ser Gln Asn Gly Ser Leu Arg Ile Thr
305 310 315 320
Val Glu Lys Lys Ser Ser Asp Arg Phe Phe Pro Lys Leu Tyr Arg Arg
325 330 335
Val Ser Val Lys Lys Asn Val Pro Tyr Thr Val Ser Phe Arg Ile Arg
340 345 350
Gln Ala Glu Gly Glu Pro Gly Glu Val Gly Phe Ala Val Ala Asp Arg
355 360 365
Gly Lys Gly Trp Glu Ser Leu Gly Ile His Thr Val Leu Lys Pro Thr
370 375 380
Lys Asn Trp Thr Lys Arg Lys Phe Thr Phe Tyr Ala Ala Lys Asp Cys
385 390 395 400
Gln Gln Ala Glu Ile Gln Phe Thr Arg Phe Glu Val Gly Ala Tyr Glu
405 410 415
Ile Asp Asp Leu Ser Phe Arg Thr Gly Asn Glu Pro Glu Asn Leu Ser
420 425 430
Thr Leu Ser Ala Glu Lys Gly Glu Val Ala Ile Val Lys Thr Lys Asp
435 440 445
Ser Val Val Pro Glu Met Lys Arg Asp Phe Tyr Arg Phe Val Met Asp
450 455 460
Thr Glu His Ala Tyr Trp Thr Gly Met Arg Asp Tyr Leu Gln Lys Glu
465 470 475 480
Leu Gly Leu Glu Ala Pro Val Ser Ala Thr Gln Leu Asp Tyr Ser Pro
485 490 495
Pro His Leu Gln Ala Glu Met Asp Phe Val Asp Asn His Ala Tyr Trp
500 505 510
Cys His Pro Ser Val Arg Lys Asp Trp Ser Ile Arg Asn Lys Ala Met
515 520 525
Val Asn Ala Arg Gly Gly Cys Ile Leu Gly Leu Ala Gly Gln Arg Val
530 535 540
Ala Gly Lys Pro Tyr Thr Val Ser Glu Tyr Asn His Pro Tyr Pro Ile
545 550 555 560
Tyr Tyr Gly Ala Glu Gly Gln Pro Met Leu Arg Ala Tyr Gly Ala Leu
565 570 575
Gln Gly Trp Asp Gly Val Phe Glu Tyr Ser Tyr Asn Asn Arg Gln Asn
580 585 590
Ala Glu Pro Asp His Asn Glu Tyr Phe Phe Ser Met Ala Ala Arg Thr
595 600 605
Asp Val Leu Ala His Phe Pro Ala Cys Ala Ala Met Tyr Leu Arg Gly
610 615 620
Asp Val Lys Glu Ser Ala Thr Arg Ile Val Ala Asn Leu Pro Leu Glu
625 630 635 640
Glu Tyr Phe Glu Arg Leu Val Lys Ala Asn Lys Val Ser Gln Gly Ile
645 650 655
Thr Thr Ala Thr Asp Gly Lys Leu Ser Ala Glu Leu Gly Leu Val His
660 665 670
Ser Val Ala Val Asp Val Thr Gly Gln Thr Pro Arg Thr Thr Asp Asn
675 680 685
Ile Pro Pro Pro Gly Lys Ile Ile Ala Ser Asp Thr Gly Glu Ile Val
690 695 700
Trp Asn Asn Asp Ile Asp Gly Ala Gly Val Trp Thr Val Asp Thr Pro
705 710 715 720
Asn Thr Lys Ile Phe Ser Gly Phe Pro Lys Gly Arg Val Phe Asn Leu
725 730 735
Ser Gly Val Lys Leu Ala Val Gly Glu Thr Lys Leu Gly Trp Ala Thr
740 745 750
Val Ser Leu Thr Ser His Asp Ala Thr Gly Phe Gly Gly Asp Gly Lys
755 760 765
Pro Ala Arg Ile Leu Leu Thr Ala Thr Gly Leu Ser His Asn Gly Gly
770 775 780
Ala Lys Phe Val Ala Lys Gly Lys Glu Ala Ile Phe Ala Ser Glu Trp
785 790 795 800
Gly Asn Gly Lys Thr Val Asn Glu Gly Ile Pro Ala Thr Val Thr Leu
805 810 815
Pro Ala Pro Thr Ala Lys Thr Ser Cys Trp Ala Leu Asp Glu Arg Gly
820 825 830
Glu Arg Lys Ala Lys Val Pro Val Thr Ala Asp Ala Asp Gly His Ala
835 840 845
Val Ile Ala Ile Gly Pro Thr Trp Gln Thr Val Trp Tyr Glu Ile Asn
850 855 860
Val Glu Gly
865
<210> 41
<211> 2622
<212> DNA
<213> 浮霉狀菌屬
<220>
<221> CDS
<222> (1)..(2619)
<220>
<221> 信號肽
<222> (1)..(81)
<220>
<221> 成熟肽
<222> (82)..(2619)
<220>
<221> PF00150
<222> (277)..(687)
<220>
<221> PF02018
<222> (850)..(1239)
<400> 41
atg agg cga aac gtt gcg ttc gat tgc att ctg atc ctg cta ctt ggg 48
Met Arg Arg Asn Val Ala Phe Asp Cys Ile Leu Ile Leu Leu Leu Gly
-25 -20 -15
cta ctg tgc ttc gga gca aca ccc tct cgg gga gaa gaa acg gca act 96
Leu Leu Cys Phe Gly Ala Thr Pro Ser Arg Gly Glu Glu Thr Ala Thr
-10 -5 -1 1 5
cca ggc aag ctc ttt ccg ttt gtc ctg agc tac gaa cca acg gac agc 144
Pro Gly Lys Leu Phe Pro Phe Val Leu Ser Tyr Glu Pro Thr Asp Ser
10 15 20
atc aca aac atc tca gaa tgg ctt gac cgt ccc gct ggg aag cac ggg 192
Ile Thr Asn Ile Ser Glu Trp Leu Asp Arg Pro Ala Gly Lys His Gly
25 30 35
ttt att cgg gcg gaa aat ggg cac ttt gtg aca gat gcc ggg cgg atc 240
Phe Ile Arg Ala Glu Asn Gly His Phe Val Thr Asp Ala Gly Arg Ile
40 45 50
cgg ctg tgg gcc act aac ctc tgt ttt gaa gcc tgc ttc cca acc aag 288
Arg Leu Trp Ala Thr Asn Leu Cys Phe Glu Ala Cys Phe Pro Thr Lys
55 60 65
gaa gag gca gaa cgc ctt gcc agg cgt ctc gcc agc ctg ggg atc aat 336
Glu Glu Ala Glu Arg Leu Ala Arg Arg Leu Ala Ser Leu Gly Ile Asn
70 75 80 85
tgt gtg cga atg cat cac atg gac aat cgg cac atc tgg ggt aaa agc 384
Cys Val Arg Met His His Met Asp Asn Arg His Ile Trp Gly Lys Ser
90 95 100
ccc aat aag ctg acg att gat ccc gaa atg ctg gat aag ctg gat tac 432
Pro Asn Lys Leu Thr Ile Asp Pro Glu Met Leu Asp Lys Leu Asp Tyr
105 110 115
ctg att tat caa ttg aaa ttg cac ggg atc tat acc aac ctc aat ctg 480
Leu Ile Tyr Gln Leu Lys Leu His Gly Ile Tyr Thr Asn Leu Asn Leu
120 125 130
cat gtg tcc cgg gag ttt ggc ccg gcc gaa ggc ttt ccc gcg gtg gag 528
His Val Ser Arg Glu Phe Gly Pro Ala Glu Gly Phe Pro Ala Val Glu
135 140 145
ggc ctc ccc aac tac gat aaa ggg atc gac aac ttt gaa ccc cgg atg 576
Gly Leu Pro Asn Tyr Asp Lys Gly Ile Asp Asn Phe Glu Pro Arg Met
150 155 160 165
atc gag tac cag aaa aaa tat gcc cgc gat ttg ctc acg cac gtc aat 624
Ile Glu Tyr Gln Lys Lys Tyr Ala Arg Asp Leu Leu Thr His Val Asn
170 175 180
ccc tac acc ggc acg gcg tac atc aac gaa ccg gcc att gcg atg gtc 672
Pro Tyr Thr Gly Thr Ala Tyr Ile Asn Glu Pro Ala Ile Ala Met Val
185 190 195
gaa atc aat aac gaa aat gca gcg ttt gac gag tac cgc aag gga gcg 720
Glu Ile Asn Asn Glu Asn Ala Ala Phe Asp Glu Tyr Arg Lys Gly Ala
200 205 210
ttt gat cat ttg ccc gag ccg tac gcc agc caa ctc cgc aag ctg tgg 768
Phe Asp His Leu Pro Glu Pro Tyr Ala Ser Gln Leu Arg Lys Leu Trp
215 220 225
aat gcc tgg ctg aaa aag aaa tac ggc agt gac gac gcg ctt cgc aaa 816
Asn Ala Trp Leu Lys Lys Lys Tyr Gly Ser Asp Asp Ala Leu Arg Lys
230 235 240 245
gcg tgg aat gcc cag cgt caa ccc ctg ggc gag gaa atc ctg aaa aat 864
Ala Trp Asn Ala Gln Arg Gln Pro Leu Gly Glu Glu Ile Leu Lys Asn
250 255 260
cgt gac ttt tcc ggc cag tgg gaa aag gtg tgg aac ctc cag cgt gac 912
Arg Asp Phe Ser Gly Gln Trp Glu Lys Val Trp Asn Leu Gln Arg Asp
265 270 275
aat ctc tcg gag gtc gtc gcc gag gtc att ccg aat ggc ttt cag ggc 960
Asn Leu Ser Glu Val Val Ala Glu Val Ile Pro Asn Gly Phe Gln Gly
280 285 290
aaa ccc gcc ttg cgt ttg cgc gtc atc cgc aac gga caa gaa acc tgg 1008
Lys Pro Ala Leu Arg Leu Arg Val Ile Arg Asn Gly Gln Glu Thr Trp
295 300 305
atc ccc cag tta agc cag ggc ggt ttt tca gtt cag aaa ggt cag gtg 1056
Ile Pro Gln Leu Ser Gln Gly Gly Phe Ser Val Gln Lys Gly Gln Val
310 315 320 325
tac act ctc cga ttc tgg ctg aaa gcg gac aaa ccg ggc cgg atc gac 1104
Tyr Thr Leu Arg Phe Trp Leu Lys Ala Asp Lys Pro Gly Arg Ile Asp
330 335 340
gtg aac tgc atg atg aac cac gat ccc tgg cag cgt ctc ggc ctt tcc 1152
Val Asn Cys Met Met Asn His Asp Pro Trp Gln Arg Leu Gly Leu Ser
345 350 355
gcg gat gtt caa acc tcg gcc gag tgg aag gaa tat cgc ctc agc ttt 1200
Ala Asp Val Gln Thr Ser Ala Glu Trp Lys Glu Tyr Arg Leu Ser Phe
360 365 370
gtg gcg gat cgc gat gat cca aat gcc agg atc acg ttc agc caa ctc 1248
Val Ala Asp Arg Asp Asp Pro Asn Ala Arg Ile Thr Phe Ser Gln Leu
375 380 385
cgt ccc ggg acg tac gaa ctg gca gac gtg tca ctc cgg ccg ggt ggg 1296
Arg Pro Gly Thr Tyr Glu Leu Ala Asp Val Ser Leu Arg Pro Gly Gly
390 395 400 405
gtc atc ggc ctg gaa gag ggc caa tcc ctc gcc gat cag acg gtt ccc 1344
Val Ile Gly Leu Glu Glu Gly Gln Ser Leu Ala Asp Gln Thr Val Pro
410 415 420
att gtt cct gct cgc gga ccg caa atg acg gcc gcc gcc cgg gcc gac 1392
Ile Val Pro Ala Arg Gly Pro Gln Met Thr Ala Ala Ala Arg Ala Asp
425 430 435
ttc gca gat ttt ttg tgg gag ctc gaa cgc gac tac tgg tgg gga atg 1440
Phe Ala Asp Phe Leu Trp Glu Leu Glu Arg Asp Tyr Trp Trp Gly Met
440 445 450
tac cga ttt ctg aag gag gaa ctc aag ctg aag ccg ctg gtc gcg gga 1488
Tyr Arg Phe Leu Lys Glu Glu Leu Lys Leu Lys Pro Leu Val Ala Gly
455 460 465
acg caa ctc tcc tac agt cca gtt cac att caa gct ggg ctg gac tac 1536
Thr Gln Leu Ser Tyr Ser Pro Val His Ile Gln Ala Gly Leu Asp Tyr
470 475 480 485
atc gac tcg cat gcc tac tgg cag cat ccc gtt ttc ccc ggc agg cca 1584
Ile Asp Ser His Ala Tyr Trp Gln His Pro Val Phe Pro Gly Arg Pro
490 495 500
tgg gat ccg gaa aac tgg tat gtg cgt agt ctg gcc ctc gtg aat cag 1632
Trp Asp Pro Glu Asn Trp Tyr Val Arg Ser Leu Ala Leu Val Asn Gln
505 510 515
ccg gga ggc aca ctt tcc gga ctc gcc agt cgg cgt gtc gaa ggt ttg 1680
Pro Gly Gly Thr Leu Ser Gly Leu Ala Ser Arg Arg Val Glu Gly Leu
520 525 530
ccg ttc acc gtg agc gaa tac aac cac ccg gct ccc aac gaa tac gcc 1728
Pro Phe Thr Val Ser Glu Tyr Asn His Pro Ala Pro Asn Glu Tyr Ala
535 540 545
gcc gaa gga ttt ccg atg atc gcg gct ttt ggg gct ttt cag gat tgg 1776
Ala Glu Gly Phe Pro Met Ile Ala Ala Phe Gly Ala Phe Gln Asp Trp
550 555 560 565
gat gga atc ttc agc ttc act tac agc cac agt cga gat tac gag ccg 1824
Asp Gly Ile Phe Ser Phe Thr Tyr Ser His Ser Arg Asp Tyr Glu Pro
570 575 580
cga aaa atc acg ggt ttc ttc gac atc aaa agc gag gtg acc aaa ctc 1872
Arg Lys Ile Thr Gly Phe Phe Asp Ile Lys Ser Glu Val Thr Lys Leu
585 590 595
gtt cac atg ccc gcc tgc gtc gcc atg ttc tac cgg ggt gat gtg caa 1920
Val His Met Pro Ala Cys Val Ala Met Phe Tyr Arg Gly Asp Val Gln
600 605 610
ccc gcc acc cag gct gtg gtc gtg ggc atg acc cgt gaa aag gaa caa 1968
Pro Ala Thr Gln Ala Val Val Val Gly Met Thr Arg Glu Lys Glu Gln
615 620 625
tcc atc ctc cga gaa aca ctc aat ccc tgg gcg ctg acc gcc gac cgt 2016
Ser Ile Leu Arg Glu Thr Leu Asn Pro Trp Ala Leu Thr Ala Asp Arg
630 635 640 645
ttg ggt att ccc gcc aac ctg agc ttg ctc cat cgg gtg gcc atg gca 2064
Leu Gly Ile Pro Ala Asn Leu Ser Leu Leu His Arg Val Ala Met Ala
650 655 660
ctg aaa gaa ccc agc gat agt gtg cca cca ccc acg ctg tcc gcg gag 2112
Leu Lys Glu Pro Ser Asp Ser Val Pro Pro Pro Thr Leu Ser Ala Glu
665 670 675
cag aag gtt ttc ctg tcc gat acg caa caa atc tgc tgg gat gtc tct 2160
Gln Lys Val Phe Leu Ser Asp Thr Gln Gln Ile Cys Trp Asp Val Ser
680 685 690
cag ccc ggc gcc ggg gtg ttc ctg gtc aac tcg ccg aaa acg aaa ctc 2208
Gln Pro Gly Ala Gly Val Phe Leu Val Asn Ser Pro Lys Thr Lys Leu
695 700 705
gtg acc ggt ttc ccc gcc gga aga act ttc aat ctg aat gga atc cag 2256
Val Thr Gly Phe Pro Ala Gly Arg Thr Phe Asn Leu Asn Gly Ile Gln
710 715 720 725
att cag att gga gaa acg gag ctg ggt tgg gcg acc gtt tcg ctc acc 2304
Ile Gln Ile Gly Glu Thr Glu Leu Gly Trp Ala Thr Val Ser Leu Thr
730 735 740
gtt atc aaa ggg gac gga ttt gat cgg cct ggc cga atc ctc ctc gct 2352
Val Ile Lys Gly Asp Gly Phe Asp Arg Pro Gly Arg Ile Leu Leu Ala
745 750 755
gct acg gga aag gcc caa aat aca ggc tgg gac ttc cgt aaa gag ggc 2400
Ala Thr Gly Lys Ala Gln Asn Thr Gly Trp Asp Phe Arg Lys Glu Gly
760 765 770
gat cgg gtg acc gtg gga cgc cgc tgg ggc gac gag ccg atc ctc tgc 2448
Asp Arg Val Thr Val Gly Arg Arg Trp Gly Asp Glu Pro Ile Leu Cys
775 780 785
gaa gga gtg ccg gct cgc atc gtg ctg ccg gtt tcg tcc agc cgc gtg 2496
Glu Gly Val Pro Ala Arg Ile Val Leu Pro Val Ser Ser Ser Arg Val
790 795 800 805
aaa gtc tat gcc ctc gac gag gcg gga cgc cgc agg gac gcg gtg acg 2544
Lys Val Tyr Ala Leu Asp Glu Ala Gly Arg Arg Arg Asp Ala Val Thr
810 815 820
gtt tct ggt ggc gat cag gcc gtt gtc gaa ata ggg ccc caa ttc agg 2592
Val Ser Gly Gly Asp Gln Ala Val Val Glu Ile Gly Pro Gln Phe Arg
825 830 835
acg ctg tgg tac gaa atc gaa atc caa tga 2622
Thr Leu Trp Tyr Glu Ile Glu Ile Gln
840 845
<210> 42
<211> 873
<212> PRT
<213> 浮霉狀菌屬
<400> 42
Met Arg Arg Asn Val Ala Phe Asp Cys Ile Leu Ile Leu Leu Leu Gly
-25 -20 -15
Leu Leu Cys Phe Gly Ala Thr Pro Ser Arg Gly Glu Glu Thr Ala Thr
-10 -5 -1 1 5
Pro Gly Lys Leu Phe Pro Phe Val Leu Ser Tyr Glu Pro Thr Asp Ser
10 15 20
Ile Thr Asn Ile Ser Glu Trp Leu Asp Arg Pro Ala Gly Lys His Gly
25 30 35
Phe Ile Arg Ala Glu Asn Gly His Phe Val Thr Asp Ala Gly Arg Ile
40 45 50
Arg Leu Trp Ala Thr Asn Leu Cys Phe Glu Ala Cys Phe Pro Thr Lys
55 60 65
Glu Glu Ala Glu Arg Leu Ala Arg Arg Leu Ala Ser Leu Gly Ile Asn
70 75 80 85
Cys Val Arg Met His His Met Asp Asn Arg His Ile Trp Gly Lys Ser
90 95 100
Pro Asn Lys Leu Thr Ile Asp Pro Glu Met Leu Asp Lys Leu Asp Tyr
105 110 115
Leu Ile Tyr Gln Leu Lys Leu His Gly Ile Tyr Thr Asn Leu Asn Leu
120 125 130
His Val Ser Arg Glu Phe Gly Pro Ala Glu Gly Phe Pro Ala Val Glu
135 140 145
Gly Leu Pro Asn Tyr Asp Lys Gly Ile Asp Asn Phe Glu Pro Arg Met
150 155 160 165
Ile Glu Tyr Gln Lys Lys Tyr Ala Arg Asp Leu Leu Thr His Val Asn
170 175 180
Pro Tyr Thr Gly Thr Ala Tyr Ile Asn Glu Pro Ala Ile Ala Met Val
185 190 195
Glu Ile Asn Asn Glu Asn Ala Ala Phe Asp Glu Tyr Arg Lys Gly Ala
200 205 210
Phe Asp His Leu Pro Glu Pro Tyr Ala Ser Gln Leu Arg Lys Leu Trp
215 220 225
Asn Ala Trp Leu Lys Lys Lys Tyr Gly Ser Asp Asp Ala Leu Arg Lys
230 235 240 245
Ala Trp Asn Ala Gln Arg Gln Pro Leu Gly Glu Glu Ile Leu Lys Asn
250 255 260
Arg Asp Phe Ser Gly Gln Trp Glu Lys Val Trp Asn Leu Gln Arg Asp
265 270 275
Asn Leu Ser Glu Val Val Ala Glu Val Ile Pro Asn Gly Phe Gln Gly
280 285 290
Lys Pro Ala Leu Arg Leu Arg Val Ile Arg Asn Gly Gln Glu Thr Trp
295 300 305
Ile Pro Gln Leu Ser Gln Gly Gly Phe Ser Val Gln Lys Gly Gln Val
310 315 320 325
Tyr Thr Leu Arg Phe Trp Leu Lys Ala Asp Lys Pro Gly Arg Ile Asp
330 335 340
Val Asn Cys Met Met Asn His Asp Pro Trp Gln Arg Leu Gly Leu Ser
345 350 355
Ala Asp Val Gln Thr Ser Ala Glu Trp Lys Glu Tyr Arg Leu Ser Phe
360 365 370
Val Ala Asp Arg Asp Asp Pro Asn Ala Arg Ile Thr Phe Ser Gln Leu
375 380 385
Arg Pro Gly Thr Tyr Glu Leu Ala Asp Val Ser Leu Arg Pro Gly Gly
390 395 400 405
Val Ile Gly Leu Glu Glu Gly Gln Ser Leu Ala Asp Gln Thr Val Pro
410 415 420
Ile Val Pro Ala Arg Gly Pro Gln Met Thr Ala Ala Ala Arg Ala Asp
425 430 435
Phe Ala Asp Phe Leu Trp Glu Leu Glu Arg Asp Tyr Trp Trp Gly Met
440 445 450
Tyr Arg Phe Leu Lys Glu Glu Leu Lys Leu Lys Pro Leu Val Ala Gly
455 460 465
Thr Gln Leu Ser Tyr Ser Pro Val His Ile Gln Ala Gly Leu Asp Tyr
470 475 480 485
Ile Asp Ser His Ala Tyr Trp Gln His Pro Val Phe Pro Gly Arg Pro
490 495 500
Trp Asp Pro Glu Asn Trp Tyr Val Arg Ser Leu Ala Leu Val Asn Gln
505 510 515
Pro Gly Gly Thr Leu Ser Gly Leu Ala Ser Arg Arg Val Glu Gly Leu
520 525 530
Pro Phe Thr Val Ser Glu Tyr Asn His Pro Ala Pro Asn Glu Tyr Ala
535 540 545
Ala Glu Gly Phe Pro Met Ile Ala Ala Phe Gly Ala Phe Gln Asp Trp
550 555 560 565
Asp Gly Ile Phe Ser Phe Thr Tyr Ser His Ser Arg Asp Tyr Glu Pro
570 575 580
Arg Lys Ile Thr Gly Phe Phe Asp Ile Lys Ser Glu Val Thr Lys Leu
585 590 595
Val His Met Pro Ala Cys Val Ala Met Phe Tyr Arg Gly Asp Val Gln
600 605 610
Pro Ala Thr Gln Ala Val Val Val Gly Met Thr Arg Glu Lys Glu Gln
615 620 625
Ser Ile Leu Arg Glu Thr Leu Asn Pro Trp Ala Leu Thr Ala Asp Arg
630 635 640 645
Leu Gly Ile Pro Ala Asn Leu Ser Leu Leu His Arg Val Ala Met Ala
650 655 660
Leu Lys Glu Pro Ser Asp Ser Val Pro Pro Pro Thr Leu Ser Ala Glu
665 670 675
Gln Lys Val Phe Leu Ser Asp Thr Gln Gln Ile Cys Trp Asp Val Ser
680 685 690
Gln Pro Gly Ala Gly Val Phe Leu Val Asn Ser Pro Lys Thr Lys Leu
695 700 705
Val Thr Gly Phe Pro Ala Gly Arg Thr Phe Asn Leu Asn Gly Ile Gln
710 715 720 725
Ile Gln Ile Gly Glu Thr Glu Leu Gly Trp Ala Thr Val Ser Leu Thr
730 735 740
Val Ile Lys Gly Asp Gly Phe Asp Arg Pro Gly Arg Ile Leu Leu Ala
745 750 755
Ala Thr Gly Lys Ala Gln Asn Thr Gly Trp Asp Phe Arg Lys Glu Gly
760 765 770
Asp Arg Val Thr Val Gly Arg Arg Trp Gly Asp Glu Pro Ile Leu Cys
775 780 785
Glu Gly Val Pro Ala Arg Ile Val Leu Pro Val Ser Ser Ser Arg Val
790 795 800 805
Lys Val Tyr Ala Leu Asp Glu Ala Gly Arg Arg Arg Asp Ala Val Thr
810 815 820
Val Ser Gly Gly Asp Gln Ala Val Val Glu Ile Gly Pro Gln Phe Arg
825 830 835
Thr Leu Trp Tyr Glu Ile Glu Ile Gln
840 845