專利名稱:來自棉桃阿舒氏囊霉的與轉(zhuǎn)錄、rna加工和/或翻譯機制相關(guān)的新基因產(chǎn)物的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及來自棉桃阿舒氏囊霉(Ashbya gossypii)的新穎多核苷酸;與之雜交的寡核苷酸;包含這些多核苷酸的表達(dá)盒和載體;由該多核苷酸轉(zhuǎn)化的微生物;由這些多核苷酸編碼的多肽;及將該新穎多肽和多核苷酸用作調(diào)節(jié)阿舒氏囊霉屬微生物的轉(zhuǎn)錄、RNA加工和/或翻譯操作,且尤其是提高維生素B2的產(chǎn)量的靶點。
背景技術(shù):
維生素B2(核黃素,乳黃素)是一種堿敏感和光敏感的維生素,其在溶液中顯示黃綠色熒光。維生素B2的缺乏可以導(dǎo)致外胚層的損害,尤其是白內(nèi)障、角膜炎、角膜血管化,或?qū)е伦灾髅谀蛏诚到y(tǒng)紊亂。維生素B2是FAD和FMN分子的前體,這兩種分子與NAD+和NADP+在生物學(xué)上對氫傳遞具有重要意義。維生素B2通過磷酸化(FMN)和隨后的腺苷酸化(FAD)形成這兩種分子。
維生素B2在植物,酵母菌以及多種微生物中由GTP和核酮酸-5-磷酸合成。該反應(yīng)途徑首先打開GTP的嘧唑環(huán)并消除一個磷酸殘基。保留的磷酸鹽經(jīng)脫氨,還原,和消除形成5-氨基-6-核醇基(ribityl)氨基-2,4-嘧啶酮。該化合物與3,4-二羥基-2-丁酮-4-磷酸反應(yīng)產(chǎn)生雙環(huán)分子6,7-二甲基-8-核醇基二氧四氫蝶啶。通過歧化反應(yīng)該化合物轉(zhuǎn)化成三環(huán)化合物核黃素,該反應(yīng)轉(zhuǎn)移了一個4-碳單位。
維生素B2存在于許多蔬菜和肉類中,在谷類產(chǎn)品中的含量較低。成人每日的維生素B2需要量為約1.4到2毫克。核黃素又是輔酶FMN和FAD在人體中的主要分解產(chǎn)物并就此被排出。
維生素B2是人類和動物的重要營養(yǎng)物質(zhì)。因此研究人員努力使維生素B2可工業(yè)規(guī)模產(chǎn)生,并建議由微生物的途徑合成維生素B2??捎糜谠撃康牡奈⑸锸牵?,枯草桿菌(Bacillus subtilis),子囊菌阿舒假囊酵母菌(Eremothecium ashbyii),棉桃阿舒氏囊霉及酵母Candida flareri和釀酒酵母(Saccharomyces cerevisiae)。為此使用的營養(yǎng)培養(yǎng)基包含作為碳源的糖蜜或植物油、無機鹽、氨基酸、動物或植物胨和蛋白質(zhì)及維生素添加劑。在無菌有氧浸沒培養(yǎng)方法中,產(chǎn)率為每升培養(yǎng)液在幾天內(nèi)生成10克以上維生素B2。所需條件為培養(yǎng)液良好的通風(fēng),小心攪動及設(shè)定低于約30℃的溫度。去掉生物質(zhì)、蒸發(fā)并干燥濃縮液得到富含維生素B2的產(chǎn)物。
例如,WO-A-92/01060,EP-A-0 405 370和EP-A-0 531 708中描述了維生素B2的微生物生產(chǎn)。
在Ullmann氏工業(yè)化學(xué)百科全書A27卷,521頁及以下頁中,可以找到關(guān)于維生素B2的重要性,出現(xiàn),生產(chǎn),生物合成和使用的調(diào)查。
轉(zhuǎn)錄真菌的基因表達(dá)主要在轉(zhuǎn)錄水平控制。轉(zhuǎn)錄裝置由多種蛋白組成,這些蛋白可被分為兩組RNA聚合酶(操作性DNA轉(zhuǎn)錄酶)和轉(zhuǎn)錄因子(其通過將RNA聚合酶引導(dǎo)至識別這些因子的特定啟動子DNA序列上而控制基因轉(zhuǎn)錄)。真菌例如棉桃阿舒氏囊霉含有對不同啟動子、生長期、環(huán)境條件、基質(zhì)、氧氣水平等具特異性的多種不同轉(zhuǎn)錄因子,從而使生物體適應(yīng)不同的環(huán)境和代謝條件。
啟動子作為RNA聚合酶復(fù)合物和轉(zhuǎn)錄因子的??课稽c,是特定的DNA序列。許多啟動子元件具有可由同源性搜索鑒定的保守序列元件;另一種可能是用標(biāo)準(zhǔn)技術(shù)例如引物延伸法鑒定特定基因的啟動子區(qū)。已知真核細(xì)胞的許多啟動子區(qū)(Guarente,L(1987),Ann.Rev.Biochem.,21;425-452)。
啟動子轉(zhuǎn)錄控制受多種抑制或激活機制影響。特定的調(diào)控蛋白(轉(zhuǎn)錄因子)與啟動子結(jié)合,具有阻斷(抑制物)或協(xié)助(激活物)RNA全酶結(jié)合的能力,并由此控制轉(zhuǎn)錄。此外,某些酶可以修飾與DNA結(jié)合的組蛋白,并由此使轉(zhuǎn)錄因子與啟動子接近被阻止或被首次實現(xiàn)(Loo,S.;Rine,J.(1995);Annu.Rev.Cell.Dev.Biol.,11,519-548)。轉(zhuǎn)錄因子的結(jié)合同樣受到其與其他分子例如蛋白質(zhì)或其他代謝化合物的相互作用的控制(Evans,R.(1989),Science,240,889-895)。通過控制基因轉(zhuǎn)錄而由此響應(yīng)多種環(huán)境或代謝信號的能力使得細(xì)胞能夠精確控制何時表達(dá)基因和當(dāng)時多少基因產(chǎn)物可出現(xiàn)于細(xì)胞中。從而阻止不必要的能量支出或不必要的潛在稀有中間化合物或輔因子的使用。
RNA加工RNA以不均一片段的形式合成,真核生物的編碼序列(外顯子)經(jīng)常被非編碼序列(內(nèi)含子)打斷。在轉(zhuǎn)錄后的RNA加工中,內(nèi)含子被切除(拼接)使得(mRNA)編碼序列可在核糖體上被解讀(Sharp,P.(1987),Science;235,766-771)。由于RNA自細(xì)胞的輸出也由拼接控制,故可通過這種方法控制核糖體上可利用的mRNA的量。
翻譯翻譯是根據(jù)RNA分子包含的信息自氨基酸合成多肽的過程。該過程的主要組分是核糖體和特定的起始或延長因子例如eEF1和eEF2(Moldave(1985);Ann.Rev.Biochem.,54,1109-1149)。核糖體由RNA(rRNA)和特定的蛋白組成。其由一個大亞基和一個小亞基組成,每個亞基均可由其在分析性超離心中的沉降行為表征。根據(jù)細(xì)胞的生理狀態(tài),核糖體的合成由RNA和蛋白質(zhì)組分的協(xié)調(diào)生產(chǎn)控制。
mRNA分子的每個密碼子編碼一種特定的氨基酸。mRNA到氨基酸的轉(zhuǎn)化由轉(zhuǎn)運RNA(tRNA)分子進(jìn)行。這些分子由具有突出區(qū)域或“臂”的L形三維結(jié)構(gòu)的RNA單鏈(60至100個堿基之間)組成。這些臂之一與mRNA分子上的特定密碼子序列形成堿基對。另一臂與特定的氨基酸(由密碼子編碼)特異地相互作用。其他tRNA臂包括可變臂,TΨC臂(具有胸苷酸和假尿苷酸修飾)和D臂(具有二氫尿苷修飾)。后面這些結(jié)構(gòu)的功能仍是未知的,但其在tRNA分子之間的保守性提示其在蛋白合成中起作用。
為使以核酸為基礎(chǔ)的tRNA分子與正確的氨基酸配對,需要稱為氨酰-tRNA合成酶的酶家族的作用。有很多不同的該類型酶,每種均對特定的-tRNA和特定的氨基酸特異。這些酶以兩步反應(yīng)使tRNA末端腺苷核糖單位的3′-羥基與氨基酸結(jié)合。第一步,該酶通過與ATP和氨基酸的反應(yīng)被活化,產(chǎn)生氨酰-tRNA合成酶/氨?;佘账釓?fù)合物。第二步,氨?;鶊F由該酶轉(zhuǎn)移至目的tRNA,并于其上保持高能狀態(tài)。tRNA分子和mRNA分子上其識別的密碼子的結(jié)合使綁定在tRNA上的高能氨基酸與核糖體接觸。在核糖體內(nèi),載有氨基酸的tRNA(氨酰-tRNA)占據(jù)結(jié)合位點(A位點),該位點與攜帶其上的氨基酸與生長多肽鏈結(jié)合的tRNA分子(肽酰-tRNA)的第二位點(P位點)相鄰。氨酰-tRNA上的活化的氨基酸的活性足以使該氨基酸自發(fā)地與生長肽鏈上的最近氨基酸之間形成肽鍵。GTP水解為現(xiàn)負(fù)載多肽鏈的tRNA從核糖體的A位點轉(zhuǎn)移至P位點提供能量,并且該過程一直重復(fù)直到到達(dá)終止密碼子。
可在多個不同步驟控制翻譯。包括核糖體與mRNA的結(jié)合,mRNA的二級結(jié)構(gòu),密碼子使用或特定tRNA的頻率。
目前仍無將轉(zhuǎn)錄,RNA加工和/或翻譯機制相關(guān)基因用于產(chǎn)生具有提高的對外界條件例如環(huán)境和代謝條件的適應(yīng)能力的微生物,優(yōu)選地為阿舒氏囊霉屬,尤其是棉桃阿舒氏囊霉株的描述。
發(fā)明概述本發(fā)明的目的是提供可用于影響阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉的轉(zhuǎn)錄和/或翻譯機制和/或RNA加工機制的新穎靶點。具體目的為特異地調(diào)節(jié)這種微生物的轉(zhuǎn)錄、RNA加工和/或翻譯。進(jìn)一步的目的是通過這種微生物提高維生素B2的產(chǎn)量。
我們發(fā)現(xiàn)可以通過提供在棉桃阿舒氏囊霉的維生素B2生產(chǎn)過程中被向上或下調(diào)節(jié)的編碼核酸序列來實現(xiàn)該目的(基于實驗部分詳細(xì)描述的MPSS分析法發(fā)現(xiàn)的結(jié)果),具體如下a)優(yōu)選被上調(diào)的核酸序列,其編碼具有26S蛋白酶體亞基或TAT結(jié)合同系物7的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 28”。
在再一優(yōu)選的實施方案中,根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 28v”。
本發(fā)明一方面涉及包含SEQ ID NO1所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO4所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 28”和“Oligo 28v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Yta7”有顯著的同源性。這些插入序列具有SEQ ID NO1或SEQ IDNO4所示的核酸序列。來自于其的氨基酸序列與釀酒酵母26S蛋白酶體亞基或TAT結(jié)合同系物7(TBP-7)具有顯著的序列同源性。
b)優(yōu)選被上調(diào)的核酸序列,其編碼具有翻譯起始因子亞基的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 45”。
在另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 45v”。
本發(fā)明一方面涉及包含SEQ ID NO6所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO10所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 45”和“Oligo 45v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“p39”或“Tif34”有顯著的同源性,這些插入序列具有SEQ ID NO6或SEQ ID NO10所示的核酸序列。來自于其的氨基酸序列與釀酒酵母翻譯起始因子EIF3(IF32)的亞基(P39)具有顯著的序列同源性。
c)優(yōu)選被下調(diào)的核酸序列,其編碼具有核糖體蛋白的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 85”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 85v”。
本發(fā)明一方面涉及包含SEQ ID NO12所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO14所示的核酸序列或其片段的多核苷酸。該多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 85”和“Oligo 85v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Rpl35a”有顯著的同源性,這些插入序列具有SEQ ID NO12或SEQID NO14所示的核酸序列。來自該編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母核糖體蛋白具有顯著的序列同源性。
d)優(yōu)選被上調(diào)的核酸序列,其編碼具有核仁蛋白的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 133”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 133v”。
本發(fā)明一方面涉及包含SEQ ID NO17所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO19所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 133”和“Oligo 133v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Nop13”有顯著的同源性,這些插入序列具有SEQ ID NO17或SEQ ID NO19所示的核酸序列。來自SEQ ID NO17的相應(yīng)互補鏈或SEQ ID NO19所示序列的氨基酸序列或氨基酸部分序列與釀酒酵母核仁蛋白具有顯著的序列同源性。
e)優(yōu)選被上調(diào)的核酸序列,其編碼具有翻譯起始蛋白的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 172”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 172v”。
本發(fā)明一方面涉及包含SEQ ID NO21所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO24所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 172和“Oligo 172v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Sua5”有顯著的同源性,這些插入序列具有SEQ ID NO21或SEQ IDNO24所示的核酸序列。來自編碼鏈的氨基酸序列或氨基酸部分序列與來自釀酒酵母的翻譯起始蛋白具有顯著的序列同源性。
f)優(yōu)選被下調(diào)的核酸序列,其編碼具有核糖體蛋白S31的前體的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 63”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 63v”。
本發(fā)明一方面涉及包含SEQ ID NO26所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO29所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 63和“Oligo 63v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Rps25a”有顯著的同源性,這些插入序列包含SEQ ID NO26或SEQ IDNO29所示的核酸序列。來自SEQ ID NO26的相應(yīng)互補鏈或SEQ ID NO29所示的編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母核糖體蛋白S31的前體具有顯著的序列同源性。
g)優(yōu)選被下調(diào)的核酸序列,其編碼具有細(xì)胞核孔蛋白的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 132”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 132v”。
本發(fā)明一方面涉及包含SEQ ID NO31所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO36所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 132”和“Oligo 132v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Nic96”有顯著的同源性,這些插入序列具有SEQ ID NO31或SEQID NO36所示的核酸序列。來自這些插入序列(相應(yīng)于SEQ ID NO31的核苷酸第108至764位)的氨基酸序列與釀酒酵母細(xì)胞核孔蛋白具有顯著的序列同源性。
h)優(yōu)選被上調(diào)的核酸序列,其編碼具有ADH-組蛋白乙酰轉(zhuǎn)移酶復(fù)合物的成分的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 174”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 174v”。
本發(fā)明一方面涉及包含SEQ ID NO38所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO40所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 174”和“Oligo 174v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Ahc1”有顯著的同源性,這些插入序列具有SEQ ID NO38或SEQID NO40所示的核酸序列。來自SEQ ID NO38相應(yīng)互補鏈或SEQ IDNO40所示的編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母ADH-組蛋白乙酰轉(zhuǎn)移酶復(fù)合物的成分具有顯著的序列同源性。
i)優(yōu)選被下調(diào)的核酸序列,其編碼具有參與RNA加工的RNA解旋酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 51”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 51v”。
本發(fā)明一方面涉及包含SEQ ID NO42所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO46所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 51”和“Oligo 51v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Rok1”有顯著的同源性,這些插入序列具有SEQ ID NO42或SEQ IDNO46所示的核酸序列。來自SEQ ID NO42相應(yīng)互補鏈或SEQ ID NO46所示的編碼鏈的氨基酸序列與釀酒酵母參與RNA加工的RNA解旋酶具有顯著的序列同源性。
k)優(yōu)選被上調(diào)的核酸序列,其編碼具有RNA pol I的非必需組分的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 30”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 30v”。
本發(fā)明一方面涉及包含SEQ ID NO48所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO51所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 30”和“Oligo 30v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Rpa34”有顯著的同源性,這些插入序列具有SEQ ID NO48或SEQ IDNO51所示的核酸序列。在每一情況下來自編碼鏈的氨基酸序列與釀酒酵母RNA pol I的非必需組分均具有顯著的序列同源性。
l)優(yōu)選被下調(diào)的核酸序列,其編碼具有RNA解旋酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 124”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 124v”。
本發(fā)明一方面涉及包含SEQ ID NO53所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO56所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 124”和“Oligo 124v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Sub2”有顯著的同源性,這些插入序列具有SEQ ID NO53或SEQID NO56所示的核酸序列。來自編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母RNA解旋酶具有顯著的序列同源性。
m)優(yōu)選被下調(diào)的核酸序列,其編碼具有mRNA脫帽酶的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 139”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 139v”。
本發(fā)明一方面涉及包含SEQ ID NO58所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO60所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 139”和“Oligo 139v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“DCP1”有顯著的同源性,這些插入序列具有SEQ ID NO58或SEQID NO60所示的核酸序列。來自該編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母mRNA脫帽酶具有顯著的序列同源性。
n)優(yōu)選被下調(diào)的核酸序列,其編碼具有翻譯起始因子eIF3的亞基的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 144”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 144v”。
本發(fā)明一方面涉及包含SEQ ID NO63所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO65所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 144”和“Oligo 144v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“PRT1”有顯著的同源性,這些插入序列具有SEQ ID NO63或SEQID NO65所示的核酸序列。來自該編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母翻譯起始因子eIF3的亞基具有顯著的序列同源性。
o)優(yōu)選被上調(diào)的核酸序列,其編碼的蛋白具有參與前核糖體RNA加工的U3核仁小核糖核蛋白相關(guān)蛋白的功能。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 168”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 168v”。
本發(fā)明一方面涉及包含SEQ ID NO67所示的核酸序列的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO70所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 168”和“Oligo 168v”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Rrp9”有顯著的同源性,這些插入序列具有SEQ ID NO67或SEQID NO70所示的核酸序列。來自該編碼鏈的氨基酸序列或氨基酸部分序列與釀酒酵母參與前核糖體RNA加工的U3核仁小核糖核蛋白相關(guān)蛋白具有顯著的序列同源性。
p)優(yōu)選被下調(diào)的核酸序列,其編碼具有核糖體60S大亞基蛋白L7a.e.B的功能的蛋白。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 160”。
本發(fā)明一方面涉及包含SEQ ID NO72所示的核酸序列的多核苷酸,該多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與該多核苷酸互補的多核苷酸,以及該多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
“Oligo 160”的插入序列與來自釀酒酵母的MIPS標(biāo)簽“Rpl8b”有顯著的同源性,這些插入序列具有SEQ ID NO72所示的核酸序列。來自相應(yīng)互補鏈的氨基酸序列與釀酒酵母核糖體蛋白(L7a.e.B;60S大亞基)具有顯著的序列同源性。
q)我們發(fā)現(xiàn)通過提供在維生素B2的生產(chǎn)中在棉桃阿舒氏囊霉中被向上調(diào)節(jié)的編碼核酸序列,可實現(xiàn)本發(fā)明目的(基于實驗部分詳細(xì)描述的MPSS分析法發(fā)現(xiàn)的結(jié)果)。
本發(fā)明此方面的一個優(yōu)選實施方案中,分離了編碼本發(fā)明核酸序列的特征性部分序列的DNA克隆,其內(nèi)部名稱為“Oligo 18”。
本發(fā)明另一優(yōu)選的實施方案中根據(jù)本發(fā)明分離了編碼本發(fā)明的核酸的完全序列的DNA克隆,其內(nèi)部名稱為“Oligo 18v”。
本發(fā)明一方面涉及包含SEQ ID NO75所示的核酸序列的多核苷酸或SEQ ID NO74所示的與之互補的多核苷酸。本發(fā)明另一方面涉及包含SEQ ID NO77所示的核酸序列或其片段的多核苷酸。這些多核苷酸優(yōu)選地自阿舒氏囊霉屬微生物,尤其是棉桃阿舒氏囊霉中分離。本發(fā)明還涉及與這些多核苷酸互補的多核苷酸,以及這些多核苷酸經(jīng)遺傳密碼簡并性衍生而成的序列。
本發(fā)明再一方面涉及尤其是在嚴(yán)格的條件下與以上多核苷酸之一雜交的寡核苷酸。
本發(fā)明還涉及可以與本發(fā)明的寡核苷酸之一雜交并編碼來自阿舒氏囊霉屬微生物的基因產(chǎn)物或該基因產(chǎn)物的功能等價物的多核苷酸。
本發(fā)明進(jìn)一步涉及由上述多核苷酸編碼的多肽或蛋白質(zhì);及其具有如下氨基酸序列的肽片段,該氨基酸序列包含SEQ ID NO2,3,5,7,8,9,11,13,15,16,18,20,22,23,25,27,28,30,32,33,34,35,37,39,41,43,44,45,47,49,50,52,54,55,57,59,61,62,64,66,68,69,71,73,76,或SEQ ID NO78;中顯示的至少10個連續(xù)的氨基酸殘基;以及本發(fā)明的多肽或蛋白質(zhì)的功能等價物。
在這方面,功能等價物與本發(fā)明中具體公開的產(chǎn)物相比在氨基酸序列上于至少一個,例如1到30或1到20或1到10個序列位置由于添加,插入,替代,缺失或倒位而不同,但功能等價物不喪失最初觀察到的蛋白功能(所述功能可以經(jīng)與其他蛋白質(zhì)進(jìn)行序列比對推斷)。因此,與天然蛋白相比較功能等價物可能具有基本相同的、較高或較低的活性。
本發(fā)明其它方面涉及用于重組產(chǎn)生本發(fā)明蛋白的表達(dá)盒,其包含可操作地與至少一個調(diào)節(jié)核酸序列連接的上述核酸序列之一;并涉及包含至少一個這樣的本發(fā)明表達(dá)盒的重組載體。
本發(fā)明還提供了由至少一個上述類型的載體轉(zhuǎn)化的原核或真核宿主。一個優(yōu)選的實施方案提供了原核或真核宿主,在宿主中至少一種編碼上述本發(fā)明多肽的基因的功能性表達(dá)受到調(diào)節(jié)(例如被抑制或被過量表達(dá));或上述定義的多肽的生物活性被降低或增加。優(yōu)選的宿主選自子囊菌,尤其是阿舒氏囊霉屬,優(yōu)選地為棉桃阿舒氏囊霉株。
上述意義的基因表達(dá)調(diào)節(jié)包括對表達(dá)的抑制,如通過阻斷表達(dá)的某一階段(尤其是轉(zhuǎn)錄或翻譯)抑制表達(dá)以及基因的特異過量表達(dá)(例如通過修飾調(diào)節(jié)序列或增加編碼序列的拷貝數(shù))。
本發(fā)明另一方面涉及本發(fā)明的表達(dá)盒、本發(fā)明的載體或本發(fā)明的宿主在維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)中的應(yīng)用。
本發(fā)明另一方面涉及本發(fā)明表達(dá)盒、本發(fā)明的載體或本發(fā)明的宿主在上述本發(fā)明多肽的重組生產(chǎn)中的應(yīng)用。
本發(fā)明還提供了一種檢測或驗證可以用于調(diào)節(jié)維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)的效應(yīng)物靶點的方法。該方法涉及使用能夠與選自上述本發(fā)明多肽或其編碼核酸序列的靶點相互作用(例如非共價結(jié)合)的效應(yīng)物處理能夠以微生物學(xué)方式生產(chǎn)維生素B2和/或其前體和/或其衍生物的微生物,驗證該效應(yīng)物對微生物生產(chǎn)的維生素B2和/或其前體和/或其衍生物的量的影響,以及在適當(dāng)時分離靶點。在此優(yōu)選地通過與在缺乏該效應(yīng)物而其他條件相同時微生物的維生素B2產(chǎn)生直接比較來進(jìn)行驗證。
本發(fā)明另一方面涉及調(diào)節(jié)維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)(涉及產(chǎn)生的量和/或速率)的方法,其中用效應(yīng)物處理能夠以微生物學(xué)方式產(chǎn)生維生素B2和/或其前體和/或其衍生物的微生物,該效應(yīng)物可以與選自上面定義的本發(fā)明多肽或編碼該多肽的核酸序列的靶點相互作用。
應(yīng)提及的上述效應(yīng)物的優(yōu)選例子為a)抗體或其抗原結(jié)合片段;b)與a)不同并可以與本發(fā)明的多肽相互作用的多肽配體;c)可以調(diào)節(jié)本發(fā)明多肽的生物活性的低分子量效應(yīng)物;d)可以與本發(fā)明的核酸序列相互作用的反義核酸序列。
本發(fā)明還涉及對至少一個以上定義的本發(fā)明靶點具有特異性的上述效應(yīng)物。
本發(fā)明另一方面涉及微生物生產(chǎn)維生素B2和/或其前體和/或其衍生物的方法,其中在有利產(chǎn)生維生素B2和/或其前體和/或其衍生物的條件下培養(yǎng)以上定義的宿主,所需的產(chǎn)物自培養(yǎng)混合物中分離。在這方面,優(yōu)選地用以上定義的效應(yīng)物在培養(yǎng)前和/或培養(yǎng)過程中處理該宿主。在此優(yōu)選的宿主選自阿舒氏囊霉屬微生物,尤其是由上述方法轉(zhuǎn)化的宿主。
本發(fā)明最后的方面涉及利用本發(fā)明的多核苷酸或多肽作為調(diào)節(jié)阿舒氏囊霉屬微生物生產(chǎn)維生素B2和/或其前體和/或其衍生物的靶點。
圖1顯示基于SEQ ID NO5的本發(fā)明的氨基酸序列(中間的序列)和來自釀酒酵母的MIPS標(biāo)簽“Yta7”的部分序列(下面的序列)的比對。共有序列在兩個序列之上標(biāo)出。缺乏同源性的位置以黑框標(biāo)出。
圖2顯示基于SEQ ID NO11的本發(fā)明的氨基酸序列(中間的序列)和來自釀酒酵母的MIPS標(biāo)簽“Tif34”的部分序列(下面的序列)的比對。共有序列在兩個序列之上標(biāo)出。缺乏同源性的位置以黑框標(biāo)出。
圖3顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO12第469位至第825位的鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Rpl25a的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標(biāo)出。相似的序列位置以“+”標(biāo)出。
圖4顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO17第114位至第1位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Nop13”的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標(biāo)出。相似的序列位置以“+”標(biāo)出。
圖5A顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO21第2位至第349位的鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Sua5”的部分序列(下面的序列)的比對。圖5B顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO21第336位至第947位的鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Sua5”的部分序列(下面的序列)的比對。
圖6A顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO26第609位至第562位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Rps25a”的部分序列(下面的序列)的比對。圖6B顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO26第556位至第401位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Rps25a”的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標(biāo)出。相似的序列位置以“+”標(biāo)出。
圖7顯示基于SEQ ID NO36的本發(fā)明的氨基酸序列(中間的序列)和來自釀酒酵母的MIPS標(biāo)簽“Nic96”的部分序列(下面的序列)的比對。共有序列在兩個序列之上標(biāo)出。缺乏同源性的位置以黑框標(biāo)出。
圖8顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO38第174位至第1位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Ahc1”的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標(biāo)出。相似的序列位置以“+”標(biāo)出。
圖9A顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO42第1086位至第1012位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Rok1”的部分序列(下面的序列)的比對。圖9B顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO42第1022位至第915位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Rok1”的部分序列(下面的序列)的比對。圖9C顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO42第925位至第689位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Rok1”的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標(biāo)出。相似的序列位置以“+”標(biāo)出。
圖10A顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO48第1位至第102位的鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Rpa43”的部分序列(下面的序列)的比對。圖10B顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO48第122位至第400位的鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Rpa43”的部分序列(下面的序列)的比對。相同的序列位置在兩個序列之間標(biāo)出。相似的序列位置以“+”標(biāo)出。圖10C顯示SEQ ID NO48所示編碼鏈及與其互補的部分序列。
圖11A顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO53第2位至第148位的鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Sub2“的部分序列(下面的序列)的比對。圖11B顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO53第150位至第185位的鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Sub2“的部分序列(下面的序列)的比對。相同的序列位置在兩個序列中間標(biāo)出。相似的序列位置以“+”標(biāo)出。
圖12顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO58第2位至第82位的鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“DCP1”的部分序列(下面的序列)的比對。相同的序列位置在兩個序列中間標(biāo)出。相似的序列位置以“+”標(biāo)出。
圖13顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO63第21位至第695位的鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“PRT1”的部分序列(下面的序列)的比對。相同的序列位置在兩個序列中間標(biāo)出。相似的序列位置以“+”標(biāo)出。
圖14A顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO67第1位至第111位的鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Rrp9”的部分序列(下面的序列)的比對。圖14B顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO67第144位至第887位的鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Rrp9”的部分序列(下面的序列)的比對。相同的序列位置在兩個序列中間標(biāo)出。相似的序列位置以“+”標(biāo)出。
圖15顯示本發(fā)明的氨基酸部分序列(相應(yīng)于SEQ ID NO72第508位至第176位的互補鏈)(上面的序列)和來自釀酒酵母的MIPS標(biāo)簽“Rpl8b”的部分序列(下面的序列)的比對。相同的序列位置在兩個序列中間標(biāo)出。相似的序列位置以“+”標(biāo)出。
圖16顯示在“Oligo 18”的開放閱讀框架(ORF)后插入抗生素抗性盒子(阿舒氏囊霉TEF啟動子控制下的G418抗性基因)的構(gòu)建策略。
發(fā)明詳述本發(fā)明的核酸分子編碼的多肽或蛋白在此被稱為轉(zhuǎn)錄、RNA加工和/或翻譯蛋白(例如具有與轉(zhuǎn)錄,RNA加工,拼接或翻譯相關(guān)的活性)或簡稱為“TT蛋白”。這些TT蛋白具有例如使生物體適應(yīng)各種生長期和環(huán)境以及代謝條件例如基質(zhì),氧氣水平等的功能。
由于已掌握了可用于棉桃阿舒氏囊霉的克隆載體(例如Wright和Philipsen(1991)基因(Gene),109,99-105中公開)以及棉桃阿舒氏囊霉和相關(guān)的酵母物種的遺傳操作技術(shù),本發(fā)明的核酸分子可以用于這些生物體,尤其是棉桃阿舒氏囊霉的遺傳操作,從而使其更好并更有效的生產(chǎn)維生素B2和/或其前體和/或其衍生物。產(chǎn)量或生產(chǎn)效率的提高可以由操作本發(fā)明的基因的直接效應(yīng)或該操作的間接效應(yīng)導(dǎo)致。
本發(fā)明基于在此被稱為TT核酸和TT蛋白的新穎分子的提供,這些分子參與尤其是棉桃阿舒氏囊霉中的轉(zhuǎn)錄、RNA加工和/或翻譯(例如調(diào)節(jié)轉(zhuǎn)錄,RNA加工和/或翻譯)。本發(fā)明的TT分子在棉桃阿舒氏囊霉中的活性影響該微生物的維生素B2生產(chǎn)。優(yōu)選對本發(fā)明的TT分子的活性進(jìn)行調(diào)節(jié),以便本發(fā)明的TT蛋白參與的棉桃阿舒氏囊霉的代謝和/或能量途徑在維生素B2的產(chǎn)率、產(chǎn)量和/或生產(chǎn)效率方面受到調(diào)節(jié),即直接或間接地調(diào)節(jié)棉桃阿舒氏囊霉中維生素B2的產(chǎn)率、產(chǎn)量和/或生產(chǎn)效率。
本發(fā)明提供的核酸序列可以自例如棉桃阿舒氏囊霉株基因組分離,所述菌株可以從美國典型培養(yǎng)物保藏中心(保藏號為ATCC 10895)自由獲得。
維生素B2生產(chǎn)的改進(jìn)通過改變本發(fā)明的TT蛋白的量和/或活性有多種可能的機制可以直接地影響棉桃阿舒氏囊霉株的維生素B2的產(chǎn)率、產(chǎn)量和/或生產(chǎn)效率。
因此,通過使所需基因產(chǎn)物的表達(dá)適應(yīng)于外部條件的更為有效的轉(zhuǎn)錄,RNA加工或翻譯,可使有價值的期望產(chǎn)物的形成得以優(yōu)化。
對本發(fā)明的一種或多種TT蛋白的誘變也可以導(dǎo)致TT蛋白的活性改變(增加或降低),間接地影響棉桃阿舒氏囊霉株中所需產(chǎn)物的生產(chǎn)。例如可通過TT蛋白在不同點上協(xié)助(例如通過活化物)或阻斷(例如通過抑制物)轉(zhuǎn)錄,RNA加工和/或翻譯過程,并由此影響基因表達(dá)或蛋白質(zhì)合成。目的產(chǎn)物的產(chǎn)量也從而被提高或相對于外界條件被優(yōu)化。
多肽本發(fā)明涉及包含上述的氨基酸序列或其特征性部分序列和/或由在此描述的核酸序列編碼的多肽。
本發(fā)明還包括具體公開的新穎多肽的“功能等價物”。
具體公開的多肽的“功能等價物”或類似物為本發(fā)明的目的是指與具體公開的多肽不同但仍具有所需生物活性(例如底物特異性)的多肽。
“功能等價物”在本發(fā)明中尤其指在至少一個上述序列位置中具有與具體公開所不同的氨基酸但仍具有一種上述的生物活性的突變體?!肮δ艿葍r物”因此包括可由一個或多個氨基酸添加,替換,缺失和/或倒位獲得的突變體,只要生成的突變體能具有本發(fā)明的性質(zhì)譜,所述的修飾可發(fā)生于任何序列位置。功能等價物尤其還可以是這樣的形式,即突變體和未修飾的多肽就反應(yīng)模式而言在性質(zhì)上是一致的,即例如對同樣的底物的轉(zhuǎn)化速率不同。
上述意義的“功能等價物”也可以是所述多肽的前體以及該多肽的功能衍生物和鹽類?!胞}類”一詞指本發(fā)明蛋白分子的羧基的鹽和氨基的酸加成鹽??捎杀绢I(lǐng)域已知方式制備羧基的鹽,包括例如鈉,鈣,銨,鐵和鋅鹽等無機鹽以及與有機堿的鹽,例如與胺類如三乙醇胺、精氨酸、賴氨酸、哌啶等的鹽。本發(fā)明另一方面涉及酸加成鹽,例如與無機酸(例如鹽酸或硫酸)的鹽和與有機酸(例如乙酸和草酸)的鹽。
本發(fā)明多肽的“功能衍生物”也可由已知技術(shù)在氨基酸側(cè)鏈官能團上或在多肽的N末端或C末端制備。這樣的衍生物包括例如羧基的脂族酯和可通過與氨或與伯胺或仲胺反應(yīng)得到的羧基的酰胺;通過與?;磻?yīng)制備的游離氨基的N-酰基衍生物;或通過與?;磻?yīng)制備的游離羥基的O-酰基衍生物。
“功能等價物”自然地也包括可自其他生物體獲得的多肽和自然出現(xiàn)的變體。例如,可以通過序列比對發(fā)現(xiàn)同源序列區(qū)并根據(jù)本發(fā)明的具體要求確立等價酶。
“功能等價物”還包括具有例如所需的生物功能的片段,優(yōu)選為本發(fā)明多肽的單結(jié)構(gòu)域或序列基序。
“功能等價物”還可以是具有上述多肽序列之一或其功能等價物和至少一個另外的具有不同功能的異源序列的融合蛋白,該異源序列在所述多肽序列或其功能等價物的N或C末端進(jìn)行功能性連接(即該融合蛋白的各部分在功能方面產(chǎn)生的相互損害是微不足道的)。這種異源序列的非限制性例子為例如信號肽,酶,免疫球蛋白,表面抗原,受體或受體配體。
根據(jù)本發(fā)明,“功能等價物”包括本文具體公開的蛋白的同系物。通過Pearson和Lipman,Proc.Natl.Acad.Sci.(USA)85(8),1988,2444-2448的算法計算,這些同系物與具體公開的序列之一具有至少60%,優(yōu)選地至少75%,尤其至少85%,例如90%,95%,或99%的同源性。
在可能存在蛋白糖基化的情況下,本發(fā)明的等價物包括以上定義的蛋白類型的去糖基化或糖基化形式,及可通過改變糖基化模式獲得的修飾形式。
誘變可產(chǎn)生本發(fā)明的蛋白或多肽的同系物,例如通過蛋白點突變或截短實現(xiàn)。這里使用的“同系物”一詞涉及可以對蛋白活性產(chǎn)生激動劑或拮抗劑作用的蛋白的變體形式。
可以通過篩選突變體(例如截短突變體)組合文庫鑒定本發(fā)明蛋白的同系物。通過核酸水平的組合誘變,例如通過合成的寡核苷酸混合物的酶促連接,可以產(chǎn)生一個多樣化的蛋白質(zhì)變體文庫。大量方法可用于從簡并寡核苷酸序列產(chǎn)生潛在同系物的文庫。簡并基因序列的化學(xué)合成可在自動DNA合成儀中進(jìn)行,然后可將合成的基因與適合的表達(dá)載體連接。利用一組簡并基因可在一個混合物中提供編碼一組所需的潛在蛋白質(zhì)序列的所有序列。本領(lǐng)域技術(shù)人員已知合成簡并寡核苷酸的方法(例如NaRNAg,S.A.(1983)Tetrahedron 393;Itakura等(1984)Annu.Rev.Biochem.53323;Itakura等(1984)Science 1981056;Ike等(1983)Nucleic Acids Res.11477)。
此外,也可以利用蛋白密碼子的片段文庫來生成多樣的蛋白片段群用于篩選和隨后選擇本發(fā)明蛋白的同系物。在一個實施方案中,通過如下方法產(chǎn)生編碼序列的片段文庫在每個分子只發(fā)生大約一次切割的條件下,以核酸酶處理編碼序列的雙鏈PCR片段,變性雙鏈DNA,之后使該DNA復(fù)性,從而形成可能包含來自不同切割產(chǎn)物的有義/反義對的雙鏈DNA,經(jīng)S1核酸酶處理自新形成的雙鏈體中去除單鏈部分,并將產(chǎn)生的片段文庫連接到表達(dá)載體中。可由這種方法得到編碼本發(fā)明蛋白的不同大小的N末端、C末端和內(nèi)部片段的表達(dá)文庫。
現(xiàn)有技術(shù)中已知一些技術(shù)可以從點突變或截短產(chǎn)生的組合文庫中篩選基因產(chǎn)物和從cDNA文庫中篩選具有選定性質(zhì)的基因產(chǎn)物。這些技術(shù)經(jīng)改造后可用于快速篩選由本發(fā)明同系物的組合誘變產(chǎn)生的基因文庫。最常用的高通量大型基因文庫篩選分析技術(shù)包括將該基因文庫克隆入可復(fù)制的表達(dá)載體中,使用產(chǎn)生的載體文庫轉(zhuǎn)化合適的細(xì)胞,并在檢測所需的活性有助于分離如下載體的條件下表達(dá)該組合基因,所述載體編碼活性檢測中被檢出的基因產(chǎn)物。遞歸總體誘變(Recursive ensemble mutagenesis,REM)技術(shù)增加文庫中功能性突變體的頻率,因而可以與篩選實驗結(jié)合用于鑒定同系物。(Arkin和Yourvan(1992)PNAS 897811-7815;Delgrave等(1993)蛋白質(zhì)工程(Protein Engineering)6(3)327-331)。
可重組制備本發(fā)明的多肽(見以下部分)或可通過傳統(tǒng)的生化技術(shù)自微生物,特別是阿舒氏囊霉屬微生物中分離自然形式的多肽。(見Cooper,T.G.,Biochemische Arbeitsmethoden,Verlag Walter de Gruyter,柏林,紐約或Scopes,R.,蛋白質(zhì)純化(Protein Purification),施普林格,紐約,海德堡,柏林)。
核酸序列本發(fā)明還涉及編碼上述多肽之一及其功能等價物的核酸序列(單鏈和雙鏈DNA和RNA序列,例如cDNA和mRNA),該核酸序列可以例如利用人工核苷酸類似物獲得。
本發(fā)明既涉及編碼本發(fā)明的多肽或蛋白質(zhì)或其生物活性部分的分離的核酸分子,又涉及可用作例如鑒定或擴增本發(fā)明的編碼核酸的雜交探針或引物的核酸片段。
本發(fā)明的核酸分子還可包含來自基因編碼區(qū)的3’和/或5’末端的非翻譯序列。
“分離的”核酸分子自存在于該核酸的天然來源中的其他核酸分子中分離出來,如果該核酸分子由重組技術(shù)產(chǎn)生,還可以基本不含其他細(xì)胞物質(zhì)或培養(yǎng)基;如果由化學(xué)方法合成,則基本不含化學(xué)前體或其他化學(xué)物質(zhì)。
通過分子生物學(xué)標(biāo)準(zhǔn)技術(shù)以及本發(fā)明提供的序列信息可以分離本發(fā)明的核酸分子。例如,以一種具體公開的完全序列或其一部分為雜交探針,通過標(biāo)準(zhǔn)雜交技術(shù)(如Sambrook,J.,F(xiàn)ritsch,E.F.和Maniatis,T.分子克隆實驗室手冊,第二版,Molecular CloningA Laboratory Manual.2ndedition,美國冷泉港實驗室(Cold Spring Harbor Laboratory),美國冷泉港實驗室出版社,冷泉港,紐約,1989的描述),可以從適宜的cDNA文庫中分離cDNA。使用基于一種公開序列而構(gòu)建的寡核苷酸引物、通過聚合酶鏈反應(yīng)也可以分離獲得包含該序列或其一部分的核酸分子。由這種方法擴增的核酸分子可以被克隆入合適的載體中并由DNA序列分析法表征。由標(biāo)準(zhǔn)合成法,例如使用自動DNA合成儀也可以產(chǎn)生相應(yīng)于TT核苷酸序列的本發(fā)明寡核苷酸。
本發(fā)明還包括與具體描述的核苷酸序列互補的核酸分子或其一部分。
本發(fā)明的核苷酸序列使得可產(chǎn)生能用于鑒定和/或克隆其他細(xì)胞類型和生物中的同源序列的探針和引物。這樣的探針和引物通常包括如下核苷酸序列區(qū)域,該區(qū)域可以在嚴(yán)格條件下與本發(fā)明核酸序列的有義鏈或相應(yīng)的反義鏈中的至少約12,優(yōu)選地至少約25,例如約40,50或75個連續(xù)的核苷酸雜交。
本發(fā)明的其它核酸序列衍生自SEQ ID NO1,4,6,10,12,14,17,19,21,24,26,29,31,36,38,40,42,46,48,51,53,56,58,60,63,65,67,70,72,74,75,或SEQ ID NO77并由于添加,替代、插入或缺失一個或多個核苷酸而與所衍生自的序列不同,但仍編碼具有所需性質(zhì)譜的多肽。
本發(fā)明還包括含有所謂的沉默突變或經(jīng)過修飾(這是根據(jù)特定來源或宿主生物的密碼子使用與具體公開的序列相比而言的)的核酸序列以及它們的自然存在的變體(例如拼接變體或等位基因變體)。本發(fā)明還涉及可通過保守核苷酸替代(即相關(guān)的氨基酸被具有同樣電荷、大小、極性和/或溶解性的氨基酸替代)獲得的序列。
本發(fā)明還涉及由序列多態(tài)性自具體公開的核酸衍生得到的分子。這些遺傳多態(tài)性可由于自然變異存在于群體的個體中。這些自然變異通常導(dǎo)致基因的核苷酸序列出現(xiàn)1%至5%的變化。
本發(fā)明還包括與上述編碼序列雜交或互補的核酸序列。對基因組或cDNA文庫進(jìn)行篩選可發(fā)現(xiàn)這些多核苷酸,適當(dāng)時可以利用合適的引物通過PCR擴增這些多核苷酸,并例如使用合適的探針進(jìn)行分離。另一種可能的方案是利用本發(fā)明的多核苷酸或載體轉(zhuǎn)化合適的微生物,增殖該微生物并由此擴增這些多核苷酸然后分離之。再一可能方案是通過化學(xué)途徑合成本發(fā)明的多核苷酸。
能與多核苷酸“雜交”的性質(zhì)意味著多核苷酸或寡核苷酸在嚴(yán)格的條件下能與幾乎互補的序列結(jié)合,而在此條件下,非互補序列之間不發(fā)生非特異的結(jié)合。為此這些序列應(yīng)具有70%至100%,優(yōu)選為90%至100%的互補性?;パa序列能夠特異性地互相結(jié)合的性質(zhì)可用于例如Northern或Southern印跡雜交或在PCR或RT-PCR中用于引物的結(jié)合。為此目的通常使用長30個堿基對或以上的寡核苷酸。嚴(yán)格的條件指例如在Northern印跡雜交法中,在50-70℃,優(yōu)選地為60-65℃下進(jìn)行洗滌,如用含有0.1xSSC緩沖液和0.1%SDS(20x SSC3M氯化鈉,0.3M檸檬酸鈉,pH7.0)的洗滌溶液洗脫非特異雜交的cDNA探針或寡核苷酸。在此情況下,如上述只有高度互補的核酸互相保持結(jié)合。本領(lǐng)域技術(shù)人員已知這種嚴(yán)格條件的建立,并可參見例如Ausubel等的《Current Protocols in MolecularBiology》,John Wiley & Sons,紐約N.Y.(1989),6.3.1-6.3.6.中的描述。
本發(fā)明另一方面涉及反義核酸。其包含與有義編碼核酸互補的核苷酸序列。該反義核酸可與整個編碼鏈互補或僅與其中一部分互補。在另一個實施方案中,該反義核酸分子與核苷酸序列編碼鏈的非編碼區(qū)反義?!胺蔷幋a區(qū)”指序列中被稱為5’-和3’-非翻譯區(qū)的部分。
反義寡核苷酸可以是例如大約5,10,15,20,25,30,35,40,45或50個核苷酸長??捎杀绢I(lǐng)域已知的方法通過化學(xué)合成和酶促連接反應(yīng)構(gòu)建本發(fā)明的反義核酸。反義核酸可由天然存在的核苷酸或各種修飾的、設(shè)計以增強分子的生物穩(wěn)定性或增強反義和有義核酸間形成的雙鏈體的物理穩(wěn)定性的核苷酸通過化學(xué)方式合成??梢允褂玫睦影虼姿狨パ苌锖瓦灌と〈暮塑账?。可用于產(chǎn)生反義核酸的經(jīng)修飾的核苷有例如5-氟尿嘧啶,5-溴尿嘧啶,5-氯尿嘧啶,5-碘尿嘧啶,次黃嘌呤,黃嘌呤,4-乙酰胞嘧啶,.5-(羧基羥基甲基)尿嘧啶,5-羧基甲基氨基甲基-2-硫尿苷,5-羧基甲基氨基甲基尿嘧啶,二氫尿嘧啶,β-D-半乳糖基queuosine,肌苷,N6-異戊烯腺嘌呤,1-甲基鳥嘌呤,1-甲基肌苷,2,2-二甲基鳥嘌呤,2-甲基腺嘌呤,2-甲基鳥嘌呤,3-甲基胞嘧啶,5-甲基胞嘧啶,N6-甲基腺嘌呤,7-甲基鳥嘌呤,5-甲基氨基甲基尿嘧啶,5-甲氧基氨基甲基-2-硫尿嘧啶,β-D-甘露糖基queuosine,5-甲氧基羧基甲基尿嘧啶,5-甲氧基尿嘧啶,2-甲硫基-N6-異戊烯腺嘌呤,尿嘧啶-5-氧基乙酸(v),Wybutoxosine,假尿嘧啶,queuosine,2-硫代胞嘧啶,5-甲基-2-硫尿嘧啶,2-硫尿嘧啶,4-硫尿嘧啶,5-甲基尿嘧啶,尿嘧啶-5-氧乙酸甲基酯,3-(3-氨基-3-羧基丙基)尿嘧啶,(acp3)w和2,6-二氨基嘌呤等。也可利用其中以反義方向亞克隆了核酸的表達(dá)載體來生物產(chǎn)生反義核酸。
本發(fā)明的反義核酸分子通常被施用給細(xì)胞或在原位產(chǎn)生,這樣它們可以與該細(xì)胞mRNA和/或編碼DNA雜交或結(jié)合,通過例如抑制轉(zhuǎn)錄和/或翻譯抑制蛋白的表達(dá)。
可以例如通過使反義核酸分子與能結(jié)合細(xì)胞表面受體或抗原的肽或抗體相連接,以修飾反義分子從而使之能與在所選的細(xì)胞表面上表達(dá)的受體或抗原特異性地結(jié)合。該反義核酸分子還可通過在此描述的載體被給予細(xì)胞。為使細(xì)胞內(nèi)的反義分子達(dá)到足夠的濃度,優(yōu)選使用的載體構(gòu)建體為其中反義核酸分子處于強的細(xì)菌、病毒或真核生物啟動子的控制之下的載體。
在另一個實施方案中,本發(fā)明的反義核酸分子是一種α-異頭核酸分子。α-異頭核酸分子(α-anomeric nucleic acid molecule)與互補的RNA形成特有的雙鏈雜交體,與通常的α單元不同,這兩條鏈的走向互相平行(Gaultier等,(1987)Nucleic Acids Res.156625-6641)。該反義核酸分子還可以包含2’-O-甲基核糖核苷酸(Inoue等.,(1987)Nucleic Acids Res.156131-6148)或嵌合RNA-DNA類似物(Inoue等.(1987)FEBS Lett.215327-330)。
本發(fā)明還涉及核酶。其為具有核糖核酸酶活性的催化性RNA分子,能夠切割具有與其互補的區(qū)域的單鏈核酸例如mRNA。因此核酶(例如錘頭核酶(見Haselhoff和Gerlach(1988)Nature 334585-591))可用于本發(fā)明轉(zhuǎn)錄物的催化性切割從而抑制相應(yīng)核酸的翻譯。對本發(fā)明的編碼核酸具有特異性的核酶可以在例如本發(fā)明具體公開的cDNA的基礎(chǔ)上形成。例如,可構(gòu)建四膜蟲-L-19 IVS RNA的衍生物,其中活性位點的核苷酸序列與本發(fā)明的編碼mRNA中待切割的核苷酸序列互補。(參考例如US-A-4 987071和US-A-5 116 742)??商鎿Q地,可用mRNA自RNA分子池中選擇具有特異的核糖核酸酶活性的催化性RNA(見例如Bartel,D.,和Szostak,J.W.(1993)Science 2611411-1418)。
可替換地,本發(fā)明序列的基因表達(dá)可通過與本發(fā)明核苷酸序列的調(diào)節(jié)區(qū)互補(例如與編碼序列的啟動子和/或增強子互補)的核苷酸序列的打靶來抑制,這種打靶可造成三螺旋結(jié)構(gòu)形成從而阻止目標(biāo)細(xì)胞中相應(yīng)基因的轉(zhuǎn)錄(Helene,C.(1991)Anticancer Drug Res.6(6)569-584;Helene,C.等,(1992)Ann.N.Y.Acad.Sci.66027-36;和Maher.,L.J.(1992)Bioassays14(12)807-815)。
表達(dá)構(gòu)建體和載體本發(fā)明還涉及包含在調(diào)節(jié)性核酸序列的遺傳控制下的編碼本發(fā)明多肽的核酸序列的表達(dá)構(gòu)建體;以及包含至少一個這樣的表達(dá)構(gòu)建體的載體。本發(fā)明的這種表達(dá)構(gòu)建體優(yōu)選包含位于特定編碼序列5’端上游的啟動子以及位于特定編碼序列3’端下游的終止序列和,適當(dāng)時,其他通常的調(diào)節(jié)元件,這些元件每一個都與該編碼序列可操作地連接?!翱刹僮鞯剡B接”指啟動子,編碼序列,終止子和適當(dāng)時其他調(diào)節(jié)元件的相繼排列方式,這種排列方式使得每個調(diào)節(jié)元件都能按預(yù)期行使其功能用于編碼序列的表達(dá)。可操作連接的序列的例子為前導(dǎo)序列和增強子、多腺苷酸化信號等。其他調(diào)節(jié)元件包括選擇標(biāo)記、擴增信號、復(fù)制起點等。適宜的調(diào)節(jié)序列在例如Goeddel,基因表達(dá)技術(shù)酶學(xué)方法(Gene Expression TechnologyMethodsin Enzymology)185,Academic Press,圣地亞哥San Diego,加利福尼亞州CA(1990)中有所描述。
除了人工調(diào)節(jié)序列,天然的調(diào)節(jié)序列仍可以存在于實際的結(jié)構(gòu)基因之前。這種天然調(diào)節(jié)可在適當(dāng)時通過基因修飾而關(guān)閉,從而使基因的表達(dá)可被增加或降低。然而,基因構(gòu)建體也可具有較為簡單的結(jié)構(gòu),即在結(jié)構(gòu)基因之前沒有插入附加的調(diào)節(jié)信號,且具有調(diào)節(jié)功能的天然啟動子未被刪除。可替換地,可以使天然調(diào)節(jié)序列發(fā)生突變不再具有調(diào)節(jié)作用,從而增強或降低基因的表達(dá)。核酸序列在基因構(gòu)建體中可有一個或多個拷貝。
可使用的啟動子的例子包括cos,tac,trp,tet,trp-tet,lpp,lac,lpp-lac,lacIq,T7,T5,T3,gal,trc,ara,SP6,λ-PR或λ-PL啟動子(它們優(yōu)選用于革蘭氏陰性細(xì)菌);革蘭氏陽性細(xì)菌啟動子amy和SPO2,酵母啟動子ADC1,MFα,AC,P-60,CYC1,GAPDH或植物啟動子CaMV/35S,SSU,OCS,lib4,usp,STLS1,B33,或泛素或菜豆蛋白啟動子。尤其優(yōu)選使用可誘導(dǎo)的啟動子,例如光誘導(dǎo)的啟動子,更優(yōu)選為溫度誘導(dǎo)的啟動子如PrPl啟動子。原則上所有天然啟動子以及它們的調(diào)節(jié)序列均可使用。此外,使用合成啟動子也可能是有利的。
所述的調(diào)節(jié)序列旨在用于實現(xiàn)核酸序列的特異表達(dá)。這可能意味著例如視宿主生物不同使基因只在誘導(dǎo)后才表達(dá)或過量表達(dá)或立即被表達(dá)和/或過量表達(dá)。
此外優(yōu)選調(diào)節(jié)序列或因子可以正面地產(chǎn)生影響,從而增加或減低表達(dá)。因此,調(diào)節(jié)元件的增強作用可以通過使用強轉(zhuǎn)錄信號如啟動子和/或增強子有利地在轉(zhuǎn)錄水平上發(fā)生。然而通過例如增加mRNA的穩(wěn)定性,也可加強其翻譯。
融合適宜的啟動子和適宜的本發(fā)明核苷酸序列以及終止信號或多腺苷酸化信號可以產(chǎn)生表達(dá)盒。為此目的可以使用常規(guī)的重組和克隆技術(shù),參見T.Maniatis,E.F.Fritsch和J.Sambrook,分子克隆實驗室手冊(Molecular CloningA Laboratory Manual),Cold Spring HarborLaboratory,冷泉港Cold Spring Harbor,紐約(1982);T.J.Silhavy,M.L.Berman和L.W.Enq uist,基因融合試驗(Experiments with GeneFusions),Cold Spring Harbor Laboratory,Cold Spring Harbor,紐約(1984);Ausubel,F(xiàn).M.等,Current Protocols in Molecular Biology,GreenePublishing Assoc.and Wiley Interscience(1987)。
為在適宜的宿主生物中表達(dá),重組核酸構(gòu)建體或基因構(gòu)建體可以有利地插入宿主特異的載體中實現(xiàn)這些基因在宿主中的最佳表達(dá)。載體是本領(lǐng)域技術(shù)人員熟知的,并可在例如“克隆載體”(Cloning Vectors)(PouwelsP.H.等,eds,Elsevier,Amsterdam-New York-Oxford,1985)中找到有關(guān)內(nèi)容。載體不僅指質(zhì)粒,還包括本領(lǐng)域技術(shù)人員已知的所有其他載體,例如噬菌體,病毒如SV40、CMV、桿狀病毒和腺病毒,轉(zhuǎn)座子,IS元件,質(zhì)粒,粘粒和線性或環(huán)狀DNA。這些載體可以在宿主生物中自主復(fù)制或隨染色體復(fù)制。
可以提及的適宜表達(dá)載體的例子有常規(guī)的融合表達(dá)載體如pGEX(Pharmacia Biotech Inc;Smith,D.B.和Johnson,K.S.(1988)Gene 6731-40),pMAL(New England Biolabs,Beverly,MA)和pRIT 5(Pharmacia,Piscataway,NJ),使用這些載體可以分別使谷胱甘肽S-轉(zhuǎn)移酶(GST)、麥芽糖E結(jié)合蛋白和A蛋白融合至重組目標(biāo)蛋白。
非融合蛋白表達(dá)載體如pTrc(Amann等(1988)Gene 69301-315)和pET 11d(Studier等,基因表達(dá)技術(shù)酶學(xué)方法(Gene ExpressionTechnologyMethods in Enzymology)185,Academic Press,圣地亞哥,加利福尼亞(1990)60-89)。
用于釀酒酵母中表達(dá)的酵母表達(dá)載體如pYepSec1(Baldari等(1987)Embo J.6229-234),pMFα(Kurjan和Herskowitz(1982)細(xì)胞(Cell)30933-943),pJRY88(Schultz等(1987)基因(Gene)54113-123)和pYES2(Invitrogen Corporation,圣地亞哥,加利福尼亞)。有關(guān)適用于其他真菌(如絲狀真菌)的載體和載體構(gòu)建方法的例子的詳細(xì)描述見例如van denHondel,C.A.M.J.J.& Punt,P.J.(1991)“絲狀真菌基因轉(zhuǎn)移系統(tǒng)和載體的發(fā)展”,《真菌的應(yīng)用分子遺傳學(xué)》(Applied Molecular Genetics ofFungi),J.F.Peberdy等eds,pp.1-28,Cambridge University PressCambridge。
現(xiàn)有用于培養(yǎng)的昆蟲細(xì)胞(例如Sf9細(xì)胞)中蛋白的表達(dá)的桿狀病毒載體包括pAc系列(Smith等,(1983)Mol.Cell Biol.32156-2165)和pVL系列(Lucklow和Summers(1989)病毒學(xué)(Virology)17031-39)。
植物表達(dá)載體的例子的詳細(xì)描述見例如Becker,D.,Kemper,E.,Schell,J.和Masterson,R.(1992)“緊靠左邊界帶有選擇標(biāo)記的新植物二元載體”,Plant Mol.Biol.201195-1197;和Bevan,M.W.(1984)“用于植物轉(zhuǎn)化的農(nóng)桿菌二元載體”,Nucl.Acids Res.128711-8721。
哺乳動物表達(dá)載體例如pCDM8(Seed,B.(1987)Nature 329840)和pMT2PC(Kaufman等(1987)EMBO J.6187-195)。
適用于原核和真核細(xì)胞的其它表達(dá)系統(tǒng)在Sambrook,J.,F(xiàn)ritsch,E.F.和Maniatis,T.,分子克隆實驗室手冊(Molecular cloningA LaboratoryManual),第二版,Cold Spring Harbor Laboratory,Cold Spring HarborLaboratory Press,Cold Spring Harbor,紐約,1989.的第16和17章中描述。
重組微生物本發(fā)明的載體可用于產(chǎn)生重組微生物,所述微生物由例如至少一個本發(fā)明的載體轉(zhuǎn)化并可用于產(chǎn)生本發(fā)明的多肽。有利地,可以將上述的本發(fā)明重組構(gòu)建體引入適合的宿主系統(tǒng)中并在其中表達(dá)。本領(lǐng)域技術(shù)人員熟悉克隆和轉(zhuǎn)染的方法,例如共沉淀,原生質(zhì)體融合,電穿孔法,逆轉(zhuǎn)錄病毒轉(zhuǎn)染法等,并優(yōu)選使用這些方法引起所述的核酸在特定的表達(dá)系統(tǒng)中表達(dá)。適宜的表達(dá)系統(tǒng)在例如《Current Protocols in Molecular Biology》(F.Ausubel等,eds,Wiley Interscience,紐約1997)或Sambrook等《分子克隆實驗室手冊》(Molecular CloningA Laboratory Manual)第二版(Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,紐約,1989)中有描述。
根據(jù)本發(fā)明還可以制備同源重組微生物。這需要產(chǎn)生包含至少一段本發(fā)明的基因或編碼序列的載體,在適當(dāng)時,向其中引入至少一個氨基酸缺失、添加或替代以修飾,例如從功能上破壞本發(fā)明的序列(剔除載體)。引入的序列也可為例如來自相關(guān)微生物的同系物或來自哺乳動物、酵母或昆蟲??商娲?,還可設(shè)計用于同源重組的載體以便同源重組過程中內(nèi)源性基因發(fā)生突變或經(jīng)過其他修飾但仍編碼功能蛋白(如可以修飾位于上游的調(diào)節(jié)序列以改變內(nèi)源性蛋白的表達(dá))。TT基因的修飾部分存在于同源重組載體內(nèi)。適宜的同源重組載體的構(gòu)建的描述見例如Thomas,K.R.和Capecchi,M.R.(1987)Cell 51503。
原則上適宜的宿主生物體可為所有能夠表達(dá)本發(fā)明核酸,其等位基因變體,其功能等價物或衍生物的生物體。宿主生物指例如細(xì)菌,真菌,酵母,植物或動物細(xì)胞。優(yōu)選的生物為細(xì)菌,例如埃希氏桿菌屬(Escherichia)如大腸桿菌,鏈霉菌屬(streptomyces)、芽孢桿菌屬(Bacillus)或假單胞菌屬(Pseudomonas),真核微生物如釀酒酵母,曲霉菌(Aspergillus),來自動物或植物的高等真核細(xì)胞,如Sf9或CHO細(xì)胞。優(yōu)選的生物選自阿舒氏囊霉屬,尤其是棉桃阿舒氏囊霉株。
成功轉(zhuǎn)化的生物可通過同樣存在于載體或表達(dá)盒中的標(biāo)記基因選擇。這樣的標(biāo)記基因為例如抗生素抗性基因和催化能引起轉(zhuǎn)化細(xì)胞染色的顏色形成反應(yīng)的酶的基因。隨后可以通過自動細(xì)胞分揀法進(jìn)行選擇。由載體成功轉(zhuǎn)化并包含適當(dāng)?shù)目股乜剐曰?例如G418或潮霉素)的微生物可由適當(dāng)?shù)暮股氐呐囵B(yǎng)質(zhì)或營養(yǎng)介質(zhì)選擇。利用細(xì)胞表面上存在的標(biāo)記蛋白可以通過親和層析法進(jìn)行選擇。
宿主生物與適合該生物的載體例如質(zhì)粒、病毒或噬菌體,如具有RNA聚合酶/啟動子系統(tǒng)的質(zhì)粒、λ或μ噬菌體或其他溫和噬菌體或轉(zhuǎn)座子和/或其他有利調(diào)節(jié)序列的結(jié)合形成了表達(dá)系統(tǒng)。“表達(dá)系統(tǒng)”一詞指,例如,哺乳動物細(xì)胞如CHO細(xì)胞與適合哺乳動物細(xì)胞的載體如pcDNA3neo載體的結(jié)合。
如需要,基因產(chǎn)物還可在轉(zhuǎn)基因生物體例如轉(zhuǎn)基因動物(尤其為小鼠,綿羊)或轉(zhuǎn)基因植物中表達(dá)。
多肽的重組生產(chǎn)本發(fā)明還涉及重組產(chǎn)生本發(fā)明的多肽或其生物學(xué)活性功能片斷的方法,該方法中培養(yǎng)可以產(chǎn)生多肽的微生物,在適當(dāng)時誘導(dǎo)多肽的表達(dá),并自培養(yǎng)物中分離多肽。如需要,該多肽可由此方法進(jìn)行工業(yè)規(guī)模的生產(chǎn)。
可以利用已知的方法培養(yǎng)和發(fā)酵重組微生物??梢栽诶?0到40℃下,pH為6到9的TB或LB培養(yǎng)基中培養(yǎng)細(xì)菌。適合的培養(yǎng)條件的描述見例如T.Maniatis,E.F.Fritsch和J.Sambrook,Molecular CloningALaboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1982)。
如果多肽不被分泌入培養(yǎng)基,則破壞細(xì)胞后,利用已知的蛋白分離法自裂解物中獲得產(chǎn)物。備選地,可以通過高頻率超聲波,高壓例如在弗氏細(xì)胞壓碎器中,滲脹裂解(osmolysis),變性劑的作用,裂解酶或有機溶劑,勻漿或上述多種方法的組合來破碎細(xì)胞。
多肽的純化可以利用已知的色譜法例如分子篩色譜(凝膠過濾法),如Q-Sepharose色譜,離子交換色譜和疏水色譜以及其他常用方法如超濾,結(jié)晶,鹽析,透析和非變性凝膠電泳。對適合的方法的描述見例如Cooper,T.G.,Biochemische Arbeitsmethoden,Verlag Walter de Gruyter,Berlin,New York或Scopes,R.,Protein Purification,Springer Verlag,New York,Heidelberg,Berlin。
使用如下載體系統(tǒng)或寡核苷酸尤其利于分離重組蛋白,所述載體系統(tǒng)或寡核苷酸通過特定的核苷酸序列延長cDNA,并由此編碼可以例如簡化純化的經(jīng)修飾的多肽或融合蛋白。該類型的適當(dāng)修飾包括例如所謂的標(biāo)簽——其起錨的作用(例如六組氨酸錨修飾法)或能被抗體識別為抗原的表位(描述見例如Harlow,E.和Lane,D.,1988,AntibodiesA LaboratoryManual.Cold Spring Harbor(N.Y.)Press)。這些錨可用于使蛋白結(jié)合在例如聚合物基質(zhì)等固相載體上,該固相載體可裝入例如層析柱中,或用于微量滴定板或其他載體上。
同時這些錨也可用于蛋白的識別。還可以單獨或與錨結(jié)合使用傳統(tǒng)的標(biāo)記物例如熒光染料,與底物反應(yīng)后可形成可探測的反應(yīng)產(chǎn)物的酶標(biāo)記物或放射性標(biāo)記物來識別蛋白質(zhì)。
本發(fā)明還涉及維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)方法。
如果轉(zhuǎn)化是用重組微生物進(jìn)行的,則優(yōu)選該微生物首先在有氧的復(fù)合培養(yǎng)基中培養(yǎng),例如在約20℃或更高的溫度下,pH值約為6到9時培養(yǎng)直到細(xì)胞密度足夠為止。為了能夠更好的控制反應(yīng),優(yōu)選使用可誘導(dǎo)的啟動子。對維生素B2產(chǎn)生實施誘導(dǎo)后,接著在有氧條件下繼續(xù)培養(yǎng)12小時到3天。
以下非限制性實施例描述了本發(fā)明具體的實施方案。
一般性實驗描述a)一般克隆方法本發(fā)明利用的克隆技術(shù),例如限制性切割,瓊脂糖凝膠電泳,DNA片段的純化,轉(zhuǎn)移核酸至硝化纖維素膜和尼龍膜上,DNA片段的連接,大腸桿菌細(xì)胞的轉(zhuǎn)化,細(xì)菌的培養(yǎng),噬菌體的復(fù)制,以及重組DNA的序列分析,均按照Sambrook等(1989)上述引文的描述進(jìn)行。
b)聚合酶鏈反應(yīng)(PCR)按照標(biāo)準(zhǔn)方案在下面的標(biāo)準(zhǔn)混合物中進(jìn)行PCR8μl dNTP混合液(200μM),10μl不含MgCl2的Taq聚合酶緩沖液(10x),8μl MgCl2(25mM),每種引物各1μl(0.1μM),1μl DNA(待擴增),2.5 U Taq聚合酶(MBI Fermentas,Vilnius,Lithuania),去離子水加至100μl。
c)大腸桿菌的培養(yǎng)在LB-amp培養(yǎng)基(胰胨10.0g,氯化鈉5.0g,酵母提取物5.0g,氨芐青霉素100g/ml,H2O加至1000ml)中、37℃下培養(yǎng)重組大腸桿菌DH5α菌株。為此每種情況下用接種環(huán)將一個菌落從瓊脂平板轉(zhuǎn)移至5mlLB-amp中。在220rpm下振蕩培養(yǎng)約18小時后,將4ml培養(yǎng)物接種至2升搖瓶中的400ml培養(yǎng)基中。當(dāng)OD578值到達(dá)0.8和1.0之間后在42℃下熱休克3至4個小時,誘導(dǎo)大腸桿菌中P450的表達(dá)。
d)自培養(yǎng)物中純化所需產(chǎn)物可以利用多種本領(lǐng)域已知的方法將所需的產(chǎn)物自微生物或培養(yǎng)物上清中分離出來。如果所需的產(chǎn)物不被細(xì)胞分泌,則可通過慢速離心將細(xì)胞從培養(yǎng)物中分離出來,并可以由如機械作用力或超聲作用等標(biāo)準(zhǔn)技術(shù)裂解細(xì)胞。
利用離心除去細(xì)胞碎片,得到包含可溶性蛋白的上清部分用于進(jìn)一步純化所需的化合物。如果該產(chǎn)物被細(xì)胞分泌,則由慢速離心除去培養(yǎng)物中的細(xì)胞,保留的上清部分用于進(jìn)一步純化。
在適合的樹脂中層析從這兩種純化方法得到的上清部分,所需的分子以大于雜質(zhì)的選擇性保留于層析樹脂上或通過之。如有必要可用相同或不同的層析樹脂重復(fù)層析步驟。本領(lǐng)域技術(shù)人員能夠選擇適宜的層析樹脂,并最為有效的利用其純化特定的分子。純化產(chǎn)物可以經(jīng)過濾或超濾濃縮,并在該產(chǎn)物最為穩(wěn)定的溫度下儲存。
本領(lǐng)域已知多種純化方法。這些純化技術(shù)的描述見例如,Bailey,J.E.&Ollis,D.F.Biochemical Engineering Fundamentals,McGraw-HillNewYork(1986)。
可以利用現(xiàn)有技術(shù)確定分離的化合物的身份和純度。這些技術(shù)包括高效液相色譜法(HPLC)、光譜學(xué)方法、染色方法、薄層色譜法、NIRS、酶分析或微生物學(xué)分析法。這些分析方法的概述見Patek等(1994)Appl.Environ.Microbiol.60133-140;Malakhova等(1996)Biotekhnologiya 1127-32;和Schmidt等(1998)Bioprocess Engineer.1967-70;Ullmann’sEncyclopedia of Industrial Chemistry(1996)Vol.A27,VCHWeinheim,pp.89-90,pp.521-540,pp.540-547,pp.559-566,pp.575-581和pp.581-587;Michal,G(1999)Biochemical PathwaysAn Atlas of Biochemistry andMolecular Biology,John Wiley and Sons;Fallon,A.等(1987)HPLC在生物化學(xué)中的應(yīng)用,《Laboratory Techniques in Biochemistry and MolecularBiology》.Vol.17。
e)MPSS法、克隆鑒定和同源性檢索的一般描述MPSS技術(shù)(Massive Parallel Signature Sequencing,大規(guī)模平行信號測序,參考Brenner等,Nat.Biotechnol.(2000)18,630-634)被應(yīng)用于產(chǎn)生維生素B2的絲狀真菌棉桃阿舒氏囊霉。利用該技術(shù)可以獲得有關(guān)大量基因在真核生物體中的表達(dá)水平的高度準(zhǔn)確的定量信息。該技術(shù)涉及在一個特定的時間X時分離生物體的mRNA,在逆轉(zhuǎn)錄酶的幫助下轉(zhuǎn)錄成cDNA并克隆入具有特定標(biāo)簽序列的特定載體中。選擇數(shù)目足夠多(大約高1000倍)的具有不同標(biāo)簽序列的載體,以便在統(tǒng)計學(xué)上每個DNA分子均被克隆入因其標(biāo)簽序列而獨特的載體中。
該載體的插入序列隨后與標(biāo)簽一起被切下。通過這種方法得到的DNA分子然后與具有所述標(biāo)簽的分子對應(yīng)物的微珠共同孵育。孵育后可認(rèn)為通過特定標(biāo)簽或?qū)?yīng)物每個微珠僅加載了一種類型的DNA分子。將這些微珠轉(zhuǎn)移至特殊的流式處理槽(flow cell)中并固定在那里,從而可能利用以熒光染料為基礎(chǔ)的改造的測序法和數(shù)碼彩色相機對所有的微珠進(jìn)行群體測序。盡管這種方法可進(jìn)行高數(shù)目的分析,卻受到約16到20個堿基對的閱讀寬度的限制。然而對大多數(shù)生物體而言,該序列長度卻足以使序列和可能的基因之間建立明確的關(guān)系(20bp序列的頻率為~1×1012;與之相比,人類基因組的大小“僅”~3×109bp)。
計數(shù)相同序列的數(shù)目并相互比較頻率以分析由此得到的數(shù)據(jù)。頻繁出現(xiàn)的序列反映了高水平的表達(dá),而只出現(xiàn)一次的序列反映了低水平的表達(dá)。如果在兩個不同的時間點(X和Y)分離mRNA,可構(gòu)建單個基因按時間順序的表達(dá)模式。
實施例1自棉桃阿舒氏囊霉中分離mRNA根據(jù)已知的技術(shù)培養(yǎng)棉桃阿舒氏囊霉(營養(yǎng)培養(yǎng)基27.5g/l酵母提取物;0.5g/l硫酸鎂;50ml/l大豆油;pH7)。在發(fā)酵過程的不同時間(24h,48h和72h)取出棉桃阿舒氏囊霉的菌絲樣品,根據(jù)Sambrook等(1989)的方案分離相應(yīng)的RNA或mRNA。
實施例2MPSS的應(yīng)用利用上述的MPSS分析法分析自棉桃阿舒氏囊霉分離的mRNA。
利用統(tǒng)計分析法分析得到的數(shù)據(jù)并根據(jù)表達(dá)差異的顯著性進(jìn)行分類。這必需要進(jìn)行關(guān)于表達(dá)水平的增加和降低的檢測。對表達(dá)的改變進(jìn)行分類a)單調(diào)的改變,b)24h后改變,和c)48h后改變。
將由MPSS分析發(fā)現(xiàn)的反映了表達(dá)的改變的20bp序列作為探針與來自棉桃阿舒氏囊霉的基因文庫雜交,文庫的插入序列的平均大小約為1kb。在此處雜交溫度為約30至57℃。
實施例3自棉桃阿舒氏囊霉構(gòu)建基因組文庫為構(gòu)建基因組DNA文庫,首先通過Wright和Philippsen(Gene(1991)10999-105)及Mohr(1995,phD論文,BioZentrum universit_t Basel,瑞士)的方法分離染色體DNA。
該DNA由Sau3A部分消化。為此,利用不同量(0.1至1U)Sau3A酶消化6μg基因組DNA。在蔗糖密度梯度中分級分離DNA片斷。分離1kb區(qū)并進(jìn)行QiaEx提取。最大的片段與BamHI切割的載體pRS416(Sikorski和Hieter,Genetics(1988)122;19-27)連接(90ng BamHI切割的脫磷酸化載體;198ng插入DNA;5ml水;2μl的10×連接緩沖液;1U連接酶)。該連接混合物用于轉(zhuǎn)化大腸桿菌實驗室菌株XL-1 blue,產(chǎn)生的克隆用于鑒定該插入序列。
實施例4有序基因文庫的制備(芯片技術(shù))將棉桃阿舒氏囊霉基因文庫的約25,000個菌落(相當(dāng)于對該基因組的約3倍覆蓋)有序地轉(zhuǎn)移至尼龍膜然后由Sambrook等(1989)描述的菌落雜交法處理。從Mpss分析法發(fā)現(xiàn)的20bp序列合成寡核苷酸并用放射性32P標(biāo)記。在每種情況下組合10個標(biāo)記的熔點相似的寡核苷酸并一起與該尼龍膜雜交。雜交并洗滌后,由放射自顯影鑒定出陽性克隆,并直接由PCR測序法分析。
由此方法鑒定出包含內(nèi)部名稱為″Oligo 28″的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Yta7”或TBP7具有顯著同源性的克隆。該插入序列具有SEQ ID NO1顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo45″的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“p39”或“Tif34”具有顯著同源性的克隆。該插入序列具有SEQ ID NO6顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 85″的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Rpl35a”具有顯著同源性的克隆。該插入序列具有SEQ ID NO12顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 133″的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Nop13”具有顯著同源性的克隆。該插入序列具有SEQ ID NO17顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 172″的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Sua5”具有顯著同源性的克隆。該插入序列具有SEQ ID NO21顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 63″的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Rps25a”具有顯著同源性的克隆。該插入序列具有SEQ ID NO26顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 132″的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Nic96”具有顯著同源性的克隆。該插入序列具有SEQ ID NO31顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 174″的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Ahc1”具有顯著同源性的克隆。該插入序列具有SEQ ID NO38顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 51″的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Rok1”具有顯著同源性的克隆。該插入序列具有SEQID NO42顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 30″的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Rpa34”具有顯著同源性的克隆。該插入序列具有SEQ ID NO48顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 124″的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Sub2”具有顯著同源性的克隆。該插入序列具有SEQ ID NO53顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 139”的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“DCP1”具有顯著同源性的克隆。該插入序列具有SEQ ID NO58顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 144”的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“PRT1”具有顯著同源性的克隆。該插入序列具有SEQ ID NO63顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 168”的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Rrp9”具有顯著同源性的克隆。該插入序列具有SEQ ID NO67顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 160”的插入序列并與來自釀酒酵母的MIPS標(biāo)簽“Rpl8b”具有顯著同源性的克隆。該插入序列具有SEQ ID NO72顯示的核酸序列。
由此方法還鑒定出包含內(nèi)部名稱為″Oligo 18”的插入序列的克隆。該插入序列具有SEQ ID NO75所示的核酸序列(SEQ ID NO74的互補序列)。可能的ORF位于SEQ ID NO75的第958位和1272位之間。
實施例5由BLASTX查詢法分析序列數(shù)據(jù)對所得核酸序列的分析,即通過功能性氨基酸序列推斷出其功能,由BLASTX查詢法在序列數(shù)據(jù)庫中進(jìn)行。幾乎所有發(fā)現(xiàn)的氨基酸序列同系物均與釀酒酵母(面包酵母)有關(guān)。由于該生物的全部序列已被測定,有關(guān)這些基因的更詳細(xì)的信息可查閱http//www.mips.gsf.de/proj/yeast/search/code search.htm。
由此發(fā)現(xiàn)了與釀酒酵母氨基酸片段的如下同源性。相應(yīng)的比對情況見附圖1至15。
a)來自SEQ ID NO1的氨基酸序列(相應(yīng)于核苷酸第3至374位和第373位至1479位)與釀酒酵母26S蛋白酶體亞基或TAT結(jié)合同系物7(TBP7)具有顯著的序列同源性。相應(yīng)的比對顯示于圖1。SEQ ID NO2和SEQ ID NO3均顯示了本發(fā)明的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有26S蛋白酶體亞基或TAT結(jié)合同系物7(TBP7)的功能。
b)來自SEQ ID NO6的氨基酸序列(參見,SEQ ID NO7;相應(yīng)于SEQ ID NO6中的核苷酸第5至463位)與釀酒酵母翻譯起始因子(EIF3)的亞基(P39)具有顯著的序列同源性。相應(yīng)的比對顯示于圖2。SEQ IDNO8和SEQ ID NO9均顯示了本發(fā)明的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有翻譯起始因子亞基的功能。
c)來自SEQ ID NO12的編碼鏈的氨基酸序列與釀酒酵母核糖體蛋白具有顯著的序列同源性。圖3描繪了來自該編碼鏈(相當(dāng)于SEQ ID NO12中的第469位至第825位核苷酸)的氨基酸部分序列與該釀酒酵母蛋白的部分序列。SEQ ID NO13顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有核糖體蛋白的功能。
d)來自SEQ ID NO17的相應(yīng)互補鏈的氨基酸序列與釀酒酵母核仁蛋白具有顯著的序列同源性。圖4描繪了來自該互補鏈(相當(dāng)于SEQ IDNO17的第114位至第1位核苷酸)的氨基酸部分序列與該釀酒酵母蛋白的部分序列。SEQ ID NO18顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有核仁蛋白的功能。
e)來自SEQ ID NO21編碼鏈的氨基酸序列與釀酒酵母翻譯起始蛋白具有顯著的序列同源性。圖5A描繪了來自該編碼鏈(相當(dāng)于SEQ ID NO21中的第2位至第349位核苷酸)的氨基酸部分序列與此釀酒酵母蛋白的部分序列。圖5B描繪了來自該編碼鏈(相當(dāng)于SEQ ID NO21中的第336位至第947位核苷酸)的另一氨基酸部分序列與此釀酒酵母蛋白的部分序列。SEQ ID NO22和SEQ ID NO23各顯示一種N端延長的氨基酸部分序列。
因此可以推斷發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有翻譯起始蛋白的功能。
f)來自SEQ ID NO26相應(yīng)互補鏈的氨基酸序列與釀酒酵母核糖體蛋白S31的前體具有顯著的序列同源性。圖6A描繪了來自該互補鏈(相當(dāng)于SEQ ID NO26的第609位至第562位核苷酸)的氨基酸部分序列與此釀酒酵母蛋白的部分序列。圖6B描繪了來自該互補鏈(相當(dāng)于SEQ IDNO26中的第556位至第401位核苷酸)的另一氨基酸部分序列與此釀酒酵母蛋白的部分序列。SEQ ID NO27和SEQ ID NO28各顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有核糖體蛋白S31的前體的功能。
g)來自SEQ ID NO31的氨基酸序列(參見,SEQ ID NO32,相應(yīng)于SEQ ID NO31的第108位至第764位核苷酸)與釀酒酵母細(xì)胞核孔蛋白具有顯著的序列同源性。圖7描繪了相應(yīng)的比對。序列SEQ ID NO33至SEQ ID NO35顯示了本發(fā)明的其它氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有細(xì)胞核孔蛋白的功能。
h)來自SEQ ID NO38相應(yīng)互補鏈的氨基酸序列與釀酒酵母ADH-組蛋白乙酰轉(zhuǎn)移酶復(fù)合物的成分具有顯著的序列同源性。圖8描繪了來自該互補鏈(相當(dāng)于SEQ ID NO38的第174位至第1位核苷酸)的氨基酸部分序列與該釀酒酵母蛋白的部分序列。SEQ ID NO39顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有ADH-組蛋白乙酰轉(zhuǎn)移酶復(fù)合物的成分的功能。
i)來自SEQ ID NO42相應(yīng)互補鏈的氨基酸序列與釀酒酵母參與RNA加工的RNA解螺旋酶具有顯著的序列同源性。圖9A描繪了來自該互補鏈(相當(dāng)于SEQ ID NO42的第1086位至第1 012位核苷酸)的氨基酸部分序列與此釀酒酵母酶的部分序列。圖9B描繪了來自該互補鏈(相當(dāng)于SEQID NO42中的第1022位至第915位核苷酸)的另一氨基酸部分序列與此釀酒酵母酶的部分序列。圖9C描繪了來自該互補鏈(相當(dāng)于SEQ ID NO42的第925位至第689位核苷酸)的再一氨基酸部分序列與此釀酒酵母酶的部分序列。SEQ ID NO43,SEQ ID NO44和SEQ ID NO45均顯示了N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有參與RNA加工的RNA解旋酶的功能。
k)來自SEQ ID NO48編碼鏈的氨基酸序列與釀酒酵母RNA pol I的非必需組分具有顯著的序列同源性。圖10A描繪了來自該鏈(相當(dāng)于SEQID NO48的第1位至第102位核苷酸)的氨基酸部分序列與該釀酒酵母蛋白的部分序列。圖10B描繪了來自該鏈(相當(dāng)于SEQ ID NO48的第122位至第400位核苷酸)的另一氨基酸部分序列與該釀酒酵母蛋白的部分序列。SEQ ID NO49和SEQ ID NO50均顯示本發(fā)明的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有RNA pol I非必需組分的功能。
l)來自SEQ ID NO53編碼鏈的氨基酸序列與釀酒酵母RNA解旋酶具有顯著的序列同源性。圖11A描繪了來自該編碼鏈(相當(dāng)于SEQ ID NO53第2位至148位核苷酸)的氨基酸部分序列與該釀酒酵母酶的部分序列。圖11B描繪了來自該編碼鏈(相當(dāng)于SEQ ID NO53第150位至185位核苷酸)的另一氨基酸部分序列與該釀酒酵母酶的部分序列。SEQ ID NO54和SEQ ID NO55各顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有RNA解旋酶的功能。
m)來自SEQ ID NO58的編碼鏈的氨基酸序列與釀酒酵母mRNA脫帽酶具有顯著的序列同源性。圖12描繪了來自該編碼鏈(相當(dāng)于SEQ IDNO58的第2位至第82位核苷酸)的氨基酸部分序列與該釀酒酵母酶的部分序列。SEQ ID NO59顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有mRNA脫帽酶的功能。
n)來自SEQ ID NO63的編碼鏈的氨基酸序列與釀酒酵母翻譯起始因子eIF3的亞基具有顯著的序列同源性。圖13描繪了來自該編碼鏈(相應(yīng)于SEQ ID NO63的第21位至第695位核苷酸)的氨基酸部分序列與該釀酒酵母蛋白的部分序列。SEQ ID NO64顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有翻譯起始因子eIF3的亞基的功能。
o)來自SEQ ID NO67的編碼鏈的氨基酸序列與釀酒酵母參與前核糖體RNA加工的U3核仁小核糖核蛋白相關(guān)蛋白具有顯著的序列同源性。圖14A描繪了來自該編碼鏈(相當(dāng)于SEQ ID NO67第1位至111位核苷酸)的氨基酸部分序列與該釀酒酵母蛋白的部分序列。圖14B描繪了來自該編碼鏈(相當(dāng)于SEQ ID NO67第144位至887位核苷酸)的氨基酸部分序列與該釀酒酵母蛋白的部分序列。SEQ ID NO68和SEQ ID NO69各顯示一種N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有參與前核糖體RNA加工的U3核仁小核糖核蛋白相關(guān)蛋白的功能。
p)來自SEQ ID NO72相應(yīng)互補鏈的氨基酸序列與釀酒酵母核糖體蛋白(L7a.e.B/60 S大亞基)具有顯著的序列同源性。圖15描繪了來自該互補鏈(相當(dāng)于SEQ ID NO72第508位至176位核苷酸)的氨基酸部分序列與該釀酒酵母蛋白的部分序列。SEQ ID NO73顯示N端延長的氨基酸部分序列。
因此可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有核糖體蛋白(L7a.e.B/60 S大亞基)的功能。
實施例6全長DNA的分離a)構(gòu)建棉桃阿舒氏囊霉基因文庫從100ml在液體MA2培養(yǎng)基(10克葡萄糖,10克蛋白胨,1克酵母提取物,0.3g肌醇,加至1000ml)中生長兩天的棉桃阿舒氏囊霉培養(yǎng)物制備高分子量細(xì)胞總DNA。濾出菌絲體,并用蒸餾水洗兩遍,懸浮于10ml包含1M山梨糖醇、20mM EDTA和20mg酶解酶20T的溶液中,并于27℃下孵育、輕振30至60分鐘。將原生質(zhì)體懸液調(diào)整至包含50mMTris-HCl,pH7.5,150mM NaCl,100mM EDTA和0.5%濃度的十二烷基硫酸鈉(SDS),并于65℃下孵育20分鐘。經(jīng)過兩次酚/氯仿(體積比1∶1)萃取,用異丙醇沉淀DNA,懸浮于TE緩沖液中,經(jīng)RNA酶的處理后再次用異丙醇沉淀并懸浮于TE緩沖液中。
根據(jù)大小選出并由Sau3A部分消化的基因組DNA與粘粒載體Super-Cos1(Stratagene)的去磷酸化臂連接產(chǎn)生棉桃阿舒氏囊霉粘?;蛭膸臁uper-Cos1載體在兩個cos位點間經(jīng)Xbal消化打開并用牛小腸堿性磷酸酶(Boehringer)去磷酸化,接著用BamHI打開克隆位點。該連接在20μl包含2.5μg部分消化的染色體DNA,1μg Super-Cos1載體臂,40mMTris-HCl,pH7.5,10mM MgCl2,1mM二硫蘇糖醇,0.5mM ATP和2Weiss單位T4-DNA連接酶(Boehringer)的混合液中、15℃下過夜進(jìn)行。利用提取物和Stratagene的方案(Gigapack II Packaging Extract)在體外包裝連接產(chǎn)物。將包裝產(chǎn)物用于感染大腸桿菌NM554(recA13,araD139,Δ(ara,leu)7696,Δ(lac)17A,galU,galK,hsrR,rps(strr),mcrA,mcrB)并涂布在含有氨芐青霉素(50μg/ml)的LB板上。獲得含有長度平均為30-45kb的棉桃阿舒氏囊霉插入片段的轉(zhuǎn)化體。
b)粘?;蛭膸斓膬Υ婧秃Y選將共4×104個新鮮單菌落各自單獨地接種于96孔微量滴定板(Falcon,No.3072)孔中的100μl LB培養(yǎng)基中,所述LB培養(yǎng)基補充有凍存液(36mM K2HPO4/13.2mM KH2PO4,、1.7mM檸檬酸鈉、0.4mMMgSO4、6.8mM(NH4)2SO4,、4.4%(w/v)甘油)和氨芐青霉素(50μg/ml),37℃下振搖過夜生長之后在-70℃下冷凍??焖偃诮獾味ò宀⒂媒?jīng)酒精浴消毒隨后在熱板上蒸發(fā)去除酒精的96孔復(fù)制板在新鮮培養(yǎng)基中進(jìn)行復(fù)制。在冷凍前和解凍后(采取其它所有措施前),在微量滴定板振蕩器(Infors)中短暫振蕩這些板子以保證該細(xì)胞懸液的均勻。利用能夠?qū)⑸倭恳后w自96孔微量滴定板轉(zhuǎn)移至尼龍膜的自動機械系統(tǒng)(Bio-Robotics)將單克隆置于尼龍膜上(GeneScreen Plus,New England Nuclear)。當(dāng)培養(yǎng)物自96孔微量滴定板轉(zhuǎn)移后(1920個克隆),該膜被置于22×22厘米培養(yǎng)皿(Nunc)中含有氨芐青霉素(50μg/ml)的LB瓊脂表面上并在37℃下孵育過夜。細(xì)胞匯合前,用Herrmann,B.G.,Barlow,D.P和Lehrach,H.(1987),Cell 48,pp.813-825描述的方法處理這些膜,包括第一個變性步驟后的附加處理,即于沸水浴上飽含變性溶液的墊子上方將濾膜暴露于蒸氣5分鐘。
利用隨機六聚體引物標(biāo)記法(Feinberg,A.P.和Vogelstein,B.(1983),Anal.Biochem.132,pp.6-13)、通過[α-32P]dCTP的攝取,得到高比活的標(biāo)記雙鏈探針。這些膜經(jīng)過預(yù)雜交后在42℃下、于含有50%(vol/vol)甲酰胺、600 mM磷酸鈉、pH7.2、1mM EDTA、10%硫酸葡聚糖、1%SDS和10x Denhardt氏液、鮭魚精子DNA(50μg/ml)以及32P標(biāo)記的探針(0.5-1×106cpm/ml)的溶液中雜交6至12小時。典型地,在55至65℃下、13至30mM NaCl、1.5至3 mM檸檬酸鈉、pH6.3、0.1%SDS中洗滌約1小時,濾膜在-70℃用柯達(dá)增感屏放射自顯影12至24小時。至今,每張膜均已被成功重復(fù)使用20次以上。在95℃下、2mM Tris-HCl,pH8.0,0.2mM EDTA,0.1%SDS中孵育2×20分鐘剝離濾膜上的探針。
c)從存儲的基因文庫中回收陽性菌落用無菌一次性柳葉刀將微量滴定板孔中的冰凍細(xì)菌培養(yǎng)物刮出,并在含有氨芐青霉素(50μg/ml)的LB瓊脂培養(yǎng)皿上劃線。單菌落接種于液體培養(yǎng)基中通過堿裂解法產(chǎn)生DNA(Birnboim,H.C.和Doly,J.(1979),NucleicAcids Res.7,pp.1513-1523)。
d)全長DNA如上述可鑒定出包含具有正確的完全序列的插入片段的克隆。這些克隆的內(nèi)部名稱為“Oligo 28v”,包含完全序列的插入片斷具有SEQ ID NO4中所示的核酸序列。
“Oligo 45v”,包含完全序列的插入片斷具有SEQ ID NO10中所示的核酸序列。
“Oligo 85v”,包含完全序列的插入片斷具有SEQ ID NO14中所示的核酸序列。由該序列編碼的蛋白優(yōu)選包含SEQ ID NO15和16中顯示的至少一種氨基酸序列。
“Oligo 133v”,包含完全序列的插入片斷具有SEQ ID NO19中所示的核酸序列。
“Oligo 172v”,包含完全序列的插入片斷具有SEQ ID NO24中所示的核酸序列。
“Oligo 63v”,包含完全序列的插入片斷具有SEQ ID NO29中所示的核酸序列。
“Oligo 132v”,包含完全序列的插入片斷具有SEQ ID NO36中所示的核酸序列。
“Oligo 174v”,包含完全序列的插入片斷具有SEQ ID NO40中所示的核酸序列。
“Oligo 51v”,包含完全序列的插入片斷具有SEQ ID NO46中所示的核酸序列。
“Oligo 30v”,包含完全序列的插入片斷具有SEQ ID NO51中所示的核酸序列。
“Oligo 124v”,包含完全序列的插入片斷具有SEQ ID NO56中所示的核酸序列。
“Oligo 139v”,包含完全序列的插入片斷具有SEQ ID NO60中所示的核酸序列。由該序列編碼的蛋白優(yōu)選包含SEQ ID NO61和62中顯示的至少一種氨基酸序列。
“Oligo 144v”,包含完全序列的插入片斷具有SEQ ID NO65中所示的核酸序列。
“Oligo 168v”,包含完全序列的插入片斷具有SEQ ID NO70中所示的核酸序列。
“Oligo 18v”,包含完全序列的插入片斷具有SEQ ID NO77中所示的核酸序列。
實施例7檢測Oligo 18對維生素B2生產(chǎn)的調(diào)節(jié)作用為測定在Oligo 18的可能閱讀框架附近整合DNA是否對核黃素的合成有不利影響,通過同源重組將DNA片段整合入所用的棉桃阿舒氏囊霉菌株基因組(阿舒氏囊霉TEF啟動子+G418抗性基因-參見圖1)。通過已知的電穿孔方式進(jìn)行轉(zhuǎn)化。使用圖1所示的引物對通過PCR鑒定陽性轉(zhuǎn)化體。在搖瓶實驗和實驗室發(fā)酵中研究了一個轉(zhuǎn)化體的維生素B2生產(chǎn),在該轉(zhuǎn)化體中可探測到在所述位點的特異整合。發(fā)現(xiàn)該DNA片段的整合使核黃素的生產(chǎn)增加(大約3%)。TEF-G418構(gòu)建體中的信息不可能是原因。因此推斷存在位置效應(yīng)。
測定核黃素的搖瓶試驗在100ml的雙擋板三角瓶中的10ml預(yù)培養(yǎng)基(9.5ml[9.5g]培養(yǎng)基+0.5ml大豆油)中接種0.5ml甘油培養(yǎng)物或約一個接種環(huán)的取自SP瓊脂板上生長良好的5日齡菌絲體,以180rpm(箱式搖床,振幅2.5cm)在28℃下振搖40小時。
在250ml三角燒瓶中將1.1ml該培養(yǎng)物接種于25.7ml主要培養(yǎng)基(21.2ml[21.2g]培養(yǎng)基,1ml尿素[10g/45ml]+3.5ml[3.2g]大豆油,終體積=26.8ml,其中4.4ml補償無加濕振搖過程中的蒸發(fā))或21.8ml主要培養(yǎng)基(17.3ml[17.3g]培養(yǎng)基,1ml尿素[10g/45ml]+3.5ml[3.2g]大豆油,終體積=22.9ml,其中0.5ml補償無人工加濕環(huán)境下振搖過程中的蒸發(fā))并以220rpm(工業(yè)搖床,振幅5cm)或以300rpm(箱式搖床,振幅2.5cm)在28℃下振搖5天。
在試管中劇烈振搖0.5ml主要培養(yǎng)物和4.5ml[5g]40%濃度的煙酰胺溶液的混合物(稀釋倍數(shù)10)或0.25ml主要培養(yǎng)物和4.75ml[5.27g]40%濃度的煙酰胺溶液的混合物(稀釋倍數(shù)20)并于70℃水浴中孵育大約2×20分種(使細(xì)胞裂解,在其間振搖).冷卻后,將40μl置于一次性大比色池中,與3ml去離子水混合,并在光度計中盡快測定,因為維生素B2會很快分解。這需要測量在402,446和550nm下的消光值,計算方法如下V=(W1-W2×C+W3×(C-1))∶(B1-B2×C)其中,B1 =17.36[常數(shù)]B2 =31.15 [常數(shù)]K =比色池容積ml[標(biāo)準(zhǔn)值=3.04ml]P =樣品體積ml[標(biāo)準(zhǔn)值=0.04ml]F =稀釋倍數(shù)[標(biāo)準(zhǔn)值=10,即0.5ml∶5ml]C =修正因子[(550-405)/(550-450)=1.45]W1 =402nm的消光值W2 =446nm的消光值W3 =550nm的消光值->V=(W1-1.45W2+0.45W3)∶-27.8075維生素B2濃度=V×K∶P×F
=V×3.04∶0.04×10=V×760使用這些值時也必需考慮到培養(yǎng)基在振蕩過程中的蒸發(fā)G1=緊接于接種后三角瓶的重量G2=采樣前三角瓶的重量KV1=具有補償蒸發(fā)的培養(yǎng)基體積[22.4ml+4.4ml=26.8ml]KV2=培養(yǎng)基的體積[22.4ml]B2=以前計算的未修正的維生素B2濃度維生素B2濃度(修正后)=((KV1-(G1-G2))∶KV2)×B2=((26.8-(G1-G2))∶22.4)×B2根據(jù)上述研究,可以推斷出發(fā)現(xiàn)的該棉桃阿舒氏囊霉核酸序列具有調(diào)節(jié)維生素B2生產(chǎn)力的蛋白的功能。
表1序列綜覽
序列表序列表<110> 巴斯福股份公司(BASF Aktiengesellschaft)<120> 來自棉桃阿舒氏囊霉的與轉(zhuǎn)錄、RNA加工和/或翻譯機制相關(guān)的新基因產(chǎn)物<130> M/42319/PCT<160> 78<170> PatentIn version 3.1<210> 1<211> 1481<212> DNA<213> 棉桃阿舒氏囊霉(Ashbya gossypii)<220>
<221> misc_feature<223> Oligo 28<220>
<221> misc_feaure<222> (151)..(151)<223> 未知氨基酸<400> 1gatctttgaa aacgaatgar agagtgttac ttttagctat tgcggaaggc ttcaccgaag60aagagttaca taacacacct ttgtcgttat ttggctttga cctgaatatt gkctctatta120gagaaccaty tacttgccca aagacacaac ntacttcaaa actctkgaag agttacctga180aaatgaagcc cactaagttt cgagagaaga ggaaaagaaa aaagccactg ccggtcctac240ccgtgtgcga tactcccagc aacgatgata tyggttctga tggtgaactm ttaaccgaag300acgaaaagty gaggaggaag ttaaaatcat accatcacca agacatgaaa ttgaagaata360ctttgaagat aaaagctttc cggtctgatg gatctattta aggggcgtta taaaagattt420aggaaaccgc ccattgagga ttccttgctt attcatctat ttgaaccaga agcctatgcc480tcaaatcctg aatggcaacc ggcttatgta agagaagatg acatgatttt agaagtttca540accggcagga agtactacaa tatggatttg gatattatag aagaaaggtt gtggaacggg600tattactctg aaccgaaaca gtatttgaag gatatcgagt taatttaccg cgatgctaat660acaactggtg accgagagcg tataataaaa gcgtcagaga tgtttgcaaa cgcacagatg720ggcattgaag aaatatatac gcctgagctt atccaggagt gcagggatac acgtcaaaga780gaactattaa ggcagcagtt gtatttacgc gaccagcaga aaaagataca cgaggaagaa840gctaagctcg agcaggagaa aaaggatccg acttttccaa atgacgataa tcatccagaa900gaggccgact taagcgttgg ggctggacag caattgcata gcccatcaca aatgtctcat960gaggcttgtg aaagccacgc agaagatgga ctgggggtac cacatggctt tgaaaataac1020
acatatgcta ttggagataa cacaccagag acgatcgata acgggtctcc taaacccyta1080gaggactttt gcggggaaga caagactgtc cctgacgaca aatccgtgcc agaacgattt1140gttcaagagg gagaagcttc tgagatgggc tttatcccga aaacaccttc cgccagaccc1200gtctccatgc actcaaatcc atcaagcaaa gaatccgtag ttgctcctat gcaaaagact1260gggttagaag tgaacagtat cgaggacacg tcagtcgctg ttcaatcaga actgacccgc1320gatgaagact tacccatgac tcctgaaccg gcctttatcc tggatgaaac cgttttagcg1380aaaataatct cgatgttgaa aacaaaaaca cagggattta cagtcgaaca gctggaaaca1440tgctatgctg ccgtactgga gctagtatgg gaggcgagat c1481<210> 2<211> 124<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 28<220>
<221> misc_feature<222> (37)..(37)<223> 未知氨基酸<220>
<221> misc_feature<222> (43)..(43)<223> 未知氨基酸<220>
<221> misc_feature<222> (50)..(50)<223> 未知氨基酸<220>
<221> misc_feature<222> (55)..(55)<223> 未知氨基酸<220>
<221> misc_feature<222> (103)..(103)<223> 未知氨基酸<400> 2Ser Leu Lys Thr Asn Glu Arg Val Leu Leu Leu Ala Ile Ala Glu Gly5 10 15
Phe Thr Glu Glu Glu Leu His Asn Thr Pro Leu Ser Leu Phe Gly Phe20 25 30Asp Leu Asn Ile Xaa Ser Ile Arg Glu Pro Xaa Thr Cys Pro Lys Thr35 40 45Gln Xaa Thr Ser Lys Leu Xaa Lys Ser Tyr Leu Lys Met Lys Pro Thr50 55 60Lys Phe Arg Glu Lys Arg Lys Arg Lys Lys Pro Leu Pro Val Leu Pro65 70 75 80Val Cys Asp Thr Pro Ser Asn Asp Asp Ile Gly Ser Asp Gly Glu Leu85 90 95Leu Thr Glu Asp Glu Lys Xaa Arg Arg Lys Leu Lys Ser Tyr His His100 105 110Gln Asp Met Lys Leu Lys Asn Thr Leu Lys Ile Lys115 120<210> 3<211> 369<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 28<400> 3Lys Leu Ser Gly Leu Met Asp Leu Phe Lys Gly Arg Tyr Lys Arg Phe1 5 10 15Arg Lys Pro Pro Ile Glu Asp Ser Leu Leu Ile His Leu Phe Glu Pro20 25 30Glu Ala Tyr Ala Ser Asn Pro Glu Trp Gln Pro Ala Tyr Val Arg Glu35 40 45Asp Asp Met Ile Leu Glu Val Ser Thr Gly Arg Lys Tyr Tyr Asn Met50 55 60Asp Leu Asp Ile Ile Glu Glu Arg Leu Trp Asn Gly Tyr Tyr Ser Glu65 70 75 80Pro Lys Gln Tyr Leu Lys Asp Ile Glu Leu Ile Tyr Arg Asp Ala Asn85 90 95
Thr Thr Gly Asp Arg Glu Arg Ile Ile Lys Ala Ser Glu Met Phe Ala100 105 110Asn Ala Gln Met Gly Ile Glu Glu Ile Ser Thr Pro Glu Leu Ile Gln115 120 125Glu Cys Arg Asp Thr Arg Gln Arg Glu Leu Leu Arg Gln Gln Leu Tyr130 135 140Leu Arg Asp Gln Gln Lys Lys Ile His Glu Glu Glu Ala Lys Leu Glu145 150 155 160Gln Glu Lys Lys Asp Pro Thr Phe Pro Asn Asp Asp Asn His Pro Glu165 170 175Glu Ala Asp Leu Ser Val Gly Ala Gly Gln Gln Leu His Ser Pro Ser180 185 190Gln Met Ser His Glu Ala Cys Glu Ser His Ala Glu Asp Gly Leu Gly195 200 205Val Pro His Gly Phe Glu Asn Asn Thr Tyr Ala Ile Gly Asp Asn Thr210 215 220Pro Glu Thr Ile Asp Asn Gly Ser Pro Lys Pro Leu Glu Asp Phe Cys225 230 235 240Gly Glu Asp Lys Thr Val Pro Asp Asp Lys Ser Val Pro Glu Arg Phe245 250 255Val Gln Glu Gly Glu Ala Ser Glu Met Gly Phe Ile Pro Lys Thr Pro260 265 270Ser Ala Arg Pro Val Ser Met His Ser Asn Pro Ser Ser Lys Glu Ser275 280 285Val Val Ala Pro Met Gln Lys Thr Gly Leu Glu Val Asn Ser Ile Glu290 295 300Asp Thr Ser Val Ala Val Gln Ser Glu Leu Thr Arg Asp Glu Asp Leu305 310 315 320Pro Met Thr Pro Glu Pro Ala Phe Ile Leu Asp Glu Thr Val Leu Ala325 330 335Lys Ile Ile Ser Met Leu Lys Thr Lys Thr Gln Gly Phe Thr Val Glu340 345 350
Gln Leu Glu Thr Cys Tyr Ala Ala Val Leu Glu Leu Val Trp Glu Ala355 360 365Arg<210> 4<211> 4670<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (245)..(4222)<223>
<220>
<221> misc_feature<223> Oligo 28<400> 4tctcgttccg aagctgaggc tggatacgaa tatcaccata tacgaaggcc ccgccacccc60gagaaaggca tttttcccct ttgaaatggg ttatgtgacg atgttcatga gttgtgcaga120aaagcaggga gggaaagacg agtcattagc atcgaagggc agcattgtgt agtcttagtg180tcgtattttt ggatctgcaa taggtttttg atttatctct cggtcttcga tttgatagag240aatc atg gcg cgt cat aca agg aga tcg cat cag cac gtg aac gac gaa 289Met Ala Arg His Thr Arg Arg Ser His Gln His Val Asn Asp Glu1 5 10 15gat aca ggt agc gaa ata tac gat aaa aat ggg atc aag cac acg acg 337Asp Thr Gly Ser Glu Ile Tyr Asp Lys Asn Gly Ile Lys His Thr Thr20 25 30ccg agg tcg ctg aag aag atc aat tac gcg gaa atc gaa aac agt tac 385Pro Arg Ser Leu Lys Lys Ile Asn Tyr Ala Glu Ile Glu Asn Ser Tyr35 40 45gat tat atg gag gac tac gat gaa gga gac aag gaa gag gag cct gca 433Asp Tyr Met Glu Asp Tyr Asp Glu Gly Asp Lys Glu Glu Glu Pro Ala50 55 60gaa ctg gag aac aac ggg cgg agc aag gga ctg gta ggc cgc gag cgc 481Glu Leu Glu Asn Asn Gly Arg Ser Lys Gly Leu Val Gly Arg Glu Arg65 70 75ggg cgg gag ccg gag gag gac gag gac gag gag ggg cca gtc cgg ggg 529Gly Arg Glu Pro Glu Glu Asp Glu Asp Glu Glu Gly Pro Val Arg Gly80 85 90 95cgg cgc agc cgg aaa cgc act tat gtg gat gtg gag gag gac gag agc 577Arg Arg Ser Arg Lys Arg Thr Tyr Val Asp Val Glu Glu Asp Glu Ser100 105 110ttc cac gag gag gag gcg gag gac gag gac gag gag gcg ctg gac gac 625Phe His Glu Glu Glu Ala Glu Asp Glu Asp Glu Glu Ala Leu Asp Asp115 120 125
gat gag gac gag gac gag gag gag cgg aac tgg cgg cgg cgg cgc gag 673Asp Glu Asp Glu Asp Glu Glu Glu Arg Asn Trp Arg Arg Arg Arg Glu130 135 140cac cag ttt gtt gta gag gac gag gat gat gac gag gac gag gag gac 721His Gln Phe Val Val Glu Asp Glu Asp Asp Asp Glu Asp Glu Glu Asp145 150 155gac tat gga gca cag aaa aaa cgc ggc agg cgg cgg acc cgg cgt ggc 769Asp Tyr Gly Ala Gln Lys Lys Arg Gly Arg Arg Arg Thr Arg Arg Gly160 165 170 175agg tcg cgg cta aca gag cgg cgt tcg ccg cca cgc aag ctg cgg aca 817Arg Ser Arg Leu Thr Glu Arg Arg Ser Pro Pro Arg Lys Leu Arg Thr180 185 190cgc cgg acg cga tcg tct gtg aac atg tat gac agt gag cat gac ggg 865Arg Arg Thr Arg Ser Ser Val Asn Met Tyr Asp Ser Glu His Asp Gly195 200 205act ggc gaa gcg ttg acg ctg gag gac gag att cgg gaa ctg cag gag 913Thr Gly Glu Ala Leu Thr Leu Glu Asp Glu Ile Arg Glu Leu Gln Glu210 215 220gat tcg ccc atc cgc gag aaa cgg tcg ctg cgg gag cgc aca aag ccg 961Asp Ser Pro Ile Arg Glu Lys Arg Ser Leu Arg Glu Arg Thr Lys Pro225 230 235gta aat tac acg ctg ccc cca ccc ctg act gat aac caa atg aac gtt 1009Val Asn Tyr Thr Leu Pro Pro Pro Leu Thr Asp Asn Gln Met Asn Val240 245 250 255gat ggc act gct gca cca gcg tac ggg agc ttc cat tct ccc aga ggc 1057Asp Gly Thr Ala Ala Pro Ala Tyr Gly Ser Phe His Ser Pro Arg Gly260 265 270aag cgt ggg cta cac tcg gga caa agt ttt gga cct atc agg cga ttg 1105Lys Arg Gly Leu His Ser Gly Gln Ser Phe Gly Pro Ile Arg Arg Leu275 280 285ttt cca acg ggc ggc cct ttc ggc gga aac gat gtg aca gct ata ttc 1153Phe Pro Thr Gly Gly Pro Phe Gly Gly Asn Asp Val Thr Ala Ile Phe290 295 300ggc cac aac acc aac ttt tat gca acg gct caa gat ccg act gtg gcc 1201Gly His Asn Thr Asn Phe Tyr Ala Thr Ala Gln Asp Pro Thr Val Ala305 310 315aat aac aag ttt atc gat tcg gac tct tca gat gac gaa att ttg ccg 1249Asn Asn Lys Phe Ile Asp Ser Asp Ser Ser Asp Asp Glu Ile Leu Pro320 325 330 335ctg gga agt acc ccc aaa cca aaa agc tcc gaa gct aag aaa aag aaa 1297Leu Gly Ser Thr Pro Lys Pro Lys Ser Ser Glu Ala Lys Lys Lys Lys340 345 350aag ccg gag att gca gat ctg gat ccg tta gga gta gat atg aat att 1345Lys Pro Glu Ile Ala Asp Leu Asp Pro Leu Gly Val Asp Met Asn Ile355 360 365aat ttt gat gac att ggc ggt ctg gat aac tac ata gac cag ctg aag 1393Asn Phe Asp Asp Ile Gly Gly Leu Asp Asn Tyr Ile Asp Gln Leu Lys370 375380gag atg gtt gcg ttg ccg tta ctc tat ccg gag ctc tat caa aat ttc 1441Glu Met Val Ala Leu Pro Leu Leu Tyr Pro Glu Leu Tyr Gln Asn Phe
385 390 395aac atc aca cct ccg cgt ggt gtg ctc ttc tat ggg cca cca ggt acg 1489Asn Ile Thr Pro Pro Arg Gly Val Leu Phe Tyr Gly Pro Pro Gly Thr400 405 410 415ggt aag acg ctt atg gct aga gcg ttg gca gcg agc tgc tca act gaa 1537Gly Lys Thr Leu Met Ala Arg Ala Leu Ala Ala Ser Cys Ser Thr Glu420 425 430aag agg aag att acg ttc tat atg cgc aag ggg gcc gat atc ctg tcg 1585Lys Arg Lys Ile Thr Phe Tyr Met Arg Lys Gly Ala Asp Ile Leu Ser435 440 445aaa tgg gtt ggc gaa gct gag aga cag ctt cga ctg ctg ttt gag gag 1633Lys Trp Val Gly Glu Ala Glu Arg Gln Leu Arg Leu Leu Phe Glu Glu450 455 460gct aag aag cac cag cct tcg ata att ttc ttt gac gag att gat ggc 1681Ala Lys Lys His Gln Pro Ser Ile Ile Phe Phe Asp Glu Ile Asp Gly465 470 475ctg gcc ccg gtt agg agt tca aag caa gaa caa atc cat gcc agc atc 1729Leu Ala Pro Val Arg Ser Ser Lys Gln Glu Gln Ile His Ala Ser Ile480 485 490 495gta tct acc atg ttg gcg tta atg gat gga atg gac aat agg gga caa 1777Val Ser Thr Met Leu Ala Leu Met Asp Gly Met Asp Asn Arg Gly Gln500 505 510gtg att gta atc ggt gct act aat aga ccg gat gca gta gac cct gct 1825Val Ile Val Ile Gly Ala Thr Asn Arg Pro Asp Ala Val Asp Pro Ala515 520 525tta aga cga cca ggt aga ttt gac aga gag ttt tat ttc cct ctg cct 1873Leu Arg Arg Pro Gly Arg Phe Asp Arg Glu Phe Tyr Phe Pro Leu Pro530 535 540gac ata cga gcc aga gcg aag att ctg gaa att cac acc agg aaa tgg 1921Asp Ile Arg Ala Arg Ala Lys Ile Leu Glu Ile His Thr Arg Lys Trp545 550 555cat cct cca gta tca agt gcg ttt ata gaa aag ctt gct tct ttg acg 1969His Pro Pro Val Ser Ser Ala Phe Ile Glu Lys Leu Ala Ser Leu Thr560 565 570 575aaa gga tac ggt gga gca gat ctt aga gcg cta tgt aca gag gcg gcc 2017Lys Gly Tyr Gly Gly Ala Asp Leu Arg Ala Leu Cys Thr Glu Ala Ala580 585 590tgg aat agc att cag cga aga ttc ccg caa ata tat caa agt gag gtc 2065Trp Asn Ser Ile Gln Arg Arg Phe Pro Gln Ile Tyr Gln Ser Glu Val595 600 605aag ttg gca ata aac cca agg gaa gtg cag gtt aaa gct aaa gac ttt 2113Lys Leu Ala Ile Asn Pro Arg Glu Val Gln Val Lys Ala Lys Asp Phe610 615 620atg att gct atg gaa aaa att aca ccg tct tcc gcg cgg tcg agt ggg 2161Met Ile Ala Met Glu Lys Ile Thr Pro Ser Ser Ala Arg Ser Ser Gly625 630 635aac ttg gcc gaa ccc tta cct cgt acc ata gcg gtt ctg cta aac gat 2209Asn Leu Ala Glu Pro Leu Pro Arg Thr Ile Ala Val Leu Leu Asn Asp640 645 650 655
cag ttc gag gaa ata aaa caa aaa ttg aat agc att ttg cct gaa gcg 2257Gln Phe Glu Glu Ile Lys Gln Lys Leu Asn Ser Ile Leu Pro Glu Ala660 665 670tca agt aag tct cat cgc ggt tct tcg cta att aaa gaa tac ctg gag 2305Ser Ser Lys Ser His Arg Gly Ser Ser Leu Ile Lys Glu Tyr Leu Glu675 680 685tac gaa gat gaa gaa gat gaa gaa gat gga gaa gat aat atc gaa ggc 2353Tyr Glu Asp Glu Glu Asp Glu Glu Asp Gly Glu Asp Asn Ile Glu Gly690 695 700aca ggt atc cac tcg tcg aac ggc ttc agc aga cat gaa ttt ttc aag 2401Thr Gly Ile His Ser Ser Asn Gly Phe Ser Arg His Glu Phe Phe Lys705 710 715atg ctt gat cag gct agg acc gtt aaa cca aag ttg tta ata aca ggt 2449Met Leu Asp Gln Ala Arg Thr Val Lys Pro Lys Leu Leu Ile Thr Gly720 725 730 735ccg gct ggc aat ggc caa caa tat att ggt tcc gcg ctt ttg cat cat 2497Pro Ala Gly Asn Gly Gln Gln Tyr Ile Gly Ser Ala Leu Leu His His740 745 750tta gag gat tac aat att cag aat ctt gat tta ggc aca tta ctc tcg 2545Leu Glu Asp Tyr Asn Ile Gln Asn Leu Asp Leu Gly Thr Leu Leu Ser755 760 765gaa agt tta agg aca atg gag tcc gct att gtg cag aca ttt att gag 2593Glu Ser Leu Arg Thr Met Glu Ser Ala Ile Val Gln Thr Phe Ile Glu770 775 780gcg aaa aaa cga caa cca tca gta atc tac atc cct aat gct gat att 2641Ala Lys Lys Arg Gln Pro Ser Val Ile Tyr Ile Pro Asn Ala Asp Ile785 790 795tgg tca aga acg gtc ccc gaa agt gcc ata atg acc ttg gca agc tta 2689Trp Ser Arg Thr Val Pro Glu Ser Ala Ile Met Thr Leu Ala Ser Leu800 805 810 815ttt aga tct ttg aaa acg aat gag aga gtg tta ctt tta gct att gcg 2737Phe Arg Ser Leu Lys Thr Asn Glu Arg Val Leu Leu Leu Ala Ile Ala820 825 830gaa ggc ttc acc gaa gaa gag tta cat aac aca cct ttg tcg tta ttt 2785Glu Gly Phe Thr Glu Glu Glu Leu His Asn Thr Pro Leu Ser Leu Phe835 840 845ggc ttt gac ctg aat att gtc tct att aga gaa cca tct act gcc caa 2833Gly Phe Asp Leu Asn Ile Val Ser Ile Arg Glu Pro Ser Thr Ala Gln850 855 860aga cac aac tac ttc aaa act ctc gaa gag tta ctg aaa atg aag ccc 2881Arg His Asn Tyr Phe Lys Thr Leu Glu Glu Leu Leu Lys Met Lys Pro865 870 875act aag ttt cga gag aag agg aaa aga aaa aag cca ctg ccg gta cta 2929Thr Lys Phe Arg Glu Lys Arg Lys Arg Lys Lys Pro Leu Pro Val Leu880 885 890 895ccc gtg tgc gat act ccc agc aac gat gat atc ggt tct gat ggt gaa 2977Pro Val Cys Asp Thr Pro Ser Asn Asp Asp Ile Gly Ser Asp Gly Glu900 905 910cta tta acc gaa gac gaa aag ttg agg agg aag tta aaa tca tac cat 3025Leu Leu Thr Glu Asp Glu Lys Leu Arg Arg Lys Leu Lys Ser Tyr His
915 920 925cac caa gac atg aaa ttg aag aat act ttg aag ata aag ctt tcc ggt 3073His Gln Asp Met Lys Leu Lys Asn Thr Leu Lys Ile Lys Leu Ser Gly930 935 940cta gtg gct cta ttt aag ggg cgt tat aaa aga ttt agg aaa ccg ccc 3121Leu Val Ala Leu Phe Lys Gly Arg Tyr Lys Arg Phe Arg Lys Pro Pro945 950 955att gag gat tcc ttg ctt att cat cta ttt gaa cca gaa gcc tat gcc 3169Ile Glu Asp Ser Leu Leu Ile His Leu Phe Glu Pro Glu Ala Tyr Ala960 965 970 975tca aat cct gaa tgg caa ccg gct tat gta aga gaa gat gac atg att 3217Ser Asn Pro Glu Trp Gln Pro Ala Tyr Val Arg Glu Asp Asp Met Ile980 985 990tta gaa gtt tca acc ggc agg aag tac tac aat atg gat ttg gat att3265Leu Glu Val Ser Thr Gly Arg Lys Tyr Tyr Asn Met Asp Leu Asp Ile995 1000 1005ata gaa gaa agg ttg tgg aac ggg tat tac tct gaa ccg aaa cag 3310Ile Glu Glu Arg Leu Trp Asn Gly Tyr Tyr Ser Glu Pro Lys Gln1010 1015 1020tat ttg aag gat atc gag tta att tac cgc gat gct aat aca act 3355Tyr Leu Lys Asp Ile Glu Leu Ile Tyr Arg Asp Ala Asn Thr Thr1025 1030 1035ggt gac cga gag cgt ata ata aaa gcg tca gag atg ttt gca aac 3400Gly Asp Arg Glu Arg Ile Ile Lys Ala Ser Glu Met Phe Ala Asn1040 1045 1050gca cag atg ggc att gaa gaa ata tct acg cct gag ctt atc cag 3445Ala Gln Met Gly Ile Glu Glu Ile Ser Thr Pro Glu Leu Ile Gln1055 1060 1065gag tgc agg gat aca cgt caa aga gaa cta tta agg cag cag ttg 3490Glu Cys Arg Asp Thr Arg Gln Arg Glu Leu Leu Arg Gln Gln Leu1070 1075 1080tat tta cgc gac cag cag aaa aag ata cac gag gaa gaa gct aag 3535Tyr Leu Arg Asp Gln Gln Lys Lys Ile His Glu Glu Glu Ala Lys1085 1090 1095ctc gag cag gag aaa aag gat ccg act ttt cca aat gac gat aat 3580Leu Glu Gln Glu Lys Lys Asp Pro Thr Phe Pro Asn Asp Asp Asn1100 1105 1110cat cca gaa gag gcc gac tta agc gtt ggg gct gga cag caa ttg 3625His Pro Glu Glu Ala Asp Leu Ser Val Gly Ala Gly Gln Gln Leu1115 1120 1125cat agc cca tca caa atg tct cat gag gct tgt gaa agc cac gca 3670His Ser Pro Ser Gln Met Ser His Glu Ala Cys Glu Ser His Ala1130 1135 1140gaa gat gga ctg ggg gta cca cat ggc ttt gaa aat aac aca tat 3715Glu Asp Gly Leu Gly Val Pro His Gly Phe Glu Asn Asn Thr Tyr1145 1150 1155gct att gga gat aac aca cca gag acg atc gat aac ggg tct cct 3760Ala Ile Gly Asp Asn Thr Pro Glu Thr Ile Asp Asn Gly Ser Pro1160 1165 1170
aaa ccc cta gag gac ttt tgc ggg gaa gac aag act gtc cct gac 3805Lys Pro Leu Glu Asp Phe Cys Gly Glu Asp Lys Thr Val Pro Asp1175 1180 1185gac aaa tcc gtg cca gaa cga ttt gtt caa gag gga gaa gct tct 3850Asp Lys Ser Val Pro Glu Arg Phe Val Gln Glu Gly Glu Ala Ser1190 1195 1200gag atg ggc ttt atc ccg aaa aca cct tcc gcc aga ccc gtc tcc 3895Glu Met Gly Phe Ile Pro Lys Thr Pro Ser Ala Arg Pro Val Ser1205 1210 1215atg cac tca aat cca tca agc aaa gaa tcc gta gtt gct cct atg 3940Met His Ser Asn Pro Ser Ser Lys Glu Ser Val Val Ala Pro Met1220 1225 1230caa aag act ggg tta gaa gtg aac agt atc gag gac acg tca gtc 3985Gln Lys Thr Gly Leu Glu Val Asn Ser Ile Glu Asp Thr Ser Val1235 1240 1245gct gtt caa tca gaa ctg acc cgc gat gaa gac tta ccc atg act 4030Ala Val Gln Ser Glu Leu Thr Arg Asp Glu Asp Leu Pro Met Thr1250 1255 1260cct gaa ccg gcc ttt atc ctg gat gaa acc gtt tta gcg aaa ata 4075Pro Glu Pro Ala Phe Ile Leu Asp Glu Thr Val Leu Ala Lys Ile1265 1270 1275atc tcg atg ttg aaa aca aaa aca cag gga ttt aca gtc gaa cag 4120Ile Ser Met Leu Lys Thr Lys Thr Gln Gly Phe Thr Val Glu Gln1280 1285 1290ctg gaa aca tgc tat gct gcc gta ctg gag cta gta tgg gag gcg 4165Leu Glu Thr Cys Tyr Ala Ala Val Leu Glu Leu Val Trp Glu Ala1295 1300 1305aga tcg tca tgg gat aaa aca agt gtc att aag caa ata gaa aaa 4210Arg Ser Ser Trp Asp Lys Thr Ser Val Ile Lys Gln Ile Glu Lys1310 1315 1320tat ata ggc atg tgagcccgtt agtaggacca agtgtatcta acatttattt 4262Tyr Ile Gly Met1325acacgattaa agcctagagt cgatatatac tagttcaatt gttcttgcat gacgtcctcg4322gctgcatcga gtaagccgta gtcatcggca aactgtgcgg tgagttggat acctactccc4382ttcattccag caagaggaac agatatgcat ggaagcccag cgagggacat tggcaccgtg4442aagacgtcgt tgatgtacga gttgactgga ctcttgttct ccttgctagt gaaggcctcg4502agactaggtg ggtggcgcca tgcaggtcag cgagagcagc acatccaccc cagcaggatt4562aggtttgttt ccggtgcaga tgttctcaaa ggcaaatatc gagtcaaact ggtttataag4622ctcgactctc agtttctgcg ccctcatgta gttggtctta aatgcgcc 4670<210> 5<211> 1326<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature
<223> Oligo 28<400> 5Met Ala Arg His Thr Arg Arg Ser His Gln His Val Asn Asp Glu Asp1 5 10 15Thr Gly Ser Glu Ile Tyr Asp Lys Asn Gly Ile Lys His Thr Thr Pro20 25 30Arg Ser Leu Lys Lys Ile Asn Tyr Ala Glu Ile Glu Asn Ser Tyr Asp35 40 45Tyr Met Glu Asp Tyr Asp Glu Gly Asp Lys Glu Glu Glu Pro Ala Glu50 55 60Leu Glu Asn Asn Gly Arg Ser Lys Gly Leu Val Gly Arg Glu Arg Gly65 70 75 80Arg Glu Pro Glu Glu Asp Glu Asp Glu Glu Gly Pro Val Arg Gly Arg85 90 95Arg Ser Arg Lys Arg Thr Tyr Val Asp Val Glu Glu Asp Glu Ser Phe100 105 110His Glu Glu Glu Ala Glu Asp Glu Asp Glu Glu Ala Leu Asp Asp Asp115 120 125Glu Asp Glu Asp Glu Glu Glu Arg Asn Trp Arg Arg Arg Arg Glu His130 135 140Gln Phe Val Val Glu Asp Glu Asp Asp Asp Glu Asp Glu Glu Asp Asp145 150 155 160Tyr Gly Ala Gln Lys Lys Arg Gly Arg Arg Arg Thr Arg Arg Gly Arg165 170 175Ser Arg Leu Thr Glu Arg Arg Ser Pro Pro Arg Lys Leu Arg Thr Arg180 185 190Arg Thr Arg Ser Ser Val Asn Met Tyr Asp Ser Glu His Asp Gly Thr195 200 205Gly Glu Ala Leu Thr Leu Glu Asp Glu Ile Arg Glu Leu Gln Glu Asp210 215 220Ser Pro Ile Arg Glu Lys Arg Ser Leu Arg Glu Arg Thr Lys Pro Val225 230 235 240Asn Tyr Thr Leu Pro Pro Pro Leu Thr Asp Asn Gln Met Asn Val Asp
245 250 255Gly Thr Ala Ala Pro Ala Tyr Gly Ser Phe His Ser Pro Arg Gly Lys260 265 270Arg Gly Leu His Ser Gly Gln Ser Phe Gly Pro Ile Arg Arg Leu Phe275 280 285Pro Thr Gly Gly Pro Phe Gly Gly Asn Asp Val Thr Ala Ile Phe Gly290 295 300His Asn Thr Asn Phe Tyr Ala Thr Ala Gln Asp Pro Thr Val Ala Asn305 310 315 320Asn Lys Phe Ile Asp Ser Asp Ser Ser Asp Asp Glu Ile Leu Pro Leu325 330 335Gly Ser Thr Pro Lys Pro Lys Ser Ser Glu Ala Lys Lys Lys Lys Lys340 345 350Pro Glu Ile Ala Asp Leu Asp Pro Leu Gly Val Asp Met Asn Ile Asn355 360 365Phe Asp Asp Ile Gly Gly Leu Asp Asn Tyr Ile Asp Gln Leu Lys Glu370 375 380Met Val Ala Leu Pro Leu Leu Tyr Pro Glu Leu Tyr Gln Asn Phe Asn385 390 395 400Ile Thr Pro Pro Arg Gly Val Leu Phe Tyr Gly Pro Pro Gly Thr Gly405 410 415Lys Thr Leu Met Ala Arg Ala Leu Ala Ala Ser Cys Ser Thr Glu Lys420 425 430Arg Lys Ile Thr Phe Tyr Met Arg Lys Gly Ala Asp Ile Leu Ser Lys435 440 445Trp Val Gly Glu Ala Glu Arg Gln Leu Arg Leu Leu Phe Glu Glu Ala450 455 460Lys Lys His Gln Pro Ser Ile Ile Phe Phe Asp Glu Ile Asp Gly Leu465 470 475 480Ala Pro Val Arg Ser Ser Lys Gln Glu Gln Ile His Ala Ser Ile Val485 490 495Ser Thr Met Leu Ala Leu Met Asp Gly Met Asp Asn Arg Gly Gln Val500 505 510
Ile Val Ile Gly Ala Thr Asn Arg Pro Asp Ala Val Asp Pro Ala Leu515 520 525Arg Arg Pro Gly Arg Phe Asp Arg Glu Phe Tyr Phe Pro Leu Pro Asp530 535 540Ile Arg Ala Arg Ala Lys Ile Leu Glu Ile His Thr Arg Lys Trp His545 550 555 560Pro Pro Val Ser Ser Ala Phe Ile Glu Lys Leu Ala Ser Leu Thr Lys565 570 575Gly Tyr Gly Gly Ala Asp Leu Arg Ala Leu Cys Thr Glu Ala Ala Trp580 585 590Asn Ser Ile Gln Arg Arg Phe Pro Gln Ile Tyr Gln Ser Glu Val Lys595 600 605Leu Ala Ile Asn Pro Arg Glu Val Gln Val Lys Ala Lys Asp Phe Met610 615 620Ile Ala Met Glu Lys Ile Thr Pro Ser Ser Ala Arg Ser Ser Gly Asn625 630 635 640Leu Ala Glu Pro Leu Pro Arg Thr Ile Ala Val Leu Leu Asn Asp Gln645 650 655Phe Glu Glu Ile Lys Gln Lys Leu Asn Ser Ile Leu Pro Glu Ala Ser660 665 670Ser Lys Ser His Arg Gly Ser Ser Leu Ile Lys Glu Tyr Leu Glu Tyr675 680685Glu Asp Glu Glu Asp Glu Glu Asp Gly Glu Asp Asn Ile Glu Gly Thr690 695 700Gly Ile His Ser Ser Asn Gly Phe Ser Arg His Glu Phe Phe Lys Met705 710 715 720Leu Asp Gln Ala Arg Thr Val Lys Pro Lys Leu Leu Ile Thr Gly Pro725 730 735Ala Gly Asn Gly Gln Gln Tyr Ile Gly Ser Ala Leu Leu His His Leu740 745 750Glu Asp Tyr Asn Ile Gln Asn Leu Asp Leu Gly Thr Leu Leu Ser Glu755 760 765
Ser Leu Arg Thr Met Glu Ser Ala Ile Val Gln Thr Phe Ile Glu Ala770 775 780Lys Lys Arg Gln Pro Ser Val Ile Tyr Ile Pro Asn Ala Asp Ile Trp785 790 795 800Ser Arg Thr Val Pro Glu Ser Ala Ile Met Thr Leu Ala Ser Leu Phe805 810 815Arg Ser Leu Lys Thr Asn Glu Arg Val Leu Leu Leu Ala Ile Ala Glu820 825 830Gly Phe Thr Glu Glu Glu Leu His Asn Thr Pro Leu Ser Leu Phe Gly835 840 845Phe Asp Leu Asn Ile Val Ser Ile Arg Glu Pro Ser Thr Ala Gln Arg850 855 860His Asn Tyr Phe Lys Thr Leu Glu Glu Leu Leu Lys Met Lys Pro Thr865 870 875 880Lys Phe Arg Glu Lys Arg Lys Arg Lys Lys Pro Leu Pro Val Leu Pro885 890 895Val Cys Asp Thr Pro Ser Asn Asp Asp Ile Gly Ser Asp Gly Glu Leu900 905 910Leu Thr Glu Asp Glu Lys Leu Arg Arg Lys Leu Lys Ser Tyr His His915 920 925Gln Asp Met Lys Leu Lys Asn Thr Leu Lys Ile Lys Leu Ser Gly Leu930 935 940Val Ala Leu Phe Lys Gly Arg Tyr Lys Arg Phe Arg Lys Pro Pro Ile945 950 955 960Glu Asp Ser Leu Leu Ile His Leu Phe Glu Pro Glu Ala Tyr Ala Ser965 970 975Asn Pro Glu Trp Gln Pro Ala Tyr Val Arg Glu Asp Asp Met Ile Leu980 985 990Glu Val Ser Thr Gly Arg Lys Tyr Tyr Asn Met Asp Leu Asp Ile Ile995 1000 1005Glu Glu Arg Leu Trp Asn Gly Tyr Tyr Ser Glu Pro Lys Gln Tyr1010 1015 1020
Leu Lys Asp Ile Glu Leu Ile Tyr Arg Asp Ala Asn Thr Thr Gly1025 1030 1035Asp Arg Glu Arg Ile Ile Lys Ala Ser Glu Met Phe Ala Asn Ala1040 1045 1050Gln Met Gly Ile Glu Glu Ile Ser Thr Pro Glu Leu Ile Gln Glu1055 1060 1065Cys Arg Asp Thr Arg Gln Arg Glu Leu Leu Arg Gln Gln Leu Tyr1070 1075 1080Leu Arg Asp Gln Gln Lys Lys Ile His Glu Glu Glu Ala Lys Leu1085 1090 1095Glu Gln Glu Lys Lys Asp Pro Thr Phe Pro Asn Asp Asp Asn His1100 1105 1110Pro Glu Glu Ala Asp Leu Ser Val Gly Ala Gly Gln Gln Leu His1115 1120 1125Ser Pro Ser Gln Met Ser His Glu Ala Cys Glu Ser His Ala Glu1130 1135 1140Asp Gly Leu Gly Val Pro His Gly Phe Glu Asn Asn Thr Tyr Ala1145 1150 1155Ile Gly Asp Asn Thr Pro Glu Thr Ile Asp Asn Gly Ser Pro Lys1160 1165 1170Pro Leu Glu Asp Phe Cys Gly Glu Asp Lys Thr Val Pro Asp Asp1175 1180 1185Lys Ser Val Pro Glu Arg Phe Val Gln Glu Gly Glu Ala Ser Glu1190 1195 1200Met Gly Phe Ile Pro Lys Thr Pro Ser Ala Arg Pro Val Ser Met1205 1210 1215His Ser Asn Pro Ser Ser Lys Glu Ser Val Val Ala Pro Met Gln1220 1225 1230Lys Thr Gly Leu Glu Val Asn Ser Ile Glu Asp Thr Ser Val Ala1235 1240 1245Val Gln Ser Glu Leu Thr Arg Asp Glu Asp Leu Pro Met Thr Pro1250 1255 1260Glu Pro Ala Phe Ile Leu Asp Glu Thr Val Leu Ala Lys Ile Ile
1265 1270 1275Ser Met Leu Lys Thr Lys Thr Gln Gly Phe Thr Val Glu Gln Leu1280 1285 1290Glu Thr Cys Tyr Ala Ala Val Leu Glu Leu Val Trp Glu Ala Arg1295 1300 1305Ser Ser Trp Asp Lys Thr Ser Val Ile Lys Gln Ile Glu Lys Tyr1310 1315 1320Ile Gly Met1325<210> 6<211> 1049<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 45<400> 6gatcgacgtg gaccagcaca cggagtacgc ggtgaccggg agtgcggact tcaktgtgaa 60ggtctggcgc gtacgcgacg gcagcatcgc gcactcgtgg gacacagcgc acgcccgtgc 120aggcagcgtg gagttttcgc ccaccggcga ccgtgtgcct tgcaggtgcc tggataacgt 180gatgaactac gccggcgcca tcgtggtgtt cagcgtgacg cgggatgcga acaaccagat 240cactggcttc aacagcggcc tttcctgcga gatcctgacg caggagggct gtgcgcccgt 300gcttgtggcg tcgtggtcgt atgacggcaa gtacatcgtg gccgggcacc aagacggcaa 360gatcagcaaa tacaacggcg tcacgggcga atgcctggaa atcaaggacc tgcacaagca 420gcgcgtctcc gacatccaat tctcgcttga ccgcacctac ttctcacgac ctccagagac 480agctacgcca acctagtcga tgtcgagaca ttcgaggtcc tgaagaccta cgaaactgac 540tgtccgctga acagcggttg catcaccccg ctaaaggagt tcgtcattct gggcggtggc 600cagacgcgcg cgatgtcacg accaccagtg cccgcgaggg taagttcgag gccaagttct 660accacaagct tttccaggtg gaaatcggcc gtgtggacga ccatttcggt cccgtcaact 720acatcgccgt ttccccgcag ggcacctcgt acgcctccgg cggtgaggac ggtttcgtgc 780gcctccatca cttcgacaag aggctacttc gacttcaagt tcgacgtcga aaaaagcgcc 840gacgcccaga agaaggtcga cactgctgac cgctgagcta catacctctg taaactaccc 900tcttgaacag ctattttcta ctgccctgca tcgtaccagg caaggcctac acacctatac 960actacctgct ggccttctcg gccttcagcc gctccagccg ctcgcgctcc ttgcgctcgt 1020
ccgccgcctg ctgcttacgc cgcaggatc 1049<210> 7<211> 153<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 45<220>
<221> misc_feature<222> (17)..(17)<223> 未知氨基酸<400> 7Asp Val Asp Gln His Thr Glu Tyr Ala Val Thr Gly Ser Ala Asp Phe1 5 10 15Xaa Val Lys Val Trp Arg Val Arg Asp Gly Ser Ile Ala His Ser Trp20 25 30Asp Thr Ala His Ala Arg Ala Gly Ser Val Glu Phe Ser Pro Thr Gly35 40 45Asp Arg Val Pro Cys Arg Cys Leu Asp Asn Val Met Asn Tyr Ala Gly50 55 60Ala Ile Val Val Phe Ser Val Thr Arg Asp Ala Asn Asn Gln Ile Thr65 70 75 80Gly Phe Asn Ser Gly Leu Ser Cys Glu Ile Leu Thr Gln Glu Gly Cys85 90 95Ala Pro Val Leu Val Ala Ser Trp Ser Tyr Asp Gly Lys Tyr Ile Val100 105 110Ala Gly His Gln Asp Gly Lys Ile Ser Lys Tyr Asn Gly Val Thr Gly115 120 125Glu Cys Leu Glu Ile Lys Asp Leu His Lys Gln Arg Val Ser Asp Ile130 135 140Gln Phe Ser Leu Asp Arg Thr Tyr Phe145 150<210> 8<211> 47<212> PRT<213> 棉桃阿舒氏囊霉
<220>
<221> misc_feature<223> Oligo 45<400> 8Leu Thr Thr ser Arg Asp Ser Tyr Ala Asn Leu Val Asp Val Glu Thr1 5 10 15Phe Glu Val Leu Lys Thr Tyr Glu Thr Asp Cys Pro Leu Asn Ser Gly20 25 30Cys Ile Thr Pro Leu Lys Glu Phe Val Ile Leu Gly Gly Gly Gln35 40 45<210> 9<211> 70<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 45<400> 9Gly Arg Trp Pro Asp Ala Arg Asp Val Thr Thr Thr Ser Ala Arg Glu1 5 10 15Gly Lys Phe Glu Ala Lys Phe Tyr His Lys Leu Phe Gln Val Glu Ile20 25 30Gly Arg Val Asp Asp His Phe Gly Pro Val Asn Tyr Ile Ala Val Ser35 40 45Pro Gln Gly Thr Ser Tyr Ala Ser Gly Gly Glu Asp Gly Phe Val Arg50 55 60Leu His His Phe Asp Lys65 70<210> 10<211> 4389<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (640)..(1674)<223>
<400> 10
gattcgctgg agcgcgtgtg caaggaggcc gcgccggggc aggaactgct gctcatcttc 60ggggacctgg gacacccacg tgccgccggc gggccgcgac ttgttgcgca gcagcctgcg 120cgaacacggc gtggccgcct ccttcctgga actgcacgcg gcccagcacg ctttcgtgcg 180cgacgagttc tccaagggcc gcttcgacgg ggccgtcacc tccagctgtc tggggctgat 240gttcgagcag ttcgaccgcc tgctgaagca caaccttggt ccgcgcgagg cagacgccgg 300cgagctggag cacgtctgct aaaactacgt aactgccgct tcgatacata acacgccttg 360ggccctgctg gccctgctgg ccctgctggc cctgctggcc ctgctggccc tgctggccct 420gctggccctg ccggtacgcc gcatctctgc acttctacct gcacctttgc accgggtcat 480cgtggtctag caagtggctc gccaatatga aaaattttcg actagttcgc aggccttaga 540gcactatcac ccaagtgaac ggaccagcca gagcgcatct aagtcacttg gagggtatct 600gatcacatca cacgcttggc catataccat acttgaaag atg aga ccg atc atg654Met Arg Pro Ile Met1 5ttg atg gga cac gag cgt tcg ctc acg cag gtg aaa tat aac cgc gag 702Leu Met Gly His Glu Arg Ser Leu Thr Gln Val Lys Tyr Asn Arg Glu10 15 20gga gac cta atc ttc acg tcg ggg aag gat aac gtt gcg tcg gtg tgg 750Gly Asp Leu Ile Phe Thr Ser Gly Lys Asp Asn Val Ala Ser Val Trp25 30 35tat gcg atg aac ggc gag cgt ctg gga acg ctg gag ggt cac aat ggt 798Tyr Ala Met Asn Gly Glu Arg Leu Gly Thr Leu Glu Gly His Asn Gly40 45 50tcg att tgg tcg atc gac gtg gac cag cac acg gag tac gcg gtg acc 846Ser Ile Trp Ser Ile Asp Val Asp Gln His Thr Glu Tyr Ala Val Thr55 60 65ggg agt gcg gac ttc agt gtg aag gtc tgg cgc gta cgc gac ggc agc 894Gly Ser Ala Asp Phe Ser Val Lys Val Trp Arg Val Arg Asp Gly Ser70 75 80 85atc gcg cac tcg tgg gac acg cgc acg ccc gtg cgg cgc gtg gag ttt 942Ile Ala His Ser Trp Asp Thr Arg Thr Pro Val Arg Arg Val Glu Phe90 95 100tcg ccc acc ggc gac cgt gtg ctt gcg gtg ctg gat aac gtg atg aac 990Ser Pro Thr Gly Asp Arg Val Leu Ala Val Leu Asp Asn Val Met Asn105 110 115tac gcc ggc gcc atc gtg gtg ttc agc gtg acg cgg gat gcg aac aac 1038Tyr Ala Gly Ala Ile Val Val Phe Ser Val Thr Arg Asp Ala Asn Asn120 125 130cag atc act ggc ttc aac agc ggc ctt tcc tgc gag atc ctg acg cag 1086Gln Ile Thr Gly Phe Asn Ser Gly Leu Ser Cys Glu Ile Leu Thr Gln135 140 145gag ggc tgt gcg ccc gtg ctt gtg gcg tcg tgg tcg tat gac ggc aag 1134Glu Gly Cys Ala Pro Val Leu Val Ala Ser Trp Ser Tyr Asp Gly Lys150 155 160 165tac atc gtg gcc ggg cac caa gac ggc aag atc agc aaa tac aac ggc 1182
Tyr Ile Val Ala Gly His Gln Asp Gly Lys Ile Ser Lys Tyr Asn Gly170 175 180gtc acg ggc gaa tgc ctg gaa atc aag gac ctg cac aag cag cgc gtc 1230Val Thr Gly Glu Cys Leu Glu Ile Lys Asp Leu His Lys Gln Arg Val185 190 195tcc gac atc caa ttc tcg ctt gac cgc acc tacttc ctc acg acc tcc 1278Ser Asp Ile Gln Phe Ser Leu Asp Arg Thr Tyr Phe Leu Thr Thr Ser200 205 210aga gac agc tac gcc aac cta gtc gat gtc gag aca ttc gag gtc ctg 1326Arg Asp Ser Tyr Ala Asn Leu Val Asp Val Glu Thr Phe Glu Val Leu215 220 225aag acc tac gaa act gac tgt ccg ctg aac agc ggt tgc atc acc ccg 1374Lys Thr Tyr Glu Thr Asp Cys Pro Leu Asn Ser Gly Cys Ile Thr Pro230 235 240 245cta aag gag ttc gtc att ctg ggc ggt ggc cag gac gcg cgc gat gtc 1422Leu Lys Glu Phe Val Ile Leu Gly Gly Gly Gln Asp Ala Arg Asp Val250 255 260acg acc acc agt gcc cgc gag ggt aag ttc gag gcc aag ttc tac cac 1470Thr Thr Thr Ser Ala Arg Glu Gly Lys Phe Glu Ala Lys Phe Tyr His265 270 275aag ctt ttc cag gtg gaa atc ggc cgt gtg gac gac cat ttc ggt ccc 1518Lys Leu Phe Gln Val Glu Ile Gly Arg Val Asp Asp His Phe Gly Pro280 285 290gtc aac tac atc gcc gtt tcc ccg cag ggc acc tcg tac gcc tcc ggc 1566Val Asn Tyr Ile Ala Val Ser Pro Gln Gly Thr Ser Tyr Ala Ser Gly295 300 305ggt gag gac ggt ttc gtg cgc ctc cat cac ttc gac aag agc tacttc 1614Gly Glu Asp Gly Phe Val Arg Leu His His Phe Asp Lys Ser Tyr Phe310 315 320 325gac ttc aag ttc gac gtc gaa aaa agc gcc gac gcc cag aag aag gtc 1662Asp Phe Lys Phe Asp Val Glu Lys Ser Ala Asp Ala Gln Lys Lys Val330 335 340gac act gct gac cgctgagcta catacctctg taaactaccc tcttgaacag 1714Asp Thr Ala Asp345ctattttcta cgcccgcatc gtaccaggca agcctacaca cctatacact acctgctggc1774cttctcggcc ttcagccgct ccagccgctc gcgctccttg cgctcgtccg ccgcctgctg1834cttacgccgc aggatctccg cgtcactctc catccgcttc agggggtccc cagacttttt1894ctgccccttg gcgctctcct tctgcttctt caggttcttc tgccgtgcga gctcgcgctg1954gtttcctcta gccatcctta gctgaagagt gtcggagggg ccgccacggt ggcagcccgc2014cttgcttatc tttgtggcca gccctcccca cgtgaggtat cacgtggcct cctccgactc2074ggcggtctga ccttcggaaa aatcggaaaa ttaagccggt ccggaatctc cgccggaccg2134gtgttcttcc cctctcgcgg tactcgagaa aaatttactg cagctgttta agttgcgtct2194catgcgtgcg gcgttgtgcg aaccgtcagt gaaaacgtgg aaaaaaaatg catcaacgca2254ggcgcatact aaatacgaaa tatatatagt gggaaagcgc aggcatcgcg agttgcacac2314
aacaggtcgt aatgtgtctt aagcaaaaac aagagcgggc gaaataactg agygraatcc2374ccctatattc aacaacagtc cgcagtattt cccagatctg aactatttat ctccatggca2434cagttattca aacggtgtcg gcaccccaat accaattaac agttccatga ttgggaaccc2494aaacctttcc aacgtcccca tgaccaagac gtacgatccc tacgatgttc cacagtcgag2554ctttcctgcc tattttaatc cgcgcgcagc gctgaacatg ccccaccgcg agaaggttaa2614ccaatggata gaaaatgttc caatacatat tgttcaccga agagtaccct gactcacgac2674tgctatagca ttgacgagta catgaactgg gaggaggatg aatttgacat gtctttgttc2734cagcgcgggg agaagaccca gattaatatg gcaaccgtcg acgaactatt acaattccag2794ctgaaacgga taacctccat ggttttaaga ctatacgagg aaagcccgga ggtcccattg2854gacaactctg atgctacatc ttactgaaat actgattcca catcatcatg attaatactt2914aatagtttta gtatttatat agtatattat taaatagcca cggggtgcac atcaacgctg2974acgccgtaca acggctttcg ggccccgaca acattttagc gcatagtaaa actaagtccc3034atacacagcg aataatcgcc cccaagaaag cttcgatcaa aacataagtt actctcgagc3094ggcaagatag gctaacagga agaggcagta ctattggacg gggttagcgc tgaaaggtgc3154aaatttgggg ccatgagtaa ggaacccgga aagaaggtta cgctgaagga acgcatggta3214agcgcctctg ctggctcgct ggtcacgtca ctgtttctca cgccactgga cgtggtccgc3274gtgcggcttc aacagcaaga aatgcttcca agttgtacat gtacaggaca gctgtcgaaa3334ccggcaggga aagtgttttg gcaggatgag tgctttgcaa acgtcggctg ccgagagcct3394gctgcgaggc tgcagggaac tctggagggg ctcaggaaga tagcccaact agagggtctg3454ccgactctgt ggcgagggct ggggattacg ctcgtaatgg cggtgccggc taacgtggtg3514tacttttccg gctatgaagc actgcgtgat aactcgccct tggcatcccg gctacctgtg3574gcaaacccac tagtgtgtgg agcatttgcg cggatattgg ctgcaactac tattgcgccg3634ctggagctat tgcgcacacg gctccagagt gtgccccgcg caagagacac agagcgtaca3694atatatctga taggcgacct gctgcgagag atgcggcatg aggtttcggt tatgggttac3754cgtgcgctat ttaaaggctt ggagatcact ttatggaggg acgtgccctt cagcgcaatc3814tattggggaa catacgagtt ctgtaaaacc cagttctggg cccgccatgc cgcaacccat3874aatgcatcaa actgggacca tttcatcggc agttttgcct gcggtagcat gggcggtgct3934gttgcagcac ttttgacaca tccttttgat gtgggcaaga cccgcatgca gattgcgatt3994gccagtccac agcagctaac tgtgggggga aaagctacga aaactgatga ctcaagaggc4054atgttctcat ttttgaatgc cattaggaaa tcagaaggta ttagagcgct atataccggc4114ctattaccta gggtgatgaa gattgcacca agttgcgcca taatgatctc gacttatgaa4174ctgtcgaaga agttcttcac tagttgaact ttgtttcttc ctgtatatac caagtaattc4234
acactgttga tacacgatac agcatttttc ttaaaaccct gtgatatacg cttgctgtag4294tacacgccca aacggtgagg tctataattt tacatgtccg cgagatggta ttggatcggc4354agaattttag agctgccgct gtagcccatc cgtcg 4389<210> 11<211> 345<212> PRT<213> 棉桃阿舒氏囊霉<400> 11Met Arg Pro Ile Met Leu Met Gly His Glu Arg Ser Leu Thr Gln Val1 5 10 15Lys Tyr Asn Arg Glu Gly Asp Leu Ile Phe Thr Ser Gly Lys Asp Asn20 25 30Val Ala Ser Val Trp Tyr Ala Met Asn Gly Glu Arg Leu Gly Thr Leu35 40 45Glu Gly His Asn Gly Ser Ile Trp Ser Ile Asp Val Asp Gln His Thr50 55 60Glu Tyr Ala Val Thr Gly Ser Ala Asp Phe Ser Val Lys Val Trp Arg65 70 75 80Val Arg Asp Gly Ser Ile Ala His Ser Trp Asp Thr Arg Thr Pro Val85 90 95Arg Arg Val Glu Phe Ser Pro Thr Gly Asp Arg Val Leu Ala Val Leu100 105 110Asp Asn Val Met Asn Tyr Ala Gly Ala Ile Val Val Phe Ser Val Thr115 120 125Arg Asp Ala Asn Asn Gln Ile Thr Gly Phe Asn Ser Gly Leu Ser Cys130 135 140Glu Ile Leu Thr Gln Glu Gly Cys Ala Pro Val Leu Val Ala Ser Trp145 150 155 160Ser Tyr Asp Gly Lys Tyr Ile Val Ala Gly His Gln Asp Gly Lys Ile165 170 175Ser Lys Tyr Asn Gly Val Thr Gly Glu Cys Leu Glu Ile Lys Asp Leu180 185 190His Lys Gln Arg Val Ser Asp Ile Gln Phe Ser Leu Asp Arg Thr Tyr195 200 205
Phe Leu Thr Thr Ser Arg Asp Ser Tyr Ala Asn Leu Val Asp Val Glu210 215 220Thr Phe Glu Val Leu Lys Thr Tyr Glu Thr Asp Cys Pro Leu Asn Ser225 230 235 240Gly Cys Ile Thr Pro Leu Lys Glu Phe Val Ile Leu Gly Gly Gly Gln245 250 255Asp Ala Arg Asp Val Thr Thr Thr Ser Ala Arg Glu Gly Lys Phe Glu260 265 270Ala Lys Phe Tyr His Lys Leu Phe Gln Val Glu Ile Gly Arg Val Asp275 280 285Asp His Phe Gly Pro Val Asn Tyr Ile Ala Val Ser Pro Gln Gly Thr290 295 300Ser Tyr Ala Ser Gly Gly Glu Asp Gly Phe Val Arg Leu His His Phe305 310 315 320Asp Lys Ser Tyr Phe Asp Phe Lys Phe Asp Val Glu Lys Ser Ala Asp325 330 335Ala Gln Lys Lys Val Asp Thr Ala Asp340 345<210> 12<211> 1042<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 45<220>
<221> misc_feature<223> Oligo 85<400> 12gatctgccga aatcgttaat ttcacctgta ggtcacgtga ttgtgaattg tgtttgactg60ttgcatccgt acattcggag gtgtgtgggt tgtatagctg aagattctgc gtcgtccgac120agactcgctc gcgcacaccg agcggagcac agtcggtttc cacagcaggc caacatcttc180aacagaagag gcagttcatt tggagtggct cttagtgcaa aatacagcaa aatcaatcat240aatggtatgt gtcaggcggt gtatagcgtg ggatgatggc atgcagcctt ttcgttgggt300
atcgaggtga ccgttagagg cttaaatccg tgggacagaa gtgcgcgaca gcagcgcata360ccgggttagc cagcgagcgg tagccgaggg gtagatgcgg ccccgcaggt tgccagcaat420gtcattccaa gcttgatagg tgcgcggagt actaacatct catctcaggc cggtgttaaa480gcttttgaat tgagaaccaa gtccaaggag caactggagc aacagttgat ctccttgaag540caggagttgg ctgctttgaa ggtccagaag ctatccagac catccttgcc aaagatcaac600accgtcagaa agagcattgc tcgtgtcttg accgtcatca accagaacca gagacaggct660gtcagagagt tgtacaaggg caagaagtac cagccaaagg acttgagagc aaagaagacc720agagctttga gaagagcttt gacgaagttc gaggctgctc agatcactga gaagcagaga780aagaagcaga ttgctttccc acaaagaaag tacgctatta aggcctaaac gtctacggta840aaccgttgta tgttaattta gtttactttt aagaacccat ctttagaccc gcgggctcaa900gcggcggcgg cctgccagag ggagtagcag gcgaggcgct tttttgatag tgtggaatct960atacaggaaa ggtgactact tattgtttac cttgtttctt tgatgctttg aactcctcga1020ttctctgttt caactcatga tc 1042<210> 13<211> 119<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 85<400> 13Ala Gly Val Lys Ala Phe Glu Leu Arg Thr Lys Ser Lys Glu Gln Leu1 5 10 15Glu Gln Gln Leu Ile Ser Leu Lys Gln Glu Lau Ala Ala Leu Lys Val20 25 30Gln Lys Leu Ser Arg Pro Ser Leu Pro Lys Ile Asn Thr Val Arg Lys35 40 45Ser Ile Ala Arg Val Leu Thr Val Ile Asn Gln Asn Gln Arg Gln Ala50 55 60Val Arg Glu Leu Tyr Lys Gly Lys Lys Tyr Gln Pro Lys Asp Leu Arg65 70 75 80Ala Lys Lys Thr Arg Ala Leu Arg Arg Ala Leu Thr Lys Phe Glu Ala85 90 95Ala Gln Ile Thr Glu Lys Gln Arg Lys Lys Gln Ile Ala Phe Pro Gln
100105 110Arg Lys Tyr Ala Ile Lys Ala115<210> 14<211> 1072<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (92)..(307)<223>
<220>
<221> misc_feature<223> Oligo 85<220>
<221> CDS<222> (403)..(858)<223>
<220>
<221> misc_feature<222> (279)..(501)<223> 內(nèi)含子<400> 14cggtgttccg tcgcgccttt ggcgctcact ttgcgatctg ccgaaatcgt taatttcacc 60tgtaggtcac gtgattgtga attgtgtttg a ctg ttg cat ccg tac att cgg 112Leu Leu His Pro Tyr Ile Arg1 5agg tgt gtg ggt tgt ata gct gaa gat tct gcg tcg tcc gac aga ctc160Arg Cys Val Gly Cys Ile Ala Glu Asp Ser Ala Ser Ser Asp Arg Leu10 15 20gct cgc gca cac cga gcg gag cac agt cgg ttt cca cag cag gcc aac208Ala Arg Ala His Arg Ala Glu His Ser Arg Phe Pro Gln Gln Ala Asn25 30 35atc ttc aac aga aga ggc agt tca ttt gga gtg gct ctt agt gca aaa256Ile Phe Asn Arg Arg Gly Ser Ser Phe Gly Val Ala Leu Ser Ala Lys40 45 50 55tac agc aaa atc aat cat aat ggt atg tgt cag gcg gtg tat agc gtg304Tyr Ser Lys Ile Asn His Asn Gly Met Cys Gln Ala Val Tyr Ser Val60 65 70gga tgatggcatg cagcttttcg ttgggtatcg aggtgaccgt tagaggctta 357Glyaatccgtggg acagaagtgc gcgacagcag cgcataccgg gttag cca gcg agc ggt 414Pro Ala Ser Gly75
agc cga ggg gta gat gcg gcc ccg cag gtt gcc agc aat gtc att cca462Ser Arg Gly Val Asp Ala Ala Pro Gln Val Ala Ser Asn Val Ile Pro80 85 90agc ttg ata ggt gcg cgg agt act aac atc tca tct cag gcc ggt gtt510Ser Leu Ile Gly Ala Arg Ser Thr Asn Ile Ser Ser Gln Ala Gly Val95 100 105aaa gct ttt gaa ttg aga acc aag tcc aag gag caa ctg gag caa cag558Lys Ala Phe Glu Leu Arg Thr Lys Ser Lys Glu Gln Leu Glu Gln Gln110 115 120ttg atc tcc ttg aag cag gag ttg gct gct ttg aag gtc cag aag cta606Leu Ile Ser Leu Lys Gln Glu Leu Ala Ala Leu Lys Val Gln Lys Leu125 130 135 140tcc aga cca tcc ttg cca aag atc aac acc gtc aga aag agc att gct654Ser Arg Pro Ser Leu Pro Lys Ile Asn Thr Val Arg Lys Ser Ile Ala145 150 155cgt gtc ttg acc gtc atc aac cag aac cag aga cag gct gtc aga gag702Arg Val Leu Thr Val Ile Asn Gln Asn Gln Arg Gln Ala Val Arg Glu160 165 170ttg tac aag ggc aag aag tac cag cca aag gac ttg aga gca aag aag750Leu Tyr Lys Gly Lys Lys Tyr Gln Pro Lys Asp Leu Arg Ala Lys Lys175 180 185acc aga gct ttg aga aga gct ttg acg aag ttc gag gct gct cag atc798Thr Arg Ala Leu Arg Arg Ala Leu Thr Lys Phe Glu Ala Ala Gln Ile190 195 200act gag aag cag aga aag aag cag att gct ttc cca caa aga aag tac846Thr Glu Lys Gln Arg Lys Lys Gln Ile Ala Phe Pro Gln Arg Lys Tyr205 210 215 220gct att aag gcctaaacgtcta cgtaaaccgt tgtatgttaa tttagtttac 898Ala Ile Lys Alattttaagaac ccatctttag acccgcgggc tcaagcggcg gcggcctgcc agagggagta 958gcagcgagcg cttttttgat agtgtggaat ctatacagga aaggtgacta cttattgttt 1018accttgtttc tttgatgctt tgaactcctc gattctctgt ttcaactcat gatc1072<210> 15<211> 72<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 85<220>
<221> misc_feature<222> (279)..(501)<223> 內(nèi)含子<400> 15Leu Leu His Pro Tyr Ile Arg Arg Cys Val Gly Cys Ile Ala Glu Asp1 5 10 15
Ser Ala Ser Ser Asp Arg Leu Ala Arg Ala His Arg Ala Glu His Ser20 25 30Arg Phe Pro Gln Gln Ala Asn Ile Phe Asn Arg Arg Gly Ser Ser Phe35 40 45Gly Val Ala Leu Ser Ala Lys Tyr Ser Lys Ile Asn His Asn Gly Met50 55 60Cys Gln Ala Val Tyr Ser Val Gly65 70<210> 16<211> 152<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 85<220>
<221> misc_feature<222> (279)..(501)<223> 內(nèi)含子<400> 16Pro Ala Ser Gly Ser Arg Gly Val Asp Ala Ala Pro Gln Val Ala Ser1 5 10 15Asn Val Ile Pro Ser Leu Ile Gly Ala Arg Ser Thr Asn Ile Ser Ser20 25 30Gln Ala Gly Val Lys Ala Phe Glu Leu Arg Thr Lys Ser Lys Glu Gln35 40 45Leu Glu Gln Gln Leu Ile Ser Leu Lys Gln Glu Leu Ala Ala Leu Lys50 55 60Val Gln Lys Leu Ser Arg Pro Ser Leu Pro Lys Ile Asn Thr Val Arg65 70 75 80Lys Ser Ile Ala Arg Val Leu Thr Val Ile Asn Gln Asn Gln Arg Gln85 90 95Ala Val Arg Glu Leu Tyr Lys Gly Lys Lys Tyr Gln Pro Lys Asp Leu100 105 110Arg Ala Lys Lys Thr Arg Ala Leu Arg Arg Ala Leu Thr Lys Phe Glu115 120 125
Ala Ala Gln Ile Thr Glu Lys Gln Arg Lys Lys Gln Ile Ala Phe Pro130 135 140Gln Arg Lys Tyr Ala Ile Lys Ala145 150<210> 17<211> 1011<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 133<220>
<221> misc_feature<222> (439)..(439)<223> 未知核苷酸<400> 17cttaccgcgt ctcagcagac gtttctgctt ctttgagagg ggcactggtt gagtcaagtc60gatttcaatt tcatcctcgg cctttctctt cttggtgggg tcgcttagcg ctttagcttg120catatcaacc tttgctggcc gtggccgatt cttcgtctga catagctcca cgcagtagga180atgtatgtag tgaccctatg gattatggtc aagaagtgcg atgcgtgcgg agaactatgc240gttacaccat agctcatcgc atctcaaaaa ttttcgaatc accgaaaatt caggtcacgt300gatttataat aggccctcac ttgaaaatct cagtccacca gcagacaaac atatgtcggt360tgctgaacgg ggcacgacaa aactggcggc atcccgtgta acgctcgcaa gattatttca420gaaccaaatt actctttcng kcgkattttt gtatctggta tataccatct acccattaaa480taagccgagc ccagtccgtg atttgcgcgg catcaacatt gcatagtatg gcggtactat540catgtcactt gccttgtaaa ccgatgatta attagctcga attgctgaag cgggcgaccc600ttgctaaacg tactaatcaa cgtctctctt cattataggt aaaacgtcag gggatcggca660cgcagatctt gaactaaaat aaaataacga aatgggatga atgtataatt agagcagtca720gatagttcca tgagaatatg agaataaccg agaacgaact agagttccct agatttcagg780ccgtgggata agggcttcgg tgtacggcgc tttaagttca cctcaaaaat ctcttcaacc840tagcaaagaa tccggacctt ctctttggtt cagtggaaga gcggctaggg ctagaattgc900tgttcttgct agaaggcctg ccgttgtgag catcaaagct ctgcttcgtg cttggagcgg960tagccatact agcagcatcc ttagaatgac gtgactgcgt tacagaagat c 1011<210> 18<211> 38
<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 133<400> 18Lys Ala Leu Ser Asp Pro Thr Lys Lys Arg Lys Ala Glu Asp Glu Ile1 5 10 15Glu Ile Asp Leu Thr Gln Pro Val Pro Leu Ser Lys Lys Gln Lys Arg20 25 30Leu Leu Arg Arg Gly Lys35<210> 19<211> 3091<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (1371)..(2495)<223>
<220>
<221> misc_feature<223> Oligo 133<400> 19ttctgaggct catgtgacac cggtaactaa cgttccagta tctgagcaga tattcttcgc60cgaaggtgac tcagccagtt gtcgaatcaa gccctgccac tgaatcggag aaggtaatta120aggcacctgc tgttgctgct cacgagatat tcccacctca tgtggtcaag ctaacaccgg180tgtcgcctaa gaagaagacg tccaccggga gcttgaagaa gcagattatt gcgcctagag240aagaggagca gccacagcct gttcacgcag tgacaggtac tgccattgag ctcgaggagg300ttccatcgac ggtggaactt gtcgaggtac ctccatctga agtgcccacg actcattccc360ctattgtcgt cggaatacca ctatcaaatg acaagattgt cgtcgcccct gtgcagatac420aaggagatat cacgacacag acgtctgctc caagtactca gtacactgac acatatgctg480ctcccgtccg ccaggatgtg cctcttgcta cgaccgctgg cagatcttct gtaacgcagt540cacgtcattc taaggatgct gctagtatgg ctaccgctcc aagcacgaag cagagctttg600atgctcacaa cggcaggcct tctagcaaga acagcaattc tagccctagc cgctcttcca660ctgaaccaaa gagaaggtcc ggattctttg ctaggttgaa gagatttttg aggtgaactt720aaagcgccgt acaccgaagc ccttatccca cggcctgaaa tctagggaac tctagttcgt780
tctcggttat tctcatattc tcatggaact atctgactgc tctaattata cattcatccc840atttcgttat tttattttag ttcaagatct gcgtgccgat cccctgacgt tttacctata900atgaagagag acgttgatta gtacgtttag caagggtcgc ccgcttcagc aattcgagct960aattaatcat cggtttacaa ggcaagtgac atgatagtac cgccatacta tgcaatgttg1020atgccgcgca aatcacggac tgggctcggc ttatttaatg ggtagatggt atataacaga1080tacaaaaata cgaccgaaag agtaatttgg ttctgaaata atcttgcgag cgttacacgg1140gatgccgcca gttttgtcgt gccccgttca gcaaccgaca tatgtttgtc tgctggtgga1200ctgagatttt caagtgaggg cctattataa atcacgtgac ctgaattttc ggtgattcga1260aaatttttga gatgcgatga gctatggtgt aacgcatagt tctccgcacg catcgcactt1320cttgaccata atccataggg tcactacata cattcctact gcgtggagct atg tca 1376Met Ser1gac gaa gaa tcg gcc acg gcc agc aaa gtt gat atg caa gct aaa gcg 1424Asp Glu Glu Ser Ala Thr Ala Ser Lys Val Asp Met Gln Ala Lys Ala5 10 15cta agc gac ccc acc aag aag aga aag gcc gag gat gaa att gaa atc 1472Leu Ser Asp Pro Thr Lys Lys Arg Lys Ala Glu Asp Glu Ile Glu Ile20 25 30gac ttg act caa cca gtg ccc ctc tca aag aag cag aaa cgt ctg ctg 1520Asp Leu Thr Gln Pro Val Pro Leu Ser Lys Lys Gln Lys Arg Leu Leu35 40 45 50aga cgc ggt aag atc acc ctc gaa cag ctc agc gag aag ttc aac atc 1568Arg Arg Gly Lys Ile Thr Leu Glu Gln Leu Ser Glu Lys Phe Asn Ile55 60 65gat caa aag tcc atc gag gag tac aag aac gag caa aag gaa aca gca 1616Asp Gln Lys Ser Ile Glu Glu Tyr Lys Asn Glu Gln Lys Glu Thr Ala70 75 80gag aac gac gat gcc gaa cca gct gcc gag gag gag cca aag cct gcg 1664Glu Asn Asp Asp Ala Glu Pro Ala Ala Glu Glu Glu Pro Lys Pro Ala85 90 95ccc cgc aaa gag aag aag ttc ggc gtc tgg atc ggt aac atg gct ttc 1712Pro Arg Lys Glu Lys Lys Phe Gly Val Trp Ile Gly Asn Met Ala Phe100 105 110gac acc acg cag gag gag ctt cgc cgc ttt gtt gtt tcc aag acc gct 1760Asp Thr Thr Gln Glu Glu Leu Arg Arg Phe Val Val Ser Lys Thr Ala115 120 125 130ggc atg gag gca ggc gag gtc aca gac gct gac atc gtg cgt gtg aat 1808Gly Met Glu Ala Gly Glu Val Thr Asp Ala Asp Ile Val Arg Val Asn135 140 145atg ccg ctg gcc aag aac gac ggc aaa cag atc aaa aac aag ggc ttt 1856Met Pro Leu Ala Lys Asn Asp Gly Lys Gln Ile Lys Asn Lys Gly Phe150 155 160gcg tac gtg gac ttt gcg act agt gcg cag atg gat gca gta atc ggc 1904Ala Tyr Val Asp Phe Ala Thr Ser Ala Gln Met Asp Ala Val Ile Gly165 170 175
ctc agc gaa gca cag ctc aac gga cgc aac ttg ctg atc aag aac gcc 1952Leu Ser Glu Ala Gln Leu Asn Gly Arg Asn Leu Leu Ile Lys Asn Ala180 185 190aag agc tac gac ggc cgc ccg gcg aag aac gac ctc atc tcg atg tcc 2000Lys Ser Tyr Asp Gly Arg Pro Ala Lys Asn Asp Leu Ile Ser Met Ser195 200 205 210aaa aac cct cct tct cgc att ttg ttt gtc ggc aac ctc tcc ttc gac 2048Lys Asn Pro Pro Ser Arg Ile Leu Phe Val Gly Asn Leu Ser Phe Asp215 220 225acc acc gat gag ctg ctg aaa aag cat ttc cag cac tgc ggc gag atc 2096Thr Thr Asp Glu Leu Leu Lys Lys His Phe Gln His Cys Gly Glu Ile230 235 240gtc aaa atc cgc atg gcc acc ttc cag gac tcc ggc aag tgc aag ggt 2144Val Lys Ile Arg Met Ala Thr Phe Gln Asp Ser Gly Lys Cys Lys Gly245 250 255ttc gcc ttc gtt gac ttc cgc gac gag gcc ggt gcc acc gcc gcc ctc 2192Phe Ala Phe Val Asp Phe Arg Asp Glu Ala Gly Ala Thr Ala Ala Leu260 265 270aca gac cgc tcc tgt cgc gcc ata gca ggt cgc ccg ctc cgg atg gag 2240Thr Asp Arg Ser Cys Arg Ala Ile Ala Gly Arg Pro Leu Arg Met Glu275 280 285 290tac ggc gag gac cgc agc aag cgc cac gtc cgc agc cgc ccg gcg ccc 2288Tyr Gly Glu Asp Arg Ser Lys Arg His Val Arg Ser Arg Pro Ala Pro295 300 305tcg ctc gtc gac gcc gag cct cat gcg cct gcc ccc gct gac cca gca 2336Ser Leu Val Asp Ala Glu Pro His Ala Pro Ala Pro Ala Asp Pro Ala310 315 320ccc gcg ccc gcg ccc gcg cct gcc cct agg gcg ccc cgg ccc cgc aag 2384Pro Ala Pro Ala Pro Ala Pro Ala Pro Arg Ala Pro Arg Pro Arg Lys325 330 335ccc acg cgc aat gac cac cac agc cgc cct aag agc agc gtc gcc ctc 2432Pro Thr Arg Asn Asp His His Ser Arg Pro Lys Ser Ser Val Ala Leu340 345 350gcc tcc gcc cag cgc gcc tca gcc gcc atc gtt ccc tct cag ggt aag 2480Ala Ser Ala Gln Arg Ala Ser Ala Ala Ile Val Pro Ser Gln Gly Lys355 360 365 370aag gtc aag ttt gat tagcatgcat ctctacatac cgaatgtaca ttagttattg 2535Lys Val Lys Phe Asp375tgcccgctgc gttgctcggt ctgctaccct acgcccgcat accgtccgtt ctttcgactc2595tcgcctcggc gtatgtgatg cagcacactg catgcagcat cgaccccggg gaacatgaac2655aaccacgtac tgccaacata ctagccggcc aatgcaaggc aaaaaggacc aagatcgagg2715tcagggatgt cacaagatga tatgcccttg tgtgaaagta tttttggtca acctggttgc2775tacgttgagt acctaaaaaa ggaaggatcc attaggctcg ataggttcta cggtacaatt2835atattctcga cacggcattg gatgcaagac tctgaggaag cggaggtgta actactagga2895gagttaagca tggggtataa caatacgagc tctccaatag gctcagggca tgggagttcg2955
ggggtggaaa aggcatccag gcccagttcg gtgcagtcga cgacgcagat gggagcacgt3015cattccgaga gcatgaatct gtccgtgagc tggctctcga cggatgcgtg gagcgcggcg3075gagtttgcga cactgg3091<210> 20<211> 375<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 133<400> 20Met Ser Asp Glu Glu Ser Ala Thr Ala Ser Lys Val Asp Met Gln Ala1 5 10 15Lys Ala Leu Ser Asp Pro Thr Lys Lys Arg Lys Ala Glu Asp Glu Ile20 25 30Glu Ile Asp Leu Thr Gln Pro Val Pro Leu Ser Lys Lys Gln Lys Arg35 40 45Leu Leu Arg Arg Gly Lys Ile Thr Leu Glu Gln Leu Ser Glu Lys Phe50 55 60Asn Ile Asp Gln Lys Ser Ile Glu Glu Tyr Lys Asn Glu Gln Lys Glu65 70 75 80Thr Ala Glu Asn Asp Asp Ala Glu Pro Ala Ala Glu Glu Glu Pro Lys85 90 95Pro Ala Pro Arg Lys Glu Lys Lys Phe Gly Val Trp Ile Gly Asn Met100 105 110Ala Phe Asp Thr Thr Gln Glu Glu Leu Arg Arg Phe Val Val Ser Lys115 120 125Thr Ala Gly Met Glu Ala Gly Glu Val Thr Asp Ala Asp Ile Val Arg130 135 140Val Asn Met Pro Leu Ala Lys Asn Asp Gly Lys Gln Ile Lys Asn Lys145 150 155 160Gly Phe Ala Tyr Val Asp Phe Ala Thr Ser Ala Gln Met Asp Ala Val165 170 175Ile Gly Leu Ser Glu Ala Gln Leu Asn Gly Arg Asn Leu Leu Ile Lys180 185 190
Asn Ala Lys Ser Tyr Asp Gly Arg Pro Ala Lys Asn Asp Leu Ile Ser195 200 205Met Ser Lys Asn Pro Pro Ser Arg Ile Leu Phe Val Gly Asn Leu Ser210 215 220Phe Asp Thr Thr Asp Glu Leu Leu Lys Lys His Phe Gln His Cys Gly225 230 235 240Glu Ile Val Lys Ile Arg Met Ala Thr Phe Gln Asp Ser Gly Lys Cys245 250 255Lys Gly Phe Ala Phe Val Asp Phe Arg Asp Glu Ala Gly Ala Thr Ala260 265 270Ala Leu Thr Asp Arg Ser Cys Arg Ala Ile Ala Gly Arg Pro Leu Arg275 280 285Met Glu Tyr Gly Glu Asp Arg Ser Lys Arg His Val Arg Ser Arg Pro290 295 300Ala Pro Ser Leu Val Asp Ala Glu Pro His Ala Pro Ala Pro Ala Asp305 310 315 320Pro Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Arg Ala Pro Arg Pro325 330 335Arg Lys Pro Thr Arg Asn Asp His His Ser Arg Pro Lys Ser Ser Val340 345 350Ala Leu Ala Ser Ala Gln Arg Ala Ser Ala Ala Ile Val Pro Ser Gln355 360 365Gly Lys Lys Val Lys Phe Asp370 375<210> 21<211> 1687<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 172<400> 21gatcagccat gtgtcatcta ttgcacagct aaaccgtcgc atataccagc aggatagaga60gggcgatgtt ctgcggaata ttcctgtagt gtaccacaga gctagttcgt caacctgtgg120
cctggtccac ctcactatcc ttctccctat caacgaggag accgctctat ctgtactcac180gacagcaggc cagccaacct ttgctgttcg catccccgca gatccagtag cgagggcact240gattgctctt agcgacaccc ccattgctgc gccgtcggct aacgtctcaa ctaggccttc300tccgacggcc gctgagcatg tataccatga cttaaaggga aagataccac ctaattctag360atggtggaag ttgccgtgtt ggggttgagt ctactgtcat cgatggcttg gtaaatccgc420caatgttgtt acgtcctgga ggatttacgt atgaagaaat catcgaacta ggcggggagc480aatggtccca ttgtaaagtt gagaatagga tgactgtagg gagtggggaa aaggttagaa540ctcccggtat gaagtacaaa cattactctc ctagggcctc cactgtagca tttgccccaa600ttaacgatga tcttccaacg agcgaaagga tgaagattgt gacctccgaa ataatgaaat660acatgacaag ccatggcacc gataagcgcc aaaaagtggg gctactgaca agcattatgt720tccccaataa cttactggaa tccattacgg acgaagttga tgttgtggtt tattcattgg780gctcctctgg gaaagaagtt caatcgaatt tgtttgccat gctgcgaagg ctggacgagg840aagatgaggt ggatttgata tttgttgaag gtattagcga taggaatgag ggactggcag900tgatgaatag attaagaaaa gccgctgggg ggaacgtagt gtcattttaa tgaaccgggt960agtcgcacat ttcatcgtca atagaaacag ccggtgggca atattgatcg atcgttttgt1020gtcgcttgtt ggataacttt atctgataaa tacaccctat atgcttgtgt atatgtttag1080tatataaatg actttatcat ctctggatga aaaaataaga gaaaacaaca tacgcactct1140gtgaattaaa ccatggaaaa gtaatatgcg tcttgatggg tattcttttt ggcgtaatac1200tttcgaactt catctgcaat gaaaacactg ctactgatta caatcaaata aatgagatcc1260cccaggctca ggcgctctgt cttgaagata ttctggaaaa atggaatgta aatagcgcac1320aactgaccta gtaatgagaa accaacagca tagttaaaca tcttattatt gaagatacca1380atttcgaaaa tggacttcgt aggcatgcct acacgctaga ggctgctgaa catatcaaaa1440aacacgaaac aggtaaacgt cattgtggtg tctctcgcag taacctgtcc atcctcagtc1500atttccttga tgaacacgta gatagtacca ccaatgataa aggctgcatt gataaggagt1560ctccgcataa cttggggagg tcaagatctt gtctgaacgt tttcttggag gcttcctcat1620tacttcgtgg tcaactggct ccacacctag ggattgcgcg ggtggaccgt ccatcaatat1680gttgatc 1687<210> 22<211> 116<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 172
<400> 22Ile Ser His Val Ser Ser Ile Ala Gln Leu Asn Arg Arg Ile Tyr Gln1 5 10 15Gln Asp Arg Glu Gly Asp Val Leu Arg Asn Ile Pro Val Val Tyr His20 25 30Arg Ala Ser Ser Ser Thr Cys Gly Leu Val His Leu Thr Ile Leu Leu35 40 45Pro Ile Asn Glu Glu Thr Ala Leu Ser Val Leu Thr Thr Ala Gly Gln50 55 60Pro Thr Phe Ala Val Arg Ile Pro Ala Asp Pro Val Ala Arg Ala Leu65 70 75 80Ile Ala Leu Ser Asp Thr Pro Ile Ala Ala Pro Ser Ala Asn Val Ser85 90 95Thr Arg Pro Ser Pro Thr Ala Ala Glu His Val Tyr His Asp Leu Lys100 105 110Gly Lys Ile Pro115<210> 23<211> 204<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 172<400> 23Arg Glu Arg Tyr His Leu Ile Leu Asp Gly Gly Ser Cys Arg Val Gly1 5 10 15Val Glu Ser Thr Val Ile Asp Gly Leu Val Asn Pro Pro Met Leu Leu20 25 30Arg Pro Gly Gly Phe Thr Tyr Glu Glu Ile Ile Glu Leu Gly Gly Glu35 40 45Gln Trp Ser His Cys Lys Val Glu Asn Arg Met Thr Val Gly Ser Gly50 55 60Glu Lys Val Arg Thr Pro Gly Met Lys Tyr Lys His Tyr Ser Pro Arg65 70 75 80
Ala Ser Thr Val Ala Phe Ala Pro Ile Asn Asp Asp Leu Pro Thr Ser85 90 95Glu Arg Met Lys Ile Val Thr Ser Glu Ile Met Lys Tyr Met Thr Ser100 105 110His Gly Thr Asp Lys Arg Gln Lys Val Gly Leu Leu Thr Ser Ile Met115 120 125Phe Pro Asn Asn Leu Leu Glu Ser Ile Thr Asp Glu Val Asp Val Val130 135 140Val Tyr Ser Leu Gly Ser Ser Gly Lys Glu Val Gln Ser Asn Leu Phe145 150 155 160Ala Met Leu Arg Arg Leu Asp Glu Glu Asp Glu Val Asp Leu Ile Phe165 170 175Val Glu Gly Ile Ser Asp Arg Asn Glu Gly Leu Ala Val Met Asn Arg180 185 190Leu Arg Lys Ala Ala Gly Gly Asn Val Val Ser Phe195 200<210> 24<211> 2641<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (277)..(1476)<223>
<220>
<221> misc_feature<223> Oligo 172<400> 24caagaccaat ccggtcccat ctctatcgga gaacgttgtt gttcggagca ccataccgtt 60tgatggggcg gcaaaggcgt gaattacatt ttcgatcacg tgacataact gagaaaaatc 120gctgcgtctt cgaactgctc gtggcatccg ccgttgtatg tctataatga actgatgccg 180cagaacacaa gtgtatttgg tggcctcgaa ttttgacagt ttatgcagag gtccttctct 240tttcttcgga ggtcaggttt tcatagcgca atgtca tat aac act aag gta ctg 294Tyr Asn Thr Lys Val Leu1 5agg gta gac cca agt gcg ata cacttc tcg gca act gcg cat att gat342
Arg Val Asp Pro Ser Ala Ile His Phe Ser Ala Thr Ala His Ile Asp10 15 20ggg tcc ctg ccg cgg att tcg gac cca gag acg gag aaa cac tta ctc 390Gly Ser Leu Pro Arg Ile Ser Asp Pro Glu Thr Glu Lys His Leu Leu25 30 35gag gct gcc aga ctt atc cgg gat gat ggc gag acg gtt gcg ttt ccg 438Glu Ala Ala Arg Leu Ile Arg Asp Asp Gly Glu Thr Val Ala Phe Pro40 45 50aca gaa act gta tat gga ctg ggg ggg tcg tct ctg aat gat act tcg 486Thr Glu Thr Val Tyr Gly Leu Gly Gly Ser Ser Leu Asn Asp Thr Ser55 60 65 70gtg cgc aat atc tac aag gca aag aac aga ccc agt gac aat cca ctg 534Val Arg Asn Ile Tyr Lys Ala Lys Asn Arg Pro Ser Asp Asn Pro Leu75 80 85atc agc cat gtg tca tct att gca cag cta aac cgt cgc ata tac cag 582Ile Ser His Val Ser Ser Ile Ala Gln Leu Asn Arg Arg Ile Tyr Gln90 95 100cag gat aga gag ggc gat gtt ctg cgg aat att cct gta gtg tac cac 630Gln Asp Arg Glu Gly Asp Val Leu Arg Asn Ile Pro Val Val Tyr His105 110 115gag cta gtt cgt caa ctg tgg cct ggt cca ctc act atc ctt ctc cct 678Glu Leu Val Arg Gln Leu Trp Pro Gly Pro Leu Thr Ile Leu Leu Pro120 125 130atc aac gag gag acc gct cta tct gta ctc acg aca gca ggc cag cca 726Ile Asn Glu Glu Thr Ala Leu Ser Val Leu Thr Thr Ala Gly Gln Pro135 140 145 150acc ttt gct gtt cgc atc ccc gca gat cca gta gcg agg gca ctg att 774Thr Phe Ala Val Arg Ile Pro Ala Asp Pro Val Ala Arg Ala Leu Ile155 160 165gct ctt agc gac acc ccc att gct gcg ccg tcg gct aac gtc tca act 822Ala Leu Ser Asp Thr Pro Ile Ala Ala Pro Ser Ala Asn Val Ser Thr170 175 180agg cct tct ccg acg gcc gct gag cat gta tac cat gac tta aag gga 870Arg Pro Ser Pro Thr Ala Ala Glu His Val Tyr His Asp Leu Lys Gly185 190 195aag ata cca cta att cta gat ggt gga agt tgc cgt gtt ggg gtt gag 918Lys Ile Pro Leu Ile Leu Asp Gly Gly Ser Cys Arg Val Gly Val Glu200 205 210tct act gtc atc gat ggc ttg gta aat ccg cca atg ttg tta cgt cct 966Ser Thr Val Ile Asp Gly Leu Val Asn Pro Pro Met Leu Leu Arg Pro215 220 225 230gga gga ttt acg tat gaa gaa atc atc gaa cta ggc ggg gag caa tgg 1014Gly Gly Phe Thr Tyr Glu Glu Ile Ile Glu Leu Gly Gly Glu Gln Trp235 240 245tcc cat tgt aaa gtt gag aat agg atg act gta ggg agt ggg gaa aag 1062Ser His Cys Lys Val Glu Asn Arg Met Thr Val Gly Ser Gly Glu Lys250 255 260gtt aga act ccc ggt atg aag tac aaa cat tac tct cct agg gcc tcc 1110Val Arg Thr Pro Gly Met Lys Tyr Lys His Tyr Ser Pro Arg Ala Ser265 270 275
act gta gca ttt gcc cca att aac gat gat ctt cca acg agc gaa agg 1158Thr Val Ala Phe Ala Pro Ile Asn Asp Asp Leu Pro Thr Ser Glu Arg280 285 290atg aag att gtg acc tcc gaa ata atg aaa tac atg aca agc cat ggc 1206Met Lys Ile Val Thr Ser Glu Ile Met Lys Tyr Met Thr Ser His Gly295 300 305 310acc gat aag cgc caa aaa gtg ggg cta ctg aca agc att atg ttc ccc 1254Thr Asp Lys Arg Gln Lys Val Gly Leu Leu Thr Ser Ile Met Phe Pro315 320 325aat aac tta ctg gaa tcc att acg gac gaa gtt gat gtt gtg gtt tat 1302Asn Asn Leu Leu Glu Ser Ile Thr Asp Glu Val Asp Val Val Val Tyr330 335 340tca ttg ggc tcc tct ggg aaa gaa gtt caa tcg aat ttg ttt gcc atg 1350Ser Leu Gly Ser Ser Gly Lys Glu Val Gln Ser Asn Leu Phe Ala Met345 350 355ctg cga agg ctg gac gag gaa gat gag gtg gat ttg ata ttt gtt gaa 1398Leu Arg Arg Leu Asp Glu Glu Asp Glu Val Asp Leu Ile Phe Val Glu360 365 370ggt att agc gat agg aat gag gga ctg gca gtg atg aat aga tta aga 1446Gly Ile Ser Asp Arg Asn Glu Gly Leu Ala Val Met Asn Arg Leu Arg375 380 385 390aaa gcc gct ggg ggg aac gta gtg tca ttt taatgaaccg ggtagtcgca1496Lys Ala Ala Gly Gly Asn Val Val Ser Phe395 400catttcatcg tcaatagaaa cagccggtgg gcaatattga tcgatcgttt tgtgtcgctt1556gttggataac tttatctgat aaatacaccc tatatgcttg tgtatatgtt tagtatataa1616atgactttat catctctgga tgaaaaaata agagaaaaca acatactgca ctctgtgaat1676taaaccatgg aaaagtaata tgcgtcttga tgggtattct ttttggcgta atactttcga1736acttcatctg caatgaaaac actgctactg attacaatca aataaatgag atcccccagg1796ctcaggcgct ctgtcttgaa gatattctgg aaaaatggaa tgtaaatagc gcacaactga1856cctagtaatg agaaaccaac agcatagtta aacatcttat tattgaagat accaatttcg1916aaaatggact tcgtaggcat gcctacacgc tagaggctgc tgaacatatc aaaaaacacg1976aaacaggtaa acgtcattgt ggtgtctctc gcaggtaacc tgtccatcct cagtcatttc2036cttgatgaac acgtagatag taccaccaat gataaaggct gcattgataa ggagtctccg2096cataacttgg ggagtcaaga tcttgtctga acgttttctt ggaggcttcc tcattacttc2156gtggtcaact ggctccacac ctagggattg cgcgggtgga ccgtccatca atatgttgat2216ccataatatc tgcatggcat ttaacggatt ttgaagctta aatgcagtag ctatggcgac2276aagtgacaag gctgcgacag aggtagacaa ttgaaacgtt agaaaactct gaatattgtt2336aaaaataccc ttgccttctt caatagcggt taggatggtg ctgaagtcat catcagttaa2396taccatatca aaagcttctt tcgcaacatc agtacccata tggcccatgg cgacaccgat2456
atcagccaat ttcaatgcag gtgcgtcgtt aacaccatct cctgtcatag cgacaatgtc2516gcccctcttc tgcaaagcac gcacaatatt cagcttgtgt tcacgtgtag cccgagcaaa2576aatattcaca tgatcgatcc gccggccaga tggtccatca atcctttggt caagtctatc2636accgg2641<210> 25<211> 400<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 172<400> 25Tyr Asn Thr Lys Val Leu Arg Val Asp Pro Ser Ala Ile His Phe Ser1 5 10 15Ala Thr Ala His Ile Asp Gly Ser Leu Pro Arg Ile Ser Asp Pro Glu20 25 30Thr Glu Lys His Leu Leu Glu Ala Ala Arg Leu Ile Arg Asp Asp Gly35 40 45Glu Thr Val Ala Phe Pro Thr Glu Thr Val Tyr Gly Leu Gly Gly Ser50 55 60Ser Leu Asn Asp Thr Ser Val Arg Asn Ile Tyr Lys Ala Lys Asn Arg65 70 75 80Pro Ser Asp Asn Pro Leu Ile Ser His Val Ser Ser Ile Ala Gln Leu85 90 95Asn Arg Arg Ile Tyr Gln Gln Asp Arg Glu Gly Asp Val Leu Arg Asn100105 110Ile Pro Val Val Tyr His Glu Leu Val Arg Gln Leu Trp Pro Gly Pro115 120 125Leu Thr Ile Leu Leu Pro Ile Asn Glu Glu Thr Ala Leu Ser Val Leu130 135 140Thr Thr Ala Gly Gln Pro Thr Phe Ala Val Arg Ile Pro Ala Asp Pro145 150 155 160Val Ala Arg Ala Leu Ile Ala Leu Ser Asp Thr Pro Ile Ala Ala Pro165 170 175Ser Ala Asn Val Ser Thr Arg Pro Ser Pro Thr Ala Ala Glu His Val
180 185 190Tyr His Asp Leu Lys Gly Lys Ile Pro Leu Ile Leu Asp Gly Gly Ser195 200 205Cys Arg Val Gly Val Glu Ser Thr Val Ile Asp Gly Leu Val Asn Pro210 215 220Pro Met Leu Leu Arg Pro Gly Gly Phe Thr Tyr Glu Glu Ile Ile Glu225 230 235 240Leu Gly Gly Glu Gln Trp Ser His Cys Lys Val Glu Asn Arg Met Thr245 250 255Val Gly Ser Gly Glu Lys Val Arg Thr Pro Gly Met Lys Tyr Lys His260 265 270Tyr Ser Pro Arg Ala Ser Thr Val Ala Phe Ala Pro Ile Asn Asp Asp275 280 285Leu Pro Thr Ser Glu Arg Met Lys Ile Val Thr Ser Glu Ile Met Lys290 295 300Tyr Met Thr Ser His Gly Thr Asp Lys Arg Gln Lys Val Gly Leu Leu305 310 315 320Thr Ser Ile Met Phe Pro Asn Asn Leu Leu Glu Ser Ile Thr Asp Glu325 330 335Val Asp Val Val Val Tyr Ser Leu Gly Ser Ser Gly Lys Glu Val Gln340 345 350Ser Asn Leu Phe Ala Met Leu Arg Arg Leu Asp Glu Glu Asp Glu Val355 360 365Asp Leu Ile Phe Val Glu Gly Ile Ser Asp Arg Asn Glu Gly Leu Ala370 375 380Val Met Asn Arg Leu Arg Lys Ala Ala Gly Gly Asn Val Val Ser Phe385 390 395 400<210> 26<211> 609<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 63
<220>
<221> misc_feature<222> (470)..(470)<223> 未知核苷酸<220>
<221> misc_feature<222> (518)..(518)<223> 未知核苷酸<220>
<221> misc_feature<222> (536)..(536)<223> 未知核苷酸<400> 26gatcataaac gaagaattcc taattaacaa tttgtcctgc atgtacttcc tcagtgagaa60atagcagata taatcattag aaagcttccc cgagcacttt agcagcaccg catgccagca120taaccccctg gactcagggc agtatgccag gctggcacct cggcacctca tcgcaggcga180gacagtccac cactgcgagc accgtagtat ttatactttt ccaggttgaa aaattttcga240ccgccccacg ccgcagaggg ctggacgcgc attagggctc acagcggtcg actgccactg300ctgccccaac agcgccgcgc atgtaacgtg aaatgatata ttataccttc tgactacaat360gtgaaatata caaaggtggc tcataggcgc attgcattta ttcagacgca gtagctctgg420tgtagatagc ctgcttggag tgcttggaga ttggcttgat gatgccctcn gtctccaagt480gtctcatagc aactctggcc atggaaccgc cgatcttnaa tctgtcgacc aacacngaca540cagagacgta tctgtagggt tgggaccctc ctttaagatt ctgtcaagct tgtcctggtc600caagatgac609<210> 27<211> 16<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 63<400> 27Val Ile Leu Asp Gln Asp Lys Leu Asp Arg Ile Lau Lys Glu Gly Pro1 5 10 15<210> 28<211> 52<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 63<220>
<221> misc_feature<222> (13)..(13)<223> 未知氨基酸<400> 28Tyr Arg Tyr Val Ser Val Ser Val Leu Val Asp Arg Xaa Lys Ile Gly1 5 10 15Gly Ser Met Ala Arg Val Ala Met Arg His Leu Glu Thr Glu Gly Ile20 25 30Ile Lys Pro Ile Ser Lys His Ser Lys Gln Ala Ile Tyr Thr Arg Ala35 40 45Thr Ala Ser Glu50<210> 29<211> 1850<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (533)..(856)<223>
<220>
<221> misc_feature<223> Oligo 63<400> 29tagccgcgat ctaccaagcg ctgccggtac ccttacagcc cgcctccaac acgtccgtgt60gccgtcttgt ctccgcagcc gctgctcttc ccattagttt ctccgctccg cttcgaaccc120cagccctcaa cgggcggcgg cgctagccgc tgcaccacca aagcgaaaat tgtaaatcgt180cgcttacgaa agagggtacc ccttctgtga ctgcacatcc gtacatccat ggactccgcc240aaatctgagt tcggaccgac gcaatactgg ttccgcaacg ggccctgctc accactgaat300cctcccacgc tctattgatt aaagcagaag agctaagtaa gtcgctgaag tctggcaaag360tagaaaccag ctaggaacat ttagagtatg tgagaggaca tgtgggacca acgccgttga420ggcgcgtagg cgttcaggcg cgcaggaggc taccggcacg cctgcagcca cgcctgccgc480cagaagagcg gccagctcgc tgccggacag ctactaacga gcacacagta at atg cca538Met Pro1
cca aaa caa caa tta tct aag gcc cag aag gcc gcc gcc gcc atg gcc 586Pro Lys Gln Gln Leu Ser Lys Ala Gln Lys Ala Ala Ala Ala Met Ala5 10 15ggt ggt aag aag tcc aag aag aag tgg tcc aag aag tcc cac aag gac 634Gly Gly Lys Lys Ser Lys Lys Lys Trp Ser Lys Lys Ser His Lys Asp20 25 30aag gcc cag cac gcc gtc atc ttg gac cag gac aag ctt gac aga atc 682Lys Ala Gln His Ala Val Ile Leu Asp Gln Asp Lys Leu Asp Arg Ile35 40 45 50cta aag gag gtc cca acc tac aga tac gtc tct gtg tcc gtg ttg gtc 730Leu Lys Glu Val Pro Thr Tyr Arg Tyr Val Ser Val Ser Val Leu Val55 60 65gac aga ttg aag atc ggc ggt tcc atg gcc aga gtt gct ttg aga cac 778Asp Arg Leu Lys Ile Gly Gly Ser Met Ala Arg Val Ala Leu Arg His70 75 80ttg gag acc gag ggc atc atc aag cca atc tcc aag cac tcc aag cag 826Leu Glu Thr Glu Gly Ile Ile Lys Pro Ile Ser Lys His Ser Lys Gln85 90 95gct atc tac acc aga gct act gcg tct gaa taaatgcaat gcgcctatga 876Ala Ile Tyr Thr Arg Ala Thr Ala Ser Glu100 105gccacctttg tatatttcac attgtagtca gaaggtataa tatatcattt cacgttacat 936gcgcggcgct gttggggcag cagtggcagt cgaccgctgt gagccctaat gcgcgtccag 996ccctctgcgg cgtggggcgg tcgaaaattt ttcaacctgg aaaagtataa atactacggt 1056gctcgcagtg gtggactgtc tcgcctgcga tgaggtgccg aggtgccagc cggcatactg 1116ccctgagtcc agggggttat gctggcatgc ggtgctgcta aagtgctcgg ggaagctttc 1176taatgattat atcgctattt ctcactgagg aagtacatgc aggacaaatt gttaattagg 1236aattcttcgt ttatgatcgg agagcacctc ccccagcgca gcactgcgca gcccaaccat 1296gagaccatgg tgtccgacag aaggtgtgct tcgccgttct atgatgaata gcttccacag 1356ctctcgatcc ggcgatgatt ctcaggaata tgtgccagga tatatcatgc atcaccatct 1416gagattcgaa caggtaaagt cttctgctgg attggccgta tgcgttcttc tagatgatga 1476taaaactttt tattcagttc tgcttctgaa catctaggaa gataactcta ttaccaaagc 1536tcaaaactct gacaggagga acgcataacg gtctgggctg ctagtgccaa agagtaacgt 1596aaaatctaac gaaagtactt agtgggcagg gccgcctgct cagagcctct tgcgggcctc 1656ttcctgagtg accttctgct cccgtagttt ccggagcagg aagtcttgca cggcgtccca 1716gcgttcgcgc tggctcgcgg ggaaccacac gcttcagctt ggaaagaatc cgcaccacgg 1776ttgtctgcac gtaaaaggga aaagttcagc tttgagccag tagatggccc agtagaagaa 1836cagcgcgaac cccc 1850<210> 30
<211> 108<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 63<400> 30Met Pro Pro Lys Gln Gln Leu Ser Lys Ala Gln Lys Ala Ala Ala Ala1 5 10 15Met Ala Gly Gly Lys Lys Ser Lys Lys Lys Trp Ser Lys Lys Ser His20 25 30Lys Asp Lys Ala Gln His Ala Val Ile Leu Asp Gln Asp Lys Leu Asp35 40 45Arg Ile Leu Lys Glu Val Pro Thr Tyr Arg Tyr Val Ser Val Ser Val50 55 60Leu Val Asp Arg Leu Lys Ile Gly Gly Ser Met Ala Arg Val Ala Leu65 70 75 80Arg His Leu Glu Thr Glu Gly Ile Ile Lys Pro Ile Ser Lys His Ser85 90 95Lys Gln Ala Ile Tyr Thr Arg Ala Thr Ala Ser Glu100 105<210> 31<211> 933<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 132<400> 31gatcctagaa ttgcggtgga atatcttctc ctaatcgctt tagcgcacga agactcacaa60attgaacttg ctcacgaagc attgagggag cctggtccta gatactaaag agttcaccat120acctcctcgg aaaaatcaac agggatggca ccaggatacc gggcattatc gaggagagac180agcctctgct ttacttggcc gacaaagagg actttttgca taagattacg gagcaggcag240cgcgcagagc agatgaaaat ggcagagtct acgacagtct gctactgtat cagctggcgg300aagagtacga tattgtcatt agcattgtta ataagctgct gagcgaaatg ttgagcaaca360ctgacctggc gcaacccctg atgcggcagg acgacaatag cgagactaac cctgttctaa420tcgccaagaa gctcattgat gtctatatca agaacttgga aatttcaaag aaggtacaca480
ggaaaaacaa ggaaacatgc attctgctcc tgaaactcgt ggatataagg agaacatata 540ttgcaagaca gtggcaaaac accctgcagc agatagagga gctggatctg cttccatctg 600tcgaagactc ttccccaagg aagaaggcgc aggaattcca caacctggac gactgtatca 660taaagaatgt ccccaacctg ttgatcatcg ccatgacctg cgtttctaac ctcatcaagc 720agttgagcaa gggccccttc tccaacgggg ccacgcaagc tcaaggtcga ggctctgaag 780aaggtcgcca acaactacat gatctacaga ggcatgatcc agtacaagat gcctcgggag 840gtgtacaaca ccctcataaa catcgaggtg gacctctgac cgctcgtcag accacgatgc 900agtgtgtacc agaccagtat tatagattag atc 933<210> 32<211> 30<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 132<400> 32Asp Pro Arg Ile Ala Val Glu Tyr Leu Leu Leu Ile Ala Leu Ala His1 5 10 15Glu Asp Ser Gln Ile Glu Leu Ala His Glu Ala Leu Arg Glu20 25 30<210> 33<211> 10<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 132<400> 33Leu Val Leu Asp Thr Lys Glu Phe Thr Ile1 5 10<210> 34<211> 219<212> PRT<213> 棉桃阿舒氏囊霉<400> 34Lys Ser Ser Pro Tyr Leu Leu Gly Lys Ile Asn Arg Asp Gly Thr Arg1 5 10 15
Ile Pro Gly Ile Ile Glu Glu Arg Gln Pro Leu Leu Tyr Leu Ala Asp20 25 30Lys Glu Asp Phe Leu His Lys Ile Thr Glu Gln Ala Ala Arg Arg Ala35 40 45Asp Glu Asn Gly Arg Val Tyr Asp Ser Leu Leu Leu Tyr Gln Leu Ala50 55 60Glu Glu Tyr Asp Ile Val Ile Ser Ile Val Asn Lys Leu Leu Ser Glu65 70 75 80Met Leu Ser Asn Thr Asp Leu Ala Gln Pro Leu Met Arg Gln Asp Asp85 90 95Asn Ser Glu Thr Asn Pro Val Leu Ile Ala Lys Lys Leu Ile Asp Val100 105 110Tyr Ile Lys Asn Leu Glu Ile Ser Lys Lys Val His Arg Lys Asn Lys115 120 125Glu Thr Cys Ile Leu Leu Leu Lys Leu Val Asp Ile Arg Arg Thr Tyr130 135 140Ile Ala Arg Gln Trp Gln Asn Thr Leu Gln Gln Ile Glu Glu Leu Asp145 150 155 160Leu Leu Pro Ser Val Glu Asp Ser Ser Pro Arg Lys Lys Ala Gln Glu165 170 175Phe His Asn Leu Asp Asp Cys Ile Ile Lys Asn Val Pro Asn Leu Leu180 185 190Ile Ile Ala Met Thr Cys Val Ser Asn Leu Ile Lys Gln Leu Ser Lys195 200 205Gly Pro Phe Ser Asn Gly Ala Thr Gln Ala Gln210 215<210> 35<211> 38<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 132<400> 35Lys Val Glu Ala Leu Lys Lys Val Ala Asn Asn Tyr Met Ile Tyr Arg
1 5 10 15Gly Met Ile Gln Tyr Lys Met Pro Arg Glu Val Tyr Asn Thr Leu Ile20 25 30Asn Ile Glu Val Asp Leu35<210> 36<211> 3969<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (629)..(3181)<223>
<220>
<221> misc_feature<223> Oligo 132<400> 36catgacagct gtgccactta tcccacggaa gactagtggc agacgactac cacgatttag60tagctttaaa tccagctatt cgacgagctc aggtccaaga tttactgtgt gagagacgat120caattcactg cggcctacaa taatccggat acgagggcta ttccaaacgg tttaactgtc180gagctaaatg atgggactac cttggaagag gttgttgtcg agtaccctat tggccataag240actagacgtg cagaggcaga accgaagctg cttgagaagt tctacaggca tttgtcaggg300cactttgagg gcgacattac taaggtcgag caagtaatga caatgtccac tgacccagag360tttgagtcct atagtatcga ccagtatgta gacactttct gtcgttgacg gtatctagat420ccaacaaatg tactaagtta cgtaacagtt ttatgatgat gttacataat cttcccagtc480gccggagctt cgcgtcaatg atatccgggt aatacttttc tgtcaacaaa attttctcta540gggatgaatg aagttttcat ctatcagcaa gtacagtata agcagtttgt tattataaga600agtacggcag ctgccttctt cgtctaac atg aat aac tcc atc aat gca tcg 652Met Asn Asn Ser Ile Asn Ala Ser1 5gat tta cgg agc gtc agc ccg cac gaa gcc ccc tta aag ggc gtg tcg 700Asp Leu Arg Ser Val Ser Pro His Glu Ala Pro Leu Lys Gly Val Ser10 15 20aag acc ttt aat gat ttg att gaa acg tcc aag aat ctg cct tct aca 748Lys Thr Phe Asn Asp Leu Ile Glu Thr Ser Lys Asn Leu Pro Ser Thr25 30 35 40tca tcc gag ttg ggt tcc gta cta ttg aat gtc aat gaa ctc aag aag 796Ser Ser Glu Leu Gly Ser Val Leu Leu Asn Val Asn Glu Leu Lys Lys45 50 55cgg gct gca gag tta aga gct aaa aat gtc aag aac aaa tct cct cac 844
Arg Ala Ala Glu Leu Arg Ala Lys Asn Val Lys Asn Lys Ser Pro His60 65 70cat acc cgg gca cac tat ttg ttg gca gga agt gga ctg gcg att caa 892His Thr Arg Ala His Tyr Leu Leu Ala Gly Ser Gly Leu Ala Ile Gln75 80 85gat gtt gaa tct tct ttg aaa acc ctt gaa tcg aga cag ctg ttg gag 940Asp Val Glu Ser Ser Leu Lys Thr Leu Glu Ser Arg Gln Leu Leu Glu90 95 100cag aat gtc caa aat aag gtt ccc gat gga gat ctt gac acc tac ctg 988Gln Asn Val Gln Asn Lys Val Pro Asp Gly Asp Leu Asp Thr Tyr Leu105 110 115 120cgc aat aaa aaa gat gaa aac atc ctc tcc tct att gag cag tcc ttg 1036Arg Asn Lys Lys Asp Glu Asn Ile Leu Ser Ser Ile Glu Gln Ser Leu125 130 135tct ttg gcg gca aag gat ttt gat aat ttt gtc aat gcg aac ttc aat 1084Ser Leu Ala Ala Lys Asp Phe Asp Asn Phe Val Asn Ala Asn Phe Asn140 145 150ctg gac tgg aag aag cat aag gag gaa gtg aag agg agc ttt ttg ggt 1132Leu Asp Trp Lys Lys His Lys Glu Glu Val Lys Arg Ser Phe Leu Gly155 160 165ctc gta tgg aag tcg gat cca aac cac aag agt cca act tct gtg tct 1180Leu Val Trp Lys Ser Asp Pro Asn His Lys Ser Pro Thr Ser Val Ser170 175 180gaa cca tca ttt atg acc tgg ccc aag aaa ggt agc gga ata ttg gat 1228Glu Pro Ser Phe Met Thr Trp Pro Lys Lys Gly Ser Gly Ile Leu Asp185 190 195 200ggt gaa tca aag ctg aat atc aac gaa aac tac gtt gtg aga gag aag 1276Gly Glu Ser Lys Leu Asn Ile Asn Glu Asn Tyr Val Val Arg Glu Lys205 210 215ttt gaa aaa tac gcc aga ata atc aat cgg ttc aac aat gcc aga cag 1324Phe Glu Lys Tyr Ala Arg Ile Ile Asn Arg Phe Asn Asn Ala Arg Gln220 225 230ctg cat aat aat ttc cct ttg acg aca gag ttt att act cta ttc caa 1372Leu His Asn Asn Phe Pro Leu Thr Thr Glu Phe Ile Thr Leu Phe Gln235 240 245aat tcc gca gac tac aaa cag agg cag ctg ctc gaa gca tgg aag atc 1420Asn Ser Ala Asp Tyr Lys Gln Arg Gln Leu Leu Glu Ala Trp Lys Ile250 255 260ctt gat aat tac cgc ttg tgt tcg gat tct atg aat att gtg gat att 1468Leu Asp Asn Tyr Arg Leu Cys Ser Asp Ser Met Asn Ile Val Asp Ile265 270 275 280tca aaa ggg tat ctt gaa aac caa ttc atg gac tac gtc gac aat cta 1516Ser Lys Gly Tyr Leu Glu Asn Gln Phe Met Asp Tyr Val Asp Asn Leu285 290 295tac ccc aaa aat gga aat gaa gga ttg cct act aac att aat aag atc 1564Tyr Pro Lys Asn Gly Asn Glu Gly Leu Pro Thr Asn Ile Asn Lys Ile300 305 310aaa tcc ttc att gat tgt aaa tta aaa aat cca aat aac act tgg aag 1612Lys Ser Phe Ile Asp Cys Lys Leu Lys Asn Pro Asn Asn Thr Trp Lys315 320 325
ttt ggc aac ttg acg atc gtc aat ggt gtt cct gtg tgg gcc ttg atc 1660Phe Gly Asn Leu Thr Ile Val Asn Gly Val Pro Val Trp Ala Leu Ile330 335 340ttt tat cta tta agg gcc ggt aag ttc cag gaa gct ttg gag gtc gcc 1708Phe Tyr Leu Leu Arg Ala Gly Lys Phe Gln Glu Ala Leu Glu Val Ala345 350 355 360ata aac aat aag cta agt tta aaa aag gtg gag cag tct ttc ctg gta 1756Ile Asn Asn Lys Leu Ser Leu Lys Lys Val Glu Gln Ser Phe Leu Val365 370 375tac ttc aaa gca tat gtc tcc tct aaa gac aag cgg ctg cca cag gag 1804Tyr Phe Lys Ala Tyr Val Ser Ser Lys Asp Lys Arg Leu Pro Gln Glu380 385 390ttc att act aga ttg cac acg gag tac aat caa cac att aaa aac tcc 1852Phe Ile Thr Arg Leu His Thr Glu Tyr Asn Gln His Ile Lys Asn Ser395 400 405ctc gat ggc gac ccc ttc aga ctc gcc gtt tac aag atc att gga aga 1900Leu Asp Gly Asp Pro Phe Arg Leu Ala Val Tyr Lys Ile Ile Gly Arg410 415 420tgt gat ctg acg aga aag aat att tcc gct ata acg ctg agt gtt gaa 1948Cys Asp Leu Thr Arg Lys Asn Ile Ser Ala Ile Thr Leu Ser Val Glu425 430 435 440gac tgg cta tgg gtc cac ttc atg ttg ata aaa gac ggc atc tcc agc 1996Asp Trp Leu Trp Val His Phe Met Leu Ile Lys Asp Gly Ile Ser Ser445 450 455gac gac cca gtt tat gag aga tat agc ctg gtc gac ttc caa aac atc 2044Asp Asp Pro Val Tyr Glu Arg Tyr Ser Leu Val Asp Phe Gln Asn Ile460 465 470atc acg tct tat ggc tct tcc agc ttc aat aac cac tac ttg caa gtc 2092Ile Thr Ser Tyr Gly Ser Ser Ser Phe Asn Asn His Tyr Leu Gln Val475 480 485cta ctt ctc agc ggt caa tat gaa cta gct gtc caa tat gcc tac act 2140Leu Leu Leu Ser Gly Gln Tyr Glu Leu Ala Val Gln Tyr Ala Tyr Thr490 495 500att aac gaa att gac gct gtt cat ttg gcg atc gct ctg gcg gat tat 2188Ile Asn Glu Ile Asp Ala Val His Leu Ala Ile Ala Leu Ala Asp Tyr505 510 515 520aaa tta ttg aag gtg gca gct aat gtg act gac gat gag ttt gtc acg 2236Lys Leu Leu Lys Val Ala Ala Asn Val Thr Asp Asp Glu Phe Val Thr525 530 535tcg ccc act ggc gag aga aag atc aac ttt gca aag att ctg ggg aac 2284Ser Pro Thr Gly Glu Arg Lys Ile Asn Phe Ala Lys Ile Leu Gly Asn540 545 550tat aca aag tcc ttc aag ttc tct gat cct aga gtt gcg gtg gaa tat 2332Tyr Thr Lys Ser Phe Lys Phe Ser Asp Pro Arg Val Ala Val Glu Tyr555 560 565ctt ctc cta atc gct tta gcg cac gaa gac tca caa att gaa ctt gct 2380Leu Leu Leu Ile Ala Leu Ala His Glu Asp Ser Gln Ile Glu Leu Ala570 575 580cac gaa gca ttg agg gag ctg gtc cta gat act aaa gag ttc acc ata 2428
His Glu Ala Leu Arg Glu Leu Val Leu Asp Thr Lys Glu Phe Thr Ile585 590 595 600ctc ctc gga aaa atc aac agg gat ggc acc agg ata ccg ggc att atc 2476Leu Leu Gly Lys Ile Asn Arg Asp Gly Thr Arg Ile Pro Gly Ile Ile605 610 615gag gag aga cag cct ctg ctt tac ttg gcc gac aaa gag gac ttt ttg 2524Glu Glu Arg Gln Pro Leu Leu Tyr Leu Ala Asp Lys Glu Asp Phe Leu620 625 630cat aag att acg gag cag gca gcg cgc aga gca gat gaa aat ggc aga 2572His Lys Ile Thr Glu Gln Ala Ala Arg Arg Ala Asp Glu Asn Gly Arg635 640 645gtc tac gac agt ctg cta ctg tat cag ctg gcg gaa gag tac gat att 2620Val Tyr Asp Ser Leu Leu Leu Tyr Gln Leu Ala Glu Glu Tyr Asp Ile650 655 660gtc att agc att gtt aat aag ctg ctg agc gaa atg ttg agc aac act 2668Val Ile Ser Ile Val Asn Lys Leu Leu Ser Glu Met Leu Ser Asn Thr665 670 675 680gac ctg gcg caa ccc ctg atg cgg cag gac gac aat agc gag act aac 2716Asp Leu Ala Gln Pro Leu Met Arg Gln Asp Asp Asn Ser Glu Thr Asn685 690 695cct gtt cta atc gcc aag aag ctc att gat gtc tat atc aag aac ttg 2764Pro Val Leu Ile Ala Lys Lys Leu Ile Asp Val Tyr Ile Lys Asn Leu700 705 710gaa att tca aag aag gta cac agg aaa aac aag gaa aca tgc att ctg 2812Glu Ile Ser Lys Lys Val His Arg Lys Asn Lys Glu Thr Cys Ile Leu715 720 725ctc ctg aaa ctc gtg gat ata agg aga aca tat att gca aga cag tgg 2860Leu Leu Lys Leu Val Asp Ile Arg Arg Thr Tyr Ile Ala Arg Gln Trp730 735 740caa aac acc ctg cag cag ata gag gag ctg gat ctg ctt cca tct gtc 2908Gln Asn Thr Leu Gln Gln Ile Glu Glu Leu Asp Leu Leu Pro Ser Val745 750 755 760gaa gac tct tcc cca agg aag aag gcg cag gaa ttc cac aac ctg gac 2956Glu Asp Ser Ser Pro Arg Lys Lys Ala Gln Glu Phe His Asn Leu Asp765 770 775gac tgt atc ata aag aat gtc ccc aac ctg ttg atc atc gcc atg acc 3004Asp Cys Ile Ile Lys Asn Val Pro Asn Leu Leu Ile Ile Ala Met Thr780 785 790tgc gtt tct aac ctc atc aag cag ttg agc aag ggc ccc ttc tcc aac 3052Cys Val Ser Asn Leu Ile Lys Gln Leu Ser Lys Gly Pro Phe Ser Asn795 800 805ggg gcc acg caa gct caa gtc gag gct ctg aag aag gtc gcc aac aac 3100Gly Ala Thr Gln Ala Gln Val Glu Ala Leu Lys Lys Val Ala Asn Asn810 815 820tac atg atc tac aga ggc atg atc cag tac aag atg cct cgg gag gtg 3148Tyr Met Ile Tyr Arg Gly Met Ile Gln Tyr Lys Met Pro Arg Glu Val825 830 835 840tac aac acc ctc ata aac atc gag gtg gac ctc tgaccgctcg tcagaccacg3201Tyr Asn Thr Leu Ile Asn Ile Glu Val Asp Leu845 850
atgcagtgtg taccagacca gtattataga ttagatccta cgaactttac ctgctattta3261tccccgtgca gatacttctg cctgtactga ctgtagtccg gctggtactc gtacgcgttc3321ggactactgg atctcttccg ttcgagtttc tgccgacgtc tggcgattcg agcctgccgc3381ctcgcttcaa agtccatgct agtgtcgttt tcggattccg aagacgagct cgacgaggca3441ctcgacgatg cgtgctcgca ctcacccccg tcctcgtcgt caaagttctg ctgcgggtgg3501aaaatgcagc atatctttgt cttcttctta ttcatatgct cgttatctac cacattctca3561tcccatctga ctttcgactt ctgctctttc ttggctaact ttggcacctg ttccgtttga3621tttgcccgga gctgaaggat ctgcgatgtc tccgaaacag ttacagtgtg tgacctgtta3681gcaagtgact cctggttgtt gcttgacatc ggaacagctc ttcccacttc cagaccaatc3741taatagtctt aacgttgttt gctcctgatt gtgtaccgct tacatacctt ccagctatta3801tacagaataa ccccttcgta actggtgata tcagcttgta tgggtggcaa attcaagggc3861cttttggcgt attatggttt acaacagcca taatctgaac agcggttaca gagaactgat3921cagatacact agccccttat tcgacgtgga tgggatagat tacagaga 3969<210> 37<211> 851<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 132<400> 37Met Asn Asn Ser Ile Asn Ala Ser Asp Leu Arg Ser Val Ser Pro His1 5 10 15Glu Ala Pro Leu Lys Gly Val Ser Lys Thr Phe Asn Asp Leu Ile Glu20 25 30Thr Ser Lys Asn Leu Pro Ser Thr Ser Ser Glu Leu Gly Ser Val Leu35 40 45Leu Asn Val Asn Glu Leu Lys Lys Arg Ala Ala Glu Leu Arg Ala Lys50 55 60Asn Val Lys Asn Lys Ser Pro His His Thr Arg Ala His Tyr Leu Leu65 70 75 80Ala Gly Ser Gly Leu Ala Ile Gln Asp Val Glu Ser Ser Leu Lys Thr85 90 95Leu Glu Ser Arg Gln Leu Leu Glu Gln Asn Val Gln Asn Lys Val Pro100 105 110
Asp Gly Asp Leu Asp Thr Tyr Leu Arg Asn Lys Lys Asp Glu Asn Ile115 120 125Leu Ser Ser Ile Glu Gln Ser Leu Ser Leu Ala Ala Lys Asp Phe Asp130 135 140Asn Phe Val Asn Ala Asn Phe Asn Leu Asp Trp Lys Lys His Lys Glu145 150 155 160Glu Val Lys Arg Ser Phe Leu Gly Leu Val Trp Lys Ser Asp Pro Asn165 170 175His Lys Ser Pro Thr Ser Val Ser Glu Pro Ser Phe Met Thr Trp Pro180 185 190Lys Lys Gly Ser Gly Ile Leu Asp Gly Glu Ser Lys Leu Asn Ile Asn195 200 205Glu Asn Tyr Val Val Arg Glu Lys Phe Glu Lys Tyr Ala Arg Ile Ile210 215 220Asn Arg Phe Asn Asn Ala Arg Gln Leu His Asn Asn Phe Pro Leu Thr225 230 235 240Thr Glu Phe Ile Thr Leu Phe Gln Asn Ser Ala Asp Tyr Lys Gln Arg245 250 255Gln Leu Leu Glu Ala Trp Lys Ile Leu Asp Asn Tyr Arg Leu Cys Ser260 265 270Asp Ser Met Asn Ile Val Asp Ile Ser Lys Gly Tyr Leu Glu Asn Gln275 280 285Phe Met Asp Tyr Val Asp Asn Leu Tyr Pro Lys Asn Gly Asn Glu Gly290 295 300Leu Pro Thr Asn Ile Asn Lys Ile Lys Ser Phe Ile Asp Cys Lys Leu305 310 315 320Lys Asn Pro Asn Asn Thr Trp Lys Phe Gly Asn Leu Thr Ile Val Asn325 330 335Gly Val Pro Val Trp Ala Leu Ile Phe Tyr Leu Leu Arg Ala Gly Lys340 345 350Phe Gln Glu Ala Leu Glu Val Ala Ile Asn Asn Lys Leu Ser Leu Lys355 360 365
Lys Val Glu Gln Ser Phe Leu Val Tyr Phe Lys Ala Tyr Val Ser Ser370 375 380Lys Asp Lys Arg Leu Pro Gln Glu Phe Ile Thr Arg Leu His Thr Glu385 390 395 400Tyr Asn Gln His Ile Lys Asn Ser Leu Asp Gly Asp Pro Phe Arg Leu405 410 415Ala Val Tyr Lys Ile Ile Gly Arg Cys Asp Leu Thr Arg Lys Asn Ile420 425 430Ser Ala Ile Thr Leu Ser Val Glu Asp Trp Leu Trp Val His Phe Met435 440 445Leu Ile Lys Asp Gly Ile Ser Ser Asp Asp Pro Val Tyr Glu Arg Tyr450 455 460Ser Leu Val Asp Phe Gln Asn Ile Ile Thr Ser Tyr Gly Ser Ser Ser465 470 475 480Phe Asn Asn His Tyr Leu Gln Val Leu Leu Leu Ser Gly Gln Tyr Glu485 490 495Leu Ala Val Gln Tyr Ala Tyr Thr Ile Asn Glu Ile Asp Ala Val His500 505 510Leu Ala Ile Ala Leu Ala Asp Tyr Lys Leu Leu Lys Val Ala Ala Asn515 520 525Val Thr Asp Asp Glu Phe Val Thr Ser Pro Thr Gly Glu Arg Lys Ile530 535 540Asn Phe Ala Lys Ile Leu Gly Asn Tyr Thr Lys Ser Phe Lys Phe Ser545 550 555 560Asp Pro Arg Val Ala Val Glu Tyr Leu Leu Leu Ile Ala Leu Ala His565 570 575Glu Asp Ser Gln Ile Glu Leu Ala His Glu Ala Leu Arg Glu Leu Val580 585 590Leu Asp Thr Lys Glu Phe Thr Ile Leu Leu Gly Lys Ile Asn Arg Asp595 600 605Gly Thr Arg Ile Pro Gly Ile Ile Glu Glu Arg Gln Pro Leu Leu Tyr610 615 620Leu Ala Asp Lys Glu Asp Phe Leu His Lys Ile Thr Glu Gln Ala Ala
625 630 635 640Arg Arg Ala Asp Glu Asn Gly Arg Val Tyr Asp Ser Leu Leu Leu Tyr645 650 655Gln Leu Ala Glu Glu Tyr Asp Ile Val Ile Ser Ile Val Asn Lys Leu660 665 670Leu Ser Glu Met Leu Ser Asn Thr Asp Leu Ala Gln Pro Leu Met Arg675 680 685Gln Asp Asp Asn Ser Glu Thr Asn Pro Val Leu Ile Ala Lys Lys Leu690 695 700Ile Asp Val Tyr Ile Lys Asn Leu Glu Ile Ser Lys Lys Val His Arg705 710 715 720Lys Asn Lys Glu Thr Cys Ile Leu Leu Leu Lys Leu Val Asp Ile Arg725 730 735Arg Thr Tyr Ile Ala Arg Gln Trp Gln Asn Thr Leu Gln Gln Ile Glu740 745 750Glu Leu Asp Leu Leu Pro Ser Val Glu Asp Ser Ser Pro Arg Lys Lys755 760 765Ala Gln Glu Phe His Asn Leu Asp Asp Cys Ile Ile Lys Asn Val Pro770 775 780Asn Leu Leu Ile Ile Ala Met Thr Cys Val Ser Asn Leu Ile Lys Gln785 790 795 800Leu Ser Lys Gly Pro Phe Ser Asn Gly Ala Thr Gln Ala Gln Val Glu805 810 815Ala Leu Lys Lys Val Ala Asn Asn Tyr Met Ile Tyr Arg Gly Met Ile820 825 830Gln Tyr Lys Met Pro Arg Glu Val Tyr Asn Thr Leu Ile Asn Ile Glu835 840 845Val Asp Leu850<210> 38<211> 997<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 174<400> 38gatcatgacc tgcagatgga gctgctccag aatctcgcgc ttcgctatct cgtattttat 60ccgctccgtc tcctcgctct cacgccccag cggcccctcc tccgcacgca gcccgctgta 120ttcgtcgtcg cccagggaaa gctcgtgcgg cgacttcggt gtcgccacct ggtaatatgc 180cggccctgcg ccgatgtgtg ggcgccccgt gatatcctcc gagtccatga gtaatacttg 240cggagatgat attagctgac cgctgtcgct atgtgcaatg ggctcctctg ccccgtggaa 300ttcttccgag cttcgatgct gaatcctgct atgttgtctc ttgttccgaa gcgtccccgt 360taatgtcatt gcacccggcg ttctgtagta taaccgcgtt cctgcgtcgt gctgcccagc 420gcctcaaatt tgatgttccc gactgttcct gcaagtaatt accgaagact gcgcccgctt 480agtctccagg atagaatacg ctcatataaa cccggtcctg actatagaga gtgtgcagag 540agtgcgaaga gcttcgcttg ccctgctcct acgcttgaag agccccatag aaaaaagcgg 600aaacgagaag cctcttcctt tgatgcattt cagccgttcc cgcagtcacg cgaccgcaac 660tctcagatat ttacagcttt tcagtgcttc atttcattag tggcaacatg gccgagcggt 720taaggcgaaa gattagaaat cttttgggct atgcccgcgc aggttcgagt cctgctgttg 780tcgttatttt ttgccgaatc catgtataca tggtcacgtg catgagaggt cacaccacgt 840atgtaagtat agtaaagatt ccgttagagt aaggattaca tattcttctg agcctcaagc 900tccgcaagga ggtcgtcgag cagcgcaacc gtttcctgtg gcgacgatat ccacgctgtg 960cagcctgcga gccgtgcctt gaagtcattc gcagatc997<210> 39<211> 58<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 174<400> 39Tyr Gln Val Ala Thr Pro Lys Ser Pro His Glu Leu Ser Leu Gly Asp1 5 10 15Asp Glu Tyr Ser Gly Leu Arg Ala Glu Glu Gly Pro Leu Gly Arg Glu20 25 30Ser Glu Glu Thr Glu Arg Ile Lys Tyr Glu Ile Ala Lys Arg Glu Ile35 40 45
Leu Glu Gln Leu His Leu Gln Val Met Ile50 55<210> 40<211> 3197<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (964)..(2589)<223>
<220>
<221> misc_feature<223> Oligo 174<400> 40tgcgcctgcc tgcggagacc ccagatcatc cgcaaggtgc gcgcagtggc cattgtaccg60ggggcagcgc tttgaccggg agtgggccgc gaaattcggc gtgccgctgt tgcgcgagac120gctggaggaa atcgttctta cagtccaggg tcggctcgag aacttcccac ccgcgcagcg180tgtgcaattc agctgtttcg acggcggcag cgacgtgtgg tgcgacatcg gcggcaagga240cctcggtgta gccttcctgc agcggttcta ctcgccggag cgtccaatcc gccctgagca300gtccttgcat gtcggtgacc agttcgcccc cgtcggatct gcgaatgact tcaaggcacg360gctcgcaggc tgcacagcgt ggatatcgtc gccacaggaa acggttgcgc tgctcgacga420cctccttgcg gagcttgagg ctcagaagaa tatgtaatcc ttactctaac ggaatcttta480ctatacttac atacgtggtg tgacctctca tgcacgtgac catgtataca tggattcggc540aaaaaataac gacaacagca ggactcgaac ctgcgcgggc atagcccaaa agatttctaa600tctttcgcct taaccgctcg gccatgttgc cactaatgaa atgaagcact gaaaagctgt660aaatatctga gagttgcggt cgcgtgactg cgggaacggc tgaaatgcat caaaggaaga720ggcttctcgt ttccgctttt ttctatgggg ctcttcaagc gtaggagcag ggcaagcgaa780gctcttcgca ctctctgcac actctctata gtcaggaccg ggtttatatg agcgtattct840atcctggaga ctaagcgggc gcagtcttcg gtaattactt gcaggaacag tcgggaacat900caaatttgag gcgctgggca gcacgacgca ggaacgcggt tatactacag aacgccgggt960gca atg aca tta acg ggg acg ctt cgg aac aag aga caa cat agc agg 1008Met Thr Leu Thr Gly Thr Leu Arg Asn Lys Arg Gln His Ser Arg1 5 10 15att cag cat cga agc tcg gaa gaa ttc cac ggg gca gag gag ccc att 1056Ile Gln His Arg Ser Ser Glu Glu Phe His Gly Ala Glu Glu Pro Ile20 25 30gca cat agc gac agc ggt cag cta ata tca tct ccg caa gta tta ctc 1104Ala His Ser Asp Ser Gly Gln Leu Ile Ser Ser Pro Gln Val Leu Leu35 40 45
atg gac tcg gag gat atc acg ggg cgc cca cac atc ggc gca ggg ccg 1152Met Asp Ser Glu Asp Ile Thr Gly Arg Pro His Ile Gly Ala Gly Pro50 55 60gca tat tac cag gtg gcg aca ccg aag tcg ccg cac gag ctt tcc ctg 1200Ala Tyr Tyr Gln Val Ala Thr Pro Lys Ser Pro His Glu Leu Ser Leu65 70 75ggc gac gac gaa tac agc ggg ctg cgt gcg gag gag ggg ccg ctg ggg 1248Gly Asp Asp Glu Tyr Ser Gly Leu Arg Ala Glu Glu Gly Pro Leu Gly80 85 90 95cgt gag agc gag gag acg gag cgg ata aaa tac gag ata gcg aag cgc 1296Arg Glu Ser Glu Glu Thr Glu Arg Ile Lys Tyr Glu Ile Ala Lys Arg100 105 110gag att ctg gag cag ctc cat ctg cag gtc atg atc aag cat cga gaa 1344Glu Ile Leu Glu Gln Leu His Leu Gln Val Met Ile Lys His Arg Glu115 120 125atg gac gac ctg gaa gcc gag tca cgt ggc tta ggg gcg aaa ttg gag 1392Met Asp Asp Leu Glu Ala Glu Ser Arg Gly Leu Gly Ala Lys Leu Glu130 135 140gtg ctg gag atg ttg cat gat gat ccg gag ctc ttg gcc aag gtg gac 1440Val Leu Glu Met Leu His Asp Asp Pro Glu Leu Leu Ala Lys Val Asp145 150 155gcg cac cag gag caa cag gca cag ctg cgt ttg gca cag tta gaa gca 1488Ala His Gln Glu Gln Gln Ala Gln Leu Arg Leu Ala Gln Leu Glu Ala160 165 170 175cgt cgc agg agg gaa caa cag atg gca gcg cta ccc cct gct ccg ctt 1536Arg Arg Arg Arg Glu Gln Gln Met Ala Ala Leu Pro Pro Ala Pro Leu180 185 190tcg tcg agc agt ggt ggt gag tac tat tac cac acc cgc agt aag agc 1584Ser Ser Ser Ser Gly Gly Glu Tyr Tyr Tyr His Thr Arg Ser Lys Ser195 200 205atg aac tcc cat cag ggg agg tct tct acc ctc cgg ccg gct gac ggg 1632Met Asn Ser His Gln Gly Arg Ser Ser Thr Leu Arg Pro Ala Asp Gly210 215 220aat gta atc ggc ctc cgt gtt ttg ggc tca aag acg gtt gca gac gct 1680Asn Val Ile Gly Leu Arg Val Leu Gly Ser Lys Thr Val Ala Asp Ala225 230 235agt agt ccc gga acc acg tca cca cct ttc agc tcc ttt cag cag gca 1728Ser Ser Pro Gly Thr Thr Ser Pro Pro Phe Ser Ser Phe Gln Gln Ala240 245 250 255gac cct ttc gcg ccg caa cat ttc aac cag cat cac agg agg aac tac 1776Asp Pro Phe Ala Pro Gln His Phe Asn Gln His His Arg Arg Asn Tyr260 265 270agc agt aat tgt att tca agc aac agc ggc gta gtc ggg aaa acc gac 1824Ser Ser Asn Cys Ile Ser Ser Asn Ser Gly Val Val Gly Lys Thr Asp275 280 285agc ggg gat gcg att ttt agg cgc ctt gat ggg ctc ctg atc gtt atc 1872Ser Gly Asp Ala Ile Phe Arg Arg Leu Asp Gly Leu Leu Ile Val Ile290 295 300acg tgc tgc aag tgc ggt aag tcg gga ttt acg tct gca caa ggc atc 1920
Thr Cys Cys Lys Cys Gly Lys Ser Gly Phe Thr Ser Ala Gln Gly Ile305 310 315gtc aac cac tcc agg ctg aaa cat gcc aat tct tat tcc agt cag cca 1968Val Asn His Ser Arg Leu Lys His Ala Asn Ser Tyr Ser Ser Gln Pro320 325 330 335cta gct gta ctt cat aac cag sga att ctt ccg gaa gag cag caa aat 2016Leu Ala Val Leu His Asn Gln Xaa Ile Leu Pro Glu Glu Gln Gln Asn340 345 350aaa att gtc atg gat aaa ttt aag gaa ctg cat ctt gac cct cag acg 2064Lys Ile Val Met Asp Lys Phe Lys Glu Leu His Leu Asp Pro Gln Thr355 360 365gag tac ctg ccg aat ccc aca gtg gtc tcc caa agc cca tcc tct agt 2112Glu Tyr Leu Pro Asn Pro Thr Val Val Ser Gln Ser Pro Ser Ser Ser370 375 380gct aat tca aat gca tgt ata aca gct act gaa ggg cgc gat ata tca 2160Ala Asn Ser Asn Ala Cys Ile Thr Ala Thr Glu Gly Arg Asp Ile Ser385 390 395cca aca cat atc tca tcg tcc tta tcg cct acc tgc gtg cag cca gtt 2208Pro Thr His Ile Ser Ser Ser Leu Ser Pro Thr Cys Val Gln Pro Val400 405 410 415tcc caa ttt cac tca act aaa cat ctg gag aag ctc tat ggc aaa gag 2256Ser Gln Phe His Ser Thr Lys His Leu Glu Lys Leu Tyr Gly Lys Glu420 425 430gga ttc cag cag ata gtg gac tat gtc aag gag tct aaa gat gat ttg 2304Gly Phe Gln Gln Ile Val Asp Tyr Val Lys Glu Ser Lys Asp Asp Leu435 440 445ggc ccc ccc atg cgg gtc gat tcg gat atc gat aac gat acg aat tcg 2352Gly Pro Pro Met Arg Val Asp Ser Asp Ile Asp Asn Asp Thr Asn Ser450 455 460ctg cac ccg ggg gat caa tcg gat ttg ctt tca caa cat aat tcg gag 2400Leu His Pro Gly Asp Gln Ser Asp Leu Leu Ser Gln His Asn Ser Glu465 470 475cgt tca acc gac cta aag cgt cgc gca tcg cct aat atg gac aaa gct 2448Arg Ser Thr Asp Leu Lys Arg Arg Ala Ser Pro Asn Met Asp Lys Ala480 485 490 495ctt cgt gaa cga atg cgg cct gct gag aag cgg gtg agg ccc gac gct 2496Leu Arg Glu Arg Met Arg Pro Ala Glu Lys Arg Val Arg Pro Asp Ala500 505 510atg gca ctc gtc gag ctc cct gct gaa gag aag aga tca tcg cat tac 2544Met Ala Leu Val Glu Leu Pro Ala Glu Glu Lys Arg Ser Ser His Tyr515 520 525aac tta agg gcc agg tca aag cta aaa tca ctc tcg aaa cat gaa 2589Asn Leu Arg Ala Arg Ser Lys Leu Lys Ser Leu Ser Lys His Glu530 535 540taatatgtaa gtattgttga gacctcattt cccttcgcat ataagtacta tgtattaata2649tcatagattc tggacggatc atcacttgtt tgctcggact ctctcaggaa acgcttgggc2709gacataggga aatatgtaac gtaccctaac ttcgcgcata ctaaatcaca gccgaaaaca2769ctggggctga acagcatata acacatgttc ctttcgcaac acaagaggag tatagttcga2829
aggatttgtt ggccctcggc taagcgctac cattcggaac tggtgcgctg gttctacgcc2889acggattcgc ccttggaaaa gccgtacgaa ccgaactata agcctgtaaa gcctccggta2949aactttatac cgttctctaa aagcgattcc gaccgtttag agcggttcta tagccttgaa3009aggccctctg agaatcccat ttcggtcaat gaggattatc tgttcgaagt atacttggaa3069gcaagacgtc tgaagcccgc gtattgggat ggccctgttt acgaggtccg gagaggcacc3129tggcttaata gcgatggcat gcctctaagt gaagacctga gcgccgagct actgagctat3189cggccaag 3197<210> 41<211> 542<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<222> (343)..(343)<223> 第343位的′Xaa′代表Gly或Arg.
<220>
<221> misc_feature<223> Oligo 174<400> 41Met Thr Leu Thr Gly Thr Leu Arg Asn Lys Arg Gln His Ser Arg Ile1 5 10 15Gln His Arg Ser Ser Glu Glu Phe His Gly Ala Glu Glu Pro Ile Ala20 25 30His Ser Asp Ser Gly Gln Leu Ile Ser Ser Pro Gln Val Leu Leu Met35 40 45Asp Ser Glu Asp Ile Thr Gly Arg Pro His Ile Gly Ala Gly Pro Ala50 55 60Tyr Tyr Gln Val Ala Thr Pro Lys Ser Pro His Glu Leu Ser Leu Gly65 70 75 80Asp Asp Glu Tyr Ser Gly Leu Arg Ala Glu Glu Gly Pro Leu Gly Arg85 90 95Glu Ser Glu Glu Thr Glu Arg Ile Lys Tyr Glu Ile Ala Lys Arg Glu100 105 110Ile Leu Glu Gln Leu His Leu Gln Val Met Ile Lys His Arg Glu Met115 120 125Asp Asp Leu Glu Ala Glu Ser Arg Gly Leu Gly Ala Lys Leu Glu Val
130 135 140Leu Glu Met Leu His Asp Asp Pro Glu Leu Leu Ala Lys Val Asp Ala145 150 155 160His Gln Glu Gln Gln Ala Gln Leu Arg Leu Ala Gln Leu Glu Ala Arg165 170 175Arg Arg Arg Glu Gln Gln Met Ala Ala Leu Pro Pro Ala Pro Leu Ser180 185 190Ser Ser Ser Gly Gly Glu Tyr Tyr Tyr His Thr Arg Ser Lys Ser Met195 200 205Asn Ser His Gln Gly Arg Ser Ser Thr Leu Arg Pro Ala Asp Gly Asn210 215 220Val Ile Gly Leu Arg Val Leu Gly Ser Lys Thr Val Ala Asp Ala Ser225 230 235 240Ser Pro Gly Thr Thr Ser Pro Pro Phe Ser Ser Phe Gln Gln Ala Asp245 250 255Pro Phe Ala Pro Gln His Phe Asn Gln His His Arg Arg Asn Tyr Ser260 265 270Ser Asn Cys Ile Ser Ser Asn Ser Gly Val Val Gly Lys Thr Asp Ser275 280 285Gly Asp Ala Ile Phe Arg Arg Leu Asp Gly Leu Leu Ile Val Ile Thr290 295 300Cys Cys Lys Cys Gly Lys Ser Gly Phe Thr Ser Ala Gln Gly Ile Val305 310 315 320Asn His Ser Arg Leu Lys His Ala Asn Ser Tyr Ser Ser Gln Pro Leu325 330 335Ala Val Leu His Asn Gln Xaa Ile Leu Pro Glu Glu Gln Gln Asn Lys340 345 350Ile Val Met Asp Lys Phe Lys Glu Leu His Leu Asp Pro Gln Thr Glu355 360 365Tyr Leu Pro Asn Pro Thr Val Val Ser Gln Ser Pro Ser Ser Ser Ala370 375 380Asn Ser Asn Ala Cys Ile Thr Ala Thr Glu Gly Arg Asp Ile Ser Pro385 390 395 400
Thr His Ile Ser Ser Ser Leu Ser Pro Thr Cys Val Gln Pro Val Ser405 410 415Gln Phe His Ser Thr Lys His Leu Glu Lys Leu Tyr Gly Lys Glu Gly420 425 430Phe Gln Gln Ile Val Asp Tyr Val Lys Glu Ser Lys Asp Asp Leu Gly435 440 445Pro Pro Met Arg Val Asp Ser Asp Ile Asp Asn Asp Thr Asn Ser Leu450 455460His Pro Gly Asp Gln Ser Asp Leu Leu Ser Gln His Asn Ser Glu Arg465 470 475 480Ser Thr Asp Leu Lys Arg Arg Ala Ser Pro Asn Met Asp Lys Ala Leu485 490 495Arg Glu Arg Met Arg Pro Ala Glu Lys Arg Val Arg Pro Asp Ala Met500 505 510Ala Leu Val Glu Leu Pro Ala Glu Glu Lys Arg Ser Ser His Tyr Asn515 520 525Leu Arg Ala Arg Ser Lys Leu Lys Ser Leu Ser Lys His Glu530 535 540<210> 42<211> 1086<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 51<400> 42gatctagtac cagctgagac tctctagttg cgtagtaact gtcgagcata cagcaggtga60ttaaaaatgg catctcgggt acaagcattc attaactgtg ctagtcagaa ggcctccttt120tttgtttcga agaccgtcta ctgcggcaag gttgccggtg aattgaccaa gacggtgtac180ttcaaagagg gcttgcagcc tccaaacata tctgacttcg agatggtata ctggagacta240ctaaagcagt tcaagaatgc ggctgcacac ccacagcaaa cattggcatc tgtgaagagc300ctagggaaga atgacctggt gaagtacggt gccgtcggtg tgcagatgct cggactgtac360tcgctaggcg aggcgatcgg tagaagacac cttgtcggct acacaaacta ctcctcgcac420cactagatat tccgcgcggc ggacggagcg ggccgggatt gcgcccattg tgtggggaag480
ccaacctaga aaacgaattg atgaagcatt gattcgcaga tctcarggat ctgatgatac540atctataaat aacaactcta aactagttat caatcttata tattcgtact atttgtgttc600atactatgat acagtacgcg cgcgacactt gggcgccggc gagttatgca tgctcttcct660cgctggcgtc gccggcttgc tgggccagtt tgcgcttctt agatgcctct atcatttctt720tttgctgtcg tttcttctgc ttcagtatct ttggaaccgt gctgatctgc ttcctgtcca780cgaatgcctt gcccttctta atcatctcct tttccctctt ggtcatcttc gcgatattct840ccatccaagc ggcgacctcg cacccactct gcttcatgac gttgacaatc ggtttcacag900caawtgcgtc ctgctttgta aagaaaggtc actgctgtac ctttccgtcc gcctctgcct960gtacggccga tcctgtggac gtaagcctgt gctgagcgag gaacgtcata ggttgataac1020aagattgatg cccttgaaat ctataccacg tgccagaaca tcggtacaga tgaggcacca1080tagatc 1086<210> 43<211> 25<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 51<400> 43Asp Leu Trp Cys Leu Ile Cys Thr Asp Val Leu Ala Arg Gly Ile Asp1 5 10 15Phe Lys Gly Ile Asn Leu Val Ile Asn20 25<210> 44<211> 36<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 51<400> 44Leu Leu Ser Thr Tyr Asp Val Pro Arg Ser Ala Gln Ala Tyr Val His1 5 10 15Arg Ile Gly Arg Thr Gly Arg Gly Gly Arg Lys Gly Thr Ala Val Thr20 25 30
Phe Leu Tyr Lys35<210> 45<211> 100<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 51<220>
<221> misc_feature<222> (29)..(29)<223> 未知氨基酸<400> 45His Arg Leu Thr Ser Thr Gly Ser Ala Val Gln Ala Glu Ala Asp Gly1 5 10 15Lys Val Gln Gln Pro Phe Phe Thr Lys Gln Asp Ala Xaa Ala Val Lys20 25 30Pro Ile Val Asn Val Met Lys Gln Ser Gly Cys Glu Val Ala Ala Trp35 40 45Met Glu Asn Ile Ala Lys Met Thr Lys Arg Glu Lys Glu Met Ile Lys50 55 60Lys Gly Lys Ala Phe Val Asp Arg Lys Gln Ile Ser Thr Val Pro Lys65 70 75 80Ile Leu Lys Gln Lys Lys Arg Gln Gln Lys Glu Met Ile Glu Ala Ser85 90 95Lys Lys Arg Lys100<210> 46<211> 3296<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (502)..(2208)<223>
<220>
<221> misc_ feature<223> Oligo 51
<400> 46atcgtcggga atctgcaacc cgtacttatc tagattgaat gcttgcttaa atttcgcctg 60gtgccttgct gggtccccct cgttgtagtg cagccccgcc gggttcttaa gatcttcatt 120ggggttcttc aggcctcgga ctttgatacc attaacgatg taagatgcat ggcgcgtaga 180ctgtctagtg cctatcgata tcttagaaca caacatggtg ctatagacgg caactacagc 240agattaacca cggctggtcg ctcttgaagg tggcctaagc caagagatga gcatccgcta 300agctatcaaa attttcaaac taccccgggt aacaagttat ccgggtaacc acgtacaaaa 360cgatatttga aaattttgta ttcacattgc tttttggtca ttagcctgcc cggtgcgcga 420tgaggtccct acttgtcagt cagatcgtat ccgagctagt gagactgggt caggccaata 480aggacattga gactcgaagt t atg gat att ttc agg gtt ctg aca cgt ggc 531Met Asp Ile Phe Arg Val Leu Thr Arg Gly1 5 10gca tcg gtg aag aag gac ggg aag cag gtg gac ttc tcc aga gtg cag 579Ala Ser Val Lys Lys Asp Gly Lys Gln Val Asp Phe Ser Arg Val Gln15 20 25agc cag cga aca gcg cgg cct gga cag cgc ggg aag gac gag gac gaa 627Ser Gln Arg Thr Ala Arg Pro Gly Gln Arg Gly Lys Asp Glu Asp Glu30 35 40gag caa ttc tcg cgc gag ctg gat ttc ttt cgc acg agg cgg tct gtg 675Glu Gln Phe Ser Arg Glu Leu Asp Phe Phe Arg Thr Arg Arg Ser Val45 50 55cct gct gcc gca gag agg cca gcg gaa gag acc ggg gat gtt cat agg 723Pro Ala Ala Ala Glu Arg Pro Ala Glu Glu Thr Gly Asp Val His Arg60 65 70gac gag acc gag cag gac gag ggc gca gag gac gtg gca cca ccg ccc 771Asp Glu Thr Glu Gln Asp Glu Gly Ala Glu Asp Val Ala Pro Pro Pro75 80 85 90cgg atc acg aca gca gaa gaa gcg tcg cag cta cgg cgc tcg tac cgg 819Arg Ile Thr Thr Ala Glu Glu Ala Ser Gln Leu Arg Arg Ser Tyr Arg95 100 105ggc aag gtc aca ggc gcg gat gcg cct ctc ccc att ggg tcg ttt gag 867Gly Lys Val Thr Gly Ala Asp Ala Pro Leu Pro Ile Gly Ser Phe Glu110 115 120gac ctg gtg aca cgc ttc aag ctg gac aag agg ctg cta tcg aac ctg 915Asp Leu Val Thr Arg Phe Lys Leu Asp Lys Arg Leu Leu Ser Asn Leu125 130 135att gag aac aac ttt acg gag ccg acg ccc atc cag tgc gag gcc atc 963Ile Glu Asn Asn Phe Thr Glu Pro Thr Pro Ile Gln Cys Glu Ala Ile140 145 150ccc atc agt ctg cag aac cgg gac ata gtg gcg tgt gcg ccg acc ggt 1011Pro Ile Ser Leu Gln Asn Arg Asp Ile Val Ala Cys Ala Pro Thr Gly155 160 165 170agt ggt aag act ctg gcc ttt ttg ata cct ctt tta cag cag gtg ata 1059Ser Gly Lys Thr Leu Ala Phe Leu Ile Pro Leu Leu Gln Gln Val Ile175 180 185
tcc gac aag gcc gtt ggc acc ggc gtg aag ggc ttg att atc tcg ccc 1107Ser Asp Lys Ala Val Gly Thr Gly Val Lys Gly Leu Ile Ile Ser Pro190 195 200aca aaa gaa ctt gcc aac cag atc ttt gac gag tgc tcg aag ctt gct 1155Thr Lys Glu Leu Ala Asn Gln Ile Phe Asp Glu Cys Ser Lys Leu Ala205 210 215cag cgg atc ttc ctc gag aaa aag cgc ccg ttg tca gtg gca ttg ctc 1203Gln Arg Ile Phe Leu Glu Lys Lys Arg Pro Leu Ser Val Ala Leu Leu220 225 230tcc aag tct ctc gcg gcg aag ctg aaa aac cag atc gtg agc gac aag 1251Ser Lys Ser Leu Ala Ala Lys Leu Lys Asn Gln Ile Val Ser Asp Lys235 240 245 250aaa tat gat atc atc ata tcg act cct ctg cga ctc ata gat ata gtg 1299Lys Tyr Asp Ile Ile Ile Ser Thr Pro Leu Arg Leu Ile Asp Ile Val255 260 265aag agc gaa tcg ctt gac cta agc gct gtc aag tac ctg atc ttt gat 1347Lys Ser Glu Ser Leu Asp Leu Ser Ala Val Lys Tyr Leu Ile Phe Asp270 275 280gaa gcc gac aag cta ttt gac aaa acc ttt gtg gaa cag acg gac gac 1395Glu Ala Asp Lys Leu Phe Asp Lys Thr Phe Val Glu Gln Thr Asp Asp285 290 295atc cta agc gca tgt agc cac cca aat att agc aag gtg ctg ttc tcg 1443Ile Leu Ser Ala Cys Ser His Pro Asn Ile Ser Lys Val Leu Phe Ser300 305 310gcc acc ctg ccc tcc agt gtc gaa gag ctt gca cag tcg atc atg acc 1491Ala Thr Leu Pro Ser Ser Val Glu Glu Leu Ala Gln Ser Ile Met Thr315 320 325 330gac ccc gtc aga gta atc att ggc cac aag gag gcc gct aat acg aac 1539Asp Pro Val Arg Val Ile Ile Gly His Lys Glu Ala Ala Asn Thr Asn335 340 345att gaa cag aaa tta gta ttc tgc gga aac gaa gaa ggt aag ttg gtt 1587Ile Glu Gln Lys Leu Val Phe Cys Gly Asn Glu Glu Gly Lys Leu Val350 355 360gcc atc agg cag cta ata cag gaa ggg atg ttc cgc cct ccc gta ata 1635Ala Ile Arg Gln Leu Ile Gln Glu Gly Met Phe Arg Pro Pro Val Ile365 370 375atc ttt ttg gaa tcc atc acc aga gcc aaa gca tta ttc cat gag cta 1683Ile Phe Leu Glu Ser Ile Thr Arg Ala Lys Ala Leu Phe His Glu Leu380 385 390ttg tac gat aaa cta aat gtt gat gtt atc cac gct gag cgt acc caa 1731Leu Tyr Asp Lys Leu Asn Val Asp Val Ile His Ala Glu Arg Thr Gln395 400 405 410gtt caa agg gag aag atc atc gaa cga ttc aag agc ggt gat cta tgg 1779Val Gln Arg Glu Lys Ile Ile Glu Arg Phe Lys Ser Gly Asp Leu Trp415 420 425tgc ctc atc tgt acc gat gtt ctg gca cgt ggt ata gat ttc aag ggc 1827Cys Leu Ile Cys Thr Asp Val Leu Ala Arg Gly Ile Asp Phe Lys Gly430 435 440atc aat ctt gtt atc aac tat gac gtt cct cgc tca gca cag gct tac 1875
Ile Asn Leu Val Ile Asn Tyr Asp Val Pro Arg Ser Ala Gln Ala Tyr445 450 455gtc cac agg atc ggc cgt aca ggc aga ggc gga cgg aaa ggt aca gca 1923Val His Arg Ile Gly Arg Thr Gly Arg Gly Gly Arg Lys Gly Thr Ala460 465 470gtg act ttc ttt aca aag cag gac gca att gct gtg aaa ccg att gtc 1971Val Thr Phe Phe Thr Lys Gln Asp Ala Ile Ala Val Lys Pro Ile Val475 480 485 490aac gtc atg aag cag agt ggg tgc gag gtc gcc gct tgg atg gag aat 2019Asn Val Met Lys Gln Ser Gly Cys Glu Val Ala Ala Trp Met Glu Asn495 500 505atc gcg aag atg acc aag agg gaa aag gag atg att aag aag ggc aag 2067Ile Ala Lys Met Thr Lys Arg Glu Lys Glu Met Ile Lys Lys Gly Lys510 515 520gca ttc gtg gac agg aag cag atc agc acg gtt cca aag ata ctg aag 2115Ala Phe Val Asp Arg Lys Gln Ile Ser Thr Val Pro Lys Ile Leu Lys525 530 535cag aag aaa cga cag caa aaa gaa atg ata gag gca tct aag aag cgc 2163Gln Lys Lys Arg Gln Gln Lys Glu Met Ile Glu Ala Ser Lys Lys Arg540 545 550aaa ctg gcc cag caa gcc ggc gac gcc agc gag gaa gag cat gca 2208Lys Leu Ala Gln Gln Ala Gly Asp Ala Ser Glu Glu Glu His Ala555 560 565taactcgccg gcgcccaagt gtcgcgcgcg tactgtatca tagtatgaac acaaatagta2268cgaatatata agattgataa ctagtttaga gttgttattt atagatgtat catcagatcc2328ctgagatctg cgaatcaatg cttcatcaat tcgttttcta ggttggcttc cccacacaat2388gggcgcaatc ccggcccgct ccgtccgccg cgcggaatat ctagtggtgc gaggagtagt2448ttgtgtagcc gacaaggtgt cttctaccga tcgcctcgcc tagcgagtac agtccgagca2508tctgcacacc gacggcaccg tacttcacca ggtcattctt ccctaggctc ttcacagatg2568ccaatgtttg ctgtgggtgt gcagccgcat tcttgaactg ctttagtagt ctccagtata2628ccatctcgaa gtcagatatg tttggaggct gcaagccctc tttgaagtac accgtcttgg2688tcaattcacc ggcaaccttg ccgcagtaga cggtcttcga aacaaaaaag gaggccttct2748gactagcaca gttaatgaat gcttgtaccc gagatgccat ttttaatcac ctgctgtatg2808ctcgacagtt actacgcaac tagagagtct cagctggtac tagatcgctt atatcgtcaa2868aattttcaaa ggtggcagca ttcaggatat ccgggtaaca atataccaat ggccaatcag2928atgccggttt ttagcacgga gagtggtctt ataccggtga tggactttga tggccaggcg2988gaaggcgata tacggccgaa aagtagtgat tgagcgcgcg gtagtgtaat cgtttacttg3048cgtctgtcta ttcggcgaac gcggcgagca tagagctgtt tatcgcgcgt acaaagtccg3108aaacaattac gctaaaacag tgagaatagc tgagtgtggg cgcgcgagca aactagacac3168ggccgttcag gcgtatcgat ctccggacgc cgtcgccgag gaccactatc ttgtcttcct3228gctgcaggcg attcagagcg tctgaaatcg tcatgttgtc caggcgggcc tgagagttct3288
cgttcagc 3296<210> 47<211> 569<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 51<400> 47Met Asp Ile Phe Arg Val Leu Thr Arg Gly Ala Ser Val Lys Lys Asp1 5 10 15Gly Lys Gln Val Asp Phe Ser Arg Val Gln Ser Gln Arg Thr Ala Arg20 25 30Pro Gly Gln Arg Gly Lys Asp Glu Asp Glu Glu Gln Phe Ser Arg Glu35 40 45Leu Asp Phe Phe Arg Thr Arg Arg Ser Val Pro Ala Ala Ala Glu Arg50 55 60Pro Ala Glu Glu Thr Gly Asp Val His Arg Asp Glu Thr Glu Gln Asp65 70 75 80Glu Gly Ala Glu Asp Val Ala Pro Pro Pro Arg Ile Thr Thr Ala Glu85 90 95Glu Ala Ser Gln Leu Arg Arg Ser Tyr Arg Gly Lys Val Thr Gly Ala100 105 110Asp Ala Pro Leu Pro Ile Gly Ser Phe Glu Asp Leu Val Thr Arg Phe115 120 125Lys Leu Asp Lys Arg Leu Leu Ser Asn Leu Ile Glu Asn Asn Phe Thr130 135 140Glu Pro Thr Pro Ile Gln cys Glu Ala Ile Pro Ile Ser Leu Gln Asn145 150 155 160Arg Asp Ile Val Ala Cys Ala Pro Thr Gly Ser Gly Lys Thr Leu Ala165 170 175Phe Leu Ile Pro Leu Leu Gln Gln Val Ile Ser Asp Lys Ala Val Gly180 185 190Thr Gly Val Lys Gly Leu Ile Ile Ser Pro Thr Lys Glu Leu Ala Asn
195 200 205Gln Ile Phe Asp Glu Cys Ser Lys Leu Ala Gln Arg Ile Phe Leu Glu210 215 220Lys Lys Arg Pro Leu Ser Val Ala Leu Leu Ser Lys Ser Leu Ala Ala225 230 235 240Lys Leu Lys Asn Gln Ile Val Ser Asp Lys Lys Tyr Asp Ile Ile Ile245 250 255Ser Thr Pro Leu Arg Leu Ile Asp Ile Val Lys Ser Glu Ser Leu Asp260 265 270Leu Ser Ala Val Lys Tyr Leu Ile Phe Asp Glu Ala Asp Lys Leu Phe275 280 285Asp Lys Thr Phe Val Glu Gln Thr Asp Asp Ile Leu Ser Ala Cys Ser290 295 300His Pro Asn Ile Ser Lys Val Leu Phe Ser Ala Thr Leu Pro Ser Ser305 310 315 320Val Glu Glu Leu Ala Gln Ser Ile Met Thr Asp Pro Val Arg Val Ile325 330 335Ile Gly His Lys Glu Ala Ala Asn Thr Asn Ile Glu Gln Lys Leu Val340 345 350Phe Cys Gly Asn Glu Glu Gly Lys Leu Val Ala Ile Arg Gln Leu Ile355 360 365Gln Glu Gly Met Phe Arg Pro Pro Val Ile Ile Phe Leu Glu Ser Ile370 375 380Thr Arg Ala Lys Ala Leu Phe His Glu Leu Leu Tyr Asp Lys Leu Asn385 390 395 400Val Asp Val Ile His Ala Glu Arg Thr Gln Val Gln Arg Glu Lys Ile405 410 415Ile Glu Arg Phe Lys Ser Gly Asp Leu Trp Cys Leu Ile Cys Thr Asp420 425 430Val Leu Ala Arg Gly Ile Asp Phe Lys Gly Ile Asn Leu Val Ile Asn435 440 445Tyr Asp Val Pro Arg Ser Ala Gln Ala Tyr Val His Arg Ile Gly Arg
450 455 460Thr Gly Arg Gly Gly Arg Lys Gly Thr Ala Val Thr Phe Phe Thr Lys465 470 475 480Gln Asp Ala Ile Ala Val Lys Pro Ile Val Asn Val Met Lys Gln Ser485 490 495Gly Cys Glu Val Ala Ala Trp Met Glu Asn Ile Ala Lys Met Thr Lys500 505 510Arg Glu Lys Glu Met Ile Lys Lys Gly Lys Ala Phe Val Asp Arg Lys515 520 525Gln Ile Ser Thr Val Pro Lys Ile Leu Lys Gln Lys Lys Arg Gln Gln530 535 540Lys Glu Met Ile Glu Ala Ser Lys Lys Arg Lys Leu Ala Gln Gln Ala545 550 555 560Gly Asp Ala Ser Glu Glu Glu His Ala565<210> 48<211> 528<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 30<220>
<221> misc_feature<222> (113)..(113)<223> 未知核苷酸<400> 48gacgctttca acgcatccat taagaaaaat aacattccgg atgattggac ctttattcat60aacgaagaga gtaccaacgg gagcagcgaa aacgattctt ccacaggaat gcngcaaggc120ccggtctcta ggccactggg ttgacggcaa cggtaagcag ctggacggaa aactcaaatt180tactgttaaa aatgtctaca ctgcgggcag aatggtgtcc ctcgaggggt cactgctaag240tgaaggctat cacaggtcgc aagcagaaaa cctgcctgtc gtttccaaca ccaagatcat300ctttgatgac gaggtctctc aagagaacaa ggaatctcat aaggacttgg aacttagcgt360tctaaaagaa gataatggcg acgagatcat gtatgaaaaa gattccagcg attcaaacag420cgacagcgac agcgactaag ttgcctctca tatttagttg ccttctacgt ccgcatatta480
catatataaa acatgttttg aatactgaag cacaatgagt cgcatcgc528<210> 49<211> 34<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 30<400> 49Asp Ala Phe Asn Ala Ser Ile Lys Lys Asn Asn Ile Pro Asp Asp Trp1 5 10 15Thr Phe Ile His Asn Glu Glu Ser Thr Asn Gly Ser Ser Glu Asn Asp20 25 30Ser Ser<210> 50<211> 105<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 30<400> 50Arg Ser Leu Gly His Trp Val Asp Gly Asn Gly Lys Gln Leu Asp Gly1 5 10 15Lys Leu Lys Phe Thr Val Lys Asn Val Tyr Thr Ala Gly Arg Met Val20 25 30Ser Leu Glu Gly Ser Leu Leu Ser Glu Gly Tyr His Arg Ser Gln Ala35 40 45Glu Asn Leu Pro Val Val Ser Asn Thr Lys Ile Ile Phe Asp Asp Glu50 55 60Val Ser Gln Glu Asn Lys Glu Ser His Lys Asp Leu Glu Leu Ser Val65 70 75 80Leu Lys Glu Asp Asn Gly Asp Glu Ile Met Tyr Glu Lys Asp Ser Ser85 90 95Asp Ser Asn Ser Asp Ser Asp Ser Asp
100 105<210> 51<211> 1489<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (198)..(1073)<223>
<220>
<221> misc_feature<223> Oligo 30<400> 51caatttttgt atcacgtgac acataccatg gaagttttgt atccattttt tacgttacaa 60tacgtacaga aaattttcac attagacgcc agtcctcatg cgatgagatg agcttcaaga 120gcagtagctg tcgctgaacg gacatcaacg tggttatact gtcctgcttg ctaaggtagt 180tacgcaaatt ggttaga atg ggt gtc aaa aaa agc ccg ctc aaa cgg tcc 230Met Gly Val Lys Lys Ser Pro Leu Lys Arg Ser1 5 10aag acc gcc gag ttc atc aac aag cat cgc aag cta tgc aag aac ccc278Lys Thr Ala Glu Phe Ile Asn Lys His Arg Lys Leu Cys Lys Asn Pro15 20 25atc agc agt gaa gat aac aca tca cag tgc atc acg cgg ctt cca gtg326Ile Ser Ser Glu Asp Asn Thr Ser Gln Cys Ile Thr Arg Leu Pro Val30 35 40tct atg tac gtc tcg cta gct ccc ctt tac cag caa cat cct ctg gag374Ser Met Tyr Val Ser Leu Ala Pro Leu Tyr Gln Gln His Pro Leu Glu45 50 55ggc ata aaa cgg caa cat ctg aat ccc atg gtc atg aaa tac aac gga422Gly Ile Lys Arg Gln His Leu Asn Pro Met Val Met Lys Tyr Asn Gly60 65 70 75gat gtt gga ggt gta ata ctg gga tat gag aat gtg gcg att atg aat470Asp Val Gly Gly Val Ile Leu Gly Tyr Glu Asn Val Ala Ile Met Asn80 85 90gaa ggc gct gcg aaa gat gaa gaa ctg cta gtc aag ttg acg cca gat518Glu Gly Ala Ala Lys Asp Glu Glu Leu Leu Val Lys Leu Thr Pro Asp95 100 105acc cct ttt gcg ttt acc tgg tgc agc gta gat ctt gtg gta tgg tcg566Thr Pro Phe Ala Phe Thr Trp Cys Ser Val Asp Leu Val Val Trp Ser110 115 120cca cat atc ggc gat gtg ctc gag gga tgg atc ttc ata cag tca gcc614Pro His Ile Gly Asp Val Leu Glu Gly Trp Ile Phe Ile Gln Ser Ala125 130 135tca cac att ggt ctg ctg atc cac gac gct ttc aac gca tcc att aag662Ser His Ile Gly Leu Leu Ile His Asp Ala Phe Asn Ala Ser Ile Lys140 145 150155
aaa aat aac att ccg gat gat tgg acc ttt att cat aac gaa gag agt 710Lys Asn Asn Ile Pro Asp Asp Trp Thr Phe Ile His Asn Glu Glu Ser160 165 170acc aac ggg agc agc gaa aac gat tct tcc aca gga atg cgc aag gcc 758Thr Asn Gly Ser Ser Glu Asn Asp Ser Ser Thr Gly Met Arg Lys Ala175 180 185cgg tct cta ggc cac tgg gtt gac ggc aac ggt aag cag ctg gac gga 806Arg Ser Leu Gly His Trp Val Asp Gly Asn Gly Lys Gln Leu Asp Gly190 195 200aaa ctc aaa ttt act gtt aaa aat gtc tac act gcg ggc aga atg gtg 854Lys Leu Lys Phe Thr Val Lys Asn Val Tyr Thr Ala Gly Arg Met Val205 210 215tcc ctc gag ggg tca ctg cta agt gaa ggc tat cac agg tcg caa gca 902Ser Leu Glu Gly Ser Leu Leu Ser Glu Gly Tyr His Arg Ser Gln Ala220 225 230 235gaa aac ctg cct gtc gtt tcc aac acc aag atc atc ttt gat gac gag 950Glu Asn Leu Pro Val Val Ser Asn Thr Lys Ile Ile Phe Asp Asp Glu240 245 250gtc tct caa gag aac aag gaa tct cat aag gac ttg gaa ctt agc gtt 998Val Ser Gln Glu Asn Lys Glu Ser His Lys Asp Leu Glu Leu Ser Val255 260 265cta aaa gaa gat aat ggc gac gag atc atg tat gaa aaa gat tcc agc 1046Leu Lys Glu Asp Asn Gly Asp Glu Ile Met Tyr Glu Lys Asp Ser Ser270 275 280gat tca aac agc gac agc gac agc gac taagttgcct ctcatattta 1093Asp Ser Asn Ser Asp Ser Asp Ser Asp285 290gttgccttct acgtccgcat attacatata taaaacatgt tttgaatact gaagcacaat 1153gagtcgcatc gcagttagtg tatagataga acatgaaagt ccaattgaga caatttacat 1213ccatatttta gtgagttaaa agcgacatta aacttggaag caatatatat accttatttc 1273cacgcaataa ctaaattcca aaatgtcgat tattttaagg ctaggctaca acgggtaccc 1333aatagcttat gatcgtgaat acaacgacgt aaatacctaa taatatgctc tttttatgtc 1393caaattcact actcattacc tggtataatc attatatacg aaaatacttt atatatgtca 1453tctgaagact gtctctctac caatcattgc accaag 1489<210> 52<211> 292<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 30<400> 52Met Gly Val Lys Lys Ser Pro Leu Lys Arg Ser Lys Thr Ala Glu Phe1 5 10 15
Ile Asn Lys His Arg Lys Leu Cys Lys Asn Pro Ile Ser Ser Glu Asp20 25 30Asn Thr Ser Gln Cys Ile Thr Arg Leu Pro Val Ser Met Tyr Val Ser35 40 45Leu Ala Pro Leu Tyr Gln Gln His Pro Leu Glu Gly Ile Lys Arg Gln50 55 60His Leu Asn Pro Met Val Met Lys Tyr Asn Gly Asp Val Gly Gly Val65 70 75 80Ile Leu Gly Tyr Glu Asn Val Ala Ile Met Asn Glu Gly Ala Ala Lys85 90 95Asp Glu Glu Leu Leu Val Lys Leu Thr Pro Asp Thr Pro Phe Ala Phe100 105 110Thr Trp Cys Ser Val Asp Leu Val Val Trp Ser Pro His Ile Gly Asp115 120 125Val Leu Glu Gly Trp Ile Phe Ile Gln Ser Ala Ser His Ile Gly Leu130 135 140Leu Ile His Asp Ala Phe Asn Ala Ser Ile Lys Lys Asn Asn Ile Pro145 150 155 160Asp Asp Trp Thr Phe Ile His Asn Glu Glu Ser Thr Asn Gly Ser Ser165 170 175Glu Asn Asp Ser Ser Thr Gly Met Arg Lys Ala Arg Ser Leu Gly His180 185 190Trp Val Asp Gly Asn Gly Lys Gln Leu Asp Gly Lys Leu Lys Phe Thr195 200 205Val Lys Asn Val Tyr Thr Ala Gly Arg Met Val Ser Leu Glu Gly Ser210 215 220Leu Leu Ser Glu Gly Tyr His Arg Ser Gln Ala Glu Asn Leu Pro Val225 230 235 240Val Ser Asn Thr Lys Ile Ile Phe Asp Asp Glu Val Ser Gln Glu Asn245 250 255Lys Glu Ser His Lys Asp Leu Glu Leu Ser Val Leu Lys Glu Asp Asn260 265 270
Gly Asp Glu Ile Met Tyr Glu Lys Asp Ser Ser Asp Ser Asn Ser Asp275 280 285Ser Asp Ser Asp290<210> 53<211> 1289<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 124<400> 53gatcaactac gatatgccta gtgaggcaga ccaatacctc cacagagtcg gtagagcggg 60cagattcggt accaaaggtc tggctatttc ccttgtgtcc tcaaaagatg atgaggaggt 120tttagctaag atccaagaac gttttgaccg tgaagatcac cgaatttcca gaagaaggtg 180tcgacccatc tacctatttg aacacttgaa caacaccgct tctccccatt tccgatacta 240tatacgaaaa gggctaacgt aaataagaga agaactcaac aaagggaaat tttaaccttt 300ttcttggttt tttgtatcta atataatcat caaggactgg gacgtatggt ttagcctagt 360ctagctgaat actattagcg tcgcttctcc gtcggaaagt actgatctaa taaaccttcc 420aaaatgtttt actgacattg atggcctagc tctagaattt cttgtactcg tgacttcttt 480acacccagtc gcttttgctt ttacgtaaaa ccaaaactga atgttttact tctcatataa 540aactgcatct ttaaatctta aatcgggcct catattacat atgtgatttt ttttcccgga 600aagtgcatcg aacttcaatg caggagtggt aatacgccaa gagcaatgac gggatcttca 660gcgttccttg cggatgcgca agtaaaacat aaacttagaa tatcactaca aataaacagc 720aactaggtta caagcactat tataaacggc cacatgaaga catctctcgg ctgtaaccca 780gcgctcatgt ttgctctggg gtgtcgcgtg cgctgacgtc aggaggctgc ggtaagatga 840tctgcatatc ttgctgtgca ctgggctttt cgttagactt ggatgataga accttggaaa 900ctttctctag acctttggtg gaattaggca tgctgtttaa atgatgtgca tgaatattac 960ttaacgggag ttccttgggg agttcttcaa tgtggcttcg ggccttcaaa gcacgagggg 1020cagcagctaa caatgacgga gaactatcat gccaattgga gtgatcagac tcagcaatat 1080tagttacagg cgttgaatct gattcctcgt ctaggacgcg cgatgccagg atcccaaggg 1140tggttagcat atgggaaccg tttttgcttc cgctgtcgct gcaagttatt ccactattaa 1200cagagccact gttacttttt gccttcacac taggcgttgt gggcatgtac tgggcagtct 1260tattcagaat gcgcatgagc ctgttgatc 1289
<210> 54<211> 49<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 124<400> 54Ile Asn Tyr Asp Met Pro Ser Glu Ala Asp Gln Tyr Leu His Arg Val1 5 10 15Gly Arg Ala Gly Arg Phe Gly Thr Lys Gly Leu Ala Ile Ser Leu Val20 25 30Ser Ser Lys Asp Asp Glu Glu Val Leu Ala Lys Ile Gln Glu Arg Phe35 40 45Asp<210> 55<211> 18<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 124<400> 55Val Lys Ile Thr Glu Phe Pro Glu Glu Gly Val Asp Pro Ser Thr Tyr1 5 10 15Leu Asn<210> 56<211> 3228<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (465)..(1775)<223>
<220>
<221> misc_feature<223> Oligo 124
<400> 56ccagacgagg atgatgcccc ggactcccgc cgctgcagat gttgctgtcg ctattctggg 60gcattcgcct ccgctggaac gaacgccatc cgcagaacgc gcatcaacag atccgcagac 120tatgcatgcc caattgaagg cgttggtggc taccattgat gaccatgagc cacagcttta 180taacaatatg gcagatcccg catcaaaagt tctactgaat aacatcttca accgtcttcg 240agccatggtg agtgatgatg cgtcctagtc tcgatcacgt gattcaaaag cgtatcctgt 300tacccggccc tctaaaggtg gcaaactgtc gaaaattgaa agcgtaatga aaaatcagcg 360aaaagaacag gatttgtttg gaacgccata ttatctttca ttctttgaaa gcataaagcg 420ctattttagc tgtcaggtca ttctttagtt aatcgattat cagg atg tca cac gaa 476Met Ser His Glu1ggc gag gaa gat tta ttg gaa tat tcc gat aac gaa cag gaa atc cag 524Gly Glu Glu Asp Leu Leu Glu Tyr Ser Asp Asn Glu Gln Glu Ile Gln5 10 15 20gtt gac aac acg aag gcc act gag gta gcc ggt aac gga gaa gag gca 572Val Asp Asn Thr Lys Ala Thr Glu Val Ala Gly Asn Gly Glu Glu Ala25 30 35gct gac gga aag gat gga gac aag aag gga tcg tac gta ggt att cac 620Ala Asp Gly Lys Asp Gly Asp Lys Lys Gly Ser Tyr Val Gly Ile His40 45 50tcg aca ggt ttt aag gat ttt ctg ttg aag cca gag ctt tcc cgg gcc 668Ser Thr Gly Phe Lys Asp Phe Leu Leu Lys Pro Glu Leu Ser Arg Ala55 60 65att att gac tgt ggt ttg gaa cat cca tgt gag gtc caa caa cac acc 716Ile Ile Asp Cys Gly Leu Glu His Pro Cys Glu Val Gln Gln His Thr70 75 80atc cca caa tca att cac ggt acg gac gtt cta tgt cag gca aag tcc 764Ile Pro Gln Ser Ile His Gly Thr Asp Val Leu Cys Gln Ala Lys Ser85 90 95 100ggt ctc ggg aaa act gct gtg ttt gtg ttg tca acg ctg cag caa ttg 812Gly Leu Gly Lys Thr Ala Val Phe Val Leu Ser Thr Leu Gln Gln Leu105 110 115gac cct gtt cca ggc gag gta tca gtg gtc gtt ctg tgc aat gcc aga 860Asp Pro Val Pro Gly Glu Val Ser Val Val Val Leu Cys Asn Ala Arg120 125 130gaa ttg gct tat cag atc aga aac gag tac ttg aga ttc tcg aaa tat 908Glu Leu Ala Tyr Gln Ile Arg Asn Glu Tyr Leu Arg Phe Ser Lys Tyr135 140 145atg ccg gac gtg aaa aca gct gtt ttc tat ggt ggc aca gac act agg 956Met Pro Asp Val Lys Thr Ala Val Phe Tyr Gly Gly Thr Asp Thr Arg150 155 160aag gac att gag ttg tta aaa aac aaa gat act gcg cca cat att gta 1004Lys Asp Ile Glu Leu Leu Lys Asn Lys Asp Thr Ala Pro His Ile Val165 170 175 180gtt gca acg ccg gga cgg ttg aag gcg ctg gta cgg gac aac aat att 1052Val Ala Thr Pro Gly Arg Leu Lys Ala Leu Val Arg Asp Asn Asn Ile185 190 195
gac ttg tct cac gtt aag aac ttt gtt atc gat gag tgt gac aag gtg 1100Asp Leu Ser His Val Lys Asn Phe Val Ile Asp Glu Cys Asp Lys Val200 205 210ttg gag gag ctc gat atg aga aga gat gtg caa gac att ttc agg gca 1148Leu Glu Glu Leu Asp Met Arg Arg Asp Val Gln Asp Ile Phe Arg Ala215 220 225act cct aga gat aag cag gtg atg atg ttc tct gct acg cta tct caa 1196Thr Pro Arg Asp Lys Gln Val Met Met Phe Ser Ala Thr Leu Ser Gln230 235 240gag atc aga ccg atc tgt aga cgt ttc ttg caa aac cct ctg gag att 1244Glu Ile Arg Pro Ile Cys Arg Arg Phe Leu Gln Asn Pro Leu Glu Ile245 250 255 260ttt gtt gat gac gaa gct aag ttg acc ttg cac ggt ttg cag cag tac 1292Phe Val Asp Asp Glu Ala Lys Leu Thr Leu His Gly Leu Gln Gln Tyr265 270 275tat atc agg ctt gag gaa cgt gag aag aac cgt aag ctg gct caa ttg 1340Tyr Ile Arg Leu Glu Glu Arg Glu Lys Asn Arg Lys Leu Ala Gln Leu280 285 290ttg gat gat ttg gaa ttt aac cag gtt att atc ttc gta aaa tcg aca 1388Leu Asp Asp Leu Glu Phe Asn Gln Val Ile Ile Phe Val Lys Ser Thr295 300 305ctt aga gca aac gaa ttg act aag ctg ttg aat gct tcc aac ttc cct 1436Leu Arg Ala Asn Glu Leu Thr Lys Leu Leu Asn Ala Ser Asn Phe Pro310 315 320gca att act gtt cac ggt cac atg aga cag gaa gag cgt att gcc cgc 1484Ala Ile Thr Val His Gly His Met Arg Gln Glu Glu Arg Ile Ala Arg325 330 335 340tac aag gcc ttc aag gaa ttt gaa aag cgt atc tgt gtg tca aca gac 1532Tyr Lys Ala Phe Lys Glu Phe Glu Lys Arg Ile Cys Val Ser Thr Asp345 350 355gtt ttc ggt agg ggt att gat atc gag cgt atc aac cta gcg atc aac 1580Val Phe Gly Arg Gly Ile Asp Ile Glu Arg Ile Asn Leu Ala Ile Asn360 365 370tac gat atg cct agt gag gca gac caa tac ctc cac aga gtc ggt aga 1628Tyr Asp Met Pro Ser Glu Ala Asp Gln Tyr Leu His Arg Val Gly Arg375 380 385gcg ggc aga ttc ggt acc aaa ggt ctg gct att tcc ctt gtg tcc tca 1676Ala Gly Arg Phe Gly Thr Lys Gly Leu Ala Ile Ser Leu Val Ser Ser390 395 400aaa gat gat gag gag gtt tta gct aag atc caa gaa cgt ttt gac gtg 1724Lys Asp Asp Glu Glu Val Leu Ala Lys Ile Gln Glu Arg Phe Asp Val405 410 415 420aag atc acc gaa ttt cca gaa gaa ggt gtc gac cca tct acc tat ttg 1772Lys Ile Thr Glu Phe Pro Glu Glu Gly Val Asp Pro Ser Thr Tyr Leu425 430 435aac acttgaacaa caccgcttct ccccatttcc gatactatat acgaaaaggg 1825Asnctaacgtaaa taagagaaga actcaacaaa gggaaatttt aacctttttc ttggtttttt1885
gtatctaata taatcatcaa ggactgggac gtatggttta gcctagtcta gctgaatact1945attagcgtcg cttctccgtc ggaaagtact gatctaataa accttccaaa atgttttact2005gacattgatg gcctagctct agaatttctt gtactcgtga cttctttaca cccagtcgct2065tttgctttta cgtaaaacca aaactgaatg ttttacttct catataaaac tgcatcttta2125aatcttaaat cgggcctcat attacatatg tgattttttt tcccggaaag tgcatcgaac2185ttcaatgcag gagtggtaat acgccaagag caatgacggg atcttcagcg ttccttgcgg2245atgcgcaagt aaaacataaa cttagaatat cactacaaat aaacagcaac taggttacaa2305gcactattat aaacggccac atgaagacat ctctcggctg taacccagcg ctcatgtttg2365ctctggggtg tcgcgtgcgc tgacgtcagg aggctgcggt aagatgatct gcatatcttg2425ctgtgcactg ggcttttcgt tagacttgga tgatagaacc ttggaaactt tctctagacc2485tttggtggaa ttaggcatgc tgtttaaatg atgtgcatga atattactta acgggagttc2545cttggggagt tcttcaatgt ggcttcgggc cttcaaagca cgaggggcag cagctaacaa2605tgacggagaa ctatcatgcc aattggagtg atcagactca gcaatattag ttacaggcgt2665tgaatctgat tcctcgtcta ggacgcgcga tgccaggatc ccaagggtgg ttagcatatg2725ggaaccgttt ttgcttccgc tgtcgctgca agttattcca ctattaacag agccactgtt2785actttttgcc ttcacactag gcgttgtggg catgtactgg gcagtcttat tcagaatgcg2845catgagcctg ttgatctgtt tattcttctc cataatggta tcacgatatt ttgagatttt2905atgatctcta gtgcgaatct gttccttcaa ctcttgctta tctatattga gcttgcattt2965cacgtgttcg tacatatgct tggacaaatt aagctcaact tcagaacggg aatccacatt3025ctttaacgtt gaattcagca ccaggttttt gaacttgagt tgccggatct gctcttgtga3085ctttgaaagc aggcttacca acaattctaa ggtcttcgag agttcatcgt tggatgggac3145aaacagttcg agtggtgtct gttgcctcga ctctgatggt tccgtcctat caaattcgtt3205acatcgccgt gtcgacaagt tgt3228<210> 57<211> 437<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 124<400> 57Met Ser His Glu Gly Glu Glu Asp Leu Leu Glu Tyr Ser Asp Asn Glu1 5 10 15Gln Glu Ile Gln Val Asp Asn Thr Lys Ala Thr Glu Val Ala Gly Asn
20 25 30Gly Glu Glu Ala Ala Asp Gly Lys Asp Gly Asp Lys Lys Gly Ser Tyr35 40 45Val Gly Ile His Ser Thr Gly Phe Lys Asp Phe Leu Leu Lys Pro Glu50 55 60Leu Ser Arg Ala Ile Ile Asp Cys Gly Leu Glu His Pro Cys Glu Val65 70 75 80Gln Gln His Thr Ile Pro Gln Ser Ile His Gly Thr Asp Val Leu Cys85 90 95Gln Ala Lys Ser Gly Leu Gly Lys Thr Ala Val Phe Val Leu Ser Thr100 105 110Leu Gln Gln Leu Asp Pro Val Pro Gly Glu Val Ser Val Val Val Leu115 120 125Cys Asn Ala Arg Glu Leu Ala Tyr Gln Ile Arg Asn Glu Tyr Leu Arg130 135 140Phe Ser Lys Tyr Met Pro Asp Val Lys Thr Ala Val Phe Tyr Gly Gly145 150 155 160Thr Asp Thr Arg Lys Asp Ile Glu Leu Leu Lys Asn Lys Asp Thr Ala165 170 175Pro His Ile Val Val Ala Thr Pro Gly Arg Leu Lys Ala Leu Val Arg180 185 190Asp Asn Asn Ile Asp Leu Ser His Val Lys Asn Phe Val Ile Asp Glu195 200 205Cys Asp Lys Val Leu Glu Glu Leu Asp Met Arg Arg Asp Val Gln Asp210 215 220Ile Phe Arg Ala Thr Pro Arg Asp Lys Gln Val Met Met Phe Ser Ala225 230 235 240Thr Leu Ser Gln Glu Ile Arg Pro Ile Cys Arg Arg Phe Leu Gln Asn245 250 255Pro Leu Glu Ile Phe Val Asp Asp Glu Ala Lys Leu Thr Leu His Gly260 265 270Leu Gln Gln Tyr Tyr Ile Arg Leu Glu Glu Arg Glu Lys Asn Arg Lys
275 280 285Leu Ala Gln Leu Leu Asp Asp Leu Glu Phe Asn Gln Val Ile Ile Phe290 295 300Val Lys Ser Thr Leu Arg Ala Asn Glu Leu Thr Lys Leu Leu Asn Ala305 310 315 320Ser Asn Phe Pro Ala Ile Thr Val His Gly His Met Arg Gln Glu Glu325 330 335Arg Ile Ala Arg Tyr Lys Ala Phe Lys Glu Phe Glu Lys Arg Ile Cys340 345 350Val Ser Thr Asp Val Phe Gly Arg Gly Ile Asp Ile Glu Arg Ile Asn355 360 365Leu Ala Ile Asn Tyr Asp Met Pro Ser Glu Ala Asp Gln Tyr Leu His370 375 380Arg Val Gly Arg Ala Gly Arg Phe Gly Thr Lys Gly Leu Ala Ile Ser385 390 395 400Leu Val Ser Ser Lys Asp Asp Glu Glu Val Leu Ala Lys Ile Gln Glu405 410 415Arg Phe Asp Val Lys Ile Thr Glu Phe Pro Glu Glu Gly Val Asp Pro420 425 430Ser Thr Tyr Leu Asn435<210> 58<211> 545<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 139<220>
<221> misc_feature<222> (358)..(358)<223> 未知核苷酸<220>
<221> misc_feature<222> (418)..(418)<223> 未知核苷酸
<220>
<221> misc_feature<222> (461)..(461)<223> 未知核苷酸<220>
<221> misc_feature<222> (506)..(506)<223> 未知核苷酸<220>
<221> misc_feature<222> (539)..(539)<223> 未知核苷酸<400> 58gatccacacg ccaaccgaca ggcagaacat ctacgattta ctgaaatatc tcctggagaa 60cgagccgaar gattcgttwg cctgagtcat gtactatatt attacacttt gagtwgttta 120tgtataggtt gggacaacat gcagacaggc acctacacac ctggattgga cagcgtagcc 180gctgccgcgg cctgttgctt cttagtaacc ctctttttgg ggactgccgc cccatctgcc 240tttttggtgg gcttccgctg ccttttcggt ttggatttgt cgtcgctgtc cgcggtgccg 300gcgcgcttgc cgtttgcctc gctcggcgcg gtgtgcgcac tgcccatccc cataccgncc 360ggcccaacat tctgcagcat ggccccggcc tgctgcttca caggctgtgt agtaagangg 420gtcgacatcg agatgcggtg attatacccc ggcggggcca ngttcgcgtt gagtgcctgc 480tgcttcttct tctctttggt caagcngaac tgctcgacga attttagtct gctgaaccng 540gtatt 545<210> 59<211> 27<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 139<220>
<221> misc_feature<222> (26)..(26)<223> 未知氨基酸<400> 59Ile His Thr Pro Thr Asp Arg Gln Asn Ile Tyr Asp Leu Leu Lys Tyr1 5 10 15Leu Leu Glu Asn Glu Pro Lys Asp Ser Xaa Ala
20 25<210> 60<211> 1396<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (402)..(638)<223>
<220>
<221> misc_feature<223> Oligo 139<220>
<221> CDS<222> (663)..(974)<223>
<400> 60cttccccgga atgaaagccg ggctcacgct gagttgcagg cgtggcagcc gcgcggcaat 60atttgcacgg ttctctcagc actgcgccag tcaacccctt aactctcgag ggtgccgccc 120ctcccgtagg cgcagtcggc caaggaggaa gcggcggcac atggtgccgg ccgccaccgc 180ggagcaggat caccggaatg acggatgtca cgtgcaggcc gagggaccga ctaagcgcgg 240tgttcgacag cgcgctcgtg gcggcaggca cagccgtcgg ttaatgtgca cacacgtgat 300ggtcacgtgc gcaacggccg ggcctttttg tgtggtcaaa gccagagcac actcgggcag 360atccacagca tacacaccat agagggacag tgccgatgac g acc gcg cgt gac aat 416Thr Ala Arg Asp Asn1 5agc gcg acg acg ctc gag ctg tat cgc aag acg ctg aat ttc aat gtg 464Ser Ala Thr Thr Leu Glu Leu Tyr Arg Lys Thr Leu Asn Phe Asn Val10 15 20atc ggc aga tat gac ccc aaa ata aag cag ctg ctg ttc cac acg ccg 512Ile Gly Arg Tyr Asp Pro Lys Ile Lys Gln Leu Leu Phe His Thr Pro25 30 35cat gcg acg gtg tac aag tgg gag gcc ggc gag aac aag tgg aac aag 560His Ala Thr Val Tyr Lys Trp Glu Ala Gly Glu Asn Lys Trp Asn Lys40 45 50ctg gag tac cag ggc gtg ctg gct ata tat cta cgc gat gtg cgc gag 608Leu Glu Tyr Gln Gly Val Leu Ala Ile Tyr Leu Arg Asp Val Arg Glu55 60 65cag gcg gag ctg ccg gtg ccg cac cag gag gcgagtgcag gcgcggaggg 658Gln Ala Glu Leu Pro Val Pro His Gln Glu70 75gcgg tgc ggc gag gtg ctc agc ggg cgc gac atc tac aac tac gcg ctg 707Cys Gly Glu Val Leu Ser Gly Arg Asp Ile Tyr Asn Tyr Ala Leu80 85 90
atc gtg ctc aac cgg atc aac ccc gag aac ttc tcg att gca att gcg 755Ile Val Leu Asn Arg Ile Asn Pro Glu Asn Phe Ser Ile Ala Ile Ala95 100 105 110ccg aac agc gtt gtg aac aag cgg cgt ctc ttt tcg ccg gag gag aac 803Pro Asn Ser Val Val Asn Lys Arg Arg Leu Phe Ser Pro Glu Glu Asn115 120 125gtg cag cag ccg ctg gag cca atg gac gtt gag gtc aaa gat gaa ctg 851Val Gln Gln Pro Leu Glu Pro Met Asp Val Glu Val Lys Asp Glu Leu130 135 140gtg atc atc aaa aac ctg cgg aag gag gtg tac ggc atc tgg atc cac 899Val Ile Ile Lys Asn Leu Arg Lys Glu Val Tyr Gly Ile Trp Ile His145 150 155acg cca acc gac agg cag aac atc tac gat tta ctg aaa tat ctc ctg 947Thr Pro Thr Asp Arg Gln Asn Ile Tyr Asp Leu Leu Lys Tyr Leu Leu160 165 170gag aac gag ccg aag gat tcg ttt gcc tgagtcatgt actatattat 994Glu Asn Glu Pro Lys Asp Ser Phe Ala175 180tacactttga gttgtttatg tataggttgg gacaacatgc agacaggcac ctacacacct 1054ggattggaca gcgtagccgc tgccgcggcc tgttgcttct tagtaaccct ctttttgggg 1114actgccgccc catctgcctt tttggtgggc ttccgctgcc ttttcggttt ggatttgtcg 1174tcgctgtccg cggtgccggc gcgcttgccg tttgcctcgc tcggcgcggt gtgcgcactg 1234cccatcccca taccgcccgg cccaacattc tgcagcatgg ccccggcctg ctgcttcaca 1294ggctgtgtag taagaggggt cgacatcgag atgcggtggt tataccccgg cggggccagg 1354ttcgcgttga gtgcctgctg ctcttcttct ctttggtcaa gc1396<210> 61<211> 79<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 139<400> 61Thr Ala Arg Asp Asn Ser Ala Thr Thr Leu Glu Leu Tyr Arg Lys Thr1 5 10 15Leu Asn Phe Asn Val Ile Gly Arg Tyr Asp Pro Lys Ile Lys Gln Leu20 25 30Leu Phe His Thr Pro His Ala Thr Val Tyr Lys Trp Glu Ala Gly Glu35 40 45Asn Lys Trp Asn Lys Leu Glu Tyr Gln Gly Val Leu Ala Ile Tyr Leu50 55 60
Arg Asp Val Arg Glu Gln Ala Glu Leu Pro Val Pro His Gln Glu65 70 75<210> 62<211> 104<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 139<400> 62Cys Gly Glu Val Leu Ser Gly Arg Asp Ile Tyr Asn Tyr Ala Leu Ile1 5 10 15Val Leu Asn Arg Ile Asn Pro Glu Asn Phe Ser Ile Ala Ile Ala Pro20 25 30Asn Ser Val Val Asn Lys Arg Arg Leu Phe Ser Pro Glu Glu Asn Val35 40 45Gln Gln Pro Leu Glu Pro Met Asp Val Glu Val Lys Asp Glu Leu Val50 55 60Ile Ile Lys Asn Leu Arg Lys Glu Val Tyr Gly Ile Trp Ile His Thr65 70 75 80Pro Thr Asp Arg Gln Asn Ile Tyr Asp Leu Leu Lys Tyr Leu Leu Glu85 90 95Asn Glu Pro Lys Asp Ser Phe Ala100<210> 63<211> 944<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 144<400> 63gatctgagaa tgttaacgat aaccctgcta ttgcgaagaa cgttgtgagc ttctacgcgc60ctgagaagaa ggtcgacaag aagggtgtca tcattgacaa agagctcagc atcttcaaga120agtggaaact tgtgcgtgcc atcgacggca agttctccaa cgaaattacc tggtcacctg180ctggacgttt tgtatgcgtc gctgctattg gtaagattgg ttcccgtaac gagaacattg240atttctacga tatggactat ccaaacactg aaaagatcat taacactgct actgacgtta300
acgctaccct gagagacgtt gcccacatca actacgccag tgccactgat tacgaatggg 360acccaagtgg acggtacctt gccttctggt cttccgcgtg gaagcacaag gccgaaaatg 420gatacaaggt attcaacttg gccggtgcca tcgtgcgtga ggagctcatc accgacttta 480acaacttctt ctggagacca agaccagact ctctactatc caactctgag aagaagaagg 540tcagaaagaa cctcaaggaa tggtccgcgc actttgaaga gcaggatgct atggaggcgg 600acagtgctac aagagagtta atcctaaaga gacgcaactg gttggatgaa tggtccaagt 660acagagaggc ttgcaagcaa accctatccg aaagtggatt gtccatttgc gattgtgtcg 720aactgtcaac taaggatgag gactgtgagc ttgtcgagga gattagagag actgtggttg 780aggagtccac cgaggaagtg ccatttttcg aggagtaatc gggtttcggc tgttgttgta 840taatagtggc aacactggta attgattatg tatatataca agtactacat ccagcgtata 900atgttttctt ttccgcagca gcgtctcgtc gcactcatgc gatc 944<210> 64<211> 260<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 144<400> 64Asn Pro Ala Ile Ala Lys Asn Val Val Ser Phe Tyr Ala Pro Glu Lys1 5 10 15Lys Val Asp Lys Lys Gly Val Ile Ile Asp Lys Glu Leu Ser Ile Phe20 25 30Lys Lys Trp Lys Leu Val Arg Ala Ile Asp Gly Lys Phe Ser Asn Glu35 40 45Ile Thr Trp Ser Pro Ala Gly Arg Phe Val Cys Val Ala Ala Ile Gly50 55 60Lys Ile Gly Ser Arg Asn Glu Asn Ile Asp Phe Tyr Asp Met Asp Tyr65 70 75 80Pro Asn Thr Glu Lys Ile Ile Asn Thr Ala Thr Asp Val Asn Ala Thr85 90 95Leu Arg Asp Val Ala His Ile Asn Tyr Ala Ser Ala Thr Asp Tyr Glu100 105 110Trp Asp Pro Ser Gly Arg Tyr Leu Ala Phe Trp Ser Ser Ala Trp Lys115 120 125
His Lys Ala Glu Asn Gly Tyr Lys Val Phe Asn Leu Ala Gly Ala Ile130 135 140Val Arg Glu Glu Leu Ile Thr Asp Phe Asn Asn Phe Phe Trp Arg Pro145 150 155 160Arg Pro Asp Ser Leu Leu Ser Asn Ser Glu Lys Lys Lys Val Arg Lys165 170 175Asn Leu Lys Glu Trp Ser Ala His Phe Glu Glu Gln Asp Ala Met Glu180 185 190Ala Asp Ser Ala Thr Arg Glu Leu Ile Leu Lys Arg Arg Asn Trp Leu195 200 205Asp Glu Trp Ser Lys Tyr Arg Glu Ala Cys Lys Gln Thr Leu Ser Glu210 215 220Ser Gly Leu Ser Ile Cys Asp Cys Val Glu Leu Ser Thr Lys Asp Glu225 230 235 240Asp Cys Glu Leu Val Glu Glu Ile Arg Glu Thr Val Val Glu Glu Ser245 250 255Thr Glu Glu Val260<210> 65<211> 3397<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (468)..(2675)<223>
<220>
<221> misc_feature<223> Oligo 144<400> 65actccattgc cctcttgcgc tgccatcgtc tcactttcgc ctgcaaatat ccactttggt 60cccgtcgcct gctccattca gcacagattg gattatcgcc tctaacacct ccatgagtct 120tgctgaagct tgcttggtgc tttgcgcgta ctgtttttgg acatctatgt aaacaagcga 180aaatacccac ttctgtgtcg cgtggataag gtgcgcgccc acattgcgaa tcccacggca 240cggccacttg ctagtaaacc ccaaagcgta acgctagttc tctagccggg cactgagacc 300gttaatgcag cagccaatgg cctgcatttg ggatgaggtt ggtcagatgg aatcacgtga 360
tatagatgct tggcgaggtc aaggtgaaaa attgttaagt taaaattttg gacgcatcac 420cagttccagc gagagaagat cagtcaagca gcaggtatag agcgaag atg gca gcg 476Met Ala Ala1gta ttc gac gat ata agg ctt gag gac atc cct gtg gat gat gtg gat 524Val Phe Asp Asp Ile Arg Leu Glu Asp Ile Pro Val Asp Asp Val Asp5 10 15atg cag gac ctt gag gag acg tat gct gta gag cgg agc atc gaa ttt 572Met Gln Asp Leu Glu Glu Thr Tyr Ala Val Glu Arg Ser Ile Glu Phe20 25 30 35gac aga tac gtg gtt gtc gac ggg gcg ccg gtg gcg ccg gag gcg aag 620Asp Arg Tyr Val Val Val Asp Gly Ala Pro Val Ala Pro Glu Ala Lys40 45 50gtg ggc gcg ctg cag aag gtg ctg acg aag cta ttt tcg cag gcg ggg 668Val Gly Ala Leu Gln Lys Val Leu Thr Lys Leu Phe Ser Gln Ala Gly55 60 65tca gtg gtg gac atg gat gtg cct gtc gaa gag ggg cgg acg aag gga 716Ser Val Val Asp Met Asp Val Pro Val Glu Glu Gly Arg Thr Lys Gly70 75 80cac ctt ttc att gag ttt gag gac gcc ggc gct gcg cgg cgg gcg atc 764His Leu Phe Ile Glu Phe Glu Asp Ala Gly Ala Ala Arg Arg Ala Ile85 90 95aag atg ttc aac ggg aag aag ttg gac gtc aag cac cgc ctg tgg gtg 812Lys Met Phe Asn Gly Lys Lys Leu Asp Val Lys His Arg Leu Trp Val100 105 110 115aac gga cta gac gac atg gag cgc tac ggg cgg ccg gac ttt tca acg 860Asn Gly Leu Asp Asp Met Glu Arg Tyr Gly Arg Pro Asp Phe Ser Thr120 125 130gaa tac cgg gag cct gtg gtg ccg gag ttc gag gcg acg gaa tac cca 908Glu Tyr Arg Glu Pro Val Val Pro Glu Phe Glu Ala Thr Glu Tyr Pro135 140 145cgg tcg tgg ttg cag gac gag acg ggt cgg gac cag ttt gtg ctg cag 956Arg Ser Trp Leu Gln Asp Glu Thr Gly Arg Asp Gln Phe Val Leu Gln150 155 160aag ggc gag atg acg gct gta ttc tgg aac cgg aac aac ctg cag ccg 1004Lys Gly Glu Met Thr Ala Val Phe Trp Asn Arg Asn Asn Leu Gln Pro165 170 175gag aac gtt gtc gaa ccg cgc cgc aac tgg tcg aac tct atc ttg aac 1052Glu Asn Val Val Glu Pro Arg Arg Asn Trp Ser Asn Ser Ile Leu Asn180 185 190 195ttc tcg cct cac ggt acg tac cta ttc tcg ttc cac gac cag ggc att 1100Phe Ser Pro His Gly Thr Tyr Leu Phe Ser Phe His Asp Gln Gly Ile200 205 210gcg tcc tgg ggt ggg ccg cag ttc aag cgt ctc cgt cgg ttt gcg cac 1148Ala Ser Trp Gly Gly Pro Gln Phe Lys Arg Leu Arg Arg Phe Ala His215 220 225cct gat gtt aag gcg atc tcc atg tcc tcg acc gag aag tac ctg gtt 1196Pro Asp Val Lys Ala Ile Ser Met Ser Ser Thr Glu Lys Tyr Leu Val230 235 240
acc ttt tcg tcg gaa cct cta gaa gtc tcg gat gaa cct aac gag gct 1244Thr Phe Ser Ser Glu Pro Leu Glu Val Ser Asp Glu Pro Asn Glu Ala245 250 255tgt cca ttc ggg ccc gag tcg cgg ggc cac cag cta tgt ata tgg gat 1292Cys Pro Phe Gly Pro Glu Ser Arg Gly His Gln Leu Cys Ile Trp Asp260 265 270 275gtg gca aca ggt gtc tgc gtg aag acc ttt gcg ctg ccg cct cag cag 1340Val Ala Thr Gly Val Cys Val Lys Thr Phe Ala Leu Pro Pro Gln Gln280 285 290cag ctg caa tgg cct atg gtc aag tgg tcc ttt gac gac aag ttc tgc 1388Gln Leu Gln Trp Pro Met Val Lys Trp Ser Phe Asp Asp Lys Phe Cys295 300 305gct cgt ctt ggc cct ggc gca att gct gtg tac gag acc gag aag aac 1436Ala Arg Leu Gly Pro Gly Ala Ile Ala Val Tyr Glu Thr Glu Lys Asn310 315 320ttc cag ctg ttg ggc ggt aag gtg atg aag atc gag gat gtt cag gac 1484Phe Gln Leu Leu Gly Gly Lys Val Met Lys Ile Glu Asp Val Gln Asp325 330 335ttc tcc ttt gct cct aag ggc atc aag ttg gcg tca aac aga ccc aac 1532Phe Ser Phe Ala Pro Lys Gly Ile Lys Leu Ala Ser Asn Arg Pro Asn340 345 350 355gac cca cca tct act gtc atg gta tac tgg act cca gag tcg aac aac 1580Asp Pro Pro Ser Thr Val Met Val Tyr Trp Thr Pro Glu Ser Asn Asn360 365 370cag tcg tgt aaa gct gtc ctg att gag cta ccg aac cgc cgt gtt ctg 1628Gln Ser Cys Lys Ala Val Leu Ile Glu Leu Pro Asn Arg Arg Val Leu375 380 385cgt acc atc aac ttg gtg cag gtt act gat gtc tcc ttc cat tgg cag 1676Arg Thr Ile Asn Leu Val Gln Val Thr Asp Val Ser Phe His Trp Gln390 395 400aac cag gca gag ttc ctc tgt gta cag gtg gac cgt cac acg aag tct 1724Asn Gln Ala Glu Phe Leu Cys Val Gln Val Asp Arg His Thr Lys Ser405 410 415agg aag acc atc ttc acc aac atg gag att tgc tct ttg act gcc aga 1772Arg Lys Thr Ile Phe Thr Asn Met Glu Ile Cys Ser Leu Thr Ala Arg420 425 430 435gag ttt cca ttt gag aag gtg gag att aag gac cgc tgc atg cgc ttt 1820Glu Phe Pro Phe Glu Lys Val Glu Ile Lys Asp Arg Cys Met Arg Phe440 445 450gca tgg gaa cct aat agc gac cgt ttc gtg atc att tcg aga tct gag 1868Ala Trp Glu Pro Asn Ser Asp Arg Phe Val Ile Ile Ser Arg Ser Glu455 460 465aat gtt aac gat aac cct gct att gcg aag aac gtt gtg agc ttc tac 1916Asn Val Asn Asp Asn Pro Ala Ile Ala Lys Asn Val Val Ser Phe Tyr470 475 480gcg cct gag aag aag gtc gac aag aag ggt gtc atc att gac aaa gag 1964Ala Pro Glu Lys Lys Val Asp Lys Lys Gly Val Ile Ile Asp Lys Glu485 490 495ctc agc atc ttc aag aag tgg aaa ctt gtg cgt gcc atc gac ggc aag 2012
Leu Ser Ile Phe Lys Lys Trp Lys Leu Val Arg Ala Ile Asp Gly Lys500 505 510 515ttc tcc aac gaa att acc tgg tca cct gct gga cgt ttt gta tgc gtc 2060Phe Ser Asn Glu Ile Thr Trp Ser Pro Ala Gly Arg Phe Val Cys Val520 525 530gct gct att ggt aag att ggt tcc cgt aac gag aac att gat ttc tac 2108Ala Ala Ile Gly Lys Ile Gly Ser Arg Asn Glu Asn Ile Asp Phe Tyr535 540 545gat atg gac tat cca aac act gaa aag atc att aac act gct act gac 2156Asp Met Asp Tyr Pro Asn Thr Glu Lys Ile Ile Asn Thr Ala Thr Asp550 555 560gtt aac gct acc ctg aga gac gtt gcc cac atc aac tac gcc agt gcc 2204Val Asn Ala Thr Leu Arg Asp Val Ala His Ile Asn Tyr Ala Ser Ala565 570 575act gat tac gaa tgg gac cca agt gga cgg tac ctt gcc ttc tgg tct 2252Thr Asp Tyr Glu Trp Asp Pro Ser Gly Arg Tyr Leu Ala Phe Trp Ser580 585 590 595tcc gcg tgg aag cac aag gcc gaa aat gga tac aag gta ttc aac ttg 2300Ser Ala Trp Lys His Lys Ala Glu Asn Gly Tyr Lys Val Phe Asn Leu600 605 610gcc ggt gcc atc gtg cgt gag gag ctc atc acc gac ttt aac aac ttc 2348Ala Gly Ala Ile Val Arg Glu Glu Leu Ile Thr Asp Phe Asn Asn Phe615 620 625ttc tgg aga cca aga cca gac tct cta cta tcc aac tct gag aag aag 2396Phe Trp Arg Pro Arg Pro Asp Ser Leu Leu Ser Asn Ser Glu Lys Lys630 635 640aag gtc aga aag aac ctc aag gaa tgg tcc gcg cac ttt gaa gag cag 2444Lys Val Arg Lys Asn Leu Lys Glu Trp Ser Ala His Phe Glu Glu Gln645 650 655gat gct atg gag gcg gac agt gct aca aga gag tta atc cta aag aga 2492Asp Ala Met Glu Ala Asp Ser Ala Thr Arg Glu Leu Ile Leu Lys Arg660 665 670 675cgc aac tgg ttg gat gaa tgg tcc aag tac aga gag gct tgc aag caa 2540Arg Asn Trp Leu Asp Glu Trp Ser Lys Tyr Arg Glu Ala Cys Lys Gln680 685 690acc cta tcc gaa agt gga ttg tcc att tgc gat tgt gtc gaa ctg tca 2588Thr Leu Ser Glu Ser Gly Leu Ser Ile Cys Asp Cys Val Glu Leu Ser695 700 705act aag gat gag gac tgt gag ctt gtc gag gag att aga gag act gtg 2636Thr Lys Asp Glu Asp Cys Glu Leu Val Glu Glu Ile Arg Glu Thr Val710 715 720gtt gag gag tcc acc gag gaa gtg cca ttt ttc gag gag taatcgggtt 2685Val Glu Glu Ser Thr Glu Glu Val Pro Phe Phe Glu Glu725 730 735tcggctgttg ttgtataata gtggcaacac tggtaattga ttatgtatat atacaagtac2745tacatccagc gtataatgtt ttcttttccg cagcagcgtc tcgtcgcact catgcgatct2805ggctgcggcc gccaccacgc agaccgcgga ccgccttcgg tgagatcatt accatacaat2865ctagagaagc aataaatagg tttttcgttt attcagcttt ggtacgcagc tgcagcccat2925
gccagcgttt gatgtcgtcc gcaagcacgc ggttgacgag cttgtgctgc tgcaccatgc2985tcttgccctt gaagtgtgtg ctccggatat cgatcgtgaa catcgaacca caacccccgc3045tcacatcagt gactttcaca taccccggcg caagcgcgtc ggttagcttt tgcgtaatga3105gcgcctcttc cggcgtgcta gtataatagc gcgcgaagag acgggagtaa gagcccacaa3165gccgacctct agctaacatg gggtcgtttg agcggcaaat aatgaaacgg gagcagcaga3225tgaagtttaa atctgcgtga tctgcagata tacgtgtgtg cgcgtgagca gtcagcctga3285gaacttttcg gaacatcgct tttgccggca acgtggggga agccctactt gccttacaag3345tcaactcatg gcacaccggc tacccttctg atgtttgcat tcccagccaa ga3397<210> 66<211> 736<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 144<400> 66Met Ala Ala Val Phe Asp Asp Ile Arg Leu Glu Asp Ile Pro Val Asp1 5 10 15Asp Val Asp Met Gln Asp Leu Glu Glu Thr Tyr Ala Val Glu Arg Ser20 25 30Ile Glu Phe Asp Arg Tyr Val Val Val Asp Gly Ala Pro Val Ala Pro35 40 45Glu Ala Lys Val Gly Ala Leu Gln Lys Val Leu Thr Lys Leu Phe Ser50 55 60Gln Ala Gly Ser Val Val Asp Met Asp Val Pro Val Glu Glu Gly Arg65 70 75 80Thr Lys Gly His Leu Phe Ile Glu Phe Glu Asp Ala Gly Ala Ala Arg85 90 95Arg Ala Ile Lys Met Phe Asn Gly Lys Lys Leu Asp Val Lys His Arg100 105 110Leu Trp Val Asn Gly Leu Asp Asp Met Glu Arg Tyr Gly Arg Pro Asp115120 125Phe Ser Thr Glu Tyr Arg Glu Pro Val Val Pro Glu Phe Glu Ala Thr130 135 140
Glu Tyr Pro Arg Ser Trp Leu Gln Asp Glu Thr Gly Arg Asp Gln Phe145 150 155 160Val Leu Gln Lys Gly Glu Met Thr Ala Val Phe Trp Asn Arg Asn Asn165 170 175Leu Gln Pro Glu Asn Val Val Glu Pro Arg Arg Asn Trp Ser Asn Ser180 185 190Ile Leu Asn Phe Ser Pro His Gly Thr Tyr Leu Phe Ser Phe His Asp195 200 205Gln Gly Ile Ala Ser Trp Gly Gly Pro Gln Phe Lys Arg Leu Arg Arg210 215 220Phe Ala His Pro Asp Val Lys Ala Ile Ser Met Ser Ser Thr Glu Lys225 230 235 240Tyr Leu Val Thr Phe Ser Ser Glu Pro Leu Glu Val Ser Asp Glu Pro245 250 255Asn Glu Ala Cys Pro Phe Gly Pro Glu Ser Arg Gly His Gln Leu Cys260 265 270Ile Trp Asp Val Ala Thr Gly Val Cys Val Lys Thr Phe Ala Leu Pro275 280 285Pro Gln Gln Gln Leu Gln Trp Pro Met Val Lys Trp Ser Phe Asp Asp290 295 300Lys Phe Cys Ala Arg Leu Gly Pro Gly Ala Ile Ala Val Tyr Glu Thr305 310 315 320Glu Lys Asn Phe Gln Leu Leu Gly Gly Lys Val Met Lys Ile Glu Asp325 330 335Val Gln Asp Phe Ser Phe Ala Pro Lys Gly Ile Lys Leu Ala Ser Asn340 345 350Arg Pro Asn Asp Pro Pro Ser Thr Val Met Val Tyr Trp Thr Pro Glu355 360 365Ser Asn Asn Gln Ser Cys Lys Ala Val Leu Ile Glu Leu Pro Asn Arg370 375 380Arg Val Leu Arg Thr Ile Asn Leu Val Gln Val Thr Asp Val Ser Phe385 390 395 400His Trp Gln Asn Gln Ala Glu Phe Leu Cys Val Gln Val Asp Arg His
405 410 415Thr Lys Ser Arg Lys Thr Ile Phe Thr Asn Met Glu Ile Cys Ser Leu420 425 430Thr Ala Arg Glu Phe Pro Phe Glu Lys Val Glu Ile Lys Asp Arg Cys435 440 445Met Arg Phe Ala Trp Glu Pro Asn Ser Asp Arg Phe Val Ile Ile Ser450 455 460Arg Ser Glu Asn Val Asn Asp Asn Pro Ala Ile Ala Lys Asn Val Val465 470 475 480Ser Phe Tyr Ala Pro Glu Lys Lys Val Asp Lys Lys Gly Val Ile Ile485 490 495Asp Lys Glu Leu Ser Ile Phe Lys Lys Trp Lys Leu Val Arg Ala Ile500 505 510Asp Gly Lys Phe Ser Asn Glu Ile Thr Trp Ser Pro Ala Gly Arg Phe515 520 525Val Cys Val Ala Ala Ile Gly Lys Ile Gly Ser Arg Asn Glu Asn Ile530 535 540Asp Phe Tyr Asp Met Asp Tyr Pro Asn Thr Glu Lys Ile Ile Asn Thr545 550 555 560Ala Thr Asp Val Asn Ala Thr Leu Arg Asp Val Ala His Ile Asn Tyr565 570 575Ala Ser Ala Thr Asp Tyr Glu Trp Asp Pro Ser Gly Arg Tyr Leu Ala580 585 590Phe Trp Ser Ser Ala Trp Lys His Lys Ala Glu Asn Gly Tyr Lys Val595 600 605Phe Asn Leu Ala Gly Ala Ile Val Arg Glu Glu Leu Ile Thr Asp Phe610 615 620Asn Asn Phe Phe Trp Arg Pro Arg Pro Asp Ser Leu Leu Ser Asn Ser625 630 635 640Glu Lys Lys Lys Val Arg Lys Asn Leu Lys Glu Trp Ser Ala His Phe645 650 655Glu Glu Gln Asp Ala Met Glu Ala Asp Ser Ala Thr Arg Glu Leu Ile
660 665 670Leu Lys Arg Arg Asn Trp Leu Asp Glu Trp Ser Lys Tyr Arg Glu Ala675 680 685Cys Lys Gln Thr Leu Ser Glu Ser Gly Leu Ser Ile Cys Asp Cys Val690 695 700Glu Leu Ser Thr Lys Asp Glu Asp Cys Glu Leu Val Glu Glu Ile Arg705 710 715 720Glu Thr Val Val Glu Glu Ser Thr Glu Glu Val Pro Phe Phe Glu Glu725 730 735<210> 67<211> 1136<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 168<400> 67gatcggaggg gtgaagtgct cgggttggct ttcaggagaa acacggacca actgtatgcg 60gcctgtgccg attataaaat acgtacgttc gcaattaacc aattttcgca gcctggaggt 120tctatatggt caccaagata tcwgtcgcag atatttcggc cctgaatatg gagcgctgcg 180ttacggtcgg gtccagggat aggacctgta tgctgtggaa gattgcagac gaaacacgct 240tgaccttcag aggcggtgac gatcctgaaa agctgctcag aagatggcag aaggcgaaca 300gtgaacagga aaacaaggat gcagacgaca atactccagc ggagccgccc gtcttttacg 360gcgagggaag catagactgc atcaccatgc tcgacgattc acacttcatc tcgggctcgg 420acaatggaaa catatcgctt tggtccctat ccaagaaaaa gccgctcttc gttcagcgag 480ttgcccatgg agtgcagcca cagccagata ataccaagat cagcggcgag cgggacccag 540ctgtgcgtac gcagcaggcc caaggcaacc gtctcgcgca gccgtactgg ataactgccc 600tgcacgccgt cccctacagc aatgtattct tcagtgggtc ctggaacgga accatgaagg 660tctggaagct gcacgaaaac atgcgctctt tcgagccact cggcgaactg gatggctgca 720agggcctggt gacgaagatc cagacggtgg aggccggtaa gagcggcagg gaaacacttc 780gcgtcctcgc cagtgtcagc aaggagcacc ggcttggtcg gtggatgggc aagcttcccg 840gcgccagaaa cggactgttt tccgcagtca tcgaccaggc tggcttctga gcaccagtcg 900cctgaagaac actcgacaca ctgcagcttg cacacacacc gttccaacag tctctctgca 960agcgagctgc tatcggcatt atgtttgtat ggatacatag acagacatag aagcaataaa 1020aaaaggcgca ccatggcgct acgaactaat cgcaaaaggg aagcctgctg ggctccacat 1080
gtctagagaa cttcggattt tgcattcgct cgcacctttc gcgctcaaca tagatc1136<210> 68<211> 34<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 168<400> 68Arg Gly Glu Val Leu Gly Leu Ala Phe Arg Arg Asn Thr Asp Gln Leu1 5 10 15Tyr Ala Ala Cys Ala Asp Tyr Lys Ile Arg Thr Phe Ala Ile Asn Gln20 25 30Phe Ser<210> 69<211> 239<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 168<400> 69Ser Val Ala Asp Ile Ser Ala Leu Asn Met Glu Arg Cys Val Thr Val1 5 10 15Gly Ser Arg Asp Arg Thr Cys Met Leu Trp Lys Ile Ala Asp Glu Thr20 25 30Arg Leu Thr Phe Arg Gly Gly Asp Asp Pro Glu Lys Leu Leu Arg Arg35 40 45Trp Gln Lys Ala Asn Ser Glu Gln Glu Asn Lys Asp Ala Asp Asp Asn50 55 60Thr Pro Ala Glu Pro Pro Val Phe Tyr Gly Glu Gly Ser Ile Asp Cys65 70 75 80Ile Thr Met Leu Asp Asp Ser His Phe Ile Ser Gly Ser Asp Asn Gly85 90 95
Asn Ile Ser Leu Trp Ser Leu Ser Lys Lys Lys Pro Leu Phe Val Gln100 105 110Arg Val Ala His Gly Val Gln Pro Gln Pro Asp Asn Thr Lys Ile Ser115 120 125Gly Glu Arg Asp Pro Ala Val Arg Thr Gln Gln Ala Gln Gly Asn Arg130 135 140Leu Ala Gln Pro Tyr Trp Ile Thr Ala Leu His Ala Val Pro Tyr Ser145 150 155 160Asn Val Phe Phe Ser Gly Ser Trp Asn Gly Thr Met Lys Val Trp Lys165 170 175Leu His Glu Asn Met Arg Ser Phe Glu Pro Leu Gly Glu Leu Asp Gly180 185 190Cys Lys Gly Leu Val Thr Lys Ile Gln Thr Val Glu Ala Gly Lys Ser195 200 205Gly Arg Glu Thr Leu Arg Val Leu Ala Ser Val Ser Lys Glu His Arg210 215 220Leu Gly Arg Trp Met Gly Lys Leu Pro Gly Ala Arg Asn Gly Leu225 230 235<210> 70<211> 2681<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (660)..(2432)<223>
<220>
<221> misc_feature<223> Oligo 168<400> 70acagccagaa gacattcatg tctggccact cggcctgaac tatgacatgt taaattacat 60tctaatcaaa ggcaagaatc tgtggcccgg cttccccttg ccgctgcctt cagaaatgga 120aatcaggctt ccacttctcg ataaaacgca ggtgctgaaa aacgacacat ctcccgacga 180agaagtggtg atccctcccg cactagcagc agaagaggaa ttcctccgct ctcaggtcct 240tgcaggactc cttgcagata cactaaagta tgatggagag ttttttggga atgagaatga 300gatactggcg aacttgaatg gggttcgtga caaatcgttg ctacgcctct ttgcctccgc 360
ttgttcagac cacaacaccg agaaggcgct atcactggtg aaggaattga agcaagataa 420agcattgaat gccgctcaaa aaatagcaga acgcgctgaa ttattaagac tggtaagcag 480catcaacgac atcagaaact ctcgtttcga gtcagaattg aacaacttat agcactgaac 540caacactgta actagtcctg tcgcttagtt aatatagttt tttttgaagg ttcgcggaat 600cgtttctttt tatatgaaaa ttttgaaggt cctttggaag gcgatgagaa gaaacgccg 659atg agg aag gct tta tct cca ctg gtt agt agg aac tct cat ata gca 707Met Arg Lys Ala Leu Ser Pro Leu Val Ser Arg Asn Ser His Ile Ala1 5 10 15cgc acc atg gca cgg ggt tcg gat agc gcg tct cgc aag aga act agg 755Arg Thr Met Ala Arg Gly Ser Asp Ser Ala Ser Arg Lys Arg Thr Arg20 25 30cag aag act acg gaa aag aat aat gtt gtg gac gag gaa att tcg ggt 803Gln Lys Thr Thr Glu Lys Asn Asn Val Val Asp Glu Glu Ile Ser Gly35 40 45gtg tca tct aac gag gaa gga tca tcg tca gat gaa caa gaa tta gag 851Val Ser Ser Asn Glu Glu Gly Ser Ser Ser Asp Glu Gln Glu Leu Glu50 55 60gat gta gct gac gct gag ttg gat tct gat gag gaa ttt gcg aat gag 899Asp Val Ala Asp Ala Glu Leu Asp Ser Asp Glu Glu Phe Ala Asn Glu65 70 75 80aac ccc gct gac aag cgg agg cga ctc gcc aaa caa tac cta gaa aat 947Asn Pro Ala Asp Lys Arg Arg Arg Leu Ala Lys Gln Tyr Leu Glu Asn85 90 95att aag gaa gag gct aat gaa att atg cat ggc gat tct gag gca cat 995Ile Lys Glu Glu Ala Asn Glu Ile Met His Gly Asp Ser Glu Ala His100 105 110gca gac gat gcc caa ggt caa ggt ttt gct gat gca tac aat aac ttt 1043Ala Asp Asp Ala Gln Gly Gln Gly Phe Ala Asp Ala Tyr Asn Asn Phe115 120 125gac gcg cgc gac ctg gat cgt gac att atc tca gca aga ttg aag caa 1091Asp Ala Arg Asp Leu Asp Arg Asp Ile Ile Ser Ala Arg Leu Lys Gln130 135 140gac gtt gct gag caa agg gga tct gtg tac cgc tgg atc gcc gat aag 1139Asp Val Ala Glu Gln Arg Gly Ser Val Tyr Arg Trp Ile Ala Asp Lys145 150 155 160ctg cta cta tct gag gcc aag aag tcc ttc acc agg gtc ggg gag aag 1187Leu Leu Leu Ser Glu Ala Lys Lys Ser Phe Thr Arg Val Gly Glu Lys165 170 175aac ctg act gcg ctc agc tgc tat cag caa gca atg aat aaa ttt tca 1235Asn Leu Thr Ala Leu Ser Cys Tyr Gln Gln Ala Met Asn Lys Phe Ser180 185 190cat agg gaa atc caa agc aaa agc aag gga cta atg ttt gcc tat act 1283His Arg Glu Ile Gln Ser Lys Ser Lys Gly Leu Met Phe Ala Tyr Thr195 200 205gtc agt aag gac atg caa ctg acg aaa tac gat atc acc gac ttc aat 1331Val Ser Lys Asp Met Gln Leu Thr Lys Tyr Asp Ile Thr Asp Phe Asn210 215 220
gct aga ccg acg aag gta aag tac act aag gga ggg cgc aaa tac atc 1379Ala Arg Pro Thr Lys Val Lys Tyr Thr Lys Gly Gly Arg Lys Tyr Ile225 230 235 240cca gag ggt aac cag ggc ttt cag aac acg acg gag gga cac tat gat 1427Pro Glu Gly Asn Gln Gly Phe Gln Asn Thr Thr Glu Gly His Tyr Asp245 250 255gag att ctg acg gtt gca gct tct cca gat ggt aag tac gtt gtc acg 1475Glu Ile Leu Thr Val Ala Ala Ser Pro Asp Gly Lys Tyr Val Val Thr260 265 270gga ggg aga gac aaa aag ctt atc gtg tgg agc act gag tcg ttg gca 1523Gly Gly Arg Asp Lys Lys Leu Ile Val Trp Ser Thr Glu Ser Leu Ala275 280 285cca gtt aaa gtt ata cca acc aaa gat cgg agg ggt gaa gtg ctc ggg 1571Pro Val Lys Val Ile Pro Thr Lys Asp Arg Arg Gly Glu Val Leu Gly290 295 300ttg gct ttc agg aga aac acg gac caa ctg tat gcg gcc tgt gcc gat 1619Leu Ala Phe Arg Arg Asn Thr Asp Gln Leu Tyr Ala Ala Cys Ala Asp305 310 315 320tat aaa ata cgt acg ttc gca att aac caa ttt tcg cag ctg gag gtt 1667Tyr Lys Ile Arg Thr Phe Ala Ile Asn Gln Phe Ser Gln Leu Glu Val325 330 335cta tat ggt cac caa gat atc gtc gca gat att tcg gcc ctg aat atg 1715Leu Tyr Gly His Gln Asp Ile Val Ala Asp Ile Ser Ala Leu Asn Met340 345 350gag cgc tgc gtt acg gtc ggg tcc agg gat agg acc tgt atg ctg tgg 1763Glu Arg Cys Val Thr Val Gly Ser Arg Asp Arg Thr Cys Met Leu Trp355 360 365aag att gca gac gaa aca cgc ttg acc ttc aga ggc ggt gac gat cct 1811Lys Ile Ala Asp Glu Thr Arg Leu Thr Phe Arg Gly Gly Asp Asp Pro370 375 380gaa aag ctg ctc aga aga tgg cag aag gcg aac agt gaa cag gaa aac 1859Glu Lys Leu Leu Arg Arg Trp Gln Lys Ala Asn Ser Glu Gln Glu Asn385 390 395 400aag gat gca gac gac aat act cca gcg gag ccg ccc gtc ttt tac ggc 1907Lys Asp Ala Asp Asp Asn Thr Pro Ala Glu Pro Pro Val Phe Tyr Gly405 410 415gag gga agc ata gac tgc atc acc atg ctc gac gat tca cac ttc atc 1955Glu Gly Ser Ile Asp Cys Ile Thr Met Leu Asp Asp Ser His Phe Ile420 425 430tcg ggc tcg gac aat gga aac ata tcg ctt tgg tcc cta tcc aag aaa 2003Ser Gly Ser Asp Asn Gly Asn Ile Ser Leu Trp Ser Leu Ser Lys Lys435 440 445aag ccg ctc ttc gtt cag cga gtt gcc cat gga gtg cag cca cag cca 2051Lys Pro Leu Phe Val Gln Arg Val Ala His Gly Val Gln Pro Gln Pro450 455 460gat aat acc aag atc agc ggc gag cgg gac cca gct gtg cgt acg cag 2099Asp Asn Thr Lys Ile Ser Gly Glu Arg Asp Pro Ala Val Arg Thr Gln465 470 475 480cag gcc caa ggc aac cgt ctc gcg cag ccg tac tgg ata act gcc ctg 2147Gln Ala Gln Gly Asn Arg Leu Ala Gln Pro Tyr Trp Ile Thr Ala Leu
485 490 495cac gcc gtc ccc tac agc aat gta ttc ttc agt ggg tcc tgg aac gga 2195His Ala Val Pro Tyr Ser Asn Val Phe Phe Ser Gly Ser Trp Asn Gly500 505 510acc atg aag gtc tgg aag ctg cac gaa aac atg cgc tct ttc gag cca 2243Thr Met Lys Val Trp Lys Leu His Glu Asn Met Arg Ser Phe Glu Pro515 520 525ctc ggc gaa ctg gat ggc tgc aag ggc ctg gtg acg aag atc cag acg 2291Leu Gly Glu Leu Asp Gly Cys Lys Gly Leu Val Thr Lys Ile Gln Thr530 535 540gtg gag gcc ggt aag agc ggc agg gaa aca ctt cgc gtc ctc gcc agt 2339Val Glu Ala Gly Lys Ser Gly Arg Glu Thr Leu Arg Val Leu Ala Ser545 550 555 560gtc agc aag gag cac cgg ctt ggt cgg tgg atg ggc aag ctt ccc ggc 2387Val Ser Lys Glu His Arg Leu Gly Arg Trp Met Gly Lys Leu Pro Gly565 570 575gcc aga aac gga ctg ttt tcc gca gtc atc gac cag gct ggc ttc 2432Ala Arg Asn Gly Leu Phe Ser Ala Val Ile Asp Gln Ala Gly Phe580 585 590tgagcaccag tcgcctgaag aacactcgac acactgcagc ttgcacacac accgttccaa2492cagtctctct gcaagcgagc tgctatcggc attatgtttg tatggataca tagacagaca2552tagaagcaat aaaaaaaggc gcaccatggc gctacgaact aatcgcaaaa gggaagcctg2612ctgggctcca catgtctaga gaacttcgga ttttgcattc gctcgcacct ttcgcgctca2672acatagatc2681<210> 71<211> 591<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 168<400> 71Met Arg Lys Ala Leu Ser Pro Leu Val Ser Arg Asn Ser His Ile Ala1 5 10 15Arg Thr Met Ala Arg Gly Ser Asp Ser Ala Ser Arg Lys Arg Thr Arg20 25 30Gln Lys Thr Thr Glu Lys Asn Asn Val Val Asp Glu Glu Ile Ser Gly35 40 45Val Ser Ser Asn Glu Glu Gly Ser Ser Ser Asp Glu Gln Glu Leu Glu50 55 60Asp Val Ala Asp Ala Glu Leu Asp Ser Asp Glu Glu Phe Ala Asn Glu
65 70 75 80Asn Pro Ala Asp Lys Arg Arg Arg Leu Ala Lys Gln Tyr Leu Glu Asn85 90 95Ile Lys Glu Glu Ala Asn Glu Ile Met His Gly Asp Ser Glu Ala His100 105 110Ala Asp Asp Ala Gln Gly Gln Gly Phe Ala Asp Ala Tyr Asn Asn Phe115 120 125Asp Ala Arg Asp Leu Asp Arg Asp Ile Ile Ser Ala Arg Leu Lys Gln130 135 140Asp Val Ala Glu Gln Arg Gly Ser Val Tyr Arg Trp Ile Ala Asp Lys145 150 155 160Leu Leu Leu Ser Glu Ala Lys Lys Ser Phe Thr Arg Val Gly Glu Lys165 170 175Asn Leu Thr Ala Leu Ser Cys Tyr Gln Gln Ala Met Asn Lys Phe Ser180 185 190His Arg Glu Ile Gln Ser Lys Ser Lys Gly Leu Met Phe Ala Tyr Thr195 200 205Val Ser Lys Asp Met Gln Leu Thr Lys Tyr Asp Ile Thr Asp Phe Asn210 215 220Ala Arg Pro Thr Lys Val Lys Tyr Thr Lys Gly Gly Arg Lys Tyr Ile225 230 235 240Pro Glu Gly Asn Gln Gly Phe Gln Asn Thr Thr Glu Gly His Tyr Asp245 250 255Glu Ile Leu Thr Val Ala Ala Ser Pro Asp Gly Lys Tyr Val Val Thr260 265 270Gly Gly Arg Asp Lys Lys Leu Ile Val Trp Ser Thr Glu Ser Leu Ala275 280 285Pro Val Lys Val Ile Pro Thr Lys Asp Arg Arg Gly Glu Val Leu Gly290 295 300Leu Ala Phe Arg Arg Asn Thr Asp Gln Leu Tyr Ala Ala Cys Ala Asp305 310 315 320Tyr Lys Ile Arg Thr Phe Ala Ile Asn Gln Phe Ser Gln Leu Glu Val
325 330 335Leu Tyr Gly His Gln Asp Ile Val Ala Asp Ile Ser Ala Leu Asn Met340 345 350Glu Arg Cys Val Thr Val Gly Ser Arg Asp Arg Thr Cys Met Leu Trp355 360 365Lys Ile Ala Asp Glu Thr Arg Leu Thr Phe Arg Gly Gly Asp Asp Pro370 375 380Glu Lys Leu Leu Arg Arg Trp Gln Lys Ala Asn Ser Glu Gln Glu Asn385 390 395 400Lys Asp Ala Asp Asp Asn Thr Pro Ala Glu Pro Pro Val Phe Tyr Gly405 410 415Glu Gly Ser Ile Asp Cys Ile Thr Met Leu Asp Asp Ser His Phe Ile420 425 430Ser Gly Ser Asp Asn Gly Asn Ile Ser Leu Trp Ser Leu Ser Lys Lys435 440 445Lys Pro Leu Phe Val Gln Arg Val Ala His Gly Val Gln Pro Gln Pro450 455 460Asp Asn Thr Lys Ile Ser Gly Glu Arg Asp Pro Ala Val Arg Thr Gln465 470 475 480Gln Ala Gln Gly Asn Arg Leu Ala Gln Pro Tyr Trp Ile Thr Ala Leu485 490 495His Ala Val Pro Tyr Ser Asn Val Phe Phe Ser Gly Ser Trp Asn Gly500 505 510Thr Met Lys Val Trp Lys Leu His Glu Asn Met Arg Ser Phe Glu Pro515 520 525Leu Gly Glu Leu Asp Gly Cys Lys Gly Leu Val Thr Lys Ile Gln Thr530 535 540Val Glu Ala Gly Lys Ser Gly Arg Glu Thr Leu Arg Val Leu Ala Ser545 550 555 560Val Ser Lys Glu His Arg Leu Gly Arg Trp Met Gly Lys Leu Pro Gly565 570 575Ala Arg Asn Gly Leu Phe Ser Ala Val Ile Asp Gln Ala Gly Phe
580 585 590<210> 72<211> 510<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 160<400> 72gatctgcgtg ggcctcgctg ggcgggcggc gggcttcaac aacatgtggg ccggggtaga 60gagcaaagtc ggttagagga tataaacgta ggtaggggca gcagcctcar gcaggcctcc 120gaggccttgg atctcttggc tagccttggc ctgggccttg gggcccatga caccagccac 180cccagtgctt tctggattcg tcgtacttct cgatgaagtt ggcgttgacg gcggagacga 240gcttggcaag ggcagcctcg tcctcggcgc ggacctcggt gagggcggcg acggcggagg 300tcttctggtt gaccagggtg cctaggcggg ccttgccctt gacgatggcg tatgggacgc 360ccatcttctt gcacagcgca ggcaggaaga tgacaagctc gatggggtcg acgtcgttgg 420cgatgagcac gagcttggcc ttcttgttct cgacgaggga gacgacgtgg ttcaagccga 480acttgacggc gtatggctta agcgaagcct 510<210> 73<211> 111<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 160<400> 73Ala Ser Leu Lys Pro Tyr Ala Val Lys Phe Gly Leu Asn His Val Val1 5 10 15Ser Leu Val Glu Asn Lys Lys Ala Lys Leu Val Leu Ile Ala Asn Asp20 25 30Val Asp Pro Ile Glu Leu Val Ile Phe Leu Pro Ala Leu Cys Lys Lys35 40 45Met Gly Val Pro Tyr Ala Ile Val Lys Gly Lys Ala Arg Leu Gly Thr50 55 60Leu Val Asn Gln Lys Thr Ser Ala Val Ala Ala Leu Thr Glu Val Arg65 70 75 80
Ala Glu Asp Glu Ala Ala Leu Ala Lys Leu Val Ser Ala Val Asn Ala85 90 95Asn Phe Ile Glu Lys Tyr Asp Glu Ser Arg Lys His Trp Gly Gly100 105 110<210> 74<211> 1437<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 18<400> 74gatcagtgaa ttttcatcat tatggccaaa actgcgtctg gggctttaat cgaagtcatc 60ttcatcataa tcatcaccat aagcccgata ttgcaagtcc ctgtcaacgc caccatagct 120gcgctcatac agcagatcct cagcgccgag atcaagcctt gctcatctga gtgagatagt 180tgaattcaga ttcctcatca ttgttgcgcc tagtttcaat tttccgggcc tgctcgcgac 240tctgctcata attaggcacg cgcctacgag tctgaccccc attgccacca aagtcgcgcc 300tacgctgacc cgagccgtac tcgtcgcggc cactgcgtct gcgttcttgc cccgatccac 360caaagtcgcg cctacgctga ccccagccgt actcgtcgcg gccactgcgt ctgcgttctt 420gccccgatcc accaaagtcg tgctgacgtt cttgccccta actgggattg ccaccatcat 480aaggctttgg ctctgcaccc tctatttcct cttgcaaagc cggctccaaa gcaaggatag 540agcttgcacc tgttaacaaa caaataatac tggataattt tatcttgctg atggttatta 600ggctattcaa tgtagaaacc tattccacaa ataacataga gtgcttttat atgccacatt 660tcatatcctt ccgcaagctt gatggcaaaa tgctgagtca taataaggat agagtaaagt 720ggcccatctg atacactctt aatgacttcg catttttagt aactttgccc aggcatatca 780tatattctac cccttcataa aagttatgta acgaataatt tgaaggagcc tattatttcc 840tggaagagta taaccgtctt tttattccaa gtatccaaaa catcactata ggaacatata 900ctaaaaagtg ggaacgttcc gatattcaca taactactgt tgttttagat caaaaaattg 960tctattttat tggcgttgga tggatccttt gtatcacgaa atacgcaaat gttggaattt 1020ttaactttgg aatacctatt gaagcaacat atgtcatttt acaaggagca tcactttaca 1080ggcaccgaga aagaaagaaa ttgacaaaaa agaagggata agtgaaggca gttgcacagg 1140caccgaccaa gacagtgatt tacaatagtt acaggtcaat aataagaaag acaactatgt 1200ggcattatgc agtacgctct aagggcgcag ttccgatgat tgtttcaccc agctacacca 1260gtagctcgca ctgccattta tttacagtgc ttgtgtcaca gacccaaaat ggataagtgt 1320gagagcgact gtcgcttctg tatagctcaa cgccaatgtg tgtctgcact gggacaacac 1380
cggatttagt acattgacac caacyttcgc cgcctgctga cagatgcagc wccgatc 1437<210> 75<211> 1437<212> DNA<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (958)..(1272)<223>
<220>
<221> misc_feature<223> Oligo 18<400> 75gatcggwgct gcatctgtca gcaggcggcg aargttggtg tcaatgtact aaatccggtg 60ttgtcccagt gcagacacac attggcgttg agctatacag aagcgacagt cgctctcaca 120cttatccatt ttgggtctgt gacacaagca ctgtaaataa atggcagtgc gagctactgg 180tgtagctggg tgaaacaatc atcggaactg cgcccttaga gcgtactgca taatgccaca 240tagttgtctt tcttattatt gacctgtaac tattgtaaat cactgtcttg gtcggtgcct 300gtgcaactgc cttcacttat cccttctttt ttgtcaattt ctttctttct cggtgcctgt 360aaagtgatgc tccttgtaaa atgacatatg ttgcttcaat aggtattcca aagttaaaaa 420ttccaacatt tgcgtatttc gtgatacaaa ggatccatcc aacgccaata aaatagacaa 480ttttttgatc taaaacaaca gtagttatgt gaatatcgga acgttcccac tttttagtat 540atgttcctat agtgatgttt tggatacttg gaataaaaag acggttatac tcttccagga 600aataataggc tccttcaaat tattcgttac ataactttta tgaaggggta gaatatatga 660tatgcctggg caaagttact aaaaatgcga agtcattaag agtgtatcag atgggccact 720ttactctatc cttattatga ctcagcattt tgccatcaag cttgcggaag gatatgaaat 780gtggcatata aaagcactct atgttatttg tggaataggt ttctacattg aatagcctaa 840taaccatcag caagataaaa ttatccagta ttatttgttt gttaacaggt gcaagctcta 900tccttgcttt ggagccggct ttgcaagagg aaatagaggg tgcagagcca aagcctt957atg atg gtg gca atc cca gtt agg ggc aag aac gtc agc acg act ttg 1005Met Met Val Ala Ile Pro Val Arg Gly Lys Asn Val Ser Thr Thr Leu1 5 10 15gtg gat cgg ggc aag aac gca gac gca gtg gcc gcg acg agt acg gct 1053Val Asp Arg Gly Lys Asn Ala Asp Ala Val Ala Ala Thr Ser Thr Ala20 25 30ggg gtc agc gta ggc gcg act ttg gtg gat cgg ggc aag aac gca gac 1101Gly Val Ser Val Gly Ala Thr Leu Val Asp Arg Gly Lys Asn Ala Asp35 40 45
gca gtg gcc gcg acg agt acg gct cgg gtc agc gta ggc gcg act ttg1149Ala Val Ala Ala Thr Ser Thr Ala Arg Val Ser Val Gly Ala Thr Leu50 55 60gtg gca atg ggg gtc aga ctc gta ggc gcg tgc cta att atg agc aga1197Val Ala Met Gly Val Arg Leu Val Gly Ala Cys Leu Ile Met Ser Arg65 70 75 80gtc gcg agc agg ccc gga aaa ttg aaa cta ggc gca aca atg atg agg1245Val Ala Ser Arg Pro Gly Lys Leu Lys Leu Gly Ala Thr Met Met Arg85 90 95aat ctg aat tca act atc tca ctc aga tgagcaaggc ttgatctcgg 1292Asn Leu Asn Ser Thr Ile Ser Leu Arg100 105cgctgaggat ctgctgtatg agcgcagcta tggtggcgtt gacagggact tgcaatatcg 1352ggcttatggt gatgattatg atgaagatga cttcgattaa agccccagac gcagttttgg 1412ccataatgat gaaaattcac tgatc1437<210> 76<211> 105<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 18<400> 76Met Met Val Ala Ile Pro Val Arg Gly Lys Asn Val Ser Thr Thr Leu1 5 10 15Val Asp Arg Gly Lys Asn Ala Asp Ala Val Ala Ala Thr Ser Thr Ala20 25 30Gly Val Ser Val Gly Ala Thr Leu Val Asp Arg Gly Lys Asn Ala Asp35 40 45Ala Val Ala Ala Thr Ser Thr Ala Arg Val Ser Val Gly Ala Thr Leu50 55 60Val Ala Met Gly Val Arg Leu Val Gly Ala Cys Leu Ile Met Ser Arg65 70 75 80Val Ala Ser Arg Pro Gly Lys Leu Lys Leu Gly Ala Thr Met Met Arg85 90 95Asn Leu Asn Ser Thr Ile Ser Leu Arg100 105<210> 77<211> 2602<212> DNA
<213> 棉桃阿舒氏囊霉<220>
<221> CDS<222> (1531)..(1845)<223>
<220>
<221> misc_feature<223> Oligo 18<400> 77tcagcggtgt ggtgtatggg tctctcagcg gtgtggtgta tgggtctctc agcggtgtgg60tgtatgggtc tctcagcggt gtggtgtatg gtctctcagc ggtgtggtgt atgggtctct120cagcggtgtg gtgtatgggt ctctcagcgg tgtggtgtat gggtctctca gcggtgtggt180gtatgggtct ctcagcggtg tggtgtatgg gtctctcagc ggtgtggtgt atcagagggt240tttaaaccta aatctgacgc cttaaccact cggccaaact ctcttatatg cttttatatg300aaaggcgtgc aatacgtacg agcaggttgg ccacgtgaac tggctgccca gggtcagagc360tgtatccgcg agtatcccaa aacccgtaca gtacgaaata cccacaccag tttcgcggta420atgtcagtta gcactcgcca cggtgatgac tgaactcgcg gctggcacga tcaacaacgt480agggcccgag ccttcagcag aggaggatcg tattattcat ataaaatgct cacacaagca540aacatggagg ccaggaaggg caccgtggtc ggtgatcggt gctgcatctg tcagcaggcg600gcgaaggttg gtgtcaatgt actaaatccg gtgttgtccc agtgcagaca cacattggcg660ttgagctata cagaagcgac agtcgctctc acacttatcc attttgggtc tgtgacacaa720gcactgtaaa taaatggcag tgcgagctac tggtgtagct gggtgaaaca atcatcggaa780ctgcgccctt agagcgtact gcataatgcc acatagttgt ctttcttatt attgacctgt840aactattgta aatcactgtc ttggtcggtg cctgtgcaac tgccttcact tatcccttct900tttttgtcaa tttctttctt tctcggtgcc tgtaaagtga tgctccttgt aaaatgacat960atgttgcttc aataggtatt ccaaagttaa aaattccaac atttgcgtat ttcgtgatac1020aaaggatcca tccaacgcca ataaaataga caattttttg atctaaaaca acagtagtta1080tgtgaatatc ggaacgttcc cactttttag tatatgttcc tatagtgatg ttttggatac1140ttggaataaa aagacggtta tactcttcca ggaaataata ggctccttca aattattcgt1200tacataactt ttatgaaggg gtagaatata tgatatgcct gggcaaagtt actaaaaatg1260cgaagtcatt aagagtgtat cagatgggcc actttactct atccttatta tgactcagca1320ttttgccatc aagcttgcgg aaggatatga aatgtggcat ataaaagcac tctatgttat1380ttgtggaata ggtttctaca ttgaatagcc taataaccat cagcaagata aaattatcca1440gtattatttg tttgttaaca ggtgcaagct ctatccttgc tttggagccg gctttgcaag1500aggaaataga gggtgcagag ccaaagcctt atg atg gtg gca atc cca gtt agg 1554
Met Met Val Ala Ile Pro Val Arg1 5ggc aag aac gtc agc acg act ttg gtg gat cgg ggc aag aac gca gac 1602Gly Lys Asn Val Ser Thr Thr Leu Val Asp Arg Gly Lys Asn Ala Asp10 15 20gca gtg gcc gcg acg agt acg gct ggg gtc agc gta ggc gcg act ttg 1650Ala Val Ala Ala Thr Ser Thr Ala Gly Val Ser Val Gly Ala Thr Leu25 30 35 40gtg gat cgg ggc aag aac gca gac gca gtg gcc gcg acg agt acg gct 1698Val Asp Arg Gly Lys Asn Ala Asp Ala Val Ala Ala Thr Ser Thr Ala45 50 55cgg gtc agc gta ggc gcg act ttg gtg gca atg ggg gtc aga ctc gta 1746Arg Val Ser Val Gly Ala Thr Leu Val Ala Met Gly Val Arg Leu Val60 65 70ggc gcg tgc cta att atg agc aga gtc gcg agc agg ccc gga aaa ttg 1794Gly Ala Cys Leu Ile Met Ser Arg Val Ala Ser Arg Pro Gly Lys Leu75 80 85aaa cta ggc gca aca atg atg agg aat ctg aat tca act atc tca ctc 1842Lys Leu Gly Ala Thr Met Met Arg Asn Leu Asn Ser Thr Ile Ser Leu90 95 100aga tgagcaaggc ttgatctcgg cgctgaggat ctgctgtatg agcgcagcta 1895Arg105tggtggcgtt gacagggact tgcaatatcg ggcttatggt gatgattatg atgaagatga1955cttcgattaa agccccagac gcagttttgg ccataatgat gaaaattcac tgatcagact2015ataaagttgc tttggaaaat aagtcatatt ggcgatggac tcgtggcaag acacttagat2075acttgaattt cttcagtatt aaatgacatg acaactatcc acagtgaatt ctgaaaaata2135aacataaaaa caataatctt atgacccatt ttcatgtaaa ctgaatatag acgatagcaa2195tacattttct ctatattttg tactctggaa gcttctgcga gtgactacca tttgatggcc2255acgtttacct ccttcgtcag caggtatcca ggtacttaaa ttaatcactt cacagcacta2315aatgtggctt ttattcggtt ttattccaag aatacggatc tctgagacac ttgagcccct2375tagtttagtt acaacagtag cttccgaaag ctacgaataa tagttataga ttttctgctc2435tcacgtgatt cgcttacata aataacccga taaaaccatg agaaatatgt ccatgtagct2495gtgtgacgta tatatgggat aaggctgggt aggcctctag ccatctattt gcccgctgtc2555ttttggtaca atagcccaac gaaaatccga gcgtacctct acgtgtg 2602<210> 78<211> 105<212> PRT<213> 棉桃阿舒氏囊霉<220>
<221> misc_feature<223> Oligo 18
<400> 78Met Met Val Ala Ile Pro Val Arg Gly Lys Asn Val Ser Thr Thr Leu1 5 10 15Val Asp Arg Gly Lys Asn Ala Asp Ala Val Ala Ala Thr Ser Thr Ala20 25 30Gly Val Ser Val Gly Ala Thr Leu Val Asp Arg Gly Lys Asn Ala Asp35 40 45Ala Val Ala Ala Thr Ser Thr Ala Arg Val Ser Val Gly Ala Thr Leu50 55 60Val Ala Met Gly Val Arg Leu Val Gly Ala Cys Leu Ile Met Ser Arg65 70 75 80Val Ala Ser Arg Pro Gly Lys Leu Lys Leu Gly Ala Thr Met Met Arg85 90 95Asn Leu Asn Ser Thr Ile Ser Leu Arg100 10權(quán)利要求
1.可自棉桃阿舒氏囊霉分離的多核苷酸,其編碼與棉桃阿舒氏囊霉中的轉(zhuǎn)錄、RNA加工和/或翻譯相關(guān)的蛋白。
2.權(quán)利要求1的多核苷酸,其與棉桃阿舒氏囊霉的轉(zhuǎn)錄、RNA加工和/或翻譯相關(guān)并具有表1所示的結(jié)構(gòu)和/或功能特性。
3.包含SEQ ID NO1,6,12,17,21,26,31,38,42,48,53,58,63,67,72或74所示的核酸序列并優(yōu)選自棉桃阿舒氏囊霉中分離的權(quán)利要求1或2的多核苷酸;其互補多核苷酸;以及通過遺傳密碼簡并性衍生自這些多核苷酸的序列。
4.權(quán)利要求3的多核苷酸,其包含SEQ ID NO4,10,14,19,24,29,36,40,46,51,56,60,65,70,75或77顯示的核酸序列或其片段。
5.寡核苷酸,其可以與任一前述權(quán)利要求的多核苷酸雜交,且尤其是在嚴(yán)格的條件下雜交。
6.多核苷酸,其可以與權(quán)利要求5的寡核苷酸雜交,且尤其是在嚴(yán)格的條件下雜交,并編碼阿舒氏囊霉屬微生物的基因產(chǎn)物或該基因產(chǎn)物的功能等價物。
7.多肽及其功能等價物,特別是具有權(quán)利要求2中所述的活性的功能等價物,其中,所述多肽由包含權(quán)利要求1至4中任意一項的核酸序列或其片段的多核苷酸編碼,或由權(quán)利要求6的多核苷酸編碼;或具有包含SEQ ID NO2,3,5,7,8,9,11,13,15,16,18,20,22,23,25,27,28,30,32,33,34,35,37,39,41,43,44,45,47,49,50,52,54,55,57,59,61,62,64,66,68,69,71,73,76,或SEQ ID NO78中所示的至少10個連續(xù)氨基酸殘基的氨基酸序列。
8.包含權(quán)利要求1至6中任意一項的核酸序列的表達(dá)盒,其中,所述核酸序列與至少一個調(diào)節(jié)核酸序列可操作地連接。
9.包含至少一個權(quán)利要求8的表達(dá)盒的重組載體。
10.由至少一個權(quán)利要求9的載體轉(zhuǎn)化的原核或真核宿主。
11.原核或真核宿主,在該宿主中,至少一個編碼權(quán)利要求7的多肽的基因的功能性表達(dá)受到調(diào)節(jié);或權(quán)利要求7的多肽的生物活性被降低或增加。
12.權(quán)利要求10或11的宿主,其來自阿舒氏囊霉屬。
13.權(quán)利要求8的表達(dá)盒、權(quán)利要求9的載體或權(quán)利要求10至12之任一項的宿主在維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)中的用途。
14.權(quán)利要求8的表達(dá)盒、權(quán)利要求9的載體或權(quán)利要求10至12之任一項的宿主在權(quán)利要求7的多肽的重組生產(chǎn)中的用途。
15.檢測可以用于調(diào)節(jié)維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)的效應(yīng)物靶點的方法,其中,用效應(yīng)物處理能夠通過微生物學(xué)方法生產(chǎn)維生素B2和/或其前體和/或其衍生物的微生物,所述效應(yīng)物可以與選自權(quán)利要求7的多肽或其核酸編碼序列的靶點相互作用,尤其是結(jié)合;驗證效應(yīng)物對微生物學(xué)方法生產(chǎn)的維生素B2和/或其前體和/或其衍生物的產(chǎn)量的影響;并且適當(dāng)時分離該靶點。
16.調(diào)節(jié)維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)的方法,其中,用效應(yīng)物處理能夠以微生物學(xué)方法生產(chǎn)維生素B2和/或其前體和/或其衍生物的微生物,所述效應(yīng)物可以與選自權(quán)利要求7的多肽或其核酸編碼序列的靶點相互作用。
17.針對選自權(quán)利要求7的多肽或其核酸編碼序列的靶點的效應(yīng)物,其中所述效應(yīng)物選自a)抗體或其抗原結(jié)合片段;b)可以與權(quán)利要求7的多肽相互作用的不同于a)的多肽配體;c)可以調(diào)節(jié)權(quán)利要求7的多肽的生物活性的低分子量效應(yīng)物;d)反義核酸序列。
18.微生物生產(chǎn)維生素B2和/或其前體和/或其衍生物的方法,其中在利于產(chǎn)生維生素B2和/或其前體和/或其衍生物的條件下培養(yǎng)權(quán)利要求10至12之任一項的宿主,自培養(yǎng)混合物中分離所需的產(chǎn)物。
19.權(quán)利要求18的方法,其中用權(quán)利要求17的效應(yīng)物在培養(yǎng)前和/或培養(yǎng)過程中處理宿主。
20.權(quán)利要求18或19的方法,其中宿主選自阿舒氏囊霉屬微生物。
21.權(quán)利要求18至20之任一項的方法,其中微生物為權(quán)利要求10至12之任一項的宿主。
22.權(quán)利要求1至4和6之任一項的多核苷酸或權(quán)利要求7的多肽作為靶點在調(diào)節(jié)阿舒氏囊霉屬微生物的維生素B2和/或其前體和/或其衍生物的生產(chǎn)中的用途。
23.權(quán)利要求1至4和6之任一項的多核苷酸或權(quán)利要求7的多肽在維生素B2和/或其前體和/或其衍生物的微生物生產(chǎn)中的用途,用于作為靶點在培養(yǎng)過程中調(diào)節(jié)阿舒氏囊霉屬微生物的轉(zhuǎn)錄、RNA加工和/或翻譯。
24.權(quán)利要求13的宿主,其具有增強的對環(huán)境和代謝條件的適應(yīng)性,尤其是具有為提高維生素B2的生產(chǎn)而改變的轉(zhuǎn)錄、RNA加工和/或翻譯。
全文摘要
本發(fā)明涉及來自棉桃阿舒氏囊霉的新穎多核苷酸;與之雜交的寡核苷酸;包含這些多核苷酸的表達(dá)盒和載體;用其轉(zhuǎn)化的微生物;由這些多核苷酸編碼的多肽;及該新穎多肽和多核苷酸作為靶點在調(diào)節(jié)轉(zhuǎn)錄和/或翻譯控制和/或RNA加工控制,且尤其是改善阿舒氏囊霉屬微生物的維生素B
文檔編號C12N1/19GK1558913SQ02818744
公開日2004年12月29日 申請日期2002年8月29日 優(yōu)先權(quán)日2001年8月29日
發(fā)明者M·考羅什, H·阿爾特赫費, B·克勒格爾, J·L·雷韋爾塔多瓦爾, M 考羅什, 嶄穸 , 睪輾, 雷韋爾塔多瓦爾 申請人:巴斯福股份公司