專利名稱:轉(zhuǎn)化破囊壺菌目微生物的產(chǎn)物和方法
技術(shù)領(lǐng)域:
本發(fā)明主要涉及編碼破囊壺菌目乙酰乳酸合酶的分離的核酸分子,包括賦予破囊壺菌目微生物對磺酰脲化合物,咪唑啉酮類抑制劑和/或嘧啶基羥苯甲酸鹽降低的敏感性的乙酰乳酸合酶;涉及包含破囊壺菌目微生物轉(zhuǎn)化的選擇性標記物的重組核酸分子,并涉及用本發(fā)明重組核酸分子轉(zhuǎn)化這類微生物的方法。本發(fā)明也涉及破囊壺菌表達系統(tǒng)可用的基因啟動子。本發(fā)明的重組核酸分子可用于外源核酸在破囊壺菌目微生物中的表達及用于在破囊壺菌目微生物中去除,突變或滅活基因。
背景技術(shù):
開發(fā)導致對破囊壺菌綱的分類學進行了修正。分類學家將破囊壺菌放在藻類或藻類狀原生生物中。然而,由于分類不確定,對于本發(fā)明最好認為本發(fā)明所述該菌株是破囊壺菌(目破囊壺菌目;科破囊壺菌科;屬破囊壺菌屬,Schizochytrium,Labyrinthuloides,或Japonochytrium)。分類學改變在下文中概括。
本文公開的某些單細胞微生物菌株是破囊壺菌目的成員。破囊壺菌是分類史進化的海洋真核生物。Moss(1986),Bahnweb和Jackle(1986),以及Chamberlain和Moss(1988)對破囊壺菌的分類地位問題進行了綜述。
為了方便,分類學家首先將破囊壺菌綱與藻菌綱(藻類狀真菌)的其它無色游動孢子真核生物放在一起。然而,藻菌綱這一名稱最后從分類學地位中去掉,破囊壺菌被保留在卵菌綱(雙鞭毛游動孢子真菌)中。最初假定卵菌綱與異鞭毛藻類相關(guān),Barr(Barr,1983)總結(jié)的廣泛超微結(jié)構(gòu)和生化研究最終支持了這一假定。事實上卵菌綱被Leedale(1974)和其他藻類學家作為異鞭毛藻類的一部分接受。但由于其異養(yǎng)特性帶來的方便,卵菌綱和破囊壺菌綱被真菌學家(研究真菌的科學家)而不是藻類學家(研究藻類的科學家)大量研究。
從另一分類學角度來看,進化生物學家對于真核生物如何進化的問題形成了兩個系統(tǒng)學派。一個學說認為膜結(jié)合細胞器通過一系列的內(nèi)共生的外生起源(Margulis,1970);例如線粒體起源于細菌的細胞內(nèi)共生生物,葉綠體起源于藍藻類,鞭毛起源于螺旋體。另一學說提出膜結(jié)合的細胞器從原核祖先的無膜結(jié)合的系統(tǒng)通過自生加工逐漸進化(Cavalier-Smith,1975)。然而兩組進化生物學家都將卵菌綱和破囊壺菌綱從真菌中取出并與產(chǎn)色植物藻類一起放在產(chǎn)色植物界中(Cavalier-Smith,1981)(該界最近擴展到包括其它原生生物且該界的成員現(xiàn)在稱為Stramenopiles)或與所有藻類一起放在Protoctista界中(Margulis和Sagen,1985)。
隨著電子顯微鏡的發(fā)展,對破囊壺菌綱的兩個屬,即,破囊壺菌屬和Schizochytrium的游動孢子超微結(jié)構(gòu)的研究(Perkins,1976;Kazama,1980;Barr,1981)提供了破囊壺菌綱與卵菌綱僅具有較遠的親緣關(guān)系的良好證據(jù)。另外,對5S核糖體RNA序列的對應分析(多變量統(tǒng)計)得到的遺傳數(shù)據(jù)表明破囊壺菌明顯是一類獨特的真核生物,完全區(qū)別于真菌,且與紅藻和褐藻,以及與卵菌綱的成員有最近的親緣關(guān)系(Mannella,等,1987)。大多數(shù)分類學家同意將破囊壺菌從卵菌綱中取出(Bartnicki-Garcia,1988)。
總之,采用Cavalier-Smith的分類系統(tǒng)(1981,1983),將破囊壺菌與產(chǎn)色植物藻類一起分類進產(chǎn)色植物界(Stramenopiles)中。該分類將它們放在與真菌完全不同的一個界中,而真菌都放在Eufungi界中。因此破囊壺菌的分類地位總結(jié)如下界產(chǎn)色植物界(Stramenopiles)門異鞭毛門目破囊壺菌目科破囊壺菌科屬破囊壺菌屬,Schizochytrium,Labyrinthuloides或Japonochytrium。
一些早期的分類學家將破囊壺菌屬的一些原始的成員(具有變形蟲狀生活階段的成員)分入一個稱為Ulkenia的獨立屬中。然而,現(xiàn)在知道大多數(shù)(如果不是全部的話)破囊壺菌(包括破囊壺菌屬和Schizochytrium)表現(xiàn)出變形蟲狀階段且有人認為Ulkenia本身不是一個正確的屬。本文使用的破囊壺菌屬將包括Ulkenia。
盡管門和界的高級分類中的分類學地位不確定,但是破囊壺菌保持特有的和特征性的分類,其成員可分類在破囊壺菌目內(nèi)。
Schizochytrium屬和其它破囊壺菌目微生物,由于能產(chǎn)生大量脂類化合物,包括高度不飽和脂肪酸(HUFAs)和多種類胡蘿卜素(例如,蝦青素),因此具有相當?shù)默F(xiàn)有和潛在商業(yè)價值。ω-3高度不飽和脂肪酸極有經(jīng)濟價值,因為它們近來已被認定為重要的飲食化合物,可避免動脈硬化和冠心病,可減輕感染病癥并延遲腫瘤細胞生長。這些有益作用是ω-3 HUFA導致對ω-6脂肪酸所生成的化合物,以及從ω-3 HUFA本身直接生成的有益化合物進行競爭性抑制的結(jié)果(Simopoulos等,1986)。ω-6脂肪酸是發(fā)現(xiàn)于植物和動物中的主要HUFA。因而,破囊壺菌目微生物作為商業(yè)生產(chǎn)生物的進一步發(fā)展,將顯著受益于經(jīng)由重組DNA技術(shù)對生物進行具體遺傳變化的能力,包括增強極有價值的HUFA和類胡蘿卜素的生產(chǎn)。另外,更好地理解這種不甚了解的生物群體的生化和分子生物學的能力會提供有價值的信息來用于指導對未來菌株的開發(fā)。然而,本發(fā)明之前沒有適合轉(zhuǎn)化破囊壺菌,包括Schizochytrium屬和破囊壺菌屬成員的方法和重組構(gòu)建體。重要的是,具體用于轉(zhuǎn)化破囊壺菌目微生物和鑒定破囊壺菌目-特異性啟動子序列的選擇性標記物的開發(fā)在本發(fā)明之前是沒有的。
以前的研究者已描述了用于多種微生物,包括在并非破囊壺菌目成員的微藻中進行轉(zhuǎn)化的方法和試劑。授予Allnutt等的美國專利6,027,900公開了用于真核生物藻類,特別是Phaeodactylum tricornutum的遺傳工程的遺傳融合體,它用光合藻類集光基因的啟動子和來自印度斯坦鏈異壁菌的Sh ble基因作為選擇性標記物。該細胞在高鹽濃度(例如,10-35g/L)下生長,用ZeocinTM選擇轉(zhuǎn)化子。適于用此種方法轉(zhuǎn)化的微藻細胞為光合微藻,它可在高鹽濃度下生長。授予Dunahay等的美國專利5,661,017公開了轉(zhuǎn)化含葉綠素C的藻類(例如硅藻)的方法,它使用含選擇性標記物的重組構(gòu)建體,該選擇性標記物與適于嘎標記物在含葉綠素C的藻類中表達的調(diào)控序列可操作性連接。該文中稱,該選擇性標記物可以是任何適合的標記物,包括從細菌和真菌來源分離的標記物,并優(yōu)選為新霉素磷酸轉(zhuǎn)移酶。該調(diào)控序列可包括任何來自含葉綠素C的藻類的調(diào)控序列,并優(yōu)選來自Cyclotella cryptica(例如,C.cryptica乙酰-CoA羧化酶調(diào)控序列)。
然而,此方法不能通過簡單轉(zhuǎn)換而用于破囊壺菌目微生物的轉(zhuǎn)化,因為本發(fā)明之前,微生物如破囊壺菌目(例如,微藻)的轉(zhuǎn)化還遠遠不到常規(guī)水平。成熟的細菌和酵母標記物及轉(zhuǎn)化系統(tǒng)不一定能輕易適用于其它微生物。事實上,美國專利5,661,017指出“在發(fā)展真核生物微藻的轉(zhuǎn)化系統(tǒng)上成功很少”(col.1,lines 49-51),一部分原因是很難向此種微生物引入外源DNA,還有一部分原因是缺乏適用于此類轉(zhuǎn)化的標記物和載體。美國專利5,661,017所述系統(tǒng)特別用于含葉綠素C的藻類,因為那些發(fā)明者認為它們適宜轉(zhuǎn)化,特別在與其它藻類比較后。類似地,美國專利6,027,900教授了特異用于光合微藻的轉(zhuǎn)化方法,它認為大多藻類對任何遺傳操作都是難操縱的(col.1,lines39-47)。適合細菌,酵母,昆蟲和動物細胞的系統(tǒng)不容易適合微藻。因而本發(fā)明之前,本領(lǐng)域存在對微藻特異的有效轉(zhuǎn)化系統(tǒng)和方法的需要。
另外,盡管破囊壺菌目現(xiàn)與產(chǎn)色植物藻類被分組到Stramenopiles,仍有本領(lǐng)域人員持意見認為這些微生物與大多微藻截然不同,而且本領(lǐng)域技術(shù)人員認為破囊壺菌目成員被分類為微藻根本不適合。被認為是微藻的微生物在進化中至少有四次不同的變革,導致″微藻″型微生物被置于不同的界(例如紅藻,綠藻和金藻(產(chǎn)色植物界)都在不同的界)。結(jié)果,在其它微藻中有用的轉(zhuǎn)化系統(tǒng)不指望對破囊壺菌有用。因而,盡管破囊壺菌目微生物具有商業(yè)價值,通過遺傳工程利用此種微生物的全部潛力的能力在迄今還未被意識到。本發(fā)明之前,本發(fā)明人未見到任何對破囊壺菌目微生物轉(zhuǎn)化有用的啟動子,選擇性標記物或載體,任何關(guān)于適合破囊壺菌所用的選擇系統(tǒng)的知識。
總而言之,本領(lǐng)域有開發(fā)轉(zhuǎn)化破囊壺菌目微生物的方法的需要,并從而提供了創(chuàng)造具有增強的商業(yè)價值的菌株的工具。另外,本領(lǐng)域有開發(fā)通過破囊壺菌目微生物的同源或非同源重組而突變或滅活特定基因的方法的需要,它提供一條改變細胞代謝并鑒定特定基因在破囊壺菌的功能的道路。
發(fā)明內(nèi)容
本發(fā)明一實施方案涉及分離的核酸分子,它包含選自如下的核酸序列(a)編碼蛋白的核酸序列,該蛋白具有選自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列,其中所述蛋白為乙酰乳酸合酶;(b)編碼蛋白的核酸序列,該蛋白具有與氨基酸序列(a)至少約75%相同的氨基酸序列,其中所述蛋白為乙酰乳酸合酶;或(c)與核酸序列(a)或(b)完全互補的核酸序列。一方面,此核酸序列編碼具有與氨基酸序列(a)至少約85%相同的氨基酸序列的蛋白,并且其中所述蛋白為乙酰乳酸合酶。另一方面,此核酸序列編碼具有與氨基酸序列(a)至少約95%相同的氨基酸序列的蛋白,并且其中所述蛋白為乙酰乳酸合酶。另一方面,此核酸序列編碼具有與SEQ ID NO15不同的氨基酸序列的蛋白,該不同是由于在選自116G,117A,192P,200A,251K,358M,383D,592V,595W和599F的氨基酸位置的氨基酸缺失,插入或取代。一方面,此核酸序列編碼具有選自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列的蛋白,并且其中所述蛋白為乙酰乳酸合酶。另一方面,所述核酸序列選自SEQ ID NO14的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。
優(yōu)選,上面鑒定的核酸序列所編碼的蛋白的表達賦予用此核酸分子轉(zhuǎn)化的破囊壺菌目微生物對選自磺酰脲化合物,咪唑啉酮類抑制劑,和嘧啶基羥苯甲酸鹽的化合物降低的敏感性。在此實施方案的一方面中,該核酸序列編碼具有氨基酸序列選自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的蛋白。在此實施方案的另一方面,所述核酸序列選自SEQ ID NO14的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。
本發(fā)明一實施方案中,上述核酸序列編碼Schizochytrium乙酰乳酸合酶。一方面,Schizochytrium乙酰乳酸合酶的表達賦予用此核酸分子轉(zhuǎn)化的破囊壺菌目微生物對選自磺酰脲化合物,咪唑啉酮類抑制劑,和嘧啶基羥苯甲酸鹽的化合物降低的敏感性。
本發(fā)明另一實施方案涉及包含可操作性連接到轉(zhuǎn)錄控制序列的上述任一種分離的核酸分子的重組核酸分子,該重組核酸分子。本發(fā)明另一實施方案涉及用此重組核酸分子轉(zhuǎn)化的破囊壺菌目的重組微生物。
本發(fā)明另一實施方案涉及用于破囊壺菌目微生物轉(zhuǎn)化的重組載體。所述載體包括編碼乙酰乳酸合酶的核酸序列,所述乙酰乳酸合酶可賦予用此核酸分子轉(zhuǎn)化的破囊壺菌目微生物對選自磺酰脲化合物,咪唑啉酮類抑制劑,和嘧啶基羥苯甲酸鹽的化合物降低的敏感性。所述乙酰乳酸合酶具有選自如下的氨基酸序列(a)選自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列;和(b)與氨基酸序列(a)至少約75%相同的氨基酸序列。編碼乙酰乳酸合酶的核酸序列是可操作性連接到轉(zhuǎn)錄控制序列。一方面,所述重組載體為表達載體。另一方面,所述重組載體為靶向載體。其它方面,載體內(nèi)的核酸序列編碼具有與氨基酸序列(a)至少約85%相同的,并且另一方面,至少約95%相同的氨基酸序列的乙酰乳酸合酶。一方面,此核酸序列編碼具有與SEQ ID NO15不同的氨基酸序列的蛋白,該不同是由于在選自116G,117A,192P,200A,251K,358M,383D,592V,595W和599F的氨基酸位置的氨基酸缺失,插入或取代。在優(yōu)選方面,所述乙酰乳酸合酶具有選自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列。另一方面,所述核酸序列選自SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。在重組載體內(nèi)的轉(zhuǎn)錄控制序列可包括但不限于破囊壺菌目α-微管蛋白啟動子,破囊壺菌目乙酰乳酸合酶啟動子,來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子,或破囊壺菌目脂肪酸脫氫酶啟動子。一方面,所述載體包含選自SEQ ID NO18,SEQ ID NO21和SEQ ID NO23的核酸序列。
本發(fā)明另一實施方案涉及破囊壺菌目微生物的細胞的轉(zhuǎn)化方法。所述方法包括第一種步(a)向破囊壺菌目微生物的細胞引入含有編碼乙酰乳酸合酶的核酸序列的重組核酸分子,所述乙酰乳酸合酶賦予細胞對選自磺酰脲化合物,咪唑啉酮類抑制劑,和嘧啶基羥苯甲酸鹽的化合物降低的敏感性,其中此乙酰乳酸合酶具有選自如下的氨基酸序列(i)選自SEQ ID NO19,SEQID NO22和SEQ ID NO24的氨基酸序列;和(ii)與氨基酸序列(i)至少約75%相同的氨基酸序列。所述方法包括第二種步(b)選擇被重組核酸分子成功轉(zhuǎn)化了的細胞,方法是在含至少一種抑制未轉(zhuǎn)化細胞的化合物的培養(yǎng)基中培養(yǎng)(a)的細胞,該化合物選自磺酰脲化合物,咪唑啉酮類抑制劑,和嘧啶基羥苯甲酸鹽。一方面,此核酸序列編碼具有與氨基酸序列(i)至少約85%相同的,更優(yōu)選至少約95%相同的氨基酸序列的乙酰乳酸合酶。一方面此核酸序列編碼與SEQ ID NO15不同的氨基酸序列的蛋白,該不同是由于在選自116G,117A,192P,200A,251K,358M,383D,592V,595W和599F的氨基酸位置的氨基酸缺失,插入或取代。另一方面,所述乙酰乳酸合酶具有選自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列。優(yōu)選,所述核酸序列選自SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。另一方面,所述核酸序列與轉(zhuǎn)錄控制序列可操作地連接,所述轉(zhuǎn)錄控制序列選自破囊壺菌目α-微管蛋白啟動子,破囊壺菌目乙酰乳酸合酶啟動子,來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子,和破囊壺菌目脂肪酸脫氫酶啟動子。
一方面,所述重組核酸分子還包含編碼細胞產(chǎn)生的蛋白的核酸序列,其中此核酸序列編碼可操作性連接到轉(zhuǎn)錄控制序列的蛋白。本實施方案一方面,所述蛋白與選自二十二碳六烯酸(DHA),二十二碳五烯酸(DPA),二十碳五烯酸(EPA)和二十碳四烯酸(ARA)的脂肪酸的合成相關(guān)。本實施方案另一方面,所述蛋白選自脂肪酸合酶,脂肪酸脫氫酶,脂肪酸延伸酶(elongase),與聚酮化合物合酶復合體相關(guān)的蛋白和與將脂肪酸摻入磷脂或三甘油酯分子相關(guān)的蛋白。一方面,所述蛋白為被核酸序列SEQ ID NO29編碼的ω-3脂肪酸脫氫酶。另一方面,該蛋白為多烯脂肪酸異構(gòu)酶。另一方面,此類蛋白選自HMG-CoA合酶,HMG-CoA還原酶,角鯊烯合酶,八氫番茄紅素合酶,八氫番茄紅素脫氫酶,類胡蘿卜素環(huán)化酶,類胡蘿卜素羥化酶,類胡蘿卜素酮酶,維生素E和硫辛酸。
本方法另一方面,步驟(a)中的所述重組核酸分子還包含與微生物內(nèi)靶核酸序列雜交的核酸序列,從而包含靶核酸序列的基因通過與第二種核酸序列同源重組而被突變或滅活。這方面,該靶核酸序列可編碼選自下組的蛋白脂肪酶,脂肪酸氧化酶,參與糖類合成的蛋白,參與類異戊二烯途徑產(chǎn)物合成的蛋白,參與細胞壁組分合成的蛋白,參與飽和脂肪酸合成途徑的蛋白,參與多聚不飽和脂肪酸合成途徑的蛋白,與聚酮化合物合酶復合體相關(guān)的蛋白和與將脂肪酸摻入磷脂或三甘油酯分子相關(guān)的蛋白。
本方法還可包括向細胞引入至少一種附加的重組核酸分子的步驟,此重組核酸分子包含編碼要表達的蛋白的核酸序列,此核酸序列與轉(zhuǎn)錄控制序列可操作性連接。在另一方面,此方法還可包括向細胞引入至少一種附加的重組核酸分子的步驟,此重組核酸分子包含與微生物內(nèi)的靶核酸序列雜交的第二種核酸序列,導致包含靶核酸序列的基因通過與第二種核酸序列同源重組而被突變或滅活。另一方面,此方法還包括向細胞引入重組核酸分子的步驟,此重組核酸分子包含編碼博來霉素-結(jié)合蛋白的核酸序列。這方面,所述包含編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子還包含編碼細胞表達的第二種蛋白的核酸序列,其中所述編碼第二種蛋白的核酸序列為可操作性連接到轉(zhuǎn)錄控制序列。所述轉(zhuǎn)錄控制序列可包括但不限于破囊壺菌目α-微管蛋白啟動子,破囊壺菌目乙酰乳酸合酶啟動子,來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子,和破囊壺菌目脂肪酸脫氫酶啟動子。本實施方案的另外的方面,所述包含編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子還包含與微生物內(nèi)靶核酸序列雜交的第二種核酸序列,從而包含靶核酸序列的基因通過與第二種核酸序列同源重組而被突變或滅活。一實施方案中,所述重組核酸分子包含核酸序列SEQ ID NO9。
本發(fā)明方法中所述微生物可來自下列屬,包括但不限于破囊壺菌屬,Labyrinthuloides屬,Japonochytrium屬,和Schizochytriun屬。一方面,此微生物來自下列種,包括但不限于Schizochytrium sp.,Schizochytriumaggregatum,Schizochytrium limacinum,Thraustochytrium sp.,Thraustochytrium striatum,Thraustochytrium aureum,Thraustochytriumroseum,和Japonochytrium sp.
本方法一實施方案中,所述引入步驟是用選自粒子轟擊,電穿孔,顯微射,脂轉(zhuǎn)染,吸附,感染和原生質(zhì)體融合的方法完成的。
本發(fā)明另一實施方案涉及用重組核酸分子轉(zhuǎn)化的破囊壺菌目的重組微生物,該重組核酸分子包含了編碼乙酰乳酸合酶的核酸序列,乙酰乳酸合酶賦予此微生物對選自磺酰脲化合物,咪唑啉酮類抑制劑和/或嘧啶基羥苯甲酸鹽的化合物降低的敏感性。所述乙酰乳酸合酶具有選自下述的氨基酸序列(a)選自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列;和(b)與氨基酸序列(a)至少約75%相同的氨基酸序列。一方面,該編碼乙酰乳酸合酶的核酸序列具有與氨基酸序列(a)至少約85%相同的氨基酸序列。另一方面,該編碼乙酰乳酸合酶的核酸序列具有與氨基酸序列(a)至少約95%相同的氨基酸序列。另一方面,所述乙酰乳酸合酶具有選自SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列。另一方面,該核酸序列選自下述SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。另一方面,所述重組核酸分子包含選自SEQ ID NO18,SEQ ID NO21和SEQ ID NO23的核酸序列。優(yōu)選,此編碼乙酰乳酸合酶的核酸序列與在破囊壺菌目微生物中有功能的啟動子可操作性連接。一方面,此編碼乙酰乳酸合酶的核酸序列可操作性連接到選自破囊壺菌目α-微管蛋白啟動子,破囊壺菌目乙酰乳酸合酶啟動子,來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子,和破囊壺菌目脂肪酸脫氫酶啟動子的轉(zhuǎn)錄控制序列。一實施方案中,所述重組核酸分子還包含編碼該微生物產(chǎn)生的第一種蛋白的核酸序列,其中此編碼第一種蛋白的核酸序列可操作性連接到轉(zhuǎn)錄控制序列。另一實施方案中,所述重組細胞還用含有編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子轉(zhuǎn)化。優(yōu)選,所述重組核酸分子包含核酸序列SEQ ID NO9。一實施方案中,所述包含編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子還包含編碼所述細胞產(chǎn)生的第二種蛋白的核酸序列,其中編碼第二種蛋白的核酸序列可操作性連接到轉(zhuǎn)錄控制序列。一實施方案中,此微生物也包括至少一種附加的重組核酸分子,它包含編碼所述細胞產(chǎn)生的蛋白的核酸序列。
本發(fā)明另一實施方案涉及分離的核酸分子,它包含選自如下的核酸序列(a)SEQ ID NO9的核苷酸441-894;(b)與SEQ ID NO9的核苷酸441-894的全長至少約95%相同的核酸序列,其中所述核酸序列具有至少基本的α-微管蛋白啟動子轉(zhuǎn)錄活性,和(c)分離的多核苷酸,它包含與多核苷酸(a)或(b)完全互補的核酸序列。優(yōu)選,所述分離的核酸分子包含SEQ ID NO4的核酸序列或包含SEQ ID NO9的核苷酸441-894。
本發(fā)明另一實施方案涉及用于轉(zhuǎn)化破囊壺菌目微生物的重組載體,它包含編碼博來霉素-結(jié)合蛋白的核酸序列,該核酸序列與啟動子可操作性連接,所述啟動子選自破囊壺菌目α-微管蛋白啟動子,破囊壺菌目乙酰乳酸合酶啟動子,來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子,和破囊壺菌目脂肪酸脫氫酶啟動子。一方面,所述破囊壺菌目乙酰乳酸合酶啟動子包含SEQ ID NO14的核苷酸1-1259。一方面,所述α-微管蛋白啟動子包含選自SEQ ID NO9的核苷酸441-894,以及與SEQ ID NO9的核苷酸441-894的全長至少約95%相同的核酸序列的核酸序列,其中所述核酸序列具有至少基本的α-微管蛋白啟動子轉(zhuǎn)錄活性。另一方面,來自破囊壺菌目PKS系統(tǒng)的啟動子包含SEQ ID NO34或包含SEQ ID NO34所含有的核酸序列,其中所述啟動子具有至少基本的PKS啟動子轉(zhuǎn)錄活性。另一方面,所述重組載體包含選自SEQ ID NO8和SEQ ID NO9的核酸序列。
附圖簡述
圖1闡述了重組質(zhì)粒pTUBZEO-11的構(gòu)建。
圖2闡述了重組質(zhì)粒pTUBZEO11-2的構(gòu)建。
圖3A闡述了重組質(zhì)粒pMON50200。
圖3B闡述了重組質(zhì)粒pMON50201。
圖3C闡述了重組質(zhì)粒pMON50202。
圖3D闡述了重組質(zhì)粒pMON50203。
發(fā)明祥述本發(fā)明包含遺傳轉(zhuǎn)化破囊壺菌目微生物的方法和相關(guān)的物質(zhì)。所有本文公開用作本發(fā)明重組構(gòu)建體的重組子的單細胞微生物菌株,也可統(tǒng)稱為破囊壺菌,是破囊壺菌目的成員。根據(jù)本發(fā)明術(shù)語″破囊壺菌″,″破囊壺菌目微生物″和″破囊壺菌目微生物″可互換使用。本發(fā)明人未見到任何以前的報告描述用于Schizochytrium屬或其它破囊壺菌目微生物的轉(zhuǎn)化系統(tǒng)。本文所述的轉(zhuǎn)化系統(tǒng)可用于向破囊壺菌目微生物引入外源基因,因而提供了創(chuàng)造具有增強的商業(yè)價值的菌株的工具。另外,本發(fā)明通過同源或非同源重組使特定的基因突變或滅活,提供了一種改變細胞代謝并鑒定特定基因在破囊壺菌目微生物中的功能的新方法。
更具體地,本發(fā)明人用兩類轉(zhuǎn)化載體證實了破囊壺菌目Schizochytrium屬微生物(目破囊壺菌目;科破囊壺菌科;屬Schizochytrium屬)的遺傳轉(zhuǎn)化。這些載體可用標準方法引入細胞,隨后基于它們在選擇性化合物存在時生長的能力來鑒定并分離重組細胞。本發(fā)明人通過粒子轟擊引入這些載體,從而證實了它們的有效性,但其它引入載體的工具也可用(例如,電穿孔)并在本領(lǐng)域已知,而且應為本發(fā)明所包括。
針對一種轉(zhuǎn)化載體,例如,本文命名為pTUBZEO11-2的重組載體,制備嵌合基因,其中來自印度斯坦鏈異壁菌的ble基因(其編碼″博來霉素-結(jié)合蛋白″)被置于來自Schizochytrium微管蛋白基因啟動子的下游。SV40終止子被置于此構(gòu)建體中ble基因的下游。此載體能保證ble基因在Schizochytrium中表達,從而賦予對ZeocinTM和相關(guān)化合物的抗性,所述化合物當以適當水平被包括在生長培養(yǎng)基內(nèi)時,對野生型細胞是有毒的。此構(gòu)建體中ble基因和SV40終止子的來源是商業(yè)化的載體,叫做pSV40/Zeo,它得自InvitrogenCorporation(Carlsbad,CA)(技術(shù)手冊180202,Version B,″ZeoCassetteVectors″;Invitrogen Corporation,1600 Faraday Ave.,Carlsbad,CA 92008)。該微管蛋白基因啟動子經(jīng)聚合酶鏈式反應分離;用于該反應的引物之一是基于通過隨機Schizochytrium cDNA測序項目得到的序列數(shù)據(jù)。pTUBZEO11-2的圖譜見圖2所示,pTUBZEO11-2的核苷酸序列用SEQ ID NO9表示。用這種載體進行的Schizochytrium轉(zhuǎn)化用聚合酶鏈式反應來確認并用DNA印跡分析來檢測整合入Schizochytrium基因組的載體序列的存在。
ble基因已被以前的研究者作為各種生物的遺傳轉(zhuǎn)化的選擇性標記物,包括細菌,非破囊壺菌微藻,真菌,原生動物,植物,和動物細胞(見,例如,美國專利6,027,900;Lumbreras等,1998,Plant J.14441-447;Rohe等.,1996,Curr.Genet.29587-590;Messina等.,1995,Gene 165213-217;Guerreroetal.,1992,ppl.Microbiol.Biotechnol.36759-762;Perez等.,1989,PlantMol.Biol.13365-373;Gatigno等.,1990Gene9135-41)。ble基因編碼″博來霉素-結(jié)合蛋白″,它賦予對多種抗生素,包括博來霉素,腐草霉素和ZeocinTM的抗性(Drocourt等.,1990,核酸s Res.184009)。此類基因可購自Invitrogen Corporation,這是本發(fā)明人用于制備Schizochytrium轉(zhuǎn)化載體pTUBZEO11-2的基因來源。然而,相信本發(fā)明人是產(chǎn)生下述轉(zhuǎn)化載體的第一種人,所述載體中ble基因與破囊壺菌啟動子相連,使得該基因在破囊壺菌表達。
第二套轉(zhuǎn)化載體用乙酰乳酸合酶基因(als)的體外定點誘變來創(chuàng)造,該基因是本發(fā)明人從Schizochytrium基因組文庫中分離的。這些突變改變了所編碼的酶(ALS)的氨基酸序列,使它對sulfometuron methyl和其它磺酰脲化合物,咪唑啉酮類抑制劑和嘧啶基羥苯甲酸鹽的敏感性大大降低,而這些化合物原本是破囊壺菌目微生物所敏感的?;酋k寤衔?,如sulfometuron methyl(SMM)通常對細胞有毒,因為它們能結(jié)合并滅活各種生物的乙酰乳酸合酶(ALS)。ALS催化纈氨酸,亮氨酸,和異亮氨酸生物合成的第一種步。咪唑啉酮,triazolopyrimidines,和其它化合物已示可結(jié)合并滅活來自某些生物的ALS。來自其他生物的,編碼乙酰乳酸合酶(也叫乙酰羥酸合酶)的基因的突變形式以前被用作酵母和植物轉(zhuǎn)化的選擇性標記物(Annu.Rev.PlantPhysiol.Plant Mol.Biol.40441-470,1989)。然而,本發(fā)明之前沒有一篇報道描述來自Schizochytrium屬或其它破囊壺菌目成員的als基因的序列或性質(zhì),或描述破囊壺菌目als基因突變體賦予對磺酰脲類,咪唑啉酮或嘧啶基羥苯甲酸鹽化合物的抗性的用途。事實上,就本發(fā)明人所知,無任何關(guān)于破囊壺菌目微生物對這些選擇試劑(包括sulfometuron methyl)的敏感性的報道,因而,本發(fā)明之前并不知道這種選擇性標記物是否適用于破囊壺菌轉(zhuǎn)化系統(tǒng)。值得注意的是,與已知als基因具有較高同源性的基因出現(xiàn)在各種生物中,但它們不編碼能催化乙酰乳酸合成的酶(Biochimica et Biophysica Acta 1385401-419,1998)。因而并不清楚,克隆的als同系物(homologue)事實上編碼ALS。為明確確定是否克隆的Schizochytrium基因真是als基因,本發(fā)明人通過轉(zhuǎn)化試驗證實,sulfometuron methyl-抗性與突變的假定Schizochytriumals基因的表達陽性相關(guān)。
本發(fā)明人制備了三種不同的含als基因突變體的轉(zhuǎn)化載體其中一種als基因突變體編碼的酶在595位是纈氨酸而不是色氨酸(質(zhì)粒pMON50201,或ALSmutl-7),另一在192位為谷氨酰胺而不是脯氨酸(質(zhì)粒pMON50202,或ALSmut2-2),第三種形式同時含有這兩種突變(質(zhì)粒pMON50203,或ALSmut3-5)。在這些載體中,所述重組als基因突變體的表達受天然als基因啟動子和終止子的控制。這些載體,以及含有野生型Schizochytrium als基因的載體(質(zhì)粒pMON50200,或AE-5)的圖譜見圖3A-3D所示。用這些ALS突變體-編碼載體進行的Schizochytrium轉(zhuǎn)化用聚合酶鏈式反應來確認,并用DNA印跡分析來檢測整合入Schizochytrium基因組的載體序列的存在。如下具體所述,既然本發(fā)明人已經(jīng)鑒定了als基因的完整序列,因而也可以制備其它突變,特別是如下的突變。因而,所述als基因突變體意在舉例,并非唯一可能的突變。
本發(fā)明的轉(zhuǎn)化系統(tǒng)已被用來經(jīng)共轉(zhuǎn)化向破囊壺菌目細胞引入外源基因。這些情況中,所述外源基因被置于多種Schizochytrium啟動子和適宜終止子(例如,SV40或Schizochytrium基因終止子區(qū))之間。例如,本發(fā)明人已產(chǎn)生并引入了編碼線蟲Caenorhabditis elegans的ω-3脂肪酸脫氫酶的合成基因(本文為SEQ ID NO29),以增加二十二碳六烯酸在Schizochytrium中的水平。SEQ ID NO30代表SEQ ID NO29編碼的脫氫酶的氨基酸序列。含有外源基因的表達盒也可通過直接包括在含有選擇性標記物的轉(zhuǎn)化載體中而被引入破囊壺菌目細胞。
而且,本發(fā)明人也用ALS突變體-編碼載體證實,同源重組出現(xiàn)在Schizochytrium中,這表明用重組工具滅活或突變具體的天然Schizochytrium基因的可行性。
關(guān)于本文所述的破囊壺菌目啟動子序列,對已經(jīng)報道的破囊壺菌目成員的所有核苷酸和蛋白序列進行了序列數(shù)據(jù)庫(GenBank)檢索,結(jié)果表明截止本發(fā)明時,沒有Schizochytrium屬或任何其它破囊壺菌目成員的啟動子序列的報道。唯一被報道來自任何Schizochytrium種的基因是S.aggregatum的5S核糖體RNA(GenBank序列號X06104和M13616)。破囊壺菌目成員(尤其Ulkefaia種),Labyrinthuloides屬和破囊壺菌屬的5S和18S核糖體RNA序列已有報道,但這與本發(fā)明沒有關(guān)系。來自Thraustochytrium aureuin的“公認T3/T7-樣RNA聚合酶”基因的部分編碼區(qū)已有報道(NucleicAcids Research15648-654,1996),但此類基因的啟動子序列未被報道。
本發(fā)明可用于將任何目的基因或其它核苷酸序列引入破囊壺菌目微生物。此類核苷酸序列包括,但不限于編碼與脂肪酸(例如,脂肪酸二十二碳六烯酸(DHA),二十二碳五烯酸(DPA),二十碳五烯酸(EPA)和二十碳四烯酸(ARA))合成相關(guān)的蛋白(例如,酶)的核酸。所述蛋白包括,但不限于脂肪酸合酶,脂肪酸脫氫酶,脂肪酸延伸酶,與聚酮化合物合酶復合體相關(guān)的蛋白,和/或與將這類脂肪酸摻入磷脂或三甘油酯分子相關(guān)的蛋白。例如,本發(fā)明已用于將編碼各種ω-3脂肪酸脫氫酶的基因引入Schizochytrium中,以嘗試經(jīng)過二十二碳五烯酸(DPA)的ω-3去飽和作用增加二十二碳六烯酸(DHA)在細胞中的水平。在另一例中,已證實紅藻Pilota的公認多烯脂肪酸異構(gòu)酶在Schizochytrium中的表達。編碼破囊壺菌聚酮化合物合酶復合體的基因(即,聚酮化合物合酶系統(tǒng))已用GenBank序列號AF378329(ORFA),F(xiàn)378328(ORFB)和AF378329(ORFC)登記。
本發(fā)明也用于向破囊壺菌目微生物引入其它編碼與類異戊二烯生物合成途徑相關(guān)的蛋白的基因和核苷酸序列。此類蛋白包括,但不限于HMG-CoA合酶和HMG-CoA還原酶。其它適合的蛋白包括與來自類異戊二烯亞單位的分子的合成相關(guān)的蛋白,所述分子包括,但不限于各種類固醇化合物和各種類胡蘿卜素化合物。與各種類胡蘿卜素化合物的合成相關(guān)的蛋白包括,但不限于角鯊烯合酶,八氫番茄紅素合酶,八氫番茄紅素脫氫酶,和各種類胡蘿卜素環(huán)化酶,羥化酶和酮酶。
本發(fā)明也用于向破囊壺菌中引入一或多種編碼與抗氧化化合物合成相關(guān)的蛋白的核酸序列,所述化合物包括,但不限于維生素E和硫辛酸。
另外,本發(fā)明可用于向破囊壺菌目微生物引入任何基因或其它核苷酸序列載體,以滅活或去除基因(即,″剔除″或″定向基因破壞″)?;虻臏缁罨蛉コǔS糜谠鰪娢⑸锏纳虡I(yè)價值。例如,可能希望去除編碼飽和和多聚不飽和脂肪酸合成途徑的酶的基因(或調(diào)節(jié)此類基因表達的核酸)。另一方面,可能希望抑制或剔除編碼下述蛋白的基因,所述蛋白參與其它為破囊壺菌目微生物所產(chǎn)生的有價值化合物的降解,或者減少所需的化合物的價值。例如,編碼脂肪酶,脂肪酸氧化酶,和具有討厭的滋味或氣味的蛋白的基因可能是本發(fā)明希望剔除的目標。另一方面,可能希望剔除編碼與化合物合成相關(guān)的蛋白的基因,其合成與其它目的分子有競爭。例如,此類基因包括,但不限于編碼參與糖類生物合成的蛋白的基因,編碼參與類異戊二烯途徑各種產(chǎn)物(例如,固醇或特定類胡蘿卜素化合物)的合成的蛋白的基因,和編碼參與細胞壁組分的合成的蛋白的基因。例如,已利用本發(fā)明將基因引入Schizochytrium細胞中,以嘗試滅活與來自Shewanella的聚酮化合物合酶基因同源的基因,從而評估他們在高度不飽和脂肪酸(HUFA)的生產(chǎn)中的作用。如實施例6所舉例,本發(fā)明也可用來滅活,去除或突變天然的參與脂肪酸,類胡蘿卜素,固醇,維生素或其它化合物的產(chǎn)生的基因,從而提高與這些化合物相關(guān)的產(chǎn)物的商業(yè)價值或可接受性。在一些實施方案中,如上討論,可能需要促進給定蛋白的產(chǎn)生,而在其他實施方案中,可能需要抑制同種蛋白的產(chǎn)生。此類決定是基于具體微生物的指定用途和生產(chǎn)目的。本發(fā)明也用于確定在Schizochytrium中進行遺傳重組的過程。
其它用于引入破囊壺菌目的基因和核酸分子對那些本領(lǐng)域技術(shù)人員將是顯而易見的,并且所有此類基因和分子都應為本發(fā)明所包括。
下文中主要就本發(fā)明的破囊壺菌目als基因和/或ALS蛋白描述了本發(fā)明的各種實施方案。然而,應理解對術(shù)語和方法的一般定義可應用于其它下述基因,核酸和蛋白的討論。
本發(fā)明是部分基于編碼選擇性標記物的核酸序列的鑒定,分離和產(chǎn)生,所述選擇性標記物適于在破囊壺菌目微生物轉(zhuǎn)化的重組構(gòu)建體中應用。這樣的選擇性標記物允許對本發(fā)明重組構(gòu)建體所成功轉(zhuǎn)化的微生物進行篩選??捎糜诒景l(fā)明破囊壺菌目轉(zhuǎn)化的一種選擇性標記物為破囊壺菌乙酰乳酸合酶(即ALS)。優(yōu)選,所述乙酰乳酸合酶已經(jīng)過修飾,突變,或者選擇,能抵抗磺酰脲化合物,咪唑啉酮類抑制劑和/或嘧啶基羥苯甲酸鹽的抑制(即這種ALS為天然乙酰乳酸合酶的同系物)。
根據(jù)本發(fā)明,乙酰乳酸合酶為具有乙酰乳酸合酶生物活性的蛋白,包括全長蛋白,融合蛋白,或天然乙酰乳酸合酶的任何同系物。乙酰乳酸合酶的同系物包括與天然乙酰乳酸合酶不同的蛋白,該不同是由于至少一或幾個,但不限于一或幾個氨基酸被去除(例如,所述蛋白的截短型,如肽或片段),插入,倒位,替代和/或衍生(例如,通過糖基化,磷酸化,乙?;孽;?,異戊二烯化,十六?;0坊?或加入糖基磷脂酰肌醇)。天然乙酰乳酸合酶的優(yōu)選同系物見下詳述。
根據(jù)本發(fā)明分離的蛋白,如分離的乙酰乳酸合酶,為從其天然環(huán)境取出(即經(jīng)過了人工處理)的蛋白,也可包括例如,純化的蛋白,部分純化的蛋白,重組產(chǎn)生的蛋白,和合成產(chǎn)生的蛋白。類似地,“分離的”不必反映該核酸分子被純化的程度。優(yōu)選,本發(fā)明分離的乙酰乳酸合酶是重組產(chǎn)生的?!捌颇覊鼐阴H樗岷厦浮敝敢阴H樗岷厦?包括天然乙酰乳酸合酶的同系物),它來自破囊壺菌目微生物或根據(jù)對破囊壺菌目微生物的天然乙酰乳酸合酶的結(jié)構(gòu)(例如,序列)的了解而制備。換言之,破囊壺菌目乙酰乳酸合酶包括任何下述乙酰乳酸合酶,它具有破囊壺菌目微生物的天然乙酰乳酸合酶的結(jié)構(gòu)和功能或位破囊壺菌目微生物的天然乙酰乳酸合酶的生物活性(即具有生物活性)同系物,如本文詳述。因此,破囊壺菌目乙酰乳酸合酶可包括純化蛋白,部分純化蛋白,重組蛋白,突變/修飾蛋白和合成蛋白。
一般,蛋白的生物活性或生物作用指該蛋白表現(xiàn)或?qū)嵤┑娜魏喂δ?,所述功能是該蛋白的天然形式在體內(nèi)(即在該蛋白的天然生理環(huán)境)或體外(即在實驗室條件下)測量或觀察到的。例如,乙酰乳酸合酶的生物活性包括乙酰乳酸合酶的酶活性。對蛋白的修飾,例如在同系物或模擬物(mimetic)中的修飾(見下討論),可導致蛋白具有與天然蛋白相同的生物活性,或?qū)е碌鞍拙哂信c天然蛋白相比降低或升高的生物活性。造成蛋白表達降低或蛋白活性降低的修飾,可被稱為蛋白的滅活(完全或部分),下調(diào),或作用減弱。類似地,造成蛋白表達升高或蛋白活性升高的修飾,可被稱為蛋白的擴增,過量表達,活化,增強,上調(diào),或作用增強。
本發(fā)明乙酰乳酸合酶優(yōu)選在乙酰乳酸合酶同系物中出現(xiàn)的修飾,與天然乙酰乳酸合酶相比基本不變,或與天然蛋白相比至少基本不降低合酶的基本生物活性。然而,與天然形態(tài)相比,所述同系物在除蛋白的功能或酶活性外的性質(zhì)上有不同,如與天然蛋白相比,對某些化合物的抑制作用的敏感性降低。優(yōu)選,與衍生出同系物的天然乙酰乳酸合酶相比,天然乙酰乳酸合酶的同系物對結(jié)合并滅活天然乙酰乳酸合酶的化合物具有降低的(即減少的,減弱的)敏感性。例如,磺酰脲化合物,如sulfometttron methyl(SMM),通常對細胞有毒,因為它們能結(jié)合并滅活乙酰乳酸合酶(ALS)。咪唑啉酮,triazolopyrimidines,和其它類似化合物(本文統(tǒng)稱咪唑啉酮類抑制劑)也顯示可結(jié)合并滅活ALS。因而,天然乙酰乳酸合酶的同系物優(yōu)選在保持乙酰乳酸合酶酶活性的同時,具有對磺酰脲化合物,和咪唑啉酮類抑制劑(例如,具有已遭破壞的此抑制劑的結(jié)合位點或具有對此抑制劑降低的親和力的結(jié)合位點),及對嘧啶基羥苯甲酸鹽,降低的敏感性。
如本文所用,具有″乙酰乳酸合酶生物活性″或被稱為″乙酰乳酸合酶″的蛋白指催化纈氨酸,亮氨酸,和異亮氨酸生物合成第一種步的蛋白。更具體地,本發(fā)明的分離的乙酰乳酸合酶,包括全長蛋白,截短蛋白,融合蛋白和同系物,可通過蛋白催化從丙酮酸合成乙酰乳酸的能力來被直接鑒定。乙酰乳酸合酶生物活性可被本領(lǐng)域技術(shù)人員用適合的體外或體內(nèi)酶活性試驗來評價。
一實施方案中,本發(fā)明乙酰乳酸合酶具有下述氨基酸序列,該序列與選自SEQ ID NO15,SEQ ID NO19,SEQ ID N022,SEQ ID NO24的氨基酸序列,或上述任何序列的至少約600個氨基酸有至少約65%相同,其中所述蛋白為乙酰乳酸合酶(即具有乙酰乳酸合酶生物活性)。更優(yōu)選,本發(fā)明的乙酰乳酸合酶具有,與SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一,或者與SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少約600個氨基酸有至少約70%相同,再更優(yōu)選至少約75%相同,再更優(yōu)選至少約80%相同,再更優(yōu)選至少約85%相同,再更優(yōu)選至少約90%相同,再更優(yōu)選至少約95%相同,再更優(yōu)選至少約96%相同,再更優(yōu)選至少約97%相同,再更優(yōu)選至少約98%相同,再更優(yōu)選至少約99%相同的氨基酸序列,其中所述蛋白具有乙酰乳酸合酶生物活性。
在另一實施方案中,本發(fā)明的乙酰乳酸合酶具有,與選自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22,SEQ ID NO24的氨基酸序列,或所述任何序列的至少95個氨基酸,有至少約75%相同的氨基酸序列,其中所述蛋白為乙酰乳酸合酶(即具有乙酰乳酸合酶生物活性)。更優(yōu)選,本發(fā)明的乙酰乳酸合酶具有,與SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQID NO24,或SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ IDNO24任一的至少95個氨基酸,至少約80%相同,再更優(yōu)選至少約85%相同,再更優(yōu)選至少約90%相同,再更優(yōu)選至少約95%相同,再更優(yōu)選至少約96%相同,再更優(yōu)選至少約97%相同,再更優(yōu)選至少約98%相同,再更優(yōu)選至少約99%相同的氨基酸序列,其中所述蛋白具有乙酰乳酸合酶生物活性。再更優(yōu)選,本發(fā)明的乙酰乳酸合酶具有下述氨基酸序列,該序列與SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24,或與SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少100個氨基酸,再更優(yōu)選125,再更優(yōu)選150,再更優(yōu)選175,再更優(yōu)選200,再更優(yōu)選225,再更優(yōu)選250,再更優(yōu)選275,再更優(yōu)選300,再更優(yōu)選325,再更優(yōu)選350,再更優(yōu)選375,再更優(yōu)選400,再更優(yōu)選425,再更優(yōu)選450,再更優(yōu)選475,再更優(yōu)選500,再更優(yōu)選525,再更優(yōu)選550,再更優(yōu)選575個氨基酸,具有上述任一相同性百分比,其中所述蛋白具有乙酰乳酸合酶生物活性。
如本文所用,除非另有說明,對于相同性百分數(shù)(%)是指使用(1)用標準默認參數(shù)進行BLAST 2.0 Basic BLAST同源性檢索,使用blastp進行氨基酸檢索,blasth用于核酸檢索,通過默認篩選查詢序列的低復雜性區(qū)域(在Altschul,S.F.,Madden,T.L,Schaaffer,A.A.,Zhang,J.,Zhang,Z.,Miller,W.& Lipman,D.J.(1997),“間隔的BLAST和PSI-BLAST新產(chǎn)生的蛋白質(zhì)數(shù)據(jù)庫檢索程序”。Nucleic Acids Res.253389-3402中描述,本文引用以其整體作為參考);(2)BLAST 2序列對比(使用下述參數(shù));(3)和/或使用標準默認參數(shù)的PSI-BLAST(位置特異性重復BLAST)進行的同源性評估。應注意由于BLAST 2.0 Basic BLAST和BLAST 2之間在標準參數(shù)上的一些區(qū)別,兩個特定序列使用BLAST 2程序可能認為具有明顯的同源性,而使用其中一個序列作為查詢序列以BLAST 2.0 Basic BLAST進行檢索時在最匹配的序列中可能沒有鑒定出第二種個序列。另外,PSI-BLAST提供了一個“提問檔(profile)”檢索的自動的,容易使用的版本,它是尋找序列同源性的一個敏感途徑。該程序首先進行有間隔的BLAST數(shù)據(jù)庫檢索。PSI-BLAST程序使用來自任何有效序列對比的信息返回構(gòu)建位置特異性記分矩陣,它代替查詢序列用于下一輪數(shù)據(jù)庫檢索。因此,應明白可使用這些程序中的任一種測定相同性百分數(shù)。
使用Tatusova和Madden,(1999),“Blast 2序列-用于比較蛋白質(zhì)和核苷酸序列的一種新工具”,F(xiàn)EMS Microbiol Lett.174247-250所述BLAST 2序列可互相對比兩個具體序列,本文引用該文獻以其整體作為參考。使用BLAST 2.0算法以blastp或blastn進行BLAST 2序列對比,在兩個序列之間進行有間隔的BLAST檢索(BLAST 2.0)允許在所得的序列對比中引入間隔(缺失和插入)。為了本文清楚的目的,使用如下標準默認參數(shù)進行BLAST2序列對比。
對于blasth,使用0 BLOSUM62矩陣匹配得分=1錯配罰分=-2空出間隔(5)和延伸間隔(2)罰分間隔_x下降(dropoff)(50)期望(expect)(10)序列大小(word size)(11)篩選(上)對于blastp,使用0 BLOSUM62矩陣空出間隔(11)和延伸間隔(1)罰分間隔_x下降(50)期望(10)序列大小(3)篩選(上)。
本發(fā)明的乙酰乳酸合酶也能包括具有下述氨基酸序列的蛋白,所述氨基酸序列包含SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少30個鄰接氨基酸殘基(即與SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的30個鄰接氨基酸具有100%相同性的30個鄰接氨基酸殘基)。在優(yōu)選實施方案中,本發(fā)明的乙酰乳酸合酶包括具有下述氨基酸序列的蛋白,所述氨基酸序列包含SEQ ID NO15,SEQID NO19,SEQ ID NO22或SEQ ID NO24任一的至少50,再更優(yōu)選至少75,再更優(yōu)選至少100,再更優(yōu)選至少115,再更優(yōu)選至少130,再更優(yōu)選至少150,再更優(yōu)選至少200,再更優(yōu)選,至少250,再更優(yōu)選,至少300,再更優(yōu)選,至少350,再更優(yōu)選,至少400,再更優(yōu)選,至少450,再更優(yōu)選,至少500,再更優(yōu)選,至少550,再更優(yōu)選,至少600,再更優(yōu)選,至少650,個鄰接氨基酸殘基。所述蛋白具有乙酰乳酸合酶生物活性。
根據(jù)本發(fā)明,術(shù)語“鄰接的”或“連續(xù)的”對于本文所述核酸或氨基酸序列是指以不中斷的序列相連。例如,對于第一種個序列含有第二種個序列的30個鄰接(或連續(xù))的氨基酸,是指第一種個序列包含與第二種個序列中30個氨基酸殘基的不中斷的序列具有100%相同性的30個氨基酸殘基的不中斷的序列。類似地,對于第一種個序列與第二種個序列具有“100%相同性”是指第一種個序列與第二種個序列完全匹配,在核苷酸或氨基酸之間沒有間隔。
在另一實施方案中,本發(fā)明的乙酰乳酸合酶(包括乙酰乳酸合酶同系物),包括具有下述氨基酸序列的蛋白,所述氨基酸序列與天然乙酰乳酸合酶氨基酸序列足夠相似,以致于編碼該同系物的核酸序列在中等,高度,或極高嚴格條件(下文描述)下能夠雜交到(即,與其雜交)編碼天然乙酰乳酸合酶氨基酸序列的核酸分子(即,編碼天然乙酰乳酸合酶氨基酸序列的核酸鏈的互補鏈)上。優(yōu)選,乙酰乳酸合酶由這樣一種核酸序列編碼,該核酸序列在中等,高度或極高嚴格條件下與編碼下述蛋白質(zhì)的核酸序列雜交,所述蛋白質(zhì)含有由SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24中任一個代表的氨基酸序列。甚至更優(yōu)選,本發(fā)明的乙酰乳酸合酶由下述核酸序列編碼,該核酸序列在中等,高度或極高嚴格條件下與SEQ ID NO15的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,或SEQ ID NO23的核苷酸1260-3314互補。該雜交條件見下詳述。編碼本發(fā)明的乙酰乳酸合酶的核酸序列的核酸序列互補指與編碼乙酰乳酸合酶的鏈互補的核酸鏈的核酸序列。理想的是,編碼給定氨基酸序列的雙鏈DNA,包含單鏈DNA并且它的互補鏈具有與單鏈DNA互補的序列。類似地,本發(fā)明的核酸分子可為雙鏈或單鏈,并且包括那些核酸分子,它們在嚴格雜交條件下與編碼氨基酸序列SEQ ID NO15,SEQ ID NO19,SEQID NO22或SEQ ID NO24的核酸序列,和/或與編碼任一此氨基酸序列的核酸序列互補,構(gòu)成穩(wěn)定雜交體。推定互補序列的方法對于本領(lǐng)域的技術(shù)人員是已知的。應注意由于氨基酸測序和核酸測序技術(shù)不是完全無誤差的,因此本文提供的序列最多代表本發(fā)明的乙酰乳酸合酶的表觀序列。
乙酰乳酸合酶同系物可以是天然等位基因變異或天然突變所致。本發(fā)明的乙酰乳酸合酶同系物也能用本領(lǐng)域已知技術(shù)產(chǎn)生,該技術(shù)包括,但不限于直接修飾所述蛋白,或者用,例如,經(jīng)典或重組DNA技術(shù)修飾編碼所述蛋白的基因,來造成隨機誘變或定點誘變。編碼乙酰乳酸合酶的核酸的一種天然等位基因變體是,與編碼氨基酸序列SEQ ID NO15的基因在基因組中基本相同的一或多個位點出現(xiàn)的基因,但其由于例如突變或重組造成的天然變異而具有相近但不相同的序列。天然等位基因變體通常編碼與相應基因編碼的蛋白具有類似活性的蛋白。一類等位基因變體開編碼具有不同核酸序列(由于遺傳密碼簡并性)的相同蛋白。等位基因變體也開在該基因的5′或3′非翻譯區(qū)(例如,調(diào)控區(qū))包含變更。等位基因變體是本領(lǐng)域技術(shù)人員已知的。
本發(fā)明的乙酰乳酸合酶蛋白也包括基因融合體(例如,用于過度表達可溶性活性重組蛋白),誘變基因(如帶有密碼子修飾以增強基因轉(zhuǎn)錄和翻譯的基因),和截短基因(如去除了膜結(jié)合結(jié)構(gòu)域以產(chǎn)生可溶性膜蛋白的基因,或去除了在特定重組宿主中耐受差的信號序列的基因)的表達產(chǎn)物。
本發(fā)明蛋白和/或同系物的最小大小為足夠具有乙酰乳酸合酶生物活性的大小。優(yōu)選,本發(fā)明的蛋白為至少30個氨基酸長,再更優(yōu)選,至少約50,再更優(yōu)選至少75,再更優(yōu)選至少100,再更優(yōu)選至少115,再更優(yōu)選至少130,再更優(yōu)選至少150,再更優(yōu)選至少200,再更優(yōu)選,至少250,再更優(yōu)選,至少300,再更優(yōu)選,至少350,再更優(yōu)選,至少400,再更優(yōu)選,至少450,再更優(yōu)選,至少500,再更優(yōu)選,至少550,再更優(yōu)選,至少600,再更優(yōu)選,至少650,再更優(yōu)選,至少684個氨基酸長。對該蛋白的最大大小除了操作限制,沒有限制,因為所述蛋白可包括乙酰乳酸合酶蛋白的一部分或全長乙酰乳酸合酶,如果需要還可加上附加序列(例如,融合蛋白序列)。
本發(fā)明也包括融合蛋白,它包括與一或多個融合節(jié)段結(jié)合的含有乙酰乳酸合酶的結(jié)構(gòu)域(即,根據(jù)本發(fā)明乙酰乳酸合酶的氨基酸序列)。本發(fā)明所用的適宜融合節(jié)段包括,但不限于具有下述功能的節(jié)段增強蛋白的穩(wěn)定性;提供其它所需生物活性;和/或輔助乙酰乳酸合酶的純化(例如,通過親和層析)。適宜的融合節(jié)段可以是具有所需功能的任何大小的結(jié)構(gòu)域(例如,賦予增加的穩(wěn)定性,溶解度,作用或生物活性;和/或簡化蛋白的純化)。融合節(jié)段可與所述蛋白上含乙酰乳酸合酶的結(jié)構(gòu)域的氨基和/或羧基末端相連,并易于剪切,以便直接回收乙酰乳酸合酶。融合蛋白優(yōu)選通過培養(yǎng)融合核酸分子轉(zhuǎn)染的重組細胞來產(chǎn)生,該融合核酸分子編碼的蛋白包括與含乙酰乳酸合酶的結(jié)構(gòu)域的氨基和/或羧基末端結(jié)合的融合節(jié)段。
本發(fā)明也包括乙酰乳酸合酶的模擬物。本文中術(shù)語″模擬物″用于指能模擬天然肽的生物學作用的任何肽或非-肽化合物,通常是由于模擬物具有模擬天然肽基本結(jié)構(gòu)的基本結(jié)構(gòu)和/或具有天然肽的特征性生物學性質(zhì)。模擬物可包括,但不限于相對于原型具有實質(zhì)性(substantial)修飾的肽,如與天然肽無側(cè)鏈相似性(這樣的修飾可以,例如,降低它對降解作用的易感性);抗獨特型和/或催化抗體,或其片段;分離的蛋白的非蛋白部分(例如,糖類結(jié)構(gòu));或合成或天然的有機分子,包括,例如通過綜合(combinatorial)化學鑒定的核酸和藥物。
此模擬物可用各種本領(lǐng)域已知方法設(shè)計,篩選和/或鑒定??捎糜谠O(shè)計本發(fā)明所用的模擬物或其它治療性化合物的各種藥物設(shè)計方法,見Maulik等,1997,Molecular BiotechnologyTherapeutic Applications and Strategies,Wiley-Liss,Inc.,全文引入本文作為參考。乙酰乳酸合酶模擬物可從,例如,分子多樣性策略(相關(guān)策略的結(jié)合使得迅速構(gòu)建大的化學多樣分子文庫)獲得,從天然或合成化合物的文庫,特別是來自化學文庫或綜合文庫(即序列或大小不同但具有相似構(gòu)架的化合物文庫)的天然或合成化合物的文庫獲得,或者通過合理的,直接的(directed)或隨機的藥物設(shè)計獲得。見例如,Maulik等.,見上文.
在分子多樣性策略中,采用生物學,酶學和/或化學方法從,例如,肽,寡核苷酸,糖類和/或合成的有機分子合成大化合物文庫。發(fā)展分子多樣性策略的嚴格參數(shù)包括亞單位多樣性,分子大小,和文庫多樣性。篩選此類文庫的一般目的是,連續(xù)應用綜合篩選來獲得對所需靶的高親和力配體,然后通過隨機設(shè)計或定向設(shè)計策略使所得分子最優(yōu)化。分子多樣性的方法見Maulik,等.,如上詳述。
Maulik等還公開了,例如,定向設(shè)計方法,隨機設(shè)計方法,以及基于網(wǎng)格坐標的方法。在定向設(shè)計中,使用者直接從適當選擇的片段的片段文庫創(chuàng)建新分子;在隨機設(shè)計中,使用者使用遺傳或其他算法來隨機突變片段和它們的組合,同時應用選擇標準來評估候選配體的吻合性;在基于網(wǎng)格坐標的方法中,使用者計算三維受體結(jié)構(gòu)與小片段探針之間的相互作用能量,之后將所需的探針位置連接起來。
根據(jù)本發(fā)明,乙酰乳酸合酶可來自任何破囊壺菌目微生物,尤其Schizochytrium屬任何微生物。在一實施方案中,優(yōu)選本發(fā)明的乙酰乳酸合酶具有選自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22,或SEQ ID NO24的氨基酸序列。具有氨基酸序列SEQ ID NO15的蛋白是破囊菌目微生物的天然(即野生型)乙酰乳酸合酶,具體是Schizochytrium乙酰乳酸合酶。氨基酸序列SEQ ID NO19,SEQ ID NO22,SEQ ID NO24為修飾的序列,導致得到的酶,與氨基酸序列SEQ ID NO15所代表的天然蛋白相比,對磺酰脲化合物,咪唑啉酮類抑制劑和嘧啶基羥苯甲酸鹽的敏感性降低。應注意,SEQ ID NO19,SEQ ID NO22和SEQ ID NO24所代表的蛋白具有乙酰乳酸合酶生物活性。對磺酰脲化合物,咪唑啉酮類抑制劑和嘧啶基羥苯甲酸鹽的敏感性降低的乙酰乳酸合酶是本發(fā)明優(yōu)選的乙酰乳酸合酶,因為編碼這類合酶的核酸序列可作為選擇性標記物用于本發(fā)明的重組載體中。
因而,本發(fā)明一實施方案涉及修飾的乙酰乳酸合酶,包括SEQ ID NO15,SEQ ID NO19,SEQ ID NO22和SEQ ID NO24任一的任何同系物,其中所述同系物具有乙酰乳酸合酶生物活性,尤其是,其中宿舍同系物與氨基酸序列SEQ ID NO15所代表的天然蛋白相比,對磺酰脲化合物,咪唑啉酮類抑制劑和嘧啶基羥苯甲酸鹽的敏感性降低。一方面,所述乙酰乳酸合酶同系物包括下述蛋白,它具有與SEQ ID NO15不同的氨基酸序列,該不同是由于在一或多個下述位置116G,117A,192P,200A,251K,358M,383D,592V,595W,或599F發(fā)生氨基酸缺失,插入或取代。這些位置對應于酵母乙酰乳酸合酶中的已知ALS突變位點(即分別是116G,117A,192P,200A,251K,354M,379D,583V, 586W,和590F)(見Mazur和Falco,1989,Annu.Rev.Plant Physiol.Plant Mol.Biol.40441-470,全文引入本文作為參考)。其它可能的突變位點對于本領(lǐng)域技術(shù)人員而言,可根據(jù)其它生物的ALS中的成功氨基酸突變而知曉。將這些位點應用于破囊壺菌目ALS中的對應位點,也是本發(fā)明所包括的范圍。
如上述,本發(fā)明部分基于轉(zhuǎn)化破囊壺菌微生物的重組構(gòu)建體的發(fā)現(xiàn)和產(chǎn)生。因而,本發(fā)明一實施方案涉及分離的核酸分子,它包含編碼破囊壺菌目乙酰乳酸合酶的核酸序列,和與其完全互補的核酸序列。編碼本發(fā)明乙酰乳酸合酶的核酸分子包括編碼上述任何乙酰乳酸合酶蛋白(包括同系物)的核酸分子。更具體的是,本發(fā)明一實施方案涉及分離的核酸分子,它包含的核酸序列編碼的蛋白具有與選自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22,SEQ ID NO24的氨基酸序列,所述任一序列的至少約600個氨基酸,至少約65%相同的氨基酸序列,其中所述蛋白為乙酰乳酸合酶(即具有乙酰乳酸合酶生物活性)。更優(yōu)選,本發(fā)明分離的核酸分子具有編碼氨基酸序列的核酸序列,該氨基酸序列與SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24,或SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少約600個氨基酸,有至少約70%相同,再更優(yōu)選,至少約75%相同,再更優(yōu)選至少約80%相同,再更優(yōu)選至少約85%相同,再更優(yōu)選至少約90%相同,再更優(yōu)選至少約95%相同,再更優(yōu)選至少約96%相同,再更優(yōu)選至少約97%相同,再更優(yōu)選至少約98%相同,再更優(yōu)選至少約99%相同,其中所述蛋白具有乙酰乳酸合酶生物活性。
在另一實施方案中,本發(fā)明的分離的核酸分子具有編碼氨基酸序列的核酸序列,該氨基酸序列與選自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22,SEQ ID NO24的氨基酸序列,任一所述序列的超過至少95氨基酸,至少約75%相同,其中所述蛋白為乙酰乳酸合酶(即具有乙酰乳酸合酶生物活性)。更優(yōu)選,本發(fā)明的分離的核酸分子具有編碼氨基酸序列核酸序列,該氨基酸序列與SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ IDNO24任一,或與SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQID NO24任一的至少95個氨基酸,有至少約80%相同,再更優(yōu)選至少約85%相同,再更優(yōu)選至少約90%相同,再更優(yōu)選至少約95%相同,再更優(yōu)選至少約96%相同,再更優(yōu)選至少約97%相同,再更優(yōu)選至少約98%相同,再更優(yōu)選至少約99%相同,其中所述蛋白具有乙酰乳酸合酶生物活性。
在另一實施方案中,本發(fā)明的分離的核酸分子具有編碼下述氨基酸序列的核酸序列,所述氨基酸序列具有SEQ ID NO15,SEQ ID NO19,SEQ IDNO22或SEQ ID NO24,或SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少100個氨基酸,再更優(yōu)選125,再更優(yōu)選150,再更優(yōu)選175,再更優(yōu)選200,再更優(yōu)選225,再更優(yōu)選250,再更優(yōu)選275,再更優(yōu)選300,再更優(yōu)選325,再更優(yōu)選350,再更優(yōu)選375,再更優(yōu)選400,再更優(yōu)選425,再更優(yōu)選450,再更優(yōu)選475,再更優(yōu)選500,再更優(yōu)選525,再更優(yōu)選550,再更優(yōu)選575個氨基酸,其中所述蛋白具有乙酰乳酸合酶生物活性。相同性百分比如上述用BLAST 2.0 Basic BLAST默認參數(shù)來確定。
一實施方案中,編碼本發(fā)明的乙酰乳酸合酶的核酸分子包括分離的核酸分子,它在中等嚴格條件,再更優(yōu)選在高度嚴格條件,再更優(yōu)選在極高嚴格條件與編碼天然乙酰乳酸合酶的核酸序列的互補鏈雜交。優(yōu)選,編碼本發(fā)明的乙酰乳酸合酶的分離的核酸分子包含核酸序列,它在中等或高度嚴格條件與編碼包含氨基酸序列SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24的蛋白的核酸序列的互補鏈雜交。在一實施方案中,分離的核酸分子包含下述核酸序列,它在中等,高度或極高嚴格條件下與SEQ IDNO14的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ IDNO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314所示核酸序列的互補序列雜交。
本文使用的雜交條件是指標準雜交條件,在該條件下使用核酸分子鑒定相似的核酸分子。該標準條件在例如,Sambrook等,Molecular CloningALaboratory Manual,Cold Spring Harbor Labs Press,1989中公開。Sambrook等,出處同上,在本文中引用以其整體作為參考(具體參見,第9.31-9.62頁)。另外,計算合適的雜交和洗滌條件以完成允許各種程度的核苷酸錯配的雜交的公式在例如,Meinkoth等,1984,Anal.Biochem.138,267-284中公開;Meinkoth等,出處同上,在本文中引用以其整體作為參考。
更具體地說,本文提及的中等嚴格的雜交和洗滌條件是指在雜交反應中允許分離與用于探測的核酸分子具有至少約70%的核酸序列相同性的核酸分子的條件(即,允許約30%或更少的核苷酸錯配的條件)。本文提及的高度嚴格的雜交和洗滌條件是指在雜交反應中允許分離與用于探測的核酸分子具有至少約80%的核酸序列相同性的核酸分子的條件(即,允許約20%或更少的核苷酸錯配的條件)。本文提及的極高嚴格的雜交和洗滌條件是指在雜交反應中允許分離與用于探測的核酸分子具有至少約90%的核酸序列相同性的核酸分子的條件(即,允許約10%或更少的核苷酸錯配的條件)。如上所述,本領(lǐng)域技術(shù)人員可使用Meinkoth等,出處同上中的公式計算合適的雜交和洗滌條件以達到這些特定的核苷酸錯配水平。該條件可依賴于形成的是DNARNA還是DNADNA雜交體而變化。計算的DNADNA雜交體的解鏈溫度比DNARNA雜交體低10℃。在具體實施方案中,DNADNA雜交體的嚴格雜交條件包括在6X SSC(0.9M Na+)的離子強度下在約20℃和約35℃之間(低度嚴格),更優(yōu)選的是,在約28℃和約40℃之間(更嚴格),且甚至更優(yōu)選的是,在約35℃和約45℃之間(甚至更嚴格)的溫度下,在合適的洗滌條件下的雜交。在具體實施方案中,DNARNA雜交體的嚴格雜交條件包括在6X SSC(0.9M Na+)的離子強度下在約30℃和約45℃之間,更優(yōu)選的是,在約38℃和約50℃之間,且甚至更優(yōu)選的是,在約45℃和約55℃之間的溫度下,以同樣嚴格的洗滌條件的雜交。這些值根據(jù)大于約100個核苷酸,0%甲酰胺和約40%的G+C含量的分子的解鏈溫度計算。另外,可按Sambrook等,出處同上,第9.31至9.62頁提供的經(jīng)驗計算Tm值。一般來說,洗滌條件應當盡可能嚴格,且對于選定的雜交條件應是合適的。例如,雜交條件可包括鹽和溫度條件的組合,該溫度比計算的特定雜交體的Tm低約20-25℃,且洗滌條件一般包括鹽和溫度條件的組合,該溫度比計算的特定雜交體的Tm低約12-20℃。適用于DNADNA雜交體的雜交條件的一個例子包括在6X SSC(50%甲酰胺)中在約42℃下雜交2-24小時,接著進行洗滌步驟,包括在室溫下在約2X SSC中的一次或多次洗滌,接著在更高溫度和更低離子強度下進一步洗滌(例如,在約37℃下在約0.1X-0.5X SSC中洗滌至少一次,接著在約68℃下在約0.1X-0.5X SSC中洗滌至少一次)。
在另一實施方案中,編碼本發(fā)明乙酰乳酸合酶的核酸分子包括含下述核酸序列的分離的核酸分子,該核酸序列編碼的氨基酸序列具有包含SEQ IDNO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少30個鄰接氨基酸殘基的蛋白,(即與SEQ ID NO15,SEQ ID NO19,SEQ IDNO22或SEQ ID NO24任一的30個鄰接氨基酸具有100%相同性的30個鄰接氨基酸殘基)。在優(yōu)選實施方案中,分離的核酸分子包含編碼下述蛋白的核酸序列,該蛋白具有的氨基酸序列包含SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ ID NO24任一的至少50個,再更優(yōu)選至少75,再更優(yōu)選至少100,再更優(yōu)選至少115,再更優(yōu)選至少130,再更優(yōu)選至少150,再更優(yōu)選至少200,再更優(yōu)選,至少250,再更優(yōu)選,至少300,再更優(yōu)選,至少350,再更優(yōu)選,至少400,再更優(yōu)選,至少450,再更優(yōu)選,至少500,再更優(yōu)選,至少550,再更優(yōu)選,至少600,再更優(yōu)選,至少650,個鄰接氨基酸殘基。所述蛋白具有乙酰乳酸合酶生物活性。在一實施方案中,編碼乙酰乳酸合酶的分離的核酸分子包含一種核酸序列,該核酸序列具有SEQ ID NO15的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314的至少60個鄰接的核苷酸,再更優(yōu)選至少150,再更優(yōu)選至少225,再更優(yōu)選至少300,再更優(yōu)選至少345,再更優(yōu)選至少390,再更優(yōu)選至少450,再更優(yōu)選至少525,再更優(yōu)選至少600,再更優(yōu)選至少750,再更優(yōu)選至少900,再更優(yōu)選至少1050,再更優(yōu)選至少1200,再更優(yōu)選至少1350,再更優(yōu)選至少1500,再更優(yōu)選至少1650,再更優(yōu)選至少1800,再更優(yōu)選至少1950,個鄰接的核苷酸。
本發(fā)明特別優(yōu)選的核酸分子包括SEQ ID NO14的核苷酸1260-3314(編碼SEQ ID NO15),SEQ ID NO18的核苷酸1260-3314(編碼SEQ ID NO19),SEQ ID NO21的核苷酸1260-3314(編碼SEQ ID NO22),或SEQ IDNO23的核苷酸1260-3314(編碼SEQ ID NO24),SEQ ID NO14,SEQ IDNO18,SEQ ID NO21或SEQ ID NO23。
根據(jù)本發(fā)明,分離的核酸分子是從其天然環(huán)境中取出(即,對其進行了人工操作)的核酸分子,其天然環(huán)境是天然狀態(tài)下發(fā)現(xiàn)該核酸分子的基因組或染色體。因此,“分離的”不必反映該核酸分子被純化的程度,但是表明該核酸分子不包括天然狀況下發(fā)現(xiàn)該核酸分子的完整基因組或完整染色體。分離的核酸分子可包括基因。包括基因的分離的核酸分子不是包括該基因的染色體的一個片段,而是包括編碼區(qū)和與該基因相關(guān)的調(diào)控區(qū),但是沒有在同一染色體中天然發(fā)現(xiàn)的其它基因。分離的核酸分子也可包括一種特定的核酸序列,其側(cè)翼(即,在該序列的5’和/或3’端)為天然狀況下一般不是該特定核酸序列側(cè)翼的其它核酸(即,異源序列)。分離的核酸分子可包括DNA,RNA(即,mRNA),或DNA或RNA之一的衍生物(例如,cDNA)。盡管短語“核酸分子”主要是指物理學核酸分子且短語“核酸序列”主要是指核酸分子上的核苷酸序列,但是兩個短語可交換使用,特別是對于能編碼蛋白質(zhì)或蛋白質(zhì)的結(jié)構(gòu)域的核酸分子或核酸序列。
優(yōu)選,本發(fā)明的分離的核酸分子用重組DNA技術(shù)(例如,聚合酶鏈式反應(PCR)擴增,克隆)或化學合成來產(chǎn)生。分離的核酸分子包括天然的核酸分子及其同系物,包括,但不限于,天然等位基因變異體和修飾的核酸分子,其中的核苷酸以這樣的方式插入,缺失,取代,和/或顛倒,即該修飾對蛋白的生物學活性產(chǎn)生了所需的影響。蛋白質(zhì)同系物(例如,由核酸同系物編碼的蛋白質(zhì))在上文中已有詳細討論。
可使用本領(lǐng)域的技術(shù)人員已知的許多方法來產(chǎn)生核酸分子同源物(參見,例如,Sambrook等,Molecular CloningA Laboratory Manual,Cold SpringHarbor Labs Press,1989)。例如,可使用各種技術(shù)修飾核酸分子,該技術(shù)包括,但不限于,傳統(tǒng)誘變技術(shù)和重組DNA技術(shù),例如定點誘變,化學處理核酸分子以誘導突變,限制性酶裂解核酸片段,連接核酸片段,核酸序列選定區(qū)域的PCR擴增和/或誘變,合成寡核苷酸混合物并連接混合物組以“構(gòu)建”核酸分子的混合體及其組合。通過篩選核酸編碼的蛋白質(zhì)的功能和/或通過與野生型基因雜交可從修飾的核酸混合物中選擇核酸分子同源物。
類似地,本發(fā)明核酸分子大小的最小值是足夠編碼具有所需生物活性的蛋白,或足夠構(gòu)成能與編碼天然蛋白的核酸分子的互補序列(例如,在中等,高度或極高嚴格條件下)構(gòu)成穩(wěn)定雜交體的探針或寡核苷酸引物的大小。因此,編碼所述蛋白的核酸分子的大小取決于核酸組成、該核酸分子與互補序列間的同源性或相同性百分比,以及雜交條件本身(例如,溫度,鹽濃度,和甲酰胺濃度)。用作寡核苷酸引物或探針的核酸分子大小的最小值一般是如果該核酸分子富含GC則為至少約12個到約15個核苷酸的長度且如果它們富含AT則為至少約15到約18個堿基的長度。對本發(fā)明的核酸分子大小的最大值沒有限制,實際的限制是該核酸分子可包括蛋白-編碼序列(例如,乙酰乳酸合酶-編碼序列)的部分或編碼全長蛋白的核酸序列。
本發(fā)明一實施方案包括用于轉(zhuǎn)化破囊壺菌目微生物的重組載體。根據(jù)本發(fā)明,重組載體是一種改造的(即,人工產(chǎn)生的)核酸分子,它用作處理選定核酸序列并將該核酸序列導入宿主細胞的工具。因此重組載體適用于克隆,測序,和/或處理選定的核酸序列,例如通過表達和/或傳遞選定的核酸序列到宿主細胞中以形成重組細胞。該載體一般含有異源核酸序列,異源核酸序列是天然狀況下未發(fā)現(xiàn)與需要克隆或傳遞的核酸序列相連的核酸序列,盡管該載體也可含有天然狀況下發(fā)現(xiàn)與本發(fā)明的核酸分子相連的或者用于表達本發(fā)明的核酸分子的調(diào)控核酸序列(例如,啟動子,非翻譯區(qū))(下面詳細討論)。該載體可以是RNA或者是DNA,是原核的或者真核的,且一般是一種質(zhì)粒。該載體可作為染色體外因子(例如,質(zhì)粒)維持或者可整合進重組生物(例如,微生物或植物)的染色體中。該完整載體可在宿主細胞內(nèi)適當保留,或者在某些情況下,可刪除質(zhì)粒DNA,留下本發(fā)明的核酸分子。整合的核酸分子可受染色體的啟動子的控制,受天然或質(zhì)粒啟動子控制,或受數(shù)個啟動子的結(jié)合的控制。所述核酸分子的單或多拷貝可整合到染色體。本發(fā)明的重組載體包含根據(jù)本發(fā)明的破囊壺菌目微生物的至少一選擇性標記物,如編碼破囊壺菌目乙酰乳酸合酶(天然蛋白或同系物)的核酸序列或編碼ble基因的核酸序列(下述)。如本文所用,術(shù)語″重組核酸分子″主要用于指連接到重組載體中,需要經(jīng)過克隆、操作、轉(zhuǎn)化而進入宿主細胞的核酸序列(即插入子)。
一般來說,重組核酸分子包括與一個或多個轉(zhuǎn)錄調(diào)控序列可操作地相連的至少一個本發(fā)明的核酸分子。本文所用的短語“重組分子”或“重組核酸分子”主要是指與轉(zhuǎn)錄調(diào)控序列可操作地相連的核酸分子或核酸序列,但是當核酸分子是本文討論的重組分子時,上述短語可與短語“核酸分子”交換使用。根據(jù)本發(fā)明,短語“可操作地相連”是指核酸分子與轉(zhuǎn)錄調(diào)控序列以這樣的方式相連,即該連接使得該分子轉(zhuǎn)染(即,轉(zhuǎn)化,轉(zhuǎn)導,轉(zhuǎn)染,接合或?qū)?進宿主細胞時能夠表達。轉(zhuǎn)錄調(diào)控序列是控制轉(zhuǎn)錄開始,延長,或終止的序列。特別重要的轉(zhuǎn)錄調(diào)控序列是那些控制轉(zhuǎn)錄開始的序列,例如啟動子,增強子,操縱子和阻抑序列。合適的轉(zhuǎn)錄調(diào)控序列包括在該重組核酸分子導入的宿主細胞或生物體中能起作用的任何轉(zhuǎn)錄調(diào)控序列。相信本發(fā)明人是第一個分離并鑒定了至少三種這樣的啟動子,如本文其它處所詳述。
優(yōu)選啟動子包括,但不限于,破囊壺菌目乙酰乳酸合酶啟動子(本文用SEQ ID NO14的核苷酸1-1259表示),破囊壺菌目α-微管蛋白啟動子(本文用SEQ ID NO9的核苷酸441-894來表示),來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子(包含在SEQ ID NO34中),和破囊壺菌目脂肪酸脫氫酶啟動子(包含在SEQ ID NO31中;應注意,脂肪酸脫氫酶啟動子指美國臨時專利申請60/284,116的脫氫酶啟動子,見上文)。α-微管蛋白啟動子,乙酰乳酸合酶啟動子,和脂肪酸脫氫酶啟動子的克隆和測序在實施例部分敘述。在優(yōu)選實施方案中,α-微管蛋白啟動子包含天然破囊壺菌α-微管蛋白啟動子序列(SEQ ID NO9的核苷酸441-894),或與SEQ ID NO9的核苷酸441-894至少95%相同的核酸序列,其中該啟動子具有至少基本的α-微管蛋白啟動子轉(zhuǎn)錄活性。類似地,優(yōu)選乙酰乳酸合酶啟動子包含天然破囊壺菌乙酰乳酸合酶啟動子的核酸序列(在SEQ ID NO14核苷酸1-1259中表示),或與SEQ ID NO14核苷酸1-1259至少75%,再更優(yōu)選80%,再更優(yōu)選85%,再更優(yōu)選90%,再更優(yōu)選95%相同的核酸序列,其中所述啟動子具有至少基本的乙酰乳酸合酶啟動子轉(zhuǎn)錄活性。優(yōu)選PKS啟動子包含天然破囊壺菌目PKS啟動子的核酸序列(在SEQ ID NO34中表示),或與SEQ ID NO34至少75%,再更優(yōu)選80%,再更優(yōu)選85%,再更優(yōu)選90%,再更優(yōu)選95%相同的核酸序列,其中所述啟動子具有至少基本的PKS啟動子轉(zhuǎn)錄活性。最后,優(yōu)選脂肪酸脫氫酶啟動子包含天然破囊壺菌目脂肪酸脫氫酶啟動子的核酸序列(在SEQ ID NO31中表示),或被包含在與SEQ ID NO31至少75%,再更優(yōu)選80%,再更優(yōu)選85%,再更優(yōu)選90%,再更優(yōu)選95%相同的核酸序列中,其中所述啟動子具有至少基本的脂肪酸脫氫酶啟動子轉(zhuǎn)錄活性。確定百分比相同性的方法已在前面針對本文乙酰乳酸合酶序列敘述,并為本文所包括。
在一實施方案中,本發(fā)明的重組載體為表達載體。本文所用的短語“表達載體”用于指適合于產(chǎn)生編碼產(chǎn)物(例如,目的蛋白)的載體。在該實施方案中,將編碼需要產(chǎn)生的蛋白的核酸序列插入重組載體中以產(chǎn)生重組核酸分子。編碼需要產(chǎn)生的蛋白的核酸序列以這樣的方式插入載體中,即將該核酸序列與載體中的調(diào)控序列(例如,本發(fā)明的破囊壺菌目啟動子)可操作地連接使得能夠在重組宿主細胞內(nèi)轉(zhuǎn)錄和翻譯該核酸序列。本發(fā)明的選擇性標記物確保能選出成功引入了本發(fā)明重組核酸分子的重組微生物。
在另一實施方案中,用于本發(fā)明的重組核酸分子的重組載體是一種定向載體。本文所用的短語“定向載體”用于指這樣一種載體,即它用于將特定核酸分子傳遞進重組宿主細胞,其中該核酸分子用于刪除或滅活宿主細胞或微生物內(nèi)的內(nèi)源性基因(即,用于定向基因破壞或敲除技術(shù))。該載體本領(lǐng)域也稱為“敲除”載體。在該實施方案的一個方面,該載體的一部分,但更典型的是插入載體中的核酸分子(即,插入片段)具有與宿主細胞中靶基因(即,刪除或失活針對的基因)的核酸序列同源的核酸序列。載體插入片段的核酸序列設(shè)計成與靶基因結(jié)合以便靶基因與插入片段進行同源重組,從而刪除,滅活或減弱該內(nèi)源性靶基因(即,通過突變或刪除至少一部分內(nèi)源性靶基因)。
在一實施方案中,本發(fā)明優(yōu)選的重組載體為適宜用在破囊壺菌目微生物中,并包括編碼本發(fā)明乙酰乳酸合酶分子的核酸序列的重組載體。優(yōu)選,所述乙酰乳酸合酶相對于天然形式(SEQ ID NO15)已被修飾,致使所述合酶賦予該重組載體所轉(zhuǎn)染的破囊壺菌目微生物對磺酰脲化合物,咪唑啉酮類抑制劑和/或嘧啶基羥苯甲酸鹽降低的敏感性。優(yōu)選,該重組載體包含編碼乙酰乳酸合酶蛋白的核酸序列,該蛋白包含與SEQ ID NO15不同的氨基酸序列,該不同是由于在一或多個下述位置116G,117A,192P,200A,251K,358M,383D,592V,595W,或599F發(fā)生氨基酸缺失,插入或取代。一實施方案中,所述乙酰乳酸合酶蛋白具有包括,但不限于SEQ ID NO19,SEQ ID NO22和SEQ ID NO24的氨基酸序列。優(yōu)選,所述重組載體包含選自下列的核酸序列SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,和SEQ ID NO23的核苷酸1260-3314。在特別優(yōu)選的實施方案中,包含賦予所需抗性的ALS-編碼核酸序列的重組載體包括SEQ ID NO18,SEQ ID NO21和SEQ ID NO23。
在一實施方案中,適宜賦予用所述重組載體轉(zhuǎn)染的破囊壺菌目微生物對磺酰脲化合物,咪唑啉酮類抑制劑和/或嘧啶基羥苯甲酸鹽降低的敏感性的重組載體,包含SEQ ID NO15,這是天然Schizochytrium乙酰乳酸合酶序列。在本實施方案中,所述重組載體被設(shè)計成過度表達天然合酶,而此過度表達具有賦予微生物對特定的化合物的抗性的效應。在本實施方案中,本領(lǐng)域的技術(shù)人員將預料到使用重組DNA技術(shù)通過操縱例如,宿主細胞內(nèi)核酸分子的拷貝數(shù),轉(zhuǎn)錄這些核酸分子的效率,翻譯所得轉(zhuǎn)錄子的效率,和翻譯后修飾的效率可改進轉(zhuǎn)染的核酸分子的表達調(diào)控。另外,可遺傳改造啟動子序列以便與天然啟動子相比表達水平提高。用于控制核酸分子表達的重組技術(shù)包括,但不限于,將該核酸分子整合進一個或多個宿主細胞染色體中,給質(zhì)粒添加載體穩(wěn)定性序列,取代或修飾轉(zhuǎn)錄控制信號(例如,啟動子,操縱子,增強子),取代或修飾翻譯控制信號(例如,核糖體結(jié)合位點,Shine-Dalgarno序列),修飾核酸分子以符合該宿主細胞的密碼子用法,和除去使轉(zhuǎn)錄子不穩(wěn)定的序列。
本發(fā)明一實施方案中,適于轉(zhuǎn)化破囊壺菌目微生物的重組載體,包含來自印度斯坦鏈異壁菌的Sh ble基因作為選擇性標記物(它編碼″博來霉素-結(jié)合蛋白),以及如本文上述的破囊壺菌目啟動子。優(yōu)選的重組載體包含ble基因和破囊壺菌目啟動子,包括,例如,SEQ ID NO8或9所示載體序列。印度斯坦鏈異壁菌博來霉素-結(jié)合蛋白的氨基酸序列在本文為SEQ ID NO10。
本發(fā)明的重組核酸分子也可含有其它調(diào)控序列,例如翻譯調(diào)控序列,復制起點,和與該重組細胞相適應的其它調(diào)控序列。在一個實施方案中,包括整合進宿主細胞染色體中的那些分子的本發(fā)明的重組分子還含有分泌信號(即,信號片段核酸序列)以便使得表達的蛋白質(zhì)從產(chǎn)生該蛋白質(zhì)的細胞中分泌出來。合適的信號片段包括天然狀況下與表達該蛋白質(zhì)相關(guān)的信號片段或者能夠指導根據(jù)本發(fā)明的蛋白質(zhì)分泌的任何異源性信號片段。在另一實施方案中,本發(fā)明的重組分子包含使得表達蛋白能夠傳遞到宿主細胞膜上并插入膜中的前導序列。合適的前導序列包括天然狀況下與該蛋白質(zhì)相關(guān)的前導序列,或者能夠指導該蛋白質(zhì)傳遞并插入細胞膜中的任何異源性前導序列。
在描述了各種可用于轉(zhuǎn)化破囊壺菌目微生物的工具以后,本發(fā)明一實施方案涉及破囊壺菌目微生物細胞的轉(zhuǎn)化方法。所述方法包括第一種步(a)將本文上述重組核酸分子引入破囊壺菌目微生物細胞。所述重組核酸分子包含編碼乙酰乳酸合酶的核酸序列,所述乙酰乳酸合酶賦予該細胞對選自如下的化合物降低的敏感性磺酰脲化合物,咪唑啉酮類抑制劑,和嘧啶基羥苯甲酸鹽。所述乙酰乳酸合酶已在上文中詳述,它包括具有氨基酸序列SEQ IDNO19,SEQ ID NO22或SEQ ID NO24,及任一所述序列或上述SEQ IDNO15的同系物的乙酰乳酸合酶。此方法包括第二種步(b)選擇已用所述重組核酸分子成功轉(zhuǎn)化的細胞,方法是在包含至少一抑制未轉(zhuǎn)化細胞的化合物的培養(yǎng)基中培養(yǎng)(a)的細胞,所述化合物選自下述磺酰脲化合物,咪唑啉酮類抑制劑,和嘧啶基羥苯甲酸鹽。在此類化合物存在時能夠生長的細胞已被成功轉(zhuǎn)化。
本方法所用重組核酸分子包含本文上述任一種本發(fā)明重組載體,并通常包括至少一種編碼重組細胞(即包含重組表達載體)產(chǎn)生的蛋白的核酸序列,或用于在重組細胞(即包含重組靶向載體)中定點去除或滅活內(nèi)源基因的核酸序列。
一實施方案中,所述重組核酸分子還包含編碼由所述細胞產(chǎn)生的蛋白的核酸序列,其中編碼所述蛋白的所述核酸序列與轉(zhuǎn)錄控制序列可操作性連接。希望在破囊壺菌目中產(chǎn)生的蛋白對本領(lǐng)域技術(shù)人員是已知的,并且全部為本發(fā)明所包括。特別優(yōu)選的蛋白包括,但不限于與選自二十二碳六烯酸(DHA),二十二碳五烯酸(DPA),二十碳五烯酸(EPA)和二十碳四烯酸(ARA)的脂肪酸的合成相關(guān)的蛋白。此類蛋白包括,例如,脂肪酸合酶,脂肪酸脫氫酶,脂肪酸延伸酶,與聚酮化合物合酶復合體相關(guān)的蛋白,以及與將脂肪酸摻入磷脂或三甘油酯分子相關(guān)的蛋白。一方面,所述蛋白為核酸序列SEQID NO29編碼的ω-3脂肪酸脫氫酶。SEQ ID NO30表示該脫氫酶的氨基酸序列。另一方面,所述蛋白為多烯脂肪酸異構(gòu)酶。一實施方案中,可用本方法在破囊壺菌目微生物中產(chǎn)生的蛋白,包括與類異戊二烯生物合成途徑相關(guān)的蛋白。所述蛋白包括,但不限于HMG-CoA合酶,HMG-CoA還原酶,角鯊烯合酶,八氫番茄紅素合酶,八氫番茄紅素脫氫酶,類胡蘿卜素環(huán)化酶,類胡蘿卜素羥化酶,類胡蘿卜素酮酶。在另一實施方案中,可用本方法在破囊壺菌目微生物中產(chǎn)生的蛋白包括,但不限于維生素E和硫辛酸。
一實施方案中,本發(fā)明方法所用重組核酸分子包括與微生物內(nèi)靶核酸序列雜交的核酸序列,從而包含該靶核酸序列的基因通過與所述第二種核酸序列同源重組而突變或滅活。此類核酸序列可與下述基因同源編碼飽和和多聚不飽和的脂肪酸合成途徑的酶的基因(或調(diào)控所述基因表達的核酸),編碼參與破囊壺菌目微生物產(chǎn)生的其它有價值的化合物的降解或者減低所需化合物的價值的蛋白的基因,或編碼與化合物合成相關(guān)的蛋白的基因,該化合物合成與其它目的分子有競爭。例如,靶核酸序列包括,但不限于編碼下述蛋白的序列脂肪酶,脂肪酸氧化酶,參與糖類合成的蛋白,參與類異戊二烯途徑產(chǎn)物合成的蛋白,參與細胞壁組分合成的蛋白,參與飽和脂肪酸合成途徑的蛋白,參與多聚不飽和脂肪酸合成途徑的蛋白,與聚酮化合物合酶復合體相關(guān)的蛋白和與將脂肪酸摻入磷脂或三甘油酯分子相關(guān)的蛋白。
本發(fā)明一實施方案中,轉(zhuǎn)化破囊壺菌目微生物的方法包括向細胞引入至少一種附加的重組核酸分子的步驟,所述分子包含編碼要表達蛋白的核酸序列,該核酸序列與轉(zhuǎn)錄控制序列可操作性連接。或者,所述附加的重組核酸分子可包括與所述微生物中靶核酸序列雜交的第二種核酸序列,從而包含該靶核酸序列的基因通過與第二種核酸序列同源重組而突變或滅活。這樣一來,有可能將多個蛋白引入細胞,和/或滅活多個基因。所述附加的重組核酸分子可與第一種重組核酸分子同時引入破囊壺菌目微生物(即共轉(zhuǎn)化),或作為后來的轉(zhuǎn)化(例如,為″堆積″性狀的目的)。
一實施方案中,所述方法還包括向細胞引入至少一種附加的包含編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子的步驟。在本實施方案中,該附加的重組核酸分子優(yōu)選在后續(xù)步驟中引入,而不是進行共轉(zhuǎn)化。優(yōu)選,所述包含編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子還包含編碼第二種被細胞表達的蛋白的核酸序列,其中所述編碼第二種蛋白的核酸序列可操作性連接到轉(zhuǎn)錄控制序列?;蛘?,或另外,所述包含編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子還包含與該微生物中靶核酸序列雜交的第二種核酸序列,從而包含該靶核酸序列的基因通過與第二種核酸序列同源重組而突變或滅活。一實施方案中,此重組核酸分子包含核酸序列SEQ ID NO9。
適宜用本發(fā)明方法轉(zhuǎn)化的宿主細胞包括,但不限于任何破囊壺菌目微生物。宿主細胞可為未轉(zhuǎn)化細胞或已轉(zhuǎn)染了至少一種核酸分子的細胞。本發(fā)明所用優(yōu)選宿主細胞包括來自下列屬的微生物包括,但不限于破囊壺菌屬,Labyrinthuloides屬,Japonochytrium屬,和Schizochytrium屬。這些屬中優(yōu)選的種的包括,但不限于任何Schizochytrium種,包括Schizochytriumaggregatum,Schizochytrium limacinum,Schizochytrium zninutum;任何破囊壺菌種(包括前Ulkenia種如U.visurgensis,U.amoeboida,U.sarkariana,U.profunda,U.radiata,U.分鐘uta和Ulkenia sp.BP-5601),并包括Thraustochytrium striatum,Thraustochytrium aureum,Thraustochytrium roseum;和任何Japonochytrium種。特別優(yōu)選破囊壺菌目菌株包括,但不限于Schizochytrium sp.(S31)(ATCC 20888);Schizochytrium sp.(S8)(ATCC20889);Schizochytrium sp.(LC-RM)(ATCC 18915);Schizochytrium sp.(SR21);Schizochytrium aggregatum(Goldstein et Belsky)(ATCC 28209);Schizochytrium limacinum(Honda et Yokochi)(IFO 32693);Thraustochytriumsp.(23B)(ATCC 20891);Thraustochytrium striatum(Schneider)(ATCC 24473);Thraustochytrium aureum(Goldstein)(ATCC 34304);Thraustochytrium roseum(Goldstein)(ATCC 28210);和Japonochytrium sp.(L1)(ATCC 28207)。
根據(jù)本發(fā)明,術(shù)語“轉(zhuǎn)化”用于指將異源核酸分子(即,重組核酸分子)插入微生物細胞,如破囊壺菌目微生物細胞的任何方法。在微生物系統(tǒng)中,術(shù)語“轉(zhuǎn)化”用于描述由于微生物獲得異源核酸所致的遺傳變化,它與術(shù)語“轉(zhuǎn)染”基本同義。適宜的轉(zhuǎn)化技術(shù)包括,但不限于粒子轟擊,電穿孔,顯微注射,脂轉(zhuǎn)染,吸附,感染和原生質(zhì)體融合。
一實施方案中,用本發(fā)明方法產(chǎn)生的蛋白通過在有效產(chǎn)生所述蛋白的條件下培養(yǎng)表達所述蛋白的細胞(即重組破囊壺菌目微生物)來產(chǎn)生。在一些例中,所述蛋白可被回收,并在其他例中,該微生物可被完整收獲或為裂解物形式并用作″生物量(biomass)″。在另一實施方案中,去除或滅活靶基因的方法是,在能發(fā)生細胞內(nèi)重組的有效條件下,培養(yǎng)已用包含本發(fā)明靶向載體的重組分子轉(zhuǎn)化的細胞,從而使靶基因被去除或滅活。優(yōu)選培養(yǎng)細胞為本發(fā)明的重組細胞。有效培養(yǎng)條件包括,但不限于允許蛋白產(chǎn)生和/或重組的有效培養(yǎng)基,生物反應器,溫度,pH和氧氣條件。有效培養(yǎng)基指通常用于培養(yǎng)破囊壺菌目細胞的任何培養(yǎng)基。所述培養(yǎng)基一般包括含水培養(yǎng)基,它具有可同化的碳,氮和磷酸鹽來源,及適合的鹽,礦物質(zhì),金屬離子和其它營養(yǎng)物,如維生素。適宜的培養(yǎng)基和培養(yǎng)條件的實施例見實施例部分的具體討論。適于破囊壺菌目微生物的培養(yǎng)條件也見August 23,1994授予Barclay的美國專利5,340,742;全文引入本文作為參考。本發(fā)明的細胞可在常規(guī)發(fā)酵生物反應器,搖瓶,試管,微滴皿,和培養(yǎng)皿中培養(yǎng)。培養(yǎng)可在適于重組細胞的溫度,pH和氧含量下進行。所述培養(yǎng)條件在本領(lǐng)域技術(shù)人員的專門技術(shù)之內(nèi)。
基于用于產(chǎn)生的載體和宿主系統(tǒng),本發(fā)明所得蛋白可保留在重組細胞內(nèi);被分泌到發(fā)酵培養(yǎng)基中;被分泌到兩個細胞的膜間空間中;或被保留在細胞膜的外表面。術(shù)語″回收所述蛋白″指收集全部包含所述蛋白的完整發(fā)酵培養(yǎng)基并且不需要暗示附加的分離或純化步驟。用本發(fā)明方法產(chǎn)生的蛋白可用各種標準蛋白純化技術(shù)純化,如,但不限于,親和層析,離子交換層析,過濾,電泳,疏水作用層析,凝膠過濾層析反相層析,伴刀豆球蛋白A層析,層析聚焦和差異溶解。用本發(fā)明方法產(chǎn)生的蛋白優(yōu)選以″實質(zhì)純的″形式回收。本文中“實質(zhì)純”指保證所述蛋白作為商業(yè)產(chǎn)品有效應用的純度。
而本發(fā)明的另一實施方案涉及破囊壺菌目的重組微生物,它已用包含編碼本發(fā)明乙酰乳酸合酶的核酸序列的重組核酸分子轉(zhuǎn)化。優(yōu)選,所述乙酰乳酸合酶賦予該微生物對選自下述的化合物降低的敏感性磺酰脲化合物,咪唑啉酮類抑制劑,和嘧啶基羥苯甲酸鹽。用于轉(zhuǎn)化此類微生物的適宜重組核酸分子和序列已在上面詳述。此類微生物還可用其它重組核酸分子轉(zhuǎn)化,包括包含ble基因選擇性標記物和破囊壺菌目轉(zhuǎn)錄控制序列的重組核酸分子,如本文上述。本發(fā)明重組破囊壺菌目微生物見實施例部分敘述。根據(jù)本發(fā)明,本發(fā)明的重組破囊壺菌目微生物用本文所述的重組載體遺傳工程化,以便表達目的蛋白(此類蛋白實例見上述),和/或用本文所述的重組載體遺傳工程化以便定點去除或滅活靶基因。
如本文所用,重組微生物具有用重組技術(shù)從其正常(即野生型或天然)形式經(jīng)過修飾(即突變或改變)的基因組。本發(fā)明的重組微生物可包括下述微生物,該微生物中已插入,去除或修飾(即突變;例如,通過核苷酸的插入,去除,取代,和/或倒位)核酸分子,導致所述修飾在該微生物中提供所需效應。如本文所用,導致基因表達,基因功能,或基因產(chǎn)物(即,由該基因編碼的蛋白)功能降低的遺傳修飾可指基因的失活(完全或部分),缺失,中斷,阻斷或下調(diào)。例如,導致該基因編碼的蛋白質(zhì)的功能下降的基因遺傳修飾可由該基因的完全缺失(即,該基因不存在,且因此該蛋白質(zhì)不存在),導致蛋白質(zhì)不完全翻譯或不翻譯(例如,蛋白質(zhì)不表達)的基因突變,或降低或消除該蛋白的天然功能(即表達降低或無酶活性或作用的蛋白質(zhì))的基因突變引起。導致基因表達或功能增強的遺傳修飾可指基因的擴增,過度表達,激活,增強,增加,或上調(diào)。
根據(jù)本發(fā)明,重組破囊壺菌目微生物可用任何破囊壺菌目微生物產(chǎn)生。優(yōu)選破囊壺菌目的屬包括,但不限于破囊壺菌屬,Labyrinthuloides屬,Japonochytrium屬,和Schizochytrium屬。優(yōu)選這些屬內(nèi)的種包括,但不限于任何Schizochytrium種,包括Schizochytrium aggregatum,Schizochytriumlimacinum;任何破囊壺菌種(包括前Ulkenia種如U.visurgensis,U.amoeboida,U.sarkariana,U.profunda,U.radiata,U.分鐘uta和Ulkenia sp.BP-5601),Thraustochytrium striatum,Thraustochytrium aureum,Thraustochytrium roseum;和任何Japonochytrium種。特別優(yōu)選破囊壺菌目的菌株包括,但不限于Schizochytrium sp.(S31)(ATCC 20888);Schizochytriumsp.(S8)(ATCC 20889);Schizochytrium sp.(LC-RM)(ATCC 18915);Schizochytrium sp.(SR21);Schizochytrium aggregatum(Goldstein et Belsky)(ATCC 28209);Schizochytrium limacinum(Honda et Yokochi)(IFO 32693);Thraustochytrium sp.(23B)(ATCC 20891);Thraustochytrium striatum(Schneider)(ATCC 24473);Thraustochytrium aureum(Goldstein)(ATCC34304);Thraustochytrium roseum(Goldstein)(ATCC 28210);和Japonochytrium sp.(L1)(ATCC 28207)。
下述實施例旨在闡述本發(fā)明,而非限制本發(fā)明的范圍。
實施例實施例1此實施例描述了重組質(zhì)粒pTUBZEO11-2的產(chǎn)生。
重組質(zhì)粒pTUBZEO11-2的構(gòu)建見圖.1和2闡述。
該質(zhì)粒包含來自印度斯坦鏈異壁菌的ble基因,該基因與從Schizochytrium sp.分離的α-微管蛋白基因啟動子功能性偶聯(lián)。此質(zhì)粒如下產(chǎn)生。從Schizochytrium sp.cDNA文庫分離cDNA克隆(CGNE0002-001-B6)并作為大規(guī)模Schizochytrium cDNA測序項目的一部分進行部分測序(SEQID NO1)。該核苷酸序列通過BLASTX同源性搜索確定能編碼α-微管蛋白(Gish,W.and D.States.1993.Nat.Genet.3266-272)。從堿基116到550推斷出的氨基酸序列與來自Pelvetica fastigiata的α-微管蛋白(GenBank序列號U58642)的開始145個氨基酸93%相同。
為分離與此類基因相關(guān)的啟動子,從Schizochytrium sp細胞分離基因組DNA,并用″Genome WalkerTM″試劑盒(Clontech Laboratories,Inc.,Palo Alto,CA)處理,包括限制性內(nèi)切酶酶學消化基因組DNA來生成平端,之后將消化的DNA與試劑盒里提供的特異的雙鏈DNA銜接分子連接。然后用試劑盒里提供的外部銜接引物(AP1)及α-微管蛋白特異性引物PGR20(SEQ IDNO2),用聚合酶鏈式反應(PCR)擴增此α-微管蛋白編碼序列的上游DNA。此類基因的進一步擴增用試劑盒里提供的嵌套銜接引物(AP2)和嵌套α-微管蛋白特異性引物PGR19(SEQ ID NO3)來進行。所得PCR產(chǎn)物被亞克隆到質(zhì)粒pCR2.1-TOPO(Invitrogen Corp.,Carlsbad,CA)。測序亞克隆片段之一;緊接在α-微管蛋白基因起始密碼子前的725bp的序列被命名為SEQ ID NO4。
用基于這種方式獲得的DNA序列的寡核苷酸引物,用TaqDNA聚合酶(Perkin-Elmer Corp.,Norwalk,CT)進行PCR,產(chǎn)生修飾的α-微管蛋白啟動子區(qū),其中NcoI限制性位點被摻入DNA片段的3′末端;該NcoI位點包含與α-微管蛋白編碼區(qū)在同一位置的起始密碼子。用于此反應的引物為PGR33(SEQ ID NO5)和PGR34(SEQ ID NO6),模板為從Schizochytrium sp細胞分離的基因組DNA。應用下述反應條件94℃4分鐘;(94℃1分鐘,54℃45秒,72℃2分鐘)×30;72℃7分鐘。此片段被克隆入質(zhì)粒pCR2.1-TOPO來構(gòu)成質(zhì)粒p7TUB(SEQ ID NO7)。質(zhì)粒p7TUB用NcoI消化,所得包含Schizochytrium α-微管蛋白啟動子區(qū)的463-bp片段通過瓊脂糖凝膠純化來分離。質(zhì)粒pSV40/Zeo(Invitrogen Corp.,Carlsbad,CA)包含來自印度斯坦鏈異壁菌的ble基因,該基因側(cè)翼有SV40啟動子和終止子,該質(zhì)粒也用NcoI消化來產(chǎn)生3201-bp和314-bp片段。所述3201-bp片段經(jīng)瓊脂糖凝膠純化并連接到來自p7TUB的463-bp的NcoI片段,產(chǎn)生pTUBZEO-11(SEQ ID NO8),如圖1所示。
之后,質(zhì)粒pTUBZEO-11用SphI消化,所得的包含ble基因,且側(cè)翼有Schizochytrium α-微管蛋白啟動子和SV40終止子的1122-bp片段經(jīng)瓊脂糖凝膠純化,連接到已用SphI消化而線性化的質(zhì)粒pUC19(Messing,J.1983.Meth.Eiizyniol.10120)。所得質(zhì)粒被命名為pTUBZEO11-2(SEQ ID NO9)并如圖2和4所示。質(zhì)粒pTUBZEO11-2也稱pMON50000。SEQ ID NO9中,Schizochytrium α-微管蛋白啟動子被包含在核苷酸441-894中;ble基因編碼區(qū)被包含在核苷酸核苷酸895-1269中;而SV40終止子被包含在核苷酸核苷酸1270-1524中。
實施例2此實施例描述了重組質(zhì)粒pMON50200,pMON50201,pMON50202,和pMON50203的產(chǎn)生。
以下述方式分離Schizochytrium sp.的天然乙酰乳酸合酶-編碼基因(als)。從Schizochytrium cDNA文庫分離cDNA克隆(LIB81-028-Q1-E1-D9)并作為大規(guī)模Schizochytrium sp.cDNA測序項目的一部分進行部分測序(SEQID NO11)。該核苷酸序列通過BLASTX同源性確定編碼乙酰乳酸合酶(Gish,W.and D.States.1993.Nat.Genet.3266-272);例如,從堿基154到378推斷出的氨基酸序列與來自栗酒裂殖酵母(GenBank Accession No.P36620)的ALS的氨基酸313到387有68%相同。然后獲得此克隆化cDNA的全長序列,它證明該cDNA克隆不包含完整的als編碼區(qū)。為獲得全長als基因,Schizochytrium基因組λ文庫按照標準流程(見例如Sambrook等,MolecularCloneA Laboratory Manual.Cold Spring Harbor Laboratory Press,1989)用372-bp地高辛配基(DIG)-標記的DNA探針(指ALS2探針)來探察。所述ALS2探針用包括DIG-11-UTP(Boehringer Mannheim Biochemicals GmbH,Germany)的核苷酸混合物經(jīng)PCR來產(chǎn)生,其中所用正向引物為PGR38(SEQ ID NO12)和反向引物為PGR39(SEQ ID NO13),它們都基于cDNA克隆LIB81-028-Q1-E1-D9的序列。分離出用ALS2探針鑒定的基因組克隆之一,ALS-4A,進一步用DIG-標記的ALS2探針通過DNA印跡雜交試驗來鑒定。結(jié)果發(fā)現(xiàn)來自AhdI-消化的ALS-4AλDNA的4.9-kbp片段可與ALS2探針雜交。將此片段通過瓊脂糖凝膠純化分離,用T4 DNA聚合酶處理來產(chǎn)生平端,然后連接到SmaI-消化的pBluescriptII KS+(Stratagene Corp.,La Jolla,CA)構(gòu)成質(zhì)粒pMON50200(如圖3-A所示)。pMON50200的序列被命名為SEQ IDNO14。Schizochytrium als基因編碼的乙酰乳酸合酶的序列被命名為SEQ IDNO15。
質(zhì)粒pMON50201,pMON50202和pMON50203(如圖3-B,3-C,和3-D分別所示)用通過定點誘變從質(zhì)粒pMON50200產(chǎn)生,從而編碼的乙酰乳酸合酶不再被某些化合物,包括sulfometuron methyl(SMM)抑制。這些質(zhì)粒被如下構(gòu)建。用所述″Transformer″定點誘變試劑盒(Clontech Laboratories,Inc.,Palo Alto,CA)根據(jù)產(chǎn)生者的說明書將下述突變引入質(zhì)粒pMON50200。在所有三種構(gòu)建體中使用寡核苷酸選擇引物DM19(SEQ ID NO16);此引物導致pMON50200多克隆位點中唯一的EcoRV位點被轉(zhuǎn)變?yōu)锳atII位點。用引物DM14(SEQ ID NO17)將編碼的ALS酶的氨基酸殘基595從色氨酸改變?yōu)槔i氨酸,而同時將AclI位點引入該基因序列;所得質(zhì)粒被稱為pMON50201(SEQ ID NO18)。類似的,用引物DM 15(SEQ ID NO20)將所編碼的ALS酶中的氨基酸殘基192從脯氨酸改變?yōu)楣劝滨0凡sgI位點引入als基因,得到質(zhì)粒pMON50202(SEQ ID NO21)。為構(gòu)建質(zhì)粒pMON50203(SEQ ID NO23),一并使用DM 14和DM 15引物,編碼得到包含上述兩種氨基酸殘基置換的ALS酶。質(zhì)粒pMON50201,pMON50202,和pMON50203編碼的乙酰乳酸合酶突變體的序列被分別命名為SEQ IDNO19,SEQ ID NO22,和SEQ ID NO24。
實施例3此實施例描述了用實施例1和2所述的重組分子對Schizochytrium sp.進行遺傳轉(zhuǎn)化。
此實施例所用的菌株是Schizochytrium sp.N230D,美國典型培養(yǎng)物保藏中心菌株20888(ATCC,Manassas,VA)的衍生物。為進行液體培養(yǎng),細胞在M50-3培養(yǎng)基中在30℃以200-300rpm振搖無菌生長。M50-3培養(yǎng)基包含下列組分NaCl,12.5g;MgSO4-7H2O,2.5g;KCl,0.5g;CaCl2,0.05g;葡萄糖,30g;谷氨酸鈉,3g;KH2PO4,0.4g;酵母提取物,1g;NaHCO3,0.4g;Na2EDTA,30mg;FeCl3-6H2O,1.2mg;H3BO3,34.2mg;ZnSO4-7H2O,0.67mg;CoCl2-6H2O,0.13mg;NaMoO4-2H2O,25μg;CuSO4-5H2O,10μg;NiSO4-6H2O,0.26mg;鹽酸硫胺素,100μg;生物素,0.5μg;氰鈷胺素,0.5μg,和去離子水(加至1升);終pH調(diào)整到7.0。在固體培養(yǎng)基上生長時,細胞在30℃的M50-3培養(yǎng)基或M1E-3培養(yǎng)基中生長,所述培養(yǎng)基中加入1.5%(w/v)瓊脂進行固化。M1E-3培養(yǎng)基包含下列組分葡萄糖,4g;(NH4)2SO4,0.75g;Na2SO4,5g;MgSO4-7H2O,2g;KH2PO4,0.5g;KCl,0.5g;CaCl2-2H2O,0.1g;MOPS緩沖液,20.9g;FeSO4-4H2O,0.3mg;MnCl2-4H2O,0.1mg;ZnSO4-7H2O,80μg;CoCl2-6H2O,2μg;NaMoO4-2H2O,1μg;CuSO4-5H2O,60μg;NiSO4-6H2O,80μg;鹽酸硫胺素,320μg;CA-泛酸鹽,320μg;氰鈷胺素,8μg,和去離子水(加至1升);終pH調(diào)整到7.0。
Schizochytrium sp.對ZeocinTM和SMM的敏感性如下確定在固化的M1E-3培養(yǎng)基中包括各種濃度的這些抑制劑,將細胞鋪板,鋪板密度類似于它們在篩選重組細胞的步驟中出現(xiàn)的密度。
Schizochytrium細胞的遺傳轉(zhuǎn)化通過用Bio-Rad Biolistic PDS-1000/氦粒子傳送系統(tǒng)(Bio-Rad Laboratories,Hercules,CA)通過粒子轟擊(Sanford,J.C.,F(xiàn).D.Smith,和J.A.Russell.1993.Meth.Enzymol.217483509)來完成。Schizochytrium sp.N230D細胞在液體M50-3培養(yǎng)基中生長直到680nm(OD680)的光密度為0.4-0.8(光路長度10mm)。對應于OD6801.0的等分細胞被短暫離心,去除上清液,沉淀的細胞重懸在100μl無菌水中。所述重懸細胞然后在含有經(jīng)瓊脂固化的培養(yǎng)基(例如,M50-3或M1E-3培養(yǎng)基)的Petri皿上涂布4-6cm的環(huán)。并放置30-60分鐘,從而過度的水可被吸收進入固體培養(yǎng)基;這稱為是靶平板。
1.5mg等分的金微載體(0.6μ標稱直徑,來自Bio Rad Laboratories,Inc.,Hercules,CA)用2.5μg轉(zhuǎn)化質(zhì)粒DNA(即質(zhì)粒pTUBZEO11-2,pMON50201,pMON50202,或pMON50203)按產(chǎn)生者的說明書(BiolisticPDS-1000/氦粒子傳送系統(tǒng)說明書手冊;Bio-Rad Laboratories,Hercules,CA)包被。所述細胞用DNA包被的金微載體用下列條件轟擊1100psi爆發(fā)圓盤(burst disk),室真空25″Hg,微載體發(fā)射裝配(assembly)置于頂層架而靶平板置于中層架,爆發(fā)圓盤到停止屏(stopping screen)的距離1.5-2cm而且停止屏到靶的距離約7cm。轟擊后,使細胞在30℃重新覆蓋到靶平板4-6小時。然后細胞用1.5ml無菌水從靶平板漂洗下來,集中在微離心(microfuge)管中,短暫離心,重懸在400μl無菌水中。100μl重懸液被涂布在四個包含150-200μg/ml ZeocinTM(Invitrogen Corp.,Carlbad,CA)或25μg/mL SMM的M1E-3平板上。用含ZeocinTM的平板選擇經(jīng)質(zhì)粒pTUBZEO11-2轉(zhuǎn)化的細胞,用含SMM的平板選擇經(jīng)質(zhì)粒pMON50201,pMON50202,或pMON50203轉(zhuǎn)化的細胞。然后在30℃孵育平板7-10天。然后將耐受選擇性介質(zhì)的菌落敷貼至包含同種選擇試劑的新鮮M1E-3平板上,以便確認抗性。此方法通常導致每輪轟擊生成100-1000個ZeocinTM-抗性株或SMM-抗性株。
實施例4下列實施例闡述了經(jīng)轉(zhuǎn)化的Schizochytrium細胞的PCR分析。
用PCR確認質(zhì)粒序列在耐受選擇試劑ZeocinTM或SMM的假定轉(zhuǎn)化菌株中的存在。是用一次性1μl塑料接種環(huán)從敷貼到瓊脂平板(如實施例3所述)上的抗性菌落取出小量細胞(1-2mm3)上樣,獲得來自假定的轉(zhuǎn)化子和非-重組Schizochytrium N230D細胞的模板DNA。然后將所述細胞重懸在微離心管中15-20μl的1% Triton X-100,置于沸水浴中10分鐘,然后在14,000xg離心5分鐘。用部分提取物(1-3μl)制備模板DNA,以便用25μl TaqDNA聚合酶進行PCR反應。為檢測pTUBZEO11-2序列在Schizochytrium DNA中存在,使用引物DM20(SEQ ID NO25)和DM21(SEQ ID NO26);這些引物與質(zhì)粒pTUBZEO11-2中的ble基因退火并擴增出346-bp的DNA片段。溫度變化如下94℃4分鐘;(94℃45秒,52℃45秒,72℃2分鐘)×30;72℃7分鐘。為檢測pMON50201,pMON50202,或pMON50203序列在SchizochytriumDNA中存在,使用引物BLA1(SEQ ID NO27)和BLA2(SEQ ID NO28);這些引物發(fā)現(xiàn)與載體骨架中的bla(氨芐青霉素-抗性)基因退火并擴增出1229-bp的DNA片段。溫度變化如下94℃4分鐘;(94℃45秒,55℃45秒,72℃2分鐘)×30;72℃7分鐘。PCR產(chǎn)物通過標準瓊脂糖凝膠電泳,之后用溴化乙錠染色分析。
這些分析的結(jié)果確認,絕大部分在這些條件下選擇的菌株為真正包含質(zhì)粒DNA的轉(zhuǎn)化子。當使用來自沒有被轉(zhuǎn)化質(zhì)粒轟擊的對照Schizochytrium spN230D細胞的模板DNA時,沒有產(chǎn)生正確大小的PCR產(chǎn)物。
實施例5下列實施例描述了經(jīng)轉(zhuǎn)化的Schizochytrium細胞的DNA印跡分析。
用從親代Schizochytrium N230D細胞和多個假定的轉(zhuǎn)化子分離的DNA進行DNA雜交印跡,來確認轉(zhuǎn)化載體DNA序列在轉(zhuǎn)化細胞中的存在。DNA印跡法用本領(lǐng)域技術(shù)人員已知技術(shù)(見例如Sambrook等,Molecular CloningA Laboratory Manual.Cold Spring Harbor Laboratory Press.1989)來進行。DNA用″QIAamp″DNA純化試劑盒(Qiagen Inc.,Valencia,CA)分離,用各種限制性酶消化,通過瓊脂糖凝膠(0.8%-1.2%w/v)電泳分離,然后通過堿性毛細管轉(zhuǎn)移法轉(zhuǎn)移到尼龍膜上。
經(jīng)pTUBZEO11-2轉(zhuǎn)化的細胞中的載體DNA用″Genius″DIG-為基礎(chǔ)的系統(tǒng)(Boehringer Mannheim Biochemicals GmbH,Germany)和包括DIG-11-UTP的核苷酸混合物來進行檢測,用346-bp DIG-標記的ble基因片段作雜交探針,該探針是通過用引物DM20(SEQ ID NO25)和DM21(SEQ ID NO26)進行PCR來產(chǎn)生。膜的預雜交在68℃在Genius試劑盒提供的雜交緩沖液中進行1小時。雜交在68℃,在包含94℃熱變性5分鐘的ble基因探針的雜交緩沖液中進行18小時。然后用50ml 2×SSC/0.1%SDS洗膜5分鐘兩次并在50ml 0.1×SSC/0.1%SDS中洗膜15分鐘兩次。按照Genius試劑盒說明書對雜交DNA進行化學發(fā)光法檢測。
來自未經(jīng)-轉(zhuǎn)化的Schizochytrium N230D細胞的DNA不與ble基因探針雜交。相反,來自轉(zhuǎn)化細胞的DNA與如下探針雜交SphI來自轉(zhuǎn)化的Schizochytrium細胞的DNA經(jīng)SphI-消化后包含與ble基因探針雜交的約1100-bp DNA片段;此片段也見于SphI-消化的pTUBZEO11-2 DNA,它表示完整的ble基因表達盒(包括微管蛋白基因啟動子和SV40終止子)。
XhoI對被試的每個轉(zhuǎn)化子,DNA經(jīng)XhoI消化產(chǎn)生大于15-20kbp的雜交片段。XhoI不在pTUBZEO11-2內(nèi)切割,因而這些結(jié)果證明pTUBZEO11-2不作為轉(zhuǎn)化細胞中的染色體外元件存在,而是整合入Schizochytrium染色體。
NcoI或HindIII這些酶都在pTUBZEO11-2中發(fā)生一次切割。用這些酶中的任一種消化轉(zhuǎn)化子DNA通常導致顯著性雜交片段,此片段與線性化pTUBZEO11-2載體(即約3.8kbp)共遷移。這提示所述載體可以以串聯(lián)重復形式整合入染色體。
實施例6此實施例闡述了Schizochytrium中的同源重組。
下述試驗是為闡述同源重組可出現(xiàn)在Schizochytrium中,內(nèi)源天然DNA序列與引入細胞的重組DNA分子中的同源DNA序列之間。此種同源重組對于產(chǎn)生具有所需性質(zhì)的重組菌株很有益。例如,同源重組可用于通過定點插入外源遺傳序列而滅活內(nèi)源基因。另外,同源重組可用于將內(nèi)源基因或其部分置換為此類基因的變更形式,從而使該重組細胞表現(xiàn)新的性質(zhì)。
實驗表明,同源重組出現(xiàn)在用pMON50202轉(zhuǎn)化的Schizochytrium細胞,所述質(zhì)粒在Schizochytrium als基因中包含突變。此突變在als編碼區(qū)的bp位置571引入BsgI位點。在als編碼區(qū)bp位置1324有天然BsgI位點。因而可用,經(jīng)BsgI-消化的Schizochytrium DNA的DNA印跡法辨別天然als基因與重組突變體als基因。為進行這些試驗,經(jīng)PCR制備als-特異的雜交探針,其中用到包括DIG-11-UTP(Boehringer Mannheim BiochemicalsGmbH,Germany)的核苷酸混合物,正向引物PGR28(SEQ ID NO32),反向引物PGR30(SEQ ID NO33),以小量pMON50200作為模板。所得323-bp DIG-標記的雜交探針被稱為ALS1。
來自非-重組Schizochytrium N230D細胞的DNA用BsgI和AhdI分別消化,經(jīng)過瓊脂糖凝膠電泳,轉(zhuǎn)移到尼龍膜上,然后用ALS1探針探測,步驟基本與實施例5所述步驟相同。所述ALS1探針標記BsdI-消化的DNA的1.76-kbp片段和AhdI-消化的DNA的4.9-kbp片段。
來自各種經(jīng)pMON50202轉(zhuǎn)化的重組菌株的DNA經(jīng)BsgI-和AhdI-消化后進行DNA印跡,然后也用ALS1探針探測。一些例中,未出現(xiàn)1.76-kbp的BsgI片段,而0.75-kbp的片段被標記,它對應于pMON50202中的753-bp的BsgI片段。但是,在這些重組菌株中,4.9-kbp的AhdI片段被標記,表明重組子的突變體als基因已通過雙-交換同源重組與天然als基因發(fā)生了重組。
還觀察到單-交換同源重組出現(xiàn)在用pMON50202轉(zhuǎn)化的重組菌株中。在這些例中,1.76-kbp和0.75-kbp的BsgI片段在來自重組菌株的DNA的DNA印跡中都被標記,但4.9-kbp AhdI片段被較大的標記片段代替,這證明完整的pMON50202載體已插入天然als基因,其形式有單拷貝也有串聯(lián)重復。
在Schizochytrium中發(fā)生同源重組的另一證據(jù)是,引入包含截短的als基因突變體的重組DNA分子,使該截短的基因編碼的不完整ALS酶無功能。此截短的基因如下制備用ClaI和HindIII消化pMON50202,產(chǎn)生2.8-kbp片段,從而一并去除als編碼序列的最后388bp連同als終止子區(qū)。將此2.8-kbp片段連接入已用ClaI和HindIII消化的pBluescriptII KS+(StratageneCorp.,La Jolla,CA),產(chǎn)生質(zhì)粒pAR2。如果通過天然als基因和pAR2的截短型als基因突變體之間發(fā)生同源重組,而使有功能的als基因突變體在轉(zhuǎn)化菌株中被挽救,僅可預計質(zhì)粒pAR2在經(jīng)轉(zhuǎn)化的Schizochytrium細胞中賦予對SMM的抗性。將該構(gòu)建體通過粒子轟擊引入Schizochytrium N230D細胞,如實施例3所述分離SMM-抗性菌株。來自轉(zhuǎn)化子的DNA經(jīng)BsgI-消化后按本實施例中前文所述進行DNA印跡分析,結(jié)果證明在這些菌株發(fā)生同源重組;即,1.76-kbp BsgI片段與所述ALS1探針在非重組細胞中雜交,但在pAR2轉(zhuǎn)化的細胞中卻是0.75-kbp的雜交片段。
實施例7此實施例描述了應用轉(zhuǎn)化載體pTUBZEO11-2或pMON50202來經(jīng)共轉(zhuǎn)化產(chǎn)生包含不與選擇性標記物基因連接的附加的外源DNA分子的菌株。
共轉(zhuǎn)化可通過同時引入pTUBZEO11-2和附加的包含所述任一種基因的質(zhì)粒來完成。如實施例3所述,使2.5μg每種質(zhì)粒與金粒子共沉淀。在用質(zhì)粒-包被的金粒子轟擊靶細胞后,在包含ZeocinTM的瓊脂平板上如實施例1所述選出重組菌株。第二種非選擇性質(zhì)粒的存在然后通過PCR分析或DNA印跡雜交確認。通常可獲得很高的共轉(zhuǎn)化頻率(例如,50-90%)。例如,將包含Caenorhabditus elegans fat-1基因的質(zhì)粒pTR202(Spychalla等.,1997.Proc.Natl.Acad.Sci.U.S.A.94,1142-1147)與Schizochytrium微管蛋白基因啟動子和終止子連接,按照本實施例提供的方法引入,PCR表明約68%的所得ZeocinTM抗性菌株包含fat-1基因(見表1)。當引入pMON50202與附加的質(zhì)粒之后,在包含SMM的固體培養(yǎng)基上選擇轉(zhuǎn)化細胞時可觀察到類似結(jié)果。此共轉(zhuǎn)化方法可用于引入任何所需的外源DNA。
表1.用選擇性標記物質(zhì)粒pTubZeo 11-2和包含各種fad基因的質(zhì)粒共轉(zhuǎn)化的有效性。用PCR篩選ZeocinR抗性轉(zhuǎn)化子的fad DNA序列。
這些實施例敘述的轉(zhuǎn)化系統(tǒng)代表了遺傳操縱Schizochytrium的能力的顯著性進步,這種菌種是已知用于發(fā)酵產(chǎn)生脂質(zhì)-為基礎(chǔ)的化合物的最有產(chǎn)生力的生物。兩種獨立的轉(zhuǎn)化系統(tǒng)的出現(xiàn),以及較高的共轉(zhuǎn)化有效性可在工程菌株中堆積多種性質(zhì)。而且,同源重組在此藻類的明顯存在可開發(fā)基因剔除方法,以便鑒定未知基因的功能并去除產(chǎn)生菌株中的不需要的性質(zhì)。本發(fā)明人現(xiàn)用這些系統(tǒng)改變Schizochytrium的脂肪酸代謝,并在探索利用此物種和相關(guān)微藻(例如,破囊壺菌)產(chǎn)生類胡蘿卜素,固醇,和其它脂類化合物的可能性。
盡管本發(fā)明的各種實施方案已被詳述,但對于本領(lǐng)域技術(shù)人員而言,針對那些實施方案進行修飾和改編是顯而易見的。然而可清楚理解的是,所述修飾和改編如下面權(quán)利要求書所提出的那樣,都是在本發(fā)明的范圍內(nèi)。
序列表<110>馬泰克生物科學公司(Martek Biosciences Corporation)<120>轉(zhuǎn)化破囊壺菌微生物的產(chǎn)物和方法<130>2997-23-PCT<150>60/284,116<151>2001-04-16<160>35<170>PatentIn version 3.1<210>1<211>551<212>DNA<213>Schizochytrium sp.
<220>
<221>misc_feature<222>(520)..(520)<223>n=a,c,g,or t<220>
<221>misc_feature<222>(541)..(541)<223>n=a,c,g,or t<400>1gtcgtgccta acaacacgcc gttctacccc gccttcttcg cgccccttcg cgtccaagca 60tccttcaagt ttatctctct agttcaactt caagaagaac aacaccacca acaagatgcg120tgaggtcatc tccatccaca tcggccaggc cggtgttcag gtcggtaacg cctgctggga180gctctactgc ctcgagcatg gcatccagcc ggacggccag atgccctcgg acaagaccat240tggcggcggc gatgatgcct tcaacacctt cttctccgag actggcgccg gcaagcacgt300gccccgcgcc gtgctcgtcg atctcgagcc caccgtctgt gacgaggtcc gcaccggcac360ctaccgcgct ctttaccacc ccgagcagat catcaccggc aaggaggacg ctgccaacaa420ctacgctcgt ggccactaca ccatcggcaa ggagatcgtc gacctcgtcc tcgaccgcat480ccgcaagctc gccgacaact gcactggtct tcagggcttn ctctgcttca acgccgtcgg540nggtggtacc g 551<210>2<211>27<212>DNA<213>Schizochytrium sp.
<400>2gcgccagtct cggagaagaa ggtgttg27<210>3<211>27<212>DNA<213>Schizochytrium sp.
<400>3agctcccagc aggcgttacc gacctga27
<210>4<211>725<212>DNA<213>Schizochytrium sp.
<400>4gagacgtgct tcgcaagacc gctgtgctcg cgccgcacgc tctgtgtgtt acattaattt 60ttttgtagat gaagtttctc tattctctcg aaattctgta gaatgttata gtctcttcac120tcccgtgatt ggagaggatt cttgcttgtt ccctcccgcc cgggtagcgc ttggagcaac180gcttgagcgc gcgctcgaaa gcggacggcg caacgagccg tttcacgccg cgctgtccaa240gtcccatttt tctccttacc ccatggccgt tgcatgccaa ttttaggccc cccactgacc300gaggtctgtc gataatccac ttttccattg atcttccagg tttcgttaac tcatgccact360gagcaaaact tcggtctttc ctaacaaaag ctctcctcac aaagcatggc gcggcaacgg420acgtgtcctc atactccact gccacacaag gtcgataaac taagctcctc acaaatagag480gagaattcca ctgacaactg aaaacaatgt atgagagacg atcaccactg gagcggcgcg540gcggttgggc gcggaggtcg gcagcaaaaa caagcgactc gccgagcaaa cccgaatcag600ccttcagacg gtcgtgccta acaacacgcc gttctacccc gccttcttcg cgccccttcg660cgtccaagca tccttcaagt ttatctctct agttcaactt caagaagaac aacaccacca720acaag725<210>5<211>24<212>DNA<213>Schizochytrium sp.
<400>5cacccatggt gttggtggtg ttgt24<210>6<211>24<212>DNA<213>Schizochytrium sp.
<400>6aaactcgaga cgtgcttcgc aaga24<210>7<211>4646<212>DNA<213>Schizochytrium sp.
<400>7aaactcgaga cgtgcttcgc aagaccgctg tgctcgcgcc gcacgctctg tgtgttacat 60taattttttt gtagatgaag tttctctatt ctctcgaaat tctgtagaat gttatagtct 120cttcactccc gtgattggag aggattcttg cttgttccct cccgcccggg tagcgcttgg 180agcaacgctt gagcgcgcgc tcgaaagcgg acggcgcaac gagccgtttc acgccgcgct 240gtccaagtcc catttttctc cttaccccat ggccgttgca tgccaatttt aggcccccca 300ctgaccgagg tctgtcgata atccactttt ccattgatct tccaggtttc gttaactcat 360gccactgagc aaaacttcgg tctttcctaa caaaagctct cctcacaaag catggcgcgg 420caacggacgt gtcctcatac tccactgcca cacaaggtcg ataaactaag ctcctcacaa 480atagaggaga attccactga caactgaaaa caatgtatga gagacgatca ccactggagc 540ggcgcggcgg ttgggcgcgg aggtcggcag caaaaacaag cgactcgccg agcaaacccg 600aatcagcctt cagacggtcg tgcctaacaa cacgccgttc taccccgcct tcttcgcgcc 660ccttcgcgtc caagcatcct tcaagtttat ctctctagtt caacttcaag aagaacaaca 720ccaccaacac catgggtgaa gggcgaattc tgcagatatc catcacactg gcggccgctc 780gagcatgcat ctagagggcc caattcgccc tatagtgagt cgtattacaa ttcactggcc 840gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccaacttaa tcgccttgca 900gcacatcccc ctttcgccag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc 960caacagttgc gcagcctgaa tggcgaatgg gacgcgccct gtagcggcgc attaagcgcg1020
gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct agcgcccgct1080cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg tcaagctcta1140aatcgggggc tccctttagg gttccgattt agagctttac ggcacctcga ccgcaaaaaa1200cttgatttgg gtgatggttc acgtagtggg ccatcgccct gatagacggt ttttcgccct1260ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg aacaacactc1320aaccctatcg cggtctattc ttttgattta taagggattt tgccgatttc ggcctattgg1380ttaaaaaatg agctgattta acaaattcag ggcgcaaggg ctgctaaagg aaccggaaca1440cgtagaaagc cagtccgcag aaacggtgct gaccccggat gaatgtcagc tactgggctal500tctggacaag ggaaaacgca agcgcaaaga gaaagcaggt agcttgcagt gggcttacat1560ggcgatagct agactgggcg gttttatgga cagcaagcga accggaattg ccagctgggg1620cgccctctgg taaggttggg aagccctgca aagtaaactg gatggctttc ttgccgccaa1680ggatctgatg gcgcagggga tcaagatctg atcaagagac aggatgagga tcgtttcgca1740tgattgaaca agatggattg cacgcaggtt ctccggccgc ttgggtggag aggctattcg1800gctatgactg ggcacaacag acaatcggct gctctgatgc cgccgtgttc cggctgtcag1860cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc cggtgccctg aatgaactgc1920aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc gcagctgtgc1980tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg ccggggcagg2040atctcctgtc atctcgcctt gctcctgccg agaaagtatc catcatggct gatgcaatgc2100ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg aaacatcgca2160tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat ctggacgaag2220agcatcaggg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc atgcccgacg2280gcgaggatct cgtcgtgatc catggcgatg cctgcttgcc gaatatcatg gtggaaaatg2340gccgcttttc tggattcaac gactgtggcc ggctgggtgt ggcggaccgc tatcaggaca2400tagcgttgga tacccgtgat attgctgaag agcttggcgg cgaatgggct gaccgcttcc2460tcgtgcttta cggtatcgcc gctcccgatt cgcagcgcat cgccttctat cgccttcttg2520acgagttctt ctgaattgaa aaaggaagag tatgagtatt caacatttcc gtgtcgccct2580tattcccttt tttgcggcat tttgccttcc tgtttttgct cacccagaaa cgctggtgaa2640agtaaaagat gctgaagatc agttgggtgc acgagtgggt tacatcgaac tggatctcaa2700cagcggtaag atccttgaga gttttcgccc cgaagaacgt tttccaatga tgagcacttt2760taaagttctg ctatgtcata cactattatc ccgtattgac gccgggcaag agcaactcgg2820tcgccgggcg cggtattctc agaatgactt ggttgagtac tcaccagtca cagaaaagca2880tcttacggat ggcatgacag taagagaatt atgcagtgct gccataacca tgagtgataa2940cactgcggcc aacttacttc tgacaacgat cggaggaccg aaggagctaa ccgctttttt3000gcacaacatg ggggatcatg taactcgcct tgatcgttgg gaaccggagc tgaatgaagc3060cataccaaac gacgagagtg acaccacgat gcctgtagca atgccaacaa cgttgcgcaa3120actattaact ggcgaactac ttactctagc ttcccggcaa caattaatag actggatgga3180ggcggataaa gttgcaggac cacttctgcg ctcggccctt ccggctggct ggtttattgc3240tgataaatct ggagccggtg agcgtgggtc tcgcggtatc attgcagcac tggggccaga3300tggtaagccc tcccgtatcg tagttatcta cacgacgggg agtcaggcaa ctatggatga3360acgaaataga cagatcgctg agataggtgc ctcactgatt aagcattggt aactgtcaga3420ccaagtttac tcatatatac tttagattga tttaaaactt catttttaat ttaaaaggat3480ctaggtgaag atcctttttg ataatctcat gaccaaaatc ccttaacgtg agttttcgtt3540ccactgagcg tcagaccccg tagaaaagat caaaggatct tcttgagatc ctttttttct3600gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc3660ggatcaagag ctaccaactc tttttccgaa ggtaactggc ttcagcagag cgcagatacc3720aaatactgtc cttctagtgt agccgtagtt aggccaccac ttcaagaact ctgtagcacc3780gcctacatac ctcgctctgc taatcctgtt accagtggct gctgccagtg gcgataagtc3840gtgtcttacc gggttggact caagacgata gttaccggat aaggcgcagc ggtcgggctg3900aacggggggt tcgtgcacac agcccagctt ggagcgaacg acctacaccg aactgagata3960cctacagcgt gagcattgag aaagcgccac gcttcccgaa gggagaaagg cggacaggta4020tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg gagcttccag ggggaaacgc4080ctggtatctt tatagtcctg tcgggtttcg ccacctctga cttgagcgtc gatttttgtg4140atgctcgtca ggggggcgga gcctatggaa aaacgccagc aacgcggcct ttttacggtt4200cctggccttt tgctggcctt ttgctcacat gttctttcct gcgttatccc ctgattctgt4260ggataaccgt attaccgcct ttgagtgagc tgataccgct cgccgcagcc gaacgaccga4320gcgcagcgag tcagtgagcg aggaagcgga agagcgccca atacgcaaac cgcctctccc4380cgcgcgttgg ccgattcatt aatgcagctg gcacgacagg tttcccgact ggaaagcggg4440cagtgagcgc aacgcaatta atgtgagtta gctcactcat taggcacccc aggctttaca4500ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc ggataacaat ttcacacagg4560
aaacagctat gaccatgatt acgccaagct tggtaccgag ctcggatcca ctagtaacgg4620ccgccagtgt gctggaattc gccctt 4646<210>8<211>3664<212>DNA<213>Schizochytrium sp.
<400>8ccatggccgt tgcatgccaa ttttaggccc cccactgacc gaggtctgtc gataatccac 60ttttccattg atcttccagg tttcgttaac tcatgccact gagcaaaact tcggtctttc 120ctaacaaaag ctctcctcac aaagcatggc gcggcaacgg acgtgtcctc atactccact 180gccacacaag gtcgataaac taagctcctc acaaatagag gagaattcca ctgacaactg 240aaaacaatgt atgagagacg atcaccactg gagcggcgcg gcggttgggc gcggaggtcg 300gcagcaaaaa caagcgactc gccgagcaaa cccgaatcag ccttcagacg gtcgtgccta 360acaacacgcc gttctacccc gccttcttcg cgccccttcg cgtccaagca tccttcaagt 420ttatctctct agttcaactt caagaagaac aacaccacca acaccatggc caagttgacc 480agtgccgttc cggtgctcac cgcgcgcgac gtcgccggag cggtcgagtt ctggaccgac 540cggctcgggt tctcccggga cttcgtggag gacgacttcg ccggtgtggt ccgggacgac 600gtgaccctgt tcatcagcgc ggtccaggac caggtggtgc cggacaacac cctggcctgg 660gtgtgggtgc gcggcctgga cgagctgtac gccgagtggt cggaggtcgt gtccacgaac 720ttccgggacg cctccgggcc ggccatgacc gagatcggcg agcagccgtg ggggcgggag 780ttcgccctgc gcgacccggc cggcaactgc gtgcacttcg tggccgagga gcaggactga 840cacgtgctac gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc 900gttttccggg acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc 960gcccacccca acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca1020aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc1080aatgtatctt atcatgtctg aattcccggg gatcctctag agtcgacctg caggcatgca1140agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa1200cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc1260accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcct gatgcggtat1320tttctcctta cgcatctgtg cggtatttca caccgcatat atggtgcact ctcagtacaa1380tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc1440cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga1500gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg1560tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg1620gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa1680atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga1740agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc1800ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg1860gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc1920gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat1980tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg2040acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag2100aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa2160cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc2220gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca2280cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc2340tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc2400tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg2460ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta2520tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag2580gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga2640ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc2700tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa2760agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa2820aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc2880cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt2940agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc3000
tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac3060gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca3120gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcat tgagaaagcg3180ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag3240gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt3300ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat3360ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc3420acatgtgtgc tgggcccagc cggccagatc tgagctcgcg gccgcgatat cgctagctcg3480aggcaggcag aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt3540ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca3600tagtcccgcc cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc3660cgcc 3664<210>9<211>3808<212>DNA<213>Artificial Seguence<220>
<223>Schizochytrium sp.and Streptoalloteichus hindustanus<220>
<221>promoter<222>(441)..(894)<223>
<220>
<221>CDS<222>(895)..(1269)<223>
<220>
<221>terminator<222>(1270)..(1524)<223>
<400>9tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg120ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc180accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc240attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat300tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt360tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccggggat420cctctagagt cgacctgcag gcatgccaat tttaggcccc ccactgaccg aggtctgtcg480ataatccact tttccattga ttttccaggt ttcgttaact catgccactg agcaaaactt540cggtctttcc taacaaaagc tctcctcaca aagcatggcg cggcaacgga cgtgtcctca600tactccactg ccacacaagg tcgataaact aagctcctca caaatagagg agaattccac660tgacaactga aaacaatgta tgagagacga tcaccactgg agcggcgcgg cggttgggcg720cggaggtcgg cagcaaaaac aagcgactcg ccgagcaaac ccgaatcagc cttcagacgg780tcgtgcctaa caacacgccg ttctaccccg ccttcttcgc gccccttcgc gtccaagcat840ccttcaagtt tatctctcta gttcaacttc aagaagaaca acaccaccaa cacc atg 897Met1gcc aag ttg acc agt gcc gtt ccg gtg ctc acc gcg cgc gac gtc gcc 945Ala Lys Leu Thr Ser Ala Val Pro Val Leu Thr Ala Arg Asp Val Ala5 10 15gga gcg gtc gag ttc tgg acc gac cgg ctc ggg ttc tcc cgg gac ttc 993Gly Ala Val Glu Phe Trp Thr Asp Arg Leu Gly Phe Ser Arg Asp Phe20 25 30
gtg gag gac gac ttc gcc ggt gtg gtc cgg gac gac gtg acc ctg ttc 1041Val Glu Asp Asp Phe Ala Gly Val Val Arg Asp Asp Val Thr Leu phe35 40 45atc agc gcg gtc cag gac cag gtg gtg ccg gac aac acc ctg gcc tgg 1089Ile Ser Ala Val Gln Asp Gln Val Val Pro Asp Asn Thr Leu Ala Trp50 55 60 65gtg tgg gtg cgc ggc ctg gac gag ctg tac gcc gag tgg tcg gag gtc 1137Val Trp Val Arg Gly Leu Asp Glu Leu Tyr Ala Glu Trp Ser Glu Val70 75 80gtg tcc acg aac ttc cgg gac gcc tcc ggg ccg gcc atg acc gag atc 1185Val Ser Thr Asn Phe Arg Asp Ala Ser Gly Pro Ala Met Thr Glu Ile85 90 95ggc gag cag ccg tgg ggg cgg gag ttc gcc ctg cgc gac ccg gcc ggc 1233Gly Glu Gln Pro Trp Gly Arg Glu Phe Ala Leu Arg Asp Pro Ala Gly100 105 110aac tgc gtg cac ttc gtg gcc gag gag cag gac tga cacgtgctac 1279Asn Cys Val His Phe Val Ala Glu Glu Gln Asp115 120gagatttcga ttccaccgcc gccttctatg aaaggttggg cttcggaatc gttttccggg1339acgccggctg gatgatcctc cagcgcgggg atctcatgct ggagttcttc gcccacccca1399acttgtttat tgcagcttat aatggttaca aataaagcaa tagcatcaca aatttcacaa1459ataaagcatt tttttcactg cattctagtt gtggtttgtc caaactcatc aatgtatctt1519atcatgtctg aattcccggg gatcctctag agtcgacctg caggcatgca agcttggcgt1579aatcatggtc atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca1639tacgagccgg aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat1699taattgcgtt gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt1759aatgaatcgg ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct1819cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa1879aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa1939aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc1999tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga2059caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc2119cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt2179ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct2239gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg2299agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta2359gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct2419acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa2479gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt2539gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta2599cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat2659caaaaaggat cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa2719gtatatatga gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct2779cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta2839cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct2899caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg2959gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa3019gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt3079cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta3139catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca3199gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta3259ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct3319gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg3379cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac3439tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact3499gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa3559atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt3619ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat3679gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg3739
acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc3799cctttcgtc3808<210>10<211>124<212>PRT<213>Artificial Seguence<220>
<223>Schizochytrium sp.and Streptoalloteichus hindustanus<400>10Met Ala Lys Leu Thr Ser Ala Val Pro Val Leu Thr Ala Arg Asp Val1 5 10 15Ala Gly Ala Val Glu Phe Trp Thr Asp Arg Leu Gly Phe Ser Arg Asp20 25 30Phe Val Glu Asp Asp Phe Ala Gly Val Val Arg Asp Asp Val Thr Leu35 40 45Phe Ile Ser Ala Val Gln Asp Gln Val Val Pro Asp Asn Thr Leu Ala50 55 60Trp Val Trp Val Arg Gly Leu Asp Glu Leu Tyr Ala Glu Trp Ser Glu65 70 75 80Val Val Ser Thr Asn Phe Arg Asp Ala Ser Gly Pro Ala Met Thr Glu85 90 95Ile Gly Glu Gln Pro Trp Gly Arg Glu Phe Ala Leu Arg Asp Pro Ala100 105 110Gly Asn Cys Val His Phe Val Ala Glu Glu Gln Asp115 120<210>11<211>1416<212>DNA<213>Schizochytrium sp.
<400>11gcaaaaggtc gagcttttcc acaaggagcg cattggcgct cctggcacgg ccgacttcaa 60gctcattgcc gagatgatca accgtgcgga gcgacccgtc atctatgctg gccagggtgt 120catgcagagc ccgttgaatg gcccggctgt gctcaaggag ttcgcggaga aggccaacat 180tcccgtgacc accaccatgc agggtctcgg cggctttgac gagcgtagtc ccctctccct 240caagatgctc ggcatgcacg gctctgccta cgccaactac tcgatgcaga acgccgatct 300tatcctggcg ctcggtgccc gctttgatga tcgtgtgacg ggccgcgttg acgcctttgc 360tccggaggct cgccgtgccg agcgcgaggg ccgcggtggc atcgttcact ttgagatttc 420ccccaagaac ctccacaagg tcgtccagcc caccgtcgcg gtcctcggcg acgtggtcga 480gaacctcgcc aacgtcacgc cccacgtgca gcgccaggag cgcgagccgt ggtttgcgca 540gatcgccgat tggaaggaga agcacccttt tctgctcgag tctgttgatt cggacgacaa 600ggttctcaag ccgcagcagg tcctcacgga gcttaacaag cagattctcg agattcagga 660gaaggacgcc gaccaggagg tctacatcac cacgggcgtc ggaagccacc agatgcaggc 720agcgcagttc cttacctgga ccaagccgcg ccagtggatc tcctcgggtg gcgccggcac 780tatgggctac ggccttccct cggccattgg cgccaagatt gccaagcccg atgctattgt 840tattgacatc gatggtgatg cttcttattc gatgaccggt atggaattga tcacagcagc 900cgaattcaag gttggcgtga agattcttct tttgcagaac aactttcagg gcatggtcaa 960gaactggcag gatctctttt acgacaagcg ctactcgggc accgccatgt tcaacccgcg1020cttcgacaag gtcgccgatg cgatgcgtgc caagggtctc tactgcgcga aacagtcgga1080
gctcaaggac aagatcaagg agtttctcga gtacgatgag ggtcccgtcc tcctcgaggt1140tttcgtggac aaggacacgc tcgtcttgcc catggtcccc gctggctttc cgctccacga1200gatggtcctc gagcctccta agcccaagga cgcctaagtt cttttttcca tggcgggcga1260gcgagcgagc gcgcgagcgc gcaagtgcgc aagcgccttg ccttgctttg cttcgcttcg1320ctttgctttg cttcacacaa cctaagtatg aattcaagtt ttcttgcttg tcggcgaaaa1380aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1416<210>12<211>20<212>DNA<213>Schizochytrium sp.
<400>12ggatctcttt tacgacaagc 20<210>13<211>18<212>DNA<213>Schizochytrium sp.
<400>13ggttgtgtga agcaaagc 18<210>14<211>7847<212>DNA<213>Schizochytrium sp.
<220>
<221>prim_transcript<222>(1)..(1259)<223>
<220>
<221>CDS<222>(1260)..(3314)<223>
<220>
<221>prim_transcript<222>(3315)..(4887)<223>
<400>14ttgtcgacag caacttgcaa gttatacgcg accaccaggc aatctcagca cgcccagcga 60gcacggagct tgcgaagagg gtttacaagt cgtcgttcat tcgctctcaa gctttgcctc120aacgcaacta ggcccaggcc tactttcact gtgtcttgtc ttgcctttca caccgaccga180gtgtgcacaa ccgtgttttg cacaaagcgc aagatgctca ctcgactgtg aagaaaggtt240gcgcgcaagc gactgcgact gcgaggatga ggatgactgg cagcctgttc aaaaactgaa300aatccgcgat gggtcagtgc cattcgcgca tgacgcctgc gagagacaag ttaactcgtg360tcactggcat gtcctagcat ctttacgcga gcaaaattca atcgctttat tttttcagtt420tcgtaacctt ctcgcaaccg cgaatcgccg tttcagcctg actaatctgc agctgcgtgg480cactgtcagt cagtcagtca gtcgtgcgcg ctgttccagc accgaggtcg cgcgtcgccg540cgcctggacc gctgctgcta ctgctagtgg cacggcaggt aggagcttgt tgccggaaca600ccagcagccg ccagtcgacg ccagccaggg gaaagtccgg cgtcgaaggg agaggaaggc660ggcgtgtgca aactaacgtt gaccactggc gcccgccgac acgagcagga agcaggcagc720tgcagagcgc agcgcgcaag tgcagaatgc gcgaaagatc cacttgcgcg cggcgggcgc780gcacttgcgg gcgcggcgcg gaacagtgcg gaaaggagcg gtgcagacgg cgcgcagtga840cagtgggcgc aaagccgcgc agtaagcagc ggcggggaac ggtatacgca gtgccgcggg900
ccgccgcaca cagaagtata cgcgggccga agtggggcgt cgcgcgcggg aagtgcggaa 960tggcgggcaa ggaaaggagg agacggaaag agggcgggaa agagagagag agagagtgaa1020aaaagaaaga aagaaagaaa gaaagaaaga aagctcggag ccacgccgcg gggagagaga1080gaaatgaaag cacggcacgg caaagcaaag caaagcagac ccagccagac ccagccgagg1140gaggagcgcg cgcaggaccc gcgcggcgag cgagcgagca cggcgcgcga gcgagcgagc1200gagcgagcgc gcgagcgagc aaggcttgct gcgagcgatc gagcgagcga gcgggaagg 1259atg agc gcg acc cgc gcg gcg acg agg aca gcg gcg gcg ctg tcc tcg 1307Met Ser A1a Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15gcg ctg acg acg cct gta aag cag cag cag cag cag cag ctg cgc gta 1355Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30ggc gcg gcg tcg gca cgg ctg gcg gcc gcg gcg ttc tcg tcc ggc acg 1403Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45ggc gga gac gcg gcc aag aag gcg gcc gcg gcg agg gcg ttc tcc acg 1451Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60gga cgc ggc ccc aac gcg aca cgc gag aag agc tcg ctg gcc acg gtc 1499Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80cag gcg gcg acg gac gat gcg cgc ttc gtc ggc ctg acc ggc gcc caa 1547Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95atc ttt cat gag ctc atg cgc gag cac cag gtg gac acc atc ttt ggc 1595Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110tac cct ggc ggc gcc att ctg ccc gtt ttt gat gcc att ttt gag agt 1643Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125gac gcc ttc aag ttc att ctc gct cgc cac gag cag ggc gcc ggc cac 1691Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140atg gcc gag ggc tac gcg cgc gcc acg ggc aag ccc ggc gtt gtc ctc 1739Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160gtc acc tcg ggc cct gga gcc acc aac acc atc acc ccg atc atg gat 1787Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175gct tac atg gac ggt acg ccg ctg ctc gtg ttc acc ggc cag gtg ccc 1835Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro180 185 190acc tct gct gtc ggc acg gac gct ttc cag gag tgt gac att gtt ggc 1883Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205atc agc cgc gcg tgc acc aag tgg aac gtc atg gtc aag gac gtg aag 1931Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220gag ctc ccg cgc cgc atc aat gag gcc ttt gag att gcc atg agc ggc 1979Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240cgc ccg ggt ccc gtg ctc gtc gat ctt cct aag gat gtg acc gcc gtt 2027Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255gag ctc aag gaa atg ccc gac agc tcc ccc cag gtt gct gtg cgc cag 2075Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270aag caa aag gtc gag ctt ttc cac aag gag cgc att ggc gct cct ggc 2123Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly
275 280 285acg gcc gac ttc aag ctc att gcc gag atg atc aac cgt gcg gag cga 2171Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300ccc gtc atc tat gct ggc cag ggt gtc atg cag agc ccg ttg aat ggc 2219Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320ccg gct gtg ctc aag gag ttc gcg gag aag gcc aac att ccc gtg acc 2267Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335acc acc atg cag ggt ctc ggc ggc ttt gac gag cgt agt ccc ctc tcc 2315Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350ctc aag atg ctc ggc atg cac ggc tct gcc tac gcc aac tac tcg atg 2363Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365cag aac gcc gat ctt atc ctg gcg ctc ggt gcc cgc ttt gat gat cgt 2411Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380gtg acg ggc cgc gtt gac gcc ttt gct ccg gag gct cgc cgt gcc gag 2459Val Tnr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400cgc gag ggc cgc ggt ggc atc gtt cac ttt gag att tcc ccc aag aac 2507Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415ctc cac aag gtc gtc cag ccc acc gtc gcg gtc ctc ggc gac gtg gtc 2555Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430gag aac ctc gcc aac gtc acg ccc cac gtg cag cgc cag gag cgc gag 2603Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445ccg tgg ttt gcg cag atc gcc gat tgg aag gag aag cac cct ttt ctg 2651Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460ctc gag tct gtt gat tcg gac gac aag gtt ctc aag ccg cag cag gtc 2699Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480ctc acg gag ctt aac aag cag att ctc gag att cag gag aag gac gcc 2747Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495gac cag gag gtc tac atc acc acg ggc gtc gga agc cac cag atg cag 2795Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510gca gcg cag ttc ctt acc tgg acc aag ccg cgc cag tgg atc tcc tcg 2843Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525ggt ggc gcc ggc act atg ggc tac ggc ctt ccc tcg gcc att ggc gcc 2891Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540aag att gcc aag ccc gat gct att gtt att gac atc gat ggt gat gct 2939Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560tct tat tcg atg acc ggt atg gaa ttg atc aca gca gcc gaa ttc aag 2987Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575gtt ggc gtg aag att ctt ctt ttg cag aac aac ttt cag ggc atg gtc 3035Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590aag aac tgg cag gat ctc ttt tac gac aag cgc tac tcg ggc acc gcc 3083
Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605atg ttc aac ccg cgc ttc gac aag gtc gcc gat gcg atg cgt gcc aag 3131Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620ggt ctc tac tgc gcg aaa cag tcg gag ctc aag gac aag atc aag gag 3179Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640ttt ctc gag tac gat gag ggt ccc gtc ctc ctc gag gtt ttc gtg gac 3227Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655aag gac acg ctc gtc ttg ccc atg gtc ccc gct ggc ttt ccg ctc cac 3275Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670gag atg gtc ctc gag cct cct aag ccc aag gac gcc taa gttctttttt 3324Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680ccatggcggg cgagcgagcg agcgcgcgag cgcgcaagtg cgcaagcgcc ttgccttgct3384ttgcttcgct tcgctttgct ttgcttcaca caacctaagt atgaattcaa gttttcttgc3444ttgtcggcga tgcctgcctg ccaaccagcc agccatccgg ccggccgtcc ttgacgcctt3504cgcttccggc gcggccatcg attcaattca cccatccgat acgttccgcc ccctcacgtc3504cgtctgcgca cgacccctgc acgaccacgc caaggccaac gcgccgctca gctcagcttg3624tcgacgagtc gcacgtcaca tatctcagat gcatttggac tgtgagtgtt attatgccac3684tagcacgcaa cgatcttcgg ggtcctcgct cattgcatcc gttcgggccc tgcaggcgtg3744gacgcgagtc gccgccgaga cgctgcagca ggccgctccg acgcgagggc tcgagctcgc3804cgcgcccgcg cgatgtctgc ctggcgccga ctgatctctg gagcgcaagg aagacacggc3864gacgcgagga ggaccgaaga gagacgctgg ggtatgcagg atatacccgg ggcgggacat3924tcgttccgca tacactcccc cattcgagct tgctcgtcct tggcagagcc gagcgcgaac3984ggttccgaac gcggcaagga ttttggctct ggtgggtgga ctccgatcga ggcgcaggtt4044ctccgcaggt tctcgcaggc cggcagtggt cgttagaaat agggagtgcc ggagtcttga4104cgcgccttag ctcactctcc gcccacgcgc gcatcgccgc catgccgccg tcccgtctgt4164cgctgcgctg gccgcgaccg gctgcgccag agtacgacag tgggacagag ctcgaggcga4224cgcgaatcgc tcgggttgta agggtttcaa gggtcgggcg tcgtcgcgtg ccaaagtgaa4284aatagtaggg gggggggggg gtacccaccc cgggcaggtt ctcctcgcca gcctaagtgc4344ctaagggagc gtaggggttt cgttgaccag agaagcggag aacctgccgc ggcgcggaga4404acctatcggc ggagaacttg ccaggcgcga ggcagttctc caatttgcgg acagcggcgc4464gcccacgcga ggcggccgcg tggcgataca gcgaggcgac cgcgcggggc cgcgtggcga4524cacagctgcg cgcggagtcg gctgcgagaa ggcttctcgc tggcttggtt ggggtcgcgg4584gtggcagggg atggatgccc aggtacgtcg gcgtgcgcgc gcccagggag aaaaggacag4644acgcgcgggc ctgcgatgcg agcacgcgat gcgagcacgc gatgcgagca cgcgatgcga4704gcacgcgagc gagcgcccga gcaaatgcca cggaacacgc gttttttgtt tggtgatttc4764tatgtatgcg gggagacttc gatggccgaa aggggtgcaa ggccaaaaga tgctgacagc4824ttcgatcggt ctacggcgcg agcaggaaag ggagcaaggg gcggaattct tctgccttga4884cccgggggat ccactagttc tagagcggcc gccaccgcgg tggagctcca attcgcccta4944tagtgagtcg tattacgcgc gctcactggc cgtcgtttta caacgtcgtg actgggaaaa5004ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa5064tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg5124ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac5184cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc5244cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt5304tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg5364gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag5424tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt5484ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt5544taacgcgaat tttaacaaaa tattaacgct tacaatttag gtggcacttt tcggggaaat5604gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg5664agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa5724catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac5784ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac5844
atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt5904ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc5964gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca6024ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc6084ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag6144gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa6204ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg6264gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa6324ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg6384gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt6444gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt6504caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag6564cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat6624ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct6684taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct6744tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca6804gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc6864agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc6924aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct6984gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gscgatagtt accggataag7044gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc7104tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg7164agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag7224cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt7284gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac7344gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg7404ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc7464cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata7524cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt7584cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag7644gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga7704taacaatttc acacaggaaa cagctatgac catgattacg ccaagcgcgc aattaaccct7764cactaaaggg aacaaaagct gggtaccggg ccccccctcg aggtcgacgg tatcgataag7824cttgatatcg aattcctgca gcc7847<210>15<211>684<212>PRT<213>Schizochytrium sp.
<400>15Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95
Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 ll0Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro180 185 190Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu IIe Ser Pro Lys Asn405 410 415
Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680<210>16<211>30<212>DNA<213>Schizochytrium sp.
<400>16tatcgataag cttgacgtcg aattcctgca 30
<210>17<211>32<212>DNA<213>Schizochytrium sp.
<400>17catggtcaag aacgttcagg atctctttta cg 32<210>18<211>7847<212>DNA<213>Schizochytrium sp.
<220>
<221>prim transcript<222>(1)..(1259)<223>
<220>
<221>CDS<222>(1260)..(3314)<223>
<220>
<221>prim_transcript<222>(3315)..(4887)<223>
<220>
<221>mutation<222>(3042)..(3044)<223>
<400>18ttgtcgacag caacttgcaa gttatacgcg accaccaggc aatctcagca cgcccagcga 60gcacggagct tgcgaagagg gtttacaagt cgtcgttcat tcgctctcaa gctttgcctc 120aacgcaacta ggcccaggcc tactttcact gtgtcttgtc ttgcctttca caccgaccga 180gtgtgcacaa ccgtgttttg cacaaagcgc aagatgctca ctcgactgtg aagaaaggtt 240gcgcgcaagc gactgcgact gcgaggatga ggatgactgg cagcctgttc aaaaactgaa 300aatccgcgat gggtcagtgc cattcgcgca tgacgcctgc gagagacaag ttaactcgtg 360tcactggcat gtcctagcat ctttacgcga gcaaaattca atcgctttat tttttcagtt 420tcgtaacctt ctcgcaaccg cgaatcgccg tttcagcctg actaatctgc agctgcgtgg 480cactgtcagt cagtcagtca gtcgtgcgcg ctgttccagc accgaggtcg cgcgtcgccg 540cgcctggacc gctgctgcta ctgctagtgg cacggcaggt aggagcttgt tgccggaaca 600ccagcagccg ccagtcgacg ccagccaggg gaaagtccgg cgtcgaaggg agaggaaggc 660ggcgtgtgca aactaacgtt gaccactggc gcccgccgac acgagcagga agcaggcagc 720tgcagagcgc agcgcgcaag tgcagaatgc gcgaaagatc cacttgcgcg cggcgggcgc 780gcacttgcgg gcgcggcgcg gaacagtgcg gaaaggagcg gtgcagacgg cgcgcagtga 840cagtgggcgc aaagccgcgc agtaagcagc ggcggggaac ggtatacgca gtgccgcggg 900ccgccgcaca cagaagtata cgcgggccga agtggggcgt cgcgcgcggg aagtgcggaa 960tggcgggcaa ggaaaggagg agacggaaag agggcgggaa agagagagag agagagtgaa1020aaaagaaaga aagaaagaaa gaaagaaaga aagctcggag ccacgccgcg gggagagaga1080gaaatgaaag cacggcacgg caaagcaaag caaagcagac ccagccagac ccagccgagg1140gaggagcgcg cgcaggaccc gcgcggcgag cgagcgagca cggcgcgcga gcgagcgagc1200gagcgagcgc gcgagcgagc aaggcttgct gcgagcgatc gagcgagcga gcgggaagg 1259atg agc gcg acc cgc gcg gcg acg agg aca gcg gcg gcg ctg tcc tcg 1307Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15gcg ctg acg acg cct gta aag cag cag cag cag cag cag ctg cgc gta 1355
Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30ggc gcg gcg tcg gca cgg ctg gcg gcc gcg gcg ttc tcg tcc ggc acg 1403Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45ggc gga gac gcg gcc aag aag gcg gcc gcg gcg agg gcg ttc tcc acg 1451Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60gga cgc ggc ccc aac gcg aca cgc gag aag agc tcg ctg gcc acg gtc 1499Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80cag gcg gcg acg gac gat gcg cgc ttc gtc ggc ctg acc ggc gcc caa 1547Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95atc ttt cat gag ctc atg cgc gag cac cag gtg gac acc atc ttt ggc 1595Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110tac cct ggc ggc gcc att ctg ccc gtt ttt gat gcc att ttt gag agt 1643Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125gac gcc ttc aag ttc att ctc gct cgc cac gag cag ggc gcc ggc cac 1091Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140atg gcc gag ggc tac gcg cgc gcc acg ggc aag ccc ggc gtt gtc ctc 1739Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160gtc acc tcg ggc cct gga gcc acc aac acc atc acc ccg atc atg gat 1787Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175gct tac atg gac ggt acg ccg ctg ctc gtg ttc acc ggc cag gtg ccc 1835Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro180 185 190acc tct gct gtc ggc acg gac gct ttc cag gag tgt gac att gtt ggc 1883Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205atc agc cgc gcg tgc acc aag tgg aac gtc atg gtc aag gac gtg aag 1931Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220gag ctc ccg cgc cgc atc aat gag gcc ttt gag att gcc atg agc ggc 1979Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240cgc ccg ggt ccc gtg ctc gtc gat ctt cct aag gat gtg acc gcc gtt 2027Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255gag ctc aag gaa atg ccc gac agc tcc ccc cag gtt gct gtg cgc cag 2075Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270aag caa aag gtc gag ctt ttc cac aag gag cgc att ggc gct cct ggc 2123Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285acg gcc gac ttc aag ctc att gcc gag atg atc aac cgt gcg gag cga 2171Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300ccc gtc atc tat gct ggc cag ggt gtc atg cag agc ccg ttg aat ggc 2219Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320ccg gct gtg ctc aag gag ttc gcg gag aag gcc aac att ccc gtg acc 2267Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335
acc acc atg cag ggt ctc ggc ggc ttt gac gag cgt agt ccc ctc tcc 2315Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350ctc aag atg ctc ggc atg cac ggc tct gcc tac gcc aac tac tcg atg 2363Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365cag aac gcc gat ctt atc ctg gcg ctc ggt gcc cgc ttt gat gat cgt 2411Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380gtg acg ggc cgc gtt gac gcc ttt gct ccg gag gct cgc cgt gcc gag 2459Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400cgc gag ggc cgc ggt ggc atc gtt cac ttt gag att tcc ccc aag aac 2507Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415ctc cac aag gtc gtc cag ccc acc gtc gcg gtc ctc ggc gac gtg gtc 2555Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430gag aac ctc gcc aac gtc acg ccc cac gtg cag cgc cag gag cgc gag 2603Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445ccg tgg ttt gcg cag atc gcc gat tgg aag gag aag cac cct ttt ctg 2651Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460ctc gag tct gtt gat tcg gsc gac aag gtt ctc aag ccg cag cag gtc 2699Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480ctc acg gag ctt aac aag cag att ctc gag att cag gag aag gac gcc 2747Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495gac cag gag gtc tac atc acc acg ggc gtc gga agc cac cag atg cag 2795Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510gca gcg cag ttc ctt acc tgg acc aag ccg cgc cag tgg atc tcc tcg 2843Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525ggt ggc gcc ggc act atg ggc tac ggc ctt ccc tcg gcc att ggc gcc 2891Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540aag att gcc aag ccc gat gct att gtt att gac atc gat ggt gat gct 2939Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560tct tat tcg atg acc ggt atg gaa ttg atc aca gca gcc gaa ttc aag 2987Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575gtt ggc gtg aag att ctt ctt ttg cag aac aac ttt cag ggc atg gtc 3035Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590aag aac gtt cag gat ctc ttt tac gac aag cgc tac tcg ggc acc gcc 3083Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605atg ttc aac ccg cgc ttc gac aag gtc gcc gat gcg atg cgt gcc aag 3131Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620ggt ctc tac tgc gcg aaa cag tcg gag ctc aag gac aag atc aag gag 3179Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640ttt ctc gag tac gat gag ggt ccc gtc ctc ctc gag gtt ttc gtg gac 3227Phe Lsu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp
645 650 655aag gac acg ctc gtc ttg ccc atg gtc ccc gct ggc ttt ccg ctc cac 3275Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670gag atg gtc ctc gag cct cct aag ccc aag gac gcc taa gttctttttt 3324Glu Met Val Leu Glu Pro Pro Lys Pro Iys Asp Ala675 680ccatggcggg cgagcgagcg agcgcgcgag cgcgcaagtg cgcaagcgcc ttgccttgct3384ttgcttcgct tcgctttgct ttgcttcaca caacctaagt atgaattcaa gttttcttgc3444ttgtcggcga tgcctgcctg ccaaccagcc agccatccgg ccggccgtcc ttgacgcctt3504cgcttccggc gcggccatcg attcaattca cccatccgat acgttccgcc ccctcacgtc3564cgtctgcgca cgacccctgc acgaccacgc caaggccaac gcgccgctca gctcagcttg3624tcgacgagtc gcacgtcaca tatctcagat gcatttggac tgtgagtgtt attatgccac3684tagcacgcaa cgatcttcgg ggtcctcgct cattgcatcc gttcgggccc tgcaggcgtg3744gacgcgagtc gccgccgaga cgctgcagca ggccgctccg acgcgagggc tcgagctcgc3804cgcgcccgcg cgatgtctgc ctggcgccga ctgatctctg gagcgcaagg aagacacggc3864gacgcgagga ggaccgaaga gagacgctgg ggtatgcagg atatacccgg ggcgggacat3924tcgttccgca tacactcccc cattcgagct tgctcgtcct tggcagagcc gagcgcgaac3984ggttccgaac gcggcaagga ttttggctct ggtgggtgga ctccgatcga ggcgcaggtt4044ctccgcaggt tctcgcaggc cggcagtggt cgttagaaat agggagtgcc ggagtcttga4104cgcgccttag ctcactctcc gcccacgcgc gcatcgccgc catgccgccg tcccgtctgt4164cgctgcgctg gccgcgaccg gctgcgccag agtacgacag tgggacagag ctcgaggcga4224cgcgaatcgc tcgggttgta agggtttcaa gggtcgggcg tcgtcgcgtg ccaaagtgaa4284aatagtaggg gggggggggg gtacccaccc cgggcaggtt ctcctcgcca gcctaagtgc4344ctaagggagc gtaggggttt cgttgaccag agaagcggag aacctgccgc ggcgcggaga4404acctatcggc ggagaacttg ccaggcgcga ggcagttctc caatttgcgg acagcggcgc4464gcccacgcga ggcggccgcg tggcgataca gcgaggcgac cgcgcggggc cgcgtggcga4524cacagctgcg cgcggagtcg gctgcgagaa ggcttctcgc tggcttggtt ggggtcgcgg4584gtggcagggg atggatgccc aggtacgtcg gcgtgcgcgc gcccagggag aaaaggacag4644acgcgcgggc ctgcgatgcg agcacgcgat gcgagcacgc gatgcgagca cgcgatgcga4704gcacgcgagc gagcgcccga gcaaatgcca cggaacacgc gttttttgtt tggtgatttc4764tatgtatgcg gggagacttc gatggccgaa aggggtgcaa ggccaaaaga tgctgacagc4824ttcgatcggt ctacggcgcg agcaggaaag ggagcaaggg gcggaattct tctgccttga4884cccgggggat ccactagttc tagagcggcc gccaccgcgg tggagctcca attcgcccta4944tagtgagtcg tattacgcgc gctcactggc cgtcgtttta caacgtcgtg actgggaaaa5004ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa5064tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg5124ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac5184cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc5244cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt5304tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg5364gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag5424tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt5484ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt5544taacgcgaat tttaacaaaa tattaacgct tacaatttag gtggcacttt tcggggaaat5604gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg5664agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa5724catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac5784ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac5844atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt5904ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc5964gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca6024ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc6084ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag6144gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa6204ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg6264gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa6324ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg6384gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt6444
gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt6504caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag6564cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat6624ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct6684taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct6744tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca6804gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc6864agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc6924aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct6984gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag7044gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc7104tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg7164agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag7224cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt7284gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac7344gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg7404ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc7464cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata7524cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt7584cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag7644gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga7704taacaatttc acacaggaaa cagctatgac catgattacg ccaagcgcgc aattaaccct7764cactaaaggg aacaaaagct gggtaccggg ccccccctcg aggtcgacgg tatcgataag7824cttgacgtcg aattcctgca gcc 7847<210>19<211>684<212>PRT<213>Schizochytrium sp.
<400>19Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu
145 150 155 160Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Pro180 185 190Thr Ser Ala Va1 Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr ser Met355 360 365Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460
Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680<210>20<211>26<212>DNA<213>Schizochytrium sp.
<400>20ccggccaggt gcagacctct gctgtc26<210>21<211>7847<212>DNA<213>Schizochytrium sp.
<220>
<221>prim_transcript<222>(1)..(1259)<223>
<220>
<221>mutation<222>(1834)..(1835)<223>
<220>
<221>CDS<222>(1260)..(3314)<223>
<220>
<221>prim_transcript<222>(3315)..(4887)<223>
<400>21ttgtcgacag caacttgcaa gttatacgcg accaccaggc aatctcagca cgcccagcga 60gcacggagct tgcgaagagg gtttacaagt cgtcgttcat tcgctctcaa gctttgcctc 120aacgcaacta ggcccaggcc tactttcact gtgtcttgtc ttgcctttca caccgaccga 180gtgtgcacaa ccgtgttttg cacaaagcgc aagatgctca ctcgactgtg aagaaaggtt 240gcgcgcaagc gactgcgact gcgaggatga ggatgactgg cagcctgttc aaaaactgaa 300aatccgcgat gggtcagtgc cattcgcgca tgacgcctgc gagagacaag ttaactcgtg 360tcactggcat gtcctagcat ctttacgcga gcaaaattca atcgctttat tttttcagtt 420tcgtaacctt ctcgcaaccg cgaatcgccg tttcagcctg actaatctgc agctgcgtgg 480cactgtcagt cagtcagtca gtcgtgcgcg ctgttccagc accgaggtcg cgcgtcgccg 540cgcctggacc gctgctgcta ctgctagtgg cacggcaggt aggagcttgt tgccggaaca 600ccagcagccg ccagtcgacg ccagccaggg gaaagtccgg cgtcgaaggg agaggaaggc 660ggcgtgtgca aactaacgtt gaccactggc gcccgccgac acgagcagga agcaggcagc 720tgcagagcgc agcgcgcaag tgcagaatgc gcgaaagatc cacttgcgcg cggcgggcgc 780gcacttgcgg gcgcggcgcg gaacagtgcg gaaaggagcg gtgcagacgg cgcgcagtga 840cagtgggcgc aaagccgcgc agtaagcagc ggcggggaac ggtatacgca gtgccgcggg 900ccgccgcaca cagaagtata cgcgggccga agtggggcgt cgcgcgcggg aagtgcggaa 960tggcgggcaa ggaaaggagg agacggaaag agggcgggaa agagagagag agagagtgaa1020aaaagaaaga aagaaagaaa gaaagaaaga aagctcggag ccacgccgcg gggagagaga1080gaaatgaaag cacggcacgg caaagcaaag caaagcagac ccagccagac ccagccgagg1140gaggagcgcg cgcaggaccc gcgcggcgag cgagcgagca cggcgcgcga gcgagcgagc1200gagcgagcgc gcgagcgagc aaggcttgct gcgagcgatc gagcgagcga gcgggaagg 1259atg agc gcg acc cgc gcg gcg acg agg aca gcg gcg gcg ctg tcc tcg 1307Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15gcg ctg acg acg cct gta aag cag cag cag cag cag cag ctg cgc gta 1355Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30ggc gcg gcg tcg gca cgg ctg gcg gcc gcg gcg ttc tcg tcc ggc acg 1403Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45ggc gga gac gcg gcc aag aag gcg gcc gcg gcg agg gcg ttc tcc acg 1451Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60gga cgc ggc ccc aac gcg aca cgc gag aag agc tcg ctg gcc acg gtc 1499Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80cag gcg gcg acg gac gat gcg cgc ttc gtc ggc ctg acc ggc gcc caa 1547Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95atc ttt cat gag ctc atg cgc gag cac cag gtg gac acc atc ttt ggc 1595Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110tac cct ggc ggc gcc att ctg ccc gtt ttt gat gcc att ttt gag agt 1643
Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125gac gcc ttc aag ttc att ctc gct cgc cac gag cag ggc gcc ggc cac 1691Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140atg gcc gag ggc tac gcg cgc gcc acg ggc aag ccc ggc gtt gtc ctc 1739Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160gtc acc tcg ggc cct gga gcc acc aac acc atc acc ccg atc atg gat 1787Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175gct tac atg gac ggt acg ccg ctg ctc gtg ttc acc ggc cag gtg cag 1835Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln180 185 190acc tct gct gtc ggc acg gac gct ttc cag gag tgt gac att gtt ggc 1883Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205atc agc cgc gcg tgc acc aag tgg aac gtc atg gtc aag gac gtg aag 1931Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220gag ctc ccg cgc cgc atc aat gag gcc ttt gag att gcc atg agc ggc 1979Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240cgc ccg ggt ccc gtg ctc gtc gat ctt cct aag gat gtg acc gcc gtt 2027Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255gag ctc aag gaa atg ccc gac agc tcc ccc cag gtt gct gtg cgc cag 2075Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270aag caa aag gtc gag ctt ttc cac aag gag cgc att ggc gct cct ggc 2123Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285acg gcc gac ttc aag ctc att gcc gag atg atc aac cgt gcg gag cga 2171Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300ccc gtc atc tat gct ggc cag ggt gtc atg cag agc ccg ttg aat ggc 2219Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320ccg gct gtg ctc aag gag ttc gcg gag aag gcc aac att ccc gtg acc 2267Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335acc acc atg cag ggt ctc ggc ggc ttt gac gag cgt agt ccc ctc tcc 2315Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350ctc aag atg ctc ggc atg cac ggc tct gcc tac gcc aac tac tcg atg 2363Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365cag aac gcc gat ctt atc ctg gcg ctc ggt gcc cgc ttt gat gat cgt 2411Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380gtg acg ggc cgc gtt gac gcc ttt gct ccg gag gct cgc cgt gcc gag 2459Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400cgc gag ggc cgc ggt ggc atc gtt cac ttt gag att tcc ccc aag aac 2507Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415ctc cac aag gtc gtc cag ccc acc gtc gcg gtc ctc ggc gac gtg gtc 2555Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430
gag aac ctc gcc aac gtc acg ccc cac gtg cag cgc cag gag cgc gag 2603Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445ccg tgg ttt gcg cag atc gcc gat tgg aag gag aag cac cct ttt ctg 2651Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460ctc gag tct gtt gat tcg gac gac aag gtt ctc aag ccg cag cag gtc 2699Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480ctc acg gag ctt aac aag cag att ctc gag att cag gag aag gac gcc 2747Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495gac cag gag gtc tac atc acc acg ggc gtc gga agc cac cag atg cag 2795Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510gca gcg cag ttc ctt acc tgg acc aag ccg cgc cag tgg atc tcc tcg 2843Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525ggt ggc gcc ggc act atg ggc tac ggc ctt ccc tcg gcc att ggc gcc 2891Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540aag att gcc aag ccc gat gct att gtt att gac atc gat ggt gat gct 2939Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560tct tat tcg atg acc ggt atg gaa ttg atc aca gca gcc gaa ttc aag 2987Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575gtt ggc gtg aag att ctt ctt ttg cag aac aac ttt cag ggc atg gtc 3035Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590aag aac tgg cag gat ctc ttt tsc gac aag cgc tac tcg ggc acc gcc 3083Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605atg ttc aac ccg cgc ttc gac aag gtc gcc gat gcg atg cgt gcc aag 3131Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620ggt ctc tac tgc gcg aaa cag tcg gag ctc aag gac aag atc aag gag 3179Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640ttt ctc gag tac gat gag ggt ccc gtc ctc ctc gag gtt ttc gtg gac 3227Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655aag gac acg ctc gtc ttg ccc atg gtc ccc gct ggc ttt ccg ctc cac 3275Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670gag atg gtc ctc gag cct cct aag ccc aag gac gcc taa gttctttttt 3324Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680ccatggcggg cgagcgagcg agcgcgcgag cgcgcaagtg cgcaagcgcc ttgccttgct3384ttgcttcgct tcgctttgct ttgcttcaca caacctaagt atgaattcaa gttttcttgc3444ttgtcggcga tgcctgcctg ccaaccagcc agccatccgg ccggccgtcc ttgacgcctt3504cgcttccggc gcggccatcg attcaattca cccatccgat acgttccgcc ccctcacgtc3564cgtctgcgca cgacccctgc acgaccacgc caaggccaac gcgccgctca gctcagcttg3624tcgacgagtc gcacgtcaca tatctcagat gcatttggac tgtgagtgtt attatgccac3684tagcacgcaa cgatcttcgg ggtcctcgct cattgcatcc gttcgggccc tgcaggcgtg3744gacgcgagtc gccgccgaga cgctgcagca ggccgctccg acgcgagggc tcgagctcgc3804cgcgcccgcg cgatgtctgc ctggcgccga ctgatctctg gagcgcaagg aagacacggc3864gacgcgagga ggaccgaaga gagacgctgg ggtatgcagg atatacccgg ggcgggacat3924tcgttccgca tacactcccc cattcgagct tgctcgtcct tggcagagcc gagcgcgaac3984
ggttccgaac gcggcaagga ttttggctct ggtgggtgga ctccgatcga ggcgcaggtt4044ctccgcaggt tctcgcaggc cggcagtggt cgttagaaat agggagtgcc ggagtcttga4104cgcgccttag ctcactctcc gcccacgcgc gcatcgccgc catgccgccg tcccgtctgt4164cgctgcgctg gccgcgaccg gctgcgccag agtacgacag tgggacagag ctcgaggcga4224cgcgaatcgc tcgggttgta agggtttcaa gggtcgggcg tcgtcgcgtg ccaaagtgaa4284aatagtaggg gggggggggg gtacccaccc cgggcaggtt ctcctcgcca gcctaagtgc4344ctaagggagc gtaggggttt cgttgaccag agaagcggag aacctgccgc ggcgcggaga4404acctatcggc ggagaacttg ccaggcgcga ggcagttctc caatttgcgg acagcggcgc4464gcccacgcga ggcggccgcg tggcgataca gcgaggcgac cgcgcggggc cgcgtggcga4524cacagctgcg cgcggagtcg gctgcgagaa ggcttctcgc tggcttggtt ggggtcgcgg4584gtggcagggg atggatgccc aggtacgtcg gcgtgcgcgc gcccagggag aaaaggacag4644acgcgcgggc ctgcgatgcg agcacgcgat gcgagcacgc gatgcgagca cgcgatgcga4704gcacgcgagc gagcgcccga gcaaatgcca cggaacacgc gttttttgtt tggtgatttc4764tatgtatgcg gggagacttc gatggccgaa aggggtgcaa ggccaaaaga tgctgacagc4824ttcgatcggt ctacggcgcg agcaggaaag ggagcaaggg gcggaattct tctgccttga4884cccgggggat ccactagttc tagagcggcc gccaccgcgg tggagctcca attcgcccta4944tagtgagtcg tattacgcgc gctcactggc cgtcgtttta caacgtcgtg actgggaaaa5004ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa5064tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg5124ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac5184cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc5244cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt5304tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg5364gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag5424tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt5484ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt5544taacgcgaat tttaacaaaa tattaacgct tacaatttag gtggcacttt tcggggaaat5604gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg5664agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa5724catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac5784ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac5844atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt5904ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc5964gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca6024ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc6084ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag6144gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa6204ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg6264gtaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa6324ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg6384gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt6444gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt6504caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag6564cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat6624ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct6684taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct6744tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca6804gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc6864agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc6924aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct6984gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag7044gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc7104tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg7164agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag7224cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt7284gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac7344gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg7404ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc7464cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata7524
cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt7584cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag7644gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga7704taacaatttc acacaggaaa cagctatgac catgattacg ccaagcgcgc aattaaccct7764cactaaaggg aacaaaagct gggtaccggg ccccccctcg aggtcgacgg tatcgataag7824cttgacgtcg aattcctgca gcc7847<210>22<211>684<212>PRT<213>Schizochytrium sp.
<400>22Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Serl 5 10 15ALa Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95Ile Phe His Glu Leu Met Arg Glu His Gln Var Asp Thr Ile Phe Gly100 105 110Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln180 185 190Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val
245 250 255Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asr Gly305 310 315 320Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560
Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590Lys Asn Trp Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680<210>23<211>7847<212>DNA<213>Schizochytrium sp.
<220>
<221>prim transcript<222>(1)..(1259)<223>
<220>
<221>CDS<222>(1260)..(3314)<223>
<220>
<221>prim transcript<222>(3315)..4887)<223>
<220>
<221>mutation<222>(1834)..(1835)<223>
<220>
<221>mutation<222>(3042)..(3044)<223>
<400>23ttgtcgacag caacttgcaa gttatacgcg accaccaggc aatctcagca cgcccagcga 60gcacggagct tgcgaagagg gtttacaagt cgtcgttcat tcgctctcaa gctttgcctc120aacgcaacta ggcccaggcc tactttcact gtgtcttgtc ttgcctttca caccgaccga180gtgtgcacaa ccgtgttttg cacaaagcgc aagatgctca ctcgactgtg aagaaaggtt240
gcgcgcaagc gactgcgact gcgaggatga ggatgactgg cagcctgttc aaaaactgaa 300aatccgcgat gggtcagtgc cattcgcgca tgacgcctgc gagagacaag ttaactcgtg 360tcactggcat gtcctagcat ctttacgcga gcaaaattca atcgctttat tttttcagtt 420tcgtaacctt ctcgcaaccg cgaatcgccg tttcagcctg actaatctgc agctgcgtgg 480cactgtcagt cagtcagtca gtcgtgcgcg ctgttccagc accgaggtcg cgcgtcgccg 540cgcctggacc gctgctgcta ctgctagtgg cacggcaggt aggagcttgt tgccggaaca 600ccagcagccg ccagtcgacg ccagccaggg gaaagtccgg cgtcgaaggg agaggaaggc 660ggcgtgtgca aactaacgtt gaccactggc gcccgccgac acgagcagga agcaggcagc 720tgcagagcgc agcgcgcaag tgcagaatgc gcgaaagatc cacttgcgcg cggcgggcgc 780gcacttgcgg gcgcggcgcg gaacagtgcg gaaaggagcg gtgcagacgg cgcgcagtga 840cagtgggcgc aaagccgcgc agtaagcagc ggcggggaac ggtatacgca gtgccgcggg 900ccgccgcaca cagaagtata cgcgggccga agtggggcgt cgcgcgcggg aagtgcggaa 960tggcgggcaa ggaaaggagg agacggaaag agggcgggaa agagagagag agagagtgaa1020aaaagaaaga aagaaagaaa gaaagaaaga aagctcggag ccacgccgcg gggagagaga1080gaaatgaaag cacggcacgg caaagcaaag caaagcagac ccagccagac ccagccgagg1140gaggagcgcg cgcaggaccc gcgcggcgag cgagcgagca cggcgcgcga gcgagcgagc1200gagcgagcgc gcgagcgagc aaggcttgct gcgagcgatc gagcgagcga gcgggaagg 1259atg agc gcg acc cgc gcg gcg acg agg aca gcg gcg gcg ctg tcc tcg 1307Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15gcg ctg acg acg cct gta aag cag cag cag cag cag cag ctg cgc gta 1355Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30ggc gcg gcg tcg gca cgg ctg gcg gcc gcg gcg ttc tcg tcc ggc acg 1403Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr35 40 45ggc gga gac gcg gcc aag aag gcg gcc gcg gcg agg gcg ttc tcc acg 1451Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60gga cgc ggc ccc aac gcg aca cgc gag aag agc tcg ctg gcc acg gtc 1499Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80cag gcg gcg acg gac gat gcg cgc ttc gtc ggc ctg acc ggc gcc caa 1547Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95atc ttt cat gag ctc atg cgc gag cac cag gtg gac acc atc ttt ggc 1595Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110tac cct ggc ggc gcc att ctg ccc gtt ttt gat gcc att ttt gag agt 1643Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125gac gcc ttc aag ttc att ctc gct cgc cac gag cag ggc gcc ggc cac 1691Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140atg gcc gag ggc tac gcg cgc gcc acg ggc aag ccc ggc gtt gtc ctc 1739Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160gtc acc tcg ggc cct gga gcc acc aac acc atc acc ccg atc atg gat 1787Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175gct tac atg gac ggt acg ccg ctg ctc gtg ttc acc ggc cag gtg cag 1835Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln180 185 190acc tct gct gtc ggc acg gac gct ttc cag gag tgt gac att gtt ggc 1883Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205atc agc cgc gcg tgc acc aag tgg aac gtc atg gtc aag gac gtg aag 1931Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220
gag ctc ccg cgc cgc atc aat gag gcc ttt gag att gcc atg agc ggc 1979Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240cgc ccg ggt ccc gtg ctc gtc gat ctt cct aag gat gtg acc gcc gtt 2027Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255gag ctc aag gaa atg ccc gac agc tcc ccc cag gtt gct gtg cgc cag 2075Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270aag caa aag gtc gag ctt ttc cac aag gag cgc att ggc gct cct ggc 2123Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285acg gcc gac ttc aag ctc att gcc gag atg atc aac cgt gcg gag cga 2171Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300ccc gtc atc tat gct ggc cag ggt gtc atg cag agc ccg ttg aat ggc 2219Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320ccg gct gtg ctc aag gag ttc gcg gag aag gcc aac att ccc gtg acc 2267Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335acc acc atg cag ggt ctc ggc ggc ttt gac gag cgt agt ccc ctc tcc 2315Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350ctc aag atg ctc ggc atg cac ggc tct gcc tac gcc aac tac tcg atg 2363Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365cag aac gcc gat ctt atc ctg gcg ctc ggt gcc cgc ttt gat gat cgt 2411Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380gtg acg ggc cgc gtt gac gcc ttt gct ccg gag gct cgc cgt gcc gag 2459Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400cgc gag ggc cgc ggt ggc atc gtt cac ttt gag att tcc ccc aag aac 2507Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415ctc cac aag gtc gtc cag ccc acc gtc gcg gtc ctc ggc gac gtg gtc 2555Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430gag aac ctc gcc aac gtc acg ccc cac gtg cag cgc cag gag cgc gag 2603Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445ccg tgg ttt gcg cag atc gcc gat tgg aag gag aag cac cct ttt ctg 2651Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460ctc gag tct gtt gat tcg gac gac aag gtt ctc aag ccg cag cag gtc 2699Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480ctc acg gag ctt aac aag cag att ctc gag att cag gag aag gac gcc 2747Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495gac cag gag gtc tac atc acc acg ggc gtc gga agc cac cag atg cag 2795Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510gca gcg cag ttc ctt acc tgg acc aag ccg cgc cag tgg atc tcc tcg 2843Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525ggt ggc gcc ggc act atg ggc tac ggc ctt ccc tcg gcc att ggc gcc 2891Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala
530 535 540aag att gcc aag ccc gat gct att gtt att gac atc gat ggt gat gct 2939Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560tct tat tcg atg acc ggt atg gaa ttg atc aca gca gcc gaa ttc aag 2987Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575gtt ggc gtg aag att ctt ctt ttg cag aac aac ttt cag ggc atg gtc 3035Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590aag aac gtt cag gat ctc ttt tac gac aag cgc tac tcg ggc acc gcc 3083Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605atg ttc aac ccg cgc ttc gac aag gtc gcc gat gcg atg cgt gcc aag 3131Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620ggt ctc tac tgc gcg aaa cag tcg gag ctc aag gac aag atc aag gag 3179Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640ttt ctc gag tac gat gag ggt ccc gtc ctc ctc gag gtt ttc gtg gac 3227Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655aag gac acg ctc gtc ttg ccc atg gtc ccc gct ggc ttt ccg ctc cac 3275Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670gag atg gtc ctc gag cct cct aag ccc aag gac gcc taa gttctttttt 3324Glu Met Val Leu Glu Pro Pro Lys Pro Lys Asp Ala675 680ccatggcggg cgagcgagcg agcgcgcgag cgcgcaagtg cgcaagcgcc ttgccttgct3384ttgcttcgct tcgctttgct ttgcttcaca caacctaagt atgaattcaa gttttcttgc3444ttgtcggcga tgcctgcctg ccaaccagcc agccatccgg ccggccgtcc ttgacgcctt3504cgcttccggc gcggccatcg attcaattca cccatccgat acgttccgcc ccctcacgtc3564cgtctgcgca cgacccctgc acgaccacgc caaggccaac gcgccgctca gctcagcttg3624tcgacgagtc gcacgtcaca tatctcagat gcatttggac tgtgagtgtt attatgccac3684tagcacgcaa cgatcttcgg ggtcctcgct cattgcatcc gttcgggccc tgcaggcgtg3744gacgcgagtc gccgccgaga cgctgcagca ggccgctccg acgcgagggc tcgagctcgc3804cgcgcccgcg cgatgtctgc ctggcgccga ctgatctctg gagcgcaagg aagacacggc3864gacgcgagga ggaccgaaga gagacgctgg ggtatgcagg atatacccgg ggcgggacat3924tcgttccgca tacactcccc cattcgagct tgctcgtcct tggcagagcc gagggcgaac3984ggttccgaac gcggcaagga ttttggctct ggtgggtgga ctccgatcga ggcgcaggtt4044ctccgcaggt tctcgcaggc cggcagtggt cgttagaaat agggagtgcc ggagtcttga4104cgcgccttag ctcactctcc gcccacgcgc gcatcgccgc catgccgccg tcccgtctgt4164cgctgcgctg gccgcgaccg gctgcgccag agtacgacag tgggacagag ctcgaggcga4224cgcgaatcgc tcgggttgta agggtttcaa gggtcgggcg tcgtcgcgtg ccaaagtgaa4284aatagtaggg gggggggggg gtacccaccc cgggcaggtt ctcctcgcca gcctaagtgc4344ctaagggagc gtaggggttt cgttgaccag agaagcggag aacctgccgc ggcgcggaga4404acctatcggc ggagaacttg ccaggcgcga ggcagttctc caatttgcgg acagcggcgc4464gcccacgcga ggcggccgcg tggcgataca gcgaggcgac cgcgcggggc cgcgtggcga4524cacagctgcg cgcggagtcg gctgcgagaa ggcttctcgc tggcttggtt ggggtcgcgg4584gtggcagggg atggatgccc aggtacgtcg gcgtgcgcgc gcccagggag aaaaggacag4644acgcgcgggc ctgcgatgcg agcacgcgat gcgagcacgc gatgcgagca cgcgatgcga4704gcacgcgagc gagcgcccga gcaaatgcca cggaacacgc gttttttgtt tggtgatttc4764tatgtatgcg gggagacttc gatggccgaa aggggtgcaa ggccaaaaga tgctgacagc4824ttcgatcggt ctacggcgcg agcaggaaag ggagcaaggg gcggaattct tctgccttga4884cccgggggat ccactagttc tagagcggcc gccaccgcgg tggagctcca attcgcccta4944tagtgagtcg tattacgcgc gctcactggc cgtcgtttta caacgtcgtg actgggaaaa5004ccctggcgtt acccaactta atcgccttgc agcacatccc cctttcgcca gctggcgtaa5064tagcgaagag gcccgcaccg atcgcccttc ccaacagttg cgcagcctga atggcgaatg5124ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac5184
cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc5244cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt5304tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg5364gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag5424tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt5484ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt5544taacgcgaat tttaacaaaa tattaacgct tacaatttag gtggcacttt tcggggaaat5604gtgcgcggaa cccctatttg tttatttttc taaatacatt caaatatgta tccgctcatg5664agacaataac cctgataaat gcttcaataa tattgaaaaa ggaagagtat gagtattcaa5724catttccgtg tcgcccttat tccctttttt gcggcatttt gccttcctgt ttttgctcac5784ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt tgggtgcacg agtgggttac5844atcgaactgg atctcaacag cggtaagatc cttgagagtt ttcgccccga agaacgtttt5904ccaatgatga gcacttttaa agttctgcta tgtggcgcgg tattatcccg tattgacgcc5964gggcaagagc aactcggtcg ccgcatacac tattctcaga atgacttggt tgagtactca6024ccagtcacag aaaagcatct tacggatggc atgacagtaa gagaattatg cagtgctgcc6084ataaccatga gtgataacac tgcggccaac ttacttctga caacgatcgg aggaccgaag6144gagctaaccg cttttttgca caacatgggg gatcatgtaa ctcgccttga tcgttgggaa6204ccggagctga atgaagccat accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg6264gcaacaacgt tgcgcaaact attaactggc gaactactta ctctagcttc ccggcaacaa6324ttaatagact ggatggaggc ggataaagtt gcaggaccac ttctgcgctc ggcccttccg6384gctggctggt ttattgctga taaatctgga gccggtgagc gtgggtctcg cggtatcatt6444gcagcactgg ggccagatgg taagccctcc cgtatcgtag ttatctacac gacggggagt6504caggcaacta tggatgaacg aaatagacag atcgctgaga taggtgcctc actgattaag6564cattggtaac tgtcagacca agtttactca tatatacttt agattgattt aaaacttcat6624ttttaattta aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct6684taacgtgagt tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct6744tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca6804gcggtggttt gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc6864agcagagcgc agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc6924aagaactctg tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct6984gccagtggcg ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag7044gcgcagcggt cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc7104tacaccgaac tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg7164agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag7224cttccagggg gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt7284gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac7344gcggcctttt tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg7404ttatcccctg attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc7464cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcccaata7524cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt7584cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct cactcattag7644gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat tgtgagcgga7704taacaatttc acacaggaaa cagctatgac catgattacg ccaagcgcgc aattaaccct7764cactaaaggg aacaaaagct gggtaccggg ccccccctcg aggtcgacgg tatcgataag7824cttgacgtcg aattcctgca gcc7847<210>24<211>684<212>PRT<213>Schizochytrium sp.
<400>24Met Ser Ala Thr Arg Ala Ala Thr Arg Thr Ala Ala Ala Leu Ser Ser1 5 10 15Ala Leu Thr Thr Pro Val Lys Gln Gln Gln Gln Gln Gln Leu Arg Val20 25 30Gly Ala Ala Ser Ala Arg Leu Ala Ala Ala Ala Phe Ser Ser Gly Thr
35 40 45Gly Gly Asp Ala Ala Lys Lys Ala Ala Ala Ala Arg Ala Phe Ser Thr50 55 60Gly Arg Gly Pro Asn Ala Thr Arg Glu Lys Ser Ser Leu Ala Thr Val65 70 75 80Gln Ala Ala Thr Asp Asp Ala Arg Phe Val Gly Leu Thr Gly Ala Gln85 90 95Ile Phe His Glu Leu Met Arg Glu His Gln Val Asp Thr Ile Phe Gly100 105 110Tyr Pro Gly Gly Ala Ile Leu Pro Val Phe Asp Ala Ile Phe Glu Ser115 120 125Asp Ala Phe Lys Phe Ile Leu Ala Arg His Glu Gln Gly Ala Gly His130 135 140Met Ala Glu Gly Tyr Ala Arg Ala Thr Gly Lys Pro Gly Val Val Leu145 150 155 160Val Thr Ser Gly Pro Gly Ala Thr Asn Thr Ile Thr Pro Ile Met Asp165 170 175Ala Tyr Met Asp Gly Thr Pro Leu Leu Val Phe Thr Gly Gln Val Gln180 185 190Thr Ser Ala Val Gly Thr Asp Ala Phe Gln Glu Cys Asp Ile Val Gly195 200 205Ile Ser Arg Ala Cys Thr Lys Trp Asn Val Met Val Lys Asp Val Lys210 215 220Glu Leu Pro Arg Arg Ile Asn Glu Ala Phe Glu Ile Ala Met Ser Gly225 230 235 240Arg Pro Gly Pro Val Leu Val Asp Leu Pro Lys Asp Val Thr Ala Val245 250 255Glu Leu Lys Glu Met Pro Asp Ser Ser Pro Gln Val Ala Val Arg Gln260 265 270Lys Gln Lys Val Glu Leu Phe His Lys Glu Arg Ile Gly Ala Pro Gly275 280 285Thr Ala Asp Phe Lys Leu Ile Ala Glu Met Ile Asn Arg Ala Glu Arg290 295 300Pro Val Ile Tyr Ala Gly Gln Gly Val Met Gln Ser Pro Leu Asn Gly305 310 315 320Pro Ala Val Leu Lys Glu Phe Ala Glu Lys Ala Asn Ile Pro Val Thr325 330 335Thr Thr Met Gln Gly Leu Gly Gly Phe Asp Glu Arg Ser Pro Leu Ser340 345 350
Leu Lys Met Leu Gly Met His Gly Ser Ala Tyr Ala Asn Tyr Ser Met355 360 365Gln Asn Ala Asp Leu Ile Leu Ala Leu Gly Ala Arg Phe Asp Asp Arg370 375 380Val Thr Gly Arg Val Asp Ala Phe Ala Pro Glu Ala Arg Arg Ala Glu385 390 395 400Arg Glu Gly Arg Gly Gly Ile Val His Phe Glu Ile Ser Pro Lys Asn405 410 415Leu His Lys Val Val Gln Pro Thr Val Ala Val Leu Gly Asp Val Val420 425 430Glu Asn Leu Ala Asn Val Thr Pro His Val Gln Arg Gln Glu Arg Glu435 440 445Pro Trp Phe Ala Gln Ile Ala Asp Trp Lys Glu Lys His Pro Phe Leu450 455 460Leu Glu Ser Val Asp Ser Asp Asp Lys Val Leu Lys Pro Gln Gln Val465 470 475 480Leu Thr Glu Leu Asn Lys Gln Ile Leu Glu Ile Gln Glu Lys Asp Ala485 490 495Asp Gln Glu Val Tyr Ile Thr Thr Gly Val Gly Ser His Gln Met Gln500 505 510Ala Ala Gln Phe Leu Thr Trp Thr Lys Pro Arg Gln Trp Ile Ser Ser515 520 525Gly Gly Ala Gly Thr Met Gly Tyr Gly Leu Pro Ser Ala Ile Gly Ala530 535 540Lys Ile Ala Lys Pro Asp Ala Ile Val Ile Asp Ile Asp Gly Asp Ala545 550 555 560Ser Tyr Ser Met Thr Gly Met Glu Leu Ile Thr Ala Ala Glu Phe Lys565 570 575Val Gly Val Lys Ile Leu Leu Leu Gln Asn Asn Phe Gln Gly Met Val580 585 590Lys Asn Val Gln Asp Leu Phe Tyr Asp Lys Arg Tyr Ser Gly Thr Ala595 600 605Met Phe Asn Pro Arg Phe Asp Lys Val Ala Asp Ala Met Arg Ala Lys610 615 620Gly Leu Tyr Cys Ala Lys Gln Ser Glu Leu Lys Asp Lys Ile Lys Glu625 630 635 640Phe Leu Glu Tyr Asp Glu Gly Pro Val Leu Leu Glu Val Phe Val Asp645 650 655Lys Asp Thr Leu Val Leu Pro Met Val Pro Ala Gly Phe Pro Leu His660 665 670
Glu Met Val Leu Glu Pro Pro Lys ProLys Asp Ala675 680<210>25<211>18<212>DNA<213>Schizochytrium sp.
<400>25gttgaccagt gccgttcc 18<210>26<211>18<212>DNA<213>Schizochytrium sp.
<400>26cgaagtgcac gcagttgc 18<210>27<211>31<212>DNA<213>Schizochytrium sp.
<400>27gcgcccatgg gacgtcaggt ggcacttttc g31<210>28<211>36<212>DNA<213>Schizochytrium sp.
<400>28gcgcccatgg ccgcggcaag cagcagatta cgcgca 36<210>29<211>1263<212>DNA<213>Caenorhabditis elegans<220>
<221>CDS<222>(23)..(1228)<223>
<400>29gcggccgcga attcagatct cc atg gtc gct cac tcg tcg gag ggt ctc tcg 52Met Val Ala His Ser Ser Glu Gly Leu Ser1 5 10gcc acc gcc ccg gtc acc ggc ggc gac gtc ctc gtc gac gcc cgc gcc 100Ala Thr Ala Pro Val Thr Gly Gly Asp Val Leu Val Asp Ala Arg Ala15 20 25tcg ctc gag gag aag gag gcc ccg cgc gac gtc aac gcc aac acc aag 148Ser Leu Glu Glu Lys Glu Ala Pro Arg Asp Val Asn Ala Asn Thr Lys30 35 40cag gcc acc acc gag gag ccc cgc atc cag ctg ccc acc gtc gac gcc 196Gln Ala Thr Thr Glu Glu Pro Arg Ile Gln Leu Pro Thr Val Asp Ala45 50 55ttc cgc cgc gcc atc ccc gcc cac tgc ttc gag cgc gac ctc gtc aag 244
Phe Arg Arg Ala Ile Pro Ala His Cys Phe Glu Arg Asp Leu Val Lys60 65 70tcg atc cgc tac ctc gtc cag gac ttc gcc gcc ctc acc atc ctc tac 292Ser Ile Arg Tyr Leu Val G1n Asp Phe Ala Ala Leu Thr Ile Leu Tyr75 80 85 90ttc gcc ctc ccc gcc ttc gag tac ttc ggc ctc ttc ggc tac ctc gtc 340Phe Ala Leu Pro Ala Phe Glu Tyr Phe Gly Leu Phe Gly Tyr Leu Val95 100 105tgg aac atc ttc atg ggc gtc ttc ggc ttc gcc ctc ttc gtc gtc ggc 388Trp Asn Ile Phe Met Gly Val Phe Gly Phe Ala Leu Phe Val Val Gly110 115 120cac gac tgc ctc cac gga agc ttc tcg gac aac cag aac ctc aac gac 436His Asp Cys Leu His Gly Ser Phe Ser Asp Asn Gln Asn Leu Asn Asp125 130 135ttc atc ggc cac atc gcc ttc tcg ccc ctc ttc tcg ccc tac ttc ccc 484Phe Ile Gly His Ile Ala Phe Ser Pro Leu Phe Ser Pro Tyr Phe Pro140 145 150tgg cag aag tcg cac aag ctc cac cac gcc ttc acc aac cac atc gac 532Trp Gln Lys Ser His Lys Leu His His Ala Phe Thr Asn His Ile Asp155 160 165 170aag gac cac ggc cac gtc tgg atc cag gac aag gac tgg gag gcc atg 580Lys Asp His Gly His Val Trp Ile Gln Asp Lys Asp Trp Glu Ala Met175 180 185ccc tcg tgg aag cgc tgg ttc aac ccc atc ccc ttc tcg ggc tgg ctc 628Pro Ser Trp Lys Arg Trp Phe Asn Pro Ile Pro Phe Ser Gly Trp Leu190 195 200aag tgg ttc ccc gtc tac acc ctc ttc ggc ttc tgc gac ggc tcg cac 676Lys Trp Phe Pro Val Tyr Thr Leu Phe Gly Phe Cys Asp Gly Ser His205 210 215ttc tgg ccc tac tcg tcg ctc ttc gtc cgc aac tcg gac cgc gtc cag 724Phe Trp Pro Tyr Ser Ser Leu Phe Val Arg Asn Ser Asp Arg Val Gln220 225 230tgc gtg atc agc ggc atc tgc tgc tgc gtc tgc gcc tac atc gcc ctc 772Cys Val Ile Ser Gly Ile Cys Cys Cys Val Cys Ala Tyr Ile Ala Leu235 240 245 250acc atc gcc ggc tcg tac tcg aac tgg ttc tgg tac tac tgg gtc ccg 820Thr Ile Ala Gly Ser Tyr Ser Asn Trp Phe Trp Tyr Tyr Trp Val Pro255 260 265ctc tcg ttc ttc ggc ctc atg ctc gtc atc gtc acc tac ctg cag cac 868Leu Ser Phe Phe Gly Leu Met Leu Val Ile Val Thr Tyr Leu Gln His270 275 280gtc gac gac gtc gcc gag gtc tac gag gcc gac gag tgg tcg ttc gtc 916Val Asp Asp Val Ala Glu Val Tyr Glu Ala Asp Glu Trp Ser Phe Val285 290 295cgc ggc cag acc cag acc atc gac cgc tac tac ggc ctc ggc ctc gac 964Arg Gly Gln Thr Gln Thr Ile Asp Arg Tyr Tyr Gly Leu Gly Leu Asp300 305 310acc acc atg cac cac atc acc gac ggc cac gtg gcc cac cac ttc ttc 1012Thr Thr Met His His Ile Thr Asp Gly His Val Ala His His Phe Phe315 320 325 330aac aag atc ccg cac tac cac ctc atc gag gcc acc gag ggc gtc aag 1060Asn Lys Ile Pro His Tyr His Leu Ile Glu Ala Thr Glu Gly Val Lys335 340 345aag gtc ctc gag ccc ctc tcg gac acc cag tac ggc tac aag tcg cag 1108Lys Val Leu Glu Pro Leu Ser Asp Thr Gln Tyr Gly Tyr Lys Ser Gln350 355 360gtc aac tac gac ttc ttc gcc cgc ttc ctc tgg ttc aac tac aag ctc 1156Val Asn Tyr Asp Phe Phe Ala Arg Phe Leu Trp Phe Asn Tyr Lys Leu365 370 375
gac tac ctc gtg cac aag acc gcc ggc atc atg cag ttc cgc acc acc1204Asp Tyr Leu Val His Lys Thr Ala Gly Ile Met Gln Phe Arg Thr Thr380 385 390ctc gag gag aag gcc aag gcc aag taacccgggg gtacccttaa ggcatgcgcg 1258Leu Glu Glu Lys Ala Lys Ala Lys395 400gccgc 1263<210>30<211>402<212>PRT<213>Caenorhabditis elegans<400>30Met Val Ala His Ser Ser Glu Gly Leu Ser Ala Thr Ala Pro Val Thr1 5 10 15Gly Gly Asp Val Leu Val Asp Ala Arg Ala Ser Leu Glu Glu Lys Glu20 25 30Ala Pro Arg Asp Val Asn Ala Asn Thr Lys Gln Ala Thr Thr Glu Glu35 40 45Pro Arg Ile Gln Leu Pro Thr Val Asp Ala Phe Arg Arg Ala Ile Pro50 55 60Ala His Cys Phe Glu Arg Asp Leu Val Lys Ser Ile Arg Tyr Leu Val65 70 75 80Gln Asp Phe Ala Ala Leu Thr Ile Leu Tyr Phe Ala Leu Pro Ala Phe85 90 95Glu Tyr Phe Gly Leu Phe Gly Tyr Leu Val Trp Asn Ile Phe Met Gly100 105 110Val Phe Gly Phe Ala Leu Phe Val Val Gly His Asp Cys Leu His Gly115 120 125Ser Phe Ser Asp Asn Gln Asn Leu Asn Asp Phe Ile Gly His Ile Ala130 135 140Phe Ser Pro Leu Phe Ser Pro Tyr Phe Pro Trp Gln Lys Ser His Lys145150 155 160Leu His His Ala Phe Thr Asn His Ile Asp Lys Asp His Gly His Val165 170 175Trp Ile Gln Asp Lys Asp Trp Glu Ala Met Pro Ser Trp Lys Arg Trp180 185 190Pha Asn Pro Ile Pro Phe Ser Gly Trp Leu Lys Trp Phe Pro Val Tyr195 200 205Thr Leu Phe Gly Phe Cys Asp Gly Ser His Phe Trp Pro Tyr Ser Ser210 215 220Leu Phe Val Arg Asn Ser Asp Arg Val Gln Cys Val Ile Ser Gly Ile225 230 235 240
Cys Cys Cys Val Cys Ala Tyr Ile Ala Leu Thr Ile Ala Gly Ser Tyr245 250 255Ser Asn Trp Phe Trp Tyr Tyr Trp Val Pro Leu Ser Phe Phe Gly Leu260 265 270Met Leu Val Ile Val Thr Tyr Leu Gln His Val Asp Asp Val Ala Glu275 280 285Val Tyr Glu Ala Asp Glu Trp Ser Phe Val Arg Gly Gln Thr Gln Thr290 295 300Ile Asp Arg Tyr Tyr Gly Leu Gly Leu Asp Thr Thr Met His His Ile305 310 315 320Thr Asp Gly His Val Ala His His Phe Phe Asn Lys Ile Pro His Tyr325 330 335His Leu Ile Glu Ala Thr Glu Gly Val Lys Lys Val Leu Glu Pro Leu340 345 350Ser Asp Thr Gln Tyr Gly Tyr Lys Ser Gln Val Asn Tyr Asp Phe Phe355 360 365Ala Arg Phe Leu Trp Phe Asn Tyr Lys Leu Asp Tyr Leu Val His Lys370 375 380Thr Ala Gly Ile Met Gln Phe Arg Thr Thr Leu Glu Glu Lys Ala Lys385 390 395 400Ala Lys<210>31<211>570<212>DNA<213>Caenorhabditis elegans<400>31agcagcagat tgcccgaggc cggcggaagg gacgaggccc aggcggctcg tgaaagcgca 60tttccgaagg cgggctcggc gacgacgccg gcgcggcgac gacggccctg ccggaccggg 120cctggggtgg acggcgaggc taactaggac ttggggaagc cgagctgagc gacttgagcg 180ggttgagggg acgaactgtt taggcgcggc cgagtcgtca gagccagcct gtggagaaag 240aggcgccgcc gagtgcgacg gggaacgctg cgccgacctc gcattgcacc gcatcgcawt 300cgcaccgcaw tcgcaccgca ccgcatcgca ccgcatcgca tcgagacccg acgcagcgag 360acgcgacgct gggccttccc ggcgaaaaaa agtgatctgg cttacaaatc ccgagacgag 420acagacgtcg gcagcagaaa cgaatcagtc gagcagcagc tgcagcagca gcagcagcag 480cagcagccca tcgcgagcaa gggctcagcc agcagaacac caatcaggcc aagaatcgca 540cggaagcaag ccttgacatc ctttgccaac 570<210>32<211>18<212>DNA<213>Schizochytrium sp.
<400>32gacccgtcat ctatgctg 18<210>33
<211>18<212>DNA<213>Schizochytrium sp.
<400>33ctcaaagtga acgatgcc18<210>34<211>4244<212>DNA<213>Schizochytrium sp.
<400>34tttctctctc tcgagctgtt gctgctgctg ctgctgctgc tgcttccttg ctggttctca 60cgtccgttcg atcaagcgct cgctcgctcg accgatcggt gcgtgcgtgc gtgcgtgagt 120cttgttgcca ggcagccgca ggctgtctgt ctgtttgtgt agttttaccc tcggggttcg 180gggtctgcct gcctcccgct cccgcccgcc gccgcccgta tccaccccgc tcgcctccgc 240ccatcgggcc tcgcctcctc gcgccgcacg catcgcgcgc atcgcatgca tcatgctgcc 300acgcacgggg ggacgcgcgc cccgcgtccc ccgccgccgc cgtcgtcgtc tggcgatgcc 360gtcgccgccc tccttccttc cctcgcctcc tcttcctccc gagcccccct gtcttccttc 420gcccccgcag cggcgcgcag gaagcgagga gagcggggag gagagaagaa aagaaaagaa 480aagaaaagaa aataacagcg ccgtctcgcg cagacgcgcg cggccgcgtg cgaggcggcg 540tgatggggct tctcgtggcg cggctgcggc ctggcccggc ctcgcctttg aggtgcaggc 600tttgggagag aagagtggga cgcggagaag ataagatggt gccatggcgc aggacggaga 660ggttgctgaa acttcttcga gcggcacagg cgatggcgag agaccgacag ctgccggcgc 720ggaggggatg gatacctccc gaggctggca tggacgagct ggccgcgcgg atctggctgg 780ccgcgcggcg gtgggtccgg aggcgcgagg ttggttttct tcatacctga taccatacgg 840tattcattct tcctctccag gaaggaagca agtcacatag agtatcacta gcctaatgat 900ggactctatg ttttagggca cgtcggagca gaaggcgcga gcgattcgaa tgcgagcgat 960agatacagca cagagacctt gccggcgacg cggatgcagg cgagcacgca cgcaccgcac1020gcacggcagc ggtgcacgcg ctcctcggca gatgcacggt tctgcgccgc gcctttacat1080tttttgattt taggtggtgt gcctgccact ttgaacatca tccacaagtc aacgcagcat1140caagaggcaa gcaagtacat acatccattc gaattcaagt tcaagagacg cagcaacagc1200cgccgctccg ctcaagctgc agctagctgg ctgacagggc tcgctggctg tagtggaaaa1260ttccattcac ttttctgcat ccgcggccag caggcccgta cgcacgttct ctcgtttgtt1320tgttcgttcg tgcgtgcgtg cgtgcgtccc agctgcctgt ctaatctgcc gcgcgatcca1380acgaccctcg gtcgtcgccg caagcgaaac ccgacgccga cctggccaat gccgcaagaa1440tgctaagcgc gcagcaatgc tgagagtaat cttcagccca ccaagtcatt atcgctgccc1500aagtctccat cgcagccaca ttcaggcttt ctctctctct ccctccctct ctttctgccg1560ggagagaagg aaagacccgc cgccgccgcc tctgcgcctg tgacgggctg tccgttgtaa1620gccctcttag acagttccta ggtgccgggc gccgccgcgc ctccgtcgca ggcacacgta1680ggcggccacg ggttcccccc gcaccttcca caccttcttc ccccgcagcc ggaccgcgcg1740ccgtctgctt acgcacttcg cgcggccgcc gcccgcgaac ccgagcgcgt gctgtgggcg1800ccgtcttccg gccgcgtcgg aggtcgtccc cgcgccgcgc tactccgggt cctgtgcggt1860acgtacttaa tattaacagt gggacctcgc acaggacctg acggcagcac agacgtcgcc1920gcctcgcatc gctggggacg caggcgaggc atcccggcgc ggccccgcac cggggaggct1980gcggggcggc ctcttccggc cggcggccgc atcaggcgga tgacgcaaga gccctcgcag2040tcgctcgctc gcgggagcgc agcgcggcgc cagcgtggcc aagctcccgc cccttctggc2100tggctgcatg cctgcctgcc tgcctgcctg cgtgcgtgcg tgcgtgcgtg ccttcgtgcg2160tgcctgcctt cgtgcgtgcg tgcgtgagtg cggcggaaga gggatcatgc gaggatcaat2220cacccgccgc acctcgactt ttgaagaagc cgcgatgcga tgcgatgcga tgcgatgcga2280cgcgataccg tgcgaggcta cgaagcgagt ctggccggcc gtcatacaac gcacgttttc2340gagaaggagg gctggcggag gcgtgcatgc cggcgaccat tgcgaacgcg gcgtctcgtg2400gctggcgaag gtgcctggag gatctaacga tcgctgctat gatgctatag ctgtgctgat2460ccccggtcca ttccaccacg tctgtgcctg ccgcctgacc tgcgcttggc tttccttcaa2520gttctcctcc gccgggcctt caggaccgag acgagacctg cagctgcagc tagactcgcg2580ctcgctcgcg gaggattcgc cggccgccgg gccggacggg actcgcgagg tcacacggcc2640gccggcgatc gcgatggctg tgctgacgta ctcgtgcgtg gcagccgtac gtcagcgacg2700ccgcctccgt attgtggatt cgttagttgg ttgttggttg atttgttgat taattttttt2760
gttcgtaggc ttggttatag ctaatagttt agtttatact ggtgctcttc ggtgctgatt2820tagctcgact tgggtccaca ccactgcccc tctactgtga atggatcaat ggacgcacga2880cgggccgacg aaagtgcgcg agtgaggtaa cctaagcaac ggcggtcttc agaggggacg2940cacgccctcc gtcgcagtca gtccagacag gcagaaaagc gtcttaggga ccacgcacgc3000acgcacgcac gcacgcacgc ccgcacgcac gctccctccc tcgcgtgcct atttttttag3060gcttccttcc gcacgggcct acctctcgct ccctcgcctc gccgcaccag gcggcagcag3120cgatacctgc cggtgccgcc tccgtcacgc gctcagccgc agctcagccc agccgcgagc3180tagggtttgt tcgtcctgaa ttgtttgatt tgatttgatt tgatttgatc cgatccgatc3240cgatctgatc tgatttgctt tgctttgctt tgtctccctc ccggcgcgga ccaagcgtcc3300gtctgcgcgc cgcagcttcc cttcttctcc cagccctcct tctgctcccg cctctcgcgc3360aagcacgcag cttcgccgcc gcatccggtc ggtcggtcgg tcgatcgacc cgcctgccgc3420tgctgctgtg gccgggcttt tctccatcgg cgactctttc ttctccatac gtcctactac3480gtacatacat actgccggct tcctcctctt ccagcgcggc gacggcggca ggctgcgacg3540tcgtcgccgc cgcgggcgcc gcgcgcgccg ccgccgccgc ccgcgtcgca gggcctcgtc3600gccgccgccg ctccgctccg ctccgaggcc gcgagagggc cgcggcggcg cgatggatgg3660atggatggat ggatggatgg atggattttg ttgatcgatg gcggcgcatg ggcggagatg3720agcgaggacg agcgcgcgag cgcggcagcc ggattcgcag ggcctcgctc gcctcgcgcc3780cgctgccgcg cccgccttgc gagcctgcgc cgcgagcgag cgagcgagcg agcggggctt3840tctttgtctc gcgcgccgct tggcctcgtg tgtcttgtgc ttgcgtagcg ggcgccgcgg3900tggaagatgg ctcattcaat cgacccattc acgcacgcac tccggcgcgc agagaaggcc3960gaggaggagc agcaagcaaa ccaaaagctc tcgcgctcgc ggtctcgggc tcgagcggtc4020tcggagagag agtcttgcgg cgaccaccgg cagcagcagc agcagcagca gcgctgtcga4080gcacgagcac gagcacgagc acgagcacga gcattcgagc aagaggacag acacggttgt4140cagcgcctag ctcgctcgat acagaaagag gcgggttggg cgtaaaaaaa aaggagcacg4200caagccgcca gccagccagc tagctagcca gcctgcctgc caaa 4244<210>35<211>4244<212>DNA<213>Schizochytrium sp.
<400>35tttctctctc tcgagctgtt gctgctgctg ctgctgctgc tgcttccttg ctggttctca 60cgtccgttcg atcaagcgct cgctcgctcg accgatcggt gcgtgcgtgc gtgcgtgagt 120cttgttgcca ggcagccgca ggctgtctgt ctgtttgtgt agttttaccc tcggggttcg 180gggtctgcct gcctcccgct cccgcccgcc gccgcccgta tccaccccgc tcgcctccgc 240ccatcgggcc tcgcctcctc gcgccgcacg catcgcgcgc atcgcatgca tcatgctgcc 300acgcacgggg ggacgcgcgc cccgcgtccc ccgccgccgc cgtcgtcgtc tggcgatgcc 360gtcgccgccc tccttccttc cctcgcctcc tcttcctccc gagcccccct gtcttccttc 420gcccccgcag cggcgcgcag gaagcgagga gagcggggag gagagaagaa aagaaaagaa 480aagaaaagaa aataacagcg ccgtctcgcg cagacgcgcg cggccgcgtg cgaggcggcg 540tgatggggct tctcgtggcg cggctgcggc ctggcccggc ctcgcctttg aggtgcaggc 600tttgggagag aagagtggga cgcggagaag ataagatggt gccatggcgc aggacggaga 660ggttgctgaa acttcttcga gcggcacagg cgatggcgag agaccgacag ctgccggcgc 720ggaggggatg gatacctccc gaggctggca tggacgagct ggccgcgcgg atctggctgg 780ccgcgcggcg gtgggtccgg aggcgcgagg ttggttttct tcatacctga taccatacgg 840tattcattct tcctctccag gaaggaagca agtcacatag agtatcacta gcctaatgat 900ggactctatg ttttagggca cgtcggagca gaaggcgcga gcgattcgaa tgcgagcgat 960agatacagca cagagacctt gccggcgacg cggatgcagg cgagcacgca cgcaccgcac1020gcacggcagc ggtgcacgcg ctcctcggca gatgcacggt tctgcgccgc gcctttacat1080tttttgattt taggtggtgt gcctgccact ttgaacatca tccacaagtc aacgcagcat1140caagaggcaa gcaagtacat acatccattc gaattcaagt tcaagagacg cagcaacagc1200cgccgctccg ctcaagctgc agctagctgg ctgacagggc tcgctggctg tagtggaaaa1260ttccattcac ttttctgcat ccgcggccag caggcccgta cgcacgttct ctcgtttgtt1320tgttcgttcg tgcgtgcgtg cgtgcgtccc agctgcctgt ctaatctgcc gcgcgatcca1380acgaccctcg gtcgtcgccg caagcgaaac ccgacgccga cctggccaat gccgcaagaa1440tgctaagcgc gcagcaatgc tgagagtaat cttcagccca ccaagtcatt atcgctgccc1500aagtctccat cgcagccaca ttcaggcttt ctctctctct ccctccctct ctttctgccg1560ggagagaagg aaagacccgc cgccgccgcc tctgcgcctg tgacgggctg tccgttgtaa1620
gccctcttag acagttccta ggtgccgggc gccgccgcgc ctccgtcgca ggcacacgta1680ggcggccacg ggttcccccc gcaccttcca caccttcttc ccccgcagcc ggaccgcgcg1740ccgtctgctt acgcacttcg cgcggccgcc gcccgcgaac ccgagcgcgt gctgtgggcg1800ccgtcttccg gccgcgtcgg aggtcgtccc cgcgccgcgc tactccgggt cctgtgcggt1860acgtacttaa tattaacagt gggacctcgc acaggacctg acggcagcac agacgtcgcc1920gcctcgcatc gctggggacg caggcgaggc atcccggcgc ggccccgcac cggggaggct1980gcggggcggc ctcttccggc cggcggccgc atcaggcgga tgacgcaaga gccctcgcag2040tcgctcgctc gcgggagcgc agcgcggcgc cagcgtggcc aagctcccgc cccttctggc2100tggctgcatg cctgcctgcc tgcctgcctg cgtgcgtgcg tgcgtgcgtg ccttcgtgcg2160tgcctgcctt cgtgcgtgcg tgcgtgagtg cggcggaaga gggatcatgc gaggatcaat2220cacccgccgc acctcgactt ttgaagaagc cgcgatgcga tgcgatgcga tgcgatgcga2280cgcgataccg tgcgaggcta cgaagcgagt ctggccggcc gtcatacaac gcacgttttc2340gagaaggagg gctggcggag gcgtgcatgc cggcgaccat tgcgaacgcg gcgtctcgtg2400gctggcgaag gtgcctggag gatctaacga tcgctgctat gatgctatag ctgtgctgat2460ccccggtcca ttccaccacg tctgtgcctg ccgcctgacc tgcgcttggc tttccttcaa2520gttctcctcc gccgggcctt caggaccgag acgagacctg cagctgcagc tagactcgcg2580ctcgctcgcg gaggattcgc cggccgccgg gccggacggg actcgcgagg tcacacggcc2640gccggcgatc gcgatggctg tgctgacgta ctcgtgcgtg gcagccgtac gtcagcgacg2700ccgcctccgt attgtggatt cgttagttgg ttgttggttg atttgttgat taattttttt2760gttcgtaggc ttggttatag ctaatagttt agtttatact ggtgctcttc ggtgctgatt2820tagctcgact tgggtccaca ccactgcccc tctactgtga atggatcaat ggacgcacga2880cgggccgacg aaagtgcgcg agtgaggtaa cctaagcaac ggcggtcttc agaggggacg2940cacgccctcc gtcgcagtca gtccagacag gcagaaaagc gtcttaggga ccacgcacgc3000acgcacgcac gcacgcacgc ccgcacgcac gctccctccc tcgcgtgcct atttttttag3060gcttccttcc gcacgggcct acctctcgct ccctcgcctc gccgcaccag gcggcagcag3120cgatacctgc cggtgccgcc tccgtcacgc gctcagccgc agctcagccc agccgcgagc3180tagggtttgt tcgtcctgaa ttgtttgatt tgatttgatt tgatttgatc cgatccgatc3240cgatctgatc tgatttgctt tgctttgctt tgtctccctc ccggcgcgga ccaagcgtcc3300gtctgcgcgc cgcagcttcc cttcttctcc cagccctcct tctgctcccg cctctcgcgc3360aagcacgcag cttcgccgcc gcatccggtc ggtcggtcgg tcgatcgacc cgcctgccgc3420tgctgctgtg gccgggcttt tctccatcgg cgactctttc ttctccatac gtcctactac3480gtacatacat actgccggct tcctcctctt ccagcgcggc gacggcggca ggctgcgacg3540tcgtcgccgc cgcgggcgcc gcgcgcgccg ccgccgccgc ccgcgtcgca gggcctcgtc3600gccgccgccg ctccgctccg ctccgaggcc gcgagagggc cgcggcggcg cgatggatgg3660atggatggat ggatggatgg atggattttg ttgatcgatg gcggcgcatg ggcggagatg3720agcgaggacg agcgcgcgag cgcggcagcc ggattcgcag ggcctcgctc gcctcgcgcc3780cgctgccgcg cccgccttgc gagcctgcgc cgcgagcgag cgagcgagcg agcggggctt3840tctttgtctc gcgcgccgct tggcctcgtg tgtcttgtgc ttgcgtagcg ggcgccgcgg3900tggaagatgg ctcattcaat cgacccattc acgcacgcac tccggcgcgc agagaaggcc3960gaggaggagc agcaagcaaa ccaaaagctc tcgcgctcgc ggtctcgggc tcgagcggtc4020tcggagagag agtcttgcgg cgaccaccgg cagcagcagc agcagcagca gcgctgtcga4080gcacgagcac gagcacgagc acgagcacga gcattcgagc aagaggacag acacggttgt4140cagcgcctag ctcgctcgat acagaaagag gcgggttggg cgtaaaaaaa aaggagcacg4200caagccgcca gccagccagc tagctagcca gcctgcctgc caaa 424權(quán)利要求
1.分離的核酸分子,包含選自下列的核酸序列a.編碼下述蛋白的核酸序列,該蛋白具有選自SEQ ID NO15,SEQ IDNO19,SEQ ID NO22或SEQ ID NO24的氨基酸序列,其中所述蛋白為乙酰乳酸合酶;b.編碼下述蛋白的核酸序列,該蛋白具有與氨基酸序列(a)至少約75%相同的氨基酸序列,其中所述蛋白為乙酰乳酸合酶;和,c.與核酸序列(a)或(b)完全互補的核酸序列。
2.權(quán)利要求1的分離的核酸分子,其中所述核酸序列編碼具有與氨基酸序列(a)至少約85%相同的氨基酸序列的蛋白,并且其中所述蛋白為乙酰乳酸合酶。
3.權(quán)利要求1的分離的核酸分子,其中所述核酸序列編碼具有與氨基酸序列(a)至少約95%相同的氨基酸序列的蛋白,并且其中所述蛋白為乙酰乳酸合酶。
4.權(quán)利要求1的分離的核酸分子,其中所述核酸序列編碼具有與SEQID NO15不同的氨基酸序列的蛋白,該不同是由于在選自116G,117A,192P,200A,251K,358M,383D,592V,595W或599F的氨基酸位置發(fā)生氨基酸缺失,插入或取代。
5.權(quán)利要求1的分離的核酸分子,其中所述核酸序列編碼一種蛋白,該蛋白具有選自SEQ ID NO15,SEQ ID NO19,SEQ ID NO22或SEQ IDNO24的氨基酸序列,并且其中所述蛋白為乙酰乳酸合酶。
6.權(quán)利要求1的分離的核酸分子,其中所述核酸序列選自SEQ ID NO14的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314或SEQ ID NO23的核苷酸1260-3314。
7.權(quán)利要求1的分離的核酸分子,其中蛋白(a)或(b)的表達賦予用所述核酸分子轉(zhuǎn)化的破囊壺菌目微生物對選自如下的化合物降低的敏感性磺酰脲化合物,咪唑啉酮類抑制劑,或嘧啶基羥苯甲酸鹽。
8.權(quán)利要求7的分離的核酸分子,其中所述核酸序列編碼具有選自SEQID NO19,SEQ ID NO22或SEQ ID NO24的氨基酸序列的蛋白。
9.權(quán)利要求7的分離的核酸分子,其中所述核酸序列選自SEQ ID NO14的核苷酸1260-3314,SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314或SEQ ID NO23的核苷酸1260-3314。
10.權(quán)利要求1的分離的核酸分子,其中所述核酸序列編碼Schizochytrium乙酰乳酸合酶。
11.權(quán)利要求10的分離的核酸分子,其中所述Schizochytrium乙酰乳酸合酶的表達賦予用所述核酸分子轉(zhuǎn)化的破囊壺菌目微生物對選自如下的化合物降低的敏感性磺酰脲化合物,咪唑啉酮類抑制劑,或嘧啶基羥苯甲酸鹽。
12.重組核酸分子,包含與轉(zhuǎn)錄控制序列可操作性連接的權(quán)利要求1的分離的核酸分子。
13.用權(quán)利要求12所述重組核酸分子轉(zhuǎn)化的破囊壺菌目的重組微生物。
14.用于轉(zhuǎn)化破囊壺菌目微生物的重組載體,包含編碼乙酰乳酸合酶的核酸序列,該乙酰乳酸合酶賦予破囊壺菌目微生物對選自如下的化合物降低的敏感性磺酰脲化合物,咪唑啉酮類抑制劑,或嘧啶基羥苯甲酸鹽,其中所述乙酰乳酸合酶具有選自如下的氨基酸序列a.選自SEQ ID NO19,SEQ ID NO22或SEQ ID NO24的氨基酸序列;和,b.與氨基酸序列(a)至少約75%相同的氨基酸序列;其中所述編碼乙酰乳酸合酶的核酸序列與轉(zhuǎn)錄控制序列可操作性連接。
15.權(quán)利要求14的重組載體,其中所述重組載體是表達載體。
16.權(quán)利要求14的重組載體,其中所述重組載體靶向載體。
17.權(quán)利要求14的重組載體,其中所述核酸序列編碼具有與氨基酸序列(a)至少約85%相同的氨基酸序列的乙酰乳酸合酶。
18.權(quán)利要求14的重組載體,其中所述核酸序列編碼具有與氨基酸序列(a)至少約95%相同的氨基酸序列的乙酰乳酸合酶。
19.權(quán)利要求14的重組載體,其中所述核酸序列編碼具有與SEQ ID NO15不同的氨基酸序列的蛋白,該不同是由于在選自116G,117A,192P,200A,251K,358M,383D,592V,595W或599F的氨基酸位置發(fā)生氨基酸缺失,插入或取代。
20.權(quán)利要求14的重組載體,其中所述乙酰乳酸合酶具有選自SEQ IDNO19,SEQ ID NO22或SEQ ID NO24的氨基酸序列。
21.權(quán)利要求14的重組載體,其中所述核酸序列選自SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,或SEQ ID NO23的核苷酸1260-3314。
22.權(quán)利要求14的重組載體,其中所述轉(zhuǎn)錄控制序列選自破囊壺菌目α-微管蛋白啟動子,破囊壺菌目乙酰乳酸合酶啟動子,來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子,或破囊壺菌目脂肪酸脫氫酶啟動子。
23.權(quán)利要求14的重組載體,其中所述載體包含選自SEQ ID NO18,SEQ ID NO21或SEQ ID NO23的核酸序列。
24.轉(zhuǎn)化破囊壺菌目微生物細胞的方法,所述方法包括a.向破囊壺菌目微生物細胞中引入包含編碼乙酰乳酸合酶的核酸序列的重組核酸分子,所述乙酰乳酸合酶賦予所述細胞對選自如下的化合物降低的敏感性磺酰脲化合物,咪唑啉酮類抑制劑,或嘧啶基羥苯甲酸鹽,其中所述乙酰乳酸合酶具有選自如下的氨基酸序列i.選自SEQ ID NO19,SEQ ID NO22或SEQ ID NO24的氨基酸序列;和,ii.與氨基酸序列(i)至少約75%相同的氨基酸序列;并且,b.選擇用所述重組核酸分子成功轉(zhuǎn)化的細胞,方法是在包含至少一種抑制未轉(zhuǎn)化細胞的化合物的培養(yǎng)基中培養(yǎng)(a)所述細胞,所述化合物選自磺酰脲化合物,咪唑啉酮類抑制劑,或嘧啶基羥苯甲酸鹽。
25.權(quán)利要求24的方法,其中所述核酸序列編碼具有與氨基酸序列(i)至少約85%相同的氨基酸序列的乙酰乳酸合酶。
26.權(quán)利要求24的方法,其中所述核酸序列編碼具有與氨基酸序列(i)至少約95%相同的氨基酸序列的乙酰乳酸合酶。
27.權(quán)利要求24的方法,其中所述核酸序列編碼具有與SEQ ID NO15不同的氨基酸序列的蛋白,該不同是由于在選自116G,117A,192P,200A,251K,358M,383D,592V,595W或599F的氨基酸位置氨基酸發(fā)生缺失,插入或取代。
28.權(quán)利要求24的方法,其中所述乙酰乳酸合酶具有選自SEQ ID NO19,SEQ ID NO22或SEQ ID NO24的氨基酸序列。
29.權(quán)利要求24的方法,其中所述核酸序列選自SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314或SEQ ID NO23的核苷酸1260-3314。
30.權(quán)利要求24的方法,其中所述核酸序列與轉(zhuǎn)錄控制序列可操作性連接,所述轉(zhuǎn)錄控制序列選自破囊壺菌目α-微管蛋白啟動子,破囊壺菌目乙酰乳酸合酶啟動子,來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子,或破囊壺菌目脂肪酸脫氫酶啟動子。
31.權(quán)利要求24的方法,其中所述重組核酸分子還包含編碼由所述細胞產(chǎn)生的蛋白的核酸序列,其中編碼所述蛋白的所述核酸序列與轉(zhuǎn)錄控制序列可操作性連接。
32.權(quán)利要求31的方法,其中所述蛋白與二十二碳六烯酸(DHA),二十二碳五烯酸(DPA),二十碳五烯酸(EPA)或二十碳四烯酸(ARA)的脂肪酸的合成相關(guān)。
33.權(quán)利要求31的方法,其中所述蛋白選自脂肪酸合酶,脂肪酸脫氫酶,脂肪酸延伸酶,與聚酮化合物合酶復合體相關(guān)的蛋白,或與將脂肪酸摻入磷脂或摻入三甘油酯分子相關(guān)的蛋白。
34.權(quán)利要求31的方法,其中所述蛋白為核酸序列SEQ ID NO29編碼的ω-3脂肪酸脫氫酶。
35.權(quán)利要求31的方法,其中所述蛋白為多烯脂肪酸異構(gòu)酶。
36.權(quán)利要求31的方法,其中所述蛋白選自HMG-CoA合酶,HMG-CoA還原酶,角鯊烯合酶,八氫番茄紅素合酶,八氫番茄紅素脫氫酶,類胡蘿卜素環(huán)化酶,類胡蘿卜素羥化酶,類胡蘿卜素酮酶,維生素E或硫辛酸。
37.權(quán)利要求24的方法,其中步驟(a)中的所述重組核酸分子還包含與所述微生物中的靶核酸序列雜交的核酸序列,從而包含所述靶核酸序列的基因通過與所述第二種核酸序列發(fā)生同源重組而被突變或滅活。
38.權(quán)利要求37的方法,其中所述靶核酸序列編碼選自如下的蛋白脂肪酶,脂肪酸氧化酶,參與糖類合成的蛋白,參與類異戊二烯途徑的產(chǎn)物的合成的蛋白,參與細胞壁組分合成的蛋白,參與飽和脂肪酸合成途徑的蛋白,參與多不飽和脂肪酸合成途徑的蛋白,與聚酮化合物合酶復合體相關(guān)的蛋白,或與將脂肪酸摻入磷脂或三甘油酯分子相關(guān)的蛋白。
39.權(quán)利要求24的方法,還包括向所述細胞引入至少一種附加的重組核酸分子的步驟,該重組核酸分子包含編碼需要表達的蛋白的核酸序列,所述核酸序列與轉(zhuǎn)錄控制序列可操作性連接。
40.權(quán)利要求24的方法,還包闊向所述細胞引入至少一種附加的重組核酸分子的步驟,該重組核酸分子包含與所述微生物中的靶核酸序列雜交的第二種核酸序列,從而包含所述靶核酸序列的基因通過與所述第二種核酸序列發(fā)生同源重組而被突變或滅活。
41.權(quán)利要求24的方法,還包括向所述細胞中引入包含編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子的步驟。
42.權(quán)利要求41的方法,其中所述包含編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子還包含編碼被所述細胞表達的第二種蛋白的核酸序列,其中編碼所述第二種蛋白的所述核酸序列與轉(zhuǎn)錄控制序列可操作性連接。
43.權(quán)利要求42的方法,其中所述轉(zhuǎn)錄控制序列選自破囊壺菌目α-微管蛋白啟動子,破囊壺菌目乙酰乳酸合酶啟動子,來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子,或破囊壺菌目脂肪酸脫氫酶啟動子。
44.權(quán)利要求41的方法,其中所述包含編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子還包含可與所述微生物中的靶核酸序列雜交的第二種核酸序列,從而包含所述靶核酸序列的基因通過與所述第二種核酸序列發(fā)生同源重組而被突變或滅活。
45.權(quán)利要求41的方法,其中所述重組核酸分子包含核酸序列SEQ IDNO9。
46.權(quán)利要求24的方法,其中所述微生物來自破囊壺菌屬,Labyrinthuloides屬,Japonochytrium屬,或Schizochytrium屬。
47.權(quán)利要求24的方法,其中所述微生物來自選自如下的物種Schizochytrium sp.,Schizochytrium aggregatum,Schizochytriumlimacinum,Schizochytrium minutum,Thraustochytrium sp.,Thraustochytriumstriatum,Thraustochytrium aureum,Thraustochytrium roseum,或Japonochytrium sp.。
48.權(quán)利要求24的方法,其中所述引入步驟用選自粒子轟擊,電穿孔,顯微注射,脂轉(zhuǎn)染,吸附,感染或原生質(zhì)體融合的方法完成。
49.破囊壺菌目的重組微生物,用包含編碼乙酰乳酸合酶的核酸序列的重組核酸分子轉(zhuǎn)化,所述乙酰乳酸合酶賦予所述微生物對選自磺酰脲化合物,咪唑啉酮類抑制劑,或嘧啶基羥苯甲酸鹽的化合物降低的敏感性,其中所述乙酰乳酸合酶具有選自如下的氨基酸序列a.選自SEQ ID NO19,SEQ ID NO22或SEQ ID NO24的氨基酸序列;和,b.與氨基酸序列(a)至少約75%相同的氨基酸序列。
50.權(quán)利要求49的重組微生物,其中所述核酸序列編碼具有與氨基酸序列(a)至少約85%相同的氨基酸序列的乙酰乳酸合酶。
51.權(quán)利要求49的重組微生物,其中所述核酸序列編碼具有與氨基酸序列(a)至少約95%相同的氨基酸序列的乙酰乳酸合酶。
52.權(quán)利要求49的重組微生物,其中所述乙酰乳酸合酶具有選自SEQID NO19,SEQ ID NO22或SEQ ID NO24的氨基酸序列。
53.權(quán)利要求49的重組微生物,其中所述核酸序列選自SEQ ID NO18的核苷酸1260-3314,SEQ ID NO21的核苷酸1260-3314,或SEQ ID NO23的核苷酸1260-3314。
54.權(quán)利要求49的重組微生物,其中所述重組核酸分子包含選自SEQID NO18,SEQ ID NO21或SEQ ID NO23的核酸序列。
55.權(quán)利要求49的重組微生物,其中所述編碼乙酰乳酸合酶的核酸序列與在破囊壺菌目微生物中起作用的啟動子可操作性連接。
56.權(quán)利要求49的重組微生物,其中所述編碼乙酰乳酸合酶的核酸序列與選自如下的轉(zhuǎn)錄控制序列可操作性連接破囊壺菌目α-微管蛋白啟動子,破囊壺菌目乙酰乳酸合酶啟動子,來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子,或破囊壺菌目脂肪酸脫氫酶啟動子。
57.權(quán)利要求49的重組微生物,其中所述重組核酸分子還包含編碼由所述微生物產(chǎn)生的第一種蛋白的核酸序列,其中編碼所述第一種蛋白的核酸序列與轉(zhuǎn)錄控制序列可操作地連接。
58.權(quán)利要求49的重組微生物,其中所述重組細胞還用包含編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子轉(zhuǎn)化。
59.權(quán)利要求58的重組微生物,其中所述重組核酸分子包含核酸序列SEQ ID NO9。
60.權(quán)利要求58的重組微生物,其中所述包含編碼博來霉素-結(jié)合蛋白的核酸序列的重組核酸分子還包含編碼所述細胞產(chǎn)生的第二種蛋白的核酸序列,其中編碼所述第二種蛋白的所述核酸序列與轉(zhuǎn)錄控制序列可操作地連接。
61.權(quán)利要求49的重組微生物,還包含至少一種附加的重組核酸分子,該分子包含編碼所述細胞產(chǎn)生的蛋白的核酸序列。
62.分離的核酸分子,包含選自如下的核酸序列a.SEQ ID NO9的核苷酸441-894;b.與SEQ ID NO9的核苷酸441-894全長有至少約95%相同的核酸序列,其中所述核酸序列具有至少基本的α-微管蛋白啟動子轉(zhuǎn)錄活性;和c.分離的多核苷酸,包含與所述多核苷酸(a)或(b)完全互補的核酸序列。
63.權(quán)利要求62的分離的核酸分子,其中所述分離的核酸分子包含SEQID NO4的核酸序列或包含SEQ ID NO9的核苷酸441-894。
64.用于轉(zhuǎn)化破囊壺菌目微生物的重組載體,包含可操作性連接到如下啟動子的編碼博來霉素結(jié)合蛋白的核酸序列破囊壺菌目α-微管蛋白啟動子,破囊壺菌目乙酰乳酸合酶啟動子,來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子,或破囊壺菌目脂肪酸脫氫酶啟動子。
65.權(quán)利要求64的重組載體,其中所述破囊壺菌目乙酰乳酸合酶啟動子包含SEQ ID NO14的核苷酸1-1259。
66.權(quán)利要求64的重組載體,其中所述α-微管蛋白啟動子包含SEQ IDNO9的核苷酸441-894,或包含與SEQ ID NO9的核苷酸441-894全長有至少約95%相同的核酸序列,其中所述核酸序列具有至少基本的α-微管蛋白啟動子轉(zhuǎn)錄活性。
67.權(quán)利要求64的重組載體,其中所述重組載體包含選自SEQ ID NO8或SEQ ID NO9的核酸序列。
68.權(quán)利要求64的重組載體,其中所述來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子包含SEQ ID NO34或其至少具有基本的PKS啟動子轉(zhuǎn)錄活性的片段。
全文摘要
本發(fā)明公開了均來自破囊壺菌目微生物的乙酰乳酸合酶,乙酰乳酸合酶調(diào)控區(qū),α-微管蛋白啟動子,來自破囊壺菌目聚酮化合物合酶(PKS)系統(tǒng)的啟動子,和脂肪酸脫氫酶啟動子的核酸和氨基酸序列。本發(fā)明也公開了用于破囊壺菌目微生物轉(zhuǎn)化的重組載體,和轉(zhuǎn)化破囊壺菌目微生物的方法。所述本發(fā)明的重組核酸分子可被用于外源核酸在破囊壺菌目微生物的表達,和基因在破囊壺菌目微生物的去除,突變或滅活。
文檔編號C12N1/21GK1556850SQ02812059
公開日2004年12月22日 申請日期2002年4月16日 優(yōu)先權(quán)日2001年4月16日
發(fā)明者保羅·G·羅斯勒, T·戴夫·馬修斯, 湯姆·M·拉姆西爾, 詹姆斯·G·梅茨, G 梅茨, M 拉姆西爾, 保羅 G 羅斯勒, 頡ぢ硇匏 申請人:馬泰克生物科學公司