專利名稱:耐高溫甲基乙二醛合酶基因序列及編碼的多肽和制備方法
技術(shù)領(lǐng)域:
本發(fā)明涉及突變或遺傳工程,尤其涉及一種耐高溫甲基乙二醛合酶基因序列及編碼的多肽和制備方法。
背景技術(shù):
甲基乙二醛合酶先將磷酸二羥丙酮轉(zhuǎn)化為順式磷酸烯二醇中間體,再催化順式磷酸烯二醇中間體脫磷酸形成烯醇式甲基乙二醛。該酶在酶學(xué)分類中屬于裂合酶。
大腸桿菌中的甲基乙二醛合酶分子量60KD,最適PH7.5,Km為0.53mM,Vmax為1.56mmol/min·mg。通常認(rèn)為甲基乙二醛合酶和磷酸丙糖異構(gòu)酶(TIM)的催化反應(yīng)機(jī)理相同。兩種酶在代謝反應(yīng)中的第一步都是利用磷酸二羥丙酮(DHAP)合成順式磷酸烯二醇中間體。在代謝途經(jīng)中的第二步,甲基乙二醛合酶起脫磷酸作用,把烯二醇轉(zhuǎn)化成甲基乙二醛,而不是像磷酸丙糖異構(gòu)酶那樣催化形成3-磷酸甘油醛的異構(gòu)體。利用x射線衍射分析得知大腸桿菌中的甲基乙二醛合酶是由五股β/α蛋白單體構(gòu)成的等六邊體,而不是象磷酸丙糖異構(gòu)酶那樣的α/β桶狀結(jié)構(gòu)。三個(gè)單體中每個(gè)單體的不對(duì)稱單元里保守殘基都是His19,Asp71,His98,這些三個(gè)單體中不對(duì)稱單元的不同處在于活性位點(diǎn)的入口部位及其是否結(jié)合磷酸根離子。結(jié)構(gòu)信息表明Asp71是起催化作用的堿基,而且Asp20和Asp101同亞基之間負(fù)責(zé)連接的鹽橋有關(guān),這些鹽橋負(fù)責(zé)異構(gòu)化信息的傳導(dǎo)。
提純釀酒酵母中的甲基乙二醛合酶,得到了具有20%活性的產(chǎn)物。該酶在聚丙烯酰胺凝膠中非常均一,由分子量為26000的單一多肽鏈組成。它在PH9.5-PH10.5催化活性最高,并對(duì)磷酸二羥丙酮有催化特效,此時(shí)Km為3mM。磷酸烯醇式丙酮酸,三磷酸甘油,正磷酸與硫醇混合物都是該酶潛在的抑制劑。
在研究糖酵解,脂降解,磷酸丙酮,甲基乙二醛等相關(guān)代謝途徑,注釋相關(guān)代謝途徑的基因,實(shí)現(xiàn)功能基因組研究等方面有重要意義。
騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis),是生活在我國云南省騰沖縣的熱泉中的一種微生物,是一種嗜熱的真細(xì)菌(eubacteria),最適生長溫度為75攝氏度,厭氧生長,革蘭氏染色反應(yīng)呈陽性。它由中國科學(xué)院微生物所首先發(fā)現(xiàn)并進(jìn)行了分類學(xué)上的分析。菌種保存在中國微生物保存中心MB4T(=Chinese collection of microorganisms AS 1.2430T=JCM 11007T)。該嗜熱厭氧菌是我國特有的一個(gè)物種,其體內(nèi)所具有的耐高溫甲基乙二醛合酶也具有自己特有的結(jié)構(gòu)。
發(fā)明內(nèi)容
本發(fā)明的目的之一是提供一種分離的,編碼具有耐高溫甲基乙二醛合酶蛋白活性的多肽的核苷酸序列。
本發(fā)明的目的之二是提供一種分離的,具有耐高溫甲基乙二醛合酶蛋白活性的多肽。
本發(fā)明的目的還提供了嗜熱厭氧菌的耐高溫甲基乙二醛合酶重組載體、含有重組載體的宿主細(xì)胞,以及生產(chǎn)蛋白的方法。
本發(fā)明一方面提供一種能編碼具有耐高溫甲基乙二醛合酶蛋白活性的多肽的核苷酸序列。所說的核苷酸序列編碼具有SEQ ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與甲基乙二醛合酶蛋白相關(guān)。核苷酸序列具有SEQ.ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯(cuò)義。
本發(fā)明另一方面提供了一種耐高溫甲基乙二醛合酶蛋白活性的多肽。該多肽具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
生產(chǎn)耐高溫甲基乙二醛合酶蛋白的方法為1)分離出編碼耐高溫甲基乙二醛合酶蛋白的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫甲基乙二醛合酶蛋白的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫甲基乙二醛合酶蛋白。
本發(fā)明涉及嗜熱厭氧菌的耐高溫甲基乙二醛合酶基因的分離及表達(dá)。以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫甲基乙二醛合酶基因。
該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫甲基乙二醛合酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫甲基乙二醛合酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫甲基乙二醛合酶活性的多肽的方法。
圖1是測序文庫構(gòu)建步驟流程圖;圖2是測序與數(shù)據(jù)分析流程圖;圖3是位于兩個(gè)contig上的一對(duì)正反向測序序列可以用來分析contig間的間距和確定兩contig的位置關(guān)系,如方向;圖4是同一插入片斷(如同一Cosmid)的兩端測序序列同處于一條contig中,可以檢驗(yàn)拼接正確性。
具體實(shí)施例方式
首先,本發(fā)明提供了分離的,編碼耐高溫甲基乙二醛合酶活性的多肽的多聚核苷酸分子,該核苷酸分子是通過對(duì)騰沖嗜熱厭氧菌全基因組測序與分析而獲得的,具有SEQ ID NO.1的核苷酸序列,它編碼具有129個(gè)氨基酸閱讀框的多肽,推測分子量為14215道爾頓。
本發(fā)明還涉及一種重組載體,該載體包含本發(fā)明的分離的核苷酸分子,以及包含有重組載體的宿主細(xì)胞。同時(shí),本發(fā)明包括構(gòu)建該重組載體和宿主細(xì)胞的方法,以及用重組工程技術(shù)生產(chǎn)耐高溫甲基乙二醛合酶的方法。
本發(fā)明進(jìn)一步地提供了一種分離的耐高溫甲基乙二醛合酶或多肽,其特征在于具有SEQ ID NO.2氨基酸序列,或至少70%相似,更佳地,至少具有90%,95%,99%的相同。
在本發(fā)明中,“分離的”DNA是指該DNA或片斷已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來,還指該DNA或片斷已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開,而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開。
在本發(fā)明中,“耐高溫甲基乙二醛合酶基因”指編碼具有耐高溫甲基乙二醛合酶活性的多肽的核苷酸序列,如SEQ ID NO.1的核苷酸序列及其簡并序列。該簡并序列是指該序列中有一個(gè)或多個(gè)密碼子被編碼相同氨基酸的簡并密碼子所取代后而產(chǎn)生的序列。由于公知的密碼子的簡并性,所以與SEQ ID NO.1核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ ID NO.2所述的氨基酸序列。該術(shù)語還包括能在中度嚴(yán)謹(jǐn)條件下,更佳地在高度嚴(yán)謹(jǐn)條件下與SEQ ID NO.1的核苷酸序列雜交的核苷酸序列。該術(shù)語還包括與SEQ ID NO.1核苷酸序列同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本發(fā)明中,“分離的”蛋白質(zhì)或多態(tài)是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計(jì))。純度可以用任何合適的方法進(jìn)行測量,如用柱層析,PAGE或HPLC法測量多肽的純度。分離的多肽基本上不含天然狀態(tài)下的伴隨其的組份。
在本發(fā)明中,“耐高溫甲基乙二醛合酶蛋白”指具有耐高溫甲基乙二醛合酶活性的,具有SEQ.ID N0.2序列的多肽。該術(shù)語還包括SEQ.ID NO.2序列的變異體,這些變異體具有與天然耐高溫甲基乙二醛合酶相同的功能。這些變異體包括(但不限于)若干個(gè)氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸,也可以是不影響序列的修飾形式上的差異。例如,為本領(lǐng)域所公知的,用性能相近或相似的氨基酸進(jìn)行取代時(shí),通常不會(huì)改變蛋白質(zhì)的功能。又比如,在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸通常也不會(huì)改變蛋白質(zhì)的功能。該術(shù)語還包括甲基乙二醛合酶的活性片斷和活性衍生物。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的各種質(zhì)粒,粘粒,噬菌體及反轉(zhuǎn)錄病毒等。在生產(chǎn)本發(fā)明的耐高溫甲基乙二醛合酶時(shí),可以將耐高溫甲基乙二醛合酶基因序列可操作地連于表達(dá)調(diào)控序列,從而形成耐高溫甲基乙二醛合酶表達(dá)載體。表達(dá)載體含有復(fù)制起始點(diǎn)和表達(dá)調(diào)控序列,啟動(dòng)子,增強(qiáng)子和必要的加工信息位點(diǎn)。表達(dá)載體還必須含有可供選擇的標(biāo)記基因,如a)提供對(duì)抗生素或其他毒性物質(zhì)(氨芐青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白質(zhì)或b)互補(bǔ)營養(yǎng)缺陷型蛋白質(zhì)或c)提供復(fù)合培養(yǎng)基中沒有的必需營養(yǎng)成分的蛋白質(zhì)。各種不同宿主的合適標(biāo)記基因是本領(lǐng)域中所熟知或生產(chǎn)廠商說明書著名的。這些表達(dá)載體可以用本領(lǐng)域技術(shù)人員公知的重組DNA技術(shù)制備,如可參考Sambrook等人,1989或Ausubel等人,1992。
重組表達(dá)載體可以用本領(lǐng)域熟知的方法引入宿主細(xì)胞,這些方法包括電轉(zhuǎn)化法,氯化鈣法,基因槍法等。將外源重組載體導(dǎo)入宿主細(xì)胞的過程稱為“轉(zhuǎn)化”。通過培養(yǎng)宿主細(xì)胞,誘導(dǎo)所需蛋白的表達(dá),并通過本領(lǐng)域所熟知的蛋白分離技術(shù),如柱層析等得到所需的蛋白質(zhì)。也可采用固相技術(shù)等人工合成該蛋白質(zhì)。
在本發(fā)明中,術(shù)語“宿主細(xì)胞”包括原核細(xì)胞和真核細(xì)胞。常用的原核細(xì)胞如大腸桿菌,枯草桿菌等。常用的真核細(xì)胞如酵母細(xì)胞,或各種動(dòng)植物細(xì)胞。
本發(fā)明的耐高溫甲基乙二醛合酶基因全長序列或其片斷通??梢杂肞CR擴(kuò)增法,重組法,或人工合成的方法獲得。對(duì)于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列來設(shè)計(jì)引物,用本領(lǐng)域技術(shù)人員已知的常規(guī)方法制備的嗜熱厭氧菌全基因組DNA為模板,擴(kuò)增而得到有關(guān)序列。一旦獲得了有關(guān)序列,就可以將其克隆入有關(guān)載體,再轉(zhuǎn)入宿主細(xì)胞,然后通過常規(guī)方法從增殖后的宿主細(xì)胞中分離得到大批量的有關(guān)序列。
本發(fā)明以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫甲基乙二醛合酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫甲基乙二醛合酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫甲基乙二醛合酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫甲基乙二醛合酶活性的多肽的方法。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。應(yīng)理解,這些實(shí)施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(cè)(NewYorkCold Spring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例1構(gòu)建測序文庫測序文庫的構(gòu)建采用全基因組霰彈法(shotgun)進(jìn)行。首先培養(yǎng)騰沖嗜熱厭氧菌,培養(yǎng)方法按(Yanfen Xue,2000)改進(jìn)的MB培養(yǎng)基(Balch et al.,1979),按Marmur(1961)方法收集細(xì)菌,提取總DNA。為了保證測序文庫構(gòu)建的隨機(jī)性,最大程度地避免產(chǎn)生斷裂熱點(diǎn)的問題,采用多種方法、不同條件的建庫原則。先采用物理剪切方法(包括超聲波法及用Hydroshear Machine進(jìn)行剪切),其次根據(jù)該菌基因組特征選用AluI進(jìn)行隨機(jī)部分酶切。物理剪切時(shí)采用不同強(qiáng)度處理樣品,酶切時(shí)通過設(shè)置酶量梯度處理樣品。處理后的樣品經(jīng)平末端處理后,采用電泳分部收集1.5-4kb DNA片段,與去磷酸化的經(jīng)SmaI酶切的pUC18進(jìn)行連接,連接產(chǎn)物通過電轉(zhuǎn)化E.coli DH5α構(gòu)建了隨機(jī)測序的文庫。同時(shí),為了便于以后長片斷(contig)的搭接還構(gòu)建了長插入片段(10kb左右)的測序文庫(將基因組DNA以Sau3AI隨機(jī)部分酶切,電泳收集10kb左右的片段,與去磷酸化的經(jīng)BamHI酶切的pUC18進(jìn)行連接、構(gòu)建文庫)。該文庫經(jīng)兩個(gè)末端的測序在完成圖(finishing)的過程中可以得到長片斷之間的關(guān)系,并可以解決較大的gap對(duì)補(bǔ)洞造成的困難。建庫流程如(見圖1)。
實(shí)施例2基因組測序在完成騰沖嗜熱厭氧菌基因組的測序時(shí),主要使用了兩種全自動(dòng)測序儀ABI377和MegaBACE 1000。這兩種測序儀都是利用電泳原理進(jìn)行測序(見圖2),每次可完成96個(gè)樣品。ABI377是PE公司的產(chǎn)品,是ABI系列的一種。它屬于平板凝膠電泳測序儀。MegaBACE 1000是法瑪西亞公司的產(chǎn)品,屬于毛細(xì)管凝膠電泳測序儀。
實(shí)施例3Basecalling和測序質(zhì)量監(jiān)控所謂Basecalling是指從測序儀上得到的原始數(shù)據(jù)文件中得到正確的堿基序列的過程。由于測序儀上得到的是A,T,G,C四種堿基對(duì)應(yīng)的不同波長的光的強(qiáng)度變化軌跡(trace),需要用計(jì)算機(jī)采取一定的算法從中正確識(shí)別出不同的軌跡對(duì)應(yīng)的堿基。這里我們使用的是Phred軟件(EwingB,HillierL,1998),原因是其結(jié)果更可靠,并且其結(jié)果輸出更便于同一軟件包中的其他程序進(jìn)行進(jìn)一步的分析。
Phred進(jìn)行Basecalling的算法原理,是根據(jù)軌跡中各個(gè)峰的形狀,間距,以及信噪比等因素,判斷堿基類型,同時(shí)對(duì)這個(gè)堿基給出可信度信息,即堿基的測序質(zhì)量。在大規(guī)模測序中,測序質(zhì)量的監(jiān)控是十分重要的,它直接影響對(duì)測序的決策,包括文庫的構(gòu)建,覆蓋率的大小。同時(shí)對(duì)測序?qū)嶒?yàn)中可能出現(xiàn)的失誤能及時(shí)反饋。
實(shí)施例4序列拼接所謂序列拼接,就是把全基因組霰彈法,又稱鳥槍法隨機(jī)測序得到的樣品序列組裝成連續(xù)的長片斷,主要利用它們之間的重疊序列作參考??紤]到測序中存在載體的影響,需要先對(duì)樣品序列進(jìn)行去載體處理。這里所用的軟件cross_match和后面拼接所用的軟件Phrap都是美國Washington大學(xué)的軟件(Gordon D,Abajian C,1998),其基本原理為Swith-Waterman算法(WatermanMS,1990)。這是一種動(dòng)態(tài)算法,在考慮了兩兩序列之間的比較之后,可以得到一組序列的公有序列(consensus sequence)。去除載體后的樣品序列再用Phrap進(jìn)行拼接。在拼接時(shí),堿基的測序質(zhì)量也被考慮了,所得到的公有序列各堿基的可信度,由組成該公有序列的樣品的測序質(zhì)量計(jì)算得到。
實(shí)施例5基因注釋在大體得到基因組的大部分序列(完成工作框架圖)后,就需要對(duì)基因組進(jìn)行注釋,包括進(jìn)行開讀框架(Open Reading Frame,ORF)的預(yù)測,基因功能的預(yù)測,以及特殊RNA片斷的分析等。第一步采用缺省參數(shù)的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)軟件預(yù)測基因編碼序列,然后所有預(yù)測的開讀框和非編碼區(qū)(intergenic region)都用BLAST軟件(Altschul,S.F.et al.1997)與NCBI的無冗余蛋白數(shù)據(jù)庫(non-redundant protein database)比較來發(fā)現(xiàn)可能漏掉的基因。在判斷一個(gè)基因的起始點(diǎn)時(shí),將參考各種相關(guān)信息,如序列同源性,核糖體結(jié)合位點(diǎn),可能的信號(hào)肽序列和啟動(dòng)子序列等。如果在一個(gè)開讀框內(nèi)出現(xiàn)多個(gè)啟動(dòng)子時(shí),一般采用第一個(gè)啟動(dòng)子作為基因的起始點(diǎn)。采用TransTerm軟件(Ermolaeva,M.D.2000)在非編碼區(qū)預(yù)測不依賴于Rho(ρ)因子的轉(zhuǎn)錄終止子。如果該終止子位于一個(gè)基因的下游區(qū)的太遠(yuǎn)處,則可能暗示一個(gè)小基因的丟失或測序錯(cuò)誤人為地縮短了該基因,可作為進(jìn)一步分析的參考。在確定移框突變和點(diǎn)突變時(shí),主要根據(jù)與數(shù)據(jù)庫中的蛋白質(zhì)的相似性來判斷。如果出現(xiàn)一個(gè)蛋白質(zhì)對(duì)應(yīng)于兩個(gè)彼此相鄰的編碼序列的情況,則被認(rèn)為是一個(gè)無活性基因(假基因pseudogenes),因?yàn)檫@說明這兩個(gè)編碼序列之間由于突變而產(chǎn)生異常中止現(xiàn)象,進(jìn)而使基因失去活性。所有分析結(jié)果再用Artemis sequence viewer軟件(Rutherford,K.et al.2000)進(jìn)行手工分析。一些明顯與其它編碼序列有重疊的開讀框,長度小于150堿基對(duì)并且在已有數(shù)據(jù)庫中沒有同源性和其中沒有明顯的啟動(dòng)子或終止區(qū)域的開讀框?qū)⒈蝗コ?br>
蛋白質(zhì)的功能片斷(motif)和功能區(qū)域(domain)分別采用與Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫進(jìn)行比對(duì)分析,結(jié)果再用InterPro數(shù)據(jù)庫(Apweiler,R.et al.2001)進(jìn)行匯總分析。根據(jù)NCBI的COGs數(shù)據(jù)庫(Tatusov,R.L.et al.2001)并且參照其他數(shù)據(jù)庫的查詢結(jié)果來確定蛋白質(zhì)在COGs分類中的功能分類和可能的代謝途徑。用TMHMM軟件(Krogh,A.et al.2001)來確認(rèn)膜蛋白、ABC轉(zhuǎn)運(yùn)蛋白和跨膜功能域。采用革蘭氏陰性菌為參數(shù),用SIGNALP2.0軟件(Nielsen,H.et al.1999)分析信號(hào)肽區(qū)域。
(4)補(bǔ)洞在完成基因組的工作框架圖之后,就要進(jìn)行更加困難的補(bǔ)洞工作,即完成整個(gè)基因組100%的測序,得到一個(gè)環(huán)形基因組。主要工作就是把前面得到的contig連接起來。這是一項(xiàng)十分具體而又繁雜的工作。主要方法包括A.利用測序中的正反向測序樣品信息在測序過程中,我們有意對(duì)某些樣品進(jìn)行了雙向測序,即同時(shí)測序某個(gè)插入片斷的兩端,再將所得序列與其他序列一起進(jìn)行拼接。由于這一對(duì)序列在基因組上的關(guān)系一定,其之間的距離大致已知,根據(jù)這一信息,一可以確認(rèn)某段contig是否可靠,二是當(dāng)這一對(duì)序列分別位于不同的contig上時(shí),可以確定這兩個(gè)contig的方向關(guān)系和位置關(guān)系,為進(jìn)一步設(shè)計(jì)實(shí)驗(yàn)提供參考(見圖3)。
B.長插入片斷及Cosmid末端測序基于同樣的原理,我們可以構(gòu)建不同長度的插入片斷文庫,只對(duì)其兩端測序,然后拼接,分析其具體位置。這些文庫包括長度為9-12Kb的長插入片斷庫和20-40Kb左右的Cosmid文庫。具體分析方法同上所述。圖4所示為部分Cosmid末端測序結(jié)果。
總體說來,根據(jù)A中的末端分析,基本上可以以15次正反向測序來補(bǔ)一個(gè)洞(Gap),前一階段的結(jié)果中近100個(gè)Gap由此方法補(bǔ)上。進(jìn)一步的分析以及長插入片斷和Cosmid的分析正在進(jìn)行。
C.PCR和末端延伸Walking實(shí)驗(yàn)根據(jù)A和B所提供的contig方向和位置關(guān)系,進(jìn)一步的生物化學(xué)實(shí)驗(yàn)就可以進(jìn)行了。如設(shè)計(jì)一對(duì)引物進(jìn)行PCR擴(kuò)增,或以某一contig末端序列合成引物進(jìn)行末端延伸(Walking)來補(bǔ)洞等。
實(shí)施例6甲基乙二醛合酶的制備和提純根據(jù)實(shí)施例中基因注釋得到的甲基乙二醛合酶全長編碼序列(SEQ IDNO.1),設(shè)計(jì)能擴(kuò)增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內(nèi)切酶位點(diǎn),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的測序文庫的質(zhì)粒DNA為模板,經(jīng)PCR擴(kuò)增后,在保證閱讀框正確的前提下重組至pGEX-2T載體(Pharmacia,Piscataway,NJ)。再將重組載體轉(zhuǎn)化入大腸桿菌DH5α中(轉(zhuǎn)化方法為CaCL2法或電轉(zhuǎn)化法)。篩選鑒定的到含有表達(dá)載體的工程菌DH5α-pGEX-2T-MgsA。
挑取單菌落的工程菌DH5α-pGEX-2T-MgsA于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)37℃過夜,按1100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時(shí),至OD600達(dá)0.5后,加入IPTG至終濃度1mmol/L,繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時(shí)。取培養(yǎng)時(shí)間不同的1ml菌液離心,在細(xì)菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時(shí)間增加而增加的菌株即為表達(dá)所需蛋白的工程菌。
按上述方法誘導(dǎo)表達(dá)所需蛋白的工程菌后,將細(xì)菌離心沉淀,按每400ml菌加入20ml PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了所需蛋白的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100□l還原型谷胱苷肽洗脫液,室溫置10分鐘,上清即為洗脫的蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進(jìn)行SDS-PAGE電泳,檢測純化效果。在14215道爾頓處的蛋白質(zhì)條帶即為甲基乙二醛合酶。
序列表1.SEQ ID NO.1
(1)序列特征a.長度390堿基對(duì)b.類型DNA/RNAc.鏈型雙鏈d.幾何結(jié)構(gòu)線性(2)分子類型核苷酸(3)序列描述atgaatatcgctcttattgcgcatgaccagaagaaagaacttatggttaactttgctatcgcttataagcacatatttgaaaaatgcaatttgtacgctacggggcacaccggacagcttataaaagaagcaacaggacttgatgttcactgcctcttgccgggacctctgggaggagaccagcagataggggctttgattgctgagaataaaattgaccttgtcattttcttgagagaccctctcactgttcagcctcatgaacctgatatacttgctcttttgagggtatgcgatgtccattcaatccctgttgctactaatattgctactgctgaagtgcttttgaaaggaatggaaatgggacttttagactggagacaaatttga2.SEQ ID NO.2(1)序列特征a.長度129氨基酸b.類型多肽c.鏈型單鏈d.幾何結(jié)構(gòu)立體(2)分子類型蛋白質(zhì)(3)序列描述MNIALIAHDQKKELMVNFAIAYKHIFEKCNLYATGHTGQLIKEATGLDVHCLLPGPLGGDQQIGALIAENKIDLVIFLRDPLTVQPHEPDILALLRVCDVHSIPVATNIATAEVLLKGMEMGLLDWRQI
權(quán)利要求
1.一種分離的DNA分子,其特征在于它是編碼具有耐高溫甲基乙二醛合酶蛋白活性的多肽的核苷酸序列。
2.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列具有SEQ.IDNO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與耐高溫甲基乙二醛合酶蛋白相關(guān)。
3.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列具有SEQ.IDNO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯(cuò)義。
4.一種分離出的多肽,其特征在于它具有耐高溫甲基乙二醛合酶蛋白活性。
5.如權(quán)利要求4所述的多肽,其特征在于它具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
6.一種載體,其特征在于它含有權(quán)利要求1中之DNA。
7.一種宿主細(xì)胞,其特征在于它是用權(quán)利要求6所述載體轉(zhuǎn)化的原核細(xì)胞或真核細(xì)胞。
8.一種制備耐高溫甲基乙二醛合酶蛋白的方法,其特征在于該方法包括1)分離出編碼耐高溫甲基乙二醛合酶蛋白的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫甲基乙二醛合酶蛋白的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫甲基乙二醛合酶蛋白。
全文摘要
本發(fā)明涉及編碼具有活性或其功能等同變異體的分離的DNA和利用重組DNA技術(shù)以所述分離的DNA生產(chǎn)具有耐高溫甲基乙二醛合酶活性的多肽或其功能等同變異體。以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫甲基乙二醛合酶基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫甲基乙二醛合酶的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫甲基乙二醛合酶活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫甲基乙二醛合酶活性的多肽的方法。
文檔編號(hào)C12N15/52GK1364907SQ0113210
公開日2002年8月21日 申請(qǐng)日期2001年11月2日 優(yōu)先權(quán)日2001年11月2日
發(fā)明者李蔚, 于軍, 鐘蘭, 王俊, 孫建冬 申請(qǐng)人:杭州華大基因研發(fā)中心