專利名稱:產(chǎn)生具有l(wèi)-天冬酰胺酶活性的分泌的多肽的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種產(chǎn)生具有L-天冬酰胺酶活性的分泌的多肽的重組方法。
背景技術(shù):
L-天冬酰胺酶(E.C.3.5.1.1)催化L-天冬酰胺水解成天冬氨酸和氨。已從不同細(xì)菌源獲得了L-天冬酰胺酶。
已經(jīng)證實(shí)了來(lái)自大腸桿菌的L-天冬酰胺酶具有抗腫瘤活性(Hill等,1967,JAMA 202882;Capizzi等,1971,Ann.Intern.Med.74893)。
Law和Wriston(Archives of Biochemistry and Biophysics 147744-7521971)公開了非分泌的凝結(jié)芽孢桿菌(Bacillus coagulans)L-天冬酰胺酶的純化和性質(zhì)。Tyul’Panova等(Microbiology 41369-374,1972)公開了腸膜芽孢桿菌(Bacillus mesentericus)43-A L-天冬酰胺酶的性質(zhì)。Nefelova等(Appl.Biochem.Microbiol.14400-403,1978/1979)公開了多粘芽孢桿菌(Bacilluspolymyxa)L-天冬酰胺酶的生物合成。
Sun和Setlow(Journal of Bacteriology 1733831-3845,1971)公開了非分泌的枯草芽孢桿菌L-天冬酰胺酶的克隆、其核苷酸序列和表達(dá)。Kunst等人(1997,Nature 390249)公開了枯草芽孢桿菌的完整基因組序列。
在本領(lǐng)域中,需要重組的分泌的L-天冬酰胺酶以有利于該酶的產(chǎn)生和回收的。
本發(fā)明的目的是提供一種具有L-天冬酰胺酶活性的分泌的多肽,以及編碼這類多肽的核酸。
發(fā)明概述本發(fā)明涉及一種產(chǎn)生具有L-天冬酰胺酶活性的分泌的多肽的重組方法,其包括(a)在有利于該多肽產(chǎn)生的條件下培養(yǎng)宿主細(xì)胞,其中所述宿主細(xì)胞含有核酸構(gòu)建體,所述核酸構(gòu)建體含有編碼分泌信號(hào)肽的第一核酸序列,其中所述第一核酸序列與編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地連接;和(b)回收該分泌的多肽。
本發(fā)明還涉及一種具有L-天冬酰胺酶活性的分離的分泌的多肽,其選自(a)具有與SEQ ID NO2的24-375位氨基酸至少70%同一性的氨基酸序列的多肽;(b)一種由核酸序列編碼的多肽,其中所述核酸序列在中度嚴(yán)謹(jǐn)條件下與以下序列雜交(i)SEQ ID NO1的70-1125位核苷酸,(ii)至少100個(gè)連續(xù)核苷酸的(i)的亞序列,或者(iii)(i)或(ii)的互補(bǔ)鏈;(c)(a)或(b)的多肽片段,其中所述多肽片段具有L-天冬酰胺酶活性。
本發(fā)明還涉及編碼所述分泌的多肽的分離的核酸序列,以及包含該核酸序列的核酸構(gòu)建體、載體和宿主細(xì)胞,和利用該分泌的多肽的方法。
圖1顯示枯草芽孢桿菌ATCC 6051A L-天冬酰胺酶的基因組DNA序列和推導(dǎo)的氨基酸序列(分別為SEQ ID NO1和2)。
圖2顯示pMDT050的限制性圖譜。
圖3顯示包含“共有序列”amyQ啟動(dòng)子的核酸序列。
發(fā)明詳述本發(fā)明涉及一種產(chǎn)生具有L-天冬酰胺酶活性的分泌的多肽的重組方法,其包括(a)在有利于該多肽產(chǎn)生的條件下培養(yǎng)宿主細(xì)胞,其中所述宿主細(xì)胞含有核酸構(gòu)建體,所述核酸構(gòu)建體含有編碼分泌信號(hào)肽的第一核酸序列,其中所述第一核酸序列與編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地連接,其中所述信號(hào)肽序列指導(dǎo)該多肽進(jìn)入細(xì)胞分泌途徑;和(b)回收該分泌的多肽。
本發(fā)明的方法有許多優(yōu)點(diǎn)。所述優(yōu)點(diǎn)包括L-天冬酰胺酶的分泌使其易于回收和純化,可高產(chǎn)量產(chǎn)生L-天冬酰胺酶的高表達(dá)構(gòu)建體,以及具有GRAS狀態(tài)的宿主細(xì)胞在生產(chǎn)中的用途。
術(shù)語(yǔ)“天冬酰胺酶活性”在本文中定義為L(zhǎng)-天冬酰胺的酰胺水解酶活性,即催化L-天冬酰胺水解為L(zhǎng)-天冬氨酸和氨。為了本發(fā)明的目的,L-天冬酰胺活性根據(jù)da Fonseca-Wollheim,F(xiàn).,Bergmeyer,H.U.& Gutmann,I.(1974)in Methoden der Enzymatischen Analyse(Bergmeyer,H.U.Hrsg.)3.Aufl.,Bd.2,S.1850-1853,Verlag Chemie,Weinheimand(1974)in Methods ofEnzymatic Analysis(Bergmeyer,H.U.ed.)2nd ed.,vol.4,pp 1802-1806,VerlagChemie,Weinheim/Academic Press,Inc.,New York and London;以及Bergmeyer,H.U.& Beutler,H.-O.(1985)in Methods of Enzymatic Analysis(Bergmeyer,H.U.,ed.)3rd ed.,vol.VIII,pp.454-461,Verlag Chemie,Weinheim,Deerfield Beach/Florida,Base所描述的方法進(jìn)行測(cè)定。在谷氨酸脫氫酶和還原型煙酰胺腺嘌呤二核苷酸(NADH)存在的條件下,將在L-天冬酰胺酶將L-天冬酰胺轉(zhuǎn)變?yōu)長(zhǎng)-天冬氨酸時(shí)產(chǎn)生的氨與2-酮戊二酸反應(yīng),產(chǎn)生氧化型煙酰胺腺嘌呤二核苷酸(NAD)和L-谷氨酸。該試驗(yàn)在25℃,pH8的條件下進(jìn)行。1個(gè)單位的L-天冬酰胺酶活性定義為在25℃,pH8時(shí),每分鐘產(chǎn)生1.0微摩爾的NAD。
術(shù)語(yǔ)“核酸構(gòu)建體”在本文中定義為一種單鏈或雙鏈的核酸分子,其分離自天然存在的基因,或通過(guò)對(duì)其進(jìn)行修飾含有以自然界中不存在的方式連接和并置的核酸片段。當(dāng)核酸構(gòu)建體含有編碼序列的表達(dá)所需的所有控制序列時(shí),術(shù)語(yǔ)核酸序列構(gòu)建體與術(shù)語(yǔ)表達(dá)盒同義。術(shù)語(yǔ)“編碼序列”在本文中定義為直接表明其蛋白產(chǎn)物的氨基酸序列的核酸序列?;蚪M編碼序列的界限通常由恰好位于mRNA 5’端的開放閱讀框上游的核糖體結(jié)合位點(diǎn)(原核生物)和恰好位于mRNA 3’端的開放閱讀框下游的轉(zhuǎn)錄終止序列來(lái)確定。編碼序列可包括但不限于DNA、cDNA和重組核酸序列。
在本文中,術(shù)語(yǔ)“可操作地連接”定義為一種構(gòu)型,其中一段控制序列,如信號(hào)肽序列,位于與核酸序列的編碼序列相關(guān)的恰當(dāng)位置,使該控制序列指導(dǎo)多肽的表達(dá)。不言而喻,表達(dá)包括多肽產(chǎn)生所涉及的任何步驟,其包括但不限于,轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾和分泌。
在本發(fā)明的制備方法中,采用本領(lǐng)域熟知的方法將細(xì)胞在適于產(chǎn)生多肽的營(yíng)養(yǎng)培養(yǎng)基中培養(yǎng)。例如,細(xì)胞可在適當(dāng)?shù)呐囵B(yǎng)基中和允許多肽表達(dá)和/或分離的條件下,通過(guò)如下方法進(jìn)行培養(yǎng)搖瓶培養(yǎng)和在實(shí)驗(yàn)室或工業(yè)發(fā)酵罐中的小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù)(continuous)、分批(batch)、補(bǔ)料分批(fed-batch)或固態(tài)(solid state)發(fā)酵)。采用本領(lǐng)域熟知的方法,在含有碳源、氮源和無(wú)機(jī)鹽的適宜營(yíng)養(yǎng)培養(yǎng)基中進(jìn)行培養(yǎng)。適宜的培養(yǎng)基可從供應(yīng)商處獲得,或可根據(jù)已公開的組合物(例如,在美國(guó)典型培養(yǎng)物保藏中心(American Type Culture Collection)的目錄中的組合物)來(lái)制備。由于所述多肽被分泌入營(yíng)養(yǎng)培養(yǎng)基中,所以可直接從培養(yǎng)基中回收所述多肽。
產(chǎn)生的分泌的多肽可采用本領(lǐng)域熟知的方法分離或回收。例如,多肽可采用常規(guī)方法從營(yíng)養(yǎng)培養(yǎng)基中回收,其包括但不限于離心、過(guò)濾、提取、噴霧干燥、蒸發(fā)或沉淀。
分離的多肽可通過(guò)本領(lǐng)域熟知的多種方法進(jìn)行純化,包括但不限于層析(如離子交換層析、親合層析、疏水層析、層析聚焦和體積排阻色譜(sizeexclusion))、電泳(如制備型等電聚焦電泳)、差異溶解性法(differentialsolubility)(如硫酸銨沉淀)、SDS-PAGE或提取(extraction)(見,如ProteinPurification,J.-C.Janson和Lars Ryden編,VCH Press,紐約,1989)。
如在本文中所定義,“分離的”多肽指基本上不含有其它非天冬酰胺酶多肽的多肽,例如通過(guò)SDS-PAGE測(cè)定純度至少約為20%,優(yōu)選至少約為40%,更優(yōu)選約為60%,甚至更優(yōu)選約為80%,最優(yōu)選約為90%,甚至最優(yōu)選約為95%。
編碼信號(hào)肽的核酸序列編碼分泌信號(hào)肽的第一核酸序列與編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地連接。信號(hào)肽編碼區(qū)編碼與具有L-天冬酰胺酶活性的多肽的氨基端相連的氨基酸序列。信號(hào)肽指導(dǎo)所編碼的多肽進(jìn)入細(xì)胞分泌途徑。
任何編碼信號(hào)肽的核酸序列均可用于本發(fā)明的方法中。細(xì)菌宿主細(xì)胞的有效信號(hào)肽編碼區(qū)可獲自芽孢桿菌NCIB11837產(chǎn)麥芽糖淀粉酶基因、嗜熱脂肪芽孢桿菌α-淀粉酶基因、地衣芽孢桿菌枯草桿菌蛋白酶基因、地衣芽孢桿菌β-內(nèi)酰胺酶基因、嗜熱脂肪芽孢桿菌中性蛋白酶基因(nprT,nprS,nprM)和枯草芽孢桿菌prsA基因。其它信號(hào)肽見Simonen和Palva,1993,微生物評(píng)論(Microbiological Reviews)57109-137。
在一個(gè)優(yōu)選的實(shí)施方案中,編碼信號(hào)肽的第一核酸序列含有SEQ ID NO1的第1-69位核苷酸(其編碼SEQ ID NO2的第1-23位氨基酸)或其編碼所述信號(hào)肽的一部分的亞序列,所述信號(hào)肽的一部分保留了指導(dǎo)所編碼的多肽進(jìn)入細(xì)胞分泌途徑的能力。在另一個(gè)優(yōu)選的實(shí)施方案中,編碼信號(hào)肽的第一核酸序列是包含在位于大腸桿菌NRRL B-30558中的質(zhì)粒pCR2.1-yccC中的序列。
編碼具有L-天冬酰胺酶活性的多肽的核酸編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列可獲自任何屬的微生物。為了本發(fā)明的目的,本文中所用術(shù)語(yǔ)“獲自”與給定來(lái)源相連,是指由所述核酸序列編碼的多肽是通過(guò)所述來(lái)源產(chǎn)生的,或通過(guò)其中插入了來(lái)自該來(lái)源的核酸序列的細(xì)胞產(chǎn)生的。
編碼具有L-天冬酰胺酶活性的多肽的核酸序列可獲自細(xì)菌源。例如,核酸序列可獲自革蘭氏陽(yáng)性菌源,如芽孢桿菌屬(Bacillus)菌株,例如嗜堿芽孢桿菌(Bacillus alkalophilus)、解淀粉芽孢桿菌(Bacillusamyloliquefaciens)、短芽孢桿菌(Bacillus brevis)、環(huán)狀芽孢桿菌(Bacilluscirculans)、凝結(jié)芽孢桿菌(Bacillus coagulans)、燦爛芽孢桿菌(Bacillus.lautus)、遲緩芽孢桿菌(Bacillus.lentus)、地衣芽孢桿菌(Baculluslincheniformis)、巨大芽孢桿菌(Bacillus megaterium)、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)、枯草芽孢桿菌(Bacillus subtilis)或蘇云金芽孢桿菌菌株(Bacillus thuringiensis);或鏈霉菌屬(Streptomyces)菌株,例如淺青紫鏈霉菌(Streptomyces lividans)或鼠灰鏈霉菌(Streptomyces murinus)菌株;或革蘭氏陰性菌株,例如大腸桿菌屬(E.coli)或假單胞菌屬(Pseudomonas)菌株。
在一個(gè)優(yōu)選的實(shí)施方案中,第二核酸序列編碼選自下組的具有L-天冬酰胺酶活性的多肽(a)具有與SEQ ID NO2的第24-375位氨基酸至少70%同一性的氨基酸序列的多肽;(b)一種由核酸序列編碼的多肽,其中所述的核酸序列在中度嚴(yán)謹(jǐn)條件下與以下序列雜交(i)SEQ ID NO1的第70-1125位核苷酸,(ii)至少100個(gè)連續(xù)核苷酸的(i)的亞序列,或者(iii)(i)或(ii)的互補(bǔ)鏈;(c)(a)或(b)的等位基因變體;(d)(a)、(b)或(c)的片段,其中所述片段具有L-天冬酰胺酶活性。
在一個(gè)更優(yōu)選的實(shí)施方案中,分泌的多肽具有與SEQ ID NO2(即,成熟多肽)的第24-375位氨基酸有至少約70%,優(yōu)選至少80%,更優(yōu)選至少85%,甚至更優(yōu)選至少90%,最優(yōu)選至少95%,甚至最優(yōu)選至少97%同一性的氨基酸序列,所述分泌的多肽具有L-天冬酰胺酶活性(此后稱“同源性多肽”)。同源性多肽具有的氨基酸序列與SEQ ID NO2的第24-375位氨基酸有5個(gè)氨基酸不同,優(yōu)選有4個(gè)氨基酸不同,更優(yōu)選有3個(gè)氨基酸不同,甚至更優(yōu)選有2個(gè)氨基酸不同,最優(yōu)選有1個(gè)氨基酸不同。為了本發(fā)明的目的,通過(guò)Clustal方法(Higgins,1989,CABIOS 5151-153),利用LASERGENETMMEGALIGNTM軟件(DNASTAR,Inc.,Madison,WI),以同一性表和多項(xiàng)比對(duì)參數(shù)(缺口罰分(gap penalty)為10,缺口長(zhǎng)度罰分(gap lengthpenalty)為10),對(duì)兩種氨基酸序列之間的同一性程度進(jìn)行測(cè)定。成對(duì)比對(duì)(pairwise alignment)參數(shù)為Ktuple=1,缺口罰分(gap penalty)=3,窗(windows)=5,且對(duì)角(diagonals)=5。
優(yōu)選,所述多肽含有SEQ ID NO2的第24-375位氨基酸或其等位基因變體;或具有L-天冬酰胺酶活性的片段。在另一個(gè)優(yōu)選的實(shí)施方案中,所述多肽含有SEQ ID NO2的第24-375位氨基酸。在另一個(gè)優(yōu)選的實(shí)施方案中,多肽由SEQ ID NO2的第24-375位氨基酸或其等位基因變體;或其具有L-天冬酰胺酶活性的片段組成。在另一個(gè)優(yōu)選的實(shí)施方案中,多肽由SEQID NO2的第24-375位氨基酸組成。
SEQ ID NO2的第24-375位氨基酸片段是具有一個(gè)或多個(gè)從該氨基酸序列的氨基端和/或羧基端缺失的氨基酸的多肽。優(yōu)選,所述片段包含至少305個(gè)氨基酸殘基,更優(yōu)選至少320個(gè)氨基酸殘基,最優(yōu)選至少335個(gè)氨基酸殘基。
等位基因變體指占據(jù)相同染色體位點(diǎn)的一個(gè)基因的兩種或多種可選形式中之一。等位基因變異通過(guò)突變自然發(fā)生,并可導(dǎo)致群體內(nèi)的多態(tài)性?;蛲蛔兛梢允浅聊蛔?在所編碼的多肽中無(wú)改變)或者可以編碼其氨基酸序列發(fā)生改變的多肽。多肽的等位基因突變體是由基因的等位基因變體編碼的多肽。
在另一個(gè)優(yōu)選的實(shí)施方案中,具有L-天冬酰胺酶活性的多肽是具有SEQ ID NO2的氨基酸序列的分泌的多肽的變體,所述變體含有一個(gè)或多個(gè)氨基酸的取代、缺失和/或插入。
變體多肽的氨基酸序列可通過(guò)一個(gè)或多個(gè)氨基酸殘基的插入或缺失和/或一個(gè)或多個(gè)氨基酸殘基被不同氨基酸殘基取代,而與SEQ ID NO2的氨基酸24-375不同。優(yōu)選,氨基酸的改變是一個(gè)次要的特性,即為不會(huì)顯著影響所述蛋白折疊和/或活性的保守性氨基酸取代;通常為1至大約30個(gè)氨基酸的小的缺失;小的氨基或羧基端延伸,例如氨基端的蛋氨酸殘基;大約20-25個(gè)殘基的小的連接肽;或者通過(guò)改變凈電荷或其它功能,例如聚組氨酸域(poly-histidine tract)、抗原性表位或結(jié)合結(jié)構(gòu)域而有利于純化的小的延伸(extension)。
保守性取代的例子在堿性氨基酸(精氨酸、賴氨酸和組氨酸),酸性氨基酸(谷氨酸和天冬氨酸)、極性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、異亮氨酸和纈氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和小的氨基酸(甘氨酸、丙氨酸、絲氨酸、蘇氨酸和甲硫氨酸)的范圍內(nèi)。通常不改變比活性的氨基酸取代為本領(lǐng)域所熟知,而且由例如H.Neurath和R.L.Hill,1979,In,The Proteins,Academic Press,紐約中所描述。最常見的交換為Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser,Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Tyr/Phe,Ala/Pro,Lys/Arg,Asp/Asn,Leu/Ile,Leu/Val,Ala/Glu和Asp/Gly,以及反過(guò)來(lái)進(jìn)行交換。
在另一個(gè)優(yōu)選的實(shí)施方案中,具有L-天冬酰胺酶活性的分泌的多肽由核酸序列編碼,所述核酸序列在極低嚴(yán)謹(jǐn)條件,優(yōu)選低嚴(yán)謹(jǐn)條件,更優(yōu)選中嚴(yán)謹(jǐn)條件,更優(yōu)選中高嚴(yán)謹(jǐn)條件,甚至更優(yōu)選高嚴(yán)謹(jǐn)條件,最優(yōu)選極高嚴(yán)謹(jǐn)條件下與核酸探針雜交,所述的核酸探針在相同條件下與以下序列雜交(i)SEQ ID NO1第70-1125位核苷酸,(ii)(i)的亞序列,或者(iii)(i)或(ii)的互補(bǔ)鏈(J.Sambrook,E.F.Fritsch和T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor,New York)。SEQ ID NO1的亞序列至少具有100個(gè)核苷酸,優(yōu)選至少200個(gè)核苷酸,并且優(yōu)選為連續(xù)的核苷酸。另外,所述亞序列可編碼具有L-天冬酰胺酶活性的多肽片段。多肽可為具有L-天冬酰胺酶活性的多肽的等位基因突變體或片段。
按照本領(lǐng)域已知的方法,SEQ ID NO1的70-1125位核苷酸或其亞序列,以及SEQ ID NO2的24-375位核苷酸或其亞序列可被用來(lái)設(shè)計(jì)核酸探針,以從不同屬或種的菌株中鑒定并克隆編碼具有L-天冬酰胺酶活性的多肽的DNA。具體為,按照標(biāo)準(zhǔn)的Southern印跡方法,可使用上述探針與目的屬或種的基因組或cDNA雜交,以鑒定并分離目的屬或種中的相應(yīng)基因。上述探針可以大大短于完整序列,但長(zhǎng)度應(yīng)該至少為15個(gè),優(yōu)選至少為25個(gè),更優(yōu)選至少為35個(gè)核苷酸。更長(zhǎng)的探針也可以使用。DNA和RNA探針都可以使用。為了檢測(cè)相應(yīng)基因,通常對(duì)探針進(jìn)行標(biāo)記(例如,用32P、3H、35S、生物素或抗生物素蛋白)。本發(fā)明包括上述探針。
因此,可以對(duì)由上述其它生物體制備的基因組DNA或cDNA文庫(kù)進(jìn)行篩選,選出與上述探針雜交并編碼具有L-天冬酰胺酶活性的多肽的DNA。通過(guò)瓊脂糖或聚丙烯酰胺凝膠電泳或其它分離技術(shù)可對(duì)來(lái)自上述其它生物體的基因組DNA或其它DNA進(jìn)行分離??蓪?lái)自文庫(kù)的DNA或者分離的DNA轉(zhuǎn)移并固定于硝酸纖維素或其它適當(dāng)?shù)妮d體材料上。在Southern印跡法中使用上述載體材料,以對(duì)與SEQ ID NO1或其亞序列同源的克隆或DNA進(jìn)行鑒定。為了本發(fā)明的目的,雜交指在極低到極高嚴(yán)謹(jǐn)條件下,核酸序列與相應(yīng)于SEQ ID NO1所示核酸序列、其互補(bǔ)鏈或其亞序列的標(biāo)記核酸探針雜交。在這些條件下,與核酸探針雜交的分子可通過(guò)利用X-線膠片檢測(cè)到。
在一個(gè)優(yōu)選的實(shí)施方案中,核酸探針是編碼SEQ ID NO2的24-375位氨基酸的核酸序列或其亞序列。在另一個(gè)優(yōu)選的實(shí)施方案中,核酸探針是SEQ ID NO1的70-1125位核苷酸。在另一個(gè)優(yōu)選的實(shí)施方案中,核酸探針是包含在質(zhì)粒pCR2.1-yccC中的核酸序列,所述質(zhì)粒pCR2.1-yccC包含在大腸桿菌NRRL B-30558中,其中所述核酸序列編碼具有L-天冬酰胺活性的多肽,即氨基酸24-375。
對(duì)于長(zhǎng)度為至少100個(gè)核苷酸的長(zhǎng)探針,極低到極高嚴(yán)謹(jǐn)條件定義為按照標(biāo)準(zhǔn)Southern印跡法,于42℃在5X SSPE、0.3%SDS、200μg/ml剪切并變性的鮭精DNA中,以及相對(duì)于極低和低嚴(yán)謹(jǐn)度、中和中高嚴(yán)謹(jǐn)度、高和極高嚴(yán)謹(jǐn)度分別為25%、35%、50%的甲酰胺中預(yù)雜交和雜交。
對(duì)于長(zhǎng)度為至少100個(gè)核苷酸的長(zhǎng)探針,載體材料最后用2X SSC、0.2%SDS洗三次,每次15分鐘,溫度優(yōu)選為至少45℃(極低嚴(yán)謹(jǐn)度),更優(yōu)選至少50℃(低嚴(yán)謹(jǐn)度),更優(yōu)選至少55℃(中嚴(yán)謹(jǐn)度),更優(yōu)選至少60℃(中高嚴(yán)謹(jǐn)度),甚至更優(yōu)選至少65℃(高嚴(yán)謹(jǐn)度),最優(yōu)選至少70℃(極高嚴(yán)謹(jǐn)度)。
對(duì)于長(zhǎng)度為約15到約70個(gè)核苷酸的短探針,嚴(yán)謹(jǐn)條件定義為根據(jù)標(biāo)準(zhǔn)Southern印跡法,于約5℃至約10℃,低于根據(jù)Bolton和McCarthy(1962,Proceedings of the National Academy of Sciences USA 481390)所述計(jì)算出的Tm下,在0.9M NaCl、0.09M Tris-HCl、pH7.6、6mM EDTA、0.5%NP-40、1X Denhardt′s溶液、1mM焦磷酸鈉、1mM磷酸二氫鈉、0.1mM ATP和0.2mg/ml酵母RNA中預(yù)雜交、雜交和雜交后洗滌。
對(duì)于長(zhǎng)度為約15到約70個(gè)核苷酸的短探針,載體材料在添加了0.1%SDS的6X SCC中洗一次,洗滌15分鐘,然后于5℃-10℃,計(jì)算的Tm下,用6X SSC洗兩次,每次15分鐘。
在一個(gè)優(yōu)選的實(shí)施方案中,第二核酸序列獲自嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、凝結(jié)芽孢桿菌、堅(jiān)強(qiáng)芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌或蘇云金芽孢桿菌的菌株。
這些種類的菌株由多個(gè)培養(yǎng)物保藏中心向公眾開放,如美國(guó)典型培養(yǎng)物保藏中心(ATCC)、德意志微生物保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌種保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)以及農(nóng)業(yè)研究機(jī)構(gòu)專利培養(yǎng)物保藏中心(Agricultural Research Service Patent Culture Collection)、北方區(qū)域研究中心(Northern Regional Research Center,NRRL)。
此外,利用上述探針可以從其它來(lái)源中鑒定和獲得所述多肽和核酸,所述來(lái)源包括從自然界(例如,土壤、堆肥、水等)分離的微生物。用于從天然生長(zhǎng)環(huán)境中分離微生物的技術(shù)是本領(lǐng)域所熟知的。然后通過(guò)類似地篩選另一種微生物的基因組或cDNA文庫(kù)可以得到核酸序列。一旦用探針檢測(cè)到編碼多肽的核酸序列,可采用本領(lǐng)域熟練技術(shù)人員已知的技術(shù)(見,如Sambrook等,1989,見上)對(duì)該序列進(jìn)行分離或克隆。
用于分離或克隆編碼多肽的核酸序列的技術(shù)在本領(lǐng)域是已知的,包括從基因組DNA分離、從cDNA制備或其組合。從此類基因組DNA中克隆核酸序列可例如,通過(guò)采用熟知的聚合酶鏈?zhǔn)椒磻?yīng)(PCR)或表達(dá)文庫(kù)的抗體進(jìn)行篩選,以檢測(cè)具有共有結(jié)構(gòu)特征的克隆DNA片段來(lái)實(shí)現(xiàn)。見,例如Innis等,1990,PCR方法和應(yīng)用指導(dǎo)(PCRA Guide to Methods and Application),Academic Press,紐約。還可以采用其它核酸擴(kuò)增方法,如連接酶鏈?zhǔn)椒磻?yīng)(LCR)、連接激活的轉(zhuǎn)錄(ligated activated transcription,LAT)和基于核酸序列的擴(kuò)增(NASBA)。核酸序列可克隆自芽孢桿菌屬菌株,或者另一種或相關(guān)生物體,且因此例如,其可為核酸序列的多肽編碼區(qū)的等位基因變體或物種變體。
本文中所用的術(shù)語(yǔ)“分離的核酸序列”指一種基本上沒(méi)有其它核酸序列的核酸序列,例如通過(guò)瓊脂糖電泳測(cè)定純度至少約為20%,優(yōu)選至少約為40%,更優(yōu)選約為60%,甚至更優(yōu)選約為80%,最優(yōu)選約為90%。例如,分離的核酸序列可以通過(guò)在遺傳工程中用來(lái)將核酸序列從其天然位置重新定位至其將被復(fù)制的另一位點(diǎn)處的標(biāo)準(zhǔn)克隆方法來(lái)獲得。所述克隆方法可包括切除和分離含編碼該多肽的核酸序列的目的核酸片段,將該片段插入到載體分子中,并將該重組載體摻入到宿主細(xì)胞中,在所述的宿主細(xì)胞中該核酸序列的多個(gè)拷貝或克隆將被復(fù)制。所述的核酸序列可以是基因組、cDNA、RNA、半合成、合成來(lái)源的或者其任意組合。
在一個(gè)優(yōu)選的實(shí)施方案中,第二核酸序列選自(a)一種編碼多肽的核酸序列,所述多肽具有與SEQ ID NO2的第24-375位氨基酸有至少65%的同一性的氨基酸序列;(b)與SEQ ID NO1的第70-1125位核苷酸有至少65%的同源性的核酸序列;(c)在低、中、中高或高度嚴(yán)謹(jǐn)條件下與以下序列雜交的核酸序列(i)SEQ ID NO1的第70-1125位核苷酸,或(ii)至少100個(gè)連續(xù)核苷酸的(i)的亞序列,或(iii)(i)或(ii)的互補(bǔ)鏈;(d)編碼SEQ ID NO2的24-375位氨基酸的變體的核酸序列,所述變體含有一個(gè)或多個(gè)氨基酸的取代、缺失和/或插入;(e)(a),(b)或(c)的等位基因變體;(f)(a),(b),(c)或(e)的亞序列,其中所述亞序列編碼具有L-天冬酰胺酶活性的多肽片段。
在一個(gè)更優(yōu)選的實(shí)施方案中,第二核酸序列與SEQ ID NO1的70-1125位核苷酸有至少約65%,優(yōu)選約70%,優(yōu)選約80%,更優(yōu)選約90%,甚至更優(yōu)選約95%,最優(yōu)選約97%的同源性,其中所述第二核酸序列編碼活性多肽。為了本發(fā)明的目的,通過(guò)Wilbur-Lipman法(Wilbur and Lipman,1983,Proceedings of the National Academy of Science USA 80726-730),利用LASERGENETMMEGALIGNTM軟件(DNASTAR,Inc.,Madison,WI)以同一性表和多項(xiàng)比對(duì)參數(shù)(缺口罰分為10,缺口長(zhǎng)度罰分為10),對(duì)兩種核酸序列之間的同源性程度進(jìn)行測(cè)定。成對(duì)比對(duì)參數(shù)為Ktuple=3,缺口罰分=3,窗(windows)=20。
在一個(gè)最優(yōu)選的實(shí)施方案中,第二核酸序列獲自枯草芽孢桿菌菌株168,例如SEQ ID NO1的70-1125位核苷酸所示的核酸序列。在另一個(gè)最優(yōu)選的實(shí)施方案中,核酸序列為包含在質(zhì)粒pCR2.1-yccC中的序列,其中所述質(zhì)粒包含在大腸桿菌NRRL B-30558中。本發(fā)明所述方法還包括由于遺傳密碼的簡(jiǎn)并性而與SEQ ID NO1不同的編碼多肽的核酸序列,所述多肽具有SEQ ID NO2的24-375位氨基酸的氨基酸序列。本發(fā)明還涉及SEQ IDNO1的具有L-天冬酰胺酶活性的亞序列,其編碼SEQ ID NO2第24-375位氨基酸片段。
SEQ ID NO1的第70-125位核苷酸的亞序列是SEQ ID NO1所包含的除了從5′和/或3′末端缺失的一個(gè)或多個(gè)核苷酸以外的核酸序列。優(yōu)選亞序列含有至少915個(gè)核苷酸,更優(yōu)選至少960個(gè)核苷酸,最優(yōu)選至少1005個(gè)核苷酸。
第二核酸序列還包含含有SEQ ID NO1第70-1125位核苷酸中的至少一個(gè)突變的突變核酸序列,其中突變核酸序列編碼由SEQ ID NO2的第24-375位氨基酸組成的多肽。
在另一個(gè)更優(yōu)選的實(shí)施方案中,如本文中所定義,編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列在極低嚴(yán)謹(jǐn)條件,優(yōu)選低嚴(yán)謹(jǐn)條件,更優(yōu)選中嚴(yán)謹(jǐn)條件,更優(yōu)選中高嚴(yán)謹(jǐn)條件,甚至更優(yōu)選高嚴(yán)謹(jǐn)條件,最優(yōu)選極高嚴(yán)謹(jǐn)條件下與核酸探針雜交,所述的核酸探針在相同條件下與SEQ IDNO1的第70-1125位核苷酸或其互補(bǔ)鏈;或其等位基因變體和其亞序列雜交(Sambrook等,1989,見上)。
對(duì)第二核酸序列的修飾可能是合成與SEQ ID NO2的第24-375氨基酸所示的具有L-天冬酰胺酶活性多肽基本上相似的多肽所必需的。術(shù)語(yǔ)與多肽“ 基本上相似”指所述多肽的非天然存在的形式。這些多肽可能在一些改造的方式(engineered way)上與其天然來(lái)源分離的多肽不同,例如,在比活性、熱穩(wěn)定性、最適PH值等方面不同的變體?;赟EQ ID NO1的第70-1125位核苷酸,例如其亞序列來(lái)構(gòu)建所述變體序列,和/或通過(guò)引入不造成由該核酸序列所編碼的多肽的氨基酸序列改變,而與待用于制備該酶的宿主生物體的密碼子的使用相對(duì)應(yīng)的核苷酸取代,或者通過(guò)引入產(chǎn)生不同的氨基酸序列的核苷酸取代來(lái)構(gòu)建所述變體序列。對(duì)于核苷酸取代的總體描述見,例如Ford等,1991,Protein Expression and Purification 295-107。
顯然,對(duì)于本領(lǐng)域熟練技術(shù)人員來(lái)說(shuō)可以在分子功能的關(guān)鍵區(qū)域外進(jìn)行上述取代,且仍可產(chǎn)生活性多肽。對(duì)本發(fā)明的分離核酸序列所編碼的多肽的活性必不可少,并因此優(yōu)選不對(duì)其進(jìn)行取代的氨基酸殘基,可按照本領(lǐng)域已知的方法,如定點(diǎn)誘變或丙氨酸掃描誘變誘變(見,例如Cunningham和Wells,1989,Science 2441081-1085)進(jìn)行鑒定。在丙氨酸掃描誘變技術(shù)中,在分子中的每一個(gè)正電荷殘基中引入突變,并對(duì)獲得的突變分子進(jìn)行L-天冬酰胺酶活性檢測(cè),以鑒定對(duì)分子活性而言重要的氨基酸殘基。底物-酶相互作用的位點(diǎn)也可以通過(guò)例如由核磁共振分析,結(jié)晶學(xué)或光親合標(biāo)記技術(shù)確定的三維結(jié)構(gòu)分析來(lái)確定(見,例如de Vos等,1992,Science 255306-312;Smith等,1992,Journal of Molecular Biology 224899-904;Wlodaver等,1992,F(xiàn)EBS Letters 30959-64)。
核酸構(gòu)建體本發(fā)明還涉及核酸構(gòu)建體,其包含編碼分泌信號(hào)肽并與編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地連接的第一核酸序列,并且所述核酸構(gòu)建體進(jìn)一步包含一種或多種可操作地連接于第二核酸序列的控制序列,其中所述控制序列與其相容的條件下,在合適的宿主細(xì)胞中指導(dǎo)編碼序列的表達(dá)。
可以進(jìn)一步以各種方式操作編碼具有L-天冬酰胺酶活性的多肽的分離核酸序列以獲得多肽的表達(dá)。根據(jù)表達(dá)載體的不同,對(duì)核酸序列在將其插入到載體之前進(jìn)行操作可以是有利的或必須的。利用重組DNA方法修飾核酸序列的技術(shù)在本領(lǐng)域中是眾所周知的。
術(shù)語(yǔ)“控制序列”在本文中定義為包括對(duì)本發(fā)明的多肽的表達(dá)所必需的或有利的所有元件。每個(gè)控制序列對(duì)于編碼多肽的核酸序列可以是天然的或外源的。所述控制序列包括但不限于前導(dǎo)序列,聚腺苷酸化序列,前肽序列,啟動(dòng)子,核糖體結(jié)合位點(diǎn),信號(hào)肽序列和轉(zhuǎn)錄終止子??刂菩蛄兄辽侔▎?dòng)子,以及轉(zhuǎn)錄和翻譯終止信號(hào)。為了引入特異性限制位點(diǎn)以有利于將控制序列與編碼多肽的核酸序列編碼區(qū)連接,可以為控制序列提供接頭。
控制序列可以是適當(dāng)?shù)膯?dòng)子序列,即表達(dá)L-天冬酰胺酶編碼序列的宿主細(xì)胞所識(shí)別的核酸序列。啟動(dòng)子序列包括介導(dǎo)多肽表達(dá)的轉(zhuǎn)錄控制序列。啟動(dòng)子可以是在宿主細(xì)胞中表現(xiàn)出轉(zhuǎn)錄活性的任意核酸序列,包括共有的、突變的、截短的和雜合的啟動(dòng)子,而且可獲自與宿主細(xì)胞同源或異源的、編碼胞外或胞內(nèi)多肽的基因。
在一個(gè)優(yōu)選的實(shí)施方案中,這些啟動(dòng)子序列可荻自細(xì)菌源。在一個(gè)更優(yōu)選的實(shí)施方案中,這些啟動(dòng)子序列可獲自革蘭氏陽(yáng)性菌,如芽孢桿菌屬菌株,例如嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、B.clausii、凝結(jié)芽孢桿菌、堅(jiān)強(qiáng)芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、短小芽孢桿菌(Bacillus.pumilus)、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌或蘇云金芽孢桿菌;或鏈霉菌屬菌株,例如淺青紫鏈霉菌或鼠灰鏈霉菌;或得自革蘭氏陰性菌,例如大腸桿菌或假單胞菌屬。
在本發(fā)明的方法中指導(dǎo)第二核酸序列轉(zhuǎn)錄的適宜啟動(dòng)子的例子為得自下述基因的啟動(dòng)子大腸桿菌lac操縱子、B.clausii堿性蛋白酶基因(aprH)、地衣芽孢桿菌堿性蛋白酶基因(枯草桿菌蛋白酶Carlsberg基因)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽糖淀粉酶基因(amyM)、解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因、蘇云金芽孢桿菌擬步甲亞種(Bt.subsp.tenebrionis)CryIIIA基因(cryIIIA)或其部分、天藍(lán)色鏈霉菌(Streptomyces coelicolor)瓊脂糖酶基因(dagA),以及原核生物的β-內(nèi)酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of theNational Academy of Sciences USA 753727-3731)。其它啟動(dòng)子包括spol細(xì)菌噬菌體啟動(dòng)子和tac啟動(dòng)子(DeBoer等,1983,Proceedings of the NationalAcademy of Sciences USA 8021-25).。更多的啟動(dòng)子參見″Useful proteins fromrecombinant bacteria″Scientific American,1980,24274-94和Sambrook,F(xiàn)ritsch和Maniatus,1989,分子克隆(Molecular Cloning),實(shí)驗(yàn)室指南(ALaboratory Manual),第二版,冷泉港(Cold Spring Harbor),紐約。
啟動(dòng)子序列還可以是串聯(lián)啟動(dòng)子。“串聯(lián)啟動(dòng)子”在本文中定義為兩個(gè)或多個(gè)啟動(dòng)子序列,其中每一個(gè)都可操作地連接于編碼序列,并其介導(dǎo)將編碼序列轉(zhuǎn)錄為mRNA。啟動(dòng)子序列的兩個(gè)或多個(gè)串聯(lián)啟動(dòng)子可以同時(shí)啟動(dòng)核酸序列的轉(zhuǎn)錄。此外,串聯(lián)啟動(dòng)子的一個(gè)或多個(gè)啟動(dòng)子序列可在宿主細(xì)胞,如芽孢桿菌屬細(xì)胞,生長(zhǎng)的不同階段啟動(dòng)核酸序列的轉(zhuǎn)錄。
在一個(gè)優(yōu)選的實(shí)施方案中,串聯(lián)啟動(dòng)子包括至少解淀粉芽孢桿菌α-淀粉酶基因amyQ啟動(dòng)子。在另一個(gè)優(yōu)選的實(shí)施方案中,串聯(lián)啟動(dòng)子至少包含具有“-35”區(qū)的TTGACA序列和“-10”區(qū)的TATAAT序列的共有序列啟動(dòng)子。在另一個(gè)優(yōu)選的實(shí)施方案中,串聯(lián)啟動(dòng)子包括至少地衣芽孢桿菌α-淀粉酶基因的amyL啟動(dòng)子。在另一個(gè)優(yōu)選的實(shí)施方案中,串聯(lián)啟動(dòng)子包含至少cryIIIA啟動(dòng)子或其部分(Agaisse和Lereclus,1994,見上)。
在一個(gè)更優(yōu)選的實(shí)施方案中,串聯(lián)啟動(dòng)子至少包含amyL啟動(dòng)子和cryIIIA啟動(dòng)子。在另一個(gè)更優(yōu)選的實(shí)施方案中,串聯(lián)啟動(dòng)子至少包含amyQ啟動(dòng)子和cryIIIA啟動(dòng)子。在另一個(gè)更優(yōu)選的實(shí)施方案中,串聯(lián)啟動(dòng)子至少包含具有“-35”區(qū)的TTGACA序列和“-10”區(qū)的TATAAT序列的共有序列啟動(dòng)子和cryIIIA啟動(dòng)子。在另一個(gè)更優(yōu)選的實(shí)施方案中,串聯(lián)啟動(dòng)子至少包含兩個(gè)拷貝的amyL啟動(dòng)子。在另一個(gè)更優(yōu)選的實(shí)施方案中,串聯(lián)啟動(dòng)子包含至少兩個(gè)拷貝的amyQ啟動(dòng)子。在另一個(gè)更優(yōu)選的實(shí)施方案中,串聯(lián)啟動(dòng)子包含至少兩個(gè)拷貝的具有“-35”區(qū)的TTGACA序列和“-10”區(qū)的TATAAT序列的共有序列啟動(dòng)子。在另一個(gè)更優(yōu)選的實(shí)施方案中,串聯(lián)啟動(dòng)子包含至少兩個(gè)拷貝的cryIIIA啟動(dòng)子。
共有序列啟動(dòng)子的構(gòu)建可通過(guò)定點(diǎn)誘變來(lái)完成,以產(chǎn)生與枯草芽孢桿菌營(yíng)養(yǎng)型(vegetative)“sigma A-型”啟動(dòng)子的“-10”和“-35”區(qū)的已確認(rèn)共有序列很好地一致的啟動(dòng)子(Voskuil等,1995,Molecular Microbiology 17271-279)?!?35”區(qū)的共有序列是TTGACA,在“-10”區(qū)的共有序列是TATAAT。共有序列啟動(dòng)子可來(lái)自在芽孢桿菌屬宿主細(xì)胞中發(fā)揮作用的任何啟動(dòng)子。
在一個(gè)優(yōu)選的實(shí)施方案中,“共有序列”啟動(dòng)子來(lái)自下述基因的啟動(dòng)子大腸桿菌lac操縱子、天藍(lán)色鏈霉菌瓊脂糖酶基因(dagA)、B.clausii堿性蛋白酶基因(aprH)、地衣芽孢桿菌堿性蛋白酶基因(枯草桿菌蛋白酶Carlsberg基因)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、枯草芽孢桿菌α-淀粉酶基因(amyE)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽糖淀粉酶基因(amyM)、解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因、蘇云金芽孢桿菌擬步甲亞種CryIIIA基因(cryIIIA)或其部分,或者原核生物的β-內(nèi)酰胺酶基因spol細(xì)菌噬菌體啟動(dòng)子。
在一個(gè)更優(yōu)選的實(shí)施方案中,“共有序列”啟動(dòng)子來(lái)自解淀粉芽孢桿菌屬α-淀粉酶基因(amyQ)。在一個(gè)最優(yōu)選的實(shí)施方案中,共有序列啟動(dòng)子是SEQ ID NO5或SEQ ID NO6的第1-185位核苷酸中所含有的“共有序列”amyQ啟動(dòng)子。在另一個(gè)最優(yōu)選的實(shí)施方案中,共有序列啟動(dòng)子是SEQ IDNO5的第86-185位核苷酸或SEQ ID NO6中所含有的短“共有序列”amyQ啟動(dòng)子。SEQ ID NO5的“共有序列”amyQ啟動(dòng)子含有包含野生型amyQ啟動(dòng)子(SEQ ID NO6)的核酸序列的如下突變?cè)赟EQ ID NO7的-35區(qū)(相對(duì)轉(zhuǎn)錄起始位點(diǎn))的135位和136位分別發(fā)生T到A和T到C的改變,以及在SEQ ID NO7的-10區(qū)156位置A轉(zhuǎn)變?yōu)門。“共有序列”amyQ啟動(dòng)子(SEQ ID NO6)還含有位于-35區(qū)上游約20個(gè)堿基處的116位上的由T到A的變換,如圖3所示。很明顯,由于遠(yuǎn)離關(guān)鍵的-10和-35區(qū),這種改變并不破壞啟動(dòng)子的功能。
“mRNA加工/穩(wěn)定序列”在本文中定義為位于一個(gè)或多個(gè)啟動(dòng)子序列的下游并且位于編碼編碼序列的上游的一段序列,其中一個(gè)或多個(gè)啟動(dòng)子序列的每一個(gè)都與該編碼序列可操作地連接,從而使從每一個(gè)啟動(dòng)子序列合成的mRNA均可被加工,產(chǎn)生具有位于轉(zhuǎn)錄產(chǎn)物5’端的穩(wěn)定序列的mRNA轉(zhuǎn)錄產(chǎn)物。mRNA轉(zhuǎn)錄產(chǎn)物的5’端所存在的這種穩(wěn)定子序列可延長(zhǎng)轉(zhuǎn)錄產(chǎn)物的半衰期(Agaisse和Lereclus,1994,見上,Hue等,1995,見上)。mRNA加工/穩(wěn)定序列與細(xì)菌16S核糖體RNA的3’末端互補(bǔ)。在一個(gè)優(yōu)選的實(shí)施方案中,mRNA加工/穩(wěn)定序列產(chǎn)生具有位于轉(zhuǎn)錄產(chǎn)物5’端的穩(wěn)定序列的基本上大小一致的轉(zhuǎn)錄產(chǎn)物。
在一個(gè)更優(yōu)選的實(shí)施方案中,mRNA加工/穩(wěn)定序列是WO9425612和Agaisse和Lereclus(1994,見上)所公開的蘇云金芽孢桿菌CryIIIAmRNA加工/穩(wěn)定序列,或其保持mRNA加工/穩(wěn)定序列功能的部分。在另一更優(yōu)選實(shí)施方案中,mRNA加工/穩(wěn)定序列是Hue等(1995,見上)所公開的枯草芽孢桿菌SP82 mRNA加工/穩(wěn)定序列,或其保持mRNA加工/穩(wěn)定功能的部分。
當(dāng)將cryIIIA啟動(dòng)子和其mRNA加工/穩(wěn)定序列用于本發(fā)明的方法時(shí),可采用含有WO 9425612和Agaisse和Lereclus(1994,見上)所公開的序列的DNA片段(如核苷酸-635至-22(SEQ ID NO8)所示),或其保持啟動(dòng)子和mRNA加工/穩(wěn)定序列功能的部分。cryIIIA啟動(dòng)子如核苷酸-635至-552所示,而cryIIIA mRNA加工/穩(wěn)定序列包含于核苷酸-551至-22之間。在一個(gè)優(yōu)選的實(shí)施方案中,cryIIIA mRNA加工/穩(wěn)定序列包含在含有核苷酸-568至-22的片段中。在另一個(gè)優(yōu)選的實(shí)施方案中,cryIIIA mRNA加工/穩(wěn)定序列包含在含有核苷酸-367至-21的片段中。而且,可用本領(lǐng)域熟知的方法制備僅含有cryIIIA啟動(dòng)子或僅含有cryIIIA mRNA加工/穩(wěn)定序列的DNA片段,以構(gòu)建串聯(lián)啟動(dòng)子和mRNA加工/穩(wěn)定序列的各種組合。在該實(shí)施方案中,cryIIIA啟動(dòng)子及其mRNA加工/穩(wěn)定序列優(yōu)選位于構(gòu)成串聯(lián)啟動(dòng)子的其它啟動(dòng)子(s)的下游,和編碼具有L-天冬酰胺酶活性的多肽的基因的編碼序列的上游。含有串聯(lián)啟動(dòng)子和cryIIIA mRNA加工/穩(wěn)定序列的各種構(gòu)建體參見美國(guó)專利6,255,076。
在一個(gè)優(yōu)選的實(shí)施方案中,核酸構(gòu)建體含有(i)一個(gè)串聯(lián)啟動(dòng)子,其中所述串聯(lián)啟動(dòng)子的各啟動(dòng)子序列可操作地連接于單拷貝的編碼具有L-天冬酰胺酶活性的多肽的核酸序列,以及可選地還含有(ii)mRNA加工/穩(wěn)定序列,該mRNA加工/穩(wěn)定序列位于該串聯(lián)啟動(dòng)子下游并且位于編碼多肽的第二核酸序列的上游。
在另一個(gè)優(yōu)選的實(shí)施方案中,核酸構(gòu)建體包含(i)“共有序列”啟動(dòng)子,其與單拷貝的編碼具有L-天冬酰胺酶活性多肽的核酸序列可操作地連接,以及(ii)位于該“共有序列”啟動(dòng)子的下游并且位于編碼多肽的第二核酸序列的上游的一個(gè)mRNA加工/穩(wěn)定序列。在一個(gè)更優(yōu)選的實(shí)施方案中,“共有序列”啟動(dòng)子是可操作地連接單拷貝的編碼多肽的核酸序列的“共有序列”amyQ啟動(dòng)子?!肮灿行蛄小眴?dòng)子具有“-35”區(qū)的TTGACA序列和“-10”區(qū)的TATAAT序列。
控制序列也可以是適宜的核糖體結(jié)合位點(diǎn),即宿主細(xì)胞所識(shí)別的mRNA序列,其中核糖體與其結(jié)合以起始翻譯。核糖體結(jié)合位點(diǎn)序列通常位于啟動(dòng)子和編碼序列之間。任何在所選宿主細(xì)胞中發(fā)揮作用的核糖體結(jié)合位點(diǎn)序列都可用于本發(fā)明。例如,核糖體結(jié)合位點(diǎn)序列可獲自以下基因B.clausii堿性蛋白酶基因(aprH)、地衣芽孢桿菌堿性蛋白酶基因(枯草桿菌蛋白酶Carlsberg基因)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽糖淀粉酶基因(amyM)、解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因、蘇云金芽孢桿菌擬步甲亞種CryIIIA基因(cryIIIA)或其部分、天藍(lán)色鏈霉菌瓊脂糖酶基因(dagA),以及原核生物的β-內(nèi)酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academyof Sciences USA 753727-3731)。在一個(gè)優(yōu)選的實(shí)施方案中,核酸構(gòu)建體包含B.clausii堿性蛋白酶基因(aprH)的核糖體結(jié)合位點(diǎn)序列。
控制序列還可以是適宜的轉(zhuǎn)錄終止序列,即宿主細(xì)胞識(shí)別以終止轉(zhuǎn)錄的序列。終止子序列與編碼具有L-天冬酰胺酶活性多肽的核酸序列的3’端可操作地連接。任何在所選宿主細(xì)胞中發(fā)揮作用的終止子均可用于本發(fā)明。
控制序列還可以是適宜的前導(dǎo)序列,即對(duì)于宿主細(xì)胞翻譯重要的mRNA非翻譯區(qū)。前導(dǎo)序列與編碼所述多肽的核酸序列的5’端可操作地連接。任何在所選宿主細(xì)胞中發(fā)揮作用的前導(dǎo)序列均可用于本發(fā)明。
控制序列還可以是前肽編碼區(qū),其編碼位于多肽氨基端的一段氨基酸序列。所得多肽被稱為酶原(proenzyme)或多肽原(propolypeptide)(或這在某些情況下為酶原(zymogen))。多肽原通常無(wú)活性,而且通過(guò)催化性或自身催化性裂解將前肽(propeptide)從該多肽原中裂解下來(lái),可以將多肽原轉(zhuǎn)化為成熟的有活性多肽。前肽編碼區(qū)可獲自枯草芽孢桿菌堿性蛋白酶基因(aprE)和枯草芽孢桿菌中性蛋白酶基因(nprT)。
當(dāng)信號(hào)肽和前肽區(qū)都存在于多肽的氨基端時(shí),前肽區(qū)鄰接于多肽的氨基端,且信號(hào)肽區(qū)鄰接于前肽區(qū)的氨基端。
可取地添加調(diào)控序列,所述調(diào)控序列允許調(diào)節(jié)與宿主細(xì)胞生長(zhǎng)相關(guān)的多肽的表達(dá)。調(diào)控系統(tǒng)的例子是對(duì)化學(xué)或物理刺激,包括調(diào)節(jié)性化合物的存在起反應(yīng),而使基因表達(dá)開啟或關(guān)閉的那些系統(tǒng)。在原核生物系統(tǒng)中的調(diào)節(jié)系統(tǒng)包括lac、tac和trp操縱子系統(tǒng)。
宿主細(xì)胞可含有一個(gè)或多個(gè)拷貝的核酸構(gòu)建體。在一個(gè)優(yōu)選的實(shí)施方案中,宿主細(xì)胞含有單拷貝的核酸構(gòu)建體。
表達(dá)載體本發(fā)明還涉及重組表達(dá)載體,其包含編碼分泌信號(hào)肽的第一核酸序列、啟動(dòng)子、以及轉(zhuǎn)錄和翻譯終止信號(hào),其中所述第一核酸序列與編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地連接。上述各種核酸和控制序列可連接在一起產(chǎn)生重組表達(dá)載體,其可包含一個(gè)或多個(gè)方便的限制性位點(diǎn)以允許編碼多肽的核酸序列在這些位點(diǎn)進(jìn)行插入或替代??蛇x地,編碼具有L-天冬酰胺酶活性的多肽的核酸序列可通過(guò)將該核酸序列或含有該序列的核酸構(gòu)建體插入適當(dāng)?shù)谋磉_(dá)載體來(lái)表達(dá)和分泌。構(gòu)建表達(dá)載體時(shí),編碼序列位于該載體中,使該編碼序列可操作地連接于表達(dá)和分泌的適當(dāng)控制序列。
重組載體可以是能方便地用于重組DNA法并能使核酸序列表達(dá)的任何載體(例如質(zhì)?;虿《?。典型地,載體的選擇依賴于載體與載體將被導(dǎo)入的宿主細(xì)胞之間的相容性。載體可以是線性或閉合環(huán)狀的質(zhì)粒。
載體可以是自主復(fù)制載體,即該載體以染色體外實(shí)體形式存在,其復(fù)制獨(dú)立于染色體的復(fù)制,如質(zhì)粒、染色體外元件、微型染色體或人工染色體。載體可含有任何保證自我復(fù)制的工具。此外,載體可以是當(dāng)導(dǎo)入宿主細(xì)胞時(shí)整合至基因組并與其整合所進(jìn)入的染色體一起復(fù)制的載體。另外,可以使用單個(gè)載體或質(zhì)粒,或總體包含將被插入宿主細(xì)胞基因組的總DNA的兩個(gè)或多個(gè)載體或質(zhì)粒,或轉(zhuǎn)座子。
本發(fā)明所述載體優(yōu)選含有使得易于對(duì)轉(zhuǎn)化細(xì)胞進(jìn)行篩選的一個(gè)或多個(gè)可篩選標(biāo)記。可篩選標(biāo)記是其產(chǎn)物提供了殺生物劑或病毒抗性、重金屬抗性、對(duì)營(yíng)養(yǎng)缺陷體(auxotroph)的原養(yǎng)型(prototrophy)等的基因。細(xì)菌的可篩選標(biāo)記的例子包括枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或可賦予抗生素抗性如氨芐青霉素、卡那霉素、氯霉素、四環(huán)素抗性的標(biāo)記。
本發(fā)明所述載體優(yōu)選包含使所述載體可以整合到宿主細(xì)胞基因組中,或者使載體可以不依賴于細(xì)胞的基因組而在細(xì)胞中自主復(fù)制的元件。
為整合入宿主細(xì)胞的基因組,載體可依賴于編碼具有L-天冬酰胺酶活性的多肽的核酸序列或載體的其它元件,通過(guò)同源或非同源重組將載體整合至基因組中。此外,載體可含有指導(dǎo)通過(guò)同源重組整合至宿主細(xì)胞基因組中的其它核苷酸。這些其它的核酸序列使得載體被整合到染色體中的宿主細(xì)胞基因組的精確位置上。這些其它核酸序列能使載體在染色體的精確位置整合至宿主細(xì)胞中。為了增加在精確位置整合的可能性,整合元件應(yīng)優(yōu)選含有足夠數(shù)量的核酸,如100-10,000bp,優(yōu)選400-10,000bp,最優(yōu)選800-10,000bp,它們與相應(yīng)靶序列高度同源以增加同源重組的幾率。整合元件可以是與宿主細(xì)胞基因組中的靶序列同源的任何序列。而且,整合元件可以是非編碼型或編碼型核酸序列。另一方面,可以通過(guò)非同源重組將載體整合至宿主細(xì)胞的基因組。
對(duì)于自主復(fù)制,載體可進(jìn)一步含有能使載體在目標(biāo)宿主細(xì)胞中自主復(fù)制的復(fù)制起點(diǎn)。復(fù)制的細(xì)菌起點(diǎn)的例子為可在大腸桿菌中復(fù)制的下列質(zhì)粒的復(fù)制起點(diǎn)pBR322,pUC19,pACYC177和pACYC184,和可在芽孢桿菌中復(fù)制的下列質(zhì)粒的復(fù)制起點(diǎn)pUB110,pE194,pTA1060和pAMB1。復(fù)制起點(diǎn)可含有使其在宿主細(xì)胞中的功能對(duì)溫度敏感化的突變(參見,例如Ehrlich,1978,Proceedings of the National Academy of Sciences USA 751433)。
可將多于一個(gè)拷貝的編碼具有L-天冬酰胺酶活性的多肽的核酸序列插入宿主細(xì)胞中從而增加基因產(chǎn)物的產(chǎn)量。獲得核酸序列拷貝數(shù)的增加可通過(guò)將至少一個(gè)額外拷貝的序列整合入宿主細(xì)胞基因組中實(shí)現(xiàn),或在所述宿主細(xì)胞含有擴(kuò)增拷貝的選擇性標(biāo)記基因的情況下,通過(guò)在核酸序列中包含一個(gè)可擴(kuò)增的選擇性標(biāo)記基因,從而可以在合適的選擇劑存在的條件下,通過(guò)培養(yǎng)宿主細(xì)胞選擇核酸序列的額外拷貝而實(shí)現(xiàn)。
用于連接上述元件以構(gòu)建重組本發(fā)明的表達(dá)載體的方法是本領(lǐng)域熟練技術(shù)人員所熟知的(參見,例如Sambrook等,1989,見上)。
宿主細(xì)胞本發(fā)明還涉及一種重組宿主細(xì)胞,其包含與編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地連接,并編碼分泌信號(hào)肽的第一核酸序列,該重組宿主細(xì)胞能有利地用于重組制備具有L-天冬酰胺酶活性的分泌的多肽。將含有所述核酸序列的載體導(dǎo)入宿主細(xì)胞中,使載體作為如前所述的染色體整合體或自主復(fù)制的染色體外載體而保持。術(shù)語(yǔ)“宿主細(xì)胞”包括由于復(fù)制過(guò)程中發(fā)生突變而與母細(xì)胞不完全相同的母細(xì)胞的任何后代。宿主細(xì)胞的選擇很大程度上依賴于編碼所述多肽的基因及其來(lái)源。
宿主細(xì)胞可以是能表達(dá)和分泌具有L-天冬酰胺酶活性的多肽的任何細(xì)菌細(xì)胞。
有用的細(xì)菌宿主細(xì)胞是革蘭氏陽(yáng)性菌,包括但不限于,芽孢桿菌屬菌株,如嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、B.clausii、凝結(jié)芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌和蘇云金芽孢桿菌;或鏈霉菌屬的細(xì)胞,如淺青紫鏈霉菌或鼠灰鏈霉菌;或革蘭氏陰性菌,如大腸桿菌或假單胞菌。在一個(gè)優(yōu)選的實(shí)施方案中,細(xì)菌宿主細(xì)胞是遲緩芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌或枯草芽孢桿菌細(xì)胞。在另一個(gè)優(yōu)選的實(shí)施方案中,芽孢桿菌細(xì)胞是嗜堿芽孢桿菌。在一個(gè)更優(yōu)選的實(shí)施方案中,細(xì)菌宿主細(xì)胞是枯草芽孢桿菌菌株。
載體可通過(guò)如下方法被導(dǎo)入細(xì)菌宿主細(xì)胞原生質(zhì)體轉(zhuǎn)化(protoplasttransformation)(見例如Chang和Cohen,1979,Molecular General Genetics 168111-115),使用感受態(tài)細(xì)胞(見例如Young和Spizizin,1961,Journal ofBacteriology 81823-829,或Dubnau和Davidoff-Abelson,1971,Journal ofMolecular Biology 56209-221),電穿孔法(見例如Shigekawa和Dower,1988,Biotechniques 6742-751),或接合作用(見例如,Koehler和Thorne,1987,Journal of Bacteriology 1695771-5278)。
用途本發(fā)明還涉及利用本發(fā)明所述的具有L-天冬酰胺酶活性的分泌的多肽的方法。
本發(fā)明所述的具有L-天冬酰胺酶活性的分泌的多肽可以用于由天冬酰胺產(chǎn)生天冬氨酸。
本發(fā)明所述的分泌的多肽還可以用于治療白血病,如急性淋巴細(xì)胞性白血病(見Asselin in Drug Resistance in Leukemia and Lymphoma III,第621-629頁(yè),Kaspers等編輯,Kluwer Academic/Plenum Publishers,New York,1999)。
組合物在另一方面,本發(fā)明涉及一種包含具有L-天冬酰胺酶活性的重組分泌的多肽的多肽組合物。優(yōu)選,所述組合物富含具有L-天冬酰胺酶活性的分泌的多肽。在本文中,術(shù)語(yǔ)“富含”指多肽組合物的L-天冬酰胺酶活性增加,如富集因子為1.1。
多肽組合物可以包含作為主要或唯一的酶組分的具有L-天冬酰胺酶活性的分泌的多肽,如單組分多肽組合物。另外,組合物可以包含多種酶活性物,如氨肽酶、淀粉酶、糖酶、羧肽酶、過(guò)氧化氫酶、纖維素酶、幾丁質(zhì)酶、角質(zhì)酶(cutinase)、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶,β-半乳糖苷酶,葡糖淀粉酶,α-葡糖苷酶、β-葡糖苷酶、鹵過(guò)氧化物酶、轉(zhuǎn)化酶、漆酶、脂酶、甘露糖苷酶、氧化酶、溶果膠酶、肽谷氨酰胺酶、過(guò)氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶。其它酶可通過(guò)下述微生物產(chǎn)生曲霉菌(Aspergillus)屬,優(yōu)選棘孢曲霉(Aspergillus Aculeatus)、泡盛曲霉(Aspergillus awamori)、黑曲霉(Aspergillus niger)或米曲霉(Aspergillusoryzae);或木霉屬(Trichoderma);腐質(zhì)霉屬(Humicola),優(yōu)選Humicolainsolens;或鐮孢屬(Fusarium),優(yōu)選桿孢狀鐮孢(Fusarium graminearum)、Fusarium cerealis、Fusarium crookwellense、大刀鐮孢(Fusarium culmorum)、禾本科鐮孢(Fusarium graminearum)、禾赤鐮孢(Fusarium graminum)、異孢鐮孢(Fusarium heterosporum)、合歡木鐮孢(Fusarium negundi)、尖鐮孢(Fusarium oxysporum)、多枝鐮孢(Fusarium reticulatum)、粉紅鐮孢(Fusarium roseum)、接骨木鐮孢(Fusarium sambucinum)、膚色鐮孢(Fusarium sarcochroum)、擬分枝鐮孢(Fusarium sporotrichioides)、硫色鐮孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum。
在一個(gè)優(yōu)選的實(shí)施方案中,組合物包含具有具有L-天冬酰胺酶活性的單一組分的分泌的多肽和可接受的載體??墒褂帽绢I(lǐng)域熟知的任何適宜載體。
信號(hào)肽本發(fā)明還涉及核酸構(gòu)建體,其包含與由SEQ ID NO1的1-69核苷酸組成的核酸序列可操作地連接的編碼蛋白的基因,所述核酸序列編碼由SEQID NO2的1-23氨基酸組成的信號(hào)肽,其中所述基因?qū)怂嵝蛄惺峭庠吹摹?br>
本發(fā)明還涉及重組表達(dá)載體和含有上述這種核酸構(gòu)建體的重組宿主細(xì)胞。
本發(fā)明還涉及產(chǎn)生蛋白的方法,其包括(a)在適于產(chǎn)生蛋白的條件下培養(yǎng)所述重組宿主細(xì)胞;和(b)回收所述蛋白。
第一和第二核酸序列能以和其它控制序列一起或與其它控制序列組合的形式,分別與外源基因可操作地連接。所述其它控制序列如上所述。如前所述,當(dāng)信號(hào)肽和前肽區(qū)都存在于蛋白氨基端時(shí),前肽區(qū)鄰接于多肽的氨基端且信號(hào)肽區(qū)鄰接于前肽區(qū)的氨基端。
蛋白對(duì)于宿主細(xì)胞可以是天然或異源的。術(shù)語(yǔ)“蛋白”在本文中并非指特定長(zhǎng)度的編碼產(chǎn)物,因此包括肽、寡肽和蛋白。術(shù)語(yǔ)“蛋白”還包含組合形成編碼產(chǎn)物的兩種或多種多肽。所述蛋白還包括雜合多肽,其包含來(lái)自至少兩個(gè)不同的蛋白的部分或全部多肽序列的組合,其中的一種或多種蛋白對(duì)宿主細(xì)胞可以是異源或天然的。蛋白還包括上面提到的蛋白和雜合蛋白的天然存在的等位基因變體和改造后的變體。
優(yōu)選地,蛋白是激素或其變體、酶、受體或其部分、抗體或其部分、或報(bào)道蛋白(reporter)。在一個(gè)更優(yōu)選的實(shí)施方案中,蛋白是氧化還原酶、移轉(zhuǎn)酶、水解酶、裂解酶、異構(gòu)酶或連接酶。在一個(gè)更優(yōu)選的實(shí)施方案中,蛋白是氨肽酶、淀粉酶、糖酶、羧肽酶、過(guò)氧化氫酶、纖維素酶、幾丁質(zhì)酶、角質(zhì)酶(cutinase)、環(huán)糊精糖基轉(zhuǎn)移酶、脫氧核糖核酸酶、酯酶、α-半乳糖苷酶,β-半乳糖苷酶,葡糖淀粉酶,α-葡糖苷酶、β-葡糖苷酶、轉(zhuǎn)化酶、漆酶、脂酶、甘露糖苷酶、齒斑葡聚糖酶(mutanase)。氧化酶、溶果膠酶、過(guò)氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、轉(zhuǎn)谷氨酰胺酶或木聚糖酶。
基因可獲自任何原核、真核或其它來(lái)源。
本發(fā)明通過(guò)如下實(shí)施例進(jìn)一步描述,這些實(shí)施例不應(yīng)理解為是對(duì)本發(fā)明范圍的限制。
實(shí)施例用作緩沖液和底物的化學(xué)制品為至少試劑級(jí)的商品化產(chǎn)品。
菌株大腸桿菌TOP10,大腸桿菌XL1-Blue,大腸桿菌SURE,枯草芽孢桿菌A164(ATCC 6051A),枯草芽孢桿菌168(Bacillus Stock Center,Columbus,OH)和枯草芽孢桿菌PL1801 spoIIE∷Tn917(amyE,apr,npr)。
引物和寡核苷酸所有引物和寡聚物均在Applied Biosystems Model 394型合成儀(AppliedBiosystemsInc.,F(xiàn)oster City,CA)上按照廠家說(shuō)明書進(jìn)行合成。
實(shí)施例1.來(lái)自枯草芽孢桿菌168的L-天冬酰胺酶基因的分離和鑒定采用QIAGEN細(xì)菌基因組DNA分離法(QIAGEN,Valencia,CA),按照廠家說(shuō)明從枯草芽孢桿菌168中分離基因組DNA。
采用下列寡核苷酸引物1和2通過(guò)PCR從枯草芽孢桿菌168基因組DNA擴(kuò)增L-天冬酰胺酶編碼區(qū)。引物1在L-天冬酰胺酶編碼區(qū)的上游并入了SacI位點(diǎn)和芽孢桿菌絲氨酸蛋白酶的核糖體結(jié)合位點(diǎn)(SAVINASETM,Novo Nordisk A/S,Bagsvrd,Denmark,下文稱為SAVINASETM基因),引物2在L-天冬酰胺酶編碼區(qū)的下游并入了NotI位點(diǎn)。
引物15′-CGAGCTCTATAAAAATGAGGAGGGAACCGAATGAAAAAACAACGAATGCTCGT-3′(SEQ ID NO3)引物25′-GCGGCCGCAGAGGTCATTATTGGTCCTA-3′(SEQ ID NO4)該擴(kuò)增反應(yīng)物(50μl)含有如下成分約200ng枯草芽孢桿菌168的基因組DNA,兩種引物各0.5μM,dATP、dCTP、dGTP和dTTP各200μM,1XPCR緩沖液,3mM MgCl2,0.625U的AmpliTaq Gold DNA聚合酶(PE AppliedBiosystems,F(xiàn)oster City,CA)。在RoboCycler 40 Temperature Cycler(StratageneCloning Systems,La Jolla,CA)中循環(huán)地進(jìn)行反應(yīng),即95℃以9分鐘進(jìn)行一次循環(huán);95℃以1分鐘,55℃以1分鐘,72℃以2分鐘,各進(jìn)行30個(gè)循環(huán);最后一個(gè)循環(huán)在72℃進(jìn)行3分鐘。
按照廠家說(shuō)明書,采用TOPO TA克隆試劑盒(Cloning Kit)(Invitrogen,Carlsbad,CA)克隆PCR產(chǎn)物。按照廠家說(shuō)明書,利用QIAprep 8質(zhì)粒試劑盒(Plasmid Kit)(QIAGEN,Valencia,CA)從大腸桿菌TOP10轉(zhuǎn)化物中分離質(zhì)粒DNA。利用酶EcoRI和NotI,通過(guò)限制性分析鑒定含有所需插入物的質(zhì)粒,并將其命名為pCR2.1-yccC。分離包含pCR2.1-yccC質(zhì)粒的大腸桿菌TOP10菌落,并按照廠家說(shuō)明書,采用QIAGEN質(zhì)粒試劑盒制備質(zhì)粒DNA用于測(cè)序。用該質(zhì)粒轉(zhuǎn)化大腸桿菌SURE細(xì)胞(Stratagene Cloning Systems,LaJolla,CA),其中一個(gè)轉(zhuǎn)化物命名為大腸桿菌MDT50(pCR2.1-yccC),并按照布達(dá)佩斯條約于2002年2月8日保存于農(nóng)業(yè)研究機(jī)構(gòu)專利培養(yǎng)物保藏中心(Agricultural Research Service Patent Culture Collection)、北部區(qū)域研究中心(Northern Regional Research Center),大學(xué)街1815號(hào)(University Street 1815),Peoria,Illinois,61604,保藏號(hào)為NRRL B-30558。
利用染料-終止物化學(xué)(dye-terminator chemistry)和基于已公開的yccC基因序列的合成寡核苷酸(Kumano等,1997,Microbiology 1432775-2782),采用Applied Biosystems 377XL型自動(dòng)DNA測(cè)序儀進(jìn)行DNA測(cè)序。DNA測(cè)序分析證實(shí)pCR2.1-yccC中的L-天冬酰胺酶基因的序列與已公開的序列(Kumano等,1997,Microbiology 1432775-2782)完全一致。
L-天冬酰胺酶克隆具有長(zhǎng)度為1125bp的開放閱讀框,所述開放閱讀框架編碼375個(gè)氨基酸的多肽。核酸序列(SEQ ID NO1)和推導(dǎo)的氨基酸序列(SEQ ID NO2)如圖1中所示。采用信號(hào)肽P法(SignalP program)(Nielsen等,1997,Protein Engineering 101-6),預(yù)測(cè)一個(gè)23個(gè)殘基的信號(hào)肽相當(dāng)于第1-69位核苷酸。
通過(guò)Clustal方法(Higgins,1989,CABIOS 5151-153),利用LASERGENETMMEGALIGNTM軟件(DNASTAR,Inc.,Madison,WI),以同一性表和多項(xiàng)比對(duì)參數(shù)(缺口罰分為10,缺口長(zhǎng)度罰分為10)對(duì)L-天冬酰胺酶氨基酸序列的相對(duì)比對(duì)進(jìn)行測(cè)定。成對(duì)比對(duì)參數(shù)為Ktuple=1,缺口罰分=3,窗(windows)=5,對(duì)角(diagonals)=5。
相對(duì)比對(duì)表明,枯草芽孢桿菌L-天冬酰胺酶與獲自菊歐文氏桿菌(Erwinia chrysanthemi)(EMBL X14777)的L-天冬酰胺酶具有55.2%的同一性,與獲自大腸桿菌(EMBL M34234)的L-天冬酰胺酶II具有48.6%的同一性。
實(shí)施例2構(gòu)建pMDT050用SacI和NotI消化pCAsub3Δ-Pr“短”共有序列amyQ/PrcryIIIA/cryIIIAstab/SAV(WO01/14534,實(shí)施例12),以除去大部分芽孢桿菌絲氨酸蛋白酶基因的編碼區(qū),用QIAquick凝膠純化(Gel Purification)試劑盒凝膠純化約5030bp的載體片段。用SacI和NotI消化pCR2.1-yccC,并采用QIAquick凝膠純化試劑盒用凝膠純化約1220bp的含有L-天冬酰胺酶基因的片段。用快速DNA連接試劑盒(Rapid DNA Ligation Kit)連接該凝膠純化的片段。將該連接混合物轉(zhuǎn)化大腸桿菌SURE細(xì)胞(Stratagene Cloning Systems,La Jolla,CA),并在添加了100μg/ml氨芐青霉素的2X YT平板上篩選具有氨芐青霉素抗性的轉(zhuǎn)化體。按照廠家說(shuō)明書,采用QIAprep 8質(zhì)粒試劑盒(QIAGEN,Valencia,CA)從大腸桿菌TOP10轉(zhuǎn)化體中分離質(zhì)粒DNA。用酶HindIII通過(guò)限制性分析鑒定含有所需插入物的質(zhì)粒,并命名為pMDT050(圖2)。
實(shí)施例3構(gòu)建pMDT050整合體用pMDT050轉(zhuǎn)化枯草芽孢桿菌PL1801 spoIIE∷Tn917,并在添加了5μg/ml氯霉素的胰蛋白 血瓊脂基礎(chǔ)(Tryptose Blood Agar Base)(TBAB)平板上篩選氯霉素抗性轉(zhuǎn)化體(其中推測(cè)pMDT050整合在L-天冬酰胺酶基因座)。選擇一個(gè)這樣的整合體,通過(guò)在添加了濃度漸增的氯霉素(最高為30μg/ml的氯霉素)的TBAB平板上,對(duì)該整合體進(jìn)行劃線(streaking),誘導(dǎo)整合DNA的串聯(lián)雙拷貝。將該菌株命名為枯草芽孢桿菌MDT51。
用pCAsub3(WO01/14534,實(shí)施例12)轉(zhuǎn)化枯草芽孢桿菌PL1801spoIIE∷Tn917,并在添加了5μg/ml氯霉素的TBAB平板上篩選氯霉素抗性轉(zhuǎn)化體。選擇其中一個(gè)這樣的整合體,命名為枯草芽孢桿菌MDT52,作為酶分析的對(duì)照。
實(shí)施例4分泌的L-天冬酰胺酶的制備在含有50ml乳酸桿菌(Lactobacilli)MRS液體培養(yǎng)基(Lactobacilli MRSBroth)(Difco Laboratories,Detroit,MI)的250ml搖瓶中,于37℃,250rpm的條件下,使枯草芽孢桿菌菌株MDT51和MDT52生長(zhǎng)24小時(shí)。以7000rpm離心5分鐘,回收上清。將上清樣品加在Novex 10-20% Tricine SDS-PAGE凝膠(Novex,San Diego,CA)上進(jìn)行電泳,并用考馬斯亮藍(lán)將蛋白條帶顯色。在MDT51樣品中,觀察到其體積與成熟L-天冬酰胺酶的預(yù)期大小(37kDa;氨基酸24-375)相對(duì)應(yīng)的明顯條帶,而MDT52樣品中則沒(méi)有所述條帶。
實(shí)施例5重組L-天冬酰胺酶的表征對(duì)MDT50和MDT51的搖瓶培養(yǎng)物的上清樣品進(jìn)行L-天冬酰胺酶活性分析。L-天冬酰胺酶購(gòu)自Hewlett-Packard,(Palo Alto,CA)。AmmoniaEnzymatic Bioanalysis試劑盒購(gòu)自R-Biopharm(Marshall,MI)(Cat.#1112732)。BioSpin6凝膠過(guò)濾柱購(gòu)自BioRad。
在通過(guò)BioSpin 6柱脫鹽后,將80μl的MDT51培養(yǎng)物上清液與200μl的0.1M天冬酰胺(在Britton-Roberson緩沖液中,pH8)、20μl水和300μlBritton-Roberson緩沖液,pH8混合。將脫鹽的MDT52培養(yǎng)物上清液或緩沖液設(shè)為陰性對(duì)照。用36μl 0.1M醋酸銨替代培養(yǎng)物上清液作為陽(yáng)性對(duì)照。在20℃孵育4小時(shí)后,取等分樣品進(jìn)行NH3檢測(cè)。溫育2天后,凍存溶液,并送到入加州大學(xué)戴維斯分校(University of California at Davis)的分子結(jié)構(gòu)設(shè)備(Molecular Structure Facility)進(jìn)行天冬氨酸檢測(cè)。
采用氨酶生物分析試劑盒(Ammonia Enzymatic Bioanalysis Kit)(R-Biopharm)進(jìn)行氨分析。如果需要,先將樣品用去離子水稀釋。在石英槽中,將75μl樣品或樣品稀釋物與625μl H2O以及300μl取自試劑盒的反應(yīng)混合物#2(含有pH8的三乙醇胺緩沖液、2-酮戊二酸、NADH和穩(wěn)定劑)混合。通過(guò)顛倒將槽內(nèi)物質(zhì)混合,于20℃放置5分鐘,在340nm測(cè)定吸光度。然后,加入6μl取自試劑盒的混合物#3(含有谷氨酸脫氫酶)并混合。樣品放置20分鐘,測(cè)量340nm的吸光度。利用試劑盒中提供的說(shuō)明進(jìn)行NH3的計(jì)算(單位mg/ml)。
表1顯示了MDT51和MDT52的反應(yīng)之間的NH3含量差異,這是由L-天冬酰胺酶對(duì)天冬酰胺的脫酰胺作用所致。觀察到40μM/h的表觀速率。
表1.檢測(cè)通過(guò)L-天冬酰胺酶的作用從天冬酰胺產(chǎn)生的NH3
1預(yù)計(jì)從開始的NH4Ac生成100μg/ml。
在加州大學(xué)戴維斯分校的分子結(jié)構(gòu)設(shè)備上進(jìn)行氨基酸分析。每次注射,MDT51的分析反應(yīng)產(chǎn)生0.60nmol天冬氨酸和6.92nmol天冬酰胺,相當(dāng)于從最初含有33mM天冬酰胺的樣品反應(yīng)產(chǎn)生2.4mM天冬氨酸和27.7mM天冬酰胺。以根據(jù)氨檢測(cè)(ammonia detection)估記的反應(yīng)時(shí)間(約48小時(shí))和速率(約40μM/h)為基礎(chǔ),樣品應(yīng)含有約2mM天冬氨酸(通過(guò)酶的作用由33mM天冬酰胺產(chǎn)生),與觀測(cè)值相符。
生物材料的保藏下列生物材料已經(jīng)按照布達(dá)佩斯條約保藏于農(nóng)業(yè)研究機(jī)構(gòu)專利培養(yǎng)物保藏中心、北部區(qū)域研究中心,大學(xué)街1815號(hào)(University Street),Peoria,Illinois,61604,保藏編號(hào)如下保藏 保藏編號(hào) 保藏日期E.coli MDT50(pCR2.1-yccC) NRRL B-30558 2002年2月8日該菌株已經(jīng)進(jìn)行保藏,并根據(jù)37 C.F.R.§1.14和35 U.S.C.§122的規(guī)定,在本發(fā)明申請(qǐng)的過(guò)程中保證專利和商標(biāo)專員指定的人員能夠獲得該培養(yǎng)物。所述保藏是所述保藏菌株的基本純的培養(yǎng)物。在提交本發(fā)明副本(counterparts)或其后續(xù)申請(qǐng)(progeny)的國(guó)家中如果外國(guó)專利法規(guī)要求,可以提供所述保藏物。但是應(yīng)該理解的是可獲得保藏物并不構(gòu)成在侵害根據(jù)國(guó)家法規(guī)授予的專利權(quán)的情況下獲得實(shí)施本發(fā)明的許可。
在此所描述并要求專利保護(hù)的發(fā)明并不限于本文中所公開的特定實(shí)施方案的范圍內(nèi),因?yàn)檫@些實(shí)施方案意圖作為對(duì)本發(fā)明幾個(gè)方面的說(shuō)明。任何等同的實(shí)施方案均在本發(fā)明的范圍內(nèi)。事實(shí)上,除了那些在此所示并描述的修改外,本領(lǐng)域的技術(shù)人員很容易根據(jù)前面的描述對(duì)發(fā)明作各種修改。這些修改也在所附權(quán)利要求的范圍內(nèi)。一旦出現(xiàn)歧義,以包括定義在內(nèi)的本申請(qǐng)的所有內(nèi)容對(duì)其進(jìn)行解釋。
本文中引用了各種參考文獻(xiàn),其公開內(nèi)容全部引入作參考。
關(guān)于微生物保藏的說(shuō)明(細(xì)則13之二)
PCT/RO/134表(1992年7月)
序列表<110>諾維信生物技術(shù)公司(Novozymes Biotech,Inc.)托馬斯,邁克爾D(Thomas,Michael D.)思洛馬,艾倫(Sloma,Alan)<120>制備具有L-天冬酰胺酶活性的分泌性多肽的方法<130>10289.204-WO<150>US 60/369,192<151>2002-04-01<160>8<170>PatentIn version 3.2<210>1<211>1128<212>DNA<213>枯草芽孢桿菌(Bacillus subtilis)<400>1atgaaaaaac aacgaatgct cgtacttttt accgcactat tgtttgtttt taccggatgt60tcacattctc ctgaaacaaa agaatccccg aaagaaaaag ctcagacaca aaaagtctct 120tcggcttctg cctctgaaaa aaaggatctg ccaaacatta gaattttagc gacaggaggc 180acgatagctg gtgccgatca atcgaaaacc tcaacaactg aatataaagc aggtgttgtc 240ggcgttgaat cactgatcga ggcagttcca gaaatgaagg acattgcaaa cgtcagcggc 300gagcagattg ttaacgtcgg cagcacaaat attgataata aaatattgct gaagctggcg 360aaacgcatca accacttgct cgcttcagat gatgtagacg gaatcgtcgt gactcatgga 420acagatacat tggaggaaac cgcttatttt ttgaatctta ccgtgaaaag tgataaaccg 480gttgttattg tcggttcgat gagaccttcc acagccatca gcgctgatgg gccttctaac 540ctgtacaatg cagtgaaagt ggcaggtgcc cctgaggcaa aagggaaagg gacgcttgtt 600gttcttaacg accggattgc ctcagcccga tatgtcacca aaacaaacac aactacaaca 660gatacattta aatcagaaga aatgggcttc gtcggaacaa ttgcagatga tatctatttt 720aataatgaga ttacccgtaa gcatacgaag gacacggatt tctcggtttc taatcttgat 780gagctgccgc aggttgacat tatctatgga taccaaaatg acggaagcta cctgtttgac 840gctgctgtaa aagccggagc aaaggggatt gtatttgccg gttctgggaa cgggtcttta 900tctgatgcag ccgaaaaagg ggcggacagc gcagtcaaaa aaggcgttac agtggtgcgc 960tctacccgca cgggaaatgg tgtcgtcaca ccaaaccaag actatgcgga aaaggacttg 1020ctggcatcga actctttaaa cccccaaaaa gcacggatgt tgctgatgct tgcgcttacc 1080aaaacaaatg atcctcaaaa aatccaagct tatttcaatg agtattga 1128<210>2
<211>375<212>PRT<213>枯草芽孢桿菌(Bacillus subtilis)<400>2Met Lys Lys Gln Arg Met Leu Val Leu Phe Thr Ala Leu Leu Phe Val1 5 10 15Phe Thr Gly Cys Ser His Ser Pro Glu Thr Lys Glu Ser Pro Lys Glu20 25 30Lys Ala Gln Thr Gln Lys Val Ser Ser Ala Ser Ala Ser Glu Lys Lys35 40 45Asp Leu Pro Asn Ile Arg Ile Leu Ala Thr Gly Gly Thr Ile Ala Gly50 55 60Ala Asp Gln Ser Lys Thr Ser Thr Thr Glu Tyr Lys Ala Gly Val Val65 70 75 80Gly Val Glu Ser Leu Ile Glu Ala Val Pro Glu Met Lys Asp Ile Ala85 90 95Asn Val Ser Gly Glu Gln Ile Val Asn Val Gly Ser Thr Asn Ile Asp100 105 110Asn Lys Ile Leu Leu Lys Leu Ala Lys Arg Ile Asn His Leu Leu Ala115 120 125Ser Asp Asp Val Asp Gly Ile Val Val Thr His Gly Thr Asp Thr Leu130 135 140Glu Glu Thr Ala Tyr Phe Leu Asn Leu Thr Val Lys Ser Asp Lys Pro145 150 155 160Val Val Ile Val Gly Ser Met Arg Pro Ser Thr Ala Ile Ser Ala Asp165 170 175Gly Pro Ser Asn Leu Tyr Asn Ala Val Lys Val Ala Gly Ala Pro Glu180 185 190Ala Lys Gly Lys Gly Thr Leu Val Val Leu Asn Asp Arg Ile Ala Ser195 200 205Ala Arg Tyr Val Thr Lys Thr Asn Thr Thr Thr Thr Asp Thr Phe Lys210 215 220Ser Glu Glu Met Gly Phe Val Gly Thr Ile Ala Asp Asp Ile Tyr Phe
225 230 235 240Asn Asn Glu Ile Thr Arg Lys His Thr Lys Asp Thr Asp Phe Ser Val245 250 255Ser Asn Leu Asp Glu Leu Pro Gln Val Asp Ile Ile Tyr Gly Tyr Gln260 265 270Asn Asp Gly Ser Tyr Leu Phe Asp Ala Ala Val Lys Ala Gly Ala Lys275 280 285Gly Ile Val Phe Ala Gly Ser Gly Asn Gly Ser Leu Ser Asp Ala Ala290 295 300Glu Lys Gly Ala Asp Ser Ala Val Lys Lys Gly Val Thr Val Val Arg305 310 315 320Ser Thr Arg Thr Gly Asn Gly Val Val Thr Pro Asn Gln Asp Tyr Ala325 330 335Glu Lys Asp Leu Leu Ala Ser Asn Ser Leu Asn Pro Gln Lys Ala Arg340 345 350Met Leu Leu Met Leu Ala Leu Thr Lys Thr Asn Asp Pro Gln Lys Ile355 360 365Gln Ala Tyr Phe Asn Glu Tyr370 375<210>3<211>53<212>DNA<213>枯草芽孢桿菌(Bacillus subtilis)<400>3cgagctctat aaaaatgagg agggaaccga atgaaaaaac aacgaatgct cgt53<210>4<211>28<212>DNA<213>枯草芽孢桿菌(Bacillus subtilis)<400>4gcggccgcag aggtcattat tggtccta28<210>5<211>185<212>DNA<213>芽孢桿菌屬(Bacillus)<400>5
ggccttaagg gcctgcaatc gattgtttga gaaaagaaga agaccataaa aataccttgt 60ctgtcatcag acagggtatt ttttatgctg tccagactgt ccgctgtgta aaaaaaagga120ataaaggggg gttgacatta ttttactgat atgtataata taatttgtat aagaaaatgg180agctc185<210>6<211>185<212>DNA<213>芽孢桿菌屬(Bacillus)<400>6ggccttaagg gcctgcaatc gattgtttga gaaaagaaga agaccataaa aataccttgt 60ctgtcatcag acagggtatt ttttatgctg tccagactgt ccgctgtgta aaaaatagga120ataaaggggg gttgacatta ttttactgat atgtataata taatttgtat aagaaaatgg180agctc185<210>7<211>185<212>DNA<213>芽孢桿菌屬(Bacillus)<400>7ggccttaagg gcctgcaatc gattgtttga gaaaagaaga agaccataaa aataccttgt 60ctgtcatcag acagggtatt ttttatgctg tccagactgt ccgctgtgta aaaaatagga120ataaaggggg gttgttatta ttttactgat atgtaaaata taatttgtat aagaaaatgg180agctc185<210>8<211>3050<212>DNA<213>芽孢桿菌屬(Bacillus)<400>8tcgaaacgta agatgaaacc ttagataaaa gtgctttttt tgttgcaatt gaagaattat 60taatgttaag cttaattaaa gataatatct ttgaattgta acgcccctca aaagtaagaa120ctacaaaaaa agaatacgtt atatagaaat atgtttgaac cttcttcaga ttacaaatat180attcggacgg actctacctc aaatgcttat ctaactatag aatgacatac aagcacaacc240ttgaaaattt gaaaatataa ctaccaatga acttgttcat gtgaattatc gctgtattta300attttctcaa ttcaatatat aatatgccaa tacattgtta caagtagaaa ttaagacacc360cttgatagcc ttactatacc taacatgatg tagtattaaa tgaatatgta aatatattta420tgataagaag cgacttattt ataatcatta catatttttc tattggaatg attaagattc480caatagaata gtgtataaat tatttatctt gaaaggaggg atgcctaaaa acgaagaaca540
ttaaaaacat atatttgcac cgtctaatgg atttatgaaa aatcatttta tcagtttgaa 600aattatgtat tatgataaga aagggaggaa gaaaaatgaa tccgaacaat cgaagtgaac 660atgatacaat aaaaactact gaaaataatg aggtgccaac taaccatgtt caatatcctt 720tagcggaaac tccaaatcca acactagaag atttaaatta taaagagttt ttaagaatga 780ctgcagataa taatacggaa gcactagata gctctacaac aaaagatgtc attcaaaaag 840gcatttccgt agtaggtgat ctcctaggcg tagtaggttt cccgtttggt ggagcgcttg 900tttcgtttta tacaaacttt ttaaatacta tttggccaag tgaagacccg tggaaggctt 960ttatggaaca agtagaagca ttgatggatc agaaaatagc tgattatgca aaaaataaag1020ctcttgcaga gttacagggc cttcaaaata atgtcgaaga ttatgtgagt gcattgagtt1080catggcaaaa aaatcctgtg agttcacgaa atccacatag ccaggggcgg ataagagagc1140tgttttctca agcagaaagt cattttcgta attcaatgcc ttcgtttgca atttctggat1200acgaggttct atttctaaca acatatgcac aagctgccaa cacacattta tttttactaa1260aagacgctca aatttatgga gaagaatggg gatacgaaaa agaagatatt gctgaatttt1320ataaaagaca actaaaactt acgcaagaat atactgacca ttgtgtcaaa tggtataatg1380ttggattaga taaattaaga ggttcatctt atgaatcttg ggtaaacttt aaccgttatc1440gcagagagat gacattaaca gtattagatt taattgcact atttccattg tatgatgttc1500ggctataccc aaaagaagtt aaaaccgaat taacaagaga cgttttaaca gatccaattg1560tcggagtcaa caaccttagg ggctatggaa caaccttctc taatatagaa aattatattc1620gaaaaccaca tctatttgac tatctgcata gaattcaatt tcacacgcgg ttccaaccag1680gatattatgg aaatgactct ttcaattatt ggtccggtaa ttatgtttca actagaccaa1740gcataggatc aaatgatata atcacatctc cattctatgg aaataaatcc agtgaacctg1800tacaaaattt agaatttaat ggagaaaaag tctatagagc cgtagcaaat acaaatcttg1860cggtctggcc gtccgctgta tattcaggtg ttacaaaagt ggaatttagc caatataatg1920atcaaacaga tgaagcaagt acacaaacgt acgactcaaa aagaaatgtt ggcgcggtca1980gctgggattc tatcgatcaa ttgcctccag aaacaacaga tgaacctcta gaaaagggat2040atagccatca actcaattat gtaatgtgct ttttaatgca gggtagtaga ggaacaatcc2100cagtgttaac ttggacacat aaaagtgtag acttttttaa catgattgat tcgaaaaaaa2160ttacacaact tccgttagta aaggcatata agttacaatc tggtgcttcc gttgtcgcag2220gtcctaggtt tacaggagga gatatcattc aatgcacaga aaatggaagt gcggcaacta2280tttacgttac accggatgtg tcgtactctc aaaaatatcg agctagaatt cattatgctt2340ctacatctca gataacattt acactcagtt tagacggggc accatttaat caatactatt2400
tcgataaaac gataaataaa ggagacacat taacgtataa ttcatttaat ttagcaagtt2460tcagcacacc attcgaatta tcagggaata acttacaaat aggcgtcaca ggattaagtg2520ctggagataa agtttatata gacaaaattg aatttattcc agtgaattaa attaactaga2580aagtaaagaa gtagtgacca tctatgatag taagcaaagg ataaaaaaat gagttcataa2640aatgaataac atagtgttct tcaactttcg ctttttgaag gtagatgaag aacactattt2700ttattttcaa aatgaaggaa gttttaaata tgtaatcatt taaagggaac aatgaaagta2760ggaaataagt cattatctat aacaaaataa catttttata tagccagaaa tgaattataa2820tattaatctt ttctaaattg acgtttttct aaacgttcta tagcttcaag acgcttagaa2880tcatcaatat ttgtatacag agctgttgtt tccatcgagt tatgtcccat ttgattcgct2940aatagaacaa gatctttatt ttcgttataa tgattggttg cataagtatg gcgtaattta3000tgagggcttt tcttttcatc aaaagccctc gtgtatttct ctgtaagctt 3050
權(quán)利要求
1.一種產(chǎn)生具有L-天冬酰胺酶活性的分泌的多肽的方法,其包括(a)在有利于該多肽產(chǎn)生的條件下培養(yǎng)宿主細(xì)胞,其中所述宿主細(xì)胞含有核酸構(gòu)建體,所述核酸構(gòu)建體含有編碼分泌信號(hào)肽的第一核酸序列,其中所述第一核酸序列與編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地連接,其中所述信號(hào)肽序列指導(dǎo)該多肽進(jìn)入細(xì)胞分泌途徑;和(b)回收該分泌的多肽。
2.權(quán)利要求1所述的方法,其中第一核酸序列編碼一種分泌信號(hào)肽,所述分泌信號(hào)肽含有編碼SEQ ID NO2第1-23位氨基酸的SEQ ID NO1第1-69位核苷酸,或其編碼所述信號(hào)肽的一部分的亞序列,其中所述信號(hào)肽的一部分保留了指導(dǎo)編碼多肽進(jìn)入細(xì)胞分泌途徑的能力。
3.權(quán)利要求1所述的方法,其中第二核酸序列編碼選自下組的具有L-天冬酰胺酶活性的多肽(a)具有與SEQ ID NO2的24-375位氨基酸至少70%同一性的氨基酸序列的多肽;(b)一種由核酸序列編碼的多肽,其中所述核酸序列在中度嚴(yán)謹(jǐn)條件下與SEQ ID NO1的70-1125位核苷酸或其互補(bǔ)鏈雜交;(c)(a)或(b)的片段,其中所述片段具有L-天冬酰胺酶活性。
4.權(quán)利要求3所述的方法,其中所述多肽具有與SEQ ID NO2的24-375位氨基酸至少70%同一性的氨基酸序列。
5.權(quán)利要求4所述的方法,其中所述多肽具有與SEQ ID NO2的24-375位氨基酸至少80%同一性的氨基酸序列。
6.權(quán)利要求5所述的方法,其中所述多肽具有與SEQ ID NO2的24-375位氨基酸至少85%同一性的氨基酸序列。
7.權(quán)利要求6所述的方法,其中所述多肽具有與SEQ ID NO2的24-375位氨基酸至少90%同一性的氨基酸序列。
8.權(quán)利要求7所述的方法,其中所述多肽具有與SEQ ID NO2的24-375位氨基酸至少95%同一性的氨基酸序列。
9.權(quán)利要求3-8中任一項(xiàng)所述的方法,其中所述多肽含有SEQ ID NO2的24-375位氨基酸。
10.權(quán)利要求3-9中任一項(xiàng)所述的方法,其中所述多肽由SEQ ID NO2的24-375位氨基酸或其具有L-天冬酰胺酶活性的片段組成。
11.權(quán)利要求10所述的方法,其中所述多肽由SEQ ID NO2的24-375位氨基酸組成。
12.權(quán)利要求3所述的方法,其中所述多肽由一種核酸序列編碼,所述核酸序列在中度嚴(yán)謹(jǐn)條件下與SEQ ID NO1第70-1125位核苷酸或其互補(bǔ)鏈雜交。
13.權(quán)利要求3所述的方法,其中所述多肽由一種核酸序列編碼,所述核酸序列在中高嚴(yán)謹(jǐn)條件下與SEQ ID NO1第70-1125位核苷酸或其互補(bǔ)鏈雜交。
14.權(quán)利要求3所述的方法,其中所述多肽由一種核酸序列編碼,所述核酸序列在高嚴(yán)謹(jǐn)條件下與SEQ ID NO1第70-1125位核苷酸或其互補(bǔ)鏈雜交。
15.權(quán)利要求3所述的方法,其中所述多肽由包含在質(zhì)粒pCR2.1-yccC中的核酸序列編碼,所述質(zhì)粒包含于大腸桿菌NRRL B-30558中。
16.權(quán)利要求1-15中任一項(xiàng)所述的方法,其中核酸構(gòu)建體進(jìn)一步含有(i)串聯(lián)啟動(dòng)子,其中所述串聯(lián)啟動(dòng)子的每種啟動(dòng)子序列可操作地連接單拷貝的編碼多肽的核酸序列,以及可選地(ii)mRNA加工/穩(wěn)定序列,該mRNA加工/穩(wěn)定序列位于該串聯(lián)啟動(dòng)子下游并且位于編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列的上游。
17.權(quán)利要求1-16中任一項(xiàng)所述的方法,其中核酸構(gòu)建體進(jìn)一步含有(i)“共有序列”啟動(dòng)子,其具有“-35”區(qū)的TTGACA序列和“-10”區(qū)的TATAAT序列,并與單拷貝的編碼所述多肽的核酸序列可操作地連接,以及(ii)mRNA加工/穩(wěn)定序列,其位于該“共有序列”啟動(dòng)子下游并位于編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列的上游。
18.權(quán)利要求17所述的方法,其中所述共有序列啟動(dòng)子可獲自任何細(xì)菌啟動(dòng)子。
19.權(quán)利要求18所述的方法,其中所述“共有序列”啟動(dòng)子可獲自芽孢桿菌屬啟動(dòng)子。
20.權(quán)利要求18所述的方法,其中所述共有序列啟動(dòng)子可獲自大腸桿菌lac操縱子、天藍(lán)色鏈霉菌瓊脂糖酶基因(dagA)、Bacillus.clausii堿性蛋白酶基因(aprH)、地衣芽孢桿菌堿性蛋白酶基因(枯草桿菌蛋白酶Carlsberg基因)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、枯草芽孢桿菌α-淀粉酶基因(amyE)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽糖淀粉酶基因(amyM)、解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽孢桿菌xylA和xylB基因,或蘇云金芽孢桿菌擬步甲亞種CryIIIA基因(cryIIIA)或其部分。
21.權(quán)利要求18所述的方法,其中所述“共有序列”啟動(dòng)子可獲自解淀粉芽孢桿菌α-淀粉酶基因(amyQ)。
22.權(quán)利要求21所述的方法,其中所述“共有序列”amyQ啟動(dòng)子具有SEQ ID NO26或SEQ ID NO27所示核酸序列。
23.權(quán)利要求19所述的方法,其中所述mRNA加工/穩(wěn)定序列是cryIIIA mRNA加工/穩(wěn)定序列。
24.權(quán)利要求1-23中任一項(xiàng)所述的方法,其中核酸構(gòu)建體進(jìn)一步含有對(duì)于宿主細(xì)胞是異源的核糖體結(jié)合位點(diǎn)序列。
25.權(quán)利要求24所述的方法,其中所述核糖體結(jié)合位點(diǎn)序列可獲自大腸桿菌lac操縱子、天藍(lán)色鏈霉菌瓊脂糖酶基因(dagA)、B.clausii堿性蛋白酶基因(aprH)、地衣芽孢桿菌堿性蛋白酶基因(枯草桿菌蛋白酶Carlsberg基因)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、枯草芽孢桿菌α-淀粉酶基因(amyE)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽糖淀粉酶基因(amyM)、解淀粉芽孢桿菌α-淀粉酶基因(amyQ)或地衣芽孢桿菌青霉素酶基因(penP)。
26.權(quán)利要求1-25中任一項(xiàng)所述的方法,其中宿主細(xì)胞是芽孢桿菌屬細(xì)胞。
27.權(quán)利要求26所述的方法,其中芽孢桿菌屬細(xì)胞選自嗜堿芽孢桿菌、解淀粉芽孢桿菌、短芽孢桿菌、環(huán)狀芽孢桿菌、B.Clausii、凝結(jié)芽孢桿菌、燦爛芽孢桿菌、遲緩芽孢桿菌、地衣芽孢桿菌、巨大芽孢桿菌、嗜熱脂肪芽孢桿菌、枯草芽孢桿菌或蘇云金芽孢桿菌。
28.一種分離的具有L-天冬酰胺酶活性的多肽,其選自(a)具有與SEQ ID NO2的24-375位氨基酸具有至少70%同一性的氨基酸序列的多肽;(b)一種由核酸序列編碼的多肽,其中所述核酸序列在中度嚴(yán)謹(jǐn)條件下與SEQ ID NO1的70-1125位核苷酸或其互補(bǔ)鏈雜交;(c)(a)或(b)的片段,其中所述片段具有L-天冬酰胺酶活性。
29.權(quán)利要求28所述的多肽,其具有與SEQ ID NO2的24-375位氨基酸至少70%同一性的氨基酸序列。
30.權(quán)利要求29所述的多肽,其具有與SEQ ID NO2的24-375位氨基酸至少80%同一性的氨基酸序列。
31.權(quán)利要求30所述的多肽,其具有與SEQ ID NO2的24-375位氨基酸至少85%同一性的氨基酸序列。
32.權(quán)利要求31所述的多肽,其中所述多肽具有與SEQ ID NO2的24-375位氨基酸至少90%同一性的氨基酸序列。
33.權(quán)利要求32所述的多肽,其中所述多肽具有與SEQ ID NO2的24-375位氨基酸至少95%同一性的氨基酸序列。
34.權(quán)利要求28-33中任一項(xiàng)所述的多肽,其中所述多肽含有SEQ IDNO2的24-375位氨基酸。
35.權(quán)利要求28-34中任一項(xiàng)所述的多肽,其中所述多肽由SEQ IDNO2的24-375位氨基酸或其具有L-天冬酰胺酶活性的片段組成。
36.權(quán)利要求35所述的多肽,其中所述多肽由SEQ ID NO2的24-375位氨基酸組成。
37.權(quán)利要求28所述的多肽,其中所述多肽由核酸序列編碼,其中所述核酸序列在中度嚴(yán)謹(jǐn)條件下與SEQ ID NO1的70-1125位核苷酸或其互補(bǔ)鏈雜交。
38.權(quán)利要求28所述的多肽,其中所述多肽由核酸序列編碼,其中所述核酸序列在中高嚴(yán)謹(jǐn)條件下與SEQ ID NO1的70-1125位核苷酸或其互補(bǔ)鏈雜交。
39.權(quán)利要求28所述的多肽,其中所述多肽由核酸序列編碼,其中所述核酸序列在高嚴(yán)謹(jǐn)條件下與SEQ ID NO1的70-1125位核苷酸或其互補(bǔ)鏈雜交。
40.權(quán)利要求28所述的多肽,其中所述多肽由包含在質(zhì)粒pCR2.1-yccC中的核酸序列編碼,所述質(zhì)粒包含于大腸桿菌NRRL B-30558中。
41.一種分離的核酸序列,其編碼權(quán)利要求28-40中任一項(xiàng)所述的多肽。
42.一種核酸構(gòu)建體,其含有權(quán)利要求41所述的核酸序列,所述核酸序列與編碼分泌信號(hào)肽的核酸序列以及一個(gè)或多個(gè)控制序列可操作地連接,所述控制序列指導(dǎo)所述多肽在適宜的表達(dá)細(xì)胞中產(chǎn)生。
43.一種重組表達(dá)載體,其含有權(quán)利要求42所述的核酸構(gòu)建體。
44.一種重組宿主細(xì)胞,其含有權(quán)利要求42所述的核酸構(gòu)建體。
45.一種核酸構(gòu)建體,其含有一種編碼蛋白的基因,所述基因可操作地連接編碼信號(hào)肽的由SEQ ID NO1的1-69位核苷酸組成的核酸序列,其中所述基因相對(duì)所述核酸序列而言是外源的。
46.一種重組表達(dá)載體,其含有權(quán)利要求45所述的核酸構(gòu)建體。
47.一種重組宿主細(xì)胞,其含有權(quán)利要求45所述的核酸構(gòu)建體。
48.一種產(chǎn)生蛋白的方法,其包括(a)在有利于所述蛋白產(chǎn)生的條件下培養(yǎng)權(quán)利要求47所述的重組宿主細(xì)胞;和(b)回收該蛋白。
全文摘要
本發(fā)明涉及一種產(chǎn)生具有L-天冬酰胺酶活性的分泌的多肽的重組方法,其包括(a)在有利于該多肽產(chǎn)生的條件下培養(yǎng)宿主細(xì)胞,其中該宿主細(xì)胞含有核酸構(gòu)建體,該核酸構(gòu)建體含有編碼分泌信號(hào)肽的第一核酸序列,其中該第一核酸序列與編碼具有L-天冬酰胺酶活性的多肽的第二核酸序列可操作地連接,其中所述信號(hào)肽指導(dǎo)該多肽進(jìn)入細(xì)胞分泌途徑;和(b)回收該分泌的多肽。本發(fā)明還涉及具有L-天冬酰胺酶活性的分離多肽和其核酸。
文檔編號(hào)C12N1/21GK1705880SQ03812354
公開日2005年12月7日 申請(qǐng)日期2003年4月1日 優(yōu)先權(quán)日2002年4月1日
發(fā)明者邁克爾·托馬斯, 艾倫·斯洛馬 申請(qǐng)人:諾維信生物技術(shù)公司