專利名稱:信號序列捕獲的制作方法
發(fā)明領域
本發(fā)明描述了由現(xiàn)有基因文庫分離編碼分泌性多肽的基因的方法,其中通過體外轉座反應來檢測內源分泌信號序列,其中轉座子包含分泌性報告基因。
背景技術:
目前,新工業(yè)酶(更具體的說是分泌性酶)地搜索依賴簡單的主要功能測定法的有效性。通常,在培養(yǎng)基中使用底物來篩選微生物,通過底物的物理變化(顏色變化、集落周圍形成的暈輪、熒光等)來識別底物的降解。對于許多蛋白質而言,不存在簡單的功能測定法,但是它們可能具有作為工業(yè)酶的潛在應用。
分泌性酶在工業(yè)應用中受到高度關注,因而非常期望獲得只選擇編碼分泌性酶的克隆的正選擇篩選系統(tǒng)。信號捕獲是通過與缺乏自身信號的胞外報告基因的翻譯融合來鑒定包含信號肽的基因的方法。為了鑒定新信號序列,文獻中已經(jīng)報道了這種方法(Manoil和Beckwith,1985,TnphoAA transposon probe for protein export signals即TnphoA用于蛋白質輸出信號的轉座子探針,Proc.Natl.Acad.Sci.USA,828129-8133;H.Smith等人,1987,Construction and useof signal sequence selection vectors in Escherichia coli andBacillus subtilis即信號序列選擇載體在大腸桿菌和枯草芽孢桿菌中的構建和使用,J.Bact.,1693321-3328);這種方法還可用于清楚的確定信號肽內實現(xiàn)最佳功能所必需的特定元件(H.Smith等人,1988,Characterisation of signal-sequence-coding regionsselected from the Bacillus subtilis chromosome即選自枯草芽孢桿菌染色體的信號序列編碼區(qū)的表征,Gene,70351-361)。
許多發(fā)表物描述了克隆載體報告系統(tǒng),即在包含無信號報告基因的篩選載體中構建基因組或cDNA文庫。在將缺乏翻譯終止位點的cDNA或基因組片段克隆到報告上游時,形成了由此產(chǎn)生的蛋白質-報告基因融合產(chǎn)物。若克隆的cDNA或基因組片段包含信號肽,則融合蛋白將被分泌到胞外??梢酝ㄟ^選擇培養(yǎng)基上的生長來檢測分泌,如在釀酒酵母中使用轉化酶或在大腸桿菌中使用β-內酰胺酶。這些發(fā)表物并不涉及用于篩選先前構建的基因文庫的方法。
通過篩選包含信號肽的克隆,顯著降低了文庫中待調查的克隆數(shù)目,然而得到的克隆可能只包含不完整基因,即它可能包含或不包含編碼酶活性(所述酶活性最初與分離的分泌信號序列相關)所需要的最小DNA信息。
發(fā)明概述
本發(fā)明要解決的問題是在現(xiàn)有基因文庫中鑒定那些編碼有效分泌的或表面展示的多肽(甚至具有未知活性的多肽)的克隆,而無需在篩選載體中再次克隆文庫且無需在費時費力但只檢測已知活性的傳統(tǒng)活性測定法中篩選文庫。解決了這個問題就能夠由先前已構建了基因文庫的新生物體快速且有效的在工業(yè)上開發(fā)分泌的或表面展示的相關多肽。
我們描述了無信號報告基因與體外多核苷酸插入反應用于由先前構建的基因組或cDNA文庫鑒定分泌的、部分分泌的、或細胞表面展示的多肽的編碼基因的聯(lián)合使用,如轉座子(諸如MuA轉座子)中包含的無信號β-內酰胺酶基因的使用。本發(fā)明能夠通過對先前構建的基因庫或文庫篩選使用常規(guī)篩選方法不太可能分離得到的分泌的、部分分泌的、或細胞表面展示的多肽(諸如酶、受體、細胞因子、肽激素等)的編碼基因。
因此,本發(fā)明的第一個方面涉及由基因文庫鑒定并分離目的基因的方法,其中基因編碼攜帶用于分泌或部分分泌的信號序列的多肽,所述方法包括下列步驟
a)提供基因組DNA文庫或cDNA文庫;
b)在所述文庫中插入包含編碼分泌性報告基因的無啟動子且無分泌信號的多核苷酸的DNA片段;
c)將包含插入DNA片段的文庫導入宿主細胞;
d)篩選并選擇分泌或部分分泌有活性的分泌性報告基因的宿主細胞;
e)通過對插入DNA片段側翼的DNA測序,在選定宿主細胞中鑒定插入了分泌性報告基因的目的基因;
f)分離在步驟e)中鑒定的完整目的基因。
本發(fā)明的第二個方面涉及由基因文庫鑒定并分離目的基因的方法,其中所述基因編碼攜帶分泌信號序列的多肽,所述方法包括下列步驟
a)提供基因組DNA文庫或cDNA文庫;
b)在所述文庫中插入包含編碼分泌報告基因的無啟動子且無分泌信號的基因的DNA片段;
c)將攜帶所述DNA片段的隨機插入片段的文庫導入宿主細胞群體;
d)篩選表達并分泌分泌性報告基因的宿主細胞;
e)通過對步驟b)的DNA片段側翼的DNA測序,鑒定插入了分泌性報告基因的目的基因;
f)由步驟a)的文庫分離完整目的基因。
術語“多肽”、“分泌的”、或“部分分泌”和“部分分泌的”在本文中可互換使用,指部分多肽或完整多肽穿過細胞(諸如原核、真核、或古細菌(archaeon)細胞)膜的轉移。在多肽分泌的非限制性實施例中,可以通過本發(fā)明的方法在宿主細胞中作為與本發(fā)明“分泌性報告基因”融合的融合多肽來表達膜結合的或跨膜的蛋白質(諸如受體);因而在此內容中,“分泌”指融合多肽穿過宿主細胞膜的轉移,其程度至少使得融合多肽的分泌性報告基因部分展示在膜的胞外一側,且在分泌性報告基因測定法中有功能活性。在其它實施例中,可以將融合多肽完整分泌到培養(yǎng)基中,而與分泌細胞沒有任何殘留連接。
在本文的非限制性實施例中,將現(xiàn)有cDNA或基因組DNA文庫用包含報告基因的轉座子做上標簽。通過測定有活性的報告基因的表達來檢測轉座子報告基因與文庫中包含信號序列的基因的符合讀碼框式融合。然后對轉座子插入位點上游和下游的側翼DNA序列測序,并通過序列分析來鑒定插入了轉座子的基因。在許多情況中,回收在相同基因的不同核苷酸位置或位點做上標簽的大量克隆將有助于獲得帶標簽基因的全長序列。對陽性克隆測序以鑒定呈現(xiàn)相同基因但具有不同轉座子插入位點的克隆??梢赃@種方式通過毗連序列群裝配而獲得所有或大多數(shù)開放讀碼框(ORF)。若以這種方式不能獲得完整ORF(可能是由于基因中轉座子插入片段的數(shù)目不夠或分布不勻),則可以通過經(jīng)典的引物行走DNA測序來獲得全長基因。
然后可以將如此獲得的序列信息用于分離包含編碼分泌信號序列的序列的完整目的基因,進一步用于構建用于分泌性蛋白質工業(yè)生產(chǎn)的最佳表達構建物,所有這些都完全屬于本領域技術范圍之內,而且表達并回收酶的工業(yè)生產(chǎn)過程在本領域已有充分描述,見本文其它部分所示。
因此,本發(fā)明的第三個方面涉及通過本發(fā)明的方法分離得到的目的基因,優(yōu)選由基因文庫分離得到的基因。本發(fā)明的另一個方面涉及通過第一個或第二個方面的方法由基因文庫分離得到的目的基因。
本發(fā)明的一個方面涉及由上述方面定義的目的基因編碼的酶。
另外,本發(fā)明的另一個方面涉及包含上述方面定義的目的基因的表達系統(tǒng)。
本發(fā)明的還有一個方面涉及包含上述方面定義的表達系統(tǒng)的宿主細胞,或包含上述方面定義的目的基因的至少兩個染色體整合拷貝的宿主細胞。
本發(fā)明的最后一個方面涉及用于生產(chǎn)酶的方法,包括在適合于表達上述方面定義的目的基因的條件下培養(yǎng)上述方面定義的宿主細胞,其中所述宿主細胞將由所述基因編碼的蛋白質分泌到培養(yǎng)基中。
圖
圖1大量轉座子在編碼支鏈淀粉酶的基因PULL1012中的整合位置的排列示意圖。已知支鏈淀粉酶編碼序列表述為“pullulanasetrimmed.SEQ(1>2598)”,指向右邊的箭頭指示轉錄方向。用箭頭指示轉座子的位置(一個箭頭指示一個分離克隆),而且左邊列出了克隆的名稱。分泌β-內酰胺酶分泌性報告基因的克隆在名稱中標有減號“-”,而且指向右邊的指示性箭頭顯示分泌性報告基因與PULL1012基因的同向轉錄。通過常規(guī)選擇分離得到不分泌β-內酰胺酶報告基因的其它克??;這些克隆標有“+”或“p”,而且指向左邊的指示性箭頭顯示符合讀碼框的融合,因而不可能獲得分泌性融合多肽。兩個克隆“Tn4-12-.ab1”和“Tn4-4-.ab1”在圖中標有方框,而且正文指示分泌性融合多肽保留了由PULL1012基因編碼的支鏈淀粉酶活性。
保藏的微生物
2001年2月8日將類芽孢桿菌(Paenibacillus)NN018026菌株保藏于DSMZ,編號DSM 14046。
定義
依照本發(fā)明,可以在本領域技術范圍之內采用常規(guī)分子生物學、微生物學、和重組DNA技術。這些技術在文獻中已有充分解釋。參閱例如Sambrook、Fritsch和Maniatis,《Molecular CloningA LaboratoryManual》即分子克隆實驗室手冊,第2版,1989,冷泉港實驗室出版社,冷泉港,紐約(在本文中略述為“Sambrook等人,1989”);《DNACloningA Practical Approach》即DNA克隆實踐方法,第1和2卷,D.N.Glover編,1985;《Oligonucleotide Synthesis》即寡核苷酸合成,M.J.Galt編,1984;《Nucleic Acid Hybridization》即核酸雜交,B.D.Hames和S.J.Higgins編,1985;《Transcription andTranslation 》即轉錄和翻譯,B.D.Hames和S.J.Higgins編,1984;《Animal Cell Culture》即動物細胞培養(yǎng),R.I.Freshney編,1986;《Immobilized Cells and Enzymes》即固定化細胞和酶,IRL出版社,1986;B.Perbal,《A Practical Guide to Molecular Cloning》即分子克隆實踐指南,1984。
在應用于蛋白質時,術語“分離的”指在除其天然環(huán)境外的條件下(諸如除了血液和動物組織以外)發(fā)現(xiàn)的蛋白質。在優(yōu)選形式中,分離的蛋白質基本上不含其它蛋白質,特別是動物來源的其它蛋白質。優(yōu)選提供高度純化形式的蛋白質,即超過95%純,更優(yōu)選超過99%純。在應用于多核苷酸分子時,術語“分離的”指分子與其天然遺傳環(huán)境分開,因而不含其它外來的或不需要的編碼序列,而且是適合用于遺傳工程蛋白質生產(chǎn)系統(tǒng)的形式。這些分離的分子是那些與其天然環(huán)境分開的分子,包括cDNA和基因組克隆。本發(fā)明的分離的DNA分子不含它們通常相關的其它基因,但是可以包含天然發(fā)生的5’和3’非翻譯區(qū),諸如啟動子和終止子。相關區(qū)域的鑒定對于本領域普通技術人員而言是顯然的(參閱例如Dynan和Tijan,Nature,316774-778,1985)。
“多核苷酸”指由5’端讀向3’端的脫氧核糖核苷酸或核糖核苷酸堿基的單鏈或雙鏈聚合物。多核苷酸包括RNA和DNA,可以由天然來源進行分離、體外合成、或由天然和合成分子的組合進行制備?!昂怂岱肿印敝负颂呛塑?腺苷、鳥苷、尿苷、或胞苷;“RNA分子”)或脫氧核糖核苷(脫氧腺苷、脫氧鳥苷、脫氧胸苷、或脫氧胞苷;“DNA”分子)的磷酸酯聚合形式,其或是單鏈形式或是雙鏈螺旋??赡苁请p鏈DNA-DNA、DNA-RNA、和RNA-RNA螺旋。術語核酸分子(特別是DNA或RNA分子)只指分子的一級和二級結構,不限于任何特定的三級或四級形式。因而,該術語包括在線性或環(huán)狀DNA分子(如限制性片段)、質粒、和染色體中發(fā)現(xiàn)的雙鏈DNA。在討論特定雙鏈DNA分子的結構時,本文可以依照常規(guī)在描述序列時只給出沿DNA非轉錄鏈(即具有與mRNA同源的序列的鏈)5’向3’方向的序列?!爸亟MDNA分子”指經(jīng)歷了分子生物學操作的DNA分子。核酸構建物
本發(fā)明還涉及包含本發(fā)明的核酸序列且其可操作連接一種或多種控制序列的核酸構建物,其中控制序列在合適宿主細胞中在與控制序列相容的條件下指導編碼序列的表達。表達應理解為包括多肽生成所涉及的任何步驟,包括但不限于轉錄、轉錄后修飾、翻譯、翻譯后修飾、和分泌。
“表達構建物”在本文中定義為由天然發(fā)生基因分離得到的或經(jīng)修飾包含核酸區(qū)段(其聯(lián)合和并列方式在自然界中并不存在)的單鏈或雙鏈核酸分子。當核酸構建物包含表達本發(fā)明的編碼序列所需要的所有控制序列時,術語核酸構建物與術語表達盒同義。術語“編碼序列”在本文中定義為直接說明其蛋白質產(chǎn)物的氨基酸序列的核酸序列。編碼序列的邊界通常由核糖體結合位點(原核生物)或恰好位于mRNA 5’端開放讀碼框上游的ATG起始密碼子和恰好位于mRNA 3’端開放讀碼框下游的轉錄終止子序列(真核生物)來確定。編碼序列可以包括但不限于DNA、cDNA、和重組核酸序列。
可以多種方式操作編碼本發(fā)明多肽的分離核酸序列以提供多肽的表達。根據(jù)表達載體,可能希望或必需在將核酸序列插入載體之前對其進行操作。利用重組DNA方法來修飾核酸序列的技術在本領域是眾所周知的。
術語“控制序列”在本文中的定義包括對本發(fā)明多肽的表達而言必需或有利的所有成分。每一種控制序列對于編碼多肽的核酸序列而言可以是天然的或外來的。這些控制序列包括但不限于前導序列、聚腺苷酸化序列、原肽序列、啟動子、信號肽序列、和轉錄終止子??刂菩蛄性谧畹拖薅劝▎幼雍娃D錄及翻譯終止信號。為了導入便于連接控制序列與編碼多肽的核酸序列的編碼區(qū)的特定限制性位點,可以一起提供接頭和控制序列。術語“可操作連接”在本文中定義為將控制序列置于相對于DNA序列的編碼序列的適當位置使得控制序列指導多肽表達的結構。
控制序列可以是適當?shù)膯幼有蛄?,即得到宿主細胞的識別而表達核酸序列的核酸序列。啟動子序列包含介導多肽表達的轉錄控制序列。啟動子可以是在選定宿主細胞中顯示轉錄活性的任何核酸序列,包括突變的、截短的、和雜合的啟動子,而且可以由編碼胞外或胞內多肽的基因(對于宿主細胞而言可以是同源的或異源的)獲得。
尤其適用于在細菌宿主細胞中指導本發(fā)明核酸構建物的轉錄的啟動子的范例是得自大腸桿菌lac操縱子、天藍色鏈霉菌瓊脂糖酶基因(dagA)、枯草芽孢桿菌果聚糖蔗糖酶基因(sacB)、地衣芽孢桿菌α-淀粉酶基因(amyL)、嗜熱脂肪芽孢桿菌產(chǎn)麥芽糖淀粉酶基因(amyM)、解淀粉芽孢桿菌α-淀粉酶基因(amyQ)、地衣芽孢桿菌青霉素酶基因(penP)、枯草芽孢桿菌xylA和sylB因、和原核生物β-內酰胺酶基因(Villa-Kamaroff等人,1978,Proceedings of theNational Academy of Sciences USA,753727-3731)的啟動子,以及tac啟動子(DeBoer等人,1983,Proceedings of the NationalAcademy of Sciences USA,8021-25)。Scientific American,1980,24274-94中的“Useful proteins from recombinantbacteria”即來自重組細菌的有用蛋白質和J.Sambrook等人,1989,《Molecular CloningA Laboratory Manual》即分子克隆實驗室手冊,第2版,冷泉港,紐約描述了其它啟動子。
適用于在絲狀真菌宿主細胞中指導本發(fā)明核酸構建物的轉錄的啟動子的范例是得自米曲霉TAKA淀粉酶、米赫根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸穩(wěn)定α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉丙糖磷酸異構酶、構巢曲霉乙酰胺酶、和尖鐮孢胰蛋白酶樣蛋白酶(WO96/00787)的基因的啟動子,以及NA2-tpi啟動子(來自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸異構酶基因的啟動子的雜合體),及其突變的、截短的、和雜合的啟動子。
在酵母宿主中,有用的啟動子得自釀酒酵母烯醇酶(ENO-1)、釀酒酵母半乳糖激酶(GAL1)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)、和釀酒酵母3-磷酸甘油酸激酶的基因。Romanos等人,1992,Yeast,8423-488描述了可用于酵母宿主細胞的其它有用啟動子。
控制序列還可以是合適的轉錄終止子序列,即得到宿主細胞的識別而終止轉錄的序列。終止子序列可操作連接于編碼多肽的核酸序列的3’末端??梢栽诒景l(fā)明中使用能夠在選定宿主細胞中發(fā)揮功能的任何終止子。
優(yōu)選用于絲狀真菌宿主細胞的終止子得自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶、和尖鐮孢胰蛋白酶樣蛋白酶的基因。
優(yōu)選用于酵母宿主細胞的終止子得自釀酒酵母烯醇酶、釀酒酵母細胞色素C(CYC1)、和釀酒酵母甘油醛-3-磷酸脫氫酶的基因。Romanos等人,1992,見上文描述了可用于酵母宿主細胞的其它有用終止子。
控制序列還可以包括合適的前導序列,即mRNA中對宿主細胞的翻譯重要的非翻譯區(qū)。前導序列可操作連接于編碼多肽的核酸序列的5’末端??梢栽诒景l(fā)明中使用能夠在選定宿主細胞中發(fā)揮功能的任何前導序列。
優(yōu)選用于絲狀真菌宿主細胞的前導序列得自米曲霉TAKA淀粉酶和構巢曲霉丙糖磷酸異構酶的基因。
適用于酵母宿主細胞的前導序列得自釀酒酵母烯醇酶(ENO-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α-因子、和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(ADH2/GAP)的基因。
控制序列還可以是聚腺苷酸化序列,即可操作連接于核酸序列的3’末端且轉錄后由宿主細胞識別而向轉錄的mRNA添加多腺苷酸殘基的信號的序列。可以在本發(fā)明中使用能夠在選定宿主細胞中發(fā)揮功能的任何聚腺苷酸化序列。
優(yōu)選用于絲狀真菌宿主細胞的聚腺苷酸化序列得自米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、尖鐮孢胰蛋白酶樣蛋白酶、和黑曲霉α-葡萄糖苷酶的基因。
Guo和Sherman,1995,Molecular Cellular Biology,155983-5990描述了可用于酵母宿主細胞的有用聚腺苷酸化序列。
還可能希望添加能夠相對于宿主細胞的生長而調控多肽表達的調控序列。調控系統(tǒng)的范例是那些應答化學或物理刺激(包括調控化合物的存在)而引起基因表達的開啟或關閉的系統(tǒng)。原核系統(tǒng)中的調控系統(tǒng)包括lac、tac、和trp操縱基因系統(tǒng)。在酵母中可以使用ADH2系統(tǒng)或GAL1系統(tǒng)。在絲狀真菌中可以使用TAKA α-淀粉酶啟動子、黑曲霉葡糖淀粉酶啟動子、和米曲霉葡糖淀粉酶啟動子作為調控序列。調控序列的其它范例是那些能夠進行基因擴增的序列。在真核系統(tǒng)中,它們包括在存在氨甲蝶呤時擴增的二氫葉酸還原酶基因和在存在重金屬時擴增的金屬硫蛋白基因。在這些情況中,編碼多肽的核酸序列將可操作連接調控序列。
本發(fā)明還涉及用于改變編碼本發(fā)明多肽的內源基因表達的核酸構建物。構建物可包含改變內源基因表達所必需的最小數(shù)目的成分。在一個實施方案中,核酸構建物優(yōu)選包含(a)靶向序列、(b)調控序列、(c)外顯子、和(d)剪接供體位點。在將核酸構建物導入細胞后,構建物將通過同源重組在內源基因位點插入細胞基因組。靶向序列指導元件(a)-(d)整合到內源基因中,使得元件(b)-(d)可操作連接內源基因。在另一個實施方案中,核酸構建物包含(a)靶向序列、(b)調控序列、(c)外顯子、(d)剪接供體位點、(e)內含子、和(f)剪接受體位點,其中靶向序列指導元件(a)-(f)的整合,使得元件(b)-(f)可操作連接內源基因。然而,構建物可包含額外成分,諸如選擇標記。
這些成分的導入導致新轉錄單位的生成,其中內源基因的表達得到改變。新的轉錄單位在本質上是通過靶向構建物導入的序列與內源基因的融合產(chǎn)物。在內源基因得到改變的一個實施方案中,基因被激活。在這個實施方案中,將同源重組用于取代、破壞、或使通常與親本細胞的內源基因有關的調控區(qū)失效,即通過插入調控序列使得基因以高于相應親本細胞中顯然的水平進行表達。
構建物還包含內源基因的一個或多個外顯子。外顯子定義為拷貝成RNA且存在于成熟mRNA分子中(使得外顯子序列符合內源基因編碼區(qū)的讀碼框)的DNA序列。外顯子可任選包含編碼一個或多個氨基酸和/或部分編碼氨基酸的DNA?;蛘?,外顯子包含對應于5’非編碼區(qū)的DNA。當外源外顯子編碼一個或多個氨基酸和/或氨基酸的一部分時,核酸構建物的設計使得轉錄和剪接后的讀碼框符合內源基因的讀碼框,mRNA中衍生自第二個外顯子的部分的適當讀碼框沒有變化。
構建物的剪接供體位點指導一個外顯子與另一個外顯子的剪接。通常,第一個外顯子位于第二個外顯子的5’端,而且位于第一個外顯子3’側翼并與其交疊的剪接供體位點識別位于第二個外顯子5’側翼的剪接受體位點。剪接受體位點,像剪接供體位點一樣,是指導一個外顯子與另一個外顯子的剪接的序列。通過與剪接供體位點一起作用,這一剪接裝置使用剪接受體位點來消除內含子。表達載體
本發(fā)明還涉及包含本發(fā)明的核酸序列、啟動子、及轉錄和翻譯終止信號的重組表達載體??梢詫⑸衔乃龈鞣N核酸和控制序列連接在一起而生成重組表達載體,它可以包含一種或多種便利的限制性位點,從而能夠在這些位點插入或替代編碼多肽的核酸序列?;蛘?,可以通過將核酸序列或包含該序列的核酸構建物插入用于表達的適當載體來表達本發(fā)明的核酸序列。在構建表達載體時,將編碼序列置于載體中使得編碼序列可操作連接用于表達的適當控制序列。
重組表達載體可以是能夠方便的進行重組DNA流程且能夠表達核酸序列的任何載體(如質粒或病毒)。載體的選擇通常取決于載體與其將要導入的宿主細胞的相容性。載體可以是線性或閉合環(huán)狀質粒。
載體可以是自主復制載體,即作為染色體外實體存在的載體,它的復制不依賴染色體的復制,如質粒、染色體外元件、微型染色體、或人工染色體。載體可以包含用于確保自身復制的任何手段。或者,載體可以是在導入宿主細胞后整合到基因組中并與其整合的染色體一起復制的載體。另外,可以使用單一載體或質粒或者一起包含將要導入宿主細胞基因組的總DNA的兩種或多種載體或質粒、或轉座子。
本發(fā)明的載體優(yōu)選包含能夠容易的選擇轉化細胞的一種或多種選擇標記。選擇標記是其產(chǎn)物提供殺生物劑或病毒抗性、重金屬抗性、為營養(yǎng)缺陷型提供原養(yǎng)型、諸如此類的基因。細菌選擇標記的范例是來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因、或賦予抗生素抗性(諸如氨芐青霉素、卡那霉素、氯霉素、或四環(huán)素抗性)的標記。適用于酵母宿主細胞的合適標記是ADE2、HIS3、LEU2、LYS2、MET3、TRP1、和URA3。用于絲狀真菌宿主細胞的選擇標記包括但不限于amdS(乙酰胺酶)、argB(鳥氨酸氨甲酰基轉移酶)、bar(膦絲菌素乙?;D移酶)、hygB(潮霉素磷酸轉移酶)、niaD(硝酸還原酶)、pyrG(乳清苷-5’-磷酸脫羧酶)、sC(硫酸腺苷酰基轉移酶)、trpC(鄰氨基苯甲酸合酶),及其等同物。優(yōu)選用于曲霉屬細胞的是構巢曲霉或米曲霉的amdS和pyrG基因及吸水鏈霉菌(Streptomyces hygroscopicus)的bar基因。
本發(fā)明的載體優(yōu)選包含能夠將載體穩(wěn)定整合到宿主細胞基因組中或能夠在細胞中獨立于基因組而自主復制載體的元件。
為了整合到宿主細胞基因組中,載體可以依賴編碼多肽的核酸序列或載體中用于通過同源或非同源重組將載體穩(wěn)定整合到基因組中的任何其它元件。或者,載體可以包含用于指導通過同源重組整合到宿主細胞基因組中的額外核酸序列。該額外核酸序列使得載體在染色體的精確位置整合到宿主細胞基因組中。為了增加整合到精確位置的可能性,整合元件應當優(yōu)選包含與對應靶序列高度同源的足夠數(shù)目(諸如100-1500堿基對,優(yōu)選400-1500堿基對,最優(yōu)選800-1500堿基對)的核酸,以增加同源重組的概率。整合元件可以是與宿主細胞基因組中的靶序列同源的任何序列。另外,整合元件可以是非編碼的或編碼的核酸序列。另一方面,可以通過非同源重組將載體整合到宿主細胞基因組中。
為了自主復制,載體還可包含使得載體能夠在討論的宿主細胞中自主復制的復制起點。細菌復制起點的范例是能夠在大腸桿菌中復制的質粒pBR322、pUC19、pACYC177、和pACYC184及能夠在芽孢桿菌中復制的pUB110、pE194、pTA1060、和pAMβ1的復制起點。用于酵母宿主細胞的復制起點的范例是2μm復制起點、ARS1、ARS4、ARS1與CEN3的聯(lián)合、及ARS4與CEN6的聯(lián)合。復制起點可以是具有使之在宿主細胞中以溫度敏感方式發(fā)揮功能的突變型復制起點(參閱例如Ehrlich,1978,Proceedings of the National Academy of Sciences USA,751433)。
可以將超過一個拷貝的本發(fā)明核酸序列插入宿主細胞以提高基因產(chǎn)物的產(chǎn)量??梢酝ㄟ^將序列的至少一個額外拷貝整合到宿主細胞基因組中或通過包含具有核酸序列的可擴增選擇標記來實現(xiàn)核酸序列拷貝數(shù)目的增加,在后一種情形中,通過在存在適當選擇劑時培養(yǎng)細胞來選擇包含擴增拷貝的選擇標記基因、因而包含額外拷貝的所述核酸序列的細胞。
用于連接上文所述元件以構建本發(fā)明重組表達載體的流程對于本領域技術人員而言是眾所周知的(參閱例如Sambrook等人,1989,見上文)。宿主細胞
本發(fā)明還涉及重組宿主細胞,它們有利的用于本發(fā)明第一個方面的方法,及用于由本發(fā)明方法鑒定的目的基因編碼的多肽的重組生產(chǎn)。將包含本發(fā)明目的核酸序列或基因的載體導入宿主細胞,從而作為較早描述的染色體整合體或自身復制染色體外載體來維持該載體。術語“宿主細胞”涵蓋因復制過程中發(fā)生的突變而與親本細胞不同的任何后代。為了這些目的而選擇的宿主細胞在極大程度上依賴編碼多肽的基因及其來源。
宿主細胞可以是單細胞微生物(如原核生物)或非單細胞微生物(如真核生物)。
有用的單細胞細胞是細菌細胞,諸如革蘭氏陽性細菌,包括但不限于芽孢桿菌屬細胞,如嗜堿芽孢桿菌(Bacillus alkalophilus)、解淀粉芽孢桿菌(Bacillus amyloliquefaciens)、短芽孢桿菌(Bacillus brevis)、環(huán)狀芽孢桿菌(Bacillus circulans)、Bacillusclausii、凝結芽孢桿菌(Bacillus coagulans)、燦爛芽孢桿菌(Bacillus lautus)、遲緩芽孢桿菌(Bacillus lentus)、地衣芽孢桿菌(Bacillus licheniformis)、巨大芽孢桿菌(Bacillusmegaterium)、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)、枯草芽孢桿菌(Bacillus subtilis)、和蘇云金芽孢桿菌(Bacillusthuringiensis),或鏈霉屬細胞,如淺青紫鏈霉菌(Streptomyceslividans)或鼠灰鏈霉菌(Streptomyces murinus);或者革蘭氏陰性細菌,諸如大腸桿菌和假單胞菌。在一個優(yōu)選的實施方案中,細菌宿主細胞是遲緩芽孢桿菌、地衣芽孢桿菌、嗜熱脂肪芽孢桿菌、或枯草芽孢桿菌細胞。在另一個優(yōu)選的實施方案中,芽孢桿菌屬細胞是嗜堿芽孢桿菌。
例如可以通過原生質體轉化(參閱例如Chang和Cohen,1979,Molecular General Genetics,168111-115)、使用感受態(tài)細胞(參閱例如Young和Spizizin,1961,Journal of Bacteriology,81823-829;或Dubnau和Dayidoff-Abelson,1971,Journal ofMolecular Biology,56209-221)、電穿孔(參閱例如Shigekawa和Dower,1988,Biotechniques,6742-751)、或接合(參閱例如Koehler和Thorne,1987,Journal of Bacteriology,1695771-5278)來實現(xiàn)將載體導入細菌宿主細胞。
宿主細胞可以是真核生物,諸如哺乳動物、昆蟲、植物、或真菌細胞。
在一個優(yōu)選的實施方案中,宿主細胞是真菌細胞?!罢婢痹谟糜诒疚臅r包括子囊菌門(Ascomycota)、擔子菌門(Basidiomycota)、壺菌門(Chytridiomycota)、和接合菌門(Zygomycota)(見Hawksworth等人的定義,《Ainsworth and Bisby’s Dictionary of the Fungi》即Ainsworth和Bisby的真菌詞典,第8版,1995,CAB International,University出版社,劍橋,英國)以及卵菌門(Oomycota)(見Hawksorth等人的引用,1995,見上文,第171頁)和其它有絲分裂孢子真菌(Hawksworth等人,1995,見上文)。
在一個更優(yōu)選的實施方案中,真菌宿主細胞是酵母細胞?!敖湍浮痹谟糜诒疚臅r包括產(chǎn)子囊酵母(內孢霉目(Endomycetales))、產(chǎn)擔孢子酵母、和屬于半知菌的酵母芽孢綱((Blastomycetes))。由于酵母的分類可能在未來發(fā)生變化,因此為了本發(fā)明的目的應當如《Biology and Activities of Yeast》即酵母的生物學和活性(F.A.Skinner、S.M.Passmore、和R.R.Davenport編,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述來定義酵母。
在一個甚至更優(yōu)選的實施方案中,酵母宿主細胞是假絲酵母屬(Candida)、漢遜酵母屬(Hansenula)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)、或Yarrowia屬細胞。
在一個最優(yōu)選的實施方案中,酵母宿主細胞是卡爾酵母(Saccharmyces carlsbergensis)、釀酒酵母(Saccharomycescerevisiae)、糖化醇母(Saccharomyces diastaticus)、Saccharomyces douglasii、克魯弗酵母(Saccharomyces kluyveri)、諾地酵母(Saccharomyces norbensis)、或Saccharomyces oviformis;細胞。在另一個最優(yōu)選的實施方案中,酵母宿主細胞是乳酸克魯維酵母(Kluyveromyces lactis)細胞。在另一個最優(yōu)選的實施方案中,酵母宿主細胞是Yarrowia lipolytica細胞。
在另一個更優(yōu)選的實施方案中,真菌宿主細胞是絲狀真菌細胞。“絲狀真菌”包括真菌門(Eumycota)和卵菌門(Oomycota)(見Hawksworth等人的定義,1995,見上文)亞門的所有絲狀形式。絲狀真菌的特征為由殼多糖、纖維素、葡聚糖、脫乙酰殼多糖、甘露聚糖、和其它復合多糖組成的菌絲體壁。營養(yǎng)性生長是通過菌絲延伸,碳分解代謝是專性需氧。相反,酵母諸如釀酒酵母的營養(yǎng)性生長是通過單細胞菌體的出芽,碳分解代謝可以是發(fā)酵。
在一個甚至更優(yōu)選的實施方案中,絲狀真菌宿主細胞是但不限于頂孢霉屬(Acremonium)、曲霉屬(Aspergillus)、鐮孢屬(Fusarium)、腐質霉屬(Humicola)、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、鏈孢菌屬(Neurospora)、青霉屬(Penicillium)、梭孢殼屬(Thielavia)、Tolypocladium屬、或木霉屬(Trichoderma)物種的細胞。
在一個最優(yōu)選的實施方案中,絲狀真菌宿主細胞是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonious)、構巢曲霉(Aspergillusnidulans)、黑曲霉、或米曲霉細胞。在另一個最優(yōu)選的實施方案中,絲狀真菌宿主細胞是桿孢狀鐮孢(Fusarium bactidioides)、Fusariumcerealis、Fusarium crookwellense、大刀鐮孢(Fusarium culmorum)、禾本科鐮孢(Fusarium graminearum)、禾赤鐮孢(Fusariumgraminum)、異孢鐮孢(Fusarium heterosporum)、合歡木鐮孢(Fusarium negundi)、尖鐮孢(Fusarium oxysporum)、多枝鐮孢(Fusarium reticulatum)、粉紅鐮孢(Fusarium roseum)、接骨木鐮孢(Fusarium Sambucinum)、膚色鐮孢(Fusarium sarcochroum)、擬分枝孢鐮孢(Fusarium spotichioides)、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、或Fusariumyenenatum細胞。在一個甚至最優(yōu)選的實施方案中,絲狀真菌親本細胞是Fusarium yenenatum(Nirenberg sp.nov.)細胞。在另一個最優(yōu)選的實施方案中,絲狀真菌宿主細胞是Humicola insolens、Humicolalanuginose、米赫毛霉(Mucor miehei)、嗜熱毀絲霉(Myceliophthorathermophila)、粗糙脈孢菌(Neurospora crassa)、產(chǎn)紫青霉(Penicillium purpurogenum)、Thielavia terrestris、Trichodermaharzianum、康寧木霉(Trichoderma koningii)、Trichodermalongibrachiatum、Trichoderma reesei、或綠色木霉(Trichodermaviride)細胞。
可以通過涉及原生質體形成、原生質體轉化、和細胞壁再生的過程以本質已知的方式來轉化真菌細胞。EP 238 023和Yellon等人,1984,Proceedings of the National Academy of Sciences USA,811470-1474描述了適用于轉化曲霉屬宿主細胞的合適流程。Malardier等人,1989,Gene,78147-156和WO96/00787描述了適用于轉化鐮孢屬物種的合適方法??梢允褂肂ecker和Guarente在J.N.Abelson和M.I.Simon編的《Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology》即酵母遺傳學和分子生物學指南,酶學方法,第194卷,第182-187頁,Academic出版公司,紐約;Ito等人,1983,Journal of Bacteriology,153163;和Hinnen等人,1978,Proceedings of the National Academy of Sciences USA,751920描述的流程來轉化酵母。生產(chǎn)過程
本發(fā)明還涉及用于生產(chǎn)本發(fā)明多肽的過程,包括(a)培養(yǎng)菌株(野生型形式能夠生成所述多肽)以生成包含多肽的上清液;并(b)回收多肽。
本發(fā)明還涉及用于生產(chǎn)本發(fā)明多肽的方法,包括(a)在適合于生成多肽的條件下培養(yǎng)已經(jīng)摻入了新轉錄單位(包含調控序列、外顯子、和/或剪接供體位點且其可操作連接編碼多肽的內源核酸序列的第二個外顯子)的同源重組細胞;并(b)回收多肽。所述方法基于基因激活技術的使用,例如美國專利號5,641,670中所述。
在本發(fā)明的生產(chǎn)方法中,使用本領域知道的方法在適合于生成多肽的營養(yǎng)培養(yǎng)基中培養(yǎng)細胞。例如,可以通過搖瓶培養(yǎng)、小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù)、成批、分批補料或固態(tài)發(fā)酵)在實驗室或工業(yè)發(fā)酵罐中在合適培養(yǎng)基中在能夠表達和/或分離多肽的條件下培養(yǎng)細胞。在包含碳源、氮源、和無機鹽的合適營養(yǎng)培養(yǎng)基中使用本領域知道的流程進行培養(yǎng)??梢杂缮虡I(yè)供應商處獲得合適培養(yǎng)基,或者可以依照發(fā)表的組成進行配制(如Amercian Type Culture Collection即美國典型培養(yǎng)物收藏中心的目錄)。若多肽被分泌到營養(yǎng)培養(yǎng)基中,則可以直接由培養(yǎng)基回收多肽。若多肽不分泌,則可以由細胞裂解物回收多肽。
可以使用本領域知道的且對多肽特異的方法來檢測多肽。這些檢測方法可以包括特異抗體的使用、酶產(chǎn)物的形成、或酶底物的消失。例如,可以將酶測定法用于測定本文所述多肽的活性。
可以通過本領域知道的方法回收生成的多肽。例如,可以通過常規(guī)流程由營養(yǎng)培養(yǎng)基回收多肽,包括但不限于離心、過濾、抽提、噴霧-干燥、蒸發(fā)、或沉淀。
可以通過本領域知道的多種流程來純化本發(fā)明的多肽,包括但不限于層析(如離子交換、親和、疏水、層析聚焦、和大小排阻)、電泳流程(如制備性等電聚焦)、差異溶解(如硫酸銨沉淀)、SDS-PAGE、或抽提(參閱例如《Protein Purification》即蛋白質純化,J.C.Janson和Lars Ryden編,VCH Publishers,紐約,1989)。
發(fā)明詳述
本發(fā)明能夠通過對例如先前構建的基因庫或文庫篩選分泌性多肽或酶(甚至具有未知活性)的編碼基因從而無需已知篩選方法。本發(fā)明的方法能夠篩選具有潛在工業(yè)利益但使用常規(guī)篩選方法不太可能分離得到的多肽。
用于由基因文庫鑒定并分離目的基因的方法,其中基因編碼攜帶用于分泌或部分分泌的信號序列的多肽,所述方法包括下列步驟
a)提供基因組DNA文庫或cDNA文庫;
b)在所述文庫中插入包含編碼分泌性報告基因的無啟動子且無分泌信號的多核苷酸的DNA片段;
c)將包含該插入DNA片段的文庫導入宿主細胞;
d)篩選并選擇分泌或部分分泌有活性的分泌性報告基因的宿主細胞;
e)通過對插入DNA片段側翼的DNA測序,在選定宿主細胞中鑒定插入了分泌性報告基因的目的基因;
f)分離在步驟e)中鑒定的完整目的基因。
可以使用本領域知道的任何基因文庫來進行本發(fā)明,特別是它還可用于通常在環(huán)境樣品中看到的可存活但不可培養(yǎng)的生物體的基因文庫。本領域已經(jīng)描述了由包含不可培養(yǎng)的生物體的環(huán)境樣品構建代表性或標準化基因文庫的方法(US 5,763,239)。
因此,本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中步驟(f)中的完整目的基因是由步驟(a)的文庫分離得到的。
本領域知道將DNA片段插入基因組的幾種方法,一個范例是通過轉座的插入,然而這通常需要進行費時費力的雜交實驗。使用本文例示的商品化體外方案可以容易的進行本發(fā)明。
本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中步驟(b)是在體外進行的。
在本發(fā)明的方法中可能有利的是對其中各種DNA的呈現(xiàn)進行了標準化的文庫進行操作,本領域已經(jīng)描述了用于對DNA文庫進行標準化的流程,參閱例如美國專利號5,763,239。
本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中cDNA或cDNA文庫是標準化的。
本發(fā)明的另一個優(yōu)選實施方案涉及第一個方面的方法,其中基因組DNA文庫或cDNA文庫衍生自微生物。在一個優(yōu)選的實施方案中,微生物是真菌、絲狀真菌、或酵母。在另一個優(yōu)選的實施方案中,微生物是細菌,在還有一個優(yōu)選的實施方案中,微生物是古細菌(archaeon)。用于由多細胞生物體(諸如衍生自昆蟲(諸如果蠅)、植物、或馴養(yǎng)動物,甚至人的商品化細胞系)構建DNA或cDNA文庫的方法在本領域同樣是眾所周知的??赡芴貏e感興趣的是使用衍生自特定組織或器官(諸如糖尿病患者的胰腺或癌性腫瘤的細胞)的文庫。
本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的任何方法,其中基因組DNA文庫或cDNA文庫衍生自多細胞生物體,優(yōu)選哺乳動物細胞,更優(yōu)選人類細胞。
正如本文其它部分所述,本領域存在幾種方法用于將DNA片段隨機插入較大的DNA序列。本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中第一個方面的DNA片段包含轉座子,優(yōu)選MuA轉座子。
正如本文的一個實施例中所述,可能有利的是使用包含在本發(fā)明方法的宿主細胞中有功能的復制起點的本發(fā)明DNA片段。
因此,本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中DNA片段包含在宿主細胞中有功能的復制起點,優(yōu)選的是復制起點在大腸桿菌中有功能,更優(yōu)選的是復制起點衍生自colE1、oriV、P15A、或colDF13,最優(yōu)選的是復制起點是colE1。
本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中分泌性報告基因是在由宿主細胞分泌時使所述細胞能夠在原本抑制其生長的物質存在時生長的蛋白質,優(yōu)選的是分泌性報告基因是β-內酰胺酶或轉化酶。
正如本文其它部分所述,在本發(fā)明的方法中可能是有利的是步驟(b)的DNA片段的多核苷酸編碼攜帶N端肽接頭的分泌性報告基因,所述肽接頭包含蛋白水解切割的特異靶位點。因而,在以符合讀碼框的方式將DNA片段插入編碼分泌的或部分分泌的多肽的目的基因時,生成的融合多肽將包含如下成分分泌性多肽-肽接頭-分泌性報告基因。因此,在鑒定了特別感興趣的目的基因后,可直接切割融合多肽并分離不含分泌性報告基因的編碼多肽,相似的融合多肽方法在本領域是眾所周知的(參閱例如WO00/75344)。在此內容中,在將至少兩種基因或者其它DNA元件連接在一起而形成一個單一開放讀碼框且將這些元件以所列相同順序表達成一個多肽時,則說各種元件是“順序融合的”,并將多肽稱為“融合多肽”或“融合蛋白”。
術語“接頭”或“間隔物”指包含至少兩個氨基酸且位于多結構域蛋白質(例如包含核心酶和結合結構域諸如纖維素結合結構域(CBD)的酶或任何其它酶雜合物)的結構域之間或者作為融合多肽(例如包含兩種核心酶的融合蛋白或本發(fā)明細胞中存在的融合蛋白)表達的兩種蛋白質或多肽之間的多肽。例如,通過將編碼第一種核心酶的DNA序列、編碼接頭的DNA序列、和編碼第二種核心酶的DNA序列順序融合成一個開放讀碼框并表達該構建物來提供兩種核心酶的融合蛋白。接頭還可包含蛋白水解切割的靶位點。
在本發(fā)明的一個優(yōu)選實施方案中,蛋白水解切割的靶位點是由蛋白酶識別并切割的氨基酸序列。文獻中已經(jīng)描述了幾種氨基酸序列,在有效定位時將促進融合產(chǎn)物的有效切割。這些策略中的大多數(shù)涉及母酶與所需肽之間的接頭區(qū)中位點特異的蛋白水解切割(Polyak等人,1997,Protein Engineering,10(6)615-619;Kjeldsen等人,1996,Gene,170(1)107-112;Sun等人,1995,Protein Expressionand Purification,6(5)685-692;Martinez等人,1995,BiochemicalJournal,306(Pt2)589-597)。
為了確保有效切割,可以在母酶與外源多肽(在這種情況中是由本發(fā)明方法的DNA片段編碼的分泌性報告基因)之間插入編碼位點特異蛋白酶識別位點的氨基酸序列。文獻中已經(jīng)描述了識別位點與蛋白酶的幾種組合。Kex2蛋白酶水解具有堿性氨基酸對的肽和蛋白質,且切割它們肽鍵的C端(Bessmertnaya等人,1997,Biochemistry,62(8)850-857)。在依照第一個和第二個方面的一個優(yōu)選實施方案中使用的Kex2切割位點是Lys-Arg(K-/-R)序列,但是也可以插入其它堿性氨基酸組合以優(yōu)化Kex2的切割(Ledgerwood等人,1995,J.Biochem.,308(1)321-325;或S.Ghosh等人,1996,Gene(阿姆斯特丹),176(1-2)249-255)。
蛋白酶與切割位點的其它有用組合是腸激酶(La Vallie等人,1993,J.Biol.Chem.,2682311-2317)優(yōu)先切割氨基酸序列X-D-D-D-K-/-X,胰蛋白酶(Jonasson等人,1996,Eur.J.Biochem.,236(2)656-661)優(yōu)先切割氨基酸序列X-K-R-/-X,因子Xa(Nagai等人,1985,PNAS,827252-7255)優(yōu)先切割氨基酸序列X-I-E-G-R-/-X,膠原酶(Chinery等人,1993,Eur.J.Biochem.,212(2)557-553)優(yōu)先切割氨基酸序列P-X-/-G-P-X-X,凝血酶(Rahman等人,1992,Cell.Mol.Biol.,38(5)529-542)優(yōu)先切割氨基酸序列X-G-V-R-G-P-R-/-X,ALP(水解無色桿菌賴氨酸特異性蛋白酶)(Kjeldsen等人,1996,Gene,170(1)107-112)優(yōu)先切割賴氨酸,來自地衣芽孢桿菌的C成分蛋白酶切割谷氨酸(Kakudo等人,1992,J.Biol.Chem.,267(33)23782-23788)。
在特定靶位點切割肽的另一種優(yōu)選方法是使用化學化合物諸如切割X-M-/-X的溴化氰或切割S-N-/-G-X的羥胺(《Current Protocols inMolecular Biology》即分子生物學通用方案,John Wiley and Sons,1995,C.R.Harwood和S.M.Cutting編)。
本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中步驟(b)的DNA片段的多核苷酸編碼攜帶N端肽接頭的分泌性報告基因,所述肽接頭包含蛋白水解切割的特異靶位點。
可以設想幾種宿主細胞將在本發(fā)明中較好的發(fā)揮作用,唯一的標準是宿主細胞識別目的基因的分泌信號序列且宿主細胞能夠合成有功能的分泌性報告基因。
本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中宿主細胞是細菌,優(yōu)選的是細菌細胞是埃希氏菌屬(Escherichia)、乳球菌屬(Lactococcus)、鏈霉菌屬(Streptomyces)、腸球菌屬(Enterococcus)、或芽孢桿菌屬(Bacillus)細胞,優(yōu)選物種大腸桿菌(Escherichia coli)、乳酸乳球菌(Lactococcus lactis)、灰色鏈霉菌(Streptomyces griseus)、天藍色鏈霉菌(Streptomycescoelicor)、糞腸球菌(Enterococcus faecalis)、嗜堿芽孢桿菌(Bacillus alkalophilus)、解淀粉芽孢桿菌(Bacillusamyloliquefaciens)、短芽孢桿菌(Bacillus brevis)、環(huán)狀芽孢桿菌(Bacillus circulans)、Bacillus clausii、凝結芽孢桿菌(Bacillus coagulans)、燦爛芽孢桿菌(Bacillus lautus)、遲緩芽孢桿菌(Bacillus lentus)、地衣芽孢桿菌(Bacilluslicheniformis)、巨大芽孢桿菌(Bacillus megaterium)、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)、枯草芽孢桿菌(Bacillus subtilis)、或蘇云金芽孢桿菌(Bacillusthuringiensis)。
本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中宿主細胞是真菌,優(yōu)選的是真菌細胞是假絲酵母屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)、Yarrowia屬、頂孢霉屬(Acremonium)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、隱球酵母屬(Cryptococcus)、Filibasidium屬、鐮孢屬(Fusarium)、腐質霉屬(Humicola)、Magnaporthe屬、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、Neocallimastix屬、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、Piromyces屬、裂褶菌屬(Schizophyllum)、Talaromyces屬、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬、Tolypocladium屬、或木霉屬(Trichoderma),更優(yōu)選的是真菌宿主細胞是物種釀酒酵母(Saccharomyces cerevisiae)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、構巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillus niger)、或米曲霉(Aspergillusoryzae)。
本發(fā)明的真菌宿主細胞可以是卡爾酵母、釀酒酵母、糖化酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、克魯弗酵母(Saccharomyces kluyveri)、諾地酵母(Saccharomycesnorbensis)、Saccharomyces oviformis、棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉、臭曲霉、日本曲霉(Aspergillus japonious)、構巢曲霉、黑曲霉、米曲霉、桿孢狀鐮孢、Fusarium cerealis、Fusariumcrookwellense、大刀鐮孢、禾本科鐮孢、禾赤鐮孢、異孢鐮孢、合歡木鐮孢(Fusarium negundi)、尖鐮孢、多枝鐮孢(Fusariumreticulatum)、粉紅鐮孢(Fusarium roseum)、接骨木鐮孢、膚色鐮孢、擬分枝孢鐮孢、Fusarium sulphureum、Fusarium torulosum、Fusarium tricho thecioides、Fusarium venenatum、Humicolainsolens、Humicola lanuginose、米赫毛霉、嗜熱毀絲霉(Myceliophthora thermophila)、粗糙脈孢菌(Neurospora crassa)、產(chǎn)紫青霉、Trichoderma harzianum、康寧木霉、Trichodermalongibrachiatum、Trichoderma reesei、或綠色木霉。
在還有一個優(yōu)選實施方案中,宿主細胞是哺乳動物,優(yōu)選人,更優(yōu)選HeLa細胞。眾所周知的哺乳動物細胞的非限制性范例包括CHO(中國倉鼠卵巢細胞)、NIH3T3、WRL-68、CoLo587、PANC-1、HeLa S3、K562、Raji、SW480、Soares B細胞(人)、Sp2/O-AG14(鼠骨髓瘤細胞)、BHK-21細胞(幼倉鼠腎細胞)、Sf9 Spodoptera frugiperda(昆蟲)、D-MEL-2黑腹果蠅(Drosophila melanogaster)(果蠅,昆蟲);所有這些都可以通過商業(yè)途徑由ATCC獲得。
正如本文其它部分所示,本發(fā)明的方法依賴DNA序列信息來分離目的基因。
因此,本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中測序步驟是使用針對第一個方面的DNA片段的至少一種引物或使用針對載體的至少一種引物進行的,其中第一個方面的DNA文庫或cDNA文庫得到克隆。
本發(fā)明的另一個優(yōu)選實施方案涉及第一個方面的方法,其中完整目的基因的分離是利用第一個方面的測序步驟獲得的DNA序列信息進行的。
將要通過本發(fā)明方法分離的目的基因可以編碼任何多肽,諸如具有藥物特性的多肽、肽激素、抗體或抗體片段、受體、或酶。
因此,本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中完整目的基因編碼由宿主細胞分泌的酶。
細胞因子是通過結合靶細胞上的特定細胞表面受體而介導廣泛生物學活性的分泌性調控肽。細胞因子的作用包括對細胞增殖和分化的控制、對造血和免疫的調控、和炎癥應答。細胞因子還是宿主防御過程的主要成員,它們涉及對外源以及內源損傷的應答和組織完整性的修復或恢復(Shi等人,2000,J.Biol.Chem.,27519167-19176)。
細胞因子家族新成員及其受體的鑒定是極其重要的,因為它們在調控廣泛的生物學應答時發(fā)揮關鍵作用。細胞因子具有高度保守的4螺旋束三級結構,但是一級氨基酸序列同源性低。因此,使用基于同源的克隆方法來鑒定新細胞因子是較為困難的。新細胞因子受體的分子克隆可能有助于理解一些疾病的發(fā)病機理從而相應地調整治療方法。
已經(jīng)使用配體結合作為方法克隆了I型細胞因子受體家族的大多數(shù)成員?;蛘撸瑢SXWS基序的寡核苷酸用作雜交探針,并將針對I型細胞因子受體高度保守區(qū)的引物用于簡并聚合酶鏈式反應(PCR)。現(xiàn)在,可以在搜索表達序列標簽(EST)數(shù)據(jù)庫時因與已知細胞因子受體的同源性(C.A.Sprecher等人,Cloning and characterization of anovel class I cytokine receptor即新的I型細胞因子受體的克隆和表征,Biochem Biophys Res Commun,1998,24682;G.C.Elson等人,Cytokine-lIke factor-1,a novel soluble protein,shareshomology with members of the cytokine type 1 receptor family即細胞因子樣因子1(新的可溶性蛋白質)與細胞因子I型受體家族的成員分享同源性,J.Immunol.,1998,1611371)或使用cDNA表達序列標簽(EST)的信號序列預測(Y.Shi等人,2000,A novel cytokinereceptor ligand pair即新細胞因子受體配體對,J.Biol.Chem.,27519167-19176)來鑒定一些細胞因子受體。
已經(jīng)描述了使用信號捕獲的稱為SST-REX(通過逆轉錄病毒介導的表達篩選的信號序列捕獲)的方法,其中在逆轉錄病毒載體中構建cDNA文庫,轉染到宿主細胞中,并篩選將細胞因子受體的組成性有活性突變體重導向細胞表面的能力,從而使原本白介素-3(IL-3)依賴性的Ba/F3細胞能夠不依賴IL-3而生長(T.Koj ima和T.Kitamura,1999,Asignal sequence trap based on a constitutively active cytokinereceptor即基于組成性有活性細胞因子受體的信號序列捕獲,NatureBiotech,17487-490)。本發(fā)明增加了找到編碼細胞因子的全長基因的機會且便于基因的測序,從而能夠更快速的發(fā)現(xiàn)新細胞因子。
本發(fā)明的另一個優(yōu)選實施方案涉及第一個方面的方法,其中完整目的基因編碼膜結合受體,優(yōu)選雙成分信號(two-componentsignal,TCS)轉導受體,更優(yōu)選細胞因子受體。
本發(fā)明的還有一個優(yōu)選實施方案涉及第一個方面的方法,其中完整目的基因編碼分泌性多肽細胞因子。
來自病原體的表面結構和分泌因子具有作為疫苗的潛在價值。那些是蛋白質的表面結構和分泌因子在致病細胞內合成且分泌至細胞的表面或胞外空間。本發(fā)明可用于鑒定這些蛋白質,然后對它們測試抗原性。來自致病細胞且可用于生成疫苗的分泌性蛋白質的非限制性范例是脂蛋白、周質蛋白、內膜蛋白、和外膜蛋白。
選擇來自淋病奈瑟氏球菌(Neisseria gonorrhoeae)的幾種這樣的蛋白質作為潛在的疫苗靶,并對它們測試在疫苗生成中的適宜性(Pizza等人,2000,Nature,2871816-1820)。在全世界,致病奈瑟氏球菌種在兒童和成年人中引起顯著的發(fā)病率和死亡率。在美國腦膜炎奈瑟氏球菌已經(jīng)成為兒童和年輕人的細菌性腦膜炎的主要起因。在歐洲和北美洲,腦膜炎球菌疾病分離菌的1/4-2/3是血清群B。與目前已獲得多糖疫苗的血清群A和C不同,血清群B的多糖在所有年齡群中的免疫原性較弱(M.C.Bash等人,2000,Genetic and immunologiccharacterization of a novel serotype 4,15 strain of Neisseria即Neisseria菌株15新血清型4的遺傳學和免疫學表征,F(xiàn)EMS ImmunolMed Microbiol,29(3)169-176)。
正在研究外膜蛋白(OMP)疫苗以滿足提供針對B群腦膜炎球菌疾病的保護的需要(W.D.Zollinger,1997,New and improved vaccinesagainst meningococcal disease即針對腦膜炎球菌疾病的新型和改進疫苗,《New Generation Vaccines》即新一代疫苗,M.M.Levine等人編,第2版,第469-488頁,Marcel Dekker,紐約)。
可用于生成疫苗的蛋白質的非限制性優(yōu)選范例是淋病奈瑟氏球菌的外膜蛋白MtrE(多藥抗性)、在BCG(卡介苗)(A.K.Tyagi,2000,F(xiàn)EMS Microbiol Lett,190309-316)中鑒定的一種分泌抗原即來自結核分支桿菌(Mycobacterium tuberculosis)的分泌性蛋白質Ag85、來自銅綠假單胞菌(Pseudomonas aeruginosa)的外膜蛋白OprM(多藥抗性)、和下列分泌性蛋白質(《MolekulareInfektionsbiologie》即分子感染生物學,Hacker、.J.Heesemann、J.Heidelberg編,柏林,Spektrum,Adad.Verlag,2000)●耶爾森氏菌(Yersinia ssp.)III型外膜蛋白(YOP),諸如YopE、H、M、O●丁香假單胞菌(Pseudomonas syringae)ArvB蛋白●銅綠假單胞菌ExoS細胞毒素●奈瑟氏球菌IgA蛋白酶、IV型菌毛●大腸桿菌α-溶血素HylA、EPEC Intimin(EaeA)、侵染素、p-fimbrien(Pap)、S-絲束蛋白●腸桿菌(Entobacteria)I型菌毛
病原體的表面結構和分泌因子可用于診斷。它們可用于獲得針對病原體結構或分泌因子的抗體。那些為蛋白質的表面結構和分泌因子在病原體細胞內合成且分泌至細胞的表面或胞外空間。本發(fā)明可用于鑒定這些蛋白質。上文列出了可用于生成診斷性抗體的分泌性蛋白質的非限制性范例,因為適用于生成疫苗的蛋白質同樣適用于診斷性測定法。
本發(fā)明的一個應用可以是克隆用于免疫療法的分泌性變應原。通常,人變應原包括蛋白質。這些蛋白質在分離后可用于誘導對變應原的耐受性,如通過皮下施用變應原(參閱WO93/19178、WO99/34826、US 6,048,962、US 5,558,869、WO98/04274、US 6,147,201、US5,693,495、或US 5,958,891)。
下文列出了由細胞分泌的主要人蛋白質性變應原的非限制性范例人T細胞反應性貓蛋白質;Der f II主要屋塵螨變應原;AMBTv豚草花粉主要變應原;5C黑麥草(Lolium perenne)花粉變應原;cry j2日本ceder變應原;Alt a 1 Alternaria alternata主要變應原;和Ara h 1花生變應原。
通過本發(fā)明的轉座子輔助信號序列捕獲方法,我們可能能夠鑒定編碼膜結合蛋白的基因,而且如上所述,膜結合蛋白在疫苗開發(fā)中可能具有極大潛力。膜結合蛋白包括脂蛋白、用于攝取溶質的受體、quorum感覺受體、和在感染過程中發(fā)揮關鍵作用的雙成分細菌調控系統(tǒng)(TCS)的部分。信號轉導系統(tǒng)像TCS使細菌病原體能夠發(fā)動適應應答并應付不利環(huán)境壓力,包括營養(yǎng)喪失、抗生素攻擊、和吞噬作用。
最近在重要的革蘭氏陽性和革蘭氏陰性病原體中發(fā)現(xiàn)的幾種重要系統(tǒng)重新點燃了對TCS作為新細菌靶的興趣(M.J.Macielag、R.Goldschmidt,Expert Opinion on Investigation Drugs,9(10)2351-2369,2000)。
本發(fā)明能夠克隆受到極大商業(yè)關注的細胞壁附著蛋白。由于為了生長而選擇性切割承壓舊壁的獨特化學和必要性,細菌細胞壁已經(jīng)成為細菌疾病化療的關鍵靶(A.L.Koch,Critical Reviews inMicrobiology,26(1)1-35,2000)。目前,許多傳染性生物體正在對過度使用的抗生素形成抗性。細胞壁仍然是較好的靶,而且可能存在幾種全新類型的抗生素,它們靶向細胞壁新陳代謝和功能的其它部分。必需的自溶素可能是特別相關的靶。
可以使用本發(fā)明鑒定的其它蛋白質包括粘附素,諸如尿道致病大腸桿菌的P-菌毛(Pap)、S-菌毛、奈瑟氏球菌的IV型菌毛、腸桿菌的I型菌毛、和侵染素例如EPEC Intimin(EaeA)侵染素(《MolekulareInfektionsbiologie》即分子感染生物學,Hacker、J.Heesemann、J.Heidelberg編,柏林,Spektrum,Akad.Verlag,2000)。
因此,本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中完整目的基因編碼在人體內引發(fā)免疫原性應答的多肽。
細菌素(bacteriocin)是具有針對不同細菌的抗微生物活性的小肽。它們是由一些細菌和真核物種合成的。范例是Leucocin A、片球菌素PA-1、腸菌素A和P、Sakacin A和P、和乳鏈菌肽。細菌素可用于保護食品免于細菌污染,因而在食品工業(yè)中具有潛在的商業(yè)價值。由于細菌素大多數(shù)是轉運至胞外空間的分泌性肽,因此可以通過本發(fā)明的信號捕獲方法使用合適的宿主生物體和合適的分泌性報告基因來分離其編碼基因。為了分離以sec依賴方式分泌的細菌素,可以使用sec依賴性報告基因,如β-內酰胺酶。
最近幾年已經(jīng)表征了大量的細菌素,新細菌素的大多數(shù)屬于II型細菌素,它們是在翻譯后通常不再進行修飾的小型(30-100個氨基酸)熱穩(wěn)定蛋白質。根據(jù)共同特性,可以將一些II型細菌素細分成組,諸如片球菌素樣和強抗李司特氏菌屬細菌素、雙肽細菌素、和具有sec依賴性信號序列的細菌素。除了包含sec依賴性信號序列的很少一些細菌素以外,II型細菌素是以包含N端雙甘氨酸前導序列的前體形式合成的。包含雙甘氨酸前導序列的細菌素的加工伴隨著細胞外在化,這是由已經(jīng)顯示具有N端蛋白水解結構域的專性ABC轉運蛋白系統(tǒng)進行的(I.F.Nes等人,1996,Int J Gen Mol Microbiol,70113-128)。
本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中完整目的基因編碼細菌素。
植物致病細菌、真菌、和其它微生物的許多致病性因子是分泌性蛋白質,如根癌土壤桿菌的vir基因編碼介導由細菌至植物細胞的tDNA轉移的分泌性蛋白質。這種轉移是根癌土壤桿菌的致病性所必需的。同樣,真菌物種像玉蜀黍黑粉菌(玉米黑穗病的病因)分泌涉及真菌的致病性的蛋白質。其它細菌植物病原體是假單胞菌種、黃單胞菌種、和寡養(yǎng)單胞菌種。本發(fā)明的方法可用于分離編碼涉及植物致病性的分泌性蛋白質的基因,而且這些蛋白質繼而可用于設計分泌性蛋白質的抑制劑。
因此,本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中完整目的基因編碼植物致病多肽。
如上所述,本發(fā)明的方法可用于分離稍后以工業(yè)規(guī)模表達的目的基因,然而這有可能需要構建表達系統(tǒng),諸如本領域所描述和本文其它部分所參考的。
本發(fā)明的一個優(yōu)選實施方案涉及第一個方面的方法,其中進行構建表達系統(tǒng)的額外步驟,所述表達系統(tǒng)包含第一個方面中分離的完整目的基因。
通過本發(fā)明的方法分離得到的目的基因,優(yōu)選由基因文庫分離得到的基因。
由上述方面定義的目的基因編碼的酶。
包含上述方面定義的目的基因的表達系統(tǒng)。
包含上述方面定義的表達系統(tǒng)的宿主細胞。
包含上述方面定義的目的基因的至少兩個染色體整合拷貝的宿主細胞。
用于生產(chǎn)多肽的方法,包括在適合于表達上述方面定義的目的基因的條件下培養(yǎng)上述方面定義的宿主細胞,其中所述宿主細胞將由所述基因編碼的多肽分泌到生長培養(yǎng)基中。
本發(fā)明的一個優(yōu)選實施方案涉及最后一個方面的方法,其中多肽是酶。
最后,本發(fā)明的一個優(yōu)選實施方案涉及最后一個方面的方法,其中進行純化多肽的額外步驟。
實施例實施例1包含β-內酰胺酶報告基因的SigA轉座子的構建
此實施例利用切除了分泌信號的β-內酰胺酶。β-內酰胺酶只有在被分泌至周質時才賦予大腸桿菌以氨芐青霉素抗性,而β-內酰胺酶的胞質表達不賦予氨芐青霉素抗性。在不含信號序列時,β-內酰胺酶不會轉運至周質,因而克隆不會在包含氨芐青霉素的培養(yǎng)基上生長。使用下文所述轉座子的體外轉座將β-內酰胺酶基因轉移至靶克隆。
包含無信號β-內酰胺酶基因的轉座子的構建是使用標準分子生物學技術進行的。首先使用校讀聚合酶(例如Pfu Turbo)由商品化來源(諸如載體pUC19)PCR擴增無信號β-內酰胺酶基因。生成的PCR片段包含限制性位點NotI和EcoRI以便于克隆。
使用校讀聚合酶(Pfu Turbo)和引物MuA-F(SEQ ID NO1)5’-GAAGATCTGAAGCGGCGCACGA由商品化來源(Finnzymes)PCR擴增編碼氯霉素抗性的微型轉座子MuA。純化包含PCR片段的轉座子,并連接到包含卡那霉素抗性基因的載體pK184中。
將連接混和液電穿孔到大腸桿菌DH10B中,并在包含氯霉素和卡那霉素的LB培養(yǎng)基上選擇包含插入了轉座子片段的pK184的克隆?;厥樟嗽S多菌落,并由其中10個分離質粒DNA。測序揭示無信號β-內酰胺酶基因正確插入了質粒pK184中所含的轉座子MuA中(M.G.Jobling、R.K.Holmes,1990,Construction of Vectors with the p15a replicon,kanamycin resistance,inducible lacZalpha and pUC18 or pUC19multiple cloning sites即具有p15a、卡那霉素抗性、誘導性lacZα、和pUC18或pUC19多克隆位點的載體的構建,Nucleic Acids Res.,185315-5316)。
無信號β-內酰胺酶基因包含于轉座子中的方式使得轉座子邊界區(qū)(在MuA的情況中是大約50bp)與β-內酰胺酶編碼區(qū)之間存在連續(xù)的開放讀碼框。以這種方式修飾的轉座子在轉座到編碼分泌性蛋白質的基因中后能夠引起與靶基因的符合讀碼框式融合。這導致融合基因產(chǎn)物分泌至大腸桿菌的周質且引起氨芐青霉素抗性。不是分泌基因中的所有轉座事件都導致成功的符合讀碼框式融合,但是在使用正選擇時,我們能夠進行大量篩選,并由此選擇甚至很稀少的事件。實施例2包含β-內酰胺酶報告基因的SigA2轉座子的構建
包含無信號β-內酰胺酶基因的轉座子的構建是使用標準分子生物學技術進行的。首先使用校讀聚合酶(Pfu Turbo,Stratagene,美國)由載體pUC19 PCR擴增無信號β-內酰胺酶基因。生成的PCR片段包含限制性位點NotI和EcoRI以便于克隆。包含Entranceposon和抗生素抗性標記CAT(在轉座子中編碼氯霉素抗性)的質粒pEntranceposon(Camr)得自Finnzymes,OY(Espoo,芬蘭)。將質粒用限制酶NotI和EcoRI消化,凝膠純化,并連接包含無信號β-內酰胺酶的片段。將連接反應轉化到電擊感受態(tài)DH10B細胞中,并通過限制性分析來鑒定包含插入了無信號B-內酰胺酶的重組質粒的大腸桿菌克隆,稱為大腸桿菌SigA2。使用QiaSpin方案由大腸桿菌SigA2分離質粒DNA并用BglII消化。使用GFX方案凝膠純化包含轉座子的DNA片段。該DNA片段即包含無信號β-內酰胺酶的轉座子,稱為SigA2。實施例3包含無信號β-內酰胺酶的SigA轉座子作為報告基因在胞外木糖葡聚糖酶XYG1006的信號捕獲中的使用
首先將SigA微型轉座子轉座到克隆的亞基因組片段中,所述片段包含編碼可測定的分泌性基因產(chǎn)物的已知基因。在此實施例中我們使用來自多粘類芽孢桿菌(Paenibacillus polymyxa)的木糖葡聚糖酶。木糖葡聚糖酶是可以由大腸桿菌DSM 13321中的質粒獲得的4.6kb亞基因組克隆片段上的大型開放讀碼框(3036bp)。
步驟1使用Pfu turbo聚合酶(Stratagene公司,美國)通過psigA的PCR制備線性微型轉座子,其中使用引物muA-f(SEQ ID NO1)擴增完整的微型轉座子。使用GFX柱(Pharmacia)純化微型轉座子,稀釋至23ng/μl,并用于標準Finnzyme GPS轉座方案。
步驟2依照原始的Finnzymes方案,在Eppendorf管中以適當濃度混和信號捕獲微型轉座子SigA、質粒pXYG1006、5x緩沖液、和轉座酶(transposome)并進行體外轉座反應。平行進行使用相同質粒和原始CAM微型轉座子的對照實驗。在Biorad Gene Pulse裝置(50μF,25mA,1.8kV)中通過電穿孔將轉座反應物轉化到大腸桿菌xL1-blue電擊感受態(tài)細胞(Stratagene,美國)中。在1ml SOC培養(yǎng)基中稀釋細胞,并在37℃搖床中預保溫1小時。將適當稀釋液涂布在下文所列LB固體培養(yǎng)基上,以測定轉化、轉座、和信號捕獲效率(見表1所示)。固體LB培養(yǎng)基LB-kan(50mg/ml卡那霉素)LB-CAM(10mg/ml氯霉素)LB-CAM-amp(10mg/ml氯霉素、100mg/ml氨芐青霉素)LB-CAM-amp AZCL-木糖葡聚糖(10mg/ml氯霉素、50mg/ml氨芐青霉素、0.07%w/v AZCL-木糖葡聚糖)
將在LB-CAM-AMP上生長的菌落復制涂布到LB-CAM-amp AZCL-木糖葡聚糖上,以獲得位于ORF前900bp中的木糖葡聚糖酶結構域的破壞頻率。表1進入pXYG1006的轉座的典型結果
在氨芐青霉素和氯霉素上選擇的大腸桿菌克隆中,β-內酰胺酶報告基因與XYG1006木糖葡聚糖酶基因發(fā)生了翻譯融合,因而XYG1006信號肽引起β-內酰胺酶轉運至大腸桿菌的周質。測序確認了陽性克隆在信號序列下游包含轉座子。使用Qiaspin流程(Qiagen)由10個隨機的氨芐青霉素抗性菌落制備質粒DNA,并使用對轉座子特異的兩種引物由質粒測定DNA序列SigA-r(SEQ ID 2)GCACCCAACTGATCTTCAGCA,和SeqB(SEQ ID 3)TTATTCGGTCGAAAAGGATCC;或SigA2up(SEQ ID 4)AGCGTTTGCGGCCGCGATCC,和SeqB(SEQ ID 3).
分析指示SigA轉座子位于XYG1006編碼區(qū),且符合木糖葡聚糖酶的開放讀碼框。β-內酰胺酶基因與XYG1006天然信號肽的符合讀碼框式融合的典型范例如下
作為能夠在雙重選擇平板(LB-CAM-amp)上生長的信號菌落分離克隆pSigA2-11。使用QiaspinTM質粒制備試劑盒(Qiagen GMBH)由該分離菌制備質粒DNA。使用引物SeqA和SeqB(Finnzyme公司)對質粒DNA測序,其中在ABI Prizm 377測序儀中使用ABI測序試劑盒進行反應。克隆pSigA2-11的DNA序列分析指示SigA2轉座子在距木糖葡聚糖酶編碼基因XYG1006的ATG起始密碼子58bp處插入,在該基因與分泌性報告基因β-內酰胺酶基因之間發(fā)生符合讀碼框式融合。這導致19個氨基酸的分泌信號肽與β-內酰胺酶融合,將β-內酰胺酶有效靶向大腸桿菌的周質。實施例4包含無信號β-內酰胺酶的轉座子SigA2在胞外支鏈淀粉酶PULL1012的信號捕獲中作為報告基因的使用
首先將SigA2微型轉座子轉座到克隆的亞基因組片段中,所述片段包含編碼可測定的分泌性基因產(chǎn)物的已知基因。在此實施例中,我們使用來自Anaerobranca horikoshii DSM 9786的PULL 1012支鏈淀粉酶編碼基因。支鏈淀粉酶是由3054bp亞基因組克隆片段上的大型開放讀碼框(2597bp)編碼的。使用GFX柱(Pharmacia)純化SigA2微型轉座子,將純DNA稀釋至20ng/μl,并用于標準Finnzyme GPS轉座方案。
依照原始的Finnzymes方案,在EppendorfTM管中以適當濃度混和信號捕獲微型轉座子SigA2、質粒pPULL1012、5x緩沖液、和MuA轉座酶并進行體外轉座反應。將在Biorad Gene Pulse裝置(設置50μF,25mA,1.8kV)中通過電穿孔將轉座反應物轉化到大腸桿菌DH10B電擊感受態(tài)細胞(Stratagene,美國)中。電穿孔后,在1ml SOC培養(yǎng)基中稀釋細胞,在37℃搖床中預保溫1小時,并涂布到包含卡那霉素、氨芐青霉素、和氯霉素的LB瓊脂上。
在卡那霉素、氨芐青霉素、和氯霉素上選擇的大腸桿菌克隆中,β-內酰胺酶報告基因與PULL1012支鏈淀粉酶基因發(fā)生翻譯融合,使得PULL1012信號肽引起β-內酰胺酶轉運至大腸桿菌的周質。DNA測序確認了所有陽性克隆都在PULL 1012信號序列下游包含轉座子。使用QiaspinTM流程(Qiagen)由15個隨機的氨芐青霉素抗性菌落制備質粒DNA,并使用對轉座子特異的兩種引物即SigA2up(SEQ ID NO4)和SeqB(SEQ ID NO3)由這些克隆測定DNA序列。結果顯示于圖1。
在有些情況中,分泌信號報告基因將插入宿主基因組,其插入編碼分泌性多肽的基因的方式能使得生成的融合多肽保留分泌性多肽的活性。例如,分泌信號報告基因可以位于基因的較遠3’端,正如在此實施例中分離的2個克隆的情況Tn4-12-ab 1(14>777)和Tn4-4-.ab(17>719)。截短的支鏈淀粉酶與分泌性報告基因β-內酰胺酶的融合多肽在這兩個克隆中都保留了實質的支鏈淀粉酶活性,如圖1中以方框所示。
本發(fā)明的篩選步驟可以設定成篩選分泌性報告基因和目的酶活性(諸如支鏈淀粉酶)二者,這將能夠非??焖偾矣行У暮Y選特定的分泌性蛋白質,而非僅僅篩選這種分泌性蛋白質。在與高通量篩選測定法的聯(lián)合中,這種技術可作為有力的篩選工具用于分離編碼具有特別感興趣的可篩選活性的分泌性多肽的基因。
另外,可以將本發(fā)明方法的DNA片段中所包含的編碼分泌性報告蛋白的基因以符合讀碼框的方式連接在編碼特定蛋白水解酶的靶序列的DNA序列的上游,其連接方式能使得插入分泌信號后面之后,提供由下列各項組成的融合多肽1)由本發(fā)明的插入DNA片段上游的DNA序列編碼的分泌信號和多肽;2)包含蛋白水解靶位點的接頭;和3)分泌性報告蛋白。
這種構造在篩選具有目的活性的分泌性融合多肽(像上述兩種支鏈淀粉酶融合體)時或篩選抗體和其它生物學活性分子時尤其有利。在分離得到目的融合多肽后,能夠通過培養(yǎng)分離得到的初級克隆快速進行大量生產(chǎn)??梢杂锰囟ǖ牡鞍姿饷柑幚慝@得的融合多肽以切割連接活性多肽與分泌性報告基因的靶位點,然后幾乎立即可以鑒定基本純的活性多肽。針對分泌性報告基因的抗體可用于初步的純化或分離步驟,或者本發(fā)明的DNA片段可以包含能夠進行His/NiTa柱純化的多組氨酸接頭。該概述的流程將規(guī)避克隆并表達基因組克隆的通常困難且費時的許多步驟。PCT DK00/00296顯示了融合接頭的范例,上文也有提及。實施例5使用轉座子SigA在基因組文庫中鑒定包含信號序列的蛋白質的編碼基因
依照實施例2中描述的方法,用信號捕獲微型轉座子SigA給亞基因組質粒DNA文庫做上標簽。在此實施例中,我們使用通過標準方法制備的飼料類芽孢桿菌(Paenibacillus pabuli)基因組文庫。轉化物應當涂布在培養(yǎng)基1、2、和3上(表2)。表2進入飼料類芽孢桿菌基因組文庫的轉座的典型結果
由在存在氯霉素和氨芐青霉素時(選擇培養(yǎng)基3)能夠生長的陽性克隆分離質粒DNA,而且可以用靶向位于轉座子中的序列的引物進行測序??梢赃@種方式獲得信號捕獲基因的DNA序列。在許多情況中,由兩種轉座子引物讀取的序列將獲得編碼區(qū)的大部分遺傳序列,或者可以由第一輪獲得的序列合成定制引物以完成基因序列。另一種方法是生成比完全覆蓋文庫所需多3-100倍的轉化體。這使得轉座子能夠在幾個獨立的轉座事件中在每個克隆內到達相同基因,但在該基因的不同位置??梢詫⒂嬎銠C毗連序列群裝配程序適用于裝配呈現(xiàn)相同基因的交疊區(qū)的轉座體。以這種方式獲得許多分泌性基因的完全或幾乎完全覆蓋。實施例6使用新型轉座子SigA2在基因組文庫中鑒定具有信號序列的蛋白質的編碼基因
在此實施例中我們使用通過標準方法制備的類芽孢桿菌NN018026(2001年2月8日保藏于DSMZ,保藏號DSM 14046)基因組文庫。依照實施例2中描述的方法,用信號捕獲微型轉座子SigA2給亞基因組質粒DNA文庫做上標簽。具體而言,在標準Finnzymes轉座方案中使用1μl(1.85μg)質粒DNA文庫、4μl 5x反應緩沖液、1μl(200μg)SigA片段、和13μl水。將轉化混和液涂布在培養(yǎng)基1、2、和3上(表3),結果顯示于表3。表3進入類芽孢桿菌基因組文庫的轉座的典型結果
通過QiaspinTM或Qiaprep turboTM mini prep(Qiagne公司)由能夠在選擇培養(yǎng)基3上在存在氯霉素(CAM)、卡那霉素(kan)、和氨芐青霉素(amp)時生長的陽性克隆分離質粒DNA。用向上讀取信號捕獲基因的SigA2up引物(SEQ ID NO4)或向下讀取捕獲基因的SeqB引物(SEQ ID NO3)對質粒DNA進行測序。以這種方式獲得信號捕獲基因的DNA序列。在許多情況中,只由兩種轉座子引物讀取的序列將得到編碼區(qū)的大部分序列,或者可以由在第一輪中獲得的序列合成定制引物,并通過“引物行走”測序完成序列。
獲取完整序列的另一種方法是生成比完全覆蓋文庫所需多3-100倍的轉化體。這使得轉座子能夠到達相同基因,但在基因的不同位置,從而能夠分離得到幾個克隆,每一個都代表獨立的轉座事件??梢詫⒂嬎銠C毗連序列群裝配程序適用于裝配代表相同基因的交疊區(qū)的轉座體。以這種方法可以完全或幾乎完全覆蓋許多分泌性基因,例如可以通過圖1所示許多交疊序列的毗連序列群裝配來推導實施例4的PUL1012支鏈淀粉酶編碼基因的完整序列。
在此實施例中,鑒定了來自編碼假定蛋白質的幾個不同開放讀碼框的信號序列,包括顯示與分泌酶有序列相似性的幾種基因-1種支鏈淀粉酶-3種纖維素酶-3種幾丁質酶-1種纖維二糖水解酶(cellubiohydrolase)-1種異麥芽糖葡聚糖酶(isomaltodextranase)-2種果膠酸裂解酶-1種鼠李糖半乳糖醛酸聚糖酶(rhamogalacturonase)-1種海藻酸裂解酶-1種果聚糖酶
合計鑒定了顯示與所述假定分泌性蛋白質有顯著序列相似性或包含預測為蛋白質分泌的信號序列的序列的12種基因。鑒定了編碼推定分泌性青霉素結合蛋白的2種基因。鑒定了編碼推定分泌性溶質結合蛋白的7種基因。2種基因編碼推定跨膜蛋白。編碼推定整合型膜蛋白、與斯氏梭菌(Clostridium sticklandii)的bmpA相似(50%氨基酸同一性)的abc轉運蛋白的底物結合脂蛋白前體和與LPLB蛋白質相似(40%氨基酸同一性)的推定膜蛋白的基因;以及編碼位于細胞質膜外側但通過錨定肽附著于膜的蛋白質(諸如根癌土壤桿菌的推定多種糖結合周質受體chve前體(68%氨基酸同一性)或大腸桿菌的D-木糖結合周質蛋白前體(43%氨基酸同一性))的基因。實施例7使用來自信號捕獲計劃的信息
第一步是由基因文庫獲取編碼分泌性蛋白質的所有或許多基因的序列信息。大多數(shù)捕獲的基因代表具有已知或未知功能的分泌性酶??梢詫⒒蛳鄳姆殖蓛深惒⑦M行相應的處理。
一類ORF與已知酶在氨基酸水平具有顯著相似性??梢詫⑦@些ORF亞克隆到最佳表達載體中,而且可以將構建物用于表達顯著水平的酶,然后可以在各種應用中進行測試。
另一類ORF與任何已知酶不具有顯著同源性,但是同樣感興趣??梢詫⑦@些ORF以與已知ORF相同的方式亞克隆到表達載體中并進行表達。然而,由于這些ORF的酶活性(如果有的話)是未知的,因此沒有特定的測定法來監(jiān)控它們的活性,而隨機應用測試是適當?shù)?。實施?使用轉座子的真核信號捕獲
許多真核生物也分泌酶,例如真菌分泌許多類型的酶,包括蛋白酶、纖維素酶、和脂肪酶。由于真核基因組的相對大小和復雜性,通常由cDNA文庫表達克隆編碼酶的基因,或者在EST(表達序列標簽)測序程序中進行鑒定。cDNA文庫是由自真核生物的誘導后生物量分離的mRNA生成的。用于在cDNA文庫中呈現(xiàn)分泌性酶的廣泛多樣性的方法在本領域是已知的,這些方法包括合并來自分開的且不同的誘導條件的生物量材料,隨后在克隆之前或之后將mRNA或cDNA標準化。
原核生物和真核生物中的信號捕獲基本理論本質上是相同的。主要差異如下cDNA文庫依賴于由克隆載體提供的啟動子。cDNA文庫是表達的基因組子集,意味著轉座進入編碼區(qū)的命中率高于原核基因組文庫的信號捕獲。
信號捕獲標記必須是對所篩選的生物體特異的。通常,用于篩選真菌基因的生物體是例如釀酒酵母、黑曲霉、或粟酒裂殖酵母。在此實施例中我們使用K.A.Jacobs,1997,Gene,198289-296中描述的轉化酶信號捕獲系統(tǒng)。
通過PCR克隆修飾后的轉化酶基因以包含NotI和EcoRI位點,用于以符合讀碼框的方式克隆到pSigA微型轉座子中。通過限制性消化切除β-內酰胺酶并凝膠純化。連接反應能夠將轉化酶基因克隆到pSigA微型轉座子中,使得轉化酶以符合讀碼框的方式融合轉座子左界,讀碼框完全如pSigA的原核版本中所述。完成的克隆pSigB即可用于酵母中的測試。
在包含已經(jīng)表達克隆的分泌性酶的cDNA編碼區(qū)的質粒上進行初步測試。cDNA是編碼棘孢曲霉(Aspergillus aculeatus)的鼠李糖半乳糖醛酸聚糖酶的rhgA基因(Kofod等人,1994,J Biol Chem,4629182-29819)。完全如上文細菌方法中所述使用23ng SigB微型轉座子進行體外轉座反應。然后將處理后的rhgA質粒轉化到消除了天然轉化酶基因的酵母細胞W3124中。以高密度(1000菌落/平板)涂布菌落并復制涂布到包含蔗糖或棉子糖的SC培養(yǎng)基(F.Sherman,1991,Methods Enzymol.,1943-21)上;典型結果顯示于表4。表4進入pRhgA的轉座的典型結果
通過Strathern和Higgens,1991,Methods Enzymol.,194319-239的方法,將來自能夠在蔗糖上生長的酵母菌落的DNA挽救到大腸桿菌中。用Qiaspin方案(Qiagen)分離質粒DNA并用YES2.0載體引物和轉座子引物對質粒測序以測定插入片段的序列。在大多數(shù)情況中,用上述引物測定的序列足以完成cDNA的序列覆蓋,從而能夠分析全長基因和構建有活性的表達克隆。實施例9使用攜帶復制起點的轉座子在宿主細胞的基因組中鑒定編碼分泌性蛋白質的基因
這種方法的優(yōu)點是轉座子中存在的復制起點能夠直接使得由轉座子標記的基因組宿主細胞DNA形成轉座子-質粒。在此實施例中使用寡核苷酸引物ori-1和ori-2 PCR擴增質粒pBR322中攜帶colE1復制起點的堿基對1763-3147區(qū)域ori-15′-CGCGGATCCTACATCTGTATTAACGAAGCGC(SEQ ID 5).ori-25′-CGCGGATCCCGTAGAAAAGATCAAAGGAT(SEQ ID 6).
用限制性內切核酸酶BamHI在制造商推薦的條件下切割生成的PCR擴增子。用BamHI部分消化包含質粒pSigA2的SigA2轉座子(包含兩個BamHI位點),并將大約1.4kb的PCR擴增子的片段連接到位于第2149位的單個BamHI切割位點中。然后用酶BglII限制性消化連接構建物,由質粒主鏈釋放期望的轉座子-復制子片段。然后對DNA進行額外的連接步驟并轉化到大腸桿菌DH5α中。將轉化體涂布在LB氯霉素選擇培養(yǎng)基上。然后將能夠在選擇壓力下生長的菌落復制涂布到LB氨芐青霉素和LB氯霉素上。選擇只在LB氯霉素上生長的幾個菌落,用于質粒分離和序列分析。選擇經(jīng)確認在BamHI位置具有正確的ColE1復制起點取代的質粒,命名為pMuori。
可以與先前實施例中所示相同的方式通過凝膠純化來制備pMuori的轉座子片段。純化后,可以兩種方式使用分離的轉座子1)可以在體外使用轉座子來處理分離自目的生物體且經(jīng)部分消化和大小分離的基因組DNA。大小分離后的DNA的大小范圍應當是1000bp或更大,以提高在隨后選擇中回收全長基因的可能性。用于這種處理的方案與實施例4(類芽孢桿菌實施例)相同,但是在轉座后用DNA連接酶連接生成的混和液,以將線性DNA片段環(huán)化。然后將生成的環(huán)化后DNA用于轉化大腸桿菌篩選宿主。選擇方案與實施例4完全相同。
使用Muori轉座子的第二種方式是首先用轉座子和轉座酶生成轉座體復合物。這種商品化系統(tǒng)的一個范例是Epicentre technologies(美國)“EZ∷Tn”系統(tǒng)。本質上,在缺乏鎂時,可以形成穩(wěn)定的轉座體復合物,它只在鎂存在時才插入外源DNA。在轉化到靶宿主中之后,細胞中存在的生理鎂激活轉座體復合物,從而能夠在體內轉座進入染色體DNA。對于我們的目的,信號捕獲轉座子也可用于進入靶生物體的體內轉座。然后由被處理的生物體分離染色體DNA,通過隨機剪切或限制酶部分消化將DNA縮短成片段,并用DNA連接酶進行連接。然后可以將生成的DNA用于轉化適當?shù)暮Y選宿主,在此實施例中是大腸桿菌DH5α。完全如實施例4的篩選也能導致包含轉座子的菌落的回收,其中復制起點插入基因組DNA片段,其插入方式使得可提供選擇標記(在此實施例中是氨芐青霉素)的抗性。分離并純化生成的質粒,用引物SigA2up(SEQ ID NO4)和SeqB(SEQ ID NO3)進行測序。序列表<110>Novozoymes A/S
Duffner,F(xiàn)iona
Wilting,Reinhard
Schnorr,Kirk<120>信號序列捕獲<130>10018.204-WO<150><160>6<170>PatentIn version 3.0<210>1<211>22<212>DNA<213>引物MuA-F<400>1gaagatctga agcggcgcac ga 22<210>2<211>21<212>DNA<213>引物SigA-r<400>2gcacccaact gatcttcagc a 21<210>3<211>21<212>DNA<213>引物SeqB<400>3ttattcggtc gaaaaggatc c 21<210>4<211>20<212>DNA<213>引物SigA2up<400>4agcgtttgcg gccgcgatcc20<210>5<211>31<212>DNA<213>引物ori-1<400>5cgcggatcct acatctgtat taacgaagcg c 31<210>6<211>29<212>DNA<213>引物ori-2<400>6cgcggatccc gtagaaaaga tcaaaggat 29
權利要求
1.用于由基因文庫鑒定并分離目的基因的方法,其中所述基因編碼攜帶用于分泌或部分分泌的信號序列的多肽,所述方法包括下列步驟
a)提供基因組DNA文庫或cDNA文庫;
b)在所述文庫中插入包含編碼分泌報告蛋白的無啟動子且無分泌信號的多核苷酸的DNA片段;
c)將包含插入DNA片段的文庫導入宿主細胞;
d)篩選并選擇分泌或部分分泌有活性的分泌性報告蛋白的宿主細胞;
e)通過對插入的DNA片段側翼的DNA測序,在選定宿主細胞中鑒定插入了分泌性報告基因的目的基因;
f)分離在步驟(e)中鑒定的完整目的基因。
2.權利要求1的方法,其中步驟(f)的完整目的基因是由步驟(a)的文庫分離的。
3.權利要求1或2的方法,其中步驟(b)是在體外進行的。
4.權利要求1-3任一項的方法,其中cDNA或cDNA文庫是標準化的。
5.權利要求1-4任一項的方法,其中基因組DNA文庫或cDNA文庫衍生自微生物。
6.權利要求5的方法,其中微生物是真菌、絲狀真菌、或酵母。
7.權利要求5的方法,其中微生物是細菌。
8.權利要求5的方法,其中微生物是古細菌。
9.權利要求1-4任一項的方法,其中基因組DNA文庫或cDNA文庫衍生自多細胞生物體,優(yōu)選哺乳動物細胞,最優(yōu)選人類細胞。
10.權利要求1-9任一項的方法,其中權利要求1的DNA片段包含轉座子,優(yōu)選MuA轉座子。
11.權利要求1-10任一項的方法,其中DNA片段包含在宿主細胞中有功能的復制起點,優(yōu)選的是復制起點在大腸桿菌中有功能,更優(yōu)選的是復制起點是colE1、oriV、P15A、或colDF13的衍生物,最優(yōu)選的是復制起點是colE1。
12.權利要求1-11任一項的方法,其中分泌性報告蛋白是在由宿主細胞分泌時使所述細胞能夠在原本抑制其生長的物質存在時生長的蛋白質。
13.權利要求12的方法,其中分泌性報告蛋白是β-內酰胺酶或轉化酶。
14.權利要求1-13任一項的方法,其中步驟(b)的DNA片段的多核苷酸編碼攜帶N端肽接頭的分泌性報告蛋白,所述肽接頭包含蛋白水解切割的特異靶位點。
15.權利要求1-14任一項的方法,其中宿主細胞是細菌。
16.權利要求15的方法,其中細菌宿主細胞是埃希氏菌屬(Escherichia)、乳球菌屬(Lactococcus)、鏈霉菌屬(Streptomyces)、腸球菌屬(Enterococcus)、或芽孢桿菌屬(Bacillus)細胞,優(yōu)選物種大腸桿菌(Escherichia coli)、乳酸乳球菌(Lactococcus lactis)、灰色鏈霉菌(Streptomyces griseus)、天藍色鏈霉菌(Streptomyces coelicor)、糞腸球菌(Enterococcusfaecalis)、嗜堿芽孢桿菌(Bacillus alkalophilus)、解淀粉芽孢桿菌(Bacillus amyloliquefaciens)、短芽孢桿菌(Bacillusbrevis)、環(huán)狀芽孢桿菌(Bacillus circulans)、Bacillus clausii、凝結芽孢桿菌(Bacillus coagulans)、燦爛芽孢桿菌(Bacilluslautus)、遲緩芽孢桿菌(Bacillus lentus)、地衣芽孢桿菌(Bacilluslicheniformis)、巨大芽孢桿菌(Bacillus megaterium)、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)、枯草芽孢桿菌(Bacillus subtilis)、或蘇云金芽孢桿菌(Bacillusthuringiensis)細胞。
17.權利要求1-14任一項的方法,其中宿主細胞是真菌。
18.權利要求17的方法,其中真菌宿主細胞是假絲酵母屬(Candida)、克魯維酵母屬(Kluyveromyces)、畢赤酵母屬(Pichia)、酵母屬(Saccharomyces)、裂殖酵母屬(Schizosaccharomyces)、Yarrowia屬、頂孢霉屬(Acremonium)、曲霉屬(Aspergillus)、短梗霉屬(Aureobasidium)、隱球酵母屬(Cryptococcus)、Filibasidium屬、鐮孢屬(Fusarium)、腐質霉屬(Humicola)、Magnaporthe屬、毛霉屬(Mucor)、毀絲霉屬(Myceliophthora)、Neocallimastix屬、脈孢菌屬(Neurospora)、擬青霉屬(Paecilomyces)、青霉屬(Penicillium)、Piromyces屬、裂褶菌屬(Schizophyllum)、Talaromyces屬、嗜熱子囊菌屬(Thermoascus)、梭孢殼屬(Thielavia)、Tolypocladium屬、或木霉屬(Trichoderma)細胞。
19.權利要求18的方法,其中真菌宿主細胞是物種釀酒酵母(Saccharomyces cerevisiae)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、構巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillus niger)、或米曲霉(Aspergillusoryzae)細胞。
20.權利要求1-14任一項的方法,其中宿主細胞是哺乳動物。
21.權利要求1-20任一項的方法,其中權利要求1中的測序步驟是使用針對權利要求1的DNA片段的至少一種引物或使用針對載體的至少一種引物進行的,其中權利要求1的DNA文庫或cDNA文庫得到克隆。
22.權利要求1-21任一項的方法,其中完整目的基因的分離是利用權利要求1中的測序步驟獲得的DNA序列信息進行的。
23.權利要求1-22任一項的方法,其中完整目的基因編碼由宿主細胞分泌的酶。
24.權利要求1-22任一項的方法,其中完整目的基因編碼膜結合性受體,優(yōu)選雙成分信號(TCS)轉導受體,更優(yōu)選細胞因子受體。
25.權利要求1-22任一項的方法,其中完整目的基因編碼分泌性多肽細胞因子。
26.權利要求1-22任一項的方法,其中完整目的基因編碼在人體內引發(fā)免疫原性應答的多肽。
27.權利要求1-22任一項的方法,其中完整目的基因編碼細菌素。
28.權利要求1-22任一項的方法,其中完整目的基因編碼植物致病多肽。
29.權利要求1-28任一項的方法,其中進行構建表達系統(tǒng)的額外步驟,所述表達系統(tǒng)包含權利要求1中分離的完整目的基因。
30.通過本發(fā)明的方法分離得到的目的基因,優(yōu)選該基因是由基因文庫分離得到的。
31.由權利要求30定義的目的基因編碼的酶。
32.包含權利要求30定義的目的基因的表達系統(tǒng)。
33.包含權利要求32定義的表達系統(tǒng)的宿主細胞。
34.包含權利要求30定義的目的基因的至少兩個染色體整合拷貝的宿主細胞。
35.用于生產(chǎn)多肽的方法,包括在適合于表達權利要求30定義的目的基因的條件下培養(yǎng)權利要求33或34定義的宿主細胞,其中所述宿主細胞將由所述基因編碼的多肽分泌到培養(yǎng)基中。
36.權利要求35的方法,其中所述多肽是酶。
37.權利要求35或36的方法,其中所述進行純化多肽的額外步驟。
全文摘要
本發(fā)明能夠通過對先前構建的基因庫或文庫篩選在工業(yè)上感興趣而使用常規(guī)篩選方法不太可能分離得到的分泌的、部分分泌的、或細胞表面展示的多肽(諸如酶、受體、細胞因子、肽激素等)的編碼基因。本發(fā)明描述了由現(xiàn)有基因文庫分離分泌的、部分分泌的、或細胞表面展示的多肽的編碼基因的方法,其中使用體外多核苷酸插入反應來檢測內源分泌信號序列,其中插入的多核苷酸包含無啟動子且無分泌信號的分泌性報告基因。
文檔編號C12N15/09GK1418250SQ0180684
公開日2003年5月14日 申請日期2001年3月22日 優(yōu)先權日2000年4月7日
發(fā)明者F·杜福納, R·威爾廷, K·施諾爾 申請人:諾沃奇梅茲有限公司