專利名稱:用于提高多肽產(chǎn)率的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于提高多肽產(chǎn)率的方法。特別地,本發(fā)明涉及通過(guò)修飾多肽主鏈來(lái)提高多肽產(chǎn)率的方法。
背景技術(shù):
近期在基因組和宏基因組測(cè)序方面的迅速發(fā)展得到大量基因,它們代表著可能非常令人感興趣的蛋白質(zhì)財(cái)富。在顯著水平下表達(dá)這些基因的問(wèn)題妨礙了對(duì)這些基因編碼的蛋白質(zhì)功能性的探索,并因此阻止了以經(jīng)濟(jì)上可行的方式對(duì)此類蛋白質(zhì)進(jìn)行可能的開發(fā)。因?yàn)樵谠S多情況下所發(fā)現(xiàn)的基因源自較不適合大規(guī)模生產(chǎn)的生物或者相當(dāng)難以使用現(xiàn)有基因工程工具的生物,所以高度期望使用已被完善建立的生產(chǎn)宿主,所述生產(chǎn)宿主能夠利用基因轉(zhuǎn)移系統(tǒng)和充分開發(fā)的基因工程工具。特別地,真核生物例如絲狀真菌和酵母在蛋白質(zhì)生產(chǎn)、特別是細(xì)胞外蛋白質(zhì)生產(chǎn)中被廣泛用作細(xì)胞工廠。因?yàn)槔萌舾蛇@些物種的長(zhǎng)期傳統(tǒng)是公認(rèn)安全(GRAS)的,這使得它們對(duì)用于人使用的產(chǎn)品制造而言非常令人感興趣。然而,盡管取得了大幅進(jìn)步,但是針對(duì)異源基因獲得的生產(chǎn)水平通常比針對(duì)同源基因所觀察到的低得多。通常根本不存在蛋白質(zhì)表達(dá)。存在用于提高蛋白質(zhì)生產(chǎn)水平的多種技術(shù)。這些包括應(yīng)用強(qiáng)啟動(dòng)子,提高拷貝數(shù),最適Kozak序列,mRNA穩(wěn)定化元件,優(yōu)化的密碼子使用(W02008/000632)和基因。然而這些策略通常不確保蛋白質(zhì)能夠以可檢出的水平被生產(chǎn)。迄今為止生產(chǎn)異源蛋白質(zhì)的最成功的途徑是作為與有效分泌的同源蛋白質(zhì)的翻譯融合物來(lái)表達(dá)它們。然而,生產(chǎn)水平仍然顯著落后,并且在許多情況下表達(dá)水平低得有問(wèn)題。一般發(fā)酵中的低表達(dá)導(dǎo)致回收時(shí)的更低產(chǎn)率。即使表達(dá)被優(yōu)化,最終的成熟蛋白質(zhì)產(chǎn)物仍然可能因?yàn)橄掠渭庸さ拇罅繐p失而導(dǎo)致非常低的生產(chǎn)產(chǎn)率。當(dāng)被表達(dá)的蛋白質(zhì)保持與生物量結(jié)合時(shí)可能是這種情況。這導(dǎo)致較高的損失,或者要求使用昂貴的、有時(shí)不期望地使用去污劑來(lái)溶解蛋白質(zhì)。附圖
概沭圖I圖I展示了 K. Iactis表達(dá)載體pKLPGE_WT (構(gòu)建描述于實(shí)施例I中)的質(zhì)粒圖譜。圖I還提供了其它PKLPGE-表達(dá)質(zhì)粒的代表性圖譜。示出了相對(duì)于PEG編碼基因的LAC4啟動(dòng)子和amdS選擇標(biāo)記物盒??梢栽谵D(zhuǎn)化之前通過(guò)用限制性酶SacII消化來(lái)去除E. coli DNA。圖2展示了表達(dá)載體pANPGE-3 (構(gòu)建描述于實(shí)施例I中)的質(zhì)粒圖譜。圖2還提供了其它PANPGE-表達(dá)質(zhì)粒的代表性圖譜。另外示出了 glaA啟動(dòng)子序列和截短的GlaA和PGE編碼序列,所述編碼序列編碼根據(jù)本發(fā)明方法的變體PGE酶。在轉(zhuǎn)化A.niger菌株之前可以通過(guò)用限制性酶NotI消化來(lái)去除E. coli DNA。圖3展示了表達(dá)載體pGBFINZDU-WT (構(gòu)建描述于實(shí)施例I中)的質(zhì)粒圖譜。圖3還提供了其它pGBFINZDU-質(zhì)粒、pGBFINZTB-質(zhì)粒和pGBFINZTC-質(zhì)粒的代表性圖譜。示出了相對(duì)于amdS選擇標(biāo)記物盒的glaA側(cè)翼區(qū)。另外還示出了 glaA啟動(dòng)子和編碼根據(jù)本發(fā)明方法的變體酶的ZDU、ZTB和ZTC序列。在轉(zhuǎn)化A. niger菌株之前可以通過(guò)用限制性酶NotI消化來(lái)去除E. coli DNA。、
圖4 對(duì) A. niger WT6 和 PGE 突變體轉(zhuǎn)化體 pANPGE12#16 ⑷和 pANPGE13#30 ⑶的SDS-PAGE和western印跡分析。分析培養(yǎng)物第2天(D2)和第3天(D3)的上清液。處于14kDa和97kDa的水平線用于對(duì)SDS-PAGE和Western印跡的校準(zhǔn)。左手側(cè)的標(biāo)記物大小對(duì)應(yīng)于SDS-PAGE染色的標(biāo)記物,右手側(cè)的標(biāo)記物對(duì)應(yīng)于Western印跡標(biāo)記物。圖5展示了發(fā)酵3天后表達(dá)不同ZDU構(gòu)建體的A. niger菌株培養(yǎng)液中的幾丁質(zhì)酶活性,所述構(gòu)建體均位于glaA啟動(dòng)子的控制下。展示了表達(dá)下述變體SDU構(gòu)建體的A. niger菌株培養(yǎng)液中的幾丁質(zhì)酶活性,所述變體SDU構(gòu)建體中信號(hào)序列、N-末端和蛋白質(zhì)設(shè)計(jì)被修飾。關(guān)于不同構(gòu)建體的細(xì)節(jié)可見(jiàn)表6。相對(duì)幾丁質(zhì)酶活性被展示為0D590測(cè)量值。對(duì)指出的所有轉(zhuǎn)化體組而言,分離并獨(dú)立培養(yǎng)了三種轉(zhuǎn)化體。圖6展示了對(duì)A. niger WT6和發(fā)酵4天后表達(dá)下述變體ZDU構(gòu)建體的ZDU菌株的培養(yǎng)液的SDS-PAGE分析,所述變體ZDU構(gòu)建體均位于glaA啟動(dòng)子的控制下。關(guān)于不同構(gòu)建體和表達(dá)的ZDU蛋白質(zhì)的細(xì)節(jié)可見(jiàn)于表6中。對(duì)示出的所有轉(zhuǎn)化體組而言,分離并獨(dú)立 培養(yǎng)了三種轉(zhuǎn)化體。圖7展示了對(duì)A. niger WT6和發(fā)酵4天后表達(dá)下述變體ZTB構(gòu)建體的ZTB-菌株的培養(yǎng)液的SDS-PAGE分析,所述變體ZTB構(gòu)建體均處于glaA啟動(dòng)子的控制下。關(guān)于不同構(gòu)建體和表達(dá)的ZTB蛋白質(zhì)的細(xì)節(jié)可見(jiàn)于表7中。對(duì)示出的所有轉(zhuǎn)化體組而言,分離并獨(dú)立培養(yǎng)了三種轉(zhuǎn)化體。圖8展示了對(duì)A. niger WT6和發(fā)酵5天后表達(dá)下述變體ZTC構(gòu)建體的ZTC-菌株的培養(yǎng)液的SDS-PAGE分析,所述變體ZTC構(gòu)建體均處于galA啟動(dòng)子的控制下。關(guān)于不同構(gòu)建體和表達(dá)的ZTC蛋白質(zhì)的細(xì)節(jié)可見(jiàn)于表8中。對(duì)示出的ZTC-WT轉(zhuǎn)化體組而言,分離并獨(dú)立培養(yǎng)了三種轉(zhuǎn)化體,對(duì)其它兩種菌株類型而言,分離并獨(dú)立培養(yǎng)了兩種菌株。圖9展不了局部蛋白質(zhì)特征。SEQ ID編號(hào)說(shuō)明SEQ ID NO :I :cDNA 密碼子對(duì)優(yōu)化的(CPO)前胃酯酶(pregastric esterase,PGE);經(jīng)加工的,即無(wú)信號(hào)序列編碼部分SEQ ID NO :2 :蛋白質(zhì)小牛前胃酯酶(PGE),包括信號(hào)序列SEQ ID NO 3 DNA PGE蛋白質(zhì)特征優(yōu)化的(PFO)變體KL8,添加了 I個(gè)額外的糖基化位點(diǎn)SEQ ID NO :4 :蛋白質(zhì)PGE PFO變體KL8,添加了 I個(gè)額外的糖基化位點(diǎn)SEQ ID NO 5 DNA PGE PFO變體KL9,添加了 5個(gè)額外的糖基化位點(diǎn)SEQ ID NO :6 :蛋白質(zhì)PGE PFO變體KL9,添加了 5個(gè)額外的糖基化位點(diǎn)SEQ ID NO 7 DNA PGE PFO 變體 KLl I,pi 從 6. 96 遷移至 7. 74SEQ ID NO 8 :蛋白質(zhì) PGE PFO 變體 KLlI,pi 從 6. 96 遷移至 7. 74SEQ ID NO 9 DNA PGE PFO 變體 KL12,pi 從 6. 96 遷移至 6. 7SEQ ID NO: 10:蛋白質(zhì) PGE PFO 變體 KL12,pi 從 6. 96 遷移至 6. 7SEQ ID NO 11 DNA PGE,具有與a -MAT因子信號(hào)前(原_)序列融合的天然信號(hào)序列的PGE變體SEQ ID NO 12 DNA PGE AN3, CPO 基因 tAG 與 Kex 位點(diǎn)(KR)的融合物SEQ ID NO 13 DNA PGE 變體 AN12,pi 從 6. 96 遷移至 4. 6
SEQ ID NO :14 :蛋白質(zhì) PGE 變體 AN12,pi 從 6· 96 遷移至 4· 6SEQ ID NO :15 DNA PGE 變體 AN13,pi 從 6· 96 遷移至 4· 88SEQ ID NO: 16 :蛋白質(zhì) PGE 變體 AN13,pi 從 6. 96 遷移至 4. 88SEQ ID NO :17 DNA 幾丁質(zhì)酶(ZDU)野生型SEQ ID NO 18 :蛋白質(zhì)幾丁質(zhì)酶(ZDU)野生型SEQ ID NO 19 DNA 幾丁質(zhì)酶變體 ZDU-6SEQ ID NO 20 :蛋白質(zhì)幾丁質(zhì)酶變體ZDU-6
SEQ ID NO 21 DNA 幾丁質(zhì)酶變體 ZDU-7SEQ ID NO 22 :蛋白質(zhì)幾丁質(zhì)酶變體ZDU-7SEQ ID NO 23 DNA β -葡糖苷酶野生型 ZTB-WTSEQ ID NO :24 :蛋白質(zhì)β -葡糖苷酶野生型ZTB-WTSEQ ID NO 25 DNA β -葡糖苷酶變體 ΖΤΒ-4SEQ ID NO :26 :蛋白質(zhì)β -葡糖苷酶變體ΖΤΒ-4SEQ ID NO 27 =DNA內(nèi)切葡聚糖酶野生型ZTC-WTSEQ ID NO 28 :蛋白質(zhì)內(nèi)切葡聚糖酶野生型ZTC-WTSEQ ID NO 29 =DNA 內(nèi)切葡聚糖酶變體 ZTC-5SEQ ID NO 30 :蛋白質(zhì)內(nèi)切葡聚糖酶變體ZTC-5發(fā)明詳沭本發(fā)明涉及用于提高真核宿主細(xì)胞分泌感興趣的多肽的方法,所述方法通過(guò)修飾多肽的氨基酸主鏈中一組相關(guān)蛋白質(zhì)特征的數(shù)值,使其落入對(duì)真核宿主中一種或多種蛋白質(zhì)特征而言的最適范圍內(nèi)或者變得更接近對(duì)真核宿主中一種或多種蛋白質(zhì)特征而言的最適值來(lái)實(shí)現(xiàn)。一個(gè)優(yōu)點(diǎn)是之前不被分泌或者僅以商業(yè)應(yīng)用沒(méi)有吸引力的低量分泌的、具有感興趣的功能性的蛋白質(zhì)現(xiàn)在由于被提高的分泌而變得可用于工業(yè)過(guò)程。另一優(yōu)點(diǎn)是因?yàn)樗O(shè)計(jì)的多肽已與生物量分離,所以多肽的下游加工和回收變得更加容易。在本文上下文中,蛋白質(zhì)特征是能夠通過(guò)計(jì)算源自蛋白質(zhì)氨基酸序列和DNA序列的特性。多肽的修飾在本文中被定義為導(dǎo)致多肽氨基酸序列改變的任何事件。修飾被理解為一種或多種修飾。修飾可以通過(guò)在多肽主鏈中引入(插入)、取代或去除(缺失)一個(gè)或多個(gè)氨基酸來(lái)實(shí)現(xiàn)。在本文上下文中,術(shù)語(yǔ)“分泌”是指細(xì)胞外培養(yǎng)基中多肽的出現(xiàn),所述細(xì)胞外培養(yǎng)基典型地是生長(zhǎng)培養(yǎng)基或生產(chǎn)培養(yǎng)基。被分泌的多肽不含生物量??梢酝ㄟ^(guò)本領(lǐng)域已知的方法,包括活性測(cè)定法(活性單位)、比活性(每重量蛋白質(zhì)的單位)、定量PAGE分析、定量質(zhì)譜和抗體測(cè)定法,來(lái)測(cè)量分泌水平。表述“多肽分泌的提高”是指細(xì)胞的細(xì)胞外培養(yǎng)基中被分泌的多肽量的增加。提高可以通過(guò)如下事實(shí)反映通常不被分泌的多肽例如細(xì)胞內(nèi)多肽變得被分泌。提高也可以在于如下事實(shí)(例如因?yàn)楹行盘?hào)序列而)預(yù)期要被分泌、但是未被分泌的多肽,變得被分泌。提高當(dāng)然常常參照相同的宿主遺傳背景和相同的培養(yǎng)或發(fā)酵條件而被測(cè)量。在這些情況下,例如聚丙烯酰胺凝膠中在提高之前無(wú)可見(jiàn)條帶處蛋白質(zhì)條帶的出現(xiàn)表明提高的分泌?;蛘撸岣咭部梢酝ㄟ^(guò)下述事實(shí)反映以非常少量分泌的多肽顯示出增加的分泌水平。在一個(gè)實(shí)施方案中,通過(guò)測(cè)量細(xì)胞外培養(yǎng)基中多肽的活性來(lái)測(cè)定被分泌的多肽量。與提高之前的狀態(tài)相比,細(xì)胞外培養(yǎng)基中的活性可增加至少5%,至少10%,至少15%或至少20 % ο優(yōu)選地,活性增加至少25 %,至少30 %,至少35 %或至少40 %。在一個(gè)更優(yōu)選的實(shí)施方案中,活性增加至少45 %,至少50 %,至少60 %,至少70 %,至少80 %,至少90 %,至少100%,至少200%,至少500%或至少1000%。活性可從在細(xì)胞外培養(yǎng)基中無(wú)活性增加至有一些活性。任何真核細(xì)胞可在本發(fā)明的方法中使用。優(yōu)選地,真核細(xì)胞是哺乳動(dòng)物、昆蟲、植物、真菌或藻類細(xì)胞。優(yōu)選的哺乳動(dòng)物細(xì)胞包括例如中國(guó)倉(cāng)鼠卵巢(CHO)細(xì)胞、COS細(xì)胞、293細(xì)胞、PeK6細(xì)胞和雜交瘤。優(yōu)選的昆蟲細(xì)胞包括例如Sf9和Sf21細(xì)胞及其衍生物。更優(yōu)選地,真核細(xì)胞是真菌細(xì)胞,即酵母細(xì)胞,例如Candida、Hansenula、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces 或 Yarrowia 菌株。更優(yōu)選地來(lái)自Kluyveromyces lactis、S.cerevisiae、Hansenula polymorpha、Yarrowia lipolytica 和Pichia pastoris,或絲狀真菌細(xì)胞。最優(yōu)選地,真核細(xì)胞是絲狀真菌細(xì)胞?!敖z狀真菌”包括(如 Hawksworth et al.,In,Ainsworth and Bisby 丨 sDictionary of The Fungi,8th edition,1995,CAB International, UniversityPress, Cambridge, UK所定義的)Eumycota和Oomycota亞門的所有絲狀形式。絲狀真菌的特征是由幾丁質(zhì)、纖維素、葡聚糖、殼聚糖、甘露聚糖和其它復(fù)合多糖組成的菌絲壁。營(yíng)養(yǎng)生長(zhǎng)通過(guò)菌絲伸長(zhǎng)進(jìn)行,并且碳代謝是專性需氧的。絲狀真菌菌株包括但不限于 Acremonium、Agaricus、Aspergillus、Aureobasidium、Chrysosporium、CoprinusΛCryptococcus、Fi Iibasidium、Fusarium、Humicola、Magnaporthe、Mucor、MyceIiophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Panerochaete、Pleurotus、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium 和Trichoderma 的菌株。優(yōu)選的絲狀真菌細(xì)胞屬于Aspergillus、Chrysosporium、Penicillium、Talaromyces 或 Trichoderma 屬的種,最優(yōu)選地屬于 Aspergillus niger、Aspergillusawamoriλ Aspergillus foetidus、Aspergillus sojae、Aspergillus fumigatus、Talaromyces emersonii、Aspergillus oryzae、Chrysosporium lucknowense、Trichodermareesei或Penicillium chrysogenum的種。當(dāng)根據(jù)本發(fā)明的宿主細(xì)胞是Aspergillus宿主細(xì)胞時(shí),宿主細(xì)胞優(yōu)選地是CBS513. 88或其衍生物。絲狀真菌的若干菌株是公眾能夠容易地從大量培養(yǎng)物保藏機(jī)構(gòu)例如AmericanType Culture Collection (ATCC)、Deutsche Sammlung von Mikroorganismenund Zellkulturen GmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)和Agricultural Research Service Patent Culture Collection, Northern RegionalResearch Center (NRRL)獲得的,Aspergillus niger CBS 513. 88、Aspergillus oryzaeATCC 20423、IFO 4177、ATCC1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892,P. chrysogenum CBS 455.95, Penicillium citrinum ATCC 38065,Penicillium、chrysogenum P2, Talaromyces emersonii CBS 124. 902, Acremonium chrysogenum ATCC36225 或 ATCC 48272, Trichoderma reesei ATCC 26921 或 ATCC 56765 或 ATCC 26921,Aspergillus sojae ATCCl 1906, Chrysosporium lucknowense ATCC44006 及其衍生物。在本發(fā)明的一個(gè)實(shí)施方案中,使用A. niger或K. lactis。在一個(gè)實(shí)施方案中,真核細(xì)胞是其中通過(guò)重組技術(shù)生產(chǎn)多肽的宿主細(xì)胞。用于轉(zhuǎn)化或轉(zhuǎn)染宿主細(xì)胞的合適方法可見(jiàn)于Sambrook, et al. (Molecular Cloning ALaboratory Manual,2nd, ed. Cold Spring Harbor Laboratory, Cold Spring HarborLaboratory Press, Cold Spring Harbor, NY,1989), Davis et al. , Basic Methods inMolecular Biology (1986)和其它實(shí)驗(yàn)室手冊(cè)。因此,本發(fā)明還涉及用于生產(chǎn)感興趣的多肽的方法,所述方法如下進(jìn)行對(duì)感興趣的多肽應(yīng)用根據(jù)本發(fā)明的用于提高多肽分泌的方法,并通過(guò)重組技術(shù)生產(chǎn)根據(jù)本發(fā)明被修飾的多肽。本發(fā)明還涉及所述被重組生產(chǎn)的多肽。本發(fā)明還涉及能夠通過(guò)根據(jù)本發(fā)明的用于提高多肽分泌的方法而獲得的多肽;優(yōu)選地,所述多肽通過(guò)根據(jù)本發(fā)明的用于提高多肽分泌的方法獲得。 根據(jù)本發(fā)明的方法提高其分泌的感興趣的多肽可以是具有感興趣的生物活性的任何多肽。多肽可以是膠原或明膠,或其變體或雜種(hybrid)。多肽可以是任何抗體或其部分,抗原,凝血因子,酶,激素或激素變體,受體或其部分,調(diào)節(jié)蛋白,結(jié)構(gòu)蛋白,報(bào)告蛋白,或轉(zhuǎn)運(yùn)蛋白例如血清白蛋白,例如牛血清白蛋白和人血清白蛋白,或例如轉(zhuǎn)鐵蛋白,例如乳鐵蛋白,涉及分泌過(guò)程的蛋白質(zhì),涉及折疊過(guò)程的蛋白質(zhì),伴侶蛋白,肽氨基酸轉(zhuǎn)運(yùn)蛋白,糖基化因子,轉(zhuǎn)錄因子,合成肽或寡肽,其天然形式是細(xì)胞內(nèi)蛋白質(zhì)并且通過(guò)本領(lǐng)域已知的方法(例如與信號(hào)肽融合和與其天然形式已是分泌型的多肽融合)被分泌的蛋白質(zhì)。此類細(xì)胞內(nèi)蛋白質(zhì)可以是酶例如蛋白酶、神經(jīng)酰胺酶、環(huán)氧化物水解酶、氨肽酶、?;D(zhuǎn)移酶、醛縮酶、羥化酶、氨肽酶、脂肪酶。多肽可以是以其天然形式被細(xì)胞外分泌的酶。此類酶可屬于氧化還原酶、轉(zhuǎn)移酶、水解酶、裂合酶、異構(gòu)酶、連接酶、過(guò)氧化氫酶、纖維素酶、幾丁質(zhì)酶、角質(zhì)酶、脫氧核糖核酸酶、聚糖酶、酯酶的組。酶可以是糖酶,例如纖維素酶如內(nèi)切葡聚糖酶,β -葡聚糖酶,纖維二糖水解酶或β -葡糖苷酶,半纖維素酶或果膠分解酶如木聚糖酶,木糖苷酶,甘露聚糖酶,半乳聚糖酶,半乳糖苷酶,果膠甲基酯酶,果膠裂合酶,果膠酸裂合酶,內(nèi)切多聚半乳糖醛酸酶,外切多聚半乳糖醛酸酶,鼠李半乳糖醛酸酶,阿拉伯聚糖酶,阿拉伯呋喃糖苷酶(arabinofuranosidases),阿拉伯木聚糖水解酶,半乳糖醒酸酶,裂合酶,或淀粉酶;水解酶,異構(gòu)酶,或連接酶,磷酸酶如植酸酶,酯酶如脂肪酶,蛋白水解酶,氧化還原酶如氧化酶,轉(zhuǎn)移酶,或異構(gòu)酶。酶可以是植酸酶。酶可以是氨肽酶,天冬酰胺酶,淀粉酶,糖酶,羧肽酶,內(nèi)切蛋白酶,金屬蛋白酶,絲氨酸-蛋白酶接觸酶,幾丁質(zhì)酶,角質(zhì)酶,環(huán)糊精糖基轉(zhuǎn)移酶,脫氧核糖核酸酶,酯酶,α-半乳糖苷酶,β -半乳糖苷酶,葡萄糖淀粉酶,α-葡糖苷酶,β -葡糖苷酶,鹵素過(guò)氧化物酶(haloperoxidase),蛋白質(zhì)脫氨酶,轉(zhuǎn)化酶,漆酶,脂肪酶,甘露糖苷酶,變構(gòu)酶,氧化酶,果膠分解酶,過(guò)氧化物酶,磷脂酶,多酚氧化酶,核糖核酸酶,轉(zhuǎn)谷氨酰胺酶,或葡萄糖氧化酶,己糖氧化酶,單加氧酶。提高其分泌的多肽可以對(duì)宿主細(xì)胞是同源或異源的。同源多肽的一個(gè)合適的例子是被克隆進(jìn)Aspergillus niger中并由Aspergillus niger生產(chǎn)的Aspergillus niger蛋白質(zhì)。異源表達(dá)的合適例子包括例如來(lái)自E. coli或Bacillus的、被克隆進(jìn)絲狀真菌或酵母中并由絲狀真菌或酵母生產(chǎn)的細(xì)菌多肽,或例如來(lái)自?;蛏窖虻?、被克隆進(jìn)絲狀真菌或酵母中并由絲狀真菌或酵母生產(chǎn)的哺乳動(dòng)物蛋白質(zhì),或被克隆進(jìn)酵母并由酵母生產(chǎn)的絲狀真菌多肽,或被克隆進(jìn)另一真菌并由另一真菌生產(chǎn)的絲狀真菌蛋白質(zhì)。優(yōu)選地,針對(duì)在相關(guān)宿主細(xì)胞中的表達(dá),例如通過(guò)密碼子對(duì)優(yōu)化來(lái)優(yōu)化編碼多肽的核酸。密碼子對(duì)優(yōu)化是這樣一種方法其中編碼多肽的核苷酸序列已經(jīng)根據(jù)其密碼子使用(特別是使用的密碼子對(duì))而被修飾,以獲得編碼多肽的核苷酸序列被提高的表達(dá)和/或所編碼的多肽的提高的生產(chǎn)。密碼子對(duì)被定義為編碼序列中一組兩個(gè)相繼的三聯(lián)體(密碼子)。密碼子對(duì)優(yōu)化優(yōu)選地如W02008/000632中所述進(jìn)行。優(yōu)選地,被修飾的多肽的特異性與提高分泌之前基本相同。這表示例如底物特異性或結(jié)合特異性基本保留。在本文上下文中,術(shù)語(yǔ)“基本保留”表示大于60 %,大于65 %,大于70 %或大于75 %的特異性被保留。優(yōu)選地,大于80 %、85 %或90 %的特異性被保留。 更優(yōu)選地,大于95%、96 %、97%、98%或99%的特異性被保留。最優(yōu)選地,大于95 %、96 %、97 %、98 %或99 %的特異性被保留。根據(jù)本發(fā)明的方法,細(xì)胞外培養(yǎng)基中的活性水平增加,這是提高的分泌的指征。然而,被修飾的多肽的比活性并非必須增加,只要其不減少即可。因此,比活性優(yōu)選地與分泌提高之前基本相同或更高。在一個(gè)優(yōu)選的實(shí)施方案中,比活性與提高之前基本相同。在本文上下文中,短語(yǔ)“基本相同的活性水平”是指與親本多肽的活性水平相差小于15%,優(yōu)選地小于12%或小于10%,更優(yōu)選地小于8%,小于6%或小于4%的活性水平。在本文上下文中,術(shù)語(yǔ)“多肽”和“蛋白質(zhì)”可互換使用。任何類型的多肽的分泌都可以通過(guò)本發(fā)明的方法被提高。在一個(gè)優(yōu)選的實(shí)施方案中,多肽是本文之前引用的列表之一 O根據(jù)本發(fā)明的方法,氨基酸主鏈中一組相關(guān)蛋白質(zhì)特征的數(shù)值被修飾,使其落入對(duì)真核宿主中一種或多種蛋白質(zhì)特征而言的最適范圍內(nèi),或者變得更接近對(duì)真核宿主中一種或多種蛋白質(zhì)特征而言的最適值。經(jīng)修飾的多肽和參照多肽之間蛋白質(zhì)特征的改變量可以通過(guò)兩種方式定義相對(duì)提聞(RI)和標(biāo)準(zhǔn)化的相對(duì)提聞(RIn)。蛋白質(zhì)特征的RI通過(guò)蛋白質(zhì)特征與最適值的絕對(duì)偏差(D)來(lái)定義RI = (Deef-Dpfo)/Deef,其中D = Fpoi-FoptI, Fpoi是作為參照或PFO的、感興趣的蛋白質(zhì)特征的數(shù)值,F(xiàn)qpt是最適特征數(shù)值。RIn通過(guò)標(biāo)準(zhǔn)化的偏差(Dn)來(lái)定義,以表明何種特征是實(shí)質(zhì)上重要的。Dn要考慮特征數(shù)值的上界(UB)和下界(LB)(見(jiàn)表I)。RIn — Dn, REF-DN, PF0,其中Fpra > Fopt 時(shí) Dn = (Fpoi-Fopt) / (UB-Fopt)Fpoi < Fopt 時(shí) Dn = (Fpoi-Fopt) / (LB-Fopt)。根據(jù)本發(fā)明的方法,對(duì)多肽主鏈進(jìn)行修飾。在本文上下文中,術(shù)語(yǔ)“主鏈”是指當(dāng)氨基酸通過(guò)肽鍵連接在一起并形成共價(jià)連接的氨基酸序列時(shí)形成的規(guī)則結(jié)構(gòu)。在本發(fā)明中,優(yōu)選地成熟多肽的主鏈被修飾。在本發(fā)明的上下文中,“成熟多肽”在本文中被定義為在翻譯和任何翻譯后修飾(例如N-端加工、C-端截短、糖基化、磷酸化等等)之后為最終功能形式的多肽。修飾前的多肽被稱作親本或參照或野生型多肽,以區(qū)別于由其產(chǎn)生的經(jīng)修飾的多肽。術(shù)語(yǔ)“親本多肽”、“野生型多肽”和“參照多肽”在本文中可互換使用。當(dāng)多肽是嵌合多肽(即與有效分泌的多肽、優(yōu)選地所述宿主細(xì)胞的固有多肽的翻譯融合物)時(shí),整個(gè)嵌合多肽可以根據(jù)本發(fā)明被修飾。當(dāng)嵌合多肽包含有效分泌的多肽作為與感興趣的多肽融合的前導(dǎo)多肽時(shí),感興趣的多肽優(yōu)選地被修飾。如本領(lǐng)域技術(shù)人員所已知的,由于成熟期間的加工錯(cuò)誤,有可能成熟多肽的N-端以及成熟多肽的C-端都是異源的。特別地,此類加工錯(cuò)誤可在多肽的過(guò)表達(dá)時(shí)發(fā)生。另外,外切蛋白酶活性可能得到異質(zhì)性。異質(zhì)性發(fā)生的程度還取決于使用的宿主和發(fā)酵方案。此類N-端和C-端加工的人工制品(artefacts)可能導(dǎo)致與預(yù)期的成熟多肽相比更短的多肽或更長(zhǎng)的多肽。在本發(fā)明的一個(gè)實(shí)施方案中,方法包括(i)測(cè)定對(duì)真核宿主中一種或多種蛋白質(zhì)特征而目的最適范圍和最適值,和(ii)測(cè)定所述真核宿主中一組相關(guān)蛋白質(zhì)特征,當(dāng)多肽的氨基酸主鏈中一種或多種這些相關(guān)特征被修飾時(shí),所述特征會(huì)提高所述真核宿主分泌所述多肽,和(iii)修飾所述相關(guān)蛋白質(zhì)特征的數(shù)值,使其落入(i)中測(cè)定的所述最適范圍內(nèi),或者更接近(i)中測(cè)定的最適值,其中(i)和(ii)可以按照任何順序進(jìn)行??梢允褂萌魏畏椒y(cè)定一組相關(guān)特征。在一個(gè)實(shí)施方案中,如下測(cè)定用于提高多肽分泌的一組相關(guān)特征(i)收集或創(chuàng)建數(shù)據(jù)組S,所述數(shù)據(jù)組S含有某真核宿主中合適量蛋白質(zhì)的分泌水平,以及這些蛋白質(zhì)的氨基酸和DNA序列。數(shù)據(jù)組S可含有分泌型蛋白質(zhì)(S+)。優(yōu)選地,數(shù)據(jù)組S還含有非分泌型蛋白質(zhì)(S-)。例如,可以在A. niger中表達(dá)所有預(yù)測(cè)的分泌型蛋白質(zhì)(Tsang et al. , 2009,Fungal Genetics and Biology, 46 :S153_160)。分泌型的蛋白質(zhì)屬于S+組,而非分泌型的蛋白質(zhì)屬于S-組??梢允褂萌魏畏椒y(cè)量分泌水平?;蛘撸琒-組可含有文獻(xiàn)中已知的真核宿主中的非分泌型蛋白質(zhì)。S中的蛋白質(zhì)對(duì)真核宿主可以是同源或異源的。(ii)針對(duì)數(shù)據(jù)組S中的所有蛋白質(zhì)計(jì)算蛋白質(zhì)特征(F)。F可源自這些蛋白質(zhì)的DNA序列和氨基酸序列;(iii)使用統(tǒng)計(jì)學(xué)分類方法選擇在ii)中計(jì)算的下述蛋白質(zhì)特征亞組(Fs),根據(jù)適當(dāng)定義的分類器性能標(biāo)準(zhǔn),所述蛋白質(zhì)特征亞組給出了在S+和S-之間區(qū)分的統(tǒng)計(jì)學(xué)分類器的最佳性能。Fs可源自DNA序列(Fs_DNA)和氨基酸序列(Fs_AA) 二者。Fs_AA中的蛋白質(zhì)特征是用于修飾從而提高相應(yīng)真核宿主中蛋白質(zhì)分泌的相關(guān)特征。因?yàn)閮?yōu)選地,成熟多肽的主鏈根據(jù)本發(fā)明的方法被修飾,所以蛋白質(zhì)特征優(yōu)選地由一組成熟蛋白質(zhì)計(jì)算??梢允褂帽绢I(lǐng)域已知的標(biāo)準(zhǔn)統(tǒng)計(jì)學(xué)分類方法,例如Linear DiscriminantCl assifier(LDC)> Quadratic Discriminant Classifier(QDC)> NearestMeanClassifier (NMC)、l_/k_Nearest Neighbour分類器、支持載體機(jī)器和決策樹等等(Webb, Statistical Pattern Recognition, 2nd ed, John Wiley & sons)。應(yīng)用此類方法時(shí),數(shù)據(jù)組S可以被分成訓(xùn)練數(shù)據(jù)組和核實(shí)數(shù)據(jù)組,并可使用本領(lǐng)域公知的核實(shí)流程(例如10-倍交叉核實(shí))??梢允褂帽绢I(lǐng)域已知的任何分類器性能度量,例如特異性、靈敏度、準(zhǔn)確度、精確、度和接受者運(yùn)行特性(Receiver Operation Characteristics, ROC)曲線下的面積。可以使用任何合適的方法測(cè)定蛋白質(zhì)特征的最適范圍或最適值。在一個(gè)實(shí)施方案中,如下測(cè)定真核宿主的蛋白質(zhì)特征的最適范圍或最適值i)收集或創(chuàng)建數(shù)據(jù)組S,所述數(shù)據(jù)組S含有某真核宿主中合適量蛋白質(zhì)的分泌水平,以及這些蛋白質(zhì)的氨基酸和DNA序列。數(shù)據(jù)組S可含有分泌型蛋白質(zhì)(S+)。優(yōu)選地,數(shù)據(jù)組S還含有非分泌型蛋白質(zhì)(S-)。例如,可以在A. niger中表達(dá)所有預(yù)測(cè)的分泌型蛋白質(zhì)(Tsang et al. , 2009,Fungal Genetics and Biology, 46 :S153_160)。分泌型的蛋白質(zhì)屬于S+組,而非分泌型的蛋白質(zhì)屬于S-組??梢允褂萌魏畏椒y(cè)量分泌水平?;蛘撸琒-組可含有文獻(xiàn)中已知的真核宿主中的非分泌型蛋白質(zhì)。S中的蛋白質(zhì)對(duì)真核宿主可以是同源或異源的。ii)針對(duì)數(shù)據(jù)組S中的所有蛋白質(zhì)計(jì)算蛋白質(zhì)特征(F)。F可源自這些蛋白質(zhì)的DNA序列和氨基酸序列; iii)測(cè)定針對(duì)相應(yīng)真核宿主的每種特征的最適值(F_opt)。也可以通過(guò)計(jì)算由S+計(jì)算的每種蛋白質(zhì)特征集中趨勢(shì)的度量,來(lái)獲得最適值。可以使用集中趨勢(shì)的任何度量,例如幾何平均,調(diào)和平均,算術(shù)平均,修剪平均,最常見(jiàn)值(most frequent value)和中位數(shù)。針對(duì)集中趨勢(shì)所計(jì)算的度量是相應(yīng)真核宿主特征的最適值?;蛘?,擬合由S+計(jì)算的每種蛋白質(zhì)特征的概率分布,使得特征數(shù)值的分布由所選擇的概率分布良好地描述??梢允褂萌魏胃怕史植?,例如可以使用正態(tài)分布、指數(shù)分布或?qū)?shù)正態(tài)分布。概率分布的均值是相應(yīng)真核宿主特征的最適值。iv)測(cè)定針對(duì)相應(yīng)真核宿主的每種特征的最適范圍考慮僅含分泌型蛋白質(zhì)的S+組,蛋白質(zhì)特征最適范圍的下界被定義為對(duì)應(yīng)于由S+計(jì)算的蛋白質(zhì)特征的0. 3-、0. 2_、0. 15或優(yōu)選地0. 10-和0. 05-分位數(shù)。此處數(shù)值0. 3,0. 2,0. 15等是指累積概率。對(duì)應(yīng)于某一累積概率的分位數(shù)可以通過(guò)任何統(tǒng)計(jì)學(xué)方法計(jì)算,例如使用Statistical Toolbox,Matlab R2007a(The Mathworks Inc)的分位數(shù)功能計(jì)算。蛋白質(zhì)特征最適范圍的上界被定義為對(duì)應(yīng)于由S+計(jì)算的蛋白質(zhì)特征的0. 7-,0. 8-,0. 85或優(yōu)選地0. 90-和0. 95-分位數(shù)?;蛘?,考慮到整個(gè)數(shù)據(jù)組S既含有分泌型蛋白質(zhì)又含有非分泌型蛋白質(zhì),蛋白質(zhì)特征最適范圍的下界可以被定義為下述蛋白質(zhì)特征數(shù)值低于所述數(shù)值時(shí)S中優(yōu)選地90%或95%的蛋白質(zhì)是非分泌型的;蛋白質(zhì)特征的最適范圍的上界被定義為下述蛋白質(zhì)特征數(shù)值高于所述數(shù)值時(shí)S中70%、80%、85%、優(yōu)選地90%或95%的蛋白質(zhì)是非分泌型的。相關(guān)特征的組和最適范圍與最適值可在宿主細(xì)胞與宿主細(xì)胞之間變化。對(duì)A. niger而言,將被修飾以提高蛋白質(zhì)分泌的相關(guān)蛋白質(zhì)特征(Fs_AA)包括但不限于堿性氨基酸頻率,極性氨基酸頻率,非極性氨基酸頻率,微小氨基酸頻率,小氨基酸頻率,帶電荷氨基酸頻率,(pH 7.2下)凈電荷,等電點(diǎn),天冬酰胺、精氨酸、異亮氨酸、半胱氨酸、組氨酸、谷氨酸、纈氨酸、賴氨酸、甘氨酸、蘇氨酸和亮氨酸的頻率,(通過(guò)Garnier計(jì)算的)轉(zhuǎn)變,通過(guò)EPESTFIND計(jì)算的PEST基序,針對(duì)pi的局部特征(LF)值,特別是LFl和LF6,針對(duì)Gravy評(píng)分的LF值,特別是LF2和LF4,針對(duì)aroma評(píng)分的LF值,特別是LF3、LF4和LF6,原子組成w. r. t.硫(S)和定位特征(例如通過(guò)MultiLoc定位預(yù)測(cè)工具或預(yù)測(cè)的)。凈電荷具有與質(zhì)子電荷相同的單位。每段長(zhǎng)度的凈電荷/凈正電荷/凈負(fù)電荷/總電荷具有與質(zhì)子電荷相同的單位,但是針對(duì)多肽的長(zhǎng)度被標(biāo)準(zhǔn)化。多肽的凈電荷在本文中如下估計(jì)假設(shè)所有氨基酸均完全暴露于溶液,相鄰的肽對(duì)任何給定氨基酸的PK沒(méi)有影響,并且組成的氨基酸以及N-端和C-端未經(jīng)修飾??梢允褂貌煌某绦蛴?jì)算具體pH(默認(rèn)pH = 7. 2)下多肽的凈電荷,例如使用BioinformaticsToolbox of Matlab (R2008b 版)的 “isoelectric” 功能,或者使用可在 http://emboss.sourceforge. net/ 獲得的 EMBOSS Explorer 的 “pepstats,,功能。
每段長(zhǎng)度的凈電荷在本文中被定義為多肽的凈電荷除以多肽的長(zhǎng)度。每段長(zhǎng)度的凈正電荷在本文中被定義為如下計(jì)算的多肽凈正電荷將pH 7. 2下多肽N-端與所有賴氨酸、精氨酸和組氨酸殘基的部分電荷總和在一起。每段長(zhǎng)度的凈正電荷通過(guò)用多肽的凈正電荷除以多肽的長(zhǎng)度來(lái)測(cè)定。每段長(zhǎng)度的凈負(fù)電荷被定義為如下計(jì)算的多肽凈負(fù)電荷將pH 7. 2下多肽C-端與所有天冬氨酸、谷氨酸、半胱氨酸和酪氨酸殘基的部分電荷總和在一起。每段長(zhǎng)度的凈負(fù)電荷通過(guò)用多肽的凈負(fù)電荷除以多肽的長(zhǎng)度來(lái)測(cè)定。每段長(zhǎng)度的總電荷在本文中被定義為如下計(jì)算的多肽總電荷從多肽的凈正電荷(正數(shù))中減去多肽的凈負(fù)電荷(負(fù)數(shù))。每段長(zhǎng)度的總電荷通過(guò)用多肽的總電荷除以多肽長(zhǎng)度來(lái)測(cè)定。Gravy評(píng)分在本文中被定義為Kyte and Doolittle (1982)所定義的多肽疏水性指數(shù)(hydropathy index)。每種氨基酸具有4. 6和-4. 6之間的疏水性評(píng)分。4. 6被指定為最疏水的蛋白質(zhì),-4. 6被指定為最親水的蛋白質(zhì)。多肽的GRAVY評(píng)分優(yōu)選地根據(jù)Kyte andDoolittle (1982)測(cè)定。Kyte, J. and Doolittle, R. 1982A simple method for displayingthe hydropathic character of a protein. J. Mol. Biol. ,157 :105-132.多肽的Aroma評(píng)分在本文中如下計(jì)算將多肽中三種芳香族氨基酸Phe、Tyr和Trp的頻率總和在一起。脂肪族指數(shù)在本文中被定義為被脂肪族側(cè)鏈占據(jù)的相對(duì)體積。多肽的脂肪族指數(shù)(Al)根據(jù) Ikai (1980) AI = f_Ala+a f_Val+b (f_Ile+f_Leu)式計(jì)算。氨基酸丙氨酸、纈氨酸、異亮氨酸和亮氨酸具有脂肪族側(cè)鏈。其中a是纈氨酸側(cè)鏈的相對(duì)體積(a = 2. 9),b是亮氨酸和異亮氨酸側(cè)鏈的相對(duì)體積(b = 3. 9)。f_Ala、f_Val、f_Ile和f_Leu分別是多肽中丙氨酸、繳氨酸、異亮氨酸和亮氨酸的頻率。Ikai, A. J. 1980ThermostabiIity andaliphatic index of globular proteins. J. Biochem. ,88 :1895-1898對(duì)GRAVY和脂肪族指數(shù)而言,也可以參考ProteinIdentification and AnalysisTools on the ExPASy Server ;Gasteiger E. , Hoogland C. , Gattiker A. , Duvaud S.,Wilkins M. R. , Appel R. D. , Bairoch A. (In) John M. Walker (ed) The ProteomicsProtocols Handbook, Humana Press (2005). pp. 571-607。基于物理-化學(xué)特性的氨基酸種類酸性D,E脂肪族A,I,L,V芳香族F,W,Y堿性H,K,R帶電D,E,H,K,R
非極性A,C,F(xiàn),G,I,L,M,P,V,W,Y^^:D,E,H,K,N,Q,R,S,T小(small)A, C, D, G, N, P, S, T, V微小(tiny)A, C, T, S, G基于序列中單元素(single element)組成的特征由元素i的頻率fi計(jì)算。頻率和分?jǐn)?shù)在本文中可互換使用。頻率被定義為序列中存在的次數(shù)ni和元素i除以序列中元素的總數(shù)。序列中的單元素(例如氨基酸)可與多元素(例如微小、酸性)組合。多肽中氨基酸殘基的表面可達(dá)性(surface accessiblity)可以通過(guò)本領(lǐng)域中已知的任何方法測(cè)定。如果多肽具有在實(shí)驗(yàn)中溶解的結(jié)構(gòu),則溶劑可達(dá)的表面積(ASA)以人2為單位給出,并且通過(guò)將蛋白質(zhì)表面的水分子尺寸滾成球形來(lái)計(jì)算[I]。然后將ASA轉(zhuǎn)化成相對(duì)表面積(RSA),所述相對(duì)表面積被計(jì)算為相對(duì)于側(cè)翼是甘氨酸[2]或丙氨酸[3]的三肽中心殘基的最大可能暴露,多肽鏈中給定氨基酸殘基的ASA。RSA大于閾值α的殘基(RSA >= α ,O <= α <= I)稱作被暴露,RSA小于閾值β的殘基(RSA <= α ,0 <= β <=1)稱作被掩埋。優(yōu)選地,α > = O. 25,更優(yōu)選地α = O. 25。優(yōu)選地β < = O. 25,更優(yōu)選地β=O. 25。如果不能獲得多肽的結(jié)構(gòu),也可以從多肽的氨基酸序列預(yù)測(cè)表面可達(dá)性。文獻(xiàn)中科獲得不同的方法,由多肽的氨基酸序列預(yù)測(cè)表面可達(dá)性,例如[3]、[4]、[5]和[6]中所述。優(yōu)選地,使用[4]中描述的所謂NetSurfP方法預(yù)測(cè)RSA,所述方法可以在線訪問(wèn)http:"www. cbs. dtu. dk/services/NetSurfP/。在本申請(qǐng)中,由成熟蛋白質(zhì)的氨基酸序歹[J預(yù)測(cè)表面可達(dá)性。被暴露和掩埋的殘基的定義與前文相同。[I]Connolly M!Analytical molecular surface calculation. Journal ofApplied Crystallography 1983,16(5) :548-558.[2]Chothia C The nature of the accessible and buried surfaces inproteins. J Mol Biol 1976,105(1) :1-12.[3]Ahmad S, Gromiha MM, Sarai AReal value prediction of solventaccessibility from amino acid sequence. Proteins 2003,50(4) :629-635.[4]Bent Petersen et al A generic method for assignment of reliabilityscores applied to solvent accessibility predictions. BMC Structural Biology2009,9 51.[5]Dor 0,Zhou YReal-SPINE an integrated system of neural networks forreal-value prediction of protein structural properties. Proteins 2007,68 (I)76-81.[6]Faraggi E,Xue B,Zhou YImproving the prediction accuracy of residuesolvent accessibility and real-value backbone torsion angles of proteinsby guided-1earning through a two-layer neural network. Proteins 2009,74(4)847-856.對(duì)A. niger而言的最適值和范圍展示于表I中。表IA蛋白質(zhì)特征的下界(LB),上界(UB)和最適值(Fopt)權(quán)利要求
1.用于提高真核宿主細(xì)胞對(duì)感興趣的多肽的分泌的方法,所述方法包括修飾所述多肽的氨基酸主鏈中一組相關(guān)的蛋白質(zhì)特征的數(shù)值,使其落入對(duì)所述真核宿主中一種或多種蛋白質(zhì)特征而言的最適范圍內(nèi),或者更接近對(duì)所述真核宿主中一種或多種蛋白質(zhì)特征而言的最適值。
2.根據(jù)權(quán)利要求I所述的方法,所述方法包括 (i)測(cè)定對(duì)所述真核宿主中一種或多種蛋白質(zhì)特征而言的最適范圍和最適值,和( )測(cè)定所述真核宿主中一組相關(guān)蛋白質(zhì)特征,當(dāng)所述多肽的氨基酸主鏈中這些相關(guān)特征中的一種或多種被修飾時(shí),所述特征會(huì)提高所述真核宿主分泌所述多肽,和 (iii)修飾所述相關(guān)蛋白質(zhì)特征的數(shù)值,使其落入(i)中測(cè)定的所述最適范圍內(nèi),或者更接近⑴中測(cè)定的最適值,其中⑴和(ii)可以按照任何順序進(jìn)行。
3.根據(jù)權(quán)利要求I或2所述的方法,其中,這樣來(lái)測(cè)定一組相關(guān)特征 a.收集或創(chuàng)建數(shù)據(jù)組S,所述數(shù)據(jù)組S含有某真核宿主中合適量蛋白質(zhì)的分泌水平,以及這些蛋白質(zhì)的氨基酸序列和DNA序列 b.針對(duì)數(shù)據(jù)組S中的所有蛋白質(zhì)計(jì)算蛋白質(zhì)特征(F); c.使用統(tǒng)計(jì)學(xué)分類方法選擇下述蛋白質(zhì)特征亞組(Fs),根據(jù)適當(dāng)定義的分類器性能標(biāo)準(zhǔn),所述蛋白質(zhì)特征亞組給出了在分泌型蛋白質(zhì)S+和非分泌型蛋白質(zhì)S-之間區(qū)分的統(tǒng)計(jì)學(xué)分類器的最佳性能。
4.根據(jù)權(quán)利要求3所述的方法,其中所述蛋白質(zhì)特征是從一組成熟蛋白質(zhì)中計(jì)算的。
5.根據(jù)權(quán)利要求1-4中任一項(xiàng)的方法,其中這樣來(lái)測(cè)定對(duì)真核宿主而言多種蛋白質(zhì)特征的最適范圍或最適值 a.收集或創(chuàng)建數(shù)據(jù)組S,所述數(shù)據(jù)組S含有某真核宿主中合適量蛋白質(zhì)的分泌水平,以及這些蛋白質(zhì)的氨基酸序列和DNA序列 b.針對(duì)數(shù)據(jù)組S中的所有蛋白質(zhì)計(jì)算蛋白質(zhì)特征(F); c.如下測(cè)定針對(duì)真核宿主的每種特征的最適值(F_opt):擬合由S+計(jì)算的每種蛋白質(zhì)特征的概率分布,使得所述特征數(shù)值的分布由所選擇的概率分布良好地描述, d.測(cè)定針對(duì)所述真核宿主的每種特征的最適范圍。
6.用于提高真核宿主分泌多肽的方法,所述方法包括 i)針對(duì)所述多肽計(jì)算蛋白質(zhì)特征, )測(cè)定所述多肽的一種或多種蛋白質(zhì)特征是否處于對(duì)所述真核宿主而言的最適范圍夕卜,或者大幅偏離對(duì)所述真核宿主而言的最適值, iii)合理地改變所述多肽的氨基酸序列,使得所述多肽的一種或多種Fs_AA的數(shù)值落入最適范圍內(nèi)或者朝向所述最適值遷移合適的量,所述改變由RI或RIn定義,其中由RI或RIn定義的所述改變優(yōu)選地大于10 %、15 %、20 %,最優(yōu)選地大于30 %。
7.根據(jù)權(quán)利要求1-6中任一項(xiàng)所述的方法,其中所述多肽的主鏈在一種或多種以下特征方面被修飾氨基酸數(shù)量,分子量,等電點(diǎn),特定PH下的凈電荷,GRAVY評(píng)分,脂肪族指數(shù),不穩(wěn)定性指數(shù),組成特征,C、H、N、O、S原子的原子組成,氨基酸頻率,二肽頻率,三肽頻率,酸性氨基酸頻率,脂肪族氨基酸頻率,芳香族氨基酸頻率,堿性氨基酸頻率,局部特征,定位特征,糖基化模式和帶電荷氨基酸頻率。
8.根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的方法,其中所述多肽的主鏈在一種或多種以下特征方面被修飾堿性氨基酸頻率,極性氨基酸頻率,非極性氨基酸頻率,微小氨基酸頻率,小氨基酸頻率,帶電荷氨基酸頻率,PH7. 2下的凈電荷,等電點(diǎn),Asn、Arg、lie、Cys、His、Gin、Val、Lys、Gly、Thr和Leu各自的頻率,定位特征,通過(guò)Garnier計(jì)算的轉(zhuǎn)變,通過(guò)EPESTFIND計(jì)算的PEST基序,針對(duì)pi的LF值,針對(duì)Gravy評(píng)分的LF值,針對(duì)aroma評(píng)分的LF值,硫(S)組成。
9.根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的方法,其中所述多肽的主鏈在一種或多種選自下組的特征方面被修飾pi,凈電荷,每段長(zhǎng)度的凈電荷,每段長(zhǎng)度的凈正電荷,每段長(zhǎng)度的凈負(fù)電荷,每段長(zhǎng)度的總電荷,gravy評(píng)分,aroma評(píng)分,脂肪族指數(shù),微小氨基酸頻率,小氨基酸頻率,極性氨基酸頻率,非極性氨基酸頻率,帶電荷氨基酸頻率,酸性氨基酸頻率,堿性氨基酸頻率,脂肪族氨基酸頻率,Ala、Arg、Asn、Asp、Cys、Gin、Glu、Gly、His、lie、Leu、Lys>Met、Phe> Pro、Ser、Thr、Trp> Tyr 和 Val 各自的頻率。
10.根據(jù)權(quán)利要求1-9中任一項(xiàng)所述的方法,其中所述多肽的主鏈在一種或多種選自下組的特征方面被修飾pl,凈電荷(pH7. 2),每段長(zhǎng)度的凈電荷(pH7. 2),每段長(zhǎng)度的凈正電荷(pH7. 2),每段長(zhǎng)度的總電荷(pH7. 2),脂肪族指數(shù),小氨基酸頻率,極性氨基酸頻率,非極性氨基酸頻率,帶電荷氨基酸頻率,氨基酸頻率,Arg、Gin、Glu、Lys、Phe和Thr各自的頻率。
11.根據(jù)權(quán)利要求1-9中任一項(xiàng)所述的方法,其中所述多肽的主鏈在一種或多種選自下組的特征方面被修飾糖基化位點(diǎn),gravy評(píng)分,極性氨基酸頻率,非極性氨基酸頻率,帶電荷氨基酸頻率,酸性氨基酸頻率,堿性氨基酸頻率,Glu、Lys和Thr各自的頻率。
12.根據(jù)權(quán)利要求1-11中任一項(xiàng)所述的方法,其中所述氨基酸主鏈的至少5%的氨基酸被修飾,更優(yōu)選地所述氨基酸主鏈的至少10%,進(jìn)一步更優(yōu)選地至少15%,進(jìn)一步更優(yōu)選地至少20%的氨基酸被修飾。
13.根據(jù)權(quán)利要求1-11中任一項(xiàng)所述的方法,其中所述氨基酸主鏈的至少5個(gè)氨基酸被修飾,更優(yōu)選地所述氨基酸主鏈的至少10個(gè)氨基酸、進(jìn)一步更優(yōu)選地至少15個(gè)氨基酸、進(jìn)一步更優(yōu)選地至少20個(gè)氨基酸、進(jìn)一步更優(yōu)選地至少25個(gè)氨基酸、進(jìn)一步更優(yōu)選地至少30個(gè)氨基酸被修飾。
14.根據(jù)權(quán)利要求1-13中任一項(xiàng)所述的方法,其中實(shí)現(xiàn)了相對(duì)于野生型參照蛋白質(zhì)的至少5%的F-評(píng)分提高,更優(yōu)選地實(shí)現(xiàn)了至少10%、進(jìn)一步更優(yōu)選地至少15%、進(jìn)一步更優(yōu)選地至少20%、進(jìn)一步更優(yōu)選地至少30%的提高,其中所述F-評(píng)分根據(jù)下式計(jì)算
15.根據(jù)權(quán)利要求1-14中任一項(xiàng)所述的方法,其中至少2、3、4或5種特征被修飾,更優(yōu)選地至少10種、進(jìn)一步更優(yōu)選地至少15種、進(jìn)一步更優(yōu)選地至少20種、進(jìn)一步更優(yōu)選地至少25種、進(jìn)一步更優(yōu)選地至少30種特征被修飾。
16.根據(jù)權(quán)利要求1-15中任一項(xiàng)所述的方法,其中至少2、3、4或5種特征被改善,更優(yōu)選地至少10種、進(jìn)一步更優(yōu)選地至少15種、進(jìn)一步更優(yōu)選地至少20種、進(jìn)一步更優(yōu)選地至少25種、進(jìn)一步更優(yōu)選地至少30種特征被改善,而優(yōu)選地少于10種、進(jìn)一步更優(yōu)選地少于5種、進(jìn)一步更優(yōu)選地少于4種特征被惡化。
17.根據(jù)權(quán)利要求1-16中任一項(xiàng)所述的方法,其中所述特征是初級(jí)特征。
18.根據(jù)權(quán)利要求I或17所述的方法,其中所述多肽的主鏈在一種或多種其它蛋白質(zhì)特征方面而被修飾。
19.根據(jù)權(quán)利要求1-18中任一項(xiàng)所述的方法,其中所述成熟多肽的主鏈被修飾。
20.根據(jù)權(quán)利要求1-19中任一項(xiàng)所述的方法,其中所述真核細(xì)胞是酵母細(xì)胞或絲狀真菌細(xì)胞。
21.根據(jù)權(quán)利要求1-20中任一項(xiàng)所述的方法,其中所述多肽是哺乳動(dòng)物多肽或細(xì)菌多肽。
22.根據(jù)權(quán)利要求1-21中任一項(xiàng)所述的方法,其中所述經(jīng)修飾的多肽的特異性基本保持與提高分泌之前相同。
23.根據(jù)權(quán)利要求1-22中任一項(xiàng)所述的方法,其中所述經(jīng)修飾的多肽的比活性基本保持與提高分泌之前相同。
24.根據(jù)權(quán)利要求1-23中任一項(xiàng)所述的方法,其中所述分泌的提高通過(guò)活性的提高來(lái)測(cè)量,并且其中細(xì)胞外培養(yǎng)基中的活性被提高至少5%。
25.根據(jù)權(quán)利要求1-24中任一項(xiàng)所述的方法,其中所述多肽是酶、膜蛋白、激素或受體。
26.用于生產(chǎn)感興趣的多肽的方法,所述方法包括對(duì)所述感興趣的多肽應(yīng)用根據(jù)權(quán)利要求1-25中任一項(xiàng)所述的方法,并且通過(guò)重組技術(shù)生產(chǎn)經(jīng)修飾的多肽。
27.通過(guò)根據(jù)權(quán)利要求26所述的方法獲得的多肽。
28.能夠根據(jù)權(quán)利要求26所述的方法獲得的多肽。
29.根據(jù)權(quán)利要求1-25中任一項(xiàng)獲得的經(jīng)修飾的多肽。
30.能夠根據(jù)權(quán)利要求1-25中任一項(xiàng)獲得的經(jīng)修飾的多肽。
全文摘要
本發(fā)明涉及用于提高蛋白質(zhì)產(chǎn)率的方法。所述方法包括修飾一組相關(guān)蛋白質(zhì)特征的數(shù)值,使其落入對(duì)真核宿主中一種或多種蛋白質(zhì)特征而言的最適范圍內(nèi),或者變得更接近對(duì)真核宿主中一種或多種蛋白質(zhì)特征而言的最適值。
文檔編號(hào)C12P21/02GK102741421SQ201080011463
公開日2012年10月17日 申請(qǐng)日期2010年3月8日 優(yōu)先權(quán)日2009年3月10日
發(fā)明者吳亮, 埃里克·皮特·洛斯, 簡(jiǎn)·米特斯卡·拉恩·范德, 約翰尼斯·安德列什·勞博斯, 諾爾·尼克拉斯·瑪利亞·伊麗莎白·佩吉·范, 赫爾曼·揚(yáng)·佩爾, 魯斯·帕拉尼克瓦 申請(qǐng)人:帝斯曼知識(shí)產(chǎn)權(quán)資產(chǎn)管理有限公司