專利名稱:用于靶向重組多肽的表達(dá)和控制其翻譯后修飾的一組序列的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及重組蛋白生產(chǎn)的領(lǐng)域,更具體地涉及生產(chǎn)下述重組多肽的方法,所述重組多肽在內(nèi)質(zhì)網(wǎng)(ER)和/或高爾基體(GA)中發(fā)生翻譯后修飾。本發(fā)明提供了可用于控制重組多肽的翻譯后修飾的工具,并且更普遍地提供了用于植物遺傳修飾的DNA操作工具。本發(fā)明還提供了涉及這些工具的重組多肽生產(chǎn)方法。
本發(fā)明的工具包括靶向信號,其允許重組多肽在其宿主細(xì)胞中合成期間分選至特定的亞細(xì)胞區(qū)室,并且還允許在所述亞細(xì)胞區(qū)室中對所述重組多肽進(jìn)行特定的設(shè)計。有利地,本發(fā)明允許例如提高重組多肽生產(chǎn)的產(chǎn)率,限制或防止重組多肽的免疫原性和獲得有治療活性的重組多肽,所述重組多肽是其天然對應(yīng)物的精確拷貝。
本發(fā)明尤其涉及植物制成藥物(plants made pharmaceutical,PMP)的再定向(reorientation)領(lǐng)域。
本發(fā)明還涉及通過利用與融合有靶向信號的單鏈可變片段(ScFv)的蛋白質(zhì)相互作用而對植物制成藥物進(jìn)行免疫靶向的領(lǐng)域。
本發(fā)明還涉及對參與植物制成藥物的翻譯后修飾的植物酶進(jìn)行再定向的領(lǐng)域。
本發(fā)明還涉及對參與植物制成藥物的翻譯后修飾的異源酶進(jìn)行再定向的領(lǐng)域。
現(xiàn)有技術(shù) 重組DNA技術(shù)使得能夠在宿主系統(tǒng)中生產(chǎn)異源重組蛋白。大部分早期工作指向在原核生物宿主中(主要在大腸桿菌(Escherichia coli)中)表達(dá)重組的治療性蛋白質(zhì)。原核生物作為生產(chǎn)系統(tǒng)的優(yōu)點(diǎn)是易于對其進(jìn)行遺傳操作、其快速生長以及重組蛋白的高水平表達(dá)和大規(guī)模發(fā)酵的可能性。
然而,一些翻譯后修飾(post-translational modification,PTM)在原核生物中可能不能進(jìn)行,所述翻譯后修飾包括信號肽切割、原肽(propeptide)加工、蛋白質(zhì)折疊、二硫鍵形成和糖基化。因此,在原核生物中生產(chǎn)的復(fù)雜的治療性蛋白質(zhì)并不總是被正確折疊或加工從而提供期望的生物活性水平。因此,微生物表達(dá)系統(tǒng)一般用于表達(dá)相對簡單的治療性蛋白質(zhì)如胰島素、干擾素或人生長激素,它們不需要折疊或大量的翻譯后加工就具有生物活性。
由于原核生物用于生產(chǎn)治療性蛋白質(zhì)的局限性,生物技術(shù)工業(yè)已經(jīng)致力于真核生物宿主,如哺乳動物細(xì)胞培養(yǎng)物、酵母、真菌、昆蟲細(xì)胞和轉(zhuǎn)基因動物。然而,這些生產(chǎn)系統(tǒng)可具有不同的缺點(diǎn)如昂貴的發(fā)酵、低產(chǎn)率、分泌問題、高運(yùn)行成本、難于按比例擴(kuò)大至大體積以及可能被病毒或朊病毒污染(Gomord等2004(參考文獻(xiàn)23))。
植物細(xì)胞和植物懸浮培養(yǎng)細(xì)胞可代表一種優(yōu)良的替代方案成本優(yōu)勢、無針對人的病原體污染(Gomord等2004(參考文獻(xiàn)23))。
但是,所有真核細(xì)胞的一個主要問題是不正確的轉(zhuǎn)錄后修飾(PTM)。
事實上,絕大部分治療性蛋白質(zhì)發(fā)生多種PTM,這是來自基因的遺傳信息指導(dǎo)功能性基因產(chǎn)物形成的最終步驟。
在本說明書中,術(shù)語“PTM”涵蓋了產(chǎn)生個體氨基酸殘基衍生物的共價修飾,例如糖基化(glycosylation)、磷酸化、甲基化、ADP-核糖基化、氧化和糖化(glycation);通過涉及多肽主鏈的反應(yīng)進(jìn)行的蛋白質(zhì)水解加工;以及非酶促修飾,如脫酰胺化、外消旋化和蛋白質(zhì)構(gòu)象的自發(fā)改變。
大部分PTM依賴于真核細(xì)胞中內(nèi)膜系統(tǒng)的存在。分泌途徑由內(nèi)質(zhì)網(wǎng)(ER)、高爾基體(GA)、液泡形成體、溶酶體區(qū)室、質(zhì)膜和細(xì)胞外介質(zhì)組成,如附
圖1中所示。最近的研究顯示,早期區(qū)室(ER和GA)可能由膜連續(xù)體(membrane continuum)組成(見圖1)。然而,對蛋白質(zhì)在ER中、ER和GA之間和高爾基體中的轉(zhuǎn)運(yùn)進(jìn)行的詳細(xì)研究顯示,蛋白質(zhì)被亞區(qū)室化到植物細(xì)胞中在酶方面不同的四個區(qū)域中(見圖1藍(lán)色、黃色、綠色和橙色區(qū)域)。
大部分治療性蛋白質(zhì)通過共翻譯插入ER腔中,然后通過GA轉(zhuǎn)運(yùn)至溶酶體區(qū)室、細(xì)胞外基質(zhì)或血流中,所述治療性蛋白質(zhì)包括血液蛋白質(zhì)、細(xì)胞因子、免疫球蛋白、結(jié)構(gòu)蛋白、(生長)激素、疫苗、酶和溶酶體蛋白質(zhì)。治療性蛋白質(zhì)的多數(shù)修飾發(fā)生在分泌途徑中,特別是在其早期區(qū)室中(ER和GA,見Gomord和Faye,2004(參考文獻(xiàn)21))。
例如,凝血因子IX是維生素K依賴性糖蛋白,其作為461個氨基酸的前體分子在ER中合成。為了獲得有生物活性的因子IX,該前體在ER和GA中發(fā)生大量的翻譯后修飾,包括信號肽和原肽的切割,二硫鍵形成,前12個谷氨酸殘基的γ-羧基化,天冬氨酸64的部分β-羥基化,天冬酰胺(Asn)157和Asn 167處的N-聯(lián)糖基化,絲氨酸(Ser)63、Ser 61、蘇氨酸(Thr)159、Thr 169、Thr 172和Thr 179處的O-聯(lián)糖基化,酪氨酸(Tyr)155的硫酸化,以及Ser 158的磷酸化。這是所觀察到的最復(fù)雜的治療性蛋白質(zhì)成熟之一。
更一般地,大部分治療性蛋白質(zhì)至少需要蛋白水解切割(proteolyticcleavage)和糖基化來實現(xiàn)其生物活性、藥物代謝動力學(xué)、穩(wěn)定性和溶解度。
真核細(xì)胞能夠?qū)崿F(xiàn)這些修飾中的大部分。然而,這些成熟更一般地是宿主系統(tǒng)特異性的。另外,翻譯后修飾在哺乳動物細(xì)胞和植物細(xì)胞中是不同的。在植物中,像在其它真核細(xì)胞中一樣,N-糖基化在ER中開始,將寡糖前體(Glc3Man9GlcNAc2)通過共翻譯添加至組成潛在N-糖基化序列Asn-X-Ser/Thr的特定天冬酰胺殘基上。一旦轉(zhuǎn)移到初生蛋白(nascentprotein)上并且該分泌型糖蛋白沿著分泌途徑被轉(zhuǎn)運(yùn),則寡糖前體發(fā)生多種成熟,包括在ER和GA中去除或添加糖殘基,如附圖2中所示。植物和哺乳動物的N-聚糖成熟僅在晚期GA中存在差異,這導(dǎo)致PMP的N-聚糖中缺少α-(1,6)-連接的巖藻糖、β-(1,4)-連接的半乳糖和唾液酸,以及存在平分型β-(1,2)-木糖和核心α-(1,3)-巖藻糖(見附圖2)。
在本文上下文中,非常重要的是能夠控制異源表達(dá)系統(tǒng)中的共翻譯成熟和翻譯后成熟。
對植物ER駐留蛋白(ER-resident protein)的結(jié)構(gòu)分析顯示,它們主要含有高甘露糖型的N-聚糖(Navazio等,1997(參考文獻(xiàn)41),1998(參考文獻(xiàn)42);Pagny等,2000(參考文獻(xiàn)49))。這些寡糖結(jié)構(gòu)是植物和哺乳動物共有的,并因此不具有免疫原性。該觀察提出了一種防止免疫原性殘基如β-(1,2)-木糖或α-(1,3)-巖藻糖與植物制成藥物(PMP)N-聚糖結(jié)合的策略。該策略在于在ER(即高爾基體囊膜上游)中儲存重組蛋白,在那里免疫原性糖-表位被添加至復(fù)雜的植物N-聚糖。首先顯示的是,在重組的可溶蛋白質(zhì)C端添加H/KDEL序列足以使其停留在植物ER中(Gomord等,1997(參考文獻(xiàn)24)、1999(參考文獻(xiàn)22)、Saint-Jore-Dupas等,2004(參考文獻(xiàn)57))。
使用相同的策略,我們將H/KDEL-ER停留序列與兩種不同抗體的抗體重鏈和輕鏈二者融合。這些抗體僅存在非免疫原性的高甘露糖型N-聚糖(Sriraman等,2004(參考文獻(xiàn)59);Petrucelli等,2006(參考文獻(xiàn)51)),表明基于聚糖成熟的非常有效的再循環(huán)受到位于ER和高爾基體順面(cis-Golgi)的酶限制,所述酶例如為α-甘露糖苷酶I(Nebenfuhr等,1999(參考文獻(xiàn)43))。因此,有可能通過與ER停留信號融合來防止免疫原性N-聚糖與PMP的結(jié)合。
相反,對于負(fù)責(zé)維持植物ER中與膜結(jié)合的蛋白質(zhì)的分子信號所知甚少。
事實上,僅很少的研究提供了C端雙賴氨酸基序(Barrieu和Chrispeels,1999(參考文獻(xiàn)3);Benghezal等2000(參考文獻(xiàn)4);McCartney等,2004(參考文獻(xiàn)35);Reyes等2006(參考文獻(xiàn)53))、跨膜結(jié)構(gòu)域(TMD)長度(Brandizzi等,2002a(參考文獻(xiàn)9)或富含芳香族氨基酸的ER回收信號(McCartney等,2004(參考文獻(xiàn)35))的作用。α-葡萄糖苷酶I是參與N-聯(lián)寡糖前體成熟的第一種酶,該酶在寡糖前體“整體(en block)”轉(zhuǎn)移至新生糖蛋白上后立即從寡糖前體上特異性去除遠(yuǎn)端的α-(1,2)-連接的葡萄糖殘基(見圖2)。這種II型膜蛋白的功能(以及因此其在ER中的定位)是關(guān)鍵性的。事實上在哺乳動物細(xì)胞中,其在新生兒中的缺乏誘發(fā)嚴(yán)重的全身性張力過低和畸形特征,在74日齡時達(dá)到致死的結(jié)果(De Praeter等,2000(參考文獻(xiàn)14))。
除糖基化外,向分泌途徑下游前進(jìn)的蛋白質(zhì)通常發(fā)生特定的蛋白水解加工,如靶向信號和調(diào)節(jié)肽的切割。如對N-糖基化而言,文獻(xiàn)中的近期論據(jù)提出,分泌途徑中的蛋白水解成熟在植物和哺乳動物細(xì)胞中是相似的。這些成熟對內(nèi)源及重組蛋白的加工均是必要的,但是它們也使得以高產(chǎn)率生產(chǎn)穩(wěn)定的、完整的多肽成為具有挑戰(zhàn)性的工作。這些蛋白水解成熟也取決于蛋白質(zhì)累積的亞細(xì)胞區(qū)室(Faye等,2005(參考文獻(xiàn)17))。
通過分泌途徑轉(zhuǎn)運(yùn)的許多植物蛋白質(zhì)首先作為前原蛋白(pre-proprotein)(在以下的說明書中也稱作“未經(jīng)翻譯后修飾的”)合成,其包含N端可切割的信號肽(或前區(qū),pre-region,將初生多肽鏈引導(dǎo)至內(nèi)質(zhì)網(wǎng)),和調(diào)節(jié)性原(多)肽(或原區(qū),pro-region,涉及在成熟蛋白質(zhì)轉(zhuǎn)運(yùn)到最終細(xì)胞目的地并加工之前的穩(wěn)定化、靶向、抑制和/或折疊)。通過信號肽酶去除其信號肽后,蛋白質(zhì)被釋放進(jìn)ER腔,從而被正確地裝配和折疊,然后轉(zhuǎn)運(yùn)至GA,并最終進(jìn)一步向下游轉(zhuǎn)運(yùn)到分泌系統(tǒng)的不同區(qū)室。
許多植物蛋白作為原蛋白離開ER,原區(qū)在其分泌途徑路徑的下游被蛋白水解切割。許多帶有C端或N端可切割分選信號的液泡蛋白都是這種情況,所述分選信號在蛋白質(zhì)轉(zhuǎn)運(yùn)至液泡期間或之后被特定的蛋白酶去除。具體地,存在于空泡和細(xì)胞壁中的Asn特異性半胱氨酸蛋白酶會參與多種分泌型蛋白質(zhì)的加工,所述分泌型蛋白質(zhì)包括種子儲藏蛋白如2S白蛋白和11S球蛋白,以及具有抗微生物或抗飼育劑/抗消化劑活性的蛋白質(zhì)如發(fā)病機(jī)制相關(guān)蛋白質(zhì)、甲殼酶、葡聚糖酶、凝集素和創(chuàng)傷誘導(dǎo)型蛋白酶抑制因子。在哺乳動物細(xì)胞中,多種分泌蛋白首先作為無活性的原蛋白前體合成,接著在通過分泌途徑移動時被可溶的或與膜結(jié)合的蛋白酶對其進(jìn)行翻譯后加工。
在許多情況下,通過枯草桿菌蛋白酶樣原蛋白轉(zhuǎn)化酶完成限制性蛋白水解對蛋白質(zhì)前體的活化,所述枯草桿菌蛋白酶樣原蛋白轉(zhuǎn)化酶是在結(jié)構(gòu)上與細(xì)菌枯草桿菌蛋白酶和酵母kexin相似的酶家族。哺乳動物原蛋白轉(zhuǎn)化酶(包括值得注意的弗林蛋白酶和二元特異性kexin樣蛋白酶(dibasic-specific kexin-like protease))通常在共有序列(Arg/Lys)-Xn-(Arg/Lys)處切割蛋白質(zhì)前體,其中X是除Cys以外的任何氨基酸,且n=0、2、4或6。在體內(nèi),通常存在于反面高爾基網(wǎng)中的這些酶將多種蛋白質(zhì)前體轉(zhuǎn)化為成熟蛋白,從而直接或間接有助于對重要過程的精細(xì)控制,所述重要過程例如酶原活化、基因表達(dá)、細(xì)胞周期、程序性細(xì)胞死亡、細(xì)胞內(nèi)蛋白質(zhì)靶向以及內(nèi)分泌/神經(jīng)功能。
在實踐中,已提供了若干例子來顯示在植物中將動物原蛋白正確加工成其生物活性形式。針對人原膠原蛋白提供了一個有趣的例子,顯示其在煙草細(xì)胞中在切割其C端和N端原肽之后轉(zhuǎn)化為成熟蛋白(Lienard等,2006(參考文獻(xiàn)32))。
如最近對茄科(Solanaceae)蛋白質(zhì)加工酶的研究所示,哺乳動物加工轉(zhuǎn)化酶的功能性同源物與蛋白質(zhì)沿著植物細(xì)胞分泌途徑成熟相關(guān)。顯示在能夠正確加工病毒抗真菌劑(KP6殺傷原毒素(killer protoxin))的轉(zhuǎn)基因煙草株系中存在kex2p樣蛋白酶活性。隨后顯示,這種在高爾基體駐留的kex2p樣轉(zhuǎn)化酶顯示酵母kex2p特征性的底物特異性,這與顯示不同特異性的來自番茄的細(xì)胞外原蛋白轉(zhuǎn)移酶LeSBT1相反,而與屬于同一加工酶亞家族的哺乳動物轉(zhuǎn)化酶SKI-1相似(Jansik等2000(參考文獻(xiàn)31);Rautengarden等,2005(參考文獻(xiàn)52))。
近期,在擬南芥(Arabidopsis)中發(fā)現(xiàn)了對發(fā)生脂質(zhì)修飾的蛋白質(zhì)的C端四肽CAAX基序進(jìn)行加工的酵母和哺乳動物CAAX蛋白酶的功能同源物,再次證實了沿著真核細(xì)胞分泌途徑發(fā)生了高度保守的蛋白水解過程(Bracha等,2002(參考文獻(xiàn)7))。
從實踐的角度來看,在細(xì)胞水平上的這些保守過程與N-糖基化的總體保守特性一起有力地指出,植物系統(tǒng)有可能用于表達(dá)和正確加工需要復(fù)雜的翻譯后修飾的多種生物或治療相關(guān)性蛋白質(zhì)。
在植物中,α-葡萄糖苷酶I在擬南芥(Arabidopsis thaliana)胚胎發(fā)育期間的儲藏蛋白累積、蛋白質(zhì)體形成、細(xì)胞分化和細(xì)胞壁破壞中是基礎(chǔ)性的(primordial)。沒有α-葡萄糖苷酶I活性時,擬南芥種子發(fā)育被阻斷在心期(Boisson等,2001(參考文獻(xiàn)6)),并且細(xì)胞壁生物合成受到強(qiáng)烈影響(Gillmor等,2002(參考文獻(xiàn)19))。
本領(lǐng)域仍然存在對下述手段的需要,所述手段用于通過遺傳重組生產(chǎn)蛋白質(zhì),尤其是在真核宿主中(特別是在植物細(xì)胞中)生產(chǎn),從而生產(chǎn)經(jīng)設(shè)計或改造的經(jīng)轉(zhuǎn)錄后修飾的重組蛋白,以例如在宿主中表達(dá)下述異源蛋白質(zhì),所述異源蛋白質(zhì)與其天然對應(yīng)物基本相同并具有盡可能小的免疫原性,從而可用作治療性物質(zhì),尤其是用于人。
本發(fā)明人鑒定了賦予擬南芥葡萄糖苷酶I以ER駐留屬性的兩類獨(dú)立的信號。使用與GFP融合的這種葡萄糖苷酶的多種缺失或突變體,他們顯示全長的擬南芥α-葡萄糖苷酶I(在下文稱作GCSI)嚴(yán)格地在ER中累積,并含有足以將報告子靶向至ER的位于胞質(zhì)尾區(qū)中的基于Arg的基序。然而,將全長GCSI定位于該區(qū)室中不需要這些功能性的基于Arg的信號,并在與膜結(jié)合的該ER酶的莖中鑒定了第二種信號。
本發(fā)明人鑒定了賦予擬南芥糖基轉(zhuǎn)移酶以GA駐留的三類獨(dú)立的信號。
發(fā)明描述 精確地講,本發(fā)明的目的是提供響應(yīng)該需要的有效工具。本發(fā)明的工具是下述形式靶向或停留信號和涉及這些靶向信號的方法。本發(fā)明一般涉及通過使用這些靶向或停留信號以不同方式對重組多肽的翻譯后成熟進(jìn)行修飾。
根據(jù)本發(fā)明人對植物或人的酶(例如糖苷酶和糖基轉(zhuǎn)移酶)轉(zhuǎn)運(yùn)和定位的大量研究,本發(fā)明人已鑒定了特異性參與ER和GA之間膜蛋白分布(尤其是在植物細(xì)胞中)的不同肽信號。
因此,本發(fā)明的第一方面是提供特定的肽信號,其允許(尤其是在植物細(xì)胞中)重組多肽停留在特定的細(xì)胞亞區(qū)室中。這些肽信號的序列和結(jié)構(gòu)在下文描述。本發(fā)明的肽信號還列于附帶的序列表中,參照SEQ IDn°1到SEQ IDn°31。下文中,這些肽信號可被稱作“停留信號序列”或“信號序列”或“靶向信號”或“肽信號”。本發(fā)明范圍內(nèi)優(yōu)選的序列是表I中公開的序列。
本發(fā)明的停留信號序列將重組多肽特異性地靶向(尤其是在植物細(xì)胞中)至ER和/或GA區(qū)室膜。這些序列允許重組多肽停留在ER中和/或不同的GA亞區(qū)室中,或者以膜結(jié)合的形式停留在ER中和/或不同的GA亞區(qū)室中。“靶向”表示與本發(fā)明肽信號融合的多肽會因為該肽信號而定位(即限制)于ER和/或GA中。
重組多肽的成熟和穩(wěn)定性直接取決于累積所述多肽的區(qū)室。例如,本發(fā)明人已顯示,重組多肽在ER中的停留提高了它們的穩(wěn)定性并防止其N-聚糖成熟。他們還顯示,以膜多肽形式表達(dá)可溶性重組多肽也提高其穩(wěn)定性。最后,他們顯示,重組多肽在分泌途徑早期區(qū)室中的停留提高所述重組多肽的產(chǎn)率,并可防止由聚糖成熟引起的免疫原性。
本發(fā)明人將本發(fā)明的適當(dāng)信號與不同的重組多肽融合,用于下文實現(xiàn)并公開的不同目標(biāo)。因此,本發(fā)明的另一方面是提供包含本發(fā)明肽信號和多肽的重組多肽,所述肽信號與所述多肽融合。本發(fā)明肽信號可在多肽的C端或N端末端融合。也就是說,所述肽信號可以與多肽或蛋白質(zhì)的C端或N端末端相連。
根據(jù)本發(fā)明,重組多肽可以是在制藥或農(nóng)業(yè)-食品工業(yè)(agri-foodindustry)中有意義的任何重組多肽?!爸亟M多肽”在本說明書中也可以稱作“重組蛋白”或“肽X”或“靶蛋白”。然而,在公開本發(fā)明的方法時,優(yōu)選使用“重組多肽”來命名待生產(chǎn)的例如用于藥物用途的重組多肽;并使用“重組蛋白”來命名參與重組多肽成熟過程(即翻譯后修飾)的蛋白質(zhì)(見下文方法描述中的解釋)。
根據(jù)本發(fā)明,多肽(在本文中也稱作“靶多肽”)可以是所有膜治療性多肽,可作為或不作為膜蛋白表達(dá)的所有可溶性治療性多肽,所有抗體及其片段。
例如,重組多肽可選自包含以下的組酶、抗體或其部分、報告蛋白、核苷酸轉(zhuǎn)運(yùn)蛋白和治療活性多肽。優(yōu)選地,重組的多肽是可溶的多肽或蛋白質(zhì)。
可通過本發(fā)明生產(chǎn)的治療活性蛋白質(zhì)的例子為疫苗、變應(yīng)原、酶、血液蛋白質(zhì)、激素、抗體、抗體衍生的片段。優(yōu)選地,治療活性多肽是可溶的?!爸委熜远嚯摹被颉爸委熁钚远嚯摹痹诒菊f明書和權(quán)利要求書中具有相同的含義(或是膜結(jié)合蛋白質(zhì)的可溶部分)。
根據(jù)本發(fā)明,當(dāng)重組多肽是酶時,所述酶可以是植物或動物酶。根據(jù)本發(fā)明,所述酶可例如選自包含以下的組糖苷酶、糖基轉(zhuǎn)移酶、蛋白酶、激酶、脫羧酶、差向異構(gòu)酶、核苷酸-糖轉(zhuǎn)運(yùn)蛋白(例如UDP-糖轉(zhuǎn)運(yùn)蛋白、GDP-糖轉(zhuǎn)運(yùn)蛋白或CMP-糖轉(zhuǎn)運(yùn)蛋白)、酰胺化酶,更普遍地為宿主細(xì)胞(例如植物細(xì)胞)的ER和/或GA中存在或不存在的任何成熟酶。糖苷酶可以是例如參與N-糖基化或O-糖基化的糖苷酶。糖基轉(zhuǎn)移酶可以是例如參與N-糖基化或O-糖基化的糖基轉(zhuǎn)移酶。酶的例子列于下表中 酶的列表 “成熟酶”表示參與宿主細(xì)胞中重組蛋白成熟的任何酶。
根據(jù)本發(fā)明,無論蛋白質(zhì)是什么,其均可與儲藏蛋白或儲藏在蛋白質(zhì)體中的蛋白質(zhì)融合,例如與
融合的蛋白質(zhì)。這對于在生產(chǎn)后從宿主細(xì)胞中回收重組多肽是有意義的。這一點(diǎn)在下文對本發(fā)明方法的描述中進(jìn)行了討論。
本發(fā)明的另一方面是提供編碼本發(fā)明肽信號的核酸序列。編碼SEQ IDNO1-31的核酸序列的例子在附帶的序列表中給出,命名為SEQ ID NO102-132。根據(jù)遺傳密碼的簡并性,技術(shù)人員會容易地推導(dǎo)出也編碼SEQ IDNO1-31的其它合適的核酸序列。
本發(fā)明的又一方面是提供編碼本發(fā)明重組多肽的核酸序列。
本發(fā)明的又一方面是提供包含本發(fā)明核酸序列的核酸載體。本發(fā)明的核酸載體包含編碼本發(fā)明肽信號的核酸序列,其中所述核酸與編碼多肽或蛋白質(zhì)的核酸序列在框內(nèi)引入載體中,以產(chǎn)生在所述多肽一個(或兩個)末端含有“停留信號序列”的重組多肽或蛋白質(zhì)。
可使用任何已知和合適的方法構(gòu)建這些核酸和核酸載體。例如,可有利地使用(Gomord等,1997(參考文獻(xiàn)24)和1998(參考文獻(xiàn)25),Pagny等2000(參考文獻(xiàn)49)和2003(參考文獻(xiàn)50),Saint-Jore-Dupas等2006(參考文獻(xiàn)58))中公開的方法。
本發(fā)明的又一方面是提供植物細(xì)胞,其包含至少一種本發(fā)明的肽信號和/或至少一種本發(fā)明的重組多肽(即包含本發(fā)明的肽信號)和/或至少一種編碼本發(fā)明重組多肽的核酸序列和/或至少一種本發(fā)明的核酸載體。根據(jù)本發(fā)明,所述重組多肽可以是同源或異源的多肽。重組多肽如上文所定義。
可使用任何已知和合適的方法獲得所述植物細(xì)胞。例如,可有利地使用Gomord等,1997(參考文獻(xiàn)24),1998(參考文獻(xiàn)25),Pagny等2000(參考文獻(xiàn)49)和2003(參考文獻(xiàn)50),Saint-Jore-Dupas等2006(參考文獻(xiàn)58),Saint-Jore等,2002(參考文獻(xiàn)56)中公開的方法。
本發(fā)明的又一方面是提供植物,所述植物包含至少一種本發(fā)明的肽信號和/或至少一種本發(fā)明的重組蛋白(即包含本發(fā)明的肽信號)和/或至少一種編碼本發(fā)明重組蛋白的核酸序列和/或至少一種本發(fā)明的核酸載體。根據(jù)本發(fā)明,所述重組蛋白可以是同源或異源的蛋白質(zhì)。重組蛋白如上文所定義。
可使用任何已知和合適的方法獲得所述植物。例如,可有利地使用Saint-JoreDupas等2006(參考文獻(xiàn)58),Saint-Jore等2002(參考文獻(xiàn)56)中公開的方法。
根據(jù)本發(fā)明,植物可以是允許生產(chǎn)重組蛋白的任何合適植物。例如,植物可選自包含以下的組苜蓿(Alfalfa)、擬南芥、煙草(Nicotianatabacum)、大豆(Glycine max)、番茄(Lycopersicon esculentum)、馬鈴薯(Solanum tuberosum)、水稻(oriza sativa)、玉米(zea maize)、苔蘚(小立碗蘚(physcomitrella patens))、浮萍(Lemna minor)、藻類(ostreococcus tauri、褐指藻(phaelodactylum))、萊茵衣藻(chlamydomonas reinhardtii)。
根據(jù)本發(fā)明,植物細(xì)胞可來自或來源于任何這些植物。
本發(fā)明人還提供了在宿主細(xì)胞中生產(chǎn)經(jīng)翻譯后修飾的異源多肽的第一種方法,所述宿主細(xì)胞轉(zhuǎn)化有設(shè)計成靶向表達(dá)所述重組多肽的載體。該第一種方法在附圖3(A)行中圖示。
生產(chǎn)經(jīng)翻譯后修飾的重組多肽的第一種方法包括以下步驟 -用至少一種本發(fā)明的核酸載體轉(zhuǎn)染或轉(zhuǎn)化細(xì)胞,所述載體編碼重組蛋白,所述重組蛋白是未經(jīng)翻譯后修飾的該多肽; -培養(yǎng)經(jīng)轉(zhuǎn)染的細(xì)胞;和 -收獲經(jīng)翻譯后修飾的多肽。
根據(jù)本發(fā)明,該方法在培養(yǎng)轉(zhuǎn)染或轉(zhuǎn)化細(xì)胞的步驟前還可包括篩選細(xì)胞的步驟??墒褂眉夹g(shù)人員已知的任何篩選方法。例如,通過用顯微鏡直接選擇,通過電泳SDS-page,通過免疫檢測,通過膜轉(zhuǎn)移等等??捎糜谶M(jìn)行篩選的方法的一個例子公開于例如文獻(xiàn)Gomord等1997(參考文獻(xiàn)24)中。該篩選步驟允許選擇已根據(jù)本發(fā)明轉(zhuǎn)染或轉(zhuǎn)化的細(xì)胞。該步驟導(dǎo)致經(jīng)修飾多肽的更高產(chǎn)率。
如上所述,對本發(fā)明方法的本公開內(nèi)容而言,優(yōu)選使用“重組多肽”來命名待生產(chǎn)的例如用于藥物用途的重組多肽;而使用“重組蛋白”來命名參與重組多肽成熟過程(即翻譯后修飾)的蛋白質(zhì)(見第二種方法描述中的解釋)。
通過該方法,使用編碼與重組多肽融合的本發(fā)明肽信號的核酸載體允許將重組多肽游離地或以膜結(jié)合形式停留在ER中和/或不同的GA亞區(qū)室內(nèi)。對現(xiàn)有技術(shù)方法的重組多肽所觀察到的部分異質(zhì)性(heterogeneity)是在通過高爾基體轉(zhuǎn)運(yùn)和成熟期間發(fā)生的。通過使用本發(fā)明肽信號使重組多肽停留在ER中或ER衍生的蛋白質(zhì)體或早期高爾基體區(qū)室中,可降低這種異質(zhì)性。
一個主要的困難是生產(chǎn)作為其天然對應(yīng)物的精確拷貝的重組蛋白。多肽翻譯后成熟不僅在表達(dá)系統(tǒng)之間不同,而且在相同表達(dá)系統(tǒng)中的器官之間也不同,并且在組成相同器官的亞細(xì)胞區(qū)室之間也不同。
根據(jù)本發(fā)明的第一種方法添加肽信號從而將PMP靶向至特定區(qū)室,可以解決這一困難,但是重組蛋白的該結(jié)構(gòu)修飾當(dāng)然導(dǎo)致了非天然的蛋白質(zhì)。有利的是,本發(fā)明的肽信號是允許進(jìn)一步控制重組多肽成熟的實用工具,所述控制通過改造或設(shè)計宿主細(xì)胞的ER和GA介質(zhì)來實現(xiàn)。該控制允許生產(chǎn)這樣的重組多肽,所述重組多肽在宿主細(xì)胞中更穩(wěn)定,具有更低的免疫原性,并通常是其天然對應(yīng)物的精確拷貝。這對于生產(chǎn)(尤其是由植物生產(chǎn))可在人治療中使用的治療活性蛋白質(zhì)而言是非常重要的。
本發(fā)明提供了設(shè)計ER和GA環(huán)境的若干方案。這些方案可單獨(dú)或一起(組合)使用。這些方案的例子在附圖3的(B)和(C)行中圖示。在所有這些方案中,用以下載體轉(zhuǎn)染或轉(zhuǎn)化宿主細(xì)胞 -至少一種編碼與重組蛋白融合的本發(fā)明肽信號的載體,所述重組蛋白與待生產(chǎn)的重組多肽不同,和 -至少一種編碼所述重組多肽的核酸載體。
因此,本發(fā)明的又一方面是提供用于生產(chǎn)經(jīng)翻譯后修飾的重組多肽的第二種方法,包括以下步驟 -用至少一種本發(fā)明的核酸載體轉(zhuǎn)染或轉(zhuǎn)化細(xì)胞,所述載體編碼與所述多肽不同的重組蛋白; -用至少一種編碼所述多肽的核酸載體轉(zhuǎn)染或轉(zhuǎn)化所述細(xì)胞; -培養(yǎng)經(jīng)轉(zhuǎn)染的細(xì)胞;和 -收獲經(jīng)翻譯后修飾的多肽。
根據(jù)本發(fā)明,該方法在培養(yǎng)轉(zhuǎn)染或轉(zhuǎn)化細(xì)胞的步驟前還可包括篩選細(xì)胞的步驟??墒褂眉夹g(shù)人員已知的任何篩選方法。篩選方法可以是上文公開的方法。該篩選步驟允許選擇已根據(jù)本發(fā)明轉(zhuǎn)染或轉(zhuǎn)化的細(xì)胞。該步驟導(dǎo)致經(jīng)修飾多肽的更高產(chǎn)率。
在該第二種方法中,在宿主細(xì)胞中翻譯的重組蛋白包含本發(fā)明的肽信號,并且該重組的蛋白質(zhì)與待生產(chǎn)的多肽不同。
在該第二種方法中,重組蛋白在待生產(chǎn)重組多肽的翻譯后修飾調(diào)控中起作用,即,其參與該重組多肽的成熟過程(即翻譯后修飾)。
該作用取決于所選擇的重組蛋白的性質(zhì)。通過閱讀本說明書和實施例,技術(shù)人員會容易地知曉如何選擇重組蛋白,從而通過使用本發(fā)明達(dá)到所期望達(dá)到的結(jié)果。
根據(jù)本發(fā)明,該重組蛋白可例如是酶和/或抗體或其部分。
根據(jù)本發(fā)明的第二種方法,當(dāng)重組蛋白是抗體或其部分時,其可以例如特異性識別和結(jié)合待生產(chǎn)的多肽,和/或是特異性識別和結(jié)合參與所述多肽翻譯后修飾的酶的抗體或其部分。
通過該方法,與本發(fā)明肽信號融合的抗體或其部分會定位于宿主細(xì)胞的ER和/或GA中。此處重組蛋白的作用是將重組多肽捕獲至ER和/或GA。因此,本發(fā)明提供了通過在宿主細(xì)胞中表達(dá)抗體或抗體片段來生產(chǎn)經(jīng)翻譯后修飾的異源多肽的方法,所述宿主細(xì)胞已轉(zhuǎn)化有表達(dá)載體,所述載體包含編碼以下的核酸序列 -ER/GA靶向的抗體或抗體片段,和 -待生產(chǎn)的多肽。
對于特異性識別和結(jié)合所述待生產(chǎn)多肽的抗體或其片段的情況,本發(fā)明允許有利地將所述天然(未通過由本發(fā)明肽信號組成的標(biāo)簽添加進(jìn)行修飾)重組蛋白保留在宿主細(xì)胞的ER和/或GA中,這借助于其與保留在這些區(qū)室之一中的特異性抗體或其片段的結(jié)合,這通過將所述抗體或其片段與本發(fā)明肽信號融合來實現(xiàn)。為此,已將本發(fā)明的ER和/或GA停留肽信號與對重組多肽具有特異性親和力的抗體融合,最終目標(biāo)是控制或調(diào)控重組蛋白的成熟。
對于特異性識別和結(jié)合參與多肽翻譯后修飾的酶的抗體或其片段的情況,抗體或其片段優(yōu)選地調(diào)控所述酶。此處,本發(fā)明的應(yīng)用是對ER和/或GA特異性地使用失活抗體,從而使位于這些區(qū)室中的特定酶失活。為此,已將本發(fā)明的ER和/或GA停留肽信號與對ER或GA酶的催化結(jié)構(gòu)域具有特異性親和力的抗體融合,最終目標(biāo)是使內(nèi)源酶失活,以控制或調(diào)控重組蛋白的成熟。此處重組蛋白的作用是捕獲參與重組多肽成熟的酶。因此,本發(fā)明允許“免疫調(diào)節(jié)”宿主細(xì)胞中的內(nèi)源酶。
根據(jù)本發(fā)明,還可使用第二種方法從而 1)通過使用至少一種本發(fā)明載體對宿主細(xì)胞補(bǔ)充異源酶,所述載體編碼與本發(fā)明肽信號融合的異源酶, 和/或 2)通過使用至少一種本發(fā)明載體對內(nèi)源酶進(jìn)行再定位,以優(yōu)化宿主細(xì)胞的生產(chǎn)能力,所述載體編碼與本發(fā)明的肽信號融合的所述內(nèi)源酶。
異源或同源酶修飾重組蛋白成熟的能力將取決于其在細(xì)胞中的定位。因而,為了修飾宿主細(xì)胞的酶設(shè)備,優(yōu)選將適當(dāng)?shù)拿赴邢颉昂谩眳^(qū)室中。因此,本發(fā)明提供了通過在轉(zhuǎn)化有表達(dá)載體的宿主細(xì)胞中表達(dá)成熟酶來生產(chǎn)經(jīng)翻譯后修飾的異源多肽的方法,所述表達(dá)載體含有編碼以下的核酸序列 1)重組蛋白,其為靶向的成熟酶,即與本發(fā)明的肽信號融合的成熟酶,和 2)待生產(chǎn)的重組多肽。
因此,所述重組蛋白可以是參與所述多肽翻譯后修飾的同源或異源酶。在該例子中,本發(fā)明允許根據(jù)兩種獨(dú)立但是可并行的策略來修飾宿主細(xì)胞(尤其是植物細(xì)胞)中ER和/或GA的酶設(shè)備(a)將內(nèi)源酶再定向至ER和/或GA,和(b)將可定位于不同亞細(xì)胞區(qū)室的異源酶靶向ER/GA。這種對宿主細(xì)胞中ER和/或GA酶設(shè)備的修飾是允許修飾(即設(shè)計)重組多肽翻譯后成熟的工具。例如,該修飾可允許提高所產(chǎn)生重組多肽的穩(wěn)定性和/或控制其免疫原性。重組蛋白在此處的作用是捕獲參與ER和/或GA中重組多肽的成熟的同源或異源酶。
因此,本發(fā)明允許有利地獲得作為非免疫原性糖蛋白的重組多肽,也允許有利地獲得作為同源糖蛋白的重組多肽。
根據(jù)本發(fā)明,多肽可以是需要通過遺傳重組生產(chǎn)(尤其是在植物細(xì)胞或整株植物中生產(chǎn))的任何多肽。可通過本發(fā)明生產(chǎn)的多肽是例如上文本發(fā)明重組多肽的公開內(nèi)容中所述的多肽。
根據(jù)本發(fā)明,可同時使用第一和第二方法。在這種情況下,在第二方法中,編碼所述多肽的載體核酸載體也是本發(fā)明的核酸載體,即編碼與本發(fā)明肽信號融合的多肽。通過本發(fā)明的這一實施方案,可以將用于成熟的重組多肽靶向至位于ER和/或GA中,同時將ER和/或GA設(shè)計成用于成熟,即重組多肽的翻譯后修飾。多肽可以是如上文所定義的。例如,其可以是治療活性蛋白質(zhì)。
如本文所公開的,根據(jù)本發(fā)明,多肽的翻譯后修飾有利地在ER和/或GA區(qū)室膜中進(jìn)行。
本發(fā)明人首次提供了用于在宿主細(xì)胞中(尤其是植物細(xì)胞中)生產(chǎn)所設(shè)計的重組多肽的這一有力工具。
無論使用本發(fā)明的何種方法(第一和/或第二方法),都可以將多肽與儲藏蛋白共表達(dá)。這種儲藏蛋白可以例如是與
融合的蛋白質(zhì)或任何其他合適蛋白質(zhì)。附圖3的(D)行圖示了將
-重組蛋白融合物靶向至高爾基體。例如,可通過宿主細(xì)胞中
-重組蛋白的表達(dá)而從ER膜產(chǎn)生蛋白質(zhì)體(見附圖5A)。在ER中累積的重組糖蛋白(見下文實施例)僅帶有高甘露糖型N-聚糖。本發(fā)明提供了肽信號,其允許有利地組合ER同質(zhì)性和聚糖修飾,例如對于藥物糖蛋白而言,其允許在與ER停留信號融合后儲藏在ER中。
可用于獲得本發(fā)明方法中所使用載體的有用方法在上文中公開。
用于轉(zhuǎn)染或轉(zhuǎn)化細(xì)胞(尤其是植物細(xì)胞)的可用方法在上文中公開。
根據(jù)本發(fā)明,細(xì)胞優(yōu)選地是植物細(xì)胞,例如上文定義的植物細(xì)胞,例如植物細(xì)胞是來自植物的細(xì)胞,所述植物選自包含以下的組紫苜蓿(Medicago sativa)、擬南芥、煙草、大豆、番茄、馬鈴薯、水稻、玉米、小立碗蘚、浮萍、Ostreococcus tauri、褐指藻。
用于培養(yǎng)轉(zhuǎn)染細(xì)胞或其所得的植物以及用于收獲經(jīng)翻譯后修飾的多肽的方法是本領(lǐng)域技術(shù)人員已知的。例如,可有利地使用lienard等,2006(參考文獻(xiàn)32)中公開的方法。
本領(lǐng)域技術(shù)人員通過附圖中展示的以下非限制性例子可以明白其他的優(yōu)點(diǎn)。
附圖簡述 圖1是植物細(xì)胞分泌途徑的圖示。ER和高爾基體連續(xù)區(qū)的結(jié)構(gòu)域如下表示
ER
ER/順面高爾基體
中間高爾基體
晚期高爾基體 圖2顯示了植物和哺乳動物細(xì)胞的內(nèi)質(zhì)網(wǎng)和高爾基體中蛋白質(zhì)上N-聯(lián)聚糖的轉(zhuǎn)移和加工。在脂質(zhì)運(yùn)載體上裝配的前體寡糖被轉(zhuǎn)移至組成新生多肽的特定Asn殘基上。然后通過去除葡萄糖基和大部分甘露糖基殘基來修剪N-聚糖。植物和哺乳動物的復(fù)雜N-聚糖加工中的差異是晚期高爾基體成熟事件。如圖1中所述,用粗箭頭指出ER和高爾基體結(jié)構(gòu)域。
圖3顯示不同信號(黑暗處)在靶向重組蛋白(A行)、抗體或其部分(ScFv)(B行)、酶(C行)或
-融合物(D行)中的可能應(yīng)用。
圖4是所分析的融合蛋白的圖示 -GCSI-GFP與GFP融合的全長擬南芥GCSI, -GCS90-GFP與GFP融合的GCSI的前90個N端氨基酸, -Δ13GCS90-GFPGCS90-GFP減去前13個N端氨基酸, -ManI-GFP與GFP融合的全長大豆ManI, -Δ19CTMan-GFPManI-GFP減去前19個N端氨基酸, -Man99-GFP和Man49-GFP與GFP融合的分別為ManI的前99個和49個氨基酸, -Δ19CTMan49-GFPMan49-GFP減去前19個N端氨基酸, -ΔCTMan49-GFP從Man49-GFP中缺失整個CT, -MAAAMan49-GFP用含有3個Ala殘基的人工CT代替Man49-GFP的CT, -ManTMD23-GFP和Man99TMD23-GFP分別為ManI-GFP和Man99-GFP,其中TMD從16個氨基酸延長至23個氨基酸, -GNTI-GFP與GFP融合的全長煙草GNTI, -GNT38-GFP與GFP融合的GNTI的前38個N端氨基酸, -XylT-GFP與GFP融合的全長擬南芥XylT, -XylT35-GFP與GFP融合的XylT的前35個氨基酸, -ST52-mRFP與mRFP融合的大鼠α-2,6-唾液酸轉(zhuǎn)移酶的前52個氨基酸, -GFP-HDEL含有sporamine信號肽和C端HDEL ER停留序列的GFP形式。
圖5顯示使用共聚焦激光掃描顯微鏡觀察時,在煙草BY-2細(xì)胞中穩(wěn)定表達(dá)(3-4天)后,與N-聚糖加工機(jī)器的四個不同成員(α-葡萄糖苷酶I、甘露糖苷酶、N-乙酰葡糖氨基轉(zhuǎn)移酶I、β-1,2-木糖基轉(zhuǎn)移酶,圖4)和與C端HDEL ER停留序列融合的一系列GFP融合物定位到高爾基體和/或ER中 (A,B)ManI-GFP, (C)ManI-GFP(用蛋白質(zhì)合成抑制劑環(huán)己酰亞胺處理2小時后), (D,E)GFP-HDEL, (F)ManI-GFP(用BFA(50mg.mL-1)處理2小時后), (G)GCSI-GFP, (H)GNTI-GFP, (I)XylT-GFP, 所有標(biāo)尺線段=8μm。
圖6顯示使用共聚焦激光掃描顯微鏡觀察時,在煙草BY-2細(xì)胞中穩(wěn)定表達(dá)(3-4天)或通過葉浸潤在煙草葉表皮細(xì)胞中瞬時表達(dá)(5天)后,與N-聚糖加工機(jī)器的截短成員(Man99、Man49、GNT38、XylT35,圖4)融合的一系列GFP融合物定位到高爾基體和/或ER中 (A,B)BY-2懸浮培養(yǎng)細(xì)胞的Man99-GFP表達(dá), (C)BY-2懸浮培養(yǎng)細(xì)胞的Man99-GFP表達(dá)(在用蛋白質(zhì)合成抑制劑環(huán)己酰亞胺處理2小時后), (D)BY-2懸浮培養(yǎng)細(xì)胞的Man49-GFP表達(dá), (E-F)分別為煙草葉表皮細(xì)胞的Man99-GFP和Man49-GFP表達(dá), (G)BY-2懸浮培養(yǎng)細(xì)胞的GNT38-GFP表達(dá), (H)煙草葉表皮細(xì)胞的GNT38-GFP表達(dá),和 (I)煙草葉表皮細(xì)胞的XylT35-GFP表達(dá)。
所有標(biāo)尺線段=8μm。
圖7顯示使用共聚焦激光掃描顯微鏡觀察時,將這些GFP融合物之一或其它與ST52-mRFP在煙草BY-2細(xì)胞中穩(wěn)定共同表達(dá)(3-4天)后,與ManI、Man99、Man49或GNT38(圖4)和反面高爾基體標(biāo)記物ST52-mRFP融合的一系列GFP融合物定位到高爾基體堆中 (A-C)ManI-GFP(A)和ST52-mRFP(B)在BY-2懸浮培養(yǎng)煙草細(xì)胞中的共表達(dá), (D-F)Man99-GFP(D)和ST52-mRFP(E)在BY-2懸浮培養(yǎng)煙草細(xì)胞中的共表達(dá), (G-I)Man49-GFP(G)和ST52-mRFP(H)在BY-2懸浮培養(yǎng)煙草細(xì)胞中的共表達(dá), (J-L)GNT38-GFP(J)和ST52-mRFP(K)在BY-2懸浮培養(yǎng)煙草細(xì)胞中的共表達(dá),和 (C,F(xiàn),I和L)GFP融合物+ST52-mRFP相應(yīng)地重疊后的表達(dá)。
插入物選定的高爾基體堆的放大率(×2,2)。
注意,堆通常顯示為“三色的”(F和I中的箭頭),GFP融合物在一側(cè)(綠色),ST52-RFP在另一側(cè)(紅色),其間為重疊區(qū)(黃色)。
A-I標(biāo)尺線段=8μm;J-L標(biāo)尺線段=16μm。
圖8顯示植物N-糖基化酶的胞質(zhì)尾區(qū)和TMD長度的比較。
(A)植物細(xì)胞內(nèi)質(zhì)網(wǎng)(ER)和高爾基體中N-聯(lián)聚糖的加工。
(B)從不同植物物種克隆的N-聚糖加工酶的胞質(zhì)尾區(qū)和跨膜結(jié)構(gòu)域的長度。登錄號在每個圖示的右側(cè)指出。
對每個膜蛋白而言,跨膜結(jié)構(gòu)域的位置和大小由TmHMM v2軟件(http://www.cbs.dtu.dk/services/TMHMM/)來估計。
對一些蛋白質(zhì)而言,確定TMD位置的概率低于50%(II)。
用粗體標(biāo)注的框?qū)?yīng)于目前已通過共聚焦和/或電子顯微鏡研究其胞內(nèi)定位的N-聚糖加工酶。
GCSI葡萄糖苷酶I;α-1,2ManIα1,2-甘露糖苷酶I;β1,2GNTIβ1,2-N-乙酰葡糖氨基轉(zhuǎn)移酶I,α1,3 ManIIα1,3-甘露糖苷酶II,β1,2GNTIIβ1,2-乙酰葡糖氨基轉(zhuǎn)移酶II;β1,2XylosylTβ1,2-木糖基轉(zhuǎn)移酶;α1,3FucTα1,3-巖藻糖基轉(zhuǎn)移酶;α1,4FucTα1,4-巖藻糖基轉(zhuǎn)移酶;α2,6sialylTα2,6-唾液酸轉(zhuǎn)移酶。
圖9顯示使用共聚焦激光掃描顯微鏡觀察時,在煙草BY-2細(xì)胞中穩(wěn)定表達(dá)(3-4天)或通過葉浸潤在煙草葉表皮細(xì)胞中瞬時表達(dá)(5天)后,與截短形式ManI(Δ19Man、Δ19Man49,圖3)和MAAAMan49融合的一系列GFP融合物定位到高爾基體和ER中 (A)BY-2懸浮培養(yǎng)細(xì)胞的Δ19Man-GFP表達(dá), (B,C)BY-2懸浮培養(yǎng)細(xì)胞的Δ19Man49-GFP表達(dá), (D)葉表皮細(xì)胞的Δ19Man49-GFP表達(dá), (E)葉表皮細(xì)胞的MAAAMan49-GFP表達(dá)。
A-C標(biāo)尺線段=16μm;D,E標(biāo)尺線段=8μm 圖10顯示使用共聚焦激光掃描顯微鏡觀察時,這些GFP融合物之一或其它與ST52-mRFP在煙草BY-2細(xì)胞中穩(wěn)定共表達(dá)(3-4天)后,與ManTMD23、Man99TMD23或XylT35(圖3)和反面高爾基體標(biāo)記物ST52-mRFP融合的一系列GFP融合物定位到高爾基體區(qū)室中 (A-C)ManTMD23-GFP(A)和ST52-mRFP(B)在BY-2懸浮培養(yǎng)煙草細(xì)胞中的共表達(dá), (D-F),(G-I)Man99TMD23-GFP(D、G)和ST52-mRFP(E、H)在BY-2懸浮培養(yǎng)煙草細(xì)胞中的共表達(dá), (J-L)XylT35-GFP(J)和ST52-mRFP(K)在BY-2懸浮培養(yǎng)煙草細(xì)胞中的共表達(dá), (C、F、I和L)GFP融合物+ST52-mRFP的相應(yīng)重疊表達(dá)。
插入物放大率(×2,2) 所有標(biāo)尺線段=8μm。
圖11顯示與Man99和Man99TMD23融合的GFP融合物在高爾基體中的定位,使用與免疫金標(biāo)記聯(lián)用的電子顯微鏡,所述免疫金標(biāo)記使用來自懸浮培養(yǎng)的BY2煙草細(xì)胞的多克隆抗GFP抗體 (A)野生型BY2煙草細(xì)胞, (B)表達(dá)Man99-GFP的BY2細(xì)胞, (C)表達(dá)Man99TMD23-GFP的BY2細(xì)胞, (D)將高爾基體中融合蛋白的分布表達(dá)為針對在不同細(xì)胞中分析的15個個體堆所觀察到的標(biāo)簽的百分比,將高爾基體分為兩個區(qū)域后對順面和反面上的金顆粒進(jìn)行計數(shù)。
SV=分泌小泡。
圖12顯示了使用共聚焦激光掃描顯微鏡觀察時,通過葉浸潤在葉表皮細(xì)胞中瞬時表達(dá)(5天)后,與N-聚糖加工機(jī)器成員(ManI、XylT)、其截短形式(Man99TMD23、Man99,圖4)融合的一系列GFP融合物定位到高爾基體和ER中 (A)Man99-GFP的大豆葉表皮細(xì)胞表達(dá), (B)Man99TMD23-GFP的大豆葉表皮細(xì)胞表達(dá), (C)Man99-GFP的栽培番茄(Lycopersicum esculentum)葉表皮細(xì)胞表達(dá), (D)Man99TMD23-GFP的栽培番茄葉表皮細(xì)胞表達(dá)。
所有標(biāo)尺線段=16μm。
圖13顯示使用共聚焦激光掃描顯微鏡觀察時,BFA處理2小時對BY-2細(xì)胞中ER和/或高爾基體蛋白質(zhì)的影響,所述BY-2細(xì)胞表達(dá)可溶的ER標(biāo)記物(GFP-HDEL,A-B)、膜ER標(biāo)記物(Glu90-GFP,C-D)、ER和早期高爾基體標(biāo)記物(Δ19Man49-GFP,E-F)、中間高爾基體標(biāo)記物(XylT35-GFP,G-H)或晚期高爾基體標(biāo)記物(Man99TMD23-GFP,ST52-mRFP,I-L)。
注意在所有情況下,ER網(wǎng)經(jīng)常轉(zhuǎn)變?yōu)橛锌椎臒晒馄瑢印?br>
所有標(biāo)尺線段=8μm。
圖14顯示使用共聚焦激光掃描顯微鏡觀察時,BFA(50mg.mL-1)處理2小時對早期和晚期高爾基體標(biāo)記物二者同時再分派到ER和高爾基體簇中的影響 (A-F)分別在不存在或存在BFA時,HDEL-GFP(A、B)和ST52-mRFP(B、E)在BY-2懸浮培養(yǎng)煙草細(xì)胞中的共表達(dá), (G-L)分別在不存在或存在BFA時,Δ19Man49-GFP(G、J)和ST52-mRFP(H、K)在BY-2懸浮培養(yǎng)煙草細(xì)胞中的共表達(dá), (M-R)分別在不存在或存在BFA時,Man99TMD23-GFP(M、P)和ST52-mRFP(N、Q)在BY-2懸浮培養(yǎng)煙草細(xì)胞中的共表達(dá), (C、F、I、L、O、R)在不存在或存在BFA時,GFP融合物+ST-mRFP的相應(yīng)重疊表達(dá)。
圖15是我們在本研究中所用的構(gòu)建體的圖示GCSI與GFP融合的全長擬南芥α-葡萄糖苷酶I/GCS150與GFP融合的GCSI前150個氨基酸/GCS90與GFP融合的GCSI前90個氨基酸/Δ13GCS150從GCS150中刪除前13個N端氨基酸(MTGASRRSARGRI-SEQ ID N°1)/Δ13GCS90從GCS90中刪除前13個N端氨基酸/Hs10-Δ13GCS90將人(Homo sapiens)GCSI的前10個N端氨基酸(MARGERRRRA-SEQ IDN°2)與Δ13GCS90的N端融合/XYLT35與GFP融合的擬南芥β-1,2-木糖基轉(zhuǎn)移酶的前35個氨基酸/XYLT35-GCS(91-150)將XYLT的前35個氨基酸與GCSI腔內(nèi)結(jié)構(gòu)域(luminal domain)的前60個氨基酸(氨基酸91到150)融合并與GFP融合/XYLT35-GCS(70-150)將XYLT的前35個氨基酸與GCSI腔內(nèi)結(jié)構(gòu)域的前80個氨基酸(氨基酸70到150)融合并與GFP融合/GCS13-XYLT35將GCSI的前13個N端氨基酸與XYLT35融合/CNX11-XYLT35將擬南芥鈣聯(lián)結(jié)蛋白(calnexin,CNX)的最后11個氨基酸(NDRRPQRKRPA-SEQ ID N°3)與XYLT35的N端融合/ST52-GFP/mRFP將大鼠α-2,6-唾液酸轉(zhuǎn)移酶(ST)的前52個氨基酸與GFP或mRFP融合/GFP/mRFP-HDEL:GFP或mRFP處于sporamine信號肽和HDEL ER停留序列的控制下,CT胞質(zhì)尾區(qū);TMD跨膜結(jié)構(gòu)域;CD催化結(jié)構(gòu)域。
圖16顯示GCSI嚴(yán)格地在ER中累積在傳代培養(yǎng)(sub-culturing)后將轉(zhuǎn)基因BY-2煙草細(xì)胞系觀察3-4天。皮層(A、C)和中部光學(xué)切片(B、D)顯示,GCSI位于ER(A、B)中,且染色模式與GFP-HDEL(C、D)相似。
標(biāo)尺線段=8μm 圖17顯示N端結(jié)構(gòu)域足以將GCSI定位于ER中像全長構(gòu)建體GCSI一樣,GCS150和GCS90在BY-2細(xì)胞中的ER中累積(分別為A、B和D、E)。它們的靶向在煙草葉表皮細(xì)胞中是一樣的(分別為C和F)。標(biāo)尺線段=8μm 圖18顯示13個氨基酸的N端序列含有ER定位信息。盡管GCS90在BY-2細(xì)胞中的ER中累積(A、B),但是Δ13GCS90定位于高爾基體中(C、D)。盡管XYLT35是高爾基體蛋白質(zhì)(E、F),但是GCS13-XYLT35存在于ER和高爾基體中(G、H)。
標(biāo)尺線段=8μm 圖19顯示富含Arg的ER靶向序列在單獨(dú)表達(dá)或者與mRFP-HDEL(B,E,H,K,N)或ST52-mRFP(C,F(xiàn),I,L,O)一起表達(dá)Δ13GCS90、XYLT35、GCS13-XYLT35、Hs10-GCS90或CNX11-XYT35(A,D,G,J,M)的煙草葉表皮細(xì)胞的界(kingdom)之間是保守的。像在BY-2細(xì)胞中一樣(圖4),Δ13GCS90(A-C)僅位于高爾基體中,而GCS90位于ER中,且Δ13GCS90與ST-mRFP完美地共定位(C、F)。將Δ13GCS90(A-C)與XYLT35(D-F)比較時,顯微照片是相同的。GCS13-XYLT35(G)在與mRFP-HDEL共表達(dá)時,ER顯示為黃色而高爾基體保持綠色(H),但是在與ST52-mRFP共表達(dá)時,高爾基體是黃色而ER是綠色(I),顯示GCS13-XYLT35具有在ER和高爾基體中的雙重定位。有趣的是,可用人GCSI的前10個氨基酸替換GCS90的前13個氨基酸(J-L)Hs10-GCS90嵌合蛋白質(zhì)僅在ER中(J),并與mRFP-HDEL共定位(K),但是不與ST52-mRFP共定位(L)。這表示信號在界之間是保守的。同樣,CNX11-XYL35(M)在與mRFP-HDEL共表達(dá)時,ER顯示黃色而高爾基體保持綠色(N),但是與ST52-mRFP共表達(dá)時,高爾基體是黃色而ER為綠色(O),顯示GCS13-XYLT35也在ER和高爾基體內(nèi)具有雙重定位。
標(biāo)尺線段=8μm 圖20顯示N端精氨酸含有煙草葉表皮細(xì)胞的ER定位信息,所述煙草葉表皮細(xì)胞單獨(dú)表達(dá)GFP融合物(左圖),或者與mRFP-HDEL(中圖)或ST52-mRFP(右圖)共表達(dá)。GCS90(A)與mRFP-HDEL完美地共定位(B,ER為黃色),但是不與ST52-mRFP共定位(C,ER為綠色,高爾基體為紅色)。用Ala(D-F)或Leu(G-I)取代6、7、10和12位的四個Arg時,如在顯微照片F(xiàn)和I上觀察到的黃點(diǎn)所示,R/LGCS90或R/AGCS90僅位于高爾基體中。成對突變Arg時,R/L6-7GCS90(J-L)或R/L10-12GCS90(M-O)或R/L6-L12(P-R)定位于ER和不含有ER可溶蛋白質(zhì)mRFP-HDEL的小點(diǎn)(K,N,Q),并且與高爾基體堆密切關(guān)聯(lián)(L,O,R)但是保持獨(dú)立。這些數(shù)據(jù)顯示,其N端的RR、RXR或RXXR基序賦予GSC90以ER靶向。
標(biāo)尺線段=8μm 圖21顯示R/L6-7與高爾基體密切關(guān)聯(lián)。將R/L6-7GCS90與mRFP-HDEL和ST52-mRFP共表達(dá)時,熒光結(jié)構(gòu)顯示為黃色,表示它們與高爾基體非常密切的關(guān)聯(lián)。
標(biāo)尺線段=8μm 圖22顯示表達(dá)與Sar1p-mRFP(圖B、E和K)或Sar1p-GTP-mRFP(圖H和N)融合的GFP融合物的煙草葉表皮細(xì)胞。成對突變Arg時,將R/L6-7GCS90(A-C)或GCS90(D-I)與突變或未突變的Sar1p共表達(dá),對GFP融合物而言未觀察到標(biāo)記修飾。相反,R/LGCS90與Sar1p-GTP的共表達(dá)(M-O)阻斷了ER中R/LGCS90的轉(zhuǎn)運(yùn),而與Sar1p的共表達(dá)未修飾R/LGCS90的模式。
標(biāo)尺線段=8μm 圖23顯示N端精氨酸基序不是AtGCSI的ER停留的關(guān)鍵決定簇。在瞬時GCS150-GFP(A)、GCS90-GFP(B)和Δ13GCS150-GFP(C)轉(zhuǎn)化的煙草葉表皮細(xì)胞中使ER顯影,皮層切片。通過與mRFP-HDEL(E)和ST52-mRFP(G)共表達(dá)來驗證Δ13GCS150-GFP的ER定位,皮層切片。盡管具有二精氨酸基序,但是該II型膜蛋白的前13個氨基酸似乎不參與GCS150-GFP的ER靶向。(D)(F)(H)在瞬時Δ13GCS90-GFP轉(zhuǎn)化的煙草葉表皮細(xì)胞(D)和共表達(dá)mRFP-HDEL(F)或ST52-mRFP(H)的煙草葉表皮細(xì)胞中使高爾基體顯影,皮層切片。與GCS150-GFP相反,對GCS90-GFP而言前13個氨基酸在ER靶向中是關(guān)鍵性的。腔內(nèi)結(jié)構(gòu)域側(cè)翼的氨基酸可含有ER靶向信息。標(biāo)尺線段8μm 圖24顯示腔內(nèi)靶向決定簇足以將XYLT35保留在ER中 (A)在瞬時XYLT35-GFP轉(zhuǎn)化的煙草葉表皮細(xì)胞中使高爾基體顯影,皮層切片。
(B)(C)在將XYLT35-GCS60(B)、XYLT35-GCS80(C)與ST52-mRFP共表達(dá)的煙草葉表皮細(xì)胞中瞬時顯影ER和高爾基體,皮層切片。AtGCSI的腔內(nèi)結(jié)構(gòu)域?qū)⒋蟛糠諼YLT35再定位于ER中。標(biāo)尺線段=8μm 圖25顯示通過共聚焦顯微鏡對BY-2細(xì)胞中的GFP融合物進(jìn)行定位分析;皮層(A)或橫截面(B)視圖。已將我們小組中最近鑒定的信號與GFP融合,并且在BY-2煙草細(xì)胞中穩(wěn)定表達(dá)后分析了重組蛋白的定位。像GFP-HDEL融合物一樣,GFP與信號1、2、3或4的融合物使ER高亮(圖A-F)。GFP與信號5、6、7、8或9的融合物使ER高亮,但是也使同化(assimilate)進(jìn)高爾基體簇中的聚集物高亮,像對照ManI-GFP那樣(圖G-L)。GFP與信號11-12的融合物僅使同化進(jìn)高爾基體簇中的聚集物高亮,像對照XylT35-GFP和D13Glu90-GFP那樣(圖M-O)。最后,GFP與信號的融合物使同化進(jìn)高爾基體簇中的聚集物高亮,但是也使溶酶體區(qū)室高亮(圖R)。
圖26顯示帶有二精氨酸基序的重組蛋白的定位。帶有一個或兩個二精氨酸基序的重組蛋白與mRFP-HDEL ER標(biāo)記物共定位(A-C;G-R),而精氨酸的突變導(dǎo)致重組蛋白與ST52-mRFP高爾基體標(biāo)記物共定位(D-F)。
圖27顯示I型或II型膜蛋白上靶向信號的定位。
圖28展示了抗體或抗體片段能將膜蛋白靶向至分泌途徑中的不同區(qū)室,所述抗體或抗體片段對膜蛋白具有特異性,并與本文所述靶向序列之一融合。此處使用定位在高爾基體中的GFP進(jìn)行展示。圖A和B中展示了用于scFv靶向表達(dá)的質(zhì)粒的結(jié)構(gòu)和一些質(zhì)粒實例。此處(圖C),單獨(dú)表達(dá)時位于高爾基體中的膜蛋白(GFP-高爾基體)在相同的植物細(xì)胞中與和SEQ ID NO33融合的GFP特異性scFv共同表達(dá)時,再定位至ER/高爾基體區(qū)室。
圖29展示了異源酶(此處為人β1,4-半乳糖基轉(zhuǎn)移酶)在與本文所述的靶向信號之一融合后,可被靶向在植物分泌途徑的不同區(qū)室中。作為實例,圖B展示了用于在植物細(xì)胞中表達(dá)人β1,4-半乳糖基轉(zhuǎn)移酶與SEQID NO8、33、36或38融合物的質(zhì)粒。
圖30展示了與人β1,4-半乳糖基轉(zhuǎn)移酶通過其自身的人靶向序列被靶向至植物分泌途徑中時獲得的糖基化模式(圖A)相比,在該糖基轉(zhuǎn)移酶催化結(jié)構(gòu)域與SEQ ID NO36融合后人β-1,4-半乳糖基轉(zhuǎn)移酶的定向表達(dá)顯著提高了該異源糖基轉(zhuǎn)移酶的效率(圖B)。
圖31展示了所制備的質(zhì)粒之一,所述質(zhì)粒用于在
肽生產(chǎn)的蛋白質(zhì)體中累積聚糖成熟酶。本文詳述的質(zhì)粒允許在植物細(xì)胞中表達(dá)與
融合的甘露糖苷酶。
實施例 實施例A將蛋白質(zhì)定位至ER和/或GA(附圖3A) 實施例1鑒定靶向信號 1.早期高爾基體II型膜蛋白的定位 為了更好地理解允許N-聚糖加工酶在早期高爾基體區(qū)室中選擇性停留的機(jī)制,在煙草BY-2細(xì)胞中穩(wěn)定表達(dá)后研究與N-聚糖加工機(jī)器四個不同成員(α-糖苷酶I、甘露糖苷酶I、N-乙酰葡糖氨基轉(zhuǎn)移酶I和b-1,2-木糖基轉(zhuǎn)移酶,附圖4)融合的一系列GFP融合物的定位。
如Saint-Jore-Dupas等,2006(參考文獻(xiàn)58)中所公開制備用于表達(dá)GFP融合蛋白的構(gòu)建體。所有甘露糖苷酶I融合構(gòu)建體均衍生自由Nebenführ等(1999)(參考文獻(xiàn)43)最初描述的全長GFP融合物(本文中稱作ManI-GFP)。
首先,在ManI和GFP編碼區(qū)之間引入含AatII限制性位點(diǎn)的連接子。與預(yù)測的莖區(qū)末端附近的天然AatII位點(diǎn)組合,這允許簡單地去除催化結(jié)構(gòu)域,得到Man99-GFP。
接著,為了便于去除N端區(qū)域的特定區(qū)段,通過PCR誘變引入三個新的限制性位點(diǎn)緊接起始密碼子后的一個NheI位點(diǎn)、密碼子21和22處的一個SpeI位點(diǎn),以及密碼子50和51處的另一個AatII位點(diǎn)。通過測序驗證所修飾構(gòu)建體的完整性。在該新的構(gòu)建體中,可用NheI和SpeI去除胞質(zhì)尾區(qū)得到Δ19CTManI-GFP,而AatII消化會去除ManI的整個腔內(nèi)(lumenal)部分得到Man49-GFP。這兩種方法組合得到Δ19CTMan49-GFP。最后,合成了編碼帶有起始密碼子的TMD結(jié)構(gòu)域18個氨基酸的正向(5′-GATCCTTGGGAATGCTTGCTCTGCTCTTCATCGTTTTCGTTTGTGTCTCTTTCGTTTTCTGGGACCGTCAAA-3’(SEQ ID N°40))和反向(5′-CTAGTTTGACGGTCCCAGAAAAGGAAAGAGACACAAACGAAAACGATGAAGAGCAGAGCAAGCATTCCCAAG-3’(SEQID N°41))寡核苷酸,將其融合并亞克隆進(jìn)含有無任何起始密碼子的GFP的pBLTI121二元載體(Kiefer-Meyer等,未公開的數(shù)據(jù))中,得到DCTMan49-GFP。使用相同的策略,用正向引物(5′-GATCCTTGGGAATGGCTGCTGCTCTTGCTCTGCTCTTCATCGTTTTCGTTTGTGTCTCTTTCGTTTTCTGGGACCGTCAAA-3’(SEQ ID N°42))和反向引物(5′-CTAGTTTGACGGTCCCAGAAAACGAAAGAGACACAAACGAAAACGATGAAGAGCAGAGCAAGAGCAGCAGCCATTCCCAAG-3’SEQ ID N°43)產(chǎn)生MAAMan49-GFP。
第三,在對上述經(jīng)修飾ManI進(jìn)行的兩步式PCR誘變中,引入更長的TMD區(qū)域。在第一步中,用BspEI位點(diǎn)代替TMD后方的AatII位點(diǎn)。在第二步中,使用長PCR引物復(fù)制所預(yù)測TMD的最后七個氨基酸,得到ManTMD23-GFP。最后,用AatII去除該構(gòu)建體的催化結(jié)構(gòu)域,得到Man99TMD23-GFP。
上述所有克隆步驟在pBluescript中進(jìn)行。然后將完成的表達(dá)盒(包括雙35S啟動子和Nos終止子)移至pBIN20。
為了獲得編碼ST-mRFP的植物二元載體,用pVKH18En6 ST-GFP(Saint-Jore等,2002(參考文獻(xiàn)56))中的單體RFP(由Roger Tsien提供)代替GFP。ST-mRFP的表達(dá)處于6×串聯(lián)重復(fù)的CaMV 35S啟動子的控制下。
使用編碼N-乙酰葡糖氨基轉(zhuǎn)移酶的煙草cDNA作為模板,通過PCR擴(kuò)增GNTI-GFP、GNT38-GFP(Strasser等,1999(參考文獻(xiàn)60))。使用反向引物5′GGTCACTAGTATCTTCATTTCCGAGTTG-3’(SEQ ID N°44)和5′-GGTCACTAGTGCGATCTGCATATTCTGACTG-3’(SEQ ID N°45)以及正向引物5-AACGTCTAGAATGAGAGGGTACAAGTTTTGC-3’(SEQ ID N°46)進(jìn)行PCR,以擴(kuò)增GNTI和GNTI的N端38個氨基酸末端,分別獲得GNTI-GFP和GNT38-GFP。為了表達(dá)GCSI-GFP,使用Boisson等,2001中克隆的擬南芥cDNA通過PCR擴(kuò)增總cDNA,與GFP的N端融合并亞克隆在pBLTI121中(Pagny等,2003(參考文獻(xiàn)50))。然后通過PCR用正向引物(5’-CGGGGTACCCCATGACCGGAGCTAGCCGT-3’(SEQ IDN°48))和反向引物(5’-GACTAGAAAAGGAG下GATAACCCT-3’(SEQ IDN°49))擴(kuò)增前90個氨基酸,并亞克隆進(jìn)pBLTI121二元載體中所包含GFP5′端的Spe I限制性位點(diǎn)中,得到GCS90-GFP。以相同的方式,使用正向引物(5′-CGGGGTACCCCATGAAATCATCATCATTATCTCCC-3′(SEQ ID N°49))和與上文相同的反向引物,通過PCR來擴(kuò)增缺失前13個氨基酸的90個氨基酸,得到D13GCS90-GFP。
如先前在另一獨(dú)立細(xì)胞系中針對該構(gòu)建體所述的(Nebenfuhr等,1999(參考文獻(xiàn)43)),通過共聚焦激光掃描顯微鏡檢測通過細(xì)胞質(zhì)移動的小體中全長ManI-GFP融合物的熒光(附圖5A和5B)。
另外,在遍布細(xì)胞質(zhì)的網(wǎng)狀網(wǎng)絡(luò)(reticulate network)中觀察到顯著的熒光信號,所述網(wǎng)絡(luò)與通過GFP-HDEL構(gòu)建體染色的ER網(wǎng)絡(luò)是可以區(qū)分的(附圖5D和5E)。為了檢驗ER標(biāo)記是否是由于重組蛋白的過表達(dá)所致,用蛋白質(zhì)合成抑制劑環(huán)己酰亞胺孵育表達(dá)ManI-GFP的BY-2細(xì)胞。處理2小時后,靶向模式保持不變,這顯示ManI-GFP的穩(wěn)態(tài)定位是高爾基體和ER(比較附圖5C和5B)。
為了證實熒光點(diǎn)是高爾基體堆,將細(xì)胞用50mg.mL-1布雷菲德菌素A(BFA)處理2小時。該BFA處理引起綠色點(diǎn)消失,而皮質(zhì)和經(jīng)血管的ER熒光變得更亮(將附圖5F與附圖5B和5E比較),如先前針對在煙草葉表皮和BY-2懸浮培養(yǎng)細(xì)胞中表達(dá)的若干定位于高爾基體的GFP融合蛋白所述(Saint-Jore等,2002(參考文獻(xiàn)56);Ritzenthaler等,2002(參考文獻(xiàn)54))。
為了將ManI與分泌途徑中其它植物N-糖基化酶之一的定位進(jìn)行比較,分析了相同條件下在ManI之前、之后立刻或之后很久發(fā)揮作用的N-聚糖成熟酶的亞細(xì)胞定位。研究的第一種酶是來自擬南芥的α-葡萄糖苷酶I(GCSI)。該II型膜蛋白與新生糖蛋白結(jié)合后立即修剪來自ER中前體寡糖的第一個糖殘基(見附圖2B中植物N-聚糖成熟的圖示)。將全長蛋白質(zhì)(Boisson等,2001(參考文獻(xiàn)6))與GFP融合,并且與COS細(xì)胞中人GCSI所顯示一致地(Hardt等,2003(參考文獻(xiàn)28)),在BY-2細(xì)胞中融合蛋白僅位于ER中(附圖5G)。
研究的第二個候選者來自煙草(GNTI)(Strasser等,1999(參考文獻(xiàn)60))。該糖基轉(zhuǎn)移酶在ManI去除a-1,2-甘露糖后不久在N-聚糖上添加第一個N-乙酰葡糖胺殘基(附圖2B)。將全長蛋白質(zhì)與GFP融合,并在煙草BY-2懸浮培養(yǎng)細(xì)胞中表達(dá)GNTI-GFP。有趣的是,該融合物的穩(wěn)態(tài)定位是高爾基體和ER(附圖5H),與ManI-GFP的模式非常相似(比較附圖5H和5B)。這些數(shù)據(jù)有力地指出,在煙草BY-2懸浮培養(yǎng)細(xì)胞中,被認(rèn)為很早在高爾基體中發(fā)揮作用的N-聚糖加工酶(如ManI和GNTI)被靶向至高爾基體,也靶向至ER。
最后,來自擬南芥的第三個候選者b-1,2-木糖基轉(zhuǎn)移酶(XylT)僅位于高爾基體中(附圖5),證實了Pagny等(2003)(參考文獻(xiàn)50)的結(jié)果,他們證明了該酶的N端末端將GFP靶向至高爾基體堆的中間囊膜亞組。
為了確定蛋白質(zhì)表達(dá)水平是否會改變我們的融合蛋白的定位,在表達(dá)融合蛋白的不同穩(wěn)定獨(dú)立細(xì)胞系中驗證了這些結(jié)果。總在傳代培養(yǎng)的第三或第四天進(jìn)行細(xì)胞成像,所述時間在我們的培養(yǎng)條件下對應(yīng)于最佳生長期。然而為了進(jìn)一步確認(rèn)ER標(biāo)記不是由于融合物的過表達(dá),通過證實其在環(huán)己酰亞胺處理2小時后不改變來控制每種融合物的標(biāo)記模式。
用抗GFP抗體顯示的Western印跡和ECL染色顯示了高于背景的極低的重組蛋白信號,這表明該研究中所有融合蛋白的低表達(dá)水平(數(shù)據(jù)未顯示)。融合蛋白表達(dá)水平與功能性不飽和分泌途徑相容的另一個證據(jù)得自共表達(dá)實驗,其中在相同的細(xì)胞中ManI-GFP位于ER和高爾基體二者中,而高爾基體標(biāo)記物(ST52-mRFP)僅位于高爾基體中(附圖7A-C)。
總而言之,在這些小心控制的條件下獲得的結(jié)果清楚地顯示,N-糖基化酶被特異性地僅靶向ER(GCSI)或高爾基體(XylT),但是一些酶具有在兩種細(xì)胞器中的雙重穩(wěn)態(tài),ManI和GNTI以及其它膜蛋白如脯氨酰4-羥化酶就是這種情況(Yuasa等,2005(參考文獻(xiàn)65))和ERD2(Boevink等,1998(參考文獻(xiàn)5);Saint-Jore等,2002(參考文獻(xiàn)56))。
在下一步中,研究了負(fù)責(zé)靶向顯示在高爾基體/ER中的雙重穩(wěn)態(tài)分布之糖基化酶群體的信號。
2.顯示腔內(nèi)結(jié)構(gòu)域不是ManI和GNTI靶向高爾基體和ER所必需的實驗 關(guān)于該實驗,三種植物糖基化酶GNTI、XylT和擬南芥ManI(附圖2)的特異性高爾基體停留表明,其特異性靶向由其N端部分中含有的信號介導(dǎo),包括胞質(zhì)尾區(qū)、TMD以及GNTI的莖(Essl等,1999(參考文獻(xiàn)16)、Dirnberger等,2002(參考文獻(xiàn)15);Pagny等,2003(參考文獻(xiàn)50);Strasser等,2006(參考文獻(xiàn)61))。本實施例研究了腔內(nèi)結(jié)構(gòu)域在ManI和GNTI靶向中的作用。
為了確定位于高爾基體腔中的ManI部分在該糖苷酶向高爾基體和ER膜的靶向中是否起作用,將ManI的前99個氨基酸(CT+TMD+S)或前49個氨基酸(CT+TMD)與GFP融合,并將相應(yīng)的嵌合蛋白質(zhì)分別命名為Man99-GFP和Man49-GFP(附圖4)。將Man99-GFP和Man49-GFP在BY-2懸浮培養(yǎng)細(xì)胞中穩(wěn)定表達(dá),或通過葉浸潤在煙草葉表皮細(xì)胞中瞬時表達(dá)。在兩種表達(dá)體系中的高爾基體和ER中均觀察到Man99-GFP和Man49-GFP嵌合蛋白質(zhì)(分別見附圖6A、6B、6E和6D、6F),正如先前針對全長構(gòu)建體所觀察到的(附圖5A和5B)。
重要的是應(yīng)該注意,在煙草葉中瞬時表達(dá)這些截短的融合物時,在轉(zhuǎn)化后5天仍然觀察到ER標(biāo)記,此時總體表達(dá)水平已經(jīng)大幅下降(附圖6F),而XylT35-GFP僅位于高爾基體中(Pagny等,2003(參考文獻(xiàn)50);附圖6I)。這進(jìn)一步證實了ManI融合物在ER中的局部定位不是由于嵌合蛋白質(zhì)的過表達(dá)。另外,用蛋白質(zhì)合成抑制劑環(huán)己酰亞胺將表達(dá)Man99-GFP的BY-2細(xì)胞處理2小時后,ER標(biāo)記未消失(附圖6C),如針對全長融合物所觀察的(與附圖5C比較)。
為了更好地了解融合蛋白位于高爾基體堆中的何處,通過用單體紅色熒光蛋白(mRFP,Campbell等,2002(參考文獻(xiàn)11))代替GFP,將ManI-GFP與衍生自ST52-GFP的反面高爾基體標(biāo)記物ST52-mRFP共表達(dá)(Saint-Jore等,2002(參考文獻(xiàn)56);Runions等,2006(參考文獻(xiàn)55))。在BY-2細(xì)胞中同時表達(dá)兩種嵌合蛋白時,與ManI-GFP相反,在ER中未檢測到ST52-mRFP,并且在高爾基體中觀察到兩種熒光信號,但并未完美地共定位(附圖7A-C)。這些結(jié)果與證明以下結(jié)果的先前研究是一致的 1)ManI-GFP融合物位于BY-2細(xì)胞中高爾基體順面的一半中(Nebenführ等,1999(參考文獻(xiàn)43))和 2)大鼠a-2,6-唾液酸轉(zhuǎn)移酶的52個氨基端氨基酸足以將報告蛋白主要靶向至高爾基體堆反面的一半(Boevink等,1998(參考文獻(xiàn)5))。
因此,共聚焦顯微鏡足以顯示,ManI-GFP和ST52-mRFP在高爾基體中不同囊膜亞組中累積。最后,與反面高爾基體標(biāo)記物ST52-mRFP共表達(dá)Man99-GFP或Man49-GFP時,兩種熒光團(tuán)僅部分重疊(分別見附圖7D-F和7G-I),提示截短融合蛋白的高爾基體內(nèi)定位與全長融合物ManI-GFP相同。
煙草GNTI的前77個N端氨基酸(包括CT、TMD和莖)先前被描述為含有維持該糖基轉(zhuǎn)移酶高爾基體停留所需的信息(Essl等1999(參考文獻(xiàn)16))。與GFP融合的該多肽結(jié)構(gòu)域已顯示偏好定位于高爾基體中,但是在ER中也檢測到該嵌合蛋白,如針對全長構(gòu)建體所觀察到的(附圖5H)。為了確定保留在高爾基體腔中的序列是否參與GNTI的高爾基體和ER靶向,去除該糖基轉(zhuǎn)移酶的腔內(nèi)部分(39個氨基酸)并將剩余的前38個N端氨基酸(CT+TMD)與GFP融合(附圖4)。該融合蛋白被稱作GNT38-GFP,并在BY-2懸浮培養(yǎng)細(xì)胞中穩(wěn)定表達(dá),或在煙草葉表皮細(xì)胞中瞬時表達(dá)。
在兩種表達(dá)體系中,GNT38-GFP均定位于高爾基體和ER中(附圖6G和6H),如先前針對全長構(gòu)建體所觀察的(GNTI-GFP。附圖5H)。另外,當(dāng)GNT38-GFP與ST52-mRFP在BY-2細(xì)胞中穩(wěn)定共表達(dá)時,如先前用Man99-GFP和Man49-GFP所觀察到的,兩種熒光點(diǎn)重疊,但是一些紅色熒光可以與黃色區(qū)分,提示GNT38-GFP不是如先前針對ManI所觀察的那樣位于反面高爾基體中(附圖7J-L)。
從這些結(jié)果可明顯看出,ManI和GNTI的胞質(zhì)尾區(qū)和TMD均足以將這些糖基化酶靶向至它們的穩(wěn)態(tài)定位ER和早期高爾基體區(qū)室。相反,在BY-2細(xì)胞(Pagny等,2003(參考文獻(xiàn)50))和煙草葉表皮細(xì)胞(附圖6I)中,同樣的結(jié)構(gòu)域(CT+TMD)均將XylT35-GFP僅靶向至高爾基體中。
3.顯示胞質(zhì)尾區(qū)不是ManI在分泌途徑早期區(qū)室中停留所必需的實驗 存在于哺乳動物和酵母ER和/或高爾基體中的許多膜結(jié)合蛋白的N端胞質(zhì)區(qū)含有下述信號,所述信號便于其從高爾基體中回收至ER(Teasdale和Jackson,1996(參考文獻(xiàn)62);Zerangue等,1999(參考文獻(xiàn)66))或其從ER輸出至高爾基體(Giraudo和Maccioni,2003(參考文獻(xiàn)20))。在植物中,胞質(zhì)尾區(qū)的長度在不同糖苷酶和糖基轉(zhuǎn)移酶之間可廣泛變化(附圖8)。例如,GCSI和ManI含有長胞質(zhì)尾區(qū)(分別為51/29個氨基酸)。相比之下,GNTI和XylT的CT僅由11個氨基酸組成。
為了更精確地定義ManI的靶向信號以及研究該糖苷酶相對長的胞質(zhì)區(qū)(29個氨基酸)在該靶向中的作用,產(chǎn)生兩種融合蛋白D19Man-GFP和D19Man49-GFP。在后兩種蛋白質(zhì)中,去除19個氨基酸,使得CT被縮短至10個氨基酸,像XylT和GNTI的CT一樣。該截短去除了可能在ER到高爾基體的轉(zhuǎn)運(yùn)中發(fā)揮作用的可能的二元基序(KxR)(Giraudo和Maccioni,2003(參考文獻(xiàn)20)),但保留了另一可能的ER輸出信號。嘗試了完全去除CT(DCTMan49-GFP,附圖4),但是無法在煙草細(xì)胞中表達(dá)該融合蛋白。為了在CT的剩余10個氨基酸中尋找靶向決定簇,用人工序列MAAA代替CT序列(MAAAMan49-GFP,附圖4)。該人工序列不含有任何已知的靶向序列,并且不影響疏水跨膜結(jié)構(gòu)域的長度。
已在煙草細(xì)胞中表達(dá)了三種構(gòu)建體MAAAMan49-GFP、D19Man-GFP和D19Man49-GFP。后兩者標(biāo)記ER和高爾基體(附圖9A-D),正像其來源的構(gòu)建體一樣(分別為附圖5A、5B和6D、6F)。另外,含有人工MAAA CT的融合蛋白位于相同區(qū)室中(附圖9E),這表明N端胞質(zhì)區(qū)不是ManI靶向所必需的,因此其穩(wěn)態(tài)定位于ER和高爾基體所需的所有信息均包含在MAAAMan49-GFP構(gòu)建體的20個氨基酸內(nèi),即TMD和C端側(cè)翼氨基酸中。
4.顯示跨膜結(jié)構(gòu)域(TDM)長度在ManI的高爾基體靶向和亞區(qū)室化(subcompartimentation)中起關(guān)鍵作用的實驗 對哺乳動物細(xì)胞而言,已提出了若干模型來解釋II型膜蛋白是如何以不同水平停留在高爾基體內(nèi)的。
根據(jù)第一種模型——“親緣識別(kin recognition)”模型(Nilsson等,1993b(參考文獻(xiàn)45)),同源/異源寡聚化引起的N-聚糖成熟酶聚集會防止得到的大復(fù)合物遞送至分泌小泡以及繼續(xù)在分泌途徑中向下游轉(zhuǎn)運(yùn)。
這類結(jié)合首先被報道的實例之一涉及a-甘露糖苷酶II和GNTI,它們是位于中間高爾基體的兩種糖基化酶,并依次在哺乳動物N-聚糖成熟中發(fā)揮作用(Nilsson等,1994(參考文獻(xiàn)46))。應(yīng)當(dāng)注意,該模型最先推測存在穩(wěn)定的高爾基體囊膜以及分泌負(fù)荷通過囊泡穿梭機(jī)制順行流動(Nilsson等,1993b(參考文獻(xiàn)45))。為了適合囊膜進(jìn)展/成熟概念,“親緣識別”模型必須被修飾,以允許寡聚復(fù)合物被優(yōu)先包裝在逆行的囊泡中(Füllekrug和Nilsson,1998(參考文獻(xiàn)18))。
第二種模型——脂雙層模型(Bretscher和Munro,1993(參考文獻(xiàn)10))提出,聚糖成熟酶TMD長度和每種細(xì)胞器膜脂雙層的厚度之間的匹配決定了定位,因為每種細(xì)胞器具有其特定的膜脂組成,并因而具有其自身的厚度(Hartmann和Benveniste,1987(參考文獻(xiàn)29);Lynch,1993(參考文獻(xiàn)33);Moreau等,1998(參考文獻(xiàn)36);Morré和Mollenhauer,1974(參考文獻(xiàn)37))。
根據(jù)膜厚度模型,分泌途徑中N-聚糖成熟酶的分布以其TMD的長度為基礎(chǔ)(Bretscher和Munro,1993(參考文獻(xiàn)10))。分泌途徑細(xì)胞器的膜在厚度上從ER到質(zhì)膜逐漸提高。ER和順面高爾基體膜僅為4-5nm厚,而反面高爾基體、分泌小泡的膜和質(zhì)膜為8-9.5nm厚(Grove等,1968(參考文獻(xiàn)26);Morré和Mollenhauer,1974(參考文獻(xiàn)37))。另外,先前在動物系統(tǒng)中(Munro 1991,1995a,1995b(參考文獻(xiàn)38))以及對I型蛋白質(zhì)而言也在植物細(xì)胞中(Brandizzi等,2002a(參考文獻(xiàn)9)),通過研究報告蛋白在改變其TMD長度后的定位而顯示了與TMD長度相關(guān)的靶向。這意味著,特定區(qū)室的膜僅能夠接受長度匹配的疏水TMD。
比較揭示,高爾基體蛋白質(zhì)TMD的長度比質(zhì)膜蛋白質(zhì)的TMD長度平均短5個氨基酸(Masibay等,1993(參考文獻(xiàn)41);Munro,1995a(參考文獻(xiàn)48))。一些實例支持了這一模型。大鼠a-2,6-唾液酸轉(zhuǎn)移酶和牛b-1,4-半乳糖基轉(zhuǎn)移酶TMD長度的增加降低了這些糖基轉(zhuǎn)移酶的高爾基體停留。另外,由17個亮氨酸組成的合成的I型TMD導(dǎo)致淋巴細(xì)胞表面抗原CD8胞外結(jié)構(gòu)域的高爾基體停留,而在細(xì)胞表面發(fā)現(xiàn)數(shù)量增加的23個亮氨酸的TMD(Masibay等,1993(參考文獻(xiàn)41);Munro,1991(參考文獻(xiàn)47),1995b(參考文獻(xiàn)49))。另外,通過插入1-9個疏水氨基酸逐漸增加18個氨基酸的a-2,6-唾液酸轉(zhuǎn)移酶TMD長度也導(dǎo)致相似的a-2,6-唾液酸轉(zhuǎn)移酶-溶菌酶嵌合體的細(xì)胞表面表達(dá)提高,而質(zhì)膜蛋白TMD長度的降低導(dǎo)致其在高爾基體中停留增加(Munro,1995b(參考文獻(xiàn)49))。
在植物細(xì)胞中,通過改變兩種與GFP融合的I型膜蛋白中TMD的長度,獲得了支持膜蛋白沿內(nèi)膜系統(tǒng)亞區(qū)室化與TMD長度相關(guān)的初步數(shù)據(jù)(Brandizzi等,2002a(參考文獻(xiàn)9))。
首先,將含23個氨基酸的TMD的人溶酶體膜蛋白LAMP1與GFP融合并在煙草葉中表達(dá)。融合物定位于質(zhì)膜中。相反,將TMD縮短至20和17個氨基酸時,GFP嵌合體分別定位于高爾基體和ER膜。其次,液泡分選受體BP80的19個氨基酸長的TMD將GFP靶向至高爾基體,而22個氨基酸的延長TMD將GFP靶向至質(zhì)膜。
研究了II型膜蛋白ManI的TMD長度,以了解其能夠怎樣影響其在高爾基體中的亞區(qū)室化。具體地,通過重復(fù)該結(jié)構(gòu)域的最后七個氨基酸,將TMD長度從16提高至23。與其定位于ER和高爾基體順面一半的含16氨基酸TMD的同源物相反,帶有23氨基酸TMD的嵌合體蛋白質(zhì)僅定位于高爾基體,更精確而言是定位于高爾基體堆的反面一半中。
在本實施例中,ManI靶向所需的信息包含在含有16氨基酸TMD的20氨基酸(aa)序列中。為了研究TMD的長度是否能夠在該II型膜蛋白在早期植物分泌途徑中的靶向中起關(guān)鍵作用,設(shè)計了兩種融合蛋白ManTMD23-GFP和Man99TMD23-GFP,其中通過重復(fù)其最后七個氨基酸將ManI的TMD從16個氨基酸延長至23個氨基酸(附圖4)。在BY-2懸浮培養(yǎng)細(xì)胞和煙草葉表皮細(xì)胞中表達(dá)ManTMD23-GFP和Man99TMD23-GFP。在兩種植物表達(dá)體系中,ManTMD23-GFP和Man99TMD23-GFP均僅定位于亮點(diǎn)(附圖10A、10B、10D)中,對真菌毒素布雷菲德菌素A敏感(50μg.mL-1,2h,附圖11C)。ManTMD23-GFP和Man99TMD23-GFP的表達(dá)模式與在BY-2懸浮培養(yǎng)細(xì)胞和煙草葉表皮細(xì)胞中均僅定位于高爾基體中的XylT-GFP融合物(附圖10)或ST52-mRFP融合物(附圖10)相似,如先前通過電子顯微鏡所證實的(Boevink等,1998(參考文獻(xiàn)7);Pagny等,2003(參考文獻(xiàn)63))。
為了進(jìn)一步研究ManTMD23-GFP和Man99TMD23-GFP的亞區(qū)室化,建立了共表達(dá)這些GFP融合物之一與ST52-mRFP的穩(wěn)定的BY-2懸浮培養(yǎng)細(xì)胞。在重疊的圖中,綠點(diǎn)與紅點(diǎn)無法分開,表明含23氨基酸TMD的GFP融合物已在高爾基體內(nèi)朝向反面移動,使得它們在共聚焦水平上與ST52-mRFP共定位(與附圖10比較)。有趣的是,皮層圖像(cortical image)(附圖8D-F)與橫切片(附圖10G-I)相比點(diǎn)模式是類似的,支持了具有更長TMD的Man-GFP融合物與反面高爾基體標(biāo)記物ST52-mRFP完美共定位的推測。相反,中間高爾基體標(biāo)記物(XylT35-GFP)和反面高爾基體標(biāo)記物(ST52-mRFP)產(chǎn)生在重疊圖像中未完美重疊的熒光點(diǎn)(附圖10J-L)。
與使用多克隆抗GFP抗體的免疫金標(biāo)記聯(lián)用的電子顯微術(shù)使得我們可以更精確地確定這些融合蛋白的高爾基體內(nèi)定位。如附圖11中所示的,Man99-GFP融合物主要在高爾基體的順面累積(附圖11B),而Man99TMD23-GFP融合物則主要定位于高爾基體的反面(附圖11C)。
用ManI-GFP和ManTMD23-GFP獲得相似的結(jié)果(數(shù)據(jù)未顯示)。使用免疫前血清或野生型煙草BY-2懸浮培養(yǎng)細(xì)胞的對照實驗顯示沒有或幾乎沒有非特異性高爾基體標(biāo)記(附圖11A)。
該結(jié)果證明,TMD足以賦予與全長蛋白ManI相同的定位,該數(shù)據(jù)提示,TMD長度是該II型膜蛋白在高爾基體堆和ER內(nèi)精確定位的決定性因素。因此,預(yù)計蛋白質(zhì)-脂質(zhì)相互作用在分泌途徑內(nèi)ManI的靶向中起關(guān)鍵作用。
有趣的是,這些結(jié)果還清楚地指出了植物分泌體系中I型和II型膜蛋白的靶向?qū)MD長度需求的差異。事實上,XylT的23氨基酸TMD(Dirnberger等,2002(參考文獻(xiàn)15);Pagny等,2003(參考文獻(xiàn)50))或ManII的22氨基酸TMD(Strasser等,2006(參考文獻(xiàn)60))將GFP僅靶向至高爾基體。此外,在本實驗中,具有延長的TMD(23個氨基酸)的ManI也僅在高爾基體中檢測到。相反,I型膜蛋白的23氨基酸TMD和BP80中延長的22氨基酸TMD將GFP靶向至質(zhì)膜(Brandizzi等,2002a(參考文獻(xiàn)8))。
使膜蛋白停留在具有給定厚度膜內(nèi)的TMD長度需求可取決于蛋白質(zhì)的拓?fù)鋵W(xué)結(jié)構(gòu)(I型或II型)。
盡管這些實驗清楚地證明了TMD長度在ManI蛋白質(zhì)靶向中的作用,但是其它實驗顯示,另一些酶的正確定位需要其它信號。例如,與高爾基體較晚期部分中TMD更長的趨勢相反,具有18氨基酸TMD的ST52-GFP融合物被發(fā)現(xiàn)與具有23氨基酸TMD的XylT35-GFP融合物(Pagny等,2003(參考文獻(xiàn)50))相比處于反面高爾基體中更下游處(Boevink等,1998(參考文獻(xiàn)5);Wee等,1999(參考文獻(xiàn)63))。
在用于瞬時表達(dá)的其它植物系統(tǒng)中獲得了相似的結(jié)果。事實上,在大豆(附圖12A)或番茄(附圖12C)中,Man99-GFP定位于高爾基體和ER中,而Man99TMD23-GFP在這兩種表達(dá)體系中幾乎都僅存在于高爾基體中(附圖12B和12D)。
即便是在本文以GCSI顯示的情況下,實驗也顯示CT中含有的額外信息是正確靶向所需要的,所述GCSI的TMD是迄今為止針對植物糖基化酶所鑒定的最短的TMD之一并且允許在ER中定位。因此,對GCSI進(jìn)行的計算機(jī)模擬分析和誘變研究與TMD長度作為糖基化酶在植物分泌體系中區(qū)室化的唯一信號是不一致的。
換言之,盡管TMD長度對于ER和/或順面高爾基體中的ManI靶向具有關(guān)鍵作用,但是用GCSI獲得的結(jié)果顯示,一些膜蛋白在ER或高爾基體膜中的特異定位也可以同時取決于蛋白質(zhì)-脂質(zhì)相互關(guān)系(通過TMD)和蛋白質(zhì)-蛋白質(zhì)相互關(guān)系(通過特異的分選基序)。胞質(zhì)配偶體如高爾基體基質(zhì)蛋白或胞質(zhì)調(diào)節(jié)因子的鑒定使得能夠解釋該第二模型中涉及的用于將N-聚糖成熟酶沿植物分泌途徑分配的機(jī)制。
以不同水平定位于高爾基體中的酶的大集合允許測試下述問題是否高爾基體堆中所有囊膜響應(yīng)于真菌毒素布雷菲德菌素A(BFA)處理而與ER融合。事實上,在使用BFA的2小時實驗期間,含16或23氨基酸TMD的Man-GFP融合物以及ST52-mRFP均返回ER或高爾基體簇中。這些結(jié)論與先前公開的結(jié)果一致(附圖12)(Nebenführ等,2002(參考文獻(xiàn)43);Ritzenthaler等,2002(參考文獻(xiàn)54))。
總而言之,這些結(jié)果一起指出,TMD長度在ManI到ER和/或順面高爾基體區(qū)室的靶向中起關(guān)鍵作用,并且TMD長度從16提高到23個氨基酸將該II型膜蛋白重新定位于朝向高爾基體反面更下游處(附圖11D)。
5.顯示在布雷菲德菌素A(BFA)存在下晚期和早期高爾基體蛋白在ER中重新分布的實驗。
利用在該研究期間產(chǎn)生的多種高爾基體標(biāo)記物,研究了定位于不同高爾基體亞區(qū)室中的高爾基體蛋白質(zhì)在BFA處理后可具有不同表現(xiàn)的可能性。
用BFA(50mg.mL-1)處理表達(dá)以下的細(xì)胞二小時ER可溶標(biāo)記物或膜標(biāo)記物(GFP-HDEL或Glu90-GFP,附圖13A-D)、ER/早期高爾基體標(biāo)記物(D19Man49-GFP,附圖13E-F)、中間高爾基體標(biāo)記物(XylT35-GFP,附圖13G-H)、或晚期高爾基體標(biāo)記物(Man99TMD23-GFP或ST52-mRFP,附圖13I-L)。在BFA處理結(jié)束時,除了未在聚集體中發(fā)現(xiàn)的ER標(biāo)記物(附圖13A-D)以外,所有融合蛋白在明亮的聚集體中和ER中累積(附圖13E-L)。所有標(biāo)記物均在BFA存在下在ER中重新定位。
在共表達(dá)ER/早期高爾基體或晚期高爾基體蛋白質(zhì)與ST52-mRFP的細(xì)胞中,除了在聚集體中未發(fā)現(xiàn)的GFP-HDEL(附圖14A-F)和Glu90-GFP(附圖14D)以外,BFA誘導(dǎo)這兩種標(biāo)記物重新分布進(jìn)入ER和進(jìn)入高爾基體聚集體(附圖14)。在一些情況下,時間上稍有差別,但是這些差別對檢測而言不是微不足道的,并且也不提供關(guān)于高爾基體內(nèi)定位的信息。另外,在BFA處理后對表達(dá)可溶標(biāo)記物(GFP-HDEL)或膜蛋白標(biāo)記物(Glu90-GFP)的細(xì)胞進(jìn)行觀察時,未觀察到熒光模式的顯著差異(附圖14A-D)。
6.顯示TMD長度模型不適用于所有II型膜蛋白的實驗 為了確定TMD長度是否可以是允許所有糖苷酶和糖基轉(zhuǎn)移酶沿植物分泌系統(tǒng)亞區(qū)室化的唯一高爾基體分選決定因素,比較已表征的糖基化酶的N端序列(附圖14)。
從單個物種克隆并進(jìn)行功能表征的不同酶的序列很少,用于在單個植物系統(tǒng)中將TMD長度與膜厚度相關(guān)聯(lián)的電子顯微鏡數(shù)據(jù)更少,這阻礙了該分析。對迄今為止克隆的所有植物糖基化酶N端序列(CT+TMD)的計算機(jī)模擬分析清楚地顯示了在高爾基體堆中具有最下游定位的蛋白質(zhì)中具有更長TMD的趨勢(附圖14)。例如,有趣的是,注意到被推定位于晚期高爾基體的酶如a-1,3-巖藻糖基轉(zhuǎn)移酶和a-1,4-巖藻糖基轉(zhuǎn)移酶均不具有短于20個氨基酸的TMD。通過用于TMD長度預(yù)測的MENSAT_V1,8、PHOBIUS或PRED_TMR程序(http://bioinf.cs.ucl.ac.uk/psipred/psiform.html和http://biophysics.biol.uoa.gr/PRED-TMR/input.html)證實了這些結(jié)果。然而,在比較來自不同物種的相似糖基化酶時可注意到對該普遍趨勢的例外,例如ManI TMD為16個氨基酸(大豆)到20個氨基酸(擬南芥)不等。
GluI中18個氨基酸的短TMD能夠完美地適合脂質(zhì)雙層模型,從而解釋其在ER膜中的定位,根據(jù)這一點(diǎn)選擇GluI用于檢驗該模型的普遍適用性。為了確定GluI的TMD對其在ER中的靶向和停留而言是否足夠,缺失該糖苷酶的大部分腔內(nèi)部分(含有催化結(jié)構(gòu)域)并將其前90個N端氨基酸(CT+TMD+S)與GFP融合,得到融合蛋白Glu90-GFP(附圖4)。在煙草細(xì)胞中表達(dá)該融合物時ER被高亮(附圖15A和15B),其模式與用全長構(gòu)建體Glul-GFP和GFP-HDEL構(gòu)建體獲得的模式相似(將顯微照片14A和14B與4G和4D、4E和12C比較)。
該結(jié)果清楚地顯示,GluI靶向至ER依賴于位于該截短蛋白質(zhì)中所剩的CT、TMD和/或21個腔內(nèi)氨基酸內(nèi)的信號。
在確定GluI在ER中定位所需的最小蛋白質(zhì)序列的另一嘗試中,缺失來自Glu90-GFP構(gòu)建體的前13個N端氨基酸,獲得D13Glu90-GFP(附圖4)。在煙草懸浮培養(yǎng)細(xì)胞或葉表皮細(xì)胞中表達(dá)該融合物時,嵌合蛋白質(zhì)僅位于高爾基體樣斑點(diǎn)中(附圖15D和15E),就像針對XylT-GFP(附圖6I和9E)和ST52-GFP(附圖15F)所觀察的一樣。
總而言之,GluI中18個氨基酸長的TMD不足以將該糖苷酶靶向在ER膜中,CT的前13個氨基酸中所含有的額外信息是該糖基化酶在分泌途徑中正常定位所需的。
該結(jié)果對除TMD長度以外的其他因素影響糖基化酶在早期分泌途徑中的定位提供了實驗證據(jù)。
7.擬南芥GCSI II型膜蛋白的定位 GCSI嚴(yán)格地在煙草內(nèi)質(zhì)網(wǎng)中累積。
擬南芥GCSI是一種II型膜蛋白,其由51個氨基酸的胞質(zhì)尾區(qū)、約18個殘基的跨膜結(jié)構(gòu)域和指向腔的大催化結(jié)構(gòu)域組成(Boisson等,2001(參考文獻(xiàn)6))。為了研究該糖苷酶的定位,在煙草BY-2細(xì)胞中穩(wěn)定表達(dá)(附圖16A和18B;附圖17A和17B)后研究全長GCSI的GFP融合物的定位(附圖15)。通過共聚焦激光掃描顯微鏡僅在遍布細(xì)胞質(zhì)的網(wǎng)狀網(wǎng)絡(luò)中檢測到全長GCSI-GFP融合構(gòu)建體的熒光,其與GFP-HDEL構(gòu)建體染色的ER網(wǎng)絡(luò)無法區(qū)分(附圖16C和16D)。
這些結(jié)果與來自前體寡糖的第一個糖殘基在ER中與新生糖蛋白結(jié)合后立即被修剪是一致的,并與COS細(xì)胞中對人GluI所示的情況一致(Hardt等,2003(參考文獻(xiàn)28))。另外,在表達(dá)可溶標(biāo)記物(GFP-HDEL)或膜蛋白標(biāo)記物(GCSI-GFP)的細(xì)胞的熒光模式中未觀察到顯著差異(附圖16A到D)。
8.顯示GCSI的前90個氨基酸足以將GFP保留在ER中的實驗。
為了了解使得GCSI在ER中選擇性停留的機(jī)制,首先研究了腔內(nèi)結(jié)構(gòu)域在GCSI靶向中的作用。為了確定位于ER腔內(nèi)的GCSI部分是否在該糖苷酶向ER的靶向中起作用,將GCSI的前150個氨基酸(aa)(CT+TMD+莖的81個氨基酸)或前90個氨基酸(CT+TMD+莖的21個氨基酸)與GFP融合,并將相應(yīng)的嵌合體蛋白質(zhì)分別稱作GCS150和GCS90(附圖15)。將GCS150和GCS90在BY-2懸浮培養(yǎng)細(xì)胞中穩(wěn)定表達(dá)或通過農(nóng)桿菌浸潤在煙草葉表皮細(xì)胞中瞬時表達(dá),兩者均在兩種表達(dá)體系的ER中觀察到(分別為附圖17A、C、E和17B、D、F),正如先前針對全長構(gòu)建體所觀察到的(附圖16A、B)。重要的是,注意到在煙草葉表皮細(xì)胞中瞬時表達(dá)這些截短的融合物時,在轉(zhuǎn)化后五天(此時總體表達(dá)水平已經(jīng)大幅降低)仍觀察到ER標(biāo)記,然而在相同條件下分析的高爾基體融合物僅位于高爾基體中(Saint-Jore-Dupas等,2006;數(shù)據(jù)未顯示)。該數(shù)據(jù)顯示,葡萄糖苷酶I的催化性腔內(nèi)結(jié)構(gòu)域不是酶的ER定位必需的,并且GCSI的前90個氨基酸足以將GFP保留在ER中。
9.顯示胞質(zhì)尾區(qū)含有ER停留序列的實驗 駐留在哺乳動物和酵母ER中的許多膜蛋白的N端胞質(zhì)區(qū)含有下述信號,所述信號促進(jìn)嚴(yán)格停留(Nilsson等,1994(參考文獻(xiàn)46);Opat等,2000(參考文獻(xiàn)48);Hardt等,2003(參考文獻(xiàn)28);Ciczora等,2005(參考文獻(xiàn)12))或從高爾基體回到ER中(Teasdale和Jackson,1996(參考文獻(xiàn)62);Zerangue等,1999(參考文獻(xiàn)66)),而一些其它信號促進(jìn)從ER輸出到高爾基體(Giraudo和Maccioni,2003(參考文獻(xiàn)20))。在植物中,僅有少數(shù)研究證明膜蛋白CT中存在ER輸出序列(Contreras等,2004(參考文獻(xiàn)4613);Yuasa等,2005(參考文獻(xiàn)65);Hanton等,2005b(參考文獻(xiàn)27))并涉及負(fù)責(zé)膜蛋白ER停留的胞質(zhì)基序的表征(Benghezal等,2000(參考文獻(xiàn)4);McCartney等,2004(參考文獻(xiàn)35))。
為了更精確地定義GCSI N端中含有ER靶向信息的序列,首先缺失位于GCS90N端末端的前13個氨基酸,并將得到的嵌合體蛋白質(zhì)命名為D13GCS90(附圖15)。該截短去除了可能在ER停留中發(fā)揮作用的兩個可能的二元基序RR或RXR,而將其它可能的ER停留信號(RR或KXK)保留在該融合蛋白的CT中。同時,將GCSI的前13個N端氨基酸肽與先前定位于中間高爾基體(Pagny等,2003(參考文獻(xiàn)50))的高爾基體報告蛋白(XYLT35,附圖15)融合。在本研究中使用的實驗條件下,XYLT35被證實僅在BY-2煙草細(xì)胞的高爾基體中累積,如圖18G到H中所示。
還在BY-2細(xì)胞中穩(wěn)定表達(dá)了兩種構(gòu)建體(D13GCS90和13GCS-XYT35)。胞質(zhì)尾區(qū)前13個氨基酸的缺失將GCS90重新定位進(jìn)亮點(diǎn)中(圖18C-D,圖19A),與用高爾基體標(biāo)記物XYLT35觀察到的相似(圖18E-F)。另外,D13GCS90在煙草葉表皮細(xì)胞中瞬時表達(dá)后不與ER標(biāo)記物mRFP-HDEL共定位(圖19B),但是完美地與ST-mRFP高爾基體標(biāo)記物共定位(圖19C)。有趣的是,GCSI的13個N端氨基酸與XYLT35高爾基體標(biāo)記物的融合物將報告蛋白阻斷在ER中(圖18G-H;圖19G)。GCS13-XYLT35融合蛋白像GCS90構(gòu)建體一樣標(biāo)記ER(圖18A-D),并與mRFP-HDEL ER標(biāo)記物共定位(圖19H)。除了強(qiáng)ER標(biāo)記外,在煙草葉表皮細(xì)胞中表達(dá)GCS13-XYLT35時也觀察到少量亮點(diǎn)。這些點(diǎn)移動并與ST-mRFP高爾基體標(biāo)記物共定位(圖19I)。
總而言之,GCSI的前13個氨基酸是將GCS90融合蛋白保留在ER中所必需的,并且足以將高爾基體標(biāo)記物重新定位于ER中。
10.顯示胞質(zhì)富含精氨酸的序列是植物中ER停留信號的實驗 為了進(jìn)一步研究AtGCSI的13個N端氨基酸中的精氨酸殘基是否是ER停留所必需的,改變位于AtGCSI人同源物N末端的富含精氨酸結(jié)構(gòu)域或位于I型植物ER駐留膜蛋白(擬南芥鈣聯(lián)結(jié)蛋白)胞質(zhì)C末端的富含精氨酸結(jié)構(gòu)域的肽。
為了研究位于人GCSI N末端的富含精氨酸肽在植物細(xì)胞中被識別的能力,用人GCSI的前10個N末端氨基酸取代GCS90的前13個N末端氨基酸(Hs10-GCS90,圖15)。在煙草葉表皮細(xì)胞中瞬時表達(dá)時,Hs10-GCS90位于ER中,表明N端胞質(zhì)區(qū)被植物分泌體系完美地識別(圖17JL)。
接著,為了研究由I型膜蛋白帶有的相似的富含精氨酸基序是否能夠介導(dǎo)II型蛋白質(zhì)靶向ER中,將位于擬南芥鈣聯(lián)結(jié)蛋白C末端的最后11個氨基酸與高爾基體標(biāo)記物XYLT35的N末端融合(CNX11-XYLT35,圖15,表1)。在煙草葉表皮細(xì)胞中瞬時表達(dá)CNX11-XYLT35。如圖19M到O中所示,I型膜蛋白的富含精氨酸C端肽足以將II型XYLT35高爾基標(biāo)記物保留在ER中(圖19M到N)。注意到像GCS13-XYLT35融合物(圖19I)一樣檢測到了高爾基體標(biāo)記(圖19O)。
11.顯示GCSI胞質(zhì)尾區(qū)中的精氨酸殘基含有ER定位信息的實驗。
為了更精確地確定GCSI的前13個氨基酸中四個精氨酸殘基的作用,使用PCR定點(diǎn)誘變(構(gòu)建體細(xì)節(jié)見表1)用亮氨酸或丙氨酸殘基替換這些殘基,并在煙草細(xì)胞中表達(dá)得到的融合蛋白。
盡管GCS90僅定位于ER中并且與ER標(biāo)記物mRFP-HDEL完美地共定位(圖20A、B)而不與高爾基體標(biāo)記物ST-52-mRFP共定位(圖20C),但是用丙氨酸殘基替換Arg-6、Arg-7、Arg-10和Arg-12時,R/LGCS90僅使亮點(diǎn)高亮(圖20D)。如此處通過與高爾基體標(biāo)記物ST-mRFP的共定位所顯示的,這些點(diǎn)對應(yīng)于高爾基體(圖20F)。未檢測到ER標(biāo)記(圖20E)。用四個亮氨酸殘基取代這四個精氨酸殘基后,觀察到對亞細(xì)胞定位的相同影響(圖20G-I)。這些觀察結(jié)果指出,位于N端第6-7-10和12位的四個精氨酸可能編碼負(fù)責(zé)GCS90的ER停留的結(jié)構(gòu)信息。
在第二步中,為了確定(RR)和(PXR)是否作為兩個獨(dú)立的信號發(fā)揮作用,用亮氨酸殘基取代Arg-6和Arg-7或Arg-10和Arg-12。RR基序(構(gòu)建體R/L10-12GCS90中的Arg-6和Arg-7)或RXR基序(構(gòu)建體R/L6-7GCS90中Arg-10和Arg-12)以及RXXR基序(構(gòu)建體R/L6-12GSC90中的Arg-7和Arg-10)的存在足以實現(xiàn)融合蛋白的ER停留(圖20J到L和M到O)。然而在這三種情況下,除了ER標(biāo)記外,也觀察到與高爾基體堆不同的熒光點(diǎn)(圖20L和20O)。
12.顯示帶有RR、RXR或RXXR基序的融合蛋白在ER中累積并在與高爾基體相關(guān)的熒光點(diǎn)中累積的實驗 下一步是鑒定被R/L6-7GCS90、R/L10-12GCS9O和R/L6-12GSC90嵌合融合蛋白標(biāo)記為熒光點(diǎn)的結(jié)構(gòu)。如用R/L6/7GCS90蛋白質(zhì)所顯示的,GFP熒光在ER中和比高爾基體堆更小的熒光結(jié)構(gòu)中累積(圖20J到L和圖21A到B)。為了更精確地定義這些結(jié)構(gòu)在細(xì)胞中的定位,同時表達(dá)mRFP-HDEL ER標(biāo)記物、ST52-mRFP高爾基體標(biāo)記物以及R/L6-7GC S90、R/L10-12GC S90或R/L6-12GSC90融合蛋白。
結(jié)果示于圖21A-B,并顯示小熒光點(diǎn)與高爾基體堆密切相關(guān),但是不同。由一個分散高爾基體和一個點(diǎn)結(jié)合形成的單位沿ER一起移動,并且從不解離。
考慮到這些結(jié)果,R/L6-7GCS90、R/L10-12GCS90和R/L6-12GSC90融合蛋白在ER中在位于ER和高爾基體之間的小中間體區(qū)域中累積,駐留在ER的可溶蛋白質(zhì)除外(圖20K和20N)。這些區(qū)域與高爾基體強(qiáng)力結(jié)合,并使高爾基體堆沿著ER皮層網(wǎng)絡(luò)移動,因此這些區(qū)域可能是ER出口位點(diǎn)(ER-exit-site,ERES),如Yang等,2005中所述。為了證實這一點(diǎn),將R/L6-7GCS90、R/L10-12GCS90和R/L6-12GSC90融合蛋白在煙草葉表皮細(xì)胞中與Sar1p-mRFP共表達(dá)。
遺憾的是,熒光點(diǎn)處未顯示Sar1p-mRFP的募集(圖22A到C)。然而,已顯示Sar1p參與突變形式GCS90的轉(zhuǎn)運(yùn)。事實上,如圖22J到L所示,當(dāng)R/LGCS90與Sar1p/GTP-mRFP共表達(dá)時,Sar1p在ER處和熒光點(diǎn)處累積(圖22K)。
相反,GCS90不募集Sar1p-mRFP,因為單獨(dú)表達(dá)的Sar1p-mRFP位于ER中(數(shù)據(jù)未顯示),而GCS90與Sar1p-RFP的共表達(dá)未改變GCS90標(biāo)記(圖22D到I)。另外,突變形式Sar1p/GTP-mRFP的表達(dá)導(dǎo)致高爾基體R/LGCS90停留在ER中。
總而言之,R/LGCS90的轉(zhuǎn)運(yùn)由胞質(zhì)蛋白Sar1p調(diào)節(jié)。然而,用帶有一個RR、RXR或RXXR基序的融合蛋白進(jìn)行標(biāo)記的小區(qū)域不與Sar1p-mRFP結(jié)合,盡管它們位于ER和高爾基體區(qū)室之間。
13.顯示AtGCSI的ER停留不僅依賴于N端精氨酸基序的實驗 在本實施例中,與高爾基體報告蛋白融合的GCSI精氨酸基序?qū)⑵涠ㄎ挥贓R。然而,沒有證據(jù)表明這些信號是參與全長GCSI的ER定位的主要停留信號。
用亮氨酸或丙氨酸替換Arg-6、Arg-7、Arg-10和Arg-12導(dǎo)致GCS90構(gòu)建體中ER導(dǎo)向信息的破壞,根據(jù)這一觀察,在GCSI全長序列中缺失N端13個氨基酸以評價基序(RXR和RR)在野生型酶(D13GCSI,圖15)ER靶向中的重要性。另外,合成N端缺少氨基酸1-13位殘基的GCS150截短形式(D13GCS150,圖15)。然后在葉表皮細(xì)胞中瞬時表達(dá)融合蛋白。與在高爾基體中累積的D13GCS90相反,D13GCSI和D13GCS150均僅定位于ER中(圖23D-E)。另外,在煙草細(xì)胞中與ER標(biāo)記物(mRFP-HDEL)同時表達(dá)嵌合蛋白質(zhì)時,與GCS90相反,D13GCSI和D13GCS150均未在高爾基體中檢測到,而兩種熒光信號均在ER中觀察到并與mRFP-HDEL完美地共定位(圖23G-L)。這些結(jié)果與Hardt等,(2003)(參考文獻(xiàn)28)的先前研究一致,所述研究證明人GCSI含有基于精氨酸的功能性信號,所述信號不是定位全長酶所必需的。在GCS90(圖23F、23I和23L)、GCSI(圖23D、23G和23J)和GCS150(圖23E、23H和23K)之間觀察到的標(biāo)記差異表明,確定ER定位的關(guān)鍵信息必定包含在GCSI的腔內(nèi)多肽鏈中,更可能包含于莖結(jié)構(gòu)域的70-150位氨基酸殘基之間。
為了驗證該這種假說,將70-150位的81個氨基酸殘基或90-150位的61個氨基酸與中間高爾基體標(biāo)記物XYLT35的腔內(nèi)結(jié)構(gòu)域融合(圖24A),并在煙草葉表皮細(xì)胞中瞬時表達(dá)這些新的蛋白質(zhì)(XYLT35-GCS81和XYLT35-GCS60,圖24B、C)。大部分GFP標(biāo)記可見于ER中,“其余部分(remnant)”在高爾基體中。
在哺乳動物細(xì)胞中已顯示,可以通過直接停留實現(xiàn)ER駐留,所述直接停留涉及蛋白質(zhì)亞基通過其跨膜和/或腔內(nèi)結(jié)構(gòu)域結(jié)合得到大寡聚復(fù)合物,如先前針對定位于高爾基體的膜蛋白的親緣識別模型中所述。(Nilsson等,1994(參考文獻(xiàn)46);Opat等,2000(參考文獻(xiàn)48)。推測這些大蛋白質(zhì)寡聚物避免包裝進(jìn)轉(zhuǎn)運(yùn)囊泡中,從而防止它們被運(yùn)出細(xì)胞器。這類機(jī)制可能在雜合寡聚物寡糖基轉(zhuǎn)移酶復(fù)合物中亞基組分的ER停留中有功能,但是尚未在植物中描述。
總而言之,AtGCSI的胞質(zhì)尾區(qū)和腔內(nèi)結(jié)構(gòu)域均含有ER靶向決定簇。與其特異性一致并且與其它真核體系中進(jìn)行的觀察完全相符的是,結(jié)果證明AtGCSI定位于植物ER中并僅定位于該區(qū)室中。在植物N-聚糖成熟中較早發(fā)揮作用的其它糖基化酶(如N-乙酰葡糖氨基轉(zhuǎn)移酶(GNT1)和a1,2甘露糖苷酶(ManI))已顯示既定位于ER中也定位于順面高爾基體中。GNTI和ManI、ER和順面高爾基體已顯示含有位于胞質(zhì)尾區(qū)中的靶向信息,而GCSI胞質(zhì)尾區(qū)的前13個N端氨基酸含有ER靶向信號。本實施例顯示了胞質(zhì)尾區(qū)中哪些是參與ER靶向的關(guān)鍵氨基酸,而且也證明了富含精氨酸的胞質(zhì)尾區(qū)不是整個蛋白質(zhì)序列中唯一的ER靶向決定簇。
事實上,從GCS150中缺失富含精氨酸的序列并不能夠使得從ER中輸出至更晚期的區(qū)室如高爾基體,D13GCS90仍僅定位于ER中。
這些結(jié)果一起表明,GCSI序列中共存至少兩個足以對高爾基體II型膜蛋白賦予ER停留的結(jié)構(gòu)域。GCSI腔內(nèi)結(jié)構(gòu)域中的缺失表明,ER停留的信息包含在位于GCSI序列中90和150位氨基酸之間60個氨基酸的肽中。
關(guān)于腔內(nèi)ER靶向信號的存在,對人葡萄糖苷酶I獲得了相當(dāng)?shù)慕Y(jié)果,但是迄今為止尚未表征所涉及的腔內(nèi)序列(Hardt等,2003(參考文獻(xiàn)28))。如上所述,與高爾基體報告蛋白XYLT35結(jié)合時,植物的腔內(nèi)肽足以將XYLT35重新定位至ER。GCSI的腔內(nèi)結(jié)構(gòu)域能夠促進(jìn)AtGCSI與可溶和/或膜結(jié)合的ER駐留蛋白形成復(fù)合物。然而,與親緣識別模型矛盾的是,顯示一些大蛋白質(zhì)復(fù)合物位于質(zhì)膜中,并且必須完全裝配才能被轉(zhuǎn)運(yùn)出ER。
事實上,解釋停留時似乎不需要考慮這些復(fù)合物的大小。事實上,由于ER腔中極高的蛋白質(zhì)濃度,對能形成蛋白質(zhì)-蛋白質(zhì)復(fù)合物的蛋白質(zhì)而言,離開ER可能比留在內(nèi)部更困難。如前文針對涉及BiP的另一ER分子陪伴體系所述,我們目前研究的是新生糖蛋白折疊機(jī)制是否能夠在植物ER中形成由GCSI、葡萄糖苷酶II、鈣聯(lián)結(jié)蛋白、鈣網(wǎng)織蛋白和ERp57形成的大的多蛋白質(zhì)復(fù)合物。
14.GCSI的胞質(zhì)尾區(qū)含有三個足以獨(dú)立實現(xiàn)ER停留的二精氨酸信號 已經(jīng)顯示,富含精氨酸的序列(MTAGASRRSARGRI(SEQ ID N°1))足以將高爾基體標(biāo)記物XYL35靶向在ER中。根據(jù)先前對哺乳動物細(xì)胞分泌途徑中膜蛋白靶向的研究,進(jìn)行本實施例來鑒定四個精氨酸殘基是否含有ER停留信息。將四個精氨酸突變成丙氨酸或亮氨酸殘基完全廢除了該序列的ER停留能力,因為L/GGCS90存在于高爾基體中,從而證實了精氨酸殘基在ER停留中的關(guān)鍵作用。
基于該富含精氨酸序列中的定向突變的進(jìn)一步分析顯示,事實上兩個精氨酸殘基(RR、RXR或RXXR SEQ ID N°70)足以賦予GCS90以ER停留,因此13個氨基酸的肽含有足夠進(jìn)行ER停留的三個不同的二精氨酸基序,所述基序共存于GCSI的胞質(zhì)尾區(qū)中。有趣的是,當(dāng)這三個二精氨酸基序中只有一個存在于GCS90的胞質(zhì)尾區(qū)中時,不僅在ER中而且在小點(diǎn)中檢測到熒光,所述小點(diǎn)與高爾基體堆結(jié)合并與其一起沿著ER軌道移動。
另外,可溶性ER標(biāo)記蛋白GFP-HDEL被排除在這些小點(diǎn)之外。推測是檢測到R/L6-7GCS90、R/L6-12GCS90和R/L10-12GCS90的這些小點(diǎn)對應(yīng)于分泌單位(ERES),所述分泌單位位于ER表面并介導(dǎo)ER和高爾基體之間的物質(zhì)交換(Runion等,2006(參考文獻(xiàn)55))。驗證該假說的進(jìn)一步研究會支持基于單個分泌單位的ER/高爾基體轉(zhuǎn)運(yùn)模型,所述單個分泌單位與分散高爾基體結(jié)合并與其一起在ER表面上移動。然而,小點(diǎn)不與Sar1p共定位。已在哺乳動物膜蛋白中廣泛地研究了二精氨酸基序,但是在本研究之前從未在其植物同源物中表征二精氨酸基序。有趣的是,先前在人GCSI中鑒定的二精氨酸基序顯示在植物細(xì)胞中介導(dǎo)ER停留(Hardt等,2003(參考文獻(xiàn)28))。
然而,在AtGCSI中鑒定的二精氨酸基序比其人同源物看起來更具靈活性。事實上,人a葡萄糖苷酶I的二精氨酸基序由+7和+8位的兩個精氨酸殘基和+9位的堿性氨基酸組成。在AtGCSI中,兩個精氨酸殘基之間的距離看起來更靈活,但是對良好的效率而言不能超過兩個氨基酸。另外,該基序應(yīng)當(dāng)十分接近蛋白質(zhì)的N末端。事實上,在GCSI中,+23和+24位的二精氨酸基序RR仍然存在于融合蛋白D13GCSS90-GFP中,但不足以賦予ER停留。
最后,可獲得的GCSI序列的比較顯示,這些ER駐留蛋白末端的二精氨酸基序是高度保守的(表2,Boisson等,2001(參考文獻(xiàn)6);Hong等,2004(參考文獻(xiàn)30))。
實施例2序列鑒定的描述 如先前的實施例中所示,表3中所列的每個信號都足以將報告蛋白質(zhì)如綠色熒光蛋白靶向至ER和/或GA(見附圖25A和25B)。
如先前所公開的,SEQ ID N°1到3代表用于將膜蛋白靶向至ER的一組錨定序列。這些序列位于膜蛋白的胞質(zhì)尾區(qū)中,所述胞質(zhì)尾區(qū)位于C-末端或N末端。
SEQ ID n°1MTAGASRRSARGRI SEQ ID n°2MARGERRRRA SEQ ID n°3MNDRRPQRKRPA 已經(jīng)顯示,這些胞質(zhì)尾區(qū)(SED ID N°1到3)中存在的以下二精氨酸基序序列足以將報告膜蛋白保留在ER中 基序序列
如圖25中所示,這些二精氨酸基序可分別位于II型和I型膜蛋白的N端或C端部分。
相應(yīng)地測試了其他的以下序列 SED ID N°4到7負(fù)責(zé)重組膜多肽在ER中的嚴(yán)格保留。這些序列位于ER腔中。
SEQ ID n°4 FQGEHKESLYWGTYRPHVYFGVRARTPLSLVAGLMWLGVKDEMYVMRHFC SEQ ID n°5 FQGDHKESLYWGTYRPNVYLGIRARTPLSLIAGIMWIGAKNGQYFLRHVC SEQ ID n°6 ESDASLLWGTYRPQIYFGLRPRLPGSLLTGLAWFGLQDYSDFQHIRHQC SEQ ID n°7 ERSNRLFWGTYRPGIYFGMKHRSPISLLFGVMWTVQDAENFAFRHSC 估計與本發(fā)明的SEQ IDn°4具有至少70%同源性的每條序列均具有與本發(fā)明的靶向序列相同的作用。
在圖26中,位于莖(S3)中的SEQ IDn°4到7負(fù)責(zé)膜蛋白在ER中的嚴(yán)格保留。S3是位于跨膜結(jié)構(gòu)域附近的序列。
重組多肽在ER中的嚴(yán)格保留(見圖26)通過將含有二精氨酸基序的SEQ ID N°1到3之一與SEQ ID N°4到7之一相結(jié)合來實現(xiàn)(如SEQ IDN°8中所示),并負(fù)責(zé)膜蛋白在ER中的嚴(yán)格保留和重組蛋白的穩(wěn)定。
16到23位氨基酸的跨膜結(jié)構(gòu)域(GS2)已顯示足以將蛋白質(zhì)定位至高爾基體。使用該結(jié)構(gòu)域足以將重組蛋白或酶錨定在高爾基體膜中。本發(fā)明的肽信號中包含的已測試膜結(jié)構(gòu)域(GS2)的例子如下 高爾基體酶的胞質(zhì)尾區(qū)(GS1)、跨膜結(jié)構(gòu)域(GS2)和莖(GS3)之間的排列負(fù)責(zé)順面、中間或反面高爾基體中的膜蛋白保留(見附圖26,底部圖)。該排列允許酶或重組蛋白在高爾基體中亞區(qū)室化。本發(fā)明的這類肽信號序列的例子如下 GS1 SEQ ID n°17MARGSRSVGSSSSKWRYCNPSYYLKRPKR SEQ ID n°18MGVFSNLRGPRAGATHDEFPATNGSPSSSSSPSSSIKRK SEQ ID n°19MRGYKFCCDFR SEQ ID n°20 MGVFSNLRGPKIGLTHEELPVVANGSTSSSSSPSSFKRK SEQ ID n°21MLVMPQPPKPFN SEQ ID n°22MARGSRSVGSSSSKWRYCNPSYYLKRPKR SEQ ID n°23MANLWKKQRLRDTGLCR 來自GS3結(jié)構(gòu)域的肽信號的例子如下 這些信號已用于在瞬時或穩(wěn)定轉(zhuǎn)化后在煙草、大豆、番茄或蘿卜中對若干膜蛋白的表達(dá)進(jìn)行靶向。這些信號可被添加至所述膜蛋白具有相同的靶向效率和特異性的膜蛋白的N端(II型膜蛋白)或C端(I型膜蛋白)(似乎信號也可以添加至III或IV型膜蛋白)。
GS1/GS2/GS3之間排列的例子 實施例3通過使用靶向序列在早期分泌途徑區(qū)室內(nèi)儲存重組蛋白,從而防止在N-葡聚糖上添加免疫原性殘基。
植物ER駐留蛋白的結(jié)構(gòu)分析顯示,它們僅帶有高甘露糖型N-聚糖(Navazio等,1997(參考文獻(xiàn)41),1998(參考文獻(xiàn)42);Pagny等,2000(參考文獻(xiàn)49))。這些寡糖結(jié)構(gòu)是植物和哺乳動物共有,因此不是免疫原性的。該觀察結(jié)果提出了一種防止免疫原性殘基(如β1,2木糖或α1,3巖藻糖)與植物制成藥物(PMP)N-聚糖結(jié)合的策略。該策略是在ER(即高爾基體囊膜上游)中儲藏重組蛋白,在所述ER中添加免疫原性糖表位從而使植物N-聚糖成熟。首先顯示在重組可溶蛋白質(zhì)C末端添加H/KDEL氨基酸序列足以使其停留在植物ER中(Gomord等,1997(參考文獻(xiàn)24),1999(參考文獻(xiàn)22))。
在本實施例中,使用相同的策略將KDEL-ER信號序列與兩種不同抗體的抗體重鏈和輕鏈二者融合。
使用SEQ ID N°1到8的序列將抗體的重鏈和輕鏈靶向至ER。
使用SEQ ID N°32到36的序列將抗體的重鏈和輕鏈靶向至ER和GA。
這些抗體僅代表了非免疫原性的高甘露糖型N-聚糖(Sriraman等,2004(參考文獻(xiàn)59);Petrucelli等,2006(參考文獻(xiàn)51)),指示了基于聚糖成熟的非常有效的再循環(huán),所述聚糖成熟受限于位于ER和順面高爾基體中的酶,如α-甘露糖苷酶I(Nebenfuhr等,1999(參考文獻(xiàn)43))。因此,可能通過與ER停留信號融合來防止免疫原性N-聚糖與PMP結(jié)合。
實施例B在ER和/或GA中表達(dá)抗體或抗體片段(附圖15,圖B) 在ER和/或GA中表達(dá)抗體或抗體片段提供了用于改進(jìn)重組蛋白生產(chǎn)的不同策略。例如,其可導(dǎo)致將未修飾(突變)的治療性蛋白質(zhì)靶向至ER和/或GA。
從最初證實在植物中的功能性表達(dá)抗體,已經(jīng)確立了兩個主要的研究方向。第一個是使用植物作為大規(guī)模生產(chǎn)治療性抗體或抗體片段的生物反應(yīng)器。在第二個策略中,在宿主細(xì)胞中表達(dá)抗體或抗體片段,以通過稱作免疫調(diào)節(jié)的機(jī)制影響生理過程。近來已闡述了可能的免疫調(diào)控除草劑特異性抗體的表達(dá)顯示在植物中(in planta)賦予抗性(Almquist KC等2004,(參考文獻(xiàn)1)并見附圖27)。
實施例C在植物細(xì)胞的ER和/或GA中表達(dá)同源或異源酶以及在所述細(xì)胞中表達(dá)重組蛋白 實施例1通過將哺乳動物糖基轉(zhuǎn)移酶定位至植物細(xì)胞的ER/GA中而使植物細(xì)胞中的N-糖基化人源化(附圖15,圖C)。
在植物中,像在其他真核細(xì)胞中一樣,N-糖基化在ER中開始,通過共翻譯向新生多肽上的特定天冬酰胺殘基添加寡糖前體(Glc3Man9GlcNAc2)。一旦轉(zhuǎn)移至蛋白質(zhì)上并且分泌型糖蛋白沿分泌途徑被轉(zhuǎn)運(yùn),則寡糖發(fā)生多次成熟,得到復(fù)雜的N-聚糖。許多藥物的體內(nèi)活性和穩(wěn)定性需要糖基化,所述藥物包括用于效應(yīng)器功能(如引發(fā)免疫應(yīng)答)的抗體(Wright和Morrison,1994(參考文獻(xiàn)64))。這就為什么在使用能夠產(chǎn)生重組抗體的可能的植物時,為了獲得“人源化的”非免疫原性N-聚糖,必須抑制這些植物特異性成熟。
使植物N-聚糖人源化的一種吸引人的策略是在植物中表達(dá)哺乳動物糖基轉(zhuǎn)移酶,這可完成植物高爾基體中N-聚糖成熟的內(nèi)源機(jī)制(或與之競爭)。以這些回補(bǔ)(complementation)策略為基礎(chǔ),在植物細(xì)胞高爾基體中表達(dá)人β(1,4)-半乳糖基轉(zhuǎn)移酶導(dǎo)致植物N-聚糖的部分人源化,并可能與β(1,2)-木糖和α-(1,3)-巖藻糖競爭。
苜?;驘煵葜参镏腥甩?1,4)-半乳糖基轉(zhuǎn)移酶的表達(dá)將半乳糖殘基轉(zhuǎn)移至植物N-聚糖的末端N-乙酰葡糖胺殘基上。然而,在表達(dá)該人半乳糖基轉(zhuǎn)移酶的煙草或苜蓿植物中生產(chǎn)的糖蛋白所帶有的N-聚糖中,僅30%到40%帶有哺乳動物樣的末端N-乙酰乳糖胺序列(Bakker等,2001(參考文獻(xiàn)2)。
人β(1,4)-半乳糖基轉(zhuǎn)移酶與高爾基體靶向信號融合。
用于hGalT和GNTIhGalT表達(dá)的質(zhì)粒從pBLTI121裝配而來(Pagny等,2003,參考文獻(xiàn)50)。用HindIII-XbaI位點(diǎn)的苜蓿質(zhì)體藍(lán)素(plastocyanin)啟動子代替CaMV 35S啟動子。通過EcoRI消化從pUC19-hGalT分離人β(1,4)-半乳糖基轉(zhuǎn)移酶(hGalT)基因(UDP半乳糖β-N-乙酰氨基葡糖苷β(1,4)-半乳糖基轉(zhuǎn)移酶;EC 2.4.1.22)。klenow處理后,在SmaI位點(diǎn)處將1.2kb hGalT片段克隆進(jìn)pBLTI221中。然后使用FGalT正向引物(5′-GACTCTAGAGCGGGAAGATGAGGCTTCGGGAGCCGCTC-3’SEQ ID N°92)和反向RGalTFlagStu引物(5′-AAGGCCTACGCTACTTGTCATCGTCATCTTTGTAGTCGCACGGTGTCCCGAAGTCCAC-3′SEQ ID N°93),通過PCR將flag標(biāo)簽融合至編碼區(qū)的C端。然后通過將該XbaI-StuI片段克隆進(jìn)Plasto啟動子和Nos終止子的控制下的二元載體pBLTI121中來產(chǎn)生R622。
使用正向FGNT(5′-ATCGAAATCGCACGATGAGAGGGTACAAGTTTTGC-3’SEQ ID N°94)和反向RGNTspe(5′-CCCATGATGCGATCTGCATATTCTGACTGTGTCGC-3’SEQ ID N°95)引物,通過PCR擴(kuò)增對應(yīng)于跨膜結(jié)構(gòu)域的來自煙草(N.tabacum)N-乙酰葡糖氨基轉(zhuǎn)移酶I(GNTI)的N端前38個氨基酸,隨后克隆進(jìn)pGEM-T載體中,并通過Apal/BamHI克隆進(jìn)pBLTI221。為了GNTI和hGalT之間的融合,從pUC19-hGalT進(jìn)行PCR擴(kuò)增,以消除其自身的TMD并產(chǎn)生SpeI和StuI位點(diǎn)。使用正向引物FGalTspe(5′-GGACTAGTGCACTGTCGCTGCCCGCCTGC-3’SEQ ID N°96)和反向引物RgalTFlagStu(5′-AAGGCCTACGCTACTTGTCATCGTCATCTTTGTAGTCGCACGGTGTCCCGAAGTCCAC-3’SEQ ID N°97)擴(kuò)增SpeI/StuI hGalT片段。
然后將該片段克隆進(jìn)pBLTI221-GNTI中。最后,通過周圍的位點(diǎn)XbaI/StuI進(jìn)行的消化允許分離1030bp的片段,隨后通過將該1030片段克隆進(jìn)二元載體pBLTI121-Plasto中而產(chǎn)生R 622。
如下進(jìn)行苜蓿植物的轉(zhuǎn)化。
如下使用根癌農(nóng)桿菌(Agrobacterium tumefaciens)AGL 1轉(zhuǎn)化苜蓿(Medicago sativa L)生態(tài)型R2336并進(jìn)行以下修改將葉柄、莖和葉外植體與農(nóng)桿菌共培養(yǎng)5到7天。用0.8到1OD的未稀釋農(nóng)桿菌培養(yǎng)物和3%蔗糖(代替1.5%蔗糖)在SH2K培養(yǎng)基中進(jìn)行共培養(yǎng)步驟。將相應(yīng)外植體胚胎發(fā)育得到的充分建立的植物轉(zhuǎn)移進(jìn)溫室中的土壤中,并對葉進(jìn)行分析。
如下對分離自野生型和經(jīng)GalT或GNTI/GalT轉(zhuǎn)化的苜蓿植物的N-聯(lián)聚糖進(jìn)行分析。
在4℃下,在5ml提取緩沖液(0.7M蔗糖、0.5M Tris、30mM HCl、0.1M KCl、2%β-巰基乙醇)中從500mg新鮮苜蓿葉中提取蛋白質(zhì)30分鐘。通過在4℃下5,000g離心10分鐘去除不溶的材料。在4℃下,在30分鐘中通過添加1倍體積以水飽和的苯酚來處理所得的上清液。然后在-20℃下以5倍體積的PB(0.1M溶于甲醇中的乙酸銨)將苯酚級分中含有的蛋白質(zhì)和糖蛋白沉淀過夜。用5ml PB洗滌沉淀物后,如先前Bakker等,2001中所述通過用胃蛋白酶和PNGase A先后處理來消化蛋白質(zhì)和糖蛋白。然后用2-氨基苯甲酰胺(2-AB)對N-聚糖進(jìn)行熒光標(biāo)記。
在裝有337-nm氮激光器的Voyager DE-Pro MALDI-TOF設(shè)備(Applied Biosystems,USA)上,獲得這些所產(chǎn)生N-聚糖的MALDI-TOF質(zhì)譜。使用2,5-二羥基苯甲酸(Sigma-Aldrich)作為基質(zhì),在反射器中延遲提取模式下運(yùn)行質(zhì)譜。
將以5mg.mL-1新溶于70∶30%乙腈/0.1%TFA中的基質(zhì)與溶解的寡糖以1∶1(V/V)的比例混合。使用20,000V的加速電壓和100ns的延遲時間,在正模式下記錄這些光譜。對其進(jìn)行一次平滑處理(smooth),并使用可購得的肽和蛋白質(zhì)的混合物(Applied Biosystems)進(jìn)行外部校準(zhǔn)。在該研究中,使用des-Arg1-緩激肽(904.4681Da)、血管緊張素I(1296.6853)、Glu1-血纖肽B(1570.6774Da)、ACTH clip 18-39(2465.1989)和牛胰島素(5730.6087)校準(zhǔn)光譜。對每個光譜累積激光射點(diǎn)(Laser shot),從而獲得可接受的信噪比。
如先前所公開的,本發(fā)明提供了大批信號,所述信號用于將糖基轉(zhuǎn)移酶活性僅靶向至亞細(xì)胞區(qū)室和亞區(qū)域中。這提供了多種方式來通過共表達(dá)表5中所列酶而提高宿主表達(dá)系統(tǒng)中N-和O-糖基化的效率,并優(yōu)化異源蛋白質(zhì)的轉(zhuǎn)錄后修飾。
表5與本發(fā)明序列融合的酶。
如先前實施例中所公開的,本發(fā)明提供了生產(chǎn)蛋白質(zhì)的方法、在植物細(xì)胞亞區(qū)室中修飾/表達(dá)蛋白的方法、在植物細(xì)胞RE和/或GA中表達(dá)異源蛋白質(zhì)的方法。本發(fā)明還提供了經(jīng)轉(zhuǎn)錄后修飾的蛋白質(zhì)。
實施例D表達(dá)與信號序列融合的
蛋白 在本實施例中,產(chǎn)生包含
和序列信號(SEQ ID N°8)和甘露糖苷酶I的融合蛋白,從而將糖苷酶作為膜蛋白在蛋白質(zhì)體中累積。使用靶向序列(SEQ IDn°8)使酶在ER膜中累積,并允許通過ZERA肽形成聚集體來生產(chǎn)蛋白質(zhì)體。
目標(biāo)是在蛋白質(zhì)體中累積帶有N-聚糖(Man5GlcNAc2)的糖蛋白。
質(zhì)粒構(gòu)建體通過PCR擴(kuò)增編碼與人甘露糖苷酶I(登錄號Q9UKM7)融合的ZERA的ADNc,并在SPeI和SacI位點(diǎn)處將其亞克隆進(jìn)含靶向信號(SED IDn°8)的pBLTI121中。
農(nóng)桿菌介導(dǎo)的煙草BY-2細(xì)胞轉(zhuǎn)化 通過熱激將pVKH18En6-mRFP、PBLTI121-GFP和pBIN20-GFP融合物轉(zhuǎn)移進(jìn)根癌農(nóng)桿菌(菌株GV3101pMP90中,Koncz和Schell,1986)。在含卡那霉素(100mg.mL-1)和慶大霉素(100mg.mL-1)的YEB培養(yǎng)基(每升中含牛肉提取物5g,酵母提取物1g,蔗糖5g,MgSO4-7H2O 0.5g)上選擇轉(zhuǎn)基因農(nóng)桿菌,并用于轉(zhuǎn)化煙草(變種Bright Yellow-2)BY-2細(xì)胞,如Gomord等,1998中所述。在卡那霉素(100mg.mL-1)和頭孢噻肟(250mg.mL-1)存在下針對PBLTI121-GFP和pBIN20-GFP融合物選擇經(jīng)轉(zhuǎn)化的煙草細(xì)胞,或在潮霉素(40mg.mL-1)和頭孢噻肟(250mg.mL-1)存在下針對pVKH18En6-mRFP選擇轉(zhuǎn)化的煙草細(xì)胞。對共表達(dá)GFP和mRFP融合物的雙重轉(zhuǎn)化體而言,首先在卡那霉素平板上選擇微愈傷組織(microcalli),然后轉(zhuǎn)移至潮霉素平板上。篩選后,使用表達(dá)GFP和/或mRFP融合物的愈傷組織來起始轉(zhuǎn)基因細(xì)胞的懸浮培養(yǎng)。使用3-4日齡的BY-2懸浮培養(yǎng)細(xì)胞進(jìn)行實驗。
在本實施例中產(chǎn)生的融合蛋白在轉(zhuǎn)化細(xì)胞中表達(dá),使酶在ER膜中累積,并允許通過ZERA肽形成聚集體來生產(chǎn)蛋白質(zhì)體。
如先前的實施例中所公開的,本發(fā)明允許將蛋白質(zhì)靶向至細(xì)胞的特定區(qū)域,提高重組多肽生產(chǎn)的產(chǎn)率,防止重組多肽的免疫原性,以及獲得作為其天然對應(yīng)物的精確拷貝的治療活性重組多肽。本發(fā)明還允許生產(chǎn)經(jīng)轉(zhuǎn)錄后修飾的蛋白質(zhì)。
參考文獻(xiàn)
參考文獻(xiàn)1Almquist,Kurt C.Yongqing Niu,Michael D.McLean,F(xiàn)rank L.Mena,Kerrm Y.F.Yau,Kirk Brown,Jim E.Brandle,J.ChristopherHall(2004)Immunomodulation confers herbicide resistance inplants Plant Biotechnology Journal 2(3),189-197.
參考文獻(xiàn)2 Bakker Hans
Muriel Bardor,Jos W.Molthoff,VéroniqueGomord,lngrid Elbers,Lucas H.Stevens,Wilco Jordi,ArjenLommen,
Faye,Patrice Lerouge,and Dirk Bosch(2001)Galactose-extended glycans of antibodies produced by transgenicplants PNAS February 27,2001 vol.98 no.52899-2904
參考文獻(xiàn)3 Barrieu
and Maarten J.Chrispeels(1999)Delivery of aSecreted Soluble Protein to the Vacuole via a Membrane Anchor.Plant Physiol.(1999)120961-968
參考文獻(xiàn)4 Benghezal,M.,Wasteneys,G.O.,and Jones,D.A,2000.TheCterminal dilysine motif confers endoplasmic reticulum localisationto type I membrane proteins in plants.Plant Cell 121179-1201.
參考文獻(xiàn)5 Boevink,P.,Oparka,K.,Santa Cruz,S.,Martin,B.,Betteridge,A.and Hawes,C.(1998).Stacks on tracksthe plant Golgiapparatus traffics on an actin/ER network.Plant J.15,441-447.
參考文獻(xiàn)6 Boisson,M.,Gomord,V.,Audran,C.,Berger,N.,Dubreucq,B.,Granier,F(xiàn).,Lerouge,P.,F(xiàn)aye,L.,Caboche,M.and Lepiniec,L.(2001).Arabidopsis glucosidase I mutants reveal a critical role ofN-glycan trimming in seed development.EMBO J.20,1010-1019.
參考文獻(xiàn)7 Bracha K,Lavy M,Yalovsky S.The Arabidopsis AtSTE24is aCAAX protease with broad substrata specificity.J Biol Chem.2002Aug 16;277(33)29856-64.
參考文獻(xiàn)8 Brandizzi,F(xiàn).,F(xiàn)rangne,N.,Marc-Martin,S.,Hawes,C.,Neuhaus,J-M.and Paris,N.(2002a).The destination for single-passmembrane proteins is influenced markedly by the length of thehydrophobic domain.Plant Cell,14,1077-1092.
參考文獻(xiàn)9 Brandizzi,F(xiàn).,Snapp,E.,Roberts,A.,Lippincott-Schwartz,J.andHawes,C.(2002b).Membrane protein transport between the ERand Golgi in tobacco leaves is energy dependent but cytoskeletonindependentevidence from selective photobleaching.Plant Cell14,1293-1309.
參考文獻(xiàn)10 Bretscher,M.S.and Munro,S.(1993).Cholesterol and the Golgiapparatus.Science 261,1280-1281.
參考文獻(xiàn)11 Campbell,R.E.,Tour,O.,Palmer,A.E.,Steinbach,P.A.,Baird,G.S.,Zacharias,D.A.and Tsien,R.Y.(2002).A monomeric redfluorescent protein.Proc.Natl.Acad.Sci.USA 99,7877-7882.
參考文獻(xiàn)12 Ciczora Yann 1,Nathalie Callens1,Claire Montpellier1,BirkeBartosch2,
Cosset2,Anne Op De
and JeanDubuisson1 Contribution of the charged residues of hepatitis Cvirus glycoprotein E2 transmembrane domain to the functions ofthe E1E2 heterodimer.J Gen Virol 86(2005),2793-2798;
參考文獻(xiàn)13 Contreras,Elena Ortiz-Zapater,F(xiàn)ernando Aniento (2004)Sortingsignals in the cytosolic tail of membrane proteins involved in theinteraction with plant ARF1 and coatomer The Plant Journal 38(4),685-698
參考文獻(xiàn)14 De Praeter,C.M.,Gerwig,G.J.,Bause,E.,Nuytinck,L.K.,Vliegenthart,J.F.,Breuer,W.,Kamerling,J.P.,Espeel,M.F.,Martin,J.J.,De Paepe,A.M.,et al.(2000).A novel disordercaused by defective biosynthesis of N-linked oligosaccharides dueto glucosidase I deficiency.Am J Hum Genet 66,1744-1756.
參考文獻(xiàn)15 Dirnberger,D,Bencur,P,Mach,L.and Steinkellner,H.(2002).The Golgi localization of Arabidopsis thaliana beta1,2-xylosyltransferase in plant cells is dependent on its cytoplasmicand transnembrane sequences.Plant Mol.Biol.50,273-281.
參考文獻(xiàn)16 Essl,D.,Dirnberger,D.,Gomord,V.,Strasser,R.,F(xiàn)aye,L.,
J.and Steinkellner,H.(1999).The N-terminal 77 amino acids fromtobacco N-acetylglucosaminyltransferase I are sufficient to retain areporter protein in the Golgi apparatus of Nicotiana benthamianacells.FEBS Lett.453,169-173.
參考文獻(xiàn)17 Faye
Aurelia Boulaflous,Meriem Benchabane,VéroniqueGomorda and Dominique Michaud Protein modifications in theplant secretory pathwaycurrent status and practical implications inmolecular pharming Volume 23,Issue 15,7March 2005,Pages1770-1778
參考文獻(xiàn)18 Füllekrug,J.and Nilsson,T.(1998).Protein sorting in the Golgicomplex.Biochim.Biophys.Acta 1404,77-84.
參考文獻(xiàn)19 Gillmor,C.S.,Poindexter,P.,Lorieau,J.,Palcic,M.M.,andSomerville,C.(2002).Alpha-glucosidase I is required for cellulosebiosynthesis and morphogenesis in Arabidopsis.J Cell Biol 156,1003-1013.
參考文獻(xiàn)20 Giraudo,C.D.and Maccioni,H.J.F.(2003).Endoplasmic reticulumexport of glycosyltransferases depends on interaction of acytoplasmic dibasic motif with Sar1.Mol.Biol.Cell 14,3753-3766.
參考文獻(xiàn)21 Gomord,V.,and Faye,L.(2004).Posttranslational modificationof therapeutic proteins in plants,Curr Opin Plant Biol 7,171-181.
參考文獻(xiàn)22 Gomord V,Wee E.and Faye L.(1999).Protein retention andlocalization in the endoplasmic reticulum and the Golgi apparatus.Biochimie,81,607-618
參考文獻(xiàn)23 Gomord V,Sourrouille C.,F(xiàn)ichette A.C.,Barbor M.Pagny S.,Lerouge P.,and Faye L.(2004)Production and glycosylation ofplant made pharmaceuticalsthe antibodies as a challenge.PlantBiotechnol.,2,83-100.
參考文獻(xiàn)24 Gomord V.,Denmat L.A.,F(xiàn)itchette-Laine A.C.,Satiat-jeunemaitre,Hawes C.and Faye L.(1997).The C-terminal HDEL sequence issufficient for retention of secretory proteins but promotes vacuolartargeting of proteins that escape the endoplasmic reticulum.PlantJ.,11,313-326
參考文獻(xiàn)25 Gomord,V.,F(xiàn)itchette,A.C.,Denmat,L.A.,Michaud,D.and Faye,L.(1998).Production of foreign proteins in tobacco cellsuspension culture.In Methods in Molecular Biotechnology,Vol 3(Cunningham C.and Porter A.J.R.Eds.)TotowaHumana PressInc.,pp.155-164.
參考文獻(xiàn)26 Grove,S.N.,Brecker,C.E.and Morré,D.J.(1968).Cytomembranedifferentiation in the endoplasmic reticulum-Golgi apparatus-yesiclecomplex.Science 161,171-173,
參考文獻(xiàn)27 Hanton SL,Renna L,Bortolotti LE,Chatre L,Stefano G,BrandizziF.(2005).Diacidic motifs influence the export of transmembraneproteins from the endoplasmic reticulum in plant cells.Plant Cell.2005 17,3081-3093.
參考文獻(xiàn)28 Hardt,B.,Kalz-Füller,B.,Aparicio,R.,
C.and Bause,E.(2003).(Arg)3within the N-terminal domain of glucosidase Icontains ER targeting information but is not required absolutely forER localisation.Glycobiology,13,159-168.
參考文獻(xiàn)29 Hartmann,M.A.and Benveniste,P.(1987).Plant membranesterolsisolation,identification and biosynthesis.MethodsEnzymol.148632-650.
參考文獻(xiàn)30 Hong,Y.,Sundaram,S.,Shin,D.-J.,and Stanley,P.(2004).TheLec23 Chinese Hamster Ovary Mutant Is a Sensitive Host forDetecting Mutations in {alpha}-Glucosidase I That Give Rise toCongenital Disorder of Glycosylation IIb (CDGIIb)10.1074/jbc.M410121200.J Biol Chem 279,49894-49901.
參考文獻(xiàn)31 Janzik I,Macheroux P,Amrhein N,Schaller A LeSBT1,a subtilasefrom tomato plants.Overexpression in insect cells,purification,andcharacterization.J Biol Chem.2000Feb 18;275(7)5193-9
參考文獻(xiàn)32 Lienard D.,Tran Dinh O.,E.van Oort,L.Van Overtvelt,C.Bonneau,E.Wambre,M.Bardor,P.Cosette,A.Didier-Laurent,F(xiàn).Dorlhac de Borne,R.Delon,R.van Ree,P.Moingeon,L.Faye andV.Gomord(2007)Suspension-cultured BY-2 tobacco cellsproduce and mature immunologically active house dust miteallergens...*DL and OTD have equal contributions to this work,Plant biotechnol.J.5,93-108
參考文獻(xiàn)33 Lynch,D.V.(1993).Sphingolipids.In Lipid Metabolism in Plants(Moore T.S.Ed.)Boca Raton,F(xiàn)LCRC Press,pp.285-308.
參考文獻(xiàn)34 Masibay,A.S.,Balaji,P.V.,Boeggeman,E.E.and Qasba,P.K.(1993).Mutational analysis.of the Golgi retention signal of bovineb-1,4-galactosyltransferase.J.Biol.Chem.268,9908-9916.
參考文獻(xiàn)35 McCartney,A.W.,Dyer,J.M.,Dhanoa,P.K.,Kim,P.K.,Andrews,D.W.,McNew,J.A.,and Mullen,R.T.(2004).Membrane-bound fatty acid desaturases are inserted co-translationally into the ER and contain different ER retrieval motifsat their carboxy termini.Plant J 37,156-t73.
參考文獻(xiàn)36 Moreau,P.,Hartmann,M.A.,Perret,A.M.,Sturbois-Balcerzak,B.and Cassagne,C.(1998).Transport of sterols to the plasmamembrane of leek seedlings.Plant Physiol.117,931-937.
參考文獻(xiàn)37 Morré,D.J.and Mollenhauer,H.H.(1974).The endomembraneconcepta functional integration of endoplasmic reticulum andGolgi apparatus.In Dynamic Aspects of Plant Ultrastructure.(Robards A.W.Ed.)LondonMcGraw-Hill Book Cy,pp.84-137.
參考文獻(xiàn)38 Munro,S.(1991).Sequences within and adjacent to thetransmembrane segment of b-2,6-sialyltransferase specify Golgiretention.EMBO J.10,3577-3588.Munro,S.(1995a).Acomparison of the transmembrane domains of Golgi and plasmamembrane proteins.Biochem.Soc.Trans.23,527-530.
參考文獻(xiàn)39 Munro,S.(1995b).An investigation of the role of thetransmembrane domain in Golgi protein retention.EMBO J.14,4695-4704.
參考文獻(xiàn)40 Munro,S.(1998).Localization of proteins to the Golgi apparatus.Trends Cell Biol.8,11-15.
參考文獻(xiàn)41 Navazio L.,Sponga L.,Damese P.,F(xiàn)itchette-Laine A-C.,F(xiàn)aye L.,Baldan B.and mariani P.(1997).The calcium binding proteincalreticulin in pollen of Liriodendron tulipifera L.Plant Sci.,131,35-42
參考文獻(xiàn)42 Navazio L.,Nardi C.,Pancaldu C.,Danese P.,Baldan B.,F(xiàn)itchette-Laine A.C.,F(xiàn)aye L.,Meggip F.,Martin W.and Mariani P.(1998).Functional conservation of calreticulin in euglena gracilis.J.Euk.Microbiol.,45,307-313.
參考文獻(xiàn)43 Nebenführ,A.,Gallagher,L.A.,Dunahay,T.G.,F(xiàn)rohlick,J.A.,Mazurkiewicz,A.M.,Meehl,J.B.and Staehelin,L.A.(1999).Stop-and-go movements of plant Golgi stacks are mediated by the acto-myosin system.Plant Physiol.121,1127-1142.
參考文獻(xiàn)44 Nilsson,T.,Pypaert,M.,Hoe,M.H.,Slusarewicz,P.,Berger,E.G.and Warren,G.(1993a).Overlapping distribution of twoglycosyltransferases in the Golgi apparatus of HeLa cells.J.CellBiol.120,5-13.
參考文獻(xiàn)45 Nilsson,T.,Slusarewicz,P.,Hoe,M.H.and Warren,G.(1993b).Kin recognitionA model for the retention of Golgi enzymes.FEBS Lett.330,1-4.
參考文獻(xiàn)46 Nilsson,T.,Hoe,M.H.,Slusarewicz,P.,Rabouille,C.,Watson,R.,Hunte,F(xiàn).,Watzele,G.,Berger,E.G.and Warren,G.(1994).Kinrecognition between medial Golgi enzymes in HeLa cells.EMBOJ.13,562-574.
參考文獻(xiàn)47 Nilsson,T.,Rabouille,C.,Hui,N.,Watson,R.and Warren,G.(1996).The role of the membrane spanning domain and stalkregion of N-acetylglucosaminyltransferase I in retention,kinrecognition and structural maintenance of the Golgi apparatus inHeLa cells.J.Cell Sci.109,1975-1989.
參考文獻(xiàn)48 Opat,A.S.,Houghton,F(xiàn).and Gleeson,P.A.(2000).Medial Golgibut not late Golgi glycosyltransferases exist as high molecularweight complexes.J.Biol.Chem.275,11836-11845.
參考文獻(xiàn)49 Pagny S.,Cabanes-Macheteau M.,Gillikin J.W.;Leborgne-CastelN.,Lerouge P.,Boston R.Faye L.and Gomord V.(2000).Proteinrecycling from the Golgi apparatus to the endoplasmic reticulum inplants and its minor contribution to calreticulin retention.Plant Cell,12,739-755
參考文獻(xiàn)50 Pagny,S.,Bouissonié,F(xiàn).,Sarkar,M.,F(xiàn)ollet-Gueye,M.L.,Driouich,A.,Schachter,H.,F(xiàn)aye,L.and Gomord,V.(2003).Structuralrequirements for Arabidopsis b-1,2-xylosyltransferase activity andtargeting to the Golgi.Plant J.33,189-203.
參考文獻(xiàn)51 Petruccelli S.,Otegui MS.,Lareu F.,Trandinhthanhlien O.,F(xiàn)itchette AC.,Circosta A.,Rumbo M.,Bardor M.,Carcamo R.,Gomord V.and Beachy RN.A KDEL tagged monoclonal antibodyis.efficiently retained in.the reticulum endoplasmic in leaves but isboth partially secreted and sorted to protein storage vacuoles inseeds.Plant Biotechnol.J.,4,511-527)
參考文獻(xiàn)52 Rautengarten C,Steinhauser D,Bussis D,Stintzi A,Schaller A,Kopka J,Altmann T Inferring hypotheses on functionalrelationships of genesAnalysis of the Arabidopsis thalianasubtilase gene family.PLoS Comput Biol.2005 Sep;1(4)e40.Epub 2005 Sep 2
參考文獻(xiàn)53 Reyes,F(xiàn).,Marchant,L.,Norambuena,L.,Nilo,R.,Silva,H.,andOrellana,A.(2006).AtUTr1,a UDP-glucose/UDP-galactosetransporter from Arabidopsis thaliana,is located in theendoplasmic reticulum and up-regulated by the unfolded proteinresponse.J Biol Chem 281,9145-9151.
參考文獻(xiàn)54 Ritzenthaler,C.,Nebenfuhr,A.,Movafeghi,A.,Stussi-Garaud,C.,Behnia,L.,Pimpl,P.,Staehelin,L.A.and Robinson,D.G.(2002).Reevaluation of the effects of brefeldin A on plant cells usingtobacco Bright Yellow 2 cells expressing Golgi-targeted greenfluorescent protein and COPI antisera.Plant Cell.14,237-261.
參考文獻(xiàn)55 Runions J.,Brach T.,Külner S and Hawes C.(2006).Photoactivation of GFP reveals protein dynamics within theendoplasmic reticulum membrane.J.Exp.Bot.57,43-50.
參考文獻(xiàn)56 Saint-Jore,C.M.,Evins,J.,Batoko,H.,Brandizzi,F(xiàn).,Moore,I.andHawes,C.(2002).Redistribution of membrane proteins betweenthe Golgi apparatus and endoplasmic reticulum in plants isreversible and not dependent on cytoskeletal networks.Plant J.,29,661-678.
參考文獻(xiàn)57 Saint-Jore-Dupas C.,Gomord V.and Paris N.(2004).Proteinlocalization in the Golgi apparatus and the trans-Golgi network.Cell Mol.Life Sci.,61,159-171.
參考文獻(xiàn)58 Saint-Jore-Dupas C.,Nebenführ A.,F(xiàn)ollet-Gueye ML.,BoulaflousA.,Hawes C.,Driouich A.,F(xiàn)aye L.and Gomord V.,(2006)Partitioning of N-glycan maturation enzymes along the secretorypathway and a key role of transmembrane domain length in early-Golgi targeting.Plant Cell 18,3182-3200
參考文獻(xiàn)59 Sriraman R.,Bardor M.,Sack M.,Vaquero C.,F(xiàn)aye L.,F(xiàn)ischer R.,F(xiàn)innern R,Lerouge P.(2004)Recombinant anti-hCG antibodiesretained in the endoplasmic reticulum of transformed plants lackcore-xylose and core-alpha(1,3)-fucose residues.PlantBiotechnol;,2,279-287
參考文獻(xiàn)60 Strasser,R.,Mucha,J.,Schwihla,H.,Altmann,F(xiàn).,
J.andSteinkellner,H.(1999).Molecular cloning and characterisation ofcDNA coding for b-1,2-N-acetylglucosaminyltransferase I(GlcNAc-TI)from Nicotiana tabacum.Glycobiology 9,779-785.
參考文獻(xiàn)61 Strasser,R.,Schoberer J.,Jin C.,Mucha,J.,
J.,Mach L.and Steinkellner,H.(2006).Molecular cloning andcharacterisation of Arabidopsis thaliana Golgi a-mannosidase II,akey enzyme in the formation of complexN-glycans in plants.PlantJ.45,789-803
參考文獻(xiàn)62 Teasdale,R.D.and Jackson,M.R.(1996).Signal-mediated sortingof membrane proteins between the endoplasmic reticulum and theGolgi apparatus.Ann.Rev.Cell Develop.Biol.12,27-54.
參考文獻(xiàn)63 Wee,E.G.T.,Sherrier,J.,Prime,T.and Dupree,P.(1998).Targeting of active sialyltransferase to the plant Golgi apparatus.Plant Cell 10,1759-1768.
參考文獻(xiàn)64 Wright A,Morrison SL.Effect of altered CH2-associatedcarbohydrate structure on the functional properties and in vivo fateof chimeric mouse-human immunoglobulin G1.J Exp Med,1994Sep 1;180(3)1087-96
參考文獻(xiàn)65 Yuasa,K.,Toyooka,K.,F(xiàn)ukuda,H.and Matsuoka,K.(2005).Membrane-anchored prolyl hydroxylase with an export signal fromthe endoplasmic reticulum.Plant J.41,81-94.
參考文獻(xiàn)66 Zerangue,N.,Schwappach,B.,Jan,Y.N.and Jan,L.Y.(19g9).Anew ER trafficking signal regulates the subunit stoichiometry ofplasma membrane K(ATP)channels.Neuron 22,537-548.
序列表
<110>CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE(CNRS)
GOMORD,Véronique
SAINT-JORE-DUPAS,Claude
BOULAFLOUS,Aurélia
KIEFER-MEYER,Marie-Christine
FAYE,
<120>用于靶向重組多肽的表達(dá)和控制其翻譯后修飾的一組序列
<130>51706/PCT
<150>US 60/857,524
<151>2006-11-08
<160>132
<170>PatentIn version 3.3
<210>1
<211>14
<212>PRT
<213>人工的
<220>
<223>肽信號(S1)
<400>1
Met Thr Ala Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile
1 5 10
<210>2
<211>10
<212>PRT
<213>人工的
<220>
<223>肽信號(S1)
<400>2
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala
1 5 10
<210>3
<211>12
<212>PRT
<213>人工的
<220>
<223>肽信號(S1)
<400>3
Met Asn Asp Arg Arg Pro Gln Arg Lys Arg Pro Ala
1 5 10
<210>4
<211>50
<212>PRT
<213>人工的
<220>
<223>莖序列S3
<400>4
Phe Gln Gly Glu His Lys Glu Ser Leu Tyr Trp Gly Thr Tyr Arg Pro
1 5 10 15
His Val Tyr Phe Gly Val Arg Ala Arg Thr Pro Leu Ser Leu Val Ala
20 25 30
Gly Leu Met Trp Leu Gly Val Lys Asp Glu Met Tyr Val Met Arg His
35 40 45
Phe Cys
50
<210>5
<211>50
<212>PRT
<213>人工的
<220>
<223>莖序列S3
<400>5
Phe Gln Gly Asp His Lys Glu Ser Leu Tyr Trp Gly Thr Tyr Arg Pro
1 5 10 15
Asn Val Tyr Leu Gly Ile Arg Ala Arg Thr Pro Leu Ser Leu Ile Ala
20 25 30
Gly Ile Met Trp Ile Gly Ala Lys Asn Gly Gln Tyr Phe Leu Arg His
35 40 45
Val Cys
50
<210>6
<211>49
<212>PRT
<213>人工的
<220>
<223>莖序列S3
<400>6
Glu Ser Asp Ala Ser Leu Leu Trp Gly Thr Tyr Arg Pro Gln Ile Tyr
1 5 10 15
Phe Gly Leu Arg Pro Arg Leu Pro Gly Ser Leu Leu Thr Gly Leu Ala
20 25 30
Trp Phe Gly Leu Gln Asp Tyr Ser Asp Phe Gln His Ile Arg His Gln
35 40 45
Cys
<210>7
<211>47
<212>PRT
<213>人工的
<220>
<223>莖序列S3
<400>7
Glu Arg Ser Asn Arg Leu Phe Trp Gly Thr Tyr Arg Pro Gly Ile Tyr
1 5 10 15
Phe Gly Met Lys His Arg Ser Pro Ile Ser Leu Leu Phe Gly Val Met
20 25 30
Trp Thr Val Gln Asp Ala Glu Asn Phe Ala Phe Arg His Ser Cys
35 40 45
<210>8
<211>150
<212>PRT
<213>人工的
<220>
<223>接合S1和S3
<400>8
Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu Ser Pro Gly Ser Asp Glu Gly Ser Ala Tyr Pro Pro Ser Ile
20 25 30
Arg Arg Gly Lys Gly Lys Glu Leu Val Ser Ile Gly Ala Phe Lys Thr
35 40 45
Asn Leu Lys Ile Leu Val Gly Leu Ile Ile Leu Gly Ile Ile Val Ile
50 55 60
Tyr Phe Val Ile Asn Arg Leu Val Arg His Gly Leu Leu Phe Asp Glu
65 70 75 80
Ser Gln Lys Pro Arg Val Ile Thr Pro Phe Pro Ala Pro Lys Val Met
85 90 95
Asp Leu Ser Met Phe Gln Gly Glu His Lys Glu Ser Leu Tyr Trp Gly
100 105 110
Thr Tyr Arg Pro His Val Tyr Phe Gly Val Arg Ala Arg Thr Pro Leu
115 120 125
Ser Leu Val Ala Gly Leu Met Trp Leu Gly Val Lys Asp Glu Met Tyr
130 135 140
Val Met Arg His Phe Cys
145 150
<210>9
<211>21
<212>PRT
<213>人工的
<220>
<223>跨膜結(jié)構(gòu)域GS2
<220>
<221>misc_feature
<222>(1)..(3)
<223>Xaa可以是任何天然氨基酸
<400>9
Xaa XaaXaa Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser Phe
15 10 15
Val Phe Trp Asp Arg
20
<210>10
<211>25
<212>pRT
<213>人工的
<220>
<223>跨膜結(jié)構(gòu)域GS2
<220>
<221>misc_feature
<222>(1)..(2)
<223>Xaa可以是任何天然氨基酸
<400>10
Xaa Xaa Arg Tyr Leu Leu Ile Leu Ala Ala Val Ala Phe Ile Tyr Ile
1 5 10 15
Gln Met Arg Leu Phe Ala Thr Gln Ser
20 25
<210>11
<211>24
<212>PRT
<213>人工的
<220>
<223>跨膜結(jié)構(gòu)域GS2
<220>
<221>misc_feature
<222>(1)..(3)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(22)..(24)
<223>Xaa可以是任何天然氨基酸
<400>11
Xaa Xaa Xaa Leu Gly Ile Leu Phe Ala Val Thr Leu Ser Ile Val Leu
1 5 10 15
Met Leu Val Ser Val Xaa Xaa Xaa
20
<210>12
<211>23
<212>PRT
<213>人工的
<220>
<223>跨膜結(jié)構(gòu)域GS2
<220>
<221>misc_feature
<222>(1)..(2)
<223>Xaa可以是任何天然氨基酸
<400>12
Xaa Xaa Lys Ile Phe Leu Tyr Met Leu Leu Leu Asn Ser Leu Phe Leu
1 5 10 15
Ile Ile Tyr Phe Val Phe His
20
<210>13
<211>26
<212>PRT
<213>人工的
<220>
<223>跨膜結(jié)構(gòu)域GS2
<220>
<221>misc_feature
<222>(1)..(3)
<223>Xaa可以是任何天然氨基酸
<400>13
Xaa Xaa Xaa Arg Lys Leu Ser Asn Leu Leu Pro Leu Cys Val Ala Leu
1 5 10 15
Val Val Ile Ala Glu Ile Gly Phe Leu Gly
20 25
<210>14
<211>26
<212>PRT
<213>人工的
<220>
<223>跨膜結(jié)構(gòu)域GS2
<220>
<221>misc_feature
<222>(1)..(3)
<223>Xaa可以是任何天然氨基酸
<400>14
Xaa Xaa Xaa Arg Lys Val Ser Thr Phe Leu Pro Ile Cys Val Ala Leu
1 5 10 15
Val Val Ile Ile Glu Ile Gly Phe Leu Cys
20 25
<210>15
<211>29
<212>PRT
<213>人工的
<220>
<223>跨膜結(jié)構(gòu)域GS2
<220>
<221>misc_feature
<222>(1)..(2)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(28)..(29)
<223>Xaa可以是任何天然氨基酸
<400>15
Xaa Xaa Phe Asn Thr Ile Thr Ile Thr Ile Met Ile Ala Phe Thr Phe
1 5 10 15
Phe Leu Leu Phe Leu Thr Gly Phe Leu Gln Phe Xaa Xaa
20 25
<210>16
<211>29
<212>PRT
<213>人工的
<220>
<223>跨膜結(jié)構(gòu)域GS2
<220>
<221>misc_feature
<222>(1)..(2)
<223>Xaa可以是任何天然氨基酸
<400>16
Xaa Xaa Lys Arg Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser
1 5 10 15
Phe Val Phe Trp Cys Val Ser Phe Val Phe Trp Asp Arg
20 25
<210>17
<211>29
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾GS1
<400>17
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg
20 25
<210>18
<211>39
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾GS1
<400>18
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Arg Ala Gly Ala Thr His
1 5 10 15
Asp Glu Phe Pro Ala Thr Asn Gly Ser Pro Ser Ser Ser Ser Ser Pro
20 25 30
Ser Ser Ser Ile Lys Arg Lys
35
<210>19
<211>11
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾GS1
<400>19
Met Arg Gly Tyr Lys Phe Cys Cys Asp Phe Arg
1 5 10
<210>20
<211>39
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾GS1
<400>20
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Lys Ile Gly Leu Thr His
1 5 10 15
Glu Glu Leu Pro Val Val Ala Asn Gly Ser Thr Ser Ser Ser Ser Ser
20 25 30
Pro Ser Ser Phe Lys Arg Lys
35
<210>21
<211>12
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾GS1
<400>21
Met Leu Val Met Pro Gln Pro Pro Lys Pro Phe Asn
1 5 10
<210>22
<211>29
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾GS1
<400>22
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg
20 25
<210>23
<211>17
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾GS1
<400>23
Met Ala Asn Leu Trp Lys Lys Gln Arg Leu Arg Asp Thr Gly Leu Cys
1 5 10 15
Arg
<210>24
<211>166
<212>PRT
<213>人工的
<220>
<223>莖序列GS3
<400>24
Arg Ile Asn Leu Ala Arg Glu His Glu Val Glu Val Phe Lys Leu Asn
1 5 10 15
Glu Glu Val Ser Arg Leu Glu Gln Met Leu Glu Glu Leu Asn Gly Gly
20 25 30
Val Gly Asn Lys Pro Leu Lys Thr Leu Lys Asp Ala Pro Glu Asp Pro
35 40 45
Val Asp Lys Gln Arg Arg Gln Lys Val Lys Glu Ala Met Ile His Ala
50 55 60
Trp Ser Ser Tyr Glu Lys Tyr Ala Trp Gly Lys Asp Glu Leu Gln Pro
65 70 75 80
Arg Thr Lys Asp Gly Thr Asp Ser Phe Gly Gly Leu Gly Ala Thr Met
85 90 95
Val Asp Ser Leu Asp Thr Leu Tyr Ile Met Gly Leu Asp Glu Gln Phe
100 105 110
Gln Lys Ala Arg Glu Trp Val Ala Ser Ser Leu Asp Phe Asp Lys Asp
115 120 125
Tyr Asp Ala Ser Met Phe Glu Thr Thr Ile Arg Val Val Gly Gly Leu
130 135 140
Leu Ser Ala Tyr Asp Leu Ser Gly Asp Lys Met Phe Leu Glu Lys Ala
145 150 155 160
Lys Asp Ile Ala Asp Arg
165
<210>25
<211>280
<212>PRT
<213>人工的
<220>
<223>莖序列GS3
<400>25
Thr Leu Phe His Phe Gly Val Pro Gly Pro Ile Ser Ser Arg Phe Leu
1 5 10 15
Thr Ser Arg Ser Asn Arg Ile Val Lys Pro Arg Lys Asn Ile Asn Arg
20 25 30
Arg Pro Leu Asn Asp Ser Asn Ser Gly Ala Val Val Asp Ile Thr Thr
35 40 45
Lys Asp Leu Tyr Asp Arg Ile Glu Phe Leu Asp Thr Asp Gly Gly Pro
50 55 60
Trp Lys Gln Gly Trp Arg Val Thr Tyr Lys Asp Asp Glu Trp Glu Lys
65 70 75 80
Glu Lys Leu Lys Ile Phe Val Val Pro His Ser His Asn Asp Pro Gly
85 90 95
Trp Lys Leu Thr Val Glu Glu Tyr Tyr Gln Arg Gln Ser Arg His Ile
100 105 110
Leu Asp Thr Ile Val Glu Thr Leu Ser Lys Asp Ser Arg Arg Lys Phe
115 120 125
Ile Trp Glu Glu Met Ser Tyr Leu Glu Arg Trp Trp Arg Asp Ala Ser
130 135 140
Pro Asn Lys Gln Glu Ala Leu Thr Lys Leu Val Lys Asp Gly Gln Leu
145 150 155 160
Glu Ile Val Gly Gly Gly Trp Val Met Asn Asp Glu Ala Asn Ser His
165 170 175
Tyr Phe Ala Ile Ile Glu Gln Ile Ala Glu Gly Asn Met Trp Leu Asn
180 185 190
Asp Thr Ile Gly Val Ile Pro Lys Asn Ser Trp Ala Ile Asp Pro Phe
195 200 205
Gly Tyr Ser Ser Thr Met Ala Tyr Leu Leu Arg Arg Met Gly Phe Glu
210 215 220
Asn Met Leu Ile Gln Arg Thr His Tyr Glu Leu Lys Lys Asp Leu Ala
225 230 235 240
Gln His Lys Asn Leu Glu Tyr Ile Trp Arg Gln Ser Trp Asp Ala Met
245 250 255
Glu Thr Thr Asp Ile Phe Val His Met Met Pro Phe Tyr Ser Tyr Asp
260 265 270
Ile Pro His Thr Cys Gly Pro Glu
275 280
<210>26
<211>183
<212>PRT
<213>人工的
<220>
<223>莖序列GS3
<400>26
Gln Thr Gln Ser Gln Tyr Ala Asp Arg Leu Ser Ser Ala Ile Glu Ser
1 5 10 15
Glu Asn His Cys Thr Ser Gln Met Arg Gly Leu Ile Asp Glu Val Ser
20 25 30
Ile Lys Gln Ser Arg Ile Val Ala Leu Glu Asp Met Lys Asn Arg Gln
35 40 45
Asp Glu Glu Leu Val Gln Leu Lys Asp Leu Ile Gln Thr Phe Glu Ser
50 55 60
Ala Leu Leu Ser Pro Met Pro Val Ala Ala Val Val Val Met Ala Cys
65 70 75 80
Ser Arg Ala Asp Tyr Leu Glu Arg Thr Val Lys Ser Val Leu Thr Tyr
85 90 95
Gln Thr Pro Val Ala Ser Lys Tyr Pro Leu Phe Ile Ser Gln Asp Gly
100 105 110
Ser Asp Gln Ala Val Lys Ser Lys Ser Leu Ser Tyr Asn Gln Leu Thr
115 120 125
Tyr Met Gln Ile Asn Glu Asp Glu Gly Ser Phe Ser Pro Phe Gln His
130 135 140
Leu Asp Phe Glu Pro Val Val Thr Glu Arg Pro Gly Glu Leu Thr Ala
145 150 155 160
Tyr Tyr Lys Ile Ala Arg Lys Asp Trp Phe Leu Phe Ser Leu Arg Pro
165 170 175
Ser Ser Ser Ile Thr Glu Thr
180
<210>27
<211>174
<212>PRT
<213>人工的
<220>
<223>莖序列GS3
<400>27
Arg Thr Ala Leu Asn Gly Ser Ser Ile Asp Asp Asp Leu Asp Gly Leu
1 5 10 15
Asp Lys Asp Leu Glu Ala Lys Leu Asn Ala Ser Leu Leu Ser Val Ala
20 25 30
Arg Gly Asn Arg Met Ser Leu Arg Leu His Arg Arg Asn His Phe Ser
35 40 45
Pro Arg Asn Thr Asp Leu Phe Pro Asp Leu Ala Lys Asp Arg Val Val
50 55 60
Ile Val Leu Tyr Val His Asn Arg Ala Gln Tyr Phe Arg Val Thr Val
65 70 75 80
Glu Ser Leu Ser Lys Val Lys Gly Ile Ser Glu Thr Leu Leu Ile Val
85 90 95
Ser His Asp Gly Tyr Phe Glu Glu Met Asn Arg Ile Val Glu Ser Ile
100 105 110
Lys Phe Cys Gln Val Lys Gln Ile Phe Ser Pro Tyr Ser Pro His Ile
115 120 125
Tyr Arg Thr Ser Phe Pro Gly Val Thr Leu Asn Asp Cys Lys Asn Lys
130 135 140
Gly Asp Glu Ala Lys Gly His Cys Glu Gly Asn Pro Asp Gln Tyr Gly
145 150 155 160
Asn His Arg Ser Pro Lys Ile Val Ser Leu Lys His His Trp
165 170
<210>28
<211>181
<212>PRT
<213>人工的
<220>
<223>莖序列GS3
<400>28
His Ser Ser Ser Phe Ser Pro Glu Gln Ser Gln Pro Pro His Ile Tyr
1 5 10 15
His Val Ser Val Asn Asn Gln Ser Ala Ile Gln Lys Pro Trp Pro Ile
20 25 30
Leu Pro Ser Tyr Leu Pro Trp Thr Pro Pro Gln Arg Asn Leu Pro Thr
35 40 45
Gly Ser Cys Glu Gly Tyr Phe Gly Asn Gly Phe Thr Lys Arg Val Asp
50 55 60
Phe Leu Lys Pro Arg Ile Gly Gly Gly Gly Glu Gly Ser Trp Phe Arg
65 70 75 80
Cys Phe Tyr Ser Glu Thr Leu Gln Ser Ser Ile Cys Glu Gly Arg Asn
85 90 95
Leu Arg Met Val Pro Asp Arg Ile Val Met Ser Arg Gly Gly Glu Lys
100 105 110
Leu Glu Glu Val Met Gly Arg Lys Glu Glu Glu Glu Leu Pro Ala Phe
115 120 125
Arg Gln Gly Ala Phe Glu Val Ala Glu Glu Val Ser Ser Arg Leu Gly
130 135 140
Phe Lys Arg His Arg Arg Phe Gly Gly Gly Glu Gly Gly Ser Ala Val
145 150 155 160
Ser Arg Arg Leu Val Asn Asp Glu Met Leu Asn Glu Tyr Met Gln Glu
165 170 175
Gly Gly Ile Asp Arg
180
<210>29
<211>150
<212>PRT
<213>人工的
<220>
<223>莖序列GS3
<400>29
Arg Leu Asp Asn Ala Ser Leu Val Asp Thr Leu Thr His Phe Phe Thr
1 5 10 15
Lys Ser Ser Ser Asp Leu Lys Val Gly Ser Gly Ile Glu Lys Cys Gln
20 25 30
Glu Trp Leu Glu Arg Val Asp Ser Val Thr Tyr Ser Arg Asp Phe Thr
35 40 45
Lys Asp Pro Ile Phe Ile Ser Gly Ser Asn Lys Asp Phe Lys Ser Cys
50 55 60
Ser Val Asp Cys Val Met Gly Phe Thr Ser Asp Lys Lys Pro Asp Ala
65 70 75 80
Ala Phe Gly Leu Ser His Gln Pro Gly Thr Leu Ser Ile Ile Arg Ser
85 90 95
Met Glu Ser Ala Gln Tyr Tyr Gln Glu Asn Asn Leu Ala Gln Ala Arg
100 105 110
Arg Lys Gly Tyr Asp Ile Val Met Thr Thr Ser Leu Ser Ser Asp Val
115 120 125
Pro Val Gly Tyr Phe Ser Trp Ala Glu Tyr Asp Ile Met Ala Pro Val
130 135 140
Gln Pro Lys Thr Glu Lys
145 150
<210>30
<211>205
<212>PRT
<213>人工的
<220>
<223>莖序列GS3
<400>30
Leu Glu Phe Pro Ser Ala Ser Thr Ser Met Glu His Ser Ile Asp Pro
1 5 10 15
Glu Pro Lys Leu Ser Asp Ser Thr Ser Asp Pro Phe Ser Asp Val Leu
20 25 30
Val Ala Tyr Lys Lys Trp Asp Phe Glu Val Gly Cys Ala Arg Phe Arg
35 40 45
Glu Asn His Lys Asp Ala Ile Leu Gly Asn Val Ser Ser Gly Ser Leu
50 55 60
Gln Glu Phe Gly Cys Gly Lys Leu Lys Met Lys His Val Lys Val Leu
65 70 75 80
Val Lys Gly Trp Thr Trp Ile Pro Asp Asn Leu Glu Asn Leu Tyr Ser
85 90 95
Cys Arg Cys Gly Met Thr Cys Leu Trp Thr Lys Ser Ser Val Leu Ala
100 105 110
Asp Ser Pro Asp Ala Leu Leu Phe Glu Thr Thr Thr Pro Pro Leu Gln
115 120 125
Arg Arg Val Gly Asp Pro Leu Arg Val Tyr Met Glu Leu Glu Ala Gly
130 135 140
Arg Lys Arg Ser Gly Arg Glu Asp Ile Phe Ile Ser Tyr His Ala Lys
145 150 155 160
Asp Asp Val Gln Thr Thr Tyr Ala Gly Ser Leu Phe His Asn Asn Arg
165 170 175
Asn Tyr His Ile Ser Pro His Lys Asn Asn Asp Val Leu Val Tyr Trp
180 185 190
Ser Ser Ser Arg Cys Leu Pro His Arg Asp Arg Leu Ala
195 200 205
<210>31
<211>150
<212>PRT
<213>人工的
<220>
<223>莖序列GS3
<400>31
Arg Leu Asp Lys Val Ala Leu Val Asp Thr Leu Thr Asp Phe Phe Thr
1 5 10 15
Gln Ser Pro Ser Leu Ser Gln Ser Pro Pro Ala Arg Ser Asp Arg Lys
20 25 30
Lys Ile Gly Leu Phe Thr Asp Arg Ser Cys Glu Glu Trp Leu Met Arg
35 40 45
Glu Asp Ser Val Thr Tyr Ser Arg Asp Phe Thr Lys Asp Pro Ile Phe
50 55 60
Ile Ser Gly Gly Glu Lys Asp Phe Gln Trp Cys Ser Val Asp Cys Thr
65 70 75 80
Phe Gly Asp Ser Ser Gly Lys Thr Pro Asp Ala Ala Phe Gly Leu Gly
85 90 95
Gln Lys Pro Gly Thr Leu Ser Ile Ile Arg Ser Met Glu Ser Ala Gln
100 05 110
Tyr Tyr Pro Glu Asn Asp Leu Ala Gln Ala Arg Arg Arg Gly Tyr Asp
115 120 125
Ile Val Met Thr Thr Ser Leu Ser Ser Asp Val Pro Val Gly Tyr Phe
130 135 140
Ser Trp Ala Glu Tyr Asp
145 150
<210>32
<211>49
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>32
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu
20 25 30
Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Asp Arg Gln
35 40 45
Thr
<210>33
<211>99
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>33
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu
20 25 30
Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Asp Arg Gln
35 40 45
Thr Leu Val Arg Glu His Gln Val Glu Ile Ser Glu Leu Gln Lys Glu
50 55 60
Val Thr Asp Leu Lys Asn Leu Val Asp Asp Leu Asn Asn Lys Gln Gly
65 70 75 80
Gly Thr Ser Gly Lys Thr Asp Leu Gly Arg Lys Ala Thr Lys Ser Ser
85 90 95
Lys Asp Val
<210>34
<211>22
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>34
Met Ala Ala Ala Leu Ala Leu Leu Phe Ile Val Phe Val Cys Val Ser
1 5 10 15
Phe Val Phe Trp Asp Arg
20
<210>35
<211>68
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>35
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Arg Ala Gly Ala Thr His
1 5 10 15
Asp Glu Phe Pro Ala Thr Asn Gly Ser Pro Ser Ser Ser Ser Ser Pro
20 25 30
Ser Ser Ser Ile Lys Arg Lys Leu Ser Asn Leu Leu Pro Leu Cys Val
35 40 45
Ala Leu Val Val Ile Ala Glu Ile Gly Phe Leu Gly Arg Leu Asp Lys
50 55 60
Val Ala Thr Ser
65
<210>36
<211>38
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>36
Met Arg Gly Tyr Lys Phe Cys Cys Asp Phe Arg Tyr Leu Leu Ile Leu
1 5 10 15
Ala Ala Val Ala Phe Ile Tyr Ile Gln Met Arg Leu Phe Ala Thr Gln
20 25 30
Ser Glu Tyr Ala Asp Arg
35
<210>37
<211>68
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>37
Met Gly Val Phe Ser Asn Leu Arg Gly Pro Lys Ile Gly Leu Thr His
1 5 10 15
Glu Glu Leu Pro Val Val Ala Asn Gly Ser Thr Ser Ser Ser Ser Ser
20 25 30
Pro Ser Ser Phe Lys Arg Lys Val Ser Thr Phe Leu Pro Ile Cys Val
35 40 45
Ala Leu Val Val Ile Ile Glu Ile Gly Phe Leu Cys Arg Leu Asp Asn
50 55 60
Ala Ser Thr Ser
65
<210>38
<211>41
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>38
Met Leu Val Met Pro Gln Pro Pro Lys Pro Phe Asn Thr Ile Thr Ile
1 5 10 15
Thr Ile Met Ile Ala Phe Thr Phe Phe Leu Leu Phe Leu Thr Gly Phe
20 25 30
Leu Gln Phe Pro Ser Ile Ser Pro Ser
35 40
<210>39
<211>106
<212>PRT
<213>人工的
<220>
<223>GS1-GS2-GS3
<400>39
Met Ala Arg Gly Ser Arg Ser Val Gly Ser Ser Ser Ser Lys Trp Arg
1 5 10 15
Tyr Cys Asn Pro Ser Tyr Tyr Leu Lys Arg Pro Lys Arg Leu Ala Leu
20 25 30
Leu Phe Ile Val Phe Val Cys Val Ser Phe Val Phe Trp Cys Val Ser
35 40 45
Phe Val Phe Trp Asp Arg Gln Thr Leu Val Arg Glu His Gln Val Glu
50 55 60
Ile Ser Glu Leu Gln Lys Glu Val Thr Asp Leu Lys Asn Leu Val Asp
65 70 75 80
Asp Leu Asn Asn Lys Gln Gly Gly Thr Ser Gly Lys Thr Asp Leu Gly
85 90 95
Arg Lys Ala Thr Lys Ser Ser Lys Asp Val
100 105
<210>40
<211>72
<212>DNA
<213>人工的
<220>
<223>引物
<400>40
gatccttggg aatgcttgct ctgctcttca tcgttttcgt ttgtgtctct ttcgttttct60
gggaccgtca aa72
<210>41
<211>72
<212>DNA
<213>人工的
<220>
<223>引物
<400>41
ctagtttgac ggtcccagaa aacgaaagag acacaaacga aaacgatgaa gagcagagca60
agcattccca ag72
<210>42
<211>81
<212>DNA
<213>人工的
<220>
<223>引物
<400>42
gatccttggg aatggctgct gctcttgctc tgctcttcat cgttttcgtt tgtgtctctt60
tcgttttctg ggaccgtcaa a 81
<210>43
<211>81
<212>DNA
<213>人工的
<220>
<223>引物
<400>43
ctagtttgac ggtcccagaa aacgaaagag acacaaacga aaacgatgaa gagcagagca60
agagcagcag ccattcccaa g 81
<210>44
<211>28
<212>DNA
<213>人工的
<220>
<223>引物
<400>44
ggtcactagt atcttcattt ccgagttg 28
<210>45
<211>31
<212>DNA
<213>人工的
<220>
<223>引物
<400>45
ggtcactagt gcgatctgca tattctgact g 31
<210>46
<211>31
<212>DNA
<213>人工的
<220>
<223>引物
<400>46
aacgtctaga atgagagggt acaagttttg c 31
<210>47
<211>29
<212>DNA
<213>人工的
<220>
<223>引物
<400>47
cggggtaccc catgaccgga gctagccgt 29
<210>48
<211>24
<212>DNA
<213>人工的
<220>
<223>引物
<400>48
gactagaaaa ggagtgataa ccct24
<210>49
<211>35
<212>DNA
<213>人工的
<220>
<223>引物
<400>49
cggggtaccc catgaaatca tcatcattat ctccc35
<210>50
<211>51
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列(GCSI ER信號)
<400>50
Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu Ser Pro Gly Ser Asp Glu Gly Ser Ala Tyr Pro Pro Ser Ile
20 25 30
Arg Arg Gly Lys Gly Lys Glu Leu Val Ser Ile Gly Ala Phe Lys Thr
35 40 45
Asn Leu Lys
50
<210>51
<211>41
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列(靶向人GCSI ER)
<400>51
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Val Pro Ala Glu Gly Val
1 5 10 15
Arg Thr Ala Glu Arg Ala Ala Arg Gly Gly Pro Gly Arg Arg Asp Gly
20 25 30
Arg Gly Gly Gly Pro Arg Ser Thr Ala
35 40
<210>52
<211>39
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列
<400>52
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Ala Ala Ala Glu Gly Ala
1 5 10 15
Arg Pro Leu Glu Arg Ala Arg Ala Ala Gly Arg Arg Asp Gly Arg Ala
20 25 30
Gly Gly Ala Arg Gly Ser Ala
35
<210>53
<211>36
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列
<400>53
Met Ala Arg Gly Glu Arg Arg Arg Arg Gly Ala Pro Val Asp Gly Ala
1 5 10 15
Arg Thr Ala Glu Arg Ala Ala Arg Gly Gly Pro Ala Arg Arg Gly Gly
20 25 30
Glu Ala Arg Gly
35
<210>54
<211>42
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列
<400>54
Met Ala Ala Arg Thr Arg Ile Ala Asp Ser Gly Gly Gly Ala Arg Ser
1 5 10 15
Arg Glu Thr Lys Thr Lys Pro Lys Ser Gly Asn Gly Ala Gln Ser Arg
20 25 30
Asn Asn Glu Thr Gln Ser Ser Ser Lys Asn
35 40
<210>55
<211>39
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列
<400>55
Met Gly Arg Arg Arg Lys Arg Val Ala Thr Gly Asp Gly Val Pro Ser
1 5 10 15
Pro Arg Lys Glu Glu Lys Ala Pro Ala Pro Pro Arg Lys Glu Lys Lys
20 25 30
Lys Lys Thr Asp Ile Gly Lys
35
<210>56
<211>37
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列
<400>56
Met Ala Arg Gln Arg Arg Thr Gln Gly Ala Ala Asp Pro Asn Lys Gly
1 5 10 15
Thr Asn Ser Ser Ser Ser Asn Gly Ser Asn Ser Thr Asn Asn Arg Ser
20 25 30
Ser Lys Ser Thr Ser
35
<210>57
<211>51
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列
<400>57
Met Ala Lys Lys Lys Val Pro Arg Glu Lys Asn His Ser Gly Gly Thr
1 5 10 15
Thr Arg Arg Thr Ser Glu Ser Ser Ser Asn Asn His Ala Asp Ser Lys
20 25 30
Arg Gln Ile Arg Ile Lys Leu Asn Glu Lys Arg Lys Arg Gln Glu Pro
35 40 45
Gly Ser Lys
50
<210>58
<211>46
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列
<400>58
Met His Arg Glu His Glu Glu Met His Gln Pro Ser Arg Arg Arg Arg
1 5 10 15
Pro Pro Arg Glu Val Glu Arg Pro Ser Ala Thr Ile Arg Tyr Glu Pro
20 25 30
Val Ala Glu Pro Glu Pro Trp Cys Ser Phe Cys Ser Trp Asp
35 40 45
<210>59
<211>62
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列
<400>59
Met Ser Gly Gly Gly Gly Ser Ser Ser Val Arg Arg Pro Val Ala Ala
1 5 10 15
Ala Arg Ser Arg Ser Gly Pro Glu Pro Asp Ala Arg Arg Ala Ala Ala
20 25 30
Ala Ala Ala Ala Ala Ala Ala Ala Ala Ala Arg Arg Arg Gly Arg Gly
35 40 45
Asp His Gly Pro Leu Arg Leu Met Glu Val Ser Pro Arg Asn
50 55 60
<210>60
<211>11
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列
<400>60
Met Ala Pro Pro Pro Pro Arg Gln Pro Arg Gln
1 5 10
<210>61
<211>42
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)尾序列
<400>61
Met Ser Ile Leu Asn Ile Ser Ile Thr Val Leu Cys Ile Ala Ile Ala
1 5 10 15
Thr Trp Phe Ser Tyr Lys Gly Tyr Leu Glu Thr Arg Val Asn Thr Pro
20 25 30
Tyr Asp Ile Lys Lys Leu Val Thr Ile Ser
35 40
<210>62
<211>18
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)結(jié)構(gòu)域
<400>62
Met Thr Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>63
<211>7
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)結(jié)構(gòu)域-SEQ ID NO64-SEQ ID NO2
<400>63
Met Ile Lys Ser Ser Ser Leu
1 5
<210>64
<211>16
<212>PRT
<213>人工的
<220>
<223>延伸的胞質(zhì)結(jié)構(gòu)域-SEQ ID NO2
<400>64
Met Ala Arg Gly Glu Arg Arg Arg Arg Ala Ile Lys Ser Ser Ser Leu
1 5 10 15
<210>65
<211>14
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)結(jié)構(gòu)域
<400>65
Met Thr Ala Gly Ala Ser Arg Arg Ser Ala Arg Gly Arg Ile
1 5 10
<210>66
<211>18
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)結(jié)構(gòu)域
<400>66
Met Thr Gly Ala Ser Ala Ala Ser Ala Ala Gly Ala Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>67
<211>18
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)結(jié)構(gòu)域
<400>67
Met Thr Gly Ala Ser Leu Leu Ser Ala Leu Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>68
<211>18
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)結(jié)構(gòu)域
<400>68
Met Thr Gly Ala Ser Leu Leu Ser Ala Arg Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>69
<211>18
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)結(jié)構(gòu)域
<400>69
Met Thr Gly Ala Ser Arg Arg Ser Ala Leu Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>70
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(2)..(3)
<223>Xaa可以是任何天然氨基酸
<400>70
Arg Xaa Xaa Arg
1
<210>71
<400>71
000
<210>72
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(2)..(3)
<223>Xaa可以是任何天然氨基酸
<400>72
Arg Xaa Xaa Lys
1
<210>73
<211>5
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(2)..(4)
<223>Xaa可以是任何天然氨基酸
<400>73
Arg Xaa Xaa Xaa Lys
1 5
<210>74
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(2)..(3)
<223>Xaa可以是任何天然氨基酸
<400>74
Lys Xaa Xaa Arg
1
<210>75
<211>5
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(2)..(4)
<223>Xaa可以是任何天然氨基酸
<400>75
Lys Xaa Xaa Xaa Arg
1 5
<210>76
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>76
Arg Arg Xaa Xaa Arg Xaa Arg
1 5
<210>77
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>77
Arg Lys Xaa Xaa Arg Xaa Arg
1 5
<210>78
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>78
Arg Arg Xaa Xaa Arg Xaa Lys
1 5
<210>79
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>79
Arg Arg Xaa Xaa Lys Xaa Arg
1 5
<210>80
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>80
Lys Arg Xaa Xaa Arg Xaa Arg
1 5
<210>81
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>81
Lys Lys Xaa Xaa Arg Xaa Arg
1 5
<210>82
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>82
Arg Arg Xaa Xaa Lys Xaa Lys
1 5
<210>83
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>83
Arg Lys Xaa Xaa Lys Xaa Arg
1 5
<210>84
<211>7
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<220>
<221>misc_feature
<222>(3)..(4)
<223>Xaa可以是任何天然氨基酸
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任何天然氨基酸
<400>84
Arg Lys Xaa Xaa Arg Xaa Lys
1 5
<210>85
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>85
Arg Arg Arg Arg
1
<210>86
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>86
Arg Lys Arg Arg
1
<210>87
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>87
Arg Arg Lys Arg
1
<210>88
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>88
Arg Arg Arg Lys
1
<210>89
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>89
Arg Arg Lys Lys
1
<210>90
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>90
Arg Lys Lys Arg
1
<210>91
<211>4
<212>PRT
<213>人工的
<220>
<223>精氨酸基序序列
<400>91
Lys Lys Arg Arg
1
<210>92
<211>38
<212>DNA
<213>人工的
<220>
<223>引物
<400>92
gactctagag cgggaagatg aggcttcggg agccgctc 38
<210>93
<211>58
<212>DNA
<213>人工的
<220>
<223>引物
<400>93
aaggcctacg ctacttgtca tcgtcatctt tgtagtcgca cggtgtcccg aagtccac 58
<210>94
<211>35
<212>DNA
<213>人工的
<220>
<223>引物
<400>94
atcgaaatcg cacgatgaga gggtacaagt tttgc35
<210>95
<211>35
<212>DNA
<213>人工的
<220>
<223>引物
<400>95
cccatgatgc gatctgcata ttctgactgt gtcgc35
<210>96
<211>29
<212>DNA
<213>人工的
<220>
<223>引物
<400>96
ggactagtgc actgtcgctg cccgcctgc 29
<210>97
<211>58
<212>DNA
<213>人工的
<220>
<223>引物
<400>97
aaggcctacg ctacttgtca tcgtcatctt tgtagtcgca cggtgtcccg aagtccac58
<210>98
<211>18
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)結(jié)構(gòu)域
<400>98
Met Thr Gly Ala Ser Leu Arg Ser Ala Arg Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>99
<211>18
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)結(jié)構(gòu)域
<400>99
Met Thr Gly Ala Ser Leu Arg Ser Ala Leu Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>100
<211>18
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)結(jié)構(gòu)域
<400>100
Met Thr Gly Ala Ser Arg Leu Ser Ala Arg Gly Leu Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>101
<211>18
<212>PRT
<213>人工的
<220>
<223>胞質(zhì)結(jié)構(gòu)域
<400>101
Met Thr Gly Ala Ser Arg Leu Ser Ala Leu Gly Arg Ile Lys Ser Ser
1 5 10 15
Ser Leu
<210>102
<211>39
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 1的核酸序列
<400>102
atgaccggag ctagccgtcg gagcgcgcgt ggtcgaatc 39
<210>103
<211>30
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 2的核酸序列
<400>103
atggctcggg gcgagcggcg gcgccgcgca30
<210>104
<211>36
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 3的核酸序列
<400>104
atgaatgatc gtagaccgca aaggaaacgc ccagca 36
<210>105
<211>147
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 4的核酸序列
<400>105
tttcagggcg agcacaaaga gagcttatac tggggaactt atcgtcctca tgtttatttt 60
ggagttcgag ctagaactcc attgtccttg gtagctggct tgatgtggct tggtgtcaaa120
gatgagatgt atgttatgcg gcatttc147
<210>106
<211>150
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 5的核酸序列
<400>106
ttccaaggag atcacaagga aagcttgtat tggggtacct acaggccgaa tgtatatctt 60
ggaattcgtg caagaacccc gttgtctcta attgctggga taatgtggat tggtgcaaag120
aatgggcaat actttcttcg tcatgtttgc 150
<210>107
<211>148
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 6的核酸序列
<400>107
tgaatctgac gcatcgctgc tctggggaac ataccgtcca caaatttact ttggccttcg 60
tcctcgtctt cccggatccc tcttaaccgg cctcgcttgg tttggcctac aagattacag120
cgactttcag catattcgac atcagtgc 148
<210>108
<211>142
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 7的核酸序列
<400>108
agaacgatct aatcgtctct tctggggtac ttatcgtcct ggaatttatt tcggtatgaa 60
acacagaagt cccatatctc ttttgtttgg agttatgtgg acagttcaag acgcagaaaa120
ctttgccttc cgtcactcat gt 142
<210>109
<211>480
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 8的核酸序列
<400>109
atgaccggag ctagccgtcg gagcgcgcgt ggtcgaatca aatcatcatc attatctccc 60
ggctccgatg aaggaagcgc ttatcctccg agtatccgcc gcggcaaagg caaggaactt120
gtatcgatcg gtgctttcaa gacgaatctc aagatattgg ttgggttaat catattaggg180
attatagtaa tctacttcgt aatcaatcgg ctagttcgtc acgggttgtt gtttgatgag240
tcccagaagc ctagggttat cactcctttt cctgctccga aagtcatgga tttgtcaatg300
tttcagggcg agcacaaaga gagcttatac tggggaactt atcgtcctca tgtttatttt360
ggagttcgag ctagaactcc attgtccttg gtagctggct tgatgtggct tggtgtcaaa420
gatgagatgt atgttatgcg gcatttctgt gaaaactctg atgatttaag tacatttggc480
<210>110
<211>54
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 9的核酸序列
<400>110
cttgctctgc tcttcatcgt tttcgtttgt gtctctttcg ttttctggga ccgt 54
<210>111
<211>69
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 10的核酸序列
<400>111
cggtacctcc tcatcttggc tgctgtcgcc ttcatctaca tacagatgcg gctttttgcg60
acacagtca69
<210>112
<211>54
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 11的核酸序列
<400>112
ttagggattc tatttgctgt tactttgtct atagttctga tgttggtgtc tgta 54
<210>113
<211>60
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 12的核酸序列
<400>113
atttttctgt atatgttact tctcaactct ctctttctca tcatctactt cgtttttcac60
<210>114
<211>69
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 13的核酸序列
<400>114
cgaaaattat cgaatttgtt accactctgc gttgctctgg tagttatcgc tgagatcggg60
tttctgggt69
<210>115
<211>69
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 14的核酸序列
<400>115
cgtaaagtct cgaccttttt gccaatctgc gtggctcttg tcgtcattat cgagatcggg60
ttcctctgt69
<210>116
<211>75
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 15的核酸序列
<400>116
ttcaacacaa tcaccatcac aatcatgata gctttcacct tcttcctcct cttcctcacc60
ggtttcctcc aattc 75
<210>117
<211>60
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 16的核酸序列
<400>117
aagcgtcttg ctctgctctt catcgttttc gtttgtgtct ctttcgtttt ctgggaccgt60
<210>118
<211>87
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 17的核酸序列
<400>118
atggcgagag ggagcagatc agtgggtagc agcagcagca aatggaggta ctgcaaccct60
tcctattact tgaagcgccc aaagcgt87
<210>119
<211>117
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 18的核酸序列
<400>119
atgggtgttt tctcgaatct tcgaggaccc agagccggag ctacccacga tgaatttccg60
gcgaccaatg gctctccttc gtcttcttct tctccatctt catcaatcaa gcgaaaa 117
<210>120
<211>32
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 19的核酸序列
<400>120
atgagagggt acaagttttg ctgtgatttc cg 32
<210>121
<211>117
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 20的核酸序列
<400>121
atgggtgttt tctccaatct tcgaggtcct aaaattggat tgacccatga agaattgcct 60
gtagtagcca atggctctac ttcttcttct tcgtctcctt cctctttcaa gcgtaaa 117
<210>122
<211>35
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 21的核酸序列
<400>122
atgcttgtaa tgccacagcc acccaaaccc ttcaa35
<210>123
<211>87
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 22的核酸序列
<400>123
atggcgagag ggagcagatc agtgggtagc agcagcagca aatggaggta ctgcaaccct 60
tcctattact tgaagcgccc aaagcgt 87
<210>124
<211>50
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 23的核酸序列
<400>124
atggcaaatc tttggaagaa gcagagattg agagatacag gtttatgtcg50
<210>125
<211>499
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 24的核酸序列
<400>125
tcgtattaat cttgcccgag aacatgaggt tgaagttttt aagctaaatg aagaagtttc 60
acggttggag cagatgttag aagagcttaa tggtggtgtt ggcaataagc ctttgaagac120
tctgaaggat gccccagaag atccagttga taaacagcga aggcagaaag taaaagaggc180
aatgatccat gcttggagct cttatgaaaa gtatgcatgg gggaaagatg agcttcagcc240
tcggacaaaa gatggcactg atagctttgg tggccttgga gcaactatgg tagattcttt300
agatacactc tatataatgg gtctagatga gcagtttcaa aaagccagag agtgggttgc360
aagctcattg gatttcgaca aggattatga cgccagtatg tttgagacaa ccataagagt420
tgtaggcgga cttcttagtg cgtatgatct ttctggggac aaaatgttcc ttgaaaaggc480
taaggatatt gcagacaga 499
<210>126
<211>837
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 25的核酸序列
<400>126
actctcttcc acttcggcgt accaggaccg atctcctcac gattccttac ctccagatcc 60
aatcggatcg tcaagccacg gaagaatatt aatcgccgac ccttaaacga ttccaattca120
ggcgccgtcg ttgatatcac aactaaagat ctatacgata ggattgagtt tcttgataca180
gatggtggtc catggaaaca aggttggaga gttacgtata aagacgatga gtgggagaaa240
gagaagctca aaatcttcgt tgttcctcat tctcataacg atcctggttg gaaattgact300
gtagaggagt attatcagag acaatccaga catattcttg acaccattgt tgagacttta360
tctaaggatt caagaagaaa gtttatatgg gaggagatgt catatctgga gagatggtgg420
agagacgctt cacctaataa acaagaagct ttgactaaat tggttaagga tgggcagcta480
gagattgttg gaggtggctg ggttatgaat gatgaggcta attcacatta ttttgccata540
attgaacaga tagcagaggg taatatgtgg ctgaatgaca caattggggt tattcctaag600
aattcttggg ctatagatcc ctttggctat tcatcaacca tggcttatct tctccggcgt660
atgggttttg aaaacatgct tattcaaagg actcattacg agctcaagaa agaccttgcc720
cagcataaga atcttgaata tatttggcgt cagagctggg atgctatgga aaccacagat780
atctttgttc atatgatgcc gttttattca tacgatatcc cacacacttg tggacca 837
<210>127
<211>550
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 26的核酸序列
<400>127
ccagacgcaa tcacagtatg cagatcgcct cagttccgct atcgaatctg agaaccattg 60
cactagtcaa atgcgaggcc tcatagatga agttagcatc aaacagtcgc ggattgttgc120
cctcgaagat atgaagaacc gccaggacga agaacttgtg cagcttaagg atctaatcca180
gacgtttgaa agtgccttac tatcacctat gcctgtggct gctgtagtgg ttatggcctg240
cagtcgtgca gactatcttg aaaggactgt taaatcagtt ttaacatatc aaactcccgt300
tgcttcaaaa tatcctctat ttatatctca ggatggatct gatcaagctg tcaagagcaa360
gtcattgagc tataatcaat taacatatat gcagataaat gaggatgaag gctcgttttc420
cccttttcag cacttggatt ttgaaccagt ggtcactgaa aggcctggcg aactgactgc480
gtactacaag attgcacgta aggactggtt tctcttttct ctgcgtccct ccagctccat540
tactgaaaca 550
<210>128
<211>523
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 27的核酸序列
<400>128
tagaactgct ttgaatggtt cttctattga cgatgatttg gatggtttag ataaagattt 60
ggaagctaag cttaatgctt cattgctaag tgtagctaga ggtaatagaa tgtctctaag120
gttgcataga aggaaccatt tttcgcctag aaatacggat ctgttcccgg atttggcaaa180
agatcgtgtg gttatcgtct tgtatgtgca taatcgggct cagtattttc gagtcacagt240
ggaaagtttg tcgaaggtta aaggtataag tgagacattg ttgattgtta gtcatgatgg300
ttactttgaa gagatgaata ggattgtgga gagtattaag ttttgtcaag tgaaacagat360
tttctcgcct tattcgcctc atatatatcg tactagcttc ccgggtgtga ccctgaatga420
ttgtaagaac aagggtgatg aggcaaaggg gcattgtgaa ggtaatcctg atcagtatgg480
gaatcatcgg tctccgaaga ttgtatcttt gaagcatcac tgg 523
<210>129
<211>544
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 28的核酸序列
<400>129
tcactcatcg tcgttttcac cggagcagtc acagcctcct catatatacc acgtttcagt 60
gaataaccaa tcggcgattc agaaaccgtg gccgatctta ccttcttacc tcccatggac120
gccgccgcag aggaatctac caactggctc ctgcgaaggt tacttcggga atggatttac180
aaagagagtt gacttcctta agccgaggat tggaggagga ggagaaggaa gctggttccg240
atgtttttac agtgagacat tacagagttc gatttgtgaa ggaaggaatc tgagaatggt300
tccggatcgg attgttatgt cgagaggagg tgagaagtta gaggaagtta tggggaggaa360
agaggaggag gagcttcctg cgtttcgaca aggtgcgttt gaggtagcgg aagaggtttc420
ttcacggtta ggttttaaga gacaccgtcg ttttggtgga ggagaaggag gtagtgcggt480
ttctcggcgg ctggtgaatg atgagatgtt gaatgaatat atgcaagaag gtggaattga540
taga 544
<210>130
<211>450
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 29的核酸序列
<400>130
cggctcgata acgcttcttt ggtcgatacg ttaacccatt ttttcaccaa gtcgtcgtcc 60
gatttgaaag ttgggtcagg aatagagaaa tgccaggagt ggttagagag agtggattca120
gttacttatt ctagagattt cactaaagat ccgattttta tctctggtag taacaaggac180
ttcaaatcgt gctctgttga ttgtgtaatg ggattcactt cagataagaa acctgatgcg240
gcttttggat taagtcatca acctggaaca ctcagtataa tccgttccat ggaatcagca300
cagtattacc aagagaataa tcttgctcaa gcacgacgga aaggttatga tattgtgatg360
acaactagtc tgtcatcaga tgttcctgtt gggtattttt catgggcgga atatgatatt420
atggctccag tgcaaccaaa aacagagaaa 450
<210>131
<211>616
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 30的核酸序列
<400>131
tttagaattc ccatctgctt caacttcgat ggagcattca atagacccgg aaccgaaatt 60
gtctgattca acatcggatc cattcagtga tgttcttgta gcttataaaa aatgggactt120
tgaagtgggt tgtgctcggt ttagggagaa tcataaagat gcgattttgg gtaatgttag180
ttcgggttct ttacaagaat ttggttgtgg taagcttaag atgaagcatg ttaaggtatt240
ggttaaaggg tggacttgga ttccggataa tttggaaaat ttgtattctt gtcgttgtgg300
gatgacttgt ttgtggacta aatcatcggt tttggctgat tcacctgatg ctttgttgtt360
cgagacaaca actcctccac tacagagacg tgttggagat ccgctccgtg tgtacatgga420
gctagaggcc ggaagaaaac gctcaggccg tgaagatata ttcatcagct accatgcgaa480
agacgatgtc caaacaactt acgccggttc gctctttcat aataacagaa actatcacat540
ctctccacat aaaaacaatg atgttctggt gtattggtct tcctcaagat gcctccctca600
cagagatcgt ctagca616
<210>132
<211>450
<212>DNA
<213>人工的
<220>
<223>編碼SEQ ID NO 31的核酸序列
<400>132
cggctcgata aagtcgcttt ggttgatacg ttgactgatt tcttcaccca gtctccgtca 60
ctctcgcagt ctccaccggc gagatccgat cggaagaaga tcggattatt tactgatagg120
agctgcgagg agtggttgat gagagaagat tcagttactt actctagaga ttttactaaa180
gatccaattt ttatctctgg tggtgaaaag gactttcaat ggtgttctgt ggattgtaca240
tttggagata gttcagggaa aacaccagat gctgcgtttg gattaggtca gaaacctgga300
actcttagta taatacgttc catggaatca gcacagtatt atccagaaaa tgatcttgca360
caggcacgac ggagaggtta tgatatagtg atgaccacta gtctatcatc agatgttcct420
gttggatatt tttcgtgggc ggagtatgat 450
權(quán)利要求
1.選自SEQ ID No1到SEQ ID No31的氨基酸序列。
2.包含根據(jù)權(quán)利要求1的氨基酸序列和蛋白質(zhì)的重組蛋白,所述氨基酸序列與所述蛋白質(zhì)的C端或N端末端融合。
3.根據(jù)權(quán)利要求2的重組蛋白,其中所述蛋白質(zhì)選自酶、抗體或其部分、報告蛋白、重組蛋白、有治療活性的蛋白質(zhì)。
4.根據(jù)權(quán)利要求2的重組蛋白,其中所述蛋白質(zhì)是酶,所述酶選自糖苷酶、糖基轉(zhuǎn)移酶、蛋白酶、激酶、脫羧酶、差向異構(gòu)酶、核苷酸-糖轉(zhuǎn)運(yùn)蛋白。
5.核酸序列,其編碼根據(jù)權(quán)利要求1的氨基酸序列或者根據(jù)權(quán)利要求3或4的重組蛋白。
6.核酸載體,其包含根據(jù)權(quán)利要求5的核酸序列。
7.植物細(xì)胞,其包含至少一種根據(jù)權(quán)利要求1的氨基酸序列和/或至少一種根據(jù)權(quán)利要求3或4的重組蛋白和/或至少一種根據(jù)權(quán)利要求6的核酸載體。
8.根據(jù)權(quán)利要求7的植物細(xì)胞,其中所述植物細(xì)胞包含至少一種根據(jù)權(quán)利要求3或4的蛋白質(zhì),所述蛋白質(zhì)是異源蛋白質(zhì)。
9.植物,其包含至少一種根據(jù)權(quán)利要求1的氨基酸序列和/或至少一種根據(jù)權(quán)利要求3或4的重組蛋白和/或至少一種根據(jù)權(quán)利要求6的核酸載體。
10.根據(jù)權(quán)利要求9的植物,其中所述植物包含至少一種根據(jù)權(quán)利要求3或4的蛋白質(zhì),所述蛋白質(zhì)是異源蛋白質(zhì)。
11.根據(jù)權(quán)利要求9或10的植物,所述植物選自苜蓿、擬南芥(Arabidospsis thaliana)、煙草(Nicotiana tabacum)、大豆(Glycinemax)、番茄(Lycopersicon esculentum)、西紅柿(Solanumlycopersicum)。
12.生產(chǎn)經(jīng)翻譯后修飾的多肽的方法,其包括以下步驟
-用至少一種根據(jù)權(quán)利要求6的核酸載體轉(zhuǎn)染或轉(zhuǎn)化細(xì)胞,所述載體編碼重組蛋白,所述重組蛋白是翻譯后修飾之前的所述多肽,或者是與所述多肽不同的重組蛋白;
-培養(yǎng)經(jīng)轉(zhuǎn)染的細(xì)胞;和
-收獲經(jīng)翻譯后修飾的多肽;
其中,當(dāng)所述重組蛋白與所述多肽不同時,所述方法還包括用至少一種編碼所述多肽的核酸載體轉(zhuǎn)染所述細(xì)胞的步驟。
13.權(quán)利要求12的方法,其中所述重組蛋白是翻譯后修飾之前的該多肽。
14.權(quán)利要求12的方法,其中所述重組蛋白與所述多肽不同,且其中所述重組蛋白是識別并特異結(jié)合所述多肽的抗體或其部分。
15.權(quán)利要求12的方法,其中所述重組蛋白與所述多肽不同,且其中所述重組蛋白是參與所述多肽翻譯后修飾的內(nèi)源或異源酶。
16.權(quán)利要求12的方法,其中所述重組蛋白與所述多肽不同,且其中所述重組蛋白是調(diào)控參與所述多肽翻譯后修飾之酶的抗體或其部分。
17.權(quán)利要求12到16中任一項的方法,其中多肽與儲藏蛋白共表達(dá)。
18.根據(jù)權(quán)利要求12到17中任一項的方法,其中所述肽的翻譯后修飾在內(nèi)質(zhì)網(wǎng)(ER)和/或高爾基體(GA)區(qū)室膜中進(jìn)行。
19.根據(jù)權(quán)利要求12到18中任一項的方法,其中所述經(jīng)翻譯后修飾的多肽是有治療活性的蛋白質(zhì)。
20.根據(jù)權(quán)利要求12到19中任一項的方法,其中所述細(xì)胞是植物細(xì)胞。
21.根據(jù)權(quán)利要求12到20中任一項的方法,其中所述植物細(xì)胞屬于選自以下的植物紫苜蓿、擬南芥、煙草、大豆、番茄、西紅柿。
全文摘要
本發(fā)明提供了可用于控制重組多肽的翻譯后修飾的新工具。這些工具是特定的信號肽,其允許將重組多肽在其宿主細(xì)胞中合成期間靶向特定的亞細(xì)胞區(qū)室,并且允許在所述亞細(xì)胞區(qū)室中對所述重組多肽進(jìn)行特定的設(shè)計。這些信號肽是本文公開的SEQ ID n°1到SEQ ID n°31。有利地,本發(fā)明允許例如提高重組多肽生產(chǎn)的產(chǎn)率、防止重組多肽的免疫原性和獲得有治療活性的重組多肽,所述重組多肽是其天然對應(yīng)物的精確拷貝。本發(fā)明尤其涉及植物制成藥物(plant made pharmaceutical,PMP)再定向的領(lǐng)域。
文檔編號C12N15/82GK101622354SQ200780049458
公開日2010年1月6日 申請日期2007年11月8日 優(yōu)先權(quán)日2006年11月8日
發(fā)明者韋羅妮克·格默爾德, 克洛德·桑-若爾-迪帕, 奧雷利婭·布拉夫盧斯, 馬里-克里斯蒂娜·基弗-梅耶爾, 盧瓦克·費(fèi)伊 申請人:國家科學(xué)研究中心