專利名稱::用于昆蟲細(xì)胞的合成的表達(dá)載體的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明總的來說涉及用于在昆蟲細(xì)胞中產(chǎn)生異源蛋白質(zhì)的經(jīng)改良的表達(dá)載體的設(shè)計(jì)。所述經(jīng)改良的表達(dá)載體由一系列調(diào)控元件組成,所述調(diào)控元件是合成起源的,或者以提供高水平的重組蛋白質(zhì)表達(dá)的方式進(jìn)行優(yōu)化和裝配。此外,本發(fā)明還涉及利用這些經(jīng)改良的表達(dá)載體來產(chǎn)生重組亞單位蛋白質(zhì)以用于在疫苗制劑中使用。
背景技術(shù):
:已開發(fā)出了許多異源細(xì)胞表達(dá)系統(tǒng)來表達(dá)和分泌重組蛋白質(zhì)。一般而言,使用基于真核宿主細(xì)胞的系統(tǒng)來表達(dá)需要正確的折疊和翻譯后修飾的真核蛋白質(zhì),從而允許產(chǎn)生"天然樣"蛋白質(zhì)。存在有4種主要的通常利用的真核宿主細(xì)胞類型真菌(包括酵母)、昆蟲、植物和哺乳動(dòng)物。待采用的重組蛋白質(zhì)表達(dá)系統(tǒng)的選擇依賴于所需的應(yīng)用。所選擇的系統(tǒng)必須符合關(guān)鍵標(biāo)準(zhǔn)例如所需蛋白質(zhì)產(chǎn)物的正確折疊和加工、一致'〖生和生產(chǎn)率(成本效益)(Schmidt,爿/v人#/'cro6/o/.5/ofec力/20/.(2004)65:363-372)?;谝子谂囵B(yǎng)、更高的在大規(guī)模培養(yǎng)過程中對(duì)于重量摩爾滲透壓濃度和副產(chǎn)物濃度的耐受性、以及一般地更高的表達(dá)水平,基于昆蟲細(xì)胞的表達(dá)系統(tǒng)具有滿足容量需求的潛力(Ikonomou等人,」;7p/.#/croWo/W0&c力/20人(2003)62:1-20)。近來,使用基于昆蟲細(xì)胞的表達(dá)系統(tǒng)已變得更常見。這些系統(tǒng)提供了真核系統(tǒng)的所需特征中的大多數(shù),但具有附加的益處例如更低的商品成本。昆蟲細(xì)胞系統(tǒng)基于用昆蟲病毒載體(例如桿狀病毒)感染宿主細(xì)胞,或者基于通過將表達(dá)質(zhì)粒整合到宿主細(xì)胞的基因組中來產(chǎn)生穩(wěn)定的細(xì)胞系。桿狀病毒表達(dá)系統(tǒng)(BES)已作為用于重組蛋白質(zhì)表達(dá)的主要昆蟲細(xì)胞培養(yǎng)系統(tǒng)而出現(xiàn)。這種系統(tǒng)基于使用源自稱為桿狀病毒的昆蟲病毒的栽體。將這些載體用于產(chǎn)生編碼所需蛋白質(zhì)產(chǎn)物的重組病毒。將所述重組病毒用于感染宿主昆蟲細(xì)胞,所述宿主昆蟲細(xì)胞隨后表達(dá)所需重組蛋白質(zhì)。盡管對(duì)于這種系統(tǒng)來說在易于克隆和"至產(chǎn)物的時(shí)間"方面存在有優(yōu)點(diǎn),但也存在有幾個(gè)缺點(diǎn)。在使用BES中的主要挑戰(zhàn)是,它基于宿主細(xì)胞的病毒感染。這導(dǎo)致在感染后72-96小時(shí)的細(xì)胞裂解和細(xì)胞死亡(Farrell等人,Wotec/.S/oge/j.(1998)60:656-663;Deo和Park,A/ofec/wo7.^//."2'oc力e邁.(2006)43:129—135)。因此,在感染的后期過程中,昆蟲細(xì)胞的加工機(jī)制被損害至所需產(chǎn)物的加工也被損害的程度。這限制了細(xì)胞可以產(chǎn)生產(chǎn)物的時(shí)間,并且可能更重要地導(dǎo)致出現(xiàn)正產(chǎn)生出的產(chǎn)物的經(jīng)改變的形式。此外,細(xì)胞的裂解釋放出細(xì)胞酶,這些細(xì)胞酶還可以影響所需產(chǎn)物的品質(zhì)。將穩(wěn)定轉(zhuǎn)化的昆蟲細(xì)胞用于表達(dá)重組蛋白質(zhì)是對(duì)于使用BES來說的備選方案。基于穩(wěn)定轉(zhuǎn)化的昆蟲細(xì)胞系的表達(dá)系統(tǒng)是非裂解性的,并且使得能夠穩(wěn)定地長(zhǎng)期生產(chǎn)需要正確的折疊和翻譯后修飾的分泌型料,并且允許最:的i白;產(chǎn)二用基本方法進(jìn)行純化。這導(dǎo)致獲得具有更高品質(zhì)的產(chǎn)物(Kirkpatrick和Shatzman,Ceie^r/7res"'aoiys^e邁s.'^y/刀g^afwre尸orf力e^^rpress/o"(1999)pp289-330)。黑腹果蠅(/^wo;力y7a邁e/a;30^2Wer)細(xì)胞表達(dá)系統(tǒng)("果蠅表達(dá)系統(tǒng)")是已建立的異源蛋白質(zhì)表達(dá)系統(tǒng),其基于使用包含果蠅啟動(dòng)子的表達(dá)載體和果蠅S2細(xì)胞("S2細(xì)胞")(Schneider,f/z^iyo/.^T.#0/77力.(1972)27:353-365)。用這些載體轉(zhuǎn)化S2細(xì)胞,以便建立穩(wěn)定細(xì)胞系,該穩(wěn)定細(xì)胞系表達(dá)相應(yīng)于被引入載體中的異源序列的蛋白質(zhì)(Johansen,H.等人,Ce/z"Zer.(1989)3:882-889;Ivey—Hoyle,M.,O/rr.6^//."/ofec/wo/.(1991)2:704—707',Culp,J.S.等人,WWec/wo/og/^V"(1991)9:173-177;美國(guó)專利5,550,043;5,681,713;5,705,359;6,046,025)。這種昆蟲細(xì)胞表達(dá)系統(tǒng)已顯示出成功產(chǎn)生了來自不同來源的許多蛋白質(zhì)。已在果蠅S2細(xì)胞系統(tǒng)中成功表達(dá)的蛋白質(zhì)的例子包括HIVgpl20(Culp,J".S.,等人,WWec力/7o/c^/(1991)9:173-177;Ivey-Hoyle,M.,倫fe由o人(1991)2:704-707)、人多巴胺p-水解酶(Bin等人,"/oc力e瓜/.(1996)313:57-64)、人血管細(xì)胞粘著蛋白(Bernard等人,O^ofec/wo/.(1994)15:139-144)。在這些例子的每一個(gè)中,表達(dá)水平大于先前所利用的其他表達(dá)系統(tǒng)。除了高水平的表達(dá)外,果蠅表達(dá)系統(tǒng)已顯示能夠表達(dá)保持了天然樣生物學(xué)功能的異源蛋白質(zhì)(Bin等人,"/oc力e瓜/.(1996)313:57-64),(Incardona和Rosenberry,A/o厶Ce//.(1996)7:595-611)。借助于X射線晶體學(xué)研究,更近期的例子顯示,這種表達(dá)系統(tǒng)能夠產(chǎn)生具有天然樣結(jié)構(gòu)的分子(Modis等人,yVs〃.力c".蹈(2003)100:6986-6991),(Modis等人,#"謡(2004)427:313-319),(Xu等人,Cr/"a"(^t.頻o厶CiT"a"o《r(2005)61:942-950)。兩個(gè)其他的近期出版物也證明了果繩表達(dá)系統(tǒng)產(chǎn)生高品質(zhì)產(chǎn)物的能力。在第一篇報(bào)道中,Schmetzer等人(/.//z朋wl(2005)174:942-952)就蛋白質(zhì)折疊和天然構(gòu)象而言將由桿狀病毒表達(dá)的EpCAM蛋白與由果蠅表達(dá)的EpCAM蛋白進(jìn)行比較。特別地,將由BES表達(dá)的EpCAM和由果蠅表達(dá)的EpCAM與變性的由果蠅表達(dá)的EpCAM進(jìn)4亍比較。確定了,相對(duì)于未變性的和變性的由果蠅表達(dá)的EpCAM蛋白而言,由BES表達(dá)的EpCAM處于部分折疊的狀態(tài)。這編碼,由BES表達(dá)的蛋白質(zhì)處于不完全折疊的狀態(tài)。另一方面,由果蠅表達(dá)的EpCAM蛋白采取更完全折疊的狀態(tài)。這篇文章的作者認(rèn)為由果蠅表達(dá)的蛋白質(zhì)處于"天然的"狀態(tài),而由桿狀病毒表達(dá)的蛋白質(zhì)則不是。在第二篇報(bào)道中,Gardsvoll等人(尸rW.戶"r/尸.(2004)34:284—295)證明,尿激酶型纖溶酶原激活物受體(uPAR)在S2細(xì)胞中的表達(dá)導(dǎo)致6在糖基化(5個(gè)N-聯(lián)位點(diǎn))方面比在CH0細(xì)胞中表達(dá)的uPAR更均一的產(chǎn)物?;诶霉塖2細(xì)胞作為宿主細(xì)胞來表達(dá)異源蛋白質(zhì)的一批工作,清楚地知曉,這些細(xì)胞具有許多在表達(dá)系統(tǒng)中所希望的特征。在對(duì)于利用這些細(xì)胞來產(chǎn)生重組蛋白質(zhì)的公開報(bào)道所進(jìn)行的綜覽中,蛋白質(zhì)產(chǎn)物的表達(dá)水平通常為5-50jig/ml。為了具有可以滿足生物技術(shù)制造的嚴(yán)苛需要的蛋白質(zhì)生產(chǎn)系統(tǒng),希望更高的表達(dá)水平。為了達(dá)到始終如一地較高的表達(dá)水平,要求優(yōu)化下列中的任何一個(gè)或全部宿主細(xì)胞系、生長(zhǎng)培養(yǎng)基或表達(dá)載體。任何異源蛋白質(zhì)表達(dá)系統(tǒng)的開發(fā)要求將各種調(diào)節(jié)控制元件(下文,備選地稱為"調(diào)控元件"或"控制元件",或者簡(jiǎn)單地稱為"元件",包括各自的單數(shù)形式)裝配到驅(qū)動(dòng)所需重組蛋白質(zhì)產(chǎn)物的表達(dá)的表達(dá)載體中。這些調(diào)節(jié)控制元件包括轉(zhuǎn)錄激活子和增強(qiáng)子、轉(zhuǎn)錄起始和終止元件、翻譯起始和終止元件、以及分泌信號(hào)前導(dǎo)序列。用于分泌重組蛋白質(zhì)產(chǎn)物的表達(dá)載體的5種主要的調(diào)節(jié)控制元件為l)近側(cè)啟動(dòng)子,2)核心啟動(dòng)子,3)5,非翻譯區(qū),4)分泌信號(hào)肽,和5)3,非翻譯區(qū)。對(duì)于這些元件中的每一種,必須首先獨(dú)立地進(jìn)行任何優(yōu)化。一旦獨(dú)個(gè)元件進(jìn)行了優(yōu)化,它們就必須進(jìn)行裝配和測(cè)試,以確保給定元件的裝配是相容的并且能夠指導(dǎo)所需重組蛋白質(zhì)產(chǎn)物的有效表達(dá)。在元件的各種組合的裝配中,還重要的是,這些元件是"有效連接的"。"有效連接的,,是指各種元件之間以這樣的方式的功能性連接,所述方式保留了各個(gè)元件的功能以及組合的元件的功能,因?yàn)樵S多轉(zhuǎn)錄和翻譯功能是從一個(gè)元件到下一個(gè)元件進(jìn)行處理的結(jié)果。因此,"有效連接的"意指,各種元件的核酸序列是相連接和鄰接的,并且在需要時(shí)鄰接地進(jìn)行連接以保持合適的編碼蛋白質(zhì)的讀碼框。盡管已開發(fā)了許多成功的表達(dá)載體,但經(jīng)完全優(yōu)化的系統(tǒng)較不常見。此外,大多數(shù)開發(fā)出的系統(tǒng)基于使用天然存在的序列,即各種調(diào)控元件取自現(xiàn)有的(天然存在的)基因序列。經(jīng)過過去數(shù)年,合成序列的使用已被用作用于開發(fā)經(jīng)優(yōu)化的表達(dá)載體的手段。"啟動(dòng)子"由兩個(gè)基本部分(核心啟動(dòng)子和近側(cè)啟動(dòng)子)組成。啟動(dòng)子位于給定基因的編碼序列的上游。核心啟動(dòng)子被定義為能夠指導(dǎo)給定基因的精確轉(zhuǎn)錄起始的最小核苷酸序列。真核生物中的核心啟動(dòng)子負(fù)責(zé)指導(dǎo)通過RNA聚合酶II復(fù)合物的起始。一般將核心啟動(dòng)子描繪為跨越轉(zhuǎn)錄起始位點(diǎn)(INR)的序列,更具體而言INR上游和下游35至45個(gè)核苷酸的序列(總長(zhǎng)度70-90個(gè)核苷酸)。由核心啟動(dòng)子所界定的區(qū)域可以包含一種或多種下列保守的調(diào)節(jié)基序TFIIB識(shí)別元件(BRE)、TATA盒、起始子(initiator)(INR)、基序10元件(motiftenelement)(MTE)、下游啟動(dòng)子元件(DPE)和下游核心元件(DCE)。盡管在調(diào)節(jié)控制元件內(nèi)的某些核苷酸序列具有包括詞語"元件"的本領(lǐng)域公認(rèn)的名稱,但此類序列在本文中籠統(tǒng)地稱為"基序";特別的本領(lǐng)域公認(rèn)的名稱(例如,BRE、MTE、DPE和DCE)在本文中具有與在所引用的參考文獻(xiàn)中一樣的含義,盡管它們?cè)诒疚闹斜环Q為"基序",例如"MTE基序"。核心啟動(dòng)子及其組成性獨(dú)個(gè)基序的作用和組成已由0hler等人(Ce/2咖e,(2002)3:1-12),Smale和Kadonaga(WeF.A/oc力e/z.(2003)72:449—479),FUzGerald等人(Ge/2歸S/o/.(2006)7:R53),Gershenzon等人(MC*Ce/2o/77/cs(2006)7:161)和Juven-Gershon等人("2'oc力e/z/.5Vc.rra/^.(2006)34:1047-1050)進(jìn)行了綜述。還已經(jīng)報(bào)道了定義了DPE基序(Kutach和Kadonaga,Ce7/.S/o/.(2000)20:4754-4764)和MTE基序(Lim等人,Ce"esZer.(2004)18:1606-1617)的研究。盡管大多數(shù)基因的核心啟動(dòng)子包含以各種組合的這些基序中的一種或多種,但存在有不包含任何這些基序的小部分的基因。在來自幾種生物體的核心啟動(dòng)子的綜覽中,清楚的是,不存在通用核心啟動(dòng)子,或者通用的包含核心啟動(dòng)子的基序子集;然而,INR基序是在核心啟動(dòng)子中發(fā)現(xiàn)的最常見的基序(FitzGerald等人,fe"咖e"/o人(2006)7:R53)。真核生物中的近側(cè)啟動(dòng)子一般被定義為緊在核心啟動(dòng)子上游的序列。近側(cè)啟動(dòng)子的長(zhǎng)度是高度可變的。近側(cè)啟動(dòng)子由征募轉(zhuǎn)錄因子的轉(zhuǎn)錄激活子基序組成,而所述轉(zhuǎn)錄因子又激活與核心啟動(dòng)子區(qū)結(jié)合的聚合酶起始復(fù)合物。轉(zhuǎn)錄激活子基序的性質(zhì)和數(shù)目對(duì)于給定啟動(dòng)子來說是高度變化的??梢酝ㄟ^系統(tǒng)性地置換和測(cè)試各種元件或基序,使用合成啟動(dòng)子文庫(kù),或者隨機(jī)置換獨(dú)個(gè)調(diào)控元件或基序來進(jìn)行啟動(dòng)子的優(yōu)化。已報(bào)等人(W"wre貝o"c力/o人(1999)17:241-245)的工作中,報(bào)道了對(duì)隨機(jī)裝配的轉(zhuǎn)錄因子結(jié)合位點(diǎn)驅(qū)動(dòng)肌特異性啟動(dòng)子的轉(zhuǎn)錄進(jìn)行評(píng)估的方法。Edel歸n等人(/Voc.5W.(2000)97:3038-3043)描述了高通量選擇操作程序,以選擇增強(qiáng)核心啟動(dòng)子的轉(zhuǎn)錄活性的合成的近側(cè)啟動(dòng)子。Tornoe等人(Ce/e(2002)297:21-32)建立了一組用于在哺乳動(dòng)物細(xì)胞中使用的合成啟動(dòng)子,其將病毒和人啟動(dòng)子元件相組合。所述合成的哺乳動(dòng)物啟動(dòng)子通過下列方式來進(jìn)一步進(jìn)行優(yōu)化置換共有序列并使其他非共有序列隨機(jī)化,以獲得具有可變活性的啟動(dòng)子。在開發(fā)用于在乳桿菌("c^6aci//^)中進(jìn)行基因表達(dá)的合成啟動(dòng)子中,Rud等人(#/cro6.(2006)152:1011-1019)利用了列隨機(jī)化,以改良啟動(dòng)子的性能。以這種方式,他們能夠鑒定具有增力口的活性的合成啟動(dòng)子。在由Juven-Gershon等人(Mature#e^c>^s(2006)3:917-922)進(jìn)行的工作中,經(jīng)優(yōu)化的核心啟動(dòng)子的開發(fā)通過將來自不同果蠅和病毒基因的核心啟動(dòng)子基序相組合來完成。這項(xiàng)工作集中于使用核心啟動(dòng)子的MTE基序(Lim等人,Ce/7esZer.(2004)18:1606-1617)。這種策略導(dǎo)致具有增加的轉(zhuǎn)錄活性的核心啟動(dòng)子。基于這些報(bào)道,清楚的是,需要通過實(shí)驗(yàn)來確定什么調(diào)控元件和組成性基序構(gòu)成了功能性啟動(dòng)子。這包括使用何種基序組合,基序以何種順序進(jìn)行裝配,以及基序和元件以何種方向插入。無論所利用的基序或元件基于合成的序列還是基于經(jīng)優(yōu)化的序列,這都是必需的。盡管啟動(dòng)子的優(yōu)化已導(dǎo)致在表達(dá)方面的改良,但啟動(dòng)子僅代表了在完全功能性的和經(jīng)優(yōu)化的表達(dá)載體中所需要的調(diào)控元件的一個(gè)方面。信使RNA(mRNA)的5,非翻譯區(qū)(5,UTR)的序列在來自真核mRNA的基因表達(dá)的轉(zhuǎn)錄后調(diào)節(jié)中起重要作用。mRNA的5'UTR區(qū)的序列的可變性以及各種基序和特征的重要性已得到證明(Kozak,/.#o7.5/o入(1994)235:95-110)和(Kozak,Ce/7e(2005)361:13-37)。5,UTR的性質(zhì)在信息穩(wěn)定性和翻譯效率中起作用。給定mRNA的穩(wěn)定性和可翻譯性將影響有效地表達(dá)重組蛋白質(zhì)的能力。因此,用于最佳地產(chǎn)生重組蛋白質(zhì)的表達(dá)栽體的設(shè)計(jì)要求,就其在給定宿主細(xì)胞系統(tǒng)中以有效的方式起作用的能力來評(píng)估5,UTR。所描述的5'UTR是mRNA的一個(gè)重要部分,其由在基因啟動(dòng)子的3,末端中所包含的DNA序列編碼。因此,在定義啟動(dòng)子的DNA序列的情況下,一般包括了5,UTR序列(從INR到起始甲硫氨酸密碼子的區(qū)域)。mRNA的3,非翻譯區(qū)(3,UTR)連同5,UTR的序列一起在基因表達(dá)的轉(zhuǎn)錄后調(diào)節(jié)中起重要作用。3,UTR的性質(zhì)在信息穩(wěn)定性、從細(xì)胞核轉(zhuǎn)運(yùn)至細(xì)胞質(zhì)以及亞細(xì)胞定位中起作用。這些因子中的每一個(gè)可以對(duì)于給定信息的翻譯效率具有影響和最終對(duì)于蛋白質(zhì)表達(dá)水平具有影響。因此,用于最佳地產(chǎn)生重組蛋白質(zhì)的表達(dá)載體的設(shè)計(jì)要求,就其在給定宿主細(xì)胞系統(tǒng)中以有效的方式起作用的能力來評(píng)估3,UTR。從細(xì)胞中分泌出的大多數(shù)蛋白質(zhì)包含指導(dǎo)蛋白質(zhì)進(jìn)入細(xì)胞的分泌途徑的N-末端信號(hào)序列。在真核細(xì)胞中,分泌信號(hào)或信號(hào)肽與內(nèi)質(zhì)膜相互作用以起始分泌過程。已將真核信號(hào)序列分成3個(gè)結(jié)構(gòu)區(qū)域(堿性的、疏水性的和極性的),分別從N-末端開始并進(jìn)行至C-末端(vonHeijne,#uc.Jc油細(xì).(1986)14:4683-4690)和(Bendtsen等人,/.Sio人(2004)340:783-795)。經(jīng)過數(shù)年,已鑒定了許多分泌信號(hào),并用于指導(dǎo)重組蛋白質(zhì)的分泌。盡管已使用了許多不同的信號(hào)序列并且它們顯示是有功能的,但已報(bào)道了對(duì)于給定細(xì)胞類型定義了最佳序列的少數(shù)研究。充分建立了與所述三個(gè)結(jié)構(gòu)區(qū)域相關(guān)的一般特征和準(zhǔn)貝'j,々口由vonHeijne(#〃c.爿c/c^(1986)14:4683-4690)和Bendtsen等人(/.顏.A/。人(2004)340:783-795)所詳細(xì)描述的,然而,關(guān)于什么構(gòu)成了最佳分泌信號(hào)存在很少的比較10實(shí)驗(yàn)數(shù)據(jù)。大多數(shù)公開的報(bào)道涉及革蘭氏陽(yáng)性細(xì)菌或酵母分泌信號(hào)的表征和優(yōu)化(LeLoir等人,Ce7/,ac^.(2005)4:2,以及Hofmann和Schultz,Ce/ze(1991)101:105-111)。描述了IL-2分泌信號(hào)的優(yōu)化的一篇報(bào)道明確地證明了優(yōu)化的益處(Zhang等人,/."e歸.(2005)7:354-365)。經(jīng)優(yōu)化的表達(dá)載體(其用于在昆蟲細(xì)胞中使用以產(chǎn)生能夠生產(chǎn)大量高品質(zhì)重組蛋白質(zhì)的穩(wěn)定細(xì)胞系)的開發(fā)要求鑒定合適的調(diào)控元件,包括但不限于核心啟動(dòng)子元件,其可以用于驅(qū)動(dòng)待表達(dá)的異源蛋白質(zhì)的轉(zhuǎn)錄和翻譯。此外,可以設(shè)計(jì)并利用合成的調(diào)控元件,以進(jìn)一步優(yōu)化表達(dá)載體的功能性。Lim等人,"脂齡.(2004)18:1606-1617;Kutach和Kadonaga,Ce//.A/o/.(2000)20:4754-4764;和Juven—Gershon等人,^/ocAe/w.Soc.rra/7S.(2006)34:1047-1050的公開內(nèi)容局限于核心啟動(dòng)子元件,并且特別地局限于TATA盒、INR、MTE和DPE基序的新型或異源序列和/或間隔。重組蛋白質(zhì)的表達(dá)的調(diào)節(jié)控制的完全優(yōu)化要求,優(yōu)化核心啟動(dòng)子中的多個(gè)調(diào)控元件,而不僅僅是基序。盡管許多調(diào)控元件對(duì)于果蠅以及其他昆蟲來說是已知的,但什么構(gòu)成了用于在昆蟲細(xì)胞中表達(dá)異源蛋白質(zhì)的最佳元件是未知的。目前的技術(shù)和方法提供了基于目前的知識(shí)體系將調(diào)控元件裝配到表達(dá)載體中的可能。盡管存在這種可能,但是作為公知常識(shí),并非如此進(jìn)行的所有嘗試都導(dǎo)致成功。在一種細(xì)胞類型中起作用的重組表達(dá)調(diào)控元件不一定在另一種細(xì)胞類型中起作用。例如,Olsen等人(0^o"c力/o/.(1992)10:157-167)評(píng)估了一系列啟動(dòng)子在S2細(xì)胞中驅(qū)動(dòng)異源蛋白質(zhì)表達(dá)的能力,并且發(fā)現(xiàn)僅果蠅MtnA導(dǎo)致微克產(chǎn)量的產(chǎn)物,盡管所測(cè)試的所有啟動(dòng)子顯示出在其他細(xì)胞類型中起作用。在另一個(gè)例子中,基于在鱗翅目昆蟲細(xì)胞中良好工作的IE啟動(dòng)子(Farrell等人,"/ofec力/20/."/oe/g.(1998)60:656-663)的家香(Ao/z^/i邁or/)表達(dá)載體無法足夠地驅(qū)動(dòng)異源蛋白質(zhì)在S2細(xì)胞中的表達(dá)(未公開的數(shù)據(jù))。因此,需要系統(tǒng)性的評(píng)估以確定使用S2細(xì)胞來始終如一地表達(dá)高水平的高品質(zhì)異源蛋白質(zhì)的潛力。在生物
技術(shù)領(lǐng)域:
中,在有利的商品成本下有效地生產(chǎn)重組蛋白質(zhì)的能力是獲得成功的關(guān)鍵。為了達(dá)到使用果蠅S2細(xì)胞這個(gè)目標(biāo),需要進(jìn)一步開發(fā)合適的表達(dá)載體。將多個(gè)調(diào)控元件以達(dá)到額外益處這樣的合適方式進(jìn)行組合可以進(jìn)一步增強(qiáng)表達(dá)載體的效用。因此,待解決的技術(shù)問題是(l)鑒定用于包括在表達(dá)載體中的調(diào)控元件,所述表達(dá)載體能夠在昆蟲細(xì)胞中驅(qū)動(dòng)大量高品質(zhì)重組蛋白質(zhì)的表達(dá),(2)設(shè)計(jì)合成形式的功能性調(diào)控元件,其具有改良的功能,和(3)確定多個(gè)調(diào)控元件的最佳組合,從而使得該組合導(dǎo)致在蛋白質(zhì)表達(dá)的生產(chǎn)率方面的額外增加。在穩(wěn)定的昆蟲表達(dá)系統(tǒng)中的進(jìn)一步改良可以潛在地為其中需要大量高品質(zhì)蛋白質(zhì)的蛋白質(zhì)制造提供新的平臺(tái),例如在用于生產(chǎn)亞單位疫苗(針對(duì)傳染病例如流感或者具有生物恐怖主義潛力的生物體)的基于細(xì)胞的系統(tǒng)中。發(fā)明概述述調(diào)控元件相組合以提供在經(jīng)穩(wěn)定轉(zhuǎn)化的昆蟲細(xì)胞中異源重組蛋白質(zhì)的高水平表達(dá)。特別地,本發(fā)明旨在當(dāng)將黑腹果蠅S2細(xì)胞用作宿主細(xì)胞時(shí)表達(dá)異源蛋白質(zhì)。下文所描述的pHBI-10(SEQ.ID.NO:10)和pHBI-ll(SEQ.ID.NO:11)表達(dá)載體由5種調(diào)控元件組成近側(cè)啟動(dòng)子、核心啟動(dòng)子、5,UTR、分泌信號(hào)序列和3,UTR。使所述5種元件有效連接以形成表達(dá)盒。使包含在該表達(dá)盒中的調(diào)節(jié)控制元件各自就在果蠅S2細(xì)胞中的使用進(jìn)行優(yōu)化;然而,由于這些序列的經(jīng)優(yōu)化或合成的性質(zhì),在果蠅基因組序列中沒有天然地發(fā)現(xiàn)定義了本發(fā)明的調(diào)控元件的核苷酸序列。本發(fā)明的表達(dá)載體能夠指導(dǎo)異源蛋白質(zhì)的高水平表達(dá)和分泌到經(jīng)轉(zhuǎn)化的細(xì)胞的培養(yǎng)基中。特別地,所描述的表達(dá)載體包含l)合成的經(jīng)優(yōu)化的誘導(dǎo)型近側(cè)啟動(dòng)子,2)合成的經(jīng)優(yōu)化的RNA聚合酶II核心啟動(dòng)子,3)截短的且經(jīng)優(yōu)化的5,UTR序列,4)合成的經(jīng)優(yōu)化的分泌信號(hào)序列,和5)經(jīng)優(yōu)化的3,UTR序列。本發(fā)明還提供了用于將異源基因序列克隆到所述經(jīng)優(yōu)化的表達(dá)載體中并利用所述經(jīng)優(yōu)化的表達(dá)載體來轉(zhuǎn)化昆蟲細(xì)胞的方法,這導(dǎo)致分泌出高水平的保持了天然樣結(jié)構(gòu)的重組蛋白質(zhì)。附圖簡(jiǎn)述圖1。3XRMRE-3XRMRE-SCPl-TolloMTE-A111合成啟動(dòng)子的序列。標(biāo)明了近側(cè)和核心啟動(dòng)子區(qū)中的每個(gè)調(diào)節(jié)基序。圖2。3XRMRE-3XRMRE-SCP7合成啟動(dòng)子的序列。標(biāo)明了近側(cè)和核心啟動(dòng)子區(qū)中的每個(gè)調(diào)節(jié)基序。圖3。pMTtPA、pHBI-10和pHBI-11表達(dá)栽體的比較。關(guān)于每種載體的調(diào)節(jié)控制元件在表3中列出。圖4。pHBI-10質(zhì)粒圖謙。顯示了完整質(zhì)粒的質(zhì)粒圖譜。pHBI-10載體包含合成的核心啟動(dòng)子TolloMTE-Alll。圖5。pHBI-ll質(zhì)粒圖譜。顯示了完整質(zhì)粒的質(zhì)粒圖i普。pHBI-ll載體包含合成的核心啟動(dòng)子SCP7。發(fā)明詳述本發(fā)明提供了已組合到表達(dá)載體中的一系列經(jīng)優(yōu)化的調(diào)控元件,所述表達(dá)載體用于驅(qū)動(dòng)從昆蟲細(xì)胞進(jìn)行高水平的高品質(zhì)蛋白質(zhì)的表達(dá),所述昆蟲細(xì)胞已用攜帶待表達(dá)的蛋白質(zhì)的基因序列的這些表達(dá)載體穩(wěn)定轉(zhuǎn)化。在單個(gè)表達(dá)載體中使用合成的且經(jīng)優(yōu)化的調(diào)控元件導(dǎo)致獲得這樣的能力,即以提供關(guān)于所表達(dá)的產(chǎn)物而言有利的商品成本的水平在穩(wěn)定的昆蟲表達(dá)系統(tǒng)中可靠且快速地產(chǎn)生重組蛋白質(zhì)。術(shù)語"調(diào)控元件"(或"調(diào)節(jié)控制元件"或"控制元件",或者簡(jiǎn)單地"元件")是指表達(dá)載體的這樣的區(qū)段,該區(qū)段在給定基因序列的所得蛋白質(zhì)產(chǎn)物的表達(dá)中所牽涉的轉(zhuǎn)錄和/或翻譯過程之中具有已知功能。調(diào)控元件不同于術(shù)語"調(diào)節(jié)基序,,(或簡(jiǎn)單地"基序"),術(shù)語"調(diào)節(jié)基序"是指用作結(jié)合位點(diǎn)或標(biāo)記出過渡位點(diǎn)的指定序列。一般而言,調(diào)控元件由多個(gè)調(diào)節(jié)基序組成。術(shù)語"合成的"調(diào)控元件是指未被發(fā)現(xiàn)天然存在的序列。更具體而言,本文所描述的合成的元件未在果蠅的基因組序列中發(fā)現(xiàn)。術(shù)語"經(jīng)優(yōu)化的"調(diào)控元件是指這樣的序列,其源自天然存在的序列并且已被改變以增強(qiáng)其功能。經(jīng)優(yōu)化的調(diào)控元件的特定序列不代表所述經(jīng)優(yōu)化的序列所源自的序列的天然存在的變體;因此,經(jīng)優(yōu)化的調(diào)控元件(和其中的基序)也可以被稱為是合成的。"表達(dá)盒"意指啟動(dòng)子元件與有效連接的其他轉(zhuǎn)錄和翻譯調(diào)節(jié)控制元件的組合??梢詫愒椿蛐蛄胁迦氲奖磉_(dá)盒中以用于表達(dá)所述基因序列的目的。表達(dá)盒能夠指導(dǎo)轉(zhuǎn)錄,該轉(zhuǎn)錄導(dǎo)致產(chǎn)生關(guān)于所需基因產(chǎn)物的mRNA。將表達(dá)盒插入到質(zhì)粒中以產(chǎn)生表達(dá)載體。這樣的表達(dá)載體指導(dǎo)異源蛋白質(zhì)在宿主細(xì)胞中的表達(dá)。術(shù)語"經(jīng)轉(zhuǎn)化的"是指由DNA介導(dǎo)的細(xì)胞轉(zhuǎn)化。這是指在所引入的DNA整合到細(xì)胞的基因組中后而產(chǎn)生穩(wěn)定細(xì)胞系的過程之中將質(zhì)粒DNA引入到昆蟲細(xì)胞中。這個(gè)術(shù)語用于代替常常在相同情況下使用的術(shù)語"轉(zhuǎn)染"。我們對(duì)于將質(zhì)粒DNA引入到培養(yǎng)的細(xì)胞中使用術(shù)語"轉(zhuǎn)化",以區(qū)別于最初稱為轉(zhuǎn)染的將病毒DNA引入到培養(yǎng)的細(xì)胞中。因?yàn)樵诒景l(fā)明的表達(dá)載體中不存在病毒DNA序列并且將這些表達(dá)載體引入到細(xì)胞中不導(dǎo)致產(chǎn)生病毒樣顆?;蚣?xì)胞裂解,所以術(shù)語"經(jīng)轉(zhuǎn)化的,,是優(yōu)選的。"表達(dá)"或"表達(dá)的"意指使用表達(dá)載體和宿主細(xì)胞例如果蠅S2細(xì)胞來產(chǎn)生蛋白質(zhì)以生產(chǎn)重組蛋白質(zhì)產(chǎn)物,所述重組蛋白質(zhì)產(chǎn)物可作到「^.、-'、土、ia"分泌"意指表達(dá)出的重組蛋白質(zhì)從培養(yǎng)的宿主細(xì)胞中分泌到培養(yǎng)基中。經(jīng)表達(dá)和分泌的蛋白質(zhì)是下列操作的結(jié)果將給定基因序列14200880021845.1與表達(dá)盒有效連接,從而使得所述序列編碼給定蛋白質(zhì)。術(shù)語"產(chǎn)物"指由宿主細(xì)胞表達(dá)的任何重組蛋白質(zhì)(全長(zhǎng)或其亞基),在所述宿主細(xì)胞中引入了攜帶編碼該產(chǎn)物的基因序列的表達(dá)載體。昆蟲細(xì)胞是備選的真核表達(dá)系統(tǒng),其提供表達(dá)經(jīng)正確折疊和翻譯后修飾的蛋白質(zhì)的能力,而同時(shí)提供簡(jiǎn)單且相對(duì)廉價(jià)的生長(zhǎng)條件。使用經(jīng)穩(wěn)定轉(zhuǎn)化的昆蟲細(xì)胞表達(dá)系統(tǒng)提供了超過基于宿主昆蟲細(xì)胞的桿狀病毒感染的那些表達(dá)系統(tǒng)的益處。在此基礎(chǔ)上,選擇S2細(xì)胞作為所選擇的昆蟲宿主細(xì)胞。因此,對(duì)于經(jīng)穩(wěn)定轉(zhuǎn)化的昆蟲細(xì)胞而言來優(yōu)化進(jìn)行的分析的數(shù)據(jù)。在本發(fā)明的一個(gè)優(yōu)選的實(shí)施方案中,表達(dá)載體的核心啟動(dòng)子被定義為跨越轉(zhuǎn)錄起始位點(diǎn)UNR)的序列,更具體而言INR上游和下游35至45個(gè)核苷酸的序列(總長(zhǎng)度70-90個(gè)核苷酸)。將INR基序的"A"(腺噪呤)核苷酸指定為+1。本發(fā)明的核心啟動(dòng)子包含有在自然界中未發(fā)現(xiàn)的基序組合。這些核心啟動(dòng)子由已知的調(diào)節(jié)基序組成;然而,基序的組合是獨(dú)特的,并且?guī)讉€(gè)在本發(fā)明的核心啟動(dòng)子中的基序基于共有序列并且進(jìn)一步地當(dāng)相組合從而形成核心啟動(dòng)子調(diào)控元件時(shí)就最佳功能進(jìn)行調(diào)整。在本文所描述的表達(dá)載體的核心啟動(dòng)子中重要的已知區(qū)域是TATA盒、轉(zhuǎn)錄起始位點(diǎn)(INR)、基序10元件(MTE)和下游啟動(dòng)子元件(DPE)。本發(fā)明的啟動(dòng)子(其具有包含這4種核心調(diào)節(jié)基序中的至少3種的合成的核心啟動(dòng)子)呈現(xiàn)在SEQ.ID.NO:1、NO:2和NO:3中。在本發(fā)明中,當(dāng)與合適的上游調(diào)控元件例如近側(cè)啟動(dòng)子相連接時(shí),所述合成的核心啟動(dòng)子(SEQ.ID.NO:2和NO:3)能夠驅(qū)動(dòng)高水平的表達(dá)。在本發(fā)明的另外一個(gè)優(yōu)選的實(shí)施方案中,5'UTR序列被定義為這樣的序列,該序列從INR基序的"A"(腺嘌呤)核苷酸到緊在起始甲硫氨酸密碼子之前的序列中的核苷酸。本發(fā)明的5,UTRs具有比較短的5'UTR并且在3,末端處包含果蠅共有Kozak序列。在SEQ.ID.NO:415和N0:5中呈現(xiàn)了這樣的序列,所述序列定義了mRNA的5,UTR,所述mRNA起因于由本發(fā)明的兩種合成的核心啟動(dòng)子所指導(dǎo)的轉(zhuǎn)錄。在本發(fā)明的另一個(gè)優(yōu)選的實(shí)施方案中,在驅(qū)動(dòng)核心啟動(dòng)子轉(zhuǎn)錄并且導(dǎo)致高水平表達(dá)的近側(cè)啟動(dòng)子中所包含的上游調(diào)控元件是由多個(gè)金屬應(yīng)答元件(MRE)組成的合成序列。該合成的近側(cè)啟動(dòng)子由通過11個(gè)核苷酸間隔開的2組3XMREs組成。所有MREs的方向?yàn)橄鄬?duì)于轉(zhuǎn)錄起始而言的相反方向,如圖1和2中所描繪的。這種合成的近側(cè)啟動(dòng)子的序列呈現(xiàn)在SEQ.ID.NO:6中。在本發(fā)明的另外一個(gè)優(yōu)選的實(shí)施方案中,提供了經(jīng)優(yōu)化的分泌信號(hào)肽序列。通過改變總長(zhǎng)度、N-末端堿性區(qū)域以及疏水性區(qū)域的組成,設(shè)計(jì)并合成了經(jīng)優(yōu)化的信號(hào)肽序列以用于指導(dǎo)表達(dá)出的蛋白質(zhì)分泌到經(jīng)轉(zhuǎn)化的細(xì)胞的培養(yǎng)基中。還設(shè)計(jì)了限制位點(diǎn)并且將其摻入到分泌信號(hào)序列中,所述限制位點(diǎn)允許將蛋白質(zhì)編碼序列克隆到與分泌信號(hào)相同的讀碼框,并且不會(huì)負(fù)面地影響分泌信號(hào)切割位點(diǎn)。所述合成的分泌信號(hào)的氨基酸序列以及編碼該肽的核苷酸序列呈現(xiàn)在SEQ.ID.NO:7和NO:8中。在本發(fā)明的另外一個(gè)優(yōu)選的實(shí)施方案中,由本發(fā)明的表達(dá)載體所產(chǎn)生的mRM轉(zhuǎn)錄物的3,UTR序列是優(yōu)化形式的天然果蠅3,UTR序列,所述天然果蠅3'UTR序列源自編碼高度表達(dá)且分泌的稱為殼多糖酶樣蛋白的蛋白質(zhì)的基因(Kirkpatrick等人,C(1995)153:147-154)。殼多糖酶樣蛋白是S2細(xì)胞中最豐富地表達(dá)且分泌的蛋白質(zhì)之一。為此,選擇編碼殼多糖酶樣蛋白(CLP)的基因作為用于優(yōu)化3'UTR的基礎(chǔ)。來自CLP基因的3'UTR不包含典型的多腺苷酸化信號(hào)基序AATAAA。對(duì)該3,UTR進(jìn)行的修飾和截短導(dǎo)致更高水平的表達(dá)。本發(fā)明的3'UTR的序列呈現(xiàn)在SEQ.ID.NO:9中。在本發(fā)明的一個(gè)更優(yōu)選的實(shí)施方案中,公開了將上文所描述的5種調(diào)控元件組合(包括轉(zhuǎn)錄和翻譯元件)到指導(dǎo)在S2細(xì)胞中的高水平表達(dá)的功能性表達(dá)盒中。僅在所利用的核心啟動(dòng)子序列中發(fā)生變化的兩種所裝配的表達(dá)盒的序列呈現(xiàn)在SEQ.ID.NO:IO和NO:11中。16因此,本發(fā)明提供了由合成的且經(jīng)優(yōu)化的調(diào)控元件組成的表達(dá)載體,其能夠驅(qū)動(dòng)高水平的異源蛋白質(zhì)表達(dá)。當(dāng)用于在S2細(xì)胞中表達(dá)異源蛋白質(zhì)時(shí),所述合成的表達(dá)載體使得能夠經(jīng)濟(jì)地生產(chǎn)大量的高品質(zhì)蛋白質(zhì)。所有合成的調(diào)節(jié)控制元件,或者合成的和野生型的調(diào)節(jié)控制元件的組合,或合成的和共有的調(diào)節(jié)控制元件的組合,或合成的、野生型的和共有的調(diào)節(jié)控制元件的組合可以在表達(dá)盒中使用。下面的實(shí)施例顯示了,使用所有合成的元件產(chǎn)生(或"驅(qū)動(dòng)")了最高水平的異源蛋白質(zhì)表達(dá)。當(dāng)少于所有的調(diào)節(jié)控制元件是合成的時(shí),其余的元件采取為本領(lǐng)域已知對(duì)給定類型的宿主細(xì)胞起作用的野生型元件(未經(jīng)優(yōu)化的)。盡管上文所呈現(xiàn)的描述和隨后的實(shí)施例主要針對(duì)將經(jīng)優(yōu)化的表達(dá)載體與果蠅S2細(xì)胞一起進(jìn)行使用,但所述載體和方法可以應(yīng)用于其他昆蟲細(xì)胞系,所述其他昆蟲細(xì)胞系導(dǎo)致在用質(zhì)粒DNA轉(zhuǎn)化宿主細(xì)胞后獲得穩(wěn)定的細(xì)胞系。作為舉例說明,而不是作為限制,提供了下面的實(shí)施例。實(shí)施例下面的實(shí)施例描述了用于在昆蟲細(xì)胞中使用的合成的表達(dá)載體的開發(fā)。所述實(shí)施例證明了,以在商業(yè)上適合于產(chǎn)品開發(fā)的水平在果蠅S2細(xì)胞中有效地表達(dá)異源蛋白質(zhì)的能力。所述實(shí)施例表明了獨(dú)個(gè)調(diào)控元件增強(qiáng)在S2細(xì)胞中表達(dá)蛋白質(zhì)的能力的能力,以及為了確定何種變化促成了這些元件的增強(qiáng)的功能而作出的努力。下面所呈現(xiàn)的結(jié)果證明,不同的元件和這些元件的修飾可以導(dǎo)致高水平的表達(dá)或者很少或無法檢測(cè)的表達(dá)。因此,功能性且有效的調(diào)控元件的選擇必須通過實(shí)驗(yàn)來確定。因此,本文所描述的本發(fā)明是獨(dú)特的,因?yàn)樗枋龅谋磉_(dá)盒在組成上來說主要是合成的并且指導(dǎo)高水平的蛋白質(zhì)表達(dá)。實(shí)施例1將非果蠅啟動(dòng)子用于在果蠅S2細(xì)胞中驅(qū)動(dòng)異源蛋白質(zhì)的表達(dá)在為了鑒定能夠在S2細(xì)胞中驅(qū)動(dòng)高水平的高品質(zhì)產(chǎn)物的備選表達(dá)載體的努力中,評(píng)估了包含源自其他昆蟲的啟動(dòng)子的表達(dá)載體。對(duì)于這個(gè)工作,利用了用于培養(yǎng)和轉(zhuǎn)化S2細(xì)胞的標(biāo)準(zhǔn)方法(VanderStraten,#e^o&a力cT"/o人(1989)1:1-8;Culp等人,"/"e由o7og/(1991)9:173-177;Kirkpatrick和Shatzman,Ce/eimpress/'0/2te歷s.'^s//2gfy_re尸ort力e力rfoT^rpre^s/o",編輯Fernandez和Hoeffler,AcademicPress,(1999)289-330)。利用了從ATCC獲得的果蠅S2細(xì)胞(Schneider,/.^6iTo/.JA77.#077力.(1972)27:353-365)。S2細(xì)胞已適應(yīng)于在Excel1420培養(yǎng)基(SAFC,StLouis,M0)中生長(zhǎng),并且本文所描述的所有操作程序和培養(yǎng)都在Excell420培養(yǎng)基中進(jìn)行。培養(yǎng)物通常以1><106個(gè)細(xì)胞/ml的密度進(jìn)行接種,并且在第5和7天之間進(jìn)行傳代。所有培養(yǎng)物均于26-27。C進(jìn)行溫育。借助于磷酸鈣法,將其中插入了目的基因的表達(dá)質(zhì)粒轉(zhuǎn)化到S2細(xì)胞中。以20jig表達(dá)質(zhì)粒對(duì)1jigpCoHygro的比率,用pCoHygro質(zhì)粒共轉(zhuǎn)化S2細(xì)胞,以便用潮霉素B進(jìn)行選擇。在轉(zhuǎn)化后,選擇出對(duì)于0.3mg/ml潮霉素具有抗性的細(xì)胞。一旦選擇出穩(wěn)定的細(xì)胞系,就對(duì)它們就合適產(chǎn)物的表達(dá)進(jìn)行評(píng)估。為了評(píng)估表達(dá),以2x1(^個(gè)細(xì)胞/ml接種5ml所選細(xì)胞系的培養(yǎng)物,并且在O.2mM硫酸銅存在下于26。C培養(yǎng)7天。在與細(xì)胞相聯(lián)合的級(jí)分和培養(yǎng)基中,就重組蛋白質(zhì)的表達(dá)來對(duì)培養(yǎng)物進(jìn)行評(píng)估。通過SDS-PAGE來分開蛋白質(zhì),并且用考馬斯藍(lán)染色或者印跡至硝酸纖維素。將對(duì)于所表達(dá)的蛋白質(zhì)特異的抗體用于探測(cè)Western印跡。通過SDS-PAGE凝膠的考馬斯染色,在S2培養(yǎng)物中容易地檢測(cè)到1fig/ml(1mg/L)或更大的表達(dá)水平。所測(cè)試的第一種昆蟲啟動(dòng)子是家蠶(蠶蛾)細(xì)胞質(zhì)肌動(dòng)蛋白A3啟動(dòng)子。這種啟動(dòng)子已在被設(shè)計(jì)用于經(jīng)穩(wěn)定轉(zhuǎn)化的家蠶細(xì)胞的高水平表達(dá)的表達(dá)載體中使用。除了肌動(dòng)蛋白A3啟動(dòng)子外,表達(dá)載體pIEl/153A還包含家蠶核型多角體病毒(BmPNV)立即早期(ie-l)轉(zhuǎn)錄因子和BmNPV的同源重復(fù)序列3(HR3)區(qū)域(Farre11等人W"ec力.A'oe/^.(1998)60:656-663)。在轉(zhuǎn)化鱗翅目昆蟲細(xì)胞后,這種表達(dá)載體顯示出驅(qū)動(dòng)重組蛋白質(zhì)的高水平表達(dá)。將編碼亞單位蛋白質(zhì)例如流感血凝素(HA)胞外域(H3HA-Ecto)和癡疾裂殖子表面蛋白1p42C-末端片段(MSPl-p42)的各種基因克隆到pIE/153A載體中,并且隨后將所得到的重組質(zhì)粒用于轉(zhuǎn)化S2細(xì)胞。H3HA-Ecto序列源自H3N2流感毒林A/Fujian/411/02全長(zhǎng)HA基因序列(HAO),其編碼具有566個(gè)氨基酸殘基的蛋白質(zhì)。特別地,所利用的序列源自在登錄號(hào)ISDN38157(ISD,www.flu.lanl.gov)中的核苷酸序列。HAO蛋白質(zhì)序列包含有在N-末端的16氨基酸分泌信號(hào)序列以及C-末端的膜錨著點(diǎn)。為了表達(dá)可溶性H3HA-Ecto,表達(dá)了N-和C-截短的分子,其被包含在全長(zhǎng)蛋白質(zhì)的Glnn至Gly526(HA2的殘基175,類似于X31晶體結(jié)構(gòu)的C-末端,Wilson等人,#a"re(1981)289:366-373)的序列中。H3HA-Ecto的核苷酸和氨基酸序列以及表達(dá)詳細(xì)公開在W02007/022425中。瘧疾MSPl-p42序列源自惡性瘧原蟲(戶7as/BO(^.w/z7/^/c/parw/z)的FUP才朱(Genbank登^己號(hào)M37213)。通過PCR擴(kuò)增而獲得的MSP-1p42編碼序列編碼MSP-1蛋白的氨基酸Ala^3至Ser。5。MSPl-p42的核苷酸和氨基酸序列以及表達(dá)詳細(xì)公開在WO2006/026625中。當(dāng)由PIE/153A載體來驅(qū)動(dòng)表達(dá)時(shí),流感和癡疾亞單位蛋白質(zhì)的表達(dá)水平在S2細(xì)胞中小于1jig/ml。根據(jù)這些結(jié)果,當(dāng)用于轉(zhuǎn)化S2細(xì)胞時(shí),pIE/153A載體不指導(dǎo)重組亞單位蛋白質(zhì)的高水平表達(dá)。所測(cè)試的第二種昆蟲啟動(dòng)子是岡比亞按蚊(^0/7/e/es^2/z6/ae)(蚊子)金屬硫蛋白1啟動(dòng)子。為了就其在S2細(xì)胞中驅(qū)動(dòng)高水平表達(dá)的能力來測(cè)試這種啟動(dòng)子,從果蠅表達(dá)載體pMTtPA中除去黑腹果蠅金屬硫蛋白啟動(dòng)子區(qū)(MtnA),并且用按蚊(^70/7力e/es)啟動(dòng)子替代。pMTtPA表達(dá)載體以及關(guān)于將其用于在培養(yǎng)的果蠅細(xì)胞中表達(dá)重組蛋白質(zhì)的方法描述在下列美國(guó)專利中5,550,043;5,681,713;5,705,359;6,046,025。在美國(guó)專利5,681,713中描述的質(zhì)粒pCoHygro用于在共轉(zhuǎn)化S2細(xì)胞后進(jìn)行潮霉素選擇。pMTtPA表達(dá)載體包含下述元件果蠅金屬硫蛋白啟動(dòng)子(MtnA)、人組織纖溶酶原激活物(tPA)前原(pre-pro)信號(hào)序列、和SV40早期多腺苷酸化信號(hào)(Culp等人,Biotechnol.(1991)9:173-177)。pCoHygro質(zhì)粒提供了關(guān)于潮霉素的選捧才示i己(vanderStraten等人,//#o/.j/7f/Ce//A/o/.(1989)1:1-8)。潮霉素基因處于果蠅COPIA轉(zhuǎn)座元件長(zhǎng)末端重復(fù)序列的轉(zhuǎn)錄控制之下。通過缺失長(zhǎng)度為15個(gè)堿基對(duì)的^威I片段來對(duì)pMTtPA載體進(jìn)行修飾,所述A/nHI片段包含外來的位點(diǎn)。這種被稱為pMTtAXho的經(jīng)修飾的載體允許利用獨(dú)特的BglII和J力o/位點(diǎn)來定向地克隆插入片段。通過緊在tPA前原信號(hào)序列的起始曱硫氨酸密碼子之前添加"'//dill限制位點(diǎn)和添加果蠅"共有Kozak序列"(Cavener,Y"c.Jc油b.(1987)15:1353-1361)來進(jìn)一步修飾載體。特別地,將緊在ATG之前的在pMTtPA中的長(zhǎng)度為12個(gè)核苷酸的序列TGTGAAGCAATC變成AAGCTTAACAAC(前6個(gè)核苷酸代表了^7/2din限制位點(diǎn),和后6個(gè)核苷酸代表了果蠅共有Kozak序列)。該經(jīng)進(jìn)一步修飾的載體稱為pMT-KtAXho。"'"dill限制位點(diǎn)允許克隆緊在tPA前原信號(hào)序列的翻譯起始密碼子之前的啟動(dòng)子序列。按蚊金屬疏蛋白啟動(dòng)子片段源自在按蚊基因組數(shù)據(jù)庫(kù)(www.ensembl.org/Anopheles—gambiae/)中的序列。特別地,長(zhǎng)度為1833個(gè)核苷酸的啟動(dòng)子片段代表了在岡比亞按蚊金屬硫蛋白l基因(UniProtKB/TrEMBL登錄名Q52P92-ANOGA)的翻譯起始密碼子上游的序列。該基因可以在染色體2R上在位置11,911,992-11,912,384處發(fā)現(xiàn),并且是果蠅MtnA基因的同源物。采用化學(xué)方法來合成(DNA2.0,MenloPark,CA)該核苷酸序列,其中在5,末端處添加//7/2l限制位點(diǎn)和在3,末端處添加i^/Kiin限制位點(diǎn)。用&力1和iW/3din消化pMT-KtAXho載體,以去除果蠅啟動(dòng)子并且用按蚊啟動(dòng)子替代。所得到的質(zhì)粒稱為pAgMT-KtAXho。然后,將H3HA-Ecto序列克隆到pAgMT-KtAXho載體中。將編碼H3HA-Ecto亞單位蛋白質(zhì)的pAgMT-KtAXho表達(dá)質(zhì)粒用于轉(zhuǎn)化S2細(xì)胞。在選擇出穩(wěn)定的細(xì)胞系后,就當(dāng)在硫酸銅存在下進(jìn)行培養(yǎng)時(shí)分泌形式的H3HA-Ecto蛋白質(zhì)的表達(dá)來對(duì)細(xì)胞進(jìn)行篩選。由按蚊金屬硫蛋白啟動(dòng)子驅(qū)動(dòng)的H3HA-Ecto亞單位的表達(dá)導(dǎo)致具有預(yù)期分子量的均勻的產(chǎn)物。盡管由按蚊啟動(dòng)子驅(qū)動(dòng)的H3HA-Ecto的表達(dá)大于由蠶(Ao/^/jr)啟動(dòng)子驅(qū)動(dòng)的表達(dá),但表達(dá)水平仍被認(rèn)為是低的,大約1ng/ml。這個(gè)水平比當(dāng)利用果蠅MtnA啟動(dòng)子時(shí)H3HA-Ecto表達(dá)的水平(大約30fig/ml)低得多。實(shí)施例2設(shè)計(jì)用于果蠅S2細(xì)胞的合成的核心啟動(dòng)子核心啟動(dòng)子被定義為能夠指導(dǎo)給定基因的轉(zhuǎn)錄起始的最小核苷酸序列。真核生物中的核心啟動(dòng)子負(fù)責(zé)指導(dǎo)通過RNA聚合酶II復(fù)合物的起始。一般將核心啟動(dòng)子描繪為跨越轉(zhuǎn)錄起始位點(diǎn)(INR)的序列,更具體而言INR上游和下游35至45個(gè)核苷酸的序列(總長(zhǎng)度70-90個(gè)核苷酸)。5,UTR編碼序列在INR處開始并且延伸直至翻譯起始ATG密碼子。5,UTR編碼序列在長(zhǎng)度方面是可變的,從相對(duì)較短的50個(gè)核苷酸到相當(dāng)長(zhǎng)的幾百個(gè)核苷酸。如先前所描述的,核心啟動(dòng)子一般包含一種或多種下列序列基序TFIIB識(shí)別元件(BRE)、TATA盒、起始子(INR)、基序10元件(MTE)、下游啟動(dòng)子元件(DPE)和下游核心元件(DCE)。在來自幾種生物體(包括果蠅)的核心啟動(dòng)子的綜覽中,清楚的是,不存在通用核心元件;然而,INR基序是最常見的(FitzGerald等人,f7e層e飾7.(2006)7:R53)。在為了制備能夠指導(dǎo)轉(zhuǎn)錄(所述轉(zhuǎn)錄導(dǎo)致高水平的重組蛋白質(zhì)表達(dá))的強(qiáng)核心啟動(dòng)子的努力中,設(shè)計(jì)了用于果蠅的合成的核心啟動(dòng)子,其摻入有所有這些元件。利用了關(guān)于構(gòu)成核心啟動(dòng)子的各種果蠅調(diào)節(jié)基序的共有序列。這些共有調(diào)節(jié)基序由0hler等人,Ce層"/o/o^r(2002)3:1-12;Kutach和Kadonaga,#。厶Ce/人5/o人(2000)20:4754-4764;Smale和Kadonaga,h/2.Woc力e瓜(2003)72:449-479;Lim等人,Ce/zes"e7.(2004)18:1606-1617;FUzGerald等人,Ce/20/e"/o/.(2006)7:R53;Gershenzon等人,廚Ce層i"(2006)7:161進(jìn)行了描述。為了構(gòu)建果蠅合成啟動(dòng)子,設(shè)計(jì)了包含下述果蠅共有調(diào)節(jié)基序的核心啟動(dòng)子包含GGGCGCC的BRE,包含TATAAA的TATA,包含TCAGTC的INR,包含CGAACGGAAC的MTE,和包含GGTTCG的DPE。將合成的核心啟動(dòng)子融合至按蚊金屬硫蛋白15,UTR的部分。按蚊金屬硫蛋白15,UTR與核心啟動(dòng)子的融合導(dǎo)致INR相對(duì)于翻譯起始ATG的位置類似于果蠅MtnA啟動(dòng)子的那種。釆用化學(xué)方法來合成這種合成啟動(dòng)子,并且將其稱為合成的核心啟動(dòng)子l(SCP1)。SCP1啟動(dòng)子的序列作為SEQ.ID.NO:1列出。化學(xué)合成的SCP1在其5'末端處包括J6al位點(diǎn)并且在其3,末端處包括iW/2dIII位點(diǎn)以用于克隆到現(xiàn)有的表達(dá)載體中。通過在MtnA啟動(dòng)子的TATA盒序列上游7個(gè)核苷酸處插入限制位點(diǎn)來進(jìn)一步修飾實(shí)施例1中所描述的pMT-KtAXho表達(dá)載體。這種質(zhì)粒-故稱為pMT-X-KtAXho。這允許通過用J&I和"/"dill限制酶進(jìn)4亍消化并且插入備選的核心啟動(dòng)子和5'UTR序列,來去除MtnA核心啟動(dòng)子(包括5,UTR)。以這種方式,將SCP1插入到pMT-X-KtAXho表達(dá)載體中。實(shí)施例3設(shè)計(jì)包含能夠在果蠅S2細(xì)胞中驅(qū)動(dòng)異源蛋白質(zhì)表達(dá)的轉(zhuǎn)錄激活子元件的近側(cè)啟動(dòng)子在為了上調(diào)核心啟動(dòng)子中的轉(zhuǎn)錄水平(而這又導(dǎo)致在S2細(xì)胞中高水平的表達(dá))的努力中,將合成的近側(cè)啟動(dòng)子設(shè)計(jì)為包含各種轉(zhuǎn)錄激活子元件。選擇開發(fā)合成的近側(cè)啟動(dòng)子而不是利用天然存在的近側(cè)啟動(dòng)子以在S2細(xì)胞中使用基于在使用兩種昆蟲啟動(dòng)子的實(shí)施例1中的結(jié)果,以及還基于Olsen等人(0^Wec力/7o7o^T(1992)10:157-167)的工作,其中證明哺乳動(dòng)物和病毒起源的啟動(dòng)子在S2細(xì)胞中并不良好地工作。因此,合成的近側(cè)啟動(dòng)子被設(shè)計(jì)為包含源自果蠅啟動(dòng)子的調(diào)節(jié)基序。近側(cè)啟動(dòng)子設(shè)計(jì)牽涉裝配獨(dú)個(gè)調(diào)節(jié)基序共有序列的重復(fù)或者不同共有調(diào)節(jié)基序的組合。就其當(dāng)與核心啟動(dòng)子相連接時(shí)指導(dǎo)高水平轉(zhuǎn)錄的能力來對(duì)合成的近側(cè)啟動(dòng)子進(jìn)行評(píng)估。所評(píng)估的第一種類型的轉(zhuǎn)錄調(diào)控元件是果蠅DM復(fù)制相關(guān)元件(DRE)。編碼DNA復(fù)制相關(guān)蛋白質(zhì)的果蠅基因的啟動(dòng)子包含共有DRE序列5,-TATCGATA。特異的DRE結(jié)合因子、DNA復(fù)制相關(guān)元件因子或DREF結(jié)合至DRE,并且正向調(diào)節(jié)在DRE控制下的基因且導(dǎo)致高水平的表達(dá)。果蠅啟動(dòng)子的計(jì)算機(jī)研究(Ohler等人,^/o歷e"/o/og/(2002)3:1-12)已顯示,DRE元件在許多果蠅啟動(dòng)子中被發(fā)現(xiàn)。事實(shí)上,它是最常見的轉(zhuǎn)錄元件之一。在Hirose等人(/our/a/o尸"/'Wog/ca/CAe/z//"r/(1993)268:2092-2099)的工作中,裝配了多個(gè)拷貝的DRE,并且將其連接至控制螢光素酶報(bào)道基因的果蠅MtnA核心啟動(dòng)子。所述DREs上調(diào)螢光素酶表達(dá),其中表達(dá)水平隨著加入的DREs的數(shù)目而增加。在包含近側(cè)啟動(dòng)子的合成的DRE的設(shè)計(jì)中,使用序列CTGCCTGCW"GATTCAGG(DRE共有序列為斜體并加有下劃線)。合成的DRE近側(cè)啟動(dòng)子設(shè)計(jì)如下1XDRE、2XDRE和4XDRE。通過去除MtnA近側(cè)啟動(dòng)子(J/wI-J6al)并且緊在MtnA核心啟動(dòng)子上游插入備選的近側(cè)啟動(dòng)子,將包含DRE的近側(cè)啟動(dòng)子克隆到實(shí)施例2中所描述的pMT-X-KtAXho載體中。DRE重復(fù)都以相同的正向方向(5,至3,)。將這些載體稱為pDRE-X-KtAXho。為了評(píng)估使用這些DRE表達(dá)質(zhì)粒的重組蛋白質(zhì)的表達(dá),將實(shí)施例1中所描述的H3HA-Ecto基因序列插入到這些載體中并用于評(píng)估表達(dá)水平。將編碼H3HA-Ecto亞單位蛋白質(zhì)的pDRE-X-KtAXho表達(dá)質(zhì)粒用于轉(zhuǎn)化S2細(xì)胞。在選擇出穩(wěn)定的細(xì)胞系后,就分泌形式的H3HA-Ecto蛋白的表達(dá)來對(duì)它們進(jìn)行篩選。所有DRE近側(cè)啟動(dòng)子構(gòu)建體無法導(dǎo)致<壬{可可測(cè)量的H3HA-Ecto表達(dá)。所評(píng)估的第二種類型的轉(zhuǎn)錄調(diào)控元件是果蠅GAGA元件。果蠅GAGA轉(zhuǎn)錄調(diào)控因子因其結(jié)合交替的(GAr或(CTT序列(GAGA元件)的能力而得名。這種轉(zhuǎn)錄因子被認(rèn)為通過重塑在受影響的基因周圍的染色質(zhì)結(jié)構(gòu)來增加基因表達(dá)(Granok等人,C〃rreWWo/og/(1995)5:238-241)。GAGA元件在多種果蠅基因的啟動(dòng)子中被發(fā)現(xiàn)。它在這些基因的遠(yuǎn)側(cè)、近側(cè)和甚至核心啟動(dòng)子中被發(fā)現(xiàn)(Soeller等人,#0厶6W入5A/o^f(1993)13:7961-7970)。在Soeller等人(1993)的工作中,證明了多個(gè)GAGA元件可以驅(qū)動(dòng)核心啟動(dòng)子的轉(zhuǎn)錄。設(shè)計(jì)了兩種近側(cè)啟動(dòng)子,其中將單個(gè)GAGA元件與DRE元件相組合。這兩種設(shè)計(jì)如下GAGA-2XDRE和2XDRE-GAGA-2XDRE。與使用DRE近側(cè)啟動(dòng)子一樣,將這些近側(cè)啟動(dòng)子插入在表達(dá)載體pMT-X-KtAXho中的MtnA核心啟動(dòng)子的上游。為了評(píng)估使用這些DRE-GAGA表達(dá)質(zhì)粒的重組蛋白質(zhì)的表達(dá),將實(shí)施例1中所描述的H3HA-Ecto基因序列用作報(bào)道分子。將編碼H3HA-Ecto亞單位蛋白質(zhì)的具有DRE-GAGA組合啟動(dòng)子的表達(dá)載體用于轉(zhuǎn)化S2細(xì)胞。在選擇出穩(wěn)定的細(xì)胞系后,就分泌形式的H3HA-Ecto蛋白的表達(dá)來對(duì)細(xì)胞進(jìn)行篩選。這兩種構(gòu)建體也無法導(dǎo)致任何可測(cè)量的蛋白質(zhì)表達(dá)。所評(píng)估的笫三種類型的轉(zhuǎn)錄調(diào)控元件是果蠅金屬應(yīng)答元件(MRE)。特異的MRE結(jié)合因子、金屬應(yīng)答轉(zhuǎn)錄因子或MTF-1結(jié)合至MRE,并且正向調(diào)節(jié)在MRE控制下的基因且導(dǎo)致高水平的表達(dá)。由MTF-1調(diào)節(jié)的果蠅基因的啟動(dòng)子包含共有MRE序列5,-TGCACAC。已證明,4個(gè)拷貝的MREs可以驅(qū)動(dòng)最小啟動(dòng)子的轉(zhuǎn)錄(Zhang等人,6W人Wo人(2001)21:4505-4514)。在pMTtPAAXho表達(dá)載體中MtnA近側(cè)啟動(dòng)子的缺失分析表明,具有序列5,-TCTTT^i^GCCGGC(共有序列為斜體并加有下劃線)的MRE的缺失對(duì)于MtnA啟動(dòng)子的強(qiáng)度具有最大影響。因此,設(shè)計(jì)了包含一個(gè)或多個(gè)拷貝的mre序列Tcrnrg(:淵(XCCGGc的合成的近側(cè)啟動(dòng)子。合成的MRE近側(cè)啟動(dòng)子設(shè)計(jì)如下2X、3X、4X、5X、6X、8XMREs。這些近側(cè)啟動(dòng)子設(shè)計(jì)中的MREs都以5,至3,(正向)頭尾相接的方式排列。與使用DRE近側(cè)啟動(dòng)子一樣,將MRE近側(cè)啟動(dòng)子插入在表達(dá)載24體pMT-X-KtAXho中的MtnA核心啟動(dòng)子的上游。為了評(píng)估使用這些合成的MRE啟動(dòng)子表達(dá)載體的重組蛋白質(zhì)的表達(dá),將實(shí)施例1中所描述的H3HA-Ecto基因序列插入到載體中。將編碼H3HA-Ecto亞單位蛋白質(zhì)的具有MRE近側(cè)啟動(dòng)子的表達(dá)質(zhì)粒用于轉(zhuǎn)化S2細(xì)胞。在選擇出穩(wěn)定的細(xì)胞系后,就分泌形式的H3HA-EctQ蛋白的表達(dá)來對(duì)細(xì)胞進(jìn)行篩選。因?yàn)檫@些構(gòu)建體包含MREs,所以表達(dá)的評(píng)估要求,用0.2mMCuS04來對(duì)培養(yǎng)物進(jìn)行誘導(dǎo),并且于26。C培養(yǎng)7天。這些S2轉(zhuǎn)化體的分析揭示,隨著MRE單元的數(shù)目增加,基因表達(dá)的水平也增加,直至在使用6XMRE時(shí)達(dá)到最大值。在使用8X時(shí),表達(dá)水平減少。因此,利用合成的MRE近側(cè)啟動(dòng)子的表達(dá)的進(jìn)一步分析基于6XMRE設(shè)計(jì)。使用6XMRE合成的近側(cè)啟動(dòng)子,制備了一系列表達(dá)構(gòu)建體,其允許將天然的MtnA近側(cè)啟動(dòng)子與合成的6XMRE近側(cè)啟動(dòng)子進(jìn)行比較。在該一系列的表達(dá)構(gòu)建體中,使這兩種近側(cè)啟動(dòng)子連接至三種不同的最小或核心啟動(dòng)子1)果蠅MtnA,2)按蚊MtnA,和3)實(shí)施例2中所描述的SCP1。然后,將所得到的6種構(gòu)建體與H3HA-Ecto報(bào)道基因相連接。當(dāng)比較給定獨(dú)個(gè)核心啟動(dòng)子中的每一種時(shí),6XMRE和DmMtnA近側(cè)啟動(dòng)子都能夠驅(qū)動(dòng)flu基因的表達(dá)水平至相等的水平。例如,6XMRE近側(cè)-MtnA核心和DmMtnA近側(cè)-MtnA核心導(dǎo)致H3HA-Ecto蛋白的相等水平的表達(dá)。使用6XMRE近側(cè)啟動(dòng)子的這個(gè)數(shù)據(jù)表明,可以設(shè)計(jì)出功能性的合成的近側(cè)啟動(dòng)子,盡管使用在這個(gè)實(shí)施例中所測(cè)試的前兩種轉(zhuǎn)錄激活子時(shí)遭到失敗。6XMRE與DraMtnA近側(cè)啟動(dòng)子的比較還揭示,在包含MtnA核心啟動(dòng)子的構(gòu)建體中H3HA-Ecto的表達(dá)水平為包含SCP1的那些構(gòu)建體的大約4倍。因此,作出了努力,以評(píng)估備選的核心啟動(dòng)子(如實(shí)施例4中所描述的)以及進(jìn)一步優(yōu)化合成的核心啟動(dòng)子(如實(shí)施例5中所描述的)。實(shí)施例4對(duì)"超級(jí)核心啟動(dòng)子"在果蠅S2細(xì)胞中驅(qū)動(dòng)異源蛋白質(zhì)表達(dá)進(jìn)行評(píng)估Juven-Gershon等人("re#e(2006)3:917-922)描述了稱為"超級(jí)核心啟動(dòng)子"的核心啟動(dòng)子的設(shè)計(jì)和分析,該核心啟動(dòng)子在后生動(dòng)物宿主細(xì)胞中指導(dǎo)高水平的通過RNA聚合酶II的RNA轉(zhuǎn)錄。相同的"超級(jí)核心啟動(dòng)子"的使用也公開于PCT申請(qǐng)PCT/US2006/020394(Kadonaga和Gershon,優(yōu)先權(quán)日為2005年5月25日)中。這些出版物中所描述的"超級(jí)核心啟動(dòng)子"將被稱為"Kadonaga核心啟動(dòng)子"或"KCP"。Kadonaga核心啟動(dòng)子由最小啟動(dòng)子組成,所述最小啟動(dòng)子包含INR和MTE元件,并且任選地包含TATA和/或DPE元件,它們?cè)醋詭追N不同的果蠅和病毒基因。在KCP核心啟動(dòng)子和本說明書中所描述的核心啟動(dòng)子之間在設(shè)計(jì)方面存在有相似性,因?yàn)閮烧叨紘?yán)重依賴于首先描述了果蠅MTE調(diào)節(jié)基序的"GenesandDevelopment"的文章(Lim等人,Ce編紋(2004)18:1606-1617)。Kadonaga核心啟動(dòng)子被描述為可用于在后生動(dòng)物宿主細(xì)胞中的異源蛋白質(zhì)表達(dá),所述后生動(dòng)物宿主細(xì)胞包括果蠅S2細(xì)胞。因此,我們?cè)贖awaiiBiotech,Inc.制備了包含Kadonaga核心啟動(dòng)子的3種構(gòu)建體,以測(cè)試Kadonaga核心啟動(dòng)子在經(jīng)穩(wěn)定轉(zhuǎn)化的S2細(xì)胞中表達(dá)異源蛋白質(zhì)的情況下的功能性。合成Kadonaga核心啟動(dòng)子,其中具有合適的側(cè)翼限制位點(diǎn)。將KCP合成序列插入到實(shí)施例9中所描述并且由SEQ.ID.NO:10所定義的HBI-IO表達(dá)載體中,從該表達(dá)栽體中去除了近側(cè)和核心啟動(dòng)子序列。所得到的KCP/HBI-10雜合表達(dá)載體包含與1R5L(SEQ.ID.NO:7)分泌信號(hào)、H3HA-Ecto報(bào)道基因和0p-CLP-3,UTR(SEQ.ID.NO:9)連接的KCP。KCP/HBI-10載體不包含近側(cè)啟動(dòng)子。因此,從這種"基礎(chǔ)KCP/HBI-10雜合載體"制備了兩種額外的構(gòu)建體,除了KCP外,在第一種額外的構(gòu)建體中還包含6xMRE近側(cè)啟動(dòng)子("6xMRE/KCP/HBI-10"),以及在第二種額外的構(gòu)建體中,還包含26巨細(xì)胞病毒(CMV)增強(qiáng)子("CMV/KCP/HBI-10");每種近側(cè)啟動(dòng)子插入在緊在KCP序列上游處。所述CMV增強(qiáng)子與在Juven-Gershon等人(A"wreVeMo^y(2006)3:917-922,對(duì)于其來說Dr.Kadonaga是相應(yīng)的作者)中所使用的相同。將這三種構(gòu)建體一式三份地轉(zhuǎn)化到果蠅S2細(xì)胞中,并且測(cè)定H3HA-Ecto的表達(dá)水平。單獨(dú)的(無近側(cè)啟動(dòng)子或增強(qiáng)子)兩種構(gòu)建體CMV/KCP/HBI-10和KCP/HBI-10顯示出最低水平的H3-HA-Ecto表達(dá),即<1ng/ml。因此,這個(gè)數(shù)據(jù)表明,l)單獨(dú)的KCP提供了低水平的分泌型蛋白質(zhì)表達(dá),和2)這個(gè)表達(dá)水平在經(jīng)轉(zhuǎn)化的果蠅S2細(xì)胞中并沒有通過CMV增強(qiáng)子而得到增強(qiáng)或增加。6xMRE/KCP/HBI-10構(gòu)建體導(dǎo)致以在粗制上清液中2-3ug/ml的水平表達(dá)和分泌出H3-HA-Ecto蛋白。使用6xMRE-SCPl的類似構(gòu)建體的先前實(shí)驗(yàn)導(dǎo)致以10ug/ml或者以連接至相同6XMRE近側(cè)啟動(dòng)子的KCP的約略2-3倍的水平表達(dá)出相同的H3-HA蛋白。因?yàn)檫@兩種構(gòu)建體之間的差異僅是核心啟動(dòng)子,所以可以得出結(jié)論,實(shí)施例2和3中所描述的SCP1提供了這樣的分泌型異源蛋白質(zhì)的表達(dá)水平,所述表達(dá)水平為在經(jīng)轉(zhuǎn)化的果蠅S2細(xì)胞中由于使用Kadonaga核心啟動(dòng)子和6xMRE近側(cè)啟動(dòng)子而產(chǎn)生的表達(dá)的大約2-3倍。在Lim等人(Ce扁齡.(2004)18:1606-1617)或Juven-Gershon等人(射訓(xùn)(2006)3:917-922)參考文獻(xiàn)中未公開MRE或基于MRE的近側(cè)啟動(dòng)子的使用。就在哺乳動(dòng)物細(xì)胞中的使用,對(duì)Kadonaga核心啟動(dòng)子進(jìn)行優(yōu)化。關(guān)于在HeLaS3細(xì)胞中使用KCP所呈現(xiàn)的數(shù)據(jù)局限于瞬時(shí)轉(zhuǎn)染和使用靈敏的熒光測(cè)定法;因此,基于在穩(wěn)定轉(zhuǎn)化果蠅細(xì)胞后用KCP核心啟動(dòng)子獲得的結(jié)果,瞬時(shí)轉(zhuǎn)染和靈敏的報(bào)道分子測(cè)定法的使用并不表示在所有細(xì)胞類型中以高水平表達(dá)和分泌異源蛋白質(zhì)的能力。KCP的設(shè)計(jì)包括病毒啟動(dòng)子例如CMV和AdML的元件,它們已傳統(tǒng)地用于在哺乳動(dòng)物細(xì)胞中表達(dá)蛋白質(zhì)。然而,相對(duì)于KCP而言通過使用SCP1使在果蠅細(xì)胞中分泌型異源蛋白質(zhì)的穩(wěn)定表達(dá)增加至2-3倍是值得注意的且出乎意料的。實(shí)施例5就在果蠅S2細(xì)胞中表達(dá)異源蛋白質(zhì)來對(duì)合成的核心啟動(dòng)子進(jìn)行優(yōu)化實(shí)施例2中所描述的原始SCP1設(shè)計(jì)包含具有BRE、TATA盒、INR、MTE和DPE的核心啟動(dòng)子。獨(dú)個(gè)地去除這些基序中的每一種,并且評(píng)估它們的去除對(duì)于表達(dá)的影響。在每種情況下,表達(dá)水平看起來略微降低。嘗試著通過獨(dú)個(gè)地將BRE、TATA、INR、MTE和DPE基序交換成備選的序列來進(jìn)一步優(yōu)化SCP,所述備選的序列包含代表了給定調(diào)節(jié)基序的備選序列或者具有在核心啟動(dòng)子中的等價(jià)位置處缺乏調(diào)節(jié)基序的序列。例如,野生型果蠅MtnA核心啟動(dòng)子缺乏BRE、MTE或DPE基序,然而,基于實(shí)施例3中所呈現(xiàn)的數(shù)據(jù),果蠅MtnA核心啟動(dòng)子是迄今所測(cè)試的最強(qiáng)的野生型核心啟動(dòng)子。去除SCP1中的BRE序列并且用"中性"序列來替代之沒有導(dǎo)致報(bào)道基因產(chǎn)物的表達(dá)水平發(fā)生變化,這表明BRE的存在是中性的,即它對(duì)于轉(zhuǎn)錄無明顯的影響。在TATA盒的情況下,將SCP1TATA和INR之間的間隔減少3個(gè)核苷酸,以匹配果蠅MtnATATA盒與其相應(yīng)的INR之間的間隔。所去除的那3個(gè)核苷酸(ACA)是緊接TATA盒的3,的那些。這個(gè)變化導(dǎo)致報(bào)道基因表達(dá)水平的略微降低,這表明SCP1中的間隔相對(duì)于MtnA中的間隔而言是優(yōu)選的。將SCP1的INR(TCAGTC)變成GCATCA,6個(gè)核苷酸中的3個(gè)發(fā)生變化。這個(gè)變化使報(bào)道基因產(chǎn)物的表達(dá)增加大約50%。SCP1包含長(zhǎng)度為190個(gè)核苷酸的5,UTR編碼序列。SCP1的這個(gè)部分源自按蚊Mtn基因。這個(gè)序列對(duì)于轉(zhuǎn)錄/表達(dá)是有益還是有害是未知的。為了確定這個(gè)序列的貢獻(xiàn),產(chǎn)生了兩種在這個(gè)序列內(nèi)的缺失構(gòu)建體。第一種去除了該序列的從3'末端開始的60個(gè)核苷酸。這個(gè)變化導(dǎo)致表達(dá)水平的略微增加。第二種去除了該序列的從3,末端開始的127個(gè)核苷酸。這個(gè)變化導(dǎo)致表達(dá)水平增加至大約2倍。這個(gè)截短形式的SCP1被稱為SCPlAlll,并且用于進(jìn)一步評(píng)估對(duì)于核心啟動(dòng)子的修飾。由Lim等人(Cs紐(2004)18:1606-1617)描述了TolloMTE對(duì)于轉(zhuǎn)錄水平的影響。因此,將在SCP1A111中使用的共有MTE變成在果蠅Tollo啟動(dòng)子中發(fā)現(xiàn)的那種。用TolloMTE序列替代共有MTE導(dǎo)致表達(dá)水平增加至大約2-3倍。將TolloMTE插入到SCP1核心中對(duì)于表達(dá)水平明顯具有非常正面的影響。該插入有TolloMTE的核心啟動(dòng)子被稱為"SCPl-TolloMTEAlll",并且包含這個(gè)核心啟動(dòng)子的啟動(dòng)子序列作為SEQ.ID.NO:2列出。測(cè)試了核心啟動(dòng)子的進(jìn)一步優(yōu)化。設(shè)計(jì)了一組3個(gè)新的核心啟動(dòng)子,其摻入有在前面的3個(gè)段落中描述的導(dǎo)致表達(dá)增加的正面方面。所述3種關(guān)鍵基序和所述5,UTR元件的特定組合是1)TATA基序,其包含TATAAA,和相對(duì)于INR的由原始SCP1所定義的間隔,2)INR序列基序GCATCA,3)源自果蠅Tollo的MTE序列基序,和4)截短的5,UTR(A111)元件。將這三種新的核心啟動(dòng)子命名為SCP5、SCP6和SCP7。所有這三種核心啟動(dòng)子都缺乏來自SCP1的BRE序列基序(當(dāng)存在時(shí),包含GGGCGCC)。這三種新的核心啟動(dòng)子在由DPE基序所占據(jù)的序列方面不同。SCP5包含來自果蠅Tollo基因的DPE(GGACGC),SCP6包含在SCP1中所使用的共有DPE(GGTTCG),和SCP7缺乏DPE基序而取而代之包含"中性填充物"序列以提供相對(duì)于SCP5和SPC6序列而言相同的間隔。當(dāng)在等價(jià)的果蠅S2表達(dá)構(gòu)建體(它們僅在其SCP序列方面不同)中比較SCP1、SCP5、SCP6和SCP7時(shí),SCP7的設(shè)計(jì)導(dǎo)致最高水平的表達(dá)。SCP7序列作為SEQ.ID.NO:3列出。如先前所討論的,信使MA(mRM)的5'非翻譯區(qū)(5'UTR)的序列在來自真核mRNA的基因表達(dá)的轉(zhuǎn)錄后調(diào)節(jié)中起重要作用。5,UTR由從INR到起始曱硫氨酸密碼子的區(qū)域來定義;因此,在對(duì)于啟動(dòng)子的DNA序列進(jìn)行定義的情況下,它一般包括5,UTR序列。對(duì)于關(guān)于SCPl-TolloAlll和SCP7啟動(dòng)子所列出的序列,這是這種情況。起因于SCPl-TolloMTEAlll啟動(dòng)子的5,狙被稱為Alll5,UTR,并且作為SEQ.ID.NO:4列出;起因于SCP7啟動(dòng)子的5,UTR被稱為Alll-75,UTR,并且作為SEQ.ID.NO:5列出。實(shí)施例6就在果蠅S2細(xì)胞中表達(dá)異源蛋白質(zhì)來對(duì)合成的MRE轉(zhuǎn)錄激活子進(jìn)行優(yōu)化在自然界中,在近側(cè)啟動(dòng)子中發(fā)現(xiàn)了轉(zhuǎn)錄激活子的不同組合。在此基礎(chǔ)上,制備了實(shí)施例3中所描述的GAGA和MRE元件的組合,以測(cè)定這種基序組合是否將會(huì)導(dǎo)致更高水平的轉(zhuǎn)錄和最終導(dǎo)致更高水平的表達(dá)。測(cè)試了兩種GAGA-MRE近側(cè)啟動(dòng)子設(shè)計(jì)。它們?nèi)缦翯AGA-2XMRE和2XMRE-GAGA-2XMRE。利用在實(shí)施例3中所描述的載體pMT-X-KtAXho之中的/6al限制位點(diǎn),將所述兩種GAGA-MRE近側(cè)啟動(dòng)子克隆到緊在實(shí)施例3中所描述的各種核心啟動(dòng)子之前的區(qū)域中。在用包含GAGA-DRE近側(cè)啟動(dòng)子的質(zhì)粒轉(zhuǎn)化并選擇了穩(wěn)定的S2細(xì)胞系后,評(píng)估了H3HA-Ecto產(chǎn)物的表達(dá)。相比于不含GAGA元件的類似MRE構(gòu)建體而言,向所利用的MREs添加GAGA元件并不增加或減少表達(dá)水平。在許多近側(cè)啟動(dòng)子中,相同類型的多個(gè)轉(zhuǎn)錄因子結(jié)合位點(diǎn)常常在正向和反向這兩個(gè)方向中被發(fā)現(xiàn)。這對(duì)于在果蠅的Mtn基因家族的近側(cè)啟動(dòng)子中發(fā)現(xiàn)的內(nèi)源MREs來說是正確的。因此,在為了確定MREs的方向是否能夠改善近側(cè)啟動(dòng)子的功能的努力中,使用正向和反向MRE序列的各種組合而制備了一系列合成的MRE近側(cè)啟動(dòng)子。反向(R)MRE僅僅是實(shí)施例3中所描述的正向(F)MRE序列的反向互補(bǔ)物。反向MRE具有序列GCCGGCCTTO:患AGA(共有MRE序列為斜體并加有下劃線)。這一系列的新的近側(cè)啟動(dòng)子由以各種組合進(jìn)行排列的正向和/或反向MREs的3X重復(fù)組成。所述組合如下3XFMRE、3XRMRE、3XFMRE-3XRMRE、3XRMRE-3XFMRE、3XFMRE-3XFMRE和3XRMRE-3XRMRE。3XMRE重復(fù)單元之間的間隔為11個(gè)核苷酸。間隔子的序列為ATCAAACTAGA。如在實(shí)施例3中一樣,將包含MRE近側(cè)啟動(dòng)子的正向和反向插入在表達(dá)載體pMT-X-KtAXho中的MtnA核心啟動(dòng)子的上游。還構(gòu)建了包含SCP1核心的類似的表達(dá)質(zhì)粒。為了評(píng)估使用這些合成的MRE啟動(dòng)子表達(dá)栽體的重組蛋白質(zhì)的表達(dá),將實(shí)施例1中所描述的H3HA-Ecto基因序列插入到所述載體中。將編碼H3HA-Ecto亞單位蛋白質(zhì)的具有MRE近側(cè)啟動(dòng)子的表達(dá)質(zhì)粒用于轉(zhuǎn)化S2細(xì)胞。在用包含正向和反向MRE組合的質(zhì)粒轉(zhuǎn)化和選擇出穩(wěn)定的S2細(xì)胞系后,評(píng)估H3HA-Ecto產(chǎn)物的表達(dá)。因?yàn)檫@些構(gòu)建體包含MREs,所以表達(dá)的評(píng)估要求,用Q.2mMCuS04來對(duì)培養(yǎng)物進(jìn)行誘導(dǎo),并且于26C培養(yǎng)7天。這些S2轉(zhuǎn)化體的分析揭示,當(dāng)使用不同的正向和反向組合時(shí),它們導(dǎo)致各種水平的表達(dá),所有這些表達(dá)水平均大于實(shí)施例3的6XMRE。即使3XFMRE-3XFMRE也導(dǎo)致比6XMRE略微更高的表達(dá)(為~2倍)。這可能是由于長(zhǎng)度為11個(gè)核苷酸的間隔子所造成的結(jié)果,這是6XMRE和3XFMRE-3XFMRE近側(cè)啟動(dòng)子序列之間的唯一差異。由3XFMRE-3XRMRE所指導(dǎo)的表達(dá)大約等于3XFMRE-3XFMRE的那種。由3XRMRE-3XFMRE所指導(dǎo)的表達(dá)為6XMRE的大約3倍,和由3XRMRE-3XRMRE所指導(dǎo)的表達(dá)為6XMRE的大約4-5倍。因此,選擇3XRMRE-3XRMRE作為近側(cè)啟動(dòng)子,以在進(jìn)一步的構(gòu)建體中使用,在所述構(gòu)建體中將所選擇的調(diào)控元件相組合從而形成僅由合成的或經(jīng)優(yōu)化的元件組成的完整的表達(dá)盒,如實(shí)施例9中所描述的。合成的近側(cè)啟動(dòng)子3XRMRE-3XRMRE的序列在SEQ.ID.NO:6中列出。實(shí)施例7就在果蠅S2細(xì)胞中表達(dá)異源蛋白質(zhì)對(duì)合成的分泌信號(hào)進(jìn)行設(shè)計(jì)和優(yōu)化分泌信號(hào)肽在被靼向從細(xì)胞中進(jìn)行分泌的蛋白質(zhì)的表達(dá)中起重要作用。因此,在表達(dá)載體中使用最佳序列對(duì)于此類表達(dá)載體的利用來說是重要的,所述表達(dá)載體指導(dǎo)重組蛋白質(zhì)在產(chǎn)生過程中分泌到培養(yǎng)基中。由Zhang等人(/.Ce/2e(2005)7:354-365)所提出的分泌信號(hào)優(yōu)化的例子清楚地證明了分泌信號(hào)優(yōu)化的益處;然而,這個(gè)特定的例子應(yīng)用于植物,并且并不清楚改變成所描述的分泌信號(hào)可以31應(yīng)用于其他真核細(xì)胞類型。因此,設(shè)計(jì)了一系列的三種分泌信號(hào),以確定對(duì)于該序列的何種類型的改變將會(huì)導(dǎo)致蛋白質(zhì)產(chǎn)物進(jìn)入到經(jīng)穩(wěn)定轉(zhuǎn)化的S2細(xì)胞的培養(yǎng)基中的表達(dá)增加。合成的分泌信號(hào)的設(shè)計(jì)遵循矩P車表(matrixtable),其首先由vonHeijne(腸.Jc油Wes.(1986)14:4683-4690)描述,并且由Bendtsen等人(/.Wo/.(2004)340:783-795)進(jìn)一步改進(jìn)。所測(cè)試的第一組三種分泌信號(hào)在切割區(qū)域中都包含有相同的序列,在疏水性區(qū)域中包含有不相同的序列長(zhǎng)度,和在堿性區(qū)域中包含有不相同數(shù)目的帶電荷的殘基。所測(cè)試的三種信號(hào)肽的氨基酸序列如下,其中名稱在括號(hào)中MRTIIA"LLTVSGAQG("1R4L")MRTIIALLL"TVSGAQG("1R5L,,)MUTIIALLLLLTVSGAQG("2R5L,,)。1R5L序列比1R4L序列長(zhǎng)1個(gè)氨基酸(以斜體字體顯示的額外的"L"),因?yàn)樵黾恿耸杷院说拈L(zhǎng)度;而2R5L序列比1R5L序列長(zhǎng)1個(gè)殘基(以斜體字體顯示的額外的"R,,),因?yàn)橄驂A性區(qū)域中添加了額外的帶電荷的殘基并同時(shí)保持了相同的疏水性核。1R4L、1R5L和2R5L序列的長(zhǎng)度分別是17、18和19個(gè)氨基酸。這三種分泌信號(hào)在pMtaf表達(dá)載體中與H3HA-Ecto結(jié)構(gòu)域基因有效連接。將利用這三種分泌信號(hào)來進(jìn)行的H3HA-Ecto產(chǎn)物的表達(dá)和分泌與其中利用了tPA分泌信號(hào)的類似的H3HA-Ecto結(jié)構(gòu)域構(gòu)建體進(jìn)行比較。在如實(shí)施例1中所描述的,轉(zhuǎn)化S2細(xì)胞、選擇穩(wěn)定的細(xì)胞系以及就產(chǎn)物在培養(yǎng)基中的表達(dá)水平進(jìn)行篩選后,確定了1R5L導(dǎo)致最高水平的表達(dá),其為包含tPA的構(gòu)建體的大約2倍,為包含2R5L的構(gòu)建體的大約3倍,以及為包含1R札(等價(jià)于tPA)的構(gòu)建體的大約2倍。此外,在1R5L序列中的偶然突變,Q至H(-2位置),導(dǎo)致表達(dá)的出乎意料的進(jìn)一步增加,為原始1R5L序列的大約2倍。包含該H殘基的1R5L序列被稱為1R5L(H),并且用于在實(shí)施例9中所公開的最終表達(dá)載體之中。在這些分泌信號(hào)序列的設(shè)計(jì)中,將六核苷酸序列AACAAC置于緊在起始曱石克氨酸密碼子之前。這代表了由Cavener(#zyc.」c/&Wes.(1987)15:1353-1361)所描述的關(guān)于果蠅的共有Kozak序列。分泌信號(hào)序列的設(shè)計(jì)還評(píng)估了緊隨在切割位點(diǎn)處的G之后的T或S氨基酸殘基的使用。當(dāng)選擇用于這些殘基的合適密碼子時(shí),在G/T和G/S切割位點(diǎn)處的序列分別編碼限制性內(nèi)切核酸酶切割位點(diǎn))T/wI和5緒HI。這兩個(gè)切割位點(diǎn)序列良好地起作用。它們都提供了編碼所需蛋白質(zhì)的序列的方便插入,以在同一個(gè)讀碼框中與分泌信號(hào)相融合。1R5L(H)這一經(jīng)優(yōu)化的分泌信號(hào)的序列為MRTIIALLLLLTVSGAHG。優(yōu)選的在切割位點(diǎn)后的氨基酸是S。編碼該經(jīng)優(yōu)化的分泌信號(hào)的核苷酸序列以及相應(yīng)的氨基酸序列分別作為SEQ.ID.NO:7和NO:8列出。實(shí)施例8就在果蠅S2細(xì)胞中表達(dá)異源蛋白質(zhì)對(duì)備選的3,UTR元件進(jìn)行評(píng)估基因和mRM的3,UTR分別在基因表達(dá)的轉(zhuǎn)錄和翻譯水平上起重要作用(由Kloc等人,Ce//(2002)108:533-544進(jìn)行了綜述)。因此,在表達(dá)載體(其幫助改善多腺苷酸化,改善mRM從細(xì)胞核到細(xì)胞質(zhì)的移位,改善mRNA穩(wěn)定性,并且不干擾mRNA定位至粗面內(nèi)質(zhì)網(wǎng))中使用最佳3,UTR序列對(duì)于指導(dǎo)產(chǎn)物釋放到培養(yǎng)基中的表達(dá)載體的利用來說是重要的。這是由于已建議的這些原因,在表達(dá)質(zhì)粒的設(shè)計(jì)中,將3,UTR考>{|、用于優(yōu)4匕(vanderVelden等人,5iofecA/2/《wes(2001)31:572-582)。果蠅pMTtPA表達(dá)質(zhì)粒利用了病毒SV40早期3'UTR序列以用于終止和多腺苷酸化。雖然它是具有功能的,但看起來在使用這種SV40序列之上存在有改善的空間。例如,由Van0ers等人(/.h'ro/.(1999)2253-2262)報(bào)道了就在昆蟲系統(tǒng)中進(jìn)行異源表達(dá)而對(duì)3,UTR進(jìn)行的優(yōu)化。他們用桿狀病毒3,UTR替代了SV40早期3,UTR,并且表達(dá)水平增加。雖然他們未剖析該新的3,UTR以確定哪個(gè)部分促成了表達(dá)的增加,但這項(xiàng)工作證明3'UTR中的改變可以改善異源蛋白質(zhì)的表達(dá)。不幸的是,每種表達(dá)系統(tǒng)是獨(dú)特的,并且必需確定什么構(gòu)成了用于在S2細(xì)胞中表達(dá)分泌型產(chǎn)物的最佳3,UTR。大多數(shù)真核3'UTR元件的主要特征是多腺苷酸化信號(hào)序列(polyA信號(hào)),其為AATAAA。polyA信號(hào)牽涉定義在細(xì)胞核中且在其上發(fā)生多腺苷酸化的新轉(zhuǎn)錄的mRNA的3,末端切割位點(diǎn)。在某些3,UTRs中,緊在切割位點(diǎn)下游觀察到保守序列。這些序列被稱為下游序列元件(DSE),并且被認(rèn)為參與定義3,UTR切割位點(diǎn)。在pMTtPA載體和衍生物中存在的SV40早期3'UTR的長(zhǎng)度為138個(gè)堿基,并且包含兩個(gè)推定的polyA信號(hào)。用于添加polyA尾的切割位點(diǎn)出現(xiàn)在核苷酸96處。在核苷酸96和138之間的序列中,存在被認(rèn)為代表了將會(huì)幫助切割的DSE基序的序列。在為了鑒定將會(huì)導(dǎo)致更高水平的表達(dá)的3'UTR序列的努力中,評(píng)估了在許多果蠅基因上的3,UTRs。主要標(biāo)準(zhǔn)是,3,UTR的長(zhǎng)度為大約IOO個(gè)核苷酸,并且源自編碼分泌型產(chǎn)物的基因。由Kirkpatrick等人("e/e(1995)143:147-154)所描述的果蠅殼多糖酶樣蛋白(CLP)是來自S2細(xì)胞的最豐富的分泌型蛋白質(zhì)之一,并且滿足這些標(biāo)準(zhǔn)。該3,UTR不具有符合AATAAA序列的polyA信號(hào)。Kirkpatrick等人提出,polyA信號(hào)在AATATA或CATAAA處。在Kirkpatrick等人(1995)中,CLP3,UTR切割位點(diǎn)由將polyA序列添加至mRM所處的位置(核苷酸106)來定義?;趤碜?rc^o/7力Z/aGeneCollection(BerkeleyDrosophilaGenomeProject,www.fruitfly.org/DGC/)的CLPcDM克隆LD21619,切割位點(diǎn)為進(jìn)一步往下游7-11個(gè)核苷酸。Kirkpatrick等人的序列、LD21619的序列和來自果蠅基因組序列的相應(yīng)序列之間的序列比對(duì),鑒定出在Kirkpatrick等人的序列中在核苷酸43處的單個(gè)核苷酸錯(cuò)誤,A變?yōu)镚。這個(gè)變化導(dǎo)致獲得AAGAAAA("變體polyA信號(hào)")而不是AAAAAAA的序列。在CLP3'UTR中還存在有另一個(gè)AAGAAA序列?;谶@些AAGAAA序列的位置,本發(fā)明人假定這些序列之一可能能夠充當(dāng)polyA信號(hào),其中第二個(gè)序列是最可能的。為了在表達(dá)載體中對(duì)CLP3'UTR進(jìn)行最初測(cè)試,選擇長(zhǎng)度為117個(gè)核苷酸的片段。這個(gè)片段包含所述兩個(gè)AAGAAA變體polyA信號(hào)。此外,基于不同來源的CLP序列的比對(duì),這個(gè)117片段將會(huì)允許在所提出的切割位點(diǎn)中的任一個(gè)處進(jìn)行切割,即接近所述兩個(gè)變體polyA信號(hào)中的每一個(gè)。將該117核苷酸CLP3,UTR序列添加至表達(dá)載體pMTtPAAXho,從所述表達(dá)載體中去除了SV40早期3,UTR。該117核苷酸CLP3,UTR的插入導(dǎo)致報(bào)道分子H3HA-Ecto蛋白的表達(dá)增加至1.5倍。在為了確定AAGAAA序列是否充當(dāng)polyA信號(hào)的努力中,將所述兩個(gè)推定的信號(hào)中的G殘基誘變成T殘基,以匹配共有polyA序列。相比于具有SV40早期3,UTR的等價(jià)的表達(dá)載體而言,這個(gè)變化導(dǎo)致表達(dá)增加至3倍。在進(jìn)一步的實(shí)驗(yàn)中,使CLP3'UTR中的所述兩個(gè)推定的多腺苷酸化位點(diǎn)均進(jìn)行突變,以使所述序列斷裂(第一個(gè)AAGAAA變成ACGCAA,而第二個(gè)AAGAAA變成AATGAA)。這些變化導(dǎo)致表達(dá)水平的急劇減少。這進(jìn)一步支持了,這些推定的多腺苷酸化信號(hào)中的至少一個(gè)充當(dāng)polyA信號(hào)。為了確定另外的下游序列是否是對(duì)于作為DSE起作用來說所必需的,基于在相應(yīng)位置處的基因組序列,使3'UTR再延長(zhǎng)20個(gè)核苷酸。延長(zhǎng)的3,UTR使表達(dá)水平降低至1/2至1/3,這是出人意料的?;谶@些結(jié)果,選擇具有兩個(gè)G至T突變的117核苷酸CLP-3,UTR,以用于構(gòu)建組合了多個(gè)調(diào)控元件的表達(dá)載體(如實(shí)施例9中所描述的)。這種經(jīng)優(yōu)化的3,UTR導(dǎo)致更高水平的表達(dá),并且被稱為Op-CLP-3,UTR。Op-CLP-3,UTR的序列作為SEQ.ID.NO:9列出。實(shí)施例9就在果蠅S2細(xì)胞中異源蛋白質(zhì)的增強(qiáng)的表達(dá)來對(duì)包含調(diào)控元件的組合的表達(dá)載體進(jìn)行評(píng)估為了形成用于在S2細(xì)胞中表達(dá)重組蛋白質(zhì)產(chǎn)物的經(jīng)優(yōu)化的表達(dá)載體,需要下述5種調(diào)控元件中的每一種近側(cè)啟動(dòng)子、核心啟動(dòng)子、5,UTR、分泌信號(hào)和3,UTR。理想地,對(duì)這5種元件中的每一種進(jìn)行優(yōu)化,并且所述元件的組合將會(huì)導(dǎo)致獲得這樣的表達(dá)盒,所述表達(dá)盒導(dǎo)致更高水平的產(chǎn)物表達(dá)。在先前實(shí)施例中,鑒定出了下述經(jīng)優(yōu)化的元件合成的近側(cè)啟動(dòng)子3XRMRE-3XRMRE,合成的核心啟動(dòng)子SCPl-TolloMTEMll和SCP7,具有共有Kozak序列的截短的5,UTR,合成的分泌信號(hào)1R5L(H),和經(jīng)優(yōu)化的3,UTROp-CLP-3,UTR。作為用于評(píng)估這些經(jīng)優(yōu)化的調(diào)控元件的組合的第一個(gè)步驟,將1R5L分泌信號(hào)和Op-CLP-3,UTR分別用于替代在實(shí)施例3中所描述的pMT-X-KtAXho之中的tPA分泌信號(hào)和SV40早期3,UTR。包含這兩種經(jīng)優(yōu)化的元件的表達(dá)載體被稱為pHBI-5。將報(bào)道基因(例如,H3HA-Ecto)克隆到pHBI-5中,并且評(píng)估它們的表達(dá)。一般地,表達(dá)水平為對(duì)于克隆到pMT-X-KtAXho中的相同報(bào)道基因所看到的表達(dá)水平的1.5倍,這表明獨(dú)個(gè)地通過1R5L分泌信號(hào)和0p-CLP-3,UTR所看到的改善不是加和性的;然而,該表達(dá)水平仍高于由pMT-X-KtAXho載體所驅(qū)動(dòng)的表達(dá)水平。裝配出包含所有5種元件的兩個(gè)表達(dá)盒。所述兩個(gè)盒在使用所述兩個(gè)核心啟動(dòng)子中的哪一個(gè)核心啟動(dòng)子方面不同。第一個(gè)盒包含SCP1-TolloMTEAlll核心啟動(dòng)子,而第二個(gè)盒包含SCP7核心啟動(dòng)子。這些表達(dá)盒分別稱為HBI-10和HBI-11。整個(gè)盒的序列在SEQ.ID.NO:10(HBI-10)和SEQ.ID.NO:11(HBI-11)中列出。圖1和2分別圖解說明了HBI-IO和HBI-11的近側(cè)啟動(dòng)子和核心啟動(dòng)子區(qū)域的序列,并且進(jìn)行了充分注釋。HBI-10和HBI-11相對(duì)于pMTtPA的差異以表格形式概括在圖3中。將HBI-10和HBI-11表達(dá)盒插入到pBR322克隆載體中,以形成S2細(xì)胞表達(dá)栽體pHBI-10和pHBI-ll。關(guān)于這兩種S2細(xì)胞表達(dá)載體的質(zhì)粒圖i普分別顯示在圖4和5中。對(duì)于利用pHBI-10和pHBI-11表達(dá)載體來表達(dá)H3HA-Ecto產(chǎn)物所進(jìn)行的評(píng)估揭示,pHBI-11導(dǎo)致相對(duì)于pMT-X-KtA載體而言增加至大約3倍的表達(dá)水平,而pHBI-10導(dǎo)致相對(duì)于由pMT-X-KtA載體所指導(dǎo)的相同-HA-Ecto產(chǎn)物的表達(dá)而言增加至大約2倍的表達(dá)水平。參考文獻(xiàn)ApuyaN,KwokS,AlexandrovN,TatrinovaT,FangY,PennellR,LuYP,MedranoL,CookZ,FeldmannPromoter,PromoterControlElements,andCombinations,andusesThereof.U.S.PatentNo.:US2006/0090216Al.Pub.Date;Apr.27,1006.BendtsenJD,NielsenH,vonHeijneG,BrimalS.Improvedpredictionofsignalpeptides:SignalP3.0.JMolBiol2004;340:783-795.BernardAR,KostTA,OvertonL,CavegnC,YoungJ,BertrandM,Yahia-cherifZ,ChabertCandStillsA.RecombinantproteinexpressioninZ>oyo;/n7acellline:comparisonwiththebaculovirussystem.Cytotechnology.1994;15:139-144.BinL,TsingS,KosakaAH,NguyenB,OsenEG,BachC,ChanHandBamettJ.Expressionofhumandopaminefi-iiydroxylaseinZ)my叩M"Scloneider2cells.Biochem.丄1996;313:57-64.Butler,JEF,KadonagaJT.TheRNApolymeraseIIcorepromoter:akeycomponentintheregulationofgeneexpression.GenesDev.2002;16:2583-2592.CavenerDR,ComparisonoftheconsensussequenceflankingtranslationalstartsitesinDra^op/n'/"andvertebrates.NucleicAcidsResearch.1987;15(4》1353-1361.CulpJS,JohansenH,HellmigB.RegulatedexpressionallowshighlevelproductionandsecretionofHIVgpl加envelopeglycoproteininZ>as*op/n7"Schneidercells.Biotechnology.1991;9:173-177.DeoYfC,ParkEY.Multipleco陽(yáng)transfectionandco-expressionofhumanP-1,3-N-acetylglucosaminyltransferasewithhumancalreticulinchaperonecDNAinasinglestepininsectcells.Biotechnol.Appl.Biochem.2006;43:129-135.EdelmanGM,MeechR,OwensGC,andJonesFS.Syntheticpromoterelementsobtainedbynucleotidesequencevariationandselectionforactivity.ProcNatlAcadSci.2000;97:3038-3043.FarrellPJ,LuM,PrevostJ,BrownC,BehieL,IatrouK.High-levelexpressionofsecretedglycoproteinsintransformedlepidopteraninsectcellsusinganovelexpressionvector.BiotechnologyandBioengineering.1998;60(6):656-663.FitzGeraldPC,SturgillD,ShyakhtenkoA,OliverB,VinsonC.ComparativegenomicsofDrarap/z//"andhumancorepromoters.GenomeBiology.2^)06;7:R53.GardsvollH,WernerF,SondergaardL,DanoK,PlougM.Characterizationoflow-glycosylatedformsofsolublehumanurokinasereceptorexpressininZVora////"Schneider5cellsafterdeletionofglycosylation-sites.聲r(shí)oteinExpressionandPurification.2004;34:284-295.GershenzonNI,TrifonovED,loshikhesIP.ThefeaturesofDrosophilacorepromotersrevealedbystatisticalanalysis.BMCGenomics.7:161,GranokH,LeibovitchBA,ShafferCD,ElginSCR.Ga匿gaoverGAGAfactor*CurrentBiol.1995;5:238-241.HiroseF,YamaguchiM,HandaH,InomataY,MatsukageA.Novel8-basepairsequence(DrosophilaDNAreplication-relatedelement)andspecificbindingfactorinvolvedintheexpressionofDrosophilagenesforDNApolymeraseaandproliferatingcellnuclearantigen.JBiolChem.1993;268:2092-2099.37HofmannKJ,SchultzLD.Mutationsoftheoc-galactosidasesignalpepetidewhichgreatlyenhancesecretionofheterologousproteinsbyyeast.Gene.1991;101:105-111.IkonomouL,SchneiderY陽(yáng)J,AgathosSN.Insectcellcultureforindustrialproductionofrecombinantproteins.Appl.Microbiol.Biotechnol.2003;62:1-20.Incardona,J.P.andT.L.Rosenberry.ConstructionandcharacterizationofsecretedandchimerictransmembraneformsofDmyopMaacetylcholinesterase:alargetruncationoftheC-terminalsignalpeptidedoesnoteliminateglycoinositolphospholipidanchoring.Mol.Biol,oftheCell1996;7:595-611.Ivey-Hoyle,M.RecombinantgeneexpressioninculturedZ)ra^p/7,7"me/awogoy/ercells.Curr.Opin.Biotechnol.1991;2:704-707.JohansenHA,vanderStratenR,SweetR,OttoE,MaroniG,RosenbergM.Regulatedexpressionathighcopynumberallowsproductionofagrowth-inhibitoryoncogeneproductinDmsop/z/'/"Schneidercells,。enesandDevelopment.1989;3:882-889.Juven-GershonT,HsuJY,KadonagaJT.PerspectivesontheRNApolymeraseIIcorepromoter.BiochemSoc,Trans.2006;34:1047-1050.Juven-GershonT,ChengS,KadonagaJT.Rationaldesignofasupercorepromoterthatenhancesgeneexpression.NatureMethods.2006;3:917-922.KadonagaJTandTGershon.Optimizedcorepromotersandusestherfor.ApplicationPCT/US2006/020394.Apppublished30November2006.Prioritydate25May2005(USprovisional60/684,4825.LimCY,SantosoB,BoulayT,DongE,OhlerU,KadonagaJT.TheMTE,anewcorepromoterelementfortranscriptionbykNApolymeraseII,GenesandDevelopment.2004;18:1606-1617.KirkpatrickRB,MaticoRE,McNultyDE,StricklerJE,RosenbergM.AnabundantlysecretedglycoproteinfromDms*op///a廳/awogasterisrelatedtomammaliansecretoryproteinsproducedinrheumatoidtissuesandbyactivatedmacrophages.Gene.199^;153:147-154.KirkpatrickRBandShatzmatiA.Z>tw//n7"S2Systemforheterologousgeneexpression.7nGeneExpressionSystems:UsingNaturefortheArtofExpression.JosephMFernandezandJamesHoefflereditors.AcademicPress.199$;Pp.289-330.KlocM,ZearfossNR,EtkinLD,MechanismsofsubcellularmRNAlocalization.CelL2002;108:533-544.KozakM.Featuresinthe5'non-codingsequencesofrabbitaandP-globiiimRNAsthataffecttranslation^efficiency,J.Mol.Biol.1994;235:95-110.KozakM.RegulationoftranslationviamRNAstructureinprokaryotesandeukaryotes.Gene.2005;361:13-37.KutachAK,KadonagaJT.ThedownstreampromoterelementDPEappearstobeaswidelyusedastheTATAboxinDrosophilacorepromoters.MoLCell.Biol.2000;20:4754-4764.LeLoirY,AzevedoV,OliveiraSC,FreitasDA,MiyoshiA,Bermudez-HumamnLG,NouailleS,RibeiroLA,LeclercqS,GabrielJE,GuimaraesVD,OliveiraMN,CharlierC,GautierM,LangellaP.ProteinsecretioninLactococcuslactis:andefficientwaytoincreasetheoverallheterologousproteinproduction.Microb.CellFact,2005;4:2.LiX,EastmanEM,SchwartzRJ,Draghia-AkliR.Syntheticmusclepromoters:activitiesexceedingnaturallyoccurringregulatorysequences.NatureBiotechnology.1999;17:241-245.LimCY,SantosoB,BoulayT,DongE,OhlerU,KadonagaJT.TheMTE,anewcorepromoterelementfortranscriptionbyRNApolymeraseII.GenesandDev.2004;18:1606-1617.LuM,JohnsonRR,IatrouK.Trans-activationofacellhousekeepinggenepromoterbytheIE1geneproductofbaculovirus.Virology.1996;218:103-113.LuM,FarrellPJ,JohnsonR,mIatrouK.Abaculovirus(BmNPV)repeatelementfunctionsasapowerfulconstitutiveenhancerintransfectedinsectcells.J.Biol.Chem.1997;272:30724-30728,ModisY,OgataS,ClementsD,HarrisonSC.Aligand-bindingpocketinthedenguevirusenvelopeglycoprotein.Proc.Natl.Acad.Sci.USA.2003;100:6986-6991.ModisY,OgataS,ClementsD,HarrisonSC.Structureofthedenguevirusenvelopeproteinaftermembranefusion.Nature,2004;427(6972):313-319.OhlerU,LiaoG,NiemannH,RubinGM,ComputationalanalysisofcorepromotersintheD簡(jiǎn)—,7"genome.GenomeBiol.2002;3(12):research0087.1-00087.12.OlsenMK,RockenbachSK,FischerHD,HoogerheideJG,TomichCSC,StableproductionofananalogofhumantissueplasminogenactivatorfromculturedDtotop/h7gcells.Cytotechnology.1992;10:157-167.RudI,JensenPR,Naterstad,AxelssonL.Asyntheticpromoterlibraryforconstituitivegeneexpressionin丄a加6鎖7/top/aw加腦.Microbiology.2006;152:1011-1019.SchmetzerO,MoldenhauerG,RiesenbergR,PiresJR,SchlagP,PezzuttoA.2005.Qualityofrecombinantproteindeterminestheamountofautoreactivityagainstthetumor-associatedepithelialcelladhesionmoleculeantigen:lowfrequencyofantibodiesagainstthenaturalprotein.TheJournalofImmunology.2005;174:SchmidtFR.Recombinantexpressionsystemsinthepharmaceuticalindustry.ApplMicrobiolBiotechnol,2004;65:363-372.SchneiderIJ.CelllinesderivedfromlateembryonicstagesofZ)ras^;/u7(7艦/"wogoy脫J.Embryol.Exp.Morph.1972;27:353-365.SmaleST,KadonagaJT.TheRNApolymeraseIIcorepromoter.Annu*Rev.Biochem.2003;72:449-479.SoellerWC,OhCE,KornbergTB.IsolationofcDNAsencodingtheZ)my叩/n7"GAGAtranscriptionfactor.MolandCellBiol.1993;13:7961-7970,TomoeJ,KuskP,JohansenTE,JensenPR.Generationofasyntheticmammalianpromoterlibrarybymodificationofsequencesspacingtranscriptionfactorbindingsites.Gene.2002;297:21-32.vanderStratenAH,JohansenH,RosenbergM,SweetRW.IntroductionandconstitutiveexpressionofgeneproductsinculturesofDra^/MacellsusinghygromycinBselection.MethodsinMolAndCellBiol.1989;1:1-8.vanderVeldenAW,VoormaHO,ThomasAAM.Vectordesignforoptimalproteinexpression.BioTechniques.2001;31:572-582.vonHeijneG.Anewmethodforpredictingsignalsequencecleavagesites,NucAcidsRes,1986;14:4683-4690.vanOersMM,VlakJM,VoormaHO,Thomas,AAM.Roleofthe3'untranslatedregionofbaculovirusp10mRNAinhigh-levelexpressionofforeigngenes.JGenVirol.1999;80:2253-2262.WilsonIA,SkehelJJ,WileyDC.Structureofthehaemagglutininmembraneglycoproteinofinfluenzavirusat3人resolution.Nature1981;289:366-673.XuT,LogsdonNJ,WaterMR.Structureofinsect-cell-derivedIL-22.ActaCrystaUogrDBiolCrystaUogr.2005;61(pt7):942-50.ZhangL,LengQ,MixsonAJ.AlterationintheIL2signalpeptideaffectssecretionofproteinsz>v/fraand>v/vo.J.GeneMed.2005;7:354-365.40權(quán)利要求1.用于在培養(yǎng)的昆蟲細(xì)胞中表達(dá)和分泌異源蛋白質(zhì)的表達(dá)載體,其包含表達(dá)盒,其中所述表達(dá)盒包含由近側(cè)和核心啟動(dòng)子元件組成的合成啟動(dòng)子,所述近側(cè)和核心啟動(dòng)子元件在所述表達(dá)盒內(nèi)有效連接,從而使得異源基因序列的插入將導(dǎo)致從用所述表達(dá)載體穩(wěn)定轉(zhuǎn)化的細(xì)胞中的蛋白質(zhì)表達(dá)。2.權(quán)利要求l的合成啟動(dòng)子,其進(jìn)一步包含SEQ.ID.所示的近側(cè)啟動(dòng)子3XRMRE-3XRMRE序列,和SEQ.ID.NO:的合成的核心啟動(dòng)子SCP1-TolloMTEAlll序列。3.權(quán)利要求l的合成啟動(dòng)子,其進(jìn)一步包含SEQ.ID.所示的近側(cè)啟動(dòng)子3XRMRE-3XRMRE序列,和SEQ.ID.NO:的合成的核心啟動(dòng)子SCP7序列。4.權(quán)利要求2或3的表達(dá)載體,其進(jìn)一步包含與所述合成的近側(cè)啟動(dòng)子和核心啟動(dòng)子有效連接的合成的5,UTR元件,從而使得該組合能夠驅(qū)動(dòng)異源蛋白質(zhì)的表達(dá)。5.權(quán)利要求4的表達(dá)載體,其進(jìn)一步包含與所述合成的近側(cè)啟動(dòng)子、核心啟動(dòng)子和5,UTR元件有效連接的合成的分泌信號(hào)序列,從而使得該組合能夠驅(qū)動(dòng)異源蛋白質(zhì)的表達(dá)和分泌。6.權(quán)利要求5的表達(dá)栽體,其進(jìn)一步包含與所述合成的近側(cè)啟動(dòng)子、核心啟動(dòng)子、5,UTR和合成的分泌信號(hào)序列元件有效連接的合成的3,UTR序列,從而使得該組合能夠驅(qū)動(dòng)異源蛋白質(zhì)的表達(dá)和分泌。7.權(quán)利要求4的合成的5,UTR,其包含SEQ.ID.NO:4中所示的序列。8.權(quán)利要求4的合成的5,UTR,其包含SEQ.ID.NO:5中所示的序列。9.權(quán)利要求5的合成的分泌信號(hào)序列,其包含SEQ.ID.NO:7中所示的1R5L(H)編碼序列。10.權(quán)利要求6的合成的3,UTR,其包含SEQ.ID.NO:9中所示NO:6中2中所示NO:6中3中所示的OpCLP3'UTR序列。11.用于在培養(yǎng)的昆蟲細(xì)胞中表達(dá)和分泌異源蛋白質(zhì)的表達(dá)載體,其包含SEQ.ID.NO:10中所示的表達(dá)盒。12.用于在培養(yǎng)的昆蟲細(xì)胞中表達(dá)和分泌異源蛋白質(zhì)的表達(dá)載體,其包含SEQ.ID.MO:ll中所示的表達(dá)盒。13.權(quán)利要求l、2、3、4、5、6、7、8、9、10、11和12的表達(dá)載體的用途,其中所述昆蟲細(xì)胞為果蠅細(xì)胞。14.權(quán)利要求l、2、3、4、5、6、7、8、9、10、11和12的表達(dá)載體的用途,其中所述昆蟲細(xì)胞為果蠅S2細(xì)胞。全文摘要本發(fā)明旨在用于在昆蟲細(xì)胞中表達(dá)天然樣異源蛋白質(zhì)的經(jīng)優(yōu)化的表達(dá)載體。本發(fā)明的組成為代表了表達(dá)載體的元件的核苷酸序列,當(dāng)所述元件相組合時(shí),導(dǎo)致異源蛋白質(zhì)的增強(qiáng)的表達(dá)和分泌。所述元件包括定義了在昆蟲細(xì)胞中有功能的轉(zhuǎn)錄激活子、核心啟動(dòng)子、分泌信號(hào)和3’非翻譯區(qū)的序列。在經(jīng)優(yōu)化的載體中所包含的元件都是合成得到的,或者為天然存在的昆蟲序列的經(jīng)修飾的變體。當(dāng)編碼蛋白質(zhì)的核苷酸序列與所述載體有效連接時(shí),所述表達(dá)載體可用于表達(dá)天然樣蛋白質(zhì)。這些載體可以用于轉(zhuǎn)化昆蟲細(xì)胞,所述昆蟲細(xì)胞隨后可以進(jìn)行培養(yǎng)以產(chǎn)生所需蛋白質(zhì)產(chǎn)物。表達(dá)出的天然樣蛋白質(zhì)可以用于需要大量高品質(zhì)蛋白質(zhì)的診斷、疫苗或其他應(yīng)用中。文檔編號(hào)C12Q1/68GK101688246SQ200880021845公開日2010年3月31日申請(qǐng)日期2008年4月28日優(yōu)先權(quán)日2007年4月26日發(fā)明者C·威克斯-利維,D·E·克萊門茨,G·V·L·王申請(qǐng)人:夏威夷生物技術(shù)公司