酸單體之間的磷酸二酯鍵而形成的。在本發(fā)明的上下文中,優(yōu)選的核酸分子包括但不限于核糖核酸(RNA)及和脫氧核糖核酸(DNA)。而且,術(shù)語“多核苷酸”還包括DNA或RNA的人工類似物,諸如肽核酸(PNA)。
[0028]更多合適的載體在PCT/EP2011/074307中詳細(xì)描述。該申請的公開內(nèi)容通過引用將它與本文披露的表達(dá)系統(tǒng)相關(guān)的公開內(nèi)容一起并入。
[0029]多肽
術(shù)語“蛋白質(zhì)”、“多肽”和“肽”在本文中可互換使用,并且是指氨基酸的任何肽連接鏈,不管共翻譯或翻譯后修飾的長度。
[0030]本文所使用的術(shù)語“翻譯后”是指核苷酸三聯(lián)體翻譯成氨基酸并與序列中前一氨基酸形成肽鍵后發(fā)生的事件。這樣的翻譯后事件可以發(fā)生在整個(gè)多肽形成后,或者已經(jīng)在翻譯過程期間發(fā)生在已被翻譯的多肽的那些部分上。翻譯后事件通常改變或修飾了所得多肽的化學(xué)或結(jié)構(gòu)特性。翻譯后事件的例子包括但不限于諸如氨基酸的糖基化或磷酸化,或者肽鏈的切割,例如通過內(nèi)肽酶。
[0031]本文所使用的術(shù)語“共翻譯”是指在核苷酸三聯(lián)體的翻譯成氨基酸鏈的過程中發(fā)生的事件。那些翻譯后事件通常改變或修改了所得氨基酸鏈的化學(xué)或結(jié)構(gòu)特性。共翻譯事件的例子包括但不限于可能完全終止翻譯過程或中斷肽鍵形成而得到兩種分離的翻譯產(chǎn)物。
[0032]本文所使用的術(shù)語“多聚蛋白質(zhì)”或“人工多聚蛋白質(zhì)”是指氨基酸鏈,其包含或基本上由未天然彼此連接的兩個(gè)氨基酸鏈組成。多聚蛋白質(zhì)可以包含一個(gè)或更多個(gè)另外的氨基酸鏈。每個(gè)氨基酸鏈可以是完整的蛋白質(zhì),即跨越整個(gè)0RF,或其片段、結(jié)構(gòu)域或表位。多聚蛋白質(zhì)的各個(gè)部分可以是永久或暫時(shí)地彼此連接。永久連接的多聚蛋白質(zhì)的部分是從單個(gè)ORF翻譯的且不在共翻譯或翻譯后隨后分離。暫時(shí)連接的多聚蛋白質(zhì)的部分也可以來源于單個(gè)0RF,但由于翻譯過程中的分離而共翻譯地分開,或者由于肽鏈切割(例如通過內(nèi)肽酶)而在翻譯后分開。額外地或可選地,多聚蛋白質(zhì)的部分也可以來源于兩個(gè)不同的0RF,并在翻譯后連接起來,例如通過共價(jià)鍵。
[0033]本發(fā)明中可用的蛋白質(zhì)或多聚蛋白質(zhì)(包括蛋白質(zhì)衍生物、蛋白質(zhì)變體、蛋白質(zhì)片段、蛋白質(zhì)片段、蛋白質(zhì)表位和蛋白質(zhì)結(jié)構(gòu)域)可以通過化學(xué)修飾進(jìn)行進(jìn)一步修飾。因此,這樣的化學(xué)修飾多肽可以包含在20種天然存在的氨基酸中找到的殘基之外的化學(xué)基團(tuán)。這樣的其他化學(xué)基團(tuán)的例子包括但不限于糖基化氨基酸和磷酸化氨基酸。相比于親本多肽,多肽的化學(xué)修飾可以提供有利的特性,例如增強(qiáng)的穩(wěn)定性、增加的生物半衰期或增加的水溶性的一種或更多種。適用于本發(fā)明中可用的變體的化學(xué)修飾包括但不限于:PEG化,非糖基化親本多肽的糖基化,或親本多肽中存在的糖基化模式的修飾。適用于本發(fā)明中可用的變體的這類化學(xué)修飾可以共翻譯或翻譯后發(fā)生。
[0034]在本申請中提到的“免疫原性多肽”是含有至少一個(gè)表位的如上定義的多肽?!氨砦弧?,也稱為抗原決定簇,是由免疫系統(tǒng)識別的多肽的那部分。優(yōu)選地,該識別是通過抗體、B細(xì)胞、或T細(xì)胞對所述表位的結(jié)合而介導(dǎo)的。在該上下文中,術(shù)語“結(jié)合”優(yōu)選涉及特異性結(jié)合。優(yōu)選地,抗體對表位的特異性結(jié)合是由抗體的Fab (片段,抗原結(jié)合的)區(qū)介導(dǎo)的,B細(xì)胞的特異性結(jié)合是由B細(xì)胞受體所包含的抗體的Fab區(qū)介導(dǎo)的與,并且T細(xì)胞的特異性結(jié)合是由T細(xì)胞受體的可變(V)區(qū)介導(dǎo)的。
[0035]根據(jù)本發(fā)明的免疫原性多肽優(yōu)選來源于選自病毒、細(xì)菌和原生動(dòng)物的病原體。在具體的實(shí)施方案中,它來源于病毒,并且在一個(gè)特別有利的實(shí)施方案中,它來源于呼吸道合胞病毒(RSV)。然而,本發(fā)明的可選實(shí)施方案中,免疫原性多肽是由癌表達(dá)的多肽或多肽片段。
[0036]優(yōu)選的免疫原性多肽誘導(dǎo)B細(xì)胞應(yīng)答或者T細(xì)胞應(yīng)答或者B細(xì)胞應(yīng)答和T細(xì)胞應(yīng)口 ο
[0037]表位通常由分子的化學(xué)活性表面基團(tuán)組成,諸如氨基酸或糖側(cè)鏈,并且通常具有特定的三維結(jié)構(gòu)特征,以及特定的電荷特征。術(shù)語“表位”是指構(gòu)象以及非構(gòu)象表位。構(gòu)象和非構(gòu)象表位的區(qū)別在于,在變性溶劑存在下,前者的結(jié)合會喪失而后者不會。
[0038]如果兩個(gè)或更多個(gè)免疫原性多肽被相同的抗體、T細(xì)胞或B細(xì)胞識別,那么它們是“免疫學(xué)上相同的”。由相同的抗體、T細(xì)胞或B細(xì)胞對兩個(gè)或更多個(gè)免疫原性多肽的識別也被稱為所述抗體、T細(xì)胞或B細(xì)胞的“交叉反應(yīng)”。由相同的抗體、T細(xì)胞或B細(xì)胞對兩個(gè)或更多個(gè)免疫學(xué)上相同的多肽的識別是由于所有多肽中相同或相似表位的存在。相似表位共有足夠的結(jié)構(gòu)和/或電荷特征以被相同抗體或B細(xì)胞受體的Fab區(qū)或者被相同T細(xì)胞受體的V區(qū)結(jié)合??贵w、T細(xì)胞受體或B細(xì)胞受體的結(jié)合特征通常通過受體對所述表位的結(jié)合親和力來定義。如果具有較低親和常數(shù)的多肽的親和常數(shù)是具有較高親和常數(shù)的多肽的親和常數(shù)的至少30 %、至少40 %、至少50 %、至少60 %、至少70 %、至少80 %、至少90 %、至少95%或至少98%,那么這兩個(gè)免疫原性多肽是如本申請所理解的“免疫學(xué)上相同的”。用于確定多肽對受體的結(jié)合親和力的方法是現(xiàn)有技術(shù)中熟知的,諸如平衡透析或酶聯(lián)免疫吸附測定(ELISA)。
[0039]優(yōu)選地,兩個(gè)或更多個(gè)“免疫學(xué)上相同的”多肽包含至少一個(gè)相同的表位。如果免疫原性多肽包含相同的表位,或者如果它們具有相同的氨基酸序列,通??赡塬@得最強(qiáng)的接種效果。
[0040]如本文所使用的,其氨基酸序列與另一個(gè)多肽的氨基酸序列“基本上相同”的多肽是多肽變體,它與另一個(gè)多肽(或區(qū)段、表位或結(jié)構(gòu)域)相比的不同之處在于氨基酸序列中的一個(gè)或多個(gè)改變。蛋白質(zhì)變體所來源的多肽也被稱為親本多肽。一般而言,變體是人工構(gòu)建的,有利地是通過基因-技術(shù)手段。一般而言,親本多肽是野生型蛋白質(zhì)或野生型蛋白質(zhì)結(jié)構(gòu)域。在本發(fā)明的上下文中,親本多肽(或親本區(qū)段)也可以是兩個(gè)或更多個(gè)野生型多肽(或野生型區(qū)段)共有序列。進(jìn)一步地,本發(fā)明中可用的變體也可以來源于親本多肽的同源物、直系同源物、或旁系同源物,或者來源于人工構(gòu)建的變體,只要變體顯示出親本多肽的至少一種生物學(xué)活性。優(yōu)選地,變體所共有的親本多肽的至少一種生物活性是(或包括)至少一個(gè)表位的存在,這導(dǎo)致了如上述所定義的“免疫學(xué)上相同的”兩個(gè)多肽。
[0041]氨基酸序列中的變化可以是氨基酸交換、插入、缺失、N-末端截短、或C-末端截短、或者這些變化的任意組合,這可以發(fā)生在一個(gè)或幾個(gè)位點(diǎn)。在某些有利的實(shí)施方案中,可用于本發(fā)明的變體顯示出總數(shù)高達(dá)200(高達(dá)1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、或200)個(gè)氨基酸序列的變化(即交換、插入、缺失、N-末端截短、和/或C末端截短)。氨基酸交換可以是保守的和/或非保守的。在某些有利的實(shí)施方案中,可用于本發(fā)明的變體不同于其來源的蛋白質(zhì)或結(jié)構(gòu)域高達(dá)1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、或100個(gè)氨基酸交換,優(yōu)選保守氨基酸變化。
[0042]可選地或額外地,本文所使用的“變體”可以通過與其來源的親本多肽或親本多核苷酸一定程度的序列同一性來表征。更確切地說,與另一個(gè)多肽“基本上相同”的蛋白質(zhì)變體表現(xiàn)出與那個(gè)多肽至少80%的序列同一性。多核苷酸變體在本發(fā)明的上下文中表現(xiàn)出與其親本多核苷酸至少80%的序列同一性。優(yōu)選地,蛋白質(zhì)變體的序列同一性是連續(xù)延伸的20、30、40、45、50、60、70、80、90、100或更多個(gè)氨基酸。優(yōu)選地,多核苷酸變體的序列同一性是連續(xù)延伸的60、90、120、135、150、180、210、240、270、300或更多個(gè)核苷酸。
[0043]在本發(fā)明的優(yōu)選實(shí)施方案中,與其親本多肽“基本上相同”的多肽具有所述親本多肽的至少80%的序列同一性。更優(yōu)選地,所述多肽是免疫學(xué)上與親本多肽相同的,并具有與親本多肽至少80%的序列同一性。
[0044]術(shù)語“至少80%的序列同一性”用于整個(gè)說明書中關(guān)于多肽和多核苷酸序列的比較。這種表述是指與各個(gè)參考多肽或各個(gè)參考多核苷酸至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性。優(yōu)選地,所述多肽和參考多肽在連續(xù)延伸的20、30、40、45、50、60、70、80、90、100個(gè)或更多個(gè)氨基酸或者在參考多肽的全長上表現(xiàn)出所示的序列同一性。優(yōu)選地,所述多核苷酸和參考多核苷酸在連續(xù)延伸的60、90、120、135、150、180、210、240、270、300個(gè)或更多個(gè)核苷酸或者在參考多肽的全長上表現(xiàn)出所示的序列同一性。
[0045]多肽的變體可以額外地或可選地包含氨基酸缺失,其可以是N-末端截短、C-末端截短或內(nèi)部缺失或者這些缺失的任意組合。包含N-末端截短、C-末端截短和/或內(nèi)部缺失的這類變體在本申請的上下文中被稱為“缺失變體”或“片段”。術(shù)語“缺失變體”和“片段”在本文中可互換使用。片段可以是天然發(fā)生的(例如剪接變體),或者它可以被人工構(gòu)建,例如通過基因技術(shù)手段。片段(或缺失變體)與親本多肽相比可以具有至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、或 100 個(gè)氨基酸缺失,優(yōu)選在N-末端、在N-和C-末端、或在C-末端或者在內(nèi)部。在比較了兩個(gè)序列并且沒有指定與之相比來計(jì)算序列同一性百分比的參考序列的情況下,序列同一性的計(jì)算要參照待比較的兩個(gè)序列的更長者來進(jìn)行,如果沒有具體另外說明。如果指明了參考序列,則序列同一性是在由SEQ ID表示的參考序列的全長基礎(chǔ)上確定的,如果沒有具體另外說明。
[0046]額外地或可選地,缺失變體的產(chǎn)生可以不是由于上述各個(gè)氨基酸的結(jié)構(gòu)性缺失,而是由于這些氨基酸被抑制或者以其他方式無法實(shí)現(xiàn)其生物學(xué)功能。一般而言,這樣的功能性缺失的發(fā)生是由于氨基酸序列中的插入或交換改變了所得蛋白質(zhì)的功能特性,諸如但不限于所得蛋白質(zhì)化學(xué)性質(zhì)的改變(即疏水性氨基酸到親水性氨基酸的交換),所得蛋白質(zhì)的翻譯后修飾的改變(例如翻譯后切割或糖基化模式),或者二級或三級蛋白質(zhì)結(jié)構(gòu)的改變。優(yōu)選地,如上所述的功能性缺失是由至少一個(gè)氨基酸的插入或交換引起的,其導(dǎo)致了免疫原性多肽表位的破壞。
[0047]核苷酸和氨基酸序列的相似性,即序列同一性的百分比,可以通過序列比對來確定。這樣的比對可以用幾個(gè)本領(lǐng)域已知的算法進(jìn)行,優(yōu)選用Karlin和Altschul的數(shù)學(xué)算法(Karlin & Altschul (1993) Proc.Natl.Acad.Sc1.USA 90:5873-5877),用 hmmalign(HMMER package, http://hmmer.wustl.edu/)或者用 CLUSTAL 算法(Thompson, J.D.,Higgins, D.G.& Gibson, T.J.(1994) Nucleic Acids Res.22,4673-80),可獲得于例如 http://www.eb1.ac.uk/Tools/clustalw/ 上或者 http://www.eb1.ac.uk/Tools/clustalw2/index, html 上或者 http://npsa-pbil.1bcp.fr/cgi_bin/npsa_automat.pl?page=/NPSA/npsa_clustalw.html 上。使用的優(yōu)選參數(shù)是如它們在 http://www.eb1.ac.uk/Tools/clustalw/ 或 http://www.eb1.ac.uk/Tools/clustalw2/index, html 上所設(shè)定的默認(rèn)參數(shù)。序列同一性(序列匹配)的等級可以使用例如BLAST、BLAT或BlastZ (或BlastX)來計(jì)算。類似算法被并入到 Altschul 等(1990) J.Mol.B1l.215:403-410 的BLASTN和BLASTP程序中。BLAST核苷酸搜索是使用BLASTN程序進(jìn)行的,得分=100,字長=12,以獲得與編碼F、N或M2-1的那些核酸同源的多核苷酸序列。BLAST蛋白質(zhì)搜索是用BLASTP程序進(jìn)行的,得分=50,字長=3,以獲得與F多肽、N多肽、或M2-1多肽同源的氨基酸序列。為了獲得缺口比對(gapped alignments)用于比較目的,使用了 Altschul等(1997)Nucleic Acids Res.25:3389-3402所述的Gapped BLAST。當(dāng)使用BLAST和Gapped BLAST程序時(shí),使用各個(gè)程序的默認(rèn)參數(shù)。序列匹配分析可以通過已知的同源作圖技術(shù)進(jìn)行補(bǔ)充,如Shuffle-LAGAN (Brudno M., B1informatics 2003b, 19 Suppl 1:154-162)或者 Markov隨機(jī)場。當(dāng)序列同一性的百分比在本申請中被提到時(shí),這些百分比是相對于較長序列的全長進(jìn)行計(jì)算的,如果沒有具體另外說明的話。
[0048]本發(fā)明的多核苷酸編碼蛋白質(zhì)、肽或其變體,它們包含按照根據(jù)WIPO標(biāo)準(zhǔn)ST.25的標(biāo)準(zhǔn)單字母或三字母密碼子命名的氨基酸,除非另有說明。如果沒有另外說明,單字母或三字母密碼子是針對天然存在的L-氨基酸的,并且氨基酸序列是從相應(yīng)蛋白質(zhì)、肽或其變體的N-末端到C-末端的方向進(jìn)行說明的。
[0049]本文所使用的術(shù)語“共有”是指代表多序列比對結(jié)果的氨基酸或核苷酸序列,其中相關(guān)序列進(jìn)行了相互比較。這樣的共有序列是由每個(gè)位置上最常觀察到的氨基酸或核苷酸構(gòu)成的。在本發(fā)明的上下文中優(yōu)選的是,在獲得共有序列的序列比對中使用的序列是分離自各種不同的世界性疾病爆發(fā)中的不同病毒亞型/血清型菌株的序列。在序列比對中使用的每個(gè)個(gè)體序列被稱為特定病毒“隔離群”的序列。如果對于給定位置不能確定“共有核苷酸”或“共有氨基酸”,例如因?yàn)橹挥袃蓚€(gè)隔離群相比較,那么優(yōu)選使用每一個(gè)隔離群的氨基酸。
[0050]短語“T細(xì)胞應(yīng)答的誘導(dǎo)”是指病原體特異性的(優(yōu)選病毒特異性的