国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      奈瑟球菌蛋白質(zhì)的異源表達(dá)的制作方法

      文檔序號(hào):3575892閱讀:1166來(lái)源:國(guó)知局
      專利名稱:奈瑟球菌蛋白質(zhì)的異源表達(dá)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及蛋白質(zhì)表達(dá)的領(lǐng)域。具體說(shuō),本發(fā)明涉及奈瑟球菌(如淋病奈瑟球菌或較佳地為腦膜炎奈瑟球菌)的蛋白質(zhì)的異源表達(dá)。
      背景技術(shù)
      國(guó)際專利申請(qǐng)WO 99/24578、WO99/36544、WO99/57280和WO 00/22430公開(kāi)了腦膜炎奈瑟球菌(Neisseria meningitidis)和淋病奈瑟球菌(Neisseriagonorrhoeae)的蛋白質(zhì)。這些蛋白質(zhì)一般是以N-未端GST-融合體或C-未端His-標(biāo)記融合體在大腸桿菌中表達(dá)的(即異源表達(dá)),雖然也公開(kāi)了其它表達(dá)系統(tǒng)(包括在天然的奈瑟球菌中的表達(dá))。
      本發(fā)明的目的是提供這些蛋白質(zhì)的異源表達(dá)的其它或改進(jìn)方法。這些方法通常影響表達(dá)的水平、純化的簡(jiǎn)易程度、表達(dá)在細(xì)胞內(nèi)定位和/或表達(dá)的蛋白質(zhì)的免疫學(xué)特性。

      發(fā)明內(nèi)容
      本文的命名本文參考在WO 99/24578、WO 99/36544和WO 99/57280中公開(kāi)的2166個(gè)蛋白質(zhì)序列,并將它們編號(hào)為如下的SEQ#


      除了這種的SEQ#編號(hào)外,本文還使用了WO 99/24578、WO 99/36544和WO99/27280中的命名約定(如WO99/24578和WO 99/36544中用的‘ORF4’、‘ORF40’、‘OFR40-1’等;WO 99/57280中用的‘m919’、‘g919’和‘a(chǎn)919’等)。
      在本文中將Tettelin等[Science(2000)2871809-1815]中的從NMB0001到NMB2160的2160個(gè)蛋白質(zhì)稱為SEQ#2167-4326[參見(jiàn)WO 00/66791]。
      本文采用的術(shù)語(yǔ)“本發(fā)明的蛋白質(zhì)”指包含以下的蛋白質(zhì)(a)SEQ#1-4326中的一個(gè)序列;或(b)與SEQ#1-4326中的一個(gè)序列相同的序列;或(c)SEQ#1-4326中的一個(gè)序列的片段。
      (b)中的“序列相同性”的程度最好大于50%(如60%、70%、80%、90%、95%、99%或更大)。其包括突變體和等位基因變體[如,參見(jiàn)WO 00/66741]。相同性宜用Smith-Waterman同源性搜尋算法確定,如在MPSRCH程序(OxfordMolecular)中執(zhí)行的,采用參數(shù)“缺口罰分(gap open penalty)”為12,“缺口延伸罰分(gap extension penalty)”為1進(jìn)行缺口仿射搜索。通常,將兩種蛋白質(zhì)之間50%或更高的相同性視為功能等效的指示。
      (c)中的“片段”應(yīng)包含SEQ#1-4326中一個(gè)序列的至少n個(gè)連續(xù)的氨基酸,且根據(jù)具體的序列n為7或更高(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100或更高)。較佳地,片段包含SEQ#1-4326中一個(gè)序列的表位。優(yōu)選的片段是在WO 00/71574和WO 01/04316中公開(kāi)的那些。
      本發(fā)明優(yōu)選的蛋白質(zhì)是在腦膜炎奈瑟球菌血清群B中發(fā)現(xiàn)的。
      根據(jù)本發(fā)明使用的優(yōu)選蛋白質(zhì)是血清群B腦膜炎奈瑟球菌菌株2996或菌株394/98(新西蘭菌株)。除非特別指出,本文所述的蛋白質(zhì)是腦膜炎奈瑟球菌菌株2996的蛋白質(zhì)。但是,應(yīng)該理解通常本發(fā)明并不受菌株的限制。參考具體的蛋白質(zhì)(如‘287’、‘919’等)可以包括任何菌株的該蛋白質(zhì)。
      非融合表達(dá)在異源表達(dá)的第一步驟中,沒(méi)有使用融合配體,而是使用了天然前導(dǎo)肽(如果存在)。這通常防止了來(lái)自融合配體的任何“干擾”,并可能改變異源宿主中的細(xì)胞定位和/或翻譯后的修飾和/或折疊。
      因此,本發(fā)明提供了一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,在該方法中(a)沒(méi)有使用融合配體,并(b)使用了蛋白質(zhì)的天然前導(dǎo)肽(如果存在)。
      該方法通常包括制備表達(dá)本發(fā)明蛋白質(zhì)的載體的步驟,這樣第一個(gè)表達(dá)的氨基酸是該蛋白質(zhì)的第一個(gè)氨基酸(甲硫氨酸),且最后一個(gè)表達(dá)的氨基酸是該蛋白質(zhì)的最后一個(gè)氨基酸(即,在天然STOP密碼子前的密碼子)。
      最好將該方法用于表達(dá)使用天然前導(dǎo)肽的如下蛋白質(zhì)111、149、206、225-1、235、247-1、274、283、286、292、401、406、502-1、503、519-1、525-1、552、556、557、570、576-1、580、583、664、759、907、913、920-1、936-1、953、961、983、989、Orf4、Orf7-1、Orf9-1、Orf23、Orf25、Orf37、Orf38、Orf40、Orf40.1、Orf40.2、Orf72-1、Orf76-1、Orf85-2、Orf91、Orf97-1、Orf119、Orf143.1、NMB0109和NMB2050。本文蛋白質(zhì)命名中所用的后綴“L”指用天然前導(dǎo)肽按這種方式的表達(dá)。
      最好用該方法(不使用融合配體,且不含天然前導(dǎo)肽)表達(dá)的蛋白質(zhì)包括008、105、117-1、121-1、122-1、128-1、148、216、243、308、593、652、726、926、982、Orf83-1和Orf143-1。
      有利地,用這種方法來(lái)表達(dá)ORF25或ORF40,形成的蛋白質(zhì)誘導(dǎo)的抗細(xì)菌抗體比GST-或His融合體誘導(dǎo)得更好。
      這種方法特別適用于表達(dá)脂蛋白。
      前導(dǎo)肽的替代在異源表達(dá)的第二步驟中,用不同蛋白質(zhì)的天然前導(dǎo)肽替代本發(fā)明蛋白質(zhì)的天然前導(dǎo)肽。另外,最好不使用融合配體。在異源宿主中使用蛋白質(zhì)自身的前導(dǎo)肽通常會(huì)將蛋白質(zhì)定位于其‘天然’細(xì)胞位置,有時(shí)異源宿主不能有效地識(shí)別該前導(dǎo)序列。在這種情況下,則可改為使用已知能有效地驅(qū)動(dòng)蛋白質(zhì)靶向的前導(dǎo)肽。
      因此,本發(fā)明提供了一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其中(a)用不同蛋白質(zhì)的前導(dǎo)肽替代該蛋白質(zhì)的前導(dǎo)肽,和任選地(b)不使用融合配體。
      該方法通常包括如下步驟獲得編碼本發(fā)明蛋白質(zhì)的核酸;操作該核酸以除去編碼所述蛋白質(zhì)前導(dǎo)肽的核苷酸,并引入編碼不同蛋白質(zhì)的前導(dǎo)肽的核苷酸??梢詫⒌玫降暮怂岵迦氡磉_(dá)載體中,或作為表達(dá)載體的一部分。表達(dá)的蛋白質(zhì)包含N-未端的替代前導(dǎo)肽,其后為本發(fā)明減去前導(dǎo)肽的蛋白質(zhì)。
      前導(dǎo)肽最好為本發(fā)明另一蛋白質(zhì)(如SEQ#1-4326中的一種)的,但也可以是大腸桿菌的蛋白質(zhì)(如,OmpA前導(dǎo)肽)或胡蘿卜軟腐歐文氏菌(Erwiniacarotovora)的蛋白質(zhì)(如PelB前導(dǎo)肽)。
      特別有用的置換前導(dǎo)肽是ORF4的前導(dǎo)肽。該前導(dǎo)肽能指導(dǎo)大腸桿菌中的脂質(zhì)化(lipidation)、改善細(xì)胞定位,且其特別適用于表達(dá)蛋白質(zhì)287,919和ΔG287。961的前導(dǎo)肽和N-未端區(qū)域也特別有用。
      另一種可用的置換前導(dǎo)肽是大腸桿菌OmpA的。該前導(dǎo)肽能指導(dǎo)在大腸桿菌中的膜定位。其特別有利于ORF1的表達(dá),形成的蛋白質(zhì)比從其自身前導(dǎo)肽融合和表達(dá)的蛋白質(zhì)能誘導(dǎo)更好的抗細(xì)菌抗體。
      另一種可用的置換前導(dǎo)肽是MKKYLFSAA。它能直接分泌到培養(yǎng)基中,是非常短和有活性。這種前導(dǎo)肽的使用不限于奈瑟球菌蛋白質(zhì)的表達(dá)-可用它來(lái)指導(dǎo)任何蛋白質(zhì)(尤其是細(xì)菌蛋白質(zhì))的表達(dá)。
      前導(dǎo)肽的缺失在異源表達(dá)的第三步驟中,刪除本發(fā)明蛋白質(zhì)的天然前導(dǎo)肽。另外,不宜使用任何融合配體。
      因此,本發(fā)明提供了一種異源表達(dá)本發(fā)明蛋白的方法,其中(a)刪除蛋白質(zhì)的前導(dǎo)肽,和任選地(b)不使用任何融合配體。
      該方法通常還包括如下步驟獲得編碼本發(fā)明蛋白質(zhì)的核酸;操作該核酸以除去編碼所述蛋白質(zhì)前導(dǎo)肽的核苷酸??梢詫⒌玫降暮怂岵迦氡磉_(dá)載體中,或作為表達(dá)載體的一部分。表達(dá)的蛋白質(zhì)的第一氨基酸是成熟的天然蛋白質(zhì)的第一氨基酸。
      該方法可以提高表達(dá)的水平。例如,對(duì)蛋白質(zhì)919而言,刪除前導(dǎo)肽時(shí),大腸桿菌中的表達(dá)水平高許多。沒(méi)有前導(dǎo)肽時(shí),表達(dá)的提高是由于定位的改變。
      該方法還優(yōu)先用于919、ORF46、961、050-1、760和287的表達(dá)。
      基于區(qū)域的表達(dá)在異源表達(dá)的第四步驟中,該蛋白質(zhì)以結(jié)構(gòu)域表達(dá)。這可以與融合系統(tǒng)(如GST或His-標(biāo)記的融合)聯(lián)合使用。
      因此,本發(fā)明提供了一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其中(a)刪除蛋白質(zhì)的至少一個(gè)結(jié)構(gòu)域,和任選地(b)不使用融合配體。
      該方法通常還包括如下步驟獲得編碼本發(fā)明蛋白質(zhì)的核酸;操作該核酸以除去蛋白質(zhì)中的至少一個(gè)結(jié)構(gòu)域。可以將得到的核酸插入表達(dá)載體中,或作為表達(dá)載體的一部分。不使用融合配體,表達(dá)的蛋白質(zhì)的第一氨基酸是該蛋白質(zhì)結(jié)構(gòu)域的第一氨基酸。
      通常,用數(shù)據(jù)庫(kù)中已知的序列將蛋白質(zhì)排序,然后確定該蛋白質(zhì)中顯示彼此不同的排序模式的區(qū)域,從而將該蛋白質(zhì)分成概念上的結(jié)構(gòu)域。
      最好將該方法用于表達(dá)蛋白質(zhì)287。概念上可以將該蛋白質(zhì)分成3個(gè)結(jié)構(gòu)域,稱為A、B和C(見(jiàn)圖5)。結(jié)構(gòu)域B與IgA蛋白酶排序很接近,結(jié)構(gòu)域C與運(yùn)鐵蛋白結(jié)合的蛋白質(zhì)排序很接近,而結(jié)構(gòu)域A顯示與數(shù)據(jù)庫(kù)列不接近。WO00/66741公開(kāi)了287的多聚體形式的排序。
      一旦將蛋白質(zhì)分區(qū)成結(jié)構(gòu)域,就可將它們(a)單獨(dú)表達(dá)(b)以蛋白質(zhì)的缺失形式表達(dá)(如蛋白質(zhì)ABCD→ABD、ACD、BCD等)、或(c)重排表達(dá)(如蛋白質(zhì)ABC→ACB、CAB等)。這三種策略可與所需的融合配體聯(lián)合。
      還將ORF46分為2個(gè)結(jié)構(gòu)域-第一結(jié)構(gòu)域(氨基酸1-433)(在品種和血清群之間很好保守的)和第二結(jié)構(gòu)域(氨基酸433-608)(非很好保守的)。最好刪除第二結(jié)構(gòu)域。WO 00/66741公開(kāi)了ORF46的多聚體形式的排序。
      還將蛋白質(zhì)564分成結(jié)構(gòu)域(圖8)如具有蛋白質(zhì)961(圖12)和蛋白質(zhì)502(MC58蛋白質(zhì)的氨基酸28-167)。
      雜交蛋白質(zhì)在異源表達(dá)的第五步驟中,將本發(fā)明的2種或多種(如3、4、5、6或更多)蛋白質(zhì)表達(dá)為單雜交蛋白質(zhì)。不宜使用非奈瑟球菌融合配體(如GST或聚-His)。
      這能提供2個(gè)優(yōu)點(diǎn)。其一,該蛋白質(zhì)自身可能不穩(wěn)定或表達(dá)很弱,而加入合適的能克服該問(wèn)題的雜交配體就可協(xié)助該蛋白質(zhì)。其二,簡(jiǎn)化工業(yè)生產(chǎn)-產(chǎn)生兩種分開(kāi)的-有用的蛋白質(zhì)只需要一次表達(dá)和純化。
      因此,本發(fā)明提供了同時(shí)異源表達(dá)兩種或多種本發(fā)明蛋白質(zhì)的方法,其中所述的兩種或多種本發(fā)明的蛋白質(zhì)是融合的(即,它們是以單多肽鏈翻譯的)。
      該方法通常還包括如下步驟獲得編碼本發(fā)明第一種蛋白質(zhì)的第一種核酸;制得編碼本發(fā)明第二種蛋白質(zhì)的第二種核酸;連接第一和第二核酸。將得到的核酸插入表達(dá)載體中,或作為表達(dá)載體的一部分。
      較佳地,本發(fā)明在雜交蛋白質(zhì)中構(gòu)成的蛋白質(zhì)是來(lái)源于同一菌株的。
      可直接連接雜交體中的融合蛋白;或通過(guò)接頭肽連接,如通過(guò)聚-甘氨酸接頭(即,Gn,其中n=3、4、5、6、7、8、9、10或更高);或通過(guò)協(xié)助克隆的短肽序列連接。顯然,不宜將ΔG蛋白質(zhì)連接于聚-甘氨酸接頭的C-未端。
      融合的蛋白質(zhì)可能缺少天然前導(dǎo)肽,或可能包含N-未端融合配體的前導(dǎo)肽序列。
      這種方法適用于表達(dá)蛋白質(zhì)orf1,orf25,orf40,Orf46/46.1,orf83,233,287,564,687,741,907,919,953,961和983。
      由式NH2-A-B-COOH在下表中以‘X’表示的42個(gè)雜交體是優(yōu)選的

      因此,優(yōu)選的以雜交體表達(dá)的蛋白質(zhì)是ORF46.1,287,741,919,961和983。它們可以全長(zhǎng)形式或聚-甘氨酸缺失(ΔG)形式使用(如ΔG-287、ΔGTbp2、ΔG741、ΔG983等),或以截短形式使用(如Δ1-287、Δ2-287等),或以結(jié)構(gòu)域缺失的形式使用(如287B、287C、287BC、ORF461-433、ORF46433-608、ORF46、961c等)。
      特別優(yōu)選的是(a)含919和287的雜交蛋白;(b)含953和287的雜交蛋白;(c)含287和ORF46.1的雜交蛋白;(d)含ORF1和ORF46.1的雜交蛋白;(e)含919和ORF46.1的雜交蛋白;(f)含ORF46.1和919的雜交蛋白;(g)含ORF46.1、287和919的雜交蛋白;(h)含919和519的雜交蛋白;和(i)含ORF97和225的雜交蛋白。圖14顯示了其它實(shí)施例。
      當(dāng)使用287時(shí),其優(yōu)先位于雜交體的C-未端;如果在N-未端使用它,則優(yōu)先使用287的ΔG形式(如與ORF46.1、919、953或961雜交的雜交體的N-未端)。
      當(dāng)使用287時(shí),其優(yōu)先為菌株2996或菌株394/98的。
      當(dāng)使用961時(shí),其宜在N-端??墒褂?61的結(jié)構(gòu)域形式。
      WO 99/66741公開(kāi)了ORF46、287、919和953的多聚體形式排序。本發(fā)明可以使用這些多聚體形式中的任一形式。
      溫度在異源表達(dá)的第六個(gè)步驟中,低溫表達(dá)本發(fā)明的蛋白質(zhì)。
      表達(dá)的奈瑟球菌蛋白(如919)可能對(duì)大腸桿菌有毒性,這可以通過(guò)在不顯現(xiàn)蛋白質(zhì)毒性的溫度時(shí)表達(dá)該蛋白來(lái)避免。
      因此,本發(fā)明提供了異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其中在不顯現(xiàn)該蛋白質(zhì)毒性的溫度時(shí)進(jìn)行本發(fā)明蛋白質(zhì)的表達(dá)。
      優(yōu)選的溫度為約30℃。這特別適用于919的表達(dá)。
      突變?nèi)缟纤?,表達(dá)的奈瑟球菌蛋白質(zhì)對(duì)大腸桿菌可能有毒性的。通過(guò)突變?cè)摰鞍滓越档突蛳拘詠?lái)避免這種毒性。特別是,可以使用降低或消除毒性酶活性的突變,較佳地使用定位誘變。
      因此在異源表達(dá)的第七個(gè)步驟中,表達(dá)的蛋白質(zhì)是突變的,以減少或消除毒性。
      因此,本發(fā)明提供了異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其中蛋白質(zhì)是突變的以降低或消除毒性。
      較佳地,該方法適用于蛋白質(zhì)907、919或922的表達(dá)。在907中的優(yōu)選突變是在Glu-117(如Glu→Gly);在919中的優(yōu)選突變是在Glu-255(如Glu→Gly)和/或在Glu-323(如Glu→Gly);在922中的優(yōu)選突變是在Glu-164(如Glu→Gly)、Ser-213(如Ser→Gly)和/或Asn-348(如Asn→Gly)。
      其它載體在異源表達(dá)的第八個(gè)步驟中,用其它載體表達(dá)蛋白質(zhì)。這可以改進(jìn)表達(dá)收率,例如,或使用已驗(yàn)證用于GMP的質(zhì)粒。
      因此,本發(fā)明提供了一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其中使用其它載體。所述的其它載體最好為pSM214,其無(wú)融合配體??梢园虿话瑹o(wú)前導(dǎo)肽。
      這種方法特別適用于蛋白質(zhì)953。用從pSM214表達(dá)的953天然前導(dǎo)肽對(duì)953的表達(dá)和定位比從pET載體的好得多。
      也可將pSM214與以下一起使用ΔG287、Δ2-287,Δ3-287,Δ4-287,Orf46.1,961L,961,961(MC58),961c-L,919,953和ΔG287-Orf46.1。
      其它適合的載體是pET-24b(Novagen;用卡那霉素抗性),而且也不使用融合配體。pET-24b宜與以下一起使用ΔG287K,Δ2-287K,Δ3-287K,Δ4-287K,Orf46.1,Orf46A-K,961-K(MC58),961a-K,961b-K,961c-K,961c-L-K,961d-K,ΔG287-919-K,ΔG287-Orf46.1-K和ΔG287-961-K。
      多聚體形式在異源表達(dá)的第九步中,表達(dá)或純化蛋白質(zhì)使其接受一種特定的多聚體形式。
      這種方法尤其適用于蛋白質(zhì)953。953的一種特定的多聚體形式(單體形式)的純化使蛋白質(zhì)比其它形式(二體形式)具有更大的殺菌活性。
      可將蛋白質(zhì)287和919以二體的形式純化。
      可將蛋白質(zhì)961以180kDa寡聚形式(如四體)純化。
      脂質(zhì)化在異源表達(dá)的第十步中,將蛋白質(zhì)以脂質(zhì)化的蛋白質(zhì)表達(dá)。
      因此,本發(fā)明提供了一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其中蛋白質(zhì)是以脂化的蛋白質(zhì)表達(dá)的。
      這尤其適用于919、287、ORF4、406、576-1和ORF25的表達(dá)。WO 00/66741公開(kāi)了919、287和ORF4的多聚體形式。
      該方法通常包括使用合適的前導(dǎo)肽而不用N-未端融合配體。
      C-未端缺失在異源表達(dá)的第十一步中,使本發(fā)明蛋白質(zhì)的C-未端突變。另外,不宜使用融合配體。
      因此,本發(fā)明提供了異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其中(a)使該蛋白質(zhì)的C-未端區(qū)域突變,并任選地(b)不使用融合配體。
      這種方法通常包括如下步驟獲得編碼本發(fā)明蛋白質(zhì)的核酸;操作所述的核酸從而使編碼蛋白質(zhì)C-未端部分的核苷酸突變。將得到的核酸插入表達(dá)載體中,或作為表達(dá)載體的一部分。表達(dá)的蛋白質(zhì)的第一氨基酸為成熟天然蛋白質(zhì)的第一氨基酸。
      這種突變可以是取代、插入或較佳地為缺失。
      這種方法能增加表達(dá)水平,尤其是蛋白質(zhì)730、ORF29和ORF46的表達(dá)水平。對(duì)蛋白質(zhì)730而言,可以刪除約65-214氨基酸的C-未端區(qū)域;對(duì)ORF46而言,可以刪除約175氨基酸的C-未端區(qū)域;對(duì)ORF29而言,可以刪除C-未端以留下約230-370N-未端氨基酸。
      前導(dǎo)肽突變?cè)诋愒幢磉_(dá)的第十二步中,使蛋白質(zhì)的前導(dǎo)肽突變。這尤其適用于蛋白質(zhì)919的表達(dá)。
      因此,本發(fā)明提供了一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其中使蛋白質(zhì)前導(dǎo)肽突變。
      這種方法通常包括如下步驟獲得編碼本發(fā)明蛋白質(zhì)的核酸;并操作所述的核酸使前導(dǎo)肽中的核苷酸突變。可將得到的核酸插入表達(dá)載體中,或作為表達(dá)載體的一部分。
      聚-甘氨酸缺失在異源表達(dá)的第十三步中,使野生型序列的聚-甘氨酸段突變。以此提高蛋白質(zhì)的表達(dá)。
      聚-甘氨酸段包括序列(Gly)n,其中n≥4(如5、6、7、8、9或更多)。讓該段突變以破壞或除去(Gly)n。這可以通過(guò)刪除(如,CGGGGS→CGGGS、CGGS、CGS或CS),通過(guò)替代(如CGGGGS→CGXGGS、CGXXGS→CGXGXS等),和/或缺失(如CGGGGS→CGGXGGS、CGXGGGS等)。
      這種方法不局限于奈瑟球菌蛋白-其可用于任何蛋白質(zhì)(尤其是細(xì)菌蛋白)以提高異源表達(dá)。然而,對(duì)奈瑟球菌蛋白質(zhì)而言,它特別適用于表達(dá)287、741、983和Tbp2。WO 00/66741公開(kāi)了287的多聚體形式的排序。
      因此,本發(fā)明提供了一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其中(a)使蛋白質(zhì)中的聚-甘氨酸段突變。
      這種方法通常包括如下步驟獲得編碼本發(fā)明蛋白質(zhì)的核酸;和操作所述的核酸使編碼蛋白質(zhì)序列中的聚-甘氨酸段的核苷酸突變??蓪⒌玫降暮怂岵迦氡磉_(dá)載體中,或作為表達(dá)載體的一部分。
      相反,可用相反的方法(即引入聚-甘氨酸段)抑制或減少特定異源蛋白質(zhì)的表達(dá)。
      異源宿主雖然本發(fā)明蛋白質(zhì)的表達(dá)可以在天然宿主(即天然表達(dá)蛋白質(zhì)的生物)中發(fā)生,但本發(fā)明用異源宿主。異源宿主可以是原核細(xì)胞或真核細(xì)胞。最好是大腸桿菌,其它合適的宿主包括枯草桿菌、霍亂弧菌、傷寒沙門(mén)氏菌(Salmonellatyphi)、鼠傷寒沙門(mén)氏菌(Salmonenna typhimurium)、腦膜炎奈瑟球菌、淋病奈瑟球菌、乳糖奈瑟球菌(Neisseria lactamica)、灰色奈瑟球菌(Neisseriacinerea)、分枝桿菌(如結(jié)核分枝桿菌(M.tuberculosis)、酵母等。
      載體等如上所述的方法,本發(fā)明提供了(a)用于這些方法的核酸和載體;(b)含所述載體的宿主細(xì)胞;(c)可用這些方法表達(dá)的或可表達(dá)的蛋白質(zhì);(d)包含這些蛋白質(zhì)的組合物,其可能適用于疫苗、或例如診斷劑或免疫原性組合物;(e)用作藥物(如疫苗)或診斷劑的組合物;(f)這些組合物用于生產(chǎn)(1)治療或預(yù)防奈瑟球菌引起的感染的藥物(2)檢測(cè)奈瑟球菌或由奈瑟球菌引起的抗體存在與否的診斷劑,和/或(3)能產(chǎn)生抗奈瑟球菌抗體的藥物;和(g)治療患者的方法,其包括對(duì)該患者施用治療有效量的這些組合物。
      序列本發(fā)明還提供了具有以下實(shí)施例中所列出的任何序列的蛋白質(zhì)或核酸。本發(fā)明還提供了具有與這些序列是序列相同性的的蛋白質(zhì)和核酸。如上所述,“序列相同性”的程度最好大于50%(如60%、70%、80%、90%、95%、99%或更高)。
      另外,本發(fā)明還提供了能與實(shí)施例中公開(kāi)的核酸雜交的核酸,較佳地在“高度嚴(yán)謹(jǐn)”條件下(如在65℃,0.1×SSC,0.5%SDS溶液中)。
      本發(fā)明還提供了編碼本發(fā)明蛋白質(zhì)的核酸。
      還應(yīng)理解,本發(fā)明提供了核酸,所述核酸含有與上述序列互補(bǔ)的序列(例如用于反義或探測(cè)目的)。
      當(dāng)然,本發(fā)明的核酸可以用多種方法制備(例如,化學(xué)合成、從基因組或cDNA文庫(kù)、或從生物體本身制得等),并可以是各種形式(例如單鏈、雙鏈、載體、探針等)。
      此外,術(shù)語(yǔ)“核酸”包括DNA和RNA,以及它們的類似物,如含有修飾骨架的那些類似物,還包括肽核酸(PNA)等。


      圖1和2顯示用于以異源前導(dǎo)肽表達(dá)蛋白質(zhì)的構(gòu)建物。
      圖3顯示ORF1的表達(dá)數(shù)據(jù),圖4顯示蛋白質(zhì)961的類似數(shù)據(jù)。
      圖5顯示蛋白質(zhì)287的結(jié)構(gòu)域,圖6和7顯示結(jié)構(gòu)域A中的缺失。
      圖8顯示蛋白質(zhì)564的結(jié)構(gòu)域。
      圖9顯示由919前導(dǎo)肽驅(qū)動(dòng)的PhoC報(bào)道基因,圖10顯示用前導(dǎo)肽的突變體得到的結(jié)果。
      圖11顯示蛋白質(zhì)730的插入突變體(A730-C1;B730-C2)。
      圖12顯示蛋白質(zhì)961的結(jié)構(gòu)域。
      圖13顯示ΔG蛋白質(zhì)的SDS-PAGE。點(diǎn)顯示主要重組產(chǎn)物。
      圖14顯示本發(fā)明的26雜交蛋白。
      具體實(shí)施例方式
      實(shí)施例1-919及其前導(dǎo)肽腦膜炎奈瑟球菌(血清群B,菌株2996)的蛋白質(zhì)919具有如下序列1MKKYLFRAALYGIAAAILAACQSKSIQTFP QPDTSVINGP DRPVGIPDPA51 GTTVGGGGAV YTVVPHLSLP HWAAQDFAKS LQSFRLGCAN LKNRQGWQDV101 CAQAFQTPVH SFQAKQFFER YFTPWQVAGN GSLAGTVTGY YEPVLKGDDR151 RTAQARFPIY GIPDDFISVP LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT201 HTADLSRFPI TARTTAIKGR FEGSRFLPYH TRNQINGGAL DGKAPILGYA251 EDPVELFFMH IQGSGRLKTP SGKYIRIGYA DKNEHPYVSI GRYMADKGYL301 KLGQTSMQGI KAYMRQNPQR LAEVLGQNPS YIFFRELAGS SNDGPVGALG351 TPLMGEYAGA VDRHYITLGA PLFVATAHPV TRKALNRLIM AQDTGSAIKG401 AVRVDYFWGY GDEAGELAGK QKTTGYVWQL LPNGMKPEYR P*在前導(dǎo)肽下加下劃線。
      可以在WO 00/66741的圖7和18中發(fā)現(xiàn)其它菌株的919序列。
      WO 99/57280的實(shí)施例2公開(kāi)了在大腸桿菌中作為His-融合體的蛋白質(zhì)919的表達(dá)。該蛋白質(zhì)是優(yōu)良的外露表面免疫原。
      將另三種表達(dá)方法用于9191)919沒(méi)有其前導(dǎo)肽(且沒(méi)有成熟的N-未端半胱氨酸)且無(wú)任何融合配體(′919未標(biāo)記的)1 QSKSIQTFP QPDTSVINGP DRPVGIPDPA GTTVGGGGAV YTVVPHLSLP50 HWAAQDFAKS LQSFRLGCAN LKNRQGWQDV CAQAFQTPVH SFQAKQFFER100 YFTPWQVAGN GSLAGTVTGY YEPVLKGDDR RTAQARFPIY GIPDDFISVP150 LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT HTADLSRFPI TARTTAIKGR200 FEGSRFLPYH TRNQINGGAL DGKAPLLGYA EDPVKLFFMH IQGSGRLKTP250 SGKYIRIGYA DKNEHPYVSI GRYMADKGYL KLGQTSMQGI KAYMRQNPQR300 LAEVLGQNPS YIFFRELAGS SNDGPVGALG TPLMGEYAGA VDRHYITLGA350 PLFVATAHPV TRKALNRLIM AQDTGSAIKG AVRVDYFWGY GDEAGELAGK400 QKTTGYVWQL LPNGMKPEYR P*通過(guò)設(shè)計(jì)從預(yù)定的前導(dǎo)序列的5′-端擴(kuò)增引物下游除去前導(dǎo)肽和半胱氨酸。
      2)包含其前導(dǎo)肽但無(wú)任何融合配體的919(‘919L′);和3)包含ORF4的前導(dǎo)肽(MKTFFKTLSAAALALILAA)的919(‘919Orf4′)。
      1MKTFFKTLSAAALALILAACQSKSIQTFP QPGTSVINGP DRPVGIPDPA50 GTTVGGGGAV YTVVPHLSLP HWAAQDFAKS LQSFRLGCAN LKNRQGWQDV100 CAQAFQTPVH SFQAKQFFER YFTPWQVAGN GSLAGTVTGY YEPVLKGDDR150 RTAQARFPIY GIPDDFISVP LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT200 HTADLSRFPI TARTTAIKGR FEGSRFLPYH TRNQINGGAL DGKAPILGYA250 EDPVELFFMH IQGSGRLKTP SGKYIRIGYA DKNEHPYVSI GRYMADKGYL300 KLGQTSMQGI KSYMRQNPQR LAEVLGQNPS YIFFRELAGS SNDGPVGALG350 TPLMGEYAGA VDPHYITLGA PLFVATAHPV TRKALNRLIM AQDTGSAIKG400 AVRVDYFWGY GDEAGELAGK QKTTGYVWQL LPNGMKPEYR P*為了制備此構(gòu)建物,編碼ORF4前導(dǎo)肽的整個(gè)序列作為尾部包括于5′-引物(引物919L或f4For)。用編碼ORF4前導(dǎo)序列的序列中的雙核苷酸改變產(chǎn)生NheI限制酶切位點(diǎn)(無(wú)氨基酸改變),使不同的基因融合于ORF4前導(dǎo)肽序列。在所有的3′-端引物序列中包括終止密碼子。
      蛋白質(zhì)的所有三種形式都被表達(dá)且可以純化。
      如所示的[3H]-棕櫚酸標(biāo)記的摻入,將‘919L′和‘919Orf4′表達(dá)產(chǎn)物脂化。919未標(biāo)記的不摻入3H標(biāo)記,且是在細(xì)胞內(nèi)定位的。
      與919L相比,919Lorf4更易純化。將其純化并用于免疫接種小鼠。得到的血清在FACS和ELISA測(cè)試以及殺菌試驗(yàn)中產(chǎn)生極佳的結(jié)果。該脂蛋白顯示位于外膜。
      919未標(biāo)記的具有極佳的ELISA滴定度和高血清殺菌活性。FACS證明了其細(xì)胞表明的定位。
      實(shí)施例2-919和表達(dá)溫度于37℃,表達(dá)919LOrf4蛋白質(zhì)的大腸桿菌的生長(zhǎng)導(dǎo)致細(xì)菌裂解。為了克服這個(gè)問(wèn)題,重組細(xì)菌在30℃生長(zhǎng)。防止了裂解,而不會(huì)制止表達(dá)。
      實(shí)施例3-907、919和922的突變假設(shè)蛋白質(zhì)907、919和922是胞壁質(zhì)水解酶和具體說(shuō)是裂解性轉(zhuǎn)糖基酶。胞壁質(zhì)裂解酶位于外膜,且參與肽聚糖的降解。
      因此測(cè)試純化的蛋白質(zhì)919未標(biāo)記的、919Lorf4、919-His(即,包含C-未端His-標(biāo)記)和922His的胞壁質(zhì)水解酶活性[Ursinus&amp;Holtje(1994)J.Bact.176338-343]。使用兩種不同的試驗(yàn),一種用于確定不難溶性胞壁質(zhì)小囊降解為可溶性胞壁肽的,另一種則是測(cè)定聚(MurNAc-GlcNAc)n>30聚糖鏈的斷裂。
      第一種試驗(yàn)使用由內(nèi)消旋-2,6-二氨基-3,4,5-[3H]庚二酸放射標(biāo)記的胞壁質(zhì)小囊作為底物。于37℃,在總體積為100μl(包括10mM Tris-馬來(lái)酸鹽(pH 5.5)、10mM MgC12、0.2%v/v Triton X-100和[3H]A2pm標(biāo)記的胞壁質(zhì)小囊(約10000cpm))中培養(yǎng)酶(總共3-10μg)45分鐘。將試驗(yàn)混合物置于冰上15分鐘,在100μl 1%w/v N-乙?;?N,N,N-三甲銨上15分鐘,從10000g離心15分鐘沉淀物質(zhì)。用液體閃爍計(jì)數(shù)測(cè)定上清液中的放射活性。用大腸桿菌可溶性裂解性轉(zhuǎn)糖基酶Slt70作為試驗(yàn)的陽(yáng)性對(duì)照;陰性對(duì)照包括不含酶的上述試驗(yàn)溶液。
      在第一個(gè)試驗(yàn)中,除919-His以外所有蛋白質(zhì)都產(chǎn)生陽(yáng)性結(jié)果。
      第二種試驗(yàn)監(jiān)測(cè)聚(MurNAc-GlcNAc)聚糖鏈的水解。于37℃,在10mMTris-馬來(lái)酸鹽(pH 5.5)、10mM MgCl2和0.2%v/v Triton X-100中,將N-乙?;?D-1-[3H]葡糖胺標(biāo)記的純化的鏈聚(MurNAc-GlcNAc)n>30與3μg 919L一起培育。煮沸5分鐘終止反應(yīng),加入10μl 20%v/v磷酸將樣品的pH調(diào)節(jié)至約3.5。如Harz等[Anal.Biochem.(1990)190120-128]所述,在Nucleosil 300 C18柱上通過(guò)反相HPLC將底物與產(chǎn)物分開(kāi)。在本試驗(yàn)中將大腸桿菌裂解性轉(zhuǎn)糖基酶Mlt A作為陽(yáng)性對(duì)照。無(wú)酶進(jìn)行的試驗(yàn)作為陰性對(duì)照。
      當(dāng)用HPLC將無(wú)水雙糖亞基從寡糖中分開(kāi)時(shí),用這種試驗(yàn)證明了919LOrf4水解分離的聚糖鏈的能力。
      選擇蛋白質(zhì)919Lorf4用于動(dòng)力學(xué)分析。在試驗(yàn)緩沖液中添加的0.2%v/vTriton X-100使919Lorf4的活性提高3.7倍。Triton X-100的存在對(duì)919未標(biāo)記的活性沒(méi)有影響。在范圍為5.0-8.0的Tris-馬來(lái)酸鹽緩沖液中測(cè)定了pH對(duì)酶活性的影響。反應(yīng)的最適pH為5.5。在18℃到42℃的溫度范圍中,在37℃觀察到最大活性。在終濃度為10mM的各種離子的存在下進(jìn)行反應(yīng),以測(cè)定各種離子對(duì)胞壁質(zhì)水解酶活性的影響。發(fā)現(xiàn)存在Mg2+時(shí)活性最高,其刺激活性2.1倍。Mn2+和Ca2+還刺激酶活性至類似程度,而添加Ni2+和EDTA沒(méi)有明顯作用。相反,F(xiàn)e2+和Zn2+顯著抑制酶活性。
      如Glauner[Anal.Biochem.(1988)172451-464]所述,用反相HPLC分析由消化未標(biāo)記的大腸桿菌胞壁質(zhì)小囊得到的反應(yīng)產(chǎn)物的結(jié)構(gòu)。用由溶菌酶Cellosyl消化的胞壁質(zhì)小囊來(lái)校準(zhǔn)和標(biāo)定Hypersil ODS柱。主要的反應(yīng)產(chǎn)物是1,6-脫水雙糖四和三肽,表明1,6-無(wú)水胞壁質(zhì)酸(muraminic)分子內(nèi)鍵的形成。
      這些結(jié)果從實(shí)驗(yàn)角度表明,919是胞壁質(zhì)水解酶,尤其是裂解性轉(zhuǎn)糖基酶家族的成員。另外,922-His裂解胞壁質(zhì)小囊的能力表明該蛋白質(zhì)也是裂解性轉(zhuǎn)糖基酶。
      這種活性可有助于解釋919在大腸桿菌內(nèi)表達(dá)時(shí)的毒性作用。
      為了消除酶促活性,使用合理的誘變。907、919和922顯示對(duì)大腸桿菌的三種膜-結(jié)合的、脂化的胞壁質(zhì)裂解性轉(zhuǎn)糖基酶的相當(dāng)?shù)偷耐葱?19(441aa)與大腸桿菌MLTA(P46885)為27.3%相同,超過(guò)440aa重疊;922(369aa)與大腸桿菌MLTB(P41052)為38.7%相同,超過(guò)310aa重疊;和907-2(207aa)與大腸桿菌MLTC(P52066)為26.8%相同,超過(guò)149aa重疊。
      907-2還與大腸桿菌MLTD(P23913)和Slt70(P03810)具有同源性,它是一種位于周質(zhì)間隙中的可溶性裂解性轉(zhuǎn)糖基酶。在919、922和907-2之間沒(méi)有測(cè)出明顯的序列同源性,且在相應(yīng)的MLTA、MLTB和MLTC蛋白質(zhì)之間的情況也同樣如此。
      Slt70([1QTEA;1QTEB;Thunnissen等(1995)Biochemistry 3412729-12737]和Slt35[1LTM;1QUS;1QUT;van Asselt等(1999)Structure Fold Des 71167-80](40kDa MLTB的可溶形式)可有晶體結(jié)構(gòu)。
      已鑒定了Slt70和MLTB的催化殘基一種(谷氨酸)。
      對(duì)Slt70而言,誘變研究表明即使用谷氨酰胺保守性地替代催化Glu505也會(huì)導(dǎo)致酶活性的完全喪失。雖然Slt35與Slt70沒(méi)有明顯的序列相似性,但它們的催化區(qū)域卻顯示出令人驚訝的相似性。MLTB中相應(yīng)的催化殘基是Glu162。
      另一個(gè)被認(rèn)為在酶裂縫的正確折疊中起重要作用的殘基是谷氨酸的保守良好的甘氨酸(Gly)下游。最近,Terrak等[Mol.Microbiol.(1999)34350-64]提出存在另一種重要的殘基,它是位于催化性谷氨酸約70-75殘基下游的芳族氨基酸。
      進(jìn)行Slt70與907-2的序列對(duì)比和MLTB與922的序列對(duì)比,以鑒定MenB抗原中相應(yīng)的催化性殘基。
      催化區(qū)域的兩個(gè)序列對(duì)比報(bào)道如下
      907-2/Slt7090 100 110_120130 140907-2.pep ERRRLLVNIQYESSRAG--LDTQIVLGLIEVESAFRQYAISGVGARGLMQVMPFWKNYIG|| | | :: :| : : :::: : |||: : | | | | | |||:|| ::
      slty_ecoliERFPLAYNDLFKRYTSGKEIPQSYAMAIARQESAWNPKVKSPVGASGLMQIMPGTATHTV480 490 500▲ 510 520 530GLU505922/MLTB150 160 _ 170 180 190 200922.pep VAQKYGVPAKLIVAVIGIETNYGKNTGSFRVADALATLGFDTPRRAGFFQKELVELLKLA: | |||| |:||::||:|| : | : | : |: ||||||:|:||||| :|: || :| :|mltb_ecoliAWQVYGVPPEIIVGIIGVETRWGRVMGKTRILDALATLSFNYPRRAEYFSGELETFLLMA150 160 ▲170 180 190 200GLU162210 220 230 240 250 260922.pep KEEGGDVFAFKGSYAGAMGMPQFMPSSYRKWAVDYDGDGHRDIWGNVGDVAASVANTMKQ::| | : :|||:|||||: |||||| | :::|||::|||| ::| | |: :|||||:|mltb_ecoliRDEQDDPLNLKGSFAGAMGYGQFMPSSYKQYAVDFSGDGHINLWDPV-DAIGSVANYFKA210 220 230 240 250260從這些對(duì)比得出907-2中相應(yīng)的催化谷氨酸鹽是Glu117,而922中為G1u164。這兩種抗原都有下游甘氨酸(在酶裂縫(粗體)折疊中起結(jié)構(gòu)作用),922在約70aa下游(粗體)具有保守的芳族殘基。
      對(duì)蛋白質(zhì)919而言,對(duì)大腸桿菌的同源MLTA沒(méi)有3D結(jié)構(gòu),且對(duì)可能的催化性殘基的了解為零。然而,通過(guò)與MLTA的序列對(duì)比,預(yù)計(jì)919中的三個(gè)氨基酸為催化殘基919/MLTA240 250_ 260 □□ 270 □ 280 290919.pep ALDGKAPILGYAEDPVELFFMHIQGSGRLKTPSGKYIRI-GYADKNEHPYVSIGRYMADK||: | ||:|::: :: |:| :|||| : :|: : : :|| || | | |||: : |:
      mlta_ecoli.p ALSDKY-ILAYSNSLMDNFIMDVQGSGYIDFGDGSPLNFFSYAGKNGHAYRSIGKVLIDR170 180 190 200 210300 310 320_330□ 340 ◇350 ◇919.pep GYLKLGQTSMQGIKSYMRQNPQ-RLAEVLGQNPSYIFFRELAGSSNDGPV-GALGTPLMG| :| : |||:|: : : : : :: |:| ||||::||: : :|| || ::||:|mlta_ecolip GEVKKEDMSMQAIRHWGETHSEAEVRELLEQNPSFVFFKPQSFA----PVKGASAVPLVG220 230 240 250 260 270360 _ ○ 380390 400 ◇◇410919.pep EYAGAVDRHYITLGAPLFVATAHPVTRKALN-----RLIMAQDTGSAIKGAVRVDYFWGY: : | || | |: |:: :: : ||::| |:|:|||| : | : |mlta_ecoli.p RASVASDRSIIPPGTTLLAEVPLLDNNGKFNGQYELRLMVALDVGGAIKGQ-HFDIYQGI280 290 300 310 330330420 ○919.pep GDEAGELAGKQKTTGYVWQLLP| |||: || : | || |mlta_ecoli.p GPEAGHRAGWYNHYGRVWVLKT340 350用符號(hào)_顯示三個(gè)可能的催化殘基1)Glu 225(MLTA中的Asp),其后為三個(gè)保守性甘氨酸(Gly263、Gly265和Gly272)和三個(gè)保守性芳族殘基(位于約75-77殘基下游)。這些下游殘基以□顯示。
      2)Glu323(在MLTA中保守的),其后為2個(gè)保守的甘氨酸(Gly347和Gly355)和兩個(gè)保守的芳族氨基酸(位于84-85殘基下游)(Tyr406或Phe407)。用◇顯示這些下游殘基。
      3)Asp362(替代預(yù)計(jì)的Glu),其后為一個(gè)甘氨酸(Gly369)和一個(gè)保守的芳族殘基(Trp428)。用o顯示這些下游殘基。
      WO00/66741中公開(kāi)了919的多聚體形式的排序。
      基于對(duì)催化殘基的預(yù)測(cè),已產(chǎn)生了919的三種突變體和907的一種突變體,各包含單個(gè)氨基取代。用基于PCR的SDM,以甘氨酸殘基替代919蛋白質(zhì)的255位和323位的谷氨酸、362位的天冬氨酸和907蛋白質(zhì)的117位的谷氨酸。為了達(dá)到該目的,設(shè)計(jì)了包含從Glu或Asp變?yōu)镚ly密碼子的內(nèi)部引物

      有下劃線的核苷酸密碼是甘氨酸的,突變的核苷酸為小寫(xiě)字母。
      為了產(chǎn)生919-E255、919-E323和919-E362突變體,用20ng pET-LOrf4 DNA作為模板和以下的引物對(duì)進(jìn)行PCR1)Orf4L正向/919-E255反向2)919-E255正向/919L反向3)Orf4L正向/919-E323反向4)919-E323正向/919L反向5)Orf4L正向/919-D362反向6)919-D362正向/919L反向用PCR1-2、3-4或5-6的產(chǎn)物作為模板和正向引物以及反向引物(“Orf4L正向”和“919L反向”),進(jìn)行第二輪PCR。
      對(duì)于突變體907-E117,用200ng 2996菌株的染色體DNA作為模板和以下的引物對(duì)進(jìn)行PCR7)907L正向/907-E117反向8)907-E117正向/907L反向用PCR7和8的產(chǎn)物作為模板和寡“907L正向”和“907L反向”作為引物,進(jìn)行第二輪PCR。
      用以下的標(biāo)準(zhǔn)方法加工包含各突變的PCR片段,用NdeI和XhoI限制酶消化并克隆入pET-21b+載體中。用序列分析驗(yàn)證各突變的存在情況。
      類似地進(jìn)行907中的Glu117向Gly的突變,以及922中的殘基Glu164、Ser213和Asn348的突變。
      919的E255G的突變體顯示活性低降50%;E323G突變體顯示活性降低70%;E362G突變體顯示活性沒(méi)有降低。
      實(shí)施例4-多聚體形式將287-GST、919未標(biāo)記的和953-His進(jìn)行凝膠過(guò)濾以分析四級(jí)結(jié)構(gòu)或制備性目的。用FPLC Superose 12(H/R 10/30)或Superdex 75凝膠過(guò)濾柱(Pharmacia)計(jì)算天然蛋白質(zhì)的分子量。用于287、919和953層析的緩沖液分別是50mMTris-HCl(pH 8.0)、20mM Bicine(pH 8.5)和50mM Bicine(pH 8.0)。
      另外,各緩沖液包含150-200mM NaCl和10%v/v甘油。用適合的緩沖液透析蛋白質(zhì)并以200μl體積施用。以0.5-2.0ml/分鐘的流速進(jìn)行凝膠過(guò)濾,在280nm監(jiān)測(cè)洗脫物。收集組分,用SDS-PAGE分析。用藍(lán)色葡聚糖2000和分子量標(biāo)準(zhǔn)核糖核酸酶A、胰凝乳蛋白酶A卵清蛋白、白蛋白(Pharmacia)校準(zhǔn)柱。由標(biāo)準(zhǔn)的Kav與log Mr的校準(zhǔn)曲線計(jì)算樣品的分子量。凝膠過(guò)濾之前,用凝血酶消化287-GST以切割GST組成成分。
      287、919和953-His的估計(jì)分子量分別為73kDa、47kDa和43kDa。這些結(jié)果表明919是單體而287和953主要是天然二聚的。對(duì)953-His而言,在凝膠過(guò)濾的過(guò)程中觀察到兩個(gè)高峰。主峰(80%)代表953的二聚形式,而次峰(20%)則為單體預(yù)計(jì)的大小。發(fā)現(xiàn)953單體形式比二聚形式具有更大的殺菌活性。
      實(shí)施例5-pSM214和pET-24b載體由pET載體和pSM214表達(dá)了包含天然前導(dǎo)肽而無(wú)融合配體的953蛋白質(zhì)[Velati Bellini等,(1991)J.Biotechnol.18,177-192]。
      用大腸桿菌MM294-1菌株作為宿主,以全長(zhǎng)基因?qū)?53序列克隆入pSM214中。為了實(shí)現(xiàn)此目的,用如下引物通過(guò)PCR擴(kuò)增953基因的整個(gè)DNA序列(從ATG到終止密碼子)953L for/2 CCGGAATTCTTATGAAAAAAATCATCTTCGCCGCEcoRI953L rev/2 GCCCAAGCTTTTATTGTTTGGCTGCCTCGATT HindIII其分別包含EcoRI和HindIII限制酶切位點(diǎn)。用EcoRI和HindIII消化擴(kuò)增的片段,并將其與用這兩種酶消化的pSM214載體接連。將連接的質(zhì)粒轉(zhuǎn)化入大腸桿菌MM294-1細(xì)胞中(通過(guò)37℃,在冰上培育65分鐘),并將細(xì)菌細(xì)胞涂布于包含20μg/ml氯霉素的LB瓊脂上。
      于37℃,在包含20μg/ml氯霉素的4ml LB肉湯中使重組菌落生長(zhǎng)過(guò)夜;將細(xì)菌細(xì)胞離心,提取質(zhì)粒DNA,并用EcoRI和HindIII限制進(jìn)行分析。為了分析重組集落表達(dá)蛋白質(zhì)的能力,將它們?cè)诎?0μg/ml氯霉素的LB肉湯中培育,并使它們?cè)?7℃生長(zhǎng)16小時(shí)。離心細(xì)菌細(xì)胞,懸浮于PBS中。用SDS-PAGE和考馬斯藍(lán)染色分析蛋白質(zhì)的表達(dá)。
      pSM214質(zhì)粒的表達(dá)水平出人意料的高。
      用于將序列克隆入pSM-214載體中的寡(核苷酸)如下

      如對(duì)953L所述,操作、克隆和表達(dá)這些序列。
      對(duì)pET-24載體而言,如以下對(duì)pET21所述,克隆這些序列并在pET-24中表達(dá)這些蛋白質(zhì)。pET2具有與pET-21相同的序列,但其具有卡那霉素抗性盒替代氨芐青霉素盒。
      用于將序列克隆入pET-24b中的寡核苷酸是

      *將該引物用作所有287形式的反向引物。
      §與ΔG278 K反向引物聯(lián)用的正向引物。
      實(shí)施例6-ORF1及其前導(dǎo)肽預(yù)計(jì)腦膜炎奈瑟球菌(血清群B,菌株MC58)的ORF1是用作外膜或分泌的蛋白質(zhì)。其具有如下序列1MKTTDKRTTETHRKAPKTGRIRFSPAYLAICLSFGILPQAWAGHTYFGIN
      51 YQYYRDFAEN KGKFAVGAKD IEVYNKKGEL VGKSMTKAPM IDFSVVSRNG101 VAALVGDQYI VSVAHNGGYN NVDFGAEGRN PDQHRFTYKI VKRNNYKAGT151 KGHPYGGDYH MPRLHKFVTD AEPVEMTSYM DGRKYIDQNN YPDRVRIGAG201 RQYWRSDEDE PNNRESSYHI ASAYSWLVGG NTFAQNGSGG GTVNLGSEKI251 KHSPYGFLPT GGSFGDSGSP MFIYDAQKQK WLINGVLQTG NPYIGKSNGF301 QLVRKDWFYD EIFAGDTHSV FYEPRQNGKY SFNDDNNGTG KINAKHEHNS351 LPNRLKTRTV QLFNVSLSET AREPVYHAAG GVNSYRPRLN NGENISFIDE401 GKGELILTSN INQGAGGLYF QGDFTVSPEN NETWQGAGVH ISEDSTVTWK451 VNGVANDRLS KIGKGTLHVQ AKGENQGSIS VGDGTVILDQ QADDKGKKQA501 FSEIGLVSGR GTVQLNADNQ FNPDKLYFGF RGGRLDLNGH SLSFHRIQNT551 DEGAMIVNHN QDKESTVTIT GNKDIATTGN NNSLDSKKEI AYNGWFGEKD601 TTKTNGRLNL VYQPAAEDRT LLLSGGTNLN GNITQTNGKL FFSGRPTPHA651 YNHLNDHWSQ KEGIPRGEIV WDNDWINRTF KAENFQIKGG QAVVSRNVAK701 VKGDWHLSNH AQAVFGVAPH QSHTICTRSD WTGLTNCVEK TITDDKVIAS751 LTKTDISGNV DLADHAHLNL TGLATLNGNL SANGDTRYTV SHNATQNGNL801 SLVGNAQATF NQATLNGNTS ASGNASFNLS DHAVQNGSLT LSGNAKANVS851 HSALNGNVSL ADKAVFHFES SRFTGQISGG KDTALHLKDS EWTLPSGTEL901 GNLNLDNATI TLNSAYRHDA AGAQTGSATD APRRRSRRSR RSLLSVTPPT951 SVESRFNTLT VNGKLNGQGT FRFMSELFGY RSDKLKLAES SEGTYTLAVN1001 NTGNEPASLE QLTVVEGKDN KPLSKNLNFT LQNEHVDAGA WRYQLIRKDG1051 EFRLHNHPVK EQELSDKLGK AEAKKQAEKN AQSLDALIAA GRDAVEKTES1101 VAERARQAGG ENVGIMQAEE EKKRVQADKD TALAKQREAE TRPATTAFPR1151 ARRARRDLPQ LQPQPQPQPQ RDLISRYANS GLSEFSATLN SVFAVQDELD1201 RVFAEDRRNA VWTSGIRDTK HYRSQDFRAY RQQTDLRQIG MQKNLGSGRV1251 GILFSHNRTE NTFDDGIGNS ARLAHGAVFG QYGIDRFYIG ISAGAGFSSG1301 SLSDGIGGKI RRRVLHYGIQ ARYRAGFGGF GIEPHIQATR YFVQKADYRY1351 ENVNIATPGL AFNRYRAGIK ADYSFKPAQH ISITPYLSLS YTDAASGKVR1401 TRVNTAVLAQ DFGTKRSAEW GVNAEIKGFT LSLHAAAAKG PQLEAQHSAG1451 IKLYRW*前導(dǎo)肽是加下劃線的。
      WO99/55873公開(kāi)了ORF1的多聚體形式。
      已將三種表達(dá)策略用于ORF11)使用His標(biāo)記的ORF1,按照WO99/24578(ORF1-His);2)包含自身前導(dǎo)肽但無(wú)任何融合配體的ORF1(‘ORF1L′);和3)包含大腸桿菌OmpA的前導(dǎo)肽(MKKTAIAIAVALAGFATVAQA)的ORF1(‘Orf1LOmpA′)MKKTAIAIAVALAGFATVAQAASAGHTYFGINYQYYRDFAENKGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSVVSRNGVAALVGDQYIVSVAHNGGYNNVDFGAEGRNPDQHRFTYKIVDRNNYKAGTKGHPYGGDYHMPRLHKFVTDAEPVEMTSYMDGRKYIDQNNYPDRVRIGAGRQYWRSDEDKPNNRKSSYHIASAYSWLVGGNTFAQNGSGGGTVNLGSEKIKHSPYGFLPTGGSFGDSGSPMFIYDAQKQKWLINGVLQTGNPYIGKSNGFQLVRKDWFYDEIFAGDTHSVFYEPRQNGKYSFNDDNNGTGKINAKHEHNSLPNRLKTRTVQLFNVSLSETAREPVYHAAGGVNSYRPRLNNGENISFIDEGKGELILTSNINQGAGGLYFQGDFTVSPENNETWQGAGVHISEDSTVTWKVNGVANDRLSKIGKGTLHVQAKGENQGSISVGDGTVILDQQADDKGKKQAFSEIGLVSGRGTVQLNADNQFNPDKLYFGFRGGRLDLNGHSLSFHRIQNTREGAMIVNHNQDKESTVTITGNKDIATTGNNNSLDSKKEIAYNGWFGEKDTTKTNGRLNLVYQPAAEDRTLLLSGGTNLNGNITQTNQKLFFSGRPTPHAYNHLNDHWSQKEGIPRGEIVWDNDWINRTFKAENFQIKGGQAVVSRNVAKVKGDWHLSNHAQAVFGVAPHQSHTICTRSDWTGLTNCVEKTITDDKVIASLTKTDISGNVDLADHAHLNLTGLATLNGNLSANGDTRYTVSHNATQNGNLSLVGNAQATFNQATLNGNTSASGNASFNLSDHAVQNGSLTLSGNAKANVSHSALNGNVSLADKAVFHFESSRFTGQISGGKDTALHLKDSEWTLPSGTELGNLNLDNATITLNSAYRHDAAGAQTGSATDAPRRRSRRSRRSLLSVTPPTSVESRFNTLTVNGKLNGQGTFRFMSELFGYRSDKLKLAESSEGTYTLAVNNTGNEPASLEQLTVVEGKDNKPLSENLNFTLQNEHVDAGAWRYQLIRKDGEFRLHNPVKEQELSDKLGKAEAKKQAEKDNAQSLDALIAAGRDAVEKTESVAEPARQAGGENVGIMQAEEEKKRVQADKDTALAKQREAETRPATTAFPRARRARRDLPQLQPQPQPQPQRDLISRYANSGLSEFSATLNSVFAVQDELDRVFAEDRRNAVWTSGIRDTKHYRSQDFRAYRQQTDLRQIGMQKNLGSGRVGILFSHNRTENTFDDGIGNSARLAHGAVFGQYGIDRFYIGISAGAGFSSGSLSDGIGGKIRRRVLHYGIQARYRAGFGGFGIEPHIGATRYFVQKADYRYENVNIATPGLAFNRYRAGIKADYSFKPAQHISITPYLSLSYTDAASGKVRTRVNTAVLAQDFGKTRSAEWGVNAEIKGFTLSLHAAAAKGPQLEAQHSAGIKLGYRW*為了制備此構(gòu)建物,用NheI和XhoI限制酶消化克隆pET911LOmpA(見(jiàn)如下),并純化相應(yīng)于攜帶OmpA前導(dǎo)序列的載體的片段(pETLOmpA)。用寡核苷酸ORF1-正向和ORF1-反向(分別包括NheI和XhoI限制性酶切位點(diǎn))擴(kuò)增編碼成熟蛋白質(zhì)的ORF1基因,用NheI和XhoI消化并連接到純化的pETOmpA片段(參見(jiàn)圖1)。由NheI位點(diǎn)引入另一AS二肽。
      該蛋白質(zhì)的所有三種形式都被表達(dá)??杉兓疕is-標(biāo)記的蛋白質(zhì),并確證其為表面外露的且可能分泌的(參見(jiàn)圖3)。用這種蛋白質(zhì)免疫接種小鼠,得到的血清在殺菌試驗(yàn)中有極佳的結(jié)果。
      將ORF1LOmpA作為完整膜純化,并固定于內(nèi)膜和外膜。出人意料地,針對(duì)ORF1LOmpA產(chǎn)生的血清比那些針對(duì)His-標(biāo)記的蛋白質(zhì)產(chǎn)生的血清顯示更好的ELISA和抗殺菌特性。
      在其定位的地方將ORFI1作為外膜純化。
      實(shí)施例7-蛋白質(zhì)911及其前導(dǎo)肽腦膜炎奈瑟球菌(血清群B,菌株MC58)的蛋白質(zhì)911具有如下序列1MKKNILEFWV GLFVLIGAAA VAFLAFRVAG GAAFGGSDKT YAVYADFGDI51 GGLKVNAPVK SAGVLVGRVG AIGLDPKSYQ ARVRLDLDGK YQFSSDVSAC101 ILTSDLLGEQ YIGLQQGGDT ENLAAGDTIS VTSSAMVLEN LIGKFMTSFA151 EKNADGGNAE KAAE*前導(dǎo)肽是加下劃線的。
      將三種表達(dá)策略用于9111)包含其自身前導(dǎo)肽但無(wú)任何融合配體的911(‘911L′);2)包含大腸桿菌OmpA的前導(dǎo)肽的911(‘911LOmpA′)。
      為了制備該構(gòu)建物,在5′-引物中包括編碼OmpA前導(dǎo)肽的完整序列作為尾(引物911OmpA正向)。在編碼OmpA前導(dǎo)肽的序列和編碼預(yù)計(jì)的成熟蛋白質(zhì)的911基因之間插入NheI限制酶切位點(diǎn)(插入一個(gè)氨基酸,一個(gè)絲氨酸),使該構(gòu)建物用于克隆不同的基因下游OmpA前導(dǎo)肽序列。
      3)包含胡蘿卜軟腐歐文氏菌(Erwinia carotovora)PelB的前導(dǎo)肽(MKYLLPTAAAGLLLAAQPAMA)的911(‘911LpelB)。
      為了制備該構(gòu)建物,將5′-端PCR引物設(shè)計(jì)為前導(dǎo)序列的下游,并包括NcoI限制酶切位點(diǎn),從而使911直接融合于PelB前導(dǎo)序列;3′-端引物包括終止密碼子。所用的表達(dá)載體是pET22b+(Novagen),其攜帶編碼PelB前導(dǎo)肽的序列。NcoI位點(diǎn)在PelB序列后引入另一甲硫氨酸。
      表達(dá)該蛋白質(zhì)的所有三種形式。用911L的ELISA滴定度最高,919LOmpA也有良好的結(jié)果。
      實(shí)施例8-ORF46腦膜炎奈瑟球菌(血清群B,菌株2996)的完整ORF46蛋白質(zhì)具有如下序列1LGISRKISLILSILAVCLPMHAHASDLAND SFIRQVLDRQ HFEPDGKYHL51 FGSRGELAER SGHIGLGKIQ SHQLGNIMIQ QAAIKGNIGY IVRFSDHGHE101 VHSPFDNHAS HSDSDEAGSP VDGFSLYRIH WDGYEHHPAD GYDGPQGGGY151 PAPKGARDIY SYDIKGVAQN IRLNLTDNRS TGQRLADRFH NAGSMLTQGV201 GDGFKRATRY SPELDRSGNA AEAFNGTADI VKNIIGAAGE IVGAGDAVQG251 ISEGSNIAVM HGLGLLSTEN KMARINDLAD MAQLKDYAAA AIRDWAVQNP301 NAAQGIEAVS NIFMAAIPIK GIGAVRGKYG LGGITAHPIK RSQMGAIALP351 KGKSAVSDNF ADAAYAKYPS PYHSRNIRSN LEQRYGKENI TSSTVPPSNG401 KNVKLADQRH PKTGVPFDGK GFPNFEKHVK YDTKLDIQEL SGGGIPKAKP451 VSDAKPRWEV DRKLNKLTTR EQVEKNVQEI RNGNKNSNFS QHAQLEREIN501 KLKSADEINF ADGMGKFTDS MNDKAFSRLV KSVKENGFTN PVVEYVEING551 KAYIVRGNNR VFAAEYLGRI HELKFKKVDF PVPNTSWKNP TDVLNESGNV601 KRPRYRSK*前導(dǎo)肽是加下劃線的。
      在WO00/66741中發(fā)現(xiàn)有其它菌株的ORF46序列。
      已將三種表達(dá)策略用于ORF461)包含自身前導(dǎo)肽但無(wú)任何融合配體的ORF46(‘ORF46-2L′);2)不含自身前導(dǎo)肽且無(wú)任何融合配體的ORF46(‘ORF46-2′),通過(guò)從預(yù)計(jì)的前導(dǎo)序列設(shè)計(jì)5′-端擴(kuò)增引物下游除去前導(dǎo)肽1 SDLANDSFIR QVLDRQHFEP DGKYHLFGSR GELAERSGHI GLGKIQSHQL51 GNLMIQQAAI KGNIGYIVRF SDHGHEVHSP FDNHASHSDS DEAGSPVDGF101 SLYRIHWDGY EHHPADGYDG PQGGGYPAPK GARDIYSYDI KGVAQNIRLN151 LTKNRSTGQR LADRFHNAGS MLTQGVGDGF KRATRYSPEL DRSGNAAEAF201 NGTADIVKNI IGAAGEIVGA GDAVQGISEG SNIAVMHGLG LLSTENKMAR251 INDLADMAQL KDYAAAAIRD WAVQNPNAAQ GIEAVSNIFM AAIPIKGIGA301 VRGKYGLGGI TAHPIKRSQM GAIALPKGKS AVSDNFADAA YAKYPSPYHS351 RNIRSNLEQR YGKENITSST VPPSNGKNVK LADQRHPKTG VPFDGKGFPN401 FEKHVKYDTK LDIQELSGGG IPKAKPVSDA KPRWEVDRKL NKLTTREQVE451 KNVQEIRNGN KNSNFSQHAQ LEREINKLKS ADEINFADGM GKFTDSMNDK501 AFSRLVKSVK ENGFTNPVVE YVEINGKAYI VRGNNRVFAA EYLGRIHELK551 FKKVDFPVPN TSWKNPTDVL NESGNVKRPR YRSK*3)作為一種截短的蛋白質(zhì)的ORF46,由前433氨基酸構(gòu)成(‘ORF46.1L′),通過(guò)設(shè)計(jì)PCR引物以擴(kuò)增相應(yīng)于aa1-433的部分序列構(gòu)建。
      在3′-端引物序列中包括終止密碼子。
      對(duì)大腸桿菌,ORF46-2L以很低的水平表達(dá)。除去它的前導(dǎo)肽(ORF46-2)也不能解決這個(gè)問(wèn)題。然而,截短的ORF46.1L形式(前433個(gè)氨基酸,在血清群和品種中很好保守的)能很好地表達(dá),且在ELISA和殺菌試驗(yàn)中得到極佳的結(jié)果。
      也將ORF46.1用作雜交蛋白的基礎(chǔ)。將其與287、919和ORF1融合。通常雜交蛋白是不溶的,但能得到一些良好的ELISA和殺菌(針對(duì)同源2996菌株)結(jié)果。

      為了比較,構(gòu)建ORF46.1、287(作為GST融合或以ΔG287形式)的‘三′雜交體,針對(duì)各種菌株(包括同源2996菌株)與三種抗原的簡(jiǎn)單混合物測(cè)試。FCA用作佐劑

      另外,雜交體顯示相等的或更佳的免疫活性。
      針對(duì)各種異源菌株,將兩種蛋白質(zhì)(菌株2996)的雜交體與單種蛋白質(zhì)進(jìn)行比較

      雜交體再一次顯示相等的或更佳的免疫活性。
      實(shí)施例9-蛋白質(zhì)961腦膜炎奈瑟球菌(血清群B,菌株MC58)的完整961蛋白質(zhì)具有如下序列1MSMKHFPAKV LTTAILATFC SGALAATSDD DVKKAATVAI VAAYRNGQEI51 NGFKAGETIY DIGEDGTITQ KDATAADVEA DDFKGLGLKK VVTNLTKTVN101 ENKQNVDAKV KAAESEIEKL TTKLADTDAA LADTDAALDE TTNALNKLGE151 NITTFAEETK TNIVKIDEKL EAVADTVDKH AEAFNDIADS LDETNTKADE201 AVKTANEAKQ TAEETKQNVD AKVKAAETAA GKAEAAAGTA NTAADKAEAV251 AAKVTDIKAD IATNKADIAK NSARIDSLDK NVANLRKETR QGLAEQAALS301 GLFQPYNVGR FNVTAAVGGY KSESAVAIGT GFRFTENFAA KAGVAVGTSS351 GSSAAYHVGV NYEW*前導(dǎo)肽是加下劃線的。
      對(duì)961的表達(dá)采用如下三種方法1)使用GST融合體的961,按照WO99/57280(‘GST961′);2)包含其自身前導(dǎo)肽但無(wú)融合配體的961(‘961L′);和3)無(wú)自身前導(dǎo)肽且不含任何融合配體的961(‘961未標(biāo)記的′),通過(guò)設(shè)計(jì)從預(yù)計(jì)的前導(dǎo)序列的5′-端PCR引物下游除去前導(dǎo)肽。
      該蛋白質(zhì)的所有三種形式都被表達(dá)。可以純化GST-融合蛋白,其抗體表明961是表面外露的(圖4)。用該蛋白質(zhì)免疫接種小鼠,得到的血清在殺菌試驗(yàn)中有極佳的結(jié)果。也可純化961L,它產(chǎn)生非常高的ELISA滴定度。
      蛋白質(zhì)961似乎是為相變量。另外,在腦膜炎奈瑟球菌的所有菌株中都沒(méi)有它。
      實(shí)施例10-蛋白質(zhì)287腦膜炎奈瑟球菌(血清群B,菌株2996)的蛋白質(zhì)287具有如下序列1MFERSVIAMACIFALSACGG GGGGSPDVKS ADTLSKPAAP VVAEKETEVK51 EDAPQAGSQG QGAPSTQGSQ DMAAVSAENT GNGGAATTDK PKNEDEGPQN101 DMPQNSAESA NQTGNNQPAD SSDSAPASNP APANGGSNFG RVDLANGVLI151 DGPSQNITLT HCKGDSCNGD NLLDEEAPSK SEFENLNESE RLEKYKKDGK201 SDKFTNLVAT AVQANGTNKY VIIYKDKSAS SSSARFRRSA RSRRSLPAEM251 PLIPVNQADT LIVDGEAVSL TGHSGNIFAP EGNNYRYLTG AEKLPGGSYA301 LRVQGEPAKG EMLAGTAVYN GEVLHFHTEN GRPYPTRGRF AAKVDFGSKS351 VDGIIDSGDD LHMGTQKFKA AIDGNGFKGT WTENGGGDVS GRFYGPAGEE401 VAGKYSYRPT DAEKGGFGVF AGKKEQD*前導(dǎo)肽是加下劃線顯示的。
      在WO00/66741的圖5和15中可以發(fā)現(xiàn)其它菌株的287序列。
      WO99/57280的實(shí)施例9公開(kāi)了在大腸桿菌中作為GST-融合蛋白的287的表達(dá)。
      已使用許多其它方法在大腸桿菌中表達(dá)287,包括1)作為His-標(biāo)記的融合蛋白的287(‘287-His′);2)包含其自身前導(dǎo)肽但無(wú)任何融合配體的287(‘287L′);3)包含ORF4前導(dǎo)肽且無(wú)任何融合配體的287(‘287LOrf4′);和4)不含其自身前導(dǎo)肽且無(wú)任何融合配體的287(‘287未標(biāo)記的′)1 CGGGGGGSPD VKSADTLSKP AAPVVAEKET EVKEDAPQAG SQGQGAPSTQ51 GSQDMAAVSA ENTGNGGAAT TDKPKNEDEG PQNDMPQNSA ESANQTGNNQ101 PADSSDSAPA SNPAPANGGS NFGRVDLANG VLIDGPSQNI TLTHCKGDSC151 NGDNLLDEEA PSKSEFENLN FSERIEKYKK DGKSDKFTNL VATAVQANGT201 NKYVIIYKDK GASSSSARFR RSARSRRSLP AEMPLIPVNQ ADTLIVDGEA251 VSLTGHSGNI FAPEGNYRYL TYGAEKLPGG SYALRVQGEP AKGEMLAGTA301 VYNGEVLHFH TENGRPYPTR GRFAAKVDFG SKSVDGIIDS GDDLHMGTQK351 FKAAIDGNGF KGTVTENGGG DVSGRFYGPA GEEVAGKYSY RPTDAKKGGF401 GVFAGKKEQD *所有這些蛋白質(zhì)都被表達(dá)和純化。
      證明‘287L′和‘287LOrf4′是脂蛋白。
      如圖2所示,通過(guò)用NheI和XhoI消化919LOrf4構(gòu)建‘287LOrf4′。在5′-端引物(287LOrf正向)(融合于287編碼序列)添加編碼遺漏氨基酸的DNA序列(作為尾),恢復(fù)完整的ORF4前導(dǎo)肽。用寡核苷酸287LOrf4正向和反向(分別包含NheI和XhoI位點(diǎn))擴(kuò)增編碼成熟蛋白質(zhì)的287基因,用NheI和XhoI消化并連接于純化的pETOrf4片段。
      實(shí)施例11-包含/不含天然前導(dǎo)肽的其它非融合蛋白質(zhì)一種類似的方法適用于大腸桿菌表達(dá)WO99/24578、WO99/36544和WO99/57280的其它蛋白質(zhì)。
      以下是未用融合配體表達(dá)的008、105、117-1、121-1、122-1、128-1、148、216、243、308、593、652、726、982和Orf143-1。FACS表明蛋白質(zhì)117-1是表面外露的,且產(chǎn)生高ELISA滴定度。
      以下是由天然前導(dǎo)肽但無(wú)融合配體表達(dá)的111、149、206、225-1、235、247-1、274、283、286、292、401、406、502-1、503、519-1、525-1、552、556、557、570、576-1、580、583、664、759、907、913、920-1、926、936-1、953、961、983、989、Orf4、Orf7-1、Orf9-1、Orf23、Orf25、Orf37、Orf38、Orf40、Orf40.1、Orf40.2、Orf72-1、Orf76-1、Orf85-2、Orf91、Orf97-1、Orf119、Orf143.1。這些蛋白質(zhì)都有后綴‘L′。
      用或不用其前導(dǎo)肽表達(dá)His標(biāo)記的蛋白質(zhì)760。信號(hào)肽的缺失大大地增加了表達(dá)水平。使用2M尿素(用于增溶)最易純化該蛋白質(zhì)。
      用其自身的信號(hào)肽能很好地表達(dá)His-標(biāo)記的蛋白質(zhì)264,且30kDa蛋白質(zhì)得到陽(yáng)性Western印跡結(jié)果。
      所有蛋白質(zhì)都成功地表達(dá)。
      驗(yàn)證了593、121-1、128-1、593、726和982在細(xì)胞質(zhì)中的定位。
      驗(yàn)證了920-1L、953L、ORF9-1L、ORF85-2L、ORF97-1L、570L、580L和664L在周質(zhì)中的定位。
      驗(yàn)證了ORF40L在外膜中的定位,和008和519-1L在內(nèi)膜中的定位。驗(yàn)證了ORF25L、ORF4L、406L、576-1L都是在膜中定位的。
      發(fā)現(xiàn)蛋白質(zhì)206不是脂蛋白。
      用其天然前導(dǎo)肽但無(wú)融合配體表達(dá)的ORF25和ORF40,以及未用其天然前導(dǎo)肽和融合配體表達(dá)的蛋白質(zhì)593,都產(chǎn)生良好的抗殺菌血清。令人驚訝地,未用融合配體而使用其前導(dǎo)肽(即‘ORF25L′和‘ORF40L′)表達(dá)的ORF25和ORF40形式比融合蛋白在殺菌試驗(yàn)中產(chǎn)生更好的結(jié)果。
      將蛋白質(zhì)920L和953L進(jìn)行N-未端測(cè)序,結(jié)果分別為HRVWVETAH和ATYKVDEYHANARFAF。此測(cè)序結(jié)果表明切除了預(yù)計(jì)的前導(dǎo)肽,且當(dāng)與周質(zhì)定位聯(lián)合時(shí)表明當(dāng)由它們的天然前導(dǎo)肽表達(dá)時(shí),大腸桿菌正確地加工和定位這些蛋白質(zhì)。
      定位于內(nèi)膜的蛋白質(zhì)519.1L的N-未端序列是MEFFIILLA,表明未切除前導(dǎo)序列。因此,它可作為未切割的前導(dǎo)序列和跨膜錨(以與淋病奈瑟球菌的PBP1的前導(dǎo)肽類似的方式)[Ropp&amp;Nicholas(1997)J.Bact.1792783-2787.]。事實(shí)上,N-未端區(qū)域表現(xiàn)出強(qiáng)疏水性,且由Tmpred.程序預(yù)計(jì)為跨膜的。
      實(shí)施例12-脂蛋白用Kraft等[J.Bact.(1998)1803441-3447.]的方法驗(yàn)證重組脂蛋白中棕櫚酸鹽的摻入。于37℃,在20ml LB/Amp(100μg/ml)的液體培養(yǎng)基中使攜帶感興趣質(zhì)粒的單集落生長(zhǎng)過(guò)夜。在5.0ml含有5μC/ml[3H]棕櫚酸鹽(Amersham)的新鮮培養(yǎng)基LB/Amp培養(yǎng)基中,將培養(yǎng)物稀釋至OD550為0.1。當(dāng)培養(yǎng)物的OD550達(dá)到0.4-0.8時(shí),用IPTG(終濃度為1.0mM)誘導(dǎo)重組脂蛋白1小時(shí)。用臺(tái)式離心機(jī)以2700g離心15分鐘收獲細(xì)菌,用1.0ml冷PBS洗滌2次。將細(xì)胞懸浮于120μl 20mMTris-HCl(pH 8.0)、1mM EDTA、1.0%w/v SDS中,并煮沸10分鐘裂解。以13000g離心10分鐘后,收集上清液,加入1.2ml冷丙酮沉淀蛋白質(zhì),在-20℃靜置1小時(shí)。以13000g離心10分鐘沉淀蛋白質(zhì),重懸浮于20-50μl(以培養(yǎng)物終O.D值校準(zhǔn)負(fù)載量計(jì)算的)1.0%w/v SDS。將15μl等份與5μl SDS-PAGE樣品緩沖液煮沸,用SDS-PAGE分析。電泳凝膠在1O%v/v乙酸中固定1小時(shí)后,在擴(kuò)增溶液(Amersham)中浸泡30分鐘。加熱真空干燥凝膠,-80℃暴露在Hyperfilm(Kodak)中過(guò)夜。
      在以下蛋白質(zhì)中發(fā)現(xiàn)[3H]棕櫚酸鹽標(biāo)記的摻入(表明脂化)Orf4L、Orf25L、287L、287LOrf4、406L、576L、926L、919L和919LOrf4。
      實(shí)施例13-287中的結(jié)構(gòu)域根據(jù)287中不同的結(jié)構(gòu)域與隸屬不同功能類別的蛋白質(zhì)的同源性,如圖5所示將其分為3個(gè)“結(jié)構(gòu)域”。第二個(gè)結(jié)構(gòu)顯示與IgA蛋白酶同源,第三結(jié)構(gòu)域顯示與結(jié)合轉(zhuǎn)鐵蛋白的蛋白質(zhì)同源。
      在腦膜炎奈瑟球菌之間這三個(gè)“結(jié)構(gòu)域”各表現(xiàn)出不同程度的序列保守性-結(jié)構(gòu)域C為98%相同,結(jié)構(gòu)域A為83%相同,而結(jié)構(gòu)域B僅為71%相同。注意到菌株MC58中的蛋白質(zhì)287比菌株2996的長(zhǎng)61個(gè)氨基酸。圖7顯示了這兩個(gè)序列的序列對(duì)比,WO00/66741(圖5和15)公開(kāi)了各種菌株的序列對(duì)比。
      將這三個(gè)結(jié)構(gòu)域分別表達(dá)成C-未端His-標(biāo)記的蛋白質(zhì)。用以下構(gòu)建物對(duì)MC58和2996菌株進(jìn)行處理287a-MC58(aa1-202),287b-MC58(aa203-288),287c-MC58(aa311-488)。
      287a-2996(aa1-139),287b-2996(aa140-225),287c-2996(aa250-427)。
      為了制備這些構(gòu)建物,除去3′-端引物序列中的終止密碼子序列。5′引物包括NheI限制酶切位點(diǎn),3′引物包括作為尾部的XhoI,從而用NdeI-XhoI、NheI-XhoI或NdeI-HindIII限制酶切位點(diǎn)指導(dǎo)將各擴(kuò)增片段克隆入表達(dá)載體pET21b+中。
      所有六種構(gòu)建物都可以表達(dá),但287b-MC8需要變性和重折疊以增溶。
      以下描述了結(jié)構(gòu)域A的缺失(‘Δ4 287-His′)。
      用菌株2996的各種結(jié)構(gòu)域還獲得了針對(duì)同源和異源MenB菌株以及MenA(F6124菌株)和MenC(BZ133菌株)的免疫學(xué)數(shù)據(jù)(血清殺菌試驗(yàn))

      用菌株MC58的結(jié)構(gòu)域獲得以下結(jié)果

      實(shí)施例14-287中的缺失與表達(dá)單一結(jié)構(gòu)域一樣,通過(guò)在第一結(jié)構(gòu)域中的漸進(jìn)缺失還表達(dá)了287(以C-未端His-標(biāo)記的蛋白質(zhì))。使用菌株2996的蛋白質(zhì)287的四缺失突變體(圖6)1)‘287-His′,由氨基酸18-427構(gòu)成(即缺失前導(dǎo)肽);2)‘Δ1 287-His′,由氨基酸26-427構(gòu)成;3)‘Δ2 287-His′,由氨基酸70-427構(gòu)成;4)‘Δ3 287-His′,由氨基酸107-427構(gòu)成;和5)‘Δ4 287-His′,由氨基酸140-427構(gòu)成(=287-bc)。
      還為菌株MC58制備了‘Δ4′蛋白質(zhì)(‘Δ4 287MC58-His′,aa203-488)。
      如上所述,用與287a/b/c相同的方法制備這些構(gòu)建物。
      可以表達(dá)所有六種構(gòu)建物,并可純化蛋白質(zhì)。然而287-His的表達(dá)很差。
      當(dāng)除去C-未端His-標(biāo)記物時(shí),表達(dá)也很高。
      用缺失突變體也獲得了針對(duì)同源(2996)和異源MenB菌株以及MenA(F6124菌株)和MenC(BZ133菌株)的免疫學(xué)數(shù)據(jù)(血清殺菌試驗(yàn))

      用菌株MC58的序列觀察到Δ4缺失的相同高的活性。同樣顯示極佳的表達(dá)特性,因此突變體是免疫學(xué)相等的或更佳的。
      實(shí)施例15-聚甘氨酸缺失前實(shí)施例的‘Δ1 287-His′構(gòu)建物與287-His和′287未標(biāo)記的′的不同僅在于短的N-未端缺失(GGGGGGS)。然而使用一種以Nhe克隆位點(diǎn)中存在的密碼子替代缺失的絲氨酸的表達(dá)載體,缺失僅為(Gly)6。因此,該(Gly)6序列的缺失顯示對(duì)蛋白質(zhì)表達(dá)有明顯影響。
      將缺失多達(dá)GGGGGG的N-未端氨基酸的蛋白質(zhì)稱為‘ΔG 287′。在菌株MC58中,其序列(前導(dǎo)序列加下劃線)為

      ΔG2871MFKRSVIAMA CIFALSACGG GGGGSPDVKS ADTLSKPAAP VVSEKETEAK51 EDAPQAGSQG AGQPSAQGSQ DMAAVSEENT GNGGAVTADN PKNEDEVAQN101 DMPQNAAGTD SSTPNHTPDP NMLAGNMENQ ATDAGESSQP ANQPDMANAA151 DGMQGDDPSA GGQNAGNTAA QGANQAGNNQ AAGSSDPIPA SNPAPANGGS201 NFGRVDLANG VLIDGPSQNI TLTHCKGDSC SGNNFLDEEV QLKSEFERLS251 DADKISNYKK DGKNDKFVGL VADSVQMKGI NQYIIFYKPK PTSFARFRRS301 ARSRRSLPAE MPLIPVNQAD TLIVDGEAVS LTGHSGNIFA PEGNYRYLTY351 GAEKLPGGSY ALRVQGEPAK GEMLAGAAVY NGEVLHFHTE NGRPYPTRGR401 FAAKVDFGSK SVDGIIDSGD DLHMGTQKFK AAIDGNGFKG TWTENGSGDV451 SGKFYGPAGE EVAGKYSYRP TDAEKGGFGV FAGKKEQD*與′287-His′或‘287未標(biāo)記的′相比,有或無(wú)His-標(biāo)記的ΔG287(分別為‘Δ287-His′和′ΔG287K′)以非常好的水平表達(dá)。
      以基因變異性數(shù)據(jù)為基礎(chǔ),許多MenB菌株(尤其是菌株2996、MC58、1000和BZ232)的ΔG287-His的變體在大腸桿菌中表達(dá)。結(jié)果也非常好。
      假設(shè)聚-Gly缺失可能是一種改進(jìn)表達(dá)的常規(guī)策略。因此鑒定了含有類似(Gly)n基序(接近N-未端,絲氨酸的下游)的其它MenB脂蛋白,稱為T(mén)bp2(NMB0460)、741(NMB1870)和983(NMB1969)
      TEP2 ΔGTbp21MNNPLVNQAA MVLPVFLLSACLGGGGSFDL DSVDTEAPRP APKYQDVFSE5 KPQAQKDQGG YGFAMRLKRR NWYPQAKEDE VKLDESDWEA TGLPDEPKEL101 PKRQKSVIEK VETDSDNNIY SSPYLKPSNH QNGNTGNGIN QPKNQAKDYE151 NFKYVYSGWF YKHAKREFNL KVEPKSAKNG DDGYIFYHGK EPSRQLPASG201 KITYKGVWHF ATDTKKGQKF REIIQPSKSQ GDRYSGFSGD DGEEYSNKNK251 STLTDGQEGY GFTSNLEVDF HNKKLTGKLI RNNANTDNNQ ATTTQYYSLE301 AQVTGNRFNG KATATDKPQQ NSETKEHPFV SDSSSLSGGF FGPQGEELGF351 RFLSDDQKVA VVGSAKTKDK PANGNTAAAS GGTDAAASNG AAGTSSENGK401 LTTVLDAVEL DLGDKEVQKL DNFSNAAQLV VDGIMIPLLP EASESGNNQA451 NQGTNGGTAF TRKFDHTPES DKKDAQAGTQ TNGAQTASNT AGDTNGKTKT501 YEVEVCCSNL NYLKYGMLTR KNSKSAMQAG ESSSQADAKT EQVEQSMFLQ551 GERTDEKEIP SEQNIVYRGS WYGYIANDKS TSWSGNASNA TSGNRAEFTV601 NFADKKITGT LTADNRQEAT FTIDGNIKDN GFEGTAKTAE SGFDLDQSNT651 TRTPKAYITD AKVQGGFYGP KAEELGGWFA YPGDKQTKNA TNASGNSSAT701 VVFGAKRQQP VR*741 ΔG7411VNRTAFCCLS LTTALILTAC SSGGGGVAAD IGAGLADALT APLDHKDKGL51 QSLTLDQSVR KNEKLKLAAQ GAEKTYGNGD SLNTGKLKND KVSRFDFIRQ101 IEVDGQLITL ESGEFQVYKQ SHSALTAFQT EQIQDSEHSG KMVAKRQFRI151 GDIAGEHTSF DKLPEGGRAT YRGTAFGSDD AGGKLTYTID FAAKQGNGKI201 EHLKSPELNV DLAAADIKPD GKRHAVISGS VLYNQAEKGS YSLGIFGGKA251 QEVAGSAEVK TVNGIRHIGL AAKQ*983 ΔG9831MRTTPTFFTK TFKPTAMALA VATTLSACLG GGGGGTSAPD FNAGGTGIGS51 NSRATTAKSA AVSYAGIKNE MCKDRSMLCA GRDDVAVTDR DAKINAPPPN101 LHTGDFPNPN DAYKNLINLK PAIEAGYTGR GVEVGIVDTG ESVGSISFPE151 LYGRKEHGYN ENYKNYTAYM RKEAPEDGGG KDIEASFDDE AVIETEAKPT201 DIRHVKEIGH IDLVSHIIGG RSVDGRPAGG IAPDATLHIM NTNDETKNEM251 MVAAIRNAWV KLGERGVRIV NNSFGTTSRA GTADLFQIAN SEEQYRQALL301 DYSGGDKTDE GIRLMQQSDY GNLSYHIRNK NMLFIFSTGN DAQAQPNTYA351 LLPFYEKDAQ KGIITVAGVD RSGEKFKREM YGEPGTEPLE YGSNHCGITA401 MWCLSAPYEA SVRFTRTNPI QIAGTSFSAP IVTGTAALLL QKYPWMSNDN451 LRTTLLTTAQ DIGAVGVDSK FGWGLLDAGK AMNGPASFPF GDFTADTKGT501 SDIAYSFRND ISGTGGLIKK GGSQLQLHGN NTYTGKTIIE GGSLVLYGNN551 KSDMRVETKG ALIYNGAASG GSLNSDGIVY LADTDQSGAN ETVHIKGSLQ601 LDGKGTLYTR LGKLLKVDGT AIIGGKLYMS ARGKGAGYLN STGRRVPFLS651 AAKIGQDYSF FTNIETDGGL LASLDSVEKT AGSEGDTLSY YVRRGNAART701 ASAAAHSAPA GLKHAVEQGG SNLENLNVEL DASESSATPE TVETAAADRT751 DMPGIRPYGA TFRAAAAVQH ANAADGVRIF NSLAATVYAD STAAHADMQG801 RRTKAVSDGL KHNGTGLRVI AQTQQDGGTW EQGGVEGKMR GSTQTVGIAA851 KTGENTTAAA TLGMGRSTWS ENSANAKTDS ISLFAGIRHD AGDIGYLKGL901 FSYGRYKNSI SRSTGADEHA EGSVNGTLMQ LGALGGVNVP EAATGDLTVE951 GGLRYDLLKQ DAFAEKGSAL GWSGNSLTEG TLVGLAGLKL SQPLSDKAVL1001 FATAGVERDL NGRDYTVTGG FTGATAATGK TGARNMPHTR LVAGLGADVE1051 FGNGWNGLAR YSYAGSKQYG NHSGRVGVGY RF*Tbp2和741基因本源于菌株MC58;983和287基因來(lái)源于菌株2996。將它們克隆入pET載體中,并在大腸桿菌中表達(dá)而無(wú)編碼它們前導(dǎo)肽的序列或以‘ΔG形式′(都融合于C-端His-標(biāo)記)。在這每種情況中,發(fā)現(xiàn)相同的作用-在攜帶聚-甘氨酸段缺失的克隆中很好表達(dá),如果在表達(dá)的蛋白質(zhì)中存在甘氨酸則表達(dá)很差或不表達(dá)

      圖13顯示了蛋白質(zhì)的SDS-PAGE。
      ΔG287和雜交體制備和純化菌株MC58、1000和BZ232的ΔG287蛋白質(zhì)。它們都產(chǎn)生高ELISA滴定度,且血清殺菌滴定度>8192。由pET-24b表達(dá)的ΔG287K在ELISA和血清殺菌試驗(yàn)中的滴定度極佳。也可在pET-24b中表達(dá)ΔG287-ORF46.1K。
      還將ΔG287直接融合于919、953、961和ORF46.1的符合讀框的上游(如下顯示的序列)ΔG287-9191 ATGGCTAGCC CCGATGTTAA ATCGGCGGAC ACGCTGTCAA AACCGGCCGC51 TCCTGTTGTT GCTGAAAAAG AGACAGAGGT AAAAGAAGAT GCGCCACAGG101 CAGGTTCTCA AGGACAGGGC GCGCCATCCA CACAAGGCAG CCAAGATATG151 GCGGCAGTTT CGGCAGAAAA TACAGGCAAT GGCGGTGCGG CAACAACGGA201 CAAACCCAAA AATGAAGACG AGGGACCGCA AAATGATATG CCGCAAAATT251 CCGCCGAATC CGCAAATCAA ACAGGGAACA ACCAACCCGC CGATTCTTCA301 GATTCCGCCC CCGCGTCAAA CCCTGCACCT GCGAATGGCG GTAGCAATTT351 TGGAAGGGTT GATTTGGCTA ATGGCGTTTT GATTGATGGG CCGTCGCAAA401 ATATAACGTT GACCCACTGT AAAGGCGATT CTTGTAATGG TGATAATTTA451 TTGGATGAAG AAGCACCGTC AAAATCAGAA TTTGAAAATT TAAATGAGTC501 TGAACGAATT GAGAAATATA AGAAAGATGG GAAAAGCGAT AAATTTACTA551 ATTTGGTTGC GACAGGAGTT CAAGCTAATG GAACTAACAA ATATGTCATC601 ATTTATAAAG ACAAGTCCGC TTCATCTTCA TCTGCGCGAT TCAGGCGTTC651 TGCACGGTCG AGGAGGTCGC TTCCTGCCGA GATGCCGCTA ATCCCCGTCA701 ATCAGGCGGA TACGCTGATT GTCGATGGGG AAGCGGTCAG CCTGACGGGG751 CATTCCGGCA ATATCTTCGC GCCCGAAGGG AATTACCGGT ATCTGACTTA801 CGGGGCGGAA AAATTGCCCG GCGGATCGTA TGCCCTCCGT GTGCAAGGCG851 AACCGGCAAA AGGCGAAATG CTTGCTGGCA CGGCCGTGTA CAACGGCGAA901 GTGCTGCATT TTCATACGGA AAACGGCCGT CCGTACCCGA CTAGAGGCAG951 GTTTGCCGCA AAAGTCGATT TTCGGCACAA ATCTGTGGAC GGCATTATCG1001 ACAGCGGCGA TGATTTGCAT ATGGGTACGC AAAAATTCAA AGCCGCCATC
      1051 GATGGAAACG GCTTTAAGGG GACTTGGACG GAAAATGGCG GCGGGGATGT1101 TTCCGGAAGG TTTTACGGCC CGGCCGGCGA GGAAGTGGCG GGAAAATACA1151 GCTATCGCCC GACAGATGCG GAAAAGGGCG GATTCGGCGT GTTTGCCGGC1201 AAAAAAGAGC AGGATGGATC CGGAGGAGGA GGATGCCAAA GCAAGAGCAT1251 CCAAACCTTT CCGCAACCCG ACACATCCGT CATCAACGGC CCGGACCGGC1301 CGGTCGGCAT CCCCGACCCC GCCGGAACGA CGGTCGGCGG CGGCGGGGCC1351 GTCTATACCG TTGTACCGCA CCTGTCCCTG CCCCACTGGG CGGCGCAGGA1401 TTTCGCCAAA AGCCTGCAAT CCTTCCGCCT CGGCTGCGCC AATTTGAAAA1451 ACCGCCAAGG CTGGCAGGAT GTGTGCGCCC AAGCCTTTCA AACCCCCGTC1501 CATTCCTTTC AGGCAAAACA GTTTTTTGAA CGCTATTTCA CGCCGTGGCA1551 GGTTGCAGGC AACGGAAGCC TTGCCGGTAC GGTTACCGGC TATTACGAGC1601 CGGTGCTGAA GGGCGACGAC AGGCGGACGG CACAAGCCCG CTTCCCGATT1651 TACGGTATTC CCGACGATTT TATCTCCGTC CCCCTGCCTG CCGGTTTGCG1701 GAGCGGAAAA GCCCTTGTCC GCATCAGGCA GACGGGAAAA AACAGCGGCA1751 CAATCGACAA TACCGGCGGC ACACATACCG CCGACCTCTC CCGATTCCCC1801 ATCACCGCGC GCACAACGGC AATCAAAGGC AGGTTTGAAG GAAGCCGCTT1851 CCTCCCCTAC CACACGCGCA ACCAAATCAA CGGCGGCGCG CTTGACGGCA1901 AAGCCCCGAT ACTCGGTTAC GCCGAAGACC CCGTCGAACT TTTTTTTATG1951 CACATCCAAG GCTCGGGCCG TCTGAAAACC CCGTCCGGCA AATACATCCG2001 CATCGGCTAT GCCGACAAAA ACGAACATCC CTACGTTTCC ATCGGACGCT2051 ATATGGCGGA CAAAGGCTAC CTCAAGCTCG GGCAGACCTC GATGCAGGGC2101 ATCAAAGCCT ATATGCGGCA AAATCCGCAA CGCCTCGCCG AAGTTTTGGG2151 TCAAAACCCC AGCTATATCT TTTTCCGCGA GCTTGCCGGA AGCAGCAATG2201 ACGTCCCGTC CGGCGCACTG GGCACGCCGT TGATGGGGGA ATATGCCGGC2251 GCAGTCGACC GGCACTACAT TACCTTGGGC GCGCCCTTAT TTGTCGCCAC2301 CGCCCATCCG GTTACCCGCA AAGCCCTCAA CCGCCTGATT ATGGCGCAGG2351 ATACCGGCAG CGCGATTAAA GGCGCGGTGC GCGTGGATTA TTTTTGGGGA2401 TACGGCGACG AAGCCGGCGA ACTTGCCGGC AAACAGAAAA CCACGGGTTA2451 CGTCTGGCAG CTCCTACCCA ACGGTATGAA GCCCGAATAC CGCCCGTAAC2501 TCGAG1 MASPDVKSAD TLSKPAAPVV AEKETEVKED APQAGSQGQG APSTQGSQDM51 AAVSAENTGN GGAATTDKPK NEDEGPQNDM PQNSAESANQ TGNNQPADSS101 DSAPASNPAP ANGGSNFGRV DLANGVLIDG PSQNITLTHC KGDSCNGDNL151 LDEEAPSKSE FENLNESERI EKYKKDGKSD KFINLVATAV QANGTNKYVI201 IYKDKSASSS SARFRRSARS RRSLPAEMPL IPVNQADTLI VDGEAVSLTG251 HSGNIFAPEG NYRYLTYGAE KLPGGSYALR VQGEPAKGEM LAGTAVYNGE301 VLHFHTENGR PYPTRGRFAA KVDFGSKSVD GIIDSGDDLH MGTQKFKAAI351 DGNGFKGTWT ENGGGDVSGR FYGPAGEEVA GKYSYRPTDA EKGGFGVFAG401 KKEQDGSGGG GCQSDSIQTF PQPDTSVING PDRPVGIPDP AGTTVGGGGA451 VYTVVPHLSL PHWAAQDFAK SLQSFRLGCA NLKNRQGWQD VCAQAFQTPV501 HSFQAKQFFE RYFTPWQVAG NGSLAGTVTG YYEPVLKGDD RRTAQARFPI551 YGIPDDFISV PLPAGLRSGK ALVRIRQTGK NSGTIDNTGG THTADLSRFP601 ITARTTAIKG RFEGSRFLPY HTRNQINGGA LDGKAPILGY AEDPVELFFM651 HIQGSGRLKT PSGKYIRIGY ADKNEHPYVS IGRYMADKGY LKLGQTSMQG701 IDAYMRQNPQ RLAEVLGQNP SYIFFRELAG SSNDGPVGAL GTPLMGEYAG751 AVDRHYITLG APLFVATAHP VTRKALNRLI MAQDTGSAIK GAVRVDYFWG801 YGDEAGELAG KQKTTGYVWQ LLPNGMKPEY RP*ΔG287-9531 ATGGCTAGCC CCGATGTTAA ATCGGCGGAC ACGCTGTCAA AACCGGCCGC51 TCCTGTTGTT GCTGAAAAAG AGACAGAGGT AAAAGAAGAT GCGCCACAGG101 CAGGTTCTCA AGGACAGGGC GCGCCATCCA CACAAGGCAG CCAAGATATG151 GCGGCAGTTT CGGCAGAAAA TACAGGCAAT GGCGGTGCGG CAACAACGGA201 CAAACCCAAA AATGAAGACG AGGGACCGCA AAATGATATG CCGCAAAATT251 CCGCCGAATC CGCAAATCAA ACAGGGAACA ACCAACCCGC CGATTCTTCA301 GATTCCGCCC CCGCGTCAAA CCCTGCACCT GCGAATGGCG GTAGCAATTT351 TGGAAGGGTT GATTTGGCTA ATGGCGTTTT GATTGATGGG CCGTCGCAAA401 ATATAACGTT GACCCACTGT AAAGGCGATT CTTGTAATGG TGATAATTTA451 TTGGATGAAG AAGCACCGTC AAAATCAGAA TTTGAAAATT TAAATGAGTC501 TGAACGAATT GAGAAATATA AGAAAGATGG GAAAAGCGAT AAATTTACTA551 ATTTGGTTCC GACAGCAGTT CAACGTAATG GAACTAACAA ATATGTCATC601 ATTTATAAAG ACAAGTCCGC TTCATCTTCA TCTGCGCGAT TCAGGCGTTC651 TGCACGGTCG AGGAGGTCGC TTCCTGCCGA GATGCCGCTA ATCCCCGTCA701 ATCAGGCGGA TACGCTGATT GTCGATGGGG AAGCGGTCAG CCTGACGGGG751 CATTCCGGCA ATATCTTCGC GCCCGAAGGG AATTACCGGT ATCTGACTTA
      801 CGGGGCGGAA AAATTGCCCG GCGGATCGTA TGCCCTCCGT GTGCAAGGCG851 AACCGGCAAA AGGCGAAATG CTTGCTGGCA CGGCCGTGTA CAACGGCGAA901 GTGCTGCATT TTCATACGGA AAACGGCCGT CCGTACCCGA CTAGAGGCAG951 GTTTGCCGCA AAAGTCGATT TCGGCAGCAA ATCTGTGGAC GGCATTATCG1001 ACAGCGGCGA TGATTTGCAT ATGGGTACGC AAAAATTCAA AGCCGCCATC1051 GATGGAAACG GCTTTAAGGG GACTTGGACG GAAAATGGCG GCGGGGATGT1101 TTCCGGAAGG TTTTACGGCC CGGCCGGCGA GGAAGTGGCG GGAAAATACA1151 GCTATCGCCC GACAGATGCG GAAAAGGGCG GATTCGGCGT GTTTGCCGGC1201 AAAAAAGAGC AGGATGGATC CGGAGGAGGA GGAGCCACCT ACAAAGTGGA1251 CGAATATCAC GCCAACGCCC GTTTCGCCAT CGACCATTTC AACACCAGCA1301 CCAACGTCGG CGGTTTTTAC GGTCTGACCG GTTCCGTCGA GTTCGACCAA1351 GCAAAACGCG ACGGTAAAAT CGACATCACC ATCCCCGTTG CCAACCTGCA1401 AAGCGGTTCG CAACACTTTA CCGACCACCT GAAATCAGCC GACATCTTCG1451 ATGCCGCCCA ATATCCGGAC ATCCGCTTTG TTTCCACCAA ATTCAACTTC1501 AACGGCAAAA AACTGGTTTC CGTTGACGGC AACCTGACCA TGCACGGCAA1551 AACCGCCCCC GTCAAACTCA AAGCCGAAAA ATTCAACTGC TACCAAAGCC1601 CGATGGCGAA AACCGAAGTT TGCGGCGGCG ACTTCAGCAC CACCATCGAC1651 CGCACCAAAT GGGGCGTGGA CTACCTCGTT AACGTTGGTA TGACCAAAAG1701 CGTCCGCATC GACATCCAAA TCGAGGCAGC CAAACAATAA CTCGAG1 MASPDVKSAD TLSKPAAPVV AEKETEVKED APQAGSOGCG APSTOGSODM51 AAVSAEWTGN GGAATTDKPK NKDEGPSNDM PQNSAESANQ TGNNQPADSS101 DSAPASNPAP ANGGSNFGRV DLANGVLIDG PSQNITLTHC KGDSCNGDNL151 LDEEAPSKSE FENLNESERI EKYKKDGKSD KFTNLVATAV QANGTNKYVI201 IYKDKSASSS SARFRRSARS RRSLPAEMPL IPVNOADTLI VDGEAVSLTG251 HSGNIFAPEC NYRYLTYGAE KLPGGSYALR VQGEPAKGEM LAGTAVYNGE301 LLHFHTENGR PYPTRGRFAA KVDFGSKSVD GIIDSGDDLH MGTQKFKAAI351 DGNGFKGTWT ENGGGDVSGR FYGPAGEEVA GKYSYRPTDA EKGGFGVFAG401 KKEQDGSGGG GATYKVDEYH ANARFAIDHF NTSTNVGGFY GLTGSVEFDQ451 AKRDGKIDIT IPVANLQSGS QHFTDHLKSA DIFDAAQYPD IRFVSTKFNF501 NGKKLVSVDG NLTMHGKTAP VKLKAEKFNC YQSPMAKTEV CGGDFSTTID551 RTKWGVDYLV NVGMTKSVRI DIQIEAAKQ*ΔG287-9611 ATGGCTAGCC CCGATGTTAA ATCGGCGGAC ACGCTGTCAA AACCGGCCGC51 TCCTGTTGTT GCTGAAAAAG AGACAGAGGT AAAAGAAGAT GCGCCACAGG101 CAGGTTCTCA AGGACAGGGC GCGCCATCCA CACAAGGCAG CCAGGATATG151 GCGGCAGTTT CGGCAGAAAA TACAGGCAAT GGCGGTGCGG CAACAACGGA201 CAAACCCAAA AATGAAGACG AGGGACCGCA AAATGATATG CCGCAAAATT251 CCGCCGAATC CGCAAATCAA ACAGGGAACA ACCAACCCGC CGATTCTTCA301 GATTCCGCCC CCGCGTCAAA CCCTGCACCT GCGAATGGCG GTAGCAATTT351 TGGAAGGGTT GATTTGGCTA ATGGCGTTTT GATTGATGGG CCGTCGCAAA401 ATATAACGTT GACCCACTGT AAAGGCGATT CTTGTAATGG TGATAATTTA451 TTGGATGAAG AAGCACCGTC AAAATCAGAA TTTGAAAATT TAAATGAGTC501 TGAACGAATT GAGAAATATA AGAAAGATGG GAAAAGCGAT AAATTTACTA551 ATTTGGTTGC GACAGCAGTT CAAGCTAATG GAACTAACAA ATATGTCATC601 ATTTATAAAG ACAAGTCCGC TTCATCTTCA TCTGCGCGAT TCAGGCGTTC651 TGCACGGTCG AGGAGGTCGC TTCCTGCCGA GATGCCGCTA ATCCCCGTCA701 ATCAGGCGGA TACGCTGATT GTCGATGGGG AAGCGGTCAG CCTGACGGGG751 CATTCCGGCA ATATCTTCGC GCCCGAAGGG AATTACCGGT ATCTGACTTA801 CGGGGCGGAA AAATTGCCCG GCGGATCGTA TGCCCTCCGT GTGCAAGGCG851 AACCGGCAAA AGGCGAAATG CTTGCTGGCA CGGCCGTGTA CAACGGCGAA901 GTGCTGCATT TTCATACGGA AAACGGCCGT CCGTACCCGA CTAGAGGCAG951 GTTTGCCGCA AAAGTCGATT TCGGCAGCAA ATCTGTGGAC GGCATTATCG1001 ACAGCGGCGA TGATTTGCAT ATGGGTACGC AAAAATTCAA AGCCGCCATC1051 GATGGAAACG GCTTTAAGGG GACTTGGACG GAAAATGGCG GCGGGGATGT1101 TTCCGGAAGG TTTTACGGCC CGGCCGGCGA GGAAGTGGCG GGAAAATACA1151 GCTATCGCCC GACAGATGCG GAAAAGGGCG GATTCGGCGT GTTTGCCGGC1201 AAAAAAGAGC AGGATGGATC CGGAGGAGGA GGAGCCACAA ACGACGACGA1251 TGTTAAAAAA GCTGCCACTG TGGCCATTGC TGCTGCCTAC AACAATGGCC1301 AAGAAATCAA CGGTTTCAAA GCTGGAGAGA CCATCTACGA CATTGATGAA1351 GACGGCACAA TTACCAAAAA ACGCGCAACT GCAGCCGATG TTGAAGCCGA1401 CGACTTTAAA GGTCTGGGTC TGAAAAAAGT CGTGACTAAC CTGACCAAAA1451 CCGTCAATGA AAACAAACAA AACGTCGATG CCAAAGTAAA AGCTGCAGAA1501 TCTGAAATAG AAAAGTTAAC AACCAAGTTA GCAGACACTG ATGCCGCTTT1551 AGCAGATACT GATGCCGCTC TGGATGCAAC CACCAACGCC TTGAATAAAT
      1601 TGGGAGAAAA TATAACGACA TTTGCTGAAG AGACTAAGAC AAATATCGTA1651 AAAATTGATG AAAAATTAGA AGCCGTGGCT GATACCGTCG ACAAGCATGC1701 CGAAGCATTC AACGATATCG CCGATTCATT GGATGAAACC AACACTAAGG1751 CAGACGAAGC CGTCAAAACC GCCAATGAAG CCAAACAGAC GCCCGAAGAA1801 ACCAAACAAA ACGTCGATGC CAAAGTAAAA GCTGCAGAAA CTGCAGCAGG1851 CAAAGCCGAA GCTGCCGCTG GCACAGCTAA TACTGCAGCC GACAAGGCCG1901 AAGCTGTCGC TGCAAAAGTT ACCGACATCA AAGCTGATAT CGCTACGAAC1951 AAAGATAATA TTGCTAAAAA AGCAAACAGT GCCGACGTGT ACACCAGAGA2001 AGAGTCTGAC AGCAAATTTG TCAGAATTGA TGGTCTGAAC GCTACTACCG2051 AAAAATTGGA CACACGCTTG GCTTCTGCTG AAAAATCCAT TGCCGATCAC2101 GATACTCGCC TGAACGGTTT GGATAAAACA GTGTCAGACC TGCGCAAAGA2151 AACCCGCCAA GGCCTTGCAG AACAAGCCGC GCTCTCCGGT CTGTTCCAAC2201 CTTACAACGT GGGTCGGTTC AATGTAACGG CTGCAGTCGG CGGCTACAAA2251 TCCGAATCGG CAGTCGCCAT CGGTACCGGC TTCCGCTTTA CCGAAAACTT2301 TGCCGCCAAA GCAGGCGTGG CAGTCGGCAC TTCGTCCGGT TCTTCCGCAG2351 CCTACCATGT CGGCGTCAAT TACGAGTGGT AACTCGAG1 MASPDVKSAD TLSKPAAPVV AEKETEVKED APQAGSQGQG APSTQGSQDM51 AAVSAENTGN GGAATTDKPK NEDEGPQNDM PQNSAESANQ TGNNQPADSS101 DSAPASNPAP ANGGSNFGRV DLANGVLIDG PSCNITLTHC KGDSCNGDNL151 LDEEAPSKSE FENLNESERI EKYKKDGKSD KFTRLVATAV QANGTNKYVI201 IYKDKSASSS SARFRRSARS RRSLPAEMPL IPVNQADTLI VDGEAVSLTG251 HSGNIFAPEG NYRYLTYGAE KLPGGSYALR VQGEPAKGEM LAGTAVYNGE301 VLHFHTENGR PYPTRGRFAA KVDFGSKSVD GIIDSGDDLH MGTQKFKAAI351 DGNGFKGTWT ENGGGDVSGR FYGPAGEEVA GKYSYRPTDA EKGGFGVFAG401 KKKQDGSGGG GATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE451 DGTITKKDAT AADVKADDFK GLGLKEVVTN LTKTVNENKQ NVDAKVKAAE501 SEIEKLTTKL ADTDAALADT DAALDATTNA LNKLGENITT FAEHTKTNIV551 KIDEKLKAVA DTVDKHAEAF NDIADSLDKT NTKADEAVKT ANEAKQTAEE601 TKQNVDAKVK AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN651 KKNIAKKANS ADVYTAEESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH701 DTRLNGLDKT VSDLRKETRQ GLAKQAALSG LFQPYNVGRF NVTAAVGGYK751 SESAVAIGTG FRFTENFAAK AGVAVGTSSG SSAAYHVGVN YEW*

      將抗體針對(duì)雜交蛋白產(chǎn)生的殺菌效力(同源菌株)與針對(duì)919和ORF46.1的組分抗原(使用287-GST)的簡(jiǎn)單化合物產(chǎn)生的抗體相比

      還獲得了針對(duì)異源MenB菌株和血清型A和C的殺菌活性的數(shù)據(jù)

      因此,在與ΔG287(在N-未端)的雜交蛋白質(zhì)比簡(jiǎn)單的與ΔG287-ORF46.1的混合物在免疫學(xué)上更優(yōu)良,針對(duì)異源菌株尤其有效。也可在pET-24b中表達(dá)ΔG287-ORF46.1。
      用新西蘭菌株394/98而非2996制備相同的雜交蛋白ΔG287NZ-9191 ATGGCTAGCC CCGATGTCAA GTCGGCGGAC ACGCTGTCAA AACCTGCCGC51 CCCTGTTGTT TCTGAAAAAG AGACAGAGGC AAAGGAAGAT GCGCCACAGG101 CAGGTTCTCA AGGACAGGGC GCGCCATCCG CACAAGGCGG TCAAGATATG151 GCGGCGGTTT CGGAAGAAAA TACAGGCAAT GGCGGTGCGG CAGCAACGGA201 CAAACCCAAA AATGAAGACG AGGGGGCGCA AAATGATATG CCGCAAAATG251 CCGCCGATAC AGATAGTTTG ACACCGAATC ACACCCCGGC TTCGAATATG301 CCGGCCGGAA ATATGGAAAA CCAAGCACCG GATGCCGGGG AATCGGAGCA351 GCCGGCAAAC CAACCGGATA TGGCAAATAC GGCGGACGGA ATGCAGGGTG401 ACGATCCGTC GGCAGGCGGG GAAAATGCCG GCAATACGGC TGCCCAAGGT451 ACAAATCAAG CCGAAAACAA TCAAACCGCC GGTTCTCAAA ATCCTGCCTC501 TTCAACCAAT CCTAGCGCCA CGAATAGCGG TGGTGATTTT GGAAGGACGA551 ACGTGGGCAA TTCTGTTGTG ATTGACGGGC CGTCGCAAAA TATAACGTTG601 ACCCACTGTA AAGGCGATTC TTGTAGTGGC AATAATTTCT TGGATGAAGA651 AGTACAGCTA AAATCAGAAT TTGAAAAATT AAGTGATGCA GACAAAATAA701 GTAATTACAA GAAAGATGGG AAGAATGACG GGAAGAATGA TAAATTTGTC751 GGTTTGGTTG CCGATAGTGT GCAGATGAAG GGAATCAATC AATATATTAT801 CTTTTATAAA CCTAAACCCA CTTCATTTGC GCGATTTAGG CGTTCTGCAC851 GGTCGAGGCG GTCGCTTCCG GCCGAGATGC CGCTGATTCC CGTCAATCAG901 GCGGATACGC TGATTGTCGA TGGGGAAGCG GTCAGCCTGA CGGGGCATTC951 CGGCAATATC TTCGCGCCCG AAGGGAATTA CCGGTATCTG ACTTACGGGG1001 CGGAAAAATT GCCCGGCGGA TCGTATGCCC TCCGTGTTCA AGGCGAACCT1051 TCAAAAGGCG AAATGCTCGC GGGCACGGCA GTGTACAACG GCGAAGTGCT1101 GCATTTTCAT ACGGAAAACG GCCGTCCGTC CCCGTCCAGA GGCAGGTTTG1151 CCGCAAAAGT CGATTTCGGC AGCAAATCTG TGGACGGCAT TATCGACAGC1201 GGCGATGGTT TGCATATGGG TACGCAAAAA TTCAAAGCCG CCATCGATGG1251 AAACGGCTTT AAGGGGACTT GGACGGAAAA TGGCGGCGGG GATGTTTCCG1301 GAAAGTTTTA CGGCCCGGCC GGCGAGGAAG TGGCGGGAAA ATACAGCTAT1351 CGCCCAACAG ATGCGGAAAA GGGCGGATTC GGCGTGTTTG CCGGCAAAAA1401 AGAGCAGGAT GGATCCGGAG GAGGAGGATG CCAAAGCAAG AGCATCCAAA1451 CCTTTCCGCA ACCCGACACA TCCGTCATCA ACGGCCCGGA CCGGCCGGTC1501 GGCATCCCCG ACCCCGCCGG AACGACGGTC GGCGGCGGCG GGGCCGTCTA1551 TACCGTTGTA CCGCACCTGT CCCTGCCCCA CTGGGCGGCG CAGGATTTCG1601 CCAAAAGCCT GCAATCCTTC CGCCTCGGCT GCGCCAATTT GAAAAACCGC1651 CAAGGCTGGC AGGATGTGTG CGCCCAAGCC TTTCAAACCC CCGTCCATTC1701 CTTTCAGGCA AAACAGTTTT TTGAACGCTA TTTCACGCCG TGGCAGGTTG1751 CAGGCAACGG AAGCCTTGCC GGTACGGTTA CCGGCTATTA CGAGCCGGTG1801 CTGAAGGGCG ACGACAGGCG GACGGCACAA GCCCGCTTCC CGATTTACGG1851 TATTCCCGAC GATTTTATCT CCGTCCCCCT GCCTGCCGGT TTGCGGAGCG1901 GAAAAGCCCT TGTCCGCATC AGGCAGACGG GAAAAAACAG CGGCACAATC1951 GACAATACCG GCGGCACACA TACCGCCGAC CTCTCCCGAT TCCCCATCAC2001 CGCGCGCACA ACGGCAATCA AAGGCAGGTT TGAAGGAAGC CGCTTCCTCC
      2051 CCTACCACAC GCGCAACCAA ATCAACGGCG GCGCGCTTGA CGGCAAAGCC2101 CCGATACTCG GTTACGCCGA AGACCCCGTC GAACTTTTTT TTATGCACAT2151 CCAAGGCTCG GGCCGTCTGA AAACCCCGTC CGGCAAATAC ATCCGCATCG2201 GCTATGCCGA CAAAAACGAA CATCCCTACG TTTCCATCGG ACGCTATATG2251 GCGGACAAAG GCTACCTCAA GCTCGGGCAG ACCTCGATGC AGGGCATCAA2301 AGCCTATATG CGGCAAAATC CGCAACGCCT CGCCGAAGTT TTGGGTCAAA2351 ACCCCAGCTA TATCTTTTTC CGCGAGCTTG CCGGAAGCAG CAATGACGGT2401 CCCGTCGGCG CACTGGGCAC GCCGTTGATG GGGGAATATG CCGGCGCAGT2451 CGACCGGCAC TACATTACCT TGGGCGCGCC CTTATTTGTC GCCACCGCCC2501 ATCCGGTTAC CCGCAAAGCC CTCAACCGCC TGATTATGGC GCAGGATACC2551 GGCAGCGCGA TTAAAGGCGC GGTGCGCGTG GATTATTTTT GGGGATACGG2601 CGACGAAGCC GGCGAACTTG CCGGCAAACA GAAAACCACG GGTTACGTCT2651 GGCAGCTCCT ACCCAACGGT ATGAAGCCCG AATACCGCCC GTAAAAGCTT1 MASPDVKSAD TLSKPAAPVV SEKETEAKED APQAGSQGQG APSAQGGQDM51 AAVSEENTGN GGAAATDKPK NEDEGAQNDM PQNAADTDSL TPNHTPASNM101 PAGNMENQAP DAGESEQPAN APDMANTADG MQGDDPSAGG ENAGNTAAQG151 TNQAENNQTA GSQNPASSTN PSATNSGGDF GRTNVGNSVV IDGPSQNITL201 THCKGDSCSG NNFLDEEVQL KSEFEKLSDA DKISNYKKDG KNDGKNDKFV251 GLVADSVQMK GINQYIIFYK PKPTSFARFR RSARSRRSLP AEMPLIPVNQ301 ADTLIVDGEA VSLTGHSGNI FAPEGNYRYL TYGAEKLPGG SYALRVQGEP351 SKGEMLAGTA VYNGEVLHFH TENGRPSPSR GRFAAKVDFG SKSVDGIIDS401 GDGLHMGTQK FKAAIDGNGF KGTWTKNGGG DVSGKFYGPA GEEVAGKYSY451 RPTDAEKGGF GVFAGKKEQD GSGGGGCQSK SIQTFPQPDT SVINGPDRPV501 GIPDPAGTTV GGGGAVYTVV PHLSLPHWAA QDFAKSLQSF RLGCANLKNR551 QGWQDVCAQA FQTPVHSFQA KQFFERYFTP WQVAGNGSLA GTVTGYYEPV601 LKGDDRRTAQ ARFPIYGIPD DFISVPLPAG LRSGKALVRI RQTGKNSGTI651 DNTGGTHTAD LSRFPITART TAIKGRFEGS RFLPYHTRNQ INGGALDGKA701 PILGYAEDPV ELFFMHIQGS GRLKTPSGKY IRIGYADKNE HPYVSIGRYM751 ADKGYLKLGQ TSMQGIKAYM RQNPQRLAEV LGQNPSYIFF RELAGSSNDG801 PVGALGTPLM GEYAGAVDRH YITLGAPLFV ATAHPVTRKA LNRLIMAQDT851 GSAIKGAVRV KYFWGYGDEA GELAGKQKTT GYVWQLLPNG MLPEYRP*ΔG287NZ-9531 ATGGCTAGCC CCGATGTCAA GTCGGCGGAC ACGCTGTCAA AACCTGCCGC51 CCCTGTTGTT TCTGAAAAAG AGACAGAGGC AAAGGAAGAT GCGCCACAGG101 CAGGTTCTCA AGGACAGGGC GCGCCATCCG CACAAGGCGG TCAAGATATG151 GCGGCGGTTT CGGAAGAAAA TACAGGCAAT GGCGGTGCGG CAGCAACGGA201 CAAACCCAAA AATGAAGACG AGGGGGCGCA AAATGATATG CCGCAAAATG251 CCGCCGATAC AGATAGTTTG ACACCGAATC ACACCCCGGC TTCGAATATG301 CCGGCCGGAA ATATGGAAAA CCAAGCACCG GATGCCGGGG AATCGGAGCA351 GCCGGCAAAC CAACCGGATA TGGCAAATAC GGCGGACGGA ATGCAGGGTG401 ACGATCCGTC GGCAGGCGGG GAAAATGCCG GCAATACGGC TGCCCAAGGT451 ACAAATCAAG CCGAAAACAA TCAAACCGCC GGTTCTCAAA ATCCTGCCTC501 TTCAACCAAT CCTAGCGCCA CGAATAGCGG TGGTGATTTT GGAAGGACGA551 ACGTGGGCAA TTCTGTTGTG ATTGACGGGC CGTCGCAAAA TATAACGTTA601 ACCCACTGTA AAGGCGATTC TTGTAGTGGC AATAATTTCT TGGATGAAGA651 AGTACAGCTA AAATCAGAAT TTGAAAAATT AAGTGATGCA GACAAAATAA701 GTAATTACAA GAAAGATGGG AAGAATGACG GGAAGAATGA TAAATTTGTC751 GGTTTGGTTG CCGATAGTGT GCAGATGAAG GGAATCAATC AATATATTAT801 CTTTTATAAA CCTAAACCCA CTTCATTTGC GCGATTTAGG CGTTCTGCAC851 GGTCGAGGCG GTCGCTTCCG GCCGAGATGC CGCTGATTCC CGTCAATCAG901 GCGGATACGC TGATTGTCGA TGGGGAAGCG GTCAGCCTGA CGGGGGATTC951 CGGCAATATC TTCGCGCCCG AAGGGGAATA CCGGTATCTG ACTTACGGGG1001 CGGAAAAATT GCCCGGCGGA TCGTATGCCC TCCGTGTTCA AGGCGAACCT1051 TCAAAAGGCG AAATGCTCGC GGGCACGCAG GTGTACAACG GCGAAGTGCT1101 GCATTTTCAT ACGGAAAACG GCCGTCCGTC CCCGTCCAGA GGCAGGTTTG1151 CCGCAAAAGT CGATTTCGGC AGCAAATCTG TGGACGGCAT TATCGACAGC1201 GGCGATGGTT TGCATATGGG TACGCAAAAA TTCAAAGCCG CCATCGATGG1251 AAACGGCTTT AAGGGGACTT GGACGGAAAA TGGCGGCGGG GATGTTTCCG1301 GAAAGTTTTA CGGCCCGGCC GGCGAGGAAG TGGCGGGAAA ATACAGCTAT1351 CGCCCAACAG ATGCGGAAAA GGGCGGATTC GGCGTGTTTG CCGGCAAAAA1401 AGAGCAGGAT GGATCCGGAG GAGGAGGAGC CACCTACAAA GTGGACGAAT1451 ATCACGCCAA CGCCCGTTTC GCCATCGACC ATTTCAACAC CAGCACCAAC1501 GTCGGCGGTT TTTACGGTCT GACCGGTTCC GTCGAGTTCG ACCAAGCAAA1551 ACGCGACGGT AAAATCGACA TCACCATCCC CGTTGCCAAC CTGCAAAGCG
      1601 GTTCGCAACA CTTTACCGAC CACCTGAAAT CAGCCGACAT CTTCGATGCC1651 GCCCAATATC CGGACATCCG CTTTGTTTCC ACCAAATTCA ACTTCAACGG1701 CAAAAAACTG GTTTCCGTTG ACGGCAACCT GACCATGCAC GGCAAAACCG1751 CCCCCGTCAA ACTCAAAGCC GAAAAATTCA ACTGCTACCA AAGCCCGATG1801 GCGAAAACCG AAGTTTGCGG CGGCGACTTC AGCACCACCA TCGACCGCAC1851 CAAATGGGGC GTGGACTACC TCGTTAACGT TGGTATGACC AAAAGCGTCC1901 GCATCGACAT CCAAATCGAG GCAGCCAAAC AATAAAAGCT T1 MASPDVKSAD TLSKPAAPVV SEKETEAKED APQAGSQGQG APSAQGGQDM51 AAVSEENTGN GGAAATDKPK NEDEGAQNDM PQNAADTDSL TPNHTPASNM101 PAGNMENQAP DAGESEQPAN QPDMANTADG MQGDDPSAGG ENAGNTAAQG151 TNQAENNQTA GSQNPASSTN PSATNSGGDF GRTNVGNSVV IDGPSQNITL201 THCKGDSCSG NNFLDEEVQL KSEFEKLSDA DKISNYKKDG KNDGKNDKFV251 GLVADSVQMK GINQYIIFYK PKPTSFARFR RSARSRRSLP AEMPLIPVNQ301 ADTLIVDGEA VSLTGHSGNI FAPEGNYRYL TYGAEKLPGG SYALRVQGEP351 SKGEMLAGTA VYNGEVLHFH TENGRPSPSR GRFAAKVDFG SKSVDGIIDS401 GDGLHMGTQK FKAAIDGNGF KGTWTENGGG DVSGKFYGPA GEEVAGKYSY451 RPTDAEKGGF GVFAGKKEQD GSGGGGATYK VDEYEANARF AIDHFNTSTN501 VGGFYGLTGS VEFDQAKRDG KIDITIPVAN LQSGSQHFTD HLKSADIFDA551 AQYPDIRFVS TKFNFNGKKL VSVDGNLTMH GKTAPVKLKA EKFNCYQSPM601 AKTEVCGGDF STTIDRTKWG VDYLVNVGMT KSVRIDIQIE AAKQ*ΔG287NZ-9611 ATGGCTAGCC CCGATGTCAA GTCGGCGGAC ACGCTGTCAA AACCTGCCGC51 CCCTGTTGTT TCTGAAAAAG AGACAGAGGC AAAGGAAGAT GCGCCACAGG101 CAGGTTCTCA AGGACAGGGC GCGCCATCCG CACAAGGCGG TCAAGATATG151 GCGGCGGTTT CGGAAGAAAA TACAGGCAAT GGCGGTGCGG CAGCAACGGA201 CAAACCCAAA AATGAAGACG AGGGGGCGCA AAATGATATG CCGCAAAATG251 CCGCCGATAC AGATAGTTTG ACACCGAATC ACACCCCGGC TTCGAATATG301 CCGGCCGGAA ATATGGAAAA CCAAGCACCG GATGCCGGGG AATCGGAGCA351 GCCGGCAAAC CAACCGGATA TGGCAAATAC GGCGGACGGA ATGCAGGGTG401 ACGATCCGTC GGCAGGCGGG GAAAATGCCG GCAATACGGC TGCCCAAGGT451 ACAAATCAAG CCGAAAACAA TCAAACCGCC GGTTCTCAAA ATCCTGCCTC501 TTCAACCAAT CCTAGCGCCA CGAATAGCGG TGGTGATTTT GGAAGGACGA551 ACGTGGGCAA TTCTGTTGTG ATTGACGGGC CGTCGCAAAA TATAACGTTG601 ACCCACTGTA AAGGCGATTC TTGTAGTGGC AATAATTTCT TGGATGAAGA651 AGTACAGCTA AAATCAGAAT TTGAAAAATT AAGTGATGCA GACAAAATAA701 GTAATTACAA GAAAGATGGG AAGAATGACG GGAAGAATGA TAAATTTGTC751 GGTTTGGTTG CCGATAGTGT GCAGATGAAG GGAATCAATC AATATATTAT801 CTTTTATAAA CCTAAACCCA CTTCATTTGC GCGATTTAGG CGTTCTGCAC851 GGTCGAGGCG GTCGCTTCCG GCCGAGATGC CGCTGATTCC CGTCAATCAG901 GCGGATACGC TGATTGTCGA TGGGGAAGCG GTCAGCCTGA CGGGGCATTC951 CGGCAATATC TTCGCGCCCG AAGGGAATTA CCGGTATCTG ACTTACGGGG1001 CGGAAAAATT GCCCGGCGGA TCGTATGCCC TCCGTGTTCA AGGCGAACCT1051 TCAAAAGGCG AAATGCTCGC GGGCACGGCA GTGTACAACG GCGAAGTGCT1101 GCATTTTCAT ACGGAAAACG GCCGTCCGTC CCCGTCCAGA GGCAGGTTTG1151 CCGCAAAAGT CGATTTCGGC AGCAAATCTG TGGACGGCAT TATCGACAGC1201 GGCGATGGTT TGCATATGGG TACGCAAAAA TTCAAAGCCG CCATCGATGG1251 AAACGGCTTT AAGGGGACTT GGACGGAAAA TGGCGGCGGG GATGTTTCCG1301 GAAAGTTTTA CGGCCCGGCC GGCGAGGAAG TGGCGGGAAA ATACAGCTAT1351 CGCCCAACAG ATGCGGAAAA GGGCGGATTC GGCGTGTTTG CCGGCAAAAA1401 AGAGCAGGAT GGATCCGGAG GAGGAGGAGC CACAAACGAC GACGATGTTA1451 AAAAAGCTGC CACTGTGGCC ATTGCTGCTG CCTACAACAA TGGCCAAGAA1501 ATCAACGGTT TCAAAGCTGG AGAGACCATC TACGACATTG ATGAAGACGG1551 CACAATTACC AAAAAAGACG CAACTGCAGC CGATGTTGAA GCCGACGACT1601 TTAAAGGTCT GGGTCTGAAA AAAGTCGTGA CTAACCTGAC CAAAACCGTC1651 AATGAAAACA AACAAAACGT CGATGCCAAA GTAAAAGCTG CAGAATCTGA1701 AATAGAAAAG TTAACAACCA AGTTAGCAGA CACTGATGCC GCTTTAGCAG1751 ATACTGATGC CGCTCTGGAT GCAACCACCA ACGCCTTGAA TAAATTGGGA1801 GAAAATATAA CGACATTTGC TGAAGAGACT AAGACAAATA TCGTAAAAAT1851 TGATGAAAAA TTAGAAGCCG TGGCTGATAC CGTCGACAAG CATGCCGAAG1901 CATTCAACGA TATCGCCGAT TCATTGGATG AAACCAACAC TAAGGCAGAC1951 GAAGCCGTCA AAACCGCCAA TGAAGCCAAA CAGACGGCCG AAGAAACCAA2001 ACAAAACGTC GATGCCAAAG TAAAAGCTGC AGAAACTGCA GCAGGCAAAG2051 CCGAAGCTGC CGCTGGCACA GCTAATACTG CAGCCGACAA GGCCGAAGCT2101 GTCGCTGCAA AAGTTACCGA CATCAAAGCT GATATCGCTA CGAACAAAGA
      2151 TAATATTGCT AAAAAAGCAA ACAGTGCCGA CGTGTACACC AGAGAAGAGT2201 CTGACAGCAA ATTTGTCAGA ATTGATGGTC TGAACGCTAC TACCGAAAAA2251 TTGGACACAC GCTTGGCTTC TGCTGAAAAA TCCATTGCCG ATCACGATAC2301 TCGCCTGAAC GGTTTGGATA AAACAGTGTC AGACCTGCGC AAAGAAACCC2351 GCCAAGGCCT TGCAGAACAA GCCGCGCTCT CCGGTCTGTT CCAACCTTAC2401 AACGTGGGTC GGTTCAATGT AACGGCTGCA GTCGGCGGCT ACAAATCCGA2451 ATCGGCAGTC GCCATCGGTA CCGGCTTCCG CTTTACCGAA AACTTTGCCG2501 CCAAAGCAGG CGTGGCAGTC GGCACTTCGT CCGGTTCTTC CGCAGCCTAC2551 CATGTCGGCG TCAATTACGA GTGGTAAAAG CTT1 MASPDVKSAD TLSKPAAPVV SEKETEAKED APQAGSQGQG APSAQGGQDM51 AAVSEENTGN GGAAATDKPK NEDEGAQNDM PQNAADTDSL TPNHTPASNM101 PAGNMENQAP DAGESEQPAN QPDMANTADG MQGDDPSAGG ENAGNTAAQG151 TNQAENNQTA GSQNPASSTN PSATNSGGDF GRTNVGNSVV IDGPSQNITL201 THCKGDSCSG NNFLDEEVQL KSEFEKLSDA DKISNYKKDG DNDGKNDKFV251 GLVADSVQMK GINQYIIFYK PKPTSFARFR RSARSRRSLP AEMPLIPVNQ301 ADTLIVDGEA VSLTGHSGNI FAPEGNYRYL TYGAEKLPGG SYALRVQGEP351 SKGEMLAGTA VYNGEVLHFH TENGRPSPSR GRFAAKVDFG SKSVDGIIDS401 GDGLHMGTQK FKAAIDGNGF KGTWTENGGG DVSGKFYGPA GEEVAGKYSY451 RPTDAEKGGF GVFAGKKEQD GSGGGGATND DDVKKAATVA IAAAYNNGQE501 INGFKAGETI YDIDEDGTIT KKDATAADVE ADDFKGLGLK KVVTNLTKTV551 NENKQNVDAK VKAAESEIEK LTTKLADTDA ALADTDAALD ATTNALNKLG601 ENITTFAEET KTNIVKIDEK LEAVADTVDK HAEAFNDIAD SLDETNTKAD651 EAVKTANEAK QTAEETKQNV DAKVKAAETA AGKAEAAAGT ANTAADKAEA701 VAAKVTDIKA DIATNKDNIA KKANSADVYT REESDSKFVR IDGLNATTEK751 LKTRLASAEK SIADHDTRLN GLDKTVSDLR KETRQGLAEQ AALSGLFQPY801 NVGRFNVTAA VGGYKSESAV AIGTGFRFTE NFAAKAGVAV GTSSGSSAAY851 HVGVNYEW*ΔG983和雜交體測(cè)定了針對(duì)各種菌株(包括同源2996菌株)應(yīng)答ΔG983(His-融合體)產(chǎn)生的殺菌滴定度

      ΔG983還可以與ORF46.1、741、961或961c(在其C-未端)雜交的雜交體表達(dá)ΔG983-ORF46.11 ATGACTTCTG CGCCCGACTT CAATGCAGGC GGTACCGGTA TCGGCAGCAA51 CAGCAGAGCA ACAACAGCGA AATCAGCAGC AGTATCTTAC GCCGGTATCA101 AGAACGAAAT GTGCAAAGAC AGAAGCATGC TCTGTGCCGG TCGGGATGAC151 GTTGCGGTTA CAGACAGGGA TGCCAAAATC AATGCCCCCC CCCCGAATCT201 GCATACCGGA GACTTTCCAA ACCCAAATGA CGCATACAAG AATTTGATCA251 ACCTCAAACC TGCAATTGAA GCAGGCTATA CAGGACGCGG GGTAGAGGTA301 GGTATCGTCG ACACAGGCGA ATCCGTCGGC AGCATATCCT TTCCCGAACT351 GTATGGCAGA AAAGAACACG GCTATAACGA AAATTACAAA AACTATACGG401 CGTATATGCG GAAGGAAGCG CCTGAAGACG GAGGCGGTAA AGACATTGAA451 GCTTCTTTCG ACGATGAGGC CGTTATAGAG ACTGAAGCAA AGCCGACGGA501 TATCCGCCAC GTAAAAGAAA TCGGACACAT CGATTTGGTC TCCCATATTA551 TTGGCGGGCG TTCCGTGGAC GGCAGACCTG CAGGCGGTAT TGCGCCCGAT601 GCGACGCTAC ACATAATGAA TACGAATGAT GAAACCAAGA ACGAAATGAT651 GGTTGCAGCC ATCCGCAATG CATGGGTCAA GCTGGGCGAA CGTGGCGTGC701 GCATCGTCAA TAACAGTTTT GGAACAACAT CGAGGGCAGG CACTGCCGAC751 CTTTTCCAAA TAGCCAATTC GGAGGAGCAG TACCGCCAAG CTTTGCTCGA801 CTATTCCGGC GGTGATAAAA CAGACGAGGG TATCCGCCTG ATGCAACAGA851 GCGATTACGG CAACCTGTCC TACCACATCC GTAATAAAAA CATGCTTTTC901 ATCTTTTCGA CAGGCAATGA CGCACAAGCT CAGCCCAACA CATATGCCCT951 ATTGCCATTT TATGAAAAAG ACGCTCAAAA AGGCATTATC ACAGTCGCAG1001 GCGTAGACCG CAGTGGAGAA AAGTTCAAAC GGGAAATGTA TGGAGAACCG1051 GGTACAGAAC CGCTTGAGTA TGGCTCCAAC CATTGCGGAA TTACTGCCAT1101 GTGGTGCCTG TCGGCACCCT ATGAAGCAAG CGTCCGTTTC ACCCGTACAA
      1151 ACCCGATTCA AATTGCCGGA ACATCCTTTT CCGCACCCAT CGTAACCGGC1201 ACGGCGGCTC TGCTGCTGCA GAAATACCCG TGGATGAGCA ACGACAACCT1251 GCGTACCACG TTGCTGACGA CGGCTCAGGA CATCGGTGCA GTCGGCGTGG1301 ACAGCAAGTT CGGCTGGGGA CTGCTGGATG CGGGTAAGGC CATGAACGGA1351 CCCGCGTCCT TTCCGTTCGG CGACTTTACC GCCGATACGA AAGGTACATC1401 CGATATTGCC TACTCCTTCC GTAACGACAT TTCAGGCACG GGCGGCCTGA1451 TCAAAAAAGG CGGCAGCCAA CTGCAACTGC ACGGCAACAA CACCTATACG1501 GGCAAAACCA TTATCGAAGG CGGTTCGCTG GTGTTGTACG GCAACAACAA1551 ATCGGATATG CGCGTCGAAA CCAAAGGTGC GCTGATTTAT AACGGGGCGG1601 CATCCGGCGG CAGCCTGAAC AGCGACGGCA TTGTCTATCT GGCAGATACC1651 GACCAATCCG GCGCAAACGA AACCGTACAC ATCAAAGGCA GTCTGCAGCT1701 GGACGGCAAA GGTACGCTGT ACACACGTTT GGGCAAACTG CTGAAAGTGG1751 ACGGTACGGC GATTATCGGC GGCAAGCTGT ACATGTCGGC ACGCGGCAAG1801 GGGGCAGGCT ATCTCAACAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC1851 CGCCAAAATC GGGCAGGATT ATTCTTTCTT CACAAACATC GAAACCGACG1901 GCGGCCTGCT GGCTTCCCTC GACAGCGTCG AAAAAACAGG GGGCAGTGAA1951 GGCGACACGC TGTCCTATTA TGTCCGTCGC GGCAATGCGG CACGGACTGC2001 TTCGGCAGCG GCACATTCCG CGCCCGCCGG TCTGAAACAC GCCGTAGAAC2051 AGGGCGGCAG CAATCTGGAA AACCTGATGG TCGAACTGGA TGCCTCCGAA2101 TCATCCGCAA CACCCGAGAC GGTTGAAACT GCGGCAGCCG ACCGCACAGA2151 TATGCCGGGC ATCCGCCCCT ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG2201 TACAGCATGC GAATGCCGCC GACGGTGTAC GCATCTTCAA CAGTCTCGCC2251 GCTACCGTCT ATGCCGACAG TACCGCCGCC CATGCCGATA TGCAGGGACG2301 CCGCCTGAAA GCCGTATCGG ACGGGTTGGA CCACAACGGC ACGGGTCTGC2351 GCGTCATCGC GCAAACCCAA CAGGACGGTG GAACGTGGGA ACAGGGCGGT2401 GTTGAAGGCA AAATGCGCGG CAGTACCCAA ACCGTCGGCA TTGCCGCGAA2451 AACCGGCGAA AATACGACAG CAGCCGCCAC ACTGGGCATG GGACGCAGCA2501 CATGGAGCGA AAACAGTGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT2551 GCAGGCATAC GGCACGATGC GGGCGATATC GGCTATCTCA AAGGCCTGTT2601 CTCCTACGGA CGCTACAAAA ACAGCATCAG CCGCAGCACC GGTGCGGACG2651 AACATGCGGA AGGCAGCGTC AACGGCACGC TGATGCAGCT GGGCGCACTG2701 GGCGGTGTCA ACGTTCCGTT TGCCGCAACG GGAGATTTGA CGGTCGAAGG2751 CGGTCTGCGC TACGACCTGC TCAAACAGGA TGCATTCGCC GAAAAAGGCA2801 GTGCTTTGGG CTGGAGCGGC AACAGCCTCA CTGAAGGCAC GCTGGTCGGA2851 CTCGCGGGTC TGAAGCTGTC GCAACCCTTG AGCGATAAAG CCGTCCTGTT2901 TGCAACGGCG GGCGTGGAAC GCGACCTGAA CGGACGCGAC TACACGGTAA2951 CGGGCGGCTT TACCGGCGCG ACTGCAGCAA CCGGCAAGAC GGGGGCACGC3001 AATATGCCGC ACACCCGTCT GGTTGCCGGC CTGGGCGCGG ATGTCGAATT3051 CGGCAACGGC TGGAACGGCT TGGCACGTTA CAGCTACGCC GGTTCCAAAC3101 AGTACGGCAA CCACAGCGGA CGAGTCGGCG TAGGCTACCG GTTCCTCGAC3151 GGTGGCGGAG GCACTGGATC CTCAGATTTG GCAAACGATT CTTTTATCCG3201 GCAGGTTCTC GACCGTCAGC ATTTCGAACC CGACGGGAAA TACCACCTAT3251 TCGGCAGCAG GGGGGAACTT GCCGAGCGCA GCGGCCATAT CGGATTGGGA3301 AAAATACAAA GCCATCAGTT GGGCAACCTG ATGATTCAAC AGGCGGCCAT3351 TAAAGGAAAT ATCGGCTACA TTGTCCGCTT TTCCGATCAC GGGCACGAAG3401 TCCATTCCCC CTTCGACAAC CATGCCTCAC ATTCCGATTC TGATGAAGCC3451 GGTAGTCCCG TTGACGGATT TAGCCTTTAC CGCATCCATT GGGACGGATA3501 CGAACACCAT CCCGCCGACG GCTATGACGG GCCACAGGGC GGCGGCTATC3551 CCGCTCCCAA AGGCGCGAGG GATATATACA GCTACGACAT AAAAGGCGTT3601 GCCCAAAATA TCCGCCTCAA CCTGACCGAC AACCGCAGCA CCGGACAACG3651 GCTTGCCGAC CGTTTCCACA ATGCCGGTAG TATGCTGACG CAAGGAGTAG3701 GCGACGGATT CAAACGCGCC ACCCGATACA GCCCCGAGCT GGACAGATCG3751 GGCAATGCCG CCGAAGCCTT CAACGGCACT GCAGATATCG TTAAAAACAT3801 CATCGGCCGG GCAGGAGAAA TTGTCGGCGC AGGCGATGCC GTGCAGGGCA3851 TAAGCGAAGG CTCAAACATT GCTGTCATGC ACGGCTTGGG TCTGCTTTCC3901 ACCGAAAACA AGATGGCGCG CATCAACGAT TTGGCAGATA TGGCGCAACT3951 CAAAGACTAT GCCGCAGCAG CCATCCGCGA TTGGGCAGTC CAAAACCCCA4001 ATGCCGCACA AGGCATAGAA GCCGTCAGCA ATATCTTTAT GGCAGCCATC4051 CCCATCAAAG GGATTGGAGC TGTTCGGGGA AAATACGGCT TGGGCGGCAT4101 CACGGCACAT CCTATCAAGC GGTCGCAGAT GGGCGCGATC GCATTGCCGA4151 AAGGGAAATC CGCCGTCAGC GACAATTTTG CCGATGCGGC ATACGCCAAA4201 TACCCGTCCC CTTACCATTC CCGAAATATC CGTTCAAACT TGGAGCAGCG4251 TTACGGCAAA GAAAACATCA CCTCCTCAAC CGTGCCGCCG TCAAACGGCA4301 AAAATGTCAA ACTGGCAGAC CAACGCCACC CGAAGACAGG CGTACCGTTT4351 GACGGTAAAG GGTTTCCGAA TTTTGAGAAG CACGTGAAAT ATGATACGCT4401 CGAGCACCAC CACCACCACC ACTGA
      1 MTSAPDFNAG GTGIGSNSRA TTAKSAAVSY AGIKNEMCKD RSMLCAGRDD51 VSVTDRDAKI NAPPPNLHTG DFPNPNDAYK NLINLKPAIE AGYTGRGVEV101 GIVDTGESVG SISFPELYGR KEHGYNENYK NYTAYMRKEA PEDGGGKDIE151 ASFDDEAVIE TEAKPTDIRH VKEIGHIKLV SHIIGGRSVD GRPAGGIAPD201 ATLHIMNTND ETKNEMMVAA IRNAWVKLGE RGVRIVNNSF GTTSRAGTAD251 LFQIANSEEQ YRQALLDYSG GDKTDEGIRL MQQSDYGNLS YHIRNKNMLF301 IFSTGNDAQA QPNTYALLPF YEKDAQKGII TVAGVDRSGE KFKREMYGEP351 GTEPLEYGSN HCGITAMWCL SAPYEASVRF TRTNPIQIAG TSFSAPIVTG401 TAALLLQKYP WMSNDNLRTT LLTTAQDIGA VGVDSKFGWG LLDAGKAMLG451 PASFPFGDFT ADTKGTSDIA YSFRNDISGT GGLIKKGGSQ LQLHGNNTYT501 GKTIIEGGSL VLYGNNKSDM RVETKGALIY NGAASGGSLN SDGIVYLADT551 DQSGANETVH IKGSLQLDGK GTLYTRLGKL LKVDGTAIIG GKLYMSARGK601 GAGYLNSTGR RVPFLSAAKI GQDYSFFTNI ETDGGLLASL DSVEKTAGSE651 GDTLSYYVRR GNAARTASAA AHSAPAGLKH AVEQGGSNLE NLMVELKASE701 SSATPETVET AAADRTDMPG IRPYGATFRA AAAVQHANAA DGVRIFNSLA751 ATVYADSTAA HADMQGRRLK AVSDGLDHNL TGLRVIAQTQ QDGGTWEQGG801 VEGKMRGSTQ TVGIAAKTGE NTTAAATLGM GRSTWSENSA NAKTDSISLF851 AGIRHDAGDI GYLKGLFSYG RYKNSISRST GSDEHAEGSV NGTLMQLGAL901 GGVNVPFAAT GDLTVEGGLR YKLLKQDAFA EKGSALGWSG NSLTEGTLVG951 LAGLKLSQPL SDKAVLFATA GVERKLNGRD YTVTGGFTGA TAATGKTGAR1001 NMPHTRLVAG LGADVEFGNG WNGLARYSYA GSKQYGNHSG RVGVGYRFLD1051 GGGGTGSSDL ANDSFIRQVL DRQHFEPDGK YHLFGSRGEL AERSGHIGLG1101 KIQSHQLGNL MIQQAAIKGN IGYIVRFSDH GHEVHSPFDN HASHSDSDEA1151 GSPVDGFSLY RIHWDGYEHH PADGYDGPQG GGYPAPKGAR DIYSYDIKGV1201 AQNIRLNLTD NRSTGQRLAD RFHNAGSMLT QGVGDGFKRA TRYSPELDRS1251 GNAAEAFNGT ADIVKNIIGA AGEIVGAGDA VQGISEGSNI AVMHGLGLLS1301 TENKMARIND LADMAQLKDY AAAAIRDWAV QNPNAAQGIE AVSNIFMAAI1351 PIKGIGAVRG KYGLGGITAH PIKRSQMGAI ALPKGKSAVS DNFADAAYAK1401 YPSPYHSRNI RSNLEQRYGK ENITSSTVPP SNGKNVKLAD QRHPKTGVPF1451 DGKGFPNFEK HVKYDTLEHH HHHH*ΔG983-7411 ATGACTTCTG CGCCCGACTT CAATGCAGGC GGTACCGGTA TCGGCAGCAA51 CAGCAGAGCA ACAACAGCGA AATCAGCAGC AGTATCTTAC GCCGGTATCA101 AGAACGAAAT GTGCAAAGAC AGAAGCATGC TCTGTGCCGG TCGGGATGAC151 GTTGCGGTTA CAGACAGGGA TGCCAAAATC AATGCCCCCC CCCCGAATCT201 GCATACCGGA GACTTTCCAA ACCCAAATGA CGCATACAAG AATTTGATCA251 ACCTCAAACC TGCAATTGAA GCAGGCTATA CAGGACGCGG GGTAGAGGTA301 GGTATCGTCG ACACAGGCGA ATCCGTCGGC AGCATATCCT TTCCCGAACT351 GTATGGCAGA AAAGAACACG GCTATAACGA AAATTACAAA AACTATACGG401 CGTATATGCG GAAGGAAGCG CCTGAAGACG GAGGCGGTAA AGACATTGAA451 GCTTCTTTCG ACGATGAGGC CGTTATAGAG ACTGAAGCAA AGCCGACGGA501 TATCCGCCAC GTAAAAGAAA TCGGACACAT CGATTTGGTC TCCCATATTA551 TTGGCGGGCG TTCCGTGGAC GGCAGACCTC CAGGCGGTAT TGCGCCCGAT601 GCGACGCTAC ACATAATGAA TACGAATGAT GAAACCAAGA ACGAAATGAT651 GGTTGCAGCC ATCCGCAATG CATGGGTCAA GCTGGGCGAA CGTGGCGTGC701 GCATCGTCAA TAACAGTTTT GGAACAACAT CGAGGGCAGG CACTGCCGAC751 CTTTTCCAAA TAGCCAATTC GGAGGAGCAG TACCGCCAAG CGTTGCTCGA801 CTATTCCGGC GGTGATAAAA CAGACGAGGG TATCCGCCTG ATGCAACAGA851 GCGATTACGG CAACCTGTCC TACCACATCC GTAATAAAAA CATGCTTTTC901 ATCTTTTCGA CAGGCAATGA CGCACAAGCT CAGCCCAACA CATATGCCCT951 ATTGCCATTT TATGAAAAAG ACGCTCAAAA AGGCATTTTC ACAGTCGCAG1001 GCGTAGACCG CAGTGGAGAA AAGTTCAAAC GGGAAATGTA TGGAGAACCG1051 GGTACAGAAC CGCTTGAGTA TGGCTCCAAC CATTGCGGAA TTACTGCCAT1101 GTGGTGCCTG TCGGCACCCT ATGAAGCAAG CGTCCGTTTC ACCCGTACAA1151 ACCCGATTCA AATTGCCGGA ACATCCTTTT CCGCACCCAT CGTAACCGGC1201 ACGGCGGCTC TGCTGCTGCA GAAATACCCG TGGATGAGCA ACGACAACCT1251 GCGTACCACG TTGCTGACGA CGGCTCAGGA CATCGGTGCA GTCGGCGTGG1301 ACAGCAAGTT CGGCTGGGGA CTGCTGGATG CGGGTAAGGC CATGAACGGA1351 CCCGCGTCCT TTCCGTTCGG CGACTTTACC GCCGATACGA AAGGTACATC1401 CGATATTGCC TACTCCTTCC GTAACGACAT TTCAGGCACG GGCGGCCTGA1451 TCAAAAAAGG CGGCAGCCAA CTGCAACTGC ACGGCAACAA CACCTATACG1501 GGCAAAACCA TTATCGAAGG CGGTTCGCTG GTGTTGTACG GCAACAACAA1551 ATCGGATATG CGCGTCGAAA CCAAAGGTGC GCTGATTTAT AACGGGGCGG1601 CATCCGGCGG CAGCCTGAAC AGCGACGGCA TTGTCTATCT GGCAGATACC1651 GACCAATCCG GCGCAAACGA AACCGTACAC ATCAAAGGCA GTCTGCAGCT
      1701 GGACGGCAAA GGTACGCTGT ACACACGTTT GGGCAAACTG CTGAAAGTGG1751 ACGGTACGGC GATTATCGGC GGCAAGCTGT ACATGTCGGC ACGCGGCAAG1801 GGGGCAGGCT ATCTCAACAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC1851 CGCCAAAATC GGGCAGGATT ATTCTTTCTT CACAAACATC GAAACCGACG1901 GCGGCCTGCT GGCTTCCCTC GACAGCGTCG AAAAAACAGC GGGCAGTGAA1951 GGCGACACGC TGTCCTATTA TGTCCGTCGC GGCAATGCGG CACGGACTGC2001 TTCGGCAGCG GCACATTCCG CGCCCGCCGG TCTGAAACAC GCCGTAGAAC2051 AGGGCGGCAG CAATCTGGAA AACCTGATGG TCGAACTGGA TGCCTCCGAA2101 TCATCCGCAA CACCCGAGAC GGTTGAAACT GCGGCAGCCG ACCGCACAGA2151 TATGCCGGGC ATCCGCCCCT ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG2201 TACAGCATGC GAATGCCGCC GACGGTGTAC GCATCTTCAA CAGTCTCGCC2251 GCTACCGTCT ATGCCGACAG TACCGCCGCC CATGCCGATA TGCAGGGACG2301 CCGCCTGAAA GCCGTATCGG ACGGGTTGGA CCACAACGGC ACGGGTCTGC2351 GCGTCATCGC GCAAACCCAA CAGGACGGTG GAACGTGGGA ACAGGGCGGT2401 GTTGAAGGCA AAATGCGCGG CAGTACCCAA ACCGTCGGCA TTGCCGCGAA2451 AACCGGCGAA AATACGACAG CAGCCGCCAC ACTGGGCATG GGACGCAGCA2501 CATGGAGCGA AAACAGTGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT2551 GCAGGCATAC GGCACGATGC GGGCGATATC GGCTATCTCA AAGGCCTGTT2601 CTCCTACGGA CGCTACAAAA ACAGCATCAG CCGCAGCACC GGTGCGGACG2651 AACATGCGGA AGGCAGCGTC AACGGCACGC TGATGCAGCT GGGCGCACTG2701 GGCGGTGTCA ACGTTCCGTT TGCCGCAACG GGAGATTTGA CGGTCGAAGG2751 CGGTCTGCGC TACGACCTGC TCAAACAGGA TGCATTCGCC GAAAAAGGCA2801 GTGCTTTGGG CTGGAGCGGC AACAGCCTCA CTGAAGGCAC GCTGGTCGGA2851 CTCGCGGGTC TGAAGCTGTC GCAACCCTTG AGCGATAAAG CCGTCCTGTT2901 TGCAACGGCG GGCGTGGAAC GCGACCTGAA CGGACGCGAC TACACGGTAA2951 CGGGCGGCTT TACCGGCGCG ACTGCAGCAA CCGGCAAGAC GGGGGCACGC3001 AATATGCCGC ACACCCGTCT GGTTGCCGGC CTGGGCGCGG ATGTCGAATT3051 CGGCAACGGC TGGAACGGCT TGGCACGTTA CAGCTACGCC GGTTCCAAAC3101 AGTACGGCAA CCACAGCGGA CGAGTCGGCG TAGGCTACCG GTTCCTCGAG3151 GGATCCGGAG GGGGTGGTGT CGCCGCCGAC ATCGGTGCGG GGCTTGCCGA3201 TGCACTAACC GCACCGCTCG ACCATAAAGA CAAAGGTTTG CAGTCTTTGA3251 CGCTGGATCA GTCCGTCAGG AAAAACGAGA AACTGAAGCT GGCGGCACAA3301 GGTGCGGAAA AAACTTATGG AAACGGTGAC AGCCTCAATA CGGGCAAATT3351 GAAGAACGAC AAGGTCAGCC GTTTCGACTT TATCCGCCAA ATCGAAGTGG3401 ACGGGCAGCT CATTACCTTG GAGAGTGGAG AGTTCCAAGT ATACAAACAA3451 AGCCATTCCG CCTTAACCGC CTTTAAGACC GAGCAAATAC AAGATTCGGA3501 GCATTCCGGG AAGATGGTTG CGAAACGCCA GTTCAGAATC GGCGACATAG3551 CGGGCGAACA TACATCTTTT GACAAGCTTC CCGAAGGCGG CAGGGCGACA3601 TATCGCGGGA CGGCGTTCGG TTCAGACGAT GCCGGCGGAA AACTGACCTA3651 CACCATAGAT TTCGCCGCCA AGCAGGGAAA CGGCAAAATC GAACATTTGA3701 AATCGCCAGA ACTCAATGTC GACCTGGCCG CCGCCGATAT CAAGCCGGAT3751 GGAAAACGCC ATGCCGTCAT CAGCGGTTCC GTCCTTTACA ACCAAGCCGA3801 GAAAGGCAGT TACTCCCTCG GTATCTTTGG CGGAAAAGCC CAGGAAGTTG3851 CCGGCAGCGC GGAAGTGAAA ACCGTAAACG GCATACGCCA TATCGGCCTT3901 GCCGCCAAGC AACTCGAGCA CCACCACCAC CACCACTGA1 MTSAPDFNAG GTGIGSNSRA TTAKSAAVSY AGIKNRMCKD RSMLCAGRDD51 VAVTDRDAKI NAPPPNLHTG DFPNPNDAYK NLINLKPAIE AGYTGRGVEV101 GIVDTGESVG SISFPELYGR KEHGYNENYK NYTAYMRKEA PEDGGGKDIE151 ASFDDEAVIE TEAKPTDIRH VKEIGHIDLV SHIIGGRSVD GRPAGGIAPD201 ATLHIMNTND ETKNEMMVAA IRNAWVKLGE RGVRIVNNSF GTTSRAGTAD251 LFQIANSEEQ YRQALLDYSG GDKTDEGIRL MQQSDYGNLS YHIRNKNMLF301 IFSTGNDAQA QPNTYALLPF YEKDAQKGII TVAGVDRSGE KFKREMYGEP351 GTEPLEYGSN HCGITAMWCL SAPYEASVRF TRTNPIQIAG TSFSAPIVTG401 TAALLLQKYP WMSNDNLRTT LLTTAQDIGA VGVDSKFGWG LLDAGKAMNG451 PASFPFGDET ADTKGTSDIA YSFRNDISGT GGLIKKGGSQ LQLHGNNTYT501 GKTIIEGGSL VLYGNNKSDM RVETKGALIY NGAASGGSLN SDGIVYLADT551 DQSGANETVH IKGSLQLDGK GTLYTRLGKL LKVDGTAIIG GKLYMSARGK601 GAGYLNSTGR RVPFLSAAKI GQDYSFFTNI ETDGGLLASL DSVEKTAGSE651 GDTLSYYVRR GNAARTASAA AHSAPAGLKH AVEQGGSNLE NLMVELDASE701 SSATPETVET AAADRTDMPG IRPYGATFRA AAAVQHANAA DGVRIFNSLA751 ATVYADSTAA HADMQGRRLK AVSDGLDHNG TGLRVIAQTQ QDGGTWEQGG801 VEGKMRGSTQ TVGIAAKTGE NTTAAATLGM GRSTWSENSA NAKTDSISLF851 AGIRHDAGDI GYLKGLFSYG RYKNSISRST GADEHAEGSV NGTLMQLGAL901 GGVNVPFAAT GDLTVEGGLR YDLLKQDAFA EKGSALGWSG NSLTEGTLVG951 LAGLKLSQPL SDKAVLFATA GVERDLNGRD YTVTGGFTGA TAATGKTGAR1001 NMPHTRLVAG LGADVEFGNG WNGLARYSYA GSKQYGNHSG RVGVGYRFLE
      1051 GSGGGGVAAD IGAGLADALT APLDHKDKGL QSLTLDQSVR KNEKLKLAAQ1101 GAEKTYGNGD SLNTGKLKND KVSRFDFIRQ IEVDGQLITL ESGEFQVYKQ1151 SHSALTAFQT EQIQDSEHSG KMVAKRQFRI GDIAGEHTSF DKLPEGGRAT1201 YRGTAFGSDD AGGKLTYTID FAAKQGNGKI EHLKSPELNV DLAAADIKPD1251 GKRHAVISGS VLYNQAEKGS YSLGIFGGKA QEVAGSAEVK TVNGIRHIGL1301 AAKQLEHHHH HH*ΔG983-9611 ATGACTTCTG CGCCCGACTT CAATGCAGGC GGTACCGGTA TCGGCAGCAA51 CAGCAGAGCA ACAACAGCGA AATCAGCAGC AGTATCTTAC GCCGGTATCA101 AGAACGAAAT GTGCAAAGAC AGAAGCATGC TCTGTGCCGG TCGGGATGAC151 GTTGCGGTTA CAGACAGGGA TGCCAAAATC AATGCCCCCC CCCCGAATCT201 GCATACCGGA GACTTTCCAA ACCCAAATGA CGCATACAAG AATTTGATCA251 ACCTCAAACC TGCAATTGAA GCAGGCTATA GAGGACGCGG GGTAGAGGTA301 GGTATCGTCG ACACAGGCGA ATCCGTCGGC AGCATATCCT TTCCCGAACT351 GTATGGCAGA AAAGAACACG GCTATAACGA AAATTACAAA AACTATACGG401 CGTATATGCG GAAGGAAGCG CCTGAAGACG GAGGCGGTAA AGACATTGAA451 GCTTCTTTCG ACGATGAGGC CGTTATAGAG ACTGAAGCAA AGCCGACGGA501 TATCCGCCAC GTAAAAGAAA TCGGACACAT CGATTTGGTC TCCCATATTA551 TTGGCGGGCG TTCCGTGGAC GGCAGACCTG CAGGCGGTAT TGCGCCCGAT601 GCGACGCTAC ACATAATGAA TACGAATGAT GAAACCAAGA ACGAAATGAT651 GGTTGCAGCC ATCCGCAATG CATGGGTCAA GCTGGGCGAA CGTGGCGTGC701 GCATCGTCAA TAACAGTTTT GGAACAACAT CGAGGGCAGG CACTGCCGAC751 CTTTTCCAAA TAGCCAATTC GGAGGAGCAG TACCGCCAAG CGTTGCTCGA801 CTATTCCGGC GGTGATAAAA CAGACGAGGG TATCCGCCTG ATGCAACAGA851 GCGATTACGG CAACCTGTCC TACCACATCC GTAATAAAAA CATGCTTTTC901 ATCTTTTCGA CAGGCAATGA CGCACAAGCT CAGCCCAACA CATATGCCCT951 ATTGCCATTT TATGAAAAAG ACGCTCAAAA AGGCATTATC ACAGTCGCAG1001 GCGTAGACCG CAGTGGAGAA AAGTTCAAAC GGGAAATGTA TGGAGAACCG1051 GGTACAGAAC CGCTTGAGTA TGGCTCCAAC CATTGCGGAA TTACTGCCAT1101 GTGGTGCCTG TCGGCACCCT ATGAAGCAAG CGTCCGTTTC ACCCGTACAA1151 ACCCGATTCA AATTGCCGGA ACATCCTTTT CCGCACCCAT CGTAACCGGC1201 ACGGCGGCTC TGCTGCTGCA GAAATACCCG TGGATGAGCA ACGACAACCT1251 GCGTACCACG TTGCTGACGA CGGCTCAGGA CATCGGTGCA GTCGGCGTGG1301 ACAGCAAGTT CGGCTGGGGA CTGCTGGATG CGGGTAAGGC CATGAACGGA1351 CCCGCGTCCT TTCCGTTCGG CGACTTTACC GCCGATACGA AAGGTACATC1401 CGATATTGCC TACTCCTTCC GTAACGACAT TTCAGGCACG GGCGGCCTGA1451 TCAAAAAAGG CGGCAGCCAA CTGCAACTGC ACGGCAACAA CACCTATACG1501 GGCAAAACCA TTATCGAAGG CGGTTCGCTG GTGTTGTACG GCAACAACAA1551 ATCGGATATG CGCGTCGAAA CCAAAGGTGC GCTGATTTAT AACGGGGCGG1601 CATCCGGCGG CAGCCTGAAC AGCGACGGCA TTGTCTATCT GGCAGATACC1651 GACCAATCCG GCGCAAACGA AACCGTACAC ATCAAAGGCA GTCTGCAGCT1701 GGACGGCAAA GGTACGCTGT ACACACGTTT GGGCAAACTG CTGAAAGTGG1751 ACGGTACGGC GATTATCGGC GGCAAGCTGT ACATGTCGGC ACGCGGCAAG1801 GGGGCAGGCT ATCTCAACAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC1851 CGCCAAAATC GGGCAGGATT ATTCTTTCTT CACAAACATC GAAACCGACG1901 GCGGCCTGCT GGCTTCCCTC GACAGCGTCG AAAAAACAGC GGGCAGTGAA1951 GGCGACACGC TGTCCTATTA TGTCCGTCGC GGCAATGCGG CACGGACTGC2001 TTCGGCAGCG GCACATTCCG CGCCCGCCGG TCTGAAACAC GCCGTAGAAC2051 AGGGCGGCAG CAATCTGGAA AACCTGATGG TCGAACTGGA TGCCTCCGAA2101 TCATCCGCAA CACCCGAGAC GGTTGAAACT GCGGCAGCCG ACCGCACAGA2151 TATGCCGGGC ATCCGCCCCT ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG2201 TACAGCATGC GAATGCCGCC GACGGTGTAC GCATCTTCAA CAGTCTCGCC2251 GCTACCGTCT ATGCCGACAG TACCGCCGCC CATGCCGATA TGCAGGGACG2301 CCGCCTGAAA GCCGTATCGG ACGGGTTGGA CCACAACGGC ACGGGTCTGC2351 GCGTCATCGC GCAAACCCAA CAGGACGGTG GAACGTGGGA ACAGGGCGGT2401 GTTGAAGGCA AAATGCGCGG CAGTACCCAA ACCGTCGGCA TTGCCGCGAA2451 AACCGGCGAA AATACGACAG CAGCCGCCAC ACTGGGCATG GGACGCAGCA2501 CATGGAGCGA AAACAGTGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT2551 GCAGTCATAC GGCACGATGC GGGCGATATC GGCTATCTCA AAGGCCTGTT2601 CTCCTACGGA CGCTACAAAA ACAGCATCAG CCGCAGCACC GGTGCGGACG2651 AACATGCGGA AGGCAGCGTC AACGGCACGC TGATGCAGCT GGGCGCACTG2701 GGCGGTGTCA ACGTTCCGTT TGCCGCAACG GGAGATTTGA CGGTCGAAGG2751 CGGTCTGCGC TACGACCTGC TCAAACAGGA TGCATTCGCC GAAAAAGGCA2801 GTGCTTTGGG CTGGAGCGGC AACAGCCTCA CTGAAGGCAC GCTGGTCGGA2851 CTCGCGGGTC TGAAGCTGTC GCAACCCTTG AGCGATAAAG CCGTCCTGTT
      2901 TGCAACGGCG GGCGTGGAAC GCGACCTGAA CGGACGCGAC TACACGGTAA2951 CGGGCGGCTT TACCGGCGCG ACTGCAGCAA CCGGCAAGAC GGGGGCACGC3001 AATATGCCGC ACACCCGTCT GGTTGCCGGC CTGGGCGCGG ATGTCGAATT3051 CGGCAACGGC TGGAACGGCT TGGCACGTTA CAGCTACGCC GGTTCCAAAC3101 AGTACGGCAA CCACAGCGGA CGAGTCGGCG TAGGCTACCG GTTCCTCGAG3151 GGTGGCGGAG GCACTGGATC CGCCACAAAC GACGACGATG TTAAAAAAGC3201 TGCCACTGTG GCCATTGCTG CTGCCTACAA CAATGGCCAA GAAATCAACG3251 GTTTCAAAGC TGGAGAGACC ATCTACGACA TTGATGAAGA CGGCACAATT3301 ACCAAAAAAG ACGCAACTGC AGCCGATGTT GAAGCCGACG ACTTTAAAGG3351 TCTGGGTCTG AAAAAAGTCG TGACTAACCT GACCAAAACC GTCAATGAAA3401 ACAAACAAAA CGTCGATGCC AAAGTAAAAG CTGCAGAATC TGAAATAGAA3451 AAGTTAACAA CCAAGTTAGC AGACACTGAT GCCGCTTTAG CAGATACTGA3501 TGCCGCTCTG GATGCAACCA CCAACGCCTT GAATAAAATG GGAGAAAATA3551 TAACGACATT TGCTGAAGAG ACTAAGACAA ATATCGTAAA AATTGATGAA3601 AAATTAGAAG CCGTGGCTGA TACCGTCGAC AAGCATGCCG AAGCATTTAA3651 CGATATCGCC GATTCATTGG ATGAAACCAA CACTAAGGCA GACGAAGCCG3701 TCAAAACCGC CAATGAAGCC AAACAGACGG CCGAAGAAAC CAAACAAAAC3751 GTCGATGCCA AAGTAAAAGC TGCAGAAACT GCAGCAGGCA AAGCCGAAGC3801 TGCCGCTGGC ACAGCTAATA CTGCAGCCGA CAAGGCCGAA GCTGTCGCTG3851 CAAAAGTTAC CGACATCAAA GCTGATATCG CTACGAAAAA AGATAATATT3901 GCTAAAAAAG CAAACAGTGC CGACGTGTAC ACCAGAGAAG AGTCTGACAG3951 CAAATTTGTC AGAATTGATG GTCTGAACGC TACTACCGAA AAATTGGACA4001 CACGCTTGGC TTCTGCTGAA AAATCCATTG CCGATCACGA TACTCGCCTG4051 AACGGTTTGG ATAAAACACT GTCAGACCTG CGCAAAGAAA CCCGCCAAGG4101 CCTTGCAGAA CAAGCCGCGC TCTCCGGTCT GTTCCAACCT TACAACGTGG4151 GTCGGTTCAA TGTAACGGCT GCAGTCGGCG GCTACAAATC CGAATCGGCA4201 GTCGCCATCG GTACCGGCTT CCGCTTTACC GAAAACTTTG CCGCCAAAGC4251 AGGCGTGGCA GTCGGCACTT CGTCCGGTTC TTCCGCAGCC TACCATGTCG4301 GCGTCAATTA CGAGTGGCTC GAGCACCACC ACCACCACCA CTGA1 MTSAPDFNAG GTGIGSNSRA TTAKSAAVSY AGIKNEMCKD RSMLCAGRDD51 VAVTDRDAKI NAPPPNLHTG DFPNPNKAYK NLDNLKPAIE AGYTGRGVEV101 GIVDTGESVG SISFPELYGR KEHGYEENYK NYTAYMRKEA PEDGGGKDIE151 ASFDDEAVIE TEAKPTDIRH VKEIGHIDLV SHIIGGRSVD GRPAGGIAPD201 ATLHIMNTND ETKNEMMVAA IPNAWVKLGE RGVRIVNNSF GTTSRAGTAD251 LFQIANSEEQ YRQALLDYSG GDKTDEGIRL MQQSDYGNLS YHIRNKNMLF301 IFSTGNDAQA QPNTYALLPF YEKDAQKGII TVAGVDRSGE KFKREMYGEP351 GTEPLEYGSN HCGITAMWCL SAPYEASVRF TRTNPIQIAG TSFSAPIVTG401 TAALLLQKYP WMSNDNLRTT LLTTAQDIGA VGVDSKFGWG LLDAGKAMNG451 PASFPFGDFT ADTKGTSDIA YSFRNDISGT GGLIKKGGSQ LQLHGNNTYT501 GKTIIEGGSL VLYGNNKSDM RVETKGALIY NGAASGGSLN SDGIVYLADT551 DQSGANETVH IKGSLQLDGK GTLYTRLGKL LKVDGTAIIG GKLYMSARGK601 GAGYLNSTGR RVPFLSAAKI GQDYSFFTNI ETDGGLLASL DSVEKTSGSE651 GDTLSYYVRR GNAARTASAA AHSAPAGLKH AVEQGGSNLE NLMVELDASE701 SSATPETVET AAADRTDMPG IRPYGATFRA AAAVQHANAA DGVRIFNSLA751 ATVYADSTAA HADMQGRRLK AVSDGLDHNG TGLRVIAQTQ QDGGTWEQGG801 VEGKMRGSTQ TVGIAAKTGE NTTAAATLGM GRSTWSENSA NAKTDSISLF851 AGIRHDAGDI GYLKGLFSYG RYKNSISRST GADEHAEGSV NGTLMQLGAL901 GGVNVPFAAT GDLTVEGGLR YDLLKQDAFA EKGSALGWSG NSLTEGTLVG951 LAGLKLSQPL SDKAVLFATA GVERDLNGRD YTVTGGFTGA TAATGKTGAR1001 NMPHTRLVAG LGADVEFGNG WNGLARYSYA GSKQYGNHSG RVGVGYRFLE1051 GGGGTGSATN DDDVKKAATV AIAAAYNNGQ EINGFKAGET IYDIDEDGTI1101 TKKDATAADV EADDFKGLGL KKVVTNLTKT VNENKQNVDA KVKAAESEIE1151 KLTTKLADTD AALADTDAAL DATTNALNKL GENITTFAEE TKTNIVKIDE1201 KLEAVADTVD DHAEAFNDIA DSLDETNTKA DEAVKTANEA KQTAEETKQN1251 VDAKVKAAET AAGKAEAAAG TANTAADKAE AVAAKVTDIK ADIATNKDNI1301 AKKANSADVY TREESDSKFV RIDGLNATTE KLDTRLASAE KSIADHDTRL1351 NGLDKTVSDL RKETRQGLAE QAALSGLFQP YNVGRFNVTA AVGGYKSESA1401 VAIGTGFRFT KNFAAKAGVA VGTSSGSSAA YHVGVNYEWL EHHHHHH*ΔG983-961c1 ATGACTTCTG CGCCCGACTT CAATGCAGGC GGTACCGGTA TCGGCAGCAA51 CAGCAGAGCA ACAACAGCGA AATCAGCAGC AGTATCTTAC GCCGGTATCA101 AGAACGAAAT GTGCAAAGAC AGAAGCATGC TCTGTGCCGG TCGGGATGAC151 GTTGCGGTTA CAGACAGGGA TGCCAAAATC AATGCCCCCC CCCCGAATCT201 GCATACCGGA GACTTTCCAA ACCCAAATGA CGCATACAAG AATTTGATCA
      251 ACCTCAAACC TGCAATTGAA GCAGGCTATA CAGGACGCGG GGTAGAGGTA301 GGTATCGTCG ACACAGGCGA ATCCGTCGGC AGCATATCCT TTCCCGAACT351 GTATGGCAGA AAAGAACACG GCTATAACGA AAATTACAAA AACTATACGG401 CGTATATGCG GAAGGAAGCG CCTGAAGACG GAGGCGGTAA AGACATTGAA451 GCTTCTTTCG ACGATGAGGC CGTTATAGAG ACTGAAGCAA AGCCGACGGA501 TATCCGCCAC GTAAAAGAAA TCGGACACAT CGATTTGGTC TCCCATATTA551 TTGGCGGGCG TTCCGTGGAC GGCAGACCTG CAGGCGGTAT TGCGCCCGAT601 GCGACGCTAC ACATAATGAA TACGAATGAT GAAACCAAGA ACGAAATGAT651 GGTTGCAGCC ATCCGCAATG CATGGGTCAA GCTGGGCGAA CGTGGCGTGC701 GCATCGTCAA TAACAGTTTT GGAACAACAT CGAGGGCAGG CACTGCCGAC751 CTTTTCCAAA TAGCCAATTC GGAGGAGCAG TACCGCCAAG CGTTGCTCGA801 CTATTCCGGC GGTGATAAAA CAGACGAGGG TATCCGCCTG ATGCAACAGA851 GCGATTACGG CAACCTGTCC TACCACATCC GTAATAAAAA CATGCTTTTC901 ATCTTTTCGA CAGGCAATGA CGCACAAGCT CAGCCCAACA CATATGCCCT951 ATTGCCATTT TATGAAAAAG ACGCTCAAAA AGGCATTATC ACAGTCGCAG1001 GCGTAGACCG CAGTGGAGAA AAGTTCAAAC GGGAAATGTA TGGAGAACCG1051 GGTACAGAAC CGCTTGAGTA TGGCTCCAAC CATTGCGGAA TTACTGCCAT1101 GTGGTGCCTG TCGGCACCCT ATGAAGCAAG CGTCCGTTTC ACCCGTACAA1151 ACCCGATTCA AATTGCCGGA ACATCCTTTT CCGCACCCAT CGTAACCGGC1201 ACGGCGGCTC TGCTGCTGCA GAAATACCCG TGGATGAGCA ACGACAACCT1251 GCGTACCACG TTGCTGACGA CGGCTCAGGA CATCGGTGCA GTCGGCGTGG1301 ACAGCAAGTT CGGCTGGGGA CTGCTGGATG CGGGTAAGGC CATGAACGGA1351 CCCGCGTCCT TTCCGTTCGG CGACTTTACC GCCGATACGA AAGGTACATC1401 CGATATTGCC TACTCCTTCC GTAACGACAT TTCAGGCACG GGCGGCCTGA1451 TCAAAAAAGG CGGCAGCCAA CTGCAACTGC ACGGCAACAA CACCTATACG1501 GGCAAAACCA TTATCGAAGG CGGTTCGCTG GTGTTGTACG GCAACAACAA1551 ATCGGATATG CGCGTCGAAA CCAAAGGTGC GCTGATTTAT AACGGGGCGG1601 CATCCGGCGG CAGCCTGAAC AGCGACGGCA TTGTCTATCT GGCAGATACC1651 GACCAATCCG GCGCAAACGA AACCGTACAC ATCAAAGGCA GTCTGCAGCT1701 GGACGGCAAA GGTACGCTGT ACACACGTTT GGGCAAACTC CTGAAAGTGG1751 ACGGTACGGC GATTATCGGC GGCAAGCTGT ACATGTCGGC ACGCGGCAAG1801 GGGGCAGGCT ATCTCAACAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC1851 CGCCAAAATC GGGCAGGATT ATTCTTTCTT CACAAACATC GAAACCGACG1901 GCGGCCTGCT GGCTTCCCTC GACAGCGTCG AAAAAACAGC GGGCAGTGAA1951 GGCGACACGC TGTCCTATTA TGTCCGTCGC GGCAATGCGG CACGGACTGC2001 TTCGGCAGCG GCACATTCCG CGCCCGCCGG TCTGAAACAC GCCGTAGAAC2051 AGGGCGGCAG CAATCTGGAA AACCTGATGG TCGAACTGGA TGCCTCCGAA2101 TCATCCGCAA CACCCGAGAC GGTTGAAACT GCGGCAGCCG ACCGCACAGA2151 TATGCCGGGC ATCCGCCCCT ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG2201 TACAGCATGC GAATGCCGCC GACGGTGTAC GCATCTTCAA CAGTCTCGCC2251 GCTACCGTCT ATGCCGACAG TCCCGCCGCC CATGCCGATA TGCAGGGACG2301 CCGCCTGAAA GCCGTATCGG ACGGGTTGGA CCACAACGGC ACGGGTCTGC2351 GCGTCATCGC GCAAACCCAA CAGGACGGTG GAACGTGGGA ACAGGGCGGT2401 GTTGAAGGCA AAATGCGCGG CAGTACCCAA ACCGTCGGCA TTGCCGCGAA2451 AACCGGCGAA AATACGACAG CAGCCGCCAC ACTGGGCATG GGACGCAGCA2501 CATGGAGCGA AAACAGTGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT2551 GCAGGCATAC GGCACGATGC GGGCGATATC GGCTATCTCA AAGGCCTGTT2601 CTCCTACGGA CGCTACAAAA ACAGCATCAG CCGCAGCACC GGTGCGGACG2651 AACATGCGGA AGGCAGCGTC AACGGCACGC TGATGCAGCT GGGCGCACTG2701 GGCGGTGTCA ACGTTCCGTT TGCCGCAACG GGAGATTTGA CGGTCGAAGG2751 CGGTCTGCGC TACGACCTGC TCAAACAGGA TGCATTCGCC GAAAAAGGCA2801 GTGCTTTGGG CTGGAGCGGC AACAGCCTCA CTGAAGGCAC GCTGGTCGGA2851 CTCGCGGGTC TGAAGCTGTC GCAACCCTGG AGCGATAAAG CCGTCCTGTT2901 TGCAACGGCG GGCGTGGAAC GCGACCTGAA CGGACGCGAC TACACGGTAA2951 CGGGCGGCTT TACCGGCGCG ACTGCAGCAA CCGGCAAGAC GGGGGCACGC3001 AATATGCCGC ACACCCGTCT GGTTGCCGGC CTGGGCGCGG ATGTCGAATT3051 CGGCAACGGC TGGAACGGCT TGGCACGTTA CAGCTACGCC GGTTCCAAAC3101 AGTACGGCAA CCACAGCGGA CGAGTCGGCG TAGGCTACCG GTTCCTCGAG3151 GGTGGCGGAG GCACTGGATC CGCCACAAAC GACGACGATG TTAAAAAAGC3201 TGCCACTGTG GCCATTGCTG CTGCCTACAA CAATGGCCAA GAAATCAACG3251 GTTTCAAAGC TGGAGAGACC ATCTACGACA TTGATGAAGA CGGCACAATT3301 ACCAAAAAAG ACGCAACTGC AGCCGATGTT GAAGCCGACG ACTTTAAAGG3351 TCTGGGTCTG AAAAAAGTCG TGACTAACCT GACCAAAACC GTCAATGAAA3401 ACAAACAAAA CGTCGATGCC AAAGTAAAAG CTGCAGAATC TGAAATAGAA3451 AAGTTAACAA CCAAGTTAGC AGACACTGAT GCCGCTTTAG CAGATACTGA3501 TGCCGCTCTG GATGCAACCA CCAACGCCTT GAATAAATTG GGAGAAAATA3551 TAACGACATT TGCTGAAGAG ACTAAGACAA ATATCGTAAA AATTGATGAA
      3601 AAATTAGAAG CCGTGGCTGA TACCGTCGAC AAGCATGCCG AAGCATTCAA3651 CGATATCGCC GATTCATTGG ATGAAACCAA CACTAAGGCA GACGAAGCCG3701 TCAAAACCGC CAATGAAGCC AAACAGACGG CCGAAGAAAC CAAACAAAAC3751 GTCGATGCCA AAGTAAAAGC TGCAGAAACT GCAGCAGGCA AAGCCGAAGC3801 TGCCGCTGGC ACAGCTAATA CTGCAGCCGA CAAGGCCGAA GCTGTCGCTG3851 CAAAAGTTAC CGACATCAAA GCTGATATCG CTACGAACAA AGATAATATT3901 GCTAAAAAAG CAAACAGTGC CGACGTGTAC ACCAGAGAAG AGTCTGACAG3951 CAAATTTGTC AGAATTGATG GTCTGAACGC TACTACCGAA AAATTGGACA4001 CACGCTTGGC TTCTGCTGAA AAATCCATTG CCGATCACGA TACTCGCCTG4051 AACGGTTTGG ATAAAACAGT GTCAGACCTG CGCAAAGAAA CCCGCCAAGG4101 CCTTGCAGAA CAAGCCGCGC TCTCCGGTCT GTTCCAACCT TACAACGTGG4151 GTCTCGAGCA CCACCACCAC CACCACTGA1 MTSAPDFNAG GTGIGSNSRA TTAKSAAVSY AGIKNEMCKD RSMLCAGRDD51 VAVTDRDAKI NAPPPNLHTG DFPNPNDAYK NLINLKPAIE AGYTGRGVEV101 GIVDTGESVG SISFPRLYGR KKHGYNENYK NYTAYMRKEA PEDGGGKDIE151 ASFDDKAVIE TEAKPTDIRH VKEIGHIDLV SHIIGGRSVD GRPAGGIAPD201 ATLHIMNTND ETKNEMMVAA IRNAWVKLGE RGVRIVNNSF GTTSRAGTAD251 LFQIANSEEQ YRQALLDYSG GDKTDEGIRL MQQSDYGNLS YHIRNKNMLF301 IFSTGNDAQA QPNTYALLPF YEKDAQKGII TVAGVDRSGE KFKREMYGEP351 GTEPLEYGSN HCGITAMWCL SAPYEASVRF TRTNPIQIAG TSFSAPIVTG401 TAALLLQKYP WMSNDNLRTT LLTTAQDIGA VGVDSKFGWG LLDAGKAMNG451 PASFPFGDFT ADTKGTSDIA YSFRNDISGT GGLIKKGGSQ LQLHGNNTYT501 GKTIIEGGSL VLYGNNKSDM RVETKGALIY NGAASGGSLN SDGIVYLADT551 DQSGANETVH IKGSLQLDGK GTLYTRLGKL LKVDGTAIIG GKLYMSARGK601 GAGYLNSTGR RVPFLSAAKI GQDYSFFINI ETDGGLLASL DSVEKTAGSE651 GDTLSYYVRR GNAARTASAA AHSAPAGLKH AVEQGGSNLE NLMVELDASE701 SSATPETVET AAADRTDMPG IRPYGATFRA AAAVQHANAA DGVRIFNSLA751 ATVYADSTAA HADMQGRRLK AVSDGLDHNG TGLRVIAQTQ QDGGTWEQGG801 VEGKMRGSTQ TVGIAAKTGE NTTAAATLGM GRSTWSENSA NAKTDSISLF851 AGIRHDAGDI GYLKGLFSYG RYKNSISRST GADEHAEGSV NGTLMQLGAL901 GGVNVPFAAT GDLTVEGGLR YDLLKQDAFA EKGSALGWSG NSLTEGTLVG951 LAGLKLSQPL SDKAVLFATA GVERKLNGRD YTVTGGFTGA TAATGKTGAR1001 NMPHTRLVAG LGADVEFGNG WNGLARYSYA GSKQYGNHSG RVGVGYRFLE1051 GGGGTGSATN DDDVKKAATV AIAAAYNNGQ EINGFKAGET IYDIDEDGTI1101 TKKDATAADV EADDFKGLGL KKVVTNLTKT VNENKQNVDA KVKAAESEIE1151 KLTTKLADTD AALADTDAAL DATTNALNKL GENITTFAEE TKTNIVKIDE1201 KLEAVADTVD KHAEAFNDIA DSLDETNTKA DEAVKTANEA KQTAEETKQN1251 VDAKVKAAET AAGKAEAAAG TANTAADKAE AVAAKVTDID ADIATNKDNI1301 AKKANSADVY TREESDSKFV RIDGLNATTE KLDTRLASAE KSIADHDTRL1351 NGLDKTVSDL RKETRQGLAE QAALSGLFQP YNVGLEHHHH HH*ΔG741和雜交體針對(duì)各種菌株(包括同源2996菌株),測(cè)定由應(yīng)答ΔG741(His-融合)產(chǎn)生的殺菌滴定度

      可以看出,針對(duì)異源菌株MC58,由ΔG741引發(fā)的抗-殺菌滴定度特別高。
      還將ΔG741直接融合于蛋白質(zhì)961、961c、983和ORF46.1的符合讀框的上游ΔG741-9611 ATGGTCGCCG CCGACATCGG TGCGGGGCTT GCCGATGCAC TAACCGCACC51 GCTCGACCAT AAAGACAAAG GTTTGCAGTC TTTGACGCTG GATCAGTCCG101 TCAGGAAAAA CGAGAAACTG AAGCTGGCGG CACAAGGTGC GGAAAAAACT151 TATGGAAACG GTGACAGCCT CAATACGGGC AAATTGAAGA ACGACAAGGT201 CAGCCGTTTC GACTTTATCC GCCAAATCGA AGTGGACGGG CAGCTCATTA
      251 CCTTGGAGAG TGGAGAGTTC CAAGTATACA AACAAAGCCA TTCCGCCTTA301 ACCGCCTTTC AGACCGAGCA AATACAAGAT TCGGAGCATT CCGGGAAGAT351 GGTTGCGAAA CGCCAGTTCA GAATCGGCGA CATAGCGGGC GAACATACAT401 CTTTTGACAA GCTTCCCGAA GGCGGCAGGG CGACATATCG CGGGACGGCG451 TTCGGTTCAG ACGATGCCGG CGGAAAACTG ACCTACACCA TAGATTTCGC501 CGCCAAGCAG GGAAACGGCA AAATCGAACA TTTGAAATCG CCAGAACTCA551 ATGTCGACCT GGCCGCCGCC GATATCAAGC CGGATGGAAA ACGCCATGCC601 GTCATCAGCG GTTCCGTCCT TTACAACCAA GCCGAGAAAG GCAGTTACTC651 CCTCGGTATC TTTGGCGGAA AAGCCCAGGA AGTTGCCGGC AGCGCGGAAG701 TGAAAACCGT AAACGGCATA CGCCATATCG GCCTTGCCGC CAAGCAACTC751 GAGGGTGGCG GAGGCACTGG ATCCGCCACA AACGACGACG ATGTTAAAAA801 AGCTGCCACT GTGGCCATTG CTGCTGCCTA CAACAATGGC CAAGAAATCA851 ACGGTTTCAA AGCTGGAGAG ACCATCTACG ACATTGATGA AGACGGCACA901 ATTACCAAAA AAGACGCAAC TGCAGCCGAT GTTGAAGCCG ACGACTTTAA951 AGGTCTGGGT CTGAAAAAAG TCGTGACTAA CCTGACCAAA ACCGTCAATG1001 AAAACAAACA AAACGTCGAT GCCAAAGTAA AAGCTGCAGA ATCTGAAATA1051 GAAAAGTTAA CAACCAAGTT AGCAGACACT GATGCCGCTT TAGCAGATAC1101 TGATGCCGCT CTGGATGCAA CCACCAACGC CTTGAATAAA TTGGGAGAAA1151 ATATAACGAC ATTTGCTGAA GAGACTAAGA CAAATATCGT AAAAATTGAT1201 GAAAAATTAG AAGCCGTGGC TGATACCGTC GACAAGCATG CCGAAGCATT1251 CAACGATATC GCCGATTCAT TGGATGAAAC CAACACTAAG GCAGACGAAG1301 CCGTCAAAAC CGCCAATGAA GCCAAACAGA CGGCCGAAGA AACCAAACAA1351 AACGTCGATG CCAAAGTAAA AGCTGCAGAA ACTGCAGCAG GCAAAGCCGA1401 AGCTGCCGCT GGCACAGCTA ATACTGCAGC CGACAAGGCC GAAGCTGTCG1451 CTGCAAAAGT TACCGACATC AAAGCTGATA TCGCTACGAA CAAAGATAAT1501 ATTGCTAAAA AAGCAAACAG TGCCGACGTG TACACCAGAG AAGAGTCTGA1551 CAGCAAATTT GTCAGAATTG ATGGTCTGAA CGCTACTACC GAAAAATTGG1601 ACACACGCTT GGCTTCTGCT GAAAAATCCA TTGCCGATCA CGATACTCGC1651 CTGAACGGTT TGGATAAAAC AGTGTCAGAC CTGCGCAAAG AAACCCGCCA1701 AGGCCTTGCA GAACAAGCCG CGCTCTCCGG TCTGTTCCAA CCTTACAACG1751 TGGGTCGGTT CAATGTAACG GCTGCAGTCG GCGGCTACAA ATCCGAATCG1801 GCAGTCGCCA TCGGTACCGG CTTCCGCTTT ACCGAAAACT TTGCCGCCAA1851 AGCAGGCGTG GCAGTCGGCA CTTCGTCCGG TTCTTCCGCA GCCTACCATG1901 TCGGCGTCAA TTACGAGTGG CTCGAGCACC ACCACCACCA CCACTGA1 MVAADIGAGL ADALTAPLDH KDKGLQSLTL DQSVRKNEKL KLAAQGAEKT51 YGNGDSLNTG KLKNDKVSRF DFIRQIEVDG QLITLESGEF QVYKQSHSAL101 TAFQTEQIQD SEHSGKMVAK RQFRIGDIAG EHTSFDKLPE GGRATYRGTA151 FGSDDAGGKL TYTIDFAAKQ GNGKIEHLKS PELNVDLAAA DIKPDGKRHA201 VISGSVLYNQ AEKGSYSLGI FGGKAQEVAG SAEVKTVNGI RHIGLAAKQL251 EGGGGTGSAT NDDDVKKAAT VAIAAAYNNG QEINGFKAGE TIYDIDEDGT301 ITKKDATAAD VEADDFKGLG LKKVVTNLTK TVNENKQNVD AKVKAAESEI351 EKLTTKLADT DAALADTDAA LDATTNALNK LGENITTFAE ETKTNIVKID401 EKLEAVADTV DKHAEAFNDI ADSLDETNTK ADEAVKTANE AKQTAEETKQ451 NVDAKVKAAE TAAGKAEAAA GTANTAADKA EAVAAKVTDI KADIATNKDN501 IAKKANSADV YTREESDSKF VRIDGLNATT EKLDTRLASA EKSIADHDTR551 LNGLDKTVSD LRKETRQGLA EQAALSGLFQ PYNVGRFNVT AAVGGYKSES601 AVAIGTGFRF TENFAAKAGV AVGTSSGSSA AYHVGVNYEW LEHHHHHH*ΔG741-961c1 ATGGTCGCCG CCGACATCGG TGCGGGGCTT GCCGATGCAC TAACCGCACC51 GCTCGACCAT AAAGACAAAG GTTTGCAGTC TTTGACGCTG GATCAGTCCG101 TCAGGAAAAA CGAGAAACTG AAGCTGGCGG CACAAGGTGC GGAAAAAACT151 TATGGAAACG GTGACAGCCT CAATACGGGC AAATTGAAGA ACGACAAGGT201 CAGCCGTTTC GACTTTATCC GCCAAATCGA AGTGGACGGG CAGCTCATTA251 CCTTGGAGAG TGGAGAGTTC CAAGTATACA AACAAAGCCA TTCCGCCTTA301 ACCGCCTTTC AGACCGAGCA AATACAAGAT TCGGAGCATT CCGGGAAGAT351 GGTTGCCAAA CGCCAGTTCA GAATCGGCGA CATAGCGGGC GAACATACAT401 CTTTTGACAA GCTTCCCGAA GGCGGCAGGG CGACATATCG CGGGACGGCG451 TTCGGTTCAG ACGATGCCGG CGGAAAACTG ACCTACACCA TAGATTTCGC501 CGCCAAGCAG GGAAACGGCA AAATCGAACA TTTGAAATCG CCAGAACTCA551 ATGTCGACCT GGCCGCCGCC GATATCAAGC CGGATGGAAA ACGCCATGCC601 GTCATCAGCG GTTCCGTCCT TTACAACCAA GCCGAGAAAG GCAGTTACTC651 CCTCGGTATC TTTGGCGGAA AAGCCCAGGA AGTTGCCGGC AGCGCGGAAG701 TGAAAACCGT AAACGGCATA CGCCATATCG GCCTGCCCGC CAAGCAACTC751 GAGGGTGGCG GAGGCACTGG ATCCGCCACA AACGACGACG ATGTTAAAAA
      801 AGCTGCCACT GTGGCCATTG CTGCTGCCTA CAACAATGGC CAAGAAATCA851 ACGGTTTCAA AGCTGGAGAG ACCATCTACG ACATTGATGA AGACGGCACA901 ATTACCAAAA AAGACGCAAC TGCAGCCGAT GTTGAAGCCG ACGACTTTAA951 AGGTCTGGGT CTGAAAAAAG TCGTGACTAA CCTGACCAAA ACCGTCAATG1001 AAAACAAACA AAACGTCGAT GCCAAAGTAA AAGCTGCAGA ATCTGAAATA1051 GAAAAGTTAA CAACCAAGTT AGCAGACTCT GATGCCGCTT TAGCAGATAC1101 TGATGCCGCT CTGGATGCAA CCACCAACGC CTTGAATAAA TTGGGAGAAA1151 ATATAACGAC ATTTGCTGAA GAGACTAAGA CAAATATCGT AAAAATTGAT1201 GAAAAATTAG AAGCCGTGGC TGATACCGTC GACAAGCATG CCGAAGCATT1251 CAACGATATC GCCGATTCAT TGGATGAAAC CAACACTAAG GCAGACGAAG1301 CCGTCAAAAC CGCCAATGAA GCCAAACAGA CGGCCGAAGA AACCAAACAA1351 AACGTCGATG CCAAAGTAAA AGCTGCAGAA ACTGCAGCAG GCAAAGCCGA1401 AGCTGCCGCT GGCACAGCTA ATACTGCAGC CGACAAGGCC GAAGCTGTCG1451 CTGCAAAAGT TACCGACATC AAAGCTGATA TCGCTACGAA CAAAGATAAT1501 ATTGCTAAAA AAGCAAACAG TGCCGACGTG TACACCAGAG AAGAGTCTGA1551 CAGCAAATTT GTCAGAATTG ATGGTCTGAA CGCTACTACC GAAAAATTGG1601 ACACACGCTT GGCTTCTGCT GAAAAATCCA TTGCCGATCA CGATACTCGC1651 CTGAACGGTT TGGATAAAAC AGTGTCAGAC CTGCGCAAAG AAACCCGCCA1701 AGGCCTTGCA GAACAAGCCG CGCTCTCCGG TCTGTTCCAA CCTTACAACG1751 TGGGTCTCGA GCACCACCAC CACCACCACT GA1 MVAADIGAGL ADALTAPLDH KDKGLQSLTL DQSVRKNEKL KLAAQGAEKT51 YGNGDSLNTG KNKNDKVSRF DFIRQIEVDG QLITLESGEF QVYKQSHSAL101 TAFQTEQIQD SEHSGKMVAK RQFRIGDIAG EHTSFDKLPE GGRATYRGTA151 FGSDDAGGKL TYTIDFAAKQ GNGKIEHLKS PHLNVDLAAA DIKPDGKRHA201 VISGSLYLNQ AEKGSYSLGI FGGKAQEVAG SAEVKTVNGI RHIGLAAKQL251 EGGGGTGSAT NDDDVKKAAT VAIAAAYNNG QEINGFKAGE TIYDIDEDGT301 ITKKDATAAD VEADDFKGLG LKKVVTNLTK TVNENKQNVD AKVKAAESEI351 EKLTTKLADT DAALADTDAA LDATTNALNK LGENITTFAE ETKTNIVKID401 EKLEAVADTV DKHAEAFNDI ADSLDETNTK ADEAVETANE AKQTAEETKQ451 NVDAKVKAAE TAAGKAEAAA GTANTAADKA EAVAAKVTDI KADIATNKDN501 IAKKANSADV YTREESDSKF VRIDGLNATT EKLDTRLASA EKSIADHDTR551 LNGLDKTVSD LRKETRQGLA EQAALSGLFQ PYNVGLEHHH HHH*ΔG741-9831 ATGGTCGCCG CCGACATCGG TGCGGGGCTT GCCGATGCAC TAACCGCACC51 GCTCGACCAT AAAGACAAAG GTTTGCAGTC TTTGACGCTG GATCAGTCCG101 TCAGGAAAAA CGAGAAACTG AAGCTGGCGG CACAAGGTGC GGAAAAAACT151 TATGGAAACG GTGACAGCCT CAATACGGGC AAATTGAAGA ACGACAAGGT201 CAGCCGTTTC GACTTTATCC GCCAAATCGA AGTGGACGGG CAGCTCATTA251 CCTTGGAGAG TGGAGAGTTC CAAGTATACA AACAAAGCCA TTCCGCCTTA301 ACCGCCTTTC AGACCGAGCA AATACAAGAT TCGGAGCATT CCGGGAAGAT351 GGTTGCGAAA CGCCAGTTCA GAATCGGCGA CATAGCGGGC GAACATACAT401 CTTTTGACAA GCTTCCCGAA GGCGGCAGGG CGACATATCG CGGGACGGCG451 TTCGGTTCAG ACGATGCCGG CGGAAAACTG ACCTACACCA TAGATTTCGC501 CGCCAAGCAG GGAAACGGCA AAATCGAACA TTTGAAATCG CCAGAACTCA551 ATGTCGACCT GGCCGCCGCC GATATCAAGC CGGATGGAAA ACGCCATGCC601 GTCATCAGCG GTTCCGTCCT TTACAACCAA GCCGAGAAAG GCAGTTACTC651 CCTCGGTATC TTTGGCGGAA AAGCCCAGGA AGTTGCCGGC AGCGCGGAAG701 TGAAAACCGT AAACGGCATA CGCCATATCG GCCTTGCCGC CAAGCAACTC751 GAGGGATCCG GCGGAGGCGG CACTTCTGCG CCCGACTTCA ATGCAGGCGG801 TACCGGTATC GGCAGCAACA GCAGAGCAAC AACAGCGAAA TCAGCAGCAG851 TATCTTACGC CGGTATCAAG AACGAAATGT GCAAAGACAG AAGCATGCTC901 TGTGCCGGTC GGGATGACGT TGCGGTTACA GACAGGGATG CCAAAATCAA951 TGCCCCCCCC CCGAATCTGC ATACCGGAGA CTTTCCAAAC CCAAATGACG1001 CATACAAGAA TTTGATCAAC CTCAAACCTG CAATTGAAGC AGGCTATACA1051 GGACGCGGGG TAGAGGTAGG TATCGTCGAC ACAGGCGAAT CCGTCGGCAG1101 CATATCCTTT CCCGAACTGT ATGGCAGAAA AGAACACGGC TATAACGAAA1151 ATTACAAAAA CTATACGGCG TATATGCGGA AGGAAGCGCC TGAAGACGGA1201 GGCGGTAAAG ACATTGAAGC TTCTTTCGAC GATGAGGCCG TTATAGAGAC1251 TGAAGCAAAG CCGACGGATA TCCGCCACGT AAAAGAAATG GGACACATCG1301 ATTTGGTCTC CCATATTATT GGCGGGCGTT CCGTGGACGG CAGACCTGCA1351 GGCGGTATTG CGCCCGATGC GACGCTACAC ATAATGAATA CGAATGATGA1401 AACCAAGAAC GAAATGATGG TTGCAGCCAT CCGCAATGCA TGGGTCAAGC1451 TGGGCGAACG TGGCGTGCGC ATCGTCAATA ACAGTTTTGG AACAACATCG1501 AGGGCAGGCA CTGCCGACCT TTTCCAAATA GCCAATTCGG AGGAGCAGTA
      1551 CCGCCAAGCG TTGCTCGACT ATTCCGGCGG TGATAAAACA GACGAGGGTA1601 TCCGCCTGAT GCAACAGAGC GATTACGGCA ACCTGTCCTA CCACATCCGT1651 AATAAAAACA TGCTTTTCAT CTTTTCGACA GGCAATGACG CACAAGCTCA1701 GCCCAACACA TATGCCCTAT TGCCATTTTA TGAAAAAGAC GCTCAAAAAG1751 GCATTATCAC AGTCGCAGGC GTAGACCGCA GTGGAGAAAA GTTCAAACGG1801 GAAATGTATG GAGAACCGGG TACAGAACCG CTTGAGTATG GCTCCAACCA1851 TTGCGGAATT ACTGCCATGT GGTGCCTGTC GGCACCCTAT GAAGCAAGCG1901 TCCGTTTCAC CCGTACAAAC CCGATTCAAA TTGCCGGAAC ATCCTTTTCC1951 GCACCCATCG TAACCGGCAC GGCGGCTCTG CTGCTGCAGA AATACCCGTG2001 GATGAGCAAC GACAACCTGC GTACCACGTT GCTGACGACG GCTCAGGACA2051 TCGGTGCAGT CGGCGTGGAC AGCAAGTTCG GCTGGGGACT GCTGGATGCG2101 GGTAAGGCCA TGAACGGACC CGCGTCCTTT CCGTTCGGCG ACTTTACCGC2151 CGATACGAAA GGTACATCCG ATATTGCCTA CTCCTTCCGT AACGACATTT2201 CAGGCACGGG CGGCCTGATC AAAAAAGGCG GCAGCCAACT GCAACTGCAC2251 GGCAACAACA CCTATACGGG CAAAACCATT ATCGAAGGCG GTTCGCTGGT2301 GTTGTACGGC AACAACAAAT CGGATATGCG CGTCGAAACC AAAGGTGCGC2351 TGATTTATAA CGGGGCGGCA TCCGGCGGCA GCCTGAACAG CGACGGCATT2401 GTCTATCTGG CAGATACCGA CCAATCCGGC GCAAACGAAA CCGTACACAT2451 CAAAGGCAGT CTGCAGCTGG ACGGCAAAGG TACGCTGTAC ACACGTTTGG2501 GCAAACTGCT GAAAGTGGAC GGTACGGCGA TTATCGGCGG CAAGCTGTAC2551 ATGTCGGCAC GCGGCAAGGG GGCAGGCTAT CTCAACAGTA CCGGACGACG2601 TGTTCCCTTC CTGAGTGCCG CCAAAATCGG GCAGGATTAT TCTTTCTTCA2651 CAAACATCGA AACCGACGGC GGCCTGCTGG CTTCCCTCGA CAGCGTCGAA2701 AAAACAGCGG GCAGTGAAGG CGACACGCTG TCCTATTATG TCCGTCGCGG2751 CAATGCGGCA CGGACTGCTT CGGCAGCGGC ACATTCCGCG CCCGCCGGTC2801 TGAAACACGC CGTAGAACAG GGCGGCAGCA ATCTGGAAAA CCTGATGGTC2851 GAACTGGATG CCTCCGAATC ATCCGCAACA CCCGAGACGG TTGAAACTGC2901 GGCAGCCGAC CGCACAGATA TGCCGGGCAT CCGCCCCTAC GGCGCAACTT2951 TCCGCGCAGC GGCAGCCGTA CAGCATGCGA ATGCCGCCGA CGGTGTACGC3001 ATCTTCAACA GTCTCGCCGC TACCGTCTAT GCCGACAGTA CCGCCGCCCA3051 TGCCGATATG GAGGGACGCC GCCTGAAAGC CGTATCGGAC GGGTTGGACC3101 ACAACGGCAC GGGTCTGCGC GTCATCGCGC AAACCCAACA GGACGGTGGA3151 ACGTGGGAAC AGGGCGGTGT TGAAGGCAAA ATGCGCGGCA GTACCCAAAC3201 CGTCGGCATT GCCGCGAAAA CCGGCGAAAA TACGACAGCA GCCGCCACAC3251 TGGGCATGGG ACGCAGCACA TGGAGCGAAA ACAGTGCAAA TGCAAAAACC3301 GACAGCATTA GTCTGTTTGC AGGCATACGG CACGATGCGG GCGATATCGG3351 CTATCTCAAA GGCCTGTTCT CCTACGGACG CTACAAAAAC AGCATCAGCC3401 GCAGCACCGG TGCGGACGAA CATGCGGAAG GCAGCGTCAA CGGCACGCTG3451 ATGCAGCTGG GCGCACTGGG CGGTGTCAAC GTTCCGTTTG CCGCAACGGG3501 AGATTTGACG GTCGAAGGCG GTCTGCGCTA CGACCTGCTC AAACAGGATG3551 CATTCGCCGA AAAAGGCAGT GCTTTGGGCT GGAGCGGCAA CAGCCTCACT3601 GAAGGCACGC TGGTCGGACT CGCGGGTCTG AAGCTGTCGC AACCCTTGAG3651 CGATAAAGCC GTCCTGTTTG CAACGGCGGG CGTGGAACGC GACCTGAACG3701 GACGCGACTA CACGGTAACG GGCGGCTTTA CCGGCGCGAC TGCAGCAACC3751 GGCAAGACGG GGGCACGCAA TATGCCGCAC ACCCGTCTGG TTGCCGGCCT3801 GGGCGCGGAT GTCGAATTCG GCAACGGCTG GAACGGCTTG GCACGTTACA3851 GCTACGCCGG TTCCAAACAG TACGGCAACC ACAGCGGACG AGTCGGCGTA3901 GGCTACCGGT TCCTCGAGCA CCACCACCAC CACCACTGA1 MVAADIGAGL ADALTAPLDH KDKGLQSLTL DQSVRKNEKL KLAAQGAEKT51 YGNGDSLNTG KLKNDKVSRF DFIRQIEVDG QLITLESGEF QVYKQSHSAL101 TAFQTEQIQD SEHSGKMVAK RQFRIGDIAG EHTSFDKLPE GGRATYRGTA151 FGSDDAGGKL TYTIDFAAKQ GNGKIEHLKS PELNVDLAAA DIKPDGKRHA201 VISGSVLYNQ AEKGSYSLGI FGGKAQEVAG SAEVKTVNGI RHIGLAAKQL251 EGSGGGGTSA PDFNAGGTGI GSNSRATTAK SAAVSYAGIK NEMCKDRSML301 CAGRDDVAVT DRDAKINAPP PNLHTGDFPN PNDAYKNLIN LKPAIEAGYT351 GRGVEVGIVD TGESVGSISF PELYGRKEHG YNENYKNYTA YMRKEAPEDG401 GGKDIEASFD DEAVIETEAK PTDIRHVKEI GHIDLVSHII GGRSVDGRPA451 GGIAPDATLH IMNTNDETKN EMMVAAIRNA WVKLGERGVR IVNNSFGTTS501 RAGTADLFQI ANSEEQYRQA LLKYSGGDKT DEGIRLMQQS DYGNLSYHIR551 NKNMLFIFST GNDAQAAPNT YALLPFYEKD AQKGIITVAG VDRSGEKFKR601 EMYGEPGTEP LEYGSNHCGI TAMWCLSAPY EASVRFTRTN PIQIAGTSFS651 APIVTGTAAL LLQKYPWMSN DNLRTTLLTT AQDIGAVGVD SKFGWGLLDA701 GKAMNGPASF PFGDFTADTK GTSDIAYSFR NDISGTGGLI KKGGSQLQLH751 GNNTYTGKTI IEGGSLVLYG NNKSDMRVET KGALIYNGAA SGGSLNSDGI801 VYLADTDQSG ANETVHIKGS LQLDGKGTLY TRLGKLLKVD GTVIIGGKLY851 MSARGKGAGY LNSTGRRVPF LSAAKIGQDY SFFTNIETDG GLLASLDSVE
      901 KTAGSEGDTL SYYVRRGNAA RTASAAAHSA PAGLKHAVEQ GGSNLENLMV951 ELDASESSAT PETVETAAAD RTDMPGIRPY GATFRAAAAV QHANAADGVR1001 IFNSLAATVY ADSTAAHADM QGRRLKAVSD GLDHNGTGLR VIAQTQQDGG1051 TWEQGGVEGK MRGSTQTVGI AAKTGENTTA AATLGMGRST WSENSANAKT1101 DSISLFAGIR HDAGDIGYLK GLFSYGRYKN SISRSTGADE HAEGSVNGTL1151 MQLGALGGVN VPFAATGDLT VEGGLRYDLL KQDAFAEKGS ALGWSGNSLT1201 EGTLVGLAGL KLSQPLSDKA VLFATAGVER DLNGRDYTVT GGFTGATAAT1251 GKTGARNMPH TRLVAGLGAD VEFGNGWNGL ARYSYAGSKQ YGNHSGRVGV1301 GYRFLEHHHH HH*△G741-ORF46.11 ATGGTCGCCG CCGACATCGG TGCGGGGCTT GCCGATGCAC TAACCGCACC51 GCTCGACCAT AAAGACAAAG GTTTGCAGTC TTTGACGCTG GATCAGTCCG101 TCAGGAAAAA CGAGAAACTG AAGCTGGCGG CACAAGGTGC GGAAAAAACT151 TATGGAAACG GTGACAGCCT CAATACGGGC AAATTGAAGA ACGACAAGGT201 CAGCCGTTTC GACTTTATCC GCCAAATCGA AGTGGACGGG CAGCTCATTA251 CCTTGGAGAG TGGAGAGTTC CAAGTATACA AACAAAGCCA TTCCGCCTTA301 ACCGCCTTTC AGACCGAGCA AATACAAGAT TCGGAGCATT CCGGGAAGAT351 GGTTGCGAAA CGCCAGTTCA GAATCGGCGA CATAGCGGGC GAACATACAT401 CTTTTGACAA GCTTCCCGAA GGCGGCAGGG CGACATATCG CGGGACGGCG451 TTCGGTTCAG ACGATGCCGG CGGAAAACTG ACCTACACCA TAGATTTCGC501 CGCCAAGCAG GGAAACGGCA AAATCGAACA TTTGAAATCG CCAGAACTCA551 ATGTCGACCT GGCCGCCGCC GATATCAAGC CGGATGGAAA ACGCCATGCC601 GTCATCAGCG GTTCCGTCCT TTACAACCAA GCCGAGAAAG GCAGTTACTC651 CCTCGGTATC TTTGGCGGAA AAGCCCAGGA AGTTGCCGGC AGCGCGGAAG701 TGAAAACCGT AAACGGCATA CGCCATATCG GCCTTGCCGC CAAGCAACTC751 GACGGTGGCG GAGGCACTGG ATCCTCAGAT TTGGCAAACG ATTCTTTTAT801 CCGGCAGGTT CTCGACCGTC AGCATTTCGA ACCCGACGGG AAATACCACC851 TATTCGGCAG CAGGGGGGAA CTTGCCGAGC GCAGCGGCCA TATCGGATTG901 GGAAAAATAC AAAGCCATCA GTTGGGCAAC CTGATGATTC AACAGGCGGC951 CATTAAAGGA AATATCGGCT ACATTGTCCG CTTTTCCGAT CACGGGCACG1001 AAGTCCATTC CCCCTTCGAC AACCATGCCT CACATTCCGA TTCTGATGAA1051 GCCGGTAGTC CCGTTGACGG ATTTAGCCTT TACCGCATCC ATTGGGACGG1101 ATACGAACAC CATCCCGCCG ACGGCTATGA CGGGCCACAG GGCGGCGGCT1151 ATCCCGCTCC CAAAGGCGCG AGGGATATAT ACAGCTACGA CATAAAAAGC1201 GTTGCCCAAA ATATCCGCCT CAACCTGACC GACAACCGCA GCACCGGACA1251 ACGGCTTGCC GACCGTTTCC ACAATGCCGG TAGTATGCTG ACGCAAGGAG1301 TAGGCGACGG ATTCAAACGC GCCACCCGAT ACAGCCCCGA GCTGGACAGA1351 TCGGGCAATG CCGCCGAAGC CTTCAACGGC ACTGCAGATA TCGTTAAAAA1401 CATCATCGGC GCGGCAGGAG AAATTGTCGG CGCAGGCGAT GCCGTGCAGG1451 GCATAAGCGA AGGCTCAAAC ATTGCTGTCA TGCACGGCTT GGGTCTGCTT1501 TCCACCGAAA ACAAGATGGC GCGCATCAAC GATTTGGCAG ATATGGCGCA1551 ACTCAAAGAC TATGCCGCAG CAGCCATCCG CGATTGGGCA GTCCAAAACC1601 CCAATGCCGC ACAAGGCATA GAAGCCGTCA GCAATATCTT TATGGCAGCC1651 ATCCCCATCA AAGGGATTGG AGCTGTTCGG GGAAAATACG GCTTGGGCGG1701 CATCACGGCA CATCCTATCA AGCGGTCGCA GATGGGCGCG ATCGCATTGC1751 CGAAAGGGAA ATCCGCCGTC AGCGACAATT TTGCCGATGC GGCATACGCC1801 AAATACCCGT CCCCTTACCA TTCCCGAAAT TATCCGTCAA ACTTGGAGCA1851 GCGTTACGGC AAAGAAAACA TCACCTCCTC AACCGTGCCG CCGTCAAACG1901 GCAAAAATGT CAAACTGGCA GACCAACGCC ACCCGAAGAC AGGCGTACCG1951 TTTGACGGTA AAGGGTTTCC GAATTTTGAG AAGCACGTGA AATATGATAC2001 GCTCGAGCAC CACCACCACC ACCACTGA1 MVAADIGAGL ADALTAPLDH KDKGLQSLTL DQSVRKNEKL KLAAQGAEKT51 YGNGDSLNTG KLKNDKVSRF DFIRQIEVDG QLITLESGEF QVYKQSHSAL101 TAFQTEQIQD SEHSGKMVAK RQFRIGDIAG EHTSFDKLPE GGRATYRGTA151 FGSDDAGGKL TYTIDFAAKQ GNGKIEHLKS PELNVDLAAA DIKPDGKRHA201 VISGSVLYNQ AEKGSYSLGI FGGKAQEVAG SAEVKTVNGI RHIGLAAKQL251 DGGGGTGSSD LANDSFIRQV LDRQHFEPDG KYHLFGSRGE LAERSGHIGL301 GKIQSHQLGN LMIQQAAIKG NIGYIVRFSD HGHEVHSPFD NHASHSDSDE351 AGSPVDGFSL YRIHWDGYEH HPADGYDGPQ GGGYPAPKGA RDIYSYDIKG401 VAQNIRLNLT DNRSTGQRLA DRFHNAGSML TQGVGDGFKR ATRYSPELDR451 SGNAAEAFNG TADIVKNIIG AAGEIVGAGD AVQGISEGSN IAVMHGLGLL501 STENKMARIN DLADMAQLKD YAAAAIRDWA VQNPNAAQGI EAVSNIFMAA551 IPIKGIGAVR GKYGLGGITA HPIKRSQMGA IALPKGKSAV SDNFADAAYA601 KYPSPYHSRN IRSNLEQRYG KENITSSTVP PSNGKNVKLA DQRHPKTGVP651 FDGKGFPNFE KHVKYDTLEH HHHHH*實(shí)施例16-與287/ΔG287的C-未端融合(‘雜交體′)
      按照本發(fā)明,兩種蛋白質(zhì)A和B的雜交體可能是NH2-A-B-COOH或NH2-B-A-COOH。用在919、953和ORF46.1的C-端(以‘287-His′形式)或N-未端(以ΔG287形式-如上所示的序列)的蛋白質(zhì)287研究了這種差異的影響。使用一組菌株,包括同源菌株2996。用FCA作為佐劑

      通常用N-未端的297(以ΔG的形式)觀察到較好的殺菌滴定度。
      當(dāng)融合于蛋白質(zhì)961[NH2-ΔG287-961-COOH-上述可示序列]時(shí),得到的的蛋白質(zhì)是不溶的且必須變性和復(fù)性以用于純化。復(fù)性后,發(fā)現(xiàn)50%蛋白質(zhì)仍不溶解。比較可溶性和不溶性蛋白質(zhì),用可溶性蛋白質(zhì)獲得的殺菌滴定度好得多(FCA作為佐劑)

      然而,用明礬佐劑替代可以改善難溶形式蛋白質(zhì)的滴定度

      實(shí)施例17-N-未端融合(′雜交體′)于287將蛋白質(zhì)287以全長(zhǎng)、含C-未端His-標(biāo)記、或無(wú)其前導(dǎo)肽但而包含C-未端His-標(biāo)記表達(dá)的水平相當(dāng)?shù)?。用N-未端GST-融合實(shí)現(xiàn)較好的表達(dá)。
      或者將GST用作N-未端融合配體,將287置于蛋白質(zhì)919的C-未端(‘919-287′)、蛋白質(zhì)953的C-未端(‘953-287′)和蛋白質(zhì)ORF46.1的C-末端(‘ORF46.1-287′)。在這兩種情況中,除去前導(dǎo)肽,且雜交體是直接的符合讀框的融合。
      為了產(chǎn)生953-287雜交體,設(shè)計(jì)各序列的前導(dǎo)肽的正向引物下游以除去這兩種蛋白質(zhì)的前導(dǎo)肽;除去953反向引物中的終止密碼子序列,但包含在287反向引物中。對(duì)953基因而言,用于擴(kuò)增的5′和3′引物分別包括NdeI和BamHI限制酶切位點(diǎn),而對(duì)287基因的擴(kuò)增而言,5′和3′引物分別包括BamHI和XhoI限制酶切位點(diǎn)。在這種方法中,使用NdeI-BamHI(用于克隆第一個(gè)基因)和隨后的BamHI-XhoI(用于克隆第二基因)可以實(shí)現(xiàn)pET21b+中兩個(gè)基因的順序定向克隆。
      通過(guò)將編碼287的成熟部分的序列克隆入pET21b+中的919-His克隆的3′端的XhoI位點(diǎn)中,獲得919-287雜交體。設(shè)計(jì)用于擴(kuò)增287基因的引物,從而在PCR片段的5′端引入SalI限制酶切位點(diǎn),并在3′端引入XhoI位點(diǎn)。由于由SalI和XhoI限制酶產(chǎn)生的粘性末端是相容的,可以將用SalI-XhoI消化的287PCR擴(kuò)增產(chǎn)物插入由XhoI切割的pET21b-919克隆中。
      類似地獲得ORF46.1-287雜交體。
      將針對(duì)雜交蛋白產(chǎn)生的抗體的殺菌效力(同源菌株)與針對(duì)組分抗原的簡(jiǎn)單混合物產(chǎn)生的抗體的殺菌效力相比較

      還獲得了919-287和953-287針對(duì)異源MenB菌株和血清型A和C的殺菌活性數(shù)據(jù)

      還構(gòu)建了ORF46.1和919的雜交體。最佳的結(jié)果(高四倍的滴定度)是用在N-未端的919實(shí)現(xiàn)的。
      還測(cè)試了雜交體919-519His、ORF97-225His和225-ORF97His。它們得到中等ELISA滴定度和殺菌的抗體應(yīng)答。
      實(shí)施例18-ORF4的前導(dǎo)肽如上所示,可以將ORF4的前導(dǎo)肽融合于其它蛋白質(zhì)(如蛋白質(zhì)287和919)的成熟序列。其可以指導(dǎo)大腸桿菌中的脂質(zhì)化。
      實(shí)施例19-564中的結(jié)構(gòu)域蛋白質(zhì)′564′非常大(2073aa),且其難以克隆并以完整形式表達(dá)。為了便于表達(dá),如圖8所示(按MC58序列)將該蛋白質(zhì)分為四個(gè)結(jié)構(gòu)域

      這些結(jié)構(gòu)域顯示出如下同源性結(jié)構(gòu)域A顯示與其它細(xì)菌毒素同源gb|AAG03431.1|AE004443-9可能血凝素[綠膿假單胞菌](38%)gb|AAC31981.1|(139897) HecA[菊果膠桿菌](45%)emb|CAA36409.1|(X52156) 絲狀血凝素[百日咳博德特氏菌](31%)gb|AAC79757.1|(AF057695)大量上清液蛋白質(zhì)1[杜氏嗜血菌](26%)gb|AAA25657.1|(M30186) HpmA前體[奇異變形菌](29%)·結(jié)構(gòu)域B顯示為非同源的,且是對(duì)564特異性的。
      ·結(jié)構(gòu)域C顯示為與以下同源gb|AAF84995.1|AE004032 HA-樣分泌的蛋白質(zhì)[苛養(yǎng)木桿菌](33%)gb|AAG05850.1|AE004673 假說(shuō)蛋白質(zhì)[銅綠假單胞菌](27%)gb|AAF68414.1AF237928 推定的FHA[多殺巴斯德氏菌](23%)gb|AAC79757.1|(AF057695)大量上清液蛋白質(zhì)1[杜氏嗜血菌](23%)pir||S21010 FHA B前體[百日咳博德特氏菌](20%)·結(jié)構(gòu)域D顯示與前體細(xì)菌毒素同源
      gb|AAF84995.1|AE004032_14 HA-樣分泌的蛋白質(zhì)[苛養(yǎng)木桿菌](29%)用MC58菌株序列,以GST-融合(未純化)和his-標(biāo)記的蛋白質(zhì)形式獲得564ab良好的細(xì)胞內(nèi)表達(dá);該結(jié)構(gòu)域-對(duì)還以脂蛋白形式表達(dá),其表現(xiàn)出在外膜/上清液組分中有中等表達(dá)。
      當(dāng)以his-標(biāo)記的產(chǎn)物(未純化)表達(dá)時(shí),b結(jié)構(gòu)域顯示中等細(xì)胞內(nèi)表達(dá),而以GST-融合則表達(dá)良好。
      以GST-融合表達(dá)時(shí)c,結(jié)構(gòu)域顯示良好的細(xì)胞內(nèi)表達(dá),但是不溶的。以his標(biāo)記的產(chǎn)物(未純化)表達(dá)時(shí),d結(jié)構(gòu)域顯示中等細(xì)胞內(nèi)表達(dá)。以GST-融合體表達(dá)時(shí),cd蛋白質(zhì)結(jié)構(gòu)域?qū)Ρ憩F(xiàn)中等細(xì)胞內(nèi)表達(dá)(未純化)。
      用c結(jié)構(gòu)域和bc對(duì)觀察到良好的殺菌試驗(yàn)滴定度。
      實(shí)施例20-919前導(dǎo)肽在以上的實(shí)施例1中討論了919的20mer前導(dǎo)肽MKKYLFRAAL YGIAAAILAA如實(shí)施例1所示,該前導(dǎo)肽的缺失改進(jìn)了異源表達(dá)(如用ORF4前導(dǎo)肽替代該前導(dǎo)肽一樣)。通過(guò)將編碼序列融合于摩氏摩根氏菌(Morganella morganii)的PhoC報(bào)道基因研究了919前導(dǎo)肽對(duì)表達(dá)的影響[Thaller等,(1994)Microbiology1401341-1350]。將該構(gòu)建物克隆入NdeI和XhoI位點(diǎn)間的pET21-b質(zhì)粒中(圖9)1MKKTLFRAAL YGIAAAILAAAIPAGNDATT KPDLYYLKNE QAIDSLKLLP51 PPPEVGSIQF LNDQAMYEKG RMLRNTERGK QAQADADLAA GGVATAFSGA101 FGYPITEKDS PELYKLLTNM IEDAGDLATR SAKEHYMRIR PFAFYGTETC151 NTKDQKKLST NGSYPSGHTS IGWATALVLA EVNPANQDAI LERGYQLGQS201 RVICGYHWQS DVDAARIVGS AAVATLHSDP AFQAQLAKAK QEFAQKSQK*該質(zhì)粒的PhoC的表達(dá)水平比相同的但包含天然PhoC信號(hào)肽的構(gòu)建物中發(fā)現(xiàn)的低>200倍。即使用大腸桿菌Plac啟動(dòng)子替代T7啟動(dòng)子后也得到相同的結(jié)果。這表明919前導(dǎo)序列對(duì)表達(dá)的影響并非取決于所用的啟動(dòng)子。
      為了研究這些結(jié)果是否是由于919信號(hào)肽核苷酸序列(二級(jí)結(jié)構(gòu)形式,對(duì)RNA酶等敏感)的某些特性或存在該信號(hào)肽引起的蛋白質(zhì)不穩(wěn)定性導(dǎo)致的,產(chǎn)生了許多突變體。所用的方法是通過(guò)克隆含簡(jiǎn)并密碼子的合成接頭替代919信號(hào)肽序列的核苷酸。用這種方法獲得含核苷酸和/或氨基酸取代的變體。
      使用兩種不同的接頭,設(shè)計(jì)919信號(hào)肽序列的兩個(gè)不同區(qū)域中產(chǎn)生突變,即在第一19堿基對(duì)(L1)中和堿基20-36之間(S1)。
      L15′T ATG AAa/g TAc/t c/tTN TTt/c a/cGC Gcc GCC CTG TAC GGC ATC GCC GCCGCC ATC CTC GCC GCC GCG ATC CC 3S15′T ATG AAA AAA TAC CTA TTC CGa/g GCN GCN c/tTa/g TAc/t GGc/g ATC GCCGCC GCC ATC CTC GCC GCC GCG ATC CC 3’獲得的一些突變體的序列排序如下。
      L1變體9L1-aATGAAGAAGTACCTTTTCAGCGCCGCC~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~9L1-eATGAAAAAATACTTTTTCCGCGCCGCC~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~9L1-dATGAAAAAATACTTTTTCCGCGCCGCC~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~9L1-fATGAAAAAATATCTCTTTAGCGCCGCCCTGTACGGCATCGCCGCCGCCATCCTCGCCGCC919spATGAAAAAATACCTATTCCGCGCCGCCCTGTACGGCATCGCCGCCGCCATCCTCGCCGCC9L1a MKKYLFSAA~~~~~~~~~~~9L1e MKKYFFRAA~~~~~~~~~~~9L1d MKKYFFRAA~~~~~~~~~~~9L1f MKKYLFSAALYGIAAAILAA919spMKKYLFRAALYGIAAAILAA(即,天然信號(hào)肽)S1突變體9S1-eATGAAAAAATACCTATTC..................ATCGCCGCCGCCATCCTCGCCGCC9S1-cATGAAAAAATACCTATTCCGAGCTGCCCAATACGGCATCGCCGCCGCCATCCTCGCCGCC9S1-bATGAAAAAATACCTATTCCGGGCCGCCCAATACGGCATCGCCGCCGCCATCCTCGCCGCC9S1-iATGAAAAAATACCTATTCCGGGCGGCTTTGTACGGGATCGCCGCCGCCATCCTCGCCGCC919SpATGAAAAAATACCTATTCCGCGCCGCCCTGTACGGCATCGCCGCCGCCATCCTCGCCGCC9S1eMKKYLF......IAAAILAA9S1cMKKYLFRAAQYGIAAALLAA9S1bMKKYLFRAAQYGIAAAILAA9S1iMKKYLFRAALYGIAAAILAA919Sp MKKYLFRAALYGIAAAILAA如序列排序中所示,分析的的大部分突變體包含由宿主細(xì)胞出人意料地產(chǎn)生的符合讀框的缺失。
      通過(guò)用從L1和S1突變的克隆制備的DNA轉(zhuǎn)化大腸桿菌BL21(DE3)細(xì)胞進(jìn)行突變體的篩選。通過(guò)在包含100μg/ml氨芐青霉素、50μg/ml甲基綠、1mg/mlPDP(酚酞二磷酸)的LB平板上劃線,篩選高PhoC活性的單轉(zhuǎn)化體。在該培養(yǎng)基上產(chǎn)生PhoC的細(xì)胞變成綠色(圖10)。
      用pNPP作為PhoC活性的底物,在液體培養(yǎng)基中對(duì)這些突變體產(chǎn)生的PhoC進(jìn)行的定量分析。測(cè)定在液體培養(yǎng)基中生長(zhǎng)0、30、90、180分鐘的實(shí)變體的細(xì)胞提取物和上清液的比活性為細(xì)胞提取物

      上清液

      一些突變體產(chǎn)生大量PhoC,尤其是突變體9L1a可以在培養(yǎng)基中分泌PhoC。這是值得關(guān)注的,因?yàn)樵撟凅w的信號(hào)肽序列的長(zhǎng)度僅為9個(gè)氨基酸。這是至今最短的信號(hào)肽。
      實(shí)施例21-Maf-相關(guān)蛋白質(zhì)的C-端缺失MafB-相關(guān)蛋白質(zhì)包括703、ORF46和ORF29。
      MC58的730蛋白質(zhì)具有如下序列1VKPLRRLTNL LAACAVAAAA LIQPALAADL AQDPFITDNA QRQHYEPGGK51 YHLFGDPRGS VSDRTGKINV IQDYTHQMGN LLIQQANING TIGYHTRFSG101 HGHEEHAPFD NHAADSASEE KGNVDEGFTV YRLNWEGHEH HPADAYDGPK151 GGNYPKPTGA RDEYTYHVNG TARSIKLNPT DTRSIRQRIS KNYSNLGSNF201 SDRADEANRK MFEHNAKLDR WGNSMEFING VAAGALNPFI SAGKALGIGD251 ILYGTKYAID KAAMRNIAPL PAEGKPAVIG GLGSVAGFEK NTREAVDRWI301 QENPNAAETV EAVFNVAAAA KVAKLAKAAK PGKAAVSGDF ADSYKKKLAL351 SDSARQLYQN AKYRKALDLH YEDLIRRKTD GSSKFINGRE IDAVTNDALI401 QAKRTISAID KPKNFLNQKN RKQIKATIEA ANQQGKRAEF WFKYGVHSQV451 KSYIESKGGI VKTGLGD*前導(dǎo)肽是加下劃線的。
      730顯示與ORF46類似的特性(見(jiàn)以上實(shí)施例8)
      -與Orf46一樣,730序列在MenB、MenA和淋球菌之間的保守性僅對(duì)N-未端部分高(>80%)。C-未端(自~340)是高度趨異的。
      -其預(yù)計(jì)的二級(jí)結(jié)構(gòu)包含跨越分子中心區(qū)域(aa.227-247)的疏水片段。
      -大腸桿菌中全長(zhǎng)基因的表達(dá)產(chǎn)生產(chǎn)量很低的蛋白質(zhì)。從標(biāo)記的或未標(biāo)記的構(gòu)建物(除去信號(hào)肽序列)的表達(dá)對(duì)宿主細(xì)胞有毒性影響。換言之,細(xì)胞質(zhì)中全長(zhǎng)成熟蛋白質(zhì)的存在對(duì)宿主細(xì)胞是非常毒的,而當(dāng)其轉(zhuǎn)位至周質(zhì)(由信號(hào)肽介導(dǎo))對(duì)細(xì)胞生存力沒(méi)有可檢測(cè)的影響。730的這種“細(xì)胞內(nèi)毒性”特別高,因?yàn)橹豢捎胷ecA遺傳背景(大腸桿菌菌株用于克隆的HB101;用于表達(dá)的HMS174(DE3))以很低的頻率得到用于表達(dá)無(wú)前導(dǎo)肽的730的克隆。
      為了克服這種毒性,將實(shí)施例8中用于ORF46的類似方法用于730。得到四種C-未端截短的形式,每種都被很好地表達(dá)。它們都是從His-標(biāo)記的無(wú)前導(dǎo)肽730的細(xì)胞內(nèi)表達(dá)得到的。
      形式A由成熟蛋白質(zhì)的N-未端疏水區(qū)域(aa.28-226)構(gòu)成。將其純化性作為可溶性His標(biāo)記的產(chǎn)物,其具有比預(yù)計(jì)更高的分子量(MW)。
      形式B延伸至血清群之間保守的區(qū)域(aa.28-340)的未端。將其純化為不溶性His標(biāo)記的產(chǎn)物。
      在篩選能在菌株HMS174(DE3)中高水平表達(dá)730-His克隆的克隆后,獲得命名為C1和C2的C-未端截短的形式。簡(jiǎn)言之,用含有編碼全長(zhǎng)成熟730蛋白質(zhì)的His標(biāo)記的序列的pET21b質(zhì)粒轉(zhuǎn)化recA菌株HMS174(DE3)。低頻率得到轉(zhuǎn)化體,其顯示出兩種表型大集落和非常小的集落。分析了若干大集落和小集落對(duì)730-His克隆的表達(dá)。只有大集落的細(xì)胞超量表達(dá)抗730A抗體識(shí)別的蛋白質(zhì)。但是,不同集落中超量表達(dá)的蛋白質(zhì)的分子量各不相同。對(duì)其中的兩個(gè)克隆進(jìn)行測(cè)序表明這兩種情況中,在編碼730的C未端區(qū)域的序列中發(fā)生了大腸桿菌IS序列的整合。這兩個(gè)整合在C1中產(chǎn)生了與另一個(gè)密碼子的符合讀框的融合,在C2中產(chǎn)生了與另外12個(gè)密碼子的符合讀框的融合(圖11)。產(chǎn)生的730“突變體”形式具有如下的序列730-C1(IS1插入引起的-圖11A)
      1 MADLAQDPFI TDNAQRQHYE PGGKYHLFGD PRGSVSDRTG KINVIQDYTH51 QMGNLLIQQA NINGTIGYHT RFSGHGHEEH APFDNHAADS ASEEKGNVDE101 GFTVYRLNWE GHEHHPADAY DGPKGGNYPK PTGARDEYTY HVNGTARSIK151 LNPTDTRSIR QRISDNYSNL GSNFSDRADE ANRKMFEHNA KLDRWGNSME201 FINGVAAGAL NPFISAGEAL GIGDILYGTR YAIDKAAMRN IAPLPAEGKF251 AVIGGLGSVA GFEKNTREAV DRWIQENPNA AETVEAVFNV AAAAKVAKLA301 KAAKPGKAAV SGDFADSYKK KLALSDSARQ LYQNAKYREA LDIHYEDLIR351 RKTDGSSKFI NGREIDAVTN DALIQAR*由插入產(chǎn)生的其它氨基酸下加下劃線。
      730-C2(IS5插入引起的-圖11B)1 MADLAQDPFI TDNAQRQHYE PGGKYHLFGD PRGSVSDRTG KINVIQDYTH51 QMGNLLIQQA NINGTIGYHT RFSGHGHEEH APFDNHAADS ASEEKGNVDE101 GFTVYRLNWE GHEHHPADAY DGPKGGNYPK PTGARDEYTY HVNGTARSIK151 LNPTDTRSIR QRISKNYSNL GSNFSDRADE ANRKMFEHNA KLDRWGNSME201 FINGVAAGAL NPFISAGEAL GIGDILYGTR YAIDKAAMRN IAPLPAEGKF251 AVIGGLGSVA GFEKNTREAV DRWIQENPNA AETVEAVFNV AAAAKVAKLA301 KAAKPGKAAV SGDFADSYKK KLALSDSARQ LYQNAKYREA LGKVRISGSI351LLG*由插入產(chǎn)生的其它氨基酸下加下劃線。
      總之,730-C1形式的細(xì)胞內(nèi)表達(dá)產(chǎn)生大很高水平的量蛋白質(zhì),且對(duì)宿主細(xì)胞無(wú)毒,而天然C-未端的存在則是有毒的。這些數(shù)據(jù)表明730的“細(xì)胞內(nèi)毒性”與蛋白質(zhì)的C-未端65氨基酸相關(guān)。
      用有或無(wú)前導(dǎo)肽(氨基酸1-26;缺失得到胞質(zhì)表達(dá))和有或無(wú)His-標(biāo)記的表達(dá),已進(jìn)行了ORF29到前231或368氨基酸的相等的截短。
      實(shí)施例22-961中的結(jié)構(gòu)域如上實(shí)施例9所述,在大腸桿菌中最佳地表達(dá)961的GSt融合。為了改進(jìn)表達(dá),將蛋白質(zhì)分成結(jié)構(gòu)域(圖12)。
      以YadA(由耶爾森氏菌產(chǎn)生的粘附素,已證明其是位于細(xì)胞表面上的粘附素,其形成產(chǎn)生表面凸起的低聚物[Hoiczyk等(2000)EMBO J 195989-99])為基礎(chǔ),設(shè)計(jì)了916的結(jié)構(gòu)域,它們?yōu)榍皩?dǎo)肽、頭部結(jié)構(gòu)域、卷曲-螺旋區(qū)域(莖部)和膜錨著點(diǎn)結(jié)構(gòu)域。
      有或無(wú)前導(dǎo)肽表達(dá)這些結(jié)構(gòu)域,且任選地融合于C-未端His-標(biāo)記或N-未端GST。用SDS-PAGE和Western印跡,從過(guò)夜(o/n)培育或用IPTG誘導(dǎo)3小時(shí)后,分析表達(dá)961不同結(jié)構(gòu)域的大腸桿菌克隆用于表達(dá)的蛋白質(zhì)的產(chǎn)生和定位。結(jié)果如下

      這些結(jié)果在大腸桿菌中顯示·961-L是高度表達(dá)的且位于外膜上。用Western印跡分析已檢測(cè)到2個(gè)特異性條帶一條為~45kDa(預(yù)計(jì)的分子量),另一條為~180kDa,表明961-L可以形成低聚物。另外,這些聚集體在過(guò)夜培養(yǎng)物(無(wú)IPTG誘導(dǎo))中表達(dá)得更多。用該克隆的OMV制備物免疫接種小鼠,并獲得血清。用過(guò)夜培養(yǎng)物(主要為寡聚物形式)的血清是殺菌的;IPTG-誘導(dǎo)的培養(yǎng)物(主要為單體)不是殺菌的。
      ·961Δ1-L(在錨區(qū)域中部分缺失)是高度表達(dá)的,且位于外膜,但不形成低聚物;·961c-L(無(wú)錨區(qū)域)以可溶的形式產(chǎn)生,并被在上清液中輸出。
      使用His-融合的ELISA和血清殺菌試驗(yàn)中的滴定度如下


      用表達(dá)不同形式961(961、961-L、961Δ1-L和961c-L)的大腸桿菌克隆研究了961是否是粘附素(參見(jiàn)YadA)。用(a)人上皮細(xì)胞和(b)大腸桿菌克隆(過(guò)夜培育或IPTG誘導(dǎo)3小時(shí)后),進(jìn)行粘附試驗(yàn)。過(guò)夜培育的961-L(961Δ1-L)和IPTG誘導(dǎo)的961c-L(在表面上表達(dá)蛋白質(zhì)的克隆)粘附于人上皮細(xì)胞。
      也將961c用于雜交蛋白(見(jiàn)上)。由于961和其結(jié)構(gòu)域變體指導(dǎo)高效表達(dá),它們理想地適用于雜交蛋白的N-未端部分。
      實(shí)施例23-其它雜交體以下顯示了本發(fā)明的其它雜交蛋白(同樣參見(jiàn)圖14)。當(dāng)與單獨(dú)蛋白質(zhì)相比時(shí),它們是有利的ORF46.1-7411 ATGTCAGATT TGGCAAACGA TTCTTTTATC CGGCAGGTTC TCGACCGTCA51 GCATTTCGAA CCCGACGGGA AATACCACCT ATTCGGCAGC AGGGGGGAAC101 TTGCCGAGCG CAGCGGCCAT ATCGGATTGG GAAAAATACA AAGCCATCAG151 TTGGGCAACC TGATGATTCA ACAGGCGGCC ATTAAAGGAA ATATCGGCTA201 CATTGTCCGC TTTTCCGATC ACGGGCACGA AGTCCATTCC CCCTTCGACA251 ACCATCCCTC ACATTCCGAT TCTGATGAAG CCGGTAGTCC CGTTGACGGA301 TTTAGCCTTT ACCGCATCCA TTGGGACGGA TACGAACACC ATCCCGCCGA351 CGGCTATGAC GGGCCACAGG GCGGCGGCTA TCCCGCTCCC AAAGGCGCGA401 GGGATATATA CAGCTACGAC ATAAAAGGCG TTGCCCAAAA TATCCGCCTC451 AACCTGACCG ACAACCGCAG CACCGGACAA CGGCTTGCCG ACCGTTTCCA501 CAATGCCGGT AGTATGCTGA CGCAAGGAGT AGGCGACGGA TTCAAACGCG551 CCACCCGATA CAGCCCCGAG CTGGACAGAT CGGGCAATGC CGCCGAAGCC601 TTCAACGGCA CTGCAGATAT CGTTAAAAAC ATCATCGGCG CGGCAGGAGA651 AATTGTCGGC GCAGGCGATG CCGTGCAGGG CATAAGCGAA GGCTCAAACA701 TTGCTGTCAT GCACGGCTTG GGTCTGCTTT CCACCGAAAA CAAGATGGCG751 CGCATCAACG ATTTGGCAGA TATGGCGCAA CTCAAAGACT ATGCCGCAGC801 AGCCATCCGC GATTGGGCAG TCCAAAACCC CAATGCCGCA CAAGGCATAG851 AAGCCGTCAG CAATATCTTT ATGGCAGCCA TCCCCATCAA AGGGATTGGA901 GCTGTTCGGG GAAAATACGG CTTGGGCGGC ATCACGGCAC ATCCTATCAA951 GCGGTCGCAG ATGGGCGCGA TCGCATTGCC GAAAGGGAAA TCCGCCGTCA1001 GCGACAATTT TGCCGATGCG GCATACGCCA AATACCCGTC CCCTTACCAT1051 TCCCGAAATA TCCGTTCAAA CTTGGAGCAG CGTTACGGCA AAGAAAACAT1101 CACCTCCTCA ACCGTGCCGC CGTCAAACGG CAAAAATGTC AAACTGGCAG1151 ACCAACGCCA CCCGAAGACA GGCGTACCGT TTGACGGTAA AGGGTTTCCG1201 AATTTTGAGA AGCACGTGAA ATATGATACG GGATCCGGAG GGGGTGGTGT1251 CGCCGCCGAC ATCGGTGCGG GGCTTGCCGA TGCACTAACC GCACCGCTCG1301 ACCATAAAGA CAAAGGTTTG CAGTCTTTGA CGCTGGATCA GTCCGTCAGG1351 AAAAACGAGA AACTGAAGCT GGCGGCACAA GGTGCGGAAA AAACTTATGG1401 AAACGGTGAC AGCCTCAATA CGGGCAAATT GAAGAACGAC AAGGTCAGCC1451 GTTTCGACTT TATCCGCCAA ATCGAAGTGG ACGGGCAGCT CATTACCTTG1501 GAGAGTGGAG AGTTCCAAGT ATACAAACAA AGCCATTCCG CCTTAACCGC1551 CTTTCAGACC GAGCAAATAC AAGATTCGGA GCATTCCGGG AAGATGGTTG1601 CGAAACGCCA GTTCAGAATC GGCGACATAG CGGGCAAACA TACATCTTTT
      1651 GACAAGCTTC CCGAAGGCGG CAGGGCGACA TATCGCGGGA CGGCGTTCGG1701 TTCAGACGAT GCCGGCGGAA AACTGACCTA CACCATAGAT TTCGCCGCCA1751 AGCAGGGAAA CGGCAAAATC GAACATTTGA AATCGCCAGA ACTCAATGTC1801 GACCTGGCCG CCGCCGATAT CAAGCCGGAT GGAAAACGCC ATGCCGTCAT1851 CAGCGGTTCC GTCCTTTACA ACCAAGCCGA GAAAGGCAGT TACTCCCTCG1901 GTATCTTTGG CGGAAAAGCC CAGGAAGTTG CCGGCAGCGC GGAAGTGAAA1951 ACCGTAAACG GCATACGCCA TATCGGCCTT GCCGCCAAGC AACTCGAGCA2001 CCACCACCAC CACCACTGA1 MSDLANDSFI RQVLDRQHFE PDGKYHLFGS RGELAERSGH IGLGKIQSHQ51 LGNLMIQQAA IKGNIGYIVR FSDHGHEVHS PFDNHASHSD SDEAGSPVDG101 FSLYRIHWDG YEHHPADGYD GPQGGGYPAP DGARDIYSYD IKGVAQNIRL151 NLTDNRSTGQ RLADRFHNAG SMLTQGVGDG FKRATRYSPE LDRSGNAAEA201 FNGTADIVKN IIGAAGEIVG AGDAVQGISE GSNIAVMHGL GLLSTENKMA251 RINDLADMAQ LKDYAAAAIR DWAVQNPNAA QGIEAVSNIF MAAIPIKGIG301 AVRGKYGLGG ITAHPIKRSQ MGAIALPKGK SAVSDNFADA AYAKYPSPYH351 SRNIRSNLEQ RYGKENITSS TVPPSNGKNV KLADQRHPKT GVPFDGKGFP401 NFEKHVKYDT GSGGGGVAAD IGAGLADALT APLDHKDKGL QSLTLDQSVR451 KNEKLDLAAQ GAEKTYGNGD SLNTGKLKND KVSRFDFIRQ IEVDGQLITL501 ESGEFQVYKQ SHSALTAFQT EQIQDSEHSG KMVAKRQFRI GDIAGEHTSF551 DKLPEGGRAT YRGTAFGSDD AGGKLTYTID FAAKQGNGKI EHLKSPELNV601 DLAAADIKPD GKRHAVISGS VLYNQAEKGS YSLGIFGGKA QEVAGSAEVK651 TVNGIRHIGL AAKQLEHHHH HH*ORF46.1-9611 ATGTCAGATT TGGCAAACGA TTCTTTTATC CGGCAGGTTC TCGACCGTCA51 GCATTTCGAA CCCGACGGGA AATACCACCT ATTCGGCAGC AGGGGGGAAC101 TTGCCGAGCG CAGCGGCCAT ATCGGATTGG GAAAAATACA AAGCCATCAG151 TTGGGCAACC TGATGATTCA ACAGGCGGCC ATTAAAGGAA ATATCGGCTA201 CATTGTCCGC TTTTCCGATC ACGGGCACGA AGTCCATTCC CCCTTCGACA251 ACCATGCCTC ACATTCCGAT TCTGATGAAG CCGGTAGTCC CGTTGAGGGA301 TTTAGCCTTT ACCGCATCCA TTGGGACGGA TACGAACACC ATCCGCCCGA351 CGGCTATGAC GGGCCACAGG GCGGCGGCTA TCCCGCTCCC AAAGGCGCGA401 GGGATATATA CAGCTACGAC ATAAAAGGCG TTGCCCAAAA TATCCGCCTC451 AACCTGACCG ACAACCGCAG CACCGGACAA CGGCTTGCCG ACCGTTTCCA501 CAATGCCGGT AGTATGCTGA CGCAAGGAGT AGGCGACGGA TTCAAACGCG551 CCACCCGATA CAGCCCCGAG CTGGACAGAT CGGGCAATGC CGCCGAAGCC601 TTCAACGGCA CTGCAGATAT CGTTAAAAAC ATCATCGGCG CGGCAGGAGA651 AATTGTCGGC GCAGGCGATG CCGTGCAGGG CATAAGCGAA GGCTCAAACA701 TTGCTGTCAT GCACGGCTTG GGTCTGCTTT CCACCGAAAA CAAGATGGCG751 CGCATCAACG ATTTGGCAGA TATGGCGCAA CTCAAAGACT ATGCCGCAGC801 AGCCATCCGC GATTGGGCAG TCCAAAACCC CAATGCCGCA CAAGGCATAG851 AAGCCGTCAG CAATATCTTT ATGGCAGCCA TCCCCATCAA AGGGATTGGA901 GCTGTTCGGG GAAAATACGG CTTGGGCGGC ATCACGGCAC ATCCTATCAA951 GCGGTCGCAG ATGGGCGCGA TCGCATTGCC GAAAGGGAAA TCCGCCGTCA1001 GCGACAATTT TGCCGATGCG GCATACGCCA AATACCCGTC CCCTTACCAT1051 TCCCGAAATA TCCGTTCAAA CTTGGAGCAG CGTTACGGCA AAGAAAACAT1101 CACCTCCTCA ACCGTGCCGC CGTCAAACGG CAAAAATGTC AAACTGGCAG1151 ACCAACGCCA CCCGAAGACA CGCGTACCGT TTGACGGTAA AGGGTTTCCG1201 AATTTTGAGA AGCACGTGAA ATATGATACG GGATCCGGAG GAGGAGGAGC1251 CACAAACGAC GACGATGTTA AAAAAGCTGC CACTGTGGCC ATTGCTGCTG1301 CCTACAACAA TGGCCAAGAA ATCAACGGTT TCAAAGCTGG AGAGACCATC1351 TACGACATTG ATGAAGACGG CACAATTACC AAAAAAGACG CAACTGCAGC1401 CGATGTTGAA GCCGACGACT TTAAAGGTCT GGGTCTGAAA AAAGTCGTGA1451 CTAACCTGAC CAAAACCGTC AATGAAAACA AACAAAACGT CGATGCCAAA1501 GTAAAAGCTG CAGAATCTGA AATAGAAAAG TTAACAACCA AGTTAGCAGA1551 CACTGATGCC GCTTTAGCAG ATACTGATGC CGCTCTGGAT GCAACCACCA1601 ACGCCTTGAA TAAATTGGGA GAAAATATAA CGACATTTGC TGAAGAGACT1651 AAGACAAATA TCGTAAAAAT TGATGAAAAA TTAGAAGCCG TGGCTGATAC1701 CGTCGACAAG CATGCCGAAG CATTCAACGA TATCGCCGAT TCATTGGATG1751 AAACCAACAC TAAGGCAGAC GAAGCCGTCA AAACCGCCAA TGAAGCCAAA1801 CAGACGGCCG AAGAAACCAA ACAAAACGTC GATGCCAAAG TAAAAGCTGC1851 AGAAACTGCA GCAGGCAAAG CCGAAGCTGC CGCTGGCACA GCTAATACTG1901 CAGCCGACAA GGCCGAAGCT GTCGCTGCAA AAGTTACCGA CATCAAAGCT1951 GATATCGCTA CGAACAAAGA TAATATTGCT AAAAAAGCAA ACAGTGCCGA2001 CGTGTACACC AGAGAAGAGT CTGACAGCAA ATTTGTCAGA ATTGATGGTC
      2051 TGAACGCTAC TACCGAAAAA TTGGACACAC GCTTGGCTTC TGCTGAAAAA2101 TCCATTGCCG ATCACGATAC TCGCCTGAAC GGTTTGGATA AAACAGTGTC2151 AGACCTGCGC AAAGAAACCC GCCAAGGCCT TGCAGAACAA GCCGCGCTCT2201 CCGGTCTGTT CCAACCTTAC AACGTGGGTC GGTTCAATGT AACGGCTGCA2251 GTCGGCGGCT ACAAATCCGA ATCGGCAGTC GCCATCGGTA CCGGCTTCCG2301 CTTTACCGAA AACTTTGCCG CCAAAGCAGG CGTGGCAGTC GGCACTTCGT2351 CCGGTTCTTC CGCAGCCTAC CATGTCGGCG TCAATTACGA GTGGCTCGAG2401 CACCACCACC ACCACCACTG A1 MSDLANDSFI RQVLDRQHFE PDGKYHLFGS RGELAERSGH IGLGKIQSHQ51 LGNLMIQQAA IKGNIGYIVR FSDHGHEVHS PFDNHASHSD SDEAGSPVDG101 FSLYRIHWDG YEHHPADGYD GPQGGGYPAP KGARDIYSYD IKGVAQNIRL151 NLTDNRSTGQ RLADRFHNAG SMLTQGVGDG FKRATRYSPE KDRSGNAAEA201 FNGTADIVKN IIGAAGEIVG AGDAVQGISE GSNIAVMHGL GLLSTENKMA251 RINDLADMAQ LKDYAAAAIR DWAVQNPNAA QGIEAVSNIF MAAIPIKGIG301 AVRGKYGLGG ITAHPIKRSQ MGAIALPKGK SAVSDNFADA AYAKYPSPYH351 SRNIRSNLEQ RYGKENITSS TVPPSNGKNV KLQDQRHPKT GVPFDGKGFP401 NFEKHVKYDT GSGGGGATND DDVKKAATVA IAAAYNNGQE INGFKAGETI451 YDIDEDGTIT KKDATAADVE ADDFKGLGLK KVVTNLTKTV NENKQNVDAK501 VKAAESEIEK LTTKLADTDA ALADTDAALD ATTNALNKLG ENITTFAEET551 KTNIVKIDEK LEAVADTVDK HAEAFNDIAD SLDETNTKAD EAVKTANEAK601 QTAEETKQNV DAKVKAAETA AGKAEAAAGT ANTAADKAEA VAAKVTDIKA651 DIATNKDNIA KKANSADVYT REESDSKFVR IDGLNATTEK LDTRLASAEK701 SIADHDTRLN GLDKTVSDLR KETRQGLAEQ AALSGLFQPY NVGRFNVTAA751 VGGYKSESAV AIGTGFRFTE NFAAKAGVAV GTSSGSSAAY HVGVNYEWLE801 HHHHHH*ORF46.1-961c1 ATGTCAGATT TGGCAAACGA TTCTTTTATC CGGCAGGTTC TCGACCGTCA51 GCATTTCGAA CCCGACGGGA AATACCACCT ATTCGGCAGC AGGGGGGAAC101 TTGCCGAGCG CAGCGGCCAT ATCGGATTGG GAAAAATACA AAGCCATCAG151 TTGGGCAACC TGATGATTCA ACAGGCGGCC ATTAAAGGAA ATATCGGCTA201 CATTGTCCGC TTTTCCGATC ACGGGCACGA AGTCCATTCC CCCTTCGACA251 ACCATGCCTC ACATTCCGAT TCTGATGAAG CCGGTAGTCC CGTTGACGGA301 TTTAGCCTTT ACCGCATCCA TTGGGACGGA TACGAACACC ATCCCGCCGA351 CGGCTATGAC GGGCCACAGG GCGGCGGCTA TCCCGCTCCC AAAGGCGCGA401 GGGATATATA CAGCTACGAC ATAAAAGGCG TTGCCCAAAA TATCCGCCTC451 AACCTGACCG ACAACCGCAG CACCGGACAA CGGCTTGCCG ACCGTTTCCA501 CAATGCCGGT AGTATGCTGA CGCAAGGAGT AGGCGACGGA TTCAAACGCG551 CCACCCGATA CAGCCCCGAG CTGGACAGAT CGGGCAATGC CGCCGAAGCC601 TTCAACGGCA CTGCAGATAT CGTTAAAAAC ATCATCGGCG CGGCAGGAGA651 AATTGTCGGC GCAGGCGATG CCGTGCAGGG CATAAGCGAA GGCTCAAACA701 TTGCTGTCAT GCACGGCTTG GGTCTGCTTT CCACCGAAAA CAAGATGGCG751 CGCATCAACG ATTTGGCAGA TATGGCGCAA CTCAAAGACT ATGCCGCAGC801 AGCCATCCGC GATTGGGCAG TCCAAAACCC CAATGCCGCA CAAGGCATAG851 AAGCCGTCAG CAATATCTTT ATGGCAGCCA TCCCCATCAA AGGGATTGGA901 GCTGTTCGGG GAAAATACGG CTTGGGCGGC ATCACGGCAC ATCCTATCAA951 GCGGTCGCAG ATGGGCGCGA TCGCATTGCC GAAAGGGAAA TCCGCCGTCA1001 GCGACAATTT TGCCGATGCG GCATACGCCA AATACCCGTC CCCTTACCAT1051 TCCCGAAATA TCCGTTCAAA CTTGGAGCAG CGTTACGGCA AAGAAAACAT1101 CACCTCCTCA ACCGTGCCGC CGTCAAACGG CAAAAATGTC AAACTGGCAG1151 ACCAACGCCA CCCGAAGACA GGCGTACCGT TTGACGGTAA AGGGTTTCCG1201 AATTTTGAGA AGCACGTGAA ATATGATACG GGATCCGGAG GAGGAGGAGC1251 CACAAACGAC GACGATGTTA AAAAAGCTGC CACTGTGGCC ATTGCTGCTG1301 CCTACAACAA TGGCCAAGAA ATCAACGGTT TCAAAGCTGG AGAGACCATC1351 TACGACATTG ATGAAGACGG CACAATTACC AAAAAAGACG CAACTGCAGC1401 CGATGTTGAA GCCGACGACT TTAAAGGTCT GGGTCTGAAA AAAGTCGTGA1451 CTAACCTGAC CAAAACCGTC AATGAAAACA AACAAAACGT CGATGCCAAA1501 GTAAAAGCTG CAGAATCTGA AATAGAAAAG TTAACAACCA AGTTAGCAGA1551 CACTGATGCC GCTTTAGCAG ATACTGATGC CGCTCTGGAT GCAACCACCA1601 ACGCCTTGAA TAAATTGGGA GAAAATATAA CGACATTTGC TGAAGAGACT1651 AAGACAAATA TCGTAAAAAT TGATGAAAAA TTAGAAGCCG TGGCTGATAC1701 CGTCGACAAG CATGCCGAAG CATTCAACGA TATCGCCGAT TCATTGGATG1751 AAACCAACAC TAAGGCAGAC GAAGCCGTCA AAACCGCCAA TGAAGCCAAA1801 CAGACGGCCG AAGAAACCAA ACAAAACGTC GATGCCAAAG TAAAAGCTGC1851 AGAAACTGCA GCAGGCAAAG CCGAAGCTGC CGCTGGCACA GCTAATACTG
      1901 CAGCCGACAA GGCCGAAGCT GTCGCTGCAA AAGTTACCGA CATCAAAGCT1951 GATATCGCTA CGAACAAAGA TAATATTGCT AAAAAAGCAA ACAGTGCCGA2001 CGTGTACACC AGAGAAGAGT CTGACAGCAA ATTTGTCAGA ATTGATGGTC2051 TGAACGCTAC TACCGAAAAA TTGGACACAC GCTTGGCTTC TGCTGAAAAA2101 TCCATTGCCG ATCACGATAC TCGCCTGAAC GGTTTGGATA AAACAGTGTC2151 AGACCTGCGC AAAGAAACCC GCCAAGGCCT TGCAGAACAA GCCGCGCTCT2201 CCGGTCTGTT CCAACCTTAC AACGTGGGTC TCGAGCACCA CCACCACCAC2251 CACTGA1 MSDLANDSFI RQVLDRQHFE PDGKYHLFGS RGELAERSGH IGLGKIQSHQ51 LGNLMIQQAA IKGNIGYIVR FSDHGHEVHS PFDNHASHSD SDEAGSPVDG101 FSLYRIHWDG YEHHPADGYD GPQGGGYPAP KGARDIYSYD IKGVAQNIRL151 NLTDNRSTGQ RLADRFHNAG SMLTQGVGDG FKRATRYSPE LDRSGNAAEA201 FNGTADIVKN IIGAAGEIVG AGDAVQGISE GSNIAVMHGL GLLSTENKMA251 RINDLADMAQ LKDYAAAAIR DWAVQNPNAA QGIEAVSNIF MAAIPIKGIG301 AVRGKYGLGG ITAHPIKRSQ MGAIALPKGK SAVSDNFADA AYAKYPSPYH351 SRNIRSNLEQ RYGKENITSS TVPPSNGKNV KLADQRHPKT GVPFDGKGFP401 NFEKHVKYDT GSGGGGATND DDVKKAATVA IAAAYNNGQE INGFKAGETI451 YDIDEDGTIT KKDATAADVE ADDFKGLGLK KVVTNLTKTV NENKQNVDAK501 VKAAESEIEK LTTKLADTDA ALADTDAALD ATTNALNKLG ENITTFAEET551 KTNIVKIDEK LEAVADTVDK HAEAFNDIAD SLDETNTKAD EAVKTANEAK601 QTAEETKQNV DAKVKAAETA AGKAEAAAGT ANTAADKAEA VAAKVTDIKA651 DIATNKDNIA KKANSADVYT REESDSKFVR IDGLNATTEK LDTRLASAEK701 SIADHDTRLN GLDKTVSDLR KETRQGLAEQ AALSGLFQPY NVGLEHHHHH751 H*961-ORF46.11 ATGGCCACAA ACGACGACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC51 TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA101 CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT151 GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT201 CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG251 CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA301 GCAGACACTG ATGCCGCTTT AGCAGATACT GATGCCGCTC TGGATGCAAC351 CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG401 AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT451 GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT501 GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAG551 CCAAACAGAC GGCCGAAGAA ACCAAACAAA ACGTCGATGC CAAAGTAAAA601 GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA651 TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA701 AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT751 GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA801 TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG851 AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA901 GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC951 GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTCGGTTC AATGTAACGG1001 CTGCAGTCGG CGGCTACAAA TCCGAATCGG CAGTCGCCAT CGGTACCGGC1051 TTCCGCTTTA CCGAAAACTT TGCCGCCAAA GCAGGCGTGG CAGTCGGCAC1101 TTCGTCCGGT TCTTCCGCAG CCTACCATGT CGGCGTCAAT TACCAGTGGG1151 GATCCGGAGG AGGAGGATCA GATTTGGCAA ACGATTCTTT TATCCGGCAG1201 GTTCTCGACC GTCAGCATTT CGAACCCGAC GGGAAATACC ACCTATTCGG1251 CAGCAGGGGG GAACTTGCCG AGCGCAGCGG CCATATCGGA TTGGGAAAAA1301 TACAAAGCCA TCAGTTGGGC AACCTGATGA TTCAACAGGC GGCCATTAAA1351 GGAAATATCG GCTACATTGT CCGCTTTTCC GATCACGGGC ACGAAGTCCA1401 TTCCCCCTTC GACAACCATG CCTCACATTC CGATTCTGAT GAAGCCGGTA1451 GTCCCGTTGA CGGATTTAGC CTTTACCGCA TCCATTGGGA CGGATACGAA1501 CACCATCCCG CCGACGGCTA TGACGGGCCA CAGGGCGGCG GCTATCCCGC1551 TCCCAAAGGC GCGAGGGATA TATACAGCTA CGACATAAAA GGCGTTGCCC1601 AAAATATCCG CCTCAACCTG ACCGACAACC GCAGCACCGG ACAACGGCTT1651 GCCGACCGTT TCCACAATGC CGTTAGTATG CTGACGCAAG GAGTAGGCGA1701 CGGATTCAAA CGCGCCACCC GATACAGCCC CGAGCTGGAC AGATCGGGCA1751 ATGCCGCCGA AGCCTTCAAC GGCACTGCAG ATATCGTTAA AAACATCATC1801 GGCGCGGCAG GAGAAATTGT CGGCGCAGGC GATGCCGTGC AGGGCATAAG1851 CGAAGGCTCA AACATTGCTG TCATGCACGG CTTGGGTCTG CTTTCCACCG1901 AAAACAAGAT GGCGCGCATC AACGATTTGG CAGATATGGC GCAACTCAAA
      1951 GACTATGCCG CAGCAGCCAT CCGCGATTGG GCAGTCCAAA ACCCCAATGC2001 CGCACAAGGC ATAGAAGCCG TCAGCAATAT CTTTATGGCA GCCATCCCCA2051 TCAAAGGGAT TGGAGCTGTT CGGGGAAAAT ACGGCTTGGG CGGCATCACG2101 GCACATCCTA TCAAGCGGTC GCAGATGGGC GCGATCGCAT TGCCGAAAGG2151 GAAATCCGCC GTCAGCGACA ATTTTGCCGA TGCGGCATAC GCCAAATACC2201 CGTCCCCTTA CCATTCCCGA AATATCCGTT CAAACTTGGA GCAGCGTTAC2251 GGCAAAGAAA ACATCACCTC CTCAACCGTG CCGCCGTCAA ACGGCAAAAA2301 TGTCAAACTG GCAGACCAAC GCCACCCGAA GACAGGCGTA CCGTTTGACG2351 GTAAAGGGTT TCCGAATTTT GAGAAGCACG TGAAATATGA TACGCTCGAG2401 CACCACCACC ACCCCACTG A1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT51 AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAEVDAAE SEIEKLTTKL101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA151 DTVDKHAEAF NKIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT301 VSDLRKETRQ GLAEQAALSG LFQPYNVGRF NVTAAVGGYK SESAVAIGTG351 FRFTENFAAK AGVAVGTSSG SSAAYHVGVN YEWGSGGGGS DLANDSFIRQ401 VLDRQHFEPD GKYHLFGSRG DLAERSGHIG LGKIQSHQLG NLMIQQAAIK451 GNIGYIVRFS DHGHEVHSPF DNHASHSDSD EAGSPVDGFS LYRIHWDGYE501 HHPADGYDGP QGGGYPAPKG ARDIYSYDIK GVAQNIRLNL TDNRSTGQRL551 ADRFHNAGSM LTQGVGDGFK RATRYSPELD RSGNAAEAFN GTADIVKNII601 GAAGEIVGAG DAVDGISEGS NIAVMHGLGL LSTENKMARI NDLADMAQLK651 DYAAAAIRDW AVQNPNAAQG IEAVSNIFMA AIPIKGIGAV REKYGLGGIT701 AHPIKRSQMG AIALPKGKSA VSDNFADAAY AKYPSPYHSR NIRSNLEQRY751 GKENITSSTV PPSNGKNVKL ADQRHPKTGV PFDGKGFPNF EKHVKYDTLE801 HHHHHH*961-7411 ATGGCCACAA ACGACGACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC51 TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA101 CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT151 GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT201 CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG251 CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA301 GCAGACACTG ATGCCGCTTT AGCAGATAGT GATGCCGCTC TGGATGCAAC351 CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG401 AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT451 GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT501 GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAG551 CCAAACAGAC GGCCGAAGAA ACCAAACAAA ACGTCGATGC CAAAGTAAAA601 GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA651 TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA701 AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT751 GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA801 TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG851 AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA901 GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC951 GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTCGGTTC AATGTAACGG1001 CTGCAGTCGG CGGCTACAAA TCCGAATCGG CAGTCGCCAT CGGTACCGGC1051 TTCCGCTTTA CCGAAAACTT TGCCGCCAAA GCAGGCGTGG CAGTCGGCAC1101 TTCGTCCGGT TCTTCCGCAG CCTACCATGT CGGCGTCAAT TACGAGTGGG1151 GATCCGGAGG GGGTGGTGTC GCCGCCGACA TCGGTGCGGG GCTTGCCGAT1201 GCACTAACCG CACCGCTCGA CCATAAAGAC AAAGGTTTGC AGTCTTTGAC1251 GCTGGATCAG TCCGTCAGGA AAAACGAGAA ACTGAAGCTG GCGGCACAAG1301 GTGCGGAAAA AACTTATGGA AACGGTGACA GCCTCAATAC GGGCAAATTG1351 AAGAACGACA AGGTCAGCCG TTTCGACTTT ATCCGCCAAA TCGAAGTGGA1401 CGGGCAGCTC ATTACCTTGG AGAGTGGAGA GTTCCAAGTA TACAAACAAA1451 GCCATTCCGC CTTAACCGCC TTTCAGACCG AGCAAATACA AGATTCGGAG1501 CATTCCGGGA AGATGGTTGC GAAACGCCAG TTCAGAATCG GCGACATAGC1551 GGGCGAACAT ACATCTTTTG ACAAGCTTCC CGAAGGCGGC AGGGCGGAAT1601 ATCGCGGGAC GGCGTTCGGT TCAGACGATG CCGGCGGAAA ACTGACCTAC1651 ACCATAGATT TCGCCGCCAA GCAGGGAAAC GGCAAAATCG AACATTTGAA1701 ATCGCCAGAA CTCAATGTCG ACCTGGCCGC CGCCGATATC AAGCCGGATG1751 GAAAACGCCA TGCCGTCATC AGCGGTTCCG TCCTTTACAA CCAAGCCGAG1801 AAAGGCAGTT ACTCCCTCGG TATCTTTGGC GGAAAAGCCC AGGAAGTTGC
      1851 CGGCAGCGCG GAAGTGAAAA CCGTAAACGG CATACGCCAT ATCGGCCTTG1901 CCGCCAAGCA ACTCGAGCAC CACCACCACC ACCACTGA1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT51 AADVEADDFK GLGLKKVVTL LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT301 VSDLRKETRQ GLAEQAALSG LFQPYNVGRF NVTAAVGGYK SESAVAIGTG351 FRFTENFAAK AGVAVGTSSG SSAAYHVGVN YEWGSGGGGV AADIGAGLAD401 ALTAPLDHKD KGLQSLTLDQ SVRKNEKLKL AAQGQEKTYG NGDSLNTGKL451 KNDKVSRFDF IRQIEVDGQL ITLESGEFQV YKQSHSALTA FQTEQIQDSE501 HSGKMVAKRQ FRIGDIAGEH TSFDKLPEGG RATYRGTAFG SDDAGGKLTY551 TIDFAAKQGN GKIEHLKSPE LNVDLAAADI KPDGKRHAVL SGSVLYNQAE601 KGSYSLGIFG GKAQEVAGSA EVKTVNGIRH IGLAAKQLEH HHHHH*961-9831 ATGGCCACAA ACGACGACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC51 TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA101 CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT151 GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT201 CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG251 CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA301 GCAGACACTG ATGCCGCTTT AGCAGATACT GATGCCGCTC TGGATGCAAC351 CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG401 AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT451 GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT501 GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAG551 CCAAACAGAC GGCCGAAGAA ACCAAACAAA ACGTCGATGC CAAAGTAAAA601 GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA651 TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA701 AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT751 GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA801 TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG851 AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA901 GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC951 GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTCGGTTC AATGTAACGG1001 CTGCAGTCGG CGGCTACAAA TCCGAATCGG CAGTCGCCAT CGGTACCGGC1051 TTCCGCTTTA CCGAAAACTT TGCCGCCAAA GCAGGCGTGG CAGTCGGCAC1101 TTCGTCCGGT TCTTCCGCAG CCTACCATGT CGGCGTCAAT TACGAGTGGG1151 GATCCGGCGG AGGCGGCACT TCTGCGCCCG ACTTCAATGC AGGCGGTACC1201 GGTATCGGCA GCAACAGCAG AGCAACAACA GCGAAATCAG CAGCAGTATC1251 TTACGCCGGT ATCAAGAACG AAATGTGCAA AGACAGAAGC ATGCTCTGTG1301 CCGGTCGGGA TGACGTTGCG GTTACAGACA GGGATGCCAA AATCAATGCC1351 CCCCCCCCGA ATCTGCATAC CGGAGACTTT CCAAACCAAA ATGACGCATA1401 CAAGAATTTG ATCAACCTCA AACCTGCAAT TGAAGCAGGC TATACAGGAC1451 GCGGGGTAGA GGTAGGTATC GTCGACACAG GCGAATCCGT CGGCAGCATA1501 TCCTTTCCCG AACTGTATGG CAGAAAAGAA CACGGCTATA ACGAAAATTA1551 CAAAAACTAT ACGGCGTATA TGCGGAAGGA AGCGCCTGAA GACGGAGGCG1601 GTAAAGACAT TGAAGCTTCT TTCGACGATG AGGCCGTTAT AGAGACTGAA1651 GCAAAGCCGA CGGATATCCG CCACGTAAAA GAAATCGGAC ACATCGATTT1701 GGTCTCCCAT ATTATTGGCG GGCGTTCCGT GGACGGCAGA CCTGCAGGCG1751 GTATTGCGCC CGATGCGACG CTACACATAA TGAATACGAA TGATGAAACC1801 AAGAACGAAA TGATGGTTGC AGCCATCCGC AATGCATGGG TCAAGCTGGG1851 CGAACGTGGC GTGCGCATCG TCAATAACAG TTTTGGAACA ACATCGAGGG1901 CAGGCACTGC CGACCTTTTC CAAATAGCCA ATTCGGAGGA GCAGTACCGC1951 CAAGCGTTGC TCGACTATTC CGGCGGTGAT AAAACAGACG AGGGTATCCG2001 CCTGATGCAA CAGAGCGATT ACGGCAACCT GTCCTACCAC ATCCGTAATA2051 AAAACATGCT TTTCATCTTT TCGACAGGCA ATGACGCACA AGCTCAGCCC2101 AACACATATG CCCTATTGCC ATTTTATGAA AAAGACGCTC AAAAAGGCAT2151 TATCACAGTC GCAGGCGTAG ACCGCAGTGG AGAAAAGTTC AAACGGGAAA2201 TGTATGGAGA ACCGGGTACA GAACCGCTTG AGTATGGCTC CAACCATTGC2251 GGAATTACTG CCATGTGGTG CCTGTCGGCA CCCTATGAAG CAAGCGTCCG2301 TTTCACCCGT ACAAACCCGA TTCAAATTGC CGGAACATCC TTTTCCGCAC2351 CCATCGTAAC CGGCACGGCG GCTCTGCTGC TGCAGAAATA CCCGTGGATG
      2401 AGCAACGACA ACCTGCGTAC CACGTTGCTG ACGACGGCTC AGGACATCGG2451 TGCAGTCGGC GTGGACAGCA AGTTCGGCTG GGGACTGCTG GATGCGGGTA2501 AGGCCATGAA CGGACCCGCG TCCTTTCCGT TCGGCGACTT TACCGCCGAT2551 ACGAAAGGTA CATCCGATAT TGCCTACTCC TTCCGTAACG ACATTTCAGG2601 CACGGGCGGC CTGATCAAAA AAGGCGGCAG CCAACTGCAA CTGCACGGCA2651 ACAACACCTA TACGGGCAAA ACCATTATCG AAGGCGGTTC GCTGGTGTTG2701 TACGGCAACA ACAAATCGGA TATGCGCGTC GAAACCAAAG GTGCGCTGAT2751 TTATAACGGG GCGGCATCCG GCGGCAGCCT GAACAGCGAC GGCATTGTCT2801 ATCTGGCAGA TACCGACCAA TCCGGCGCAA ACGAAACCGT ACACATCAAA2851 GGCAGTCTGC AGCTGGACGG CAAAGGTACG CTGTACACAC GTTTGGGCAA2901 ACTGCTGAAA GTGGACGGTA CGGCGATTAT CGGCGGCAAG CTGTACATGT2951 CGGCACGCGG CAAGGGGGCA GGCTATCTCA ACAGTACCGG ACGACGTGTT3001 CCCTTCCTGA GTGCCGCCAA AATCGGGCAG GATTATTCTT TCTTCACAAA3051 CATCGAAACC GACGGCGGCC TGCTGGCTTC CCTCGACAGC GTCGAAAAAA3101 CAGCGGGCAG TGAAGGCGAC ACGCTGTCCT ATTATGTCCG TCGCGGCAAT3151 GCGGCACGGA CTGCTTCGGC AGCGGCACAT TCCGCGCCCG CCGGTCTGAA3201 ACACGCCGTA GAACAGGGCG GCAGCAATCT GGAAAACCTG ATGGTCGAAC3251 TGGATGCCTC CGAATCATCC GCAACACCCG AGACGGTTGA AACTGCGGCA3301 GCCGACCGCA CAGATATGCC GGGCATCCGC CCCTACGGCG CAACTTTCCG3351 CGCAGCGGCA GCCGTACAGC ATGCGAATGC CGCCGACGGT GTACGCATCT3401 TCAACAGTCT CGCCGCTACC GTCTATGCCG ACAGTACCGC CGCCCATGCC3451 GATATGCAGG GACGCCGCCT GAAAGCCGTA TCGGACGGGT TGGACCACAA3501 CGGCACGGGT CTGCGCGTCA TCGCGCAAAC CCAACAGGAC GGTGGAACGT3551 GGGAACAGGG CGGTGTTGAA GGCAAAATGC GCGGCAGTAC CCAAACCGTC3601 GGCATTGCCG CGAAAACCGG CGAAAATACG ACAGCAGCCG CCACACTGGG3651 CATGGGACGC AGCACATGGA GCGAAAACAG TGCAAATGCA AAAACCGACA3701 GCATTAGTCT GTTTGCAGGC ATAGGCACG ATGCGGGGCGA TATCGGCTAT3751 CTCAAAGGCC TGTTCTCCTA CGGACGCTAC AAAAACAGCA TCAGCCGCAG3801 CACCGGTGCG GACGAACATG CGGAAGGCAG CGTCAACGGC ACGCTGATGC3851 AGCTGGGCGC ACTGGGCGGT GTCAACGTTC CGTTTGCCGC AACGGGAGAT3901 TTGACGGTCG AAGGCGGTCT GCGCTACGAC CTGCTCAAAC AGGATGCATT3951 CGCCGAAAAA GGCAGTGCTT TGGGCTGGAG CGGCAACAGC CTCACTGAAG4001 GCACGCTGGT CGGACTCGCG GGTCTGAAGC TGTCGCAACC CTTGAGCGAT4051 AAAGCCGTCC TGTTTGCAAC GGCGGGCGTG GAACGCGACC TGAACGGACG4101 CGACTACACG GTAACGGGCG GCTTTACCGG CGCGACTGCA GCAACCGGCA4151 AGACGGGGGC ACGCAATATG CCGCACACCC GTCTGGTTGC CGGCCTGGGC4201 GCGGATGTCG AATTCGGCAA CGGCTGGAAC GGCTTGGCAC GTTACAGCTA4251 CGCCGGTTCC AAACAGTACG GCAACCACAG CGGACGAGTC GGCGTAGGCT4301 ACCGGTTCCT CGAGCACCAC CACCACCACC ACTGA1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT51 AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH KTRLNGLDKT301 VSDLRKETRQ GLAEQAALSG LFQPYNVGRF NVTAAVGGYK SESAVAIGTG351 FRFTENFAAK AGVAVGTSSG SSAAYHVGVN YEWGSGGGGT SAPDFNAGGT401 GIGSNSRATT AKSAAVSYAG IKNEMCKDRS MLCAGRDDVA VTDRDAKINA451 PPPNLHTGDF PNPNDAYKNL INLKPAIEAG YTGRGVEVGI VDTGESVGSI501 SFPELYGRKE HGYNENYKNY TAYMRKEAPE DGGGKDIEAS FDDEAVIETE551 AKPTDIRHVK EIGHIDLVSH IIGGRSVDGR PAGGIAPDAT LHIMNTNDET601 KNEMMVAAIR NAWVKLGERG VRIVNNSFGT TSRAGTADLF QIANSEEQYR651 QALLDYSGGD KTDEGIRLMQ QSDYGNLSYH IRNKNMLFIF STGNDAQAQP701 NTYALLPFYE KDAQKGIITV AGVDRSGEKF KREMYGEPGT EPLEYGSNHC751 GITAMWCLSA PYEASVRFTR TNPIQIAGTS FSAPIVTGTA ALLLQKYPWM801 SNDNLRTTLL TTAQDIGAVG VDSKFGWGLL DAGKAMNGPA SFPFGDFTAD851 TKGTSDIAYS FRNDISGTGG LIKKGGSQLQ LHGNNTYTGK TIIEGGSLVL901 YGNNKSDMRV ETKGALIYNG AASGGSLNSD GIVYLADTDQ SGANETVHIK951 GSLQLDGKGT LYTRLGKLLK VDGTAIIGGK LYMSARGKGA GYLNSTGRRV1001 PFLSAAKIGQ DYSFFTNIET DGGLLASLDS VEKTAGSEGD TLSYYVRRGN1051 AARTASAAAH SAPAGLKHAV EQGGSNLENL MVELDASESS ATPETVETAA1101 ADRTDMPGIR PYGATFRAAA AVQHANAADG VRIFNSLAAT VYADSTAAHA1151 DMQGRRLKAV SDGLDHNGTG LRVIAQTQQD GGTWEQGGVE GKMRGSTQTV1201 GIAAKTGENT TAAATLGMGR STWSENSANA KTDSISLFAG IRHDAGDIGY1251 IKGLFSYGRY KNSISRSTGA DEHAEGSVNG TLMQLGALGG VNVPFAATGD1301 LTVEGGLRYD LLKQDAFAEK GSALGWSGNS LTEGTLVGLA GLKLSQPLSD
      1351 KAVLFATAGV ERDLNGRDYT VTGGFTGATA ATGKTGARNM PHTRLVAGLG1401 ADVEFGNGWN GLARYSYAGS KQYGNHSGRV GVGYRFLEHH HHHH*961c-ORF46.11 ATGGCCACAA ACGACGACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC51 TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA101 CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT151 GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT201 CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG251 CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA301 GCAGACACTG ATGCCGCTTT AGCAGATACT GATGCCGCTC TGGATGCAAC351 CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG401 AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT451 GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT501 GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAG551 CCAAACAGAC GGCCGAAGAA ACCAAACAAA ACGTCGATGC CAAAGTAAAA601 GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA651 TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA701 AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT751 GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA801 TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG851 AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA901 GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC951 GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTGGATCC GGAGGAGGAG1001 GATCAGATTT GGCAAACGAT TCTTTTATCC GGCAGGTTCT CGACCGTCAG1051 CATTTCGAAC CCGACGGGAA ATACCACCTA TTCGGCAGCA GGGGGGAACT1101 TGCCGAGCGC AGCGGCCATA TCGGATTGGG AAAAATACAA AGCCATCAGT1151 TGGGCAACCT GATGATTCAA CAGGCGGCCA TTAAAGGAAA TATCGGCTAC1201 ATTGTCCGCT TTTCCGATCA CGGGCACGAA GTCCATTCCC CCTTCGACAA1251 CCATGCCTCA CATTCCGATT CTGATGAAGC CGGTAGTCCC GTTGACGGAT1301 TTAGCCTTTA CCGCATCCAT TGGGACGGAT ACGAACACCA TCCCGCCGAC1351 GGCTATGACG GGCCACAGGG CGGCGGCTAT CCCGCTCCCA AAGGCGCGAG1401 GGATATATAC AGCTACGACA TAAAAGGCGT TGCCCAAAAT ATCCGCCTCA1451 ACCTGACCGA CAACCGCAGC ACCGGACAAC GGCTTGCCGA CCGTTTCCAC1501 AATGCCGGTA GTATGCTGAC GCAAGGAGTA GGCGACGGAT TCAAACGCGC1551 CACCCGATAC AGCCCCGAGC TGGACAGATC GGGCAATGCC GCCGAAGCCT1601 TCAACGGCAC TGCAGATATC GTTAAAAACA TCATCGGCGC GGCAGGAGAA1651 ATTGTCGGCG CAGGCGATGC CGTGCAGGGC ATAAGCGAAG GCTCAAACAT1701 TGCTGTCATG CACGGCTTGG GTCTGCTTTC CACCGAAAAC AAGATGGCGC1751 GCATCAACGA TTTGGCAGAT ATGGCGCAAC TCAAAGACTA TGCCGCAGCA1801 GCCATCCGCG ATTGGGCAGT CCAAAACCCC AATGCCGCAC AAGGCATAGA1851 AGCCGTCAGC AATATCTTTA TGGCAGCCAT CCCCATCAAA GGGATTGGAG1901 CTGTTCGGGG AAAATACGGC TTGGGCGGCA TCACGGCACA TCCTATCAAG1951 CGGTCGCAGA TGGGCGCGAT CGCATTGCCG AAAGGGAAAT CCGCCGTCAG2001 CGACAATTTT GCCGATGCGG CATACGCCAA ATACCCGTCC CCTTACCATT2051 CCCGAAATAT CCGTTCAAAC TTGGAGCAGC GTTACGGCAA AGAAAACATC2101 ACCTCCTCAA CCGTGCCGCC GTCAAACGGC AAAAATGTCA AACTGGCAGA2151 CCAACGCCAC CCGAAGACAG GCGTACCGTT TGACGGTAAA GGGTTTCCGA2201 ATTTTGAGAA GCACGTGAAA TATGATACGC TCGAGCACCA CCACCACCAC2251 CACTGA1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT51 AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV EIDEKLEAVA151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT301 VSDLRKETRQ GLAEQAALSG LFQPYNVGGS GGGGSDLAND SFIRQVLDRQ351 HFEPDGKYHL FGSRGELAER SGHIGLGKIQ SHQLGNLMIQ QAAIKGNIGY401 IVRFSDHGHE VHSPFDNHAS HSDSDEAGSP VDGFSLYRIH WDGYEHHPAD451 GYDGPQGGGY PAPKGARDIY SYDIKGVAQN IRLNLTDNRS TGQRLADRFH501 NAGSMLTQGV GDGFKRATRY SPELDRSGNA AEAFNGTADI VKNIIGAAGE551 IVGAGDAVQG ISEGSNIAVM HGLGLLSTEN KMARINDLAD MAQLKDYAAA601 AIRDWAVQNP NAAQGIEAVS NIFMAAIPIK GIGAVRGKYG LGGITAHPIK651 RSQMGAIALP KGKSAVSDNF ADAAYAKYPS PYHSRNIRSN LEQRYGKENI701 TSSTVPPSNG KNVKLADQRH PKTGVPFDGK GFPNFEKHVK YDTLEHHHHH
      751 H*961c-7411 ATGGCCACAA ACGACGACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC51 TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA101 CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT151 GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT201 CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG251 CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA301 GCAGACACTG ATGCCGCTTT AGCAGATACT GATGCCGCTC TGGATGCAAC351 CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG401 AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT451 GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT501 GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAG551 CCAAACAGAC GGCCGAAGAA ACCAAACAAA ACGTCGATGC CAAAGTAAAA601 GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA651 TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA701 AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT751 GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAAATTG TCAGAATTGA801 TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG851 AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA901 GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC951 GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTGGATCC GGAGGGGGTG1001 GTGTCGCCGC CGACATCGGT GCGGGGCTTG CCGAGCCACT AACCGCACCG1051 CTCGACCATA AAGACAAAGG TTTGCAGTCT TTGACGCTGG ATCAGTCCGT1101 CAGGAAAAAC GAGAAACTGA AGCTGGCGGC ACAAGGTGCG GAAAAAACTT1151 ATGGAAACGG TGACAGCCTC AATACGGGCA AATTGAAGAA CGACAAGGTC1201 AGCCGTTTCG ACTTTATCCG CCAAATCGAA GTGGACGGGC AGCTCATTAC1251 CTTGGAGAGT GGAGAGTTCC AAGTATACAA ACAAAGCCAT TCCGCCTTAA1301 CCGCCTTTCA GACCGAGCAA ATACAAGATT CGGAGCATTC CGGGAAGATG1351 GTTGCGAAAC GCCAGTTCAG AATCGGCGAC ATAGCGGGCG AACATACATC1401 TTTTGACAAG CTTCCCGAAG GCGGCAGGGC GACATATCGC GGGACGGCGT1451 TCGGTTCAGA CGATGCCGGC GGAAAACTGA CCTACACCAT AGATTTCGCC1501 GCCAAGCAGG GAAACGGCAA AATCGAACAT TTGAAATCGC CAGAACTCAA1551 TGTCGACCTG GCCGCCGCCG ATATCAAGCC GGATGGAAAA CGCCATGCCG1601 TCATCAGCGG TTCCGTCCTT TACAACCAAG CCGAGAAAGG CAGTTACTCC1651 CTCGGTATCT TTGGCGGAAA AGCCCAGGAA GTTGCCGGCA GCGCGGAAGT1701 GAAAACCGTA AACGGCATAC GCCATATCGG CCTTGCCGCC AAGCAACTCG1751 AGCACCACCA CCACCACCAC TGA1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT51 AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TKIKADIATN KDNIAKKANS251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT301 VSDLRKETRQ GLAEQAALSG LFQPYNVGGS GGGGVAADIG AGLADALTAP351 LDHKDKGLQS LTLDQSVRKV EKLKLAAQGA EKTYGNGDSL NTGKLKNDKV401 SRFDFIRQIE VDGQLITLES GEFQVYKQSH SALTAFQTEQ IQDSEHSGKM451 VAKRQFRIGD IAGEHTSFDK LPEGGRATYR GTAFGSDDAG GKLTYTIDFA501 AKQGNGKIEH LDSPELNVDL AAADIKPDGK RHAVISGSVL YNQAEKGSYS551 LGIFGGKAQE VAGSAEVKTV NGIRHIGLAA KQLEHHHHHH *961c-9831 ATGGCCACAA ACGACGACGA TGTTAAAAAA GCTGCCACTG TGGCCATTGC51 TGCTGCCTAC AACAATGGCC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA101 CCATCTACGA CATTGATGAA GACGGCACAA TTACCAAAAA AGACGCAACT151 GCAGCCGATG TTGAAGCCGA CGACTTTAAA GGTCTGGGTC TGAAAAAAGT201 CGTGACTAAC CTGACCAAAA CCGTCAATGA AAACAAACAA AACGTCGATG251 CCAAAGTAAA AGCTGCAGAA TCTGAAATAG AAAAGTTAAC AACCAAGTTA301 GCAGACACTG ATGCCGCTTT AGCAGATACT GAGCGCTCTC TGGATGCAAC351 CACCAACGCC TTGAATAAAT TGGGAGAAAA TATAACGACA TTTGCTGAAG401 AGACTAAGAC AAATATCGTA AAAATTGATG AAAAATTAGA AGCCGTGGCT451 GATACCGTCG ACAAGCATGC CGAAGCATTC AACGATATCG CCGATTCATT501 GGATGAAACC AACACTAAGG CAGACGAAGC CGTCAAAACC GCCAATGAAG
      551 CCAAACAGAC GGCCGAAGAA ACCAAACAAA ACGTCGATGC CAAAGTAAAA601 GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA651 TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA701 AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT751 GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA801 TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG851 AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA901 GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC951 GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTGGATCC GGCGGAGGCG1001 GCACTTCTGC GCCCGACTTC AATGCAGGCG GTACCGGTAT CGGCAGCAAC1051 AGCAGAGCAA CAACAGCGAA ATCAGCAGCA GTATCTTACG CCGGTATCAA1101 GAACGAAATG TGCAAAGACA GAAGCATGCT CTGTGCCGGT CGGGATGACG1151 TTGCGGTTAC AGACAGGGAT GCCAAAATCA ATGCCCCCCC CCCGAATCTG1201 CATACCGGAG ACTTTCCAAA CCCAAATGAC GCATACAAGA ATTTGATCAA1251 CCTCAAACCT GCAATTGAAG CAGGCTATAC AGGACGCGGG GTAGAGGTAG1301 GTATCGTCGA CACAGGCGAA TCCGTCGGCA GCATATCCTT TCCCGAACTG1351 TATGGCAGAA AAGAACACGG CTATAACGAA AATTACAAAA ACTATACGGC1401 GTATATGCGG AAGGAAGCGC CTGAAGACGG AGGCGGTAAA GACATTGAAG1451 CTTCTTTCGA CGATGAGGCC GTTATAGAGA CTGAAGCAAA GCCGACGGAT1501 ATCCGCCACG TAAAAGAAAT CGGACACATC GATTTGGTCT CCCATATTAT1551 TGGCGGGCGT TCCGTGGACG GCAGACCTGC AGGCGGTATT GCGCCCGATG1601 CGACGCTACA CATAATGAAT ACGAATGATG AAACCAAGAA CGAAATGATG1651 GTTGCAGCCA TCCGCAATGC ATGGGTCAAG CTGGGCGAAC GTGGCGTGCG1701 CATCGTCAAT AACAGTTTTG GAACAACATC GAGGGCAGGC ACTGCCGACC1751 TTTTCCAAAT AGCCAATTCG GAGGAGCAGT ACCGCCAAGC GTTGCTCGAC1801 TATTCCGGCG GTGATAAAAC AGACGAGGGT ATCCGCCTGA TGCAACAGAG1851 CGATTACGGC AACCTGTCCT ACCACATCCG TAATAAAAAC ATGCTTTTCA1901 TCTTTTCGAC AGGCAATGAC GCACAAGCTC AGCCCAACAC ATATGCCCTA1951 TTGCCATTTT ATGAAAAAGA CGCTCAAAAA GGCATTATCA CAGTCGCAGG2001 CGTAGACCGC AGTGGAGAAA AGTTCAAACG GGAAATGTAT GGAGAACCGG2051 GTACAGAACC GCTTGAGTAT GGCTCCAACC ATTGCGGAAT TACTGCCATG2101 TGGTGCCTGT CGGCACCCTA TGAAGCAAGC GTCCGTTTCA CCCGTACAAA2151 CCCGATTCAA ATTGCCGGAA CATCCTTTTC CGCACCCATC GTAACCGGCA2201 CGGCGGCTCT GCTGCTGCAG AAATACCCGT GGATGAGCAA CGACAACCTG2251 CGTACCACGT TGCTGACGAC GGCTCAGGAC ATCGGTGCAG TCGGCGTGGA2301 CAGCAAGTTC GGCTGGGGAC TGCTGGATGC GGGTAAGGCC ATGAACGGAC2351 CCGCGTCCTT TCCGTTCGGC GACTTTACCG CCGATACGAA AGGTACATCC2401 GATATTGCCT ACTCCTTCCG TAACGACATT TCAGGCACGG GCGGCCTGAT2451 CAAAAAAGGC GGCAGCCAAC TGCAACTGCA CGGCAACAAC ACCTATACGG2501 GCAAAACCAT TATCGAAGGC GGTTCGCTGG TGTTGTACGG CAACAACAAA2551 TCGGATATGC GCGTCGAAAC CAAAGGTGCG CTGATTTTAA ACGGGGCGGC2601 ATCCGGCGGC AGCCTGAACA GCGACGGCAT TGTCTATCTG GCAGATACCG2651 AGCAATCCGG CGCAAACGAA ACCGTACACA TCAAAGGCAG TCTGCAGCTG2701 GACGGCAAAG GTACGCTGTA CACACGTTTG GGCAAACTGC TGAAAGTGGA2751 CGGTACGGCG ATTATCGGCG GCAAGCTGTA CATGTCGGCA CGCGGCAAGG2801 GGGCAGGCTA TCTCAACAGT ACCGGACGAC GTGTTCCCTT CCTGAGTGCC2851 GCCAAAATCG GGCAGGATTA TTCTTTCTTC ACAAACATCG AAACCGACGG2901 CGGCCTGCTG GCTTCCCTCG ACAGCGTCGA AAAAACAGCG GGCAGTGAAG2951 GCGACACGCT GTCCTATTAT GTCCGTCGCG GCAATGCGGC ACGGACTGCT3001 TCGGCAGCGG CACATTCCGC GCCCGCCGGT CTGAAACACG CCGTAGAACA3051 GGGCGGCAGC AATCTGGAAA ACCTGATGGT CGAACTGGAT GCCTCCGAAT3101 CATCCGCAAC ACCCGAGACG GTTGAAACTG CGGCAGCCGA CCGCACAGAT3151 ATGCCGGGCA TCCGCCCCTA CGGCGCAACT TTCCGCGCAG CGGCAGCCGT3201 ACAGCATGCG AATGCCGCCG ACGGTGTACG CATCTTCAAC AGTCTCGCCG3251 CTACCGTCTA TGCCGACAGT ACCGCCGCCC ATGCCGATAT GCAGGGAGGC3301 CGCCTGAAAG CCGTATCGGA CGGGTTGGAC CACAACGGCA CGGGTCTGCG3351 CGTCATCGCG CAAACCCAAC AGGACGGTGG AACGTGGGAA CAGGGCGGTG3401 TTGAAGGCAA AATGCGCGGC AGTACCCAAA CCGTCGGCAT TGCCGCGAAA3451 ACCGGCGAAA ATACGACAGC AGCCGCCACA CTGGGCATGG GACGCAGCAC3501 ATGGAGCGAA AACAGTGCAA ATGCAAAAAC CGACAGCATT AGTCTGTTTG3551 CAGGCATACG GCACGATGCG GGCGATATCG GCTATCTCAA AGGCCTGTTC3601 TCCTACGGAC GCTACAAAAA CAGCATCAGC CGCAGCCCGG GTGCGGACGA3651 ACATGCGGAA GGCAGGTCAA ACGGCACGCT GATGCAGCTG GGCGCACTGG3701 GCGGTGTCAA CGTTCCGTTT GCCGCAACGG GAGATTTGAC GGTCGAAGGC3751 GGTCTGCGCT ACGACCTGCT CAAACAGGAT GCATTCGCCG AAAAAGGCAG3801 TGCTTTGGGC TGGAGCGGCA ACAGCCTCAC TGAAGGCACG CTGGTCGGAC3851 TCGCGGGTCT GAAGCTGTCG CAACCCTTGA GCGATAAAGC CGTCCTGTTT
      3901 GCAACGGCGG GCGTGGAACG CGACCTGAAC GGACGCGACT ACACGGTAAC3951 GGGCGGCTTT ACCGGCGCGA CTGCAGCAAC CGGCAAGACG GGGGCACGCA4001 ATATGCCGCA CACCCGTCTG GTTGCCGGCC TGGGCGCGGA TGTCGAATTC4051 GGCAACGGCT GGAACGGCTT GGCACGTTAC AGCTACGCCG GTTCCAAACA4101 GTACGGCAAC CACAGCGGAC GAGTCGGCGT AGGCTACCGG TTCCTCGAGC4151 ACCACCACCA CCACCACTGA1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT51 AADVEADDFK GLGLKKVVTN LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT301 VSDLRKETRQ GLAEQAALSG LFQPYNVGGS GGGGTSAPDF NAGGTGIGSN351 SRATTAKSAA VSYAGIKNEM CKDRSMLCAG RDDVAVTDRD AKINAPPPNL401 HTGDFPNPND AYKNLINLKP AIEAGYTGRG VEVGIVDTGE SVGSISFPEL451 YGRKEHGYNE NYKNYTAYMR KEAPEDGGGK DIEASFDDEA VIETEAKPTD501 IRHVKEIGHI DLVSHIIGGR SVDGRPAGGI APDATLHIMN TNDETKNEMM551 VAAIRNAWVK LGERGVRIVN NSFGTTSRAG TADLFQIANS EEQYRQALLD601 YSGGDKTDEG IRLMQQSDYG NLSYHIRNKN MLFIFSTGND AQAQPNTYAL651 LPFYEKDAQK GIITVAGVDR SGEKFKREMY GEPGIEPLEY GSNHCGITAM701 WCLSAPYEAS VRFTRTNPIQ IAGTSFSAPI VTGTAALLLQ KYPWMSNDNL751 RTTLLTTAQD IGAVGVDSKF GWGLLDAGKA MNGPASFPFG DFTADTKGTS801 DIAYSFRNDI SGTGGLIKKG GSQLQLHGNN TYTGKTIIEG GSLVLYGNNK851 SDMRVETKGA LIYNGAASGG SLNSDGIVYL ADTDQSGANE TVHIKGSLQL901 DGKGTLYTRL GKLLKVDGTA IIGGKLYMSA RGKGAGYLNS TGRRVPFLSA951 AKIGQDYSFF TNIETDGGLL ASLDSVEKTA GSEGDTLSYY VRRGNAARTA1001 SAAAHSAPAG LKHAVEQGGS NLENLMVELD ASESSATPET VETAAADRTD1051 MPGIRPYGAT FRAAAAVQHA NAADGVRIFN SLAATVYADS TAAHADMQGR1101 RLKAVSDGLD HNGTGLRVIA QTQQDGGTWE QGGVEGKMRG STQTVGIAAK1151 TGENTTAAAT LGMGRSTWSE NSANAKTDSI SLFAGIRHDA GDIGYLKGLF1201 SYGRYKNSIS RSTGADEHAE GSVNGTLMQL GALGGVNVPF AATGDLTVEG1251 GLRYDLLKQD AFAEKGSALG WSGNSLTEGT LVGLAGLKLS QPLSDKAVLF1301 ATAGVERDLN GRDYTVTGGF TGATAATGKT GARNMPHTRL VAGLGADVEF1351 GNGWNGLARY SYAGSKQYGN HSGRVGVGYR FLEHHHHHH*961cL-ORF46.11 ATGAAACACT TTCCATCCAA AGTACTGACC ACAGCCATCC TTGCCACTTT51 CTGTAGCGGC GCACTGGCAG CCACAAACGA CGACGATGTT AAAAAAGCTG101 CCACTGTGGC CATTGCTGCT GCCTACAACA ATGGCCAAGA AATCAACGGT151 TTCAAAGCTG GAGAGACCAT CTACGACATT GATGAAGACG GCACAATTAC201 CAAAAAAGAC GCAACTGCAG CCGATGTTGA AGCCGACGAC TTTAAAGGTC251 TGGGTCTGAA AAAAGTCGTG ACTAACCTGA CCAAAACCGT CAATGAAAAC301 AAACAAAACG TCGATGCCAA AGTAAAAGCT GCAGAATCTG AAATAGAAAA351 GTTAACAACC AAGTTAGCAG ACACTGATGC CGCTTTAGCA GATACTGATG401 CCGCTCTGGA TGCAACCACC AACGCCTTGA ATAAATTGGG AGAAAATATA451 ACGACATTTG CTGAAGAGAC TAAGACAAAT ATCGTAAAAA TTGATGAAAA501 ATTAGAAGCC GTGGCTGATA CCGTCGACAA GCATGCCGAA GCATTCAACG551 ATATCGCCGA TTCATTGGAT GAAACCAACA CTAAGGCAGA CGAAGCCGTC601 AAAACCGCCA ATGAAGCCAA ACAGACGGCC GAAGAAACCA AACAAAACGT651 CGATGCCAAA GTAAAAGCTG CAGAAACTGC AGCAGGCAAA GCCGAAGCTG701 CCGCTGGCAC AGCTAATACT GCAGCCGACA AGGCCGAAGC TGTCGCTGCA751 AAAGTTACCG ACATCAAAGC TGATATCGCT ACGAACAAAG ATAATATTGC801 TAAAAAAGCA AACAGTGCCG ACGTGTACAC CAGAGAAGAG TCTGACAGCA851 AATTTGTCAG AATTGATGGT CTGAACGCTA CTACCGAAAA ATTGGACACA901 CGCTTGGCTT CTGCTGAAAA ATCCATTGCC GATCACGATA CTCGCCTGAA951 CGGTTTGGAT AAAACAGTGT CAGACCTGCG CAAAGAAACC CGCCAAGGCC1001 TTGCAGAACA AGCCGCGCTC TCCGGTCTGT TCCAACCTTA CAACGTGGGT1051 GGATCCGGAG GAGGAGGATC AGATTTGGCA AACGATTCTT TTATCCGGCA1101 GGTTCTCGAC CGTCAGCATT TCGAACCCGA CGGGAAATAC CACCTATTCG1151 GCAGCAGGGG GGAACTTGCC GAGCGCAGCG GCCATATCGG ATTGGGAAAA1201 ATACAAAGCC ATCAGTTGGG CAACCTGATG ATTCAACAGG CGGCCATTAA1251 AGGAAATATC GGCTACATTG TCCGCTTTTC CGATCACGGG CACGAAGTCC1301 ATTCCCCCTT CGACAACCAT GCCTCACATT CCGATTCTGA TGAAGCCGGT1351 AGTCCCGTTG ACGGATTTAG CCTTTACCGC ATCCATTGGG ACGGATACGA1401 ACACCATCCC GCCGACGGCT ATGACGGGCC ACAGGGCGGC GGCTATCCCG
      1451 CTCCCAAAGG CGCGAGGGAT ATATACAGCT ACGACATAAA AGGCGTTGCC1501 CAAAATATCC GCCTCAACCT GACCGACAAC CGCAGCACCG GACAACGGCT1551 TGCCGACCGT TTCCACAATG CCGGTAGTAT GCTGACGCAA GGAGTAGGCG1601 ACGGATTCAA ACGCGCCACC CGATACAGCC CCGAGCTGGA CAGATCGGGC1651 AATGCCGCCG AAGCCTTCAA CGGCACTGCA GATATCGTTA AAAACATCAT1701 CGGCGCGGCA GGAGAAATTG TCGGCGCAGG CGATGCCGTG CAGGGCATAA1751 GCGAAGGCTC AAACATTGCT GTCATGCACG GCTTGGGTCT GCTTTCCACC1801 GAAAACAAGA TGGCGCGCAT CAACGATTTG GCAGATATGG CGCAACTCAA1851 AGACTATGCC GCAGCAGCCA TCCGCGATTG GGCAGTCCAA AACCCCAATG1901 CCGCACAAGG CATAGAAGCC GTCAGCAATA TCTTTATGGC AGCCATCCCC1951 ATCAAAGGGA TTGGAGCTGT TCGGGGAAAA TACGGCTTGG GCGGCATCAC2001 GGCACATCCT ATCAAGCGGT CGCAGATGGG CGCGATCGCA TTGCCGAAAG2051 GGAAATCCGC CGTCAGCGAC AATTTTGCCG ATGCGGCATA CGCCAAATAC2101 CCGTCCCCTT ACCATTCCCG AAATATCCGT TTCAACTTGG AGCAGCGTTA2151 CGGCAAAGAA AACATCACCT CCTCAACCGT GCCGCCGTCA AACGGCAAAA2201 ATGTCAAACT GGCAGACCAA CGCCACCCGA AGACAGGCGT ACCGTTTGAC2251 GGTAAAGGGT TTCCGAATTT TGAGAAGCAC GTGAAATATG ATACGTAACT2301 CGAG1 MKHFPSKVLT TAILATFCSG ALAATNDDDV KKAATVAIAA AYNNGQEING51 FKAGETIYDI DEDGTITKKD ATAADVEADD FKGLGLKKVV TNLTKTVNEN101 KQNVDAKVKA AESEIEKLTT KLADTDAALA DTDAALDATT NALNKLGENI151 TTFAEETKTN IVKIDEKLEA VADTVDKHAE AFNDIADSLD ETNTKADEAV201 KTANEAKQTA EETKQNVDAK VKAAETAAGK AEAAAGTANT AADKAEAVAA251 KVTDIKADIA TNKDNIAKKA NSADVYTREE SDSKFVRIDG LNATTEKLDT301 RLASAEKSIA DHDTRLNGLD KTVSDLRKET RQGLAEQAAL SGLFQPYNVG351 GSGGGGSDLA NDSFIRQVLD RQHFEPDGKY HLFGSRGELA ERSGHIGLGK401 IQSHQLGNLM IQQAAIKGNI GYIVRFSDHG HEVHSPFDNH ASHSDSDEAG451 SPVDGFSLYR IHWDGYEHHP ADGYDGPQGG GYPAPKGARD IYSYDIKGVA501 QNIRLNLTDN RSTGQRLADR FHNAGSMLTQ GVGDGFKRAT RYSPELDRSG551 NAAEAFNGTA DIVKNIIGAA GEIVGAGDAV QGISEGSNIA VMHGLGLLST601 ENKMARINDL ADMAQLKDYA AAAIRDWAVQ NPNAAQGIEA VSNIFMAAIP651 LKGIGAVRGK YGLGGITAHP IKRSQMGALA LPKGKSAVSD NFADAAYAKY701 PSPYHSRNIR SNLEQRYGKE NITSSTVPPS NGKNVKLADQ RHPKTGVPFD751 GKGFPNFEKH VKYDT*961cL-7411 ATGAAACACT TTCCATCCAA AGTACTGACC ACAGCCATCC TTGCCACTTT51 CTGTAGCGGC GCACTGGCAG CCACAAACGA CGACGATGTT AAAAAAGCTG101 CCACTGTGGC CATTGCTGCT GCCTACAACA ATGGCCAAGA AATCAACGGT151 TTCAAAGCTG GAGAGACCAT CTACGACATT GATGAAGACG GCACAATTAC201 CAAAAAAGAC GCAACTGCAG CCGATGTTGA AGCCGACGAC TTTAAAGGTC251 TGGGTCTGAA AAAAGTCGTG ACTAACCTGA CCAAAACCGT CAATGAAAAC301 AAACAAAACG TCGATGCCAA AGTAAAAGCT GCAGAATCTG AAATAGAAAA351 GTTAACAACC AAGTTAGCAG ACACTGATGC CGCTTTAGCA GATACTGATG401 CCGCTCTGGA TGCAACCACC AACGCCTTGA ATAAATTGGG AGAAAATATA451 ACGACATTTG CTGAAGAGAC TAAGACAAAT ATCGTAAAAA TTGATGAAAA501 ATTAGAAGCC GTGGCTGATA CCGTCGACAA GCATGCCGAA GCATTCAACG551 ATATCGCCGA TTCATTGGAT GAAACCAACA CTAAGGCAGA CGAAGCCGTC601 AAAACCGCCA ATGAAGCCAA ACAGACGGCC GAAGAAACCA AACAAAACGT651 CGATGCCAAA GTAAAAGCTG CAGAAACTGC AGCAGGCAAA GCCGAAGCTG701 CCGCTGGCAC AGCTAATACT GCAGCCGACA AGGCCGAAGC TGTCGCTGCA751 AAAGTTACCG ACATCAAAGC TGATATCGCT ACGAACAAAG ATAATATTGC801 TAAAAAAGCA AACAGTGCCG ACGTGTACAC CAGAGAAGAG TCTGACAGCA851 AATTTGTCAG AATTGATGGT CTGAACGCTA CTACCGAAAA ATTGGACACA901 CGCTTGGCTT CTGCTGAAAA ATCCATTGCC GATCACGATA CTCGCCTGAA951 CGGTTTGGAT AAAACAGTGT CAGACCTGCG CAAAGAAACC CGCCAAGGCC1001 TTGCAGAACA AGCCGGCTC TCCGGTCTGGT TCCAACCTTA CAACGTGGGT1051 GGATCCGGAG GGGGTGGTGT CGCCGCCGAC ATCGGTGCGG GGCTTGCCGA1101 TGCACTAACC GCACCGCTCG ACCATAAAGA CAAAGGTTTG CAGTCTTTGA1151 CGCTGGATCA GTCCGTCAGG AAAAACGAGA AACTGAAGCT GGCGGCACAA1201 GGTGCGGAAA AAACTTATGG AAACGGTGAC AGCCTCAATA CGGGCAAATT1251 GAAGAACGAC AAGGTCAGCC GTTTCGACTT TATCCGCCAA ATCGAAGTGG1301 ACGGGCAGCT CATTACCTTG GAGAGTGGAG AGTTCCAAGT ATACAAACAA1351 AGCCATTCCG CCTTAACCGC CTTTCAGACC GAGCAAATAC AAGATTCGGA1401 GCATTCCGGG AAGATGGTTG CGAAACGCCA GTTCAGAATC GGCGACATAG
      1451 CGGGCGAACA TACATCTTTT GACAAGCTTC CCGAAGGCGG CAGGGCGACA1501 TATCGCGGGA CGGCGTTCGG TTCAGACGAT GCCGGCGGAA AACTGACCTA1551 CACCATAGAT TTCGCCGCCA AGCAGGGAAA CGGCAAAATC GAACATTTGA1601 AATCGCCAGA ACTCAATGTC GACCTGGCCG CCGCCGATAT CAAGCCGGAT1651 GGAAAACGCC ATGCCGTCAT CAGCGGTTCC GTCCTTTACA ACCAAGCCGA1701 GAAAGGCAGT TACTCCCTCG GTATCTTTGG CGGAAAAGCC CAGGAAGTTG1751 CCGGCAGCGC GGAAGTGAAA ACCGTAAACG GCATACGCCA TATCGGCCTT1801 GCCGCCAAGC AACTCGAGCA CCACCACCAC CACCACTGA1 MKHFPSKVLT TAILATFCSG ALAATNDDDV KKAATVAIAA AYNNGQEING51 FKAGETIYDI DEDGTITKKD ATAADVEADD FKGLGLKKVV TNLTKTVNEN101 KQNVDAKVKA AESEIEKLTT KLADTDAALA DTDAALDATT NALNKLGENI151 TTFAEETKTN IVKIDEKLEA VADTVDKHAE AFNDIADSLD ETNTKADEAV201 KTANEAKQTA EETKQNVDAK VKAAETAAGK AEAAAGTANT AADKAEAVAA251 KVTDIKADIA TNKDNIAKKA NSADVYTREE SDSKFVRIDG LNATTEKLDT301 RLASAEKSIA DHDTRLNGLD KTVSDLRKET RQGLAEQAAL SGLFQPYNVG351 GSGGGGVAAD IGAGLADALT APLDHKDKGL QSLTLDQSVR KNEKLKLAAQ401 GAEKTYGNGD SLNTGKLKND KVSRFDFIRQ IEVDGQLITL ESGEFQVYKQ451 SHSALTAFQT EQIQDSEHSG DMVAKRQFRI GDIAGEHTSF DKLPEGGRAT501 YRGTAFGSDD AGGKLTYTID FAAKQGNGKI EHLKSPELNV DLAAADIKPD551 GDRHAVISGS VLYNQAEKGS YSLGIFGGKA QEVAGSAEVK TVNGIRHIGL601 AAKQLEHHHH HH*961cL-9831 ATGAAACACT TTCCATCCAA AGTACTGACC ACAGCCATCC TTGCCACTTT51 CTGTAGCGGC GCACTGGCAG CCACAAACGA CGACGATGTT AAAAAAGCTG101 CCACTGTGGC CATTGCTGCT GCCTACAACA ATGGCCAAGA AATCAACGGT151 TTCAAAGCTG GAGAGACCAT CTACGACATT GATGAAGACG GCACAATTAC201 CAAAAAAGAC GCAACTGCAG CCGATGTTGA AGCCGACGAC TTTAAAGGTC251 TGGGTCTGAA AAAAGTCGTG ACTAACCTGA CCAAAACCGT CAATGAAAAC301 AAACAAAACG TCGATGCCAA AGTAAAAGCT GCAGAATCTG AAATAGAAAA351 GTTAACAACC AAGTTAGCAG ACACTGATGC CGCTTTAGCA GATACTGATG401 CCGCTCTGGA TGCAACCACC AACGCCTTGA ATAAATTGGG AGAAAATATA451 ACGACATTTG CTGAAGAGAC TAAGACAAAT ATCGTAAAAA TTGATGAAAA501 ATTAGAAGCC GTGGCTGATA CCGTCGACAA GCATGCCGAA GCATTCAACG551 ATATCGCCGA TTCATTGGAT GAAACCAACA CTAAGGCAGA CGAAGCCGTC601 AAAACCGCCA ATGAAGCCAA ACAGACGGCC GAAGAAACCA AACAAAACGT651 CGATGCCAAA GTAAAAGCTG CAGAAACTGC AGCAGGCAAA GCCGAAGCTG701 CCGCTGGCAC AGCTAATACT GCAGCCGACA AGGCCGAAGC TGTCGCTGCA751 AAAGTTACCG ACATCAAAGC TGATATCGCT ACGAACAAAG ATAATATTGC801 TAAAAAAGCA AACAGTGCCG ACGTGTACAC CAGAGAAGAG TCTGACAGCA851 AATTTGTCAG AATTGATGGT CTGAACGCTA CTACCGAAAA ATTGGACACA901 CGCTTGGCTT CTGCTGAAAA ATCCATTGCC GATCACGATA CTCGCCTGAA951 CGGTTTGGAT AAAACAGTGT CAGACCTGCG CAAAGAAACC CGCCAAGGCC1001 TTGCAGAACA AGCCGCGCTC TCCGGTCTGT TCCAACCTTA CAACGTGGGT1051 GGATCCGGCG GAGGCGGCAC TTCTGCGCCC GACTTCAATG CAGGCGGTAC1101 CGGTATCGGC AGCAACAGCA GAGCAACAAC AGCGAAATCA GCAGCAGTAT1151 CTTACGCCGG TATCAAGAAC GAAATGTGCA AAGACAGAAG CATGCTCTGT1201 GCCGGTCGGG ATGACGTTGC GGTTACAGAC AGGGATGCCA AAATCAATGC1251 CCCCCCCCCG AATCTGCATA CCGGAGACTT TCCAAACCCA AATGACGCAT1301 ACAAGAATTT GATCAACCTC AAACCTGCAA TTGAAGCAGG CTATACAGGA1351 CGCGGGGTAG AGGTAGGTAT CGTCGACACA GGCGAATCCG TCGGCAGCAT1401 ATCCTTTCCC GAACTGTATG GCAGAAAAGA ACACGGCTAT AACGAAAATT1451 ACAAAAACTA TACGGCGTAT ATGCGGAAGG AAGCGCCTGA AGACGGAGGC1501 GGTAAAGACA TTGAAGCTTC TTTCGACGAT GAGGCCGTTA TAGAGACTGA1551 AGCAAAGCCG ACGGATATCC GCCACGTAAA AGAAATCGGA CACATCGATT1601 TGGTCTCCCA TATTATTGGC GGGCGTTCCG TGGACGGCAG ACCTGCAGGC1651 GGTATTGCGC CCGATGCGAC CGCACACATA ATGAATACGA ATGATGAAAC1701 CAAGAACGAA ATGATGGTTG CAGCCATCCG CAATGCATGG GTCAAGCTGG1751 GCGAACGTGG CGTGCGCATC GTCAATAACA GTTTTGGAAC AACATCGAGG1801 GCAGGCACTG CCGACCTTTT CCAAATAGCC AATTCGGAGG AGCAGTACCG1851 CCAAGCGTTG CTCGACTATT CCGGCGGTGA TAAAACAGAC GAGGGTATCC1901 GCCTGATGCA ACAGAGCGAT TACGGCAACC TGTCCTACCA CATCCGTAAT1951 AAAAACATGC TTTTCATCTT TTCGACAGGC AATGACGCAC AAGCTCAGCC2001 CAACACATAT GCCCTATTGC CATTTTATGA AAAAGACGCT CAAAAAGGCA2051 TTATCACAGT CGCAGGCGTA GACCGCAGTG GAGAAAAGTT CAAACGGGAA
      2101 ATGTATGGAG AACCGGGTAC AGAACCGCTT GAGTATGGCT CCAACCATTG2151 CGGAATTACT GCCATGTGGT GCCTGTCGGC ACCCTATGAA GCAAGCGTCC2201 GTTTCACCCG TACAAACCCG ATTCAAATTG CCGGAACATC CTTTTCCGCA2251 CCCATCGTAA CCGGCACGGC GGCTCTGCTG CTGCAGAAAT ACCCGTGGAT2301 GAGCAACGAC AACCTGCGTA CCACGTTGCT GACGACGGCT CAGGACATCG2351 GTGCAGTCGG CGTGGACAGC AAGTTCGGCT GGGGACTGCT GGATGCGGGT2401 AAGGCCATGA ACGGACCCGC GTCCTTTCCG TTCGGCGACT TTACCGCCGA2451 TACGAAAGGT ACATCCGATA TTGCCTACTC CTTCCGTAAC GACATTTCAG2501 GCACGGGCGG CCTGATCAAA AAAGGCGGCA GCCAACTGCA ACTGCACGGC2551 AACAACACCT ATACGGGCAA AACCATTATC GAAGGCGGTT CGCTGGTGTT2601 GTACGGCAAC AACAAATCGG ATATGCGCGT CGAAACCAAA GGTGCGCTGA2651 TTTATAACGG GGCGGCATCC GGCGGCAGCC TGAACAGCGA CGGCATTGTC2701 TATCTGGCAG ATACCGACCA ATCCGGCGCA AACGAAACCG TACACATCAA2751 AGGCAGTCTG CAGCTGGACG GCAAAGGTAC GCTGTACACA CGTTTGGGCA2801 AACTGCTGAA AGTGGACGGT ACGGCGATTA TCGGCGGCAA GCTGTACATG2851 TCGGCACGCG GCAAGGGGGC AGGCTATCTC AACAGTACCG GACGACGTGT2901 TCCCTTCCTG AGTGCCGCCA AAATCGGGCA GGATTATTCT TTCTTCACAA2951 ACATCGAAAC CGACGGCGGC CTGCTGGCTT CCCTCGACAG CGTCGAAAAA3001 ACAGCGGGCA GTGAAGGGGA CACGCTGTCC TATTATGTCC GTCGCCGCAA3051 TGCGGCACGG ACTGCTTCGG CAGCGGCACA TTCCGCGCCC GCCGGTCTGA3101 AACACGCCGT AGAACAGGGC GGCAGCAATC TGGAAAACCT GATGGTCGAA3151 CTGGATGCCT CCGAATCATC CGCAACACCC GAGACGGTTG AAACTGCGGC3201 AGCCGACCGC ACAGATATGC CGGGCATCCG CCCCTACGGC GCAACTTTCC3251 GCGCAGCGGC AGCCGTACAG CATGCGAATG CCGCCGACGG TGTACGCATC3301 TTCAACAGTC TCGCGGCTAC CGTCTATGCC GACAGTACCG CCGCCCATGC3351 CGATATGCAG GGACGCCGCC TGAAAGCCGT ATCGGACGGG TTGGACCACA3401 ACGGCACGGG TCTGCGCGTC ATCGCGCAAA CCCAACAGGA CGGTGGAACG3451 TGGGAACAGG GCGGTGTTGA AGGCAAAATG CGCGGCAGTA CCCAAACCGT3501 CGGCATTGCC GCGAAAACCG GCGAAAATAC GACAGCAGCC GCCACACTGG3551 GCATGGGACG CAGCACATGG AGCGAAAACA GTGCAAATGC AAAAACCGAC3601 AGCATTAGTC TGTTTGCAGG CATACGGCAC GATGCGGGCG ATATCGGCTA3651 TCTCAAAGGC CTGTTCTCCT ACGGACGCTA CAAAAACAGC ATCAGCCGCA3701 GCACCGGTGC GGACGAACAT GCGGAAGGCA GCGTCAACGG CACGCTGATG3751 CAGCTGGGCG CACTGGGCGG TGTCAACGTT CCGTTTGCGG CAACGGGAGA3801 TTTGACGGTC GAAGGCGGTC TGCGCTACGA CCTGCTCAAA CAGGATGCAT3851 TCGCCGAAAA AGGCAGTGCT TTGGGCTGGA GCGGCAACAG CCTCACTGAA3901 GGCACGCTGG TCGGACCTGC GGGTCTGAAG CTGTCGCAAC CCTTGAGCGA3951 TAAAGCCGTC CTGTTTGCAA CGGCGGGCGT GGAACGCGAC CTGAACGGAC4001 GCGACTACAC GGTAACGGGC GGCTTTACCG GCGCGACTGC AGCAACCGGC4051 AAACGGGGGG CACGCAATAT GCCGCACACC CGTCTGGTTG CCGGCCTGGG4101 CGCGGATGTC GAATTCGGCA ACGGCTGGAA CGGCTTGGCA CGTTACAGCT4151 ACGCCGGTTC CAAACAGTAC GGCAACCACA GCGGACGAGT CGGCGTAGGC4201 TACCGGTTCT GACTCGAG1 MKHFPSKVLT TAILATFCSG ALAATNDDDV KKAATVAIAA AYNNGQEING51 FKAGETIYDI DEDGTITKKD ATAADVKADD FKGLGLKKVV TNLTKTVNEN101 KQNVDAKVKA AESEIEKLTT KLADTDAALA DTDAALDATT NALNKLGENI151 TTFAEETKTN IVKIDEKLEA VADTVDKHAE AFNDIADSLK ETNTKADEAV201 KTANEAKQTA EETKQNVDAK VKAAETAAGK AEAAAGTANT AADKAEAVAA251 KVTDIKADIA TNKDNIAKKA NSADVYTREE SDSKFVRIDG LNATTEKLDT301 RLASAEKSIA DHDTRLNGLD KTVSDLRKET RQGLAEQAAL SGLFQPYNVG351 GSGGGGTSAP DFNAGGTGIG SNSRATTAKS AAVSYAGIKN EMCKDRSMLC401 AGRDDVAVTD RDAKINAPPP NLHTGDFPNP NDAYKNLINL KPAIEAGYTG451 RGVEVGIVDT GESVGSISFP ELYGRKEHGY NENYKNYTAY MRKEAPEDGG501 GKDIEASFDD EAVIETEAKP TDIRHVKEIG HIDLVSHIIG GRSVDGRPAG551 GIAPDATLHI MNTNDETKNE MMVAAIRNAW VKLGERGVRI VNNSFGTTSR601 AGTADLFQIA NSEEQYRQAL LDYSGGDKTD EGIRLMQQSD YGNLSYHIRN651 KNMLFIFSTG NDAQAQPNTY ALLPFYEKDA QKGIITVAGV DRSGEKFKRE701 MYGEPGTEPL EYGSNHCGIT AMWCLSAPYE ASVRFTRTNP IQIAGTSFSA751 PIVTGTAALL LQKYPWMSND NLRTTLLTTA QDIGAVGVDS KFGWGLLDAG801 KAMNGPASFP FGDFTADTKG TSDIAYSFRN DISGTGGLIK KGGSQLQLHG851 NNTYTGKTII EGGSLVLYGN NKSDMRVETK GALIYNGAAS GGSLNSDGIV901 YLADTDQSGA NETVHIKGSL QLDGKGTLYT RLGKLLKVDG TAIIGGKLYM951 SARGKGAGYL NSTGRRVPFL SAAKIGQDYS FFTNIETDGG LLASLDSVEK1001 TAGSEGDTLS YYVRRGNAAR TASAAAHSAP AGLKHAVEQG GSNLENLMVE1051 LDASESSATP ETVETAAADR TDMPGIRPYG ATFRAAAAVQ HANAAKGVRI1101 FNSLAATVYA DSTAAHADMQ GRRLKAVSDG LDHNGTGLRV IAQTQQDGGT
      1151 WEQGGVEGKM RGSTQTVGIA AKTGENTTAA ATLGMGRSTW SENSANAKTD1201 SISLFAGIRH DAGDIGYLKG LFSYGRYKNS ISRSTGADEH AEGSVNGTLM1251 QLGALGGVNV PFAATGDLTV EGGLRYDLLK QDAFAKKGSA LGWSGNSLTE1301 GTLVGLAGLK LSQPLSDKAV LFATAGVERD LNGRDYTVTG GFTGATAATG1351 KTGARNMPHT RLVAGLGADV EFGNGWNGLA RYSYAGSKQY GNHSGRVGVG1401 YRF*可以理解本發(fā)明僅以例子的方式進(jìn)行描述,在本發(fā)明的范圍和精神內(nèi)還可進(jìn)行改變。例如,設(shè)想可以使用其它菌株的蛋白質(zhì)[如,參見(jiàn)WO 00/66741,ORF4、ORF40、ORF46、225、235、287、519、726、919和953的多聚體序列]。
      實(shí)驗(yàn)詳述FPLC蛋白質(zhì)純化下表總結(jié)了所用的FPLC蛋白質(zhì)純化

      緩沖液包括20-120mM NaCl、5.0mg/ml CHAPS和10%v/v甘油。將透析液以13000g離心20分鐘,加樣到單Q或單S FPLC離子交換樹(shù)脂上。按照感興趣蛋白質(zhì)的pI和FPLC方法手冊(cè)[pharmaciaFPLC離子交換和層析聚焦;理論和方法。Pharmacia Publication]選擇緩沖液和離子交換樹(shù)脂。用分步NaCl梯度法脫蛋白質(zhì)。用SDS-PAGE分析純化,并用Bradford方法測(cè)定蛋白質(zhì)濃度。
      ‘方法′欄中的字母為以下含義FPLC-A破碎細(xì)胞后從大腸桿菌可溶性組分中純化克隆121.1、128.1、593、726、982、周質(zhì)蛋白質(zhì)920L和雜交蛋白919-287、953-287。于37℃,在20mlLB/Amp(100μg/ml)液體培養(yǎng)基中,使攜帶感興趣質(zhì)粒的單集落生長(zhǎng)過(guò)夜。用1.0L新鮮培養(yǎng)基以1∶30稀釋細(xì)菌,并在30℃或37℃生長(zhǎng)直到OD550到達(dá)0.6-0.8。以終濃度1.0mM的IPTG誘導(dǎo)重組蛋白質(zhì)的表達(dá)。培育3小時(shí)后,于4℃以8000離心15分鐘收獲細(xì)菌。必要時(shí)將細(xì)胞存儲(chǔ)于-20℃。隨后的所有步驟都是在冰上或4℃進(jìn)行的。對(duì)胞質(zhì)蛋白質(zhì)(121.1、128.1、593、726和982)和周質(zhì)蛋白質(zhì)920L而言,將細(xì)菌重懸浮于25ml含完整蛋白酶抑制劑(Boehringer-Mannheim)的PBS中。用Branson Sonifier 450通過(guò)超聲處理裂解細(xì)胞。以8000g離心破碎的細(xì)胞30分鐘,以沉淀未破碎的細(xì)胞和包含體,并加入3.9M(NH4)2SO4使上清液達(dá)到35%v/v飽和。以8000g沉積沉淀物30分鐘。添加3.9M(NH4)2SO4使上清液達(dá)到70%/v飽和,如上所述收集沉淀物。用SDS-PAGE鑒定含感興趣蛋白質(zhì)的沉淀物,并用適合的離子交換緩沖液(見(jiàn)以下)透析6小時(shí)或過(guò)夜。按Evans等[Infect.hnmun.(1974)101010-1017]的方法制備表達(dá)953L大腸桿菌的周質(zhì)組分,并用適合的離子交換緩沖液透析。根據(jù)感興趣蛋白的pI和FPLC方法手冊(cè)[Pharmacia]的推薦選擇緩沖液和離子交換樹(shù)脂。緩沖液包括20mM NaCl和10%(v/v)甘油。以13000g離心透析液20分鐘,并加到單Q或單S FPLC離子交換樹(shù)脂上。根據(jù)感興趣蛋白的pI和FPLC方法手冊(cè)[Pharmacia]的推薦選擇緩沖液和離子交換樹(shù)脂。用分步或連續(xù)NaCl梯度從離子交換樹(shù)脂洗脫蛋白質(zhì)。用SDS-PAGE分析純化,并用Bradford方法測(cè)定蛋白質(zhì)濃度。通過(guò)NH2-未端測(cè)序(見(jiàn)以下)驗(yàn)證周質(zhì)蛋白質(zhì)的前導(dǎo)肽的切割。
      FPLC-B從大腸桿菌的膜組分純化這些蛋白質(zhì)。37℃,在20ml LB/Amp(100μg/ml)液液培養(yǎng)基中使攜帶感興趣質(zhì)粒的單集落生長(zhǎng)過(guò)夜。用1.0L新鮮培養(yǎng)基以l∶30稀釋細(xì)菌。克隆406.1L和919LOrf4在30℃生長(zhǎng),Orf25L和576.1L在37℃生長(zhǎng),直到OD550達(dá)到0.6-0.8。對(duì)919LOrf4而言,生長(zhǎng)必須在30℃,因?yàn)橹亟M蛋白質(zhì)在37℃的表達(dá)導(dǎo)致細(xì)胞的裂解。以終濃度為1.0mM的IPTG誘導(dǎo)重組蛋白質(zhì)的表達(dá)。培育3小時(shí)后,于4℃以8000g離心15分鐘收獲細(xì)菌。必要時(shí),將細(xì)胞存儲(chǔ)于-20℃。隨后的所有步驟都是在冰上或4℃進(jìn)行的。將細(xì)菌重懸浮于25ml含完整蛋白酶抑制劑(Boehringer-Mannheim)的PBS中,并通過(guò)French Press以滲透性沖擊2-3代裂解細(xì)菌。以5000g離心15分鐘除去未破碎的細(xì)胞,以100000g(Beckman Ti50,38000rpm)離心45分鐘沉淀膜。用Dounce勻漿器將膜沉淀物重懸浮于7.5ml 20mM Tris-HCl(pH 8.0)、1.0M NaCl和完整的蛋白酶抑制劑中?;旌蠎腋∫?4小時(shí),以100000g離心45分鐘,并將沉淀物重懸浮于7.5ml 20mM Tris-HCl(pH 8.0)、1.0M NaCl、5.0mg/ml CHAPS、10%(v/v)甘油和完整的蛋白酶抑制劑中。將此溶液混合過(guò)夜,以100000g離心45分鐘,用適當(dāng)選擇的緩沖液透析上清液6小時(shí)。對(duì)Orf25.L而言,發(fā)現(xiàn)在CHAPS提取后得到的沉淀物包含重組蛋白質(zhì)。無(wú)需進(jìn)一步純化,可將該組分用于免疫接種小鼠。
      FPLC-C與FPLC-A相同,但從用多粘菌素B滲透大腸桿菌后得到的可溶性組分進(jìn)行純化,而不是在細(xì)胞破碎后進(jìn)行的。
      FPLC-D于37℃,使攜帶感興趣質(zhì)粒的單集落在20ml LB/Amp(100μg/ml)液態(tài)培養(yǎng)基中生長(zhǎng)過(guò)夜。用1.0L新鮮培養(yǎng)基以1∶30稀釋細(xì)菌,并在30℃生長(zhǎng)直到OD550到達(dá)0.6-0.8。以終濃度1.0mM的IPTG誘導(dǎo)重組蛋白質(zhì)的表達(dá)。培育3小時(shí)后,于4℃以8000離心15分鐘收獲細(xì)菌。必要時(shí)將細(xì)胞存儲(chǔ)于-20℃。隨后的所有步驟都是在冰上或4C進(jìn)行的。將細(xì)胞重懸浮于20mM Bicine(pH8.0)、20mM NaCl、10%(v/v)甘油和完整蛋白酶抑制劑(Boehringer-Mannheim)中,并用Branson Sonifier 450破碎細(xì)胞。以8000g離心超聲處理液30分鐘,以沉積未破碎的細(xì)胞和包含體。通過(guò)添加3.9M(NH4)2SO4,從飽和度為35%v/v到70%v/v之間的溶液中沉淀重組蛋白。以8000g沉積沉淀物30分鐘,將其重懸浮于20mM Bicine(pH 8.5)、20mM NaCl、10%(v/v)甘油,并用該緩沖液透析6小時(shí)或過(guò)夜。以13000g離心透析液20分鐘,并加到FPLC樹(shù)脂上。用分步NaCl梯度從該柱洗脫下蛋白質(zhì)。用SDS-PAGE分析純化,并用Bradford方法測(cè)定蛋白質(zhì)濃度。
      克隆策略和寡核苷酸設(shè)計(jì)用以腦膜炎奈瑟球菌B MC58的基因組序列為基礎(chǔ)設(shè)計(jì)的寡核苷酸,通過(guò)PCR擴(kuò)增編碼感興趣抗原的基因。除非特別指出,通常將菌株2996的基因組DNA用作PCR反應(yīng)的模板,將擴(kuò)增的片段克隆入表達(dá)載體pET2lb+(Novagen),從而以C-未端His標(biāo)記的產(chǎn)物形式表達(dá)該蛋白質(zhì),或?qū)⑵淇寺∪雙ET-24b+(Novagen)以‘未標(biāo)記的′形式(如ΔG287K)表達(dá)該蛋白質(zhì)。
      當(dāng)?shù)鞍踪|(zhì)不用融合配體和用其自身前導(dǎo)肽(如果存在時(shí))表達(dá)時(shí),進(jìn)行開(kāi)放讀框(ATG到終止密碼子)的擴(kuò)增。
      當(dāng)?shù)鞍踪|(zhì)以‘未標(biāo)記的′的形式表達(dá)時(shí),通過(guò)從預(yù)計(jì)的前導(dǎo)序列設(shè)計(jì)5′-端擴(kuò)增引物下游除去前導(dǎo)肽。
      用于PCR的引物的解鏈溫度取決于整個(gè)引物中雜交核苷酸的數(shù)量和類型,并用以下公式確定Tm1=4(G+C)+2(A+T)(除去尾部的)Tm2=64.9+0.41(%GC)-600/N(完整的引物)對(duì)整個(gè)寡聚物而言,所選寡核苷酸的解鏈溫度通常為65-70℃,僅針對(duì)雜交區(qū)域,解鏈溫度為50-60℃。
      用Perkin Elmer 394 DNA/RNA合成儀合成寡核苷酸,將其從柱上洗脫到2.0ml NH4OH中,在56℃培育5小時(shí)以去保護(hù)。加入0.3M乙酸鈉和2體積的乙醇沉淀寡聚物。將樣品離心,將沉淀物重懸浮于水中。












      *將該引物用作反向引物,將所有287的C未端融合于His-標(biāo)記。
      §與287-His反向引物聯(lián)用的正向引物。
      NB-所有PCR反應(yīng)使用菌株2996,除非特別指出如菌株MC58)。
      在所有以ATG起始不跟隨唯一NheI位點(diǎn)的構(gòu)建物中,ATG密碼子是用于克隆的NdeI位點(diǎn)的一部分。在5′端用NheI作為克隆位點(diǎn)制備的構(gòu)建物(如所有那些在N-未端包含287的)另有兩個(gè)融合于抗原的編碼序列的密碼子(GCTAGC)。
      染色體DNA模板的制備在100ml GC培養(yǎng)基中使腦膜炎奈瑟球菌菌株2996、MC58、394.98、1000和BZ232及其它)生長(zhǎng)至指數(shù)期,離心收獲,并重懸浮于5ml緩沖液(20%w/v蔗糖、50mM Tris-HCl、50mM EDTA、pH 8)中。在冰上培育10分鐘后,加入10ml裂解液(50mM NaCl、1%十二烷基肌氨酸鈉(Na-Sarkosyl)、50μg/ml蛋白酶K)裂解細(xì)菌,懸浮液在37℃培育2小時(shí)。進(jìn)行2次苯酚提取(平衡至pH8)和一次CHCl3/異戊醇(24∶1)提取。加入0.3M乙酸鈉和2體積乙醇沉降DNA,并離心收集。用70%(v/v)乙醇洗滌沉淀物1次,并重溶解于4.0ml TE緩沖液(10mM Tris-HCl、1mM EDTA、pH 8.0)。讀取OD260測(cè)定DNA濃度。
      PCR擴(kuò)增標(biāo)準(zhǔn)的PCR過(guò)程進(jìn)行如下在40μM各寡核苷酸引物、400-800μM dNTP溶液、1x PCR緩沖液(包含1.5mM MgCl2)、2.5單位TaqI DNA聚合酶(用Perkin-Elmer AmpliTaQ,Boerhingher Mannheim ExpandTM長(zhǎng)模板)存在時(shí),將200ng 2996、MC581000、或BZ232菌株的基因組DNA或10ng重組克隆的質(zhì)粒DNA制備物用作模板。
      將整個(gè)混合物在95℃初步培育3分鐘后,每份樣品進(jìn)行2-步的擴(kuò)增用除去引物(Tm1)的限制酶尾部的雜交溫度進(jìn)行前5輪。然后以按全長(zhǎng)?聚物(Tm2)計(jì)算的雜交溫度進(jìn)行30輪。根據(jù)要擴(kuò)增的Orf的長(zhǎng)度,在68℃或72℃進(jìn)行的延伸時(shí)間各不相同。對(duì)Orf1而言,白3分鐘開(kāi)始的延伸時(shí)間每輪遞增15秒。以在72℃10分鐘延伸步驟完成循環(huán)。
      將擴(kuò)增的DNA直接加到1%瓊脂糖凝膠上。按制造商說(shuō)明,用Qiagen凝膠提取試劑盒純化相應(yīng)于正確大小條帶的DNA片段。
      PCR片段和克隆載體的消化用適合的限制酶消化相應(yīng)于擴(kuò)增片段的純化DNA,從而克隆入pET-21b+、pET22b+、或pET-24b+。用QIAquick PCR純化試劑盒(按制造商的說(shuō)明)純化消化的片段,用H2O或10mM Tris(pH 8.5)洗脫。用適合的限制酶消化質(zhì)粒載體,加到1.0%瓊脂糖凝膠上,用Qiagen AIQquick凝膠提取試劑盒純化相應(yīng)于消化的載體的條帶。
      克隆將預(yù)先消化和純化的、相應(yīng)于各基因的片段連接到pET21b+、pET22b+或pET-24b+中。將在連接緩沖液(由制造商提供)中的T4DNA連接酶用于摩爾比為3∶1的片段/載體。
      通過(guò)在冰上培育連接酶反應(yīng)溶液和細(xì)菌40分鐘,然后在37℃培育3分鐘,將重組質(zhì)粒轉(zhuǎn)化入感受態(tài)大腸桿菌DH5或HB101中。
      然后添加800μl LB肉湯,并在37℃培育20分鐘。在Eppendorf微型離心機(jī)中以最高速度離心這些細(xì)胞,并重懸浮于約200μl的上清液中,并涂布在到LB氨芐青霉素(100mg/ml)瓊脂上。
      在4.0ml LB肉湯+100μg/ml氨芐青霉素中培育隨機(jī)選擇的集落過(guò)夜,進(jìn)行重組集落的篩選。使細(xì)胞沉淀,并按制造商的說(shuō)明用Qiagen QIAprep SpinMiniprep試劑盒提取質(zhì)粒DNA。用適合的限制酶消化約1μg的各微型制備物,將消化物加到1-1.5%瓊脂糖凝膠(取決于預(yù)計(jì)的插入大小)與分子量標(biāo)記(1kbDNA Ladder,GIBCO)平行。根據(jù)插入的大小選擇陽(yáng)性克隆。
      表達(dá)各基因克隆入表達(dá)載體后,將重組質(zhì)粒轉(zhuǎn)化入適合表達(dá)重組蛋白的大腸桿菌菌株中。如上所述,用1μl各構(gòu)建物轉(zhuǎn)化大腸桿菌BL21-DE3。將單重組集落接種入2ml LB+Amp(100μg/ml)中,在37℃培育過(guò)夜,然后在100ml燒瓶中用20ml LB+Amp(100μg/ml)以1∶30稀釋,使OD600在0.1-0.2之間。將燒瓶置于旋轉(zhuǎn)式水浴搖床中于30℃或37℃培育,直到OD600顯示適合誘導(dǎo)表達(dá)的指數(shù)生長(zhǎng)期(0.4-0.8OD)。加入1.0mM IPTG誘導(dǎo)蛋白質(zhì)表達(dá)。在30℃或37℃培育3小時(shí)后,測(cè)定OD600并檢測(cè)表達(dá)。用微型離心機(jī)離心1.0ml各樣品,將沉淀物重懸浮于PBS中,用SDS-PAGE和考馬斯藍(lán)染色分析。
      Gateway克隆和表達(dá)克隆GATE標(biāo)記的序列,并用GATEWAY克隆方法(GIBCO-BRL)表達(dá)。重組克隆(CR)是根據(jù)介節(jié)噬菌體整合入大腸桿菌基因組和從大腸桿菌基因組切除噬菌體的重組反應(yīng)。整合包括在位于細(xì)菌基因組attB位點(diǎn)中的噬菌體DNA的attP位點(diǎn)的重組(BP反應(yīng))和產(chǎn)生側(cè)翼于attL和attR位點(diǎn)的整合的噬菌體基因組。切除將attL和attR位點(diǎn)重組回attP和attB位點(diǎn)(LR反應(yīng))。整合反應(yīng)需要兩種酶[噬菌體蛋白融合酶(Int)和細(xì)菌蛋白整合宿主因子(IHF)](BP克隆酶)。切除反應(yīng)需要Int、IHF和其它噬菌體酶切除酶(Xis)(LR克隆酶)。將25-bp細(xì)菌attB重組位點(diǎn)的人工衍生物(涉及B1和B2)加到用于PCR反應(yīng)的引物的5′端,以擴(kuò)增奈瑟球菌的ORF。用BP克隆酶,將得到的產(chǎn)物BP克隆入包含噬菌體attP重組位點(diǎn)的互補(bǔ)衍生物的“供體載體”中。得到的“進(jìn)入克隆”包含側(cè)翼于attL位點(diǎn)的衍生物(L1和L2)的ORF,用LR克隆酶將其亞克隆入包含attL-相容的attR位點(diǎn)的衍生物的表達(dá)“目的載體”中。得到“表達(dá)克隆”,其中ORF側(cè)翼于B1和B2,且在讀框內(nèi)融合于GST或His N未端標(biāo)記。
      用于GATEWAY表達(dá)的大腸桿菌菌株是BL21-SI。通過(guò)在含有鹽(0.3MNaCl)的培養(yǎng)基中培育,誘導(dǎo)該菌株的細(xì)胞表達(dá)T7 RNA聚合酶。
      要注意的是該系統(tǒng)產(chǎn)生N-未端His標(biāo)記。
      膜蛋白的制備分離主要由內(nèi)膜、外膜或全膜構(gòu)成的組分,以獲得由膜定位的前導(dǎo)序列表達(dá)的重組蛋白。制備膜組分(富含重組蛋白)的方法是采用Filip等[J.Bact.(1973)115717-722]和Davies等人[J.Innunol.Meth.(1990)143215-225]的方法。于37℃,在20ml LB/Amp(100μg/ml)液體培養(yǎng)基中使攜帶感興趣質(zhì)粒中的單集落生長(zhǎng)過(guò)夜。用1.0L新鮮培養(yǎng)基以1∶30稀釋細(xì)菌,讓其在30℃或37℃生長(zhǎng)直到OD550達(dá)到0.6-0.8。用終濃度為1.0mM的IPTG誘導(dǎo)重組蛋白的表達(dá)。培育3小時(shí)后,在4℃以8000g離心15分鐘收獲細(xì)菌,并重懸浮于20ml 20mM Tris-HCl(pH 7.5)和完整的蛋白酶抑制劑(Boehringer-Mannheim)中。隨后的所有步驟都是在4℃或冰上進(jìn)行的。
      用Branson Sonifier 450進(jìn)行超聲處理破碎細(xì)胞,并以5000g離心20分鐘以沉積未破碎的細(xì)胞和包含體。以50000g(Beckman Ti50,29000rpm)離心包含膜和細(xì)胞碎片的上清液75分鐘,用20mM Bis-Tris丙烷(pH 6.5)、1.0M NaCl、10%(v/v)甘油洗滌,并以50000g再次離心75分鐘。將沉淀物重懸浮于20mMTris-HCl(pH 7.5)、2.0%(v/v)十二烷基肌氨酸鈉、完整的蛋白酶抑制劑(1.0mMEDTA終濃度),并培育20分鐘以溶解內(nèi)膜。以5000g離心沉淀的細(xì)胞碎片10分鐘,以75000g離心上清液75分鐘(Beckman Ti50,33000rpm)。在上清液中發(fā)現(xiàn)蛋白質(zhì)008L和519L,表明內(nèi)膜的定位。對(duì)這些蛋白質(zhì),用內(nèi)膜和全膜組分(如上所述用NaCl洗滌)免疫接種小鼠。用20mM Tris-HCl(pH 7.5)洗滌從75000g沉淀物得到的外膜小泡,并以75000g離心75分鐘或過(guò)夜。最后將OMV重懸浮于500μl 20mM Tris-HCl(pH 7.5)、10%v/v甘油中。Orf1L和Orf40L都定位于且在外膜組分中富含,將其用于免疫接種小鼠。用標(biāo)準(zhǔn)Bradford試驗(yàn)(Bio-Rad)計(jì)算蛋白質(zhì)濃度,用DC蛋白質(zhì)試驗(yàn)(Bio-Rad)確定內(nèi)膜組分的蛋白質(zhì)濃度。用SDS-PAGE分析分離步驟中的各種組分。
      His-標(biāo)記的蛋白質(zhì)的純化從菌株2996和MC58中克隆了287的各種形式。用C-未端His標(biāo)記的融合體進(jìn)行構(gòu)建,其包括成熟形式(aa18-427)、含缺失(Δ1、Δ2、Δ3和Δ4)的構(gòu)建物和由B或C結(jié)構(gòu)域組成的克隆。對(duì)以His-融合體純化的各克隆而言,劃線接種單集落,并且在37℃LB/Amp(100μg/ml)瓊脂板上培育過(guò)夜。將從該平板上分離的集落接種到20ml LB/Amp(100μg/ml)的液體培養(yǎng)基中,并在37℃振蕩生長(zhǎng)過(guò)夜。以1∶30將過(guò)夜培養(yǎng)物稀釋到1.0L LB/Amp(100μg/ml)液體培養(yǎng)基中,讓其在最佳溫度(30或37℃)生長(zhǎng),直到OD550達(dá)到0.6-0.8。添加IPTG(終濃度為1.0mM)誘導(dǎo)重組蛋白的表達(dá),再培育培養(yǎng)物3小時(shí)。于4℃,以8000g離心15分鐘收獲細(xì)菌。將細(xì)菌沉淀重物懸浮于7.5ml(i)冷緩沖液A(300mM NaCl、50mM磷酸鹽緩沖液、10mM咪唑、pH 8.0),用于可溶性蛋白質(zhì);或(ii)緩沖液B(10mM Tirs-HCl、100mM磷酸鹽緩沖液,pH 8.8和任選地8M尿素),用于不溶性蛋白質(zhì)。以可溶形式純化的蛋白質(zhì)包括287-His、Δ1、Δ2、Δ3和Δ4287-His、Δ4287MC58-His、287c-His和287cMC58-His。蛋白質(zhì)287bMC58-His是不溶的并相應(yīng)地純化。用Branson Sonifier 450,在冰上以40W、30秒超聲處理破壞細(xì)胞4次,并于4℃以13000xg離心30分鐘。對(duì)于不溶蛋白質(zhì),將沉淀物重懸浮于2.0ml緩沖液C(6M鹽酸胍、100mM磷酸鹽緩沖液、10mM Tris-HCl、pH 7.5),并用Dounce勻漿器處理10次。以13000g離心勻漿30分鐘并保留上清液。將可溶的和不溶制備物的上清液與150μl Ni2+-樹(shù)脂(預(yù)先用緩沖液A或緩沖液B平衡)混合,并在室溫溫和振蕩培育30分鐘。樹(shù)脂是按制造商說(shuō)明制備的Chelating Sepharose Fast Flow(Pharmcia)。于4℃,以700g離心分批制備物5分鐘,棄去上清液。用10ml緩沖液A或B洗滌樹(shù)脂2次(分批)10分鐘,重懸浮于1.0ml緩沖液A或B中,加到一次性柱上。用(i)緩沖液A(4℃)或(ii)緩沖液B(室溫)持續(xù)洗滌樹(shù)脂,直到流出物的OD280達(dá)到0.02-0.01。再用(i)冷緩沖液C(300mM NaCl、50mM磷酸鹽緩沖液、20mM咪唑、pH 8.0)或(ii)緩沖液D(10mM Tris-HCl、100mM磷酸鹽緩沖液、pH 6.3和任選地8M尿素)進(jìn)一步洗滌樹(shù)脂,直到流出物的OD280達(dá)到0.02-0.01。加入700μl(i)冷洗脫緩沖液A(300mM NaCl、50mM磷酸鹽緩沖液、250mM咪唑、pH 8.0)或(ii)洗脫緩沖液B(10mM Tris-HCl、100mM磷酸鹽緩沖液、pH 4.5和任選地8M尿素)洗脫His-融合蛋白,收集組分直到OD280顯示獲得了所有重組蛋白。用SDS-PAGE分析20μl量的各洗脫組分。用Bradford試驗(yàn)計(jì)算蛋白質(zhì)濃度。
      變性的His-融合蛋白的復(fù)性需要變性以穩(wěn)定287bMC8,因此在免疫接種前需要進(jìn)行復(fù)性步驟。將甘油加到上述得到的變性組分中,使終濃度為10%v/v。用透析緩沖液I(10%v/v甘油,0.5M精氨酸、50mM磷酸鹽緩沖液、5.0mM還原的谷胱甘肽、0.5mM氧化的谷胱甘肽、2.0M尿素,pH 8.8)將蛋白質(zhì)稀釋至200μg/ml,用相同的緩沖液在4℃透析12-14小時(shí)。于4℃,用緩沖液II(10%v/v甘油,0.5M精氨酸、50mM磷酸鹽緩沖液、5.0mM還原的谷胱甘肽、0.5mM氧化的谷胱甘肽、pH 8.8)再進(jìn)行透析12-14小時(shí)。用以下公式計(jì)算蛋白質(zhì)的濃度蛋白質(zhì)(mg/ml)=(1.55×OD280)-(0.76×OD260)氨基酸序列分析根據(jù)制造商的推薦,用配備在線乙內(nèi)酰苯硫脲-氨基酸分析儀(System Gold)的Beckman測(cè)序儀(LF 3000)進(jìn)行蛋白質(zhì)NH2-末端的自動(dòng)測(cè)序分析。
      免疫接種在第0、21和35天,用抗原免疫接種Balb/C小鼠,在第49天分析血清。
      血清分析-ELISA將不包囊的MenB M7和包囊的菌株置于巧克力瓊脂板上,在37℃、5%CO2中培育過(guò)夜。用無(wú)菌Dracon刷從瓊脂板上收集細(xì)菌菌落,并接種到含有0.25%葡萄糖的Mueller-Hinton肉湯(Difco)中。每30分鐘監(jiān)測(cè)一次細(xì)菌的生長(zhǎng),隨后測(cè)定OD620。讓細(xì)菌生長(zhǎng)直到OD達(dá)到0.4-0.5。將培養(yǎng)物以4000rpm離心10分鐘。棄去上清液,用PBS洗滌細(xì)菌2次,重懸浮于含有0.025%甲醛的PBS中,并在37℃培育1小時(shí),然后在4℃攪拌培育過(guò)夜。在96孔Greiner板的各孔中添加100μl細(xì)菌細(xì)胞,并在4℃培育過(guò)夜。然后用PBT洗滌緩沖液(0.1%Tween-20的PBS溶液)沖洗這些孔3次。在各孔中加入200μl飽和緩沖液(2.7%聚乙烯吡咯烷酮10的水溶液),將這些平板在37℃培育2小時(shí)。用PBT沖洗這些孔3次。在各孔中加入200μl稀釋的血清(稀釋緩沖液1%BSA、0.1%Tween-20、0.1%NaN3的PBS溶液),將這些平板在37℃培育2小時(shí)。用PBT沖洗這些孔3次。在各孔中加入100μl HRP-綴合的兔抗-小鼠(Dako)血清(用稀釋緩沖液以1∶2000稀釋),將這些平板置于37℃培育90分鐘。用PBT緩沖液洗滌這些孔3次。在各孔中加入100μl HRP的底物緩沖液(25ml檸檬酸緩沖液pH 5,10mg鄰-苯二胺(phenildiamine)和10μl H2O2),并將平板在室溫中靜置20分鐘。在各孔中加入100μl 12.5%H2SO4,隨后測(cè)定OD490。計(jì)算ELISA滴定度,即高于預(yù)先免疫血清稀釋度的、OD490值為0.4的血清稀釋度。當(dāng)OD490值為0.4的血清稀釋度高于1∶400時(shí),將ELISA視為陽(yáng)性。
      血清分析-FACS掃描細(xì)菌結(jié)合分析將不包囊的MenB M7菌株置于巧克力瓊脂板上,在37℃、5%CO2中培育過(guò)夜。用無(wú)菌Dracon刷從瓊脂板上收集菌落,并接種到4支裝有0.25%葡萄糖的8ml Mueller-Hinton肉湯(Difco)試管中。每30分鐘監(jiān)測(cè)細(xì)菌的生長(zhǎng),然后測(cè)定OD620。讓細(xì)菌生長(zhǎng)直到OD達(dá)到0.35-0.5。將培養(yǎng)物以4000rpm離心10分鐘。棄去上清液,用封阻緩沖液(1%BSA的PBS溶液,0.4%NaN3)重懸浮沉淀物,并以4000rpm離心5分鐘。將細(xì)胞重懸浮于封阻緩沖液,使OD620達(dá)到0.05。在96孔Costar板的各孔中添加100μl細(xì)菌細(xì)胞。在各孔中加入100μl稀釋的(1∶100、1∶200、1∶400)血清(以封阻緩沖液配制),并將這些平板在4℃培育2小時(shí)。以4000rpm離心細(xì)胞5分鐘,吸出上清液,在各孔中加入200μl/孔封阻緩沖液洗滌細(xì)胞。在各孔中加入100μl R-Phicoerytrin綴合的F(ab)2山羊抗-小鼠(以1∶100稀釋),將平板置于4℃培育1小時(shí)。以4000rpm離心5分鐘以沉淀細(xì)胞,加入200μl/孔封阻緩沖液洗滌細(xì)胞。吸出上清液,細(xì)胞重懸浮于200μl/孔PBS、0.25%甲醛。將樣品轉(zhuǎn)移到FACScan管中并讀數(shù)。FACScan(Laser Power15mW)的條件設(shè)為FL2開(kāi);FSC-H閾值92;FSC PMT電壓E01;SSCPMT474;Amp.Gains 6.1;FL-2PMT586;補(bǔ)償值0。
      血清分析-殺菌試驗(yàn)于37℃、在5%CO2、在巧克力瓊脂板(以冷凍原液起始)上培育腦膜炎奈瑟球菌2996過(guò)夜。收集菌落,并將其接種到7ml含有0.25%葡萄糖的Mueller-Hinton肉湯中,使OD620達(dá)到0.05-0.08。在37℃振蕩培育約1.5小時(shí),直到OD620達(dá)到0.23-0.24。用50mM磷酸鹽緩沖液(pH7.2,含10mM MgCl2、10mM CaCl2和0.5%(w/v)BSA(分析緩沖液))以105CFU/ml工作稀釋度稀釋細(xì)菌。最終反應(yīng)混合物的總體積為50μl,其中25μl連續(xù)2倍稀釋的測(cè)試血清,12.5μl工作稀釋度的細(xì)菌,12.5μl幼兔補(bǔ)體(終濃度25%)。
      對(duì)照包括用補(bǔ)體血清培育的細(xì)菌、用細(xì)菌培育并在56℃加熱30分鐘補(bǔ)充滅活的免疫血清。在加入幼兔補(bǔ)體后,用斜置方法立即將10μl對(duì)照置于Mueller-Hinton瓊脂板上(0時(shí)間)。37℃旋轉(zhuǎn)培育96孔板1小時(shí)。將每份樣品的7μl涂布在Mueller-Hinton瓊脂板上作為斑點(diǎn),而用斜置方法將10μl對(duì)照涂布在Mueller-Hinton瓊脂板上(1時(shí)間)。37℃培育瓊脂板18小時(shí),計(jì)算相應(yīng)于0時(shí)間和1時(shí)間的菌落數(shù)量。
      血清分析-Western印跡法將純化的蛋白質(zhì)(500ng/泳道)、外膜小泡(5μg)和MenB菌株2996衍生的全細(xì)胞提取物(25μg)加到12%SDS-聚丙烯酰胺凝膠上,并轉(zhuǎn)移到硝基纖維素膜上。用轉(zhuǎn)化緩沖液(0.3%Tris堿,1.14%甘氨酸、20%(v/v)甲醇)在4℃、150mA進(jìn)行轉(zhuǎn)化2小時(shí)。于4℃在飽和緩沖液(10%脫脂乳、0.1%Triton X10)的PBS溶液)中培育過(guò)夜使膜飽和。用沖洗緩沖液(3%脫脂乳、0.1%Triton X100的PBS溶液)沖洗膜2次,并在37℃與用洗滌緩沖液以1∶200稀釋的小鼠血清一起培育2小時(shí)。沖洗膜2次,與1∶2000稀釋的辣根過(guò)氧化物酶標(biāo)記的抗-小鼠Ig一起培育90分鐘。用0.1%Triton X100的PBS溶液沖洗膜2次,用Opti-4CN底物試劑盒(Bio-Rad)顯色。加入水終止反應(yīng)。
      如下制備OMV37℃、5%CO2,在5個(gè)GC板上讓腦膜炎奈瑟球菌2996生長(zhǎng)過(guò)夜,用接種環(huán)收獲,并重懸浮于10ml 20mM Tris-HCl pH 7.5、2mM EDTA中。在56℃熱滅活45分鐘,在冰上超聲處理破碎細(xì)胞5分鐘(50%負(fù)載循環(huán)(dutycycle)、50%輸出,Branson超聲儀3mm微型針頭)。以5000g離心10分鐘除去未破碎的細(xì)胞,回收含有完整細(xì)胞包膜組分的上清液,于4℃以50000g進(jìn)一步離心過(guò)夜。將含有膜的沉淀物重懸浮于2%二烷基肌氨酸、20mM Tris-HCl pH7.5、2mM EDTA中,在室溫培育20分鐘以溶解內(nèi)膜。以10000g離心上清液10分鐘除去聚集體,以50000g進(jìn)一步離心上清液3小時(shí)。用PBS沖洗含有外膜的沉積物,并重懸浮于相同的緩沖液中。用BSA作為標(biāo)準(zhǔn),由D.C.Bio-Rad蛋白分析(改進(jìn)的Lowry方法)測(cè)定蛋白質(zhì)的濃度。
      如下制備全細(xì)胞提取物使腦膜炎奈瑟球菌在GC板上培育過(guò)夜,用接種環(huán)收獲,并重懸浮于1ml 20mM Tris-HCl中。在56℃熱滅活30分鐘。
      961結(jié)構(gòu)域的研究細(xì)胞組分的制備用過(guò)夜培養(yǎng)物或在IPTG培育3小時(shí)后的細(xì)菌制備表達(dá)961不同結(jié)構(gòu)域的大腸桿菌克隆的全裂解物、周質(zhì)、上清液和OMV。簡(jiǎn)單地說(shuō),獲得周質(zhì),細(xì)菌懸浮于蔗糖25%和Tris 50mM(pH 8)(含有polimixine 100μg/ml)。1小時(shí)后,室溫以13000rpm離心細(xì)菌15分鐘,收集上清液。用0.2μm過(guò)濾培養(yǎng)物上清液,在冰中用TCA 50%沉淀2小時(shí)。離心(13000rp,30分鐘)后,用乙醇70%漂洗沉淀物2次,并懸浮于PBS中。如上所述,進(jìn)行OMV制備。用針對(duì)GST-961的多克隆抗血清,在SDS-PAGE或Western印跡中分析各細(xì)胞組分。
      粘附分析在補(bǔ)充有10%熱滅活的PCS、15mM L-谷氨酰胺和抗生素的DMEM(Gibco)中維持張氏(Chang)上皮細(xì)胞(Wong-Kilbourne衍生物,克隆1-5c-4,人結(jié)膜)。
      為了進(jìn)行粘附分析,用PBS漂洗張氏上皮細(xì)胞的亞融合培養(yǎng)物,并用胰蛋白酶-EDTA(Giboc)處理,從而從塑性支持體上釋放它們。然后將細(xì)胞懸浮于PBS中,計(jì)數(shù)并在PBS中稀釋至5×105細(xì)胞/ml。
      沉淀過(guò)夜培育的或用IPTG誘導(dǎo)后的細(xì)菌,并用PBS通過(guò)以13000離心5分鐘洗滌2次。在室溫、暗處,在1ml緩沖液(含有50mM NaHCO3和100mM NaClpH 8)中將約2-3×108(cfu)與0.5mg/ml FITC(Sigma)一起培育30分鐘。洗滌FITC標(biāo)記的細(xì)菌2-3次,并以1-1.5×109/ml懸浮于PBS中。于37℃,將200μl此懸浮液(2-3×108)與200μl(1×105)上皮細(xì)胞一起培育30分鐘。然后以2000rpm離心細(xì)胞5分鐘,除去未粘附的細(xì)胞,懸浮液200μl PBS中,轉(zhuǎn)移到FACScan管中并讀數(shù)。
      權(quán)利要求
      1.一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其特征在于,所述的方法(a)未使用融合配體,和(b)使用蛋白質(zhì)的天然前導(dǎo)肽(如果存在)。
      2.如權(quán)利要求1所述的方法,其特征在于,所述的本發(fā)明的蛋白質(zhì)選自111、149、206、225-1、235、247-1、274、283、286、292、401、406、502-1、503、519-1、525-1、552、556、557、570、576-1、580、583、664、759、907、913、920-1、936-1、953、961、983、989、Orf4、Orf7-1、Orf9-1、Orf23、Orf25、Orf37、Orf38、Orf40、Orf40.1、Orf40.2、Orf72-1、Orf76-1、Orf85-2、Orf91、Orf97-1、Orf119、Orf143.1、NMB0109、NMB2050、008、105、117-1、121-1、122-1、128-1、148、216、243、308、593、652、726、926、982、Orf83-1和Orf143-1。
      3.一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其特征在于,在所述的方法中(a)用不同蛋白質(zhì)的前導(dǎo)肽替代該蛋白質(zhì)的前導(dǎo)肽,和任選地(b)未使用融合配體。
      4.如權(quán)利要求3所述的方法,其特征在于,所述的不同蛋白質(zhì)是961、ORF4、大腸桿菌OmpA或胡蘿卜軟腐歐文氏菌PelB,或所述的前導(dǎo)肽是MKKYLFSAA。
      5.如權(quán)利要求4所述的方法,其特征在于,所述的不同蛋白質(zhì)是大腸桿菌OmpA,且本發(fā)明的蛋白質(zhì)是ORF1。
      6.權(quán)利要求4所述的方法,其特征在于,所述的本發(fā)明蛋白質(zhì)是911,所述的不同蛋白質(zhì)是胡蘿卜軟腐歐文氏菌PelB或大腸桿菌OmpA。
      7.如權(quán)利要求4所述的方法,其特征在于,所述的不同蛋白質(zhì)是ORF4,所述的本發(fā)明的蛋白質(zhì)是287。
      8.一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其特征在于,在所述的方法中(a)除去所述的蛋白質(zhì)的前導(dǎo)肽,和任選地(b)未使用融合配體。
      9.如權(quán)利要求8所述的方法,其特征在于,所述的本發(fā)明蛋白質(zhì)是919。
      10.一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其特征在于,在不顯現(xiàn)所述的蛋白質(zhì)毒性的溫度表達(dá)本發(fā)明的蛋白質(zhì)。
      11.如權(quán)利要求10所述的方法,其特征在于,在30℃表達(dá)所述的蛋白質(zhì)919。
      12.一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其特征在于,突變所述的蛋白質(zhì)以降低或除去毒性。
      13.如權(quán)利要求12所述的方法,其特征在于,所述的本發(fā)明蛋白質(zhì)是907、919或922。
      14.如權(quán)利要求13所述的方法,其特征在于,在Glu-117突變907(如Glu→Gly)。
      15.如權(quán)利要求13所述的方法,其特征在于,在Glu-255(如Glu→Gly)和/或Glu-323(如Glu→Gly)突變919。
      16.如權(quán)利要求13所述的方法,其特征在于,在Glu-164(如Glu-→Gly)、Ser-213(如Ser→Gly)和/或Asn-348(如Asn-Gly)突變922。
      17.一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其特征在于,在所述的方法中使用載體pSM214或載體pET-24b。
      18.如權(quán)利要求17所述的方法,其特征在于,所述的本發(fā)明蛋白質(zhì)是953,載體是pSM214。
      19.一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其特征在于,表達(dá)或純化所述的蛋白質(zhì)使其為特定的多聚體形式。
      20.如權(quán)利要求19所述的方法,其特征在于,以單體形式表達(dá)和/或純化蛋白質(zhì)953。
      21.如權(quán)利要求19所述的方法,其特征在于,以四聚體形式表達(dá)和/或純化蛋白質(zhì)961。
      22.如權(quán)利要求19所述的方法,其特征在于,以二聚體形式表達(dá)和/或純化蛋白質(zhì)287。
      23.如權(quán)利要求19所述的方法,其特征在于,以單體形式表達(dá)和/或純化蛋白質(zhì)919。
      24.一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其特征在于,在所述的方法中將蛋白質(zhì)以脂質(zhì)化的蛋白質(zhì)表達(dá)。
      25.如權(quán)利要求24所述的方法,其特征在于,所述的本發(fā)明蛋白質(zhì)是919、287、ORF4、406、576或ORF25。
      26.一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其特征在于,在所述的方法中(a)突變蛋白質(zhì)的C-未端區(qū)域,和任選地(b)未使用融合配體。
      27.如權(quán)利要求26所述的方法,其特征在于,所述的突變是替代、插入或缺失。
      28.如權(quán)利要求27所述的方法,其特征在于,所述的本發(fā)明的蛋白質(zhì)是730、ORF29或ORF46。
      29.一種異源表達(dá)本發(fā)明蛋白質(zhì)的方法,其特征在于,在所述的方法中突變所述的蛋白質(zhì)的前導(dǎo)肽。
      30.如權(quán)利要求29所述的方法,其特征在于,所述的本發(fā)明蛋白質(zhì)是919。
      31.由上述任一方法表達(dá)的蛋白質(zhì)。
      32.包含N-未端氨基酸序列MKKYLFSAA的異源蛋白質(zhì)。
      全文摘要
      異源表達(dá)腦膜炎奈瑟球菌和淋病奈瑟球菌蛋白質(zhì)的其它和改進(jìn)的方法。這些方法通常影響表達(dá)的水平、純化的簡(jiǎn)易性、細(xì)胞的定位和/或所表達(dá)的蛋白質(zhì)的免疫特性。
      文檔編號(hào)C07K19/00GK1800385SQ20051011630
      公開(kāi)日2006年7月12日 申請(qǐng)日期2001年2月28日 優(yōu)先權(quán)日2000年2月28日
      發(fā)明者M·B·阿科, M·科曼杜西, C·加萊蒂, V·馬斯格阿尼, M·M·朱利亞尼, M·皮扎 申請(qǐng)人:啟龍有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1