專利名稱:有效治療腫瘤和基它需要除去或破壞細(xì)胞的疾病的肽的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用含有對(duì)應(yīng)于、相似于或同源于神經(jīng)絲狀蛋白的部分氨基酸序列的氨基酸序列的蛋白質(zhì)和肽化合物治療疾病的方法,這類疾病需要除去或破壞細(xì)胞成分,如良性或惡性腫瘤。該方法包括但不限于肌肉內(nèi)、口服、靜脈內(nèi)、鞘內(nèi)、腫瘤內(nèi)、鼻內(nèi)、局部、透皮等給所述化合物,或單獨(dú)或偶聯(lián)于載體的所述化合物。
背景技術(shù):
許多醫(yī)學(xué)治療和過程包括除去或破壞有害或不想要的組織。這種重要治療的例子包括手術(shù)除去癌性生長(zhǎng)物、通過化療破壞轉(zhuǎn)移性腫瘤和減少腺體(如前列腺)增生。其它例子包括除去不想要的面部毛發(fā)、疣、皮下組織、淋巴組織或脂肪組織。
需要有效的制劑來(lái)破壞從而便于除去有害或不想要的細(xì)胞和組織或抑制其進(jìn)一步生長(zhǎng),主要是局部作用而全身毒性最小或沒有。神經(jīng)絲狀蛋白及其相關(guān)分子是2002年3月8日提交的題為“用神經(jīng)絲狀蛋白治療腫瘤和相關(guān)疾病的方法”的待審批美國(guó)專利申請(qǐng)序列號(hào)10/092,934所描述的這類制劑之一,其公布的內(nèi)容全部納入本文供參考。含有與神經(jīng)絲狀蛋白部分氨基酸序列相對(duì)應(yīng)的氨基酸序列的肽,AD7c-NTP也是這類試劑。這些肽可參見2002年5月24日提交的題為“有效治療腫瘤和其它需要除去或破壞細(xì)胞的疾病的肽”的待審批美國(guó)專利申請(qǐng)序列號(hào)10/153,334中的描述,其公布的內(nèi)容全部納入本文供參考。
癌是細(xì)胞內(nèi)部調(diào)節(jié)機(jī)制發(fā)生的異常,導(dǎo)致不受控制的細(xì)胞生長(zhǎng)和繁殖。正常細(xì)胞構(gòu)成組織,當(dāng)這些細(xì)胞失去作為特定、受控制和協(xié)同單元的能力(去分化)時(shí),這種缺陷會(huì)導(dǎo)致細(xì)胞群發(fā)生混亂。當(dāng)它發(fā)生時(shí),即形成腫瘤。
組織的良性過度生長(zhǎng)是異常情況,此時(shí)需要從機(jī)體中除去細(xì)胞。良性腫瘤是不會(huì)全身轉(zhuǎn)移但能引起疾病癥狀的細(xì)胞增殖。如果這種腫瘤位于器官如腦中難以到達(dá)的區(qū)域,它們可能是致命的。良性腫瘤存在于許多器官中,包括肺、腦、皮膚、垂體、甲狀腺、腎上腺皮質(zhì)和腎上腺髓質(zhì)、卵巢、子宮、睪丸、結(jié)締組織、肌肉、腸、耳、鼻、喉、扁桃腺、口、肝臟、膽囊、胰、前列腺、心和其它器官。
在癌癥治療中手術(shù)通常是第一步。手術(shù)的目的不同。有時(shí)用手術(shù)的除盡可能多的明顯腫瘤,或至少使它“除塊”(節(jié)除主要的腫瘤塊從而減少對(duì)其它方法治療的需要)。取決于癌種類和位置,手術(shù)也可為病人提供一些癥狀緩解。例如,如果手術(shù)切除了大部分?jǐn)U增的腦腫瘤,顱內(nèi)壓將減少,使病人的癥狀改善。
不是所有的腫瘤都可以手術(shù)切除。一些腫瘤可能位于使它們不能完全被切除的身體部位。這些腫瘤例子是腦干中的腫瘤(控制呼吸的腦部分)或生長(zhǎng)在主要血管中和周圍的腫瘤。在這些情況中,由于腫瘤切除相關(guān)的高風(fēng)險(xiǎn),手術(shù)的實(shí)施受到限制。
在一些情況中,由于不需要,不能用手術(shù)切除腫瘤塊。一個(gè)例子是何杰金淋巴瘤,這是一種對(duì)化療和放射治療相聯(lián)合有良好反應(yīng)的淋巴結(jié)癌癥。在何杰金淋巴瘤中,很少需要手術(shù)來(lái)達(dá)到治愈,而手術(shù)幾乎都是用于確定診斷。
化療是癌治療的一種常用形式,包括使用能特異性攻擊全身中快速分裂細(xì)胞(如腫瘤中所見的細(xì)胞)的藥物(通常通過口服或注射給予)。這使化療可用于治療轉(zhuǎn)移癌以及有很高機(jī)會(huì)通過血液和淋巴系統(tǒng)擴(kuò)散但尚未明顯超過原發(fā)性腫瘤部位的腫瘤?;熞部捎糜谔岣呔植磕[瘤對(duì)手術(shù)和放療的反應(yīng)。例如對(duì)于一些頭部和頸部的癌癥。
不幸的是,人體中正??焖俜至训钠渌?xì)胞(如胃的內(nèi)皮層和毛發(fā))也會(huì)受到化療影響。由于這個(gè)原因,許多化療劑會(huì)導(dǎo)致不良副作用如惡心、嘔吐、貧血、脫發(fā)或其它癥狀。這些副作用是暫時(shí)性的,目前的藥物可幫助減輕許多這些副作用。隨著我們的知識(shí)持續(xù)增長(zhǎng),學(xué)者們?cè)O(shè)計(jì)了更加新的化療劑,它們不僅能更好地殺死癌細(xì)胞且對(duì)病人的副作用更小。
化療藥物可以多種方式給予病人。一些是藥丸,一些通過靜脈內(nèi)或其它部位注射給藥。就可注射的化療藥物而言,病人須到醫(yī)生診所或醫(yī)院接受治療。其它化療劑需要一天24小時(shí)連續(xù)輸入血流中。對(duì)于這些類型的化療藥物,可進(jìn)行小手術(shù)給病人植入小泵。用泵慢慢給藥。在許多情況中,須在病人靜脈中安置永久性輸液管口以消除反復(fù)針刺的需要。
放療是另一種抗癌的常用武器。放射線通過破壞腫瘤細(xì)胞內(nèi)的DNA來(lái)殺死癌。放療可用不同方式傳送。最普通的方法包括以高度精確方式使放射線束指向病人,集中照射在腫瘤上。為此,病人須躺在臺(tái)上光束圍繞他/她周圍移動(dòng)。此可程持續(xù)幾分鐘,但可每天進(jìn)行,連續(xù)數(shù)周(取決于腫瘤類型)以達(dá)到具體的總處方放射量。
有時(shí)采用稱為近程治療的另一種放射方法,包括采用放射性小丸(“輻射盒”)或電線,將它們植入身體的腫瘤區(qū)域中。植入物可以是暫時(shí)或永久性的。就永久性植入而言,輻射盒中的射線在幾天或幾周中“衰變”從而病人不會(huì)有放射性。就暫時(shí)性植入而言,總放射劑量通常須在數(shù)天中輸入,病人在此時(shí)間中必須住院。對(duì)于這兩種近程治療,一般須將放射線準(zhǔn)確關(guān)至腫瘤區(qū)域以獲得對(duì)癌癥的局部控制(此與全身治療相反,如化療)。
一些高度選擇的病人可求助于骨髓移植。通常進(jìn)行此種治療是因?yàn)椴∪嘶加酗@著的攻擊性癌或因?yàn)樗麄兘?jīng)常規(guī)療法治療后癌癥復(fù)發(fā)。骨髓移植是一種復(fù)雜的過程。有許多種類且它們引起副作用和治愈的可能性不同。大多數(shù)移植須在特殊的醫(yī)療中心進(jìn)行,在許多情況中采用移植認(rèn)為是研究性的。
有一些其它治療方法,盡管大部分仍在臨床考核中探索,未成為標(biāo)準(zhǔn)治療方法。例子包括免疫治療、單克隆抗體、抗血管生成因子和基因治療。
免疫治療設(shè)計(jì)了多種技術(shù)以促進(jìn)病人自身免疫系統(tǒng)抵抗癌癥,這與放射治療或化療完全不同。通常為達(dá)到此目的,學(xué)者們用特制疫苗給病人注射。單克隆抗體設(shè)計(jì)用于攻擊癌細(xì)胞(不攻擊正常細(xì)胞)的抗體,利用癌和非癌細(xì)胞之間抗原性或/或其它特征的差異??贵w可單獨(dú)給予病人,或與各種細(xì)胞毒化合物偶聯(lián)或采用放射性形式,使抗體優(yōu)先靶向癌性細(xì)胞,從而將毒性劑或放射劑遞送給需要的細(xì)胞。
抗血管生成因子由于癌細(xì)胞迅速分裂和腫瘤生長(zhǎng),它們可能很快長(zhǎng)得比其血液供應(yīng)還快。為補(bǔ)償這點(diǎn),一些腫瘤可分泌協(xié)助誘導(dǎo)其周圍血管生長(zhǎng)的物質(zhì),從而向癌細(xì)胞提供血管輸送的營(yíng)養(yǎng)物。已設(shè)計(jì)了實(shí)驗(yàn)性療法以阻止血管長(zhǎng)入腫瘤。
基因療法癌是一系列突變的產(chǎn)物,最終導(dǎo)致癌細(xì)胞產(chǎn)生和其過度增殖。治療癌可將能控制或停止癌增殖的基因引入癌細(xì)胞、開啟細(xì)胞的程序性細(xì)胞(死亡)機(jī)制破壞癌細(xì)胞、提高細(xì)胞的免疫識(shí)別、或表達(dá)能轉(zhuǎn)變成毒性代謝物的前體藥物或抑制腫瘤生長(zhǎng)的細(xì)胞因子。
良性腫瘤和畸形也可通過多種方法治療,包括手術(shù)、放射治療、藥物治療、熱和電燒灼、冷凍療法等。盡管良性腫瘤不轉(zhuǎn)移,它們可長(zhǎng)大且可復(fù)發(fā)。手術(shù)根除良性腫瘤通常有困難和手術(shù)副作用,而一些良性腫瘤須要反復(fù)進(jìn)行手術(shù),如垂體腺瘤、腦膜瘤、前列腺增生等。
還有其它一些疾患包含不想要的細(xì)胞成分,需要選擇性去除這些細(xì)胞。例如心臟病和中風(fēng)一般由動(dòng)脈粥樣硬化所引起,而動(dòng)脈粥樣硬化是纖維脂肪和平滑肌成分的增殖性損傷而致使血管壁扭曲、血管腔狹窄、血流收縮、易發(fā)病灶性血栓并最終導(dǎo)致阻塞和梗塞。治療動(dòng)脈粥樣硬化的各種方法包括旁路移植;人工移植;采用血管再通、刮除、放射、激光或其它去除阻塞的血管成形術(shù);通過脂質(zhì)減少抑制動(dòng)脈粥樣硬化的藥物療法;抗血凝治療;和飲食、鍛煉及生活方式的全身療法。仍需要一種除去動(dòng)脈粥樣硬化性損傷而無(wú)風(fēng)險(xiǎn)和副作用的方法。
其它需要選擇性去除不想要的細(xì)胞豐分例子,包括病毒誘導(dǎo)的生長(zhǎng)物如疣。另一個(gè)例子是炎癥情況中所見的肥大炎性塊和肥大疤痕或瘢痕疙瘩。其它例子見于化妝美容時(shí)例如除去不想要的毛發(fā)如面部汗毛,或?yàn)槊廊菽康捻毘ッ娌科つw和結(jié)締組織或四肢皮膚和結(jié)締組織中的皺縮的不需要的組織區(qū)域。
其它例子是此領(lǐng)域一般技術(shù)人員知道的。在所有或大部分這些例子中,都需要能除去或破壞不想要的細(xì)胞成分進(jìn)行治療,而無(wú)常規(guī)療法的風(fēng)險(xiǎn)和副作用,和需要更精確除去不想要的細(xì)胞成分的方法。
神經(jīng)絲狀蛋白(NTP)是最近才鑒定的一個(gè)腦蛋白質(zhì)家族。此家族成員之一AD7c-NTP是41kD功能與神經(jīng)芽生相關(guān)的膜結(jié)合磷蛋白(de la Monte等,J.Clin.Invest.,1003093-3104(1997);de la Monte等,Alz.Rep.,2327-332(1999);de la Monte SM和Wands JR,Journal of Alzheimer’s Disease,3345-353(2001))。已鑒定和報(bào)道了編碼AD7c-NTP的基因和AD7c-NTP的預(yù)測(cè)蛋白質(zhì)序列(de laMonte等,J.Clin.Invest.,1003093-3104(1997))。除了41kD種類外,其它種類的神經(jīng)絲狀蛋白(約26kD、約21kD、約17kD和約15kD)也已鑒定并與神經(jīng)外胚層瘤、星形細(xì)胞瘤和成膠質(zhì)細(xì)胞瘤以及缺氧、局部缺血或腦梗塞引起的損傷相關(guān)聯(lián)(Xu等,Cancer Research,533823-3829(1993);de la Monte等,J.Neuropathol.Exp.Neurol.,55(10)1038-50(1996),de la Monte等,J.Neurol.Sci.,138(1-2)26-35(1996);de la Monte等,J.Neurol.Sci.,135(2)118-25(1996);de la Monte等,J.Clin.Invest.,1003093-3104(1997);de la Monte等,Alz.Rep.,2327-332(1999))。
對(duì)神經(jīng)絲狀蛋白的種類已有描述和權(quán)利要求,見美國(guó)專利號(hào)5,948,634;5,948,888和5,830,670中所有關(guān)于“阿爾茨海默氏病的神經(jīng)絲狀蛋白基因表達(dá)和檢測(cè)”和美國(guó)專利號(hào)6,071,705關(guān)于“檢測(cè)神經(jīng)疾病或功能不良的方法”。這些專利所披露內(nèi)容特別地全部納入本文供參考。如其中所述,NTP在細(xì)胞死亡期間上調(diào)和產(chǎn)生。因此,報(bào)道認(rèn)為死亡和垂死的神經(jīng)細(xì)胞系過度產(chǎn)生NTP而致,因而它的存在表明神經(jīng)細(xì)胞死亡和阿爾茨海默氏病(AD)發(fā)作。
已將其它種類的神經(jīng)絲狀蛋白鑒定為AD7c-NTP基因的其它產(chǎn)物(如描述于NCBI Entrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#XP 032307 PID g15928971的一種112個(gè)氨基酸的蛋白質(zhì))或類似于神經(jīng)絲狀蛋白(如描述于NCBI Entrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#AAH14951 PID g15928971的一種106個(gè)氨基酸的蛋白質(zhì),描述于NCBI Entrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#XP 039102 PID g18599339的另一種106個(gè)氨基酸的蛋白質(zhì)和描述于NCBI Entrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#AAH02534 PID g12803421的一種61個(gè)氨基酸的蛋白質(zhì))。
與AD和NTP相關(guān)的神經(jīng)絲狀蛋白在AD的細(xì)胞死亡中上調(diào)。與對(duì)照相比AD7c-NTP mRNA在AD大腦中上調(diào);AD中大腦和CSF中的AD7c-NTP蛋白水平高于對(duì)照;AD7c-NTP的免疫反應(yīng)性發(fā)現(xiàn)于AD和唐氏綜合癥大腦中的老年斑、神經(jīng)纖維纏結(jié)(NFT)、變性神經(jīng)元、神經(jīng)氈絲(neuropil thread)和營(yíng)養(yǎng)不良性神經(jīng)芽生中(Ozturk等,Proc.Natl.Acad.Sci.USA,86419-423(1989);de la Monte等,J.Clin.Invest.,86(3)1004-13(1990);de la Monte等,J.Neurol.Sci.,113(2)152-64(1992);de la Monte等,Ann.Neurol.,32(6)733-42(1992);de la Monte等,J.Neuropathol.Exp.Neurol.,55(10)1038-50(1996),de la Monte等,J.Neurol.Sci.,138(1-2)26-35(1996);de la Monte等,J.Neurol.Sci.,135(2)118-25(1996);de la Monte等,J.Clin.Invest.,1003093-3104(1997);de la Monte等,Alz.Rep.,2327-332(1999))。NTP定位于細(xì)胞內(nèi)、神經(jīng)氈內(nèi)的精細(xì)加工中,或AD和唐氏綜合癥大腦中的細(xì)胞外。de la Monte等,Ann.Neurol.,32(6)733-42(1992)。
在AD病人的CSF和尿中都發(fā)現(xiàn)AD7c-NTP蛋白水平升高(de la Monte和Wands,F(xiàn)ront Biosci 7989-96(2002);de la Monte和Wands,Journal of Alzheimer’sDisease,3345-353(2001);Munzar等,Alzheimer’s Reports 461-65(2001);Kahle等,Neurology 541498-1504(2000);Munzar等,Alzheimer’s Reports 3155-159(2000);de la Monte等,Alzheimer’s Reports 2327-332(1999);和de la Monte等,J Clin Invest 1003093-3104(1997)。
過度表達(dá)NTP也與阿爾茨海默氏病中的細(xì)胞死亡過程相聯(lián)系(de la Monte和Wands,J.Neuropathol Exp.Neurol.,60195-207(2001);de la Monte和Wands,CellMol Life Sci 58844-49(2001)。也在唐氏綜合癥大腦組織中鑒定到AD7c-NTP(Wands等,國(guó)際專利出版號(hào)WO 90/06993;de la Monte等,J Neurol Sci 135118-25(1996);de la Monte等,Alz.Rep.,2327-332(1999))。有一些證據(jù)表明過度表達(dá)NTP也可能與正常張力青光眼相關(guān)聯(lián)(Golubnitschaja-Labudova等,Curr Eye Res21867-76(2000))。
已證明NTP是在體外神經(jīng)膠質(zhì)瘤和成神經(jīng)細(xì)胞瘤的細(xì)胞培養(yǎng)物,體內(nèi)正常嚙齒動(dòng)物肌肉組織、皮下結(jié)締組織和真皮中,以及多種不同人和非人來(lái)源的腫瘤(包括乳腺癌、皮膚癌和乳頭狀瘤、結(jié)腸癌、腦膠質(zhì)瘤和嚙齒動(dòng)物模型中的其它腫瘤)中,能導(dǎo)死細(xì)胞死亡的一種有效制劑。參見2002年3月8日提交的待審批美國(guó)專利申請(qǐng)序列號(hào)10/092,934;題為“用神經(jīng)絲狀蛋白治療腫瘤和相關(guān)疾病的方法”。
此描述中包括上述相關(guān)領(lǐng)域的描述、任何和所有本文所述公開的文獻(xiàn),包括任何和所有的美國(guó)專利全部納入本文供參考。上述相關(guān)領(lǐng)域的描述不意味著以任何方式承認(rèn)包括待審批美國(guó)專利申請(qǐng)的任何本文所述文獻(xiàn)是本發(fā)明的現(xiàn)有技術(shù)。
* * * *此領(lǐng)域仍需要新的、毒性較弱的治療不需要的細(xì)胞成分的方法。本發(fā)明可滿足這些需求。
發(fā)明概述本發(fā)明一部分包括本發(fā)明者發(fā)現(xiàn)AD7c-NTP中所含的肽序列,及其變體或同系物,包括其人和其它哺乳動(dòng)物等生物的其它蛋白質(zhì)中發(fā)現(xiàn)的肽序列是破壞或除去有害細(xì)胞或不想要細(xì)胞的有效制劑,。一旦發(fā)現(xiàn)了此種肽序列,此領(lǐng)域的一般技術(shù)人員就可通過利用廣泛存在的公眾或商業(yè)蛋白質(zhì)數(shù)據(jù)庫(kù)如國(guó)家生物技術(shù)信息中心的蛋白質(zhì)數(shù)據(jù)庫(kù)(National Center Biotechnology Information′s Protein database)和檢索程序如BLAST(局部序列比對(duì)基本檢索工具)找到這些蛋白質(zhì)。參見Altschul,Stephen F.,Thomas L.Madden,Alejandro A.Schffer,Jinghui Zhang,ZhengZhang,Webb Miller和David J.Lipman(1997),“缺口BLAST和PSI-BLAST新一代蛋白質(zhì)數(shù)據(jù)庫(kù)檢索程序(Gapped BLAST and PSI-BLASTa new generation of proteindatabase search programs)”,Nucleic Acids Res.253389-3402。
此領(lǐng)域的一般技術(shù)人員然后可以用這里描述的測(cè)定方法來(lái)篩選這些蛋白質(zhì),以確定它們作為破壞或除去不需要的或有害細(xì)胞的制劑的效力。發(fā)現(xiàn)一種或多種這類有效制劑后,此領(lǐng)域的一般技術(shù)人員然后可以確定那些制劑中,包含與這里所述或2002年5月24日提交的題為“有效治療腫瘤和其它需要除去或破壞細(xì)胞的疾病的肽”的待審批美國(guó)專利申請(qǐng)序列號(hào)10/153,334所述的AD7c-NTP肽序列同源或類似的序列,這些制劑可用此領(lǐng)域技術(shù)人員已知的方法合成,并測(cè)試合成的制劑作為破壞或除去不需要或有害細(xì)胞的制劑的效力。此外,此領(lǐng)域的一般技術(shù)人員還可所發(fā)現(xiàn)的此類蛋白質(zhì)的氨基酸序列,來(lái)確定與本文所述以及2002年5月24日提交的題為“有效治療腫瘤和其它需要除去或破壞細(xì)胞的疾病的肽”的美國(guó)專利申請(qǐng)序列號(hào)10/153,334所述的AD7c-NTP肽序列不類似或不同源,和同源或類似的其它肽序列。然后可測(cè)試這些新合成的序列作為破壞或除去不需要的或有害細(xì)胞的制劑的效力。
本發(fā)明涉及治療不需要的細(xì)胞增殖的肽、組合物和方法,如良性或惡性腫瘤、腺體(如前列腺)增生、不需要的面部汗毛、疣和不需要的脂肪組織。這種方法包括將治療有效量的相關(guān)蛋白、已知是能導(dǎo)致細(xì)胞死亡的有效制劑的相關(guān)肽或NTP肽,給予需要的哺乳動(dòng)物,。“相關(guān)蛋白”、“相關(guān)肽”和“NTP肽”的定義如下。
本發(fā)明的肽具有至少一段與神經(jīng)絲狀蛋白的部分氨基酸序列相對(duì)應(yīng)的氨基酸序列。本發(fā)明的組合物包括這種肽和藥學(xué)上可接受的載體。本發(fā)明的肽或蛋白質(zhì)(“細(xì)胞死亡肽”)可單獨(dú)或者與載體或抗體偶聯(lián)后施用。施用此細(xì)胞死亡肽可通過肌肉內(nèi)、口服、靜脈內(nèi)、腹膜內(nèi)、腦內(nèi)(實(shí)質(zhì)內(nèi))、腦室內(nèi)、腫瘤內(nèi)、病灶內(nèi)、皮內(nèi)、鞘內(nèi)、鼻內(nèi)、眼內(nèi)、動(dòng)脈內(nèi)、局部、透皮、通過氣霧劑、灌輸、推注、植入裝置、緩釋系統(tǒng)等,或單獨(dú)或運(yùn)載體偶聯(lián)。另外,此細(xì)胞死亡肽可通過給予表達(dá)此肽的基因來(lái)體內(nèi)表達(dá)、通過給予能誘導(dǎo)導(dǎo)入此基因的細(xì)胞、細(xì)菌或病毒體內(nèi)表達(dá)此肽的疫苗,或?qū)е禄蛐揎椀葋?lái)產(chǎn)生此肽。
此外,此細(xì)胞死亡肽可結(jié)合其它療法用于來(lái)治療良性或惡性腫瘤和其它不想要的或有害的細(xì)胞生長(zhǎng)。以上一般描述和下列詳細(xì)描述是示范性和說明性的,將為本發(fā)明的權(quán)利要求提供進(jìn)一步說明。從本發(fā)明的詳細(xì)描述中,本領(lǐng)域技術(shù)人員不難了解本發(fā)明的其它目標(biāo)、優(yōu)點(diǎn)和新特征。
附圖簡(jiǎn)述
圖1顯示AD7c-NTP基因的完整氨基酸序列和核酸序列以及該基因的AD7c-NTP蛋白產(chǎn)物(獲自美國(guó)專利號(hào)5,830,670、5,948,634和5,948,888的序列120和121;de la Monte等,J.Clin.Invest.,1003093-3104(1997);NCBI Entrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#AAC08737;PID g3002527)[SEQ ID NO.1]。
圖2顯示122個(gè)氨基酸的神經(jīng)絲狀蛋白的完整氨基酸序列(獲自美國(guó)專利號(hào)5,830,670、5,948,634和5,948,888的序列40;NCBI Entrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#AAE25447 PID g10048540)[SEQ ID NO.2](“NTP-122”)。
圖3顯示112個(gè)氨基酸的神經(jīng)絲狀蛋白的完整氨基酸序列(NCBI Entrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#XP_032307 PID g15928971)[SEQ ID NO.3](“NTP-112”)。
圖4顯示106個(gè)氨基酸的神經(jīng)絲狀蛋白樣蛋白質(zhì)的完整氨基酸序列(NCBIEntrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#AAH14951 PID g15928971)[SEQ ID NO.4](“NTP-106A”)。
圖5顯示106個(gè)氨基酸的神經(jīng)絲狀蛋白樣蛋白質(zhì)的完整氨基酸序列(NCBIEntrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#XP_039102 PID g18599339)[SEQ ID NO.5](“NTP-106B”)。
圖6顯示98個(gè)氨基酸的神經(jīng)絲狀蛋白的完整氨基酸序列(獲自美國(guó)專利號(hào)5,830,670、5,948,634和5,948,888的序列30;NCBI Entrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#AAE25445,PID g10048538)[SEQ ID NO.6](“NTP-98”)。
圖7顯示75個(gè)氨基酸的神經(jīng)絲狀蛋白的完整氨基酸序列(獲自美國(guó)專利號(hào)5,830,670、5,948,634和5,948,888的序列48;NCBI Entrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#AAE25448,PID g10048541)[SEQ ID NO.7](“NTP-75”)。
圖8顯示68個(gè)氨基酸的神經(jīng)絲狀蛋白的完整氨基酸序列(獲自美國(guó)專利號(hào)5,830,670、5,948,634和5,948,888的序列36;NCBI Entrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#AAE25446,PID g10048539)[SEQ ID NO.8](“NTP-66”)。
圖9顯示61個(gè)氨基酸的神經(jīng)絲狀蛋白樣蛋白質(zhì)的完整氨基酸序列(NCBIEntrez-蛋白質(zhì)數(shù)據(jù)庫(kù)登錄號(hào)#AAH02534,PID g12803421)[SEQ ID NO.9](“NTP-61”)。
優(yōu)選實(shí)施方案的詳細(xì)說明除非另有說明,本文使用的術(shù)語(yǔ)和詞組按如下定義。
術(shù)語(yǔ)“AD7c-NTP”指約41kD蛋白質(zhì)和基因以及編碼它的核酸序列,描述是de la Monte等,J.Clin.Invest.,1003093-104(1997),美國(guó)專利號(hào)5,948,634;5,948,888和5,830,670的序列120和121以及GenBank#AF010144中,其核酸和氨基酸序列示于圖1。術(shù)語(yǔ)“AD7c-NTP”也包括AD7c-NTP的生物活性片段、變體、衍生物、同源物和模擬物。
術(shù)語(yǔ)“NTP”或“神經(jīng)絲狀蛋白”指神經(jīng)絲狀蛋白和相關(guān)分子(包括胰絲狀蛋白)和編碼這些蛋白質(zhì)的核酸序列,且包括(但不限于)下列蛋白質(zhì)和編碼這些蛋白質(zhì)的氨基酸序列的核酸序列(a)AD7c-NTP;(b)~42、~26、~21、~17、~14和~8kD種類的神經(jīng)絲狀蛋白,描述見于美國(guó)專利號(hào)5,948,634;5,948,888;5,830,670和6,071,705和de la Monte等,J.Neuropathol.Exp.Neurol.,55(10)1038-50(1996),de la Monte等,J.Neurol.Sci.,138(1-2)26-35(1996);de la Monte等,J.Neurol.Sci.,135(2)118-25(1996);de la Monte等,J.Clin.Invest.,1003093-3104(1997);de la Monte等,Alz.Rep.,2327-332(1999);(c)單克隆抗體#2特異性識(shí)別的蛋白質(zhì)保存于美國(guó)典型培養(yǎng)物保藏所,Manassas,Va.,登錄號(hào)HB-12546,或單克隆抗體#5特異識(shí)別的蛋白質(zhì)保存于美國(guó)典型培養(yǎng)物保藏所,Manassas,Va.,登錄號(hào)HB-12545;(d)由AD7c-NTP基因所編碼的蛋白質(zhì);(e)122個(gè)氨基酸神經(jīng)絲狀蛋白,描述見美國(guó)專利號(hào)5,830,670、5,948,634和5,948,888的序列40,并在NCBI Entrez-蛋白質(zhì)登錄號(hào)#AAE25447,PID g10048540中列出,其氨基酸序列示于圖2(“NTP-122”);(f)NCBI Entrez-蛋白質(zhì)登錄號(hào)#XP_032307,PID g14725132中列出的122個(gè)氨基酸神經(jīng)絲狀蛋白,其氨基酸序列示于圖3(“NTP-112”);(g)NCBI Entrez-蛋白質(zhì)登錄號(hào)#AAH14951 PID g15928971中列出的106個(gè)氨基酸神經(jīng)絲狀蛋白,其氨基酸序列示于圖4(“NTP-106A”);(h)NCBI Entrez-蛋白質(zhì)登錄號(hào)#XP_039102 PID g18599399中列出的106個(gè)氨基酸神經(jīng)絲狀蛋白,其氨基酸序列示于圖5(“NTP-106B”);(i)98個(gè)氨基酸神經(jīng)絲狀蛋白,描述見美國(guó)專利號(hào)5,830,670、5,948,634和5,948,88的序列30,并在NCBI Entrez-蛋白質(zhì)登錄號(hào)#AAE25445,PIDg10048538中列出,其氨基酸序列示于圖6(“NTP-98”);(j)75個(gè)氨基酸神經(jīng)絲狀蛋白,描述見美國(guó)專利號(hào)5,830,670、5,948,634和5,948,888的序列48,并在NCBI Entrez-蛋白質(zhì)登錄號(hào)#AAE25448,PIDg10048541中列出,其氨基酸序列示于圖7(“NTP-75”);(k)68個(gè)氨基酸神經(jīng)絲狀蛋白,描述見美國(guó)專利號(hào)5,830,670、5,948,634和5,948,888的序列36,并在NCBI Entrez-蛋白質(zhì)登錄號(hào)#AAE25446,PIDg10048539中列出,其氨基酸序列示于圖8(“NTP-68”);(l)在NCBI Entrez-蛋白質(zhì)登錄號(hào)#AAH02534,PID g12803421中列出的61個(gè)氨基酸的神經(jīng)狀蛋白樣蛋白質(zhì),其氨基酸序列示于圖9(“NTP-61”);(m)胰絲狀蛋白;(n)在美國(guó)專利號(hào)6,071,705中描述的神經(jīng)胰絲狀蛋白(nPTP);(o)雜交瘤產(chǎn)生的抗體特異性識(shí)別的蛋白質(zhì),這些雜交瘤為保存于美國(guó)典型培養(yǎng)物保藏所的HB 9934、HB 9935和HB 9936。
術(shù)語(yǔ)“NTP肽”所指的肽包括對(duì)應(yīng)于NTP的至少一部分氨基酸序列或NTP片段的氨基酸序列,除非另有說明,還包括這些肽的同源物、衍生物、變體、融合蛋白和肽模擬物。術(shù)語(yǔ)“NTP肽”還包括(但不限于)美國(guó)專利申請(qǐng)序列號(hào)10/092,934個(gè)10/153334中特別列出的肽。術(shù)語(yǔ)“NTP肽”優(yōu)選包括(但不限于)NTP的以下氨基酸序列a)NTP肽#1[SEQ ID NO.10],AD7c-NTP p239-243SSWDYSer-Ser-Trp-Asp-Tyrb)NTP肽#2[SEQ ID NO.11],AD7c-NTP p31-39PASASPVAGPro-Ala-Ser-Ala-Ser-Pro-Val-Ala-Glyc)NTP肽#3[SEQ ID NO.12],AD7c-NTP p14-24GAISAHRNLRLGly-Ala-Ile-Ser-Ala-His-Arg-Asn-Leu-Arg-Leud)NTP肽#4[SEQ ID NO.13],AD7c-NTP p53-58FFLVEMPhe-Phe-Leu-Val-Glu-Mete)NTP肽#5[SEQ ID NO.14],AD7c-NTP p208-216SVTQAGVQWSer-Val-Thr-Gln-Ala-Gly-Val-Gln-Trp
f)NTP肽#6[SEQ ID NO.15],NTP-122 p106-122IDQQVLSRIKLEIKRCLIle-Asp-Gln-Gln-Val-Leu-Ser-Arg-Ile-Lys-Leu-Glu-Ile-Lys-Arg-Cys-Leug)NTP肽#7[SEQ ID NO.16],NTP-122 p111-119LSRIKLEIKLeu-Ser-Arg-Ile-Lys-Leu-Glu-Ile-Lys并包括這些特別列出的NTP肽的同源物、衍生物、變體、片段、融合蛋白和肽模擬物。
術(shù)語(yǔ)“相關(guān)蛋白”指含有一種或多種與一種或多種NTP肽相同、非常類似或同源的氨基酸序列的蛋白質(zhì)。
表述“相關(guān)肽”指由與所述相關(guān)蛋白的至少一部分氨基酸序列相對(duì)應(yīng)的氨基酸序列構(gòu)成的肽,并包括這種肽的同源物、變體、融合蛋白、反-D肽和肽模擬物。表述“相關(guān)肽”還優(yōu)選包括(但不限于)所述相關(guān)蛋白的以下氨基酸序列(a)相關(guān)肽#1[SEQ ID NO.17],暫時(shí)的受體潛在通道6,δ變體(NCBI登錄號(hào)CAC01686,PID g9716913),p356-377GDHGRPNLSRLKLAIKYEVKKMGly-Asp-His-Gly-Arg-Pro-Asn-Leu-Ser-Arg-Leu-Lys-Leu-Ala-Ile-Lys-Tyr-Glu-Val-Lys-Lys-Met(b)相關(guān)肽#2[SEQ ID NO.18],假定的鈣通道(NCBI登錄號(hào)NP_065122,PIDg9966865),p345-360QQSIAVKFLAVFGVSIGln-Gln-Ser-Ile-Ala-Val-Lys-Phe-Leu-Ala-Val-Phe-Gly-Val-Ser-Ile(c)相關(guān)肽#3[SEQ ID NO.19],trp-相關(guān)蛋白4截短的γ變體(NCBI登錄號(hào)AF063825_1,PID g6665596),p337-357GLLFPVFSVCYLIAPKSPLGLGly-Leu-Leu-Phe-Pro-Val-Phe-Ser-Val-Cys-Tyr-Leu-Ile-Ala-Pro-Lys-Ser-Pro-Leu-Gly-Leu并包括這些特別列出的相關(guān)肽的同源物、衍生物、變體、片段、融合蛋白和肽模擬物。
表述“細(xì)胞死亡肽”指已證明是造成細(xì)胞死亡的有效制劑的相關(guān)蛋白或相關(guān)肽。
術(shù)語(yǔ)“片段”指由NTP蛋白、NTP肽、相關(guān)蛋白或相關(guān)肽的氨基酸序列的連續(xù)亞序列構(gòu)成的蛋白質(zhì)或多肽,包括天然產(chǎn)生的片段,如剪接變體和體內(nèi)由于蛋白酶水解活性天然產(chǎn)生的片段。這種片段可在氨基末端、羧基末端和/或中間(如自然剪接)截短。這種片段可以用或不用氨基末端甲硫氨酸制備。術(shù)語(yǔ)“片段”包括相同NTP蛋白或NTP肽,或相關(guān)蛋白或相關(guān)肽的片段,可以相同或不同,共有或沒有毗連的氨基酸序列,直接或通過接頭連接在一起。
術(shù)語(yǔ)“變體”指蛋白質(zhì)或多肽,其中與NTP蛋白、NTP肽、相關(guān)蛋白或相關(guān)肽的氨基酸序列相比,存在一個(gè)或多個(gè)氨基酸取代、缺失和/或插入,包括天然產(chǎn)生的NTP蛋白、NTP肽、相關(guān)蛋白或相關(guān)肽的等位基因變體或者交替剪接變體。術(shù)語(yǔ)“變體”包括在肽序列中的一個(gè)或多個(gè)氨基酸用類似或同源氨基酸或不相似氨基酸的置換。氨基酸可在許多等級(jí)上分為類似或同源氨基酸(Gunnar von Heijne,《分子生物學(xué)的序列分析》(Sequence Analysis in Molecular Biology),123-39頁(yè)Academic Press,紐約,NY 1987.)優(yōu)選的變體包括一個(gè)或多個(gè)氨基酸位置的丙氨酸取代。其它優(yōu)選的取代包括對(duì)蛋白質(zhì)的整體凈電荷、極性或疏水性影響小或沒有影響的保守性取代。保守性取代列于下表2中。
表2保守性氨基酸取代堿性精氨酸賴氨酸組氨酸酸性谷氨酸天冬氨酸無(wú)電荷極性 谷氨酰胺天冬酰胺絲氨酸蘇氨酸酪氨酸非極性 苯丙氨酸色氨酸半胱氨酸甘氨酸丙氨酸纈氨酸脯氨酸甲硫氨酸亮氨酸異亮氨酸表3列出氨基酸取代的另一種方案
表3原來(lái)的殘基取代丙氨酸甘氨酸;絲氨酸精氨酸賴氨酸天冬酰胺 谷氨酰胺;組氨酸天冬氨酸 谷氨酸半胱氨酸 絲氨酸谷氨酰胺 天冬酰胺谷氨酸天冬氨酸甘氨酸丙氨酸;脯氨酸組氨酸天冬酰胺;谷氨酰胺異亮氨酸 亮氨酸;纈氨酸亮氨酸異亮氨酸;纈氨酸賴氨酸精氨酸;谷氨酰胺;谷氨酸甲硫氨酸 亮氨酸;酪氨酸;異亮氨酸苯丙氨酸 甲硫氨酸;亮氨酸;酪氨酸絲氨酸蘇氨酸蘇氨酸絲氨酸色氨酸酪氨酸酪氨酸色氨酸;苯丙氨酸纈氨酸異亮氨酸;亮氨酸其它變體可由保守性較小的氨基酸取代組成,如選擇的殘基更顯著的不同在于它們對(duì)維持(a)取代區(qū)域中多肽主鏈結(jié)構(gòu)的作用,例如片層或螺旋構(gòu)型,(b)靶位點(diǎn)分子的電荷或疏水性,(c)側(cè)鏈大小。預(yù)期通常對(duì)功能有更顯著作用的取代是(a)甘氨酸和/或脯氨酸被另一種氨基酸取代或缺失或插入;(b)親水性殘基如絲氨酰或蘇氨酰取代(或被)疏水性殘基,如亮氨酰、異亮氨酰、苯丙氨酰、纈氨?;虮滨?;(c)半胱氨酸殘基取代(或被)任何其它殘基;(d)具有正電側(cè)鏈的殘基如賴氨酰、精氨?;蚪M氨酰取代(或被)具有負(fù)電荷的殘基如谷氨?;蛱於滨?;或(e)具有大側(cè)鏈的殘基如苯丙氨酸取代(或被)沒有這種側(cè)鏈的殘基如甘氨酸。其它變體包括設(shè)計(jì)為產(chǎn)生新的糖基化和/或磷酸化位點(diǎn)的,或設(shè)計(jì)為缺失現(xiàn)有糖基化和/或磷酸化位點(diǎn)的殘基。變體包括糖基化位點(diǎn)、蛋白水解切割位點(diǎn)和/或半胱氨酸殘基上的至少一個(gè)氨基酸取代。變體還包括在接頭肽上NTP蛋白、NTP肽、相關(guān)蛋白或相關(guān)肽氨基酸序列之前或之后具有其它氨基酸殘基的NTP蛋白、NTP肽、相關(guān)蛋白或相關(guān)肽。例如,可將半胱氨酸殘基加在相關(guān)肽的氨基和羧基末端通過形成二硫鍵使相關(guān)肽環(huán)化。術(shù)語(yǔ)“變體”還包括具有相關(guān)蛋白或相關(guān)肽的氨基酸序列的多肽,它們?cè)谙嚓P(guān)蛋白或相關(guān)肽的3′或5′末端側(cè)接有至少1個(gè)和多達(dá)25個(gè)或更多額外的氨基酸。
術(shù)語(yǔ)“衍生物”指化學(xué)修飾的蛋白質(zhì)或多肽,它們通過天然過程如加工和其它翻譯后修飾而被化學(xué)修飾,也可通過化學(xué)修飾技術(shù)加入一個(gè)或多個(gè)聚乙二醇分子、糖、磷酸鹽和/或其它這類分子,其中這類分子不是天然結(jié)合于野生型NTP蛋白或肽的分子。衍生物包括鹽。這種化學(xué)修飾描述可見基礎(chǔ)教材和更詳細(xì)的專論以及大量研究文獻(xiàn)中,它們是本領(lǐng)域技術(shù)人員所熟知的。將會(huì)理解的是,相同類型的修飾可能以相同或不同程度存在于某給定蛋白質(zhì)或多肽的一些位點(diǎn)上。同樣,給定蛋白質(zhì)或多肽可包含許多種類的修飾。這些修飾可發(fā)生在蛋白質(zhì)或多肽的任何地方,包括肽主鏈、氨基酸側(cè)鏈和氨基或羧基末端。這些修飾包括例如乙?;?、酰化、ADP-核糖基化、酰胺化、黃素的共價(jià)結(jié)合、血紅素部分的共價(jià)結(jié)合、核苷酸或核苷酸衍生物的共價(jià)結(jié)合、脂質(zhì)或脂質(zhì)衍生物的共價(jià)結(jié)合、磷脂酰肌醇的共價(jià)結(jié)合、交聯(lián)、環(huán)化、二硫鍵形成、脫甲基化、形成共價(jià)交聯(lián)、形成半胱氨酸、形成焦谷氨酸、甲?;ⅵ?羧基化、糖基化、GPI錨形成、羥基化、碘化、甲基化、豆蔻酰化、氧化、蛋白酶解加工、磷酸化、異戊二烯化、外消旋化、糖基化、脂質(zhì)結(jié)合、硫酸化、谷氨酸殘基的γ-羧基化、羥基化和ADP-核糖基化、硒基化(selenoylation)、轉(zhuǎn)運(yùn)RNA介導(dǎo)的氨基酸加入蛋白質(zhì),如精氨酰化和泛素化。參見例如《蛋白質(zhì)-結(jié)構(gòu)和分子性質(zhì)》(Proteins-Structure And Molecular Properties),第二版,T.E.Creighton,W.H.Freeman和Company,紐約(1993)和Wold,F(xiàn).,“翻譯后蛋白質(zhì)修飾觀點(diǎn)和前景”(Posttranslational Protein ModifcationPerspective andProspects),《蛋白質(zhì)的翻譯后共價(jià)修飾》(Posttranslational Convalent Modification ofProteins),1-12頁(yè),B.C.Johnson編,Academic Press,紐約(1983);Seifter等,Meth.Enzymol.182626-646(1990)和Rattan等,“蛋白質(zhì)合成翻譯后修飾和衰老”(Posttranslational Modifcation and Aging),Ann.N.Y.Acad.Sci.66348-62(1992)。術(shù)語(yǔ)“衍生物”包括化學(xué)修飾導(dǎo)致蛋白質(zhì)或多肽變成分支狀或者有或沒有分支的環(huán)狀。環(huán)狀、分支狀和分支環(huán)狀蛋白質(zhì)或多肽可能由翻譯后的天然加工產(chǎn)生并也可完全由合成方法產(chǎn)生。
術(shù)語(yǔ)“同源物”指蛋白質(zhì),其與NTP蛋白、NTP肽、相關(guān)蛋白或相關(guān)肽的氨基酸序列,根據(jù)常用于比較兩種多肽的氨基酸位置相似性的標(biāo)準(zhǔn)方法測(cè)定至少有60%相同。兩種蛋白質(zhì)之間的相似性或相同性程度可用已知方法計(jì)算,包括但不限于以下所描述的那些方法《計(jì)算分子生物學(xué)》(Computational Molecular Biology),Lesk,A.M.編,牛津大學(xué)出版社,紐約,1988;《生物計(jì)算信息學(xué)和基因組計(jì)劃》(BiocomputingInformatics and Genome Projiects),Smith,D.W.編,Academic Press,紐約,1993;《序列數(shù)據(jù)的計(jì)算機(jī)分析》(Computer Analysis of Sequence Data),第I部分,Griffin,A.M.和Griffin,H.G.編,Humana Press,新澤西州,1994);《分子生物學(xué)序列分析》(Sequence analysis in Molecular Biology),von Heinje,G.,AcademicPress,紐約,1987);《序列分析引物》(Sequence analysis Primery),Gribskov,M.和Devereux,J.編,M Stockton Press,紐約,1991;Carillo H.和Lipman,D.,SIAM,J.Applied Math.,481073(1988)。設(shè)計(jì)了確定相同性的優(yōu)選方法來(lái)給出測(cè)試序列之間的最大匹配。在公眾可得到的計(jì)算機(jī)程序中編纂了確定相同性和相似性的方法。
用于確定兩種序列之間相同性和相似性的優(yōu)選計(jì)算機(jī)程序方法,包括但不限于GCG程序包(Devereux,J.等,Nucleic Acids Research,12(1)387(1984)),BLASTP,BLASTN和FASTA,Atschul,S.F.等,J.Molec.Biol.,215403-410(1990)。BLASTX程序公眾可從NCBI和其它來(lái)源獲得(BLAST手冊(cè),Altschul,S.等,NCBI NLM NIHBethesda,Md.20894;Altschul,S.等,J.Mol.Biol.,215403-410(1990)。例如采用計(jì)算機(jī)算法如GAP(遺傳學(xué)計(jì)算機(jī)組,University of Wisconsin,Madison,Wis.),排列對(duì)比兩種待測(cè)定的蛋白質(zhì)或多肽的序列相同性百分比用于最佳匹配它們各自的氨基酸(“匹配范圍”通過算法確定)。
空隙開放罰分(gap opening penalty)(計(jì)算為3x倍平均對(duì)角線;“平均對(duì)角線”是所用比較矩陣的對(duì)角線平均值;“對(duì)角線”是通過具體比較矩陣賦予各優(yōu)選氨基酸的評(píng)分或數(shù)值)和空隙延伸罰分(gap extension penalty)(通常是空隙開放罰分的1/10倍)以及比較矩陣?yán)鏟AM250或BLOSUM 62可與此算法結(jié)合使用。此算法也可使用標(biāo)準(zhǔn)的比較矩陣(PAM250比較矩陣參見Dayhoff等,《蛋白質(zhì)序列和結(jié)構(gòu)圖譜集》(Atlas ofProtein Sequence and Structure),第5卷,增補(bǔ)本3;BLOSUM62比較矩陣參見Henikoff等,Proc.Natl.Acad.Sci.USA,8910915-10919)。然后用該算法計(jì)算相同性百分比。同源物與NTP蛋白、NTP肽、相關(guān)蛋白或相關(guān)肽相比,通常具有一個(gè)或多個(gè)氨基酸取代、缺失和/或插入。
術(shù)語(yǔ)“肽模擬物”或“模擬物”指能模擬肽或蛋白質(zhì)的生物活性但在化學(xué)性質(zhì)上不再是肽的生物活性化合物,即它們不再含任何肽鍵(即氨基酸間的酰胺鍵)。這里術(shù)語(yǔ)肽模擬物用于更廣泛含義,包括性質(zhì)上不再完全是肽的分子如假肽、半肽和擬肽(peptoid)。此廣泛含義上的肽模擬物的例子(其中肽的一部分被缺乏肽鍵的結(jié)構(gòu)取代)在下面描述。無(wú)論完全是或部分是非肽,本發(fā)明的肽模擬物提供了反應(yīng)性化學(xué)組成成分的空間排列,肽模擬物所依據(jù)的這種排列非常類似于NTP肽相關(guān)蛋白或相關(guān)肽中活性基團(tuán)的三維排列。由于這種相似的活性位點(diǎn)的幾何結(jié)構(gòu),肽模擬物對(duì)生物系統(tǒng)的作用類似于NTP肽、相關(guān)蛋白或相關(guān)肽的生物活性。
本發(fā)明的肽模擬物優(yōu)選在三維形狀和生物活性上基本上類似于本文所述的NTP肽、相關(guān)蛋白或相關(guān)肽。本領(lǐng)域已知的結(jié)構(gòu)上修飾肽以產(chǎn)生肽模擬物的方法的例子,包括倒置主鏈?zhǔn)中灾行漠a(chǎn)生D-氨基酸殘基結(jié)構(gòu),具體是在N-末端,使對(duì)蛋白酶降解的穩(wěn)定性提高而對(duì)活性沒有不利地影響。在論文“含氚D-丙氨酸1-肽T結(jié)合”,Smith C.S.等,Drug Development Res.,15,371-379頁(yè)(1988)中描述了一個(gè)例子。第二種方法是改變穩(wěn)定性所需的環(huán)狀結(jié)構(gòu),如N到c的鏈間二酰亞胺和內(nèi)酰胺(Ede等,Smith和Rivier編,《肽化學(xué)和生物學(xué)》(PeptidesChemistry andBiology),Escom,Leiden,1991,268-270頁(yè))。例子見構(gòu)型限制的胸腺五肽樣化合物,如美國(guó)專利號(hào)4,457,489(1985),Goldstein,G.等所公開的那樣,其內(nèi)容全部納入本文供參考。第三種方法是用對(duì)蛋白水解有抗性的假肽鍵替換相關(guān)蛋白或相關(guān)肽中的肽鍵。
已報(bào)道了一些假肽鍵一般不影響肽的結(jié)構(gòu)和生物活性。此方法的一個(gè)例子是取代逆一反轉(zhuǎn)假肽鍵(“胸腺五肽的生物活性逆反轉(zhuǎn)同源物”)(Biologically activeretroinverso analogue of thymopentin),Sisto A等,Rivier,J.E.和Marshall,G.R.編,“肽、化學(xué)、結(jié)構(gòu)和生物學(xué)”(Peptides,Chemistry,Structure and Biology),Escom,Leiden,1990,722-773頁(yè))和Dalpozzo等(1993),Int.J.Peptide Protein Res.,41561-566,納入本文供參考)。根據(jù)此修飾,肽的氨基酸序列可能與上述NTP肽、相關(guān)蛋白或相關(guān)肽的序列相同,除了一個(gè)或多個(gè)肽鍵被逆轉(zhuǎn)化假肽鍵所取代。優(yōu)選大部分N-末端肽鍵被取代,由于這種取代將賦于N-末端對(duì)抗外肽酶的蛋白水解抗性。也可用其它類似結(jié)構(gòu)的化學(xué)基團(tuán)替代氨基酸的化學(xué)基團(tuán)進(jìn)行修飾。另一種已知可提高對(duì)抗酶裂解的穩(wěn)定性而生物活性沒有或很少損失的合適假肽鍵,是還原型電子等排物(isostere)假肽鍵(Couder等(1993),Int.J.Peptide Protein Res.,41181-184,全部納入本文供參考)。
因此,這些肽的氨基酸序列可能與NTP肽、相關(guān)蛋白或相關(guān)肽的序列相同,除了一個(gè)或多個(gè)肽鍵被電子等排物假肽鍵替代外。本文所用術(shù)語(yǔ)“氨基酸序列”優(yōu)選指至少2個(gè)氨基酸的序列,優(yōu)選至少4個(gè),更優(yōu)選至少5個(gè)。優(yōu)選大部分N-末端肽鍵被取代,因?yàn)檫@種取代可賦予N-末端對(duì)抗外肽酶的蛋白水解抗性。合成具有一個(gè)或多個(gè)還原型電子等排的假肽鍵的肽是本領(lǐng)域已知的(Couder等,上面所引用)。另一個(gè)例子包括導(dǎo)入酮亞甲基鍵或甲硫鍵來(lái)替代肽鍵。
NTP肽、相關(guān)蛋白或相關(guān)肽的擬肽衍生物代表了另一類肽模擬物,它們保留了生物活性的重要結(jié)構(gòu)決定簇,但去除了肽鍵,從而賦予對(duì)蛋白水解的抗性(Simon等,1992,Proc.Natl.Acad.Sci.USA,899367-9371,全部納入本文供參考)。擬肽是N-取代的甘氨酸的寡聚物。已報(bào)道了一些N-烷基基團(tuán),各對(duì)應(yīng)于天然氨基酸的側(cè)鏈(Simon等,1992,見上面所引用)。NTP肽、相關(guān)蛋白或相關(guān)肽的一些或所有的氨基酸可用對(duì)應(yīng)于被替代氨基酸的N-取代甘氨酸所替代。
術(shù)語(yǔ)“肽模擬物”或“模擬物”還包括反-D肽和下面定義的對(duì)映異構(gòu)體。
術(shù)語(yǔ)“反-D肽”指與NTP肽、相關(guān)蛋白或相關(guān)肽的L-氨基酸序列相比,由反向順序排列的D-氨基酸組成的生物活性蛋白質(zhì)或肽。因此,L-氨基酸NTP肽、相關(guān)蛋白或相關(guān)肽的羧基末端殘基成為D-氨基酸肽的氨基末端。例如,NTP肽、SSWDY變成TdDdWdSdSd,其中Dd、Sd、Wd和Yd是分別對(duì)應(yīng)于L-氨基酸D、S、W和Y的D-氨基酸。
術(shù)語(yǔ)“對(duì)映異構(gòu)體”指一種生物活性蛋白質(zhì)或肽,其中NTP肽、相關(guān)蛋白或相關(guān)肽的氨基酸序列中一個(gè)或多個(gè)L-氨基酸殘基被相應(yīng)的D-氨基酸殘基替代。
本文所描述的氨基酸和氨基酸殘基可參考下表提供的公眾接受的單字母或三字母碼。
表1氨基酸單字母符三字母符丙氨酸A Ala精氨酸R Arg天冬酰胺 N Asn天冬氨酸 D Asp半胱氨酸 C Cys谷氨酰胺 Q Gln谷氨酸E Glu甘氨酸G Gly組氨酸H His異亮氨酸 I Ile亮氨酸L Leu賴氨酸K Lys甲硫氨酸 M Met苯丙氨酸 F Phe脯氨酸P Pro絲氨酸S Ser蘇氨酸T Thr色氨酸W Trp酪氨酸Y Tyr纈氨酸V Val本發(fā)明涉及含有如本發(fā)明以上定義的細(xì)胞死亡肽的組合物。優(yōu)選的細(xì)胞死亡肽與NTP肽類似或同源。然而,使用基于相關(guān)蛋白的部分或片段的細(xì)胞死亡肽也包括在本發(fā)明范圍之內(nèi)。例如,在許多人類和非人蛋白質(zhì)(“相關(guān)蛋白”)中也發(fā)現(xiàn)了AD7c-NTP肽序列和類似的變體和同源物。特別是,AD7c-NTP基因含有Alu-型序列,它與那些也在人類和其它靈長(zhǎng)類基因組的其它基因中發(fā)現(xiàn)的序列非常類似。
因此,可以理解,一些(如果不是全部)相關(guān)蛋白也將被證明是造成細(xì)胞死亡的有效制劑,因?yàn)樗鼈兒须男蛄信cAD7c-NTP肽同源或非常類似(“相關(guān)肽”)。同樣,此領(lǐng)域的一般技術(shù)人員可以基于任何相關(guān)蛋白的氨基酸序列來(lái)合成特定的相關(guān)肽,這些相關(guān)蛋白質(zhì)是造成細(xì)胞死亡的有效制劑,并測(cè)試它們作為造成細(xì)胞死亡制劑的效力。
衍生自相關(guān)蛋白(它們被發(fā)現(xiàn)是造成細(xì)胞死亡的有效制劑)的其它肽序列也是可造成細(xì)胞死亡的有效制劑。此領(lǐng)域的一般技術(shù)人員無(wú)需過多實(shí)驗(yàn)就可合成跨越所述蛋白質(zhì)整個(gè)氨基酸序列的有效相關(guān)蛋白的片段,以便鑒定其它有效的肽序列。
一些相關(guān)蛋白包括以下已知含有與NTP肽序列相同、非常類似或同源的氨基酸的蛋白質(zhì)。
蛋白質(zhì) 序列蛋白質(zhì)的氨基酸序列鑒定編號(hào)編號(hào)(PID)g1012186520MEVSPLQPVNENMQVN KIKKNEDAKKRLSVER IYQKKTQLEHILLRPDTYIGSVELVTQQMWVY DEDVGINYREVTFVPG LYKIFDEILVNAADNKQRDPKMSCIRVTIDPE NNLISIWNNGKGIPVV EHKVEKMYVPALIFGQLLTSSNYDDDEKKVTG GRNGYGAKLCNIFSTK FTVETASREYKKMFKQTWMDNMGRAGEMELKP FNGEDYTCITFQPDLS KFKMQSLDKDIVALMVRRAYDIAGSTKDVKVF LNGNKLPVKGFRSYVD MYLKDKLDETGNSLKVIHEQVNHRWEVCLTMS EKGFQQISFVNSIATS KGGRHVDYVADQIVTKLVDVVKKKNKGGVAVK AHQRELCNGAILAHCN LRLMGSSDSPASASRVAGIAGGCHHTQLIFVF LVETGFHHVGQAGLER LTSGDPPASASQSSGITDVKVKNHMWIFVNAL IENPTFDSQTKENMTL QPKSFGSTCQLSEKFIKAAIGCGIVESILNWV KFKAQVQLNKKCSAVK HNRIKGIPKLDDANDAGGRNSTECTLILTEGD SAKTLAVSGLGVVGRD KYGVFPLRGKILNVREASHKQg1025740921MTGDKGPQRLSGSSYG SISSPTSPTSPGPQQA PPRETYLSEKIPIPDTKPGTFSLRKLWAFTGP GFLMSIAFLDPGNIES DLQAGAVAGFKLLWVLLWATVLGLLCQRLAAR LGVVTGKDLGEVCHLY YPKSESRSVAQSGVQWCDVSSLQPLPPRCPAP SSGg1043356722MMLSVQENVHRCICKH YAPPTAPHLFFETESH SVTQAGVQWCDLGSLQPSPPGFKQFSCLSLSR SWDYRRVPLCLANFIV FLVETGFCRVGQAGLKLLTSSDLPASACQSAG DYRHEPLRLALTLCHF ISRTCTSVDFYICRDLERIPHGHg1043444123MISAHRNLHLPGSSNS PASAFLSSWDYRHVPP CPANVVFLVEMGFLHVGQAGLELPTSDDPPTL ASQSAGITGVSHRTWQ EFASLTVSQAVLRMLVWGPQFENHCSKLLMAS EGDSSLVFFLYPLSNL Ng1043638724MQGSHSAVQAGVWWCH HDSLQPWPPGLRRSSC LSLQSLWDYRSLALSLRLACNGTTSAHCDLCL LSSSDSPASASQVAGI TGEKTAEPHKAHAAQGERHLSSHMSPDENMTE KFCPGPRASFHLRILA ASRHLVKRLLNEYTVTVLRDKSYLRNN
g1043748525MKNYYYFLGQGLTLSP RLECSSTISAHCNLHL LGSSNSPVAASPVAGTTGTCHHDWLIFVFLVE TGFHHIGQTGLEFLTS GDPPTLASKSAGITGVSHCAWPTFLLNDMRHS FNKNLVIIFYVPAISg1044198626MRRELLAGILLRITFN FFLFFFLPFPLVVFFI YFYFYFFLEMESHYVAQAGLELLGSSNPPASA SLVAGTLSVHHCACFE SFTKRKKKLKKAFRFIQCLLLGLLKVRPLQHQ GVNSCDCERGYFQGIF MQAAPWEGTg1094542827MSKTLKKKKHWLSKVQ ECAVSWAGPPGDFGAE IRGGAERGEFPYLGRLREEPGGGTCCIVSGKA PNPSDVLLEVNGTPVS GLTNRDTLAVIRHFREPIRLKTVKPGKVINKD LRHYLSLQFQKGSIDH KLQQVIRDNLYLRTIPCTTRAPRDGEVPGVDY NFISVEQFKALEESGA LLESGTYDGNFYGTPKPPAEPSPFQPDPVDQV LFDNEFDAESQRKRTT SVSKMERMDSSLPEEEEDEDKGAINGSGNAEN RERHSESSDWMKTVPS YNQTNSSMDFRNYMMRDETLEPLPKNWEMAYT DTGMIYFIDHNTKTTT WLDPRLCKKAKAPEDCEDGELPYGWEKIEDPQ YGTYYVDFTLVAQAGV QWHDLGSLQPPPPGFNHLNQKTQFENPVEEAK RKKQLGQVEIGSSKPD MEKSHFTRDPSQLKGVLVRASLKKSTMGFGFT IIGGDRPDEFLQVKNV LKDGPAAQDGKIAPGDVIVDINGNCVFGHTHA DVVQMFQLVPVNQYVN LTLCRGYPLPDDSEDPVVDIVAATPVINGQSL TKGETCMNPQDFKPGA MVLEQNGKSGHTSTGDGLNGPSDASEQRVSMA SSGSSQPELVTIPLIK GPKGFGFAIADSPTGQKVKMILDSQWCQGLQK EDIIKEIYHQNVQNLT HLQVVEVLKQFPVGADVPLLILRGGPPSTTKT AKMKTDKKENAGSLEA INEPIPQPMPFPPSIIRSGSPKLDPSEVYLKS KTLYEDKPPNTKDLDV FLRKQESGFGFRVLGGDGPDQSIYIGAIIPLG AAEKDGRLRAADELMC IDGIPVKGKSHKQVLDLMTTAARNGHVLLTVR RKIFYGEKQPEDDSSQ AFISTQNGSPRLNRAEVPARPAPQEPYDVVLQ RKENEGFGFVILTSKN KPPPGVIPHKIGRVIEGSPADRCGKLKVGDHI SAVNGQSIVELSHANI VQLIKDAGVTVTLTVIAEEEHHGPPSGTNSAR QSPALQHRPMGQSQAN HIPGDRSALEGEIGKDVSTSYRHSWSDHKHLA QPDTAVISVVGSRHNQ NLGCYPVELERGPRGFGFSLRGGKEYNMGLFI LRLAEDGPAIKDGRIH VGDQIVEINGEPTQGITHTRAIELIQAGGNKV LLLLRPGTGLIPDHGL APSGLCSYVKPEQHg111784928MADDQGCIEEQGVEDS ANEDSVDAKPDRSSFV PSLFSKKKKNVTMRSIKTTRDRVPTYQYNMNF EKLGKCIIINNKNFDK VTGMGVRNGTDKDAEALFKCFRSLGFDVIVYN DCSCAKMQDLLKKASE EDHTNAACFACILLSHGEENMESCSVTQAGVQ RRDLGRLQPPPPRLAE GPSLMMASRPTRGPSMTQMLILDTRSQWKLTS SSPIPRFQAITRGGAQ EEAPGLCKPSAPSWRSTEKTWKSCRSSPGg1149340929MGLSIASHFGLLIKKV ERNILFFFRRSLALCQ AGVQWRYLSQLTAASASWVQAILCLSLPSSWD YRHMPPRPANFCILSR DGISPCWPGWSRSLDLVIRPPRPPKVLRLQA
g1149348330MQIIFFFLFLRWSFTL VAQAGVQWRDLSSPQP PPPRFKRFSCLSPPSSWDYRHAPPHPANFVFL VETGFLRVGQAGLELL TSGDPPASASQSAGITGVSHHTQPDANNFLRK LFQKLFg1265488131MGHPRAIQPSVFFSPY DVHFLLYPIRCPYLKI GRFHIKLKGLHFLFSFLFFFFETQSHSVTRLE CSGTISAHCNLCLPGS SNSPASASQVAGTTGTCHHAQLI FVFLAEMGF HHIGQDGLDLNLVIHP PRSPKALGLQAg1280392932MPNHYSFCFCFCFCFR RSLALSPRLECSGAIL AHGKLHLPGSRHSPASASPVAGTKGARHHARL IFLYFg1335918333LFTNSPFSLLSPAQWL CFGTHLGHVQSVSHLQ WEGSVQESLRSVRNSRCALPMLSAPCSLSLHF LLFSLSPFFFFEIRVL LYRQAGVQWCYLGSLQPLPPGFKQFSCLSYPS SWDYRRPPPRQANFCI FSTDGVSPCWPRWSLSLDLMIRPPQPPEVLGL QVg1337562434MGRLVLLWGAAVFLLG GWMALGQGGAEGVQIQ IIYFNLETVQVTWNASKYSRTNLTFHYRFNGD EAYDQCTNYLLQEGHT SGCLLDAEQRDDILYFSIRNGTHPVFTASRWM VYYLKPSSPKHVRFSW HQDAVTVTCSDLSYGDLLYEVQYRSPFDTEWQ TQSRSVTQAGVQWCDL CLLQPSPPRFKRFSCLSLPSSWDYRHPPPRLA NFCIISRDGVSPCWPG WSRTCDLRg1337652835MEFLKVARRNKREQLE QIQKELSVLEEDIKRV EEMSGLYSPVSEDSTVPQFEAPSPSHSSIIDS TEYSQPPGFSGSSQAG VQWRYLGSLQPPPPRYKRFSCLTLPSSWDYRR LPPHLTKKQPWYNSTL ASRRKRLTAHFEDLEQCYFSTRMSRISDDSRT ASQLDEFQECLSKFTR YNSVRPLATLSYASDLYNGSSIVSSIEFDRDC DYFAIAGVTKKIKVYE YDTVIQDAVDIHYPENEMTCNSKISCISWSSY HKNLLASSDYEGTVIL WDGFTGQRSKVYQEHEKRCWSVDFNLMDPKLL ASGSDDAKVKLWSTNL DNSVASIEAKANVCCVKFSPSSRYHLAFGCAD HCVHYYDLRNTKQPIM VFKGHRKAVSYAKFVSGEEIVSASTDSQLKLW NVGKPYCLRSFKGHIN EKNFVGLASNGDYIACGSENNSLYLYYKGLSK TLLTFKFDTVKSVLDK DRKEDDTNEFVSAVCWRALPDGESNVLIAANS QGTIKVLELVg1337655036MGSYFVARAGCKLLGL KGTSHFSLPKCRNCRR EPLPGLFFLFFVFFFLRRSLALSPRLECSGAI VAHCKLGLPGSLHSPA SASQVAGTIGTCHNTRIIFCILVETGFHRVSQ DGVDLLTLg1343085637MDCGSVGGQRTQRLPG RQRLLFLPVGLSGRPG GSETSARRCPSALSDGLGALRPRAPAARGGVS RASPLLLLLLVPSPRL AAAAPRRQLGDWERSRLGYAAPPAGRSGAWRC SPGVAAAAGALPQYHG PAPALVSCRRELSLSAGSLQLERKRRDFTSSG SRKLYFDTHALVCLLE DNESHSFIQAGVQWHSLGLLQPPPPGFKRSSH LILLSSWDYRHAPPHL DNFSVFLLETGFHHVGQAGLKLLTSSDPPTLA S
g1343183538MSPATTGTFLLTVYSI FSKVHSDRNVYPSAGV LFVHVLEREYFKGEFPPYPKPGEISNDPITFN TNLMGYPDRPGWLRYI QRTPYSDGVLYGSPTAENVGKPTIIEITAYNR RTFETARHNLIINIMS AEDFPLPYQAEFFIKNMNVEEMLASEVLGDFL GAVKNVWQPERLNAIN ITSALDRGGRVPLPINDLKEGVYVMVGADVPF SSCLREVENPQNQLRC SQEMEPVITCDKKFRTQFYIDWCKISLVDKTK QVSTYQEVIRGEGILP DGGEYKPPSDSLKSRDYYTDFLITLAVPSAVA LVLFLILAYIMCCRRE GVEKRNMQTPDIQLVHHSAIQKSTKELRDMSK NREIAWPLSTLPVFHP VTGEIIPPLHTDNYDSTNMPLMQTQQWSFAPV AQAGVQWRDLGSLQPP PPRNLPHQTQIPQQQTTGKWYPg1343515339MLGLRKAAAISLLLRN VGLQLATLLMSQKKLG FCGNFLFLNLAIIQTKISSSFFFFLRQSLTLS PRLECNGAISAHCHLR LPDSSNSPASASQVTGITGSHHHAWLIFVFLV ETGFCHVGQDGLELLT SGDPPASASQSAGITGMSHHTWPTDLFFKTVL PARLGLWDSSVg1348907940MHAVPRGFGKKVRVGV QSCPSPFSGQACPQPS SVFWSLLKNLPFLEHLELIGSNFSSAMPRNEP AIRNSLPPCSRAQSVG DSEVAAIGQLAFLRHLTLAQLPSVLTGSGLVN IGPQCQQLRSLSLANL GMMGKVVYMPALSDMLKHCKRLRDLRLEQPYF SANAQFFQALSQCPSL QRLCLVSRSGTLQPDAVLAFMARCLQVVMCHL FTGESLATCKSLQQSL LRRWGEVTGRRPQLFTELREEPSARTSRATGR RQPCLPDSGVVCCPCG RPLAVSGIILVGVSPSLVVKTTCVYRVLFKNL DYASIFFLVCLFETES HSVVQAGVQWRDLSSLQPLLSGLQPQPPEQLE NELEIGFSYCFVIg1348908141MEEDEFIGEKTFQRYC AEFIKHSQQIGDSWEW RPSKDCSDGYMCKIHFQIKNGSVMSHLGASTH GQTCLPMEVKSCSVTQ AGVQLRDLSSLQPPPSGFKQFSCLSLPSNWDY RGSPLHLANFLYFg1354049842MTTCEFEFIFLKEQVT RICNIAPLKAYFSVHK MGKILKKLSNFSFLTHRQSLTLSPRLECSGAI SAHCNLHLLGSSNSAA SASRVAGTTGACHHAQLIFVFLVETGFHHVGQ DGLGLLTSg1354328743MSCNPSFGGIGKGHLM REVDALDGLCSRICDQ SGVHYKVLNRRKGPAVWGLRAQIDRKLYKQNM QKEILNTPLLTVQEGA VEDLILTEPEPEHTGKCRVSGVVLVDGSTVYA ESVILTTGTFLRGMIV IGLETHPAGRLGDQPSIGLAQTLEKLGFVVGR LKTGTPPRIAKESINF SILNKHIPDNPSIPFSFTNETVWIKPEDQLPC YLTHTNPRVDEIVLKN LHLNSHVKETTRGPRYCPSIESKVLRFPNRLH QVWLEPEGMDSDLIYP QGLSMTLPAELQEKMITCIRGLEKAKVIQPDG VLLLLPRMECNGAISA HHNLPLPGYGVQYDYLDPRQITPSLETHLVQR LFFAGQINGTTGYEEA AAQGVIAGINASLRVSRKPPFVVSRTEGYIGV LIDDLTTLGTSEPYRM FTSRVEFRLSLRPDNADSRLTLRGYKDAGCVS QQRYERACWMKSSLEE GISVLKSIEFLSSKWKKLIPEASISTSRSLPV RALDVLKYEEVDMDSL AKAVPEPLKKYTKCRELAERLKIEATYESVLF HQLQEIKGVQQDEALQ LPKDLDYLTIRDVSLSHEVREKLHFSRPQTIG AASRIPGVTPAAIINL LRFVKTTQRRQSAMNE
SSKTDQYLCDADRLQE RELg1356985644MPFLYDISSCWTSFCF LFFSPLDGVLLCFPGW NAVARSQLTATSASQVQAILLVSASGVAGIIG TCHHAQPIFVFLVEMG FHHVGQACLKLLNSGDPPASASQSAGITGMSH HARPFFFFFSFg1359186845MSEAENEFINWVATAA IEANCSQCWLCVELPE AAGNGLPWRIVPANISEWICQYQWEWDNTWFC FDFLSQSVSLSPRLEC SGTILAQCNLCLLGSSDSPASASQVAGIIGAC RHAWLIFCIFSRDGVS PYCPGg1359187046MALFLDKMGSLQKGNY SSQSGMIPGSWQHKMK LQLILKSSKAYYVLSDAAMSLQKYGRALRYIK LALQSHDTYCCLCTNM LSEVLLFLSQYLTLCGDIQLMLAQNANNRAAH LEEFHYQTKEDQEILH SLHRESSCQGVPQAWTTWFTVGLCSLAHAYLS IQKRGRNIRVLIFALY LFIYFLRRSFALVAQAGVQWCNLGSLKPPPPG FKQFSCLSLPSSWNYR HAPPCPASPPWPPKVLGLQVg136299347 RSLTLWPSLEYSGTIS AHCNLRLPGSSDSRAS ASRAAGITGVSHCARPCMLFDPEFDLLAGVQL LPFEPPTGKALSRKDg1363190748MEFRKLRGMETRPPAN TARLQPPRDLRSSSPR KQLSESSDDDYDDVDIPTPAEDTPPPLPPKPK FRSPSDEGPGSMGDDG QLSPGVLVRCASGPPPNSPRPGPPPSTSSPHL TAHSEPSLWNPPSREL DKPPLLPPKKEKMKRKGCALLVKLFNGCPLRI HSTAAWTHPSTKDQHL LLGAEEGIFILNRNDQEATLEMLFPSRTTWVY SINNVLMSLSGKTPHL YSHSILGLLERKETRAGNPIAHISPHRLLARK NMVSTKIQDTKGCRAC CVAEGASSGGPFLCGALETSVVLLQWYQPMNK FLLVRQVLFPLPTPLS VFALLTGPGSELPAVCIGVSPGRPGKSVLFHT VRFGALSCWLGEMSTE HRGPVQVTQVEEDMVMVLMDGSVKLVTPEGSP VRGLRTPEIPMTEAVE AVAMVGGQLQAFWKHGVQVWALGSDQLLQELR DPTLTFRLLGSPRLEC SGTISPHCNLLLPGSSNSPASASRVAGITGLg1364461249MSMVLGGPFSKGHTAS DEYFQIFHNISFFETE SCSVAQAGVQWCNLGSLQALPPRFTPFSCLSL PSSWDYRHPPPCPDNV FVFSVETGLHCVSQDGLNLLTLg1364605550MDCGSVGGQRTQRLPG RQRLLFLPVGLSGRPG GSETSARRCLSALSDGLGALRPRAPAARGGVS RASPLLLLLLVPSPRL AAAAPRRQLGDWERSRLGYAAPPAGRSSAWRC SPGVAAAAGALPQYHG PAPALVSCRRELSLSAGSLQLERKRRDFTSSG SRKLYFDTHALVCLLE DNESHSFIQAGVQWHSLGLLQPPPPGFKRSSH LILLSSWDYRHAPPHL DNFSVFLLETGFHHVGQAGLKLLTSSDPPTLA Sg1364642351MNFFFKTEFLSVTQAG MQWHNFSSLQPLPPGF KQFSCLSLLSSWDYRHTPPCPANFCIFSRGGV SPCWSGWSRTPDFMIH PPRPPKVLRLQK
g1364861152MPLAAYCYLRVVGKGS YGEVTLVKHRRDGKQY VIKKLNLRNASSRERRAAEQEAQLLSQLKHPN IVTYKESWEGGDGLLY IVMGFCEGGDLYRKLKEQKGQLLPENQVVEWF VQIAMALQYLHEKHIL HRDLKTQNVFLTRTNIIKVGDLGIARVLENHC DMASTLIGTPYYMSPE LFSNKPYNYKSDVWALGCCVYEMATLKHAFNA KDMNSLVYRIIEGKLP PMPRDYSPELAELIRTMLSKRPEERPSVRSIL RQPYIKRQISFFLEAT KIKTSKNNIKNGDSQSKPFATVVSGEAESNHE VIHPQPLSSEGSQTYI MGEGKCLSQEKPRASGLLKSPASLKAHTCKQD LSNTTELATISSVNID ILPAKGRDSVSDGFVQENQPRYLDASNELGGI CSISQVEEEMLQDNTK SSAQPENLIPMWSSDIVTGEKNEPVKPLQPLI KEQKPKDQSLALSPKL ECSGTILAHSNLRLLGSSDSPASASRVAGITG VCHHAQDQVAGECIIE KQGRIHPDLQPHNSGSEPSLSRQRRQKRREQT EHRGEKRQVRRDLFAF QESPPRFLPSHPIVGKVDVTSTQKEAENQRRV VTGSVSSSRSSEMSSS KDRPLSARERRRLKQSQEEMSSSGPSVRKASL SVAGPGKPQEEDQPLP ARRLSSDCSVTQERKQIHCLSEDELSSSTSST DKSDGDYGEGKGQTNE INALVQLMTQTLKLDSKESCEDVPVANPVSEF KLHRKYRDTLILHGKV AEEAEEIHFKELPSAIMPGSEKIRRLVEVLRT DVIRGLGVQLLEQVYD LLEEEDEFDREVRLREHMGEKYTTYSVKARQL KFFEENMNFg1365134253MFISFGRLIFSFFLTW SLSLSPRLECSGTILA HCNPTSQVQAILPASASRVAGITGMHHHTCLI FVLLVKMGFCHVGHAG LELVTg1365201054MESGQPSLSFYFLFIY FFEIGSHFVTQAGVQW HNLDSLQLSLASAPQVAGTTGACHHARLIFGV FCRDWVLPCg1365340955MLLVDADQPEPMRSGA RELALFLTPEPGAEAK EVEETIEGMLLRLEEFCSLADLIRSDTSQILE ENIPVLKAKLTEMRGI YAKVDRLEAFVKMVGHHVAFLEADVLQAERDH GAFPQALRRWLGSAGL PSFRNVECSGTIPARCNLRLPGSSDSPASASQ VAGIPEVTCTGARDVR AAHTVg1369991656MSRGNENRLTHRRQTV LREKGRRLANRGPAYM FNDHSTSLSIEEERFLDAAEYGNIPVVRKMLE ECLSLNVNCVDYMGQN ALQLAVANEHLEITELLLKKENLSRVGDALLL AISKGYVRIVEAILNH PAFAEGKRLATSPSQSELQQDDFYAYDEDGTR FSHDVTPIILAAHCQE YEIVHTLLRKGARIERPHDYFCKCTECSQKQK HDSFSHSRSRINAYKG LASPAYLSLSSEDPVMTALELSNELAVLANIE KEFKNDYRKLSMQCKD FVVGLLDLCRNTEEVEAILNGDAETRQPGDLA RPNLSRLKLAIKYEVK KFVAHPNCQQQLLSIWYENLSGLRQQTMAVKF LVVLAVAIGLPFLALI YWCAPCSKMGKILRGPFMKFVAHAASFTIFLG LLVMNAADRFEGTKLL PNETSTDNARQLFRMKTSCFSWMEMLIISWVI GMIWAECKEIWTQGPK EYLFELWNMLDFGMLAIFAASFIARFMAFWHA SKAQSIIDANDTLKDL TKVTLGDNVKYYNLARIKWDPTDPQIISEGLY AIAVVLSFSRIAYILP ANESFGPLQISLGRTVKDIFKFMVIFIMVFVA FMIGMFNLYSYYIGAK QNEAFTTVEESFKTLFWAIFGLSEVKSVVINY NHKFIENIGYVLYGVY NVTMVIVLLNMLIAMI
NSSFQEIEDDADVEWK FARAKLWFSYFEEGRT LPVPFNLVPSPKSLLYLLLKFKKWMSELIQGH KKGFQEDAEMNKRNEE KKFGILGSHEDLSKFSLDRNQLAHNKQSSTRS SEDFHLNSFSNPPRQY QKIMKRLIKRYVLQAQIDKESDEVNEGELKEI KQDISSLRYELLEEKS QNTEDLAELIRKLGERLSLESKQEESRRg1370214957MSRGNENRLTHRRQTV LREKGRRLANRGPAYM FNDHSTSLSIEEERFLDAAEYGNIPVVRKMLE ECLSLNVNCVDYMGQN ALQLAVANEHLEITELLLKKENLSRVGDALLL AISKGYVRIVEAILNH PAFAEGKRLATSPSQSELQQDDFYAYDEDGTR FSHDVTPIILAAHCQE YEIVHTLLRKGARIERPHDYFCKCTECSQKQK HDSFSHSRSRINAYKG LASPAYLSLSSEDPVMTALELSNELAVLANIE KEFKNDYRKLSMQCKD FVVGLLDLCRNTEEVEAILNGDAETRQPGDLA RPNLSRLKLAIKYEVK KFVAHPNCQQQLLSIWYENLSGLRQQTMAVKF LVVLAVAIGLPFLALI YWCAPCSKMGKILRGPFMKFVAHAASFTIFLG LLVMNAADRFEGTKLL PNETSTDNARQLFRMKTSCFSWMEMLIISWVI GMIWAECKEIWTQGPK EYLFELWNMLDFGMLAIFAASFIARFMAFWHA SKAQSIIDANDTLKDL TKVTLGDNVKYYNLARIKWDPTDPQIISEGLY AIAVVLSFSRIAYILP ANESFGPLQISLGRTVKDIFKFMVIFIMVFVA FMIGMFNLYSYYIGAK QNEAFTTVEESFKTLFWAIFGLSEVRSVVINY NHKFIENIGYVLYGVY NVTMVIVLLNMLIAMINSSFQEI ERNEEKKFG ILGSHEDLSKFSLDRN QLAHNKQSSTRSSEDFHLNSFSNPPRQYQKIM KRLIKRYVLQAQIDKE SDEVNEGELKEIKQDISSLRYELLEEKSQNTE DLAELIRRLGERLSLE SKQEESRRg1404323858MESRSVAQAGVQWPDL GSLQPLPPRFKRFFCL SLQSSWDYRHAPPRPANFVFLVETGFCHVSQA GLELLTSSDPPPRPPK VLRg1419293159MISVHCNLCLPGSSDP PASASQVAGITGVRHC MASGAVLNKVRRHQCSGDLEVRGSHGSLGEAP WGKSVPGRGTASRKGP GAGVIGNSKEASTGRAQWSAPVIPATQEAKAG GLLEPRSLISAWATYQ DLISINKLKEKRGg1419830960MTRSLFKGNFWSADIL STIGYDNIIQHLNNGR KNCKEFEDFLKERAAIEERYGKDLLNLSRKKP CGQSEINTLKRALEVF KQQVDNVAQCHIQLAQSLREEARKMEEFREKQ KLQRKKMESHSVTQAG AQWHDLGSLQALPPGFMPFSCLSLPSSWNYRL PPPPRLAEPRNQDHGV Ag1424997361MESHSVTQAGVQWRDL GSLQPLPPGFKQFSHL SLPSSWDYRRVPPYLGNFCIFSGEGVSPCWPG WSg1622602562MGSLSTANVEFCLDVF KELNSNNIGDNIFFSS LSLLYALSMVLLGARGETAEQLEKVLHFSHTV DSLKPGFKDSPKCSQA GRIHSEFGVEFSQINQPDSNCTLSIANRLYGT KTMAFHQQYLSCSEKW YQARLQTVDFEQSTEETRKTINAWVENKTNGK VANLFGKSTIDPSSVM VLVNTIYFKGQRQNKFQVRETVKSPFQLSEGK NVTVEMMYQIGTFKLA FVKEPQMQVLELPYVNNKLSMIILLPVGIANL KQIEKQLNSGTFHEWT SSSNMMEREVEVHLPR
FKLEIKYELNSLLKPL GVTDLFNQVKADLSGM SPTKGLYLSKAIHKSYLDVSEEGTEAAAATGD SIAVKSLPMRAQFKAN HPFLFFIRHTHTNTILFCGKLASPg1651717463MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASVKKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYVGDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDITPIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRHSRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSEYEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLARLKLAIKYRQKEFVAQP NCQQLLASRWYDEFPG WRRRHWAVKMVTCFIIGLLFPVFSVCYLIAPK SPLGLFIRKPFIKFIC HTASYLTFLFLLLLASQHIDRSDLNRQGPPPT IVEWMILPWVLGFIWG EIKQMWDGGLQDYIHDWWNLMDFVMNSLYLAT ISLKIVAFVKYSALNP RESWDMWHPTLVAEALFAIANIFSSLRLISLF TANSHLGPLQISLGRM LLDILKFLFIYCLVLLAFANGLNQLYFYYEET KGLTCKGIRCEKQNNA FSTLFETLQSLFWSIFGLINLYVTNVKAQHEF TEFVGATMFGTYNVIS LVVLLNMLIAMMNNSYQLIADHADIEWKFART KLWMSYFEEGGTLPTP FNVIPSPKSLWYLIKWIWTHLCKKKMRRKPES FGTIGVRTQHRRAADN LRRHHQYQEVMRNLVKRYVAAMIRDAKTEEGL TEENFKELKQDISSFR FEVLGLLRGSKLSTIQSANASKESSNSADSDE KSDSEGNSKDKKKNFS LFDLTTLIHPRSAAIASERHNISNGSALVVQE PPREKQRKVNFVTDIK NFGLFHRRSKQNAAEQNANQIFSVSEEVARQQ AAGPLERNIQLESRGL ASRGDLSIPGLSEQCVLVDHRERNTDTLGLQV GKRVCPFKSEKVVVED TVPIIPKEKHAKEEDSSIDYDLNLPDTVTHED YVTTRLg1651717664MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASVKKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYVGDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDITPIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRHSRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSEYEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLARLKLAIKYRQKEASYGE KLNRCGMADFRTTSMI GGIg1675833065MSQSPGFVTRRGGSPK AAPGAGARRNESQDYL LMDELGDDGYPQLQQPPYGYYPSFRGNENRLT HRRQTVLREKGRRLAN RGPAYMFNDHSTSLSIEEERFLDAAEYGNIPV VRKMLEECLSLNVNCV DYMGQNALQLAVANEHLEITELLLKKENLSRV GDALLLAISKGYVRIV EAILNHPAFAEGKRLATSPSQSELQQDDFYAY DEDGTRFSHDVTPIIL AAHCQEYEIVHTLLRKGARIERPHDYFCKCTE CSQKQKHDSFSHSRSR INAYKGLASPAYLSLSSEDPVMTALELSNELA VLANIEKEFKNDYRKL SMQCKDFVVGLLDLCRNTEEVEAILNGDAETR QPGDLARPNLSRLKLA IKYEVKKFVAHPNCQQQLLSIWYENLSGLRQQ TMAVKFLVVLAVAIGL PFLALIYWCAPCSKMGKILRGPFMKFVAHAAS FTIFLGLLVMNAADRF EGTKLLPNETSTDNARQLFRMKTSCFSWMEML IISWVIGMIWAECKEI WTQGPKEYLFELWNML
DFGMLAIFAASFIARF MAFWHASKAQSIIDAN DTLKDLTKVTLGDNVKYYNLARIKWDPTDPQI ISEGLYAIAVVLSFSR IAYILPANESFGPLQISLGRTVKDIFKFMVIF IMVFVAFMIGMFNLYS YYIGAKQNEAFTTVEESFKTLFWAIFGLSEVK SVVINYNHKFIENIGY VLYGVYNVTMVIVLLNMLIAMINSSFQEIEDD ADVEWKFARAKLWFSY FEEGRTLPVPFNLVPSPKSLLYLLLKFKKWMS ELIQGHKKGFQEDAEM NKRNEEKKFGILGSHEDLSKFSLDRNQLAHNK QSSTRSSEDFHLNSFS NPPRQYQKIMKRLIKRYVLQAQIDKESDEVNE GELKEIKQDISSLRYE LLEEKSQNTEDLAELIRKLGERLSLESKQEES RRg171021666 MGHPRAIQPSVFFSPY DVHFLLYPIRCPYLKI GRFHIKLKGLHFLFSFLFFFFETQSHSVTRLE CSGTISAHCNLCLPGS SNSPASASRVAGTAGTCRRAQLIFVFLAEMGF HHVGRDGLDLNLVIHP PRSPKALGLQAg1797830367MGSLSTANVEFCLDVF KELNSNNIGDNIFFSS LSLLYALSMVLLGARGETAEQLEKVLHFSHTV DSLKPGFKDSPKCSQA GRIHSEFGVEFSQINQPDSNCTLSIANRLYGT KTMAFHQQYLSCSEKW YQARLQTVDFEQSTEETRKMINAWVENKTNGK VANLFGKSTIDPSSVM VLVNTIYFKGQRQNKFQVRETVKSPFQLSEGK NVTVEMMYQIGTFKLA FVKEPQMQVLELPYVNNKLSMIILLPVGIANL KQIEKQLNSGTFHEWT SSSNMMEREVEVHLPRFKLEIKYELNSLLKPL GVTDLFNQVKADLSGM SPTKGLYLSKAIHKSYLDVSEEGTEAAAATGD SIAVKSLPMRAQFKAN HPFLFFIRHTHTNTILFCGKLASPg1837662968MLRNSTFKNMQRRHTT LREKGRRQAIRGPAYM FNEKGTSLTPEEERFLDSAEYGNIPVVRKMLE ESKTLNFNCVDYMGQN ALQLAVGNEHLEVTELLLKKENLARVGDALPL AISKGYVRIVEAILNH PAFAQGQRLTLSPLEQELRDDDFYAYDEDGTR FSHDITPIILAAHCQE YEIVHILLLKGARIERPHDYFCKCNECTEKQR KDSFSHSRSRMNAYKG LASAAYLSLSSEDPVLTALELSNELARLANIE TEFKNDYRKLSMQCKD FVVGVLDLCRDTEEVEAILNGDVNFQVWSDHH RPSLSRIKLAIKYEVK KFVAHPNCQQQLLTMWYENLSGLRQQSIAVKF LAVFGVSIGLPFLAIA YWIAPCSKLGRTLRSPFMKFVAHAVSFTIFLG LLVVNASDRFEGVKTL PNETFTDYPKQIFRVKTTQFSWTEMLIMKWVL GMIWSECKEIWEEGPR EYVLHLWNLLDFGMLSIFVASFTARFMAFLKA TEAQLYVDQHVQDDTL HNVSLPPEVAYFTYARDKWWPSDPQIISEGLY AIAVVLSFSRIAYILP ANESFGPLQISLGRTVKDIFKFMVIFIMVFVA FMIGMFNLYSYYRGAK YNPAFTTVEESFKTLFWSIFGLSEVISVVLKY DHKFIENIGYVLYGVY NVTMVVVLLNMLIAMINNSYQEIEEDADVEWK FARAKLWLSYFDEGRT LPAPFNLVPSPKSFYYLIMRIKMCLIKLCKSK AKSCENDLEMGMLNSK FKKTRYQAGMRNSENLTANNTLSKPTRYQKIM KRLIKRYVLKAQVDRE NDEVNEGELKEIKQDISSLRYELLEEKSQATG ELADLIQQLSEKFGKN LNKDHLRVNKGKDIg184338869 MKVRLLRQLSAAAKVK APSGLQGPPQAHQFIS LLLEEYGALCQAARSISTFLGTLENEHLKKFQ VTWELHNKHLFENLVF SEPLLQSNLPALVSQI
RLGTTTHDTCSEDTYS TLLQRYQRSEEELRRV AEEWLECQKRIDAYVDEQMTMKTKQRMLTEDW ELFKQRRFIEEQLTNK KAVTGENNFTDTMRHVLSSRLSMPDCPNCNYR RRCACDDCSLSHILTC GIMDPPVTDDIHIHQLPLQVDPAPDYLAERSP PSVSSASSGSGSSSPI TIQQHPRLILTDSGSAPTFCSDDEDVAPLSAK FADIYPLSNYDDTEVV ANMNGIHSELNGGGENMALKDESPQISSTSSS SSEADDEEADGESSGE PPGAPKEDGVLGSRSPRTEESKADSPPPSYPT QQAEQAPNTCECHVCK QEASGLTPSAMTAGALPPGHQFLSPEKPTHPA LHLYPHIHGHVPLHTV PHLPRPLIHPTLYATPPFTHSKALPPAPVQNH TNKHQVFNASLQDHIY PSCFGNTPEWNSSKFISLWGSEVMNDKNWNPG TFLPDTISGSEILGPT LSETRPEALPPPSSNETPAVSDSKEKKNAAKK KCLYNFQDAFMEANKV VMATSSATSSVSCTATTVQSSNSQFRVSSKRP PSVGDVFHGISKEDHR HSAPAAPRNSPTGLAPLPALSPAALSPAALSP ASTPHLANLAAPSFPK TATTTPGFVDTRKSFCPAPLPPATDGSISAPP SVCSDPDCEGHRCENG VYDPQQDDGDESADEDSCSEHSSSTSTSTNQK EGKYCDCCYCEFFGHG GPPAAPTSRNYAEMREKLRLRLTKRKEEQPKK MDQISERESVVDHRRV EDLLQFINSSETKPVSSTRAAKRARHKQRKLE EKARLEAEARAREHLH LQEEQRRREEEEDEEEEEDRFKEEFQRLQELQ KLRAVKKKKKERPSKD CPKLDMLTRNFQAATESVPNSGNIHNGSLEQT EEPETSSHSPSRHMNH SEPRPGLGADGDAADPVDTRDSKFLLPKEVNG KQHEPLSFFFDIMQHH KEGNGKQKLRQTSKASSEPARRPTEPPKATEG QSKPRAQTESKAKVVD LMSITEQKREERKVNSNNNNKKQLNHIKDEKS NPTPMEPTSPGEHQQN SKLVLAESPQPKGKNKKNKKKKGDRVNNSIDG VSLLLPSLGYNGAILA HCNLRLPGSSDCAASASQVVGITDDVFLPKDI DLDSVDMDETEREVEY FKRFCLDSARQTRQRLSINWSNFSLKKATFAA Hg2014014470MGSLSTANVEFCLDVF KELNSNNIGDNIFFSS LSLLYALSMVLLGARGETAEQLEKVLHFSHTV DSLKPGFKDSPKCSQA GRIHSEFGVEFSQINQPDSNCTLSIANRLYGT KTMAFHQQYLSCSEKW YQARLQTVDFEQSTEETRKMINAWVENKTNGK VANLFGKSTIDPSSVM VLVNIIYFKGQRQNKFQVRETVKSPFQLSEGK NVTVEMMYQIGTFKLA FVKEPQMQVLELPYVNNKLSMIILLPVGIANL KQIEKQLNSGTFHEWT SSSNMMEREVEVHLPRFKLEIKYELNSLLKPL GVTDLFNQVKADLSGM SPTKGLYLSKAIHKSYLDVSEEGTEAAAATGD SIAVKSLPMRAQFKAN HPFLFFIRHTHTNTILFCGKLASPg2047666071MMAALYPSTDLSGASS SSLPSSPSSSSPNEVM ALKDVREVKEENTLNEKLFLLACDKGDYYMVK KILEENSSGDLNINCV DVLGRNAVTITIENENLDILQLLLDYGCQSAD ALLVAIDSEVVGAVDI LLNHRPKRSSRPTIVKLMERIQNPEYSTTMDV APVILAAHRNNYEILT MLLKQDVSLPKPHAVGCECTLCSAKNKKDSLR HSRFRLDIYRCLASPA LIMLTEEDPILRAFELSADLKELSLVEVEFRN DYEELARQCKMFAKDL LAQARNSRELEVILNHTSSDEPLDKRGLLEER MNLSRLKLAIKYNQKE FVSQSNCQQFLNTVWFGQMSGYRRKPTCKKIM TVLTVGIFWPVLSLCY LIAPKSQFGRIIHTPFMKFIIHGASYFTFLLL LNLYSLVYNEDKKNTM GPALERIDYLLILWIIGMIWSDIKRLWYEGLE DFLEESRNQLSFVMNS LYLATFALKVVAHNKF
HDFADRKDWDAFHPTL VAEGLFAFANVLSYLR LFFMYTTSSILGPLQISMGQMLQDFGKFLGMF LLVLFSFTIGLTQLYD KGYTSKEQKDCVGIFCEQQSNDTFHSFIGTCF ALFWYIFSLAHVAIFV TRFSYGEELQSFVGAVIVGTYNVVVVIVLTKL LVAMLHKSFQLIANHE DKEWKFARAKLWLSYFDDKCTLPPPFNIIPSP KTICYMISSLSKWICS HTSKGKVKRQNSLKEWRNLKQKRDENYQKVMC CLVHRYLTSMRQKMQS TDQATVENLNELRQDLSKFRNEIRDLLGFRTS KYAMFYPRNg2054604472MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASVKKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYVGDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDITPIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRHSRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSEYEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLARLKLAIKYRQKEFVAQP NCQQLLASRWYDEFPG WRRRHWAVKMVTCFIIGLLFPVFSVCYLIAPK SPLGLFIRKPFIKFIC HTASYLTFLFLLLLASQHIDRSDLNRQGPPPT IVEWMILPWVLGFIWG EIKQMWDGGLQDYIHDWWNLMDFVMNSLYLAT ISLKIVAFVKYSALNP RESWDMWHPTLVAEALFAIANIFSSLRLISLF TANSHLGPLQISLGRM LLDILKFLFIYCLVLLAFANGLNQLYFYYEET KGLTCKGIRCEKQNNA FSTLFETLQSLFWSIFGLINLYVTNVKAQHEF TEFVGATMFGTYNVIS LVVLLNMLIAMMNNSYQLIADHADIEWKFART KLWMSYFEEGGTLPTP FNVIPSPKSLWYLIKWIWTHLCKKKMRRKPES FGTIGVRTQHRRAADN LRRHHQYQVIMRNLVKRYVAAMIRDAKTEEGL TEENFKELKQDISSFR FEVLGLLRGSKLSTIQSANASKESSNSADSDE KSDSEGNSKDKKKNFS LFDLTTLIHPRSAAIASERHNISNGSALVVQE PPREKQRKVNFVTDIK NFGLFHRRSKQNAAEQNANQIFSVSEEVARQQ AAGPLERNIQLESRGL ASRGDLSIPGLSEQCVLVDHRERNTDTLGLQV GKRVCPFKSEKVVVED TVPIIPKEKHAKEEDSSIDYDLNLPDTVTHED YVTTRLg2088128773MSQSPRFVTRRGGSLK AAPGAGTRRNESQDYL LMDELGDDGYPQLPLPPYGYYPSFRGNENRLT HRRQTILREKGRRLAN RGPAYMFNDHSTSLSIEEERFLDAAEYGNIPV VRKMLEECHSLNVNCV DYMGQNALQLAVANEHLEITELLLKKENLSRV GDALLLAISKGYVRIV EAILNHPAFAEGKRLATSPSQSELQQDDFYAY DEDGTRFSHDVTPIIL AAHCQEYEIVHTLLRKGARIERPHDYFCKCTE CSQKQKHDSFSHSRSR INAYKGLASPAYLSLSSEDPVMTALELSNELA VLANIEKEFKNDYRKL SMQCKDFVVGLLDLCRNTEEVEAILNGDAETR QPGDFGRPNLSRLKLA IKYEVKKFVAHPNCQQQLLSIWYENLSGLRQQ TMAVKFLVVLAVAIGL PFLALIYWCAPCSKMGKILRGPFMKFVAHAAS FTIFLGLLVMNAADRF EGTKLLPNETSTDNARQLFRMKTSCFSWMEML IISWVIGMIWAECKEI WTQGPKEYLFELWNMLDFGMLAIFAASFIARF MAFWHASKAQSIIDAN DTLKDLTKVTLGDNVKYYNLARIKWDPTDPQI ISEGLYAIAVVLSFSR IAYILPANESFGPLQISLGRTVKDIFKFMVIF IMVFVAFMIGMFNLYS YYIGAKQNEAFTTVEESFKTLFWAIFGLSEVK SVVINYNHKFIENIGY VLYGVYNVTMVIVLLNMLIAMINSSFQEIEDD ADVEWKFARAKLWFSY FEEGRTLPVPFNLVPS
PKSLLYLLLKFKKWMC ELIQGQKQGFQEDAEM NKRNEEKKFGISGSHEDLSKFSLDKNQLAHNK QSSTRSSEDYHLNSFS NPPRQYQKIMKRLIKRYVLQAQIDKESDEVNE GELKEIKQDISSLRYE LLEEKSQNTEDLAELIRKLGERLSLEPKLEES RRg210542074 PSGLPLLPVLFALGGL LLLSNASCVGGVLWQR RLRRLAEALNFPPHLHPGRSEEDRVRNEYEES QWTGERDTQSSTVSTT EAEPYYRSLRDFSPQLPPTQEEVSYSRGFTGE DEDMAFPGHLYDEVER TYPPSGAWGPLYDEVQMGPWDLHWPEDTYQDP RGIYDQVAGDLDTLEP DSLPFELRGHLVWGFNHVSQAGLKLLASSDPP ASASQSAEITESHSVV QVGVQWRYFGSLHPLPPGSRDSLASASRIAGI TAPWEAEVSRSPQGTQ DSPVTRSGPPSRGWQSLSFDGGAFHLKGTGEL TRALLVLRLCAWPPLV THGLLLQAWSRRLLGSRLSGAFLRASVYGQFV AGETAEEVKGCVQQLR TLSLRPLLAVPTEEEPDSAAKRMRLHHVGQAG LELLTPAASGSVAQAG VQWRQSSDRGGGNQAAASRSSLLQEAAFSPPC GRLQLPAQPASRHGAR GRGSMKAKSLTSRHLLASQGQETIIKTKVRIP ALWKAEPGQHSKTPSQ QNKSQYVTTLWEADVGRSLENLQVSCLNAEQN QHLRASLSRLHRVTPP AGTSTSGPPSAACIGWHSRLHRVAQYARAQHV RLLVDAEYTSLNPALS LLVAALAVRWNSPGEGGPWVWNTYQACLKDTF ERLGRDAEAAHRAGLA FGVKLVRGAYLDKERAVAQLHGMEDPTQPDYE ATSELNRASPFSYSRC LELMLTHVARHGPMCHLMVASHNEESVRQATK RMWELGIPLDGTVCFG QLLGMCDHVSLALGQAGYVVYKSIPYGSLEEV IPYLIRRAQENRSVLQ GARREQELLSQELWRRLLPGCRRIPHg211964375 SCSVTLAGVQWRDLGL LQPLPPKFKRFSCLSF PSSWDYRg211964476 EMEFNCESCSVTLAGV QWRDLGLLQPLPPKFK RFSCLSFPSSWDYRg213632877 MCPGIPGPRAEAAVGT THPFSSPGAWLGSGSG SGPVGAPPPSPGLPPSWAAMMAALYPSTDLSG ASSSSLPSSPSSSSPN EVMALKDVREVKEENTLNEKLFLLACDKGDYY MVKKILEENSSGDLNI NCVDVLGRNAVTITIENENLDILQLLLDYGCQ KLMERIQNPEYSTTMD VAPVILAAHRNNYEILTMLLKQDVSLPKPHAV GCECTLCSAKNKKDSL RHSRFRLDIYRCLASPALIMLTEEDPILRAFE LSADLKELSLVEVEFR NDYEELARQCKMFAKDLLAQARNSRELEVILN HTSSDEPLDKRGLLEE RMNLSRLKLAIKYNQKEFVSQSNCQQFLNTVW FGQMSGYRRKPTCKKI MTVLTVGIFWPVLSLCYLIAPKSQFGRIIHTP FMKFIIHGASYFTFLL LLNLYSLVYNEDKKNTMGPALERIDYLLILWI IGMIWSDIKRLWYEGL EDFLEESRNQLSFVMNSLYLATFALKVVAHNK FHDFADRKDWDAFHPT LVAEGLFAFANVLSYLRLFFMYTTSSILGPLQ ISMGQMLQDFGKFLGM FLLVLFSFTIGLTQLYDKGYTSKEQKDCVGIF CEQQSNDTFHSFIGTC FALFWYIFSLAHVAIFVTRFSYGEELQSFVGA VIVGTYNVVVVIVLTK LLVAMLHKSFQLIANHEDKEWKFARAKLWLSY FDDKCTLPPPFNIIPS PKTICYMISSLSKWICSHTSKGKVKRQNSLKE WRNLKQKRDENYQKVM CCLVHRYLTSMRQKMQSTDQATVENLNELRQD LSKFRNEIRDLLGFRT SKYAMFYPRN
g376619178 MSRGNENRLTHRRQTI LREKGRRLANRGPAYM FNDHSTSLSIEEERFLDAAEYGNIPVVRKMLE ECHSLNVNCVDYMGQD ALQLAVANEHLEITELLLKKENLSRVGDALLL AISKGYVRIVEAILNH PAFAEGKRLATSPSQSELQQDDFYAYDEDGTR FSHDVTPIILAAHCQE YEIVHTLLRKGARIERPHDYFCKCTECSQKQK HDSFSHSRSRINAYKG LASPAYLSLSSEDPVMTALELSNELAVLANIE KEFKNDYRKLSMQCKD FVVGLLDLCRNTEEVEAILNGDAETRQPGDFG RPNLSRLKLAIKYEVK KFVAHPNCQQQLLSIWYENLSGLRQQTMAVKF LVVLAVAIGLPFLALI YWCAPCSKMGKILRGPFMKFVAHAASFTIFLG LLVMNAADRFEGTKLL PNETSTDNARQLFRMKTSCFSWMEMLIISWVI GMIWAECKEIWTQGPK EYLFELWNMLDFGMLAIFAASFIARFMAFWHA SKAQSIIDANDTLKDL TKVTLGDNVKYYNLARIKWDPTDPQIISEGLY AIAVVLSFSRIAYILP ANESFGPLQISLGRTVKDIFKFMVIFIMVFVA FMIGMFNLYSYYIGAK QNEAFTTVEESFKTLFWAIFGLSEVKSVVINY NHKFIENIGYVLYGVY NVTMVIVLLNMLIAMINSSFQEIEDDADVEWK FARAKLWFSYFEEGRT LPVPFNLVPSPKSLLYLLLKFKKWMCELIQGQ KQGFQEDAEMNKRNEE KKFGISGSHEDLSKFSLDKNQLAHNKQSSTRS SEDYHLNSFSNPPRQY QKIMKRLIKRYVLQAQIDKESDEVNEGELKEI KQDISSLRYELLEEKS QNTEDLAELIRKLGERLSLEPKLEESRRg40346079 DRLSLLSPRLECNGMI LAHCKLRLPGFKRFSC LSLPSSWDYRHVPPRQVHFVFSVETGFHRAGQ AGLELLTSSVPPTSAF PKCWDYRRDDQAWPTLSSFRGLNKFAFLPKFF AHPISQFQRVECNVGC PILLAMKYLAYSSLPGADTMLYFYFYEQEASL AVCNICRQKFHWVLYQ ISHLYRGVIVDNFLLHPDGRFTWTIFFLSWVK QNSLVDFFFGTESRSV ALLPRLECSGAMSTLHTVLRPAYSHIYHPDVK EKTHFLGNVFNKRKLQ KKILKTPNPLCALHSAPSPSLPPFLRCTGRLP FYLGLDDFLFVAGALM FLPVSFLNPHTLTWPPQCCTRSDCNPLRGQRE ISALSHSLPTGLSMPLg420023480 MAALYACTKCHQRFPF EALSQGQQLCKECRIA HPVVKCTYCRTEYQQERLECNGTISAHCNLHL PGSSDSPASSSRVAGI TGIKTNTICKKCAQNVQLYGTPKPCQYCNIIA AFIGNKCQRCTNSEKK YGPPYSCEQCKQQCAFDRKDDRKKVDGKLLCW LCTLSYKRVLQKTKEQ RKHLSSSSRAGHQEKEQYSRLSGGGHYNSQKT LSTSSIQNEIPKKKSK FESITTNGDSFSPDLALDSPGTDHFVIIAQLK EEVATLKKMLHQKDQM ILEKEKKITELKADFQYQESQMRAKMNQMEKT HKEVTEQLQAKNRELL KQAAALSKSKKSEKSGAITSPg420023881 MAALYACTKCHQRFPF EALSQGQQLCKECRIA HPVVKCTYCRTEYQQERLECNGTISAHCNLHL PGSSDSPASSSRVAGI TGIKTNTICKKCAQNVQLYGTPKPCQYCNIIA AFIGNKCQRCTNSEKK YGPPYSCEQCKQQCAFDRKDDRKKVDGKLLCW LCTLSYKRVLQKTKEQ RKHLSSSSRAGHQEKEQYSRLSGGGHYNSFSP DLALDSPGTDHFVIIA QLKEEVATLKKMLHQKDQMILEKEKKITELKA DFQYQESQMRAKMNQM EKTHKEVTEQLQAKNR
ELLKQAAALSKSKKSE KSGAITSPg42314982 FFFFFFETESCSVAEA GVQWCDLGSLKSPPPG SSDSPASASRVAGITGMHHHTQLIFVFLVETG SHMQLSDSTLVITTAQ NAKITARAPRDLFFFFFFFFg433640183 LPLLPRMECRGMISAH CNLCRSGSSDSPASAS RVAGITGTCHHAQLSFPFFLFMRWg433640284 LPLLPRMECRGMISAH CNLCRSGSSDSPASAS RVAGITGTCHHAQLg437909885 MDIEDEENMSSSSTDV KENRNLDNVSPKDGST PGPGEGSQLSNGGGGGPGRKRPLEEGSNGHSK YRLKKRRKTPGPVLPK NALMQLNEIKPGLQYTLLSQTGPVHAPLFVMS VEVNGQVFEGSGPTKK KAKLHAAEKALRSFVQFPNASEAHLAMGRTLS VNTDFTSDQADFPDTL FNGFETPDKAEPPFYVGSNGDDSFSSSGDLSL SASPVPASLAQPPLPV LPPFPPPSGKNPVMILNELRPGLKYDFLSESG ESHAKSFVMSVVVDGQ FFEGSGRNKKLAKARAAQSALAAIFNLHLDQT PSRQPIPSEGLQLHLP QVLADAVSRLVLGKFGDLTDNFSSPHARRKVL AGVVMTTGTDVKDAKV ISVSTGTKCINGEYMSDRGLALNDCHAEIISR RSLLRFLYTQLELYLN NKDDQKRSIFQKSERGGFRLKENVQFHLYIST SPCGDARIFSPHEPIL EGSRSYTQAGVQWCNHGSLQPRPPGLLSDPST STFQGAGTTEPADRHP NRKARGQLRTKIESGEGTIPVRSNASIQTWDG VLQGERLLTMSCSDKI ARWNVVGIQGSLLSIFVEPIYFSSIILGSLYH GDHLSRAMYQRISNIE DLPPLYTLNKPLLSGISNAEARQPGKAPNFSV NWTVGDSAIEVINATT GKDELGRASRLCKHALYCRWXaAACARQGSLPLT TLQDYQAQRVPg450460186 MLLSQNAFIVRSLNLV LMVYISLVFGISYDSP DYTDESCTFKISLRNFRSILSWELKNHSIVPT HYTLLYTIMSKPEDLK VVKNCANTTRSFCDLTDEWRSTHEAYVTVLEG FSGNTTLFSCSHNFWL AIDMSFEPPEFEIVGFTNHINVMVKFPSIVEE ELQFDLSLVIEEQSEG IVKKHKPEIKGNMSGNFTYIIDKLIPNTNYCV SVYLEHSDEQAVIKSP LKCTLLPPGQESESAESAKIGGIITVFLIALV LTSTIVTLKWIGYICL RNSLPKVLRQGLTKGWNAVAIHRCSHNALQSE TPELKQSSCLSFPSSW DYKRASLCPSDg450727787 MPLAAYCYLRVVGKGS YGEVTLVKHRRDGKQY VIKKLNLRNASSRERRAAEQEAQLLSQLKHPN IVTYKESWEGGDGLLY IVMGFCEGGDLYRKLKEQKGQLLPENQVVEWF VQIAMALQYLHEKHIL HRDLKTQNVFLTRTNIIKVGDLGIARVLENHC DMASTLIGTPYYMSPE LFSNKPYNYKSDVWALGCCVYEMATLKHAFNA KDMNSLVYRIIEGKLP AMPRDYSPELAELIRTMLSKRPEERPSVRSIL RQPYIKRQISFFLEAT KIKTSKNNIKNGDSQSKPFATVVSGEAESNHE VIHPQPLSSEGSQTYI MGEGKCLSQEKPRASGLLKSPASLKAHTCKQD LSNTTELATISSVNID ILPAKGRDSVSDGFVQENQPRYLDASNELGGI CSISQVEEEMLQDNTK SSAQPENLIPMWSSDIVTGEKNEPVKPLQPLI KEQKPKDQSLALSPKL ECSGTILAHSNLRLLG
SSDSPASASRVAGITG VCHHAQDQVAGECIIE KQGRIHPDLQPHNSGSEPSLSRQRRQKRREQT EHRGEKRQVRRDLFAF QESPPRFLPSHPIVGKVDVTSTQKEAENQRRV VTGSVSSSRSSEMSSS KDRPLSARERRRLKQSQEEMSSSGPSVRKASL SVAGPGKPQEEDQPLP ARRLSSDCSVTQERKQIHCLSEDELSSSTSST DKSDGDYGEGKGQTNE INALVQLMTQTLKLDSKESCEDVPVANPVSEF KLHRKYRDTLILHGKV AEEAEEIHFKELPSAIMPGSEKIRRLVEVLRT DVIRGLGVQLLEQVYD LLEEEDEFDREVRLREHMGEKYTTYSVKARQL KFFEENMNFg450768588 MMAALYPSTDLSGASS SSLPSSPSSSSPNEVM ALKDVREVKEENTLNEKLFLLACDKGDYYMVK KILEENSSGDLNINCV DVLGRNAVTITIENENLDILQLLLDYGCQKLM ERIQNPEYSTTMDVAP VILAAHRNNYEILTMLLKQDVSLPKPHAVGCE CTLCSAKNKKDSLRHS RFRLDIYRCLASPALIMLTEEDPILRAFELSA DLKELSLVEVEFRNDY EELARQCKMFAKDLLAQARNSRELEVILNHTS SDEPLDKRGLLEERMN LSRLKLAIKYNQKEFVSQSNCQQFLNTVWFGQ MSGYRRKPTCKKIMTV LTVGIFWPVLSLCYLIAPKSQFGRIIHTPFMK FIIHGASYFTFLLLLN LYSLVYNEDKKNTMGPALERIDYLLILWIIGM IWSDIKRLWYEGLEDF LEESRNQLSFVMNSLYLATFALKVVAHNKFHD FADRKDWDAFHPTLVA EGLFAFANVLSYLRLFFMYTTSSILGPLQISM GQMLQDFGKFLGMFLL VLFSFTIGLTQLYDKGYTSKEQKDCVGIFCEQ QSNDTFHSFIGTCFAL FWYIFSLAHVAIFVTRFSYGEELQSFVGAVIV GTYNVVVVIVLTKLLV AMLHKSFQLIANHEDKEWKFARAKLWLSYFDD KCTLPPPFNI IPSPKT ICYMISSLSKWICSHTSKGKVKRQNSLKEWRN LKQKRDENYQKVMCCL VHRYLTSMRQKMQSTDQATVENLNELRQDLSK FRNEIRDLLGFRTSKY AMFYPRNg450768789 MEGSPSLRRMTVMREK GRRQAVRGPAFMFNDR GTSLTAEEERFLDAAEYGNIPVVRKMLEESKT LNVNCVDYMGQNALQL AVGNEHLEVTELLLKKENLARIGDALLLAISK GYVRIVEAILNHPGFA ASKRLTLSPCEQELQDDDFYAYDEDGTRFSPD ITPIILAAHCQKYEVV HMLLMKGARIERPHDYFCKCGDCMEKQRHDSF SHSRSRINAYKGLASP AYLSLSSEDPVLTALELSNELAKLANIEKEFK NDYRKLSMQCKDFVVG VLDLCRDSEEVEAILNGDLESAEPLEVHRHKA SLSRVKLAIKYEVKKF VAHPNCQQQLLTIWYENLSGLREQTIAIKCLV VLVVALGLPFLAIGYW IAPCSRLGKILRSPFMKFVAHAASFIIFLGLL VFNASDRFEGITTLPN ITVTDYPKQIFRVKTTQFTWTEMLIMVWVLGM MWSECKELWLEGPREY ILQLWNVLDFGMLSIFIAAFTARFLAFLQATK AQQYVDSYVQESDLSE VTLPPEIQYFTYARDKWLPSDPQIISEGLYAI AVVLSFSRIAYILPAN ESFGPLQISLGRTVKDIFKFMVLFIMVFFAFM IGMFILYSYYLGAKVN AAFTTVEESFKTLFWSIFGLSEVTSVVLKYDH KFIENIGYVLYGIYNV TMVVVLLNMLIAMINSSYQEIEDDSDVEWKFA RSKLWLSYFDDGKTLP PPFSLVPSPKSFVYFIMRIVNFPKCRRRRLQK DIEMGMGNSKSRLNLF TQSNSRVFESHSFNSILNQPTRYQQIMKRLIK RYVLKAQVDKENDEVN EGELKEIKQDISSLRYELLEDKSQATEELAIL IHKLSEKLNPSMLRCE
g488537390 MSETVPPAPAASAAPE KPLAGKKAKKPAKAAA ASKKKPAGPSVSELIVQAASSSKERGGVSLAA LKKALAAAGYDVEKNN SRIKLGIKSLVSKGTLVQTKGTGASGSFKLNK KASSVETKPGASKVAT KTKATGASKKLKKATGASKKSVKTPKKAKKPA ATRKSSKNPKKPKTVK PKKVAKSPAKAKAVKPKAAKARVTKPKTAKPK KAAPKKKg573010291 MSQSPAFGPRRGSSPR GAAGAAARRNESQDYL LMDSELGEDGCPQAPLPCYGYYPCFRGSDNRL AHRRQTVLREKGRRLA NRGPAYMFSDRSTSLSIEEERFLDAAEYGNIP VVRKMLEECHSLNVNC VDYMGQNALQLAVANEHLEITELLLKKENLSR VGDALLLAISKGYVRI VEAILSHPAFAEGKRLATSPSQSELQQDDFYA YDEDGTRFSHDVTPII LAAHCQEYEIVHTLLRKGARIERPHDYFCKCN DCNQKQKHDSFSHSRS RINAYKGLASPAYLSLSSEDPVMTALELSNEL AVLANIEKEFKNDYKK LSMQCKDFVVGLLDLCRNTEEVEAILNGDVET LQSGDHGRPNLSRLKL AIKYEVKKFVAHPNCQQQLLSIWYENLSGLRQ QTMAVKFLVVLAVAIG LPFLALIYWFAPCSKMGKIMRGPFMKFVAHAA SFTIFLGLLVMNAADR FEGTKLLPNETSTDNAKQLFRMKTSCFSWMEM LIISWVIGMIWAECKE IWTQGPKEYLFELWNMLDFGMLAIFAASFIAR FMAFWHASKAQSIIDA NDTLKDLTKVTLGDNVKYYNLARIKWDPSDPQ IISEGLYAIAVVLSFS RIAYILPANESFGPLQISLGRTVKDIFKFMVI FIMVFVAFMIGMFNLY SYYIGAKQNEAFTTVEESFKTLFWAIFGLSEV KSVVINYNHKFIENIG YVLYGVYNVTMVIVLLNMLIAMINSSFQEIED DADVEWKFARAKLWFS YFEEGRTLPVPFNLVPSPKSLFYLLLKLKKWI SELFQGHKKGFQEDAE MNKINEEKKLGILGSHEDLSKLSLDKKQVGHN KQPSIRSSEDFHLNSF NNPPRQYQKIMKRLIKRYVLQAQIDKESDEVN EGELKEIKQDISSLRY ELLEEKSQNTEDLAELIRELGEKLSMEPNQEE TNRg580223493 SRDPPASASQVTGIRg600586894 MASLSRALRVAAAHPR QSPTRGMGPCNLSSAA GPTAEKSVPYQRTLKEGQGTSVVAQGPSRPLP STANVVVIGGGSLGCQ TLYHLAKLGMSGAVLLERERLTSGTTWHTAGL LWQLRPSDVEVELLAH TRRVVSRELEEETGLHTGWIQNGGLFIASNRQ RLDEYKRLMSLGKAYG VESHVLSPAETKTLYPLMNVDDLYGTLYVPHD GTMDPAGTCTTLARAA SARGAQVIENCPVTGIRVWTDDFGVRRVAGVE TQHGSIQTPCVVNCAG VWASAVGRMAGVKVPLVAMHHAYVVTERIEGI QSFTLLPTLEYSGTVS AHCNLRLPGSSNSRASASHVAGIKCARHHTRL IFFCILVETEFHHVAK AGLELLSSGNPPISDFQSARITGVSHHAg60496995 LLWVLLWATVLGLLCQ RLAARLGVVTGKDLGE VCHLYYPKSESRSVAQSGVQWCDVSSLQPLPP RCPAPSSGg6650810 96 METESGSVAQAGVQWH NLGSLQPPPSRLKQLS YLSLPSSWDYRCTPPHPANFLYFNRDGISPCC PGWSPTPKLTQSTHLG LSKC
g666559497 MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASVKKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYVGDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDITPIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRHSRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSEYEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLARLKLAIKYRQKEFVAQP NCQQLLASRWYDEFPG WRRRHWAVKMVTCFIIGLLFPVFSVCYLIAPK SPLGLFIRKPFIKFIC HTASYLTFLFLLLLASQHIDRSDLNRQGPPPT IVEWMILPWVLGFIWG EIKQMWDGGLQDYIHDWWNLMDFVMNSLYLAT ISLKIVAFVKYSALNP RESWDMWHPTLVAEALFAIANIFSSLRLISLF TANSHLGPLQISLGRM LLDILKFLFIYCLVLLAFANGLNQLYFYYEET KGLTCKGIRCEKQNNA FSTLFETLQSLFWSIFGLINLYVTNVKAQHEF TEFVGATMFGTYNVIS LVVLLNMLIAMMNNSYQLIADHADIEWKFART KLWMSYFEEGGTLPTP FNVIPSPKSLWYLIKWIWTHLCKKKMRRKPES FGTIGRRAADNLRRHH QYQEVMRNLVKRYVAAMIRDAKTEEVARQQAA GPLERNIQLESRGLAS RGDLSIPGLSEQCVLVDHRERNTDTLGLQVGK RVCPFKSEKVVVEDTV PIIPKEKHAKEEDSSIDYDLNLPDTVTHEDYV TTRLg666559698 MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASVKKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYVGDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDITPIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRHSRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSEYEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLARLKLAIKYRQKEFVAQP NCQQLLASRWYDEFPG WRRRHWAVKMVTCFIIGLLFPVFSVCYLIAPK SPLGLFIRKPFIKFIC HTASYLTFLFLLLLASQHIDRSDLNRQGPPPT IVEWMILPWVLGFIWG EIKQMWDGGLQDYIHDWWNLMDFVMNSLYLAT ISLKIVAFVKYSALNP RESWDMWHPTLVAEALFAIANIFSSLRLISLF TANSHLGPLQISLGRM LLDILKFLFIYCLVLLAFANGLNQLYFYYEET KGLTCKGIRCEKQNNA FSTLFETLQSLFWSIFGLINLYVTNVKAQHEF TEFVGATMFGTYNVIS LVVLLNMLIAMMNNSYQLIARRAADNLRRHHQ YQEVMRNLVKRYVAAM IRDAKTEEGLTEENFKELKQDISSFRFEVLGL LRGSKLSTIQSANASK ESSNSADSDEKSDSEEEVARQQAAGPLERNIQ LESRGLASRGDLSIPG LSEQCVLVDHRERNTDTLGLQVGKRVCPFKSE KVVVEDTVPIIPKEKH AKEEDSSIDYDLNLPDTVTHEDYVTTRLg669016799 MRTKSEREIHLCVLGF FXFFFETGSRSVAQAG VQRHSHGSLQPRPPGLIQFSHLSLPSSWDYRH APPHLVNFLg6690252100RFFFFFFFEESRSFAQ AGVQWRYLGSLQPPPP GFTRFSCLSLLSSWDYRRPPPRPANFLYFg7243280101ELSFPLLSLDFGAHQG LGSADMGDMKTPDFDD LLAAFDIPDIDANEAI
HSGPEENEGPGGPGKP EPGVGSESEDTAAASA GDGPGVPAQASDHGLPPPDISVVSVIVKNTVC PEQSEALAGGSAGDGA QAAGVTKEGPVGPHRMQNGFGSPEPSLPGTPH SPAPPSGGTWKEKGME GKTPLDLFAHFGPEPGDHSDPLPPSAPSPTRE GALTPPPFPSSFELAQ ENGPGMQPPVSSPPLGALKQESCSPHHPQVLA QQGSGSSPKATDIPAS ASPPPVAGVPFFKQSPGHQSPLASPKVPVCQP LKEEDDDEGPVDKSSP GSPQSPSSGAEAADEDSNDSPASSSSRPLKVR IKTIKTSCGNITRTVT QVPSDPDPPAPLAEGAFLAEASLLKLSPATPT SEGPKVVSVQLGDGTR LKGTVLPVATIQNASTAMLMAASVARKAVVLP GGTATSPKMIAKNVLG LVPQALPKADGRAGLGTGGQKVNGASVVMVQP SKTATGPSTGGGTVIS RTQSSLVEAFNKILNSKNLLPAYRPNLSPPAE AGLALPPTGYRCLECG DAFSLEKSLARHYDRRSMRIEVTCNHCARRLV FFNKCSLLLHAREHKD KGLVMQCSHLVMRPVALDQMVGQPDITPLLPV AVPPVSGPLALPALGK GEGAITSSAITTVAAEAPVLPLSTEPPAAPAT SAYTCFRCLECKEQCR DKAGMAAHFQQLGPPAPGATSNVCPTCPMMLP NRCSFSAHQRMHKNRP PHVCPECGGNFLQANFQTHLREACLHVSRRVG YRCPSCSVVFGGVNSI KSHIQTSHCEVFHKCPICPMAFKSGPSAHAHL YSQHPSFQTQQAKLIY KCAMCDTVFTHKPLLSSHFDQHLLPQRVSVFK CPSCPLLFAQKRTMLE HLKNTHQSGRLEETAGKGAGGALLTPKTEPEE LAVSQGGAAPATEESS SSSEEEEVPSSPEPPRPAKRPRRELGSKGLKG GGGGPGGWTCGLCHSW FPERDEYVAHMKKEHGKSVKKFPCRLCERSFC SAPSLRRHVRVNHEGI KRVYPCRYCTEGKRTFSSRLILEKHVQVRHGL QLGAQSPGRGTTLARG SSARAQGPGRKRRQSSDSCSEEPDSTTPPAKS PRGGPGSGGHGPLRYR SSSSTEQSLMMGLRVEDGAQQCLDCGLCFASP GSLSRHRFISHKKRRG VGKASALGLGDGEEEAPPSRSDPDGGDSPLPA SGGPLTCKVCGKSCDS PLNLKTHFRTHGMAFIRARQGAVGDNg7305597102MSQSPRFVTRRGGSLK AAPGAGTRRNESQDYL LMDELGDDGYPQLPLPPYGYYPSFRGNENRLT HRRQTILREKGRRLAN RGPAYMFNDHSTSLSIEEERFLDAVEYGNIPV VWKMLEECHSLNVNCV DYMGQNALQLAVANEHLEITELLLKKENLSRV GDALLLAISKGYVRIV EAILNHPSFAEGKRLATSPSQSELQQDDFYAY DEDGTRFSHDVTPIIL AAHCQEYEIVHTLLRKGARIERPHDYFCKCTE CSQKQKHDSFSHSRSR INAYKGLASPAYLSLSSEDPVMTALELSNELA VLANIEKEFKNDYRKL SMQCKDFVVGLLDLCRNTEEVEAILNGDAETR QPGDFGRPNLSRLKLA IKDEVKKFVAHPNCQQQLLSIWYENLSGLRQQ TMAVKFLVVLAVAIGL PFLALIYWCAPCSKMGKILPRPFMKFVAHAAS FTIFLGLLVMNAADRF EGTKLLPNETSTDNARQLFRMKTSCFSWMEML IISWVIGMIWAECKEI WTQGPKEYLFELWNMLDFGMLAIFAASFIARF MAFWHASKAQSIIDAN DTLKDLTKVTLGDNVKYYNLARIKWDPTDPQI ISEGLYAIAVVLSFSR IAYILPANESFGPLQISLGRTVKDIFKFMVIF IMVFVAFMIGMFNLYS YYIGAKQNEAFTTVEESFKTLFWAIFGLSEVK SVVINYNHKFIENIGY VLYGVYNVTMVIVLLNMLIAMINSSFQEIEDD ADVEWKFARAKLWFSY FEEGRTLPVPFNLVPSPKSLLYLLLKFKKWMC ELIQGQKQGFQEDAEM NKRNEEKKFGISGSHEDLSKFSLDKNQLAHNK QSSTRSSEDYHLNSFS NPPRQYQKIMKRLIKRYVLQAQIDKESDEVNE GELKEIKQDISSLRYE LLEEKSQNSEDLAELI
RKLGERLSLEPKLEES RRg7512448103GFLPATKNLLNEKNHG VLHTSVVLLTEMCERS PDMLAHFRENEKLVPQLVRILKNLIMSGYSPG HDVSGISDPFLQVRIL RLLRILGRNDDDSSEAMNDILAQVATNTETSK NVGNAILYETVLTIMD IKSESGLRVLAINILGRFLLNNDKNIRYVALT SLLKTVQTDHNAVQRH RSTIVDCLKDLDVSIKRRAMELSFALVNGNNI RGMMKELLYFLDSCEP EFKADCASGIFLAAEKYAPSKRWHIDTIMRVL TTAGSYVRDDAVPNLI QLITNSVEMHAYTVQRLYKAILGDYSQQPLVQ VAAWCIGEYGDLLVSG QCEEEEPIQVTEDEVLDILESVLISNMSTSVT RGYALTAIMKLSTRFT CTVNRIKKVVSIYGSSIDVELQRRAVEYNALF KKYDHMRSALLERMPV MEKVTTNGPTEIVQTNGETEPAPLETKPPPSG PQPTSQANDLLDLLGG NDITPVIPTAPTSKPSSAGGELLDLLGDINLT GSHSVSQAGVQWDYLG SLQPLPPAFRg7522630104MWPNGSSLGPCFRPTN ITLEERRLIASPWFAA SFCVVGLASNLLALSVLAGARQGGSHTRSSFL TFLCGLVLTDFLGLLV TGTIVVSQHAALFEWHAVDPGCRLCRFMGVVM IFFGLSPLLLGAAMAS ERYLGITRPFSRPAVASQRRAWATVGLVWAAA LALGLLPLLGVGRYTV QYPGSWCFLTLGAESGDVAFGLLFSMLGGLSV GLSFLLNTVSVATLCH VYHGQEAAQQRPRDSEVEMMAQLLGIMVVASV CWLPLLVFIAQTVLRN PPAMSPAGQLSRTTEKELLIYLRVATWNQILD PWVYILFRRAVLRRLQ PRLSTRPRRSLTLWPSLEYSGTISAHCNLRLP GSSDSRASASRAAG IT GVSHCARPCMLFDPEFDLLAGVQLLPFEPPTG KALSRKDg7669477105MDIEDEENMSSSSTDV KENRNLDNVSPKDGST PGPGEGSQLSNGGGGGPGRKRPLEEGSNGHSK YRLKKRRKTPGPVLPK NALMQLNEIKPGLQYTLLSQTGPVHAPLFVMS VEVNGQVFEGSGPTKK KAKLHAAEKALRSFVQFPNASEAHLAMGRTLS VNTDFTSDQADFPDTL FNGFETPDKAEPPFYVGSNGDDSFSSSGDLSL SASPVPASLAQPPLPV LPPFPPPSGKNPVMILNELRPGLKYDFLSESG ESHAKSFVMSVVVDGQ FFEGSGRNKKLAKARAAQSALAAIFNLHLDQT PSRQPIPSEGLQLHLP QVLADAVSRLVLGKFGDLTDNFSSPHARRKVL AGVVMTTGTDVKDAKV ISVSTGTKCINGEYMSDRGLALNDCHAEIISR RSLLRFLYTQLELYLN NKDDQKRSIFQKSERGGFRLKENVQFHLYIST SPCGDARIFSPHEPIL EGSRSYTQAGVQWCNHGSLQPRPPGLLSDPST STFQGAGTTEPADRHP NRKARGQLRTKIESGEGTIPVRSNASIQTWDG VLQGERLLTMSCSDKI ARWNVVGIQGSLLSIFVEPIYFSSIILGSLYH GDHLSRAMYQRISNIE DLPPLYTLNKPLLSGISNAEARQPGKAPNFSV NWTVGDSAIEVINATT GKDELGRASRLCKHALYCRWMRVHGKVPSHLL RSKITKPNVYHESKLA AKEYQAAKARLFTAFIKAGLGAWVEKPTEQDQ FSLTPg7669479106MDIEDEENMSSSSTDV KENRNLDNVSPKDGST PGPGEGSQLSNGGGGGPGRKRPLEEGSNGHSK YRLKKRRKTPGPVLPK NALMQLNEIKPGLQYTLLSQTGPVHAPLFVMS VEVNGQVFEGSGPTKK KAKLHAAEKALRSFVQFPNASEAHLAMGRTLS VNTDFTSDQADFPDTL FNGFETPDKAEPPFYV
GSNGDDSFSSSGDLSL SASPVPASLAQPPLPV LPPFPPPSGKNPVMILNELRPGLKYDFLSESG ESHAKSFVMSVVVDGQ FFEGSGRNKKLAKARAAQSALAAIFNLHLDQT PSRQPIPSEGLQLHLP QVLADAVSRLVLGKFGDLTDNFSSPHARRKVL AGVVMTTGTDVKDAKV ISVSTGTKCINGEYMSDRGLALNDCHAEIISR RSLLRFLYTQLELYLN NKDDQKRSIFQKSERGGFRLKENVQFHLYIST SPCGDARIFSPHEPIL EGSRSYTQAGVQWCNHGSLQPRPPGLLSDPST STFQGAGTTEPADRHP NRKARGQLRTKIESGEGTIPVRSNASIQTWDG VLQGERLLTMSCSDKI ARWNVVGIQGSLLSIFVEPIYFSSIILGSLYH GDHLSRAMYQRISNIE DLPPLYTLNKPLLSGISNAEARQPGKAPNFSV NWTVGDSAIEVINATT GKDELGRASRLCKHALYCRWMRVHGKVPSHLL RSKITKPNVYHESKLA AKEYQAAKVHg7770147107MEVLLFLFIFETESCS VIRLECSGSLQPPPPR FKQFSCLSLPSSWDYRCPPPCPINFCIFGTDR VSPCWPGWSRSRg7706747108MAQFYYKRNVNAPYRD RIPLRIVRAESELSPS EKAYLNAVEKGDYASVKKSLEEAEIYFKININ CIDPLGRTALLIAIEN ENLELIELLLSFNVYVGDALLHAIRKEVVGAV ELLLNHKKPSGEKQVP PILLDKQFSEFTPDITPIILAAHTNNYEIIKL LVQKGVSVPRPHEVRC NCVECVSSSDVDSLRHSRSRLNIYKALASPSL IALSSEDPFLTAFQLS WELQELSKVENEFKSEYEELSRQCKQFAKDLL DQTRSSRELEIILNYR DDNSLIEEQSGNDLARLKLAIKYRQKEFVAQP NCQQLLASRWYDEFPG WRRRHWAVKMVTCFIIGLLFPVFSVCYLIAPK SPLGLFIRKPFIKFIC HTASYLTFLFLLLLASQHIDRSDLNRQGPPPT IVEWMILPWVLGFIWG EIKQMWDGGLQDYIHDWWNLMDFVMNSLYLAT ISLKIVAFVKYSALNP RESWDMWHPTLVAEALFAIANIFSSLRLISLF TANSHLGPLQISLGRM LLDILKFLFIYCLVLLAFANGLNQLYFYYEET KGLTCKGIRCEKQNNA FSTLFETLQSLFWSIFGLINLYVTNVKAQHEF TEFVGATMFGTYNVIS LVVLLNMLIAMMNNSYQLIADHADIEWKFART KLWMSYFEEGGTLPTP FNVIPSPKSLWYLIKWIWTHLCKKKMRRKPES FGTIGRRAADNLRRHH QYQEVMRNLVKRYVAAMIRDAKTEEGLTEENF KELKQDISSFRFEVLG LLRGSKLSTIQSANASKESSNSADSDEKSDSE GNSKDKKKNFSLFDLT TLIHPRSAAIASERHNISNGSALVVQEPPREK QRKVNFVTDIKNFGLF HRRSKQNAAEQNANQIFSVSEEVARQQAAGPL ERNIQLESRGLASRGD LSIPGLSEQCVLVDHRERNTDTLGLQVGKRVC PFKSEKVVVEDTVPII PKEKHAKEEDSSIDYDLNLPDTVTHEDYVTTR Lg8922960109MESYSVTQAGVQWHEL CSLQPSPPRFREMCIE QDGRVHLTVVYFGKEEINEVKGVLENTSKAAN FRNFTFIQLNGEFSRG KGLDVGARFWKGSNVLLFFCDVDIYFTSEFLN TCRLNTQPGKKVFYPV LFSQYNPGIIYGHHDAVPPLEQQLVIKKETGF WRDFGFGMTCQYRSDF INIGGFDLDIKGWGGEDVHLYRKYLHSNLIVV RTPVRGLFHLWHEKRC MDELTPEQYKMCMQSKAMNEASHGQLGMLVFR HEIEAHLRKQKQKTSS KKTg8923251110MDITLVRKELQELQNL YKQNSTHTAQQAELIQ QLQVLNMDTQKVLRNQ
EDVHTAESISYQKLYN ELHICFETTKSNEAML RQSVTNLQDQLLQKEQENAKLKEKLQESQGAP LPLPQESDPDYSAQVP HRPSLSSLETLMVSQKSEIEYLQEKLKIANEK LSENISANKGFSRKSI MTSAEGKHKEPPVKRSRSLSPKSSFTDSEELQ KLRKAERKIENLEKAL QLKSQENDELRDAHEKRKERLQMLQTNYRAVK EQLKQWEEGSGMTEIR KIKRADPQQLRQEDSDAVWNELAYFKRENQEL MIQKMNLEEELDELKV HISIDKAAIQELNRCVAERREEQLFRSGEDDE VKRSTPEKNGKEMLEQ TLQKVIELENRLKSFEKRSRKLKEGNKKLMKE NDFLKSLLKQQQEDTE TREKELEQIIKGSKDVEKENTELQVKISELET EVTSLRRQVAEANALR NENEELINPMEKSHQSADRAKSEMATMKVRSG RYDCKTTMTKVKFKAA KKNCSVGRHHTVLNHSIKVMSNVFENLSKDGW EDVSESSSDSEAQTSQ TLGTIIVETSQKISPTEDGKDQKESDPTEDSQ TQGKEIVQTYLNIDGK TPKDYFHDKNAKKPTFQKKNCKMQKSSHTAVP TRVNREKYKNITAQKS SSNIILLRERIISLQQQNSVLQNAKKTAELSV KEYKEVNEKLLHQQQV SDQRFQTSRQTIKKLNLDLAGLRKEKEDLLKK LESSSEITSLAEENSQ VTFPRIQVTSLSPSRSMDLEMKQLQYKLKNAT NELTKQSSNVKTLKFE LLAKEEHIKEMHEKISRMERDITMKRHLIEDL KFRQKVNLESNKSFSE MLQNLDKKVKTLTEECSNKKVSIDSLKQRLNV AVKEKSQYEQMYQKSK EELEKKDLKLTLLVSRISETESAMAEIETAAS KQLQELALQSEQVLEG AQKTLLLANEKVEEFTTFVKALAKELQNDVHV VRRQIRELKKMKKNRD ACKTSTHKAQTLAASILNISRSDLEEILDTED QVEIEKTKIDAENDKE WMLYIQKLLEGQSLTLSPRLKCNGAIMAHQNL RLPDSSSSASASg8923273111MKVVPEKNAVRILWGR ERGARAMGAQRLLQEL VEDKTRWMKWEGKRVELPDSPRSTFLLAFSPD RTLLASTHVNHNIYIT EVKTGKCVHSLIGHRRTPWCVTFHPTISGLIA SGCLDGEVRIWDLHGG SESWFTDSNNAIASLAFHPTAQLLLIATANEI HFWDRSRREPFAVVKT ASEMERVRLVRFDPLGHYLLTAIVNPSNQQGD DEPEIPIDGTELSHYR QRALLQSQPVRRTPLLHNFLHMLSSRSSGIQT EPFHPPEQASSTQQDQ GLLNRPSAFSTVQSSTAGNTLRNLSLGPTRRS LGGPLSSHPSRYHREI APGLTGSEWTRTVLSLNSRSEAESMPPPRTSA SSVSLLSVLRQQEGGS QASVYTSATEGRGFPASGLATESDGGNGSSQN NSGSIRHELQCDLRRF FLEYDRLQELDQSLSGEAPQTQQAQEMLNNNI ESERPGPSHQPTPHSS ENNSNLSRGHLNRCRACHNLLTFNNDTLRWER TTPNYSSGEASSSWQV PSSFESVPSSGSQLPPLERTEGQTPSSSRLEL SSSASPQEERTVGVAF NQETGHWERIYTQSSRSGTVSQEALHQDMPEE SSEEDSLRRRSLALSP RLEYSGAILAHCKLRLPGSCHSPASASQVAGT TGAHHHARLIFAFLVE MEFHHVSQAGLELLTSGDLPTSASQVLGLQAg8923360112MVHSPRSLVANPSQVL FFLSFLFFFFLRQSFA LVAQAGVQWRNLGSLQPPPPGFKQFSCLSLLS SWDYRHAPPCPAYFVF LVDMGFPHVGQTGLELLTSGDPPASASQSAGI TGGSHRAQPTSSNPYG IVFFFLPVKTFSGMSQEAGDCRETg8923452113MPTATGLTLLTSASSA ISDPGGEVSAPWGGLR TWTQPLRCWERLLPPP
GDPRTVAENTQQDECG LPGSCPARPLSRKPEC GREGILPCCSSSAWPEGSFRPFQMNLFSFLSF FFLFFFFLRWSLTLSP RLECSSAISAHCNLRLPGSSNSPALASQVAGI TGICHHARQIFVFLVE TGFCHVGQAGLELLISGDSPASAFQSAGIIGV SHRARPGSVFLARSEE SLYLRPGQQSQEVKVg8923454114MLLVDADQPEPMRSGA RELALFLTPEPGAEAK EVEETIEGMLLRLEEFCSLADLIRSDTSQILE ENIPVLKAKLTEMRGI YAKVDRLEAFVKMVGHHVAFLEADVLQAERDH GAFPQALRRWLGSAGL PSFRNVECSGTIPARCNLRLPGSSDSPASASQ VAGITEVTCTGARDVR AAHTVg8923691115MSVYSGKVLLQTTPPH VIGQLDKLIREVSTLD GVLEVRNEHFWTLGFGSLAGSVHVRIRRDANE QMVLAHVTNRLYTLVS TLTVQIFKDDWIRPALLSGPVAANVLNFSDHH VIPMPLLKGTDGLNPY VHFLWKINFFLFFDMESLSVAQAGVQWHDLGS LQPHLPGSSNSACLSL PSSWDYRHAPPHLPNFCIISKDGVLPCWPCWSg8924071116MESRSVAQTGVHWHNL SSLQPLPPRFKQFSCL SLRSSWDYTHLPPCLANFFVFLVETAFRHVGQ AGLKLLTSGDQPTSAS QSAGITGISHRTQPVGRFLITDSIFLFVTDLL KFSISSg8924204117MSKVLGGPFSKGHTAS DKYFQIFHNISFFETE SCSVAQAGVQWCNLGSLQALPPRFTPFSCLSL PSSWDYRHPPPCPDNV FVFSVETGFHCVSQDGLNLLTLg8980667118MAQGTLIRVTPEQPTH AVCVLGTLTQLDICSS APEDCTSFS INASPGVVVDIAHSPPAKKKSTG SSTWPLDPGVEVTLTM KAASGSTGDQKVQISYYGPKTPPVKALLYLTA VDGVSPCHPGWSAMHD LAHCNLRLQVQAILCFSVPSSWTTGACHHAWL IFVFLVEMEFHHVGQA GLELLTSGDLPASGSQSARITGMNHCARPSIF LILKYLg9716913119MSQSPAFGPRRGSSPR GAAGAAARRNESQDYL LMDSELGEDGCPQAPLPCYGYYPCFRGSDNRL AHRRQTVLREKGRRLA NRGPAYMFSDRSTSLSIEEERFLDAAEYGNIP VVRKMLEECHSLNVNC VDYMGQNALQLAVANEHLEITELLLKKENLSR VGDALLLAISKGYVRI VEAILSHPAFAEGKRLATSPSQSELQQDDFYA YDEDGTRFSHDVTPII LAAHCQEYEIVHTLLRKGARIERPHDYFCKCN DCNQKQKHDSFSHSRS RINAYKGLASPAYLSLSSEDPVMTALELSNEL AVLANIEKEFKNDYKK LSMQCKDFVVGLLDLRRNTEEVEAILNGDVET LQSGDHGRPNLSRLKL AIKYEVKKMGKIMRGPFMKFVAHAASFTIFLG LLVMNAADRFEGTKLL PNETSTDNAKQLFRMKTSCFSWMEMLIISWVI GMIWAECKEIWTQGPK EYLFELWNMLDFGMLAIFAASFIARFMAFWHA SKAQSIIDANDTLKDL TKVTLGDNVKYYNLARIKWDPSDPQIISEGLY AIAVVLSFSRIAYTLP ANESFGPLQISLGRTVKDIFKFMVIFIMVFVA FMIGMFNLYSYYIGAK QNEAFTTVEESFKTLFWAIFGLSEVKSVVINY NHKFIENIGYVLYGVY NVTMVIVLLNMLIAMINSSFQEIEDDADVEWK FARAKLWFSYFEEGRT LPVPFNLVPSPKSLFY
LLLKLKKWISELFQGH KKGFQEDAEMNKINEE KKLGILGSHEDLSKLSLDKKQVGHNKQPSIRS SEDFHLNSFNNPPRQY QKIMKRLIKRYVLQAQIDKESDEVNEGELKEI KQDISSLRYELLEEKS QNTEDLAELIRELGEKLSMEPNQEETNRg9966865120MLRNSTFKNMQRRHTT LREKGRRQAIRGpAYM FNEKGTSLTPEEERFLDSAEYGNIPVVRKMLE ESKTLNFNCVDYMGQN ALQLAVGNEHLEVTELLLKKENLARVGDALLL AISKGYVRIVEAILNH PAFAQGQRLTLSPLEQELRDDDFYAYDEDGTR FSHDITPIILAAHCQE YEIVHILLLKGARIERPHDYFCKCNECTEKQR KDSFSHSRSRMNAYKG LASAAYLSLSSEDPVLTALELSNELARLANIE TEFKNDYRKLSMQCKD FVVGVLDLCRDTEEVEAILNGDVNFQVWSDHH RPSLSRIKLAIKYEVK KFVAHPNCQQQLLTMWYENLSGLRQQSIAVKF LAVFGVSIGLPFLAIA YWIAPCSKLGRTLRSPFMKFVAHAVSFTIFLG LLVVNASDRFEGVKTL PNETFTDYPKQIFRVKTTQFSWTEMLIMKWVL GMIWSECKEIWEEGPR EYVLHLWNLLDFGMLSIFVASFTARFMAFLKA TEAQLYVDQHVQDDTL HNVSLPPEVAYFTYARDKWWPSDPQIISEGLY AIAVVLSFSRIAYILP ANESFGPLQISLGRTVKDIFKFMVIFIMVFVA FMIGMFNLYSYYRGAK YNPAFTTVEESFKTLFWSIFGLSEVISVVLKY DHKFIENIGYVLYGVY NVTMVVVLLNMLIAMINNSYQEIEEDADVEWK FARAKLWLSYFDEGRT LPAPFNLVPSPKSFYYLIMRIKMCLIKLCKSK AKSCENDLEMGMLNSK FKKTRYQAGMRNSENLTANNTLSKPTRYQKIM KRLIKRYVLKAQVDRE NDEVNEGELKEIKQDISSLRYELLEEKSQATG ELADLIQQLSEKFGKN LNKDHLRVNKGKDIg9967846121MDDGCPQLPLPPHGYY PSLRGTDNRLTHRRQT VLREKGRRLANRGPAYMFNDHSTTLSIEEERF LDAAEYGNIPVVRKML EECLSLNVNCVDYMGQNALQLAVANEHLEITE LLLKKENLSRVGDALL LAISKGYVRIVEAILSHPAFAEGKRLATSPSQ SELQQDDFYAYDEDGT RFSHDVTPIILAAHCQEYEIVHTLLRKGARIE RPHDYFCKCSECNQKQ KHDSFSHSRSRINAYKGLASPAYLSLSSEDPV MTALELSNELAVLANI EKEFKNDYKKLSMQCKDFVVGLLDLCRNTEEV EAILNGDVETCQSGDQ GRPNLSRLKLAIKYEVKKFVAHPNCQQQLLSI WYENLSGLRQQTMAVK FLVVLGVAIGLPFLALIYWCAPCSKMGKIMRG PFMKFVAHAASFTIFL GLLVMNAADRFEGTKLRPNETSTDNAKQLFRM KTSCFSWMEMLIISWV IGMIWAECKEIWAQGPKEYLFELWNMLDFGML AIFAASFIARFMAFWH ASKAQSIIDANDTLKDLTKVTLGEDVKYYNLA RIKWDPSDPQIISEGL YAIAVVLSFSRIAYILPANESFGPLQISLGRT VKDIFKFMVIFIMVFV AFMIGMFNLYSYYIGAKQNEAFTTVEESFKTL FWAIFGLSEVKSVVIN YNHKFIENIGYVLYGVYNVTMVIVLLNMLIAM INSSFQEIEDDADVEW KFARAKLWFSYFEEGRTLPVPFNLVPSPKSLL YLLLKFKKWGFELFQG HKKAFQEDAEMNKRNEEKKFGILGSHEDLSKL SVDKKQLGQNKQSSIR SSEDFHLNSFNNPPRQYQKIMKRLIKRYVLQA QIDKESDEVNEGELKE IKQDISSLRYELLEEKSQNTEDLAELIRKLGE KLSSEPKQEEINRg9967886122MFNDHSTTLSIEEERF LDAAEYGNIPVVRKML EECLSLNVNCVDYMGQ
NALQLAVANEHLEITE LLLKKENLSRVGDALL LAISKGYVRIVEAILSHPAFAEGKRLATSLSQ SELQQDDFYAYDEDGT RFSHDVTPIILAAHCQEYEIVHTLLRKGARIE RPHDYFCKCSECNQKQ KHDSFSHSRSRINAYKGLASPAYLSLSSEDPV MTALELSNELAVLANI EKEFKNDYKKLSMQCKDFVVGLLDLCRNTEEV EAILNGDIETCQPGDQ GRPNLSRLKLAIKYEVKKFVAHPNCQQQLLSI WYENLSGLRQQTMAVK FLVVLGVA IGLPFLALIYWCAPCSKMGKIMRG PFMKFVAHAASFTIFL GLLVMNAADRFEGTKLRPNETSTDNAKQLFRM KTSCFSWMEMLIISWV IGMVWAECKEIWAQGPKEYLFELWNMLDFGML AIFAASFIARFMAFWH ASKAQSIIDANDTLKDLTKVTLGEDVKYYNLA RIKWDPSDPQI ISEGL YAIAVVLSFSRIAYILPANESFGPLQISLGRT VKDIFKFMVIFIMVFV AFMIGMFNLYSHYIGAKQNEAFTTYVISDVLT MEIADg9967888123MDDGCPQLPLPPHGYY PSLRGTDNRLTHRRQT VLREKGRRLANRGPAYMFNDHSTTLSIEEERF LDAAEYGNIPVVRKML EECLSLNVNCVDYMGQNALQLAVANEHLEITE LLLKKENLSRVGDALL LAISKGYVRIVEAILSHPAFAEGKRLATSPSQ SELQQDDFYAYDEDGT RFSHDVTPIILAAHCQEYEIVHTLLRKGARIE RPHDYFCECSECNQKQ KHDSFSHSRSRINAYKGLASPAYLSLSSEDPV MTALELSNELAVLANI EKEFKNDYKKLSMQCKDFVVGLLDLCRNTEEV EAILNGDVETCQPGDQ GRPNLSRLKLAIKYEVKKFVAHPNCQQQLLSI WYENLSGLRQQTMAVK FLVVLGVAIGLPFLALIYWCAPCSKMGKIMRG PFMKFVAHAASFTIFL GLLVMNAADRFEGTKLRPNETSTDNAKQLFRM KTSCFSWMEMLIISWV IARIKWDPSDPQIISEGLYAIAVVLSFSRIAY ILPANESFGPLQISLG RTVKDIFKFMVIFIMVFVAFMIGMFHLYSYYI GAKQNEAFTTVEESFK TLFWAIFGLSEVKSVVINYNHKFIENIGYVLY GVYNVTMVIVLLNMLI AMINSSFQEIEDDADVEWKFARAKLWFSYFEE GRTLPVPFNLVPSPKS LLYLLLKFKKWGFELFQGHKKAFQEDAEMNKR NEEKKFGILGSHEDLS KLSVDKKQLGQNKQSSIRSSEDFHLNSFNNPP RQYQKIMKRLIKRYVL QAQIDKESDEVNEGELKEIKQDISSLRYELLE EKSQNTEDLAELIRKL GEKLSSEPKQEEINRg9716913124MSQSPAFGPRRGSSPR GAAGAAARRNESQDYL LMDSELGEDGCPQAPLPCYGYYPCFRGSDNRL AHRRQTVLREKGRRLA NRGPAYMFSDRSTSLSIEEERFLDAAEYGNIP VVRKMLEECHSLNVNC VDYMGQNALQLAVANEHLEITELLLKKENLSR VGDALLLAISKGYVRI VEAILSHPAFAEGKRLATSPSQSELQQDDFYA YDEDGTRFSHDVTPII LAAHCQEYEIVHTLLRKGARIERPHDYFCKCN DCNQKQKHDSFSHSRS RINAYKGLASPAYLSLSSEDPVMTALELSNEL AVLANIEKEFKNDYKK LSMQCKDFVVGLLDLRRNTEEVEAILNGDVET LQSGDHGRPNLSRLKL AIKYEVKKMGKIMRGPFMKFVAHAASFTIFLG LLVMNAADRFEGTKLL PNETSTDNAKQLFRMKTSCFSWMEMLIISWVI GMIWAECKEIWTQGPK EYLFELWNMLDFGMLAIFAASFIARFMAFWHA SKAQSIIDANDTLKDL TKVTLGDNVKYYNLARIKWDPSDPQIISEGLY AIAVVLSFSRIAYTLP ANESFGPLQISLGRTVKDIFKFMVIFIMVFVA FMIGMFNLYSYYIGAK QNEAFTTVEESFKTLFWAIFGLSEVKSVVINY NHKFIENIGYVLYGVY NVTMVIVLLNMLIAMINSSFQEIEDDADVEWK FARAKLWFSYFEEGRT LPVPFNLVPSPKSLFY
LLLKLKKWISELFQGH KKGFQEDAEMNKINEE KKLGILGSHEDLSKLSLDKKQVGHNKQPSIRS SEDFHLNSFNNPPRQY QKIMKRLIKRYVLQAQIDKESDEVNEGELKEI KQDISSLRYELLEEKS QNTEDLAELIRELGEKLSMEPNQEETNR本發(fā)明的NTP肽、相關(guān)蛋白、相關(guān)肽及其片段、變體、衍生物、同源物和模擬物可用此領(lǐng)域技術(shù)人員已知的方法制備,如重組DNA技術(shù)、蛋白質(zhì)合成和分離天然產(chǎn)生的NTP肽、相關(guān)蛋白、相關(guān)肽及其片段、變體、衍生物和同源物。
NTP肽、相關(guān)蛋白或相關(guān)肽可用熟知的重組DNA技術(shù)方法制備,如列于Sambrook等,(《分子克隆實(shí)驗(yàn)室手冊(cè)》(Molecular CloningA Laboratory Manual),Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.)和/或Ausubel等編,《新編分子生物學(xué)實(shí)驗(yàn)指南》(Current Protocols in Molecular Biology),GreenPublishers Inc.及Wiley和Sons,N.Y.的方法。
可獲得編碼NTP肽、相關(guān)蛋白或相關(guān)肽的基因或cDNA,例如通過篩選基因組或cDNA文庫(kù)或通過PCR擴(kuò)增。用于篩選文庫(kù)的探針或引物可在其它已知基因或基因片段序列信息的基礎(chǔ)上產(chǎn)生,這些基因或基因片段來(lái)自相同或相關(guān)基因家族,如在其它相關(guān)蛋白中發(fā)現(xiàn)的保守基序。此外,已鑒定了一種生物編碼NTP肽、相關(guān)蛋白或相關(guān)肽的基因,該基因的所有或一部分可用作探針來(lái)鑒定其它生物的同源基因。此種探針或引物可用于篩選認(rèn)為能表達(dá)NTP肽、相關(guān)蛋白或相關(guān)肽基因的多種組織來(lái)源的cDNA文庫(kù)。通常,可采用高嚴(yán)謹(jǐn)性條件來(lái)盡可能減少篩選獲得的假陽(yáng)性數(shù)量。
另一種制備編碼NTP肽、相關(guān)蛋白或相關(guān)肽的基因的方法采用化學(xué)合成,使用此領(lǐng)域技術(shù)人員熟知的方法,如Engels等(Angew.Chem.Intl.Ed.,28716-734)描述的方法。這些方法尤其包括磷酸三酯、亞磷酰胺、H-膦酸酯方法用于核酸合成。這種化學(xué)合成的優(yōu)選方法是用標(biāo)準(zhǔn)亞磷酰胺化學(xué)的聚合物-支持的合成。一般,編碼NTP肽、相關(guān)蛋白或相關(guān)肽的DNA長(zhǎng)度為幾百個(gè)核苷酸??捎眠@些方法將大于約100個(gè)核苷酸的核酸合成為幾個(gè)片段。然后可將這些片段連接在一起形成全長(zhǎng)NTP肽、相關(guān)蛋白或相關(guān)肽。通常,編碼此蛋白質(zhì)氨基末端的DNA片段具有編碼甲硫氨酸的ATG。此甲硫氨酸可以或可不存在于相關(guān)蛋白、相關(guān)肽或NTP肽的成熟形式中,這取決于宿主細(xì)胞中產(chǎn)生的蛋白質(zhì)是否設(shè)計(jì)成該細(xì)胞分泌的蛋白質(zhì)。
可將編碼相關(guān)蛋白、相關(guān)肽或NTP肽的基因、cDNA或其片段用標(biāo)準(zhǔn)連接技術(shù)插入合適的表達(dá)或擴(kuò)增載體中。通常選擇在所用具體宿主細(xì)胞中具有功能的載體(即載體與宿主細(xì)胞機(jī)制相容,從而其中的基因可擴(kuò)增和/或表達(dá))。編碼相關(guān)蛋白、相關(guān)肽或NTP肽的基因、cDNA或其片段可在原核、酵母、昆蟲(桿狀病毒系統(tǒng))和/或真核宿主細(xì)胞中擴(kuò)增/表達(dá)。宿主細(xì)胞的選擇部分取決于相關(guān)蛋白,相關(guān)肽或NTP肽是否糖基化和/或磷酸化。如果這樣,優(yōu)選酵母、昆蟲或哺乳動(dòng)物宿主細(xì)胞。
通常,用于任何宿主細(xì)胞的載體包含5’側(cè)翼序列(也稱為“啟動(dòng)子”)和其它調(diào)節(jié)元件如增強(qiáng)子、復(fù)制元件的起點(diǎn)、轉(zhuǎn)錄終止元件、含供體和受體剪接位點(diǎn)的完整內(nèi)含子序列、信號(hào)肽序列、核糖體結(jié)合位點(diǎn)元件、聚腺苷酸化序列、用于插入編碼待表達(dá)多肽的核酸的多接頭區(qū)域、及可選擇的標(biāo)記元件。各個(gè)這些元件在下面討論。任選的,載體可包含一尾序列,即位于相關(guān)蛋白、相關(guān)肽或NTP肽編碼序列的5’或3’末端的寡核苷酸分子;該寡核苷酸分子編碼聚組氨酸(如6個(gè)組氨酸)或其它標(biāo)志如FLAG、HA(流感病毒血凝素)或存在可商業(yè)購(gòu)買抗體的myc。此尾常在表達(dá)多肽時(shí)融合于該多肽,可作為從宿主細(xì)胞親和純化相關(guān)蛋白、相關(guān)肽或NTP肽的工具。例如可通過柱層析完成親和純化,此柱層析采用抗該尾巴的抗體抗作為親和基質(zhì)。任選地,隨后可通過多種方法某些肽酶從純化的相關(guān)蛋白、相關(guān)肽或NTP肽中去除該尾巴。
本領(lǐng)域技術(shù)人員可將人免疫球蛋白鉸鏈區(qū)和Fc區(qū)融合于該相關(guān)蛋白、相關(guān)肽或NTP肽的N-或C-末端。隨后Fc融合蛋白可用A蛋白親和柱純化。已知Fc體內(nèi)可表現(xiàn)出長(zhǎng)的藥物動(dòng)力學(xué)半衰期且發(fā)現(xiàn)融合Fc的蛋白質(zhì)體內(nèi)表現(xiàn)出的半衰期顯著大于未融合蛋白質(zhì)。同樣,融合的Fc區(qū)使得一些分子可二聚化/多聚化而利用其生物活性。
5’側(cè)翼序列可以是同源(即來(lái)自與宿主細(xì)胞相同的物種和/或品系)、異源(即來(lái)自與宿主細(xì)胞不同的物種或品質(zhì))、雜交的(即一個(gè)以上來(lái)源的5’側(cè)翼序列的組合)、合成的,或可以是天然的相關(guān)蛋白、相關(guān)肽或NTP肽基因5’側(cè)翼序列。同樣,5’側(cè)翼序列的來(lái)源可以是單細(xì)胞原核或真核生物、任何脊椎動(dòng)物或無(wú)脊椎動(dòng)物、或任何植物,只要此5’側(cè)翼序列有功能且可被宿主細(xì)胞機(jī)制活化。
本發(fā)明載體中所用的5’側(cè)翼序列可通過本領(lǐng)域熟知的一些方法來(lái)獲得。通常,除了相關(guān)蛋白、相關(guān)肽或NTP肽基因側(cè)翼序列外本文所用的5’側(cè)翼序列前面已通過作圖和/或限制性內(nèi)切酶消化得到鑒定,因此可用合適的限制性內(nèi)切酶從適當(dāng)組織來(lái)源中分離得到。在一些情況中,此5′側(cè)翼序列的全核苷酸序列可以是已知的。這里可用上述核酸合成或克隆的方法合成此5’側(cè)翼序列。
當(dāng)5’側(cè)翼所有或僅部分序列已知時(shí),它可用PCR和/或通過篩選基因組文庫(kù)來(lái)獲得,篩選所用的合適寡核苷酸和/或5’側(cè)翼序列片段來(lái)自相同或另一物種。
當(dāng)不知道5’側(cè)翼序列時(shí),含5’側(cè)翼序列的DNA片段可從DNA的較大片斷中分離,此DNA可包含例如編碼序列或甚至另外的基因。分離可通過限制性內(nèi)切酶消化完成,用一種或多種仔細(xì)選擇的酶分離適當(dāng)DNA片段。消化后,所需片段可通過瓊脂糖凝膠純化、Qiagen柱或其它本領(lǐng)域技術(shù)人員已知的方法來(lái)分離。選擇適當(dāng)酶以達(dá)到此目的對(duì)此領(lǐng)域的一般技術(shù)人員是不難懂得的。
復(fù)制元件的起點(diǎn)通常是商業(yè)購(gòu)買的原核表達(dá)載體的一部分,可協(xié)助宿主細(xì)胞中載體的擴(kuò)增。在一些情況中,載體擴(kuò)增到一定拷貝數(shù)對(duì)最佳表達(dá)相關(guān)蛋白、相關(guān)肽或NTP肽很重要。如果所選載體不含有復(fù)制起始位點(diǎn),可在已知序列基礎(chǔ)上化學(xué)合成此起點(diǎn)并連接入載體。轉(zhuǎn)錄終止元件一般位于NTP蛋白或NTP/肽編碼序列的3’末端,作用是終止相關(guān)蛋白、相關(guān)肽或NTP肽的轉(zhuǎn)錄。通常,原核細(xì)胞中的轉(zhuǎn)錄終止元件是后面有一聚T序列的富含G-c的片段。雖然可從文庫(kù)克隆或商業(yè)購(gòu)買此元件作為載體部分,也可用上述核酸合成方法容易地合成。
可選擇性標(biāo)記基因元件編碼宿主細(xì)胞在選擇性培養(yǎng)基中存活和生長(zhǎng)所必需的蛋白質(zhì)。典型的選擇標(biāo)記基因元件編碼的蛋白質(zhì)(a)賦予原核宿主細(xì)胞對(duì)抗生素或其它毒素的抗性,如氨芐青霉素、四環(huán)素或卡那霉素的抗性,(b)彌補(bǔ)細(xì)胞的營(yíng)養(yǎng)缺陷;或(c)提供復(fù)合培養(yǎng)基沒有的關(guān)鍵營(yíng)養(yǎng)素。優(yōu)選的可選擇標(biāo)記是卡那霉素抗性基因、氨芐青霉素抗性基因和四環(huán)素抗性基因。
一般稱為SD序列(原核生物)或Kozak序列(真核核生物)的核糖體結(jié)合元件,是mRNA翻譯起始通常必需的。此元件通常位于啟動(dòng)子3’端和待合成的相關(guān)蛋白、相關(guān)肽或NTP肽編碼序列的5’端。各SD序列不同但一般是聚嘌呤(即有高A-G含量)。已鑒定到許多SD序列,本領(lǐng)域普通技術(shù)人員可不難用上述方法合成各種SD序列并用于原核載體中。
在需要相關(guān)蛋白、相關(guān)肽或NTP肽從宿主細(xì)胞分泌時(shí),可利用信號(hào)序列引導(dǎo)相關(guān)蛋白,相關(guān)肽或NTP肽分泌到宿主細(xì)胞外,可缺失此蛋白質(zhì)的羧基末端部分以防止膜錨定。通常,信號(hào)序列位于相關(guān)蛋白/相關(guān)肽/NTP肽基因或cDNA的編碼區(qū)域中,或連接在相關(guān)蛋白/相關(guān)肽/NTP肽基因編碼區(qū)的5’末端。已鑒定到許多信號(hào)序列,任何一種在所選宿主細(xì)胞中有功能的信號(hào)序列可與相關(guān)蛋白/相關(guān)肽/NTP肽基因或cDNA結(jié)合使用。因此,該信號(hào)序列可與相關(guān)蛋白/相關(guān)肽/NTP肽基因或cDNA同源或異源,可與相關(guān)蛋白/相關(guān)肽/NTP肽基因或cDNA同源或異源。另外,此信號(hào)序列可用上述方法化學(xué)合成。在大部分情況中,通過信號(hào)肽的存在宿主細(xì)胞分泌多肽時(shí)會(huì)導(dǎo)致從此多肽中去除氨基末端的甲硫氨酸。
在許多情況中,相關(guān)蛋白/相關(guān)肽/NTP肽基因或cDNA的轉(zhuǎn)錄,可通過載體中存在一個(gè)或多個(gè)內(nèi)含子而增加;當(dāng)相關(guān)蛋白、相關(guān)肽或NTP肽在真核宿主細(xì)胞中產(chǎn)具體是哺乳動(dòng)物宿主細(xì)胞生時(shí)尤其如此。所用內(nèi)含子可以是相關(guān)蛋白/相關(guān)肽/NTP肽基因中天然存在的,特別是當(dāng)所用基因是全長(zhǎng)基因組序列或其片段時(shí)。當(dāng)基因中無(wú)天然產(chǎn)生的此內(nèi)含子時(shí)(對(duì)于大部分cDNAs如此),該內(nèi)含子可獲自另外的來(lái)源。由于此內(nèi)含子必須轉(zhuǎn)錄有效,關(guān)于其側(cè)翼序列和相關(guān)蛋白/相關(guān)肽/NTP肽基因的相對(duì)位置通常很重要。同樣,當(dāng)插入表達(dá)載體中的相關(guān)蛋白/相關(guān)肽/NTP肽基因是cDNA分子時(shí),該內(nèi)含子的優(yōu)選位置是轉(zhuǎn)錄起始位點(diǎn)的3’端和聚A轉(zhuǎn)錄終止序列的5’端。對(duì)于相關(guān)蛋白/相關(guān)肽/NTP肽cDNA,此內(nèi)含子或這些內(nèi)含子優(yōu)選位于cDNA一側(cè)或另一側(cè)(即5’或3’),從而不會(huì)打斷此編碼序列。只要此內(nèi)含子與其插入的宿主細(xì)胞相容,任何來(lái)源的任何內(nèi)含子均可用于實(shí)施本發(fā)明,包括病毒、原核和真核(植物或動(dòng)物)生物的內(nèi)含子。還包括在本文中的合成內(nèi)含子。任選地,在載體中可使用一個(gè)以上的內(nèi)含子。
當(dāng)上述一個(gè)或多個(gè)元件不存在于待使用的載體中時(shí),它們可單獨(dú)獲得并連接入載體。用于獲得各元件的方法是本領(lǐng)域技術(shù)人員熟知的,且可與上述方法相比較(即合成DNA、文庫(kù)篩選等)。
用于實(shí)施本發(fā)明的最終載體可從起始載體構(gòu)建,如商業(yè)購(gòu)買的載體。這種載體可以或可不包含一些完整載體中所含的元件。如果起始載體中沒有所需元件,各元件可單獨(dú)連接入載體,通過用合適的限制性內(nèi)切酶切割載體,使此元件待連接末端和載體末端適合于連接。在一些情況中,可能必須使待連接在一起的末端成為“平端”,以獲得滿意的連接。通過先用Klenow DNA聚合酶或T4 DNA聚合酶在所有四種核苷酸存在時(shí)填補(bǔ)“粘端”來(lái)獲得平端。此過程是本領(lǐng)域熟知,其描述見例如Sambrook等,同上。另外,待插入此載體的兩個(gè)或多個(gè)元件可先連接一起(如果它們的位置彼此相鄰),隨后連接入載體。
另一種構(gòu)建此載體的方法是在一種反應(yīng)混合物中同時(shí)進(jìn)行多種元件的所有連接。這里,由于不適當(dāng)?shù)倪B接或插入元件將含產(chǎn)生許多無(wú)意義和無(wú)功能的載體。然而可通過限制性內(nèi)切酶消化來(lái)鑒定和選擇功能性載體。
實(shí)施本發(fā)明的優(yōu)選載體是與細(xì)菌、昆蟲和哺乳動(dòng)物宿主細(xì)胞相容的那些載體。這種載體包括pCPII、pCR3和pcDNA3.1(Invitrogen Company,San Diego,Calif.)、pBSII(Strtagene Company,La Jolla,Calif.)、pET15b(Novagen,Madison,Wis.)、PGEX(Pharmacia Biotech,Piscataway,N.J.)、pEGFP-N2(Clontech,Palo Alto,Calif.)、pETL(BlueBacII;Invitrogen)和pFastBacDual(Gibco/BRL,Grand Island,N.Y.)。
在載體構(gòu)建和編碼全長(zhǎng)或截短的相關(guān)蛋白、相關(guān)肽或NTP肽的核酸分子插入此載體的適當(dāng)位點(diǎn)后,可將此完整的載體插入合適的宿主細(xì)胞用于擴(kuò)增和/或多肽表達(dá)。宿主細(xì)胞可以是原核宿主細(xì)胞(如大腸桿菌)或真核宿主細(xì)胞(如酵母細(xì)胞、昆蟲細(xì)胞或脊椎動(dòng)物細(xì)胞)。當(dāng)宿主細(xì)胞在合適條件下培養(yǎng)時(shí),可合成相關(guān)蛋白、相關(guān)肽或NTP肽,隨后從培養(yǎng)基收集(如果宿主細(xì)胞分泌它們到培養(yǎng)基中)或直接從產(chǎn)生它們的宿主細(xì)胞(如果它不被分泌)收集。
收集后,相關(guān)蛋白、相關(guān)肽或NTP肽可用分子篩層析、親和層析等方法純化。產(chǎn)生相關(guān)蛋白、相關(guān)肽或NTP肽的宿主細(xì)胞的選擇部分取決于相關(guān)蛋白、相關(guān)肽或NTP肽是否糖基化或磷酸化(其中真核宿主細(xì)胞優(yōu)選)、宿主細(xì)胞是否能折疊此蛋白質(zhì)成其天然三級(jí)結(jié)構(gòu)(如二硫橋的正確取向等)方式,從而通過具有生物活性的相關(guān)蛋白、相關(guān)肽或NTP肽而制備生物活性蛋白質(zhì)。合成后可用下面討論的合適化學(xué)條件折疊相關(guān)蛋白、相關(guān)肽或NTP肽。用于本發(fā)明的合適細(xì)胞或細(xì)胞系包括哺乳動(dòng)物細(xì)胞,如中國(guó)倉(cāng)鼠卵巢細(xì)胞(CHO)、人胚胎腎(HEK)293或293T細(xì)胞,或3T3細(xì)胞。選擇合適的哺乳動(dòng)物宿主細(xì)胞和轉(zhuǎn)化、培養(yǎng)、擴(kuò)增、篩選和產(chǎn)物生成及純化的方法是本領(lǐng)域技術(shù)人員已知的。其它合適的哺乳動(dòng)物細(xì)胞系包括猴COS-1和COS-7細(xì)胞系及CV-1細(xì)胞系。更具示范性的哺乳動(dòng)物宿主細(xì)胞包括靈長(zhǎng)類細(xì)胞系和嚙齒動(dòng)物細(xì)胞系,含轉(zhuǎn)化的細(xì)胞系。正常二倍體細(xì)胞、衍生自原代組織體外培養(yǎng)的細(xì)胞株以及原代外植體也是合適的。候選細(xì)胞可以是在選擇基因中有遺傳型缺陷或可含有優(yōu)勢(shì)作用的選擇基因。其它合適的哺乳動(dòng)物細(xì)胞系包括但不限于小鼠成神經(jīng)細(xì)胞瘤N2A細(xì)胞、海拉細(xì)胞、小鼠L-929細(xì)胞、衍生自Swiss、Balb-c或NIH小鼠的3T3系、BHK或HaK倉(cāng)鼠細(xì)胞系。
與適合于本發(fā)明的宿主細(xì)胞同樣有用的是細(xì)菌細(xì)胞。例如,多種大腸桿菌菌株(如HB101、DH5α、DH10和MC1061)是生物技術(shù)領(lǐng)域中熟知的宿主細(xì)胞??莶菅挎邨U菌(B.subtilis)、假單胞菌屬(Pseudomonas spp.)、其它芽孢桿菌屬(Bacillusspp.)、鏈霉菌屬(Streptomyces spp.)等多種菌株可用于此方法。本領(lǐng)域技術(shù)人員已知的許多酵母細(xì)胞菌株也可作為表達(dá)本發(fā)明多肽的宿主細(xì)胞。
另外,需要時(shí)昆蟲細(xì)胞系統(tǒng)可用于本發(fā)明的方法。這種系統(tǒng)已有描述,例如Kitts等(Biotechniques,14810-817)、Lucklow(Curr.Opin.Biotechnol.,4564-572)和Lucklow等(J.Virol.,674566-4579)。優(yōu)選的昆蟲細(xì)胞是Sf-9和Hi5(Invitrogen,Carlsbad,Calif.)。
插入(也稱為轉(zhuǎn)化或轉(zhuǎn)染)載體到所選宿主細(xì)胞中可用方法如氯化鈣、電穿孔、顯微注射、脂轉(zhuǎn)染或DEAE-葡聚糖方法來(lái)完成。選擇的方法部分利用所用類型宿主細(xì)胞的功能。這些方法和其它合適方法是本領(lǐng)域技術(shù)人員熟知的并被列出,例如見Sambrook等,同上。
含此載體(即轉(zhuǎn)化的或轉(zhuǎn)染的)的宿主細(xì)胞可用本領(lǐng)域技術(shù)人員熟知的標(biāo)準(zhǔn)培養(yǎng)基培養(yǎng)。此培養(yǎng)基通常含有細(xì)胞生長(zhǎng)和存活必需的所有營(yíng)養(yǎng)物。培養(yǎng)大腸桿菌細(xì)胞的合適培養(yǎng)基是例如Luria Broth(LB)和/或Terrific Broth(TB)。培養(yǎng)真核細(xì)胞的合適培養(yǎng)基是RPMI1640、MEM、DMEM,它們都添加有血清和/或培養(yǎng)特定細(xì)胞系所需的生長(zhǎng)因子。培養(yǎng)昆蟲的合適培養(yǎng)基是Grace培養(yǎng)基,添加有必需的yeastolate、乳白蛋白水解產(chǎn)物和/或胎牛血清。通常,培養(yǎng)基中加入抗生素或其它僅用于選擇性生長(zhǎng)轉(zhuǎn)化細(xì)胞的化合物作為添加物。所用化合物將通過由轉(zhuǎn)化宿主細(xì)胞的質(zhì)粒上存在的可選擇標(biāo)記元件決定。例如,當(dāng)可選擇標(biāo)記元件是卡那霉素抗性時(shí),加入培養(yǎng)基的化合物是卡那霉素。
宿主細(xì)胞中產(chǎn)生的相關(guān)蛋白、相關(guān)肽或NTP肽的量可用本領(lǐng)域已知的標(biāo)準(zhǔn)方法評(píng)估。這種方法包括但不限于蛋白質(zhì)印跡分析、SDS-聚丙烯酰胺凝膠電泳、非變性凝膠電泳、HPLC分離、質(zhì)譜、免疫沉淀和/或活性試驗(yàn)如DNA結(jié)合凝膠移位試驗(yàn)。
如果相關(guān)蛋白、相關(guān)肽或NTP肽設(shè)計(jì)為從宿主細(xì)胞中分泌,大部分相關(guān)蛋白、相關(guān)肽或NTP肽可發(fā)現(xiàn)于細(xì)胞培養(yǎng)基中。以此方法制備的蛋白質(zhì)通常不具有氨基末端甲硫氨酸,因?yàn)樗诩?xì)胞分泌時(shí)被去除。然而如果相關(guān)蛋白、相關(guān)肽或NTP肽不從宿主細(xì)胞中分泌,它將存在于細(xì)胞質(zhì)和/或核中(真核宿主細(xì)胞)或細(xì)胞溶質(zhì)中(革蘭陰性菌宿主細(xì)胞),且可具有氨基末端甲硫氨酸。
對(duì)位于宿主細(xì)胞細(xì)胞質(zhì)和/或核中的相關(guān)蛋白、相關(guān)肽或NTP肽,通常先機(jī)械破碎宿主細(xì)胞或用洗滌劑釋放胞內(nèi)成分到緩沖溶液中。然后可從溶液中分離相關(guān)蛋白、相關(guān)肽或NTP肽。
從溶液中純化相關(guān)蛋白、相關(guān)肽或NTP肽可采用多種技術(shù)完成。如果合成的蛋白質(zhì)含有如6個(gè)組氨酸的鈀(NTP蛋白/hexa His)或其它小肽如FLAG(Sigrna-Aldritch,St.Louis,MI)或在其羧基或氨基末端含有鈣調(diào)蛋白-結(jié)合肽(Stratagene,LaJolla,CA),它可采用一步法使溶液通過親和柱來(lái)純化,柱中的柱基質(zhì)對(duì)該尾巴或直接對(duì)該蛋白質(zhì)有高親和性(即特異性識(shí)別相關(guān)蛋白或相關(guān)肽的單克隆抗體)。例如,聚組氨酸能以高親和力特異性結(jié)合鎳、鋅及鈷;因而使用以鎳為基礎(chǔ)的親和樹脂(如Qiagen的QIAexpress system或Invitrogen的Xpress System中所用的)或以鈷為基礎(chǔ)的親和樹脂(如BD Biosciences-CLONTECH的Talon system中所用的)的固定金屬離子親和層析可用于純化NTP相關(guān)蛋白/聚組氨酸。(參見例如,Ausubel等編,《新編分子生物學(xué)實(shí)驗(yàn)指南》,10.11.8章節(jié),John Wiley&Sons,紐約)。
當(dāng)制備的相關(guān)蛋白、相關(guān)肽或NTP肽沒有附著尾巴又不能得到其抗體時(shí),可使用其它熟知的純化方法。這種方法包括但不限于離子交換層析、羥基磷灰石層析、疏水作用層析、分子篩層析、HPLC、結(jié)合凝膠洗提的天然凝膠電泳以及制備型等電聚焦(Isoprime機(jī)器/技術(shù),Hoefer Scientific)。在一些情況下可聯(lián)合一種或多種技術(shù)以提高純度。
如果預(yù)期相關(guān)蛋白、相關(guān)肽或NTP肽主要發(fā)現(xiàn)于胞內(nèi),可用本領(lǐng)域技術(shù)人員已知的標(biāo)準(zhǔn)技術(shù)提取宿主細(xì)胞中的胞內(nèi)物質(zhì)(包括革蘭陰性菌的包含體)。例如可離心后通過弗氏壓碎器、勻漿和/或超聲裂解宿主細(xì)胞以釋放周質(zhì)/細(xì)胞質(zhì)成分。如果相關(guān)蛋白、相關(guān)肽或NTP肽在細(xì)胞溶質(zhì)中形成包含體,該包含體常結(jié)合于內(nèi)和/或外細(xì)胞膜,因此離心后主要見于沉淀物中。然后在存在還原劑如堿性pH的二硫蘇糖醇或酸性pH的三羧乙基膦時(shí)用極端pH或用離液劑如去污劑、胍、胍衍生物、尿素或尿素衍生物處理此沉淀物以釋放、破裂和溶解此包含體。然后可對(duì)已是可溶形式的相關(guān)蛋白、相關(guān)肽或NTP肽用凝膠電泳、免疫沉淀等分析。如果需要分離相關(guān)蛋白、相關(guān)肽或NTP肽,可用標(biāo)準(zhǔn)方法完成分離,如下面和Marston等(Meth.Enz.,182264-275)列出的方法。
在一些情況中,相關(guān)蛋白、相關(guān)肽或NTP肽分離時(shí)可能沒有生物活性??刹捎弥卣郫B或轉(zhuǎn)變此多肽成其三級(jí)結(jié)構(gòu)并產(chǎn)生二硫鍵的多種方法恢復(fù)其生物活性。這些方法包括使溶解的多肽暴露于通常高于7的pH和存在的特定濃度離液劑。離液劑的選擇非常類似于用于包含體溶解的選擇,但通常濃度較低且不一定是溶解所用的同一離液劑。在大部分情況中,重折疊/氧化溶液也包含還原劑或特定比例的還原劑加其氧化形式,以產(chǎn)生特定氧化還原電勢(shì)使二硫化物改組形成蛋白質(zhì)的半胱氨酸橋。一些常用的氧化還原對(duì)包括半胱氨酸/胱胺、谷胱甘肽(GSH)/二硫雙GSH(dithiobis GSH)、氯化銅、二硫蘇糖醇(DTT)/二噻烷DTT、2-巰基乙醇(bME)/二硫-b(ME)。在許多情況中,需要共溶劑以提高重折疊的效率,用于此目的較常用試劑包括甘油、不同分子量的聚乙二醇和精氨酸。
如果宿主細(xì)胞中不形成顯著程度的相關(guān)蛋白、相關(guān)肽或NTP肽包含體,細(xì)胞勻漿離心后相關(guān)蛋白、相關(guān)肽或NTP肽主要見于上清液中,相關(guān)蛋白、相關(guān)肽或NTP肽可用如下方法從上清液中分離獲得。
當(dāng)優(yōu)選部分或完全分離相關(guān)蛋白、相關(guān)肽或NTP肽的情況中,可用本領(lǐng)域技術(shù)人員熟知的標(biāo)準(zhǔn)方法完成純化。這種方法包括但不限于電泳分離,接著電洗脫、多種類型的層析(免疫親和、分子篩和/或離子交換)、和/或高壓液相層析。在一些情況中,優(yōu)選使用一種以上的這些方法來(lái)完全純化。
除了用重組DNA技術(shù)制備和純化相關(guān)蛋白、相關(guān)肽或NTP肽外,相關(guān)蛋白、相關(guān)肽或NTP肽和它們的片段、變體、同源物和衍生物可用化學(xué)合成方法制備(如固相肽合成),使用本領(lǐng)域已知技術(shù)如描述于Merrifield等,(J.Am.Chem.Soc.,852149)、Houghten等(Proc.Natl.Acad.Sci.USA,855132)、Stewart和Young(《固相肽合成》(Solid Phase Peptide Synthesis),Pierce Chemical Co.,Rockford,III.)??珊铣砂被┒擞谢驔]有甲硫氨酸的這些多肽?;瘜W(xué)合成的相關(guān)蛋白、相關(guān)肽或NTP肽可用參考文獻(xiàn)所列方法氧化以形成二硫橋。預(yù)期相關(guān)蛋白、相關(guān)肽或NTP肽具有相當(dāng)于重組產(chǎn)生或純化自天然來(lái)源的相關(guān)蛋白、相關(guān)肽或NTP肽相的生物活性,因此可與重組或天然的相關(guān)蛋白、相關(guān)肽或NTP肽交換使用。
化學(xué)修飾的相關(guān)蛋白、相關(guān)肽或NTP肽組合物中包含連接于一聚合物的相關(guān)蛋白、相關(guān)肽或NTP肽屬于本發(fā)明范圍內(nèi)。所選聚合物通??扇苡谒畯亩浣Y(jié)合的蛋白質(zhì)在水環(huán)境,如生理環(huán)境中不會(huì)沉淀。所選聚合物通常經(jīng)修飾而具有一個(gè)反應(yīng)基團(tuán)如用于酰化的活性酯或用于烷化的醛,這樣可如本方法所提供的那樣,控制聚合程度。聚合物可以是任何分子量,可以分支或不分支。相關(guān)蛋白/相關(guān)肽/NTP肽聚合物范圍包括聚合物的混合物。
在一些情況中,需要制備天然產(chǎn)生的相關(guān)蛋白、相關(guān)肽或NTP肽的核酸和/或氨基酸變體。核酸變體可用定點(diǎn)誘變、PCR擴(kuò)增或其它合適方法產(chǎn)生,其中引物具有所需的點(diǎn)突變(誘變技術(shù)的描述參見Sambrook等,同上,Ausubel等,同上)。采用Engels等(同上),所述的化學(xué)合成方法也可制備這種變體。其它本領(lǐng)域技術(shù)人員已知的方法也可使用。
優(yōu)選的核酸變體是用于產(chǎn)生相關(guān)蛋白、相關(guān)肽或NTP肽的宿主細(xì)胞中含有密碼子優(yōu)先的核苷酸取代的那些變體。這種“密碼子最優(yōu)化”可通過計(jì)算機(jī)算法確定,此算法結(jié)合密碼子頻率表如“Ecohigh.Cod”作為高表達(dá)細(xì)菌基因的密碼子優(yōu)先,由University of Wisconsin包版本9.0,遺傳學(xué)計(jì)算機(jī)組,Madison,Wis提供。其它有用的密碼子頻率表包括“Celegans high.cod”、“Celegans low.cod”、“Drosophila high.cod”、“Human high.cod”、“Maize high.cod”和“Yeast high.cod”。其它優(yōu)選變體是編碼上述與野生型相比保守性氨基酸變化(如其中天然產(chǎn)生的氨基酸側(cè)鏈的電荷或極性沒有因被不同氨基酸取代而顯著改變)的變體、和/或設(shè)計(jì)為產(chǎn)生新的糖基化和/或磷酸化位點(diǎn)的變體、或設(shè)計(jì)為缺失現(xiàn)有糖基化和/或磷酸化位點(diǎn)的變體。
相關(guān)蛋白、相關(guān)肽、NTP肽、其片斷、同源物、變體、衍生物及其鹽類可用此領(lǐng)域的普通技術(shù)人員已知的常規(guī)肽合成技術(shù)產(chǎn)生。這些技術(shù)包括化學(xué)偶聯(lián)方法(參見Wunch,E“有機(jī)化學(xué)方法”,第15卷,Band 1+2,Synthese von Peptiden,thimeVerlag,Stuttgart(1974)和Barrany,G.;Marrifield,R.B.“肽”(The Peptides),E.Gross,J.Meienhofer編,第2卷,第1章,1-284頁(yè),Academic Press(1980))、酶偶聯(lián)方法(參見Widmer,F(xiàn).Johansen,J.T.,Carlsverg Res.Commun.,第44卷,37-46頁(yè)(1979)和Kullmann,W.“酶促性肽合成”(Enzymatic Peptide Synthesis),CRC Press Inc.BocaRaton,F(xiàn)la.(1987)和Widmer,F(xiàn).,Johansen,J.T.,“生物和醫(yī)學(xué)中的合成肽”(SyntheticPeptides in Biology and Medicines),Alitalo,K.,Partanen,P.,Vatieri,A.編,79-86頁(yè),Elsevier,Amsterdam(1985))、或化學(xué)和酶方法的組合,如果這具有加工設(shè)計(jì)和經(jīng)濟(jì)的優(yōu)點(diǎn)。使用本文提供的指南,本領(lǐng)域技術(shù)人員能改變相關(guān)蛋白、相關(guān)肽或NTP肽的肽序列以產(chǎn)生具有與原始或天然相關(guān)蛋白、相關(guān)肽或NTP肽相同或類似生物活性的同源物。
采用給定的相關(guān)蛋白、相關(guān)肽或NTP肽的模擬物而不是此蛋白質(zhì)本身有其優(yōu)點(diǎn)。通常,與該蛋白質(zhì)和肽相比,肽模擬物的生物利用度更高,具有較長(zhǎng)的作用時(shí)間且生產(chǎn)成本較低。
因此,上述相關(guān)蛋白、相關(guān)肽和NTP肽可用于開發(fā)具有類似生物活性從而具有類似治療作用的小化學(xué)化合物。可采用組合化學(xué)技術(shù)和本領(lǐng)域已知的其它技術(shù)開發(fā)相關(guān)蛋白、相關(guān)肽和NTP肽的肽模擬物(參見例如《第20屆歐洲肽專題討論會(huì)論文集》(Proceedings of the 20th European Peptide Symposium),G.Jung,E.Bayer編,289-336頁(yè),和其中的參考文獻(xiàn))。
結(jié)構(gòu)上修飾本領(lǐng)域已知的肽以產(chǎn)生肽模擬物的方法的例子包括倒置主鏈?zhǔn)中灾行漠a(chǎn)生D-氨基酸殘基結(jié)構(gòu),具體是在N-末端,導(dǎo)致對(duì)蛋白酶降解的穩(wěn)定性提高而對(duì)活性沒有不利影響。在論文“含氚D-丙氨酸1-肽T結(jié)合”,Smith C.S.等,DrugDevelopment Res.,15,371-379頁(yè)(1988)中給出了一個(gè)例子。
第二種方法是改變穩(wěn)定性所需的環(huán)狀結(jié)構(gòu),如N到C鏈間的二酰亞胺和內(nèi)酰胺(Ede等,Smith和Rivier編,《肽化學(xué)和生物學(xué)》,Escom,Leiden,1991,268-270頁(yè))。例子見構(gòu)型限制的胸腺五肽樣化合物,如美國(guó)專利號(hào)4,457,489(1985),Goldstein,G.等所公開的那樣,其內(nèi)容全部納入本文供參考。
第三種方法是用能賦予蛋白水解抗性的假肽鍵替換相關(guān)蛋白、相關(guān)肽或NTP肽中的肽鍵。已報(bào)道了一些假肽鍵一般不影響肽的結(jié)構(gòu)和生物活性。此方法的一個(gè)例子是取代逆一反假肽鍵(“胸腺五肽的生物活性逆反轉(zhuǎn)同源物”,Sisto A等,Rivier,J.E.和Marshall,G.R.編,“肽、化學(xué)、結(jié)構(gòu)和生物學(xué)”,Escom,Leiden,1990,722-773頁(yè))和Dalpozzo等(1993),Int.J.Peptide Protein Res.,41561-566,納入本文供參考)。根據(jù)此修飾,此肽的氨基酸序列可能與上述相關(guān)蛋白、相關(guān)肽和NTP肽的序列相同,除了一個(gè)或多個(gè)肽鍵被逆反轉(zhuǎn)假肽鍵所取代外。優(yōu)選大部分N-末端肽鍵被取代,由于這種取代將賦予對(duì)外肽酶作用于N-末端水解蛋白的抗性。
合成具有一個(gè)或多個(gè)還原的逆反轉(zhuǎn)假肽鍵的肽是本領(lǐng)域已知的(Sisto(1990)和Dalpozzo等,(1993),見上)。因此肽鍵可用非肽鍵替代使肽模擬物獲得與原始肽相似的結(jié)構(gòu),從而生物活性相似。也可用其它類似結(jié)構(gòu)的化學(xué)基團(tuán)替代氨基酸的化學(xué)基團(tuán)作進(jìn)一步修飾。另一種已知可提高對(duì)酶裂解的穩(wěn)定性而生物活性沒有或很少損失的合適假肽鍵,是還原型電子等排物假肽鍵(Couder等(1993),Int.J.PeptideProtein Res.,41181-184,全部納入本文供參考)。因此,這些肽的氨基酸序列可能與相關(guān)蛋白、相關(guān)肽或NTP肽序列相同,除了一個(gè)或多個(gè)肽鍵被電子等排物假肽鍵替代外。優(yōu)選大部分N-末端肽鍵被取代,由于這種取代將賦予對(duì)外肽酶作用于N-末端水解蛋白的抗性。合成具有一個(gè)或多個(gè)還原型電子等排假肽鍵的肽是本領(lǐng)域已知的(Couder等1993,見上)。其他例子包括導(dǎo)入酮亞甲基鍵或甲硫鍵來(lái)替代肽鍵。
相關(guān)蛋白、相關(guān)肽和NTP肽的擬肽衍生物代表了另一類肽模擬物,擬肽保留了生物活性的重要結(jié)構(gòu)決定簇,但去除了肽鍵,可賦予對(duì)蛋白水解的抗性(Simon等,1992,Proc.Natl.Acad.Sci.USA,899367-9371,全部納入本文供參考)。擬肽是N-取代的甘氨酸的寡聚物。已報(bào)道了一些N-烷基基團(tuán),各對(duì)應(yīng)于天然氨基酸的側(cè)鏈(Simon等,1992,見上)。相關(guān)蛋白、相關(guān)肽或NTP肽的一些或所有氨基酸用對(duì)應(yīng)于所替代氨基酸的N-取代甘氨酸替代。
可通過NMR譜、晶體圖和/或計(jì)算機(jī)-輔助分子模型確定原始相關(guān)蛋白、相關(guān)肽或NTP肽的三級(jí)結(jié)構(gòu)來(lái)協(xié)助開發(fā)肽模擬物。這些技術(shù)可幫助開發(fā)具有比原始肽更高效力和/或更高生物利用率和/或更高穩(wěn)定性的新組合物(Dean(1994),BioEssays,16683-687;Cohen和Shatzmiller(1993),J.Mol.Graph.,11166-173;Wiley和Rich(1993),Med.Res.Rev.,13327-384;Moore(1994),Trends Pharmacol.Sci.,15124-129;Hruby(1993),Biopolymers.,331073-1082;Bugg等(1993)Sci.Am.,26992-98,全部納入本文供參考)。
一旦一種潛在的肽模擬物化合物被鑒定,它可以用下面例子中列出的方法合成和分析以評(píng)估其活性。用上述方法獲得的肽模擬化合物包括在本發(fā)明范圍內(nèi),該化合物具有相關(guān)蛋白、相關(guān)肽或NTP肽的生物活性和類似的三維結(jié)構(gòu)。本領(lǐng)域技術(shù)人員不難明白,此肽模擬物可從任何攜帶上述一種或多種修飾的相關(guān)蛋白、相關(guān)肽或NTP肽中產(chǎn)生。還將明白,本發(fā)明的肽模擬物除了其作為治療化合物的用途外,可進(jìn)一步用于開發(fā)甚至更強(qiáng)的非肽化合物。
今天許多機(jī)構(gòu)都能夠合成本文所述的相關(guān)蛋白、相關(guān)肽和NTP肽。例如,有了一種NTP肽的序列,這些機(jī)構(gòu)就能合成肽并為合成的肽提供相應(yīng)的文件并證明肽的相同性。
本發(fā)明還包括使用相關(guān)蛋白、相關(guān)肽和NTP肽和它們相應(yīng)的核酸分子進(jìn)行試驗(yàn),以定性或定量測(cè)定哺乳動(dòng)物組織或體液樣品中相關(guān)蛋白、相關(guān)肽、NTP肽、相關(guān)蛋白/相關(guān)肽/NTP肽的DNA或相應(yīng)RNA的存在。相關(guān)蛋白、相關(guān)肽、NTP肽和它們相應(yīng)的核酸分子可用于這些試驗(yàn)的準(zhǔn)備,無(wú)論相關(guān)蛋白、相關(guān)肽或NTP肽或者編碼的相關(guān)蛋白、相關(guān)肽或NTP肽是否顯示生物活性。相關(guān)蛋白、相關(guān)肽或NTP肽的核酸序列可能是雜交探針有用的來(lái)源以定性或定量測(cè)定哺乳動(dòng)物組織或體液樣品中相關(guān)蛋白、相關(guān)肽或NTP肽DNA或相應(yīng)RNA的存在。
本身不具生物活性的相關(guān)蛋白、相關(guān)肽或NTP肽可用于制備識(shí)別和/或結(jié)合相關(guān)蛋白、相關(guān)肽或NTP肽的抗體。這種抗體可用標(biāo)準(zhǔn)方法制備。因此,與相關(guān)蛋白、相關(guān)肽或NTP肽反應(yīng)的抗體以及短鏈抗體片段和這種抗體的其它反應(yīng)片段也在本發(fā)明范圍內(nèi)??贵w可以是多克隆、單克隆、重組、嵌合、單鏈和/或雙特異性。通常,抗體或其片段是人來(lái)源或“人源化”,即制備后給予病人時(shí)可防止對(duì)抗體的免疫反應(yīng)或減少到最低程度。優(yōu)選的抗體是人抗體,多克隆或單克隆。抗體片段可以是能與本發(fā)明相關(guān)蛋白、相關(guān)肽或NTP肽反應(yīng)的任何片斷,如Fab、Fab’等。本發(fā)明還提供了雜交瘤,方法是通過呈遞作為抗源的相關(guān)蛋白、相關(guān)肽或NTP肽給所選哺乳動(dòng)物,接著用已知技術(shù)使該哺乳動(dòng)物的細(xì)胞(如脾細(xì)胞)與一些癌細(xì)胞融合以產(chǎn)生無(wú)限增殖的細(xì)胞系。本發(fā)明還包括產(chǎn)生這種細(xì)胞系和產(chǎn)生抗所有或部分相關(guān)蛋白、相關(guān)肽或NTP肽的抗體的方法。
此種抗體可進(jìn)一步用于體內(nèi)和體外診斷或研究目的,如以標(biāo)記形式來(lái)檢測(cè)體液或細(xì)胞樣品中相關(guān)蛋白、相關(guān)肽或NTP肽的存在。
本發(fā)明還包括使用一種或多種相關(guān)蛋白、相關(guān)肽或NTP肽作為試驗(yàn)中的校準(zhǔn)標(biāo)準(zhǔn)品,以定性或定量測(cè)定哺乳動(dòng)物組織或體液樣品中相關(guān)蛋白、相關(guān)肽、NTP肽、相關(guān)蛋白/相關(guān)肽/NTP肽的DNA或相應(yīng)RNA的存在。
本發(fā)明涉及治療需要除去細(xì)胞的疾病的新方法,如良性或惡性腫瘤、腺體(如前列腺)增生、不想要的面部汗毛、疣和不想要的脂肪組織。這種方法包括將治療有效量的相關(guān)蛋白、相關(guān)肽或NTP肽給予需要的哺乳動(dòng)物。
這類疾病可以是例如肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮膚、腎、竇、結(jié)腸、腸、胃、直腸、食道、血液、大腦和其覆蓋物、脊髓和其覆蓋物、肌肉、結(jié)締組織、腎上腺、副甲狀腺、甲狀腺、子宮、睪丸、垂體、生殖器、肝臟、膽囊、眼、耳、鼻、喉、扁桃腺、口、淋巴結(jié)和淋巴系統(tǒng)及其它器官的腫瘤。
如本文所用,術(shù)語(yǔ)“惡性腫瘤”包括人類癌、肉瘤和黑素瘤的所有形式,它們以低度分化、適度分化、高度分化的形式出現(xiàn)。
本發(fā)明滿足本領(lǐng)域治療的需要,可以除去良性腫瘤而風(fēng)險(xiǎn)較小、不良的手術(shù)副作用較少。特別需要在手術(shù)危險(xiǎn)區(qū)如體內(nèi)深處位(例如腦、心臟、肺和其它)去除良性腫瘤的方法。
治療必須除去細(xì)胞的疾病的方法可與治療這些疾病的常規(guī)方法如手術(shù)切除、化療和放射治療結(jié)合使用。相關(guān)蛋白、相關(guān)肽或NTP肽可在這些常規(guī)治療之前、期間或之后施用。
待治療的疾病也可以是選自肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮膚、腎、竇、結(jié)腸、腸、胃、直腸、食道、血液、大腦和其覆蓋物、脊髓和其覆蓋物、肌肉、結(jié)締組織、腎上腺、副甲狀腺、甲狀腺、子宮、睪丸、垂體、生殖器、肝臟、膽囊、眼、耳、鼻、喉、扁桃腺、口、淋巴結(jié)和淋巴系統(tǒng)的組織增生,肥大或過度生長(zhǎng)。
可用本發(fā)明方法治療的其它疾病是選自肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮膚、腎、竇、結(jié)腸、腸、胃、直腸、食道、血液、大腦和其覆蓋物、脊髓和其覆蓋物、肌肉、結(jié)締組織、腎上腺、副甲狀腺、甲狀腺、子宮、睪丸、垂體、生殖器、肝臟、膽囊、眼、耳、鼻、喉、扁桃腺、口、淋巴結(jié)和淋巴系統(tǒng)的病毒,細(xì)菌或寄生蟲改變的組織。
待治療的疾病也可以是選自肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮膚、腎、竇、結(jié)腸、腸、胃、直腸、食道、血液、大腦和其覆蓋物、脊髓和其覆蓋物、肌肉、結(jié)締組織、腎上腺、副甲狀腺、甲狀腺、子宮、睪丸、垂體、生殖器、肝臟、膽囊、眼、耳、鼻、喉、扁桃腺、口、淋巴結(jié)和淋巴系統(tǒng)的組織畸形或亂。
具體說,待治療的疾病可以是扁桃體肥大、前列腺增生銀屑病、濕疹、皮膚病或痔。待治療的疾病可以是血管病如動(dòng)脈粥樣硬化或動(dòng)脈硬化,或者是血管病如靜脈曲張。待治療的疾病也可以是以下組織的整容修飾,如皮膚、眼、耳、鼻、喉、口、肌肉、結(jié)締組織、毛發(fā)或乳房組織。
相關(guān)蛋白、相關(guān)肽和/或NTP肽的治療性組合物屬于本發(fā)明范圍內(nèi)。這種組合物可包括治療有效量的相關(guān)蛋白、相關(guān)肽或NTP肽與藥學(xué)上可接受載體的混合物。載體物質(zhì)可以是注射用水,優(yōu)選在溶液中添加哺乳動(dòng)物給藥常用的其它物質(zhì)。通常,用于治療的相關(guān)蛋白、相關(guān)肽或NTP肽以組合物形式給藥,該組合物包括純化的相關(guān)蛋白、相關(guān)肽或NTP肽,加上一種或多種生理上可接受的載體、賦形劑或稀釋劑。中性緩沖鹽水或與血清白蛋白混合的鹽水是適當(dāng)載體的范例。優(yōu)選此產(chǎn)物用合適的賦形劑(如蔗糖)制成凍干物。如果需要可包括其它標(biāo)準(zhǔn)載體、稀釋劑和賦形劑。組合物包括此領(lǐng)域普通技術(shù)人員已知的pH值范圍合適的緩沖液,包括pH7.0-8.5的Tris緩沖液、或pH 4.0-5.5的乙酸緩沖液,此緩沖液還可包括山梨醇或其合適的替代物。
對(duì)于靶向不想要的細(xì)胞成分的相關(guān)蛋白、相關(guān)肽或NTP肽偶聯(lián)的或連接或結(jié)合的抗體、抗體片段、抗體樣分子或?qū)μ禺愋阅[瘤標(biāo)記如細(xì)胞受體、信號(hào)肽或過度表達(dá)的酶有高親和性的分子,也在發(fā)明范圍內(nèi)。這些抗體、抗體片段、抗體樣分子或?qū)μ禺愋阅[瘤標(biāo)記有高親和性的分子,可用于將所述相關(guān)蛋白、相關(guān)肽或NTP肽偶聯(lián)物到特定細(xì)胞或靶組織。例如,具有特殊表面抗原或表達(dá)抗原的腫瘤可被這些抗體、抗體片段、抗體樣結(jié)合分子靶向,因而腫瘤細(xì)胞可被相關(guān)蛋白、相關(guān)肽或NTP肽所殺死。這種采用抗體靶向的方法優(yōu)點(diǎn)是降低劑量、增加結(jié)合和被靶細(xì)胞攝取的可能性、提高靶向和治療轉(zhuǎn)移性腫瘤和微小腫瘤的效率。
本發(fā)明還包括采用偶聯(lián)于或連接或結(jié)合于蛋白質(zhì)或其它分子的所述相關(guān)蛋白、相關(guān)肽和NTP肽以形成組合物,通過腫瘤-特異性或位點(diǎn)-特異性酶或蛋白酶或者通過靶向腫瘤或其它不想要的細(xì)胞的抗體偶聯(lián)物,在腫瘤或其它不想要的細(xì)胞部位或附近裂解時(shí),在腫瘤或其它不想要的細(xì)胞的部位或附近釋放相關(guān)蛋白、相關(guān)肽或NTP肽。
本發(fā)明還包括采用偶聯(lián)于或連接或結(jié)合于蛋白質(zhì)或其它分子的所述相關(guān)蛋白、相關(guān)肽和NTP肽以形成組合物,在待治療組織暴露于光(如激光療法或其它光動(dòng)力學(xué)或光活化療法)、其它形式電磁輻射時(shí),該組合物可釋放相關(guān)蛋白、相關(guān)肽或NTP肽或相關(guān)蛋白、相關(guān)肽或NTP肽的一些生物活性片段,電磁輻射的其它形式有例如紅外線輻射、紫外線輻射、x射線或γ射線輻射、局部加熱、α或β輻射、超聲波發(fā)射或其它局部能量源。
相關(guān)蛋白、相關(guān)肽或NTP肽可單獨(dú)、一起或聯(lián)合其它藥物組合物使用,如對(duì)待治療指征合適的細(xì)胞因子、生長(zhǎng)因子、抗生素、細(xì)胞凋亡誘導(dǎo)劑、抗炎藥物和/或化療劑。
本發(fā)明還包括所述蛋白、相關(guān)肽或NTP肽的組合物,此組合物采用樹狀聚體、富勒烯和其它合成分子、聚合物及大分子,組合物中相關(guān)蛋白、相關(guān)肽或NTP肽和/或其相應(yīng)DNA分子本身或與其它種類分子如腫瘤特異性標(biāo)記偶聯(lián)、結(jié)合于或包裹在上述分子、聚合物或大分子中。例如,美國(guó)專利號(hào)5,714,166《生物活性和/或靶樹狀聚體結(jié)合物》(Bioactive and/or Targeted Dendrimer Conjugates)提供了制備和利用靶樹狀聚合偶聯(lián)物的方法,此種偶聯(lián)物包括至少一種樹狀聚體和靶指示物以及至少一種與之偶聯(lián)的生物活性劑劑。
本發(fā)明還包括所述相關(guān)蛋白、相關(guān)肽或NTP肽和/或基因及藥物遞送載體的治療性組合物,遞送載體有例如脂質(zhì)乳劑、膠束聚合物、聚合物微球、電活化聚合物、水凝膠和脂質(zhì)體。
采用可轉(zhuǎn)運(yùn)到不想要細(xì)胞的相關(guān)蛋白、相關(guān)肽或NTP肽或相關(guān)基因或基因同等物也在本發(fā)明范圍內(nèi)。腫瘤內(nèi)過度表達(dá)所述相關(guān)蛋白、相關(guān)肽或NTP肽可用于誘導(dǎo)腫瘤中的細(xì)胞死亡并因而減少腫瘤細(xì)胞群。采用能轉(zhuǎn)運(yùn)所述相關(guān)蛋白、相關(guān)肽或NTP肽以治療不想要的細(xì)胞成分的基因或基因同等物,其優(yōu)點(diǎn)是所需劑量更少、可通過靶細(xì)胞分子的細(xì)胞后代傳代,治療次數(shù)必然減少、總體治療減少。本發(fā)明還包括將編碼含相關(guān)蛋白、相關(guān)肽或NTP肽的融合蛋白的基因轉(zhuǎn)運(yùn)給不想要的細(xì)胞或其鄰近細(xì)胞,表達(dá)該基因及產(chǎn)生和/或分泌此融合蛋白后,此融合蛋白受到天然酶或蛋白酶或者前體藥物的切割可釋放出所述相關(guān)蛋白、相關(guān)肽或NTP肽到不想要的細(xì)胞或附近。
應(yīng)用克隆的重組相關(guān)蛋白-、相關(guān)肽-或NTP肽-抗體偶聯(lián)物;克隆的重組相關(guān)蛋白、、相關(guān)肽、或NTP肽-抗體片段偶聯(lián)物;克隆的重組相關(guān)蛋白-、相關(guān)肽-或NTP肽-抗體樣蛋白偶聯(lián)物也包括在本發(fā)明范圍內(nèi)。與尋靶偶聯(lián)物(如抗體、抗體片段、抗體樣分子或者對(duì)癌特異性受體或其它腫瘤標(biāo)記有高親和性的分子)結(jié)合的克隆的所述相關(guān)蛋白、相關(guān)肽或NTP肽的優(yōu)點(diǎn),是這種分子兼有上述尋靶優(yōu)點(diǎn),及可制造和標(biāo)準(zhǔn)化生產(chǎn)克隆的偶聯(lián)分子的優(yōu)點(diǎn)。
口服給藥的固體劑量形式包括但不限于膠囊、片劑、藥丸、粉末和顆粒。在這種固體劑量形式中,優(yōu)選將活性化合物與至少一種下列物質(zhì)混合(a)一種或多種惰性賦形劑(或載體),如檸檬酸鈉或磷酸二鈣;(b)填充劑或膨脹劑,如淀粉、乳糖、蔗糖、葡萄糖、甘露醇和硅酸;(c)粘合劑,如羧甲基纖維素、藻酸鹽、明膠、聚乙烯吡咯烷酮、蔗糖和阿拉伯樹膠;(d)保濕劑,如甘油;(e)崩解劑,如瓊脂-瓊脂、碳酸鈣、馬鈴薯或木薯淀粉、褐藻酸、一些復(fù)合硅酸鹽和碳酸鈉;(f)溶液緩聚劑,如石蠟;(g)吸收加速劑,如季銨化合物;(h)潤(rùn)濕劑,如乙酰醇和甘油單硬脂酸鹽;(i)吸收劑,如瓷土和斑脫土;(j)滑潤(rùn)劑,如滑石、硬脂酸鈣、硬脂酸鎂、固體聚乙二醇、月桂酰硫酸鈉和它們的混合物。就膠囊、片劑、藥丸而言,其劑量形式也可包括緩沖劑。
口服給藥的液體劑量形式包括藥學(xué)上可接受的乳劑、溶液、懸浮液、糖漿和酏劑。除了活性化合物外,液體劑量形式可包括本領(lǐng)域常用的惰性稀釋劑如水或其它溶劑、增溶劑和乳化劑。乳化劑的范例是乙醇、異丙醇、碳酸乙酯、乙酸乙酯、芐醇、苯甲酸芐酯、丙二醇、1,3-丁二醇、二甲基甲酰胺,油如棉子油、花生油、玉米胚芽油、橄欖油、蓖麻油和芝麻油,甘油、四氫糠醇、聚乙二醇、山梨聚糖的脂肪酸酯或這些物質(zhì)的混合物等。
除了這種惰性稀釋劑,該組合物也可包括輔佐劑,如潤(rùn)濕劑、乳化劑和懸浮劑、甜味劑、調(diào)味劑和香味劑。
本發(fā)明組合物中活性成分的實(shí)際劑量水平可以改變以得到治療有效量的相關(guān)蛋白、相關(guān)肽或NTP肽從而獲得對(duì)具體組合物和給藥方法的理想治療反應(yīng)。因此選擇劑量水平取決于所需的治療效果、給藥途徑、所需治療的持續(xù)時(shí)間以及其它因素。
哺乳動(dòng)物包括人的有效量可根據(jù)體表面積給藥。用于不同大小、種類的動(dòng)物和人的劑量間的相互關(guān)系(以體表的mg/M2為基礎(chǔ))的描述見E.J.Freireich等,Cancer Chemother.Rep.,50(4)219(1966)。體表面積可從個(gè)體身高體重大約確定(參見例如《科學(xué)表》(Scientific Tables),Geigy Pharmaceuticals,Ardsley,N.Y.537-538頁(yè)(1970))。
給予宿主的所述相關(guān)蛋白、相關(guān)肽或NTP肽的每日總劑量可以是單劑或分開的劑量。劑量單位組合物包含幾分之一的量可用于構(gòu)成每天劑量。然而要理解的是,任何具體病人的特定劑量水平取決于多種因素,包括體重、整體健康、性別、飲食、給藥時(shí)間和途徑、所給藥物的效力、吸收和排泄的比例、聯(lián)用的其它藥物以及所治療具體疾病的嚴(yán)重性。
給予本發(fā)明的相關(guān)蛋白、相關(guān)肽或NTP肽組合物的方法,包括但不限于肌肉內(nèi)、口服、靜脈內(nèi)、腹膜內(nèi)、大腦內(nèi)(實(shí)質(zhì)內(nèi))、腦心室內(nèi)、腫瘤內(nèi)、病灶內(nèi)、皮內(nèi)、鞘內(nèi)、鼻內(nèi)、眼內(nèi)、動(dòng)脈內(nèi)、局部、透皮、通過氣霧劑、輸注、推射、植入裝置、緩釋系統(tǒng)等。
另一種給予本發(fā)明的相關(guān)蛋白、相關(guān)肽或NTP肽組合物的方法,是經(jīng)皮或透皮途徑。這種實(shí)施方案的一個(gè)例子是使用貼片。具體是,貼片可用相關(guān)蛋白、相關(guān)肽或NTP肽的精細(xì)懸浮液制備,例如二甲亞砜(DMSO)或DMSO與棉子油的混合物,使其接觸攜帶腫瘤的哺乳動(dòng)物皮膚,離開皮膚囊(pouch)內(nèi)腫瘤定位部位。含有其它溶劑和固體支持物的其它介質(zhì)或其混合物也可同樣起作用。此貼片可包含溶液或懸浮液形式的所述相關(guān)蛋白、相關(guān)肽或NTP肽化合物。然后可將貼片應(yīng)用于病人皮膚,例如將它插入病人的皮膚囊,此種皮膚囊可通過用縫針、夾子或其它夾持裝置折疊皮膚并夾持在一起來(lái)形成。應(yīng)確保囊與皮膚連續(xù)接觸而不干擾哺乳動(dòng)物。除了使用皮膚囊,可使用任何能保證牢固放置的貼片與皮膚接觸的裝置。例如,粘附繃帶可用來(lái)保持貼片在皮膚上。
所述相關(guān)蛋白、相關(guān)肽或NTP肽可以緩釋制劑或制品給藥。緩釋制劑的合適例子包括成形物質(zhì)形式的半透性聚合物基質(zhì),如薄膜或微膠囊。緩釋基質(zhì)包括聚酯、水凝膠、聚交酯(美國(guó)3,773,919、EP58,481)、L-谷氨酸和γ乙基-L-谷氨酰胺的共聚物(Sidman等,Biopolymers,22547-556)、聚(2-羥乙基-甲基丙烯酸鹽)(Langer等,J.Biomed.Mater.Res.,15167-277和Langer等,Chem.Tech.,1298-105)、乙烯乙酸聚乙烯(Langer等,同上)或聚-D(-)-3-羥基丁酸(EP133,988)。緩釋組合物也包括脂質(zhì)體,可用本領(lǐng)域已知的一些方法之一來(lái)制備(如Eppstein等,Proc.Natl.Acad.Sci.USA,823688-3692;EP 36,676;EP 88,046和EP 143,949)。
另一種給予本發(fā)明相關(guān)蛋白、相關(guān)肽或NTP肽的方法,是將相關(guān)蛋白、相關(guān)肽或NTP肽直接或間接輸入到待治療的腫瘤或其它組織中。這種實(shí)施方案的一個(gè)例子是直接注射相關(guān)蛋白、相關(guān)肽或NTP肽到待治療的腫瘤或其它組織中。此種治療可以是單次注射、一段時(shí)間多次注射或幾小時(shí)、幾天或幾個(gè)月內(nèi)一系列注射,待治療腫瘤或其它組織的消退或破壞可通過活組織檢查、攝像或其它監(jiān)測(cè)組織生長(zhǎng)的方法來(lái)監(jiān)控。可通過插入孔中如鼻、口、耳、陰道、直腸或尿道中的裝置注射到待治療的腫瘤或其它組織中或穿過切口以到達(dá)體內(nèi)的腫瘤或組織,此種注射可與攝像或光學(xué)系統(tǒng)如超聲波或纖維光鏡結(jié)合進(jìn)行,以確定注射部位是不合適。這種實(shí)施方案的另一個(gè)例子是采用可使相關(guān)蛋白、相關(guān)肽或NTP肽恒定輸入到該種組織的裝置。
又一種給予本發(fā)明相關(guān)蛋白、相關(guān)肽或NTP肽的方法是,與手術(shù)或類似的用于物理切除、消融或者殺死或破壞需要去除或破壞的腫瘤或其它組織或細(xì)胞成分的方法相結(jié)合,其中將本發(fā)明的相關(guān)蛋白、相關(guān)肽或NTP肽給予待去除的腫瘤或其它組織的周圍接近區(qū)域,以破壞或阻止腫瘤細(xì)胞的生長(zhǎng),或此方法不會(huì)除去或破壞其它的細(xì)胞成分。
另一種給予本發(fā)明相關(guān)蛋白、相關(guān)肽或NTP肽的方法是將裝置植入到待治療的腫瘤或其它組織中。這種實(shí)施方案的一個(gè)例子是將含相關(guān)蛋白、相關(guān)肽或NTP肽的薄片植入到待治療的腫瘤或其它組織中。薄片隨時(shí)可釋放治療劑量的相關(guān)蛋白、相關(guān)肽或NTP肽到該組織中。另外,該組合物可局部應(yīng)用,通過植入吸附了相關(guān)蛋白、相關(guān)肽或NTP肽的膜、海綿或其它合適物質(zhì)到受影響的區(qū)域。使用植入裝置時(shí),此裝置可植入到任何合適的組織或器官中,相關(guān)蛋白、相關(guān)肽或NTP肽的輸送可直接通過該裝置,經(jīng)推注或經(jīng)連續(xù)給藥或經(jīng)導(dǎo)管連續(xù)輸注。
另外一種給藥方法是將一個(gè)或多個(gè)拷貝的相關(guān)蛋白-、相關(guān)肽-或NTP肽-編碼基因?qū)氚屑?xì)胞,如果必要,誘導(dǎo)此基因復(fù)制開始胞內(nèi)產(chǎn)生所述相關(guān)蛋白、相關(guān)肽或NTP肽。一種可用于基因治療的方式是采用相關(guān)蛋白-、相關(guān)肽-或NTP肽-編碼基因(編碼相關(guān)蛋白、相關(guān)肽或NTP肽(或其片斷、變體、同源物或衍生物)的基因組DNA、cDNA和/或合成的DNA),可特此基因操作性連接于一組成型或可誘導(dǎo)啟動(dòng)子以形成“基因治療DNA構(gòu)建物”。只要該啟動(dòng)子在構(gòu)建物插入的細(xì)胞或組織類型中具有活性,它可與內(nèi)源性相關(guān)蛋白-、相關(guān)肽-或NTP肽-編碼基因同源或異源。如果需要,該基因治療DNA構(gòu)建物的其它成分可任選地包括設(shè)計(jì)用于位點(diǎn)特異性整合的DNA分子(如用于同源重組的內(nèi)源性側(cè)翼序列),組織特異性啟動(dòng)子、增強(qiáng)子或沉默子,能提供選擇性優(yōu)于親代細(xì)胞的DNA分子、用作鑒定轉(zhuǎn)化細(xì)胞標(biāo)記的DNA分子、陰性選擇系統(tǒng)、細(xì)胞特異結(jié)合劑(例如用于細(xì)胞靶向)、細(xì)胞特異性內(nèi)化因子、提高載體表達(dá)的轉(zhuǎn)錄因子以及能使載體生產(chǎn)的因子。
體內(nèi)或活體外輸送基因到細(xì)胞或組織中的方法,包括(但不限于)直接注射裸露DNA、彈道方法、脂質(zhì)體介導(dǎo)的轉(zhuǎn)運(yùn)、受體介導(dǎo)的轉(zhuǎn)運(yùn)(配體-DNA復(fù)合體)、電穿孔和磷酸鈣沉淀,參見美國(guó)專利號(hào)4,970,154、WO 96/40958、美國(guó)專利號(hào)5,679,559、美國(guó)專利號(hào)5,676,954和美國(guó)專利號(hào)5,593,875,其公開的內(nèi)容全部納入本文供參考。
相關(guān)蛋白-、相關(guān)肽-或NTP肽-編碼基因可通過植入患者的某些細(xì)胞中來(lái)輸送,患者的這種細(xì)胞已用本文所述方法在活體外進(jìn)行了遺傳工程改造能表達(dá)和分泌所述相關(guān)蛋白、相關(guān)肽或NTP肽或其片段、變體、同源物或衍生物。這種細(xì)胞可以是動(dòng)物或人細(xì)胞,可獲自病人自身組織或另外的人或非人來(lái)源。任選地此種細(xì)胞可以是無(wú)限增殖的細(xì)胞或可以是干細(xì)胞。然而為減少免疫應(yīng)答的機(jī)會(huì),優(yōu)選包裹這種細(xì)胞以防止向周圍組織滲透。包裹物質(zhì)一般是生物相容的半透性聚合性封閉物或膜,能使蛋白產(chǎn)物釋放但可阻止病人免疫系統(tǒng)細(xì)胞或周圍組織的其它有害因素的破壞。用于膜包裹細(xì)胞的方法是該領(lǐng)域技術(shù)人員所熟悉的,可制備包裹的細(xì)胞并植入到病人中而不需要過多的實(shí)驗(yàn)。參見例如美國(guó)專利號(hào)4,892,538;5,001,472和5,106,627,它們公布的內(nèi)容全部納入本文供參考。包裹活細(xì)胞的系統(tǒng)描述見PCTWO 91/10425。制備多種其它持續(xù)或受控制遞送方式的技術(shù)是本領(lǐng)域技術(shù)人員已知的,如脂質(zhì)體載體、生物可侵蝕的顆?;蛑?,這些技術(shù)描述見例如美國(guó)專利號(hào)5,653,975,其公開的內(nèi)容全部納入本文供參考。可裝包裹或不包裹的細(xì)胞植入到病人的適當(dāng)機(jī)體組織或器官中。
* * * *提供以下實(shí)施例以闡明本發(fā)明。然而應(yīng)理解本發(fā)明不限于這些實(shí)施例中所述的具體條件和細(xì)節(jié)。在本說明書中,任何和所有公眾可得到的文獻(xiàn)納入供參考,包括美國(guó)專利。
特別地,本發(fā)明特意包括了待審批美國(guó)專利申請(qǐng)序列號(hào)10/092,934“用神經(jīng)絲狀蛋白治療腫瘤和相關(guān)疾病的方法”中列出的實(shí)施例以供參考,此文顯示完整的AD7c-NTP蛋白是在體外膠質(zhì)瘤和成神經(jīng)細(xì)胞瘤細(xì)胞培養(yǎng)物中以及體內(nèi)正常嚙齒動(dòng)物肌肉組織、皮下結(jié)締組織和真皮中,以及多種不同人和非人來(lái)源的腫瘤(包括乳腺癌、皮膚癌和乳頭狀瘤、結(jié)腸癌、腦膠質(zhì)瘤和嚙齒動(dòng)物模型中的其它腫瘤)中造成細(xì)胞死亡的一種有效制劑。本發(fā)明還特意包括了待審批美國(guó)專利申請(qǐng)序列號(hào)10/153,334的實(shí)施例以供參考,該文顯示NTP肽是在體內(nèi)正常嚙齒動(dòng)物肌肉組織、皮下結(jié)締組織、真皮和其它組織中造成細(xì)胞死亡的有效制劑。
實(shí)施例1此實(shí)施例的目的是測(cè)定NTP肽#6對(duì)注射部位組織的作用。
用乙醚將雄性Sprague-Dawley大鼠(體重范圍300克)麻醉,并在外科手術(shù)暴露前列腺后通過前列腺內(nèi)灌輸給予NTP肽#6。注射劑包括300μl NTP肽#6、1mg/mLPBS pH 7.4(1.0mg/kg)(n=8),對(duì)照僅注射PBS(n=6),并有未注射對(duì)照(n=2)。72小時(shí)后無(wú)痛處死動(dòng)物。解剖前列腺,將其在10%的緩沖福爾馬林中固定24小時(shí),石蠟包埋,切片并用H&E染色。將每個(gè)動(dòng)物的完整前列腺包埋并切片。所有染色切片進(jìn)行組織學(xué)檢測(cè)并進(jìn)行測(cè)量。每個(gè)前列腺至少檢測(cè)4張組織切片,測(cè)量每張組織切片相互垂直(90°)的兩個(gè)截面的直徑(每個(gè)前列腺總共測(cè)量8次或以上)。用每個(gè)前列腺這些測(cè)量值的平均直徑,根據(jù)公式V=43(D2)3]]>估算體積。
結(jié)果與對(duì)照(僅注射PBS的對(duì)照和未注射的對(duì)照沒有可以覺察的變化)相比,注射了NTP肽#6的大鼠前列腺體積減小估計(jì)平均為45%。經(jīng)過處理的大鼠前列腺顯示腺上皮廣泛?jiǎn)适?、扁平和萎縮。溶于PBS(pH7.4)的NTP肽#6通常以1.0mg/kg灌輸?shù)酱笫笄傲邢伲?2小時(shí)時(shí),與未處理或PBS處理的對(duì)照相比,估計(jì)前列腺體積減小40%以上。
實(shí)施例2此實(shí)施例的目的是測(cè)定NTP肽#7對(duì)注射部位組織的作用。
給4只正常大鼠作皮內(nèi)和皮下注射,各注射四個(gè)不同的點(diǎn),四肢骨骼肌注射時(shí),各注射兩個(gè)不同的點(diǎn),通過不銹鋼26號(hào)針頭從塑料注射器輸注0.1-1mg/ml濃度的100-400ml鹽水配的NTP肽#7。
觀察動(dòng)物24小時(shí)且在24小時(shí)后無(wú)痛處死動(dòng)物。切取各滲透灶,固定在10%福爾馬林中,石蠟包埋,染色并用標(biāo)準(zhǔn)組織病理學(xué)方法檢測(cè)。
對(duì)照僅接受鹽水注射。
結(jié)果注射NTP肽#7后注射部位產(chǎn)生急性組織壞死。壞死在NTP肽#7注射部位的肌肉組織、皮下結(jié)締組織和真皮中明顯。壞死與注射區(qū)域相關(guān)連,似乎不擴(kuò)散到離注射部分很遠(yuǎn)。
遠(yuǎn)離炎癥的輕度區(qū)域,對(duì)照沒有顯示出壞死或細(xì)胞損失。對(duì)照顯示出極少或沒有肌肉變化。對(duì)照注射在注射部位有輕度至極小的急性炎癥及針頭引起的灶性微出血。
實(shí)施例3此實(shí)施例的目的是測(cè)定相關(guān)肽#1對(duì)注射部位組織的作用。
如上述實(shí)施例2那樣給大鼠作皮膚和皮下注射相關(guān)肽#1。
觀察動(dòng)物24小時(shí)且在24小時(shí)無(wú)痛處死動(dòng)物。切取組織,固定在10%福爾馬林中,石蠟包埋,染色并用標(biāo)準(zhǔn)組織病理學(xué)方法檢測(cè)。
對(duì)照與實(shí)施例2相同。
結(jié)果注射相關(guān)肽#1在注射部位產(chǎn)生細(xì)胞死亡和組織壞死。與上述實(shí)施例2類似,細(xì)胞死亡出現(xiàn)在注射了相關(guān)肽#1的肌肉組織、皮下結(jié)締組織和真皮中。
遠(yuǎn)離炎癥的輕度區(qū)域,對(duì)照顯示出很輕微的壞死或細(xì)胞損失。對(duì)照注射在注射部位有輕度至很小的急性炎癥偶有針頭引起的灶性微出血。
實(shí)施例4此實(shí)施例的目的是測(cè)定相關(guān)肽#2對(duì)注射部位組織的作用。
用乙醚將雄性Sprague-Dawley大鼠(體重范圍300克)麻醉,并外科手術(shù)暴露前列腺后通過前列腺內(nèi)灌輸給予相關(guān)肽#2。注射劑包括300μl相關(guān)肽#2、1mg/mLPBS pH 7.4(1.0mg/kg)(n=8),對(duì)照僅注射PBS(n=6),并有未注射的對(duì)照(n=2)。72小時(shí)后無(wú)痛處死動(dòng)物。解剖前列腺,將其在10%的緩沖福爾馬林中固定24小時(shí),石蠟包埋,切片并用H&E染色。將每個(gè)動(dòng)物的完整前列腺包埋并切片。所有染色切片進(jìn)行組織學(xué)檢測(cè)并進(jìn)行測(cè)量。每個(gè)前列腺至少檢測(cè)4張組織切片,測(cè)量每張組織切片相互垂直(90°)的兩個(gè)截面的直徑(每個(gè)前列腺總共測(cè)量8次或以上)。用每個(gè)前列腺這些測(cè)量值的平均直徑,根據(jù)公式V=43(D2)3]]>估算體積。
對(duì)照與實(shí)施例1相同。
結(jié)果如上述實(shí)施例1所示,注射相關(guān)肽#2第72小時(shí)造成了前列腺中顯著的細(xì)胞損失和萎縮。對(duì)照顯示出最輕微的變化或沒有變化,包括針頭引起的輕度灶性炎癥。
實(shí)施例5此實(shí)施例的目的是測(cè)定相關(guān)肽#3對(duì)注射部位組織的作用。
如實(shí)施例1和4在正常大鼠的前列腺中注射相關(guān)肽#3。72小時(shí)后無(wú)痛處死動(dòng)物并如上述實(shí)施例1和4檢測(cè)前列腺。
結(jié)果與對(duì)照相比,在72小時(shí)時(shí)發(fā)現(xiàn)顯著的細(xì)胞損失和萎縮,而對(duì)照只有最輕微的變化。
* * * *已經(jīng)參考特別優(yōu)選的實(shí)施方案和例子描述了本發(fā)明。然而,此領(lǐng)域的技術(shù)人員應(yīng)理解,可對(duì)本發(fā)明作出多種改變但不背離本發(fā)明的思路和或范圍。
權(quán)利要求
1.一種選自SEQ ID NO10-124中一種或多種的肽。
2.一種組合物,其特征在于,所述組合物含有一種或多種權(quán)利要求1所述的肽及其載體。
3.一種蛋白質(zhì),其特征在于,所述蛋白質(zhì)含有權(quán)利要求1所述肽的同源物、衍生物、片段或變體。
4.一種蛋白質(zhì),其特征在于,所述蛋白質(zhì)含有權(quán)利要求1所述肽的氨基酸序列的反-D順序的氨基酸。
5.一種蛋白質(zhì),其特征在于,所述蛋白質(zhì)包括權(quán)利要求1所述的肽,所述肽的3′或5′末端側(cè)翼具有1到25個(gè)額外的氨基酸修飾。
6.一種蛋白質(zhì),其特征在于,所述蛋白質(zhì)包含權(quán)利要求1所述的至少兩個(gè)肽。
7.一種蛋白質(zhì),其特征在于,所述蛋白質(zhì)包含權(quán)利要求1所述的至少兩個(gè)肽的重復(fù)。
8.一種如權(quán)利要求1所述的肽的模擬物。
9.一種蛋白質(zhì),其特征在于,所述蛋白質(zhì)包含與抗體、抗體片段或抗體樣分子融合的權(quán)利要求1所述的肽。
10.一種核酸,其特征在于,所述核酸編碼與權(quán)利要求1所述肽及其同源物、片段和變體相對(duì)應(yīng)的氨基酸序列。
11.一種組合物,其特征在于,所述組合物包含權(quán)利要求10所述的一種或多種核酸以及其藥學(xué)上可接受的載體。
12.一種肽,其特征在于,所述肽包含至少一段與權(quán)利要求1所述肽的部分氨基酸序列相對(duì)應(yīng)的氨基酸序列。
13.一種組合物,其特征在于,所述組合物包含權(quán)利要求12所述的一種或多種肽以及其載體。
14.一種肽,其特征在于,所述肽包含權(quán)利要求12所述肽的同源物、衍生物、片段或變體。
15.一種肽,其特征在于,所述肽含有權(quán)利要求12所述肽的氨基酸序列的反-D順序的氨基酸。
16.一種肽,其特征在于,所述肽包含權(quán)利要求12所述的肽,所述肽的3′或5′末端側(cè)翼具有1到25個(gè)額外的氨基酸修飾。
17.一種肽,其特征在于,所述肽包含權(quán)利要求12所述的至少兩個(gè)肽。
18.一種肽,其特征在于,所述肽包含權(quán)利要求12所述的至少兩個(gè)肽的重復(fù)。
19.一種如權(quán)利要求12所述的肽的模擬物。
20.一種肽,其特征在于,所述肽包括與抗體、抗體片段或抗體樣分子融合的權(quán)利要求12所述的肽。
21.一種核酸,其特征在于,所述核酸編碼與權(quán)利要求12所述肽相對(duì)應(yīng)的氨基酸序列。
22.一種組合物,其特征在于,所述組合物包含權(quán)利要求21所述的一種或多種核酸以及其藥學(xué)上可接受的載體。
23.一種治療患者疾病的方法,所述疾病需要除去或破壞細(xì)胞,其特征在于,所述方法包括給予需要治療的哺乳動(dòng)物治療有效量的權(quán)利要求1-23中任一項(xiàng)所述的肽、模擬物、核酸或組合物。
24.如權(quán)利要求23所述的方法,其特征在于,所述給藥方法選自口服、皮下、皮內(nèi)、鼻內(nèi)、靜脈內(nèi)、肌肉內(nèi)、鞘內(nèi)、鼻內(nèi)、腫瘤內(nèi)、局部和透皮。
25.如權(quán)利要求23所述的方法,其特征在于,所述治療劑在選用手術(shù)切除、移植、嫁接、化療、免疫治療、疫苗接種、熱或電消融、冷凍療法和激光療法、光療、基因治療和放射療法治療患者之前、期間或之后給予患者。
26.如權(quán)利要求23所述的方法,其特征在于,所述疾病是選自以下組織的良性或惡性腫瘤即肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮膚、腎、竇、結(jié)腸、腸、胃、直腸、食道、心、脾、唾液腺、血液、大腦和其覆蓋物、脊髓和其覆蓋物、肌肉、結(jié)締組織、腎上腺、副甲狀腺、甲狀腺、子宮、睪丸、垂體、生殖器、肝臟、膽囊、眼、耳、鼻、喉、扁桃腺、口、淋巴結(jié)和淋巴組織。
27.如權(quán)利要求23所述的方法,其特征在于,所述疾病是選自以下組織的增生、肥大或過度生長(zhǎng)即肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮膚、腎、竇、結(jié)腸、腸、胃、直腸、食道、心、脾、唾液腺、血液、大腦和其覆蓋物、脊髓和其覆蓋物、肌肉、結(jié)締組織、腎上腺、副甲狀腺、甲狀腺、子宮、睪丸、垂體、生殖器、肝臟、膽囊、眼、耳、鼻、喉、扁桃腺、口、淋巴結(jié)和淋巴組織。
28.如權(quán)利要求23所述的方法,其特征在于,所述疾病是受病毒、細(xì)菌或寄生蟲改變的組織,這些組織選自肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮膚、腎、竇、結(jié)腸、腸、胃、直腸、食道、心、脾、唾液腺、血液、大腦和其覆蓋物、脊髓和其覆蓋物、肌肉、結(jié)締組織、腎上腺、副甲狀腺、甲狀腺、子宮、睪丸、垂體、生殖器、肝臟、膽囊、眼、耳、鼻、喉、扁桃腺、口、淋巴結(jié)和淋巴組織。
29.如權(quán)利要求23所述的方法,其特征在于,所述疾病是選自以下組織的畸形即肺、乳房、胃、胰、前列腺、膀胱、骨、卵巢、皮膚、腎、竇、結(jié)腸、腸、胃、直腸、食道、心、脾、唾液腺、血液、大腦和其覆蓋物、脊髓和其覆蓋物、肌肉、結(jié)締組織、腎上腺、副甲狀腺、甲狀腺、子宮、睪丸、垂體、生殖器、肝臟、膽囊、眼、耳、鼻、喉、扁桃腺、口、淋巴結(jié)和淋巴組織。
30.如權(quán)利要求26所述的方法,其特征在于,所述組織是淋巴組織。
31.如權(quán)利要求23所述的方法,其特征在于,所述疾病是扁桃體肥大。
32.如權(quán)利要求23所述的方法,其特征在于,所述疾病是前列腺增生。
33.如權(quán)利要求23所述的方法,其特征在于,所述疾病是銀屑病。
34.如權(quán)利要求23所述的方法,其特征在于,所述疾病是濕疹。
35.如權(quán)利要求23所述的方法,其特征在于,所述疾病是皮膚病。
36.如權(quán)利要求23所述的方法,其特征在于,所述疾病是對(duì)組織的整容修飾。
37.如權(quán)利要求26所述的方法,其特征在于,所述組織是皮膚、眼、耳、鼻、喉、口、肌肉、結(jié)締組織、毛發(fā)和乳房。
38.如權(quán)利要求23所述的方法,其特征在于,所述疾病是血管病。
39.如權(quán)利要求23所述的方法,其特征在于,所述疾病是痔。
40.如權(quán)利要求23所述的方法,其特征在于,所述疾病是靜脈曲張。
41.如權(quán)利要求38所述的方法,其特征在于,所述血管病是動(dòng)脈粥樣硬化或動(dòng)脈硬化。
42.如權(quán)利要求23所述的方法,其特征在于,所述疾病選自炎性疾病、自身免疫疾病、代謝疾病、遺傳疾病、創(chuàng)傷性疾病或身理?yè)p傷、營(yíng)養(yǎng)缺乏性疾病、傳染病、淀粉樣變疾病、纖維變性病、貯積病、先天性畸形、酶缺乏性疾病、中毒、致醉、環(huán)境病、輻射病、內(nèi)分泌疾病、變性疾病和機(jī)械性損傷疾病。
43.如權(quán)利要求23所述的方法,其特征在于,所述肽衍生自胰絲狀蛋白的氨基酸序列。
44.如權(quán)利要求23所述的方法,其特征在于,所述肽偶聯(lián)于、連接于或結(jié)合于選自抗體、抗體片段和抗體樣結(jié)合分子的分子,其中所述分子與腫瘤或其它靶結(jié)合的親和力高于與其它細(xì)胞結(jié)合的親和力。
45.如權(quán)利要求23所述的方法,其特征在于,所述肽是一新克隆的重組分子的一部分,該重組分子由所述肽和選自抗體、抗體片段和抗體樣結(jié)合分子的分子組成,其中所述分子與腫瘤或其它靶結(jié)合的親和力高于與其它細(xì)胞結(jié)合的親和力。
46.一種肽,其特征在于,所述肽含有至少一種選自以下的肽(i)具有SEQ ID NO15(Ile-Asp-Gln-Gln-Val-Leu-Ser-Arg-Ile-Lys-Leu-Glu-Ile-Lys-Arg-Cys-Leu)所代表的氨基酸序列的肽;或(ii)具有SEQ ID NO18(Gln-Gln-Ser-Ile-Ala-Val-Lys-Phe-Leu-Ala-Val-Phe-Gly-Val-Ser-Ile)所代表的氨基酸序列的肽。
全文摘要
本發(fā)明涉及用于治療需要除去或破壞患者的有害細(xì)胞或不想要的組織的疾病的肽,組合物和方法,該方法采用含有衍生自神經(jīng)絲狀蛋白至少一種氨基酸序列和其它相關(guān)分子的蛋白質(zhì),和衍生自該蛋白質(zhì)氨基酸序列的肽進(jìn)行治療。
文檔編號(hào)A61KGK1714101SQ02818332
公開日2005年12月28日 申請(qǐng)日期2002年7月19日 優(yōu)先權(quán)日2001年7月19日
發(fā)明者P·A·艾弗白克, J·杰梅爾 申請(qǐng)人:尼莫克斯股份有限公司