專利名稱:識(shí)別蛋白質(zhì)中大分子結(jié)合區(qū)域和易聚集區(qū)域的方法及其用途的制作方法
識(shí)別蛋白質(zhì)中大分子結(jié)合區(qū)域和易聚集區(qū)域的方法及其用
途
背景技術(shù):
了解和控制蛋白質(zhì)穩(wěn)定性已成為生物學(xué)家、化學(xué)家和工程師渴望的努力。氨基酸 取代和疾病之間的第一個(gè)聯(lián)系(Ingram. Nature. 1957,180(4581) :326-8.)提供了健康和 疾病中對(duì)蛋白質(zhì)穩(wěn)定性的新的和重要的看法?;诘鞍踪|(zhì)的藥物的近來(lái)巨大增長(zhǎng)已產(chǎn)生了 新的挑戰(zhàn)。將治療用蛋白質(zhì)在非常高的濃度下以液體貯藏幾個(gè)月。非單體種類的百分比隨 著時(shí)間增加。隨著聚集體形成,不但產(chǎn)品的效能降低,而且副作用諸如對(duì)給藥的免疫應(yīng)答可 發(fā)生。保證蛋白質(zhì)藥物的穩(wěn)定性對(duì)于產(chǎn)品的貯存期限是必要的。由于抗體在各種疾病治療中的潛能,抗體目前構(gòu)成人類治療學(xué)中增長(zhǎng)最快速 的種類(Carter. Nature Reviews Immunology. 2006,6 (5),;343)。自從 2001 年,抗體市 場(chǎng)一直在以35%的平均年增長(zhǎng)率——所有種類生物技術(shù)藥物之中最高的速率——增長(zhǎng) (S. Aggarwal, Nature.BioTech. 2007,25(10) 1097)。如疾病治療所需要的,治療用抗體以高濃度在水溶液中制備和貯藏。然而,這些抗 體在這些條件下在熱力學(xué)上是不穩(wěn)定的,并由于聚集而降解。這種聚集進(jìn)而導(dǎo)致抗體活性 的降低,使藥物無(wú)效,甚至能產(chǎn)生免疫應(yīng)答。像這樣,存在迫切的需要來(lái)開發(fā)這些抗體,實(shí)際 上一般而言是蛋白質(zhì),如何聚集的機(jī)制了解,以發(fā)現(xiàn)蛋白質(zhì)的什么區(qū)域參與聚集和發(fā)展阻 止聚集的策略。這些作用對(duì)抗體治療學(xué)特別重要??贵w穩(wěn)定的一個(gè)方法是將授予抗原結(jié)合特異性 的 CDR 環(huán)移植至Ij更穩(wěn)、定的框架上(Ewert, Honegger, and Pluckthun, Biochemistry. 2003, 42(6) :1517-28.)。只有在CDR環(huán)中的氨基酸序列不是驅(qū)動(dòng)聚集力的情況下,以及在將CDR 環(huán)移植到更穩(wěn)定的框架不改變抗原結(jié)合特異性的情況下,該方法才起作用。可將與預(yù)測(cè)蛋白質(zhì)易聚集區(qū)域相關(guān)的技術(shù)分成兩類,1)唯象模型 (Phenomenological models)和2)分子模擬技術(shù)。唯象模型主要是基于使用性質(zhì)諸如疏水 性、β-折疊傾向等預(yù)測(cè)來(lái)自蛋白質(zhì)一級(jí)序列的聚集‘熱點(diǎn)’,而分子模擬技術(shù)使用蛋白質(zhì)的 三維結(jié)構(gòu)和動(dòng)力學(xué)來(lái)定位易聚集區(qū)域。這些技術(shù)中的大部分已指向了解淀粉樣蛋白原纖維 形成和其它小蛋白的聚集,其中折疊形成是主要的。已基于理化性質(zhì)諸如疏水性、折疊傾向等發(fā)展了唯象模型以預(yù)測(cè)來(lái)自蛋白質(zhì) 一級(jí)序列的易聚集區(qū)域(Caflisch,Current Opinion in Chemical Biology. 2006,10, 437-444 ;Chiti and Dobson. Annu. Rev. Biochem. 2006,75 :333-366)。一個(gè)最初的唯象模型 是基于小的球狀蛋白質(zhì)‘人肌肉?;姿崦?AcP) ’連同其它的非結(jié)構(gòu)化肽(unstructured peptides)和天然未折疊的蛋白質(zhì)的聚集的動(dòng)力學(xué)突變研究(Chiti,etal. Nature. 2003, 424p. 805-808 ;U. S. Pat. No. 7379824] 該研究顯示聚集與理化性質(zhì)諸如β-折疊傾向、 疏水性和電荷之間的簡(jiǎn)單關(guān)聯(lián)。這些研究是在蛋白質(zhì)主要是非結(jié)構(gòu)化的條件下進(jìn)行的。 因此發(fā)展了將序列與聚集傾向聯(lián)系的三參數(shù)經(jīng)驗(yàn)?zāi)P?Chiti,et al. Nature. 2003,424, 805-808)。該模型還用于提示32個(gè)殘基的肽類激素降鈣素的變體以降低其聚集傾向 (Fowler, et al. Proc Natl Acad Sci USA. 2005,102,10105-10110.)。DuBay 和同事已將三參數(shù)方程(Chiti,et al. Nature. 2003,424,805-808)擴(kuò)展到包括多肽鏈的內(nèi)在性質(zhì) 和與環(huán)境相關(guān)的外在因素諸如肽濃度、溶液的PH值和離子強(qiáng)度的七參數(shù)公式(DiAay,et al. J Mol Biol. 2004,341,1317-1326)。使用該模型,他們能再現(xiàn)寬范圍的非結(jié)構(gòu)化肽和 蛋白質(zhì)的體外聚集率。然而,該七參數(shù)模型的主要限制是給予序列中的所有殘基相同的相 對(duì)重要性。這與實(shí)驗(yàn)和模擬觀察結(jié)果不一致,實(shí)驗(yàn)和模擬觀察結(jié)果顯示根據(jù)它們的二級(jí)結(jié) 構(gòu)傾向,某些區(qū)域較其它區(qū)域更重要。最近,將該分析進(jìn)一步擴(kuò)展,包括保護(hù)因子以描述結(jié) 構(gòu)化多月太鏈的聚集(Tartaglia, G. G.,Pawar, A. P.,Campioni, S, Dobson, C. M.,Chiti, F., and Vendruscolo, Μ. J Mol Biol (2008) in press)。預(yù)測(cè)的位點(diǎn)中的一些與蛋白質(zhì)諸如 溶菌酶、肌紅蛋白等的已知易聚集位點(diǎn)一致。發(fā)展了無(wú)自由參數(shù)的唯象模型(Tartaglia, et al. Protein Sci.2004,13,1939-1941 ;Tartaglia et al.ProteinSci. 2005, 14, 2723-2734)以預(yù)測(cè)突變后聚集原纖維的延伸率的變化和識(shí)別易聚集區(qū)段。使用的理化性質(zhì) 是突變后β傾向的變化、芳香族殘基數(shù)目的變化和總電荷的變化。此外,如果野生型和突 變側(cè)鏈都是極性的或都是非極性的,考慮可及表面區(qū)域的比率,而在非極性到極性(或極 性到非極性)突變的情況下使用極性側(cè)鏈的偶極矩。該模型再現(xiàn)了一組沈個(gè)七肽序列的 相對(duì)聚集傾向,預(yù)測(cè)其偏愛(ài)全符合狀態(tài)(in-register)平行β-折疊排列。已改進(jìn)了 DuBay 和同事的模型(Dubay et al. J Mol Biol. 2004,341,1317-1326), 其中包含α -螺旋傾向和疏水圖案,和比較給定的氨基酸序列的聚集傾向得分與為一組相 似長(zhǎng)度的序列計(jì)算的平均傾向(Pawar, et al.,J Mol Biol. 2005,350,379-392)。已在三 個(gè)天然未折疊的多肽鏈Aβ 42、α突觸核蛋白和tau蛋白的易聚集區(qū)段上驗(yàn)證了該模型。發(fā)展了另一個(gè)稱作 TANGO 的算法(Fernandez-Escami 11a,et al.,Nat Biotechnol. 2004,22,1302-1306),其平衡相同的理化參數(shù),附帶有氨基酸以聚集的狀態(tài)被 完全埋入的假設(shè)。這是基于二級(jí)結(jié)構(gòu)傾向和去溶劑化處罰的估計(jì)以預(yù)測(cè)蛋白序列的β聚 集區(qū)域以及突變作用。與較早討論的模型相反,通過(guò)使用FOLD-X力場(chǎng),TANGO考慮了天然 狀態(tài)穩(wěn)定性。盡管,不可能用TANGO計(jì)算絕對(duì)聚集率,但是它提供了序列顯著不同的肽或蛋 白質(zhì)之間的定性比較。Serrano 和同事(Linding, et al.,J MolBiol. 2004,342,345-353) 已使用TANGO分析一組具有40%序列同一性上限的非冗余球狀蛋白質(zhì)的β聚集傾向。最近,通過(guò)為在β-折疊內(nèi)互相面對(duì)的殘基編輯配對(duì)能量函數(shù)而引入了另外的 算法,淀粉樣蛋白結(jié)構(gòu)聚集的預(yù)測(cè)(Erediction of Amyloid StrucTure Aggregation) (PASTA)(Trovato, et al. , Protein Engineering, Design&Selection.2007,20 (10), 521-523 ;Trovato, et al. , PLoS Comput. Biol. 2006,2,1608-1618 ;Trovato et al., J. Phys. =Condens. Matter. 200719,285221)。以三級(jí)接觸的數(shù)目為條件,Yoon 和 Welsh(Yoonand Welsh, Protein Sci. 2004,13 :2149-2160)已發(fā)展了用于檢測(cè)蛋白區(qū)段 β聚集傾向的基于結(jié)構(gòu)的方法。使用滑動(dòng)的七殘基窗,提示在緊密包裝的環(huán)境中具有強(qiáng) β-折疊傾向的區(qū)段(即具有大量的三級(jí)接觸)為原纖維形成的局部介質(zhì)。雖然上面描述的唯象模型顯示對(duì)小肽和變性蛋白進(jìn)行良好,但是聚集傾向?qū)η驙?蛋白質(zhì)諸如抗體可不同,其中天然狀態(tài)的三級(jí)結(jié)構(gòu)和穩(wěn)定性是非常重要的。用于預(yù)測(cè)易聚集區(qū)域和研究聚集機(jī)制的分子模擬技術(shù)已大部分利用較簡(jiǎn)單的模 擬模型(Ma and Nussinov. Curr· Opin. Chem. Biol. 2006,10,445-452 ;Cellmer,et al., TRENDS in Biotechnology 2007,25 (6),254)。利用的模擬模型中最不詳細(xì)的是點(diǎn)陣模型,其中將每個(gè)殘基表示為占據(jù)三維點(diǎn)陣上單一位點(diǎn)的珠子。更詳細(xì)的模型,諸如中間體分辨 率模型隨之產(chǎn)生但遭受相同的不能準(zhǔn)確地代表蛋白質(zhì)二級(jí)和三級(jí)結(jié)構(gòu)。與較簡(jiǎn)單的模型不同,原子論模型包括所有的原子論細(xì)節(jié)諸如氫鍵合,并因此較 點(diǎn)陣或中間體分辨率模型更準(zhǔn)確。這樣的原子論模型已與顯式溶劑或隱式溶劑一起使用, 其中將溶劑處理為連續(xù)體。顯式模型更準(zhǔn)確但在計(jì)算上也要求多。后來(lái)發(fā)展了分子動(dòng)力學(xué) 模擬方案以獲得關(guān)于淀粉樣多肽(amyloidogenicpolyp印tide)的有序β聚集的結(jié)構(gòu)信息 (Cecchini et al.,J Mol Biol. 2006,357,1306-1321.)。然而,因?yàn)檫@樣的程序在計(jì)算上 要求非常多,尤其對(duì)于大蛋白諸如抗體,其看起來(lái)不是文獻(xiàn)中全部抗體原子論模擬。雖然如 此,已有小部分抗體的原子論模擬,大部分是針對(duì)Fab片段(N00n,et al.,,PNAS. 2002,99, 6466 ;Sinha andSmith-Gill, Cell Biochemistry and Biophysics. 2005,43,253)。用于阻止抗體聚集的許多現(xiàn)存的方法利用蛋白制劑中的添加劑的使用。這與本 文描述的直接方法不同,在該直接方法中抗體本身基于從分子模擬預(yù)測(cè)的易聚集區(qū)域被修 飾。在抗體穩(wěn)定中通常使用的添加劑是含氮堿基的鹽諸如精氨酸、胍或咪唑(EP0025275)。 用于穩(wěn)定的其它合適的添加劑是聚醚(EPA0018609)、甘油、白蛋白和硫酸葡聚糖(美 國(guó)專利號(hào)4808705)、去垢劑和表面活性劑諸如基于聚山梨酯80的表面活性劑(公布 文本DA2652636和公布文本GB2175906 (英國(guó)專利申請(qǐng)?zhí)朑B8514349))、蛋白伴侶諸如 GroEL (Mendoza, Biotechnol. Tech. 1991,(10) 535-540)、檸檬酸鹽緩沖劑(W09322335)或 螯合劑(W09115509)。盡管這些添加劑在一定程度上使蛋白在溶液中變得穩(wěn)定,但是它們?cè)?受到某些缺點(diǎn)諸如用于添加劑去除的另外處理的必要性。因此,需要新方法來(lái)了解涉及蛋 白聚集的機(jī)制和識(shí)別介導(dǎo)該現(xiàn)象的蛋白區(qū)域。這樣的方法在許多診斷和治療區(qū)域?qū)⑹怯杏?的,并將允許蛋白組合物,諸如抗體治療,成為直接穩(wěn)定的,不需要添加劑的使用。發(fā)明概述本發(fā)明提供至少部分基于計(jì)算機(jī)模擬的方法和計(jì)算工具,其識(shí)別蛋白質(zhì)的易聚集 區(qū)域。然后可在這些易聚集區(qū)域進(jìn)行替代以設(shè)計(jì)具有增強(qiáng)的穩(wěn)定性和/或降低的聚集傾向 的蛋白。此外,本發(fā)明提供至少部分基于計(jì)算機(jī)模擬的方法和計(jì)算工具,其識(shí)別蛋白質(zhì)的 大分子結(jié)合區(qū)域。然后可在這些大分子結(jié)合區(qū)域進(jìn)行替代和缺失以設(shè)計(jì)具有改變的對(duì)大分 子的結(jié)合親合力的蛋白。一方面,本發(fā)明提供針對(duì)蛋白質(zhì)中的特定原子計(jì)算空間聚集傾向 (Spatial-Aggregation-Propensity) (SAP)的方法,包括(a)識(shí)別代表蛋白質(zhì)的結(jié)構(gòu)模型 中的一個(gè)或多個(gè)原子,其中一個(gè)或多個(gè)原子位于集中于特定原子上或其附近的限定空間區(qū) 域內(nèi);(b)針對(duì)限定空間區(qū)域中的一個(gè)或多個(gè)原子,計(jì)算原子的溶劑可及面積(SAA)與完全 暴露的同一殘基中的原子的SAA的比;(c)用一個(gè)或多個(gè)原子的原子疏水性乘以每個(gè)比;和 (d)合計(jì)步驟(c)的乘積;借此該和是針對(duì)特定原子的SAP。在相關(guān)的實(shí)施方式中,針對(duì)蛋白質(zhì)中的特定原子計(jì)算空間聚集傾向(SAP)的方法 包括(a)識(shí)別代表蛋白質(zhì)的結(jié)構(gòu)模型中的一個(gè)或多個(gè)氨基酸殘基,其中一個(gè)或多個(gè)氨基酸 殘基具有集中于特定原子上或其附近的限定空間區(qū)域內(nèi)的至少一個(gè)原子;(b)針對(duì)限定空 間區(qū)域中的原子,計(jì)算原子的溶劑可及面積(SAA)與完全暴露的同一殘基中的原子的SAA 的比;(c)用如通過(guò)氨基酸疏水性標(biāo)度所測(cè)定的一個(gè)或多個(gè)氨基酸殘基的疏水性乘以每個(gè)比;和(d)合計(jì)步驟(c)的乘積;借此該和是針對(duì)特定原子的SAP。應(yīng)當(dāng)理解在特定的實(shí)施方式中,限定的空間區(qū)域是任何3維體積或區(qū)域。在具體 的實(shí)施方式中,限定的空間區(qū)域選自球體、立方體、圓柱體、錐體和橢圓的球狀體。在一些實(shí) 施方式中,限定的空間區(qū)域是具有與具有1-30A之間或更大半徑的球體相等的體積的區(qū)域。 在一些實(shí)施方式中,該半徑可以是50A或更大。在一些優(yōu)選實(shí)施方式中限定的空間區(qū)域的半 徑是5Α_θΑ。在優(yōu)選實(shí)施方式中,限定的空間區(qū)域是具有1-30A半徑的球體。在一些實(shí)施方式中 將該球體集中在特定的原子上,而在其它的實(shí)施方式中,將限定的空間區(qū)域或球體集中在 化學(xué)鍵中或集中在空間上接近將在其上計(jì)算SAP的原子的點(diǎn)上。在一些實(shí)施方式將限定的空間區(qū)域集中在空間上距特定原子30A內(nèi)的點(diǎn)上,或在 一些優(yōu)選實(shí)施方式中將限定的空間區(qū)域集中在空間上距特定原子20A內(nèi)、IOA內(nèi)、5A內(nèi)、2A 內(nèi)、IA內(nèi)的點(diǎn)上。在一些實(shí)施方式中,限定的空間區(qū)域內(nèi)的一個(gè)或多個(gè)原子是一個(gè)或多個(gè)氨基酸的 側(cè)鏈中的原子。在另外的實(shí)施方式中,結(jié)構(gòu)模型中選擇的半徑內(nèi)的一個(gè)或多個(gè)原子可以位于或需 要位于一個(gè)或多個(gè)氨基酸的側(cè)鏈中??蛇x地,結(jié)構(gòu)模型中選擇的半徑內(nèi)的一個(gè)或多個(gè)原子 可以是或需要是一個(gè)或多個(gè)氨基酸的主鏈原子。在一些實(shí)施方式中,可只在氨基酸側(cè)鏈的原子上計(jì)算溶劑可及面積 (SolventAccessibleArea) (SAA),其是SAP計(jì)算的部分,或在一些實(shí)施方式中只在主鏈原 子上。主鏈原子可包括或可不包括附著的氫原子。在一些特別優(yōu)選的實(shí)施方式中,在SAP的計(jì)算之前,例如通過(guò)進(jìn)行分子動(dòng)力學(xué)模 擬處理蛋白質(zhì)結(jié)構(gòu)模型,該模擬任選地包括溶劑。該溶劑可以是水、本領(lǐng)域已知的另一溶 劑,或可缺少該溶劑。在一些特別優(yōu)選的實(shí)施方式中,在SAP的計(jì)算之前,例如通過(guò)進(jìn)行 Monte Carlo模擬處理蛋白質(zhì)結(jié)構(gòu)模型。在另一個(gè)方面,SAP的計(jì)算可進(jìn)一步包括進(jìn)行分子動(dòng)力學(xué)模擬和求SAP值的平均 數(shù),該值是通過(guò)分子動(dòng)力學(xué)模擬中的多個(gè)時(shí)間步驟計(jì)算的。例如可通過(guò)在上面的步驟(a) 之前進(jìn)行分子動(dòng)力學(xué)模擬和重復(fù)步驟(a)-(d),每次以許多時(shí)間步驟進(jìn)行進(jìn)一步的分子動(dòng) 力學(xué)模擬,由此產(chǎn)生如步驟(d)中的多個(gè)和,和計(jì)算這些和的平均數(shù)來(lái)計(jì)算針對(duì)特定原子 的SAP ;借此該計(jì)算的平均數(shù)是針對(duì)特定原子的SAP。在其它的實(shí)施例中,Monte Carlo模 擬可替代分子動(dòng)力學(xué)模擬使用或與分子動(dòng)力學(xué)模擬組合使用。在另外的實(shí)施方式中,可合計(jì)多個(gè)氨基酸的SAP得分,例如在蛋白結(jié)構(gòu)模型上的 易聚集區(qū)域或表面補(bǔ)丁中的1和50個(gè)氨基酸之間進(jìn)行合計(jì)。在特別優(yōu)選的實(shí)施方式中,合 計(jì)1-20個(gè)氨基酸、1-15個(gè)氨基酸、1-10個(gè)氨基酸、1-5個(gè)氨基酸、1-3個(gè)氨基酸的SAP,或可 合計(jì)跨2個(gè)相鄰氨基酸的SAP。在一些實(shí)施方式中,可合計(jì)相鄰氨基酸,其可沿著蛋白質(zhì)序 列連續(xù)地相鄰或在蛋白質(zhì)結(jié)構(gòu)中空間地相鄰。在這些方法需要分子動(dòng)力學(xué)模擬的時(shí)候,可使用選自包括ABINIT、AMBER、 Ascalaph、CASTEP,CPMD,CHARMM、DL_P0LY、FIREBALL、GROMACS、GROMOS、LAMMPS、MDynaMiχ、 MOLDY、M0SCIT0、NAMD, Newton-X、ProtoMol、PWscf、SIESTA、VASP, TINKER、YASARA,ORAC 和 XMD的集合或由它們構(gòu)成的集合的模擬程序包進(jìn)行模擬。在特別優(yōu)選的實(shí)施方式中,模擬程
11序包是CHARMM模擬程序包。在其它的優(yōu)選實(shí)施方式中,模擬程序包是NAMD模擬程序包。在這些方法需要針對(duì)側(cè)鏈、殘基或蛋白質(zhì)內(nèi)的一個(gè)或多個(gè)原子進(jìn)行計(jì)算(例如, 針對(duì)一個(gè)或多個(gè)原子計(jì)算SAA)的時(shí)候,熟練的技術(shù)人員應(yīng)當(dāng)理解計(jì)算可針對(duì)空間區(qū)域、 側(cè)鏈、殘基、蛋白質(zhì)等中的原子、原子對(duì)、原子的組合或組、原子的部分,或針對(duì)空間區(qū)域、側(cè) 鏈、殘基、蛋白質(zhì)等中的每個(gè)原子或所有原子。當(dāng)進(jìn)行以本發(fā)明的方法學(xué)為特征的計(jì)算時(shí), 熟練的技術(shù)人員還應(yīng)當(dāng)理解也能針對(duì)包括原子、原子組等的氨基酸殘基、側(cè)鏈等進(jìn)行計(jì)算 (例如SAA計(jì)算)。在另外的優(yōu)選實(shí)施方式中,結(jié)構(gòu)模型是蛋白質(zhì)或其部分的X射線晶體結(jié)構(gòu)模型; 或結(jié)構(gòu)模型可以是蛋白質(zhì)或其部分的理論蛋白結(jié)構(gòu)模型。在相關(guān)的實(shí)施方式中,理論結(jié)構(gòu) 模型是蛋白質(zhì)或其部分的同源模型。在其它的實(shí)施方式中,理論結(jié)構(gòu)模型是蛋白質(zhì)或其部 分的從頭開始蛋白結(jié)構(gòu)模型。在另一個(gè)方面,本發(fā)明提供識(shí)別蛋白上的易聚集區(qū)域的方法。在一個(gè)實(shí)施方式中, 識(shí)別蛋白上的易聚集區(qū)域的方法包括(a)將如根據(jù)本文描述的任何方法所計(jì)算的針對(duì)蛋 白質(zhì)中原子的SAP繪制到結(jié)構(gòu)模型上;和(b)識(shí)別具有SAP > 0的許多原子的蛋白質(zhì)內(nèi)區(qū) 域;其中易聚集區(qū)域包括包含所述許多原子的氨基酸。在一些實(shí)施方式中,該方法可包括識(shí) 別一個(gè)或多個(gè)氨基酸,該氨基酸含有一個(gè)或多個(gè)具有大于所選閾值的SAP的原子,其中根 據(jù)本文描述的任何方法計(jì)算SAP,且其中易聚集區(qū)域包括識(shí)別的氨基酸。在另一個(gè)實(shí)施方式中,識(shí)別蛋白上的易聚集區(qū)域的方法包括繪制如根據(jù)本文描述 的任何方法所計(jì)算的SAP值,進(jìn)一步為圖中的峰計(jì)算曲線下面積(AUC)和識(shí)別一個(gè)或多個(gè) 具有正的AUC的蛋白區(qū)域,其中易聚集區(qū)域包括識(shí)別的蛋白區(qū)域。在另一個(gè)方面,本發(fā)明提供制備顯示降低的聚集傾向的蛋白質(zhì)變體的方法。在一 個(gè)優(yōu)選實(shí)施方式中,制備顯示降低的聚集傾向的蛋白質(zhì)變體的方法包括替代或缺失蛋白質(zhì) 中易聚集區(qū)域內(nèi)的至少一個(gè)氨基酸殘基,其中使用根據(jù)本文描述的任何方法計(jì)算的SAP得 分識(shí)別易聚集區(qū)域;以及其中,如果替代氨基酸殘基,則用更親水的氨基酸殘基替代它,這 樣變體的聚集傾向降低了。在一些特定實(shí)施方式中替代至少一個(gè)殘基并缺失至少一個(gè)殘 基。在另一個(gè)實(shí)施方式中,制備顯示降低的聚集傾向的蛋白質(zhì)變體的方法包括(a)在 每個(gè)變體中通過(guò)替代蛋白質(zhì)中易聚集區(qū)域內(nèi)的至少一個(gè)殘基而產(chǎn)生許多蛋白質(zhì)變體,其中 使用根據(jù)本文描述的任何方法計(jì)算的SAP得分識(shí)別易聚集區(qū)域,其中在每個(gè)變體中,將一 個(gè)或多個(gè)不同殘基或不同的殘基組合進(jìn)行替代;其中用更親水的殘基替代至少一個(gè)殘基; 和(b)選擇如(a)中制備的顯示降低的聚集傾向的蛋白質(zhì)變體。在一些實(shí)施方式中,選擇的用于替代的氨基酸是易聚集區(qū)域中最疏水的氨基酸 (如通過(guò)領(lǐng)域公認(rèn)的疏水性標(biāo)度所測(cè)定的)。在具體的實(shí)施方式中,選擇的用于替代的氨 基酸是 Phe, Leu、lie、Tyr、Trp, Val、Met、Pro、Cys, Ala 或 Gly0 在這樣具體的實(shí)施方式 中,被替代進(jìn)蛋白質(zhì)中的更親水的氨基酸可選自Hir、Ser, Lys, Gin、Asn、His、Glu、Asp和 Arg。通常,用于測(cè)定哪些殘基較其它的更親水或疏水或更不親水或疏水的優(yōu)選疏水性標(biāo)度 是Black和Mould疏水性標(biāo)度。在一些實(shí)施方式中替代易聚集區(qū)域內(nèi)的至少兩個(gè)氨基酸殘基。在相關(guān)的實(shí)施方式 中替代易聚集區(qū)域內(nèi)的至少三個(gè)氨基酸殘基。同樣,在相似的實(shí)施方式中替代蛋白質(zhì)內(nèi)超過(guò)一個(gè)易聚集區(qū)域內(nèi)的至少一個(gè)殘基。在優(yōu)選實(shí)施方式中,將本文描述的方法應(yīng)用于選自抗體、Fab片段、Fab’片段、Fd 片段、Fv片段、F(ab' )2片段和Fc片段的蛋白質(zhì)。在其它的優(yōu)選實(shí)施方式中,將本文描述的方法應(yīng)用于選自細(xì)胞因子、趨化因子、脂 因子(Iipokine)、肌因子(myokine)、神經(jīng)遞質(zhì)、神經(jīng)營(yíng)養(yǎng)蛋白、白細(xì)胞介素或干擾素的蛋 白。在一些具體實(shí)施方式
中,蛋白可以是激素或生長(zhǎng)因子、受體或受體域、或神經(jīng)遞質(zhì)或神 經(jīng)營(yíng)養(yǎng)蛋白。在一些實(shí)施方式中蛋白是擬肽(P印tidomimetic)、修飾的蛋白、包含非天然氨 基酸的蛋白或包含稀有氨基酸的蛋白。在另一個(gè)方面,本發(fā)明還提供計(jì)算針對(duì)蛋白質(zhì)中氨基酸殘基的有效SAA的方法。 優(yōu)選的計(jì)算針對(duì)蛋白質(zhì)中氨基酸殘基的有效SAA的方法包括(a)針對(duì)氨基酸計(jì)算氨基酸中 原子的溶劑可及面積(SAA)與完全暴露的同一殘基中原子的SAA的比;(b)用如通過(guò)氨基 酸疏水性標(biāo)度所測(cè)定的氨基酸殘基的疏水性乘以該比;借此該乘積是氨基酸的有效SAA。 此外,可通過(guò)進(jìn)一步包括合計(jì)3個(gè)氨基酸的有效SAA的方法計(jì)算蛋白質(zhì)中氨基酸殘基的有 效SAA,或在一些實(shí)施方式中2、4、5或6個(gè)氨基酸,這些氨基酸在蛋白序列中是相鄰的。在另一個(gè)方面,本發(fā)明還包括識(shí)別蛋白質(zhì)上的大分子結(jié)合區(qū)域的方法,包括(a) 將如根據(jù)先前方面中的任何一個(gè)所計(jì)算的蛋白質(zhì)中原子的SAP繪制到蛋白質(zhì)的結(jié)構(gòu)模型 上;和(b)識(shí)別具有SAP > 0的許多原子的蛋白質(zhì)內(nèi)區(qū)域;其中大分子結(jié)合區(qū)域包括,包含 所述許多原子的氨基酸。在另一個(gè)方面,本發(fā)明包括識(shí)別蛋白質(zhì)上的大分子結(jié)合區(qū)域的方法,包括識(shí)別一 個(gè)或多個(gè)氨基酸,該氨基酸含有一個(gè)或多個(gè)具有大于所選閾值的SAP的原子;其中根據(jù)先 前方面中的任何一個(gè)的方法計(jì)算SAP,且其中大分子結(jié)合區(qū)域包括識(shí)別的氨基酸。在另一個(gè)方面,本發(fā)明包括識(shí)別蛋白質(zhì)上的大分子結(jié)合區(qū)域的方法,包括繪制如 先前方面中的任何一個(gè)所計(jì)算的SAP值,為圖中的峰計(jì)算曲線下面積(AUC)和識(shí)別一個(gè)或 多個(gè)具有正的AUC的蛋白區(qū)域,其中大分子結(jié)合區(qū)域包括識(shí)別的蛋白區(qū)域。在另一個(gè)方面,本發(fā)明包括制備顯示對(duì)大分子降低的結(jié)合親和力的蛋白質(zhì)變體的 方法,包括替代或缺失針對(duì)蛋白質(zhì)中大分子的大分子結(jié)合區(qū)域內(nèi)的至少一個(gè)氨基酸殘基, 其中使用根據(jù)先前方面中的任何一個(gè)計(jì)算的SAP得分識(shí)別大分子結(jié)合區(qū)域;并且其中,如 果替代氨基酸殘基,則用更親水的氨基酸殘基替代它,這樣降低了變體的大分子結(jié)合親和 力。在某些實(shí)施方式中替代至少一個(gè)殘基并缺失至少一個(gè)殘基。在另一個(gè)方面,本發(fā)明還包 括制備顯示對(duì)大分子改變的結(jié)合親和力的蛋白質(zhì)變體的方法,包括(a)在每個(gè)變體中通過(guò) 替代針對(duì)蛋白質(zhì)中大分子的大分子結(jié)合區(qū)域內(nèi)的至少一個(gè)殘基,產(chǎn)生許多蛋白質(zhì)變體,其 中使用根據(jù)先前方面中的任何一個(gè)所計(jì)算的SAP得分識(shí)別大分子結(jié)合區(qū)域,其中在每個(gè)變 體中,替代一個(gè)或不同殘基或不同的殘基組合;和(b)選擇如(a)中所制備的顯示對(duì)大分子 改變的結(jié)合親和力的蛋白質(zhì)變體。在某些實(shí)施方式中,大分子結(jié)合區(qū)域內(nèi)的至少一個(gè)氨基 酸殘基是大分子結(jié)合區(qū)域中的最疏水的殘基。在某些實(shí)施方式中,易聚集區(qū)域內(nèi)的至少一 個(gè)氨基酸殘基是Wie、Leu、lie、Tyr, Trp、Val、Met、Pro, Cys、Ala或Gly。在某些實(shí)施方式 中,更親水的氨基酸殘基選自Thr、Ser、Lys、Gln、Asn、His、Glu、Asp和Arg。在某些實(shí)施方 式中,更親水的氨基酸殘基是稀有的、非天然的或修飾的氨基酸。在某些實(shí)施方式中,根據(jù) Black和Mould的疏水性標(biāo)度測(cè)定更親水的氨基酸殘基。在某些實(shí)施方式中替代大分子結(jié)合區(qū)域內(nèi)的至少兩個(gè)氨基酸殘基。在某些實(shí)施方式中替代大分子結(jié)合區(qū)域內(nèi)的至少三個(gè)氨 基酸殘基。在某些實(shí)施方式中替代蛋白質(zhì)內(nèi)超過(guò)一個(gè)易聚集區(qū)域內(nèi)的至少一個(gè)殘基。在某 些實(shí)施方式中,為了識(shí)別蛋白質(zhì)上的易聚集區(qū)域,根據(jù)先前方面中的任何一個(gè)的方法識(shí)別 易聚集區(qū)域。在可與先前的實(shí)施方式結(jié)合的某些實(shí)施方式中,大分子是另一個(gè)蛋白、多核苷 酸或多糖。在可與先前的實(shí)施方式結(jié)合的某些實(shí)施方式中,蛋白選自抗體、Fab片段、Fab' 片段、Fd片段、Fv片段、F (ab' )2片段和Fc片段。在可與先前的實(shí)施方式結(jié)合的某些實(shí)施 方式中,蛋白是細(xì)胞因子、趨化因子、脂因子、肌因子、神經(jīng)遞質(zhì)、神經(jīng)營(yíng)養(yǎng)蛋白、白細(xì)胞介素 或干擾素。在可與先前的實(shí)施方式結(jié)合的某些實(shí)施方式中,蛋白是激素或生長(zhǎng)因子。在某 些實(shí)施方式中,大分子是激素受體或生長(zhǎng)因子受體。在某些實(shí)施方式中,蛋白是受體或受體 域。在某些實(shí)施方式中,大分子是受體或受體域的受體激動(dòng)劑或受體拮抗劑。在可與先前 的實(shí)施方式結(jié)合的某些實(shí)施方式中,蛋白是神經(jīng)遞質(zhì)或神經(jīng)營(yíng)養(yǎng)蛋白。在某些實(shí)施方式中, 大分子是神經(jīng)遞質(zhì)受體或神經(jīng)營(yíng)養(yǎng)蛋白受體。在另一個(gè)方面,本發(fā)明還包括制備包含蛋白質(zhì)變體的藥物組合物的方法,該蛋白 質(zhì)變體顯示改變的與結(jié)合配偶體相互作用的傾向,該方法包括配制根據(jù)先前方面中的任何 的方法獲得的蛋白質(zhì)變體以及藥學(xué)上可接受的載體、佐劑和/或賦形劑。發(fā)明詳述本發(fā)明解決更深地了解蛋白質(zhì)聚集的機(jī)制和識(shí)別參與聚集的蛋白區(qū)域的未滿足 的需要。本發(fā)明至少部分提供模擬技術(shù),該技術(shù)能同時(shí)地與本文描述的實(shí)驗(yàn)方法使用以改 進(jìn)潛在地所有抗聚集的治療用蛋白的穩(wěn)定性。鑒于基于抗體的治療正以所有種類的人類治 療中最高的速度增長(zhǎng),該技術(shù)顯示巨大的科學(xué)和商業(yè)潛能。聚集是抗體藥物開發(fā)的大多數(shù) 階段遇到的常見問(wèn)題,阻礙潛在的抗體藥物候選物的快速商業(yè)化。因此使用本文描述方法 的聚集阻止會(huì)對(duì)蛋白藥物開發(fā)具有顯著的影響。此外,本發(fā)明解決準(zhǔn)確地識(shí)別參與與其它大分子結(jié)合的蛋白區(qū)域的未滿足的需 要,這種結(jié)合常常至少部分是通過(guò)大的疏水補(bǔ)丁(patch)介導(dǎo)的,使用本文描述的方法能 容易地識(shí)別這些補(bǔ)丁。本發(fā)明至少部分提供模擬技術(shù),該技術(shù)能同時(shí)地與本文描述的實(shí)驗(yàn) 方法使用以改變潛在地所有蛋白質(zhì)-分子相互作用的結(jié)合親和力,該結(jié)合親和力至少部分 是通過(guò)大的疏水補(bǔ)丁介導(dǎo)的。鑒于基于蛋白的治療正以所有種類的人類治療中最高的速度 增長(zhǎng),該技術(shù)顯示巨大的科學(xué)和商業(yè)潛能。改變針對(duì)一個(gè)或多個(gè)大分子的蛋白治療的結(jié)合 親和力的能力能用于提高效率和降低或除去通過(guò)不需要的第二大分子結(jié)合區(qū)域介導(dǎo)的活 性。本發(fā)明另外提供減少或阻止蛋白質(zhì)聚集或改變針對(duì)大分子的結(jié)合親和力的方法。 特別地,提供識(shí)別蛋白質(zhì)結(jié)構(gòu)上的疏水區(qū)域的方法,該區(qū)域可參與蛋白質(zhì)相互作用、蛋白 質(zhì)-大分子相互作用或蛋白質(zhì)聚集。提供的方法是基于本文公開的如“空間聚集傾向”或 “SAP”的新技術(shù)。該SAP工具還正確地識(shí)別易于與其它蛋白結(jié)合的抗體區(qū)域。除了抗體, 該工具能廣泛地應(yīng)用于所有蛋白質(zhì),用于識(shí)別易聚集區(qū)域或結(jié)合其它蛋白或配體的區(qū)域。 本發(fā)明的方法可應(yīng)用于任何蛋白質(zhì),其三維結(jié)構(gòu)是可利用的或者其三維結(jié)構(gòu)可使用同源建 模、分子建?;驈念^開始結(jié)構(gòu)測(cè)定產(chǎn)生。一般而言,可用多種方式計(jì)算“SAP”,其使用本文 描述的方程和方法學(xué),例如,可在蛋白質(zhì)結(jié)構(gòu)模型上計(jì)算SAP,或可將SAP計(jì)算為結(jié)構(gòu)模型 的分子動(dòng)力學(xué)模擬的多個(gè)時(shí)間步驟的平均數(shù)。盡管特定的計(jì)算方法和獲得的結(jié)果可變化,如本文所描述的,但是潛在的原理是基于SAP是一個(gè)計(jì)量單位的事實(shí),其不但說(shuō)明蛋白質(zhì) 中的殘基的疏水性,而且說(shuō)明蛋白質(zhì)三維結(jié)構(gòu)和折疊的蛋白質(zhì)結(jié)構(gòu)中的氨基酸殘基的接近度?!暗鞍踪|(zhì)”指兩個(gè)或多個(gè)氨基酸的任何序列,(本文也被稱為“氨基酸殘基”或“殘 基”)通過(guò)相鄰氨基酸的羧基和氨基之間的肽鍵連接在一起,不管長(zhǎng)度、翻譯后修飾、化學(xué)修 飾或功能?!岸嚯摹?、“肽”和“蛋白質(zhì)”在本文可交換地使用。在優(yōu)選實(shí)施方式中,本發(fā)明的 方法應(yīng)用于具有足夠長(zhǎng)度以折疊成三維結(jié)構(gòu)的蛋白質(zhì)。在一些實(shí)施方式中,蛋白質(zhì)是天然 存在的蛋白質(zhì)。在一些實(shí)施方式中,蛋白質(zhì)是化學(xué)合成的。在一些實(shí)施方式中,蛋白質(zhì)是重 組蛋白質(zhì),例如,雜合蛋白或嵌合蛋白。在一些實(shí)施方式中,蛋白是復(fù)合蛋白,(例如復(fù)合的 相互作用蛋白)。蛋白質(zhì)能被分離(例如,從天然來(lái)源或化學(xué)環(huán)境中)。在一些實(shí)施方式 中,蛋白質(zhì)可以是修飾的蛋白質(zhì)或擬肽。在一些實(shí)施方式中,蛋白可以是衍生的蛋白,例如 化學(xué)共軛蛋白質(zhì)(包括但并不限于聚合物共軛蛋白質(zhì)(例如聚乙二醇化蛋白質(zhì))。如本文 所用,術(shù)語(yǔ)“蛋白質(zhì)”也意欲包括蛋白質(zhì)片段。示例性的蛋白質(zhì)包括抗體(包括但并不限于 其片段、變體和衍生物)。實(shí)際上,預(yù)見本發(fā)明的方法可應(yīng)用于任何基于氨基酸的分子,其結(jié)構(gòu)模型是可利 用的或可被產(chǎn)生的。例如,本文描述的方法可應(yīng)用于如本文所描述的修飾的蛋白質(zhì)或摻入 稀有的或非天然氨基酸的蛋白質(zhì)。在一些實(shí)施方式中,可將稀有的、非天然的或修飾的氨 基酸的結(jié)構(gòu)計(jì)算地替代或插入到結(jié)構(gòu)模型,用于本文描述的方法的應(yīng)用。實(shí)驗(yàn)上設(shè)計(jì)肽類 似物、衍生物和擬態(tài)的方法是本領(lǐng)域已知的。例如,參見Farmer,P. S. in Drug Design (Ε. J.Ariens, ed.)Academic Press, New York,1980, vol. 10, pp. 119-143 ;Ball. J. B. and Alewood,P. F. (1990) J. Mol. Recognition 3 55 ;Morgan, B. A. and Gainor,J. A. (1989) Ann. Rep. Med. Chem. 24 243 ;禾口 Freidinger,R. M. (1989) Trends Pharmacol. Sci.!^ :270。還參 JAL Sawyer,T. K. (1995)" Peptidomimetic Design and Chemical Approaches to Peptide Metabolism " in Taylor, MD. and Amidon, G. L. (eds. )Peptide-Based Drug Design Controlling Transport andMetabolism, Chapter 17 ;Smith, A. B. 3rd, et al. (1995) J. Am. Chem. Soc. 117 :11113-11123 ;Smith, A. B. 3rd, et al. (1994) J. Am. Chem. Soc. 116 9947-9962 和 Hirschman,R. , et al. (1993)J. Am. Chem. Soc. 115 :12550_12568。大量和各種肽、多肽和蛋白治療制劑是本領(lǐng)域已知的,并期望從本發(fā)明的方法受 益。這些治療制劑包括幾個(gè)非常寬的種類,包括激素、蛋白質(zhì)、抗原、免疫球蛋白、抑制劑/ 激活劑、酶、細(xì)胞因子、趨化因子、肌因子、脂因子、生長(zhǎng)因子、受體、受體域、神經(jīng)遞質(zhì)、神經(jīng) 營(yíng)養(yǎng)蛋白、白細(xì)胞介素和干擾素等。能在本發(fā)明的范圍內(nèi)使用的合適的激素包括蛋白質(zhì)激素,諸如調(diào)節(jié)血糖的胰島素 和胰高血糖素。如具有本領(lǐng)域普通技術(shù)的人所理解的,著名的激素典型地用于包括癌癥、代 謝病、心血管疾病、垂體狀況和絕經(jīng)在內(nèi)的各種狀況和疾病的治療。最初,人們認(rèn)為只有一些蛋白質(zhì)形成原纖維或聚集體。更近的證據(jù)表明更多超過(guò) 期望的蛋白質(zhì)具有易聚集區(qū)域(Fandrich, M.,F(xiàn)letcher, Μ. Α.,and Dobson, C. Μ. (2001) Nature 410,165-166)。實(shí)際上,據(jù)記錄短至4個(gè)殘基的肽能形成原纖維(J. Biol. Chem., Vol. 277,Issue 45,43243-43246, Nov.8,2002)。蛋白治療代表了治療市場(chǎng)的增長(zhǎng)的份額。例如,胰島素和胰高血糖素是調(diào)節(jié)血糖的重要蛋白治療,可從本文描述的方法受益。胰島淀粉樣多肽(Islet AmyloidPolypeptide) (IAPP)是由胰腺分泌的另外的激素,其用于糖尿病的治療。另一個(gè)感 興趣的蛋白是粒細(xì)胞集落刺激因子或G-CSF,它是可用于增加血細(xì)胞產(chǎn)生的血液生長(zhǎng)因子。 組織纖溶酶原激活劑是中風(fēng)或心臟病發(fā)作的治療中使用的凝塊破裂劑。另外,紅細(xì)胞生成 素是腎產(chǎn)生的激素,它可用于AIDS、貧血、腎衰竭和其它狀況的治療。最后,降鈣素是已被發(fā) 現(xiàn)在高鈣血癥、佩吉特病(Paget disease)和某些類型的骨質(zhì)疏松癥的治療中有效的肽。期望從本文描述的方法獲益的蛋白的另外例子包括,而沒(méi)有限制,ACTH、支鏈淀 粉、血管緊張素、血管生成素、抗炎肽、BNP、內(nèi)啡肽、內(nèi)皮素、GLIP、生長(zhǎng)激素釋放因子(GRF)、 水蛭素、胰島素調(diào)理素、神經(jīng)肽Y、PTH、VIP、生長(zhǎng)激素釋放激素(GHRH)、奧曲肽、垂體激素 (例如hGH)、ANF、生長(zhǎng)因子、bMSH、生長(zhǎng)抑素、血小板衍生的生長(zhǎng)因子釋放因子、人絨毛膜促 性腺素、水蛭肽、干擾素α、干擾素β、干擾素Y、白細(xì)胞介素、粒細(xì)胞巨噬細(xì)胞集落刺激因 子(GM-CSF)、粒細(xì)胞集落刺激因子(G-CSF)、尿促性素(尿促卵泡素(FSH)和LH))、鏈激酶、 尿激酶、ANF、ANP、ANP清除抑制劑、抗利尿激素激動(dòng)劑、降鈣素基因相關(guān)肽(CGRP)、IGF-U 噴替吉肽、蛋白C、蛋白S、胸腺素α-l、加壓素拮抗劑類似物、顯性負(fù)性TNF-α、α-MSH、 VEGF、PYY、和衍生自上述蛋白的多肽、片段、多肽類似物和衍生物。在特別優(yōu)選的實(shí)施方式中,蛋白是抗體或免疫球蛋白。術(shù)語(yǔ)“抗體”以最寬的意義 使用,并且具體地覆蓋單克隆抗體(包括全長(zhǎng)單克隆抗體)、多克隆抗體、多特異性抗體(例 如雙特異性抗體)、單鏈抗體、嵌合抗體、重組抗體、和抗體片段。全長(zhǎng)抗體是包含由二硫鍵 相互連接的至少兩個(gè)重(H)鏈和兩個(gè)輕(L)鏈的糖蛋白。Ch2中的Asn-297殘基是N-糖基 化的。每個(gè)重鏈由重鏈可變區(qū)(本文縮寫為Vh)和重鏈恒定區(qū)組成。重鏈恒定區(qū)由三個(gè)結(jié) 構(gòu)域CH1、Ch2和Ch3組成。Fc受體在較低的Ch2鉸鏈區(qū)結(jié)合并介導(dǎo)效應(yīng)子作用諸如抗體依賴 的細(xì)胞介導(dǎo)的細(xì)胞毒性(ADCC)。蛋白A結(jié)合在Fc的Ch2-Ch3的連接處,在完全抗體的純化 中廣泛使用。每個(gè)輕鏈由輕鏈可變區(qū)(本文縮寫為VJ和輕鏈恒定區(qū)組成。輕鏈恒定區(qū)由 一個(gè)結(jié)構(gòu)域Q組成。V1^Pt區(qū)能被進(jìn)一步細(xì)分成稱作互補(bǔ)決定區(qū)(CDR)的高度可變區(qū), 點(diǎn)綴著稱作框架區(qū)(FR)的更保守的區(qū)域。每個(gè)V1^Pt由三個(gè)CDR和四個(gè)FR組成,以下 面的順序從氨基末端至羧基末端排列FR1、CDRl、FR2、CDR2、FR3、CDR3、FR4。重鏈和輕鏈 的可變區(qū)含有與抗原相互作用的結(jié)合結(jié)構(gòu)域。因此,術(shù)語(yǔ)“抗體”將包括各種抗體同種型 或亞類,例如 IgA、IgD、IgE、IgG 和 IgM,或 IgGl、IgG2、IgG3 和 IgG4。進(jìn)一步包括的是 Fab 片段,它是由八、Vh、(^和ChI結(jié)構(gòu)域組成的一價(jià)片段;F(ab' )2片段,它是包含由二硫鍵在 鉸鏈區(qū)連接的兩個(gè)Fab片段的二價(jià)片段;Fab’片段,它是本質(zhì)上具有鉸鏈區(qū)部分的Fab (參 見 FUNDAMENTALIMMUNOLOGY (Paul ed.,3rd ed. 1993);由 Vh 禾口 ChI 結(jié)構(gòu)域組成的 Fd 片段; 由抗體單臂的\和Vh結(jié)構(gòu)域組成的Fv片段,dAb片段(Ward et al.,(1989)NatureMi M4-M6),其由Vh結(jié)構(gòu)域組成;分離的互補(bǔ)決定區(qū)(CDR);和納米抗體(nanobody),其為含 有單個(gè)可變域和兩個(gè)恒定域的重鏈可變區(qū)。如本文所用蛋白質(zhì)“結(jié)構(gòu)模型”是蛋白質(zhì)三維的二級(jí)、三級(jí)和/或四級(jí)結(jié)構(gòu)的表 示。結(jié)構(gòu)模型包括X射線晶體結(jié)構(gòu)、NMR結(jié)構(gòu)、理論蛋白質(zhì)結(jié)構(gòu)、從同源建模產(chǎn)生的結(jié)構(gòu)、蛋 白質(zhì)斷層照相模型和從電子微觀研究建立的原子論模型。典型地,“結(jié)構(gòu)模型”將不僅包括 蛋白質(zhì)的一級(jí)氨基酸序列,還將為蛋白質(zhì)中的原子提供三維空間中的坐標(biāo),因此顯示蛋白 折疊和氨基酸殘基位置。在優(yōu)選的實(shí)施方式中,分析的結(jié)構(gòu)模型是X射線晶體結(jié)構(gòu),例如從蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB,rcsb.org/pdb/home/home. do)獲得的結(jié)構(gòu)或在相似蛋白質(zhì)的已知結(jié) 構(gòu)之上建立的同源模型。在優(yōu)選的實(shí)施方式中,結(jié)構(gòu)模型將在應(yīng)用本發(fā)明的方法之前被預(yù) 處理。例如,可通過(guò)分子動(dòng)力學(xué)模擬提出結(jié)構(gòu)模型以允許蛋白質(zhì)側(cè)鏈達(dá)到更自然的構(gòu)象,或 可允許結(jié)構(gòu)模型與溶劑例如水在分子動(dòng)力學(xué)模擬中相互作用。預(yù)處理不限于分子動(dòng)力學(xué)模 擬并能使用任何本領(lǐng)域公認(rèn)的手段完成預(yù)處理以測(cè)定溶液中蛋白質(zhì)的運(yùn)動(dòng)。示例性的可選 的模擬技術(shù)是Monte Carlo模擬。能使用模擬程序包或任何其它可接受的計(jì)算方法進(jìn)行模 擬。在某些實(shí)施方式中,能在結(jié)構(gòu)模型上進(jìn)行搜索、探查或取樣蛋白質(zhì)構(gòu)象空間的模擬以測(cè) 定蛋白質(zhì)的運(yùn)動(dòng)?!袄碚摰鞍踪|(zhì)結(jié)構(gòu)”是使用計(jì)算的方法,通常沒(méi)有蛋白質(zhì)天然結(jié)構(gòu)的任何直接的 實(shí)驗(yàn)測(cè)量結(jié)果而產(chǎn)生的三維蛋白結(jié)構(gòu)模型?!袄碚摰鞍踪|(zhì)結(jié)構(gòu)”包括通過(guò)從頭開始法和同 源建模產(chǎn)生的結(jié)構(gòu)模型?!巴茨P汀笔怯赏唇.a(chǎn)生的三維蛋白結(jié)構(gòu)模型,其典型地 包括比較蛋白質(zhì)的一級(jí)序列與相似蛋白質(zhì)的已知三維結(jié)構(gòu)。同源建模在本領(lǐng)域是眾所周 知的,并且被描述在 Kolinski et al. Proteins. 1999 ;37 (4) :592-610 ;Rost et al.,B, Potein Sci. 1996 ;5 (8) :1704_1718,和美國(guó)專利號(hào) 7212924 ;6256647 和 6125331 中,本文 通過(guò)引用將其并入。特別地,Xiang. (CurrProteinPept Sci. 2006Jun ;7 (3) :217_27,本文 通過(guò)引用并入)提供了同源建模技術(shù)的極好的描述和綜述,該同源建模技術(shù)可用于產(chǎn)生對(duì) 本發(fā)明的方法有用的結(jié)構(gòu)。實(shí)際上,根據(jù)本發(fā)明的方法可使用本領(lǐng)域已知的任何同源建模 軟件,例如 MODELLER(Eswar, et al. , Comparative Protein Structure Modeling With MODELLER. Current Protocols inBioinformatics, John Wiley&Sons, Inc. , Supplement 15,5.6. 1-5.6.30,200.)、SEGMOD/ENCAD (Levitt M. JMolBiol 1992 ;226 :507-533)、 SWISS-MODEL(Schwede Τ,Κορρ J,Guex N,Peitsch MC. Nucleic Acids Research2003 ;31 3381-3385.)>3D-JIGSAff(Bates et al. , Proteins !Structure, Function andGenetics, Suppl 2001 ;5 :39-46), NEST (Xiang. Curr Protein P印t Sci. 2006June ;7 (3) :217-227) 和 BUILDER(Koehl and Delarue. Curr Opin Struct Bioll996 ;6 (2) :222-2 .)。對(duì)于抗 體,特別地,能使用規(guī)范的結(jié)構(gòu)方法(Chothia C and LeskAM, J. Mol. Biol. 1987,196,901 ; Chothia C et al.,Nature 1989,342,877)準(zhǔn)確地獲得抗體可變區(qū)的結(jié)構(gòu)。在特定的實(shí)施方式中,可使用同源建模以從已知結(jié)構(gòu)片段裝配完整蛋白質(zhì),諸如 當(dāng)將抗體Fab片段模建到Fc片段上時(shí),或當(dāng)Fab片段作為理論蛋白質(zhì)結(jié)構(gòu)產(chǎn)生并模建到Fc 片段晶體結(jié)構(gòu)上時(shí)。熟練的技術(shù)人員將了解存在各種可能性。在一個(gè)特定的實(shí)施方式中, 可將Fab片段做模型到不同種類或同種型的各種抗體Fc結(jié)構(gòu)上。也可在本發(fā)明的方法中使用從頭開始模型?!皬念^開始蛋白結(jié)構(gòu)模型”是通過(guò)使用 物理化學(xué)中已知的方程模擬蛋白質(zhì)折疊過(guò)程從蛋白質(zhì)一級(jí)序列直接產(chǎn)生的蛋白結(jié)構(gòu)模型 (Bonneau and Baker. Annual Review of Biophysics and BiomolecularStructure. 2001, Vol.30, Pages 173-189 ;Lesk Proteins 1997 ;1 151-166.Suppl ;Zemla, et al.. Proteins 1997 ;1 :140-150. Suppl ;Ingwal1, et al.Biopolymers 1968;6 :331-368 ;和 美國(guó)專利號(hào) 6832162 ;5878373 ;5436850 ;6512981 ;7158891 ;6377893 ;和美國(guó)專利申請(qǐng)?zhí)?9/788,006 ;11/890,863和10/113,219,本文通過(guò)應(yīng)用將其全部并入)。由于在模擬新形成 蛋白質(zhì)折疊中的困難在某些情況下可導(dǎo)致不精確的蛋白結(jié)構(gòu)模型,典型地,以實(shí)驗(yàn)測(cè)定的 結(jié)構(gòu)(例如X射線晶體結(jié)構(gòu))和同源模型對(duì)從頭開始模型是優(yōu)選的。
應(yīng)理解,根據(jù)本發(fā)明,產(chǎn)生理論蛋白質(zhì)結(jié)構(gòu)的本領(lǐng)域已知的任何方法可以是有 用的。除了上面描述的方法,一些方法諸如在會(huì)議、用于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的技術(shù)的關(guān)鍵 評(píng)估(CASP)中描述的那些方法可在本方法學(xué)中使用。在CASP的學(xué)報(bào)中,例如在與7th Community Wide Experiment on the Critical Assessment of Techniquesfor Protein Structure Prediction Asilomar Conference Center, Pacific Grove, CANovember 26-30,2006 相關(guān)的出版物中和在 CASP6 學(xué)報(bào)· Proteins Structure, Function, and Bioinformatics. 2005. 61(S7) 1-236 ;CASP5 學(xué) 報(bào)· Proteins !Structure, Function, and Genetics. 2003,53(S6) :333-595 ;CASP4 學(xué) 報(bào)· Proteins :Structure, Function, and Genetics. 2001,45(S5) :1-199 ;CASP3 學(xué) 報(bào) Proteins -Structure, Function, and Genetics, 1999, 37 (S3) :1-237(1999)中描述了各種例子。本發(fā)明還提供了制備顯示降低的聚集傾向的蛋白質(zhì)變體的方法。如本文所用,“聚 集傾向”是蛋白質(zhì)形成簇或塊的傾向。這樣的簇或塊可含有兩個(gè)、或更常常是3個(gè)、或更多 的蛋白質(zhì),蛋白質(zhì)典型地是相同類型。相應(yīng)地,顯示“降低的聚集傾向”的蛋白質(zhì)是與未修 飾或未處理的相同蛋白質(zhì)相比,當(dāng)被修飾或處理時(shí),形成較少聚集體或形成較小聚集體的 蛋白質(zhì)。術(shù)語(yǔ)“抑制”指?jìng)鬟_(dá)現(xiàn)象中的可測(cè)量的減少,本文常常參考蛋白質(zhì)結(jié)合相互作用或 聚集而使用它。本文常常將蛋白質(zhì)表面上的氨基酸殘基、殘基簇、蛋白質(zhì)區(qū)域、肽或補(bǔ)丁描述為親 水的或疏水的。根據(jù)本發(fā)明的方法,空間聚集傾向描述了疏水性,并部分地使用本領(lǐng)域已知 的氨基酸疏水性標(biāo)度計(jì)算空間聚集傾向。在優(yōu)選的實(shí)施方式中,氨基酸疏水性標(biāo)度是Black 和Mould,Anal. Biochem. 1991,193,72-82 (本文通過(guò)引用并入)中提出的標(biāo)度。一般而言, 根據(jù)Black和Mould,氨基酸疏水性進(jìn)展如下(從最疏水的殘基開始)Phe > Leu = Ile > Tyr ^ Trp > Val > Met > Pro > Cys > Ala > Gly > Thr > Ser > Lys > Gln > Asn > His > Glu > Asp > Arg0如Black和Mould所報(bào)道的,疏水性的標(biāo)度值顯示在下面的表1 中。表 權(quán)利要求
1.計(jì)算針對(duì)蛋白質(zhì)中特定原子的空間聚集傾向(SAP)的方法,包括(a)識(shí)別代表所述蛋白質(zhì)的結(jié)構(gòu)模型中的一個(gè)或多個(gè)原子,其中所述一個(gè)或多個(gè)原子 位于集中于所述特定原子上或其附近的限定空間區(qū)域內(nèi);(b)針對(duì)所述限定空間區(qū)域中的所述一個(gè)或多個(gè)原子,計(jì)算所述原子的溶劑可及面積 (SAA)與完全暴露的同一殘基中的原子的SAA的比;(c)用所述一個(gè)或多個(gè)原子的原子疏水性乘以每個(gè)比;和(d)合計(jì)步驟(C)的乘積;借此該和是針對(duì)所述特定原子的SAP。
2.計(jì)算針對(duì)蛋白質(zhì)中特定原子的空間聚集傾向(SAP)的方法,包括(a)識(shí)別代表所述蛋白質(zhì)的結(jié)構(gòu)模型中的一個(gè)或多個(gè)氨基酸殘基,其中所述一個(gè)或多 個(gè)氨基酸殘基具有集中于所述特定原子上或其附近的限定空間區(qū)域內(nèi)的至少一個(gè)原子;(b)針對(duì)所述限定空間區(qū)域中的所述一個(gè)或多個(gè)原子,計(jì)算所述原子的溶劑可及面積 (SAA)與完全暴露的同一殘基中的原子的SAA的比;(c)用如通過(guò)氨基酸疏水性標(biāo)度所測(cè)定的所述一個(gè)或多個(gè)氨基酸殘基的疏水性乘以每 個(gè)比;和(d)合計(jì)步驟(C)的乘積;借此該和是針對(duì)所述特定原子的SAP。
3.權(quán)利要求2的方法,其中步驟(a)的所述一個(gè)或多個(gè)原子是所述一個(gè)或多個(gè)氨基酸 的側(cè)鏈中的原子。
4.權(quán)利要求2的方法,其中步驟(a)的所述一個(gè)或多個(gè)原子是所述一個(gè)或多個(gè)氨基酸 的主鏈原子。
5.權(quán)利要求1或2的方法,其中所述限定的空間區(qū)域選自球體、立方體、圓柱體、錐體和 橢圓的球狀體。
6.權(quán)利要求1或2的方法,其中所述限定的空間區(qū)域是具有與具有i_30A之間半徑的球 體相等的體積的區(qū)域。
7.權(quán)利要求1或2的方法,其中所述限定的空間區(qū)域是具有I_30A之間半徑的球體。
8.權(quán)利要求1或2的方法,其中所述限定的空間區(qū)域集中在所述特定原子上。
9.權(quán)利要求1或2的方法,其中所述限定的空間區(qū)域集中在化學(xué)鍵上。
10.權(quán)利要求1或2的方法,其中所述限定的空間區(qū)域集中在空間上距所述特定原子 30A內(nèi)的點(diǎn)上。
11.權(quán)利要求10的方法,其中所述限定的空間區(qū)域集中在空間上距所述特定原子20A 內(nèi)的點(diǎn)上。
12.權(quán)利要求10的方法,其中所述限定的空間區(qū)域集中在空間上距所述特定原子IOA 內(nèi)的點(diǎn)上。
13.權(quán)利要求10的方法,其中所述限定的空間區(qū)域集中在空間上距所述特定原子5A內(nèi) 的點(diǎn)上。
14.權(quán)利要求10的方法,其中所述限定的空間區(qū)域集中在空間上距所述特定原子2A內(nèi) 的點(diǎn)上。
15.權(quán)利要求10的方法,其中所述限定的空間區(qū)域集中在空間上距所述特定原子IA內(nèi)的點(diǎn)上。
16.權(quán)利要求1或2的方法,其中只在氨基酸側(cè)鏈的原子上計(jì)算所述SAA。
17.權(quán)利要求1或2的方法,其中只在主鏈原子上計(jì)算所述SAA。
18.權(quán)利要求1或2的方法,其中只在排除附著的氫原子的主鏈原子上計(jì)算所述SAA。
19.權(quán)利要求1或2的方法,其中在步驟(a)之前通過(guò)進(jìn)行任選地包括溶劑的分子動(dòng)力 學(xué)模擬而處理所述結(jié)構(gòu)模型。
20.權(quán)利要求19的方法,其中所述溶劑是水。
21.權(quán)利要求19的方法,其中使用選自包括ABINIT、AMBER、Ascalaph、CASTEP,CPMD, CHARMM、DL_P0LY、FIREBALL、GROMACS、GROMOS、LAMMP S、MDynaMiχ、MOLDY、MO SCITO、NAMD, Newton-X, ProtoMol, Pffscf, SIESTA, VASP, TINKER, YASARA, ORAC 和 XMD 的集合的模擬程序 包進(jìn)行所述分子動(dòng)力學(xué)模擬。
22.權(quán)利要求21的方法,其中使用CHARMM模擬程序包進(jìn)行所述分子動(dòng)力學(xué)模擬。
23.權(quán)利要求21的方法,其中使用NAMD模擬程序包進(jìn)行所述分子動(dòng)力學(xué)模擬。
24.權(quán)利要求1或2的方法,其中通過(guò)在步驟(a)之前進(jìn)行分子動(dòng)力學(xué)模擬和重復(fù)步 驟(a)-(d)計(jì)算針對(duì)所述特定原子的SAP,每次以許多時(shí)間步驟進(jìn)行進(jìn)一步的分子動(dòng)力學(xué) 模擬,由此產(chǎn)生如步驟(d)中的多個(gè)和,和計(jì)算所述這些和的平均值;借此所述計(jì)算的平均 值是針對(duì)所述特定原子的SAP。
25.權(quán)利要求M的方法,其中使用選自包括ABINIT、AMBER、Ascalaph、CASTEP,CPMD, CHARMM、DL_P0LY、FIREBALL、GROMACS、GROMOS、LAMMP S、MDynaMiχ、MOLDY、MO SCITO、NAMD, Newton-X, ProtoMol, Pffscf, SIESTA, VASP, TINKER, YASARA, ORAC 和 XMD 的集合的模擬程序 包進(jìn)行所述分子動(dòng)力學(xué)模擬。
26.權(quán)利要求對(duì)的方法,其中使用CHARMM模擬程序包進(jìn)行所述分子動(dòng)力學(xué)模擬。
27.權(quán)利要求M的方法,其中使用NAMD模擬程序包進(jìn)行所述分子動(dòng)力學(xué)模擬。
28.權(quán)利要求1、權(quán)利要求2和權(quán)利要求M中任一項(xiàng)所述的方法,進(jìn)一步包括對(duì)1-5個(gè) 氨基酸合計(jì)所述SAP得分。
29.權(quán)利要求觀的方法,其中所述氨基酸是沿著所述蛋白質(zhì)序列連續(xù)地相鄰的。
30.權(quán)利要求觀的方法,其中所述氨基酸在所述蛋白質(zhì)結(jié)構(gòu)模型中是空間地相鄰的。
31.權(quán)利要求1至權(quán)利要求30中任一項(xiàng)的方法,其中所述結(jié)構(gòu)模型是所述蛋白質(zhì)或其 部分的X射線晶體結(jié)構(gòu)模型。
32.權(quán)利要求1至權(quán)利要求30中任一項(xiàng)的方法,其中所述結(jié)構(gòu)模型是所述蛋白質(zhì)或其 部分的理論蛋白結(jié)構(gòu)模型。
33.權(quán)利要求1至權(quán)利要求30中任一項(xiàng)的方法,其中所述結(jié)構(gòu)模型是所述蛋白質(zhì)或其 部分的同源模型。
34.權(quán)利要求1至權(quán)利要求30中任一項(xiàng)的方法,其中所述結(jié)構(gòu)模型是所述蛋白質(zhì)或其 部分的從頭開始蛋白結(jié)構(gòu)模型。
35.權(quán)利要求1至權(quán)利要求30中任一項(xiàng)的方法,其中所述半徑在之間。IA和30A
36.權(quán)利要求35的方法,其中所述半徑是5A。
37.權(quán)利要求35的方法,其中所述半徑是1OA。
38.識(shí)別蛋白上的易聚集區(qū)域的方法,包括(a)將如根據(jù)權(quán)利要求1、權(quán)利要求2和權(quán)利要求M中任一項(xiàng)所計(jì)算的針對(duì)所述蛋白 質(zhì)中原子的SAP繪制到所述蛋白質(zhì)的結(jié)構(gòu)模型上;和(b)識(shí)別具有SAP> 0的許多原子的所述蛋白質(zhì)內(nèi)的區(qū)域; 其中所述易聚集區(qū)域包括包含所述許多原子的所述氨基酸。
39.識(shí)別蛋白上的易聚集區(qū)域的方法,包括識(shí)別一個(gè)或多個(gè)氨基酸,所述氨基酸含有一個(gè)或多個(gè)具有大于所選閾值的SAP的原子,其中根據(jù)權(quán)利要求1、權(quán)利要求2和權(quán)利要求M中任一項(xiàng)的方法計(jì)算所述SAP,并且其 中所述易聚集區(qū)域包括所述識(shí)別的氨基酸。
40.識(shí)別蛋白上的易聚集區(qū)域的方法,包括繪制如權(quán)利要求1、權(quán)利要求2和權(quán)利要求M中任一項(xiàng)所計(jì)算的所述SAP值, 為所述圖中的峰計(jì)算曲線下面積(AUC),和 識(shí)別一個(gè)或多個(gè)具有正的AUC的蛋白區(qū)域, 其中所述易聚集區(qū)域包括所述識(shí)別的蛋白區(qū)域。
41.制備顯示降低的聚集傾向的蛋白質(zhì)變體的方法,包括替代或缺失所述蛋白質(zhì)中易聚集區(qū)域內(nèi)的至少一個(gè)氨基酸殘基, 其中使用根據(jù)權(quán)利要求1、權(quán)利要求2和權(quán)利要求M中任一項(xiàng)計(jì)算的SAP得分識(shí)別所 述易聚集區(qū)域;和其中,如果替代所述氨基酸殘基,用更親水的氨基酸殘基替代它,這樣所述變體的所述 聚集傾向降低了。
42.權(quán)利要求41的方法,其中替代至少一個(gè)殘基和缺失至少一個(gè)殘基。
43.制備顯示降低的聚集傾向的蛋白質(zhì)變體的方法,包括(a)在每個(gè)變體中通過(guò)替代所述蛋白質(zhì)中易聚集區(qū)域內(nèi)的至少一個(gè)殘基而產(chǎn)生許多蛋 白質(zhì)變體,其中使用根據(jù)權(quán)利要求1、權(quán)利要求2和權(quán)利要求M中任一項(xiàng)計(jì)算的SAP得分識(shí)別所 述易聚集區(qū)域,其中在每個(gè)變體中,將一個(gè)或多個(gè)不同殘基或不同的殘基組合替代; 其中用更親水的殘基替代所述至少一個(gè)殘基;和(b)選擇如(a)中制備的顯示降低的聚集傾向的蛋白質(zhì)變體。
44.權(quán)利要求41至權(quán)利要求43中任一項(xiàng)的方法,其中易聚集區(qū)域內(nèi)所述至少一個(gè)氨基 酸殘基是所述易聚集區(qū)域中最疏水的殘基。
45.權(quán)利要求41至權(quán)利要求43中任一項(xiàng)的方法,其中易聚集區(qū)域內(nèi)所述至少一個(gè)氨基 酸殘基是 Phe> Leu、lie、Tyr> Trp> Val> Met> Pro、Cys> Ala 或 Gly0
46.權(quán)利要求41至權(quán)利要求43中任一項(xiàng)的方法,其中所述更親水的氨基酸殘基選自 Thrλ Serλ LysΛ Gin、Asn、His、Glu、Asp 禾口 Arg0
47.權(quán)利要求41至權(quán)利要求43中任一項(xiàng)的方法,其中所述更親水的氨基酸殘基是稀有 的、非天然的或修飾的氨基酸。
48.權(quán)利要求41至權(quán)利要求43的方法,其中根據(jù)Black和Mould的疏水性標(biāo)度測(cè)定所 述更親水的氨基酸殘基。
49.權(quán)利要求41至權(quán)利要求43的方法,其中替代所述易聚集區(qū)域內(nèi)的至少兩個(gè)氨基酸殘基。
50.權(quán)利要求41至權(quán)利要求43的方法,其中替代所述易聚集區(qū)域內(nèi)的至少三個(gè)氨基酸殘基。
51.權(quán)利要求41至權(quán)利要求43的方法,其中替代所述蛋白質(zhì)內(nèi)超過(guò)一個(gè)易聚集區(qū)域內(nèi) 的至少一個(gè)殘基。
52.權(quán)利要求41至權(quán)利要求43中任一項(xiàng)的方法,其中根據(jù)權(quán)利要求38至權(quán)利要求40 中任一項(xiàng)所述的方法識(shí)別所述易聚集區(qū)域。
53.權(quán)利要求1至權(quán)利要求52中任一項(xiàng)的方法,其中所述蛋白選自抗體、Fab片段、 Fab'片段、Fd片段、Fv片段、F(ab' )2片段和Fc片段。
54.權(quán)利要求1至權(quán)利要求52中任一項(xiàng)的方法,其中所述蛋白是細(xì)胞因子、趨化因子、 脂因子、肌因子、神經(jīng)遞質(zhì)、神經(jīng)營(yíng)養(yǎng)蛋白、白細(xì)胞介素或干擾素。
55.權(quán)利要求1至權(quán)利要求52中任一項(xiàng)的方法,其中所述蛋白是激素或生長(zhǎng)因子。
56.權(quán)利要求1至權(quán)利要求52中任一項(xiàng)的方法,其中所述蛋白是受體或受體域。
57.權(quán)利要求1至權(quán)利要求52中任一項(xiàng)的方法,其中所述蛋白是神經(jīng)遞質(zhì)或神經(jīng)營(yíng)養(yǎng) 蛋白。
58.權(quán)利要求1至權(quán)利要求52中任一項(xiàng)的方法,其中所述蛋白是擬肽,包含非天然氨基 酸的蛋白或包含稀有氨基酸的蛋白。
59.計(jì)算針對(duì)蛋白質(zhì)中氨基酸殘基的有效SAA的方法,包括(a)針對(duì)氨基酸計(jì)算所述氨基酸中原子的溶劑可及面積(SAA)與完全暴露的同一殘基 中原子的SAA的比;(b)用如通過(guò)氨基酸疏水性標(biāo)度所測(cè)定的所述氨基酸的疏水性乘以所述比;借此所述 乘積是所述氨基酸的所述有效SAA。
60.權(quán)利要求59的方法,其進(jìn)一步包括合計(jì)至少兩個(gè)氨基酸的有效SAA,所述氨基酸在 所述蛋白序列中是相鄰的。
61.權(quán)利要求59的方法,其進(jìn)一步包括合計(jì)三個(gè)氨基酸的有效SAA,所述氨基酸在所述 蛋白序列中是相鄰的。
62.權(quán)利要求59的方法,其進(jìn)一步包括合計(jì)四個(gè)氨基酸的有效SAA,所述氨基酸在所述 蛋白序列中是相鄰的。
63.權(quán)利要求59的方法,其進(jìn)一步包括合計(jì)五個(gè)氨基酸的有效SAA,所述氨基酸在所述 蛋白序列中是相鄰的。
64.制備包括蛋白質(zhì)變體的藥物組合物的方法,所述蛋白質(zhì)變體顯示減小的聚集傾向, 所述方法包括配制根據(jù)權(quán)利要求41或43的方法獲得的蛋白質(zhì)變體加上藥學(xué)上可接受的載 體、佐劑和/或賦形劑。
65.識(shí)別蛋白質(zhì)上的大分子結(jié)合區(qū)域的方法,包括(a)將如根據(jù)權(quán)利要求1、權(quán)利要求2和權(quán)利要求M中任一項(xiàng)所計(jì)算的針對(duì)所述蛋白 質(zhì)中原子的所述SAP繪制到所述蛋白質(zhì)的結(jié)構(gòu)模型上;和(b)識(shí)別具有SAP> 0的許多原子的所述蛋白質(zhì)內(nèi)的區(qū)域;其中所述大分子結(jié)合區(qū)域包括包含所述許多原子的所述氨基酸。
66.識(shí)別蛋白質(zhì)上的大分子結(jié)合區(qū)域的方法,包括識(shí)別一個(gè)或多個(gè)氨基酸,所述氨基酸含有一個(gè)或多個(gè)具有大于所選閾值的SAP的原子;其中根據(jù)權(quán)利要求1、權(quán)利要求2和權(quán)利要求M中任一項(xiàng)的方法計(jì)算所述SAP,并且其 中所述大分子結(jié)合區(qū)域包括所述識(shí)別的氨基酸。
67.識(shí)別蛋白質(zhì)上的大分子結(jié)合區(qū)域的方法,包括繪制如權(quán)利要求1、權(quán)利要求2和權(quán)利要求M中任一項(xiàng)中所計(jì)算的所述SAP值, 為所述圖中的峰計(jì)算曲線下面積(AUC),和 識(shí)別一個(gè)或多個(gè)具有正的AUC的蛋白區(qū)域, 其中所述大分子結(jié)合區(qū)域包括所述識(shí)別的蛋白區(qū)域。
68.制備顯示對(duì)大分子降低的結(jié)合親和力的蛋白質(zhì)變體的方法,包括替代或缺失針對(duì)所述蛋白質(zhì)中的所述大分子的大分子結(jié)合區(qū)域內(nèi)的至少一個(gè)氨基酸 殘基,其中使用根據(jù)權(quán)利要求1、權(quán)利要求2和權(quán)利要求M中任一項(xiàng)計(jì)算的SAP得分識(shí)別所 述大分子結(jié)合區(qū)域;和其中,如果替代所述氨基酸殘基,用更親水的氨基酸殘基替代它,這樣降低了所述變體 對(duì)所述大分子的所述結(jié)合親和力。
69.權(quán)利要求68的方法,其中替代至少一個(gè)殘基和缺失至少一個(gè)殘基。
70.制備顯示針對(duì)大分子的改變的結(jié)合親和力的蛋白質(zhì)變體的方法,包括(a)在每個(gè)變體中通過(guò)替代針對(duì)所述蛋白質(zhì)中所述大分子的大分子結(jié)合區(qū)域內(nèi)的至少 一個(gè)殘基,產(chǎn)生許多蛋白質(zhì)變體,其中使用根據(jù)權(quán)利要求1、權(quán)利要求2和權(quán)利要求M中任一項(xiàng)計(jì)算的SAP得分識(shí)別所 述大分子結(jié)合區(qū)域,其中在每個(gè)變體中,替代一個(gè)或不同殘基或不同的殘基組合;和(b)選擇如(a)中所制備的顯示對(duì)所述大分子改變的結(jié)合親和力的蛋白質(zhì)變體。
71.權(quán)利要求68至權(quán)利要求70中任一項(xiàng)的方法,其中所述大分子結(jié)合區(qū)域內(nèi)的至少一 個(gè)氨基酸殘基是所述大分子結(jié)合區(qū)域中最疏水的殘基。
72.權(quán)利要求68至權(quán)利要求70中任一項(xiàng)的方法,其中易聚集區(qū)域內(nèi)所述至少一個(gè)氨基 酸殘基是 Phe> Leu、lie、Tyr> Trp> Val> Met> Pro、Cys、Ala 或 Gly0
73.權(quán)利要求68至權(quán)利要求70中任一項(xiàng)的方法,其中所述更親水的氨基酸殘基選自 Thrλ Serλ LysΛ Gin、Asn、His、Glu、Asp 禾口 Arg0
74.權(quán)利要求68的方法,其中所述更親水的氨基酸殘基是稀有的、非天然的或修飾的 氨基酸。
75.權(quán)利要求68的方法,其中根據(jù)Black和Mould的疏水性標(biāo)度測(cè)定所述更親水的氨基酸殘基。
76.權(quán)利要求68至權(quán)利要求70的方法,其中替代所述大分子結(jié)合區(qū)域內(nèi)的至少兩個(gè)氨基酸殘基。
77.權(quán)利要求68至權(quán)利要求70的方法,其中替代大分子結(jié)合區(qū)域內(nèi)的至少三個(gè)氨基酸殘基。
78.權(quán)利要求68至權(quán)利要求70的方法,其中替代所述蛋白質(zhì)內(nèi)超過(guò)一個(gè)大分子結(jié)合區(qū) 域內(nèi)的至少一個(gè)殘基。
79.權(quán)利要求68至權(quán)利要求70中任一項(xiàng)的方法,其中根據(jù)權(quán)利要求65至權(quán)利要求67 中任一項(xiàng)所述的方法識(shí)別所述大分子結(jié)合區(qū)域。
80.權(quán)利要求68至權(quán)利要求79中任一項(xiàng)的方法,其中所述大分子是另一個(gè)蛋白、多核 苷酸或多糖。
81.權(quán)利要求68至權(quán)利要求80中任一項(xiàng)的方法,其中所述蛋白選自抗體、Fab片段、 Fab'片段、Fd片段、Fv片段、F(ab' )2片段和Fc片段。
82.權(quán)利要求68至權(quán)利要求80中任一項(xiàng)的方法,其中所述蛋白是細(xì)胞因子、趨化因子、 脂因子、肌因子、神經(jīng)遞質(zhì)、神經(jīng)營(yíng)養(yǎng)蛋白、白細(xì)胞介素或干擾素。
83.權(quán)利要求68至權(quán)利要求80中任一項(xiàng)的方法,其中所述蛋白是激素或生長(zhǎng)因子。
84.權(quán)利要求83的方法,其中所述大分子是激素受體或生長(zhǎng)因子受體。
85.權(quán)利要求68至權(quán)利要求70中任一項(xiàng)的方法,其中所述蛋白是受體或受體域。
86.權(quán)利要求85的方法,其中所述大分子是所述受體或受體域的受體激動(dòng)劑或受體拮 抗劑。
87.權(quán)利要求68至權(quán)利要求80中任一項(xiàng)的方法,其中所述蛋白是神經(jīng)遞質(zhì)或神經(jīng)營(yíng)養(yǎng)蛋白。
88.權(quán)利要求87的方法,其中所述大分子是神經(jīng)遞質(zhì)受體或神經(jīng)營(yíng)養(yǎng)蛋白受體。
89.制備包括蛋白質(zhì)變體的藥物組合物的方法,所述蛋白質(zhì)變體顯示改變的與結(jié)合配 偶體相互作用的傾向,所述方法包括配制根據(jù)權(quán)利要求68或70的方法獲得的蛋白質(zhì)變體 加上藥學(xué)上可接受的載體、佐劑和/或賦形劑。
全文摘要
本發(fā)明提供至少部分基于計(jì)算機(jī)模擬的方法和計(jì)算工具,其識(shí)別蛋白質(zhì)的大分子結(jié)合區(qū)域和易聚集區(qū)域。然后可在這些易聚集區(qū)域進(jìn)行替代以設(shè)計(jì)具有增強(qiáng)的穩(wěn)定性和/或降低的聚集傾向的蛋白質(zhì)。相似地,然后可在這些大分子結(jié)合區(qū)域進(jìn)行替代以設(shè)計(jì)具有改變的對(duì)大分子的結(jié)合親合力的蛋白質(zhì)。
文檔編號(hào)G06F19/00GK102099809SQ200980128287
公開日2011年6月15日 申請(qǐng)日期2009年6月19日 優(yōu)先權(quán)日2008年6月20日
發(fā)明者B·垂奧特, B·海爾克, N·陳納姆塞蒂, V·卡瑟爾, V·沃諾夫 申請(qǐng)人:諾華公司, 麻省理工學(xué)院