本申請(qǐng)要求皆在2015年3月26日提交的美國(guó)專利申請(qǐng)?zhí)?4/669,753和國(guó)際申請(qǐng)?zhí)朠CT/US2015/022780的優(yōu)先權(quán);根據(jù)35U.S.C.119(e),這兩篇皆要求2015年2月18日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?2/117,550、2014年5月15日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/993,783,和2014年3月27日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/971,388的申請(qǐng)日的權(quán)益。根據(jù)35U.S.C.119(e),本申請(qǐng)也要求2015年2月18日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?2/117,550、2014年5月15日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/993,783和2014年3月27日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/971,388的申請(qǐng)日的權(quán)益。上述提及的申請(qǐng)的每一篇的全部?jī)?nèi)容,包括所有的附圖和序列表,通過(guò)引用并入本文。
背景技術(shù):
:膜蛋白在所有活的系統(tǒng)(livingsystem)中起到關(guān)鍵的作用。在幾乎所有測(cè)序基因組中的約~30%的所有基因?qū)δさ鞍拙幋a。但是,我們對(duì)于它們的結(jié)構(gòu)和功能的詳細(xì)理解遠(yuǎn)遠(yuǎn)落后于對(duì)可溶性蛋白質(zhì)的詳細(xì)理解。截止2015年3月,蛋白質(zhì)數(shù)據(jù)庫(kù)(ProteinDataBank)中有超過(guò)100,000個(gè)結(jié)構(gòu)。但是,僅僅有945個(gè)膜蛋白結(jié)構(gòu),其中530個(gè)獨(dú)特的結(jié)構(gòu)包括28個(gè)G蛋白偶聯(lián)受體并且沒(méi)有四次跨膜蛋白(tetraspaninmembraneproteins)。闡釋膜受體的結(jié)構(gòu)和功能,以及它們的識(shí)別和配體結(jié)合特性有數(shù)個(gè)瓶頸,但是它們非常令人感興趣。最關(guān)鍵和挑戰(zhàn)性的工作是非常難以產(chǎn)生毫克量的可溶性的和穩(wěn)定的受體。非常需要便宜的大規(guī)模生產(chǎn)方法,并且因此已經(jīng)是廣泛研究的焦點(diǎn)。只有當(dāng)克服這些基本障礙之后,才可能進(jìn)行詳細(xì)的結(jié)構(gòu)研究。通過(guò)引用并入本文的Zhang等(美國(guó)專利號(hào):8,637,452)描述了改進(jìn)的水溶解GPCR的方法,其中位于跨膜區(qū)中的某些疏水氨基酸被極性氨基酸替換。但是,該方法是勞動(dòng)密集型的。此外,盡管修飾的跨膜區(qū)符合水溶性標(biāo)準(zhǔn),但是期望水溶性和配體結(jié)合的改善。所以,本領(lǐng)域需要研究G蛋白偶聯(lián)受體的改善的方法。技術(shù)實(shí)現(xiàn)要素:本發(fā)明涉及設(shè)計(jì)、選擇和/或產(chǎn)生水溶性膜蛋白和肽的方法,由其設(shè)計(jì)、選擇或產(chǎn)生的肽(和跨膜結(jié)構(gòu)域)、包括所述肽的組合物,以及使用其的方法。尤其,方法涉及使用“QTYPrinciple”設(shè)計(jì)水溶性膜肽,比如GPCR變體和四次跨膜蛋白的文庫(kù)的過(guò)程,將不溶于水的氨基酸(Leu、Ile、Val和Phe,或簡(jiǎn)單的字母符號(hào)L、I、V、F)變成水溶性、非離子氨基酸(Gln、Thr和Tyr,或簡(jiǎn)單的字母符號(hào)Q、T、Y)。此外,兩個(gè)另外的非離子氨基酸Asn(N)和Ser(S)也可用于替換L、I和V而不替換F。在下面討論的實(shí)施方式中,應(yīng)當(dāng)理解Asn(N)和Ser(S)被設(shè)想替換Q和T(作為變體描述)或L、I或V(作為天然蛋白質(zhì)描述)。但是,為了簡(jiǎn)化的目的,本申請(qǐng)不進(jìn)一步闡述這些可選的實(shí)施方式的細(xì)節(jié),因?yàn)楦鶕?jù)本文的教導(dǎo),這些是本領(lǐng)域技術(shù)人員已知的。本發(fā)明包括修飾的、合成的和/或非天然存在的α-螺旋結(jié)構(gòu)域和包括這種修飾的α-螺旋結(jié)構(gòu)域的水溶性多肽(例如,“sGPCR”),其中修飾的α-螺旋結(jié)構(gòu)域包括其中天然膜蛋白的α-螺旋結(jié)構(gòu)域中的多個(gè)疏水氨基酸殘基(L、I、V、F)的氨基酸序列被親水的、非離子氨基酸殘基(分別Q、T、T、Y,或“Q、T、Y”)和/或N和S替換。本發(fā)明也包括制備水溶性多肽的方法,其包括用親水的、非離子氨基酸殘基(Q/N/S、T/N/S、Y)替換天然膜蛋白的α-螺旋結(jié)構(gòu)域中的多個(gè)疏水氨基酸殘基(L,I,V,F(xiàn))。本發(fā)明另外包括通過(guò)用親水的、非離子氨基酸殘基(分別Q/N/S、T/N/S、Y)替換天然膜蛋白的α-螺旋結(jié)構(gòu)域中的多個(gè)疏水氨基酸殘基(L,I,V,F(xiàn))制備的多肽。變體可由親本或天然蛋白質(zhì)(例如,CXCR4)的名字加上縮寫(xiě)“QTY”來(lái)表征(例如,CXCR4-QTY)。因此,本發(fā)明的一個(gè)方面提供了操作計(jì)算機(jī)程序,以執(zhí)行設(shè)計(jì)膜蛋白(例如,G蛋白偶聯(lián)受體(GPCR))的水溶性變體的腳本程序(scriptedprocedure)的方法,該方法包括:(1)輸入用于分析的膜蛋白(例如,GPCR)的序列;(2)獲得膜蛋白(例如,GPCR)的變體,其中膜蛋白(例如,GPCR)的跨膜(TM)結(jié)構(gòu)域α-螺旋區(qū)段(“TM區(qū)”)中的多個(gè)疏水氨基酸是替換的,其中:(a)所述疏水氨基酸選自亮氨酸(L)、異亮氨酸(I)、纈氨酸(V)和苯丙氨酸(F);(b)每個(gè)所述亮氨酸(L)獨(dú)立地被谷氨酰胺(Q)、天冬酰胺(N)或絲氨酸(S)替換;(c)每個(gè)所述異亮氨酸(I)和所述纈氨酸(V)獨(dú)立地被蘇氨酸(T)、天冬酰胺(N)或絲氨酸(S)替換;并且,(d)每個(gè)所述苯丙氨酸被酪氨酸(Y)替換;和,隨后,(3)獲得變體的α-螺旋二級(jí)結(jié)構(gòu)結(jié)果,以確認(rèn)變體中α-螺旋二級(jí)結(jié)構(gòu)的保持;(4)獲得變體的跨膜區(qū)結(jié)果,以確認(rèn)變體的水溶性,從而設(shè)計(jì)膜蛋白(例如,GPCR)的水溶性變體。在某些實(shí)施方式中,步驟(3)在步驟(4)之前進(jìn)行、與步驟(4)同時(shí)進(jìn)行或在步驟(4)之后進(jìn)行。如本文所描述,另外的步驟可并入上述處理順序。處理優(yōu)選地使用數(shù)據(jù)處理系統(tǒng)實(shí)施的計(jì)算步驟。系統(tǒng)使用自動(dòng)計(jì)算系統(tǒng)和方法來(lái)選擇蛋白質(zhì)變體。在某些實(shí)施方式中,在步驟(2)中,在GPCR的一個(gè)和相同TM區(qū)中的一個(gè)亞組的所述多個(gè)疏水氨基酸被替換,以產(chǎn)生潛在的變體的文庫(kù)的一個(gè)成員,和所述多個(gè)疏水氨基酸的一個(gè)或多個(gè)不同亞組被替換,以產(chǎn)生文庫(kù)的另外的成員。在某些實(shí)施方式中,方法可進(jìn)一步包括基于組合評(píng)分對(duì)所述文庫(kù)的所有成員排序,其中組合評(píng)分是α-螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果和跨膜區(qū)預(yù)測(cè)結(jié)果的加權(quán)組合。在某些實(shí)施方式中,方法進(jìn)一步包括使用排序函數(shù)對(duì)變體排序。在某些實(shí)施方式中,排序函數(shù)可包括二級(jí)結(jié)構(gòu)分量和水溶性分量。例如,排序函數(shù)可包括二級(jí)結(jié)構(gòu)分量和/或水溶性分量的加權(quán)值。在某些實(shí)施方式中,方法進(jìn)一步包括用數(shù)據(jù)處理器進(jìn)行的方法,其可進(jìn)一步包括與其關(guān)聯(lián)的存儲(chǔ)器。在某些實(shí)施方式中,方法可進(jìn)一步包括選擇具有最高組合評(píng)分的N個(gè)成員,以形成所述TM區(qū)的潛在變體的第一文庫(kù),其中N是預(yù)定的整數(shù)(例如,3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更大)。在某些實(shí)施方式中,方法可進(jìn)一步包括產(chǎn)生GPCR的1、2、3、4、5個(gè)或所有6個(gè)其他TM區(qū)的潛在變體的一個(gè)文庫(kù)。在某些實(shí)施方式中,方法可進(jìn)一步包括用來(lái)自潛在變體的文庫(kù)的相應(yīng)TM區(qū)替換GPCR的兩個(gè)或更多個(gè)TM區(qū),以建立組合變體的文庫(kù)。在某些實(shí)施方式中,方法進(jìn)一步包括產(chǎn)生/表達(dá)所述組合變體。在某些實(shí)施方式中,方法進(jìn)一步包括測(cè)試所述組合變體的配體結(jié)合(例如,在酵母雙雜交系統(tǒng)中),其中選擇與GPCR的相比具有基本上相同配體結(jié)合的那些。在某些實(shí)施方式中,方法進(jìn)一步包括測(cè)試所述組合變體的GPCR的生物功能,其中選擇與GPCR的相比具有基本上相同生物功能的那些。本發(fā)明的某些水溶性多肽具備結(jié)合通常結(jié)合野生型或天然膜蛋白(例如,GPCR)的配體。在某些實(shí)施方式中,天然膜蛋白(例如,GPCR)的潛在的配體結(jié)合位點(diǎn)中的氨基酸不被替換和/或天然膜蛋白(例如,GPCR)的細(xì)胞外和/或細(xì)胞內(nèi)結(jié)構(gòu)域的序列相同。(非離子)親水殘基(其替換了天然膜蛋白的α-螺旋結(jié)構(gòu)域中的一個(gè)或多個(gè)疏水殘基)選自:谷氨酰胺(Q)、蘇氨酸(T)、酪氨酸(Y)、天冬酰胺(N)和絲氨酸(S),和任何其組合。在另外的方面中,替換了選自亮氨酸(L)、異亮氨酸(I)、纈氨酸(V)和苯丙氨酸(F)的疏水殘基。在某些實(shí)施方式中,蛋白質(zhì)的α-螺旋結(jié)構(gòu)域的苯丙氨酸殘基被酪氨酸替換;蛋白質(zhì)的α-螺旋結(jié)構(gòu)域的異亮氨酸和/或纈氨酸殘基的每一個(gè)獨(dú)立地被蘇氨酸(或S或N)替換;和/或蛋白質(zhì)的α-螺旋結(jié)構(gòu)域的每一個(gè)亮氨酸殘基獨(dú)立地被谷氨酰胺(或S或N)替換。在某些實(shí)施方式中,基本上所有的(例如,96%、97%、98%、99%或100%)或30%、40%、50%、60%、70%、75%、80%、85%、90%、95%的所述亮氨酸被谷氨酰胺替換。在某些實(shí)施方式中,基本上所有的(例如,96%、97%、98%、99%或100%)或30%、40%、50%、60%、70%、75%、80%、85%、90%、95%的所述異亮氨酸被蘇氨酸替換。在某些實(shí)施方式中,基本上所有的(例如,96%、97%、98%、99%或100%)或30%、40%、50%、60%、70%、75%、80%、85%、90%、95%的所述纈氨酸被蘇氨酸替換。在某些實(shí)施方式中,基本上所有的(例如,96%、97%、98%、99%或100%)或30%、40%、50%、60%、70%、75%、80%、85%、90%、95%的所述苯丙氨酸被酪氨酸替換。在某些實(shí)施方式中,一個(gè)或多個(gè)(例如,1、2或3個(gè))所述亮氨酸不被替換。在某些實(shí)施方式中,一個(gè)或多個(gè)(例如,1、2或3個(gè))所述異亮氨酸不被替換。在某些實(shí)施方式中,一個(gè)或多個(gè)(例如,1、2或3個(gè))所述纈氨酸不被替換。在某些實(shí)施方式中,一個(gè)或多個(gè)(例如,1、2或3個(gè))所述苯丙氨酸不被替換。在某些實(shí)施方式中,組合變體的文庫(kù)包括小于約2百萬(wàn)個(gè)成員。在某些實(shí)施方式中,GPCR的序列包括關(guān)于GPCR的TM區(qū)的信息。在某些實(shí)施方式中,GPCR的序列獲得自蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)(例如,PDB、UniProt)。在某些實(shí)施方式中,GPCR的TM區(qū)基于GPCR的序列預(yù)測(cè)。例如,GPCR的TM區(qū)可使用TMHMM2.0(使用隱馬爾科夫模型(HiddenMarkovModel)的跨膜預(yù)測(cè))軟件模塊/包預(yù)測(cè)。在某些實(shí)施方式中,TMHMM2.0軟件模塊/包使用尋峰的動(dòng)態(tài)基線。在某些實(shí)施方式中,方法進(jìn)一步包括提供GPCR的每個(gè)變體的多核苷酸序列。多核苷酸序列可為在宿主(例如,細(xì)菌比如大腸桿菌,酵母比如釀酒酵母或粟酒裂殖酵母,昆蟲(chóng)細(xì)胞比如Sf9細(xì)胞,非人哺乳動(dòng)物細(xì)胞,或人細(xì)胞)中的表達(dá)所優(yōu)化的密碼子。在某些實(shí)施方式中,腳本程序可包括VBA腳本。在某些實(shí)施方式中,腳本程序可在Linux系統(tǒng)(例如,Ubuntu12.04LTS)、Unix系統(tǒng)、MicrosoftWindows操作系統(tǒng)、Android操作系統(tǒng)或AppleiOS操作系統(tǒng)中操作。包括C++、JavaScript、MATLAB等的不同編程語(yǔ)言可結(jié)合本發(fā)明的實(shí)施而使用。編碼的指令可儲(chǔ)存在可與本領(lǐng)域技術(shù)人員已知的計(jì)算機(jī)系統(tǒng)一起使用的存儲(chǔ)器設(shè)備,比如非瞬時(shí)計(jì)算機(jī)可讀的介質(zhì)中。在某些實(shí)施方式中,α-螺旋結(jié)構(gòu)域是G蛋白偶聯(lián)受體(GPCR)的天然膜蛋白中的7個(gè)跨膜α-螺旋結(jié)構(gòu)域中的一個(gè)。在一些實(shí)施方式中,GPCR選自:嘌呤能受體(P2Y1、P2Y2、P2Y4、P2Y6);M1和M3蕈毒堿乙酰膽堿受體;用于凝血酶(蛋白酶-激活受體(PAR)-1、PAR-2)、凝血烷(TXA2)、鞘氨醇1-磷酸(sphingosine1-phosphate)(S1P2、S1P3、S1P4和S1P5)、溶血磷脂酸(LPA1、LPA2、LPA3)、血管緊張肽II(AT1)、血清素(5-HT2c和5-HT4)、生長(zhǎng)激素釋放的抑制因子(sst5)、內(nèi)皮素(ETA和ETB)、膽囊收縮素(CCK1)的受體;V1a升壓素受體;D5多巴胺受體;fMLP甲酰基肽受體;GAL2甘丙肽受體;EP3前列腺素受體;A1腺苷受體;α1腎上腺素能受體;BB2鈴蟾肽受體;B2緩激肽受體;鈣感知受體;趨化因子受體;KSHV-ORF74趨化因子受體;NK1速激肽受體;甲狀腺-刺激激素(TSH)受體;蛋白酶-激活受體;神經(jīng)肽受體;腺苷A2B受體;P2Y嘌呤受體;代謝谷氨酸受體;GRK5;GPCR-30;和CXCR4。在其他實(shí)施方式中,天然膜蛋白或膜蛋白是整合膜蛋白。在進(jìn)一步的方面中,天然膜蛋白是哺乳動(dòng)物蛋白。本發(fā)明的蛋白優(yōu)選地是人的。在某些實(shí)施方式中,提及具體的GPCR蛋白(例如,CXCR4)指哺乳動(dòng)物GPCR,比如非人哺乳動(dòng)物GPCR或人GPCR。在一些實(shí)施方式中,α-螺旋結(jié)構(gòu)域是,例如,細(xì)胞外或細(xì)胞內(nèi)環(huán)中修飾的以改善或改變配體結(jié)合的G蛋白偶聯(lián)受體(GPCR)變體中7個(gè)跨膜α-螺旋結(jié)構(gòu)域之一,如在參考文獻(xiàn)的其他地方所描述。為了本發(fā)明的目的,詞“天然”或“野生型”旨在指根據(jù)本文所述的方法水溶解之前的蛋白質(zhì)(或α-螺旋結(jié)構(gòu)域)。在某些實(shí)施方式中,膜蛋白可以是四次跨膜蛋白,其特征在于4個(gè)跨膜α-螺旋。已經(jīng)評(píng)述和注釋了約54種人四次跨膜蛋白。已知許多介導(dǎo)細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)事件,其在細(xì)胞發(fā)育、激活、生長(zhǎng)和運(yùn)動(dòng)的調(diào)節(jié)中起到關(guān)鍵作用。例如,CD81受體作為丙肝病毒進(jìn)入和瘧原蟲(chóng)感染的受體起到關(guān)鍵作用。CD81基因位于腫瘤-抑制因子基因區(qū)域中并且可以是介導(dǎo)癌癥惡性腫瘤的候選。CD151參與癌癥細(xì)胞的增強(qiáng)的細(xì)胞運(yùn)動(dòng)、侵入和轉(zhuǎn)移。CD63的表達(dá)與卵巢癌的侵入有關(guān)。四次跨膜蛋白的特征是第二或大的細(xì)胞外環(huán)中的半胱氨酸-半胱氨酸-甘氨酸基序。本發(fā)明的另一方面提供了G蛋白偶聯(lián)受體(GPCR)的水溶性變體,其中:(1)GPCR的跨膜(TM)結(jié)構(gòu)域α-螺旋區(qū)段(“TM區(qū)”)中的多個(gè)疏水氨基酸被替換,其中:(a)所述疏水氨基酸選自亮氨酸(L)、異亮氨酸(I)、纈氨酸(V)和苯丙氨酸(F);(b)每個(gè)所述亮氨酸(L)獨(dú)立地被谷氨酰胺(Q)、天冬酰胺(N)或絲氨酸(S)替換;(c)每個(gè)所述異亮氨酸(I)和所述纈氨酸(V)獨(dú)立地被蘇氨酸(T)、天冬酰胺(N)或絲氨酸(S)替換;并且,(d)每個(gè)所述苯丙氨酸被酪氨酸(Y)替換;和,隨后,(2)變體的所有7個(gè)TM區(qū)保持α-螺旋二級(jí)結(jié)構(gòu);并且(3)沒(méi)有預(yù)測(cè)的跨膜區(qū)。在某些實(shí)施方式中,水溶性變體包括選自SEQIDNOs:4-11、13-20、22-29、31-38、40-47、49-56和58-64的一個(gè)或多個(gè)氨基酸序列。其可進(jìn)一步包括選自SEQIDNOs:3、12、21、30、39、48和57的一個(gè)或多個(gè)氨基酸序列。在某些實(shí)施方式中,水溶性變體結(jié)合CXCR4配體。在某些實(shí)施方式中,水溶性變體包括選自SEQIDNOs:69-76、78-85、87、89-96、98-105、107-114和116-123的一個(gè)或多個(gè)氨基酸序列。其可進(jìn)一步包括選自SEQIDNOs:68、77、86、88、97、106、115和124的一個(gè)或多個(gè)氨基酸序列。在某些實(shí)施方式中,水溶性變體結(jié)合CX3CR1配體。在某些實(shí)施方式中,水溶性變體包括選自SEQIDNOs:128-135、137-144、146-153、155-162、164-171、173和175-182的一個(gè)或多個(gè)氨基酸序列。其可進(jìn)一步包括選自SEQIDNOs:127、136、145、154、163、172、174和183的一個(gè)或多個(gè)氨基酸序列。在某些實(shí)施方式中,水溶性變體結(jié)合CCR3配體。在某些實(shí)施方式中,水溶性變體包括選自SEQIDNOs:187-194、196-203、205-206、208、210-217、219-225、227-234的一個(gè)或多個(gè)氨基酸序列。其可進(jìn)一步包括選自SEQIDNOs:186、195、204、207、209、218、226和235的一個(gè)或多個(gè)氨基酸序列。在某些實(shí)施方式中,水溶性變體結(jié)合CCR5配體。在某些實(shí)施方式中,水溶性變體包括選自SEQIDNOs:236-243、245-252、254-261、263-270、272、274-281和283-290的一個(gè)或多個(gè)氨基酸序列。其可進(jìn)一步包括選自SEQIDNOs:235、244、253、262、271、273、282和291的一個(gè)或多個(gè)氨基酸序列。在某些實(shí)施方式中,水溶性變體結(jié)合CXCR3配體。在某些實(shí)施方式中,水溶性變體包括在SEQIDNOs:2、67、126、185、327、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323或325的任何一個(gè)中闡釋的一個(gè)或多個(gè)跨膜結(jié)構(gòu)域。在某些實(shí)施方式中,變體是水溶性的并且結(jié)合同源的天然跨膜蛋白的配體。本發(fā)明的另一方面提供在細(xì)菌(例如,大腸桿菌)中產(chǎn)生蛋白質(zhì)的方法,包括:(a)在適于蛋白質(zhì)產(chǎn)生的條件下在生長(zhǎng)培養(yǎng)基中培養(yǎng)細(xì)菌;(b)分級(jí)分離(fractioning)細(xì)菌的裂解物,以產(chǎn)生可溶性部分(fraction)和不溶性的小球部分;和,(c)從可溶性部分分離蛋白質(zhì);其中:(1)蛋白質(zhì)是權(quán)利要求29-46任一項(xiàng)的變體G蛋白偶聯(lián)受體(GPCR);和,(2)蛋白質(zhì)的產(chǎn)率是至少20mg/L(例如,30mg/L、40mg/L、50mg/L或更大)的生長(zhǎng)培養(yǎng)基。在某些實(shí)施方式中,細(xì)菌是大腸桿菌BL21,并且生長(zhǎng)培養(yǎng)基是LB培養(yǎng)基。在某些實(shí)施方式中,蛋白質(zhì)由細(xì)菌中的質(zhì)粒編碼。在某些實(shí)施方式中,蛋白質(zhì)的表達(dá)在誘導(dǎo)型啟動(dòng)子,比如IPTG可誘導(dǎo)的誘導(dǎo)型啟動(dòng)子的控制下。在某些實(shí)施方式中,通過(guò)超聲產(chǎn)生裂解物。在某些實(shí)施方式中,可溶性部分通過(guò)在14,500×g或更大離心裂解物產(chǎn)生。本發(fā)明的另一方面提供了在需要其的受試者中治療由膜蛋白的活性介導(dǎo)的不適或疾病的方法,其包括向所述受試者施用有效量的本文所述的水溶性多肽。在某些實(shí)施方式中,水溶性多肽保持膜蛋白的配體結(jié)合活性。可通過(guò)施用本發(fā)明的水溶性肽治療的不適和疾病的例子包括但不限于癌癥(比如,小細(xì)胞肺癌、黑素瘤、三陰性乳腺癌)、帕金森病、心血管疾病、高血壓和支氣管哮喘。本發(fā)明的另一方面提供了包括治療有效量的本發(fā)明的水溶性多肽和藥學(xué)上可接受的載體或稀釋劑的藥物組合物。在仍另一方面中,本發(fā)明提供了用包括修飾的α-螺旋結(jié)構(gòu)域的受試者水溶性肽轉(zhuǎn)染的細(xì)胞。在某些實(shí)施方式中,細(xì)胞是動(dòng)物細(xì)胞(例如,人、非人哺乳動(dòng)物、昆蟲(chóng)、鳥(niǎo)、魚(yú)、爬行動(dòng)物、兩棲動(dòng)物或其他細(xì)胞)、酵母或細(xì)菌細(xì)胞。本發(fā)明也包括在計(jì)算機(jī)系統(tǒng)進(jìn)行的計(jì)算機(jī)實(shí)施的方法,該方法包括如本文所描述的一個(gè)或多個(gè)方法(或其步驟)。計(jì)算機(jī)系統(tǒng)包括非瞬時(shí)計(jì)算機(jī)可讀的介質(zhì),其具有在其上儲(chǔ)存的計(jì)算機(jī)-可執(zhí)行的指令、使得計(jì)算機(jī)系統(tǒng)實(shí)施該方法的被計(jì)算機(jī)系統(tǒng)執(zhí)行的計(jì)算機(jī)-可執(zhí)行的指令、使得計(jì)算機(jī)系統(tǒng)實(shí)施本文考慮的方法的被計(jì)算機(jī)系統(tǒng)執(zhí)行的計(jì)算機(jī)-可執(zhí)行的指令。另外,計(jì)算機(jī)系統(tǒng)包括至少一個(gè)存儲(chǔ)器,以儲(chǔ)存順序數(shù)據(jù)和本文所述的定量結(jié)果以及與存儲(chǔ)器關(guān)聯(lián)的至少一個(gè)處理器,考慮配置為實(shí)施本文所述的方法的處理器。結(jié)合電子顯示設(shè)備,用戶界面,比如圖形用戶界面(GUI)可用于選擇可操作以控制選擇過(guò)程——包括本文所述的計(jì)算方法——的處理參數(shù)。本發(fā)明的另一方面提供了非瞬時(shí)計(jì)算機(jī)可讀的介質(zhì),其具有在其上儲(chǔ)存的一系列指令,以實(shí)施本發(fā)明的任何方法。本發(fā)明的進(jìn)一步方面提供了可操作以選擇G蛋白偶聯(lián)受體的水溶性變體的數(shù)據(jù)處理系統(tǒng),其包括:數(shù)據(jù)處理器,其可操作以實(shí)施本發(fā)明的任何方法中闡釋的氨基酸替換,其中系統(tǒng)用排序函數(shù)對(duì)蛋白質(zhì)變體排序。應(yīng)理解,本發(fā)明的所有實(shí)施方式,包括僅僅在本發(fā)明的一個(gè)方面(例如,篩選方法)下描述的那些,解釋為適用于本發(fā)明的所有方面(例如,水溶性蛋白質(zhì)或使用方法),并且解釋為與本發(fā)明的任何一個(gè)或多個(gè)另外實(shí)施方式可結(jié)合,除非明確否認(rèn)或以其他方式不合適,如本領(lǐng)域技術(shù)人員容易理解。附圖說(shuō)明本發(fā)明的前述和其他目的、特征和優(yōu)勢(shì)將從下述本發(fā)明代表性實(shí)施方式的更具體描述中顯而易見(jiàn),如在附圖中闡釋,其中在不同的視圖中相同的參考字符指相同的部分。附圖不必按比例,而是強(qiáng)調(diào)圖解本發(fā)明原理。圖1A-1D是系統(tǒng)性將疏水氨基酸L、I、V和F分別替換為Q、T、T、Y的QTYCode的一般圖解(圖1A)。氨基酸亮氨酸和谷氨酰胺的分子形狀類似;同樣地,異亮氨酸和纈氨酸的分子形狀與蘇氨酸類似;并且苯丙氨酸和酪氨酸的分子形狀類似。亮氨酸、異亮氨酸、纈氨酸和苯丙氨酸是疏水的并且不能結(jié)合水分子。相反,谷氨酰胺可結(jié)合4個(gè)水分子、2個(gè)氫供體和2個(gè)氫受體;蘇氨酸和酪氨酸上的-OH基可結(jié)合3個(gè)水分子、1個(gè)氫供體和2個(gè)受體。圖1B是α螺旋的側(cè)視圖。在應(yīng)用系統(tǒng)性氨基酸改變的QTYCode之后,α螺旋成為水溶性的。圖1C是QTYCode替換之前和之后的α螺旋的頂視圖:左側(cè)的螺旋是天然膜螺旋,主要是疏水氨基酸,在右側(cè)的螺旋是應(yīng)用QTYCode替換之后的相同螺旋?,F(xiàn)在螺旋具有大部分親水氨基酸(圖1D)。在QTYCode之前,GPCR膜蛋白由疏水的脂質(zhì)分子圍繞,以將它們嵌入脂質(zhì)膜的內(nèi)側(cè)(圖1D的左側(cè)部分)。在應(yīng)用QTYCode之后,GPCR膜蛋白成為水溶性的并且不再需要凈化劑圍繞它用于穩(wěn)定性(圖1D的右側(cè)部分)。圖2是CXCR4的跨膜結(jié)構(gòu)域區(qū)的TMHMM預(yù)測(cè)。預(yù)測(cè)顯示7個(gè)不同的疏水跨膜區(qū)段。而在進(jìn)行本發(fā)明的QTY替換方法的CXCR4的變體的TMHMM預(yù)測(cè)中(CXCR4-QTY),不再有可見(jiàn)的不同的7個(gè)疏水跨膜區(qū)段。圖3圖解了預(yù)測(cè)的CXCR4的全QTYCode修飾的TM1結(jié)構(gòu)域的α螺旋輪結(jié)構(gòu)。圖4圖解了在GPCRCXCR4的7個(gè)TM區(qū)的每一個(gè)中的潛在變體。圖5、6、7和8分別是野生型蛋白質(zhì)和CXCR4、CXCR3、CCR3和CCR5的QTY變體的序列排比。QTYCode僅僅應(yīng)用于7個(gè)疏水的跨膜區(qū)段,而不應(yīng)用于細(xì)胞外和細(xì)胞內(nèi)區(qū)段。圖9A是方法的代表性實(shí)施方式的流程圖。圖9B是方法的代表性實(shí)施方式的另一流程圖。圖10是本發(fā)明的計(jì)算機(jī)系統(tǒng)的圖解。圖11A和11B是流程圖的示意圖,其闡釋了本發(fā)明某些優(yōu)選實(shí)施方式的處理步驟。發(fā)明詳述如下是本發(fā)明優(yōu)選的實(shí)施方式的描述。詞“一個(gè)(a)”或“一個(gè)(an)”意思是包括一個(gè)或多個(gè),除非另外指出。在一些方面中,本發(fā)明涉及QTY(谷氨酰胺、蘇氨酸和酪氨酸)替換(或“QTYCode”)方法(或“原理”)的使用,以將天然蛋白質(zhì)的7個(gè)跨膜α-螺旋疏水殘基亮氨酸(L)、異亮氨酸(I)、纈氨酸(V)和苯丙氨酸(F)變成親水殘基谷氨酰胺(Q)、蘇氨酸(T)和酪氨酸(Y)。在某些實(shí)施方式中,如上述,Asn(N)和Ser(S)可也用作L、I和/或V,而不是F的替換殘基。本發(fā)明可將水不溶性的天然膜蛋白轉(zhuǎn)化為仍保持天然蛋白質(zhì)的一些或基本上所有功能的更水溶性的對(duì)應(yīng)物。本發(fā)明包括設(shè)計(jì)水溶性肽的方法。根據(jù)GPCR蛋白作為示意性例子描述該方法,在第一種情況下對(duì)人CCR3、CCR5、CXCR4和CX3CR1具有特異性。但是,本發(fā)明的一般原理也適用于具有跨膜(α-螺旋)區(qū)的其他蛋白質(zhì)。GPCR通常具有7個(gè)跨膜α-螺旋(7TM)和由7個(gè)TM區(qū)連接的8個(gè)環(huán)(loop)(8NTM)。這些跨膜區(qū)段可稱為T(mén)M1、TM2、TM3、TM4、TM5、TM6和TM7。8個(gè)非跨膜環(huán)分為4個(gè)細(xì)胞外環(huán)EL1、EL2、EL3和EL4,并且4個(gè)細(xì)胞內(nèi)環(huán)IL1、IL2、IL3和IL4,因此,總共8個(gè)環(huán)(包括N-和C-末端環(huán),其每個(gè)僅僅連接一個(gè)TM區(qū),并且每個(gè)具有游離端)。因此,7TMGPCR蛋白基于跨膜和非跨膜特征可分為15個(gè)片段。本發(fā)明的一個(gè)方面提供了操作計(jì)算機(jī)程序的方法,以執(zhí)行腳本程序,以選擇或制備膜蛋白(例如,G蛋白偶聯(lián)受體(GPCR))的水溶性變體,該方法包括:(1)輸入用于分析的膜蛋白(例如,GPCR)的序列;(2)獲得膜蛋白(例如,GPCR)的變體,其中膜蛋白(例如,GPCR)的跨膜(TM)結(jié)構(gòu)域α-螺旋區(qū)段(“TM區(qū)”)中的多個(gè)疏水氨基酸被替換,其中:(a)所述疏水氨基酸選自亮氨酸(L)、異亮氨酸(I)、纈氨酸(V)和苯丙氨酸(F);(b)每個(gè)所述亮氨酸(L)獨(dú)立地被谷氨酰胺(Q)、天冬酰胺(N)或絲氨酸(S)替換;(c)每個(gè)所述異亮氨酸(I)和所述纈氨酸(V)獨(dú)立地被蘇氨酸(T)、天冬酰胺(N)或絲氨酸(S)替換;并且,(d)每個(gè)所述苯丙氨酸被酪氨酸(Y)替換;和,隨后,(3)獲得變體的α-螺旋二級(jí)結(jié)構(gòu)結(jié)果,以確認(rèn)變體中α-螺旋二級(jí)結(jié)構(gòu)的保持;(4)獲得變體的跨膜區(qū)結(jié)果,以確認(rèn)變體的水溶性,從而選擇膜蛋白(例如,GPCR)的水溶性變體。如本文所使用,“(跨)膜蛋白的水溶性變體”或“水溶性(跨)膜變體”可替換使用。進(jìn)行本發(fā)明步驟的精確的順序可以是可改變的。例如,在某些實(shí)施方式中,步驟(3)在步驟(4)之前進(jìn)行。在某些實(shí)施方式中,步驟(3)與步驟(4)同時(shí)進(jìn)行。在某些實(shí)施方式中,步驟(3)在步驟(4)之后進(jìn)行。在某些實(shí)施方式中,多個(gè)疏水氨基酸隨機(jī)選自位于蛋白質(zhì)的所有TM區(qū)上的所有潛在的疏水氨基酸L、I、V和F。在某些實(shí)施方式中,多個(gè)疏水氨基酸是位于蛋白質(zhì)的所有TM區(qū)上的所有潛在的疏水氨基酸L、I、V和F的約5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。在某些實(shí)施方式中,多個(gè)疏水氨基酸不少于位于蛋白質(zhì)的所有TM區(qū)上的所有潛在的疏水氨基酸L、I、V和F的約10%、15%、20%、25%、30%、35%、40%、45%、50%。在某些實(shí)施方式中,多個(gè)疏水氨基酸不大于位于蛋白質(zhì)的所有TM區(qū)上的所有潛在的疏水氨基酸L、I、V和F的約95%、90%、85%、80%、75%、70%、65%、60%或50%。在某些實(shí)施方式中,隨機(jī)選擇的疏水氨基酸L、I、V和F可大體上均勻分布在所有的TM區(qū)上,或可優(yōu)選地或排他性地分布在1、2、3、4、5或6個(gè)TM區(qū)上。在某些實(shí)施方式中,蛋白質(zhì)的所有TM區(qū)上的每個(gè)潛在的疏水氨基酸L、I、V和F被替換。例如,所有L獨(dú)立地被Q(或S或N)替換;和/或所有I和V獨(dú)立地被T(或S或N)替換;和/或所有F被Y替換。在某些實(shí)施方式中,所有L被Q替換,所有I和V被T替換,和所有F被Y替換。在某些實(shí)施方式中,不是隨機(jī)替換所有TM區(qū)中的選擇的疏水氨基酸L、I、V和F,而是所有的替換可首先限于TM區(qū)的任何一個(gè)(比如最N-末端或C-末端TM區(qū)),并且僅僅期望的替換變體被選擇作為潛在的變體的文庫(kù)的成員。文庫(kù)的所有成員在選擇的TM區(qū)中的替換不同,這是由于替換的位置(例如,TM區(qū)中的第3個(gè)殘基對(duì)第10個(gè)殘基被替換),或由于替換基殘基的身份(identity)(例如,對(duì)于I或V替換,S對(duì)T),或二者?;陬A(yù)定的標(biāo)準(zhǔn)選擇期望的替換變體,比如考慮α-螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果和/或跨膜區(qū)預(yù)測(cè)結(jié)果的評(píng)分系統(tǒng)。該方法可為蛋白質(zhì)的1、2、3、4、5、6個(gè)另外的TM區(qū),或蛋白質(zhì)的所有剩余的TM區(qū)重復(fù),每個(gè)迭代產(chǎn)生潛在的變體的文庫(kù),其可儲(chǔ)存在電子存儲(chǔ)器或數(shù)據(jù)庫(kù)中。在相同的文庫(kù)中,所有的變體在所選擇的TM區(qū)中的替換不同(見(jiàn)上),但是在剩余的TM區(qū)和非TM區(qū)中另外相同。使用來(lái)自兩個(gè)或更多個(gè)這種文庫(kù)的序列的結(jié)構(gòu)域轉(zhuǎn)換或改組產(chǎn)生了在兩個(gè)或更多個(gè)TM區(qū)中具有疏水氨基酸L、I、V、F替換的組合變體。取決于每個(gè)文庫(kù)中成員的數(shù)量,即使每個(gè)文庫(kù)中僅僅數(shù)個(gè)成員,組合變體的總的可能組合可達(dá)百萬(wàn)。例如,對(duì)于具有7個(gè)TM區(qū)的GPCR,如果7個(gè)文庫(kù)的每一個(gè)中有8個(gè)成員,基于文庫(kù)的組合變體的總數(shù)將是87或約二百一十萬(wàn)。在某些實(shí)施方式中,組合變體的文庫(kù)包括小于約5百萬(wàn)、4百萬(wàn)、3百萬(wàn)、2百萬(wàn)、1百萬(wàn)或5十萬(wàn)個(gè)成員。因此,在某些實(shí)施方式中,在步驟(2)中,在蛋白質(zhì)(例如,GPCR)的一個(gè)和相同TM區(qū)中的一個(gè)亞組的所述多個(gè)疏水氨基酸被替換,以產(chǎn)生潛在的變體的文庫(kù)的一個(gè)成員,并且所述多個(gè)疏水氨基酸的一個(gè)或多個(gè)不同亞組被替換,以產(chǎn)生文庫(kù)的另外的成員。在某些實(shí)施方式中,方法進(jìn)一步包括基于組合評(píng)分對(duì)所述文庫(kù)的所有成員排序,其中組合評(píng)分是α-螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果和跨膜區(qū)預(yù)測(cè)結(jié)果的加權(quán)組合。如本領(lǐng)域普通技術(shù)人員將認(rèn)識(shí)到,具有不同序列的結(jié)構(gòu)域?qū)⒖赡茴A(yù)測(cè)不同的水溶性并且傾向于α螺旋形成。人們可賦予特定預(yù)測(cè)的水溶性或溶解范圍、傾向性“評(píng)分”,以形成α螺旋結(jié)構(gòu)或傾向性范圍。評(píng)分可以是定量的(0,1),其中0可表示,例如,具有不可接受的預(yù)測(cè)水溶性的結(jié)構(gòu)域和1可表示,例如,具有可接受的預(yù)測(cè)水溶性的結(jié)構(gòu)域。例如,該評(píng)分可基于閾值。或,可在一定范圍內(nèi),例如,確定表征增加水溶性程度的1和10之間評(píng)估評(píng)分?;?,評(píng)分可以是定量的,比如根據(jù)mg/mL在描述預(yù)測(cè)的溶解性中。當(dāng)評(píng)估每個(gè)結(jié)構(gòu)域的評(píng)分時(shí),結(jié)構(gòu)域變體可容易地被一個(gè)或,優(yōu)選地,兩個(gè)評(píng)分比較(或排序),以選擇皆是水溶性并且形成α螺旋的結(jié)構(gòu)域變體。因此,優(yōu)選的實(shí)施方式可使用可用于計(jì)算排序數(shù)據(jù)的排序函數(shù)。也注意,基于目前描述的系統(tǒng)制備的水溶性蛋白可被分析和表征,以為系統(tǒng)提供輸入,使得未有效實(shí)現(xiàn)給定生物功能的替換的那些組合可用于約束計(jì)算模型,從而確保信息更有效的處理。例如,使用本發(fā)明的方法,可設(shè)計(jì)并且在體外和/或體內(nèi)產(chǎn)生一個(gè)或多個(gè)變體,以及可基于任何許多本領(lǐng)域熟知的方法測(cè)定變體的一種或多種生物功能。例如,對(duì)于GPCR,變體的配體結(jié)合和/或下游信號(hào)轉(zhuǎn)導(dǎo)可與野生型GPCR的比較,并且用于產(chǎn)生特定的變體的QTY替換的模式可與增強(qiáng)的、保持的或消失的生物活性相關(guān)?;谝粋€(gè)或多個(gè)變體獲得的這種結(jié)構(gòu)-功能關(guān)系信息可用于機(jī)器學(xué)習(xí)或賦予本發(fā)明的計(jì)算模型另外的約束,以更有效對(duì)通過(guò)本發(fā)明的方法產(chǎn)生的變體排序。因此,具有更密切匹配已知成功變體的替換模式的新的潛在變體可比具有較不密切匹配已知的成功變體,或更密切匹配已知不成功變體的替換模式的另一潛在的變體的排序更高。TMHMM程序,當(dāng)作為單機(jī)版本的軟件模塊/包運(yùn)行(例如,用于Linux系統(tǒng)的版本)時(shí),產(chǎn)生0和1之間的評(píng)分,其可用于預(yù)測(cè)形成跨膜區(qū)/蛋白質(zhì)的傾向性。評(píng)分可用作本發(fā)明的方法的水溶性的定量預(yù)測(cè)。因此,在某些實(shí)施方式中,排序函數(shù)的α-螺旋二級(jí)結(jié)構(gòu)分量可以是定量的評(píng)分,比如0.5或1,對(duì)于沒(méi)有預(yù)測(cè)的α-螺旋二級(jí)結(jié)構(gòu),和0,對(duì)于具有保持的預(yù)測(cè)的α-螺旋二級(jí)結(jié)構(gòu)。在某些實(shí)施方式中,可由TM區(qū)預(yù)測(cè)程序,比如TMHMM2.0提供跨膜區(qū)結(jié)果,TMHMM2.0提供0和1之間的數(shù)值,0是沒(méi)有預(yù)測(cè)的TM區(qū),和1是形成TM區(qū)的最強(qiáng)傾向性。因此,可直接或加權(quán)組合兩個(gè)評(píng)分,使得組合評(píng)分表示保持的二級(jí)結(jié)構(gòu)以及預(yù)測(cè)的水溶性的總體評(píng)估(如通過(guò)形成TM區(qū)的傾向性測(cè)量的)。例如,0的組合評(píng)分指示變體沒(méi)有預(yù)測(cè)的TM區(qū),而具有保持的預(yù)測(cè)的α-螺旋二級(jí)結(jié)構(gòu),并且因此是期望的變體。同時(shí),變體具有的形成TM區(qū)的強(qiáng)傾向性(例如,由于存在大量的疏水殘基),傾向于具有更大的組合評(píng)分并且因此在該評(píng)分方案中是非期望的。在某些實(shí)施方式中,方法包括去除具有傾向于顯示α-螺旋二級(jí)結(jié)構(gòu)被破壞或干擾的α-螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果的變體。在某些實(shí)施方式中,方法包括去除具有傾向于顯示的形成TM區(qū)的強(qiáng)傾向性的跨膜區(qū)預(yù)測(cè)結(jié)果的變體。因此,系統(tǒng)可包括照射模塊,其中可從進(jìn)一步選擇處理中排除變體。在某些實(shí)施方式中,可選擇排序函數(shù),以包括賦予α-螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果5%、10%、20%、25%、30%、40%、50%、60%、70%、80%、90%或95%權(quán)重,和將剩余的權(quán)重賦予跨膜區(qū)預(yù)測(cè)結(jié)果的加權(quán)方案。用戶可手動(dòng)選擇加權(quán)特征,或軟件可自動(dòng)選擇加權(quán)特征,這取決于期望的特征比如生物功能。在某些實(shí)施方式中,方法進(jìn)一步包括選擇具有最高組合評(píng)分的N個(gè)成員,以形成所述TM區(qū)的潛在變體的第一文庫(kù),其中N是預(yù)定的整數(shù)(例如,3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更大)。在某些實(shí)施方式中,方法進(jìn)一步包括為蛋白質(zhì)(例如,GPCR)的1、2、3、4、5、6個(gè)或所有剩余的TM區(qū)產(chǎn)生潛在的變體的一個(gè)文庫(kù)。文庫(kù)中的每個(gè)輸入可包括用于定義該輸入屬性的字段,包括由一個(gè)或多個(gè)排序函數(shù)產(chǎn)生的排序數(shù)據(jù)。在某些實(shí)施方式中,方法進(jìn)一步包括用來(lái)自潛在變體的文庫(kù)的相應(yīng)TM區(qū)替換蛋白質(zhì)(例如,GPCR)的兩個(gè)或更多個(gè)(例如,所有的)TM區(qū),以建立組合變體的文庫(kù)。如本文所使用,“相應(yīng)的TM區(qū)”指潛在的變體的文庫(kù)中的TM區(qū),其與被組合的蛋白質(zhì)(例如,GPCR)的TM區(qū)相同或同源。例如,如果來(lái)自GPCR的N-末端的第2和第3個(gè)TM區(qū)待被替換,則來(lái)自僅僅在第2個(gè)TM區(qū)具有替換的文庫(kù)的TM區(qū)序列,和來(lái)自僅僅在第3個(gè)TM區(qū)具有文庫(kù)的TM區(qū)序列,被輸入/粘貼/轉(zhuǎn)移至GPCR的第2個(gè)和第3個(gè)TM區(qū),以建立組合變體。在某些實(shí)施方式中,基本上所有的(例如,96%、97%、98%、99%或100%),或30%、40%、50%、60%、70%、75%、80%、85%、90%、95%的所述亮氨酸被谷氨酰胺替換。在某些實(shí)施方式中,基本上所有的(例如,96%、97%、98%、99%或100%),或30%、40%、50%、60%、70%、75%、80%、85%、90%、95%的所述異亮氨酸被蘇氨酸替換。在某些實(shí)施方式中,基本上所有的(例如,96%、97%、98%、99%或100%),或30%、40%、50%、60%、70%、75%、80%、85%、90%、95%的所述纈氨酸被蘇氨酸替換。在某些實(shí)施方式中,其中基本上所有的(例如,96%、97%、98%、99%或100%),或30%、40%、50%、60%、70%、75%、80%、85%、90%、95%的所述苯丙氨酸被酪氨酸替換。在某些實(shí)施方式中,一個(gè)或多個(gè)(例如,1、2或3個(gè))所述亮氨酸不被替換。在某些實(shí)施方式中,一個(gè)或多個(gè)(例如,1、2或3個(gè))所述異亮氨酸不被替換。在某些實(shí)施方式中,一個(gè)或多個(gè)(例如,1、2或3個(gè))所述纈氨酸不被替換。在某些實(shí)施方式中,一個(gè)或多個(gè)(例如,1、2或3個(gè))所述苯丙氨酸不被替換。在某些實(shí)施方式中,方法進(jìn)一步包括產(chǎn)生/表達(dá)所述組合變體。在某些實(shí)施方式中,方法進(jìn)一步包括測(cè)試所述組合變體的配體結(jié)合(例如,體外,或在生物系統(tǒng)比如酵母雙雜交系統(tǒng)中),其中選擇與GPCR的相比具有基本上相同配體結(jié)合的那些。在某些實(shí)施方式中,方法進(jìn)一步包括測(cè)試所述組合變體的GPCR的生物功能,其中選擇與GPCR的相比具有基本上相同生物功能的那些。在某些實(shí)施方式中,TM蛋白質(zhì)(例如,GPCR)的序列包含與蛋白質(zhì)的TM區(qū)有關(guān)的信息,例如,TM蛋白質(zhì)的一個(gè)或多個(gè)跨膜區(qū)的位置,比如所有TM區(qū)的位置。這種序列可屬于包含具有限定的TM區(qū)的分解的晶體結(jié)構(gòu)的蛋白質(zhì)。這種序列也可屬于具有基于之前的研究注釋的TM區(qū)信息的蛋白質(zhì),并且這種信息容易可獲得自公開(kāi)數(shù)據(jù)庫(kù)或?qū)@麛?shù)據(jù)庫(kù),比如PDB、UniProt、GenBank、EMBL、DBJ等。蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB)是每周更新的大生物分子,比如蛋白質(zhì)和核酸的三維結(jié)構(gòu)數(shù)據(jù)的資源庫(kù)。通常通過(guò)X射線晶體學(xué)或NMR光譜學(xué)獲得并且由來(lái)自世界各地的生物學(xué)家和生物化學(xué)家提交的數(shù)據(jù)在因特網(wǎng)上經(jīng)其成員組織(PDBe、PDBj和RCSB)的網(wǎng)站免費(fèi)獲取。PDB由世界蛋白質(zhì)數(shù)據(jù)庫(kù),wwPDB監(jiān)視。PDB是結(jié)構(gòu)生物學(xué)領(lǐng)域,比如結(jié)構(gòu)基因組學(xué),和最主要的科學(xué)期刊,和一些基金機(jī)構(gòu)的關(guān)鍵資源,現(xiàn)要求科學(xué)家將他們的結(jié)構(gòu)數(shù)據(jù)提交至PDB。如果將PDB的內(nèi)容視為原始數(shù)據(jù),那么存在數(shù)百個(gè)衍生的(即,二級(jí))數(shù)據(jù)庫(kù),其將數(shù)據(jù)不同地歸類。例如,SCOP和CATH二者將結(jié)構(gòu)根據(jù)結(jié)構(gòu)類型和假設(shè)的進(jìn)化關(guān)系歸類;GO將結(jié)構(gòu)基于基因歸類;而晶體學(xué)數(shù)據(jù)庫(kù)儲(chǔ)存與蛋白質(zhì)的3D結(jié)構(gòu)相關(guān)的信息。所有這些公眾可獲得的數(shù)據(jù)庫(kù)可用于提供輸入序列信息,包括與跨膜區(qū)的存在和位置相關(guān)的信息??商峁┯糜诒景l(fā)明的方法的序列信息的另一公眾可用的數(shù)據(jù)庫(kù)是UniProt。UniProt是綜合的、高質(zhì)量和免費(fèi)獲取的蛋白質(zhì)序列和功能信息的數(shù)據(jù)庫(kù),許多條目源自基因組測(cè)序項(xiàng)目。其包含大量的源自研究文獻(xiàn)的關(guān)于蛋白質(zhì)的生物功能的信息。UniProt提供了四個(gè)核心數(shù)據(jù)庫(kù):UniProtKB(具有Swiss-Prot和TrEMBL的一部分)、UniParc、UniRef,和UniMes。它們中,UniProtKB/Swiss-Prot是手動(dòng)注釋的,非冗余蛋白質(zhì)序列數(shù)據(jù)庫(kù),其結(jié)合從科學(xué)文獻(xiàn)和生物管理-評(píng)估計(jì)算分析提取的信息。UniProtKB/Swiss-Prot的目標(biāo)是提供所有與具體蛋白質(zhì)相關(guān)的已知的相關(guān)信息。定期檢查注釋以與當(dāng)前的科學(xué)發(fā)現(xiàn)一致。條目的手動(dòng)注釋涉及蛋白質(zhì)序列和科學(xué)文獻(xiàn)的詳細(xì)分析。來(lái)自相同基因和相同物種的序列并入相同的數(shù)據(jù)庫(kù)條目。鑒定序列之間的差異,并且記錄它們的原因(例如,可選的剪接、自然變化等)。手動(dòng)評(píng)估計(jì)算機(jī)-預(yù)測(cè),并且為包括在該條目中選擇相關(guān)的結(jié)果。這些預(yù)測(cè)包括翻譯后修飾,跨膜結(jié)構(gòu)域和拓?fù)?、信?hào)肽、結(jié)構(gòu)域鑒定和蛋白質(zhì)家族分類,所有的可用于提供與本發(fā)明的方法中使用的TM區(qū)相關(guān)的有用序列信息。在某些實(shí)施方式中,TM蛋白質(zhì)(例如,GPCR)的序列不包含與一個(gè)或多個(gè)(例如,任何)跨膜區(qū)的位置相關(guān)的信息。但是,可基于與具有已知TM區(qū)的相關(guān)蛋白質(zhì)的序列同源性預(yù)測(cè)TM區(qū)。例如,相關(guān)蛋白質(zhì)可以是在不同物種中的同源蛋白質(zhì)。在某些實(shí)施方式中,TM蛋白質(zhì)(例如,GPCR)的序列不包含與一個(gè)或多個(gè)(例如,任何)跨膜區(qū)的位置相關(guān)的信息,并且這種信息不容易基于已知的信息獲得。在該實(shí)施方式中,本發(fā)明使用熟知的方法,比如生物序列分析中心開(kāi)發(fā)的TMHMM2.0(使用隱馬爾科夫模型的跨膜預(yù)測(cè))程序提供了TM區(qū)的計(jì)算。關(guān)于此的進(jìn)一步細(xì)節(jié)見(jiàn)下方。在某些實(shí)施方式中,方法進(jìn)一步包括提供蛋白質(zhì)(例如,GPCR)的每個(gè)變體的多核苷酸序列。這種多核苷酸序列可容易基于蛋白質(zhì)(例如,GPCR)的蛋白質(zhì)序列,和已知的遺傳密碼而產(chǎn)生。在某些實(shí)施方式中,多核苷酸序列是為在宿主中表達(dá)而優(yōu)化的密碼子。宿主可以是細(xì)菌比如大腸桿菌、酵母比如釀酒酵母或粟酒裂殖酵母、昆蟲(chóng)細(xì)胞比如Sf9細(xì)胞、非人哺乳動(dòng)物細(xì)胞或人細(xì)胞。在某些實(shí)施方式中,蛋白質(zhì)是GPCR,比如選自下述的一種:嘌呤能受體(P2Y1、P2Y2、P2Y4、P2Y6);M1和M3蕈毒堿乙酰膽堿受體;凝血酶(蛋白酶-激活受體(PAR)-1、PAR-2)、凝血烷(TXA2)、鞘氨醇1-磷酸(S1P2、S1P3、S1P4和S1P5)、溶血磷脂酸(LPA1、LPA2、LPA3)、血管緊張肽II(AT1)、血清素(5-HT2c和5-HT4)、生長(zhǎng)激素釋放的抑制因子(sst5)、內(nèi)皮素(ETA和ETB),膽囊收縮素(CCK1)的受體;V1a升壓素受體;D5多巴胺受體;fMLP甲?;氖荏w;GAL2甘丙肽受體;EP3前列腺素受體;A1腺苷受體;α1腎上腺素能受體;BB2鈴蟾肽受體;B2緩激肽受體;鈣感知受體;趨化因子受體;KSHV-ORF74趨化因子受體;NK1速激肽受體;甲狀腺-刺激激素(TSH)受體;蛋白酶-激活受體;神經(jīng)肽受體;腺苷A2B受體;P2Y嘌呤受體;代謝谷氨酸受體;GRK5;GPCR-30和CXCR4。在某些實(shí)施方式中,方法的腳本程序包括VBA腳本。在某些實(shí)施方式中,腳本程序可在Linux系統(tǒng)(例如,Ubuntu12.04LTS)、MicrosoftWindows操作系統(tǒng)或AppleiOS操作系統(tǒng)中運(yùn)行。在某些實(shí)施方式中,方法包括所有的或基本上所有的下述步驟:(1)鑒定(跨)膜蛋白的第一跨膜區(qū),如果必要,通過(guò)預(yù)測(cè)蛋白質(zhì)(例如,GPCR)的α-螺旋結(jié)構(gòu);(2)經(jīng)QTYCode修飾多個(gè)疏水氨基酸,如本文所限定的,以獲得修飾的第一跨膜序列;(3)對(duì)(2)的第一修飾跨膜序列的α-螺旋結(jié)構(gòu)的傾向性評(píng)分(例如,在具有第一修飾的跨膜序列的修飾的(跨)膜蛋白的背景下),以獲得結(jié)構(gòu)評(píng)分;(4)對(duì)(2)的第一修飾跨膜序列的水溶性預(yù)測(cè)評(píng)分(例如,在具有第一修飾跨膜序列的修飾(跨)膜蛋白的背景下),以獲得溶解性評(píng)分;(5)重復(fù)步驟(2)至(4),以獲得具有推測(cè)的水溶性第一修飾跨膜變體的第一文庫(kù);(6)比較第一文庫(kù)中每個(gè)推測(cè)的水溶性第一修飾跨膜變體的結(jié)構(gòu)評(píng)分和溶解性評(píng)分,并且優(yōu)選地使用所述結(jié)構(gòu)評(píng)分和溶解性評(píng)分對(duì)推測(cè)的水溶性第一修飾跨膜變體排序;(7)選擇多個(gè)推測(cè)的水溶性第一修飾跨膜變體(其中多個(gè)是整數(shù),H,或優(yōu)選地小于10、9、8、7、6、5或4),以獲得推測(cè)的水溶性第一修飾跨膜變體的第二文庫(kù);(8)為蛋白質(zhì)的第二、第三、第四、第五、第六、第七或優(yōu)選地所有跨膜區(qū)重復(fù)步驟(1)至(7)(由該方法修飾的跨膜區(qū)的總和是整數(shù)n);(9)鑒定不包括在步驟(1)至(8)中修飾的任何跨膜區(qū)內(nèi)的蛋白質(zhì)的氨基酸序列,并且包括蛋白質(zhì)的任何細(xì)胞外或細(xì)胞內(nèi)結(jié)構(gòu)域;(10)產(chǎn)生推測(cè)的水溶性的修飾跨膜蛋白的組合變體(見(jiàn)上);和,(11)任選地,鑒定每個(gè)推測(cè)的水溶性修飾的跨膜變體的核酸序列。使用在上面的過(guò)程中鑒定的核酸序列,可產(chǎn)生每個(gè)推測(cè)的水溶性修飾跨膜變體和每個(gè)非跨膜結(jié)構(gòu)域(包括細(xì)胞外和細(xì)胞內(nèi)結(jié)構(gòu)域)的核酸序列,并且被組合表達(dá),以建立多達(dá)Hn個(gè)推測(cè)的水溶性跨膜蛋白變體的文庫(kù)。例如,當(dāng)H是8并且n是7時(shí),可設(shè)計(jì)約2百萬(wàn)個(gè)水溶性蛋白質(zhì)變體的文庫(kù)。本發(fā)明的另一方面涉及基于本發(fā)明的方法而設(shè)計(jì)的水溶性變體蛋白質(zhì)(例如,GPCR)的表達(dá)。本發(fā)明的該方面部分基于出人意料的發(fā)現(xiàn),基于本發(fā)明的方法而設(shè)計(jì)的水溶性變體蛋白質(zhì)(例如,GPCR)在體外無(wú)細(xì)胞表達(dá)系統(tǒng)中和在常用的基于細(xì)胞的表達(dá)系統(tǒng),比如大腸桿菌中都可實(shí)現(xiàn)高水平的表達(dá)。另外,表達(dá)的蛋白質(zhì)是高度可溶的,并且可容易從表達(dá)系統(tǒng)的可溶性部分,比如來(lái)自大腸桿菌培養(yǎng)物的裂解物的可溶性部分純化,與其中通常發(fā)現(xiàn)大部分膜蛋白的不溶解的聚集體或小球相反。因此,本發(fā)明的一個(gè)方面提供了在細(xì)菌(例如,大腸桿菌)中產(chǎn)生蛋白質(zhì)的方法,包括:(a)在適于蛋白質(zhì)生產(chǎn)的條件下在生長(zhǎng)培養(yǎng)基中培養(yǎng)細(xì)菌;(b)分級(jí)分離細(xì)菌的裂解物,以產(chǎn)生可溶性部分和不溶解的小球部分;和,(c)從可溶性部分分離蛋白質(zhì);其中:(1)蛋白質(zhì)是本發(fā)明的受試者變體蛋白質(zhì)(例如,G蛋白偶聯(lián)受體(GPCR));和,(2)蛋白質(zhì)的產(chǎn)率是至少20mg/L(例如,30mg/L、40mg/L、50mg/L或更大)的生長(zhǎng)培養(yǎng)基。在某些實(shí)施方式中,細(xì)菌是大腸桿菌BL21,并且生長(zhǎng)培養(yǎng)基是LB培養(yǎng)基。在某些實(shí)施方式中,蛋白質(zhì)由細(xì)菌中的質(zhì)粒編碼。在某些實(shí)施方式中,蛋白質(zhì)的表達(dá)在誘導(dǎo)型啟動(dòng)子的控制下。例如,誘導(dǎo)型啟動(dòng)子可以是由IPTG誘導(dǎo)的。在某些實(shí)施方式中,裂解物通過(guò)超聲產(chǎn)生。在某些實(shí)施方式中,可溶性部分通過(guò)在14,500×g或更大離心裂解物產(chǎn)生。關(guān)于上述本發(fā)明的大體方面,下面進(jìn)一步描述本發(fā)明的某些特征或具體實(shí)施方式??缒^(qū)預(yù)測(cè)本發(fā)明的某些方法包括預(yù)測(cè)蛋白質(zhì),比如GPCR的跨膜區(qū)的步驟。本領(lǐng)域已知許多與TM區(qū)相關(guān)的程序和軟件,并且其中任何一種可單獨(dú)使用或在調(diào)用TM區(qū)預(yù)測(cè)步驟時(shí)結(jié)合本發(fā)明的方法使用。這些程序通常具有非常簡(jiǎn)單的用戶界面,通常需要用戶提供特定格式的輸入序列(比如FASTA或純文本),并且使用文本或圖形或兩種提供預(yù)測(cè)結(jié)果。一些程序也提供更高級(jí)的特征,比如允許用戶指定某些參數(shù)以優(yōu)化預(yù)測(cè)結(jié)果。所有這些程序可用于本發(fā)明的方法。一種示例性TM區(qū)預(yù)測(cè)程序是TMHMM(由丹麥技術(shù)大學(xué)生物序列分析中心托管),該方法正確預(yù)測(cè)97-98%TM區(qū)螺旋。其使用隱馬爾科夫模型預(yù)測(cè)蛋白質(zhì)中的跨膜螺旋。輸入蛋白質(zhì)序列可以是FASTA格式,并且輸出可提供為html頁(yè)面,具有TM區(qū)的預(yù)測(cè)位置的圖形。在Moller等,題目為“EvaluationofMethodsforpredictionofMembraneSpanningRegions,”Bioinformatics17(7):646-653,2001的研究中,確定了TMHMM是在評(píng)估時(shí)最佳表現(xiàn)的跨膜預(yù)測(cè)程序。在該研究中比較的程序包括下述,所有都可在本發(fā)明的方法中用于預(yù)測(cè)TM區(qū):TMHMM1.0、2.0和2.0的再訓(xùn)練版本(retrainedversion)(Sonnhammer等,Int.Conf.Intell.Syst.Mol.Biol.AAAIPress,Montreal,Canada,176-182頁(yè),1998;Krogh等,JMolBiol.305(3):567-80,2001);MEMSAT1.5(Jones等,Biochemistry33:3038-3049,1994);Eisenberg(Eisenberg等,Nature299:371-374,1982);Kyte/Doolittle(Kyte和Doolittle,J.Mol.Biol.157:105-132,1982);TMAP(Persson和Argos,J.ProteinChem.16:453-457,1997);DAS(Cserzo等,ProteinEng.10:673-676,1997);HMMTOP(Tusnady和Simon,J.Mol.Biol.283:489-506,1998);SOSUI(Hirokawa等,Bioinformatics14:378-379,1998);PHD(Rost等,Int.Conf.Intell.Syst.Mol.Biol.AAAIPress,St.Louis,USA,pp.192-200,1996);TMpred(HofmannandStoffel,Biol.Chem.Hoppe-Seyler374:166,1993);KKD(Klein等,Biochim.Biophys.Acta.815:468-476,1985);ALOM2(Nakai和Kanehisa,Genomics14:489-911,1992);和Toppred2(Claros和Heijne,Comput.Appl.Biosci.10:685-686,1994)。所有的參考文獻(xiàn)通過(guò)引用并入本文。TMHMM的原理描述在Krogh等,PredictingtransmembraneproteintopologywithahiddenMarkovmodel:Applicationtocompletegenomes.JournalofMolecularBiology,305(3):567-580,2001年1月(通過(guò)引用并入);和Sonnhammer等,AhiddenMarkovmodelforpredictingtransmembranehelicesinproteinsequences.InJ.Glasgow,T.Littlejohn,F(xiàn).Major,R.Lathrop,D.Sankoff,和C.Sensen,編輯者,ProceedingsoftheSixthInternationalConferenceonIntelligentSystemsforMolecularBiology,175-182頁(yè),MenloPark,CA,1998,AAAIPress(通過(guò)引用并入)。DAS(密集比對(duì)表面(DenseAlignmentSurface),Cserzo等,“Predictionoftransmembranealpha-helicesinprocarioticmembraneproteins:theDenseAlignmentSurfacemethod,”P(pán)rot.Eng.10(6):673-676,1997,StockholmUniversity,Sweden)使用密集比對(duì)表面方法預(yù)測(cè)跨膜區(qū)。DAS是使用先前衍生的專用評(píng)分矩陣基于查詢序列針對(duì)一組文庫(kù)序列——非同源的膜蛋白——低嚴(yán)格性點(diǎn)圖。該方法為查詢提供了高精度疏水性圖譜,從中可獲得潛在的跨膜區(qū)段的位置。DAS-TM濾波算法的新穎性是第二個(gè)預(yù)測(cè)循環(huán),以預(yù)測(cè)TM-文庫(kù)的序列中的TM區(qū)段。為了使用DAS服務(wù)器,用戶在wwwdotsbcdotsudotseslash~miklosslashDAS輸入蛋白質(zhì)序列,并且DA服務(wù)器將預(yù)測(cè)輸入序列的TM區(qū)。HMMTOP(HungarianAcademyofSciences,布達(dá)佩斯)是自動(dòng)服務(wù)器,其用于使用隱馬爾科夫模型預(yù)測(cè)蛋白質(zhì)的跨膜螺旋和拓?fù)?,由G.E.Tusnády,在InstituteofEnzymology開(kāi)發(fā)。由該預(yù)測(cè)服務(wù)器使用的方法描述在G.ETusnády和I.Simon(1998)“PrinciplesGoverningAminoAcidCompositionofIntegralMembraneProteins:ApplicationstoTopologyPrediction."J.Mol.Biol.283:489-506中(通過(guò)引用并入)。HMMTOP2.0版本的新特征描述在’G.ETusnády和I.Simon(2001)“TheHMMTOPtransmembranetopologypredictionserver,"Bioinformatics17:849-850中(通過(guò)引用并入)。MEMSAT2跨膜預(yù)測(cè)網(wǎng)頁(yè)(wwwdotsacsdotucsfdoteduslashcgi-binslashmemsatdotpy)使用FASTA格式或純文本作為輸入預(yù)測(cè)蛋白質(zhì)中的跨膜區(qū)段。相關(guān)的程序,MEMSAT(1.5)軟件的版權(quán)是DavidJones博士(Jones等,Biochemistry33:3038-3049,1994)。最新版的MEMSTAT,MEMSATV3是廣泛使用的全螺旋膜蛋白預(yù)測(cè)方法MEMSAT。該方法是已知拓?fù)涞目缒さ鞍诇y(cè)試組的基準(zhǔn)。從序列數(shù)據(jù),MEMSAT被評(píng)估對(duì)于預(yù)測(cè)全螺旋跨膜蛋白的結(jié)構(gòu)和膜中它們成分螺旋要素的位置具有超過(guò)78%的精確度。MEMSATSVM是跨膜螺旋拓?fù)涞姆浅>_的預(yù)測(cè)器。其能夠區(qū)分信號(hào)肽并且鑒定細(xì)胞溶質(zhì)和細(xì)胞外的環(huán)。MEMSAT3和MEMSATSVM都是PSIPRED蛋白質(zhì)序列分析工作臺(tái)的一部分,其將數(shù)個(gè)結(jié)構(gòu)預(yù)測(cè)方法聚集在UniversityCollegeLondon的一個(gè)位置。Phobius服務(wù)器(phobiusdotsbcdotsudotse)用于從FASTA格式的蛋白質(zhì)的氨基酸序列預(yù)測(cè)跨膜拓?fù)浜托盘?hào)肽。Phobius描述在Lukas等,“ACombinedTransmembraneTopologyandSignalPeptidePredictionMethod”,JournalofMolecularBiology338(5):1027-1036,2004)中。PoyPhobius描述在:Lukas等,“AnHMMposteriordecoderforsequencefeaturepredictionthatincludeshomologyinformation,”Bioinformatics,21(Suppl1):i251-i257,2005中。并且Phobius網(wǎng)頁(yè)服務(wù)器描述在:Lukas等,“Advantagesofcombinedtransmembranetopologyandsignalpeptideprediction--thePhobiuswebserver”,NucleicAcidsRes.35:W429-32,2007中(所有引用的現(xiàn)有技術(shù)通過(guò)引用并入)。SOSUI用于區(qū)分膜蛋白和可溶性蛋白以及預(yù)測(cè)跨膜螺旋。SOSUI使用三級(jí)結(jié)構(gòu)(tertialstructure)的拓?fù)浜吞结樎菪椒ǖ氖杷苑治鰜?lái)預(yù)測(cè)跨膜區(qū)。據(jù)信,蛋白質(zhì)的分類的精確度高達(dá)99%,并且據(jù)信跨膜螺旋預(yù)測(cè)的相應(yīng)值是約97%。系統(tǒng)SOSUI通過(guò)因特網(wǎng)可用,訪問(wèn)wwwdottuatdotacdotjpslashmitakuslashsosui。TMPred(歐洲分子生物學(xué)網(wǎng)絡(luò),瑞士節(jié)點(diǎn))預(yù)測(cè)查詢序列中跨膜區(qū)和蛋白質(zhì)取向。具體而言,TMPred算法是基于天然存在的跨膜蛋白的數(shù)據(jù)庫(kù)TMbase的統(tǒng)計(jì)分析。使用數(shù)個(gè)評(píng)分的權(quán)重矩陣的組合進(jìn)行預(yù)測(cè)。見(jiàn)Hofmann&Stoffel(1993)“TMbase-Adatabaseofmembranespanningproteinssegments,”Biol.Chem.Hoppe-Seyler,374:166。SPLIT4.0服務(wù)器是膜蛋白二級(jí)結(jié)構(gòu)預(yù)測(cè)服務(wù)器(splitdotpmfstdothrslashsplitslash4),其使用偏好功能方法預(yù)測(cè)SWISS-PROT格式的膜蛋白的跨膜(TM)二級(jí)結(jié)構(gòu)。見(jiàn)Juretic等,“Basicchargeclustersandpredictionsofmembraneproteintopology,”J.Chem.Inf.Comput.Sci.,42:620-632,2002(通過(guò)引用并入)。PRED-TMR單獨(dú)使用蛋白質(zhì)序列本身預(yù)測(cè)蛋白質(zhì)中的跨膜結(jié)構(gòu)域。算法用跨膜區(qū)潛在的末端(“邊緣”,開(kāi)始和結(jié)束)的測(cè)定優(yōu)化了標(biāo)準(zhǔn)疏水性分析。這使得二者放棄沒(méi)有被清晰的開(kāi)始和結(jié)束構(gòu)象限定的高度疏水的區(qū)域并且確認(rèn)通過(guò)它們的疏水的組分不可區(qū)分的推測(cè)的跨膜區(qū)段。對(duì)基于可靠拓?fù)涞?01個(gè)非同源的跨膜蛋白的測(cè)試組獲得的精確度與其他流行存在的方法的相當(dāng)。當(dāng)算法應(yīng)用于SwissProt數(shù)據(jù)庫(kù)(發(fā)行35(release35))的所有跨膜蛋白時(shí),觀察預(yù)測(cè)精確度僅僅稍微的下降。見(jiàn)Pasquier等,“AnovelmethodforpredictingtransmembranesegmentsinproteinsbasedonastatisticalanalysisoftheSwissProtdatabase:thePRED-TMRalgorithm,”P(pán)roteinEng.,12(5):381-385,1999(通過(guò)引用并入)。在相關(guān)的PRED-TMR2中,已經(jīng)用由人工神經(jīng)網(wǎng)絡(luò)代表的預(yù)處理階段擴(kuò)展了應(yīng)用,其中所述人工神經(jīng)網(wǎng)絡(luò)能夠以高精確度區(qū)分跨膜蛋白和可溶性或纖維蛋白。應(yīng)用于跨膜蛋白的數(shù)個(gè)測(cè)試組,系統(tǒng)通過(guò)歸類跨膜類別中的所有序列而產(chǎn)生了100%的完美預(yù)測(cè)率。應(yīng)用于從PDBSELECT數(shù)據(jù)庫(kù)提取的995個(gè)非跨膜蛋白,神經(jīng)網(wǎng)絡(luò)錯(cuò)誤預(yù)測(cè)了它們中的23個(gè)是跨膜的(97.7%的準(zhǔn)確率)。見(jiàn)Pasquier和Hamodrakas,“Anhierarchicalartificialneuralnetworksystemfortheclassificationoftransmembraneproteins”,ProteinEng.,12(8):631-634,1999(通過(guò)引用并入)。蛋白質(zhì)α螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè)本發(fā)明的某些方法包括預(yù)測(cè)蛋白質(zhì),比如GPCR的α螺旋二級(jí)結(jié)構(gòu)的步驟。本領(lǐng)域已知許多這種程序和軟件,并且其任何一個(gè)可單獨(dú)使用或當(dāng)調(diào)用α螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè)步驟時(shí)與本發(fā)明的方法一起使用。所有這種程序可用于本發(fā)明的方法。二級(jí)結(jié)構(gòu)預(yù)測(cè)的早期方法限于預(yù)測(cè)三個(gè)主要的狀態(tài):螺旋、片層或隨機(jī)卷曲。這些方法基于單獨(dú)氨基酸的螺旋-或片層-形成傾向性,有時(shí)與評(píng)估形成二級(jí)結(jié)構(gòu)要素的自由能的規(guī)則相關(guān)。這種方法在預(yù)測(cè)殘基采用三種狀態(tài)(螺旋/片層/卷曲)的哪一個(gè)時(shí)通常是~60%準(zhǔn)確。第一個(gè)廣泛采用的由氨基酸序列預(yù)測(cè)蛋白質(zhì)二級(jí)結(jié)構(gòu)的技術(shù)是Chou-Fasman方法。利用由多重序列排比提供的信息使得精確度顯著提高(至接近~80%);知道在整個(gè)進(jìn)化中在位置(和在其附近中,通常在每側(cè)~7個(gè)殘基)上發(fā)生的氨基酸的充分分布提供了對(duì)于在該位置處結(jié)構(gòu)傾向的更好的理解。例如,給定的蛋白質(zhì)可能在給定位置具有甘氨酸,其本身可能提示了隨機(jī)卷曲。但是,多重序列排比可能揭示利于螺旋的氨基酸在整個(gè)進(jìn)化中在95%的同源蛋白質(zhì)中出現(xiàn)在該位置(以及附近位置)。而且,通過(guò)檢查在該位置和附近位置的平均疏水性,相同的比對(duì)也可提示殘基溶劑可及性(accessibility)的模式與α-螺旋一致。一并考慮,這些因素將提示初始蛋白質(zhì)的甘氨酸采用α-螺旋結(jié)構(gòu),而不是隨機(jī)卷曲。因此,在本發(fā)明的方法中,α螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè)程序可結(jié)合所有可用數(shù)據(jù),而形成3狀態(tài)預(yù)測(cè),包括神經(jīng)網(wǎng)絡(luò)、隱馬爾科夫模型,和支持向量機(jī)。這種預(yù)測(cè)方法也提供了置信評(píng)分,用于它們?cè)诿總€(gè)位置的預(yù)測(cè)。二級(jí)結(jié)構(gòu)預(yù)測(cè)方法是連續(xù)基準(zhǔn),例如,EVA(基準(zhǔn))。EVA是連續(xù)運(yùn)行的基準(zhǔn)項(xiàng)目,用于評(píng)估蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和二級(jí)結(jié)構(gòu)預(yù)測(cè)方法的質(zhì)量。預(yù)測(cè)二級(jí)結(jié)構(gòu)和三級(jí)結(jié)構(gòu)——包括同源性建模、蛋白質(zhì)穿引(proteinthreading)和接觸順序預(yù)測(cè)——的方法與來(lái)自蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB)中保藏的每周更新解析的蛋白質(zhì)結(jié)構(gòu)的結(jié)果相當(dāng)。項(xiàng)目的目標(biāo)是確定通常公眾可用的預(yù)測(cè)網(wǎng)頁(yè)服務(wù)器的非專業(yè)用戶期望的預(yù)測(cè)精確度?;谶@些測(cè)試,目前最精確的方法是Psipred,SAM(Karplus,"SAM-T08,HMM-basedproteinstructureprediction,"NucleicAcidsRes.(2009)37(WebServerissue):W492–497.doi:10.1093/nar/gkp403);PORTER(Pollastri&McLysaght,"Porter:anew,accurateserverforproteinsecondarystructureprediction,"Bioinformatics21(8):1719-1720,2005);PROF(Yachdav等(2014)."PredictProtein--anopenresourceforonlinepredictionofproteinstructuralandfunctionalfeatures,"NucleicAcidsRes.42(WebServerissue):W337–343.doi:10.1093/nar/gku366);andSABLE(Adamczak等(2005)"Combiningpredictionofsecondarystructureandsolventaccessibilityinproteins,"Proteins59(3):467–475.doi:10.1002/prot.20441)。另外,將二級(jí)結(jié)構(gòu)類別(螺旋/股/卷曲)分配至PDB結(jié)構(gòu)的標(biāo)準(zhǔn)方法是DSSP(KabschW和Sander(1983)"Dictionaryofproteinsecondarystructure:patternrecognitionofhydrogen-bondedandgeometricalfeatures,"Biopolymers22(12):2577–2637.doi:10.1002/bip.360221211),針對(duì)其預(yù)測(cè)是基準(zhǔn)。所有通過(guò)引用并入并且所有的可用于本發(fā)明的方法。DSSP算法是將二級(jí)結(jié)構(gòu)分配至蛋白質(zhì)的氨基酸的標(biāo)準(zhǔn)方法,考慮到蛋白質(zhì)的原子分辨率坐標(biāo)。DSSP開(kāi)始于使用純粹的靜電定義鑒定蛋白質(zhì)的骨架內(nèi)氫鍵,分別賦予羰基氧和酰胺氫-0.42e和+0.20e的局部電荷,它們的對(duì)立(opposite)賦予至羰基碳和酰胺氮。如果下述等式中的E小于-0.5kcal/mol,則鑒定了氫鍵:基于此,賦予了八類二級(jí)結(jié)構(gòu)。310螺旋、α螺旋和π螺旋具有符號(hào)G、H和I,并且通過(guò)具有氫鍵的重復(fù)序列來(lái)識(shí)別,其中殘基分別是分開(kāi)的三、四或五個(gè)殘基。存在兩類β片層結(jié)構(gòu);β橋具有符號(hào)B,而更長(zhǎng)組的氫鍵和β凸起具有符號(hào)E。T用于轉(zhuǎn)角,描繪螺旋典型的氫鍵,S用于高曲率的區(qū)域(其中和之間的角度小于70°),并且如果沒(méi)有其他規(guī)則應(yīng)用,則使用空白(或間隔),參照環(huán)。這八種類型通常分為三個(gè)更大的類別:螺旋(G、H和I)、股(E和B)和環(huán)(所有其他的)。PSIPRED(基于Psi-blast的二級(jí)結(jié)構(gòu)預(yù)測(cè))是研究蛋白質(zhì)結(jié)構(gòu)的技術(shù)。其在其算法中采用神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)方法。其是服務(wù)器端程序,特點(diǎn)是用作前端界面的網(wǎng)站,其可從原始序列預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu)(β片層、α螺旋和卷曲)。見(jiàn)bioinfdotcsdotucldotacdotukslashpsipred。該方法的靈感是機(jī)器學(xué)習(xí)方法,其使用進(jìn)化相關(guān)的蛋白質(zhì)的信息來(lái)預(yù)測(cè)新的氨基酸序列的二級(jí)結(jié)構(gòu)。具體而言,PSIBLAST用于發(fā)現(xiàn)相關(guān)的序列并且構(gòu)建位置特異性評(píng)分矩陣。該矩陣由神經(jīng)網(wǎng)絡(luò)處理,其被構(gòu)建并且訓(xùn)練,以預(yù)測(cè)輸入序列的二級(jí)結(jié)構(gòu)。預(yù)測(cè)方法或算法被分成三個(gè)階段:產(chǎn)生序列圖譜、預(yù)測(cè)初始二級(jí)結(jié)構(gòu),和過(guò)濾預(yù)測(cè)的結(jié)構(gòu)。PSIPRED用于使由PSIBLAST產(chǎn)生的序列圖譜歸一化。然后,通過(guò)使用神經(jīng)網(wǎng)絡(luò),預(yù)測(cè)初始二級(jí)結(jié)構(gòu)。對(duì)于序列中的每個(gè)氨基酸,神經(jīng)網(wǎng)絡(luò)被提供15個(gè)酸的窗口。存在附著的另外的信息,指示窗口是否橫跨鏈的N或C末端。這產(chǎn)生最終的315個(gè)輸入單元的輸入層,分成21個(gè)單元的15個(gè)組。網(wǎng)絡(luò)具有75個(gè)單元的單個(gè)隱藏層和3個(gè)輸出節(jié)點(diǎn)(一個(gè)用于每個(gè)二級(jí)結(jié)構(gòu)要素:螺旋、片層、卷曲)。第二神經(jīng)網(wǎng)絡(luò)用于過(guò)濾第一網(wǎng)絡(luò)的預(yù)測(cè)結(jié)構(gòu)。該網(wǎng)絡(luò)也被提供有15個(gè)位置的窗口。在鏈末端的窗口的可能位置上的指示符也被發(fā)送(forwarded)。這產(chǎn)生60個(gè)輸入單元,分成四個(gè)一組共15個(gè)組。網(wǎng)絡(luò)具有60個(gè)單元的單個(gè)隱藏層并且產(chǎn)生三個(gè)輸出節(jié)點(diǎn)(一個(gè)用于每個(gè)二級(jí)結(jié)構(gòu)要素:螺旋、片層、卷曲)。三個(gè)最終輸出節(jié)點(diǎn)為窗口的中心位置遞送每個(gè)二級(jí)結(jié)構(gòu)要素的評(píng)分。使用具有最高評(píng)分的二級(jí)結(jié)構(gòu),PSIPRED產(chǎn)生蛋白質(zhì)預(yù)測(cè)。Q3值是二級(jí)結(jié)構(gòu)狀態(tài),即螺旋、股和卷曲正確預(yù)測(cè)的殘基的分?jǐn)?shù)。示例性實(shí)施方式的逐步描述:上面大體上描述了本發(fā)明,下面參考附圖中代表性流程圖描述某些非限制性但是示意性實(shí)施方式。圖9A闡釋了本發(fā)明的一個(gè)實(shí)施方式,其是非限制性的。其大體上圖解了本發(fā)明的方法200,其中蛋白質(zhì)(例如,GPCR)的TM區(qū)中選擇的疏水氨基酸L、I、V和F根據(jù)本發(fā)明的“QTYCode”替換,而不限制任何具體TM區(qū)/結(jié)構(gòu)域中的替換。在該具體的實(shí)施方式中,方法開(kāi)始于202,獲取或讀取204可能是或可能不是跨膜蛋白的蛋白質(zhì)序列的輸入。蛋白質(zhì)序列可接著進(jìn)行TM區(qū)預(yù)測(cè)206(如果這種信息從輸入蛋白質(zhì)序列中不可獲得)和α-螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè),這基于任何本領(lǐng)域熟知的方法。例如,TM區(qū)預(yù)測(cè)可使用程序240比如TMHMM程序進(jìn)行。如果預(yù)測(cè)在242不產(chǎn)生任何TM區(qū),可能一個(gè)或多個(gè)不同TM區(qū)預(yù)測(cè)程序250,比如SOSUI,可用于預(yù)測(cè)TM區(qū)的存在/缺失。如果在252基于這種程序沒(méi)有預(yù)測(cè)到TM區(qū),可能在該蛋白中不存在TM區(qū)254,并且該方法將終止260。另一方面,如果通過(guò)任何適當(dāng)?shù)某绦蛟?42預(yù)測(cè)到一個(gè)或多個(gè)TM區(qū),則獲得TM區(qū)蛋白質(zhì)序列244,并且本發(fā)明的QTYCode可應(yīng)用于這種TM區(qū)中的疏水氨基酸L、I、V和F。更具體而言,根據(jù)QTYcode,TM區(qū)中的每個(gè)亮氨酸可獨(dú)立地被谷氨酰胺(Q)、絲氨酸(S)或天冬酰胺(N)替換212,或保持不替換;TM區(qū)中的每個(gè)異亮氨酸和纈氨酸可獨(dú)立地被蘇氨酸(T)、絲氨酸(S)或天冬酰胺(N)替換,或保持不替換;并且TM區(qū)中的每個(gè)苯丙氨酸可被酪氨酸(Y)替換,或保持不替換。這種QTY替換的結(jié)果產(chǎn)生初始跨膜蛋白的一個(gè)或多個(gè)推測(cè)的水溶性變體。注意,為區(qū)域中的每個(gè)氨基酸進(jìn)行的替換的數(shù)量可被選擇為參數(shù)。接下來(lái),可使用任何本領(lǐng)域熟知的程序,比如PORTER預(yù)測(cè)每個(gè)推測(cè)的水溶性變體中的α-螺旋二級(jí)結(jié)構(gòu)210。結(jié)果可與初始蛋白比較208,優(yōu)選地使用相同程序(例如,PORTER)預(yù)測(cè)的。注意,初始蛋白的α-螺旋二級(jí)結(jié)構(gòu)可使用任何本領(lǐng)域熟知的程序在初始蛋白的TM區(qū)預(yù)測(cè)步驟之前、同時(shí)或之后預(yù)測(cè)。如果α-螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè)的結(jié)果顯示潛在的水溶性變體在214具備保持的或主要保持的與初始蛋白相同α-螺旋二級(jí)結(jié)構(gòu),其提示在該變體中QTY替換的具體模式不影響或不明顯影響初始蛋白中的α-螺旋二級(jí)結(jié)構(gòu)。TM區(qū)的預(yù)測(cè)可接著被進(jìn)行220、驗(yàn)證222,和產(chǎn)生突變體序列224。任選地,如果結(jié)果顯示初始蛋白中的一個(gè)或多個(gè)α-螺旋二級(jí)結(jié)構(gòu)在214被破壞,則變體可在該步驟作為非期望的而放棄,因此終止該方法。另一方面,本發(fā)明的方法也需要預(yù)測(cè)的QTY變體,以顯示與初始蛋白相比很小或沒(méi)有形成TM區(qū)的傾向性。因此推測(cè)的水溶性變體可進(jìn)行TM區(qū)預(yù)測(cè),比如使用用于初始蛋白中初始TM區(qū)預(yù)測(cè)(如果必要的話)的相同的TM區(qū)預(yù)測(cè)程序。如果結(jié)果顯示仍存在明顯的TM區(qū),可放棄變體。另一方面,如果結(jié)果顯示不存在TM區(qū),或形成TM區(qū)的傾向性低,變體可被選擇作為相對(duì)于初始蛋白具有提高的水溶性的期望變體,同時(shí)具有保持的α-螺旋二級(jí)結(jié)構(gòu),并且因此可能具有初始蛋白的功能。如果需要,可進(jìn)行另外的步驟,以提供所得水溶性變體的進(jìn)一步表征。這種另外的表征可包括計(jì)算226變體的pI并且將其與初始蛋白的相比。pI應(yīng)未改變或改變非常少(即小于30%,或優(yōu)選地小于20%或更優(yōu)選地小于10%)。其他另外的表征可包括產(chǎn)生螺旋輪模型246(比如圖3中顯示的),以顯示在任何具體TM區(qū)上QTY替換的位置和任何聚簇(clustering)。用于通過(guò)本發(fā)明的QTYCode設(shè)計(jì)蛋白質(zhì)(例如,GPCR)的跨膜區(qū)的本發(fā)明的另一示意性實(shí)施方式可在計(jì)算機(jī)系統(tǒng)上進(jìn)行,其使用在圖9B中的代表性方法10,一些詳細(xì)步驟在下方進(jìn)一步描述。許多步驟是任選的或可根據(jù)本發(fā)明的方法組合。1:在步驟1中,計(jì)算機(jī)系統(tǒng)的計(jì)算機(jī)界面接收選擇用于分析的蛋白質(zhì)序列,和通過(guò)計(jì)算機(jī)的計(jì)算機(jī)界面送入、上傳或輸入12的描述蛋白質(zhì)(例如,序列)的數(shù)據(jù)。送入的數(shù)據(jù)可以是蛋白質(zhì)名稱、數(shù)據(jù)庫(kù)參考或蛋白質(zhì)序列。例如,蛋白質(zhì)序列可通過(guò)計(jì)算機(jī)界面上傳。2:在步驟2中,可鑒定、確定、獲得和/或送入關(guān)于蛋白質(zhì)的另外的數(shù)據(jù),包括其名稱或序列,并且經(jīng)計(jì)算機(jī)界面送入。獲得20蛋白質(zhì)數(shù)據(jù)的一個(gè)來(lái)源是名稱為UniProt(wwwdotuniprotdotorg)的數(shù)據(jù)庫(kù)??蛇x地,本發(fā)明的方法可儲(chǔ)存與蛋白質(zhì)相關(guān)的數(shù)據(jù),或蛋白質(zhì)相關(guān)序列,用于隨后用戶稍后在該步驟中檢索。在實(shí)施方式中,程序可促使用戶選擇數(shù)據(jù)庫(kù)或文件用于檢索與選擇用于分析的蛋白質(zhì)相關(guān)的另外的數(shù)據(jù)(例如,序列數(shù)據(jù))。3:在步驟3中,用戶可送入、上傳或獲得鑒定跨膜區(qū)的數(shù)據(jù)。例如,可使用戶從公共資源,比如UniProt獲得數(shù)據(jù)。信息可被確認(rèn)30并且從數(shù)據(jù)庫(kù)收集用于步驟5。4:可選地或另外地,如果TM區(qū)信息不容易從輸入蛋白質(zhì)序列獲得,跨膜區(qū)照舊可通過(guò)任何本領(lǐng)域熟知的方法確認(rèn)40??缒^(qū)的大體特征在于α螺旋構(gòu)象??缒ぢ菪A(yù)測(cè)可使用例如名稱為T(mén)MHMM2.0(使用隱馬爾科夫模型的跨膜預(yù)測(cè))、由生物序列分析中心(wwwdotcbsdotdtudotdkslashservicesslashTMHMM)開(kāi)發(fā)的軟件模塊/包預(yù)測(cè)。軟件的版本可能對(duì)于尋峰存在問(wèn)題并且有時(shí)不能發(fā)現(xiàn)GPCR的7-TM區(qū)。所以,當(dāng)必要時(shí),可使用改良版本的程序,其中通過(guò)計(jì)算機(jī)系統(tǒng)執(zhí)行的尋峰方法引入了動(dòng)態(tài)基線。這里,例如,在GPCR的情況下,如果未發(fā)現(xiàn)使用初始基線值的所有7個(gè)TM區(qū),基線可變?yōu)檩^低的值。例如,默認(rèn)的基線可在0.2設(shè)置。為了鑒定缺失的第七跨膜區(qū),人們可將基線值設(shè)置至0.1。如果發(fā)現(xiàn)了大于7個(gè)TM區(qū),基線可變?yōu)楦叩闹担热?.15,以消除假的TM預(yù)測(cè)。例如,當(dāng)CCR-2氨基酸序列進(jìn)行TMHMM2.0軟件時(shí),起初僅僅鑒定了6個(gè)跨膜區(qū)。但是,當(dāng)TMHMM2.0基線值設(shè)置至0.07時(shí),鑒定了正確的總共7個(gè)跨膜區(qū)。然后,TM區(qū)預(yù)測(cè)的結(jié)果提供至步驟5。5:在步驟5中,在通過(guò)重新預(yù)測(cè)或通過(guò)初始序列輸入而獲得這種信息鑒定了TM數(shù)據(jù)之后,根據(jù)TM區(qū)信息,GPCR的序列被分成50總共15個(gè)片段(即,7-跨膜區(qū)段(7TM)52和8個(gè)非跨膜區(qū)段(8NTM))54。即,每個(gè)典型的GPCR應(yīng)具有7個(gè)TM和8個(gè)NTM片段。應(yīng)理解,使用計(jì)算機(jī)界面用于由用戶輸入,系統(tǒng)可執(zhí)行一個(gè)或多個(gè),比如所有的上述步驟。也應(yīng)理解,系統(tǒng)可省略一個(gè)或多個(gè)上述步驟,或組合兩個(gè)或更多個(gè)步驟。6:在步驟6中,對(duì)蛋白質(zhì)給定TM區(qū)中選擇的亞組疏水氨基酸L、I、V和F部分進(jìn)行QTY替換60。具體而言,第一跨膜區(qū)(典型地,但不是必要地,最靠近蛋白質(zhì)的N-末端的跨膜區(qū))首先被選擇用于改變。第一跨膜區(qū)中的一些或所有的疏水氨基酸(L、I、V和F)接著被相應(yīng)的非離子親水的氨基酸(Q/S/N、T/S/N、T/S/N或Y)替換。應(yīng)理解,氨基酸實(shí)際上在該背景下不被替換至蛋白質(zhì)。而是,序列中氨基酸名稱(designation)被替換用于建模。因此,術(shù)語(yǔ)“序列”旨在包括“序列數(shù)據(jù)”。典型地,大部分或所有的疏水氨基酸被選擇用于替換。如果小于所有的氨基酸被選擇,可期望選擇內(nèi)部疏水氨基酸,留下跨膜區(qū)疏水的一個(gè)或多個(gè)N和/或C末端氨基酸。另外地或可選地,可期望選擇替換跨膜區(qū)中的所有的亮氨酸(L)。另外或可選地,可期望選擇和替換跨膜區(qū)中的所有的異亮氨酸(I)。另外或可選地,可期望選擇替換跨膜區(qū)中的所有的纈氨酸(V)。另外或可選地,可期望選擇替換跨膜區(qū)中的所有的苯丙氨酸(F)。另外或可選地,可有利地保留跨膜區(qū)中的一個(gè)或多個(gè)苯丙氨酸。另外或可選地,可有利地保留跨膜區(qū)中的一個(gè)或多個(gè)纈氨酸。另外或可選地,可有利地保留跨膜區(qū)中的一個(gè)或多個(gè)亮氨酸。另外或可選地,可有利地保留跨膜區(qū)中的一個(gè)或多個(gè)異亮氨酸。另外或可選地,可有利地保留跨膜區(qū)中的一個(gè)或多個(gè)疏水氨基酸,其中野生型序列的特征在于三個(gè)或更多個(gè)連續(xù)疏水氨基酸。7:在步驟7中,將如此設(shè)計(jì)的跨膜區(qū)返回到初始蛋白的環(huán)境(context)。即,具有QTY替換的突變的或再設(shè)計(jì)的TM區(qū)62被交換至初始蛋白的相應(yīng)TM區(qū),以建立跨膜變體70或“推測(cè)的變體”,因?yàn)槊拷M替換為該TM區(qū)產(chǎn)生一個(gè)特定的推測(cè)的變體。這些相關(guān)推測(cè)的變體一起形成推測(cè)的變體的第一文庫(kù)。8:在步驟82和84中,每個(gè)推測(cè)的變體然后進(jìn)行跨膜區(qū)預(yù)測(cè)方法(84),如本文所討論(例如,預(yù)測(cè)的TM區(qū)的丟失)。變體也被評(píng)估序列形成α螺旋的傾向性的評(píng)分(82)。變體也進(jìn)行水溶性預(yù)測(cè)方法,如本文所討論。例如,變體被評(píng)估序列是水溶性的傾向性的評(píng)分。這種評(píng)分可基于預(yù)測(cè)的形成TM區(qū)的傾向性,強(qiáng)的形成TM區(qū)的傾向性與差的水溶性相關(guān),并且較低的或沒(méi)有形成TM區(qū)的傾向性與高的水溶性相關(guān)。當(dāng)然,大部分商業(yè)目的不要求在所有濃度下的完全水溶性。水溶性優(yōu)選地確定為在預(yù)測(cè)的使用條件下(例如,在配體結(jié)合試驗(yàn))起作用所需要的溶解性。9:在步驟9中,放棄預(yù)測(cè)α螺旋結(jié)構(gòu)丟失和/或“水不溶性”的推測(cè)的變體(在期望使用條件下預(yù)測(cè))??蛇x擇預(yù)測(cè)α螺旋結(jié)構(gòu)和水溶性的推測(cè)的變體,比如通過(guò)使用組合評(píng)分或排序90,其是基于α-螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果和TM區(qū)/水溶性預(yù)測(cè)結(jié)果的排序函數(shù)的加權(quán)組合。例如,人們可選擇高度水溶性的或特征在于0、1、2或3個(gè)疏水氨基酸(例如,對(duì)于水溶性預(yù)測(cè)結(jié)果更高的權(quán)重)的跨膜變體,可能預(yù)期α螺旋結(jié)構(gòu)可被折損(compromised)??蛇x地或另外,人們可選擇高度α-螺旋結(jié)構(gòu)(例如,對(duì)于α螺旋二級(jí)結(jié)構(gòu)預(yù)測(cè)結(jié)果更高的權(quán)重),其特征在于3、4、5或6個(gè)疏水氨基酸。10:在步驟10中,相同文庫(kù)94中推測(cè)的變體可基于上面闡釋的評(píng)分計(jì)算方案被分類或排序100。接著,可選擇預(yù)定數(shù)量的推測(cè)的變體,作為第一推測(cè)的變體文庫(kù)中的最終成員。例如,在上述組合評(píng)分中,評(píng)分0意思是沒(méi)有形成TM區(qū)的傾向性,和完全保持初始α螺旋二級(jí)結(jié)構(gòu),并且因此是最期望的推測(cè)的變體。稍微更高的評(píng)分可指示形成TM區(qū)的稍微傾向性(或水溶性的較少傾向性)。因此,推測(cè)的變體是較不期望的,但是基于其與文庫(kù)中其他推測(cè)的變體相比卓越的組合評(píng)分仍可被選擇。在某些實(shí)施方式中,可選擇預(yù)定數(shù)量的期望的推測(cè)的變體,比如10、9、8、7、6、5、4、3、2或1個(gè)。這些步驟(例如,步驟6-10)可重復(fù)用于第二、第三、第四、第五、第六和/或第七(或更多)跨膜區(qū)或結(jié)構(gòu)域,以為每個(gè)這種TM區(qū)或結(jié)構(gòu)域建立一個(gè)推測(cè)的變體文庫(kù)。11:在步驟11中,人們可選擇110TM區(qū)或結(jié)構(gòu)域與推測(cè)的變體和未替換的非TM區(qū)的組合。例如,可將具有具備高α-螺旋結(jié)構(gòu)評(píng)分的推測(cè)的變體的一個(gè)、兩個(gè)、三個(gè)或四個(gè)結(jié)構(gòu)域和具有具備高水溶性評(píng)分的推測(cè)的變體的一個(gè)、兩個(gè)、三個(gè)、四個(gè)、五個(gè)或六個(gè)結(jié)構(gòu)域組合。在另一實(shí)例中,人們可將特征在于所有的疏水氨基酸被親水氨基酸替換,因此使水溶性評(píng)分最大化的結(jié)構(gòu)域/TM區(qū),和在多個(gè)變體選擇中保持3、4或5個(gè)疏水氨基酸的第二結(jié)構(gòu)域/TM區(qū)組合。這種選擇的推測(cè)的變體可如本領(lǐng)域已知的與細(xì)胞外和細(xì)胞內(nèi)結(jié)構(gòu)域被“改組”,以建立推測(cè)的水溶性蛋白質(zhì)變體的初始組合文庫(kù)。在某些實(shí)施方式中,可制備如本文所描述設(shè)計(jì)的初始組合文庫(kù)的所有或一部分推測(cè)的水溶性蛋白質(zhì)變體(體外或在宿主細(xì)胞中產(chǎn)生或表達(dá)),并且篩選水溶性和/或配體結(jié)合,優(yōu)選地在高通量篩選中。例如,文庫(kù)的擴(kuò)增可從表達(dá)產(chǎn)生小于100%的推測(cè)的水溶性蛋白質(zhì)組合變體。報(bào)告系統(tǒng)可用于篩選配體結(jié)合,如本領(lǐng)域熟知的。使用本發(fā)明的方法,人們可快速鑒定包含功能上結(jié)合細(xì)胞外和細(xì)胞內(nèi)結(jié)構(gòu)域的推測(cè)的水溶性修飾跨膜組合變體的文庫(kù),并且產(chǎn)生具有野生型蛋白質(zhì)的適當(dāng)3維結(jié)構(gòu)并且保持配體結(jié)合功能(包括結(jié)合親和力)或其他功能的水溶性蛋白質(zhì)變體。軟件可包括學(xué)習(xí)模塊,其中蛋白質(zhì)變體的確認(rèn)功能用于剔除某些變體或?qū)λ鼈儾煌嘏判颉T谀承?shí)施方式中,為了實(shí)際實(shí)驗(yàn),初始組合文庫(kù)具有約2百萬(wàn)個(gè)潛在水溶性GPCR,或CXCR4,變體。當(dāng)然,也可設(shè)計(jì)更多或更少變體的文庫(kù)。在某些實(shí)施方式中,較小的文庫(kù)可能是優(yōu)選的,因?yàn)樗鼈兛苫谌绫疚乃枋龅难芯拷Y(jié)果的分析而優(yōu)化。研究結(jié)果的分析可能建立趨勢(shì),以優(yōu)化改組的結(jié)構(gòu)域變體的數(shù)量和用于選擇結(jié)構(gòu)域變體的假設(shè)。在某些實(shí)施方式中,基于也稱為“螺旋預(yù)測(cè)評(píng)分”的螺旋形成傾向性,選擇用于修飾的跨膜蛋白的TM區(qū)中的某些疏水氨基酸(見(jiàn)wwwdotproteopediadotorgslashwikislashindexdotphpslashMain_Page)。隨機(jī)組裝改變的片段,以形成全長(zhǎng)GPCR基因的約2M(87)變體。預(yù)測(cè)的變體的數(shù)量可一般由式Hn表示,其中n=通過(guò)方法修飾和/或改變的跨膜區(qū)的數(shù)量(在GPCR的例子中,n=7)和H=在產(chǎn)生組合變體可用的每個(gè)跨膜區(qū)中推測(cè)的變體的數(shù)量。一旦選擇了初始組合文庫(kù),或待改組的結(jié)構(gòu)域變體的選擇,則可設(shè)計(jì)在初始組合文庫(kù)中編碼蛋白質(zhì)的核酸分子或DNA或cDNA分子。核酸分子優(yōu)選地設(shè)計(jì)以為選擇以產(chǎn)生編碼序列文庫(kù)的表達(dá)系統(tǒng)提供密碼子優(yōu)化和內(nèi)含子缺失。例如,如果表達(dá)系統(tǒng)是大腸桿菌,可選擇為大腸桿菌表達(dá)優(yōu)化的密碼子。參見(jiàn)wwwdotdna20dotcomslashresourcesslashgenedesigner。另外,選擇啟動(dòng)子區(qū)域,比如適于在表達(dá)系統(tǒng)(例如,大腸桿菌)中的表達(dá)的啟動(dòng)子,并且可操作地連接至編碼序列的文庫(kù)中的編碼序列。接著表達(dá)編碼序列的初始文庫(kù),或其一部分以產(chǎn)生推測(cè)的水溶性的GPCR的文庫(kù)。接著,文庫(kù)進(jìn)行配體結(jié)合試驗(yàn)。在結(jié)合試驗(yàn)中,推測(cè)的水溶性的GPCR與配體結(jié)合,優(yōu)選地在水性介質(zhì)中并且檢測(cè)到配體結(jié)合。本發(fā)明包括從本文所述的方法獲得的,或可獲得的跨膜結(jié)構(gòu)域變體和編碼其的核酸分子。本發(fā)明也考慮水溶性GPCR變體(“sGPCR”),其特征在于多個(gè)跨膜結(jié)構(gòu)域獨(dú)立地特征在于天然跨膜蛋白(例如,GPCR)的至少50%、優(yōu)選地至少約60%、更優(yōu)選地至少約70%或80%、比如至少約90%)的疏水氨基酸殘基(L、I、V和F)分別被Q、T、T或Y替換)。本發(fā)明的sGPCR特征在于水溶性和配體結(jié)合。尤其,sGPCR結(jié)合與相應(yīng)的天然GPCR相同的天然配體。本發(fā)明進(jìn)一步包括治療由膜蛋白的活性介導(dǎo)的不適或疾病的方法,包括使用水溶性多肽治療所述不適和疾病,其中所述水溶性多肽包括修飾的α-螺旋結(jié)構(gòu)域,和其中所述水溶性多肽保留了天然膜蛋白配體結(jié)合活性。這種不適和疾病的例子包括但不限于癌癥、小細(xì)胞肺癌、黑素瘤、乳腺癌、帕金森病、心血管疾病、高血壓和哮喘。如本文所描述,本文所述的水溶性肽可用于治療由膜蛋白的活性介導(dǎo)的病況或疾病。在某些方面中,水溶性肽可用作膜受體的“誘餌(decoy)”并且結(jié)合配體,否則以其他方式激活膜受體。這樣,本文所述的水溶性肽可用于降低膜蛋白的活性。這些水溶性肽可保留在循環(huán)中并且競(jìng)爭(zhēng)性結(jié)合特異性配體,從而降低膜結(jié)合受體的活性。例如,GPCRCXCR4在小細(xì)胞肺癌中過(guò)表達(dá)并且促進(jìn)腫瘤細(xì)胞的轉(zhuǎn)移。該配體被水溶性肽比如本文所述的水溶性肽的結(jié)合可顯著降低轉(zhuǎn)移。趨化因子受體CXCR4在病毒研究中已知作為用于進(jìn)入嗜T細(xì)胞系HIV(Tcellline-tropicHIV)的主要共同受體(Feng等(1996)Science272:872-877;Davis等(1997)JExpMed186:1793-1798;Zaitseva等(1997)NatMed3:1369-1375;Sanchez等(1997)JBiolChem272:27529-27531)?;|(zhì)細(xì)胞衍生的因子1(SDF-1)是趨化因子,其與CXCR4特異性相互作用。當(dāng)SDF-1結(jié)合CXCR4時(shí),CXCR4激活Gαi蛋白質(zhì)-介導(dǎo)的信號(hào)傳導(dǎo)(百日咳毒素敏感的)(Chen等(1998)MolPharmacol53:177-181),包括淋巴細(xì)胞、巨核細(xì)胞和造血干細(xì)胞中的下游激酶途徑,比如Ras/MAP激酶和磷脂酰肌醇3-激酶(PI3K)/Akt(Bleul等(1996)Nature382:829-833;Deng等(1997)Nature388:296-300;Kijowski等(2001)StemCells19:453-466;Majka等(2001)Folia.Histochem.Cytobiol.39:235-244;Sotsios等(1999)J.Immunol.163:5954-5963;Vlahakis等(2002)J.Immunol.169:5546-5554)。在移植有人淋巴結(jié)的小鼠中,SDF-1誘導(dǎo)CXCR4陽(yáng)性細(xì)胞遷移至移植的淋巴結(jié)(Blades等(2002)J.Immunol.168:4308-4317)。最近,研究已經(jīng)顯示CXCR4相互作用可調(diào)節(jié)轉(zhuǎn)移細(xì)胞的遷移。低氧、氧分壓的降低是在大部分實(shí)體瘤中出現(xiàn)的微環(huán)境改變并且是腫瘤血管生成和治療抗性的主要誘導(dǎo)物。低氧增加了CXCR4水平(Staller等(2003)Nature425:307-311)。對(duì)來(lái)自具有升高的轉(zhuǎn)移活性的骨轉(zhuǎn)移模型的細(xì)胞的亞群體的微陣列分析顯示轉(zhuǎn)移表型中增加的一種基因是CXCR4。此外,分離的細(xì)胞中過(guò)表達(dá)CXCR4顯著增加了轉(zhuǎn)移活性(Kang等(2003)CancerCell3:537-549)。在從各種乳腺癌患者收集的樣品中,Muller等(Muller等(2001)Nature410:50-56)發(fā)現(xiàn)CXCR4表達(dá)水平在原發(fā)性腫瘤中相對(duì)于正常的乳腺或上皮細(xì)胞更高。而且,已經(jīng)顯示,CXCR4抗體治療當(dāng)與所有轉(zhuǎn)移至淋巴結(jié)和肺的對(duì)照同種型相比時(shí),抑制轉(zhuǎn)移至局部淋巴結(jié)(Muller等(2001)。這種誘餌療法模型適于治療CXCR4介導(dǎo)的疾病和不適。在本發(fā)明的另一實(shí)施方式中,涉及治療與取決于CXCR4趨化性相關(guān)的疾病或不適,其中疾病與異常白細(xì)胞募集或激活相關(guān)。疾病選自關(guān)節(jié)炎、牛皮癬、多發(fā)性硬化、潰瘍性結(jié)腸炎、克羅恩病、過(guò)敏、哮喘、AIDS相關(guān)的腦炎、AIDS相關(guān)的斑狀皮膚丘疹、AIDS相關(guān)的間質(zhì)肺炎、AIDS相關(guān)的腸疾病、AIDS相關(guān)的門(mén)靜脈周肝炎和AIDS相關(guān)的腎小球性腎炎。在另一方面中,本發(fā)明涉及治療選自下述的疾病或不適:關(guān)節(jié)炎、淋巴瘤、非小細(xì)胞肺癌、肺癌、乳腺癌、前列腺癌、多發(fā)性硬化、中樞神經(jīng)系統(tǒng)發(fā)育疾病、癡呆、帕金森病、阿爾茨海默氏疾病、腫瘤、纖維瘤、星形細(xì)胞瘤、骨髓瘤、膠質(zhì)母細(xì)胞瘤、炎性疾病、器官移植排斥、AIDS、HIV感染或血管生成。本發(fā)明也包括藥物組合物,其包括所述水溶性多肽和藥學(xué)上可接受的載體或稀釋劑。取決于期望的制劑,組合物可也包括藥學(xué)上可接受的、無(wú)毒的載體或稀釋劑,其定義為媒介,通常用于配制用于動(dòng)物或人施用的藥物組合物。選擇稀釋劑從而不影響藥學(xué)試劑或組合物的生物活性。這種稀釋劑的例子是蒸餾水、生理學(xué)磷酸鹽緩沖的生理鹽水、林格溶液、右旋糖溶液和Hank’s溶液。另外,藥物組合物或制劑也可包括其他載體、佐劑或非毒性、非治療性、非免疫性穩(wěn)定劑等。藥物組合物可也包括大的、緩慢代謝的大分子,比如蛋白質(zhì)、多糖,比如殼聚糖、聚乳酸、聚乙醇酸和共聚物(比如膠乳官能化的SEPHAROSETM、瓊脂糖、纖維素等)、聚合氨基酸、氨基酸共聚物和脂質(zhì)聚集物(比如油液滴或脂質(zhì)體)。組合物可被腸胃外施用,比如,例如,通過(guò)靜脈內(nèi)、肌內(nèi)、鞘內(nèi)或皮下注射。腸胃外施用可通過(guò)將組合物并入溶液或懸浮而完成。這種溶液或懸液也可包括無(wú)菌稀釋劑,比如注射用水、生理鹽水溶液、不揮發(fā)油、聚乙二醇、丙三醇、丙二醇或其他合成溶劑。腸胃外制劑也可包括抗細(xì)菌劑,比如,例如,苯甲醇或?qū)αu基苯甲酸甲酯;抗氧化劑比如,例如,抗壞血酸或亞硫酸氫鈉;和螯合劑,比如EDTA。也可添加緩沖劑比如醋酸鹽、檸檬酸鹽或磷酸鹽和調(diào)整肌肉彈性的試劑,比如氯化鈉或右旋糖。腸胃外制劑可封裝在安瓿、一次性注射器或由玻璃或塑料制備的多劑量小瓶中。另外,輔助物質(zhì),比如濕潤(rùn)劑或乳化劑、表面活性劑、pH緩沖物質(zhì)等可存在于組合物中。藥物組合物的其他組分是石油、動(dòng)物、蔬菜或合成來(lái)源的那些,例如,花生油、大豆油和礦物質(zhì)油。一般而言,乙二醇比如丙二醇或聚乙二醇是優(yōu)選的液體載體,尤其用于可注射的溶液??勺⑸涞闹苿┛芍苽錇橐后w溶液或懸液;也可制備在注射之前適于溶于或懸浮在液體媒介中的固體形式。制劑也可乳化或封裝在脂質(zhì)體或微顆粒比如聚乳酸、聚乙交酯中或用于增強(qiáng)佐劑效果的共聚物中,如上所討論。Langer,Science249:1527,1990;和Hanes,AdvancedDrugDeliveryReviews28:97-119,1997。本文所述的組合物和藥理學(xué)試劑可以儲(chǔ)庫(kù)式注射(depotinjection)或植入制劑(implantpreparation)形式——其可配制為允許活性成分持續(xù)釋放或脈沖釋放的形式——施用。經(jīng)皮的施用包括組合物通過(guò)皮膚的經(jīng)皮吸收。經(jīng)皮的制劑包括貼片、藥膏、乳劑、凝膠、油膏等。經(jīng)皮的遞送可使用皮膚貼片或使用傳遞體(transferosomes)實(shí)現(xiàn)。見(jiàn)Paul等,Eur.J.Immunol.25:3521-24,1995;和Cevc等,Biochem.Biophys.Acta1368:201-15,1998。“治療(treating)”或“治療(treatment)”包括預(yù)防或延遲疾病的癥狀、并發(fā)癥或生物化學(xué)指標(biāo)的出現(xiàn),緩解或減輕癥狀或壓制或抑制疾病、病況或不適的進(jìn)一步發(fā)展。“患者”是需要治療的人受試者?!坝行Я俊敝缸銐驕p輕不適的一個(gè)或多個(gè)癥狀和/或預(yù)防不適的進(jìn)展、引起不適的退化和/或?qū)崿F(xiàn)期望效果的治療劑的量。計(jì)算機(jī)系統(tǒng)本文所述的各種方面和功能可實(shí)施為在一個(gè)或多個(gè)計(jì)算機(jī)系統(tǒng)中執(zhí)行的專用硬件或軟件組件。存在目前使用的許多計(jì)算機(jī)系統(tǒng)的例子。這些例子包括網(wǎng)絡(luò)裝置、個(gè)人計(jì)算機(jī)、工作站、主機(jī)、網(wǎng)絡(luò)客戶端、服務(wù)器、媒體服務(wù)器、應(yīng)用服務(wù)器、數(shù)據(jù)庫(kù)服務(wù)器和網(wǎng)絡(luò)服務(wù)器等。計(jì)算機(jī)系統(tǒng)的其他例子可包括移動(dòng)計(jì)算設(shè)備,比如手機(jī)和個(gè)人數(shù)字輔助物和網(wǎng)絡(luò)裝置,比如負(fù)載平衡器、路由器和交換機(jī)。此外,方面可位于單個(gè)計(jì)算機(jī)系統(tǒng)上或可分布在與一個(gè)或多個(gè)通訊網(wǎng)絡(luò)連接的多個(gè)計(jì)算機(jī)系統(tǒng)中。例如,各種方面、功能和方法可分布在配置為給一個(gè)或多個(gè)客戶端計(jì)算機(jī)提供服務(wù),或作為分布的系統(tǒng)的一部分進(jìn)行總體任務(wù)的一個(gè)或多個(gè)計(jì)算機(jī)系統(tǒng)中。另外,方面可在包括分布在一個(gè)或多個(gè)實(shí)施各種功能的服務(wù)器系統(tǒng)中的組件的客戶端-服務(wù)器或多層次系統(tǒng)上進(jìn)行。從而,實(shí)施方式不限于在任何具體的系統(tǒng)或系統(tǒng)組中執(zhí)行。此外,方面、功能和方法可在軟件、硬件或固件,或其任何組合中實(shí)施。因此,方面、功能和方法可在使用各種硬件和軟件配置的方法、動(dòng)作、系統(tǒng)、系統(tǒng)要素和組件中實(shí)施,并且例子不限于任何特定分布的架構(gòu)、網(wǎng)絡(luò)或通信方案。參考圖10,闡釋了分布式計(jì)算機(jī)系統(tǒng)300的方塊圖,其中實(shí)施了各種方面和功能。如顯示的,分布式計(jì)算機(jī)系統(tǒng)300包括交換信息的一個(gè)或多個(gè)計(jì)算機(jī)系統(tǒng)。更具體而言,分布式計(jì)算機(jī)系統(tǒng)300包括計(jì)算機(jī)系統(tǒng)302、304和306。如顯示的,計(jì)算機(jī)系統(tǒng)302、304和306通過(guò)通信網(wǎng)絡(luò)308相互連接,并且可通過(guò)通信網(wǎng)絡(luò)308交換數(shù)據(jù)。網(wǎng)絡(luò)308可包括通過(guò)其計(jì)算機(jī)系統(tǒng)可交換數(shù)據(jù)的任何通信網(wǎng)絡(luò)。為了使用網(wǎng)絡(luò)308交換數(shù)據(jù),計(jì)算機(jī)系統(tǒng)302、304和306和網(wǎng)絡(luò)308可使用各種方法、方案和標(biāo)準(zhǔn)。這些方案和標(biāo)準(zhǔn)的例子包括適于在大數(shù)據(jù)環(huán)境下使用的NAS、Web、儲(chǔ)存和其他數(shù)據(jù)移動(dòng)方案。為了確保數(shù)據(jù)轉(zhuǎn)移是安全的,計(jì)算機(jī)系統(tǒng)302、304和306可經(jīng)網(wǎng)絡(luò)308使用各種安全性措施包括,例如,SSL或VPN技術(shù)傳輸數(shù)據(jù)。盡管分布式計(jì)算機(jī)系統(tǒng)300圖解三種網(wǎng)絡(luò)計(jì)算機(jī)系統(tǒng),但是分布式計(jì)算機(jī)系統(tǒng)300不這樣限制并且可包括任何數(shù)量的使用任何介質(zhì)和通信方案網(wǎng)絡(luò)化的計(jì)算機(jī)系統(tǒng)和計(jì)算設(shè)備。如在圖10中闡釋,計(jì)算機(jī)系統(tǒng)302包括處理器310、存儲(chǔ)器312、互聯(lián)元件314、界面316和數(shù)據(jù)儲(chǔ)存元件318。為了實(shí)施本文公開(kāi)的至少一些方面、功能和方法,處理器310進(jìn)行一系列指令,其產(chǎn)生操作的數(shù)據(jù)。處理器310可以是任何類型的處理器、多處理器或控制器。示例性處理器可包括商業(yè)上可獲得的處理器比如IntelXeon、Itanium、Core、Celeron或Pentium處理器;AMDOpteron處理器;AppleA4或A5處理器;SunUltraSPARC處理器;IBMPower5+處理器;IBM主機(jī)芯片;或量子計(jì)算機(jī)。處理器310通過(guò)互聯(lián)元件314與其他系統(tǒng)組件——包括一個(gè)或多個(gè)存儲(chǔ)器設(shè)備312——連接。在計(jì)算機(jī)系統(tǒng)302的操作期間,存儲(chǔ)器312儲(chǔ)存程序(例如,編碼以被處理器310執(zhí)行的一系列指令)和數(shù)據(jù)。因此,存儲(chǔ)器312可以是相對(duì)高效、易失、隨機(jī)存取存儲(chǔ)器,比如動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(“DRAM”)或靜態(tài)存儲(chǔ)器(“SRAM”)。但是,存儲(chǔ)器312可包括儲(chǔ)存數(shù)據(jù)的任何設(shè)備,比如磁盤(pán)驅(qū)動(dòng)器或其他非易失性存儲(chǔ)器設(shè)備。各種例子可將存儲(chǔ)器312組織進(jìn)入特定的結(jié)構(gòu),和在一些情況下,獨(dú)特的結(jié)構(gòu)中,以實(shí)施本文公開(kāi)的功能。這些數(shù)據(jù)結(jié)構(gòu)可被定制大小和組織,以儲(chǔ)存具體數(shù)據(jù)的值和數(shù)據(jù)的類型。通過(guò)互聯(lián)元件比如互聯(lián)元件314連接計(jì)算機(jī)系統(tǒng)302的組件。互聯(lián)元件314可包括系統(tǒng)組件之間的任何通信連接,比如與專用的或標(biāo)準(zhǔn)計(jì)算總線技術(shù)比如IDE、SCSI、PCI和InfiniBand一致的一個(gè)或多個(gè)物理總線。互聯(lián)元件314確保通訊,包括指令和數(shù)據(jù),以在計(jì)算機(jī)系統(tǒng)302的系統(tǒng)組件之間被交換。計(jì)算機(jī)系統(tǒng)302也包括一個(gè)或多個(gè)界面設(shè)備316,比如輸入設(shè)備、輸出設(shè)備和組合輸入/輸出設(shè)備。界面設(shè)備可接收輸入或提供輸出。更具體地,輸出設(shè)備可使得信息外部顯示。輸入設(shè)備可從外部資源接收信息。界面設(shè)備的例子包括鍵盤(pán)、鼠標(biāo)設(shè)備、軌跡球、麥克風(fēng)、觸感屏幕、打印設(shè)備、顯示屏、話筒、網(wǎng)絡(luò)接口卡等。界面設(shè)備使得計(jì)算機(jī)系統(tǒng)302與外部實(shí)體交換信息并且與外部實(shí)體通訊,外部實(shí)體比如用戶和其他系統(tǒng)。數(shù)據(jù)儲(chǔ)存元件318包括計(jì)算機(jī)可讀的和可寫(xiě)的、非易失或非瞬時(shí)數(shù)據(jù)存儲(chǔ)介質(zhì),其中儲(chǔ)存限定由處理器310執(zhí)行的程序或其他對(duì)象的指令。數(shù)據(jù)儲(chǔ)存元件318也可包括記錄在介質(zhì)上或介質(zhì)中并且在程序執(zhí)行期間被處理器310處理的信息。更具體而言,信息可儲(chǔ)存在專門(mén)配置為保存儲(chǔ)存空間或增加數(shù)據(jù)交換性能的一個(gè)或多個(gè)數(shù)據(jù)結(jié)構(gòu)中。指令可持久性地儲(chǔ)存為編碼信號(hào),并且指令可使得處理器310實(shí)施本文所述的任何功能。介質(zhì)可以是例如光盤(pán)、磁盤(pán)或閃存等。在操作時(shí),處理器310或一些其他控制器使得數(shù)據(jù)從非易失記錄介質(zhì)中讀入另一存儲(chǔ)器,比如存儲(chǔ)器312中,使得比包括在數(shù)據(jù)儲(chǔ)存元件318中的存儲(chǔ)介質(zhì),處理器310更快地訪問(wèn)信息。存儲(chǔ)器可位于數(shù)據(jù)儲(chǔ)存元件318或存儲(chǔ)器312中,但是,處理器310操縱存儲(chǔ)器中的數(shù)據(jù),并且然后在處理完成之后,將數(shù)據(jù)拷貝至與數(shù)據(jù)儲(chǔ)存元件318相關(guān)的存儲(chǔ)介質(zhì)。各種組件可控制存儲(chǔ)介質(zhì)和其他存儲(chǔ)器元件之間的數(shù)據(jù)移動(dòng)并且例子不限于具體的數(shù)據(jù)操作組件。此外,實(shí)施例不限于具體的存儲(chǔ)器系統(tǒng)或數(shù)據(jù)儲(chǔ)存系統(tǒng)。盡管計(jì)算機(jī)系統(tǒng)302顯示為在其上可實(shí)施各種方面和功能的一種類型的計(jì)算機(jī)系統(tǒng)的例子,但是方面和功能不限于在如圖10中顯示的計(jì)算機(jī)系統(tǒng)302上實(shí)施。各種方面和功能可在具有與圖10中顯示的相比不同架構(gòu)或組件的一個(gè)或多個(gè)計(jì)算機(jī)上實(shí)施。例如,計(jì)算機(jī)系統(tǒng)302可包括專用編程、專用目的硬件,比如特定用途集成電路(“ASIC”),其定制為實(shí)施本文公開(kāi)的具體操作。但是,另一例子可使用數(shù)個(gè)通用目的計(jì)算設(shè)備柵格實(shí)施相同功能,所述通用目的計(jì)算設(shè)備以MotorolaPowerPC處理器運(yùn)行MACOS系統(tǒng)X和數(shù)個(gè)運(yùn)行專有硬件和操作系統(tǒng)的專用計(jì)算設(shè)備。計(jì)算機(jī)系統(tǒng)302可以是計(jì)算機(jī)系統(tǒng),包括管理至少一部分包括在計(jì)算機(jī)系統(tǒng)302中的硬件元件的操作系統(tǒng)。在一些實(shí)例中,處理器或控制器,比如處理器310,執(zhí)行操作系統(tǒng)??蓤?zhí)行的具體操作系統(tǒng)的例子包括可獲得自MicrosoftCorporation的基于Windows的操作系統(tǒng),比如,WindowsNT、Windows2000(WindowsME)、WindowsXP、WindowsVista或Windows7操作系統(tǒng);可獲得自Apple計(jì)算機(jī)的MACOS系統(tǒng)X操作系統(tǒng)或iOS操作系統(tǒng);許多基于Linux的操作系統(tǒng)分布的一種,例如,可獲得自RedHatInc.的EnterpriseLinux操作系統(tǒng);可獲得自O(shè)racleCorporation的Solaris操作系統(tǒng);或可獲得自各種來(lái)源的UNIX操作系統(tǒng)??墒褂迷S多其他操作系統(tǒng),并且例子不限于任何具體的操作系統(tǒng)。處理器310和操作系統(tǒng)一起限定了編寫(xiě)高級(jí)編程語(yǔ)言的應(yīng)用程序的計(jì)算機(jī)平臺(tái)。這些組件應(yīng)用可以是可執(zhí)行的中間字節(jié)碼或編譯碼,其經(jīng)通信網(wǎng)絡(luò),例如,因特網(wǎng),使用通信方案,例如,TCP/IP通訊。類似地,方面可使用源于對(duì)象的編程語(yǔ)言,比如,Net、SmallTalk、Java、C++、Ada、C#(C-Sharp)、Python或JavaScript實(shí)施。也可使用其他源于對(duì)象的編程語(yǔ)言??蛇x地,可使用函數(shù)式、腳本或邏輯編程語(yǔ)言。另外,各種方面和功能可在非編程環(huán)境下實(shí)施。例如,以HTML、XML或其他格式創(chuàng)建的文檔,當(dāng)在瀏覽器程序的窗口中查看時(shí),可產(chǎn)生圖形用戶界面的方面或?qū)嵤┢渌δ?。此外,各種例子可實(shí)施為編程的或非編程的要素,或其任何組合。例如,網(wǎng)頁(yè)可使用HTML實(shí)施,同時(shí)從網(wǎng)頁(yè)中調(diào)用的數(shù)據(jù)對(duì)象可用C++編寫(xiě)。因此,實(shí)施例不限于具體的編程語(yǔ)言并且可使用任何適當(dāng)?shù)木幊陶Z(yǔ)言。因此,本文公開(kāi)的功能組成可包括配置為實(shí)施本文所述功能的各種要素(例如,專用硬件、可執(zhí)行碼、數(shù)據(jù)結(jié)構(gòu)或?qū)ο?。在一些實(shí)施例中,本文公開(kāi)的組件可讀取影響由組件進(jìn)行的功能的參數(shù)。這些參數(shù)可以物理儲(chǔ)存在任何形式的適當(dāng)?shù)拇鎯?chǔ)器中,包括易失存儲(chǔ)器(比如RAM)或非易失存儲(chǔ)器(比如磁性硬盤(pán)驅(qū)動(dòng)器)。另外,參數(shù)可邏輯儲(chǔ)存在合適的數(shù)據(jù)結(jié)構(gòu)(比如用戶空間應(yīng)用定義的數(shù)據(jù)庫(kù)或文件)或通常共享的數(shù)據(jù)結(jié)構(gòu)(比如操作系統(tǒng)限定的應(yīng)用注冊(cè)表)中。另外,一些實(shí)施例提供了系統(tǒng)和用戶界面,其使得外部實(shí)體修飾參數(shù)并且從而配置組件的行為。圖11A中大體上描述了實(shí)施計(jì)算方法的軟件,其中用戶選擇操作參數(shù),以在計(jì)算機(jī)上執(zhí)行程序402,如本文先前所描述的,其中一個(gè)或多個(gè)序列被送入404,并且進(jìn)行替換408。系統(tǒng)可操作的以驗(yàn)證二級(jí)結(jié)構(gòu)408并且驗(yàn)證一個(gè)或多個(gè)變體的水溶性。如圖11B中顯示,除了先前描述的那些,程序可包括另外的處理選項(xiàng),其中可儲(chǔ)存一個(gè)或多個(gè)排序函數(shù)442,用戶可選擇或系統(tǒng)可自動(dòng)選擇444待使用的排序函數(shù)。然后,系統(tǒng)可產(chǎn)生如本文所描述的排序446,并且然后用戶可制備選擇的變體,以測(cè)量功能448,并且隨后輸入功能數(shù)據(jù),以基于其修飾處理序列450。結(jié)合下述實(shí)施例將更好地理解本發(fā)明,所述實(shí)施例期望僅僅作為闡釋而不限制本發(fā)明的范圍。本公開(kāi)實(shí)施方式的各種改變和改進(jìn)將對(duì)本領(lǐng)域技術(shù)人員的顯而易見(jiàn)的并且可進(jìn)行這種改變,而不背離本發(fā)明的精神和所附權(quán)利要求的范圍。實(shí)施例實(shí)施例1:CXC趨化因子受體4型同種型a(CXCR4):CXCR4是長(zhǎng)度356個(gè)氨基酸的趨化因子受體。其pI是約8.61和分子量是40221.19Da。文獻(xiàn)中公開(kāi)的CXCR4的序列是:MSIPLPLLQIYTSDNYTEEMGSGDYDSMKEPCFREENANFNKIFLPTIYSIIFLTGIVGNGLVILVMGYQKKLRSMTDKYRLHLSVADLLFVITLPFWAVDAVANWYFGNFLCKAVHVIYTVNLYSSVLILAFISLDRYLAIVHATNSQRPRKLLAEKVVYVGVWIPALLLTIPDFIFANVSEADDRYICDRFYPNDLWVVVFQFQHIMVGLILPGIVILSCYCIIISKLSHSKGHQKRKALKTTVILILAFFACWLPYYIGISIDSFILLEIIKQGCEFENTVHKWISITEALAFFHCCLNPILYAFLGAKFKTSAQHALTSVSRGSSLKILSKGKRGGHSSVSTESESSSFHSS(SEQIDNO.1)。序列進(jìn)行TMHMM使得鑒定如圖3中所描繪的跨膜結(jié)構(gòu)域。用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列:1MSIPLPLLQIYTSDNYTEEMGSGDYDSMKEPCFREENANFNKIFLPTTYSTTYQTGTTGN61GQTTQTMGYQKKLRSMTDKYRQHQSTADQQYTTTQPYWATDAVANWYFGNFLCKATHTTY121TTNQYSSTQTQAYTSQDRYLAIVHATNSQRPRKLLAEKTTYTGTWTPAQQQTTPDYTYAN181VSEADDRYICDRFYPNDLWVVVYQYQHTMTGQTQPGTTTQSCYCTIISKLSHSKGHQKRK241ALKTTTTQTQAYYACWQPYYTGTSTDSYILLEIIKQGCEFENTVHKWTSTTEAQAYYHCC301QNPTQYAYQGAKFKTSAQHALTSVSRGSSLKILSKGKRGGHSSVSTESESSSFHSS(SEQIDNO:2)。蛋白質(zhì)預(yù)測(cè)的pI是8.54和分子量是40551.64Da。每個(gè)預(yù)測(cè)的跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括跨膜結(jié)構(gòu)域,其包括SEQIDNO:2的氨基酸47-70(TM1),和包括其的蛋白質(zhì)。作為例子,圖3表示TM1序列的α-螺旋預(yù)測(cè)。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括SEQIDNO:2的一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文TM1的蛋白質(zhì)包括SEQIDNO:2中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如SEQIDNO:1中闡釋。將CXCR4的天然蛋白質(zhì)序列(N-末端氨基酸不同)第二次進(jìn)行方法。程序輸出將天然序列分成細(xì)胞外和細(xì)胞內(nèi)區(qū)域并且為每個(gè)跨膜結(jié)構(gòu)域選擇8個(gè)跨膜結(jié)構(gòu)域變體。結(jié)果闡釋在圖4和下述表中:MEGISIYTSDNYTEEMGSGDYDSMKEPCFREENANFNK(SEQIDNO.3;EC1)TM1變體:TM2變體:TM3變體:TM4變體:TM5變體:TM6變體:TM7變體AFLGAKFKTSAQHALTSVSRGSSLKILSKGKRGGHSSVSTESESSSFHSS(SEQIDNO.65;IC4).相信從上面清楚地,在跨膜結(jié)構(gòu)域變體的每列之前、之間和之后的序列(SEQIDNOs:3、12、21、30、39、48、57和65)分別是N’,中間的和C’細(xì)胞外和細(xì)胞內(nèi)區(qū)域。然后,上述序列用于產(chǎn)生編碼序列,如本領(lǐng)域已知的,適于在表達(dá)系統(tǒng),在該情況下在酵母中表達(dá)。然后,將編碼序列改組和表達(dá)以產(chǎn)生包括多個(gè)蛋白質(zhì)的文庫(kù),每個(gè)蛋白質(zhì)具有SEQIDNOs:3、12、21、30、39、48、57和65,其具有來(lái)自在各自的細(xì)胞內(nèi)和細(xì)胞外結(jié)構(gòu)域之間每個(gè)變體列表的一個(gè)跨膜結(jié)構(gòu)域變體。如此產(chǎn)生的文庫(kù)接著被測(cè)試在結(jié)合活酵母細(xì)胞內(nèi)側(cè)的酵母中表達(dá)的質(zhì)粒上的CXCR4關(guān)聯(lián)配體(cognateligand),SDF1a(或CCL12)。通過(guò)來(lái)自酵母2雜交系統(tǒng)的基因激活檢測(cè)配體結(jié)合并且接著對(duì)樣品測(cè)序。測(cè)序了19個(gè)CXCR4變體。結(jié)果顯示在圖5中。實(shí)施例2:CXC趨化因子受體3型同種型b(CX3CR1):CX3CR1是長(zhǎng)度為355個(gè)氨基酸的趨化因子受體。其pI是約6.74和分子量是40396.4Da。序列進(jìn)行TMHMM產(chǎn)生跨膜結(jié)構(gòu)域的鑒定。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行),與野生型(上行)對(duì)齊:蛋白質(zhì)變體的預(yù)測(cè)pI是6.74和分子量是41027.17Da。每個(gè)預(yù)測(cè)的跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括這樣的跨膜結(jié)構(gòu)域,其包括SEQIDNO:67加下劃線的氨基酸。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括SEQIDNO:66的一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括SEQIDNO:67中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然V、L、I和F氨基酸的同源序列,如SEQIDNO:66中闡釋。將CX3CR1的天然蛋白質(zhì)序列進(jìn)行方法第二次。程序輸出將天然序列分成細(xì)胞外和細(xì)胞內(nèi)區(qū)域并且為每個(gè)跨膜結(jié)構(gòu)域選擇8個(gè)跨膜結(jié)構(gòu)域變體。結(jié)果闡釋在下述表中:MDQFPESVTENFEYDDLAEACYIGDIVVFGT(SEQIDNO.68)TM1變體:TM2變體TM3變體YTTAYYYTGYYGSTYYTTTTST(SEQIDNO.87)DRYLAIVLAANSMNNRT(SEQIDNO.88)TM4變體:TM5變體:TM6變體:TM7變體:EKFRRYLYHLYGKCLAVLCGRSVHVDFSSSESQRSRHGSVLSSNFTYHTSDGDALLLL(SEQIDNO.124)。如在以上實(shí)施例1中,跨膜結(jié)構(gòu)域變體的每列之前、之間和之后的序列分別是N’、中間和C’細(xì)胞內(nèi)或細(xì)胞外區(qū)域。然后,上述序列用于產(chǎn)生編碼序列,如本領(lǐng)域已知的,適于在表達(dá)系統(tǒng),在該情況下在酵母中表達(dá)。然后,將編碼序列改組和表達(dá)以產(chǎn)生包括多個(gè)蛋白質(zhì)的文庫(kù),每個(gè)蛋白質(zhì)具有SEQIDNOs:68、77、86、88、97、106和115,其具有來(lái)自在各自的細(xì)胞內(nèi)和細(xì)胞外結(jié)構(gòu)域之間每個(gè)變體列表的一個(gè)跨膜結(jié)構(gòu)域變體。如此產(chǎn)生的文庫(kù)接著被測(cè)試在水性媒介中CX3CR1關(guān)聯(lián)配體結(jié)合,如在實(shí)施例1中描述。檢測(cè)配體結(jié)合和接著對(duì)樣品測(cè)序。對(duì)七個(gè)變體測(cè)序。結(jié)果顯示在圖6中。實(shí)施例3:CCR3變體為趨化因子受體3型同種型3重復(fù)實(shí)施例1的方法。名稱pIMW(Da)WT8.8743122.3MT8.7843531.64在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行),與野生型(上行)對(duì)齊:每個(gè)預(yù)測(cè)的跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括這樣的跨膜結(jié)構(gòu)域,其包括SEQIDNO:126加下劃線的氨基酸。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括SEQIDNO:126的一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括SEQIDNO:126中的一個(gè)或多個(gè)另外的跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然V、L、I和F氨基酸的同源序列,如在SEQIDNO:125中闡釋。對(duì)CCR3的天然蛋白質(zhì)序列進(jìn)行方法第二次(注意N末端序列的不同)。程序輸出將天然序列分成細(xì)胞外和細(xì)胞內(nèi)區(qū)域并且為每個(gè)跨膜結(jié)構(gòu)域選擇8個(gè)跨膜結(jié)構(gòu)域變體。結(jié)果闡釋在下述表中:MTTSLDTVETFGTTSYYDDVGLLCEKADTRALMA(SEQIDNO.127)TM1變體:TM2變體:TM3變體:TM4變體:TM5變體:TM7變體:ERFRKYLRHFFHRHLLMHLGRYIPFLPSEKLERTSSVSPSTAEPELSIVF(SEQIDNO:183)。如在以上實(shí)施例1中,跨膜結(jié)構(gòu)域變體的每列之前、之間和之后的序列分別是N’、中間和C’細(xì)胞內(nèi)或細(xì)胞外區(qū)域。然后,上述序列用于產(chǎn)生編碼序列,如本領(lǐng)域已知的,適于在表達(dá)系統(tǒng),在該情況下在酵母中表達(dá)。然后,將編碼序列改組和表達(dá)以產(chǎn)生包括多個(gè)蛋白質(zhì)的文庫(kù),每個(gè)蛋白質(zhì)具有SEQIDNOs:127、136、145、154、163、172、174和183,其具有來(lái)自在各自的細(xì)胞內(nèi)和細(xì)胞外結(jié)構(gòu)域之間每個(gè)變體列表的一個(gè)跨膜結(jié)構(gòu)域變體。如此產(chǎn)生的文庫(kù)接著在水性媒介中被測(cè)試CCR3關(guān)聯(lián)配體CCL3結(jié)合,如在實(shí)施例1中描述。檢測(cè)配體結(jié)合和接著對(duì)樣品測(cè)序。測(cè)序了11個(gè)變體。結(jié)果顯示在圖7中。實(shí)施例4:CCR5變體為趨化因子受體5型同種型3重復(fù)實(shí)施例1的方法。名稱pIMW(Da)WT9.2140524.05MT9.0641058.3在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行),與野生型(上行)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括這樣的跨膜結(jié)構(gòu)域,其包括SEQIDNO:185加下劃線的氨基酸。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括SEQIDNO:185的一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括SEQIDNO:185中的一個(gè)或多個(gè)另外的跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然V、L、I和F氨基酸的同源序列,如在SEQIDNO:184中闡釋。為CCR5的天然蛋白質(zhì)序列進(jìn)行方法第二次(注意N末端序列的不同)。程序輸出將天然序列分成細(xì)胞外和細(xì)胞內(nèi)區(qū)域,并且為每個(gè)跨膜結(jié)構(gòu)域選擇8個(gè)跨膜結(jié)構(gòu)域變體。結(jié)果闡釋在下述表中:MDYQVSSPIYDINYYTSEPCQKINVKQIAA(SEQIDNO.186)TM1變體:TM2變體:TM3變體:QQTGQYFTGYYSGTYYTTQQTT(SEQIDNO.205)QQTGQYYTGYYSGTYYTTQQTT(SEQIDNO.206)DRYLAVVHAVFALKART(SEQIDNO.207)TM4變體:TTYGTTTSTTTWTTATYASQPGTTY(SEQIDNO.208)TRSQKEGLHYTCSSHFPYSQYQFWKNFQTLKI(SEQIDNO.209)TM5變體:TM6變體:TM7變體:EKFRNYLLVFFQKHIAKRFCKCCSIFQQEAPERASSVYTRSTGEQEISVGL(SEQIDNO.235)。如在以上實(shí)施例1中,跨膜結(jié)構(gòu)域變體的每個(gè)列表之前、之間和之后的序列分別是N’、中間和C’細(xì)胞內(nèi)或細(xì)胞外區(qū)域。然后,上述序列用于產(chǎn)生編碼序列,如本領(lǐng)域已知的,適于在表達(dá)系統(tǒng),在該情況下在酵母中表達(dá)。然后,將編碼序列改組和表達(dá)以產(chǎn)生包括多個(gè)蛋白質(zhì)的文庫(kù),每個(gè)蛋白質(zhì)具有SEQIDNOs:186、195、204、207、209、218、226和235,其具有來(lái)自在各自的細(xì)胞內(nèi)和細(xì)胞外結(jié)構(gòu)域之間每個(gè)變體列表的一個(gè)跨膜結(jié)構(gòu)域變體。如此產(chǎn)生的文庫(kù)接著在水性媒介中被測(cè)試CCR5關(guān)聯(lián)配體CCL5結(jié)合,如在實(shí)施例1中描述。檢測(cè)配體結(jié)合和接著對(duì)樣品測(cè)序。測(cè)序了1個(gè)變體。結(jié)果顯示在圖8中。實(shí)施例5:CXCR3變體對(duì)CXC趨化因子受體3型同種型2重復(fù)實(shí)施例1的方法。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(SEQIDNO:325,下行),與野生型(SEQIDNO:324,上行)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括SEQIDNO:325中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然V、L、I和F氨基酸的同源序列,如在SEQIDNO:324中闡釋。如上所討論,對(duì)CXCR3的天然蛋白質(zhì)序列進(jìn)行所述方法。程序輸出將天然序列分成細(xì)胞外和細(xì)胞內(nèi)區(qū)域并且為每個(gè)跨膜結(jié)構(gòu)域選擇8個(gè)跨膜結(jié)構(gòu)域變體。結(jié)果闡釋在下述表中:MVLEVSDHQVLNDAEVAALLENFSSSYDYGENESDSCCTSPPCPQDFSLNFDR(SEQIDNO.235)TM1變體:TM2變體:TM3變體:TM4變體:TM5變體:TAQRTQQQTAGYQQPQQTMAY(SEQIDNO.:272)CYAHILAVLLVSRGQRRLRAMR(SEQIDNO.:273)TM6變體:TM7變體:GVKFRERMWMLLLRLGCPNQRGLQRQPSSSRRDSSWSETSEASYSGL(SEQIDNO.:291)。上述序列可用于產(chǎn)生編碼序列,如本領(lǐng)域已知的,適于在表達(dá)系統(tǒng),在該情況下在酵母中表達(dá)。然后,將編碼序列改組和表達(dá)以產(chǎn)生包括多個(gè)蛋白質(zhì)的文庫(kù),每個(gè)蛋白質(zhì)具有細(xì)胞內(nèi)和細(xì)胞外環(huán),其具有來(lái)自在各自的細(xì)胞內(nèi)和細(xì)胞外結(jié)構(gòu)域之間每個(gè)變體列表的一個(gè)跨膜結(jié)構(gòu)域變體。如此產(chǎn)生的文庫(kù)可接著在水性媒介中測(cè)試關(guān)聯(lián)配體結(jié)合,如在實(shí)施例1中描述。實(shí)施例6:CCR-1C-C趨化因子受體1型為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。名稱pIMW(Da)WT8.3841172.64MT8.3141583.78在跨膜結(jié)構(gòu)域中,用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:293),與野生型(上行SEQIDNO:292)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然V、L、I和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)。可測(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例7:CCR-2C-C趨化因子受體2型同種型A為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換的每個(gè)疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:295),與野生型(上行SEQIDNO:294)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然V、L、I和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例8:CCR-4C-C趨化因子受體4型為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:297),與野生型(上行SEQIDNO:296)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然V、L、I和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述。可設(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例9:CCR-6C-C趨化因子受體6型為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:299),與野生型(上行SEQIDNO:298)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可如上所討論進(jìn)行方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例10:CCR-7C-C趨化因子受體7型前體為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:301),與野生型(上行SEQIDNO:300)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例11:CCR-8C-C趨化因子受體8型為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO.:303),與野生型(上行SEQIDNO.302)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)。可測(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例12:CCR-9C-C趨化因子受體9型同種型B為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:305),與野生型(上行SEQIDNO:304)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)。可測(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例13:CCR-10C-C趨化因子受體10型為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換每個(gè)疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:307),與野生型(上行SEQIDNO:306)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述。可設(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例14:CXCR1趨化因子受體1型為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:309),與野生型(上行SEQIDNO:308)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例15:CXR趨化因子受體1CXR1為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換每個(gè)疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:311),與野生型(上行SEQIDNO:310)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然V、L、I和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)。可測(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例16:CXCR2趨化因子受體2型為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:313),與野生型(上行SEQIDNO:312)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例17:CCR-10C-C趨化因子受體10型為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換每個(gè)疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:315),與野生型(上行SEQIDNO:314)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例18:CXCR6趨化因子受體6型為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換每個(gè)疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:317),與野生型(上行SEQIDNO:316)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(已經(jīng)加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì),其包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行的如上所討論方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例19:CXCR7趨化因子受體7型為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:319),與野生型(上行SEQIDNO:318)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行的如上所討論方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)。可測(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例20:CLR-1a趨化因子樣受體1同種型a為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換所有或基本上所有的疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:321),與野生型(上行SEQIDNO:320)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(已經(jīng)加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例21:DARIADuffy抗原/趨化因子受體同種型a為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換每個(gè)疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:323),與野生型(上行SEQIDNO:322)對(duì)齊:每個(gè)預(yù)測(cè)跨膜區(qū)已經(jīng)加下劃線并且例證了本發(fā)明充分修飾的結(jié)構(gòu)域。因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)加下劃線的結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然L、I、V和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述??稍O(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例22:CD81抗原CD81可在調(diào)節(jié)淋巴瘤細(xì)胞生長(zhǎng)中起到重要的作用并且與16kDaLeu-13蛋白質(zhì)相互作用而形成可能參與信號(hào)轉(zhuǎn)導(dǎo)的復(fù)合物。CD81可用作HCV的病毒受體。為標(biāo)題蛋白質(zhì)重復(fù)實(shí)施例1。在跨膜結(jié)構(gòu)域中用Q、T和Y(分別)替換每個(gè)疏水氨基酸L、I、V和F產(chǎn)生下述序列(下行SEQIDNO:325),與野生型(上行SEQIDNO:324)對(duì)齊:預(yù)測(cè)的跨膜區(qū)例證了本發(fā)明的修飾結(jié)構(gòu)域并且包括(分別SEQIDNOs:326、327、328、329、330、331、332、333):因此,例如,本發(fā)明包括的跨膜結(jié)構(gòu)域包括每個(gè)修飾的或“mt”結(jié)構(gòu)域。優(yōu)選地,包括本文的TM1的蛋白質(zhì)包括一個(gè)或多個(gè)(例如,所有的)細(xì)胞外和細(xì)胞內(nèi)環(huán)序列(還未加下劃線的序列)。另外或可選地,包括本文的TM1的蛋白質(zhì)包括描述的蛋白質(zhì)中的一個(gè)或多個(gè)另外跨膜區(qū)(加下劃線的序列)或保留一個(gè)、兩個(gè)、三個(gè)或可能四個(gè)或更多個(gè)天然V、L、I和F氨基酸的同源序列,如在野生型序列中闡釋。野生型序列可進(jìn)行如上所討論的方法,以選擇另外的跨膜結(jié)構(gòu)域變體,如在實(shí)施例1中描述。可設(shè)計(jì)、改組編碼序列并且表達(dá)蛋白質(zhì)??蓽y(cè)試表達(dá)的蛋白質(zhì)的配體結(jié)合,如本文所描述。實(shí)施例23:QTY變體和CXCR4-QTY變體的大腸桿菌表達(dá)1.在大腸桿菌BL21(DE3)中大規(guī)模產(chǎn)生CXCR4-QTY在大腸桿菌中產(chǎn)生水溶性GPCRCXCR4,產(chǎn)率評(píng)估為~20mg純化蛋白每升常規(guī)LB培養(yǎng)基。評(píng)估的生產(chǎn)費(fèi)用是約$0.25每毫克。有利地,該方法可用于容易獲得克數(shù)量的水溶性GPCR,其接著可利于它們的結(jié)構(gòu)確定。2.確定大腸桿菌細(xì)胞中在哪兒產(chǎn)生水溶性CXCR4-QTY將水溶性CXCR4-QTY克隆至pET載體。我們首先進(jìn)行小規(guī)模的大腸桿菌培養(yǎng)研究,以評(píng)估產(chǎn)生的CXCR4-QTY蛋白的位置(150ml培養(yǎng)基)。培養(yǎng)細(xì)胞之后,用IPTG在24℃下誘導(dǎo)4小時(shí),我們收集和超聲細(xì)胞并且通過(guò)在14,637xg(12,000rmp)下離心分成2個(gè)部分。我們接著使用特異性抗rho-標(biāo)簽單克隆抗體的蛋白質(zhì)印跡分析,以檢測(cè)CXCR4-QTY蛋白在哪里。我們觀察到CXCR4-QTY蛋白在上清液部分中并且在小球部分中未觀察到蛋白質(zhì),因此提示蛋白質(zhì)是完全水溶性的。3.大腸桿菌細(xì)胞的可溶性部分中產(chǎn)生的評(píng)估的產(chǎn)率CXCR4-QTY我們接著進(jìn)行另一150ml培養(yǎng)并且獲得~6mg1D4單克隆抗體-純化的CXCR4-QTY。因?yàn)槲覀兊凸懒水a(chǎn)率(我們未預(yù)料到令人吃驚的高產(chǎn)率),我們未使用足夠的親和性1D4rho-標(biāo)簽單克隆抗體磁珠(bead)捕獲產(chǎn)生的CXCR4-QTY。因此,大量的CXCR4-QTY蛋白由于純化期間未添加足夠的磁珠而未與磁珠結(jié)合,并且蛋白質(zhì)在流過(guò)泳道(flow-throughlane)中,并且被進(jìn)一步洗掉。盡管損失嚴(yán)重,但是對(duì)于150ml培養(yǎng)物,我們?nèi)阅軌颢@得~6mg,如從泳道8-10可見(jiàn)(洗脫部分)。4.測(cè)量純化的水溶性CXCR4-QTY蛋白的熱穩(wěn)定性在大部分情況下,結(jié)構(gòu)決定蛋白質(zhì)的功能。因此,知道大腸桿菌中產(chǎn)生的純化的CXCR4-QTY蛋白是否仍以典型的α–螺旋結(jié)構(gòu)以~50%的α-螺旋正確折疊是重要的。我們使用圓二色譜(CD)進(jìn)行了二級(jí)結(jié)構(gòu)測(cè)量。我們觀察到了純化的CXCR4-QTY蛋白在各種溫度下的CD光譜。我們測(cè)量了純化的CXCR4-QTY蛋白的熱穩(wěn)定性。我們觀察到純化的CXCR4-QTY蛋白在高達(dá)55℃是相對(duì)穩(wěn)定的,蛋白質(zhì)僅僅部分和逐漸變性,CD信號(hào)下降是~15%。在55℃和65℃之間,至65℃變性增加,在65℃和75℃之間出現(xiàn)變性轉(zhuǎn)變并且在75℃蛋白質(zhì)幾乎完全變性。我們將溫度與橢圓率在222nm下繪圖,以獲得純化的水溶性CXCR4-QTY蛋白的解鏈溫度(Tm)。從該圖,我們?cè)u(píng)估了純化的CXCR4-QTY蛋白的Tm是~67℃。該Tm提示純化的水溶性CXCR4-QTY蛋白與許多其他可溶性蛋白相比相當(dāng)穩(wěn)定。該熱穩(wěn)定性特征促進(jìn)了獲得衍射晶體,因?yàn)橐阎獰岱€(wěn)定性越好,晶格填充越好,并且因此獲得結(jié)構(gòu)的機(jī)會(huì)越好。5.另外的G蛋白偶聯(lián)受體使用Zhang等,WaterSolubleMembraneProteinsandMethodsforthePreparationandUseThereof,美國(guó)專利公開(kāi)號(hào)2012/0252719A("Zhang")描述的QTY方法,我們選擇了10種G蛋白偶聯(lián)受體(GPCR)來(lái)設(shè)計(jì)水溶性形式??蛇x地,可以選擇本文所述的蛋白質(zhì)。6.基因的分子克隆。我們?cè)跓o(wú)細(xì)胞蛋白質(zhì)表達(dá)質(zhì)粒載體pIVex2.3d和大腸桿菌pET28a和pET-duet-1質(zhì)粒載體中成功確認(rèn)了天然GPCR和QTY基因。7.水溶性GPCR產(chǎn)生我們已經(jīng)產(chǎn)生了數(shù)個(gè)天然和QTY蛋白。當(dāng)在無(wú)細(xì)胞系統(tǒng)中產(chǎn)生天然GPCR時(shí),需要凈化劑Brij35,沒(méi)有凈化劑的情況下,當(dāng)生產(chǎn)時(shí)蛋白質(zhì)沉淀。另一方面,我們?cè)诖嬖诤蜎](méi)有凈化劑的情況下測(cè)試了QTY變體。在沒(méi)有凈化劑的情況下,無(wú)細(xì)胞系統(tǒng)產(chǎn)生可溶性蛋白質(zhì)。我們將QTY變體克隆至大腸桿菌體內(nèi)表達(dá)系統(tǒng),pET28a和pET-duet-1質(zhì)粒載體,其用于在大腸桿菌BL21(DE3)菌株中的大腸桿菌細(xì)胞蛋白質(zhì)產(chǎn)生。我們已經(jīng)純化了數(shù)種水溶性GPCR蛋白,包括CXCR4和CCR5,我們已經(jīng)將其用于二級(jí)結(jié)構(gòu)分析。我們利用其天然配體CCL12(SDF1a),已經(jīng)進(jìn)行了CXCR4的配體結(jié)合研究。我們進(jìn)行了大腸桿菌產(chǎn)生和水溶性GPCRCCR5e變體的純化。CCR5e變體具有58個(gè)氨基酸改變(~18%改變)。使用特異性單克隆抗體視紫紅質(zhì)標(biāo)簽,水溶性GPCRCCR5e變體被純化至均勻。藍(lán)色染色在指示純度的SDS凝膠上顯示單條帶。從蛋白質(zhì)尺寸標(biāo)記物評(píng)估,其好像是純的同二聚體(結(jié)合天然膜的CXCR4晶體結(jié)構(gòu)是二聚體。蛋白質(zhì)印記確認(rèn)了CCR5e變體的單體和同二聚體在GPCR中是常見(jiàn)的。8.QTYCCR5e二級(jí)結(jié)構(gòu)研究。我們獲得了水溶性GPCRCCR5e的QTY變體。接著,我們使用Aviv模型410圓二色譜工具進(jìn)行了二級(jí)結(jié)構(gòu)分析,并且確認(rèn)了GPCRQTYCCR5-e變體具有典型的α-螺旋結(jié)構(gòu)。我們也在各種溫度下進(jìn)行了試驗(yàn),以確定CCR5e變體Tm,即,水溶性CCR5e變體的熱穩(wěn)定性。由實(shí)驗(yàn),我們確定了CCR5e變體的Tm是約46℃。該Tm對(duì)于晶體篩選實(shí)驗(yàn)是良好的。9.CXCR4與CCL12(SDF1a)的配體結(jié)合研究。為了確定設(shè)計(jì)的水溶性QTYGPCR仍保持它們的生物功能,即識(shí)別和結(jié)合它們的天然配體,我們首先使用ELISA測(cè)量,以研究水溶性CXCR4與其天然配體CCL12(也稱為SDF1a)。試驗(yàn)濃度范圍是50nM至10μM。測(cè)量的Kd是~80nM。結(jié)合天然膜的CXCR4與SDF1a的Kd是約100nM。因此,水溶性CXCR4的Kd在可接受的范圍內(nèi)。使用更靈敏的SPR或其他測(cè)量的進(jìn)一步實(shí)驗(yàn)可產(chǎn)生更精確的Kd。盡管已經(jīng)參考了優(yōu)選的實(shí)施方式具體顯示和描述了本發(fā)明,但是本領(lǐng)域技術(shù)人員應(yīng)理解,可對(duì)形式和細(xì)節(jié)上做出各種改變而不背離由所附的權(quán)利要求所包括的本發(fā)明的范圍。當(dāng)前第1頁(yè)1 2 3