專(zhuān)利名稱(chēng)::環(huán)肽結(jié)構(gòu)的穩(wěn)定的制作方法環(huán)肽結(jié)構(gòu)的穩(wěn)定背景功能基因組分析方面的進(jìn)步提供了增強(qiáng)我們?cè)u(píng)估蛋白治療前景的能力的數(shù)據(jù)集。但是,單獨(dú)的功能基因組數(shù)據(jù)在任何單一蛋白對(duì)疾病或過(guò)程的貢獻(xiàn)方面生成相對(duì)低質(zhì)量的信息。為了獲得蛋白的治療前景的更可靠結(jié)論,有必要為功能基因組數(shù)據(jù)補(bǔ)充直接實(shí)驗(yàn)。進(jìn)行直接實(shí)驗(yàn)方面主要的瓶頸為缺乏用于逆向分析蛋白功能的高通量技術(shù)。在逆向分析中,研究者以假定與疾病或過(guò)程有關(guān)的基因開(kāi)始,并采用直接實(shí)驗(yàn)來(lái)證實(shí)這種相關(guān)性。生物體中,直接實(shí)驗(yàn)一直是依賴(lài)于使基因失活的遺傳學(xué)方法,其或者通過(guò)刪除基因,或者通過(guò)制造基因中的功能缺失突變。盡管遺傳學(xué)方法提供大量信息,但是它們通常難于大規(guī)模和在多種生物體中進(jìn)行。已經(jīng)開(kāi)發(fā)出了諸如小分子、反義RNA、核酶、RNAi、抗體的反式顯性試齊寸(7hmsdominantagent)和顯性負(fù)性(dominantnegative)蛋白,使得能更容易地在雙倍體生物體中進(jìn)行逆向分析(Geyer,CR.&Brent,R.(2000)MethodsEnzymol.328:178-208)。這些試劑使基因產(chǎn)物失活而不改變編碼它們的遺傳物質(zhì)。除了顯性作用模式外,蛋白功能的系統(tǒng)逆向分析要求試劑可針對(duì)任何給定靶而容易地和快速地產(chǎn)生、可抑制蛋白相互作用和活性以及可阻斷與蛋白的特異相互作用而保持其它相互作用不被干擾。為了證實(shí)以小分子藥物抑制靶點(diǎn)的治療前景,也必需以直接抑制靶點(diǎn)而不是阻斷靶點(diǎn)轉(zhuǎn)錄或翻譯中的步驟的試劑進(jìn)行逆向分析。可采用酵母雙雜交測(cè)定法通過(guò)從肽適體組合文庫(kù)中遺傳學(xué)地選擇構(gòu)象上受限的(conformationallyconstrained)支架肽(scaffoldedpeptide)(肽適體)而快速得到具有這些特征的細(xì)胞內(nèi)蛋白功能抑制劑(Geyer,CR.&Brent,R.(2000)MethodsEnzymol.328:178-208)。受限肽是優(yōu)選的,因?yàn)樗鼈兺ǔ1染€(xiàn)性肽結(jié)合更緊并且更穩(wěn)定(Davidson,A.R.8&Sauer,R.T.(1994)Proc.Natl.Acad.Sci.USA91:2146-2150)。肽適體組合文庫(kù)應(yīng)該原則上含有結(jié)合任何耙點(diǎn)的成員。支架蛋白增強(qiáng)溶解性并允許轉(zhuǎn)錄激活結(jié)構(gòu)域與肽適體融合,這對(duì)于酵母雙雜交測(cè)定是必需的。肽適體在證實(shí)蛋白為治療性靶點(diǎn)方面是有用的,但是將肽展示在支架表面限制了它們作為藥物或先導(dǎo)藥物(drug-leads)的用途,因?yàn)樗鼈兺ǔ2皇悄た赏ㄍ傅牟⑶宜鼈內(nèi)菀妆坏鞍酌附到?。支架蛋白的大小也阻礙了通過(guò)合成肽化學(xué)來(lái)合成肽適體并使得解析其結(jié)構(gòu)困難。可選擇地,肽可通過(guò)環(huán)化而受限,并且有^f艮多天然和合成環(huán)肽抑制劑的實(shí)例(Horswill,A.R.&Benkovic,S,J.(2005)CellCycle4:552-555)。最近,已經(jīng)開(kāi)發(fā)了采用經(jīng)工程化的蛋白內(nèi)含子(intein)表達(dá)基因編碼的環(huán)肽的方法(Scott,CP.a/.(1999)Proc.Natl.Acad.Sci.USA96:13638-13643)。環(huán)肽比肽適體有優(yōu)勢(shì),因?yàn)樗鼈兛雇馇械鞍酌?,并且它們的小尺寸使它們適合于化學(xué)合成、結(jié)構(gòu)研究和膜轉(zhuǎn)運(yùn)。已經(jīng)采用正向和逆向方法篩選了環(huán)肽組合文庫(kù),來(lái)分別分離抑制細(xì)胞過(guò)程(Kinsella,T.M.etal.(2002)J.Biol,Chem.277:37512-37518,Nilsson,L.O.etal.(2005)ProteinPept.Lett.12:795畫(huà)799)和破壞蛋白相互作用(Horswill,A.R.etal.(2004)Proc.Natl.Acad.Sci.USA101:15591-15596)的環(huán)肽??贵w為非環(huán)狀蛋白,所述非環(huán)狀蛋白具有被良好表征的結(jié)構(gòu),其由具有可識(shí)別的三級(jí)結(jié)構(gòu)的多個(gè)結(jié)構(gòu)域構(gòu)成。抗體分子中的每個(gè)結(jié)構(gòu)域都具有類(lèi)似的結(jié)構(gòu),即在壓縮的反平行P桶中兩P片層彼此緊密地疊在一起。這種保守的結(jié)構(gòu)稱(chēng)為免疫球蛋白折疊。這種折疊通常通過(guò)每個(gè)片層的p鏈之間的氫鍵、通過(guò)內(nèi)部相對(duì)片層的殘基之間的疏水鍵以及通過(guò)片層間的二碌"定穩(wěn)定??勺兘Y(jié)構(gòu)域的折疊具有9個(gè)(3鏈,設(shè)置為4鏈和5鏈的兩片層。每個(gè)可變區(qū)是由通過(guò)4個(gè)框架區(qū)(FR)分開(kāi)的3個(gè)互補(bǔ)決定區(qū)(CDR)構(gòu)成。CDR為可變區(qū)的最可變部分,并執(zhí)行抗原結(jié)合功能。已經(jīng)顯示結(jié)合抗原的功能也可通過(guò)完整抗體的片段進(jìn)行。結(jié)合片段實(shí)例為(i)由VL、VH、CL和CH1結(jié)構(gòu)域構(gòu)成的Fab片段;(ii)由VH和CH1結(jié)構(gòu)域構(gòu)成的Fd片段;(iii)由抗體的單臂的VL和VH結(jié)構(gòu)域構(gòu)成的Fv片段;(iv)dAb片段(Ward,E.S.etal.,Nature341,544-546(1989),其由VH結(jié)構(gòu)域構(gòu)成;(v)分離的CDR區(qū);以及(vi)F(ab').sub.2片段,包含通過(guò)鉸鏈區(qū)二硫化物橋連接的兩Fab片段的二價(jià)片段。盡管Fv片段的兩結(jié)構(gòu)域是由不同基因編碼的,但是證實(shí)通過(guò)重組方法生成合成的接頭使它們作為單鏈蛋白被產(chǎn)生也是可能的(稱(chēng)為單鏈Fv(scFv);Bird,R.E.etal.,Science242,423-426(1988)Huston,J.S.etal.,Proc.Natl.Acad.Sci,USA85,5879-5883(1988))。概述本發(fā)明的一方面公開(kāi)了遺傳測(cè)定法,其可被用于采用酵母雙雜交相互作用陷阱(Gyuris,J.etal.(1993)Cell75:791-803)分離與扭蛋白相互作用的肽套索(peptidelariat)。套索由帶有共價(jià)連接的轉(zhuǎn)錄激活結(jié)構(gòu)域的環(huán)肽或"絞索(noose)"區(qū)構(gòu)成。通過(guò)改造蛋白內(nèi)含子環(huán)肽產(chǎn)生系統(tǒng)(Scott,CP.etal.(1999)Proc.Natl.Acad.Sci.USA96:13638國(guó)13643)以將環(huán)肽反應(yīng)停止在中間步驟(這產(chǎn)生含有通過(guò)酰胺鍵與內(nèi)酯環(huán)化肽共價(jià)結(jié)合的轉(zhuǎn)錄激活結(jié)構(gòu)域的套索),本發(fā)明提供適合于酵母雙雜交系統(tǒng)的套索?;诮g索序列的套索肽或環(huán)肽可被用于研究蛋白靶點(diǎn)的功能或證實(shí)蛋白耙點(diǎn)的治療前景。在一個(gè)具體的實(shí)施方案中,本發(fā)明通過(guò)產(chǎn)生細(xì)菌阻遏蛋白LexA的抑制劑例證了前述方法的可行性。LexA代表了推定的抗菌靶點(diǎn),當(dāng)被抑制時(shí)會(huì)增強(qiáng)細(xì)胞毒性抗生素的活性。當(dāng)LexA被活化的RecA結(jié)合時(shí),其經(jīng)歷自體蛋白水解而不再抑制其調(diào)節(jié)子中的基因(Lin,LL.&Little,J.W.(1988)Bacteriol.170:2163-2173)。阻斷自體蛋白水解的LexA突變體(Walker,G.C.(1984)Microbiol.Rev.48:60-93)使得細(xì)菌對(duì)諸如DNA損傷試劑絲裂霉素C(MMC)的化合物誘導(dǎo)的壓力更敏感(Lin,L丄.&Little,J.W.(1988)Bacteriol.170:2163-2173),并且它們降低抗生素抗性(Cirz,R.T.etal.(2005)PLoSBiol.3:el76,Miller,C.etal.(2004)Science305:1629-1631)。阻斷自體蛋白水解的LexA抑制劑將增強(qiáng)細(xì)菌對(duì)細(xì)胞毒性試劑的敏感性,并且由于LexA不存在于人中,其將不會(huì)對(duì)宿主DNA損傷修復(fù)系統(tǒng)有影響。本發(fā)明的不同實(shí)施方案利用了包含與核酸分子可操作地連接的宿主可操作啟動(dòng)子的載體,該核酸分子按順序包含活性結(jié)構(gòu)域、經(jīng)修飾的C-蛋白內(nèi)含子結(jié)構(gòu)域、插入序列、經(jīng)修飾的N-蛋白內(nèi)含子和轉(zhuǎn)錄終止序列。在一些實(shí)施方案中,提供了包含與與核酸分子可操作地連接的宿主可操作啟動(dòng)子的經(jīng)修飾蛋白內(nèi)含子套索文庫(kù),該核酸分子按順序包含活性結(jié)構(gòu)域、經(jīng)修飾的C-蛋白內(nèi)含子、在其中插入了隨機(jī)肽或抗體單鏈可變片段(ScFv)編碼寡核苷酸或隨機(jī)基因組片段的插入序列、經(jīng)修飾的N-蛋白內(nèi)含子和轉(zhuǎn)錄終止序列。這里,ScFv指由通過(guò)短接頭結(jié)合在一起的重(H)和輕(L)鏈的免疫球蛋白可變(V)結(jié)構(gòu)域構(gòu)成的抗體片段(Tanaka,T.etal.(2003)Nucl.AcidsRes.31:e23)。可構(gòu)建新的ScFv,其含有來(lái)自所選輕鏈和重鏈可變結(jié)構(gòu)域的特定框架區(qū),以及含有隨機(jī)互補(bǔ)決定區(qū)??蛇x擇地,采用RT-PCR從純化自外周血B淋巴細(xì)胞的總RNA擴(kuò)增輕鏈和重鏈可變結(jié)構(gòu)域,可產(chǎn)生免疫和非免疫ScFv文庫(kù)。該免疫文庫(kù)可從以特定抗原攻擊的動(dòng)物或從具有特定疾病的動(dòng)物產(chǎn)生?;蚪M片段指源于基因組DNA或cDNA的隨機(jī)或理性產(chǎn)生的DNA片^殳。在可選擇實(shí)施方案中,提供了鑒定與靶分子相互作用的環(huán)狀肽、ScFv或基因組片段的方法。這些方法例如可在宿主生物體中進(jìn)行,所述方法包括(i)將上述經(jīng)修飾的蛋白內(nèi)含子文庫(kù)轉(zhuǎn)化進(jìn)適合的宿主或宿主細(xì)胞或細(xì)胞系;(ii)以編碼連接至第二活性結(jié)構(gòu)域的靶分子的核酸分子轉(zhuǎn)化所述宿主或宿主細(xì)胞或細(xì)胞系,所述第二活性結(jié)構(gòu)域被設(shè)置為在所述宿主中表達(dá);(iii)鑒定包含可檢測(cè)產(chǎn)物的宿主細(xì)胞,所述產(chǎn)物是通過(guò)蛋白內(nèi)含子文庫(kù)成員和靶分子之間的相互作用使活性結(jié)構(gòu)域在一起而產(chǎn)生的;以及(iv)從表達(dá)可檢測(cè)產(chǎn)物的宿主細(xì)胞回收所述文庫(kù)成員并對(duì)隨機(jī)肽、ScFv或基因組片段編碼寡核苷酸測(cè)序。已經(jīng)報(bào)道了很多檢測(cè)細(xì)胞內(nèi)蛋白相互作用的測(cè)定法,包括雙雜交系統(tǒng)(在VidalM.&LegrainP.(1999)Nucl.AcidRes.27:919中所綜述的)、斷裂泛素系統(tǒng)(Stagljaretal.,(1998)Proc.Natl.Acad.Sci.USA95:5187)、蛋白片段互補(bǔ)測(cè)定法(RemyI.&MichnickS.W,(1999)Proc.Natl.Acad.Sci.USA96:5394)、阻遏物重建測(cè)定法(Hirstetal.,(2001)Proc.Natl.Acad.Sci.USA98:8726),以及SOS募集系統(tǒng)(Broderetal.,(1998)Curr.Biol.8:1121)。這些測(cè)定法的任一種或未列出的采用報(bào)告基因/蛋白在細(xì)胞中檢測(cè)蛋白相互作用的類(lèi)似測(cè)定法可被用于分離與蛋白靶相互作用的環(huán)狀肽、基因組片段或ScFv。可選擇地,已經(jīng)報(bào)道了很多將編碼蛋白的DNA與表達(dá)的蛋白偶聯(lián)的測(cè)定法,包括噬菌體展示(Smith,G.P.(1985)Science228:1315)、細(xì)菌展示(Francisco,etal"(1993)Proc.Natl.Acad.Sci.USA卯:10444),以及酵母展示(Boder,E.T.Wittrup,K.D.(1997)Nat.Biotech.15:553)。已經(jīng)開(kāi)發(fā)了其它的涉及無(wú)細(xì)胞蛋白表達(dá)的測(cè)定法,用于將編碼蛋白的RNA與表達(dá)的蛋白偶聯(lián),包括核糖體展示(Mattheakis,etal"(1994)Proc.Nat.Acad.Sci.USA91:卯22)和mRNA展示(Roberts,R.W.&Szostak,J.W.(1997)Proc.Natl.Acad.Sci.USA94:12297)。這些測(cè)定法的任一種或未列出的將編碼核酸的DNA或RNA與其表達(dá)的蛋白偶聯(lián)的類(lèi)似測(cè)定法可被用于分離與蛋白靶相互作用的環(huán)狀肽、基因組片段或ScFv。本發(fā)明還提供如上文所述分離的環(huán)狀肽、ScFv或基因組片段。本發(fā)明提供了可以用于產(chǎn)生所選靶點(diǎn)的環(huán)狀和套索肽抑制劑的方法,其可用于多種目的。例如,環(huán)肽可用作藥物來(lái)抑制致病靶點(diǎn)。它們也可用作親和試劑來(lái)證實(shí)靶點(diǎn)的治療前景或者用在需要親和試劑的普通應(yīng)用中。在其它實(shí)施方案中,套索肽在這樣的應(yīng)用中是有用的所述應(yīng)用使用環(huán)肽,但是可能還需要共價(jià)連接至環(huán)肽的標(biāo)簽(尾)。如本文所述,這些標(biāo)簽可編碼酵母雙雜交轉(zhuǎn)錄激活結(jié)構(gòu)域。這些標(biāo)簽還可以編碼其它蛋白相互作用檢測(cè)系統(tǒng)所需的部分,所述系統(tǒng)包括斷裂泛素系統(tǒng)(Stagljaretal.,(1998)Proc.Natl.Acad.Sci.USA95:5187)、蛋白片段互補(bǔ)測(cè)定法(RemyI.&MichnickS.W.(1999)Proc,Natl.Acad.Sci.USA96:5394)、阻遏物重建測(cè)定法(Hirstetal.,(2001)Proc.Natl.Acad.Sci.USA98:8726)、SOS募集系統(tǒng)(Broderetal"(1998)Curr.Biol.8:1121)、噬菌體展示(Smith,G.P.(1985)Science228:1315)、細(xì)菌展示(Francisco,etal.,(1993)Proc.Natl.Acad.Sci.USA90:10444),以及酵母展示(Boder,E.T.Wittrup,K.D.(1997)Nat.Biotech.15:553)、核糖體展示(Mattheakis,etal"(1994)Proc.Nat,Acad.Sci.USA91:9022)和mRNA展示(Roberts,R.W.&Szostak,J.W.(1997)Proc.Natl.Acad.Sci.USA94:12297)。所述標(biāo)簽也可以編碼用于標(biāo)記靶的標(biāo)記物(label)(熒光、放射性等)、定位序列、膜滲透序列、抗體表位標(biāo)簽、用于檢測(cè)和定量結(jié)合靶的量的核酸序列,或小分子。當(dāng)然,其它適合的用途對(duì)本領(lǐng)域技術(shù)人員而言也是顯而易見(jiàn)的。如本文中所討論的,套索肽文庫(kù)可在多種生物體中產(chǎn)生??刹捎没プ饔玫奶囟ㄌ姿麟?。酵母雙雜交測(cè)定法有很多優(yōu)勢(shì),包括但絕不限于以下。環(huán)肽相對(duì)地穩(wěn)定和小,這增加了它們?cè)隗w內(nèi)的穩(wěn)定性和細(xì)胞通透性。在一些實(shí)施方案中,本發(fā)明提供了可以適合于細(xì)胞內(nèi)肽輸送的肽。例如,對(duì)源于HIV-1的Tat-肽系統(tǒng)的操作已被用于細(xì)胞內(nèi)肽輸送。參見(jiàn)例如Caron等人(2001)IntracellulardeliveryofaTat國(guó)eGFPfUsionproteinintomusclecells(Tat畫(huà)eGFP融合蛋白細(xì)月包內(nèi)輸送進(jìn)肌肉細(xì)月包).Mol.Therap.3(3):310-18;Wadia和Dowdy(2003)ModulationofcellularfunctionbyTATmediatedtransductionoffulllengthproteins(通過(guò)TAT介導(dǎo)的全長(zhǎng)蛋白轉(zhuǎn)導(dǎo)調(diào)節(jié)細(xì)胞功能);以及EP656950Bl。可選擇地,穿膜肽(penetratin)、穿透肽(transportan)和MAP(KLAL)肽可被用于介導(dǎo)細(xì)胞內(nèi)輸送。參見(jiàn)例如Hallbrink等人(2001)Cargodeliverykineticsofcell-penetratingpeptides(細(xì)胞穿透肽的貨物輸送動(dòng)力學(xué)).Biochim.Biophys.Acta.1515(2):101-09;Thor6n等人Uptakeofanalogsofpenetratin,Tat(48國(guó)60)andoligoarginineinlivecells(活細(xì)胞對(duì)穿膜肽類(lèi)似物、Tat(48-60)和寡聚精氨酸的攝取).Biochem.Biophys.Res.Commun.307(1):100-07;WO2006/101283Al;以及Howl等人(2003)IntracellulardeliveryofbioactivepeptidestoRBL-2H3cellsinducesbeta-hexosaminidasesecretionandphospholipaseDactivation(細(xì)胞內(nèi)輸送生物活性肽至RBL-2H3細(xì)胞誘導(dǎo)(3-氨基己糖苷酶分泌和磷脂酶D活化).Chembiochem.4(12):1312-16??蛇x擇地,寡聚精氨酸融合蛋白可細(xì)胞內(nèi)輸送。參見(jiàn)例如Han等人(2001)Efficientintracellulardelivery13ofexogenousproteinGFPwithgeneticallyfusedbasicoligopeptides(具有遺傳融合的堿性寡肽的外源蛋白GFP的有效胞內(nèi)輸送).Mol.Cells.12(2》267-71;Futakietal.(2001)Arginine-richpeptides.Anabundantsourceofmembrane-permeablepeptideshavingpotentialascarriersforintracellularproteindelivery(精氨酸豐富肽。來(lái)源充足的具有作為胞內(nèi)蛋白輸送栽體潛力的膜可滲透肽).J.Biol.Chem.276(8):5836-40;以及AU2003/290511A8??蛇x擇地,豆蔻?;目杉?xì)胞內(nèi)輸送。參見(jiàn)例如Nelson等人(2007)Myristoyl-basedtransportofpeptidesintolivingcells(進(jìn)入活細(xì)胞的基于豆蔻酰基的肽輸送).Biochemistry46(51):14771-81;和EP651805Bl。酵母雙雜交測(cè)定法為容易、快速和可自動(dòng)化的測(cè)定法。例如,酵母雙雜交系統(tǒng)可以以陣列模式進(jìn)行。這使得能產(chǎn)生套索肽陣列。采用自動(dòng)化機(jī)器人,這些陣列可用于快速產(chǎn)生針對(duì)特定靶的套索肽。與不同靶相互作用的套索肽的模式可用于對(duì)靶進(jìn)行表征。例如,具有類(lèi)似的結(jié)合表面的靶應(yīng)該與陣列中的類(lèi)似套索肽相互作用??蛇x擇地,套索肽可被用于摘出靶復(fù)合物以鑒定相互作用伴侶。在其它實(shí)施方案中,套索可被固定在表面,生成蛋白微陣列芯片來(lái)檢測(cè)蛋白水平。在其它實(shí)施方案中,其它的功能結(jié)構(gòu)域可以連接至套索,包括顯像和破壞結(jié)構(gòu)域。在具體實(shí)施方案中,本發(fā)明提供了編碼斷裂蛋白內(nèi)含子多肽的重組核酸序列。按氨基到羧基順序,該斷裂蛋白內(nèi)含子多肽可以包括包含F(xiàn)模塊(block)和G模塊的Ic結(jié)構(gòu)域,F(xiàn)模塊與序列rVYDLpV**a國(guó)-HNFh有至少80%的一致性,分別命名為位置F1至F16,G模塊與序列NGhhhHNp有至少80%的一致性,分別命名為位置Gl至G8;與G模塊的C末端部分連接的蛋白外顯子(extein)結(jié)構(gòu)域;以及與蛋白外顯子結(jié)構(gòu)域的C末端部分連接的lN結(jié)構(gòu)域,該In結(jié)枸域包含A模塊和B模塊,A模塊與序列Ch--Dp-hhh--G有至少80%的一致性,分別命名為位置A1至A13,B模塊與序列G--h-hT-誦H-hhh有至少80%的一致性,分別命名為位置B1至B14。在前述序列中,大寫(xiě)字母表示通過(guò)單字母氨基酸代碼命名的氨基酸;"h"表示選自G、B、L、I、A和M的疏水殘基;"a"表示選自D和E的酸性殘基;"r"表示選自F、Y和W的芳香性殘基;"p"表示選自S、T和C的極性殘基;"-"表示任何氨基酸;"*"表示任選的空位。在可能以增強(qiáng)的穩(wěn)定性,特別地肽骨架中內(nèi)酯鍵的增強(qiáng)的穩(wěn)定性為特征的特定實(shí)施方案中,多種氨基酸替換可以發(fā)生在前述分子式中,包括這樣的替換,即其中(a)位置G7處編碼的殘基為Q、W、F、L、I、Y、M、V、R、K、H、E或D;和/或(b)位置G6處編碼的殘基為L(zhǎng)、N、D、W、F、I、M或Y;和/或(c)位置Bll處編碼的殘基為K、Y、F、W、H、Q或E;和/或(d)位置G6處編碼的殘基為A且G7為Y;和/或(e)位置G6處編碼的殘基為A且Bll為K、Y、F、W、H、Q或E;和/或(f)位置F4處編碼的殘基為E或Q;和/或(g)位置F13處編碼的殘基為F、L或I;和/或(h)位置F14處編碼的殘基為W、F、Y、L、K或R;和/或(i)位置F15處編碼的殘基為W或L;和/或(j)位置B9處的殘基不為R或T且對(duì)于N-X?;D(zhuǎn)換而言是非催化氨基酸;和/或(k)位置B10處的殘基不為R或T且對(duì)于N-X酰基轉(zhuǎn)換而言是非催化氨基酸;和/或(1)位置F2處的殘基不為R或T且對(duì)于N-X?;D(zhuǎn)換而言是非催化氨基酸;和/或(m)位置F6處的殘基不為S、T或C且對(duì)于涉及位置G8處親核氨基酸攻擊酯鍵或硫酯鍵的酯交換反應(yīng)而言是非催化氨基酸。在一些實(shí)施方案中,蛋白外顯子結(jié)構(gòu)域可以包含編碼免疫球蛋白分子的免疫球蛋白編碼區(qū),該免疫球蛋白分子包含通過(guò)接頭連接至輕鏈可變區(qū)的重鏈可變區(qū),第一接頭將重鏈可變區(qū)的C末端區(qū)連接至輕鏈可變區(qū)的N末端區(qū),第二接頭將重鏈可變區(qū)的N末端區(qū)連接至輕鏈可變區(qū)的C末端區(qū),其中所述接頭包含至少10個(gè)氨基酸(或者10至50的整數(shù)個(gè)氨基酸)的多肽鏈。在這些實(shí)施方案中,重鏈可變區(qū)可以包含一個(gè)或多個(gè)選自HFR1、HFR2、HFR3和HFR4的重鏈才匡架區(qū);并且該重鏈可變區(qū)還包含一個(gè)或多個(gè)選自CDR-H1、CDR-H2、CDR-H3的互^卜決定區(qū);重鏈沖匡架區(qū)和互補(bǔ)決定區(qū)4姿式HFR1-國(guó)CDR國(guó)H1—HFR2畫(huà)畫(huà)CDR畫(huà)H2—HFR3—CDR誦H3畫(huà)誦HFR4設(shè)置。輕鏈可變區(qū)可以包含一個(gè)或多個(gè)選自L(fǎng)FR1、LFR2、LFR3和LFR4的輕鏈框架區(qū);并且該輕鏈可變區(qū)還包含一個(gè)或多個(gè)選自CDR-L1、CDR-L2和CDR-L3的互補(bǔ)決定區(qū);輕鏈框架區(qū)和互補(bǔ)決定區(qū)4要式LFRl—CDR-L1—LFR27-CDR-L2—LFR3—CDR-L3—LFR4設(shè)置。在這些結(jié)構(gòu)式中(i)HFR1為第一重鏈框架區(qū),由約30個(gè)氨基酸殘基(或20至40中的任何整數(shù)值或其范圍)的序列構(gòu)成;(ii)HFR2為第二重鏈框架區(qū),由約14個(gè)氨基酸殘基(或10至30中的任何整數(shù)值或其范圍)的序列構(gòu)成;(iii)HFR3為第三重鏈框架區(qū),由約29至約32個(gè)氨基酸殘基(或20至50中的任何整數(shù)值或其范圍)的序列構(gòu)成;(iv)HFR4為第四重鏈框架區(qū),由約7至約9個(gè)氨基酸殘基(或5至15中的任何整數(shù)值或其范圍)的序列構(gòu)成;(v)CDR-H1為第一重鏈互補(bǔ)決定區(qū)(其可以例如為長(zhǎng)10-100中的任何整數(shù)值或其范圍的氨基酸);(vi)CDR-H2為第二重鏈互補(bǔ)決定區(qū)(其可以例如為長(zhǎng)10-100中的任何整數(shù)值或其范圍的氨基酸);(vii)CDR-H3為第三重鏈互補(bǔ)決定區(qū)(其可以例如為長(zhǎng)10-100中的任何整數(shù)值或其范圍的氨基酸);(viii)LFR1為第一輕鏈框架區(qū),由約22至約23個(gè)氨基酸殘基(或15至35中的任何整數(shù)值或其范圍)的序列構(gòu)成;(ix)LFR2為第二輕鏈框架區(qū),由約13至約16個(gè)氨基酸殘基(或15至35中的任何整數(shù)值或其范圍)的序列構(gòu)成;20至40中的任何整數(shù)值或其范圍)的序列構(gòu)成;(xi)LFR4為第四輕鏈框架區(qū),由約12至約13個(gè)氨基酸殘基(或5至25中的任何整數(shù)值或其范圍)的序列構(gòu)成;(xii)CDR-L1為第一輕鏈互補(bǔ)決定區(qū)(其可以例如為長(zhǎng)10-100中的任何整數(shù)值的氨基酸);(xiii)CDR-L2為第二輕鏈互補(bǔ)決定區(qū)(其可以例如為長(zhǎng)10-100中的任何整數(shù)值的氨基酸);以及(xiv)CDR-L3為第三輕鏈互補(bǔ)決定區(qū)(其可以例如為長(zhǎng)10-100中的任何整數(shù)值的氨基酸)。本發(fā)明還提供了包含前述重組核酸的宿主細(xì)胞,包括這樣的細(xì)胞,即其中斷裂蛋白內(nèi)含子多肽在宿主細(xì)胞中在自體催化的反應(yīng)中加工,以形成具有不超過(guò)一個(gè)線(xiàn)性末端的至少一種環(huán)化多肽(諸如免疫球蛋白分子,所述免疫球蛋白分子具有不超過(guò)一個(gè)線(xiàn)性末端并具有免疫球蛋白折疊的構(gòu)象)。例如,該環(huán)化多肽可以具有一個(gè)線(xiàn)性末端,C末端或N末端,例如套索肽(其可以包含內(nèi)酯或內(nèi)酰胺連接點(diǎn))??蛇x擇地,該環(huán)化多肽可以為環(huán)狀的,以致其不具有線(xiàn)性末端。本發(fā)明的宿主細(xì)胞可以適用于分析融合蛋白間相互作用的方法。例如,本發(fā)明的細(xì)J包可以包含編碼獵物融合蛋白的第一重組基因,該獵物融合蛋白包含轉(zhuǎn)錄阻遏物或激活物結(jié)構(gòu)域和第一異源氨基酸序列;編碼誘飾融合蛋白的第二重組基因,該誘飾融合蛋白包含DNA結(jié)合結(jié)構(gòu)域和第二異源氨基酸序列;以及編碼可檢測(cè)基因產(chǎn)物的重組報(bào)告基因,該重組報(bào)告基因包含能夠與誘飾融合蛋白的DNA結(jié)合結(jié)構(gòu)域結(jié)合的操縱基因DNA序列;其中報(bào)告基因的表達(dá)響應(yīng)第一異源氨基酸序列和第二異源氨基酸序列之間的結(jié)合而^皮調(diào)節(jié);以及其中所述重組基因的至少一種包含前述重組核酸。一方面,本發(fā)明提供了具有不超過(guò)一個(gè)線(xiàn)性末端的免疫球蛋白分子,包括具有如下構(gòu)象的分子,即免疫球蛋白折疊,所述折疊包含通過(guò)接頭與輕鏈可變區(qū)連接的重鏈可變區(qū)。在這類(lèi)分子中,可以存在第一接頭,將重鏈可變區(qū)的C末端區(qū)連接至輕鏈可變區(qū)的N末端區(qū),并且可以存在第二接頭,將重鏈可變區(qū)的N末端區(qū)連接至輕鏈可變區(qū)的C末端區(qū)。這些接頭可以為長(zhǎng)至少約50埃的柔性共價(jià)分子連接,例如長(zhǎng)約15個(gè)氨基酸的多肽鏈或長(zhǎng)14至25個(gè)氨基酸的多肽鏈(例如由甘氨酸和絲氨酸殘基構(gòu)成)。附圖簡(jiǎn)要說(shuō)明圖1蛋白內(nèi)含子催化的蛋白剪接反應(yīng)。(a)自體剪接蛋白內(nèi)含子反應(yīng)。蛋白內(nèi)含子結(jié)構(gòu)域(黑)催化自體剪接反應(yīng),導(dǎo)致蛋白外顯子結(jié)構(gòu)域(白)的連接。(b)斷裂蛋白內(nèi)含子反應(yīng)。蛋白內(nèi)含子斷裂為兩個(gè)分開(kāi)的蛋白。一個(gè)蛋白含有N蛋白外顯子和N蛋白內(nèi)含子,另一蛋白含有C蛋白內(nèi)含子和C蛋白外顯子。蛋白內(nèi)含子結(jié)構(gòu)域之間的相互作用導(dǎo)致蛋白外顯子結(jié)構(gòu)域的連接。(c)斷裂蛋白內(nèi)含子蛋白環(huán)化反應(yīng)。蛋白內(nèi)含子結(jié)構(gòu)域相對(duì)于蛋白外顯子結(jié)構(gòu)域被交換。蛋白內(nèi)含子結(jié)構(gòu)域折疊在一起并催化蛋白外顯子結(jié)構(gòu)域的環(huán)化。圖2蛋白內(nèi)含子介導(dǎo)的肽環(huán)化反應(yīng)示意圖。步驟l:蛋白內(nèi)含子折疊-C蛋白內(nèi)含子和N蛋白內(nèi)含子結(jié)構(gòu)域相互作用形成催化上有活性的蛋白內(nèi)含子結(jié)構(gòu)。步驟2:N-蛋白內(nèi)含子切割-蛋白內(nèi)含子催化蛋白外顯子的環(huán)化和切除N蛋白內(nèi)含子結(jié)構(gòu)域。步驟3:C蛋白內(nèi)含子的釋放-C蛋白內(nèi)含子結(jié)構(gòu)域被切去,導(dǎo)致形成環(huán)肽。圖3套索蛋白內(nèi)含子的形成。(a)套索蛋白內(nèi)含子為蛋白內(nèi)含子催化的環(huán)化反應(yīng)中的中間體產(chǎn)物。套索肽中的C末端氨基酸通過(guò)內(nèi)酯鍵共價(jià)連接到C蛋白內(nèi)含子結(jié)構(gòu)域(Ic)中的特定親核殘基。(b)套索蛋白內(nèi)含子"絞索"的環(huán)化部分用于展示(i)隨機(jī)肽、(ii)基因組片段和(iii)抗體單鏈可變片段(ScFv)。顯示Ic結(jié)構(gòu)域與核定位序列(NLS)、轉(zhuǎn)錄激活結(jié)構(gòu)域(ACT)、血凝素標(biāo)簽(HA)融合。圖4未加工蛋白內(nèi)含子的形成。(a)通過(guò)阻斷蛋白內(nèi)含子催化的環(huán)化反應(yīng)中的步驟(i)形成未加工蛋白內(nèi)含子。(b)蛋白外顯子或限制在C蛋白內(nèi)含子(Ic)和N蛋白內(nèi)含子(lN)結(jié)構(gòu)域之間的區(qū)域被用于展示(i)隨18機(jī)肽、(ii)基因組片段和(iii)抗體單鏈可變片段(ScFv)。顯示Ic結(jié)構(gòu)域與核定位序列(NLS)、轉(zhuǎn)錄激活結(jié)構(gòu)域(ACT)、血凝素標(biāo)簽(HA)融合。圖5雙半胱氨酸蛋白內(nèi)含子的形成。(a)通過(guò)阻斷蛋白內(nèi)含子催化的環(huán)化反應(yīng)中的步驟(i)形成雙半胱氨酸蛋白內(nèi)含子。雙半胱氨酸蛋白內(nèi)含子在C蛋白內(nèi)含子結(jié)構(gòu)域(Ic)后和N蛋白內(nèi)含子結(jié)構(gòu)域(lN)的第一氨基酸位置處各含有1個(gè)Cys。(b)蛋白外顯子或限制在兩Cys氨基酸之間的區(qū)域被用于展示(i)隨機(jī)肽、(ii)基因組片段和(iii)抗體單鏈可變片段(ScFv)。顯示Ic結(jié)構(gòu)域與核定位序列(NLS)、轉(zhuǎn)錄激活結(jié)構(gòu)域(ACT)、血凝素標(biāo)簽(HA)融合。圖6套索、未加工和雙半胱氨酸蛋白內(nèi)含子向環(huán)狀和線(xiàn)性肽的轉(zhuǎn)化。(a)套索蛋白內(nèi)含子中內(nèi)酯環(huán)化的肽或蛋白可被轉(zhuǎn)化為頭尾相接的環(huán)化肽或蛋白或者線(xiàn)性肽或蛋白。(b)未加工蛋白內(nèi)含子中的受限肽或蛋白可被轉(zhuǎn)化為頭尾相接的環(huán)化肽或蛋白或者線(xiàn)性肽或蛋白。(c)雙半胱氨酸蛋白內(nèi)含子中的受限肽或蛋白可被轉(zhuǎn)化為Cys交聯(lián)的或二硫鍵環(huán)化的肽或蛋白或者線(xiàn)性肽或蛋白。lN是N蛋白內(nèi)含子結(jié)構(gòu)域,Ic是C蛋白內(nèi)含子結(jié)構(gòu)域。顯示Ic結(jié)構(gòu)域與核定位序列(NLS)、轉(zhuǎn)錄激活結(jié)構(gòu)域(ACT)和血凝素標(biāo)簽(HA)融合。圖7采用套索、未加工和雙半胱氨酸蛋白內(nèi)含子的酵母雙雜交測(cè)定。(a)采用酵母雙雜交測(cè)定法篩選套索蛋白內(nèi)含子組合文庫(kù)。套索蛋白內(nèi)含子含有融合至Ic結(jié)構(gòu)域的轉(zhuǎn)錄激活結(jié)構(gòu)域(ACT),其為酵母雙雜交測(cè)定法中激活報(bào)告基因所需。(b)采用酵母雙雜交測(cè)定法篩選未加工蛋白內(nèi)含子組合文庫(kù)。未加工蛋白內(nèi)含子含有融合至Ic結(jié)構(gòu)域的轉(zhuǎn)錄激活結(jié)構(gòu)域(ACT),其為酵母雙雜交測(cè)定法中激活報(bào)告基因所需。(c)采用酵母雙雜交測(cè)定法篩選雙半胱氨酸蛋白內(nèi)含子組合文庫(kù)。雙半胱氨酸蛋白內(nèi)含子含有融合至Ic結(jié)構(gòu)域的轉(zhuǎn)錄激活結(jié)構(gòu)域(ACT),其為酵母雙雜交測(cè)定法中激活報(bào)告基因所需。對(duì)于以上列出的所有實(shí)例,Ic結(jié)構(gòu)域還顯示出與核定位序列(NLS)和血凝素標(biāo)簽(HA)融合。圖8蛋白內(nèi)含子和蛋白外顯子氨基酸編號(hào)。C蛋白內(nèi)含子結(jié)構(gòu)域(Ic)具有保守的模塊F和G,N蛋白內(nèi)含子(IN)結(jié)構(gòu)域具有保守的模塊A和B。保守氨基酸根據(jù)它們的模塊字母和位置數(shù)字編號(hào)。顯示了Ic-蛋白外顯子-lN邊界處的剪接位點(diǎn)的放大圖。Ic蛋白內(nèi)含子采用標(biāo)記方案Ic-i、Ic-2、Ic.3、…從C末端向N末端編號(hào)或者根據(jù)模塊字母和位置號(hào)編號(hào)。模塊G編號(hào)1-8,模塊F編號(hào)1-16。Iw蛋白內(nèi)含子采用標(biāo)記方案Ijsm、IN+2、IN+3、...從N末端向C末端編號(hào)或者根據(jù)模塊字母和位置號(hào)編號(hào)。模塊A編號(hào)1-13,模塊B編號(hào)1-14。蛋白外顯子采用標(biāo)記方案Icw、Ic+2、Ic+3、…從N末端向C末端編號(hào),或者采用標(biāo)記方案In.!、In.2、In.3、…從C末端向N末端編號(hào)。每個(gè)模塊的一致序列顯示在模塊下方。定義h-疏水殘基(G、V、L、I、A、M);a-酸性殘基(D、E);r-芳香殘基(F、Y、W);p-極性殘基(S、T、C);""=非保守殘基;"*"=用于較佳比對(duì)而引入的空位;大寫(xiě)字母=單字母氨基酸代碼,表示高度保守的位置。圖9蛋白內(nèi)含子介導(dǎo)的蛋白剪接的標(biāo)準(zhǔn)機(jī)制。步驟(i):N-X?;D(zhuǎn)換-蛋白外顯子Iw連接點(diǎn)處的IN+1(Al)親核試劑經(jīng)歷N-X酰基轉(zhuǎn)換而將酰胺鍵轉(zhuǎn)變?yōu)轷セ蛄蝓ユI。步驟(ii):酯交換反應(yīng)-Ic-蛋白外顯子連接點(diǎn)處的Ic+1(G8)親核試劑經(jīng)歷對(duì)步驟(i)中形成的酯或硫酯的親核攻擊并產(chǎn)生分支中間體。步驟(iii):Asn環(huán)化-Ic+2Asn經(jīng)歷側(cè)鏈環(huán)化,這切割了Ic結(jié)構(gòu)域和蛋白外顯子之間的酰胺鍵,產(chǎn)生通過(guò)酯或硫酯連接的蛋白外顯子。步驟(iv):酯至酰胺的轉(zhuǎn)換-酯或硫酯鍵通過(guò)熱動(dòng)力學(xué)上有利的X至N?;D(zhuǎn)換而轉(zhuǎn)變?yōu)轷0锋I。定義乂=0或S,這取決于Ser或Cys。^是N蛋白內(nèi)含子結(jié)構(gòu)域,Ic是C蛋白內(nèi)含子結(jié)構(gòu)域。圖10蛋白內(nèi)含子介導(dǎo)的蛋白剪接的非標(biāo)準(zhǔn)機(jī)制。步驟(i):對(duì)酰胺鍵的直接攻擊-Ic-蛋白外顯子連接點(diǎn)處的Ic+1(G8)親核試劑對(duì)連接N蛋白外顯子和lN結(jié)構(gòu)域的酰胺鍵進(jìn)行親核攻擊并產(chǎn)生分支中間體。步驟(ii):Asn環(huán)化-1(:+2八811經(jīng)歷側(cè)鏈環(huán)化,這切去了Ic結(jié)構(gòu)域,產(chǎn)生通過(guò)酯或硫酯連接的蛋白外顯子產(chǎn)物。步驟(iii):酯至酰胺的轉(zhuǎn)換-酯或硫酯鍵通過(guò)熱動(dòng)力學(xué)上有利的X至N酰基轉(zhuǎn)換而轉(zhuǎn)變?yōu)轷0锋I。定義X-O或S,這取決于Cys或Ser/Thr。In是N蛋白內(nèi)含子結(jié)構(gòu)域,Ic是C蛋白內(nèi)含子結(jié)構(gòu)域。圖11蛋白內(nèi)含子介導(dǎo)的蛋白環(huán)化反應(yīng)。步驟(i):N-X酰基轉(zhuǎn)換-蛋白外顯子-Iw連接點(diǎn)處的IN+1(Al)親核試劑經(jīng)歷N-X?;D(zhuǎn)換而將酰胺鍵轉(zhuǎn)變?yōu)轷セ蛄蝓?。步驟(ii):酯交換反應(yīng)-Ic-蛋白外顯子連接點(diǎn)處的Ic+1(G8)親核試劑對(duì)步驟(i)中形成的酯或疏酯進(jìn)行親核攻擊并產(chǎn)生分支中間體。步驟(iii):Asn環(huán)化-Ic+2Asn經(jīng)歷側(cè)鏈環(huán)化,這切去了Ic結(jié)構(gòu)域,產(chǎn)生了作為內(nèi)酯的蛋白外顯子產(chǎn)物。步驟(iv):內(nèi)酯至內(nèi)酰胺的轉(zhuǎn)換-內(nèi)酯環(huán)化的蛋白內(nèi)含子通過(guò)熱動(dòng)力學(xué)上有利的X至N?;D(zhuǎn)換而轉(zhuǎn)變?yōu)閮?nèi)酰胺。定義X-S或O,這取決于Cys或Ser/Thr。Iw是N蛋白內(nèi)含子結(jié)構(gòu)域,Ic是C蛋白內(nèi)含子結(jié)構(gòu)域。圖12未加工蛋白內(nèi)含子的產(chǎn)生。(a)通過(guò)抑制步驟(ii)(酯交換反應(yīng))產(chǎn)生未加工蛋白內(nèi)含子。如果只是步驟(ii)被阻斷,則未加工蛋白內(nèi)含子可經(jīng)歷兩個(gè)副反應(yīng)。副反應(yīng)(iii)(Asn環(huán)化)導(dǎo)致從未加工蛋白內(nèi)含子切去Ic結(jié)構(gòu)域。副反應(yīng)(iv)(酯水解)導(dǎo)致從未加工蛋白內(nèi)含子切去IN結(jié)構(gòu)域。為了產(chǎn)生穩(wěn)定的未加工蛋白內(nèi)含子,需要抑制步驟(i)(N-X?;D(zhuǎn)換)和步驟(iii)(Asn環(huán)化)。Ic結(jié)構(gòu)域顯示為與核定位序列(NLS)、轉(zhuǎn)錄激活結(jié)構(gòu)域(ACT)、血凝素標(biāo)簽(HA)融合。X-S或O,這取決于Cys或Ser/Thr。圖13雙半胱氨酸蛋白內(nèi)含子的產(chǎn)生。(a)通過(guò)抑制步驟(ii)(酯交換反應(yīng))產(chǎn)生未加工蛋白內(nèi)含子。如果只是步驟(ii)被阻斷,則未加工蛋白內(nèi)含子可經(jīng)歷兩個(gè)副反應(yīng)。副反應(yīng)(iii)(Asn環(huán)化)導(dǎo)致從未加工蛋白內(nèi)含子切去Ic結(jié)構(gòu)域。副反應(yīng)(iv)(酯水解)導(dǎo)致從未加工蛋白內(nèi)含子切去In結(jié)枸域。為了產(chǎn)生穩(wěn)定的雙半胱氨酸蛋白內(nèi)含子,需要抑制步驟(i)(N-X?;D(zhuǎn)換)和步驟(iii)(Asn環(huán)化)。Ic結(jié)構(gòu)域顯示為與核定位序列(NLS)、轉(zhuǎn)錄激活結(jié)構(gòu)域(ACT)、血凝素標(biāo)簽(HA)融合。X-S或0,這取決于Cys或Ser/Thr。圖14套索蛋白內(nèi)含子的產(chǎn)生。為了產(chǎn)生套索蛋白內(nèi)含子,需要阻斷步驟(iii)(Asn環(huán)化)。套索蛋白內(nèi)含子可進(jìn)行副反應(yīng)(iv)(內(nèi)酯水解)。為了產(chǎn)生穩(wěn)定的蛋白內(nèi)含子套索,應(yīng)該減少步驟(iv)(內(nèi)酯水解)。Ic結(jié)構(gòu)域顯示為與核定位序列(NLS)、轉(zhuǎn)錄激活結(jié)構(gòu)域(ACT)、血凝素標(biāo)簽(HA)融合。X=S或O,這取決于Cys或Ser/Thr。圖15抗LexA套索的分離。(a)蛋白內(nèi)含子介導(dǎo)的肽環(huán)化。(i)未加工蛋白內(nèi)含子采用肽-lN連接點(diǎn)處的&+1半胱氨酸經(jīng)歷N至S?;D(zhuǎn)換。(ii)涉及Ic-肽連接點(diǎn)處的Icw絲氨酸和步驟(i)中形成的硫酯的酯交換反應(yīng),其釋放lN結(jié)構(gòu)域,產(chǎn)生套索中間體。(iii)在產(chǎn)生環(huán)肽系統(tǒng)的蛋白內(nèi)含子中,Ic+2天冬酰胺經(jīng)歷側(cè)鏈環(huán)化,其釋放Ic結(jié)構(gòu)域并產(chǎn)生內(nèi)酯環(huán)化肽,所述內(nèi)酯環(huán)化肽經(jīng)歷熱動(dòng)力學(xué)上有利的O至N?;D(zhuǎn)換而產(chǎn)生內(nèi)酰胺環(huán)化肽。在產(chǎn)生套索的蛋白內(nèi)含子中,位置IcM處的天冬酰胺突變?yōu)楸彼?*),其抑制天冬酰胺環(huán)化。(b)用于產(chǎn)生套索和無(wú)活性蛋白內(nèi)含子的突變。套索蛋白內(nèi)含子在位置IcM處含有天冬酰胺至丙氨酸的突變,這阻斷了天冬酰胺側(cè)鏈環(huán)化反應(yīng)。無(wú)活性蛋白內(nèi)含子含有與套索蛋白內(nèi)含子相同的突變以及位置Icw處的絲氨酸至丙氨酸突變和位置I謝處的半胱氨酸至丙氨酸突變。位置Iw處的半胱氨酸至丙氨酸突變阻斷了N至S?;D(zhuǎn)換。位置Icw處的絲氨酸至丙氨酸突變阻斷了酯交換反應(yīng)。X表示NNK密碼子編碼的氨基酸。(c)套索酵母雙雜交測(cè)定法。通過(guò)將天冬酰胺突變?yōu)楸彼嵋种屏颂於0穫?cè)鏈環(huán)化反應(yīng),這終止了套索中間體的環(huán)化反應(yīng)。套索含有轉(zhuǎn)錄激活結(jié)構(gòu)域,其被用于采用酵母雙雜交相互作用陷阱來(lái)選擇抗LexA套索。(d)來(lái)自?xún)煽筁exA套索肽(Ll和L2)的絞索區(qū)域的氨基酸序列。來(lái)自組合區(qū)域的氨基酸為粗體并且短劃線(xiàn)用于比對(duì)L1和L2中的相同氨基酸。圖16套索組合文庫(kù)的分析。來(lái)自17套索文庫(kù)質(zhì)粒(pIL-XX)的序列。粗體氨基酸是不變的。*表示終止密碼子。X表示NNK密碼子編碼的氨基酸。文庫(kù)的35%含有隨機(jī)7氨基酸肽,無(wú)終止密碼子。圖17L2套索的分析。(a)采用抗HA抗體對(duì)EY93中蛋白內(nèi)含子介導(dǎo)的套索生成的Western分析。pIL-L2和pIN-L2分別設(shè)計(jì)為產(chǎn)生套索和未加工蛋白內(nèi)含子。未加工蛋白內(nèi)含子在約23kDa處,套索在約9kDa處。(b)酵母雙雜交分析L2套索與LexA的相互作用。pIL-Ol為具有CGPC肽絞索的套索表達(dá)質(zhì)粒。pIL-L2為具有L2絞索的套索表達(dá)質(zhì)粒。pIN-L2為帶有L2絞索的突變體套索表達(dá)質(zhì)粒,其僅產(chǎn)生未加工蛋白內(nèi)含子。(i)在非選擇性的Hi"Trp-葡萄糖培養(yǎng)基上的酵母生長(zhǎng)。(ii)在為選擇激活LEU2、ADE2和LacZ酵母雙雜交報(bào)告基因的22His-Trp-LeifAde-Xgal半乳糖/蔗糖培養(yǎng)基上生長(zhǎng)的酵母。(c)BL21-CP中產(chǎn)生的經(jīng)His標(biāo)簽純化的套索的HPLC和ESI-TOFMS分析。(i)套索和In片段的反相HPLC分離。(ii)套索(8651.7calc;8651.4obs)和7jc解套索(8669.7calc;8669.5obs)的ESI-TOFMS分析。(iii)In片段的ESI誦TOFMS分析(13966.7calc;13967.0obs)。(d)對(duì)MS分析之前存在的套索的量的分析。(i)通過(guò)內(nèi)酯鍵環(huán)化的套索。(ii)在Na18OH處理之前被切割的套索。(iii)Na18OH誘導(dǎo)內(nèi)酯鍵切割得到的產(chǎn)物。(iv)胰蛋白酶消化經(jīng)切割的套索來(lái)證實(shí)180摻入的位置。顯示了含有180的每個(gè)片段的百分比,所述百分比對(duì)應(yīng)于MS分析前通過(guò)內(nèi)酯鍵環(huán)化的套索的量(圖20)。圖18L2與LexA相互作用的表面等離子共振(SPR)分析。L2肽被固定到CM5傳感器芯片上,LexA(11pM-110^M)流經(jīng)該傳感器芯片。每個(gè)點(diǎn)的反應(yīng)曲線(xiàn)被用于采用BiaEvaluation(Biacore)擬和軟件來(lái)確定解離常數(shù)(Kd)。采用不同的LexA濃度計(jì)算標(biāo)準(zhǔn)偏差。圖19NaOH切割套索的機(jī)制。Na"OH對(duì)套索內(nèi)酯的水解可通過(guò)兩個(gè)機(jī)制進(jìn)行。(a)第一個(gè)機(jī)制涉及對(duì)酯鍵的水解,導(dǎo)致180摻入位置(1^)處的酪氨酸羧酸。(b)第二個(gè)機(jī)制涉及a-H消除以產(chǎn)生二氫丙氨酸,接著是邁克爾(Michael)加成,其將180摻入位置(Ic+0處絲氨酸側(cè)鏈。圖20對(duì)MS分析前套索的定量。(a)分析180在位置(I^)處酪氨酸羧酸的摻入。胰蛋白酶消化經(jīng)Na18OH處理的套索產(chǎn)生在位置(Iw)處含有酪氨酸的肽片段(SWDLPGEY)。160產(chǎn)物具有966.420m/z的計(jì)算質(zhì)量,180產(chǎn)物具有968.420m/z的計(jì)算質(zhì)量。(b)來(lái)自經(jīng)Na"OH或Na18OH處理樣品的SWDLPGEY肽片段的質(zhì)譜分析與理論上的同位素分布(MS-ISOTOPE軟件)疊放。在Na"OH處理的樣品中,與理論分布有大偏差,表明存在一種以上的肽。(c)MATCHING軟件分析所觀察到的圖譜中"0標(biāo)記肽(966.3m/z,86。/。,方形)和180標(biāo)記肽(969.3m/z,14%,三角形)的百分比。分析了l+和2+帶電片段,觀察到類(lèi)似結(jié)果。僅顯示了l+電荷。(d)在觀察到的SWDLPGEY肽片段圖譜上疊放180和160肽的計(jì)算貢獻(xiàn)的總和。(e)"O在位置(Ic+0處絲氨酸側(cè)鏈摻入的分析。胰蛋白酶消化經(jīng)Na18OH處理的套索產(chǎn)生在位置(Icw)處含有絲氨酸的肽片段(IFDIGLPQDHNFLLANGAIAHASR)。該片段的質(zhì)量為25卯.352m/z,對(duì)應(yīng)于比預(yù)測(cè)的"O摻入的產(chǎn)物重1Da的產(chǎn)物。1Da的位移可歸結(jié)于天冬酰胺的脫酰胺。由于位于甘氨酸(7-10)的N末端,位置(Io7)處的天冬酰胺容易發(fā)生堿催化的脫酰胺。分析了2+、3+、4+和5+帶電片段,得到類(lèi)似的結(jié)果。僅顯示了4+帶電片段。(f)來(lái)自經(jīng)Na16OH或Na18OH處理樣品的IFDIGLPQDHNFLLANGAIAHASR肽片段的質(zhì)語(yǔ)分析與理論上的同位素分布(MS-ISOTOPE軟件)疊放。在Na"OH處理的樣品中,與理論分布有大偏差,表明存在一種以上的肽。Na"OH處理的樣品應(yīng)該摻入了兩個(gè)180,—個(gè)來(lái)自水解,另一個(gè)來(lái)自脫酰胺,產(chǎn)生2595.36Da的M+H。(g)MATCHING軟件分析160和180標(biāo)記肽的百分比—)具有兩個(gè)160取代的肽,對(duì)應(yīng)于由"0進(jìn)行的脫酰胺和水解(2591.35m/z,8.8%,方形),(A)具有一160和一180取代的肽,對(duì)應(yīng)于由180進(jìn)行的脫酰胺和由"O進(jìn)行的水解(2593.35m/z,59.0%,三角形),以及(*)具有兩個(gè)180取代的肽(2595.35m/z,32.2%,圓形),對(duì)應(yīng)于由180進(jìn)行的脫酰胺和水解。D:脫酰胺,H-水解。(h)在觀察到的IFDIGLPQDHNFLLANGAIAHASR肽片段圖譜上疊放180和160肽的計(jì)算貢獻(xiàn)的總和。圖21L2套索和環(huán)肽的生物學(xué)活性。(a)通過(guò)L2套索抑制MMC誘導(dǎo)的LexA切割。以MMC和氯霉素處理BL21-CP細(xì)胞,所述細(xì)胞或者表達(dá)pETIL-Ol(其表達(dá)帶有CGPC絞索的套索),或者表達(dá)pETIL-L2(其表達(dá)帶有L2絞索的套索)。在MMC添加后0、1、2和3小時(shí)采用抗LexA抗體通過(guò)Western分析法分析細(xì)胞提取物。(b)SMR6039-DE3中抑制MMC誘導(dǎo)的sulA-GFP表達(dá)。存在和不存在IPTG時(shí)經(jīng)pETIL-L2轉(zhuǎn)化和MMC處理的表達(dá)GFP的SMR6039-DE3細(xì)胞的百分比。在MMC添加后的0、0.5、1.5和2.5小時(shí)采用流式細(xì)胞術(shù)分析GFP表達(dá)。誤差線(xiàn)表示來(lái)自3個(gè)獨(dú)立試驗(yàn)的標(biāo)準(zhǔn)偏差。(c)經(jīng)pETIL-Ol或pETIL-L2轉(zhuǎn)化的BL21-CP細(xì)胞在存在(+)和不存在(-)MMC和/或IPTG時(shí)的存活測(cè)定。(d)合成的線(xiàn)性和環(huán)狀L2肽處理的BL21-CP細(xì)胞的存活測(cè)定。通過(guò)1小時(shí)后的菌落形成單位(cfu)數(shù)量除以0小時(shí)時(shí)間點(diǎn)的cfu數(shù)量計(jì)算標(biāo)準(zhǔn)化的細(xì)胞存活百分比。未誘導(dǎo)的對(duì)照或無(wú)肽的24對(duì)照標(biāo)準(zhǔn)化至100%。誤差線(xiàn)表示3個(gè)獨(dú)立試驗(yàn)的標(biāo)準(zhǔn)偏差。圖22線(xiàn)性L(fǎng)2肽抑制細(xì)胞存活并增強(qiáng)絲裂霉素C活性。合成的線(xiàn)性L(fǎng)2肽處理的BL21-CP細(xì)胞的存活測(cè)定。相對(duì)于未處理對(duì)照才艮告細(xì)胞存活。誤差線(xiàn)表示3個(gè)獨(dú)立試驗(yàn)的標(biāo)準(zhǔn)偏差。圖23用于構(gòu)建套索蛋白內(nèi)含子和混合蛋白內(nèi)含子的寡核苷酸。圖24套索突變對(duì)套索穩(wěn)定性和加工的影響。蛋白內(nèi)含子構(gòu)建體中的3個(gè)位置G6、G7和B11突變?yōu)樗械陌被?。野生型蛋白?nèi)含子進(jìn)行蛋白內(nèi)含子反應(yīng)中的所有步驟并產(chǎn)生環(huán)肽。G6:His、G7:Ala和Bll:Arg為產(chǎn)生套索的蛋白內(nèi)含子構(gòu)建體。(-)表示套索形成和加工未表征。%套索為未水解套索的量。%加工為在套索反應(yīng)中進(jìn)行前兩步驟的量。圖25ScFv文庫(kù)的多樣化互補(bǔ)區(qū)域(CDR)中氨基酸位置。CDR的名稱(chēng)列在表上方,位置以對(duì)應(yīng)于Kabat數(shù)據(jù)庫(kù)的編號(hào)標(biāo)記。編號(hào)下的字母指以單字母氨基酸代碼表示的該位置中的氨基酸。X表示可變位置。圖26ScFv套索加工的時(shí)程分析。采用抗HA抗體對(duì)EY93中蛋白內(nèi)含子介導(dǎo)的ScFv套索產(chǎn)生的Western分析。未加工蛋白內(nèi)含子為約54kDa,套索為約42kDa。圖27ScFv文庫(kù)相互作用的酵母雙雜交比較。針對(duì)5誘鉺池Bcr-AblSH2結(jié)構(gòu)域、Bcr-AblSH3結(jié)構(gòu)域、Bcr-Abl巻曲螺旋結(jié)構(gòu)域、Bcr-AblY177基序以及HckTyr激酶結(jié)構(gòu)域篩選K4、cyc-K4、T4和cyc-T4文庫(kù)。由于激活腺噤呤報(bào)告基因(ADE)而生長(zhǎng)的陽(yáng)性克隆的數(shù)量以黑條顯示。由于激活腺噤呤報(bào)告基因(ADE)和LacZ報(bào)告基因而生長(zhǎng)并變藍(lán)的陽(yáng)性克隆的數(shù)量以灰色條顯示。誤差線(xiàn)表示來(lái)自3個(gè)獨(dú)立試驗(yàn)的標(biāo)準(zhǔn)偏差。圖28用于構(gòu)建ScFv文庫(kù)的寡核苷酸。詳細(xì)說(shuō)明產(chǎn)生連續(xù)的酰胺肽骨架的頭尾相接肽環(huán)化已被成功地用于約束和穩(wěn)定肽并改善其生物學(xué)活性。已經(jīng)開(kāi)發(fā)出了多種用于將肽從其線(xiàn)性前體環(huán)化的體外化學(xué)和酶學(xué)策略。最近已經(jīng)開(kāi)發(fā)了采用蛋白內(nèi)含子的方法來(lái)體內(nèi)合成頭尾相接環(huán)肽(Scott,CP.etal.(1999)Proc.Natl.Acad.Sci.USA96:13638-13643)。蛋白內(nèi)含子為自體剪接蛋白,它們存在于前體蛋白的蛋白外顯子之間。蛋白內(nèi)含子從前體蛋白中除去它們自身,導(dǎo)致蛋白外顯子連接(圖la)。天然存在的和經(jīng)改造的蛋白內(nèi)含子以及斷裂蛋白內(nèi)含子將蛋白和肽連接在一起(圖lb)?;谶@些結(jié)果,蛋白內(nèi)含子已被進(jìn)一步改造,用于產(chǎn)生環(huán)狀蛋白和肽。為此,改變蛋白內(nèi)含子結(jié)構(gòu)域的順序(圖lc)以使得蛋白外顯子結(jié)構(gòu)域能頭尾相接環(huán)化。采用改造的蛋白內(nèi)含子來(lái)產(chǎn)生頭尾相接的環(huán)化肽的方法已有描述。通過(guò)融合蛋白內(nèi)含子結(jié)構(gòu)域之間的隨才幾肽已生成了組合環(huán)肽文庫(kù)。這些環(huán)肽文庫(kù)已被用于分離在人B細(xì)胞中阻斷白介素-4信號(hào)轉(zhuǎn)導(dǎo)的特異頭尾相接環(huán)化肽(Kinsella,T.M.etal.(2002)J.Biol.Chem.277:37512-37518)。盡管這種方法已成功地用于改變細(xì)胞表型,但是難以確定環(huán)肽的細(xì)胞靶點(diǎn)。最近,已經(jīng)開(kāi)發(fā)了在細(xì)菌中采用遺傳選擇策略,來(lái)分離破壞特異蛋白-蛋白相互作用的頭尾相接環(huán)化肽的技術(shù)(Horswill,A.R.etal.(2004)Proc.Natl.Acad.Sci.USA101:15591-15596,Tavassoli,A.&Benkovic,SJ.(2005)AgnewChem.Int.Ed.Engl.44:2760-2763)。但是,本領(lǐng)域技術(shù)人員顯而易見(jiàn)的是,頭尾相接環(huán)化肽缺乏自由N末端或C末端,這意味著報(bào)告子(reporter)或激活子不能與其連接。本發(fā)明描述"套索,,蛋白內(nèi)含子或套索前體(未加工或雙半胱氨酸蛋白內(nèi)含子)在酵母雙雜交測(cè)定法或上述和/或現(xiàn)有技術(shù)中已知的其它選擇技術(shù)中的構(gòu)建和應(yīng)用。套索為沒(méi)有C末端的新的肽構(gòu)建體,代表了一種新類(lèi)型的環(huán)肽。通過(guò)改動(dòng)體內(nèi)蛋白內(nèi)含子介導(dǎo)的蛋白連接反應(yīng)來(lái)產(chǎn)生套索蛋白內(nèi)含子(圖2)。使套索蛋白內(nèi)含子的C末端倒回成環(huán)并通過(guò)內(nèi)酯鍵連接到肽內(nèi)部的特定絲氨酸(圖3)。隨機(jī)肽、ScFv或基因組片段的文庫(kù)可展示在套索的環(huán)狀區(qū)或絞索區(qū)(圖3)。與頭尾相接的環(huán)化肽不同,套索具有自由N末端,這使得能連接有用的活性結(jié)構(gòu)域,例如轉(zhuǎn)錄激活結(jié)構(gòu)域,這對(duì)于酵母雙雜交測(cè)定法是必要的。未加工蛋白內(nèi)含子(圖4)為這樣的蛋白內(nèi)含子構(gòu)建體,即其不能在蛋白內(nèi)含子介導(dǎo)的環(huán)化中經(jīng)歷任何步驟。隨機(jī)肽、ScFv或基因組片段可被展示和限制在C和N蛋白內(nèi)含子結(jié)構(gòu)域之間(圖4)。未加工蛋白內(nèi)含子具有自由N和C末端,使得能在任一端連接有用的活性結(jié)構(gòu)域,例如轉(zhuǎn)錄激活結(jié)構(gòu)域,這對(duì)于酵母雙雜交測(cè)定法是必要的。雙半胱氨酸蛋白內(nèi)含子(圖5)為這樣的蛋白內(nèi)含子構(gòu)建體,即其不能在蛋白內(nèi)含子介導(dǎo)的環(huán)化中經(jīng)歷任何步驟。隨機(jī)肽、ScFv或基因組片段可被展示和限制在C和N蛋白內(nèi)含子結(jié)構(gòu)域之間(圖5)。在雙半胱氨酸蛋白內(nèi)含子中,隨機(jī)肽、ScFv或基因組片段在每一端與Cys側(cè)翼連接。該雙半胱氨酸蛋白內(nèi)含子具有自由N和C末端,使得能在任一端連接有用的活性結(jié)構(gòu)域,例如轉(zhuǎn)錄激活結(jié)構(gòu)域,這對(duì)于酵母雙雜交測(cè)定法是必要的。該套索構(gòu)建體或未加工蛋白內(nèi)含子和雙半胱氨酸蛋白內(nèi)含子可用于展示與轉(zhuǎn)錄激活結(jié)構(gòu)域融合的組合環(huán)肽、ScFv或基因組片段文庫(kù)。本文中,ScFv指由通過(guò)短接頭結(jié)合在一起的重(H)和輕(L)鏈的免疫球蛋白可變(V)結(jié)構(gòu)域構(gòu)成的抗體片段(Tanaka,T.etal.(2003)Nucl.AcidsRes.31:e23)。注意,在圖3、圖4和圖5中,可通過(guò)將VH結(jié)構(gòu)域融合至Ic結(jié)構(gòu)域及隨后的接頭和V^結(jié)構(gòu)域而構(gòu)建ScFv??蛇x擇地,Vt結(jié)構(gòu)域可融合至后面接有接頭和Vh結(jié)枸域的Ic結(jié)構(gòu)域。用在本文時(shí),"ScFv,,指任一構(gòu)建體。本文中,基因組片段指源于基因組DNA或cDNA的DNA的隨機(jī)或理性產(chǎn)生的片段,它們?cè)谔姿?、未加工蛋白?nèi)含子或雙半胱氨酸蛋白內(nèi)含子構(gòu)建體中表達(dá)。酵母雙雜交測(cè)定法或其它的選擇技術(shù)可用于從遺傳學(xué)上選擇與特異靶結(jié)合的套索肽、未加工蛋白內(nèi)含子和雙半胱氨酸蛋白內(nèi)含子。其它的用于檢測(cè)細(xì)胞內(nèi)蛋白、RNA和DNA相互作用的測(cè)定法也可用于選擇結(jié)合特異靶的套索肽、未加工蛋白內(nèi)含子和雙半胱氨酸蛋白內(nèi)含子,包括雙雜交系統(tǒng)(在VidalM.&LegrainP.(1999)Nucl.AcidRes.27:919中所綜述的)、斷裂泛素系統(tǒng)(Stagljaretal.,(1998)Proc.Natl.Acad.Sci.USA95:5187)、蛋白片段互補(bǔ)測(cè)定法(RemyI.&MichnickS.W.(1999)Proc.Natl.Acad.Sci.USA96:5394)、阻遏物重建測(cè)定法(Hirstetal.,(2001)Proc.Natl.Acad.Sci.USA98:8726),以及SOS募集27系統(tǒng)(Broderetal.,(1998)Curr.Biol.8:1121)。這些測(cè)定法的任一種或未列出的采用報(bào)告基因/蛋白在細(xì)胞中檢測(cè)蛋白、RNA或DNA相互作用的類(lèi)似測(cè)定法可被用于分離與靶相互作用的環(huán)狀肽、基因組片段或ScFv??蛇x擇地,已經(jīng)報(bào)道了很多將編碼蛋白的DNA與表達(dá)的蛋白偶聯(lián)的測(cè)定法,包括噬菌體展示(Smith,G.P.(1985)Science228:1315)、細(xì)菌展示(Francisco,etal.,(1993)Pro"Natl.Acad.Sci.USA90:10444),以及酵母展示(Boder,E.T.Wittrup,K.D.(1997)Nat.Biotech.15:553)。已經(jīng)開(kāi)發(fā)了其它的涉及無(wú)細(xì)胞蛋白表達(dá)的測(cè)定法,用于將編碼蛋白的RNA與表達(dá)的蛋白偶聯(lián),包括核糖體展示(Mattheakis,etal.,(1994)Proc.Nat.Acad.Sci.USA91:9022)和mRNA展示(Roberts,R.W.&Szostak,J.W.(1997)Proc.Natl.Acad.Sci.USA94:12297)。這些測(cè)定法的任一種或未列出的將DNA或RNA編碼核酸與其表達(dá)的蛋白偶聯(lián)的類(lèi)似測(cè)定法可被用于分離與耙相互作用的環(huán)狀肽、基因組片段或ScFv。結(jié)合特異靶的套索和未加工蛋白內(nèi)含子可被用作模板以合成與該相同靶相互作用但不含有任何蛋白內(nèi)含子序列的線(xiàn)性或環(huán)肽、ScFv或基因組片段(圖6a、圖6b)。與靶相互作用的雙半胱氨酸蛋白內(nèi)含子可用于設(shè)計(jì)與靶相互作用但不含有任何蛋白內(nèi)含子序列的受限肽(constrainedpeptide).ScFv或基因組片段。為此,將展示在C和N蛋白內(nèi)含子結(jié)構(gòu)域之間的肽、ScFv或基因組片段合成為側(cè)翼連接Cys。側(cè)翼連接的Cys被用于交聯(lián)和限制肽、ScFv或基因組片段(圖6c)。也可采用其它的可交聯(lián)氨基酸替代兩半胱氨酸殘基來(lái)構(gòu)建雙半胱氨酸蛋白內(nèi)含子。存在于氨基酸上的可交聯(lián)部分的實(shí)例包括但不限于胺-硫醇、胺-胺、胺-羧酸、羧酸-羧酸等。其它的氨基酸可在翻譯后修飾,以并入不在氨基酸上天然存在的可交聯(lián)部分。進(jìn)一步地,可設(shè)計(jì)這樣的交聯(lián)分子,使得具有獨(dú)特功能的其它分子可連接到所述肽、ScFv或基因組片段。這些分子可以包括熒光標(biāo)記、定位序列、純化標(biāo)簽、分子破壞部分等。術(shù)語(yǔ)"蛋白內(nèi)含子"指一組公知的"剪接蛋白"。如本文所討論的,多種蛋白內(nèi)含子可如下文所述被修飾而用在本發(fā)明中。來(lái)自不同蛋白內(nèi)含子的N蛋白內(nèi)含子結(jié)構(gòu)域和C蛋白內(nèi)含子結(jié)構(gòu)域也可混合以產(chǎn)生功能性蛋白內(nèi)含子。實(shí)例包括但不限于天然存在的斷裂蛋白內(nèi)含子,例如AhaDnaE-c和AhaDnaE畫(huà)n、AovDnaE-c和AovDnaE國(guó)n、AspDnaE攀c和AspDnaE國(guó)n、AvaDnaE-c和AvaDnaE-n、CwaDnaE國(guó)c和CwaDnaE-n、DraSnf2國(guó)c和DraSnf2國(guó)n、NpuDnaE誦c和NpuDnaE-n、NspDnaE-c和NspDnaE-n、OliDnaE-c和OliDnaE-n、SspDnaE-c和SspDnaE-n、TelDnaE國(guó)c和TelDnaE-n、TerDnaE-3c和TerDnaE-3n,以及TvuDnaE-c和TvuDnaE-n。其它適合的蛋白內(nèi)含子包括那些被鑒定為蛋白內(nèi)含子的肽,即符合以下標(biāo)準(zhǔn)的肽(來(lái)自NewEnglandBiolabs網(wǎng)頁(yè))1)基因內(nèi)的同框插入,該基因具有先前經(jīng)測(cè)序缺乏該插入的同源物。2)成熟蛋白的觀測(cè)大小類(lèi)似于缺乏蛋白內(nèi)含子的該同源物的大小,而與前體的預(yù)測(cè)大小不同。很多小組進(jìn)一步通過(guò)對(duì)跨連接的蛋白外顯子中的剪接結(jié)合點(diǎn)的氨基酸測(cè)序或者通過(guò)質(zhì)語(yǔ)分析鑒定經(jīng)剪接的肽而證實(shí)蛋白剪接。在缺乏剪接的實(shí)驗(yàn)證據(jù)時(shí),蛋白內(nèi)含子被認(rèn)為是推斷的并在蛋白內(nèi)含子登記(InteinRegistry)中注明為理論的。3)存在由模塊A、N2、B、N4、F和G構(gòu)成的蛋白內(nèi)含子剪接基序。盡管模塊C、D、E和H為內(nèi)切核酸酶結(jié)構(gòu)域的部分,但它們傾向于比剪接基序更保守,并且有時(shí)更容易在候選序列中找到。但是,歸巢內(nèi)切核酸酶(homingendonuclease)結(jié)構(gòu)域的存在不足以將蛋白歸類(lèi)為蛋白內(nèi)含子,因?yàn)楹芏鄽w巢內(nèi)切核酸酶為獨(dú)立存在的或者在內(nèi)含子(intron)中發(fā)現(xiàn)。因而缺乏這些DOD基序的小蛋白內(nèi)含子更難鑒定,尤其是它們?cè)诒J匚恢煤蟹且恢滦蛄袝r(shí)。注意最近的文章報(bào)道了既非蛋白內(nèi)含子介導(dǎo)亦非自催化的"蛋白剪接"。請(qǐng)區(qū)分蛋白內(nèi)含子介導(dǎo)的蛋白剪接和產(chǎn)生剪接、重排蛋白的其它蛋白編輯機(jī)制。4)存在4個(gè)保守的剪接點(diǎn)殘基蛋白內(nèi)含子N末端的Ser、Thr或Cys,蛋白內(nèi)含子C末端的二肽His-Asn或His-Gln,下游剪接位點(diǎn)后的Ser、Thr或Cys。Ser、Thr、Cys和Asn為必要?dú)埢?,它們?cè)诩艚油緩街杏米饔H核試劑。缺乏這些殘基或以不能進(jìn)行類(lèi)似化學(xué)的殘基29替換提示無(wú)活性的蛋白內(nèi)含子或可選擇的剪接途徑。在TliPol-2蛋白內(nèi)含子中,未在蛋白內(nèi)含子N末端觀察到Thr,但是其可有效地替換Ser(Hodges,R.A.etal.(1992)Nucl.Acid.Res.20:6153-6157)。保守的Thr(模塊B)和His(模塊B和G中)殘基協(xié)助催化,因而可能不是必要的,因?yàn)榈鞍變?nèi)含子中的其它殘基可以在它們不存在時(shí)提供類(lèi)似的輔助功能。一方面,本發(fā)明提供了分離識(shí)別所選靶標(biāo)的套索蛋白內(nèi)含子、未加工蛋白內(nèi)含子以及雙半胱氨酸蛋白內(nèi)含子的方法,例如采用酵母雙雜交相互作用陷阱(圖7)。套索蛋白內(nèi)含子為環(huán)化的肽、基因組片段或ScFv,其具有共價(jià)連接環(huán)化或絞索區(qū)的肽標(biāo)簽。通過(guò)突變產(chǎn)生環(huán)肽的蛋白內(nèi)含子以使其在環(huán)化反應(yīng)中僅經(jīng)歷前兩個(gè)步驟,來(lái)產(chǎn)生套索肽。套索為蛋白內(nèi)含子介導(dǎo)的環(huán)肽反應(yīng)中的中間產(chǎn)物。套索產(chǎn)物含有經(jīng)酰胺鍵共價(jià)連接至內(nèi)酯環(huán)化肽的尾(對(duì)于酵母雙雜交測(cè)定法,這為轉(zhuǎn)錄激活結(jié)構(gòu)域)。套索肽對(duì)于該酵母雙雜交測(cè)定法來(lái)說(shuō)是必需的,因?yàn)檫@種測(cè)定法要求轉(zhuǎn)錄激活結(jié)構(gòu)域連接至環(huán)肽來(lái)激活報(bào)告基因。如下文所討論的,酵母雙雜交測(cè)定法可用于產(chǎn)生針對(duì)給定靶的環(huán)狀和套索肽親和試劑。也可使用其它的激活結(jié)構(gòu)域,例如阻遏結(jié)構(gòu)域、斷裂泛素和本領(lǐng)域已知的其它雙雜交融合物,其如本文所討論。描述了兩種套索蛋白內(nèi)含子前體蛋白,其在環(huán)化反應(yīng)中不經(jīng)歷任何步驟。稱(chēng)為未加工蛋白內(nèi)含子的第一前體蛋白含有突變,所述突變使得在環(huán)化反應(yīng)中不允許進(jìn)行任何步驟。在未加工蛋白內(nèi)含子中,通過(guò)將組合肽、基因組片段或ScFv插在C蛋白內(nèi)含子結(jié)構(gòu)域和N蛋白內(nèi)含子結(jié)構(gòu)域之間而進(jìn)行限制。在未加工蛋白內(nèi)含子中,活性結(jié)構(gòu)域可連接至C蛋白內(nèi)含子或N蛋白內(nèi)含子結(jié)構(gòu)域。稱(chēng)為雙半胱氨酸蛋白內(nèi)含子的第二前體蛋白含有在每一端與半胱氨酸側(cè)翼連接的組合肽、基因組片段或ScFv。半胱氨酸蛋白內(nèi)含子也含有突變,所述突變使得環(huán)化反應(yīng)中的步驟不能進(jìn)行??梢赃x擇與靶分子相互作用的、插在C蛋白內(nèi)含子和N蛋白內(nèi)含子結(jié)構(gòu)域之間的組合肽、ScFv或基因組片段。未加工蛋白內(nèi)含子或雙半胱氨酸蛋白內(nèi)含子可被用作針對(duì)給定靶的親和試劑?;谒鲭摹cFv或基因組片段插入序列的環(huán)肽也可被用作針對(duì)給定靶的親和試劑。雙半胱氨酸蛋白內(nèi)含子中肽插入序列每一端的半胱氨酸也可用于環(huán)化肽、基因組片段或ScFv插入序列,或者是通過(guò)形成二疏鍵,或者是通過(guò)硫醇反應(yīng)性交聯(lián)劑交聯(lián)半胱氨酸。環(huán)肽實(shí)際上^f皮用于產(chǎn)生高親和性藥物樣效應(yīng)子。天然存在的和合成設(shè)計(jì)的環(huán)肽都成功地用作藥物來(lái)治療人類(lèi)疾病(Horswill,A.R.&Benkovic,SJ.(2005)CellCycle4:552-555)。環(huán)肽用作藥物是有優(yōu)勢(shì)的,因?yàn)樗鼈兿鄬?duì)于線(xiàn)性肽具有減弱的蛋白水解敏感性(Humphrey,J.M.&Chamberlin,A.R.(1997)Chem.Rev.97:2243-2266),并且由于它們受限的構(gòu)象空間(結(jié)合時(shí)熵減小(Williamsetal.(2002)J.Biol.Chem.277:7790-7798)),它們展示了對(duì)其把的增強(qiáng)結(jié)合(Horton,D.A.etal.(2002)J.Comput.AidedMol.Des.16:415-430,Li,P.&Roller,P.P.(2002)Curr.Top.Med.Chem.2:325-341)。出于這些原因,需要可快速產(chǎn)生結(jié)合或干擾特異靶的環(huán)肽的方法。一方面,本發(fā)明提供了經(jīng)修飾的蛋白內(nèi)含子文庫(kù)和使用該文庫(kù)篩選與特異靶相互作用或干擾特異過(guò)程的環(huán)肽、基因組片段和ScFv。如本文所討論的,在一些實(shí)施方案中,"特異過(guò)程,,可以為蛋白-蛋白相互作用。在一個(gè)可應(yīng)用于套索蛋白內(nèi)含子、未加工蛋白內(nèi)含子和雙半胱氨酸蛋白內(nèi)含子的實(shí)施方案中,提供了包含與核酸分子可操作地連接的宿主可操作啟動(dòng)子的載體,該核酸分子按順序包含活性結(jié)構(gòu)域、經(jīng)修飾的C蛋白內(nèi)含子、插入序列、經(jīng)修飾的N蛋白內(nèi)含子和轉(zhuǎn)錄終止序列。在另一可應(yīng)用于未加工蛋白內(nèi)含子和雙半胱氨酸蛋白內(nèi)含子的實(shí)施方案中,提供了包含與核酸分子可操作地連接的宿主可操作啟動(dòng)子的載體,該核酸分子按順序包含經(jīng)修飾的C蛋白內(nèi)含子、插入序列、經(jīng)修飾的N蛋白內(nèi)含子、活性結(jié)構(gòu)域和轉(zhuǎn)錄終止序列。在一些實(shí)施方案中,宿主可操作啟動(dòng)子為在宿主中有活性的合適啟動(dòng)子,其可操作地連接至本文所描述的蛋白內(nèi)含子文庫(kù),用于驅(qū)動(dòng)在宿主中的表達(dá)。這些啟動(dòng)子和中止序列的實(shí)例為現(xiàn)有技術(shù)中公知,這些元件在其中有功能的宿主也是公知的。值得注意的是,在一些實(shí)施方案中,可以使用強(qiáng)病毒啟動(dòng)子如SV40或CAMV,而不是強(qiáng)宿主特異啟動(dòng)子。如本領(lǐng)域技術(shù)人員所了解的,這些構(gòu)建體的一個(gè)優(yōu)點(diǎn)是,它們會(huì)在多種宿主中有功能。在其它實(shí)施方案中,可以使用組織特異性啟動(dòng)子或可誘導(dǎo)啟動(dòng)子。在所選的實(shí)施方案中,載體中的宿主可操作啟動(dòng)子為盒,所述盒可容易地采用普通分子生物學(xué)技術(shù)被替換以插入不同表達(dá)盒或該核酸序列上游的啟動(dòng)子盒。如本領(lǐng)域技術(shù)人員所了解的,對(duì)活性結(jié)構(gòu)域的選擇是基于其與第二活性結(jié)構(gòu)域緊密靠近時(shí)形成可檢測(cè)產(chǎn)物的能力。如下文所討論的,使用時(shí),第二活性結(jié)構(gòu)域融合至靶分子,這樣蛋白內(nèi)含子文庫(kù)編碼的環(huán)肽、ScFv或基因組片段與靶分子之間的相互作用使兩活性結(jié)構(gòu)域在一起以產(chǎn)生可檢測(cè)的產(chǎn)物.適合的活性結(jié)構(gòu)域的實(shí)例包括但絕不限于DNA結(jié)合結(jié)構(gòu)域、轉(zhuǎn)錄激活結(jié)構(gòu)域、阻遏結(jié)構(gòu)域、熒光蛋白和定位序列、斷裂-泛素、其它用于蛋白相互作用測(cè)定的結(jié)構(gòu)域(上文所述)、生物素化序列或其它的抗體表位標(biāo)簽和蛋白純化結(jié)構(gòu)域,如His標(biāo)簽或GST。在其它實(shí)施方案中,所述文庫(kù)可以用來(lái)篩選對(duì)特定生物學(xué)過(guò)程或細(xì)胞表型的破壞或改變。如本領(lǐng)域技術(shù)人員所了解的,取決于生物學(xué)過(guò)程或細(xì)胞表型的性質(zhì),可基于檢測(cè)對(duì)生物學(xué)過(guò)程(舉例而言,在特定基質(zhì)或培養(yǎng)基上生長(zhǎng)的能力)或細(xì)胞表型的破壞來(lái)選擇陽(yáng)性物。如本領(lǐng)域技術(shù)人員所了解的,文庫(kù)成員與靶的相互作用可以防止的相互作用。因此,在這些和類(lèi)似的實(shí)施方案中,所述文庫(kù)可以用于鑒定抑制蛋白-蛋白相互作用的候選物。如本領(lǐng)域技術(shù)人員所了解的,In和Ic指?jìng)?cè)翼連接插入序列的N和C蛋白內(nèi)含子結(jié)構(gòu)域。對(duì)蛋白內(nèi)含子結(jié)構(gòu)域進(jìn)行修飾以使得蛋白內(nèi)含子形成套索、未加工蛋白內(nèi)含子或雙半胱氨酸蛋白內(nèi)含子,其將在下文討論0在這些實(shí)施方案中,插入序列包括用于插入編碼隨才幾肽、ScFv或基因組片段的核酸分子的插入位點(diǎn),如下文所討論。如本領(lǐng)域技術(shù)人員所了解的,插入位點(diǎn)可以例如為本領(lǐng)域已知的單個(gè)限制性位點(diǎn)、兩個(gè)鄰近的限制性位點(diǎn)或多克隆位點(diǎn)。例如,插入序列可以包含iVrM/限制酶識(shí)別位點(diǎn),盡管對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)顯而易見(jiàn)的是,可以使用任何適合的限制酶識(shí)別位點(diǎn)。值得進(jìn)一步注意的是,本領(lǐng)域技術(shù)人員可容易地將"適合,,理解為包括因素,所述因素例如但絕不限于載體序列內(nèi)的獨(dú)特性和酶學(xué)活性。PCR也T被用于產(chǎn)生線(xiàn)性化的套索、未加工或雙半胱氨酸載體,其用于插入編碼隨機(jī)肽、ScFv或基因組片段的核酸分子,其如下文所討論。在另一實(shí)施方案中,提供了經(jīng)修飾的蛋白內(nèi)含子套索文庫(kù),其包含與核酸分子可操作地連接的宿主可操作啟動(dòng)子,該核酸分子按順序包含活性結(jié)構(gòu)域、經(jīng)修飾的C-蛋白內(nèi)含子、在其中插入了隨機(jī)肽、ScFv或基因組片段編碼寡核脊酸的插入序列、經(jīng)修飾的N-蛋白內(nèi)含子和轉(zhuǎn)錄中止序列。在這些實(shí)施方案中,將編碼一個(gè)或多個(gè)氨基酸的寡核苷酸插進(jìn)插入序列的插入位點(diǎn)。如以下所討論的,由隨機(jī)肽、ScFv或基因組片段編碼寡核苷酸編碼的氨基酸將形成套索、未加工蛋白內(nèi)含子或雙半胱氨酸蛋白內(nèi)含子的環(huán)。重要的是,注意到,在產(chǎn)生用于隨機(jī)肽或新ScFv的寡核苷酸時(shí),如果終止密碼子被去除或或針對(duì)其進(jìn)行選擇,則提高了方法的效率,因?yàn)樗谢蚧旧纤械牟迦胄蛄卸紝⑿纬森h(huán),但是這不是本發(fā)明的必要特征。此外,重要的是,注意到,寡核苷酸編碼的氨基酸數(shù)量沒(méi)有必需的上限或下限。還有,重要的是,注意到,盡管在制備所述文庫(kù)期間,可能希望采用相同長(zhǎng)度的寡核苷酸(編碼例如6或7或8個(gè)氨基酸)來(lái)產(chǎn)生例如6氨基酸套索文庫(kù),但是在使用時(shí),可對(duì)這些文庫(kù)進(jìn)行組合,如下文所討論的。重要的是,注意到,盡管就特定長(zhǎng)度寡核苷酸而言,當(dāng)然希望所述文庫(kù)含有氨基酸的所有組合(例如,對(duì)于5氨基酸套索,這將是20x20x20x20x20=3200000個(gè)不同的5氨基酸套索),但這絕不是本發(fā)明所必需的。最后,重要的是,注意到,隨機(jī)氨基酸文庫(kù)不必含有全部20種氨基酸。文庫(kù)可由兩種或更多種氨基酸的任意組合構(gòu)成。在一些實(shí)施方案中,經(jīng)修飾的蛋白內(nèi)含子文庫(kù)可以被設(shè)置為用于轉(zhuǎn)化進(jìn)適合的宿主或者可以包含經(jīng)該文庫(kù)轉(zhuǎn)化的宿主細(xì)胞混合物,其^口下文戶(hù)斤i寸論。使用時(shí),經(jīng)修飾的蛋白內(nèi)含子套索文庫(kù)被轉(zhuǎn)化進(jìn)適合的宿主或宿主細(xì)胞或細(xì)胞系中。所述細(xì)胞可以為之前用核酸分子轉(zhuǎn)化或轉(zhuǎn)染的細(xì)胞,該核酸分子編碼融合至如上所述的第二活性結(jié)構(gòu)域的靶分子??蛇x擇地,可以首先導(dǎo)入所述文庫(kù),再導(dǎo)入靶,或者可以用所述文庫(kù)和靶共轉(zhuǎn)化宿主。適合的宿主的實(shí)例包括但絕不限于細(xì)菌、酵母、噬菌體、黑腹果竭(Z)rajo/緣'aMe/a"ogoster)、線(xiàn)蟲(chóng)(C.e/ega"5)、斑馬魚(yú)、小鼠或其它模式生物以及哺乳動(dòng)物細(xì)胞系、昆蟲(chóng)細(xì)胞系等。如本文所討論的,如果特異的經(jīng)修飾的蛋白內(nèi)含子文庫(kù)成員與靶分子相互作用,則產(chǎn)生可檢測(cè)的產(chǎn)物,并且可從表達(dá)可檢測(cè)產(chǎn)物的宿主細(xì)胞中回收該特異的蛋白內(nèi)含子文庫(kù)成員并對(duì)其測(cè)序。在這種篩選中分離的這類(lèi)肽的實(shí)例在下文提供。相應(yīng)地,在本發(fā)明的一方面,提供了由上述方法鑒定的環(huán)肽。如本領(lǐng)域技術(shù)人員所了解的,活性緒構(gòu)域可與其連接的任何分子都可以用作靶。值得注意的是,如本文所述,采用作為本方法基礎(chǔ)的酵母雙雜交系統(tǒng)已經(jīng)鑒定了廣泛種類(lèi)肽的大量的蛋白-蛋白相互作用。如本文所討論,蛋白內(nèi)含子序列經(jīng)修飾以產(chǎn)生套索結(jié)構(gòu),其經(jīng)歷部分蛋白內(nèi)含子反應(yīng),產(chǎn)生具有環(huán)狀"環(huán)"和連接活性結(jié)構(gòu)域的N末端尾的套索。未加工蛋白內(nèi)含子和雙半胱氨酸蛋白內(nèi)含子不經(jīng)歷蛋白內(nèi)含子反應(yīng)的任何步驟,因此活性結(jié)構(gòu)域可添加到C末端或N末端。通過(guò)對(duì)蛋白內(nèi)含子序列進(jìn)行特定突變,因而阻斷蛋白內(nèi)含子的完全加工,來(lái)產(chǎn)生套索、未加工蛋白內(nèi)含子和雙半胱氨酸蛋白內(nèi)含子。蛋白內(nèi)含子構(gòu)建體的編號(hào)方案已經(jīng)開(kāi)發(fā)了編號(hào)方案來(lái)協(xié)助比較異源或外源蛋白內(nèi)含子。該協(xié)議對(duì)蛋白內(nèi)含子的氨基酸順序編號(hào),從N末端到C末端,于蛋白內(nèi)含子的第一殘基起始,蛋白內(nèi)含子的最后一個(gè)殘基結(jié)束。斷裂蛋白內(nèi)含子使這種命名協(xié)議復(fù)雜化,并因此使用以下的編號(hào)方案(i)lN蛋白內(nèi)含子結(jié)構(gòu)域從N末端到C末端編號(hào){^+1,In+2,In+3...};(ii)蛋白外顯子從C末端到N末端編號(hào)"n.i,IN.2,In.3…)或者從N末端到C末端編號(hào)(Ic+i,Ic+2,Ic+3...};(ii)隨后Ic蛋白內(nèi)含子結(jié)構(gòu)域從蛋白內(nèi)含子的C末端到N末端編號(hào)(Ic-"Ic_2,IC-3...}(Perler,RB.(2002).Nucl.AcidsRes.30:383-384)。這種編號(hào)系統(tǒng)使得難以在不同蛋白內(nèi)含子之間比較不與剪接位點(diǎn)接近的保守氨基酸位點(diǎn)。為了方便指出這些保守氨基酸,本發(fā)明制定了基于保守蛋白內(nèi)含子基序的命名方案。通過(guò)比較蛋白內(nèi)含子氨基酸序列,觀察到數(shù)個(gè)保守的基序(motif)。對(duì)這些基序有兩個(gè)命名法(i)模塊A、B、C、D、E、H、F、G(Pietrokovski,S(1994)ProteinSci3:2340-50:Telenti,A.etal.(1997)J.Bacteriol.179:6378-82)和(ii)模塊Nl、N3、EN1、EN2、EN3、EN4、C2和CI(Pietrokovski,S.(1998)ProteinSci.7:64-71)。本發(fā)明使用A、B、C、D、E、H、F、G命名法,并且從N末端到C末端,對(duì)保守模塊中的每個(gè)氨基酸位置指定一個(gè)數(shù)字。例如,Ic+1,其在才莫塊G中為從N末端起的第8個(gè)氨基酸,標(biāo)記為G8。類(lèi)似地,IN+i,其為模塊A中從N末端起的第1個(gè)氨基酸,標(biāo)記為Al。IN蛋白內(nèi)含子結(jié)構(gòu)域含有模塊A和B,Ic蛋白內(nèi)含子結(jié)構(gòu)域含有模塊F和G。待環(huán)化區(qū)域或蛋白外顯子從N末端向C末端編號(hào)(Icw,Ic+2,Ic+3,...,In-3,IN.2,IwK關(guān)于編號(hào)方案參見(jiàn)圖8)。在本文中,位于剪接點(diǎn)5氨基酸以?xún)?nèi)的氨基酸將采用兩種協(xié)議命名,即Icw(G8)。離剪接點(diǎn)5個(gè)氨基酸以上的氨基酸將采用它們保守的模塊和氨基酸編號(hào)指出。蛋白內(nèi)含子介導(dǎo)的蛋白剪接的機(jī)制對(duì)于蛋白內(nèi)含子介導(dǎo)的蛋白剪接提出了兩種機(jī)制。第一種是最常見(jiàn)的,稱(chēng)為"標(biāo)準(zhǔn)"機(jī)制(圖9)。第二種較不常見(jiàn)的機(jī)制稱(chēng)為"非標(biāo)準(zhǔn)"機(jī)制(圖10)。標(biāo)準(zhǔn)機(jī)制中的步驟1涉及位置IN+1(Al)處的N-X酰基轉(zhuǎn)換(其中X-Cys或Ser)。酰基轉(zhuǎn)換向肽的酰胺骨架引入了疏酯或酯。酯鍵比酰胺鍵更不穩(wěn)定,因此為步驟2(酯交換反應(yīng))提供了良好的離去基團(tuán)。酯鍵的形成還使酯鍵在步驟2(酯交換反應(yīng))中處于Ic+1(G8)Ser35或Cys親核試劑攻擊的位置(Southworth,M.W.etal.(2000)EMBOJ.19:5019-5026,Poland,B.W.etal.(2000)J.Biol.Chem.275:16408-16413)。在步驟2(酯交換反應(yīng))中,位置Icw(G8)的Cys、Ser或Thr可用作親核試劑與步驟1(N-X?;D(zhuǎn)換)中形成的硫酯或酯鍵反應(yīng)。這導(dǎo)致Iw結(jié)構(gòu)域在位置IN+1(Al)和1^的氨基酸之間從蛋白內(nèi)含子的切割,并通過(guò)Ic+!(G8)和Iw之間的硫酯或酯鍵形成分支中間物。在步驟3中,Asn環(huán)化切割了連接Ic+1(G8)和(G7)位置上氨基酸的酰胺鍵并釋放蛋白外顯子,其含有Ic+1(G8)和Iw之間的硫酯或酯鍵。Gln也出現(xiàn)在位置Id(G7),并經(jīng)歷類(lèi)似的環(huán)化反應(yīng)(Pietrokovski,S.(1998)ProteinSci.7:64-71)。最后一步,內(nèi)酯向內(nèi)酰胺的轉(zhuǎn)化將蛋白外顯子中Ic+i(G8)和IN_t之間的酯鍵轉(zhuǎn)變?yōu)轷0锋I?;贗nBase數(shù)據(jù)庫(kù)中的344條蛋白內(nèi)含子序列(Perler,RB.(2002).Nucl.AcidsRes.30:383-384),以下氨基酸出現(xiàn)在上述位置Cys(281/344)和Ser(34/344)出現(xiàn)在位置IN+1(Al);Cys(139/344)、Ser(120/344)和Thr(81/344)出現(xiàn)在位置Ic+i(G8);Asn(327/344)和Gin(15/344)出現(xiàn)在位置I"(G7)。在非標(biāo)準(zhǔn)機(jī)制中,沒(méi)有N-X?;D(zhuǎn)換(標(biāo)準(zhǔn)機(jī)制中的步驟1)。對(duì)于采用非標(biāo)準(zhǔn)機(jī)制的蛋白內(nèi)含子而言,位置&+1(Al)的Ser或Cys由Ala替換。InBase(Perler,RB.(2002)Nuct.AcidsRes.30:383-384)中,Ala在25/344蛋白內(nèi)含子中存在于IN+1(Al)。在IN+1(Al)位置具有Ala的蛋白內(nèi)含子利用位置Icw(G8)處的氨基酸,經(jīng)歷對(duì)1^至IN+1(Al)的肽骨架的直接親核攻擊(圖10)(Southworth,M.W.etal.(2000)EMBOJ.19:5019-5026)。在采用非標(biāo)準(zhǔn)機(jī)制的蛋白內(nèi)含子中不需要步驟1(N-X?;D(zhuǎn)換),因?yàn)閷?duì)于Ic+"G8)處的親核試劑的直接攻擊,已經(jīng)排列了酰胺鍵,因此它們不需要步驟l(N-X酰基轉(zhuǎn)換)產(chǎn)生的骨架延伸(Southworth,M.W.etal.(2000)EMBOJ.19:5019-5026,Poland,B.W.etal.(2000)J.Biol.Chem.275:16408-16413)。在直接參與到剪接的3個(gè)位置(Ic+"G8)、Icm(G7)和IN+1(Al))也觀察到其它的氨基酸替代。這些蛋白內(nèi)含子也可以使用不用于標(biāo)準(zhǔn)機(jī)制的蛋白內(nèi)含子剪接機(jī)制。例如,曾鑒定Asp在Id(G7)處替換Asn(1/344)(Amitai,G.etal.(2004)J.Biol.Chem.279:3121-3131)。這種蛋白內(nèi)含子可以在標(biāo)準(zhǔn)機(jī)制的步驟3(Asn環(huán)化)中經(jīng)歷Asp環(huán)化。但是即使Asp突變?yōu)锳la,這種蛋白內(nèi)含子仍能夠剪接,這表明還有未確定的蛋白內(nèi)含子剪接的非標(biāo)準(zhǔn)機(jī)制(Amitai,Getal.(2004)J.Biol.Chem.279:3121-3131)。已經(jīng)鑒定了數(shù)種其它的蛋白內(nèi)含子,它們也在直接涉及剪接的3氨基酸(Ic+KG8)、Id(G7)和I^(Al))處具有其它的氨基酸。對(duì)于這些蛋白內(nèi)含子,還沒(méi)有關(guān)于它們剪接機(jī)制或它們是否能夠剪接的信息。在所指出位置含有其它氨基酸的這些蛋白內(nèi)含子的一些實(shí)例包括位置IN+1(Al)的Gin(2/344)(CATerA和/V'£XORF11蛋白內(nèi)含子)、Met(1/344)(尸/z/^XORF40蛋白內(nèi)含子)和Pro(1/344)(M>eDnaB蛋白內(nèi)含子);位置Ic+"G8)的Val(2/344)(C^ATpase和尸yFha)、Gly(1/344)(AvinPIR1)和Tyr(1/344)(M附agMagn8951);以及位置Icm(G7)的His(1/344)(MgaSuffi(MgaPpsl))。描述蛋白內(nèi)含子反應(yīng)中的中間體結(jié)構(gòu)對(duì)蛋白內(nèi)含子介導(dǎo)的剪接機(jī)制的了解使得我們能夠在該機(jī)制的不同點(diǎn)中斷剪接并分離出在很多生物學(xué)應(yīng)用中有用的突變蛋白內(nèi)含子。本發(fā)明中描述的突變蛋白內(nèi)含子指在蛋白內(nèi)含子介導(dǎo)的蛋白環(huán)化反應(yīng)中的突變體(圖11)。這些突變體稱(chēng)為未加工蛋白內(nèi)含子、雙半胱氨酸蛋白內(nèi)含子和套索蛋白內(nèi)含子。這3種蛋白內(nèi)含子以產(chǎn)生它們所需的突變來(lái)描述。為了產(chǎn)生未加工蛋白內(nèi)含子,需要抑制步驟2(酯交換反應(yīng))。酯交換反應(yīng)釋放Iw結(jié)構(gòu)域。如果Iw結(jié)構(gòu)域被釋放,則負(fù)責(zé)這種突變體支架能力的Ic-lN結(jié)構(gòu)域相互作用被破壞。為了進(jìn)一步穩(wěn)定未加工蛋白內(nèi)含子,步驟1(N-X?;D(zhuǎn)換)也應(yīng)該被抑制。步驟1(N-X?;D(zhuǎn)換)導(dǎo)致蛋白外顯子-lN連接點(diǎn)處、lN-i和lNW(Al)之間形成硫酯或酯鍵。硫酯鍵或酯鍵比酰胺鍵更容易水解。水解導(dǎo)致在蛋白外顯子-lN連接點(diǎn)處的切割并釋放In結(jié)枸域。由于Asn環(huán)化(步驟3),Id(G7)和IC+1(G8)之間Ic-蛋白外顯子連接點(diǎn)處的切割也以低速率發(fā)生(Xu,M.&Perler,F.B.(1996)EMBOJ.15:5146-5153)。為了針對(duì)Asn環(huán)化對(duì)Ic-蛋白外顯子的切割而穩(wěn)定蛋白內(nèi)含子,步驟3(Asn環(huán)化)也應(yīng)該被抑制。抑制蛋白內(nèi)含子反應(yīng)中的全部3個(gè)步驟(N-X?;D(zhuǎn)換、酯交換反應(yīng)和Asn環(huán)化)產(chǎn)生最穩(wěn)定的未加工蛋白內(nèi)含子(Xu,M.&Perler,F(xiàn).B.(1996)EMBOJ.15:5146-5153)。雙半胱氨酸蛋白內(nèi)含子在Icw(G8)和IN+1(Al)位置上具有Cys,它們用于交聯(lián)與靶相互作用的肽、基因組片段或ScFv。因?yàn)檫@些氨基酸可在蛋白內(nèi)含子反應(yīng)的步驟1(N-X?;D(zhuǎn)換)和步驟2(酯交換反應(yīng))中起親核試劑的作用,所以需要抑制這些步驟而不突變這些Cys的策略。最低限度,步驟2(酯交換反應(yīng))需要被抑制以防止在Ic+!(G8)和蛋白外顯子的最后殘基I^之間形成不穩(wěn)定的硫酯鍵(其導(dǎo)致對(duì)lN結(jié)構(gòu)域的切割)。與未加工蛋白內(nèi)含子類(lèi)似,可通過(guò)抑制步驟l(N-X酰基轉(zhuǎn)換)來(lái)穩(wěn)定雙半胱氨酸蛋白內(nèi)含子,其防止了蛋白外顯子-lN酯或硫酯的水解??赏ㄟ^(guò)抑制步驟3(Asn環(huán)化)來(lái)進(jìn)一步穩(wěn)定雙半胱氨酸蛋白內(nèi)含子,其防止了Id(G7)和Ic+"G8)之間的Ic-蛋白外顯子切割。通過(guò)在蛋白內(nèi)含子反應(yīng)中抑制步驟3(Asn環(huán)化)來(lái)產(chǎn)生套索蛋白內(nèi)含子。套索蛋白內(nèi)含子是通過(guò)內(nèi)酯鍵環(huán)化,這比酰胺鍵更容易水解??赏ㄟ^(guò)抑制內(nèi)酯鍵的水解來(lái)進(jìn)一步穩(wěn)定套索。抑制蛋白內(nèi)含子反應(yīng)中的步驟的方法概述如下文所述,這些策略可單獨(dú)使用,或者組合4吏用以產(chǎn)生未加工蛋白內(nèi)含子、雙半胱氨酸蛋白內(nèi)含子或套索蛋白內(nèi)含子。步驟l:N-X?;D(zhuǎn)換N-X?;D(zhuǎn)換涉及IN+1(Al)親核試劑,其通常為Ser或Cys。盡管Thr通常不存在于位置IN+1(Al),但是它也可以在步驟1(N-X酰基轉(zhuǎn)換)中潛在地起親核試劑的作用。步驟l(N-X酰基轉(zhuǎn)換)產(chǎn)生替換IN+1(Al)殘基和殘基(蛋白外顯子的最后一個(gè)殘基)間酰胺鍵的酯鍵或硫酯鍵。酯或硫酯為步驟2(酯交換反應(yīng))形成良好的離去基團(tuán),但是酯或疏酯鍵容易水解,這可導(dǎo)致蛋白外顯子-lN在I^和lN+!(Al)之間的切割。因此,如果步驟2(酯交換反應(yīng))被抑制,則水解導(dǎo)致的In切割會(huì)成為副產(chǎn)物。參與催化N-X?;D(zhuǎn)換的氨基酸的突變可阻斷蛋白內(nèi)含子反應(yīng)中的步驟1。在其中形成N-X?;I的催化口袋含有模塊B中的氨基酸B7(Thr69&PDnaE、Thr70^DnaB)、B9(Asn72&PDnaB)、B10(His72~DnaE、His73卸DnaB),模塊F中的氨基酸F2(Vall34~DnaB)、F3(Phel39鄉(xiāng)DnaE)、F4(Aspl40&pDnaE),模塊A和B之間的氨基酸Arg50&PDnaE、Thr51~DnaB、Lys54&pDnaB,模塊A中的親核試劑Al(Cysl^DnaE)、模塊A中的鄰近氨基酸A2(Leu2鄉(xiāng)DnaE),以及蛋白外顯子的最后一個(gè)殘基(Sun,P.etal.(2005)J.Mol.Biol.353:1093-1105,Ding,Y.etal.(2003)J.Biol.Chem.278:39133-39142)。以下的策略可用于抑制蛋白內(nèi)含子反應(yīng)中的步驟1(N-X?;D(zhuǎn)換)。這些策略可用于產(chǎn)生未加工蛋白內(nèi)含子和雙半胱氨酸蛋白內(nèi)含子。策略l.l:突變I,(A1)親核試劑。lNw(Al)突變?yōu)榉怯H核氨基酸防止了酉旨或硫酯的形成(Ding,Y,etal.(2003)J.Biol.Chem.278:39133-39142,Sun,P.etal.(2005)J.Mol.Biol.353:1093-1105,Xu,M.&Perler,RB.(1996)EMBOJ.15:5146-5153)。位置IN+1(Al)處的Ser突變?yōu)锳la阻止了尸spPol-I蛋白內(nèi)含子中的步驟1(N-X酰基轉(zhuǎn)換)(Xu:M.&Perler,F.B.(1996)EMBOJ.15:5146國(guó)5153)。位置IN+1(Al)處的Cys突變?yōu)锳rg、Gly或Val抑制了《SceVMA蛋白內(nèi)含子中的步驟1(N-X?;D(zhuǎn)換)(Cooper,A.A.etal.(1993)EMBOJ.12:2575-2583)。當(dāng)位置IN+1處的親核試劑突變?yōu)榱硪挥H核氨基酸時(shí),很多蛋白內(nèi)含子被抑制。一些實(shí)例包括i^/Pol-I蛋白內(nèi)含子,當(dāng)SerIN+1(Al)突變?yōu)镃ys時(shí),剪接效率4氐,當(dāng)Ser突變?yōu)門(mén)hr時(shí),則完全阻斷(Xu,M.&Perler,F.B.(1996)EMBOJ.15:5146-5153)。類(lèi)似地,SeeVMA1蛋白內(nèi)含子不能容忍IN+i(Al)處的Cys突變?yōu)镾er(Hirata,R.&Anraku,Y.(1992)Biochem.Biophys.Res.Commun.188:40-47,Cooper,A.A.etal.(1993)EMBOJ.12:2575-2583)。策略1.1可用于抑制采用標(biāo)準(zhǔn)才幾制的蛋白內(nèi)含子中的步驟1(N-X?;D(zhuǎn)換)。策略1.2:F3氨基酸的突變。分析&;DnaE、PISee/和DnaB蛋白內(nèi)含子結(jié)構(gòu)揭示出F3位置的氨基酸位于催化口袋(N-X?;I在這里形成)中。DnaE中位置F3處Phe突變?yōu)锳la抑制了和IN+1之間酉旨或硫酯的形成(Ghosh,I.etal.(2001)J.Biol.Chem.276:24051-24058)。策略1.3:突交Inw(Al)氫鍵距離內(nèi)的氨基酸。分析&pDnaE、PISce/和&pDnaB蛋白內(nèi)含子結(jié)構(gòu)揭示出&/DnaE內(nèi)的Arg50(Sun,P.etal.(2005)J.Mol.Biol.353:1093-1105)和DnaB內(nèi)的Thr51(Ding,Y.etal.(2003)J.Biol.Chem.278:39133國(guó)39142)與IN+i(Al)親核試劑相互作用。根據(jù)可選擇的實(shí)施方案,突變Ijw(Al)氫鍵距離內(nèi)的氨基酸可以用于破壞步驟1(N-X?;D(zhuǎn)換)或步驟2(酯交換反應(yīng))。在可選擇的方面,阻斷步驟1的突變相應(yīng)地可以包括位置B9、B10或F2(與SspDnaE內(nèi)的Arg50和SspDnaB內(nèi)的Thd等價(jià)的氨基酸)的替換,包括這些位置處的非催化性氨基酸的替換。步驟2:酯交換反應(yīng)酯交換反應(yīng)涉及位置Ic+1(G8)的親核氨基酸攻擊步驟1(N-X?;D(zhuǎn)換)中形成的酯或硫酯鍵,這導(dǎo)致了Ic+1(G8)和I^之間酯或硫酯鍵的形成。酯交換反應(yīng)從Ic-蛋白外顯子結(jié)構(gòu)域(斷裂蛋白內(nèi)含子產(chǎn)物)釋放IN結(jié)構(gòu)域。在Iqm(G8)殘基和I^之間形成的酯或硫酯鍵可以潛在地被水解而產(chǎn)生由Ic-蛋白外顯子構(gòu)成的線(xiàn)性蛋白內(nèi)含子產(chǎn)物(斷裂蛋白內(nèi)含子產(chǎn)物)。發(fā)現(xiàn)催化口袋中Ic+2和Iw用于酯交換反應(yīng),并且有可能影響剪接。以下的策略可用于抑制蛋白內(nèi)含子反應(yīng)中的步驟2(酉旨交換反應(yīng))。這些策略可用于產(chǎn)生未加工蛋白內(nèi)含子和雙半胱氨酸蛋白內(nèi)含子。策略2.1:Ic+1(G8)親核試劑的突變。Ic+1(G8)位置的氨基酸在酯交換反應(yīng)中起親核試劑的作用。Ic+1(G8)位置的親核氨基酸的突變抑制酯交換反應(yīng)。例如,以下的在IcM(G8)位置的突變阻斷酯交換反應(yīng)Psppol蛋白內(nèi)含子中Ser突變?yōu)锳la(Xu,M.&Perler,F.B.(1996)EMBOJ.15:5146-5153);Klb蛋白內(nèi)含子中Cys突變?yōu)锳la(Southworth,M.W.etal.(2000)EMBOJ.19:5019-5026);以及SeeTfpl蛋白內(nèi)含子中Cys突變?yōu)锳rg、Gly或Val(Cooper,A.A.etal.(1993)EMBOJ.12:2575-2583)。<SceVMA蛋白內(nèi)含子中,當(dāng)Ic+1(G8)Cys突變?yōu)镻ro時(shí),在體外Asn環(huán)化被強(qiáng)烈抑制;被Val、Ile、Asp、Glu、Lys、Arg和His中度至強(qiáng)烈抑制;被Gly、Leu、Asn、Trp、Phe和Tyr中度抑制;故Met、Ala、Gin較弱抑制(NewEnglandBiolabs,IMPACTTM-CN蛋白純化系統(tǒng))。在SeeVMA蛋白內(nèi)含子中,Ic+1(G8)處Cys突變?yōu)镾er抑制了酯交換反應(yīng),但是穩(wěn)定了分支中間體(Chong,S.etal.(1996)J.Biol.Chem.271:22159-22168,Cooper,A.A.etal.(1993)EMBOJ,12:2575-2583)。在Ic+1(G8)位置采用其它親核氨基酸,某些蛋白內(nèi)含子不能起作用(Shingledecker,K.etal.(2000)ArchivesBiochem.Biophys.375:138-144)。例如,在尸s/Pol-I蛋白內(nèi)含子中,當(dāng)SerIc+1(G8)突變?yōu)镃ys或Thr時(shí),步驟2(酯交換反應(yīng))被抑制(Xu,M.&Perler,F.B.(1996)EMBOJ.15:5146-5153)。類(lèi)似地,在SeeVMA1蛋白內(nèi)含子中,位置Ic+1(G8)處Cys突變?yōu)镾er抑制了步驟2(酯交換反應(yīng))(Hirata,R.&Anraku,Y.(1992)Biochem.Biophys.Res.Commun.188:40-47)。策略2.2:突變B7氨基酸。分析DnaE、PISce/和&pDnaB蛋白內(nèi)含子結(jié)構(gòu)提示位置B7處的氨基酸參與了步驟2(酯交換反應(yīng))。位置B7的氨基酸(Thr69&pDnaE(Sun,P.etal.(2005)J.Mol.Biol.353:1093-1105)、Thr73鄉(xiāng)DnaE(Ding,Y.etal.(2003)J.Biol.Chem.278:39133國(guó)39142)以及Asp76PI5ce/(Werner,E.etal.(2002)Nucl.AcidRes.30:3962-3971))穩(wěn)定了位置IN+1(Al)處Cys的羰基氧。突變研究證實(shí)了B7在步驟2(酯交換反應(yīng))中的作用。位置B7處的Thr突變?yōu)锳la抑制了ApDnaE蛋白內(nèi)含子中的酯交換反應(yīng);在體外可通過(guò)切割酯或硫酯鍵的DTT誘導(dǎo)In切割,表明帶有這種突變時(shí)發(fā)生步驟1(N-X?;D(zhuǎn)換)以及可能的步驟2(酯交換反應(yīng))(Ghosh,I.etal.(2001)J.Biol.Chem.2了6:24051-24058)。其它的以A^'aKlbA蛋白內(nèi)含子(其使用非標(biāo)準(zhǔn)機(jī)制)進(jìn)行的實(shí)驗(yàn)顯示,位置B7處的Thr突變?yōu)锳la抑制了DTT存在下的酯或硫酯切割(Southworth,M.W.etal.(2000)EMBOJ.19:5019-5026)。在A(/aKlbA蛋白內(nèi)含子中,Ic+1親核試劑直接攻擊IN.i和IN+1(Al)之間的酰胺鍵,對(duì)DTT敏感的唯一鍵為步驟2(酯交換反應(yīng))形成的分支中間體中的酯或硫酯。這表明步驟2(酯交換反應(yīng))被位置B7處的突變所抑制。策略2.3:B10氨基酸的突變。分析DnaE、PISce/和&pDnaB蛋白內(nèi)含子結(jié)構(gòu)提示B10參與了Iw-蛋白外顯子剪接。位置B10處的氨基酸(His72^Dn化(Sun,P.etal.(2005)J.Mol.Biol.353:1093-1105),His73&pDnaB(Ding,Y.etal.(2003)J.Biol.Chem.278:39133-39142)以及His79p"ce/(Werner,E.etal.(2002)Nucl.AcidRes.30:3962畫(huà)3971》與位置Al(I,)處的Cysl鄉(xiāng)Dn必的酰胺氮形成氫鍵。突變研究證實(shí)了其在酯交換反應(yīng)中的作用。位置B10處的His突變?yōu)锳la阻止了&pDnaE蛋白內(nèi)含子中的剪接,但是在體外采用切割酯或疏酯鍵的DTT可誘導(dǎo)In切割,表明帶有BIO突變時(shí)發(fā)生了步驟1(N-X?;D(zhuǎn)換)(Ghosh,I.etal.(2001)J.Biol.Chem.276:24051-24058)。其它的以爭(zhēng)KlbA蛋白內(nèi)含子(其使用非標(biāo)準(zhǔn)^^制)進(jìn)行的實(shí)驗(yàn)顯示,位置BIO處的His突變?yōu)锳la抑制了DTT存在下的酯或硫酯切割(Southworth,M.W.etal.(2000)EMBOJ.19:5019-5026)。在A^aKlbA蛋白內(nèi)含子中,Ic+1親核試劑直接攻擊IN.i和IN+1(Al)之間的酰胺鍵,對(duì)DTT敏感的唯一鍵為步驟2(酯交換反應(yīng))形成的分支中間體中的酯或硫酯。這表明步驟2(酯交換反應(yīng))被位置BIO處的突變所抑制。策略2.4:在剪接位點(diǎn)附近引入帶電氨基酸。尸^Pol中位置lN+2(A2)的Leu突變?yōu)長(zhǎng)ys或尸j/Po1中位置Ic.2(G6)的Ala突變?yōu)長(zhǎng)ys阻止了對(duì)IN結(jié)構(gòu)域的切割(Xu,M.&Perler,F(xiàn).B.(1996)EMBOJ.15:5146-5153)。5"ceVMA蛋白內(nèi)含子中位置Ic.2(G6)的Val突變?yōu)锳rg或Phe阻斷了剪接,但是Ser、Cys、Ile和Gly突變不抑制剪接(Cooper,A.A.etal.(1993)EMBOJ.12:2575-2583)。在位置IN+2(A2)和Ic.2(G6)引入電荷的突變應(yīng)該會(huì)抑制酯交換反應(yīng)。策略2.5:突變F4氨基酸。分析蛋白內(nèi)含子結(jié)構(gòu)揭示,位置F4氨基酸(Asp140^DnaE)與(Ty^鄉(xiāng)DnaE)氨基酸的羰基氧形成氫鍵(Sun,P.etal.(2005)J.Mol.Biol.353:1093-1105)。SspDnaE蛋白內(nèi)含子中Aspl40突變?yōu)锳la會(huì)阻止剪接(Ghosh,I.etal.(2001)J.Biol.Chem.276:24051-24058)。策略2.6:鋅介導(dǎo)的抑制。鋅與Icw(G8)親核試劑配位并阻止剪接(Mills,K.V.&Paulus,H.(2001)J.Biol.Chem.276:10832-10838)。以大于10pM的濃度添加鋅將阻斷酯交換反應(yīng)。策略2.7:位置F6的氨基酸與Ser(G8)配位,用于攻擊步驟1中形成的硫酯。因此,位置F6處突變?yōu)榉谴呋詺埢梢杂糜谧钄嗖襟E2。步驟3:Asn環(huán)化步驟3(Asn環(huán)化)導(dǎo)致從蛋白外顯子切除Ic結(jié)構(gòu)域。這個(gè)步驟的最常見(jiàn)機(jī)制涉及到Asn環(huán)化。InBase數(shù)據(jù)庫(kù)中344個(gè)蛋白內(nèi)含子中的327個(gè)采用了這種機(jī)制。第二種最常見(jiàn)的方法涉及Gln環(huán)化,其^皮InBase數(shù)據(jù)庫(kù)中344個(gè)蛋白內(nèi)含子中的15個(gè)采用。以下的氨基酸對(duì)于形成用于Asn環(huán)化的催化口袋是重要的BlockB:Bll(Arg73鄉(xiāng)DnaE);模塊F:F5(Leul37鄉(xiāng)DnaB)、F6(Thrl38鄉(xiāng)DnaB)、F7(Vall39^Dn必、Leul43鄉(xiāng)onaE)、F13(Hisl43&pDnaB、Hisl47&pDnaE);模塊G:G6(Hisl53~DnaB)、G7(Asnl54&;DnaB、Asnl59~DnaE)、G8(Serl55&pDnaE、Cysl60&pDna)、蛋白外顯子的第二殘基(Ic+2)、以及蛋白外顯子的最后一個(gè)殘基(lN.D(Sun,P.etal.(2005)J.Mol.Biol.353:1093-1105,Ding,Y.elal.(2003)J.Biol.Chem.278:39133-39142)。為了產(chǎn)生套索蛋白內(nèi)含子、未加工蛋白內(nèi)含子和雙半胱氨酸蛋白內(nèi)含子,需要阻斷Asn環(huán)化的突變。已開(kāi)發(fā)了以下的策略抑制Asn環(huán)化。策略3.1:突變位置ItM(G7)處的氨基酸。突變位置Id(G7)處的氨基酸為任何非天然氨基酸都抑制步驟3(Asn環(huán)化)。位置Id(G7)處的Asn突變?yōu)镚ln和Asp可能不會(huì)阻斷步驟3(Asn環(huán)化)(Amitai,G.etal.(2004)J.Biol.Chem.279:3121-3131),因此應(yīng)該避免。SceTfpl蛋白內(nèi)含子中位置Id(G7)處的Asn突變?yōu)長(zhǎng)ys、Ala、Tyr、Gln、Glu、His和Asp都抑制步驟3(Asn環(huán)化)(Cooper,A.A.etal.(1993)EMBOJ,12:2575-2583)。除了抑制步驟3(Asn環(huán)化),位置Iw(G7)處的Asn突變?yōu)槭杷园被嵋部梢苑€(wěn)定步驟2(酯交換反應(yīng))中形成的酯或硫酯。這種推測(cè)是基于當(dāng)位置Ic2(G6)處的His突變?yōu)長(zhǎng)eu、Asn或Gin時(shí)觀察到分支中間體的積累(Xu,M.&Perler,F.B.(1996)EMBOJ.4315:5146-5153)。因此,位置Id(G7)處的Asn的某些突變可以穩(wěn)定套索。當(dāng)SeeVMA蛋白內(nèi)含子中位置Id(G7)處的Asn突變時(shí),觀察到分支中間體積累,這進(jìn)一步支持了這種推測(cè)。位置Id(G7)處的Asn突變?yōu)镾er或Ala(Chong,S.etal.(1996)J.Biol.Chem.271:22159-22168)不會(huì)導(dǎo)致分支中間體的積累,但是位置Ic.,(G7)處的Asn突變?yōu)長(zhǎng)ys導(dǎo)致了分支中間體的積累(KawasakiM.etal.(1997)J.Biol.Chem.272:15668-15674)。SeeVMA蛋白內(nèi)含子中,.位置Id(G7)處的Asn突變?yōu)锳la并且位置Ic+"G8)處的Cys突變?yōu)镾er導(dǎo)致分支中間體的積累(Chong,S.etal.(1996)J.Biol.Chem.271:22159-22168)。酯交換反應(yīng)中形成的酯或硫酯鍵的周?chē)h(huán)境似乎在穩(wěn)定分支中間體方面起作用。策略3.2:突變與位置Id(G7)處的Asn羰基氧形成氫鍵的位置G6(Ic2)或Bll處的氨基酸。位置Ic_2(G6)處的His通過(guò)與位置IcM(G7)處的Asn羰基氧形成氫鍵而使這個(gè)肽鍵更不穩(wěn)定(Klabunde,T.etal.(1998)Nat.Struct.Biol.5:31-36,Duan,X.etal.(1997)Cell89:555-564),來(lái)協(xié)助Asn環(huán)化(Xu,M.&Perier,F(xiàn).B.(1996)EMBOJ.15:5146-5153)。但是,在位置Ic.2(G6)處具有Ala而不是His的DnaE和其它蛋白內(nèi)含子中,關(guān)于位置IC-2(G6)在步驟3(Asn環(huán)化)中的作用的報(bào)道不一致。對(duì)DnaE(Sun,P.etal.(2005)J.Mol.Biol.353:1093-1105)和&pDnaB(Ding,Y.etal.(2003)J.Biol.Chem.278:39133-39142)的結(jié)構(gòu)分析提供了對(duì)位置Ic-2(G6)處氨基酸作用的了解。在DnaB蛋白內(nèi)含子中,位置Ic_2(G6)處His結(jié)合位置Id(G7)處的Asn羰基氧。在DnaE蛋白內(nèi)含子中,位置Bll處的Arg結(jié)合位置(G7)處的Asn羰基氧(Ding,Y.etal.(2003)J.Biol.Chem.278:39133-39142)。采用His或Arg與Asn羰基氧相互作用取決于蛋白內(nèi)含子中的殘基。蛋白外顯子中位置(Ic+2)的Phe和位置(&.4)的Phe形成疏水口袋,與位置Ic_2(G6)處的His的咪唑環(huán)相互作用,這防止了其與位置Id(G7)處的Asn羰基氧相互作用(Sun,P.etal.(2005)J.Mol.Biol.353:1093-1105)。尸^pol-I蛋白內(nèi)含子中位置Ic.2(G6)處的His突變?yōu)長(zhǎng)eu、Asn和Gin導(dǎo)致分支中間體的積累(Xu,M.&Perler,F(xiàn).B.(1996)EMBOJ.15:5146-5153)。HisIc.2(G6)突變?yōu)镚in防止了SeeVMA蛋白內(nèi)含子中的Ans環(huán)化(NewEnglandBiolabs,IMPACTTM-CN蛋白純化系統(tǒng))。但是當(dāng)位置Ic.2(G6)的His突變?yōu)長(zhǎng)eu并且位置(G7)處Asn突變?yōu)锳la,則無(wú)分支中間體積累,表明Asn對(duì)于分支中間體積累是重要的。目前,還沒(méi)有關(guān)于位置B11處的Arg在積累分支中間體中的作用的i秀變研究。策略3.3:突變位置F13處的氨基酸。&/DnaB蛋白內(nèi)含子中位置F13處的His突變?yōu)镚in阻斷了步驟3(Asn環(huán)化)(Ding,Y.etal.(2003)J.Biol.Chem.278:39133-39142)。&pDnaB蛋白內(nèi)含子中位置F13處的His突變?yōu)锳la僅部分地抑制步驟3(Asn環(huán)化)(Ding,Y.etal.(2003)J.Biol.Chem.278:39133-39142)。策略3.4:突變位置F14處的氨基酸。DnaE蛋白內(nèi)含子中位置F14處的Asn突變?yōu)锳la抑制了Asn環(huán)化(Ghosh,I.etal.(2001)J.Biol.Chem.276:24051-24058)。但是,5^DnaB蛋白內(nèi)含子中位置F14處Asn突變?yōu)锳la對(duì)于步驟3(Asn環(huán)化)無(wú)影響(Ding,Y.etal.(2003)J.Biol.Chem.278:39133-39142)。策略3.5:突變位置F15處的氨基酸。位置F15處的氨基酸高度保守。&/DnaB蛋白內(nèi)含子中位置F15處Phe突變?yōu)锳la阻斷了步驟3(Asn環(huán)化)(Ding,Y.etal.(2003)J.Biol.Chem.278:39133-39142)。&pDnaB蛋白內(nèi)含子中位置F15處Phe突變?yōu)門(mén)yr輕微抑制了步驟3(Asn環(huán)化)(Ding,Y.etal.(2003)J.Biol.Chem.278:39133-39142)。策略4:突變蛋白外顯子區(qū)域。蛋白外顯子中接近剪接位點(diǎn)的氨基酸影響剪接。Evans等人提供證據(jù)表明,蛋白外顯子-^連接點(diǎn)處IN-,、IN.2氨基酸,以及Ic-蛋白外顯子連接點(diǎn)處Ic+2、Ic+3、Ic+4氨基酸為&pDnaE蛋白內(nèi)含子中剪接所需(Evans,T.C.Jr.etal.(2000)J.Biol.Chem.275:卯91-卯94)。在DnaE蛋白內(nèi)含子中,蛋白外顯子中位置Ic+2處氨基酸參與了蛋白內(nèi)含子介導(dǎo)的剪接(Iwai,H.etal.(2006)FEBSLett.580:1853-1858)。DnaE蛋白內(nèi)含子中位置10+2處Phe突變?yōu)椴煌赑he、Tyr或Trp的氨基酸抑制了蛋白內(nèi)含子介導(dǎo)的剪接(Iwai,H.etal.(2006)FEBSLett.580:1853-1858)。含有來(lái)自A^wDnaE蛋白內(nèi)含子的lN結(jié)構(gòu)域和來(lái)自DnaE蛋白內(nèi)含子的Ic結(jié)構(gòu)域的混合蛋白內(nèi)含子更能容忍該位置上的氨基酸替換(Iwai,H.etal.(2006)FEBSLett.580:1853-1858)。因此當(dāng)采用某些蛋白內(nèi)含子時(shí),在隨機(jī)文庫(kù)中固定該氨基酸可能是有益的。位置的氨基酸出現(xiàn)在N-X?;D(zhuǎn)換催化口袋中(Sun,P.etal.(2005)J.Mol.Biol.353:1093-1105)。&/0加6中,已提出位置I^的Tyr起開(kāi)關(guān)作用,在步驟2(酯交換反應(yīng))完成之前防止步驟3(Asn環(huán)化)發(fā)生(Sun,P.etal.(2005)J,Mol.Biol.353:1093-1105)。經(jīng)修飾的用于蛋白純化的SeeVMA蛋白內(nèi)含子以C末端與耙蛋白融合,該SceVMA被突變以防止步驟3(Asn環(huán)化)和步驟2(酯交換反應(yīng))發(fā)生,僅允許步驟1(N-X?;D(zhuǎn)換)發(fā)生。SeeVMA蛋白內(nèi)含子中位置lN.i處的某些氨基酸允許步驟1(N-X酰基轉(zhuǎn)換)在體內(nèi)發(fā)生Thr、Glu、His、Arg和Asp。以下氨基酸在SeeVMA蛋白內(nèi)含子中位置處時(shí)體內(nèi)抑制步驟1(N-X酰基轉(zhuǎn)換),但體外不抑制Gly、Ala、Ile、Leu、Met、Phe、Val、Gln、Ser、Trp、Tyr和Lys。位置I^處的以下氨基酸在SceVMA蛋白內(nèi)含子中、在體內(nèi)和體外都抑制步驟l(N-X酰基轉(zhuǎn)換)Asn、Cys和Pro(NewEnglandBiolabs,IMPACTTM-CN蛋白純化系統(tǒng))。在剪接連接點(diǎn)附近固定蛋白外顯子氨基酸為產(chǎn)生套索蛋白內(nèi)含子的有用策略。蛋白內(nèi)含子說(shuō)明未加工蛋白內(nèi)含子說(shuō)明在未加工蛋白內(nèi)含子中,不形成環(huán)化肽或"絞索"。In和Ic結(jié)構(gòu)域折疊,以受限的環(huán)狀構(gòu)象展示肽、ScFv或基因組片段(圖12)。對(duì)于構(gòu)建未加工蛋白內(nèi)含子而言最重要的突變?yōu)橐种撇襟E2(酯交換反應(yīng))的突變(圖12)。當(dāng)僅僅步驟2(酯交換反應(yīng))被抑制時(shí),未加工蛋白內(nèi)含子仍可能經(jīng)歷步驟1(N-X酰基轉(zhuǎn)換)和步驟3(Asn環(huán)化)(圖12)。如果發(fā)生步驟1(N-X酰基轉(zhuǎn)換),則IN+1(Al)和lNd處形成蛋白外顯子-lN邊界的氨基酸將通過(guò)酯或硫酯鍵連接。這種鍵比酰胺鍵更快速地水解,導(dǎo)致釋放出lN結(jié)構(gòu)域。如果步驟3(Ans環(huán)化)發(fā)生,則Asn環(huán)化仍將以低速率發(fā)生,導(dǎo)致蛋白外顯子-Ic切割。為了穩(wěn)定未加工蛋白內(nèi)含子,需要抑制步驟1(N-X?;D(zhuǎn)換)和步驟3(Asn環(huán)化)。對(duì)于所描述的每種策略,可能有多種氨基酸替換起作用。例如,在策略2.1中,可能通過(guò)將位置Ic+1(G8)處的Ser突變?yōu)锳la而阻斷步驟2(酯交換反應(yīng))。也可能通過(guò)將位置Ic+1(G8)處的Ser突變?yōu)槠渌被岫鴮⑵渥钄?。?dāng)策略提到突變時(shí),有可能是達(dá)到相同結(jié)果的在該位點(diǎn)的多種氨基酸替換。通過(guò)抑制步驟2(酯交換反應(yīng))產(chǎn)生未加工蛋白內(nèi)含子可采用僅抑制步驟2(酯交換反應(yīng))的單一策略或策略組合來(lái)產(chǎn)生未加工蛋白內(nèi)含子。如果Ic+1(G8)不是Cys,則策略2.6將沒(méi)有效果,剩下策略(2.1-2.5),產(chǎn)生了總共25-1=31個(gè)策略用于抑制步驟2。如果Icw(G8)是Cys,則所有的6種策略(2.1-2.6)都可用于抑制步驟2(酯交換反應(yīng)),產(chǎn)生了總共26-1=63種策略用于抑制步驟2。以下說(shuō)明將上述策略2.1-2.6應(yīng)用于未加工蛋白內(nèi)含子。為了采用策略2.1抑制步驟2,位置Ic+1(G8)處的氨基酸需要突變?yōu)椴荒茉诓襟E2(酯交換反應(yīng))中起親核試劑作用的氨基酸。列在InBase中的蛋白內(nèi)含子在位置Ic+1(G8)處含有Ser、Cys和Thr。Ic+1(G8)突變?yōu)槿魏纹渌被釋⒁种撇襟E2(酯交換反應(yīng))。但是,某些蛋白內(nèi)含子僅能在位置Ic+1(G8)采用特定的親核氨基酸(Shingledecker,K.etal.(2000)ArchivesBiochem.Biophys.375:138-144)。因此,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以另一親核性氨基酸替換位置Ic+i(G8)處野生型氨基酸來(lái)抑制步驟2(酯交換反應(yīng))(Shingledecker,K.etal.(2000)Arch.Biochem.Biophys.375:138-144)。例如,在尸s/Pol-I蛋白內(nèi)含子中,當(dāng)SerIc+1(G8)突變?yōu)镃ys或Thr時(shí),步驟2(酯交換反應(yīng))被抑制(Xu,M.&Perler,F(xiàn).B.(1996)EMBOJ.15:5146-5153)。類(lèi)似地,在SeeVMA1蛋白內(nèi)含子中,突變位置Ic+!(G8)處的Cys為Ser抑制步驟2(酯交換反應(yīng))(Hirata,R.&Anraku,Y,(1992)Biochem.Biophys.Res.Commun.188:40-47)。為了采用策略2.2抑制步驟2,位置B7處的氨基酸需要突變?yōu)椴荒芘c位置IN+1(Al)處的羰基氧形成氫鍵的氨基酸。以下的氨基酸在InBase中列出的蛋白內(nèi)含子的位置B7處出現(xiàn)多次Thr、Ser、Asn、Asp、Cys以及Glu。位置B7處的氨基酸突變?yōu)槌薚hr、Ser、Asn、Asp、Cys和Glu之外的任何其它氨基酸將抑制步驟2(酯交換反應(yīng))。但是,某些蛋白內(nèi)含子僅能夠在位置B7釆用特定氨基酸。因而,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以任何其它氨基酸替換位置B7處野生型氨基酸來(lái)抑制步驟2(酯交換反應(yīng))。為了采用策略2.3抑制步驟2,位置B10處氨基酸需要突變?yōu)椴荒芘c位置IN+1(Al)處酰胺氮形成氫鍵的氨基酸。InBase中列出的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子的位置B10處最常見(jiàn)氨基酸為His和Thr。氨基酸Asp和Lys也出現(xiàn)在位置B10,盡管頻率比His和Thr低得多。這些氨基酸能夠與位置IN+1(Al)處酰胺氮形成氫鍵,并且將位置BIO處氨基酸突變?yōu)槌薍is、Thr、Asp和Lys之外的任何其它氨基酸都將抑制步驟2(酯交換反應(yīng))。但是,某些蛋白內(nèi)含子僅能在位置BIO采用特定氨基酸。因而,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以另一氨基酸替換位置BIO處野生型氨基酸來(lái)抑制步驟2(酯交換反應(yīng))。為了采用策略2.4抑制步驟2,在剪接位點(diǎn)附近引入帶電氨基酸。列在InBase中的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子在位置A2(^+2)主要含有Leu、Val、Phe和lie。氨基酸His、Gln、Met、Gly、Cys、Ser、Thr和Tyr在少于10個(gè)蛋白內(nèi)含子中出現(xiàn)在位置A2(IN+2)。在位置G5(Ic-3),最常出現(xiàn)的氨基酸為Val、Thr、Leu、Ala和Ser。氨基酸Cys、Ile、Asn和His在4個(gè)或更少的蛋白內(nèi)含子中出現(xiàn)。位置A2(&+2)和G5(Ic-3)處最常見(jiàn)的氨基酸為疏水性的。在剪接位點(diǎn)附近引入Lys、Arg、Glu或Asp將抑制步驟2(酯交換反應(yīng))。但是,某些蛋白內(nèi)含子僅能在位置A2(In+2)和G5(Ic-3)處采用特定氨基酸。因而,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它氨基酸替換位置A2(In+2)和G5(1。3)處野生型氨基酸來(lái)抑制步驟2(酯交換反應(yīng))。為了采用策略2.5抑制步驟2,位置F4處的氨基酸需要突變?yōu)椴荒芘cIN.i的羰基氧形成氫鍵的氨基酸。列在InBase中的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子在位置F4主要含有Asp、Cys、Thr、Trp、Ser和Asn。氨基酸Arg、Ala、Glu、Phe、Gly、Ile、Leu、Gln、Val和Tyr在5個(gè)或更少的蛋白內(nèi)含子中出現(xiàn)。氨基酸Asp、Cys、Thr、Trp、Ser和Asn48都可與IN.!的羰基氧形成氫鍵。位置F4的氨基酸突變?yōu)椴恍纬蓺彐I的氨基酸將抑制步驟2(酯交換反應(yīng))。但是,某些蛋白內(nèi)含子僅能在位置F4處采用特定氨基酸。因而,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它氨基酸替換位置F4處野生型氨基酸來(lái)抑制步驟2(酯交換反應(yīng))。為了釆用策略2.6抑制步驟2,Ic+1(G8)親核試劑需要是Cys。當(dāng)Ic+1(G8)親核試劑是Cys時(shí),向生長(zhǎng)培養(yǎng)基中加入鋅將抑制步驟2(酯交換反應(yīng))。通過(guò)抑制步驟1(N-X?;D(zhuǎn)換)產(chǎn)生未加工蛋白內(nèi)含子也可采用僅抑制步驟1(N-X?;D(zhuǎn)換)的單一策略或組合策略來(lái)產(chǎn)生未加工蛋白內(nèi)含子。有3種抑制步驟1(N-X?;D(zhuǎn)換)的策略(1.1-1.3),產(chǎn)生了總共23-1=7種抑制步驟1(N-X?;D(zhuǎn)換)的策略。以下討論應(yīng)用策略1.1-1.3產(chǎn)生未加工蛋白內(nèi)含子。為了采用策略l.l抑制步驟1,位置Al(&+1)處的氨基酸需要突變?yōu)椴荒茉诓襟E1(N-X?;D(zhuǎn)換)中起親核試劑作用的氨基酸。InBase中列出的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子主要含有Cys、Ser,以及較少見(jiàn)的Ala。在該位置具有Ala的蛋白內(nèi)含子經(jīng)歷如上所述的可選擇的蛋白內(nèi)含子機(jī)制。在標(biāo)準(zhǔn)蛋白內(nèi)含子中,位置Al處的氨基酸突變?yōu)槿魏纹渌被岫紝⒁种撇襟E1(N-X酰基轉(zhuǎn)換)。但是,某些蛋白內(nèi)含子僅能在位置A1(&+1)處使用特定親核氨基酸。因此,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它親核氨基酸替換位置Al(&+1)處的野生型氨基酸來(lái)抑制步驟1(N-X酰基轉(zhuǎn)換)。例如,當(dāng)SerIN+1(Al)突變?yōu)镃ys時(shí),尸spPol-I蛋白內(nèi)含子剪接較弱,而當(dāng)Ser突變?yōu)門(mén)hr時(shí),剪接被完全阻斷(Xu,M.&Perler,F(xiàn).B.(1996)EMBOJ.15:5146-5153)。類(lèi)似地,SeeVMA1蛋白內(nèi)含子不能容忍位置IN+1(Al)處的Cys突變?yōu)镾er(Hirata,R.&Anraku,Y.(1992)Biochem.Biophys.Res.Commun.188:40-47,Cooper,A.A.etal.(1993)EMBOJ.12:2575-2583)。為了采用策略1.2抑制步驟1,位置F3處的氨基酸需要突變?yōu)槠茐腘-X催化口袋的氨基酸。InBase中列出的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子在位置F3處主要含有Tyr和Phe。氨基酸Glu、Ile、Arg、Val、Gln、Asp、Lys、Thr、His、Leu、Trp、Ser、Cys、Gly、Asn和Pro較少出現(xiàn)在該位置。位置F3的氨基酸突變?yōu)椴煌赥yr或Phe的任何氨基酸都將抑制步驟1(N-X?;D(zhuǎn)換)。但是,某些蛋白內(nèi)含子僅能在位置F3處使用特定氨基酸。因此,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它氨基酸替換位置F3處野生型氨基酸來(lái)抑制步驟1(N-X?;D(zhuǎn)換)。為了采用策略1.3抑制步驟1,位于&+1(Al)親核試劑的側(cè)鏈的氫鍵距離內(nèi)的氨基酸需要被突變。在這里發(fā)現(xiàn)的氨基酸不與保守蛋白內(nèi)含子模塊中的氨基酸對(duì)應(yīng)。在DnaE和DnaB蛋白內(nèi)含子中,Thr和Arg位于IN+i(Al)親核試劑的側(cè)鏈的氬鍵距離內(nèi)。Thr或Arg突變?yōu)椴荒芘cIN+1(Al)親核試劑的側(cè)鏈形成氫鍵的氨基酸將抑制步驟1(N-X?;D(zhuǎn)換)或步驟2(酯交換反應(yīng))。通過(guò)抑制步驟l(N-X?;D(zhuǎn)換)和步驟3(Asn環(huán)化)產(chǎn)生未加工蛋白內(nèi)含子可通過(guò)聯(lián)合使用抑制步驟1(N-X?;D(zhuǎn)換)的單一或組合策略和抑制步驟3(Asn環(huán)化)的單一或組合策略來(lái)產(chǎn)生穩(wěn)定的未加工蛋白內(nèi)含子。有3種抑制步驟1(N-X?;D(zhuǎn)換)的策略(1.1-1.3)和5種抑制步驟3(Asn環(huán)化)的策略(3.1-3.5),產(chǎn)生了總共(23隱1)乂(25畫(huà)1)=217種抑制步驟1(N-X?;D(zhuǎn)換)和步驟3(Asn環(huán)化)的不同策略。應(yīng)用策略1.1-1.3產(chǎn)生未加工蛋白內(nèi)含子如上所述。以下說(shuō)明應(yīng)用策略3.1-3.5產(chǎn)生未加工蛋白內(nèi)含子。為了采用策略3.1抑制步驟3,位置ItM(G7)處的氨基酸需要突變?yōu)椴荒芙?jīng)歷環(huán)化的氨基酸。InBase中列出的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子在位置Id(G7)處含有Asn和Gln。位置Id(G7)處的氨基酸突變?yōu)椴荒芙?jīng)歷側(cè)鏈環(huán)化的氨基酸將抑制步驟3(Asn環(huán)化)。但是,某些蛋白內(nèi)含子僅能在位置IcM(G7)使用特定氨基酸。因此,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它氨基酸替換位置IcM(G7)處的野生型氨基酸來(lái)抑制步驟3(Asn環(huán)化)。為了采用策略3.2抑制步驟3,氨基酸G6(Ic2)和/或Bll(它們通過(guò)與位置Id(G7)處的Asn羰基氧形成氫鍵而協(xié)助Asn環(huán)化)應(yīng)該突變?yōu)椴荒芘c該氨基酸形成氫鍵的氨基酸。InBase中列出的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子在位置G6(1:.2)處含有His,較少見(jiàn)的是Gly、Ser、Ala和Cys。突變?yōu)槌鼿is外的任何氨基酸將抑制步驟3(Asn環(huán)化)。G6(Ic2)處不存在His時(shí),Bll可通過(guò)與位置Id(G7)處Asn羰基氧形成氫鍵而協(xié)助Asn環(huán)化。當(dāng)G6不是His時(shí),Bll絕大多數(shù)情況下是Lys或Arg。在任一位置處突變?yōu)椴粠д姾?Lys,Arg或His)的任何氨基酸都將抑制步驟3(Asn環(huán)化)。但是,某些蛋白內(nèi)含子僅能在位置G6(Ic2)或Bll處使用特定氨基酸。因此,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它氨基酸替換位置G6(Ic-2)或Bll處野生型氨基酸來(lái)抑制步驟3(Asn環(huán)化)。為了采用策略3.3抑制步驟3,位置F13處的氨基酸需要突變?yōu)檫@樣的氨基酸,即所述氨基酸不能通過(guò)配位水分子而作為位置Icm(G7)處Asn質(zhì)子受體。InBase中列出的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子在位置F13處主要含有His,較少見(jiàn)的是Glu、Gln、Asn、Pro、Ser、Lys、Ala、Gly、Asp、Arg、Ile、Leu、Tyr、Trp、Val和Thr。如果野生型殘基為His,則突變?yōu)槠渌被釋⒁种撇襟E3(Asn環(huán)化)。但是,某些蛋白內(nèi)含子僅能在位置F13處使用特定氨基酸。因此,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它氨基酸替換位置F13處的野生型氨基酸來(lái)抑制步驟3(Asn環(huán)化)。為了采用策略3.4抑制步驟3,位置F14處的氨基酸需要突變?yōu)橐种艫sn環(huán)化的氨基酸。InBase中列出的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子在位置F14處主要含有Asn。氨基酸Leu、Ser、Thr、Gln、Ala、Arg、Met、Phe、Val、Glu、Tyr、His、Lys、Cys、Asp和Ile較少出現(xiàn)。突變?yōu)槿魏纹渌被釋⑵茐募艚游稽c(diǎn),抑制步驟3(Asn環(huán)化)。但是,某些蛋白內(nèi)含子僅能在位置F14處使用特定氨基酸。因此,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它氨基酸替換位置F14處的野生型氨基酸來(lái)抑制步驟3(Asn環(huán)化)。為了采用策略3.5抑制步驟3,位置F15處的氨基酸需要突變?yōu)橐种艫sn環(huán)化的氨基酸。InBase中列出的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子51在位置F15處主要含有Phe和Tyr。氨基酸Val、Gly、Asn、Ser、Thr、His、Ile、Trp、Ala和Glu也出現(xiàn)在位置15。F15位置與圍繞剪接位點(diǎn)的氨基酸形成疏水接觸并確定位置F13處氨基酸方向。位置F15處氨基酸從Phe或Tyr突變?yōu)槌薖he或Tyr之外的任何氨基酸都將抑制步驟3(Asn環(huán)化)。但是,某些蛋白內(nèi)含子僅能在位置F15處使用特定氨基酸。因此,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它氨基酸替換位置F15處的野生型氨基酸來(lái)抑制步驟3(Asn環(huán)化)。通過(guò)抑制步驟l(N-X?;D(zhuǎn)換)和步驟2(酯交換反應(yīng))產(chǎn)生未加工蛋白內(nèi)含子3種策略(1.1-1.3)可用于抑制步驟1(N-X?;D(zhuǎn)換),如果Icw(G8)不是Cys則策略2.6不可用,并且僅有5種策略(2.1-2.5)可用于抑制步驟2(酯交換反應(yīng)),產(chǎn)生了總共(23-1>(25-1)=217種抑制步驟1(N畫(huà)X?;D(zhuǎn)換)和步驟2(酯交換反應(yīng))的策略。如果Ic+1(G8)是Cys,則有6種策略(2.1-2.6)可用于抑制步驟2(酯交換反應(yīng)),產(chǎn)生了總共(23-1)x(2M)=441種抑制步驟1(N-X?;D(zhuǎn)換)和步驟2(酯交換反應(yīng))的策略。上文描述了應(yīng)用策略1.1-1.3和2.1-2.6產(chǎn)生未加工蛋白內(nèi)含子。通過(guò)抑制步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)產(chǎn)生未加工蛋白內(nèi)含子5種策略(3.1-3.5)可用于抑制步驟3(Asn環(huán)化)。如果Ic+1(G8)不是Cys,則策略2.6不可用,并且僅有5種策略(2.1-2.5)可用于抑制步驟2(酯交換反應(yīng)),產(chǎn)生了(25國(guó)1)乂(25國(guó)1)=961種策略用于抑制步驟1(N-X?;D(zhuǎn)換)和步驟3(Asn環(huán)化)。如果Ic+1(G8)是Cys,則有6種策略(2.1_2.6)可用于抑制步驟2(酯交換反應(yīng)),產(chǎn)生了總共(^-l)x(25-1)=1953種抑制步驟1(N-X?;D(zhuǎn)換)和步驟3(Asn環(huán)化)的策略。上文描述了應(yīng)用策略2.1-2.6和3.1-3.5產(chǎn)生未加工蛋白內(nèi)含子。通過(guò)抑制步驟l(N-X?;D(zhuǎn)換)、步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)產(chǎn)生未加工蛋白內(nèi)含子3種策略(1.1-1.3)可用于抑制步驟1(N-X酰基轉(zhuǎn)換),5種策略(3.1-3.5)可用于抑制步驟3(Asn環(huán)化)。如果Ic+1(G8)不是Cys則策略2.6不可用,剩下5種策略(2.1-2.5)抑制步驟2,產(chǎn)生了(23-l)x(25-l)x(25-l)=6727種策略用于抑制步驟1(N-X?;D(zhuǎn)換)、步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)。如果Ic+1(G8)是Cys,則有6種策略(2.1-2.6)可用于抑制步驟2,產(chǎn)生了(23-1>(26-1^(25-1)=13671種抑制步驟1(N-X酰基轉(zhuǎn)換)、步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)的策略。上文已經(jīng)描述了將策略1.1-1.3、2.1-2.6和3.1-3.5應(yīng)用于未加工蛋白內(nèi)含子。雙半胱氨酸蛋白內(nèi)含子說(shuō)明雙半胱氨酸蛋白內(nèi)含子在蛋白內(nèi)含子介導(dǎo)的剪接反應(yīng)中不經(jīng)歷任何步驟(圖13)。位置Ic+!(G8)和I,(Al)的Cys氨基酸被保留,而需要其它突變來(lái)抑制蛋白內(nèi)含子加工。在選擇了與給定靶相互作用的雙半胱氨酸蛋白內(nèi)含子后,可合成含有側(cè)翼連接半胱氨酸殘基的隨機(jī)肽、ScFv或基因組片段的肽。然后這些肽、ScFv和基因組片段可通過(guò)二硫鍵或半胱氨酸交聯(lián)劑約束。位置Ic+1(G8)和IN+1(Al)處的Cys氨基酸為雙半胱氨酸蛋白內(nèi)含子所需。策略2.2(鋅抑制)為產(chǎn)生雙半胱氨酸蛋白內(nèi)含子的良好策略,因?yàn)樗恍枰狪cw(G8)處的突變,并且抑制是可逆的??蛇x擇地,采用不能容忍Ic+,(G8)和Iw(Al)處替換的蛋白內(nèi)含子可用于產(chǎn)生雙半胱氨酸蛋白內(nèi)含子。例如,尸^Pol蛋白內(nèi)含子在位置Ic+,和lN+,處具有Ser,突變?yōu)镃ys則抑制蛋白剪接(Xu,M.&Perler,F.B.(1996)EMBOJ.15:5146-5153)。通過(guò)抑制步驟1(N-X?;D(zhuǎn)換)產(chǎn)生雙半胱氨酸蛋白內(nèi)含子可采用僅抑制步驟1(N-X酰基轉(zhuǎn)換)的單一策略或組合策略來(lái)產(chǎn)生雙半胱氨酸蛋白內(nèi)含子。有3種策略(1.1-1.3)抑制步驟1(N-X酰基轉(zhuǎn)換),產(chǎn)生了23-1=7種抑制步驟1(N-X?;D(zhuǎn)換)的策略。如杲蛋白內(nèi)含子在位置lNw(Al)處具有天然Cys,則不能使用策略l.l。因此有22-1=3種策略抑制步驟1(N-X?;D(zhuǎn)換)。下文描述將策略1.1-1.3應(yīng)用于雙半胱氨酸蛋白內(nèi)含子。在策略1.1中,位置IN+1(Al)處的氨基酸需要突變?yōu)镃ys,或者如果其已經(jīng)為Cys,則不需要改變。某些蛋白內(nèi)含子僅能在位置IN+1(Al)處使用特定親核氨基酸。因此,對(duì)于這些蛋白內(nèi)含子,以其它親核氨基酸替換位置IN+1(Al)處野生型氨基酸可抑制步驟1(N-X?;D(zhuǎn)換)。例如,當(dāng)SerlN+KAl)突變?yōu)镃ys時(shí),Pol-I蛋白內(nèi)含子剪接弱(Xu,M.&Perler,F.B.(1996)EMBOJ,15:5146-5153)。為了采用策略1.2抑制步驟1(N-X?;D(zhuǎn)換),位置F3處的氨基酸需要突變?yōu)槠茐腘-X酰基轉(zhuǎn)換催化口袋的氨基酸。InBase中列出的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子在位置F3處主要含有Tyr和Phe。氨基酸Glu、Ile、Arg、Val、Gln、Asp、Lys、Thr、His、Leu、Trp、Ser、Cys、Gly、Asn和Pro較少出現(xiàn)在該位置。位置F3的氨基酸突變?yōu)椴煌赥yr或Phe的任何氨基酸都將抑制步驟1(N-X?;D(zhuǎn)換)。但是,某些蛋白內(nèi)含子僅能在位置F3處使用特定氨基酸。因此,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它氨基酸替換F3處野生型氨基酸來(lái)抑制步驟1(N-X酰基轉(zhuǎn)換)。為了采用策略1.3抑制步驟1,位于^+1(Al)親核試劑的側(cè)鏈的氫鍵距離內(nèi)的氨基酸需要被突變。該區(qū)域中的氨基酸不與保守蛋白內(nèi)含子模塊中的氨基酸對(duì)應(yīng)。在DnaE和&pDnaB蛋白內(nèi)含子中Thr51和Arg50位于IN+1(Al)親核試劑的側(cè)鏈的氫鍵距離內(nèi)。Thr或Arg突變?yōu)椴荒芘cIN+1(Al)親核試劑的側(cè)鏈形成氫鍵的氨基酸將抑制步驟1(N-X酰基轉(zhuǎn)換)或步驟2(酯交換反應(yīng))。通過(guò)抑制步驟1(N-X?;D(zhuǎn)換)和步驟3(Asn環(huán)化)產(chǎn)生雙半胱氨酸蛋白內(nèi)含子可通過(guò)聯(lián)合采用抑制步驟1(N-X?;D(zhuǎn)換)的單一或組合策略和抑制步驟3(Asn環(huán)化)的單一或組合策略來(lái)產(chǎn)生穩(wěn)定的雙半胱氨酸蛋白內(nèi)含子。有3種抑制步驟1(N-X?;D(zhuǎn)換)的策略(1.1-1.3)和5種抑制步驟3(Asn環(huán)化)的策略,產(chǎn)生了總共(2、l)x(2M)=217種抑制步驟1(N-X?;D(zhuǎn)換)和步驟3(Asn環(huán)化)的策略。如果蛋白內(nèi)含子在位置IN+1(Al)具有Cys,則策略1.1是不適合的。對(duì)于這種情況,有總共(22-l)x(25-l)=93種策略抑制步驟1(N-X酰基轉(zhuǎn)換)和步驟3(Asn環(huán)化)。應(yīng)用策略1.1-1.3產(chǎn)生雙半胱氨酸蛋白內(nèi)含子如前所述。應(yīng)用策略3.1-3.5產(chǎn)生雙半胱氨酸蛋白內(nèi)含子與用于未加工蛋白內(nèi)含子相同。通過(guò)抑制步驟l(N-X?;D(zhuǎn)換)和步驟2(酯交換反應(yīng))產(chǎn)生雙半胱氨酸蛋白內(nèi)含子可通過(guò)聯(lián)合采用抑制步驟1(N-X?;D(zhuǎn)換)的單一或組合策略和抑制步驟2(酯交換反應(yīng))的單一或組合策略來(lái)產(chǎn)生穩(wěn)定的雙半胱氨酸蛋白內(nèi)含子。有3種抑制步驟1(N-X酰基轉(zhuǎn)換)的策略(1.1-1.3)和6種抑制步驟2(酯交換反應(yīng))的策略,產(chǎn)生了總共(23-1>(26-1)=441種抑制步驟1(N-X?;D(zhuǎn)換)和步驟2(酯交換反應(yīng))的策略。如果蛋白內(nèi)含子的野生型氨基酸在位置IN+1(Al)為Cys,則策略1.1是不適合的。對(duì)于這種情況,有總共(22-1^(26-1)=189種策略抑制步驟1(N-X酰基轉(zhuǎn)換)和步驟2(酯交換反應(yīng))。如果蛋白內(nèi)含子在位置Ic+1(G8)具有Cys,則策略2.1是不適合的。對(duì)于這種情況,有總共(23-1>(25-1)=217種策略抑制步驟1(N-X?;D(zhuǎn)換)和步驟2(酯交換反應(yīng))。如果蛋白內(nèi)含子的野生型氨基酸在位置Ic+1(G8)和IN+1(Al)都為Cys,則策略1.1和2.1是不適合的。對(duì)于這種情況,有總共(22-1>(25-1)=93種策略抑制步驟1(N-X?;D(zhuǎn)換)和步驟2(酯交換反應(yīng))。除了以下將討論的策略2.1,對(duì)抑制步驟2(酯交換反應(yīng))的突變的描述參見(jiàn)未加工蛋白內(nèi)含子。在策略2.1中,位置Ion(G8)處的氨基酸需要突變?yōu)镃ys。某些蛋白內(nèi)含子僅能在位置Ic+1(G8)處使用特定親核氨基酸,Cys突變將抑制步驟2(酯交換反應(yīng))。因此,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它親核氨基酸替換位置Ic+1(G8)處的野生型氨基酸來(lái)抑制步驟2(酯交換反應(yīng))。例如,在/^/7Pol-I蛋白內(nèi)含子中,當(dāng)SerIc+1(G8)突變?yōu)镃ys時(shí),步驟2(酯交換反應(yīng))被抑制(Xu,M.&Perler,F(xiàn).B.(1996)EMBOJ.15:5146-5153)。通過(guò)抑制步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)產(chǎn)生雙半胱氣酸蛋白內(nèi)含子可通過(guò)聯(lián)合采用抑制步驟2(酯交換反應(yīng))的單一或組合策略和抑制步驟3(Asn環(huán)化)的單一或組合策略來(lái)產(chǎn)生穩(wěn)定的雙半胱氨酸蛋白內(nèi)含子。有6種抑制步驟2(酯交換反應(yīng))的策略(2.1-2.6)和5種抑制步驟3(酯交換反應(yīng))策略(3.1-3.5),產(chǎn)生了總共(26-1^(25-1)=1953種抑制步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)的策略。如果在位置Icw(G8)處的野生型氨基酸為Cys,則策略2.1是不適合的,剩下5種抑制步驟2(酯交換反應(yīng))的策略(2.2-2.6)。這種情況下,有(25國(guó)1)乂(25國(guó)1)=961種抑制步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)的策略。對(duì)于抑制步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)的突變的說(shuō)明參見(jiàn)未加工蛋白內(nèi)含子,除了上述策略2.1。通過(guò)抑制步驟l(N-X?;D(zhuǎn)換)、步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)產(chǎn)生雙半胱氨酸蛋白內(nèi)含子可通過(guò)聯(lián)合采用抑制步驟1(N-X?;D(zhuǎn)換)的單一或組合策略、抑制步驟2(酯交換反應(yīng))的單一或組合策略、以及抑制步驟3(Asn環(huán)化)的單一或組合策略來(lái)產(chǎn)生穩(wěn)定雙半胱氨酸蛋白內(nèi)含子。有3種抑制步驟l(N-X酰基轉(zhuǎn)換)的策略(l,l-1.3),6種抑制步驟2(酯交換反應(yīng))的策略(2.1-2.6),5種抑制步驟3(Asn環(huán)化)的策略(3.1-3.5),產(chǎn)生總共(23-l)x(26-l)x(25-l)=13671種抑制步驟1(N畫(huà)X?;D(zhuǎn)換)、步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)的策略。如果蛋白內(nèi)含子在位置Inw(Al)的野生型氨基酸為Cys,則策略l.l是不適合的。對(duì)于這種情況,有總共(22-l)x(26-l)x(2、1)=5859種抑制步驟1(N-X?;D(zhuǎn)換)、步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)的策略。如果蛋白內(nèi)含子在位置Ic+1(G8)具有Cys,則策略2.1是不適合的。對(duì)于這種情況,有總共(23-1>(25-1)x(25-l)=6727種抑制步驟1(N-X?;D(zhuǎn)換)、步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)的策略。如果蛋白內(nèi)含子在位置Ic+1(G8)和In+!(Al)的野生型氨基酸都為Cys,則策略1.1和2.1是不適合的。對(duì)于這種情況,有總共(2M)x(25-l)x(25-l)=2883種抑制步驟1(N-X酰基轉(zhuǎn)換)、56步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)的策略。對(duì)抑制步驟l(N-X酰基轉(zhuǎn)換)、步驟2(酯交換反應(yīng))和步驟3(Asn環(huán)化)的突變的描述參見(jiàn)未加工蛋白內(nèi)含子,除了上述策略1.1和2.1。套索蛋白內(nèi)含子說(shuō)明通過(guò)允許蛋白內(nèi)含子反應(yīng)(圖14)的前兩步進(jìn)行并阻斷第三步(Asn環(huán)化)來(lái)產(chǎn)生套索蛋白內(nèi)含子。防止水解而穩(wěn)定酯鍵的任何圍繞Ic+1(G8)的殘基也應(yīng)被并入。增強(qiáng)前兩步的突變也是有益的。策略4對(duì)于產(chǎn)生強(qiáng)有力的套索文庫(kù)也是有益,其中數(shù)量增加的文庫(kù)成員形成套索。通過(guò)抑制步驟3(Asn環(huán)化)產(chǎn)生套索蛋白內(nèi)含子可通過(guò)采用抑制步驟3(Asn環(huán)化)的策略或抑制步驟3(Asn環(huán)化)的策略組合來(lái)產(chǎn)生套索蛋白內(nèi)含子。有6種抑制步驟3(Asn環(huán)化)的策略,產(chǎn)生了總共25-1=31種抑制步驟3(Asn環(huán)化)的策略。策略2.6也可能適用,因?yàn)闆](méi)有確定地證實(shí)鋅阻斷步驟2(酯交換反應(yīng))(Mills,K.V.&Paulus,H.(2001)J.Biol.Chem.276:10832-10838)。在策略3.1中,位置Icm(G7)處的氨基酸需要突變?yōu)椴荒芙?jīng)歷環(huán)化的氨基酸。InBase中列出的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子在位置1"(G7)處含有Asn和Gln。位置Ic.!(G7)處的氨基酸突變?yōu)槌薃sn、Gln和Asp之外的任何氨基酸都將抑制步驟3(Asn環(huán)化)。Id(G7)的特定突變也可導(dǎo)致分支中間體(套索)穩(wěn)定。Id(G7)氨基酸突變?yōu)長(zhǎng)ys(KawasakiM.etal.(1997)J.Biol.Chem.272:15668-15674)、Gln或Asp(Xu,M.&Perler,F(xiàn).B,(1996)EMBOJ.15:5146-5153)可以有助于分支中間體(套索)的穩(wěn)定。當(dāng)該氨基酸不突變,但是位置G6(Ic2)處的氨基酸突變?yōu)長(zhǎng)eu、Asn或Gln時(shí),也觀察到分支中間體的積累(Xu,M.&Perler,F(xiàn).B.(1996)EMBOJ.15:5146-5153)。在策略3.2中,通過(guò)與位置Icm(G7)處Asn羰基氧形成氫鍵而協(xié)助Asn環(huán)化的氨基酸G6(Ic々)和/或Bll應(yīng)突變?yōu)椴荒芘c該氨基酸形成氫鍵的氨基酸。InBase中列出的被認(rèn)為經(jīng)歷剪接的蛋白內(nèi)含子在位置G6(1。2)處含有His,較少見(jiàn)的是Gly、Ser、Ala和Cys。突變?yōu)槌薍is之外的任何氨基酸都將抑制步驟3(Asn環(huán)化)。當(dāng)G6(1。2)處不存在His時(shí),發(fā)現(xiàn)Bll可與位置Icm(G7)處Asn羰基氧形成氫鍵。當(dāng)G6不是His時(shí),位置Bll絕大多數(shù)情況下是Lys或Arg。任一位置突變?yōu)椴粠д姾?Lys、Arg、His)的任何氨基酸都將抑制步驟3(Asn環(huán)化)。尸jpPol-I蛋白內(nèi)含子中,僅當(dāng)Id(G7)不突變?yōu)锳la時(shí),位置I。2(G6)處His突變?yōu)長(zhǎng)eu、Asn和Gln會(huì)導(dǎo)致分支中間體的積累(Xu,M.&Perler,F(xiàn).B.(1996)EMBOJ.15:5146-5153)。目前,還沒(méi)有關(guān)于位置Bll處Arg在積累分支中間體中的作用的誘變研究。但是,某些蛋白內(nèi)含子僅能在位置G6(Ic,2)或Bll處使用特定氨基酸。因此,對(duì)于這些蛋白內(nèi)含子,可通過(guò)以其它氨基酸替換位置G6(1。2)或Bll處野生型氨基酸來(lái)抑制步驟3(Asn環(huán)化)。關(guān)于策略3.3-3.5,抑制步驟3(Asn環(huán)化)的突變的說(shuō)明參見(jiàn)未加工蛋白內(nèi)含子。應(yīng)用套索蛋白內(nèi)含子技術(shù)分離結(jié)合并抑制細(xì)菌阻遏蛋白LEXA的套索本發(fā)明描述在酵母雙雜交測(cè)定法中構(gòu)建和應(yīng)用"套索"、未加工蛋白內(nèi)含子和雙半胱氨酸蛋白內(nèi)含子。套索為沒(méi)有C末端的新型肽構(gòu)建體,代表了新類(lèi)型的環(huán)肽。通過(guò)修飾體內(nèi)蛋白內(nèi)含子介導(dǎo)的蛋白連接反應(yīng)而產(chǎn)生套索肽。套索肽的C末端倒回成環(huán)并通過(guò)環(huán)狀內(nèi)酯鍵連接到該肽內(nèi)部的特定絲氨酸(圖3)。套索具有自由N末端,允許連接有用的生物學(xué)結(jié)構(gòu)域,例如激活結(jié)構(gòu)域,這對(duì)酵母雙雜交測(cè)定法而言是必需的。如以上所討論的,這種方法被用于產(chǎn)生針對(duì)給定靶的環(huán)肽、套索、未加工蛋白內(nèi)含子、以及雙半胱氨酸蛋白內(nèi)含子親和試劑。通過(guò)產(chǎn)生細(xì)菌阻遏蛋白LexA的抑制劑而證實(shí)了這種方法的可行性。LexA代表了推定的抗菌靶點(diǎn),當(dāng)被抑制時(shí)應(yīng)加強(qiáng)細(xì)胞毒性抗生素的活性。當(dāng)LexA纟皮活化的RecA結(jié)合時(shí),其經(jīng)歷自體溶解而不再抑制其調(diào)節(jié)子中的基因(Lin,IX.&Little,J.W.(1988)Bacteriol.170:2163-2173)。阻斷自體溶解的LexA突變體(Walker,G.C.(1984)Microbiol.Rev.48:60-93)使得細(xì)菌對(duì)諸如DNA損傷試劑絲裂霉素C(MMC)的化合物誘導(dǎo)的壓力更敏感(Lin,LL&Little,J.W.(1988)Bacterid.170:2163-2173),并且它們降低抗生素抗性(Cirz,R.T.etal.(2005)PLoSBiol.3:el76,Miller,C.etal.(2004)Science305:1629-1631)。阻斷自體溶解的LexA抑制劑將增強(qiáng)細(xì)菌對(duì)細(xì)胞毒性試劑的敏感性,并且由于LexA不存在于人體中,其將對(duì)宿主DNA損傷修復(fù)系統(tǒng)沒(méi)有影響。構(gòu)建和篩選套索肽組合文庫(kù)通過(guò)將產(chǎn)生環(huán)肽系統(tǒng)(Scott,C.Retal.(1999)Proc.Natl.Acad.Sci.USA96:13638-13643)的蛋白內(nèi)含子改造為在中間步驟中中止環(huán)肽反應(yīng)而產(chǎn)生適合酵母雙雜交系統(tǒng)的套索,這產(chǎn)生含有激活結(jié)構(gòu)域(通過(guò)酰胺鍵與內(nèi)酯環(huán)肽共價(jià)連接)的套索。為了防止套索中間體經(jīng)歷天門(mén)冬酰胺環(huán)化(其產(chǎn)生環(huán)肽),位置Id(G7)處的天門(mén)冬酰胺以丙氨酸替換(圖15a、圖15b)。創(chuàng)建套索的組合文庫(kù),其中"絞索"區(qū)含有氨基酸序列SXXXXXXXEY,其中X代表NNK密碼子編碼的氨基酸。絞索區(qū)內(nèi)的谷氨酸和酪氨酸氨基酸被包括進(jìn)來(lái)促進(jìn)環(huán)化(Scott,C.P.etal.(2001)ChemBiol.8:801-815,Naumann,T.A.etal.(2005)Biotechnol.Bioeng.92:820-830)。在MATa酵母林EY93中構(gòu)建了大約七百萬(wàn)套索肽的文庫(kù)(圖16),并將該文庫(kù)與含有LexA靶質(zhì)粒(pEG202)(Gyuris,J.etal.(1993)Cell75:791-803)和酵母雙雜交報(bào)告基因的MATa株EYlll交配。采用圖15c中的酵母雙雜交相互作用陷阱,分離了14個(gè)克隆,其編碼與LexA相互作用的兩獨(dú)特套索(圖15d)。L2套索被用于進(jìn)一步分析,因?yàn)樗懈鄮щ姲被幔@可能增強(qiáng)其溶解性??筁exA套索的表征為了證實(shí)套索結(jié)構(gòu)對(duì)L2套索-LexA相互作用的重要性,將來(lái)自L(fǎng)2套索的絞索區(qū)克隆進(jìn)無(wú)活性套索蛋白內(nèi)含子質(zhì)粒(pIN-L2)(其在蛋白內(nèi)含子介導(dǎo)的環(huán)化反應(yīng)中不經(jīng)歷任何步驟)。以抗N末端蛋白內(nèi)含子血凝素(HA)標(biāo)簽的抗體采用Western分析,我們證實(shí)了L2套索和L2無(wú)活性套索蛋白內(nèi)含子在EY93中的表達(dá),并監(jiān)測(cè)了蛋白內(nèi)含子介導(dǎo)的環(huán)化反應(yīng)。pIL-L2產(chǎn)生未加工(23kDa)和套索(9kDa)產(chǎn)物,而無(wú)活性蛋白內(nèi)含子質(zhì)粒pIN-L2僅產(chǎn)生未加工產(chǎn)物。套索結(jié)構(gòu)對(duì)于L2套索-LexA相互作用是重要的,因?yàn)榕c表達(dá)未加工產(chǎn)物和套索的L2套索(pIL-L2)相比,表達(dá)未加工套索的無(wú)活性L(fǎng)2蛋白內(nèi)含子(pIN-L2)對(duì)酵母雙雜交報(bào)告基因的活化基本檢測(cè)不到(圖17b)。我們采用表面等離子共振分析來(lái)確定合成的對(duì)應(yīng)L2套索絞索的線(xiàn)性肽和LexA之間是否發(fā)生直接的相互作用。該線(xiàn)性L(fǎng)2肽以1.7土0.6pM的Kd與LexA相互作用(圖18)。我們采用質(zhì)譜(MS)測(cè)量在BL21CodonPlus(BL21-CP)大腸桿菌(五.co/Z)中從His-標(biāo)簽細(xì)菌表達(dá)載體(pETIL-L2)表達(dá)的L2套索的分子量。我們觀察到兩種產(chǎn)物,15。/。對(duì)應(yīng)于L2套索(8651Da),85%對(duì)應(yīng)于重18Da的水解套索產(chǎn)物(8669Da)(圖17c)。套索難以通過(guò)MS觀察(Scott,C.P.etal.(1999)Proc.Natl.Acad.Sci.USA96:13638-13643,Scott,C.P.etal.(2001)ChemBiol.8:801-815),可能是由于MS分析中采用的高溫和酸性條件導(dǎo)致內(nèi)酯鍵水解。為了確定MS分析前存在的套索的量,我們采用Na18OH迫使套索內(nèi)酯切割(Hagelin,G.(2005)Rap.Commun.MassSpectrom.19:3633-3642),然后以胰蛋白酶消化套索,并采用LC-ESI-TOFMS分析片段的分子量(圖17d)。Na18OH切割的套索內(nèi)酯比Na18OH處理前切割的內(nèi)酯重2Da。我們觀察到180并入兩胰蛋白酶片段中,這兩胰蛋白酶片段來(lái)自酯鍵的水解或者來(lái)自產(chǎn)生脫氫丙氨酸的a-H消除(隨后是邁克爾加成)(圖19)。并入這些片段中的180部分表明46%的套索在MS分析之前環(huán)化(圖20)。與很多內(nèi)酯環(huán)化肽天然存在的事實(shí)(Guenewald,J.&Marahiel,M.A.(2006)Microbiol.Mol.Biol.Rev.70:121-146)結(jié)合,該數(shù)據(jù)支持套索結(jié)構(gòu)在體內(nèi)的存在??筁exA套索和環(huán)肽的生物學(xué)活性我們監(jiān)測(cè)了L2套索阻斷MMC誘導(dǎo)的LexA切割的能力。MMC為細(xì)菌SOS應(yīng)答的有力誘導(dǎo)劑,SOS應(yīng)答活化RecA輔蛋白酶(coprotease)活性并i秀導(dǎo)LexA的切割(Lin,L丄.&Little,J,W.(1988)Bacteriol.170:2163-2173)。我們將pETIL-L2轉(zhuǎn)化進(jìn)BL21-CP,并采用Western分析來(lái)監(jiān)測(cè)暴露于MMC后、存在和不存在L2套索時(shí)LexA的降解(Yasuda,T.etal.(1998)EMBOJ.17:3207-3216)(圖21a)。在表達(dá)L2套索的細(xì)胞中,3小時(shí)后未觀察到LexA切割,而在表達(dá)帶有CPGC氨基酸絞索(pETIL-01)的套索蛋白內(nèi)含子的細(xì)胞中,1小時(shí)后LexA^皮完全切割。我們證實(shí)L2套索的表達(dá)阻斷了MMC誘導(dǎo)的SOS應(yīng)答基因的表達(dá)。我們將在SOS調(diào)節(jié)的sulA啟動(dòng)子(Hastings,P.J.etal.(2004)PLoSBiol.2:e399)控制下表達(dá)GFP的大腸桿菌菌林SMR6039改造為表達(dá)T7RNA聚合酶(SMR6039-DE3),這使得能夠從T7啟動(dòng)子表達(dá)L2套索。在不存在誘導(dǎo)劑(IPTG)時(shí),對(duì)經(jīng)pETIL-L2轉(zhuǎn)染的SMR6039-DE3的MMC處理導(dǎo)致表達(dá)GFP的細(xì)胞的百分比隨時(shí)間增加(圖21b)。通過(guò)添加IPTG表達(dá)L2套索肽降低了表達(dá)GFP細(xì)胞的百分比(圖21b)。采用Lin和Little描述的存活測(cè)定法(Lin,LL&Little,J.W.(1988)Bacteriol.170:2163-2173),我們測(cè)試了L2套索在存在和不存在MMC時(shí)抑制細(xì)菌生長(zhǎng)的能力。我們?cè)贐L21-CP細(xì)月包中表達(dá)L2套索(pETIL-L2)或帶有CPGC絞索的套索(pETIL-Ol),將細(xì)菌暴露于含MMC的0.85%NaCl中1小時(shí),并測(cè)定它們的存活(圖21c)。表達(dá)任一種質(zhì)粒都將減弱生存力至未誘導(dǎo)對(duì)照的~35%。單獨(dú)的MMC(0.1嗎/ml)減弱生存力至未處理對(duì)照的~14%。L2套索的表達(dá)增強(qiáng)了MMC的活性并將存活力減小至對(duì)照的<1%,而表達(dá)帶有CPGC絞索的套索不增強(qiáng)MMC的活性。我們合成對(duì)應(yīng)L2套索絞索的環(huán)狀和線(xiàn)性肽,并測(cè)試它們抑制細(xì)菌生長(zhǎng)和加強(qiáng)MMC活性的能力。首先,我們采用存活測(cè)定法檢查了單獨(dú)L2肽在0.85%NaCI9中抑制細(xì)菌生長(zhǎng)的能力。以環(huán)狀或線(xiàn)性L(fǎng)2肽處理BL21-CP減弱BLU-CP存活至未處理對(duì)照的~20%(圖21c)。當(dāng)線(xiàn)性L(fǎng)2肽從0.2|ig/ml增加至0.7嗎/ml時(shí),未觀察到存活的進(jìn)一步降低(圖22)。接著,我們研究了L2肽增強(qiáng)MMC效果的能力。我們監(jiān)測(cè)了恒定L2肽濃度下的細(xì)胞存活并改變MMC濃度。環(huán)狀和線(xiàn)性L(fǎng)2肽降低了MMC的最小抑制濃度約IO倍(圖21d)。61因此,本發(fā)明采用蛋白內(nèi)含子介導(dǎo)的肽環(huán)化和酵母雙雜交相互作用陷阱,提供了遺傳學(xué)上選擇針對(duì)給定靶蛋白的套索的方法。該系統(tǒng)使得能快速產(chǎn)生針對(duì)蛋白靶的適合于酵母雙雜交系統(tǒng)的套索和基于該套索的絞索序列的環(huán)肽。該套索技術(shù)為分離環(huán)肽抑制劑提供了快速高通量系統(tǒng),這些抑制劑可用于反向分析蛋白功能或者作為藥物或擬藥(pseudo-drug)來(lái)確定治療輩巴點(diǎn)。我們采用這種系統(tǒng)產(chǎn)生LexA的套素抑制劑并確認(rèn)LexA為增強(qiáng)激活SOS應(yīng)答途徑的試劑的抗菌效果的治療靶點(diǎn)。該套索可轉(zhuǎn)變?yōu)榄h(huán)狀或線(xiàn)性肽,它們也增強(qiáng)MMC的效果。方法試劑線(xiàn)性肽來(lái)自卡爾加里大學(xué)快速多種肽合成服務(wù)(Calgary,AB)。環(huán)肽來(lái)自AnygenCo.Ltd.(韓國(guó))。寡核苷酸來(lái)自IDTDNA(Coralville,IA)并列在在線(xiàn)的附表l中。菌林和質(zhì)粒大腸桿菌菌抹BL21(DE3)來(lái)自Novagen(Madison,WI),BL21-CodonPlus(DE3)-RIL(BL21-CP)來(lái)自Stratagene(LaJolla,CA)。SMR6039為SusanRosenberg(Hastings,P丄etal.pOO"PLoSBiol.2:e399)所贈(zèng)。釀酒酵母(&ce^Ww'ae)菌林EY93(MATaura2his3trplleu2ade2::URA3)源自EGY42(Cohen,B.A.etal.(1998)Proc.Natl.Acad.Sci.USA95:14272-14277)。EY111(MATahis3trplura3::LexA8op畫(huà)lacZade2::URA3-LexA8op畫(huà)ADE2leu2::LexA6op匪LEU2)源自EGY48(Golemis,E.A.&Brent,R.(1992)Mol.Cell.Biol.12:3006-3014)。pINOl:該套索蛋白內(nèi)含子設(shè)計(jì)是基于集胞藻OSy"ec/wx^s"ss/少.)菌抹PCC6803(&p)蛋白內(nèi)含子基因的氨基酸序列。我們通過(guò)將8種(每種0.1嗎)寡核苷酸[A-H]與2.5單位的//m聚合酶(Fermentas,Burlington,ON)、200pMdNTPs、20mMTris國(guó)Cl、10mM(NH4)2S04、10mMKC1,0.1%(v/v)TritonX畫(huà)100、0.1mg/mL牛血清白蛋白(BSA)以及2mMMgS04混合而組裝無(wú)活性蛋白內(nèi)含子基因。我們?cè)?5。C孵育該組裝反應(yīng)5分鐘,然后進(jìn)行25個(gè)循環(huán)(95。C30秒、50。C30秒和72。C1.5分鐘),然后是最后的72。C孵育IO分鐘。采用上述反應(yīng)條件和擴(kuò)增循環(huán),我們4吏用1/5(10nL)的組裝反應(yīng)在含有1PCR引物I和J的50nLPCR反應(yīng)中擴(kuò)增該無(wú)活性蛋白內(nèi)含子基因。我們使用醋酸鋰轉(zhuǎn)化(Schiestl,R.H.&Gietz,R.D.(1989)Curr.Genet.16:339-346),通過(guò)EY93中的體內(nèi)同源重組(Ma,H.etal.(1987)Gene58:201-216),以經(jīng)五coiJ/AY7zo/(Fermentas)消化的500ngpJG4-5(Gyuris,J.etal.(1993)Cell75:791-803)和400ng的PCR擴(kuò)增無(wú)活性蛋白內(nèi)含子將無(wú)活性蛋白內(nèi)含子克隆進(jìn)pJG4-5。套索文庫(kù)(pIL-XX):我們采用寡核苷酸K以7氨基酸組合肽替換pINOl中的CPGC連接肽。我們采用引物L(fēng)和MPCR擴(kuò)增寡核香酸K。我們使用上述反應(yīng)條件,進(jìn)行7個(gè)擴(kuò)增循環(huán),其由95。C30秒的變性步驟、55。C30秒的退火步驟、以及72。C15秒的延伸步驟構(gòu)成。我們以(NewEnglandBiolabs,Ipswich,MA)消化pIN01,并以10單位的蚱堿性磷酸酶(Fermentas)對(duì)消化的質(zhì)粒脫磷酸化。我們?cè)贓Y93中采用體內(nèi)同源重組(Ma,H.etal.(1987)Gene58:201-216)將該文庫(kù)克隆進(jìn)pINOl中。我們進(jìn)行100個(gè)醋酸鋰轉(zhuǎn)化(Schiestl,R.H.&Gietz,R.D.(1989)Curr.Genet.16:339-346),每個(gè)轉(zhuǎn)化含有400ng的經(jīng)擴(kuò)增寡核脊酸K和1嗎的經(jīng)及^//消化的pINOl。合起來(lái),我們獲得了2千萬(wàn)酵母克隆。pIL-L2:pIL-L2為來(lái)自pILXX文庫(kù)的文庫(kù)成員。絞索序列為(RSWDLPGEY)。pIN-L2:通過(guò)將lNw半胱氨酸突變?yōu)楸彼?,我們?gòu)建了pIN-L2,其產(chǎn)生無(wú)活性蛋白內(nèi)含子。兩個(gè)交疊的PCR片段被用于引入點(diǎn)突變。我們采用引物I和N來(lái)擴(kuò)增N末端區(qū),引物O和J來(lái)擴(kuò)增C末端區(qū)。我們將兩PCR產(chǎn)物混合在一起,并采用引物I和J擴(kuò)增全長(zhǎng)蛋白內(nèi)含子。我們?cè)贓Y93中采用體內(nèi)同源重組(Ma,H.etal.(1987)Gene58:201-216)將PCR片段克隆進(jìn)經(jīng)£coi//Wo/消化的pINOl中。pETIL-L2:我們通過(guò)以引物P和Q擴(kuò)增包含中止密碼子的整個(gè)pIL-L2蛋白內(nèi)含子基因來(lái)構(gòu)建pETIL-L2。我們以五coi7和^o/(Fermentas)消化PCR片段并將其克隆進(jìn)pET28b(Novagen)。pETIL-01:我們通過(guò)采用引物P和Q擴(kuò)增包含中止密碼子的整個(gè)pIN-Ol蛋白內(nèi)含子基因來(lái)構(gòu)建pETIL-Ol。我們以五coi/和Wo/(Fermentas)消化PCR片段并將其克隆進(jìn)pET28b(Novagen)。套索文庫(kù)的表征采用"砸窗搶劫(SmashandGrab)"酵母微量制備物(mini-prep)(Geyer,C.R.&Brent,R.(2000)MethodsEnzymol.328:178-208),我們?cè)赥rp-葡萄糖培養(yǎng)基中從含有pIL-XX的EY93過(guò)夜培養(yǎng)物中分離出pIL-XX質(zhì)粒。我們將3pL的酵母微量制備物電穿孔進(jìn)MC1061大腸桿菌細(xì)胞(Invitrogen,Burlington,ON),并在Luria肉湯培養(yǎng)基(LB)上以100嗎/mL氨千青霉素(LB-AMP)選擇轉(zhuǎn)化子。我們采用Qiagen細(xì)菌微量制備物試劑盒(Qiagen,Mississauga,ON)從17個(gè)轉(zhuǎn)化子中分離質(zhì)粒。我們采用引物R和ABI大染料中止劑化學(xué)(ABIbigDyeterminatorchemistry)(AppliedBiosciencesInc,F(xiàn)osterCity,CA)對(duì)7氨基酸組合肽插入序列測(cè)序。篩選套索蛋白內(nèi)含子組合文庫(kù)采用酵母雙雜交相互作用匹配法(Kolonin,M.G.etal.(2000)MethodsEnzymol.328:26-46),我們篩選套索文庫(kù)中與LexA的相互作用。我們將LexA誘辨質(zhì)粒(pEG202)(Gyuris,J,etal.(1993)Cell75:791-803)轉(zhuǎn)化進(jìn)EYlll,并使EYlll::pEG202與EY93::pIL-XX交配。我們?cè)?00mLHis-葡萄糖培養(yǎng)基中將EY111::pEG202培養(yǎng)至OD6000.6-0.9。我們通過(guò)離心沉淀EYlll::pEG202細(xì)月包并在等體積的酵母胨葡萄糖(YPD)培養(yǎng)基中重懸浮該沉淀物。我們以1:20的比例將EY93::pIL-XX細(xì)胞與EYlll::pEG202細(xì)胞混合。我們?cè)赮PD平板上讓酵母細(xì)胞在30。C交配24小時(shí)。我們收集交配的酵母細(xì)胞并采用LEU2、ADE2和LacZ報(bào)告基因篩選2千萬(wàn)個(gè)雙倍體酵母細(xì)胞以檢測(cè)64與LexA相互作用的套索。我們?cè)诤蠿畫(huà)Gal的Hi"Trp-、LeiT、Ade-半乳糖/蔗糖平板上培養(yǎng)雙倍體酵母細(xì)胞約7天。我們選擇陽(yáng)性克隆,并且通過(guò)從陽(yáng)性克隆分離pILXX和重復(fù)上述酵母雙雜交測(cè)定法再確認(rèn)了陽(yáng)性相互作用。蛋白內(nèi)含子加工和套索產(chǎn)物的表征我們采用Western分析以抗HA抗體監(jiān)測(cè)了套索在EY93中的表達(dá)。我們?cè)赥rp-半乳糖/棉子糖培養(yǎng)基中于30。C過(guò)夜孵育含有pIL-L2或pIN-L2的EY93。我們通過(guò)離心收集細(xì)胞,在300珠緩沖液(20mMTris-ClpH7.9、10mMMgCl2、1mMEDTA、5%甘油、1mMDTT、0.3M(NH4)S04、1mMPMSF)和500酸洗的玻璃珠(Sigma,Oakville,ON)中重懸浮細(xì)胞,并在FastPr印FP120(Q-Biogene,Irvine,CA)中裂解細(xì)胞。我們通過(guò)在4°C離心澄清細(xì)胞裂解物。我們采用樣品的OD600對(duì)其標(biāo)準(zhǔn)化并采用標(biāo)準(zhǔn)Western分析方法(Ausubel,F(xiàn).M.etal.(1997)CurrentprotocolsinMolecularBiology(現(xiàn)代分子生物學(xué)實(shí)驗(yàn)技術(shù)))以抗HA標(biāo)簽抗體(SantaCruzBiotechnology,SantaCruz,CA)(1:200稀釋)分析20fxL的上清。我們4吏用LC-ESI-TOFMS證實(shí)了從大腸桿菌中純化的His標(biāo)簽套索的分子量。為了證實(shí)在MS分析之前套索內(nèi)酯的存在,我們以0.5MNa"OH處理His標(biāo)簽套索,采用反相HPLC純化產(chǎn)物,用胰蛋白酶對(duì)其進(jìn)行消化,并采用LC-ESI-TOFMS分析胰蛋白酶片段的分子量。LexA自體蛋白質(zhì)水解的分析我們釆用抗LexA抗體監(jiān)測(cè)了L2套索對(duì)MMC誘導(dǎo)的LexA自體蛋白質(zhì)水解的作用。我們?cè)诤?0pg/ml卡那霉素的10mLLB(LB-KAN)中,讓BL21誦CP::pETIL-01或BL21國(guó)CP::pETIL-L2的培養(yǎng)物生長(zhǎng)過(guò)夜。我們以含有1mMIPTG的LB-KAN將培養(yǎng)物稀釋至OD600為0.1,并且在30。C培養(yǎng)細(xì)胞至OD6。。為約0.4-0.6。我們以100嗎/mL氯霉素處理細(xì)胞,將其孵育10分鐘,并將培養(yǎng)物分為兩份。我們以0.1嗎/mLMMC處理一份培養(yǎng)物,而留下另一份不處理。我們?cè)跇?biāo)明的時(shí)間點(diǎn)從每份培養(yǎng)物中取出4mL樣品,用H20洗滌細(xì)胞,并在-80°C保存,直至所有的時(shí)間點(diǎn)都取樣了。我們?cè)?50pL的PBSTritonX-100(0.05%)和約300nL的酸洗玻璃珠(Sigma)中重懸浮細(xì)胞,并在FastPrepFP120(Q-biogene)中勻漿4x。我們?cè)?。C離心細(xì)胞裂解物并采用標(biāo)準(zhǔn)Western分析方法(Ausubel,F(xiàn),M.etal.(1997)CurrentprotocolsinMolecularBiology(現(xiàn)代分子生物學(xué)實(shí)驗(yàn)技術(shù)))以抗LexA抗體(Invitrogen)(1:5000稀釋)分析澄清上清。分析MMC誘導(dǎo)的SOS應(yīng)答基因的表達(dá)我們采用在SOS調(diào)節(jié)的sulA啟動(dòng)子(Hastings,P.J.Wa/.(2004)PLoSBiol.2:e399)控制下表達(dá)GFP的SMR6039大腸桿菌菌林來(lái)監(jiān)測(cè)對(duì)SOS應(yīng)答途徑的誘導(dǎo)。我們使用XDE3溶原化試劑盒(Novagen)將SMR6039改造為表達(dá)T7RNA聚合酶,這使得在pETIL-L2質(zhì)粒中能從T7啟動(dòng)子表達(dá)L2套索。我們?cè)贚B-KAN中過(guò)夜培養(yǎng)含有pETIL-L2的SMR6039(DE3),在含有1mMIPTG的LB-KAN中將培養(yǎng)物稀釋至OD60。=0.1,并培養(yǎng)細(xì)胞至OD6oo為約0.4-0.6。我們用0.1嗎/mLMMC處理細(xì)胞,在特定時(shí)間點(diǎn)取出樣品,在2mL0.85。/。NaCl中將它們稀釋為終濃度約0.5xl06cfu/mL。我們采用流式細(xì)胞術(shù)(EpicsXL,Coultier,Mississauga,ON)測(cè)量樣品的GFP熒光。如果細(xì)胞表達(dá)GFP在1個(gè)熒光單位以上,則將細(xì)胞評(píng)分為SOS誘導(dǎo)陽(yáng)性。細(xì)菌存活力測(cè)定按Lin和Little所述方法(Lin,L.L.&Little,J.W.(1988)Bacteriol.170:2163-2173),我們進(jìn)行了細(xì)胞存活力測(cè)定。對(duì)于L2從pET28b質(zhì)粒表達(dá)的測(cè)定,我們?cè)?7°C在LB-KAN中培養(yǎng)含pETIL-L2或pETIL-01的BL21(DE3)-CP至OD6o。為0.4。我們將樣品分為兩份,以1mMIPTG誘導(dǎo)1份樣品1小時(shí),留下另一份樣品不誘導(dǎo)。我們?cè)诤谢虿缓?.1pg/mLMMC的5mL0.85%NaCl中將樣品稀釋100倍。我們?nèi)〕?0pL,并在冰冷的LB(1mL)中將其稀釋1000倍作為零時(shí)間點(diǎn)對(duì)照。我們將剩余樣品在37。C孵育l小時(shí),然后取出10pL并稀釋1000倍至1mL冰冷LB。我們將來(lái)自0和1小時(shí)樣品的60pL等份接種在LB平板上并在37°C過(guò)夜孵育平板。對(duì)于采用合成的線(xiàn)性和環(huán)狀L2肽的測(cè)定,除了以我們添加0.7嗎/mL肽替代在MMC處理之前誘導(dǎo)細(xì)胞外,我們進(jìn)行如上所述的存活測(cè)定。通過(guò)l小時(shí)后菌落形成單位(cfii)的數(shù)量除以0小時(shí)'時(shí)間點(diǎn)的cfu數(shù)量,計(jì)算標(biāo)準(zhǔn)化的百分比細(xì)胞存活。未誘導(dǎo)的對(duì)照或無(wú)肽的對(duì)照標(biāo)準(zhǔn)化至100%。表面等離子共振分析L2肽-LexA相互作用我們合成了在N末端具有TAT輸入序列(Vive's,E.etal.(1997)Biol.Chem.272:16010-16017)的線(xiàn)性L(fǎng)2肽NH2-GRKKRRQRRRPPQSRSWDLPGEY。我們采用生產(chǎn)商的方法將該肽連接到羧甲基化的葡聚糖基體傳感器芯片(CM5,Biacore,Piscataway,NJ)。4姿之前所述的方法(Little,J.W.etal.(1994)MethodsEnzymol.244:266-284),我們純化了LexA蛋白。通過(guò)將50mM磷酸緩沖鹽水、100mMNaCl中的LexA以20jiL/分鐘注射2分鐘,并在BiacoreX(Biacore)上測(cè)量解離常數(shù)1.5分鐘,我們測(cè)定了L2肽-LexA相互作用的結(jié)合動(dòng)力學(xué)。我們測(cè)定了LexA濃度在11-110nM范圍內(nèi)的結(jié)合動(dòng)力學(xué)。采用BiaEvaluation軟件(Biacore)將每種稀釋的結(jié)合曲線(xiàn)擬合為k。n和k。ff。純化和表征His標(biāo)簽純化的套索我們采用Ni-NTASpin試劑盒(Qiagen)純化His標(biāo)簽套索。簡(jiǎn)言之,我們以pIL-L2轉(zhuǎn)化BL21-CP大腸桿菌(Invitrogen)。通過(guò)以1mMIPTG誘導(dǎo)0.4OD6。。的BL21-CP::pIL-L2培養(yǎng)物3小時(shí),我們表達(dá)L2套索。我們洗滌細(xì)胞,將它們懸浮在磷酸緩沖鹽水、0.05%TritonX-100、1mg/mL溶菌酶中,并采用超聲裂解它們。我們?cè)?。C以10,000xg離心裂解液20分鐘,并讓澄清的上清通過(guò)Ni-NA柱(Qiagen)。我們以50mMNaH2P04和300mMNaCl洗滌柱3次并采用50mMNaH2P04pH7.0、250mMNaCl和100mMEDTA洗脫L2套索。我們采用C4反相柱(Symmetry300TMC43.5|xm2.1x50mm柱)(Waters,Milford,Massachusetts)以20分鐘內(nèi)5%緩沖液A/95%緩沖液至25。/。緩沖液A/75。/。緩沖液B的梯度(緩沖液A:H20和0.1。/。曱酸(v/v),緩沖液B:乙腈和0.08。/o曱酸(v/v)),分離His標(biāo)簽純化的套索并對(duì)其脫鹽。我們采用ESI(+)-TOFMS(MicroMassLCT,Waters)確定洗脫蛋白的分子量。我們采用最大熵軟件(MaxEnt3,Waters)解析多電荷的套索語(yǔ)圖。為了確定MS分析前內(nèi)酯環(huán)化的套索在樣品中的量,我們采用Na18OH迫使內(nèi)酯鍵斷裂。通過(guò)將鈉(Sigma)溶解在98%H2180(StableIsotopes,Summit,NJ)中制備0.5MNa18OH。我們將His標(biāo)簽純化的L2套索凍干并采用0.5MNa"OH或0.5MNa18OH在室溫(4)下處理500fxg的L2套索16小時(shí)。我們以0.5NHC1酸化反應(yīng)物,使最終pH在2.0-7.0。我們采用C4反相柱(Symmetry300TMC43.5jxm2.1x50mm柱)(Waters)在之前所球相同條件下,通過(guò)HPLC純化套索樣品。我們凍干所純化的L2套索,將其重懸浮在6M尿素和100mMTris-HClpH8.0中,并將樣品在80。C加熱10分鐘來(lái)變性蛋白。我們將樣品冷卻至室溫,在100mMTris-HClpH8.0中稀釋10倍,添加0.68嗎經(jīng)修飾的測(cè)序級(jí)胰蛋白酶(Roche,Laval,QC),并在37°C下孵育樣品過(guò)夜(18小時(shí))。采用20分鐘內(nèi)5%緩沖液A/95。/。緩沖液B至50%緩沖液A/50%緩沖液B的梯度(緩沖液A:H20和0.1。/。曱酸(v/v),緩沖液B:乙腈和0.08%曱酸(v/v)),我們?cè)贐ioSuiteC18PA-A3pm2.1x250mm柱(Waters)上分離來(lái)自Na16OH或Na18OH處理樣品的胰蛋白酶消化產(chǎn)物。洗脫的肽采用ESI-TOF(+)MS(MicroMassLCT,Waters)分析。我們采用MATCHING軟件(Fernandez-de誦Cossio,J.etal.(2004)Rap.Commun.MassSpectrom.18:2465-2472)處理原始圖語(yǔ),該軟件通過(guò)將所觀察的同位素模式與預(yù)測(cè)的同位素模式進(jìn)行比較而檢測(cè)具有小分子量差異的蛋白。MATCHING軟件被用于計(jì)算參與內(nèi)酯鍵的兩胰蛋白酶肽片段SWDLPGEY[966.42m/z][氨基酸73-80]和IFDIGLPQDHNFLLANGAIAHASR[2590.352m/z][氨基酸49-72]中的160和180摻入百分比。對(duì)于73-80氨基酸片段,MATCHING軟件被用于確定"O和1sO摻入百分比(假定摻入一個(gè)氧)。對(duì)于49-72氨基酸片段,MATCHING被用于確定160和18o摻入百分比(假定摻入兩個(gè)氧)。我們采用MATCHING軟件生成的約束條件來(lái)計(jì)算肽混合物最大強(qiáng)度,并以計(jì)算的峰強(qiáng)度對(duì)觀察的峰強(qiáng)度作圖。首先,我們采用等式1(EQ1)計(jì)算每個(gè)峰的強(qiáng)度。為每個(gè)峰指定索引j=l...N,這里N為峰的數(shù)量。每種肽的最大強(qiáng)度由(Xi)定義,其中i-l...P,并且P為肽的數(shù)量?;陔姆肿邮胶妥匀唤缰邪l(fā)現(xiàn)的重同位素百分比,每種肽具有相關(guān)的同位素分布,這種分布采用MS-ISOTOPE軟件(Clauser,K.R.etal.(1999)Anal.Chem.71:2871-2882)確定。每個(gè)峰的強(qiáng)度為在該峰中發(fā)現(xiàn)的所有肽的最大強(qiáng)度的總和乘以比例因子(ScalarFactor)(Ij),比例因子為MS-ISOTOPE軟件預(yù)測(cè)的在該峰位置處肽的最大強(qiáng)度百分比。所有峰(從j^…N)的觀察強(qiáng)度(IobSj)與計(jì)算強(qiáng)度(IcalCj)的總誤差(R"通過(guò)等式2(EQ2)定義。我們將等式系統(tǒng)從EQl代入EQ2,每個(gè)峰CD—個(gè)等式。于是通過(guò)應(yīng)用MATCHING軟件給出的約束條件,EQ2簡(jiǎn)化為單變量。對(duì)于氨基酸73-80(SWDPLGEY),MATCHING軟件確定比例為14%160對(duì)86%180。對(duì)于氨基酸49-72(IFDIGLPQDHNFLLANGAIAHASR),MATCHING軟件確定比例為兩個(gè)160摻入8.8%、一個(gè)160摻入和一個(gè)lsO摻入59.0%,以及兩個(gè)180摻入32.2。我們求EQ2的導(dǎo)數(shù)并相對(duì)于單個(gè)變量對(duì)最小總誤差求解。該值給出肽物質(zhì)之一的最大強(qiáng)度,其被用于計(jì)算其它肽強(qiáng)度的值。等式EQl:計(jì)算峰強(qiáng)度i:(Xiij)=icji為模型中不同肽的數(shù)量,j為峰索引,Xj為肽的最大強(qiáng)度,Ij為通過(guò)MS-ISOTOPE確定的在該峰位置處預(yù)計(jì)的Xi分?jǐn)?shù)的比例因子,以及ICj為在該峰位置處從模型計(jì)算的峰強(qiáng)度。EQ2:總誤差S(I0j-ICj)=R2j為峰索引,IobSj為觀察強(qiáng)度,IcalCj為計(jì)算強(qiáng)度。產(chǎn)生和篩選混合的套索蛋白內(nèi)含子文庫(kù)蛋白內(nèi)含子-蛋白外顯子連接點(diǎn)處蛋白外顯子中的氨基酸可影響剪接。就發(fā)現(xiàn)的鄰近剪接位點(diǎn)的氨基酸而言,SspDnaE蛋白內(nèi)含子表69現(xiàn)為混雜的。野生型蛋白內(nèi)含子的突變或使用混合的蛋白內(nèi)含子可改變這種依賴(lài)性。Iwai"(Iwai,H.etal.(2006)FEBSLett.580:1853國(guó)1858)表明,與wtSspDnaE蛋白內(nèi)含子相比,具有SspDnaEIc結(jié)構(gòu)域和點(diǎn)狀念珠藻(MWocpwwc"/orme)(Npu)DnaEIn結(jié)枸域的斷裂蛋白內(nèi)含子能在Ic-蛋白外顯子連接點(diǎn)(Ic+2)更有效地將線(xiàn)性蛋白外顯子與更多種類(lèi)的氨基酸連接。Dassaef(Dassa,B.etal.(2007)Biochemistry46:322國(guó)330)嘗i式了來(lái)自念珠藻(7VoWocsp.)PCC7120(A^)、湖沼顫藻(Osc///flfo"'a//mwedca)(0/0和7TzeA7wojywec/zococcwjFw/cawws(7Vw)的N末端和C末端結(jié)構(gòu)域的所有組合。所有這些組合都經(jīng)歷某種剪接,證明來(lái)自不同物種的斷裂蛋白內(nèi)含子可結(jié)合,并且許多組合比野生型蛋白內(nèi)含子更有效地剪接。這種結(jié)合被認(rèn)為是部分地由于在模塊B之前緊接的14氨基酸處發(fā)現(xiàn)的帶負(fù)電荷氨基酸和在模塊F之前緊接的12氨基酸處發(fā)現(xiàn)的帶正電荷氨基酸(包括Fl氨基酸)之間的電荷-電荷相互作用?;谶@些發(fā)現(xiàn),我們以來(lái)自NpuDnaE的In結(jié)枸域和來(lái)自SspDnaE的Ic結(jié)構(gòu)域構(gòu)建了混合蛋白內(nèi)含子文庫(kù)。如之前所述,通過(guò)將產(chǎn)生環(huán)肽系統(tǒng)(Scott,CP.etal.(1999)Proc.Natl.Acad.Sci,USA96:13638-有通過(guò)酰胺鍵與內(nèi)酯環(huán)化肽共價(jià)連接的轉(zhuǎn)錄激活結(jié)構(gòu)域的套索),我們制備了與酵母雙雜交系統(tǒng)匹配的套索。為了防止套索中間體進(jìn)行Asn環(huán)化(其產(chǎn)生環(huán)肽),我們讓位置IcM(G7)處的Asn突變?yōu)锳la。質(zhì)粒骨架被修飾為包含不同的選擇標(biāo)志物(Kan替代Amp)以及含有NpuDnaE蛋白內(nèi)含子的In結(jié)枸域和SspDnaE蛋白內(nèi)含子的Ic結(jié)構(gòu)域。為了證實(shí)這種構(gòu)建體仍然被加工,采用含有來(lái)自SspDnaE的兩結(jié)構(gòu)域(Ic-Ssp、1『Ssp)的蛋白內(nèi)含子分離的針對(duì)LexA的L2肽(SRSWDLPGEY)被轉(zhuǎn)移進(jìn)(Ic-Ssp、1『Npu)蛋白內(nèi)含子,該L2肽仍然在酵母雙雜交測(cè)定中與LexA相互作用并經(jīng)歷加工。我們創(chuàng)建三個(gè)套索組合文庫(kù)。一個(gè)文庫(kù),其中"絞索"區(qū)域含有氨基酸序列SX(h)),其中X表示由NNK密碼子(R10)編碼的氨基酸。兩個(gè)文庫(kù),其中"絞索"區(qū)域含有氨基酸序列SX(5),其中X表示由NNK密碼子(R5)或BNT密碼子(B-G、T或C)(F5)編碼的氨基酸。套索肽文庫(kù)構(gòu)建在MATa酵母林EY93中。通過(guò)測(cè)序證實(shí)了文庫(kù)的構(gòu)建。R5和F5文庫(kù)多樣性在核苷酸水平上分別大于理論上的多樣性3xl07和2.5xl05。R10文庫(kù)多樣性為6.5xl06。每一文庫(kù)的10個(gè)文庫(kù)拷貝與Rizl的PR結(jié)構(gòu)域以及與Jak2的各個(gè)結(jié)構(gòu)域配對(duì),Jak2結(jié)構(gòu)域包括全長(zhǎng)Jak2V617F、酪氨酸激酶結(jié)構(gòu)域(JH1)、假激酶結(jié)構(gòu)域(JH2V617F)、以及與假激酶結(jié)構(gòu)域融合的酪氨酸激酶結(jié)構(gòu)域(JH1-JH2V617F)。分離每個(gè)篩選中最強(qiáng)烈的匹配,獲得質(zhì)粒,并在酵母雙雜交測(cè)定中復(fù)查它們的相互作用。PR結(jié)構(gòu)域篩選得到三個(gè)不同的套索序列,它們特異結(jié)合PR結(jié)構(gòu)域。兩個(gè)序列來(lái)自R10文庫(kù),一個(gè)序列來(lái)自R5文庫(kù)。在分析過(guò)的針對(duì)Jak2的套索中,有一個(gè)套索針對(duì)JH1結(jié)構(gòu)域,三個(gè)不同的套索針對(duì)JH2V617F結(jié)構(gòu)域,以及4個(gè)不同的套索針對(duì)全長(zhǎng)Jak2V617F。所有這些套索都來(lái)自R10文庫(kù)。方法構(gòu)建(Ic-Ssp、lN-Npu)蛋白內(nèi)含子質(zhì)粒37。C下在NEBuffer4[50mMTris-醋酸pH7.9、50mM醋酸鉀、10mM醋酸鎂、1mM二硫蘇糖醇]中以RsrII和Xhol消化pINOl3小時(shí),以除去SspDnaElN結(jié)構(gòu)域。采用5個(gè)為在釀酒酵母(S.ce"Ww'ae)中表達(dá)而優(yōu)化的合成寡核苷酸構(gòu)建合成的A^mDnaE(圖23)。DnaE基因以三個(gè)步驟構(gòu)建(l)二聚體延伸(2)全長(zhǎng)構(gòu)建(3)全長(zhǎng)擴(kuò)增。步驟1中,在含有60mMTris-S04(pH8.9)、18mMNH4S04、2mMMgS04、10mMdNTPs和1.0單位Platinum高保真r"《(Invitrogen)的單獨(dú)的PCR管中,將約l嗎(20^M)的具有重疊區(qū)域的寡核苷酸npul+叩112、npu3+npu4、以及npu5+npuVR混合在一起(圖23)。采用95。C5分鐘的i性步驟,接著是采用以下循環(huán)的5輪孵育95。C30秒、55。C30秒、以及72。C15秒,延伸這些二聚體。在步驟2中,通過(guò)將步驟1中形成的二聚體在與二聚體延伸中完全相同的條件下混合于含有60mMTris-S04(pH8.9)、18mMNH4S04、2mMMgS04、10mMdNTPs和1.0單位Platinum高保真Tag(Invitrogen)的單一反應(yīng)管中,構(gòu)建全長(zhǎng)W/wDnaE基因。最后,在步驟3中,從不完全二聚體延伸池中選擇性擴(kuò)增全長(zhǎng)基因而得到全長(zhǎng)基因,步驟(2)的1:10產(chǎn)物與npuVF、npuVR(圖23)、60mMTris-S04(pH8.9)、18mMNH4S04、2mMMgS04、10mMdNTPs和1.0單位Platinum高保真7b《(Invitrogen)混合。該P(yáng)CR反應(yīng)為以95。C變性5分鐘開(kāi)始,接著是25個(gè)循環(huán)95°C30秒、55。C30秒、以及72。C15秒。采用醋酸鋰轉(zhuǎn)化,通過(guò)同源重組,在酵母抹EY93中將合成的A^wDnaE基因克隆進(jìn)以Rsrll和Xhol消化的pIN01(上文)中。這種轉(zhuǎn)化產(chǎn)生了載體pILlOO。接著將KanR基因在AmpR基因位點(diǎn)克隆進(jìn)pIL100。以Sea/在NEBuffer3[100mMNaCl、50mMTris-HClpH7.9、10mMMgCl2、1mM二硫蘇糖醇]中于37。C過(guò)夜消化pIL100。采用S、T(圖23)、60mMTris-S04(pH8.9)、18mMNH4S04、2mMMgS04、10mMdNTPs和l.O單位Platinum高保真(Invitrogen)通過(guò)PCR擴(kuò)增制備KanR基因,該P(yáng)CR起始變性為95。C5分鐘,接著是25個(gè)循環(huán)95。C30秒、55°C30秒、以及72°C1分鐘。采用體內(nèi)同源重組和醋酸鋰轉(zhuǎn)化將KanR基因克隆進(jìn)pIL100中。通過(guò)PCR分析復(fù)查陽(yáng)性克隆,證實(shí)在LB卡那霉素培養(yǎng)基上生長(zhǎng)而不在LB氨芐青霉素上生長(zhǎng)。成功的克隆通過(guò)測(cè)序證實(shí),得到完成的pIL500載體。構(gòu)建混合蛋白內(nèi)含子文庫(kù)構(gòu)建了三個(gè)另外的pIL500套索文庫(kù)(pIL-XX):隨機(jī)5氨基酸文庫(kù)(Libl),隨機(jī)10氨基酸文庫(kù)(Lib2)和隨機(jī)5氨基酸集中庫(kù)(BNT密碼子,B=G、C、T,N=A、G、C、T)(Lib3)。采用文庫(kù)寡核香酸Libl、Lib2或Lib3,我們以組合的5或10氨基酸肽替換pIL500中連接DnaEIc結(jié)構(gòu)域和iV^DnaElN結(jié)構(gòu)域的Ser-Arg接頭肽(圖23)。我們采用引物L(fēng)和npuLRPCR擴(kuò)增文庫(kù)寡核苷酸(圖23)。我們^^用上文所述的反應(yīng)條件,采用7個(gè)擴(kuò)增循環(huán),所述擴(kuò)增循環(huán)由95。C30秒的變性步驟,55。C30秒的退火步驟和72。C15秒的延伸步驟構(gòu)成。我們以M^/(NewEnglandBiolabs,Ipswich,MA)消化pIL500,并采用10單位的蚱72堿性磷酸酶(Fermentas)對(duì)消化的質(zhì)粒脫磷酸。我們?cè)贓Y93中采用體內(nèi)同源重組(Ma,H.etal.(1987)Gene58:201-216)將所述文庫(kù)克隆進(jìn)pIL500中。我們進(jìn)行100個(gè)醋酸鋰轉(zhuǎn)化(Schiestl,R.H.&Gietz,R.D.(1989)Curr.Genet.16:339-346),每個(gè)轉(zhuǎn)化含有400ng的擴(kuò)增文庫(kù)和1pg的經(jīng)7Vn//消化的pIL500。具有增強(qiáng)穩(wěn)定性的突變套索蛋白內(nèi)含子穩(wěn)定內(nèi)酯環(huán)化的套索通過(guò)在蛋白內(nèi)含子環(huán)化反應(yīng)中抑制Asn環(huán)化而產(chǎn)生通過(guò)內(nèi)酯鍵環(huán)化的肽,生成套索肽。我們通過(guò)將套索蛋白內(nèi)含子構(gòu)建體中位置Ic-i(G7)處Asn突變?yōu)锳la而產(chǎn)生套索。環(huán)化套索的內(nèi)酯鍵比酰胺鍵更容易水解,我們證實(shí)當(dāng)在大腸桿菌中表達(dá)時(shí)約50%的套索以?xún)?nèi)酯環(huán)化的狀態(tài)存在。為了改善我們的套索酵母雙雜交測(cè)定法,使其更容易純化并存儲(chǔ)套索,以及擴(kuò)展釆用套索的應(yīng)用,我們檢測(cè)了突變套索是否能產(chǎn)生并穩(wěn)定在套索中?;诘鞍變?nèi)含子反應(yīng)機(jī)制、蛋白內(nèi)含子晶體結(jié)構(gòu)和特定突變穩(wěn)定正常蛋白內(nèi)含子反應(yīng)中的分支中間體的能力(這類(lèi)似于內(nèi)酯環(huán)化的套索),我們?cè)谔姿鳂?gòu)建體中鑒定了穩(wěn)定內(nèi)酯鍵的特定突變或突變組合。我們檢測(cè)了突變的小子集來(lái)確認(rèn)除了在位置Icm(G7)處Asn突變?yōu)锳la中所觀察到的之外,是否可通過(guò)向套索構(gòu)建體引入以下突變來(lái)穩(wěn)定套索內(nèi)酯鍵(總結(jié)在圖24中)(i)突變位置Icm(G7)處的Asn:位置1^(G7)處的Asn對(duì)于蛋白內(nèi)含子介導(dǎo)的環(huán)化反應(yīng)中的Asn環(huán)化是必需的。Asn側(cè)鏈經(jīng)歷環(huán)化以從套索切去lN結(jié)構(gòu)域,并產(chǎn)生內(nèi)酯環(huán)化的肽。在正常的蛋白內(nèi)含子反應(yīng)中,當(dāng)位置Icm(G7)處的Asn突變?yōu)長(zhǎng)ys時(shí),分支中間體積累(KawasakiM,etal.(1997)/5/o/.C7z亂272:15668-15674)。但是,不是位置Icm(G7)處的所有突變都導(dǎo)致分支中間體的積累。例如,位置I"(G7)處的Asn突變?yōu)镾er或Ala(Chong,S,etal.(1996)/5/o/.C/e/w.271:22159-22168)不導(dǎo)致分支中間體的積累。有趣的是,位置Icm(G7)處的Asn突變?yōu)锳la導(dǎo)致分支中間體的積累,如果位置Ic+1(G8)處的Cys也突變?yōu)镾er(Chong,S,etal.(1996)5/o/.CTzem.271:22159-22168)。基于這些觀察結(jié)果,酯鍵附近的環(huán)境似乎在穩(wěn)定分支中間體方面起作用。為了證實(shí)除了Asn至Ala突變夕卜,位置Id(G7)處的突變可增強(qiáng)內(nèi)酯鍵的穩(wěn)定性,我們將位置Id(G7)處的Asn突變?yōu)镚ln。這種突變導(dǎo)致內(nèi)酯鍵的進(jìn)一步穩(wěn)定,從Ala在Id(G7)處時(shí)觀察到的29%內(nèi)酯到Gln在Id(G7)處時(shí)觀察到的47%內(nèi)酯。位置Id(G"處的Gln仍維持著良好的套索加工(67%)(圖24)。這種結(jié)果是出乎意料的,因?yàn)楦鶕?jù)其它蛋白內(nèi)含子的結(jié)果,位置Id(G7)處的Asn被Gln替換時(shí)預(yù)期會(huì)產(chǎn)生功能性蛋白內(nèi)含子,其將一直加工至環(huán)肽。在可選擇實(shí)施方案中,具有其它大側(cè)鏈的氨基酸(具有烷基y碳)可以被用于穩(wěn)定內(nèi)酯(例如通過(guò)阻止水接近內(nèi)酯鍵)。因而以下的氨基酸可以在位置G7處替換(以阻止水接近內(nèi)酯鍵的優(yōu)先順序表示)Trp、Phe、Leu、Ile、Tyr、Met、Val、Arg、Lys、His、Glu、Asp。(ii)位置Ic_2(G6)處His的突變位置Ic.2(G6)處的His通過(guò)與位置Id(G7)處的Asn羰基氧形成氫鍵而協(xié)助Asn環(huán)化。當(dāng)位置IC-2(G6)處的His突變?yōu)長(zhǎng)eu、Asn或Gin時(shí)分支中間體積累,這也依賴(lài)于位置Id(G7)處的氨基酸,因?yàn)楫?dāng)該位置處Asn突變?yōu)锳la時(shí)未觀察到分支中間體(Xu,M.&Perler,f.B.(1996)15:5146-5153)。這種觀察結(jié)果提示位置Id(G7)處的Asn對(duì)于Ic.2(G6)突變導(dǎo)致分支中間體積累是重要的。為了證實(shí)位置Ic_2(G6)處的突變?cè)鰪?qiáng)內(nèi)酯環(huán)化套索的穩(wěn)定性,我們將位置IC-2(G6)處的His突變?yōu)長(zhǎng)eu、Asn或Asp并測(cè)量?jī)?nèi)酯鍵的穩(wěn)定性。Leu、Asn和Asp突變分別增強(qiáng)套索穩(wěn)定性至47。/。、54%和55°/。。Leu突變維持良好的加工(72%),而Asn和Asp突變分別降低加工至19%和8%。在可選擇實(shí)施方案中,具有其它疏水側(cè)鏈的氨基酸也可以用于穩(wěn)定內(nèi)酯鍵(例如,通過(guò)將水排除在反應(yīng)位點(diǎn)之外而同時(shí)仍允許加工)。因而以下的氨基酸也可在位置G6處替換Trp、Phe、Leu、Ile、Met、Tyr。(iii)位置Bll處Arg的突變?cè)贗C-2(G6)處不存在His時(shí),已經(jīng)顯示位置Bll處的Arg可通過(guò)與位置Id(G7)處的Asn羰基氧形成氫鍵而協(xié)助Asn環(huán)化(Ding,Y,etal.(2003)所o/.278:39133-39142)。當(dāng)Ic.2(G6)不是His時(shí),Bll絕大部分情況下是Lys或Arg。目前,沒(méi)有關(guān)于位置Bll處Arg在積累分支中間體中的作用的誘變研究。但是,某些蛋白內(nèi)含子僅能在位置Ic.2(G6)或B11處具有特定氨基酸時(shí)發(fā)揮功能。我們?cè)u(píng)估了位置Ic-2(G6)或B11處單一突變穩(wěn)定套索內(nèi)酯的能力。套索構(gòu)建體的突變、Bll從Arg突變?yōu)門(mén)yr增加套索穩(wěn)定性至38%,突變?yōu)長(zhǎng)eu對(duì)套索穩(wěn)定性沒(méi)有影響,突變?yōu)锳sp降低套索穩(wěn)定性至15%。Tyr、Leu和Asp分別降低套索加工至27%、34%和61%。我們還聯(lián)合位置IcM(G7)處的突變,將位置I。2(G6)處的His也突變?yōu)锳la。Ic.2(G6)突變?yōu)锳la和I。!(G7)突變?yōu)門(mén)yr增加套索穩(wěn)定性至53°/。,而Icm(G7)突變?yōu)锳sp或Lys對(duì)穩(wěn)定性無(wú)影響。Ic-2(G6)突變?yōu)锳la并且Id(G7)突變?yōu)門(mén)yr或Lys分別降低加工至33%和58%,而Icm(G7)突變?yōu)锳sp增強(qiáng)加工至89%。在可選擇實(shí)施方案中,G6(His)突變?yōu)锳la并且Bll(Arg)突變?yōu)榱硪淮髠?cè)鏈可用于穩(wěn)定內(nèi)酯鍵(例如通過(guò)排除水而同時(shí)繼續(xù)允許加工)。因而可聯(lián)合G6處的Ala替換,在Bll處以以下氨基酸替換Lys、Tyr、Phe、Trp、His、Gln、Glu。(iv)位置F4(Asp):該位置的氨基酸在內(nèi)酯鍵附近與水配位,并通過(guò)極化羰基協(xié)助Al和G8的親核攻擊來(lái)參與步驟1和步驟2。因而可將F4從Asp突變?yōu)镚lu和Gln,以便允許步驟1和步驟2發(fā)生,同時(shí)穩(wěn)定內(nèi)酯鍵(例如通過(guò)將水排除出內(nèi)酯鍵附近區(qū)域)。(v)位置F13(His):F13處的His至Ala突變不阻斷步驟3,但是以大疏水氨基酸在F13處替換可以被用于穩(wěn)定內(nèi)酯鍵包括Phe、Leu或lie的替才灸。(vi)位置F14(Asn):F14處的大或帶電氨基酸替換可^C用于^皮壞F13的定位,因而阻斷Asn環(huán)化并穩(wěn)定內(nèi)酯鍵,包括Trp、Phe、Tyr、Leu、Lys、Arg替換。(vii)位置F15(Phe):位置F15突變?yōu)锳la阻斷Asn環(huán)化,而突變?yōu)門(mén)yr僅輕微抑制Asn環(huán)化。因而,F(xiàn)15突變?yōu)榇笫杷被峥梢员挥糜谧钄郃sn環(huán)化,并且將水排除出內(nèi)酯鍵附近,從而穩(wěn)定它。以下的氨基酸因此可于F13定位替換來(lái)穩(wěn)定內(nèi)酯鍵Trp、Leu。方法根據(jù)制造商的說(shuō)明,采用PhusionTM定點(diǎn)誘變?cè)噭┖?Finnzymes)75通過(guò)G6、G7和B11位置處的定點(diǎn)誘變來(lái)構(gòu)建突變。我們采用Ni-NTASpin試劑盒(Qiagen)純化His標(biāo)簽套索。簡(jiǎn)言之,我們以突變蛋白內(nèi)含子表達(dá)質(zhì)粒轉(zhuǎn)化BL21-CP大腸桿菌(Invitrogen)。我們通過(guò)以1mMIPTG誘導(dǎo)0.6OD6。oBL21-CP培養(yǎng)物4小時(shí)來(lái)表達(dá)突變L2套索。我們洗滌細(xì)胞,將它們懸浮在磷酸緩沖鹽水、0.05%TritonX-100、1mg/mL溶菌酶中并采用FastPrep120裂解它們。我們?cè)?。C以10,000xg離心裂解液20分鐘并讓澄清上清通過(guò)Ni-NA柱(Qiagen)。我們用50mMNaH2P04和300mMNaCl洗柱3次并采用50mMNaH2P04pH7.0、300mMNaCl和250mM咪唑洗脫L2套索。我們采用C4反相柱(Symmetry300TMC43.5jam2.1x50mm柱)(Waters,Milford,Massachusetts)以20分鐘內(nèi)95%緩沖液A/5%緩沖液B至25%緩沖液A/75%緩沖液B的梯度(緩沖液A:H20和0.1。/。曱酸(v/v),緩沖液B:乙腈和0.08。/。曱酸(v/v))分離His標(biāo)簽純化的套索并對(duì)其脫鹽。我們采用ESI(+)-TOFMS(MicroMassLCT,Waters)確定洗脫蛋白的分子量。我們采用最大熵軟件(MaxEnt,Waters)解析多電荷的套索鐠圖,以確定HPLC/質(zhì)譜分析后水解的與未水解的套索的比例。通過(guò)環(huán)化增強(qiáng)ScFv穩(wěn)定性某些蛋白結(jié)構(gòu)域和基序,尤其是具有小三級(jí)結(jié)構(gòu)的小基序,可能不容易被小環(huán)肽當(dāng)作靶。這些類(lèi)型的靶可能更有效地作為ScFv的靶,其在結(jié)合小的線(xiàn)性肽表位方面高效。對(duì)于涉及ScFv的醫(yī)學(xué)和非醫(yī)學(xué)應(yīng)用而言,常見(jiàn)的要求是高穩(wěn)定性。ScFv包含免疫球蛋白重鏈和輕鏈的可變結(jié)構(gòu)域,它們通過(guò)短肽接頭保持在一起(Bird,R.E.,etal.(1988)5Wewce242:423-426)。4艮多從天然抗體產(chǎn)生的或者通過(guò)體外選擇而分離的ScFv不能在它們計(jì)劃的應(yīng)用中有效地發(fā)揮功能,因?yàn)樗鼈兘?jīng)常變性或聚集(Worn,A.&Pluckthun,A.(2001)丄Mo/.5/o/.305:989-1010)。對(duì)于細(xì)胞內(nèi)應(yīng)用,由于在細(xì)胞質(zhì)的還原條件下ScFv不能形成保守的結(jié)構(gòu)域內(nèi)二石危鍵而凈皮去穩(wěn)定化(Worn,A.&Pluckthun,A.(2001)Mo/.5/o/.305:989-1010)。包括推理和進(jìn)化手段在內(nèi)的多種策略已被用于增強(qiáng)ScFv的結(jié)構(gòu)域內(nèi)和結(jié)構(gòu)域間穩(wěn)定性(Worn,A.&Pluckthun,A.(2001)/Mo/.所o/.305:989-1010),以產(chǎn)生各種互補(bǔ)決定區(qū)(CDR)可嫁接在其上的穩(wěn)定scFv框架。這些ScFv框架通常能很好地發(fā)揮功能,但是很多情況下特異的CDR不與給定的框架匹配(Worn,A.&Pluckthun,A.(1998)i^:^S丄e".427:357-361)。為了產(chǎn)生適合于酵母雙雜交和其它測(cè)定法的更通用和穩(wěn)定的ScFv框架,可環(huán)化ScFv或者增加它們的表面電荷,二者都應(yīng)增強(qiáng)穩(wěn)定性和溶解性。我們采用Tanaka等人使用的用于酵母雙雜交測(cè)定的ScFv框架(Tanaka,T.,etal.,(2003)iV"c/.爿c/A及w.31:e23),在酵母雙雜交表達(dá)載體中構(gòu)建了數(shù)個(gè)ScFv文庫(kù)?;贔ellouse等人報(bào)道的用在噬菌體展示中的;殳計(jì)(Fellouse,RA.etal"(2004)7V^/.Jcad<SW101:12467-12472;Fellouse,F.A.,etal.(2005)Mo/.5/o/.348:1153-1162),我們^f吏三個(gè)重鏈可變環(huán)和一個(gè)輕鏈可變環(huán)隨機(jī)化。用于隨才幾化的所選殘基顯示在圖25中。兩個(gè)丈庫(kù)具有采用Tyr和Ser組合(稱(chēng)為T(mén)4)或Tyr、Ala、Asp和Ser組合(稱(chēng)為K4)隨機(jī)化的重鏈上的三個(gè)CDR和輕鏈上的一個(gè)CDR。選擇這種有限的氨基酸多樣性是基于Fellouse等人的才艮告,其中他們證實(shí)具有微摩爾至納摩爾結(jié)合親和力的ScFv可采用T4(Fellouse,RA.,etal.(2005)M/.所o/.348:1153-1162)或K4(Fellouse,F.A.etal.,(2004)iVo".爿c"(i5W.101:12467-12472)多樣性隨機(jī)化的ScFv分離。通過(guò)將這些文庫(kù)克隆在套索構(gòu)建體中而產(chǎn)生基于T4和K4文庫(kù)的兩個(gè)另外文庫(kù),將它們命名為cyc-T4和cyc-K4。我們采用Western分析法分析了這些文庫(kù)的表達(dá)(圖26)。我們采用代表性試驗(yàn)蛋白計(jì)算了有效的文庫(kù)親和力,其為每個(gè)文庫(kù)當(dāng)量的陽(yáng)性相互作用數(shù)。我們使用兩個(gè)酵母雙雜交報(bào)告系統(tǒng)來(lái)評(píng)價(jià)有效文庫(kù)親和力。第一種報(bào)告子為"弱"腺噤呤報(bào)告子,其需要較小的親和相互作用來(lái)激活。第二種報(bào)告子為"較強(qiáng)"腺噤呤/LacZ報(bào)告子,其需要較強(qiáng)的親和相互作用來(lái)激活。對(duì)于非環(huán)化的和套索T4和K4文庫(kù),我們觀察到弱相互作用文庫(kù)成員數(shù)量的增加(圖27)。T4和K4文庫(kù)的套索環(huán)化增加了較強(qiáng)相互作用文庫(kù)成員的數(shù)量(圖27)??膳c套索環(huán)化策略聯(lián)合使用的用于穩(wěn)定的可選擇方法涉及增加或降低ScFv表面電荷。最近,Lawrence等人顯示,蛋白表面電荷的根本變化"增壓(supercharging)"可顯著減小聚集傾向并改善蛋白的溶解性,同時(shí)不破壞它們的功能(Lawrence,M.A.,etal.,(2007)爿w.CTew.Soc.129:10110-10112)。在一些實(shí)施方案中,因而可以產(chǎn)生經(jīng)增壓的環(huán)狀ScFv,例如采用將降低它們的聚集傾向的修飾(Worn,A.&Pluckthun:A.(2001)J.Mol.Biol.305:989-1010)。ScFv的晶體結(jié)構(gòu),如(Tanaka,T.,etal.,(2007)EMBOJ.26:3250-3259)所報(bào)道的,可^皮用作鑒定待突變表面殘基的指導(dǎo)。ScFv上溶劑可及的表面殘基可采用鑒定表面殘基的ASAView軟件(Ahmad,S.,etal.,(2004)BMCBioinf.5:51-56)或其它類(lèi)似的軟件和技術(shù)鑒定。取決于在ScFv上希望的電荷是正、負(fù)或正負(fù)電荷的混合,可將表面氨基酸突變?yōu)閹д姲被?Lys、Arg、His)或帶負(fù)電氨基酸(Asp、Glu、Tyr、Cys)。采用諸如酵母雙雜交測(cè)定法的遺傳測(cè)定法,表達(dá)為與給定靶相互作用的套索、未加工或雙半胱氨酸蛋白內(nèi)含子的ScFv可從合成的ScFv文庫(kù)分離,其中可變區(qū)或CDR以?xún)煞N或多種氨基酸隨機(jī)化。一旦被分離,通過(guò)采用蛋白內(nèi)含子介導(dǎo)的環(huán)肽/蛋白生成反應(yīng),將ScFv表達(dá)為套索或頭尾相接的環(huán)化ScFv,它們可被穩(wěn)定地生產(chǎn)。可選擇地,可通過(guò)交聯(lián)環(huán)化ScFv。ScFv可^皮改造為含有作為其N(xiāo)和C末端的小接頭肽,它們含有可交聯(lián)的氨基酸并產(chǎn)生環(huán)化的ScFv。用于細(xì)月包內(nèi)應(yīng)用的環(huán)4匕和/或增壓ScFv也可/人雜交瘤細(xì)胞系產(chǎn)生的現(xiàn)有單克隆抗體構(gòu)建。這種情況下,重和輕鏈抗體cDNA被用作模板來(lái)PCR擴(kuò)增輕和重鏈可變結(jié)構(gòu)域。然后這些結(jié)構(gòu)域可被克隆進(jìn)一個(gè)描述的蛋白內(nèi)含子表達(dá)構(gòu)建體,其中它們將翻譯為套索、未加工或雙半胱氨酸ScFv??蛇x擇地,ScFv可被改造為含有作為其N(xiāo)和C末端的小接頭肽,它們含有可交聯(lián)的氨基酸并產(chǎn)生環(huán)化的ScFv。采用諸如噬菌體展示、酵母展示等的體外篩選策略分離的針對(duì)給定靶的ScFv和抗原結(jié)合片段(Fabs)也可通過(guò)上文所述的環(huán)化和/或增壓被轉(zhuǎn)化為細(xì)胞內(nèi)抗體。抗原結(jié)合片段(Fab片段)為抗體上的區(qū)域,其結(jié)合抗原。它由重鏈和輕鏈的各一個(gè)恒定和一個(gè)可變結(jié)構(gòu)域構(gòu)成。環(huán)化或增壓也可應(yīng)用到單獨(dú)重鏈或輕鏈片段的表達(dá)。這種情況下78重鏈和輕鏈凈皮單獨(dú)用作親和試劑。分開(kāi)表達(dá)環(huán)化和/或增壓的重和輕鏈,并且它們相互作用并形成由兩條鏈構(gòu)成的功能性Fv,這樣也是可能的。環(huán)化或增壓也可應(yīng)用至Fab片段的表達(dá)。Fab由重鏈和輕鏈的各一個(gè)恒定和一個(gè)可變結(jié)構(gòu)域構(gòu)成。Fab的輕鏈和重鏈區(qū)域通過(guò)結(jié)構(gòu)域間二硫鍵維持在一起。這種情況下,通過(guò)釆用上述方法之一環(huán)化,F(xiàn)ab可穩(wěn)定在還原環(huán)境中,例如存在于細(xì)胞內(nèi)。純化環(huán)狀ScFv我們預(yù)期ScFv環(huán)化和增壓將減弱構(gòu)象呼吸(conformationalbreathing)和疏水聚集,由此增強(qiáng)穩(wěn)定性和溶解性。環(huán)化被證實(shí)穩(wěn)定GFP(Iwai,H.,etal.,(2001)J.Biol.Chem.276:16548-16554)和P-內(nèi)酰胺酶(Iwai,H.&Pluckthun,A.(1999)FEBSLett459:166-172)。我們采用蛋白內(nèi)含子介導(dǎo)的環(huán)化來(lái)環(huán)化ScFv并使用蛋白L柱來(lái)純化ScFv。如果需要可選擇方法來(lái)純化更高水平的ScFv,則我們將使用組氨酸標(biāo)簽作為接頭來(lái)連4妄ScFv輕鏈和重鏈,類(lèi)似于用于純化環(huán)狀GFP(Iwai,H.,etal.,(2001)J.Biol.Chem.276:16548畫(huà)16554)和|3-內(nèi)酰胺酶(Iwai,H.&Pluckthun,A.(1999)FEBSLett.459:166國(guó)172)的策略。環(huán)化肽和蛋白的表達(dá)和輸送除了細(xì)胞內(nèi)瞬時(shí)表達(dá)(質(zhì)粒轉(zhuǎn)化、腺病毒等)或通過(guò)整合進(jìn)宿主基因組(穩(wěn)定細(xì)胞系、逆轉(zhuǎn)錄病毒等)被表達(dá)外,環(huán)化肽、基因組片段和ScFv可在體外或體內(nèi)應(yīng)用中外源輸送。現(xiàn)有采用脂多糖、脂肽、脂質(zhì)體和聚乙二醇(PEG)偶聯(lián)物的多種輸送系統(tǒng)(參見(jiàn)綜述Ali,M&Manolios,N.(2002)Lett.PeptideSci.8:289-294)。也可通過(guò)將肽和蛋白共價(jià)或非共價(jià)偶聯(lián)至轉(zhuǎn)導(dǎo)肽而輸送(參見(jiàn)綜述Joliot,A&Prochiantz,A.(2004)NatureCellBiol.6:189-196)。方法構(gòu)建ScFv和文庫(kù)i殳計(jì)ScFv框架采用為釀酒酵母表達(dá)而優(yōu)化的密碼子構(gòu)建編碼ScFv框架的合成基因。采用Tanaka等人報(bào)道的ScFv(Tanaka,T.,etal.(2003)Nucl.AcidsRes.31:e23)設(shè)計(jì)了重鏈和輕鏈的氨基酸序列??缰劓湹牡谝缓偷诙﨏DR的區(qū)域被7Vrw/限制性?xún)?nèi)切酶位點(diǎn)替換,以便能將隨機(jī)氨基酸文庫(kù)克隆進(jìn)重鏈的CDR1和CDR2。重鏈CDR3被屈o/限制性?xún)?nèi)切酶位點(diǎn)替換。輕鏈和重鏈通過(guò)由甘氨酸和絲氨酸重復(fù)[G4S]3構(gòu)成的接頭肽連接。輕鏈CDR為不變的,其基于Martineau等人報(bào)道的抗(3-半乳糖苷酶ScFv(Martineau,P.,etal.(1998)J.Mol.Biol.280:117-127)。程序GeneDesign[http:〃slam.bs.jhmi.edu/gd/]凈皮用于設(shè)計(jì)18重疊寡核苷酸(Oligol-18-Ab)(圖28),它們被用于構(gòu)建合成的ScFv細(xì)胞內(nèi)抗體基因。將18寡核苷酸(Oligol-Ab至01igol8-Ab)與HIFI&《聚合酶緩沖液(60mMTris-S04(pH8.9)、18mM(NH4)2S04)(Invitrogen)、0.2mMdNTPs、2mMMgS04、以及1.0單位PlatinumHIFI&《聚合酶(Invitrogen)混合在一起(每種0.2ng爾L)。將反應(yīng)混合物在以下條件下孵育94。C2分鐘、(94。C30秒、56。C30秒、68。C1分鐘(30個(gè)循環(huán)))以及68。C10分鐘。為了擴(kuò)增全長(zhǎng)基因產(chǎn)物,采用2pL的上述PCR產(chǎn)物以及0.2Ab-pJG4-5.FWD引物和0.2Ab-pJG4-5.RVS引物在上述條件下進(jìn)行另一PCR(圖28)。將ScFv4醫(yī)架克隆進(jìn)酵母表達(dá)載體以0.5單位五co/7內(nèi)切酶、1單位Wo/內(nèi)切酶、1xy+/Tango緩沖液(Fermentas)消化pIL500以除去蛋白內(nèi)含子序列。反應(yīng)混合物在37。C孵育過(guò)夜。采用同源重組將ScFv框架克隆進(jìn)經(jīng)五co^/和J^o/消化的pIL500中。按Gietz等人的方法(Schiestl,R.H.&Gietz,R.D.(1989).Curr.Genet.16:339-346),將經(jīng)五co及/和^To/消化的pIL500和40|iLPCR擴(kuò)增的ScFv框架轉(zhuǎn)化進(jìn)酵母株EY93,產(chǎn)生ScFv框架表達(dá)質(zhì)粒,稱(chēng)為pScFv誦Fr。CDR文庫(kù)寡核苷酸通過(guò)采用同源重組將側(cè)翼連接不變區(qū)域的簡(jiǎn)并寡核香酸克隆進(jìn)ScFv框架而使CDR隨機(jī)化。由Tyr(TAT密碼子)和Ser(TCT密碼子)構(gòu)成的組合文庫(kù)(稱(chēng)為T(mén)4文庫(kù))采用TMT筒并密碼子構(gòu)建,其中T=胸腺嘧啶,M=腺嘌呤或胞嘧啶。T4文庫(kù)在重鏈CDR1-3和輕鏈CDR3中含有組合的Tyr和SerCDRs。由Tyr(TAT密碼子)、Ser(TCT密碼子)、Asp(GAT密碼子)和Ala(GCT密碼子)構(gòu)成的組合文庫(kù)(稱(chēng)為K4文庫(kù))采用KMT簡(jiǎn)并密碼子構(gòu)建,其中M-腺噤呤或l包嘧,定,K-胸腺嘧啶或鳥(niǎo)嘌呤。K4文庫(kù)在重鏈CDR1-3和輕鏈CDR3中含有組合的Tyr、Ser、Ala和AspCDRs。含有簡(jiǎn)并CDR的寡核苦酸(Oligo-CDRlKMT、Oligo國(guó)CDRlTMT、01igo-CDR2KMT、01igo-CDR2TMT、Oligo-CDR3KMT、01igo國(guó)CDR3TMT、L3.KMT.RVS和L3.KTMT.RVS列在圖28中。將簡(jiǎn)并重鏈CDR3克隆進(jìn)ScFv框架為了將簡(jiǎn)并重鏈CDR3克隆進(jìn)ScFv框架,以Wo/消化pScFv-Fr質(zhì)粒并凝力交純化。通過(guò)采用醋酸鋰轉(zhuǎn)化(Schiestl,R.H.&Gietz,R.D.(1989)Curr.Genet.16:339-346)將屈o/消化的pScFv-Fr和PCR擴(kuò)增的01igo-CDR3KMT轉(zhuǎn)化進(jìn)EY93,利用同源重組將用于K或T文庫(kù)的簡(jiǎn)并CDR3區(qū)&戈克隆進(jìn)pScFv-Fr,這產(chǎn)生了新質(zhì)粒pScFv-Fr-HCD3-K或pScFv誦Fr-HCD3國(guó)T。在以下反應(yīng)中PCR擴(kuò)增01igo-CDR3KMT:lxPCR緩沖液、0.2mMdNTPs、2mMMgS04、1CDR.FWD、1pMCDR3.RVS、0.02|iM01igo-CDR3KMT或01igo-CDR3KMT、72|iLH20、0.4pL7^聚合酶。在以下條件下孵育PCR反應(yīng)95。C1分鐘,95°C30秒,52°C30秒和68。C30秒(20循環(huán))。將簡(jiǎn)并重鏈CDR1和CDR2克隆進(jìn)ScFv框架為了將CDR1和CDR2引入含有簡(jiǎn)并CDR3的ScFv框架,以iVrw/消化pScFv-Fr-HCD3-K和pScFv-Fr-HCD3-T并凝膠純化。在以下反應(yīng)中PCR擴(kuò)增CDR1和CDR2:lxPCR緩沖液、0.2mMdNTPs、2mMMgSO4、0.02pMOligo-CDRITMT(或KMT)、0.0201igo畫(huà)CDR2TMT(或KMT)、0.2pMCDR1-F2-CDR2.RVS、0.2|xMCDR1國(guó)F2-CDR2.FWD、80pLH2O、0.4r"《聚合酶。在以下條件下孵育PCR反應(yīng)95。C2分鐘,95。C30秒,56。C30秒,68。C1分鐘(25個(gè)循環(huán))以及68。C10分鐘。通過(guò)采用醋酸鋰轉(zhuǎn)化(Schiestl,R.H.&Gietz,R.D.(1989)CumGenet.16:339國(guó)346)將iVn//消化的pScFv-Fr-HCD3-K或pScFv-Fr國(guó)HCD3-T和PCR擴(kuò)增的CDR1和CDR2轉(zhuǎn)化進(jìn)EY93,來(lái)分別利用同源重組將筒并K或TCDR1和CDR2區(qū)域克隆進(jìn)pScFv-Fr-HCD3-K和pScFv-Fr-HCD3-T,這產(chǎn)生了新質(zhì)粒pScFv-Fr-HCDl-3-K和pScFv畫(huà)Fr畫(huà)HCDl國(guó)3-T。將簡(jiǎn)并輕鏈CDR3克隆進(jìn)ScFv框架為了將輕鏈CDR3引入含有筒并重鏈CDRl-3的ScFv框架中,含有簡(jiǎn)并輕鏈K或T文庫(kù)CDR3的引物(圖28)被用于從pScFv-Fr國(guó)HCDl-3-K和pScFv-Fr-HCDl-3-T擴(kuò)增含有簡(jiǎn)并重鏈CDR1-3的ScFv。使用以下的PCR反應(yīng)條件lxPCR緩沖液(Invitrogen)、0.2mMdNTPs、1pScFv-Fr-HCDl誦3國(guó)K或pScFv-Fr-HCDl畫(huà)3國(guó)T、0.6PIpJG4國(guó)5chK、0.2pMTMT(或KMT)L3.RVS、0.2Ab33.pJG26.RVS、0.2pMpJG4-5.RVS、17hg聚合酶。在以下條件下孵育反應(yīng)混合物95。C2分鐘,95。C30秒,55。C30秒,72。C30秒(25循環(huán))以及72。CIO分鐘。將PCR產(chǎn)物克隆進(jìn)經(jīng)五coi/和^o/消化的pIL500中,產(chǎn)生表達(dá)K4和T4文庫(kù)的質(zhì)粒,稱(chēng)為pScFv-K4或pScFv-T4。ScFv文庫(kù)的環(huán)化以10單位的7Vnz/和lxNEBuffer在100|iL反應(yīng)中消化pIL500。該反應(yīng)在37。C孵育24小時(shí)。采用引物PlVH3-74/pIL500(圖28)利用所述引物含有與IC結(jié)構(gòu)域的重疊互補(bǔ)序列。第二引物(P2L19/接頭)(圖28)含有編碼第二接頭肽的DNA,其在Vh結(jié)枸域和Iw結(jié)構(gòu)域之間添加接頭肽。采用以下條件PCR擴(kuò)增ScFv文庫(kù)lxPCR緩沖液、0.2mMdNTPs、1pLpScFv-K4或pScFv-T4、0.2(iMPlVH3陽(yáng)74/pIL500、0.2P2L19/接頭、以及1聚合酶。在以下條件下孵育PCR反應(yīng)95。C2分鐘,95。C30秒,50。C30秒,72。C2分鐘(30循環(huán))以及72。C7分鐘。采用引物(P2接頭/pIL500)進(jìn)行另一PCR反應(yīng),其將重疊序列的DNA添加到lN結(jié)構(gòu)域。該反應(yīng)4安上述方法進(jìn)4于。將PCR產(chǎn)物克隆進(jìn)經(jīng)Nrul消化的pIL500中,產(chǎn)生表達(dá)K4和T4文庫(kù)的質(zhì)粒,稱(chēng)為pScFv-cyc-K4或pScFv-cyc-T4。來(lái)自每個(gè)文庫(kù)的50個(gè)成員被測(cè)序以確定功能性ScFv的百分比和證實(shí)文庫(kù)多樣性。酵母雙雜交相互作用交配篩選針對(duì)5誘斜池Bcr-AblSH2結(jié)構(gòu)域、Bcr-AblSH3結(jié)構(gòu)域、Bcr-Abl巻曲螺旋結(jié)構(gòu)域、Bcr-AblY177基序以及HckTyr激酶結(jié)構(gòu)域篩選K4、cyc-K4、T4和cyc-T4文庫(kù)。將K4、cyc-K4、T4和cyc-T4文庫(kù)轉(zhuǎn)化進(jìn)EY93,以得到分別為4.2x106、4.2x106、20x106和2.2x106的最終文庫(kù)多樣性。ScFv文庫(kù)和誘辨細(xì)胞分別在Trp-葡萄糖和His-葡萄糖培養(yǎng)基中過(guò)夜培養(yǎng),達(dá)到高于0.5的光密度。將細(xì)胞在室溫下以4000rpm離心5分鐘并在lxPBS中洗滌。如上所述將細(xì)月包再次離心并重懸浮在YPD+腺噤呤(40mg/L)培養(yǎng)基中。將細(xì)胞以60x106ScFv文庫(kù)細(xì)胞對(duì)30xl(^每種誘斜(總誘何150xl0"的比例混合并接種在YPD+腺噤呤平板上,在30。C孵育過(guò)夜。.第二天將細(xì)胞從平板上刮下,用40mLH2O洗滌,重懸浮在甘油冷凍的溶液(根據(jù)沉淀多少)中,保存在-80。C。計(jì)算了交配效率并確定了雙倍體的數(shù)量。來(lái)自每個(gè)文庫(kù)的6xl06細(xì)胞(對(duì)正確克隆的序列標(biāo)準(zhǔn)化)接種在His-、Trp-、Leu-半乳糖/蔗糖平板上,以便為與誘辨相互作用并激活LEU2酵母雙雜交報(bào)告基因的ScFv評(píng)分。一星期后,將平板影印接種在His-、Trp-、Ade-、X-Gal半乳糖/篇糖平板上。生長(zhǎng)的細(xì)胞分類(lèi)為弱相互作用子(interactor),生長(zhǎng)并變藍(lán)的細(xì)胞分類(lèi)為強(qiáng)相互作用子(圖27)。該測(cè)定重復(fù)進(jìn)行5次。ScFv套索的Western分析83讓cyc-K4文庫(kù)成員的單個(gè)成員在Trp-葡萄糖培養(yǎng)基中過(guò)夜生長(zhǎng)。在室溫下將細(xì)胞以4000rpm離心5分鐘,在40mLH20中洗滌,離心,重懸浮在10mLTrp-半乳糖/棉籽糖培養(yǎng)基中。在1、3、4、5、6、8、9.5和25小時(shí)時(shí)間點(diǎn)取樣1mL,用于分析cyc-K4成員的表達(dá)。室溫下將特定時(shí)間點(diǎn)的等份樣品以4000rpm離心5分鐘并在1mLH20中洗滌。將細(xì)胞重懸浮在100pLH2O和100jxL0.2MNaOH中,輕輕震蕩,并在室溫下孵育5分鐘。將反應(yīng)離心并重懸浮在50^LSDS上樣緩沖液(0.06MTris畫(huà)HCl,pH6.8、5%甘油、2%SDS、4。/。p國(guó)巰基乙醇、0.0025%溴酚藍(lán))中,在95。C加熱3分鐘。采用15。/。SDSPAGE分析樣品。以15伏45分鐘將凝膠電印跡至硝酸纖維素膜。將硝酸纖維素膜在lOmL封閉緩沖液(LicorBiosciences)中孵育1小時(shí)。將膜在a-HA一抗溶液(50|xLa-HA抗體(SantaCruz)、10mL封閉纟爰沖液、5(xL吐溫)中孵育過(guò)夜。以lxPBS洗滌膜3次并以a-小鼠二抗(LicorBiosciences)孵育1小時(shí)。以lxPBS洗滌膜3次并使用紅外線(xiàn)Licor分析儀觀察。盡管本文已經(jīng)公開(kāi)了本發(fā)明的不同實(shí)施方案,但是依照本領(lǐng)域技術(shù)人員的普通常識(shí)在本發(fā)明范圍內(nèi)可以做出很多改動(dòng)和修飾。這類(lèi)修飾包括本發(fā)明的任何方面中的已知等同物替換,以便以本質(zhì)上相同的方式達(dá)到相同的結(jié)果。定義范圍的數(shù)包括在數(shù)字范圍內(nèi)。詞語(yǔ)"包含(comprising)"在本文中作為開(kāi)放式用語(yǔ),基本上等同于短語(yǔ)"包括,但不限于",詞語(yǔ)"包含(comprises)"具有對(duì)應(yīng)的含義。用在本文時(shí),單數(shù)形式的"a"、"an"和"the"包括復(fù)數(shù)對(duì)象,除非上下文清楚地另有指示。因此,例如提及"athing,,包括一個(gè)以上的這種事物(thing)。利和專(zhuān)利申請(qǐng))都通過(guò)?1用并入本文,如同每個(gè)出版物都被明確地和單獨(dú)地指明通過(guò)引用并入本文并且如同在本文中充分闡述。本發(fā)明包括實(shí)質(zhì)上在上文中描述的以及涉及實(shí)施例和附圖的所有的實(shí)施方案和變權(quán)利要求1.編碼斷裂蛋白內(nèi)含子多肽的重組核酸序列,其中按氨基至羧基的順序,所述斷裂蛋白內(nèi)含子多肽包含包含F(xiàn)模塊和G模塊的IC結(jié)構(gòu)域,所述F模塊與序列rVYDLpV**a--HNFh有至少80%的一致性,分別命名為位置F1至F16,所述G模塊與序列NGhhhHNp有至少80%的一致性,分別命名為位置G1至G8;與所述G模塊的C末端部分連接的蛋白外顯子結(jié)構(gòu)域;以及與所述蛋白外顯子結(jié)構(gòu)域的C末端部分連接的IN結(jié)構(gòu)域,所述IN結(jié)構(gòu)域包含A模塊和B模塊,所述A模塊與序列Ch--Dp-hhh--G有至少80%的一致性,分別命名為位置A1至A13,所述B模塊與序列G--h-hT--H-hhh有至少80%的一致性,分別命名為位置B1至B14;其中大寫(xiě)字母表示通過(guò)單字母氨基酸代碼命名的氨基酸;“h”表示選自G、B、L、I、A和M的疏水殘基;“a”表示選自D和E的酸性殘基;“r”表示選自F、Y和W的芳香殘基;“p”表示選自S、T和C的極性殘基;“-”表示任何氨基酸;以及“*”表示任選的空位;以及其中位置G7處編碼的殘基為Q、W、F、L、I、Y、M、V、R、K、H、E或D;和/或位置G6處編碼的殘基為L(zhǎng)、N、D、W、F、I、M或Y;和/或位置B11處編碼的殘基為K、Y、F、W、H、Q或E;和/或位置G6處編碼的殘基為A且G7為Y;和/或位置G6處編碼的殘基為A且B11為K、Y、F、W、H、Q或E;和/或位置F4處編碼的殘基為E或Q;和/或位置F13處編碼的殘基為F、L或I;和/或位置F14處編碼的殘基為W、F、Y、L、K或R;和/或位置F15處編碼的殘基為W或L;和/或位置B9處的殘基不為R或T且對(duì)于N-X?;D(zhuǎn)換而言是非催化氨基酸;和/或位置B10處的殘基不為R或T且對(duì)于N-X?;D(zhuǎn)換而言是非催化氨基酸;和/或位置F2處的殘基不為R或T且對(duì)于N-X?;D(zhuǎn)換而言是非催化氨基酸;和/或位置F6處的殘基不為S、T或C且對(duì)于涉及位置G8處親核氨基酸攻擊酯鍵或硫酯鍵的酯交換反應(yīng)而言是非催化氨基酸。2.如>^又利要求1所述的重組核酸,其中位置G7處編碼的殘基為Q;或位置G6處編碼的殘基為L(zhǎng)、N或D;或位置Bll處編碼的殘基為Y;或位置G6處編碼的殘基為A且G7為Y。3.如權(quán)利要求1所述的重組核酸,其中所述蛋白外顯子結(jié)構(gòu)域包含編碼免疫球蛋白分子的免疫球蛋白編碼區(qū),所述免疫球蛋白分子包含通過(guò)接頭連接至輕鏈可變區(qū)的重鏈可變區(qū),第一接頭將所述重鏈可變區(qū)的C末端區(qū)連接至所述輕鏈可變區(qū)的N末端區(qū),第二接頭將所述重鏈可變區(qū)的N末端區(qū)連接至所述輕鏈可變區(qū)的C末端區(qū),其中所述接頭包含至少I(mǎi)O個(gè)氨基酸的多肽鏈,其中所述重鏈可變區(qū)包含一個(gè)或多個(gè)選自HFR1、HFR2、HFR3和HFR4的重鏈框架區(qū);并且所述重鏈可變區(qū)還包含一個(gè)或多個(gè)選自CDR-H1、CDR-H2、CDR-H3的互補(bǔ)決定區(qū);所述重鏈框架區(qū)和互補(bǔ)決定區(qū)按式HFR1畫(huà)誦CDR-H1陽(yáng)國(guó)HFR2畫(huà)國(guó)CDR-H2畫(huà)-HFR3—CDR國(guó)H3-誦HFR4設(shè)置;以及所述輕鏈可變區(qū)包含一個(gè)或多個(gè)選自L(fǎng)FR1、LFR2、LFR3和LFR4的輕鏈框架區(qū);并且所述輕鏈可變區(qū)還包含一個(gè)或多個(gè)選自CDR-L1、CDR-L2和CDR-L3的互補(bǔ)決定區(qū);所述輕鏈框架區(qū)和互補(bǔ)決定區(qū)按式LFR1—CDR-L1—LFR27-CDR-L2—LFR3畫(huà)國(guó)CDR畫(huà)L3—LFR4設(shè)置;以及其中,(i)HFRl為第一重鏈框架區(qū),由約30個(gè)氨基酸殘基的序列構(gòu)成;(ii)HFR2為第二重鏈框架區(qū),由約14個(gè)氨基酸殘基的序列構(gòu)成;(iii)HFR3為第三重鏈框架區(qū),由約29至約32個(gè)氨基酸殘基的序列構(gòu)成;(iv)HFR4為第四重鏈框架區(qū),由7至約9個(gè)氨基酸殘基的序列構(gòu)成;(v)CDR-H1為第一重鏈互補(bǔ)決定區(qū);(vi)CDR-H2為第二重鏈互補(bǔ)決定區(qū);(vii)CDR-H3為第三重鏈互補(bǔ)決定區(qū);(viii)LFR1為第一輕鏈框架區(qū),由約22至約23個(gè)氨基酸殘基的序列構(gòu)成;(ix)LFR2為第二輕鏈框架區(qū),由約13至約16個(gè)氨基酸殘基的序列構(gòu)成;(x)LFR3為第三輕鏈框架區(qū),由約32個(gè)氨基酸殘基的序列構(gòu)成;(xi)LFR4為第四輕鏈框架區(qū),由約12至約13個(gè)氨基酸殘基的序列構(gòu)成;(xii)CDR-L1為第一輕鏈互補(bǔ)決定區(qū);(xiii)CDR-L2為第二輕鏈互補(bǔ)決定區(qū);以及(xiv)CDR-L3為第三輕鏈互補(bǔ)決定區(qū)。4.包含外又利要求1或2所述的重組核酸的宿主細(xì)月包,其中所述斷裂蛋白內(nèi)含子多肽在所述宿主細(xì)胞中以自體催化反應(yīng)加工,以形成具有不超過(guò)一個(gè)線(xiàn)性末端的至少一種環(huán)化多肽。5.包含權(quán)利要求3所述的重組核酸的宿主細(xì)胞,其中所述斷裂蛋白內(nèi)含子多肽在所述宿主細(xì)胞中以自體催化反應(yīng)加工,以形成具有不超過(guò)一個(gè)線(xiàn)性末端并具有免疫球蛋白折疊構(gòu)象的免疫球蛋白分子。6.如權(quán)利要求4所述的宿主細(xì)胞,其中所述環(huán)化多肽具有一個(gè)線(xiàn)性末端,所述線(xiàn)性末端為C末端或N末端。7.如權(quán)利要求6所述的宿主細(xì)胞,其中所述環(huán)化多肽形成套索肽。8.如權(quán)利要求5所述的宿主細(xì)胞,其中所述免疫球蛋白分子形成套索肽。9.如權(quán)利要求7或8所述的宿主細(xì)胞,其中所述套索肽包含內(nèi)酯連接點(diǎn)。10.如權(quán)利要求6所述的宿主細(xì)胞,其中所述環(huán)化多肽為環(huán)狀并且不具有線(xiàn)性末端。11.如權(quán)利要求5所述的宿主細(xì)胞,其中所述免疫球蛋白分子為環(huán)狀并且不具有線(xiàn)性末端。12.適合于測(cè)定融合蛋白之間相互作用的宿主細(xì)胞,所述細(xì)胞包含編碼獵物融合蛋白的第一重組基因,所述獵物融合蛋白包含轉(zhuǎn)錄阻遏子或激活子結(jié)構(gòu)域和第一異源氨基酸序列;編碼誘何融合蛋白的第二重組基因,所述誘斜融合蛋白包含DNA結(jié)合結(jié)構(gòu)域和第二異源氨基酸序列;以及編碼可檢測(cè)基因產(chǎn)物的重組報(bào)告基因,所述重組報(bào)告基因包含能夠與所述誘何融合蛋白的DNA結(jié)合結(jié)構(gòu)域結(jié)合的操縱基因DNA序列;其中所述報(bào)告基因的表達(dá)響應(yīng)所述第一異源氨基酸序列和所述第二異源氨基酸序列之間的結(jié)合而被調(diào)節(jié);以及其中所述重組基因的至少一種包含權(quán)利要求1、2或3所述的核酸。13.在細(xì)胞中測(cè)定融合蛋白之間相互作用的方法,所述方法包括使所述細(xì)胞表達(dá)編碼獵物融合蛋白的重組基因,所述獵物融合蛋白包含轉(zhuǎn)錄阻遏子或激活子結(jié)構(gòu)域和第一異源氨基酸序列;使所述細(xì)胞表達(dá)編碼誘何融合蛋白的重組基因,所述誘何融合蛋白包含DNA結(jié)合結(jié)構(gòu)域和第二異源氨基酸序列;其中所述重組基因的至少一種包含權(quán)利要求1、2或3所述的核酸;向所述細(xì)胞提供編碼可檢測(cè)基因產(chǎn)物的重組報(bào)告基因,所述重組報(bào)告基因包含能夠與所述誘何融合蛋白的DNA結(jié)合結(jié)構(gòu)域結(jié)合的操縱基因DNA序列,其中所述報(bào)告基因的表達(dá)響應(yīng)所述第一異源氨基酸序列和所述第二異源氨基酸序列之間的結(jié)合而被調(diào)節(jié);以及測(cè)定所述可4企測(cè)基因產(chǎn)物的表達(dá)。14.免疫球蛋白分子,其具有不超過(guò)一個(gè)線(xiàn)性末端并具有免疫球蛋白折疊構(gòu)象,所述免疫球蛋白分子包含通過(guò)接頭與輕鏈可變區(qū)連接的重鏈可變區(qū),第一接頭將所述重鏈可變區(qū)的C末端區(qū)連接至所述輕鏈可變區(qū)的N末端區(qū),第二接頭將所述重鏈可變區(qū)的N末端區(qū)連接至所述輕鏈可變區(qū)的C末端區(qū),其中所述接頭包含長(zhǎng)至少約50埃的柔性共價(jià)分子鍵,其中所述重鏈可變區(qū)包含一個(gè)或多個(gè)選自HFR1、HFR2、HFR3和HFR4的重鏈框架區(qū);并且所述重鏈可變區(qū)還包含一個(gè)或多個(gè)選自CDR-H1、CDR-H2、CDR-H3的互補(bǔ)決定區(qū);所述重鏈框架區(qū)和互補(bǔ)決定區(qū)按式HFR1—CDR誦H1國(guó)國(guó)HFR2畫(huà)國(guó)CDR-H2國(guó)-HFR3國(guó)畫(huà)CDR畫(huà)H3—HFR4設(shè)置;以及所述輕鏈可變區(qū)包含一個(gè)或多個(gè)選自L(fǎng)FR1、LFR2、LFR3和LFR4的輕鏈框架區(qū);并且所述輕鏈可變區(qū)還包含一個(gè)或多個(gè)選自CDR-L1、CDR-L2和CDR-L3的互補(bǔ)決定區(qū);所述輕鏈框架區(qū)和互補(bǔ)決定區(qū)按式LFR1—CDR-L1—LFR27-CDR-L2—LFR3—CDR-L3—LFR4設(shè)置;以及其中,(i)HFRl為第一重鏈框架區(qū),由約30個(gè)氨基酸殘基的序列構(gòu)成;(ii)HFR2為第二重鏈框架區(qū),由約14個(gè)氨基酸殘基的序列構(gòu)成;(iii)HFR3為第三重鏈框架區(qū),由約29至約32個(gè)氨基酸殘基的序列構(gòu)成;(iv)HFR4為第四重鏈框架區(qū),由7至約9個(gè)氨基酸殘基的序列構(gòu)成;(v)CDR-H1為第一重鏈互補(bǔ)決定區(qū);(vi)CDR-H2為第二重鏈互補(bǔ)決定區(qū);(vii)CDR-H3為第三重鏈互補(bǔ)決定區(qū);(viii)LFR1為第一輕鏈框架區(qū),由約22至約23個(gè)氨基酸殘基的序列構(gòu)成;(ix)LFR2為笫二輕鏈框架區(qū),由約13至約16個(gè)氨基酸殘基的序列構(gòu)成;(x)LFR3為第三輕鏈框架區(qū),由約32個(gè)氨基酸殘基的序列構(gòu)成;(xi)LFR4為第四輕鏈框架區(qū),由約12至約13個(gè)氨基酸殘基的序列構(gòu)成;(xii)CDR-L1為第一輕鏈互補(bǔ)決定區(qū);(xiii)CDR-L2為第二輕鏈互補(bǔ)決定區(qū);以及(xiv)CDR-L3為第三輕鏈互補(bǔ)決定區(qū)。15.如權(quán)利要求14所述的免疫球蛋白分子,其中所述接頭為包含14至25個(gè)氨基酸的多肽接頭。16.如權(quán)利要求15所述的免疫球蛋白分子,其中所述多肽接頭包含甘氨酸和絲氨酸氨基酸。全文摘要在多個(gè)方面,本發(fā)明提供了環(huán)化蛋白的方法,包括增強(qiáng)環(huán)化蛋白在胞質(zhì)條件下的穩(wěn)定性的方法。本發(fā)明還提供了多種利用環(huán)化蛋白的方法。例如,本發(fā)明的環(huán)化蛋白可用在類(lèi)似于酵母雙雜交測(cè)定法的篩選測(cè)定法中。本發(fā)明所選的實(shí)施方案提供環(huán)化的單鏈可變片段(ScFv)分子,包括免疫球蛋白折疊形式的分子。文檔編號(hào)C12N15/62GK101646771SQ200880007136公開(kāi)日2010年2月10日申請(qǐng)日期2008年1月10日優(yōu)先權(quán)日2007年1月10日發(fā)明者羅納德·C·格耶爾申請(qǐng)人:薩斯喀徹溫大學(xué)