專利名稱::在哺乳動物細(xì)胞中將非天然氨基酸遺傳摻入蛋白質(zhì)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于翻譯生物化學(xué)領(lǐng)域。本發(fā)明涉及制備和利用正交(orthogonal)tRNA、正交氨酰-tRNA合成酶和它們的配對將非天然氨基酸摻入蛋白質(zhì)的組合物和方法。本發(fā)明還涉及用這種配對在細(xì)胞中產(chǎn)生蛋白質(zhì)的方法以及用這種方法產(chǎn)生的蛋白質(zhì)。
背景技術(shù):
:己有描述在哺乳動物細(xì)胞中將非天然氨基酸定點插入蛋白的方法。分別將化學(xué)氨?;囊种谱觮RNA顯微注射或電穿孔到CHO細(xì)胞或神經(jīng)元中,并用一系列的非天然氨基酸抑制無義琥珀突變(Monahan等(2003),"將非天然氨基酸定點摻入哺乳動物細(xì)胞中表達(dá)的受體"(Site-specificincorporationofunnaturalaminoacidsintoreceptorsexpressedinMammaliancells)CTzem5/o/10:573-580)。然而,使用氨酰化tRNA作為化學(xué)計量試劑嚴(yán)重限制了能夠產(chǎn)生的蛋白的量。此外,工程改造不與宿主tRNA、aaRS或氨基酸(正交tRNA/aaRS)交叉反應(yīng)的異源抑制子tRNA/aaRS對使蛋白,選擇性摻入非天然氨基酸。例如,Yokoyama及其同事對脂肪嗜熱芽孢桿菌CSac///^Wefl/^/^mo;Mz^)琥珀抑制子tRNA^(5對RNAg^)以及大腸桿菌CE.co/z')酪氨酰-tRNA合成酶(五cTyrRS)進(jìn)行修飾使3-碘-L-酪氨酸摻入到CHO細(xì)胞的蛋白中(Sakamoto等(2002),"在哺乳動物細(xì)胞中將非天然氨基酸定點慘入蛋白質(zhì)中"(Site-specificincorporationofanunnaturalaminoacidintoproteinsinmammaliancells)TVwc/e/ci^30:4692-4699)。同樣,Zhang及其同事對正交枯草桿菌(5ac/〃usw6"fc)抑制子tRNA/色氨酸-tRNA合成酶對進(jìn)行工程改造使5-羥色氨高保真的摻入到哺乳動物細(xì)胞的蛋白中(Zhang等(2004)"將5-羥色氨選擇性摻入到哺乳動物細(xì)胞蛋白中"(Selectiveincorporationof5-hydroxytryptophanintoproteinsinmammaliancells)/Voc^caof101:8882-8887).然而,使用基于結(jié)構(gòu)的誘變產(chǎn)生氨?;瘋?cè)鏈與野生型底物顯著不同的氨基酸的aaRS變體需要突變多個活性位點殘基,而這些殘基難以事先預(yù)測(Zhang等(2002),"基于結(jié)構(gòu)設(shè)計突變詹氏甲垸球菌(MW/z朋ococc^y'朋"wc/^)酪氨酰-tRNA合成酶以摻入O-甲基-L-酪氨酸"(Structure-baseddesignofmutantMethanococcusjannaschiityrosyl-tRNAsynthetaseforincorporationofO-methyl-L-tyrosine)PracA^/JcadS".t/S爿99:6579-6584;Turner等(2005)'"對-乙酰苯丙氨酸氨?;鵷RNA合成酶的結(jié)構(gòu)鑒定"(Structuralcharacterizationofap-acetylphenylalanylaminoacyl-tRNAsynthetase)J爿mCAem&c127:14976-14977;Turner等(2006),"氨酰-tRNA合成酶活性位點的結(jié)構(gòu)可塑十生"(Structuralplasticityofanaminoacyl-tRNAsynthetaseactivesite)/VocAto/Jcad&/103:6483-6488)。此外,工程改造的突變體仍可識別宿主氨基酸,如使關(guān)聯(lián)tRNAg^攜帶3-碘-L-酪氨酸的突變aaRS(Sakamoto等(2002),"在哺乳動物細(xì)胞中將非天然氨基酸定點慘入蛋白質(zhì)中"(Site-specificincorporationofanunnaturalaminoacidintoproteinsinmammaliancells)■/Vwc/eZc爿d^Tm30:4692-4699;以及Kiga等(2002),"一種在真核翻譯中將非天然氨基酸定點摻入蛋白的工程改造的大腸桿菌酪氨酰-tRNA合成酶及其在麥芽無細(xì)胞體系中白勺應(yīng)用,,(AnengineeredEscherichiacolityrosyl-tRNAsynthetaseforsite-specificincorporationofanunnaturalaminoacidintoproteinsineukaryotictranslationanditsapplicationinawheatgermcell-freesystem)/Voc7Va,/Jcat/t/S爿99:9715-9720)。此外,可嘗試在哺乳動物細(xì)胞中直接演化特異性改變的aaRS。例如,Wang及其同事最近在人B細(xì)胞系中使用體細(xì)胞超變異直接演化具有增強的光穩(wěn)定性和遠(yuǎn)紅發(fā)射的單體形式的紅色熒光蛋白(Wang等(2004),"通過反復(fù)體細(xì)胞超變異使新非抗體蛋白演化"(Evolutionofnewnonantibodyproteinsviaiterativesomatichypermutation)尸mcA^/爿cadt/&4101:16745-16749)。然而,體細(xì)胞超變異在整個蛋白中引入隨機(jī)突變,其有效性小于演化底物特異性改變的突變體時進(jìn)行的活性位點靶向誘變中產(chǎn)生的遺傳多樣性。然而后者受限于在哺乳動物細(xì)胞中產(chǎn)生大的穩(wěn)定文庫的困難。正交翻譯技術(shù)已開發(fā)出能將結(jié)構(gòu)多樣的非天然氨基酸體外定點摻入原核生物和酵母蛋白的常用方法,這些非天然氨基酸具有非天然的物理、化學(xué)和生物學(xué)屬性。這些方法依賴于在體內(nèi)多肽翻譯中能識別合適選擇編碼子并在感興趣基因的明確位點插入期望的非天然氨基酸的正交蛋白翻譯組件。這些方法使用識別選擇編碼子(如無義琥珀編碼子)的正交tRNA(O-tRNA),并且對應(yīng)的特定正交氨酰-tRNA合成酶(O-RS)使該O-tRNA特異性攜帶非天然氨基酸。這些組件不與宿主有機(jī)體內(nèi)任意內(nèi)源性tRNA或RS交叉反應(yīng)(即工程改造的tRNA和RS是正交的)。在大腸桿菌宿主系統(tǒng)中使用此技術(shù),由詹氏甲烷球菌tRNATy7TyrRS對、古細(xì)菌tRNAG'u/嗜熱古菌(尸,ococcz^/^汰ay/H7)谷氨酰-tRNA合成酶對、以及古細(xì)菌tRNA"7嗜熱古菌賴氨酰-tRNA合成酶對產(chǎn)生功能性琥珀和移碼抑制子tRNA/aaRS對。在酉良酒酵母(Sacc/w;nmyc^cereWw'ae,S.cerew;s7'ae)中,功能性tRNACUA/aaRS對衍生自對應(yīng)的大腸桿菌tRNATy7TyrRS以及tRNA"7亮氨酰-tRNA合成酶對。使用正向和反向選擇組合對這些抑制子tRNA/aaRS對的定向演化能夠在大腸桿菌和釀酒酵母中有效、高選擇性地體內(nèi)摻入大量不同的非天然氨基酸。這些包括熒光、糖基化、硫酸化、金屬離子結(jié)合和氧化還原活性氨基酸以及具有新化學(xué)和光化學(xué)反應(yīng)性的氨基酸。該方法為在體內(nèi)外探索蛋白結(jié)構(gòu)和功能以及產(chǎn)生諸如具有新的或增強特性的治療性蛋白等蛋白質(zhì)提供了有力的工具。將這些方法擴(kuò)展至哺乳動物細(xì)胞,如靈長類和嚙齒動物細(xì)胞系將顯著增強該方法的實用性。本領(lǐng)域普遍知道利用適合于在體內(nèi)制備含一個或多個非天然氨基酸的蛋白質(zhì)的正交翻譯系統(tǒng)。例如,參見國際公布號WO2002/086075,其名為"METHODSANDCOMPOSITIONFORTHEPRODUCTIONOFORTHOGONALtRNA-AMINOACYL-tRNASYNHETASEPAIRS(產(chǎn)生正交tRNA-氨酰-tRNA合成酶配對的方法和組合物)";WO2002/085923,其名氨基酸的體內(nèi)摻入)";WO2004/094593,其名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴(kuò)展真核遺傳密碼)";2004年7月7日提交的WO2005/019415;2004年7月7日提交的WO2005/007870;2004年7月7日提交的WO2005/007624;和2005年10月27日提交的WO2006/110182,其名為"ORTHOGONALTRANSLATIONCOMPONENTSFORTHEINVIVOINCORPORATIONOFUNNATURALAMINOACIDS(體內(nèi)慘入非天然氨基酸的正交翻譯組分)"。這些申請各自通過引用全文納入本文。正交翻譯系統(tǒng)的其它討論參見如Wang等(2001),"擴(kuò)展大腸桿菌的遺傳密石馬"(Expandingthegeneticcodeoffcc/zen'c/^aco//)5We"ce292:498-500;Wang和Schultz(2002),"擴(kuò)展遺傳密碼"(ExpandingtheGeneticCode)Comm,.^Ojm^l:1-11;Alfonta等(2003),"在蛋白中定點摻入氧化還原活性氨基酸"(Site-SpecificIncorporationofaRedox-ActiveAminoAcidintoProteins)■/爿wC7z謹(jǐn)Socl25:14662-14663;Santoro等(2003),"用于在大腸桿菌中對蛋白進(jìn)行非天然氨基酸誘變的古細(xì)菌起源的谷氨酰-tRNA合成酶和tRNA"(Anarchaebacteria-derivedglutamyl-tRNAsynthetaseandtRNApairforunnaturalaminoacidmutagenesisofproteinsinEsr/zm.c/z/a7Vwc/e/cJc油31:6700-6709;Chin等(2003)'"擴(kuò)展的真核遺傳密碼"(Anexpandedeukaryoticgeneticcode)Sc/ewce301,964-967;Chin等(2003),"擴(kuò)展的真核遺傳密碼進(jìn)展"(Progresstowardanexpandedeukaryoticgeneticcode)Oew10,511-519;以及Wu等(2004),"遺傳編碼的光籠蔽氨基酸"(Ageneticallyencodedphotocagedaminoacid)J」wCAem&c126,14306-14307;Summerer等(2006),"遺傳編碼的熒光氨基酸"(AGeneticallyEncodedFluorescentAminoAcid)尸M46"103(26):9785-9789;Anderson等(2004),"具有功能性四聯(lián)密碼子的擴(kuò)展遺傳密碼"(Anexpandedgeneticcodewithafunctionalquadrupletcodon)/VocAto/」cad^4101:7566-7571;Zhang等(2004),"合成糖蛋白的新策略"(Anewstrategyforthesynthesisofglycoproteins)Sc,e"ce303,371-373;Wang和Schultz"擴(kuò)展遺傳密碼"(ExpandingtheGeneticCode)爿wge麗w血CTzem/e/"A44(1):34-66(2005);Xie和Schultz"擴(kuò)展的遺傳密碼"(AnExpandingGeneticCode)M"toA36(3):227-238(2005);Xie和Schultz"在遺傳庫中加入氨基酸"(AddingAminoAcidstotheGeneticRepertoire)Cwr.0/〖"/owz'wC7zemz'ca/5fo/ogy9(6):548-554(2005);Wang等"擴(kuò)展遺傳密碼"(ExpandingtheGeneticCode)j朋".及ev.歷o尸/^.所omo/.^r"",35:225-249(2006);Xie和Schultz(2006)"蛋白化學(xué)工具箱-擴(kuò)展遺傳密碼"(AChemicalToolkitforProteins-anExpandedGeneticCode)A^.iev.Mo/.Ce〃歷o/.,7(10):775-782;Summerer等(2006),"遺傳編碼的熒光氨基酸"(AGeneticallyEncodedFluorescentAminoAcid)/VociVa〃爿cfld&z'f/SJ103,9785-9789;Wang等(2006),"遺傳編碼的熒光氨基酸"(AGeneticallyEncodedFluorescentAminoAcid)/C7z,Soc128,8738-8739;以及Liu和Schultz(2006),"在大腸桿菌中重組表達(dá)選擇性硫酸化的蛋白"(RecombinantExpressionofSelectivelySulfatedProteinsin五.co/z〕歷ofec/z"o/.,24(11):1436-1440。上述每一出版物的內(nèi)容均通過引用納入本文。本領(lǐng)域需要開發(fā)在期望將非天然氨基酸摻入設(shè)定位點時,能夠在哺乳動物細(xì)胞宿主系統(tǒng),例如靈長類和嚙齒類宿主細(xì)胞系統(tǒng)中將非天然氨基酸摻入蛋白質(zhì)的改良的正交翻譯組件。本領(lǐng)域需要用于篩選和鑒別能用于哺乳動物細(xì)胞如嚙齒類和人細(xì)胞的正交翻譯組件(如突變的氨酰-tRNA合成酶)的改良方法。本文所述發(fā)明滿足此類及其它需求,在瀏覽下述公開文本后將明了。
發(fā)明內(nèi)容本發(fā)明提供了允許在哺乳動物細(xì)胞如嚙齒類和靈長類細(xì)胞中遺傳表達(dá)具有多種理化和生物學(xué)屬性的非天然氨基酸的常用方法。首先在酵母中演化突變的大腸桿菌(^c/2eWc/u'aco//,£.co/z')氨酰-tRNA合成酶(RS),以選擇性使用感興趣的非天然氨基酸。使用突變RS及來自真細(xì)菌如脂肪嗜熱芽孢桿菌(及他araAennopMM5))的琥珀抑制子tRNA在哺乳動物細(xì)胞中響應(yīng)于琥珀無義密碼子而將非天然氨基酸定點摻入蛋白質(zhì)中。將十種非天然氨基酸(圖1提供的非天然氨基酸)獨立摻入中國倉鼠卵巢(CHO)細(xì)胞或人293T表達(dá)的模式蛋白中,蛋白表達(dá)效率高達(dá)每2x107個細(xì)胞產(chǎn)生1pg蛋白。質(zhì)譜確認(rèn)非天然氨基酸的高翻譯保真度。該方法利于在蛋白中引入生物學(xué)探針進(jìn)行細(xì)胞研究,并可能最終利于在哺乳動物細(xì)胞如嚙齒類和靈長類細(xì)胞中合成含非天然氨基酸的治療性蛋白。本發(fā)明提供了在宿主細(xì)胞如嚙齒類宿主細(xì)胞或靈長類宿主細(xì)胞體內(nèi),響應(yīng)選擇者密碼子如琥珀終止密碼子,在延伸的多肽鏈中摻入非天然氨基酸的組合物和方法。這些組合物包括宿主細(xì)胞、以及不與宿主細(xì)胞翻譯機(jī)器相互作用的正交-tRNA(O-tRNA)和正交氨酰-tRNA合成酶(O-RS)對。也就是說,宿主細(xì)胞的內(nèi)源性氨酰-tRNA合成酶未使(或未顯著使)該O-tRNA攜帶(天然的或非天然的)氨基酸。同樣,本發(fā)明提供的O-RS未使任意內(nèi)源性tRNA攜帶顯著或可檢測水平的氨基酸(天然的或非天然的)。這些新組合物允許在哺乳動物宿主細(xì)胞系統(tǒng)中產(chǎn)生大量翻譯摻入非天然氨基酸的蛋白質(zhì)。在一些方面,本發(fā)明提供了翻譯系統(tǒng)。這些系統(tǒng)包含(a)哺乳動物宿主細(xì)胞如嚙齒類或靈長類宿主細(xì)胞,含有(b)第一正交氨酰-tRNA合成酶(O-RS),(c)第一正交tRNA(O-tRNA)以及(d)第一非天然氨基酸,其中第一O-RS優(yōu)選用第一非天然氨基酸氨?;谝籓-tRNA。非天然氨基酸可以是,但不限于對-甲氧基苯丙氨酸(pMpa);對-乙?;奖彼?pApa);對-苯甲酰苯丙氨酸(pBpa);對-碘代苯丙氨酸(plpa);對-疊氮基苯丙氨酸(pAzpa);對-炔丙基氧基苯丙氨酸(pPpa);a-氨基辛酸;鄰-硝基芐基半胱氨酸(o-NBC);1,5-丹磺酰丙氨酸;和11鄰-硝基芐基絲氨酸(o-NBS).在一些方面,O-RS優(yōu)選用所述非天然氨基酸氨?;疧-tRNA,其效率至少為包含相同O-tRNA、非天然氨基酸和含有選自SEQIDNO:57-101的氨基酸序列的氨酰-tRNA合成酶的翻譯系統(tǒng)效率的50%。該翻譯系統(tǒng)可使用衍生自多種來源的組分。在一個實施方式中,第一O-RS衍生自大腸桿菌氨酰-tRNA合成酶,如野生型大腸桿菌酪氨酰或亮氨酰合成酶。在一些實施方式中,O-tRNA包含SEQIDNO:3或由SEQIDNO:3編碼。系統(tǒng)中所用O-RS可包含氨基酸序列SEQIDNOS:57-101以及該序列的保守變體。在一些方面,宿主細(xì)胞可包含一種或多種編碼翻譯系統(tǒng)組件,包括O-RS或O-tRNA的多核苷酸。在一些實施方式中,編碼O-RS的多核苷酸包含選自SEQIDNO:8-56的核苷酸序列。在一些方面,該翻譯系統(tǒng)還包含編碼感興趣蛋白的核酸,其中所述核酸具有至少一個能被O-tRNA識別的選擇者密碼子。在一些方面,該翻譯系統(tǒng)(即宿主細(xì)胞)納入使用第二非天然氨基酸的第二正交對(即第二O-RS和第二O-tRNA),因此該系統(tǒng)現(xiàn)在能夠?qū)⒅辽賰煞N不同非天然氨基酸摻入到多肽的不同所選位點。在這個雙重系統(tǒng)中,第二O-RS優(yōu)選用不同于第一非天然氨基酸的第二非天然氨基酸氨?;诙﨩-tRNA,并且第二O-tRNA識別的選擇者密碼子不同于第一O-tRNA識別的選擇者密碼子。翻譯系統(tǒng)中所用的哺乳動物宿主細(xì)胞不受特別限制,只要O-RS和O-tRNA在宿主細(xì)胞環(huán)境中保留其正交性。宿主細(xì)胞可以是嚙齒類宿主動物細(xì)胞如小鼠細(xì)胞和大鼠細(xì)胞。當(dāng)宿主細(xì)胞為靈長類細(xì)胞時,細(xì)胞可為,例如人宿主細(xì)胞、黑猩猩宿主細(xì)胞、倭黑猩猩宿主細(xì)胞、大猩猩宿主細(xì)胞、猩猩宿主細(xì)胞、長臂猿宿主細(xì)胞、短尾猿宿主細(xì)胞、絹毛猴宿主細(xì)胞或狨宿主細(xì)胞。宿主細(xì)胞可為,例如CHO細(xì)胞或人293T。在另一些方面,本發(fā)明提供了產(chǎn)生在所選位置具有一個或多個非天然氨基酸的感興趣蛋白質(zhì)的方法。這些方法使用上述翻譯系統(tǒng)。通常,這些方法從提供翻譯系統(tǒng)的步驟開始,該翻譯系統(tǒng)包括(i)第一非天然氨基酸(如圖1中非天然氨基酸);(ii)第一正交氨酰-tRNA合成酶(O-RS);(iii)第一正交tRNA(O-tRNA),其中O-RS優(yōu)選用非天然氨基酸氨?;疧-tRNA;以及(i力編碼感興趣蛋白的核酸,其中該核酸包含至少一個能被第一O-tRNA識別的選擇者密碼子,并且選擇者密碼子在核酸中的位置對應(yīng)感興趣蛋白中的所選位置。所有這些系統(tǒng)組件均包含于合適的宿主細(xì)胞,如嚙齒類或靈長類細(xì)胞中。產(chǎn)生具有非天然氨基酸的蛋白質(zhì)的方法通常需要在上述翻譯系統(tǒng)所有組件存在下培養(yǎng)宿主細(xì)胞。在這些方法中,非天然氨基酸可選自(但不限于)對-甲氧基苯丙氨酸(pMpa);對-乙?;奖彼?pApa);對-苯甲酰苯丙氨酸(pBpa);對-碘代苯丙氨酸(plpa);對-疊氮基苯丙氨酸(pAzpa);對-炔丙基氧基苯丙氨酸(pPpa);a-氨基辛酸;鄰-硝基芐基半胱氨酸(o-NBC);1,5-丹磺酰丙氨酸;和鄰-硝基芐基絲氨酸(o-NBS).在這些方法的一些方面,O-RS優(yōu)選用非天然氨基酸氨?;疧-tRNA,其效率至少為包含相同O-tRNA、非天然氨基酸和含有選自SEQIDNO:57-101的氨基酸序列的氨酰-tRNA合成酶的翻譯系統(tǒng)效率的50%。該方法可利用多種試劑進(jìn)行廣泛應(yīng)用。在本方法的一些實施方式中,O-tRNA包含SEQIDNO:3或由SEQIDNO:3編碼。在一些實施方式中,提供了編碼O-RS禾P/或O-tRNA的多核苷酸。在一些實施方式中,O-RS衍生自大腸桿菌氨酰-tRNA合成酶,如野生型大腸桿菌酪氨酰或亮氨酰-tRNA合成酶。一些實施方式中,提供步驟包括提供含有選自SEQIDNO:57-101的氨基酸序列及其保守變體的O-RS。在這些方法的一些方面,提供了編碼O-RS的多核苷酸。例如,編碼O-RS的多核苷酸可包含選自SEQIDNO:8-56的核苷酸序列。在這些方法的一些實施方式中,提供O-RS需要通過定點誘變技術(shù)突變野生型氨酰-tRNA合成酶的氨基酸結(jié)合口袋,和選擇優(yōu)先用非天然氨基酸氨酰化O-tRNA的所得的O-RS。選擇步驟可包括在定點誘變后從得到的氨酰-tRNA合成酶分子庫中正向和負(fù)向選擇O-RS。還可改進(jìn)這些方法以在蛋白質(zhì)中摻入一個以上非天然氨基酸。在那些方法中,聯(lián)用第二正交翻譯系統(tǒng)與第一翻譯系統(tǒng),其中第二系統(tǒng)具有不同的氨基酸和選擇者密碼子特異性。例如,提供步驟可包括提供第二O-RS和第二O-tRNA,其中第二O-RS優(yōu)先用不同于第一非天然氨基酸的第二非天然氨基酸氨酰化第二O-tRNA,且第二O-tRNA識別核酸中不同于第一O-tRNA所識別的選擇者密碼子的選擇者密碼子。定義在詳細(xì)描述本發(fā)明前,應(yīng)該知道本發(fā)明不局限于具體的生物系統(tǒng),本發(fā)明當(dāng)然可以有各種變化。還應(yīng)知道本文所用的術(shù)語只是為了描述具體的實施方式,而非限制性的。除非另有明確指出,本說明書和隨附的權(quán)利要求書中使用的單數(shù)形式"一個"、"一種"和"該"也包括復(fù)數(shù)對象。因此,例如述及"一個細(xì)胞"包括兩個或多個細(xì)胞的組合;"一個多核苷酸"實際上包括該多核苷酸的多份拷貝。除了此處和說明書以下其余部分所定義的,本文所用的所有技術(shù)和科學(xué)術(shù)語都與本發(fā)明所屬領(lǐng)域普通技術(shù)人員常規(guī)理解的意義相同。正交:本文所用的術(shù)語"正交"指與某細(xì)胞或翻譯系統(tǒng)的內(nèi)源性相應(yīng)分子相比,某分子(例如,正交tRNA(0-tRNA)禾卩/或正交氨酰tRNA合成酶(O-RS))與該細(xì)胞內(nèi)源性組分起作用的效率降低,或不能與該細(xì)胞的內(nèi)源性組分起作用。就tRNA和氨酰-tRNA合成酶而言,正交指與和內(nèi)源性tRNA合成酶起作用的內(nèi)源性tRNA相比,正交tRNA不能與內(nèi)源性tRNA合成酶起作用或起作用的效率降低;或者與和內(nèi)源性tRNA起作用的內(nèi)源性tRNA合成酶相比,正交氨酰tRNA合成酶與內(nèi)源性tRNA不起作用或起作用的效率降低,所述效率降低例如,小于20%的效率,小于10%的效率,小于5%的效率,或小于1%的效率。正交分子缺乏細(xì)胞中功能正常的內(nèi)源性互補分子。例如,與內(nèi)源性RS氨?;瘍?nèi)源性tRNA相比,細(xì)胞的任何內(nèi)源性RS氨?;?xì)胞中正交tRNA的效率降低或者甚至為0。在另一例子中,與內(nèi)源性RS氨酰化內(nèi)源性tRNA相比,正交RS氨?;信d趣細(xì)胞中任何內(nèi)源性tRNA的效率降低或者甚至為0??蓪⒛芘c第一正交分子一起起作用的第二正交分子引入細(xì)胞。例如,正交tRNA/RS配對包括在細(xì)胞中共同起作用且與對照,例如相應(yīng)的tRNA/RS內(nèi)源性配對相比其效率是,例如45%效率、50%效率、60%效率、70%效率、75%效率、80%效率、90%效率、95%效率或99%效率,或更高的引入補充組分,或活性正交配對(如酪氨?;蛄涟滨Q苌恼籺RNA/RS配對)。正交酪氨酰-tRNA:本文所用的正交酪氨酰-tRNA(酪氨酰-O-tRNA)是與感興趣翻譯系統(tǒng)正交的tRNA,其中所述tRNA是(1)與天然酪氨酰-tRNA相同或基本類似;(2)通過天然或人工誘變衍生自天然酪氨酰tRNA;(3)由考慮了(1)或(2)的野生型或突變型酪氨酰tRNA序列的任何方法產(chǎn)生;(4)與野生型或突變型酪氨酰tRNA同源;(5)與稱為酪氨酰tRNA合成酶底物的任何tRNA同源;或(6)稱為酪氨酰tRNA合成酶底物的任何示例性tRNA的保守變體。酪氨酰tRNA可加載有氨基酸,或處于非負(fù)載狀態(tài)。還應(yīng)知道"酪氨酰-0-tRNA"任選被關(guān)聯(lián)(cognate)合成酶分別加載(氨?;?除酪氨酸以外的氨基酸,例如非天然氨基酸。應(yīng)該知道,實際上優(yōu)選利用本發(fā)明酪氨酰-O-tRNA在翻譯期間響應(yīng)于選擇者密碼子而將基本上任何氨基酸(無論天然或非天然的)摻入延伸的多肽內(nèi)。正交酪氨酰氨基酸合成酶:本文所用的正交酪氨酰氨基酸合成酶(酪氨酰-O-RS)是在感興趣翻譯系統(tǒng)內(nèi)用氨基酸優(yōu)先氨?;野滨?O-tRNA的酶。酪氨酰-O-RS加載到酪氨酰-O-tRNA上的氨基酸可以是任何氨基酸,無論是天然的、非天然的還是人工的,并且不限于本文所述的氨基酸。該合成酶任選與天然酪氨酰氨基酸合成酶相同或同源,或者本文提供的稱為O-RS的合成酶相同或同源。例如,所述O-RS可以是圖16的酪氨酰-O-RS的保守變體,和/或與圖16中O-RS的序列(SEQIDNO:57-101)至少有50。/。、60%、70%、80%、90%、95%、98%、99%或以上相同。TH交亮氨酰-tRNA:如本文所用,正交亮氨酰-tRNA(亮氨酰-O-tRNA)是對感興趣翻譯系統(tǒng)正交的tRNA,其中tRNA是(l)與天然發(fā)生的亮氨酰-tRNA相同或基本相似,(2)通過天然或人工誘變衍生自天然發(fā)生的亮氨酰-tRNA,(3)由考慮了(l)或(2)的野生型或突變型亮氨酰-tRNA序列的任何方法產(chǎn)生,(4)與野生型或突變型酪氨酰-tRNA同源;(5)與稱為亮氨酰-tRNA15合成酶底物的任何tRNA同源,或(6)稱為亮氨酰-tRNA合成酶底物的任何示范性tRNA的保守變體。亮氨酰-tRNA可以加載有氨基酸,或處于非負(fù)載狀態(tài)。還應(yīng)知道,"亮氨酰-O-tRNA"任選被關(guān)聯(lián)合成酶分別加載(氨?;?除亮氨酸外的氨基酸,如非天然氨基酸。事實上,應(yīng)理解優(yōu)選利用本發(fā)明亮氨酰-O-tRNA在翻譯期間響應(yīng)于選擇密碼子而將基本上任何氨基酸(無論是天然或是非天然)摻入延伸的多肽中。正交亮氨酰氨基酸合成酶本文所用的正交亮氨酰氨基酸合成酶(亮氨酰-O-RS)是感興趣翻譯系統(tǒng)中用氨基酸優(yōu)先氨?;涟滨?O-tRNA的酶。被亮氨酰-O-RS加載到亮氨酰-O-tRNA上的氨基酸可以是任何氨基酸,如天然、非天然或人工氨基酸,在本文中不作限制。所述合成酶任選與天然產(chǎn)生的亮氨酰氨基酸合成酶相同或同源,或者與本文中稱為O-RS的合成酶相同或同源。例如,O-RS可以是圖16的亮氨酰-O-RS的保守變體,和/或可能與圖16的O-RS有至少50%、60%、70%、80%、90%、95%、98%、99%或更多序列相同。關(guān)聯(lián)(co四ate):術(shù)語"關(guān)聯(lián)"指共同起作用或彼此具有一定特異性的組分,例如正交tRNA和正交氨酰-tRNA合成酶。這些組分也可互稱為"互補的"。優(yōu)先氨酰化:對于本文所用正交翻譯系統(tǒng)而言,當(dāng)某表達(dá)系統(tǒng)中O-RS使O-tRNA帶上氨基酸的效率高于其使任何內(nèi)源性tRNA帶上氨基酸的效率時,該O-RS"優(yōu)先氨?;?關(guān)聯(lián)O-tRNA。g卩,當(dāng)翻譯系統(tǒng)中存在摩爾比大致相等的O-tRNA與任何給定的內(nèi)源性tRNA時,O-RS加載O-tRNA的頻率高于它加載內(nèi)源性tRNA的頻率。當(dāng)翻譯系統(tǒng)中存在等摩爾濃度的O-tRNA與內(nèi)源性tRNA時,由O-RS加載的O-tRNA與由O-RS加載的內(nèi)源性tRNA的相對比例優(yōu)選較高,最好導(dǎo)致O-RS僅加載或幾乎僅加載O-tRNA。當(dāng)存在等摩爾濃度的O-tRNA與O-RS時,O-RS加載的O-tRNA與內(nèi)源性tRNA的相對比例大于1:1,優(yōu)選至少約2:1,更優(yōu)選5:1,更優(yōu)選10:1,更優(yōu)選20:1,更優(yōu)選50:1,更優(yōu)選75:1,更優(yōu)選95:1、98:1、99:1、100:1、500:1、1,000:1、5,000:1或更當(dāng)(a)與內(nèi)源性tRNA相比,O-RS優(yōu)先氨酰化O-tRNA,禾口(b)與O-RS用任何天然氨基酸氨?;疧-tRNA相比,氨?;瘜Ψ翘烊话被崽禺悤r,稱O-RS"優(yōu)先用非天然氨基酸氨?;疧-tRNA"。即,當(dāng)包含O-RS和O-tRNA的翻譯系統(tǒng)中存在等摩爾量的非天然和天然氨基酸時,O-RS用非天然氨基酸加載O-tRNA的頻率高于用天然氨基酸加載的頻率。加載有非天然氨基酸的O-tRNA與加載有天然氨基酸的O-tRNA的相對比例優(yōu)選較高。O-RS最好使O-tRNA僅加載,或者幾乎僅加載有非天然氨基酸。當(dāng)翻譯系統(tǒng)中存在等摩爾濃度的天然和非天然氨基酸時,使O-tRNA帶上非天然氨基酸與使O-tRNA帶上天然氨基酸的相對比例大于l:l,優(yōu)選至少約2:1,更優(yōu)選5:1,更優(yōu)選10:1,更優(yōu)選20:1,更優(yōu)選50:1,更優(yōu)選75:1,更優(yōu)選95:1、98:1、99:1、100:1、500:1、1,000:1、5,000:1或更高。選擇者密碼子:術(shù)語"選擇者密碼子"指翻譯過程中為O-tRNA所識別而不為內(nèi)源性tRNA所識別的密碼子。O-tRNA反密碼子環(huán)識別mRNA上的選擇者密碼子并在多肽的此位置摻入其氨基酸,例如非天然氨基酸。選擇者密碼子可包括,例如無義密碼子,如終止密碼子(如,琥珀、赭石和乳白密碼子);四堿基或四堿基以上密碼子;罕用密碼子;衍生自天然或非天然堿基對的密碼子,等等。抑制子tRNA:抑制子tRNA是在多肽翻譯期間通常響應(yīng)于終止密碼子而摻入氨基酸(即,"連讀")來改變給定的翻譯系統(tǒng)中信使RNA(mRNA)閱讀的tRNA。在一些方面,本發(fā)明的選擇者密碼子是抑制子密碼子,例如,終止密碼子(如,琥珀、赭石和乳白密碼子)、四堿基密碼子、罕用密碼子等。抑制活性:本文所用的術(shù)語"抑制活性"總體上指tRNA(例如,抑制子tRNA)能翻譯連讀在其它情況中可導(dǎo)致翻譯終止或錯譯(例如,移碼)的密碼子(例如,作為選擇者密碼子的琥珀密碼子或四個或以上個堿基的密碼子)的能力。抑制子tRNA的抑制活性可表示為與第二抑制子tRNA,或與對照系統(tǒng),例如缺乏O-RS的對照系統(tǒng)相比,觀察到的翻譯連讀活性的百分比。本發(fā)明提供定量測定抑制活性的各種方法。特定O-tRNA和O-RS對感興趣選擇者密碼子(例如,琥珀密碼子)的抑制百分比指,在感興趣的翻譯系統(tǒng)中,在編碼表達(dá)測試標(biāo)記的核酸中含有選擇者密碼子的該給定表達(dá)測試標(biāo)記(例如,LacZ)的活性與陽性對照構(gòu)建物相比的百分比,所述感興趣的翻譯系統(tǒng)包含O-RS禾BO-tRNA,所述陽性對照沒有O-tRNA、O-RS和選擇者密碼子。因此,例如,如果在給定翻譯系統(tǒng)中觀察到不含選擇者密碼子的活性陽性對照標(biāo)記構(gòu)建物的活性為X(其單位與所述標(biāo)記試驗相關(guān)),則含有選擇者密碼子的測試構(gòu)建物的抑制百分比是在與陽性對照標(biāo)記的表達(dá)基本相同的環(huán)境條件下(除了該測試標(biāo)記構(gòu)建物在也含有O-tRNA和O-RS的翻譯系統(tǒng)中表達(dá)外),該測試標(biāo)記構(gòu)建物顯示的X百分比。表達(dá)該測試標(biāo)記的翻譯系統(tǒng)一般也包含O-RS和O-tRNA識別的氨基酸??扇芜x通過將測試標(biāo)記與"背景"或"陰性"對照標(biāo)記構(gòu)建物比較來校正抑制百分比的測量值,所述"背景"或"陰性"對照標(biāo)記構(gòu)建物含有與測試標(biāo)記相同的選擇者密碼子,但其所在的系統(tǒng)不含O-tRNA、O-RS和/或O-tRNA和域O-RS識別的相關(guān)氨基酸。該陰性對照可用于標(biāo)準(zhǔn)化抑制百分比測定值以補償感興趣的翻譯系統(tǒng)中標(biāo)記的背景信號的影響??赏ㄟ^本領(lǐng)域已知的許多試驗測定抑制效率。例如,可采用^半乳糖苷酶報道試驗,如可將衍生的lacZ質(zhì)粒(該構(gòu)建物在lacZ核酸序列中含有選擇者密碼子)連同含有本發(fā)明的O-tRNA的質(zhì)粒引入合適生物(例如,可利用正交組分的生物)的細(xì)胞。還可引入關(guān)聯(lián)合成酶(可以是多肽或表達(dá)時能編碼該關(guān)聯(lián)合成酶的多核苷酸)。細(xì)胞在培養(yǎng)基中生長至所需密度,例如至OD,約為0.5,進(jìn)行P-半乳糖苷酶試驗,例如用諾瓦金公司(Novagen)的BetaFluorTM(3-半乳糖苷酶試驗試劑盒。可將抑制百分比計算為樣品相對于可比較對照,例如,衍生的lacZ構(gòu)建物的觀察值的活性百分比,該構(gòu)建物在所需位置具有相應(yīng)的有義密碼子而非選擇者密碼子。翻譯系統(tǒng):術(shù)語"翻譯系統(tǒng)"指將氨基酸摻入延伸中的多肽鏈(蛋白質(zhì))的各組分。翻譯系統(tǒng)的組分可包括,例如核糖體、tRNA、合成酶、mRNA等。本發(fā)明的O-tRNA禾n/或O-RS可加入體外或體內(nèi)翻譯系統(tǒng)或是其一部分,例如存在于哺乳動物細(xì)胞,如嚙齒動物細(xì)胞、靈長動物細(xì)胞。非天然氨基酸:本文所用的術(shù)語"非天然氨基酸"指不在20種常見天然氨基酸或硒代半胱氨酸或吡咯賴氨酸(pyrrolysine)之列的任何氨基酸,修飾的氨基酸和/或氨基酸類似物。參見例如圖l提供的非天然氨基酸。衍生自:本文所用的術(shù)語"衍生自"指分離自特定分子或生物,或是用特定分子或生物的信息制得的某組份。例如,衍生自第二多肽的多肽含有與該第二多肽的氨基酸序列相同或基本上類似的氨基酸序列。以多肽為例,可通過,例如天然產(chǎn)生的誘變、人工定向誘變或人工隨機(jī)誘變獲得衍生的種類。用于衍生多肽的誘變可以是有意定向或有意隨機(jī)的,或混用兩種方法。誘變多肽以產(chǎn)生衍生自第一(多肽)的不同多肽可以是隨機(jī)的(例如,聚合酶失真所致),可通過合適的篩選方法,例如本文所述的方法鑒定衍生的多肽。誘變多肽通常需要對編碼該多肽的多核苷酸進(jìn)行操作。正選擇或篩選標(biāo)記:本文所用的術(shù)語"正選擇或篩選標(biāo)記"指當(dāng)存在該標(biāo)記時(例如被表達(dá)或激活等)可從不具有特征的細(xì)胞中鑒定出具有特征的細(xì)胞,例如具有正選擇標(biāo)記的細(xì)胞。負(fù)選擇或篩選標(biāo)記:本文所用的術(shù)語"負(fù)選擇或篩選標(biāo)記"指當(dāng)存在該標(biāo)記時(例如被表達(dá)或激活等)可鑒定不含有所選特性或特征的細(xì)胞(例如,與確實具有該特性或特征的細(xì)胞相比)。報道分子:本文所用的術(shù)語"報道分子"是指可用于鑒定和/或選擇感興趣系統(tǒng)的耙組分的組分。例如,報道分子可以包括蛋白質(zhì),如能賦予抗生素抗性或敏感性的酶(如(3-內(nèi)酰胺酶、氯霉素乙酰轉(zhuǎn)移酶(CAT)等)、熒光篩選標(biāo)記(如綠色熒光蛋白(如GFP)、YFP、EGFP、RFP等)、冷光標(biāo)記(如螢火蟲螢光素酶蛋白)、親和力篩選標(biāo)記,或者可選擇的正或負(fù)標(biāo)記基因如lacZ、(3-gal/lacZ((3-半乳糖苷酶)、ADH(乙醇脫氫酶)、his3、ura3、leu2、lys2等°真核生物:本文所用的術(shù)語"真核生物"指屬于真核生物界(KingdomEucarya)的生物。真核生物通常因其以下特征而區(qū)別于原核生物典型的多細(xì)胞組織(但不都是多細(xì)胞,例如酵母),存在膜限制的核與其它膜限制的細(xì)胞器,線形遺傳物質(zhì)(即,線形染色體),不存在操縱子,存在內(nèi)含子、信使(RNA)加帽和聚-AmRNA,以及其它生物化學(xué)特征,如不同的核糖體結(jié)構(gòu)。真核生物包括,例如動物(如哺乳動物、昆蟲、爬行動物、鳥等),纖毛蟲,植物(如單子葉植物、雙子葉植物、藻類等)、真菌、酵母菌、鞭毛蟲類、微孢子蟲、原生動物等。原核生物:本文所用的術(shù)語"原核生物"指屬于原核生物界(也稱為原核生物(Procarya))的生物。原核生物通常因其以下特征而區(qū)別于真核生物單細(xì)胞組織,通過出芽或分裂的無性生殖,缺乏膜限制的核與其它膜限制的細(xì)胞器,環(huán)狀染色體,存在操縱子,不存在內(nèi)含子、信使(RNA)加帽和聚-AmRNA,以19及其它生物化學(xué)特征,如不同的核糖體結(jié)構(gòu)。原核生物包括真細(xì)菌和古細(xì)菌(Archaea)(有時稱為"古細(xì)菌(Archaebacteria)")亞界。在原核生物界有時將藍(lán)細(xì)菌(藍(lán)綠藻)與支原體(歷史上認(rèn)為是細(xì)菌)分為不同類別。真細(xì)菌:本文所用的術(shù)語"真細(xì)菌"和"細(xì)菌"指不同于古細(xì)菌的原核生物。類似地,古細(xì)菌指不同于真細(xì)菌的原核生物??筛鶕?jù)許多形態(tài)和生物化學(xué)標(biāo)準(zhǔn)區(qū)分真細(xì)菌和古細(xì)菌。例如,可采用核糖體RNA序列、RNA聚合酶結(jié)構(gòu)的差異,內(nèi)含子的存在與否,抗生素敏感性,細(xì)胞壁肽聚糖和其它細(xì)胞壁組分的存在與否,膜脂質(zhì)的分枝與不分枝結(jié)構(gòu),存在/不存在組蛋白和組蛋白樣蛋白而將某生物指定為真細(xì)菌或古細(xì)菌。真細(xì)菌的例子包括大腸桿菌C&c/2en'c/z/aco//)、嗜熱棲熱菌(TTz^vm^^^mo//2//z)、枯草芽孢桿菌(5acz7/wss"6"fc)和嗜熱脂肪芽孢桿菌(5ac/〃wstearaAermo;^//^)等)。古細(xì)菌的例子包括詹氏甲烷球菌(7W"/za"ococcwy'aw7fl^c/n7)(A0、梅氏甲烷八疊球菌(Af"/zaworarc/"amaze/)CMm)、嗜熱堿甲烷桿菌(Me^za"o6fl"en'wmAe削oawto^o/7/w'c謂)(M0、海沼甲院球菌(Me決anococcMSman》a/w(iz'力、甲烷嗜熱菌(AfeAflwopjTMSA:a"tZ/erz〕、鹽細(xì)菌(7a/o6a"en'ww)(例如沃氏富鹽菌(/fa/o/eraxvo/cam7)和鹽細(xì)菌種A^C-7入閃爍古生球菌04rc/zaeog/o6w51/zz/g/(i—(4/)、激烈火球菌(尸"coccz^/鵬.。愿)(尸/)、極端嗜熱古菌CPyrococcws/zor汰as/zz》(尸/z)、好氧火球菌(尸;vro6acw/訓(xùn)aen9/Mw附)、深?;鹎驍嗍琷rococcwsa6戸Z)、硫磺礦硫化葉斷iS^o/o6wsso(/^to〃-cm)(&)、超嗜熱泉古菌(^w//0/06^to/totto//)、嗜熱泉生古細(xì)菌04ewra外'ram^rm'x卩G^)、口耆酸熱原體(T7^rmo//asw。ac/c/op/H'/wm)禾口火山熱原體(T7zerwop/as7Wflvo/cam.臓)。保守變體:就翻譯組分而言,本文所用的術(shù)語"保守變體"指某翻譯組份,例如保守變體O-tRNA或保守變體O-RS,其所執(zhí)行的功能與與其相似的基本組分(例如O-tRNA或O-RS)相類似,但與參比O-tRNA或O-RS相比序列中有變異的。例如,O-RS或該O-RS的保守變體可用非天然氨基酸,例如圖1的非天然氨基酸氨酰化關(guān)聯(lián)O-tRNA。在該例子中,所述O-RS及保守變體O-RS的氨基酸序列不相同。所述保守變體在序列中可具有例如一處變異、兩處變異、三處變異、四處變異或五處或更多處變異,只要該保守變體仍與關(guān)聯(lián)的相應(yīng)O-tRNA或O-RS互補(例如,與之起作用)。在一些實施方式中,保守變體O-RS與衍生其的O-RS相比,含有一個或多個保守性氨基酸取代。在一些實施方式中,保守變體O-RS與衍生其的O-RS相比,含有一個或多個保守性氨基酸取代,此外還保留了O-RS的生物學(xué)活性;例如,保守變體O-RS保留了衍生其的親本O-RS分子至少10%,或者至少20%,至少30%,或至少40%的生物學(xué)活性。在一些優(yōu)選實施方式中,所述保守變體O-RS保留了衍生其的親本O-RS分子至少50%的生物學(xué)活性。保守變體O-RS的保守性氨基酸取代可出現(xiàn)在該O-RS的任何結(jié)構(gòu)域內(nèi),包括氨基酸結(jié)合袋。選擇或篩選試劑:本文所用的術(shù)語"選擇或篩選試劑"指當(dāng)存在時可從某群體中選擇/篩選某些組分的試劑。例如,選擇或篩選試劑可以是但不限于,如營養(yǎng)物、抗生素、某波長的光、抗體、表達(dá)的多核苷酸等。選擇試劑可因例如濃度、強度等而有所不同。響應(yīng):本文所用的術(shù)語指本發(fā)明的O-tRNA識別選擇者密碼子并介導(dǎo)與該tRNA偶聯(lián)的非天然氨基酸摻入延伸中的多肽鏈的過程。編碼:本文所用的術(shù)語"編碼"指用多聚大分子或序列鏈中的信息來指導(dǎo)不同于該第一分子或序列鏈的第二種分子或序列鏈產(chǎn)生的任何過程。本文所用的該術(shù)語應(yīng)用廣泛,可用于各領(lǐng)域。在一些方面,術(shù)語"編碼"描述了半保留DNA復(fù)制的過程,其中雙鏈DNA分子的一條鏈用作模板,借助依賴DNA的DNA合成酶來編碼新合成的互補姊妹鏈。在另一方面,術(shù)語"MM"指用一種分子的信息來指導(dǎo)產(chǎn)生化學(xué)性質(zhì)不同于該第一分子的第二種分子的任何過程。例如,DNA分子可編碼RNA分子(例如,包含依賴DNA的RNA聚合酶的轉(zhuǎn)錄過程)。RNA分子也可編碼多肽,例如翻譯過程。當(dāng)術(shù)語"編碼"用于描述翻譯過程時,其含義也延伸至編碼氨基酸的三聯(lián)密碼子。在一些方面,RNA分子可編碼DNA分子,例如通過包含依賴RNA的DNA合成酶的逆轉(zhuǎn)錄過程。在另一方面,DNA分子可編碼多肽,應(yīng)該知道該情況用"編碼"同時包括轉(zhuǎn)錄和翻譯過程。附圖簡述圖l提供非天然氨基酸對-甲氧基苯丙氨酸(pMpa)、對-乙?;奖彼?pApa)、對-苯甲酰苯丙氨酸(pBpa)、對-碘代苯丙氨酸(pIpa)、對-疊氮基苯丙氨酸(pAzpa)、對-炔丙基氧基苯丙氨酸(pPpa)、a-氨基辛酸、鄰-硝基芐基半胱氨酸(o-NBC)、1,5-丹磺酰丙氨酸和鄰-硝基節(jié)基絲氨酸(o-NBS)的化學(xué)結(jié)構(gòu)和命名。使用其它命指代多數(shù)這些非天然氨基酸,圖中也有標(biāo)明。圖2顯示使用正交fotRNA^和五cTyrRS對在英杰(Invitrogen)tmT-RExTMCHO細(xì)胞中表達(dá)全長GFP的Western印跡分析。用質(zhì)粒pcDNA4-GFP37TAG、PcDNA4-£cTyrRS變體和pUC18-3&tRNA^共轉(zhuǎn)染細(xì)胞,并在存在或不存在非天然氨基酸的條件下培養(yǎng)。第一泳道是pcDNA4-GFP瞬時轉(zhuǎn)染的T-rexCHO細(xì)胞中野生型GFP的表達(dá)。第二泳道是野生型五cTyrRS和5rfRNA^抑制下的GFP37TAG的全長表達(dá)。后隨的泳道是在存在或不存在非天然氨基酸的條件下,五cTyrRS變體和ArtRNA^抑制下的GFP37TAG全長表達(dá)。pMpaRS代表pMpa-tRNA合成酶等。用抗-c-myc抗體分析每一反應(yīng)40|_ig細(xì)胞裂解物(第一泳道上樣10pg細(xì)胞裂解物)。用于蛋白表達(dá)的非天然氨基酸濃度為10mMpMpa、10mMpApa、1mMpBpa、8mMplpa、5mMpAzpa以及1mMpPpa。圖3顯示使用如圖2所示正交fctRNA^^和汝TyrRS対在英杰tmT-REx293細(xì)胞中表達(dá)全長GFP的Western印跡分析。用抗-His-HRP抗體分析每一反應(yīng)20(ig細(xì)胞裂解物(對照反應(yīng)5pg)。試劑、非天然氨基酸濃度和泳道定義同圖2所示。圖4A提供pSWAN-pMpaRS的質(zhì)粒圖。圖4B提供pSWAN-GFP37TAG的質(zhì)粒圖。圖5提供野生型GFP和GFP-pMpa肽的氨基酸序列。Y'表示野生型GFP中的酪氨酸或GFP-pMpa中的pMpa。顯示了肽FSVSGEGEGDATY'GK(SEQIDNO:103)片段化過程中產(chǎn)生的y-和b-型離子。圖6提供圖5中野生型GFP肽FSVSGEGEGDATY'GK(SEQIDNO:103)的注釋的串聯(lián)質(zhì)譜圖。為了比較和明確起見,僅對富集的Y^離子系列以及使pMpa明確定位于37位的bi3離子作注釋。用抗-myc親和柱純化蛋白并用SDS-PAGE分析。切下GFP條帶進(jìn)行MS分析。圖7提供來自GFP-pMpa的肽FSVSGEGEGDATY*GK(SEQIDNO:103)的注釋串連質(zhì)譜圖。Y:離子系列的串連質(zhì)譜圖顯示了預(yù)期的14Da的質(zhì)量漂移。圖8提供親和純化的GFP-pMpa的完整蛋白ESITOF-MS譜圖。解巻積電荷狀態(tài)包絡(luò)線(插圖所示)顯示一種29696Da的主組分,這與修飾蛋白減去N-末端甲硫氨酸再加上乙?;念A(yù)期質(zhì)量(理論質(zhì)量29696.52)在實驗誤差內(nèi)吻合。29654Da的小特征峰指定為GFP-pMpa減去N-末端甲硫氨酸。兩側(cè)條帶可能是由非特異性修飾產(chǎn)生的。圖9提供含pApa的突變GFP的串連質(zhì)譜圖。與野生型GFP譜圖中相同離子相比,Y'-離子的質(zhì)量漂移為26Da。圖10提供含pBpa的突變GFP的串連質(zhì)譜圖。清楚觀察到突變GFP和野生型GFP之間86Da的特征性質(zhì)量漂移。圖11提供含pAzpa的突變GFP的串連質(zhì)譜圖。多數(shù)pAzpa衰變?yōu)閜Ampa(對募基苯兩嚴(yán)激胰蛋白酶消化后含pAmpa的片段的串連質(zhì)譜圖參見圖15)。然而,與野生型GFP信號相比,仍清晰觀察到Y(jié)^離子25Da的特征性質(zhì)量漂移。圖12提供含pPpa的突變GFP的串連質(zhì)譜圖。背景掩蓋了大部分pPpa片段信號。盡管如此,通過搜索MSDB數(shù)據(jù)庫中的圖譜仍然具有很好的分辨率。觀察到特征性質(zhì)量漂移為38Da的較強的Y'-離子。圖13A和13B顯示在英杰tmT-RExCHO和英杰tmT-REx293細(xì)胞中琥珀抑制依賴于EcTyrRS和BstRNA^,基因。圖13A提供不同構(gòu)建物瞬時轉(zhuǎn)染的英杰tmT-REXtmCHO細(xì)胞的綠色熒光圖像。在第一張圖中,用pcDNA4-GFP轉(zhuǎn)染細(xì)胞。在第二張圖中,用pcDNA4-五cTyrRS和pcDNA4-GFP37TAG轉(zhuǎn)染細(xì)胞。在第三張圖中,用pUC18-3&tRNAg力和pcDNA4-GFP37TAG轉(zhuǎn)染細(xì)胞。在第四張圖中,用pUC18-3&tRNA^、PcDNA4-£cTyrRS和pcDNA4-GFP37TAG轉(zhuǎn)染細(xì)胞。圖13B提供不同構(gòu)建物瞬時轉(zhuǎn)染的英杰TMT-RExTM293細(xì)胞的綠色熒光圖像。不同圖中使用的構(gòu)建物與圖13A中所示相同。圖14提供在英杰tmT-RExCHO和293細(xì)胞中六種五cTyrRS變體表達(dá)的Western印跡分析。用抗-c-myc抗體分析每一反應(yīng)的40pg細(xì)胞裂解物。23五cTyrRS變體的表達(dá)不受活性位點突變的影響。T-RExCHO和T-REx293細(xì)胞系中變體表達(dá)相等。圖15提供來自含pAzpa的突變GFP的肽FSVSGEGEGDATY*GK(SEQIDNO:103)的注釋串連質(zhì)譜圖。Y'代表pAmpa(對募基苯厲賓熟。為明確起見僅注釋了Y^離子系列。pAzpa多數(shù)衰變成pAmpa,因為pAzpa肽的信號強度很弱(參見圖11),并且在野生型GFP的片段和含pAzpa的突變型GFP的片段之間檢測到的質(zhì)量差異為lDa。圖16提供了核苷酸和氨基酸序列。發(fā)明詳述本發(fā)明提供了快速篩選和分離突變型氨酰-tRNA合成酶(RS)的常用方法,這些突變型氨酰-tRNA合成酶能夠在哺乳動物宿主系統(tǒng)中使合適的正交抑制子tRNA帶上不同理化和生物學(xué)屬性的非天然氨基酸,此外,其中篩選方法也消除了對在哺乳動物細(xì)胞中進(jìn)行緩慢的有技術(shù)挑戰(zhàn)性的篩選的需求。在這些方法中,突變的大腸桿菌氨酰-tRNA合成酶(RS)在酵母中演化,能夠選擇性使用感興趣的非天然氨基酸。然后使用同樣的突變RS以及來自嗜熱脂肪芽孢桿菌的琥珀抑制子tRNA在哺乳動物細(xì)胞中響應(yīng)選擇者密碼子(如琥珀無義密碼子)將非天然氨基酸定點摻入感興趣的蛋白質(zhì)中。通過工程改造編碼感興趣蛋白的多核苷酸使其包含轉(zhuǎn)導(dǎo)非天然氨基酸摻入信號的選擇者密碼子,可對非天然氨基酸摻入蛋白進(jìn)行編程使其發(fā)生在任何需要的位置上。本發(fā)明也提供了新的翻譯系統(tǒng),該系統(tǒng)包含了至今尚未考慮過的宿主細(xì)胞。例如,本發(fā)明的翻譯系統(tǒng)包括(i)非天然氨基酸、(ii)正交tRNA(O-tRNA)、(iii)衍生自真細(xì)菌的氨酰-tRNA合成酶,通常為X^好慮RS的正交氨酰-tRNA合成酶(O-RS),以及(iv)包含這些組件的哺乳動物宿主細(xì)胞,其中哺乳動物宿主細(xì)胞可為嚙齒類細(xì)胞(如小鼠細(xì)胞或大鼠細(xì)胞),或靈長類細(xì)胞,即屬于通常稱為猿(包括猿、人和舊大陸猴)、新大陸猴和原猴(pro-simian)(^/7狐猴)的類群的任何細(xì)胞。人細(xì)胞對本發(fā)明尤其有用。然而,上述列舉的細(xì)胞并非意在限制本發(fā)明的范圍,本發(fā)明也可使用其它宿主細(xì)胞。本發(fā)明也提供了用于制造在選定位置具有至少一個非天然氨基酸的蛋白質(zhì)的方法,所述方法使用上述翻譯系統(tǒng)。該方法在蛋白質(zhì)翻譯期間通過在選擇者密碼子的位點程序性摻入非天然氨基酸,導(dǎo)致非天然氨基酸摻入。本發(fā)明提供了使用突變RS(最初在釀酒酵母中演化)以及來自合適真細(xì)菌如嗜熱脂肪芽孢桿菌(及她aro^rmo;Mw力的琥珀抑制子在哺乳動物宿主細(xì)胞如嚙齒類細(xì)胞和靈長類細(xì)胞中將多種非天然摻入蛋白的常用方法。作為驗證,已經(jīng)成功使用本方法響應(yīng)琥珀無義密碼子將總共十種不同非天然氨基酸定點摻入到模型蛋白中,在中國倉鼠卵巢(CHO)細(xì)胞和人239T宿主細(xì)胞中具有優(yōu)秀的保真性和良好的效率。例如,將非天然氨基酸獨立摻入CHO細(xì)胞表達(dá)的綠色熒光蛋白(GFP)中,效率高達(dá)每2x107個細(xì)胞1嗎蛋白質(zhì)。質(zhì)譜確認(rèn)了非天然氨基酸的高翻譯保真度。該方法利于在蛋白質(zhì)中引入生物學(xué)探針進(jìn)行細(xì)胞研究,并可能最終利于在哺乳動物細(xì)胞中合成含非天然氨基酸的治療性蛋白。在一些方面,為了展示(而非限制)本發(fā)明,本文的公開文本提出可在哺乳動物細(xì)胞中將非天然氨基酸部分摻入到不同模型蛋白中。不應(yīng)理解非天然氨基酸的摻入僅限于任一感興趣的特定蛋白。從本公開文本中能清楚了解,將不同非天然氨基酸摻入感興趣的特定蛋白中可用于各種不同的蛋白質(zhì)和目的。應(yīng)當(dāng)注意的是,控制在酵母中演化的突變型大腸桿菌氨酰-tRNA合成酶(O-RS)和O-tRNA表達(dá)的基因并不能直接用于哺乳動物宿主細(xì)胞(如嚙齒類或人細(xì)胞)。必須用合適的調(diào)節(jié)元件重新工程改造這些基因,驅(qū)動其在哺乳動物細(xì)胞背景中表達(dá)。原本與O-tRNA和O-RS基因相關(guān)的酵母轉(zhuǎn)錄調(diào)節(jié)元件在哺乳動物細(xì)胞中無效(或者并非最佳)。本領(lǐng)域熟練技術(shù)人員應(yīng)該意識到這一點。已對哺乳動物基因表達(dá)元件進(jìn)行很好的鑒定,隨時可用于需要優(yōu)化(如最大化)與其相關(guān)的基因序列的各種重組構(gòu)建物。本發(fā)明使用的非天然氨基酸本發(fā)明提供能在哺乳動物宿主細(xì)胞系統(tǒng)如靈長類和嚙齒類宿主細(xì)胞系統(tǒng)中產(chǎn)生含非天然氨基酸的多肽的正交翻譯系統(tǒng)。這些翻譯系統(tǒng)中使用的非天然氨基酸不受特別限制。通常,本發(fā)明使用的非天然氨基酸通常為大腸桿菌衍生的突變型氨酰-tRNA合成酶用來在釀酒酵母宿主系統(tǒng)中加載到相應(yīng)正交tRNA上的那些氨基酸。例如本文所用,本發(fā)明使用下列非天然氨基酸對-甲氧基苯丙氨酸(pMpa)對-乙?;奖彼?pApa)對-苯甲酰苯丙氨酸(pBpa)對-碘代苯丙氨酸(plpa)對-疊氮基苯丙氨酸(pAzpa)對-炔丙基氧基苯丙氨酸(pPpa)圖1顯示了這六種非天然氨基酸的每一種的結(jié)構(gòu)。還標(biāo)出了這些氨基酸的其它命名和不同的縮寫,如圖1所示。如實施例所示,在人和嚙齒類宿主細(xì)胞中,使用最初由酵母宿主細(xì)胞系統(tǒng)篩選和分離的大腸桿菌衍生的O-RS物質(zhì)將這六種非天然氨基酸獨立摻入綠色熒光蛋白(GFP)中。除了上述列舉的以外,本發(fā)明還使用了其它非天然氨基酸。下文列舉的非天然氨基酸曾成功用于酵母宿主細(xì)胞系統(tǒng)中,由大腸桿菌衍生的正交RS將其加載于O-tRNA上。這些非天然氨基酸包括a-氨基辛酸鄰-硝基芐基半胱氨酸(o-NBC)1,5-丹磺酰丙氨酸鄰-硝基芐基絲氨酸這些非天然氨基酸的結(jié)構(gòu)及其不同的命名和簡寫如圖1所示。所有這些非天然氨基酸在酵母宿主細(xì)胞中的成功使用已有記錄,如Chin等(2003),"擴(kuò)展的真核遺傳密碼"(Anexpandedeukaryoticgeneticcode)&/ewce301:964-967;Deiters等(2003),"在釀酒酵母的遺傳密碼中加入具有新反應(yīng)性的氨基酸"(Addingaminoacidswithnovelreactivitytothegeneticcodeof)/JmC/zemSoc125:11782-11783;Summerer等(2006),"遺傳編碼的熒光氨基酸"(AGeneticallyEncodedFluorescentAminoAcid)/WAS103(26):9785-9789;Deiters箏游2004年4月16日提交的WO2005/003294"非天然反應(yīng)性氨基酸遺傳密碼增加"(UNNATURALREACTIVEAMINOACIDGENETICCODEADDITIONS);Deiters牟9^27^楚:^"/效WO2006/034410"在遺傳密碼中加入光調(diào)節(jié)性氨基酸"(ADDINGPHOTOREGULATEDAMINOACIDSTOTHEGENETICCODE),以及2005年10月27日提交的WO2006/110182"用于體內(nèi)摻入非天然氨基酸的正交翻26譯組件"(ORTHOGONALTRANSLATIONCOMPONENTSFORTHEVIVOINCORPORATIONOFUNNATURALAMINOACIDS)。本發(fā)明使用的宿主細(xì)胞本發(fā)明提供了新型翻譯系統(tǒng),該系統(tǒng)使用迄今為止尚未考慮過的宿主細(xì)胞。例如,本發(fā)明翻譯系統(tǒng)包括(i)非天然氨基酸、(ii)正交tRNA(O-tRNA)、(iii)衍生自大腸桿菌氨酰-tRNA合成酶的正交氨酰-tRNA合成酶(O-RS),以及(iv)包含這些組件的哺乳動物宿主細(xì)胞,其中哺乳動物宿主細(xì)胞可為嚙齒類細(xì)胞(如小鼠細(xì)胞或大鼠細(xì)胞),或靈長類細(xì)胞,即屬于通常稱為猿(包括猿、人和舊大陸猴)、新大陸猴和原猴(》膽瓜猴)的類群的任何細(xì)胞。人細(xì)胞對本發(fā)明尤其有用。用于本發(fā)明的動物細(xì)胞系可衍生自該動物的任何組織。上述列舉的細(xì)胞并非意在限制本發(fā)明的范圍,本發(fā)明也可使用其它宿主細(xì)胞。本文所用術(shù)語"宿主細(xì)胞"也包括多個獨立細(xì)胞,通常指"細(xì)胞系",在該情況下是"宿主細(xì)胞系"。用于產(chǎn)生含有至少一個非天然氨基酸的多肽的宿主細(xì)胞可為任一類型的宿主細(xì)胞,但是一些宿主細(xì)胞尤其有用。例如,可使用一些宿主細(xì)胞類型產(chǎn)生用于生產(chǎn)重組治療性多肽的多肽。當(dāng)宿主細(xì)胞為嚙齒類細(xì)胞時,嚙齒類細(xì)胞的類型不受特別限制。如實施例所述,中國倉鼠卵巢(CHO)細(xì)胞可作為宿主細(xì)胞。CHO細(xì)胞被廣泛采用并且是公眾接受的重組蛋白表達(dá)系統(tǒng)。然而,并不意味本發(fā)明僅限于這種嚙齒動物細(xì)胞類型。事實上,本領(lǐng)域熟練技術(shù)人員了解可用作生產(chǎn)重組蛋白的宿主細(xì)胞的大量嚙齒動物細(xì)胞系。嚙齒動物細(xì)胞系包括任一衍生自哺乳動物嚙齒目的細(xì)胞系,嚙齒目包括但不限于真鼠(truemice)、大鼠、倉鼠、花栗鼠、海貍和松鼠。嚙齒類細(xì)胞系包括衍生自普通家鼠一小鼠(A/wm^cw/^)及其所有品系的細(xì)胞系。同樣,嚙齒類細(xì)胞系包括衍生自大鼠,如家鼠屬的任一種,如褐家鼠(iam^"orveg/cwW(挪威大鼠)和屋頂鼠(i加^ra"w力(黑鼠)及其任何和所有品系的細(xì)胞系。本發(fā)明的宿主細(xì)胞可為靈長類細(xì)胞。靈長類細(xì)胞類型不受特別限制。如實施例中所述,人胚腎細(xì)胞(也稱作HEK細(xì)胞、HEK293或293)可用作宿主細(xì)胞。293細(xì)胞被廣泛采用并且是公眾接受的重組蛋白表達(dá)系統(tǒng)。然而,并不意味本發(fā)明僅限于該種人的細(xì)胞類型。事實上,本領(lǐng)域熟練技術(shù)人員了解可用作生產(chǎn)重組蛋白的宿主細(xì)胞的大量人或其它靈長動物細(xì)胞系。靈長類細(xì)胞系包括任一起源于哺乳動物靈長目的細(xì)胞系,靈長目包括但不限于(i)猿,包括舊大陸猿猴,包括人),(ii)新大陸猴以及(iii)原猴(勿狐猴)。靈長類細(xì)胞系可衍生自任一靈長類物種。例如但不限于,靈長類細(xì)胞系可衍生自黑猩猩、狒狒、狨、短尾猿和非洲綠銜如COS-l細(xì)胞系)。下表提供了靈長類物種的非窮舉列表,衍生自這些物種的細(xì)胞系可用于本發(fā)明。<table>tableseeoriginaldocumentpage28</column></row><table><table>tableseeoriginaldocumentpage29</column></row><table>可在促進(jìn)靈長類分子生物學(xué)研究組織(ResearchInfrastructuretoPromotePrimateMolecularBiology)(INPRIMAT;西班牙巴塞羅那)以及生物醫(yī)學(xué)靈長類研究中心(BiomedicalPrimateResearchCentre)(BPRC;荷蘭瑞斯維基克(Rijswijk))的網(wǎng)站上找到衍生自這些靈長類物種的細(xì)胞系。使用人細(xì)胞系生產(chǎn)重組多肽已經(jīng)廣為接受并在本發(fā)明的范圍內(nèi)。人宿主細(xì)胞系可為任一來源,衍生自任一組織。適合生產(chǎn)重組蛋白的人細(xì)胞系廣為人知,并可獲自本領(lǐng)域技術(shù)人員熟知的大量商業(yè)來源。此外,衍生自其它多種哺乳動物物種的宿主細(xì)胞系也在本發(fā)明的范圍之內(nèi)。包括牛、豬、綿羊、犬、馬和山羊細(xì)胞系。源于這些物種的細(xì)胞系為本領(lǐng)域所知,并且本領(lǐng)域一般技術(shù)人員易于使用。本領(lǐng)域已建立嚙齒類細(xì)胞系、靈長類細(xì)胞系和多種其它哺乳動物群來源的細(xì)胞系,以及培養(yǎng)這些動物細(xì)胞系的材料和方法,它們可從多種來源獲得。例如,參見美國典型培養(yǎng)物保藏中心(AmericanTypeCultureCollection(ATCC;弗吉尼亞州瑪納薩斯(Manassas,VA)))以獲取更多可利用細(xì)胞系的列表??蓮臄?shù)種來源獲取細(xì)胞培養(yǎng)基,例如吉布科(GIBCOf品牌(英杰TM)細(xì)胞培養(yǎng)基以及Cellgr(^的MT公司(Mediatech,Inc.)培養(yǎng)基。此外,本發(fā)明也可使用全新建立的細(xì)胞系(原代細(xì)胞系或建立細(xì)胞系)作為宿主細(xì)胞,用于產(chǎn)生含有至少一個非天然氨基酸的重組蛋白。本發(fā)明使用的O-RS物質(zhì)本發(fā)明提供了新的正交翻譯系統(tǒng),該系統(tǒng)能夠在以前未關(guān)注的哺乳動物宿主細(xì)胞,例如靈長類和嚙齒類宿主細(xì)胞系統(tǒng)中產(chǎn)生含非天然氨基酸的多肽。本發(fā)明的翻譯系統(tǒng)包括(i)非天然氨基酸、(ii)正交tRNA(O-tRNA)、(iii)衍生自大腸桿菌氨酰-tRNA合成酶的正交氨酰-tRNA合成酶(O-RS),以及(iv)包含這些組件的哺乳動物宿主細(xì)胞,其中哺乳動物宿主細(xì)胞可以是,例如嚙齒類細(xì)胞(如小鼠細(xì)胞或大鼠細(xì)胞),或靈長類細(xì)胞(如人或小鼠細(xì)胞)。本發(fā)明還提供了產(chǎn)生在選定位置具有至少一個非天然氨基酸的蛋白質(zhì)的方法,所述方法使用上述翻譯系統(tǒng)。該方法在蛋白質(zhì)翻譯期間通過在選擇者密碼子的位點程序性摻入非天然氨基酸,導(dǎo)致在哺乳動物宿主細(xì)胞中摻入非天然氨基酸。本發(fā)明所用O-RS物質(zhì)不受特別限制,但通常具有下列屬性。本發(fā)明所用O-RS通常衍生自大腸桿菌氨酰-tRNA合成酶,如野生型大腸桿菌亮氨酰-tRNA合成酶CEcLeuRS;SEQIDNO:4提供了氨基酸序列,SEQIDNO:5提供了多核苷酸序列)或者野生型大腸桿菌酪氨酰-tRNA合成酶(五cTyrRS;SEQIDNO:6提供了氨基酸序列,SEQIDNO:7提供了多核苷酸序列)。本發(fā)明使用的突變的O-RS物質(zhì)(例如,衍生自SEQIDNO:4或6的合成酶)最初在釀酒酵母宿主細(xì)胞系統(tǒng)中演化和選擇。本領(lǐng)域已知大量本發(fā)明使用的此類O-RS物質(zhì)。在釀酒酵母中,功能性tRNACUA/RS對已成功衍生自對應(yīng)的大腸桿菌tRNATy7TyrRS和tRNALe7亮氨酰-tRNA合成酶對。參見例如Chin等(2003),"擴(kuò)展的真核遺傳密碼"(Anexpandedeukaryoticgeneticcode)5Wence301:964-967;Chin等,"擴(kuò)展真核遺傳密石馬進(jìn)展"(ProgressTowardanExpandedEukaryoticGeneticCode)C7zem10,511-519(2003);Deiters等(2003),"在釀酒酵母的遺傳密碼中加入具有新反應(yīng)性白勺氣基酸"(AddingaminoacidswithnovelreactivitytothegeneticcodeofSacc/zaramycescereWs/ae)/」mC/zemSoc125:11782-11783;Summerer等(2006),"遺傳編碼的熒光氨基酸"(AGeneticallyEncodedFluorescentAminoAcid)/WJS103(26):9785-9789;Wu等(2004),"遺傳編碼的光籠蔽氨基酸"(Ageneticallyencodedphotocagedaminoacid)J"JmCTem/Sbc126,14306-14307。授權(quán)Deiters箏游2004年4月16日提交的WO2005/003294"非天然反應(yīng)性氨基酸遺傳密碼增加"(UNNATURALREACTIVEAMINOACIDGENETICCODEADDITIONS);Deiters#"游2005牟9^"斤連^"游WO2006/034410"在遺傳密碼中加入光調(diào)節(jié)性氨基酸"(ADDINGPHOTOREGULATEDAMINOACIDSTOTHEGENETICCODE),以及2005年10月27日提交的WO2006/110182"用于體內(nèi)摻入非天然氨基酸的正交翻譯組件"(ORTHOGONALTRANSLATIONCOMPONENTSFORTHEVIVOINCORPORATIONOFUNNATURALAMINOACIDS)。每一參考文獻(xiàn)均通過引用全文納入本文。本領(lǐng)域這些教導(dǎo)為構(gòu)建本發(fā)明使用的其它O-RS物質(zhì)提供了充分的指導(dǎo)。圖16提供本發(fā)明所使用的O-RS物質(zhì)的例子。SEQIDNO:8-56提供編碼O-RS的多核苷酸序列。SEQIDNO:57-101提供對應(yīng)的O-RS多肽序列。應(yīng)當(dāng)注意的是,本發(fā)明對RS進(jìn)行操作時未必需要全長O-RS。僅表達(dá)RS活性位點片段足以滿足本發(fā)明的使用,如圖16所示的一些序列。圖16中每一O-RS序列均為本領(lǐng)域所知,如本文引用參考文獻(xiàn)所述。應(yīng)了解,本發(fā)明并不局限于使用圖16提供的0-RS。本文鑒定的任何用于本發(fā)明的O-RS物質(zhì)均可作為模板衍生其它本發(fā)明可用的O-RS物質(zhì),例如,通過在現(xiàn)有O-RS物質(zhì)內(nèi)進(jìn)行保守氨基酸取代。只要新衍生的O-RS保持優(yōu)選用非天然氨基酸氨酰化對應(yīng)的O-tRNA的生物學(xué)活性,則允許的取代數(shù)目不受限制。O-RS的生物學(xué)活性可表示為己證明可為本發(fā)明使用的另一"參考"O-RS的生物學(xué)活性的百分?jǐn)?shù)。例如,本發(fā)明所用O-RS可包括優(yōu)選用非天然氨基酸氨?;疧-tRNA,其效率為含有O-tRNA、非天然氨基酸和己知序列的氨酰-tRNA合成酶(RS)的"參考"翻譯系統(tǒng)效率的至少50%的O-RS。任意選擇活性閾值,"50%"僅作為示例。事實上,本發(fā)明所用O-RS可包括優(yōu)選用非天然氨基酸氨?;疧-tRNA,其效率至少為"參考"翻譯系統(tǒng)效率的20%、30%、40%、50%、60%、70%、80%、90%、95%、98%或99%的O-RS。本發(fā)明使用的O-TRNA物質(zhì)本發(fā)明使用的突變O-RS物質(zhì)最初在酵母宿主細(xì)胞系統(tǒng)中演化和選擇。在酵母宿主細(xì)胞系統(tǒng)中演化的O-RS物質(zhì)與O-tRNA聯(lián)合行使功能,所述O-tRNA被O-RS用非天然氨基酸優(yōu)先氨酰化。例如,在酵母宿主系統(tǒng)中有功能的抑制子O-tRNA物質(zhì)可為,例如SEQIDNO:1或2的tRNA。相反,本發(fā)明翻譯系統(tǒng)使用在哺乳動物宿主細(xì)胞(如嚙齒類或靈長類細(xì)胞)中正交的不同O-tRNA。例如,本發(fā)明使用的O-tRNA可為嗜熱脂肪芽孢桿菌的琥珀抑制子酪氨酰-tRNAcuA(5&tRNATyrCUA),如SEQIDNO:3所示。這并不意味本發(fā)明僅限于使用這一種tRNA物質(zhì),也考慮使用該tRNA序列的變體、衍生自嗜熱脂肪芽孢桿菌的其它tRNA以及衍生自其它有機(jī)體(如其它真細(xì)菌種類)的tRNA物質(zhì)。正交tRNA/氨酰-tRNA合成酶技術(shù)理解與正交tRNA和正交氨酰-tRNA合成酶配對有關(guān)的活性有助于理解本發(fā)明的新型組合物和方法。為在遺傳密碼中加入額外的非天然氨基酸,需要含有氨酰-tRNA合成酶和適當(dāng)tRNA的新正交配對,它們可在宿主翻譯機(jī)制中有效起作用,但對于所述翻譯系統(tǒng)是"正交"的,這意味著它可不依賴于翻譯系統(tǒng)的內(nèi)源性合成酶和tRNA而起作用。正交配對的所需特征包括能解碼或識別不由任何內(nèi)源性tRNA解碼的僅一種特定密碼子(例如選擇者密碼子)的tRNA,和只能優(yōu)先用一種特定非天然氨基酸氨酰化(或"加載")其關(guān)聯(lián)tRNA的氨酰-tRNA合成酶。內(nèi)源性合成酶通常不氨酰化O-tRNA(或氨?;?,即加載不佳)。例如,在大腸桿菌宿主系統(tǒng)中,正交配對包括不與任何內(nèi)源性tRNA(例如,大腸桿菌中有40種)交叉反應(yīng)的氨酰-tRNA合成酶和不被任何內(nèi)源性合成酶(例如,大腸桿菌中有21種)氨?;恼籺RNA。本領(lǐng)域已知適于制備含有一個或多個非天然氨基酸的蛋白質(zhì)的正交翻譯系統(tǒng)的通用原則,例如制備正交翻譯系統(tǒng)的通用方法。例如,可參見國際公開號WO2002/086075,名為"METHODSANDCOMPOSITIONSFORTHEPRODUCTIONOFORTHOGONAL簡A-AMINOACYL-tRNASYNTHETASEPAIRS"(產(chǎn)生正交tRNA-氨酰-tRNA合成酶配對的方法和組合物);WO2002/085923,名為"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS"(非天然氨基酸的體內(nèi)摻入);WO2004/094593,名為"EXPANDINGTHEEUKARYOTICGENETICCODE"(擴(kuò)展真核遺傳密碼);2004年7月7日提交的WO2005/019415;2004年7月7日提交的WO2005/007870;2004年7月7日提交的WO2005/007624;2005年10月27日提交的國際申請?zhí)朠CT/US2005/039210,名為"ORTHOGONALTRANSLATIONCOMPONENTSFORTHEINVIVOINCORPORATIONOFUNNATURALAMINOACIDS"(用于體內(nèi)摻入非天然氨基酸的正交翻譯組分)和2007年3月7日提交的美國臨時申請序列號60/783,497,名為"SYSTEMSFORTHEEXPRESSIONOFORTHOGONALTRANSLATIONCOMPONENTSINEUBACTERIALHOSTCELLS(在真細(xì)菌宿主細(xì)胞中表達(dá)正交翻譯組分的系統(tǒng))"。這些申請各自通過引用全文納入本文。摻入非天然氨基酸的正交翻譯系統(tǒng)和它們的產(chǎn)生及使用方法的討論還可參見Wang和Schultz,"ExpandingtheGeneticCode(擴(kuò)展遺傳密碼)",^"gewam^eC/zem/e/"f.五d,44(l):34-66(2005);Xie禾口Schultz,"AnExpandingGeneticCode(擴(kuò)展的遺傳密碼)",臉A油36(3):227-238(2005);Xie和Schultz,"AddingAminoAcidstotheGeneticRepertoire(將氨基酸加入遺傳庫)",Cwr.(9;/m'ow&Ozew/ca/9(6):548-554(2005);禾BWang等,"ExpandingtheGeneticCode(擴(kuò)展遺傳密碼)",iev.歷o//y^.S/omo/.Sfrw".,35:225-249(2006);這些文獻(xiàn)的內(nèi)容通過引用全文納入本文。正交翻譯系統(tǒng)正交翻譯系統(tǒng)一般包括含有正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)和非天然氨基酸的細(xì)胞(可以是哺乳動物細(xì)胞,例如嚙齒動物細(xì)胞或靈長動物細(xì)胞),其中所述O-RS用所述非天然氨基酸氨?;鯫-tRNA。本發(fā)明的正交配對可以包括O-tRNA,例如抑制itRNA、移碼tRNA等和關(guān)聯(lián)O-RS。本發(fā)明的正交系統(tǒng)通常包含處于宿主細(xì)胞環(huán)境中或無宿主細(xì)胞的0-tRNA/0-RS配對。除多組分系統(tǒng)外,本發(fā)明還提供單組分,例如,正交氨酰-tRNA合成酶多肽(例如,SEQIDNO:57-101)和編碼那些多肽的多核苷酸(例如,SEQIDNO:8-56)。當(dāng)正交配對識別選擇者密碼子并對該選擇者密碼子起反應(yīng)而加載氨基酸時,通常稱該正交配對"抑制"該選擇者密碼子。即,不被翻譯系統(tǒng)的(例如,細(xì)胞的)內(nèi)源性機(jī)制識別的選擇者密碼子通常不被加載,從而阻斷了多肽產(chǎn)生,否則可自核酸翻譯該多肽。在正交配對系統(tǒng)中,O-RS用特定的非天然氨基酸氨?;疧-tRNA。加載的O-tRNA識別選擇者密碼子并抑制選擇者密碼子所致的翻譯阻斷。在一些方面,與包含本文序列表所示多核苷酸序列或由其編碼的O-tRNA的抑制效率相比,本發(fā)明的O-tRNA識別選擇者密碼子并在關(guān)聯(lián)合成酶存在下對選擇者密碼子起反應(yīng)而具有至少約,例如,45%、50%、60%、75%、80%或90%或更高的抑制效率。在一些實施方式中,聯(lián)用O-RS和O-tRNA的抑制效率是缺乏O-RS的O-tRNA的抑制效率的約,例如5倍、10倍、15倍、20倍或25倍或更高。在一些方面,聯(lián)用O-RS和O-tRNA的抑制效率是本文序列表所示正交合成酶配對的抑制效率的至少約,例如35%、40%、45%、50%、60%、75%、80%或90%或更高。宿主細(xì)胞利用0-tRNA/0-RS配對將非天然氨基酸摻入延伸中的多肽鏈,例如經(jīng)由包含編碼感興趣多肽的多核苷酸的核酸,其中所述多核苷酸包含所述O-tRNA識別的選擇者密碼子。在某些優(yōu)選方面,細(xì)胞可包含一種或多種其它O-tRNA/0-RS配對,其中所述其它O-RS用不同的非天然氨基酸加載所述其它O-tRNA。例如,O-tRNA之一可識別四堿基密碼子,其它O-tRNA可識別終止密碼子?;蛘?,多個不同的終止密碼子或多個不同的四堿基密碼子可用于同一編碼核酸。應(yīng)注意,在一些實施方式中,細(xì)胞或其它翻譯系統(tǒng)中可存在多個0-tRNA/0-RS配對,從而能將多個非天然氨基酸摻入多肽。例如,細(xì)胞還可包含額外的不同O-tRNA/0-RS配對和第二非天然氨基酸,其中該額外的O-tRNA識別第二選擇者密碼子,該額外的O-RS優(yōu)先用該第二非天然氨基酸氨?;擃~外的O-tRNA。例如,包含O-tRNA/0-RS配對的細(xì)胞(其中所述O-tRNA識別,例如琥珀選擇者密碼子)還可包含第二正交配對,其中該第二O-tRNA識別不同的選擇者密碼子,例如乳白密碼子、四堿基密碼子等。不同的正交配對優(yōu)選衍生自不同來源,從而有助于識別不同的選擇者密碼子。在某些實施方式中,系統(tǒng)包含例如哺乳動物細(xì)胞等細(xì)胞,例如但不限于嚙齒動物和靈長動物細(xì)胞,這些細(xì)胞含有正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)、非天然氨基酸和包含編碼感興趣多肽的多核苷酸的核酸,其中所述多核苷酸包含所述O-tRNA識別的選擇者密碼子。翻譯系統(tǒng)還可以是無細(xì)胞系統(tǒng),例如與本文所述O-tRNA/0-RS配對和非天然氨基酸組合的各種市售可得"體外"轉(zhuǎn)錄/翻譯系統(tǒng)。O-tRNA和/或0-RS可以是天然產(chǎn)生的,或者可以是,例如天然tRNA和/或RS經(jīng)突變衍生,例如,通過產(chǎn)生各種生物的tRNA文庫和/或RS文庫和/或采用各種可用的突變方案。例如,產(chǎn)生正交tRNA/氨酰-tRNA合成酶配對的一種方案包括將,例如得自除宿主細(xì)胞外的來源或多個來源的異源(對宿主細(xì)胞而言)tRNA/合成酶配對輸入宿主細(xì)胞。候選異源合成酶的特性包括,例如不加載任何宿主細(xì)胞tRNA,候選異源tRNA的特性包括,例如不被任何宿主細(xì)胞合成酶所氨?;?。此外,異源tRNA對于所有宿主細(xì)胞合成酶是正交的。產(chǎn)生正交配對的第二種方案包括產(chǎn)生用于篩選和/或選擇O-tRNA或O-RS的突變體文庫。也可聯(lián)用這些方案。IH交t脂A(O-tRNA)本發(fā)明的正交tRNA(O-tRNA)優(yōu)選在例如體內(nèi)或體外介導(dǎo)將非天然氨基酸摻入蛋白質(zhì)內(nèi),所述蛋白質(zhì)由含選擇者密碼子的多核苷酸編碼,而這種選擇者密碼子可被該O-tRNA識別。在某些實施方式中,與包含本文序列表中04RNA序列所示多核苷酸序列或由其編碼的O-tRNA相比,本發(fā)明的O-tRNA在關(guān)聯(lián)合成酶存在下,對選擇者密碼子起反應(yīng)而具有至少45%、50%、60%、75%、80%、90%或更高的抑制效率。可通過本領(lǐng)域已知的多種試驗測定抑制效率。例如,可采用卩半乳糖苷酶報道分子試驗,例如,將衍生的lacZ質(zhì)粒(該構(gòu)建物在lacZ核酸序列中含有選擇者密碼子)和含有本發(fā)明O-tRNA的質(zhì)粒一起導(dǎo)入合適生物(如可利用正交組分的生物)的細(xì)胞內(nèi)。還可導(dǎo)入關(guān)聯(lián)合成酶(多肽或表達(dá)時可編碼關(guān)聯(lián)合成酶的多核苷酸)。將細(xì)胞在培養(yǎng)基內(nèi)培養(yǎng)到所需密度,如OD600約0.5時,采用例如諾瓦金公司(Novagen)的BetaFluorP-半乳糖苷酶檢測試劑盒進(jìn)行(3半乳糖苷酶試驗。抑制百分率可以計算為樣品相對于可比較對照(如衍生的lacZ構(gòu)建物的觀察值,所述構(gòu)建物在所需位置上含有相應(yīng)的有義密碼子而不是選擇者密碼子)的活性百分?jǐn)?shù)。本發(fā)明所用的O-tRNA的例子見本文序列表,例如參見圖16和SEQIDNO:3。本文內(nèi)容還提供了設(shè)計其它等價O-tRNA的指導(dǎo)。在RNA分子(例如O-RSmRNA或O-tRNA分子)中,與給定序列(或?qū)幋aDNA而言反之亦然)或其互補序列相比,胸腺嘧啶(T)被尿嘧啶(U)取代。還可存在堿基的其它修飾以大量產(chǎn)生功能等同分子。本發(fā)明還包括對應(yīng)于本文具體O-tRNA的O-tRNA保守性變體。例如,O-tRNA保守性變體包括功能與具體O-tRNA(例如本文序列表中的)相似的,和因合適的自身互補性而保留了tRNA的L-形結(jié)構(gòu)但不具有與例如序列表或圖16所示那些(序列)相同的序列并且最好也不是野生型tRNA分子的那些分子。含O-tRNA的組合物還可包含正交氨酰-tRNA合成酶(O-RS),其中所述O-RS優(yōu)先用非天然氨基酸氨?;疧-tRNA。在某些實施方式中,含有O-tRNA的組合物還可包含(例如體外或體內(nèi))翻譯系統(tǒng)。細(xì)胞中也可存在含有編碼感興趣多肽的多核苷酸的核酸或這些物質(zhì)中一個或多個的組合,其中所述多核苷酸含有O-tRNA能識別的選擇者密碼子。產(chǎn)生正交tRNA(O-tRNA)的方法也是本發(fā)明的特征之一。通過該方法產(chǎn)生的正交tRNA(0-tRNA)也是本發(fā)明的特征之一。在本發(fā)明的某些實施方式中,可通過構(gòu)建突變體文庫來產(chǎn)生O-tRNA??刹捎帽绢I(lǐng)域已知的各種誘變技術(shù)構(gòu)建突變體tRNA文庫。例如,可通過位點特異性突變、隨機(jī)位點突變、同源重組、DNA改組或其它遞歸誘變(recursivemutagenesis)方法、嵌合體構(gòu)建、或者這些技術(shù)的任何組合產(chǎn)生突變體tRNA,例如SEQIDNO:3所示O-tRNA。也可將其它突變引入特定位置,例如tRNA的所需環(huán)或區(qū)域(如反密碼子環(huán)、接納莖、D臂或環(huán)、可變環(huán)、TPC臂或環(huán)、tRNA分子的其它區(qū)域或其組合)中一個或多個非保守位置、保守位置、一個或多個隨機(jī)位置或者二者的組合位置。tRNA中的突變通常包括使突變型tRNA文庫內(nèi)各成員的反密碼子環(huán)突變以使其能識別選擇者密碼子。該方法還可包括給O-tRNA加上額外序列。與起始材料(例如多種tRNA序列)相比,O-tRNA通常提高了對所需生物的正交性,同時保留其對所需RS的親和力。這些方法任選包括分析tRNA和/或氨酰-tRNA合成酶序列的相似性(和/或所推斷的同源性)以確定顯示與特定生物正交的潛在候選O-tRNA、O-RS和/或其配對??衫帽绢I(lǐng)域已知和本文所述的計算機(jī)程序進(jìn)行這種分析,例如可用BLAST和堆積(pileup)程序。在一個實施例中,為篩選用于哺乳動物細(xì)胞如嚙齒動物細(xì)胞和靈長動物細(xì)胞的可能的正交翻譯組分,可選擇與宿主生物不顯示接近的序列相似性的合成酶和/或tRNA。通??赏ㄟ^,例如負(fù)選擇第一物種的細(xì)胞群以獲得O-tRNA,其中所述細(xì)胞含有多種潛在O-tRNA的某成員。負(fù)選擇可去除含有被細(xì)胞內(nèi)源性氨酰-tRNA合成酶(RS)氨酰化的潛在0-tRNA文庫某成員的細(xì)胞。這樣就可以得到第一物種細(xì)胞的正交tRNA庫。某些實施方式在負(fù)選擇中將選擇者密碼子引入編碼負(fù)選擇標(biāo)記(例如能賦予抗生素抗性的酶如(3內(nèi)酰胺酶;能得到可檢測產(chǎn)物的酶如p半乳糖苷酶、氯霉素乙酰轉(zhuǎn)移酶(CAT),所述產(chǎn)物例如是毒性產(chǎn)物,如芽孢桿菌RNA酶)的多核苷酸的非必須位置(例如,仍能產(chǎn)生功能性芽孢桿菌RNA酶)等。還任選在選擇性試劑(比如抗生素,如氨芐青霉素)存在下培養(yǎng)細(xì)胞群來進(jìn)行篩選/選擇。在一個實施方式中,選擇性試劑的濃度不同。例如,為檢測抑制子tRNA的活性,可利用基于選擇者密碼子的體內(nèi)抑制的選擇系統(tǒng),例如將無義(如終止)或移碼突變引入編碼負(fù)選擇標(biāo)記的多核苷酸(如編碼(3-內(nèi)酰胺酶的基因(6/fl))中。例如,構(gòu)建在某位置(如,A184)含有選擇者密碼子的多核苷酸變體,如Wa變體。用這些多核苷酸轉(zhuǎn)化細(xì)胞,如細(xì)菌。以不能被內(nèi)源性大腸桿菌合成酶有效加載的正交tRNA為例,抗生素抗性(例如氨芐青霉素抗性)應(yīng)約為或小于未用質(zhì)粒轉(zhuǎn)化的細(xì)菌的抗生素抗性。如果tRNA不是正交的,或者能加載該tRNA的異源合成酶在此系統(tǒng)內(nèi)共同表達(dá),應(yīng)可觀察到更高水平的抗生素(如氨芐青霉素)抗性。選出那些在抗生素濃度與未用質(zhì)粒轉(zhuǎn)化的細(xì)胞大致相等的LB瓊脂平板上不能生長的細(xì)胞,如細(xì)菌。以毒性產(chǎn)物(如核糖核酸酶或芽孢桿菌RNA酶)為例,當(dāng)多種潛在的tRNA中的成員被內(nèi)源性宿主(如大腸桿菌)合成酶(即與宿主如大腸桿菌合成酶不是正交的)氨?;瘯r,選擇者密碼子被抑制,所產(chǎn)生的毒性多核苷酸產(chǎn)物導(dǎo)致細(xì)胞死亡。而含有正交tRNA或非功能性tRNA的細(xì)胞可存活。然后,在一個實施方式中,對與所需生物正交的tRNA庫進(jìn)行正選擇,其中將選擇者密碼子置于正選擇標(biāo)記中(例如抗藥性基因(如(3內(nèi)酰胺酶基因)編碼的標(biāo)記)。對以下細(xì)胞進(jìn)行正選擇含有編碼與該細(xì)胞正交的tRNA庫某成員的多核苷酸或包含該成員的多核苷酸、含有編碼正選擇標(biāo)記的多核苷酸和含有編碼關(guān)聯(lián)RS的多核苷酸。在某些實施方式中,第二群細(xì)胞含有不能通過負(fù)選擇除去的細(xì)胞。該多核苷酸在胞內(nèi)表達(dá),細(xì)胞在有選擇試劑(如氨芐青霉素)存在下生長。然后選擇能被共同表達(dá)的關(guān)聯(lián)合成酶氨?;约皩Υ诉x擇者密碼子起反應(yīng)而插入氨基酸的tRNA。與一種或多種含有非功能性tRNA或不能被感興趣合成酶有效識別的tRNA的細(xì)胞相比,這些細(xì)胞通常顯示抑制效率升高。含有非功能性tRNA或不能被感興趣合成酶有效識別的tRNA的細(xì)胞對該抗生素敏感。因此在兩次選擇中能保留下的tRNA是(i)不是內(nèi)源性宿主(如大腸桿菌)合成酶的底物;(ii)能被感興趣的合成酶氨?;?;以及(iii)能在翻譯過程中起作用。因此,根據(jù)篩選所處的環(huán)境,同一標(biāo)記可以是正或負(fù)標(biāo)記。g卩,如果為了篩選該標(biāo)記,則它是正標(biāo)記,但如果為了抵御該標(biāo)記則它是負(fù)標(biāo)記。上述方法中,篩選,如正選擇、負(fù)選擇或者正負(fù)選擇的嚴(yán)格性任選包括改變選擇的嚴(yán)格性。例如,由于芽孢桿菌RNA酶是毒性極高的蛋白質(zhì),可通過將不同數(shù)目的選擇者密碼子引入到芽孢桿菌RNA酶基因內(nèi)和/或使用可誘導(dǎo)啟動子來控制負(fù)選擇的嚴(yán)格性。在另一實施例中,選擇或篩選試劑的濃度(如氨芐青霉素的濃度)可以不同。在本發(fā)明的一些方面,因為在前幾輪中所需活性較低,嚴(yán)格性可以不同。因此,前幾輪適用較低的嚴(yán)格性篩選標(biāo)準(zhǔn),而后幾輪選擇適用更嚴(yán)謹(jǐn)?shù)臉?biāo)準(zhǔn)。在某些實施方式中,負(fù)選擇、正選擇或者正負(fù)選擇可重復(fù)多次。也可使用多個不同的負(fù)選擇標(biāo)記、正選擇標(biāo)記或正負(fù)選擇標(biāo)記。在某些實施方式中,正選擇標(biāo)記和負(fù)選擇標(biāo)記可以相同。其他類型的選擇/篩選方法也可用于本發(fā)明以制備正交翻譯組分,如O-tRNA、O-RS和能對選擇者密碼子起反應(yīng)而加載非天然氨基酸的0-tRNA/0-RS配對。例如,負(fù)選擇標(biāo)記、正選擇標(biāo)記或正負(fù)選擇標(biāo)記可包括發(fā)熒光的或在合適反應(yīng)物存在下能催化發(fā)光反應(yīng)的標(biāo)記。在另一實施方式中,可通過熒光激活細(xì)胞分選(FACS)或發(fā)光檢測標(biāo)記的產(chǎn)物。標(biāo)記任選可包括親和篩選標(biāo)記。也參見Francisco,J.A.等(1993》"/Voc/mc"owaw<i,omscewce-ac"v她(ie;c&ma/犯r/ace(在外表面表達(dá)功能性抗體片段的大腸桿菌的制備與熒光激活細(xì)胞分選)",ProcNatlAcadSciUSA.,90:10444-8。制備重組正交tRNA的其它方法可見,例如名為"METHODSANDCOMPOSITIONSFORTHEPRODUCTIONOFORTHOGONALtRNAAMINOACYL-tRNASYNTHETASEPAIRS(制備正交tRNA-氨酰-tRNA合成酶配對的方法和組合物)"的國際申請公開號WO2002/086075;名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴(kuò)展真核生物遺傳密碼)"的WO2004/094593;與2004年7月7日提交的WO2005/019415。也參見Forster等,(2003),"iVograww/"g/e/"t/ow/me"c■sywf/ze^wesfnms7a""g爐"/cco<^(ie^g"ec/<ie"ovo(通過箭l譯從頭設(shè)計的遺傳密碼來編程肽模擬合成酶)",PNAS,100(11):6353-6357;和Feng等,(2003),c/zcmge(通過單氨基酸改變擴(kuò)大tRNA合成酶的tRNA識別)",PNAS,100(10):5676-5681。正交氨酰-tRNA合成酶(O-RS)本發(fā)明的O-RS在體外或體內(nèi)優(yōu)先用非天然氨基酸氨?;疧-tRNA。可通過含O-RS的多肽和/或編碼O-RS或其部分的多核苷酸將本發(fā)明的O-RS提供給翻譯系統(tǒng),如細(xì)胞。例如,示例性O(shè)-RS包含選自SEQIDNO:57-101的氨基酸序列或其保守變體。在另一實施例中,O-RS或其部分是由編碼本文序列表和實施例所示的氨基酸序列的多核苷酸序列或其互補多核苷酸序列編碼??蓞⒁姡邕x自SEQIDNO:8-56的多核苷酸。鑒定可與O-tRNA—起應(yīng)用的正交氨酰-tRNA合成酶(O-RS),例如O-RS的方法也是本發(fā)明的特征之一。例如,一種方法包括選擇(如正選擇)第一物種的細(xì)胞群,其中所述細(xì)胞各自含有1)多種氨酰-tRNA合成酶(RS)的成員之一(例如,所述多種RS可包括突變型RS、衍生自第一物種之外的物種的RS,或突變型RS和衍生自第一物種之外的物種的RS二者);2)正交tRNA(O-tRNA)(例如,一個或多個物種的);以及3)編碼選擇(例如正選擇)標(biāo)記并含有至少一個選擇者密碼子的多核苷酸。與缺乏所述多種RS的成員或成員數(shù)目少的細(xì)胞相比,選擇或篩選顯示抑制效率提高的那些細(xì)胞??捎帽绢I(lǐng)域已知和本文所述的方法測定抑制效率。抑制效率提高的細(xì)胞包含能氨酰化O-tRNA的活性RS。將第一物種的第一組tRNA的活性RS氨?;乃?體外或體內(nèi))與第二物種的第二組tRNA被活的RS氨酰化的水平作比較。通過可檢測物質(zhì)(例如,標(biāo)記的非天然氨基酸)測定氨酰化水平。通常選擇與第一組tRNA相比更有效地氨?;诙MtRNA的活性RS,從而獲得能與O-tRNA聯(lián)用的有效(如優(yōu)化)正交氨酰-tRNA合成酶。采用這種方法鑒定的O-RS也是本發(fā)明的特征之一。可用許多試驗來測定氨?;?。這些試驗可在體外或體內(nèi)進(jìn)行。例如,體外氨?;囼灴梢娎鏗oben和Soll,(1985),MethodsEnzymol.,113:55-59。也可聯(lián)用報道分子和正交翻譯組分并檢測細(xì)胞中的報道分子來測定氨?;?,所述細(xì)胞表達(dá)含有至少一個選擇者密碼子并編碼某蛋白質(zhì)的多核苷酸。也參見名為"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS(非天然氨基酸的體內(nèi)摻入)"的WO2002/085923和名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴(kuò)展真核生物遺傳密碼)"的WO2004/094593。還可進(jìn)一步改造鑒定的O-RS以改變該合成酶的底物特異性,從而使得O-tRNA只加載上所需的非天然氨基酸,而不是任何常見的20種氨基酸。產(chǎn)生對非天然氨基酸具有底物特異性的正交氨酰tRNA-合成酶的方法包括,例如通過組合合成酶的不同結(jié)構(gòu)域而使合成酶在其活性位點、在其編輯機(jī)制位點、在不同位點發(fā)生突變等,并應(yīng)用選擇方法。也可以采用先正選擇再負(fù)選擇的方案。在正選擇中,抑制引入陽性標(biāo)記的一個或多個非重要位置的選擇者密碼子使得細(xì)胞在正選擇壓力下存活。在同時有天然和非天然氨基酸存在時,如此存活的細(xì)胞編碼使正交抑制itRNA帶有天然或非天然氨基酸的活性合成酶。在負(fù)選擇中,抑制引入陰性標(biāo)記的一個或多個非重要位置的選擇者密碼子使合成酶失去天然氨基酸特異性。經(jīng)正、負(fù)選擇而存活的細(xì)胞編碼只用非天然氨基酸氨?;?加載)正交抑制子tRNA的合成酶。然后通過例如DNA改組或其它遞歸誘變方法進(jìn)一步誘變這些合成酶??刹捎帽绢I(lǐng)域已知的各種誘變技術(shù)產(chǎn)生突變型O-RS文庫。例如,可用位點特異性突變、隨機(jī)點突變、同源重組、DNA改組或其它遞歸誘變方法,嵌合構(gòu)建或它們的組合來制備突變型RS。例如,可從兩種或更多種其它如較小、多樣性較低的"亞文庫"來制備突變型RS文庫。本發(fā)明也包括RS的嵌合文庫。應(yīng)注意,可以構(gòu)建各種生物(例如微生物,如真細(xì)菌或古細(xì)菌)的tRNA合成酶文庫,例如具有天然多樣性的文庫(參見,例如授予Short等的美國專利號6,238,884;授予Schallenberger等的美國專利號5,756,316;授予Petersen等的美國專利號5,783,431;授予Thompson等的美國專利號5,824,485;授予Short等的美國專利號5,958,672),并任選構(gòu)建和篩選正交配對。一旦合成酶經(jīng)歷正和負(fù)選擇/篩選方法,就可進(jìn)一步誘變這些合成酶。例如可分離編碼O-RS的核酸;從該核酸產(chǎn)生編碼突變O-RS的一組多核苷酸(例如通過隨機(jī)誘變、位點特異性誘變、重組或它們的任何組合);可重復(fù)各步驟或各步驟的組合直至獲得優(yōu)先用非天然氨基酸氨酰化O-tRNA的突變O-RS。在本發(fā)明的一些方面,這些步驟可進(jìn)行多次,例如至少兩次。本發(fā)明方法也可采用其它水平的選擇/篩選嚴(yán)格性來產(chǎn)生O-tRNA、O-RS或其配對。可改變O-RS產(chǎn)生方法中一個或兩個步驟的選擇或篩選嚴(yán)格性。這包括,例如,改變選擇/篩選試劑的用量等。也可額外進(jìn)行幾輪正和/或負(fù)選擇。選擇或篩選也可包括以下一種或多種改變氨基酸滲透性、翻譯效率、翻譯保真度(tmnslationalfidelity)等。一種或多種改變通常依據(jù)用正交tRNA-tRNA合成酶配對來產(chǎn)生蛋白質(zhì)的生物中一種或多種基因突變。產(chǎn)生O-RS并改變合成酶底物特異性的其它常規(guī)細(xì)節(jié)見名為"METHODSANDCOMPOSITIONSFORTHEPRODUCTIONOFORTHOGONALtRNAAMINOACYL-tRNASYNTHETASEPAIRS(產(chǎn)生正交tRNA-氨?;鵷RNA合成酶配對的方法和組合物)"的WO2002/086075和名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴(kuò)展真核生物遺傳密碼)"的WO2004/094593。也可參見Wang和Schultz,"ExpandingtheGeneticCode(擴(kuò)展遺傳密碼)",Jwgewaw^eC/zem/e/W.£d,44(1):34-66(2005),其內(nèi)容以引用方式全文納入。來源和宿主生物本發(fā)明正交翻譯組分(O-tRNA和O-RS)可得自任何生物(或生物的組合),可用于任何其它物種的宿主翻譯系統(tǒng),只要所述O-tRNA/O-RS組分與宿主系統(tǒng)能以正交方式起作用。某正交配對中的O-tRNA和O-RS無需得自同一生物。在一些方面,正交組分得自用于哺乳動物宿主系統(tǒng)(如嚙齒動物或靈長動物宿主系統(tǒng))的大腸桿菌(即,真細(xì)菌)基因。例如,正交O-tRNA可衍生自古菌生物,例如古細(xì)菌,如詹氏甲垸球菌、嗜熱堿甲垸桿菌;鹽細(xì)菌,如沃氏富鹽菌和鹽細(xì)菌種A^C-/;閃爍古生球菌、激烈火球菌、極端嗜熱古菌、嗜熱泉生古細(xì)菌、海沼甲烷球菌、甲烷嗜高熱菌(M^z^o/7F^fe^^/en;;、梅氏甲垸八疊球菌(Mm)、耐超高溫?zé)岚艟?7>"o6acM/wmGwo/7/n7ww」、深?;鹎蚓?、硫磺礦硫化葉菌(&)、超嗜熱古菌G^/yb/o/^to/^^/;、嗜酸熱原體、火山熱原體等;或真細(xì)菌,如大腸桿菌、嗜熱棲熱菌、枯草芽胞桿菌(^flc///^^&//&)、嗜熱脂肪芽孢桿菌等;而正交O-RS可得自以下生物(或生物的組合),例如古細(xì)菌,如詹氏甲烷球菌、嗜熱堿甲垸桿菌;鹽細(xì)菌,如沃氏富鹽菌和鹽細(xì)菌種A^CW;閃爍古生球菌、激烈火球菌、極端嗜熱古菌、嗜熱泉生古細(xì)菌、海沼甲垸球菌、甲烷嗜高熱菌、梅氏甲烷八疊球菌、耐超高溫?zé)岚艟?、深?;鹎蚓?、硫磺礦硫化葉菌、超嗜熱古菌、嗜酸熱原體、火山熱原體等;或真細(xì)菌,如大腸桿菌、嗜熱棲熱菌、枯草芽胞桿菌、嗜熱脂肪芽孢桿菌等。在一個實施方式中,真核生物來源,例如植物、藻類、原生動物、真菌、酵母菌、動物(例如哺乳動物、昆蟲、節(jié)肢動物等)等也可用作O-tRNA和O-RS的來源。O-tRNA/0-RS配對的各組分可得自同一生物或不同生物。在一個實施方式中,0-tRNA/0-RS配對可來自同一生物?;蛘撸琌-tRNA/0-RS配對的O-tRNA和O-RS可來自不同生物。O-tRNA、O-RS或O-tRNA/0-RS配對可在體內(nèi)或體外選擇或篩選和/或可用于細(xì)胞,例如哺乳動物細(xì)胞,如嚙齒動物或靈長動物細(xì)胞,從而產(chǎn)生含有非天然氨基酸的多肽。不特別限制所用的哺乳動物宿主細(xì)胞。含本發(fā)明翻譯組分的哺乳動物細(xì)胞組合物也是本發(fā)明特征之一。為在一種生物中篩選O-tRNA和/或O-RS以用于另一種生物,也可參見2004年4月16日提交的名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴(kuò)展真核生物遺傳密碼)"的國際申請公布號WO2004/094593。雖然正交翻譯系統(tǒng)(例如,含有O-RS、O-tRNA和非天然氨基酸)可利用培養(yǎng)的宿主細(xì)胞產(chǎn)生含非天然氨基酸的蛋白質(zhì),但并非要求本發(fā)明的正交翻譯系統(tǒng)需要完整的、有活力的宿主細(xì)胞。例如,在細(xì)胞提取物存在下,正交翻譯系統(tǒng)可利用無細(xì)胞系統(tǒng)。實際上,使用無細(xì)胞的體外轉(zhuǎn)錄/翻譯系統(tǒng)產(chǎn)生蛋白質(zhì)是公認(rèn)的技術(shù)。利用本文所述的正交翻譯系統(tǒng)組分,使這些體外系統(tǒng)適用于產(chǎn)生含非天然氨基酸的蛋白質(zhì)也屬于本發(fā)明的范圍。選擇者密碼子本發(fā)明的選擇者密碼子擴(kuò)大了蛋白質(zhì)生物合成機(jī)理的遺傳密碼子框架。例如,選擇者密碼子包括,如獨特的三堿基密碼子、無義密碼子(如終止密碼子(如琥珀密碼子(UAG)或乳白密碼子(UGA)))、非天然密碼子、至少四堿基的密碼子、罕用密碼子等??蓪⒃S多選擇者密碼子引入所需基因,例如一個以上、兩個以上、三個以上等。利用不同的選擇者密碼子,可利用多對正交tRNA/合成酶配對,從而能利用這些不同的選擇者密碼子同時位點特異性地?fù)饺攵鄠€非天然氨基酸,例如包含至少一個非天然氨基酸。在一個實施方式中,這些方法包括利用作為終止密碼子的選擇者密碼子在細(xì)胞中體內(nèi)摻入非天然氨基酸。例如,制備能識別終止密碼子的O-tRNA,并由O-RS用非天然氨基酸氨酰化該O-tRNA。宿主的天然氨酰-tRNA合成酶不識別該O-tRNAc可采用常規(guī)的定點誘變將終止密碼子引入編碼感興趣多肽的多核苷酸中感興趣的位點??蓞⒁?,例如Sayers,J.R.等,(1988),"5',3'Exonucleaseinphosphorothioate-basedoligonucleotide-directedmutagenesis(硫代磷酸酯寡核苷酸定向誘變中的5,,3'核酸外切酶)",泡c/e/cJc/&b,791-802。當(dāng)例如在體內(nèi)聯(lián)用O-RS、O-tRNA和編碼感興趣多肽的核酸時,可對終止密碼子起反應(yīng)而摻入非天然氨基酸,從而獲得在特定位點含有非天然氨基酸的多肽。在本發(fā)明的一個實施方式中,用作選擇者密碼子的終止密碼子是琥珀密碼子UAG和/或乳白密碼子UGA。在一實施例中,UAG和UGA都用作選擇者密碼子的遺傳密碼可編碼22個氨基酸,同時保留赭石無義密碼子,UAA,其是最豐富的終止信號。體內(nèi)摻入非天然氨基酸不會顯著干擾宿主細(xì)胞。例如,在非真核細(xì)胞,如大腸桿菌中,由于UAG密碼子的抑制效率依賴于O-tRNA(如琥珀抑制子tRNA)與釋放因子l(RFl)(其可結(jié)合UAG密碼子,進(jìn)而引起延伸中的肽從核糖體釋放)之間的競爭,因此可通過,例如提高O-tRNA(如抑制子tRNA)的表達(dá)水平,或利用RF1缺陷型菌株調(diào)節(jié)抑制效率。在真核細(xì)胞中,由于UAG密碼子的抑制效率依賴于O-tRNA(如琥珀抑制子tRNA)和真核釋放因子(如eRF)(其可結(jié)合終止密碼子,進(jìn)而引起延伸中的肽從核糖體釋放)之間的競爭,因此可通過,例如提高O-tRNA(如抑制子tRNA)的表達(dá)水平調(diào)節(jié)抑制效率。此外,也可存在其它化合物,例如還原劑,如二硫蘇糖醇(DTT)。非天然氨基酸也可由罕用密碼子編碼。例如,當(dāng)體外蛋白合成反應(yīng)中的精氨酸濃度下降時,證實罕用的精氨酸密碼子AGG可利用丙氨酸酰化的合成tRNA而有效插入ala??蓞⒁奙a等,Aoc/zew&^y,32:7939(1993)。在此情況中,合成tRNA可與大腸桿菌中作為次要成分存在的天然tRNAAfg競爭。此外,一些生物不能利用所有三聯(lián)密碼子。已可在體外轉(zhuǎn)錄/翻譯提取物中利用藤黃微球菌(^f/crococa^/w&w)的未指定密碼子AGA插入氨基酸。可參見,例如Kowal和Oliver,7Vwc/.,25:4685(1997)??僧a(chǎn)生本發(fā)明的各組分以體內(nèi)利用這些罕用密碼子。選擇者密碼子也可包括延伸密碼子,例如四個或四個以上堿基的密碼子,如四個、五個、六個或更多堿基的密碼子。四堿基密碼子的例子包括,CCCU等。五堿基密碼子的例子包括,例如AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本發(fā)明方法可包括使用基于移碼抑制的延伸密碼子。四個或四個以上堿基的密碼子可將例如一個或多個非天然氨基酸插入同一蛋白質(zhì)。在其它實施方式中,反密碼子環(huán)可解碼例如至少一種四堿基密碼子、至少一種五堿基密碼子或至少一種六堿基密碼子或更多。由于可能的四堿基密碼子有256種,所以同一細(xì)胞中可用四個或四個以上堿基的密碼子編碼多種非天然氨基酸。也可參見,Anderson等,(2002),"ExploringtheLimitsofCodonandAnticodonSize(密碼子和反密碼子大小極限的研究)",C/zem/^o;朋d5/o/ogy,9:237-244禾口Magliery,(2001),"ExpandingtheGeneticCode:SelectionofEfficientSuppressorsofFour-baseCodonsandIdentificationof"Shifty"Four-baseCodonswithaLibraryApproachinEscherichiacoli(擴(kuò)增遺傳密石馬在大腸桿菌中選擇有效的四堿基密碼子抑制劑并用文庫方法鑒定"變化的"四堿基密碼子)",乂Mo/.5/o/.,307:755-769。例如,已采用體外生物合成方法利用四堿基密碼子將非天然氨基酸摻入蛋白質(zhì)。參見,例如Ma等,(1993),A'oc/z簡.勿,32:7939和Hohsaka等,(1999),J爿m.C/zem.Soc.,121:34。聯(lián)用CGGG和AGGU及兩種化學(xué)?;囊拼a抑制子tRNA在體外將2-萘基丙氨酸和賴氨酸的NBD衍生物同時摻入鏈霉親和素??蓞⒁?,例如Hohsaka等,(1999),」m.C/zem.Soc.,121:12194。在體內(nèi)研究中,Moore等檢測了含NCUA反密碼子的tRNA"11衍生物抑制UAGN密碼子(N可以是U、A、G或C)的能力,發(fā)現(xiàn)含UCUA反密碼子的tRNA"u能解碼四聯(lián)UAGA,其效率為13到26%,而在0或-l讀框中幾乎不解碼??蓞⒁奙oore等,(2000),/JIA/.所o/.,298:195。在一個實施方式中,本發(fā)明可利用基于罕用密碼子或無義密碼子的延伸密碼子,它們能降低在其它不期望位點的錯義連讀(missensereadthrough)和移碼抑制。四堿基密碼子已在各種正交系統(tǒng)中用作選擇者密碼子。可參見,例如,WO2005/019415;WO2005/007870和WO2005/07624。也可參見Wang和Schultz,"ExpandingtheGeneticCode(擴(kuò)展遺傳密碼)",C/zem/e/W.,44(1):34-66(2005),其內(nèi)容通過引用的方式全文納入。雖然以下例子利用琥珀選擇者密碼子,但通過改進(jìn)本文的實例使之包含四堿基O-tRNA和經(jīng)修飾包含與之前描述的各非天然氨基酸O-RS的突變相似的突變的合成酶,也可使用四堿基或更多堿基的密碼子。對于給定系統(tǒng),選擇者密碼子還可包括天然三堿基密碼子中內(nèi)源性系統(tǒng)不用(或很少用)的那個天然堿基密碼子。例如,這包括缺乏能識別該天然三堿基密碼子的tRNA的系統(tǒng),和/或該三堿基密碼子是罕用密碼子的系統(tǒng)。選擇者密碼子任選包含非天然堿基對。這些非天然堿基對進(jìn)一步擴(kuò)大了現(xiàn)有的遺傳字符集(geneticalphabet)。一種額外的堿基對可將三聯(lián)密碼子的數(shù)目從64增加至125。第三堿基對的特性包括穩(wěn)定和選擇性的堿基配對,利用聚合酶高保真地有效酶促摻入DNA,新生非天然堿基對合成后引物繼續(xù)有效延伸。適用于這些方法和組合物的非天然堿基對的描述包括例如Hirao等,(2002),"Anunnaturalbasepairforincorporatingaminoacidanaloguesintoprotein(將氨基酸類似物摻入蛋白質(zhì)的非天然堿基對)",Atoz^e5/o&c/mo/ogy,20:177-182。也可參見Wu,Y.等,(2002),,力w.CTzem.Soc.,124:14626-14630。下文列出了其它的相關(guān)出版物。對于體內(nèi)使用,非天然核苷是膜可滲透的,并可磷酸化形成相應(yīng)的磷酸三酯。此外,增加的遺傳信息穩(wěn)定且不為細(xì)胞酶所破壞。Benner與他人先前的工作利用了不同于經(jīng)典Watson-Crick配對的氫鍵模式,其中最值得注意的例子是異-C:異-G配對(iso-C:iso-Gpair)。參見,例如Switzer等,(1989),/Jw.C/z纖,<Soc.,111:8322;Piccirilli等,(1990),淑臟,343:33;Kool,(2000),Cw/r.(9;/".CAem.5/o/.,4:602。這些堿基通常與天然堿基有一定程度的錯配,因而不能酶促復(fù)制。Kool和同事證明,堿基間的疏水包裝相互作用(hydrophobicpackinginteraction)可替代氫鍵以驅(qū)動堿基對形成。參見Kool,(2000),Cwr.pp/".CAem.所o/.,4:602;Guckian和Kool,(1998),C/zem.五d.£"g/.,36:2825。在致力于開發(fā)符合以上所有要求的非天然堿基對的過程中,Schultz、Romesberg和同事已系統(tǒng)地合成并研究了一系列非天然疏水堿基。發(fā)現(xiàn)PICS:PICS自身配對比天然堿基對更穩(wěn)定,并可用大腸桿菌DNA聚合酶I的Klenow片段(KF)有效地?fù)饺隓NA??蓞⒁?,例如McMinn等,(1999),乂爿m.C/zew.,121:11586;和Ogawa等,(2000),/力m.C/zew.Soc.,122:3274。就生物學(xué)功能而言,KF合成3MN:3MN自身配對的效率和選擇性足夠。可參見,例如Ogawa等,(2000),C/zem.Soc.,122:88Q3。然而,這兩種堿基均作為進(jìn)一步復(fù)制的鏈終止子而起作用。近來開發(fā)了可用于復(fù)制PICS自身配對的突變型DNA聚合酶。此外,可復(fù)制7AI自身配對??蓞⒁?,例如Tae等,(2001),/爿附,C/zem.Soc.,123:7439。還已開發(fā)了與Cu(II)結(jié)合后可形成穩(wěn)定配對的金屬堿基(metallobase)對Dipis:Py??蓞⒁?,Meggers等,(2000),顛.C/ze肌Soc.,122:10714。因為延伸密碼子和非天然密碼子在本質(zhì)上與天然密碼子正交,所以本發(fā)明方法可利用該特性產(chǎn)生它們的正交tRNA。還可利用翻譯旁路系統(tǒng)將非天然氨基酸摻入所需多肽。在翻譯旁路系統(tǒng)中,可將一個大序列插入基因,但該序列不翻譯成蛋白質(zhì)。該序列含有可作為提示的結(jié)構(gòu),從而能誘導(dǎo)核糖體跳過該序列然后恢復(fù)該插入序列的下游翻譯。非天然氨基酸本文所用的非天然氨基酸指除硒代半胱氨酸和/或吡咯賴氨酸和以下20種遺傳編碼的a-氨基酸以外的任何氨基酸、修飾的氨基酸或氨基酸類似物丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸、纈氨酸。a-氨基酸的通用結(jié)構(gòu)如式I所示<formula>formulaseeoriginaldocumentpage47</formula>非天然氨基酸一般具有式I所示的任何結(jié)構(gòu),其中R基團(tuán)是除20種天然氨基酸中所用以外的任何取代基。20種天然氨基酸的結(jié)構(gòu)可參見,例如《生物化學(xué)》(Biochemistry),L.Stryer編,第三版,1988,福里曼公司(FreemanandCompany),紐約。注意,本發(fā)明的非天然氨基酸可以是除以上20種a-氨基酸以外的天然化合物。由于本發(fā)明的非天然氨基酸與天然氨基酸通常區(qū)別在側(cè)鏈,所以非天然氨基酸與其它氨基酸(例如天然或非天然的)形成酰胺鍵的方式與天然蛋白質(zhì)中酰胺鍵的形成方式相同。然而,非天然氨基酸的側(cè)鏈不同于天然氨基酸的側(cè)鏈。雖然本文所述實施例中主要感興趣的是圖l所示的非天然氨基酸,但并非要將本發(fā)明嚴(yán)格限制于這些結(jié)構(gòu)。實際上,不難制備各種易于獲得且結(jié)構(gòu)相關(guān)的類似物,這些類似物保留產(chǎn)生它們的結(jié)構(gòu)(即圖1所示結(jié)構(gòu))的主要特性,而且本文參考的氨酰-tRNA合成酶(例如,SEQIDNO:57-101所示O-RS)還特異性識別這些類似物。這些相關(guān)的氨基酸類似物屬于本發(fā)明的范圍。在其它非天然氨基酸中,例如式I中的R可任選含有垸基-、芳基-、?;?、肼、氰基-、鹵代-、酰肼、烯基、醚、硼酸基(borate)、硼酸酯基(boronate)、磷、膦?;㈧?、烯酮、亞胺、酯、羥胺、胺等,或上述基團(tuán)的任何組合。感興趣的其它非天然氨基酸包括但不限于含光可活化交聯(lián)劑的氨基酸、自旋-標(biāo)記的氨基酸、熒光氨基酸、金屬結(jié)合氨基酸、含金屬的氨基酸、放射性氨基酸、含有新官能團(tuán)的氨基酸、能與其它分子共價或非共價相互作用的氨基酸、光鎖定(photocaged)和/或光致異構(gòu)(photoisomerizable)的氨基酸、含生物素或生物素類似物的氨基酸、含酮基的氨基酸、糖基化的氨基酸、與氨基酸側(cè)鏈相連的糖部分、含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、化學(xué)方法可切割或光可切割的氨基酸、與天然氨基酸相比側(cè)鏈延長的氨基酸(如聚醚或長鏈烴,如超過約5個、約10個碳原子等)、含碳連接糖的氨基酸、含氨基硫代酸的氨基酸以及含一個或多個毒性部分的氨基酸。本發(fā)明另一方面提供具有以下式IV所示通用結(jié)構(gòu)的非天然氨基酸具有此結(jié)構(gòu)的非天然氨基酸一般可以是任何結(jié)構(gòu),其中&是20種天然氨基酸之一(例如,酪氨酸或苯丙氨酸)所用的取代基,R2是取代基。因此,此類非天然氨基酸可視作天然氨基酸衍生物。除了含有圖1所示非天然氨基酸結(jié)構(gòu)外,非天然氨基酸還可任選含有經(jīng)修飾的骨架結(jié)構(gòu),例如式II和III所示的結(jié)構(gòu)<formula>formulaseeoriginaldocumentpage49</formula>其中,Z—般包含OH、NH2、SH、NH-R'或S-R';X和Y可以相同或不同,一般包含S或O,R和R'可任選相同或不同,通常選自與上述式I所示非天然氨基酸的R基團(tuán)相同的組成以及氫。例如,本發(fā)明的非天然氨基酸還任選在式II和III所示氨基或羧基中包含取代基。該類型的非天然氨基酸包括但不限于例如含有20種常見氨基酸的相應(yīng)側(cè)鏈或非天然側(cè)鏈的a-羥酸、a-硫代酸、a-氨基硫代羧酸酯等。另外,a碳上的取代基還任選包括L、D或a-a-雙取代氨基酸,如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它替代結(jié)構(gòu)包括環(huán)形氨基酸,如脯氨酸類似物以及3、4、6、7、8和9元環(huán)脯氨酸類似物,(3和Y氨基酸,如取代的P丙氨酸和Y-氨基丁酸。在一些方面,本發(fā)明使用L-構(gòu)型的非天然氨基酸。然而,本發(fā)明并非僅限于使用L-構(gòu)型的非天然氨基酸。還考慮了這些非天然氨基酸的D-對映體可用于本發(fā)明。本發(fā)明所用的非天然氨基酸不嚴(yán)格局限于圖1所示的非天然氨基酸。本領(lǐng)域技術(shù)人員知道不難獲得天然氨基酸的各種非天然類似物。例如,但不限于不難制備衍生自苯丙氨酸或酪氨酸的非天然氨基酸。酪氨酸類似物包括,例如對位取代的酪氨酸、鄰位取代的酪氨酸和間位取代的酪氨酸,其中該取代的酪氨酸含有炔基、乙?;?、苯甲?;?、氨基、肼、羥胺、巰基、羧基、異丙基、甲基、C6-C2C直鏈或支鏈烴、飽和或不飽和的烴、0-甲基、聚醚基團(tuán)、硝基等。此外,也包括多取代的芳環(huán)。本發(fā)明的谷氨酰胺類似物包括但不限于a-羥基衍生物、y-取代的衍生物、環(huán)形衍生物和酰胺取代的谷氨酰胺衍生物。苯丙氨酸類似物的例子包括但不限于對位取代的苯丙氨酸、鄰位取代的苯丙氨酸和間位取代的苯丙氨酸,其中所述取代基含有炔基、羥基、甲氧基、甲基、烯丙基、醛基、硝基、巰基或酮基等。非天然氨基酸的具體例子包括但不限于磺基酪氨酸、對-乙基硫代羰基-L-苯丙氨酸、對-(3-氧代丁?;?-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素氨基酸、7-羥基-香豆素氨基酸、硝基芐基-絲氨酸、0-(2-硝基芐基)丄-酪氨酸、對-羧甲基-L-苯丙氨酸、對-氰基-L-苯丙氨酸、間-氰基-L-苯丙氨酸、聯(lián)苯基丙氨酸、3-氨基-L-酪氨酸、聯(lián)吡啶基丙氨酸、對-(2-氨基-l-羥乙基)-L-苯丙氨酸、對-異丙基硫代羰基-L-苯丙氨酸、3-硝基-L-酪氨酸和對-硝基-L-苯丙氨酸。還包括對-炔丙氧基苯丙氨酸、3,4-二羥基-L-苯丙氨酸(DHP)、3,4,6-三羥基-L-苯丙氨酸、3,4,5-三羥基-L-苯丙氨酸、4-硝基-苯丙氨酸、對-乙?;?L-苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、0-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、3-硝基-酪氨酸、3-巰基-酪氨酸、三-0-乙酰基-GlcNAc(3-絲氨酸、L-多巴(Dopa)、氟化苯丙氨酸、異丙基-L-苯丙氨酸、對-疊氮基-L-苯丙氨酸、對-?;?L-苯丙氨酸、對-苯甲?;?L-苯丙氨酸、L-磷酸絲氨酸、膦酰絲氨酸、膦酰酪氨酸、對-碘代-苯丙氨酸、對-溴代苯丙氨酸、對-氨基-L-苯丙氨酸以及異丙基-L-苯丙氨酸等。本文引用的參考文獻(xiàn)披露了各種非天然氨基酸的結(jié)構(gòu)。還可參見國際申請公開號WO2004/094593,題為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴(kuò)展真核遺傳密碼)"和2005年10月27日提交的國際申請PCT/US2005/039210,題為"ORTHOGONALTRANSLATIONCOMPONENTSFORTHE,(9INCORPORATIONOFUNNATURALAMINOACIDS(體內(nèi)掾入非天然氨基酸的正交翻譯組分)"。非天然氨基酸的化學(xué)合成上述許多非天然氨基酸可以從,例如美國的西格瑪公司(Sigma)或美國威斯康星州密爾沃基市的阿爾得里奇公司(Aldrich)等購得。那些不能商品化購得的非天然氨基酸可任選如各種出版物所述或采用本領(lǐng)域技術(shù)人員己知的標(biāo)準(zhǔn)方法合成。有機(jī)合成技術(shù)可參見,例如Fessendon和Fessendon,OrganicChemistry(有機(jī)化學(xué)),(1982,第二版,威拉德格蘭特出版社(WillardGrantPress),波士頓,馬薩諸塞州);March,AdvancedOrganicChemistry(高級有機(jī)化學(xué))(第三版,1985,威立父子公司(WileyandSons),紐約);以及Carey和Sundberg的AdvancedOrganicChemistry(高級有機(jī)化學(xué))(第三版,A和B部分,1990,普萊納姆出版社(PlenumPress),紐約)。其它描述非天然氨基酸合成的出版物包括名為"非天然氨基酸的體內(nèi)摻入"的國際專利申請WO2002/085923;Matsoukas等,(1995)J!MedCAem.,38,4660-4669;King和Kidd,(1949)"ANewSynthesisofGlutamineandofDipeptidesofGlutamicAcidfromPhthylatedIntermediates"(從令卩苯二甲?;虚g體合成谷氨酰胺和y-二肽的新方法)./C/zem.Soc.,3315-3319;Friedman禾口Chatterrji,(1959)"SynthesisofDerivativesofGlutamineasModelSubstratesforAnti-tumorAgents(合成谷氨酰胺衍生物作為抗腫瘤藥物的模擬底物)".J^w.C/zem.Soc.81,3750-3752;Craig等,(1988)"AbsoluteConfigurationoftheEnantiomersof7-Chloro-4amino]quinoline(Chloroquine)(7-氯-4[[4-(二乙基氨基)-l-甲基丁基]氨基]喹啉(氯喹)對映體的絕對構(gòu)型)".,Og.CZzem.53,1167-1170;Azoulay等(1991)"GlutamineanaloguesasPotentialAntimalarials(谷氨酰胺類似物作為潛在的抗癥藥)",五wr乂Met/.C/zem.26:201-205;Koskinen禾口Rapoport,H.(1989)"Synthesisof4-SubstitutedProlinesasConformationallyConstrainedAminoAcidAnalogues(合成4-取代的月甫氨酸作為構(gòu)象約束的氨基酸類似物)".乂Og.CTzem.54:1859-1866;Christie禾口Rapoport(1985)"SynthesisofOpticallyPurePipecolatesfromL-Asparagine.ApplicationtotheTotalSynthesisof(+)-ApovincaminethroughAminoAcidDecarbonylationandIminiumIonCyclization(從L-天冬酰月安合成光學(xué)純的哌啶酸酯,應(yīng)用于通過氨基酸脫羰基和亞氨鏡離子環(huán)化總合成(+)-阿撲長春胺)".JOg.C&m.1989:1859-1866;Barton等,(1987)"SynthesisofNovela-Amino-AcidsandDerivativesUsingRadicalChemistry:SynthesisofL-andD-a-Amino-AdipicAcids,L-a-aminopimelicAcidandAppropriateUnsaturatedDerivatives(采用自由基化學(xué)方法合成新的a-氨基酸和衍生物合成L-和D-a氨基酸、L-a-氨基庚二酸以及合適的不飽和衍生物)".r"ra/ze^謂丄e".43:4297-4308;以及Subasinghe等,(1992)"Quisqualicacidanalogues:synthesisofbeta-heterocyclic2-aminopropanoicacidderivativesandtheiractivityatanovelquisqualate-sensitizedsite(使君子氨酸類似物|3-雜環(huán)2-氨基丙酸衍生物的合成及其在使君子氨酸敏化部位的活性)".J.^ed.C/zem.35:4602-7。還可參見2003年12月22日提交的名為"ProteinArrays(蛋白質(zhì)陣列)"的國際專利申請WO2004/058946。非天然氨基酸的細(xì)胞攝取細(xì)胞攝取非天然氨基酸通常是設(shè)計和選擇非天然氨基酸,例如用于摻入蛋白質(zhì)中應(yīng)考慮的問題之一。例如,a-氨基酸的高電荷密度提示這些化合物不可能透過細(xì)胞。天然氨基酸通過蛋白質(zhì)轉(zhuǎn)運系統(tǒng)的收集(作用)攝取入細(xì)胞,這些系統(tǒng)往往顯示程度不同的氨基酸特異性??蛇M(jìn)行快速篩選來評估細(xì)胞將攝取哪種非天然氨基酸(如果有的話)??蓞⒁姡?003年12月22日提交的名為"ProteinArrays(蛋白質(zhì)陣列)"的國際公布WO2004/058946中的毒性試驗;Liu禾口Schultz,(1999),"Progresstowardtheevolutionofanorganismwithanexpandedgeneticcode(含擴(kuò)增遺傳密碼的生物演化的進(jìn)展)",PNAS,96:4780-4785。雖然不難采用各種試驗分析攝取情況,但設(shè)計適合于細(xì)胞攝取途徑的非天然氨基酸的另一種方法是提供生物合成途徑,從而能在體內(nèi)產(chǎn)生氨基酸。非天然氨基酸的生物合成細(xì)胞中己有許多生物合成途徑來產(chǎn)生氨基酸和其它化合物。雖然自然界中,例如細(xì)胞中,可能不存在特定非天然氨基酸的生物合成方法,但本發(fā)明提供了這種方法。例如,通過加入新的酶或修飾現(xiàn)有的宿主細(xì)胞途徑可以在宿主細(xì)胞中任選產(chǎn)生非天然氨基酸的生物合成途徑。其它新的酶任選是天然產(chǎn)生的酶或人工開發(fā)的酶。例如,生物合成對氨基苯丙氨酸(如WO2002/085923(同上)中的實施例所示)依賴加入其它生物的已知酶的混合物。可通過用含這些酶的基因的質(zhì)粒轉(zhuǎn)染細(xì)胞而將這些基因引入細(xì)胞。當(dāng)這些基因在細(xì)胞中表達(dá)時,它們提供了合成所需化合物的酶途徑??扇芜x加入的酶類型的例子見以下實施例。其它酶序列見例如Genbank。也可以相同方式將人工開發(fā)的酶任選加入細(xì)胞??梢源朔绞讲倏丶?xì)胞機(jī)理和資源用以產(chǎn)生非天然氨基酸。實際上,可采用各種方法產(chǎn)生新的酶從而在體內(nèi)或體外用于生物合成途徑,改進(jìn)現(xiàn)有途徑,產(chǎn)生非天然氨基酸。開發(fā)酶和其它生物合成途徑組分的許多現(xiàn)有方法適用于本發(fā)明以產(chǎn)生非天然氨基酸(或者,實際上,用于開發(fā)合成酶使之具有新的底物特異性或其它感興趣的活性)。例如,可任選采用DNA改組來開發(fā)新的酶和/或這些酶的途徑,從而能在體外或體內(nèi)產(chǎn)生非天然氨基酸(或產(chǎn)生新的合成酶)??蓞⒁?,例如Stemmer,(1994),"RapidevolutionofaproteininvitrobyDNAshuffling(通過DNA改組在體外快速進(jìn)化蛋白質(zhì))",淑臟,370(4):389-391;Stemmer,(1994),"DNAshufflingbyrandomfragmentationandreassembly:Invitrorecombinationformolecularevolution(通過隨機(jī)斷裂和裝配的DNA改組分子進(jìn)化的體外重組)",iVoc.Wa".」cW.OSA,91:10747-10751。相關(guān)方法改組關(guān)聯(lián)的(例如同源的)基因家族,從而能快速開具有所需特性的酶。這種"家族基因改組"方法的例子見Crameri等,(1998),"DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolution(不同禾中類基因家方矣的DNA改組加速了定向進(jìn)化)",A^a"",391(6664):288-291。也可采用稱為"產(chǎn)生雜交酶的遞增截短"(ITCHY)的DNA重組方法來產(chǎn)生新的酶(無論是生物合成途徑組分或合成酶),例如Ostermeier等,(1999),"AcombinatorialapproachtohybridenzymesindependentofDNAhomology(不依賴DNA同源性的雜交酶的組合方法)",A^wre歷o&c/z,17:1205中所述。該方法也可用于產(chǎn)生用作一種或多種體外或體內(nèi)重組方法底物的酶或其它途徑變體的文庫。也可參見,Ostermeier等,(1999),"CombinatorialProteinEngineeringbyIncrementalTruncation(采用遞增截矢豆的組合蛋白質(zhì)工程)",尸亂淑/Jca"c/.,,96:3562-67;Ostermeier等,(1999),"IncrementalTruncationasaStrategyintheEngineeringofNovelBiocatalysts(作為工程改造新生物催化劑的方法的遞增截短)",5/0/0g/ca/a"ofMe&c/"a/C7z麵勿,7:2139-44。另一種方法采用指數(shù)集合誘變(exponentialensemblemutagenesis)來產(chǎn)生酶或其它途徑變體的文庫,其能例如催化與產(chǎn)生非天然氨基酸(或新合成酶)有關(guān)的生物合成反應(yīng)。在該方法中,平行地隨機(jī)選取(randomized)感興趣序列中的小基團(tuán)殘基,以在各不同位置鑒定可產(chǎn)生功能性蛋白質(zhì)的氨基酸。適用于本發(fā)明以產(chǎn)生新酶進(jìn)而產(chǎn)生非天然氨基酸(或新合成酶)的此類方法的例子見Delegrave和Youvan,(1993),5/o&c/z"o/ogyWe"arc/z,11:1548-1552。在另一方法中,利用摻雜或簡并寡核苷酸的隨機(jī)或半隨機(jī)誘變可用于工程改造酶和/或途徑成分,例如采用如以下文獻(xiàn)所述的通用誘變方法Arkin和Youvan,(1992),"Optimizingnucleotidemixturestoencodespecificsubsetsofaminoacidsforsemi-randommutagenesis"(優(yōu)化核苷酸混合物來編碼用于半隨機(jī)誘變的特定氨基酸亞組),5Zo&c/mo/ogy10:297-300;或Reidhaar-Olson等,(1991),"Randommutagenesisofproteinsequencesusingoligonucleotidecassettes"(用寡核苷酸盒隨機(jī)誘變蛋白質(zhì)序列),M^o&^7"mo/.,208:564-86。利用多核苷酸重裝配和位點飽和誘變的另一種方法(常稱為"非隨機(jī)"誘變)可用于產(chǎn)生酶和/或途徑組分,然后篩選它們行使一種或多種合成酶或生物合成途徑功能(例如在體內(nèi)產(chǎn)生非天然氨基酸)的能力??蓞⒁姡鏢hort,"NON-STOCHASTICGENERATIONOFGENETICVACCINESANDENZYMES(遺傳疫苗和酶的非隨機(jī)產(chǎn)生)",WO00/46344。這種突變方法的替代方法包括重組生物的整個基因組并選擇得到的后代的特定途徑功能(常稱為"全基因組改組")。該方法適用于本發(fā)明,例如通過基因組重組并選擇能夠產(chǎn)生非天然氨基酸(或其中間體)的生物(大腸桿菌或其它細(xì)胞)。例如,以下出版物所指導(dǎo)的方法可應(yīng)用于途徑設(shè)計,從而能開發(fā)細(xì)胞中現(xiàn)有和/或新的途徑進(jìn)而在體內(nèi)產(chǎn)生非天然氨基酸Patnaik等,(2002),"Genomeshufflingoflactobacillusforimprovedacidtolerance(乳酸桿菌基因組改組來提高酸耐受性)",A^化re歷o&cA"o/ogy,20(7):707-712;禾口Zhang等,(2002),"Genomeshufflingleadstorapidphenotypicimprovementinbacteria(基因組改組導(dǎo)致細(xì)菌表型快速改善)",A^rt^e,2月7日,415:644-646。其它可用于生物和代謝途徑工程改造(例如為產(chǎn)生所需化合物)的技術(shù)也適用于產(chǎn)生非天然氨基酸。指導(dǎo)有用的路徑工程改造方法的出版物的例子包括Nakamura禾卩White,(2003),"Metabolicengineeringforthemicrobialproductionof1,3propanediol(微生物生產(chǎn)1,3丙二醇的代謝工程)",C鮮.(9;z".所o,ec/zwo/,,14(5):454-9;Berry等,(2002),"ApplicationofMetabolicEngineeringtoimproveboththeproductionanduseofBiotechIndigo(應(yīng)用代謝工程來提高BiotechIndigo的生產(chǎn)和用途)",J/"c^Wn'a/M/cro6/o/ogyaw/5/o&c/mo/ogy,28:127-133;Banta等,(2002),"Optimizinganartificialmetabolicpathway:EngineeringthecofactorspecificityofCorynebacterium2,5-diketo-D-gluconicacidreductaseforuseinvitaminCbiosynthesis(優(yōu)化人工代謝途徑工程改造用于維生素C生物合成的棒狀桿菌2,5-二酮基-D-葡糖酸還原酶的輔助因子特異性)",5/oc/zem/^o;,41(20):6226-36;Selivonova等,(2001),"RapidEvolutionofNovelTraitsinMicroorganisms(微生物中新特性的快速進(jìn)化)",4////e(iami£>zv/romne"to/jVf/cro6/o/ogy,67:3645,和許多其它出版物。無論采用什么方法,用本發(fā)明工程改造的生物合成途徑產(chǎn)生的非天然氨基酸的濃度足以有效地生物合成蛋白質(zhì),例如天然細(xì)胞含量,但不應(yīng)達(dá)到顯著影響其它細(xì)胞氨基酸的濃度或耗盡細(xì)胞資源的程度。以此方式在體內(nèi)所產(chǎn)生的濃度一般為約10mM到約0.05mM。一旦細(xì)胞被工程改造從而產(chǎn)生了特定途徑所需的酶和非天然氨基酸,為了核糖體蛋白質(zhì)合成和細(xì)胞生長,可任選采用體內(nèi)選擇以進(jìn)一步優(yōu)化非天然氨基酸的產(chǎn)生。摻入非天然氨基酸的正交組分本發(fā)明提供制備正交組分從而能在體內(nèi)對選擇者密碼子,如琥珀終止密碼子、無義密碼子、四堿基或多堿基密碼子等起反應(yīng)而將圖1所示的非天然氨基酸摻入延伸的多肽鏈中的方法和組合物。例如,本發(fā)明提供了正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)及其配對。這些配對可用于將非天然氨基酸摻入延伸的多肽鏈中。本發(fā)明的組合物包含正交氨酰-tRNA合成酶(O-RS),所述O-RS優(yōu)先用圖1的非天然氨基酸氨?;疧-tRNA。在某些實施方式中,O-RS包含選自SEQIDNO:57-101的氨基酸序列及其保守變體。在本發(fā)明的某些實施方式中,O-RS優(yōu)先用特定的非天然氨基酸氨?;疧-tRNA勝過任何內(nèi)源性tRNA,其中所述O-RS對O-tRNA有偏好(bias),其中加載有非天然氨基酸的O-tRNA與加載有相同非天然氨基酸的內(nèi)源性tRNA的比例大于1:1,更優(yōu)選O-RS排他性地或者幾乎排他性地加載O-tRNA。含O-RS的組合物還可任選含有正交tRNA(O-tRNA),該O-tRNA識別選擇者密碼子。與包含本文序列表(例如,SEQIDNO:l)和實施例所列的多核苷酸序列或由其編碼的O-tRNA的抑制效率相比,在關(guān)聯(lián)合成酶存在下,本發(fā)明O-tRNA對選擇者密碼子起反應(yīng)而通常具有至少約,例如45%、50%、60%、75%、80%、90%或更高的抑制效率。在一個實施方式中,O-RS結(jié)合O-tRNA的抑制效率至少是沒有O-RS存在下O-tRNA的抑制效率高,例如5倍、10倍、15倍、20倍、25倍或更高。在一些方面,O-RS與O-tRNA一起的抑制效率至少是衍生自大腸桿菌(五.Co/Z)的正交亮氨?;蚶野滨?tRNA合成酶的抑制效率的45%。包含O-tRNA的組合物還可任選包含宿主細(xì)胞(例如哺乳動物細(xì)胞,如嚙齒動物細(xì)胞或靈長動物細(xì)胞)和/或完整翻譯系統(tǒng)。本發(fā)明還提供包含翻譯系統(tǒng)的細(xì)胞(如嚙齒動物細(xì)胞或靈長動物細(xì)胞),所述翻譯系統(tǒng)包含正交-tRNA(O-tRNA);正交氨酰-tRNA合成酶(O-RS)和圖1所示非天然氨基酸。O-RS通常優(yōu)先用非天然氨基酸氨?;疧-tRNA勝過任何內(nèi)源性tRNA,該O-RS對O-tRNA有偏好,加載有非天然氨基酸的O-tRNA與加載有相同非天然氨基酸的內(nèi)源性tRNA的比例大于1:1,更優(yōu)選該O-RS排他性地或者幾乎排他性地加載O-tRNA。O-tRNA識別第一選擇者密碼子,O-RS優(yōu)先用非天然氨基酸氨酰化O-tRNA。在一個實施方式中,O-tRNA含有SEQIDNO:3所示多核苷酸序列或其互補多核苷酸序列,或者由其編碼。在一個實施方式中,該O-RS含有選自SEQIDNO:57-101的氨基酸序列和其保守變體。本發(fā)明的細(xì)胞還可任選包含其它不同的O-tRNA/O-RS配對和第二非天然氨基酸,例如,此O-tRNA識別第二選擇者密碼子,此O-RS優(yōu)先用第二非天然氨基酸氨酰化相應(yīng)的O-tRNA,其中所述第二氨基酸不同于第一非天然氨基酸。本發(fā)明的細(xì)胞可任選包含含有編碼感興趣多肽的多核苷酸的核酸,所述多核苷酸含有所述O-tRNA能識別的選擇者密碼子。在某些實施方式中,本發(fā)明的宿主細(xì)胞是哺乳動物細(xì)胞(如嚙齒動物細(xì)胞或靈長動物細(xì)胞),所述細(xì)胞含有正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、非天然氨基酸和含有編碼感興趣多肽的多核苷酸的核酸,其中所述多核苷酸含有該O-tRNA能識別的選擇者密碼子。在本發(fā)明的某些實施方式中,所述Q-RS優(yōu)先用所述非天然氨基酸氨酰化所述O-tRNA,其效率高于該O-RS氨?;魏蝺?nèi)源性tRNA的效率。在本發(fā)明的某些實施方式中,本發(fā)明的O-tRNA含有本文序列表(例如,SEQIDNO:3)或?qū)嵤├兴镜亩嗪塑账嵝蛄谢蚱浠パa多核苷酸序列,或由這些序列編碼。在本發(fā)明的某些實施方式中,O-RS含有序列表中所示氨基酸序列或其保守變體。在一個實施方式中,O-RS或其部分由編碼本文序列表和實施例所示氨基酸序列的多核苷酸序列或其互補的多核苷酸序列編碼。本發(fā)明的0-tRNA和/或0-RS可衍生自各種生物(如真核和/或非真核生物)。多核苷酸也是本發(fā)明的特征。本發(fā)明的多核苷酸(例如,SEQIDNO:8-56)包括人工的(如人造的和非天然產(chǎn)生的)多核苷酸,所述多核苷酸序列含有編碼本文序列表所示多肽的核苷酸序列,和/或與該多核苷酸序列互補。本發(fā)明的多核苷酸還可包括在高度嚴(yán)謹(jǐn)條件下能與上述多核苷酸在基本全長的核酸上雜交的核酸。本發(fā)明的多核苷酸還包括與天然tRNA或相應(yīng)編碼核酸的序列具有,例如至少75%、至少80%、至少90%、至少95%、至少98%或更高相同性的多核苷酸(但是本發(fā)明的多核苷酸不是天然tRNA或相應(yīng)的編碼核酸),所述tRNA識別選擇者密碼子,如四堿基密碼子。與上述任何多核苷酸序列和/或含上述任何序列的保守變體的多核苷酸有,例如至少80%、至少90%、至少95%、至少98%或更高相同性的人工多核苷酸也包括在本發(fā)明的多核苷酸內(nèi)。含本發(fā)明多核苷酸的載體也是本發(fā)明的特征。例如,本發(fā)明的載體可以是質(zhì)粒、粘粒、噬菌體、病毒、表達(dá)載體等。含本發(fā)明載體的細(xì)胞也是本發(fā)明的特征。O-tRNA/0-RS配對組分的制備方法也是本發(fā)明的特征。用這些方法制備的組分也是本發(fā)明的特征。例如,產(chǎn)生至少一種與細(xì)胞正交的tRNA(O-tRNA)的方法包括制備突變體tRNA文庫;使突變體tRNA文庫中各成員的反密碼子環(huán)突變使得其能識別選擇者密碼子,藉此提供潛在的O-tRNA文庫,并對第一物種的第一細(xì)胞群進(jìn)行負(fù)選擇,所述細(xì)胞含有潛在O-tRNA文庫的成員。負(fù)選擇可去除含潛在O-tRNA文庫成員的細(xì)胞,該潛在O-tRNA可被細(xì)胞的內(nèi)源性氨酰-tRNA合成酶(RS)氨?;?。由此提供與第一物種的細(xì)胞正交的tRNA庫,從而至少提供一種O-tRNA。還提供用本發(fā)明方法產(chǎn)生的O-tRNA。在某些實施方式中,這些方法還包括正選擇第一物種的第二細(xì)胞群,其中所述細(xì)胞含有與第一物種的細(xì)胞正交的tRNA庫的成員、關(guān)聯(lián)氨酰-tRNA合成酶和陽性選擇標(biāo)記。采用正選擇可選擇或篩選出含有能被關(guān)聯(lián)氨酰-tRNA合成酶氨?;以陉栃赃x擇標(biāo)記存在下可顯示所需反應(yīng)的tRNA庫成員的那些細(xì)胞,藉此提供O-tRNA。在某些實施方式中,第二細(xì)胞群含有未被負(fù)選擇去除的細(xì)胞。還提供能用非天然氨基酸加載O-tRNA的正交-氨酰-tRNA合成酶的鑒定方法。例如,該方法包括對第一物種的細(xì)胞群進(jìn)行篩選,其中所述細(xì)胞各自含有1)多種氨酰-tRNA合成酶(RS)的成員(例如,所述多種RS可包括突變型RS、衍生自第一物種以外的物種的RS、或者突變型RS和衍生自第一物種以外的物種的RS二者);2)正交-tRNA(O-tRNA)(如衍生自一個或多個物種);和3)編碼陽性選擇標(biāo)記并且包含至少一個選擇者密碼子的多核苷酸。選擇或篩選與不含所述多種RS的成員或所含成員數(shù)目較少的細(xì)胞相比細(xì)胞(如宿主細(xì)胞)中顯示抑制效率提高的那些細(xì)胞。這些選擇/篩選的細(xì)胞含有能氨?;疧-tRNA的活性RS。用這些方法鑒定到的正交氨酰-tRNA合成酶也是本發(fā)明的特征。在宿主細(xì)胞(例如哺乳動物,如嚙齒動物細(xì)胞或靈長動物細(xì)胞等)內(nèi)產(chǎn)生在所選位置含有非天然氨基酸的蛋白質(zhì)的方法也是本發(fā)明的特征。例如,一種方法包括在適當(dāng)?shù)呐囵B(yǎng)基內(nèi)培養(yǎng)細(xì)胞,其中所述細(xì)胞含有核酸,而該核酸含有至少一個選擇者密碼子并編碼一種蛋白,從而提供非天然氨基酸并在含所述至少一個選擇者密碼子的核酸的翻譯過程中將該非天然氨基酸摻入該蛋白質(zhì)的特定位置,從而產(chǎn)生該蛋白質(zhì)。細(xì)胞還含有在細(xì)胞內(nèi)起作用并識別選擇者密碼子的正交-tRNA(O-tRNA);以及優(yōu)先用非天然氨基酸氨?;疧-tRNA的正交氨酰-tRNA合成酶(O-RS)。用這種方法產(chǎn)生的蛋白質(zhì)也是本發(fā)明的特征。本發(fā)明還提供含有蛋白質(zhì)的組合物,其中所述蛋白質(zhì)包含非天然氨基酸。在某些實施方式中,蛋白質(zhì)包含的氨基酸序列與己知蛋白,如治療蛋白、診斷蛋白和工業(yè)用酶或其一部分的氨基酸序列有至少75%相同性。組合物任選包含藥學(xué)上可接受的載體。核酸和多肽序列及變體如本文所述,本發(fā)明提供編碼例如O-tRNA和O-RS的多核苷酸序列,多肽氨基酸序列,例如O-RS,以及例如包含所述多核苷酸或多肽序列的組合物、系統(tǒng)和方法。本文披露了所述序列的例子,如O-tRNA和O-RS的氨基酸和核苷酸序列(見圖16,例如SEQIDNO:3和8-101)。然而,本領(lǐng)域技術(shù)人員應(yīng)知道本發(fā)明并不限于本文,例如實施例和序列表中披露的那些序列。本領(lǐng)域技術(shù)人員應(yīng)知道本發(fā)明還提供具有本文所述功能的許多相關(guān)序列,例如編碼本文所披露O-RS的保守變體的多核苷酸和多肽。本領(lǐng)域已知構(gòu)建和分析能夠在酵母宿主系統(tǒng)中用非天然氨基酸氨?;疧-tRNA的正交合成酶物質(zhì)(O-RS)的通用方法。本發(fā)明提供多肽(O-RS)和多核苷酸,如O-tRNA、編碼O-RS或其諸部分的多核苷酸,用于分離氨酰-tRNA合成酶克隆的寡核苷酸等。本發(fā)明的多核苷酸包括編碼本發(fā)明的感興趣蛋白或多肽并含有一個或多個選擇者密碼子的那些多核苷酸。另外,本發(fā)明多核苷酸包括,例如含有選自SEQIDNO:8-56的核苷酸序列的多核苷酸;與其多核苷酸序列互補或編碼其多核苷酸序列的多核苷酸。本發(fā)明的多核苷酸還包括編碼選自SEQIDNO:57-101的O-RS氨基酸序列的任何多核苷酸。類似地,在高嚴(yán)謹(jǐn)條件下,可與上述多核苷酸在基本全長的核酸上雜交(并且不是天然多核苷酸序列)的人工核酸也是本發(fā)明多核苷酸。在一個實施方式中,組合物包含本發(fā)明的多肽和賦形劑(如緩沖液、水、藥學(xué)上可接受的賦形劑等)。本發(fā)明還提供可與本發(fā)明多肽發(fā)生特異性免疫反應(yīng)的抗體或抗血清。人工多核苷酸是人造而不是天然產(chǎn)生的多核苷酸。本發(fā)明的多核苷酸還包括人工多核苷酸,即與天然tRNA具有如至少75%、至少80%、至少卯%、至少95%、至少98%或更高相同性(但不是天然tRNA)。多核苷酸還包括與天然tRNA具有如至少75%、至少80%、至少90%、至少95%、至少98%或更高相同性(但不是100%相同)的人工多核苷酸。在某些實施方式中,載體(如質(zhì)粒、粘粒、噬菌體、病毒等)含有本發(fā)明的多核苷酸。在一個實施方式中,所述載體是表達(dá)載體。在另一個實施方式中,所述表達(dá)載體包含與本發(fā)明的一種或多種多核苷酸操作性相連的啟動子。在另一個實施方式中,細(xì)胞包含含有本發(fā)明多核苷酸的載體。本領(lǐng)域技術(shù)人員還知道本發(fā)明包括所披露序列的多種變體。例如,產(chǎn)生功能相同序列的所披露序列的保守變體也屬于本發(fā)明。核酸多核苷酸序列的變體也屬于本發(fā)明,所述變體與至少一種所披露序列雜交。本文披露序列的獨特亞序列,例如可通過標(biāo)準(zhǔn)序列比較技術(shù)測定的獨特亞序列也屬于本發(fā)明。保守性變異由于遺傳密碼的簡并性,"沉默取代"(即,核酸序列中的取代不導(dǎo)致所編碼多肽改變)是編碼氨基酸序列的每條核酸序列所隱含的特征。類似地,也不難鑒定氨基酸序列中有一個或少數(shù)氨基酸被具有高度相似特性的不同氨基酸取代的"保守性氨基酸取代",因為它與披露的構(gòu)建物高度相似。披露的各序列的這種保守性變異是本發(fā)明的特征之一。具體核酸序列的"保守性變異"指編碼相同或基本相同的氨基酸序列的那些核酸,或者,如果核酸不編碼氨基酸序列,則指基本上相同的序列。技術(shù)人員知道改變、加入或刪除所編碼序列中一個氨基酸或少部分氨基酸(一般低于5%、更常見低于4%、2%或1%)的各種取代、缺失或插入是"保守性修飾變異",這些改變導(dǎo)致氨基酸的缺失、插入或被化學(xué)性質(zhì)相似的氨基酸所取代。因此,本發(fā)明所列舉多肽序列的"保守性變異"包括用同一保守性取代組的氨基酸取代該多肽序列的少部分(通常低于5%,更常見是低于2%或1%)的氨基酸。最后,加入不改變某核酸分子所編碼活性的序列(例如加入無功能序列)是基礎(chǔ)核酸的保守性變異。本領(lǐng)域熟知提供功能類似的氨基酸的保守性取代表,其中一個氨基酸殘基被另一個具有相似化學(xué)特性(例如芳族側(cè)鏈或帶正電荷的側(cè)鏈)的氨基酸殘基取代,因此基本上不改變該多肽分子的功能特性。以下例舉多組化學(xué)特性相似的天然氨基酸,其中,各組內(nèi)的取代即"保守性取代"。保守性氨基酸取代非極性和/或脂族極性,不帶電帶正電荷帶負(fù)電荷的側(cè)鏈荷的側(cè)鏈萬跌WJ班的側(cè)鏈側(cè)鏈甘氨酸絲氨酸丙氨酸蘇氨酸苯丙氨酸賴氨酸天冬氨酸纈氨酸半胱氨酸酪氨酸精氨酸亮氨酸甲硫氨酸谷氨酸色氨酸組氨酸異亮氨酸精氨酸脯氨酸谷氨酰胺核酸雜交可采用比較雜交來鑒定本發(fā)明的核酸,包括本發(fā)明核酸的保守性變體,該比較雜交方法是區(qū)別本發(fā)明核酸的優(yōu)選方法。此外,在高度、超高度和超超高度嚴(yán)謹(jǐn)性條件下能與SEQIDNO:8-56所示核酸雜交的靶核酸是本發(fā)明的特征。這種核酸的例子包括與某給定的核酸序列相比,含有一個或少許沉默或保守性核酸取代的核酸。當(dāng)測試核酸與探針的雜交程度是與完美匹配的互補耙標(biāo)雜交程度的至少50%,即信噪比至少是該探針與靶標(biāo)在完美匹配的探針與完美匹配的互補靶標(biāo)結(jié)合的條件下雜交的信噪比的一半高時,可稱該測試核酸與探針核酸特異性雜交;此條件下,完美匹配的探針與完美匹配的互補耙核酸結(jié)合的信噪比至少是與任何不匹配靶核酸雜交所觀察到的信噪比的約5-10倍。當(dāng)核酸結(jié)合(一般在溶液中)時,稱其"雜交"。核酸因各種已充分表征的理化力,例如氫鍵、溶劑排斥、堿基堆積等而雜交。核酸雜交的廣泛指南見Tijssen,(1993),LaboratoryTechniquesinBiochemistryandMolecularBiology—HybridizationwithNucleicAcidProbes(生物化學(xué)與分子生物學(xué)的實驗室技術(shù)——核酸探針雜交),第一部分第二章,"Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays(雜交原理概述與核酸探針試驗方法)",(艾爾賽弗公司(Elsevier),紐約);以及CurrentProtocolsinMolecularBiology(最新分子生物學(xué)方法),Ausubel等編,"CurrentProtocols"(最新方法),格林出版合伙公司(GreenePublishingAssociates,Inc.)和約翰威立父子公司(JohnWiley&Sons)的合資企業(yè),(2004年增補);Hames和Higgins,(1995),GeneProbesl(基因探針l)和GeneProbes2(基因探針2),IRL出版社,牛津大學(xué)出版社,牛津,英格蘭,它們提供了合成、標(biāo)記、檢測和定量測定DNA及RNA,包括寡核苷酸的細(xì)節(jié)。在Southern或northern印跡濾膜上具有100個以上互補殘基的互補核酸雜交的嚴(yán)謹(jǐn)性雜交條件的例子是含lmg肝素的50。/。福爾馬林,42'C雜交過夜。嚴(yán)謹(jǐn)性洗滌條件的例子是65。C,用0.2XSSC洗滌15分鐘(SSC緩沖液的描述可參見Sambrook等;MolecularCloning-ALaboratoryManual(分子克隆-實驗室手冊),(第三版),第1-3巻,冷泉港實驗室,冷泉港,紐約,2001)。通常先進(jìn)行低嚴(yán)謹(jǐn)性洗滌除去背景探針信號,再進(jìn)行高嚴(yán)謹(jǐn)性洗滌。示例性低嚴(yán)謹(jǐn)性洗滌是4(TC,用2XSSC洗滌15分鐘。具體雜交試驗中信噪比是無關(guān)探針觀察到的信噪比的5倍(或更高)通常表示檢測到特異性雜交。核酸雜交實驗(例如,Southern和northern雜交)的"嚴(yán)謹(jǐn)性雜交洗滌條件"取決于序列,并隨不同的環(huán)境參數(shù)而不同。核酸雜交的廣泛指南見Tijssen,(1993),生物化學(xué)與分子生物學(xué)的實驗室技術(shù)——核酸探針雜交,第一部分第二章,"雜交原理概述與核酸探針試驗方法",(艾爾賽弗公司,紐約);Hames禾BHiggins,(1995),基因探針l,IRL出版社,牛津大學(xué)出版社,牛津,英格蘭,禾卩Hames禾卩Higgins,(1995),基因探針2,IRL出版社,牛津大學(xué)出版社,牛津,英格蘭。不難憑經(jīng)驗確定適合任何測試核酸的嚴(yán)謹(jǐn)性雜交和洗滌條件。例如,在確定嚴(yán)謹(jǐn)性雜交和洗滌條件時,可逐漸提升雜交和洗滌條件(例如,通過升高雜交或洗滌的溫度、降低雜交或洗滌中的鹽濃度、增加雜交或洗滌中的洗滌劑濃度和/或增加雜交或洗滌中的有機(jī)溶劑如福爾馬林的濃度)直至符合選定的標(biāo)準(zhǔn)。例如,在高度嚴(yán)謹(jǐn)性雜交和洗滌條件中,逐漸提升雜交和洗滌條件直至探針與完美匹配的互補靶標(biāo)結(jié)合的信噪比至少是該探針與不匹配靶標(biāo)雜交所觀察到的信噪比的5倍。選擇的"非常嚴(yán)謹(jǐn)"的條件等于具體探針的熱解鏈溫度(TJ。Tm是50M的測試序列與完美匹配的探針雜交時的溫度(在規(guī)定的離子強度和pH下)。為本發(fā)明的目的,"高度嚴(yán)謹(jǐn)"的雜交和洗滌條件一般選擇為在規(guī)定的離子強度和pH下比具體序列的Tm約低5'C。"超高嚴(yán)謹(jǐn)"的雜交和洗滌條件指,增加雜交和洗滌條件的嚴(yán)謹(jǐn)性直至探針與完美匹配的互補靶核酸結(jié)合的信噪比至少是任何不匹配靶核酸雜交時觀察到的信噪比的10倍。靶核酸在這種條件下與探針雜交的信噪比至少是完美匹配的互補靶核酸的1/2時,可稱其在超高嚴(yán)謹(jǐn)性條件下與探針結(jié)合o類似地,可通過逐漸提升相關(guān)雜交試驗的雜交和/或洗滌條件來確定甚至更高的嚴(yán)謹(jǐn)性水平。例如,提升雜交和洗滌的條件的嚴(yán)謹(jǐn)性直至探針與完美匹配的互補耙核酸結(jié)合的信噪比至少是任何不匹配靶核酸雜交信噪比的10、20、50、100或500倍或更高。靶核酸在這種條件下與探針雜交的信噪比至少是完美匹配的互補靶核酸的1/2時,可稱其在超超高度嚴(yán)謹(jǐn)性條件下與探針結(jié)合。如果在嚴(yán)謹(jǐn)性條件下彼此不雜交的核酸所編碼的多肽基本相同,則這些核酸仍基本相同。例如,當(dāng)利用遺傳密碼所允許的最大密碼簡并性產(chǎn)生核酸的拷貝時會發(fā)生這種情況。獨特亞序列在一些方面,本發(fā)明提供含有選自本文披露的O-tRNA和O-RS序列的核酸中獨特亞序列的核酸。與對應(yīng)于任何已知O-tRNA或O-RS核酸序列的核酸相比,所述獨特亞序列是獨特的。可采用,例如設(shè)置默認(rèn)參數(shù)的BLAST進(jìn)行核酸比對。任何獨特亞序列可用作,例如探針來鑒定本發(fā)明核酸或相關(guān)核酸。類似地,本發(fā)明包括含有選自本文披露的O-RS序列的多肽中獨特亞序列的多肽。與對應(yīng)于任何已知多肽序列的多肽相比,本文的獨特亞序列是獨特的。本發(fā)明還提供能在嚴(yán)謹(jǐn)性條件下與獨特的編碼寡核苷酸雜交的靶核酸,所述寡核苷酸編碼選自O(shè)-RS序列的多肽中的獨特亞序列,其中與對應(yīng)于任何對照多肽(例如,通過突變獲得本發(fā)明合成酶的親代序列)的多肽相比,所述獨特亞序列是獨特的。可如上所述測定獨特序列。序列比較、相同性和同源性對于兩個或多個核酸或多肽序列,術(shù)語"相同的"或"相同性百分比"指當(dāng)用下文所述序列比較算法(或技術(shù)人員可用的其它算法)或通過目測觀察來比較和比對最大相應(yīng)性時,這兩個或多個序列或亞序列相同,或者有特定百分比的氨基酸殘基或核苷酸相同。對于兩個核酸或多肽(例如,編碼O-tRNA或O-RS的DNA,或O-RS的氨基酸序列),術(shù)語"基本相同"指當(dāng)利用序列比較算法或通過目測觀察來比較和比對最大相應(yīng)性時,兩個或多個序列或亞序列至少有約60%、約80%、約90-95%、約98%、約99%或更多的核苷酸或氨基酸殘基相同。這種"基本相同"的序列通常認(rèn)為是"同源的",而不論實際祖先。優(yōu)選在至少長約50個殘基的序列區(qū)域,更優(yōu)選在至少約100個殘基的區(qū)域存在"基本相同性",待比較兩條序列最好在至少約150個殘基或者在全長上基本相同。當(dāng)?shù)鞍踪|(zhì)和/或蛋白質(zhì)序列(天然或人工地)衍生自同一祖先蛋白或蛋白序列時,它們是"同源的"。類似地,當(dāng)核酸和/或核酸序列(天然或人工地)衍生自同一祖先核酸或核酸序列時,它們是"同源的"。例如,可通過任何可用的誘變方法來修飾任何天然核酸使之含有一個或多個選擇者密碼子。當(dāng)該誘變的核酸表達(dá)時,它編碼的多肽含有一個或多個非天然氨基酸。當(dāng)然,該突變方法還可改變一個或多個標(biāo)準(zhǔn)密碼子,從而也改變了所得突變型蛋白質(zhì)中的一個或多個標(biāo)準(zhǔn)氨基酸。通常可從兩種或多種核酸或蛋白質(zhì)(或其序列)間的序列相似性推斷同源性。可用于確認(rèn)同源性的序列間精確的相似性百分比因所研究的核酸與蛋白質(zhì)而有所不同,但常規(guī)利用低至25%的序列相似性來確認(rèn)同源性。還可用更高水平的序列相似性,例如30%、40%、50%、60%、70%、80%、90%、95%或99%或更高來確認(rèn)同源性。本文描述了測定序列相似性百分比的方法(例如,采用參數(shù)默認(rèn)的BLASTP和BLASTN),這些方法眾所周知。對于序列比較和同源性測定,通常將一條序列用作參比序列與測試序列相比較。當(dāng)采用序列比較算法時,將測試序列與參比序列輸入計算機(jī),如果需要可指定亞序列坐標(biāo),并指定序列算法程序參數(shù)。然后根據(jù)所指定的程序參數(shù),序列比較算法可計算測試序列相比于參比序列的序列相同性百分比??捎靡韵路椒ㄟM(jìn)行比較序列的最佳比對,例如Smith和Waterman的局部同源性算法,Jdv./^//.M。仇,2:482,(1981);Needleman和Wunsch的同源性比對算法,J,Mo/.5z'o/.,48:443,(1970);Pearson和Lipman的相似性檢索方法,尸亂淑'"ca""'.腦,85:2444,(1988);計算機(jī)執(zhí)行這些算法(威斯康星遺傳軟件包中的GAP,BESTFIT,F(xiàn)ASTA和TFASTA,遺傳學(xué)計算機(jī)組(GeneticsComputerGroup),575ScienceDr.,麥迪遜,威斯康星州);或者目測觀察(一般可參見Cw〃eW/Vo"co"Mo/ecw/arS/o/ogy(最新分子生物學(xué)方法),Ausubel等編,"Cw廳eW/VWoco&(最新方法)",格林出版合伙公司和約翰威立父子公司的合資企業(yè),2006年增補)。適用于測定序列相同性和序列相似性百分比的算法的一個例子是Altschul等,J.Mol.Biol.,215:403-410,(1990)所述的BLAST算法。進(jìn)行BLAST分析的軟件由國家生物技術(shù)信息中心對公眾開放。該算法包括首先通過在査詢序列中鑒定長為W的短字串來鑒定高評分序列配對(HSP),這些字串與數(shù)據(jù)庫序列中相同長度的字串比對時符合或滿足某些正值閾值評分T。T稱為鄰近字串評分閾值(Altschul等,J.Mol.Biol.,215:403-410(1990))。這些原始鄰近字串選中(hit)作為啟動檢索的種子來找尋含有它們的較長HSP。然后使這些字串選中沿著各條序列雙向延伸,以致累積比對評分增加。對于核苷酸序列,用參數(shù)M(—對匹配殘基的獎勵評分;恒大于O)和N(錯配殘基的罰分;恒小于O)計算累積評分。對于氨基酸序列,則用評分矩陣來計算累積評分。當(dāng)出現(xiàn)以下情況時終止各方向的字串選中延伸累積比對評分從其達(dá)到的最高值下降X;因一個或多個負(fù)評分殘基比對的累積導(dǎo)致累積評分降至0或0以下;或者到達(dá)各序列的末端。BLAST算法參數(shù)W、T和X決定比對的靈敏度和速度。BLAST程序(用于核苷酸序列)默認(rèn)11為字長(W)、IO為期望值(E)、100為截斷值、M=5、N=-4,并進(jìn)行雙鏈比較。對于氨基酸序列,BLAST程序默認(rèn)3為字長(W)、10為期望值(E)并采用BLOSUM62評分矩陣(參見Henikoff和Henikoff,(1989),尸roc.A^f/.JcfldSc/.t/&4,89:10915)。除了計算序列相同性百分比外,BLAST算法也可對兩條序列間的相似性進(jìn)行統(tǒng)計學(xué)分析(參見,例如Karlin和Altschul,尸roc.淑7.JcadSc/.C/W,90:5873-5787,(1993))。BLAST算法提供的相似性量度之一是最小總概率(P(N)),其指示兩條核苷酸或氨基酸序列之間發(fā)生隨機(jī)匹配的概率。例如,如果在測試核酸與參比核酸的比較中最小總概率小于約0.1,更優(yōu)選小于約0.01,最優(yōu)選小于約0.001,則可認(rèn)為該核酸與參比核酸相似。誘變與其它分子生物學(xué)技術(shù)可采用分子生物學(xué)技術(shù)操作本發(fā)明的和用于本發(fā)明的多核苷酸和多肽。描述分子生物學(xué)的通用教材包括Berger和Kimmel,GuidetoMolecularCloningTechniques(分子克隆技術(shù)指南),MefAotfe//7五""wo/ogy(酶學(xué)方法),第152巻,學(xué)術(shù)出版社公司(AcademicPress,Inc.),圣迭戈,加利福尼亞州;Sambrook等,MolecularCloning-ALaboratoryManual(分子克隆-實驗室手冊),(第三版),第l-3巻,冷泉港實驗室,冷泉港,紐約,2001和Owre^/VotocoAuMo/ecw/ar歷o/ogy(最新分子生物學(xué)方法),Ausubel等編;"O^reW/Vo^co/s/"Mo/ecw/ar歷o/ogy(分子生物學(xué)最新方法)",格林出版合伙公司和約翰威立父子公司的合資企業(yè),(2006年增補)。這些教材描述了誘變、載體的應(yīng)用、啟動子和涉及,例如產(chǎn)生含有選擇者密碼子的基因從而產(chǎn)生含非天然氨基酸的蛋白質(zhì),正交tRNA、正交合成酶及其配對的許多其它相關(guān)課題。本發(fā)明可采用各種類型的誘變,例如以使tRNA分子突變、產(chǎn)生tRNA文庫、產(chǎn)生合成酶文庫、插入編碼感興趣蛋白質(zhì)或多肽中的非天然氨基酸的選擇者密碼子。它們包括但不限于定點誘變、隨機(jī)點誘變、同源重組、DNA改組或其它遞歸誘變方法、嵌合構(gòu)建、利用含尿嘧啶的模板誘變、寡核苷酸指導(dǎo)的誘變、硫代磷酸酯修飾的DNA誘變、利用缺口雙螺旋DNA的誘變等,或者是它們的任何組合。其它合適的方法包括點錯配修復(fù)、利用修復(fù)缺陷宿主株的誘變、限制性選擇和限制性純化、缺失誘變、總基因合成誘變、雙鏈斷裂修復(fù)等。本發(fā)明也包括,例如涉及嵌合構(gòu)建物的誘變。在一個實施方式中,可用天然分子或經(jīng)改變或突變的天然分子的已知信息,例如序列,序列比較、物理特性、晶體結(jié)構(gòu)等來指導(dǎo)誘變。可利用本發(fā)明多核苷酸或含有本發(fā)明多核苷酸的構(gòu)建物,例如本發(fā)明的載體(例如可以是克隆載體或表達(dá)載體)來遺傳改造(例如轉(zhuǎn)化、轉(zhuǎn)導(dǎo)或轉(zhuǎn)染)宿主細(xì)胞。例如,可將正交tRNA、正交tRNA合成酶和待衍生蛋白質(zhì)的編碼區(qū)操作性連接于可在所需宿主細(xì)胞中起作用的基因表達(dá)控制元件。典型的載體含有轉(zhuǎn)錄和翻譯終止子、轉(zhuǎn)錄和翻譯起始序列和用于調(diào)節(jié)具體靶核酸表達(dá)的啟動子。這些載體可任選地包含遺傳表達(dá)盒,所述表達(dá)盒含有至少一個獨立的終止子序列,允許該表達(dá)盒在真核細(xì)胞或原核細(xì)胞或二者中復(fù)制的序列(例如,穿梭載體),和適用于原核與真核系統(tǒng)的選擇標(biāo)記。載體適用于在原核細(xì)胞、真核細(xì)胞或優(yōu)選二者中復(fù)制和/或整合。參見Giliman和Smith,G匿,8:81,(1979);Roberts等,淑訓(xùn),328:731,(1987);Schneider等,五xpr,i^〃y:,6435:10,(1995);Berger和Kimmel,分子克隆技術(shù)指南,酶學(xué)方法,第152巻,學(xué)術(shù)出版社公司,圣迭戈,加利福尼亞州;Sambrook等,分子克隆-實驗室手冊,(第三版),第1-3巻,冷泉港實驗室,冷泉港,紐約,2001;和最新分子生物學(xué)方法,Ausubel等編;最新方法,格林出版合伙公司和約翰威立父子公司的合資企業(yè),(2006年增補)。例如,載體可以是質(zhì)粒、細(xì)菌、病毒、裸多核苷酸或綴合的多核苷酸形式??赏ㄟ^標(biāo)準(zhǔn)方法將載體導(dǎo)入細(xì)胞和/或微生物,所述方法包括電穿孔(From等,TVoc.A^/.爿cacf.5W.C7&4,82,5824,(1985)),病毒載體感染,利用在小珠或顆粒的基質(zhì)內(nèi)或其表面上含有核酸的小顆粒的高速彈丸穿透(Klein等,A^&re,327:70-73(1987))等。本領(lǐng)域技術(shù)人員廣泛了解用于克隆的細(xì)菌和噬菌體,它們可由各種來源獲得。參見例如美國典型培養(yǎng)物保藏中心(弗吉尼亞州瑪納薩斯(Manassas,VA)的ATCC)和ATCC出版的77^爿rCCCato/ogweo/5a"eW。5a"en'o;/2flge(ATCC細(xì)菌和細(xì)菌噬菌體目錄),(1996),Gherna等編。測序、克隆的其它基本方法和分子生物學(xué)的其它方面及基礎(chǔ)理論思考也可參見Sambrook等,分子克隆-實驗室手冊,(第三版),第1-3巻,冷泉港實驗室,冷泉港,紐約,2001;最新分子生物學(xué)方法,Ausubel等編;最新方法,格林出版合伙公司和約翰威立父子公司的合資企業(yè),(2006年增補);和Watson等,(1992),iecom6/"flWDAM(重組DNA),第二版,科學(xué)美國書籍公司(ScientificAmericanBooks),紐約。此外,可以向各種商業(yè)來源定制或標(biāo)準(zhǔn)定購基本上任何核酸(和實際上任何標(biāo)記的核酸,無論標(biāo)準(zhǔn)或非標(biāo)準(zhǔn)的),例如得克薩斯州米德蘭的米德蘭檢定試劑公司(MidlandCertifiedReagentCompany,Midland,TX)、加利福尼亞州雷蒙納市的大美國基因公司(TheGreatAmericanGeneCompany,Ramona,CA)、伊利諾斯州芝加哥市的表達(dá)基因公司(ExpressGenInc.)、加利福尼亞州阿拉米達(dá)市的操縱子技術(shù)公司(OperonTechnologiesInc.)禾口許多其它公司??衫脼槔绾Y選步驟、激活啟動子或選擇轉(zhuǎn)化子的活性而作適當(dāng)改進(jìn)的常規(guī)營養(yǎng)培養(yǎng)基培養(yǎng)工程改造的宿主細(xì)胞。這些細(xì)胞任選培養(yǎng)成轉(zhuǎn)基因生物。其它可用的參考文獻(xiàn),例如細(xì)胞分離和培養(yǎng)(例如,用于隨后核酸分離)的文獻(xiàn)包括Freshney,(1994),Cm/&"o/jm'ma/CW&,Sw/crec/m/卯e(動物細(xì)胞培養(yǎng),基本技術(shù)手冊),第三版,威立利斯公司(Wiley-Liss),紐約及其所引用的參考文獻(xiàn);Payne等,(1992),P』CW/T7^raeC"/^re/"h々wW辦We/7m(液體系統(tǒng)中的植物細(xì)胞與組織培養(yǎng)),約翰威立父子公司,紐約,紐約州;Gamborg和Phillips編,(1995),尸/耐Ce〃,200780039015.7說明書第64/85頁T7^"ea"c/C^we(植物細(xì)胞、組織和器官培養(yǎng));尸ww^mewto/Me^o&(基本方法),SpringerLabManual(斯普林格實驗室手冊),S-V公司(Springer-Verlag)(伯林海德爾堡紐約);Atlas禾BParks編,7Tzei/a"Wooto/M/craWo/og/ca/Me&a(微生物培養(yǎng)基手冊),(1993),CRC出版社(CRCPress),伯克萊屯,佛羅里達(dá)州。感興趣的蛋白質(zhì)與多肽在細(xì)胞中產(chǎn)生在特定位置含非天然氨基酸的蛋白質(zhì)的方法也是本發(fā)明特征之一。例如,一種方法包括用適當(dāng)?shù)呐囵B(yǎng)基培養(yǎng)細(xì)胞,其中所述細(xì)胞包含含有至少一個選擇者密碼子并編碼蛋白質(zhì)的核酸;和提供非天然氨基酸;其中所述細(xì)胞還包含在細(xì)胞內(nèi)具有功能并識別選擇者密碼子的正交-tRNA(O-tRNA);和優(yōu)先用非天然氨基酸氨?;疧-tRNA的正交氨酰-tRNA合成酶(O-RS)。該方法所產(chǎn)生的蛋白質(zhì)也是本發(fā)明特征之一。在某些實施方式中,與表達(dá)系統(tǒng)中任何內(nèi)源性tRNA相比,O-RS偏向于氨?;P(guān)聯(lián)的O-tRNA。當(dāng)O-tRNA和O-RS以等摩爾濃度存在時,O-RS所加載的O-tRNA與內(nèi)源性tRNA的相對比例大于1:1,優(yōu)選至少約2:1,更優(yōu)選5:1,更優(yōu)選10:1,更優(yōu)選20:1,更優(yōu)選50:1,更優(yōu)選75:1,更優(yōu)選95:1,98:1,99:1,100:1,500:1,1,000:1,5,000:1或更高。本發(fā)明還提供包含蛋白質(zhì)的組合物,所述蛋白質(zhì)含有非天然氨基酸。在某些實施方式中,所述蛋白質(zhì)含有的氨基酸序列與治療性蛋白、診斷性蛋白、工業(yè)用酶或其部分的序列至少有75%相同。本發(fā)明的組合物和本發(fā)明方法制備的組合物任選處于細(xì)胞中。然后可將本發(fā)明的0-tRNA/0-RS配對或各組分用于宿主系統(tǒng)的翻譯機(jī)制中,從而將非天然氨基酸摻入蛋白質(zhì)。2004年4月16日提交的,名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴(kuò)展真核遺傳密碼)"的國際公布號WO2004/094593和名為"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS(非天然氨基酸的體內(nèi)摻入)"的國際公布號WO2002/085923描述了該方法,這兩篇文獻(xiàn)以引用的方式納入本文。例如,當(dāng)O-tRNA/O-RS配對引入宿主,例如嚙齒動物或靈長動物細(xì)胞時,該配對對選擇者密碼子起反應(yīng)而將非天然氨基酸(如圖l所示非天然氨基酸)在體內(nèi)摻入蛋白質(zhì)。加入系統(tǒng)的非天然氨基酸可以是合成氨基酸,例如可以外源性加入生長培養(yǎng)基的苯丙氨酸或酪氨酸衍生物。本發(fā)明的組合物任選為體外翻譯系統(tǒng),或體內(nèi)系統(tǒng)。本發(fā)明的細(xì)胞能大量合成包含非天然氨基酸的蛋白質(zhì)。在一些方面,組合物任選包含,例如至少10微克、至少50微克、至少75微克、至少100微克、至少200微克、至少250微克、至少500微克、至少1毫克、至少10毫克或更多含非天然氨基酸的蛋白質(zhì),或者體內(nèi)蛋白質(zhì)產(chǎn)生方法所能達(dá)到的含量(本文提供重組蛋白質(zhì)制備和純化的細(xì)節(jié))。在另一方面,組合物中包含在例如細(xì)胞裂解液、緩沖液、藥學(xué)緩沖液或其它液體混懸液中(例如,體積為約lnL-約100L)的蛋白質(zhì)濃度任選是,例如每升至少10微克蛋白質(zhì)、每升至少50微克蛋白質(zhì)、每升至少75微克蛋白質(zhì)、每升至少100微克蛋白質(zhì)、每升至少200微克蛋白質(zhì)、每升至少250微克蛋白質(zhì)、每升至少500微克蛋白質(zhì)、每升至少1毫克蛋白質(zhì)或每升至少10毫克蛋白質(zhì)或更高。在細(xì)胞中制備大量(例如,大于采用其它方法如體外翻譯通常可能得到的量)包含至少一個非天然氨基酸的蛋白質(zhì)是本發(fā)明特征之一??蓳饺敕翘烊话被醽?,例如改變蛋白質(zhì)結(jié)構(gòu)和/或功能,如改變大小、酸性、親核性、氫鍵、疏水性、蛋白酶耙位的易接近性、對某部分的耙向(如用于蛋白陣列)、摻入標(biāo)記物或反應(yīng)基團(tuán)等。含有非天然氨基酸的蛋白質(zhì)的催化或物理特性可得到改善,甚至獲得全新的催化或物理特性。例如,可通過將非天然氨基酸摻入蛋白質(zhì)來任選改進(jìn)以下特性毒性、生物分布、結(jié)構(gòu)特性、光譜特性、化學(xué)和/或光化學(xué)特性、催化能力、半衰期(例如血清半衰期)、與其它分子的反應(yīng)能力(如共價或非共價的)等。包含含有至少一個非天然氨基酸的蛋白質(zhì)的組合物可用作,例如新型治療劑、診斷劑、催化酶、工業(yè)用酶、結(jié)合蛋白(如抗體)以及用于例如研究蛋白質(zhì)結(jié)構(gòu)和功能。參見例如Dougherty,(2000),"t/n"a/wra/Jw/woJc〖cfaas/Vo6eso//Vo/e/wadF朋c^M(1乍為蛋白質(zhì)結(jié)構(gòu)和功能探針的非天然氨基酸"),CwrenZOp/m'o"C7z謹(jǐn)/ca/所o/ogy,4:645-652。在本發(fā)明的一些方面,組合物包含至少一種含有至少一個,例如至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個或至少十個或更多非天然氨基酸的蛋白質(zhì)。所述非天然氨基酸可以相同或不同,例如蛋白質(zhì)中可以在1、2、3、4、5、6、7、8、9或10個或更多不同的位點上含有l(wèi)、2、3、4、5、6、7、8、9或10個或更多不同的非天然氨基酸。在另一方面,組合物包含蛋白質(zhì),該蛋白質(zhì)中存在的至少一個(但不是全部)具體氨基酸是非天然氨基酸。對于給定的含多個非天然氨基酸的蛋白質(zhì),所述非天然氨基酸可以相同或不同(如蛋白質(zhì)可包含兩個或多個不同類型的非天然氨基酸,或者可包含兩個相同的非天然氨基酸)。對于含兩個以上非天然氨基酸的給定蛋白質(zhì),所述非天然氨基酸可以相同,不同,或是多個同一類型的非天然氨基酸與至少一個不同的非天然氨基酸的組合。利用本文組合物和方法可制備基本上任何含非天然氨基酸的蛋白質(zhì)(或其一部分)(與任何相應(yīng)的編碼核酸,例如含有一個或更多選擇者密碼子的核酸)。未試圖鑒定成百上千的已知蛋白質(zhì),可修飾它們中的任一種使之含有一個或多個非天然氨基酸,例如通過改進(jìn)任何可用的突變方法從而使相關(guān)翻譯系統(tǒng)中包含一個或多個合適的選擇者密碼子。已知蛋白質(zhì)的共有序列庫包括GenBankEMBL、DDBJ和NCBI。通過檢索互聯(lián)網(wǎng)不難鑒定其它庫。這些蛋白質(zhì)通常與任何可用的蛋白質(zhì)(例如,治療性蛋白、診斷性蛋白、工業(yè)用酶或其一部分等)有,例如至少60%、至少70%、至少75%、至少80%、至少90%、至少95%或至少99%或更高的相同性,同時這些蛋白質(zhì)含有一個或多個非天然氨基酸??山?jīng)修飾包含一個或多個非天然氨基酸的治療性、診斷性和其它蛋白質(zhì)的例子參見但不限于2004年4月16日提交的名為"ExpandingtheEukaryoticGeneticCode(擴(kuò)展真核生物遺傳密碼)"的國際公布號WO2004/094593和名為"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS.(非天然氨基酸的體內(nèi)慘入")的WO2002/085923??山?jīng)修飾包含一個或多個非天然氨基酸的治療性、診斷性和其它蛋白質(zhì)的例子包括但不限于例如蛭素、oc-1抗胰蛋白酶、血管生成抑制素、抗溶血因子(Antihemolyticfactor)、抗體(抗體的其它細(xì)節(jié)見下文)、載脂蛋白、脫輔蛋白、心房利鈉因子、心房利鈉多肽、心房肽(Atrialpeptides)、C-X陽C趨化因子(如T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-IO、GCP-2、NAP-4、SDF-1、PF4、MIG)、降轉(zhuǎn)素、CC趨化因子(如單核細(xì)胞趨化蛋白-1、單核細(xì)胞趨化蛋白-2、單核細(xì)胞趨化蛋白-3、單核細(xì)胞炎性蛋白-la、單核細(xì)胞炎性蛋白-l(J、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配體、C-kit配體、胱冬酶、膠原、集落剌激因子(CSF)、補體因子5a、補體抑制劑、補體受體l、細(xì)胞因子(如,上皮嗜中性活化肽-78(epithelialNeutrophilActivatingPeptide-78)、GROa/MGSA、GRO(J、GROy、MIP-la、MIP-15、MCP-1)、表皮生長因子(EGF)、促紅細(xì)胞生成素("EPO")、剝落性毒素A和B、因子IX、因子VII、因子VIII、因子X、成纖維細(xì)胞生長因子(FGF)、血纖蛋白原、纖連蛋白、G-CSF、GM-CSF、葡糖腦苷脂酶、促性腺激素、生長因子、Hedgehog蛋白(如Sonic,Indian,Desert)、血紅蛋白、肝細(xì)胞生長因子(HGF)、水蛭素、人血清白蛋白、胰島素、胰島素樣生長因子(IGF)、干擾素(如,IFN-a、IFN隱卩、IFN陽y)、白介素(如,IL-1、IL-2、IL隱3、IL隱4、IL-5、IL陽6、IL-7、IL-8、IL-9、IL-10、IL-ll、IL-12等)、角質(zhì)形成細(xì)胞生長因子(KGF)、乳鐵蛋白、白血病抑制因子、螢光素酶、神經(jīng)營養(yǎng)因子(Neurturin)、嗜中性白細(xì)胞抑制因子(NIF)、抑瘤蛋白M、成骨蛋白、甲狀腺激素、PD-ECSF、PDGF、肽激素(如,人生長激素)、多效營養(yǎng)因子、胱冬酶原-3、胱冬酶原-9、A蛋白、G蛋白、熱源性外毒素A、B和C、松弛素、腎素、SCF、可溶性補體受體I、可溶性I-CAM1、可溶性白介素受體(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受體、生長調(diào)節(jié)素、促生長素抑制劑、促生長素、鏈激酶、超抗原,即葡萄球菌腸毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE)、超氧化物岐化酶(SOD)、中毒性休克綜合征毒素(TSST-1)、胸腺素al、組織纖溶酶原激活物、腫瘤壞死因子P(TNF(3)、腫瘤壞死因子受體(TNFR)、腫瘤壞死因子-a(TNFa)、血管內(nèi)皮生長因子CVEGEF)、尿激酶和許多其它蛋白??刹捎帽疚乃瞿茉隗w內(nèi)摻入非天然氨基酸的組合物和方法制備的一類蛋白質(zhì)包括轉(zhuǎn)錄調(diào)節(jié)劑或其一部分。示例性轉(zhuǎn)錄調(diào)節(jié)劑包括調(diào)節(jié)細(xì)胞生長、分化、調(diào)控等的基因和轉(zhuǎn)錄調(diào)節(jié)蛋白。轉(zhuǎn)錄調(diào)節(jié)劑存在于原核生物、病毒和真核生物(包括真菌、植物、酵母菌)、昆蟲和動物(包括哺乳動物)中,從而提供了廣泛的治療靶點。應(yīng)該理解表達(dá)和轉(zhuǎn)錄激活物通過許多機(jī)理調(diào)控轉(zhuǎn)錄,例如通過與受體結(jié)合、刺激信號轉(zhuǎn)導(dǎo)級聯(lián)反應(yīng)、調(diào)控轉(zhuǎn)錄因子表達(dá)、與啟動子和增強子結(jié)合、與結(jié)合啟動子和增強子的蛋白質(zhì)結(jié)合、DNA解鏈、前-mRNA剪接、RNA聚腺苷酸化和RNA降解。本發(fā)明的一類蛋白質(zhì)(例如,含有一個或多個非天然氨基酸的蛋白質(zhì))包括生物學(xué)活性蛋白,例如蛭素、細(xì)胞因子、炎性分子、生長因子、它們的受體和癌基因產(chǎn)物,如白介素(如IL-1、IL-2、IL-8等)、干擾素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-a、TGF-卩、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-l、ICAM-1/LFA-1和透明素(hyalurin)/CD44;信號轉(zhuǎn)導(dǎo)分子和相應(yīng)的癌基因產(chǎn)物,例如Mos、Ras、Raf和Met;轉(zhuǎn)錄激活物和阻遏物,例如p53、Tat、Fos、Myc、Jun、Myb、Rel和類固醇激素受體,例如雌激素、孕酮、睪酮、醛甾酮的那些受體,LDL受體配體和皮質(zhì)酮。本發(fā)明也提供含有至少一個非天然氨基酸的酶(例如工業(yè)用酶)或其一部分。酶的例子包括但不限于酰胺酶、氨基酸消旋酶、?;D(zhuǎn)移酶、脫鹵酶、雙加氧酶、二芳基丙垸過氧化物酶(diarylpropaneperoxidases),差向異構(gòu)酶、環(huán)氧化物水解酶、酯酶、異構(gòu)酶、激酶、葡糖異構(gòu)酶、糖苷酶、糖基轉(zhuǎn)移酶、鹵素過氧化物酶(haloperoxidases)、單加氧酶(例如p450)、脂酶、木質(zhì)素過氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酶、枯草桿菌蛋白酶、轉(zhuǎn)氨酶和核酶。許多這些蛋白質(zhì)可商品化購得(參見,例如西格瑪生物科學(xué)公司(SigmaBiosciences)),相應(yīng)的蛋白質(zhì)序列和基因及其許多變體通常是熟知的(參見,例如Genbank)??筛鶕?jù)本發(fā)明通過插入一個或多個非天然氨基酸來修飾任何這些蛋白,從而(例如)改變這些蛋白質(zhì)一種或多種感興趣的治療、診斷或酶活性。治療相關(guān)特性包括血清半衰期、保存半衰期、穩(wěn)定性、免疫原性、治療活性、可檢測性(例如,通過在非天然氨基酸中加入報道基團(tuán)(如標(biāo)記物或標(biāo)記結(jié)合位點))、LD5Q或其他負(fù)效應(yīng)的降低、通過胃腸道進(jìn)入體內(nèi)的能力(如口服利用度)等。診斷特性的例子包括保存半衰期、穩(wěn)定性、診斷活性、可檢測性等。相關(guān)的酶特性的例子包括保存半衰期、穩(wěn)定性、酶活性、生產(chǎn)能力等。也可采用本發(fā)明方法和組合物修飾各種其它蛋白質(zhì)使之包含一個或多個非天然氨基酸。例如,本發(fā)明可包括用非天然氨基酸取代一種或多種疫苗蛋白質(zhì)中的一個或多個天然氨基酸,例如以下來源的蛋白質(zhì)感染性真菌,如曲霉(A^erg///^)、假絲酵母(OmAWa)種;細(xì)菌,特別是用作病原性細(xì)菌模型的大腸桿菌,以及醫(yī)學(xué)上重要的細(xì)菌,如葡萄球菌屬(Stoj^y/ococc/)(如,金黃色葡萄球菌)或鏈球菌屬0^"印fOCOCC/)(如,肺炎鏈球菌);原生動物,如孢子綱(如,瘧原蟲(尸/(Xmoflf/a))、根足蟲(r/n'zo;0(iy)(如,內(nèi)變形蟲(五Wamoe6a))和鞭毛蟲類(錐蟲(7V;;/7a"(Woma)、利什曼原蟲(丄e^/zmam'a)、毛滴蟲(7Wc/zwnowa力、賈第蟲(G/aWZa)等);病毒,如(+)RNA病毒(例子包括痘病毒,如痘苗病毒(vac"'m'a);小RNA病毒,如脊髓灰質(zhì)炎病毒(/7o/Zo);披膜病毒,如風(fēng)疹病毒(ra6e〃a);黃病毒(Flavivimses),如HCV;和冠狀病毒)、(-)RNA病毒(如棒狀病毒(Rhabdovirus),如VSV;副粘病毒,如RSV;正粘病毒,如流感病毒;布尼亞病毒和嵌沙樣病毒)、dsDNA病毒(如呼腸孤病毒)、RNA到DNA的病毒,即逆轉(zhuǎn)錄病毒,如HIV和HTLV和某些DNA到RNA的病毒,如乙肝病毒。農(nóng)業(yè)相關(guān)的蛋白也是非天然氨基酸修飾的合適靶位,例如抗蟲蛋白(如Cry蛋白)、淀粉和脂質(zhì)產(chǎn)生酶、植物和昆蟲毒素、毒素耐受性蛋白、真菌毒素解毒蛋白、植物生長酶(如核酮糖1,5-二磷酸羧化酶/加氧酶,"RUBISCO")、脂氧合酶(LOX)和磷酸烯醇式丙酮酸(PEP)羧化酶。在某些實施方式中,本發(fā)明方法和/或組合物中的感興趣多肽或蛋白質(zhì)(或其一部分)由核酸編碼。所述核酸通常含有至少一個、至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個、十個或更多個選擇者密碼子??刹捎帽绢I(lǐng)域技術(shù)人員熟知和本文在"誘變與其它分子生物學(xué)技術(shù)"中所述的方法誘變編碼感興趣蛋白質(zhì)或多肽的基因,從而使之含有(例如)一個或多個選擇者密碼子來摻入非天然氨基酸。例如,可誘變感興趣蛋白質(zhì)的核酸,使之含有一個或多個選擇者密碼子以插入一個或多個非天然氨基酸。本發(fā)明包括任何蛋白質(zhì)的這種變體(例如突變體)形式,例如含有至少一個非天然氨基酸。類似地,本發(fā)明也包括相應(yīng)的核酸,即具有編碼一個或多個非天然氨基酸的一個或多個選擇者密碼子的任何核酸。為制備含有非天然氨基酸的蛋白質(zhì),可利用適合通過正交tRNA/RS配對在體內(nèi)摻入非天然氨基酸的宿主細(xì)胞和生物。可用表達(dá)正交tRNA、正交tRNA合成酶的一個或多個載體和編碼待衍生蛋白質(zhì)的載體來遺傳改造(例如轉(zhuǎn)化、轉(zhuǎn)導(dǎo)或轉(zhuǎn)染)宿主細(xì)胞。各組分可以位于同一載體或各自位于不同載體,或者可以兩個組分位于一個載體而第三組分位于第二載體。載體可以是例如質(zhì)粒、細(xì)菌、病毒、裸多核苷酸或偶聯(lián)多核苷酸的形式。通過免疫反應(yīng)性測定多肽因為本發(fā)明多肽提供了各種新的多肽序列(例如,以在本文翻譯系統(tǒng)中合成的蛋白質(zhì)為例,多肽含有非天然氨基酸;或者,以新的合成酶為例,則是標(biāo)準(zhǔn)氨基酸的新序列),這些多肽也提供了可在例如免疫測定中識別的新結(jié)構(gòu)特征。產(chǎn)生能與本發(fā)明多肽特異性結(jié)合的抗血清以及能與這種血清結(jié)合的多肽是本發(fā)明的特征之一。本文所用的術(shù)語"抗體"包括但不限于基本上由一個或多個免疫球蛋白基因編碼的多肽,或其能特異性結(jié)合并識別分析物(抗原)的片段。例子包括多克隆、單克隆、嵌合型和單鏈抗體等。本文所用的術(shù)語"抗體"也包括免疫球蛋白片段,包括Fab片段和由表達(dá)文庫(包括噬菌體展示文庫)產(chǎn)生的片段。抗體的結(jié)構(gòu)與術(shù)語可參見,例如Paul,F(xiàn)wm/ame"a〃wm""o/ogX基礎(chǔ)免疫學(xué)),第四版,1999,雷文出版社(RavenPress),紐約。為產(chǎn)生用于免疫測定的抗血清,可如本文所述產(chǎn)生并純化一種或多種免疫原性多肽。例如,可在重組細(xì)胞中產(chǎn)生重組蛋白。采用標(biāo)準(zhǔn)小鼠免疫方案(關(guān)于用于測定特異性免疫反應(yīng)性的抗體產(chǎn)生、免疫測定形式和條件的標(biāo)準(zhǔn)說明可參見,例如Harlow禾卩Lane,(1988),爿""60^//^,^Z^6oraforyMawwfl/(抗體,實驗室手冊),冷泉港出版社,紐約),用免疫原性蛋白和標(biāo)準(zhǔn)佐劑(如弗氏佐劑)免疫小鼠的近交品系(此類小鼠因其實際遺傳相同性使得實驗結(jié)果重現(xiàn)性較高而用于測定)。蛋白質(zhì)、抗體、抗血清等的其它細(xì)節(jié)可見名為"EXPANDINGTHEEUKARYOTICGENETICCODE(擴(kuò)展真核生物遺傳密碼)"的國際公布號WO2004/094593;名為"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS(非天然氨基酸的體內(nèi)摻入)"的WO2002/085923;名為"GLYCOPROTEINSYNTHESIS(糖蛋白合成)"的WO2004/035605和名為"PROTEINARRAYS(蛋白質(zhì)陣列)"的WO2004/058946。O-tRNA和O-RS以及O-tRNA/O-RS配對的應(yīng)用本發(fā)明的組合物和用本發(fā)明方法制備的組合物任選存在于細(xì)胞內(nèi)。然后可將本發(fā)明的O-tRNA/O-RS配對或各組分用于宿主系統(tǒng)的翻譯機(jī)制中,從而將非天然氨基酸摻入蛋白質(zhì)。Schultz等人的名為"非天然氨基酸的體內(nèi)摻入"的國際公布號WO2002/085923描述了該方法,該篇文獻(xiàn)以引用的方式納入本文。例如,當(dāng)O-tRNA/O-RS配對引入宿主,例如大腸桿菌細(xì)胞或酵母時,該配對對選擇者密碼子,例如琥珀無義密碼子起反應(yīng)而將可外源性加入生長培養(yǎng)基的非天然氨基酸在體內(nèi)摻入蛋白質(zhì),例如肌紅蛋白測試蛋白或治療蛋白中。本發(fā)明的組合物可以任選處于體外翻譯系統(tǒng),或細(xì)胞體內(nèi)系統(tǒng)中。含非天然氨基酸的蛋白質(zhì)的應(yīng)用范圍廣泛。例如摻入蛋白質(zhì)的非天然部分可作為廣泛修飾的靶標(biāo),如與其它蛋白質(zhì)、與小分子如標(biāo)記物或染料和/或生物分子交聯(lián)。通過這些修飾,摻入非天然氨基酸可產(chǎn)生改進(jìn)的治療蛋白,可用于改變或提高酶的催化功能。在一些方面,蛋白質(zhì)中摻入非天然氨基酸和隨后進(jìn)行修飾有助于研究蛋白質(zhì)的結(jié)構(gòu)、與其它蛋白質(zhì)的相互作用,等等。試劑盒試劑盒也是本發(fā)明特征之一。例如,提供用于在嚙齒動物或靈長動物細(xì)胞中產(chǎn)生含至少一個非天然氨基酸的蛋白質(zhì)的試劑盒,所述試劑盒中裝有至少一個容器,而該容器含有編碼O-tRNA的多核苷酸序列和/或編碼O-RS的多核苷酸序列、和/或0-RS多肽。在一個實施方式中,所述試劑盒還包含非天然氨基酸。在另一實施方式中,所述試劑盒還包含制備含有非天然氨基酸的蛋白質(zhì)的使用說明材料。實施例提供以下實施例只是為了說明,并非要限制本發(fā)明。技術(shù)人員應(yīng)該知道可以改變各種非關(guān)鍵性參數(shù)而不會脫離本發(fā)明的范圍。應(yīng)該知道,本文所述的實施例和實施方式只是為說明目的,本領(lǐng)域技術(shù)人員借鑒這些實施例和實施方式可以作出各種改進(jìn)或改變而仍屬于本申請的構(gòu)思和權(quán)限以及隨附權(quán)利要求書的范圍內(nèi)。實施例l用非哺乳動物翻譯組件進(jìn)行無義抑制的技術(shù)限制在哺乳動物細(xì)胞中遺傳編碼非天然氨基酸的一種策略是使現(xiàn)有的大腸桿菌或釀酒酵母宿主系統(tǒng)中生成的突變tRNA/aaRS對適應(yīng)(哺乳動物細(xì)胞)。因為大腸桿菌的tRNA^鑒別元件,包括可變臂和接納莖中G1:C72堿基對,與哺乳動物細(xì)胞不同(Wang和Schultz"擴(kuò)展遺傳密碼"(ExpandingtheGeneticCode)v4"geuw2^eC7zem/e五d,44(1):34-66(2005);以及Bonnefond等(2005),"tRNA(Tyr)/TyrRS氨?;到y(tǒng)的演化"(EvolutionofthetRNA(Tyr)/TyrRSaminoacylationsystems)歷oc/z/m/e87:873-883),不幸的是,細(xì)菌中使用的tRNA/aaRS對不大可能在真核細(xì)胞中正交。相反,釀酒酵母和哺乳動物細(xì)胞中的tRNA經(jīng)相似處理并具有同樣的鑒別元件(Bonnefond等(2005),"tRNA(Tyr)/TyrRS氨?;到y(tǒng)的演化"(EvolutionofthetRNA(Tyr)/TyrRSaminoacylationsystems)歷oc/z/脂'e87:873-883)。此外,因為釀酒酵母的翻譯機(jī)器也與高等真核生物同源,因此可能將酵母中演化的經(jīng)修飾的正交tRNA/aaRS對轉(zhuǎn)移到哺乳動物細(xì)胞中。事實上,Yokoyama及其同事在CHO細(xì)胞中使用酵母中演化的EcTyrRS變體來接受對-苯甲酰-L-苯丙氨酸(pBpa),將該光反應(yīng)性氨基酸摻入到人Grb2蛋白中(Hino等(2005),"哺乳動物細(xì)胞中通過定點摻入光反應(yīng)性氨基酸進(jìn)行蛋白光交聯(lián)"(Proteinphoto-cross-linkinginmammaliancellsbysite-specificincorporationofaphotoreactiveaminoacid,"AtoMe/Zzcxis12,201-206)。不幸的是,具有功能活性的大腸桿菌tRNA〖^不能在哺乳動物細(xì)胞中很好地表達(dá),嚴(yán)重限制了突變蛋白的產(chǎn)率(Sakamoto等(2002),"在哺乳動物細(xì)胞中將非天然氨基酸定點摻入蛋白質(zhì)中"(Site-specificincorporationofanunnaturalaminoacidintoproteinsinmammaliancells)_iVwc/eZc爿c/cfe30:4692-4699)。實施例2在哺乳動物細(xì)胞中創(chuàng)建新的無義抑制系統(tǒng)為了克服上述正交tRNA表達(dá)的局限性,本發(fā)明提供了一種常用方法允許將酵母中演化的突變抑制tRNA/aaRS對轉(zhuǎn)移到哺乳動物細(xì)胞中使用。本文所展示的該方法以及新的正交系統(tǒng)在嚙齒類CHO宿主細(xì)胞和靈長類(人)293T宿主細(xì)胞中將數(shù)種非天然氨基酸有效引入到綠色熒光蛋白中。盡管用這兩種細(xì)胞進(jìn)行實驗,但本發(fā)明能夠廣泛應(yīng)用于來自多種物種的哺乳動物宿主細(xì)胞中。創(chuàng)建新的哺乳動物無義抑制系統(tǒng)真核細(xì)胞中tRNA由RNA聚合酶III轉(zhuǎn)錄,該聚合酶識別兩個保守的基因內(nèi)部轉(zhuǎn)錄控制元件,即A和B盒(Sprague,《真核tRNA基因轉(zhuǎn)錄》(rramc〃;p"owo/£wtoo;o"cfiA^Gewe^,AMS出版社,華盛頓特區(qū);1994)。大腸桿菌tRNATyr僅具有B盒元件,研究表明引入假-A盒產(chǎn)生不能被五cTyrRS識別的無功能tRNA(Sakamoto等,"在哺乳動物中將非天然氨基酸定點摻入蛋白質(zhì)中"(Site-specificincorporationofanunnaturalaminoacidintoproteinsinmammaliancells)A^c/e/cJc^si^30:4692-4699(2002))。不同于大腸桿菌tRNATyr,來自嗜熱脂肪芽孢桿菌的tRNATyr(其具有相似的鑒別元件并且仍可被EcTyrRS加載,Bedouelle,"酪氨酰-tRNA合成酶識別tRNA(Tyr)"(RecognitionoftRNA(Tyr)bytyrosyl-tRNAsynthetase)72,589-598(1990))具有天然產(chǎn)生的內(nèi)部A和B盒。因此,該tRNA與五cTyrRS能夠在哺乳動物細(xì)胞中行使正交tRNA/aaRS對的功能(Sakamoto等(2002),"在哺乳動物中將非天然氨基酸定點摻入蛋白質(zhì)中"(Site-specificincorporationofanunnaturalaminoacidintoproteinsinmammaliancells)TVwc/e/cJc/<is30:4692-4699)。構(gòu)建并表達(dá)琥珀抑制子正交tRNA為提供琥珀抑制子SytRNAg^,將^tRNATyr三核苷反密碼子改變?yōu)镃(34)UA。因為原核tRNATyr的G34僅為TyrRS的一個弱鑒別元件(Hou和Schimmel(1989),"用體外動力學(xué)參數(shù)建模詳述體內(nèi)轉(zhuǎn)移RNA種類"(Modelingwithw>okineticparametersfortheelaborationoftransferRNAidentityv/vo)說oc/zem^^y28:4942-4947),所以G34C突變體應(yīng)當(dāng)不顯著影響EcTyrRS與5stRNA〖的結(jié)合。此外,因為哺乳動物基因組TAG終止密碼子的出現(xiàn)頻率較低(智人的TAG,23%;TAA,30%;TGA,47%),所以在哺乳動物細(xì)胞中無義琥珀抑制應(yīng)當(dāng)比蛋白石或赭石抑制更加耐受。因為真核生物中5對RNAg,基因的表達(dá)也依賴于5'側(cè)接序列,所以將人tRNA^的5'側(cè)接序列加到^tRNA^上以增強其在哺乳動物中的轉(zhuǎn)錄。為進(jìn)一步增加5對RNA然,的轉(zhuǎn)錄,構(gòu)建了含三個串連重復(fù)的5dRNA^基因的基因簇,將該基因簇插入到pUC18質(zhì)粒中得到pUC18-35對RNA^。對提取自pUC18-35stRNA^轉(zhuǎn)染CHO細(xì)胞的總tRNA進(jìn)行Northern印跡分析,顯示RrtRNA^的水平是僅含單一拷貝5rtRNA^的pUC18質(zhì)粒轉(zhuǎn)染細(xì)胞的兩倍。正交合成酶的表達(dá)下一步,將野生型EcTyrRS基因插入哺乳動物表達(dá)載體pcDNA4/TO/myc-HisA中得到pcDNA4-五cTyrRS,其表達(dá)受到四環(huán)素(Tet)-調(diào)節(jié)的CMV啟動子的控制。使用誘導(dǎo)型表達(dá)意在降低在哺乳動物細(xì)胞中異源表達(dá)五cTyrRS可能產(chǎn)生的毒性。展示功能性五cTyrRS/BstRNA忠力正交對在哺乳動物細(xì)胞中檢測所得抑制子&tRNA〖^/£cTyrRS對有效抑制模型綠色熒光蛋白GFP(GFP37TAG)Y37位的琥珀密碼子突變的能力。因為Y37位于GFP表面,并遠(yuǎn)離熒光團(tuán),因此預(yù)計在此位點引入非天然氨基酸不會影響蛋白的折疊和熒光屬性(Ormo等(1996),"水母04e《wo^flv/cto^綠色熒光蛋白的晶體結(jié)構(gòu)"(CrystalstructureoftheJegworeav/"on'agreenfluorescentprotein)&/ece273:1392-1395)。并且GFP37TAG的琥珀抑制導(dǎo)致全長GFP表達(dá),提供快速定量測定琥珀抑制效率的實驗方法。將突變GFP37TAG基因插入pcDNA4/TO/myc-HisA得到pcDNA4-GFP37TAG,其中GFP與myc和6xHis表位在C末端融合,并處于Tet-調(diào)節(jié)的啟動子的控制下。在英杰tmT-RExTM嚙齒類CHO和人293細(xì)胞中檢測fetRNA^/五cTyrRS對抑制GFP37TAG無義琥珀密碼子的能力。兩種細(xì)胞系均組成型表達(dá)四環(huán)素阻抑物并適合使用pcDNA4/TO/myc-HisA質(zhì)粒進(jìn)行Tet-調(diào)節(jié)的蛋白表達(dá)。細(xì)胞生長至80-90。/。鋪滿(英杰tmT-RExCHO細(xì)胞生長于含10%FBS、1%青鏈霉素、2mML-谷氨酰胺、10pg/ml殺稻瘟素的F12培養(yǎng)基中;英杰頂T-RExTM293細(xì)胞生長于含10%FBS、1%青鏈霉素、2mML-谷氨酰胺和5pg/ml殺稻瘟素的DMEM中),使用羅氏應(yīng)用科學(xué)部(RocheAppliedScience)的FuGENE⑧進(jìn)行瞬時轉(zhuǎn)染,每2x106個細(xì)胞使用3嗎質(zhì)粒(0.5|igpUC18-3&tRNA^、0.5嗎pcDNA4UyrRS、2(igpcDNA4-GFP37TAG;當(dāng)pUC18-3&tRNAg;或pcDNA4-EcTyrRS不存在時用等量pUC18替換)。轉(zhuǎn)染6小時后加入1|ig/ml四環(huán)素誘導(dǎo)蛋白質(zhì)表達(dá),細(xì)胞在37。C生長兩天。在兩種細(xì)胞系中,全長GFP的表達(dá)依賴于5rfRNA^和EcTyrRS基因的存在(參見圖13A和13B)。當(dāng)用pcDNA4-GFP37TAG和pcDNA4-£cTyrRS或單獨pUC18-3&tRNA^轉(zhuǎn)染時,細(xì)胞不呈現(xiàn)綠色熒光。這些實驗證明,僅五cTyrRS使AtRNA〖^獲得負(fù)載,并且fctRNA〖^/五cTyrRS對在靈長類細(xì)胞和嚙齒類細(xì)胞中有效行使抑制無義琥珀密碼子的功能。實施例3用6種非天然氨基酸證明系統(tǒng)的普遍性驗證該正交系統(tǒng)的一般性。在該測試系統(tǒng)中,檢測了5對RNA〖^和6種五cTyrRS変體在英杰tmT-RExCHO和293細(xì)胞系中將各種對應(yīng)的非天然氨基酸摻入GFP37TAG的能力。6種五cTyrRS變體最初在釀酒酵母中演化并編碼下列非天然氨基酸對-甲氧基-L-苯丙氨酸(pMpa);對-乙?;?L-苯丙氨酸(pApa);對-苯甲酰-L-苯丙氨酸(pBpa);對-碘代-L-苯丙氨酸(plpa);對-疊氮基-L-苯丙氨酸(pAzpa);對-炔丙基氧基苯丙氨酸(pPpa)圖1結(jié)構(gòu)1-6顯示了這些非天然氨基酸的結(jié)構(gòu)。選擇和分離這些合成酶變體的方法參見例如Chin等(2003),"擴(kuò)展的真核遺傳密碼"(Anexpandedeukaryoticgeneticcode)Sc/ewce301,964-967;Deiters等(2003),"在釀酒酵母的遺傳密碼中力卩入新反應(yīng)性的氨基酸"(AddingaminoacidswithnovelreactivitytothegeneticcodeofiSacc/zarowycescerev/s/ae)J"CTzem<Soc125:11782-11783;Deiters,2004年4月16日提交的WO2005/003294"非天然反應(yīng)性氨基酸遺傳密碼增加"(UNNATURALREACTIVEAMINOACIDGENETICCODEADDITIONS);Deiters,2膨牟9y727:連爻游WO2006/034410"在遺傳密碼中加入光調(diào)節(jié)性氨基酸"(ADDINGPHOTOREGULATEDAMINOACIDSTOTHEGENETICCODE)。將6種AcTyrRS基因中的每一種插入到pcDNA4/TO/myc-HisA中得到pcDNA4-五cTyrRS衍生物,Western印跡分析aaRS在T-RExCHO和293細(xì)胞中的表達(dá)(圖14)。所有6種EcTyrRS變體在T-RExCHO和T-RExTM293細(xì)胞中顯示相似的表達(dá)水平。然后在培養(yǎng)基中存在或不存在非天然氨基酸的條件下檢測6種五cTyrRS變體和^tRNA^—起抑制GFP37TAG中琥珀密碼子的能力。如對野生型EcTyrRS所述用質(zhì)粒瞬時轉(zhuǎn)染細(xì)胞。轉(zhuǎn)染6小時后,換用新鮮培養(yǎng)基,其中含1嗎/ml四環(huán)素并補充相應(yīng)的非天然氨基酸(pMpa,10mM;pApa,10mM;pBpa,ImM;plpa,8mM;pAzpa,5mM;或pPpa,1mM)。T-RExTMCHO細(xì)胞培養(yǎng)24小時,T-RExTM293細(xì)胞培養(yǎng)48小時,然后收獲細(xì)胞。在T-RExTMCHO和293細(xì)胞中,全長GFP37TAG的表達(dá)依賴于生長培養(yǎng)基中非天然氨基酸的存在,如圖2和3所示。在缺少非天然氨基酸時,未檢測到GFP表達(dá)(〈1。/。),表明EcTyrRS變體特異性、高保真地使S對RNA^攜帶其關(guān)聯(lián)非天然氨基酸。觀察到T-RExCHO細(xì)胞中含plpaGFP表達(dá)水平低,而在T-REx293細(xì)胞中無含plpaGFP表達(dá),這也許是因為plpa有細(xì)胞毒性(在8mMplpa存在條件下,T-RExTM293細(xì)胞在6小時內(nèi)死亡)。實施例4表達(dá)摻入對-甲氧基-L-苯丙氨酸的正交組件的改良質(zhì)粒表達(dá)系統(tǒng)因為異源表達(dá)對-甲氧基-L-苯丙氨酸-tRNA合成酶(pMpaRS)在所用生長條件下未顯示出任何明顯的細(xì)胞毒性,因此修飾含pMpaRS基因的質(zhì)粒,以編碼(a)3個串聯(lián)重復(fù)的^tRNA^基因,以及(b)pMpaRS基因(圖4A中pSWAN-pMpaRS)。在非調(diào)節(jié)CMV啟動子后直接插入pMpaRS基因用于有效持續(xù)表達(dá)pMpaRS。構(gòu)建另一質(zhì)粒(圖4B中pSWAN-GFP37TAG),同時含有三個串聯(lián)重復(fù)&tRNA^基因和GFP37TAG基因。在Tet-調(diào)節(jié)的CMV啟動子后插入編碼GFP37TAG的基因以最小化哺乳動物細(xì)胞內(nèi)源性琥珀抑制引起的無義琥拍密碼子通讀的可能。然后檢測這兩個質(zhì)粒的抑制效率。因為兩個質(zhì)粒均含有三個串聯(lián)重復(fù)的5對RNAg,基因,所以預(yù)計無法通過改變兩種質(zhì)粒的比例增加抑制水平來改變轉(zhuǎn)染細(xì)胞的^rtRNAg,基因的總量。在優(yōu)化的轉(zhuǎn)染條件下(每2x106個細(xì)胞O.5嗎pSWAN-pMpaRS和2.5嗎pSWAN-GFP37TAG),抑制水平大概是使用三個質(zhì)粒pUC18-35對RNA^、pcDNA4-pMpaRS和pcDNA4-GFP37TAG的兩倍(通過熒光細(xì)胞數(shù)測定抑制水平)。誘導(dǎo)后細(xì)胞生長1-2天,在收集前保持活力。對含pMpa的突變GFP(GFP-pMpa)的產(chǎn)量進(jìn)行定量。在培養(yǎng)基中存在10mMpMpa時,可從2x107個貼壁T-RExTMCHO細(xì)胞中得到1|_ig突變GFP。實施例5質(zhì)譜和保真度分析為進(jìn)一步鑒定GFP-pMpa,在用pSWAN-pMpaRS和pSWAN-GFP37TAG瞬時轉(zhuǎn)染的T-RExCHO細(xì)胞中表達(dá)突變蛋白。用抗-myc抗體瓊脂糖柱純化蛋白并用SDS-PAGE分離。用胰蛋白酶消化來自SDS-PAGE凝膠的GFP-pMpa條帶并用納米反相液相層析/質(zhì)譜/質(zhì)譜(納米-RPLC/MS/MS)進(jìn)行分析。平行的,從轉(zhuǎn)染pcDNA4-GFP的細(xì)胞中純化野生型GFP并進(jìn)行相同分析。含片段FSVSGEGEGDATY*GK(參見圖5和SEQIDNO:103,其中Y*代表酪氨酸或pMpa)的突變蛋白的胰蛋白酶解Y37的串聯(lián)質(zhì)譜圖揭示了強pMpa峰,表明有效的pMpa摻入(參見圖6和圖7)。與野生型GFP相比,含離子(ys-yi4)的Y+都發(fā)生14Da的質(zhì)量漂移,這與酪氨酸和pMpa的質(zhì)量差準(zhǔn)確吻合。Y離子系列的質(zhì)量漂移以及圖7中觀察到bn離子的相同質(zhì)量漂移明確指示了pMpa的摻入位點是GFP的37位。也獲得了含pMpa肽和含酪氨酸肽的MS峰的比值。FSVSGEGEGDATY*GK(參見圖5和SEQIDNO:103)前體離子的單一離子色譜的積分表明pMpa摻入的高保真度(>99.9%)。根據(jù)監(jiān)測串聯(lián)質(zhì)譜數(shù)據(jù)中3個最豐富的片段離子(y9、yn和yu)作出的推測表明甚至更高的純度(99.93。/c0。為了獲取親本蛋白的質(zhì)量,將抗-myc抗體柱純化的突變蛋白進(jìn)行ESITOF-MS分析。缺少N-末端甲硫氨酸的乙酰化突變蛋白的理論質(zhì)量為29,696.00Da,這與圖8中帶電態(tài)解巻積ESITOF-MS譜觀察到的29,696.0Da的主要組分良好吻合。29,654.0Da的一個較小特征峰指定為缺少N-末端乙?;腉FP-pMpa的質(zhì)量。未檢測到野生型GFP信號或表明摻入多個pMpa的信號。該結(jié)果進(jìn)一步確認(rèn)在GFP37位選擇性摻入pMpa。實施例6用于表達(dá)摻入pApa、pBpa、plpa、pAzpa和pPpa的正交組件的改良質(zhì)粒表達(dá)系統(tǒng)通過亞克隆編碼不同合成酶變體的基因重新工程改造質(zhì)粒,以提供其它pSWAN-EcTyrRS變體雙質(zhì)粒系統(tǒng)。這些合成酶變體為對-乙?;?L-苯丙氨酸-tRNA合成酶(pApaRS)對-苯甲酰-L-苯丙氨酸-tRNA合成酶(pBpaRS)對-碘代-L-苯丙氨酸-tRNA合成酶(pIpaRS)對-疊氮基-L-苯丙氨酸-tRNA合成酶(pAzpaRS)對-炔丙基氧基-L-苯丙氨酸-tRNA合成酶(pPpaRS)pSWANUyrRS變體和pSWAN-GFP37TAG(每2xl06個細(xì)胞0.5嗎pSWAN-五cTyrRS變體和2.5嗎pSWAN-GFP37TAG)瞬時轉(zhuǎn)染T-RExCHO和293細(xì)胞所提供的抑制水平均為三種質(zhì)粒pUC18-3BMRNA^、pcDNA4-五cTyrRS變體和pcDNA4-GFP37TAG轉(zhuǎn)染時的大約兩倍(plpa特異性變體除外)。也在pSWAN-五cTyrRS變體和pSWAN-GFP37TAG轉(zhuǎn)染的T-RExCHO細(xì)胞中表達(dá)含pApa、pBpa、pAzpa或pPpa的突變GFP,在含對應(yīng)非天然氨基酸的培養(yǎng)基(pApa,10mM;pBpa,1mM;pAzpa,5mM或pPpa,1mM)中培養(yǎng)細(xì)胞l-2天,并用抗-myc抗體柱純化。含pApa和pAzpa突變蛋白的產(chǎn)率與pMpa接近(每2x107個細(xì)胞約1pg蛋白),含pBpa和pPpa突變蛋白的產(chǎn)率較低(每2x107個細(xì)胞0.7|ig蛋白)。因為五cTyrRS變體在T-RExCHO細(xì)胞中的表達(dá)水平相似,所以含pBpa和pPpa突變蛋白的產(chǎn)率較低也許是因為培養(yǎng)基中非天然氨基酸濃度較低。同樣利用納米-RPLC/MS艇S分析突變GFP蛋白,獲取胰蛋白酶解片段FSVSGEGEGDATY*GK(圖5和SEQIDNO:103)的串聯(lián)質(zhì)譜圖。串聯(lián)質(zhì)譜數(shù)據(jù)(圖9-12)清楚顯示在GFP37位摻入非天然氨基酸。僅可檢測到微弱的含pAzpa的突變GFP。更仔細(xì)的分析數(shù)據(jù)揭示了存在含對-氨基苯丙氨酸的肽(圖15),考慮到疊氮基的化學(xué)反應(yīng)性和光不穩(wěn)定性這不足為奇(曾經(jīng)從含pAzpa肽的質(zhì)譜分析中觀察到pAmpa;Chin等(2003),"擴(kuò)展的真核遺傳密碼進(jìn)展"(Progresstowardanexpandedeukaryoticgeneticcode)CTzew5/o/10,5U-519)。鑒別出pBpa樣品中痕量的野生型肽,但信號太弱無法準(zhǔn)確計算pBpa/酪氨酸比值。在pApa、pAzpa和pPpa樣品中未探測到野生型信號。來自所有5種突變蛋白的數(shù)據(jù)表明非天然氨基酸摻入的高選擇性和保真度。實施例7討論/結(jié)論在哺乳動物基因組中,琥珀終止密碼子的出現(xiàn)頻率較高(人23%),而大腸桿菌相比較低(7%)。因此,如果必需蛋白未被正確終止,琥珀抑制也許具有細(xì)胞毒性。Yokoyama和同事證明,使關(guān)聯(lián)tRNA攜帶3-碘代-L-酪氨酸的突變五cTyrRS的誘導(dǎo)表達(dá)將可能的細(xì)胞毒性降到最低,這種毒性來自在缺少3-碘代-L-酪氨酸時突變aaRS造成的內(nèi)源性酪氨酸背景摻入。本發(fā)明提供了該問題的解決方案。所有五cTyrRS變體都曾在釀酒酵母中由兩步正向/負(fù)向選擇方案演化,從而去除了摻入內(nèi)源性氨基酸的aaRS變體。pSWAN-£cTyrRS變體和pSWAN-GFP37TAG共轉(zhuǎn)染細(xì)胞后,在缺少非天然氨基酸的條件下觀察不到GFP37TAG中無義琥珀密碼子的通讀,表明在缺少非天然氨基酸的條件下tRNA/aaRS對不足以有效抑制天然TAG終止密碼子。因此在缺少非天然氨基酸的條件下穩(wěn)定表達(dá)tRNA和aaRS蛋白的細(xì)胞系能夠存活。因為未觀察到內(nèi)源性琥珀抑制,含非天然氨基酸的靶蛋白的表達(dá)也無須誘導(dǎo)。產(chǎn)生維持tRNA、aaRS和耙蛋白基因的穩(wěn)定細(xì)胞系能夠在補充非天然氨基酸時有效產(chǎn)生含非天然氨基酸的靶蛋白。在當(dāng)前所述原理論證實驗中,宿主哺乳動物細(xì)胞能夠存活至加入非天然氨基酸3天后,這大概足夠重組蛋白的表達(dá)。這些實驗已成功擴(kuò)展到其它非天然氨基酸中,包括1,5-丹磺酰丙氨酸、鄰-硝基芐基半胱氨酸和(x-氨基辛酸。并不意味本發(fā)明僅限于本文所述細(xì)胞系或非天然氨基酸。實施例8哺乳動物細(xì)胞中的光調(diào)節(jié)性蛋白序列在要求保護(hù)的翻譯系統(tǒng)和方法的一些實施方式中,所述非天然氨基酸是光調(diào)節(jié)性氨基酸,如鄰-硝基芐基絲氨酸、鄰-硝基芐基半胱氨酸、(X-氨基辛酸及其它??墒褂霉庹{(diào)節(jié)性氨基酸(如光致變每的、光切割的、光異構(gòu)化的等)從空間和時間上控制許多生物學(xué)過程,如通過直接調(diào)節(jié)酶、受體、離子通道等的活性,或通過調(diào)節(jié)不同信號分子的細(xì)胞內(nèi)濃度。參見,如Shigeri等,尸/zwmaco/.7Tzera;e化,2001,91:85+;Curley等,尸/zarmaco/.77zera/ew"1999,82:347+;Curley等,CwmQp.Oiem.1999,3:84+;"籠蔽化合物"(CagedCompounds)《酶學(xué)方法》(MethodsinEnzvmologv),Marriott,G.編,科學(xué)出版社,紐約,1998,291巻;Adams等,j臓.化v.尸—。/"1993,55:755+;以及Bochet等,/Oem.6bc.,尸erh7z2002,125+。為了提高源自大腸桿菌tRNALeu的琥珀抑制子tRNA的轉(zhuǎn)錄水平,將抑制子tRNA置于人起始子(initiator)tRNAMet5,-和3,-側(cè)接序列的控制之下。在CHO細(xì)胞和人293T細(xì)胞中使用過度轉(zhuǎn)錄的琥珀抑制子tRNA以及對鄰-硝基芐基半胱氨酸有特異性的突變大腸桿菌亮氨酰-tRNA合成酶將該非天然氨基酸定點摻入人胱冬酶原-3活性位點。在鄰-硝基節(jié)基半胱氨酸存在條件下表達(dá)蛋白,然后將細(xì)胞暴露于紫外線5分鐘觸發(fā)細(xì)胞死亡,表明紫外線誘導(dǎo)從非天然半胱氨酸殘基上切割硝基芐基,恢復(fù)了胱冬酶原-3的活性,觸發(fā)了細(xì)胞凋亡。該實驗證實了在活哺乳動物細(xì)胞中用鄰-硝基芐基半胱氨酸選擇性取代蛋白質(zhì)中的活性位點半胱氨酸可用于,例如,通過使用諸如紫外線等從空間上控制蛋白活性。用具有不同反應(yīng)性位點基團(tuán)的蛋白可獲取相似結(jié)果(例如,在絲氨酸蛋白酶活性位點殘基上使用-/TJ^If^^A^^o關(guān)于光籠蔽和光調(diào)節(jié)氨基酸的進(jìn)一步細(xì)節(jié)可在如下PCT公開文本中找到WO2006/034410,Dieters等(2006年3月30日),"在遺傳密碼中加入光調(diào)節(jié)性氨基酸"(ADDINGPHOTOREGULATEDAMINOACIDSTOTHEGENETICCODE),通過引用將其內(nèi)容整體納入本文。實施例9材料和方法:哺乳動物細(xì)胞轉(zhuǎn)染和Western印跡分析T-RExTMCHO和T-RExTM293細(xì)胞(英杰TM)組成型表達(dá)四環(huán)素抑制子,其調(diào)節(jié)插入pcDNA4/TO/myc-HisA質(zhì)粒的基因的表達(dá)。用含10%FBS(英杰頂)、1。/。青鏈霉素(英杰tm)、2mML-谷氨酰胺(英杰tm)和io昭/ml系稻瘟素(英杰tm)的F-12培養(yǎng)基(英杰tm),在含5%C02的37°C潮濕環(huán)境中培養(yǎng)T-RExCHO細(xì)胞。用含有10n/。FBS、1%青鏈霉素、2mML-谷氨酰胺和5ng/ml殺稻瘟素的吉布科D-MEM培養(yǎng)基(英杰tm),在含5%C02的37°C潮濕環(huán)境中培養(yǎng)T-REx293細(xì)胞。細(xì)胞在克斯塔(Costarf6-孔培養(yǎng)板中生長至80-90%鋪滿,然后利用質(zhì)粒和FuGENE6(羅氏應(yīng)用科學(xué)部)(9piFuGENE+3|ig質(zhì)粒)進(jìn)行轉(zhuǎn)染。轉(zhuǎn)染6小時后,換成含1|ig/ml四環(huán)素的新鮮培養(yǎng)基。為了檢測在對應(yīng)非天然氨基酸存在下EcTyrRS變體的琥珀抑制,在新鮮培養(yǎng)基中加入非天然氨基酸。培養(yǎng)基中非天然氨基酸的濃度為10mMpMpa(巴凱公司(Bachem,Inc》、10mMpApa(新凱公司(Synchem,Inc))、1mMpBpa(巴凱公司)、8mMpIpa(巴凱公司)、5mMpAzpa(巴凱公司)以及1mMpPpa。如前所述合成手性純pPpa(Deiters等(2003),"在釀酒酵母的遺傳密碼中加入具有新反應(yīng)性的氨基酸"(AddingaminoacidswithnovelreactivitytothegeneticcodeofiSWcc/wrowycescereWw'ae)C7zem<Sbc125:11782-11783)。在力卩入四環(huán)素后繼續(xù)培養(yǎng)T-RExCHO細(xì)胞24小時,收集細(xì)胞;T-RExTM293細(xì)胞則在孵育48小時后收集。為了進(jìn)行Western印跡分析,在含1:100稀釋的蛋白酶抑制劑混合物(西格瑪公司(sigma))的RIPA緩沖液(UB公司/密理博公司(UpstateBiotechnology/Millipore))中裂解收集的細(xì)胞。在變性條件下用SDS-PAGE分離上清,并轉(zhuǎn)移到0.45fim硝酸纖維素膜(英杰tm)上。對于T-RExTMCHO細(xì)胞,固化于膜上的蛋白質(zhì)用抗-myc抗體(英杰tm;1:5000稀釋)作為一抗,抗-小鼠IgG-HRP(英杰tm)作為二抗進(jìn)行檢測。用皮爾斯公司(PIERCE)ECLWestern印跡底物進(jìn)行化學(xué)發(fā)光檢測。對于T-RExTM293細(xì)胞,用抗-His-HRP(英杰tm;1:5000稀釋)探測并用皮爾斯公司(P正RCE)ECLWestern印跡底物進(jìn)行檢測材料和方法細(xì)菌細(xì)胞轉(zhuǎn)染使用前10位的大腸桿菌細(xì)胞(英杰tm)克隆、維持并擴(kuò)增質(zhì)粒。使用P/c高保真DNA聚合酶(英杰tm)進(jìn)行聚合酶鏈反應(yīng)(PCR)。使用FuGENE6(羅氏應(yīng)用科學(xué)部)作為轉(zhuǎn)染試劑。所有質(zhì)粒均經(jīng)測序校驗。實施例10材料和方法質(zhì)粒構(gòu)建PUC18-355TRNA^通過使四種寡聚脫氧核苷酸退火構(gòu)建^tRNAg,基因(集成DNA技術(shù)公司(IntegratedDNATechnologies,Inc))。該基因由缺少人tRNA7"基因的3'-CCA和5'-側(cè)接序列的相應(yīng)tRNA序列組成(SEQIDNO:104)將兩個限制性位點整合到合成DNA雙鏈體中,五coi/整合入5'端,Sam歷整合入3'端,然后將其插入pUC18得到pUC18-5對RNA^。然后,通過PCR擴(kuò)增pUC-5對RNA^中的^tRNA^。將5'端含有5g///限制性位點且3'端含有5flm/Z/位點的擴(kuò)增的&tRNA^插入pUC18-B對RNA^的Bami//限制性位點中,得到pUC18-2BstRNA[:。質(zhì)粒pUC18-25stRNA^僅含有一個5ami//限制性位點,用該位點引入另一個拷貝的5rtRNA^,得到pUC18-35對RNA^。通過PCR擴(kuò)增p£"cTyrRS/tRNACUA得到五cTyrRS和其六種變體(Chin等(2003),"擴(kuò)展的真核遺傳密碼"(Anexpandedeukaryoticgeneticcode),Sc/e"ce301:964-967),然后將其插入pcDNA4/TO/myc-HisA質(zhì)粒(英杰(Invitrogen)TM)的力a/和^a/位點中,得到pcDNA4-五cTyrRS載體。將五cTyrRS基因設(shè)置在兩個四環(huán)素操縱子序列和CMV啟動子之后,CMV啟動子能在英杰TMT-RExTM細(xì)胞系中指導(dǎo)四環(huán)素調(diào)節(jié)的基因表達(dá)。也將它們連接于c-myc表位,以便進(jìn)行Western印跡分析。六種五cTyrRS變體中的突變是pMpaRS:Y37V/D182S/F183MpApaRS:Y37I/D182G/F183M/L186ApBpaRS:Y37G/D182G/F183Y/L186MpIpaRS:Y37I/D183S/F183MpAzpaRS:Y37L/D182S/F183M/L186ApPpaRS:Y37S/D182T/F183M/L186VpcDNA4-JgcTvrRS和pcDNA4-GFP37TAG將野生型增強的GFP基因插入載體pcDNA4/TO/myc-HisA的^&a/和j;a/位點內(nèi),產(chǎn)生pcDNA4-GFP。在pcDNA4-GFP中,在C末端將該GFP基因與myc表位和6xHis標(biāo)簽連接,以便對表達(dá)的蛋白質(zhì)進(jìn)行Western印跡分析和親和純化。通過(^^1^11&1^6@定點誘變試劑盒(司查塔基公司(8&&1&§6116))產(chǎn)生Y37的三聯(lián)體密碼子突變成TAG琥珀密碼子的質(zhì)粒cDNA4-GFP37TAG。pSWAN-五cTvrRS變體和pSWAN-GFP37TAG為了構(gòu)建pSWAN-汝TyrRS變體,利用5am///和五coi7限制性酶由pUC18-3&tRNA^分離3&tRNA^,將其插入pcDNA3.1/hygro(+)(英杰頂)的5g/7/和Tl^e/位點中,得到pcDNA-35stRNA^。然后,將編碼此六種五cTyrRS變體的基因插入pcDNA-3&tRNA^的^a/和^a/位點中,得到pSWANUyrRS變體。為了產(chǎn)生pSWAN-GFP37TAG,擴(kuò)增pSWANUyrRS載體并用Mw/和戶c//限制性酶消化。通過瓊脂糖凝膠電泳分離消化的片段,通過QIAquicl^凝膠純化試劑盒(凱杰(QIAGENf)純化含有3ArtRNA^的片段。通過PCR擴(kuò)增從CMV啟動子到BGH聚A位點的pcDNA4-GFP37TAG片段,用M"/和尸c//限制性酶消化,然后與含有3S對RNA^的pSWAN-五cTyrRS片段連接,得到pSWAN-GFP37TAG(4000bp)。實施例11材料和方法蛋白質(zhì)表達(dá)和純化利用pSWAN-五cTyrRS變體和pSWAN-GFP37TAG表達(dá)含有非天然氨基酸的突變GFP。在75cm4且織培養(yǎng)瓶(BD生物科學(xué)公司(BDBiosciences))中培養(yǎng)T-RExCHO細(xì)胞(英杰tm)至80-90%鋪滿,用60piFuGENE6以及2嗎pSWAN-五cTyrRS和10嗎pSWAN-GFP37TAG轉(zhuǎn)染。培育過夜后,將培養(yǎng)基更換為含有非天然氨基酸(pMpa,10mM;pApa,10mM;pBpa,1mM;pAzpa,5mM;和pPpa,1mM)和1(ig/ml四環(huán)素的新鮮培養(yǎng)基。然后,37°C培養(yǎng)細(xì)胞l-2天,收獲細(xì)胞,用RIPA裂解緩沖液裂解。細(xì)胞裂解物的上清液用PBS緩沖液透析和平衡,然后加載到抗-myc抗體瓊脂糖柱(西格馬公司(Sigma))上。用15倍柱體積的PBS緩沖液洗柱,然后用O.lM氫氧化銨洗脫。純化的蛋白質(zhì)用0.1M乙酸中和,并用SDS-PAGE分析。剪下對應(yīng)于GFP的條帶進(jìn)行質(zhì)譜分析。為了測定產(chǎn)率和獲得完整蛋白質(zhì)質(zhì)譜,洗脫后將該蛋白濃縮至0.1mg/ml。實施例12材料和方法蛋白酶解用測序級改良的胰蛋白酶(普洛麥格公司(Promega》于37°C培育蛋白質(zhì)過夜,以便使親和純化的蛋白質(zhì)發(fā)生蛋白酶解(對野生型和pBpa樣品進(jìn)行這種操作),其中根據(jù)100mM三乙銨碳酸氫鹽緩沖液(pH8.5)中的蛋白質(zhì)濃度估計值,底物/酶的比例為10:1(wt/wt)。按照改良的EMBL方法(參見德國海德爾堡(Heidelberg,Germany)的EMBL的網(wǎng)站,生物分析研究組(BioanalyticalResearchGroup))進(jìn)行凝膠中消化(對pMpa、pAzpa、pApa和pPpa樣品進(jìn)行)。簡要說,將凝膠塊切成約1mmx1mm的小塊,用水洗滌5分鐘,用乙腈洗滌15分鐘,真空離心干燥,然后用50mM三乙銨碳酸氫鹽緩沖液(pH8.5)配制的12.5納克/微升測序級改良的胰蛋白酶在0°C再水化30分鐘。去除過量緩沖液,將20微升50mM三乙銨碳酸氫鹽緩沖液(pH8.5)加入該凝膠塊,然后于37°C培育過夜。如方案部分所述從所述凝膠塊中提取肽。實施例13材料和方法納米-RPLC/MS/MS用HPLC泵、自動取樣器(加州帕洛阿爾托的安捷倫技術(shù)公司(AgilentTechnologies,PaloAlto,CA))和LTQOrbitmp雜交質(zhì)譜用儀(加州圣何塞的熱電公司(ThermoElectron,SanJose,CA))進(jìn)行納米-RPLC/MS/MS。用壓力泵(pressurebomb)將胰蛋白酶消化物加載到內(nèi)徑為75微米的預(yù)裝4厘米5微米MonitorC18顆粒的預(yù)裝柱(加州安大略的柱工程公司(ColumnEngineering,Ontario,CA))上,流速約為2微升/分鐘。然后,將該預(yù)裝柱連接于HPLC泵,用溶劑A洗滌數(shù)分鐘后,串聯(lián)集成有發(fā)射尖頭(emittertip)的分析柱(360微米外徑x75微米內(nèi)徑;10厘米5微米C18,5微米尖頭)。用100%溶劑A(0.1%乙酸水溶液)至50%溶劑B(0.1%乙酸的乙腈溶液)進(jìn)行色譜40分鐘;通過分析柱的流速約為100納升/分鐘。在依賴數(shù)據(jù)的實驗中,在質(zhì)譜儀上設(shè)定程序,以便首先記錄高分辨Orbitrap掃描,然后記錄全掃描離子阱譜(m/z500-2,000)。然后進(jìn)行10次依賴數(shù)據(jù)的MS/MS掃描(相對碰撞能量二35。/。;3-Da分離窗),觸發(fā)離子阱掃描,最后是兩次耙定MS/MS掃描。第一次靶定MS/MS掃描能分離和片段化預(yù)測的非天然氨基酸修飾肽(FSVSGEGEGDATY'GK;SEQIDNO:103)的雙電荷前體離子。第二次靶定MS/MS掃描總是能分離和片段化野生型肽(FSVSGEGEGDATYGK;SEQIDNO:102)的雙電荷前體離子,其m/z為752.3。用MASCOT(英國倫敦的MS公司(Matrixscience,London,UK))搜索MSDB數(shù)據(jù)庫的原始數(shù)據(jù),以便隨著變量改變鑒定蛋白質(zhì)和發(fā)現(xiàn)包含含有非天然氨基酸的靶肽的掃描。為了估計GFP-pMpa的Y*37上的保真度,用Xcalibur軟件包(力口州圣何塞的熱電公司)對單一離子色譜(野生型雙電荷前體離子的m/z為752.3,pMpa雙電荷前體離子的m/z為759.3)和所選離子色譜(y9、yu和》2)進(jìn)行積分。在裝有自動取樣器的毛細(xì)管LC和QTOF2質(zhì)譜儀組成的自動化LC/MS系統(tǒng)(馬薩諸塞州米爾福德沃特公司(Waters,Milford,MA))上獲得完整蛋白質(zhì)質(zhì)譜。將GFP-pMpa(O.lmg/ml)加載到反相蛋白質(zhì)Captrap(加州奧本的MB公司(MichromBioresources,Auburn,CA))上,用0.1%乙酸水溶液脫鹽,并用80%乙腈/0.1%乙酸以5微升/分鐘的速率洗脫到質(zhì)譜儀的ESI源中。利用MassLynx(馬薩諸塞州米爾福德沃特公司)軟件包,以MaxEntl算法對譜圖進(jìn)行求和、平滑和解巻積處理。實施例14哺乳動物轉(zhuǎn)錄的啟動子在哺乳動物細(xì)胞中,tRNA轉(zhuǎn)錄的強啟動子包括大腸桿菌阻抑物tRNALeu5(CUAW々5'側(cè)接序列GATCCGACCGTGTGCTTGGCAGAAC(SEQIDNO:105)和大腸桿菌阻抑物tRNALe,CUA)的3'側(cè)接序列GTCCTTTTTTTG(SEQIDNO:106)。承*氺雖然出于闡述和理解的目的詳細(xì)描述了上述發(fā)明,但本領(lǐng)域技術(shù)人員應(yīng)明了,通過閱讀該公開,可在不背離本發(fā)明真實范圍的情況下對其形式和細(xì)節(jié)進(jìn)行各種改變。通過引用將本申請引用的所有發(fā)表物、專利、專利申請和/或其它文件全文納入本文用于所有目的,其程度就好像通過引用將各篇發(fā)表物、專利、專利申請和/或其它文件單獨納入本文用于所有目的那樣。權(quán)利要求1.一種翻譯系統(tǒng),其包括(a)選自下組的第一非天然氨基酸i)對-甲氧基苯丙氨酸(pMpa);ii)對-乙?;奖彼?pApa);iii)對-苯甲酰苯丙氨酸(pBpa);iv)對-碘代苯丙氨酸(pIpa);v)對-疊氮基苯丙氨酸(pAzpa);vi)對-炔丙基氧基苯丙氨酸(pPpa);vii)α-氨基辛酸;viii)鄰-硝基芐基半胱氨酸(o-NBC);ix)1,5-丹磺酰丙氨酸;和x)鄰-硝基芐基絲氨酸(o-NBS);(b)第一正交tRNA(O-tRNA);(c)衍生自真細(xì)菌氨酰-tRNA合成酶的第一正交氨酰-tRNA合成酶(O-RS),其中所述O-RS優(yōu)先用所述非天然氨基酸氨?;鯫-tRNA;和(d)包含(a)、(b)和(c)的宿主細(xì)胞,所述細(xì)胞選自嚙齒動物細(xì)胞或靈長動物細(xì)胞。2.如權(quán)利要求1所述的翻譯系統(tǒng),其特征在于,所述第一O-RS優(yōu)先用所述第一非天然氨基酸氨?;龅谝籓-tRNA,其效率至少為包含所述0-tRNA、所述非天然氨基酸和含有選自SEQIDNO:57-101的氨基酸序列的氨酰-tRNA合成酶的翻譯系統(tǒng)效率的50%。3.如權(quán)利要求1所述的翻譯系統(tǒng),其特征在于,所述第一O-tRNA包含SEQIDNO:3所示的多核苷酸序列或由其編碼。4.如權(quán)利要求1所述的翻譯系統(tǒng),其特征在于,所述第一O-RS衍生自大腸桿菌氨酰-tRNA合成酶。5.如權(quán)利要求1所述的翻譯系統(tǒng),其特征在于,所述第一O-RS包含選自SEQIDNO:57-101的氨基酸序列或其保守變體。6.如權(quán)利要求1所述的翻譯系統(tǒng),其特征在于,所述宿主細(xì)胞還包含編碼感興趣蛋白質(zhì)的核酸,所述核酸包含至少一個選擇者密碼子,其中所述選擇者密碼子被所述第一O-tRNA識別。7.如權(quán)利要求6所述的翻譯系統(tǒng),其特征在于,所述宿主細(xì)胞還包含不同于所述第一非天然氨基酸的第二非天然氨基酸、第二O-RS和第二O-tRNA,其中所述第二O-RS優(yōu)先用所述第二非天然氨基酸氨?;龅诙﨩-tRNA,所述第二O-tRNA識別由核酸編碼的選擇者密碼子,其不同于所述第一O-tRNA識別的選擇者密碼子。8.如權(quán)利要求1所述的翻譯系統(tǒng),其特征在于,所述宿主細(xì)胞包含編碼所述第一O-RS的多核苷酸。9.如權(quán)利要求8所述的翻譯系統(tǒng),其特征在于,所述多核苷酸包含選自SEQIDNO:8-56的核苷酸序列。10.如權(quán)利要求l所述的翻譯系統(tǒng),其特征在于,所述宿主細(xì)胞包含編碼所述第一O-tRNA的多核苷酸。11.如權(quán)利要求1所述的翻譯系統(tǒng),其特征在于,所述嚙齒動物宿主細(xì)胞選自大鼠宿主細(xì)胞或小鼠宿主細(xì)胞。12.如權(quán)利要求1所述的翻譯系統(tǒng),其特征在于,所述靈長動物宿主細(xì)胞選自人宿主細(xì)胞、黑猩猩宿主細(xì)胞、倭黑猩猩宿主細(xì)胞、大猩猩宿主細(xì)胞、猩猩宿主細(xì)胞、長臂猿宿主細(xì)胞、短尾猿宿主細(xì)胞、絹毛猴宿主細(xì)胞或狨宿主細(xì)胞。13.如權(quán)利要求l所述的翻譯系統(tǒng),其特征在于,所述嚙齒動物宿主細(xì)胞是CHO宿主細(xì)胞。14.如權(quán)利要求l所述的翻譯系統(tǒng),其特征在于,所述靈長動物宿主細(xì)胞是293T宿主細(xì)胞。15.—種產(chǎn)生在選定位置含有非天然氨基酸的蛋白質(zhì)的方法,所述方法包括(a)提供(i)選自下組的第一非天然氨基酸A)對-甲氧基苯丙氨酸(pMpa);B)對-乙?;奖彼?pApa);C)對-苯甲酰苯丙氨酸(pBpa);D)對-碘代苯丙氨酸(plpa);E)對-疊氮基苯丙氨酸(pAzpa);F)對-炔丙基氧基苯丙氨酸(pPpa);G)a-氨基辛酸;H)鄰-硝基芐基半胱氨酸(o-NBC);I)1,5-丹磺酰丙氨酸;和J)鄰-硝基芐基絲氨酸(o-NBS);(ii)第一正交tRNA(O-tRNA);(iii)第一正交氨酰-tRNA合成酶(O-RS),其中所述第一O-RS優(yōu)先用所述非天然氨基酸氨酰化所述第一O-tRNA;(hO編碼所述蛋白質(zhì)的核酸,其中所述核酸包含至少一個所述第一O-tRNA識別的選擇者密碼子,該選擇者密碼子在所述核酸中的位置對應(yīng)于所述蛋白質(zhì)的所選位置;和(v)包含(i)、(ii)、(iii)和(iv)的宿主細(xì)胞,所述宿主細(xì)胞選自嚙齒動物細(xì)胞或靈長動物細(xì)胞;和(b)在所述蛋白質(zhì)翻譯期間,在所述非天然氨基酸、O-tRNA和O-RS存在下,響應(yīng)所述選擇者密碼子而將所述非天然氨基酸摻入所述蛋白質(zhì)中的所述所選位置,從而產(chǎn)生在所述所選位置上含有所述非天然氨基酸的所述蛋白質(zhì)。16.如權(quán)利要求15所述的方法,其特征在于,所述第一O-RS優(yōu)先用所述第一非天然氨基酸氨酰化所述第一O-tRNA,其效率至少為包含所述0-tRNA、所述非天然氨基酸和含有選自SEQIDNO:57-101的氨基酸序列的氨酰-tRNA合成酶的翻譯系統(tǒng)效率的50%。17.如權(quán)利要求15所述的方法,其特征在于,所述第一O-tRNA包含SEQIDNO:3所示的多核苷酸序列或由其編碼。18.如權(quán)利要求15所述的方法,其特征在于,提供第一O-RS包括提供編碼所述第一O-RS的多核苷酸。19.如權(quán)利要求15所述的方法,其特征在于,所述第一O-RS衍生自大腸桿菌氨酰-tRNA合成酶。20.如權(quán)利要求15所述的方法,其特征在于,所述第一O-RS包含選自SEQIDNO:57-101的氨基酸序列或其保守變體。21.如權(quán)利要求15所述的方法,其特征在于,所述提供第一O-RS包括提供編碼所述O-RS的多核苷酸。22.如權(quán)利要求21所述的方法,其特征在于,所述多核苷酸包含選自SEQIDNO:8-56的核苷酸序列。23.如權(quán)利要求15所述的方法,其特征在于,所述提供第一O-RS包括通過定點誘變技術(shù)突變野生型氨酰-tRNA合成酶的氨基酸結(jié)合口袋,和選擇優(yōu)先用所述第一非天然氨基酸氨?;龅谝籓-tRNA的所得的O-RS。24.如權(quán)利要求23所述的方法,其特征在于,所述選擇步驟包括在定點誘變后從得到的氨酰-tRNA合成酶分子庫中正向和負(fù)向選擇所述第一O-RS。25.如權(quán)利要求15所述的方法,其特征在于,所述提供第一O-tRNA包括提供編碼所述第一O-tRNA的多核苷酸。26.如權(quán)利要求15所述的方法,其特征在于,所述蛋白質(zhì)包含不同于所述第一非天然氨基酸的第二非天然氨基酸,所述方法還提供所述第二非天然氨基酸、第二O-RS和第二O-tRNA,其中所述第二O-RS優(yōu)先用所述第二非天然氨基酸氨?;龅诙﨩-tRNA,所述第二O-tRNA識別核酸中的選擇者密碼子,其不同于所述第一O-tRNA識別的選擇者密碼子。27.如權(quán)利要求15所述的方法,其特征在于,所述摻入步驟包括培養(yǎng)所述宿主細(xì)胞。28.如權(quán)利要求15所述的方法,其特征在于,所述第一非天然氨基酸包括光籠蔽氨基酸,所述方法還包括使所述宿主細(xì)胞暴露于紫外線。29.如權(quán)利要求29所述的方法,其特征在于,使所述宿主細(xì)胞暴露于紫外線能夠從空間上控制所述宿主細(xì)胞中的蛋白質(zhì)活性。全文摘要本發(fā)明涉及能在哺乳動物宿主細(xì)胞,如靈長類宿主細(xì)胞和嚙齒動物細(xì)胞中將非天然氨基酸摻入蛋白質(zhì)的tRNA和氨酰-tRNA合成酶的正交對。本發(fā)明提供,例如但不限于包括宿主細(xì)胞(如靈長類或嚙齒類細(xì)胞),衍生自真細(xì)菌合成酶的正交氨酰-tRNA合成酶、正交tRNA以及非天然氨基酸的翻譯系統(tǒng)。本發(fā)明還涉及在哺乳動物宿主細(xì)胞系統(tǒng)中產(chǎn)生含有至少一個非天然氨基酸的感興趣蛋白質(zhì)的方法。文檔編號C07K14/00GK101535338SQ200780039015公開日2009年9月16日申請日期2007年10月17日優(yōu)先權(quán)日2006年10月18日發(fā)明者P·G·舒爾茨,劉文設(shè)申請人:斯克利普斯研究院