国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于脊椎動物細胞的雜合抑制tRNA的制作方法

      文檔序號:11936663閱讀:486來源:國知局

      本申請案是申請日為2007年9月7日,申請?zhí)枮?00780033108.9(國際申請?zhí)枮镻CT/US2007/019655),發(fā)明名稱為“用于脊椎動物細胞的雜合抑制tRNA”專利申請的分案申請。

      技術領域

      本發(fā)明涉及脊椎動物細胞中的翻譯生物化學領域。本發(fā)明涉及在脊椎動物細胞中產(chǎn)生正交tRNA、正交合成酶和其對的方法以及正交tRNA、正交合成酶與其對的組合物。本發(fā)明還涉及非天然氨基酸組合物、包括非天然氨基酸的蛋白質(zhì)以及在脊椎動物細胞中產(chǎn)生包括非天然氨基酸的蛋白質(zhì)的方法。



      背景技術:

      從細菌到人類,每一種已知生物體的遺傳密碼都編碼相同的二十種常見氨基酸。這二十種相同天然氨基酸的不同組合形成實質(zhì)上進行生命的所有復雜過程(光合作用到信號轉(zhuǎn)導和免疫反應)的蛋白質(zhì)。為研究和修飾蛋白質(zhì)的結構和功能,科學家們曾嘗試操縱蛋白質(zhì)的遺傳密碼和氨基酸序列。然而,難以去除由遺傳密碼所強加的將蛋白質(zhì)局限于二十種基因編碼的標準結構單元(其中極少見的特例為,硒代半胱氨酸(例如參看A.Bock等人,(1991),Molecular Microbiology 5:515-20)和吡咯賴氨酸(例如參看G.Srinivasan等人,(2002),Science 296:1459-62))的約束。

      已取得一些進展來去除這些約束,但這一進展受到限制并且合理控制蛋白質(zhì)結構和功能的能力仍不成熟。舉例來說,化學家們已開發(fā)出合成和操縱小分子結構的方法和策略(例如參看E.J.Corey和X.-M.Cheng,The Logic of Chemical Synthesis(Wiley-Interscience,New York,1995))。全合成(例如參看B.Merrifield,(1986),Science 232:341-7(1986))和半合成方法(例如參看D.Y.Jackson等人,(1994)Science 266:243-7;以及P.E.Dawson和S.B.Kent,(2000),Annual Review of Biochemistry 69:923-60)使得合成肽和小蛋白質(zhì)成為可能,但這些方法限制了超過10千道爾頓(kilo Dalton,kDa)的蛋白質(zhì)的效用。誘變方法盡管有效,但也局限于有限數(shù)量的結構改變。在多種情況下,在整個蛋白質(zhì)中競爭性并入常見氨基酸的極其接近的結構類似物已成為可能。例如參看R.Furter,(1998),Protein Science 7:419-26;K.Kirshenbaum等人,(2002),ChemBioChem 3:235-7;和V.Doring等人,(2001),Science292:501-4。

      在嘗試擴大操縱蛋白質(zhì)結構和功能的能力的過程中,開發(fā)出使用經(jīng)化學酰化的正交tRNA的活體外方法,其使得能在活體外響應無義密碼子選擇性并入非天然氨基酸(例如參看,J.A.Ellman等人,(1992),Science 255:197-200)。將具有新穎結構和物理特性的氨基酸選擇性并入蛋白質(zhì)中,來研究蛋白質(zhì)折疊和穩(wěn)定性以及生物分子識別和催化。例如參看,D.Mendel等人(1995),Annual Review of Biophysics and Biomolecular Structure24:435-462;和V.W.Cornish等人(1995年3月31日),Angewandte Chemie-InternationalEdition in English 34:621-633。然而,這一方法的化學計量性質(zhì)極大限制了能產(chǎn)生的蛋白質(zhì)的量。

      已將非天然氨基酸顯微注射到細胞中。舉例來說,通過顯微注射以化學方式錯酰化的嗜熱四膜蟲(Tetrahymena thermophila)tRNA(例如,M.E.Saks等人(1996),An engineered Tetrahymena tRNAGln for in vivo incorporation of unnatural amino acids into proteins by nonsense suppression,J.Biol.Chem.271:23169-23175)和相關mRNA而將非天然氨基酸引入爪蟾卵母細胞(Xenopus oocyte)中的煙堿型乙酰膽堿受體中(例如,M.W.Nowak等人(1998),In vivo incorporation of unnatural amino acids into ion channels in Xenopus oocyte expression system,Method Enzymol.293:504-529)。這允許通過引入具有獨特物理或化學特性的含側鏈氨基酸來對卵母細胞中的受體進行詳細生物物理研究。例如參看,D.A.Dougherty(2000),Unnatural amino acids as probes of protein structure and function,Curr.Opin.Chem.Biol.4:645-652。不幸的是,這種方法局限于細胞中可進行顯微注射的蛋白質(zhì),并且由于相關tRNA是在活體外以化學方式?;⑶覠o法再?;实鞍踪|(zhì)的產(chǎn)率極低。

      為克服這些缺點,將新組件添加到原核生物大腸桿菌(Escherichia coli,E.coil)的蛋白質(zhì)生物合成機器中(參看L.Wang等人,(2001),Science 292:498-500),這允許在活體內(nèi)基因編碼非天然氨基酸。已使用這種方法響應琥珀密碼子TAG將多種具有新穎化學、物理或生物特性的新氨基酸有效且高保真地并入大腸桿菌的蛋白質(zhì)中,所述新氨基酸包括光親和標記和光致異構化氨基酸、酮基氨基酸和糖基化氨基酸。例如參看J.W.Chin等人,(2002),Journal of the American Chemical Society 124:9026-9027;J.W.Chin,&P.G.Schultz,(2002),Chem BioChem 11:1135-1137;J.W.Chin等人,(2002),PNAS United States of America 99:11020-11024;和L.Wang,&P.G.Schultz,(2002),Chem.Comm.,1-10。然而,原核生物和真核生物的翻譯機器并不高度保守;因此,添加到大腸桿菌中的生物合成機器的組件通常無法用于將非天然氨基酸位點特異性并入脊椎動物細胞中的蛋白質(zhì)中。舉例來說,用于大腸桿菌中的詹氏甲烷球菌(Methanococcus jannaschii)酪氨酰-tRNA合成酶/tRNA對在脊椎動物細胞中并不正交。此外,真核生物而非原核生物中tRNA的轉(zhuǎn)錄是通過RNA聚合酶III進行,并且這會限制能在脊椎動物細胞中轉(zhuǎn)錄的tRNA結構基因的一級序列。而且,與原核生物細胞相比,脊椎動物細胞中的tRNA都是從轉(zhuǎn)錄tRNA的細胞核輸出到細胞質(zhì),以進行翻譯。最后,脊椎動物的80S核糖體與70S原核生物核糖體截然不同。因此,需要開發(fā)出經(jīng)改進的生物合成機器組件以擴充脊椎動物遺傳密碼。如在仔細查看以下揭示內(nèi)容后將顯而易見,本發(fā)明滿足這些要求和其它要求。



      技術實現(xiàn)要素:

      本發(fā)明對脊椎動物細胞提供翻譯組件,例如正交氨酰基-tRNA合成酶(O-RS)與正交tRNA(O-tRNA)對和其個別組件,所述翻譯組件可用于脊椎動物蛋白質(zhì)生物合成機器中以將非天然氨基酸并入脊椎動物細胞中正在生長的多肽鏈中。

      本發(fā)明的組合物包括包含正交氨酰基-tRNA合成酶(O-RS)(例如,得自非脊椎動物生物體,諸如大腸桿菌、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)等)的脊椎動物細胞(例如,哺乳動物細胞、禽類細胞、魚細胞、爬行動物細胞、兩棲動物細胞、得自非哺乳動物的細胞等),其中O-RS優(yōu)先在脊椎動物細胞中利用至少一個非天然氨基酸將正交tRNA(O-tRNA)氨?;?。可任選將指定脊椎動物細胞中的兩個或兩個以上OtRNA氨?;R环矫?,O-RS利用非天然氨基酸將O-tRNA氨酰化,這與具有(例如)如SEQ ID NO.:86或45中所述的氨基酸序列的O-RS例如至少40%、至少45%、至少50%、至少60%、至少75%、至少80%或者甚至90%或90%以上有效。在一個實施例中,本發(fā)明的O-RS利用非天然氨基酸將O-tRNA氨?;?,這比O-RS利用天然氨基酸將O-tRNA氨?;行Ю缰辽?0倍、至少20倍、至少30倍等。

      在一個實施例中,O-RS或其部分是由如SEQ ID NO.:3-35中任一序列所述的多聚核苷酸序列或其互補多聚核苷酸序列編碼。在另一實施例中,O-RS包含如SEQ ID NO.:36-63和/或86中任一序列所述的氨基酸序列,或其保守變異體。在另一實施例中,O-RS包含例如與天然存在的酪氨?;滨;?tRNA合成酶(TyrRS)的氨基酸序列至少90%、至少95%、至少98%、至少99%或至少99.5%或99.5%以上一致并且包含兩個或兩個以上來自A-E組的氨基酸的氨基酸序列。A組包括在與大腸桿菌TyrRS的Tyr37對應的位置的纈氨酸、異亮氨酸、亮氨酸、甘氨酸、絲氨酸、丙氨酸或蘇氨酸。B組包括在與大腸桿菌TyrRS的Asn126對應的位置的天冬氨酸。C組包括在與大腸桿菌TyrRS的Asp182對應的位置的蘇氨酸、絲氨酸、精氨酸、天冬酰胺或甘氨酸。D組包括在與大腸桿菌TyrRS的Phe183對應的位置的甲硫氨酸、丙氨酸、纈氨酸或酪氨酸;并且E組包括在與大腸桿菌TyrRS的Leu 186對應的位置的絲氨酸、甲硫氨酸、纈氨酸、半胱氨酸、蘇氨酸或丙氨酸。

      在另一實施例中,O-RS具有一種或多種相比天然氨基酸改進或增強的針對非天然氨基酸的酶特性。舉例來說,相比天然氨基酸,改進或增強的針對非天然氨基酸的特性包括例如較高Km、較低Km、較高kcat、較低kcat、較低kcat/km、較高kcat/km等。

      脊椎動物細胞還任選包括非天然氨基酸。脊椎動物細胞任選包括正交tRNA(O-tRNA)(例如,得自非脊椎動物生物體,諸如大腸桿菌、嗜熱脂肪芽孢桿菌等),其中O-tRNA識別選擇性密碼子且優(yōu)先通過O-RS利用非天然氨基酸氨酰化。一方面,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或99%的包含如SEQ ID NO.:65中所述的多聚核苷酸序列或在細胞中由如SEQ ID NO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介導將非天然氨基酸并入蛋白質(zhì)中。另一方面,O-tRNA包含SEQ ID NO.:65的序列,且O-RS包含選自SEQ ID NO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽序列和/或其保守變異體。

      在另一實施例中,脊椎動物細胞包含包括編碼所關注多肽的多聚核苷酸的核酸,其中所述多聚核苷酸包含由O-tRNA所識別的選擇性密碼子。一方面,包含非天然氨基酸的所關注多肽的產(chǎn)率例如為從多聚核苷酸缺乏選擇性密碼子的細胞中獲得天然存在的所關注多肽的產(chǎn)率的至少2.5%、至少5%、至少10%、至少25%、至少30%、至少40%、50%或更多。另一方面,細胞在不存在非天然氨基酸的情況下以一定產(chǎn)率產(chǎn)生所關注多肽,所述產(chǎn)率例如為在存在非天然氨基酸的情況下多肽產(chǎn)率的不到35%、不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。

      本發(fā)明還提供一種脊椎動物細胞,其包含正交氨酰基-tRNA合成酶(O-RS)、正交tRNA(O-tRNA)、非天然氨基酸和包含編碼所關注多肽的多聚核苷酸的核酸。所述多聚核苷酸包含由O-tRNA識別的選擇性密碼子。此外,在脊椎動物細胞中,O-RS優(yōu)先利用非天然氨基酸將正交tRNA(O-tRNA)氨?;?,且所述細胞在不存在非天然氨基酸的情況下以一定產(chǎn)率產(chǎn)生所關注多肽,所述產(chǎn)率例如為在存在非天然氨基酸的情況下多肽產(chǎn)率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。

      包括包含正交tRNA(O-tRNA)的脊椎動物細胞的組合物也為本發(fā)明的特征。通常,O-tRNA介導在活體內(nèi)將非天然氨基酸并入蛋白質(zhì)中,所述蛋白質(zhì)是由包含由O-tRNA識別的選擇性密碼子的多聚核苷酸編碼。在一個實施例中,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或甚至99%或99%以上的包含如SEQ ID NO.:65中所述的多聚核苷酸序列或在細胞中由如SEQ ID NO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介導將非天然氨基酸并入蛋白質(zhì)中。在另一實施例中,O-tRNA包含如SEQ ID NO.:65中所述的多聚核苷酸序列或其保守變異體,或者是由如SEQ ID NO.:65中所述的多聚核苷酸序列或其保守變異體加工。在另一實施例中,O-tRNA包含可重復利用的O-tRNA。

      在本發(fā)明一方面中,O-tRNA經(jīng)轉(zhuǎn)錄后修飾。本發(fā)明還提供一種在脊椎動物細胞中編碼O-tRNA的核酸,或其互補多聚核苷酸。在一個實施例中,核酸包含A盒和B盒。

      本發(fā)明還涉及產(chǎn)生例如O-RS或O-tRNA/O-RS對等翻譯組件的方法(和由這些方法產(chǎn)生的翻譯組件)。舉例來說,本發(fā)明提供產(chǎn)生正交氨酰基-tRNA合成酶(O-RS)的方法,所述O-RS在脊椎動物細胞中優(yōu)先利用非天然氨基酸將正交tRNA氨?;K龇椒òɡ?a)在存在非天然氨基酸的情況下,使第一物種的脊椎動物細胞群經(jīng)歷正選擇,其中所述脊椎動物細胞各自包含:i)氨酰基-tRNA合成酶(RS)文庫成員,ii)正交tRNA(O-tRNA),iii)編碼正選擇標記的多聚核苷酸,和iv)編碼負選擇標記的多聚核苷酸;其中在正選擇下存活的細胞包含在存在非天然氨基酸的情況下將正交tRNA(O-tRNA)氨酰化的活性RS。使在正選擇下存活的細胞在不存在非天然氨基酸的情況下經(jīng)歷負選擇,以除去利用天然氨基酸將O-tRNA氨?;幕钚訰S。這提供優(yōu)先利用非天然氨基酸將O-tRNA氨酰化的O-RS。

      在某些實施例中,將編碼正選擇標記的多聚核苷酸可操作性連接到反應元件,并且所述細胞另外包含一種多聚核苷酸,其a)編碼調(diào)節(jié)由反應元件進行的轉(zhuǎn)錄的轉(zhuǎn)錄調(diào)節(jié)蛋白(例如,脊椎動物轉(zhuǎn)錄調(diào)節(jié)蛋白等);且b)包含至少一個選擇性密碼子。通過利用非天然氨基酸氨?;腛-tRNA將非天然氨基酸并入轉(zhuǎn)錄調(diào)節(jié)蛋白中,將會引起正選擇標記的轉(zhuǎn)錄。在一個實施例中,轉(zhuǎn)錄調(diào)節(jié)蛋白為轉(zhuǎn)錄活化蛋白(例如GAL4等),且選擇性密碼子為琥珀終止密碼子,例如其中所述琥珀終止密碼子位于編碼轉(zhuǎn)錄活化蛋白的DNA結合結構域的多聚核苷酸的一部分中,或?qū)嵸|(zhì)上鄰近編碼轉(zhuǎn)錄活化蛋白的DNA結合結構域的多聚核苷酸的一部分。

      正選擇標記可為多種分子中任一者。在一個實施例中,正選擇標記包含供生長的營養(yǎng)補充并且所述選擇是在缺乏所述營養(yǎng)補充的培養(yǎng)基上執(zhí)行。在另一實施例中,編碼正選擇標記的多聚核苷酸例如為ura3、leu2、lys2、lacZ基因、his3(例如,其中his3基因編碼咪唑甘油磷酸酯脫水酶,通過提供3-氨基三唑(3-AT)檢測)等。在另一實施例中,編碼正選擇標記的多聚核苷酸包含選擇性密碼子。

      與正選擇標記相同,負選擇標記也可為多種分子中的任一者。在某些實施例中,將編碼負選擇標記的多聚核苷酸可操作性連接到反應元件,轉(zhuǎn)錄調(diào)節(jié)蛋白通過所述反應元件介導轉(zhuǎn)錄。通過利用天然氨基酸氨酰化的O-tRNA將天然氨基酸并入轉(zhuǎn)錄調(diào)節(jié)蛋白中,將會引起負選擇標記的轉(zhuǎn)錄。在一個實施例中,編碼負選擇標記的多聚核苷酸為例如ura3基因,且負選擇是在包含5-氟乳清酸(5-FOA)的培養(yǎng)基上實現(xiàn)。在另一實施例中,用于負選擇的培養(yǎng)基包含轉(zhuǎn)化成通過負選擇標記可檢測的物質(zhì)的選擇或篩選劑。在本發(fā)明一方面中,可檢測物質(zhì)為有毒物質(zhì)。在一個實施例中,編碼負選擇標記的多聚核苷酸包含選擇性密碼子。

      在某些實施例中,正選擇標記和/或負選擇標記包含在存在適當反應物的情況下發(fā)熒光或催化發(fā)光反應的多肽。在本發(fā)明一方面中,通過熒光活化細胞分選(fluorescence-activated cell sorting,F(xiàn)ACS)或通過發(fā)光來檢測正選擇標記和/或負選擇標記。在某些實施例中,正選擇標記和/或負選擇標記包含基于親和力的篩選標記或轉(zhuǎn)錄調(diào)節(jié)蛋白。在一個實施例中,同一多聚核苷酸編碼正選擇標記和負選擇標記。

      在一個實施例中,編碼本發(fā)明的正選擇標記和/或負選擇標記的多聚核苷酸可包含至少兩個選擇性密碼子,其各自或都可包含至少兩個不同選擇性密碼子或至少兩個相同選擇性密碼子。

      其它水平的選擇/篩選嚴格度也可用于本發(fā)明方法中。在一個實施例中,所述方法可例如包含在步驟(a)、(b)或(a)和(b)中提供不同量的無活性合成酶,其中所述不同量的無活性合成酶提供另一水平的選擇或篩選嚴格度。在一個實施例中,用于產(chǎn)生O-RS的方法的步驟(a)、(b)或步驟(a)和(b)包括改變例如正和/或負選擇標記的選擇或篩選嚴格度。所述方法任選包括使優(yōu)先利用非天然氨基酸將O-tRNA氨酰化的O-RS經(jīng)歷另一回合選擇,例如另一回合(數(shù)回合)正選擇、另一回合(數(shù)回合)負選擇或另一回合正和負選擇的組合。

      在一個實施例中,選擇/篩選包含一次或多次例如選自氨基酸滲透性改變、翻譯效率改變、翻譯保真度改變等的正或負選擇/篩選。所述一種或多種改變是建立在一個或多個編碼用于產(chǎn)生蛋白質(zhì)的正交tRNA-tRNA合成酶對的組件的多聚核苷酸突變的基礎上。

      通常,RS文庫(例如,突變型RS文庫)包含由例如來自非脊椎動物生物體的至少一種氨?;?tRNA合成酶(RS)得到的RS。在一個實施例中,RS文庫是從無活性RS得到,例如其中所述無活性RS是由使活性RS突變而產(chǎn)生。在另一實施例中,無活性RS包含氨基酸結合袋并且一個或多個包含所述結合袋的氨基酸經(jīng)一個或多個不同氨基酸取代,例如所述經(jīng)取代氨基酸經(jīng)丙氨酸取代。

      在某些實施例中,產(chǎn)生O-RS的方法另外包括對編碼RS的核酸執(zhí)行隨機突變、位點特異性突變、重組、嵌合構建或其任何組合,從而產(chǎn)生突變型RS文庫。在某些實施例中,所述方法另外包括例如(c)分離出編碼O-RS的核酸;(d)由所述核酸產(chǎn)生一組編碼突變型O-RS的多聚核苷酸(例如,通過隨機誘變、位點特異性誘變、嵌合構建、重組或其任何組合);和(e)重復步驟(a)和/或(b),直到獲得優(yōu)先利用非天然氨基酸將O-tRNA氨酰化的突變型O-RS。在本發(fā)明一方面中,將步驟(c)-(e)執(zhí)行至少2次。

      產(chǎn)生O-tRNA/O-RS對的方法也為本發(fā)明的特征。在一個實施例中,如上文所述獲得O-RS,且通過使第一物種的脊椎動物細胞群(其中所述脊椎動物細胞包含tRNA文庫成員)經(jīng)歷負選擇以除去包含經(jīng)對于脊椎動物細胞為內(nèi)源性的氨?;?tRNA合成酶(RS)氨酰化的tRNA文庫成員的細胞,來獲得O-tRNA。這提供與第一物種的脊椎動物細胞正交的tRNA池。在本發(fā)明一方面中,tRNA文庫包含由例如來自非脊椎動物生物體的至少一個tRNA得到的tRNA。在本發(fā)明另一方面中,氨?;?tRNA合成酶(RS)文庫包含由例如來自非脊椎動物生物體的至少一個氨酰基-tRNA合成酶(RS)得到的RS。在本發(fā)明另一方面中,tRNA文庫包含由來自第一非脊椎動物生物體的至少一個tRNA得到的tRNA。氨?;?tRNA合成酶(RS)文庫任選包含由來自第二非脊椎動物生物體的至少一個氨酰基-tRNA合成酶(RS)得到的RS。在一個實施例中,第一與第二非脊椎動物生物體相同?;蛘?,第一與第二非脊椎動物生物體可不同。由本發(fā)明方法產(chǎn)生的特定O-tRNA/O-RS對也為本發(fā)明的特征。

      本發(fā)明另一特征為用于在一種物種中產(chǎn)生翻譯組件并將選擇/篩選的翻譯組件引入第二物種中的方法。舉例來說,在第一物種(例如,脊椎動物物種,諸如酵母等)中產(chǎn)生O-tRNA/O-RS對的方法另外包括將編碼O-tRNA的核酸和編碼O-RS的核酸引入第二物種(例如,哺乳動物、昆蟲、真菌、藻類、植物等)的脊椎動物細胞中。第二物種可使用引入的翻譯組件在活體內(nèi)例如在翻譯期間將非天然氨基酸并入正在生長的多肽鏈中。

      在另一實例中,在脊椎動物細胞中產(chǎn)生優(yōu)先利用非天然氨基酸將正交tRNA氨酰化的正交氨?;?tRNA合成酶(O-RS)的方法包括:(a)在存在非天然氨基酸的情況下,使第一物種(例如,脊椎動物物種,諸如酵母等)的脊椎動物細胞群經(jīng)歷正選擇。第一物種的脊椎動物細胞各自包含:i)氨?;?tRNA合成酶(RS)文庫成員,ii)正交tRNA(O-tRNA),iii)編碼正選擇標記的多聚核苷酸,和iv)編碼負選擇標記的多聚核苷酸。在正選擇中存活的細胞包含在存在非天然氨基酸的情況下將正交tRNA(O-tRNA)氨?;幕钚訰S。使在正選擇下存活的細胞在不存在非天然氨基酸的情況下經(jīng)歷負選擇,以除去利用天然氨基酸將O-tRNA氨?;幕钚訰S,從而提供優(yōu)先利用非天然氨基酸將O-tRNA氨酰化的O-RS。將編碼O-tRNA的核酸和編碼O-RS的核酸引入第二物種(例如,哺乳動物、昆蟲、真菌、藻類、植物等)的脊椎動物細胞中。當在第二物種中翻譯時,可使用這些組件將非天然氨基酸并入第二物種中的所關注蛋白質(zhì)或多肽中。在一個實施例中,將O-tRNA和/或O-RS引入第二物種的脊椎動物細胞中。

      在某些實施例中,通過使第一物種的脊椎動物細胞群(其中所述脊椎動物細胞包含tRNA文庫成員)經(jīng)歷負選擇以除去包含經(jīng)對于脊椎動物細胞為內(nèi)源性的氨?;?tRNA合成酶(RS)氨酰化的tRNA文庫成員的細胞,來獲得O-tRNA。這提供與第一物種和第二物種的脊椎動物細胞正交的tRNA池。

      具有至少一個非天然氨基酸的蛋白質(zhì)(或所關注多肽)也為本發(fā)明的特征。在本發(fā)明某些實施例中,具有至少一個非天然氨基酸的蛋白質(zhì)包括至少一個翻譯后修飾。在一個實施例中,至少一個翻譯后修飾包含通過[3+2]環(huán)加成將包含第二反應性基團的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交聯(lián)劑、細胞毒性化合物、親和標記、生物素衍生物、樹脂、第二蛋白質(zhì)或多肽、金屬螯合劑、輔因子、脂肪酸、碳水化合物、多聚核苷酸(例如,DNA、RNA等)等)與至少一個包含第一反應性基團的非天然氨基酸連接。舉例來說,第一反應性基團為炔基部分(例如,在非天然氨基酸對-炔丙基氧基苯丙氨酸中)(這個基團有時也稱為乙炔部分),且第二反應性基團為疊氮基部分。在另一實例中,第一反應性基團為疊氮基部分(例如,在非天然氨基酸對疊氮基-L-苯丙氨酸中)且第二反應性基團為炔基部分。在某些實施例中,本發(fā)明的蛋白質(zhì)包括至少一個包含至少一個翻譯后修飾的非天然氨基酸(例如,酮基非天然氨基酸),其中所述至少一個翻譯后修飾包含糖部分。在某些實施例中,翻譯后修飾是于脊椎動物細胞中在活體內(nèi)進行。

      在某些實施例中,蛋白質(zhì)包括至少一個在活體內(nèi)由脊椎動物細胞所產(chǎn)生的翻譯后修飾,其中所述翻譯后修飾通常不是由原核細胞進行。翻譯后修飾的實例包括(但不限于)乙?;?、?;?、脂質(zhì)修飾、棕櫚?;?、棕櫚酸鹽加成、磷酸化、糖脂連接修飾等。在一個實施例中,翻譯后修飾包含通過GlcNAc-天冬酰胺鍵聯(lián)將寡糖與天冬酰胺連接在一起(例如,寡糖包含(GlcNAc-Man)2-Man-GlcNAc-GlcNAc等的情形)。在另一實施例中,翻譯后修飾包含通過GalNAc-絲氨酸、GalNAc-蘇氨酸、GlcNAc-絲氨酸或GlcNAc-蘇氨酸鍵聯(lián)將寡糖(例如,Gal-GalNAc、Gal-GlcNAc等)與絲氨酸或蘇氨酸連接在一起。在某些實施例中,本發(fā)明的蛋白質(zhì)或多肽可包含分泌或定位序列、抗原決定基標簽(epitope tag)、FLAG標簽、聚組氨酸標簽、GST融合體等。

      通常,蛋白質(zhì)與任何可用蛋白質(zhì)(例如,治療性蛋白質(zhì)、診斷性蛋白質(zhì)、工業(yè)酶或其部分等)例如至少60%、至少70%、至少75%、至少80%、至少90%、至少95%或甚至至少99%或99%以上一致,且其包含一個或多個非天然氨基酸。在一個實施例中,本發(fā)明的組合物包括所關注蛋白質(zhì)或多肽和賦形劑(例如,緩沖液、醫(yī)藥學上可接受的賦形劑等)。

      所關注蛋白質(zhì)或多肽可含有至少一個、至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個或者十個或十個以上非天然氨基酸。非天然氨基酸可相同或不同,例如可在蛋白質(zhì)中1、2、3、4、5、6、7、8、9、10個或更多不同位點包含1、2、3、4、5、6、7、8、9、10個或更多不同非天然氨基酸。在某些實施例中,天然存在的蛋白質(zhì)型式中所存在的至少一個(但少于全部)特定氨基酸經(jīng)非天然氨基酸取代。

      蛋白質(zhì)(或所關注多肽)的實例包括(但不限于)例如,細胞因子、生長因子、生長因子受體、干擾素、白細胞介素、炎癥分子、癌基因產(chǎn)物、肽激素、信號轉(zhuǎn)導分子、類固醇激素受體、促紅細胞生成素(EPO)、胰島素、人生長激素、α-1抗胰蛋白酶、血管抑素(Angiostatin)、抗溶血因子(Antihemolytic factor)、抗體、載脂蛋白、脫輔基蛋白、心房利鈉因子、心房利鈉多肽、心房肽、C-X-C趨化因子、T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG、降鈣素、c-kit配體、細胞因子、CC趨化因子、單核細胞趨化蛋白-1、單核細胞趨化蛋白-2、單核細胞趨化蛋白-3、單核細胞炎癥蛋白-1α、單核細胞炎癥蛋白-1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262、CD40、CD40配體、C-kit配體、膠原蛋白、群落刺激因子(CSF)、補體因子5a、補體抑制劑、補體受體1、細胞因子、DHFR、上皮中性粒細胞活化肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-1δ、MCP-1、表皮生長因子(EGF)、上皮中性粒細胞活化肽、促紅細胞生成素(EPO)、脫落毒素、因子IX、因子VII、因子VIII、因子X、成纖維細胞生長因子(FGF)、纖維蛋白原、纖維粘連蛋白、G-CSF、GM-CSF、葡糖腦苷脂酶、促性腺激素、生長因子、生長因子受體、刺猬蛋白(hedgehog protein)、血紅蛋白、肝細胞生長因子(HGF)、水蛭素(hirudin)、人血清白蛋白、ICAM-1、ICAM-1受體、LFA-1、LFA-1受體、胰島素、類胰島素生長因子(IGF)、IGF-I、IGF-II、干擾素(IFN)、IFN-α、IFN-β、IFN-γ、白細胞介素、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、角質(zhì)細胞生長因子(KGF)、乳鐵蛋白、白血病抑制因子、熒光素酶、神經(jīng)營養(yǎng)因子、中性粒細胞抑制因子(NIF)、抑瘤素M、成骨蛋白、癌基因產(chǎn)物、甲狀旁腺激素、PD-ECSF、PDGF、肽激素、人生長激素、多效生長因子、蛋白質(zhì)A、蛋白質(zhì)G、致熱性外毒素A、B或C、松馳素、腎素、SCF、可溶性補體受體I、可溶性I-CAM 1、可溶性白細胞介素受體、可溶性TNF受體、生長調(diào)節(jié)素、生長抑素、生長激素、鏈激酶、超抗原、葡萄球菌腸毒素、SEA、SEB、SEC1、SEC2、SEC3、SED、SEE、類固醇激素受體、超氧化物歧化酶(SOD)、中毒性休克綜合癥毒素、胸腺肽α1、組織型纖溶酶原活化劑、腫瘤生長因子(TGF)、TGF-α、TGF-β、腫瘤壞死因子、腫瘤壞死因子α、腫瘤壞死因子β、腫瘤壞死因子受體(TNFR)、VLA-4蛋白、VCAM-1蛋白、血管內(nèi)皮生長因子(VEGEF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受體、孕酮受體、睪酮受體、醛固酮受體、LDL受體、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1、透明質(zhì)酸(hyalurin)/CD44、皮質(zhì)酮、存在于Genebank或其它可用數(shù)據(jù)庫中的蛋白質(zhì)等,和/或其部分。在一個實施例中,所關注多肽包括轉(zhuǎn)錄調(diào)節(jié)蛋白(例如,轉(zhuǎn)錄活化蛋白(諸如GAL4)或轉(zhuǎn)錄阻遏蛋白等)或其部分。

      本發(fā)明的脊椎動物細胞提供合成包含大量有用非天然氨基酸的蛋白質(zhì)的能力。舉例來說,可產(chǎn)生在細胞提取物、緩沖液、醫(yī)藥學上可接受的賦形劑等中濃度為例如至少10微克/升、至少50微克/升、至少75微克/升、至少100微克/升、至少200微克/升、至少250微克/升或至少500微克/升或更多蛋白質(zhì)的包含非天然氨基酸的蛋白質(zhì)。在某些實施例中,本發(fā)明的組合物包括例如至少10μg、至少50μg、至少75μg、至少100μg、至少200μg、至少250μg或至少500μg或更多包含非天然氨基酸的蛋白質(zhì)。

      在某些實施例中,所關注蛋白質(zhì)或多肽(或其部分)是由核酸編碼。通常,核酸包含至少一個選擇性密碼子、至少兩個選擇性密碼子、至少三個選擇性密碼子、至少四個選擇性密碼子、至少五個選擇性密碼子、至少六個選擇性密碼子、至少七個選擇性密碼子、至少八個選擇性密碼子、至少九個選擇性密碼子或甚至十個或十個以上選擇性密碼子。

      本發(fā)明還提供用于在脊椎動物細胞中產(chǎn)生至少一種包含至少一個非天然氨基酸的蛋白質(zhì)的方法(以及由所述方法產(chǎn)生的蛋白質(zhì))。所述方法包括例如使包含包括至少一個選擇性密碼子且編碼蛋白質(zhì)的核酸的脊椎動物細胞在適當培養(yǎng)基中生長。脊椎動物細胞還包含正交tRNA(O-tRNA),其在細胞中起作用并且識別選擇性密碼子;和正交氨?;鵷RNA合成酶(O-RS),其優(yōu)先利用非天然氨基酸將O-tRNA氨酰化;并且所述培養(yǎng)基包含非天然氨基酸。在一個實施例中,O-RS利用非天然氨基酸將O-tRNA氨?;?,這與具有(例如)如SEQ ID NO.:86或45中所述序列的氨基酸序列的O-RS例如至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或者甚至99%或99%以上有效。在另一實施例中,O-tRNA包含SEQ ID NO.:64或65或者其互補多聚核苷酸序列;由SEQ ID NO.:64或65或者其互補多聚核苷酸序列加工;或由SEQ ID NO.:64或65或者其互補多聚核苷酸序列編碼。在另一實施例中,O-RS包含如SEQ ID NO.:36-63和/或86中任一序列所述的氨基酸序列。

      在一個實施例中,所述方法另外包括將非天然氨基酸并入蛋白質(zhì)中,其中所述非天然氨基酸包含第一反應性基團;和使所述蛋白質(zhì)與包含第二反應性基團的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交聯(lián)劑、細胞毒性化合物、親和標記、生物素衍生物、樹脂、第二蛋白質(zhì)或多肽、金屬螯合劑、輔因子、脂肪酸、碳水化合物、多聚核苷酸(例如,DNA、RNA等)等)接觸。第一反應性基團與第二反應性基團反應以通過[3+2]環(huán)加成將所述分子與非天然氨基酸連接。在一個實施例中,第一反應性基團為炔基或疊氮基部分且第二反應性基團為疊氮基或炔基部分。舉例來說,第一反應性基團為炔基部分(例如,在非天然氨基酸對炔丙基氧基苯丙氨酸中)且第二反應性基團為疊氮基部分。在另一實例中,第一反應性基團為疊氮基部分(例如,在非天然氨基酸對疊氮基-L-苯丙氨酸中)且第二反應性基團為炔基部分。

      在某些實施例中,所編碼的蛋白質(zhì)包含治療性蛋白質(zhì)、診斷性蛋白質(zhì)、工業(yè)酶或其部分。在一個實施例中,由所述方法產(chǎn)生的蛋白質(zhì)進一步通過非天然氨基酸來得以修飾。舉例來說,例如通過親核-親電反應、[3+2]環(huán)加成等來修飾非天然氨基酸。在另一實施例中,在活體內(nèi)通過至少一個翻譯后修飾(例如,N-糖基化、O-糖基化、乙?;?、?;⒅|(zhì)修飾、棕櫚?;?、棕櫚酸鹽加成、磷酸化、糖脂連接修飾等)來修飾由所述方法產(chǎn)生的蛋白質(zhì)。

      還提供產(chǎn)生篩選或選擇轉(zhuǎn)錄調(diào)節(jié)蛋白的方法(以及由所述方法產(chǎn)生的篩選或選擇轉(zhuǎn)錄調(diào)節(jié)蛋白)。所述方法包括例如選擇第一多聚核苷酸序列,其中所述多聚核苷酸序列編碼核酸結合結構域;和使所述第一多聚核苷酸序列突變以包括至少一個選擇性密碼子。這將提供篩選或選擇多聚核苷酸序列。所述方法還包括例如選擇第二多聚核苷酸序列,其中所述第二多聚核苷酸序列編碼轉(zhuǎn)錄活化結構域;提供包含可操作性連接到第二多聚核苷酸序列的篩選或選擇多聚核苷酸序列的構建體;和將所述構建體、非天然氨基酸、正交tRNA合成酶(O-RS)和正交tRNA(O-tRNA)引入細胞中。利用這些組件,O-RS優(yōu)先利用非天然氨基酸將O-tRNA氨酰化,且O-tRNA識別選擇性密碼子,并響應篩選或選擇多聚核苷酸序列中的選擇性密碼子將非天然氨基酸并入核酸結合結構域中。這將提供篩選或選擇轉(zhuǎn)錄調(diào)節(jié)蛋白。

      在某些實施例中,本發(fā)明的組合物和方法包括脊椎動物細胞。本發(fā)明的脊椎動物細胞包括例如哺乳動物細胞、酵母細胞、真菌細胞、植物細胞、昆蟲細胞等中的任一種。本發(fā)明的翻譯組件可得自多種生物體,例如非脊椎動物生物體,諸如原核生物體(例如,大腸桿菌、嗜熱脂肪芽孢桿菌等)或古細菌;或例如脊椎動物生物體。

      本發(fā)明的選擇性密碼子將擴充脊椎動物蛋白質(zhì)生物合成機器的遺傳密碼子框架。多個選擇性密碼子中的任一個可用于本發(fā)明中,包括終止密碼子(例如,琥珀密碼子、赭石密碼子或蛋白石終止密碼子)、無義密碼子、稀有密碼子、四(或更多)堿基密碼子等。

      可用于本文所述的組合物和方法中的非天然氨基酸的實例包括(但不限于):對-乙?;?L-苯丙氨酸;對-碘-L-苯丙氨酸;O-甲基-L-酪氨酸;對-炔丙基氧基苯丙氨酸;對-炔丙基-苯丙氨酸;L-3-(2-萘基)丙氨酸;3-甲基-苯丙氨酸;O-4-烯丙基-L-酪氨酸;4-丙基-L-酪氨酸;三-O-乙?;?GlcNAcβ-絲氨酸;L-多巴(L-Dopa);氟化苯丙氨酸;異丙基-L-苯丙氨酸;對-疊氮基-L-苯丙氨酸;對-?;?L-苯丙氨酸;對-苯甲?;?L-苯丙氨酸;L-磷酸絲氨酸;膦酸絲氨酸;膦酸酪氨酸;對-溴苯丙氨酸;對-氨基-L-苯丙氨酸;異丙基-L-苯丙氨酸;酪氨酸氨基酸的非天然類似物;谷氨酰胺氨基酸的非天然類似物;苯丙氨酸氨基酸的非天然類似物;絲氨酸氨基酸的非天然類似物;蘇氨酸氨基酸的非天然類似物;烷基、芳基、?;?、疊氮基、氰基、鹵基、肼、酰肼、羥基、烯基、炔基、醚、硫醇、磺?;⑽?、酯、硫代酸、硼酸酯基(borate)、硼酸酯基(boronate)、磷酸基、膦酸基、膦、雜環(huán)、烯酮、亞胺、醛、羥胺、酮基或氨基取代的氨基酸,或其任何組合;具有可光活化交聯(lián)劑的氨基酸;自旋標記的氨基酸;發(fā)熒光氨基酸;結合金屬的氨基酸;含金屬氨基酸;放射性氨基酸;光籠蔽(photocaged)和/或光致異構化氨基酸;含生物素或生物素類似物氨基酸;含酮基氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化學可裂解或可光裂解氨基酸;具有伸長側鏈的氨基酸;含有毒基團的氨基酸;糖取代的氨基酸;含碳連接的糖的氨基酸;具有氧化還原活性的氨基酸;含α-羥基的酸;氨基硫代酸;α,α雙取代氨基酸;β-氨基酸;除脯氨酸或組氨酸外的環(huán)狀氨基酸;除苯丙氨酸、酪氨酸或色氨酸外的芳香族氨基酸等。

      本發(fā)明還提供多肽(O-RS)和多聚核苷酸,例如O-tRNA、編碼O-RS或其部分(例如,合成酶活性位點)的多聚核苷酸、用于構建氨?;?tRNA合成酶突變體的寡聚核苷酸、編碼所關注蛋白質(zhì)或多肽的包含一個或多個選擇性密碼子的多聚核苷酸等。舉例來說,本發(fā)明的多肽包括:包含如SEQ ID NO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽;包含由如SEQ ID NO.:3-35中任一序列所述的多聚核苷酸序列編碼的氨基酸序列的多肽;以及與對包含如SEQ ID NO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽具特異性的抗體特異性免疫反應的多肽;或包含由如SEQ ID NO.:3-35中任一序列所示的多聚核苷酸序列編碼的氨基酸序列的多肽。

      本發(fā)明的多肽中還包括包含與天然存在的酪氨?;滨;?tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQ ID NO.:2)至少90%一致的氨基酸序列且包含兩個或兩個以上A-E組(上文所述)氨基酸的多肽。類似地,本發(fā)明的多肽還任選包括包含SEQ ID NO.:36-63和/或86中任一序列的至少20個相鄰氨基酸以及兩個或兩個以上如上文在A-E組中所述的氨基酸取代的多肽。還包括包含任一上述多肽的保守變異體的氨基酸序列作為本發(fā)明的多肽。

      在一個實施例中,組合物包括本發(fā)明的多肽和賦形劑(例如,緩沖液、水、醫(yī)藥學上可接受的賦形劑等)。本發(fā)明還提供與本發(fā)明的多肽特異性免疫反應的抗體或抗血清。

      本發(fā)明中還提供多聚核苷酸。本發(fā)明的多聚核苷酸包括具有一個或多個選擇性密碼子的編碼本發(fā)明的所關注蛋白質(zhì)或多肽的多聚核苷酸。此外,本發(fā)明的多聚核苷酸包括例如:包含如SEQ ID NO.:3-35、64-85中任一序列所述的核苷酸序列的多聚核苷酸;與其多聚核苷酸序列互補或編碼其多聚核苷酸序列的多聚核苷酸;和/或編碼包含如SEQ ID NO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽的多聚核苷酸,或其保守變異體。本發(fā)明的多聚核苷酸還包括編碼本發(fā)明的多肽的多聚核苷酸。類似地,在高度嚴格條件下在實質(zhì)上整個核酸長度上與上文所述的多聚核苷酸雜交的核酸為本發(fā)明的多聚核苷酸。

      本發(fā)明的多聚核苷酸還包括編碼多肽的多聚核苷酸,所述多肽包含與天然存在的酪氨?;滨;?tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQ ID NO.:2)至少90%一致的氨基酸序列且包含兩個或兩個以上如上文在A-E組(上文指出)中所述的突變。本發(fā)明的多聚核苷酸中還包括與上文所述的多聚核苷酸至少70%(或至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或更多)一致的多聚核苷酸,和/或包含任一上文所述的多聚核苷酸的保守變異體的多聚核苷酸。

      在某些實施例中,載體(例如,質(zhì)粒、柯斯質(zhì)粒(cosmid)、噬菌體、病毒等)包含本發(fā)明的多聚核苷酸。在一個實施例中,載體為表達載體。在另一實施例中,表達載體包括可操作性連接到一個或多個本發(fā)明的多聚核苷酸的啟動子。在另一實施例中,細胞包含包括本發(fā)明的多聚核苷酸的載體。

      另一方面,本發(fā)明提供化合物的組合物和制造所述化合物的方法。舉例來說,化合物包括例如非天然氨基酸(諸如對-(炔丙基氧基)-苯丙氨酸(例如,圖11中的1));疊氮基染料(諸如化學結構4和化學結構6中所示);炔基聚乙二醇(例如,如化學結構7中所示),其中n為介于例如50與10,000之間、75與5,000之間、100與2,000之間、100與1,000之間等的整數(shù)等。在本發(fā)明的實施例中,炔基聚乙二醇具有例如約5,000到約100,000Da、約20,000到約50,000Da、約20,000到約10,000Da(例如,20,000Da)的分子量。

      還提供包含這些化合物,例如具有蛋白質(zhì)和細胞的各種組合物。一方面,包括對-(炔丙基氧基)-苯丙氨酸非天然氨基酸的組合物進一步包括正交tRNA??蓪⒎翘烊话被崤c正交tRNA鍵接(例如共價鍵接),例如通過氨?;I與正交tRNA共價鍵接、與正交tRNA的末端核糖的3'OH或2'OH共價鍵接。

      試劑盒也為本發(fā)明的特征。舉例來說,提供在細胞中產(chǎn)生包含至少一個非天然氨基酸的蛋白質(zhì)的試劑盒,其中所述試劑盒包括含有編碼O-tRNA的多聚核苷酸序列或O-tRNA以及編碼O-RS的多聚核苷酸序列或O-RS的容器。在一個實施例中,試劑盒另外包括至少一個非天然氨基酸。在另一實施例中,試劑盒另外包含用于產(chǎn)生蛋白質(zhì)的說明材料。

      附圖說明

      圖1繪示使用雜合tRNA使hGH的表達增加。

      具體實施方式

      在詳細描述本發(fā)明之前,應了解,本發(fā)明不限于特定裝置或生物系統(tǒng),其當然可以變化。還應了解,本文所使用的術語只是出于描述特定實施例的目的,并且不打算限制本發(fā)明。除非內(nèi)容另作明確指示,否則如本說明書和隨附權利要求中所使用,單數(shù)形式“一”和“所述”包括多個參考物。因此,例如提及“一細胞”包括兩個或兩個以上細胞的組合;提及“細菌”包括細菌混合物等。

      除非本文或下文說明書的剩余部分中另作定義,否則本文所使用的所有科技術語都具有與本發(fā)明所屬領域技術人員通常所了解相同的含義。

      同源:當?shù)鞍踪|(zhì)和/或蛋白質(zhì)序列是天然或以人工方式從共同的祖先蛋白質(zhì)或蛋白質(zhì)序列得到時,其為“同源”的。類似地,當核酸和/或核酸序列是天然或以人工方式從共同的祖先核酸或核酸序列得到時,其為同源的。舉例來說,可通過任何可用的誘變方法來修飾任何天然存在的核酸以使其包括一個或多個選擇性密碼子。當表達時,這一經(jīng)誘變核酸將編碼包含一個或多個非天然氨基酸的多肽。當然,突變方法可另外改變一個或多個標準密碼子,從而也使所得突變蛋白質(zhì)中的一個或多個標準氨基酸改變。同源性一般是從兩種或兩種以上核酸或蛋白質(zhì)(或其序列)之間的序列相似性推斷得出。可用于確定同源性的序列之間相似性的確切百分比隨所討論的核酸和蛋白質(zhì)而變化,但通常使用僅25%的序列相似性來確定同源性。較高的序列相似性水平(例如,30%、40%、50%、60%、70%、80%、90%、95%或99%或更多)也可用于確定同源性。測定序列相似性百分比的方法(例如,使用默認參數(shù)的BLASTP和BLASTN)在本文中得以描述并且一般可用。

      正交:如本文所使用,術語“正交”是指與對于細胞或翻譯系統(tǒng)為內(nèi)源的相應分子相比,以降低的效率利用細胞的內(nèi)源性組件起作用,或者無法利用細胞的內(nèi)源性組件起作用的分子(例如,正交tRNA(O-tRNA)和/或正交氨?;鵷RNA合成酶(O-RS))。在tRNA和氨?;?tRNA合成酶的情況下,正交是指與利用內(nèi)源性tRNA合成酶起作用的內(nèi)源性tRNA相比,正交tRNA無法利用內(nèi)源性tRNA合成酶起作用或以降低的效率(例如,低于20%的效率、低于10%的效率、低于5%的效率或低于1%的效率)利用內(nèi)源性tRNA合成酶起作用;或者與利用內(nèi)源性tRNA起作用的內(nèi)源性tRNA合成酶相比,正交氨酰基-tRNA合成酶無法利用內(nèi)源性tRNA起作用或以降低的效率(例如,低于20%的效率、低于10%的效率、低于5%的效率或低于1%的效率)利用內(nèi)源性tRNA起作用。正交分子在細胞中缺乏功能性內(nèi)源互補分子。舉例來說,當與通過內(nèi)源性RS將內(nèi)源性tRNA氨酰化相比較時,細胞中的任何內(nèi)源性RS以降低的效率或甚至為零的效率將所述細胞中的正交tRNA氨?;?。在另一實例中,當與通過內(nèi)源性RS將內(nèi)源性tRNA氨酰化相比較時,正交RS以降低的效率或甚至為零的效率將所關注細胞中的任何內(nèi)源性tRNA氨?;?蓪⒌诙环肿右爰毎袕亩c第一正交分子一起作用。舉例來說,正交tRNA/RS對包括所引入的在細胞中相對于相應內(nèi)源性tRNA/RS對以一定效率(例如,50%效率、60%效率、70%效率、75%效率、80%效率、90%效率、95%效率或99%或更高效率)一起作用的互補組件。

      互補:術語“互補”是指可一起作用的正交對O-tRNA與O-RS的組件,例如其中O-RS將O-tRNA氨?;?。

      優(yōu)先氨酰化:術語“優(yōu)先氨?;笔侵概cO-RS將天然存在的tRNA或用于產(chǎn)生O-tRNA的原材料氨?;啾?,O-RS利用非天然氨基酸將O-tRNA氨酰化的效率,例如70%效率、75%效率、85%效率、90%效率、95%效率或99%或更高效率。將非天然氨基酸以高保真度,例如以對指定選擇性密碼子高于75%的效率、對指定選擇性密碼子高于約80%的效率、對指定選擇性密碼子高于約90%的效率、對指定選擇性密碼子高于約95%的效率或?qū)χ付ㄟx擇性密碼子高于約99%或更高效率并入正在生長的多肽鏈中。

      選擇性密碼子:術語“選擇性密碼子”是指在翻譯過程中由O-tRNA識別且不被內(nèi)源性tRNA識別的密碼子。O-tRNA反密碼子環(huán)識別mRNA上的選擇性密碼子并且在多肽中的這一位點并入其氨基酸,例如非天然氨基酸。選擇性密碼子可例如包括無義密碼子,諸如終止密碼子,例如琥珀密碼子、赭石密碼子和蛋白石密碼子;四個或四個以上堿基的密碼子;稀有密碼子;從天然或非天然堿基對獲得的密碼子等。

      抑制性tRNA:抑制性tRNA是(例如)通過提供響應選擇性密碼子將氨基酸并入多肽鏈的機制來改變指定翻譯系統(tǒng)中信使RNA(mRNA)的閱讀的tRNA。舉例來說,抑制性tRNA可通讀例如終止密碼子、四堿基密碼子或稀有密碼子等。

      可重復利用tRNA:術語“可重復利用tRNA”是指在翻譯期間經(jīng)氨酰化且可利用氨基酸(例如非天然氨基酸)反復地再氨?;詫⑺霭被?例如非天然氨基酸)并入一個或多個多肽鏈中的tRNA。

      翻譯系統(tǒng):術語“翻譯系統(tǒng)”是指將天然存在的氨基酸并入正在生長的多肽鏈(蛋白質(zhì))的組件集合。翻譯系統(tǒng)的組件可包括例如核糖體、tRNA、合成酶、mRNA、氨基酸等。本發(fā)明的組件(例如,ORS、OtRNA、非天然氨基酸等)可添加到活體外或活體內(nèi)翻譯系統(tǒng)中,例如脊椎動物細胞,例如酵母細胞、哺乳動物細胞、植物細胞、藻類細胞、真菌細胞、昆蟲細胞等。

      非天然氨基酸:如本文所使用,術語“非天然氨基酸”是指不為20種常見的天然存在的氨基酸中的一種或者硒代半胱氨酸或吡咯賴氨酸的任何氨基酸、經(jīng)修飾氨基酸和/或氨基酸類似物。

      得自:如本文所使用,術語“得自”是指從特定分子或生物體分離或者使用來自特定分子或生物體的信息制得的組件。

      無活性RS:如本文所使用,術語“無活性RS”是指已突變以致其無法再利用氨基酸將其天然同源tRNA氨酰化的合成酶。

      正選擇或篩選標記:如本文所使用,術語“正選擇或篩選標記”是指當存在(例如,經(jīng)表達、經(jīng)活化等)時導致將具有正選擇標記的細胞從不具有正選擇標記的細胞中鑒別出的標記。

      負選擇或篩選標記:如本文所使用,術語“負選擇或篩選標記”是指當存在(例如,經(jīng)表達、經(jīng)活化等)時使得鑒別出不具有所需特性(例如,當與具有所需特性的細胞相比較時)的細胞的標記。

      報告基因:如本文所使用,術語“報告基因”是指可用于選擇所關注系統(tǒng)中的靶組件的組件。舉例來說,報告基因可包括熒光篩選標記(例如,綠色熒光蛋白質(zhì));發(fā)光標記(例如,螢火蟲熒光素酶蛋白);基于親和力的篩選標記;或可選擇標記基因,諸如his3、ura3、leu2、lys2、lacZ、β-gal/lacZ(β-半乳糖苷酶)、Adh(醇脫氫酶)等。

      脊椎動物:如本文所使用,術語“脊椎動物”是指屬于系統(tǒng)發(fā)生域真核生物的生物體,諸如動物,例如哺乳動物、爬行動物、鳥類等。

      非真核生物:如本文所使用,術語“非真核生物”是指非脊椎動物生物體。舉例來說,非脊椎動物生物體可屬于真細菌(例如,大腸桿菌(Escherichia coli)、極端嗜熱細菌(Thermus thermophilics)、嗜熱脂肪芽孢桿菌(Bacillus stearothermophilus)等)系統(tǒng)發(fā)生域;或古細菌(例如,詹氏甲烷球菌(Methanococcus jannaschii)、嗜熱自養(yǎng)甲烷桿菌(Methanobacterium thermoautotrophicum)、諸如沃氏嗜鹽富饒菌(Haloferax volcanii)和嗜鹽菌屬NRC-1(Halobacterium species NRC-1)的嗜鹽菌(Halobacterium)、超嗜熱古菌(Archaeoglobus fulgidus)、強烈嗜熱球菌(Pyrococcus furiosus)、極端嗜熱古菌(Pyrococcus horikoshii)、嗜熱泉生古細菌(Aeuropyrum pernix)等)系統(tǒng)發(fā)生域。

      抗體:如本文所使用,術語“抗體”包括(但不限于)實質(zhì)上由一個或多個特異性結合并識別分析物(抗原)的免疫球蛋白基因或其片段所編碼的多肽。實例包括多克隆抗體、單克隆抗體、嵌合抗體和單鏈抗體等。如本文所使用的術語“抗體”中也包括免疫球蛋白的片段,包括Fab片段和由表達文庫(包括噬菌體呈現(xiàn))所產(chǎn)生的片段。有關抗體結構和技術例如參看Paul,Fundamental Immunology,第4版,1999,Raven Press,New York。

      保守變異體:術語“保守變異體”是指在功能上與得到保守變異體的組件(例如O-tRNA或O-RS)類似但序列變異的翻譯組件,例如保守變異體O-tRNA或保守變異體O-RS。舉例來說,O-RS將利用非天然氨基酸將互補O-tRNA或保守變異體O-tRNA氨酰化,但所述O-tRNA和所述保守變異體O-tRNA不具有相同序列。保守變異體的序列可具有例如一處變異、兩處變異、三處變異、四處變異或者五處或五處以上變異,只要保守變異體與相應O-tRNA或O-RS互補即可。

      選擇或篩選劑:如本文所使用,術語“選擇或篩選劑”是指當存在時允許從群體中選擇/篩選某些組件的試劑。舉例來說,選擇或篩選劑例如包括(但不限于)養(yǎng)分、抗生素、光波長、抗體、經(jīng)表達多聚核苷酸(例如,轉(zhuǎn)錄調(diào)節(jié)蛋白)等??衫缤ㄟ^濃度、強度等來改變選擇劑。

      可檢測物質(zhì):如本文所使用,術語“可檢測物質(zhì)”是指當經(jīng)活化、改變、表達等時允許從群體中選擇/篩選出某些組分的試劑。舉例來說,可檢測物質(zhì)可為化學劑,例如5-氟乳清酸(5-FOA),其在某些條件下,例如表達URA3報告基因時,變?yōu)槔鐨⑺辣磉_URA3報告基因的細胞的可檢測的有毒產(chǎn)物。

      除由遺傳密碼所強加的化學約束外,直接在脊椎動物細胞中基因修飾蛋白質(zhì)結構的能力將提供探查和操縱細胞過程的有力的分子工具。本發(fā)明提供擴充脊椎動物細胞中基因編碼的氨基酸數(shù)量的翻譯組件。其包括tRNA(例如,正交tRNA(O-tRNA))、氨酰基-tRNA合成酶(例如,正交合成酶(O-RS))、O-tRNA/O-RS對和非天然氨基酸。

      通常,有效地表達和加工本發(fā)明的O-tRNA且其在脊椎動物細胞中的翻譯過程中起作用,但不會被宿主的氨?;?tRNA合成酶有效氨?;T趍RNA翻譯期間,本發(fā)明的O-tRNA響應選擇性密碼子將不編碼常見20種氨基酸中的任一種的非天然氨基酸遞送到正在生長的多肽鏈中。

      本發(fā)明的O-RS在脊椎動物細胞中優(yōu)先利用非天然氨基酸將本發(fā)明的O-tRNA氨酰化,但不會將任何細胞質(zhì)中宿主的tRNA氨酰化。此外,本發(fā)明的氨?;?tRNA合成酶的特異性使得能接受非天然氨基酸,同時排除任何內(nèi)源性氨基酸。包括例如O-RS的氨基酸序列的多肽或其部分也為本發(fā)明的特征。此外,編碼翻譯組件O-tRNA、O-RS和其部分的多聚核苷酸為本發(fā)明的特征。

      本發(fā)明還提供產(chǎn)生所需翻譯組件(例如)O-RS和或正交對(正交tRNA和正交氨酰基-tRNA合成酶)的方法,所述正交對利用非天然氨基酸用于脊椎動物細胞中,(和由所述方法產(chǎn)生的翻譯組件)。舉例來說,來自大腸桿菌的酪氨酰-tRNA合成酶/tRNACUA對為本發(fā)明的O-tRNA/O-RS對。此外,本發(fā)明還提供在一種脊椎動物細胞中選擇/篩選翻譯組件并且當選擇/篩選后將這些組件用于不同脊椎動物細胞(未用于選擇/篩選的脊椎動物細胞)中的方法。舉例來說,可在酵母(例如釀酒酵母(Saccharomyces cerevisiae))中進行產(chǎn)生用于脊椎動物細胞的翻譯組件的選擇/篩選方法,且隨后可將這些所選組件用于另一脊椎動物細胞中,例如另一酵母細胞、哺乳動物細胞、昆蟲細胞、植物細胞、真菌細胞等。

      本發(fā)明進一步提供在脊椎動物細胞中產(chǎn)生蛋白質(zhì)的方法,其中所述蛋白質(zhì)包含非天然氨基酸。所述蛋白質(zhì)是使用本發(fā)明的翻譯組件產(chǎn)生。本發(fā)明還提供包括非天然氨基酸的蛋白質(zhì)(和由本發(fā)明的方法產(chǎn)生的蛋白質(zhì))。所關注蛋白質(zhì)或多肽還可包括翻譯后修飾,其例如是通過[3+2]環(huán)加成或親核-親電反應添加,并非由原核細胞所產(chǎn)生等。在某些實施例中,利用非天然氨基酸產(chǎn)生轉(zhuǎn)錄調(diào)節(jié)蛋白的方法(和由所述方法產(chǎn)生的蛋白質(zhì))也都包括在本發(fā)明中。包括包含非天然氨基酸的蛋白質(zhì)的組合物也為本發(fā)明的特征。

      用于產(chǎn)生具有非天然氨基酸的蛋白質(zhì)或多肽的試劑盒也為本發(fā)明的特征。

      正交氨酰基-TRNA合成酶(O-RS)

      為了將非天然氨基酸特異性并入脊椎動物細胞中的所關注蛋白質(zhì)或多肽中,將改變合成酶的底物特異性,以致僅將所需非天然氨基酸而非常見20種氨基酸中任一種裝入tRNA中。如果正交合成酶混雜,那么其將產(chǎn)生在靶位置具有天然與非天然氨基酸的混合物的突變蛋白質(zhì)。本發(fā)明提供對特定非天然氨基酸具有經(jīng)修飾的底物特異性的正交氨?;?tRNA合成酶的組合物以及產(chǎn)生所述合成酶的方法。

      包括正交氨?;?tRNA合成酶(O-RS)的脊椎動物細胞為本發(fā)明的特征。O-RS在脊椎動物細胞中優(yōu)先利用非天然氨基酸將正交tRNA(O-tRNA)氨?;?。在某些實施例中,O-RS利用一個以上非天然氨基酸,例如兩個或兩個以上、三個或三個以上等。因此,本發(fā)明的O-RS可具有優(yōu)先利用不同非天然氨基酸將O-tRNA氨?;哪芰?。這允許通過選擇將何種非天然氨基酸或非天然氨基酸組合放于細胞中和/或通過選擇不同量的放于細胞中的非天然氨基酸以供其并入來達到另一層面的控制。

      本發(fā)明的O-RS任選具有一種或多種相比天然氨基酸改進或增強的針對非天然氨基酸的酶特性。這些特性包括例如與天然存在的氨基酸(例如,20種已知常見氨基酸中的一種)相比較,針對非天然氨基酸的較高Km、較低Km、較高kcat、較低kcat、較低kcat/km、較高kcat/km等。

      可任選通過包括O-RS的多肽和/或編碼O-RS或其部分的多聚核苷酸將O-RS提供到脊椎動物細胞中。舉例來說,O-RS或其部分是由如SEQ ID NO.:3-35中任一序列所述的多聚核苷酸序列或其互補多聚核苷酸序列編碼。在另一實例中,O-RS包含如SEQ ID NO.:36-63和/或86中任一序列所述的氨基酸序列,或其保守變異體。關于例示性O-RS分子的序列,例如參看本文中表5、6和8以及實例6。

      O-RS還可包含與天然存在的酪氨?;滨;?tRNA合成酶(TyrRS)的氨基酸序列(例如,如SEQ ID NO.:2中所述)例如至少90%、至少95%、至少98%、至少99%或甚至至少99.5%一致且包含兩個或兩個以上A-E組的氨基酸的氨基酸序列。A組包括在與大腸桿菌TyrRS的Tyr37對應的位置的纈氨酸、異亮氨酸、亮氨酸、甘氨酸、絲氨酸、丙氨酸或蘇氨酸;B組包括在與大腸桿菌TyrRS的Asn126對應的位置的天冬氨酸;C組包括在與大腸桿菌TyrRS的Asp 182對應的位置的蘇氨酸、絲氨酸、精氨酸、天冬酰胺或甘氨酸;D組包括在與大腸桿菌TyrRS的Phe183對應的位置的甲硫氨酸、丙氨酸、纈氨酸或酪氨酸;且E組包括在與大腸桿菌TyrRS的Leu186對應的位置的絲氨酸、甲硫氨酸、纈氨酸、半胱氨酸、蘇氨酸或丙氨酸。

      除O-RS外,本發(fā)明的脊椎動物細胞還可包括其它組件,例如非天然氨基酸。脊椎動物細胞還包括正交tRNA(O-tRNA)(例如,得自非脊椎動物生物體,諸如大腸桿菌、嗜熱脂肪芽孢桿菌等),其中O-tRNA識別選擇性密碼子且優(yōu)先通過O-RS利用非天然氨基酸氨?;?。所述細胞中還可存在包含編碼所關注多肽的多聚核苷酸的核酸,其中所述多聚核苷酸包含由O-tRNA識別的選擇性密碼子或者一個或多個所述密碼子的組合。

      一方面,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或99%的包含如SEQ ID NO.:65中所述的多聚核苷酸序列或由如SEQ ID NO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介導將非天然氨基酸并入蛋白質(zhì)中。另一方面,O-tRNA包含SEQ ID NO.:65,且O-RS包含SEQ ID NO.:36-63和/或86中任一序列中所述的多肽序列和/或其保守變異體。關于例示性O-RS和O-tRNA分子的序列,也例如參看本文中表5和實例6。

      在一個實例中,脊椎動物細胞包含正交氨酰基-tRNA合成酶(O-RS)、正交tRNA(O-tRNA)、非天然氨基酸和包含編碼所關注多肽的多聚核苷酸的核酸,所述多聚核苷酸包含由O-tRNA識別的選擇性密碼子。在脊椎動物細胞中,O-RS優(yōu)先利用非天然氨基酸將正交tRNA(O-tRNA)氨?;宜黾毎诓淮嬖诜翘烊话被岬那闆r下以一定產(chǎn)率產(chǎn)生所關注多肽,所述產(chǎn)率例如為在存在非天然氨基酸的情況下多肽產(chǎn)率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。

      用于產(chǎn)生O-RS的方法(其為本發(fā)明的特征)任選包括:由野生型合成酶框架產(chǎn)生突變合成酶池,且隨后根據(jù)相對于常見20種氨基酸,針對非天然氨基酸的特異性選擇突變RS。為分離出所述合成酶,其選擇方法:(i)敏感,因為由最初幾回合得到的所需合成酶的活性較低且群體較小;(ii)“可調(diào)”,因為需要以不同選擇回合改變選擇嚴格度;和(iii)通用,以致所述方法可用于不同非天然氨基酸。

      在脊椎動物細胞中產(chǎn)生優(yōu)先利用非天然氨基酸將正交tRNA氨?;恼话滨;?tRNA合成酶(O-RS)的方法通常包括應用正選擇隨后負選擇的組合。在正選擇過程中,抑制正標記非必需位置處所引入的選擇性密碼子將使脊椎動物細胞能在正選擇壓力下存活。因此,在存在非天然氨基酸的情況下,存活細胞編碼將非天然氨基酸裝于正交抑制tRNA的活性合成酶。在負選擇的過程中,抑制負標記非必需位置處所引入的選擇性密碼子將去除具有天然氨基酸特異性的合成酶。負選擇和正選擇的存活細胞編碼只能(或至少優(yōu)先)利用非天然氨基酸將正交抑制tRNA氨?;?裝入)的合成酶。

      舉例來說,所述方法包括:(a)在存在非天然氨基酸的情況下,使第一物種的脊椎動物細胞群經(jīng)歷正選擇,其中所述脊椎動物細胞各自包含:i)氨酰基-tRNA合成酶(RS)文庫成員,ii)正交tRNA(O-tRNA),iii)編碼正選擇標記的多聚核苷酸和iv)編碼負選擇標記的多聚核苷酸;其中在正選擇下存活的細胞包含在存在非天然氨基酸的情況下將正交tRNA(O-tRNA)氨酰化的活性RS;和(b)在不存在非天然氨基酸的情況下,使在正選擇下存活的細胞經(jīng)歷負選擇,以除去利用天然氨基酸將O-tRNA氨?;幕钚訰S,從而提供優(yōu)先利用非天然氨基酸將O-tRNA氨?;腛-RS。

      正選擇標記可為多種分子中任一個。在一個實施例中,正選擇標記為提供營養(yǎng)補充以供生長的產(chǎn)物,并且所述選擇是在缺乏所述營養(yǎng)補充的培養(yǎng)基上執(zhí)行。編碼正選擇標記的多聚核苷酸的實例包括(但不限于)例如基于補充細胞的氨基酸營養(yǎng)缺陷的報告基因、his3基因(例如,其中所述his3基因編碼咪唑甘油磷酸酯脫水酶,通過提供3-氨基三唑(3-AT)檢測)、ura3基因、leu2基因、lys2基因、lacZ基因、adh基因等。例如參看G.M.Kishore,&D.M.Shah,(1988),Amino acid biosynthesis inhibitors as herbicides,Annual Review of Biochemistry 57:627-663。在一個實施例中,通過鄰-硝基苯基-β-D-半乳糖吡喃糖苷(ONPG)水解檢測lacZ產(chǎn)生。例如參看I.G.Serebriiskii,&E.A.Golemis,(2000),Uses oflacZ to study gene function:evaluation of beta-galactosidase assays employed in the yeast two-hybrid system,Analytical Biochemistry 285:1-15。其它正選擇標記包括例如熒光素酶、綠色熒光蛋白質(zhì)(GFP)、YFP、EGFP、RFP、抗生素抗性基因的產(chǎn)物(例如,氯霉素乙酰轉(zhuǎn)移酶(CAT))、轉(zhuǎn)錄調(diào)節(jié)蛋白(例如GAL4)等。編碼正選擇標記的多聚核苷酸任選包含選擇性密碼子。

      可將編碼正選擇標記的多聚核苷酸可操作性連接到反應元件。還可存在另一多聚核苷酸,其編碼調(diào)節(jié)由反應元件進行的轉(zhuǎn)錄的轉(zhuǎn)錄調(diào)節(jié)蛋白且包含至少一個選擇性密碼子。通過經(jīng)非天然氨基酸氨?;腛-tRNA將非天然氨基酸并入轉(zhuǎn)錄調(diào)節(jié)蛋白中,將引起編碼正選擇標記的多聚核苷酸(例如報告基因)的轉(zhuǎn)錄。選擇性密碼子任選位于編碼轉(zhuǎn)錄調(diào)節(jié)蛋白的DNA結合結構域的多聚核苷酸的一部分中或?qū)嵸|(zhì)上鄰近編碼轉(zhuǎn)錄調(diào)節(jié)蛋白的DNA結合結構域的多聚核苷酸的一部分。

      還可將編碼負選擇標記的多聚核苷酸可操作性連接到反應元件,轉(zhuǎn)錄調(diào)節(jié)蛋白將通過所述反應元件介導轉(zhuǎn)錄。例如參看A.J.DeMaggio等人,(2000),The yeast split-hybrid system,Method Enzymol.328:128-137;H.M.Shih等人,(1996),A positive genetic selection for disrupting protein-protein interactions:identification of CREB mutations that prevent association with the coactivator CBP,Proc.Natl.Acad.Sci.U.S.A.93:13896-13901;M.Vidal等人,(1996),Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system.[comment],Proc.Natl.Acad.Sci.U.S.A.93:10321-10326;和M.Vidal等人,(1996),Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions.[comment],Proc.Natl.Acad.Sci.U.S.A.93:10315-10320。通過經(jīng)天然氨基酸氨?;腛-tRNA將天然氨基酸并入轉(zhuǎn)錄調(diào)節(jié)蛋白中,將引起負選擇標記的轉(zhuǎn)錄。負選擇標記任選包含選擇性密碼子。在一個實施例中,本發(fā)明的正選擇標記和/或負選擇標記可包含至少兩個選擇性密碼子,其各自或都可包含至少兩個不同選擇性密碼子或至少兩個相同選擇性密碼子。

      轉(zhuǎn)錄調(diào)節(jié)蛋白為結合(直接或間接)核酸序列(例如,反應元件)且調(diào)節(jié)可操作性連接到反應元件的序列的轉(zhuǎn)錄的分子。轉(zhuǎn)錄調(diào)節(jié)蛋白可為轉(zhuǎn)錄活化蛋白(例如,GAL4、核激素受體、AP1、CREB、LEF/tcf家族成員、SMAD、VP16、SP1等)、轉(zhuǎn)錄阻遏蛋白(例如,核激素受體、Groucho/tle家族、Engrailed家族等)或可視環(huán)境而具有兩種活性的蛋白質(zhì)(例如LEF/tcf、同源異型盒蛋白等)。反應元件通常為轉(zhuǎn)錄調(diào)節(jié)蛋白所識別的核酸序列或與轉(zhuǎn)錄調(diào)節(jié)蛋白一起作用的額外試劑。

      轉(zhuǎn)錄調(diào)節(jié)蛋白的另一實例為轉(zhuǎn)錄活化蛋白GAL4。例如參看A.Laughon等人,(1984),Identification of two proteins encoded by the Saccharomyces cerevisiae GAL4gene,Molecular&Cellular Biology 4:268-275;A.Laughon,&R.F.Gesteland,(1984),Primary structure of the Saccharomyces cerevisiae GAL4gene.Molecular&Cellular Biology 4:260-267;L.Keegan等人,(1986),Separation of DNA binding from the transcription-activating function of a vertebrate regulatory protein,Science 231-.699-704;和M.Ptashne,(1988),How vertebrate transcriptional activators work,Nature 335:683-689。此881個氨基酸的蛋白質(zhì)的N末端147個氨基酸形成特異性結合DNA序列的DNA結合結構域(DBD)。例如參看M.Carey等人,(1989),An amino-terminal fragment of GAL4binds DNA as a dimer,J.Mol.Biol.209:423-432;和E.Giniger等人,(1985),Specific DNA binding of GAL4,a positive regulatory protein of yeast,Cell 40:767-774。DBD通過插入蛋白質(zhì)序列連接到當結合DNA時可活化轉(zhuǎn)錄的C末端113個氨基酸的活化結構域(AD)。例如參看J.Ma,&M.Ptashne,(1987),Deletion analysis of GAL4defines two transcriptional activating segments,Cell48:847-853;和J.Ma,&M.Ptashne,(1987),The carboxy-terminal 30amino acids of GAL4are recognized by GAL80,Cell 50:137-142。將琥珀密碼子朝向例如含有GAL4的N末端DBD和其C末端AD的單一多肽的N末端DBD放置,可將由O-tRNA/O-RS對執(zhí)行的琥珀抑制連接到由GAL4執(zhí)行的轉(zhuǎn)錄活化。可使用GAL4活化的報告基因以利用所述基因執(zhí)行正選擇和負選擇。

      用于負選擇的培養(yǎng)基可包含轉(zhuǎn)化成通過負選擇標記可檢測的物質(zhì)的選擇或篩選劑。在本發(fā)明一方面中,可檢測物質(zhì)為有毒物質(zhì)。編碼負選擇標記的多聚核苷酸可例如為ura3基因。舉例來說,可將URA3報告基因置于含有GAL4DNA結合位點的啟動子的控制下。當例如通過翻譯編碼具有選擇性密碼子的GAL4的多聚核苷酸產(chǎn)生負選擇標記時,GAL4將活化URA3的轉(zhuǎn)錄。在包含5-氟乳清酸(5-FOA)的培養(yǎng)基上實現(xiàn)負選擇,所述5-FOA將經(jīng)ura3基因的基因產(chǎn)物轉(zhuǎn)化成可檢測物質(zhì)(例如,殺死細胞的有毒物質(zhì))。例如參看J.D.Boeke等人,(1984),A positive selection for mutants lacking orotidine-5'-phosphate decarboxylase activity in yeast:5-fluoroorotic acid resistance,Molecular&General Genetics 197:345-346;M.Vidal等人,(1996),Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system.[comment],Proc.Natl.Acad.Sci.U.S.A.93:10321-10326;和M.Vidal等人,(1996),Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions,[comment],Proc.Natl.Acad.Sci.U.S.A.93:10315-10320。

      與正選擇標記相同,負選擇標記也可為多種分子中的任一個。在一個實施例中,正選擇標記和/或負選擇標記為在存在適當反應物的情況下發(fā)熒光或催化發(fā)光反應的多肽。舉例來說,負選擇標記包括(但不限于)例如熒光素酶、綠色熒光蛋白質(zhì)(GFP)、YFP、EGFP、RFP、抗生素抗性基因的產(chǎn)物(例如,氯霉素乙酰轉(zhuǎn)移酶(CAT))、lacZ基因的產(chǎn)物、轉(zhuǎn)錄調(diào)節(jié)蛋白等。在本發(fā)明一方面中,通過熒光活化細胞分選(FACS)或通過發(fā)光來檢測正選擇標記和/或負選擇標記。在另一實例中,正選擇標記和/或負選擇標記包含基于親和力的篩選標記。同一多聚核苷酸可編碼正選擇標記和負選擇標記。

      其它水平的選擇/篩選嚴格度也可用于本發(fā)明方法中。在產(chǎn)生O-RS的方法的一個或兩個步驟中可改變選擇或篩選嚴格度。這可包括例如改變編碼正選擇和/或負選擇標記的多聚核苷酸中反應元件的量;將不同量的無活性合成酶添加到一個或兩個步驟中;改變所使用的選擇/篩選劑的量等。還可執(zhí)行額外回合的正和/或負選擇。

      選擇或篩選也可包含一次或多次正或負選擇或篩選,所述選擇或篩選包括例如氨基酸滲透性的改變、翻譯效率的改變、翻譯保真度的改變等。通常,一種或多種改變是建立在一個或多個包含或編碼用于產(chǎn)生蛋白質(zhì)的正交tRNA-tRNA合成酶對組件的多聚核苷酸突變的基礎上。

      還可使用模型富集研究從過量無活性合成酶中迅速選擇活性合成酶。可進行正和/或負模型選擇研究。舉例來說,將包含潛在活性氨?;?tRNA合成酶的脊椎動物細胞與不同倍數(shù)過量的無活性氨酰基-tRNA合成酶混合。在生長于非選擇性培養(yǎng)基中并例如通過X-GAL覆蓋分析的細胞與生長于選擇性培養(yǎng)基(例如,在不存在組氨酸和/或尿嘧啶的情況下)中且能存活并例如通過X-GAL分析的細胞之間進行比率比較。對于負選擇模型,將潛在活性氨酰基-tRNA合成酶與不同倍數(shù)過量的無活性氨?;?tRNA合成酶混合,并利用例如5-FOA等負選擇物質(zhì)執(zhí)行選擇。

      通常,RS文庫(例如,突變型RS文庫)包含由例如來自非脊椎動物生物體的至少一種氨?;?tRNA合成酶(RS)得到的RS。在一個實施例中,RS文庫是得自無活性RS,例如其中無活性RS是通過使活性RS例如在所述合成酶的活性位點、所述合成酶的編輯機制位點、由組合合成酶的不同結構域得到的不同位點等突變而產(chǎn)生。舉例來說,使RS活性位點中的殘基突變成例如丙氨酸殘基。將編碼丙氨酸突變的RS的多聚核苷酸用作模板,以將丙氨酸殘基誘變?yōu)樗?0種氨基酸。選擇/篩選突變型RS的文庫以產(chǎn)生O-RS。在另一實施例中,無活性RS包含氨基酸結合袋并且一個或多個包含所述結合袋的氨基酸經(jīng)一個或多個不同氨基酸取代。在一個實例中,經(jīng)取代氨基酸是經(jīng)丙氨酸取代。任選將編碼丙氨酸突變的RS的多聚核苷酸用作模板以將丙氨酸殘基誘變?yōu)樗?0種氨基酸,并加以選擇/篩選。

      產(chǎn)生O-RS的方法可進一步包括通過使用所屬領域中已知的各種誘變技術產(chǎn)生RS文庫。舉例來說,可通過位點特異性突變、隨機點突變、同源重組、DNA改組或其它遞歸式誘變方法、嵌合構建或其任何組合產(chǎn)生突變型RS。舉例來說,可由兩個或兩個以上其它(例如)較小、較少多樣性的“子文庫”產(chǎn)生突變型RS文庫。在使合成酶經(jīng)歷正和負選擇/篩選策略后,可隨后使這些合成酶經(jīng)歷進一步誘變。舉例來說,可分離出編碼O-RS的核酸;可由所述核酸產(chǎn)生一組編碼突變型O-RS的多聚核苷酸(例如,通過隨機誘變、位點特異性誘變、重組或其任何組合);且可重復這些個別步驟或這些步驟的組合,直到獲得優(yōu)先利用非天然氨基酸將O-tRNA氨?;耐蛔冃蚈-RS。在本發(fā)明一方面中,將所述步驟執(zhí)行至少2次。

      有關產(chǎn)生O-RS的其它細節(jié)可見于題為“Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA synthetase pairs.”的WO 2002/086075中。還參看Hamano-Takaku等人,(2000)A mutant Escherichia coli Tyrosyl-tRNA Synthetase Utilizes the Unnatural Amino Acid Azatyrosine More Efficiently than Tyrosine,Journal of Biological Chemistry.275(51):40324-40328;Kiga等人(2002),An engineered Escherichia coli tyrosyl-tRNA synthetase for site-specific incorporation of an unnatural amino acid into proteins in vertebrate translation and its application in a wheat germ cell-free system,PNAS 99(15):9715-9723;和Francklyn等人,(2002),Aminoacyl-tRNA synthetases:Versatile players in the changing theater of translation;RNA.8:1363-1372。

      正交tRNA

      本發(fā)明提供包括正交tRNA(O-tRNA)的真核細胞。正交tRNA介導在活體內(nèi)將非天然氨基酸并入蛋白質(zhì)中,所述蛋白質(zhì)是由包含由O-tRNA識別的選擇性密碼子的多聚核苷酸編碼。在某些實施例中,本發(fā)明的O-tRNA例如以至少40%、至少45%、至少50%、至少60%、至少75%、至少80%或甚至90%或更高的包含如SEQ ID NO.:65中所述的多聚核苷酸序列或在細胞中由如SEQ ID NO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介導將非天然氨基酸并入蛋白質(zhì)中。參看本文中表5。

      本發(fā)明O-tRNA的實例為SEQ ID NO.:65(參看本文中實例6和表5)。SEQ ID NO.:65為剪接前/加工前轉(zhuǎn)錄物,其在細胞中任選例如使用標準內(nèi)源細胞剪接和加工機器加工,且經(jīng)修飾以形成活性O-tRNA。通常,所述剪接前轉(zhuǎn)錄物群在細胞中形成活性tRNA群。本發(fā)明還包括O-tRNA的保守變異體和其經(jīng)加工細胞產(chǎn)物。舉例來說,O-tRNA的保守變異體包括功能與SEQ ID NO.:65的O-tRNA類似且保持經(jīng)加工形式的tRNA L形結構,但不具有相同序列的分子(且不為野生型tRNA分子)。通常,由于O-tRNA可在活體內(nèi)再氨酰化,從而再次介導響應選擇性密碼子將非天然氨基酸并入由多聚核苷酸編碼的蛋白質(zhì)中,故本發(fā)明的O-tRNA為可重復利用的O-tRNA。

      真核生物而非原核生物中tRNA的轉(zhuǎn)錄是通過RNA聚合酶III進行,這將限制能在脊椎動物細胞中轉(zhuǎn)錄的tRNA結構基因的一級序列。而且,在脊椎動物細胞中,tRNA需要從轉(zhuǎn)錄tRNA的細胞核輸出到細胞質(zhì),以進行翻譯。編碼本發(fā)明的O-tRNA或其互補多聚核苷酸的核酸也為本發(fā)明的特征。在本發(fā)明一個方面中,編碼本發(fā)明的O-tRNA的核酸包括內(nèi)部啟動子序列,例如A盒(例如,TRGCNNAGY)和B盒(例如,GGTTCGANTCC,SEQ ID NO:95)。A盒和B盒序列的其它實例可見于Geiduschek,(1988),Transcription By RNA Polymerase III,Ann-Rev.Biochem.57:873-914,其以引用的方式并入本文中。本發(fā)明的O-tRNA也可經(jīng)轉(zhuǎn)錄后修飾。舉例來說,真核生物中tRNA基因的轉(zhuǎn)錄后修飾包括分別通過Rnase P和3'-內(nèi)切核酸酶去除5'-和3'-側接序列。添加3'-CCA序列也為真核生物中tRNA基因的轉(zhuǎn)錄后修飾。

      在一個實施例中,通過使第一物種的脊椎動物細胞群(其中所述脊椎動物細胞包含tRNA文庫成員)經(jīng)歷負選擇來獲得O-tRNA。負選擇除去包含如下tRNA文庫成員的細胞,所述tRNA文庫成員經(jīng)對于脊椎動物細胞為內(nèi)源性的氨?;?tRNA合成酶(RS)氨酰化。這提供與第一物種的脊椎動物細胞正交的tRNA池。

      另外,或者與上文所述其它方法組合,使用反式翻譯系統(tǒng)以將非天然氨基酸并入多肽中。此系統(tǒng)涉及存在于大腸桿菌中的稱為tmRNA的分子。這一RNA分子在結構上與丙氨酰tRNA相關且經(jīng)丙氨酰合成酶氨?;?。tmRNA與tRNA之間的差異在于,反密碼子環(huán)經(jīng)特定較大序列置換。這一序列允許核糖體使用tmRNA內(nèi)編碼的開放式閱讀框作為模板在已停止的序列上重新開始翻譯。在本發(fā)明中,可產(chǎn)生優(yōu)先經(jīng)正交合成酶氨?;已b載有非天然氨基酸的正交tmRNA。通過所述系統(tǒng)轉(zhuǎn)錄基因,核糖體將在特定位點停止;將非天然氨基酸引入此位點處,并且使用正交tmRNA內(nèi)編碼的序列重新開始翻譯。

      有關產(chǎn)生重組正交tRNA的其它方法可見于例如題為“Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA synthetase pairs.”的國際專利申請案WO 2002/086075中。還參看Forster等人,(2003)Programmingpeptidomimetic synthetases by translating genetic codes designed de novo PNAS 100(11):6353-6357;和Feng等人,(2003),Expanding tRNA recognition of a tRNA synthetase by a single amino acid change,PNAS 100(10):5676-5681。

      正交TRNA與正交氨酰基-TRNA合成酶對

      正交對是由例如抑制tRNA、移碼tRNA等O-tRNA與O-RS構成。O-tRNA不經(jīng)內(nèi)源性合成酶?;?,且能夠在活體內(nèi)介導將非天然氨基酸并入蛋白質(zhì)中,所述蛋白質(zhì)是由包含由O-tRNA識別的選擇性密碼子的多聚核苷酸編碼。在脊椎動物細胞中,O-RS識別O-tRNA且優(yōu)先利用非天然氨基酸將O-tRNA氨?;?。本發(fā)明中包括用于產(chǎn)生正交對的方法連同由所述方法產(chǎn)生的正交對,和用于脊椎動物細胞中的正交對組合物。多種正交tRNA/合成酶對的開發(fā)可允許使用不同密碼子將多個非天然氨基酸同時并入脊椎動物細胞中。

      可通過利用無效跨物種氨?;斎雭碜圆煌矬w的對(例如,無義抑制子對)在脊椎動物細胞中產(chǎn)生正交O-tRNA/O-RS對。在脊椎動物細胞中有效表達和加工O-tRNA和O-RS,并且將O-tRNA從細胞核有效地輸出到細胞質(zhì)。舉例來說,一種所述對為來自大腸桿菌的酪氨酰-tRNA合成酶/tRNACUA對(例如參看,H.M.Goodman等人,(1968),Nature 217:1019-24;和D.G.Barker等人,(1982),FEBS Letters 150:419-23)。當在釀酒酵母細胞質(zhì)中表達大腸桿菌酪氨酰-tRNA合成酶和其同源大腸桿菌tRNACUA時,大腸桿菌酪氨酰-tRNA合成酶有效地將其同源大腸桿菌tRNACUA氨酰化,但不會將釀酒酵母tRNA氨酰化。例如參看,H.Edwards,&P.Schimmel,(1990),Molecular&Cellular Biology 10:1633-41;和H.Edwards等人,(1991),PNAS United States of America 88:1153-6。此外,大腸桿菌酪氨酰tRNACUA為釀酒酵母氨?;?tRNA合成酶的弱底物(例如參看V.Trezeguet等人,(1991),Molecular&Cellular Biology 11:2744-51),但其有效地在釀酒酵母的蛋白質(zhì)翻譯中起作用。例如參看,H.Edwards,&P.Schimmel,(1990)Molecular&Cellular Biology 10:1633-41;H.Edwards等人,(1991),PNAS United States of America 88:1153-6;和V.Trezeguet等人,(1991),Molecular&Cellular Biology 11:2744-51。此外,大腸桿菌TyrRS不具有校對接合到tRNA的非天然氨基酸的編輯機制。

      O-tRNA和O-RS可為天然存在的,或可通過使來自多種生物體的天然存在的tRNA和/或RS突變得到,這將產(chǎn)生tRNA文庫和/或RS文庫。參看本文中題為“來源和宿主”的章節(jié)。在各個實施例中,O-tRNA和O-RS是得自至少一種生物體。在另一實施例中,O-tRNA得自第一物種的天然存在或突變的天然存在的tRNA,且O-RS得自第二物種的天然存在或突變的天然存在的RS。在一個實施例中,第一與第二非脊椎動物生物體相同?;蛘撸谝慌c第二非脊椎動物生物體可不同。

      有關產(chǎn)生O-RS和O-tRNA的方法,參看本文中題為“正交氨?;?tRNA合成酶(Orthogonal aminoacyl-tRNA synthetases)”和“O-tRNA”的章節(jié)。還參看題為“Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA synthetase pairs.”的國際專利申請案WO 2002/086075。

      保真度、效率和產(chǎn)率

      保真度是指將所需分子(例如非天然氨基酸或氨基酸)并入正在生長的多肽中的所需位置的準確度。本發(fā)明的翻譯組件響應選擇性密碼子以高保真度將非天然氨基酸并入蛋白質(zhì)中。舉例來說,與并入正在生長的多肽鏈中所需位置的特定天然氨基酸的不合需要的并入相比,使用本發(fā)明的組件將所需非天然氨基酸并入正在生長的多肽鏈中所需位置(例如響應選擇性密碼子)的效率為例如大于75%、大于85%、大于95%或甚至大于99%有效。

      效率還可以指與相關對照相比,O-RS利用非天然氨基酸將O-tRNA氨酰化的程度。本發(fā)明的O-RS可通過其效率定義。在本發(fā)明某些實施例中,將O-RS與另一O-RS相比較。例如,本發(fā)明的O-RS利用非天然氨基酸將O-tRNA氨酰化,這與具有(例如)如SEQ ID NO.:86或45中所述的氨基酸序列的O-RS或表5)中另一特定RS將O-tRNA氨酰化相比例如至少40%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或甚至99%或更高有效。在另一實施例中,本發(fā)明的O-RS利用非天然氨基酸將O-tRNA氨?;@比O-RS利用天然氨基酸將O-tRNA氨?;行Ю缰辽?0倍、至少20倍、至少30倍等。

      使用本發(fā)明的翻譯組件,包含非天然氨基酸的所關注多肽的產(chǎn)率例如為從多聚核苷酸缺乏選擇性密碼子的細胞中獲得天然存在的所關注多肽的產(chǎn)率的至少5%、至少10%、至少20%、至少30%、至少40%、50%或更多。另一方面,細胞在不存在非天然氨基酸的情況下以一定產(chǎn)率產(chǎn)生所關注多肽,所述產(chǎn)率例如為在存在非天然氨基酸的情況下多肽產(chǎn)率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。

      來源和宿主生物體

      本發(fā)明的正交翻譯組件通常得自非脊椎動物生物體從而用于脊椎動物細胞或翻譯系統(tǒng)。舉例來說,正交O-tRNA可得自非脊椎動物生物體,例如真細菌,諸如大腸桿菌、極端嗜熱細菌(Thermus thermophilus)、嗜熱脂肪芽孢桿菌等;或古細菌,例如詹氏甲烷球菌、嗜熱自養(yǎng)甲烷桿菌(Methanobacterium thermoautotrophicum)、嗜鹽古菌(Halobacterium)(諸如沃氏嗜鹽富饒菌(Haloferax volcanii)和嗜鹽古菌NRC-1(Halobacterium species NRC-1))、閃爍古生球菌(Archaeoglobus fulgidus)、強烈火球菌(Pyrococcus furiosus)、掘越氏熱球菌(Pyrococcus horikoshii)、嗜熱泉生古細菌(Aeuropyrum pernix)等,而正交O-RS可得自非脊椎動物生物體,例如真細菌,諸如大腸桿菌、極端嗜熱細菌、嗜熱脂肪芽孢桿菌等;或古細菌,例如詹氏甲烷球菌、嗜熱自養(yǎng)甲烷桿菌、嗜鹽古菌(諸如沃氏嗜鹽富饒菌和嗜鹽古菌NRC-1)、閃爍古生球菌、強烈火球菌、掘越氏熱球菌、嗜熱泉生古細菌等。另外,還可使用脊椎動物來源,例如植物、藻類、原生生物、真菌、酵母、動物(例如,哺乳動物、昆蟲、節(jié)肢動物等)等,例如其中所述組件與所關注細胞或翻譯系統(tǒng)正交,或其中其經(jīng)修飾(例如,突變)而與所述細胞或翻譯系統(tǒng)正交。

      O-tRNA/O-RS對的個別組件可得自相同生物體或不同生物體。在一個實施例中,O-tRNA/O-RS對是來自相同生物體。舉例來說,O-tRNA/O-RS對可得自大腸桿菌的酪氨酰-tRNA合成酶/tRNACUA對?;蛘逴-tRNA/O-RS對的O-tRNA和O-RS任選來自不同生物體。

      正交O-tRNA、O-RS或O-tRNA/O-RS對可經(jīng)選擇或篩選和/或用于脊椎動物細胞中以產(chǎn)生具有非天然氨基酸的多肽。脊椎動物細胞可來自各種來源,例如任何脊椎動物(例如,哺乳動物、兩棲動物、鳥類、爬行動物、魚類等)等。具有本發(fā)明的翻譯組件的脊椎動物細胞的組合物也為本發(fā)明的特征。

      本發(fā)明還提供在一種物種中有效篩選以任選用于所述物種和/或第二物種(任選無需額外選擇/篩選)中。舉例來說,在一種物種(例如,易于操縱的物種,諸如酵母細胞等)中選擇或篩選O-tRNA/O-RS組件,且將其引入第二脊椎動物物種,例如植物(例如復雜植物,諸如單子葉植物或雙子葉植物)、藻類、原生生物、真菌、酵母、動物(例如哺乳動物、昆蟲、節(jié)肢動物等)等中,以用于在活體內(nèi)將非天然氨基酸并入所述第二物種中。

      舉例來說,由于釀酒酵母(Saccharomyces cerevisiae,S.cerevisiae)為單細胞的,具有快速換代時間和相對充分表征的遺傳學,故可將其選作脊椎動物第一物種。例如參看D.Burke等人,(2000)Methods in Yeast Genetics.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY。此外,由于真核生物的翻譯機器高度保守(例如參看(1996)Translational Control.Cold Spring Harbor Laboratory,Cold Spring Harbor,NY;Y.Kwok,&J.T.Wong,(1980),Evolutionary relationship between Halobacterium cutirubrum and eukaryotes determined by use of aminoacyl-tRNA synthetases as phylogenetic probes,Canadian Journal of Biochemistry 58:213-218;和(2001)The Ribosome.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY),故可將在釀酒酵母中發(fā)現(xiàn)的用于并入非天然氨基酸的aaRS基因引入高級脊椎動物生物體中,且與同源tRNA合作(例如參看K.Sakamoto等人,(2002)Site-specific incorporation of an unnatural amino acid into proteins in mammalian cells,Nucleic Acids Res.30:4692-4699;和C.Kohrer等人,(2001),Import of amber and ochre suppressor tRNA's into mammalian cells:a general approach to site-specific insertion of amino acid analogues into proteins,Proc.Natl.Acad.Sci.U.S.A.98:14310-14315)用于并入非天然氨基酸。

      在一個實例中,在如本文所述的第一物種中產(chǎn)生O-tRNA/O-RS對的方法另外包括將編碼O-tRNA的核酸和編碼O-RS的核酸引入第二物種(例如,哺乳動物、昆蟲、真菌、藻類、植物等)的脊椎動物細胞中。在另一實例中,產(chǎn)生在脊椎動物細胞中優(yōu)先利用非天然氨基酸將正交tRNA氨?;恼话滨;?tRNA合成酶(O-RS)的方法包括:(a)在存在非天然氨基酸的情況下,使第一物種(例如,酵母等)的脊椎動物細胞群經(jīng)歷正選擇。所述脊椎動物細胞各自包含:i)氨?;?tRNA合成酶(RS)文庫成員,ii)正交tRNA(O-tRNA),iii)編碼正選擇標記的多聚核苷酸,和iv)編碼負選擇標記的多聚核苷酸。在正選擇中存活的細胞包含在存在非天然氨基酸的情況下將正交tRNA(O-tRNA)氨酰化的活性RS。使在正選擇下存活的細胞在不存在非天然氨基酸的情況下經(jīng)歷負選擇,以除去利用天然氨基酸將O-tRNA氨?;幕钚訰S。這提供優(yōu)先利用非天然氨基酸將O-tRNA氨?;腛-RS。將編碼O-tRNA的核酸和編碼O-RS的核酸(或O-tRNA和/或O-RS的組件)引入第二物種(例如,哺乳動物、昆蟲、真菌、藻類、植物等)的脊椎動物細胞中。通常,通過使第一物種的脊椎動物細胞群經(jīng)歷負選擇來獲得O-tRNA,其中所述脊椎動物細胞包含tRNA文庫成員。負選擇標記除去包含tRNA文庫成員的細胞,所述tRNA文庫成員經(jīng)對于脊椎動物細胞為內(nèi)源性的氨?;?tRN合成酶(RS)氨?;?,其提供與第一物種和第二物種的脊椎動物細胞正交的tRNA池。

      選擇性密碼子

      本發(fā)明的選擇性密碼子將擴充蛋白質(zhì)生物合成機器的遺傳密碼子框架。舉例來說,選擇性密碼子包括例如獨特的三堿基密碼子、無義密碼子(諸如終止密碼子,例如琥珀密碼子(UAG)、蛋白石密碼子(UGA))、非天然密碼子、至少四堿基的密碼子、稀有密碼子等。可將多個(例如一個或多個、兩個或兩個以上、三個以上等)選擇性密碼子引入所需基因中?;蚩砂ǘ鄠€指定選擇性密碼子拷貝,或可包括多個不同選擇性密碼子或其組合。

      在一個實施例中,所述方法涉及使用作為終止密碼子的選擇性密碼子以在脊椎動物細胞中于活體內(nèi)并入非天然氨基酸。舉例來說,產(chǎn)生識別終止密碼子(例如UAG)且通過O-RS利用所需非天然氨基酸氨?;腛-tRNA。天然存在的宿主氨?;?tRNA合成酶不識別所述O-tRNA??墒褂贸R?guī)定點誘變將終止密碼子(例如TAG)引入所關注多肽中的所關注位點處。例如參看Sayers,J.R.等人(1988),5',3'Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis.Nucleic Acids Res.791-802。當在活體內(nèi)將O-RS、O-tRNA和編碼所關注多肽的核酸組合時,響應UAG密碼子而并入非天然氨基酸從而得到在指定位置處含有所述非天然氨基酸的多肽。

      在活體內(nèi)并入非天然氨基酸可在不顯著干擾脊椎動物宿主細胞的情況下進行。舉例來說,由于UAG密碼子的抑制效率視O-tRNA(例如,琥珀抑制性tRNA)與脊椎動物釋放因子(例如,eRF)(其與終止密碼子結合并且起始正在生長的肽從核糖體釋放)之間的競爭而定,故所述抑制效率可例如通過增加O-tRNA(例如,抑制性tRNA)的表達水平來調(diào)節(jié)。

      選擇性密碼子還包含擴充的密碼子,例如四個或四個以上堿基的密碼子,諸如四堿基密碼子、五堿基密碼子、六堿基密碼子或更多個堿基的密碼子。四堿基密碼子的實例包括例如AGGA、CUAG、UAGA、CCCU等。五堿基密碼子的實例包括例如AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本發(fā)明的特征包括基于移碼抑制使用擴充的密碼子。四個或四個以上堿基的密碼子可將例如一個或多個非天然氨基酸插入同一蛋白質(zhì)中。舉例來說,在存在具有反密碼子環(huán)、例如具有8-10nt反密碼子環(huán)的突變O-tRNA(例如,特定移碼抑制性tRNA)的情況下,將四個或四個以上堿基的密碼子讀作單一氨基酸。在其它實施例中,反密碼子環(huán)可解碼例如至少四堿基密碼子、至少五堿基密碼子或至少六堿基密碼子或更多堿基的密碼子。由于存在256個可能的四堿基密碼子,故可在同一細胞中使用四個或四個以上堿基的密碼子編碼多個非天然氨基酸。參看Anderson等人,(2002)Exploring the Limits of Codon and Anticodon Size,Chemistry and Biology.9:237-244;Magliery,(2001)Expanding the Genetic Code:Selection of Efficient Suppressors of Four-base Codons and Identification of"Shifty"Four-base Codons with a Library Approach in Escherichia coli.J.Mol.Biol.307:755-769。

      舉例來說,已使用四堿基密碼子使用活體外生物合成方法將非天然氨基酸并入蛋白質(zhì)中。例如參看Ma等人,(1993)Biochemistry,32:7939;和Hohsaka等人,(1999)J.Am.Chem.Soc,121:34。使用CGGG和AGGU利用兩個以化學方式?;囊拼a抑制性tRNA在活體外將2-萘基丙氨酸和賴氨酸的NBD衍生物同時并入抗生蛋白鏈菌素中。例如參看Hohsaka等人,(1999)J.Am.Chem.Soc,121:12194。在活體內(nèi)研究中,Moore等人檢查具有NCUA反密碼子的tRNALeu衍生物抑制UAGN密碼子(N可為U、A、G或C)的能力,并且發(fā)現(xiàn)四聯(lián)體UAGA可以通過具有UCUA反密碼子的tRNALeu以13%到26%的效率解碼且在0或-1框內(nèi)極少解碼。參看Moore等人,(2000)J.Mol.Biol.,298:195。在一個實施例中,可將基于稀有密碼子或無義密碼子的擴充密碼子用于本發(fā)明中,其可減少錯義通讀和其它不合需要的位點處的移碼抑制。

      對于指定系統(tǒng)來說,選擇性密碼子也可包括一個天然三堿基密碼子,其中內(nèi)源系統(tǒng)不使用(或極少使用)天然堿基密碼子。舉例來說,這包括缺乏識別天然三堿基密碼子的tRNA的系統(tǒng)和/或三堿基密碼子為稀有密碼子的系統(tǒng)。

      選擇性密碼子任選包括非天然堿基對。這些非天然堿基對使現(xiàn)有的遺傳代碼進一步擴展。一種額外的堿基對使三聯(lián)體密碼子的數(shù)量從64增加到125。第三堿基對的特性包括穩(wěn)定且具選擇性的堿基配對、通過聚合酶以高保真度有效酶促并入DNA中以及合成新的非天然堿基對之后有效的持續(xù)引物延伸。可適于方法和組合物的非天然堿基對的描述包括例如Hirao等人,(2002)An unnatural base pair for incorporating amino acid analogues into protein,Nature Biotechnology.20:177-182。其它相關公開案列于下文中。

      對于活體內(nèi)使用來說,非天然核苷可滲透膜并且磷酸化形成相應的三磷酸鹽。此外,增加的遺傳信息穩(wěn)定并且不被細胞酶所破壞。Benner和其它人先前的工作利用不同于規(guī)范Watson-Crick配對的氫鍵模式,最值得關注的實例為iso-C:iso-G配對。例如參看Switzer等人,(1989)J.Am.Chem.Soc,111:8322;和Piccirilli等人,(1990)Nature,343:33;Kool,(2000)Curr.Opin.Chem.Biol,4:602。一般說來,這些堿基在某種程度上與天然堿基錯配并且無法酶促復制。Kool和同事證實,堿基之間的疏水堆積相互作用可替代氫鍵以驅(qū)動堿基對的形成。參看Kool,(2000)Curr.Opin.Chem.Biol,4:602;和Guckian及Kool,(1998)Angew.Chem.Int.Ed.Engl.,36,2825。在開發(fā)滿足所有上述需求的非天然堿基對的工作中,Schultz、Romesberg和同事已系統(tǒng)地合成一系列非天然疏水堿基并且對其進行研究。已發(fā)現(xiàn),PICS:PICS自身配對比天然堿基對穩(wěn)定,并且能夠通過大腸桿菌DNA聚合酶I的Klenow片段(KF)有效地并入DNA中。例如參看McMinn等人,(1999)J.Am.Chem.Soc,121:11586;以及Ogawa等人,(2000)J.Am.Chem.Soc,122:3274。3MN:3MN自身配對可通過KF以足以用于生物功能的效率和選擇性合成。例如參看Ogawa等人,(2000)J.Am.Chem.Soc.122:8803。然而,兩種堿基都充當用于進一步復制的鏈終止子。近來已開發(fā)出可用于復制PICS自身配對的突變體DNA聚合酶。此外,可復制7AI自身配對。例如參看Tae等人,(2001)J.Am.Chem.Soc,123:7439。也已開發(fā)出新穎的金屬堿基對Dipic:Py,其在結合Cu(II)后形成穩(wěn)定的配對。參看Meggers等人,(2000)J.Am.Chem.Soc,122:10714。由于擴充密碼子和非天然密碼子內(nèi)在地與天然密碼子正交,故本發(fā)明的方法可利用這一特性產(chǎn)生正交tRNA供其使用。

      也可使用翻譯旁路系統(tǒng)將非天然氨基酸并入所需多肽中。在翻譯旁路系統(tǒng)中,將較大序列插入基因中但并不被翻譯成蛋白質(zhì)。所述序列含有充當誘導核糖體越過所述序列并且在插入下游重新開始翻譯的線索的結構。

      非天然氨基酸

      如本文所使用,非天然氨基酸是指除硒代半胱氨酸和/或吡咯賴氨酸和以下20種基因編碼的α-氨基酸外的任何氨基酸、經(jīng)修飾氨基酸或氨基酸類似物:丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸、纈氨酸。通過式I說明α-氨基酸的一般結構:

      非天然氨基酸通常為具有式I的任何結構,其中R基團為除二十種天然氨基酸中所用基團外的任何取代基。有關二十種天然氨基酸的結構,例如參看L.Stryer的Biochemistry,第3版1988,Freeman and Company,New York。應注意,本發(fā)明的非天然氨基酸可為除上述二十種α-氨基酸外的天然存在的化合物。

      由于本發(fā)明的非天然氨基酸與天然氨基酸的不同之處通常僅在于側鏈,故非天然氨基酸以與其在天然存在的蛋白質(zhì)中形成酰胺鍵相同的方式與其它氨基酸(例如,天然或非天然)形成酰胺鍵。然而,非天然氨基酸具有使其與天然氨基酸相區(qū)別的側鏈基團。舉例來說,式I中的R任選包含烷基-、芳基-、?;?、酮基-、疊氮基-、羥基-、肼、氰基-、鹵基-、酰肼、烯基、炔基、醚、硫醇、硒基-、磺?;?、硼酸酯基(borate)、硼酸酯基(boronate)、磷酸基、膦酸基、膦、雜環(huán)、烯酮、亞胺、醛、酯、硫代酸、羥胺、胺等,或其任何組合。其它所關注非天然氨基酸包括(但不限于)包含可光活化交聯(lián)劑的氨基酸、自旋標記的氨基酸、發(fā)熒光氨基酸、結合金屬的氨基酸、含金屬的氨基酸、放射性氨基酸、具有新穎官能團的氨基酸、與其它分子共價或非共價相互作用的氨基酸、光籠蔽和/或光致異構化氨基酸、含有生物素或生物素類似物的氨基酸、含酮基氨基酸、包含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、可化學裂解和/或可光裂解的氨基酸、與天然氨基酸相比具有伸長側鏈(例如,聚醚或長鏈烴,例如大于約5個、大于約10個碳原子等)的氨基酸、含碳連接的糖的氨基酸、具有氧化還原活性的氨基酸、含有氨基硫代酸的氨基酸和包含一個或多個有毒部分的氨基酸。在一些實施例中,非天然氨基酸具有例如用于將蛋白質(zhì)與固體支撐物連接的可光活化交聯(lián)劑。在一個實施例中,非天然氨基酸具有連接到氨基酸側鏈的糖部分(例如,糖基化氨基酸)和/或其它碳水化合物修飾。

      除含有新穎側鏈的非天然氨基酸外,非天然氨基酸還任選包含經(jīng)修飾的主鏈結構,例如,如式II和III的結構所示:

      其中Z通常包含OH、NH2、SH、NH-R'或S-R';X和Y可相同或不同且通常包含S或O;且R和R'任選相同或不同且通常選自與上文關于具有式I的非天然氨基酸所述的R基的組分相同的列表以及氫。舉例來說,如式II和III所示,本發(fā)明的非天然氨基酸任選在氨基或羧基中包含取代。此類非天然氨基酸包括(但不限于)例如具有與常見二十種天然氨基酸相對應的側鏈或非天然側鏈的α-羥基酸、α-硫代酸、α-氨基硫代羧酸酯。此外,α-碳的取代任選包括L、D或α-α雙取代氨基酸,諸如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它結構替代物包括環(huán)狀氨基酸,諸如脯胺酸類似物以及3、4、6、7、8和9元環(huán)脯胺酸類似物;β和γ氨基酸,諸如經(jīng)取代β-丙氨酸和γ-氨基丁酸。舉例來說,許多非天然氨基酸都是建立在諸如酪氨酸、谷氨酸、苯丙氨酸等天然氨基酸的基礎上。酪氨酸類似物包括對位取代的酪氨酸、鄰位取代的酪氨酸和間位取代的酪氨酸,其中所述經(jīng)取代酪氨酸包含例如酮基(例如乙?;?、苯甲?;被?、肼、羥胺、硫醇基、羧基、異丙基、甲基、C6-C20直鏈或支鏈烴、飽和或不飽和烴、O-甲基、聚醚基、硝基、炔基等。此外,也涵蓋多取代的芳基環(huán)。本發(fā)明的谷氨酰胺類似物包括(但不限于)α-羥基衍生物、γ取代的衍生物、環(huán)狀衍生物和酰胺取代的谷氨酰胺衍生物。苯丙氨酸類似物的實例包括(但不限于)對位取代的苯丙氨酸、鄰位取代的苯丙氨酸和間位取代的苯丙氨酸,其中所述取代基包含例如羥基、甲氧基、甲基、烯丙基、醛、疊氮基、碘基、溴基、酮基(例如乙?;?、苯甲酰基、炔基等。非天然氨基酸的特定實例包括(但不限于)對乙?;?L-苯丙氨酸、對炔丙基氧基苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙?;?GlcNAcβ-絲氨酸、L-多巴、氟化苯丙氨酸、異丙基-L-苯丙氨酸、對疊氮基-L-苯丙氨酸、對酰基-L-苯丙氨酸、對苯甲?;?L-苯丙氨酸、L-磷酸絲氨酸、膦?;z氨酸、膦酰基酪氨酸、對碘-苯丙氨酸、對溴苯丙氨酸、對氨基-L-苯丙氨酸和異丙基-L-苯丙氨酸等。多種非天然氨基酸的其它結構提供于例如題為“In vivo incorporation of unnatural amino acids.”的WO 2002/085923的圖16、17、18、19、26和29中。關于其它甲硫氨酸類似物,還參看Kiick等人,(2002)Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligtation,PNAS 99:19-24的圖1結構2-5。

      在一個實施例中,提供包括非天然氨基酸(諸如對-(炔丙基氧基)-苯丙氨酸)的組合物。還提供包含對-(炔丙基氧基)-苯丙氨酸和例如蛋白質(zhì)和/或細胞的各種組合物。一方面,包括對-(炔丙基氧基)-苯丙氨酸非天然氨基酸的組合物進一步包括正交tRNA??蓪⒎翘烊话被崤c正交tRNA鍵接(例如共價),例如通過氨酰基鍵與正交tRNA共價鍵接、與正交tRNA的末端核糖的3'OH或2'OH共價鍵接。

      可通過非天然氨基酸并入蛋白質(zhì)中的化學部分為蛋白質(zhì)提供多種益處和操縱。舉例來說,酮基官能團的獨特反應性允許在活體外和活體內(nèi)利用多種含肼或羥胺試劑中任一種選擇性修飾蛋白質(zhì)。舉例來說,重原子非天然氨基酸例如可用于定相x射線結構數(shù)據(jù)。使用非天然氨基酸位點特異性地引入重原子還為選擇重原子的位置提供選擇性和靈活性。光反應性非天然氨基酸(例如,具有二苯甲酮和疊氮芳基(例如疊氮苯)側鏈的氨基酸)例如允許在活體內(nèi)和活體外有效地光交聯(lián)蛋白質(zhì)。光反應性非天然氨基酸的實例包括(但不限于)例如對疊氮基-苯丙氨酸和對苯甲酰基-苯丙氨酸。隨后可通過激發(fā)光反應性基團-提供時間(和/或空間)控制使具有光反應性非天然氨基酸的蛋白質(zhì)隨意交聯(lián)。在一個實例中,非天然氨基酸的甲基可經(jīng)作為局部結構和動力學探針(例如,使用核磁共振和振動光譜)的同位素標記的(例如)甲基取代。舉例來說,炔基或疊氮基官能團允許利用分子通過[3+2]環(huán)加成反應選擇性修飾蛋白質(zhì)。

      非天然氨基酸的化學合成

      上文所提供的許多非天然氨基酸都是購自例如Sigma(USA))或Aldrich(Milwaukee,WI,USA)。非市售的非天然氨基酸是任選如本文所提供或如各種公開案中所提供或使用所屬領域技術人員已知的標準方法來合成。有關有機合成技術,例如參看Fessendon和Fessendon的Organic Chemistry,(1982,第2版,Willard Grant Press,Boston Mass.);March的Advanced Organic Chemistry(第3版,1985,Wiley and Sons,New York);以及Carey和Sundberg的Advanced Organic Chemistry(第3版,第A和B部分,1990,Plenum Press,New York)。描述非天然氨基酸的合成的其它公開案例如包括:題為“In vivo incorporation of Unnatural Amino Acids”的WO 2002/085923,Matsoukas等人,(1995)J.Med.Chem.,38-4669;King,F.E.&Kidd,D.A.A.(1949)A New Synthesis of Glutamine and of γ-Dipeptides of Glutamic Acid from Phthylated Intermediates.J.Chem.Soc.3315-3319;Friedman,O.M.&Chatterrji,R.(1959)Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents.J.Am.Chem.Soc.81,3750-3752;Craig,J.C.等人(1988)Absolute Configuration of the Enantiomers of 7-Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine).J.Org.Chem.53,1167-1170;Azoulay,M.,Vilmont,M.&Frappier,F.(1991)Glutamine analogues as Potential Antimalarials,Eur.J.Med.Chem.26-5;Koskinen,A.M.P.&Rapoport,H.(1989)Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues.J.Org.Chem.54,1859-1866;Christie,B.D.&Rapoport,H.(1985)Synthesis of Optically Pure Pipecolates from L-Asparagine.Application to the Total Synthesis of(+)-Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization.J.Org.Chem.1989:1859-1866;Barton等人,(1987)Synthesis of Novelα-Amino-Acids and Derivatives Using Radical Chemistry:Synthesis of L-and D-α-Amino-Adipic Acids,L-α-aminopimelic Acid and Appropriate Unsaturated Derivatives.Tetrahedron 43:4297-4308;和Subasinghe等人,(1992)Quisqualic acid analogues:synthesis of bela-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site.J.Med.Chem.35:4602-7。

      非天然氨基酸的細胞攝取

      脊椎動物細胞對非天然氨基酸的攝取是在設計和選擇例如并入蛋白質(zhì)中的非天然氨基酸時通??紤]的一個問題。舉例來說,α-氨基酸的高電荷密度表明這些化合物可能無法滲透細胞。天然氨基酸是經(jīng)由一系列基于蛋白質(zhì)的轉(zhuǎn)運系統(tǒng)而吸收到脊椎動物細胞中??蛇M行快速篩選以評定哪些非天然氨基酸(如果存在)被細胞吸收。例如參看,例如2002年12月22日申請的題為“Protein Arrays”的代理人案號為P1001US00的申請案以及Liu,D.R.&Schultz,P.G.(1999)Progress toward the evolution of an organism with an expanded genetic code.PNAS United States 96:4780-4785中的毒性分析法。盡管易于利用各種分析法分析攝取,但設計適用于細胞攝取路徑的非天然氨基酸的替代方法是提供生物合成路徑以在活體內(nèi)產(chǎn)生氨基酸。

      非天然氨基酸的生物合成

      許多生物合成路徑已經(jīng)存在于細胞中以產(chǎn)生氨基酸和其它化合物。特定非天然氨基酸的生物合成方法可能不存在于自然界(例如,脊椎動物細胞)中,而本發(fā)明提供所述方法。舉例來說,任選在宿主細胞中通過添加新穎酶或改變現(xiàn)存的宿主細胞路徑來產(chǎn)生非天然氨基酸的生物合成路徑。其它新穎酶任選為天然存在的酶或人工開發(fā)的酶。舉例來說,對氨基苯丙氨酸的生物合成(如題為“In vivo incorporation of unnatural amino acids”的WO 2002/085923中的實例所提供)依賴于添加來自其它生物體的已知酶的組合??赏ㄟ^用包含這些酶的基因的質(zhì)粒轉(zhuǎn)化細胞來將所述基因引入脊椎動物細胞中。當在細胞中表達時,這些基因提供合成所需化合物的酶促路徑。任選添加的酶類型的實例提供于下文實例中。其它酶序列可見于例如Genbank中。也任選以相同方式將人工開發(fā)的酶添加到細胞中。以此方式,操縱細胞機器和細胞資源以產(chǎn)生非天然氨基酸。

      多種方法可用于產(chǎn)生用于生物合成路徑或發(fā)展現(xiàn)存路徑中的新穎酶。舉例來說,任選將(例如)如Maxygen,Inc.所開發(fā)的遞歸重組(recursive recombination)(可在萬維網(wǎng)www.maxygen.com上獲得)用于開發(fā)新穎酶和路徑。例如參看Stemmer(1994),Rapid evolution of a protein in vitro by DNA shuffling,Nature 370(4):389-391;和Stemmer,(1994),DNA shuffling by random fragmentation and reassembly:In vitro recombination for molecular evolution,Proc.Natl.Acad.Sci.USA..91:10747-10751。類似地,任選將Genencor所開發(fā)的DesignPathTM(可在萬維網(wǎng)genencor.com上獲得)用于代謝路徑工程改造,例如工程改造某一路徑以在細胞中產(chǎn)生O-甲基-L-酪氨酸。這項技術使用例如通過功能性基因組學以及分子進化和設計所鑒別出的新基因的組合在宿主生物體中重建現(xiàn)存路徑。Diversa公司(可在萬維網(wǎng)diversa.com上獲得)也提供迅速篩選基因文庫和基因路徑(例如建立新路徑)的技術。

      通常以足以有效進行蛋白質(zhì)生物合成但未達到影響其它氨基酸的濃度或耗盡細胞資源的程度的濃度(例如天然細胞量)來產(chǎn)生利用本發(fā)明的經(jīng)工程改造的生物合成路徑所產(chǎn)生的非天然氨基酸。在活體內(nèi)以此方式所產(chǎn)生的典型濃度為約10mM到約0.05mM。在用包含用于產(chǎn)生特定路徑所需的酶的基因的質(zhì)粒轉(zhuǎn)化細胞并且產(chǎn)生非天然氨基酸后,任選使用活體內(nèi)選擇以針對核糖體蛋白質(zhì)合成和細胞生長進一步優(yōu)化非天然氨基酸的產(chǎn)生。

      具有非天然氨基酸的多肽

      具有至少一個非天然氨基酸的所關注蛋白質(zhì)或多肽為本發(fā)明的特征。本發(fā)明還包括使用本發(fā)明的組合物和方法產(chǎn)生的具有至少一個非天然氨基酸的多肽或蛋白質(zhì)。賦形劑(例如,醫(yī)藥學上可接受的賦形劑)也可與蛋白質(zhì)一起存在。

      通過在脊椎動物細胞中產(chǎn)生具有至少一個非天然氨基酸的所關注蛋白質(zhì)或多肽,蛋白質(zhì)或多肽通常將包括脊椎動物翻譯后修飾。在某些實施例中,蛋白質(zhì)包括至少一個非天然氨基酸和至少一個由脊椎動物細胞于活體內(nèi)所產(chǎn)生的翻譯后修飾,其中所述翻譯后修飾不是由原核細胞產(chǎn)生。舉例來說,翻譯后修飾包括例如乙?;Ⅴ;⒅|(zhì)修飾、棕櫚?;⒆貦八猁}加成、磷酸化、糖酯連接修飾、糖基化等。一方面,翻譯后修飾包括通過GlcNAc-天冬酰胺鍵聯(lián)將寡糖(例如(GlcNAc-Man)2-Man-GlcNAc-GlcNAc))與天冬酰胺連接在一起。參看表7,其列出脊椎動物蛋白質(zhì)的N連接寡糖的一些實例(也可存在其它未展示的殘基)。另一方面,翻譯后修飾包括通過GalNAc-絲氨酸或GalNAc-蘇氨酸鍵聯(lián)或者GlcNAc-絲氨酸或GlcNAc-蘇氨酸鍵聯(lián)將寡糖(例如Gal-GalNAc、Gal-GlcNAc等)與絲氨酸或蘇氨酸連接在一起。

      表7:通過GlcNAc鍵聯(lián)連接的寡糖的實例

      另一方面,翻譯后修飾包括前體(例如,降鈣素前體、降鈣素基因相關肽前體、前甲狀旁腺激素原、前胰島素原、前胰島素、前阿黑皮素原(prepro-opiomelanocortin)、阿黑皮素原等)的蛋白水解處理;組裝成多亞單元蛋白質(zhì)或大分子組裝物;翻譯到細胞中另一位點處(例如,細胞器,諸如內(nèi)質(zhì)網(wǎng)、高爾基體(golgi apparatus)、細胞核、溶酶體、過氧化物酶體、線粒體、葉綠體、液泡等,或通過分泌途徑)。在某些實施例中,蛋白質(zhì)包含分泌或定位序列、抗原決定基標簽、FLAG標簽、聚組氨酸標簽、GST融合體等。

      非天然氨基酸的一個優(yōu)勢在于,其提供可用于添加額外分子的額外化學部分。這些修飾可在脊椎動物細胞中于活體內(nèi)進行或在活體外進行。因此,在某些實施例中,翻譯后修飾是通過非天然氨基酸進行。舉例來說,翻譯后修飾可通過親核-親電反應進行。當前用于選擇性修飾蛋白質(zhì)的大部分反應涉及親核與親電反應搭配物之間的共價鍵形成,例如α-鹵代酮與組氨酸或半胱氨酸側鏈的反應。在這些情況中,選擇性是由蛋白質(zhì)中親核殘基的數(shù)量和可接近性決定。在本發(fā)明的蛋白質(zhì)中,可在活體外或活體內(nèi)使用其它更具選擇性的反應,諸如非天然酮基氨基酸與酰肼或氨氧基化合物的反應。例如參看Cornish等人,(1996)J.Am.Chem.Soc.118:8150-8151;Mahal等人,(1997)Science.276:1125-1128;Wang等人,(2001)Science 292:498-500;Chin等人,(2002)Am.Chem.Soc.124:9026-9027;Chin等人,(2002)Proc.Natl.Acad.Sci.,99:11020-11024;Wang等人,(2003)Proc.Natl.Acad.Sci 100:56-61;Zhang等人,(2003)Biochemistry.42:6735-6746;和Chin等人,(2003)Science.,出版中。這使得能夠用包括熒光團、交聯(lián)劑、糖衍生物和細胞毒性分子在內(nèi)的多種試劑選擇性標記幾乎任何蛋白質(zhì)。還參看2003年10月15日申請的題為“Glycoprotein synthesis”的專利申請案USSN 10/686,944。翻譯后修飾(例如通過疊氮基氨基酸)也可通過施陶丁格接合(Staudinger ligation)(例如,用三芳基膦試劑)進行。例如參看Kiick等人,(2002)Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligtation,PNAS 99:19-24。

      本發(fā)明提供另一種選擇性修飾蛋白質(zhì)的極為有效的方法,其涉及響應選擇性密碼子將例如含有疊氮基或炔基部分的非天然氨基酸遺傳并入蛋白質(zhì)中。隨后可通過例如胡伊斯根(Huisgen)[3+2]環(huán)加成反應(例如參看Padwa,A.Comprehensive Organic Synthesis,第4卷.(1991)Trost,B.M.編,Pergamon,Oxford,第1069-1109頁;和Huisgen,R.1,3-Dipolar Cycloaddition Chemistry,(1984)Padwa,A.編,Wiley,New York,第1-176頁)分別用例如炔基或疊氮化物衍生物來修飾這些氨基酸側鏈。例如參看圖16。由于這種方法涉及環(huán)加成而非親核取代反應,故可以極高的選擇性修飾蛋白質(zhì)??稍谑覝叵掠谒詶l件中通過將催化量的Cu(I)鹽添加到反應混合物中以優(yōu)良的區(qū)位選擇性(1,4>1,5)進行所述反應。例如參看Tornoe等人,(2002)J.Org.Chem.67:3057-3064;和Rostovtsev,等人,(2002)Angew.Chem.Int.Ed.41:2596-2599。可使用的另一方法是在雙砷化合物上配體交換四半胱氨酸基元,例如參看Griffin等人,(1998)Science 281:269-272。

      可通過非天然編碼的氨基酸的官能團添加到本發(fā)明的蛋白質(zhì)中的分子包括實質(zhì)上任何具有互補官能團的分子。所述分子包括(但不限于)染料、熒光團、交聯(lián)劑、糖衍生物、聚合物(例如,聚乙二醇衍生物)、光交聯(lián)劑、細胞毒性化合物、親和標記、生物素衍生物、樹脂、珠粒、第二蛋白質(zhì)或多肽(或更多)、多聚核苷酸(例如,DNA、RNA等)、金屬螯合劑、輔因子、脂肪酸、碳水化合物等。另一方面,本發(fā)明提供包括所述分子的組合物以及產(chǎn)生這些分子(例如,聚乙二醇)的方法,其中n為介于例如50與10,000之間、75與5,000之間、100與2,000之間、100與1,000之間等的整數(shù)。在本發(fā)明的實施例中,聚乙二醇具有例如約5,000到約100,000Da、約20,000到約30,000Da、約40,000或約50,000Da、約20,000Da到約10,000Da等的分子量。

      還提供包含這些化合物,例如具有蛋白質(zhì)和細胞的各種組合物。在本發(fā)明一方面中,包含疊氮基染料(例如,具有化學結構4或化學結構6)的蛋白質(zhì)進一步包括至少一個非天然氨基酸(例如,炔基氨基酸),其中所述疊氮基染料通過[3+2]環(huán)加成連接到所述非天然氨基酸。

      本發(fā)明的脊椎動物細胞提供合成包含大量有用非天然氨基酸的蛋白質(zhì)的能力。一方面,組合物任選包括例如至少10微克、至少50微克、至少75微克、至少100微克、至少200微克、至少250微克、至少500微克、至少1毫克、至少10毫克或更多包含非天然氨基酸的蛋白質(zhì),或可利用活體內(nèi)蛋白質(zhì)產(chǎn)生方法所實現(xiàn)的量(關于重組蛋白產(chǎn)生和純化的細節(jié)提供于本文中)。另一方面,蛋白質(zhì)任選以在例如細胞溶解產(chǎn)物、緩沖液、醫(yī)藥緩沖液或其它液體懸浮液(例如,在從約1nl到約100L間任何數(shù)量的體積中)中為例如每升至少10微克蛋白質(zhì)、每升至少50微克蛋白質(zhì)、每升至少75微克蛋白質(zhì)、每升至少100微克蛋白質(zhì)、每升至少200微克蛋白質(zhì)、每升至少250微克蛋白質(zhì)、每升至少500微克蛋白質(zhì)、每升至少1毫克蛋白質(zhì)或每升至少10毫克蛋白質(zhì)或更高的濃度存在于組合物中。在包括至少一個非天然氨基酸的脊椎動物細胞中產(chǎn)生大量(例如,大于通常用其它方法、例如活體外翻譯可能獲得的量)蛋白質(zhì)為本發(fā)明的特征。

      可進行非天然氨基酸的并入,例如以調(diào)整蛋白質(zhì)結構和/功能的改變,例如改變尺寸、酸度、親核性、氫鍵、疏水性、蛋白酶靶位點可接取性、靶向部分(例如,對于蛋白質(zhì)陣列)等。包括非天然氨基酸的蛋白質(zhì)可具有增強或者甚至全新的催化或物理特性。舉例來說,任選通過將非天然氨基酸包涵入蛋白質(zhì)中來改變以下特性:毒性、生物分布、結構特性、光譜特性、化學和/或光化學特性、催化能力、半衰期(例如,血清半衰期)、與其它分子反應(例如共價或非共價)的能力等。包括包含至少一個非天然氨基酸的蛋白質(zhì)的組合物可用于例如新穎治療劑、診斷劑、催化酶、工業(yè)酶、結合蛋白(例如,抗體)以及例如蛋白質(zhì)結構和功能研究。例如參看Dougherty,(2000)Unnatural Amino Acids as Probes of Protein Structure and Function,Current Opinion in Chemical Biology.4:645-652。

      在本發(fā)明一方面中,組合物包括至少一種具有至少一個、例如至少兩個、至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個或至少十個或更多非天然氨基酸的蛋白質(zhì)。非天然氨基酸可相同或不同,例如可在蛋白質(zhì)中1、2、3、4、5、6、7、8、9、10個或更多不同位點包含1、2、3、4、5、6、7、8、9、10個或更多不同非天然氨基酸。另一方面,組合物包括蛋白質(zhì)中存在的至少一個(但少于全部)特定氨基酸經(jīng)非天然氨基酸取代的蛋白質(zhì)。對于具有一個以上非天然氨基酸的指定蛋白質(zhì),非天然氨基酸可相同或不同(例如,所述蛋白質(zhì)可包括兩種或兩種以上不同類型的非天然氨基酸,或可包括相同非天然氨基酸中的兩個)。對于具有兩個以上非天然氨基酸的指定蛋白質(zhì),非天然氨基酸可相同、不同或為多個相同種類的非天然氨基酸與至少一個不同非天然氨基酸的組合。

      基本上任何包括非天然氨基酸的蛋白質(zhì)(或其部分)(以及任何相應編碼核酸,例如其包括一個或多個選擇性密碼子)都可使用本文中的組合物和方法產(chǎn)生。未進行嘗試來鑒別成千上萬種已知蛋白質(zhì),所述蛋白質(zhì)中任一種可例如通過調(diào)整任何可用突變方法以在相關翻譯系統(tǒng)中包括一個或多個適當選擇性密碼子來修飾,從而包括一個或多個非天然氨基酸。已知蛋白質(zhì)的常見序列譜系包括GenBank EMBL、DDBJ和NCBI。可易于通過搜索互聯(lián)網(wǎng)鑒別其它譜系。

      通常,蛋白質(zhì)與任何可用蛋白質(zhì)(例如,治療性蛋白質(zhì)、診斷性蛋白質(zhì)、工業(yè)酶或其部分等)例如至少60%、至少70%、至少75%、至少80%、至少90%、至少95%或至少99%或更高一致,且其包含一個或多個非天然氨基酸。可經(jīng)修飾以包含一個或多個非天然氨基酸的治療性、診斷性和其它蛋白質(zhì)的實例包括(但不限于)例如α-1抗胰蛋白酶、血管抑素、抗溶血因子、抗體(關于抗體的其它細節(jié)見下文)、載脂蛋白、脫輔基蛋白、心房利鈉因子、心房利鈉多肽、心房肽、C-X-C趨化因子(例如,T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG)、降鈣素、CC趨化因子(例如,單核細胞趨化蛋白-1、單核細胞趨化蛋白-2、單核細胞趨化蛋白-3、單核細胞炎癥蛋白-1α、單核細胞炎癥蛋白-1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配體、C-kit配體、膠原蛋白、群落刺激因子(CSF)、補體因子5a、補體抑制劑、補體受體1、細胞因子(例如,上皮中性粒細胞活化肽-78、GROα/MGSA、GROβ、GROγ、MlP-1α、MIP-1δ、MCP-1)、表皮生長因子(EGF)、促紅細胞生成素(“EPO”,代表通過并入一個或多個非天然氨基酸修飾的優(yōu)選靶)、脫落毒素A和B、因子IX、因子VII、因子VIII、因子X、成纖維細胞生長因子(FGF)、纖維蛋白原、纖維粘連蛋白、G-CSF、GM-CSF、葡糖腦苷脂酶、促性腺激素、生長因子、刺猬蛋白(例如,音速(Sonic)、印度(Indian)、沙漠(Desert))、血紅蛋白、肝細胞生長因子(HGF)、水蛭素、人血清白蛋白、胰島素、類胰島素生長因子(IGF)、干擾素(例如,IFN-α、IFN-β、IFN-γ)、白細胞介素(例如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12等)、角質(zhì)細胞生長因子(KGF)、乳鐵蛋白、白血病抑制因子、熒光素酶、神經(jīng)營養(yǎng)因子、中性粒細胞抑制因子(NIF)、抑瘤素M、成骨蛋白、甲狀旁腺激素、PD-ECSF、PDGF、肽激素(例如,人生長激素)、多效生長因子、蛋白質(zhì)A、蛋白質(zhì)G、致熱性外毒素A、B和C、松馳素、腎素、SCF、可溶性補體受體I、可溶性I-CAM 1、可溶性白細胞介素受體(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受體、生長調(diào)節(jié)素、生長抑素、生長激素、鏈激酶、超抗原(即葡萄球菌腸毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE))、超氧化物歧化酶(SOD)、中毒性休克綜合癥毒素(TSST-1)、胸腺肽α1、組織型纖溶酶原活化劑、腫瘤壞死因子β(TNFβ)、腫瘤壞死因子受體(TNFR)、腫瘤壞死因子α(TNFα)、血管內(nèi)皮生長因子(VEGEF)、尿激酶等。

      可使用本文所述的用于活體內(nèi)并入非天然氨基酸的組合物和方法產(chǎn)生的一類蛋白質(zhì)包括轉(zhuǎn)錄調(diào)節(jié)蛋白或其部分。轉(zhuǎn)錄調(diào)節(jié)蛋白的實例包括調(diào)節(jié)細胞生長、分化、調(diào)控等的基因和轉(zhuǎn)錄調(diào)節(jié)蛋白。轉(zhuǎn)錄調(diào)節(jié)蛋白可在原核生物、病毒和真核生物(包括真菌、植物、酵母、昆蟲,和動物,包括哺乳動物)中發(fā)現(xiàn),從而提供多種治療靶。應了解,表達和轉(zhuǎn)錄活化因子通過許多機制,例如通過結合受體、刺激信號轉(zhuǎn)導級聯(lián)、調(diào)控轉(zhuǎn)錄因子表達、結合啟動子和增強子、與結合啟動子和增強子的蛋白質(zhì)結合、解開DNA、剪接前體mRNA、使RNA多聚腺苷酸化和降解RNA,來調(diào)控轉(zhuǎn)錄。舉例來說,脊椎動物細胞中的GAL4蛋白或其部分的組合物也為本發(fā)明的特征。通常,GAL4蛋白或其部分包含至少一個非天然氨基酸。也參看本文中題為“正交氨?;?tRNA合成酶”的章節(jié)。

      本發(fā)明的一類蛋白質(zhì)(例如,具有一個或多個非天然氨基酸的蛋白質(zhì))包括表達活化因子,諸如細胞因子、炎癥分子、生長因子、其受體和癌基因產(chǎn)物,例如白細胞介素(例如,IL-1、IL-2、IL-8等)、干擾素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-α、TGF-β、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1和透明質(zhì)酸/CD44;信號轉(zhuǎn)導分子和相應癌基因產(chǎn)物,例如,Mos、Ras、Raf和Met;和轉(zhuǎn)錄活化因子和抑制因子,例如p53、Tat、Fos、Myc、Jun、Myb、Rel,和類固醇激素受體,諸如雌激素、孕酮、睪酮、醛固酮、LDL受體配體和皮質(zhì)酮的受體。

      本發(fā)明還提供具有至少一個非天然氨基酸的酶(例如,工業(yè)酶)或其部分。酶的實例包括(但不限于)例如酰胺酶、氨基酸消旋酶、酰化酶、脫鹵酶、雙加氧酶、二芳基丙烷過氧化物酶、表異構酶、環(huán)氧化物水解酶、酯酶、異構酶、激酶、葡萄糖異構酶、糖苷酶、糖基轉(zhuǎn)移酶、鹵素過氧化物酶、單加氧酶(例如,p450)、脂肪酶、木素過氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酶、枯草桿菌蛋白酶、轉(zhuǎn)氨酶和核酸酶。

      這些蛋白質(zhì)中有許多在市面上有售(例如參看,Sigma BioSciences 2002目錄和報價單),且相應蛋白質(zhì)序列和基因以及其許多常見變異體眾所周知(例如參看Genbank)??赏ㄟ^插入根據(jù)本發(fā)明的一個或多個非天然氨基酸來修飾其中任一種,從而例如改變蛋白質(zhì)的所關注的一種或多種治療、診斷或酶特性。治療相關特性的實例包括血清半衰期、保存半衰期、穩(wěn)定性、免疫原性、治療活性、可檢測性(例如,通過在非天然氨基酸中包涵報告子基團(例如,標記或標記結合位點))、LD50或其它副作用的減少、通過腸道進入身體的能力(例如,口服生物可用性)等。診斷特性的實例包括保存半衰期、穩(wěn)定性、診斷活性、可檢測性等。相關酶特性的實例包括保存半衰期、穩(wěn)定性、酶活性、生產(chǎn)量等。

      還可對多種其它蛋白質(zhì)加以修飾以包括本發(fā)明的一個或多個非天然氨基酸。舉例來說,本發(fā)明可包括利用例如以下來源的蛋白質(zhì)中的非天然氨基酸取代一種或多種蛋白疫苗中的一個或多個天然氨基酸:感染性真菌,例如曲霉屬(Aspergillus)、念珠菌屬(Candida);充當病原菌模型的細菌、尤其大腸桿菌,以及醫(yī)學上重要的細菌,諸如葡萄球菌屬(Staphylococci)(例如,金黃葡萄球菌(aureus))或鏈球菌屬(Streptococci)(例如,肺炎鏈球菌(pneumoniae));原生生物,諸如孢子蟲類(sporozoa)(例如,瘧原蟲(Plasmodia))、根足蟲(rhizopod)(例如,內(nèi)阿米巴屬(Entamoeba))和鞭毛蟲(flagellate)(錐蟲(Trypanosoma)、利什曼蟲(Leishmania)、毛滴蟲(Trichomonas)、賈第蟲(Giardia)等);病毒,諸如(+)RNA病毒(實例包括痘病毒,例如牛痘(vaccinia);細小核糖核酸病毒,例如,脊髓灰質(zhì)炎病毒(polio);外衣病毒,例如風疹病毒(rubella);黃病毒,例如HCV;和冠狀病毒)、(-)RNA病毒(例如,棒狀病毒,例如VSV;副粘病毒,例如RSV;流感粘病毒,例如流感病毒;本雅病毒(Bunyavirus);和腺病毒)、dsDNA病毒(例如,呼腸孤病毒(Reovirus)、RNA變?yōu)镈NA的病毒(即逆轉(zhuǎn)錄病毒,例如HIV和HTLV)和某些DNA變?yōu)镽NA的病毒(諸如乙型肝炎病毒)。

      農(nóng)業(yè)相關的蛋白也為非天然氨基酸修飾的適當靶,諸如昆蟲抗性蛋白(例如,Cry蛋白)、淀粉和脂質(zhì)產(chǎn)生酶、植物和昆蟲毒素、毒素抗性蛋白、霉菌毒素脫毒蛋白、植物生長酶(例如,1,5-二磷酸核酮糖羧化酶/加氧酶,“RUBISCO”)、脂氧合酶(LOX)和烯醇丙酮酸磷酸(PEP)羧化酶。

      本發(fā)明還提供用于在脊椎動物細胞中產(chǎn)生至少一種包含至少一個非天然氨基酸的蛋白質(zhì)的方法(以及由所述方法產(chǎn)生的蛋白質(zhì))。舉例來說,方法包括:使包含包括至少一個選擇性密碼子且編碼蛋白質(zhì)的核酸的脊椎動物細胞在適當培養(yǎng)基中生長。脊椎動物細胞還包含:正交tRNA(O-tRNA),其在細胞中起作用并且識別選擇性密碼子;和正交氨?;?tRNA合成酶(O-RS),其優(yōu)先利用非天然氨基酸將O-tRNA氨酰化;并且所述培養(yǎng)基包含非天然氨基酸。

      在一個實施例中,所述方法另外包括將非天然氨基酸并入蛋白質(zhì)中,其中所述非天然氨基酸包含第一反應性基團;和使所述蛋白質(zhì)與包含第二反應性基團的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交聯(lián)劑、細胞毒性化合物、親和標記、生物素衍生物、樹脂、第二蛋白質(zhì)或多肽、金屬螯合劑、輔因子、脂肪酸、碳水化合物、多聚核苷酸(例如,DNA、RNA等)等)接觸。第一反應性基團與第二反應性基團反應以通過[3+2]環(huán)加成將所述分子與非天然氨基酸連接。在一個實施例中,第一反應性基團為炔基或疊氮基部分且第二反應性基團為疊氮基或炔基部分。舉例來說,第一反應性基團為炔基部分(例如,在非天然氨基酸對炔丙基氧基苯丙氨酸中)且第二反應性基團為疊氮基部分。在另一實例中,第一反應性基團為疊氮基部分(例如,在非天然氨基酸對疊氮基-L-苯丙氨酸中)且第二反應性基團為炔基部分。

      在一個實施例中,O-RS利用非天然氨基酸以與具有(例如)如SEQ ID NO.:86或45中所述的氨基酸序列的O-RS至少50%一樣的效率將O-tRNA氨酰化。在另一實施例中,O-tRNA包含SEQ ID NO.:65或64或者其互補多聚核苷酸序列;由SEQ ID NO.:64或65或者其互補多聚核苷酸序列加工;或由SEQ ID NO.:64或65或者其互補多聚核苷酸序列編碼。在另一實施例中,O-RS包含SEQ ID NO.:36-63和/或86中任一序列所述的氨基酸。

      所編碼的蛋白質(zhì)可包含例如治療性蛋白質(zhì)、診斷性蛋白質(zhì)、工業(yè)酶或其部分。由所述方法產(chǎn)生的蛋白質(zhì)任選進一步經(jīng)非天然氨基酸修飾。舉例來說,任選通過至少一種活體內(nèi)翻譯后修飾來修飾由所述方法產(chǎn)生的蛋白質(zhì)。

      還提供產(chǎn)生篩選或選擇轉(zhuǎn)錄調(diào)節(jié)蛋白的方法(以及由所述方法產(chǎn)生的篩選或選擇轉(zhuǎn)錄調(diào)節(jié)蛋白)。舉例來說,方法包括:選擇第一多聚核苷酸序列,其中所述多聚核苷酸序列編碼核酸結合結構域;和使所述第一多聚核苷酸序列突變以包括至少一個選擇性密碼子。這將提供篩選或選擇多聚核苷酸序列。所述方法還包括:選擇第二多聚核苷酸序列,其中所述第二多聚核苷酸序列編碼轉(zhuǎn)錄活化結構域;提供包含可操作性連接到第二多聚核苷酸序列的篩選或選擇多聚核苷酸序列的構建體;和將所述構建體、非天然氨基酸、正交tRNA合成酶(O-RS)和正交tRNA(O-tRNA)引入細胞中。利用這些組件,O-RS優(yōu)先利用非天然氨基酸將O-tRNA氨酰化,且O-tRNA識別選擇性密碼子,并響應篩選或選擇多聚核苷酸序列中的選擇性密碼子將非天然氨基酸并入核酸結合結構域中,從而提供篩選或選擇轉(zhuǎn)錄調(diào)節(jié)蛋白。

      在某些實施例中,本發(fā)明的方法和/或組合物中的所關注蛋白質(zhì)或多肽(或其部分)是由核酸編碼。通常,核酸包含至少一個選擇密碼子、至少兩個選擇密碼子、至少三個選擇密碼子、至少四個選擇密碼子、至少五個選擇密碼子、至少六個選擇密碼子、至少七個選擇密碼子、至少八個選擇密碼子、至少九個選擇密碼子、十個或十個以上選擇密碼子。

      可使用所屬領域技術人員眾所周知且在本文中在“誘變和其它分子生物學技術”下描述的方法誘變編碼所關注蛋白質(zhì)或多肽的基因以包括例如一個或多個選擇性密碼子以便并入非天然氨基酸。舉例來說,使所關注蛋白質(zhì)的核酸誘變以包括一個或多個選擇性密碼子,從而插入一個或多個非天然氨基酸。本發(fā)明包括例如包括至少一個非天然氨基酸的任何蛋白質(zhì)的任何此種變異體(例如,突變體)型式。類似地,本發(fā)明還包括相應核酸,即,具有一個或多個編碼一個或多個非天然氨基酸的選擇性密碼子的任何核酸。

      純化包含非天然氨基酸的重組蛋白

      根據(jù)所屬領域技術人員已知且使用的標準程序,可將本發(fā)明的蛋白質(zhì)(例如包含非天然氨基酸的蛋白質(zhì)、針對包含非天然氨基酸的蛋白質(zhì)的抗體等)部分或?qū)嵸|(zhì)上純化成均質(zhì)。因此,可通過所屬領域中眾所周知的眾多方法中的任一種來回收和純化本發(fā)明的多肽,這些方法包括例如硫酸銨或乙醇沉淀、酸或堿萃取、柱色譜、親和柱色譜、陰離子或陽離子交換色譜、磷酸纖維素色譜、疏水相互作用色譜、羥基磷灰石色譜、凝集素色譜、凝膠電泳等。必要時,在制備正確折疊的成熟蛋白質(zhì)時可使用蛋白質(zhì)再折疊步驟。可將高效液相色譜(HPLC)、親和色譜或其它適合方法用于需要高純度的最后純化步驟中。在一個實施例中,將針對非天然氨基酸(或包含非天然氨基酸的蛋白質(zhì))制成的抗體用作純化試劑,例如以基于親和力純化包含一個或多個非天然氨基酸的蛋白質(zhì)。必要時,在部分純化或純化達到均質(zhì)后,任選將多肽例如用作分析組分、治療劑或抗體產(chǎn)生的免疫原。

      除了本文中指出的其它參考文獻之外,所屬領域中眾所周知多種純化/蛋白質(zhì)折疊方法,包括例如以下文獻中描述的那些:R.Scopes,Protein Purification,Springer-Verlag,N.Y.(1982);Deutscher,Methods in Enzymology第182卷:Guide to Protein Purification.Academic Press,Inc.N.Y.(1990);Sandana,(1997)Bioseparation of Proteins.Academic Press,Inc.;Bollag等人(1996)Protein Methods,第2版Wiley-Liss,NY;Walker,(1996)The Protein Protocols Handbook Humana Press,NJ,Harris和Angal,(1990)Protein Purification Applications:A Practical Approach IRL Press at Oxford,Oxford,England;Harris和Angal,Protein Purification Methods:A Practical Approach IRL Press at Oxford,Oxford,England;Scopes,(1993)Protein Purification:Principles and Practice第3版Springer Verlag,NY;Janson和Ryden,(1998)Protein Purification:Principles.High Resolution Methods and Applications,第2版Wiley-VCH,NY;和Walker(1998),Protein Protocols on CD-ROMHumana Press,NJ;以及其中所引用的參考文獻。

      在脊椎動物細胞中產(chǎn)生具有至少一個非天然氨基酸的所關注蛋白質(zhì)或多肽的一個優(yōu)點在于,通常所述蛋白質(zhì)或多肽將以其天然構象折疊。然而,在本發(fā)明某些實施例中,所屬領域技術人員將認識到,在合成、表達和/或純化之后,蛋白質(zhì)可具有與相關多肽的所需構象不同的構象。在本發(fā)明一個方面中,所表達的蛋白質(zhì)任選變性且隨后復性。這是例如通過將伴侶蛋白(chaperonin)添加到所關注蛋白質(zhì)或多肽中,和/或通過將蛋白質(zhì)溶解于諸如鹽酸胍等離液劑中來實現(xiàn)。

      一般來說,有時候需要變性和還原所表達的多肽且隨后使多肽再折疊成優(yōu)選構象。舉例來說,可將胍、尿素、DTT、DTE和/或伴侶蛋白添加到所關注翻譯產(chǎn)物中。所屬領域技術人員眾所周知還原、變性和復性蛋白質(zhì)的方法(參看上述參考文獻,以及Debinski等人,(1993)J.Biol.Chem.,268:14065-14070;Kreitman和Pastan(1993)Bioconjug.Chem.,4:581-585;和Buchner等人,(1992)Anal.Biochem.,205:263-270)。舉例來說,Debinski等人描述在胍-DTE中使包涵體蛋白質(zhì)變性和還原。所述蛋白質(zhì)可在含有例如氧化谷胱甘肽和L-精氨酸的氧化還原緩沖液中再折疊。再折疊試劑可流動或以其它方式移動以與一種或多種多肽或其它表達產(chǎn)物接觸,或者一種或多種多肽或其它表達產(chǎn)物可流動或以其它方式移動以與再折疊試劑接觸。

      抗體

      一方面,本發(fā)明提供針對本發(fā)明的分子,例如合成酶、tRNA和包含非天然氨基酸的蛋白質(zhì)的抗體。針對本發(fā)明的分子的抗體可用作純化試劑,例如以供純化本發(fā)明的分子。此外,可將所述抗體用作指示劑以指示合成酶、tRNA或包含非天然氨基酸的蛋白質(zhì)的存在,例如以便追蹤所述分子的存在或位置(例如,活體內(nèi)或原位)。

      本發(fā)明的抗體可為包含一個或多個實質(zhì)上或部分由免疫球蛋白基因或免疫球蛋白基因片段編碼的多肽的蛋白質(zhì)。認可的免疫球蛋白基因包括κ、λ、α、γ、δ、ε和μ恒定區(qū)基因,以及多種免疫球蛋白可變區(qū)基因。輕鏈分為κ或λ。重鏈分為γ、μ、α、δ或ε,其又分別定義免疫球蛋白種類IgG、IgM、IgA、IgD和IgE。典型免疫球蛋白(例如抗體)結構單元包含四聚體。各四聚體是由兩對相同的多肽鏈構成,各對具有一條“輕鏈”(約25kD)和一條“重鏈”(約50-70kD)。各鏈的N末端界定主要負責抗原識別的具有約100到110或更多個氨基酸的可變區(qū)。術語可變輕鏈(VL)和可變重鏈(VH)分別是指這些輕鏈和重鏈。

      抗體是以完整免疫球蛋白形式或由各種肽酶消化產(chǎn)生的多個充分表征的片段的形式存在。因此,舉例來說,胃蛋白酶消化抗體鉸鏈區(qū)中的二硫鍵聯(lián),產(chǎn)生F(ab')2,即Fab的二聚體,所述Fab本身為通過二硫鍵與VH-CH1連接的輕鏈。F(ab')2可在溫和條件下還原以斷開鉸鏈區(qū)中的二硫鍵聯(lián),從而將F(ab')2二聚體轉(zhuǎn)化成Fab'單體。Fab'單體基本上為具有鉸鏈區(qū)的部分的Fab(關于其它抗體片段的更為詳細地描述,參看Fundamental Immunology.第4版,W.E.Paul編,Raven Press,N.Y.(1999))。盡管根據(jù)完整抗體的消化定義各種抗體片段,但所屬領域技術人員將了解,所述Fab'片段等可以化學方法或通過利用重組DNA方法重新合成。因此,如本文所使用,術語抗體還任選包括由修飾完整抗體產(chǎn)生或使用重組DNA方法重新合成的抗體片段??贵w包括單鏈抗體,包括單鏈Fv(sFv或scFv)抗體,其中可變重鏈與可變輕鏈連接在一起(直接連接或通過肽連接子連接)形成連續(xù)多肽。本發(fā)明的抗體可例如為多克隆抗體、單克隆抗體、嵌合抗體、人化抗體、單鏈抗體、Fab片段、由Fab表達文庫產(chǎn)生的片段等。

      一般說來,本發(fā)明的抗體在多種分子生物或制藥過程中作為普通試劑和治療劑都極具價值。產(chǎn)生多克隆和單克隆抗體的方法可得到,并且可用于制造本發(fā)明的抗體。多個基本文本中描述標準抗體產(chǎn)生方法,包括例如Borrebaeck(編)(1995)Antibody Engineering.第2版Freeman and Company,NY(Borrebaeck);McCafferty等人(1996)Antibody Engineering,A Practical Approach IRL Oxford Press,Oxford,England(McCafferty);和Paul(1995)Antibody Engineering Protocols Humana Press,Towata,NJ(Paul);Paul(編),(1999)Fundamental Immunology.第5版Raven Press,N.Y.;Coligan(1991)Current Protocols in Immunology Wiley/Greene,NY;Harlow和Lane(1989)Antibodies:A Laboratory Manual Cold Spring Harbor Press,NY;Stites等人(編)Basic and Clinical Immunology(第4版)Lange Medical Publications,Los Altos,CA,和其中引用的參考文獻;Goding(1986)Monoclonal Antibodies:Principles and Practice(第2版)Academic Press,New York,NY;以及Kohler和Milstein(1975)Nature256:495-497。

      已開發(fā)出多種用于抗體制備的不依賴于例如將抗原注射到動物中的重組技術,并且可將其用于本發(fā)明的情形中。舉例來說,有可能在噬菌體或類似載體中產(chǎn)生并選擇重組抗體文庫。關于評論,例如參看Winter等人(1994)Making Antibodies by Phage Display Technology Annu.Rev.Immunol.12:433-55和其中所引用的參考文獻。還參看,Griffiths和Duncan(1998)Strategies for selection of antibodies by phage display Curr Opin Biotechnol 9:102-8;Hoogenboom等人(1998)Antibody phage display technology and its applications Immunotechnology 4:1-20;Gram等人(1992)in vitro selection and affinity maturation of antibodies from a naive combinatorial immunoglobulin library PNAS 89:3576-3580;Huse等人(1989)Science 246:1275-1281;和Ward等人(1989)Nature 341:544-546。

      在一個實施例中,抗體文庫可包括V基因譜系(例如,從淋巴細胞群采集或在活體外組裝),其經(jīng)克隆以在絲狀噬菌體表面上展示相關重鏈和輕鏈可變結構域。通過結合抗原來選擇噬菌體??扇苄钥贵w是由感染噬菌體的細菌表達并且可例如經(jīng)由誘變來改進抗體。例如參看,Balint和Larrick(1993)Antibody Engineering by Parsimonious Mutagenesis Gene 137:109-118;Stemmer等人(1993)Selection of an Active Single-Chain Fv Antibody From a Protein Linker Library Prepared by Enzymatic Inverse PCR Biotechniques 14(2):256-65;Crameri等人(1996)Construction and evolution ofantibody-phage libraries by DNA shuffling Nature Medicine 2:100-103;以及Crameri和Stemmer(1995)Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes BioTechniques 18:194-195。

      用于克隆和表達重組抗體噬菌體系統(tǒng)的試劑盒也已知且可得,例如來自Amersham-Pharmacia Biotechnology(Uppsala,Sweden)的“重組噬菌體抗體系統(tǒng)小鼠ScFv組件(mouse ScFv module)”。也已產(chǎn)生噬菌體抗體文庫以通過鏈改組制造高親和力人類抗體(例如參看,Marks等人(1992)By-Passing Immunization:Building High Affinity Human Antibodies by Chain Shuffling Biotechniques 10:779-782)。還應認識到,可通過多種商務服務中任一種(例如,Bethyl Laboratories(Montgomery,TX)、Anawa(Switzerland)、Eurogentec(Belgium且在US,Philadelphia,PA)等制備抗體。

      在某些實施例中,將本發(fā)明的抗體“人化”是有用的,例如在所述抗體將會治療性投與的情況下。使用人化抗體傾向于減少針對治療性抗體的不合需要的免疫反應的發(fā)生率(例如,當患者為人類時)。上述抗體參考文獻中描述人化策略。除人化抗體外,人類抗體也為本發(fā)明的特征。人類抗體是由特征性人類免疫球蛋白序列組成。人類抗體可使用多種方法產(chǎn)生(關于評論,例如參看Larrick等人的美國專利第5,001,065號)。通過三源雜交瘤技術產(chǎn)生人類抗體的通用方法描述于Ostberg等人(1983),Hybridoma 2:361-367;Ostberg的美國專利第4,634,664號和Engelman等人的美國專利第4,634,666號中。

      已知多種將抗體用于蛋白質(zhì)的純化和檢測中的方法,且其可用于檢測和純化如本文所述包含非天然氨基酸的蛋白質(zhì)。一般說來,抗體為ELISA、Western印跡法、免疫化學、親和色譜法、SPR和許多其它方法的有用試劑。上文所述的參考文獻提供有關如何執(zhí)行ELISA分析、Western印跡、表面等離子體共振(SPR)等的細節(jié)。

      在本發(fā)明一方面中,本發(fā)明的抗體本身包括非天然氨基酸,提供具有所關注特性的抗體(例如,改進的半衰期、穩(wěn)定性、毒性等)。還參看本文中題為“具有非天然氨基酸的多肽”的章節(jié)??贵w占當前臨床試驗中所有化合物的近50%(Wittrup,(1999)Phage on display Tibtech 17:423-424)且抗體普遍用作診斷試劑。因此,利用非天然氨基酸修飾抗體的能力提供修飾這些有價值的試劑的重要工具。

      舉例來說,存在將MAb用于診斷領域的多種應用。分析范圍從簡單的斑點試驗到較為復雜的方法,諸如用于腫瘤成像的來自DuPont Merck Co.放射性標記的NR-LU-10MAb(Rusch等人(1993)NR-LU-10monoclonal antibody scanning.A helpful new adjunct to computed tomography in evaluating non-small-cell lung cancer.J Thorac Cardiovasc Surg 106:200-4)。如所述,MAb為ELISA、Western印跡法、免疫化學、親和色譜法等的重要試劑??蓪θ魏未祟愒\斷抗體加以修飾以包括一個或多個非天然氨基酸,從而改變例如Ab對靶的特異性或親合力,或例如通過在非天然氨基酸中包括可檢測標記(例如,光譜、熒光、發(fā)光等)來改變一種或多種可檢測特性。

      一類有價值的抗體試劑為治療性Ab。舉例來說,抗體可為通過靶向腫瘤細胞以通過抗體依賴細胞介導的細胞毒性(ADCC)或補體介導的細胞溶解(CML)破壞來阻止腫瘤生長的腫瘤特異性Mab(這些常見類型的Ab有時稱為“魔術彈(magic bullet)”)。一個實例為利妥昔單抗(Rituxan),一種治療非霍奇金氏淋巴瘤(Non-Hodgkins lymphoma)的抗CD20Mab(Scott(1998)Rituximab:a new therapeutic monoclonal antibody for non-Hodgkin's lymphoma Cancer Pract 6:195-7)。第二個實例涉及干擾腫瘤生長的關鍵組分的抗體。赫賽汀(Herceptin)為一種用于治療轉(zhuǎn)移性乳癌的抗HER-2單克隆抗體,并且提供具有此作用機制的抗體的實例(Baselga等人(1998)Recombinant humanized anti-HER2antibody(Herceptin)enhances the antitumor activity of paclitaxel and doxorubicin against HER2/neu over expressing human breast cancer xenografts[公開的勘誤表見于Cancer Res(1999)59(8):2020],Cancer Res 58:2825-31)。第三個實例涉及將細胞毒性化合物(毒素、放射性核素等)直接遞送到腫瘤或其它所關注部位的抗體。舉例來說,一個應用Mab為CYT-356,一種將輻射直接靶向前列腺腫瘤細胞的90Y連接的抗體(Deb等人Treatment of hormone-refractory prostate cancer with 90Y-CYT-356monoclonal antibody Clin Cancer Res 2:1289-97)。第四個應用為抗體定向酶前藥療法(antibody-directed enzyme prodrug therapy),其中共定位于腫瘤的酶可活化在腫瘤鄰近地區(qū)中全身投與的前藥。舉例來說,正開發(fā)一種連接到羧肽酶A的抗Ep-CAM1抗體來治療結腸直腸癌(Wolfe等人(1999)Antibody-directed enzyme prodrug therapy with the T268G mutant of human carboxypeptidase A1:in vitro and in vivo studies with prodrugs of methotrexate and the thymidylate synthase inhibitors GW1031and GW1843Bioconiug Chem 10:38-48)。其它Ab(例如,拮抗劑)經(jīng)設計以特異性抑制正常細胞功能用于治療益處。實例為奧素健體(Orthoclone)OKT3,一種由強生公司(Johnsonand Johnson)所提供的用于減少急性器官移植物排斥的抗CD3MAb(Strate等人(1990)Orthoclone OKT3as first-line therapy in acute renal allograft rejection Transplant Proc 22:219-20)。另一類抗體產(chǎn)物為激動劑。這些Mab經(jīng)設計以特異性增強正常細胞功能用于治療益處。舉例來說,用于神經(jīng)療法的基于Mab的乙酰膽堿受體激動劑正在開發(fā)中(Xie等人Direct demonstration of MuSK involvement in acetylcholine receptor clustering through identification of agonist ScFv Nat.Biotechnol.15:768-71)。這些抗體中任一種可經(jīng)修飾以包括一個或多個非天然氨基酸以增強一種或多種治療特性(特異性、親合力、血清半衰期等)。

      另一類抗體產(chǎn)物提供新穎功能。這一組中的主要抗體為已經(jīng)工程改造以模擬酶的催化能力的催化抗體,諸如Ig序列(Wentworth和Janda(1998)Catalytic antibodies Curr Opin Chem Biol 2:138-44)。舉例來說,值得關注的應用涉及使用催化抗體mAb-15A10以在活體內(nèi)水解可卡因(cocaine)以用于成癮的治療(Mets等人(1998)A catalytic antibody against cocaine prevents cocaine's reinforcing and toxic effects in rats Proc Natl Acad Sci USA 95:10176-81)。催化抗體還可經(jīng)修飾以包括一個或多個非天然氨基酸以改進一種或多種所關注特性。

      通過免疫反應性定義多肽

      由于本發(fā)明的多肽提供多種新的多肽序列(例如,在本文中的翻譯系統(tǒng)中合成的蛋白質(zhì)的情況下包含非天然氨基酸;或例如在本文中新穎合成酶的情況下,包含新穎標準氨基酸序列),故所述多肽還提供可例如在免疫學分析中識別的新結構特征。特異性結合本發(fā)明多肽的抗體或抗血清的產(chǎn)生以及所述抗體或抗血清所結合的多肽為本發(fā)明的特征。

      舉例來說,本發(fā)明包括合成酶蛋白,其特異性結合針對包含選自(SEQ ID NO:36-63和/或86)中一個或多個序列的氨基酸序列的免疫原所產(chǎn)生的抗體或抗血清或與所述抗體或抗血清特異性免疫反應。為除去與其它同源物交叉反應,利用諸如野生型大腸桿菌酪氨?;铣擅?TyrRS)(例如SEQ ID NO.:2)等可用對照合成酶同源物消減抗體或抗血清。

      在一種典型形式中,免疫分析使用針對一種或多種包含一個或多個對應于SEQ ID NO:36-63和/或86中一個或多個序列或者其實質(zhì)子序列(即,提供至少約30%的全長序列)的序列的多肽產(chǎn)生的多克隆抗血清。得自SEQ ID NO:36-63和86的潛在多肽免疫原組在下文中統(tǒng)稱為“免疫原性多肽”。任選選擇所得抗血清以對于對照合成酶同源物具有低交叉反應性,并且在免疫分析中使用多克隆抗血清之前,利用一種或多種對照合成酶同源物,例如通過免疫吸附去除任何此類交叉反應性。

      為了能產(chǎn)生用于免疫分析中的抗血清,可如本文所述產(chǎn)生一種或多種免疫原性多肽并加以純化。舉例來說,可在重組細胞中產(chǎn)生重組蛋白。利用免疫原性蛋白與標準佐劑(諸如,夫羅因德佐劑(Freund's adjuvant))的組合以及標準小鼠免疫方案,對近交系小鼠(因為結果歸因于小鼠的實質(zhì)遺傳一致更為可重復從而用于此分析中)進行免疫(有關抗體產(chǎn)生、可用于測定特異性免疫反應性的免疫分析形式和條件,例如參看Harlow和Lane(1988)Antibodies,A Laboratory Manual.Cold Spring Harbor Publications,New York。有關抗體的其它參考文獻和論述也見于本文中且可在本文中用于制造通過免疫反應性定義/檢測多肽的抗體)。另外,可將得自本文中所揭示的序列的一種或多種合成或重組多肽與載體蛋白連結并用作免疫原。

      收集多克隆血清并且在免疫分析,例如,利用一種或多種固定于固體支撐物上的免疫原性蛋白的固相免疫分析中,對免疫原性多肽進行滴定。選擇具有106或更高滴度的多克隆抗血清,匯集并利用對照合成酶多肽消減,以產(chǎn)生消減的經(jīng)匯集的經(jīng)滴定多克隆抗血清。

      在比較免疫分析中,測試消減的所匯集的經(jīng)滴定多克隆抗血清對于對照同源物的交叉反應性。在這個比較分析中,測定用于消減的經(jīng)滴定多克隆抗血清的差別結合條件,這引起比結合對照合成酶同源物高至少約5-10倍的經(jīng)滴定多克隆抗血清和免疫原性合成酶的信噪比。也就是說,通過添加諸如白蛋白或無脂肪奶粉等非特異性競爭劑,和/或通過調(diào)節(jié)鹽條件、溫度等,來調(diào)節(jié)結合/洗滌反應的嚴格度。將這些結合/洗滌條件用于后續(xù)分析中,以測定所匯集的經(jīng)消減的多克隆抗血清是否特異性結合測試多肽(與免疫原性多肽和/或?qū)φ斩嚯南啾容^的多肽)。具體說來,如與已知合成酶相比,在差別結合條件下展示比對照合成酶同源物高至少2-5×的信噪比以及為免疫原性多肽的至少約1/2的信噪比的測試多肽與免疫原性多肽共有相當大的結構相似性,且因此為本發(fā)明的多肽。

      在另一實例中,將競爭性結合形式的免疫分析用于檢測測試多肽。舉例來說,如所述,通過利用對照多肽的免疫吸附將交叉反應的抗體從匯集的抗血清混合物中去除。隨后,將免疫原性多肽固定于暴露于所匯集的消減抗血清的固體支撐物上。將測試蛋白質(zhì)添加到所述分析中以競爭結合所匯集的消減抗血清。將與固定蛋白質(zhì)相比,測試蛋白質(zhì)競爭結合所匯集的消減抗血清的能力與添加到所述分析中的免疫原性多肽競爭結合的能力(所述免疫原性多肽有效地與固定的免疫原性多肽競爭結合所匯集的抗血清)相比較。使用標準計算法計算測試蛋白質(zhì)的交叉反應性百分比。

      在平行分析中,任選與免疫原性多肽競爭結合抗血清的能力相比較,測定對照蛋白質(zhì)競爭結合所匯集的消減抗血清的能力。再使用標準計算法計算對照多肽的交叉反應性百分比。當測試多肽的交叉反應性百分比為對照多肽的至少5-10×高時,和或當測試多肽的結合大致在免疫原性多肽結合的范圍內(nèi)時,認為所述測試多肽特異性結合所匯集的消減抗血清。

      一般說來,可將經(jīng)免疫吸附且匯集的抗血清用于如本文所述的競爭性結合免疫分析中,以將任何測試多肽與免疫原性和/或?qū)φ斩嚯南啾容^。為進行這個比較,分別分析多種濃度的免疫原性、測試和對照多肽,并且使用標準技術測定抑制50%的消減抗血清與例如經(jīng)固定對照、測試或免疫原性蛋白質(zhì)結合所需的各多肽的量。如果在競爭性分析中結合所需的測試多肽的量比所需的免疫原性多肽的量少2倍,那么只要所述量為對照多肽的至少約5-10×高,即認為測試多肽特異性結合針對免疫原性蛋白質(zhì)所產(chǎn)生的抗體。

      作為特異性的另一測定法,任選利用免疫原性多肽(而非對照多肽)完全免疫吸附所匯集的抗血清,直到可檢測到極少所得免疫原性多肽-經(jīng)匯集的消減抗血清與免疫吸附中所使用的免疫原性多肽的結合或無法檢測到結合。隨后測試所述完全免疫吸附的抗血清與測試多肽的反應性。如果觀察到極少反應性或未觀察到反應性(即,關于完全免疫吸附的抗血清與免疫原性多肽結合觀察到不超過2×的信噪比),那么免疫原性蛋白質(zhì)引起抗血清與測試多肽的特異性結合。

      醫(yī)藥組合物

      將本發(fā)明的多肽或蛋白質(zhì)(例如,合成酶、包含一個或多個非天然氨基酸的蛋白質(zhì)等)任選例如與適當醫(yī)藥載劑組合用于治療用途。所述組合物例如包含治療有效量的化合物和醫(yī)藥學上可接受的載劑或賦形劑。所述載劑或賦形劑包括(但不限于)生理鹽水、緩沖生理鹽水、右旋糖、水、甘油、乙醇和/或其組合。調(diào)配物經(jīng)制備成與投藥模式相適應。一般來說,所屬領域眾所周知投與蛋白質(zhì)的方法并且其可應用于投與本發(fā)明的多肽。

      根據(jù)所屬領域眾所周知的方法,任選在一種或多種適當?shù)幕铙w外和/或活體內(nèi)動物疾病模型中測試包含一種或多種本發(fā)明的多肽的治療性組合物,以確定功效、組織代謝并評估劑量。具體來說,最初可通過本文中非天然氨基酸同源物相對于天然氨基酸同源物的活性、穩(wěn)定性或其它適當量度(例如,經(jīng)修飾以包括一個或多個非天然氨基酸的EPO與天然氨基酸EPO的比較)(即在相關分析中)來確定劑量。

      投藥可通過通常用于將分子引入以使其與血液或組織細胞緊密接觸的任何途徑進行。本發(fā)明的非天然氨基酸多肽是以任何適當?shù)姆绞饺芜x與一種或多種醫(yī)藥學上可接受的載劑一起投與。對患者投與本發(fā)明上下文中的所述多肽的適當方法都可用,且盡管可使用一種以上途徑投與特定組合物,但特定途徑通常能夠提供比另一途徑更快捷且更有效的作用或反應。

      醫(yī)藥學上可接受的載劑部分是由所投與的特定組合物以及用于投與組合物的特定方法決定。因此,存在多種本發(fā)明醫(yī)藥組合物的適當調(diào)配物。

      多肽組合物可通過多種途徑投與,包括(但不限于)口服、靜脈內(nèi)、腹膜內(nèi)、肌肉內(nèi)、透皮、皮下、局部、舌下或直腸方式。還可經(jīng)由脂質(zhì)體投與非天然氨基酸多肽組合物。所屬領域技術人員通常已知所述投藥途徑和適當?shù)恼{(diào)配物。

      單獨或與其它適當組分組合的非天然氨基酸多肽也可制成氣霧劑調(diào)配物(即,其可“成霧狀”)以經(jīng)由吸入投與??蓪忪F劑調(diào)配物放入諸如二氯二氟甲烷、丙烷、氮氣等加壓可接受推進劑中。

      適于不經(jīng)腸投藥(諸如通過關節(jié)內(nèi)(在關節(jié)中)、靜脈內(nèi)、肌肉內(nèi)、皮內(nèi)、腹膜內(nèi)和皮下途徑)的調(diào)配物包括水性和非水性等張無菌注射液,其可含有抗氧化劑、緩沖劑、抑菌劑和使調(diào)配物與預定接受者血液等張的溶質(zhì),以及可包括懸浮劑、增溶劑、增稠劑、穩(wěn)定劑和防腐劑的水性和非水性無菌懸浮液??捎趩挝粍┝炕蚨鄤┝棵芊馊萜?諸如安瓿和小瓶)中提供包裝好的核酸調(diào)配物。

      不經(jīng)腸投藥和靜脈內(nèi)投藥是優(yōu)選的投藥方法。具體來說,已經(jīng)用于天然氨基酸同源物治療劑的投藥途徑(例如,通常用于EPO、GCSF、GMCSF、IFN、白細胞介素、抗體和/或任何其它醫(yī)藥學上遞送蛋白質(zhì)的途徑)以及當前使用的調(diào)配物提供包括本發(fā)明的非天然氨基酸的蛋白質(zhì)(當前治療性蛋白質(zhì)的聚乙二醇化變異體等)的優(yōu)選投藥途徑以及調(diào)配物。

      在本發(fā)明的情況下,視應用而定,投與患者的劑量足以在患者體內(nèi)隨時間實現(xiàn)有益的治療反應,或例如抑制病原體感染或其它適當活性。通過特定組合物/調(diào)配物的功效、所使用的非天然氨基酸多肽的活性、穩(wěn)定性或血清半衰期和患者的病狀以及欲治療患者的體重或表面積來確定劑量。劑量大小也通過在特定患者體內(nèi)伴隨特定組合物/調(diào)配物的投藥的任何不利副作用的存在、性質(zhì)和程度等來確定。

      在確定疾病(例如,癌癥、遺傳疾病、糖尿病、AIDS等)的治療或預防中欲投與的組合物/調(diào)配物的有效量時,醫(yī)師會評估循環(huán)血漿水平、調(diào)配物毒性、疾病進展和/或(相關時)抗非天然氨基酸多肽抗體的產(chǎn)生。

      例如投與70公斤患者的劑量通常在等于當前使用的治療性蛋白質(zhì)的劑量范圍內(nèi),所述范圍可針對相關組合物的活性或血清半衰期的改變而調(diào)節(jié)。本發(fā)明的組合物/調(diào)配物可通過任何已知的常規(guī)療法來補充治療條件,包括抗體投與、疫苗投與、投與細胞毒性劑、天然氨基酸多肽、核酸、核苷酸類似物、生物反應調(diào)節(jié)劑等。

      對于投藥,本發(fā)明的調(diào)配物是以由以下因素所確定的速率投與:相關調(diào)配物的LD-50,和/或例如當關系到患者的質(zhì)量和總體健康狀況時,對各種濃度的非天然氨基酸的任何副作用的觀察。投藥可以單次劑量或分劑量實現(xiàn)。

      如果進行調(diào)配物輸注的患者出現(xiàn)發(fā)燒、寒戰(zhàn)或肌肉疼痛,那么其接收適當劑量的阿司匹林(aspirin)、布洛芬(ibuprofen)、對乙酰氨基酚(acetaminophen)或其它疼痛/發(fā)燒控制藥物。在將要進行輸注之前30分鐘,對經(jīng)歷輸注反應(諸如發(fā)燒、肌肉疼痛和寒戰(zhàn))的患者預先給予阿司匹林、對乙酰氨基酚或例如苯海拉明(diphenhydramine)。將哌替啶(Meperidine)用于不能對解熱劑和抗組織胺快速作出反應的更為嚴重的寒戰(zhàn)和肌肉疼痛。視反應的嚴重程度減緩或中斷治療。

      核酸和多肽序列及變異體

      如上文和下文所述,本發(fā)明提供核酸多聚核苷酸序列和多肽氨基酸序列(例如,O-tRNA和O-RS)以及例如包含所述序列的組合物和方法。例如O-tRNA和O-RS等所述序列的實例在本文中揭示(參看表5,例如SEQ ID NO.3-65、86,以及SEQ ID NO.:1和2)。然而,所屬領域技術人員將了解,本發(fā)明不限于本文(例如,實例和表5)中所揭示的這些序列。所屬領域技術人員將了解,本發(fā)明還提供具有本文所述的功能(例如,編碼O-tRNA或O-RS)的許多相關和甚至不相關的序列。

      本發(fā)明還提供多肽(O-RS);和多聚核苷酸,例如O-tRNA、編碼O-RS或其部分(例如,所述合成酶的活性位點)的多聚核苷酸;用于構建氨酰基-tRNA合成酶突變體的寡聚核苷酸等。舉例來說,本發(fā)明的多肽包括:包含如SEQ ID NO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽;包含由如SEQ ID NO.:3-35中任一序列所示的多聚核苷酸序列編碼的氨基酸序列的多肽;以及與對包含如SEQ ID NO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽具特異性的抗體特異性免疫反應的多肽;或包含由如SEQ ID NO.:3-35中任一序列所示的多聚核苷酸序列編碼的氨基酸序列的多肽。

      本發(fā)明的多肽中還包括包含與天然存在的酪氨酰基氨?;?tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQ ID NO.:2)至少90%一致的氨基酸序列且包含兩個或兩個以上A-E組氨基酸的多肽。舉例來說,A組包括在與大腸桿菌TyrRS的Tyr37對應的位置的纈氨酸、異亮氨酸、亮氨酸、甘氨酸、絲氨酸、丙氨酸或蘇氨酸;B組包括在與大腸桿菌TyrRS的Asn126對應的位置的天冬氨酸;C組包括在與大腸桿菌TyrRS的Asp 182對應的位置的蘇氨酸、絲氨酸、精氨酸、天冬酰胺或甘氨酸;D組包括在與大腸桿菌TyrRS的Phe183對應的位置的甲硫氨酸、丙氨酸、纈氨酸或酪氨酸;且E組包括在與大腸桿菌TyrRS的Leu186對應的位置的絲氨酸、甲硫氨酸、纈氨酸、半胱氨酸、蘇氨酸或丙氨酸。類似地,本發(fā)明的多肽還包括包含SEQ ID NO.:36-63和/或86的至少20個相鄰氨基酸以及兩個或兩個以上如上文在A-E組中所述的氨基酸取代的多肽。還包括包含任一上述多肽的保守變異體的氨基酸序列作為本發(fā)明的多肽。

      在一個實施例中,組合物包括本發(fā)明的多肽和賦形劑(例如,緩沖液、水、醫(yī)藥學上可接受的賦形劑等)。本發(fā)明還提供與本發(fā)明的多肽特異性免疫反應的抗體或抗血清。

      本發(fā)明中還提供多聚核苷酸。本發(fā)明的多聚核苷酸包括編碼本發(fā)明的所關注蛋白質(zhì)或多肽或包括一個或多個選擇性密碼子或二者的多聚核苷酸。舉例來說,本發(fā)明的多聚核苷酸包括例如:包含如SEQ ID NO.:3-35、64-85中任一序列所述的核苷酸序列的多聚核苷酸;與其多聚核苷酸序列互補或編碼其多聚核苷酸序列的多聚核苷酸;和/或編碼包含如SEQ ID NO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽的多聚核苷酸,或其保守變異體。本發(fā)明的多聚核苷酸還包括編碼本發(fā)明的多肽的多聚核苷酸。類似地,在高度嚴格條件下在實質(zhì)上整個核酸長度上與上文所述的多聚核苷酸雜交的核酸為本發(fā)明的多聚核苷酸。

      本發(fā)明的多聚核苷酸還包括編碼多肽的多聚核苷酸,所述多肽包含與天然存在的酪氨酰基氨?;?tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQ ID NO.:2)至少90%一致的氨基酸序列且包含兩個或兩個以上如上文在第11段中A-E組中所述的突變。本發(fā)明的多聚核苷酸中還包括與上文所述的多聚核苷酸至少70%(或至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或更多)一致的多聚核苷酸,和/或包含任一上文所述的多聚核苷酸的保守變異體的多聚核苷酸。

      在某些實施例中,載體(例如,質(zhì)粒、柯斯質(zhì)粒、噬菌體、病毒等)包含本發(fā)明的多聚核苷酸。在一個實施例中,載體為表達載體。在另一實施例中,表達載體包括可操作性連接到一個或多個本發(fā)明的多聚核苷酸的啟動子。在另一實施例中,細胞包含包括本發(fā)明的多聚核苷酸的載體。

      技術人員還應了解,所揭示的序列的許多變異體都包括在本發(fā)明中。舉例來說,本發(fā)明中包括得到功能相同的序列的所揭示的序列的保守變異體。認為核酸多聚核苷酸序列的變異體與至少一個所揭示的序列雜交的變異體包括在本發(fā)明中。本發(fā)明中還包括如例如通過標準序列比較技術確定的本文所揭示的序列的獨特子序列。

      保守變異體

      歸因于遺傳密碼的簡并性,“沉默取代(silent substitution)”(即,不會引起所編碼的多肽改變的核酸序列的取代)為編碼氨基酸的各核酸序列所暗含的特征。類似地,“保守氨基酸取代”(即,氨基酸序列中一個或數(shù)個氨基酸經(jīng)具有高度相似性的不同氨基酸取代)也易于鑒別為與所揭示的構建體高度相似。所述各所揭示序列的保守變異體為本發(fā)明的特征。

      特定核酸序列的“保守變異體”是指編碼相同或基本上相同的氨基酸序列的核酸,或當所述核酸不編碼氨基酸序列時是指基本上相同的序列。所屬領域技術人員將認識到,在編碼序列中改變、添加或缺失單一氨基酸或少量氨基酸(通常小于5%,更通常小于4%、2%或1%)的個別取代、缺失或添加為“保守性修飾變異”,其中所述改變將導致氨基酸的缺失、氨基酸的添加或化學上類似的氨基酸對氨基酸的取代。因此,本發(fā)明所列多肽序列的“保守變異”包括少量、通常小于5%、更通常小于2%或1%的多肽序列的氨基酸經(jīng)具有相同保守取代基團的保守所選氨基酸取代。最后,不改變核酸分子的編碼活性的序列的添加(諸如,非功能性序列的添加)為基本核酸的保守變異。

      所屬領域技術人員眾所周知提供功能類似的氨基酸的保守取代表。以下陳述含有包括彼此互為“保守取代”的天然氨基酸的例示性群組:

      保守取代組

      核酸雜交

      可使用比較雜交來鑒別本發(fā)明的核酸,包括本發(fā)明核酸的保守變異體,并且所述比較雜交方法是區(qū)別本發(fā)明的核酸的優(yōu)選方法。此外,與SEQ ID NO:3-35、64-85所示的核酸在高、超高和極高嚴格條件下雜交的靶核酸為本發(fā)明的特征。所述核酸的實例包括與指定的核酸序列相比具有一個或數(shù)個沉默或保守核酸取代的核酸。

      當測試核酸以其與完全匹配的互補靶雜交的至少1/2水平與探針雜交時,即,以高達探針與靶在一定條件下(其中完全匹配的探針以關于與任何不匹配靶核酸雜交所觀察到的信噪比的至少約5×-10×高的信噪比與完全匹配的互補靶結合)雜交的信噪比的至少1/2信噪比雜交時,認為所述測試核酸與探針核酸特異性雜交。

      當核酸通常在溶液中締合時,其“雜交”。核酸因存在多種諸如氫鍵、溶劑排斥、堿基堆疊等充分表征的物理化學力而雜交。核酸雜交的廣泛指導可見于Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes第2章第I部分,“Overview of principles of hybridization and the strategy of nucleic acid probe assays,”(Elsevier,New York),以及Ausubel,同上文中。Hames和Higgins(1995)Gene Probes 1IRL Press at Oxford University Press,Oxford,England,(Hames and Higgins 1)以及Hames和Higgins(1995)Gene Probes 2IRL Press at Oxford University Press,Oxford,England(Hames and Higgins 2)中提供有關合成、標記、檢測和量化DNA和RNA(包括寡核苷酸)的細節(jié)。。

      在Southern印跡或Northern印跡中于過濾器上具有超過100個互補殘基的互補核酸雜交的嚴格雜交條件的實例為42℃,50%福爾馬林和1mg肝素,且進行雜交整夜。嚴格洗滌條件的實例為65℃下0.2×SSC洗滌15分鐘(關于SSC緩沖液的描述參看Sambrook,同上文)。通常,高度嚴格洗滌是在低嚴格度洗滌之前以去除背景探針信號。例示性低嚴格度洗滌是在40℃下以2×SSC洗滌15分鐘。一般來說,5×(或更高)于在特定雜交分析中關于不相關探針所觀察到的信噪比的信噪比指示檢測到特異性雜交。

      在諸如Southern和Northern雜交等核酸雜交實驗的情形中,“嚴格雜交洗滌條件”為序列依賴性,并且在不同環(huán)境參數(shù)下不同。有關核酸雜交的廣泛指導可見于Tijssen(1993),同上文以及Hames和Higgins,1和2。任何測試核酸的嚴格雜交和洗滌條件都可易于根據(jù)經(jīng)驗確定。舉例來說,在確定高度嚴格雜交和洗滌條件的過程中,將雜交和洗滌條件逐漸增加(例如,通過增加溫度、降低鹽濃度、增加清潔劑濃度和/或增加雜交或洗滌中諸如福爾馬林等有機溶劑的濃度),直到滿足一組所選擇的標準。舉例來說,逐漸增加雜交和洗滌條件,直到探針與完全匹配的互補靶以對于探針與不匹配靶雜交所觀察到的至少5倍高的信噪比結合。

      選擇與特定探針的熱熔點(Tm)相等的“極嚴格”條件。Tm為50%的測試序列與完全匹配的探針雜交的溫度(在指定離子強度和pH值下)。出于本發(fā)明的目的,一般地說,選擇在指定離子強度和pH值下比特定序列的Tm低約5℃的“高度嚴格”雜交和洗滌條件。

      “超高嚴格”雜交和洗滌條件為增加雜交和洗滌條件的嚴格度,直到探針與完全匹配的互補靶核酸結合的信噪比為對于雜交任何不匹配靶核酸所觀察到的至少10倍高。據(jù)悉,在所述條件下以完全匹配的互補靶核酸的至少1/2的信噪比與探針雜交的靶核酸在超高嚴格條件下與所述探針結合。

      類似地,可通過逐漸增加相關雜交分析的雜交和/或洗滌條件來確定甚至較高的嚴格度。舉例來說,增加雜交和洗滌條件的嚴格度,直到探針與完全匹配的互補靶核酸結合的信噪比為對于雜交任何不匹配靶核酸所觀察到的至少10×、20×、50×、100×或500×或更高倍數(shù)。據(jù)悉,在所述條件下以完全匹配的互補靶核酸的至少1/2的信噪比與探針雜交的靶核酸在極高嚴格條件下與所述探針結合。

      如果在嚴格條件下彼此不雜交的核酸編碼的多肽實質(zhì)上相同,那么所述核酸也實質(zhì)上相同。例如當使用遺傳密碼所允許的最大密碼子簡并性產(chǎn)生核酸拷貝時,出現(xiàn)此情形。

      獨特子序列

      一方面,本發(fā)明提供一種核酸,其包含選自本文所揭示的O-tRNA和O-RS序列的核酸中的獨特子序列。獨特子序列與對應于任何已知的O-tRNA或O-RS核酸序列的核酸相比為獨特的??墒褂美缭O置為默認參數(shù)的BLAST執(zhí)行比對。任何獨特子序列都例如可用作鑒別本發(fā)明的核酸的探針。

      類似地,本發(fā)明包括一種多肽,其包含選自本文所揭示的O-RS序列的多肽中的獨特子序列。在本文中,獨特子序列與對應于任何已知多肽序列的多肽相比為獨特的。

      本發(fā)明還提供靶核酸,其在嚴格條件下與編碼選自O-RS的序列的多肽中的獨特子序列的獨特編碼寡聚核苷酸雜交,其中所述獨特子序列與對應于任何對照多肽的多肽(例如,通過突變得到本發(fā)明的合成酶的親本序列)相比為獨特的。獨特子序列是如上文所述確定。

      序列比較、一致性和同源性

      在兩個或兩個以上核酸或多肽序列的情形中,術語“一致”或“一致性”百分比是指當比較和比對最大對應性時,如使用下文所述的序列比較算法中的一種(或所屬領域技術人員可用的其它算法)或通過目測所測量,相同或具有特定的相同氨基酸殘基或核苷酸百分比的兩個或兩個以上序列或子序列。

      在兩個核酸或多肽(例如,編碼O-tRNA或O-RS的DNA,或O-RS的氨基酸序列)的情形中,短語“實質(zhì)上一致”是指當比較和比對最大對應性時,如使用序列比較算法或通過目測所測量,具有至少約60%、優(yōu)選80%、最優(yōu)選90-95%的核苷酸或氨基酸殘基一致性的兩個或兩個以上序列或子序列。在不提及實際祖先的情況下,通常認為所述“實質(zhì)上一致”的序列“同源”。“實質(zhì)一致性”優(yōu)選在至少約50個殘基長的序列區(qū)、更優(yōu)選至少約100個殘基的區(qū)域上存在,且最優(yōu)選所述序列在至少約150個殘基或欲比較的兩個序列的全長上實質(zhì)上一致。

      為進行序列比較和同源性測定,通常將一個序列充當與測試序列相比較的參考序列。當使用序列比較算法時,將測試序列和參考序列輸入計算機內(nèi),視需要指定子序列坐標,并且指定序列算法程序參數(shù)。隨后序列比較算法基于指定的程序參數(shù)計算測試序列相對于參考序列的序列一致性百分比。

      可例如通過Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法、Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源性比對算法、Pearson&Lipman,Proc.Nat’l.Acad.Sci.USA 85:2444(1988)的相似性搜索方法、這些算法的計算機實施(Wisconsin Genetics Software Package,Genetics Computer Group,575Science Dr.,Madison,WI中的GAP、BESTFIT、FASTA和TFASTA)或通過目測(例如參看Ausubel等人,同上文)進行供比較序列的最佳比對。

      適于測定序列一致性百分比和序列相似性的算法的一個實例為BLAST算法,其描述于Altschul等人,J.Mol.Biol.215:403-410(1990)中。執(zhí)行BLAST分析的軟件可通過美國生物技術信息中心(National Center for Biotechnology Information,www.ncbi.nlm.nih.gov/)公共可用。所述算法涉及首先通過鑒別詢問序列中長度W的短字來鑒別高得分的序列對(high scoring sequence pair,HSP),當與數(shù)據(jù)庫序列中相同長度的字比對時,所述HSP匹配或滿足一些正值臨界得分T。T是指鄰近字的臨界分值(neighborhood word score threshold)(Altschul等人,同上文)。這些初始鄰近字匹配(word hit)充當起始搜索的種子以發(fā)現(xiàn)含有其的較長HSP。隨后使字匹配沿各序列的兩個方向延伸直到可增加累積比對的分值。對核苷酸序列使用參數(shù)M(一對匹配殘基的獎勵分值;通常>0)和N(錯配殘基的處罰分值,通常<0)計算累積分值。對于氨基酸序列,使用得分矩陣計算累積分值。當:累積比對分值比其所達到的最大值低數(shù)量X;累積分值因一個或多個負得分殘基比對的積累而為零或更低值;或到達各序列的末端時,在各個方向上的字匹配延伸停止。BLAST算法參數(shù)W、T和X將決定比對的靈敏性和速度。BLASTN程序(對于核苷酸序列)使用11的字長(W)、10的期望值(expectation,E)、100的截止值、M=5、N=-4和兩條鏈的比較作為默認值。對于氨基酸序列,BLASTP程序使用3的字長(W)、10的期望值(E)和BLOSUM62得分矩陣(參看Henikoff&Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)作為默認值。

      除計算序列一致性百分比外,BLAST算法還執(zhí)行兩個序列之間相似性的統(tǒng)計學分析(例如參看Karlin&Altschul,Proc.Nat'l.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法所提供的一種相似性量度為最小和概率(smallest sum probability,P(N)),其提供對于兩個核苷酸或氨基酸序列之間偶然出現(xiàn)匹配的概率的指示。舉例來說,如果在將測試核酸與參考核酸相比較時,最小和概率小于約0.1、更優(yōu)選小于約0.01且最優(yōu)選小于約0.001,那么可認為所述核酸與參考序列相似。

      誘變和其它分子生物學技術

      描述分子生物技術的常見文章包括Berger和Kimmel Guide to Molecular Cloning Techniques. Methods in Enzymology第152卷Academic Press,Inc.,San Diego,CA(Berger);Sambrook等人,Molecular Cloning-A Laboratory Manual(第2版)第1-3卷.Cold Spring Harbor Laboratory,Cold Spring Harbor,New York,1989("Sambrook")和Current Protocols in Molecular Biology.F.M.Ausubel等人,編,Current Protocols,Greene Publishing Associates,Inc.與John Wiley&Sons,Inc.的合資公司,(1999增刊)("Ausubel")。這些文章描述誘變、載體的使用、啟動子和許多其它相關課題,所述相關課題涉及例如包括用于產(chǎn)生包括非天然氨基酸的蛋白質(zhì)的選擇密碼子、正交tRNA、正交合成酶和其對在內(nèi)的基因的產(chǎn)生。

      多類誘變方法用于本發(fā)明中,例如以產(chǎn)生tRNA文庫、產(chǎn)生合成酶文庫、插入編碼所關注蛋白質(zhì)或多肽中的非天然氨基酸的選擇性密碼子。所述誘變方法包括(但不限于)定點誘變、隨機點誘變、同源重組、DNA改組或其它遞歸誘變方法、嵌合構建、使用含尿嘧啶的模板的誘變、寡核苷酸定向誘變、硫代磷酸酯修飾DNA誘變、使用缺口雙螺旋DNA的誘變等或其任何組合。其它適當方法包括點錯配修復、使用修復缺陷型宿主株的誘變、限制性選擇和限制性純化、缺失誘變、通過總基因合成誘變、雙鏈斷裂修復等。舉例來說,涉及嵌合構建體的誘變也包括在本發(fā)明中。在一個實施例中,可通過天然存在分子或者改變或突變的天然存在的分子的已知信息(例如,序列、序列比較、物理特性、晶體結構等)指導誘變。

      上述本文中所見的文章和實例描述這些程序。其它信息可見于文中所引用的以下公開案和參考文獻:Ling等人,Approaches to DNA mutagenesis:an overview,Anal Biochem.254(2):157-178(1997);Dale等人,Oligonucleotide-directed random mutagenesis using the phosphorothioate method,Methods Mol.Biol.57:369-374(1996);Smith,In vitro mutagenesis,Ann.Rev.Genet.19:423-462(1985);Botstein&Shortle,Strategies and applications of in vitro mutagenesis,Science 229:1193-1201(1985);Carter,Site-directed mutagenesis,Biochem.J.237:1-7(1986);Kunkel,The efficiency of oligonucleotide directed mutagenesis,Nucleic Acids&Molecular Biology(Eckstein,F.和Lilley,D.M.J編,Springer Verlag,Berlin))(1987);Kunkel,Rapid and efficient site-specific mutagenesis withoutphenotypic selection,Proc.Natl.Acad.Sci.USA 82:488-492(1985);Kunkel等人,Rapid and efficient site-specific mutagenesis without phenotypic selection,Methods in Enzymol.154,367-382(1987);Bass等人,Mutant Trp repressors with new DNA-binding specificities,Science 242:240-245(1988);Methods in Enzymol.100:468-500(1983);Methods in Enzymol.154:329-350(1987);Zoller&Smith,Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficient and general procedure for the production of point mutations in any DNA fragment,Nucleic Acids Res.10:6487-6500(1982);Zoller&Smith,Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13vectors,Methods in Enzymol.100:468-500(1983);Zoller&Smith,Oligonucleotide-directed mutagenesis:a simple method using two oligonucleotide primers and a single-stranded DNA template,Methods in Enzymol.154:329-350(1987);Taylor等人,The use of phosphor othioate-modified DNA in restriction enzyme reactions to prepare nicked DNA,Nucl.Acids Res.13:8749-8764(1985);Taylor等人,The rapid generation of oligonucleotide-directed mutations at high frequency using phosphor othioate-modified DNA,Nucl.Acids Res.13:8765-8787(1985);Nakamaye&Eckstein,Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis,Nucl.Acids Res.14:9679-9698(1986);Sayers等人,Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis,Nucl.Acids Res.16:791-802(1988);Sayers等人,Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence ofethidium bromide,(1988)Nucl.Acids Res.16:803-814;Kramer等人,The gapped duplex DNA approach to oligonucleotide-directed mutation construction,Nucl.Acids Res.12:9441-9456(1984);Kramer&Fritz Oligonucleotide-directed construction of mutations via gapped duplex DNA,Methods in Enzymol.154:350-367(1987);Kramer等人,Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations,Nucl.Acids Res.16:7207(1988);Fritz等人,Oligonucleotide-directed construction of mutations:a gapped duplex DNA procedure without enzymatic reactions in vitro,Nucl.Acids Res.16:6987-6999(1988);Kramer等人,Point Mismatch Repair,Cell 38:879-887(1984);Carter等人,Improved oligonucleotide site-directed mutagenesis using MI3vectors.Nucl.Acids Res.13:4431-4443(1985);Carter,Improved oligonucleotide-directed mutagenesis using M13vectors,Methods in Enzymol.154:382-403(1987);Eghtedarzadeh&Henikoff,Use of oligonucleotides to generate large deletions,Nucl.Acids Res.14:5115(1986);Wells等人,Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin,Phil.Trans.R.Soc.Lond.A 317:415-423(1986);Nambiar等人,Total synthesis and cloning of a gene coding for the ribonuclease Sprotein,Science 223:1299-1301(1984);Sakamar和Khorana,Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-bindingprotein(transducin).Nucl.Acids Res.14:6361-6372(1988);Wells等人,Cassette mutagenesis:an efficient method for generation of multiple mutations at defined sites,Gene 34:315-323(1985);等人,Oligonucleotide-directed mutagenesis by microscale'shot-gun'gene synthesis,Nucl.Acids Res.13:3305-3316(1985);Mandecki,Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli:a method for site-specific mutagenesis,Proc.Natl.Acad.Sci.USA,83:7177-7181(1986);Arnold,Protein engineering for unusual environments,Current Opinion in Biotechnology4:450-455(1993);Sieber,等人,Nature Biotechnology,19:456-460(2001).W.P.C.Stemmer,Nature 370,389-91(1994);和I.A.Lorimer,I.Pastan,Nucleic Acids Res.23,3067-8(1995)。關于眾多上述方法的其它細節(jié)可見于Methods in Enzymology第154卷,其也描述對于各種誘變方法引起的故障查找問題的有效控制。

      本發(fā)明還涉及經(jīng)由正交tRNA/RS對活體內(nèi)并入非天然氨基酸的脊椎動物宿主細胞和生物體。利用本發(fā)明的多聚核苷酸或包括本發(fā)明的多聚核苷酸的構建體(例如本發(fā)明的載體,其可為例如克隆載體或表達載體)對宿主細胞進行基因工程改造(例如,轉(zhuǎn)化、轉(zhuǎn)導或轉(zhuǎn)染)。載體可為例如質(zhì)粒、細菌、病毒、裸多聚核苷酸或連結多聚核苷酸的形式??赏ㄟ^標準方法將載體引入細胞和/或微生物中,所述方法包括電穿孔(Fromm等人,Proc.Natl.Acad.Sci.USA 82,5824(1985))、通過病毒載體感染、在小珠粒或粒子基質(zhì)內(nèi)或在表面上用具有核酸的小粒子高速彈道穿透(Klein等人,Nature 327,70-73(1987))。

      可在經(jīng)調(diào)節(jié)適用于諸如篩選步驟、活化啟動子或選擇轉(zhuǎn)化株的活動的常規(guī)營養(yǎng)培養(yǎng)基中培養(yǎng)經(jīng)工程改造的宿主細胞。這些細胞可任選培養(yǎng)入轉(zhuǎn)基因有機體中。關于例如細胞分離和培養(yǎng)(例如用于隨后核酸分離)的其它有用參考文獻包括Freshney(1994)Culture of Animal Cells,a Manual of Basic Technique,第3版,Wiley-Liss,New York及其中所引用的參考文獻;Payne等人(1992)Plant Cell and Tissue Culture in Liquid SystemsJohn Wiley&Sons,Inc.New York,NY;Gamborg和Phillips(編)(1995)Plant Cell,Tissue and Organ Culture;Fundamental Methods Springer Lab Manual,Springer-Verlag(Berlin Heidelberg New York)以及Atlas和Parks(編)The Handbook of MicrobiologicalMedia(1993)CRC Press,Boca Raton,FL。

      本發(fā)明還涉及具有經(jīng)由正交tRNA/RS對并入一個或多個非天然氨基酸的能力的脊椎動物細胞系??墒褂盟鶎兕I域中已知的細胞培養(yǎng)技術在已經(jīng)本發(fā)明的多聚核苷酸或包括本發(fā)明的多聚核苷酸的構建體轉(zhuǎn)化、轉(zhuǎn)導或轉(zhuǎn)染的宿主細胞上建立這些細胞系。將外源核酸引入宿主細胞中的方法已為所屬領域中眾所周知且將隨所使用的宿主細胞而變化。技術包括(但不限于)葡聚糖介導的轉(zhuǎn)染、磷酸鈣沉淀、氯化鈣處理、聚凝胺(polybrene)介導的轉(zhuǎn)染、原生質(zhì)體融合、電穿孔、病毒或噬菌體感染、脂質(zhì)體中多聚核苷酸的封裝和定向微注射。

      可以允許瞬時或穩(wěn)定并入DNA的方式轉(zhuǎn)化或轉(zhuǎn)染細胞。對于重組蛋白的長期、高產(chǎn)率產(chǎn)生來說,優(yōu)選穩(wěn)定表達。舉例來說,可對穩(wěn)定表達抗體分子的細胞系進行工程改造??捎猛ㄟ^適當表達控制元件(例如,啟動子、增強子、序列、轉(zhuǎn)錄終止子、多聚腺苷酸位點等)控制的DNA和可選擇標記轉(zhuǎn)化宿主細胞,而非使用含有病毒復制起點的表達載體。在引入外來DNA后,可使經(jīng)工程改造的細胞在富集培養(yǎng)基中生長1-2天,且隨后轉(zhuǎn)換為選擇性培養(yǎng)基。重組質(zhì)粒中的可選擇標記賦予對選擇的抗性,并且使細胞能將質(zhì)粒穩(wěn)定整合到其染色體組中并生長,從而形成細胞群,又可對其進行克隆并擴充成細胞系??捎欣厥褂盟龇椒▉砉こ谈脑毂磉_抗體分子的細胞系。所述經(jīng)工程改造的細胞系尤其適用于篩選和評估與抗體分子直接或間接相互作用的化合物。另外,諸如一些病毒介導的載體轉(zhuǎn)染技術等所屬領域技術人員眾所周知的其它技術可允許瞬時轉(zhuǎn)染細胞。

      可使用將靶核酸引入細胞中的若干種眾所周知的方法,其中任一種都可用于本發(fā)明中。這些方法包括:受體細胞與含有DNA的細菌原生質(zhì)體融合、電穿孔、基因槍法(projectile bombardment)(對于較為穩(wěn)定的表達)和經(jīng)病毒載體感染(其可用于穩(wěn)定或瞬時轉(zhuǎn)染且也在下文中進一步論述)等。細菌細胞可用于擴增含有本發(fā)明的DNA構建體的質(zhì)粒的數(shù)目。使細菌生長到對數(shù)生長期且可通過所屬領域中已知的多種方法分離細菌中的質(zhì)粒(例如參看Sambrook)。另外,可購得大量試劑盒以從細菌中純化質(zhì)粒(例如參看都來自Pharmacia Biotech的EasyPrepTM、FlexiPrepTM;來自Stratagene的StrataCleanTM;和來自Qiagen的QIAprepTM)。隨后進一步操縱經(jīng)分離和純化的質(zhì)粒以產(chǎn)生其它質(zhì)粒,其用于轉(zhuǎn)染細胞或并入相關載體中以感染生物體。典型載體含有轉(zhuǎn)錄和翻譯終止子、轉(zhuǎn)錄和翻譯起始序列以及可用于調(diào)控特定靶核酸表達的啟動子。載體任選包含通用表達盒,其含有至少一個獨立終止子序列、允許表達盒在真核細胞或原核細胞或兩者中復制的序列(例如,穿梭載體)和用于原核系統(tǒng)與脊椎動物系統(tǒng)的選擇標記。載體適用于在原核細胞、真核細胞或優(yōu)選兩者中復制和整合。參看Gillam&Smith,Gene8:81(1979);Roberts等人,Nature.328:731(1987);Schneider,B.等人,Protein Expr.Purif.6435:10(1995);Ausubel,Sambrook,Berger(都同上文)。例如,ATCC(例如由ATCC出版的The ATCC Catalogue of Bacteria and Bacteriophage(1992)Gherna等人(編))提供可用于克隆的細菌和噬菌體的目錄。用于測序、克隆和分子生物學的其它方面的其它基本程序以及基礎理論探討也見于Watson等人(1992)Recombinant DNA第2版Scientific American Books,NY。另外,基本上任何核酸(和幾乎任何標記核酸,無論標準或非標準)都可從多種商業(yè)來源中的任一種定制或標準定購,這些商業(yè)來源諸如Midland Certified Reagent Company(Midland,TX,mcrc.com)、The Great American Gene Company(Ramona,CA,可通過萬維網(wǎng)在genco.com上獲得)、ExpressGen Inc.(Chicago,IL,可通過萬維網(wǎng)在expressgen.com上獲得)、Operon Technologies Inc.(Alameda,CA)和許多其它來源。

      試劑盒

      試劑盒也為本發(fā)明的特征。舉例來說,提供在細胞中產(chǎn)生包含至少一個非天然氨基酸的蛋白質(zhì)的試劑盒,其中所述試劑盒包括含有編碼O-tRNA的多聚核苷酸序列和/或O-tRNA和/或編碼O-RS的多聚核苷酸序列和/或O-RS的容器。在一個實施例中,試劑盒另外包括至少一個非天然氨基酸。在另一實施例中,試劑盒另外包含用于產(chǎn)生蛋白質(zhì)的說明材料。

      實例

      提供以下實例說明但非限制所主張的本發(fā)明。所屬領域技術人員將認識到,在不背離所主張的本發(fā)明的范圍的情況下,可改變多個不重要的參數(shù)。

      實例1:在脊椎動物細胞中產(chǎn)生并入非天然氨基酸的氨?;?tRNA合成酶的方法以及所述氨酰基-tRNA合成酶的組合物

      擴充脊椎動物遺傳密碼以包括具有新穎物理、化學或生物特性的非天然氨基酸,將提供用于分析和控制這些細胞中的蛋白質(zhì)功能的有效工具。為此,描述用于分離氨?;?tRNA合成酶的通用方法,所述氨?;?tRNA合成酶響應釀酒酵母(Saccharomyces cerevisiae,S.cerevisiae)中的琥珀密碼子以高保真度并入非天然氨基酸。所述方法是建立在通過抑制GAL4的DNA結合結構域與轉(zhuǎn)錄活化結構域之間的琥珀密碼子來活化GAL4反應性報告基因HIS3、URA3或LacZ的基礎上。描述用于正選擇活性大腸桿菌酪氨?;?tRNA合成酶(EcTyrRS)變異體的GAL4報告基因的優(yōu)化。還曾利用作為“有毒等位基因(toxic allele)”添加到生長培養(yǎng)基中的小分子,利用URA3報告基因來發(fā)展無活性EcTyrRS變異體的負選擇。重要的是,可對單一細胞且以多種嚴格度執(zhí)行正選擇和負選擇。這可促進從大型突變合成酶文庫中分離出多種氨?;?tRNA合成酶(aaRS)活性。用于分離所需aaRS表現(xiàn)型的方法的功效可通過模型選擇加以證實。

      實例2

      大腸桿菌和嗜熱脂肪芽孢桿菌Tyr tRNA雜合tRNA的構建

      從釀酒酵母中進行的工作已知,大腸桿菌Tyr tRNA/RS對與內(nèi)源性tRNA/RS對正交并且支持非天然氨基酸抑制。然而,在活體內(nèi)于哺乳動物細胞中轉(zhuǎn)錄功能性大腸桿菌tRNATyr的嘗試富有挑戰(zhàn)。為此,關注焦點已轉(zhuǎn)向作為tRNA序列來源的嗜熱脂肪芽孢桿菌,其可支持哺乳動物細胞中非天然氨基酸的抑制。盡管嗜熱脂肪芽孢桿菌tRNA為大腸桿菌tRNATyr合成酶的底物,但仍需要進一步工程改造tRNA以改進tRNA氨?;男?。改進tRNA氨?;瘜倪M抑制效率。tRNA的接受莖(acceptor stem)為tRNA合成酶識別的關鍵決定因素。在本實例中,通過將大腸桿菌與嗜熱脂肪芽孢桿菌tRNATyr的不同結構組件組合來構建雜合tRNA。所述雜合tRNA具有大腸桿菌tRNATyr接受莖,以及D臂、TΨC臂、可變環(huán)和嗜熱脂肪芽孢桿菌tRNATyr的反密碼子莖。具有得自大腸桿菌的接受莖的新雜合tRNA為大腸桿菌tRNATyr合成酶的良好底物。下文的實驗中將展示,當使用新近建立的雜合琥珀抑制tRNA時,獲得改進的琥珀抑制效率。為進行比較,對雜合tRNA與得到所述雜合tRNA的嗜熱脂肪芽孢桿菌tRNATyr加以測試。

      實驗:

      編碼雜合tRNA的質(zhì)粒的構建:

      通過使用以下引物的重疊PCR:

      FTam 73:具有EcoR I和Bgl II位點的正向引物:

      GTACGAATTCCCGAGATCTGGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGACTAGCGCTCCGGTTTTTCTGTGC(SEQ ID NO:91);

      FTam 115:反向引物

      AGTCCGCCGCGTTTAGCCACTTCGCTACCCCACCGACGTGTACGTGTGTCGGCGTCCCCTGAGGTTCAGCACAGAAAAACCGGAGCGC(SEQ ID NO:92);

      Ftam116:第2段的正向引物:

      GTGGCTAAACGCGGCGGACTCTAAATCCGCTCCCTTTGGGTTCGGCGGTTCGAATCCGTCCCCCACCAGACAAGTG(SEQ ID NO:93);

      Ftam117:第2段的反向引物:

      GATGCAAGCTTGATGGATCCGCCATAAGTCATCGGGAGCTGGAGAAAAAAACCGCACTTGTCTGGTGGGGGACGG(SEQ ID NO:94).,

      來構建單拷貝雜合琥珀抑制tRNA表達插入物,其包括5′限制性位點(EcoR I和Bgl II)、人類tRNATyr的5′側接序列

      (GGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGACTAGCGCTCCGGTTTT

      TCTGTGCTGAACCTCAGGGGACGCCGACACACGTACACGTC(SEQ ID NO:89)),、

      缺乏3′-CCA的雜合tRNA琥珀抑制突變體(雜合tRNA的核苷酸序列如下:

      GGUGGGGUAGCGAAGUGGCUAAACGCGGCGGACUCUAAAUCCGCUCCCUUUGGGUUCGGCGGTUCGAAUCCGUCCCCCUCCACCA(SEQ ID NO:87)且編碼所述tRNA的DNA序列如下:

      GGTGGGGTAGCGAAGTGGCTAAACGCGGCGGACTCTAAATCCGCTCCCTTTGGGTTCGGCGGTTCGAATCCGTCCCCCA(SEQ ID NO:88))、人類tRNATyr的3'側接序列(GACAAGTGCGGTTTTTTTCTCCAGCTCCCGATGACTTATGGC(SEQ ID NO:90))和3'限制位點(BamH I和Hind III)。

      將所述插入物接合到pUC19中EcoR I和Hind III位點處。

      利用雜合tRNA的琥珀抑制實驗(圖1):

      將編碼hGH E88琥珀突變體、大腸桿菌tRNA合成酶和單拷貝琥珀抑制嗜熱脂肪芽孢桿菌tRNA或單拷貝琥珀抑制雜合tRNA的質(zhì)粒共轉(zhuǎn)染到CHO K1細胞中。轉(zhuǎn)染后42小時分析hGH的表達。當使用雜合tRNA(hb1)時,琥珀抑制效率相對于當使用嗜熱脂肪芽孢桿菌琥珀抑制tRNA時所獲得的效率增加約30%。

      實例3

      將分子添加到具有非天然氨基酸的蛋白質(zhì)中

      一方面,本發(fā)明提供包含非天然氨基酸的蛋白質(zhì)與其它取代基分子偶聯(lián)的的方法和相關組合物。

      應了解,本文所述的實例和實施例僅出于說明性目的,并且將對所屬領域技術人員提出根據(jù)所述實例和實施例的各種修改或改變,且所述修改和改變都將包括在本申請案的精神和范圍以及隨附權利要求書的范圍內(nèi)。

      盡管已出于清楚和理解的目的相當詳細地描述本發(fā)明,但在閱讀本發(fā)明后所屬領域技術人員將了解,在不偏離本發(fā)明的真實范圍的情況下,可對形式和細節(jié)進行各種修改。舉例來說,上述所有技術和設備可以各種組合使用。本申請案中引用的所有公開案、專利、專利申請案和/或其它文獻都以全文引用的方式并入本文中用于所有目的,所引用的程度就如同將各個別公開案、專利、專利申請案和/或其它文獻個別地以引用的方式并入本文中用于所有目的一般。

      表5

      a這些克隆還含有Asp165Gly突變。

      當前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1