專利名稱::硫肽前體蛋白質(zhì)、編碼該蛋白質(zhì)的基因及其用途的制作方法硫肽前體蛋白質(zhì)、編碼該蛋白質(zhì)的基因及其用途本發(fā)明涉及用于硫肽(thiop印tide)生物合成的前體蛋白質(zhì)、相應(yīng)的結(jié)構(gòu)基因及其用途。本發(fā)明還涉及用于遺傳處理硫肽前體蛋白質(zhì)的方法,或表達(dá)編碼該硫肽前體蛋白質(zhì)的基因以產(chǎn)生硫肽化合物或其衍生物的宿主細(xì)胞。本發(fā)明進(jìn)一步涉及參與硫肽生物合成的基因的克隆和表征及其在硫肽化合物制備中的用途。硫肽是天然的、富含硫的、高度修飾的大環(huán)肽,許多所述硫肽具有有效的抗生素活性。這些復(fù)雜的天然產(chǎn)物根據(jù)抗生素的Berdy化學(xué)分類分為噻唑肽(BerdyJ.‘Recentdevelopmentsofantibioticresearchandclassificationofantibioticsaccordingtochemicalstructure.'AdvApplMicrobiol.1974;18(0):309_406·)并包括硫鏈絲菌肽、諾雪七肽、微球菌素、nocathiacin、amythiamicin、GE2270A等。硫肽共有許多共同結(jié)構(gòu)特征聚集在中心多吡咯結(jié)構(gòu)域中的三元或四元取代的氮雜環(huán),其為由修飾的雜環(huán)殘基(包括噻唑類、唑類和吲哚類)和脫氫氨基酸組成的大環(huán)框架(framework)的一部分。硫肽的該大環(huán)標(biāo)志使得它們與其他噻唑化合物,如博來霉素、桿菌肽、或小菌素B17區(qū)分開來。Hensens首先建議根據(jù)中心雜環(huán)結(jié)構(gòu)域的結(jié)構(gòu)和氧化狀態(tài)對硫肽抗生素進(jìn)行分類(0.D.Hensens禾口G.Albers-Schoenberg.'Totalstructureofthepeptideantibioticcomponentsofthiopeptinby1Hand13CNMRspectroscopy.,TetrahedronLett.1978,3649)。來自CardiffUniversity的MarkBagley和同事的近期綜述已經(jīng)擴(kuò)展了Hensens的分類系統(tǒng),以描述5個不同的中心雜環(huán)結(jié)構(gòu)域四元取代脫氫哌啶或飽和哌啶、二氫咪唑哌啶、三元取代吡啶和四元取代羥基吡啶(Bagley等‘Thiop印tideantibiotics.,ChemRev.2005年2月;105(2):685_714)。盡管具有大量結(jié)構(gòu)同源性,硫肽抗生素的作用(對蛋白質(zhì)合成的抑制)位點(diǎn)和方式可分為兩個功能類結(jié)合稱為Lll結(jié)合結(jié)構(gòu)域的23S核糖體RNA區(qū)域的那些和結(jié)合參與延伸循環(huán)的Ef-Tu蛋白質(zhì)復(fù)合體的那些。經(jīng)常認(rèn)為在1954年首次分離為遠(yuǎn)青鏈霉菌(Streptomycesazureus)次生代謝物的硫鏈絲菌肽是硫肽家族的原型化合物(Donovick等iThiostrepton,anewantibiotic.,AntibiotAnnu.1955-1956;3554-9禾口Bagley等‘硫肽antibiotics.,ChemRev.2005年2月;105(2):685_714)。假定硫肽通過利用稱為非核糖體肽合成酶(NRPS)的大的多酶復(fù)合體的非核糖體方法合成(Mocek等'BiosynthesisofthemodifiedpeptideantibioticthiostreptoninStreptomycesazureusandStreptomyceslaurentii'.J.Am.Chem.Soc.1993,115,7992-8001)。NRPS裝配大環(huán)的實(shí)例是由真菌多孢木霉菌(Tolypocladiuminflatum)產(chǎn)生的免疫抑制肽環(huán)胞菌素。NRPS裝配肽不限于通常見于蛋白質(zhì)的常見的20種L氨基酸。相反,這些酶具有摻入數(shù)百種不常見氨基酸及衍生殘基的更廣泛的所有成分的生物合成能力。Washington大學(xué)的HeinzFloss等人指導(dǎo)的預(yù)實(shí)驗(yàn)揭示了硫肽的確由非核糖體途徑產(chǎn)生。該研究組用抑制核糖體蛋白質(zhì)合成水平的氯霉素處理培養(yǎng)物。然而,硫肽的從頭產(chǎn)生仍然繼續(xù)。當(dāng)用于探測來自各生產(chǎn)生物的基因組DNA的Southern印跡時,來自代表硫鏈絲菌肽或相關(guān)諾雪七肽的氨基酸序列的寡核苷酸不能與任何同源序列雜交(Τ.Μ.Smith,Y.-F.Jiang,H.G.Floss.'ThiopeptideAntibiotics"in"BiotechnologyofAntibiotics"W.R.Strohl,編著,第2版,Marcel-Dekker,NewYork,1997,第393-413頁)。此外,在生成菌株中已經(jīng)鑒定了假定編碼微球菌素合成酶復(fù)合體組件的NRPS基因片段(Carnio等iPyridinylpolythiazoleclasspeptideantibioticmicrococcinPl,secretedbyfoodborneStaphylococcusequorumffS2733,isbiosynthesizednonribosomally.,EurJBiochem.2001年12月;268(24):6390_401·)。然而,至今仍未有硫肽生物合成途徑的出版說明書。因此,需要鑒定參與硫肽生物合成的基因,其將為有效的硫肽制備提供工具并為產(chǎn)生可選的硫肽結(jié)構(gòu)提供可能性。本發(fā)明滿足了該需要并第一次公開了用于硫肽生物合成的染色體編碼骨架(backbone)以及參與硫肽生物合成的核心生物合成酶。1.作為硫肽生物合成起始材料的染色體編碼骨架本發(fā)明人確實(shí)已經(jīng)發(fā)現(xiàn)了這樣的確鑿證據(jù),例如在放線菌物種中染色體編碼骨架是用于硫肽生物合成的起始材料。第一方面,本發(fā)明涉及包含選自以下的氨基酸序列的硫肽前體蛋白質(zhì)(i)SEQIDNO1;(ii)SEQIDNO5;(iii)SEQIDNO:11;和(iv)任何所述氨基酸序列的變體。如本文所用,術(shù)語“硫肽”指根據(jù)抗生素的Berdy’s化學(xué)分類的噻唑肽,與其他噻唑化合物,如博來霉素、桿菌肽、或小菌素B17相反,其特征在于聚集在中心多吡咯結(jié)構(gòu)域中的三元或四元取代氮雜環(huán),其為由修飾的雜環(huán)殘基(包括噻唑類、唑類和吲哚類)和脫氫氨基酸組成的大環(huán)框架的一部分。術(shù)語“硫肽前體蛋白質(zhì)”指可用作體外或體內(nèi)硫肽合成起始材料的基因編碼多肽骨架。優(yōu)選地,所述硫肽前體是細(xì)菌延伸因子Ef-tu的抑制劑的前體。Ef-tu抑制劑描述于例如HoggT,MestersJR禾口HilgenfeldR.('InhibitorymechanismsofantibioticstargetingelongationfactorTu.,CurrProteinPeptSci.2002年2月;3(1)121-31)的綜述中。眾所周知的Ef-tu抑制劑的實(shí)例是GE2270A(如Selva等'AntibioticGE2270A:anovelinhibitorofbacterialproteinsynthesis.I.Isolationandcharacterization.,JAntibiot(Tokyo).1991B;44(7)693-701中定義)、GE37648A(如Stella等‘AntibioticGE37468A:anewinhibitorofbacterialproteinsynthesis.I.Isolationandcharacterization.'JAntibiot(Tokyo).1995^8月;48(8)780-6、Erratum:JAntibiot(Tokyo)1995年12月;48(12):C_3中定義)禾口Amythiamicin(如(‘Novelantibiotics,amythiamicins.,JAntibiot(Tokyo).1994年6月;47(6):668-74,1145-52和1153-9中定義)。新的Ef-tu抑制劑也描述于2007年12月19日提交的國際專利申請?zhí)朠CT/US07/025955中。此類新Ef-tu抑制劑更特異地包括如下表示的通式I到XI的化合物(包括其可藥用鹽,以及其對映異構(gòu)體、立體異構(gòu)體、旋轉(zhuǎn)異構(gòu)體、互變異構(gòu)體、非對映體或外消旋物)<formula>formulaseeoriginaldocumentpage10</formula><formula>formulaseeoriginaldocumentpage11</formula><formula>formulaseeoriginaldocumentpage12</formula>這種前體蛋白的氨基酸序列對硫肽的最終結(jié)構(gòu)至關(guān)重要。如將在下文中詳細(xì)描述的,本發(fā)明的硫肽前體蛋白質(zhì)可用于再生新鑒定的硫肽的骨架或產(chǎn)生已知硫肽的新衍生物,其例如具有改良性質(zhì)。本發(fā)明因此不僅涉及SEQIDNO:1、SEQIDNO5或SEQIDNO11的前體蛋白,也涉及可用于硫肽衍生物生物合成的任何變體。本領(lǐng)域技術(shù)人員將知道怎樣根據(jù)待合成硫肽的氨基酸骨架設(shè)計所述變體。在SEQIDN0:1中,在14氨基酸骨架中發(fā)現(xiàn)的六個半胱氨酸是修飾這些分子的噻唑雜環(huán)的前體。此外,兩個絲氨酸殘基參與吡啶環(huán)系在大環(huán)和側(cè)鏈交界處的形成。在GE2270A分子的硫肽側(cè)鏈中發(fā)現(xiàn)了額外的噁唑啉,并在通式(I)到(XI)的新Ef-tu抑制劑中發(fā)現(xiàn)了分別通過絲氨酸的雜環(huán)化和脫水形成的脫氫丙氨酸殘基。在特定實(shí)施方案中,當(dāng)與原始序列相比時,SEQIDN0:1、SEQIDN05或SEQIDNO11的變體具有不超過1、2、3、4、5、6或10個缺失、插入或取代的氨基酸。取代的氨基酸可以是具有等同功能團(tuán)或不同功能團(tuán)的天然氨基酸或非天然氨基酸。下表1給出了可用于相應(yīng)特定硫肽生物合成的硫肽前體蛋白質(zhì)序列(SEQIDNO1-14)的指示。表1.硫肽氨基酸骨架的一級序列比對。所述比對集中在形成標(biāo)記多取代氮雜環(huán)的兩個不變絲氨酸分子結(jié)合的大環(huán)周圍。硫鏈絲菌肽具有4個氨基酸的額外氨基延伸。<table>tableseeoriginaldocumentpage13</column></row><table>在本申請中使用以下標(biāo)準(zhǔn)密碼字母用于描述任何氨基酸、肽和蛋白質(zhì)序列A,丙氨酸;R,精氨酸;N,天冬酰胺;D,天冬氨酸;C,半胱氨酸;Q,谷氨酰胺;E,谷氨酸;G,甘氨酸;H,組氨酸;I,異亮氨酸;L,亮氨酸;K,賴氨酸;M,甲硫氨酸;F,苯丙氨酸;P,脯氨酸;S,絲氨酸;T,蘇氨酸;W,色氨酸;Y,酪氨酸;V,纈氨酸。更普遍地,在一個特定實(shí)施方案中,氨基酸序列SEQIDNO:1的所述變體具有以下通式SXNCXCXXCCSCSX,其中X可以是任何氨基酸。更優(yōu)選地,SEQIDNO1的所述變體包含以下通式SXiNCX2CX3X4CCSCSX5,其中Xi是C或S,X2是V或F,X3是G或Y,X4是aF,P、I或V并且&是?或S。此類變體的實(shí)例是SEQIDN0:2-4的前體蛋白。在另一特定實(shí)施方案中,氨基酸序列SEQIDNO:5的所述變體包含以下通式SCX2X3CX4CX5X6X7X8,其中Xi是T或V,優(yōu)選T,X2是T或G,優(yōu)選T,X3是C或S,優(yōu)選C,X4是任何氨基酸,優(yōu)選V、I、E或A,X5是任何氨基酸,優(yōu)選T、C、V或A,X6和X7獨(dú)立地是C或S,優(yōu)選C,&是(或S,并且X9是任何非氨基酸殘基,或T或S。此類變體的實(shí)例是SEQIDNO6-10的前體蛋白。在另一特定實(shí)施方案中,氨基酸序列SEQIDNO11的所述變體包含以下通式SCX2SX3X4X5X6SSSSSS,其中Xi是!1或V,優(yōu)選!^是!1或G,優(yōu)選!\&是5、6或六,父4是V、C或4,&是5、1~或々,乂6是(或S。此類變體的實(shí)例是SEQIDNO12-14的前體蛋白。2.編碼硫肽前體蛋白質(zhì)的基因的核酸本發(fā)明還提供編碼硫肽前體蛋白質(zhì)的基因和/或可讀框的核酸。更具體是,本發(fā)明提供包含編碼如上所定義的硫肽前體蛋白質(zhì)的核苷酸序列的核酸。“核酸”指核糖核苷(腺苷、鳥苷、尿苷或胞苷;“RNA分子”)或脫氧核糖核苷(脫氧腺苷、脫氧鳥苷、脫氧胸苷或脫氧胞苷;“DNA分子”)的磷酸酯多聚體形式,或其任何磷酸酯類似物,如單鏈形式或雙鏈螺旋的硫代磷酸酯類和硫代酸酯類。雙鏈DNA-DNA、DNA-RNA和RNA-RNA螺旋(helices)是可能的。術(shù)語核酸,具體而言DNA或RNA分子僅指分子的一級和二級結(jié)構(gòu),并不限于任何特定三級形式。因此,該術(shù)語包括尤其是見于線性(例如限制性片段)或環(huán)形DNA分子、質(zhì)粒和染色體中的雙鏈DNA?!爸亟MDNA分子”是已經(jīng)進(jìn)行分子生物學(xué)操作的DNA分子?!岸嗪塑账帷被颉昂塑账嵝蛄小笔呛怂?,如DNA和RNA中的一系列核苷酸堿基(也稱作“核苷酸”),并表示兩個或更多個核苷酸的任何鏈。核苷酸序列通常攜帶遺傳信息,包括用于產(chǎn)生蛋白質(zhì)和酶的細(xì)胞裝置的信息。這些術(shù)語包括雙鏈或單鏈基因組和cDNA、RNA、任何合成的和遺傳處理的多核苷酸,以及正義和反義多核苷酸(盡管此處僅表示了正義鏈)。這包括單鏈和雙鏈分子,即DNA-DNA、DNA-RNA和RNA-RNA雜合體。這也包括含有修飾堿基,例如硫代尿嘧啶、硫代鳥嘌呤和氟代尿嘧啶的核酸。本文中核酸的側(cè)翼可以是天然調(diào)節(jié)(表達(dá)控制)序列,或可以與包括啟動子、其他核糖體結(jié)合位點(diǎn)序列、調(diào)節(jié)響應(yīng)元件、信號序列等的異源序列連接。也可通過本領(lǐng)域已知的任何手段修飾所述核酸。此類修飾的非限制性實(shí)例包括甲基化、“帽子”、類似物對一個或多個天然核苷酸的取代和核苷酸間修飾,如具有不帶電連接(例如甲基化磷酸酯類、磷酸三酯類、氨基磷酸鹽類、氨基甲酸酯類等)和帶電連接(例如硫代磷酸酯類、二硫代磷酸酯類等)的那些。術(shù)語“基因”,也稱為“結(jié)構(gòu)基因”表示編碼或?qū)?yīng)于包含一個或多個蛋白質(zhì)所有或部分的氨基酸特定序列的DNA序列,并可以包括或可以不包括調(diào)節(jié)DNA序列,如啟動子序列,其決定例如基因表達(dá)的條件。非結(jié)構(gòu)基因的一些基因可以從DNA轉(zhuǎn)錄成RNA,但不翻譯成氨基酸序列。其他基因可以作為結(jié)構(gòu)基因的調(diào)節(jié)物或DNA轉(zhuǎn)錄的調(diào)節(jié)物起作用?!熬幋a序列”或“編碼”表達(dá)產(chǎn)物如RNA、多肽、蛋白質(zhì)或酶的序列,是當(dāng)表達(dá)時產(chǎn)生所述RNA、多肽、蛋白質(zhì)或酶的核苷酸序列,即所述核苷酸序列編碼所述多肽、蛋白質(zhì)或酶的氨基酸序列。蛋白質(zhì)的編碼序列可包括起始密碼子(一般是ATG或GTG)和終止密碼子。當(dāng)RNA聚合酶轉(zhuǎn)錄所述編碼序列成為RNA,尤其是mRNA,并翻譯成所述編碼序列編碼的蛋白質(zhì)時,編碼序列在細(xì)胞中處于表達(dá)控制序列的“控制下”或“有效連接”表達(dá)控制序列。術(shù)語“異源的”指非天然元件的組合。例如,異源DNA指非天然定位于細(xì)胞,或所述細(xì)胞的染色體位點(diǎn)中的DNA。優(yōu)選地,所述異源DNA包括對細(xì)胞外源的基因。例如,本發(fā)明包括包含DNA序列和非DNA序列部分的異源DNA序列的嵌合DNA分子。在該上下文中,所述異源DNA序列指非天然定位于硫肽生物合成基因簇序列中的DNA序列?;蛘?,所述異源DNA序列可以天然定位于其非天然位置處的生物合成基因簇中。異源表達(dá)調(diào)節(jié)元件是與不同基因而非自然界中有效連接的基因有效連接的元件。在本發(fā)明的上下文中,編碼目的蛋白質(zhì)的基因?qū)λ龌虿迦肫渲杏糜诳寺』虮磉_(dá)的載體DNA是異源的,并且其對含有所述基因在其中表達(dá)的該載體的宿主細(xì)胞是異源的。術(shù)語“表達(dá)控制序列”指組合以調(diào)節(jié)編碼序列轉(zhuǎn)錄的啟動子、任何增強(qiáng)子元件或抑制元件(例如復(fù)制起始區(qū))。術(shù)語“表達(dá)”表示允許或引起基因或DNA序列中的信息表現(xiàn)出來,例如通過激活參與相應(yīng)基因或DNA序列轉(zhuǎn)錄和翻譯的細(xì)胞功能來產(chǎn)生蛋白質(zhì)。在細(xì)胞中或由細(xì)胞表達(dá)DNA序列以形成“表達(dá)產(chǎn)物”如蛋白質(zhì)。表達(dá)產(chǎn)物本身,例如所得蛋白質(zhì)也可稱作由細(xì)胞“表達(dá)”。表達(dá)產(chǎn)物的特征可以是細(xì)胞內(nèi)的、細(xì)胞外的或分泌的。術(shù)語“細(xì)胞內(nèi)的”表示在細(xì)胞內(nèi)的某些東西。術(shù)語“細(xì)胞外的”表示細(xì)胞外的某些東西。如果物質(zhì)從細(xì)胞上或細(xì)胞內(nèi)到細(xì)胞外以顯著量出現(xiàn),那么其由細(xì)胞“分泌”。術(shù)語“轉(zhuǎn)化”表示“外源”(即外部的或細(xì)胞外的)基因、DNA或RNA序列引入細(xì)胞中,使得宿主細(xì)胞表達(dá)所述引入基因或序列,以產(chǎn)生期望物質(zhì),通常是所述引入基因或序列編碼的蛋白質(zhì)或酶。所述引入基因或序列也可稱作“克隆”或“外源”基因或序列,可包括調(diào)節(jié)或控制序列,如起始序列、終止序列、啟動子序列、信號序列、分泌序列或細(xì)胞遺傳裝置使用的其他序列。所述基因或序列可包括非功能序列或功能未知的序列。接受并表達(dá)引入DNA或RNA的宿主細(xì)胞已經(jīng)被“轉(zhuǎn)化”并且是“轉(zhuǎn)化體”或“克隆”。引入宿主細(xì)胞的DNA或RNA可以來自任何來源,包括與宿主細(xì)胞相同的屬或種的細(xì)胞,或不同屬或種的細(xì)胞。本發(fā)明人在Ef-tu抑制劑硫肽產(chǎn)生野野村氏菌屬物種的基因組中成功鑒定了小的結(jié)構(gòu)基因,其編碼SEQIDN0:1和SEQIDNO3的整個肽骨架。前體前蛋白原的預(yù)測大小分別是57和49個氨基酸,并分別描述于SEQIDNO19和SEQIDNO20中。然而,存在表明可選翻譯起始位點(diǎn)的許多起始密碼子。所述14氨基酸硫肽前體序列位于C末端。已經(jīng)從如實(shí)施例4中所示的遠(yuǎn)青鏈霉菌ETH28555物種中鑒定了不相關(guān)的硫肽硫鏈絲菌肽的相似結(jié)構(gòu)基因,并且其編碼SEQIDNO:6的整個肽骨架。硫鏈絲菌肽的前體前蛋白原的預(yù)測大小是60個氨基酸并描述于SEQIDNO65中。在一個實(shí)施方案中,本發(fā)明的所述核酸包含編碼SEQIDN0:1的14氨基酸硫肽前體的SEQIDNO:15的核苷酸序列。在另一實(shí)施方案中,本發(fā)明的所述核酸包含編碼SEQIDNO3的14氨基酸硫肽前體的SEQIDN016的核苷酸序列。本發(fā)明還包括編碼SEQIDNO:1、SEQIDNO5和SEQIDNO11的硫肽前體及其任何變體(如表1描述的那些前體變體)的任何核苷酸序列。此類核苷酸序列的實(shí)例描述于SEQIDNO:17和18或SEQIDNO65中,分別編碼SEQIDNO1和SEQIDNO3和SEQIDN06的硫肽前體蛋白質(zhì)。以來自SEQIDNO:15_18的探針或引物開始從已知硫肽產(chǎn)生菌中分離并鑒定本發(fā)明此類核苷酸序列的方法為本領(lǐng)域所熟知,并且該方法的一個實(shí)例示于實(shí)施例4中。例如,可使用編碼14氨基酸前體蛋白質(zhì)的區(qū)域側(cè)翼的引物擴(kuò)增硫肽產(chǎn)生菌株的基因組DNA,并從本文公開的SEQIDNO17或SEQIDNO18進(jìn)行測定。在另一實(shí)施方案中,本發(fā)明的所述核酸包含分別編碼57個氨基酸或49個氨基酸的前蛋白原的SEQIDNO:17或SEQIDNO18的核苷酸序列,或包含至少SEQIDNO:15或SEQIDNO16的其任何片段。還包括的是所述核酸的修飾。此類修飾包括,例如本領(lǐng)域已知的標(biāo)記、甲基化和簡并核苷酸對一個或多個天然核苷酸的取代。這些修飾可用于增加所選表達(dá)系統(tǒng)中的表達(dá)、產(chǎn)量和/或提高純化,或用于另一期望目的。在另一實(shí)施方案中,本發(fā)明的核酸有效連接異源轉(zhuǎn)錄和翻譯控制序列。更優(yōu)選,其為表達(dá)載體。如本文使用,術(shù)語“表達(dá)載體”指載體,通過所述載體可以將核酸弓丨入宿主細(xì)胞,導(dǎo)致引入序列的表達(dá)。在一個實(shí)施方案中,載體包含啟動子和一個或多個控制元件(例如增強(qiáng)子元件),其對引入的核酸是異源的,但被宿主細(xì)胞識別和使用。在另一實(shí)施方案中,引入載體的序列保留由宿主細(xì)胞識別并表達(dá)的其天然啟動子。在一個實(shí)施方案中,與本發(fā)明相容的載體是穿梭載體PSET152、p0J436、pOJ446(Bierman等‘PlasmidcloningvectorsfortheconjugaltransferofDNAfromEscherichiacolitoStreptomycesspp.'Gene.1992¥7月1日;116(1)43-9),pHMlla(Motamedi^'IntegrativevectorsforheterologousgeneexpressioninStreptomycesspp.,Gene.1995年7月4日;160(1)25-31)和pIJ8600(Sun等‘GreenfluorescentproteinasareporterforspatialandtemporalgeneexpressioninStreptomycescoelicolorA3(2).'Microbiology.1999年9月;145(Pt9):2221_7)及其衍生物。在另一實(shí)施方案中,所述載體是粘粒?!皢幼印被颉皢幼有蛄小笔窃诩?xì)胞中能夠結(jié)合RNA聚合酶并起始下游(3'方向)編碼序列轉(zhuǎn)錄的DNA調(diào)節(jié)區(qū)域。為定義本發(fā)明的目的,所述啟動子序列在其3'末端結(jié)合轉(zhuǎn)錄起始位點(diǎn),并向上游(5'方向)延伸以包括起始高于背景的可檢測水平的轉(zhuǎn)錄必需的最小數(shù)量的堿基或元件。在啟動子序列內(nèi)將發(fā)現(xiàn)轉(zhuǎn)錄起始位點(diǎn)(例如通過用核酸酶S1作圖方便地進(jìn)行定義),以及負(fù)責(zé)結(jié)合RNA聚合酶的蛋白質(zhì)結(jié)合結(jié)構(gòu)域(共有序列)。所述啟動子可有效連接其他表達(dá)控制序列,包括增強(qiáng)子和阻抑物序列。載體的常見類型是“質(zhì)粒”,其一般是雙鏈DNA(其可以是環(huán)形)的自攜分子,通常是細(xì)菌來源,其可容易地接受額外的(外源的)DNA并且可容易地被引入合適的宿主細(xì)胞中。質(zhì)粒載體經(jīng)常含有編碼DNA和啟動子DNA,并具有適合于插入外源DNA的一個或多個限制性位點(diǎn)。重組克隆載體將經(jīng)常包括用于克隆或表達(dá)的一個或多個復(fù)制系統(tǒng)、用于在宿主中選擇的一個或多個標(biāo)記,例如抗生素抗性,以及一個或多個表達(dá)盒??墒褂帽绢I(lǐng)域內(nèi)的常規(guī)分子生物學(xué)和重組DNA技術(shù)產(chǎn)生載體構(gòu)建體。在文獻(xiàn)中詳細(xì)解釋了此類技術(shù)。參閱例如Sambrook,F(xiàn)ritsch&Maniatis,MolecularCloning:ALaboratoryManual,第二片反(1989)ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.(^^I^J"Sambrook1989");DNACloning:APracticalApproach,第I和II卷(D.N.Glover編著1985);F.M.Ausubel等(編著),CurrentProtocolsinMolecularBiology,Johnffiley&Sons,Inc.(1994)。或者,可使用建構(gòu)生物學(xué)公司如CodonDevices(Cambridge,MA,USA;http://www,codondevices.com/)或BlueHeronBiotechnology(Bothwel1,WA,USA;http://www.blueheronbio.com/)DNA地或完全地合成載體構(gòu)建體。3.用于從硫肽前體產(chǎn)生核心大環(huán)的核心生物合成酶來自兩種不同硫肽產(chǎn)生菌株的兩個硫肽生物合成基因簇的表征允許本發(fā)明人鑒定兩種菌株中的高度保守基因,因此提示這些基因編碼核心硫肽分子從硫肽前體進(jìn)行合成需要的酶。圖2和圖3顯示了從兩種不同硫肽產(chǎn)生菌株表征的生物合成基因簇的可讀框(0RF)的位置。另一方面,本發(fā)明涉及用于硫肽生物合成的多肽,其包含選自以下的氨基酸序列(i)SEQIDNO:23_34的任一個;禾口(ii)(i)中列出的氨基酸序列的變體,當(dāng)與(i)中列出的相應(yīng)的野生型氨基酸序列相比時,其具有不超過1、2、3、4、5、6或10個缺失、插入或取代氨基酸。這些多肽可在體外或體內(nèi)用于進(jìn)行一個或多個反應(yīng)步驟,所述反應(yīng)步驟使用硫肽前體蛋白質(zhì)作為硫肽分子合成的起始材料。變體多肽可保留與野生型相應(yīng)序列基本上相同的催化活性,或具有提高的或改善的催化活性。僅為便于閱讀,在下文中將這些多肽稱作“核心生物合成酶”。下表2描述了可用于硫肽生物合成的核心生物合成酶(SEQIDN0:23_34)的實(shí)例及其在生物合成途徑中的可能功能。所述可能功能進(jìn)一步描述于下文實(shí)施例5.1和5.2中。表2用于從硫肽前體蛋白質(zhì)開始生物合成硫肽的核心酶的實(shí)例<table>tableseeoriginaldocumentpage18</column></row><table><table>tableseeoriginaldocumentpage18</column></row><table>4.編碼核心生物合成酶的基因本發(fā)明進(jìn)一步提供編碼核心生物合成酶的基因和/或可讀框的核酸。更特別地,本發(fā)明提供包含編碼如上定義的任何一種核心生物合成酶的核苷酸序列的核酸。本發(fā)明人在Ef-tu抑制劑硫肽產(chǎn)生野野村氏菌屬物種的基因組中成功鑒定了結(jié)構(gòu)基因,其可能編碼相應(yīng)的Ef-tu抑制劑進(jìn)行生物合成的必需酶。在一個實(shí)施方案中,編碼用于Ef-tu抑制劑生物合成的酶的所述核酸包含選自如表2中所述SEQIDNO62的基因組片段的0RF9、0RF10、0RF11、0RF12、0RF13和0RF15的核酸。在另一實(shí)施方案中,所述本發(fā)明核酸包含選自如表2中所述SEQIDN0:63的基因組片段的0RF6、0RF7、0RF8、0RF9、0RF10和0RF11。在表2中也報道了相應(yīng)的基因組片段(從5’到3’)中各基因的0RF(可讀框)的核苷酸位置(坐標(biāo))。從已知的硫肽產(chǎn)生菌株并使用來自SEQIDNO35-46的探針或引物分離并鑒定本發(fā)明這類核苷酸序列的方法為本領(lǐng)域所熟知。例如,可使用編碼各基因保守區(qū)的區(qū)域側(cè)翼的引物擴(kuò)增硫肽產(chǎn)生菌株的基因組DNA,并從公開的核苷酸序列進(jìn)行測定。也包括的是所述核酸的修飾。此類修飾包括,例如,本領(lǐng)域已知的標(biāo)記、甲基化,和簡并核苷酸對一個或多個天然核苷酸的取代。這些修飾可用于增加在所選表達(dá)系統(tǒng)中的表達(dá)、產(chǎn)量,和/或提高純化,或用于另一期望目的。在一個實(shí)施方案中,本發(fā)明的核酸有效連接異源轉(zhuǎn)錄和翻譯控制序列。更優(yōu)選地,其為適合于在宿主細(xì)胞中表達(dá)全部或部分核心生物合成酶的表達(dá)載體。5.硫肽前體蛋白質(zhì)及相應(yīng)硫肽的產(chǎn)生染色體編碼骨架的測定以及因此本發(fā)明人進(jìn)行硫肽生物合成的核糖體途徑允許本領(lǐng)域的一名普通技術(shù)人員在一個實(shí)施方案中克隆并表達(dá)硫肽生物合成途徑,即生物合成基因簇,并因此在修飾的宿主細(xì)胞或異源生物中產(chǎn)生硫肽化合物。本發(fā)明還允許產(chǎn)生待在異源宿主細(xì)胞,即另一菌株而非天然產(chǎn)生菌株中表達(dá)的硫肽前體。盡管如本文所述,實(shí)施例說明了細(xì)菌菌株的用途,可使用任何生物或表達(dá)系統(tǒng)。生物的選擇取決于技術(shù)人員的需要。例如,可使用易于遺傳操作的菌株,以利于硫肽化合物的修飾和產(chǎn)生。因此,另一方面,本發(fā)明涉及包含如上所述編碼硫肽前體蛋白質(zhì)和/或核心生物合成酶的一個或多個核酸的宿主細(xì)胞,其中所述核酸并非天然發(fā)現(xiàn)于所述宿主細(xì)胞的基因組中和/或所述宿主細(xì)胞并不天然產(chǎn)生相應(yīng)的硫肽?;蛘?,可能通過提供包含適當(dāng)量的如上所述硫肽前體蛋白質(zhì)的培養(yǎng)基,并在所述培養(yǎng)基中培養(yǎng)微生物來完成硫肽或硫肽衍生物的制備,其中所述微生物還包含硫肽生物合成需要的其他基因,例如編碼核心生物合成酶的基因。如本文使用,術(shù)語“宿主細(xì)胞”或“微生物”表示以任何方式選擇、修飾、轉(zhuǎn)化、培養(yǎng)或使用或操作用于通過細(xì)胞產(chǎn)生硫肽前體或硫肽及其衍生物的任何生物的任何細(xì)胞。例如,宿主細(xì)胞可以是進(jìn)行處理以表達(dá)特定基因、DNA或RNA序列、蛋白質(zhì)或酶的一個細(xì)胞。宿主細(xì)胞可進(jìn)一步用于篩選或下文所述的其他測定??稍隗w外或非人動物(例如轉(zhuǎn)基因動物或瞬時轉(zhuǎn)染動物)中一個或多個細(xì)胞中培養(yǎng)宿主細(xì)胞。宿主細(xì)胞或微生物本身可選自任何生物體,包括原核(例如細(xì)菌)細(xì)胞、植物細(xì)胞,和真核細(xì)胞,所述真核細(xì)胞包括昆蟲細(xì)胞、酵母細(xì)胞和哺乳動物細(xì)胞。適當(dāng)宿主細(xì)胞的代表性實(shí)例包括細(xì)菌細(xì)胞,如大腸桿菌(E.coli)、鏈霉菌(Str印tomyces)和枯草芽孢桿菌(Bacillussubtilis)細(xì)胞;真菌細(xì)胞,如酵母細(xì)胞,如畢赤酵母(Pichia)或釀酒酵母(Saccharomyces)細(xì)胞,絲狀真菌如木霉(Trichoderma)或曲霉細(xì)胞(Aspergillus);和昆蟲細(xì)胞如果蠅(DrOSOphila)S2和SpodopteraSf9細(xì)胞。優(yōu)選地,所述宿主細(xì)胞選自已知合成硫肽衍生物或被描述對所述硫肽具有抗性的宿主細(xì)胞,如Str印tomycesramocissimus禾口天藍(lán)色鏈霉菌(Streptomycescoelicolor)(01sthoorn-Tie1eman等'ElongationfactorTu3(EF-Tu3)fromthekirromycinproducerStreptomycesramocissimusisresistanttothreeclassesofEF-Tu-specificinhibitors.,JBacterid.2007年5月;189(9):3581-90.)。在一些實(shí)施方案中,所述宿主細(xì)胞選自針對硫肽提供抗性的菌株。為菌株提供抗性的方法為本領(lǐng)域所熟知[KieserT,BibbMJ,ButtnerMJ,ChaterKF,HopwoodD.PracticalStreptomycesGenetics.JohnInnesFoundation,Norwich(2000)]并且在下文實(shí)施例中給出了該方法的實(shí)例。在制備方法的一些實(shí)施方案中,所述宿主細(xì)胞還包含硫肽生物合成需要的其他基因。生物合成需要的其他基因可包括例如編碼如上述核心生物合成酶的一個或多個基因。所述宿主細(xì)胞例如選自野野村氏菌屬物種(Nonomuraeaap.)、游動雙孢菌屬物種(Planobisporasp.)、擬無枝酸菌屬物種(Amycolatopsisp.)和鏈霉素屬物種(Str印tomycessp.)。本文包括的特定宿主細(xì)胞包括,但不限于鏈?包囊菌亞目(Streptosporangineae)鏈孢子囊菌(actinomycete)的生物,包括諾卡(氏)土壤菌禾斗(Nocardiopsaceae)、鏈孢囊菌禾斗(Streptosporangiaceae)禾口高溫單孢菌禾斗(Thermomonosporaceae),其優(yōu)選禾中包括Acrocarpospora、馬杜拉放線菌屬(Actinomadura)、Herbidospora、小雙孢菌屬(Microbispora)、小四孢菌屬(Microtetraspora)、諾卡(氏)土壤菌屬(Nocardiopsis)、里予野村氏菌((Nonomuriasic,由Chiba等(1999)校正為野野村氏菌)ZhenshuiZhang,YueWang和JishengRuan在theInternationalJournalofSystematicBacteriology(1998),48,411-422)中報道的重新分類屬)、游動雙孢菌屬(Planobispora)、游動單孢菌屬(Planomonospora)、Planopolyspora、Planotetraspora胃屬(Streptosporangium)M胃@的i,B*f述術(shù)語旨在包括含有產(chǎn)生硫肽化合物必需的遺傳信息的所有生物。該宿主細(xì)胞的實(shí)例包括在2006年11月30日保藏的野野村氏菌微生物菌株Bp3714-39,保藏號為第德意志微生物保藏中心DSM18831號。用于蛋白質(zhì)如本發(fā)明硫肽前體蛋白質(zhì)的合適產(chǎn)生技術(shù)為本領(lǐng)域技術(shù)人員所熟知。參閱例如Sambrook等,MolecularCloning:ALaboratoryManual,ColdSpringHarborPress(ColdSpringHarbor,N.Y.)??墒褂枚喾N技術(shù)容易地產(chǎn)生本文提供的任何氨基酸序列的序列。這些和其他合適的產(chǎn)生方法為本領(lǐng)域技術(shù)人員所知。一方面,通過在所選宿主細(xì)胞中表達(dá)一個或多個0RF或基因產(chǎn)生本發(fā)明的氨基酸序列。本發(fā)明因此涉及用于產(chǎn)生硫肽前體蛋白質(zhì)的方法,所述方法包括步驟在適合于產(chǎn)生所述硫肽前體蛋白質(zhì)的條件下培養(yǎng)能夠表達(dá)編碼如上述硫肽前體蛋白質(zhì)的核酸,和任選地,編碼核心生物合成酶的一個或多個核酸的宿主細(xì)胞。在該方法中,所述宿主細(xì)胞并非所述硫肽前體蛋白質(zhì)的天然產(chǎn)生菌株,或當(dāng)所述宿主細(xì)胞是所述硫肽前體蛋白質(zhì)的天然產(chǎn)生菌株時,編碼硫肽前體蛋白質(zhì)的所述核酸是重組核酸或異源核酸。根據(jù)所用的宿主細(xì)胞,可通過所述宿主細(xì)胞從硫肽前體完成硫肽化合物生物合成。為此目的,本領(lǐng)域的技術(shù)人員可以使用天然合成硫肽前體蛋白質(zhì)進(jìn)行翻譯后修飾需要的酶的宿主細(xì)胞,或在產(chǎn)生菌株中引入硫肽生物合成進(jìn)行翻譯后修飾需要的所述基因。在一個特定實(shí)施方案中,上文定義的方法還包括分離基本上純形式的所述硫肽前體或硫肽化合物。在一個特定實(shí)施方案中,本發(fā)明涉及本發(fā)明宿主細(xì)胞用于產(chǎn)生硫肽化合物的用途,所述硫肽化合物選自GE2270A、GE37648A、Amythiamicin和如上述通式I到XI中表示的新Ef-tu抑制劑、微球菌素、硫鏈絲菌肽、諾雪七肽、高硫青霉素、thiocins,nocathiacins、伯爾尼霉素、A10255B禾口radamycin。一方面,本發(fā)明提供產(chǎn)生硫肽衍生物的方法,其包括i)通過在所述宿主細(xì)胞中基因表達(dá)編碼所述改變的硫肽前體序列,在宿主細(xì)胞中合成改變的硫肽前體,ii)從所述改變的硫肽前體合成所述硫肽衍生物;和/或iii)通過一種或更多種核心生物合成酶修飾所述改變的硫肽前體。如本文使用,“改變的硫肽前體”是非天然發(fā)現(xiàn)于產(chǎn)生所述硫肽前體的菌株,即產(chǎn)生菌中的硫肽前體。用于合成改變的硫肽前體的方法進(jìn)一步描述于下文中。優(yōu)選地,所述改變的硫肽衍生物前體是如上所述的SEQIDNOSEQIDNO:5或SEQIDN0:11的變體。步驟ii)在體外,即宿主細(xì)胞外;或在與步驟i)相同的宿主細(xì)胞中體內(nèi)進(jìn)行。在與步驟i)相同的宿主細(xì)胞中,通過所述宿主細(xì)胞天然地或從重組DNA合成一種或更多種核心生物合成酶。在產(chǎn)生硫肽衍生物的方法中,使用例如旋轉(zhuǎn)振蕩器或攪拌釜發(fā)酵罐在有氧條件下溫育接種本發(fā)明宿主細(xì)胞的培養(yǎng)基。在溫育過程中通過向接種的培養(yǎng)基注射空氣、氧氣或適當(dāng)?shù)臍怏w混合物完成通氣。一旦已經(jīng)積累足夠量的硫肽衍生物,就以常規(guī)且平常的方式,例如通過萃取和層析方法、沉淀或結(jié)晶、和/或本文公開的方式從培養(yǎng)物中濃縮并分離它們。作為萃取的實(shí)例,培養(yǎng)物可與合適的有機(jī)溶劑如正丁醇、乙酸乙酯、環(huán)己烷、正己烷、甲苯、乙酸正丁酯或4-甲基-2-亞硝酸異戊酯混和并攪拌,可在減壓情況下通過去除溶劑回收有機(jī)層中的硫肽衍生物??扇芜x地用例如水、乙醇、甲醇或其混合物重新溶解所得殘余,并用合適的有機(jī)溶劑如己烷、四氯化碳、氯乙烯、二氯甲烷或其混合物重新萃取。去除溶劑后,例如通過層析方法進(jìn)一步純化化合物。作為層析的實(shí)例,可應(yīng)用固定相如硅膠或氧化鋁,并具有有機(jī)洗脫溶劑或其混合物,包括醚、酮、酯、鹵代烴或鹵代醇;或應(yīng)用反相層析,其基于具有多種功能基團(tuán)的修飾的硅膠,并用有機(jī)溶劑或其水性混合物,像乙睛、甲醇或不同PH的四氫呋喃洗脫。另一實(shí)例是例如固體-液體或液體-液體模式的分配層析。也可應(yīng)用例如使用S印hadexLH-20(Sigma-AldriCh)并用不同溶劑,優(yōu)選用醇洗脫的分子排阻層析。因?yàn)樵诒绢I(lǐng)域比較常見,可通過多種分析方法,包括生物測定、TLC、HPLC或其組合并應(yīng)用不同檢測方法(對TLC通常用UV燈、碘吸入劑或噴霧顯色試劑,對HPLC通常用UV燈、質(zhì)量靈敏的或光散射方法)監(jiān)測產(chǎn)生以及回收和純化過程。例如,通過使用具有功能化硅膠的反相柱并應(yīng)用特定PH下極性水可混和溶劑和水的線性梯度混合物的洗脫劑,和利用不同波長UV燈和質(zhì)量靈敏監(jiān)測器的檢測方法表示HPLC技術(shù)。所得純化的化合物不含細(xì)胞和細(xì)胞物質(zhì)、副產(chǎn)物、試劑和其他外來物質(zhì),必要時允許處理并配制化合物用于實(shí)驗(yàn)室和/或臨床目的。優(yōu)選用于本發(fā)明的化合物的純度具有以重量計高于80%的純度;更優(yōu)選地以重量計至少90%,甚至更優(yōu)選以重量計高于95%;甚至更優(yōu)選以重量計至少99%。在一個實(shí)施方案中,本發(fā)明提供含有本發(fā)明化合物的組合物,不管產(chǎn)生多少化合物。宿主細(xì)胞生物合成的化合物可任選地進(jìn)行隨機(jī)和/或定向化學(xué)修飾,以形成是衍生物或結(jié)構(gòu)類似物的化合物。可使用本領(lǐng)域已知的方法和本文描述的方法任選地修飾所述化合物。6.能夠產(chǎn)生硫肽前體蛋白質(zhì)用于硫肽衍生物產(chǎn)生的突變體微生物根據(jù)本發(fā)明的教導(dǎo),現(xiàn)在可以遺傳處理能夠產(chǎn)生硫肽前體蛋白質(zhì)的微生物,例如目的在于提高硫肽產(chǎn)生或調(diào)整硫肽結(jié)構(gòu)。因此,在其他方面,本發(fā)明提供突變體微生物,其中所述突變體微生物在編碼硫肽前體蛋白質(zhì)的基因中和/或在編碼核心生物合成酶的一個或多個基因中具有突變。所述突變可以是單個或多個核苷酸缺失、插入或取代。其也可以是編碼所述硫肽前體蛋白質(zhì)的基因片段或完整基因的缺失。優(yōu)選地,所述突變體微生物與相應(yīng)的野生型微生物相比時,不再表達(dá)編碼本發(fā)明硫肽前體蛋白質(zhì)的基因。優(yōu)選地,為了避免極化影響,所述突變是編碼所述硫肽前體蛋白質(zhì)的基因內(nèi)的框內(nèi)缺失。所述突變體生物是例如鏈孢囊菌亞目鏈孢子囊菌的生物,包括諾卡(氏)土壤菌科、鏈孢囊菌科和高溫單孢菌科,其優(yōu)選種包括Acrocarpospora、馬杜拉放線菌屬、Herbidospora、小雙孢菌屬、小四孢菌屬、諾卡(氏)土壤菌屬、野野村氏菌((Nonomuriasic,由Chiba等(1999)校正為野野村氏菌)ZhenshuiZhang,YueWang和JishengRuan在theInternationalJournalofSystematicBacteriology(1998),48,411-422)中艮道的重新分類屬)、游動雙孢菌屬、游動單孢菌屬、Planopolyspora、Planotetraspora或鏈孢囊菌屬。在特定實(shí)施方案中,所述突變體微生物是野野村氏菌屬物種,例如野野村氏菌微生物菌株Bp3714-39,其于2006年11月30日保藏,保藏號為DSM18831,并且所述突變是包含SEQIDNO15或SEQIDNO16的基因的破壞,例如包含SEQIDNO17或SEQIDNO18的基因的突變。在另一特定實(shí)施方案中,可以用編碼如上述任何硫肽前體蛋白質(zhì)的核酸進(jìn)一步轉(zhuǎn)化本發(fā)明的突變體微生物。該方法允許提供能夠從任何硫肽前體蛋白質(zhì),包括如上述SEQIDNO=USEQIDN05或SEQIDNO:11的變體生物合成硫肽的微生物。在另一實(shí)施方案中,所述突變體微生物還天然或重組表達(dá)至少一個或多個編碼核心生物合成酶的基因,例如編碼選自SEQIDN0:23-34的多肽的一個或多個基因。在一個實(shí)施方案中,所述突變體微生物天然或重組表達(dá)至少編碼SEQIDN0:23-28的多肽的基因。在另一實(shí)施方案中,所述突變體微生物天然或重組表達(dá)至少編碼SEQIDNO35-46的多肽的基因。7.篩選產(chǎn)生新硫肽化合物的新菌株本發(fā)明人鑒定的基因可進(jìn)一步用作鑒定能夠產(chǎn)生硫肽衍生物的其他微生物的工具。例如,本發(fā)明涉及允許鑒定具有與(i)SEQIDN0:17或SEQIDNO:18的基因并更優(yōu)選SEQIDN0:15或SEQIDN0:16的片段,或(ii)SEQIDNO:35_46任一個中定義的核心基因基本類似的基因的細(xì)胞的任意方法。在特定實(shí)施方案中,如通過序列比較算法,如BLAST、FASTA,DNAStrider等測定,當(dāng)至少約80%,并最優(yōu)選至少約90%或95%的核苷酸在DNA序列的確定長度內(nèi)匹配時,則兩條DNA序列“基本同源”或“基本類似”。該序列的實(shí)例是本發(fā)明特定基因的等位基因或物種變體。通過使用可從序列數(shù)據(jù)庫中獲得的標(biāo)準(zhǔn)軟件比較,或在例如為特定系統(tǒng)規(guī)定的嚴(yán)格條件下的Southern雜交實(shí)驗(yàn)中鑒定基本同源的序列。在核酸序列的上下文中,術(shù)語“序列同一性”“序列同一性百分比”或“相同性百分比”指當(dāng)比對最大相似性時兩條序列中的相同殘基。序列同一性比較的長度可以在基因組全長范圍內(nèi),期望在基因編碼序列的全長或至少約500到5000個核苷酸的片段范圍內(nèi)。然而,也期望例如至少約9個核苷酸,一般至少約20到24個核苷酸、至少約28到32個核苷酸、至少約36或更多個核苷酸的更小片段的同一性。類似地,可容易地測定蛋白質(zhì)全長或其片段范圍內(nèi)的氨基酸序列的“百分之序列同一性”。適當(dāng)時,片段長度為至少約8個氨基酸,更優(yōu)選至少約14個氨基酸,并可高達(dá)約700個氨基酸。合適片段的實(shí)例如下文所述。在一個實(shí)施方案中,鑒定能夠產(chǎn)生硫肽衍生物的方法包括以下步驟⑴將來自分離細(xì)胞的基因組DNA或RNA與SEQIDNO15或SEQIDNO16或其特異片段的核酸探針溫育,用于探針與同源DNA區(qū)域的特異雜交;并(ii)鑒定包含與步驟(i)的所述探針特異性雜交的基因組DNA區(qū)域或RNA的細(xì)胞。當(dāng)單鏈形式的核酸分子可以與其他核酸分子在溫度和溶液離子強(qiáng)度的適當(dāng)條件下退火時,核酸分子與另一核酸分子如cDNA、基因組DNA或RNA“特異性雜交”(參I^lSambrookMolecularCloning:ALaboratoryManual,^Hjx(1989)ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.(本文為"Sambrook等,1989")。溫度和離子強(qiáng)度的狀況決定雜交的“嚴(yán)格性”。為了對同源核酸進(jìn)行初篩,可使用對應(yīng)Tm(解鏈溫度)55°C的低嚴(yán)格雜交條件,例如5XSSC、0.1%SDS,0.25%奶,并且沒有甲酰胺;或30%甲酰胺、5XSSC、0.5%SDS)。中等嚴(yán)格的雜交條件對應(yīng)于更高的Tm,例如40%甲酰胺、5X或6XSCC。高嚴(yán)格雜交條件對應(yīng)于最高的Tm,例如50%甲酰胺、5X或6XSCC。SCC是0.15MNaCl、0.015M檸檬酸鈉。雜交需要兩條核酸包含互補(bǔ)序列,盡管根據(jù)雜交的嚴(yán)格性,兩個堿基之間的錯配是可能的。用于雜交核酸的適當(dāng)嚴(yán)格性取決于本領(lǐng)域熟知的變量核酸的長度和互補(bǔ)的程度。兩條核苷酸序列之間的相似性或同源性的程度越高,具有這些序列的核酸的雜交的Tm值越大。核酸雜交的相對穩(wěn)定性(對應(yīng)于更高的Tm)以以下順序降低RNARNA、DNARNA、DNA:DNA。對于長度大于100個核苷酸的雜合體,衍生了用于計算Tm的方程式(參閱Sambrook等,上文,9.50-9.51)。對于更短核酸,即寡核苷酸的雜交,錯配的位置變得更重要,并且寡核苷酸的長度決定了它的特異性(參閱Sambrook等,上文,11.7-11.8)。雜交核酸的最小長度是至少約10個核苷酸;優(yōu)選至少約15個核苷酸;并更優(yōu)選所述長度是至少約20個核苷酸。在特定實(shí)施方案中,使用標(biāo)準(zhǔn)的雜交條件。術(shù)語“標(biāo)準(zhǔn)雜交條件”指55°C的Tm,并利用如上文闡明的條件。在優(yōu)選實(shí)施方案中,所述Tm是60°C;在更優(yōu)選的實(shí)施方案中,所述Tm是65°C。在特定實(shí)施方案中,使用“高嚴(yán)格條件”。用于寡核苷酸(例如寡核苷酸探針或引物)的合適的雜交條件通常與全長核酸(例如全長cDNA)多少有些不同,因?yàn)楣押塑账峋哂懈偷慕怄湝囟取R驗(yàn)楣押塑账岬慕怄湝囟葘⑷Q于所涉及的寡核苷酸序列的長度,所以合適的雜交溫度將根據(jù)所用的寡核苷酸分子不同而不同。示例性溫度可以是37°C(對于14堿基的寡核苷酸)、48°C(對于17堿基寡核苷酸)、55°C(對于20堿基的寡核苷酸)和60°C(對于23堿基的寡核苷酸)。用于寡核苷酸的示例性合適的雜交條件包括在6XSSC/0.05%磷酸鈉中洗滌,或提供等同程度雜交的其他條件。在本方法的一個優(yōu)選實(shí)施方案中,設(shè)計對編碼硫肽前體的基因特異的寡核苷酸并用于鑒定能夠產(chǎn)生硫肽化合物的新細(xì)胞。此類寡核苷酸可用于編碼硫肽前體蛋白質(zhì)的基因片段的PCR擴(kuò)增。優(yōu)選地,篩選更低等的真核細(xì)胞,并更優(yōu)選來自放線菌類的細(xì)胞。8.編碼硫肽前體蛋白質(zhì)的基因的遺傳操作和用于篩選新硫肽衍生物的用途在另一實(shí)施方案中,本發(fā)明提供修飾編碼硫肽前體蛋白質(zhì)的基因和/或可讀框的一個或多個核苷酸序列的方法。例如,此類修飾或改變可用于在所選表達(dá)系統(tǒng)中提高表達(dá)或產(chǎn)生新硫肽衍生物的目的。可進(jìn)行其他改變以消減、修飾或增強(qiáng)硫肽化合物的功能,包括提高抗生素功能或減少非期望的性質(zhì)。一方面,從修飾編碼硫肽前體蛋白質(zhì)的核酸序列完成改變的硫肽前體的合成。在一個實(shí)施方案中,改變的核酸序列在所選宿主細(xì)胞中可通過合適的載體向如上述異源宿主細(xì)胞提供,并用于表達(dá)相應(yīng)產(chǎn)物?;蛘撸芍苯釉诋a(chǎn)生硫肽的菌株攜帶的天然基因中例如通過所述菌株的遺傳操作進(jìn)行所述改變。本發(fā)明包括改變編碼本發(fā)明前體蛋白的任何核酸序列的任何方法。更具體地是,本發(fā)明包括在本發(fā)明蛋白質(zhì)中插入氨基酸、缺失氨基酸或取代氨基酸的任何方法??稍诤怂崴缴线M(jìn)行修飾。通過標(biāo)準(zhǔn)技術(shù)進(jìn)行這些修飾并為本領(lǐng)域所熟知。因此,本發(fā)明提供方法,以產(chǎn)生編碼硫肽衍生物的前體的核酸,所述方法包括步驟對各核酸,通過在所述序列(其編碼SEQIDNO1-14中任意序列)的至少一個密碼子中進(jìn)行核苷酸取代,產(chǎn)生具有改變核苷酸序列的多個核酸。此類核酸文庫可有利地用于篩選新的硫肽衍生物,例如具有改善性質(zhì)的Ef-tu抑制劑。改變的核酸或核酸文庫然后可用于轉(zhuǎn)化宿主細(xì)胞用于如上所述的硫肽產(chǎn)生。優(yōu)選,核酸文庫的各核酸具有單個核苷酸取代,使得與野生型相應(yīng)序列相比時,編碼SEQIDNO:1-14任意序列的僅一個密碼子突變。產(chǎn)生位點(diǎn)定向誘變或核酸文庫的方法為本領(lǐng)域所熟知并例如描述于Biotechniques出版的Hogrefe等的文章中(‘CreatingrandomizedaminoacidlibrarieswiththeQuikChangeMultiSite-DirectedMutagenesisKit.,2002年11月;33(5):1158_60,1162,1164-5)。在一個特定實(shí)施方案中,所述核苷酸取代在編碼SEQIDNO:1_4任意序列的位置2、5、7、8、14的氨基酸殘基的一個或多個密碼子中進(jìn)行。優(yōu)選地,宿主細(xì)胞能夠合成硫肽化合物,即還包含硫肽生物合成所需的其他基因。例如,硫肽生物合成所需的其他基因可包含編碼選自SEQIDNO23-34的多肽的一個或多個基因。更優(yōu)選地,改變的核酸與表達(dá)載體一起進(jìn)行轉(zhuǎn)化,因此轉(zhuǎn)化后從所述表達(dá)載體合成相應(yīng)的硫肽前體蛋白質(zhì)。所得表達(dá)文庫可用作篩選新硫肽衍生物,例如新Ef-tu抑制劑的工具。9.特定生物合成基因的克隆當(dāng)對來自產(chǎn)生不同硫肽化合物的兩菌株的生物合成基因簇進(jìn)行表征時,本發(fā)明人鑒定了很可能參與硫肽生物合成但卻是菌株特異性的0RF。因此提出這些基因很可能編碼特定多肽,主要是參與核心硫肽結(jié)構(gòu)的基因調(diào)節(jié)和酶促修飾的酶和轉(zhuǎn)錄調(diào)節(jié)物,以產(chǎn)生最終的菌株特異性硫肽化合物。表3和表4描述了本發(fā)明這些特定多肽的核酸和相應(yīng)的多肽序列。表3用于從菌I生物合成硫肽的特定多肽的實(shí)例<table>tableseeoriginaldocumentpage25</column></row><table>表4用于從菌株II生物合成硫肽的特定多肽的實(shí)例<table>tableseeoriginaldocumentpage26</column></row><table>在一個實(shí)施方案中,在表3或4中列出的一個或多個多肽用于如上定義通式(I)到(XI)的化合物的體外或體內(nèi)合成。本發(fā)明也涉及表3或4中報道的此類酶的任何功能變體,其保留基本上相同的酶促活性。本發(fā)明也涉及表3或4中報道的任何轉(zhuǎn)錄調(diào)節(jié)物的任何功能變體,其保留基本上相同的轉(zhuǎn)錄活性。在一個實(shí)施方案中,此類多肽與上表列出的原始多肽相比時含有不少于1、2、3、4或5個缺失、插入或取代的氨基酸。在另一實(shí)施方案中,此類功能變體與上文列出的一個多肽具有至少80或90%的同一性。這些序列可用于使得能夠產(chǎn)生缺少特定步驟的突變體菌株,例如以避免產(chǎn)生非期望副產(chǎn)物。在一個實(shí)施方案中,本發(fā)明涉及能夠產(chǎn)生在上表中列出一個或多個特定基因的表達(dá)中有缺陷的硫肽的突變體菌株。在一個特定實(shí)施方案中,所述突變體菌株在0RF2-II或0RF3-II(分別是SEQIDNO58和SEQIDNO59)或0RF4-I(SEQIDNO50)編碼基因的表達(dá)中有缺陷。如本文所用,“缺陷表達(dá)”表示與野生型菌株相比時,突變體菌株不再表達(dá)對應(yīng)的多肽,或如在用于定量mRNA表達(dá)的常規(guī)方法中測定,與野生型菌株穩(wěn)定狀態(tài)mRNA相比時,所述相應(yīng)多肽具有超過50%或超過90%減少的穩(wěn)定狀態(tài)mRNA量。例如,基因被阻斷,或部分或完全缺失,使得不再合成功能性蛋白質(zhì)。這些序列可進(jìn)一步用于與編碼前體蛋白的基因和編碼核心酶的基因組合,以改造能夠產(chǎn)生特異硫肽衍生物的宿主細(xì)胞。在一個實(shí)施方案中,本發(fā)明涉及含有如表2、3和4中所述重組可讀框ORFl-II到0RF12-II,或具有相應(yīng)野生型序列的至少80%或至少90%同一性的其功能變體,并能夠產(chǎn)生EF-Tu抑制劑的宿主細(xì)胞。在另一實(shí)施方案中,本發(fā)明涉及含有表2、3和4中所述重組ORFl-I到0RF18-I,或與相應(yīng)野生型序列具有至少80%或至少90%同一性的其功能變體,并能夠產(chǎn)生EF-Tu抑制劑的宿主細(xì)胞。在另一實(shí)施方案中,分離的特定酶可單獨(dú)使用或在例如使用硫肽前體蛋白質(zhì)作為起始材料的體外方法,例如用于產(chǎn)生硫肽的方法,例如用于產(chǎn)生E-FTu抑制劑的方法的化學(xué)反應(yīng)步驟中組合作為催化劑使用。附圖簡述圖1.硫肽結(jié)構(gòu)基因。可能的起始位點(diǎn)為粗體。14個氨基酸的骨架下面為下劃線。圖2.來自硫肽產(chǎn)生菌株I的生物合成基因簇。箭頭代表假設(shè)的啟動子。空心箭頭代表可讀框黑色實(shí)心箭頭表示系列I結(jié)構(gòu)基因,灰色陰影箭頭是系列I和系列II硫肽基因簇共有的syntenous基因。HindIII和EcoRI是基因簇側(cè)翼的唯一限制性位點(diǎn)。圖3.來自硫肽產(chǎn)生菌株11(菌株Bp3714_39)的生物合成基因簇。箭頭代表假設(shè)的分散的啟動子??招募^代表可讀框黑色實(shí)心箭頭表示系列II結(jié)構(gòu)基因,灰色陰影箭頭是系列I和系列II硫肽基因簇共有的syntenous基因?;虼氐膫?cè)翼是PstI限制性位點(diǎn)ο實(shí)施例還通過特定實(shí)施例來描述本發(fā)明。然而,此類實(shí)施例的使用僅在于說明而絕不在于限制本發(fā)明或任何示例性術(shù)語的范圍和意義。1.在產(chǎn)生硫肽的野野村氏菌屬物種基因組中鑒定編碼完整肽骨架的小結(jié)構(gòu)基因使用PCR方法來分離編碼硫肽骨架的染色體序列。從來自中國湖北省的產(chǎn)生硫肽的野野村氏菌菌株中純化基因組DNA并用限制性內(nèi)切酶NarI消化。通過流經(jīng)QiaQuickDNA純化柱(Qiagen)來純化消化后的染色體DNA。通過將摩爾數(shù)500倍過量的以下銜接頭5’-CGACCACGACCA(5’末端上磷酸化并包括3’C6-TFA氨基修飾)和5’-AGTCTCGCAGATGATAAGGTGGTCGTGGT連接到片段化的DNA上來產(chǎn)生連接銜接頭的文庫。通過使用銜接頭引物(5’-GTCCAGTCTCGCAGATGATAAGG)和基于硫肽大環(huán)設(shè)計的簡并引物(CFGCVCNC5‘-CARAAICCRCAIACRCARTTRCA)來擴(kuò)增硫肽結(jié)構(gòu)基因。在寡核苷酸中包括肌苷以降低簡并性。使用HotStar聚合酶混合物(Qiagen)來獲得特異的PCR產(chǎn)物,循環(huán)條件如下95°C15分鐘;94°C30秒,55°C30秒,及72°C1分鐘,30個循環(huán);以及72°C10分鐘。銜接頭上的3’氨基修飾阻斷延伸并防止由銜接頭引物進(jìn)行的銜接頭與銜接頭的擴(kuò)增。僅當(dāng)簡并寡核苷酸退火并引導(dǎo)產(chǎn)生銜接頭引物互補(bǔ)序列的聚合酶延伸時才發(fā)生擴(kuò)增。在產(chǎn)生硫肽的野野村氏菌屬物種基因組中鑒定編碼完整肽骨架的小結(jié)構(gòu)基因(圖1)的實(shí)驗(yàn)成功進(jìn)行。該前體蛋白質(zhì)的預(yù)測大小為57個氨基酸。然而,存在許多可能表示可選翻譯起始位點(diǎn)的起始密碼子。14個氨基酸的硫肽序列位于C末端并確定了合成方向。硫肽骨架的一級氨基酸序列以整合到吡啶環(huán)的絲氨酸開始并環(huán)繞大環(huán)以逆時針方向繼續(xù)并以側(cè)鏈末端的最后一個氨基酸結(jié)束。公共數(shù)據(jù)庫中的同源性搜索揭示沒有親緣關(guān)系近的同系物。2.編碼硫肽前體蛋白質(zhì)的基因的遺傳破壞自殺載體pSET152-Hind可在大腸桿菌中復(fù)制,賦予阿泊拉霉素抗性并攜帶允許從大腸桿菌向放線菌種進(jìn)行屬間(intergeneric)結(jié)合的轉(zhuǎn)移起點(diǎn)(oriT)。pSET152-Hind為廣譜宿主性載體PSET152的衍生載體。通過去除HindIII片段從pSET152上刪除允許位點(diǎn)特異性整合(int)的基因??捎貌迦胧Щ罨蛉笔煞N方法中的一種來破壞編碼硫肽前體蛋白質(zhì)的基因。第一種方法需要將不具有起始密碼子或終止密碼子的基因內(nèi)部片段克隆至pSET152-Hind中。隨后可通過細(xì)胞接合作用將該質(zhì)粒導(dǎo)入硫肽產(chǎn)生菌株中。利用阿泊拉霉素選擇將鑒定具有插入硫肽結(jié)構(gòu)基因中的載體骨架的突變體。此類事件將抑制轉(zhuǎn)錄和翻譯并阻止產(chǎn)生硫肽。第二種方法需要將突變體等位基因構(gòu)建到pSET152-HindIII中并隨后轉(zhuǎn)移至產(chǎn)生菌株內(nèi)。突變體等位基因?qū)Y(jié)構(gòu)基因的上游和下游序列,但具有優(yōu)選在框內(nèi)缺失的可讀框。可由賦予對如潮霉素或硫鏈絲菌肽的抗生素抗性的基因標(biāo)記/取代該缺失。在結(jié)合到產(chǎn)生菌株中,質(zhì)??股貥?biāo)記的選擇將選擇在染色體中具有野生型和突變體等位基因的菌株。在上游或下游序列中質(zhì)粒和染色體之間的同源重組會導(dǎo)致部分二倍體。載體抗生素標(biāo)記丟失的選擇及后續(xù)的PCR篩選缺失或?qū)?biāo)記突變體等位基因的抗生素選擇將鑒定期望的第二次重組事件,該事件將去除野生型等位基因并保留結(jié)構(gòu)基因的缺失等位基因?;蛘撸F(xiàn)今DNA合成技術(shù)的進(jìn)展允許DNA大片段的合成組裝,并且此類服務(wù)是可通過商業(yè)途徑獲得的。通過從頭化學(xué)合成可重新改造硫肽基因簇,用于在替代宿主中進(jìn)行異源表達(dá)和硫肽產(chǎn)生。此類宿主如天藍(lán)色鏈霉菌(Str印tomycescoelicolor)或變鉛青鏈霉菌(Str印tomyceslividans)將具有良好建立的遺傳工具并肯定對硫肽具有抗性或針對硫肽提供抗性。通過在含高于硫肽最小抑制濃度的硫肽濃度的瓊脂平板上按IOw至IO11細(xì)胞/孢子量鋪板來分離抗性菌株??赏ㄟ^在選擇性平板上的菌落生長來鑒定在賦予抗性的群體中預(yù)先存在的稀有自發(fā)突變體??赏ㄟ^將細(xì)胞暴露于化學(xué)誘變劑來提高突變率的頻率。硫肽基因簇的化學(xué)合成允許引入更優(yōu)調(diào)控元件、基因缺失、去除或引入限制性位點(diǎn)及改變密碼子選擇??寺〉秸洗┧筝d體P0J436或游離穿梭載體P0J446上的基因簇的功能性合成拷貝將具有引入到結(jié)構(gòu)基因的限制性位點(diǎn)以允許產(chǎn)生框內(nèi)缺失。此外,通過在表達(dá)噬菌體衍生蛋白質(zhì)對、或來自Rac原噬菌體的RecE/RecT或來自λ噬菌體的Reda/Redii的大腸桿菌菌株中進(jìn)行同源重組來精確地處理硫肽基因簇的克隆拷貝或合成版本。該技術(shù)稱為Red/ETRecombineering或λ介導(dǎo)的重組(Muyrers,J.P.P.,Zhang,Y.,Stewart,Α.F.ETcloning:Thinkrecombinationfirst.GeneticEngineering,PrinciplesandMethods(J.K.Setlow編著),22,77-98KluwerAcademic/PlenumPublishers,NY.(2000))。3.異源表達(dá)結(jié)構(gòu)基因以產(chǎn)生可選硫肽結(jié)構(gòu)天然產(chǎn)生菌株或表達(dá)硫肽核心和特定生物合成基因但在前體結(jié)構(gòu)基因中具有框內(nèi)缺失的異源宿主是有用的工具菌株。這些工具菌株可用于產(chǎn)生具有可選結(jié)構(gòu)的硫肽。結(jié)構(gòu)基因的位點(diǎn)定向誘變可用于向硫肽中取代或引入新氨基酸。通過結(jié)合或轉(zhuǎn)化將在pHMlla或pSET152中克隆的結(jié)構(gòu)基因的突變版本重新引入表達(dá)硫肽生物合成酶的工具菌株中?;蛘?,可產(chǎn)生編碼硫肽骨架每一位置上可選氨基酸的文庫??赏ㄟ^基因合成或簡并PCR來化學(xué)產(chǎn)生該變體文庫。PCR方法需要硫肽結(jié)構(gòu)基因的擴(kuò)增以在硫肽編碼骨架中摻入變異并在如PHMlla或PSET152的質(zhì)粒中摻入用于克隆及表達(dá)的限制性酶切位點(diǎn)。PCR引物中的一條引物將是簡并的,用于摻入所有氨基酸取代??筛淖兒啿⒍纫栽试S在骨架的所選位置上進(jìn)行取代,即不在編碼認(rèn)為是不變量氨基酸上進(jìn)行取代,如不在形成硫肽大環(huán)的噻唑的半胱氨酸的位置上進(jìn)行取代。兩條引物都將標(biāo)記限制性酶切位點(diǎn)以允許將PCR產(chǎn)物直接克隆至表達(dá)載體中。將所有大腸桿菌轉(zhuǎn)化體混合并分離DNA來產(chǎn)生變體文庫。文庫將轉(zhuǎn)化到工具菌株中并且生物測定可用于鑒定攜帶支持產(chǎn)生具有可選結(jié)構(gòu)的活性硫肽的結(jié)構(gòu)基因的克隆。4.編碼硫鏈絲菌肽骨架多肽的基因的分離使用PCR方法來分離編碼硫鏈絲菌肽骨架的染色體序列。從硫鏈絲菌肽產(chǎn)生菌遠(yuǎn)青鏈霉菌ETH28555中純化基因組DNA并用限制性內(nèi)切酶NarI消化。通過流經(jīng)QiaQuickDNA純化柱(Qiagen)來純化消化后的染色體DNA。通過摩爾數(shù)500倍過量的以下銜接頭5’-CGACCACGACCA(5’末端上磷酸化并包括3’C6-TFA氨基修飾)和5’-AGTCTCGCAGATGATAAGGTGGTCGTGGT連接片段化DNA來產(chǎn)生連接銜接頭的文庫。通過使用銜接頭引物(5’-GTCCAGTCTCGCAGATGATAAGG)和基于硫鏈絲菌肽大環(huán)設(shè)計的簡并引物(CTTCICTC:5,-CACGTGCAGATRCANGTNGTRCA-3,)來從該文庫中擴(kuò)增硫鏈絲菌肽結(jié)構(gòu)基因。根據(jù)C0DEH0P原則設(shè)計具有5’非簡并性夾板結(jié)構(gòu)(consensusclamp)和3’簡并核心的簡并引物(Rose等C0DEH0P(COnsensus-DEgenerateHybridOligonucleotidePrimer)PCRprimerdesign.NucleicAcidsRes.2003年7月1日;31(13):3763_6)。使用HotStar聚合酶混合物(Qiagen)來獲得特異的PCR產(chǎn)物,循環(huán)條件如下95°C15分鐘;94°C30秒,550C30秒,及72°C1分鐘,40個循環(huán);以及72°C10分鐘。銜接頭上的3,氨基修飾阻斷了延伸并防止由銜接頭引物進(jìn)行的銜接頭與銜接頭擴(kuò)增。僅當(dāng)簡并寡核苷酸退火并引導(dǎo)產(chǎn)生銜接頭引物互補(bǔ)序列的聚合酶延伸時才發(fā)生擴(kuò)增。該策略在鑒定編碼硫鏈絲菌肽大環(huán)的基因組片段中證明是成功的。隨后使用基因特異引物向上游和下游步移來鑒定全長硫鏈絲菌肽結(jié)構(gòu)基因。5.來自硫肽產(chǎn)生菌株I和II的生物合成基因簇5.1菌株I圖2描述了來自包含用于硫肽合成的生物合成基因簇的菌株I基因組DNA的一個分離的BAC(SEQIDNO62)中可讀框的位置。在不受任何優(yōu)選模型約束的情況下,以下途徑定義了各個多肽的推測功能,所述多肽的特征在于硫肽衍生物合成中的克隆的生物合成基因簇。系列I的合成方案(A)0RF9,ORF10,ORF1UORF12,ORF13和0RF14編碼很可能形成復(fù)合體的核心生物合成酶,所述復(fù)合體通過結(jié)合前體肽進(jìn)一步行使功能。當(dāng)復(fù)合體沿肽移動時引入相應(yīng)的修飾。通過半胱氨酸巰基與前面的羰基的環(huán)化脫水和隨后噻唑啉環(huán)的氧化來引入噻唑。兩個絲氨酸殘基的脫水作用形成了作為產(chǎn)生中心吡啶雜環(huán)的aza-Diels-Alder環(huán)化加成反應(yīng)的底物的脫氫丙氨酸殘基。<formula>formulaseeoriginaldocumentpage30</formula>(B)0RF2和0RF3編碼很可能參與將修飾摻入尾部的酶。絲氨酸殘基的環(huán)化脫水作用產(chǎn)生噁唑啉環(huán)。由于尾部脯氨酸的存在,尾部額外絲氨酸脫水成脫氫丙氨酸可能需要單獨(dú)步驟,該步驟很可能在肽中引起出現(xiàn)構(gòu)象紐接。0RF18可能參與了去除末端序列而留下酰胺基。<formula>formulaseeoriginaldocumentpage30</formula>(C)0RF4、0RF6、0RF7、ORF16和0RF17編碼很可能參與特定修飾的酶。0RF4苯丙氨酸的羥化。0RF5天冬酰胺的甲基化。0RF7噻唑的甲基化。0RF16和0RF17向噻唑添加甲氧乙基。<formula>formulaseeoriginaldocumentpage31</formula>5.2菌株II圖3描述了來自包含用于硫肽合成的生物合成基因簇的菌株II基因組DNA的一個分離的BAC(SEQIDNO63)中ORF的位置。在不受任何優(yōu)選模型約束的情況下,以下途徑定義了各個多肽的推測功能,所述多肽的特征在于硫肽衍生物合成中的克隆的生物合成基因簇。系列II的合成方案(A)0RF6、0RF7、0RF8、0RF9、0RF10和ORFll編碼很可能形成復(fù)合體的核心生物合成酶,所述復(fù)合體通過結(jié)合前體肽進(jìn)一步行使功能。當(dāng)復(fù)合體沿肽移動時引入相應(yīng)的修飾。通過半胱氨酸巰基與前面的羰基的環(huán)化脫水和隨后噻唑啉環(huán)的氧化來引入噻唑。兩個絲氨酸殘基的脫水作用形成了作為產(chǎn)生中心吡啶雜環(huán)的aza-Diels-Alder環(huán)化加成反應(yīng)的底物的脫氫丙氨酸殘基。<formula>formulaseeoriginaldocumentpage32</formula>(B)0RF12編碼切割末端丙氨酸的肽酶。(C)0RFU0RF2和0RF3編碼了可能參與特定修飾的酶。噻唑的0RF1甲基化及0RF2和0RF3參與苯丙氨酸和異亮氨酸的羥基化。異亮氨酸羥基化兩次并分解產(chǎn)生環(huán)氧化物。6.硫肽衍生物的產(chǎn)生培養(yǎng)基組分(a)種子培養(yǎng)基<table>tableseeoriginaldocumentpage34</column></row><table>(b)生產(chǎn)培養(yǎng)基A<table>tableseeoriginaldocumentpage35</column></row><table>將如實(shí)施例3所述宿主細(xì)胞的冰凍懸液(1.5mL)接種至含有500mL種子培養(yǎng)基的兩升無擋板搖瓶。該搖瓶30°C下在搖床中以200轉(zhuǎn)/分鐘和50mm振幅溫育3天。通過按每瓶40mL將第一階段的種子接種至每個含有500mL種子培養(yǎng)基的8個兩升無擋板搖瓶中進(jìn)行第二個種子階段。該搖瓶在30°C的搖床中以200轉(zhuǎn)/分鐘和50mm振幅溫育2天。通過按每瓶4升將第二階段的種子接種至每個含有100升種子培養(yǎng)基的2個150升規(guī)模的攪拌釜發(fā)酵罐中進(jìn)行第三個種子階段。按以下參數(shù)操作150升規(guī)模的發(fā)酵罐3天溫度=30°C、攪拌=80轉(zhuǎn)/分鐘、空氣流動=25slpm及壓力=0.5bar。通過控制添加基于硅油的消泡劑來阻止過量泡沫的形成。監(jiān)測但不控制PH值。用200升來自第三個種子階段的種子接種含有3500升生產(chǎn)培養(yǎng)基A的5500升規(guī)模的攪拌釜發(fā)酵罐。5500升規(guī)模的發(fā)酵罐操作參數(shù)如下溫度=30°C、空氣流動=1050slpm及壓力=0.5bar。攪拌控制在60轉(zhuǎn)/分鐘并在44小時之后增加到80轉(zhuǎn)/分鐘。通過控制添加基于硅油的消泡劑來阻止過量泡沫的形成。監(jiān)測但不控制PH值。溫育5天后收集含3500升發(fā)酵液的發(fā)酵罐。7.硫肽衍生物的分離通過在攪拌槽中加入乙酸乙酯過夜收集并提取發(fā)酵液。在提取過程中將混合物流經(jīng)連續(xù)DispaX反應(yīng)器(Jahnke&Kunkel,德國)用于最大剪力(sheerforce)及最佳混和。在連續(xù)Westfalia分離器SA20(WestfaliaS印aratorAG,0elde,德國)上分離兩相后,通過減壓下的蒸發(fā)來濃縮乙酸乙酯相。蒸發(fā)過程中形成經(jīng)過濾分離的沉淀。將根據(jù)如上描述的方法從培養(yǎng)液的提取物中獲得的沉淀溶解于比例為955的二噁烷/水中并過濾去除不可溶成分。在減壓及硅藻(diat0me)8(Isolute0,InternationalSorbentTechnologyLtd.,HengoedMidGlam,UK)Wff液。將所獲的粉末應(yīng)用到在比例為90100.5的二氯甲烷/甲醇/乙酸溶液中制備的硅膠層析柱(例如0.040-0.063mm,柱子大小為5x25cm)上。用比例為90100.5的二氯甲烷/甲醇/乙酸溶液以35mL/分鐘的流速洗脫柱子。收集30mL經(jīng)HPLC分析的級分。向含化合物I的混和級分中加入20mL異丙醇并在減壓條件下濃縮直至化合物從殘留的異丙醇中沉淀出來。通過離心從沉淀中分離出溶劑后,在減壓條件下干燥殘留物,產(chǎn)生半純化的硫肽衍生物。權(quán)利要求包含選自以下的氨基酸序列的硫肽前體蛋白質(zhì)(i)SEQIDNO1;(ii)SEQIDNO5;(iii)SEQIDNO11;(iv)或當(dāng)與SEQIDNO1、SEQIDNO5或SEQIDNO11相比時,具有不超過1、2、3、4、5、6或10個缺失、插入和/或取代氨基酸的所述氨基酸序列的變體。2.權(quán)利要求1的硫肽前體蛋白質(zhì),其中所述前體是Ef-tu硫肽抑制劑的生物合成前體。3.權(quán)利要求2的硫肽前體蛋白質(zhì),其中所述Ef-tu抑制劑選自GE2270A、GE37648A、Amythiamicin或如以下任意通式I_XI中的任意通式所示的化合物<image>imageseeoriginaldocumentpage3</image><image>imageseeoriginaldocumentpage4</image><formula>formulaseeoriginaldocumentpage5</formula>4.核酸,其包含編碼權(quán)利要求1-3中任一項(xiàng)的硫肽前體蛋白質(zhì)的核苷酸序列。5.權(quán)利要求4的核酸,其包含SEQIDNO5的核苷酸序列。6.權(quán)利要求5的核酸,其包含SEQIDNO6的核苷酸序列或包含至少SEQIDNO5的其任何片段。7.權(quán)利要求4-6中任一項(xiàng)的核酸,其中所述核酸序列有效連接異源轉(zhuǎn)錄和翻譯控制序列。8.權(quán)利要求7的核酸,其中所述核酸是表達(dá)載體。9.用于硫肽生物合成的多肽,其包含選自以下的氨基酸序列(i)SEQIDNO:23-34中的任一個,(ii)(i)中列出的氨基酸序列的變體,當(dāng)與(i)中列出的相應(yīng)野生型氨基酸序列相比時,其具有不超過1、2、3、4、5、6、或10個缺失、插入或取代氨基酸,并保留基本上相同的酶功能。10.核酸,其包含編碼權(quán)利要求9的多肽的核苷酸序列。11.權(quán)利要求10的核酸,其中所述核酸序列有效連接異源轉(zhuǎn)錄和翻譯序列。12.包含權(quán)利要求1-86中任一項(xiàng)的核酸的宿主細(xì)胞,其中在所述宿主細(xì)胞的基因組中未天然發(fā)現(xiàn)所述核酸。13.權(quán)利要求12的宿主細(xì)胞,其還包含硫肽生物合成所需的其他基因。14.權(quán)利要求13的宿主細(xì)胞,其中硫肽生物合成所需的所述其他基因包含權(quán)利要求10或11定義的核酸。15.權(quán)利要求13或14的宿主細(xì)胞,其選自野野村氏菌屬物種、游動雙孢菌屬物種、擬無枝酸菌屬物種、大腸桿菌(Escherichiacoli)、棒桿菌屬物種(Corynebacteriumsp.)、芽孢桿菌屬物種(Bacillussp.)和鏈霉菌屬物種,如變鉛青鏈霉菌、天藍(lán)色鏈霉菌、白色鏈霉菌(Streptomycesalbus)、Streptomycesramocissimus、丘鏈霉菌(Streptomycescollinus)、弗氏鏈霉菌(Streptomycesfradiae)、遠(yuǎn)青鏈霉菌或灰色鏈霉菌(Str印tomycesgriseus),并且其中所述宿主細(xì)胞針對所述硫肽提供抗性。16.突變體微生物,其中與相應(yīng)野生型微生物相比時,所述突變體微生物不再表達(dá)編碼如權(quán)利要求1-8中任一項(xiàng)定義的硫肽前體蛋白質(zhì)的基因。17.權(quán)利要求16的突變體微生物,其中所述突變在相應(yīng)野生型微生物中是編碼如權(quán)利要求1-8中任一項(xiàng)定義的硫肽前體蛋白質(zhì)的基因的破壞。18.權(quán)利要求17的突變體微生物,其中所述微生物是野野村氏菌屬物種并且所述突變是包含SEQIDNO15或SEQIDNO16的基因的破壞。19.權(quán)利要求16-18中任一項(xiàng)的突變體微生物,其中用權(quán)利要求1-8中任一項(xiàng)的核酸進(jìn)一步轉(zhuǎn)化所述突變體。20.突變體微生物,其中所述突變體微生物不再表達(dá)編碼如權(quán)利要求9定義的一個或多個多肽的一個或多個基因。21.用于硫肽生物合成的多肽,其包含選自以下的氨基酸序列(i)SEQIDNO:47-60的中任一個,(ii)(i)中列出的氨基酸序列的變體,與(i)中列出的相應(yīng)野生型氨基酸序列相比時,其具有不超過1、2、3、4、5、6或10個缺失、插入或取代氨基酸,并保留基本上相同的酶促功能或調(diào)節(jié)功能,(iii)(i)中列出的氨基酸序列的變體,其與(i)中列出的一個多肽具有至少80%或至少90%的同一性,并保留基本上相同的酶促功能或調(diào)節(jié)功能。22.包含編碼權(quán)利要求21的多肽的核苷酸序列的核酸。23.權(quán)利要求22的核酸,其中所述核酸序列有效連接異源轉(zhuǎn)錄和翻譯序列。24.包含權(quán)利要求22或23的核酸的宿主細(xì)胞,其中在所述宿主細(xì)胞的基因組中未天然發(fā)現(xiàn)所述核酸。25.權(quán)利要求24的宿主細(xì)胞,其還包含硫肽生物合成需要的其他基因。26.權(quán)利要求25的宿主細(xì)胞,其中硫肽生物合成需要的所述其他基因選自編碼權(quán)利要求4-8中任一項(xiàng)的硫肽前體蛋白質(zhì)的核酸和權(quán)利要求10-11的核酸。27.突變體微生物,其能夠產(chǎn)生一個或多個特定基因的表達(dá)有缺陷的硫肽,所述特定基因編碼如權(quán)利要求21中所定義的一個或多個多肽。28.用于產(chǎn)生硫肽前體蛋白質(zhì)的方法,所述方法包括在適合于產(chǎn)生所述硫肽前體蛋白質(zhì)的條件下培養(yǎng)權(quán)利要求12、13、15或24-26的宿主細(xì)胞的步驟。29.產(chǎn)生硫肽化合物的方法,所述方法包括在適合于產(chǎn)生所述硫肽前體化合物的條件下培養(yǎng)權(quán)利要求12、13、15或24-26的宿主細(xì)胞的步驟。30.權(quán)利要求28或29的方法,其還包括分離基本純形式的所述硫肽前體或硫肽化合物。31.權(quán)利要求29或30的方法,其中所述硫肽化合物選自GE2270A、GE37648A、如權(quán)利要求5中任意通式I-X中任意通式所示的化合物、amythiamicin、微球菌素、硫鏈絲菌肽、諾雪七月太、高硫青毒素、thiocins、nocathiacins、伯爾尼毒素、A10255B禾口radamycin。32.產(chǎn)生硫肽衍生物的方法,其包括(i)通過在所述宿主細(xì)胞中基因表達(dá)編碼所述改變的硫肽前體的序列,在宿主細(xì)胞中合成改變的硫肽前體,()從所述改變的硫肽前體合成所述硫肽衍生物。33.權(quán)利要求32的方法,其中所述改變的硫肽衍生物前體是如權(quán)利要求1-11中任一項(xiàng)定義的SEQIDNO:1、SEQIDNO5或SEQIDNO11的變體。34.權(quán)利要求32或33的方法,其中步驟ii)在體外進(jìn)行。35.權(quán)利要求32或33的方法,其中步驟ii)在與步驟i)相同的宿主細(xì)胞中體內(nèi)進(jìn)行。36.產(chǎn)生硫肽或硫肽衍生物的方法,其包括(i)提供包含如1-11中任一項(xiàng)中定義的硫肽前體蛋白質(zhì)的培養(yǎng)基,(ii)在所述培養(yǎng)基中培養(yǎng)微生物,其中所述微生物還包含硫肽生物合成所需的其他基因。37.權(quán)利要求36的方法,其中硫肽生物合成所需的所述其他基因選自編碼下述多肽的那些基因,所述多Jj太選自SEQIDN0:23-34和SEQIDNO:47_60。38.權(quán)利要求36或37的方法,其中所述微生物選自自野野村氏菌屬物種、游動雙孢菌屬物種、擬無枝酸菌屬物種和鏈霉素物種,如變鉛青鏈霉菌、天藍(lán)色鏈霉菌、白色鏈霉菌、Streptomycesramocissimus、丘鏈霉菌、弗氏鏈霉菌、遠(yuǎn)青鏈霉菌或灰色鏈霉菌,其中所述微生物是選擇為對所述硫肽或硫肽衍生物有抗性的菌株。全文摘要本發(fā)明涉及用于硫肽生物合成的前體蛋白質(zhì)、相應(yīng)的結(jié)構(gòu)基因及其用途。本發(fā)明還涉及用于遺傳處理該前體蛋白質(zhì)的方法,或表達(dá)編碼該硫肽前體蛋白質(zhì)的基因以產(chǎn)生硫肽化合物或其衍生物的宿主細(xì)胞。本發(fā)明進(jìn)一步涉及參與硫肽生物合成的基因的克隆和表征及其在硫肽化合物產(chǎn)生中的用途。文檔編號C07K14/435GK101809030SQ200880102696公開日2010年8月18日申請日期2008年8月6日優(yōu)先權(quán)日2007年8月9日發(fā)明者R·莫里斯申請人:諾瓦提斯公司