編碼基因的核巧酸序列選自Seq. 1中的10543-9830堿 基。
[0022] 本發(fā)明還提供了一個包括酬基合成酶化S)8-酷基轉(zhuǎn)移酶(AT)8-酬基還原酶化R)8-酷基載體蛋白結(jié)構(gòu)域(ACP)8-鏈釋放硫醋酶(TE)的聚酬合酶結(jié)構(gòu)域氨基酸序列,由Seq. 12 序列中1890個氨基酸組成,命名為IA-W10,編碼基因的核巧酸序列選自Seq. 1中的16215-10543堿基。
[002引本發(fā)明還提供了一個包括KS7-AT7-KR7-ACP7的聚酬合酶結(jié)構(gòu)域氨基酸序列,由 Seq. 13序列中的1582個氨基酸組成,命名為IA-W11,編碼基因的核巧酸序列選自Seq. 1中的 21076-16328堿基。
[0024] 本發(fā)明還提供了一個包括KS5-AT5-KR5-ACP5-KS6-AT6-D此(脫水酶)-邸6 (締酷基還 原酶)-KR6-A(P6的聚酬合酶結(jié)構(gòu)域氨基酸序列,由Seq.l4序列中的3795個氨基酸組成,命名 為IA-W12,編碼基因的核巧酸序列選自Seq.l中的32511-21124堿基。
[002引本發(fā)明還提供了一個包括KS4-AT4-畑4-KR4-ACP4的聚酬合酶結(jié)構(gòu)域氨基酸序列,由 Seq.l5序列中的2004個氨基酸組成,命名為IA-W13,編碼基因的核巧酸序列選自Seq.l中的 38599-32585堿基。
[0026 ]本發(fā)明還提供了 一個包 KS 廣 AT 廣 ACP 廣 KS2-AT2-KR2-ACP2-KS3-AT3-DH3-KR3-ACP3 的 聚酬合酶結(jié)構(gòu)域氨基酸序列,由Seq. 16序列中的4538個氨基酸組成,命名為IA-W14,編碼基 因的核巧酸序列選自Seq. 1中的52259-38643堿基。
[0027] 本發(fā)明還提供了一個細胞色素 P-450氧化酶的氨基酸序列,由Seq. 17序列中的403 個氨基酸組成,命名為IA-W15,編碼基因的核巧酸序列選自Seq. 1中的53099-54310堿基。
[0028] 本發(fā)明還提供了一個NDP-己糖異構(gòu)酶的氨基酸序列,由Seq. 18序列中的116個氨 基酸組成,命名為IA-W16,編碼基因的核巧酸序列選自Seq. 1中的54495-54845堿基。
[0029] 本發(fā)明還提供了一個NDP-己糖氨基轉(zhuǎn)移酶的氨基酸序列,由Seq. 19序列中的399 個氨基酸組成,命名為IA-W17,編碼基因的核巧酸序列選自Seq. 1中的54842-56041堿基。
[0030] 本發(fā)明還提供了一個NDP-葡萄糖合酶的氨基酸序列,由Seq. 20序列中的302個氨 基酸組成,命名為IA-W18,編碼基因的核巧酸序列選自Seq. 1中的56038-56946堿基。
[0031] 本發(fā)明還提供了一個NDP-葡萄糖-4,6脫水酶的氨基酸序列,由Seq. 21序列中的 345個氨基酸組成,命名為IA-W19,編碼基因的核巧酸序列選自Seq. 1中的56930-57967堿 基。
[0032] 本發(fā)明還提供了一個NDP-己糖2,3脫水酶/硫醋酶的氨基酸序列,由Seq. 22序列中 的745個氨基酸組成,命名為IA-W20,編碼基因的核巧酸序列選自Seq. 1中的57937-60174堿 基。
[0033] 本發(fā)明還提供了一個NDP-己糖氨基轉(zhuǎn)移酶的氨基酸序列,由Seq. 23序列中的382 個氨基酸組成,命名為IA-W21,編碼基因的核巧酸序列選自Seq. 1中的60836-61984堿基。
[0034] 本發(fā)明還提供了一個NDP-氨基己糖N二甲基轉(zhuǎn)移酶的氨基酸序列,由Seq. 24序列 中的239個氨基酸組成,命名為IA-W22,編碼基因的核巧酸序列選自Seq. 1中的62796-62077 堿基。
[003引本發(fā)明還提供了一個轉(zhuǎn)錄調(diào)控因子的氨基酸序列,由Seq. 25序列中的670個氨基 酸組成,命名為IA-W23,編碼基因的核巧酸序列選自Seq. 1中的63633-65645堿基。
[0036] 本發(fā)明還提供了一個NDP-氨基己糖異構(gòu)酶的氨基酸序列,由Seq. 26序列中的354 個氨基酸組成,命名為IA-W24,編碼基因的核巧酸序列選自Seq. 1中的67379-66318堿基。
[0037] 本發(fā)明還提供了一個ABC轉(zhuǎn)運蛋白的氨基酸序列,由Seq. 27序列中的550個氨基酸 組成,命名為IA-W25,編碼基因的核巧酸序列選自Seq. 1中的69004-67352堿基。
[0038] 本發(fā)明還提供了一個NDP-己糖脫水酶的氨基酸序列,由Seq. 28序列中的433個氨 基酸組成,命名為IA-W26,編碼基因的核巧酸序列選自Seq. 1中的69349-70650堿基。
[0039] 本發(fā)明還提供了一個類似于GTP酶的氨基酸序列,由Seq. 29序列中的482個氨基酸 組成,命名為IA-W27,編碼基因的核巧酸序列選自Seq. 1中的72156-70708堿基。
[0040] 本發(fā)明還提供了一個NDP-糖異構(gòu)酶的氨基酸序列,由Seq. 30序列中的346個氨基 酸組成,命名為IA-W28,編碼基因的核巧酸序列選自Seq. 1中的72422-73462堿基。
[0041 ]本發(fā)明還提供了一個NDP-己糖酬基還原酶的氨基酸序列,由Seq. 31序列中的346 個氨基酸組成,命名為IA-W29,編碼基因的核巧酸序列選自Seq. 1中的74601-73561堿基。
[0042] 本發(fā)明還提供了一個糖基轉(zhuǎn)移酶輔助蛋白的氨基酸序列,由Seq. 32序列中415個 氨基酸組成,命名為IA-W30,編碼基因的核巧酸序列選自Seq. 1中的74913-76160堿基。
[0043] 本發(fā)明還提供了一個糖基轉(zhuǎn)移酶的氨基酸序列,由Seq. 33序列中的422個氨基酸 組成,命名為IA-W31,編碼基因的核巧酸序列選自Seq. 1中的76218-77486堿基。
[0044] 本發(fā)明還提供了一個糖基轉(zhuǎn)移酶的氨基酸序列,由Seq. 34序列中的391個氨基酸 組成,命名為IA-W32,編碼基因的核巧酸序列選自Seq. 1中的77606-78781堿基。
[004引本發(fā)明還提供了一個NDP-己糖酬基還原酶的氨基酸序列,由Seq. 35序列中的330 個氨基酸組成,命名為IA-W33,編碼基因的核巧酸序列選自Seq. 1中的78783-79775堿基。
[0046] 本發(fā)明還提供了一個NDP-己糖還原酶的氨基酸序列,Seq. 36由序列中的335個氨 基酸組成,命名為IA-W34,編碼基因的核巧酸序列選自Seq. 1中的79772-80779堿基。
[0047] 本發(fā)明還提供了一個NDP-己糖甲基轉(zhuǎn)移酶的氨基酸序列,由Seq. 37序列中的410 個氨基酸組成,命名為IA-W35,編碼基因的核巧酸序列選自Seq. 1中的82055-80823堿基。
[0048] 本發(fā)明還提供了一個甲氧基丙二酷合成酶的氨基酸序列,由Seq.38序列中的370 個氨基酸組成,命名為IA-W36,編碼基因的核巧酸序列選自Seq. 1中的83164-82052堿基。
[0049] 本發(fā)明還提供了一個脫氨酶的氨基酸序列,由Seq. 39序列中的373個氨基酸組成, 命名為IA-W37,編碼基因的核巧酸序列選自Seq. 1中的84400-83279堿基。
[0050] 本發(fā)明還提供了一個酷基攜帶蛋白的氨基酸序列,由Seq. 40序列中的106個氨基 酸組成,命名為IA-W38,編碼基因的核巧酸序列選自Seq. 1中的84713-84393堿基。
[0051] 本發(fā)明還提供了一個甲氧基丙二酷脫氨酶的氨基酸序列,由Seq.41序列中的288 個氨基酸組成,命名為IA-W39,編碼基因的核巧酸序列選自Seq. 1中的85576-84710堿基。
[0052] 本發(fā)明還提供了一個糖基轉(zhuǎn)移酶的氨基酸序列,由Seq.42序列中的405個氨基酸 組成,命名為IA-W40,編碼基因的核巧酸序列選自Seq. 1中的85825-87042堿基。
[0053] 本發(fā)明還提供了一個NDP-己糖異構(gòu)酶的氨基酸序列,由Seq. 43序列中的202個氨 基酸組成,命名為IA-W41,編碼基因的核巧酸序列選自Seq. 1中的87094-87702堿基。
[0054] 本發(fā)明還提供了一個轉(zhuǎn)錄調(diào)控因子蛋白的氨基酸序列,由Seq.44序列中的390個 氨基酸組成,命名為IA-W42,編碼基因的核巧酸序列選自Seq. 1中的89315-88143堿基。
[00巧]本發(fā)明還提供了外源插入的23S rRNA甲基化酶(硫鏈絲菌素 thiostr邱ton、ts;r抗 性標記相關(guān))氨基酸序列,由Seq.45序列中的269個氨基酸組成,命名為IA-W43,編碼基因的 核巧酸序列選自Seq. 2中的866-57堿基。
[0056] 本發(fā)明還提供了外源插入的4"碳霉糖巧異戊酷轉(zhuǎn)移酶氨基酸序列,由Seq. 46序列 中的388個氨基酸組成,命名為IA-W44,編碼基因的核巧酸序列選自Seq. 2中的2337-1171堿 基。
[0057] 在獲得可利霉素生物合成基因簇信息、通過基因阻斷及同源性比較分析各基因編 碼蛋白可能功能基礎上,進一步描述本發(fā)明整個可利霉素生物合成基因簇共44個基因,其 基因簇結(jié)構(gòu)如圖1所示,具體為:
[005引(1)聚酬合酶基因 orflO-14,共5個基因;
[0059] (2)與聚酬合成延長單位及修飾相關(guān)的基因〇計1、〇計4-6、15、36-39,共9個基因;
[0060] (3)與糖基合成相關(guān)基因〇計9、16-22、24、26、28、29、33-35、41,共16個基因;
[0061] (4)與糖基轉(zhuǎn)移相關(guān)基因〇計7、8、30-32、40,共6個基因;
[0062] (5)與抗性相關(guān)基因〇計3和25,共2個基因;
[0063] (6)與生物合成調(diào)控相關(guān)基因〇計2、23、27、42,共4個基因;
[0064] (7)外源引入的基因工程菌標記基因 orf43(硫鏈絲菌素-thiostrepton、ts;r抗性 基因)和與之連鎖的碳霉糖4"-0-異戊酷轉(zhuǎn)移酶基因〇計44,共2個基因。
[0065] Seq.l中有5個聚酬合酶基因(0計10-14),核巧酸互補序列及其氨基酸序列,是可 利霉素內(nèi)醋環(huán)合成所必須的,其中,包含8個模塊,37個結(jié)構(gòu)域如圖2所示。0計14包含3個模 塊:加載結(jié)構(gòu)域m及模塊2和3;加載模塊域中,KSi、ATi和ACPi負責內(nèi)醋環(huán)的起始合成,催化 一個乙酸作為起始單位,模塊2含有KS2、AT2、KR沸ACP2結(jié)構(gòu)域;模塊3含有KS3、AT3、畑3、邸3和 ACP3結(jié)構(gòu)域,負責引入另2個乙酸延伸單位,最終形成可利霉素 C11-15碳鏈骨架。0rfl3包括 模塊4,含有腳、4了4、0此、抓4、4〔?4,負責第3個乙酸單位的延伸,最終形成可利霉素〔9-10碳 鏈骨架;0rfl2包括模塊5和6,模塊5含有KSs-ATs-KRs-ACPs結(jié)構(gòu)域,負責引入丙酸延伸單位; 模塊6含有KS6-AT6-DH6-KR6-ER6-KR6-ACP6結(jié)構(gòu)域,負責引入下酸延伸單位,最終形成可利霉 素 C5-C8碳鏈骨架。Orfl 1包括模塊7,含有KS7-AT7-KR7-ACP7結(jié)構(gòu)域,負責引入乙醇酸延伸單 位,最終形成可利霉素 C3-C4碳鏈骨架。OrflO包括模塊8,含有KS8-AT8-KR8-ACP8-TE結(jié)構(gòu)域, 負責引入一個乙酸延伸單位,并在硫醋酶(TE)參與下完成碳鏈的環(huán)化及釋放。可利霉素聚 酬合酶基因結(jié)構(gòu)示意圖見圖2。聚酬合酶基因各結(jié)構(gòu)域及其氨基酸的位置如表1所示。
[0066] 可利霉素聚酬合成延長單位及修飾相關(guān)基因 orfUo計4-6、15、36-39的核巧酸序 列或互補序列及其相應的氨基酸序列:即IA-W1,編碼PPT