国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      具有經(jīng)修飾的前原區(qū)域的蛋白酶的制作方法

      文檔序號:3570839閱讀:522來源:國知局
      專利名稱:具有經(jīng)修飾的前原區(qū)域的蛋白酶的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及編碼經(jīng)修飾的蛋白酶的經(jīng)修飾的多核苷酸,本發(fā)明還涉及用于改變蛋白酶在微生物中的生產(chǎn)的方法。特別地,經(jīng)修飾的多核苷酸包含一個或多個突變,編碼具有改變的前原(pre-pro)區(qū)域的經(jīng)修飾的蛋白酶,所述修飾的前原區(qū)域增強該活性酶的生產(chǎn)。本發(fā)明還涉及用于改變蛋白酶在微生物(例如芽孢桿菌屬(Bacillus)物種)中的生產(chǎn)的方法。
      背景技術(shù)
      細菌來源的蛋白酶是重要的工業(yè)酶,其占所有酶銷售量的大多數(shù),在多種工業(yè)(包括洗滌劑、肉嫩化、干酪制造、脫毛、烘焙、釀造、助消化劑的生產(chǎn)、以及從攝影膠片回收銀)中被廣泛應(yīng)用。這些酶作為洗滌劑添加劑的應(yīng)用促進了它們的商業(yè)發(fā)展, 并導(dǎo)致對這些酶的基礎(chǔ)研究的大幅擴增(Germano等,Enzyme Microb. Techno 1. 32 M6-251[2003])。除了作為洗滌劑和食品添加劑,蛋白酶(例如,堿性蛋白酶)在其它工業(yè)領(lǐng)域(例如皮革、紡織、有機合成、以及廢水處理)中也具有廣泛的應(yīng)用((Kalisz,Adv. Biochem. Eng. Biotechnol. ,36 1-65[1988])禾口(Kumar 禾口 Takagi, Biotechnol. Adv. ,17 561-594[1999]))ο隨著對這些工業(yè)酶的高要求,具有新穎特性的堿性蛋白酶持續(xù)成為研究興趣的重點,從而導(dǎo)致了具有改良的催化效率和對溫度、氧化劑及變化的使用條件具有更佳穩(wěn)定性的新蛋白酶制劑。然而,酶生產(chǎn)和下游加工的總成本仍然是酶工業(yè)中任何技術(shù)成功應(yīng)用所面臨的主要障礙。為了解決這個問題,研究人員和工藝工程師采用了幾種方法,相對于堿性蛋白酶的工業(yè)需求,增加堿性蛋白酶的產(chǎn)量。盡管采用了多種方法(包括篩選高產(chǎn)菌種、克隆和過表達蛋白酶、改進補料分批發(fā)酵和恒化器發(fā)酵、以及優(yōu)化發(fā)酵技術(shù))來增加蛋白酶的產(chǎn)量,但仍然需要額外的手段來提高蛋白酶的生產(chǎn)。發(fā)明概述本發(fā)明提供經(jīng)修飾的多核苷酸,其編碼經(jīng)修飾的蛋白酶;本發(fā)明還提供用于改變蛋白酶在微生物中的生產(chǎn)的方法。特別地,經(jīng)修飾的多核苷酸包含一個或多個突變,編碼前原(pre-pro)區(qū)域具有修飾的經(jīng)修飾的蛋白酶,所述前原區(qū)域的修飾增強該活性酶的生產(chǎn)。本發(fā)明還涉及用于改變蛋白酶在微生物(例如芽孢桿菌屬物種)中的生產(chǎn)的方法。在一個實施方案中,本發(fā)明提供了編碼經(jīng)修飾的全長蛋白酶的分離的修飾多核苷酸,其中該分離的經(jīng)修飾的多核苷酸包含編碼該全長蛋白酶的前原區(qū)域的第一多核苷酸, 該第一多核苷酸有效地連接到編碼該全長蛋白酶的成熟區(qū)域的第二多核苷酸上,其中第一多核苷酸編碼SEQ ID NO :7的前原區(qū)域,并進一步被突變而包含至少一個增強該蛋白酶在宿主細胞中的生產(chǎn)的突變。優(yōu)選地,宿主細胞為芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌(Bacillus subtilis)宿主細胞。在一些實施方案中,經(jīng)修飾的全長蛋白酶為絲氨酸蛋白酶,其源自野生型的或變體的親本絲氨酸蛋白酶,例如枯草芽孢桿菌(Bacillussubtilis)、解淀粉芽孢桿菌(Bacillus amyloliquefaciens)、短小芽孢桿菌(Bacillus pumilis)或地衣芽孢桿菌(Bacillus licheniformis)的絲氨酸蛋白酶。在另一個實施方案中,本發(fā)明提供了分離的、經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的全長蛋白酶,其中該分離的、經(jīng)修飾的多核苷酸包括第一多核苷酸,所述第一多核苷酸編碼該全長蛋白酶的前原區(qū)域,并有效地連接到第二多核苷酸,所述第二多核苷酸編碼全長蛋白酶的成熟區(qū)域,其中第一多核苷酸編碼SEQ ID NO :7的前原區(qū)域,并進一步被突變以包含至少一個增強宿主細胞的蛋白酶生產(chǎn)的突變,第二多核苷酸編碼與SEQ ID NO 9的成熟蛋白酶至少約65%相同的蛋白酶。優(yōu)選地,第二多核苷酸編碼SEQ ID NO :9的成熟蛋白酶。在一些實施方案中,經(jīng)修飾的全長蛋白酶為絲氨酸蛋白酶,其源自野生型的或變體的親本絲氨酸蛋白酶,例如枯草芽孢桿菌、解淀粉芽孢桿菌、短小芽孢桿菌或地衣芽孢桿菌的絲氨酸蛋白酶。優(yōu)選地,宿主細胞為芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌宿主細胞。本發(fā)明也提供了分離的、經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的全長蛋白酶,其中該分離的、經(jīng)修飾的多核苷酸包括第一多核苷酸,所述第一多核苷酸編碼全長蛋白酶的前原區(qū)域,并有效地連接到第二多核苷酸,所述第二多核苷酸編碼全長蛋白酶的成熟區(qū)域,其中第一多核苷酸編碼SEQ ID NO :7的前原區(qū)域,并進一步被突變以包含至少一個增強宿主細胞的蛋白酶生產(chǎn)的突變。在一些實施方案中,第一多核苷酸的至少一個突變編碼在選自位置 2,3,6,7,8,10,11,12,13,14,15,16,17,19,20,21,22,23,24,25,26,27,28, 29,30,31,32,33,34,35,36,37,38,39,45,46,47,48,49,50,51,52,53,54,55,57,58,59, 61,62,63,64,66,67,68,69,70,72,74,75,76,77,78,80,82,83,84,87,88,89,90,91,93, 96,100和102的一個或多個位置的至少一個氨基酸取代,其中的位置通過與SEQ ID NO 7 所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在其它實施方案中,該至少一個突變編碼至少一個取代,選自:X2F, N,P和Y ;X3A, M,P和R ;X6K和M ;X7E ;I8W ;X10A, C, G,M 禾口 T ;X11A,F(xiàn) 禾口 T ;X12C,P, T ;X13C, G 禾口 S ;X14F ;X15G, M,T 禾口 V ;X16V ;X17S ;X19P 禾口 S ;X20V ;X21S ;X22E ;X23F, Q 禾口 W ;X24G, T 禾口 V ;X25A, D 禾口 W ;X26C 禾口 H ;X27A, F, H, P, Τ, V 禾口 Y ;X28V ;X29E, I,R,S 禾口 T ;X30C ;X31H, K, N, S,V 禾口 W ;X32C, F, M, N, P,S 禾口 V ;X33E, F, M,P 禾口 S ;X34D, H,P 禾口 V ;X35C, Q 禾口 S ;X36C, D, L, N, S,W 禾口 Y ;X37C, G,K 禾口 Q ;X38F, Q, S 禾口 W ;X39A, C,G,I,L, M, P, S,T 禾口 V ;X45G 禾口 S ;X46S ;X47E 禾口 F ;X48G, I,T,W 禾口 Y ;X49A, C,E 禾口 I ;X50D 禾口 Y ;X51A 禾口 H ;X52A, H,I 禾口 M ;X53D, Ε, M,Q 禾口 T ;X54F,G, H,I 禾口 S ;X55D ; X57E, N 禾Π R ;Χ58Α, C, Ε, F, G, K, R, S, Τ, W ;Χ59Ε ;Χ61Α, F,I 禾Π R ;Χ62Α, F, G, H, N,S,T 禾Π V ; Χ63Α, C, Ε, F, G, N, Q,R 禾口 T ;G64D,M,Q 禾口 S ;Χ66Ε ;X67G 禾口 L ;X68C, D 禾口 R ;Χ69Υ ;Χ70Ε, G, K, L, Μ, P,S 禾口 V ;X72D 禾口 N ;X74C 禾口 Y ;X75G ;X76V ;Χ77Ε, V 禾口 Y ;Χ78Μ, Q 禾口 V ;X80D, L 禾口 N ; X82C, D, P, Q,S 禾口 T ;X83G 和 N ;Χ84Μ ;X87R ;Χ88Α, D, G,T 禾口 V ;X89V ;X90D 和 Q ;Χ91Α ;Χ92Ε 和S ;X93G, N和S ;X96G, N和T ;X100Q ;以及Χ102Τ,其中的位置通過與SEQ ID NO 7所示 FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在其它一些實施方案中,該至少一個突變編碼至少一個取代,選自:R2F, N,P 和 Y ;S3A, M,P 和 R ;L6K 和 M ;W7E ;I8W ;L10A, C, G, M 禾口 T ;L11A,F(xiàn) 禾口 T ;F12C,P, T ;A13C,G 禾口 S ;L14F ;A15G, M,T 禾口 V ;L16V ; I17S ;T19P 禾口 S ; M20V ;A21S ;F22E ;G23F, Q 禾口 W ;S24G, T 禾口 V ;T25A, D 禾口 W ;S26C 禾口 H ;S27A, F, H, P, Τ, V 禾口 Y ;A28V ;Q29E, I,R,S 禾口 T ;A30C ;A31H, K, N, S,V 禾口 W ;G32C, F, M, N, P,S 禾口 T ;K33E,F(xiàn), M, P禾口 S ;S34D, H,P 禾口 V ;N35C, Q 禾口 S ;G36C, D, L, N, S,W 禾口 Y ;E37C, G,K 禾口 Q ;K38F, Q,S 禾口 W ; K39A, C,G,I,L, M, P, S,T 禾口 V ;K45G 禾口 S ;Q46S ;T47E 禾口 F ;M48G, I,T,W 禾口 Y ;S49A, C, E 禾口 I ;T50D 禾口 Y ;M51A 禾口 H ;S52A, H,I 禾口 M ;A53D, Ε, M,Q 禾口 T ;A54F,G, H,I 禾口 S ;K55D ;K57E, N 禾口 R ;D58A, C, E, F, G, K, R, S, T, W ;V59E ;S61A, F,I 禾Π R ;Ε62Α, F, G, H, N, S,T 禾Π V ;Κ63Α,
      C,Ε, F, G, N, Q,R 禾口 T ;64D,M,Q 禾口 S ;Κ66Ε ;V67G 禾口 L ;Q68C, D 禾口 R ;Κ69Υ ;Q70E, G, K, L, Μ, P,S 禾口 V ;K72D 禾口 N ;V74C 禾口 Y ;D75G ;A76V ;Α77Ε, V 禾口 Y ;S78M, Q 禾口 V ;T80D, L 禾口 N ;N82C,
      D,P, Q,S 禾口 T ;E83G 禾口 N ;Κ84Μ ;K87R ;Ε88Α, D, G,T 禾口 V ;L89V ;K90D 禾口 Q ;Κ91Α ;D92E 禾口 S ; P93G,N和S ;A96G,N和T ;E100Q ;以及Η102Τ,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。宿主細胞為芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌(Bacillus subtilis)宿主細胞。經(jīng)修飾的全長蛋白酶為絲氨酸蛋白酶, 其源自野生型的或變體的親本絲氨酸蛋白酶。在一些實施方案中,野生型的或變體的親本絲氨酸蛋白酶為枯草芽孢桿菌、解淀粉芽孢桿菌、短小芽孢桿菌或地衣芽孢桿菌的絲氨酸蛋白酶。在一些實施方案中,第二多核苷酸編碼與SEQ ID NO :9的蛋白酶至少約65%相同的蛋白酶。優(yōu)選地,第二多核苷酸編碼SEQ ID NO :9的成熟蛋白酶。本發(fā)明也提供分離的、經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的全長蛋白酶,其中該分離的、經(jīng)修飾的多核苷酸包括第一多核苷酸,所述第一多核苷酸編碼全長蛋白酶的前原區(qū)域,并有效地連接到第二多核苷酸,所述第二多核苷酸編碼全長蛋白酶的成熟區(qū)域,其中第一多核苷酸編碼SEQ ID NO :7的前原區(qū)域,并進一步被突變以包含至少一個增強宿主細胞的蛋白酶生產(chǎn)的突變。第一多核苷酸的該至少一個突變編碼突變組合, 所述突變組合編碼選自以下的取代組合X49A-XMT,X49A-X72D,X49A-X78M,X49A-X78V, X49A-X93S, X49C-X24T, X49C-X72D, X49C-X78M, X49C-X78V, X49C-X91A, X49C-X93S, X91A-x24T, X91A-X49A, X91A-X52H, X91A-X72D, X91A-X78M, X91A-X78V, X93S-X24T, X93S-X49C, X93S-X52H, X93S-X72D, X93S-X78M 和 X93S-X78V,其中的位置通過與 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在其它實施方案中,至少一個突變?yōu)橥蛔兘M合,所述突變組合編碼選自以下的取代組合S49A-SMT,S49A-K72D, S49A-S78M, S49A-S78V, S49A-P93S, S49C-S24T, S49C-K72D, S49C-S78M, S49C-S78V, S49C-K91A, S49C-P93S, K91A-S24T, K91A-S49A, K91A-S52H, K91A-K72D, K91A-S78M, K91A-S78V, P93S-S24T, P93S-S49C,P93S-S52H,P93S-K72D,P93S-S78M 和 P93S-S78V,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。 宿主細胞為芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌宿主細胞。經(jīng)修飾的全長蛋白酶為絲氨酸蛋白酶,其源自野生型或變體的親本絲氨酸蛋白酶。在一些實施方案中,野生型或變體的親本絲氨酸蛋白酶為枯草芽孢桿菌、解淀粉芽孢桿菌、短小芽孢桿菌或地衣芽孢桿菌的絲氨酸蛋白酶。在一些實施方案中,第二多核苷酸編碼與SEQ ID NO :9的蛋白酶至少約65%相同的蛋白酶。優(yōu)選地,第二多核苷酸編碼SEQ ID NO :9的成熟蛋白酶。本發(fā)明也提供分離的、經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的全長蛋白酶,其中該分離的、經(jīng)修飾的多核苷酸包括第一多核苷酸,所述第一多核苷酸編碼全長蛋白酶的前原區(qū)域,并有效地連接到第二多核苷酸,所述第二多核苷酸編碼全長蛋白酶的成熟區(qū)域,其中第一多核苷酸編碼SEQ ID NO :7的前原區(qū)域,并進一步被突變以包含至少一個增強宿主細胞的蛋白酶生產(chǎn)的突變。第一多核苷酸的該至少一個突變編碼選自以下的至少一個缺失p. X18_X19del, p. X22_23del, pX37del, pX49del, p. X47del, pX55del 和 p. X57del, 其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,該至少一個突變編碼選自以下的至少一個缺失P. I18_T19del, p. F22_G23del, p. E37del, p. T47del, p. S49del, p. K55del 和 p. K57del,其中的位置通過與 SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。宿主細胞為芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌宿主細胞。經(jīng)修飾的全長蛋白酶為絲氨酸蛋白酶, 其源自野生型或變體的親本絲氨酸蛋白酶。在一些實施方案中,野生型或變體的親本絲氨酸蛋白酶為枯草芽孢桿菌、解淀粉芽孢桿菌、短小芽孢桿菌或地衣芽孢桿菌的絲氨酸蛋白酶。在一些實施方案中,第二多核苷酸編碼與SEQ ID NO :9的蛋白酶至少約65%相同的蛋白酶。優(yōu)選地,第二多核苷酸編碼SEQ ID NO :9的成熟蛋白酶。本發(fā)明也提供分離的、經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的全長蛋白酶,其中該分離的、經(jīng)修飾的多核苷酸包括第一多核苷酸,所述第一多核苷酸編碼全長蛋白酶的前原區(qū)域,并有效地連接到第二多核苷酸,所述第二多核苷酸編碼全長蛋白酶的成熟區(qū)域,其中第一多核苷酸編碼SEQ ID NO :7的前原區(qū)域,并進一步被突變以包含至少一個增強宿主細胞的蛋白酶生產(chǎn)的突變。第一多核苷酸的該至少一個突變編碼選自以下的至少一個插入p. X2_X3insT, p. X30_X3IinsA, p. X19_X20insAT, p. X21_X22insS, p. X32_X33insG, p. X36_X37insG和p. X58_X59insA,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,該至少一個突變編碼選自以下的至少一個插入p. R2_S3insT, p. A30_A3IinsA, p. T19_M20insAT, p. A21_F22insS, p. G32_ K33insG,p. G36_E37insG 和 p. D58_V59insA,其中的位置通過與 SEQ ID NO :7 所示 FNA 蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。宿主細胞為芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌宿主細胞。經(jīng)修飾的全長蛋白酶為絲氨酸蛋白酶,其源自野生型或變體的親本絲氨酸蛋白酶。在一些實施方案中,野生型或變體的親本絲氨酸蛋白酶為枯草芽孢桿菌、 解淀粉芽孢桿菌、短小芽孢桿菌或地衣芽孢桿菌的絲氨酸蛋白酶。在一些實施方案中,第二多核苷酸編碼與SEQ ID NO :9的蛋白酶至少約65%相同的蛋白酶。優(yōu)選地,第二多核苷酸編碼SEQ ID NO 9的成熟蛋白酶。本發(fā)明也提供分離的、經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的全長蛋白酶,其中該分離的、經(jīng)修飾的多核苷酸包括第一多核苷酸,所述第一多核苷酸編碼全長蛋白酶的前原區(qū)域,并有效地連接到第二多核苷酸,所述第二多核苷酸編碼全長蛋白酶的成熟區(qū)域,其中第一多核苷酸編碼SEQ ID NO :7的前原區(qū)域,并進一步被突變以包含至少2個增強宿主細胞的蛋白酶生產(chǎn)的突變。第一多核苷酸的該至少2個突變編碼選自以下的至少一個取代和至少一個缺失X46H-p. X47del,X49A_p. X22_X23del,X49C_p. X22_ X23del, X48I-p. X49del,X17ff-p. X18_X19del, X78M_p. X22_X23del, X78V-p. X22_X23del, X78V-p. X57del,X91A_p. X22_X23del,X91A_X48I-pX49del,X91A_p. X57del,X93S_p. X22_ X23del和X93S-X48I-p. X49del,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,該至少一個取代和至少一個缺失選自Q46H-p. T47del,S49A_p. F22_G23del,S49C_p. F22_G23del,M48I_p. S49del, I17ff-p. I18_T19del, S78M-p. F22_G23del, S78V-p. F22_G23del, K91A-p. F22_G23del, K91A-M48I-pS49del, K91A_p. K57del, P93S_p. F22_G23del 和 P93S_M48I-p. S49del,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。宿主細胞為芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌宿主細胞。經(jīng)修飾的全長蛋白酶為絲氨酸蛋白酶,其源自野生型或變體的親本絲氨酸蛋白酶。在一些實施方案中,野生型或變體的親本絲氨酸蛋白酶為枯草芽孢桿菌、解淀粉芽孢桿菌、短小芽孢桿菌或地衣芽孢桿菌的絲氨酸蛋白酶。在一些實施方案中,第二多核苷酸編碼與SEQ ID NO :9的蛋白酶至少約 65%相同的蛋白酶。優(yōu)選地,第二多核苷酸編碼SEQ ID NO :9的成熟蛋白酶。本發(fā)明也提供分離的、經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的全長蛋白酶,其中該分離的、經(jīng)修飾的多核苷酸包括第一多核苷酸,所述第一多核苷酸編碼全長蛋白酶的前原區(qū)域,并有效地連接到第二多核苷酸,所述第二多核苷酸編碼全長蛋白酶的成熟區(qū)域,其中第一多核苷酸編碼SEQ ID NO :7的前原區(qū)域,并進一步被突變以包含至少2個增強宿主細胞的蛋白酶生產(chǎn)的突變。第一多核苷酸的該至少2個突變編碼選自以下的至少一個取代和至少一個插入X49A-p. X2_X3insT, X49A_p32X_X33insG,X49A_p. X19_X20insAT, X49C-p.X19_X20insAT, X49C-p.X32_X33insG, X52H—p. X19_X20insAT, X72D-p.X19_ X20insAT, X78M_p. X19_X20insAT, X78V-p. X19_X20insAT, X91A-p. X19_X20insAT, X91A_p. X32_X33insG, X93S_p. X19_X20insAT 和 X93S_p. X32_X33insG,其中的位置通過與 SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,該至少一個取代和至少一個插入選自S49A-p. R2 S3insT, S49A_p32G_K33insG,S49A_p. T19_ M20insAT, S49C_p. T19_M20insAT, S49C_p. G32_K33insG, S49C_p. T19_M20insAT, S52H—p. T19_M20insAT, K72D_p. T19_M20insAT, S78M_p. T19_M20insAT, S78V-p. T19_M20insAT, K91A-p. T19_M20insAT, K91A-p. G32_K33insG, P93S-p. T19_M20insAT 禾P P93S-p. G32_ K33insG,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。宿主細胞為芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌宿主細胞。經(jīng)修飾的全長蛋白酶為絲氨酸蛋白酶,其源自野生型或變體的親本絲氨酸蛋白酶。在一些實施方案中,野生型或變體的親本絲氨酸蛋白酶為枯草芽孢桿菌、解淀粉芽孢桿菌、短小芽孢桿菌或地衣芽孢桿菌的絲氨酸蛋白酶。在一些實施方案中,第二多核苷酸編碼與SEQ ID N0:9的蛋白酶至少約65%相同的蛋白酶。優(yōu)選地,第二多核苷酸編碼SEQ ID NO :9的成熟蛋白酶。本發(fā)明也提供分離的、經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的全長蛋白酶,其中該分離的、經(jīng)修飾的多核苷酸包括第一多核苷酸,所述第一多核苷酸編碼全長蛋白酶的前原區(qū)域,并有效地連接到第二多核苷酸,所述第二多核苷酸編碼全長蛋白酶的成熟區(qū)域,其中第一多核苷酸編碼SEQ ID NO :7的前原區(qū)域,并進一步被突變以包含至少2個增強宿主細胞的蛋白酶生產(chǎn)的突變。第一多核苷酸的該至少2個突變編碼選自以下的至少一個缺失和至少一個插入P. X57del-p. X19_X20insAT 和 p. X22_X23del_p. X2_X3insT, 其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,該至少一個缺失和至少一個插入選自pK57del-p. T19_M20insAT 和p. F22_G23del-p. R2_S3insT。優(yōu)選地,第一多核苷酸編碼SEQ ID NO 7的前原區(qū)域,并被突變以包含至少2個增強宿主細胞的蛋白酶生產(chǎn)的突變。宿主細胞為芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌宿主細胞。經(jīng)修飾的全長蛋白酶為絲氨酸蛋白酶,其源自野生型或變體親本絲氨酸蛋白酶。在一些實施方案中,野生型或變體親本絲氨酸蛋白酶為枯草芽孢桿菌、解淀粉芽孢桿菌、短小芽孢桿菌或地衣芽孢桿菌絲氨酸蛋白酶。在一些實施方案中,第二多核苷酸編碼與SEQ ID NO :9的蛋白酶至少約65%相同的蛋白酶。優(yōu)選地,第二多核苷酸編碼SEQ ID NO 9的成熟蛋白酶。本發(fā)明也提供分離的、經(jīng)修飾的多核苷酸,所述多核苷酸編碼經(jīng)修飾的全長蛋白酶,其中該分離的、經(jīng)修飾的多核苷酸包括第一多核苷酸,所述第一多核苷酸編碼全長蛋白酶的前原區(qū)域,并有效地連接到第二多核苷酸,所述第二多核苷酸編碼全長蛋白酶的成熟區(qū)域,其中第一多核苷酸編碼SEQ ID NO :7的前原區(qū)域,并進一步被突變以包含至少3個增強宿主細胞的蛋白酶生產(chǎn)的突變。第一多核苷酸的該至少3個突變編碼相應(yīng)于 p. X49del-p. X19_X20insAT-X48I的至少一個缺失、至少一個插入和至少一個取代,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,編碼至少一個缺失、至少一個插入和至少一個取代的至少3個突變相應(yīng)于 p. S49del-p. T19_M20insAT-M48I,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。宿主細胞為芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌宿主細胞。經(jīng)修飾的全長蛋白酶為絲氨酸蛋白酶,其源自野生型或變體親本絲氨酸蛋白酶。在一些實施方案中,野生型或變體親本絲氨酸蛋白酶為枯草芽孢桿菌、解淀粉芽孢桿菌、短小芽孢桿菌或地衣芽孢桿菌絲氨酸蛋白酶。在一些實施方案中,第二多核苷酸編碼與 SEQ ID NO :9的蛋白酶至少約65%相同的蛋白酶。優(yōu)選地,第二多核苷酸編碼SEQ ID NO: 9的成熟蛋白酶。在另一個實施方案中,本發(fā)明提供了由以上所描述的任一經(jīng)修飾的全長多核苷酸編碼的多肽。在另一個實施方案中,本發(fā)明提供了表達載體,所述表達載體包含以上所描述的任一分離的、經(jīng)修飾的多核苷酸。在一些實施方案中,表達載體還包含AprE啟動子,例如 SEQ ID NO 333 或 SEQ ID NO :445。在另一個實施方案中,本發(fā)明提供了芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌宿主細胞,所述宿主細胞包含本發(fā)明的表達載體,并能夠表達以上所提供的任一經(jīng)修飾的多核苷酸。優(yōu)選地,表達載體穩(wěn)定地整合到宿主的基因組中。在一些實施方案中,本發(fā)明的宿主細胞為芽孢桿菌屬物種宿主細胞。在一些實施方案中,芽孢桿菌屬物種宿主細胞選自枯草芽孢桿菌(B. subtilis)、地衣芽孢桿菌(B. Iicheniformis)、遲緩芽孢桿菌 (B. Ientus)、短芽胞桿菌(B. brevis)、嗜熱脂肪芽孢桿菌(B. stearothermophilus)、嗜堿芽孢桿菌(B. alkalophilus)、解淀粉芽孢桿菌(B. amyloliquefaciens)、克勞氏芽孢桿菌 (B. clausii)、耐鹽芽孢桿菌(B. halodurans)、巨大芽孢桿菌(B. megaterium)、凝結(jié)芽孢桿菌(B. coagulans)、環(huán)狀芽孢桿菌(B. circulans)、燦爛芽孢桿菌(B. Iautus)和蘇云金芽孢桿菌(B. thuringiensis)。在一些實施方案中,芽孢桿菌屬物種宿主細胞為枯草芽孢桿菌宿主細胞。在另一個實施方案中,本發(fā)明提供了用于在芽孢桿菌屬物種宿主細胞中生產(chǎn)成熟蛋白酶的方法,所述方法包括(a)提供包含編碼經(jīng)修飾的全長蛋白酶的分離的、經(jīng)修飾的多核苷酸的表達載體,其中所述多核苷酸包括第一多核苷酸,所述第一多核苷酸編碼全長蛋白酶的前原區(qū)域,并有效地連接到第二多核苷酸,所述第二多核苷酸編碼全長蛋白酶的成熟區(qū)域,其中第一多核苷酸編碼SEQ ID NO :7的前原區(qū)域,并進一步被突變以包含至少一個增強宿主細胞的成熟蛋白酶生產(chǎn)的突變,其中該至少一個突變選自X2F,N,P和Y;X3A,M,P 禾口 R ;X6K 禾口 M ;X7E ; I8W ;X10A,C,G,M 禾口 T ;X11A,F(xiàn) 禾口 T ;X12C,P,T ;X13C,G 禾口 S ;X14F ; X15G, M,T 禾口 V ;X16V ;X17S ;X19P 禾口 S ;X20V ;X21S ;X22E ;X23F, Q 禾口 W ;X24G, T 禾口 V ;X25A, D 禾口 W ;X26C 禾口 H ;X27A, F, H, P, T,V 禾口 Y ;X28V ;X29E, I,R,S 禾口 T ;X30C ;X31H, K, N, S, V 禾口 W ;X32C, F, M, N, P,S 禾口 V ;X33E, F, M,P 禾口 S ;X34D, H,P 禾口 V ;X35C, Q 和 S ;X36C, D, L, N, S, W 禾口 Y ;X37C, G,K 禾口 Q ;X38F, Q,S 禾口 W ;X39A, C,G,I,L, M, P, S,T 禾口 V ;X45G 禾口 S ;X46S ;X47E 禾口 F ;X48G, I,T,W 禾口 Y ;X49A, C,E 禾口 I ;X50D 禾口 Y ;X51A 禾口 H ;X52A, H,I 禾口 M ;X53D, Ε, M, Q 禾Π T ;X54F,G, H,I 禾Π S ;X55D ;Χ57Ε, N 禾Π R ;Χ58Α, C, Ε, F, G, K, R, S, Τ, W ;Χ59Ε ;Χ61Α, F, I 禾口 R ;Χ62Α, F, G, H, N, S,T 禾口 V ;Χ63Α, C, Ε, F, G, N, Q,R 禾口 T ;G64D,M,Q 禾口 S ;Χ66Ε ;X67G 禾口 L ;X68C, D 禾口 R ;Χ69Υ ;Χ70Ε, G, K, L, Μ, P,S 禾口 V ;X72D 禾口 N ;X74C 禾口 Y ;X75G ;X76V ;Χ77Ε, V 和 Y ;Χ78Μ, Q 和 V ;X80D, L 和 N ;X82C, D, P, Q,S 和 T ;X83G 和 N ;Χ84Μ ;X87R ;Χ88Α, D, G, T 和 V ;X89V ;X90D 和 Q ;Χ91Α ;Χ92Ε 和 S ;X93G, N 和 S ;X96G, N 和 T ;X100Q ;Χ102Τ ;Χ49Α-Χ24Τ, X49A-X72D, Χ49Α-Χ78Μ, X49A-X78V, X49A-X93S, X49C-X24T, X49C-X72D, X49C-X78M, X49C-X78V, X49C-X91A, X49C-X93S, Χ91Α_χ24Τ, Χ91Α-Χ49Α, Χ91Α-Χ52Η, X91A-X72D, Χ91Α-Χ78Μ, X91A-X78V, X93S-X24T, X93S-X49C, X93S-X52H, X93S-X72D, X93S-X78M, X93S-X78V,p. X18_X19del,p. X22_23del,pX37del,pX49del,p. X47del,pX55del,p. X57del, p. X2_X3insT, p. X30_X3IinsA, p. X19_X20insAT, p. X21_X22insS, p. X32_X33insG, p. X36_ X37insG, p.X58_X59insA, X46H-p.X47del, X49A-p. X22_X23del, X49C-p. X22_X23del, X48I-P. X49del,X17ff-p. X18_X19del, X78M-p. X22_X23del, X78V-p. X22_X23del, X78V-p. X57del, X91A-P. X22_X23del,X91A_X48I-pX49del,X91A_p. X57del,X93S_p. X22_X23del, X93S-X48I-p. X49del, X49A_p. X2_X3insT,X49A_p32X_X33insG,X49A_p. X19_X20insAT, X49C-p.X19_X20insAT, X49C-p.X32_X33insG, X52H—p. X19_X20insAT, X72D-p.X19_ X20insAT, X78M_p. X19_X20insAT, X78V-p. X19_X20insAT, X91A_p. X19_X20insAT, X91A-p. X32_X33insG, X93S_p. X19_X20insAT,X93S_p. X32_X33insG, p.X57del_p. X19_X20insAT, p. X22_X23del-p. X2_X3insT,p. X49del-p. X19_X20insAT-X48I,以及 p. X49del_p· X19_ X20insAT-X48I,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號;(b)以表達載體轉(zhuǎn)化宿主細胞;以及(c)在允許成熟蛋白酶生產(chǎn)的合適條件下培養(yǎng)轉(zhuǎn)化了的宿主細胞。在一些實施方案中,所述方法還包括回收成熟蛋白酶。在一些實施方案中,蛋白酶為絲氨酸蛋白酶。在一些實施方案中,芽孢桿菌屬物種宿主細胞為枯草芽孢桿菌宿主細胞。在一些實施方案中,經(jīng)修飾的多核苷酸編碼全長蛋白酶,所述全長蛋白酶包含與SEQ ID NO :9至少約65%相同的成熟區(qū)域。優(yōu)選地,第二多核苷酸編碼SEQ ID NO 9的成熟蛋白酶。宿主細胞為芽孢桿菌屬物種宿主細胞,例如枯草芽孢桿菌宿主細胞。 經(jīng)修飾的全長蛋白酶為絲氨酸蛋白酶,其源自野生型或變體親本絲氨酸蛋白酶。在一些實施方案中,野生型或變體親本絲氨酸蛋白酶為枯草芽孢桿菌、解淀粉芽孢桿菌、短小芽孢桿菌或地衣芽孢桿菌絲氨酸蛋白酶。 在另一個實施方案中,本發(fā)明提供了用于在芽孢桿菌屬物種宿主細胞中生產(chǎn)成熟蛋白酶的方法,所述方法包括(a)提供表達載體,所述表達載體包含SEQ ID NO :7所示的第一多核苷酸,此第一多核苷酸有效地連接到第二多核苷酸,所述第二多核苷酸編碼SEQ ID NO 9的前原區(qū)域,其中第一多核苷酸被突變以編碼至少一個增強細胞中該成熟蛋白酶生產(chǎn)的突變,其中該至少一個突變選自:R2F,N,P和Y ;S3A,M,P和R ;L6K和M ;W7E ; I8W ;L10A,C,G,M 禾口 T ;L11A,F(xiàn) 禾口 T ;F12C,P,T ;A13C,G 禾口 S ;L14F ;A15G,M,T 禾口 V ;L16V ; I17S ;T19P 禾口 S ;M20V ;A21S ;F22E ;G23F,Q 和 W ;S24G,T 和 V ;T25A,D 和 W ;S26C 和 H ;S27A,F(xiàn),H,P,T,V 和 Y ;A28V ;Q29E, I,R,S 禾口 T ;A30C ;A31H,K,N,S,V 和 W ;G32C,F(xiàn),M,N,P,S 和 T ;K33E,F(xiàn),M,P 和 S ;S34D,H,P 和 V ;N35C,Q 禾口 S ;G36C,D,L,N,S,W 和 Y ;E37C,G,K 禾口 Q ;K38F,Q,S 禾口 W ;K39A, C,G,I,L,M,P,S,T 禾口 V ;K45G 禾口 S ;Q46S ;T47E 和 F ;M48G, I,T,W 禾口 Y ;S49A,C,E 禾口 I ;T50D 和 Y ;M51A和 H ;S52A,H,I 和M ;A53D,E,M,Q和 T ;A54F,G,H,I 和 S ;K55D ;K57E,N和 R ;D58A, C, Ε, F, G, K, R, S, Τ, W ;V59E ;S61A, F,I 和 R ;Ε62Α, F, G, H, N, S,T 和 V ;Κ63Α, C, Ε, F, G, N, Q, R 禾口 T ;64D,M,Q 禾口 S ;K66E ;V67G 和 L ;Q68C, D 和 R ;K69Y ;Q70E, G, K,L,M,P,S 和 V ;K72D 和 N ;V74C 和 Y ;D75G ;A76V ;A77E, V 和 Y ;S78M, Q 和 V ;T80D, L 和 N ;N82C, D, P, Q,S 禾口 T ;E83G 和 N ;K84M ;K87R ;E88A, D, G,T 禾口 V ;L89V ;K90D 和 Q ;K91A ;D92E 和 S ;P93G, N 和 S ;A96G, N 和 T;E100Q ;H102T,S49A-S24T,S49A-K72D,S49A-S78M,S49A-S78V,S49A-P93S,S49C-S24T, S49C-K72D, S49C-S78M, S49C-S78V, S49C-K91A, S49C-P93S, K91A-S24T, K91A-S49A, K91A-S52H, K91A-K72D, K91A-S78M, K91A-S78V, P93S-S24T, P93S-S49C, P93S-S52H, P93S-K72D, P93S-S78M, P93S-S78V, p.I18_T19del, p. F22_G23del,p. E37del, p.T47del, p.S49del, p.K55del, p. K57del, p. R2_S3insT, p. A30_A31insA, p.T19_M20insAT, p. A21_ F22insS, p.G32_K33insG, p. G36_E37insG, p. D58_V59insA, Q46H-p. T47del, S49A-p. F22_ G23del, S49C_p. F22_G23del,M48I_p. S49del,I17ff-p. I18_T19del, S78M_p. F22_G23del, S78V-p. F22_G23del, K91A_p. F22_G23del,K91A_M48I-pS49del,K91A_p. K57del,P93S_p. F22_G23del, P93S_M48I_p. S49del, S49A_p. R2_S3insT, S49A_p32G_K33insG,S49A_p. T19_ M20insAT, S49C_p. T19_M20insAT,S49C_p. G32_K33insG,S49C_p. T19_M20insAT,S52H_p. T19_M20insAT, K72D-p. T19_M20insAT, S78M_p. T19_M20insAT,S78V-p. T19_M20insAT, K91A-p.T19_M20insAT, K91A-p. G32_K33insG, P93S-p. T19_M20insAT, P93S-p. G32_ K33insG, pK57del_p. T19_M20insAT, p. F22_G23del_p. R2_S3insT,以及 p. S49del_p. T19_ M20insAT-M48I ; (b)以表達載體轉(zhuǎn)化芽孢桿菌屬物種宿主細胞;以及(c)在允許成熟蛋白酶生產(chǎn)的合適條件下培養(yǎng)轉(zhuǎn)化了的宿主細胞。在一些實施方案中,所述方法另外還包括回收成熟蛋白酶。在一些實施方案中,蛋白酶為絲氨酸蛋白酶,并且其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,芽孢桿菌屬物種宿主細胞為枯草芽孢桿菌宿主細胞。在一些實施方案中,該至少一個突變增加該成熟蛋白酶的生產(chǎn)。附圖簡述

      圖1提供了 SEQ ID NO=I的全長FNA蛋白酶的氨基酸序列。氨基酸1-107 (SEQ ID NO 7)和氨基酸108-382 (SEQ ID NO 9)分別對應(yīng)于FNA (SEQ ID NO 1)的前原多肽和成熟部分。圖2顯示了 FNA的未經(jīng)修飾的前原區(qū)域(SEQ ID NO 7)與來自各種芽孢桿菌屬物種的蛋白酶的未經(jīng)修飾的前原區(qū)域的氨基酸序列比對。圖3顯示了 FNA的成熟區(qū)域(SEQ ID NO 9)與來自各種芽孢桿菌屬物種的蛋白酶的成熟區(qū)域的氨基酸序列比對。圖4顯示了示意圖,說明用于產(chǎn)生符合讀框的缺失和插入的方法。文庫質(zhì)量33% 沒有插入或缺失;33%具有插入和33%具有缺失;沒有移碼突變。
      圖5顯示了質(zhì)粒pAC-FNAare的示意圖,所述質(zhì)粒用于在枯草芽孢桿菌 (B. subtilis)中表達FNA蛋白酶。質(zhì)粒的元件如下pUBllO =來自質(zhì)粒pUBllO的DNA片段[McKenzie T.,Hoshino T.,Tanaka T.,Sueoka N. (1986)pUB110 的核苷酸序列與復(fù)制及其調(diào)節(jié)相關(guān)的一些^ilient特征.Plasmid 15 :93-103],pBR322 =來自質(zhì)粒pBR322 的 DNA >t g [Bolivar F, Rodriguez RL, Greene PJ, Betlach MC, Heyneker HL, Boyer HW. (1977).新克隆載體的構(gòu)建和表征.II.多用途克隆系統(tǒng).Gene 2 :95-113],pC194 =來自質(zhì)粒 PC194 的 DNA 片段[Horinouchi S.,Weisblum B. (1982)pC194,一種規(guī)定可誘導(dǎo)的氯霉素抗性的質(zhì)粒,的核苷酸序列和功能圖譜.J. Bacteriol 150 :815-825]。圖6顯示了用于在枯草芽孢桿菌中表達FNA蛋白酶的整合型載體 ρJH-FNA(Ferrari 等,J. Bacteriol. 154 1513-1515[1983])的示意圖。圖7顯示了柱形圖,描述了相對于相同成熟FNA從未經(jīng)修飾的全長FNA前體蛋白質(zhì)(未經(jīng)修飾的;SEQ ID NO :1)的加工生產(chǎn),從經(jīng)修飾的全長FNA蛋白質(zhì)加工的成熟 FNA(SEQ ID NO 9)的百分比相對活性,其中經(jīng)修飾的全長FNA蛋白質(zhì)具有包含氨基酸取代 P93S和缺失p. F22_G23del的突變了的前原多肽(克隆684)。發(fā)明描述本發(fā)明提供了經(jīng)修飾的多核苷酸,其編碼經(jīng)修飾的蛋白酶;本發(fā)明還提供了用于改變蛋白酶在微生物中的生產(chǎn)的方法。特別地,經(jīng)修飾的多核苷酸包含一個或多個突變,編碼經(jīng)修飾的蛋白酶,所述經(jīng)修飾的蛋白酶具有增強該活性酶生產(chǎn)的前原區(qū)域修飾。本發(fā)明還涉及用于改變在微生物(例如芽孢桿菌屬物種)中的蛋白酶生產(chǎn)的方法。除非在本文中另有指明,本文所使用的所有技術(shù)和科學(xué)術(shù)語都具有本發(fā)明所屬領(lǐng)域的普通技術(shù)人員通常理解的含義(例如,Singleton和Minsbury,微生物學(xué)和分子生物學(xué)i司典(Dictionary of Microbiology and Molecular Biology),第二片反,John Wiley and Sons,NY[1994];以及 Hale 和 Markham,Harper Collins 生物學(xué)詞典(The Harper Collins Dictionary of Biology),Harper Perennial,NY[1991])。本文描述了優(yōu)選的方法和材料, 但是與本文描述的方法和材料相似或等同的任何方法和材料都可用于本發(fā)明的實施。因此,下文即將定義的術(shù)語通過說明書整體而進行更為充分的描述。此外,如本文中使用的, 除非上下文另有清楚指示,否則單數(shù)"a"," an"和"the"包括復(fù)數(shù)指代。數(shù)值范圍包括界定該范圍的數(shù)字。除非另有指明,分別地,核酸是按照5'至3'的方向從左到右書寫的;氨基酸序列是按照氨基到羧基的方向從左到右書寫的。應(yīng)當理解,本發(fā)明并不限于所描述的特定的方法、方案和試劑,這些方法、方案和試劑可以根據(jù)本領(lǐng)域技術(shù)人員使用它們的背景而變化。在整個說明書中給出的每一個最大數(shù)值界限均旨在包括每一個較小的數(shù)值界限, 如同在本文中明確書寫了該較小的數(shù)值界限。在整個本說明書中給出的每一個最小數(shù)值界限均包括每一個較大的數(shù)值界限,如同在本文中明確書寫了該較大的數(shù)值界限。在整個說明書中給出的每一個數(shù)值范圍均包括落入該較寬數(shù)值范圍以內(nèi)的每一個較窄的數(shù)值范圍, 如同在本文中明確書寫了所有該較窄的數(shù)值范圍。本文中(包括上文和下文中)所提到的所有專利、專利申請、文獻和出版物都通過引用明確并入本文。此外,本文提供的標題并非是對本發(fā)明的各個方面或?qū)嵤┓桨傅南拗?,本發(fā)明的各個方面或?qū)嵤┓桨缚梢酝ㄟ^參照說明書整體而得出。因此,下文即將定義的術(shù)語應(yīng)通過參考說明書整體而更完整地定義。但是,為了便于理解本發(fā)明,對多個術(shù)語定義如下。定義如本文中使用的,術(shù)語“分離的”和“純化的”指核酸或氨基酸(或其它組分)從至少一種天然與其相關(guān)的組分中分離出。本文中術(shù)語“經(jīng)修飾的多核苷酸”指已經(jīng)經(jīng)過改變而包含至少一個突變以編碼“經(jīng)修飾的”蛋白質(zhì)的多核苷酸序列。如本文中使用的,術(shù)語“蛋白酶”和“蛋白水解活性”指顯示出能夠水解肽或具有肽鍵的底物的能力的蛋白質(zhì)或肽。已有很多公知的方法用于測定蛋白質(zhì)水解活性 (Kalisz, “ Microbial Proteinases “,于 Fiechter (ed. ), Advances in Biochemical Engineering/Biotechnology, [1988])。例如,可以通過分析所產(chǎn)生的蛋白酶水解商業(yè)底物之能力的比較試驗來確定蛋白水解活性??捎糜诖祟惖鞍酌富虻鞍姿饣钚苑治鲋械氖纠缘孜锇ǖ幌抻诙谆业鞍?Sigma C-9801)、牛膠原蛋白(Sigma C-9879)、牛彈性蛋白(Sigma E-1625)和牛角蛋白(ICN Biomedical 902111)。利用這些底物進行的比色測定法在是本領(lǐng)域公知的(見例如,WO 99/34011和美國專利號6,376,450,它們都通過引用并入本文)。AAPF 檢驗(見例如,Del Mar 等,Anal. Biochem.,99 :316-320 [1979])也可用于確定成熟蛋白酶的產(chǎn)生。該檢驗測量酶水解可溶性合成底物(琥珀酰丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-對硝基苯胺(sAAPF-pNA))時釋放對硝基苯胺的速率。在分光光度計上于410nm測量從水解反應(yīng)產(chǎn)生黃色的速率,其與活性酶濃度成比例。特別地,本文中術(shù)語“蛋白酶”指“絲氨酸蛋白酶”。如本文中使用的,術(shù)語“枯草桿菌蛋白酶”和“絲氨酸蛋白酶”可互換使用,指 MEROPS-肽酶數(shù)據(jù)庫中描述的S8絲氨酸蛋白酶家族的任何成員(Rawlings等,MEROPS the peptidase database, Nucleic Acids Res, 34Database issue,D270-272, 2006,于網(wǎng)站 merops. sanger. ac. uk/cgi-bin/merops. cgi ? id = s08 ;action = ·)。以下信息得自截止于2008年11月6日的MEROPS-肽酶數(shù)據(jù)庫“肽酶S8家族包含絲氨酸內(nèi)肽酶和絲氨酸蛋白酶及其同源物”(Biochem J,290 =205-218,1993) 0 S8家族,也被稱為枯草桿菌蛋白酶家族,是第二大的絲氨酸肽酶家族,其可被分為2個亞家族,枯草桿菌蛋白酶(S08. 001)為S8A 亞家族的典型例子,kexin(S08. 070)為S8B亞家族的典型例子。三肽基肽酶II (TPP-II ; S08.090)以前被認為是第三亞家族的典型例子,但已經(jīng)被確定是錯誤分類。S8家族的成員在序列中具有按Asp,His和kr的順序的催化三聯(lián)體,該順序與Si,S9和SlO家族的不同。 在S8A亞家族中,活性位點殘基時常位于基序Asp-ThrAer-Gly (其與AA族(clan)中天冬氨酸內(nèi)肽酶家族的序列基序類似),His-Gly-Thr-His和Gly-Thr-Ser-Met-Ala-Xaa-Pro 中。在S8B亞家族中,催化殘基時常位于基序Asp-Asp-Gly,His-Gly-Thr-Arg和 Gly-Thr-Ser-Ala/Val-Ala/Ser-Pro中。S8家族的大多數(shù)成員是內(nèi)肽酶,其在中性-弱堿性PH值條件下具有活性。該家族中許多肽酶是熱穩(wěn)定的。酪蛋白常被用作蛋白質(zhì)底物,典型的合成底物為suc-AAPF。該家族的大多數(shù)成員為非特異性肽酶,其偏好在疏水殘基后進行切割。然而,S8B亞家族的成員,例如kexin (S08. 070)和fur in (S08. 071),在雙堿性氨基酸后進行切割。S8家族的大多數(shù)成員受一般絲氨酸肽酶抑制劑(例如DFP和PMSF)的抑制。因為該家族的許多成員和鈣結(jié)合以保持穩(wěn)定性,故以EDTA和EGTA可以看到抑制,EDTA
      15和EGTA常被認為是金屬肽酶的特異性抑制劑。蛋白抑制劑包括火雞卵類粘蛋白第三結(jié)構(gòu)域(101. 003),鏈霉菌屬(Sti^ptomyces)枯草桿菌蛋白酶抑制劑(116. 003),113家族的成員例如eglin C(I13. 001)和大麥抑制劑CI-IA(113. 005),其中的許多抑制劑也抑制胰凝乳蛋白酶(S01.001),枯草桿菌蛋白酶前肽自身具有抑制性,來自酵母屬的同源蛋白酶B抑制劑抑制cereviSin(S08. 052)?,F(xiàn)已確定了 S8家族幾個成員的三級結(jié)構(gòu)。典型的S8蛋白結(jié)構(gòu)由三層(7股β折疊夾在兩層螺旋之間)組成??莶輻U菌蛋白酶(S08.001)是SB族 (SB)的典型結(jié)構(gòu)。盡管結(jié)構(gòu)不同,枯草桿菌蛋白酶和胰凝乳蛋白酶(S01.001)的活性位點可以重疊,這說明該相似性是趨同進化而不是趨異進化的結(jié)果。本文中的術(shù)語“前體蛋白酶”和“親本蛋白酶”指未經(jīng)修飾的全長蛋白酶,其包含全長野生型或變體親本蛋白酶的前原區(qū)域和成熟區(qū)域。前體蛋白酶可以源自天然存在的 (即野生型)蛋白酶,或源自變體蛋白酶。野生型或變體前體蛋白酶的前原區(qū)域被修飾,以產(chǎn)生經(jīng)修飾的蛋白酶。在本文上下文中,“經(jīng)修飾的”和“前體”蛋白酶都是包含信號肽、原 (pro)區(qū)域和成熟區(qū)域的全長蛋白酶。編碼經(jīng)修飾的序列的多核苷酸被稱為“經(jīng)修飾的多核苷酸”,編碼前體蛋白酶的多核苷酸被稱為“前體多核苷酸”。“前體多肽”和“前體多核苷酸”可分別與稱謂“未經(jīng)修飾的前體多肽”或“未經(jīng)修飾的前體多核苷酸”互換。本文中“天然存在的”或“野生型”指蛋白酶或編碼所述蛋白酶的多核苷酸,其中所述蛋白酶具有與天然存在的氨基酸序列相同的未經(jīng)修飾的氨基酸序列。天然存在的酶包括天然酶,即在特定微生物中天然表達或存在的那些酶。野生型序列或天然存在的序列是變體所源自的序列。野生型序列可編碼同源或異源蛋白質(zhì)。如本文中使用的,“變體”指通過在C-末端和N-末端中任一或兩者添加一個或多個氨基酸、在氨基酸序列的一個或多個不同位點取代一個或多個氨基酸、在蛋白質(zhì)的任一末端或兩個末端或在氨基酸序列中的一個或多個位點缺失一個或多個氨基酸、和/或在氨基酸序列中的一個或多個位點插入一個或多個氨基酸,而與其相應(yīng)野生型蛋白質(zhì)不同的蛋白質(zhì)。在本發(fā)明上下文中,通過解淀粉芽孢桿菌(B.amyloliquefaciens)蛋白酶FNA(SEQ ID NO 9)來示例變體蛋白質(zhì),它是天然存在的蛋白質(zhì)BPN’的變體,其與BPN’的不同在于在成熟區(qū)域的單個氨基酸取代Y217L。變體蛋白酶包括天然存在的同源物。例如,SEQ ID NO 9的成熟蛋白酶的變體包括圖3所示的同源物。術(shù)語“源自”和“得自”不僅指由所述及生物的菌株產(chǎn)生的或可產(chǎn)生的蛋白酶,也指由分離自該菌株的DNA序列編碼并在含有該DNA序列的宿主生物中生產(chǎn)的蛋白酶。此外, 該術(shù)語還指由合成的和/或cDNA來源的DNA序列編碼并具有所述及蛋白酶的標識特征的蛋白酶。作為例示,“來自芽孢桿菌的蛋白酶”指由芽孢桿菌天然產(chǎn)生的具有蛋白水解活性的那些酶,也指絲氨酸蛋白酶,如由芽孢桿菌源產(chǎn)生的、通過使用遺傳工程技術(shù)而從轉(zhuǎn)化了編碼所述絲氨酸蛋白酶的核酸的非芽孢桿菌生物產(chǎn)生的那些絲氨酸蛋白酶。“經(jīng)修飾的全長蛋白酶”或“經(jīng)修飾的蛋白酶”可互換使用,指包含源自親本蛋白酶的成熟區(qū)域和前原區(qū)域的全長蛋白酶,其中前原區(qū)域被突變以包含至少一個突變。在一些實施方案中,前原區(qū)域和成熟區(qū)域源自相同的親本蛋白酶。在其它實施方案中,前原區(qū)域和成熟區(qū)域源自不同的親本蛋白酶。經(jīng)修飾的蛋白酶包含經(jīng)修飾以包含至少一個突變的前原區(qū)域,它由經(jīng)修飾的多核苷酸編碼。經(jīng)修飾的蛋白酶的氨基酸序列可以被認為是通過在前體氨基酸序列的前原區(qū)域中進行一個或多個氨基酸的取代、缺失或插入而自所述前體蛋白酶氨基酸序列“產(chǎn)生的”。在一些實施方案中,前體蛋白酶的前原區(qū)域的一個或多個氨基酸被取代,以產(chǎn)生經(jīng)修飾的全長蛋白酶。該修飾是對編碼“前體”或“親本”蛋白酶的氨基酸序列的“前體”或“親本” DNA序列的修飾,而非對前體蛋白酶本身進行的操作。本文中使用的術(shù)語“增強”是指突變對成熟蛋白酶的生產(chǎn)的影響,其中來自經(jīng)修飾的前體的成熟蛋白酶的產(chǎn)量大于相同的成熟蛋白酶自未經(jīng)修飾的前體加工時的產(chǎn)量。術(shù)語“全長蛋白質(zhì)”在本文中指基因的初級基因產(chǎn)物,其包含信號肽、原序列和成熟序列。例如,SEQ ID NO 1的全長蛋白酶包含信號肽(前區(qū)(pre region)) (VRSKKLWISL LFALALIFTM AFGSTSSAQA ;SEQ ID NO :3,由例如 SEQ ID NO :4 的前(pre)多核苷酸編碼),原區(qū)(pro region) (AGKSNGEKKY IVGFKQTMST MSAAKKKDVI SEKGGKVQKQ FKYVDAASAT LNEKAVKELK KDPSVAYVEE DHVAHAY ;SEQ ID NO :5,由例如前多核苷酸GCAGGGAAATCAAACGGGG AAAAGAAATATATTGTCGGGTTTAAACAGACAATGAGCACGATGAGCGCCGCTAAGAAGAAAGATGTCATTTCTGAA AAAGGCGGGAAAGTGCAAAAGCAATTCAAATATGTAGACGCAGCTTCAGCTACATTAAACGAAAAAGCTGTAAAAGA ATTGAAAAAAGACCCGAGCGTCGCTTACGTTGAAGAAGATCACGTAGCACACGCGTAC :SEQ ID NO :6 編碼), 和成熟區(qū)域(SEQ ID NO 9)。術(shù)語“信號序列”、“信號肽”或“前區(qū)”指可參與蛋白質(zhì)的成熟或前體形式分泌的任何核苷酸和/或氨基酸序列。信號序列的該定義是功能性定義,其意欲包括由蛋白質(zhì)基因N-末端部分編碼的、參與實現(xiàn)蛋白質(zhì)分泌的所有那些氨基酸序列。例如,本發(fā)明的蛋白酶的前肽可以至少包括與SEQ ID NO 1的1-30位殘基相同的氨基酸序列。術(shù)語“原序列,,或“原區(qū),,是信號序列和成熟蛋白酶之間的氨基酸序列,其對于蛋白酶的分泌/生產(chǎn)來說是必要的。將原序列切割掉將產(chǎn)生成熟活性蛋白酶。例如,本發(fā)明的蛋白酶的原區(qū)可以至少包括與SEQ ID NO :1的31-107位殘基相同的氨基酸序列。術(shù)語“前原區(qū)域”或“前原多肽”在本文中指蛋白酶的N-末端區(qū)域,其包括全長蛋白酶的前區(qū)和原區(qū)。例如,一個前原區(qū)域如SEQ ID NO :7所示,其包括SEQ ID NO :5的原區(qū)和SEQ ID NO 3的信號肽(前區(qū))。術(shù)語“成熟形式”或“成熟區(qū)域”指蛋白質(zhì)的最終功能性部分。例如,本發(fā)明的蛋白酶的成熟形式可以包括與SEQ ID NO 1的108-382位殘基相同的氨基酸序列。在本上下文中,“成熟形式” “加工自”全長蛋白酶,其中對全長蛋白酶的加工包括除去信號肽和除去原區(qū)。如本文中使用的,“同源蛋白”指細胞中天然的或天然存在的蛋白質(zhì)或多肽。類似地,“同源多核苷酸”指細胞中天然的或天然存在的多核苷酸。如本文中使用的,術(shù)語“異源蛋白”指不在宿主細胞中天然存在的蛋白質(zhì)或多肽。 類似地,“異源多核苷酸”指不在宿主細胞中天然存在的多核苷酸。異源多肽和/或異源多核苷酸包括嵌合多肽和/或多核苷酸。如本文中使用的,“取代的”和“取代”指對親本序列中的氨基酸殘基或核酸堿基的替換。在一些實施方案中,取代包括對天然存在的殘基或堿基的替換。在本文中,經(jīng)修飾的蛋白酶涵蓋在前體蛋白酶的前原區(qū)域的任何一個氨基酸殘基位上19種天然存在的氨基酸的任何一種的取代。在一些實施方案中,對兩個或更多個氨基酸進行取代,以產(chǎn)生包含氨基酸取代組合的經(jīng)修飾的蛋白酶。在一些實施方案中,取代的組合用發(fā)生取代的氨基酸位置來表示。例如,以X49A-X93S表示的組合意思是親本蛋白質(zhì)中第49位無論是何種氨基酸(X)都用丙氨酸(A)取代,以及親本蛋白質(zhì)中第93位無論是何種氨基酸(X)都用絲氨酸 (S)取代。氨基酸的位置按對應(yīng)于全長親本蛋白質(zhì)中的編號位置給出。如本文中使用的,“缺失”指遺傳物質(zhì)的丟失,其中部分DNA序列失去。盡管可以缺失任何數(shù)量的核苷酸,但缺失的核苷酸數(shù)目不被3整除將導(dǎo)致移碼突變,造成缺失之后的所有密碼子在翻譯中被錯誤地閱讀,從而產(chǎn)生嚴重改變的和可能無功能的蛋白質(zhì)。缺失可以在末端,即對染色體末端發(fā)生的缺失;或者缺失可以是中間缺失,即從基因內(nèi)部發(fā)生的缺失。在本文中,缺失以被缺失的氨基酸(一個或多個)和該氨基酸(一個或多個)的位置表示。例如,P. I18del表示第18位的異亮氨酸(I)被缺失;p. I18_T19del表示第18位的異亮氨酸(I)和第19位的蘇氨酸(T)都被缺失。可以單獨地或與一個或多個取代和/或插入組合地,實施一個或多個氨基酸的缺失。如本文中使用的,“插入”指向DNA中添加數(shù)量為3的倍數(shù)的核苷酸,以在編碼的蛋白質(zhì)中編碼添加的一個或多個氨基酸。在本文中,插入以插入的氨基酸(一個或多個)和該氨基酸(一個或多個)的位置表示。例如,pR2_S3insT表示在第2位精氨酸(R)和第3 位絲氨酸( 之間插入蘇氨酸(T)??梢詥为毜鼗蚺c一個或多個取代和/或缺失組合地進行一個或多個氨基酸的插入。在提到蛋白酶時,術(shù)語“生產(chǎn)/產(chǎn)生”包括對全長蛋白酶的兩個加工步驟,包括 1.除去信號膚,這己知在蛋白質(zhì)分泌期間發(fā)生,和2.除去原區(qū),這產(chǎn)生酶的活性成熟形式, 并且已知在成熟過程中發(fā)生(Wang等,Biochemistry 37 :3165-3171 (1998) ;Power 等,Proc Natl Acad Sci USA83 :3096-3100(1986)) 如本文中使用的,“與......對應(yīng)”和“對應(yīng)于”指,蛋白質(zhì)或肽中位于所編號位置
      上的殘基與參考蛋白質(zhì)或肽中的編號殘基等價。在提到成熟蛋白酶時,術(shù)語“經(jīng)加工的”指全長蛋白質(zhì)(例如蛋白酶)經(jīng)歷以成為活性成熟酶的成熟過程。在本文中,術(shù)語“增強的生產(chǎn)”指從經(jīng)修飾的全長蛋白酶加工的成熟蛋白酶的生產(chǎn)水平高于同樣的成熟蛋白酶從未經(jīng)修飾的全長蛋白酶加工時的生產(chǎn)水平。
      當提到酶時,“活性”意指“催化活性”,其包括對酶活性的任何可接受的度量,例如活性速率,活性量,或比活性。催化活性指催化特定化學(xué)反應(yīng),例如水解特定化學(xué)鍵,的能力。如技術(shù)人員將理解的,酶的催化活性只是加快沒有酶存在時慢的化學(xué)反應(yīng)的速率。因為酶僅充當催化劑,其本身既不由反應(yīng)產(chǎn)生,也不被反應(yīng)消耗。技術(shù)人員也將理解,不是所有的多肽都具有催化活性?!氨然钚浴笔敲繂挝豢偟鞍谆蛎傅拿富钚缘牧慷取R虼?,比活性可以用酶的單位重量(例如,每克或每毫克)或單位體積(例如,每毫升)來表示。此外, 例如在活性標準已知或可得以用于進行比較的情況下,比活性可以包括對酶純度的度量, 或可以提供對純度的指示。活性量反映了由表達所測定酶的宿主細胞產(chǎn)生的酶量。術(shù)語“相對活性”或“產(chǎn)量比”在本文中可互換使用,其指從經(jīng)修飾的蛋白酶加工得到的成熟蛋白酶的酶活性與從未經(jīng)修飾的蛋白酶加工得到的成熟蛋白酶的酶活性的比率。產(chǎn)量比通過用從經(jīng)修飾的前體加工得到的蛋白酶的活性值除以從未經(jīng)修飾的前體加工得到的同樣蛋白酶的活性值來確定。相對活性是以百分比表示的產(chǎn)量比。如本文中使用的,術(shù)語“表達”指基于基因的核酸序列產(chǎn)生多肽的過程。此過程包括轉(zhuǎn)錄和翻譯。
      當用來指蛋白質(zhì)時,術(shù)語“嵌合”或“融合”在本文中指通過連接兩個或更多個原先編碼分開的蛋白質(zhì)的多核苷酸而產(chǎn)生的蛋白質(zhì)。該融合多核苷酸的翻譯導(dǎo)致單個嵌合多肽,其具有源自于每個原先蛋白質(zhì)的功能特性。重組融合蛋白質(zhì)通過重組DNA技術(shù)來人工產(chǎn)生。“嵌合多肽”或“嵌合體”意指包含源自一個以上多肽的序列的蛋白質(zhì)。經(jīng)修飾的蛋白酶在如下意義上可以是嵌合的,即,其包含源自一個蛋白酶的部分、區(qū)域或結(jié)構(gòu)域,其中該部分、區(qū)域或結(jié)構(gòu)域融合到源自一個或多個其它蛋白酶的一個或多個部分、區(qū)域或結(jié)構(gòu)域上。例如,嵌合蛋白酶可以包含一個成熟蛋白酶的序列,其中該序列與另一個蛋白酶的前原肽的序列連接。技術(shù)人員將理解的是,嵌合多肽和蛋白酶不必由蛋白質(zhì)序列的實際融合構(gòu)成,而是,具有相應(yīng)編碼序列的多核苷酸也可以用來表達嵌合多肽或蛋白酶。術(shù)語“百分比(% )同一性”定義為候選序列中與前體序列(即,親本序列)的氨基酸/核苷酸殘基相同的氨基酸/核苷酸殘基的百分比。%氨基酸序列同一性數(shù)值通過用匹配的相同殘基的數(shù)目除以比對區(qū)域中“較長”序列的殘基的總數(shù)來確定。當相對于參考序列,目標序列中氨基酸被取代、缺失或插入時,氨基酸序列可以是相似的而不是“相同的”。對于蛋白質(zhì),百分比序列同一性優(yōu)選在就翻譯后修飾而言狀態(tài)相似的序列之間進行測定。典型地,將目標蛋白酶的“成熟序列”(即,加工以除去信號序列和原區(qū)后剩下的序列) 和參考蛋白質(zhì)的成熟序列進行比較。在其它情況下,可以將目標多肽序列的前體序列和參考序列的前體進行比較。如本文中使用的,術(shù)語“啟動子”指具有指導(dǎo)下游基因轉(zhuǎn)錄的作用的核酸序列。在一些實施方案中,啟動子適合于其中將要表達靶基因的宿主細胞。啟動子,與其它轉(zhuǎn)錄和翻譯調(diào)控核酸序列(也稱為“控制序列”)一起,是表達給定基因所必需的。通常,轉(zhuǎn)錄和翻譯調(diào)控序列包括但不限于啟動子序列、核糖體結(jié)合位點、轉(zhuǎn)錄起始和終止序列、翻譯起始和終止序列、以及增強子或激活物序列。當核酸或多肽被置于與另一核酸或多肽序列發(fā)生功能性關(guān)系的位置時,其為“有效連接的”。例如,當啟動子或增強子影響編碼序列的轉(zhuǎn)錄時,啟動子或增強子與編碼序列是有效連接的;當核糖體結(jié)合位點被放置在促進翻譯的位置上時,它是與編碼序列有效連接的;或者,當經(jīng)修飾的前原區(qū)域能夠使全長蛋白酶加工以產(chǎn)生酶的成熟活性形式時,它是與蛋白酶的成熟區(qū)域有效連接的。通常,“有效連接”意指連接的DNA或多肽序列是毗鄰的?!八拗骷毎敝缚勺鳛榘景l(fā)明DNA的表達載體的宿主的合適細胞。合適的宿主細胞可以是天然存在的或野生型宿主細胞,或者其可以是經(jīng)改造了的宿主細胞。在一個實施方案中,宿主細胞是革蘭氏陽性微生物。在一些實施方案中,該術(shù)語指芽胞桿菌屬細胞。如本文中使用的,“芽孢桿菌屬物種”包括本領(lǐng)域技術(shù)人員已知的“芽孢桿菌”屬中的所有種,其包括但不限于枯草芽孢桿菌(B. subtilis)、地衣芽孢桿菌(B. Iicheniformis)、遲緩芽孢桿菌(B. Ientus)、短芽孢桿菌(B. brevis)、短小芽胞桿菌(B. pumilis)、嗜熱脂肪芽孢桿菌(B. stearothermophiIus)、嗜堿芽孢桿菌(B. alkalophilus)、解淀粉芽孢桿菌(B. amyloliquefaciens)、克勞氏芽孢桿菌 (B. clausii)、耐鹽芽孢桿菌(B. halodurans)、巨大芽孢桿菌(B. megaterium)、凝結(jié)芽孢桿菌(B. coagulans)、環(huán)狀芽孢桿菌(B. circulans)、燦爛芽孢桿菌(B. Iautus)和蘇云金芽孢桿菌(B.thuringiensis)。應(yīng)當認識到,芽孢桿菌屬繼續(xù)經(jīng)歷分類學(xué)重組織。因此,該屬旨在包括已經(jīng)被重新分類的物種,包括但不限于生物例如嗜熱脂肪芽孢桿菌(其現(xiàn)在被稱為"Geobacillus stearothermophilus”)。在氧存在時產(chǎn)生抗性內(nèi)生孢子被認為是芽孢桿菌屬的定義特征,但該特征也適用于近來命名的脂環(huán)酸芽孢桿菌屬(Alicyclobacillus)、雙芽孢桿菌屬(Amphibacillus)、解硫胺素芽孢桿菌屬(Aneurinibacillus)、厭氧芽孢桿菌屬(Anoxykicillus)、短小芽孢桿菌屬(Brevikicillus)、線芽孢桿菌屬(FilcAacillus)、 薄壁芽孢桿菌屬(Gracilibacillus)、喜鹽芽孢桿菌屬(HalcAacillus)、類芽孢桿菌屬 (Paenibacillus)、鹽芽孢桿菌屬(&ilibacillus)、嗜熱芽孢桿菌屬(Thermobacillus)、解脲芽胞桿菌屬⑴reikicillus)和枝芽孢桿菌屬(Virgikicillus)。術(shù)語“多核苷酸”和“核酸”在本文中可互換使用,指任何長度的核苷酸聚合形式。 這些術(shù)語包括但不限于,單鏈DNA、雙鏈DNA、基因組DNA、cDNA或包含嘌呤和嘧啶堿基或其它天然的、經(jīng)化學(xué)修飾的、經(jīng)生化修飾的、非天然的或衍生的核苷酸堿基的聚合物。多核苷酸的非限制性例子包括基因、基因片段、染色體片段、ESTs、外顯子、內(nèi)含子、mRNA、tRNA、 rRNA、核糖體、cDNA、重組多核苷酸、分支的多核苷酸、質(zhì)粒、載體、任何序列的分離的DNA、任何序列的分離的RNA、核酸探針和引物。如本文中使用的,術(shù)語“DNA構(gòu)建體”和“轉(zhuǎn)化DNA”可互換使用,表示用于將序列引入宿主細胞或生物中的DNA。DNA構(gòu)建體可以通過PCR或本領(lǐng)域技術(shù)人員已知的任何其它合適技術(shù),在體外產(chǎn)生。在一些實施方案中,DNA構(gòu)建體包含目的序列(例如,經(jīng)修飾的序列)。在一些實施方案中,所述序列與另外的元件,例如控制元件(例如啟動子等)有效連接。DNA構(gòu)建體可以進一步包含選擇標記。在一些實施方案中,DNA構(gòu)建體包含與宿主細胞染色體同源的序列。在其它實施方案中,DNA構(gòu)建體包含非同源序列。一旦DNA構(gòu)建體被體外裝配,其可用于誘變宿主細胞染色體的區(qū)域(即,用異源序列替換內(nèi)源序列)。如本文中使用的,術(shù)語“表達盒”指通過重組或合成產(chǎn)生的核酸構(gòu)建體,其具有允許特定核酸在靶細胞中轉(zhuǎn)錄的一系列指定的核酸元件。重組表達盒可以被整合進載體,例如質(zhì)粒、染色體、線粒體DNA、質(zhì)體DNA、病毒或核酸片段中。典型地,表達載體的重組表達盒部分包括例如待轉(zhuǎn)錄的核酸序列和啟動子。在一些實施方案中,表達載體具有將異源DNA 片段整合在宿主細胞中和表達的能力。許多原核和真核表達載體可以商業(yè)獲取。對合適表達載體的選擇為本領(lǐng)域技術(shù)人員所知。在本文中,術(shù)語“表達盒”與“DNA構(gòu)建體”以及它們的語法等同表述可以互換使用。對合適表達載體的選擇為本領(lǐng)域技術(shù)人員所知。如本文中使用的,術(shù)語“異源DNA序列,,指不在宿主細胞中天然存在的DNA序列。 在一些實施方案中,異源DNA序列為嵌合的DNA序列,其由不同基因的部分(包括調(diào)控序列)組成。如本文中使用的,術(shù)語“載體”指設(shè)計來向一種或多種細胞類型中引入核酸的多核苷酸構(gòu)建體。載體包括克隆載體、表達載體、穿梭載體和質(zhì)粒。在一些實施方案中,多核苷酸構(gòu)建體包含編碼全長蛋白酶(例如,經(jīng)修飾的蛋白酶或未經(jīng)修飾的前體蛋白酶)的DNA 序列。如本文中使用的,術(shù)語“質(zhì)?!敝赣米骺寺≥d體的環(huán)狀雙鏈(ds)DNA構(gòu)建體,其在一些真核生物或原核生物中形成染色體外自主復(fù)制遺傳元件,或整合到宿主染色體中。如本文中使用的,在向細胞中引入核酸序列的上下文中,術(shù)語“引入”指適用于將核酸序列轉(zhuǎn)入細胞的任何方法。用于引入的此類方法包括但不限于原生質(zhì)體融合、轉(zhuǎn)染、轉(zhuǎn)化、接合和轉(zhuǎn)導(dǎo)(見例如,F(xiàn)errari 等,“Genetics”,于Hardwood等(eds.),Bacillus,Plenum Publishing Corp.,頁 57-72,[1989])。
      如本文中使用的,術(shù)語“經(jīng)轉(zhuǎn)化的”和“穩(wěn)定轉(zhuǎn)化的”指具有非天然(異源)多核苷酸序列的細胞,所述非天然(異源)多核苷酸序列整合進了所述細胞的基因組中,或為保持至少兩代的游離型質(zhì)粒形式。如本文中使用的,術(shù)語“表達”指基于基因的核酸序列產(chǎn)生多肽的過程。該過程包括轉(zhuǎn)錄和翻譯。經(jīng)修飾的蛋白酶本發(fā)明提供了用于在細菌宿主細胞中生產(chǎn)成熟蛋白酶的方法和組合物。特別地, 本發(fā)明提供了用于增強細菌細胞中成熟絲氨酸蛋白酶生產(chǎn)的組合物和方法。本發(fā)明的組合物包括編碼經(jīng)修飾的蛋白酶(其在前原區(qū)域具有至少一個突變)的經(jīng)修飾的多核苷酸,由經(jīng)修飾的多核苷酸編碼的經(jīng)修飾的絲氨酸蛋白酶,包含編碼經(jīng)修飾的絲氨酸蛋白酶的經(jīng)修飾的多核苷酸的表達盒、DNA構(gòu)建體、載體,以及轉(zhuǎn)化了本發(fā)明載體的細菌宿主細胞。本發(fā)明的方法包括用于增強細菌宿主細胞中成熟蛋白酶生產(chǎn)的方法。所產(chǎn)生的蛋白酶可以用于工業(yè)生產(chǎn)酶,適用于各種工業(yè),包括但不限于清潔、動物飼料和紡織品加工工業(yè)。在一些實施方案中,本發(fā)明提供了編碼經(jīng)修飾的全長蛋白酶的經(jīng)修飾的全長多核苷酸,其通過在源自編碼動物、植物或微生物來源的野生型或變體全長前體蛋白酶的多核苷酸的前原多核苷酸中,引入至少一個突變而產(chǎn)生。在一些實施方案中,前體蛋白酶是細菌來源的。在一些實施方案中,前體蛋白酶為包含催化活性氨基酸的枯草桿菌蛋白酶類型的蛋白酶(subtilases, subtilop印tidases,EC 3. 4. 21. 62),也被稱為絲氨酸蛋白酶。在一些實施方案中,前體蛋白酶為芽孢桿菌屬物種的蛋白酶。優(yōu)選地,前體蛋白酶為源自枯草芽孢桿菌、解淀粉芽孢桿菌、地衣芽孢桿菌和短小芽孢桿菌的絲氨酸蛋白酶。前體蛋白酶的例子包括枯草桿菌蛋白酶BPN' (SEQ ID N0:67),其源自解淀粉芽孢桿菌,已知于 Vasantha 等(1984),J. Bacteriol. , Volume 159,pp. 811-819,和 J. A. Wells 等(1983) ,Nucleic Acids Research, Volume 11,pp. 7911-7925 ;枯草桿菌蛋白酶 Carlsberg,描述于 Ε. L. Smith 等(1968),J. Biol. Chem.,Volume 243,pp. 2184-2191,禾口 Jacobs 等(1985), Nucl. Acids Res. , Volume 13,pp. 8913-8926,其由地衣芽孢桿菌天然形成;蛋白酶PB92,其由嗜堿芽孢桿菌Bacillus nov. spec. 92天然產(chǎn)生;以及AprE,其由枯草芽孢桿菌天然產(chǎn)生。在一些實施方案中,前體蛋白酶為FNA(SEQ ID NO 1),它是天然存在的 BPN'的變體,其因在成熟區(qū)域的第217位具有單個氨基酸的取代而不同于BPN’,其中BPN’ 的第217位的Tyr(Y)被替換為Leu(L),即FNA的成熟區(qū)域的第217位氨基酸為L(SEQ ID NO :9)。在一些實施方案中,前體蛋白酶包含和SEQ ID NO :7至少約30%相同的前原區(qū)域 (VRSKKLWISL LFALALIFTM AFGSTSSAQA AGKSNGEKKY IVGFKQTMST MSAAKKKDVI SEKGGKVQKQ FKYVDAASAT LNEKAVKELK KDPSVAYVEE DHVAHAY ; SEQ ID NO 7),所述前原區(qū)域與 SEQ ID N0: 9 的成熟區(qū)域有效連接(AQSVPYGVSQIKAPALHSQGYTGSNVKVAVIDSGIDSSHPDLKVAGGASMVPSETN PFQDNNSHGTHVAGTVAALNNSIGVLGVAPSASLYAVKVLGADGSGQYSWIINGIEWAIANNMDVI匪SLGGPSGSA ALKAAVDKAVASGVVVVAAAGNEGTSGSSSTVGYPGKYPSVIAVGAVDSSNQRASFSSVGPELDVMAPGVSIQSTLP GNKYGALNGTSMASPHVAGAAALILSKHPNWTNTQVRSSLENTTTKLGDSFYYGKGLINVQAAAQ ;SEQ ID NO 9).在其它實施方案中,前體蛋白酶包含和SEQ ID NO :7至少約30%相同的前原區(qū)域,所述前原區(qū)域與和SEQ ID NO :9至少約65%相同的成熟區(qū)域有效連接。在其它實施方案中,前體蛋白酶包含SEQ ID NO :7的前原區(qū)域,所述前原區(qū)域和與SEQ ID NO :9至少約 65%相同的成熟區(qū)域有效連接。和SEQ ID NO :7的前原區(qū)域至少約30%相同的絲氨酸蛋白酶的前原區(qū)域的例子包括SEQ ID NOS :11-66,其顯示在圖2中。和SEQ ID NO :9至少約 65%相同的成熟區(qū)域的例子包括SEQ ID NOS :67-122,其顯示在圖3中。多核苷酸序列共有的百分比同一性通過如下方式確定利用本領(lǐng)域已知的方法, 比對序列以直接比較分子之間的序列信息,并確定同一性。適用于確定序列相似性的一個算法例子是 BLAST 算法,其被描述于 Altschul 等,J. Mol. Biol.,215 =403-410(1990)中。 用于進行BLAST分析的軟件可以通過美國國家生物技術(shù)信息中心(National Center for Biotechnology Information)公開獲取。該算法包括首先通過在查詢序列中鑒定出長度為W的短字,所述短字與數(shù)據(jù)庫序列中同樣長度的字比對時匹配或滿足一定的正值閾值分數(shù)T,以鑒定高得分序列對(HSPs)。以這些初始相鄰字命中物作為起點,尋找含有它們的較長的HSI^s。只要累積比對分數(shù)可以增加,就讓字命中物沿著被比較的兩條序列之每條向兩個方向延伸。當累積比對分數(shù)從獲得的最大值降低了數(shù)量X ;累積分數(shù)趨于零或更低;或者到達了任一序列的末端時,字命中物的延伸停止。BLAST算法參數(shù)W、T和X決定了比對的靈敏性和速度。作為默認設(shè)置,BLAST程序采用字長(W)為11、BL0SUM62打分矩陣(見 Henikoff 和 Henikoff,Proc. Natl. Acad. Sci. USA 89 10915 (1989))、比對(B)為 50、期望值(E)為10、M' 5、N' -4和兩鏈比較。然后,BLAST算法進行兩條序列間相似性的統(tǒng)計學(xué)分析(見例如,Karlin和 Altschul,Proc. Nat'1. Acad. Sci. USA 90 :5873-5787 [1993])。BLAST 算法提供的一種相似性量度是最小和概率(P(N)),這指示了兩條核苷酸或氨基酸序列間偶然發(fā)生匹配的概率。 例如,如果在測試核酸與絲氨酸蛋白酶核酸的比較中最小和概率小于約0. 1,更優(yōu)選小于約 0. 01,最優(yōu)選小于約0. 001,則該核酸就被認為與本發(fā)明的絲氨酸蛋白酶核酸相似。當測試核酸編碼絲氨酸蛋白酶多肽時,如果比較產(chǎn)生了小于約0. 5,更優(yōu)選小于約0. 2的最小和概率,則認為所述測試核酸與指定的絲氨酸蛋白酶核酸相似。按照如下方式,使用BLAST程序,獲得了各種絲氨酸蛋白酶的前原區(qū)域(圖2)和成熟區(qū)域(圖3)的氨基酸序列與FNA的前原區(qū)域和成熟區(qū)域的比對。使用FNA的前原區(qū)域或成熟蛋白質(zhì)區(qū)域搜索NCBI非冗余蛋白質(zhì)數(shù)據(jù)庫(2009年2月9日版)。使用命令行 BLAST程序(2. 2. 17版),其中除了 5000和_b 5000以外,采用默認參數(shù)。僅選擇具有期望的最終百分比同一性的序列。使用clustalw(1.83版)程序,采用默認參數(shù)進行比對。 使用MUSCLE(3. 51版)程序,采用默認參數(shù),對比對進行5次精化。在比對中,僅選擇對應(yīng)于FNA的成熟區(qū)域或前原區(qū)域的區(qū)域。根據(jù)與FNA的百分比同一性,按遞減的順序,將比對中的序列進行排序。百分比同一性通過用所述及的兩條序列間對齊的相同殘基的數(shù)量除以在比對中比對的殘基數(shù)量來計算。在一些實施方案中,經(jīng)修飾的多核苷酸從前體多核苷酸產(chǎn)生,所述前體多核苷酸包含與編碼SEQ ID NO :9所示成熟區(qū)域的多核苷酸有效連接的、編碼前原區(qū)域的前原多核苷酸,其中該前原區(qū)域與SEQ ID NO=I(FNA)的前體蛋白酶的前原區(qū)域(SEQ ID NO 7)的氨基酸序列具有至少約30%、至少約35%、至少約40%、至少約45%、至少約50%、至少約 55%、至少約60%、至少約65%的氨基酸序列同一性,優(yōu)選至少約70%的氨基酸序列同一性、更優(yōu)選至少約75%的氨基酸序列同一性、更優(yōu)選至少約80%的氨基酸序列同一性、更優(yōu)選至少約85%的氨基酸序列同一性、甚至更優(yōu)選至少約90%的氨基酸序列同一性、更優(yōu)選至少約92%的氨基酸序列同一性、再更優(yōu)選至少約95%的氨基酸序列同一性、更優(yōu)選至少約97%的氨基酸序列同一性、更優(yōu)選至少約98%的氨基酸序列同一性、以及最優(yōu)選至少約99 %的氨基酸序列同一性。優(yōu)選地,經(jīng)修飾的多核苷酸從前體多核苷酸產(chǎn)生,所述前體多核苷酸包含與編碼SEQ ID NO :9所示成熟區(qū)域的多核苷酸有效連接的、編碼SEQ ID NO 7 的前原區(qū)域的前原多核苷酸。在其它實施方案中,經(jīng)修飾的多核苷酸從前體多核苷酸產(chǎn)生, 所述前體多核苷酸編碼SEQ ID NOS :11-66之任一的前原區(qū)域,所述前原區(qū)域與編碼SEQ ID NO :9中所示的成熟區(qū)域的多核苷酸有效連接。編碼SEQ ID NO :9的成熟蛋白酶的多核苷酸的一個例子是 SEQ ID NO: 10 的多核苷酸(GCGCAGTCCGTGCCTTACGGCGTATCACAAATTAAAGCC CCTGCTCTGCACTCTCAAGGCTACACTGGATCAAATGTTAAAGTAGCGGTTATCGACAGCGGTATCGATTCTTCTCA TCCTGATTTAAAGGTAGCAGGCGGAGCCAGCATGGTTCCTTCTGAAACAAATCCTTTCCAAGACAACAACTCTCACG GAACTCACGTTGCCGGCACAGTTGCGGCTCTTAATAACTCAATCGGTGTATTAGGCGTTGCGCCAAGCGCATCACTT TACGCTGTAAAAGTTCTCGGTGCTGACGGTTCCGGCCAATACAGCTGGATCATTAACGGAATCGAGTGGGCGATCGC AAACAATATGGACGTTATTAACATGAGCCTCGGCGGACCTTCTGGTTCTGCTGCTTTAAAAGCGGCAGTTGATAAAG CCGTTGCATCCGGCGTCGTAGTCGTTGCGGCAGCCGGTAACGAAGGCACTTCCGGCAGCTCAAGCACAGTGGGCTAC CCTGGTAAATACCCTTCTGTCATTGCAGTAGGCGCTGTTGACAGCAGCAACCAAAGAGCATCTTTCTCAAGCGTAGG ACCTGAGCTTGATGTCATGGCACCTGGCGTATCTATCCAAAGCACGCTTCCTGGAAACAAATACGGCGCGTTGAACG GTACATCAATGGCATCTCCGCACGTTGCCGGAGCGGCTGCTTTGATTCTTTCTAAGCACCCGAACTGGACAAACACT CAAGTCCGCAGCAGTTTAGAAAACACCACTACAAAACTTGGTGATTCTTTCTACTATGGAAAAGGGCTGATCAACGT ACAGGCGGCAGCTCAGTAA ; SEQ ID NO: 10).如以上所描述,前原區(qū)域多核苷酸被進一步修飾以在所編碼的多肽的前原區(qū)域中引入至少一個突變,以使得該蛋白酶的成熟形式的生產(chǎn)水平,與從未經(jīng)修飾的多核苷酸加工時相同成熟蛋白酶的生產(chǎn)水平相比較,得到增強。經(jīng)修飾的前原多核苷酸與成熟多核苷酸有效連接,以編碼本發(fā)明的經(jīng)修飾的蛋白酶。在一些實施方案中,經(jīng)修飾的多核苷酸從前體多核苷酸產(chǎn)生,所述前體多核苷酸包含與編碼蛋白酶的成熟區(qū)域的多核苷酸有效連接的、編碼前原區(qū)域的前原多核苷酸,其中所述前原區(qū)域與SEQ ID NO :1的前體蛋白酶的前原區(qū)域(SEQ ID NO 7)的氨基酸序列具有至少約30%、至少約35%、至少約40%、至少約45%、至少約50%、至少約55%、至少約60%、至少約65%的氨基酸序列同一性,優(yōu)選至少約70%的氨基酸序列同一性、更優(yōu)選至少約75%的氨基酸序列同一性、更優(yōu)選至少約80%的氨基酸序列同一性、更優(yōu)選至少約 85%的氨基酸序列同一性、更優(yōu)選至少約90%的氨基酸序列同一性、更優(yōu)選至少約92%的氨基酸序列同一性、更優(yōu)選至少約95%的氨基酸序列同一性、更優(yōu)選至少約97%的氨基酸序列同一性、更優(yōu)選至少約98%的氨基酸序列同一性、以及最優(yōu)選至少約99%的氨基酸序列同一性,其中所述成熟區(qū)域和SEQ ID NO 1的前體蛋白酶的成熟區(qū)域(SEQ ID NO 9)的氨基酸序列具有至少約65%的氨基酸序列同一性,優(yōu)選至少約70%的氨基酸序列同一性、 更優(yōu)選至少約75%的氨基酸序列同一性、更優(yōu)選至少約80%的氨基酸序列同一性、更優(yōu)選至少約85%的氨基酸序列同一性、更優(yōu)選至少約90%的氨基酸序列同一性、更優(yōu)選至少約 92%的氨基酸序列同一性、更優(yōu)選至少約95%的氨基酸序列同一性、更優(yōu)選至少約97%的氨基酸序列同一性、更優(yōu)選至少約98%的氨基酸序列同一性、以及最優(yōu)選至少約99%的氨基酸序列同一性。在一些實施方案中,經(jīng)修飾的多核苷酸從前體多核苷酸產(chǎn)生,所述前體多核苷酸編碼與蛋白酶的成熟區(qū)域有效連接的SEQ ID NO :1的蛋白酶的前原區(qū)域(SEQ ID NO 7), 其中所述成熟區(qū)域和SEQ ID NO :1的前體蛋白酶的成熟形式(SEQ ID NO :9)的氨基酸序列具有至少約65%的氨基酸序列同一性,優(yōu)選至少約70%的氨基酸序列同一性、更優(yōu)選至少約75%的氨基酸序列同一性、更優(yōu)選至少約80%的氨基酸序列同一性、更優(yōu)選至少約85% 的氨基酸序列同一性、更優(yōu)選至少90%的氨基酸序列同一性、更優(yōu)選至少約92%的氨基酸序列同一性、更優(yōu)選至少約95%的氨基酸序列同一性、更優(yōu)選至少約97%的氨基酸序列同一性、更優(yōu)選至少約98%的氨基酸序列同一性、以及最優(yōu)選至少約99%的氨基酸序列同一性。在其它實施方案中,經(jīng)修飾的多核苷酸從前體多核苷酸產(chǎn)生,所述前體多核苷酸編碼SEQ ID NO 1的蛋白酶的前原區(qū)域(SEQ ID NO :7),所述前原區(qū)域與SEQ ID NO 1的蛋白酶的成熟區(qū)域(SEQ ID NO 9)有效連接,即,前體多核苷酸編碼SEQ ID NO :1的蛋白酶。如以上所描述,前原區(qū)域多核苷酸被修飾以引入至少一個突變,該突變使該蛋白酶的成熟形式的生產(chǎn)水平,與從未經(jīng)修飾的多核苷酸加工時相同成熟蛋白酶的生產(chǎn)水平相比,得到增強。前體多核苷酸被突變以產(chǎn)生本發(fā)明的經(jīng)修飾的多核苷酸。在一些實施方案中,編碼前原區(qū)域的前體多核苷酸序列的部分被突變,以在選自位置1-107的至少一個氨基酸位置上編碼至少一個突變,其中的位置通過與SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。因此,在一些實施方案中,本發(fā)明的經(jīng)修飾的全長多核苷酸在選自位置 1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26, 27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51, 52,53,54,55,56,57,58,59,60,61,62,63,64,65,66,67,68,69,70,71,72,73,74,75,76, 77,78,79,80,81,82,83,84,85,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99,100, 101,102,103,104,105,106和107的至少一個氨基酸位置上包含至少一個突變,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在其它實施方案中,經(jīng)修飾的全長多核苷酸在氨基酸位置2,3,6, 7,8,10,11,12, 13,14,15,16,17,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38, 39,45,46,47,48,49,50,51,52,53,54,55,57,58,59,61,62,63,64,66,67,68,69,70,72, 74,75,76,77,78,80,82,83,84,87,88,89,90,91,93,96,100 和 102 上包含至少一個突變, 其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,該至少一個突變?yōu)槿〈?,選自以下取代X2F, N,P,禾口 Y ;X3A, M,P,禾口 R ;X6K,禾口 M ;X7E ; 18W ;X10A, C, G, M,禾口 T ;Xl 1A, F,禾口 T ;X12C,P,T ;X13C,G,和 S ;X14F ;X15G,M,T,和 V ;X16V ;X17S ;X19P,和 S ;X20V ;X21S ;X22E ; X23F, Q,和 W ;X24G, T 和 V ;X25A, D,禾口 W ;X26C,和 H ;X27A, F,H,P,T,V,和 Y ;X28V ;X29E, I, R, S,和 T ;X30C ;X31H, K, N, S, V,和 W ;X32C, F, M, N, P, S,和 V ;X33E, F, M, P,和 S ;X34D, H, P,禾口 V ;X35C, Q,禾口 S ;X36C, D, L, N, S, W,禾口 Y ;X37C, G, K,禾口 Q ;X38F, Q, S,禾口 W ;X39A, C, G, I, L, M, P, S, T,禾口 V ;X45G 禾口 S ;X46S ;X47E 禾口 F ;X48G, I,T,W,禾口 Y ;X49A, C,E 禾口 I ;X50D,和 Y ;X51A 和 H ;X52A,H,I,禾口 M ;X53D,E,M,Q,禾口 T ;X54F, G, H, I,禾口 S ;X55D ;X57E,N,禾口 R ; X58A, C, E, F, G, K, R, S, T, W ;X59E ;X61A, F, I,禾口 R ;X62A, F, G, H, N, S,T 禾口 V ;X63A, C, E, F, G, N, Q, R,和 T ;G64D, M, Q,和 S ;X66E ;X67G 和 L ;X68C, D,和 R ;X69Y ;X70E, G, K, L, M, P, S,和 V ;X72D 和 N ;X74C 和 Y ;X75G ;X76V ;X77E,V,和 Y ;X78M, Q 和 V ;X80D, L,和 N ;X82C,D, P, Q, S,和 T ;X83G,和 N ;X84M ;X87R ;X88A, D, G, T,和 V ;X89V ;X90D 和 Q ;X91A ;X92E 和 S ; X93G, N,禾口 S ;X96G, N,禾口 T ;X100Q ;禾口 X102T,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在其它實施方案中,至少一個突變?yōu)槿〈M合,選自X49A-XMT,X49A-X72D, X49A-X78M, X49A-X78V, X49A-X93S, X49C-X24T, X49C-X72D, X49C-X78M, X49C-X78V, X49C-X91A, X49C-X93S, X91A_x24T, X91A-X49A, X91A-X52H, X91A-X72D, X91A-X78M, X91A-X78V, X93S-X24T, X93S-X49C,X93S-X52H,X93S-X72D,X93S-X78M,和 X93S-X78V,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,至少一個突變編碼至少一個缺失,選自p.X18_X19del, p. X22_23del, pX37del, pX49del, p. X47del, pX55del 和 p. X57del,其中的位置通過與 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,至少一個突變編碼至少一個插入,選自p. X2_X3insT,p. X30_ X31insA, p. X19_X20insAT, p. X21_X22insS, p. X32_X33insG, p. X36_X37insG 和 p.X58_ )(59insA,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,至少一個突變編碼至少一個取代和至少一個缺失,選自 X46H-p. X47del、X49A_p. X22_X23del、x49C_p. X22_X23del、X48I_p. X49del、X17ff-p. X18_ X19del、X78M-p. X22_X23del、X78V-p. X22_X23del、X78V-p. X57del、X91A_p. X22_X23del、 X91A-X48I-pX49del、X91A-p. X57del、X93S_p. X22_X23del、和 X93S_X48I_p. X49del,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,至少一個突變編碼至少一個取代和至少一個插入,選自 X49A-P. X2_X3insT, X49A_p32X_X33insG,Χ49Α_ρ· X19_X20insAT,X49C_p. X19_X20insAT, X49C-p. X32_X33insG, X52H—p. X19_X20insAT, X72D-p. X19_X20insAT, X78M-p.X19_ X20insAT, X78V-p. X19_X20insAT, X91A-p. X19_X20insAT, X91A-p. X32_X33insG, X93S_p. X19_X20insAT和X93S-p. X32_X33insG,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,至少一個突變?yōu)榫幋a至少一個缺失和至少一個插入的至少2 個突變,選自P. X57del-p. X19_X20insAT 和 p. X22_X23del_p. X2_X3insT,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,至少一個突變?yōu)橄鄳?yīng)于p. S49del-p. T19_M20insAT_M48I的編碼至少一個缺失、一個插入和一個取代的至少3個突變,其中的位置通過與SEQ ID NO 7 所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,前體多核苷酸編碼SEQ ID NO :1的全長FNA蛋白酶。在一些實施方案中,編碼SEQ ID NO 1的全長FNA蛋白酶的前體多核苷酸是SEQ ID NO 2的多核苷酸。經(jīng)修飾的全長多核苷酸通過在前體多核苷酸(SEQ ID NO 2)的前原區(qū)域(SEQ ID NO 4)中引入至少一個突變,從SEQ ID NO :2的前體多核苷酸產(chǎn)生。在一些實施方案中,至少一個突變是至少一個取代,選自:R2F, N,P 和 Y ;S3A, M,P 和 R ;L6K 和 M ;W7E ;I8W ;L10A, C, G, M 禾口 T ;L11A,F(xiàn) 禾口 T ;F12C,P, T ;A13C,G 禾口 S ;L14F ;A15G, M,T 禾口 V ;L16V ; I17S ;T19P 禾口 S ; M20V ;A21S ;F22E ;G23F, Q 禾口 W ;S24G, T 禾口 V ;T25A, D 禾口 W ;S26C 禾口 H ;S27A, F, H, P, Τ, V 禾口 Y ;A28V ;Q29E, I,R,S 禾口 T ;A30C ;A31H, K, N, S,V 禾口 W ;G32C, F, M, N, P,S 禾口 T ;K33E,F(xiàn), M, P 禾口 S ;S34D, H,P 禾口 V ;N35C, Q 禾口 S ;G36C, D, L, N, S,W 禾口 Y ;E37C, G,K 禾口 Q ;K38F, Q,S 禾口 W ; K39A, C,G,I,L,M, P, S,T 禾口 V ;K45G 禾口 S ;Q46S ;T47E 禾口 F ;M48G, I,T,W 禾口 Y ;S49A, C, E 禾口 I ;T50D 禾口 Y ;M51A 禾口 H ;S52A, H,I 禾口 M ;A53D, Ε, M,Q 禾口 T ;A54F,G, H,I 禾口 S ;K55D ;K57E, N 禾口 R ;D58A, C, E, F, G, K, R, S, T, W ;V59E ;S61A, F,I 禾Π R ;Ε62Α, F, G, H, N, S,T 禾Π V ;Κ63Α,
      C,Ε, F, G, N, Q,R 禾口 T ;64D,M,Q 禾口 S ;Κ66Ε ;V67G 禾口 L ;Q68C, D 禾口 R ;Κ69Υ ;Q70E, G, K, L, Μ, P,S 禾口 V ;K72D 禾口 N ;V74C 禾口 Y ;D75G ;A76V ;Α77Ε, V 禾口 Y ;S78M, Q 禾口 V ;T80D, L 禾口 N ;N82C,
      D,P, Q,S 禾口 T ;E83G 禾口 N ;Κ84Μ ;K87R ;Ε88Α, D, G,T 禾口 V ;L89V ;K90D 禾口 Q ;Κ91Α ;D92E 禾口 S ; P93G,N和S ;A96G,N和T ;E100Q ;以及Η102Τ,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,前體FNA多核苷酸被突變以編碼經(jīng)修飾的全長FNA,所述經(jīng)修飾的全長FNA在其前原區(qū)域包含編碼選自以下的取代組合的至少一個突變組合 S49A-S24T, S49A-K72D, S49A-S78M, S49A-S78V, S49A-P93S, S49C-S24T, S49C-K72D, S49C-S78M, S49C-S78V, S49C-K91A, S49C-P93S, K91A-S24T, K91A-S49A, K91A-S52H, K91A-K72D, K91A-S78M, K91A-S78V, P93S-S24T, P93S-S49C, P93S-S52H, P93S-K72D, P93S-S78M和P93S-S78V,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,前體FNA多核苷酸被突變以編碼經(jīng)修飾的全長FNA,所述經(jīng)修飾的全長FNA在其前原區(qū)域包含編碼選自以下的至少一個缺失的至少一個突變p. 118_ T19del, p. F22_G23del, p. E37del, p. T47del466, p. S49del, p. K55del 和 p. K57del,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,前體FNA多核苷酸被突變以編碼經(jīng)修飾的全長FNA,所述經(jīng)修飾的全長FNA在其前原區(qū)域包含編碼選自以下的至少一個插入的至少一個突變p. R2_ S3insT, p. A30_A3IinsA, p. T19_M20insAT, p. A21_F22insS, p. G32_K33insG, p. G36_E37insG 和p. D58_V59insA,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,前體FNA多核苷酸被突變以編碼經(jīng)修飾的全長FNA,所述經(jīng)修飾的全長FNA在其前原區(qū)域包含編碼至少一個取代和至少一個缺失的至少2個突變,選自Q46H-p. T47del,S49A_p. F22_G23del,S49C-p. F22_G23del, M48I_p. S49del, I17ff-p. I18_T19del, S78M-p. F22_G23del, S78V-p. F22_G23del, K91A-p. F22_G23del, K91A-M48I-pS49del, K91A_p. K57del, P93S_p. F22_G23del 和 P93S_M48I-p. S49del,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,前體FNA多核苷酸被突變以編碼經(jīng)修飾的全長FNA,所述經(jīng)修飾的全長FNA在其前原區(qū)域包含編碼至少一個取代和至少一個插入的至少2個突變,選自 S49A-p. R2_S3insT, S49A_p32G_K33insG,S49A_p. T19_M20insAT, S49C_p. T19_M20insAT, S49C-p. G32_K33insG, S49C-p. T19_M20insAT, S52H—p. T19_M20insAT, K72D-p.T19_M20insAT, S78M_p. T19_M20insAT, S78V-p. T19_M20insAT, K91A_p. T19_M20insAT, K91A-p. G32_K33insG, P93S_p. T19_M20insAT 和 P93S_p. G32_K33insG,其中的位置通過與 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,前體FNA多核苷酸被突變以編碼經(jīng)修飾的全長FNA,所述經(jīng)修飾的全長FNA在其前原區(qū)域包含編碼缺失和插入的至少2個突變,選自pK57del-p. T19_ M20insAT 和 p. F22_G23del_p. R2_S3insT,其中的位置通過與 SEQ ID NO :7 所示 FNA 蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。在一些實施方案中,前體FNA多核苷酸被突變以編碼經(jīng)修飾的全長FNA,所述經(jīng)修飾的全長FNA在其前原區(qū)域包含編碼至少一個缺失、一個插入和一個取代的至少3個突變, 其對應(yīng)于P. S49del-p. T19_M20insAT-M48I,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。本發(fā)明前體蛋白酶前原區(qū)域的修飾包括至少一個取代、至少一個缺失或至少一個插入。在一些實施方案中,前原區(qū)域的修飾包括突變的組合。例如,前原區(qū)域的修飾包括至少一個取代和至少一個缺失的組合。在其它實施方案中,前原區(qū)域的修飾包括至少一個取代和至少一個插入的組合。在其它實施方案中,前原區(qū)域的修飾包括至少一個缺失和至少一個插入的組合。在其它實施方案中,前原區(qū)域的修飾包括至少一個取代、至少一個缺失和至少一個插入的組合。本領(lǐng)域已知若干方法適于產(chǎn)生本發(fā)明的經(jīng)修飾的多核苷酸序列,其包括但不限于位點飽和誘變、掃描誘變、插入誘變、缺失誘變、隨機誘變、位點定向誘變和定向進化以及多種其它重組方法。常用的方法包括DNA改組(Stemmer WP, Proc Natl Acad Sci U S A. 25 ;91 (22) :10747-51 [1994]),基于基因的非同源重組的方法,例如ITCHY (Ostermeier 等,Bioorg Med Chem. 7(10) :2139-44[1999])、SCRACHY(Lutz 等,Proc Natl Acad Sci U S A. 98(20) :11248-53[2001])、SHIPREC (Sieber 等,Nat Biotechnol. 19(5) :456-60 [2001]) 和 NRR(Bittker 等,Nat Biotechnol. 20(10) :1024-9 [2001] ;Bittker 等,Proc Natl Acad Sci U S A. 101(18) :7011-6[2004]),以及依賴于使用寡核苷酸插入隨機和靶向的突變、 缺失和 / 或插入的方法(Ness 等,Nat Biotechnol. 20(12) 1251-5[2002] ;Coco 等,Nat Biotechnol. 20(12) 1246-50[2002] ;Zha 等,Chembiochem. 3 ;4(1) :34_9[2003] ;Glaser 等,J Immunol. 149(12) :3903-13 [1992] ;Sondek 和 Shortle,Proc Natl Acad Sci U S A 89(8) :3581-5 [1992] ;Yafiez等,Nucleic Acids Res. 32(20) :el58[2004] ;Osuna 等, Nucleic Acids Res. 32(17) :el36[2004] ;Gaytcin等,NucleicAcids Res. 29(3) :E9[2001]; 以及 GayWn 等,Nucleic Acids Res. 30(16) :e84[2002])。在一些實施方案中,將全長親本多核苷酸連接到合適的表達質(zhì)粒上,可以使用以下誘變方法以利于本發(fā)明經(jīng)修飾的蛋白酶的構(gòu)建,但也可以使用其它方法。所述誘變方法基于 Pisarchik 等(Protein engineering,Design and Selection20 :257-265 [2007])的描述,具有額外的優(yōu)點,即本文中使用的限制性內(nèi)切酶在其識別序列外進行切割,這使得可以對幾乎任何核苷酸序列進行消化并防止限制性內(nèi)切位點疤痕的形成。首先,如本文中所描述,獲得天然存在的、編碼全長蛋白酶的基因,并對其全部或部分進行測序。隨后,對前原序列進行掃描,以確定期望在編碼的前原區(qū)域中進行一個或多個氨基酸的突變(缺失、插入、取代,或它們的組合)的點??梢园凑展姆椒?,通過引物延伸,進行基因突變,以便改變基因的序列以使其符合期望序列。以PCR擴增期望的突變位點(一個或多個)的左邊和右邊片段,使其包含Eaml 1041限制性位點。以Eaml 1041消化左邊和右邊片段,以產(chǎn)生多個具有互補的3堿基突出端的片段,然后將這些片段混合并連接,以產(chǎn)生包含一個或多個突變的經(jīng)修飾的前原序列的文庫。該方法圖示于圖2。該方法避免了移碼突變的發(fā)生。此外,該方法簡化了誘變過程,因為可以合成所有的寡核苷酸以具有相同的限制性位點,而不需要如一些其他方法所必須的那樣利用合成接頭來產(chǎn)生限制性位點。如上所示,在一些實施方案中,本發(fā)明提供了包含上述多核苷酸的載體。在一些實施方案中,載體為表達載體,其中編碼本發(fā)明的經(jīng)修飾的蛋白酶的經(jīng)修飾的多核苷酸序列與基因高效表達所需的額外片段有效連接(例如,啟動子有效連接到該目的基因)。在一些實施方案中,提供的這些必需元件是基因自身的同源啟動子(如果其能被識別的話,即,被宿主轉(zhuǎn)錄)、和外源的或由蛋白酶基因的內(nèi)源終止子區(qū)域提供的轉(zhuǎn)錄終止子。在一些實施方案中,也包括選擇基因,例如抗生素抗性基因,所述抗生素抗性基因使得可以通過在含殺微生物劑的培養(yǎng)基中生長來持續(xù)培養(yǎng)維持被質(zhì)粒感染了的宿主細胞。在一些實施方案中,表達載體源自質(zhì)?;虿《綝NA,或者,在可選擇的實施方案中,表達載體包含兩者的元件。示例性載體包括但不限于pXX,PC194,pJHIOl, pE194, pHP13 (Harwood 禾口 Cutting (編輯),MolecularBioloRical Methods for Bacillus, John ffiley&Sons, [1990],詳見第3章;適用于枯草芽孢桿菌的復(fù)制型質(zhì)粒包括第92頁所列的那些;Perego,Μ. (1993),用于在枯草芽孢桿菌中進行遺傳操作的整合型載體,p. 615-624 ; A. L. Sonenshein, J. A. Hoch,和R. Losick (ed.),枯草芽孢桿菌以及其它革蘭氏陽性細菌 生物化學(xué)、生理學(xué)禾口分子遺傳學(xué),American Society for Microbiology, Washington, D. C.)。為了在細胞中表達和生產(chǎn)目的蛋白質(zhì)(例如,蛋白酶),將包含至少一個拷貝(優(yōu)選包含多個拷貝)的編碼經(jīng)修飾蛋白酶的多核苷酸的至少一個表達載體,在合適蛋白酶表達的條件下轉(zhuǎn)化到細胞中。在一些特定實施方案中,編碼蛋白酶的序列(以及載體中所包含的其它序列)被整合進宿主細胞的基因組中,而在其它實施方案中,質(zhì)粒在細胞中作為染色體外自主元件維持。由此,本發(fā)明既提供染色體外元件,也提供整合進宿主細胞基因組中的進入序列(incoming sequence)。在一些實施方案中,可以用復(fù)制型載體構(gòu)建包含本文中所描述的多核苷酸的載體 (例如,pAC-FNA;見圖5)。本文中所描述的每一個載體均旨在用于本發(fā)明。在一些實施方案中,構(gòu)建體存在于整合型載體上(例如,PJH-FNA ;圖6),該載體使得經(jīng)修飾的多核苷酸可以整合到細菌染色體中并任選地擴增。整合位點的例子包括但不限于aprE,amyE, veg或 pps區(qū)域。事實上,可以考慮的是,在本發(fā)明中也可以使用本領(lǐng)域技術(shù)人員所知的其它位點。 在一些實施方案中,啟動子是所選擇的前體蛋白酶的野生型啟動子。在一些其它實施方案中,啟動子是與前體蛋白酶異源的,但其在宿主細胞中是起作用的。特別地,用于細菌宿主細胞的合適啟動子的例子包括但不限于pSPAC、pAprE、pAmyE、pVeg、pHpaII啟動子,嗜熱脂肪芽孢桿菌產(chǎn)麥芽糖淀粉酶基因、解淀粉芽孢桿菌(BAN)淀粉酶基因、枯草芽孢桿菌堿性蛋白酶基因、克勞氏芽孢桿菌堿性蛋白酶基因、短小芽孢桿菌木糖苷酶基因、蘇云金芽孢桿菌cryIIIA基因、以及地衣芽孢桿菌α-淀粉酶基因的啟動子。在一些實施方案中,啟動子具有SEQ ID NO :333中所示的序列。在其它實施方案中,啟動子具有SEQ ID NO :445中所示的序列。另外的啟動子包括但不限于A4啟動子,以及λ噬菌體&或1\啟動子和大腸桿菌lac、trp或tac啟動子??梢栽谌魏魏线m的革蘭氏陽性微生物宿主細胞(包括細菌和真菌)中生產(chǎn)前體和經(jīng)修飾的蛋白酶。例如,在一些實施方案中,在真菌和/或細菌來源的宿主細胞中生產(chǎn)經(jīng)修飾的蛋白酶。在一些實施方案中,宿主細胞是芽孢桿菌屬物種、鏈霉菌屬物種、埃希氏桿菌屬物種(Escherichia sp.)或曲霉屬物種(Aspergillus sp.)。在一些實施方案中,經(jīng)修飾的蛋白酶由芽孢桿菌屬物種宿主細胞生產(chǎn)??梢杂糜谏a(chǎn)本發(fā)明經(jīng)修飾的蛋白質(zhì)的芽孢桿菌屬物種宿主細胞的例子包括但不限于地衣芽孢桿菌、遲緩芽孢桿菌、枯草芽孢桿菌、解淀粉芽孢桿菌、遲緩芽孢桿菌、短芽胞桿菌、嗜熱脂肪芽孢桿菌、嗜堿芽孢桿菌、凝結(jié)芽孢桿菌、環(huán)狀芽孢桿菌、短小芽孢桿菌、蘇云金芽孢桿菌、克勞氏芽孢桿菌、巨大芽孢桿菌以及芽孢桿菌屬中其它微生物。在一些實施方案中,使用芽孢桿菌宿主細胞。美國專利5,264, 366 和4,760,025(RE 34,606)中描述了各種可以用于本發(fā)明的芽孢桿菌宿主菌株,但在本發(fā)明中也可以使用其它合適的菌株。幾種工業(yè)菌株也可以用于本發(fā)明,包括非重組(即,野生型)芽孢桿菌屬物種菌株、以及天然存在的菌株的變體和/或重組菌株。在一些實施方案中,宿主菌株是重組菌株,其中編碼目的多肽的多核苷酸已經(jīng)被引入到該宿主中。在一些實施方案中,宿主菌株是枯草芽孢桿菌宿主菌株,特別是重組枯草芽孢桿菌宿主菌株?,F(xiàn)已知許多枯草芽孢桿菌菌株,其包括但不限于 1A6 (ATCC 39085),168 (1A01),SB19, W23, Ts85, B637, PB1753 至 PB1758, PB3360, JH642,1A243(ATCC 39,087), ATCC 21332, ATCC 6051, MI113, DE100 (ATCC 39,094),GX4931,PBT 110 和 PEP 211 菌株(見例如,Hoch 等,Genetics,73 215-228[1973])(也見美國專利號 4,450,235 ;美國專利號 4,302,544 ;和 EP 0134048 ;每一項均就其全部內(nèi)容通過引用并入本文)。使用枯草芽孢桿菌作為表達宿主在本領(lǐng)域中公知(見例如,Palva 等,Gene 19 :81_87[1982] ;Fahnestock 和 Fischer,J. Bacteriol.,165 796-804 [1986];以及 Wang 等,Gene 69 39-47 [1988]) 在一些實施方案中,芽孢桿菌宿主是在基因degU,degS, degR和degQ之至少一個中包含突變或缺失的芽孢桿菌屬物種。優(yōu)選地,突變在degU基因中,更優(yōu)選地,突變是 degU (Hy) 32 (見例如,Msadek 等,J. Bacteriol.,172 :824-834 [1990];和 Olmos 等, Mol. Gen. Genet.,253 :562-567 [1997])。優(yōu)選的宿主菌株是攜帶 degU32 (Hy)突變的枯草芽孢桿菌。在另外一些的實施方案中,芽孢桿菌宿主包含在scoC4(見例如,Caldwell 等,J. Bacteriol.,183 :7329-7340 [2001]), spoIIE(見,Arigoni 等,Mol. Microbiol., 31 :1407-1415[1999])、和/或oppA或opp操縱子的其它基因(見例如,Perego等,Mol. Microbiol. ,5 173-185[1991])中的突變或缺失。事實上,可以考慮,將與oppA基因中突變導(dǎo)致相同表型的opp操縱子中的任何突變,用于本發(fā)明的改變的芽孢桿菌菌株的一些實施方案中。在一些實施方案中,這些突變單獨存在,而在其它一些實施方案中,存在突變的組合。在一些實施方案中,可用于生產(chǎn)本發(fā)明的經(jīng)修飾蛋白酶的改變了的芽孢桿菌是已經(jīng)在一種或多種上述基因中包括突變的芽孢桿菌宿主菌株。此外,可以使用包含內(nèi)源蛋白酶基因的突變和/或缺失的芽孢桿菌屬物種宿主細胞。在一些實施方案中,芽孢桿菌宿主細胞包括aprE和nprE基因的缺失。在其它實施方案中,芽孢桿菌屬物種宿主細胞包含5個蛋白酶基因的缺失(US20050202535),而在其它實施方案中,芽孢桿菌屬物種宿主細胞包含9個蛋白酶基因的缺失(US20050202535)??梢允褂帽绢I(lǐng)域已知的任何合適方法,以編碼本發(fā)明的經(jīng)修飾的蛋白酶的經(jīng)修飾的多核苷酸來轉(zhuǎn)化宿主細胞。無論是將經(jīng)修飾的多核苷酸整合到載體中還是在沒有質(zhì)粒 DNA存在的情況下使用,所述經(jīng)修飾的核苷酸均可以被引入到微生物中,在一些實施方案中,優(yōu)選大腸桿菌細胞或感受態(tài)芽孢桿菌細胞。涉及質(zhì)粒構(gòu)建體和質(zhì)粒向大腸桿菌中的轉(zhuǎn)化的、用于將DNA引入芽孢桿菌細胞中的方法是公知的。在一些實施方案中,隨后從大腸桿菌中分離質(zhì)粒,并將其轉(zhuǎn)化到芽孢桿菌中。但是,使用居間微生物例如大腸桿菌并不是必須的,在一些實施方案中,DNA構(gòu)建體或載體被直接引入到芽孢桿菌宿主中。本領(lǐng)域技術(shù)人員熟知用于將多核苷酸序列引入到芽孢桿菌細胞中的合適方法 (見例如,F(xiàn)errari 等,"Genetics,,,于 Harwood 等(ed. ), Bacillus, Plenum Publishing Corp. [1989],57-72 頁中;Saunders 等,J. Bacteriol.,157 :718-726 [1984] ;Hoch 等, J. Bacteriol. ,93 1925-1937[1967] ;Mann 等,Current Microbiol. ,13 131-135[1986]; Holubova, Folia Microbiol. , 30 97 [1985] ;Chang 等,Mol. Gen. Genet. , 168 11-115 [1979] ;Vorobjeva 等,F(xiàn)EMS Microbiol. Lett. ,7 :261-263 [1980] ;Smith 等,Appl. Env. Microbiol. ,51 634[1986] ;Fisher 等,Arch. Microbiol.,139 :213-217[1981];以及McDonald,J. Gen. Microbiol.,130 :203 [1984])。事實上,諸如轉(zhuǎn)化,包括原生質(zhì)體轉(zhuǎn)化和congression、轉(zhuǎn)導(dǎo)和原生質(zhì)體融合等方法是已知的并適用于本發(fā)明。可以使用轉(zhuǎn)化的方法,將本發(fā)明提供的DNA構(gòu)建體引入到宿主細胞中。本領(lǐng)域中已知用于轉(zhuǎn)化芽孢桿菌的方法包括質(zhì)粒標記挽救轉(zhuǎn)化等方法,其涉及由攜帶有部分同源的居民質(zhì)粒的感受態(tài)細胞攝入供體質(zhì)粒(Contente 等,Plasmid 2 :555-571 [1979] ;Haima 等,Mol. Gen. Genet.,223 185-191 [1990] ;Weinrauch 等,J. Bacteriol.,154 1077-1087 [1983];以及 Weinrauch 等, J. Bacteriol.,169 :1205-1211 [1987])。在該方法中,進入供體質(zhì)粒在模擬染色體轉(zhuǎn)化的過程中與居民“輔助”質(zhì)粒的同源區(qū)域重組。除了通常使用的方法之外,在一些實施方案中,可以直接轉(zhuǎn)化宿主細胞(即,在引入到宿主細胞之前,不用居間細胞來擴增或加工DNA構(gòu)建體)。將DNA構(gòu)建體引入宿主細胞包括本領(lǐng)域已知用來將DNA引入宿主細胞而不插入質(zhì)?;蜉d體中的那些物理和化學(xué)方法。此類方法包括但不限于氯化鈣沉淀、電穿孔、裸DNA、脂質(zhì)體等。在另一些實施方案中, 將DNA構(gòu)建體與質(zhì)粒共轉(zhuǎn)化,而不插入到質(zhì)粒中。在另外一些實施方案中,通過本領(lǐng)域已知的方法,將選擇性標記從經(jīng)改變的芽孢桿菌菌株中除去(見,Stahl等,J. Bacteriol.,158 411-418[1984];和 Palmeros 等,Gene 247 :255-264[2000])。在一些實施方案中,在常規(guī)營養(yǎng)培養(yǎng)基中培養(yǎng)本發(fā)明的經(jīng)轉(zhuǎn)化了的細胞。合適的具體培養(yǎng)條件,例如溫度、PH等,為本領(lǐng)域技術(shù)人員熟知。此外,一些培養(yǎng)條件可以自科學(xué)文獻例如 Hopwood(2000)PracticalStreptomyces Genetics, John Innes Foundation, Norwich UK ;Hardwood 等(1990)Molecular Biological Methods for Bacillus, John Wiley,以及自美國典型培養(yǎng)物保藏中心(American Type Culture Collection,ATCC)找到。在一些實施方案中,在允許表達和生產(chǎn)本發(fā)明蛋白酶的條件下,于合適的營養(yǎng)培養(yǎng)基中培養(yǎng)轉(zhuǎn)化了編碼經(jīng)修飾蛋白酶的多核苷酸序列的宿主細胞,之后從培養(yǎng)物中回收所得到的蛋白酶。用于培養(yǎng)細胞的培養(yǎng)基包括適于宿主細胞生長的任何常規(guī)培養(yǎng)基,例如基本培養(yǎng)基或含有合適補充物的復(fù)雜培養(yǎng)基。合適的培養(yǎng)基可從商業(yè)供應(yīng)者獲得,或者可以按照公開的配方(例如,在American Type Culture Collection的目錄中)來制備。在一些實施方案中,通過常規(guī)方法從細胞培養(yǎng)基中回收細胞生產(chǎn)的蛋白酶,所述方法包括但不限于通過離心或過濾從培養(yǎng)基中分離宿主細胞、通過鹽(例如,硫酸銨)來沉淀上清液或濾液的蛋白質(zhì)性組分、層析純化(例如,離子交換、凝膠過濾、親和層析等)。因此,適于回收本發(fā)明蛋白酶的任何方法都可用于本發(fā)明。事實上,本發(fā)明不受任何特定純化方法的限制。包含本發(fā)明的經(jīng)修飾蛋白酶的重組宿主細胞生產(chǎn)的蛋白質(zhì)可以被分泌到培養(yǎng)基中。在一些實施方案中,其它重組構(gòu)建體將該異源或同源多核苷酸序列連接至編碼蛋白酶多肽結(jié)構(gòu)域的核苷酸序列,以方便可溶蛋白的純化(Kroll DJ等(1993)DNA Cell Biol 12 :441-53)。此類協(xié)助純化的結(jié)構(gòu)域包括但不限于金屬螯合肽,例如,允許在固定化的金屬上進行純化的組氨酸-色氨酸模塊(Porath J (1992) Protein Expr Purif3 :263-281), 允許在固定化的免疫球蛋白上進行純化的A蛋白結(jié)構(gòu)域、以及用于FLAGS延伸/親和純化系統(tǒng)的結(jié)構(gòu)域(Immimex Corp, Seattle WA)。將可切割的接頭序列,例如因子XA或腸激酶 (Invitrogen, San Diego CA)納入純化結(jié)構(gòu)域和異源蛋白之間也可用于促進純化。如上所述,本發(fā)明提供了編碼經(jīng)修飾的全長蛋白酶的經(jīng)修飾的全長多核苷酸,所述經(jīng)修飾的全長蛋白酶被芽孢桿菌宿主細胞加工以產(chǎn)生成熟形式,該生產(chǎn)水平高于由在相同條件下生長的芽孢桿菌宿主細胞從未經(jīng)修飾的全長酶加工相同成熟蛋白酶時的生產(chǎn)水平。該生產(chǎn)水平可以通過所分泌的酶的活性水平確定。生產(chǎn)增強的一種量度可以以相對活性來測量,這可表示為從經(jīng)修飾的蛋白酶加工的成熟形式的酶促活性值與從未經(jīng)修飾的前體蛋白酶加工的成熟形式的酶促活性值的比值百分數(shù)。等于或高于100%的相對活性表明,從經(jīng)修飾的前體加工時蛋白酶成熟形式的生產(chǎn)水平等于或高于從未經(jīng)修飾的前體加工時同樣的成熟蛋白酶的生產(chǎn)水平。由此,在一些實施方案中,與從未經(jīng)修飾的前體蛋白酶加工的蛋白酶成熟形式的相應(yīng)生產(chǎn)相比,從經(jīng)修飾的蛋白酶加工的成熟蛋白酶的相對活性是至少約100%、至少約110%、至少約120%、 至少約130%、至少約140%、至少約150%、至少約160%、至少約170%、至少約180%、至少約190%、至少約200%、至少約225%、至少約250%、至少約275%、至少約300%、至少約325%、至少約350%、至少約375%、至少約400%、至少約425%、至少約450%、至少約475%、至少約500%、至少約525%、至少約550%、至少約575%、至少約600%、至少約625%、至少約650%、至少約675%、至少約700%、至少約725%、至少約750%、至少約800%、至少約825%、至少約850%、至少約875%、至少約850%、至少約875%、至少約 900 %、以及高達至少約1000 %或更高。可選地,相對活性可表示為產(chǎn)量比,其通過用從經(jīng)修飾的前體加工的蛋白酶的活性值除以從未經(jīng)修飾的前體加工的相同蛋白酶的活性值來測量。由此,在一些實施方案中,從經(jīng)修飾的前體加工的成熟蛋白酶的產(chǎn)量比為至少約1、至少約1. 1、至少約1. 2、至少約1. 3、至少約1. 4、至少約1. 5、至少約1. 6、至少約1. 7、至少約 1. 8、至少約1. 9、至少約2、至少約2. 25、至少約2. 5、至少約2. 75、至少約3、至少約3. 25、 至少約3. 5、至少約3. 75、至少約4. 0、至少約4. 25、至少約4. 5、至少約4. 75、至少約5、至少約5. 25、至少約5. 5、至少約5. 75、至少約6、至少約6. 25、至少約6. 5、至少約6. 75、至少約7、至少約7. 25、至少約7. 5、至少約8、至少約8. 25、至少約8. 5、至少約8. 75、至少約9、 以及高達至少約10。
      本領(lǐng)域技術(shù)人員已知用于檢測和測量蛋白酶活性的多種測定法。特別是,可獲得用于測量蛋白酶活性的如下測定法,所述測定法基于酸可溶性肽從酪蛋白或血紅蛋白的釋放,該釋放可以使用Folin方法通過^Onm處吸光度或比色法來進行測量(見例如,Bergmeyer 等,"Methods of Enzymatic Analysis^ vol. 5, Peptidases, Proteinases and their Inhibitors, Verlag Chemie, ffeinheim[1984]) 一些其它測定法涉及生色底物的溶解(JAL 例如,Ward, "Proteinases,,,in Fogarty (ed. ). ,Microbial Enzymes andBiotechnology,Applied Science,London, [1983],pp 251-317)。其它示例性測定法包括但不限于琥珀酰-Ala-Ala-Pro-Phe-對硝基酰苯胺測定法(SAAPFpNA)和2,4,6-三硝基苯磺酸鈉鹽測定法(TNBS測定法)。本領(lǐng)域技術(shù)人員已知的許多其它參考文獻提供了合適的方法(見例如,Wells 等,Nucleic Acids Res. 11 :7911-7925[1983] ;Christianson 等, Anal. Biochem.,223 :119_129[1994];和Hsia等,Anal Biochem.,242 :221-227[1999])。這并不意味著本發(fā)明受限于任何特定的測定方法。用于測定宿主細胞中成熟蛋白酶生產(chǎn)水平的其它手段包括但不限于使用對該蛋白質(zhì)特異的多克隆或單克隆抗體的方法。例子包括但不限于酶聯(lián)免疫吸附測定(ELISA)、放射免疫測定(RIA)、熒光免疫測定(FIA)和熒光激活細胞分選(FACS)。這些以及其它一些測定法在本領(lǐng)域公知(見例如,Maddox等,J. Exp. Med.,158 :1211 [1983])。本文提到的所有出版物和專利都通過弓I用并入本文。對本領(lǐng)域技術(shù)人員將是顯而易見的,可以對所描述的本發(fā)明方法和系統(tǒng)進行多種修改和變動而不偏離本發(fā)明的范圍和宗旨。雖然已經(jīng)參照具體實施方案對本發(fā)明進行了描述,但應(yīng)理解的是,本發(fā)明不應(yīng)被不恰當?shù)叵薅ㄓ谶@些特定的實施方案。事實上,所描述的本發(fā)明實施方式的各種對本領(lǐng)域和/ 或相關(guān)領(lǐng)域技術(shù)人員顯而易見的變型形式都旨在落入本發(fā)明的范圍內(nèi)。實驗提供下述實施例來展示和進一步闡述本發(fā)明的某些實施方案和方面,它們不應(yīng)被解釋為限制本發(fā)明的范圍。在下文的實驗公開內(nèi)容中,應(yīng)用了下述縮寫ppm(每百萬分之);M(摩爾每升); mM(毫摩爾每升);μ M(微摩爾每升);ηΜ(納摩爾每升);mol (摩爾);mmol (毫摩爾); μπιο (微摩爾);nmol (納摩爾);gm(克);mg (毫克);Pg (微克);Pg (皮克);L (升);ml 和mL(毫升);μ 和4 1^(微升);cm(厘米);mm(毫米);^111(微米);nm(納米);U(單位);V(伏特);MW(分子量);sec(秒);min(s)(分鐘/分鐘);h(s)和hr(s)(小時/ 小時);。C (攝氏度);QS(足夠量);ND(未進行);NA(不適用);rpm(每分鐘轉(zhuǎn)數(shù));w/ ν(質(zhì)量體積比);v/V(體積體積比);g(重力);OD(光密度);aa(氨基酸);bp (堿基對); kb (千堿基對);kD (千道爾頓);suc-AAPF-pNA (琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨?;?對硝基苯胺);FNA(BPN’的變體);BPN’ (解淀粉芽孢桿菌的枯草桿菌蛋白酶);DMSO(二甲基亞砜);cDNA(拷貝或互補DNA) ;DNA(脫氧核糖核酸);ssDNA(單鏈 DNA) ; dsDNA (雙鏈DNA) ; dNTP (三磷酸脫氧核糖核苷酸);DTT (1,4- 二巰基-DL-蘇糖醇); H20(水);dH20(去離子水);HCl (鹽酸);MgCl2 (氯化鎂);MOPS (3-[N-嗎啉代]-丙烷磺酸);NaCl (氯化納);PAGE (聚丙烯酰胺凝膠電泳);PBS (磷酸緩沖鹽溶液[150mM NaCl, IOmM磷酸鈉緩沖液,pH 7.2]) ;PEG(聚乙二醇);PCR(聚合酶鏈式反應(yīng));PMSF(苯基甲基磺酰氟);RNA(核糖核酸);SDS(十二烷基硫酸納);Tris(三(羥甲基)氨基甲烷);SOCO^細菌用胰蛋白胨,0.5%細菌用酵母提取物,IOmM NaCl, 2. 5mM KCl) ;Terrific Broth (TB 12g/l 細菌用胰蛋白胨,24g/l 甘油,2. 31g/l KH2PO4,和 12. 54g/l K2HPO4) ;0D280 (280nm ^h 的光密度);0D600(600nm處的光密度);A405 G05nm處的吸光度);Vmax(酶催化反應(yīng)的最大初速度);HEPES(N-[2-羥乙基]哌嗪-N-[2-乙磺酸]);Tris-HCl (三[羥甲基]氨基甲烷鹽酸鹽);TCA(三氯乙酸);HPLC(高壓液相色譜);RP-HPLC(反相高壓液相色譜); TLC(薄層色譜);EDTA(乙二胺四乙酸)出tOH(乙醇);SDS(十二烷基硫酸納);Tris(三 (羥甲基)氨基甲烷);TAED (N,N, N’ N’ -四乙?;叶?。實施例1靶向ISD(插入取代缺失)文庫的構(gòu)建用于構(gòu)建經(jīng)修飾的FNA多核苷酸文庫的方法(ISD方法)顯示于圖2中。使用在正向和反向上均勻地覆蓋編碼392個氨基酸的全長蛋白質(zhì)(SEQ ID NO 1)的前原區(qū)域(SEQ ID NO 7)的FNA基因序列的兩套寡核苷酸,擴增編碼FNA的前原區(qū)域的FNA基因部分的左邊和右邊片段。兩種PCR反應(yīng)(左邊和右邊片段)包含5’正向或3’反向基因序列側(cè)翼寡核苷酸,每一寡核苷酸與相應(yīng)的相對引物寡核苷酸組合。使用包含EcoRI位點的單一正向引物(P3233,TTATTGTCTCATGAGCGGATAC ;SEQ ID NO :123)和各含 Eaml04I 位點的反向引物 P3301r-P3404r(SEQ ID NOS =124-227 ;表1)擴增左邊片段。使用包含MluI限制性位點的單條反向引物(P3237,TGTCGATAACCGCTACTTTAAC ;SEQ ID NO 228)和各含 Eaml04I 限制性位點的正向引物P3301f-P3401f(SEQ ID NOS :229-332 ;表2)擴增右邊片段。表1、用于擴增左邊片段的反向引物序列
      權(quán)利要求
      1.一種編碼經(jīng)修飾的全長蛋白酶的分離的經(jīng)修飾的多核苷酸,所述分離的經(jīng)修飾的多核苷酸包含編碼所述全長蛋白酶的前原區(qū)域的第一多核苷酸,該第一多核苷酸有效連接到編碼所述全長蛋白酶的成熟區(qū)域的第二多核苷酸上,其中所述第一多核苷酸編碼SEQ ID NO 7的前原區(qū)域,并進一步被突變而包含至少一個突變,其中所述至少一個突變增強宿主細胞的所述蛋白酶生產(chǎn)。
      2.權(quán)利要求1的分離的經(jīng)修飾的多核苷酸,其中所述經(jīng)修飾的全長蛋白酶為源自野生型或變體前體堿性絲氨酸蛋白酶的堿性絲氨酸蛋白酶。
      3.權(quán)利要求2的分離的經(jīng)修飾的多核苷酸,其中所述前體堿性絲氨酸蛋白酶為枯草芽孢桿菌、解淀粉芽孢桿菌、短小芽孢桿菌或地衣芽孢桿菌的絲氨酸蛋白酶。
      4.權(quán)利要求1的分離的多核苷酸,其中所述宿主細胞為芽孢桿菌屬物種宿主細胞。
      5.權(quán)利要求4的分離的多核苷酸,其中所述芽孢桿菌屬物種宿主細胞為枯草芽孢桿菌宿主細胞。
      6.權(quán)利要求1-5之任一的分離的經(jīng)修飾的多核苷酸,其中所述第二多核苷酸編碼與 SEQ ID NO :9的蛋白酶具有至少約65%同一性的蛋白酶。
      7.權(quán)利要求1-6之任一的分離的經(jīng)修飾的多核苷酸,其中所述第二多核苷酸編碼SEQ ID NO 9的蛋白酶。
      8.權(quán)利要求1-7之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含至少一個突變,所述至少一個突變編碼在選自以下的一個或多個位置上的至少一個取代2, 3,6,7,8,10,11,12,13,14,15,16,17,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33, 34,35,36,37,38,39,45,46,47,48,49,50,51,52,53,54,55,57,58,59,61,62,63,64,66, 67,68,69,70,72,74,75,76,77,78,80,82,83,84,87,88,89,90,91,93,96,100 和 102,其中的位置通過與SEQ ID NO :7的前原多肽的氨基酸序列對應(yīng)而進行編號。
      9.權(quán)利要求1-8之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含至少一個突變,所述至少一個突變編碼選自以下的至少一個取代X2F,N,P和Y ;X3A, M,P和R ; X6K 禾口 M ;X7E ;I8W ;X10A,C,G,M 禾口 T ;X11A,F(xiàn) 禾口 T ;X12C,P,T ;X13C,G 禾口 S ;X14F ;X15G,M,T 禾口 V ;X16V ;X17S ;X19P 禾口 S ;X20V ;X21S ;X22E ;X23F, Q 禾口 W ;X24G, T 禾口 V ;X25A, D 禾口 W ;X26C 和 H ;X27A, F, H, P, T,V 和 Y ;X28V ;X29E, I,R,S 和 T ;X30C ;X31H, K, N, S,V 和 W ;X32C, F, M, N, P,S 禾口 V ;X33E, F, M,P 禾口 S ;X34D, H,P 禾口 V ;X35C, Q 禾口 S ;X36C, D, L, N, S,W 禾口 Y ;X37C, G,K 禾口 Q ;X38F, Q,S 禾口 W ;X39A, C,G,I,L, M, P, S,T 禾口 V ;X45G 禾口 S ;X46S ;X47E 禾口 F ;X48G, I,T,W 禾口 Y ;X49A, C,E 禾口 I ;X50D 禾口 Y ;X51A 禾口 H ;X52A, H, I 禾口 M ;X53D,E,M,Q 禾口 T ;X54F, G, H,I 禾Π S ;X55D ;Χ57Ε, N 禾Π R ;Χ58Α, C, Ε, F, G, K, R, S, Τ, W ;Χ59Ε ;Χ61Α, F,I 禾Π R ;Χ62Α, F, G, H, N, S,T 禾口 V ;Χ63Α, C, Ε, F, G, N, Q,R 禾口 T ;G64D,M,Q 禾口 S ;Χ66Ε ;X67G 禾口 L ;X68C, D 和 R ;Χ69Υ ;Χ70Ε, G, K, L, Μ, P,S 禾口 V ;X72D 禾口 N ;X74C 禾口 Y ;X75G ;X76V ;Χ77Ε, V 禾口 Y ;Χ78Μ, Q 禾口 V ;X80D, L 禾口 N ;X82C, D, P, Q,S 禾口 T ;X83G 禾口 N ;Χ84Μ ;X87R ;Χ88Α, D, G,T 禾口 V ;X89V ; X90D 和 Q ;Χ91Α ;Χ92Ε 和 S ;X93G,N 禾口 S ;X96G,N 禾口 T ;X100Q ;禾口 Χ102Τ,其中的位置通過與 SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      10.權(quán)利要求1-9之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含至少一個突變,所述至少一個突變編碼選自以下的至少一個取代R2F,N,P和Y ;S3A, M,P和 R ;L6K 禾口 M ;W7E ; I8W ;L10A, C,G,M 禾口 T ;L11A,F(xiàn) 禾口 T ;F12C,P,T ;A13C,G 禾口 S ;L14F ;A15G,M,T 禾口 V ;L16V ;I17S ;T19P 禾口 S ;M20V ;A21S ;F22E ;G23F, Q 禾口 W ;S24G, T 禾口 V ;T25A, D 禾口 W ;S26C 禾口 H ;S27A, F, H, P, T,V 禾口 Y ;A28V ;Q29E, I,R,S 禾口 T ;A30C ;A31H, K, N,S,V 禾口 W ; G32C, F, M, N, P,S 禾口 T ;K33E,F(xiàn), M,P 禾口 S ;S34D, H,P 禾口 V ;N35C, Q 禾口 S ;G36C, D, L, N, S, W 禾口 Y ;E37C, G,K 禾口 Q ;K38F, Q,S 禾口 W ;K39A, C,G,I,L, M, P, S,T 禾口 V ;K45G 禾口 S ;Q46S ;T47E 禾口 F ;M48G, I,T,W 禾口 Y ;S49A, C,E 禾口 I ;T50D 禾口 Y ;M51A 禾口 H ;S52A, H,I 禾口 M ;A53D, Ε, M, Q 禾Π T ;A54F,G, H,I 禾Π S ;K55D ;Κ57Ε, N 禾Π R ;D58A, C, Ε, F, G, K, R, S, Τ, W ;V59E ;S61A, F, I 禾口 R ;Ε62Α, F, G, H, N, S,T 禾口 V ;Κ63Α, C, Ε, F, G, N, Q,R 禾口 T ;64D,M,Q 禾口 S ;Κ66Ε ;V67G 禾口 L ;Q68C, D 禾口 R ;Κ69Υ ;Q70E, G, K, L, Μ, P,S 禾口 V ;K72D 禾口 N ;V74C 禾口 Y ;D75G ;A76V ;Α77Ε, V 禾口 Y ;S78M, Q 禾口 V ;T80D, L 禾口 N ;N82C, D, P, Q,S 禾口 T ;E83G 禾口 N ;Κ84Μ ;K87R ;Ε88Α, D, G, T 和 V ;L89V ;K90D 和 Q ;Κ91Α ;D92E 和 S ;P93G,N 禾口 S ;A96G,N 禾口 T ;E100Q ;禾口 Η102Τ,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      11.權(quán)利要求1-10之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含編碼選自以下的取代組合的至少一個突變組合X49A-XMT,X49A-X72D,Χ49Α-Χ78Μ, X49A-X78V, X49A-X93S, X49C-X24T, X49C-X72D, X49C-X78M, X49C-X78V, X49C-X91A, X49C-X93S, Χ91Α-χ24Τ, Χ91Α-Χ49Α, Χ91Α-Χ52Η, X91A-X72D, Χ91Α-Χ78Μ, X91A-X78V, X93S-X24T, X93S-X49C, X93S-X52H, X93S-X72D, X93S-X78M 和 X93S-X78V,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      12.權(quán)利要求1-11之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含編碼選自以下的取代組合的至少一個突變組合S49A-S24T,S49A-K72D,S49A-S78M, S49A-S78V, S49A-P93S, S49C-S24T, S49C-K72D, S49C-S78M, S49C-S78V, S49C-K91A, S49C-P93S, K91A-S24T, K91A-S49A, K91A-S52H, K91A-K72D, K91A-S78M, K91A-S78V, P93S-S24T, P93S-S49C, P93S-S52H,P93S-K72D,P93S-S78M 和 P93S-S78V,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      13.權(quán)利要求1-7之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含至少一個突變,所述至少一個突變編碼選自以下的至少一個缺失p. X18_X19del, p. X22_23del, pX37del, pX49del, p. X47del, pX55del 和 p. X57del,其中的位置通過與 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      14.權(quán)利要求1-7和13之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含至少一個突變,所述至少一個突變編碼選自以下的至少一個缺失p. I18_T19del, p. F22_ G23del, p. E37del, p. T47del, p. S49del, p. K55del 和 p. K57del,其中的位置通過與 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      15.權(quán)利要求1_7、13和14之任一的分離的多核苷酸,其中所述第一多核苷酸包含至少一個突變,所述至少一個突變編碼選自以下的至少一個插入p. X2_X3insT,p. X30_ X31insA, p. X19_X20insAT, p. X21_X22insS, p. X32_X33insG, p. X36_X37insG 和 p. X58_ )(59insA,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      16.權(quán)利要求1-7和15之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含至少一個突變,所述至少一個突變編碼選自以下的插入p. R2_S3insT, p. A30_A31insA, p. T19_M20insAT, p. A21_F22insS, p. G32_K33insG, p. G36_E37insG 和 p. D58_V59insA,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      17.權(quán)利要求1-7之任一的分離的多核苷酸,其中所述第一多核苷酸包含至少2 個突變,所述至少2個突變編碼選自以下的至少一個取代和至少一個缺失X46H-p. X47del, X49A-p.X22_X23del, x49C-p.X22_X23del, X48I-p. X49del, X17ff-p.X18_ X19del, X78M-P. X22_X23del,X78V-p. X22_X23del, X78V-p. X57del, X91A_p. X22_X23del, X91A-X48I-pX49del, X91A_p. X57del, X93S_p. X22_X23del 和 X93S_X48I-p. X49del,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      18.權(quán)利要求1-7和17之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含至少2個突變,所述至少2個突變編碼選自以下的至少一個取代和至少一個缺失Q46H-p. T47del, S49A-p. F22_G23del, S49C-p. F22_G23del, M48I-p.S49del, I17ff-p. I18_T19del, S78M-p. F22_G23del, S78V-p. F22_G23del, K91A-p. F22_G23del, K91A-M48I-pS49del, K91A_p. K57del, P93S_p. F22_G23del 和 P93S_M48I-p. S49del,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      19.權(quán)利要求1-7之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含至少2個突變,所述至少2個突變編碼選自以下的至少一個取代和至少一個插入X49A-p. X2_ X3insT, X49A-p32X_X33insG, X49A_p. X19_X20insAT, X49C_p. X19_X20insAT, X49C_p. X32_ X33insG, X52H—p. X19_X20insAT, X72D_p. X19_X20insAT, X78M_p. X19_X20insAT, X78V-p. X19_X20insAT, X91A-p. X19_X20insAT, X91A-p. X32_X33insG, X93S-p. X19_X20insAT 和 X93S-p. X32_X33insG,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      20.權(quán)利要求1-7和19之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含至少2個突變,所述至少2個突變編碼選自以下的至少一個取代和至少一個插入 S49A-p. R2_S3insT, S49A_p32G_K33insG,S49A_p. T19_M20insAT, S49C_p. T19_M20insAT, S49C-p. G32_K33insG, S49C-p. T19_M20insAT, S52H—p. T19_M20insAT, K72D-p.T19_ M20insAT, S78M_p. T19_M20insAT, S78V-p. T19_M20insAT, K91A_p. T19_M20insAT, K91A-p. G32_K33insG, P93S_p. T19_M20insAT 和 P93S_p. G32_K33insG,其中的位置通過與 SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      21.權(quán)利要求1-7之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含至少2個突變,所述至少2個突變編碼選自以下的至少一個缺失和至少一個插入 p. X57del-p. X19_X20insAT 和 p. X 22_X23del_p. X2_X3insT,其中的位置通過與 SEQ ID NO: 7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      22.權(quán)利要求1-7和21之任一的分離的經(jīng)修飾的多核苷酸,其中所述第一多核苷酸包含至少2個突變,所述至少2個突變編碼選自以下的缺失和插入pK57del-p. T19_M20insAT 和 p. F22_G23del-p. R2_S3insT。
      23.權(quán)利要求1-7之任一的分離的多核苷酸,其中所述第一多核苷酸包含至少3個突變,所述至少3個突變編碼相應(yīng)于p. X49del-p. X19_X20insAT_X48I的至少一個缺失、一個插入和一個取代,其中的位置通過與SEQ ID NO :7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      24.權(quán)利要求1-7和23之任一的分離的多核苷酸,其中所述第一多核苷酸包含至少3個突變,所述至少3個突變編碼相應(yīng)于p. S49del-p. T19_M20insAT_M48I的至少一個缺失、 一個插入和一個取代,其中的位置通過與SEQ ID NO 7所示FNA蛋白酶的前原多肽的氨基酸序列對應(yīng)而進行編號。
      25.由權(quán)利要求I-M之任一的經(jīng)修飾的全長多核苷酸編碼的分離的多肽。
      26.包含權(quán)利要求I-M之任一的分離的經(jīng)修飾的多核苷酸的表達載體。
      27.權(quán)利要求沈的表達載體,其還包含AprE啟動子。
      28.包含權(quán)利要求沈-27之任一的表達載體的宿主細胞。
      29.權(quán)利要求觀的宿主細胞,其中宿主細胞為芽孢桿菌屬物種宿主細胞。
      30.權(quán)利要求四的宿主細胞,其中所述芽孢桿菌屬物種宿主細胞選自枯草芽孢桿菌、 地衣芽孢桿菌、遲緩芽孢桿菌、短芽孢桿菌、嗜熱脂肪芽孢桿菌、嗜堿芽孢桿菌、解淀粉芽孢桿菌、克勞氏芽孢桿菌、耐鹽芽孢桿菌、巨大芽孢桿菌、凝結(jié)芽孢桿菌、環(huán)狀芽孢桿菌、燦爛芽孢桿菌和蘇云金芽孢桿菌。
      31.權(quán)利要求觀-30之任一的宿主細胞,其中所述宿主細胞為枯草芽孢桿菌宿主細胞。
      32.在芽孢桿菌屬物種宿主細胞中生產(chǎn)成熟蛋白酶的方法,所述方法包括a)提供權(quán)利要求沈-27之任一的表達載體;b)以所述表達載體轉(zhuǎn)化宿主細胞;c)在合適的條件下培養(yǎng)所述宿主細胞,以使所述宿主細胞生產(chǎn)所述蛋白酶。
      33.權(quán)利要求32的方法,其中所述芽孢桿菌屬物種宿主細胞為枯草芽孢桿菌宿主細胞。
      34.權(quán)利要求32-33之任一的方法,其中所述蛋白酶為堿性絲氨酸蛋白酶。
      35.權(quán)利要求32-34之任一的方法,其中所述經(jīng)修飾的多核苷酸編碼包含與SEQID NO 9至少約65%相同的成熟區(qū)域的蛋白酶。
      36.權(quán)利要求32-35之任一的方法,其中所述第一多核苷酸編碼SEQID NO :7的前原區(qū)域,其中所述第一多核苷酸包含至少一個增加所述蛋白酶的所述成熟區(qū)域的生產(chǎn)的突變, 并且其中所述第二多核苷酸編碼SEQ ID NO :9的成熟區(qū)域。
      全文摘要
      本發(fā)明涉及編碼經(jīng)修飾的蛋白酶的經(jīng)修飾的多核苷酸,本發(fā)明還涉及用于改變蛋白酶在微生物中的生產(chǎn)的方法。特別地,該經(jīng)修飾的多核苷酸包含一個或多個突變,編碼經(jīng)修飾的蛋白酶,所述經(jīng)修飾的蛋白酶具有增強該活性酶生產(chǎn)的前原區(qū)域修飾。本發(fā)明還涉及用于改變蛋白酶在微生物,例如芽孢桿菌屬物種,中的生產(chǎn)的方法。
      文檔編號C07H21/04GK102575242SQ201080043790
      公開日2012年7月11日 申請日期2010年4月15日 優(yōu)先權(quán)日2009年7月31日
      發(fā)明者A·比薩奇科, B·F·施密特 申請人:丹尼斯科美國公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1