具有修飾的原區(qū)的蛋白酶的制作方法

文檔序號：392068閱讀：658來源：國知局

專利名稱：具有修飾的原區(qū)的蛋白酶的制作方法
技術(shù)領(lǐng)域：
本發(fā)明提供用于在細菌宿主細胞中產(chǎn)生成熟蛋白酶的方法和組合物。該組合物包含編碼在原區(qū)(pro region)中具有至少一個突變的修飾蛋白酶的修飾多核苷酸；由該修飾多核苷酸編碼的修飾的絲氨酸蛋白酶；包含編碼該修飾蛋白酶的修飾多核苷酸的表達盒、DNA構(gòu)建體和載體；及用本發(fā)明的載體轉(zhuǎn)化的細菌宿主細胞。該方法包括用于增強成熟蛋白酶在細菌宿主細胞，例如芽孢桿菌屬物種(Bacillus sp.)宿主細胞中的產(chǎn)生的方法。所產(chǎn)生的蛋白酶用于工業(yè)產(chǎn)生適合用于包括但不限于清潔、動物飼料和織物加工產(chǎn)業(yè)的多種產(chǎn)業(yè)中的酶。
背景技術(shù)：
部分由于它們將其發(fā)酵產(chǎn)物分泌入其培養(yǎng)基中的能力，已將作為芽孢桿菌屬 (Bacillus)成員的微生物，如革蘭氏陽性微生物用于大規(guī)模工業(yè)發(fā)酵。使分泌性蛋白質(zhì)跨細胞膜和細胞壁輸出，然后釋放入外部培養(yǎng)基中。事實上，異源多肽的分泌是工業(yè)中廣泛使用的技術(shù)。通常，用編碼待表達和分泌的異源目的多肽的核酸轉(zhuǎn)化細胞來大量產(chǎn)生希望的多肽。已通過編碼希望的蛋白質(zhì)的多核苷酸的遺傳操作來控制希望的多肽的表達和分泌。盡管蛋白質(zhì)產(chǎn)生方法中有多種進步，但本領(lǐng)域中仍然存在提供更有效的方法用于胞外蛋白質(zhì)分泌的需要，目的在于增強用于包括但不限于清潔、動物飼料和織物加工產(chǎn)業(yè)的多種產(chǎn)業(yè)中的酶，如蛋白酶的產(chǎn)生。
發(fā)明概述本發(fā)明提供用于在細菌宿主細胞中產(chǎn)生成熟蛋白酶的方法和組合物。該組合物包含編碼在原區(qū)中具有至少一個突變的修飾蛋白酶的修飾多核苷酸；由該修飾多核苷酸編碼的修飾的絲氨酸蛋白酶；包含編碼該修飾蛋白酶的修飾多核苷酸的表達盒、DNA構(gòu)建體和載體；及用本發(fā)明的載體轉(zhuǎn)化的細菌宿主細胞。該方法包括用于增強成熟蛋白酶在細菌宿主細胞，例如芽孢桿菌屬物種宿主細胞中的產(chǎn)生的方法。所產(chǎn)生的蛋白酶用于工業(yè)產(chǎn)生適合用于包括但不限于清潔、動物飼料和織物加工產(chǎn)業(yè)的多種產(chǎn)業(yè)中的酶。在一個實施方案中，本發(fā)明提供編碼修飾蛋白酶的分離的修飾多核苷酸。該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID N0:7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)在選自原區(qū)的位置6、30和32的位置上包含至少兩個氨基酸取代的組合。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌(Bacillus subtilis)的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)在選自原區(qū)的位置6、30和32的位置上包含至少兩個氨基酸的取代的組合。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的源自克勞氏芽孢桿菌(Bacillus clausii)或遲緩芽孢桿菌(Bacillus lentus)的野生型或變體堿性絲氨酸蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)在選自原區(qū)的位置6、30和32的位置上包含至少兩個氨基酸的取代的組合。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼選自SEQ ID NO :9、11、13、15、17、19和21 的蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，本發(fā)明提供編碼修飾蛋白酶的分離的修飾多核苷酸。該分離的修飾多核苷酸包含編碼選自SEQ ID NO :3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)在選自原區(qū)的位置6、30 和32的位置上包含至少兩個氨基酸的取代的組合。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼選自SEQ ID NO 3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)在選自原區(qū)的位置6、30和32的位置上包含至少兩個氨基酸的取代的組合。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID N0:9的成熟蛋白酶至少約60%同一的源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼選自SEQ ID NO 3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)在選自原區(qū)的位置6、30和32的位置上包含至少兩個氨基酸的取代的組合。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼選自SEQ ID NO 9, 11、13、15、17、19和21的蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自E6X-E30G、E6X-E30S、E6X-A32K、E30X-A32K、 E30G-A32X、E30S-A32X和E6G-E30G-A32X。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自E6X-E30G、E6X-E30S、E6X-A32K、E30X-A32K、 E30G-A32X、E30S-A32X和E6G-E30G-A32X。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自E6X-E30G、E6X-E30S、E6X-A32K、E30X-A32K、 E30G-A32X、E30S-A32X和E6G-E30G-A32X。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼選自SEQ ID N0:9、ll、13、15、17、19和21的蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，本發(fā)明提供編碼修飾蛋白酶的分離的修飾多核苷酸。該分離的修飾多核苷酸包含編碼選自SEQ ID NO :3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自 E6X-E30G、E6X-E30S、E6X-A32K、E30X-A32K、E30G-A32X、E30S-A32X 和E6G-E30G-A32X。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼選自SEQ ID N0:3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自E6X-E30G、E6X-E30S、 E6X-A32K、E30X-A32K、E30G-A32X、E30S-A32X 和 E6G-E30G-A32X。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60% 同一的源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼選自SEQ ID N0:3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自E6X-E30G、E6X-E30S、 E6X-A32K、E30X-A32K、E30G-A32X、E30S-A32X 和 E6G-E30G-A32X。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼選自SEQ ID NO :9、11、13、15、17、19和21 的蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自 E6R-A32K、E6N-A32K、E6D-A32K、E6I-A32K、E6K-A32K、 E6M-A32K,E6P-A32K,
E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G， E6H-E30G， E6K-E30G， E6S-E30G， E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G,E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S,E6Y-E30S,E6V-E30S,E30S-A32R,E30S-A32N，E30S-A32D,E30S-A32C，E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y 和 E30S-A32V。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自 E6R-A32K、E6N-A32K、E6D-A32K、E6I-A32K、E6K-A32K、 E6M-A32K,E6P-A32K,
E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G， E6H-E30G， E6K-E30G， E6S-E30G， E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S,E6Y-E30S,E6V-E30S,E30S-A32R,E30S-A32N，E30S-A32D,E30S-A32C，E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y 和 E30S-A32V。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自 E6R-A32K、E6N-A32K、E6D-A32K、E6I-A32K、E6K-A32K、 E6M-A32K,E6P-A32K,
E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G， E6H-E30G， E6K-E30G， E6S-E30G， E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S,E6Y-E30S,E6V-E30S,E30S-A32R,E30S-A32N，E30S-A32D,E30S-A32C，E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F,E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y 和 E30S-A32V。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼選自SEQ ID N0:9、ll、13、15、17、 19和21的蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，本發(fā)明提供編碼修飾蛋白酶的分離的修飾多核苷酸。該分離的修飾多核苷酸包含編碼選自SEQ ID NO :3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自 E6R-A32K、E6N-A32K、E6D-A32K、E6I-A32K、E6K-A32K、E6M-A32K、 E6P-A32K,E6S-A32K,E6T-A32K,E6N-A32K,E30W-A32K,E30V-A32K,E6A-E30G、E6R-E30G、
E6C-E30G, E6Q-E30G,E6G-E30G，E6H-E30G，E6K-E30G，E6S-E30G，E6W-E30G,E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W,E6A-E30G，E6R-E30G,E6N-E30G，E6D-E30G，E6C-E30G，E6Q-E30G,E6G-E30G， E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S, E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T，E30S-A32W, E30S-A32Y 和 E30S-A32V。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，該分離的修飾多核苷酸包含編碼選自SEQ ID N0:3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自E6R-A32K、E6N-A32K、 E6D-A32K、E6I-A32K、E6K-A32K、E6M-A32K、E6P-A32K、E6S-A32K、E6T-A32K、E6N-A32K、 E30W-A32K,E30V-A32K,E6A-E30G、
E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G，E6H-E30G，E6K-E30G，E6S-E30G，E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G， E6D-E30G， E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S，E6V-E30S, E30S-A32R, E30S-A32N，E30S-A32D, E30S-A32C， E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W、E30S_A32Y 和 E30S-A32V。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID N0:9的成熟蛋白酶至少約60%同一的源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。
在另一實施方案中，該分離的修飾多核苷酸包含編碼選自SEQ ID NO :3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自E6R-A32K、E6N-A32K、 E6D-A32K、E6I-A32K、E6K-A32K、E6M-A32K、E6P-A32K、E6S-A32K、E6T-A32K、E6N-A32K、 E30W-A32K,E30V-A32K,E6A-E30G、
E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G，E6H-E30G，E6K-E30G，E6S-E30G，E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G， E6R-E30G, E6N-E30G， E6D-E30G， E6C-E30G， E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S，E6V-E30S,E30S-A32R, E30S-A32N，E30S-A32D, E30S-A32C， E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W、E30S_A32Y 和 E30S-A32V。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID N0:9的成熟蛋白酶至少約60%同一的源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶的成熟區(qū)。優(yōu)選地，該取代增強成熟蛋白酶通過芽孢桿菌屬物種宿主，例如枯草芽孢桿菌的產(chǎn)生。在另一實施方案中，本發(fā)明提供包含分離的修飾多核苷酸的表達載體，該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID N0:7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)在選自原區(qū)的位置6、30和32的位置上包含至少兩個氨基酸的取代的組合。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該成熟蛋白酶是源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶，例如 SEQ ID NO :9、11、13、15、17、19和21。在一些實施方案中，通過包含于該表達載體中的AprE 啟動子驅(qū)動該分離的多核苷酸的表達。在另一實施方案中，該表達載體包含分離的修飾多核苷酸，該分離的修飾多核苷酸包含編碼選自SEQ ID NO 3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO 7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)在選自原區(qū)的位置6、30和32的位置上包含至少兩個氨基酸的取代的組合。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該成熟蛋白酶是源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶，例如SEQ ID NO :9、11、13、15、17、19和21。在一些實施方案中，通過包含于該表達載體中的AprE啟動子驅(qū)動該分離的多核苷酸的表達。在另一實施方案中，本發(fā)明提供包含分離的修飾多核苷酸的表達載體，該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID N0:7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自 E6X-E30G、E6X-E30S、E6X-A32K, E30X-A32K, E30G-A32X、E30S-A32X 和 E6G-E30G-A32X。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID N0:9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該成熟蛋白酶是源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶，例如SEQ ID NO :9、11、13、15、17、19 和21。在一些實施方案中，通過包含于該表達載體中的AprE啟動子驅(qū)動該分離的多核苷酸的表達。在另一實施方案中，該表達載體包含分離的修飾多核苷酸，該分離的修飾多核苷酸包含編碼選自SEQ ID NO :3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼 SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自 E6X-E30G、E6X-E30S、E6X-A32K, E30X-A32K, E30G-A32X、E30S-A32X 和 E6G-E30G-A32X。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該成熟蛋白酶是源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶，例如SEQ ID NO :9、11、13、15、17、19和21。在一些實施方案中，通過包含于該表達載體中的AprE啟動子驅(qū)動該分離的多核苷酸的表達。在另一實施方案中，本發(fā)明提供包含分離的修飾多核苷酸的表達載體，該分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID N0:7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自 E6R-A32K, E6N-A32K, E6D-A32K, E6I-A32K, E6K-A32K, E6M-A32K, E6P-A32K, E6S-A32K, E6T-A32K,E6N-A32K,
E30W-A32K, E30V-A32K, E6A-E30G, E6R-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6S-E30G，E6W-E30G, E30G-A32R，E30G-A32Q，E30G-A32E，E30G-A32G， E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S， E6F-E30S， E6P-E30S， E6Y-E30S， E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W，E30S-A32Y和E30S-A32V。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該成熟蛋白酶是源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶，例如SEQ ID N0:9、ll、13、15、17、19和21。在一些實施方案中，通過包含于該表達載體中的AprE啟動子驅(qū)動該分離的多核苷酸的表達。在另一實施方案中，該表達載體包含分離的修飾多核苷酸，該分離的修飾多核苷酸包含編碼選自SEQ ID NO 3和5的信號肽的第一多核苷酸，該第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含至少兩個氨基酸的取代的組合，該組合選自 E6R-A32K, E6N-A32K, E6D-A32K, E6I-A32K, E6K-A32K, E6M-A32K, E6P-A32K, E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G， E6R-E30G, E6C-E30G， E6Q-E30G, E6G-E30G, E6H-E30G， E6K-E30G， E6S-E30G， E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T,E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S, E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P、 E30S-A32S、E30S-A32T、E30S-A32W、E30S-A32Y 和 E30S-A32V。相應地，該第二多核苷酸與第三多核苷酸有效連接，該第三多核苷酸編碼與SEQ ID NO :9的成熟蛋白酶至少約60%同一的蛋白酶的成熟區(qū)。優(yōu)選地，該成熟蛋白酶是源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶，例如SEQ ID N0:9、ll、13、15、17、19和21。在一些實施方案中，通過包含于該表達載體中的AprE啟動子驅(qū)動該分離的多核苷酸的表達。在另一實施方案中，本發(fā)明提供包含上述表達載體中的任一個的芽孢桿菌屬物種宿主細胞，例如枯草芽孢桿菌。優(yōu)選地，包含于修飾多核苷酸的原區(qū)中的取代增強成熟蛋白酶從芽孢桿菌屬宿主細胞的產(chǎn)生。除枯草芽孢桿菌外，可以用于從表達載體表達修飾多核苷酸的其他宿主細胞包含地衣芽孢桿菌(Bacillus licheniformis)、遲緩芽孢桿菌、短芽孢桿菌(Bacillus brevis)、嗜熱月旨肪芽孢桿菌(Bacillus stearothermophilus)、嗜堿 ^ifelf lif (Bacillus alkalophilus) >I ^jv^ifelflii (Bacillus amyloliquefaciens) > 克勞氏芽孢桿菌、耐鹽芽孢桿菌(Bacillus halodurans)、巨大芽孢桿菌(Bacillus megaterium)、凝結(jié)芽孢桿菌(Bacillus coagulans)、環(huán)狀芽孢桿菌(Bacillus circulans)、燦爛芽孢桿菌(Bacillus lautus)禾Π蘇云金芽孢桿菌(Bacillus thuringiensis)。在另一實施方案中，本發(fā)明提供用于在芽孢桿菌屬物種宿主細胞中產(chǎn)生成熟蛋白酶的方法。該方法包括提供上述表達載體中的任一種，將該表達載體轉(zhuǎn)化入芽孢桿菌屬物種宿主細胞中，并在適宜的條件下培養(yǎng)轉(zhuǎn)化的宿主細胞來產(chǎn)生蛋白酶。優(yōu)選地，該宿主細胞是枯草芽孢桿菌宿主細胞。但是，除枯草芽孢桿菌外，可以用于從表達載體產(chǎn)生成熟蛋白酶的其他宿主細胞包含地衣芽孢桿菌、遲緩芽孢桿菌、短芽孢桿菌、嗜熱脂肪芽孢桿菌、嗜堿芽孢桿菌、解淀粉芽孢桿菌、克勞氏芽孢桿菌、耐鹽芽孢桿菌、巨大芽孢桿菌、凝結(jié)芽孢桿菌、環(huán)狀芽孢桿菌、燦爛芽孢桿菌和蘇云金芽孢桿菌。在另一實施方案中，該方法通過提供表達分離的修飾多核苷酸的表達載體來產(chǎn)生SEQ ID NO 9的成熟蛋白酶，該分離的修飾多核苷酸包含編碼SEQ ID NO 3的信號肽的第一多核苷酸；編碼SEQ ID N0:7的原區(qū)的第二多核苷酸，該原區(qū)包含選自E6R-A32K、 E6N-A32K、E6D-A32K、E6I-A32K、E6K-A32K、E6M-A32K、E6P-A32K、E6S-A32K、E6T-A32K、 E6N-A32K、E30W-A32K、E30V-A3^(的取代組合；和編碼SEQ ID NO :9的成熟蛋白酶的第三多核苷酸。將該表達載體轉(zhuǎn)化入芽孢桿菌屬物種宿主細胞，例如枯草芽孢桿菌中，在適宜的條件下培養(yǎng)該宿主細胞來產(chǎn)生成熟蛋白酶。在另一實施方案中，該方法通過提供表達分離的修飾多核苷酸的表達載體來產(chǎn)生 SEQ ID NO :17的成熟蛋白酶，該分離的修飾多核苷酸包含編碼SEQ ID NO :3的信號肽的第一多核苷酸；編碼SEQ ID N0:7的原區(qū)的第二多核苷酸，該原區(qū)包含選自E6A-E30G、 E6R-E30G、E6C-E30G, E6Q-E30G,E6G-E30G，E6H-E30G，E6K-E30G，E6S-E30G，E6W-E30G,E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S，E6G-E30G-A32T 禾P E6G-E30G-A32W的取代組合；和編碼SEQ ID NO :17的成熟蛋白酶的第三多核苷酸。將該表達載體轉(zhuǎn)化入芽孢桿菌屬物種宿主細胞，例如枯草芽孢桿菌中，在適宜的條件下培養(yǎng)該宿主細胞來產(chǎn)生成熟蛋白酶。在另一實施方案中，該方法通過提供表達分離的修飾多核苷酸的表達載體來產(chǎn)生 SEQ ID NO :19的成熟蛋白酶，該分離的修飾多核苷酸包含編碼SEQ ID NO :3的信號肽的第一多核苷酸；編碼SEQ ID N0:7的原區(qū)的第二多核苷酸，該原區(qū)包含選自E6A-E30G、 E6R-E30G、E6N-E30G、E6D-E30G、E6C-E30G、E6Q-E30G、E6G-E30G、E6H-E30G、E6K-E30G、 E6M-E30G、E6F-E30G、E6P-E30G、E6S-E30G、E6T-E30G、E6W-E30G、E6V-E30G 和 E6Y-E30G 的取代組合；和編碼SEQ ID NO :19的成熟蛋白酶的第三多核苷酸。將該表達載體轉(zhuǎn)化入芽孢桿菌屬物種宿主細胞，例如枯草芽孢桿菌中，在適宜的條件下培養(yǎng)該宿主細胞來產(chǎn)生成熟蛋白酶。在另一實施方案中，該方法通過提供表達分離的修飾多核苷酸的表達載體來產(chǎn)生 SEQ ID NO :21的成熟蛋白酶，該分離的修飾多核苷酸包含編碼SEQ ID NO :3的信號肽的第一多核苷酸；編碼SEQ ID N0:7的原區(qū)的第二多核苷酸，該原區(qū)包含選自E6A-E30S、 E6G-E30S、E6L-E30S、E6K-E30S、E6F-E30S、E6P-E30S、E6Y-E30S、E6V-E30S、E30S-A32R, E30S-A32N、E30S-A32D、E30S-A32C、E30S-A32Q、E30S-A32E、E30S-A32G、E30S-A32H、 E30S-A32L、E30S-A32K、E30S-A32M、E30S-A32F、E30S-A32P、E30S-A32S、E30S-A32T、 E30S-A32W、E30S-A32Y和E30S-A32V的取代組合；和編碼SEQ ID NO 21的成熟蛋白酶的第三多核苷酸。將該表達載體轉(zhuǎn)化入芽孢桿菌屬物種宿主細胞，例如枯草芽孢桿菌中，在適宜的條件下培養(yǎng)該宿主細胞來產(chǎn)生成熟蛋白酶。在其他實施方案中，該分離的修飾多核苷酸包含優(yōu)選增強成熟蛋白酶從芽孢桿菌屬物種宿主細胞的產(chǎn)生的一個氨基酸取代。在一個實施方案中，該分離的修飾多核苷酸包含第一多核苷酸，該第一多核苷酸編碼SEQ ID NO :3的信號肽，且與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含選自E6A、E6R、E6C、E6Q、E6H、E6I、E6K、E6M、 E6S、E6Y、E30A、E30R、E30N、E30D、E30Q、E30G、E30L、E30M、E30P、E30S、E30T、E30W、E30Y、 E30V、A32、A32R、A32C、A32E、A32G、A32L、A32K、A32F、A32T、A32Y 和 A32V 的氨基酸取代。該第二多核苷酸與編碼SEQ ID NO :17的蛋白酶的成熟區(qū)的第三多核苷酸有效連接。在另一實施方案中，該分離的修飾多核苷酸包含第一多核苷酸，該第一多核苷酸編碼SEQ ID NO :3的信號肽，且與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含選自 E6A、E6R、E6N、E6C、E6Q、E6G、E6H、E6M、E6F、E6P、E6S、E6T、E6W、E6V、A32K、 A32T和A32V的氨基酸取代。該第二多核苷酸與編碼SEQ ID NO :9的蛋白酶的成熟區(qū)的第三多核苷酸有效連接。在另一實施方案中，該分離的修飾多核苷酸包含第一多核苷酸，該第一多核苷酸編碼SEQ ID NO :3的信號肽，且與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含選自 E6A、E6H、E6K、E6R、E30A、E30R、E30N、E30D、E30G、E30H、E30L、E30K、E30F、 E30S、E30T和E30V的氨基酸取代。該第二多核苷酸與編碼SEQ ID NO :19的蛋白酶的成熟區(qū)的第三多核苷酸有效連接。在另一實施方案中，該分離的修飾多核苷酸包含第一多核苷酸，該第一多核苷酸編碼SEQ ID NO :3的信號肽，且與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含選自 E6A、E6R、E6Q、E6G、E6L、E6K、E6M、E6F、E6T、E6V、E30R、E30Q、E30G、E30I、 E30L、E30M、E30F、E30P、E30T、E30W、E30Y、E30V、A32Q、A32S、A32T 和 A32V 的氨基酸取代。該第二多核苷酸與編碼SEQ ID NO :11的蛋白酶的成熟區(qū)的第三多核苷酸有效連接。在另一實施方案中，該分離的修飾多核苷酸包含第一多核苷酸，該第一多核苷酸編碼SEQ ID NO :3的信號肽，且與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，該原區(qū)包含選自 E30A、E30R、E30N、E30D、E30C、E30G、E30H、E30M、E30F、E30S、E30W、A32L、 A32F和A32V的氨基酸取代。該第二多核苷酸與編碼SEQ ID NO :21的蛋白酶的成熟區(qū)的第三多核苷酸有效連接。用于產(chǎn)生從原區(qū)中包含兩個或三個取代的修飾多核苷酸表達的成熟蛋白酶的方法還用于產(chǎn)生從包含單個氨基酸取代的修飾多核苷酸表達的成熟蛋白酶。在一個實施方案中，該方法包括提供如上文所述且包含原區(qū)中含有單個氨基酸取代的修飾多核苷酸的表達載體中的任一個，將該表達載體轉(zhuǎn)化入芽孢桿菌屬物種宿主細胞中，并在適宜的條件下培養(yǎng)轉(zhuǎn)化的宿主細胞來產(chǎn)生蛋白酶。優(yōu)選地，該宿主細胞是枯草芽孢桿菌宿主細胞。但是，除枯草芽孢桿菌外，可以用于從表達載體產(chǎn)生成熟蛋白酶的其他宿主細胞包含地衣芽孢桿菌、遲緩芽孢桿菌、短芽孢桿菌、嗜熱脂肪芽孢桿菌、嗜堿芽孢桿菌、解淀粉芽孢桿菌、克勞氏芽孢桿菌、耐鹽芽孢桿菌、巨大芽孢桿菌、凝結(jié)芽孢桿菌、環(huán)狀芽孢桿菌、燦爛芽孢桿菌和蘇云金芽孢桿菌。在一個實施方案中，該方法通過提供表達分離的修飾多核苷酸的表達載體來產(chǎn)生 SEQ ID NO 17的成熟蛋白酶，該分離的修飾多核苷酸包含編碼SEQ ID NO 3的信號肽的第一多核苷酸；編碼SEQ ID NO 7的原區(qū)的第二多核苷酸，該原區(qū)包含選自E6A、E6R、E6C、 E6Q、E6H、E6I、E6K、E6M、E6S、E6Y、E30A、E30R、E30N、E30D、E30Q、E30G、E30L、E30M、E30P、 E30S、E30T、E30W、E30Y、E30V、A32、A32R、A32C、A32E、A32G、A32L、A32K、A32F、A32T、A32Y 和A32V的單個氨基酸取代；和編碼SEQ ID NO 17的成熟蛋白酶的第三多核苷酸。將改表達載體轉(zhuǎn)化入芽孢桿菌屬物種宿主細胞，例如枯草芽孢桿菌中，在適宜的條件下培養(yǎng)該宿主細胞來產(chǎn)生成熟蛋白酶。在另一實施方案中，該方法通過提供表達分離的修飾多核苷酸的表達載體來產(chǎn)生 SEQ ID NO :9的成熟蛋白酶，該分離的修飾多核苷酸包含編碼SEQ ID NO :3的信號肽的第一多核苷酸；編碼SEQ ID NO 7的原區(qū)的第二多核苷酸，該原區(qū)包含選自E6A、E6R、E6N、 E6C、E6Q、E6G、E6H、E6M、E6F、E6P、E6S、E6T、E6W、E6V、A32K、A32T 和 A32V 的單個氨基酸取代；和編碼SEQ ID NO :9的成熟蛋白酶的第三多核苷酸。將該表達載體轉(zhuǎn)化入芽孢桿菌屬物種宿主細胞，例如枯草芽孢桿菌中，在適宜的條件下培養(yǎng)該宿主細胞來產(chǎn)生成熟蛋白酶。在另一實施方案中，該方法通過提供表達分離的修飾多核苷酸的表達載體來產(chǎn)生 SEQ ID NO 19的成熟蛋白酶，該分離的修飾多核苷酸包含編碼SEQ ID NO 3的信號肽的第一多核苷酸；編碼SEQ ID N0:7的原區(qū)的第二多核苷酸，該原區(qū)包含選自E6A、E6H、E6K、 E6R、E30A、E30R、E30N、E30D、E30G、E30H、E30L、E30K、E30F、E30S、E30T 和 E30V 的單個氨基酸取代；和編碼SEQ ID NO :19的成熟蛋白酶的第三多核苷酸。將該表達載體轉(zhuǎn)化入芽孢桿菌屬物種宿主細胞，例如枯草芽孢桿菌中，在適宜的條件下培養(yǎng)該宿主細胞來產(chǎn)生成熟蛋白酶。在另一實施方案中，該方法通過提供表達分離的修飾多核苷酸的表達載體來產(chǎn)生 SEQ ID NO 11的成熟蛋白酶，該分離的修飾多核苷酸包含編碼SEQ ID NO 3的信號肽的第一多核苷酸；編碼SEQ ID NO 7的原區(qū)的第二多核苷酸，該原區(qū)包含選自E6A、E6R、E6Q、 E6G、E6L、E6K、E6M、E6F、E6T、E6V、E30R、E30Q, E30G、E30I、E30L、E30M、E30F、E30P、E30T、 E30W、E30Y、E30V、A32Q、A32S、A32T 和 A32V 的單個氨基酸取代；和編碼 SEQ ID NO 11 的成熟蛋白酶的第三多核苷酸。將該表達載體轉(zhuǎn)化入芽孢桿菌屬物種宿主細胞，例如枯草芽孢桿菌中，在適宜的條件下培養(yǎng)該宿主細胞來產(chǎn)生成熟蛋白酶。在另一實施方案中，該方法通過提供表達分離的修飾多核苷酸的表達載體來產(chǎn)生 SEQ ID NO 21的成熟蛋白酶，該分離的修飾多核苷酸包含編碼SEQ ID NO 3的信號肽的第一多核苷酸；編碼SEQ ID N0:7的原區(qū)的第二多核苷酸，該原區(qū)包含選自E30A、E30R、 E30N、E30D、E30C、E30G、E30H、E30M、E30F、E30S、E30W、A32L、A32F 和 A32V 的單個氨基酸取代；和編碼SEQ ID NO :21的成熟蛋白酶的第三多核苷酸。將該表達載體轉(zhuǎn)化入芽孢桿菌屬物種宿主細胞，例如枯草芽孢桿菌中，在適宜的條件下培養(yǎng)該宿主細胞來產(chǎn)生成熟蛋白酶。
附圖簡述

圖1顯示SEQ ID NO 9的遲緩芽孢桿菌野生型絲氨酸蛋白酶(GG36)、SEQ ID NO 11的遲緩芽孢桿菌變體絲氨酸蛋白酶、SEQ ID NO :13的克勞氏芽孢桿菌絲氨酸蛋白酶及 SEQ ID NO 15,SEQ ID NO 17,SEQ ID NO 19,SEQ ID NO :21、SEQ ID NO :23 禾口SEQ ID NO: 25的克勞氏芽孢桿菌變體絲氨酸蛋白酶的成熟區(qū)的氨基酸序列比對。圖2顯示Blast檢索產(chǎn)生的SEQ ID NO 7的未修飾的原區(qū)的氨基酸序列與來自多種芽孢桿菌屬物種的蛋白酶的未修飾的原區(qū)的氨基酸序列的比對。圖3顯示Blast檢索產(chǎn)生的成熟蛋白酶的氨基酸序列(SEQ ID NO 9)與來自多種芽孢桿菌屬物種的蛋白酶的成熟區(qū)氨基酸序列的比對。圖4提供包含aprE信號序列(SEQ ID NO :3)、SEQ ID NO 7的原序列(pro sequence)和編碼成熟絲氨酸蛋白酶Pn的多核苷酸的pJH-Pn質(zhì)粒(A)圖譜和pBN3_Pn載體(B)圖譜。圖5提供分別編碼SEQ ID NO :9、11、13、15、17、19、21、23和25的成熟蛋白酶的示例性多核苷酸(SEQ ID NO :8、10、12、14、16、18、20、22和24)的比對。應理解，由于遺傳密
碼的簡并性，多肽可以由一個以上核苷酸序列編碼。發(fā)明詳述本發(fā)明提供編碼修飾蛋白酶的修飾多核苷酸，及用于增強蛋白酶在微生物中的產(chǎn)生的方法。具體而言，該修飾多核苷酸包含編碼具有原區(qū)的修飾，例如氨基酸取代的蛋白酶的一個或多個突變來增強活性酶的產(chǎn)生。本發(fā)明還涉及用于改變蛋白酶在微生物，如芽孢桿菌屬物種中的表達的方法。除非本文中另作定義，本文中使用的所有技術(shù)和科學術(shù)語具有與本發(fā)明所屬領(lǐng)域的普通技術(shù)人員的通常理解相同的含義(例如Singleton和^tinsbury，Dictionary of Microbiology and Molecular Biology,第 2 版·，John Wiley and Sons, NY[1994] ；Hale 禾口Markham,The Harper Collins Dictionary of Biology,Harper Perennial,NY[1991])。雖然與本文中所述的那些類似或等同的任意方法和材料也可用于實施本發(fā)明，但本文中描述優(yōu)選的方法和材料。因此，以下術(shù)語通過參考說明書整體而得到更充分的定義。同樣，除非文中清除地另有說明，本文中使用的單數(shù)形式“一”、“一個”和“該”包含復數(shù)指代。數(shù)字范圍包含定義該范圍的數(shù)字。除非另有說明，分別按5'至3'方向從左至右書寫核酸；按氨基至羧基方向從左至右書寫氨基酸序列。應理解，本發(fā)明不限于所描述的具體方法、流程和試劑，因為這些可以取決于本領(lǐng)域技術(shù)人員使用它們的背景而變化。本說明書通篇給出的每一最大數(shù)值限制旨在包含每一較低數(shù)值限制，就如同在本文中明確寫出這類較低數(shù)值限制一樣。本說明書通篇給出的每一最小數(shù)值限制將包含每一較高數(shù)值限制，就如同在本文中明確寫出這類較高數(shù)值限制一樣。本說明書通篇給出的每一數(shù)值范圍將包含落在這種較寬數(shù)值范圍內(nèi)的每一較窄數(shù)值范圍，就如同在本文中明確寫出這類較窄數(shù)值范圍一樣。本文在上文和下文中提到的所有專利、專利申請、文章和出版物在此明確引入作為參考。此外，本文中提供的標題不是可以參考說明書整體而得到的本發(fā)明的多種方面或?qū)嵤┓桨傅南拗?。因此，以下術(shù)語通過參考說明書整體而得到更充分的定義。但是，為了便于理解本發(fā)明，下文定義了許多術(shù)語。
定義本文中使用的術(shù)語“分離的”和“純化的”指從它與之天然結(jié)合的至少一種成分移出的核酸或氨基酸(或其他成分)。本文中的術(shù)語“修飾多核苷酸”指已改變?yōu)榘辽僖粋€突變來編碼“修飾”蛋白質(zhì)的多核苷酸序列。本文中使用的術(shù)語“蛋白酶”和“蛋白水解活性”指顯示水解具有肽鍵的肽或底物的能力的蛋白質(zhì)或肽。存在許多公知的方法用于測量蛋白水解活性(Kalisz，" Microbial Proteinases, “ 在 Fiechter(編輯)，Advances in Biochemical Engineering/ BiotechnoloRY, [1988]中)。例如，可以通過比較測定來確定蛋白水解活性，該比較測定分析所產(chǎn)生的蛋白酶水解市售底物的能力。用于蛋白酶或蛋白水解活性的這種分析的示例性底物包括但不限于二甲基酪蛋白(Sigma C-9801)、牛膠原(Sigma C-9879)、牛彈性蛋白 (Sigma E-1625)和牛角蛋白(ICN Biomedical 902111)。利用這些底物的比色測定為本領(lǐng)域公知(參見例如WO 99/34011和美國專利號6，376，450，二者均在此引入作為參考)。 AAPF測定(參見例如Del Mar等，Anal. Biochem.，99 :316-320 [1979])也用于測定成熟蛋白酶的產(chǎn)生。此測定測量酶水解可溶性合成底物琥珀酰-丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-對硝基苯胺(sAAPF-pNA)時釋放對硝基苯胺的速率。在分光光度計上于410nm測量從水解反應產(chǎn)生黃色的速率，且其與活性酶濃度成比例。尤其是，本文中的術(shù)語“蛋白酶”指 “絲氨酸蛋白酶”。本文中使用的術(shù)語“枯草蛋白酶”和“絲氨酸蛋白酶”指MEROPS-The Peptidase Data base (Rawlings 等，MEROPS :the peptidase database, Nucleic Acids Res,34 Database issue, D270-272, 2006,在網(wǎng)立占 merops. sanger. ac. uk/cgi-bin/merops. cgi ？ id = s08 ；action =.上)中所述的S8絲氨酸蛋白酶家族的任意成員。以下信息源自 2008 ^ 11^6 H ^ MEROPS-The Peptidase Data base "Peptidase family S8 containsthe serine endopeptidase serine protease and its homologues (Biochem J,290: 205-218，1993) ”。S8家族(也稱為枯草桿菌酶(subtilase)家族)是絲氨酸肽酶的第二大家族，且可以劃分為兩個亞家族以枯草蛋白酶(S08. 001)為模式實例的S8A亞家族和以 kexin(S08. 070)為模式實例的S8B亞家族。先前認為三肽酰肽酶II (TPP-II ；S08. 090)是第三亞家族的模式實例，但后來確定其是錯誤分類。本文中的術(shù)語“親本蛋白酶”指包含天然組合表達的前區(qū)(pre region)、原區(qū)和成熟區(qū)的全長蛋白酶。在一些實施方案中，親本蛋白酶的前區(qū)和/或原區(qū)和/或成熟區(qū)用于產(chǎn)生前體蛋白酶的前區(qū)和/或原區(qū)和/或成熟區(qū)。本文中的術(shù)語“前體蛋白酶”指包含信號肽、原區(qū)和成熟區(qū)的未修飾的全長蛋白酶。前體蛋白酶可以源自天然存在(即野生型)的蛋白酶，或源自變體蛋白酶。正是修飾前體蛋白酶的原區(qū)來產(chǎn)生修飾蛋白酶。在一些實施方案中，前體蛋白酶包含源自一種親本蛋白酶的原區(qū)和成熟區(qū)。在其他實施方案中，前體蛋白酶是嵌合蛋白質(zhì)，其包含源自一種親本蛋白酶的原區(qū)和源自不同親本蛋白酶的成熟區(qū)。在用來指蛋白質(zhì)時，本文中的術(shù)語“嵌合的”或“融合”指通過原來編碼分開的蛋白質(zhì)的兩個或多個多核苷酸的連接產(chǎn)生的蛋白質(zhì)。此融合多核苷酸的翻譯產(chǎn)生具有源自各原始蛋白質(zhì)的功能特性的單個嵌合多肽。通過重組DNA技術(shù)人工產(chǎn)生重組融合蛋白質(zhì)?！扒逗隙嚯摹被颉扒逗象w”意指包含來自一個以上多肽的序列的蛋白質(zhì)。在它包含與來自一種或多種其他蛋白酶的一個或多個部分、區(qū)域或結(jié)構(gòu)域融合的來自一種蛋白酶的部分、區(qū)域或結(jié)構(gòu)域的意義上，修飾的蛋白酶可以是嵌合的。作為實例，嵌合蛋白酶可以包含一種蛋白酶的成熟區(qū)，該成熟區(qū)與另一蛋白酶的前肽連接。熟練的技術(shù)人員將理解，嵌合的多肽和蛋白酶無需由蛋白質(zhì)序列的實際融合組成，而是還可以用具有對應的編碼序列的多核苷酸來表達嵌合的多肽或蛋白酶。本文中的“天然存在的”或“野生型的”指具有與見于自然界中的氨基酸序列相同的未修飾的氨基酸序列的蛋白酶或編碼這種蛋白酶的多核苷酸。天然存在的酶包含天然酶——天然表達或見于具體微生物中的那些酶。野生型的或天然存在的序列指從其衍生變體的序列。野生型序列可以編碼同源或異源蛋白質(zhì)。本文中使用的“變體”指成熟蛋白質(zhì)，其與它所對應的野生型成熟蛋白質(zhì)的不同在于向C端和N端的任一端或兩端添加一個或多個氨基酸；在氨基酸序列中的一個或許多個不同位點上取代一個或多個氨基酸；在蛋白質(zhì)的任一端或兩端或在氨基酸序列中的一個或多個位點上缺失一個或多個氨基酸；和/或在成熟蛋白質(zhì)的氨基酸序列中的一個或多個位點上插入一個或多個氨基酸。變體蛋白質(zhì)包含天然存在的變體蛋白質(zhì)和遺傳改造的變體蛋白質(zhì)。通過SEQ ID NO :11的遲緩芽孢桿菌蛋白酶來示例本發(fā)明的背景中的變體蛋白酶，其是天然存在的蛋白質(zhì)遲緩芽孢桿菌蛋白酶GG36 (SEQ ID NO 9)的變體，其與GG36的不同在于成熟區(qū)的位置74、101和102上的三個氨基酸取代。變體蛋白酶的另一實例是克勞氏芽孢桿菌蛋白酶SEQ ID NO :19，其是天然存在的蛋白質(zhì)克勞氏芽孢桿菌蛋白酶Maxacal (SEQ ID N0 13)的變體，其與Maxacal的不同在于成熟區(qū)的位置99和102上的兩個氨基酸取代 (圖 1)。本文中使用的“同源物”和“同源蛋白質(zhì)”指具有與目的蛋白質(zhì)(例如來自另一來源的蛋白酶)相似的作用和/或結(jié)構(gòu)的蛋白質(zhì)(例如蛋白酶)。同源物并非意指必然在進化上相關(guān)。因此，該術(shù)語意指包含獲自不同物種的相同或相似的酶(即就結(jié)構(gòu)和功能而言)。術(shù)語“源自”和“獲自”不僅指由所討論的生物的菌株產(chǎn)生或可產(chǎn)生的蛋白酶，還指由分離自這種菌株的DNA序列編碼且在包含這種序列的宿主生物中產(chǎn)生的蛋白酶。此外，該術(shù)語指由合成和/或cDNA來源的DNA序列編碼，且具有所討論的蛋白酶的鑒定特征的蛋白酶。為了示例，“源自芽孢桿菌屬的蛋白酶”指由芽孢桿菌屬天然產(chǎn)生的具有蛋白水解活性的那些酶，以及絲氨酸蛋白酶，如由芽孢桿菌屬來源產(chǎn)生，但其是通過基因工程技術(shù)的使用，由用編碼該絲氨酸蛋白酶的核酸轉(zhuǎn)化的非芽孢桿菌屬生物產(chǎn)生的那些。“修飾的全長蛋白酶”、“修飾的前體蛋白酶”或“修飾的蛋白酶”可互換使用來指包含源自親本或前體蛋白酶的信號肽、成熟區(qū)和原區(qū)的全長蛋白酶，其中修飾原區(qū)為包含至少一個突變。在一些實施方案中，原區(qū)和成熟區(qū)源自相同的親本蛋白酶。在其他實施方案中，原區(qū)和成熟區(qū)源自不同的親本蛋白酶。修飾的蛋白酶包含修飾為含有至少一個突變的原區(qū)，且它由修飾的多核苷酸編碼。將修飾蛋白酶的氨基酸序列稱為是通過向親本氨基酸序列的原區(qū)中引入至少一個突變(例如一個或多個氨基酸的取代、缺失或插入)從親本蛋白酶氨基酸序列“產(chǎn)生的”。在一些實施方案中，取代前體蛋白酶的原區(qū)的一個或多個氨基酸來產(chǎn)生修飾的全長蛋白酶。這種修飾是編碼“前體”蛋白酶氨基酸序列的“前體”DNA序列的修飾，而不是操作前體蛋白酶本身。在用來指蛋白酶多肽或多核苷酸時，本文中的術(shù)語“未修飾的”指包含未修飾為含有至少一個突變(例如取代)的原區(qū)的蛋白酶。本文中的術(shù)語“全長蛋白質(zhì)”和“前蛋白原”指包含信號肽、原序列和成熟序列的基因產(chǎn)物。例如，SEQ ID NO :59的全長蛋白酶包含信號肽(前區(qū))(SEQ ID N0:3，例如由 SEQ ID NO :2的前多核苷酸編碼)、原區(qū)(SEQ ID NO :7，例如由SEQ ID NO :6的前多核苷酸編碼)和成熟區(qū)(由SEQ ID NO 8的多核苷酸編碼的SEQ ID NO :9)。術(shù)語“信號序列”、“信號肽”或“前區(qū)”指核苷酸和/或氨基酸的任意序列，其可以參與蛋白質(zhì)的成熟形式或前體形式的分泌。信號序列的此定義是功能性定義，意在包含所有由蛋白質(zhì)基因的N端部分編碼，且參與實現(xiàn)蛋白質(zhì)的分泌的那些氨基酸序列。為了示例，本發(fā)明的蛋白酶的前肽至少包含與SEQ ID NO 3的殘基1- 同一的氨基酸序列。術(shù)語“原序列，，或“原區(qū)，，是信號肽和成熟蛋白酶間的氨基酸序列，其是蛋白酶的分泌/產(chǎn)生所必需的。原序列的切割將產(chǎn)生成熟的活性蛋白酶。為了示例，本發(fā)明的蛋白酶的原區(qū)至少包含與SEQ ID NO 7的原區(qū)的殘基1-84(其對應于SEQ ID NO 59的全長蛋白酶的氨基酸30-113)同一的氨基酸序列。術(shù)語“成熟形式”或“成熟區(qū)”指蛋白質(zhì)最終的功能性部分。為了示例，本發(fā)明的蛋白酶的成熟形式包含與SEQ ID N0:9的殘基H69同一的氨基酸序列。在此背景中，“成熟形式”是全長蛋白酶的“加工形式”，其中全長蛋白酶的加工包含信號肽的去除和原區(qū)的去除。本文中的術(shù)語“蛋白質(zhì)原(pro-protein) ”、“多肽原(pro-polyp印tide) ”和“蛋白酶原(pro-protease)”指包含與多肽原有效連接的成熟形式的蛋白質(zhì)?！岸嚯脑庇伞霸嗪塑账帷本幋a。本文中使用的術(shù)語“異源蛋白質(zhì)”指并非天然存在于宿主細胞中的蛋白質(zhì)或多肽。類似地，“異源多核苷酸”指并非天然存在于宿主細胞中的多核苷酸。異源多肽和/或異源多核苷酸包含嵌合的多肽和/或多核苷酸。本文中使用的“取代的”和“取代”指親本序列中的氨基酸殘基或核酸堿基的取代。在一些實施方案中，取代涉及天然存在的殘基或堿基的取代。本文中的修飾蛋白酶包含通過其余十九種氨基酸中的任一種來取代前體蛋白酶的原區(qū)的84個氨基酸中的任一個。例如，位置6(E6)上的取代是用丙氨酸(A)、半胱氨酸(C)、天冬氨酸(D)、甘氨酸(G)、苯丙氨酸(F)、組氨酸(H)、異亮氨酸(I)、賴氨酸(K)、亮氨酸(L)、甲硫氨酸(M)、天冬酰胺(N)、脯氨酸(P)、谷氨酰胺(Q)、精氨酸(R)、絲氨酸(S)、蘇氨酸(T)、纈氨酸(V)、色氨酸(W)和酪氨酸(Y)中的一個取代谷氨酸(E)。在相同位置上用任意其他氨基酸取代氨基酸例如E6表示為E6X，其中X是在位置6上取代E的其余19種氨基酸之一。在一些實施方案中，取代兩個或多個氨基酸來產(chǎn)生包含氨基酸取代的組合的修飾蛋白酶。例如，用氨基酸A取代位置 6上的氨基酸E與用氨基酸T取代位置30上的氨基酸E的組合表示為E6A-E30T。對應于 SEQ ID NO :7的原區(qū)中編號的位置來編號原區(qū)中進行取代的氨基酸位置。本文中使用的“與...對應”、“對應于”或“等同于”指蛋白質(zhì)或多肽中列出的位置上的殘基，或與蛋白質(zhì)或多肽中列出的殘基類似、同源或等同的殘基。本文中使用的“對應的區(qū)域”泛指沿著相關(guān)蛋白質(zhì)或參考蛋白質(zhì)的類似位置。本文中的術(shù)語“前多核苷酸”、“原核苷酸”和“成熟多核苷酸”指分別編碼蛋白質(zhì) (例如蛋白酶)的前區(qū)、原區(qū)和成熟區(qū)的多核苷酸序列。就蛋白酶而言，術(shù)語“產(chǎn)生”包含全長蛋白酶的兩個加工步驟1.信號肽的去除，已知其發(fā)生在蛋白質(zhì)分泌期間；和2.原區(qū)的去除，其產(chǎn)生酶的活性成熟形式，且已知其發(fā)生在成熟過程期間(Wang 等，Biochemistry 37:3165-3171 (1998) ；Power 等，Proc Natl Acad Sci USA83 :3096-3100[1986])。本文中的術(shù)語“增強的產(chǎn)生”指從修飾的全長蛋白酶加工的成熟蛋白酶的產(chǎn)生，且其以高于從未修飾的全長蛋白酶加工時相同成熟蛋白酶的產(chǎn)生水平的水平發(fā)生。就成熟蛋白酶而言，術(shù)語“加工的”指成熟過程，全長蛋白質(zhì)(例如全長蛋白酶)經(jīng)歷該過程而成為活性成熟酶。就酶而言，“活性”意指“催化活性”，且包含酶活性的任意可接受的測量，如活性的速率、活性的量或比活性。催化活性指催化具體的化學反應，如具體的化學鍵的水解的能力。熟練的技術(shù)人員將理解，酶的催化活性只是加快否則將緩慢的化學反應的速率。因為酶只是作為催化劑，所以反應本身既不產(chǎn)生也不消耗酶。熟練的技術(shù)人員還將理解，并非所有多肽都具有催化活性。“比活性”是每單位總蛋白質(zhì)或酶的酶活性的測量。因此，比活性可以表示為酶的單位重量(例如每克或每毫克)或單位體積(例如每毫升)。此外，比活性可以包含酶純度的測量，或者可以提供純度的指示，例如在已知或可獲得活性標準用于比較時?；钚缘牧糠从秤杀磉_所測量的酶的宿主細胞產(chǎn)生的酶的量。術(shù)語“相對活性”或“產(chǎn)生比”在本文中可互換使用，指從修飾蛋白酶加工的成熟蛋白酶的酶活性與從未修飾的蛋白酶加工的成熟蛋白酶的酶活性的比。用從修飾前體加工的蛋白酶的活性值除以從未修飾的前體加工時相同蛋白酶的活性值來測定產(chǎn)生比。相對活性是表示為百分數(shù)的產(chǎn)生比。本文中使用的術(shù)語“表達”指通過其來根據(jù)基因的核酸序列產(chǎn)生多肽的過程。該過程包含轉(zhuǎn)錄和翻譯二者。
術(shù)語“百分比(％ )同一性”定義為候選序列中與前體序列(即親本序列)的氨基酸殘基/核苷酸殘基同一的氨基酸/核苷酸殘基的百分比。用匹配的相同殘基數(shù)除以比對區(qū)中“較長”序列的殘基總數(shù)來測定％氨基酸序列同一性。氨基酸序列可以是相似的，但不是“同一的”，其中相對于參考序列在主題序列中取代、缺失或插入氨基酸。對于蛋白質(zhì)，優(yōu)選在就翻譯后修飾而言處于相似的狀態(tài)的序列間測量百分比序列同一性。通常，將主題蛋白質(zhì)的“成熟序列”(即在去除信號序列的加工后保留的序列)與參考蛋白質(zhì)的成熟序列相比較。在其他情況下，可以將主題多肽序列的前體序列與參考序列的前體相比較。本文中所用的術(shù)語“啟動子”指發(fā)揮功能來指導下游基因的轉(zhuǎn)錄的核酸序列。在一些實施方案中，啟動子適合于在其中表達靶基因的宿主細胞。啟動子以及其他轉(zhuǎn)錄和翻譯調(diào)節(jié)核酸序列(也稱為“控制序列”)是表達給定基因所必需的。一般而言，轉(zhuǎn)錄和翻譯調(diào)節(jié)序列包括但不限于啟動子序列、核糖體結(jié)合位點、轉(zhuǎn)錄起始和終止序列、翻譯起始和終止序列及增強子或激活序列。在將其分別置于與另一核酸或多肽序列的功能性關(guān)系中時，核酸或多肽是“有效連接的”。例如，如果啟動子或增強子影響編碼序列的轉(zhuǎn)錄，則它與該序列有效連接；如果為了便于翻譯而放置核糖體結(jié)合位點，則它與編碼序列有效連接；或者如果修飾的原區(qū)使得能夠加工全長蛋白酶來產(chǎn)生酶的成熟活性形式，則它與蛋白酶的成熟區(qū)有效連接。一般而言，“有效連接的”意指所連接的DNA或多肽序列是連續(xù)的?！八拗骷毎敝缚捎米靼景l(fā)明的DNA的表達載體的宿主的適宜細胞。適宜的宿主細胞可以是天然存在的或野生型的宿主細胞，或者它可以是改變的宿主細胞。在一個實施方案中，宿主細胞是革蘭氏陽性微生物。在一些實施方案中，該術(shù)語指芽孢桿菌屬中的細胞。本文中使用的“芽孢桿菌屬物種”包含本領(lǐng)域技術(shù)人員已知的“芽孢桿菌屬”內(nèi)的所有物種，其包括但不限于枯草芽孢桿菌、地衣芽孢桿菌、遲緩芽孢桿菌、短芽孢桿菌、短小芽孢桿菌(B. pumilis)、嗜熱脂肪芽孢桿菌、嗜堿芽孢桿菌、解淀粉芽孢桿菌、克勞氏芽孢桿菌、耐鹽芽孢桿菌、巨大芽孢桿菌、凝結(jié)芽孢桿菌、環(huán)狀芽孢桿菌、燦爛芽孢桿菌和蘇云金芽孢桿菌。公認芽孢桿菌屬持續(xù)經(jīng)歷分類學重組。因此，該屬旨在包含已重新分類的物種，其包括但不限于如嗜熱脂肪芽孢桿菌的生物，其現(xiàn)在命名為“嗜熱脂肪地芽孢桿菌(Geobacillus stearothermophilus) ”。認為在存在氧的情況下產(chǎn)生抗性內(nèi)生孢子是芽孢桿菌屬的定義特征，雖然此特征也適用于最近命名的脂環(huán)酸芽孢桿菌屬(Alicyclobacillus)、雙芽孢桿菌屬(Amphikicillus)、溶硫胺素芽孢桿菌屬(Aneurinibacillus)、厭氧芽孢桿菌屬(Anoxybacillus)、短芽孢桿菌屬 (Brevibacillus)、Filobacillus、Gracilibacillus、耐鹽芽抱桿菌屬(Halobacillus)、類芽抱桿菌屬(Paenibacillus)、Salibacillus、熱桿菌屬(Thermobacillus)、Ureibacillus 和支芽孢桿菌屬(Virgikicillus)。本文中互換使用的術(shù)語“多核苷酸”和“核酸”指任意長度的核苷酸的聚合形式。這些術(shù)語包括但不限于單鏈、雙鏈DNA ；基因組DNA ；cDNA ；或包含嘌呤和嘧啶堿基，或其他天然的，化學、生物化學修飾的，非天然的或衍生的核苷酸堿基的聚合物。多核苷酸的非限制性實例包含基因、基因片段、染色體片段、EST、外顯子、內(nèi)含子、mRNA、tRNA、rRNA、核酶、 cDNA、重組多核苷酸、支鏈多核苷酸、質(zhì)粒、載體、任意序列的分離的DNA、任意序列的分離的RNA、核酸探針和引物。應理解，由于遺傳密碼的簡并性，可以產(chǎn)生編碼給定蛋白質(zhì)的多個核酸序列。本文中使用的術(shù)語“DNA構(gòu)建體”和“轉(zhuǎn)化DNA”可互換使用，指用來將序列引入宿主細胞或生物中的DNA。可以通過PCR或本領(lǐng)域技術(shù)人員已知的任意其他適宜的技術(shù)來在體外產(chǎn)生DNA構(gòu)建體。在一些實施方案中，DNA構(gòu)建體包含目的序列(例如編碼修飾蛋白酶的序列)。在一些實施方案中，序列與其他元件，如控制元件(例如啟動子等)有效連接。 DNA構(gòu)建體可以進一步包含選擇標記。在一些實施方案中，DNA構(gòu)建體包含與宿主細胞染色體同源的序列。在其他實施方案中，DNA構(gòu)建體包含非同源序列。一旦在體外組裝了 DNA構(gòu)建體，即可以用它來誘變宿主細胞染色體的區(qū)域(即用異源序列取代內(nèi)源序列)。本文中使用的術(shù)語“表達盒”指重組或合成產(chǎn)生的核酸構(gòu)建體，其具有允許具體核酸在靶細胞中轉(zhuǎn)錄的一系列指定的核酸元件。可以將重組表達盒摻入載體，如質(zhì)粒、染色體、線粒體DNA、質(zhì)體DNA、病毒或核酸片段中。通常，除其他序列外，表達載體的重組表達盒部分包含待轉(zhuǎn)錄的核酸序列和啟動子。在一些實施方案中，表達盒具有在宿主細胞中摻入和表達異源DNA片段的能力。許多原核和真核表達載體是市售的。適當?shù)谋磉_載體的選擇在本領(lǐng)域技術(shù)人員的知識范圍之內(nèi)。術(shù)語“表達盒”在本文中可以與“DNA構(gòu)建體”及它們的語法等同形式互換使用。適當?shù)谋磉_載體的選擇在本領(lǐng)域技術(shù)人員的知識范圍之內(nèi)。本文中使用的術(shù)語“異源DNA序列”指并非天然存在于宿主細胞中的DNA序列。在一些實施方案中，異源DNA序列是由不同基因的部分(包含調(diào)節(jié)元件)組成的嵌合DNA序列。本文中使用的術(shù)語“載體”指設計用來將核酸引入一種或多種細胞類型中的多核苷酸構(gòu)建體。載體包含克隆載體、表達載體、穿梭載體和質(zhì)粒。在一些實施方案中，多核苷酸構(gòu)建體包含編碼全長蛋白酶(例如修飾蛋白酶或未修飾的前體蛋白酶)的DNA序列。本文中使用的術(shù)語“質(zhì)?！敝赣米骺寺≥d體，且在一些真核生物或原核生物中形成染色體外自主復制的遺傳元件，或整合入宿主染色體中的環(huán)狀雙鏈(ds) DNA構(gòu)建體。本文在將核酸序列引入細胞的背景中使用的術(shù)語“引入”指適合用于將核酸序列轉(zhuǎn)移入細胞中的任意方法。這類用于引入的方法包括但不限于原生質(zhì)體融合、轉(zhuǎn)染、轉(zhuǎn)化、接合和轉(zhuǎn)導(參見例如 Ferrari 等，“Genetics，”在Hardwood等，(編輯)，Bacillus，Plenum Publishing Corp.，57-72 頁，[1989]中)。本文中使用的術(shù)語“轉(zhuǎn)化”和“穩(wěn)定轉(zhuǎn)化”指具有整合入其基因組中或作為保持至少兩代的附加型質(zhì)粒的非天然(異源)多核苷酸序列的細胞。
修飾的蛋白酶本發(fā)明提供用于在細菌宿主細胞中產(chǎn)生成熟蛋白酶的方法和組合物。該組合物包含編碼在原區(qū)中具有至少一個突變的修飾蛋白酶的修飾多核苷酸；由該修飾多核苷酸編碼的修飾的絲氨酸蛋白酶；包含編碼該修飾蛋白酶的修飾多核苷酸的表達盒、DNA構(gòu)建體和載體；及用本發(fā)明的載體轉(zhuǎn)化的細菌宿主細胞。該方法包括用于增強成熟蛋白酶在細菌宿主細胞，例如芽孢桿菌屬物種宿主細胞中的產(chǎn)生的方法。所產(chǎn)生的蛋白酶用于工業(yè)產(chǎn)生適合用于包括但不限于清潔、動物飼料和織物加工產(chǎn)業(yè)的多種產(chǎn)業(yè)中的酶。蛋白質(zhì)跨膜轉(zhuǎn)運的基本機制似乎是通用的，其重要特征在細菌和真核生物間保守。因為它們可以大量分泌某些蛋白質(zhì)至培養(yǎng)基中，所以芽孢桿菌屬物種用于酶，如堿性絲氨酸蛋白酶的工業(yè)產(chǎn)生。在體內(nèi)，蛋白酶是從稱為前蛋白酶原的前體蛋白酶產(chǎn)生的，該前蛋白酶原包含蛋白酶的前區(qū)(也稱為信號肽)、原區(qū)和成熟區(qū)。跨芽孢桿菌屬物種細胞膜的蛋白質(zhì)分泌是復雜的過程，其包括前體蛋白質(zhì)插入膜中和蛋白質(zhì)跨細胞膜易位。前區(qū)用作蛋白質(zhì)跨膜分泌的信號肽，并由信號肽酶水解。成熟過程的胞外部分包含蛋白酶原的折疊、原區(qū)的自加工和原區(qū)的降解，以產(chǎn)生酶的活性成熟形式(Nagarj an V. Protein Secretion in "Bacillus subtilis and other Gram-Positive Bacteria，，Ch. 49,第 713-726 頁， [1993] ；Ruan 等，Biochemistry,38 :8562-8571[2009])。在一些實施方案中，本發(fā)明提供編碼修飾蛋白酶的修飾多核苷酸，該修飾蛋白酶是通過在前體蛋白酶的原多核苷酸中引入至少一個突變來產(chǎn)生的。該修飾多核苷酸產(chǎn)生自前體多核苷酸，該前體多核苷酸包含編碼蛋白酶的原區(qū)的多核苷酸(原多核苷酸)和編碼蛋白酶的成熟區(qū)的多核苷酸(成熟多核苷酸)，其中修飾原多核苷酸為包含至少一個突變，以產(chǎn)生編碼本發(fā)明的修飾蛋白酶的修飾多核苷酸。前體多核苷酸進一步包含編碼信號肽的多核苷酸(前多核苷酸)。未修飾的蛋白酶的前區(qū)、原區(qū)和成熟區(qū)可以源自動物、植物或微生物來源的野生型或變體親本蛋白酶。在一些實施方案中，未修飾的前體蛋白酶的原區(qū)和成熟區(qū)源自一種親本蛋白酶，而前區(qū)源自不同的親本蛋白酶。在其他實施方案中，前區(qū)、原區(qū)和成熟區(qū)源自三種不同的親本蛋白酶。在一些實施方案中，親本蛋白酶是細菌來源的。在一些實施方案中，親本蛋白酶是枯草蛋白酶型(枯草桿菌酶，枯草桿菌肽酶，EC 3. 4.21.62)蛋白酶，其包含催化活性氨基酸，也稱為絲氨酸蛋白酶。在一些實施方案中，親本蛋白酶是芽孢桿菌屬物種蛋白酶。優(yōu)選地，親本蛋白酶是源自克勞氏芽孢桿菌或遲緩芽孢桿菌的絲氨酸蛋白酶。
編碼前體蛋白酶的前體多核苷酸在一些實施方案中，未修飾的前體多核苷酸編碼包含親本蛋白酶的成熟區(qū)的全長蛋白酶，如源自克勞氏芽孢桿菌和遲緩芽孢桿菌的蛋白酶，其同源物和變體，其與多核苷酸，例如
gctgaagaagcaaaagaaaaatatttaattggctttaatgagcaggaagctgtcagtgagtttgtagaacaa gtagaggcaaatgacgaggtcgccattctctctgaggaagaggaagtcgaaattgaattgcttcatgaatttgaaac gattcctgttttatccgttgagttaagcccagaagatgtggacgcgcttgaactcgatccagcgatttcttatattg aagaggatgcagaagtaacgacaatg(SEQ ID NO 6)有效連接，該多核苷酸編碼 SEQ ID NO :7 的原區(qū)
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAIS YIEEDAEVTTM(SEQ ID NO :7)。成熟親本蛋白酶的實例包含野生型遲緩芽孢桿菌蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LNNSIGVLGVAPSAELYAVKVLGASGSGSVSSIAQGLEffAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR (SEQ IDNO :9)，及其變體，如
SEQ ID NO 11的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LDNSIGVLGVAPSAELYAVKVLGASGSGAISSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR (SEQ IDNO 11)；野生型克勞氏芽孢桿菌PB92蛋白酶Maxacal (美國專利5，217，878) AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ； (SEQ ID NO 13)，及其變體，如 SEQ ID NO 15的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ； (SEQ ID NO 15)， SEQ ID NO 17的蛋白酶
AQSVPffGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LNNSIGVLGVAPNAELYAVKVLGASGMGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ； (SEQ ID NO 17)， SEQ ID NO 19的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPG EPSTQDGNGHGTHVAGTIAA LNNSIGVLGVAPNAELYAVKVLGASGGGSNSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ； (SEQ ID NO 19), SEQ ID NO 21的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ； (SEQ ID NO 21), SEQ ID NO 23的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNRQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ； (SEQ ID NO :23)，和 SEQ ID NO 25的蛋白酶
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA LDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGLQAPSATLEQAVNSATSRGVLVVA ASGNSGAGSISYPARYANAMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAA LVKQKNPSWSNVQIRRHLKNTATSLGSTNLYGSGLVNAEAATR ； (SEQ ID NO 25)。
編碼SEQ ID NO 9、11、13、15、17、19、21、23和25的成熟蛋白酶的多核苷酸的實例分別是圖5中所示的SEQ ID吣8、10、12、14、16、18、20、22和對。應理解，由于遺傳密碼的簡并性，多肽可以由一個以上核苷酸序列編碼。
SEQ ID NO :9、11、13、15、17、19、21、23和25的成熟蛋白酶彼此不同在于至多9個氨基酸(圖1)。在一些實施方案中，SEQ ID NO :7的多肽原與SEQ ID NO :9、11、13、15、17、 19、21、23和25的成熟序列天然地且有效地連接。因此，在一些實施方案中，前體多核苷酸包含編碼SEQ ID NO :7的原區(qū)的多核苷酸，該原區(qū)與選自SEQ ID NO :9、11、13、15、17、19、 21、23和25的成熟區(qū)有效連接，分別產(chǎn)生SEQ ID NO :38-46的原蛋白酶 SEQ ID NO 38
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPffGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALNNSIGVLGVAPSAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ；SEQ ID NO 38)， SEQ ID NO 39
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALDNSIGVLGVAPSAELYAVKVLGASGSGAISSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSffSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ；SEQ ID NO 39) SEQ ID NO 40
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ；SEQ ID NO 40)； SEQ ID NO 41
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ；SEQ ID NO 41)； SEQ ID NO 42
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALNNSIGVLGVAPNAELYAVKVLGASGMGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ；SEQ ID NO 42)， SEQ ID NO 43
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALNNSIGVLGVAPNAELYAVKVLGASGGGSNSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ；SEQ ID NO 43)， SEQ ID NO 44
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ；SEQ ID NO 44)； SEQ ID NO 45
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPffGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNRQIRNHLKNTATSLGSTNLYGSGLVNAEAATR ；SEQ ID NO 45)；禾口 SEQ ID NO 46
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAI SYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTH VAGTIAALDNSIGVLGVAPRAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGLQAPSATLEQAVNSATS RGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATP HVAGAAALVKQKNPSWSNVQIRRHLKNTATSLGSTNLYGSGLVNAEAATR(SEQ ID NO :46).與SEQ ID NO :7的多肽原有效連接的其他成熟親本蛋白酶包含來自芽孢桿菌屬物種的成熟蛋白酶的同源物，如P27693嗜堿芽孢桿菌，例如SEQ ID NO 47 ；P20724芽孢桿菌屬物種_YAB，例如SEQ ID NO :48 ;BAA25184芽孢桿菌屬物種，例如SEQ ID NO 49 ； YP_174261克勞氏芽孢桿菌_KSM-K16，例如SEQ ID NO 50 ；BAA06157芽孢桿菌屬物種 G-825-6 (SEQ ID NO 51)；和 BAF34115_A_transvaalensis，例如 SEQ ID NO :52(圖 3)。在一些實施方案中，未修飾的前體多核苷酸編碼包含蛋白酶的成熟區(qū)的前體蛋白酶，該成熟區(qū)與有效連接至SEQ ID NO :7的多肽原的SEQ ID NO :9、11、13、15、17、19、21、23和25的成熟區(qū)至少約60%、至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約97%、至少約98%、至少約99%同一。對SEQ ID NO :7的原區(qū)的氨基酸序列進行BLAST查詢揭示，除與P41362克勞氏芽孢桿菌和P27693嗜堿芽孢桿菌的天然存在的原區(qū)相同(圖2)之外，SEQ ID NO :7的原區(qū)與來自GG36遲緩芽孢桿菌^7048(SEQ ID NO :53)、P20724芽孢桿菌屬物種_丫六8 (SEQ ID NO: M)、BAA25184芽孢桿菌屬物種(SEQ ID NO :55)、YP_174261克勞氏芽孢桿菌_KSM_K16 (例如 SEQ ID NO :56)、BAA06157 芽孢桿菌屬物種 G-825-6(SEQ ID NO :57)和 BAF34115_A_ transvaalensis (例如SEQ ID NO :58)的蛋白酶的原區(qū)具有高度的同一性(圖2)。預期在 SEQ ID NO :53-58的原區(qū)中產(chǎn)生，且對應于SEQ ID NO :7的增強其與之有效連接的成熟蛋白酶的產(chǎn)生的突變的突變將增強SEQ ID NO :53-58的原區(qū)與之有效連接的成熟蛋白酶的產(chǎn)生。因此，在一些實施方案中，未修飾的前體多核苷酸包含編碼多肽原的原多核苷酸，該多肽原選自SEQ ID N0:53-58，且與SEQ ID NO :9的成熟蛋白酶，其變體和同源物有效連接。例如，編碼選自SEQ ID NO 53-58的多肽原的原多核苷酸與SEQ ID NO 9的成熟蛋白酶的變體，例如SEQ ID NO :11、13、15、17、18、21、23和25有效連接。類似地，編碼選自SEQ ID NO :53-58的多肽原的原多核苷酸與SEQ ID NO :9的成熟蛋白酶的同源物，例如SEQ ID NO 47-52有效連接。在其他實施方案中，未修飾的前體多核苷酸包含編碼多肽原的原多核苷酸，該多肽原與SEQ ID NO 7的多肽原至少約60 %、至少約65 %、至少約70 %、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約97%或至少約99%同一，該 SEQ ID NO :7 的多肽原與 SEQ ID NO :9 的成熟蛋白酶或 SEQ ID NO :11、13、15、17、18、21、 23和25及47-52中的任一個有效連接。通過本領(lǐng)域已知的方法比對序列并測定同一性，通過直接比較分子間的序列信息來測定多核苷酸或多肽序列所具有的百分比同一性。適合用于測定序列相似性的算法的實例是描述于 Altschul 等，J. Mol. Biol.，215 :403-410(1990)中的 BLAST 算法。用于進行 BLAST分析的軟件是通過National Center for Biotechnology ^formation 公開可得的。該算法涉及首先通過在查詢序列中鑒定長度W的短字串來鑒定高得分序列對(HSP)，在與數(shù)據(jù)庫序列中相同長度的字串比對時，其匹配或滿足一定的正值閾值得分T。這些初始相鄰字串命中作為起點來發(fā)現(xiàn)包含它們的更長HSP。字串命中沿所比較的兩條序列的每一條在兩個方向擴展，直至累積比對得分可以提高。當累積比對得分從最大達到值下降數(shù)量X ；累積得分達到零或以下；或到達任一序列的末端時，字串命中的延伸就終止。BLAST算法參數(shù)W、T和X決定比對的靈敏性和速度。BLAST程序默認使用字長(W) 11、BL0SUM62評分矩陣(見 Henikoff&HenikofT，Proc. Natl. Acad. Sci. USA 89 :10915 (1989))、比對(B)50、期望值(E) 10、Μ’ 5、N’ -4和兩條鏈的比較。然后BLAST算法進行兩條序列間相似性的統(tǒng)計學分析(參見例如Kar 1 in和 Altschul,Proc. Nat'1. Acad. Sci. USA 90 :5873-5787[1993])。BLAST 算法提供的一種相似性的測量是最小總數(shù)概率(P(N))，其提供兩條核苷酸或氨基酸序列間偶然發(fā)生匹配的概率的指示。例如，如果測試核酸與絲氨酸蛋白酶核酸的比較中的最小總數(shù)概率小于約0. 1、更優(yōu)選小于約0. 01和最優(yōu)選小于約0. 001，則認為核酸與本發(fā)明的絲氨酸蛋白酶核酸相似。在測試核酸編碼絲氨酸蛋白酶多肽時，如果比較產(chǎn)生小于約0. 5和更優(yōu)選小于約0. 2的最小總數(shù)概率，則認為它與指定的絲氨酸蛋白酶核酸類似。用SEQ ID NO 7的原區(qū)來檢索NCBI非豐余蛋白質(zhì)數(shù)據(jù)庫(2009年3月沈日版)。按默認參數(shù)使用命令行BLAST程序(2.2. 17版)。將發(fā)現(xiàn)其具有與該原區(qū)(SEQ ID NO 7) 相似的序列的獲得的序列劃分為原區(qū)和成熟區(qū)，進一步按以下對其進行分析來產(chǎn)生圖2和 3中所示的比對。用多重比對程序ClustalW和MUSCLE獲得了多種絲氨酸蛋白酶的原區(qū)(圖2)和成熟區(qū)(圖3)與GG36的原區(qū)(SEQ ID NO 7)和成熟區(qū)(SEQ ID NO 9)的氨基酸序列比對。首先以默認參數(shù)用程序Clustaiwa. 83版)進行比對。以默認參數(shù)用程序MUSCLE(3. 51版) 將比對精練五倍。比對中僅選擇對應于成熟區(qū)或原區(qū)的區(qū)域。用在所討論的兩條序列間比對的相同殘基數(shù)除以比對中比對的殘基數(shù)來計算百分比同一性。如上文所討論，比對顯示，存在與GG36的原區(qū)序列(SEQ ID NO 7)和成熟區(qū)序列(SEQ ID NO 9)具有高度氨基酸同一性的幾個原序列和成熟序列。在一些實施方案中，除編碼蛋白酶原外，未修飾的前體多核苷酸進一步包含編碼與蛋白酶原有效連接的信號肽的前多核苷酸。在一些實施方案中，該信號肽是由多核苷酸 gtgagaagcaaaaaattgtggatcagcttgttgtttgcgttaacgttaatctttacgatggcgttcagcaacatgtc tgcgcaggct (SEQ ID NO 2)編碼的 AprE 信號肽 VRSKKLWISLLFALTLIFTMAFS匪SAQA (SEQ ID NO 3)。在其他實施方案中，該信號肽是由多核苷酸gtgagaagcaaaaaattgtggatcgtcgcgtcg accgcactactcatttctgttgcttttagttcatcgatcgcatcggct (SEQ ID NO 4)編碼的融合信號肽 VRSKKLWIVASTALLISVAFSSSIASA(SEQ ID NO :5)。還在其他實施方案中，前體多核苷酸包含編碼與蛋白酶原天然地且有效地連接的信號肽的多核苷酸。可以使可以實現(xiàn)修飾的蛋白酶在芽孢桿菌屬物種宿主細胞中的有效分泌的任意信號序列與本發(fā)明的蛋白酶原有效連接。這類信號肽包含指導蛋白質(zhì)通過細菌分泌途徑，例如Sec途徑、TAT途徑分泌的細菌來源的信號肽，及適用于在原核宿主細胞中表達蛋白質(zhì)的真核信號序列(EP1481059B1)。編碼修飾蛋白酶的修飾多核苷酸通過在與成熟蛋白酶有效連接的SEQ ID NO 7的多肽原的位置1_84上的氨基酸中的任一個上引入至少一個突變來修飾上述未修飾的前體多核苷酸，以編碼修飾蛋白酶。在一些實施方案中，該至少一個突變是氨基酸取代。在一些實施方案中，該修飾多核苷酸編碼至少在選自SEQ ID NO 7的多肽原的位置 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、 29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、 54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、 79、80、81、82、83和84的一個氨基酸位置上氨基酸取代，該SEQ ID NO 7的多肽原與成熟蛋白酶有效連接，該成熟蛋白酶與SEQ ID NO :9的成熟蛋白酶至少60%同一。在一些實施方案中，該成熟蛋白酶與SEQ ID NO :9的成熟區(qū)至少約65%、至少約70%、至少約75%、至少約80%、至少約85%、至少約90%、至少約95%、至少約97%、至少約98%、至少約99% 同一。與SEQ ID N0:9的成熟蛋白酶(遲緩芽孢桿菌蛋白酶GG36)至少60%同一的成熟蛋白酶包含野生型克勞氏芽孢桿菌PB92蛋白酶Maxacal (SEQ ID NO 13)及其變體，如SEQ ID NO 11, SEQ ID NO :15、SEQ ID NO :17、SEQ ID NO :19、SEQ ID NO :21、SEQ ID NO 23 和SEQ ID NO :25 JPSEQ ID NO :9的同源物，包括來自芽孢桿菌屬物種的成熟蛋白酶的同源物，如:P27693嗜堿芽孢桿菌，例如SEQ ID NO 47 ；P20724芽孢桿菌屬物種_YAB,例如 SEQ ID NO 48 ；BAA25184芽孢桿菌屬物種，例如SEQ ID NO 49 ；YP_174261克勞氏芽孢桿菌_1 ]\1-1(16，例如 SEQ ID NO :50 ;ΒΑΑ06157 芽孢桿菌屬物種 G-825-6(SEQ ID NO :51)；禾口 BAF34115_A_transvaalensis，例如SEQ ID NO :52(圖3)。優(yōu)選地，該修飾的原多核苷酸編碼至少在選自SEQ ID NO 7的多肽原的位置6、30和32的位置上的一個氨基酸上突變，該 SEQ ID NO :7的多肽原與SEQ ID NO :9、11、13、15、17、19、21、23和25的蛋白酶中的任一個的成熟蛋白酶有效連接。該至少一個突變是位置6和/或30上的谷氨酸(E)的氨基酸取代；和/或位置32上的丙氨酸㈧的氨基酸取代。取代SEQ ID NO 7的原區(qū)的位置6和/ 或30上的谷氨酸(E)和/或位置32上的丙氨酸(A)的其它19種氨基酸中的任一個旨在可以用來編碼修飾蛋白酶，以比從對應的未修飾的前體蛋白質(zhì)的加工獲得的水平高的水平從該修飾蛋白酶產(chǎn)生成熟形式。在一些實施方案中，該至少一個突變是選自以下取代的取代SEQ ID NO 7 的多肽原的 E6A, E6R, E6C, E6Q, E6H, E6I, E6K, E6L, E6M, E6S, E6Y,E6N, E6G, E6F, E6P, E6T, E6W, E6V, E30A, E30R, E30N, E30D, E30G, E30H, E30L, E30K, E30F, E30S, E30T, E30V, E30R, E30Q, E30G, E30I, E30L, E30M, E30F, E30P, E30T, E30W, E30Y, E30C, E30M, E30F E30V, A32K, A32T, A32Q, A32S, A32V, A32L 禾口 A32F。例如，在 SEQ ID NO 7 的原區(qū)中產(chǎn)生選自 E6A、E6R、E6C、E6Q、E6H、E6I、E6K、E6M、E6S、E6Y、E30A、E30R、E30N、E30D、 E30Q, E30G、E30L、E30M、E30P、E30S、E30T、E30W、E30Y、E30V、A32、A32R、A32C、A32E、A32G、 A32L、A32K、A32F、A32T、A32Y和A32V的取代中的任一個，以產(chǎn)生SEQ ID NO 17的成熟蛋白酶；在 SEQ ID NO 7 的原區(qū)中產(chǎn)生選自 E6A、E6R、E6N、E6C、E6Q、E6G、E6H、E6M、E6F、E6P、 E6S、E6T、E6W、E6V、A3I、A32T和A32V的取代中的任一個，以產(chǎn)生SEQ ID NO 9的成熟蛋白酶；在 SEQ ID NO 7 的原區(qū)中產(chǎn)生選自 E6A、E6H、E6K、E6R、E30A、E30R、E30N、E30D、E30G、 E30H、E30L、E30K、E30F、E30S、E30T 和 E30V 的取代中的任一個，以產(chǎn)生 SEQ ID NO 19 的成熟蛋白酶；在 SEQ ID NO :7 的原區(qū)中產(chǎn)生選自 E6A、E6R、E6Q、E6G、E6L、E6K、E6M、E6F、E6T、 E6V、E30R、E30Q, E30G、E30I、E30L、E30M、E30F、E30P、E30T、E30W, E30Y、E30V、A32Q, A32S、 A32T和A32V的取代中的任一個，以產(chǎn)生SEQ ID NO 11的成熟蛋白酶；在SEQ ID NO 7的原區(qū)中產(chǎn)生選自 E30A、E30R、E30N、E30D、E30C、E30G、E30H、E30M、E30F、E30S、E30W、A32L、 A32F和A32V的取代中的任一個，以產(chǎn)生SEQ ID NO :21的成熟蛋白酶。與表達自在與之有效連接的SEQ ID NO :7的原區(qū)中不包含該至少一個取代的前體蛋白酶的成熟蛋白酶的產(chǎn)生相比時，該至少一個取代增強成熟蛋白酶的產(chǎn)生。在一些其他實施方案中，SEQ ID NO 7的原區(qū)的修飾包含突變的組合。例如，SEQ ID NO :7的原區(qū)的修飾包含至少兩個取代的組合。在其他實施方案中，SEQ ID NO :7的原區(qū)的修飾包含至少三個、至少四個、至少五個、至少六個、至少七個、至少八個、至少九個或至少十個取代的組合。該原區(qū)的修飾還包含至少一個取代和一個缺失的組合；至少一個取代和至少一個插入的組合；至少一個插入和一個缺失的組合；及至少一個取代、至少一個缺失和至少一個插入的組合。優(yōu)選地，SEQ ID NO 7的原區(qū)的修飾包含在位置6和30 (即 E6X-E30X)、6和32 (即E6X-A32X)或30和32 (即E30X-A32X)上導致取代的組合的至少兩個取代。例如，該修飾多核苷酸編碼包含選自以下的取代組合的原區(qū)
E6R-A32K, E6N-A32K, E6D-A32K, E6I-A32K, E6K-A32K,E6M-A32K,E6P-A32K,E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G， E6R-E30G, E6C-E30G， E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G，E6S-E30G，E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E， E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S, E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y 和 E30S-A32V。例如，SEQ ID NO 7 的原區(qū)的修飾包含選自 E6R-A32K,E6N-A32K,E6D-A32K,E6I-A32K,E6K-A32K,E6M-A32K,E6P-A32K,E6S-A32K, E6T-A32K、E6N-A32K、E30W-A32K 和 E30V-A32K 的至少兩個取代的組合，以產(chǎn)生 SEQ ID NO 9的成熟蛋白酶；SEQ ID NO 7的原區(qū)的修飾包含選自E6A-E30G、E6R-E30G、E6C-E30G、E6Q-E30G、E6G-E30G、E6H-E30G、E6K-E30G、E6S-E30G、E6W-E30G、E30G-A32R, E30G-A32Q, E30G-A32E、E30G-A32G、E30G-A32H、E30G-A32I、E30G-A32K、E30G-A32S、E30G-A32T、 E30G-A32W、E30G-A32V的至少兩個取代的組合，以產(chǎn)生SEQ ID NO :17的成熟蛋白酶；SEQ ID NO :7 的原區(qū)的修飾包含選自 E6A-E30G、E6R-E30G、E6N-E30G、E6D-E30G、E6C-E30G、 E6Q-E30G、E6G-E30G、E6H-E30G、E6K-E30G、E6M-E30G、E6F-E30G、E6P-E30G、E6S-E30G、 E6T-E30G、E6W-E30G、E6V-E30G、E6Y-E30G 的至少兩個取代的組合，以產(chǎn)生 SEQ ID NO 19的成熟蛋白酶；SEQ ID NO :7的原區(qū)的修飾包含選自E6A-E30S、E6G-E30S、E6L-E30S、 E6K-E30S、E6F-E30S、E6P-E30S、E6Y-E30S、E6V-E30S、E30S-A32R, E30S-A32N、E30S-A32D, E30S-A32C、E30S-A32Q、E30S-A32E、E30S-A32G、E30S-A32H、E30S-A32L、E30S-A32K、 E30S-A32M、E30S-A32F、E30S-A32P、E30S-A32S、E30S-A32T、E30S-A32W、E30S-A32Y 禾P E30S-A32V的至少兩個取代的組合，以產(chǎn)生SEQ ID NO 21的成熟蛋白酶。SEQ ID NO 7的原區(qū)的修飾的其他實例包含在位置6、30和32上導致取代的組合(即E6X-E30X-A32X)的至少三個取代。例如，SEQ ID NO :7的原區(qū)的修飾包含選自E6G-E30G-A32E、E6G-E30G-A32S、 E6G-E30G-A32T、E6G-E30G-A32W的至少三個取代的組合，以產(chǎn)生SEQ ID NO 17的成熟蛋白酶。與表達自在與之有效連接的SEQ ID NO :7的原區(qū)中不包含該至少兩個或三個取代的前體蛋白酶的成熟蛋白酶的產(chǎn)生相比時，該至少兩個或三個取代增強成熟蛋白酶的產(chǎn)生。本領(lǐng)域中已知適合用于產(chǎn)生本發(fā)明的修飾多核苷酸序列的幾種方法，其包括但不限于位點飽和誘變、掃描誘變、插入誘變、缺失誘變、隨機誘變、位點定向誘變和定向進化，以及多種其他重組方法。常用的方法包括DNA改組(Stemmer WP, Proc Natl Acad Sci U S A. 25 ；91 (22) :10747-51 [1994])；基于基因的非同源重組的方法，例如ITCHY(Ostermeier 等，Bioorg Med Chem. 7(10) :2139-44[1999])、SCRACHY(Lutz 等 Proc Natl Acad Sci U S A. 98(20) :11248-53[2001])、SHIPREC (Sieber 等，Nat Biotechnol. 19(5) :456-60 [2001]) 和 NRR(Bittker 等，Nat Biotechnol. 20(10) 1024-9 [2001] ；Bittker 等，Proc Natl Acad Sci U S A. 101(18) :7011_6[2004])；依賴于用寡核苷酸插入隨機和靶向的突變、缺失和 / 或插入的方法(Ness 等，Nat Biotechnol. 20(12) :1251-5[2002] ；Coco 等，Nat Biotechnol. 20(12) 1246-50 [2002] ；Zha 等，Chembiochem. 3 ；4(1) :34_9[2003] ；Glaser 等，J Immunol. 149(12) :3903-13 [1992] ；Sondek 和 Shortle，Proc Natl Acad Sci U S
A 89(8) :3581-5[1992] ； Yafiez 等，Nucleic Acids Res. 32(20) :el58[2004] ；Osuna
等，Nucleic Acids Res. 32(17) :el36[2004] ；Gaytan 等，Nucleic Acids Res. 29(3) E9[2001]；和 GayWn 等，Nucleic Acids Res. 30(16) :e84[2002])。除編碼修飾的蛋白酶原外，修飾的前體多核苷酸進一步包含編碼信號肽的前多核苷酸。在一些實施方案中，該信號肽是由SEQ ID NO :2的多核苷酸編碼的AprE信號肽(SEQ ID NO :3)。例如，全長修飾前體蛋白酶包含SEQ ID NO 的蛋白酶，其中該前體蛋白酶的原區(qū)包含至少一個突變。在一些實施方案中，該至少一個突變是在等同于SEQ ID N0:7的原區(qū)的位置6、30或32的位置上產(chǎn)生的氨基酸取代。備選地，該信號肽是由SEQ ID NO 4的多核苷酸編碼的SEQ ID NO :5的融合信號肽。與成熟蛋白酶天然連接的信號肽也可以用來表達本文中所述的全長修飾蛋白酶?？梢孕揎棡樵谶x自SEQ ID N0:7的原區(qū)的6、30和32 的位置上包含至少一個氨基酸取代的全長前體蛋白酶的實例包含
SEQ ID NO 59的全長蛋白酶VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEI ELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPSAELYAVKVLGASGS GSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTATSLGSTNLYGSGL VNAEAATR\ SEQ ID NO :59)； SEQ ID NO 60的全長蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEI ELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALDNS1GVLGVAPSAELYAVKVLGASGS GAISSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANA MAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSW SNVQIRNHLKNTATSLGSTNL YGSGLVNAEAATR] SEQ ID NO :60)； SEQ ID NO 61的全長蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAYSEFVEQVEANDEVAILSEEEEYEI ELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGS GSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTA TSLGSTNL YGSGL VNAEAA TR] SEQ ID NO 61)； SEQ ID NO 62的全長蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQAAEEAKEKYLIGFN EQEAVSEFVEQVEAN DEVAILSEEEEV EIELLEEFETIPYLSYELSPEmMLELOPAISYIEEMEYTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGS GSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR\ SEQ ID NO 62)； SEQ ID NO 63的全長蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEV
EIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGM GSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTA TSLGSTNL YGSGL VNAEAA TR\ SEQ ID NO 63)； SEQ ID NO 64的全長蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEV EIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGG GSNSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTA TSLGSTNL YGSGL VNAEAATR, SEQ ID NO :64)；SEQ ID NO 65的全長蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVE QVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTT M AQSVPWGISRVQAPAAHNRGLTGSGVKVA
VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALDNSIGVLGVAPRAELYAVKVLGASGS GSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR] SEQ ID NO 65)，
SEQ ID NO 66的全長蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVE QVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTT M AQSVPWGISRVQAPAAHNRGL TGSG VKVA
VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALDNSIGVLGVAPRAELYAVKVLGASGS GSVSSIAQGLEWAGNNRMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNRQIRNHLKNTATSLGSTNL YGSGLVNAEAAT, SEQ ID NO :66)；禾口
SEQ ID NO 67的全長蛋白酶
VRSKKLWISLLFALTLIFTMAFSNMSAQA AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVE IELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTM AQSVPWGISRVQAPAAHNRGLTGSGVKVA VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALDNSIGVLGVAPRAELYAVKVLGASGS GSVSSIAQGLEWAGNNGMHVANLSLGLQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYAN AMAVGATDQNNNRADFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPS WSNVQIRRHLKNTATSLGSTNLYGSGLVNAEAATR\ SEQ ID NO :67).。前區(qū)(信號肽；SEQ ID NO 3)以黑體顯示，原區(qū)(SEQ ID NO :7)下劃線，成熟區(qū)為斜體。如之前所描述，除與P41362克勞氏芽孢桿菌和P27693嗜堿芽孢桿菌的天然存在的原區(qū)相同(圖2)之外，SEQ ID NO :7的原區(qū)與來自以下的蛋白酶的原區(qū)的氨基酸序列具有高度同一性GG36遲緩芽孢桿菌^7048(SEQ ID NO 53) ；P207M芽孢桿菌屬物種_ YAB (SEQ ID NO 54) ；BAA25184 芽孢桿菌屬物種(SEQ ID NO 55) ；YP_174261 克勞氏芽孢桿菌_1 ]\1-1(16，例如 SEQ ID NO :56 ;ΒΑΑ06157 芽孢桿菌屬物種 G-825-6(SEQ ID NO :57)；禾口 BAF34115_A_transvaalensis，例如 SEQ ID NO :58 (圖 2)。預期在 SEQ ID NO :53-58 的原區(qū)中產(chǎn)生，且對應于SEQ ID NO :7的增強其與之有效連接的成熟蛋白酶的產(chǎn)生的突變的突變將增強SEQ ID NO :53-58的修飾原區(qū)與之有效連接的成熟蛋白酶的產(chǎn)生。例如，可以修飾編碼SEQ ID NO :53-58的原區(qū)的修飾多核苷酸中的任一個，以至少在選自位置1、2、3、4、5、 6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、 33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、 58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83 和84的一個氨基酸位置上編碼氨基酸取代，其中，通過與SEQ ID NO :7的多肽原的氨基酸序列對應來編號位置。優(yōu)選地，修飾編碼SEQ ID NO :53-58的原區(qū)的修飾多核苷酸中的任一個，以至少在選自位置6、30和32的位置上的一個氨基酸上編碼突變。在一些實施方案中，選自位置6、30和32的該至少一個突變是選自以下取代的取代E6A、E6R、E6C、E6Q、
E6H, E6I，E6K，E6L, E6M, E6S, E6Y, E6N, E6G, E6F, E6P, E6T, E6W, E6V, E30A, E30R, E30N, E30D, E30G, E30H, E30L, E30K, E30F, E30S, E30T, E30V, E30R, E30Q, E30G, E30I，E30L，E30M, E30F, E30P, E30T, E30W, E30Y, E30C, E30M, E30F E30V, A32K, A32T, A32Q, A32S, A32V, A32L 和A32F，其中，通過與SEQ ID NO :7的多肽原的氨基酸序列對應來編號位置。在其他實施方案中，該修飾多核苷酸編碼包含取代組合的原區(qū)，該取代組合選自在位置6和32上(即 E6X-E30X)、在位置30和32上(即E30X-A32X)產(chǎn)生的取代組合。例如，該修飾多核苷酸編碼包含選自以下的取代組合的原區(qū)E6R-A32K、
E6N-A32K, E6D-A32K, E6I-A32K, E6K-A32K, E6M-A32K, E6P-A32K,E6S-A32K,E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G， E6R-E30G, E6C-E30G， E6Q-E30G, E6G-E30G， E6H-E30G, E6K-E30G, E6S-E30G，E6W-E30G, E30G-A32R，E30G-A32Q，E30G-A32E，E30G-A32G， E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S， E6F-E30S， E6P-E30S， E6Y-E30S， E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y和E30S-A32V，其中，通過與SEQ ID NO 7的多肽原的氨基酸序列對應來編號位置。還在其他實施方案中，該修飾多核苷酸編碼包含選自以下的取代組合的原區(qū)E6G-E30G-A32E、E6G-E30G-A32S、E6G-E30G-A32T、E6G-E30G-A32W，其中，通過與 SEQ ID NO :7的多肽原的氨基酸序列對應來編號位置。使上述修飾為包含至少一個、兩個或三個取代的SEQ ID NO 7和53-58的原區(qū)中的任一個與成熟蛋白酶有效連接，該成熟蛋白酶與SEQ ID NO 9的成熟蛋白酶至少60%同一。與SEQ ID NO 9的成熟蛋白酶(遲緩芽孢桿菌蛋白酶GG36)至少60%同一的成熟蛋白酶包含野生型克勞氏芽孢桿菌PB92蛋白酶 Maxacal (SEQ ID NO 13)及其變體，如 SEQ ID NO 11、SEQ ID NO 15、SEQ ID NO :17、SEQ ID NO :19、SEQ ID NO :21、SEQ ID NO 23 和 SEQ ID NO 25 ；和 SEQ ID NO 9 的同源物，包括來自芽孢桿菌屬物種的成熟蛋白酶的同源物，如P27693嗜堿芽孢桿菌，例如SEQ ID NO 47 ；P207M芽孢桿菌屬物種_丫々8，例如SEQ ID NO 48 ；BAA25184芽孢桿菌屬物種，例如SEQ ID NO :49 ;YP_174261 克勞氏芽孢桿菌 _KSM-K16，例如 SEQ ID NO :50 ;BAA06157 芽孢桿菌屬物種 G-825-6 (SEQ IDNO 51)；和 BAF34115_A_transvaalensis，例如 SEQ ID NO :52(圖 3)。修飾為包含上述至少一個取代，且有效連接至與SEQ ID NO :9的成熟多肽至少 60%同一的成熟多肽的SEQ ID NO 7和53-58的原區(qū)中的任一個進一步與信號肽有效連接。優(yōu)選地，該信號肽是由SEQ ID NO :2的多核苷酸編碼的AprE信號肽(SEQ ID NO :3)。備選地，該信號肽是由 SEQ ID NO 4 的多核苷酸 gtgagaagcaaaaaattgtggatcgtcgcgtcga ccgcactactcatttctgttgcttttagttcatcgatcgcatcggct (SEQ ID NO 4)編碼的融合信號肽 VRSKKLWIVASTALLISVAFSSSIASA(SEQ ID NO :5)。可以使可以實現(xiàn)修飾蛋白酶在芽孢桿菌屬物種宿主細胞中的有效分泌的任意信號序列與本發(fā)明的蛋白酶原有效連接。這類信號肽包含指導蛋白質(zhì)通過細菌分泌途徑，例如Sec途徑、TAT途徑分泌的細菌來源的信號肽，及適用于在原核宿主細胞中表達蛋白質(zhì)的真核信號序列(EP1481059B1)?？梢栽谇暗鞍酌冈脑瓍^(qū)中等同的氨基酸位置上引入在SEQ ID NO :7的原區(qū)中產(chǎn)生的位置6、30和/或32上的至少一個氨基酸取代，以增強成熟蛋白酶的產(chǎn)生，其中該信號肽可以選自SEQ ID NOS :3和5的信號肽；與蛋白酶原天然地且有效地連接的信號肽；及可以實現(xiàn)修飾蛋白酶在芽孢桿菌屬物種宿主細胞，例如枯草芽孢桿菌中有效分泌的任意信號序列。如上文所指出，在一些實施方案中，本發(fā)明提供包含前述修飾多核苷酸的載體。在一些實施方案中，該載體是表達載體，其中編碼本發(fā)明的修飾蛋白酶的修飾多核苷酸序列與有效的基因表達所需的其他區(qū)段(例如與目的基因有效連接的啟動子)有效連接。在一些實施方案中，以基因自身的同源啟動子(如果它是已知的，即由宿主轉(zhuǎn)錄)和外源的或由蛋白酶基因的內(nèi)源終止子區(qū)提供的轉(zhuǎn)錄終止子提供這些必需元件。在一些實施方案中，還包含選擇基因，如抗生素抗性基因，其使得能夠通過在含有抗微生物劑的培養(yǎng)基中培養(yǎng)來持續(xù)培養(yǎng)維持質(zhì)粒感染的宿主細胞。在一些實施方案中，該表達載體衍生自質(zhì)?；虿《綝NA，或者在備選實施方案中，包含二者的元件。示例性載體包括但不限于pXX、pC194、ρJHlOU pE194、pHP13 (Harwood 禾口 Cutting(編輯)，Molecular BioloRical Methods for Bacillus, John ffiley&Sons, [1990]，尤其是第3章；適合用于枯草芽孢桿菌的復制質(zhì)粒包含92頁上所列的那些； Perego, M. (1993)Integrational Vectors for Genetic Manipulations in Bacillus subtilis，p. 615-624 ；A. L Sonenshein, J. A. Hoch禾口 R. Losick(編輯)，Bacillus subtilis and other Gram-positive bacteria :biochemistry，physiology and molecular genetics，American Society for Microbiology，Washington，D· C·)0為了在細胞中表達和產(chǎn)生目的蛋白質(zhì)，例如蛋白酶，在適合用于表達該蛋白酶的條件下將包含編碼修飾蛋白酶的多核苷酸的至少一個拷貝，且優(yōu)選包含多個拷貝的至少一個表達載體轉(zhuǎn)化入該細胞中。在一些具體實施方案中，編碼蛋白酶的序列(以及包含于載體中的其他序列)整合入宿主細胞的基因組中，而在其他實施方案中，質(zhì)粒作為自主染色體外的元件保留在細胞內(nèi)。因此，本發(fā)明提供染色體外的元件以及整合入宿主細胞基因組中的輸入序列二者。預期本文中所述的各載體將用于本發(fā)明中。在一些實施方案中，編碼修飾蛋白酶的多核苷酸構(gòu)建體存在于整合載體(例如PJH-GG36 ；圖4)上，該整合載體使得能夠?qū)⑿揎椂嗪塑账嵴先爰毦旧w中和可選地擴增。整合位點的實例包括但不限于 aprE、amyE、veg或pps區(qū)。事實上，考慮將本領(lǐng)域技術(shù)人員已知的其他位點用于本發(fā)明中。在一些實施方案中，通過對所選擇的前體蛋白酶而言是野生型啟動子的啟動子來實現(xiàn)編碼修飾蛋白酶的多核苷酸的轉(zhuǎn)錄。在一些實施方案中，啟動子對前體蛋白酶而言是異源的，但在宿主細胞中是具有功能的。具體而言，適合用于細菌宿主細胞中的啟動子的實例包括但不限于 amyE、amyQ、amyL、pstS、sacB、pSPAC、pAprE、pVeg、pHpall 啟動子，嗜熱脂肪芽孢桿菌麥芽糖淀粉酶基因、解淀粉芽孢桿菌(BAN)淀粉酶基因、枯草芽孢桿菌堿性蛋白酶基因、克勞氏芽孢桿菌堿性蛋白酶基因、短小芽孢桿菌木糖苷酶基因、蘇云金芽孢桿菌cryIIIA 和地衣芽孢桿菌α-淀粉酶基因的啟動子。在一些實施方案中，啟動子是具有以下序列的 AprE啟動子gaattcctccattttcttctgctatcaaaataacagactcgtgattttccaaacgagctttcaaaaaagcc tctgccccttgcaaatcggatgcctgtctataaaattcccgatattggttaaacagcggcgcaatggcggccgcat ctgatgtctttgcttggcgaatgttcatcttatttcttcctccctctcaataattttttcattctatcccttttct gtaaagtttatttttcagaatacttttatcatcatgctttgaaaaaatatcacgataatatccattgttctcacgg aagcacacgcaggtcatttgaacgaattttttcgacaggaatttgccgggactcaggagcatttaacctaaaaaa gcatgacatttcagcataatgaacatttactcatgtctattttcgttcttttctgtatgaaaatagttatttcga gtctctacggaaatagcgagagatgatatacctaaatagagataaaatcatctcaaaaaaatgggtctactaaaa tattattccatctattacaataaattcacagaatagtcttttaagtaagtctactctgaatttttttaaaaggag agggtaaaga (SEQ ID N0:1)·。
其他啟動子包括但不限于A4啟動子，以及λ噬菌體1\或1\啟動子和大腸桿菌 (E. coli) lac、trp 或 tac 啟動子。在包括細菌和真菌的任意適宜的革蘭氏陽性微生物的宿主細胞中產(chǎn)生前體和修飾蛋白酶。例如，在一些實施方案中，在真菌和/或細菌來源的宿主細胞中產(chǎn)生修飾蛋白酶。在一些實施方案中，宿主細胞是芽孢桿菌屬物種、鏈霉菌屬物種(Sti^ptomyces sp.)、埃希氏菌屬物種(Escherichia sp.)或曲霉屬物種(Aspergillus sp.)。在一些實施方案中，通過芽孢桿菌屬物種宿主細胞產(chǎn)生修飾蛋白酶。用于產(chǎn)生本發(fā)明的修飾蛋白質(zhì)的芽孢桿菌屬物種宿主細胞的實例包括但不限于地衣芽孢桿菌、遲緩芽孢桿菌、枯草芽孢桿菌、解淀粉芽孢桿菌、遲緩芽孢桿菌、短芽孢桿菌、嗜熱脂肪芽孢桿菌、嗜堿芽孢桿菌、凝結(jié)芽孢桿菌、環(huán)狀芽孢桿菌、短小芽孢桿菌、蘇云金芽孢桿菌、克勞氏芽孢桿菌和巨大芽孢桿菌，以及芽孢桿菌屬內(nèi)的其他生物。在一些實施方案中，使用枯草芽孢桿菌宿主細胞。美國專利 5，沈4，366和4，760，025 (RE 34，606)描述了用于本發(fā)明中的多種芽孢桿菌屬宿主菌株，雖然其他適宜的菌株也用于本發(fā)明中。用于本發(fā)明中的幾種工業(yè)菌株包含非重組(即野生型)芽孢桿菌屬物種菌株，以及天然存在的菌株的變體和/或重組菌株。在一些實施方案中，宿主菌株是重組菌株，其中已將編碼目的多肽的多核苷酸引入該宿主中。在一些實施方案中，宿主菌株是枯草芽孢桿菌宿主菌株，尤其是重組枯草芽孢桿菌宿主菌株。已知許多枯草芽孢桿菌菌株，其包括但不限于 1A6 (ATCC 39085)、168 (1A01)、SB19、W23、Ts85、B637、PB1753 至 PB1758、PB3360、 JH642、1A243(ATCC 39, 087),ATCC 21332、ATCC6051、MI113、DE100(ATCC 39，094)、GX4931、 PBT 110和PEP 211菌株(參見例如Hoch等，Genetics，73 :215-2沘[1973]；還見美國專利號4，450，235、美國專利號4，302，544和EP 0134048 ；其中每一篇以其整體引入作為參考)?？莶菅挎邨U菌作為表達宿主的用途為本領(lǐng)域公知(參見例如I^lva等，Gene 19 81-87[1982] ；Fahnestock 和 Fischer, J. Bacteriol.，165 :796-804[1986]；和 Wang 等， Gene 69 :39-47[1988])。在一些實施方案中，芽孢桿菌屬宿主是在以下基因的至少一個中包含突變或缺失的芽孢桿菌屬物種degU、degS、degR和degQ。優(yōu)選地，突變在degU基因中，且更優(yōu)選地，突變是 degU(Hy)32。(參見例如 Msadek 等，J. Bacteriol.，172 :824-834 [1990]；和 Olmos 等，Mol. Gen. Genet.，253 :562-567 [1997])。優(yōu)選的宿主菌株是攜帶 degU32 (Hy)突變的枯草芽孢桿菌。在一些其他實施方案中，芽孢桿菌屬宿主在scoC4(參見例如Caldwell 等，J. Bacteriol.，183 :7329-7340[2001]), spoIIE(參見 Arigoni 等，Mol. Microbiol.，31 :1407-1415 [1999])和/或oppA或opp操縱子的其他基因(參見例如Perego等，Mol. Microbiol. ,5 173-185[1991])中包含突變或缺失。事實上，考慮將opp操縱子中導致與 oppA基因中的突變相同的表型的任意突變用于本發(fā)明的改變的芽孢桿菌屬宿主的一些實施方案中。在一些實施方案中，這些突變單獨存在，而在其他實施方案中，存在突變的組合。在一些實施方案中，可以用來產(chǎn)生本發(fā)明的修飾蛋白酶的改變的芽孢桿菌屬是已在上文提到的一個或多個基因中包含突變的芽孢桿菌屬宿主菌株。此外，還使用包含內(nèi)源蛋白酶基因的突變和/或缺失的芽孢桿菌屬物種宿主細胞。在一些實施方案中，芽孢桿菌屬宿主細胞包含aprE和nprE基因的缺失。在其他實施方案中，芽孢桿菌屬物種宿主細胞包含5個蛋白酶基因的缺失(US20050202535)，而在其他實施方案中，芽孢桿菌屬物種宿主細胞包含 9個蛋白酶基因的缺失(US200502025;35)。使用本領(lǐng)域已知的任意適宜的方法，用編碼本發(fā)明的修飾蛋白酶的修飾多核苷酸轉(zhuǎn)化宿主細胞。無論將修飾多核苷酸整合入載體中，還是在不存在質(zhì)粒DNA的情況下使用，都將它引入微生物中，在一些實施方案中，優(yōu)選引入大腸桿菌細胞或感受態(tài)芽孢桿菌屬細胞中。涉及質(zhì)粒構(gòu)建體和質(zhì)粒向大腸桿菌中的轉(zhuǎn)化的用于將DNA引入芽孢桿菌屬細胞中的方法是公知的。在一些實施方案中，隨后從大腸桿菌分離質(zhì)粒，并轉(zhuǎn)化入芽孢桿菌屬中。但是，并非必需使用中間微生物，如大腸桿菌，在一些實施方案中，直接將DNA構(gòu)建體或載體引入芽孢桿菌屬宿主中。本領(lǐng)域技術(shù)人員清楚意識到適合用于將多核苷酸序列引入芽孢桿菌屬細胞中的方法(參見例如 Ferrari 等，“Genetics，” 在 Harwood 等(編輯)，Bacillus, Plenum Publishing Corp. [1989]，57-72 頁中；Saunders 等，J. Bacteriol. , 157 :718-726 [1984]； Hoch 等,J. Bacteriol. ,93 1925-1937 [ 1967] ；Mann 等,Current Microbiol. ，13 131-135[1986] ；Holubova, Folia Microbiol. ,30 :97 [1985] ；Chang 等，Mol. Gen. Genet.， 168 11-115[1979] ；Vorobjeva 等，F(xiàn)EMS Microbiol. Lett.，7 :261-263[1980] ；Smith 等， Appl. Env. Microbiol. ,51 634[1986] ；Fisher 等，Arch. Microbiol.，139 :213-217[1981]；和 McDonald，J. Gen. Microbiol.，130 :203[1984])。事實上，諸如轉(zhuǎn)化(包括原生質(zhì)體轉(zhuǎn)化和中板集合(congression))、轉(zhuǎn)導和原生質(zhì)體融合的這類方法是已知的，且適合用于本發(fā)明中。用轉(zhuǎn)化的方法將本發(fā)明提供的DNA構(gòu)建體引入宿主細胞中。本領(lǐng)域已知的轉(zhuǎn)化芽孢桿菌屬的方法包括諸如質(zhì)粒標記拯救轉(zhuǎn)化的方法，該方法涉及攜帶部分同源的存留質(zhì)粒(resident plasmid)的感受態(tài)細胞攝取供體質(zhì)粒(Contente等， Plasmid2 :555-571 [1979] ；Haima 等，Mol. Gen. Genet.，223 185-191[1990] ；Weinrauch 等，J. Bacteriol. ，154 1077-1087 [1983]；禾口 Weinrauch 等，J. Bacteriol. ，169 1205-1211 [1987])。在此方法中，輸入的供體質(zhì)粒在模擬染色體轉(zhuǎn)化的過程中與居民“輔助”質(zhì)粒的同源區(qū)重組。除常用方法外，在一些實施方案中，直接轉(zhuǎn)化宿主細胞(即在引入宿主細胞之前不用中間細胞來擴增或以其他方式加工DNA構(gòu)建體)。DNA構(gòu)建體向宿主細胞中的引入包括本領(lǐng)域已知的，在不插入質(zhì)粒或載體的情況下將DNA引入宿主細胞中的那些物理和化學方法。這類方法包括但不限于氯化鈣沉淀、電穿孔、裸DNA、脂質(zhì)體等。在其他實施方案中，將DNA構(gòu)建體與質(zhì)粒共轉(zhuǎn)化，而不插入質(zhì)粒中。在其他實施方案中，通過本領(lǐng)域已知的方法從改變的芽孢桿菌屬菌株缺失選擇標記(見Mahl等，J. Bacteriol.，158 :411-418 [1984]；和 Palmeros 等，Gene 247 :255-264[2000])。在一些實施方案中，在常規(guī)營養(yǎng)培養(yǎng)基中培養(yǎng)本發(fā)明的轉(zhuǎn)化的細胞。適宜的具體培養(yǎng)條件，如溫度、PH等為本領(lǐng)域技術(shù)人員已知。此外，一些培養(yǎng)條件可以見于科學文獻中，如 Hopwood(2000)Practical Streptomvces Genetics, John Innes Foundation, Norwich UK ；Hardwood 等，(1990)Molecular Biological Methods for Bacillus, John Wiley 和來自美國典型培養(yǎng)物保藏中心(ATCC)。在一些實施方案中，在允許表達該蛋白酶的條件下將編碼修飾蛋白酶的多核苷酸序列轉(zhuǎn)化的宿主細胞培養(yǎng)在適宜的營養(yǎng)培養(yǎng)基中，然后從培養(yǎng)物回收產(chǎn)生的蛋白酶。用來培養(yǎng)細胞的培養(yǎng)基包含適合用于培養(yǎng)宿主細胞的任意常規(guī)培養(yǎng)基，如包含適當補充物的基本培養(yǎng)基或復合培養(yǎng)基。適宜的培養(yǎng)基可以從供應商獲得，或者可以按照公開的配方(例如美國典型培養(yǎng)物保藏中心的目錄中)制備。在一些實施方案中，通過常規(guī)方法從培養(yǎng)基回收由細胞產(chǎn)生的蛋白酶，該方法包括但不限于通過離心或過濾從培養(yǎng)基分離宿主細胞、利用鹽(例如硫酸銨)沉淀上清或濾液的蛋白質(zhì)成分、層析純化(例如離子交換、凝膠過濾、親和力等)。因此，將適合用于回收本發(fā)明的蛋白酶的任意方法用于本發(fā)明中。事實上，本發(fā)明并非旨在限于任意具體的純化方法。包含本發(fā)明的修飾蛋白酶的由重組宿主細胞產(chǎn)生的蛋白質(zhì)分泌進入培養(yǎng)基中。在一些實施方案中，其他重組構(gòu)建將異源或同源多核苷酸序列與編碼便于純化可溶性蛋白質(zhì)的蛋白酶多肽結(jié)構(gòu)域的核苷酸序列連接(Kroll DJ等(1993)DNA Cell Biol 12 :441-53)。這類便于純化的結(jié)構(gòu)域包括但不限于金屬螯合肽，如組氨酸-色氨酸組件，其允許在固定化金屬上純化(Porath J(1992)Protein Expr Purif 3:263-281)；蛋白 A 結(jié)構(gòu)域，其允許在固定化免疫球蛋白上純化；和用于FLAGS延伸/親和純化系統(tǒng)的結(jié)構(gòu)域(Immunex Corp, Seattle WA)。在純化結(jié)構(gòu)域和異源蛋白質(zhì)之間包含可切割的接頭序列，如因子XA或腸激酶(Invitrogen, San Diego CA)也用于便于純化。如上文所指出，本發(fā)明提供編碼修飾全長蛋白酶的修飾全長多核苷酸，通過芽孢桿菌屬宿主細胞加工該修飾全長蛋白酶來以這樣的水平產(chǎn)生成熟形式，該水平高于在相同條件下通過芽孢桿菌屬宿主細胞從未修飾的全長酶加工時相同成熟蛋白酶的產(chǎn)生水平。產(chǎn)生水平由分泌酶的活性水平?jīng)Q定。產(chǎn)生的一個度量(measure)可以測定為相對活性，其表示為從修飾蛋白酶加工時成熟形式的酶活性值與從未修飾的前體蛋白酶加工時成熟形式的酶活性值之比的百分數(shù)。相對活性等于或大于100%表明以這樣的水平產(chǎn)生從修飾前體加工的蛋白酶的成熟形式，該水平等于或高于從未修飾的前體加工時產(chǎn)生相同成熟蛋白酶的水平。因此，在一些實施方案中，在與對應的從未修飾的前體蛋白酶加工的蛋白酶的成熟形式的產(chǎn)生相比時，從修飾蛋白酶加工的成熟蛋白酶的相對活性是至少約100%、至少約110%、至少約120%、至少約130%、至少約140%、至少約150%、至少約160%、至少約170%、至少約180%、至少約190%、至少約200%、至少約225%、至少約250%、至少約275%、至少約300%、至少約325%、至少約350%、至少約375%、至少約400%、至少約425%、至少約450%、至少約475%、至少約500%、至少約525%、至少約550%、至少約575%、至少約600%、至少約625%、至少約650%、至少約675%、至少約700%、至少約725%、至少約750%、至少約800%、至少約825%、至少約850%、至少約875%、至少約850%、至少約875%、至少約900%和至多至少約1000%或更多。備選地，將相對活性表示為用從修飾前體加工的蛋白酶的活性值除以從未修飾的前體加工時相同蛋白酶的活性值測定的產(chǎn)生比。因此，在一些實施方案中，從修飾前體加工的成熟蛋白酶的產(chǎn)生比是至少約1、至少約1. 1、至少約1.2、至少約1. 3、至少約1. 4、至少約1. 5、至少約1. 6、至少約1. 7、至少約1. 8、至少約1. 9、至少約 2、至少約2. 25、至少約2. 5、至少約2. 75、至少約3、至少約3. 25、至少約3. 5、至少約3. 75、至少約、至少約4. 25、至少約4. 5、至少約4. 75、至少約5、至少約5. 25、至少約5. 5、至少約 5. 75、至少約6、至少約6. 25、至少約6. 5、至少約6. 75、至少約7、至少約7. 25、至少約7. 5、至少約8、至少約8. 25、至少約8. 5、至少約8. 75、至少約9和至多至少約10。存在本領(lǐng)域普通技術(shù)人員已知的多種用于檢測和測量蛋白酶活性的測定。具體而言，可以獲得基于酸溶性肽從酪蛋白或血紅蛋白的釋放的測定來測量蛋白酶活性，用福林法將該釋放度量為280nm的吸光度或進行比色測量(參見例如Bergmeyer等，"Methods of Enzymatic Analysis” 卷 5， Peptidases, Proteinases and their Inhibitors, Verlag Chemie, ffeinheim[1984]) 0 一些其他測定涉及顯色底物的溶解(參見例如 Ward, "Proteinases, ” 在 Fogarty (編輯)·，Microbial Enzymes and BiotechnoloRY, Applied Science, London, [1983]，251-317頁中)。其他示例性測定包括但不限于琥珀酰-Ala-Ala-Pro-Phe-對硝基苯胺測定(SAAPFpNA)和2，4，6_三硝基苯磺酸鈉鹽測定 (TNBS測定)。本領(lǐng)域技術(shù)人員已知的許多其他參考文獻提供了適宜的方法(參見例如 Wells 等，Nucleic Acids Res. 11 :7911-7925[1983] ；Christianson 等，Anal. Biochem.， 223 119-129[1994]；和 Hsia 等，Anal Biochem.，242 :221-227[1999])。本發(fā)明并非旨在限于任意具體的測定方法。用于測定宿主細胞中成熟蛋白酶的產(chǎn)生水平的其他手段包括但不限于使用對該蛋白質(zhì)特異的多克隆或單克隆抗體的方法。實例包括但不限于酶聯(lián)免疫吸附測定(ELISA)、放射免疫測定(RIA)、熒光免疫測定(FIA)和熒光激活細胞分選術(shù)(FACS)。這些及其他測定為本領(lǐng)域公知(參見例如Maddox等，J.Exp. Med.，158 :1211 [1983])。本文中提到的所有出版物和專利在此引入作為參考。本發(fā)明所述的方法和系統(tǒng)的多種修改和變化對本領(lǐng)域技術(shù)人員而言顯而易見而不背離本發(fā)明的范圍和精神。雖然已結(jié)合具體實施方案描述了本發(fā)明，但應理解，不應不當?shù)貙⒈景l(fā)明限于這類具體實施方案。事實上，旨在將對本領(lǐng)域和/或相關(guān)領(lǐng)域技術(shù)人員而言顯而易見的所述用于實施本發(fā)明的方式的多種修改包含于本發(fā)明的范圍之內(nèi)。
實驗在隨后的實驗公開內(nèi)容中，適用以下縮寫ppm(百萬分之幾)；M(摩爾每升)； mM(毫摩爾每升)；μ M(微摩爾每升)；ηΜ(納摩爾每升)；mol (摩爾)；mmol (毫摩爾)； μπιο (微摩爾)；nmol (納摩爾)；gm (克)；mg (毫克)；Pg (微克)；Pg (皮克)；L (升)；ml 和mL(毫升)；μ 和4 1^(微升)；cm(厘米)；mm(毫米)；ym(微米)；nm(納米)；U(單位)；V(伏特)；MW(分子量)；sec(秒)；min(s)(分鐘)；h(s)和 hr(s)(小時)；。C (攝氏度)；QS(足量)；QC(QuikChange) ；ND(未進行)；NA(不適用)；rpm(轉(zhuǎn)每分鐘)；w/ ν (質(zhì)量比體積)；v/V (體積比體積)；g (重力)；OD (光密度)；aa (氨基酸)；bp (堿基對)； 1Λ (千堿基對)；kD(千道爾頓)；suc-AAPF-pNA(琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酰-對硝基苯胺)；DMSO ( 二甲基亞砜)；cDNA (拷貝或互補DNA) ；DNA (脫氧核糖核酸)；ssDNA(單鏈DNA) ；dsDNA(雙鏈DNA) ；dNTP(脫氧核糖核苷三磷酸)；DTT(1， 4-二硫代-DL-蘇糖醇)；H20(7jO ；dH20(去離子水)；HCl (鹽酸)；MgCl2(氯化鎂)； MOPS (3-[N-嗎啉代]丙磺酸)；NaCl (氯化鈉)；PAGE (聚丙烯酰胺凝膠電泳)；PBS (磷酸緩沖鹽溶液[150mM NaCl、10mM磷酸鈉緩沖液，pH7. 2]) ；PEG(聚乙二醇)；PCR(聚合酶鏈反應)；PMSF(苯甲基磺酰氟)；RNA(核糖核酸)；SDS(十二烷基硫酸鈉)；Tris(三(羥甲基)氨基甲烷)；S0C(2% Bacto-Tryptone,0. 5% Bacto Yeast Extract , IOmM NaCl, 2. 5mM KCl) ；Terrific Broth (TB ； 12g/l Bacto Tryptone，24g/l 甘油，2. 31g/lKH2P04 和 12. 54g/l K2HPO4) ；O擬80Q80nm 的光密度)；0D600 (600nm 的光密度)；A405 (405nm 的吸光度)；Vmax(酶催化的反應的最大初速度)；HEPES(N-[2-羥乙基]哌嗪-N_[2_乙磺酸])； Tris-HCl(三[羥甲基]氨基甲烷-鹽酸)；TCA(三氯乙酸)；HPLC (高壓液相層析)； RP-HPLC(反相高壓液相層析)；TLC(薄層層析)；EDTA(乙二胺四乙酸)出tOH(乙醇)； SDS(十二烷基硫酸鈉)；Tris(三(羥甲基)氨基甲烷)；TAED(N，N，N，N，-四乙?；叶?。提供以下實施例來顯示和進一步說明本發(fā)明的某些實施方案和方面，而不解釋為限制其范圍。為了測定堿性蛋白酶原區(qū)中的氨基酸取代對該原區(qū)與之有效連接的蛋白酶的成熟形式的產(chǎn)生的影響，在分別與實施例1-5中所述的SEQ ID NO :9、11、17、19和21的成熟蛋白酶有效連接時，在SEQ ID NO :7的原區(qū)的位置6、30和32上的氨基酸上引入一個、兩個和三個氨基酸取代。
實施例1
SEQ ID NO :7的原區(qū)中的突變對SEQ ID NO :9的成熟堿性蛋白酶的產(chǎn)生的影響(a)原區(qū)位置6、30或32上的氨基酸的位點飽和誘變。
按照廠家的說明用QuikChange 位點定向誘變試劑盒(qc ；Stratagene)進行關(guān)于seq ID NO :9的成熟蛋白酶的產(chǎn)生的原區(qū)的位點飽和誘變。將包含AprE啟動子和編碼seq ID NO :59的全長蛋白酶的多核苷酸的DNA盒克隆入pJHIOl載體(Ferrari等 J. Bacteriol. 154 1513-1515[1983])pJH-Pn(圖 4A)的 EcoRI 和 HindIII 限制位點，產(chǎn)生 PJH-P9質(zhì)粒。(Pn指從pJH-pn質(zhì)粒表達的成熟蛋白酶的seq ID NO)。該DNA盒包含枯草芽孢桿菌aprE啟動子
gaattcctccattttcttctgctatcaaaataacagactcgtgattttccaaacgagctttcaaaaaagcc tctgccccttgcaaatcggatgcctgtctataaaattcccgatattggttaaacagcggcgcaatggcggccgcat ctgatgtctttgcttggcgaatgttcatcttatttcttcctccctctcaataattttttcattctatcccttttct gtaaagtttatttttcagaatacttttatcatcatgctttgaaaaaatatcacgataatatccattgttctcacgg aagcacacgcaggtcatttgaacgaattttttcgacaggaatttgccgggactcaggagcatttaacctaaaaaa gcatgacatttcagcataatgaacatttactcatgtctattttcgttcttttctgtatgaaaatagttatttcga gtctctacggaaatagcgagagatgatatacctaaatagagataaaatcatctcaaaaaaatgggtctactaaaa tattattccatctattacaataaattcacagaatagtcttttaagtaagtctactctgaatttttttaaaaggag agggtaaaga(SEQ ID NO :1)，
多核苷酸序列
gtgagaagcaaaaaattgtggatcagcttgttgtttgcgttaacgttaatctttacgatggcgttcagcaacatgtctgcgcaggct (SEQ ID NO 2),其編碼 AprE 信號肽 VRSKKLWISLLFALTLIFTMAFS匪SAQA (SE Q ID NO 3)；
多核苷酸序列
gctgaagaagcaaaagaaaaatatttaattggctttaatgagcaggaagctgtcagtgagtttgtagaacaa gtagaggcaaatgacgaggtcgccattctctctgaggaagaggaagtcgaaattgaattgcttcatgaatttgaaac gattcctgttttatccgttgagttaagcccagaagatgtggacgcgcttgaactcgatccagcgatttcttatattg aagaggatgcagaagtaacgacaatg(SEQ ID NO :6)，其編碼未修飾的原區(qū)
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAIS YIEEDAEVTTM(SEQ ID NO 7)；和多核苷酸序列
gcgcaatcagtgccatggggaattagccgtgtgcaagccccagctgcccataaccgtggattgacaggttct ggtgtaaaagttgctgtcctcgatacaggtatttccactcatccagacttaaatattcgtggtggcgctagctttgt accaggggaaccatccactcaagatgggaatgggcatggcacgcatgtggccgggacgattgctgctttaaacaatt cgattggcgttcttggcgtagcgccgagcgcggaactatacgctgttaaagtattaggggcgagcggttcaggtteg gtcagctcgattgcccaaggattggaatgggcagggaacaatggcatgcacgttgctaatttgagtttaggaagccc ttcgccaagtgccacacttgagcaagctgttaatagcgcgacttctagaggcgttcttgttgtagcggcatctggaa attcaggtgcaggctcaatcagctatccggcccgttatgcgaacgcaatggcagtcggagctactgaccaaaacaac aaccgcgccagcttttcacagtatggcgcagggcttgacattgtcgcaccaggtgtaaacgtgcagagcacataccc aggttcaacgtatgccagcttaaacggtacatcgatggctactcctcatgttgcaggtgcagcagcccttgttaaac aaaagaacccatcttggtccaatgtacaaatccgcaatcatctaaagaatacggcaacgagcttaggaagcacgaac ttgtatggaagcggacttgtcaatgcagaagctgcaactcgt(SEQ ID NO :8)，，其編碼蛋白酶 9 的成熟區(qū)(P9)
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAG TIAALNNSIGVLGVAPSAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVN SATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGS TYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR(SEQ ID NO 9)。
按如下將包含于SEQ ID NO 59的全長蛋白酶中的SEQ ID NO 7的原區(qū)中的3個密碼子(通過NNG/C示例)中的每一個突變?yōu)楸痪幋a20種天然存在的氨基酸的32個可能的核苷酸三聯(lián)體取代來產(chǎn)生三個文庫。突變包含編碼全長蛋白酶的序列的質(zhì)粒PJH-P9DNA的整分試樣，以產(chǎn)生編碼原區(qū)(SEQ ID NO 7)位置6上的谷氨酸(E)的所有可能的取代(E6X) 的克隆的第一文庫；突變第二整分試樣，以產(chǎn)生編碼原區(qū)(SEQ ID NO 7)位置30上的谷氨酸(E)的所有可能的取代(E30X)的克隆的第二文庫；突變第三整分試樣，以產(chǎn)生編碼原區(qū) (SEQ ID NO 7)位置32上的精氨酸(A)的所有可能的取代(A32X)的克隆的第三文庫。設計在NNS密碼子側(cè)翼具有約18個堿基的互補重疊引物來突變目的密碼子。表1中給出了用來突變位置6、30和32上的氨基酸的正向引物和反向引物的多核苷酸序列。表權(quán)利要求
1.編碼修飾蛋白酶的分離的修飾多核苷酸，所述分離的修飾多核苷酸包含編碼信號肽的第一多核苷酸，所述第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，其中所述原區(qū)在選自所述原區(qū)的位置6、30和32的位置上包含至少兩個氨基酸的取代的組合，所述第二多核苷酸與編碼蛋白酶成熟區(qū)的第三多核苷酸有效連接，其中所述蛋白酶與SEQ ID NO :9的成熟蛋白酶至少約60%同一，且其中通過與SEQ ID NO :7的多肽原的氨基酸序列對應來編號位置。
2.權(quán)利要求1的分離的修飾多核苷酸，其中所述成熟蛋白酶是源自克勞氏芽孢桿菌或遲緩芽孢桿菌的野生型或變體堿性絲氨酸蛋白酶。
3.權(quán)利要求1或2的分離的修飾多核苷酸，其中所述成熟蛋白酶具有選自SEQID NO 9、11、13、15、17、19和21的氨基酸序列。
4.權(quán)利要求1-3中任一項的分離的多核苷酸，其中所述信號肽具有選自SEQID NO 3 和5的氨基酸序列。
5.權(quán)利要求1-4中任一項的分離的修飾多核苷酸，其中所述取代的組合選自 E6X-E30G、E6X-E30S、E6X-A32K, E30X-A32K, E30G-A32X、E30S-A32X 和 E6G-E30G-A32X。
6.權(quán)利要求1-4中任一項的分離的修飾多核苷酸，其中所述取代的組合選自 E6R-A32K, E6N-A32K, E6D-A32K， E6I-A32K， E6K-A32K, E6M-A32K， E6P-A32K, E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K, E30V-A32K, E6A-E30G， E6R-E30G, E6C-E30G， E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G，E6S-E30G，E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E， E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V, E6G-E30G-A32E, E6G-E30G-A32S, E6G-E30G-A32T, E6G-E30G-A32W, E6A-E30G, E6R-E30G, E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G, E6W-E30G, E6V-E30G, E6Y-E30G, E6A-E30S, E6G-E30S, E6L-E30S, E6K-E30S, E6F-E30S, E6P-E30S, E6Y-E30S, E6V-E30S, E30S-A32R, E30S-A32N, E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y，和 E30S-A32V。
7.權(quán)利要求1-6中任一項的分離的多核苷酸，其中所述取代增強所述成熟蛋白酶通過芽孢桿菌屬物種宿主細胞的產(chǎn)生。
8.權(quán)利要求7的分離的多核苷酸，其中所述芽孢桿菌屬物種宿主細胞是枯草芽孢桿菌宿主細胞。
9.表達載體，其包含權(quán)利要求1的分離的修飾多核苷酸。
10.權(quán)利要求9的表達載體，其進一步包含AprE啟動子。
11.芽孢桿菌屬物種宿主細胞，其包含權(quán)利要求9或10的表達載體。
12.權(quán)利要求11的宿主細胞，其中所述宿主細胞是枯草芽孢桿菌宿主細胞。
13.用于在芽孢桿菌屬物種宿主細胞中產(chǎn)生成熟蛋白酶的方法，所述方法包括a)提供權(quán)利要求10的表達載體；b)用所述表達載體轉(zhuǎn)化芽孢桿菌屬物種宿主細胞；和c)在適宜的條件下培養(yǎng)所述宿主細胞，使得通過所述宿主細胞產(chǎn)生所述蛋白酶。
14.權(quán)利要求13的方法，其中所述芽孢桿菌屬物種宿主細胞是枯草芽孢桿菌宿主細胞。
15.權(quán)利要求13或14的方法，其中所述成熟蛋白酶是野生型克勞氏芽孢桿菌或遲緩芽孢桿菌堿性絲氨酸蛋白酶，其變體或同源物。
16.權(quán)利要求13-15中任一項的方法，其中所述第一多核苷酸編碼SEQID NO :3的信號肽，其中編碼所述原區(qū)的所述第二多核苷酸包含選自E6R-A32K、E6N-A32K、E6D-A32K、 E6I-A32K, E6K-A32K, E6M-A32K, E6P-A32K, E6S-A32K, E6T-A32K, E6N-A32K, E30W-A32K 和 E30V-A32K的取代組合，且其中所述第三多核苷酸編碼選自SEQ ID NO 9的成熟蛋白酶。
17.權(quán)利要求13-15中任一項的方法，其中所述第一多核苷酸編碼SEQID NO :3的信號肽，其中編碼所述原區(qū)的所述第二多核苷酸包含選自E6A-E30G，E6R-E30G，E6C-E30G， E6Q-E30G, E6G-E30G, E6H-E30G， E6K-E30G， E6S-E30G， E6W-E30G, E30G-A32R, E30G-A32Q, E30G-A32E, E30G-A32G, E30G-A32H, E30G-A32I, E30G-A32K, E30G-A32S, E30G-A32T, E30G-A32W, E30G-A32V，E6G-E30G-A32E，E6G-E30G-A32S，E6G-E30G-A32T 和 E6G-E30G-A32W 的取代組合，且其中所述第三多核苷酸編碼選自SEQ ID NOS 17的成熟蛋白酶。
18.權(quán)利要求13-15中任一項的方法，其中所述第一多核苷酸編碼SEQID NO :3的信號肽，其中編碼所述原區(qū)的所述第二多核苷酸包含選自E6A-E30G，E6R-E30G，E6N-E30G, E6D-E30G, E6C-E30G, E6Q-E30G, E6G-E30G, E6H-E30G, E6K-E30G, E6M-E30G, E6F-E30G, E6P-E30G, E6S-E30G, E6T-E30G，E6W-E30G, E6V-E30G 和 E6Y-E30G 的取代組合，且其中所述第三多核苷酸編碼選自SEQ ID NO :19的成熟蛋白酶。
19.權(quán)利要求13-15中任一項的方法，其中所述第一多核苷酸編碼SEQID NO :3的信號肽，其中編碼所述原區(qū)的所述第二多核苷酸包含選自E6A-E30S，E6G-E30S, E6L-E30S， E6K-E30S, E6F-E30S, E6P-E30S，E6Y-E30S，E6V-E30S, E30S-A32R, E30S-A32N，E30S-A32D, E30S-A32C, E30S-A32Q, E30S-A32E, E30S-A32G, E30S-A32H, E30S-A32L, E30S-A32K, E30S-A32M, E30S-A32F, E30S-A32P, E30S-A32S, E30S-A32T, E30S-A32W, E30S-A32Y 禾P E30S-A32V的取代組合，且其中所述第三多核苷酸編碼選自SEQ ID NO 21的成熟蛋白酶。
20.編碼修飾蛋白酶的分離的多核苷酸，所述分離的修飾多核苷酸包含編碼SEQID NO :3的信號肽的第一多核苷酸，所述第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，其中所述原區(qū)包含選自E6A、E6C、E6Y、E30A、E30L、E30P、E30T、E30Y、E30V、 A32C、A32E、A32G、A3^(和A32T的氨基酸取代，所述第二多核苷酸與編碼SEQ ID NO :17的蛋白酶的成熟區(qū)的第三多核苷酸有效連接。
21.編碼修飾蛋白酶的分離的多核苷酸，所述分離的修飾多核苷酸包含編碼SEQID NO :3的信號肽的第一多核苷酸，所述第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，其中所述原區(qū)包含選自E6A、E6C、E6F、E6P、E6T、E6W、E6V、A3I和A32T的氨基酸取代，所述第二多核苷酸與編碼SEQ ID NO :9的蛋白酶的成熟區(qū)的第三多核苷酸有效連接。
22.編碼修飾蛋白酶的分離的多核苷酸，所述分離的修飾多核苷酸包含編碼SEQID NO :3的信號肽的第一多核苷酸，所述第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，其中所述原區(qū)包含選自E6A、E30A、E30L、E30T和E30V的氨基酸取代，所述第二多核苷酸與編碼SEQ ID NO :19的蛋白酶的成熟區(qū)的第三多核苷酸有效連接。
23.編碼修飾蛋白酶的分離的多核苷酸，所述分離的修飾多核苷酸包含編碼SEQIDNO :3的信號肽的第一多核苷酸，所述第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，其中所述原區(qū)包含選自E6A、E6L、E6F、E6T、E6V、E30I、E30L、E30P、E30T、 E30Y、E30V、A32Q、A32S和A32T的氨基酸取代，所述第二多核苷酸與編碼SEQ ID NO 11的蛋白酶的成熟區(qū)的第三多核苷酸有效連接。
24.編碼修飾蛋白酶的分離的多核苷酸，所述分離的修飾多核苷酸包含編碼SEQID NO :3的信號肽的第一多核苷酸，所述第一多核苷酸與編碼SEQ ID NO :7所示原區(qū)的第二多核苷酸有效連接，其中所述原區(qū)包含氨基酸取代E30A，所述第二多核苷酸與編碼SEQ ID NO 21的蛋白酶的成熟區(qū)的第三多核苷酸有效連接。
25.用于在枯草芽孢桿菌宿主細胞中產(chǎn)生成熟蛋白酶的方法，所述方法包括a)提供包含分離的多核苷酸的表達載體，所述分離的多核苷酸選自權(quán)利要求20、21、 22,23和M的分離的多核苷酸；b)用所述表達載體轉(zhuǎn)化所述枯草芽孢桿菌宿主細胞；和c)在適宜的條件下培養(yǎng)所述宿主細胞，使得通過所述宿主細胞產(chǎn)生所述成熟蛋白酶。
全文摘要
本發(fā)明提供用于在細菌宿主細胞中產(chǎn)生成熟蛋白酶的方法和組合物。該組合物包含編碼在原區(qū)中具有至少一個突變的修飾蛋白酶的修飾多核苷酸；由該修飾多核苷酸編碼的修飾的絲氨酸蛋白酶；包含編碼該修飾蛋白酶的修飾多核苷酸的表達盒、DNA構(gòu)建體和載體；及用本發(fā)明的載體轉(zhuǎn)化的細菌宿主細胞。該方法包括用于增強成熟蛋白酶在細菌宿主細胞，例如芽孢桿菌屬物種宿主細胞中的產(chǎn)生的方法。所產(chǎn)生的蛋白酶用于工業(yè)產(chǎn)生適合用于包括但不限于清潔、動物飼料和織物加工產(chǎn)業(yè)的多種產(chǎn)業(yè)中的酶。
文檔編號C12N9/54GK102414321SQ201080017883
公開日2012年4月11日申請日期2010年4月15日優(yōu)先權(quán)日2009年4月24日
發(fā)明者齊蒙耐德 A·范, C·菲奧雷西, E·費拉里申請人:丹尼斯科美國公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：E·費拉里;C·菲奧雷西;A·范齊蒙耐德
技術(shù)所有人：E·費拉里;C·菲奧雷西;A·范齊蒙耐德
我是此專利的發(fā)明人

上一篇：用于生產(chǎn)感興趣的重組多肽的方法
上一篇：分離方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.食品功能因子基因工程菌種的構(gòu)建、智能高通量進化篩選 2.發(fā)酵工藝優(yōu)化
2、馬老師：1.酶工程與生物催化 2.釀造技術(shù)與風味分析 3.生物質(zhì)資源綜合利用
3、林老師：1.釀造微生物育種及關(guān)鍵釀造工藝開發(fā) 2. 真菌基因功能及調(diào)控網(wǎng)絡解析 3.精細化學品、蛋白真菌細胞底盤開發(fā)
4、張老師：1.發(fā)酵食品安全：危害物相關(guān)基因的篩選，危害物產(chǎn)生菌的快速檢測，危害物的預警和發(fā)酵過程控制 2.真菌次級代謝與調(diào)控 3.釀造酒相關(guān)研究
5、郭老師：1.現(xiàn)代釀造技術(shù)與食品安全 2. 酵母生物學 3.生物基化學品與合成生物學
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

菠蘿蛋白酶的修飾相關(guān)技術(shù)

胃蛋白酶原相關(guān)技術(shù)

胃蛋白酶原ii偏高相關(guān)技術(shù)

胃蛋白酶原i相關(guān)技術(shù)

胃蛋白酶原1相關(guān)技術(shù)

胃蛋白酶原ⅰ相關(guān)技術(shù)

膠原蛋白酶相關(guān)技術(shù)

胃蛋白酶原ⅰ降低相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

具有修飾的原區(qū)的蛋白酶的制作方法