枯草桿菌蛋白酶變體以及編碼它們的多核苷酸的制作方法
【專利摘要】本發(fā)明涉及枯草桿菌蛋白酶變體以及用于獲得枯草桿菌蛋白酶變體的方法。本發(fā)明還涉及編碼這些變體的多核苷酸;包括這些多核苷酸的核酸構(gòu)建體、載體以及宿主細(xì)胞;以及使用這些變體的方法。
【專利說(shuō)明】枯草桿菌蛋白酶變體以及編碼它們的多核苷酸
[0001] 序列表的引用
[0002] 本申請(qǐng)含有一個(gè)計(jì)算機(jī)可讀形式的序列表,該序列表通過(guò)引用結(jié)合在此。
[0003] 發(fā)明背景 發(fā)明領(lǐng)域
[0004] 本發(fā)明涉及在一種或多種特性上相對(duì)于親本枯草桿菌蛋白酶展示出改變的新穎 枯草桿菌蛋白酶變體,這些特性包括:洗滌性能、熱穩(wěn)定性、儲(chǔ)存穩(wěn)定性或催化活性。本發(fā)明 的這些變體適合用于在例如清潔或洗滌劑組合物中使用,如衣物洗滌劑組合物和餐具洗滌 劑組合物,包括自動(dòng)餐具洗滌劑組合物。本發(fā)明還涉及編碼這些變體的分離的DNA序列、表 達(dá)載體、宿主細(xì)胞以及用于產(chǎn)生和使用本發(fā)明變體的方法。
[0005] 相關(guān)技術(shù)說(shuō)明
[0006] 在洗滌劑工業(yè)中,酶在洗滌配制品中的應(yīng)用已經(jīng)超過(guò)30年。用于此類配制品的酶 包括蛋白酶、脂肪酶、淀粉酶、纖維素酶、甘露糖苷酶以及其他酶或其混合物。商業(yè)上最重要 的酶是蛋白酶。
[0007] 越來(lái)越多的商業(yè)上使用的蛋白酶是天然存在的野生型蛋白酶的蛋白質(zhì)工 程變體,例如義威 lii 丨'丨丨V'i ( Everlase) ?、Relase\ CoronaseK、OvozymeK、 波力低溫蛋白酶(Polarzyme ) 液體蛋白酶(Liquanase) ?、超級(jí)液體蛋白酶 (LiquanaseUltra)?' 和 Kannase? (諾維信公司(Novozymes a/s)),Maxacal?、 Propei'aseK、Purafast' PurafectO_XPK、FN31'、FN4l<:和Excellase' <'(杜邦/杰能 科國(guó)際公司(DuPont/Genencor International、Inc·))以及 BLAP(圖 29,US5352604)(漢 高股份有限公司(Henkel AG&Co.KGaA))。
[0008] 此外,本領(lǐng)域描述了多種變體,如在W0 04/041979(諾維信公司)中描述了相對(duì)于 親本枯草桿菌蛋白酶在例如洗滌性能、熱穩(wěn)定性、儲(chǔ)存穩(wěn)定性或催化活性方面展示出變化 的多種枯草桿菌蛋白酶變體。這些變體適合用于在例如清潔或洗滌劑組合物中使用。
[0009] 已描述多種有用的枯草桿菌蛋白酶變體,其中很多已在不同洗滌劑中提供了改進(jìn) 的活性、穩(wěn)定性以及溶解度。W0 94/02618描述了具有改進(jìn)的儲(chǔ)存穩(wěn)定性的枯草桿菌蛋白酶 變體。取代L211X和N212Z (其中X是除L以外的任何氨基酸并且Z是除N以外的任何氨 基酸)與若干其他突變一起被提及。然而,針對(duì)這些變體未顯示洗滌性能并且未提及關(guān)于 特定污物(如雞蛋污物)的信息。在本領(lǐng)域中熟知雞蛋污物特別難于完全清除并且盡管已 經(jīng)例如在W0 01/44452中描述了對(duì)雞蛋污物具有改進(jìn)性能的若干蛋白酶變體,但是對(duì)于對(duì) 各種污物(包括雞蛋污物)具有高洗滌性能的蛋白酶仍存在需要。
[0010] 因此,本發(fā)明的一個(gè)目的在于提供一種蛋白酶的與其親本蛋白酶相比具有改進(jìn)特 性的多種變體。
[0011] 發(fā)明概述
[0012] 本發(fā)明涉及具有蛋白酶活性的枯草桿菌蛋白酶變體,這些變體包括對(duì)應(yīng)于SEQ ID N0:2的Y217X和N218Z的取代,其中X和Z選自下組,該組由以下各項(xiàng)組成:K、H、R、D、E、S 以及T。因此,本發(fā)明的一個(gè)方面涉及具有蛋白酶活性的枯草桿菌蛋白酶變體,這些變體包 括對(duì)應(yīng)于SEQ ID N0:2的Y217X和N218Z的取代,其中X和Z選自下組,該組由以下各項(xiàng)組 成:K、H、R、D、E、S以及T,其中當(dāng)X是D、E、S或T時(shí),則Z也選自D、E、S或T并且其中當(dāng)X 是K、Η或R時(shí),則Z也選自K、Η或R。本發(fā)明還涉及具有蛋白酶活性的枯草桿菌蛋白酶變 體,這些變體包括對(duì)應(yīng)于SEQ ID Ν0:2的Υ217Χ和Ν218Ζ的取代,其中X和Ζ選自下組,該 組由以下各項(xiàng)組成:K、H、R、D、E、S以及Τ,并且其中當(dāng)X是D、E、S或Τ時(shí),則Ζ也選自D、 E、S或Τ,其中當(dāng)X是Κ、Η或R時(shí),則Ζ也選自Κ、Η或R,并且其中這些變體具有一個(gè)與SEQ ID Ν0:2和/或4至少60%-致的氨基酸序列。
[0013] 本發(fā)明還涉及編碼這些變體的分離的多核苷酸;包含這些多核苷酸的核酸構(gòu)建 體、載體和宿主細(xì)胞;以及產(chǎn)生這些變體的方法。
[0014] 本發(fā)明還涉及一種用于獲得具有枯草桿菌蛋白酶親本蛋白酶的蛋白酶活性的變 體的方法,該方法包括向親本枯草桿菌蛋白酶中引入對(duì)應(yīng)于SEQ ID Ν0:2的Υ217Χ和Ν218Ζ 的取代,其中X和Ζ選自下組,該組由以下各項(xiàng)組成:D、E、R、K、H、S以及Τ,其中當(dāng)X是D、 E、S或Τ時(shí),則Ζ也選自D、E、S或Τ并且其中當(dāng)X是Κ、Η或R時(shí),則Ζ也選自Κ、Η或R;回 收該變體并且測(cè)試所述變體是否具有蛋白酶活性。優(yōu)選地,這些變體與SEQ ID Ν0:2和/ 或4具有至少60%的序列一致性。本發(fā)明還涉及通過(guò)這樣的方法獲得的變體。
[0015] 本發(fā)明進(jìn)一步地涉及組合物,如清潔和洗滌劑組合物,并且涉及本發(fā)明的這類組 合物以及變體在清潔過(guò)程(如洗衣和/或餐具清洗)中的用途。
[0016] 定義
[0017] 蛋白酶:術(shù)語(yǔ)"蛋白酶"在此被定義為水解肽鍵的酶。它包括任何屬于EC3.4酶 組的酶(包括其13個(gè)亞類中的每一種)。EC編號(hào)參考加利福尼亞州(California)的圣迭 戈(San Diego)的NC-IUBMB學(xué)術(shù)出版社(Academic Press)的1992年酶命名法,分別包括 出版于歐洲生物化學(xué)期刊(Eur. J. Biochem.) 1994, 223,1-5、歐洲生物化學(xué)期刊1995, 232, 1-6、歐洲生物化學(xué)期刊1996, 237,1-5、歐洲生物化學(xué)期刊1997, 250,1-6、以及歐洲生物化 學(xué)期刊 1999, 264,610-650 的增刊 1-5。
[0018] 蛋白酶活性:術(shù)語(yǔ)"蛋白酶活性"意指蛋白質(zhì)分解活性(EC 3. 4)。本發(fā)明的蛋白酶 是內(nèi)肽酶(EC 3.4.21)。存在若干蛋白酶活性類型:三種主要的活性類型是:胰蛋白酶樣, 其中存在P1處Arg或Lys后酰胺底物的切割;糜蛋白酶樣,其中切割發(fā)生在P1處疏水性氨 基酸中的一個(gè)之后;以及彈性蛋白酶樣,在P1處Ala之后切割。出于本發(fā)明的目的,根據(jù)以 下"材料與方法(Materials and Methods)"所述的程序確定蛋白酶活性。本發(fā)明的枯草桿 菌蛋白酶變體具有SEQ ID N0:2或4的成熟多肽的蛋白酶活性的至少20%,例如至少40%、 至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、以及至少100%。
[0019] 等位基因變體:術(shù)語(yǔ)"等位基因變體"意指占用同一染色體位點(diǎn)的一種基因的兩個(gè) 或更多個(gè)替代形式中的任一者。等位基因變異由突變天然產(chǎn)生,并且可以導(dǎo)致群體內(nèi)的多 態(tài)性?;蛲蛔兛梢允庆o默的(在所編碼的多肽中沒(méi)有改變)或可編碼具有改變的氨基酸 序列的多肽。多肽的等位基因變體是由基因的等位基因變體編碼的多肽。
[0020] cDNA:術(shù)語(yǔ)"cDNA"意指可以通過(guò)從得自原核或真核細(xì)胞的成熟的、剪接的mRNA分 子反轉(zhuǎn)錄來(lái)制備的DNA分子。cDNA缺乏可以存在于相應(yīng)基因組DNA中的內(nèi)含子序列。早先 的初始RNA轉(zhuǎn)錄本是mRNA的前體,其在呈現(xiàn)為成熟的剪接的mRNA之前要經(jīng)一系列的步驟 進(jìn)行加工,包括剪接。
[0021] 編碼序列:術(shù)語(yǔ)"編碼序列"意指直接指明其多肽產(chǎn)物的氨基酸序列的多核苷酸。 編碼序列的邊界一般由開(kāi)放閱讀框架決定,該開(kāi)放閱讀框架通常以ATG起始密碼子或替代 性起始密碼子(例如GTG和TTG)開(kāi)始,并且以終止密碼子(例如TAA、TAG、和TGA)結(jié)束。 編碼序列可以是DNA、cDNA、合成或重組的多核苷酸。
[0022] 控制序列:術(shù)語(yǔ)"控制序列"意指對(duì)于表達(dá)編碼本發(fā)明變體的多核苷酸所必需的所 有部件。每個(gè)控制序列對(duì)于編碼變體的多核苷酸可以是天然的或外源的,或者彼此可以是 天然的或外源的。此類控制序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前肽序列、啟動(dòng) 子、信號(hào)肽序列、以及轉(zhuǎn)錄終止子。至少,控制序列包括啟動(dòng)子,以及轉(zhuǎn)錄和翻譯終止信號(hào)。 出于引入有利于將這些控制序列與編碼一種變體的多核苷酸的編碼區(qū)連接的特異性限制 酶切位點(diǎn)的目的,這些控制序列可以提供有多個(gè)接頭。
[0023] 表達(dá):術(shù)語(yǔ)"表達(dá)"包括涉及變體產(chǎn)生的任何步驟,包括但不限于:轉(zhuǎn)錄、轉(zhuǎn)錄后修 飾、翻譯、翻譯后修飾、以及分泌。
[0024] 表達(dá)載體:術(shù)語(yǔ)"表達(dá)載體"意指包含編碼一種變體的一種多核苷酸并可操作地連 接至提供其表達(dá)的額外核苷酸的線性或環(huán)形DNA分子。
[0025] 高嚴(yán)謹(jǐn)度條件:術(shù)語(yǔ)"高嚴(yán)謹(jǐn)度條件"是指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸的探針而 言,遵循標(biāo)準(zhǔn) DNA 印跡(Southern blotting)程序,在 42°C下在 5XSSPE、0.3% SDS、200 微 克/ml剪切并變性的鮭魚(yú)精子DNA和50%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。載體材料 最終使用2XSSC、0. 2% SDS,在65°C下洗滌三次,每次15分鐘。
[0026] 宿主細(xì)胞:術(shù)語(yǔ)"宿主細(xì)胞"意指對(duì)于用包含本發(fā)明多核苷酸的核酸構(gòu)建體或表達(dá) 載體進(jìn)行的轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等是易感的任何細(xì)胞類型。術(shù)語(yǔ)"宿主細(xì)胞"涵蓋由于復(fù)制期 間發(fā)生的突變而與親本細(xì)胞不同的親本細(xì)胞的任何后代。
[0027] 改進(jìn)的特性:術(shù)語(yǔ)"改進(jìn)的特性"意指與一種變體有關(guān)的特征,該特征相比于親本、 或者相比于具有SEQ ID N0:2的蛋白酶、或者相比于具有與所述變體一致的氨基酸序列但 是在一個(gè)或多個(gè)所述指定位置不具有變化的蛋白酶有所改進(jìn)。這類改進(jìn)的特性包括但不限 于洗滌性能、蛋白酶活性、熱活性譜、熱穩(wěn)定性、pH活性曲線、pH穩(wěn)定性、底物/輔因子特異 性、改進(jìn)的表面特性、底物特異性、產(chǎn)物特異性、在經(jīng)預(yù)處理的生物質(zhì)的存在下增加的穩(wěn)定 性(例如螯合穩(wěn)定性)或溶解度、在儲(chǔ)存條件下改進(jìn)的穩(wěn)定性、以及化學(xué)穩(wěn)定性。
[0028] 改進(jìn)的化學(xué)穩(wěn)定性:術(shù)語(yǔ)"改進(jìn)的化學(xué)穩(wěn)定性(improved chemical stability) " 在此定義為變體酶在一種或多種化學(xué)物存在下表現(xiàn)為在孵育一段時(shí)間之后仍保留酶活性, 這種或這些種化學(xué)物是天然存在的或是合成的,可降低親本酶的酶活性。改進(jìn)的化學(xué)穩(wěn)定 性還可使得這些變體在這類化學(xué)物存在下能更好地催化反應(yīng)。在本發(fā)明的一個(gè)特別的方 面,這種改進(jìn)的化學(xué)穩(wěn)定性是洗滌劑的,尤其是液體洗滌劑的一種改進(jìn)的穩(wěn)定性。當(dāng)本發(fā)明 的α淀粉酶變體與一種包括螯合劑的液體洗滌劑配制品相混合時(shí),這種改進(jìn)的洗滌劑穩(wěn) 定性特別是指該α淀粉酶活性的改進(jìn)的穩(wěn)定性,這種液體還包括膠體或糊。這種液體洗滌 劑配制品可指的是在洗衣或自動(dòng)餐具清洗過(guò)程中被加入的濃縮洗滌劑,或是稀釋洗滌劑, 如清洗液,即加入該濃縮洗滌劑的水性溶液。
[0029] 在本發(fā)明中,液體洗滌劑作為洗衣液是特別有用的。
[0030] 穩(wěn)定性:術(shù)語(yǔ)"穩(wěn)定性"包括儲(chǔ)存穩(wěn)定性和在使用過(guò)程中的穩(wěn)定性,例如在洗滌過(guò) 程中的穩(wěn)定性,并且反應(yīng)了作為時(shí)間函數(shù)的蛋白酶的穩(wěn)定性,例如當(dāng)?shù)鞍酌钢糜谌芤褐袝r(shí), 尤其是在洗滌劑溶液中時(shí),保留多少活性。這種穩(wěn)定性受到許多因素的影響,例如pH、溫度、 洗滌劑組合物,例如助洗劑的量、表面活性劑等等。
[0031] 改進(jìn)的洗滌性能:術(shù)語(yǔ)"改進(jìn)的洗滌性能"在此被定義為一種蛋白酶變體例如通過(guò) 增強(qiáng)的去污而相對(duì)于親本枯草桿菌蛋白酶變體、相對(duì)于具有SEQ ID N0:2的蛋白酶或者相 對(duì)于具有與所述變體一致的氨基酸序列但是在一個(gè)或多個(gè)所述指定位置不具有變化的蛋 白酶的洗滌性能展示蛋白酶變體的洗滌性能的變化。術(shù)語(yǔ)"洗滌性能"包括在衣物洗滌并 且例如在餐具洗滌中的洗滌性能??梢酝ㄟ^(guò)計(jì)算在"材料與方法"部分下的自動(dòng)機(jī)械應(yīng)力 測(cè)定(AMSA)的描述中定義的所謂的強(qiáng)度值(Int)來(lái)對(duì)洗滌性能進(jìn)行量化。
[0032] 改進(jìn)的蛋白酶活性:術(shù)語(yǔ)"改進(jìn)的蛋白酶活性"在此被定義為通過(guò)增加的蛋白質(zhì)轉(zhuǎn) 化而相對(duì)于(或相比于)親本蛋白酶、或相比于具有SEQ ID N0:2的蛋白酶、或者相對(duì)于具 有與所述變體一致的氨基酸序列但是在一個(gè)或多個(gè)所述指定位置不具有變化的蛋白酶的 活性展示活性改變的蛋白酶變體的改變的蛋白酶活性(如上文所定義的)。
[0033] 分離的變體:術(shù)語(yǔ)"分離的變體"意指通過(guò)人工修飾的變體。在一個(gè)方面中,通過(guò) SDS-PAGE測(cè)定,該變體具有至少1%的純度,例如至少5%的純度、至少10%的純度、至少 20 %的純度、至少40 %的純度、至少60 %的純度、至少80 %的純度、以及至少90 %的純度。 [0034] 分離的多核苷酸:術(shù)語(yǔ)"分離的多核苷酸"意指通過(guò)人工修飾的多核苷酸。在一個(gè) 方面中,通過(guò)瓊脂電泳測(cè)定,該分離的多核苷酸具有至少1%的純度,例如至少5%的純度、 至少10 %的純度、至少20 %的純度、至少40 %的純度、至少60 %的純度、至少80 %的純度、 至少90%的純度、以及至少95%的純度。多核苷酸可以是基因組來(lái)源的、cDNA來(lái)源的、RNA 來(lái)源的、半合成來(lái)源的,合成來(lái)源的、或它們的任何組合。
[0035] 低嚴(yán)謹(jǐn)度條件:術(shù)語(yǔ)"低嚴(yán)謹(jǐn)度條件"意指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸的探針 來(lái)說(shuō),遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/毫升剪切并變性 的鮭魚(yú)精子DNA和25%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。載體材料最終使用2X SSC、 0. 2% SDS,在50°C下洗滌三次,每次15分鐘。
[0036] 成熟多肽:術(shù)語(yǔ)"成熟多肽"意指在翻譯和任何翻譯后修飾如N末端加工、C末端 截短、糖基化作用、磷酸化作用等之后處于其最終形式的多肽。在一個(gè)方面,該成熟多肽與 具有SEQ ID N0:2或SEQ ID N0:4的氨基酸序列相對(duì)應(yīng)。
[0037] 成熟多肽編碼序列:術(shù)語(yǔ)"成熟多肽編碼序列"意指編碼具有蛋白酶活性的成熟 多肽的多核苷酸。在一個(gè)方面,該成熟多肽編碼序列是SEQ ID NO: 1的核苷酸322至1146, 基于 SignalP(尼爾森(Nielsen)等人,1997,蛋白質(zhì)工程學(xué)(Protein Engineering) 10: 1-6)],對(duì)編碼信號(hào)肽的SEQ ID NO: 1的核苷酸1至91進(jìn)行的預(yù)測(cè)。
[0038] 在一個(gè)方面,該成熟多肽編碼序列是SEQ ID N0:3的核苷酸577至1140,基于 SignalP(尼爾森等人,1997,蛋白質(zhì)工程學(xué)10:l-6)],對(duì)編碼信號(hào)肽的SEQIDN0:3的核苷 酸1至81進(jìn)行的預(yù)測(cè)。
[0039] 中嚴(yán)謹(jǐn)度條件:術(shù)語(yǔ)"中嚴(yán)謹(jǐn)度條件"意指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸的探針而 言,遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C在5X SSPE、0. 3% SDS、200微克/ml剪切和變性的鮭精 DNA和35%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。載體材料最終使用2X SSC、0. 2% SDS, 在55 °C下洗滌三次,每次15分鐘。
[0040] 中-高嚴(yán)謹(jǐn)度條件:術(shù)語(yǔ)"中-高嚴(yán)謹(jǐn)度條件"意指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸 的探針來(lái)說(shuō),遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/毫升剪切 并變性的鮭魚(yú)精子DNA以及或者35%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。最終在60°C 下將載體材料使用2X SSC、0. 2% SDS洗滌三次各15分鐘。
[0041] 突變體:術(shù)語(yǔ)"突變體"意指編碼一種變體的多核苷酸。
[0042] 核酸構(gòu)建體:術(shù)語(yǔ)"核酸構(gòu)建體"意指從天然存在的基因中分離的、或以自然界中 不會(huì)另外存在的方式被修飾成包含核酸片段的、或合成的單鏈或雙鏈的核酸分子。當(dāng)核酸 構(gòu)建體含有表達(dá)本發(fā)明編碼序列所需要的控制序列時(shí),術(shù)語(yǔ)核酸構(gòu)建體與術(shù)語(yǔ)"表達(dá)盒"含 義相同。
[0043] 可操作地連接:術(shù)語(yǔ)"可操作地連接"意指如下構(gòu)造,其中控制序列相對(duì)于多核苷 酸的編碼序列安置在適當(dāng)位置,這樣使得控制序列指導(dǎo)編碼序列的表達(dá)。
[0044] 親本:術(shù)語(yǔ)"親本"意指對(duì)其做出改變以產(chǎn)生本發(fā)明的酶變體的一種蛋白酶。由 此可見(jiàn),親本是與所述的變體具有相同的氨基酸序列但在一個(gè)或更多個(gè)(例如兩個(gè)或更多 個(gè))所述的指定位置上具有改變的一種蛋白酶。應(yīng)理解的是,在上下文中的"具有相同的氨 基酸序列"的表達(dá)是相對(duì)于100%的序列一致性。親本可以是天然存在的(野生型)多肽或 其變體。在一個(gè)具體實(shí)施例中,該親本是與具有SEQ ID N0:2或4的多肽具有至少60%的 一致性,例如至少65%、至少70%、至少75%、至少80%、至少81 %、至少82%、至少83%、 至少84%、至少85%、至少90%、至少91 %、至少92%、至少93%、至少94%、至少95%、至 少96%、至少97%、至少98%、至少99%、或100%的一致性的蛋白酶。
[0045] 序列一致性:兩個(gè)氨基酸序列之間或兩個(gè)核苷酸序列之間的相關(guān)性由參數(shù)"序 列一致性"描述。出于本發(fā)明的目的,使用尼德曼-翁施(Needleman-Wunsch)算法來(lái) 確定在兩個(gè)氨基酸序列之間的序列一致性的程度(尼德曼與翁施,1970,分子生物學(xué)雜 志(J· Mol. Biol.) 48:443-453),如在EMBOSS軟件包的尼德?tīng)枺∟eedle)程序所實(shí)現(xiàn)的 (EMBOSS :歐洲分子生物學(xué)開(kāi)放軟件包(The European Molecular Biology Open Software Suite),賴斯(Rice)等人,2000,遺傳學(xué)趨勢(shì)(Trends Genet. ) 16 :276-277),優(yōu)選的是版 本3. 0. 0或更新的版本。所使用的這些任選參數(shù)是空位開(kāi)放罰分10、空位延伸罰分0. 5,及 EBL0SUM62 (BL0SUM62的EMBOSS版本)取代矩陣。尼德?tīng)枠?biāo)注的"最長(zhǎng)的一致性"的輸出 (使用-非簡(jiǎn)化選項(xiàng)獲得)被用作百分比一致性,并且如下計(jì)算:
[0046] (一致的殘基X 100V(比對(duì)長(zhǎng)度-比對(duì)中的空位總數(shù))
[0047] 比對(duì)長(zhǎng)度優(yōu)選是至少150個(gè)氨基酸殘基、至少175個(gè)氨基酸殘基、至少200個(gè)氨基 酸殘基、至少220個(gè)氨基酸殘基、至少240個(gè)氨基酸殘基或至少260個(gè)氨基酸殘基。
[0048] 出于本發(fā)明的目的,采用尼德曼-翁施算法來(lái)確定在兩種脫氧核苷酸序列之間的 序列一致性的程度(尼德曼與翁施,1970,同上),如在EMBOSS軟件包的尼德?tīng)柍绦蛩鶎?shí) 現(xiàn)的(EMBOSS :歐洲分子生物學(xué)開(kāi)放軟件包,賴斯等人,2000,同上),優(yōu)選的是版本3. 0. 0 或更新的版本。使用的任選參數(shù)是空位開(kāi)放罰分10,空位延伸罰分〇. 5及EDNAFULL(NCBI NUC4. 4的EMBOSS版本)取代矩陣。尼德?tīng)枠?biāo)注的"最長(zhǎng)的一致性"的輸出(使用-非簡(jiǎn)化 選項(xiàng)獲得)被用作百分比一致性,并且如下計(jì)算:
[0049] (一致的脫氧核糖核苷酸X 100V (比對(duì)長(zhǎng)度-比對(duì)中的空位總數(shù))
[0050] 比對(duì)長(zhǎng)度優(yōu)選是至少450個(gè)核苷酸、至少525個(gè)核苷酸、至少600個(gè)核苷酸、至少 660個(gè)核苷酸、至少720個(gè)核苷酸或至少840個(gè)核苷酸。
[0051] 基本上純的變體:術(shù)語(yǔ)"基本上純的變體"意指包含按重量計(jì)至多10%、至多8%、 至多6%、至多5%、至多4%、至多3%、至多2%、至多1 %、以及至多0. 5%的其他多肽材 料的制劑,這些其他多肽材料是與其天然或重組地相關(guān)的。優(yōu)選的是,在該制劑中存在的全 部多肽材料中,該變體具有至少92%的純度、例如至少94%的純度、至少95%的純度、至少 96%的純度、至少97%的純度、至少98%的純度、至少99%的純度、至少99. 5%的純度、以 及100%的純度(按重量計(jì))。本發(fā)明的這些變體優(yōu)選以一種基本上純的形式存在??赏?過(guò)例如用熟知的重組方法或經(jīng)典純化方法來(lái)制備該變體來(lái)完成。
[0052] 基本上純的多核苷酸:術(shù)語(yǔ)"基本上純的多核苷酸"意指不含其他外部或不想要的 核苷酸并且處在適用于基因工程化多肽生產(chǎn)系統(tǒng)內(nèi)部的形式的多核苷酸制劑。因而,基本 上純的多核苷酸包含按重量計(jì)最多10%、最多8%、最多6%、最多5%、最多4%、最多3%、 最多2%、最多1%和最多0. 5%與該多核苷酸天然或重組結(jié)合的其他多核苷酸物質(zhì)。然而, 基本上純的多核苷酸可包括天然存在的5'和3' -非翻譯區(qū),如啟動(dòng)子和終止子。優(yōu)選的 是,基本上純的多核苷酸具有至少90%的純度,例如至少92%的純度、至少94%的純度、至 少95 %的純度、至少96 %的純度、至少97 %的純度、至少98 %的純度、至少99 %的純度、以 及至少99. 5%的純度(按重量計(jì))。本發(fā)明的多核苷酸優(yōu)選以一種基本上純的形式存在。
[0053] 變體:術(shù)語(yǔ)"變體"意指具有蛋白酶活性的相比于其親本在一個(gè)或多個(gè)(或一個(gè)或 若干個(gè))位置包含一個(gè)變化即取代、插入、和/或缺失的多肽,該親本是具有與所述變體一 致的氨基酸序列但是在一個(gè)或多個(gè)所述指定位置不具有所述變化的蛋白酶。取代意為將占 據(jù)了一個(gè)位置的氨基酸用另一個(gè)不同的氨基酸來(lái)代替;缺失意為將占據(jù)了一個(gè)位置的氨基 酸去除;并且插入意為加入氨基酸,例如1至10個(gè)氨基酸,如9個(gè)氨基酸、如8個(gè)氨基酸、如 7個(gè)氨基酸、如6個(gè)氨基酸、如5個(gè)氨基酸、如4個(gè)氨基酸,優(yōu)選的是1-3個(gè)氨基酸,更優(yōu)選的 是1-2個(gè)氨基酸,最優(yōu)選的是與占據(jù)了一個(gè)位置的氨基酸相鄰的兩個(gè)氨基酸。
[0054] 非常高嚴(yán)謹(jǐn)度條件:術(shù)語(yǔ)"非常高嚴(yán)謹(jǐn)度條件"是指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸 的探針而言,遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并 變性的鮭魚(yú)精子DNA和50%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。載體材料最終使用2X SSC、0. 2% SDS,在70°C下洗滌三次,每次15分鐘。
[0055] 非常低嚴(yán)謹(jǐn)度條件:術(shù)語(yǔ)"非常低嚴(yán)謹(jǐn)度條件"是指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸 的探針而言,遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并 變性的鮭魚(yú)精子DNA和25%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。載體材料最終使用2X SSC、0. 2% SDS,在45°C下洗滌三次,每次15分鐘。
[0056] 洗滌性能:術(shù)語(yǔ)"洗滌性能"被用作酶在例如洗滌(如衣物洗滌或硬表面清潔)過(guò) 程中除去存在于有待清潔的物體上的污物的能力。洗滌性能上的改進(jìn)可以通過(guò)計(jì)算如在此 處的材料與方法所述的AMSA測(cè)定中定義的所謂強(qiáng)度值(Int)來(lái)定量。也參見(jiàn)在此的實(shí)例 2中的洗滌性能測(cè)試。
[0057] 野生型蛋白酶:術(shù)語(yǔ)"野生型蛋白酶"意指由天然存在的有機(jī)體(例如在自然界中 發(fā)現(xiàn)的細(xì)菌、古生菌、酵母、真菌、植物或動(dòng)物)表達(dá)的一種蛋白酶。野生型蛋白酶的實(shí)例是 BPN'(SEQ ID N0:2)或賽威蛋白酶(Savinase) (SEQ ID N0:4)。
[0058] 轉(zhuǎn)錄啟動(dòng)子:術(shù)語(yǔ)"轉(zhuǎn)錄啟動(dòng)子"用于指為促進(jìn)特定基因的轉(zhuǎn)錄的一個(gè)DNA區(qū)域的 啟動(dòng)子。轉(zhuǎn)錄啟動(dòng)子典型地位于它們所調(diào)節(jié)的基因附近,在相同鏈上并且在上游(朝向有 義鏈的5'區(qū)域)。
[0059] 轉(zhuǎn)錄終止子:術(shù)語(yǔ)"轉(zhuǎn)錄終止子"用于指標(biāo)記基因結(jié)束的基因序列區(qū)段或者供轉(zhuǎn)錄 的基因組DNA上的操縱子。
[0060] 變體命名慣例
[0061] 出于本發(fā)明的目的,在SEQ ID N0:2中披露的成熟多肽是用于確定在另一個(gè)枯草 桿菌蛋白酶中的相應(yīng)氨基酸殘基。將另一種枯草桿菌蛋白酶的氨基酸序列與SEQ ID N0:2 中披露的成熟多肽比對(duì),并且基于該比對(duì),使用在EMBOSS包(EMBOSS :歐洲分子生物學(xué)開(kāi)發(fā) 軟件套,賴斯等人,2000,遺傳學(xué)趨勢(shì)16:276-277)(優(yōu)選版本5. 0. 0或更新版本)的尼德?tīng)?程序中實(shí)施的尼德曼-翁施算法(尼德曼和翁施,1970,分子生物學(xué)雜志48:443-453)確定 與SEQ ID N0:2中所披露的成熟多肽的任何氨基酸殘基相對(duì)應(yīng)的氨基酸位置編號(hào)。使用的 參數(shù)是空位開(kāi)放罰分10、空位延伸罰分0. 5、以及EBL0SUM62 (BL0SUM62的EMBOSS版)取代 矩陣。
[0062] 在另一種枯草桿菌蛋白酶中的對(duì)應(yīng)的氨基酸殘基的識(shí)別可通過(guò)采用幾種計(jì)算 機(jī)程序與多種多肽序列進(jìn)行比對(duì)來(lái)確定,這些計(jì)算機(jī)程序包括但不限于MUSCLE(對(duì)數(shù) 預(yù)期的多序列比較;版本3. 5或更新的版本;埃德加(Edgar) ,2004,核酸研究(Nucleic Acids Research) 32 :1792-1797),MAFFT (版本 6. 857 或更新的版本;加藤(Katoh)與 庫(kù)瑪(Kuma),2002,核酸研究30 :3059-3066 ;加藤等人,2005,核酸研究33 :511-518 ; 加藤與淘(Toh),2007,生物信息學(xué)(Bioinformatics) 23 :372-374 ;加藤等人,2009,分 子生物學(xué)方法(Methods in Molecular Biology)537:39-64;加藤與淘,2010,生物信 息學(xué) 26:1899-1900),以及采用ClustalW的EMB0SSEMMA(1.83或更新的版本;托馬森 (Thompson)等人,1994,核酸研究22 :4673-4680),應(yīng)用其各自的默認(rèn)參數(shù)。
[0063] 當(dāng)其他酶與SEQ ID N0:2的成熟多肽相背離使得傳統(tǒng)的基于序列的比較方法不 能檢測(cè)其相互關(guān)系時(shí)(Lindahl (林達(dá)爾)和Elofsson (埃洛弗松),2000,分子生物學(xué)雜 志)295 :613-615),可應(yīng)用其他成對(duì)序列比較算法。在基于序列的搜索中的更大靈敏度可 以使用搜索程序來(lái)獲得,這些搜索程序利用多肽家族的概率表示(特征曲線)來(lái)搜索數(shù)據(jù) 庫(kù)。例如,PSI-BLAST程序通過(guò)一個(gè)迭代數(shù)據(jù)庫(kù)搜索過(guò)程來(lái)產(chǎn)生多個(gè)特征曲線并且能夠檢測(cè) 遠(yuǎn)距離同源物(阿特休爾(Atschul)等人,1997,核酸研究25:3389-3402)。如果多肽的家族 或超家族在蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)中具有一個(gè)或多個(gè)代表,則可以實(shí)現(xiàn)甚至更大的靈敏度。程序 (例如 GenTHREADER)(瓊斯(Jones),1999,分子生物學(xué)雜志 287:797-815 ;麥谷芬(McGuffi) 和瓊斯,2003,生物信息學(xué)19:874-881)利用來(lái)自多種來(lái)源(PSI-BLAST,二級(jí)結(jié)構(gòu)預(yù)測(cè)、結(jié) 構(gòu)比對(duì)特征曲線、以及溶劑化可能性)的信息作為預(yù)測(cè)查詢序列的結(jié)構(gòu)折疊的神經(jīng)網(wǎng)絡(luò)的 輸入。類似地,高夫(Gough)等人,2000,分子生物學(xué)雜志313:903-919的方法可以用于比 對(duì)未知結(jié)構(gòu)的序列與存在于SC0P數(shù)據(jù)庫(kù)中的超家族模型。這些比對(duì)進(jìn)而可以用于產(chǎn)生多 肽的同源性模型,并且使用出于該目的而開(kāi)發(fā)的多種工具可以評(píng)定這類模型的準(zhǔn)確度。 [0064] 對(duì)于已知結(jié)構(gòu)的蛋白,若干工具和資源可用于檢索并產(chǎn)生結(jié)構(gòu)比對(duì)。例如,蛋 白的SC0P超家族已經(jīng)在結(jié)構(gòu)上進(jìn)行比對(duì),并且那些比對(duì)是可訪問(wèn)的并且可下載的。使 用多種算法(例如距離比對(duì)矩陣(赫爾姆(Holm)和桑德?tīng)枺⊿ander),1998,蛋白雜志 (Proteins) 33:88-96)或者組合擴(kuò)展(辛迪亞洛夫(Shindyalov)和伯恩(Bourne) ,1998, 蛋白質(zhì)工程學(xué)11:739-747))可以比對(duì)兩個(gè)或更多個(gè)蛋白結(jié)構(gòu),并且可以額外利用這些算 法的實(shí)施來(lái)隨所感興趣的結(jié)構(gòu)查詢結(jié)構(gòu)數(shù)據(jù)庫(kù)以便發(fā)現(xiàn)可能的結(jié)構(gòu)同源物(例如,赫爾姆 和帕克(Park),2000,生物信息學(xué)16:566-567)。
[0065] 在描述本發(fā)明的變體中,以下所述的命名法適于方便參考。使用公認(rèn)的IUPAC單 字母或三字母氨基酸縮寫。
[0066] 取代。對(duì)于氨基酸取代,使用以下命名法:原始氨基酸、位置、取代的氨基酸。因此, 在位置226處的蘇氨酸被丙氨酸取代表示為"Thr226Ala"或者"T226A"。多個(gè)突變由加號(hào) (" + ")分開(kāi),例如"Gly205Arg+Ser411Phe"或者"G205R+S411F"代表分別在位置205和位 置411處的甘氨酸(G)被精氨酸(R)并且絲氨酸(S)被苯丙氨酸(F)取代。
[0067] 缺失。對(duì)于氨基酸缺失,使用以下命名法:原始氨基酸、位置、*。因此,在位置 195處的甘氨酸缺失表示為"Glyl95*"或者"G195*"。多個(gè)缺失由加號(hào)(" + ")分開(kāi),例如 "Glyl95*+Ser411*,,或 "G195*+S411*,,。
[0068] 插入。對(duì)于氨基酸插入,使用以下命名法:原始氨基酸、位置、原始氨基酸、插入 的氨基酸。因此,在位置195處的甘氨酸之后插入賴氨酸被表示為"Glyl95GlyLys"或者 "G195GK"。多個(gè)氨基酸的插入被表示為[原始氨基酸、位置、原始氨基酸、插入的氨基酸#1、 插入的氨基酸#2 ;等]。例如,在位置195處的甘氨酸之后插入賴氨酸和丙氨酸被表示為 "Glyl95GlyLysAla" 或 "G195GKA"。
[0069] 在這類情況下,通過(guò)將小寫字母添加至在所插入的一個(gè)或多個(gè)氨基酸殘基之前的 氨基酸殘基的位置編號(hào)中來(lái)對(duì)所插入的一個(gè)或多個(gè)氨基酸殘基進(jìn)行編號(hào)。在以上實(shí)例中, 該序列因此將是:
[0070]
【權(quán)利要求】
1. 一種具有蛋白酶活性的枯草桿菌蛋白酶變體,該變體包括對(duì)應(yīng)于SEQ ID N0:2的 Y217X和N218Z的取代,其中X和Z選自下組,該組由以下各項(xiàng)組成:K、H、R、D、E、S#&T, 其中當(dāng)X是K、H或R時(shí),則Z也選自K、H或R,并且其中當(dāng)X是D、E、S或T時(shí),則Z也選自 D、 E、S 或 T。
2. 根據(jù)權(quán)利要求1所述的變體,其中X和Z是相同的氨基酸。
3. 根據(jù)權(quán)利要求2所述的變體,其中X和Z是D或E。
4. 根據(jù)權(quán)利要求2所述的變體,其中X和Z是K或R。
5. 如權(quán)利要求1-4中任一項(xiàng)所述的變體,該變體與SEQ ID NO: 2或4的成熟多肽具有至 少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、 至少96%、至少97%、至少98%、或至少99%、但小于100%的序列一致性。
6. 如權(quán)利要求5所述的變體,其中比對(duì)長(zhǎng)度是至少150個(gè)氨基酸殘基、至少175個(gè)氨 基酸殘基、至少200個(gè)氨基酸殘基、至少220個(gè)氨基酸殘基、至少240個(gè)氨基酸殘基或至少 260個(gè)氨基酸殘基。
7. 如權(quán)利要求1-6中任一項(xiàng)所述的變體,其中該變體是由150至350個(gè)氨基酸組成的, 例如 175 至 330、200 至 310、220 至 300、240 至 290、260 至 280、270 至 275 個(gè)氨基酸。
8. 如權(quán)利要求1-7中任一項(xiàng)所述的變體,其中改變的個(gè)數(shù)是1-20,例如1-10和1-5,如 1、2、3、4、5、6、7、8、9 或 10 個(gè)改變。
9. 如權(quán)利要求1-8中任一項(xiàng)所述的變體,該變體包括選自下組的取代中的任一個(gè), 該組由以下各項(xiàng)組成:[Y217D+N218D]、[Y217E+N218E]、[Y217D+N218E]、[Y217E+N218D]、 [Y217E+N218S]、 [Y217S+N218E]、 [Y217S+N218S]、 [Y217D+N218S]、 [Y217S+N218D]、 [Y217E+N218T]、 [Y217T+N218E]、 [Y217T+N218T]、 [Y217D+N218T]、 [Y217T+N218D] [Y217K+N218K]、 [Y217R+N218R]、 [Y217K+N218R]、 [Y217R+N218K]、 [Y217R+N218H]、 [Y217H+N218R]、 [Y217H+N218H]、 [Y217K+N218H]、 [Y217H+N218K]。
10. 如權(quán)利要求1-9中任一項(xiàng)所述的變體,該變體相比于該親本或者相比于具有SEQ ID NO:2的蛋白酶對(duì)雞蛋污物具有改進(jìn)的洗滌性能。
11. 一種包括如權(quán)利要求1-10中任一項(xiàng)所述的變體的組合物。
12. -種用于獲得枯草桿菌蛋白酶親本蛋白酶的變體的方法,該方法包括向一種親本 枯草桿菌蛋白酶中引入對(duì)應(yīng)于SEQ ID N0:2的Y217X和N218Z的取代,其中X和Z選自下 組,該組由以下各項(xiàng)組成:D、E、R、K、H、S以及T,其中當(dāng)X是D、E、S或T時(shí),則Z也選自D、 E、 S或T,并且其中當(dāng)X是K、H或R時(shí),則Z也選自K、H或R ;回收該變體并且測(cè)試所述變體 是否具有蛋白酶活性。
13. 如權(quán)利要求12的方法,其中該親本蛋白酶枯草桿菌蛋白酶選自下組,該組由以下 各項(xiàng)組成: a. 與SEQ ID N0:2或4的成熟多肽具有至少60%序列一致性的一種多肽; b. 由一種多核苷酸編碼的一種多肽,該多核苷酸在低嚴(yán)謹(jǐn)度條件下與(i)SEQ ID NO: 1 或3的成熟多肽編碼序列、(ii)其cDNA序列、或(iii)⑴或(ii)的全長(zhǎng)互補(bǔ)體雜交; c. 由一種多核苷酸編碼的一種多肽,該多核苷酸與SEQ ID N0:1或3的成熟多肽編碼 序列或其cDNA序列具有至少60%的一致性;以及 d. SEQ ID N0:2或4的成熟多肽的一個(gè)片段,該片段具有蛋白酶活性。
14. 如權(quán)利要求13所述的方法,其中該親本枯草桿菌蛋白酶與SEQ ID N0:2或4的成熟 多肽具有至少60 %,例如至少65 %、至少70 %、至少75 %、至少80 %、至少85 %、至少90 %、 至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性。
15. 如權(quán)利要求14所述的方法,其中比對(duì)長(zhǎng)度是至少150個(gè)氨基酸殘基、至少175個(gè)氨 基酸殘基、至少200個(gè)氨基酸殘基、至少220個(gè)氨基酸殘基、至少240個(gè)氨基酸殘基或至少 260個(gè)氨基酸殘基。
16. -種通過(guò)如權(quán)利要求14或15所述的方法獲得的枯草桿菌蛋白酶親本蛋白酶的變 體。
【文檔編號(hào)】C12N9/54GK104114698SQ201380009379
【公開(kāi)日】2014年10月22日 申請(qǐng)日期:2013年2月14日 優(yōu)先權(quán)日:2012年2月17日
【發(fā)明者】W.貝森馬特, M.馬爾滕, A.貝尼 申請(qǐng)人:諾維信公司