具有過氧合酶活性的多肽的制作方法
【專利說明】具有過氧合酶活性的多肽
[0001] 對(duì)序列表的引用
[0002] 本申請(qǐng)包括一個(gè)計(jì)算機(jī)可讀形式的序列表,將其通過引用結(jié)合在此。
[0003] 背景 發(fā)明領(lǐng)域
[0004] 本發(fā)明涉及具有過氧合酶(peroxygenase)活性的多肽和編碼這些多肽的多核苷 酸。本發(fā)明還涉及核酸構(gòu)建體、載體以及包括這些多核苷酸的宿主細(xì)胞連同產(chǎn)生和使用這 些多肽的方法。
[0005] 相關(guān)技術(shù)說明
[0006] WO 2006/034702 Al披露了使用茶樹菇TM Al的AaP過氧合酶來酶促羥基化未活 化的烴(例如,萘、甲苯和環(huán)己烷)的方法。這也描述于烏爾里克(Ullrich)和霍夫里克特 (Hofrichter),2005,歐洲生化學(xué)會(huì)聯(lián)合會(huì)快報(bào)(FEBS Letters) 579:6247-6250 中。
[0007] DE 103 32 065 Al披露了用于通過使用茶樹菇TM Al的AaP過氧合酶通過醛的中 間形成從醇中酶法制備酸的方法。
[0008] 報(bào)道了用于通過該AaP過氧合酶而快速和選擇性地以分光光度計(jì)直接檢測(cè)芳香 族羥基化的方法(克盧格(Kluge)等人,2007,應(yīng)用微生物學(xué)和生物技術(shù)(Appl Microbiol Biotechnol)75:1473-1478)。
[0009] 從嗜奠真菌福毛鬼傘(Coprinus radians)中分離了另一種能夠進(jìn)行芳香族過氧 合化(peroxygenation)的過氧合酶并對(duì)其進(jìn)行了表征,鑒定了 N-末端16個(gè)氨基酸并與較 早公布的茶樹菇的AaP酶的N-末端14個(gè)氨基酸進(jìn)行了比對(duì);但是未分離編碼基因(安赫 (Anh)等人,2007,應(yīng)用與環(huán)境微生物學(xué)(Appl Env Microbiol) 73 (17) :5477-5485)。
[0010] WO 2008/119780披露了若干種不同的過氧合酶多肽及其編碼多核苷酸連同其重 組產(chǎn)生。
[0011] WO 2011/120938披露了使用過氧合酶多肽的脂肪烴的位點(diǎn)特異性羥基化。
[0012] 本發(fā)明提供了具有過氧合酶活性的新穎多肽和編碼這些多肽的多核苷酸。
[0013] 發(fā)明概述
[0014] 本發(fā)明涉及具有過氧合酶活性的分離的多肽,這些分離的多肽選自下組,該組由 以下各項(xiàng)組成:
[0015] (a) -種多肽,該多肽與SEQ ID NO:2的成熟多肽具有至少60%的序列一致性;
[0016] (b) -種由以下多核苷酸編碼的多肽,該多核苷酸在中嚴(yán)謹(jǐn)度條件下與⑴SEQ ID NO: 1的成熟多肽編碼序列、(ii)其cDNA序列、或(iii) (i)或(ii)的全長(zhǎng)互補(bǔ)體雜交;
[0017] (c)-種由以下多核苷酸編碼的多肽,該多核苷酸與SEQ ID NO: 1的成熟多肽編碼 序列、或其cDNA序列具有至少60%序列一致性;
[0018] (d)SEQ ID N0:2的成熟多肽的一種變體,該變體在一個(gè)或多個(gè)(例如,若干個(gè))位 置處包括取代、缺失、和/或插入;以及
[0019] (e) (a)、(b)、(c)或(d)的多肽的一個(gè)片段,該片段具有過氧合酶活性。
[0020] 本發(fā)明還涉及編碼本發(fā)明的多肽的分離的多核苷酸;核酸構(gòu)建體;重組表達(dá)載 體;包括這些多核苷酸的重組宿主細(xì)胞;以及產(chǎn)生這些多肽的方法。
[0021] 本發(fā)明還涉及使用本發(fā)明的多肽的方法。
[0022] 本發(fā)明還涉及一種編碼信號(hào)肽的多核苷酸,該信號(hào)肽包括SEQ ID NO:2的氨基 酸-18至-1或由其組成,該多核苷酸被可操作地連接至編碼一種蛋白質(zhì)的基因;包括這些 多核苷酸的核酸構(gòu)建體、表達(dá)載體和重組宿主細(xì)胞;以及產(chǎn)生一種蛋白質(zhì)的方法。
[0023] 定義
[0024] 過氧合酶(Peroxygenase):術(shù)語"過氧合酶"意指根據(jù)EC 1. 11. 2. 1的一種"非特 異性過氧合酶"活性,其催化來自H2O2的一個(gè)氧原子插入多種底物(例如硝基苯并二噁茂) 中。出于本發(fā)明的目的,過氧合酶活性是根據(jù)描述于實(shí)例2,或描述于以下中的程序確定的: M.波拉杰-可比爾斯考(Poraj-Kobielska),Μ·金尼(Kinne),R.烏爾里克(Ullrich),Κ·詩 切布內(nèi)爾(Scheibner),Μ.霍夫里克特(Hofrichter),"用于檢測(cè)真菌過氧合酶的分光光度 計(jì)測(cè)定(A spectrophotometric assay for the detection of fungal peroxygenases) ", 分析生物化學(xué)(Analytical Biochemistry) (2012),第 421 卷,第 I 期,第 327 - 329 頁。
[0025] 在一個(gè)方面中,本發(fā)明的這些多肽(過氧合酶)具有SEQ ID N0:2的成熟多肽的至 少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95% 或至少100%的過氧合酶活性。
[0026] 等位基因變體:術(shù)語"等位基因變體"意指占據(jù)同一染色體基因座的基因的兩種或 更多種可替代形式中的任一種。等位基因變異由突變天然產(chǎn)生,并且可以導(dǎo)致群體內(nèi)的多 態(tài)性?;蛲蛔兛梢允浅聊模ㄔ谒幋a的多肽中沒有改變)或可編碼具有改變的氨基酸 序列的多肽。多肽的等位基因變體是由基因的等位基因變體編碼的多肽。
[0027] cDNA :術(shù)語"cDNA"意指可以通過反轉(zhuǎn)錄從得自真核或原核細(xì)胞的成熟的、已剪接 的mRNA分子制備的DNA分子。cDNA缺乏可以存在于相應(yīng)基因組DNA中的內(nèi)含子序列。早 先的初始RNA轉(zhuǎn)錄本是mRNA的前體,其在呈現(xiàn)為成熟的剪接的mRNA之前要經(jīng)一系列的步 驟進(jìn)行加工,包括剪接。
[0028] 編碼序列:術(shù)語"編碼序列"意指直接指定一個(gè)多肽的氨基酸序列的多核苷酸。編 碼序列的邊界一般由一個(gè)開放閱讀框架決定,該開放閱讀框架從一個(gè)起始密碼子(如ATG、 GTG或TTG)開始并且以一個(gè)終止密碼子(如TAA、TAG或TGA)結(jié)束。編碼序列可以是一種 基因組DNA、cDNA、合成DNA或其組合。
[0029] 控制序列:術(shù)語"控制序列"意指對(duì)于表達(dá)編碼本發(fā)明的成熟多肽的多核苷酸所必 需的核酸序列。每個(gè)控制序列對(duì)于編碼該多肽的多核苷酸來說可以是天然的(即,來自相 同基因)或外源的(即,來自不同基因),或相對(duì)于彼此是天然的或外源的。此類控制序列 包括但不限于前導(dǎo)子、聚腺苷酸化序列、前肽序列、啟動(dòng)子、信號(hào)肽序列、以及轉(zhuǎn)錄終止子。 至少,控制序列包括啟動(dòng)子,以及轉(zhuǎn)錄和翻譯終止信號(hào)。出于引入有利于將這些控制序列與 編碼一種多肽的多核苷酸的編碼區(qū)連接的特異性限制酶切位點(diǎn)的目的,這些控制序列可以 提供有多個(gè)接頭。
[0030] 表達(dá):術(shù)語"表達(dá)"包括涉及多肽產(chǎn)生的任何步驟,包括但不限于,轉(zhuǎn)錄、轉(zhuǎn)錄后修 飾、翻譯、翻譯后修飾、以及分泌。
[0031] 表達(dá)載體:術(shù)語"表達(dá)載體"意指線性或環(huán)狀DNA分子,該分子包括編碼多肽的多 核苷酸并且該多核苷酸可操作地與提供用于其表達(dá)的控制序列相連接。
[0032] 片段:術(shù)語"片段"意指具有從成熟多肽或結(jié)構(gòu)域的氨基和/或羧基末端缺失的一 個(gè)或多個(gè)(例如,若干個(gè))氨基酸的多肽或催化結(jié)構(gòu)域;其中該片段具有過氧合酶活性。在 一個(gè)方面中,一個(gè)片段包含至少230個(gè)氨基酸殘基(例如,SEQ ID NO:2的氨基酸1至230 或SEQ ID NO:2的氨基酸20至230)、至少220個(gè)氨基酸殘基(例如,SEQ ID NO:2的氨基 酸1至220或SEQ ID NO: 2的氨基酸20至220)或至少210個(gè)氨基酸殘基(例如,SEQ ID NO:2的氨基酸1至210或SEQ ID NO:2的氨基酸20至210)。
[0033] 高嚴(yán)謹(jǐn)度條件:術(shù)語"高嚴(yán)謹(jǐn)度條件"意指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸的探針而 言,遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的鮭 魚精子DNA和50%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。載體材料最終使用2X SSC、0. 2% SDS,在65 °C下洗滌三次,每次15分鐘。
[0034] 宿主細(xì)胞:術(shù)語"宿主細(xì)胞"意指任何細(xì)胞類型,該細(xì)胞類型對(duì)于用包含本發(fā)明的 多核苷酸的核酸構(gòu)建體或表達(dá)載體進(jìn)行轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等是易感的。術(shù)語"宿主細(xì)胞"涵 蓋由于復(fù)制期間發(fā)生的突變而與親本細(xì)胞不同的親本細(xì)胞的任何后代。
[0035] 分離的:術(shù)語"分離的"意指處于自然界中不出現(xiàn)的形式或環(huán)境中的物質(zhì)。分離的 物質(zhì)的非限制性實(shí)例包括(1)任何非天然存在的物質(zhì);(2)至少部分地從與其在自然界中 相關(guān)聯(lián)的一種或多種或全部天然存在的組分中除去的任何物質(zhì),包括但不局限于任何酶、 變體、核酸、蛋白質(zhì)、肽或輔因子;(3)相對(duì)于自然界中發(fā)現(xiàn)的那種物質(zhì)通過人工手動(dòng)修飾 的任何物質(zhì);或者(4)通過相對(duì)于與其天然相關(guān)聯(lián)的其他組分增加該物質(zhì)的量而修飾的任 何物質(zhì)(例如,編碼該物質(zhì)的基因的多個(gè)拷貝;比與編碼該物質(zhì)的基因天然相關(guān)聯(lián)的啟動(dòng) 子更強(qiáng)的啟動(dòng)子的使用)。一種分離的物質(zhì)可以存在于發(fā)酵液樣品中。
[0036] 低嚴(yán)謹(jǐn)度條件:術(shù)語"低嚴(yán)謹(jǐn)度條件"意指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸的探針而 言,遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的鮭 魚精子DNA和25%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。載體材料最終使用2X SSC、0. 2% SDS,在50 °C下洗滌三次,每次15分鐘。
[0037] 成熟多肽:術(shù)語"成熟多肽"意指在翻譯和任何翻譯后修飾如N-末端加工、C-末 端截短、糖基化作用、磷酸化作用等之后處于其最終形式的多肽。在一個(gè)方面中,基于預(yù)測(cè) SEQ ID N0:2的氨基酸-18至-1是信號(hào)肽的SignalP 3.0程序,成熟多肽是SEQ ID N0:2 的氨基酸1至237。本領(lǐng)域中已知的是,一個(gè)宿主細(xì)胞可以產(chǎn)生由同一多核苷酸表達(dá)的兩種 或更多種不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)的混合物。
[0038] 成熟多肽編碼序列:術(shù)語"成熟多肽編碼序列"意指編碼具有過氧合酶活性的成熟 多肽的一種多核苷酸。在一個(gè)方面中,基于預(yù)測(cè)SEQ ID NO: 1的核苷酸1至54編碼信號(hào)肽 的SignalP 3.0程序,成熟多肽編碼序列是SEQ ID NO: 1的核苷酸55至91、170至682以 及751至911,或其cDNA序列。
[0039] 中嚴(yán)謹(jǐn)度條件:術(shù)語"中嚴(yán)謹(jǐn)度條件"意指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸的探針而 言,遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的鮭 魚精子DNA和35%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。載體材料最終使用2X SSC、0. 2% SDS,在55 °C下洗滌三次,每次15分鐘。
[0040] 中-高嚴(yán)謹(jǐn)度條件:術(shù)語"中-高嚴(yán)謹(jǐn)度條件"意指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸 的探針而言,遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5XSSPE、0. 3% SDS、200微克/ml剪切并 變性的鮭魚精子DNA和35%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。載體材料最終使用2X SSC、0. 2% SDS,在60°C下洗滌三次,每次15分鐘。
[0041] 核酸構(gòu)建體:術(shù)語"核酸構(gòu)建體"意指單鏈或雙鏈的一種核酸分子,該核酸分子是 從天然存在的基因中分離的,或者以一種本來不存在于自然界中的方式被修飾成含有核酸 的區(qū)段,或者是合成的,該核酸分子包含一個(gè)或多個(gè)控制序列。
[0042] 可操作地連接:術(shù)語"可操作地連接"意指如下的構(gòu)造,其中,控制序列相對(duì)于多核 苷酸的編碼序列安置在適當(dāng)位置處,從而使得該控制序列指導(dǎo)該編碼序列的表達(dá)。
[0043] 序列一致性:兩個(gè)氨基酸序列之間或者兩個(gè)核苷酸序列之間的關(guān)聯(lián)度通過參數(shù) "序列一致性"來描述。
[0044] 出于本發(fā)明的目的,使用如在EMBOSS包(EMBOSS :歐洲分子生物學(xué)開放軟件套件 (The European Molecular Biology Open Software Suite),賴斯(Rice)等人,2000,遺 傳學(xué)趨勢(shì)(Trends Genet.) 16:276-277)(優(yōu)選5.0.0版或更新版本)的尼德爾(Needle) 程序中所實(shí)施的尼德爾曼-翁施(Needleman-Wunsch)算法(Needleman (尼德爾曼)和 Wunsch(翁施),1970,分子生物學(xué)雜志(J. Mol. Biol. )48:443-453)來確定兩個(gè)氨基酸 序列之間的序列一致性。使用的這些參數(shù)是空位開放罰分10、空位延伸罰分0.5,以及 EBL0SUM62(BL0SUM62的EMBOSS版本)取代矩陣。尼德爾標(biāo)注"最長(zhǎng)的一致性"的輸出(使 用-非簡(jiǎn)化選項(xiàng)獲得)被用作百分比一致性,并且如下計(jì)算:
[0045] (一致的殘基X 100V(比對(duì)長(zhǎng)度-比對(duì)中的空位總數(shù))
[0046] 在一個(gè)實(shí)施例中,比對(duì)長(zhǎng)度是至少150個(gè)氨基酸殘基,優(yōu)選至少180個(gè)氨基酸殘 基,更優(yōu)選至少200個(gè)氨基酸殘基,并且最優(yōu)選至少220個(gè)氨基酸殘基。
[0047] 出于本發(fā)明的目的,使用如在EMBOSS包(EMBOSS :歐洲分子生物學(xué)開放軟件套件, 賴斯(Rice)等人,2000,見上文)(優(yōu)選5. 0. 0版或更新版本)的尼德爾程序中所實(shí)施的尼 德爾曼-翁施算法(尼德爾曼(Needleman)和翁施(Wunsch),1970,見上文)來確定兩個(gè) 脫氧核糖核苷酸序列之間的序列一致性。使用的這些參數(shù)是空位開放罰分10、空位延伸罰 分0. 5以及EDNAFULL(NCBI NUC4. 4的EMBOSS版本)取代矩陣。尼德爾標(biāo)注的"最長(zhǎng)的一 致性"的輸出(使用-非簡(jiǎn)化選項(xiàng)獲得)被用作百分比一致性,并且如下計(jì)算:
[0048] (一致的脫氧核糖核苷酸X 100V(比對(duì)長(zhǎng)度-比對(duì)中的空位總數(shù))
[0049] 子序列:術(shù)語"子序列"意指使一個(gè)或多個(gè)(例如,若干個(gè))核苷酸從成熟多肽編 碼序列的5'端和/或3'端缺少的多核苷酸,其中該子序列編碼具有過氧合酶活性的一個(gè) 片段。在一個(gè)方面中,子序列包含至少600個(gè)核苷酸、至少650個(gè)核苷酸或至少700個(gè)核苷 酸。
[0050] 變體:術(shù)語"變體"意指在一個(gè)或多個(gè)(例如,若干個(gè))位置處包括改變(即,取代、 插入和/或缺失)的具有過氧合酶活性的一個(gè)多肽。取代意指占據(jù)一個(gè)位置的氨基酸替換 不同的氨基酸;缺失意指去除占據(jù)一個(gè)位置的氨基酸;并且插入意指在鄰接并且緊隨占據(jù) 一個(gè)位置的氨基酸之后添加一個(gè)氨基酸。
[0051] 非常高嚴(yán)謹(jǐn)度條件:術(shù)語"非常高嚴(yán)謹(jǐn)度條件"是指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸 的探針而言,遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5X SSPE、0. 3 % SDS、200微克/ml剪切并 變性的鮭魚精子DNA和50%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。載體材料最終使用2X SSC、0. 2% SDS,在70°C下洗滌三次,每次15分鐘。
[0052] 非常低嚴(yán)謹(jǐn)度條件:術(shù)語"非常低嚴(yán)謹(jǐn)度條件"是指對(duì)于長(zhǎng)度為至少100個(gè)核苷酸 的探針而言,遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5X SSPE、0. 3 % SDS、200微克/ml剪切并 變性的鮭魚精子DNA和25%甲酰胺中預(yù)雜交和雜交12至24小時(shí)。載體材料最終使用2X SSC、0. 2% SDS,在45°C下洗滌三次,每次15分鐘。
[0053] 詳細(xì)說明
[0054] 具有過氧合酶活性的多肽
[0055] 在一個(gè)實(shí)施例中,本發(fā)明涉及與SEQ ID NO:2成熟多肽具有至少60%,例如至少 65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致 性的分離的多肽,這些分離的多肽具有過氧合酶活性。在一個(gè)方面中,這些多肽與SEQ ID NO:2的成熟多肽相差不超過10個(gè)氨基酸,例如1、2、3、4、5、6、7、8或9個(gè)。
[0056] 本發(fā)明的多肽優(yōu)選地包括SEQ ID NO: 2的氨基酸序列或其等位基因變體或由其組 成;或是其具有過氧合酶活性的片段。在另一個(gè)方面中,該多肽包括SEQ ID N0:2的成熟多 肽或由其組成。在另一個(gè)方面中,該多肽包括SEQ ID N0:2的氨基酸-18至237或SEQ ID NO:2的氨基酸1至237或由其組成
[0057] 本發(fā)明的多肽可以包括如以下所示的氨基酸序列:
[0058] Glu-His-Asp-Gly-Ser-Leu-Ser-Arg(SEQ ID N0:3),
[0059] Glu-His-Asp-Ala-Ser-Leu-Ser-Arg(SEQ ID N0:4),
[0060] Glu-His-Asp-Gly-Ser-Ile-Ser-Arg(SEQ ID NO:5),或
[0061] Glu-His-Asp-Ala-Ser-Ile-Ser-Arg(SEQ ID NO:6)〇
[0062] -其對(duì)應(yīng)于SEQ ID NO: 2的氨基酸87-94,并且其配位血紅素基附近的Mn原子。
[0063] 因此,本發(fā)明的多肽的氨基酸序列可以包括如以下所示的基序(其是將SEQ ID NO:3組合至SEQ ID NO:6的結(jié)果):
[0064] E-H-D- [G,A] -S- [L,I] -S-R (SEQ ID NO :7)。
[0065] 本發(fā)明的多肽可以包括如以下所示的氨基酸序列:
[0066] Arg-Gly-Pro-Cys-Pro-Xaa-Met-Asn-Ser-Leu(SEQ ID NO:8),
[0067] Arg-Ala-Pro-Cys-Pro-Xaa-Met-Asn-Ser-Leu(SEQ ID NO:9),
[0068] Arg-Gly-Pro-Cys-Pro-Xaa-Leu-Asn-Ser-Leu(SEQ ID NO:10),
[0069] Arg-Ala-Pro-Cys-Pro-Xaa-Leu-Asn-Ser-Leu(SEQ ID NO:11),
[0070] Arg-Gly-Pro-Cys-Pro-Xaa-Met-Asn-Thr-Leu(SEQ ID NO:12),
[0071] Arg-Ala-Pro-Cys-Pro-Xaa-Met-Asn-Thr-Leu(SEQ ID NO:13),
[0072] Arg-Gly-Pro-Cys-Pro-Xaa-Leu-Asn-Thr-Leu(SEQ ID NO:14),或
[0073] Arg-Ala-Pro-Cys-Pro-Xaa-Leu-Asn-Thr-Leu(SEQ ID NO:15);
[0074] -其對(duì)應(yīng)于SEQ ID NO: 2的氨基酸14-23,并且其形成連接至血紅素基的必需結(jié)構(gòu) 元件。Xaa可以是任何氨基酸,但是優(yōu)選地,它是Met、Gly、Ala或Val。
當(dāng)前第1頁
1 
2 
3 
4 
5 
6