具有過氧合酶活性的多肽的制作方法
【專利說明】具有過氧合酶活性的多肽
[0001] 對序列表的引用
[0002] 本申請包括一個計算機可讀形式的序列表,將其通過引用結合在此。
[0003] 背景 發(fā)明領域
[0004] 本發(fā)明涉及具有過氧合酶(peroxygenase)活性的多肽和編碼這些多肽的多核苷 酸。本發(fā)明還涉及核酸構建體、載體以及包括這些多核苷酸的宿主細胞連同產生和使用這 些多肽的方法。
[0005] 相關技術說明
[0006] WO 2006/034702 Al披露了使用茶樹菇TM Al的AaP過氧合酶來酶促羥基化未活 化的烴(例如,萘、甲苯和環(huán)己烷)的方法。這也描述于烏爾里克(Ullrich)和霍夫里克特 (Hofrichter),2005,歐洲生化學會聯(lián)合會快報(FEBS Letters) 579 :6247-6250 中。
[0007] DE 103 32 065 Al披露了用于通過使用茶樹菇TM Al的AaP過氧合酶通過醛的中 間形成從醇中酶法制備酸的方法。
[0008] 報道了用于通過該AaP過氧合酶而快速和選擇性地以分光光度計直接檢測芳香 族羥基化的方法(克盧格(Kluge)等人,2007,應用微生物學和生物技術(Appl Microbiol Biotechnol) 75 :1473-1478)。
[0009] 從嗜奠真菌福毛鬼傘(Coprinus radians)中分離了另一種能夠進行芳香族過氧 合化(peroxygenation)的過氧合酶并對其進行了表征,鑒定了 N-末端16個氨基酸并與較 早公布的茶樹菇的AaP酶的N-末端14個氨基酸進行了比對;但是未分離編碼基因(安赫 (Anh)等人,2007,應用與環(huán)境微生物學(Appl Env Microbiol) 73 (17) :5477-5485)。
[0010] WO 2008/119780披露了若干種不同的過氧合酶多肽及其編碼多核苷酸連同其重 組產生。
[0011] WO 2011/120938披露了使用過氧合酶多肽的脂肪烴的位點特異性羥基化。
[0012] 本發(fā)明提供了具有過氧合酶活性的新穎多肽和編碼這些多肽的多核苷酸。
[0013] 發(fā)明概述
[0014] 本發(fā)明涉及具有過氧合酶活性的分離的多肽,這些分離的多肽選自下組,該組由 以下各項組成:
[0015] (a) -種多肽,該多肽與SEQ ID NO:2的成熟多肽具有至少60%的序列一致性;
[0016] (b) -種由以下多核苷酸編碼的多肽,該多核苷酸在中嚴謹度條件下與⑴SEQ ID NO: 1的成熟多肽編碼序列、(ii)其cDNA序列、或(iii) (i)或(ii)的全長互補體雜交;
[0017] (c)-種由以下多核苷酸編碼的多肽,該多核苷酸與SEQ ID NO: 1的成熟多肽編碼 序列、或其cDNA序列具有至少60%序列一致性;
[0018] (d)SEQ ID N0:2的成熟多肽的一種變體,該變體在一個或多個(例如,若干個)位 置處包括取代、缺失、和/或插入;以及
[0019] (e) (a)、(b)、(c)或(d)的多肽的一個片段,該片段具有過氧合酶活性。
[0020] 本發(fā)明還涉及編碼本發(fā)明的多肽的分離的多核苷酸;核酸構建體;重組表達載 體;包括這些多核苷酸的重組宿主細胞;以及產生這些多肽的方法。
[0021] 本發(fā)明還涉及使用本發(fā)明的多肽的方法。
[0022] 本發(fā)明還涉及一種編碼信號肽的多核苷酸,該信號肽包括SEQ ID NO:2的氨基 酸-16至-1或由其組成,該多核苷酸被可操作地連接至編碼一種蛋白質的基因;包括這些 多核苷酸的核酸構建體、表達載體和重組宿主細胞;以及產生一種蛋白質的方法。
[0023] 定義
[0024] 過氧合酶(Peroxygenase):術語"過氧合酶"意指根據EC 1. 11. 2. 1的一種"非特 異性過氧合酶"活性,其催化來自H2O2的一個氧原子插入多種底物(例如硝基苯并二噁茂) 中。出于本發(fā)明的目的,過氧合酶活性是根據描述于實例2,或描述于以下中的程序確定的: M.波拉杰-可比爾斯考(Poraj-Kobielska),Μ·金尼(Kinne),R.烏爾里克(Ullrich),Κ·詩 切布內爾(Scheibner),Μ.霍夫里克特(Hofrichter),"用于檢測真菌過氧合酶的分光光度 計測定(A spectrophotometric assay for the detection of fungal peroxygenases) ", 分析生物化學(Analytical Biochemistry) (2011),doi :10. 1016/j.ab. 2011. 10. 009。還 可以根據描述于實例中的程序確定過氧合酶活性。在一個方面中,本發(fā)明的這些多肽具有 SEQ ID N0:2的成熟多肽的至少20%,例如至少40%、至少50%、至少60%、至少70%、至 少80%、至少90%、至少95 %或至少100 %的過氧合酶活性。
[0025] 等位基因變體:術語"等位基因變體"意指占據同一染色體基因座的基因的兩種或 更多種可替代形式中的任一種。等位基因變異由突變天然產生,并且可以導致群體內的多 態(tài)性。基因突變可以是沉默的(在所編碼的多肽中沒有改變)或可編碼具有改變的氨基酸 序列的多肽。多肽的等位基因變體是由基因的等位基因變體編碼的多肽。
[0026] cDNA :術語"cDNA"意指可以通過反轉錄從得自真核或原核細胞的成熟的、已剪接 的mRNA分子制備的DNA分子。cDNA缺乏可以存在于相應基因組DNA中的內含子序列。早 先的初始RNA轉錄本是mRNA的前體,其在呈現(xiàn)為成熟的剪接的mRNA之前要經一系列的步 驟進行加工,包括剪接。
[0027] 編碼序列:術語"編碼序列"意指直接指定一個多肽的氨基酸序列的多核苷酸。編 碼序列的邊界一般由一個開放閱讀框架決定,該開放閱讀框架從一個起始密碼子(如ATG、 GTG或TTG)開始并且以一個終止密碼子(如TAA、TAG或TGA)結束。編碼序列可以是一種 基因組DNA、cDNA、合成DNA或其組合。
[0028] 控制序列:術語"控制序列"意指對于表達編碼本發(fā)明的成熟多肽的多核苷酸所必 需的核酸序列。每個控制序列對于編碼該多肽的多核苷酸來說可以是天然的(即,來自相 同基因)或外源的(即,來自不同基因),或相對于彼此是天然的或外源的。此類控制序列 包括但不限于前導子、聚腺苷酸化序列、前肽序列、啟動子、信號肽序列、以及轉錄終止子。 至少,控制序列包括啟動子,以及轉錄和翻譯終止信號。出于引入有利于將這些控制序列與 編碼一種多肽的多核苷酸的編碼區(qū)連接的特異性限制酶切位點的目的,這些控制序列可以 提供有多個接頭。
[0029] 表達:術語"表達"包括涉及多肽產生的任何步驟,包括但不限于,轉錄、轉錄后修 飾、翻譯、翻譯后修飾、以及分泌。
[0030] 表達載體:術語"表達載體"意指線性或環(huán)狀DNA分子,該分子包括編碼多肽的多 核苷酸并且該多核苷酸可操作地與提供用于其表達的控制序列相連接。
[0031] 片段:術語"片段"意指具有從成熟多肽或結構域的氨基和/或羧基末端缺失的一 個或多個(例如,若干個)氨基酸的多肽或催化結構域;其中該片段具有過氧合酶活性。在 一個方面中,一個片段包含至少240個氨基酸殘基(例如,SEQ ID NO:2的氨基酸1至240 或SEQ ID NO:2的氨基酸20至240)、至少230個氨基酸殘基(例如,SEQ ID NO:2的氨基 酸1至230或SEQ ID NO: 2的氨基酸20至230)或至少220個氨基酸殘基(例如,SEQ ID NO:2的氨基酸1至220或SEQ ID NO:2的氨基酸20至220)。
[0032] 高嚴謹度條件:術語"高嚴謹度條件"意指對于長度為至少100個核苷酸的探針而 言,遵循標準DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的鮭 魚精子DNA和50%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用2X SSC、0. 2% SDS,在65 °C下洗滌三次,每次15分鐘。
[0033] 宿主細胞:術語"宿主細胞"意指任何細胞類型,該細胞類型對于用包含本發(fā)明的 多核苷酸的核酸構建體或表達載體進行轉化、轉染、轉導等是易感的。術語"宿主細胞"涵 蓋由于復制期間發(fā)生的突變而與親本細胞不同的親本細胞的任何后代。
[0034] 分離的:術語"分離的"意指處于自然界中不出現(xiàn)的形式或環(huán)境中的物質。分離的 物質的非限制性實例包括(1)任何非天然存在的物質;(2)至少部分地從與其在自然界中 相關聯(lián)的一種或多種或全部天然存在的組分中除去的任何物質,包括但不局限于任何酶、 變體、核酸、蛋白質、肽或輔因子;(3)相對于自然界中發(fā)現(xiàn)的那種物質通過人工手動修飾 的任何物質;或者(4)通過相對于與其天然相關聯(lián)的其他組分增加該物質的量而修飾的任 何物質(例如,編碼該物質的基因的多個拷貝;比與編碼該物質的基因天然相關聯(lián)的啟動 子更強的啟動子的使用)。一種分離的物質可以存在于發(fā)酵液樣品中。
[0035] 低嚴謹度條件:術語"低嚴謹度條件"意指對于長度為至少100個核苷酸的探針而 言,遵循標準DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的鮭 魚精子DNA和25%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用2X SSC、0. 2% SDS,在50 °C下洗滌三次,每次15分鐘。
[0036] 成熟多肽:術語"成熟多肽"意指在翻譯和任何翻譯后修飾如N-末端加工、C-末 端截短、糖基化作用、磷酸化作用等之后處于其最終形式的多肽。在一個方面中,基于預測 SEQ ID N0:2的氨基酸-16至-1是信號肽的SignalP 3.0程序,成熟多肽是SEQ ID N0:2 的氨基酸1至241。本領域中已知的是,一個宿主細胞可以產生由同一多核苷酸表達的兩種 或更多種不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)的混合物。
[0037] 成熟多肽編碼序列:術語"成熟多肽編碼序列"意指編碼具有過氧合酶活性的成熟 多肽的一種多核苷酸。在一個方面中,基于預測SEQ ID NO: 1的核苷酸1至48編碼信號肽 的SignalP 3.0程序,成熟多肽編碼序列是SEQ ID NO: 1的核苷酸49至85、161至401、480 至754以及880至1049,或其cDNA序列。
[0038] 中嚴謹度條件:術語"中嚴謹度條件"意指對于長度為至少100個核苷酸的探針而 言,遵循標準DNA印跡程序,在42°C下在5X SSPE、0. 3% SDS、200微克/ml剪切并變性的鮭 魚精子DNA和35%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用2X SSC、0. 2% SDS,在55 °C下洗滌三次,每次15分鐘。
[0039] 中-高嚴謹度條件:術語"中-高嚴謹度條件"意指對于長度為至少100個核苷酸 的探針而言,遵循標準DNA印跡程序,在42°C下在5X SSPE、0. 3 % SDS、200微克/ml剪切并 變性的鮭魚精子DNA和35%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用2X SSC、0. 2% SDS,在60°C下洗滌三次,每次15分鐘。
[0040] 核酸構建體:術語"核酸構建體"意指單鏈或雙鏈的一種核酸分子,該核酸分子是 從天然存在的基因中分離的,或者以一種本來不存在于自然界中的方式被修飾成含有核酸 的區(qū)段,或者是合成的,該核酸分子包含一個或多個控制序列。
[0041] 可操作地連接:術語"可操作地連接"意指如下的構造,其中,控制序列相對于多核 苷酸的編碼序列安置在適當位置處,從而使得該控制序列指導該編碼序列的表達。
[0042] 序列一致性:兩個氨基酸序列之間或者兩個核苷酸序列之間的關聯(lián)度通過參數(shù) "序列一致性"來描述。
[0043] 出于本發(fā)明的目的,使用如在EMBOSS包(EMBOSS :歐洲分子生物學開放軟件套件 (The European Molecular Biology Open Software Suite),賴斯(Rice)等人,2000,遺 傳學趨勢(Trends Genet.) 16 :276-277)(優(yōu)選5· 0· 0版或更新版本)的尼德爾(Needle) 程序中所實施的尼德爾曼-翁施(Needleman-Wunsch)算法(Needleman (尼德爾曼)和 Wunsch(翁施),1970,分子生物學雜志(J. Mol. Biol. )48:443-453)來確定兩個氨基酸 序列之間的序列一致性。使用的這些參數(shù)是空位開放罰分10、空位延伸罰分0.5,以及 EBL0SUM62 (BL0SUM62的EMBOSS版本)取代矩陣。尼德爾標注的"最長的一致性"的輸出 (使用-非簡化選項獲得)被用作百分比一致性,并且如下計算:
[0044] (一致的殘基X 100V(比對長度-比對中的空位總數(shù))
[0045] 在一個實施例中,比對長度是至少150個氨基酸殘基,優(yōu)選至少180個氨基酸殘 基,更優(yōu)選至少200個氨基酸殘基,并且最優(yōu)選至少220個氨基酸殘基。
[0046] 出于本發(fā)明的目的,使用如在EMBOSS包(EMBOSS :歐洲分子生物學開放軟件套件, 賴斯(Rice)等人,2000,見上文)(優(yōu)選5. 0. 0版或更新版本)的尼德爾程序中所實施的尼 德爾曼-翁施算法(尼德爾曼(Needleman)和翁施(Wunsch),1970,見上文)來確定兩個 脫氧核糖核苷酸序列之間的序列一致性。使用的這些參數(shù)是空位開放罰分10、空位延伸罰 分0. 5以及EDNAFULL(NCBI NUC4. 4的EMBOSS版本)取代矩陣。尼德爾標注的"最長的一 致性"的輸出(使用-非簡化選項獲得)被用作百分比一致性,并且如下計算:
[0047] (一致的脫氧核糖核苷酸X 100V(比對長度-比對中的空位總數(shù))
[0048] 子序列:術語"子序列"意指使一個或多個(例如,若干個)核苷酸從成熟多肽編 碼序列的5'端和/或3'端缺少的多核苷酸,其中該子序列編碼具有過氧合酶活性的一個 片段。在一個方面中,子序列包含至少600個核苷酸、至少650個核苷酸或至少700個核苷 酸。
[0049] 變體:術語"變體"意指在一個或多個(例如,若干個)位置處包括改變(即,取代、 插入和/或缺失)的具有過氧合酶活性的一個多肽。取代意指占據一個位置的氨基酸替換 不同的氨基酸;缺失意指去除占據一個位置的氨基酸;并且插入意指在鄰接并且緊隨占據 一個位置的氨基酸之后添加一個氨基酸。
[0050] 非常高嚴謹度條件:術語"非常高嚴謹度條件"是指對于長度為至少100個核苷酸 的探針而言,遵循標準DNA印跡程序,在42°C下在5X SSPE、0. 3 % SDS、200微克/ml剪切并 變性的鮭魚精子DNA和50%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用2X SSC、0. 2% SDS,在70°C下洗滌三次,每次15分鐘。
[0051] 非常低嚴謹度條件:術語"非常低嚴謹度條件"是指對于長度為至少100個核苷酸 的探針而言,遵循標準DNA印跡程序,在42°C下在5X SSPE、0. 3 % SDS、200微克/ml剪切并 變性的鮭魚精子DNA和25%甲酰胺中預雜交和雜交12至24小時。載體材料最終使用2X SSC、0. 2% SDS,在45°C下洗滌三次,每次15分鐘。
[0052] 詳細說明
[0053] 具有過氧合酶活性的多肽
[0054] 在一個實施例中,本發(fā)明涉及與SEQ ID NO:2成熟多肽具有至少60%,例如至少 65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致 性的分離的多肽,這些分離的多肽具有過氧合酶活性。在一個方面中,這些多肽與SEQ ID NO:2的成熟多肽相差不超過10個氨基酸,例如1、2、3、4、5、6、7、8或9個。
[0055] 本發(fā)明的多肽優(yōu)選地包括SEQ ID NO: 2的氨基酸序列或其等位基因變體或由其組 成;或是其具有過氧合酶活性的片段。在另一個方面中,該多肽包括SEQ ID N0:2的成熟多 肽或由其組成。在另一個方面中,該多肽包括SEQ ID N0:2的氨基酸-16至241或SEQ ID NO:2的氨基酸1至241或由其組成。
[0056] 本發(fā)明的多肽可以包括如以下所示的氨基酸序列:
[0057] Glu-His-Asp-Gly-Ser-Leu-Ser-Arg(SEQ ID N0:3),
[0058] Glu-His-Asp-Ala-Ser-Leu-Ser-Arg(SEQ ID N0:4),
[0059] Glu-His-Asp-Gly-Ser-Ile-Ser-Arg(SEQ ID NO:5),或
[0060] Glu-His-Asp-Ala-Ser-Ile-Ser-Arg(SEQ ID NO:6)〇
[0061] -其對應于SEQ ID NO: 2的氨基酸87-94,并且其配位血紅素基附近的Mn原子。
[0062] 因此,本發(fā)明的多肽的氨基酸序列可以包括如以下所示的基序(其是將SEQ ID NO:3組合至SEQ ID NO:6的結果):
[0063] E-H-D-[G, A]-S-[L, IJ-S-R(SEQ ID N0:7)0
[0064] 本發(fā)明的多肽可以包括如以下所示的氨基酸序列:
[0065] Arg-Gly-Pro-Cys-Pro-Xaa-Met-Asn-Ser-Leu(SEQ ID NO:8),
[0066] Arg-Ala-Pro-Cys-Pro-Xaa-Met-Asn-Ser-Leu(SEQ ID NO:9),
[0067] Arg-Gly-Pro-Cys-Pro-Xaa-Leu-Asn-Ser-Leu(SEQ ID NO:10),
[0068] Arg-Ala-Pro-Cys-Pro-Xaa-Leu-Asn-Ser-Leu(SEQ ID NO:11),
[0069] Arg-Gly-Pro-Cys-Pro-Xaa-Met-Asn-Thr-Leu(SEQ ID NO:12),
[0070] Arg-Ala-Pro-Cys-Pro-Xaa-Met-Asn-Thr-Leu(SEQ ID NO:13),
[0071] Arg-Gly-Pro-Cys-Pro-Xaa-Leu-Asn-Thr-Leu(SEQ ID NO:14),或
[0072] Arg-Ala-Pro-Cys-Pro-Xaa-Leu-Asn-Thr-Leu(SEQ ID NO:15);
[0073] -其對應于SEQ ID NO