α-淀粉酶以及對其進行編碼的多核苷酸的制作方法
【專利說明】a-淀粉酶W及對其進行編碼的多核音酸
[0001] 對序列表的引用
[0002] 本申請包括一個計算機可讀形式的序列表,將其通過引用結(jié)合在此。
[000引發(fā)明背景 發(fā)明領(lǐng)域
[0004] 本發(fā)明設(shè)及a-淀粉酶、編碼該些a-淀粉酶的多核巧酸、生產(chǎn)該些a-淀粉酶的 方法、和使用該些a-淀粉酶的方法。在本披露的實施例中,生淀粉(rawstarch)降解活 性被改善。
[0005] 相關(guān)技術(shù)說明
[0006] 淀粉的酶降解是很多工業(yè)過程中的部分,該些工業(yè)過程包括釀造、葡萄糖或高果 糖糖漿的生產(chǎn)W及飲用或燃料己醇的生產(chǎn)。在天然的狀態(tài)中,淀粉非常耐受很多酶的降解, 并因此傳統(tǒng)上通過一個對淀粉進行糊化的加熱步驟來啟動淀粉的工業(yè)酶降解,該使得淀粉 對很多酶更加敏感。一些酶可W作用于未糊化的淀粉,并且通常被提及為具有生淀粉降解 活性。該些酶的使用允許改善工藝,包括例如減少加工淀粉中的加熱步驟。
[0007]a-淀粉酶(a-1,4-葡聚糖4葡聚糖水解酶,EC3. 2. 1. 1)構(gòu)成催化淀粉W及其 他直鏈和支鏈1,4葡糖巧寡糖和多糖的水解的一組酶。a-淀粉酶已經(jīng)用于各種不同的 工業(yè)目的,包括淀粉液化、己醇生產(chǎn)、紡織品脫漿、紡織品洗漆、紙張和紙漿工業(yè)中的淀粉改 性、釀造和烘賠。
[000引W0 2010/091221披露了一種來自±曲霉的具有a-淀粉酶活性的多膚。數(shù)據(jù)庫 化iProtXP002576027披露了來自Q0C881(±曲霉)基因組針對a-淀粉酶的核酸序列。
[0009]W0 2008/080093披露了a-淀粉酶和葡糖淀粉酶W及其在制造燃料中的用途。
[0010] 在本領(lǐng)域中仍然需要改進的a-淀粉酶,包括具有生淀粉降解活性的a-淀粉酶。
[0011] 發(fā)明概述
[0012] 本發(fā)明設(shè)及具有a-淀粉酶活性的多膚,該些多膚選自下組,該組由W下各項組 成:
[0013] (a) -種包括SEQIDN0:2、SEQIDN0:4或SEQIDN0:6的氨基酸序列的成熟多 膚的氨基酸序列或由其組成的多膚;
[0014] 化)一種包括與SEQIDN0:2、SEQIDN0:4或SEQIDN0:6的氨基酸序列的成熟 多膚具有至少80%序列一致性的氨基酸序列的多膚;
[0015] (C)一種由W下多核巧酸編碼的多膚,該多核巧酸在中嚴格條件下與SEQID N0:1、SEQIDN0:3或SEQIDN0:5的成熟多膚編碼序列雜交。在實施例中,本披露的多膚 是分離的。
[0016] 本發(fā)明還設(shè)及編碼本發(fā)明的多膚的多核巧酸;核酸構(gòu)建體;重組表達載體;包括 該些多核巧酸的重組宿主細胞;W及產(chǎn)生該些多膚的方法。
[0017] 本發(fā)明另外設(shè)及用一種編碼本發(fā)明的多膚的多核巧酸轉(zhuǎn)化的一種轉(zhuǎn)基因植物、植 物部分或植物細胞。
[0018] 在又另外的方面中,本發(fā)明設(shè)及包括一種本發(fā)明的多膚的組合物,包括用于生產(chǎn) 己醇的組合物。
[0019] 本發(fā)明還設(shè)及使用一種本發(fā)明的多膚生產(chǎn)己醇的方法。本發(fā)明還設(shè)及使用一種本 發(fā)明的多膚從未糊化的淀粉生產(chǎn)己醇的方法。
[0020] 定義
[0021] a-淀粉酶活性;在此將術(shù)語"a-淀粉酶活性"定義為一種催化包含=個或更多 個(1,4) -a-連接的D-葡萄糖單位的多糖中的(1,4) -a-D-糖巧鍵的內(nèi)切水解的活性。術(shù) 語"a-淀粉酶活性"對應(yīng)于在E.C. 3. 2. 1. 1中分類的酶。出于本發(fā)明的目的,根據(jù)"實例" 部分所述的程序確定a-淀粉酶活性。
[0022] 等位基因變體;術(shù)語"等位基因變體"意指占據(jù)同一染色體基因座的基因的兩種或 更多種可替代形式中的任一種。等位基因變異由突變天然產(chǎn)生,并且可W導(dǎo)致群體內(nèi)的多 態(tài)性?;蛲蛔兛蒞是沉默的(在所編碼的多膚中沒有改變)或可編碼具有改變的氨基酸 序列的多膚。多膚的等位基因變體是由基因的等位基因變體編碼的多膚。
[002引cDNA;術(shù)語"cDNA"是指可W通過從得自真核或原核細胞的成熟的、剪接的mRNA分 子進行反轉(zhuǎn)錄而制備的DNA分子。cDNA缺乏可W存在于對應(yīng)基因組DNA中的內(nèi)含子序列。 早先的初始RNA轉(zhuǎn)錄本是mRNA的前體,其在呈現(xiàn)為成熟的剪接的mRNA之前要經(jīng)一系列的 步驟進行加工,包括剪接。
[0024] 編碼序列;術(shù)語"編碼序列"意指直接指定一個多膚的氨基酸序列的多核巧酸。編 碼序列的邊界一般由一個開放閱讀框架決定,該開放閱讀框架從一個起始密碼子(如ATG、 GTG或TTG)開始并且W-個終止密碼子(如TAA、TAG或TGA)結(jié)束。編碼序列可W是一種 基因組DNA、cDNA、合成DNA或其組合。
[0025] 控制序列;術(shù)語"控制序列"意指對于表達編碼本發(fā)明的成熟多膚的多核巧酸所必 需的核酸序列。每個控制序列對于編碼該多膚的多核巧酸來說可W是天然的(即,來自相 同基因)或外源的(即,來自不同基因),或相對于彼此是天然的或外源的。此類控制序列 包括但不限于前導(dǎo)子、聚腺巧酸化序列、前膚序列、啟動子、信號膚序列、W及轉(zhuǎn)錄終止子。 至少,控制序列包括啟動子,W及轉(zhuǎn)錄和翻譯終止信號。出于引入有利于將該些控制序列與 編碼一種多膚的多核巧酸的編碼區(qū)連接的特異性限制酶切位點的目的,該些控制序列可W 提供有多個接頭。
[0026] 表達;術(shù)語"表達"包括設(shè)及多膚產(chǎn)生的任何步驟,包括但不限于,轉(zhuǎn)錄、轉(zhuǎn)錄后修 飾、翻譯、翻譯后修飾、W及分泌。
[0027] 表達載體;術(shù)語"表達載體"意指線性或環(huán)狀DNA分子,該分子包括編碼多膚的多 核巧酸并且該多核巧酸可操作地與提供用于其表達的控制序列相連接。
[0028] 片段;術(shù)語"片段"意指具有從成熟多膚或結(jié)構(gòu)域的氨基和/或駿基末端缺失的一 個或多個(例如,若干個)氨基酸的本發(fā)明的多膚;其中該片段具有a-淀粉酶活性。在一 個方面,一個片段包含了SEQIDN0:2或6的至少497個氨基酸殘基、至少526個氨基酸殘 基或至少555個氨基酸殘基。在另一個方面,一個片段含有SEQIDNO: 4的至少528個氨 基酸殘基、至少559個氨基酸殘基或至少590個氨基酸殘基。
[0029] 高嚴格條件;術(shù)語"高嚴格條件"意指對于長度為至少100個核巧酸的探針而言, 遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5XSSPE、0. 3%SDS、200微克/ml剪切并變性的蛙魚 精子DM和50%甲酯胺中預(yù)雜交和雜交12至24小時。載體材料最終使用2XSSC、0. 2%SDS,在65°C下洗漆=次,每次15分鐘。
[0030] 宿主細胞;術(shù)語"宿主細胞"意指任何細胞類型,該細胞類型對于用包含本發(fā)明的 多核巧酸的核酸構(gòu)建體或表達載體進行轉(zhuǎn)化、轉(zhuǎn)染、轉(zhuǎn)導(dǎo)等是易感的。術(shù)語"宿主細胞"涵 蓋由于復(fù)制期間發(fā)生的突變而與親本細胞不同的親本細胞的任何后代。
[0031] 分離的;術(shù)語"分離的"意指處于自然界中不出現(xiàn)的形式或環(huán)境中的物質(zhì)。分離的 物質(zhì)的非限制性實例包括(1)任何非天然發(fā)生的物質(zhì),(2)包括但不限于任何酶、變體、核 酸、蛋白質(zhì)、膚或輔因子的任何物質(zhì),該物質(zhì)至少部分地從與其本質(zhì)相關(guān)的一種或多種或所 有天然發(fā)生的成分中去除;(3)相對于天然發(fā)現(xiàn)的物質(zhì)通過人工修飾的任何物質(zhì);或(4)通 過增加該物質(zhì)相對于與其本質(zhì)相關(guān)的其他組分的量而修飾的任何物質(zhì)(例如,編碼該物質(zhì) 的基因的多拷貝;使用比編碼該物質(zhì)的基因本質(zhì)相關(guān)的啟動子強的啟動子)。一種分離的 物質(zhì)可W存在于發(fā)酵液樣品中。例如,本發(fā)明的多膚可W按發(fā)酵液產(chǎn)物的形式用于工業(yè)應(yīng) 用中,即,本發(fā)明的多膚是用作工業(yè)應(yīng)用(例如,己醇生產(chǎn))中產(chǎn)物的發(fā)酵液的組分。除本 發(fā)明的多膚外,該發(fā)酵液產(chǎn)物將包括在發(fā)酵過程中使用的另外的成分,例如像,細胞(包括 含有編碼本發(fā)明的多膚的基因的宿主細胞,該些宿主細胞被用于產(chǎn)生感興趣的多膚)、細胞 碎片、生物質(zhì)、發(fā)酵介質(zhì)和/或發(fā)酵產(chǎn)物。該發(fā)酵液可W任選地經(jīng)受一個或多個純化(包括 過濾)步驟,W除去或降低發(fā)酵過程中的再一個組分。因此,本發(fā)明的"分離的"多膚可W 存在于此類發(fā)酵液產(chǎn)物中。
[003引成熟多膚;術(shù)語"成熟多膚"意指在翻譯和任何翻譯后修飾如N-末端加工、C-末 端截短、糖基化作用、磯酸化作用等之后處于其最終形式的多膚。本領(lǐng)域中已知的是,一個 宿主細胞可W產(chǎn)生由同一多核巧酸表達的兩種或更多種不同成熟多膚(即,具有不同C-末 端和/或N-末端氨基酸)的混合物。本領(lǐng)域還已知,不同的宿主細胞不同地加工多膚,并 且因此一個表達一種多核巧酸的宿主細胞當(dāng)與另一個表達相同多核巧酸的宿主細胞相比 時可W產(chǎn)生一種不同的成熟多膚(例如,具有一個不同的C-末端和/或N-末端氨基)。
[0033] 在一個方面中,基于預(yù)測SEQIDN0:2的氨基酸-1至-21是信號膚的SignalP(巧 爾森(Nielsen)等人,1997,蛋白質(zhì)工程(ProteinElngineering) 10:1-6),該成熟多膚是 SEQIDNO:2的氨基酸1至585。
[0034] 在另一個方面,基于預(yù)測SEQIDN0:4的氨基酸-1至-21是信號膚的SignalP程 序(巧爾森(Nielsen)等人,1997,蛋白質(zhì)工程(ProteinElngineering) 10:1-6),該成熟多 膚是SEQIDNO:4的氨基酸1至622。
[00巧]在另一個方面,基于預(yù)測SEQIDNO:6的氨基酸-1至-21是信號膚的SignalP程 序(巧爾森(Nielsen)等人,1997,蛋白質(zhì)工程(ProteinElngineering) 10:1-6),該成熟多 膚是SEQIDNO:6的氨基酸1至607。
[0036] 成熟多膚編碼序列;術(shù)語"成熟多膚編碼序列"意指編碼具有a-淀粉酶活性的成 熟多膚的多核巧酸。
[0037] 中嚴格條件;術(shù)語"中嚴格條件"意指對于長度為至少100個核巧酸的探針而言, 遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5XSSPE、0. 3%SDS、200微克/ml剪切并變性的蛙魚 精子DNA和35%甲酯胺中預(yù)雜交和雜交12至24小時。載體材料最終使用2XSSC、0. 2% SDS,在55°C下洗漆=次,每次15分鐘。
[003引中-高嚴格條件;術(shù)語"中-高嚴格條件"意指對于長度為至少100個核巧酸的探 針而言,遵循標(biāo)準(zhǔn)DNA印跡程序,在42°C下在5XSS陽、0. 3%SDS、200微克/ml剪切并變性 的蛙魚精子DNA和35%甲酯胺中預(yù)雜交和雜交12至24小時。載體材料最終使用2XSSC、 0. 2%SDS,在60°C下洗漆S次,每次15分鐘。
[0039] 核酸構(gòu)建體;術(shù)語"核酸構(gòu)建體"意指單鏈或雙鏈的一種核酸分子,該核酸分子是 從天然存在的基因中分離的,或者W-種本來不存在于自然界中的方式被修飾成含有核酸 的區(qū)段,或者是合成的,該核酸分子包含一個或多個控制序列
[0040] 可操作地連接;術(shù)語"可操作地連接"意指如下的構(gòu)造,其中,控制序列相對于多核 巧酸的編碼序列安置在適當(dāng)位置處,從而使得該控制序列指導(dǎo)該編碼序列的表達。
[0041] 序列一致性;兩個氨基酸序列之間或者兩個核巧酸序列之間的關(guān)聯(lián)度通過參數(shù) "序列一致性"來描述。
[0042] 出于本發(fā)明的目的,使用如在EMBOSS包(EMBOSS;歐洲分子生物學(xué)開放軟件套件 (TheEluropeanMolecularBiologyOpenSoftwareSuite),賴斯巧ice)等人,2000,遺 傳學(xué)趨勢(TrendsGenet.) 16:276-277)(優(yōu)選5. 0.0版或更新版本)的巧德爾(Needle) 程序中所實施的巧德爾曼-翁施(Needleman-Wunsch)算法(Needleman(巧德爾曼)和 Wunsch(翁施),1970,分子生物學(xué)雜志(J.Mol.Biol.)48:443-453)來確定兩個氨基酸 序列之間的序列一致性。使用的該些參數(shù)是空位開放罰分10、空位延伸罰分0.5,W及 E化0SUM62炬L0SUM62的EMBOSS版本)取代矩陣。巧德爾標(biāo)注的"最長的一致性""的輸出 (使用-非簡化選項獲得)被用作百分比一致性,并且如下計算:
[00