專利名稱:用于生產(chǎn)感興趣的重組多肽的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于生產(chǎn)感興趣的重組多肽的方法,通過所述方法獲得的多肽,重組多核苷酸、表達載體、表達構(gòu)建體,以及特定信號肽用于生產(chǎn)感興趣的重組多肽的用途和編碼所述特定信號肽的多核苷酸用于生產(chǎn)感興趣的重組多肽的用途。
背景技術(shù):
絲狀真菌宿主細胞中重組多肽的生產(chǎn)是本領(lǐng)域已知的。目前多肽的生產(chǎn)以多種方式進行。用于生產(chǎn)重組多肽的現(xiàn)有技術(shù)方法是通過發(fā)酵包含表達構(gòu)建體的宿主細胞進行的,所述表達構(gòu)建體包含與編碼感興趣的多肽的多核苷酸可操作地連接的啟動子等等。為了將感興趣的多肽導向宿主細胞的分泌途徑,感興趣的多肽包含信號序列。在 Broekhuijsen et al(Journal of Biotechnology,31(1993)135-145, Broekhuijsen et al ;Secretion of heterologous proteins by Aspergillus niger Production of active human interleukin-6 in a protease deficient mutant by KEX2_like processing of a glucoamylase-hIL6 fusion protein)中,使用分泌型多肽葡糖淀粉酶的信號序列在Aspergillus niger中表達重組蛋白質(zhì)。在工業(yè)背景下,需要生產(chǎn)的多肽的高產(chǎn)量。可以通過提高分泌效率來增強感興趣的重組多肽的生產(chǎn)產(chǎn)量。因此,為了增強感興趣的多肽的生產(chǎn)產(chǎn)量,需要改進分泌效率。本發(fā)明的一個目的是提供改進的用于生產(chǎn)重組多肽的方法。
圖1描繪了表達載體pGBFINFUA-1 (描述于W02008/000632中)的質(zhì)粒圖譜。 pGBFINFUA-Ι對于質(zhì)粒pGBFINFUA_3和pGBFINFUA_21來說也是代表性的。相對于amyB啟動子序列和編碼引入了變體信號序列的α -淀粉酶的A. niger amyB cDNA序列,標出了 glaA 側(cè)翼區(qū)。轉(zhuǎn)化A. niger菌株之前,可以通過用限制性酶NotI消化來去除E. coli DNA。圖2描繪了表達載體pGBFINFUA-6(構(gòu)建描述于實施例1中)的質(zhì)粒圖譜。 pGBFINFUA-6 對于質(zhì)粒 pGBFINFUA-8、pGBFINFUA-11、pGBFINFUA-12、pGBFINFUA-13、 pGBFINFUA-15、pGBFINFUA-16和pGBFINFUA_18來說也是代表性的。相對于glaA啟動子和編碼引入了變體信號序列的α-淀粉酶的A. niger amyB cDNA序列,標出了 glaA側(cè)翼區(qū)。 轉(zhuǎn)化A. niger菌株之前,可以通過用限制性酶NotI消化來去除E. coliDNA。圖3描繪了通過單同源重組整合的圖示。表達載體包含可選擇的amdS標記物,和與amyB基因連接的啟動子,所述啟動子含有變體信號序列。這些特征側(cè)翼是指導在基因組 glaA基因座處整合的glaA基因座的同源區(qū)(分別為3’ glaA和3” glaA)。圖4描繪了表達不同amyB構(gòu)建體的A. niger菌株培養(yǎng)液中的α -淀粉酶活性,所有amyB構(gòu)建體均位于glaA啟動子的控制下。描繪了表達amyB構(gòu)建體的A. niger菌株發(fā)酵液中的α-淀粉酶活性,其中不同構(gòu)建體中的信號序列已被修飾。關(guān)于不同構(gòu)建體的細節(jié)可見表1。以相對α-淀粉酶單位[AU]為單位描述α-淀粉酶活性,其中第3天FUA6組 3個菌株的FUA-6單拷貝菌株的均值被設為100%。對指出的所有轉(zhuǎn)化體組而言,分離并獨
立培養(yǎng)三個轉(zhuǎn)化體。圖5描繪了表達兩種不同的amyB構(gòu)建體的A. niger菌株培養(yǎng)液中的α -淀粉酶活性,所述兩種不同的amyB構(gòu)建體均位于amyB啟動子的控制下。描述了表達天然amyB構(gòu)建體(pGBFINFUA-3)的A. niger菌株發(fā)酵液中的α -淀粉酶活性,其中根據(jù)本發(fā)明的方法將amyB信號序列修飾成了經(jīng)密碼子優(yōu)化的pmeA信號序列(pGBFINFUA_21)。關(guān)于兩種構(gòu)建體的細節(jié)可見表2。以相對α -淀粉酶單位[AU]為單位描述α -淀粉酶活性,以第3天 FUA3組3個菌株的FUA-3-1單拷貝菌株的均值設為100%。對指出的兩個轉(zhuǎn)化體組而言, 分離并獨立培養(yǎng)三個轉(zhuǎn)化體。圖6描述了表達編碼P. chrysogenum葡萄糖氧化酶GoxA的兩種不同的構(gòu)建體的 A. niger菌株培養(yǎng)液中的葡萄糖氧化酶活性,所述兩種不同的構(gòu)建體均位于glaA啟動子的控制下。描述了表達天然goxA構(gòu)建體(G0X-l-#)的A. niger菌株發(fā)酵液中的葡萄糖氧化酶活性,其中根據(jù)本發(fā)明的方法將經(jīng)密碼子優(yōu)化的goxA信號序列修飾成了經(jīng)密碼子優(yōu)化的pmeA信號序列(G0X-2-#)。以相對葡萄糖氧化酶單位[AU]為單位描述葡萄糖氧化酶活性。對指出的兩個轉(zhuǎn)化體組而言,分離并獨立培養(yǎng)五個轉(zhuǎn)化體。發(fā)明詳述令人驚訝地,我們確定,可以通過使用特定的信號序列改進感興趣的重組多肽的生產(chǎn)。因此,本發(fā)明在第一方面提供了用于生產(chǎn)感興趣的重組多肽的方法,所述方法包括(i)在有助于生產(chǎn)所述多肽的條件下培養(yǎng)絲狀真菌宿主細胞,所述絲狀真菌宿主細胞包含以符合翻譯讀碼框的方式與第二多核苷酸連接的第一多核苷酸,所述第二多核苷酸編碼感興趣的多肽,所述第一多核苷酸編碼選自下組的信號肽,所述組由a) SEQ ID NO 25,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同,c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,d) SEQ ID NO 39,e) 15到23個氨基酸的SEQ ID NO 39的變體,其中至少8個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同,f) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,g) SEQ ID NO 44,h) 15到23個氨基酸的SEQ ID NO 44的變體,其中至少8個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同,i) 15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,j)SEQ ID NO :34,k) 15到23個氨基酸的SEQ ID NO 34的變體,其中至少8個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸構(gòu)成,(ii)以及任選地,從培養(yǎng)基分離所述多肽。上文所述方法在本文中被稱作根據(jù)本發(fā)明的方法。根據(jù)一個實施方案,在本發(fā)明的方法中,信號肽是SEQ ID NO :25。根據(jù)另一個實施方案,在本發(fā)明的方法中,信號肽是15到23個氨基酸的SEQ ID NO :25的變體,其中至少8個氨基酸與SEQ ID NO :25的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,在本發(fā)明的方法中,信號肽是15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,在本發(fā)明的方法中,信號肽是SEQ ID NO :39。根據(jù)另一個實施方案,在本發(fā)明的方法中,信號肽是15到23個氨基酸的SEQ ID NO 39的變體,其中至少8個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,在本發(fā)明的方法中,信號肽是15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,在本發(fā)明的方法中,信號肽是SEQ ID NO :44。根據(jù)另一個實施方案,在本發(fā)明的方法中,信號肽是15到23個氨基酸的SEQ ID NO 44的變體,其中至少8個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,在本發(fā)明的方法中,信號肽是15到23個氨基酸的SEQ ID NO 44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,在本發(fā)明的方法中,信號肽是SEQ ID NO :34。根據(jù)另一個實施方案,在本發(fā)明的方法中,信號肽是15到23個氨基酸的SEQ ID NO 34的變體,其中至少8個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,在本發(fā)明的方法中,信號肽是15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。優(yōu)選地,在根據(jù)本發(fā)明的方法中,當信號肽是以下時a) SEQ ID NO 25,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同,或c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
感興趣的多肽不是果膠甲基酯酶,更優(yōu)選地感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。更優(yōu)選地,當信號肽是(b)或(c)時,感興趣的多肽不是果膠甲基酯酶,進一步更優(yōu)選地感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。優(yōu)選地,編碼SEQ ID NO 25時,第一多核苷酸是根據(jù)SEQ ID NO 29的多核苷酸。 優(yōu)選地,編碼SEQ ID NO 39時,第一多核苷酸是根據(jù)SEQ ID NO 38的多核苷酸。優(yōu)選地, 編碼SEQ ID NO :44時,第一多核苷酸是根據(jù)SEQ ID NO :43的多核苷酸。優(yōu)選地,編碼SEQ ID NO 34時,第一多核苷酸是根據(jù)SEQ ID NO 33的多核苷酸。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :25變體是下述變體,其中至少9個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 25的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 25變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸,c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2、 3和/或4位的氨基酸是Val或Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或 Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,d) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :39的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :39的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 39的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 39的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2、3 和/或5位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :44的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :44的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 44的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 44的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 44的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :34的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :34的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 34的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 34的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu 的氨基酸,b) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少 5個選自Ala或Leu的氨基酸,c) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,d) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,e) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,f) 15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,
g) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,h) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個Ala,i) 15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少4個Ala和1個Leu,j) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少3個Ala和2個Leu,k) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少2個Ala和3個Leu,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少1個Ala和4個Leu,m) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個Leu,η) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,ο) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu、Ala,ρ) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個Ala,q) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少4個Ala和1個Leu,r) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少3個Ala和2個Leu,s) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少2個Ala和3個Leu,t) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少1個Ala和4個Leu,u) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個Leu。在上述SEQ ID NO 25 的變體(a)到(d)、SEQ ID NO 39 的變體(a)禾口 (b),SEQ ID NO 44的變體(a)和(b)和SEQ ID NO 34的變體(a)到(U)中,連續(xù)串優(yōu)選地為10個氨基酸,更優(yōu)選地為9個氨基酸,進一步更優(yōu)選地為8個氨基酸,最優(yōu)選地為7個氨基酸。在上述SEQ ID NO 25 的變體(a)到(d)、SEQ ID NO 39 的變體(a)禾口 (b),SEQ ID NO 44的變體(a)和(b)和SEQ ID NO 34的變體(a)到(U)中,氨基酸的連續(xù)串優(yōu)選地包含至少5個選自Ala或Leu的氨基酸,更優(yōu)選地包含至少6個選自Ala或Leu的氨基酸,最優(yōu)選地包含至少7個選自Ala或Leu的氨基酸。
15 到 23 個氨基酸的 SEQ ID NO 25、SEQ ID NO 39、SEQ ID NO 44 或 SEQ ID NO 34的變體可包含15個氨基酸、17個氨基酸、18個氨基酸、19個氨基酸、20個氨基酸、21個氨基酸、22個氨基酸或23個氨基酸。由上文所述第一多核苷酸編碼的信號肽在本文中被稱作根據(jù)本發(fā)明的信號肽?!半摹被颉肮央摹痹诒疚闹惺侵赣芍辽賰蓚€氨基酸組成的分子,所述至少兩個氨基酸在線性鏈中排列,并通過相鄰氨基酸殘基羧基與氨基之間的肽鍵接合在一起。術(shù)語“肽”和 “寡肽”被認為是同義的(如所公認的那樣),并且每個術(shù)語可以根據(jù)上下文的需要可交換地使用。“多肽”在本文中是指包含至少40個氨基酸的分子。在本發(fā)明的上下文中,術(shù)語“信號肽”在本文中被定義為引導多肽進入宿主細胞分泌途徑的肽。信號序列通常但不必須存在于多肽的氨基端,與多肽以符合讀碼框的方式融合。信號肽和多肽的氨基端之間可存在前肽(prop印tide)。信號序列通常但不必須在分泌過程期間從多肽上被切下,得到成熟的多肽。本領(lǐng)域技術(shù)人員已知如何鑒定信號序列。可以獲得多種工具和大量文獻。不應理解為本發(fā)明的限制的例子是A new method for predicting signal sequence cleavage sites.von Heijne G. Nucleic Acids Res. 1986 Jun 11 ;14(11) :4683-90.Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. Henrik Nielsen, Jacob Engelbrecht, S0ren Brunak and Gunnar von Heijne. Protein Engineering,10 :1-6,1997.Locating proteins in the cell using TargetP, SignalP, and related tools.Olof EmanueIsson, S0ren Brunak, Gunnar von Heijne, Henrik Nielsen. Nature Protocols 2,953-971(2007).網(wǎng)站:http://www. cbs. dtu. dk/services/SignalP/術(shù)語“前肽”在本文中被定義為與多肽氨基端以符合讀碼框的方式融合的肽。得到的多肽已知為前多肽,并且可以通過從前多肽上催化切割或自動催化切割前肽而被轉(zhuǎn)化為成熟的多肽。信號肽和前肽一起在本文中被稱作“前肽原(pr印rop印tide) ”,信號序列以符合讀碼框的方式與前肽融合,前肽以符合讀碼框的方式與多肽的氨基端融合。信號肽、前肽和前肽原在本領(lǐng)域中有時被稱作“前導序列”。術(shù)語“成熟多肽”在本文中被定義為在翻譯、翻譯后修飾(例如N-端加工、C-端加工、糖基化、磷酸化和任選的通過切割去除前導序列)之后為最終形式的多肽。在本發(fā)明的上下文中,術(shù)語“多肽”和“蛋白質(zhì)”是相同的,并且在本發(fā)明的說明書通篇中可以互換理解。在本發(fā)明的上下文中,“重組體”是指不排外地涉及天然存在的過程的任何遺傳修飾和/或通過對宿主細胞進行隨機誘變誘導的遺傳修飾。因此,重組體和天然存在的過程和/或通過對宿主細胞進行隨機誘變誘導的遺傳修飾的組合被認為是重組體。優(yōu)選地,重組體遺傳修飾不涉及天然存在的過程和/或通過對宿主細胞進行隨機誘變誘導的遺傳修飾。術(shù)語“可操作地連接”在本文中被定義為一種構(gòu)型,其中控制序列相對于編碼序列被置于適當?shù)奈恢蒙?,使得控制序列指導編碼序列的表達。
術(shù)語“編碼序列”在本文中被定義為下述序列,所述序列被轉(zhuǎn)錄成mRNA并翻譯成根據(jù)本發(fā)明的多肽。編碼序列的界限通常由mRNA 5’-側(cè)的ATG或其他起始密碼子和mRNA 3'-側(cè)終止開放讀碼框的翻譯終止密碼子序列決定。編碼序列可包括但不限于DNA、cDNA 和重組核酸序列。術(shù)語“變體肽”或“變體多肽”在本文中被定義為分別在肽或多肽的一個或多個特定位置上包含一個或多個改變(例如一個或多個特定氨基酸殘基的取代、插入、缺失和/或截短)的肽或多肽。相應地,變體信號肽是在信號肽的一個或多個特定位置上包含一個或多個改變(例如一個或多個特定氨基酸殘基的取代、插入、缺失和/或截短)的信號肽。根據(jù)本發(fā)明的變體信號肽的相應位置由與參照序列例如信號肽SEQ ID NO 25、SEQ ID NO :39, SEQ ID NO :44或SEQ ID N0:34的比對決定。適用時,可以使用本領(lǐng)域中已知的方法進行肽、多肽或多核苷酸的比對或多重比對。此類方法包括但不限于 Clustalff(Thompson et al,1994, Nucleic Acid Research 22,4673-4680), BLAST, GAP, MAP, MultiBLAST, and Smith Waterman。術(shù)語“多核苷酸”與術(shù)語“核酸分子”相同,并且在本文中可互換理解。該術(shù)語是指多核苷酸分子,其為單鏈或雙鏈的核糖核酸(RNA)或脫氧核糖核酸(DNA)分子。多核苷酸可以分離形式存在,或者可包含在重組核酸分子或載體中,或包含在宿主細胞中。術(shù)語“變體多核苷酸”在本文中被定義為在多核苷酸中一個或多個特定位置上包含一個或多個改變(例如一個或多個核苷酸的取代、插入、缺失和/或截短)的多核苷酸。根據(jù)本發(fā)明的信號肽可以與第二多核苷酸編碼的感興趣的多肽天然結(jié)合,或者可以對第二多核苷酸編碼的感興趣的多肽而言是外源的。優(yōu)選地,根據(jù)本發(fā)明的信號肽對第二多核苷酸編碼的感興趣的多肽而言是外源的。變體信號肽在本文中被定義為對第二多核苷酸編碼的感興趣的多肽而言是外源的。可以通過使用本領(lǐng)域已知的標準分子克隆技術(shù),通過用根據(jù)本發(fā)明的信號肽物理替換編碼天然結(jié)合的信號肽的多核苷酸,將與感興趣的多肽天然結(jié)合的信號肽替換為根據(jù)本發(fā)明的信號肽。所述方法詳盡描述于Sambrook & Russell,Molecular Cloning A Laboratory Manual,3rd Ed. , CSHLPress, Cold Spring Harbor, NY,2001 禾口 Ausubel et al. , Current Protocols in Molecular Biology, Wiley InterScience, NY,1995 中?;蛘?,可以使用本領(lǐng)域已知的方法(見例如上文Sambrook & Russel),通過編碼天然結(jié)合的信號肽的位點特異性誘變,將與感興趣的多肽天然結(jié)合的信號肽轉(zhuǎn)化為根據(jù)本發(fā)明的信號肽。根據(jù)本發(fā)明的信號肽對絲狀真菌宿主細胞而言可以是天然的或外源的。優(yōu)選地, 根據(jù)本發(fā)明的信號肽對絲狀真菌宿主細胞而言是天然的。優(yōu)選地,在相同條件下培養(yǎng)時,與由與編碼其天然信號肽的多核苷酸以符合翻譯讀碼框的方式連接的第二多核苷酸編碼的感興趣的多肽相比,根據(jù)本發(fā)明的方法生產(chǎn)了至少多10%、更優(yōu)選地至少多25%、進一步更優(yōu)選地至少多50%、進一步更優(yōu)選地至少多 75%、進一步更優(yōu)選地至少多100%、進一步更優(yōu)選地至少多200%、最優(yōu)選地至少多500% 的由與編碼根據(jù)本發(fā)明的信號肽的第一多核苷酸以符合翻譯讀碼框的方式連接的第二多核苷酸編碼的感興趣的重組多肽??梢酝ㄟ^本領(lǐng)域技術(shù)人員已知的一般方法提供編碼感興趣的多肽的第二多核苷酸。此類方法詳盡描述于上文Sambrook & Russell中。所述方法的例子如下。當?shù)诙嗪塑账岬男蛄幸阎獣r,或所編碼的感興趣的多肽的序列已知時,可以從天然表達所述多核苷酸的宿主細胞中分離所述多核苷酸?;蛘?,可以化學合成多核苷酸。例如下文所述的密碼子優(yōu)化方法可被用于適應所選擇的宿主細胞的密碼子使用。如果多肽的序列未知,則可首先使用本領(lǐng)域已知的方法確定序列(上文Sambrook & Russel)。組合或單獨的本文多核苷酸(即以符合翻譯讀碼框的方式與第二多核苷酸連接的第一多核苷酸,所述第二多核苷酸編碼感興趣的多肽,所述第一多核苷酸編碼信號肽;或單獨的第一多核苷酸或單獨的第二多核苷酸)可以是合成的多核苷酸。合成的多核苷酸可以按照密碼子使用被優(yōu)化,優(yōu)選地根據(jù)W02006/077258和/或PCT/EP2007/055943中所述的方法被優(yōu)化,所述參考文獻通過引用并入本文。PCT/EP2007/055943介紹了密碼子對優(yōu)化。密碼子對優(yōu)化是這樣一種方法其中編碼多肽的核苷酸序列根據(jù)其密碼子使用、尤其是使用的密碼子對而被修飾,以獲得編碼多肽的核苷酸序列經(jīng)改進的表達和/或所編碼的多肽的經(jīng)改進的生產(chǎn)。密碼子對被定義為編碼序列中一組兩個連續(xù)的三聯(lián)體(密碼子)。組合或單獨的本文多核苷酸(即以符合翻譯讀碼框的方式與第二多核苷酸連接的第一多核苷酸,所述第二多核苷酸編碼感興趣的多肽,所述第一多核苷酸編碼信號肽;或單獨的第一多核苷酸或單獨的第二多核苷酸)可包含一個或多個內(nèi)含子。將多核苷酸以符合翻譯讀碼框的方式彼此連接的方法在本領(lǐng)域中已知為一般克隆技術(shù)(Sambrook & Russell,上文)。例子是消化、連接、PCR、化學合成等等。因此,可以通過本領(lǐng)域已知的此類方法孔昂第一多核苷酸與第二多核苷酸以符合翻譯讀碼框的方式連接??梢允褂帽绢I(lǐng)域已知的方法構(gòu)建下述絲狀真菌宿主細胞,所述絲狀真菌宿主細胞包含以符合翻譯讀碼框的方式與第二多核苷酸連接的第一多核苷酸,所述第二多核苷酸編碼感興趣的多肽,所述第一多核苷酸編碼根據(jù)本發(fā)明的信號肽。優(yōu)選地,通過下述方法構(gòu)建所述絲狀真菌宿主細胞,所述方法包括-提供合適的絲狀真菌宿主細胞,和-用以符合翻譯讀碼框的方式與所述第二多核苷酸連接的所述第一多核苷酸轉(zhuǎn)化所述宿主細胞。優(yōu)選地通過本領(lǐng)域公知的技術(shù)(見Sambrook & Russell ;Ausubel,上文),通過將多核苷酸、表達載體或核酸構(gòu)建體引入細胞中,來進行宿主細胞的轉(zhuǎn)化。轉(zhuǎn)化可涉及由以下組成的方法以本身已知的方式形成原生質(zhì)體、轉(zhuǎn)化原生質(zhì)體和再生細胞壁。用于轉(zhuǎn)化 Aspergillus 細胞的合適程序描述于 EP 238 023 和 Yelton et al.,1984,Proceedings of the National Academy of Sciences USA 81 :1470-1474 中。使用 Agrobacterium tumefaciens轉(zhuǎn)化Aspergillus和其他絲狀真菌宿主細胞的合適步驟描述于例如De Groot et al. ,Agrobacterium tumefaciens-mediated transformation of filamentous fungi. Nat Biotechnol. 1998,16 :839-842. Erratum in :Nat Biotechnol 1998 16 :1074 中。轉(zhuǎn)化Fusarium物種的合適方法由Malardier et al.,1989,Gene78 :147156描述或描述于 WO 96/00787中??梢詰闷渌椒?,例如使用如描述于Christiansen et al. ,Biolistic transformation of the obligate plant pathogenic fungus, Erysiphe graminis f. sp. hordei. 1995,Curr Genet. 29 :100-102 中的生物射彈轉(zhuǎn)化??梢允褂?Becker andGuarente, In Abelson, J. N. and Simon, Μ. I. , editors, Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology,Volume 194,pp 182—187, Academic Press, Inc. , New York ;Ito et al. , 1983, Journal of Bacteriology 153 :163 ;禾口 Hinnen et al. , 1978, Proceedings of the National Academy of Sciences USA 75 :1920 ^步驟轉(zhuǎn)化酵母。使用本領(lǐng)域已知的方法,在適合生產(chǎn)感興趣的重組多肽的營養(yǎng)培養(yǎng)基中培養(yǎng)根據(jù)本發(fā)明的絲狀真菌宿主細胞。例如,可以在合適的培養(yǎng)基中和允許多肽表達和/或分離的條件下,通過在實驗室或工業(yè)發(fā)酵罐中進行的搖瓶培養(yǎng)、小規(guī)?;虼笠?guī)模發(fā)酵(包括連續(xù)、 分批、進料分批或固體狀態(tài)發(fā)酵)來培養(yǎng)細胞。使用本領(lǐng)域已知的程序(見例如Bennett, J. W. and LaSure, L,eds.,More Gene Manipulations in Fungi,Academic Press,CA, 1991),在包含碳源和氮源和無機鹽的合適營養(yǎng)培養(yǎng)基中進行培養(yǎng)。合適的培養(yǎng)基可來自商業(yè)供應商,或者可以使用(例如American Type Culture Collection產(chǎn)品目錄中)公開的組合物制備。如果多肽被分泌進營養(yǎng)培養(yǎng)基中,則多肽可從培養(yǎng)基中直接回收。如果多肽不被分泌,則從細胞裂解物中回收。可以通過本領(lǐng)域已知的方法從培養(yǎng)基中回收生產(chǎn)的感興趣的重組多肽。例如,可以通過常規(guī)步驟從培養(yǎng)基中回收多肽,所述常規(guī)步驟包括但不限于離心、過濾、萃取、噴霧干燥、蒸發(fā)或沉淀??梢酝ㄟ^本領(lǐng)域已知的多種程序純化感興趣的重組多肽,所述程序包括但不限于色譜法(例如離子交換、親合、疏水、色譜聚焦和尺寸排除)、電泳程序(例如制備的等電位聚焦)、差異溶解度(例如硫酸銨沉淀)、SDS-PAGE或萃取(見例如ftOtein Purification, J.-C. Janson and Lars Ryden, editors, VCH Publishers, New York,1989)。可以使用本領(lǐng)域已知的對多肽特異性的方法來檢測感興趣的重組多肽。這些檢測方法可包括使用特異性抗體、高效液相色譜、毛細色譜、電泳、酶產(chǎn)物的形成、或酶底物的消失。根據(jù)本發(fā)明的宿主細胞是絲狀真菌宿主細胞?!敖z狀真菌”包括(如Hawksworth et al. , In, Ainsworth and Bisby' s Dictionary of The Fungi,8thedition, 1995, CAB International, University Press, Cambridge, UK 所定義的)Eumycota 禾口 Oomycota 亞門的所有絲狀形式。絲狀真菌的特征是由甲殼質(zhì)、纖維素、葡聚糖、殼聚糖、甘露聚糖和其他復合多糖組成的菌絲壁。營養(yǎng)生長通過菌絲伸長進行,并且碳代謝是專性需氧的。絲狀真菌菌株包括但不限于 Acremonium、Agaricus、Aspergillus、Aureobasidium、Chrysosporium、 Coprinus、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、MucorΛ Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、 Panerochaete、Pleurotus、Sporotrichum、Schizophyllum、Talaromyces、Thermoascus、 Thielavia、Tolypocladium 禾口 Trichoderma 的菌株。優(yōu)選的絲狀真菌細胞屬于 Acremonium、Aspergillus、Chrysosporium、 Myceliophthora、Penicillium、Sporotrichum、Talaromyces、Thielavia 或 Trichoderma 屬的禾中,最優(yōu)選地屬于 Acremonium alabamensis、Aspergillus niger、Aspergillus awamoriλ Aspergillus foetidus、Aspergillus sojae、Aspergillus fumigatus、 Aspergillus oryzae、Chrysosporium lucknowense、Myceliophthora thermophila、Sporotrichum eellulophilum>Thielavia terrestris>Trichoderma reesei>Talaromyces emersonii 或Penicillium chrysogenum 的禾中。絲狀真菌的若干菌株是公眾能夠容易地從大量培養(yǎng)物保藏機構(gòu)例如American Type Culture Collection (ATCC)、Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH (DSM)、Centraalbureau Voor Schimmelcultures (CBS)禾口 Agricultural Research Service Patent Culture Collection, Northern Regional Research Center (NRRL)獲得的,Aspergillus niger CBS 513. 88、Aspergillus oryzae ATCC 20423、IFO 4177、ATCC1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892, P.chrysogenum CBS 455.95, Penicillium citrinum ATCC 38065, Penicillium chrysogenum P2, Acremonium chrysogenum ATCC 36225 或 ATCC 48272, Trichoderma reesei ATCC 26921 或 ATCC 56765 或 ATCC 26921, Aspergillus sojae ATCCl1906, Chrysosporium lucknowense ATCC44006, Talaromyces emersonii CBS393.64 或 CBS814. 70及其衍生物。任選地,宿主細胞包含與野生型細胞相比提高的解折疊蛋白應答(UPR),以增強感興趣的多肽的生產(chǎn)能力??梢酝ㄟ^US2004/0186070A1和/或US2001/0034045A1和/或 W001/72783A2和/或W02005/123763中描述的技術(shù)提高UPR。更特定地,為了獲得具有提高的UPR的宿主細胞,調(diào)控了 HACl和/或IREl和/或PTC2的蛋白質(zhì)水平,和/或改造了 SEC61蛋白質(zhì)?;蛘?,或與提高的WR組合,對宿主細胞進行遺傳修飾,以獲得與野生型細胞相比展示更低蛋白酶表達和/或蛋白酶分泌的表型,從而增強感興趣的多肽的生產(chǎn)能力。此類表型可以通過蛋白酶表達的轉(zhuǎn)錄調(diào)節(jié)子的缺失和/或修飾和/或失活來獲得。此類轉(zhuǎn)錄調(diào)節(jié)子可以是例如prtT。通過調(diào)控prtT來降低蛋白酶的表達可以通過US2004/0191864A1中描述的技術(shù)進行?;蛘?,或與提高的WR和/或展示更低蛋白酶表達和/或蛋白酶分泌的表型組合, 宿主細胞展示了草酸鹽缺陷型表型,從而增強感興趣的多肽的生產(chǎn)產(chǎn)量。草酸鹽缺陷型表型可以通過W02004/070022A2中描述的技術(shù)獲得?;蛘?,或與提高的WR和/或展示更低蛋白酶表達和/或蛋白酶分泌和/或草酸鹽缺陷的表型組合,宿主細胞展示了與野生型相比的表型差異的組合,以增強感興趣的多肽的生產(chǎn)產(chǎn)率。這些差異可包括但不限于,降低的葡糖淀粉酶和/或中性α-淀粉酶A和 /或中性α-淀粉酶B蛋白酶和草酸水解酶的表達。宿主細胞展示的所述表型差異可以通過根據(jù)US2004/0191864A1中所述技術(shù)的遺傳修飾獲得?;蛘?,或與提高的WR和/或展示更低蛋白酶表達和/或蛋白酶分泌和/或草酸鹽缺陷的表型和與野生型相比為了增強感興趣的多肽生產(chǎn)產(chǎn)率的表型差異的組合相組合, 宿主細胞展示毒素基因的缺陷,使得絲狀真菌宿主細胞失去表達毒素的能力。此類毒素包括但不限于,赭曲毒素,煙曲霉毒素,環(huán)并偶氮酸(cyclapiazonic acid),3-硝基丙酸,布洛芬,畸形素,黃曲霉毒素和黑麥酸。此類缺陷優(yōu)選地例如描述于W02000/039322中。感興趣的多肽可以是具有感興趣的生物活性的任何多肽。多肽對宿主細胞而言可以是天然的或異源的。異源的多肽在本文中被定義為對宿主細胞而言并非天然的多肽,或者其中進行了結(jié)構(gòu)修飾以改變多肽的天然多肽。多肽可以是膠原或明膠,或其變體或雜種(hybrid)。多肽可以是任何抗體或其部分,抗原,凝血因子,酶,激素或激素變體,受體或其部分,調(diào)節(jié)蛋白,結(jié)構(gòu)蛋白,報告蛋白,或轉(zhuǎn)運蛋白,天然涉及分泌過程的蛋白質(zhì),涉及折疊過程的蛋白質(zhì),伴侶蛋白,肽氨基酸轉(zhuǎn)運蛋白,糖基化因子,轉(zhuǎn)錄因子,寡肽,天然是細胞內(nèi)的蛋白質(zhì)。天然是細胞內(nèi)的蛋白質(zhì)可以是酶例如蛋白酶、神經(jīng)酰胺酶、環(huán)氧化物水解酶、氨肽酶、?;D(zhuǎn)移酶、醛縮酶、羥化酶、氨肽酶、脂肪酶。感興趣的重組多肽優(yōu)選地是細胞外分泌的酶。此類酶可屬于氧化還原酶、轉(zhuǎn)移酶、水解酶、裂合酶、異構(gòu)酶、連接酶、過氧化氫酶、 纖維素酶、幾丁質(zhì)酶、角質(zhì)酶、脫氧核糖核酸酶、聚糖酶、酯酶的組。酶可以是糖酶,例如纖維素酶如內(nèi)切葡聚糖酶,β-葡聚糖酶,纖維二糖水解酶或β-葡糖苷酶,半纖維素酶或果膠分解酶如木聚糖酶,木糖苷酶,甘露聚糖酶,半乳聚糖酶,半乳糖苷酶,果膠甲基酯酶,果膠裂合酶,果膠酸裂合酶,內(nèi)切多聚半乳糖醛酸酶,外切多聚半乳糖醛酸酶,鼠李半乳糖醛酸酶,阿拉伯聚糖酶,阿拉伯呋喃糖苷酶(arabinofuranosidases),阿拉伯木聚糖水解酶, 半乳糖醛酸酶,裂合酶,或淀粉酶;水解酶,異構(gòu)酶,或連接酶,磷酸酶如植酸酶,酯酶如脂肪酶,蛋白水解酶,氧化還原酶如氧化酶,轉(zhuǎn)移酶,或異構(gòu)酶。酶可以是植酸酶。酶可以是天冬酰胺酶,氨肽酶,淀粉酶,糖酶,羧肽酶,內(nèi)切蛋白酶,金屬蛋白酶,絲氨酸-蛋白酶接觸酶, 幾丁質(zhì)酶,角質(zhì)酶,環(huán)糊精糖基轉(zhuǎn)移酶,脫氧核糖核酸酶,酯酶,α-半乳糖苷酶,β-半乳糖苷酶,葡萄糖淀粉酶,α-葡糖苷酶,β -葡糖苷酶,鹵素過氧化物酶(haloperoxidase),蛋白水解酶,轉(zhuǎn)化酶,漆酶,脂肪酶,甘露糖苷酶,變構(gòu)酶,氧化酶,果膠分解酶,過氧化物酶,磷脂酶,多酚氧化酶,核糖核酸酶,轉(zhuǎn)谷氨酰胺酶,或葡萄糖氧化酶,己糖氧化酶,單加氧酶。多肽還包括上述多肽的天然存在的等位基因變異和經(jīng)改造的變異。根據(jù)本發(fā)明,感興趣的多肽也可以是融合的多肽或雜種多肽,另一多肽在所述多肽或其片段的N-端或C-端與之融合。融合的多肽通過將編碼一種多肽的核酸序列與編碼另一多肽的核酸序列(或其部分)融合來生產(chǎn)。雜種多肽可包含得自至少兩種不同多肽的部分或全部多肽序列的組合,其中所述至少兩種不同多肽中的一種或多種對宿主細胞而言可以是異源的。根據(jù)本發(fā)明的方法被便利地用于生產(chǎn)感興趣的重組多肽。因此,在第二方面中,本發(fā)明涉及通過根據(jù)本發(fā)明第一方面的方法生產(chǎn)的感興趣的重組多肽。優(yōu)選地,所述多肽是如上文所述的酶。本發(fā)明還涉及中間產(chǎn)物,即由于第二多核苷酸以符合翻譯讀碼框的方式連接的第一多核苷酸編碼的感興趣的多肽,所述第二多核苷酸編碼感興趣的多肽,所述第一多核苷酸編碼根據(jù)本發(fā)明的信號肽。感興趣的多肽優(yōu)選地是本發(fā)明第一方面中描述的感興趣的多肽。優(yōu)選地,信號肽是選自下組的信號肽,所述組由a) SEQ ID NO 25,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同,c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,d) SEQ ID NO 39,
e) 15到23個氨基酸的SEQ ID NO 39的變體,其中至少8個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同,f) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,g) SEQ ID NO 44,h) 15到23個氨基酸的SEQ ID NO 44的變體,其中至少8個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同,i) 15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,j)SEQ ID NO :34,k) 15到23個氨基酸的SEQ ID NO 34的變體,其中至少8個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸構(gòu)成。根據(jù)一個實施方案,在中間產(chǎn)物中,信號肽是SEQ ID NO :25。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是SEQ ID NO :39。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是15到23個氨基酸的SEQ ID NO 39的變體,其中至少8個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是SEQ ID NO 44 根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是15到23個氨基酸的SEQ ID NO 44的變體,其中至少8個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是15到23個氨基酸的SEQ ID N0 44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是SEQ ID NO :34。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是15到23個氨基酸的SEQ ID N0 34的變體,其中至少8個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是15到23個氨基酸的SEQ ID N034的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。優(yōu)選地,在中間產(chǎn)物中,當信號肽是以下時a) SEQ ID NO 25,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同,或c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,感興趣的多肽不是果膠甲基酯酶,更優(yōu)選地感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。更優(yōu)選地,當信號肽是(b)或(c)時,感興趣的多肽不是果膠甲基酯酶,進一步更優(yōu)選地感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。優(yōu)選地,編碼SEQ ID NO 25時,第一多核苷酸是根據(jù)SEQ ID NO 29的多核苷酸。 優(yōu)選地,編碼SEQ ID NO 39時,第一多核苷酸是根據(jù)SEQ ID NO 38的多核苷酸。優(yōu)選地, 編碼SEQ ID NO :44時,第一多核苷酸是根據(jù)SEQ ID NO :43的多核苷酸。優(yōu)選地,編碼SEQ ID NO 34時,第一多核苷酸是根據(jù)SEQ ID NO 33的多核苷酸。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :25的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :25的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 25的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 25的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸,c) 15到23個氨基酸的SEQ ID NO :25的變體,其中第1位的氨基酸是Met,第2、 3和/或4位的氨基酸是Val或Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或 Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,d) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :39的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :39的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 39的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2、3 和/或5位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :44的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :44的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 44的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 44的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 44的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :34的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :34的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 34的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 34的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu 的氨基酸,b) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少 5個選自Ala或Leu的氨基酸,c) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,
d) 15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,e) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,f) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,g) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,h) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個Ala,i) 15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少4個Ala和1個Leu,j) 15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少3個Ala和2個Leu,k) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少2個Ala和3個Leu,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少1個Ala和4個Leu,m) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個Leu,η) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,ο) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu、Ala,ρ) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個Ala,q) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少4個Ala和1個Leu,r) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少3個Ala和2個Leu,s) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少2個Ala和3個Leu,t) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少1個Ala和4個Leu,u) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個Leu。在上述SEQ ID NO 25 的變體(a)到(d)、SEQ ID NO 39 的變體(a)禾口 (b),SEQ ID NO 44的變體(a)和(b)和SEQ ID NO 34的變體(a)到(U)中,連續(xù)串優(yōu)選地為10個氨基酸,更優(yōu)選地為9個氨基酸,進一步更優(yōu)選地為8個氨基酸,最優(yōu)選地為7個氨基酸。在上述SEQ ID NO 25 的變體(a)到(d)、SEQ ID NO 39 的變體(a)禾口 (b),SEQ ID NO 44的變體(a)和(b)和SEQ ID NO 34的變體(a)到(U)中,氨基酸的連續(xù)串優(yōu)選地包含至少5個選自Ala或Leu的氨基酸,更優(yōu)選地包含至少6個選自Ala或Leu的氨基酸,最優(yōu)選地包含至少7個選自Ala或Leu的氨基酸。15 到 23 個氨基酸的 SEQ ID NO 25、SEQ ID NO 39、SEQ ID NO 44 或 SEQ ID NO: 34變體可包含15個氨基酸、16個氨基酸、17個氨基酸、18個氨基酸、19個氨基酸、20個氨基酸、21個氨基酸、22個氨基酸或23個氨基酸。在第三方面中,本發(fā)明涉及包含以下的重組表達構(gòu)建體以符合翻譯讀碼框的方式與第二多核苷酸連接的第一多核苷酸,所述第二多核苷酸編碼感興趣的多肽,所述第一多核苷酸編碼根據(jù)本發(fā)明的信號肽。感興趣的多肽優(yōu)選地是本發(fā)明第一方面中描述的感興趣的多肽。優(yōu)選地,當信號肽是以下時a) SEQ ID NO 25,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同,或c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,感興趣的多肽不是果膠甲基酯酶,更優(yōu)選地感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。更優(yōu)選地,當信號肽是(b)或(c)時,感興趣的多肽不是果膠甲基酯酶,進一步更優(yōu)選地感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。優(yōu)選地,編碼SEQ ID NO 25時,第一多核苷酸是根據(jù)SEQ ID NO 29的多核苷酸。 優(yōu)選地,編碼SEQ ID NO 39時,第一多核苷酸是根據(jù)SEQ ID NO 38的多核苷酸。優(yōu)選地, 編碼SEQ ID NO :44時,第一多核苷酸是根據(jù)SEQ ID NO :43的多核苷酸。優(yōu)選地,編碼SEQ ID NO 34時,第一多核苷酸是根據(jù)SEQ ID NO 33的多核苷酸。本發(fā)明還涉及還包含以下的所述重組表達構(gòu)建體與以符合讀碼框的方式與第二多核苷酸連接的第一多核苷酸可操作地連接的啟動子,所述第二多核苷酸編碼感興趣的多肽,所述第一多核苷酸編碼根據(jù)本發(fā)明的信號肽。感興趣的多肽優(yōu)選地是本發(fā)明第一方面中描述的感興趣的多肽。本發(fā)明還涉及包含上文所述的表達構(gòu)建體的重組表達載體。術(shù)語“核酸構(gòu)建體”在本文中是指單鏈或雙鏈的核酸分子,其與天然存在的基因分離,或者已被修飾為含有下述核酸區(qū)段,所述核酸區(qū)段以天然不會存在的方式組合和并置。 當核酸構(gòu)建體含有表達編碼序列所需的所有控制序列(其中所述控制序列與所述編碼序列可操作地連接)時,術(shù)語“核酸構(gòu)建體”與術(shù)語“表達盒”同義。
術(shù)語“控制序列”在本文中被定義為包括對mRNA和/或多肽的體外表達或在宿主細胞中的表達而言必需的或有利的所有組件。每種控制序列對編碼多肽的核酸序列而言可以是內(nèi)源的或外源的。此類控制序列可包括,但不限于Siine-Delgarno序列、最適翻譯起始序列(如Kozak, 1991,J. Biol. Chem. 266 :19867-19870中所述)、多聚腺苷酸化序列、啟動子和轉(zhuǎn)錄終止子??刂菩蛄兄辽侔▎幼右约稗D(zhuǎn)錄和翻譯終止信號??梢葬槍ζ涮囟ǖ挠猛緝?yōu)化控制序列。優(yōu)選地,DNA構(gòu)建體包含啟動子DNA序列,與所述啟動子DNA序列可操作地連接的編碼序列,和控制序列例如-一個選自以下序列列表的由5’朝向3’方向的翻譯終止序列TAAG、TAGA和 TAAA,優(yōu)選地TAAA,和/或-一個選自以下序列列表的由5’朝向3’方向的翻譯起始子編碼序列GCTACCCCC ; GCTACCTCC ;GCTACCCTC ;GCTACCTTC ;GCTCCCCCC ;GCTCCCTCC ;GCTCCCCTC ;GCTCCCTTC ; GCTGCCCCC ;GCTGCCTCC ;GCTGCCCTC ; GCTGCCTTC ;GCTTCCCCC ;GCTTCCTCC ; GCTTCCCTC ;和 GCTTCCTTC,優(yōu)選地 GCT TCC TTC,和 / 或-選自以下序列列表的翻譯起始子序列5,-mwChkyCAAA-3,;5,-mwChkyCACA-3, 或 5’ -mwChkyCAAG-3’,使用核苷酸的模糊編碼m(A/C) ;w(A/T) ;y(C/T) ;k(G/T) ;h(A/C/ Τ),優(yōu)選地 5,-CACCGTCAAA-3’ 或 5,-CGCAGTCAAG-3,。在本發(fā)明的上下文中,術(shù)語“翻譯起始子編碼序列”被定義為DNA編碼序列開放讀碼框起始子或起始密碼子緊下游的9個核苷酸。起始子或起始密碼子編碼AA甲硫氨酸。起始密碼子典型地為ATG,但是也可以是任何功能性起始密碼子如GTG。在本發(fā)明的上下文中,術(shù)語“翻譯終止序列”被定義為從開放讀碼框或核苷酸編碼序列3’端的翻譯終止密碼子開始并按5’到3’方向的四個核苷酸。在本發(fā)明的上下文中,術(shù)語“翻譯起始子序列”被定義為編碼多肽的DNA序列開放讀碼框的起始子或起始密碼子緊上游的十個核苷酸。起始子或起始密碼子編碼AA甲硫氨酸。起始密碼子典型地為ATG,但是也可以是任何功能性起始密碼子如GTG。本領(lǐng)域公知在 RNA中尿嘧啶U代替脫氧核苷酸胸腺嘧啶Τ??梢詾榱艘胩囟ǖ南拗菩晕稽c而對控制序列提供連接子,所述特定的限制性位點有助于將控制序列與編碼多肽的核酸序列的編碼區(qū)連接??刂菩蛄锌梢允呛线m的啟動子序列,啟動子序列是被宿主細胞識別用于表達核酸序列的核酸序列。啟動子序列含有介導多肽表達的轉(zhuǎn)錄控制序列。啟動子可以是在細胞中顯示轉(zhuǎn)錄活性的任何核酸序列,包括突變、截短和雜種的啟動子,并且可得自編碼對細胞而言同源或異源的細胞外或細胞內(nèi)多肽的基因??刂菩蛄幸部梢允呛线m的轉(zhuǎn)錄終止子序列,這是被絲狀真菌細胞識別為終止轉(zhuǎn)錄的序列。終止子序列與編碼多肽的核酸序列的3'-端可操作地連接。本發(fā)明中可以使用在細胞中發(fā)揮功能的任何終止子。對絲狀真菌細胞而言優(yōu)選的終止子得自編碼以下的基因A. oryzae TAKA淀粉酶、 A.niger葡糖淀粉酶(glaA)、A. nidulans鄰氨基苯甲酸合酶、A. niger α-葡糖苷酶、trpC 基因和Fusarium oxysporum胰蛋白酶樣蛋白酶??刂菩蛄幸部梢允嵌嗑巯佘账峄蛄?,這是與核酸序列3'-端可操作地連接的序列,其轉(zhuǎn)錄后被絲狀真菌細胞識別為對所轉(zhuǎn)錄的mRNA添加多聚腺苷殘基的信號。本發(fā)明中可以使用在細胞中有功能的任何多聚腺苷酸化序列。對絲狀真菌細胞而言優(yōu)選的多聚腺苷酸化序列得自編碼以下的基因Aoryzae TAKA淀粉酶、A. niger葡糖淀粉酶、A. nidulans鄰氨基苯甲酸合酶、Fusarium oxysporum胰蛋白酶樣蛋白酶和A.niger α-葡糖苷酶。術(shù)語“啟動子”在本文中被定義為結(jié)合RNA聚合酶并指導聚合酶到達編碼生物化合物的核酸序列的正確下游轉(zhuǎn)錄起始位點處從而起始轉(zhuǎn)錄的DNA序列。RNA聚合酶有效地催化與編碼區(qū)的適當DNA鏈互補的信使RNA的裝配。術(shù)語“啟動子”還可被理解為包括在轉(zhuǎn)錄成mRNA后用于翻譯的5'-非編碼區(qū)(啟動子和翻譯起點之間),順式作用轉(zhuǎn)錄控制元件如增強子,和能夠與轉(zhuǎn)錄因子相互作用的其他核苷酸序列。啟動子可以是適用于真核或原核宿主細胞的任何合適的啟動子序列,其顯示轉(zhuǎn)錄活性,包括突變、截短和雜種的啟動子, 并且可得自編碼對細胞而言同源(天然)或異源(外源)的細胞外或細胞內(nèi)多肽的基因。 啟動子可以是組成型或誘導型啟動子??梢允褂玫恼T導型啟動子的例子是淀粉誘導型啟動子、銅誘導型啟動子、油酸誘導型啟動子。啟動子可選自下組,所述組包括但不限于下述啟動子,所述啟動子得自編碼以下的基因A.oryZae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A. niger中性α -淀粉酶、A. niger酸穩(wěn)定性α -淀粉酶、A. niger或A. awamori 葡糖淀粉酶(glaA)、R. miehei脂肪酶、A. oryzae堿性蛋白酶、A. oryzae磷酸丙糖異構(gòu)酶、 A. nidulans乙酰胺酶、NA2_tpi啟動子(來自編碼A. niger中性α -淀粉酶和A. oryzae 磷酸丙糖異構(gòu)酶的基因的啟動子的雜種),及其突變、截短和雜種的啟動子。在絲狀真菌細胞中使用的尤其優(yōu)選的啟動子是來自蛋白酶基因的啟動子或其功能性部分;例如來自 F. oxysporum胰蛋白酶樣蛋白酶基因(U. S. 4,288,627)、A. oryzae堿性蛋白酶基因(alp)、 A. niger pacA基因、A. oryzae堿性蛋白酶基因、A. oryzae中性金屬蛋白酶基因、A. niger曲霉肽酶蛋白酶P印A基因或F. venenatum胰蛋白酶基因、A. niger天冬氨酸蛋白酶ρ印B基因。其他優(yōu)選的啟動子是W02006/092396和W02005/100573中描述的啟動子,所述參考文獻通過引用并入本文。當感興趣的重組多肽是由兩個或更多多肽(部分)組成的嵌合多肽時,本領(lǐng)域技術(shù)人員已知如何使用本領(lǐng)域已知的方法構(gòu)建這些和其他嵌合多核苷酸構(gòu)建體。為了促進表達和/或翻譯,根據(jù)本發(fā)明的多核苷酸或核酸構(gòu)建體可包含在表達載體中,使得本發(fā)明的多核苷酸與用于在體外、或原核或真核宿主細胞中表達和/或翻譯的適當控制序列可操作地連接。重組表達載體可以是任何載體(例如質(zhì)?;虿《?,可對其便利地進行重組DNA程序,并且可導致編碼多肽的核酸序列的表達。載體的選擇典型地應取決于載體與引入所述載體的宿主細胞的相容性。載體可以是線性或閉合環(huán)狀質(zhì)粒。載體可以是自主復制載體, 即作為染色體外實體存在的載體,其復制獨立于染色體復制,例如質(zhì)粒、染色體外元件、微型染色體、或人工染色體。自主維持的克隆載體可包含AMAl-序列(見例如Aleksenko and Clutterbuck(1997),F(xiàn)ungal Genet. Biol. 21 :373-397)?;蛘撸d體可以是在引入宿主細胞后被整合進基因組中并與整合了所述載體的染色體一起復制的載體。整合型克隆載體可在宿主細胞染色體中隨機整合,或在預定的靶基因座處整合。在本發(fā)明的一個優(yōu)選的實施方案中,整合型克隆載體包含與宿主細胞基因組中預定的靶基因座中的DNA序列同源的DNA片段,從而將克隆載體整合至該預定的基因座。為了促進定向整合,在轉(zhuǎn)化細胞之前優(yōu)選地將克隆載體線性化。優(yōu)選地以下述方式進行線性化,所述方式使得克隆載體的至少一端,優(yōu)選地任一端的側(cè)翼是與靶基因座同源的序列。靶基因座側(cè)翼的同源序列的長度優(yōu)選地至少為30bp,優(yōu)選地至少為50bp,優(yōu)選地至少為0. 11Λ,進一步優(yōu)選地至少為0. 21Λ,更優(yōu)選地至少為0. 51Λ,進一步更優(yōu)選地至少為 11Λ,最優(yōu)選地至少21Λ。優(yōu)選地,通過宿主細胞增強的同源重組能力提高了定向整合進宿主細胞基因組中(即在預定的靶基因座中整合)的效率。細胞的此類表型優(yōu)選地涉及如 W02005/095624中所述的缺陷型ku70基因。W02005/0956M公開了獲得包含提高的定向整合效率的絲狀真菌細胞的一種優(yōu)選的方法。優(yōu)選地,克隆載體中與靶基因座同源的同源側(cè)翼DNA序列源自高度表達的基因座,即它們源自能夠在宿主細胞中具有高表達水平的基因。能夠具有高表達水平的基因(即高度表達的基因)在本文中被定義為例如在被誘導的條件下,其mRNA能夠組成總細胞mRNA的至少0.5% (w/w)的基因,或者其基因產(chǎn)物能夠組成總細胞蛋白質(zhì)的至少(w/w)的基因,或者在分泌型基因產(chǎn)物的情況下,可以分泌到至少0. lg/Ι的水平(如EP 357 127 Bl中所述)。通過舉例給出了大量優(yōu)選的高度表達的真菌基因來自Aspergilli或Trichoderma的淀粉酶、葡糖淀粉酶、醇脫氫酶、木聚糖酶、 磷酸甘油醛脫氫酶或纖維二糖水解酶(cbh)基因。用于這些目的的最優(yōu)選的高度表達的基因是葡糖淀粉酶基因,優(yōu)選地為A. niger葡糖淀粉酶基因、A. oryzae TAKA-淀粉酶基因、 A. nidulans gpdA 基因、Trichoderma reesei cbh 基因,優(yōu)選地為 cbhl。可以向細胞中插入多于一個拷貝的核酸序列,以提高基因產(chǎn)物的生產(chǎn)。這可以如下完成優(yōu)選地通過向其基因組中整合進多個拷貝的DNA序列來完成,更優(yōu)選地通過將DNA 序列的整合靶向至在前一段中定義的高度表達的基因座之一處來完成。或者這可以如下完成包括可擴增的可選擇標記物基因與核酸序列,其中含有被擴增的可選擇標記物基因拷貝、從而存在額外的核酸序列拷貝的細胞可以通過在存在適當?shù)目蛇x擇試劑時培養(yǎng)細胞而被選擇。為了進一步提高要過表達的DNA序列的拷貝數(shù),可以使用如W098/46772中所述的基因轉(zhuǎn)化基因。載體系統(tǒng)可以是單個載體或質(zhì)粒,或兩個或更多的載體或質(zhì)粒,它們一起含有要被引入宿主細胞基因組中的總DNA,或是轉(zhuǎn)座子。載體優(yōu)選地含有一個或多個可選擇標記物,所述可選擇標記物允許容易地選擇被轉(zhuǎn)化的細胞??蛇x擇標記物是一種基因,其產(chǎn)物提供殺生物性或病毒抗性、對重金屬的抗性、對營養(yǎng)缺陷型的自養(yǎng)型等等。絲狀真菌細胞中使用的可選擇標記物可選自下組, 所述組包括但不限于amdS (乙酰胺酶),argB (鳥氨酸氨甲酰轉(zhuǎn)移酶),bar (膦絲菌素乙酰轉(zhuǎn)移酶),bleA(腐草霉素結(jié)合),hygB (潮霉素磷酸轉(zhuǎn)移酶),niaD (硝酸還原酶), PyrG(乳清酸核苷-5'-磷酸脫羧酶),sC(硫酸腺嘌呤基轉(zhuǎn)移酶)和trpC(鄰氨基苯甲酸合酶),以及來自其他物種的等同物。優(yōu)選用于Aspergillus和Penicillium細胞中的是 A. nidulans 或 A. oryzae 的 amdS (EP635574B1,WO 97/06261)和 pyrG 基因,禾口 Streptomyces hygroscopicus的bar基因。更優(yōu)選地使用amdS基因,進一步更優(yōu)選地使用來自A. nidulans或A. niger的amdS基因。最優(yōu)選的選擇標記物基因是與A. nidulans gpdA 啟動子融合的A. nidulans amdS編碼序列(見EP 635574B1)。其他優(yōu)選的AmdS標記物是 W02006/040358中所述的那些。也可以使用來自其他絲狀真菌的AmdS基因(W0 97/06261)。用于連接上文所述元件從而構(gòu)建本發(fā)明的重組表達載體的程序是本領(lǐng)域技術(shù)人員公知的(見例如Sambrook & Russell,上文)。在第四方面中,本發(fā)明涉及包含根據(jù)本發(fā)明第三方面的表達構(gòu)建體或包含根據(jù)本發(fā)明第三方面的表達載體的重組絲狀真菌宿主細胞。所述絲狀真菌宿主細胞優(yōu)選地是如本文先前所述的細胞。所述絲狀真菌宿主細胞可使用本領(lǐng)域已知的方法構(gòu)建。優(yōu)選地,所述絲狀真菌宿主細胞通過下述方法構(gòu)建,所述方法包括-提供合適的絲狀真菌宿主細胞,和-用根據(jù)本發(fā)明第三方面的表達構(gòu)建體或用根據(jù)本發(fā)明第三方面的表達載體轉(zhuǎn)化所述宿主細胞。絲狀真菌宿主細胞的轉(zhuǎn)化優(yōu)選地如本文之前所述進行。在第五方面中,本發(fā)明涉及根據(jù)本發(fā)明的信號肽用于生產(chǎn)感興趣的重組多肽的方法。因此,信號肽優(yōu)選地選自由以下組成的組a) SEQ ID NO 25,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同,c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,d) SEQ ID NO 39,e) 15到23個氨基酸的SEQ ID NO 39的變體,其中至少8個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同,f) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,g) SEQ ID NO 44,h) 15到23個氨基酸的SEQ ID NO 44的變體,其中至少8個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同,i) 15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,j)SEQ ID NO :34,k) 15到23個氨基酸的SEQ ID NO 34的變體,其中至少8個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)一個實施方案,信號肽是SEQ ID NO :25。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同。
根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,信號肽是SEQ ID NO :39。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 39的變體,其中至少8個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,信號肽是SEQ ID NO :44。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 44的變體,其中至少8個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,信號肽是SEQ ID NO :34。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 34的變體,其中至少8個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。優(yōu)選地,當信號肽是以下時a) SEQ ID NO 25,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同,或c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,感興趣的多肽不是果膠甲基酯酶,更優(yōu)選地感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。更優(yōu)選地,當信號肽是(b)或(c)時,感興趣的多肽不是果膠甲基酯酶,進一步更優(yōu)選地感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :25的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO 25的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 25的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 25的變體是選自下組的變體
a) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸,c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2、 3和/或4位的氨基酸是Val或Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或 Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,d) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :39的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :39的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 39的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 39的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2、3 和/或5位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :44的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :44的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 44的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 44的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 44的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :34的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :34的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 34的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 34的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu 的氨基酸,b) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少 5個選自Ala或Leu的氨基酸,c) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,d) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,e) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,f) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,g) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,h) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個Ala,i) 15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少4個Ala和1個Leu,j) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少3個Ala和2個Leu,k) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少2個Ala和3個Leu,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少1個Ala和4個Leu,m) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個Leu,η) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,ο) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu、Ala,ρ) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個Ala,q) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少4個Ala和1個Leu,r) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少3個Ala和2個Leu,s) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少2個Ala和3個Leu,t) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少1個Ala和4個Leu,u) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個Leu。在上述SEQ ID NO 25 的變體(a)到(d)、SEQ ID NO 39 的變體(a)禾口 (b),SEQ ID NO 44的變體(a)和(b)和SEQ ID NO 34的變體(a)到(U)中,連續(xù)串優(yōu)選地為10個氨基酸,更優(yōu)選地為9個氨基酸,進一步更優(yōu)選地為8個氨基酸,最優(yōu)選地為7個氨基酸。在上述SEQ ID NO 25 的變體(a)到(d)、SEQ ID NO 39 的變體(a)禾口 (b),SEQ ID NO 44的變體(a)和(b)和SEQ ID NO 34的變體(a)到(U)中,氨基酸的連續(xù)串優(yōu)選地包含至少5個選自Ala或Leu的氨基酸,更優(yōu)選地包含至少6個選自Ala或Leu的氨基酸,最優(yōu)選地包含至少7個選自Ala或Leu的氨基酸。15 到 23 個氨基酸的 SEQ ID NO 25、SEQ ID NO 39、SEQ ID NO 44 或 SEQ ID NO 34變體可包含15個氨基酸、16個氨基酸、17個氨基酸、18個氨基酸、19個氨基酸、20個氨基酸、21個氨基酸、22個氨基酸或23個氨基酸。在第六方面中,本發(fā)明涉及編碼根據(jù)本發(fā)明的信號肽的多核苷酸用于生產(chǎn)感興趣的重組多肽的用途。因此,信號肽優(yōu)選地選自由以下組成的組a) SEQ ID NO 25,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同,c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,d) SEQ ID NO 39,e) 15到23個氨基酸的SEQ ID NO 39的變體,其中至少8個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同,f) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,g) SEQ ID NO 44,h) 15到23個氨基酸的SEQ ID NO 44的變體,其中至少8個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同,i) 15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,j)SEQ ID NO :34,k) 15到23個氨基酸的SEQ ID NO 34的變體,其中至少8個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)一個實施方案,信號肽是SEQ ID NO :25。根據(jù)另一個實施方案,在中間產(chǎn)物中,信號肽是15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,信號肽是SEQ ID NO :39。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 39的變體,其中至少8個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,信號肽是SEQ ID NO :44。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 44的變體,其中至少8個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 44變體,其中第 1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。根據(jù)另一個實施方案,信號肽是SEQ ID NO :34。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 34的變體,其中至少8個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同。根據(jù)另一個實施方案,信號肽是15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸。優(yōu)選地,當信號肽是以下時a) SEQ ID NO 25,
b) 15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同,或c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨
基酸,感興趣的多肽不是果膠甲基酯酶,更優(yōu)選地感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。更優(yōu)選地,當信號肽是(b)或(c)時,感興趣的多肽不是果膠甲基酯酶,進一步更優(yōu)選地感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。優(yōu)選地,編碼SEQ ID NO 25時,第一多核苷酸是根據(jù)SEQ ID NO 29的多核苷酸。 優(yōu)選地,編碼SEQ ID NO :39時,第一多核苷酸是根據(jù)SEQ ID NO :38的多核苷酸。優(yōu)選地, 編碼SEQ ID NO :44時,第一多核苷酸是根據(jù)SEQ ID NO :43的多核苷酸。優(yōu)選地,編碼SEQ ID NO 34時,第一多核苷酸是根據(jù)SEQ ID NO 33的多核苷酸。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :25的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :25的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 25的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 25的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 25的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸,c) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2、 3和/或4位的氨基酸是Val或Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或 Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,d) 15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第3位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :39的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :39變體是下述的變體,其中至少9個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 39的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 39的變體是選自下組的變體
a) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2、3 和/或5位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO 39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第5位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :44的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :44的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 44的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 44的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 44的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 44的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala 或Leu的氨基酸,b) 15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,第4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自 Ala或Leu的氨基酸。優(yōu)選地,其中至少8個氨基酸與SEQ ID NO :34的前10個氨基酸在相應位置上相同的、15到23個氨基酸的SEQ ID NO :34的變體是下述變體,其中至少9個氨基酸與SEQ ID NO 34的前10個氨基酸在相應位置上相同。更優(yōu)選地,10個氨基酸與SEQ ID NO 34的前 10個氨基酸在相應位置上相同。優(yōu)選地,其中第1位的氨基酸是Met、第2位的氨基酸是Val或Lys、并且其中10 個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸的、15到23個氨基酸的SEQ ID NO 34的變體是選自下組的變體a) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu 的氨基酸,b) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少 5個選自Ala或Leu的氨基酸,c) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2、3 和/或4位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,d) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,第3和/或4位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,e) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,f) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,g) 15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu和Ala,h) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個Ala,i) 15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少4個Ala和1個Leu,j) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少3個Ala和2個Leu,k) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少2個Ala和3個Leu,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少1個Ala和4個Leu,m) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val,并且其中10個氨基酸的連續(xù)串包含至少5個Leu,η) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,ο) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,并且其中變體最后三個位置上的氨基酸是Ala、Leu、Ala,ρ) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個Ala,q) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少4個Ala和1個Leu,r) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少3個Ala和2個Leu,s) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少2個Ala和3個Leu,t) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少1個Ala和4個Leu,u) 15到23個氨基酸的SEQ ID NO 34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Lys,并且其中10個氨基酸的連續(xù)串包含至少5個Leu。在上述SEQ ID NO 25 的變體(a)到(d)、SEQ ID NO 39 的變體(a)禾口 (b),SEQ ID NO 44的變體(a)和(b)和SEQ ID NO 34的變體(a)到(U)中,連續(xù)串優(yōu)選地為10個氨基酸,更優(yōu)選地為9個氨基酸,進一步更優(yōu)選地為8個氨基酸,最優(yōu)選地為7個氨基酸。
在上述SEQ ID NO 25 的變體(a)到(d)、SEQ ID NO 39 的變體(a)禾口 (b),SEQ ID NO 44的變體(a)和(b)和SEQ ID NO 34的變體(a)到(U)中,氨基酸的連續(xù)串優(yōu)選地包含至少5個選自Ala或Leu的氨基酸,更優(yōu)選地包含至少6個選自Ala或Leu的氨基酸,最優(yōu)選地包含至少7個選自Ala或Leu的氨基酸。15 到 23 個氨基酸的 SEQ ID NO 25、SEQ ID NO 39、SEQ ID NO 44 或 SEQ ID NO 34的變體可包含15個氨基酸、16個氨基酸、17個氨基酸、18個氨基酸、19個氨基酸、20個氨基酸、21個氨基酸、22個氨基酸或23個氨基酸。本文提供的序列信息不應被狹窄地理解為要求包括錯誤鑒定的堿基。本文公開的特定序列可容易地被用于從各個宿主細胞中分離完整的基因,所述完整的基因可隨后被容易地進行序列分析,從而鑒定序列錯誤。除非另有說明,本文通過測序DNA分子測定的所有核苷酸序列都使用自動化DNA 測序儀測定,由本文測定的DNA分子編碼的多肽的所有氨基酸序列都通過翻譯如上文測定的核酸序列來預測。因此,如本領(lǐng)域針對通過該自動化途徑測定的任何DNA序列所已知的, 本文測定的任何核苷酸序列可含有一些錯誤。通過自動化測定的核苷酸序列可典型地與被測序的DNA分子的實際核苷酸序列至少約90 %相同,更典型地至少約95 %到至少約99. 9 % 相同。實際序列可通過其他途徑更精確地測定,包括本領(lǐng)域中公知的手動DNA測序方法。 還如本領(lǐng)域所已知的,與實際序列相比被測定的核苷酸序列中的單個插入或缺失會在核苷酸序列翻譯中引起移碼,使得所預測的由測定的核苷酸序列編碼的氨基酸序列與被測序的 DNA分子實際編碼的氨基酸序列從此類插入或缺失點開始完全不同。本領(lǐng)域技術(shù)人員能夠鑒定此類被錯誤鑒定的堿基,并且知道如何糾正此類錯誤。本文所描述和要求保護的發(fā)明在范圍上不受本文公開的特定實施方案的限制,因為這些實施方案旨在闡述本發(fā)明的若干方面。任何等同的實施方案旨在落入本發(fā)明的范圍內(nèi)。事實上,除了本文所展示盒描述的以外,本領(lǐng)域技術(shù)人員根據(jù)前述說明書能夠明白對本發(fā)明的多種修飾。此類修飾也旨在落入附帶的權(quán)利要求書的范圍內(nèi)。在沖突的情況下,采取包括定義在內(nèi)的本公開作為指導。本發(fā)明通過以下實施例進一步說明。
實施例菌株WT 1 該A. niger菌株被用作野生型菌株。該菌株以保藏號CBS513. 88保藏于CBS Institute。WT 2 該A. niger菌株是包含編碼葡糖淀粉酶的基因(glaA)缺失的WT 1菌株。 如EP 0 635 574 Bl中所述通過使用“MARKER-GENE FREE”途徑構(gòu)建WT 2。在該專利中詳盡地描述了如何在CBS 513.88的基因組中缺失glaA特異的DNA序列。所述程序?qū)е?MARKER-GENE FREE Δ glaA重組體A. niger CBS 513. 88菌株,所述菌株最終完全不具有外來DNA序列。WT 3 該A. niger菌株是包含下述缺失的WT 2菌株,所述缺失導致草酸鹽/酯缺陷型A. niger菌株。通過使用EP1157100和US6,936,438中所述的方法構(gòu)建WT 3,其中通過缺失編碼草酰乙酸水解酶的oahA基因獲得草酸鹽/酯缺陷型菌株,菌株WT 3被選擇為在WT 2菌株背景中失活了 oahA基因的代表性菌株?;蛘撸贓P1590444中詳盡地描述了如何篩選草酸鹽/酯缺陷型突變體A. niger 菌株。根據(jù)EP1590444的實施例1和2,描述了如何獲得WT 2的草酸鹽/酯缺陷型突變體菌株。WT 4 該A.niger菌株是包含在三個后續(xù)步驟中編碼α-淀粉酶的三個基因 (amyB、amyBI和amyBII)缺失的WT 3菌株。缺失載體的構(gòu)建和這三個基因的基因組缺失已詳細描述于 W02005095624 中。描述于 W02005095624 中的載體 pDEL_AMYA、pDEL-AMYBI 和pDEL-AMYBII已根據(jù)EP 0 635 574 Bl中所述的“MARKER-GENE FREE”途徑使用。上述程序得到草酸鹽 / 酯缺陷型的,MARKER-GENE FREE Δ glaA、Δ amyA, Δ amyBI 禾Π AamyBII 淀粉酶陰性重組體A. niger CBS 513. 88菌株,所述菌株最終完全不具有外來DNA序列。這樣,WT 4具有低淀粉酶背景,并且與WT 1相比針對α-淀粉酶表達和表達檢測更加優(yōu)化。分子生物學技術(shù)在這些菌株中,使用本領(lǐng)域技術(shù)人員已知的分子生物學技術(shù)(見Sambrook & Russell, Molecular Cloning :A Laboratory Manual, 3rd Ed. , CSHL Press, Cold Spring Harbor, NY,2001),如下文所述過表達了若干基因,并下調(diào)了其它基因。用于基因過表達和破壞的表達載體,用于下調(diào)、轉(zhuǎn)化的載體的一般設計的例子,標記物和選擇培養(yǎng)基的使用可參見 W0199846772、W0199932617、W02001121779、W02005095624、EP635574B 和 W02005100573。A. niger 搖瓶發(fā)酵如 WO 99/32617 的實施例“Aspergillus niger shake flask fermentations,,部分中所述,在20ml預培養(yǎng)培養(yǎng)基中預培養(yǎng)A. niger菌株。過夜生長后,將IOml該培養(yǎng)物轉(zhuǎn)移至發(fā)酵培養(yǎng)基(FM)中。每升發(fā)酵培養(yǎng)基(FM)含有82.5g Glucose. lH20,25g Maldex 15(荷蘭 Boom M 印 pel),2g 檸檬酸,4.5g NaH2P04. 1H20,9gKH2P04,15g (NH4) 2S04,0. 02g ZnC12,0. Ig MnS04. 1H20,0. 015gCuS04. 5H20,0. 015g CoC12. 6H20,Ig MgS04. 7H20,0. lgCaC12. 2H20, 0. 3g FeS04. 7H20,30g MES(2-[N-嗎啉代]乙磺酸),pH = 6。在FM中的發(fā)酵于34°C和170rpm下在含有100ml發(fā)酵液的500ml帶擋板燒瓶中進行指示的天數(shù),一般如W099/3^17中所述。真菌α -淀粉酶活性為了在A. niger培養(yǎng)液中測定α -淀粉酶活性,根據(jù)供應商的說明使用Megazyme 谷物α -淀粉酶試劑盒(Megazyme,CERALPHA α淀粉酶測定試劑盒,產(chǎn)品目錄編號K-CERA, 2000-2001年)。所測量的活性以存在過量葡糖淀粉酶和α-葡糖苷酶時非還原性末端阻斷的P-硝基苯基麥芽庚糖苷(P-nitrophenyl maltoheptaoside)的水解為基礎(chǔ)。形成的P-硝基苯酚是樣品中存在的α-淀粉酶活性的度量。葡萄糖氧化酶活性為了在A. niger培養(yǎng)液中測定葡萄糖氧化酶活性,如Witteveen et al. 1990 ( "Glucose oxidase overproducing and negative mutants of Aspergillus niger", Appl. Microbiol. Biotechnol 33:683-686)所述使用鄰聯(lián)二茴香胺 (o-dianisidine),在450nm處用分光光度計測量葡萄糖氧化酶。
實施例1針對A. niger α -淀粉酶AmyB和P. chrysogenum葡萄糖氧化酶goxA構(gòu)津經(jīng)修飾的Aspergillus表汰構(gòu)津體編碼α-淀粉酶蛋白質(zhì)的amyB基因的DNA序列可在登記號XM_001395712. 1、 ΧΜ_001390741. 1 或 CAK46324 下得自 EMBLNucleotide Sequence Database (http//www. ebi.ac.uk/embl/index.html)。天然 A. niger amyB 基因的基因組序列作為 SEQ ID NO. 1 展示。amyB的相應編碼序列或cDNA序列作為SEQ ID NO. 2展示。SEQ ID NO. 2經(jīng)翻譯的序列被命名為SEQ ID N0. 3,代表了 A. niger α -淀粉酶蛋白質(zhì)AmyB。該序列也與 A. oryzae α -淀粉酶蛋白質(zhì)具有 100% 的相似性(Wirsel S.,Lachmund Α.,Wildhardt G. , Ruttkowski Ε. , “ Three alpha-amylase genes of Aspergillus oryzae exhibit identical intron-exon organization" (1989)Mol. Microbiol. 3 :3-14)。天然的分泌型 A. niger成熟α -淀粉酶肽被命名為SEQ ID Ν0. 4。如下文詳述的,用經(jīng)優(yōu)化的amyB cDNA 序列和靜改進的表達載體進行根據(jù)本發(fā)明方法的優(yōu)化。為了進行Aspergillus物種中A. niger amyB構(gòu)建體變體的表達分析,amyB編碼序列包含編碼α-淀粉酶的amyB基因的經(jīng)密碼子優(yōu)化的(CO)編碼序列(如W02008/000632 中詳述的)。使用基于pGBFIN-的表達構(gòu)建體,使用強A. niger葡糖淀粉酶glaA啟動子和α -淀粉酶amyB啟動子二者進行A. niger中α -淀粉酶的過表達(如W01999/3^17 和TO2006/077258中所述)。在所有隨后產(chǎn)生的amyB表達構(gòu)建體中,葡糖淀粉酶glaA和 α -淀粉酶amyB啟動子的翻譯起始序列已被修飾成5’ -CACCGTCAAA ATG-3’ (也詳述于 W02006/077258中)。在一些載體中去除存在于天然α -淀粉酶amyB啟動子中的BstXl位點(5’-CCANNNNN/NTGG-3’),以便于克隆信號序列變體。另外,使用最適的翻譯終止序列,因此在所有表達構(gòu)建體中,野生型amyB 5’ -TGA-3’翻譯終止序列被替換為5’ -TAAA-3,(如 W02006/077258 中所詳述)。在兩端引入適當?shù)南拗菩晕稽c,以允許在表達載體中克隆。在5’_端引入B10I位點,在3’ -端引入I^cI位點。包含經(jīng)修飾的基因組glaA或amyB啟動子和經(jīng)優(yōu)化的amyB cDNA序列的參照構(gòu)建體的DNA片段被完全合成、亞克隆,并通過序列分析進行序列驗證。使用兩種合成的片段端部的BioI-PacI限制性位點,從而允許在經(jīng)BioI和 PacI消化的pGBFINFUA-Ι表達載體(pGBFINFUA_l載體還描述于W02006/077258和 W02008/000632中)的大載體片段中克隆,分別產(chǎn)生pGBFINFUA_6和pGBFINFUA_3。根據(jù)本發(fā)明的方法在信號序列中a. ο.變化的經(jīng)修飾的AmyB序列的所有DNA片段被設計、完全合成為EcoRI-PacI或EcoRI-BstXl片段,亞克隆并進行序列驗證。使用所有合成的片段端部的EcoRI-PacI/BstXl限制性位點,從而允許在經(jīng)EcoRI和I^acI/BstXl消化的pGBFINFUA-3或經(jīng)EcoRI和I^acI消化的pGBFINFUA_6表達載體的大載體片段中克隆, 產(chǎn)生變體pGBFINFUA-表達載體。對各個載體進行序列驗證后,如下文表1和表2中所述對變體表達構(gòu)建體命名。對所有PGBFINFUA-構(gòu)建體的各個序列的所有特征和參照可從表1 和表2中推出。表1 用于A. niger中位于glaA啟動子控制下的α -淀粉酶AmyB表達的經(jīng)修飾
的表達構(gòu)建體
權(quán)利要求
1.用于生產(chǎn)感興趣的重組多肽的方法,所述方法包括(i)在有助于生產(chǎn)所述多肽的條件下培養(yǎng)絲狀真菌宿主細胞,所述絲狀真菌宿主細胞包含以符合翻譯讀碼框的方式與第二多核苷酸連接的第一多核苷酸,所述第二多核苷酸編碼感興趣的多肽,所述第一多核苷酸編碼選自下組的信號肽,所述組由a)SEQ ID NO :25,b)15到23個氨基酸的SEQ ID NO :25的變體,其中至少8個氨基酸與SEQ ID NO 25 的前10個氨基酸在相應位置上相同,c)15到23個氨基酸的SEQ ID NO :25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,d)SEQID NO 39,e)15到23個氨基酸的SEQ ID NO :39的變體,其中至少8個氨基酸與SEQ ID NO 39 的前10個氨基酸在相應位置上相同,f)15到23個氨基酸的SEQ ID NO :39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,g)SEQID NO 44,h)15到23個氨基酸的SEQ ID NO :44的變體,其中至少8個氨基酸與SEQ ID NO 44 的前10個氨基酸在相應位置上相同,i)15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,j)SEQ ID NO 34,k) 15到23個氨基酸的SEQ ID NO :34的變體,其中至少8個氨基酸與SEQ ID NO 34 的前10個氨基酸在相應位置上相同,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸, 構(gòu)成( )以及,任選地,從培養(yǎng)基分離所述多肽,并且,當所述信號肽是(b)或(c)時,所述感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。
2.通過根據(jù)權(quán)利要求1所述的方法獲得的多肽。
3.由以符合翻譯讀碼框的方式與第二多核苷酸連接的第一多核苷酸編碼的重組多肽, 所述第二多核苷酸編碼感興趣的多肽,所述第一多核苷酸編碼選自下組的信號肽,所述組由a)SEQ ID NO :25,b)15到23個氨基酸的SEQ ID NO 25的變體,其中至少8個氨基酸與SEQ ID NO 25 的前10個氨基酸在相應位置上相同,c)15到23個氨基酸的SEQ ID NO :25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,d)SEQID NO 39,e)15到23個氨基酸的SEQ ID NO :39的變體,其中至少8個氨基酸與SEQ ID NO 39的前10個氨基酸在相應位置上相同,f)15到23個氨基酸的SEQ ID NO :39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,g)SEQID NO 44,h)15到23個氨基酸的SEQ ID NO :44的變體,其中至少8個氨基酸與SEQ ID NO 44 的前10個氨基酸在相應位置上相同,i)15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,j)SEQ ID NO 34,k) 15到23個氨基酸的SEQ ID NO :34的變體,其中至少8個氨基酸與SEQ ID NO 34 的前10個氨基酸在相應位置上相同,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸構(gòu)成,并且,當所述信號肽是(b)或(c)時,所述感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。
4.包含以符合翻譯讀碼框的方式與第二多核苷酸連接的第一多核苷酸的重組表達構(gòu)建體,所述第二多核苷酸編碼感興趣的多肽,所述第一多核苷酸編碼選自下組的信號肽,所述組由a)SEQ ID NO :25,b)15到23個氨基酸的SEQ ID NO :25的變體,其中至少8個氨基酸與SEQ ID NO 25 的前10個氨基酸在相應位置上相同,c)15到23個氨基酸的SEQ ID NO :25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,d)SEQID NO 39,e)15到23個氨基酸的SEQ ID NO :39的變體,其中至少8個氨基酸與SEQ ID NO 39 的前10個氨基酸在相應位置上相同,f)15到23個氨基酸的SEQ ID NO :39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,g)SEQID NO 44,h)15到23個氨基酸的SEQ ID NO :44的變體,其中至少8個氨基酸與SEQ ID NO 44 的前10個氨基酸在相應位置上相同,i)15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,j)SEQ ID NO 34,k) 15到23個氨基酸的SEQ ID NO :34的變體,其中至少8個氨基酸與SEQ ID NO 34 的前10個氨基酸在相應位置上相同,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸構(gòu)成,并且當所述信號肽是(b)或(c)時,所述感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。
5.根據(jù)權(quán)利要求3所述的表達構(gòu)建體,其還包含與所述第一和第二多核苷酸可操作地連接的啟動子。
6.包含根據(jù)權(quán)利要求4和5中任一項所述的表達構(gòu)建體的重組表達載體。
7.包含根據(jù)權(quán)利要求4和5中任一項所述的表達構(gòu)建體或包含根據(jù)權(quán)利要求6所述的表達載體的重組絲狀真菌宿主細胞。
8.選自下組的信號肽用于生產(chǎn)感興趣的重組多肽的用途,所述組由a)SEQID NO :25,b)15到23個氨基酸的SEQ ID NO :25的變體,其中至少8個氨基酸與SEQ ID NO 25 的前10個氨基酸在相應位置上相同,c)15到23個氨基酸的SEQ ID NO :25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,d)SEQID NO 39,e)15到23個氨基酸的SEQ ID NO :39的變體,其中至少8個氨基酸與SEQ ID NO 39 的前10個氨基酸在相應位置上相同,f)15到23個氨基酸的SEQ ID NO :39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,g)SEQID NO 44,h)15到23個氨基酸的SEQ ID NO :44的變體,其中至少8個氨基酸與SEQ ID NO 44 的前10個氨基酸在相應位置上相同,i)15到23個氨基酸的SEQ ID NO 44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,j)SEQ ID NO 34,k) 15到23個氨基酸的SEQ ID NO :34的變體,其中至少8個氨基酸與SEQ ID NO 34 的前10個氨基酸在相應位置上相同,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸, 組成,并且,當所述信號肽是(b)或(c)時,所述感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。
9.編碼下述信號肽的多核苷酸用于生產(chǎn)感興趣的重組多肽的用途,所述信號肽選自下組,所述組由a)SEQ ID NO :25,b)15到23個氨基酸的SEQ ID NO :25的變體,其中至少8個氨基酸與SEQ ID NO 25 的前10個氨基酸在相應位置上相同,c)15到23個氨基酸的SEQ ID NO 25的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,d)SEQID NO 39,e)15到23個氨基酸的SEQ ID NO :39的變體,其中至少8個氨基酸與SEQ ID NO 39 的前10個氨基酸在相應位置上相同,f)15到23個氨基酸的SEQ ID NO :39的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,g)SEQID NO 44,h)15到23個氨基酸的SEQ ID NO :44的變體,其中至少8個氨基酸與SEQ ID NO 44 的前10個氨基酸在相應位置上相同,i)15到23個氨基酸的SEQ ID NO :44的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸,j)SEQ ID NO 34,k) 15到23個氨基酸的SEQ ID NO :34的變體,其中至少8個氨基酸與SEQ ID NO 34 的前10個氨基酸在相應位置上相同,1)15到23個氨基酸的SEQ ID NO :34的變體,其中第1位的氨基酸是Met,第2位的氨基酸是Val或Lys,并且其中10個氨基酸的連續(xù)串包含至少5個選自Ala或Leu的氨基酸, 組成,并且當所述信號肽是(b)或(c)時,所述感興趣的多肽不是來自Erwinia chrysanthemi的果膠甲基酯酶。
全文摘要
本發(fā)明涉及用于生產(chǎn)感興趣的重組多肽的方法,通過所述方法獲得的多肽,重組多核苷酸,表達載體,表達構(gòu)建體,以及特定信號肽用于生產(chǎn)感興趣的重組多肽的用途和編碼所述特定信號肽的多核苷酸用于生產(chǎn)感興趣的重組多肽的用途。
文檔編號C12P21/02GK102414323SQ201080017888
公開日2012年4月11日 申請日期2010年4月14日 優(yōu)先權(quán)日2009年4月22日
發(fā)明者德 彼得·約瑟夫·艾達·沃恩德沃爾特·范, 約翰尼斯·安德列什·勞博斯, 諾埃爾·尼古拉斯·瑪麗亞·伊麗莎白·佩吉·范, 阿恩·斯達姆 申請人:帝斯曼知識產(chǎn)權(quán)資產(chǎn)管理有限公司