本發(fā)明涉及具有脫酰胺酶抑制劑活性的多肽,編碼這些多肽的多核苷酸,包含這些多核苷酸的核酸構(gòu)建體、載體以及宿主細(xì)胞連同產(chǎn)生和使用這些多肽的方法。
背景技術(shù):
1、脫酰胺酶是由微生物細(xì)胞以無活性的原形式(proform)產(chǎn)生的,該原形式包含與脫酰胺酶結(jié)構(gòu)域緊密結(jié)合的前肽結(jié)構(gòu)域。該原形式幾乎不具有脫酰胺酶活性以保護(hù)宿主細(xì)胞的活力。本質(zhì)上,將該原形式進(jìn)行后處理以去除前肽并將活性脫酰胺酶釋放到宿主細(xì)胞外。然而,在重組表達(dá)系統(tǒng)中,該前肽不會(huì)自然地去除,并且失活的脫酰胺酶原形式在宿主細(xì)胞外分泌。
2、由于前肽對(duì)脫酰胺酶多肽的高結(jié)合親和力,前肽結(jié)構(gòu)域不能通過簡(jiǎn)單切割與脫酰胺酶結(jié)構(gòu)域分離。該結(jié)合親和力可以通過誘變來操縱,以使得前肽和活性脫酰胺酶更容易分離,但這會(huì)導(dǎo)致細(xì)胞內(nèi)脫酰胺酶部分激活,降低宿主細(xì)胞的活力。
3、本發(fā)明的目的是提供新型脫酰胺酶抑制劑,該抑制劑可以與脫酰胺酶共表達(dá),通過減輕活性細(xì)胞內(nèi)脫酰胺酶對(duì)宿主細(xì)胞活力的負(fù)面影響來改善脫酰胺酶的重組表達(dá)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了能夠通過可逆地結(jié)合至脫酰胺酶以及與脫酰胺酶活性位點(diǎn)相互作用來抑制脫酰胺酶活性的多肽。
2、因此,在第一個(gè)方面,本發(fā)明涉及具有脫酰胺酶抑制劑活性的多肽,該多肽選自由以下組成的組:
3、(a)與seq?id?no:2具有至少60%氨基酸序列同一性的多肽;
4、(b)通過在一個(gè)或多個(gè)位置處具有1-30個(gè)改變(例如,取代、缺失和/或插入),例如1或2或3或4或5或6或7或8或9或10或11或12或13或14或15或16或17或18或19或20或21或22或23或24或25或26或27或28或29或30個(gè)改變,特別是取代而衍生自seq?id?no:2的多肽;
5、(c)衍生自(a)或(b)的多肽的多肽,其中n-和/或c-末端已通過添加一個(gè)或多個(gè)氨基酸而延伸;以及
6、(d)(a)、(b)或(c)的多肽的片段。
7、在另一個(gè)方面,本發(fā)明涉及編碼本發(fā)明的多肽的多核苷酸;包含這些多核苷酸的核酸構(gòu)建體、重組表達(dá)載體、重組宿主細(xì)胞;以及產(chǎn)生這些多肽的方法。
8、本發(fā)明的其他方面和實(shí)施例從說明書和實(shí)例是顯而易見的。
9、序列
10、seq?id?no:1:編碼來自金黃桿菌屬物種-62563的脫酰胺酶抑制劑的多核苷酸。
11、seq?id?no:2:由seq?id?no:1編碼的脫酰胺酶抑制劑的氨基酸序列。
12、seq?id?no:3:編碼來自金黃桿菌屬物種-62563的活性脫酰胺酶的多核苷酸。
13、seq?id?no:4:由seq?id?no:3編碼的脫酰胺酶的氨基酸序列。
14、seq?id?no:5:脫酰胺酶抑制劑的氨基酸序列基序。
15、seq?id?no:6:脫酰胺酶抑制劑的氨基酸序列基序。
16、seq?id?no:7:脫酰胺酶抑制劑的氨基酸序列基序。
17、seq?id?no:8:脫酰胺酶抑制劑的氨基酸序列基序。
18、seq?id?no:9:脫酰胺酶抑制劑的氨基酸序列基序。
19、seq?id?no:10:脫酰胺酶抑制劑的氨基酸序列基序。
20、seq?id?no:11:脫酰胺酶抑制劑的氨基酸序列基序。
21、seq?id?no:12:脫酰胺酶抑制劑的氨基酸序列基序。
22、seq?id?no:13:脫酰胺酶抑制劑的氨基酸序列基序。
23、seq?id?no:14:脫酰胺酶活性位點(diǎn)的氨基酸序列基序。
24、seq?id?no:15:脫酰胺酶活性位點(diǎn)的氨基酸序列基序。
25、seq?id?no:16:脫酰胺酶活性位點(diǎn)的氨基酸序列基序。
26、定義
27、根據(jù)此詳細(xì)描述,以下定義適用。注意,單數(shù)形式“一種/個(gè)(a/an)”以及“該/這些(the)”包括復(fù)數(shù)個(gè)指示物,除非上下文中另外明確指明。
28、除非另外定義或由上下文明確指示,否則本文所用的全部技術(shù)與科學(xué)術(shù)語(yǔ)具有如本發(fā)明所屬領(lǐng)域的普通技術(shù)人員通常理解的相同含義。
29、脫酰胺酶活性:術(shù)語(yǔ)“脫酰胺酶活性”意指蛋白質(zhì)-谷氨酰谷氨酰胺酶(也稱為谷氨酰肽谷氨酰胺酶)活性,如ec?3.5.1.44中所述,其催化在羧基位置或α-氨基和羧基位置都取代的谷氨酰胺的γ-酰胺的水解,例如l-谷氨酰甘氨酸和l-苯丙氨?;?l-谷氨酰甘氨酸。具有脫酰胺酶活性的多肽通常也稱為脫酰胺酶。因此,脫酰胺酶可以將蛋白質(zhì)中的谷氨酰胺殘基脫酰胺為谷氨酸殘基,并且脫酰胺酶也被稱為蛋白質(zhì)谷氨酰胺脫酰胺酶。脫酰胺酶包括cys-his-asp催化三聯(lián)體(例如cys-156、his-197和asp-217,如hashizume等人“crystal?structures?of?protein?glutaminase?and?its?pro?forms?converted?intoenzyme-substrate?complex”“蛋白質(zhì)谷氨酰胺酶及其原形式轉(zhuǎn)化為酶-底物復(fù)合體的晶體結(jié)構(gòu)”,journal?of?biological?chemistry[生物化學(xué)雜志],第286卷,編號(hào)44,第38691-38702頁(yè)所示)并且屬于interpro條目ipr041325。在一個(gè)優(yōu)選的實(shí)施例中,本發(fā)明的脫酰胺酶屬于pfam結(jié)構(gòu)域pf18626。脫酰胺酶氨基酸序列可以包含對(duì)應(yīng)于seq?id?no:4的氨基酸殘基40-47的氨基酸序列基序dgcyarah(seq?id?no:14),和/或?qū)?yīng)于seq?id?no:4的氨基酸殘基42-48的氨基酸序列基序cyarah[r/k/q](seq?id?no:15),和/或?qū)?yīng)于seq?id?no:4的氨基酸殘基83-89的氨基酸序列基序hva[l/v/i]lvs(seq?id?no:16)。這些基序與脫酰胺酶活性位點(diǎn)重疊。優(yōu)選地,脫酰胺酶活性是由如seq?id?no:4所示的多肽展現(xiàn)出的活性。
30、如實(shí)例1中所述,通過使用包含谷氨酰胺殘基和熒光淬滅基團(tuán)的熒光底物測(cè)量脫酰胺酶活性。谷氨酰胺殘基通過脫酰胺酶活性轉(zhuǎn)化為谷氨酸殘基,然后通過谷氨酰內(nèi)肽酶切割底物以去除熒光淬滅基團(tuán)。
31、脫酰胺酶活性還可以通過使谷氨酰胺底物(例如cbz-gln-gly)脫酰胺來測(cè)量,并且在該過程中產(chǎn)生氨。將氨用作谷氨酸脫氫酶與α-酮戊二酸組合的底物以產(chǎn)生谷氨酸。后一種酶促反應(yīng)需要nadh作為輔酶。nadh的消耗可以通過測(cè)量340nm處的動(dòng)力學(xué)吸光度來跟蹤,并且與脫酰胺酶活性直接成正比。該反應(yīng)在ph?7下在37℃下進(jìn)行。
32、脫酰胺酶抑制劑:術(shù)語(yǔ)“脫酰胺酶抑制劑”意指與脫酰胺酶活性位點(diǎn)的氨基酸殘基相互作用的氨基酸序列。因此,脫酰胺酶抑制劑活性會(huì)降低或抑制脫酰胺酶活性,優(yōu)選地由如seq?id?no:4所示的多肽展現(xiàn)出的脫酰胺酶活性。例如,在存在脫酰胺酶抑制劑的情況下,脫酰胺酶活性可以降低到少于90%、少于80%、少于70%、少于60%、少于50%、或少于40%(與不存在脫酰胺酶抑制劑的情況下的脫酰胺酶活性相比)。具有脫酰胺酶抑制劑活性的多肽通常也稱為脫酰胺酶抑制劑。脫酰胺酶抑制劑可以包含選自由以下組成的組的氨基酸序列基序:f[f/y][i/l/v][f/q/s][e/k/r];l[i,t]wy[d,h,k,n];g[i,m]s[a,p,q]q;[d,h,k,n,s][i,l][g,v][i,v][d,e];[n,h][i,l,m,v,q][i,v][k,r,q][e,i,q];[d/n][p/s][d/e][h/k/n/q/r][a/p/s];及其組合。脫酰胺酶抑制劑還可以包含選自由以下組成的組的氨基酸序列基序:seq?id?no:5、seq?id?no:6、seq?id?no:7、seq?id?no:8、seq?idno:9、seqid?no:10、seq?id?no:11、seq?id?no:12、seq?id?no:13及其組合。
33、cdna:術(shù)語(yǔ)“cdna”意指可以通過從獲得自真核或原核細(xì)胞的成熟的、剪接的mrna分子進(jìn)行反轉(zhuǎn)錄而制備的dna分子。cdna缺乏可以存在于相應(yīng)基因組dna中的內(nèi)含子序列。初始的初級(jí)rna轉(zhuǎn)錄物是mrna的前體,通過一系列步驟(包括剪接)對(duì)前體進(jìn)行加工,然后呈現(xiàn)為成熟的剪接的mrna。
34、編碼序列:術(shù)語(yǔ)“編碼序列”意指直接指定多肽的氨基酸序列的多核苷酸。編碼序列的邊界通常由開放閱讀框確定,該開放閱讀框以起始密碼子(如atg、gtg或ttg)開始并且以終止密碼子(如taa、tag或tga)結(jié)束。編碼序列可為基因組dna、cdna、合成dna或其組合。
35、控制序列:術(shù)語(yǔ)“控制序列”意指涉及在特定生物體內(nèi)或體外調(diào)節(jié)多核苷酸表達(dá)的核酸序列。每個(gè)控制序列對(duì)于編碼多肽的多核苷酸而言可以是天然的(即,來自相同基因)或異源的(即,來自不同基因),并且對(duì)于彼此是天然的或異源的。這樣的控制序列包括但不限于前導(dǎo)序列、聚腺苷酸化序列、前原肽、前肽、信號(hào)肽、啟動(dòng)子、終止子、增強(qiáng)子以及轉(zhuǎn)錄或翻譯起始子和終止子序列。最少,這些控制序列包括啟動(dòng)子以及轉(zhuǎn)錄和翻譯終止信號(hào)。出于引入有利于將控制序列與編碼多肽的多核苷酸的編碼區(qū)連接的特異性限制位點(diǎn)的目的,這些控制序列可以提供有多個(gè)接頭。
36、表達(dá):術(shù)語(yǔ)“表達(dá)”意指多肽產(chǎn)生中涉及的任何步驟,包括但不限于轉(zhuǎn)錄、轉(zhuǎn)錄后修飾、翻譯、翻譯后修飾以及分泌。
37、表達(dá)載體:“表達(dá)載體”是指包含編碼多肽的dna序列的線性或環(huán)狀dna構(gòu)建體,該編碼序列可操作地連接到能夠影響dna在合適宿主中表達(dá)的合適控制序列。這樣的控制序列可包括影響轉(zhuǎn)錄的啟動(dòng)子、控制轉(zhuǎn)錄的任選操縱子序列、編碼mrna上合適的核糖體結(jié)合位點(diǎn)的序列、增強(qiáng)子以及控制轉(zhuǎn)錄和翻譯的終止的序列。
38、延伸:術(shù)語(yǔ)“延伸”意指在多肽的氨基和/或羧基末端添加一個(gè)或多個(gè)氨基酸,其中該“延伸的”多肽具有脫酰胺酶抑制劑活性。
39、片段:術(shù)語(yǔ)“片段”意指在成熟多肽的氨基和/或羧基末端缺失一個(gè)或多個(gè)氨基酸的多肽,其中該片段具有脫酰胺酶抑制劑活性。
40、融合多肽:術(shù)語(yǔ)“融合多肽”是其中本發(fā)明的一種多肽在本發(fā)明的另一種多肽的n-末端和/或c-末端融合的多肽。通過將編碼本發(fā)明的多肽的兩個(gè)或更多個(gè)多核苷酸融合在一起來產(chǎn)生融合多肽。用于產(chǎn)生融合多肽的技術(shù)是本領(lǐng)域已知的,并且包括連接編碼多肽的編碼序列使得它們符合讀框,而且融合多肽的表達(dá)處于一個(gè)或多個(gè)相同的啟動(dòng)子和終止子的控制之下。還可以使用其中在翻譯之后產(chǎn)生融合多肽的內(nèi)含肽技術(shù)(cooper等人,1993,embo?j.[歐洲分子生物學(xué)雜志]12:2575-2583;dawson等人,1994,science[科學(xué)]266:776-779)來構(gòu)建融合多肽。融合多肽可進(jìn)一步包含兩個(gè)多肽之間的切割位點(diǎn)。因此,這些融合多肽可以包含位點(diǎn)特異性內(nèi)肽酶的切割位點(diǎn),例如在第一多肽的c-末端的20個(gè)氨基酸內(nèi),優(yōu)選地10個(gè)氨基酸內(nèi)。熟知的位點(diǎn)特異性內(nèi)肽酶的實(shí)例包括谷氨酰內(nèi)肽酶(例如,ec3.4.21.19或ec?3.4.21.82)、胰蛋白酶樣內(nèi)肽酶和糜蛋白酶樣內(nèi)肽酶(包括腸肽酶)。切割位點(diǎn)和相應(yīng)的內(nèi)肽酶的許多其他實(shí)例包括但不限于在以下中披露的位點(diǎn):martin等人,2003,j.ind.microbio1.biotechnol.[工業(yè)微生物學(xué)雜志]3:568-576;svetina等人,2000,j.biotechnol.[生物技術(shù)雜志]76:245-251;rasmussen-wilson等人,1997,appl.environ.microbiol.[應(yīng)用與環(huán)境微生物學(xué)]63:3488-3493;ward等人,1995,biotechnology[生物技術(shù)]13:498-503;以及contreras等人,1991,biotechnology[生物技術(shù)]9:378-381;eaton等人,1986,biochemistry[生物化學(xué)]25:505-512;collins-racie等人,1995,biotechnology[生物技術(shù)]13:982-987;carter等人,1989,proteins:structure,function,and?genetics[蛋白質(zhì):結(jié)構(gòu),功能和遺傳學(xué)]6:240-248;以及stevens,2003,drug?discovery?world[藥物發(fā)現(xiàn)世界]4:35-48。
41、異源的:對(duì)于宿主細(xì)胞,術(shù)語(yǔ)“異源的”意指多肽或核酸不是宿主細(xì)胞中天然存在的。對(duì)于多肽或核酸,術(shù)語(yǔ)“異源的”意指控制序列(例如多肽或核酸的啟動(dòng)子)不與該多肽或核酸天然相關(guān)聯(lián),即,控制序列是來自編碼成熟多肽的基因以外的基因。
42、宿主菌株或宿主細(xì)胞:“宿主菌株”或“宿主細(xì)胞”是其中已引入表達(dá)載體、噬菌體、病毒或其他dna構(gòu)建體(包括編碼目的多肽(例如,淀粉酶)的多核苷酸)的生物體。示例性宿主菌株是能夠表達(dá)目的多肽和/或發(fā)酵糖類的微生物細(xì)胞(例如,細(xì)菌、絲狀真菌和酵母)。術(shù)語(yǔ)“宿主細(xì)胞”包括由細(xì)胞產(chǎn)生的原生質(zhì)體。
43、引入:在將核酸序列插入細(xì)胞的情況下,術(shù)語(yǔ)“引入”意指“轉(zhuǎn)染”、“轉(zhuǎn)化”或“轉(zhuǎn)導(dǎo)”,如本領(lǐng)域已知的。
44、分離的:術(shù)語(yǔ)“分離的”意指多肽、核酸、細(xì)胞或其他特定材料或組分,其與至少一種其他材料或組分(包括但不限于,其他蛋白質(zhì)、核酸、細(xì)胞等)已經(jīng)分離。因此,分離的多肽、核酸、細(xì)胞或其他材料呈自然界中不存在的形式。分離的多肽包括但不限于含有在宿主細(xì)胞中表達(dá)的分泌性多肽的培養(yǎng)液。
45、成熟多肽:術(shù)語(yǔ)“成熟多肽”意指在n-末端和/或c-末端加工(例如,信號(hào)肽的去除)后呈其成熟形式的多肽。在一方面,該成熟多肽是seq?id?no:2。
46、成熟多肽編碼序列:術(shù)語(yǔ)“成熟多肽編碼序列”意指編碼具有脫酰胺酶抑制劑活性的成熟多肽的多核苷酸。在一方面,該成熟多肽編碼序列是seq?id?no:1。
47、天然:術(shù)語(yǔ)“天然”意指天然存在于宿主細(xì)胞中的核酸或多肽。
48、核酸:術(shù)語(yǔ)“核酸”涵蓋dna、rna、異源雙鏈體和能夠編碼多肽的合成分子。核酸可以是單鏈或雙鏈,并且可以是化學(xué)修飾。術(shù)語(yǔ)“核酸”和“多核苷酸”可互換使用。因?yàn)檫z傳密碼是簡(jiǎn)并的,所以可使用多于一個(gè)密碼子來編碼特定氨基酸,并且本發(fā)明組合物和方法涵蓋編碼特定氨基酸序列的核苷酸序列。除非另有說明,否則核酸序列以5′至3′取向呈現(xiàn)。
49、核酸構(gòu)建體:“核酸構(gòu)建體”是指分離自天然存在的基因或以原本不存在于自然界中的方式被修飾以含有核酸的區(qū)段或是合成的并且包含可操作地連接到核酸序列的一個(gè)或多個(gè)控制序列的單鏈或雙鏈核酸分子。
50、可操作地連接:“可操作地連接”意指指定組分處于允許它們以預(yù)期方式起作用的關(guān)系(包括但不限于并置)。例如,調(diào)節(jié)序列可操作地連接到編碼序列,使得編碼序列的表達(dá)處于調(diào)節(jié)序列的控制之下。
51、純化的:術(shù)語(yǔ)“純化的”意指基本上不含其他組分的核酸、多肽或細(xì)胞,如通過本領(lǐng)域熟知的分析技術(shù)(例如,在電泳凝膠、色譜洗脫物和/或經(jīng)受密度梯度離心的培養(yǎng)基中,純化的多肽或核酸可形成離散的條帶)所確定。純化的核酸或多肽是至少約50%純的,通常是至少約60%、約65%、約70%、約75%、約80%、約85%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%、約99.5%、約99.6%、約99.7%、約99.8%或更加純的(例如,按重量計(jì)或以摩爾計(jì)的百分比)。在相關(guān)意義上,當(dāng)在應(yīng)用純化或富集技術(shù)之后分子的濃度大幅度增加時(shí),組合物富集了該分子。術(shù)語(yǔ)“富集”是指化合物、多肽、細(xì)胞、核酸、氨基酸或其他指定材料或組分以高于起始組合物的相對(duì)或絕對(duì)濃度存在于組合物中。
52、在一個(gè)方面,如本文所用的術(shù)語(yǔ)“純化的”是指多肽或細(xì)胞基本上不含來自生產(chǎn)生物體的組分(尤其是不溶性組分)。在其他方面,術(shù)語(yǔ)“純化的”是指多肽基本上不含來自從中獲得其的天然生物體的不溶性組分(尤其是不溶性組分)。在一個(gè)方面,將多肽與從中回收其的生物體和培養(yǎng)基的一些可溶性組分分離??赏ㄟ^單元操作過濾、沉淀或色譜法中的一種或多種來純化(即,分離)多肽。
53、相應(yīng)地,可純化多肽,使得僅存在少量的其他蛋白,特別是其他多肽。如本文所用的術(shù)語(yǔ)“純化的”可指去除存在于多肽來源的細(xì)胞中的其他組分,特別是其他蛋白并且最特別是其他酶。多肽可以是“基本上純的”,即不含來自產(chǎn)生其的生物體(例如,用于重組產(chǎn)生多肽的宿主生物體)的其他組分。在一個(gè)方面,按制劑中存在的總多肽材料的重量計(jì),多肽是至少40%純的。在一個(gè)方面,按制劑中存在的總多肽材料的重量計(jì),多肽是至少50%、60%、70%、80%或90%純的。如本文所用,“基本上純的多肽”可表示含有按重量計(jì)至多10%、優(yōu)選地至多8%、更優(yōu)選地至多6%、更優(yōu)選地至多5%、更優(yōu)選地至多4%、更優(yōu)選地至多3%、甚至更優(yōu)選地至多2%、最優(yōu)選地至多1%并且甚至最優(yōu)選地至多0.5%的多肽與其天然或重組締合的其他多肽材料的多肽制劑。
54、因此,優(yōu)選的是按制劑中存在的總多肽材料的重量計(jì),基本上純的多肽是至少92%純的、優(yōu)選地至少94%純的、更優(yōu)選地至少95%純的、更優(yōu)選地至少96%純的、更優(yōu)選地至少97%純的、更優(yōu)選地至少98%純的、甚至更優(yōu)選地至少99%純的、最優(yōu)選地至少99.5%純的。本發(fā)明的多肽優(yōu)選地是基本上純的形式(即,制劑基本上不含與其天然或重組締合的其他多肽材料)。例如,這可以通過采用熟知的重組方法或采用經(jīng)典的純化方法制備多肽來實(shí)現(xiàn)。
55、重組:術(shù)語(yǔ)“重組”以其常規(guī)含義使用,是指對(duì)核酸序列進(jìn)行操縱(例如,切割和重接)以形成與在自然界中發(fā)現(xiàn)的序列群不同的序列群。術(shù)語(yǔ)重組指已從其天然狀態(tài)修飾的細(xì)胞、核酸、多肽或載體。因此,例如,重組細(xì)胞表達(dá)在天然(非重組)形式的細(xì)胞內(nèi)未發(fā)現(xiàn)的基因,或與在自然界中發(fā)現(xiàn)的相比,以不同水平表達(dá)或在不同條件下表達(dá)天然基因。術(shù)語(yǔ)“重組”與“遺傳修飾的”和“轉(zhuǎn)基因的”同義。
56、回收:術(shù)語(yǔ)“回收(recover或recovery)”是指從選自細(xì)胞、核酸或其他指定材料的列表的至少一種發(fā)酵液組分中去除多肽,例如通過以下方法從全發(fā)酵液或從無細(xì)胞發(fā)酵液中回收多肽:通過多肽晶體收獲、通過過濾(例如,深度過濾(通過使用助濾劑或填充過濾介質(zhì)、箱式過濾器中的布過濾、轉(zhuǎn)鼓過濾、鼓過濾、旋轉(zhuǎn)真空鼓過濾、燭式過濾器、水平葉過濾器或類似物、在框架式或模塊化裝置中使用片狀或墊式過濾)或膜過濾(使用板過濾、模塊過濾、燭式過濾、微過濾、橫流、動(dòng)態(tài)橫流或死端操作中的超濾))或者通過離心(使用臥式離心機(jī)、圓盤堆式離心機(jī)、水式漩渦分離器(hyrdo?cyclone)或類似物)或者通過沉淀多肽并使用相關(guān)的固-液分離方法以通過使用粒度分級(jí)分離從肉湯培養(yǎng)基中收獲多肽?;厥蘸w多肽的分離和/或純化。
57、序列同一性:兩個(gè)氨基酸序列之間或兩個(gè)核苷酸序列之間的關(guān)聯(lián)度通過參數(shù)“序列同一性”來描述。
58、出于本發(fā)明的目的,使用尼德曼-翁施算法(needleman-wunschalgorithm)(needleman和wunsch,1970,j.mol.biol.[分子生物學(xué)雜志]48:443-453)來確定兩個(gè)氨基酸序列之間的序列同一性作為“最長(zhǎng)同一性”的輸出,該算法如emboss軟件包(emboss:theeuropean?molecular?biology?open?software?suite[歐洲分子生物學(xué)開放軟件套件],rice等人,2000,trends?genet.[遺傳學(xué)趨勢(shì)]16:276-277)(優(yōu)選6.6.0版本或更新版本)的尼德爾程序中所實(shí)施的。使用的參數(shù)是空位開放罰分10、空位延伸罰分0.5以及eblosum62(blosum62的emboss版本)取代矩陣。為了使needle程序報(bào)告最長(zhǎng)同一性,必須在命令行中指定-nobrief選項(xiàng)。needle標(biāo)記的“最長(zhǎng)同一性”的輸出計(jì)算如下:
59、(相同的殘基×100)/(比對(duì)長(zhǎng)度-比對(duì)中的空位總數(shù))
60、出于本發(fā)明的目的,使用尼德曼-翁施算法(needleman和wunsch,1970,同上)來確定兩個(gè)多核苷酸序列之間的序列同一性作為“最長(zhǎng)同一性”的輸出,該算法如emboss軟件包(emboss:the?european?molecular?biology?open?software?suite[歐洲分子生物學(xué)開放軟件套件],rice等人,2000,同上)(優(yōu)選6.6.0版本或更新版本)的尼德爾程序所實(shí)施的。使用的參數(shù)是空位開放罰分10、空位延伸罰分0.5以及ednafull(ncbi?nuc4.4的emboss版本)取代矩陣。為了使needle程序報(bào)告最長(zhǎng)同一性,必須在命令行中指定非簡(jiǎn)化(nobrief)選項(xiàng)。needle標(biāo)記的“最長(zhǎng)同一性”的輸出計(jì)算如下:
61、(相同的核苷酸x100)/(比對(duì)長(zhǎng)度-比對(duì)中的空位總數(shù))
62、信號(hào)肽:“信號(hào)肽”是附接至蛋白質(zhì)的n-末端部分的氨基酸序列,其促進(jìn)蛋白質(zhì)分泌到細(xì)胞外。細(xì)胞外蛋白質(zhì)的成熟形式缺乏信號(hào)肽,該信號(hào)肽在分泌過程中被切除。
63、子序列:術(shù)語(yǔ)“子序列”意指使一個(gè)或多個(gè)核苷酸從成熟多肽編碼序列的5′端和/或3′端缺失的多核苷酸;其中子序列編碼具有脫酰胺酶抑制劑活性的片段。
64、熱解折疊溫度:術(shù)語(yǔ)“熱解折疊溫度”,也稱為“解鏈溫度”、“tm”、或“中點(diǎn)解折疊溫度”,意指其中大約50%的蛋白質(zhì)被解折疊的溫度。典型地,折疊蛋白質(zhì)的級(jí)分在室溫下是優(yōu)勢(shì)的(>99.999%),并且隨著溫度接近解鏈溫度(tm)而降低。在tm處,約50%的分子處于折疊狀態(tài),并且約50%處于解折疊狀態(tài)。在溫度高于tm時(shí),解折疊狀態(tài)變成優(yōu)勢(shì)種(>50%)。確定包含本發(fā)明的抑制劑的脫酰胺酶/抑制劑復(fù)合物的熱解折疊溫度的優(yōu)選方法是nanodsf。使用nanodsf,可以在330nm、350nm、和/或以330nm/350nm的比率進(jìn)行tm的確定,其中tm等于一階導(dǎo)數(shù)的拐點(diǎn)(ip)的溫度。在拐點(diǎn)處,一階導(dǎo)數(shù)達(dá)到局部最大值或最小值,并且二階導(dǎo)數(shù)具有孤立的零點(diǎn)。對(duì)于本發(fā)明,tm或熱解折疊溫度是通過nanodsf在330nm處確定的一階導(dǎo)數(shù)的拐點(diǎn)(ip)的溫度,如實(shí)例2中所述。
65、用于確定熱解折疊溫度的其他方法是如current?protocols?in?proteinscience:“analysis?of?protein?stability?and?ligand?interactions?by?thermalshift?assay”[蛋白質(zhì)科學(xué)的當(dāng)前方案:“通過熱位移測(cè)定的蛋白質(zhì)穩(wěn)定性和配體相互作用的分析”](k.huynh和c.l?partch,2015)所描述的熱位移測(cè)定,或描述于encyclopedia?ofindustrial?biotechnology[工業(yè)生物技術(shù)百科全書]:“proteins:thermal?unfolding”[蛋白質(zhì):熱解折疊](r.lonescu和l?shi,2009)中的方法。
66、熱解折疊代表了評(píng)估蛋白質(zhì)穩(wěn)定性的重要工具。為了評(píng)估蛋白質(zhì)偏好以維持其折疊(活性)構(gòu)象,將蛋白質(zhì)暴露于增加水平的變性應(yīng)激(溫度)中,并且基于產(chǎn)生解折疊蛋白質(zhì)的顯著級(jí)分所需的應(yīng)激水平來確定蛋白質(zhì)穩(wěn)定性。影響熱穩(wěn)定性的因素包括但不限于,蛋白質(zhì)結(jié)構(gòu)、配體或賦形劑的存在、抑制劑與酶之間的結(jié)合強(qiáng)度、以及溶劑條件。
67、變體:術(shù)語(yǔ)“變體”意指具有脫酰胺酶抑制劑活性的、在一個(gè)或多個(gè)位置處包含人為突變(即取代、插入(包括延伸)和/或缺失(例如截短))的多肽。取代意指用不同的氨基酸替代占據(jù)某一位置的氨基酸;缺失意指去除占據(jù)某一位置的氨基酸;并且插入意指與占據(jù)一個(gè)位置的氨基酸相鄰并緊接其后添加1-5個(gè)氨基酸(例如,1-3個(gè)氨基酸,特別是1個(gè)氨基酸)。
68、野生型:提及氨基酸序列或核酸序列時(shí)術(shù)語(yǔ)“野生型”意指該氨基酸序列或核酸序列是天然或天然存在的序列。如本文所用,術(shù)語(yǔ)“天然存在的”是指在自然界中發(fā)現(xiàn)的任何物質(zhì)(例如蛋白質(zhì)、氨基酸或核酸序列)。相反,術(shù)語(yǔ)“非天然存在的”是指在自然界中未發(fā)現(xiàn)的任何物質(zhì)(例如,在實(shí)驗(yàn)室中產(chǎn)生的重組核酸和蛋白質(zhì)序列、或野生型序列的修飾)。