專利名稱:耐高溫精氨酸抑制因子基因及其編碼的多肽和制備方法
技術(shù)領(lǐng)域:
本發(fā)明涉及突變或遺傳工程,尤其涉及一種耐高溫精氨酸抑制因子基因及其編碼的多肽和制備方法。
背景技術(shù):
精氨酸抑制因子(arginine repressor)是一個(gè)L一精氨酸依賴性DNA粘合蛋白,它控制著精氨酸的生物合成基因組表達(dá),同時(shí)是質(zhì)粒中cer以及相關(guān)的結(jié)合位點(diǎn)的Xer特定位點(diǎn)結(jié)合的必須蛋白。形成于精氨酸抑制因子中的直接位點(diǎn)突變,常用來分離兩個(gè)突變異種。
精氨酸抑制因子是一種普遍存在于細(xì)菌基因組之間的轉(zhuǎn)錄因子。盡管在一個(gè)基因組內(nèi)部位點(diǎn)之間只有很小的相似性,它的識(shí)別信號,一個(gè)微弱的回文序列,仍然存在于基因組之間。因此,精氨酸抑制因子和其他的兩個(gè)普遍存在轉(zhuǎn)錄因子是不同的。HrcA,它的識(shí)別信號十分強(qiáng)的存在于基因組之間以及內(nèi)部;而LexA/DinR,它的信號十分強(qiáng)的保存于基因組內(nèi)部而不是之間。在Escherichiacoli,Bacillus subtilis以及其他的一些基因組中的精氨酸抑制因子被很好的研究。
Escherichia coli中精氨酸抑制因子是一種典型的反饋調(diào)節(jié)因子,信號發(fā)自于細(xì)胞內(nèi)部的L-精氨酸。它不同于其他大多數(shù)具有六聚體作用的抑制因子,而且它缺乏具體的結(jié)構(gòu),也不同其他的轉(zhuǎn)錄調(diào)節(jié)因子那樣擁有清晰的同族序列。精氨酸抑制因子的氨基酸殘基序列以及蛋白水解分裂模型的分析,可以應(yīng)用于鑒定DNA粘合物功能的預(yù)測區(qū)域。當(dāng)這個(gè)蛋白的碎片從一個(gè)相應(yīng)的基因組碎片中被過分表達(dá)的時(shí)候,它可以抑制體內(nèi)鳥氨酸轉(zhuǎn)氨甲酰酶的水平,而且于體外限制DNA的操縱子。溶液中的沉淀平衡以及凝膠體過濾顯示,純化蛋白碎皮是一個(gè)單體。結(jié)果在低的精讀條件下,限定了抑制因子的區(qū)域結(jié)構(gòu),顯示出肽鏈的N,C末端蛋白可以被結(jié)構(gòu)性及功能性的邊界所分割,這個(gè)邊界可以減弱六聚體聚合物以及DNA結(jié)合物的精氨酸粘合物的震波。
在Escherichia coli中,精氨酸抑制因子調(diào)節(jié)L-精氨酸生物合成基因組的轉(zhuǎn)錄因子,同時(shí)也作用于Xer特定位點(diǎn)的在結(jié)合。在DNA合成以及六聚體聚合過程中,氨酸抑制因子需要L-精氨酸的加入。同源六聚體精氨酸抑制因子的單肽鏈具有156個(gè)氨基酸長度而且有兩個(gè)功能區(qū)域組成,一個(gè)堿性N末端區(qū)域(1-79個(gè)殘基),用于DNA的合成,一個(gè)酸性C末端區(qū)域(80-156個(gè)殘基),用于六聚體聚合物以及L-精氨酸的合成。
精氨酸抑制因子蛋白由78個(gè)氨基酸組成,它的長度相當(dāng)于78個(gè)殘基。在蛋白內(nèi)部每個(gè)螺旋有3個(gè)區(qū)域。一個(gè)螺旋由一個(gè)嚴(yán)格的圓柱體組成,由分子中的疏水性因子以及氫鍵連接而成。在一個(gè)螺旋體中每個(gè)翻轉(zhuǎn)由3.6個(gè)殘基,所以在精氨酸的三個(gè)螺旋中,大約每一個(gè)都有三個(gè)完全的翻轉(zhuǎn),而每個(gè)長度大約是10個(gè)殘基。他們顯示的位置為氨基酸10-19,26-36,43-53。41%的精氨酸抑制因子由一個(gè)螺旋體組成。精氨酸抑制因子的晶體結(jié)構(gòu)在2.7的精度條件下被測定。因子的每個(gè)亞基有兩個(gè)區(qū)域。C末端區(qū)域排列分布著32個(gè)對稱位點(diǎn)群,它調(diào)節(jié)著主要的內(nèi)部亞基的相互作用。N末端區(qū)域在這個(gè)核心周圍定位,他們的定位有微弱的關(guān)聯(lián)性,但是沒有嚴(yán)格的遵守對稱規(guī)則。
精氨酸的X-射線晶體結(jié)構(gòu)圖譜分析結(jié)果顯示,三聚體內(nèi)的二聚體中夾入一個(gè)L-精氨酸分子的層,在2.2精度條件下,精氨酸物理數(shù)據(jù)庫受限于在Accelrys′Insight II軟件的構(gòu)象研究。運(yùn)用分子造型工具,可以限定晶體結(jié)構(gòu)以及分析它的化學(xué)和物理成分,以用于更好的理解文獻(xiàn)中所描述的精氨酸抑制因子的生物成份。
騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis),是生活在我國云南省騰沖縣的熱泉中的一種微生物,是一種嗜熱的真細(xì)菌(eubacteria),最適生長溫度為75攝氏度,厭氧生長,革蘭氏染色反應(yīng)呈陽性。它由中國科學(xué)院微生物所首先發(fā)現(xiàn)并進(jìn)行了分類學(xué)上的分析。菌種保存在中國微生物保存中心MB4T(Chinese collection of microorganisms AS 1.2430T=JCM 11007T)。該嗜熱厭氧菌是我國特有的一個(gè)物種,其體內(nèi)所具有的耐高溫精氨酸抑制因子也具有自己特有的結(jié)構(gòu)。
發(fā)明內(nèi)容
本發(fā)明的目的之一是提供一種分離的,編碼具有耐高溫精氨酸抑制因子活性的多肽的核苷酸序列。
本發(fā)明的目的之二是提供一種分離的,具有耐高溫精氨酸抑制因子活性多肽。
本發(fā)明的目的還提供了嗜熱厭氧菌的精氨酸抑制因子重組載體、含有重組載體的宿主細(xì)胞,以及生產(chǎn)蛋白的方法。
本發(fā)明一方面提供一種能編碼具有耐高溫精氨酸抑制因子活性的多肽的核苷酸序列。所說的核苷酸序列編碼具有SEQ ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與精氨酸抑制因子相關(guān)。核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯(cuò)義。
本發(fā)明另一方面提供了一種耐高溫精氨酸抑制因子活性的多肽。該多肽具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
生產(chǎn)耐高溫精氨酸抑制因子的方法為1)分離出編碼耐高溫精氨酸抑制因子的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫精氨酸抑制因子的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫精氨酸抑制因子。
本發(fā)明涉及嗜熱厭氧菌的耐高溫精氨酸抑制因子基因的分離及表達(dá)。以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫精氨酸抑制因子基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫精氨酸抑制因子的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫精氨酸抑制因子活性的多肽的氨基酸序列及功能等同體。同時(shí),本發(fā)明還提供了制備,分離,純化具有耐高溫精氨酸抑制因子活性的多肽的方法。
圖1是測序文庫構(gòu)建步驟流程圖;圖2是測序與數(shù)據(jù)分析流程圖。
具體實(shí)施例方式
首先,本發(fā)明提供了分離的,編碼耐高溫精氨酸抑制因子活性的多肽的多聚核苷酸分子,該核苷酸分子是通過對騰沖嗜熱厭氧菌全基因組測序與分析而獲得的,具有SEQ.ID NO.1的核苷酸序列,它編碼具有151氨基酸的多肽,該多肽推測分子量為17006道爾頓。
本發(fā)明還提供一種重組載體,該載體包含本發(fā)明的分離的核苷酸分子,以及包含有重組載體的宿主細(xì)胞。同時(shí),本發(fā)明包括構(gòu)建該重組載體和宿主細(xì)胞的方法,以及用重組工程技術(shù)生產(chǎn)耐高溫精氨酸抑制因子的方法。
本發(fā)明進(jìn)一步地提供了一種分離的耐高溫精氨酸抑制因子或多肽,其特征在于具有SEQ.ID NO.2氨基酸序列,或至少70%相似,更佳地,至少具有90%,95%,99%的相同。
在本發(fā)明中,“分離的”DNA是指該DNA或片段已從天然狀態(tài)下位于其兩側(cè)的序列中分離出來,還指該DNA或片段已經(jīng)與天然狀態(tài)下伴隨核酸的組份分開,而且已經(jīng)與在細(xì)胞中伴隨其的蛋白質(zhì)分開。
在本發(fā)明中,“耐高溫精氨酸抑制因子基因”指編碼具有耐高溫精氨酸抑制因子活性的多肽的核苷酸序列,如SEQ.ID NO.1的核苷酸序列及其簡并序列。該簡并序列是指該序列中有一個(gè)或多個(gè)密碼子被編碼相同氨基酸的簡并密碼子所取代后而產(chǎn)生的序列。由于公知的密碼子的簡并性,所以與SEQ ID NO.1核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ ID NO.2所述的氨基酸序列。該術(shù)語還包括能在中度嚴(yán)謹(jǐn)條件下,更佳地在高度嚴(yán)謹(jǐn)條件下與SEQ IDNO.1的核苷酸序列雜交的核苷酸序列。該術(shù)語還包括與SEQ ID NO.1核苷酸序列同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
在本發(fā)明中,“分離的”蛋白的多肽是指其至少占樣品總物質(zhì)的至少20%,較佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或濕重計(jì))。純度可以用任何合適的方法進(jìn)行測量,如用柱層析,PAGE或HPLC法測量多肽的純度。分離的多肽基本上不含天然狀態(tài)下的伴隨其的組份。
在本發(fā)明中,“耐高溫精氨酸抑制因子”指具有耐高溫精氨酸抑制因子活性的SEQ ID NO.2序列的多肽。該術(shù)語還包括SEQ ID NO.2序列的變異體,這些變異體具有與天然耐高溫精氨酸抑制因子相同的功能。這些變異體包括(但不限于)若干個(gè)氨基酸的缺失,插入和/或取代,以及在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸,也可以是不影響序列的修飾形式上的差異。例如,為本領(lǐng)域所公知的,用性能相近或相似的氨基酸進(jìn)行取代時(shí),通常不會(huì)改變蛋白質(zhì)的功能。又比如,在C末段和/或N末端添加一個(gè)或數(shù)個(gè)氨基酸通常也不會(huì)改變蛋白質(zhì)的功能。該術(shù)語還包括耐高溫精氨酸抑制因子的活性片段和活性衍生物。
在本發(fā)明中,可選用本領(lǐng)域已知的各種載體,如市售的各種質(zhì)粒,粘粒,噬菌體及反轉(zhuǎn)錄病毒等。在生產(chǎn)本發(fā)明的耐高溫精氨酸抑制因子時(shí),可以將耐高溫精氨酸抑制因子基因序列與表達(dá)調(diào)控序列相連,從而形成耐高溫精氨酸抑制因子表達(dá)載體。表達(dá)載體含有復(fù)制起始點(diǎn)和表達(dá)調(diào)控序列,啟動(dòng)子,增強(qiáng)子和必要的加工信息位點(diǎn)。表達(dá)載體還必須含有可供選擇的標(biāo)記基因,如a)提供對抗生素或其它毒性物質(zhì)(氨芐青霉素,卡那霉素,氨甲蝶呤等)的抗性的蛋白質(zhì)或b)互補(bǔ)營養(yǎng)缺陷型蛋白質(zhì)或c)提供復(fù)合培養(yǎng)基中沒有的必需營養(yǎng)成分的蛋白質(zhì)。各種不同宿主的合適標(biāo)記基因是本領(lǐng)域中所熟知或生產(chǎn)廠商說明書注明的。這些表達(dá)載體可以用本領(lǐng)域技術(shù)人員公知的重組DNA技術(shù)制備,如可參考Sambrook等人,1989或Ausubel等人,1992。
重組表達(dá)載體可以用本領(lǐng)域熟知的方法引入宿主細(xì)胞,這些方法包括電轉(zhuǎn)化法,氯化鈣法,基因槍法等。將外源重組載體導(dǎo)入宿主細(xì)胞的過程稱為“轉(zhuǎn)化”。通過培養(yǎng)宿主細(xì)胞,誘導(dǎo)所需蛋白的表達(dá),并通過本領(lǐng)域所熟知的蛋白分離技術(shù),如柱層析等得到所需的蛋白質(zhì)。也可采用固相技術(shù)等人工合成該蛋白質(zhì)。
在本發(fā)明中,術(shù)語“宿主細(xì)胞”包括原核細(xì)胞和真核細(xì)胞。常用的原核細(xì)胞如大腸桿菌,枯草桿菌等。常用的真核細(xì)胞如酵母細(xì)胞,或各種動(dòng)植物細(xì)胞。本發(fā)明的耐高溫精氨酸抑制因子基因全長序列或其片段通??梢杂镁酆厦告?zhǔn)椒磻?yīng)(PCR)擴(kuò)增法,重組法,或人工合成的方法獲得。對于PCR擴(kuò)增法,可根據(jù)本發(fā)明所公開的有關(guān)核苷酸序列來設(shè)計(jì)引物,用本領(lǐng)域技術(shù)人員已知的常規(guī)方法制備的嗜熱厭氧菌全基因組DNA為模板,擴(kuò)增而得到有關(guān)序列。一旦獲得了有關(guān)序列,就可以將其克隆入有關(guān)載體,再轉(zhuǎn)入宿主細(xì)胞,然后通過常規(guī)方法從增殖后的宿主細(xì)胞中分離得到大批量的有關(guān)序列。
下面結(jié)合具體實(shí)施例,進(jìn)一步闡述本發(fā)明。下列實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如Sambrook等人,分子克隆實(shí)驗(yàn)室手冊(New YorkCold Spring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實(shí)施例1構(gòu)建測序文庫測序文庫的構(gòu)建采用全基因組霰彈法(shotgun)進(jìn)行。首先培養(yǎng)騰沖嗜熱厭氧菌,培養(yǎng)方法按(Yanfen Xue,2000)改進(jìn)的MB培養(yǎng)基(Balch et al.,1979),按Marmur(1961)方法收集細(xì)菌,提取總DNA。為了保證測序文庫構(gòu)建的隨機(jī)性,最大程度地避免產(chǎn)生斷裂熱點(diǎn)的問題,采用多種方法、不同條件的建庫原則。先采用物理剪切方法(包括超聲波法及用Hydroshear Machine進(jìn)行剪切),其次根據(jù)該菌基因組特征選用AluI進(jìn)行隨機(jī)部分酶切。物理剪切時(shí)采用不同強(qiáng)度處理樣品,酶切時(shí)通過設(shè)置酶量梯度處理樣品。處理后的樣品經(jīng)平末端處理后,采用電泳分部收集1.5-4kb DNA片段,與去磷酸化的經(jīng)SmaI酶切的pUC18進(jìn)行連接,連接產(chǎn)物通過電轉(zhuǎn)化E.coli DH5α構(gòu)建了隨機(jī)測序的文庫。同時(shí),為了便于以后重疊群(contig)的搭接還構(gòu)建了長插入片段(10kb左右)的測序文庫(將基因組DNA以Sau3AI隨機(jī)部分酶切,電泳收集10kb左右的片段,與去磷酸化的經(jīng)BamHI酶切的pUC18進(jìn)行連接、構(gòu)建文庫)。該文庫經(jīng)兩個(gè)末端的測序在完成圖(finishing)的過程中可以得到contig之間的關(guān)系,并可以解決較大的洞(gap)對補(bǔ)洞造成的困難。建庫流程見圖1。
實(shí)施例2基因組測序在完成騰沖嗜熱厭氧菌基因組的測序時(shí),主要使用了兩種全自動(dòng)測序儀ABI377和MegaBACE 1000。這兩種測序儀都是利用電泳原理進(jìn)行測序(見圖2),每次可完成96個(gè)樣品。ABI377是PE公司的產(chǎn)品,是ABI系列的一種。它屬于平板凝膠電泳測序儀。MegaBACE 1000是法瑪西亞公司的產(chǎn)品,屬于毛細(xì)管凝膠電泳測序儀。
實(shí)施例3Basecalling和測序質(zhì)量監(jiān)控所謂Basecalling是指從測序儀上得到的原始數(shù)據(jù)文件中得到正確的堿基序列的過程。由于測序儀上得到的是A,T,G,C四種堿基對應(yīng)的不同波長的光的強(qiáng)度變化軌跡(trace),需要用計(jì)算機(jī)采取一定的算法從中正確識(shí)別出不同的軌跡對應(yīng)的堿基。我們使用的是Phred軟件(Ewing B,Hillier L,1998),原因是其結(jié)果更可靠,并且其結(jié)果輸出更便于同一軟件包中的其他程序進(jìn)行進(jìn)一步的分析。
Phred進(jìn)行Basecalling的算法原理,是根據(jù)軌跡中各個(gè)峰的形狀,間距,以及信噪比等因素,判斷堿基類型,同時(shí)對這個(gè)堿基給出可信度信息,即堿基的測序質(zhì)量。在大規(guī)模測序中,測序質(zhì)量的監(jiān)控是十分重要的,它直接影響對測序的決策,包括文庫的構(gòu)建,覆蓋率的大小。同時(shí)對測序?qū)嶒?yàn)中可能出現(xiàn)的失誤能及時(shí)反饋。
實(shí)施例4序列拼接所謂序列拼接,就是把全基因組霰彈法,又稱鳥槍法隨機(jī)測序得到的樣品序列組裝成連續(xù)的重疊群(contig),主要利用它們之間的重疊序列作參考??紤]到測序中存在載體的影響,需要先對樣品序列進(jìn)行去載體處理。這里所用的軟件cross match和后面拼接所用的軟件Phrap都是美國Washington大學(xué)的軟件(Gordon D,Abajian C,1998),其基本原理為Swith-Waterman算法(WatermanMS,1990)。這是一種動(dòng)態(tài)算法,在考慮了兩兩序列之間的比較之后,可以得到一組序列的公有序列(consensus sequence)。去除載體后的樣品序列再用Phrap進(jìn)行拼接。在拼接時(shí),堿基的測序質(zhì)量也被考慮了,所得到的公有序列各堿基的可信度,由組成該公有序列的樣品的測序質(zhì)量計(jì)算得到。
實(shí)施例5基因注釋在大體得到基因組的大部分序列(完成工作框架圖)后,就需要對基因組進(jìn)行注釋,包括進(jìn)行開讀框架(Open Reading Frame,ORF)的預(yù)測,基因功能的預(yù)測,以及特殊RNA片段的分析等。
第一步采用缺省參數(shù)的GLIMMER2.0(Delcher,A.L.,Harmon,D.1999)和ORPHEUS(Frishman,D.1998)軟件預(yù)測基因編碼序列,然后所有預(yù)測的開讀框和非編碼區(qū)(intergenic region)都用BLAST軟件(Altschul,S.F.et al.1997)與NCBI的無冗余蛋白數(shù)據(jù)庫(non-redundant protein database)比較來發(fā)現(xiàn)可能漏掉的基因。在判斷一個(gè)基因的起始點(diǎn)時(shí),將參考各種相關(guān)信息,如序列同源性,核糖體結(jié)合位點(diǎn),可能的信號肽序列和啟動(dòng)子序列等。如果在一個(gè)開讀框內(nèi)出現(xiàn)多個(gè)啟動(dòng)子時(shí),一般采用第一個(gè)啟動(dòng)子作為基因的起始點(diǎn)。采用TransTerm軟件(Ermolaeva,M.D.2000)在非編碼區(qū)預(yù)測不依賴于Rho(ρ)因子的轉(zhuǎn)錄終止子。如果該終止子位于一個(gè)基因的下游區(qū)的太遠(yuǎn)處,則可能暗示一個(gè)小基因的丟失或測序錯(cuò)誤人為地縮短了該基因,可作為進(jìn)一步分析的參考。在確定移框突變和點(diǎn)突變時(shí),主要根據(jù)與數(shù)據(jù)庫中的蛋白質(zhì)的相似性來判斷。如果出現(xiàn)一個(gè)蛋白質(zhì)對應(yīng)于兩個(gè)彼此相鄰的編碼序列的情況,則被認(rèn)為是一個(gè)無活性基因(假基因pseudogenes),因?yàn)檫@說明這兩個(gè)編碼序列之間由于突變而產(chǎn)生異常中止現(xiàn)象,進(jìn)而使基因失去活性。所有分析結(jié)果再用Artemis sequence viewer軟件(Rutherford,K.et al.2000)進(jìn)行手工分析。一些明顯與其它編碼序列有重疊的開讀框,長度小于150堿基對并且在已有數(shù)據(jù)庫中沒有同源性和其中沒有明顯的啟動(dòng)子或終止區(qū)域的開讀框?qū)⒈蝗コ?br>
蛋白質(zhì)的功能片段(motif)和功能區(qū)域(domain)分別采用與Pfam、PRINTS、PROSITE、ProDom和SMART數(shù)據(jù)庫進(jìn)行比對分析,結(jié)果再用InterPro數(shù)據(jù)庫(Apweiler,R.et al.2001)進(jìn)行匯總分析。根據(jù)NCBI的COGs數(shù)據(jù)庫(Tatusov,R.L.et al.2001)并且參照其他數(shù)據(jù)庫的查詢結(jié)果來確定蛋白質(zhì)在COGs分類中的功能分類和可能的代謝途徑。用TMHMM軟件(Krogh,A.et al.2001)來確認(rèn)膜蛋白、ABC轉(zhuǎn)運(yùn)蛋白和跨膜功能域。采用革蘭氏陰性菌為參數(shù),用SIGNALP2.0軟件(Nielsen,H.et al.1999)分析信號肽區(qū)域。
(4)補(bǔ)洞在完成基因組的工作框架圖之后,就要進(jìn)行更加困難的補(bǔ)洞工作,即完成整個(gè)基因組100%的測序,得到一個(gè)環(huán)形基因組。主要工作就是把前面得到的contig連接起來。這是一項(xiàng)十分具體而又繁雜的工作。主要方法包括
A.利用測序中的正反向測序樣品信息在測序過程中,我們有意對某些樣品進(jìn)行了雙向測序,即同時(shí)測序某個(gè)插入片段的兩端,再將所得序列與其他序列一起進(jìn)行拼接。由于這一對序列在基因組上的關(guān)系一定,其之間的距離大致已知,根據(jù)這一信息,一可以確認(rèn)某段contig是否可靠,二是當(dāng)這一對序列分別位于不同的contig上時(shí),可以確定這兩個(gè)contig的方向關(guān)系和位置關(guān)系,為進(jìn)一步設(shè)計(jì)實(shí)驗(yàn)提供參考。
B.長插入片段及Cosmid末端測序基于同樣的原理,我們可以構(gòu)建不同長度的插入片段文庫,只對其兩端測序,然后拼接,分析其具體位置。這些文庫包括長度為9-12Kb的長插入片段庫和20-40Kb左右的Cosmid文庫。具體分析方法同上所述。
C.PCR和末端延伸Walking實(shí)驗(yàn)根據(jù)A和B所提供的contig方向和位置關(guān)系,進(jìn)一步的生物化學(xué)實(shí)驗(yàn)就可以進(jìn)行了。如設(shè)計(jì)一對引物進(jìn)行PCR擴(kuò)增,或以某一contig末端序列合成引物進(jìn)行末端延伸(Walking)來補(bǔ)洞等。
實(shí)施例6精氨酸抑制因子的制備和提純根據(jù)實(shí)施例中基因注釋得到的精氨酸抑制因子全長編碼序列(SEQ IDNO.1),設(shè)計(jì)能擴(kuò)增出完整編碼閱讀框的引物,并在正反引物上分別引入限制性內(nèi)切酶位點(diǎn),以便構(gòu)建表達(dá)載體。以實(shí)施例1中獲得的測序文庫的質(zhì)粒DNA為模板,經(jīng)PCR擴(kuò)增后,在保證閱讀框正確的前提下重組至pGEX-2T載體(Pharmacia,Piscataway,NJ)。再將重組載體轉(zhuǎn)化入大腸桿菌DH5α中(轉(zhuǎn)化方法為CaCL2法或電轉(zhuǎn)化法)。篩選鑒定的到含有表達(dá)載體的工程菌DH5α-pGEX-2T-ArgR。
挑取單菌落的工程菌DH5α-pGEX-2T-ArgR于3ml含100μg/ml氨芐青霉素的LB培養(yǎng)基中振搖培養(yǎng)37℃過夜,按1∶100的濃度吸取培養(yǎng)液于新的LB培養(yǎng)基(含100μg/ml氨芐青霉素)中培養(yǎng)約3小時(shí),至OD600達(dá)0.5后,加入IPTG至終濃度1mmol/L,繼續(xù)于37℃分別培養(yǎng)0,1,2,3小時(shí)。取培養(yǎng)時(shí)間不同的1ml菌液離心,在細(xì)菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細(xì)菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預(yù)期分子量大小的蛋白量隨IPTG誘導(dǎo)時(shí)間增加而增加的菌株即為表達(dá)所需蛋白的工程菌。
按上述方法誘導(dǎo)表達(dá)所需蛋白的工程菌后,將細(xì)菌離心沉淀,按每400ml菌加入20ml PBS飽和的50%谷胱苷肽Sepharose 4B,37℃振搖結(jié)合30分鐘,10000rpm離心10分鐘沉淀結(jié)合了所需蛋白的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl還原型谷胱苷肽洗脫液,室溫置10分鐘,上清即為洗脫的蛋白。重復(fù)洗脫兩次。洗脫的上清保存于-80℃,并進(jìn)行SDS-PAGE電泳,檢測純化效果。在17006道爾頓處的蛋白質(zhì)條帶即為精氨酸抑制因子。
序列表<110>杭州華大基因研發(fā)中心<120>耐高溫精氨酸抑制因子基因及其編碼的多肽和制備方法<140><141><160>2<170>PatentIn Version 3.1<210>1<211>456<212>DNA<213>騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis)<220><221>gene<222>(1)…(456)<223>n=a或g或c或t<400>1atgatgaagt tggcaaggca tgccaagatt ttagagataa tttctgaaaa agaaatagag60acgcaggaag agctggcagc agaacttcag aagagaggaa tagatgtcac acaggccacg 120gtgtctagag atattaaaga gcttcgcctc ataaaagttc ttacagaaga tggaaaaaga 180tacaaatatg cgccaatgac aaaagtagat actaatataa gtgaaagact tatgacttta 240ctttctgagt ccatagtcaa tgtggactat gctggaaaca tcatagtcat aaaaacgtta 300tcaggcagtg cttcagcagc agccgaagca attgatactc ttaattggaa aaatattgta 360ggcactattg ccggcgataa tactattttt gtccttgtga gaaaccagga ggatattcaa 420gaactggtgg agaagttcag aaaactcatg aagtag 456<210>2<211>151<212>PRT<213>騰沖嗜熱厭氧菌(Thermoanaerobacter tangcongensis)<400>2Met Met Lys Leu Ala Arg His Ala Lys Ile Leu Glu Ile Ile Ser Glu1 5 10 15Lys Glu Ile Glu Thr Gln Glu Glu Leu Ala Ala Glu Leu Gln Lys Arg20 25 30Gly Ile Asp Val Thr Gln Ala Thr Val Ser Arg Asp Ile Lys Glu Leu35 40 45Arg Leu Ile Lys Val Leu Thr Glu Asp Gly Lys Arg Tyr Lys Tyr Ala50 55 60Pro Met Thr Lys Val Asp Thr Asn Ile Ser Glu Arg Leu Met Thr Leu65 70 75 80Leu Ser Glu Ser Ile Val Asn Val Asp Tyr Ala Gly Asn Ile Ile Val85 90 95Ile Lys Thr Leu Ser Gly Ser Ala Ser Ala Ala Ala Glu Ala Ile Asp100 105 110Thr Leu Asn Trp Lys Asn Ile Val Gly Thr Ile Ala Gly Asp Asn Thr115 120 125Ile Phe Val Leu Val Arg Asn Gln Glu Asp Ile Gln Glu Leu Val Glu130 135 140Lys Phe Arg Lys Leu Met Lys145 150
權(quán)利要求
1.一種分離的DNA分子,其特征在于它是編碼具有耐高溫精氨酸抑制因子蛋白活性的多肽的核苷酸序列。
2.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列編碼具有SEQ.ID NO.2中的氨基酸序列的多肽或所述多肽的修飾形式,該修飾形式功能上相當(dāng)或與耐高溫精氨酸抑制因子相關(guān)。
3.如權(quán)利要求1所述的DNA分子,其特征在于所說的核苷酸序列具有SEQ ID NO.1的多核苷酸序列以及它的突變形式,突變類型包括缺失、無義、插入、錯(cuò)義。
4.一種分離出的多肽,其特征在于它具有耐高溫精氨酸抑制因子活性。
5.如權(quán)利要求4所述的多肽,其特征在于它具有SEQ ID No.2中的氨基酸序列的多肽、或其保守性變異多肽、或其活性片段、或其活性衍生物。
6.一種載體,其特征在于它含有權(quán)利要求1中之DNA。
7.一種宿主細(xì)胞,其特征在于它是用權(quán)利要求6所述載體轉(zhuǎn)化的原核細(xì)胞或真核細(xì)胞。
8.一種制備耐高溫精氨酸抑制因子的方法,其特征在于該方法包括1)分離出編碼耐高溫精氨酸抑制因子基因的核苷酸序列SEQ ID NO.1;2)構(gòu)建含SEQ ID NO.1核苷酸序列的表達(dá)載體;3)將步驟2)中表達(dá)載體轉(zhuǎn)入宿主細(xì)胞,形成能生產(chǎn)耐高溫精氨酸抑制因子的重組細(xì)胞;4)培養(yǎng)步驟3)中的重組細(xì)胞;5)分離、純化得到耐高溫精氨酸抑制因子。
全文摘要
本發(fā)明公開了一種耐高溫精氨酸抑制因子基因及其編碼的多肽和制備方法。它涉及編碼具有活性或其功能等同變異體的分離的DNA和利用重組DNA技術(shù)以所述分離的DNA生產(chǎn)具有耐高溫精氨酸抑制因子活性的多肽或其功能等同變異體。以騰沖嗜熱厭氧菌全基因組測序與分析為基礎(chǔ),克隆分離了耐高溫精氨酸抑制因子基因。該基因?qū)τ谥苽溆糜谏a(chǎn)耐高溫精氨酸抑制因子的轉(zhuǎn)基因微生物或動(dòng)植物,并回收獲得該基因編碼的酶有用。另外,本發(fā)明還提供了具有耐高溫精氨酸抑制因子活性的多肽的氨基酸序列及功能等同體。同時(shí),提供了制備,分離,純化具有耐高溫精氨酸抑制因子活性的多肽的方法。
文檔編號C12N15/64GK1379091SQ0211136
公開日2002年11月13日 申請日期2002年4月12日 優(yōu)先權(quán)日2002年4月12日
發(fā)明者汪建, 李蔚, 張麗敏, 王鵬, 王俊 申請人:杭州華大基因研發(fā)中心