專利名稱:重組II型限制性內(nèi)切核酸酶MmeI和相關(guān)內(nèi)切核酸酶以及制備這些酶的方法
背景技術(shù):
本發(fā)明涉及DNA(脫氧核糖核酸)片段,該片段編碼具有兩種相關(guān)的酶功能的多肽,一個酶功能是識別DNA序列5’-TCC(Pu)AC-3’并且剪切位于這個識別序列3’端第20和第21個殘基之間的磷酸二酯鍵以及互補(bǔ)鏈上的識別序列5’-GT(Py)GGT-3’的5’端第18和19個殘基之間的磷酸二酯鍵,從而產(chǎn)生具有兩個堿基的3’粘末端(以下稱為MmeI限制性內(nèi)切酶),而第二個酶活性是識別同樣的DNA序列,5’-TCC(Pu)AC-3’,但是通過增加一個甲基來修飾這段序列以防止內(nèi)切酶MmeI的剪切。本發(fā)明還涉及含有該DNA片段的載體、含有該DNA片段的轉(zhuǎn)化宿主,以及從這樣的轉(zhuǎn)化宿主中制備出MmeI限制性內(nèi)切酶的改進(jìn)的方法。本發(fā)明還涉及鑒定編碼具有和MmeI同樣特性但卻很可能具有獨(dú)特的DNA識別序列的酶的其它DNA片段的方法。這個方法依賴于本申請中所提出的MmeI酶的氨基酸序列的使用,或者由此依賴于通過這個方法鑒定出來的別的序列。本發(fā)明還涉及可以通過所述的該方法鑒定出來的其它的DNA片段,這些片段中的每一個都編碼與MmeI多肽具有顯著的氨基酸序列相似性的多肽。由這些DNA片段編碼的多肽被預(yù)測表現(xiàn)出和MmeI相似的功能。特別地,這些多肽被預(yù)測具有雙重的酶學(xué)功能在離特異性識別序列相對遠(yuǎn)的距離處以特異性的方式剪切DNA,而又修飾它們的識別序列以防止宿主DNA由于內(nèi)切酶活性而被剪切。通過這種方法鑒定出來的酶的一個實(shí)例是CstMI(參見申請序列號為_____的美國專利申請,其與本申請同時提交)。CstMI由于其與MmeI高度顯著的氨基酸序列相似性而被認(rèn)為是一種潛在的內(nèi)切酶。CstMI識別序列5’-AAGGAG-3’,并剪切位于該識別序列3’端第20和第21個殘基之間的磷酸二酯鍵以及互補(bǔ)鏈上識別序列5’-CTCCTT-3’的5’端第18和19個殘基之間的磷酸二酯鍵,由此產(chǎn)生具有兩個堿基的3’粘末端。
限制性內(nèi)切酶是一類自然存在于原核生物中的酶。已知的限制性酶切系統(tǒng)有好幾種,其中II型內(nèi)切酶是在遺傳工程中非常有用的一類。當(dāng)這些II型內(nèi)切酶與原核生物中的其它雜質(zhì)組分分開而被純化出來以后,就可以在實(shí)驗(yàn)室中用來將DNA分子打斷成準(zhǔn)確的片段。這種特性使得DNA分子可以被特定地鑒定出來并且被分到它們的組成基因中。限制性內(nèi)切酶已經(jīng)被證明是現(xiàn)代遺傳學(xué)研究中不可或缺的工具。它們是生物化學(xué)上的“剪刀”,通過它們遺傳工程和分析得以進(jìn)行。
限制性內(nèi)切酶通過識別并結(jié)合到DNA分子上特定的核苷酸序列(“識別序列”)而起作用。一旦結(jié)合到DNA序列上,II型內(nèi)切酶就在這段序列的內(nèi)部或者是一側(cè)剪切核酸分子。不同的限制性內(nèi)切酶對不同的識別序列具有親和性。大多數(shù)限制性內(nèi)切酶識別的序列長度為4到6個核苷酸,雖然最近也有少數(shù)識別7或8個特異核苷酸的限制性內(nèi)切酶已經(jīng)被分離出來。絕大多數(shù)識別序列都含有一對對稱軸,而且在絕大多數(shù)情況下所有的核苷酸都是獨(dú)特地確定的。然而,有些限制性內(nèi)切酶具有簡并或者不嚴(yán)格的特異性,因?yàn)樗鼈冊谒鼈兊淖R別序列中一個或者多個位置處識別多種堿基,而且有的限制性內(nèi)切酶識別非對稱的序列。HaeIII識別的序列是5’-GGCC-3’,這是具有對稱性、非簡并識別序列的一個實(shí)例;HaeII識別的序列是5’-(Pu)GCGC(Py)-3’,這是典型的具有簡并的或者不嚴(yán)格的識別序列的限制性內(nèi)切酶;而BspMI識別的序列為5’-ACCTGC-3’,這是典型的具有非對稱識別序列的限制性內(nèi)切酶。具有對稱性識別序列的II型內(nèi)切酶一般對稱地在識別位點(diǎn)內(nèi)部或者與之相鄰的位置剪切,而那些識別非對稱序列的限制性內(nèi)切酶往往在距離識別位點(diǎn)一端1到20個堿基范圍內(nèi)剪切。本申請的酶MmeI(還有CstMI)具有的特性就是在距離所有已知的II型限制性內(nèi)切酶的識別序列最遠(yuǎn)的位置剪切DNA。目前有多于200種獨(dú)特的限制性內(nèi)切酶在幾千種已經(jīng)研究過的細(xì)菌物種中被鑒定出來。
限制性系統(tǒng)的另一個組分是甲基化修飾酶。這些酶與限制性內(nèi)切酶互補(bǔ),它們?yōu)榧?xì)菌提供可以保護(hù)自身的DNA并與外源侵染的DNA區(qū)分開來的手段。甲基化修飾酶識別并結(jié)合到與對應(yīng)的限制性內(nèi)切酶同樣的識別序列上,但它們不是打斷DNA,而是通過添加甲基基團(tuán)來化學(xué)修飾序列中的一個或者其它的核苷酸。甲基化之后,識別序列便不再會被限制性內(nèi)切酶剪切。細(xì)菌細(xì)胞的DNA借助它的甲基化修飾酶的活性而被修飾,因而它對內(nèi)源限制性內(nèi)切酶的存在變得不敏感。只有未被修飾因而也就被認(rèn)為是外源的DNA才對限制性內(nèi)切酶的識別和剪切敏感。甲基轉(zhuǎn)移修飾酶常常是不同于它們的同源內(nèi)切酶伴侶的另外一種酶。在某些情況下,一種單個的多肽同時具有甲基轉(zhuǎn)移修飾酶和內(nèi)切酶的功能,比如Eco57I。在這樣的情況下,會有另外一個甲基轉(zhuǎn)移酶存在并作為限制-修飾系統(tǒng)的一部分。相反,本申請中的MmeI系統(tǒng)沒有另外的甲基轉(zhuǎn)移酶與內(nèi)切酶-甲基轉(zhuǎn)移酶多肽相伴。
內(nèi)切酶的命名是根據(jù)它們來源的細(xì)菌而制定的。因此,比如嗜血桿菌(Haemophilus ageyptius)合成三種不同的限制性內(nèi)切酶,它們就會被命名為HaeI、HaeII和HaeIII。這些酶識別和剪切的序列分別為5’-(W)GGCC(W)-3’、5’-(Pu)GCGC(Py)-3’和5’-GGCC-3’。另一方面,大腸桿菌(Escherichia coli)RY13只合成一種內(nèi)切酶EcoRI,它識別的序列是5’-GAATTC-3’。
雖然并不想受到理論的約束,但是一般認(rèn)為在自然界中,限制性內(nèi)切酶在細(xì)菌細(xì)胞的保障系統(tǒng)中起著保護(hù)性作用。它們可以使細(xì)菌能夠抵抗外源DNA分子比如病毒或者質(zhì)粒的侵染,不然這些分子可能會破壞或者寄生于細(xì)胞。它們是通過識別侵染DNA分子中出現(xiàn)的識別序列并在這些位置剪切DNA而達(dá)到抵抗的目的。由此產(chǎn)生的這種瓦解使得很多侵染性的基因失活,而且促使這些DNA易于進(jìn)一步被外切酶降解。
已經(jīng)有多于3000種限制性內(nèi)切酶從各種細(xì)菌株系中被分離出來。其中超過240種是識別獨(dú)特的序列,而其他種類的內(nèi)切酶則分享共同的識別特異性。識別同樣的核苷酸序列的限制性內(nèi)切酶被稱為“同裂酶(isoschizomer)”。雖然同裂酶的識別序列是一樣的,但是它們的剪切位點(diǎn)卻有可能會不同(比如XmaI和SmaI,Endow等,J.Mol.Biol.112521(1977);Waalwijk等,Nucleic Acids Res.53231(1978)),并且在不同位點(diǎn)的剪切速率也會有所不同(XhoI和PaeR7I,Gingeras等,Proc.Natl.Acad.Sci.U.S.A.80402(1983))。
限制性內(nèi)切酶傳統(tǒng)地被分成三個主要的大類I型、II型和III型。I型限制性系統(tǒng)召集多種肽構(gòu)成復(fù)合物,其由限制性多肽、修飾性多肽和特異性或者DNA識別多肽組成。I型系統(tǒng)需要二價陽離子、ATP和S-腺苷甲硫氨酸(SAM)作為輔助因子。I型系統(tǒng)剪切DNA的位置隨機(jī),最遠(yuǎn)可以在距離它們的特異性識別位點(diǎn)幾千個堿基對的位置。III型系統(tǒng)一般識別非對稱的DNA序列,而剪切則發(fā)生在距離識別序列一側(cè)20到30個堿基對的特異性位置。這樣的系統(tǒng)需要ATP作為輔助因子,同時也需要SAM和二價陽離子。III型系統(tǒng)是由內(nèi)切酶多肽和修飾性多肽構(gòu)成的復(fù)合體組成,這樣它便可以修飾識別序列處的DNA或者剪切DNA。由于它們的修飾活性和剪切活性之間的競爭,III型系統(tǒng)產(chǎn)生的是部分消化的DNA底物,因此也沒有在遺傳操作中被使用。
MmeI的DNA剪切活性不需要ATP,而且它剪切完全;因此它可以被歸為一種II型內(nèi)切酶。盡管如此,與其他II型內(nèi)切酶所不同的是,MmeI由一條結(jié)合了內(nèi)切酶和修飾活性的單個多肽組成,這使得它自身就足可以形成完整的限制-修飾系統(tǒng)。MmeI也是所有II型內(nèi)切酶中在距離特異性DNA識別序列的最遠(yuǎn)處進(jìn)行剪切的(本申請的CstMI也是如此)。MmeI相當(dāng)大,似乎三個功能性結(jié)構(gòu)域整合在一段多肽中。這些結(jié)構(gòu)域由氨基末端結(jié)構(gòu)域、DNA修飾結(jié)構(gòu)域和羧基末端結(jié)構(gòu)域組成;氨基末端結(jié)構(gòu)域包含內(nèi)切酶DNA剪切基序(motif),也參與DNA識別,DNA修飾結(jié)構(gòu)域與γ類N6mA甲基轉(zhuǎn)移酶最相似,羧基末端結(jié)構(gòu)域被推測參與二聚體的形成和并可能參與DNA識別。這種酶的剪切和修飾活性都需要SAM。單個MmeI多肽足可以在體內(nèi)條件下修飾攜帶基因的質(zhì)粒載體以使得在體外條件下免受MmeI的剪切,而在使用含飾的DNA。
對于新的II型限制性內(nèi)切酶的需要一直在持續(xù)不斷。雖然目前已經(jīng)有識別大量特異性核苷酸序列的II型限制性內(nèi)切酶可以利用,但是識別新的序列的新的限制性內(nèi)切酶對遺傳操作會提供更多的機(jī)會和能力;每一個新的獨(dú)特的內(nèi)切酶都可以使科學(xué)家利用這種內(nèi)切酶提供的所有機(jī)會來準(zhǔn)確地在DNA分子內(nèi)新的位置剪切DNA。
發(fā)明概述根據(jù)本發(fā)明,提供了編碼新型的限制性內(nèi)切酶的新的DNA片段,這個片段可以從嗜甲醇營養(yǎng)菌(Methylophilus methylotrophus)(NEB#1190)中獲得。因此這種內(nèi)切酶被命名為“MmeI”,這種內(nèi)切酶(1)識別雙鏈DNA分子中的簡并核苷酸序列,如下所示5’-TCC(Pu)AC-3’3’-AGG(Py)TG-5’(其中G代表鳥嘌呤,C代表胞嘧啶,A代表腺嘌呤,T代表胸腺嘧啶,(Pu)代表一種嘌呤,A或者G,而(Py)代表一種嘧啶,C或者T);(2)在識別序列5’-TCC(Pu)AC-3’的3’側(cè)第20個核苷酸位置后面的磷酸二酯健處和在互補(bǔ)鏈上識別序列5’-GT(Py)GGA-3’的5’側(cè)第18個核苷酸位置前面的磷酸二酯鍵處剪切DNA,產(chǎn)生一個伸出兩個堿基的3’端5’-TCC(Pu)AC(N20)-3’3’-AGG(Py)TG(N18)-5’;(3)在體內(nèi)條件下使(1)中指出的識別序列甲基化以保護(hù)宿主DNA免受內(nèi)切酶MmeI活性造成的剪切。
本發(fā)明進(jìn)一步涉及其它的DNA片段,這些片段中的每一個都被鑒定出編碼具有與MmeI限制-修飾多肽顯著的序列相似性的多肽。編碼MmeI多肽的DNA片段使得這些其它的潛在的內(nèi)切酶可以被鑒定出來,其中利用程序如BLAST(Altschul等,Nucleic Acids Res.253389-3402(1997))在數(shù)據(jù)庫例如GENBANK可獲得的序列中進(jìn)行MmeI序列的相似性搜索。這些DNA片段以及其它的將會在以后提交到數(shù)據(jù)庫中的具有與MmeI這樣的相似性的片段,都是可以編碼與MmeI類似的多肽的候選者,這些被編碼的多肽同時作為限制性內(nèi)切酶和甲基轉(zhuǎn)移酶。類似于MmeI,這些多肽可以在距離識別序列類似遠(yuǎn)的位置處剪切DNA,范圍是18到20個核苷酸或者更長,這種特性是獨(dú)特的而且在某些分子生物學(xué)技術(shù)中是有用的。特別地,這些多肽含有在N6mA DNA甲基轉(zhuǎn)移酶中普遍的氨基酸基序,具有在限制性內(nèi)切酶中普遍的并且位于多肽氨基末端部分的基序,這個基序由氨基酸D/E(X8~X12)D/EXK組成,而且這些多肽在保守的甲基轉(zhuǎn)移酶基序之后還具有一個由數(shù)百個氨基酸組成的區(qū)域,它與MmeI的相應(yīng)區(qū)域具有顯著的相似性,這個區(qū)域被認(rèn)為在二聚體化中起作用,也有可能是一個DNA序列識別結(jié)構(gòu)域。這樣的多肽的一個例子就是CstMI。已經(jīng)表明CstMI識別6個堿基對的非對稱序列5’-AAGGAG-3’,剪切DNA的方式和MmeI一樣5’-AAGGAGN20/N18-3’。由這些DNA片段編碼的內(nèi)切酶可以通過如下所述的用于MmeI的方法來制備。
本發(fā)明進(jìn)一步涉及生產(chǎn)限制性內(nèi)切酶MmeI的方法。這個方法包括培養(yǎng)含有編碼MmeI限制性系統(tǒng)多肽的DNA片段的轉(zhuǎn)化宿主,比如大腸桿菌,收集培養(yǎng)的細(xì)胞,從中獲得無細(xì)胞抽提物(cell-free extract),并從所述無細(xì)胞抽提物中分離和收集限制性內(nèi)切酶MmeI。本發(fā)明進(jìn)一步涉及生產(chǎn)由被鑒定為與MmeI同源的DNA序列編碼的限制性內(nèi)切酶的方法。這個方法包括培養(yǎng)含有編碼這些限制性系統(tǒng)的基因的轉(zhuǎn)化宿主,比如大腸桿菌,收集培養(yǎng)的細(xì)胞,從中獲得無細(xì)胞抽提物,并從所述無細(xì)胞抽提物中分離和收集限制性內(nèi)切酶。
圖1-顯示了MmeI剪切Lamda、T7、phiX174、pBR322和pUC19 DNA的瓊脂糖凝膠。
圖2-MmeI基因座的DNA序列(SEQ ID NO1)。
圖3-MmeI基因座的氨基酸序列(SEQ ID NO2)。
圖4-顯示了MmeI剪切pTBMmeI.1 DNA和未修飾DNA底物的瓊脂糖凝膠。
圖5-顯示了MmeI剪切非甲基化、半甲基化和全甲基化的DNA底物的瓊脂糖凝膠。
圖6-將帶標(biāo)記的甲基整合到未甲基化、半甲基化和全甲基化的DNA底物中。
圖7-MmeI氨基酸序列(SEQ ID NO3到SEQ ID NO14)和來自于公共數(shù)據(jù)庫的同源多肽之間的多序列比對。
發(fā)明詳述本發(fā)明的內(nèi)切酶的識別序列和剪切位點(diǎn)在以前已有過描述(Boyd,Nucleic Acids Res.145255-5274(1986))。然而,MmeI酶被證明從天然宿主嗜甲醇營養(yǎng)菌中的生產(chǎn)是困難的,這是由于這種酶的低產(chǎn)率以及嗜甲醇營養(yǎng)菌宿主相對比較難以大量培養(yǎng)。為了克服生產(chǎn)MmeI的這些限制,本申請描述了編碼MmeI基因的DNA序列的鑒定,以及在合適的宿主——在本例中是大腸桿菌——中MmeI基因的表達(dá)。對編碼MmeI的DNA片段的這種操作導(dǎo)致每克細(xì)胞所生產(chǎn)的酶的量的顯著增加以及含有MmeI酶的大量細(xì)胞的生長的顯著增加。
被克隆技術(shù)領(lǐng)域的技術(shù)人員經(jīng)常采用的數(shù)種標(biāo)準(zhǔn)方法曾被應(yīng)用于克隆MmeI,結(jié)果都沒有獲得成功。特別地,甲基化酶選擇方法(Wilson等,美國專利號5,200,333)也沒有試驗(yàn)成功。嗜甲醇營養(yǎng)菌DNA的數(shù)個隨機(jī)文庫已在大腸桿菌中被建立起來,并且經(jīng)歷了MmeI消化的考驗(yàn),但是沒有獲得含有MmeI甲基化酶的克隆。
還嘗試了另一種方法,但仍然失敗了。在這種方法中,特異地針對N6mA的抗體被用于篩選在lamda噬菌體替換型載體中構(gòu)建的隨機(jī)克隆文庫。這種方法成功地獲得了甲基化酶的陽性克隆,但是所有的克隆經(jīng)過驗(yàn)證之后都發(fā)現(xiàn)是在嗜甲醇營養(yǎng)菌中表達(dá)另外一個限制性系統(tǒng)的甲基轉(zhuǎn)移酶,MmeII甲基化酶(識別序列為5’-GATC-3’),而不是所要的MmeI甲基化酶活性。
成功獲得所需要的編碼MmeI限制性系統(tǒng)的DNA片段的方法包括數(shù)個步驟。首先,一種新的純化程序被發(fā)展出來以從嗜甲醇營養(yǎng)菌中純化出同質(zhì)的內(nèi)切酶MmeI肽。一旦成功地獲得了顯著量的這種超純的內(nèi)切酶MmeI多肽,氨基端的氨基酸序列和內(nèi)部溴化氰降解肽的氨基酸序列就可以被確定。利用所獲得的氨基酸序列,互補(bǔ)于編碼該氨基酸序列的DNA的簡并DNA引物就可以被合成出來,并用于PCR擴(kuò)增MmeI基因的一部分。這部分MmeI基因的DNA序列被測定。然后整個MmeI內(nèi)切酶基因及其周圍DNA序列可以通過應(yīng)用反向PCR技術(shù)獲得。與獲得的DNA序列匹配的大量引物被設(shè)計、合成出來,并與大量不同的模板組合使用。反向PCR的模板是通過用各種限制性內(nèi)切酶消化嗜甲醇營養(yǎng)菌基因組DNA,然后再將這些切開的嗜甲醇營養(yǎng)菌DNA在低濃度下連接以獲得環(huán)狀的分子而獲得的。不同的引物嘗試與不同的模板組合,以便找到能夠產(chǎn)生特異性PCR擴(kuò)增產(chǎn)物的引物-模板組合。將這樣得到的產(chǎn)物進(jìn)行測序。一旦編碼整個內(nèi)切酶MmeI基因的DNA序列被獲得,就可以設(shè)計引物從嗜甲醇營養(yǎng)菌基因組DNA中特異性地擴(kuò)增該基因。擴(kuò)增后的基因被插入到一個表達(dá)載體中,再克隆到大腸桿菌宿主中。宿主經(jīng)測試發(fā)現(xiàn)表達(dá)內(nèi)切酶MmeI活性和在體內(nèi)條件下修飾重組表達(dá)載體使得載體在體外條件下不被內(nèi)切酶MmeI活性剪切。
編碼內(nèi)切酶MmeI的單個多肽也在體內(nèi)條件下提供抵抗MmeI的保護(hù)這個發(fā)現(xiàn)與以前發(fā)表的關(guān)于MmeI的信息(Tucholski,Gene223293-302(1998))形成對比。特別地,這篇文獻(xiàn)教導(dǎo)內(nèi)切酶MmeI多肽不提供抵抗內(nèi)切酶MmeI剪切的保護(hù)。這篇文獻(xiàn)報道為了修飾兩條鏈上的MmeI位點(diǎn)并由此阻止內(nèi)切酶MmeI的剪切需要一個獨(dú)立的48kD的甲基轉(zhuǎn)移酶。特別地,該文獻(xiàn)教導(dǎo)內(nèi)切酶MmeI多肽只修飾識別序列上鏈(top strand)5’-TCCRAC-3’中的腺嘌呤,而這種被修飾的DNA會被內(nèi)切酶MmeI剪切。本發(fā)明的DNA片段編碼內(nèi)切酶MmeI基因,當(dāng)它單獨(dú)在大腸桿菌宿主中生長的時候,可導(dǎo)致含有該內(nèi)切酶MmeI的載體產(chǎn)生對純化的內(nèi)切酶MmeI的抗性。進(jìn)一步,由這個片段產(chǎn)生的內(nèi)切酶MmeI不剪切在上鏈5’-TCCRAC-3’的腺嘌呤處有修飾而在反鏈或者下鏈(bottom strand)中都沒有修飾存在的DNA片段。這個結(jié)果與Tucholski的文獻(xiàn)中的教導(dǎo)相反。另外,本申請的內(nèi)切酶MmeI不剪切其下鏈5’-GTYGGA-3’中的腺嘌呤殘基被修飾的DNA片斷,這也與Tucholski的文獻(xiàn)中的教導(dǎo)相反。當(dāng)上鏈和下鏈中腺嘌呤殘基都被修飾時,內(nèi)切酶MmeI不剪切該DNA。在該內(nèi)切酶MmeI基因附近沒有發(fā)現(xiàn)如Tucholski的文獻(xiàn)中所報道的另一種甲基轉(zhuǎn)移酶基因。在緊接著該內(nèi)切酶MmeI基因的3’端的位置有一個開放閱讀框,它所編碼的蛋白的大小接近于所報道的第二甲基轉(zhuǎn)移酶活性蛋白(48kD)。然而,這條潛在的多肽不具有在甲基轉(zhuǎn)移酶中發(fā)現(xiàn)的氨基酸基序,而且在克隆進(jìn)大腸桿菌后也不會提供抵抗內(nèi)切酶MmeI的保護(hù)作用。雖然Tucholski的文獻(xiàn)教導(dǎo)第二甲基轉(zhuǎn)移酶多肽在保護(hù)宿主細(xì)胞免受內(nèi)切酶MmeI活性影響中的必要性,但本申請表明編碼內(nèi)切酶MmeI多肽的DNA片段足可以提供這種保護(hù)作用。另外,在此所述的編碼與MmeI相似的氨基酸序列的11個DNA片段兩側(cè)都沒有可識別到的DNA甲基轉(zhuǎn)移酶基因。這表明這些多肽本身也極有可能提供對宿主DNA的保護(hù)作用和對未修飾DNA底物的內(nèi)切酶活性,而不需要別的甲基轉(zhuǎn)移酶作為該限制性修飾系統(tǒng)的一部分。這與其它的II型限制性修飾系統(tǒng)形成對比。
同一研究組(Tucholski,Gene 223293-302(1998)和Anna Podhajska,私人交流)之前報道過單個內(nèi)部溴化氰消化片段的8個殘基的氨基酸序列(序列GRGRGVGV(SEQ ID NO_))?;谶@段序列的PCR被嘗試,然而失敗了。在根據(jù)本發(fā)明確定了真實(shí)的MmeI氨基酸序列之后,發(fā)現(xiàn)上述序列與MemI沒有關(guān)系。因此,使得MmeI基因得以克隆的內(nèi)部氨基酸序列的正確測定依賴于本申請中描述的新的純化方法,其中可以生產(chǎn)出足夠量的足夠純的MmeI以便確定溴化氰消化的內(nèi)部片段氨基酸序列,如在本申請中所實(shí)施的。
在實(shí)施例II中,我們通過培養(yǎng)帶有MmeI基因的轉(zhuǎn)化宿主,比如攜帶pTBMmeI.1的大腸桿菌ER2683,并從這些細(xì)胞中回收內(nèi)切酶來獲得MmeI。攜帶有pTBMmeI.1的大腸桿菌ER2683樣品(NEB#1457)已經(jīng)在布達(dá)佩斯條約的條款和條件下于2002年7月3日保藏于美國典型培養(yǎng)物保藏中心(ATCC),其相應(yīng)的專利注冊號(the Patent AccessionNo.)是PTA-4521。
為了回收本發(fā)明的酶,攜帶有pTBMmeI.1的大腸桿菌(NEB#1457)可以使用任何合適的技術(shù)來培養(yǎng)。比如,攜帶有pTBMmeI.1的大腸桿菌可以在含有100μg/ml氨芐青霉素的Luria broth培養(yǎng)基中,37℃通風(fēng)有氧培養(yǎng)。處于對數(shù)生長期晚期的細(xì)胞通過加入0.3mM的IPTG進(jìn)行誘導(dǎo),繼續(xù)生長4個小時,離心收集,然后立即破碎細(xì)胞或者于-70℃冷凍保存。
MmeI酶可以通過傳統(tǒng)的蛋白純化技術(shù)從攜帶有pTBMmeI.1的大腸桿菌中分離出來。比如,可以將細(xì)胞沉積物在緩沖液中重懸,然后再通過超聲、高壓分散或者酶消化來處理,使得內(nèi)切酶被提取到緩沖溶液中。完整的細(xì)胞和細(xì)胞碎片然后通過離心除去,得到含有MmeI的無細(xì)胞抽提物。然后,伴隨有其相應(yīng)的內(nèi)源性甲基化酶活性的內(nèi)切酶MmeI通過離子交換層析、親合層析、分子篩層析或者這些方法的組合從無細(xì)胞抽提物中純化出來以生產(chǎn)出本發(fā)明的內(nèi)切酶。
本發(fā)明還涉及鑒定其它的DNA片段的方法,其中每個片段都編碼具有與MmeI多肽顯著的氨基酸序列相似性的多肽。由這些DNA片段編碼的多肽被預(yù)測執(zhí)行與MmeI相似的功能。特別地,它們被預(yù)測具有雙重酶功能,既在距離特定識別序列相對遠(yuǎn)的位置處以特定的方式剪切DNA,又修飾它們的識別序列以保護(hù)宿主DNA免受它們的內(nèi)切酶活性的攻擊。一旦內(nèi)切酶MmeI的氨基酸序列根據(jù)本申請中描述的方法被確定出來,存儲在數(shù)據(jù)庫中的序列可以與該MmeI序列相比較,從而找出那些與MmeI極為顯著相似的序列。這種方法與美國專利6,383,770(Roberts等)中描述的方法有些類似,不同的是在這里我們是尋找與內(nèi)切酶MmeI序列的相似性,而不是尋找與甲基轉(zhuǎn)移酶或內(nèi)切酶蛋白數(shù)據(jù)庫匹配的序列,然后在潛在的甲基轉(zhuǎn)移酶開放閱讀框的附近檢查沒有被鑒定出的開放閱讀框。在鑒定出MmeI的氨基酸序列之前,編碼與MmeI相關(guān)的蛋白的DNA序列還沒有被包含在Roberts等如上所用的限制性和甲基轉(zhuǎn)移酶基因序列數(shù)據(jù)庫中,因?yàn)檫@些序列還沒有聯(lián)系到任何已知的內(nèi)切酶功能上。在此公開的鑒定潛在MmeI樣內(nèi)切酶的方法因此要比美國專利6,383,770(Roberts等)中的方法更加具有特異性。
在數(shù)據(jù)庫如GENBANK中對可獲得的序列進(jìn)行MmeI序列的相似性搜索是利用程序如BLAST(Altschul等.Nucleic Acids Res.253389-3402(1997))完成的。期望值(expectation value,E)分?jǐn)?shù)低于E=e-10的序列被認(rèn)為是潛在的內(nèi)切酶候選者。期望值低得更多,比如低于E=e-30的序列被認(rèn)為極有可能是類似于MmeI的內(nèi)切酶。這些候選MmeI樣肽被進(jìn)一步檢驗(yàn)以確認(rèn)它們是否符合MmeI所表現(xiàn)出來的結(jié)構(gòu)域組成。一個真正的候選者將會含有一個內(nèi)切酶折疊基序,常常是以(D/E)X8~X12(D/E)XK的形式出現(xiàn)在肽的氨基端部分(Aravind等,Nucleic Acids Res.283417-3432(2000))。一個真正的候選者將會在肽的中間部分含有與γ類N6甲基腺嘌呤甲基轉(zhuǎn)移酶類似的甲基轉(zhuǎn)移酶基序,而且在候選肽的羧基端部分含有與MmeI的羧基端部分相似的序列。這樣的BLAST搜索是在2003年6月12日進(jìn)行的,返回的如下序列與MmeI高度相似
記錄編號NEB-207-PCTGenbank注冊號 描述 分?jǐn)?shù) E值(Genbank accession ID) (Description)(Score)(E value)
這些蛋白中的大多數(shù)在它們的數(shù)據(jù)庫記錄中被標(biāo)記為假想(hypothetical)蛋白或者推定的(putative)蛋白。其中有許多似乎是全長的多肽,比如上面的序列#2GcrY。這些候選蛋白可以按照Roberts描述的方法來表達(dá)以鑒定期望的內(nèi)切酶活性。一些內(nèi)切酶基因在用于測序的特定菌株中可能是沒有活性的(Lin等,Proc.Natl.Acad.Sci.USA982740-2745(2001))。在這樣的情況下,通過修復(fù)導(dǎo)致這些基因失活的突變來表達(dá)功能性的內(nèi)切酶被證明是可能的。MmeI的數(shù)個同源物,比如#7(SEQ ID NO14)(耐放射異常球菌(Deinococcus radiodurans)DR2267)和#8(SEQ ID NO13)(耐放射異常球菌DR0119.1),在它們的開放閱讀框架中都有缺陷。DR2267在MmeI上由密碼子GAG編碼谷氨酸的位置處含有一個終止密碼子TAG,它可以過早地終止該開放閱讀框架。通過將這個TAG終止密碼子改變成GAG,則有可能會重新激活這個潛在的內(nèi)切酶基因。DR0119.1也是有缺陷的,因?yàn)樗霈F(xiàn)了框架漂移(frameshift),這使得開放閱讀框架被破壞。通過使DR0119.1序列和MmeI序列之間的相似性最大化,可以將MmeI序列用作指導(dǎo)修復(fù)這種框架漂移的指南。這樣可能會很好地恢復(fù)DR0119.1內(nèi)切酶的活性。
另外一種產(chǎn)生新的潛在內(nèi)切酶的方法是通過進(jìn)行結(jié)構(gòu)域交換(domain swapping)來利用它們之間相似的結(jié)構(gòu)域。可以將MmeI蛋白的氨基端結(jié)構(gòu)域與一種MmeI樣肽的氨基端結(jié)構(gòu)域交換,比如將新的潛在基因中直至第一個甲基轉(zhuǎn)移酶基序(基序X,“Gly Ala His TyrThr Ser”)的序列與MmeI中直至同一序列的這一部分交換。當(dāng)只能獲得部分的序列或者潛在基因已經(jīng)由于多個突變而喪失了功能時,這種方法非常有效。這種方法會產(chǎn)生一個嵌合蛋白,這個蛋白可能具有內(nèi)切酶活性并在距離識別序列一定距離的位置剪切DNA,就像MmeI一樣,但是它識別的序列是新的DNA序列。也可能在數(shù)據(jù)庫中發(fā)現(xiàn)有的序列雖然與MmeI相比具有高度的相似性,但卻是不完全的序列。比如,上述的序列#11(SEQ ID NO9)(熒光假單胞菌(Pseudomonasfluorescens))就是來自于數(shù)據(jù)庫中的DNA序列的一個小片段。為了由這個序列獲得像MmeI一樣有功能性的內(nèi)切酶,可以用反向PCR或者其他技術(shù)獲得與報道的片段相鄰的DNA序列,然后用該序列獲得完整的內(nèi)切酶基因。
一旦序列被鑒定出來,潛在的內(nèi)切酶就可以被表達(dá)并按照Roberts等如上描述的方法鑒定其特征。然而,在這里沒有另外獨(dú)立的甲基轉(zhuǎn)移酶基因與該內(nèi)切酶一起表達(dá)。一旦這樣一個潛在的內(nèi)切酶被克隆并在合適的宿主比如大腸桿菌中表達(dá),那么無細(xì)胞抽提物可以被制備出來并被分析以檢測任何內(nèi)切酶活性。這樣一個內(nèi)切酶分析必須包括這些內(nèi)切酶所需要的輔助因子SAM。一旦發(fā)現(xiàn)有特異性的DNA剪切活性,則識別序列和剪切位點(diǎn)就可以通過標(biāo)準(zhǔn)方法來確定(Schildkraut,(1984)在Genet.Eng.(NY)第6卷,(Setlow J.K.,Hollaender,A.Ed.).117-140頁,Plenum Press,New York.“Screening for and Characterizingrestriction endonuclease.”)。
這樣確定的酶可以通過傳統(tǒng)的蛋白純化技術(shù)從攜帶含有DNA片段的合適載體的大腸桿菌細(xì)胞中分離出來。例如,細(xì)胞沉積物可以在緩沖液中重懸,然后再通過超聲、高壓分散或者酶消化來處理,以使內(nèi)切酶被提取到緩沖溶液中。完整的細(xì)胞和細(xì)胞碎片然后通過離心除去,得到含有所述酶的無細(xì)胞抽提物。所述內(nèi)切酶,伴隨著它對應(yīng)的內(nèi)源性甲基化酶活性,然后通過離子交換層析、親合層析、分子篩層析或者這些方法的組合從無細(xì)胞抽提物中純化出來以生產(chǎn)出本發(fā)明中的內(nèi)切酶。
這些DNA片段以及其它的將會在以后提交到數(shù)據(jù)庫中的與MmeI具有這樣的相似性的片段,都被預(yù)測編碼與MmeI類似的多肽,因?yàn)檫@些被編碼的多肽同時作為限制性內(nèi)切酶和甲基轉(zhuǎn)移酶。類似于MmeI,這些多肽可以在距離識別序列類似遠(yuǎn)的位置處剪切DNA,范圍是大約18到20個核苷酸或者更長,這種特性是獨(dú)特的而且在某些分子生物學(xué)技術(shù)中是有用的。
根據(jù)這種方法鑒定出來的這樣的酶的一個實(shí)例是CstMI(參見序列號為____美國專利申請,與本申請同時提交)。因?yàn)榕cMmeI高度顯著的氨基酸序列相似性,CstMI被確定是一種潛在的內(nèi)切酶。CstMI由上述序列#2(SEQ ID NO8)編碼,這個序列在用BLAST與MmeI比對的時候給出了高度顯著的期望值e-171。CstMI識別6個堿基對的非對稱序列5’-AAGGAG-3’,而且剪切DNA的方式和MmeI一樣它剪切位于這個識別序列3’側(cè)第20和第21個殘基之間的磷酸二酯鍵,以及互補(bǔ)鏈上的識別序列5’-CTCCTT-3’的5’側(cè)第18和19個殘基之間的磷酸二酯鍵,由此產(chǎn)生一個有兩個堿基的3’粘末端。
本發(fā)明通過下面的實(shí)施例來進(jìn)一步說明。提供這些實(shí)施例是用來幫助理解本發(fā)明,而并不作為本發(fā)明的限制。
以上和以下引用的文獻(xiàn)都在此引入作為參考。
實(shí)施例1內(nèi)切酶MmeI的純化嗜甲醇營養(yǎng)菌(NEB#1190)的單個克隆在1升培養(yǎng)基M(0.08μMCuSO4、0.448μM MnSO4、0.348μM ZnSO4、6.0μM FeCl3、18μM CaCO3、1.6mM MgSO4、9.0mM NaH2PO4、10.9mM K2HPO4、13.6mM(NH4)2SO4)中生長24個小時。使用該培養(yǎng)物接種到100升的培養(yǎng)基M中。這些細(xì)胞在有氧條件下37℃過夜培養(yǎng)直至進(jìn)入穩(wěn)定期。用5份100升的發(fā)酵液收集到752克的濕細(xì)胞沉淀。
將750克嗜甲醇營養(yǎng)菌細(xì)胞沉淀懸浮在2.25升緩沖液A(20mMTris-HCl(pH 8.0)、50mM NaCl、1.0mM DTT、0.1mM EDTA、5%甘油)中,然后以大約12000psig通過Gaulin勻漿機(jī),裂解物于13000×G離心40分鐘后收集上清。
將上清溶液加到已經(jīng)用緩沖液A平衡的500ml Heparin Hyper-D柱(Biosepra SA)上。用1升緩沖液A清洗柱子,然后將2升的NaCl濃度梯度為0.05M到1M的緩沖液A加到柱子上并收集分離級分。對級分進(jìn)行MmeI內(nèi)切酶活性的分析在補(bǔ)充有32μM的S-腺苷-L-甲硫氨酸(SAM)的50μl NEBuffer1中與1μg的Lamda DNA(NEB)于37℃溫育15分鐘。MmeI活性是在0.3M到0.4M NaCl之間被洗脫下來。
含有MmeI活性的Heparin Hyper-D柱分離級分被匯集到一起,用(不含有NaCl的)緩沖液A稀釋到50mM NaCl濃度,然后上樣到105ml的已經(jīng)用緩沖液A平衡好的Source15 Q柱(Amersham Biotech)上。用210ml的緩沖液A清洗柱子,再用1升的NaCl濃度梯度為0.05M到0.7M的緩沖液A加到柱子上進(jìn)行洗脫。級分被收集,并分析MmeI的內(nèi)切酶活性。MmeI活性在未被結(jié)合的級分中被發(fā)現(xiàn)。
將Source15 Q的匯集物加載到22ml的已經(jīng)用緩沖液A平衡好的AF-Heparin-TSK柱(TosoHaas)上。用44ml的緩沖液A清洗柱子之后,接著用NaCl濃度梯度從0.05M到1M的緩沖液A線性洗脫。各級分被收集并分析內(nèi)切酶MmeI的活性。MmeI活性在NaCl濃度為0.26M到0.29M之間被洗脫下來。這些含有活性的級分被匯集到一起,然后用緩沖液B(20mM NaPO4(pH7.0)、50mM NaCl、1.0mM DTT、0.1mMEDTA、5%甘油)中透析。
經(jīng)過透析的AF-Heparin-TSK匯集物被加載到已經(jīng)用緩沖液B平衡好的6ml的Resource15 S柱(Amersham Biotech)上。用12ml緩沖液B清洗柱子之后,再用NaCl濃度梯度從0.05M到1M的緩沖液B線性洗脫。各級分被收集并分析內(nèi)切酶MmeI的活性。MmeI活性在NaCl濃度0.14M和0.17M之間被洗脫下來。
這樣洗脫下來的匯集級分被上樣到已經(jīng)用緩沖液C(20mMTris-HCl,pH8.0、500mM NaCl、1.0mM DTT、0.1mM EDTA、5%甘油)平衡好的2升的Superdex 75大小分離柱(Amersham Biotech)上。用緩沖液C洗脫出的500ml和1500ml之間的洗脫級分被收集起來,然后通過Mme內(nèi)切酶分析進(jìn)行分析,在4-20%梯度膠上進(jìn)行聚丙烯酰氨凝膠電泳,然后再用考馬斯亮蘭對蛋白質(zhì)染色。在775ml到825ml之間洗脫出的級分對應(yīng)于MmeI活性,對應(yīng)的蛋白條帶是105kDa。這些級分被匯集在一起,然后用緩沖液D(20mM NaPO4(pH7.0)、50mM NaCl、1mM DTT、5%甘油)進(jìn)行透析。
透析之后的分離級分被上樣到已經(jīng)用緩沖液D平衡好的CeramicHTP柱(BioRad)上。用32ml緩沖液D清洗之后,再用NaPO4濃度梯度從0.02M到1M的緩沖液D線性洗脫。收集各級分并分析Mme內(nèi)切酶活性,在4-20%的梯度膠上進(jìn)行聚丙烯酰氨凝膠電泳,然后再用考馬斯亮蘭對蛋白質(zhì)染色。MmeI在NaPO4濃度為0.26M和0.3M之間被洗脫下來。含有105kDa的單個同質(zhì)的蛋白條帶的數(shù)個級分中的一部分被用于蛋白質(zhì)測序。剩下的純化的MmeI級分被匯集到一起(6ml,濃度為0.36mg/ml),然后用保存緩沖液(10mM Tris(pH7.9)、50mMKCl、1mM DTT、0.1mM EDTA、50%甘油)透析。純化后的MmeI酶在-20℃保存。
活性測定將1-4μl的樣品加到50μl由1×NEBuffer 1、32μM的S-腺苷-L-甲硫氨酸和1μg的DNA(Lamda、PhiX174或者pUC19 DNA)組成的底物溶液中。反應(yīng)在37℃進(jìn)行15分鐘,然后加入20μl終止溶液,用1%瓊脂糖凝膠電泳分析結(jié)果。
優(yōu)化內(nèi)切酶活性從嗜甲醇營養(yǎng)菌中純化出MmeI之后,進(jìn)行實(shí)驗(yàn)以確定DNA剪切的最優(yōu)反應(yīng)條件。發(fā)現(xiàn)內(nèi)切酶活性會由于反應(yīng)緩沖液中鉀離子的存在而大大增強(qiáng)。反應(yīng)條件從4℃變化到37℃和從5分鐘變化到60分鐘都沒有明顯地改變剪切DNA的量。為了達(dá)到最大程度的剪切,要求酶濃度與DNA位點(diǎn)在化學(xué)計量上相等或接近。大大過量的酶會阻斷剪切的發(fā)生。這些發(fā)現(xiàn)被用于重新評估MmeI的活性和定義可行的內(nèi)切酶單位。
單位定義一個單位(one unit)的MmeI被定義為在15分鐘內(nèi)在補(bǔ)充有80μM的S-腺苷-L-甲硫氨酸(SAM)的NEBuffer 4(20mM Tris-乙酸鹽、10mM乙酸鎂、50mM乙酸鉀、1mM二硫蘇糖醇(在25℃時pH7.9))中于37℃完全剪切1μg的PhiX174 DNA所需要的用量。
實(shí)施例IIMmeI內(nèi)切酶的克隆1.DNA純化制備嗜甲醇營養(yǎng)菌的總基因組DNA。5克的沉積細(xì)胞懸浮在20ml的25%蔗糖、0.05M Tris-HCl pH8.0中,其中還加入10ml的0.25M的EDTA,pH8.0。然后加入6ml的溶菌酶溶液(10mg/ml溶菌酶在0.25M的Tris-HCl中,pH8.0),之后細(xì)胞懸浮液在4℃放置16個小時。接著25ml的裂解混合物(1%Triton-X100、0.05M Tris、62mMEDTA,pH8.0)和5ml的10%SDS被加入,然后在37℃放置5分鐘。接著用一倍體積的平衡酚∶氯仿∶異戊醇(50∶48∶2,v/v/v)提取該溶液,回收水相,再用一倍體積的氯仿∶異戊醇(24∶1,v/v)提取兩次。將得到的水溶液用2升的10mM Tris、1mM EDTA,pH8.0的溶液透析四次。透析過的DNA溶液用RNase(100μg/ml)在37℃消化1小時。加入1/10體積的5M NaCl和0.55個體積的2-丙醇讓DNA沉淀,并纏繞在玻璃棒上。用70%乙醇簡單潤洗DNA之后,簡單地進(jìn)行空氣干燥,然后溶解在20ml的TE緩沖液(10mM Tris、1mM EDTA,pH8.0),濃度至大約500μg/ml,4℃保存。
2.MmeI內(nèi)切酶按照上述實(shí)施例1中描述的方法純化到同質(zhì)。
3.MmeI內(nèi)切酶的氨基酸序列是針對MmeI多肽的氨基端和數(shù)段內(nèi)部溴化氰消化產(chǎn)物獲得的。對按照上述實(shí)施例1中描述的方法制備的MmeI限制性內(nèi)切酶進(jìn)行電泳分析,然后根據(jù)Matsudaira(Matsudaira.J.Biol.Chem.26210035-10038,1987)的程序進(jìn)行電印跡,其中按照已有的描述做了一定的修改(Looney等,Gene 80193-208(1989))。然后用考馬斯亮蘭R-250染膜,將大約105kD的蛋白條帶切下來,然后在一臺帶有氣相傳遞的ABI Procise 494 Protein/Peptide Sequencer上進(jìn)行有序的降解(Waite-Rees等,J.Bacteriol.1735207-5219(1991))。頭14個氨基端殘基的氨基酸序列被獲得,如下ALSWNEIRRKAIEF(SEQID NO15)。
MmeI內(nèi)切酶的另外一個樣品——20μl中有20μg——用溶解在200μl88%蒸餾甲酸中的2μg溴化氰(Sigma)在室溫于黑暗處處理24個小時。這個反應(yīng)混合物被蒸發(fā)至干,然后重新懸浮在20μl的上樣緩沖液(1.5M Tris-HCl,pH8.5、12%甘油、4%SDS、0.05%Serva Blue G、0.05%酚紅)中,100℃保持5分鐘。這個樣品在Tris-Tricine系統(tǒng)中的10到20%聚丙烯酰氨梯度凝膠(Invitrogen)上進(jìn)行3個小時的電泳,然后再用10mM CAPS緩沖液(10mM 3-[環(huán)己胺基]-1-丙磺酸、10%甲醇、0.05%SDS、0.005%二硫蘇糖醇,用NaOH調(diào)節(jié)pH至11.0)將蛋白轉(zhuǎn)移到聚偏二氟乙烯(PVDF)膜(Problott,Applied Biosystems Inc.),轉(zhuǎn)移是在用槽式電轉(zhuǎn)儀(TE52,Hoeffer)在200伏特轉(zhuǎn)移18小時完成的。用考馬斯亮蘭R-250染膜,觀察到的主要條帶是25kD、14kD、7.5kD和6kD,以及一些更小的條帶。這些被染上的蛋白條帶從膜上被切下來,然后進(jìn)行漸次降解。這些不是氨基端片斷的片斷是來自于溴化氰在蛋白內(nèi)甲硫氨酸殘基位置處的剪切,因此其前面應(yīng)該有甲硫氨酸。25kD的肽的前29個殘基序列為(M)KISDEFGNYFARIPLKSTXXIXEXNALQ(SEQ ID NO16)。標(biāo)記成X的殘基20、21、23和25是沒有被鑒定出的殘基。14kD片段的前40個氨基酸殘基序列為(M)DAKKRRNLGAHYTSEANILKLIKPLLLDELWVVFXKVKN(SEQID NO17)。第36號殘基沒有鑒定出來。7.5kD肽的前25個殘基的序列對應(yīng)為(M)KSRGKDLDKAYDQALDYFSGIAER(SEQ ID NO18)。
6kD片段被發(fā)現(xiàn)含有三個序列的混合物。
4.擴(kuò)增MmeI內(nèi)切酶的一部分從氨基端肽、25kD、14kD和7.5kD肽獲得的肽段序列信息被用于構(gòu)建一系列對應(yīng)于氨基酸殘基密碼子的簡并PCR引物。這些內(nèi)部肽片斷的順序是未知的,因此針對這些片段都制備了正向(正義鏈)和反向(反義鏈)引物,這些引物是25kD片段殘基DEFGNYFA(SEQ ID NO19)正向1)5’-GARTTYGGNAAYTAYTTYGC-3’(SEQ ID NO20)反向2)5’-AARTARTTNCCRAAYTCRTC-3’(SEQ ID NO21)14kD片段殘基MDAKKR(SEQ ID NO22)正向A3)5’-ATGGAYGCNAARAARCG-3’(SEQ ID NO23)正向B4)5’-ATGGAYGCNAARAARAG-3’(SEQ ID NO24)反向5)5’-CGNCGYTTYTTNGCRTCCAT-3’(SEQ ID NO25)7.5kD片段殘基DKAYDQA(SEQ ID NO26)
正向6)5’-GAYAARGCNTAYGAYCARGC-3’(SEQ ID NO27)反向7)5’-GCYTGRTCRTANGCYTTRTC-3’(SEQ ID NO28)其中Y=T、CR=A、GH=A、T、CS=G、CN=A、C、G、T引物1和2源自MmeI的25kD的CNBr肽段,準(zhǔn)備導(dǎo)引基因的正義鏈(1)或者反義鏈(2)。引物3到5源自MmeI的14kD的CNBr肽段,準(zhǔn)備導(dǎo)引基因的正義鏈(3和4)或者反義鏈(5),其中引物3和4在精氨酸殘基的密碼子使用上有所不同。引物6和7源自MmeI的7.5kD的CNBr肽段,準(zhǔn)備導(dǎo)引基因的正義鏈(6)或者反義鏈(7)。
PCR擴(kuò)增反應(yīng)采用引物組合1和5、1和7、3和2、3和7、4和2、4和7、6和2、以及6和7來進(jìn)行。MmeI基因的一部分可以在PCR反應(yīng)中被擴(kuò)增出來,反應(yīng)溶液包括80μl 10×Thermopol緩沖液(NEB)50μl 4mM dNTP溶液(NEB)4μl MmeI基因組DNA(500μg/ml儲液)16μl 100mM MgSO4586μl dH2O16μl(32個單位)Ventexo-DNA聚合酶(NEB)上述混合溶液被分成每份90μl的8個等份,然后往每個等份中加入5μl的正向引物(10μM儲液)和5μl的反向引物(10μM儲液)。反應(yīng)循環(huán)參數(shù)為95℃3分鐘,一個循環(huán);然后95℃30秒,46℃30秒,72℃2分鐘,25個循環(huán)。
擴(kuò)增反應(yīng)的產(chǎn)物在1%的瓊脂糖凝膠上電泳分離并分析。獲得的主要的DNA擴(kuò)增產(chǎn)物是450個堿基對(bp)(引物2和4)、650bp(引物5和6)和1100bp(引物2和6)的片段。這些片段的大小與7.5kD的CnBr降解片段位于最靠近蛋白氨基端的位置并距離14kD的CnBr片段大約650bp,14kD片段位于7.5kD片段和25kD片段中間而且鄰近25kD片段相一致。這些擴(kuò)增出來的DNA片段經(jīng)過膠純化,并利用用于擴(kuò)增的引物進(jìn)行測序。獲得的DNA序列的翻譯與來自于純化的MmeI內(nèi)切酶的氨基酸序列匹配,這表明MmeI內(nèi)切酶基因DNA序列的一部分已經(jīng)被成功獲得了。
5.測定整個MmeI基因和鄰近DNA的DNA序列利用反向PCR技術(shù)從上面得到的1060bp的MmeI基因片段的兩端出發(fā)延伸DNA序列。為了達(dá)到這個目的,一系列與MmeI基因DNA序列匹配并用于反向PCR的引物被設(shè)計和合成出來。MmeI基因組DNA用一系列限制性內(nèi)切酶剪切之后,在低濃度條件下連接形成環(huán)狀的DNA模板。
A.MmeI基因組DNA用10種不同的限制性內(nèi)切酶消化,然后環(huán)狀連接以獲得可以利用反向PCR技術(shù)來擴(kuò)增的DNA模板。使用的限制性酶是BspHI(T/CATGA)EcoRI(G/AATTC)HindIII(A/AGCTT)HinPlI(G/CGC)MspI(C/CGG)NlaIII(CATG/)PstI(CTGCA/G)SacI(GAGCT/C)SphI(GCATG/C)XbaI(T/CTAGA)為了進(jìn)行限制性內(nèi)切酶消化,將下列試劑組合5μl 10×為不同酶所推薦的NEBuffer(隨著酶改變)2μl嗜甲醇營養(yǎng)菌基因組DNA(1μg)43μl dH2O1μl(10~20單位)限制性酶。
反應(yīng)在37℃溫浴1個小時。將反應(yīng)加熱到65℃(對于PstI是80℃)持續(xù)20分鐘使限制性內(nèi)切酶失活。被消化的DNA通過加入50μl的10×T4 DNA連接酶緩沖液、400μl dH2O和3μl濃的T4 DNA連接酶(6000單位,新英格蘭生物實(shí)驗(yàn)室公司)并在16℃溫浴16小時而被連接成環(huán)狀的片段。連接后的DNA用酚和氯仿提取,再用2-丙醇沉淀,之后重懸在100μl TE緩沖液中。
B.擴(kuò)增與MmeI內(nèi)切酶基因的1060bp片段鄰近的DNA兩對PCR引物被設(shè)計出來,一對分別靠近用簡并引物直接PCR出來的1060bp序列的兩端。這些引物序列是引物IP15’-GTTGGATCCCGCACAGATTGCTCAGG-3’(SEQ ID NO29)引物IP25’-GTTGGATCCTACGTTAATCTGAATAAGATG-3’(SEQ IDNO30)引物IP35’-GTTGGATCCTGTTAATCTGAAACGCTGG-3’(SEQ IDNO31)引物IP45’-GTTGGATCCTTATACCAAAATGTGAGGTC-3’(SEQ IDNO32)。
反向PCR反應(yīng)是利用引物對IP1和IP2、IP3和IP4、以及IP1和IP3,以上述10種環(huán)狀模板為模板進(jìn)行的。為了進(jìn)行擴(kuò)增反應(yīng),將下列試劑組合80μl 10×Thermopol緩沖液(NEB)50μl 4mM dNTP溶液(NEB)40μl IP引物(正向)40μl IP引物(反向)16μl 100mM MgSO4534μl dH2O16μl(32個單位)Ventexo-DNA聚合酶(NEB)上述混合液被分裝成10管,每管76μl,然后再往每管中加入4μl經(jīng)過適當(dāng)消化并環(huán)狀連接的模板。反應(yīng)循環(huán)參數(shù)為95℃3分鐘,一個循環(huán),然后95℃30秒,56℃30秒,72℃3分鐘,25個循環(huán)。擴(kuò)增產(chǎn)物用瓊脂糖凝膠電泳分析。
對于引物IP1和IP2與SphI模板和NlaIII模板,得到的擴(kuò)增產(chǎn)物大約是825bp。對于引物IP3和IP4與BspHI模板,得到的產(chǎn)物大約是800bp。對于引物IP1和IP3與EcoRI模板,得到的產(chǎn)物大約是1500bp。這些擴(kuò)增得到的DNA片段經(jīng)過膠純化,測序,并與前面得到的序列組裝。組裝后的序列并不含有完整的MmeI內(nèi)切酶開放閱讀框。這個組裝后的序列被用于指導(dǎo)第二輪反向PCR引物對的合成。這些引物的序列是引物IP55’-TTCAGAAATACGAGCGATGC-3’(SEQ ID NO33)引物IP65’-GTCAAGCCATAAACACCATC-3’(SEQ ID NO34)引物IP75’-GAGGGTCAGAAAGGAAGCTG-3’(SEQ ID NO35)引物IP85’-GTCCAACTAACCCTTTATGG-3’(SEQ ID NO36)。
反向PCR擴(kuò)增反應(yīng)按照上述條件進(jìn)行。采用引物IP5和IP6,可以從NlaIII模板(大約450bp)和MspI模板(大約725bp)得到產(chǎn)物,但不能從其它環(huán)狀連接模板得到產(chǎn)物。采用引物IP7和IP8,可以從EcoRI模板(大約500bp)、SphI模板(大約825bp)和BspHI模板(大約750bp)得到產(chǎn)物。這些DNA片段被測序,然后再與前面得到的序列組裝。組裝后的序列依然不含有完整的MmeI內(nèi)切酶開放閱讀框,因此要進(jìn)行又一輪引物合成和反向PCR。額外的DNA模板按照上述方法獲得,但是是用限制性酶ApoI(R/AATTY)、AseI(AT/TAAT)、BsaHI(GR/CGYC)、MfeI(C/AATTG)、SspI(AAT/ATT)和EcoRV(GAT/ATC)來消化嗜甲醇營養(yǎng)菌基因組DNA。第三輪中的引物的序列是引物IP95’-TTCCTAGTGCTGAACCTTTG-3’(SEQ ID NO37)引物IP105’-GTTGCGTTACTTGAAATGAC-3’(SEQ ID NO38)引物IP115’-CCAAAATGGAACTTGTTTCG-3’(SEQ ID NO39)
引物IP125’-GTGAGTGCGCCCTGAATTAG-3’(SEQ ID NO40)。
反向PCR擴(kuò)增反應(yīng)如上所述地進(jìn)行。采用引物IP9和IP10,可以從NlaIII模板(大約425bp)、MfeI模板(大約750bp)、ApoI模板(大約800bp)和MspI模板(大約2100bp)得到產(chǎn)物。采用引物IP11和IP12,可以從SphI模板(大約875bp)、BspHI模板(大約925bp)和EcoRI模板(大約950bp)得到產(chǎn)物。這些DNA片段被測序,然后再與前面獲得的序列組裝。利用如下三個額外的引物,進(jìn)一步對IP9、IP10的MspI 2100bp產(chǎn)物進(jìn)行測序引物S15’-GCTTCATTTCATCCTCTGTGC-3’(SEQ ID NO41)引物S25’-TAACCGCCAAAATTAATCGTG-3’(SEQ ID NO42)引物S35’-CCACTATTCATTACAACACC-3’(SEQ ID NO43)。
最終組裝成的序列(圖2)含有完整的MmeI限制性內(nèi)切酶基因,還包括基因上游1640bp的序列以及基因下游1610bp的序列。
6.在大腸桿菌中克隆MmeI內(nèi)切酶基因推定的MmeI內(nèi)切酶開放閱讀框從由各反向PCR擴(kuò)增出的DNA片段序列組裝而獲得的DNA序列中鑒定出來。開放閱讀框的起始位點(diǎn)是基于預(yù)測的開放閱讀框氨基端氨基酸序列與由MmeI內(nèi)切酶蛋白確定的序列的匹配而鑒定出來的。預(yù)測的開放閱讀框末端能夠保證編碼大約105kD的多肽,這與觀察到的天然MmeI內(nèi)切酶大小一致。從這個開放閱讀框翻譯得到的氨基酸序列含有N6mA DNA甲基轉(zhuǎn)移酶的保守序列基序。然而,在鄰近MmeI內(nèi)切酶基因的區(qū)域沒有發(fā)現(xiàn)含有在DNA甲基轉(zhuǎn)移酶中保守的序列基序的開放閱讀框,這與預(yù)測的結(jié)果是一致的。因此決定在沒有另一個甲基轉(zhuǎn)移酶存在以保護(hù)大腸桿菌宿主DNA免受剪切的情況下,在大腸桿菌中嘗試表達(dá)MmeI內(nèi)切酶。寡聚核苷酸引物被合成出來以特異性地從嗜甲醇營養(yǎng)菌基因組DNA中擴(kuò)增出MmeI基因,使得它可以用克隆載體pRRS(Skoglund,Gene 881-5(1990))表達(dá)。正向引物含有方便克隆的PstI位點(diǎn)、與載體的lacZ基因處于同一閱讀框的終止密碼子、保守的大腸桿菌核糖體結(jié)合位點(diǎn)、ATG翻譯起始位點(diǎn)(修改了嗜甲醇營養(yǎng)菌使用的GTG,這是為了在大腸桿菌中更好地表達(dá)),以及與嗜甲醇營養(yǎng)菌DNA序列匹配的20個核苷酸5’-GTTCTGCAGTTAAGGATAACATATGGCTTTAAGCTGGAACGAG-3’(SEQ ID NO44)。
反向引物含有方便克隆的BamHI位點(diǎn),以及與MmeI開放閱讀框末端3’側(cè)的嗜甲醇營養(yǎng)菌DNA序列匹配的22個核苷酸5’-GTTGGATCCGTCGACATTAATTAATTTTTGCCCTTAG-3’(SEQ IDNO45)。
為了在PCR反應(yīng)中擴(kuò)增MmeI基因,將下列試劑組合50μl 10×Thermopol緩沖液(NEB)30μl 4mM dNTP溶液(NEB)12.5μl正向引物(10μM儲液)12.5μl反向引物(10μM儲液)5μl MmeI基因組DNA(500μg/ml儲液)387μl dH2O3μl(6個單位)VentDNA聚合酶反應(yīng)溶液混合后分裝到5個管中,每管80μl。將MgSO4(100mM儲液)分別加入到各管使得終濃度分別為2mM、3mM、4mM、5mM和6mM。反應(yīng)循環(huán)參數(shù)為95℃30秒,60℃30秒,72℃3分鐘,24個循環(huán)。反應(yīng)產(chǎn)物用凝膠電泳分析,結(jié)果發(fā)現(xiàn)Mg++濃度為3mM到6mM時的反應(yīng)得到了所要的2.8kb的DNA條帶。這些反應(yīng)產(chǎn)物被匯集到一起,2.8kb的條帶被膠純化。2.8kb的MmeI基因擴(kuò)增片段用BamHI和PstI內(nèi)切酶(NEB)降解,條件如下15μl 10×BamHI反應(yīng)緩沖液(NEB)1.5μl BSA(NEB)50μl MmeI基因的2.8kb擴(kuò)增DNA片段80μl dH2O5μl BamHI內(nèi)切酶(100單位)5μl PstI內(nèi)切酶(100單位)
反應(yīng)液混合之后在37℃溫浴1小時。按照制造商提供的說明通過Qiagen的QiaPrep spin column進(jìn)行純化,將從2.8kb的DNA片段末端剪切下來的小片段和內(nèi)切酶去除。
剪切后的MmeI基因DNA片段按照如下的程序被連接到pRRS載體中10μl經(jīng)過消化、純化的2.8kb MmeI片段與5μl事先用BamHI和PstI剪切并純化過的pRRS載體混合,加入5μl的dH2O、20μl的2×QuickLigase緩沖液(NEB),混合,再加入2μl的QuickLigase。反應(yīng)在室溫溫育5分鐘。將5μl的連接反應(yīng)產(chǎn)物轉(zhuǎn)化到50μl的大腸桿菌ER2683化學(xué)感受態(tài)細(xì)胞中,將這些細(xì)胞涂在含有100μg/ml氨芐青霉素的L-broth平板上,37℃溫育過夜。結(jié)果得到大約200個轉(zhuǎn)化子,挑出18個代表性轉(zhuǎn)化子進(jìn)行如下分析來自每個克隆的質(zhì)粒通過小量制備程序被分離出來,接著用AlwNI和NdeI內(nèi)切酶消化以確定它們是否含有正確大小的插入片段。18個轉(zhuǎn)化子中有2個具有正確大小的插入片段,大約是2800bp。兩個克隆都被測試是否產(chǎn)生MmeI內(nèi)切酶活性。這些克隆在500ml含有100μg/ml氨芐青霉素的L-broth培養(yǎng)基中37℃過夜培養(yǎng)。細(xì)胞通過離心收集,懸浮在10mL超聲緩沖液(20mMTris-HCl、1mM DTT、0.1mM EDTA,pH7.5)中用超聲破碎細(xì)胞。粗裂解物通過離心使之澄清,回收上清。裂解液被用來檢測內(nèi)切酶活性,將裂解液用含有20μg/ml Lamda DNA底物并補(bǔ)充有終濃度為100μM的SAM的1×反應(yīng)緩沖液NEBuffer1(新英格蘭生物實(shí)驗(yàn)室)進(jìn)行一系列稀釋。反應(yīng)在37℃溫浴1小時。反應(yīng)產(chǎn)物用1%的瓊脂糖凝膠和1×TBE緩沖液通過瓊脂糖凝膠電泳分析。兩個克隆中有1個具有MmeI內(nèi)切酶活性。這個有活性的克隆被標(biāo)記為菌株NEB1457,可用于后續(xù)的MmeI生產(chǎn)。該克隆中表達(dá)MmeI活性的質(zhì)粒構(gòu)建物被標(biāo)記為pTBMmeI.1。
實(shí)施例IIIMmeI內(nèi)切酶在體內(nèi)條件下提供抗MmeI剪切的保護(hù)作用質(zhì)粒pTBMmeI.1通過Qiagen的小量制備(miniprep)程序從NEB1457中純化出來。這個質(zhì)粒在載體骨架中具有兩個MmeI位點(diǎn),在MmeI基因中也有一個MmeI位點(diǎn)。質(zhì)粒用MmeI消化以檢測這段DNA是否對MmeI內(nèi)切酶活性具有抗性,這種抗性意味著單個MmeI基因可以在體內(nèi)條件下甲基化DNA以保護(hù)宿主DNA免受內(nèi)切酶活性的影響。為了檢測將下列試劑混合10μl pTBMmeI.1 miniprep DNA15μl 10×NEBuffer415μl SAM(1mM儲液)110μl dH2O1μl MmeI內(nèi)切酶(15單位)。
反應(yīng)液混合之后分成三份。往第一個三分之一反應(yīng)液中加入0.5μl水,往第二個三分之一反應(yīng)液中加入0.5μl pRRS載體,往第三個三分之一反應(yīng)液中加入0.5μl PhiX174 DNA作為陽性對照。pTBMmeI.1不被MmeI內(nèi)切酶活性剪切,而同在一個反應(yīng)體系中的PhiX174和pRRSDNA都被剪切,這表明pTBMmeI.1 DNA中的三個MmeI位點(diǎn)對MmeI內(nèi)切酶活性都具有抗性。
實(shí)施例IVMmeI內(nèi)切酶對甲基化的靈敏性現(xiàn)有技術(shù)的文獻(xiàn)報道MmeI內(nèi)切酶只甲基化其識別序列中的一條鏈,并且認(rèn)為這種半甲基化并不能阻止該內(nèi)切酶繼而對該DNA的剪切(Tucholski,Gene 223(1998)293-302)。為了測試這一點(diǎn),四種寡聚核苷酸被合成出來,從而得到兩條鏈都沒有甲基化(寡聚物1+寡聚物2)、只有上鏈被甲基化(寡聚物3+寡聚物2)、只有下鏈被甲基化(寡聚物1+寡聚物4),或者兩條鏈都被甲基化(寡聚物3+寡聚物4)的DNA底物。這些合成的寡聚核苷酸如下寡聚物15’-FAM-GTTTGAAGACTCCGACGCGATGGCCAGCGATCGGCGCCTCAGCTTTTG-3’(SEQ ID NO46)寡聚物25’-FAM-CAAAAGCTGAGGCGCCGATCGCTGGCCATCGCGTCGGAGTCTTCAAAC-3’(SEQ ID NO47)
寡聚物35’-FAM-GTTTGAAGACTCCG(6mA)CGCGATGGCCAGCGATCGGCGCCTCAGCTTTTG-3’(SEQ IDNO48)寡聚物45’-FAM-CAAAAGCTGAGGCGCCGATCGCTGGCCATCGCGTCGG(6mA)GTCTTCAAAC-3’(SEQ ID NO49)。
(MmeI識別序列以外的其它核苷酸也在其它研究中被甲基化,但由于MmeI對于這些核苷酸沒有任何序列特異性,因此確實(shí)可能影響MmeI活性的才表示出來,而其它甲基化為了簡明起見而在這里略去)。雙鏈DNA是通過將100μl上鏈寡聚核苷酸(14μm儲液)和100μl下鏈寡聚核苷酸(14μm儲液)混合,加熱到85℃然后經(jīng)20分鐘緩慢冷卻到30℃而形成的。然后使用MmeI在30μl的反應(yīng)中剪切寡聚核苷酸對,反應(yīng)體積中包括1×NEBuffer4、2.5μM寡聚核苷酸、100μM的SAM和2.5單位的MmeI。作為對照,限制性內(nèi)切酶Hpy188I也被用于剪切所述寡聚DNA。Hpy188I的識別序列覆蓋了這段DNA中MmeI識別序列的前5個核苷酸,5’-TCNGA-3’,而且Hpy188I的活性會被這段DNA中任一條鏈上的腺嘌呤甲基化所阻斷。結(jié)果發(fā)現(xiàn)MmeI按照預(yù)想的一樣剪切沒有甲基化的DNA。與以前的教導(dǎo)(Tucholski,Gene 223293-302(1998))相反,MmeI并不剪切只有上鏈被甲基化的半甲基化DNA5’-TCCG(N6Ma)C-3’。當(dāng)只有下鏈被甲基化的時候,MmeI確實(shí)會剪切該DNA。當(dāng)兩條鏈都被甲基化的時候,MmeI不剪切DNA。(圖5)這個發(fā)現(xiàn)與觀察到的單個MmeI酶在體內(nèi)條件下保護(hù)宿主DNA免受剪切的能力以及MmeI只甲基化其識別序列上鏈的觀察一致。我們通過用帶有氚標(biāo)記的H3-SAM甲基化上述寡聚核苷酸對,再洗去沒有整合的SAM并對DNA進(jìn)行放射性活性計數(shù),從而確認(rèn)MmeI酶只甲基化其識別序列的上鏈。未甲基化的寡聚DNA和上鏈沒有甲基化、下鏈甲基化的DNA都具有比背景高10倍以上的計數(shù)量,而下鏈沒有甲基化、上鏈甲基化的DNA和兩條鏈都甲基化的DNA具有接近背景的計數(shù)量(圖6)。這些發(fā)現(xiàn)表明MmeI是一種新型的不需要另外單獨(dú)的甲基轉(zhuǎn)移酶來修飾宿主DNA以提供抗該內(nèi)切酶活性的保護(hù)作用的限制性修飾系統(tǒng),就像IIG型(也稱為IV型)的酶如Eco57I一樣。
實(shí)施例VDNA測序和分析DNA測序DNA測序是在ABI373或ABI377自動測序儀上用雙鏈模板進(jìn)行的。擴(kuò)增的DNA片段和各個克隆用上述合成的引物或者載體上的通用引物進(jìn)行測序。
計算機(jī)分析獲得的DNA序列的計算機(jī)分析是用GeneticsComputer Group程序(Deverenx等,Nucleic Acids Res.12387-395(1984))進(jìn)行的,而數(shù)據(jù)庫相似性搜索是通過因特網(wǎng)在美國國立生物信息中心的網(wǎng)站(http//www.ncbi.nlm.nih.gov/BLAST/)上用BLASTX和BLASTP算法(Altschul等,J.Mol.Biol 215403-410(1990)和Gish等,Nature Genet.3266-722(1993))實(shí)施的。
權(quán)利要求
1.編碼MmeI限制性酶的分離出的DNA,其中所述分離出的DNA可從嗜甲醇營養(yǎng)菌中獲得。
2.重組DNA載體,包括已經(jīng)插入了編碼MmeI的DNA片段的載體。
3.編碼MmeI內(nèi)切核酸酶和MmeI/甲基轉(zhuǎn)移酶的分離出的DNA,其中所述分離出的DNA可從ATCC注冊號PTA-4521獲得。
4.載體,其包含權(quán)利要求3中的分離出的DNA。
5.用權(quán)利要求2或4中的載體轉(zhuǎn)化的宿主細(xì)胞。
6.生產(chǎn)重組MmeI限制性內(nèi)切酶和MmeI甲基化酶的方法,包括在適合表達(dá)所述的內(nèi)切酶和甲基化酶的條件下培養(yǎng)用權(quán)利要求2或者4中的載體轉(zhuǎn)化了的宿主細(xì)胞。
7.編碼類似于MmeI限制性酶的分離出的DNA,其中所述分離出的DNA在預(yù)先給定的條件下與編碼MmeI限制性酶的核苷酸序列的至少一個保守基序雜交。
全文摘要
根據(jù)本發(fā)明,提供一種編碼重組II型限制性內(nèi)切酶MmeI的DNA(脫氧核糖核酸)片段。這種酶具備兩種相關(guān)的酶學(xué)功能;一個是識別DNA序列5’-TCC(Pu)AC-3’的內(nèi)切酶活性,并在如箭頭標(biāo)記的地方剪切DNA5’-TCCRAC(N20)↓-3’和3’-AGGYTG(N18)↑-5’,另一個酶活性是識別同樣的DNA序列5’-TCC(Pu)AC-3’,但是通過增加甲基的方式來修飾該序列以防止MmeI內(nèi)切酶活性的剪切。
文檔編號C12N1/21GK1668740SQ03816564
公開日2005年9月14日 申請日期2003年7月10日 優(yōu)先權(quán)日2002年7月12日
發(fā)明者R·D·摩根, T·巴蒂亞, T·戴維斯, L·洛沃什科 申請人:新英格蘭生物實(shí)驗(yàn)室公司