一種新型錯配結(jié)合蛋白與纖維素結(jié)合域3的融合蛋白及其高通量去除dna合成中錯誤的方法
【專利摘要】本發(fā)明構(gòu)建了一種錯配結(jié)合蛋白MutS與纖維素結(jié)合域3的融合蛋白;建立了快速將這種融合蛋白固定到纖維素上的方法以及構(gòu)建錯配結(jié)合蛋白纖維素層析柱的方法;本發(fā)明還建立了利用這種錯配結(jié)合蛋白層析柱高通量去除芯片合成的寡核苷酸中錯誤的方法;同時本發(fā)明的方法也可以高通量糾正DNA合成中的錯誤。
【專利說明】一種新型錯配結(jié)合蛋白與纖維素結(jié)合域3的融合蛋白及其高通量去除DNA合成中錯誤的方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及生物【技術(shù)領(lǐng)域】,具體地說,本發(fā)明涉及構(gòu)建一種能夠去除寡核苷酸及DNA中合成錯誤的融合蛋白MutS及其應(yīng)用的領(lǐng)域。本發(fā)明涉及利用固定化重組錯配結(jié)合蛋白MutS固定化構(gòu)建纖維素柱的方法。本發(fā)明還涉及MutS纖維素的層析柱對芯片合成寡核苷酸及其組裝DNA的合成錯誤的糾正的方法,特別是利用這種固定重組蛋白的層析柱高效快速的高通量糾正DNA的合成錯誤的方法。
【背景技術(shù)】
[0002]基因的從頭合成技術(shù)無論在合成生物學(xué),系統(tǒng)生物學(xué)以及普遍的生命科學(xué)研究中發(fā)揮著越來越重要的作用[1-6]?;虻膹念^合成普遍采用的策略是使用合成的寡核苷酸作為原材料,再利用各種拼接方法將這些短的寡核苷酸組裝成較長的目的基因。然而,這些寡核苷酸合成價格以及合成通量成為了基因從頭合成面臨的問題?,F(xiàn)在,采用傳統(tǒng)的DNA合成技術(shù)所提供的寡核苷酸(100~200堿基)普遍的價格是0.4~1.0美元/堿基。然而,與傳統(tǒng)的DNA合成技術(shù)相比較利用微列陣及微流體技術(shù)合成的寡核苷酸則需要較低的價格,并且達(dá)到更高的通量[7-12]。例如,采用微流體的DNA合成技術(shù)可以在一個標(biāo)準(zhǔn)的芯片上同時并行合成百萬條不同的寡核苷酸[13,14]。在某些寡核苷酸合成事例中,基于微列陣的DNA芯片合成技術(shù)可以提供一百萬種60個堿基長度的寡核苷酸庫而只需要約600美元的價格[14, 15] ο
[0003]然而,利用芯片合成的寡核苷酸進(jìn)行基因的從頭合成中還存在多個技術(shù)瓶頸。I)與傳統(tǒng)技術(shù)合成的寡核苷酸相比,芯片合成的每種寡核苷酸的平均數(shù)量很低。在一個芯片上,可以一次性合成成千上萬種寡核苷酸,但是每種寡核苷酸的數(shù)量只有IO4~IO6條[12]。2)芯片合成的寡核苷酸庫的成分很復(fù)雜。合成的寡核苷酸從芯片上切割下來后會形成一個含有成千上萬不同種類寡核苷酸的文庫,而`當(dāng)使用這些寡核苷酸進(jìn)行后續(xù)的基因全長的組裝時,由于文庫中的序列的多樣性將給全長基因的組裝帶來很大的困難。3)芯片合成的寡核苷酸的質(zhì)量較傳統(tǒng)方法合成的寡核苷酸差。當(dāng)這些寡核苷酸組裝成為全長基因的時候(500~5000nt),由于寡核苷酸本身的合成錯誤而給組裝的全長基因引入大量的突變。幸運的是,芯片合成寡核苷酸較低的產(chǎn)量和復(fù)雜的組成可以通過引入通用引物以及高保真PCR技術(shù)得到部分的解決。通過向寡核苷酸序列兩端加入不同的通用引物,可以將復(fù)雜的文庫分割為多個成分較為簡單的亞文庫,然后通過高保真PCR擴(kuò)增這些目的寡核苷酸亞庫從而得到較高量的成分較為簡單的亞文庫[12]。綜上所述,芯片合成寡核苷酸的質(zhì)量變成了利用芯片合成DNA進(jìn)行基因從頭合成的最主要的障礙。
[0004]提高芯片合成寡核苷酸的質(zhì)量可以通過提高合成過程中合成循環(huán)的效率[16]或者在芯片合成后的進(jìn)行DNA糾錯[8,12,17]。有文獻(xiàn)報導(dǎo)的,通過優(yōu)化試劑流動以減少寡核苷酸合成過程中的脫嘌呤化(depurination)作用,從而有效的降低合成中的副反應(yīng)(sidereactions),最終提高目標(biāo)寡核苷酸的合成質(zhì)量以及產(chǎn)量[16]。高效液相色譜(HPLC),聚丙烯酰胺凝膠電泳(PAGE)技術(shù)也可以用于提高合成寡核苷酸的質(zhì)量[15,18]。使用這些方法,約90%的會導(dǎo)致合成寡核苷酸長度變化的合成錯誤可以被去除。除此以外,一種設(shè)計合成兩張含有互補序列的芯片,然后通過雜交選擇的方法可以將芯片合成寡核苷酸的正確率提高約9倍[12].另外還有文獻(xiàn)報道了,一種高并行高通量的寡核苷酸糾錯方法,該方法結(jié)合高通量的DNA測序技術(shù),設(shè)計使用一種高通量的平臺特異性的選擇那些測序顯示序列正確的寡核苷酸,從而提高芯片合成寡核苷酸的質(zhì)量。通過該方法可以獲得正確率提高了約500倍的寡核苷酸[19]。
[0005]另一方面,DNA的合成錯誤的糾正也可以在基因組裝之后進(jìn)行。錯配識別蛋白已經(jīng)被廣泛應(yīng)用于合成DNA的錯誤糾正。錯配結(jié)合蛋白MutS可以特異性的識別并結(jié)合DNA鏈上的所有種類的單堿基錯配和I~5堿基的插入或缺失錯配而不需要其他蛋白或者因子的協(xié)助[20,21]。一種基于耐熱的棲熱水生菌MutS(Taq-Muts)的DNA糾錯方法可以提供突變率為l/1000bp的DNA,與傳統(tǒng)基因合成技術(shù)相比較在保真度上提高了約15倍[22]。另一種改進(jìn)的基于Taq-MutS的方法,通過將Taq-MutS與純化標(biāo)簽蛋白MBP相融合從而便于去除含有突變堿基的DNA而達(dá)到糾錯的效果,使用該種策略可以將含有合成的綠色熒光蛋白(GFPuv)基因的克隆的比例由約60%提高到90%,錯誤率降低了約3.5~4.3倍,可以獲得錯誤率在l/3500bp的目的基因[23]。可以特異性識別DNA錯配的核酸外切酶(Endonucleases)也被應(yīng)用于 DNA 的錯誤糾正。例如:T4endonuclease VII, BacteriophageT7endonuclease I 和E.coli endonuclease V 結(jié)合exonucleonase 也被成功應(yīng)用于合成基因的錯誤糾正[24]。另一種被用于突變檢測的商業(yè)酶CEL Surveyor nuclease也成功的被用于合成DNA的錯誤糾正,使用該種酶可以將合成基因的錯誤率由原來的l/526bp提高到l/3833bp,兩輪循環(huán)的糾錯反應(yīng)可以進(jìn)一步降低合成基因的錯誤率至l/8701bp約合16倍的降低[25]。ErrASE kit,另一種商業(yè)化的主要利用核酸外切酶CEL進(jìn)行堿基糾錯的產(chǎn)品,可以將芯片合成的寡核苷酸的錯誤率由l/250bp降低至l/7017bp[26]。
[0006]然而,已經(jīng)存在的糾錯方法在應(yīng)用于糾正芯片合成的寡核苷酸庫(具有高突變率和不同的Tm值并且成分復(fù)雜)還需要進(jìn)一步的提高和改進(jìn)[12] [19]。尤其需要一種更加高效,易于規(guī)模化且價格低廉的高通量的錯誤糾正方法。HPLC和PAGE的方法可以移除部分合成不成功的寡核苷酸,但是該過程既昂貴且糾錯效率較低,而且當(dāng)錯誤的和正確的寡核苷酸之間沒有長度的差別時也不可以使用。這些方法更適合用于移除合成過程中的副反應(yīng)產(chǎn)物?;阱e配結(jié)合蛋白的糾錯方法更傾向于使用耐熱的MutS,因為它們與大腸桿菌的MutS相比較更加的穩(wěn)定且對于完全互補雙鏈DNA的非特異性結(jié)合很低。但是,這些方法的通量都比較低,通常一個糾錯反應(yīng)用于糾正一條DNA,而沒有提供一種高通量的糾錯方法。另一種使用核酸外切酶進(jìn)行從頭合成基因的錯誤糾正[25,27]也存在一些問題。例如,當(dāng)使用Surveyor nuclease這種核酸內(nèi)切酶進(jìn)行錯誤糾正的時候,需要多種額外的步驟從而移除錯配堿基和修復(fù)被切割的DNA鏈。其昂貴的成本和繁雜耗時的操作使該方法不適合應(yīng)用于高通量的基因糾錯。然而這種方法比較適合用于糾正較長的基因片段而不是寡核苷酸的錯誤,因為對于由不同的長度的寡核苷酸組成的混合物進(jìn)行基于長度區(qū)分的糾錯方法是不具有實際的操作可行性,并且對于較短的寡核苷酸(<200mer)是比較容易切割過度。由Mark Matzas和Peer F Stalller提出的基于高通量測序平臺的寡核苷酸糾錯方法似乎是最適合應(yīng)用于芯片合成的寡核苷酸的糾錯。然而,這個方法是基于高通量測序技術(shù),且對于設(shè)備的要求很高,成本很昂貴。
[0007]錯配結(jié)合蛋白MutS已經(jīng)被廣泛用于錯配堿基的識別。來源于大腸桿菌的錯配結(jié)合系統(tǒng)MutHLS被應(yīng)用于PCR錯配DNA的錯誤糾正[28]。來源于耐熱菌的MutS也被應(yīng)用于糾正合成DNA中的合成錯誤。利用MutS進(jìn)行DNA的合成錯誤的糾正的方法是可以肯定的[23,29]。但是能否使用MutS進(jìn)行芯片合成DNA的高通量的錯誤糾正還沒有系統(tǒng)的研究。雖然來源于棲熱水生菌的MutS和源于大腸桿菌的MutS已經(jīng)被應(yīng)用于DNA的糾錯,并且來源于棲熱水生菌的MutS也與MBP相結(jié)合然后使用可以和MBP結(jié)合的基質(zhì)通過離心去除結(jié)合有錯配DNA的MutS [23],但是來源于大腸桿菌的MutS卻沒有被進(jìn)行這方面的研究,而且它們都沒有將MutS固定化到纖維素上形成特異性結(jié)合含有錯配堿基DNA的柱子的研究,而且都沒有與CBM結(jié)構(gòu)域相結(jié)合以將MutS蛋白固定到無定形纖維素(amorphous cellulose)上然后形成MutS纖維素柱(MCSC)以進(jìn)行DNA合成錯誤的糾正,而與其他的凝膠介質(zhì)比起來,無定形纖維素的成本要低得多。而且也沒有研究將該技術(shù)應(yīng)用到芯片合成DNA的高通量錯誤糾正的研究中。所以能否將這兩種MutS蛋白進(jìn)行結(jié)合使用從而近一步優(yōu)化糾錯體系,并利用CBM將其固定化在無定形纖維素介質(zhì)上,并形成一套芯片合成DNA的錯誤糾正的系統(tǒng),這樣的系統(tǒng)在MutS結(jié)合有錯配的基礎(chǔ)上,還有層析效應(yīng),進(jìn)一步提高去除錯配DNA能力。這一套系統(tǒng)還能夠進(jìn)行芯片合成寡核苷酸以及DNA片段的高通量糾錯,由于傳統(tǒng)的基因合成中的寡核苷酸和DNA片段錯誤去除相對芯片合成的寡核苷酸的錯誤去除容易的多,所以構(gòu)建的系統(tǒng)應(yīng)該也可以用于普通的DNA合成中的錯誤去除。
【發(fā)明內(nèi)容】
[0008]本發(fā)明中將棲熱水生菌的錯配結(jié)合蛋白MutS(TaqMutS)或大腸桿菌的錯配結(jié)合蛋白MutS (EcoMutS)與纖維素結(jié)合結(jié)構(gòu)域3(CBM3)融合表達(dá),以纖維素凝膠為基質(zhì),將MutS融合蛋白固定在纖維素凝膠上,然后使用這種凝膠裝柱,形成MutS纖維素柱。而需要糾錯的DNA樣本通過變性退火從而將合成錯誤的堿基展示為錯配堿基,利用MutS蛋白特異性的識別并結(jié)合含有錯配堿基對的雙鏈DNA的能力,可以將這些展示有錯誤合成堿基的DNA雙鏈去除。而利用兩種MutS之間DNA結(jié)合特異`性的不同,進(jìn)行互補,從而進(jìn)一步提高錯誤去除的能力。主要內(nèi)容包括MutS融合蛋白表達(dá)載體的構(gòu)建及融合蛋白的表達(dá)及純化;MutS纖維素柱的構(gòu)建,包括將融合蛋白固定化到纖維素凝膠上,并裝柱形成MutS纖維素柱。以芯片合成的EGFP (0.7kb,60種不同寡核苷酸)以及番茄紅素合成基因(12.4kb,479種不同寡核苷酸)寡核苷酸庫為例,通過在這些基因的合成組裝過程中對合成錯誤的糾正,建立完整的同時處理多達(dá)數(shù)百根不同寡核苷酸的高通量的糾錯體系,用于寡核苷酸文庫及多條較長的DNA片段(>250bp,數(shù)十根)的合成錯誤的糾正。
[0009]在一些方面中,本發(fā)明包括以下內(nèi)容:
[0010]I) PCR擴(kuò)增大腸桿菌MutS (EcoMutS)和棲熱水生菌 MutS (TaqMutS)基因。EcoMutS基因是以質(zhì)粒PET-28a-eMutS為模板,設(shè)計特異性擴(kuò)增引物,通過PCR擴(kuò)增獲得。TaqMutS基因則是以棲熱水生菌的基因組為模板,設(shè)計引物通過PCR擴(kuò)增獲得。同時以質(zhì)粒pCG[30]為模板,設(shè)計特異性擴(kuò)增引物,通過PCR擴(kuò)增獲得CBM-EGFP (融合EGFP是為了在下游過程中進(jìn)行監(jiān)控)基因。
[0011]2)將第一項PCR擴(kuò)增獲得的EcoMutS基因和CBM-EGFP基因通過限制性內(nèi)切酶酶切連接的方法,插入表達(dá)質(zhì)粒pET-21c中構(gòu)建表達(dá)載體pEcoMutS-CBM3-EGFP,用于表達(dá)eMutS融合蛋白。將第一項PCR擴(kuò)增獲得的TaqMutS基因和CBM-EGFP基因通過限制性內(nèi)切酶酶切連接的方法,插入表達(dá)質(zhì)粒pET_21c中構(gòu)建表達(dá)載體pCBM3-EGFP_TaqMutS,用于表達(dá)tMutS融合蛋白。
[0012]3)將第二項構(gòu)建的表達(dá)載體pEcoMutS-CBM3-EGFP和 pCBM3_EGFP_TaqMutS 分別通過化學(xué)法轉(zhuǎn)化進(jìn)入大腸桿菌BL21 (DE3)細(xì)胞中來表達(dá)eMutS和tMutS目標(biāo)蛋白。
[0013]4)將第三項eMutS和tMutS蛋白表達(dá)細(xì)胞,通過超聲破碎裂解細(xì)胞,然后離心收集上清,將收集的上清使用N1-NTA蛋白純化體系純化目標(biāo)蛋白。然后使用透析袋將N1-NTA純化的蛋白透析于結(jié)合緩沖液中。
[0014]5)將第四項中純化的eMutS和tMutS利用CBM3和纖維素凝膠的特異性結(jié)合能力,固定化到無定形纖維素上,然后使用固定化有目標(biāo)蛋白的纖維素填充到空層析柱中,形成不同的MutS纖維素凝膠柱(MCSC)。只固定化有eMutS的纖維素柱稱為eMCSC ;只固定化有tMutS的纖維素柱稱為tMCSC。同時固定化有eMutS和tMutS的纖維素柱稱為etMCSC。對于etMCSC,由于eMutS和tMutS的裝柱方法不一樣而又分為三種etMCSC:e/tMCSC、e+tMCSC和t/eMCSC。e/tMCSC是先將tMutS纖維素凝膠裝在柱子的底部,然后在其上裝入eMutS纖維素凝膠;e+tMCSC是將eMutS和tMutS纖維素凝膠先混合,然后裝入柱子中。t/eMCSC是先將eMutS纖維素凝膠裝在柱子的底部,然后再其上裝入tMutS纖維素凝膠。
[0015]6)以第五項中構(gòu)建的MCSC,以芯片合成的EGFP寡核苷酸文庫的錯誤糾正為例。結(jié)果顯示etMCSC具有更高的糾錯效率;etMCSC的不同裝柱方式不影響etMCSC的糾錯效率;使用MCSC重復(fù)糾錯循環(huán)能夠 進(jìn)一步提聞糾錯的效率,即兩步糾錯法比一步糾錯法更加有效。
[0016]7)在第六項中,確定最有效的MCSC糾錯體系(etMCSC)后,設(shè)計了一種高通量糾錯策略。以從頭合成番茄紅素合成所需的基因為例,通過芯片合成的寡核苷酸(479種不同寡核苷酸)的合成錯誤的糾正,研究MCSC高通量糾正DNA合成錯誤的糾錯策略的效率。并研究在寡核苷酸文庫階段進(jìn)行錯誤糾正的一步糾錯法和在寡核苷酸階段和組裝片段階段都進(jìn)行一輪糾錯的兩步糾錯法的糾錯效率,結(jié)果顯示通過一步糾錯可使錯誤率降低5.90倍,通過兩步糾錯可使錯誤率降低19.38倍。
[0017]本發(fā)明的優(yōu)點和積極效果
[0018]本發(fā)明中使用MutS和CBM3融合表達(dá),便于MutS蛋白快速高效的固定到無定形纖維素上。本發(fā)明中使用的無定形纖維素的價格非常便宜($5/g[31]),大大減低MCSC的成本。
[0019]本發(fā)明中使用MCSC用于DNA的合成錯誤的糾正,與已經(jīng)發(fā)表的使用MutS進(jìn)行錯誤糾正的方法相比較有多個優(yōu)點。⑴簡便,已發(fā)表的基于MutS的DNA合成錯誤的糾正的方法,都是在液相中進(jìn)行MutS融合蛋白和DNA樣本的結(jié)合。然后再通過電泳,離心等方法除去含有錯配的DNA。而本發(fā)明的MCSC,MutS和DNA的結(jié)合以及MutS和含有錯配堿基DNA的復(fù)合物的移除是同時在柱子上進(jìn)行。不需要后續(xù)的步驟。(2)高效,由于本發(fā)明的MCSC屬于一種特異性結(jié)合合成錯誤堿基的親和層析柱,其柱層析效應(yīng)使其較非柱結(jié)構(gòu)的錯配純化方法有更高的錯配移除能力。(3)本發(fā)明中使用MCSC進(jìn)行高通量的錯誤糾正,一次性能夠糾正含有數(shù)百種寡核苷酸的寡核苷酸文庫的合成錯誤以及一次能夠去除幾十種數(shù)百堿基的DNA片段中的錯誤。是第一次提出使用MutS蛋白進(jìn)行高并行,高通量且低成本的DNA合成錯誤的糾正。
[0020]更具體地,本發(fā)明提供以下各項:
[0021]1.一種融合蛋白,所述融合蛋白包含錯配結(jié)合蛋白(MutS)和纖維素結(jié)合結(jié)構(gòu)域3 (CBM3)的序列。
[0022]2.根據(jù)I所述的融合蛋白,其中所述CBM3的序列如SEQ ID N0.1所示。
[0023]3.根據(jù)I所述的融合蛋白,其中所述MutS是大腸桿菌MutS,其序列優(yōu)選如SEQ IDN0.2所示,并且更優(yōu)選地,所述融合蛋白的序列如SEQ ID N0.3所示。
[0024]4.根據(jù)I所述的融合蛋白,其中所述MutS是棲熱水生菌MutS,其序列優(yōu)選如SEQID N0.4所示,并且更優(yōu)選地,所述融合蛋白的序列如SEQ ID N0.5所示。
[0025]5.核酸,所述核酸編碼根據(jù)1-4中任一項所述的融合蛋白。
[0026]6.一種用于除去合成的寡核苷酸樣品中錯誤合成的寡核苷酸的介質(zhì),所述介質(zhì)通過將根據(jù)1-4中任一項所述的融合蛋白與纖維素結(jié)合來制備。
[0027]7.根據(jù)6所述的介質(zhì),其中所述纖維素是無定形纖維素。
[0028]8.一種用于除去合成的寡核苷酸樣品中錯誤合成的寡核苷酸的層析柱,所述層析柱中填充有根據(jù)6-7中任一項 所述的介質(zhì)。
[0029]9.一種用于除去合成的寡核苷酸樣品中錯誤合成的寡核苷酸的方法,所述方法包括使所述合成的寡核苷酸樣品與根據(jù)6-7中任一項所述的介質(zhì)充分接觸。
[0030]10.一種用于除去合成的寡核苷酸樣品中錯誤合成的寡核苷酸的方法,所述方法包括使所述合成的寡核苷酸樣品通過根據(jù)8所述的層析柱,優(yōu)選地,所述方法還包括洗脫的步驟。
【專利附圖】
【附圖說明】
[0031]圖1、多種MutS固定化纖維素柱。(a) tMutS固定化纖維素柱(tMCSC) ; (b) eMutS固定化纖維素柱(eMCSC) ; (c) e/tMutS固定化纖維素柱(e/tMCSC) ; (d) t/eMutS固定化纖維素柱(t/eMCSC) ;(e)e+tMutS固定化纖維素柱(e+tMCSC)。
[0032]圖2、MutS融合蛋白表達(dá)載體圖譜。(A)pEcoMutS-CBM3_EGFP,eMutS蛋白表達(dá)載體。(B)pCBM3-EGFP_TaqMutS,tMutS 蛋白表達(dá)載體。
[0033]圖 3、純化的MutS 融合蛋白的 SDS-PAGE。1.eMutS 融合蛋白(EcoMutS-CBM3_EGFP,147.8kDa) ;2.tMutS 融合蛋白(CBM3_TaqMutS_EGFP,140.29kDa) ;M 蛋白分子量標(biāo)記(PageRuler?Prestained Protein Ladder, #SM0671, Fermentas)。
[0034]圖4、使用MCSC進(jìn)行寡核苷酸或者其組裝DNA合成錯誤移除的圖示;(a)PCR擴(kuò)增芯片合成寡核苷酸或者其組裝DNA ;(b)通過擴(kuò)增的寡核苷酸或者其組裝DNA進(jìn)行重新退火雜交將合成錯誤的堿基展示為錯配堿基;(c)重新雜交的寡核苷酸或者其組裝DNA上樣到MCSC上;(d)洗脫,含有錯配堿基的寡核苷酸或DNA被滯留在柱子上,不含有錯配堿基的合成正確的寡核苷酸或DNA流過柱子,洗脫下來;(e)擴(kuò)增,錯誤糾正后的寡核苷酸或者DNA通過PCR擴(kuò)增用于下述應(yīng)用。。
[0035]圖5、芯片合成EGFP寡核苷酸文庫的設(shè)計。EGFP基因使用DNAWork進(jìn)行密碼子優(yōu)化和限制性內(nèi)切酶酶切位點移除,然后切割成為等長的三段,且相鄰的片段之間含有30bp的互補區(qū)域。這些片段再使用Gene201igO切割為寡核苷酸序列,這些寡核苷酸含有互補區(qū)域可以用于片段的組裝,并且相鄰的互補的寡核苷酸區(qū)域之間不存在間隔,那樣他們既可以使用基于PCR的組裝方法也可以使用基于連接的組裝方法。上述設(shè)計的寡核苷酸,通過在兩端添加不同的引物序列將其分成多個寡核苷酸亞庫。
[0036]圖6、圖示高通量糾正芯片合成寡核苷酸文庫的合成錯誤。(i)芯片合成寡核苷酸文庫。引物(黑,紅,黃)添加到寡核苷酸序列兩端將寡核苷酸文庫分割成亞庫。(ii)從芯片上將寡核苷酸切割下來。合成的寡核苷酸是單鏈。(iii)亞庫的擴(kuò)增。(iv)重新雜交展示錯誤合成的堿基(紫點)為錯配。(V)所有的重新雜交的寡核苷酸亞庫混合成一個寡核苷酸文庫。(vi)MCSC錯誤移除。混合的重新雜交的寡核苷酸文庫(含有多個亞庫)使用一個MCSC糾錯。(vii)使用不同的特異性引物分別擴(kuò)增錯誤移除的寡核苷酸亞庫。(viii)Mly I酶切移除引物序列。(ix)DNA片段或基因序列的組裝。
[0037]圖7、芯片合成番茄紅素生物合成基因所需寡核苷酸文庫的設(shè)計。首先將目標(biāo)基因使用DNAWork進(jìn)行密碼子優(yōu)化和限制性內(nèi)切酶酶切位點移除,然后切割成為多個片段,且相鄰的片段之間含有30bp的互補區(qū)域。然后這些片段再進(jìn)一步切割為寡核苷酸序列,這些寡核苷酸含有互補區(qū)域可以用于片段的組裝,并且相鄰的互補的寡核苷酸區(qū)域之間不存在間隔,那樣他們既可以使用基于PCR的組裝方法也可以使用基于連接的組裝方法。上述設(shè)計的寡核苷酸,對于來源于片段兩端的寡核苷酸序列分別在其5’端添加一組引物序列用于基因片段的擴(kuò)增。然后再通過在不同的寡核苷酸亞庫序列的兩端添加不同的引物序列用于不同亞庫的擴(kuò)增。
【具體實施方式】 [0038]材料和方法
[0039]試劑和菌株:本發(fā)明中的所有試劑均是市場購買的試劑級以上試劑。微晶纖維素Avicel PH105 (20 μ m)購自 FMC Co (Philadelphia, PA)。大腸桿菌(Escherichia coli)XLlOgold作為DNA操作時使用的宿主菌,包含100 μ g/mL氨節(jié)青霉素的Luria-Bertani (LB)培養(yǎng)基用作培養(yǎng)E.coli。大腸桿菌BL21(DE3)用于表達(dá)重組蛋白質(zhì),包含lmmol/L異丙基-β -D-硫代半乳糖苷(IPTG),100 μ g/mL氨芐青霉素的Luria-Bertani (LB)培養(yǎng)基用作表達(dá)培養(yǎng)基。引物由生工生物工程(上海)股份有限公司合成。
[0040]無定形纖維素的制備:
[0041]0.2g微晶纖維素和0.6mL水在50mL離心管中充分混合制備成纖維素懸液,再加入IOmL冰冷的濃磷酸(>85%)。加入時速度要慢,同時劇烈混合。這個纖維素混合物會很快變透明。在冰上放置lh,并不時攪動。然后分四次加入40mL冰冷的水。加入時要劇烈攪動,避免成塊的纖維素出現(xiàn)。沉淀的纖維素在4°C,5000x g條件下離心20min。棄去上清,將沉淀重懸與冰水之中,再次離心,并棄上清,重復(fù)4次,以除去磷酸。加入lmL2MNa2C03和40mL冰冷的水到纖維素懸液中中和殘余的磷酸,離心除去上清后,在用水洗兩遍,如果纖維素pH為5-7,那么無定形纖維素的制備完成。無定形纖維素的制備的定量采用phenol-H2S0ji,其他纖維素如Sigmacell,脫脂棉等也可以用于制備無定形纖維素。制備好的無定形纖維素添加0.2%(ff/V)疊氮化鈉后在4°C可保存一年以上。
[0042]融合蛋白構(gòu)建中所用引物如下:[0043]序列1:EcoMutS-Nhe1-F CTAGCTAGCATGAGTGCAATAGAAAATTTCG
[0044]序列2 =EcoMutS-Sac1-R CGAGCTCCACCAGGCTCTTCAAGCG
[0045]序列3 =TaqMutS-Sal1-F AAACGCGTCGACATGGAAGGCATGCTGAAGG
[0046]序列4 =TaqMutS-Not1-R ATAAGAATGCGGCCGCCCCCTTCATGGTATCCAAG
[0047]序列5:CBM3-GFP-Sac1-F CGAGCTCATGCCGGTATCAGGCAATTTG
[0048]序列6:CBM3-GFP-Not1-R ATAAGAATGCGGCCGCCTTGTACAGCTCGTCCATG
[0049]序列7:CBM3-GFP-Nde1-F AAAAAACATATGCCGGTATCAGGCAATTTG
[0050]序列8:CBM3-GFP-Sal1-R AAACGCGTCGACCTTGTACAGCTCGTCCATG
[0051]實施例1、eMutS和tMutS蛋白的制備
[0052]1.eMutS和tMutS蛋白表達(dá)載體的構(gòu)建
[0053]I).EcoMutS 基因的獲得:
[0054]以質(zhì)粒 pET- 32a-eMutS (將 EcoMutS 基因(GenBank:HG738867.1)插入 pET_32a 的EcoRI和HindIII位點構(gòu)建而成,具體參見畢利軍等,AnthonyE.G.Cass (2002) DNA錯配修復(fù)基因mutS的高效表達(dá)及表達(dá)產(chǎn)物活性鑒定.生物工程學(xué)報18(5):536-540)為模板,設(shè)計特異性擴(kuò)增引物,使用PrimeSTAR HS DNA聚合酶(寶生物工程(大連)有限公司)進(jìn)行PCR,得到的產(chǎn)物片段為包含EcoMutS基因的EcoMutS-NS片段(“-NS”表示該片段包含酶切位點N =NheI和S =SacI,以下類似)。
[0055]EcoMutS-NS 基因的 PCR 體系:
[0056]
? X PrnmoSI AK 聚tV酶緩沖液10 μ I
2.? mM介液8 μ I
[0057]
10 μ M lxoMuLS-\hcH_'(序列 I)2 μ I
10 μ M IxoMuLS-Sac HU序列2)2 μ I
PlUHa-GMutS質(zhì)粒(10 ng/μ I)I μ I
PrimeSTAR [)\Λ 聚介酶I μ I
ddH20.個.1 ()() μ I
[0058]PCR 程序
[0059]步驟1:98 0C5 min
步驟2:98 °Csec
步驟3:55 V15 sec
少驟 1:72 V:)) min
步驟5:回到步驟230循環(huán)
步驟6:72 0CIO min
步驟7: 4 V保持
[0060]2).TaqMutS 基因的獲得:
[0061]提取棲熱水生菌(菌株號NBRC103206)的基因組,并將提取的棲熱水生菌的基因組稀釋100倍作為模板,采用PrimeSTAR DNA聚合酶通過PCR擴(kuò)增獲得TaqMutS基因(GenBank:U33117.1) DNA。并將其插入pMD18_T載體(寶生物工程(大連)有限公司)中從而得到pMD18_TaqMutS,測序確定序列正確。然后`以插入TaqMutS基因的pMD18_TaqMutS為模板,采用PrimeSTAR HS DNA聚合酶進(jìn)行PCR,得到的產(chǎn)物片段為包含TaqMutS基因的TaqMutS-SN 片段。
[0062]具體操作步驟為:
[0063](I)首先,提取棲熱水生菌的基因組,其提取步驟為:
[0064]①.挑取棲熱水生菌凍干粉末,接入5ml液體CASTENH0LZ培養(yǎng)基(Nitrilotriacetic acid (Titriplex I) 100.00mg/L ;CaS04x2H2060.0Omg/L ;MgS04x7H20100.0Omg/L ;NaC18.0Omg/L ;KN03103.0Omg/L ;NaN03689.0Omg/L;Na2HP04x2H20140.0Omg/L;FeC13x6H200.47mg/L;MnS04x H202.20mg/L ; ZnS04x7H200.50mg/L;H3B030.50mg/L; CuS04x5H2025.00 μ g/L;Na2Mo04x2H2025.00 μ g/L;CoC12x6H2046.00 μ g/L;Tryptone1.0Og/L;Yeastextractl.0Og/L; Adjust pH to8.2with NaOH.)中,7CTC, 250rpm,培養(yǎng) 48h。
[0065]②.常溫下12000rpm, 5sec離心收菌,棄上清。
[0066]③.500 μ I蒸懼水重懸菌體,12000rpm, 5sec離心收菌,棄上清。
[0067]④.取200 μ I 實驗室自配 Ix breaking 緩沖液(TritonX-lOO (2%(w/v)),SDS (1%(w/v)),NaCl (IOOmM),Tris-Cl (IOmM, pH8.0),EDTA(ImM))重懸菌體,并將菌液轉(zhuǎn)入到含有0.3g玻璃珠(425-600um,sigma,美國)的EP管內(nèi)。
[0068]⑤.加入200 μ I酚氯仿溶液后,高速震蕩3min,加入200 μ Ilx TE (IOmM Tris-Cl,pH8.0,lmM EDTA)。輕微震蕩。
[0069]⑥.12000rpm,離心5min,取最上層清液轉(zhuǎn)入新的EP管內(nèi),加入Iml預(yù)冷的無水乙醇。
[0070]⑦.12000rpm,4°C,離心IOmin,棄上清,室溫下干燥沉淀,并用400μ Ilx TE重懸沉淀。
[0071 ] ⑧.加入2 μ I RNase (RNA水解酶,中國生工生物工程(上海)股份有限公司生物),2mg/ml)到EP管內(nèi),混勻,37°C,酶切Ih。
[0072]⑨.取40 μ 13M醋酸鈉(ρΗ5.2)加入到管內(nèi),混勻并加入Iml預(yù)冷的無水乙醇。[0073]⑩.12000rpm,4°C,離心30min,棄上清室溫下干燥。用100 μ I無菌水重懸沉淀,此即棲熱水生菌基因組。
[0074]TaqMutS基因片段的PCR體系:
[0075]
【權(quán)利要求】
1.一種融合蛋白,所述融合蛋白包含錯配結(jié)合蛋白(Muts)和纖維素結(jié)合結(jié)構(gòu)域3 (CBM3)的序列。
2.根據(jù)權(quán)利要求1所述的融合蛋白,其中所述CBM3的序列如SEQID N0.1所示。
3.根據(jù)權(quán)利要求1所述的融合蛋白,其中所述MutS是大腸桿菌MutS,其序列優(yōu)選如SEQ ID N0.2所示,并且更優(yōu)選地,所述融合蛋白的序列如SEQ ID N0.3所示。
4.根據(jù)權(quán)利要求1所述的融合蛋白,其中所述MutS是棲熱水生菌MutS,其序列優(yōu)選如SEQ ID N0.4所示,并且更優(yōu)選地,所述融合蛋白的序列如SEQ ID N0.5所示。
5.核酸,所述核酸編碼根據(jù)權(quán)利要求1-4中任一項所述的融合蛋白。
6.一種用于除去合成的寡核苷酸樣品中錯誤合成的寡核苷酸的介質(zhì),所述介質(zhì)通過將根據(jù)權(quán)利要求1-4中任一項所述的融合蛋白與纖維素結(jié)合來制備。
7.根據(jù)權(quán)利要求6所述的介質(zhì),其中所述纖維素是無定形纖維素。
8.一種用于除去合成的寡核苷酸樣品中錯誤合成的寡核苷酸的層析柱,所述層析柱中填充有根據(jù)權(quán)利要求6-7中任一項所述的介質(zhì)。
9.一種用于除去合成的寡核苷酸樣品中錯誤合成的寡核苷酸的方法,所述方法包括使所述合成的寡核苷酸樣品與根據(jù)權(quán)利要求6-7中任一項所述的介質(zhì)充分接觸。
10.一種用于除去合成的寡核苷酸樣品中錯誤合成的寡核苷酸的方法,所述方法包括使所述合成的寡核苷酸樣品通過根據(jù)權(quán)利要求8所述的層析柱,優(yōu)選地,所述方法還包括洗脫的步 驟。
【文檔編號】B01D15/08GK103755815SQ201410023235
【公開日】2014年4月30日 申請日期:2014年1月17日 優(yōu)先權(quán)日:2014年1月17日
【發(fā)明者】洪泂, 高曉連, 宛雯, 周小川 申請人:中國科學(xué)技術(shù)大學(xué)