使用尿嘧啶-dna-n-糖基化酶使錯(cuò)誤最小化的制作方法
【專利說明】使用尿嘧啶-DNA-N-糖基化酶使錯(cuò)誤最小化
[0001]本申請要求提交于2013年3月14日的美國臨時(shí)專利申請系列號61/782,698的優(yōu)先權(quán),其通過引用以其整體結(jié)合到本文中。
發(fā)明領(lǐng)域
[0002]本文提供涉及核酸的酶修飾的技術(shù),和特別但不限于涉及使用尿嘧啶-DNA-N-糖基化酶以使由胞嘧啶殘基的脫氨作用導(dǎo)致的DNA序列的錯(cuò)誤最小化或消除所述錯(cuò)誤的方法、試劑盒和組合物。
[0003]背景
PH、溫度、離子強(qiáng)度、壓力等的變化經(jīng)常用于分子生物學(xué)過程和測定法以引起樣品組分例如核酸、蛋白、輔因子等變化。然而,特定樣品組分(例如特定蛋白)的一些分子生物學(xué)操作對其它樣品組分(例如核酸)產(chǎn)生不需要的影響。例如,在分子生物學(xué)中使用熱活化的酶需要一段加熱的時(shí)間(例如,在95°C 10-20分鐘)以活化酶。在該加熱期間,存在于樣品中的核酸(例如DNA)也受到加熱。加熱核酸誘導(dǎo)胞嘧啶的脫氨作用(參見例如Lindahl和Nyberg (1974)^Heat-1nduced deaminat1n of cytosine residues in deoxyribonucleicacid (在脫氧核糖核酸中胞啼啶殘基的熱誘導(dǎo)的脫氨作用)”,B1chemistry\3(16):3405),其導(dǎo)致將胞嘧啶堿基轉(zhuǎn)化成尿嘧啶堿基。而胞嘧啶堿基與鳥嘌呤配對,尿嘧啶堿基與腺嘌呤配對。因此,在互補(bǔ)DNA鏈的合成期間尿嘧啶堿基編碼腺嘌呤。在DNA鏈中的該起始的錯(cuò)誤導(dǎo)致在隨后自損壞的模板合成的DNA鏈中G至A的突變和/或C至T的突變。
[0004]盡管具有2百萬個(gè)堿基的單鏈DNA分子在pH 7.4和37°C每2.8小時(shí)將經(jīng)歷涉及胞嘧啶的單脫氨作用事件,但95°C孵育DNA以大約2 X 10 _7次脫氨作用事件/秒的速率誘導(dǎo)胞嘧啶的脫氨作用(參見例如Lindahl和Nyberg,同上)。根據(jù)該速率,在95°C加熱DNA 10分鐘以大約1個(gè)/8333個(gè)胞嘧啶引起胞嘧啶轉(zhuǎn)變?yōu)槟蜞奏?。因此,該速率是意義重大的,因?yàn)榉肿由飳W(xué)樣品經(jīng)常包含超過百萬(或甚至超過十億)個(gè)胞嘧啶殘基。該轉(zhuǎn)變對于單核苷酸多態(tài)性(SNP)檢測測定是個(gè)問題,在所述測定中檢測靶向的SNP為G至A或C至T轉(zhuǎn)變。例如,在加熱活化期間大約1個(gè)/8333個(gè)拷貝野生型序列將轉(zhuǎn)變成突變體拷貝,因此產(chǎn)生SNP存在于樣品中的假陽性結(jié)果。因此,需要在分子生物學(xué)過程中解決核酸的熱脫氨作用的技術(shù)。
[0005]簡述
因此,本文提供涉及核酸的酶修飾的技術(shù),和特別但不限于涉及使用尿嘧啶-DNA-N-糖基化酶(一種“UDG”酶,通常由稱為UNG的基因編碼)以使由胞嘧啶殘基的脫氨作用(例如,由于加熱DNA導(dǎo)致)導(dǎo)致的DNA序列的錯(cuò)誤最小化或消除所述錯(cuò)誤的方法和組合物。在DNA分子可用作DNA合成的模板之前,尿嘧啶-DNA糖基化酶通過從DNA分子消除尿嘧啶阻止將C至U和G至A的突變固定到復(fù)制的DNA中。通過將損壞的堿基彈出雙螺旋和切割N-糖苷鍵,尿嘧啶-DNA-N-糖基化酶切割連接尿嘧啶堿基與DNA骨架的N-糖苷鍵,從而除去損壞的含氮堿基和留下完整的糖-磷酸骨架。作為該過程的結(jié)果,在DNA鏈中產(chǎn)生脫堿基位點(diǎn)(亦稱為脫嘌呤/脫嘧啶位點(diǎn)或AP位點(diǎn))。
[0006]脫堿基位點(diǎn)引起聚合酶停止。在一些條件下,脫堿基位點(diǎn)引起DNA鏈的中斷(例如,自發(fā)地和/或由于在脫堿基位點(diǎn)上切割核酸的酶的作用)。在任一情況下,聚合酶不繼續(xù)越過脫堿基位點(diǎn),因此不引入堿基到脫堿基位點(diǎn)相對的互補(bǔ)鏈中。因此,聚合酶不產(chǎn)生與損壞的DNA模板互補(bǔ)的突變體DNA鏈,所述損壞的DNA模板由損壞的寡核苷酸引物引發(fā)導(dǎo)致,或因?yàn)楦鞣N分子生物學(xué)方法中的其它損壞的核酸導(dǎo)致。因此,損壞的堿基不引起樣品中的突變體序列的擴(kuò)增。沒有該活性的情況下,在DNA合成期間自損壞的C產(chǎn)生的U指導(dǎo)聚合酶摻入A而不是G到相對互補(bǔ)鏈中;后續(xù)輪合成摻入T到錯(cuò)誤的A的對面。結(jié)果,起始的脫氨作用事件導(dǎo)致將C至T和G至A的突變固定到所有后續(xù)拷貝中。C堿基的脫氨作用因此在天然群體中導(dǎo)致突變。
[0007]此外,在合成擴(kuò)增核酸的方法(例如在聚合酶鏈反應(yīng)(PCR)、連接酶鏈反應(yīng)、引物延伸反應(yīng)和其它擴(kuò)增反應(yīng),如下文更詳細(xì)描述)中,C堿基經(jīng)脫氨作用產(chǎn)生U堿基是明顯成問題的。作為實(shí)例,在PCR期間DNA的擴(kuò)增按指數(shù)發(fā)生。結(jié)果,表示樣品中小比例的核酸的較少事件,例如單DNA鏈中的單C堿基的脫氨作用,被擴(kuò)增和在PCR期間和在PCR的終產(chǎn)物中以顯著量呈現(xiàn)。此外,后面的PCR循環(huán)的坪效應(yīng)導(dǎo)致在最終的擴(kuò)增產(chǎn)物中過度呈現(xiàn)起始較少種類的核酸。通過PCR-相關(guān)的熱循環(huán)期間的已知誘導(dǎo)C堿基的脫氨作用的加熱期,這些脫氨作用問題加重。
[0008]因此,本文提供的技術(shù)涉及從DNA中識(shí)別和除去U堿基的酶。在一些實(shí)施方案中,所述酶自熱穩(wěn)定的生物分離。熱穩(wěn)定的酶通過許多方法產(chǎn)生,和熱穩(wěn)定的酶的來源不限制所述技術(shù)。例如,在一些實(shí)施方案中熱穩(wěn)定的酶是自嗜熱生物(例如,古細(xì)菌(Archaea)的嗜熱成員例如閃爍古生球菌(Archaeglobus fulgidis))分離的酶。
[0009]所述技術(shù)包括組合物、方法和反應(yīng)混合物,其包括(或包括使用)以下酶:從DNA中識(shí)別和除去U堿基的天然熱穩(wěn)定的酶,例如天然熱穩(wěn)定的尿嘧啶-DNA-N-糖基化酶;從DNA中識(shí)別和除去U堿基的重組體熱穩(wěn)定的酶,例如重組體熱穩(wěn)定的尿嘧啶-DNA-N-糖基化酶;從DNA中識(shí)別和除去U堿基的野生型熱穩(wěn)定的酶,例如野生型熱穩(wěn)定的尿嘧啶-DNA-N-糖基化酶;從DNA中識(shí)別和除去U堿基的突變體熱穩(wěn)定的酶,例如突變體熱穩(wěn)定的尿嘧啶-DNA-N-糖基化酶;和/或從DNA中識(shí)別和除去U堿基的工程改造的熱穩(wěn)定的酶,例如工程改造的熱穩(wěn)定的尿嘧啶-DNA-N-糖基化酶。
[0010]在一些實(shí)施方案中,所述酶自嗜溫生物分離和是熱穩(wěn)定的酶。在一些實(shí)施方案中,熱穩(wěn)定的酶通過例如隨機(jī)誘變、計(jì)算機(jī)建模、合理(定向)誘變、合理(定向)酶設(shè)計(jì)、體外進(jìn)化(例如SELEX)等方法自較不熱穩(wěn)定的酶產(chǎn)生。在一些實(shí)施方案中,所述酶是冷穩(wěn)定的酶(例如,自嗜冷或喜低溫的生物分離),其也是熱穩(wěn)定的。在一些實(shí)施方案中,所述酶是尿嘧啶-DNA-N-糖基化酶(“UDG”或“UNG” )。
[0011]熱穩(wěn)定的尿嘧啶-DNA-N-糖基化酶是市購可得的。此外,幾種熱穩(wěn)定的尿嘧啶-DNA-N-糖基化酶的核苷酸序列和/或氨基酸序列是已知的,和許多生物(包括許多嗜熱生物)的基因組序列是已知的。因此,可購買熱穩(wěn)定的尿嘧啶-DNA-N-糖基化酶,或根據(jù)已知的核苷酸和/或蛋白序列和可得的基因組序列從生物分離熱穩(wěn)定的尿嘧啶-DNA-N-糖基化酶,例如通過PCR (例如,使用靶向保守區(qū)的引物,使用簡并引物)、探針方法或通過完全體外合成。嗜熱生物區(qū)別于嗜溫生物之處在于特征例如它們的最適生長溫度(例如,高于嗜溫生物的最適生長溫度)和基因組特征(例如,更高的GC含量)。
[0012]因此,在一些實(shí)施方案中,所述技術(shù)提供與熱穩(wěn)定的UDG相關(guān)的方法和組合物,所述UDG在加熱期間保持其活性,例如,在PCR的加熱步驟、測序反應(yīng)的加熱步驟、樣品制備的加熱步驟期間和/或在高溫例如在60°C或更高、70°C或更高、80°C或更高、90°C或更高、或95°C或更高下孵育期間。例如,一些PCR方法使用熱活化的聚合酶例如熱活化的Taq聚合酶。經(jīng)常,聚合酶保持無活性,直到在95°C或更高下加熱。在該加熱期間,發(fā)生C堿基脫氨作用。
[0013]所述技術(shù)廣泛適用于使由胞嘧啶的脫氨作用(例如由于樣品中核酸的任何加熱導(dǎo)致)導(dǎo)致的核酸序列錯(cuò)誤最小化或消除所述錯(cuò)誤。在用于制備樣品(例如分離和制備核酸和其它生物分子)的分子生物學(xué)技術(shù)中經(jīng)常進(jìn)行樣品的加熱。例如,自福爾馬林固定的石蠟包埋樣品(FFPE樣品)中制備核酸經(jīng)常伴隨加熱期,其產(chǎn)生胞嘧啶脫氨作用和在自FFPE樣品分離的核酸序列中的相關(guān)錯(cuò)誤。作為另一實(shí)例,加熱經(jīng)常用于制備用于測序的核酸(例如,在制備測序文庫中)和在測序反應(yīng)本身期間使用。因此,所述技術(shù)可適用于現(xiàn)有的測序技術(shù)和尚待開發(fā)的測序技術(shù),例如與Sanger和Maxam測序相關(guān)的制備方法和方案、第二代(即下一代或Next-Gen)、第三代(即Next-Next-Gen)或第四代(即N3_Gen)測序技術(shù),包括但不限于焦磷酸測序、通過連接測序、單分子測序、通過合成序列(SBS)、大規(guī)模平行克隆、大規(guī)模平行單分子SBS、大規(guī)模平行單分子實(shí)時(shí)、大規(guī)模平行單分子實(shí)時(shí)納米孔技術(shù)、使用零模式波導(dǎo)的方法等。Morozova和Marra在92: 255 (2008)中提供一些這樣的技術(shù)的綜述,其通過引用以其整體結(jié)合到本文中。示例性的技術(shù)是包括擴(kuò)增步驟的方法,例如由Roche作為454技術(shù)平臺(tái)商業(yè)化的焦磷酸測序(例如GS 20和GSFLX)、由 Illumina 商業(yè)化的 Solexa 平臺(tái)和由 Applied B1systems 商業(yè)化的 SupportedOligonucleotide Ligat1n and Detect1n (SOLiD)平臺(tái)。亦稱為單分子測序的其它方法的實(shí)例為由Helicos B1Sciences商業(yè)化的HeliScope平臺(tái)和分別由VisiGen, OxfordNanopore Technologies Ltd.、Life Technologies/1n Torrent和Pacific B1sciences商業(yè)化的顯現(xiàn)中的平臺(tái)(例如納米孔測序、基于pH的核苷酸摻入事件檢測、Xpandomer技術(shù))。
[0014]所述技術(shù)還涉及與樣品制備相關(guān)的方法,例如限制性消化、基因組擴(kuò)增、片段化、末端修復(fù)、連接(例如,接頭連接)、鏈分離、二級和/或三級結(jié)構(gòu)的熔解、污染物去除、蛋白去除、細(xì)胞裂解、自組織和/或細(xì)胞和/或生物流體制備核酸、附著至固體支持物、引物退火等。
[0015]所述技術(shù)還在微陣列技術(shù)、探針檢測技術(shù)(例如,印跡方法例如Southern印跡、Northern印跡、斑點(diǎn)印跡、槽印跡、雜交保護(hù)測定法等)中找到用途。
[0016]核酸擴(kuò)增的方法經(jīng)常結(jié)合樣品的加熱。核酸擴(kuò)增技術(shù)的實(shí)例包括但不限于聚合酶鏈反應(yīng)(PCR)、逆轉(zhuǎn)錄聚合酶鏈反應(yīng)(RT-PCR)、轉(zhuǎn)錄介導(dǎo)的擴(kuò)增(TMA)、連接酶鏈反應(yīng)(LCR)、鏈置換擴(kuò)增(SDA)和基于核酸序列的擴(kuò)增(NASBA)。本領(lǐng)域普通技術(shù)人員將認(rèn)識(shí)到,某些擴(kuò)增技術(shù)(例如PCR)要求在擴(kuò)增前將RNA反轉(zhuǎn)錄成DNA (例如RT-PCR),而其它擴(kuò)增技術(shù)直接擴(kuò)增RNA (例如TMA和NASBA)。
[0017]聚合酶鏈反應(yīng)(美國專利號4,683,195,4, 683,202,4, 800,159 和 4,965,188,各自通過引用以其整體結(jié)合到本文中),通常稱為PCR,使用多個(gè)循環(huán)的變性、引物對退火至相對鏈和引物延伸以指數(shù)增加靶核酸序列的拷貝數(shù)。在稱為RT-PCR的變化中,逆轉(zhuǎn)錄酶(RT)用于從mRNA制備互補(bǔ)DNA (cDNA),和然后通過PCR擴(kuò)增cDNA以產(chǎn)生多拷貝的DNA。對于PCR的其它各種改變,參見例如美國專利號4,683,195,4, 683,202和4,800,159 ;Mullis等,Meth.Enzymol.155: 335 (1987);和 Murakawa 等,DNA 7: 287 (1988),各自通過引用以其整體結(jié)合到本文中。
[0018]轉(zhuǎn)錄介導(dǎo)的擴(kuò)增(美國專利號5,480,784和5,399,491,各自通過引用以其整體結(jié)合到本文中),通常稱為TMA,在基本恒定的溫度、離子強(qiáng)度和pH的條件下自動(dòng)催化性合成多拷貝的靶核酸序列,其中靶序列的多個(gè)RNA拷貝自動(dòng)催化產(chǎn)生另外的拷貝。參見例如美國專利號5,399,491和5,824,518,各自通過引用以其整體結(jié)合到本文中。在描述于美國公布號20060046265 (通過引用以其整體結(jié)合到本文中)的變化中,TMA任選結(jié)合使用封閉部分、終止部分和其它修飾部分以改進(jìn)TMA過程的靈敏度和準(zhǔn)確度。
[0019]連接酶鏈反應(yīng)(Weiss, R., Science 254: 1292 (1991),通過引用以其整體結(jié)合到本文中),通常稱為LCR,使用與靶核酸的鄰近區(qū)域雜交的兩組互補(bǔ)DNA寡核苷酸。DNA寡核苷酸在重復(fù)循環(huán)的熱變性、雜交和連接中通過DNA連接酶共價(jià)連接,以產(chǎn)生可檢測的雙鏈連接寡核苷酸產(chǎn)物。
[0020]鏈置換擴(kuò)增(Walker,G.等,Proc.Natl.Acad.Sc1.USA 89: 392-396(1992);美國專利號5,270,184和5,455,166,各自通過引用以其整體結(jié)合到本文中),通常稱為SDA,使用下列的循環(huán):將引物序列對退火至靶序列的相對鏈、在dNTPa S的存在下引物延伸以產(chǎn)生雙鏈體半硫代磷酸酯化的引物延伸產(chǎn)物、半修飾的限制性核酸內(nèi)切酶識(shí)別位點(diǎn)的核酸內(nèi)切酶介導(dǎo)切口和聚合酶介導(dǎo)的自切口的3’末端的引物延伸,以置換現(xiàn)有鏈和產(chǎn)生用于下一輪引物退火、切口和鏈置換的鏈,導(dǎo)致產(chǎn)物的幾何擴(kuò)增。嗜熱SDA (tSDA)在更高的溫度下在基本相同的方法中,使用嗜熱核酸內(nèi)切酶和聚合酶(歐洲專利號0 684315)。
[0021]其它擴(kuò)增方法包括例如:基于核酸序列的擴(kuò)增(美國專利號5,130, 238,通過引用以其整體結(jié)合到本文中),通常稱為NASBA ;使用RNA復(fù)制酶以擴(kuò)增探針分子本身的擴(kuò)增方法(Lizardi等,B1Technol.6: 1197 (1988),通過引用以其整體結(jié)合到本文中),通常稱為QP復(fù)制酶;基于轉(zhuǎn)錄的擴(kuò)增方法(Kwoh等,Proc.Natl.Acad.Sc1.USA86:1173 (1989));和自持續(xù)序列復(fù)制(Guatelli 等,Proc.Natl.Acad.Sc1.USA 87:1874 (1990),各自通過引用以其整體結(jié)合到本文中)。對于已知擴(kuò)增方法的其它論述,參見例如 Persing, David Η., Diagnostic Medical Microb1logy: Principles andApplicat1ns (診斷醫(yī)學(xué)微生物學(xué):原理和應(yīng)用)(Persing等編輯)中的“In VitroNucleic Acid Amplificat1n Techniques (體外核酸擴(kuò)增技術(shù))”,第 51-87 頁(AmericanSociety for Microb1logy, Washington, DC (1993))0
[0022]在一些實(shí)施方案中,擴(kuò)增是等溫?cái)U(kuò)增方法。在一些實(shí)施方案中,擴(kuò)增方法是固相擴(kuò)增、polony擴(kuò)增、集落(colony)擴(kuò)增、乳液PCR、珠RCA、表面RCA、表面SDA等,如本領(lǐng)域技術(shù)人員所認(rèn)識(shí)到的。在一些實(shí)施方案中,使用導(dǎo)致溶液中游離DNA分子擴(kuò)增或通過DNA分子的僅一個(gè)末端連接至合適基質(zhì)的DNA分子擴(kuò)增的擴(kuò)增方法。在一些實(shí)施方案中,使用依賴于橋式PCR的方法,其中兩個(gè)PCR引物連接至表面(參見例如W0 2000/018957、U.S.7,972,820、7,790,418和八(^881等,Nucleic Acids Research (2000): 28(20): E87 ;各自通過引用結(jié)合到本文中)。在一些情況下,本發(fā)明的方法可產(chǎn)生“聚合酶集落(colony)技術(shù)”或“polony”,其是指保持相同擴(kuò)增子的空間聚類的多路擴(kuò)增。這些包括例如原位polony(Mitra 和 Church, Nucleic Acid Research 27, e34, 1999 年 12 月 15 日)、原位滾環(huán)擴(kuò)增(RCA) (Lizardi 等,Nature Genetics 19, 225, I"8 年 7 月)、橋式 PCR (美國專利號 5,641,658)、皮滴定(picotiter) PCR (Leamon 等,Electrophoresis 24, 3769, 2003年 11 月)和乳液 PCR (Dressman 等,PNAS 100,8817,2003 年 7 月 22 日)。
[0023]所述技術(shù)不限制于損壞(例如通過胞嘧啶的脫氨作用(例如熱誘導(dǎo)或其它(例如pH誘導(dǎo))的胞嘧啶的脫氨作用)或摻入尿嘧啶到DNA中)和隨后暴露于從核酸中除去尿嘧啶的酶(例如UDG)的核酸的類型(例如,關(guān)于其大小、目的、來源(例如天然的或合成的)等)。例如,在一些程序中,探針、寡核苷酸、引物、接頭、基因組、擴(kuò)增子、質(zhì)?;蚱渌怂崾艿綋p壞,例如,其包含脫氨的胞嘧啶,例如因?yàn)榧訜釋?dǎo)致。所述技術(shù)包括使因這些類型的損壞的核酸產(chǎn)生的錯(cuò)誤最小化或消除所述錯(cuò)誤。
[0024]因此,所述技術(shù)涉及熱穩(wěn)定的UDG,其在活化聚合酶的高溫下孵育期間和之后(例如,在95°C下10分鐘孵育以活化Taq聚合酶)保持活性。此外,所述技術(shù)涉及熱穩(wěn)定的UDG,其在PCR期間防止引物退火和鏈延伸的高溫下具有活性。具體而言,在聚合酶將腺嘌呤置于尿嘧啶對位之前,UDG從DN