用于核酸測序的方法和試劑盒的制作方法
【專利說明】用于核酸測序的方法和試劑盒
[0001] 相關(guān)申請
[0002] 本發(fā)明要求于2012年8月6日提交的美國臨時申請系列號61/680, 212的優(yōu)先權(quán), 其通過引用完全結(jié)合在本文中。 發(fā)明領(lǐng)域
[0003] 本發(fā)明涉及用于測序單一核酸(基因組DNA,RNA,CDNA等)分子和其他分子的分 子生物學(xué)方法和傳感器設(shè)計、制造和應(yīng)用,例如,以允許高度平行的、高通量的單一分子和 長讀取長度的DNA測序和片段長度分析。
[0004] 發(fā)明背景
[0005] DNA(脫氧核糖核酸)通常是由稱為核苷酸的亞基組成的長的聚合物。這些單個 亞基的鏈形成稱為核酸的分子,其中DNA和RNA(核糖核酸)是目前自然中最常見的實例。 天然的脫氧核糖核酸由沿著核糖/磷酸骨架的四個堿基(腺嘌呤(A),胞嘧啶(C),鳥嘌呤 (G)和胸腺嘧啶(T))中的一種構(gòu)成。在天然存在的核糖核苷酸群體中,胸苷被替換為尿嘧 啶(U)。當通過在核糖骨架的5'和3'位置形成磷酸二酯鍵聚合時,核酸可以攜帶細胞中的 遺傳信息。核酸中的堿基能夠與另一個堿基形成氫鍵,促使穩(wěn)定的雙鏈分子的形成,在DNA 的情形中,其每一半是另一半的反向互補物。DNA包含兩個含有四種不同核苷酸堿基的長的 核苷酸鏈(例如,AGTCATCGT...等),具有的糖和磷酸基團的骨架通過酯鍵連接,扭曲成雙 螺旋并且通過互補核苷酸之間的氫鍵連接(A通過氫鍵結(jié)合相反的鏈中的T,C和相反鏈中 的G氫鍵結(jié)合)。沿著骨架的核苷酸堿基的序列可以攜帶豐富量的信息,并且可以包含巨大 部分的遺傳信息,如個體遺傳特征。
[0006] 分子生物學(xué)的中心法則通常是如下述描述生物學(xué)信息的正常流轉(zhuǎn):DNA可以復(fù)制 成DNA,DNA中的遺傳信息可以'轉(zhuǎn)錄'成RNA,如信使RNA ( "mRNA"),并且可以由mRNA中的 信息翻譯成蛋白。在翻譯過程中,使得蛋白亞基(氨基酸)以mRNA的序列并且最終以其所 轉(zhuǎn)錄的DNA所示的順序足夠接近以鍵合。這一過程涉及稱為tRNA( "轉(zhuǎn)運RNA")的氨基酸 適體RNA的堿基配對,在核糖體的存在,每個tRNA攜帶由其針對mRNA序列的序列決定的特 定的氨基酸,核糖體本身是在rRNA( "核糖體RNA")周圍構(gòu)建的蛋白復(fù)合物。通過這一過 程,遺傳DNA序列利用mRNA中間物和tRNA與rRNA組分指定了要組裝成多肽的氨基酸的序 列。
[0007] 術(shù)語核酸測序通常包括用于確定DNA或RNA分子中的核苷酸堿基(即,腺嘌呤、鳥 嘌呤、胞嘧啶和胸腺嘧啶)的順序的生物化學(xué)方法。DNA的序列組成細胞核、線粒體和葉綠 體中的遺傳性遺傳信息,其形成活生物體的發(fā)育程序的基礎(chǔ)。遺傳變異可能引起疾病,賦予 增加的疾病的危險或賦予有益的特性。這些變異可能是遺傳的(傳承自父母)或獲得性的 (成年時發(fā)育,如通過DNA復(fù)制中的錯誤發(fā)展)。因此,知曉這些遺傳分子的序列對于獲得 對生命、分子系統(tǒng)和疾病的更好的理解是特別重要的。
[0008] DNA分析最初被廣泛譽為DNA譜分析(DNA指紋),并且在1987年成為商業(yè)可用的, 那時化學(xué)公司Imperial Chemical Industries(ICI)在英格蘭開設(shè)了血液檢測中心。該技 術(shù)最先由英格蘭萊斯特大學(xué)的Sir Alec Jeffreys報道,現(xiàn)在成為數(shù)個國立DNA數(shù)據(jù)庫的 基礎(chǔ),包括美國的CODIS組。該技術(shù)利用稱為變數(shù)串聯(lián)重復(fù)序列(variable number tandem r印eats,VNTRs)的高度可變的重復(fù)("重復(fù)")序列,特別是短的串聯(lián)重復(fù)(short tandem r印eats,STRs)。VNTR基因座在血緣密切的人之間是非常相似的,但是如此可變,以致沒有 血緣關(guān)系的個體極不可能具有相同的VNTRs。擴增和隨后的擴增子的片段長度分析提供了 關(guān)于個體的身份或血緣關(guān)系的有力的遺傳信息。
[0009] DNA測序的出現(xiàn)已經(jīng)顯著加快了生物學(xué)研宄和發(fā)現(xiàn),并且將DNA測試的應(yīng)用從簡 單的概圖擴展到疾病診斷,甚至是疾病預(yù)測。利用現(xiàn)代DNA測序技術(shù)可獲得的快速的測序 速度已經(jīng)成為人類基因組計劃中的大規(guī)模測序人類基因組的手段。相關(guān)計劃已經(jīng)產(chǎn)生了多 種動物、植物、病毒和微生物基因組的完整的DNA序列。
[0010] RNA測序從技術(shù)原因上來講比DNA測序容易操作,其是最早的核苷酸測序形式之 一。溯及重組DNA之前的時代,RNA測序的主要里程碑是第一個完整的基因的序列,然后是 噬菌體MS2的完整的基因組,其由根特大學(xué)(比利時根特)的Walter Fiers與其同事在 1972-1976年鑒定并且公布。
[0011] 由Frederick Sanger與其同事在1975年開發(fā)的鏈終止方法是第一個大規(guī)模應(yīng)用 的DNA測序方法。在二十世紀七十年代早期由英格蘭的Sanger和哈佛的Walter Gilbert 與Allan Maxam開發(fā)快速DNA測序法之前,使用多種費力的方法,如由Gilbert和Maxam于 1973年提出的搖擺點分析(wandering-spot analysis),其報道了 24個堿基對的測序。
[0012] 在1976-1977年,Allan Maxam和Walter Gilbert基于DNA的化學(xué)修飾和后續(xù)在 特定堿基的切割開發(fā)了一種DNA測序法。該方法需要在DNA鏈的一個末端進行放射性或熒 光標記以及純化要測序的DNA片段。在四個核苷酸堿基中的一個處、有時在兩個處產(chǎn)生不 常見的斷點,并且這在四個反應(yīng)中重復(fù)(G,A+G,C,C+T)。這產(chǎn)生一系列標記的片段,在每個 分子中從放射性標記的末端到第一個'切割'位點,并且通過凝膠電泳按尺寸分離,其中四 種反應(yīng)并排排列。Maxam-Gilbert測序由于其技術(shù)復(fù)雜性、有害化學(xué)品的廣泛應(yīng)用和規(guī)模放 大的困難而不容易采用。另外,該方法不能容易地定制在標準分子生物學(xué)試劑盒中進行應(yīng) 用。
[0013] 鏈終止或Sanger法需要單鏈DNA模板、DNA引物、DNA聚合酶、放射性或熒光標記 的核苷酸,和修飾的核苷酸,即終止DNA鏈延長的雙脫氧核苷酸三磷酸(ddNTPs)。將DNA 樣品分到四個獨立的測序反應(yīng)中,每個反應(yīng)含有四種標準脫氧核苷酸(dATP,dGTP,dCTP 和dTTP)和DNA聚合酶。向這四種獨立的測序反應(yīng)的每一個中僅加入四種雙脫氧核苷酸 (ddATP,ddGTP,ddCTP或ddTTP)中的一種。這些雙脫氧核苷酸是鏈終止核苷酸,其缺少在 DNA鏈延伸過程中在兩個核苷酸之間形成磷酸二酯鍵所需要的3' -OH核糖基集團。因此, 在新生的(延長的)DNA鏈中摻加雙脫氧核苷酸終止DNA鏈延伸,產(chǎn)生多個不同長度的DNA 片段,這些片段中的每一個在雙脫氧核苷酸的結(jié)合位點終止。由此,如果已知雙脫氧核苷酸 的性質(zhì),則所產(chǎn)生的片段的長度將表示該雙脫氧堿基在序列中的位置。雙脫氧核苷酸以比 標準脫氧核苷酸低的濃度加入,以允許足夠序列分析的鏈延長。
[0014] 新合成和標記的DNA片段進行熱變性并在變性聚丙烯酰胺尿素凝膠上通過凝膠 電泳進行大?。ň哂袃H一個核苷酸的分辨率)分離。四種DNA合成反應(yīng)中的每一個在四個 單獨的泳道(泳道A,T,G,C)中的一個泳道中運行;然后,通過放射自顯影或紫外光顯現(xiàn) DNA條帶,且DNA序列可在X射線膠片或凝膠圖像直接讀出。將X射線膠片暴露于凝膠,并 且當顯色時,深色條帶對應(yīng)于不同長度的DNA片段。泳道中的深色條帶表示雙脫氧核苷酸 (ddATP、ddGTP、ddCTP或ddTTP)摻入之后鏈終止產(chǎn)生的DNA片段。末端核苷酸堿基可根據(jù) 在產(chǎn)生該條帶的反應(yīng)中添加了何種雙脫氧核苷酸進行鑒定。然后四個泳道中不同條帶的相 對位置用于讀?。◤牡撞恐另敳浚┧镜腄NA序列。
[0015] DNA片段可通過使用引物上的放射性標記物或熒光標記物,在新的DNA鏈中,用標 記的dNTP或用標記的ddNTP進行標記。鏈終止測序存在一些技術(shù)變通。在一個方法中,DNA 片段用含有用于放射性標記的放射性磷的核苷酸進行標記。備選地,在5'端用熒光染料 標記的引物用于標記。仍然需要四個單獨的反應(yīng),但是具有染料標記物的DNA片段可使用 光學(xué)系統(tǒng)讀出,有助于更快和更經(jīng)濟的分析和自動化。這種方法被稱為'染料-引物測序'。 由L Hood和同事后來開發(fā)的熒光標記的ddNTP和引物開創(chuàng)了自動化、高通量DNA測序的階 段。
[0016] 不同的鏈終止方法大大簡化了 DNA測序所需的工作量和計劃。例如,來自USB Biochemicals (USB生化藥劑)的基于鏈終止的"測序酶(Sequenase) "試劑盒包含測序所 需的大多數(shù)試劑,這些試劑是事先等分的且隨時可用的。用Sanger方法可出現(xiàn)一些測序問 題,諸如引物與DNA的非特異性結(jié)合,影響DNA序列的準確讀出。此外,DNA模板內(nèi)的二級結(jié) 構(gòu),或污染在DNA模板的隨機引發(fā)(priming)的RNA也可能影響所獲得序列的保真性。其 它影響反應(yīng)的污染物可由外來DNA或DNA聚合酶抑制劑組成。
[0017] 引物標記的替代是標記鏈終止子,其是通常被稱作'染料-終止子測序'的方法。 這種方法的一個主要優(yōu)勢是可在單個反應(yīng)中進行測序,而不是如在標記引物方法中的四個 反應(yīng)中進行測序。在染料終止子測序中,四種雙脫氧核苷酸鏈終止子的每種用不同的熒光 染料進行標記,每種熒光染料在不同的波長發(fā)熒光。這種方法有吸引力,因為它具有更大的 方便和速度,并且其是目前用計算機控制的序列分析儀(見下文)的自動化測序中的主要 方法。其潛在的限制包括由于染料標記的鏈終止子引入至DNA片段的不同而引起的染料效 應(yīng),其導(dǎo)致毛細管電泳后電子DNA序列示蹤色譜中的不等的峰高和形狀。
[0018] 在常規(guī)臨床中,核苷酸聚合物(DNA和RNA)的分析已經(jīng)變得重要起來。然而,成本 和復(fù)雜性仍然是廣泛全面采用的主要障礙。對此的一個原因是分析的復(fù)雜性,所述分析需 要能夠隨著實驗進行靈敏地測量至多四種不同的熒光通道的昂貴的裝置。其他原因包括 高的試劑成本,長久和復(fù)雜的樣品制備步驟和熟練的生物信息學(xué)家所具有的廣博的計算能 力,以將得到的短的讀取序列組裝成臨床相關(guān)的構(gòu)建體。較便宜的備選方案可能需要熟練 的技術(shù)人員來運行和解釋低等技術(shù)設(shè)備,如電泳,但是這也可能是昂貴的,并且不能產(chǎn)生足 夠的DNA數(shù)據(jù)用于高通量全基因組測序應(yīng)用。
[0019] 發(fā)明概述
[0020] 按照本發(fā)明的實施方案,公開了測序多種多核苷酸分子的新方法。在一些實施方 案中,所述方法可以用于解決復(fù)雜性、成本、時間和需要長讀取長度和高通量DNA測序的問 題。聯(lián)系本公開內(nèi)容應(yīng)用的多個實施方案旨在使用新型的測序技術(shù)在成本有效的裝置中進 行長讀取長度、高度平行的、單分子DNA測序。在一些技術(shù)實施方案中,本發(fā)明可以用于分 析DNA片段的長度。
[0021] 一些實施方案包括用于測序或分析多核苷酸分子的長度的裝置。在一些方面中, 所述裝置包括具有nm范圍內(nèi)尺寸的納米通道。在一些方面中,實施方案記述具有小于 3 ym的寬度和小于IOOnm的高度的通道。在一些實施方案中,所述通道直徑小于50nm。在 其他實施方案中,所述通道的直徑小于5nm ;并且納米結(jié)構(gòu)傳感器陣列與所述納米通道垂 直或平行排列,其在所述納米通道內(nèi)具有靈敏的測定區(qū)域,以致由多核酸分子的通過片段 (passing fragment)或單個堿基產(chǎn)生擾動。在一些實施方案中,每個堿基通過所述納米結(jié) 構(gòu)傳感器時直接導(dǎo)致所述傳感器產(chǎn)生的特異性的信號,或通過置換經(jīng)由所述靈敏的測定區(qū) 域的多核酸的離子而導(dǎo)致所述傳感器產(chǎn)生的特異性的信號,此時每個堿基將提供獨特的電 子特征。在一些方面中,所述納米結(jié)構(gòu)傳感器檢測電荷。在一些方面中,所述納米結(jié)構(gòu)檢測 高電荷結(jié)構(gòu)部分。在一些方面中,所述高電荷結(jié)構(gòu)部分是圖7A-G或圖8的結(jié)構(gòu)部分。在一 些方面中,所述納米結(jié)構(gòu)傳感器檢測緩沖液電位。在一些方面中,所述納米結(jié)構(gòu)傳感器檢測 熒光。在一些方面中,所述納