單核苷酸檢測方法
【專利說明】單核苷酸檢測方法
[0001] 本發(fā)明涉及一種用于表征多核苷酸如來源于天然存在的RNA或DNA的那些的方 法,所述方法是通過捕獲并檢測通過逐步焦磷酸解而由所述多核苷酸產生的單核苷酸堿基 的有序序列。
[0002] 遺傳物質的下一代測序已經對總體生物學和醫(yī)學產生巨大的影響,尤其是因為測 序的單位成本隨著越來越快的測序儀進入市場而直線下降。因此,在一種這樣的機器中,首 先將雙鏈DNA分析物分解為多個更小的多核苷酸片段,各個多核苷酸片段首先在一條鏈的 兩端被腺苷酸化(adenylate),使得單鏈第一寡核苷酸可以通過與未配對的腺噪呤堿基雜 交結合于其互補體(compliment)的兩端。然后將這樣獲得的處理的片段按大小進行選擇 并捕獲到用結合的單鏈第二寡核苷酸包被的表面上,所述單鏈第二寡核苷酸自身是第一個 的序列互補體,使得實質上,通過進一步雜交可以形成表面結合的雙鏈片段的文庫。在隨后 的聚類(clustering)步驟中,隨后使用延伸和等溫橋接反應將這些文庫組分在表面上克 隆擴增數(shù)百萬次,以利用未使用的第二寡核苷酸。這實質上產生了通過其一條鏈結合于表 面的稠密濃度的多核苷酸片段。然后除去各個片段的未結合的互補鏈,從而留下結合的單 鏈片段供測序使用。在測序階段,用引物引發(fā)(prime)這些單鏈片段中的每個并且通過使 用聚合酶鏈反應和雙脫氧核苷酸三磷酸(ddNTP)形式的DNA的四種特征核苷酸堿基的混合 物進行延伸來再產生其互補鏈。各個ddNTP類型用在不同波長發(fā)熒光的不同熒光團標記的 部分封端。然后延伸反應采用三步驟的循環(huán)形式;首先相關ddNTP被結合到生長的鏈中;接 下來通過照射樣品并檢測熒光的波長來鑒定其包含的核苷酸堿基,并且最后除去封端及其 相關熒光團從而允許接下來的延伸事件發(fā)生。通過這種方式,互補鏈的序列可以逐個堿基 地建立。將理解的是,雖然這種方法可以是高度自動化的并且可以產生高準確度的序列讀 取,但其運行速度受延伸循環(huán)速率的限制。因此,在實踐中,該技術的使用傾向于包括平行 處理相對短的多核苷酸片段和自由其獲得的各種讀取結果(reads)組裝整個序列。這本身 可能導致計算的復雜度并且可能引入錯誤。
[0003] 最近已經進行嘗試開發(fā)直接測序方法。例如,W0 2009/030953公開了一種新型快 速測序儀,其中尤其是,單鏈或雙鏈多核苷酸樣品(例如天然存在的RNA或DNA)中的核苷 酸堿基或堿基對的序列通過將其經由設置有并置在納米孔(nanopores)的出口內或附近 的等離子體納米結構(plasmonicnanostructures)的納米穿孔基板轉移來讀取。在該裝置 中,所述等離子體納米結構限定檢測窗(實質上是電磁場),在所述檢測窗內,通過與入射 光相互作用,各核苷酸堿基(優(yōu)選標記的)又被誘導從而以特征方式發(fā)熒光或拉曼散射光 子。隨后遠程檢測這樣產生的光子,多倍化(multiplexed)并轉化為數(shù)據(jù)流,其信息內容表 征為與多核苷酸相關的核苷酸堿基序列。然后可以使用被嵌入在被編寫入與其集成的微處 理器或與其連接的輔助計算裝置中的相應軟件中的計算算法將該序列由所述數(shù)據(jù)流復原。 關于使用等離子體納米結構和其相關共振特征的進一步背景可以在例如Adv.Mat. 2004, 叢(19)pp. 1685-1706 中找到。
[0004] 另一種快速測序多核苷酸的裝置在例如,US6627067,US6267872和US6746594 中描述。在其最簡單的形式中,該裝置使用電極替代等離子體納米結構,來限定跨過基板或 在納米孔出口中或納米孔出口周圍的檢測窗。隨后應用跨電極的電位差,并且測量作為多 核苷酸和相關電解質經由納米孔的電泳轉移的結果的電極之間流動的離子介質的電學特 性的改變,作為時間的函數(shù)。在該裝置中,因為多種個體核苷酸堿基通過檢測窗,它們連續(xù) 阻塞和開啟檢測窗,引起導致電流或電阻率的特征性波動的'事件'。然后這些波動用于產 生合適的數(shù)據(jù)流用于上述分析。
[0005] 穩(wěn)定小滴流(dropletstream),特別是微滴流(microdropletstream)的產生, 已經應用于分子生物學的技術的另一開發(fā)領域。例如,US7708949公開一種用于在油中 產生穩(wěn)定的水滴的新型微流體方法,同時例如US2011/0250597描述了使用該技術產生含 有核酸模板(通常是多核苷酸DNA或RNA片段)和使得能夠使用聚合酶鏈反應擴增所 述模板的多個引物對的微滴。其他與該領域相關的專利申請通常包括JP2004/290977, JP2004/351417,US2012/0122714,US2011/0000560,US2010/01376163,US2010/0022414 和 US2008/0003142。
[0006] W0 2004/002627公開了一種使用各種裝置產生液-液和氣-液分散體的方法,所 述方法包括在上游和下游微流體區(qū)域之間形成不連續(xù)部分。然而,未教導將其用于單核苷 酸DNA測序。
[0007] W0 2010/077859教導了一種小滴執(zhí)行器(actuator),其包括設置有電極的基板、 反應器通路和核苷酸堿基、洗滌緩沖液、樣品和酶儲庫(reservoirs)。雖然總體上該執(zhí)行器 被說成是用于擴增和測序核酸,但是沒有教導我們在下文描述的分析物降解方法。相反,其 涉及完全不同的方式;使用焦磷酸測序觀察分析物的互補鏈的合成。US2009/0280475涉 及類似的主題。
[0008] 生物探針,通常包含已知序列順序的長度小于1000個核苷酸的單鏈寡核苷酸,其 被廣泛用于分析分子生物學。這種探針通常通過在探針和靶標的核苷酸堿基之間存在足夠 的序列互補性時將其自身連接于靶標(例如源自天然存在的病原體的DNA的靶標)而起作 用。通常,這種探針的核苷酸用可檢測元件如放射性或熒光標志物標記,以使得當將探針用 于處理據(jù)信其中或其上已經捕獲有靶標的分析物溶液或基板時,通過尋找并檢測檢測元件 的特征檢測性質來表明所述靶標存在與否。
[0009] 此種探針中的一類的代表是本領域中被稱為'分子信標(beacon) '的物質,如例如 US8211644中所述的。這些探針由以下構成:已經實際上被回折于其自身上以形成充當探 針的感受器的殘留的單鏈環(huán)的單鏈寡核苷酸,和短莖(stem),其中臨近兩端的核苷酸通過 互補核苷酸堿基配對彼此結合;從而形成雙鏈區(qū)域。這種可以比作發(fā)夾的布置(其中單鏈 環(huán)連接于理論上的雙鏈寡核苷酸的同一端的互補鏈)是高度應變的。向所述寡核苷酸的3' 和5'自由端(現(xiàn)在彼此臨近并且在所述莖的遠端處)分別連接熒光團和猝滅劑。隨后其 彼此的幾何學接近保證無顯著熒光產生。在使用中,靶標結合于單鏈環(huán),產生額外的應變, 以致當加熱探針時,所述莖解鏈,從而導致熒光團和猝滅劑產生距離并使得前者發(fā)熒光。
[0010] 現(xiàn)在,我們已經開發(fā)了一種新型測序方法,在一個實施方案中,其包括通過逐步降 解分析物產生核苷酸堿基流,其排序表征分析物中的序列;并且隨后以使得其能夠被檢測 的方式捕獲各核苷酸堿基。
[0011] W0 94/18218公開了一種基因組測序儀,其中從分析物分離有序的單核苷酸流并 且之后將其包含在熒光增強固體基質中,在那里,使用激光激發(fā)各核苷酸并且檢測其特征 光譜發(fā)射。該測序儀使用的單核苷酸轉移法包括形成流動的不可混溶的液體的單個雙鞘 (dual-sheath),而不是一系列小滴。此外,所述測序儀試圖直接檢測單個核苷酸,而不是使 用我們描述的類型的捕獲系統(tǒng)和熒光團釋放方法。我們相信,這是一個缺點,因為它將導致 檢測發(fā)射時的信噪比問題。這將損害整體靈敏度并且因此有損測序儀本身的實用性。
[0012] Stephan等JournalofBiotechnology86 (2001)pp. 255-267 教導了用于計數(shù)通 過核酸外切降解用熒光團標記的固定的DNA樣品而產生的單核苷酸的一般方法。然而未提 供關于在產生的不同單核苷酸類型之間進行區(qū)分的信息。
[0013] 已經在http://www. mrc-lmb. cam. ac. uk/happy/HappyGroup/seq. html以圖解形 式公開了使用逐步核酸外切降解多核苷酸以產生單核苷酸堿基流,但是幾乎沒有提供關于 實際使用的方法學的信息。此外,W0 03/080861描述了一種測序方法,其中通過在用智能 染料標記的焦磷酸根陰離子的存在下進行焦磷酸解的方式將DNA分析物按順序降解為有 序的單核苷酸流。在一個實例中,焦磷酸根陰離子用染料JF-4標記,所述染料具有不同熒 光壽命,這取決于其連接的特定核苷酸類型。然后通過激光激發(fā)標記的單核苷酸流并且利 用光譜法進行分析,從而確定核苷酸的性質并因此確定核苷酸的排序。再一次,單核苷酸被 直接檢測,而不是通過使用我們所描述的捕獲系統(tǒng)和熒光團釋放方法。因此,據(jù)信,該方法 也會導致信噪比問題并且因此導致靈敏度問題。
[0014] 根據(jù)本發(fā)明,因此提供一種用于確定多核苷酸分析物中核苷酸堿基的序列的方 法,其特征在于以下步驟:(1)通過焦磷酸解由所述分析物產生單核苷酸堿基流;(2)通過 將各單核苷酸堿基與用處于不可檢測狀態(tài)的可檢測元件標記的捕獲系統(tǒng)反應產生捕獲的 分子;(3)從各捕獲的分子釋放處于可檢測狀態(tài)的可檢測元件;和(4)檢測這樣釋放的可檢 測元件并且由其確定核苷酸堿基的序列。
[0015] 本發(fā)明方法的步驟(1)包括通過焦磷酸解由多核苷酸分析物產生單核苷酸堿基 流。用于該步驟的分析物適當?shù)厥怯珊芏嗪塑账釅A基構成的雙鏈多核苷酸。原則上,所述 多核苷酸的長度可以是不受限的,包括多至在人基因組片段中發(fā)現(xiàn)的很多數(shù)百萬的核苷酸 堿基。分析物本身適當?shù)厥翘烊粊碓吹腞NA或DNA,但是所述方法也可以用于對合成制備 的RNA或DNA或全部或部分由在自然中通常遇不到的核苷酸堿基(即除了腺嘌呤、胸腺 嘧啶、鳥嘌呤、胸腺嘧啶和尿嘧啶之外的核苷酸堿基)