專利名稱:用于納米孔解鏈依賴性核酸測(cè)序的工具和方法
用于納米孔解鏈依賴性核酸測(cè)序的工具和方法相關(guān)申請(qǐng)的交叉引用本申請(qǐng)?jiān)?5U.S.C. § 119(e)下要求2010年3月30日提交的美國(guó)臨時(shí)申請(qǐng)No. 61/318,872的權(quán)益,所述文獻(xiàn)的內(nèi)容通過引用的方式完整地并入本文。政府資助本發(fā)明在美國(guó)政府支持下在美國(guó)國(guó)家健康研究所資助的合同號(hào)R01-HG004128下做出。美國(guó)政府在本發(fā)明中持有某些權(quán)利。
背景技術(shù):
納米孔測(cè)序法是作為常規(guī)Sanger測(cè)序方法的便宜和快速替代技術(shù)所開發(fā)的一項(xiàng)有前景技術(shù)。納米孔測(cè)序方法可以提供勝過常規(guī)Sanger測(cè)序方法的幾個(gè)優(yōu)點(diǎn);它們?cè)试S單分子分析,不是酶依賴性的(例如,對(duì)于鏈延長(zhǎng)不需要聚合酶)并且需要明顯較少的試劑。最近已經(jīng)提出許多基于納米孔的DNA測(cè)序方法14并且凸顯出兩個(gè)主要難題15 I)在各個(gè)核苷酸(nt)之間區(qū)分的能力,例如,該系統(tǒng)必須能夠在單分子水平區(qū)別4種堿基,和2)這種方法必須能夠平行讀出。在基于納米孔的DNA測(cè)序方法中,以往難以按比例縮小DNA分析至單分子水平,這主要因構(gòu)成DNA的4種核苷酸之間相對(duì)小的差異所致和因單分子探測(cè)時(shí)的內(nèi)在噪聲所致。由一些人采用以克服這些問題的手段是相對(duì)于產(chǎn)生明顯大于背景噪聲水平的可度量信號(hào)的不同實(shí)體而’放大"DNA的各個(gè)堿基的每一種,從而增加信噪比。這由一個(gè)初始制備步驟實(shí)現(xiàn),所述初始制備步驟將待分析的DNA分子轉(zhuǎn)化成較長(zhǎng)和周期性結(jié)構(gòu)化的DNA分子(命名為“設(shè)計(jì)聚合物)”17’29’3°。目前,存在兩種在“檢測(cè)”或測(cè)量DNA各個(gè)堿基的基于納米孔的DNA測(cè)序方法中所用的一般方法1)當(dāng)DNA進(jìn)入并通過孔時(shí),監(jiān)測(cè)孔導(dǎo)電性的變化,孔導(dǎo)電性的變化可以直接測(cè)量,例如,使用靜電計(jì);和2)在不同分子信標(biāo)由必須小到足以排除雙鏈DNA但仍將允許單鏈DNA進(jìn)入和移位的納米孔解鏈時(shí),對(duì)它們進(jìn)行光學(xué)地檢測(cè)。在第一種方法中,大體積基團(tuán)與核苷酸的堿基連接以增加當(dāng)雙鏈DNA經(jīng)過納米孔移位時(shí)所生成用于檢測(cè)的電子阻斷信號(hào)并且使其不同32。在第二種方法中,首先通過將DNA序列中的每種和每個(gè)堿基系統(tǒng)地置換為特定順序的級(jí)聯(lián)寡核苷酸對(duì),將這種DNA轉(zhuǎn)化成擴(kuò)展的數(shù)字化形式29,31 (圖I)。存在每種不同堿基(例如,A、T、U、G或C)的寡核苷酸的特定種類。轉(zhuǎn)化的DNA與互補(bǔ)性分子信標(biāo)雜交以形成雙鏈DNA。存在每種不同堿基(例如,A、T、U、G或C)的分子信標(biāo)互補(bǔ)性寡核苷酸的不同種類。出于鑒定目的,將這些不同種類的分子信標(biāo)區(qū)別性地標(biāo)記,例如,用于4個(gè)種類分子信標(biāo)的4種不同熒光團(tuán)。為檢測(cè)DNA的序列,隨后使用小于2nm的納米孔以依次地使信標(biāo)從包含分子信標(biāo)的雙鏈DNA (dsDNA)中解鏈。對(duì)于每個(gè)解鏈?zhǔn)录粋€(gè)新熒光團(tuán)是未猝滅的,從而產(chǎn)生不同顏色的一系列光子閃光(photon flash),這些光子閃光由(XD照相機(jī)記錄(圖2)。解鏈過程以電壓依賴性方式將DNA經(jīng)過孔的移位延緩到與光學(xué)記錄相容的速率。依賴于標(biāo)記dsDNA的納米孔解鏈的DNA測(cè)序的一個(gè)限制性因素是納米孔的孔不得不小到足以撬開雙鏈結(jié)構(gòu),直徑通常小于2nm。目前,存在兩種制備納米孔用于核酸分析的一般方法(I)從天然存在分子制備的有機(jī)納米孔,如α-溶血素孔。雖然有機(jī)納米孔常用于DNA分析,但是有機(jī)納米孔對(duì)于單個(gè)DNA測(cè)序而言是大的并且不易適應(yīng)于同時(shí)需要許多納米孔的高通量DNA測(cè)序。(2)由多項(xiàng)常規(guī)和非常規(guī)制造技術(shù)產(chǎn)生的合成固態(tài)納米孔。合成制造的納米孔具有用于同時(shí)需要許多納米孔的高通量DNA測(cè)序的更大潛力。依賴于標(biāo)記dsDNA的納米孔解鏈的DNA測(cè)序的另一個(gè)限制性因素是單納米孔可以一次僅探測(cè)單個(gè)分子。使用基于納米孔的測(cè)序方法,開發(fā)快速、高通量基因組測(cè)序?qū)⑿枰{米孔陣列和同時(shí)監(jiān)測(cè)納米孔。雖然納米孔的制造可以產(chǎn)生大量合成納米孔,但是以均一恒定的質(zhì)量制造具有很小孔的納米孔是困難的。在基于納米孔的解鏈測(cè)序方法中允許使用孔徑略微較大的納米孔的替代性策略是合乎需要的。發(fā)明概述本發(fā)明的實(shí)施方案基于以下發(fā)現(xiàn)將調(diào)節(jié)基團(tuán)與納米孔解鏈依賴性核酸測(cè)序中使用的部分如分子信標(biāo)(MB)連接使利用孔比標(biāo)準(zhǔn)雙鏈核酸寬度(約2. 2nm)更大的納米孔成為可能。對(duì)于納米孔解鏈依賴性測(cè)序,約I. 5-2. Onm的孔徑僅允許單鏈核酸在電場(chǎng)中經(jīng)過該孔的開口移位。這實(shí)質(zhì)上迫使與納米孔接觸的雙鏈核酸發(fā)生鏈分開,這個(gè)過程常叫作“解鏈”。伴隨這種常規(guī)方法的問題是,納米孔尺寸限于小于雙鏈核酸寬度的孔徑。大規(guī)模制造具有均一孔徑的小尺寸納米孔是困難的。與MB連接的調(diào)節(jié)基團(tuán)對(duì)MB增加體積并且允許改造常規(guī)方法以使用具有較大孔徑的納米孔。雙鏈核酸通過單鏈核酸和其上各自連接有大體積調(diào)節(jié)基團(tuán)的多種MB雜交而形成。MB上大體積調(diào)節(jié)基團(tuán)的存在起到以下作用將雙鏈核酸在大體積基團(tuán)與MB連接的點(diǎn)處的寬度(見圖9)增加到比標(biāo)準(zhǔn)雙鏈核酸的寬度更大的寬度。大于2. Onm但小于雙鏈核酸在大體積基團(tuán)與MB連接的點(diǎn)處的寬度的較大孔可以用來在測(cè)序過程中使包含連接大體積基團(tuán)的MB的雙鏈核酸解鏈。這類構(gòu)造的較大孔仍能夠僅允許單鏈核酸在電場(chǎng)中經(jīng)過該孔的開口移位。這類構(gòu)造的較大孔通過防止連接有大體積基團(tuán)的MB在電場(chǎng)中經(jīng)過該孔的開口移位而實(shí)現(xiàn)這一點(diǎn),因?yàn)樵摽仔∮陔p鏈核酸在大體積基團(tuán)與MB連接的點(diǎn)處的寬度(D3,見圖9)。這導(dǎo)致雙鏈核酸的鏈分開,正如鏈分開將在標(biāo)準(zhǔn)雙鏈核酸和約I. 5-2. Onm納米孔尺寸的情況下,即,在不存在連接有大體積基團(tuán)的MB的情況下發(fā)生那樣。沒有在其上連接的大體積調(diào)節(jié)基團(tuán)的標(biāo)準(zhǔn)雙鏈核酸將具有大約2. 2nm的寬度。如本文所用并且除非另外說明,否則以下每個(gè)術(shù)語應(yīng)當(dāng)具有下文所述的定義。“納米孔”例如包括一種結(jié)構(gòu),所述結(jié)構(gòu)包含(a)由物理屏障分隔的第一區(qū)室和第二區(qū)室,所述屏障具有直徑例如約Inm至IOnm的至少一個(gè)孔,和(b)用于跨屏障施加電場(chǎng)的裝置,從而帶電分子如DNA可以從第一區(qū)室經(jīng)過所述孔進(jìn)入第二區(qū)室。納米孔理想地進(jìn)一步包含一種裝置,所述裝置用于測(cè)量通過納米孔屏障的分子的電子簽章(electronicsignature)。在一個(gè)實(shí)施方案中,納米孔屏障是合成的,即,由合成材料制成或是合成產(chǎn)生的納米孔。在一個(gè)實(shí)施方案中,納米孔屏障是部分合成存在的。在一個(gè)實(shí)施方案中,納米孔屏障是天然的,即,由天然材料制成或是天然存在的屏障。在一個(gè)實(shí)施方案中,納米孔屏障是部分天然存在的。屏障可以包括,例如,內(nèi)有α-溶血素、寡聚蛋白質(zhì)通道如孔蛋白(porin)和合成肽等的脂質(zhì)雙層。在一個(gè)實(shí)施方案中,納米孔屏障也可以包括具有大小合適的一個(gè)或多個(gè)孔的無機(jī)平板。在一些實(shí)施方案中,納米孔屏障包含有機(jī)材料和/或無機(jī)材料。在一些實(shí)施方案中,納米孔屏障包含有機(jī)材料和/或無機(jī)材料或者合成材料或天然存在材料的修飾形式。本文中,“納米孔”和納米孔屏障中的“孔”互換地使用。如本文所用,術(shù)語“包含”意指除了提出的限定要素之外,其他要素也可以存在?!鞍钡挠猛颈砻靼ǘ窍拗?。指示如本文所述的文庫(kù)、方法和及其相應(yīng)組分時(shí),術(shù)語“由……組成”意指排除在實(shí)施方案的這個(gè)描述中沒有提到的任何要素或組分。如本文所用的術(shù)語“基本由……組成”指給定實(shí)施方案所要求的那些要素。該術(shù)語允許不實(shí)質(zhì)影響本發(fā)明的這個(gè)實(shí)施方案的基本和新的或功能特征的要素存在。如本文所用,術(shù)語“核酸”應(yīng)當(dāng)意指任何核酸分子,包括而不限于DNA、RNA及其雜交分子或類似物。形成核酸分子的核酸堿基可以是堿基A、C、G、T和U以及其衍生物。這些堿基的衍生物是本領(lǐng)域熟知的。核酸是由單體核苷酸的鏈組成的大分子。在一些實(shí)施方案中,核酸是脫氧核糖核酸(DNA)和核糖核酸(RNA)。在其他實(shí)施方案中,核酸是人工核酸如肽核酸(PNA)、M0rph0lin0、鎖核酸(LNA)、二醇核酸(GNA)和蘇糖核酸(TM)。這些核酸的每一種因分子主鏈的改變與天然存在的DNA或RNA區(qū)別。如本文所用,術(shù)語“寡核苷酸”是任何長(zhǎng)度的核苷酸聚合物形式。通常,核苷酸單元的數(shù)目可以是約2至100,并且優(yōu)選地約2至30或50至80。在一個(gè)實(shí)施方案中,本文所述的MB的寡核苷酸是4-25個(gè)核苷酸長(zhǎng)度。在本文所述的MB文庫(kù)和方法的背景下術(shù)語“寡核苷酸”指以特定順序連接在一起的多個(gè)天然存在、非天然存在、通常已知或合成的核苷酸,如二醇核酸(GNA)、鎖核酸(LNA)、肽核酸(PNA)、蘇糖核酸(TNA)和磷酰二胺嗎啉代寡聚物(PMO/Morpholino) 它們可以具有任意長(zhǎng)度,在其3’末端和/或5’末端經(jīng)修飾或未修飾。在一個(gè)實(shí)施方案中,“寡核苷酸”指DNA或RNA。如本文所用,在本文所述方法的背景下使用時(shí),術(shù)語“包含代表A、U、T、C或G的定義序列的聚合物”指包含“嵌段序列”的聚合物,其中每個(gè)嵌段序列單獨(dú)或組合地代表核苷酸堿基A、U、T、C或G。在一個(gè)實(shí)施方案中,術(shù)語“代表A、U、T、C或G的定義序列”指包含“嵌段序列”的聚合物,其中每個(gè)嵌段序列單獨(dú)或組合地代表核苷酸堿基A、U、T、C或G。如本文所用,在包含代表A、U、T、C或G的定義序列的聚合物的背景下使用時(shí),“嵌段序列”指具有特定序列的4-35個(gè)核苷酸的短核酸,所述短核酸單獨(dú)或與另一個(gè)嵌段序列組合時(shí)代表A、U、T、C或G。例如,ATTTGGAAT是嵌段-O并且TTCCGAGGT是另一個(gè)嵌段_1。嵌段01的組合是ATTTGGAAT-TTCCGAGGT(SEQ ID. NO. I)和它代表核苷酸堿基A。在實(shí)施本文所述的本發(fā)明實(shí)施方案時(shí),可以使用與任何部分連接的調(diào)節(jié)基團(tuán)。一種示例性部分是分子信標(biāo)。其他部分包括但不限于DNA、RNA和肽。本文所述的本發(fā)明實(shí)施方案的應(yīng)用包括但不限于使用適配子的蛋白質(zhì)分析或檢測(cè)。對(duì)于蛋白質(zhì)檢測(cè)中的應(yīng)用,納米孔可以與用于特定蛋白質(zhì)分析的部分(例如,特定蛋白質(zhì)部分)組合。然而,出于說明本發(fā)明目的,本文所述的部分是MB。這種說明不應(yīng)當(dāng)以任何方式解釋為這個(gè)部分僅限于MB。因此,本文中提供了一種用于納米孔解鏈依賴性核酸測(cè)序的分子信標(biāo)(MB)文庫(kù),所述文庫(kù)包含多種MB,其中每種MB包含寡核苷酸,所述寡核苷酸包含(I)可檢測(cè)標(biāo)記;(2)可檢測(cè)標(biāo)記封阻劑;和(3)調(diào)節(jié)基團(tuán);其中所述MB能夠與代表單鏈核酸中A、U、T、C或G核苷酸的定義序列進(jìn)行序列特異性互補(bǔ)雜交以形成雙鏈(ds)核酸。在一個(gè)實(shí)施方案中,本文中提供了一種使雙鏈(ds)核酸解鏈用于納米孔解鏈依賴性核酸測(cè)序的方法,所述方法包括(a)將本文所述的分子信標(biāo)(MB)文庫(kù)與待測(cè)序的單鏈核酸雜交,從而形成具有寬度D3的雙鏈(ds)核酸,所述雙鏈核酸因調(diào)節(jié)基團(tuán)在MB上的存在而形成,其中所述待測(cè)序的單鏈核酸是包含代表A、U、T、C或G的定義序列的聚合物;(b)使步驟a)中形成的雙鏈核酸與具有寬度Dl的納米孔開口接觸,其中D3大于Dl ;并且(c)施加跨納米孔的電勢(shì)以使雜交的MB與待測(cè)序的單鏈核酸解鏈。由跨納米孔的電勢(shì)產(chǎn)生的電場(chǎng)引起雙鏈核酸從納米孔的一個(gè)區(qū)室經(jīng)過納米孔移位至另一個(gè)區(qū)室。在移位過程期間,MB在進(jìn)入納米孔時(shí)從雙鏈核酸剝離,原因是連接有大體積基團(tuán)的MB太大(即,太寬),以至于不能隨互補(bǔ)雜交的單鏈核酸一起經(jīng)過該孔移位。在另一個(gè)實(shí)施方案中,本文中提供了一種用于測(cè)定核酸的核苷酸序列的方法,所述方法包括以下步驟(a)將本文所述的分子信標(biāo)(MB)文庫(kù)與待測(cè)序的單鏈核酸雜交,從而形成具有寬度D3的雙鏈(ds)核酸,所述雙鏈核酸因調(diào)節(jié)基團(tuán)在MB上的存在而形成,其中所述待測(cè)序的單鏈核酸是包含代表A、U、T、C或G的定義序列的聚合物;(b)使步驟a)中形成的雙鏈核酸與具有寬度Dl的納米孔開口接觸,其中D3大于Dl ;(c)施加跨納米孔的電勢(shì)以使雜交的MB與待測(cè)序的單鏈核酸解鏈;并且(d)當(dāng)MB在所述孔處與雙鏈核酸分開時(shí),檢測(cè)由可檢測(cè)標(biāo)記從每種MB發(fā)射的信號(hào)。由跨納米孔的電勢(shì)產(chǎn)生的電場(chǎng)引起雙鏈核酸從納米孔的一個(gè)區(qū)室經(jīng)過納米孔移位至另一個(gè)區(qū)室。在移位過程期間,MB在進(jìn)入納米孔時(shí)從雙鏈核酸剝離,原因是連接有大體積基團(tuán)的MB太大(即,太寬),以至于不能隨互補(bǔ)雜交的單鏈核酸一起經(jīng)過該孔移位。在一個(gè)實(shí)施方案中,用于測(cè)定核酸的核苷酸序列的方法進(jìn)一步包括將一串檢測(cè)到的信號(hào)解碼成正在測(cè)序的核酸的核苷酸堿基序列。在一個(gè)實(shí)施方案中,MB的寡核苷酸包含兩個(gè)親和臂。在一些實(shí)施方案中,MB的寡核苷酸包含5’親和臂和3’親和臂。親和臂是具有互補(bǔ)序列并且在條件有利于雜交時(shí)可以雜交的寡核苷酸的部分。在一個(gè)實(shí)施方案中,MB的寡核苷酸包含4-60個(gè)核苷酸。在一個(gè)實(shí)施方案中,寡核苷酸是聚合物。在一個(gè)實(shí)施方案中,這種聚合物包含4-60個(gè)核苷酸、核堿基或單體。在一個(gè)實(shí)施方案中,單體是核苷酸及其類似物,例如,去羥肌苷、阿糖腺苷、阿糖胞苷、恩曲他濱、拉米夫定、扎西他濱、阿巴卡韋、恩替卡韋、司他夫定、替比夫定、齊多夫定、碘苷和曲氟尿苷。在一個(gè)實(shí)施方案中,一些核苷酸、核堿基或單體可以出于與可檢測(cè)標(biāo)記、可檢測(cè)標(biāo)記封阻劑、調(diào)節(jié)基團(tuán)(例如,硫代-dT (thiol-dT))偶聯(lián)的目的進(jìn)行修飾。在一個(gè)實(shí)施方案中,MB的寡核苷酸包含選自脫氧核糖核酸(DNA)、核糖核酸(RNA)、二醇核酸(GNA)、鎖核酸(LNA)、肽核酸(PNA)、蘇糖核酸(TNA)和磷酰二胺嗎啉代寡聚物(PMO/Morpholino)的核酸。在一個(gè)實(shí)施方案中,寡核苷酸的單體選自脫氧核糖核酸(DNA)、核糖核酸(RNA)、二醇核酸(GNA)、肽核酸(PNA)、鎖核酸(LNA)、蘇糖核酸(TNA)和(PMO/Morpholino)。在另一個(gè)實(shí)施方案中,MB的寡核苷酸是嵌合寡核苷酸,即,包含DNA、RNA、GNA、PNA、LNA、TNA 和 Morpholino 的混合物或組合,例如,(DNA+RNA)、(GNA+RNA)、(LNA+DNA)、(PNA+DNA+RNA)等。在一個(gè)實(shí)施方案中,MB的寡核苷酸包含一對(duì)“臂”。在一個(gè)實(shí)施方案中,MB的寡核苷酸包含5’臂和3'臂,優(yōu)選地5’熒光團(tuán)臂和3’猝滅劑臂。在這個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記是在5’熒光團(tuán)臂上存在的熒光團(tuán)并且可檢測(cè)標(biāo)記封阻劑是在MB的3’猝滅劑臂上存在
8的猝滅劑。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記連接在MB的寡核苷酸的一個(gè)末端上并且處于在文庫(kù)中全部MB的寡核苷酸的相同末端上。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記發(fā)射當(dāng)可檢測(cè)標(biāo)記不受封阻劑抑制時(shí)被檢測(cè)和/或測(cè)量的信號(hào)。在一個(gè)實(shí)施方案中,文庫(kù)的MB不與固相載體連接。在一個(gè)實(shí)施方案中,文庫(kù)的MB游離于溶液中。在一個(gè)實(shí)施方案中,文庫(kù)中MB的寡核苷酸上的可檢測(cè)標(biāo)記、可檢測(cè)標(biāo)記封阻劑和調(diào)節(jié)基團(tuán)不干擾MB與代表單鏈核酸中A、U、T、C或G核苷酸的定義序列進(jìn)行序列特異性互補(bǔ)雜交。在一個(gè)實(shí)施方案中,光學(xué)地檢測(cè)可檢測(cè)基團(tuán)的信號(hào),例如,通過光強(qiáng)度、發(fā)射的光的顏色或熒光等。在一個(gè)實(shí)施方案中,可檢測(cè)基團(tuán)是熒光團(tuán)并且信號(hào)是熒光。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑是突光團(tuán)的粹滅劑。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑還是調(diào)節(jié)基團(tuán)。換而言之,MB上的可檢測(cè)標(biāo)記封阻劑和調(diào)節(jié)基團(tuán)是相同的分子。換而言之,MB上的可檢測(cè)標(biāo)記封阻劑也作為調(diào)節(jié)基團(tuán)發(fā)揮作用。在一個(gè)實(shí)施方案中,MB的寡核苷酸上的調(diào)節(jié)基團(tuán)增加因此與其形成的雙鏈核酸在所述調(diào)節(jié)基團(tuán)與MB寡核苷酸連接的點(diǎn)處的寬度到大于2. O納米(nm),其中通過MB與代表A、U、T、C或G的定義序列雜交形成所述雙鏈核酸(見圖9)。在一個(gè)實(shí)施方案中,MB的寡核苷酸上的調(diào)節(jié)基團(tuán)增加因此與其形成的雙鏈核酸在所述調(diào)節(jié)基團(tuán)與MB寡核苷酸連接的點(diǎn)處的寬度到大于2. 2nm,其中通過MB與代表A、U、T、C或G的定義序列雜交形成所述雙鏈核酸(見圖9)。在一個(gè)實(shí)施方案中,MB的寡核苷酸上的調(diào)節(jié)基團(tuán)增加因此與其形成的雙鏈核酸的D2到大于2. Onm(見圖9)。在一個(gè)實(shí)施方案中,MB的寡核苷酸上的調(diào)節(jié)基團(tuán)增加因此與其形成的雙鏈核酸的D2到大于2. 2nm(見圖9)。在一個(gè)實(shí)施方案中,MB的寡核苷酸上的調(diào)節(jié)基團(tuán)增加因此與其形成的雙鏈核酸的寬度到大于2. Onm。在一個(gè)實(shí)施方案中,MB的寡核苷酸上的調(diào)節(jié)基團(tuán)增加因此與其形成的雙鏈核酸的寬度到大于2. 2nm。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)連接在MB的寡核苷酸的5’末端或3’末端處。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)在距離本文所述文庫(kù)中MB的寡核苷酸的3’或5’末端的3-7個(gè)核苷酸內(nèi)部連接。在另一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)在距離本文所述文庫(kù)中MB的寡核苷酸的3’或5’末端的1-7個(gè)核苷酸內(nèi)部連接。在一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與本文所述文庫(kù)中MB的寡核苷酸連接的點(diǎn)處的寬度是約3-7nm。在另一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與MB寡核苷酸連接的點(diǎn)處的寬度是約3-5nm。在一個(gè)實(shí)施方案中,文庫(kù)的MB的寡核苷酸上的調(diào)節(jié)基團(tuán)選自但不限于納米級(jí)粒子、蛋白質(zhì)分子、有機(jī)金屬粒子、金屬粒子和半導(dǎo)體粒子。在另一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)大于2nm的任何分子,所述分子不是納米級(jí)粒子、蛋白質(zhì)分子、有機(jī)金屬粒子、金屬粒子或半導(dǎo)體粒子。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是3_5nm。在一個(gè)實(shí)施方案中,當(dāng)核酸經(jīng)歷納米孔測(cè)序并且雙鏈核酸包含本文所述文庫(kù)的MB時(shí),MB的寡核苷酸上的調(diào)節(jié)基團(tuán)促進(jìn)雙鏈核酸解鏈。在一個(gè)實(shí)施方案中,本文所述的文庫(kù)包含兩種或更多種類的MB,其中MB的每個(gè)種類具有不同的可檢測(cè)標(biāo)記。在一個(gè)實(shí)施方案中,每個(gè)種類的MB互補(bǔ)物與獨(dú)特核酸序列雜交。在本文所述方法的一個(gè)實(shí)施方案中,納米孔尺寸允許待測(cè)序的單鏈核酸通過所述孔,但是不允許包含本文所述文庫(kù)的MB的雙鏈核酸通過所述孔。在本文所述方法的一個(gè)實(shí)施方案中,納米孔尺寸允許單鏈核酸經(jīng)所述孔移位,但是不允許包含本文所述文庫(kù)的MB的雙鏈核酸經(jīng)所述孔移位。在本文所述方法的一個(gè)實(shí)施方案中,孔大于2nm。在本文所述方法的另一個(gè)實(shí)施方案中,孔大于2. 2nm。在一個(gè)實(shí)施方案中,孔大于2nm但是小于雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度(D3)。在一個(gè)實(shí)施方案中,孔大于2. 2nm但是小于雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度(D3)。在本文所述方法的另一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度(D3)大于2. 2nm。在本文所述方法的一個(gè)實(shí)施方案中,Dl (孔的寬度)大于2nm。在另一個(gè)實(shí)施方案中,Dl大于2. 2nm。在本文所述方法的一個(gè)實(shí)施方案中,Dl是3_6nm。在本文所述方法的一個(gè)實(shí)施方案中,D3,雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度,大于2nm。在另一個(gè)實(shí)施方案中,D3大于2. 2nm。在本文所述方法的一個(gè)實(shí)施方案中,D3是約3_7nm。在本文所述方法的一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度(D3)是約3-5nm。在本文所述方法的一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度(D3)大于納米孔的開口寬度(Dl),因而當(dāng)雙鏈核酸試圖在電場(chǎng)的影響下通過納米孔的開口時(shí),調(diào)節(jié)基團(tuán)封阻雙鏈核酸上的MB寡核苷酸進(jìn)入所述開口,導(dǎo)致鏈分開,并且MB的寡核苷酸從雙鏈核酸中解鏈,同時(shí)單鏈核酸通過所述孔。在本文所述方法的一個(gè)實(shí)施方案中,雜交的單鏈核酸和MB之間的結(jié)合親和力小于MB的調(diào)節(jié)基團(tuán)和寡核苷酸的結(jié)合親和力,因而當(dāng)雙鏈核酸試圖在電場(chǎng)影響下通過納米孔的開口時(shí),單鏈核酸和MB之間的鍵而不是MB的調(diào)節(jié)基團(tuán)和寡核苷酸之間的鍵破壞。在一個(gè)實(shí)施方案中,單鏈核酸和MB之間的鍵是非共價(jià)的氫鍵。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)和MB的寡核苷酸之間的鍵是共價(jià)鍵。在一個(gè)實(shí)施方案中,單鏈核酸和MB之間的鍵是非共價(jià)的氫鍵,并且調(diào)節(jié)基團(tuán)和MB的寡核苷酸之間的鍵是非共價(jià)鍵如離子相互作用和疏水相互作用。在一個(gè)實(shí)施方案中,雜交的單鏈核酸和MB之間的氫鍵弱于調(diào)節(jié)基團(tuán)和MB的寡核苷酸之間的離子相互作用和/或疏水相互作用。在本文所述方法的一個(gè)實(shí)施方案中,待測(cè)序的核酸是DNA或RNA。附圖簡(jiǎn)述圖Ia是DNA解鏈依賴性測(cè)序方法學(xué)中兩個(gè)步驟的示意性說明。首先,將靶DNA序列的每種核苷酸以本體生物化學(xué)(bulk biochemical conversion)方式轉(zhuǎn)化成具有已知序列的已知寡核苷酸,隨后與分子信標(biāo)雜交。DNA/信標(biāo)復(fù)合物經(jīng)過納米孔的線性化允許光學(xué)檢測(cè)靶DNA序列。圖Ib是平行讀出方案的示意性說明。每個(gè)孔在EM-CCD的視域中具有特定位置并且因此使同時(shí)讀出納米孔的陣列成為可能。圖2a顯示環(huán)狀DNA轉(zhuǎn)化方法(OTC)的3個(gè)步驟。5’模板末端核苷酸及其代碼是顏色編碼的“C” -紫、“A” -灰、“T” -紅和“G” -藍(lán)。顏色已經(jīng)在此變成灰度級(jí)。圖2b顯示在⑶C方法后分析轉(zhuǎn)化的DNA。左小圖變性凝膠顯示探針與全部4種模板成功連接。泳道A、T、C和G指4種模板的相應(yīng)5’末端核苷酸,而R是含有長(zhǎng)度100-nt和150-nt的兩種ssDNA分子的參考泳道。右小圖使用序列特異性熒光寡核苷酸,該凝膠顯示,全部4種模板的第一個(gè)核苷酸均成功被轉(zhuǎn)化并且沒有副產(chǎn)物從這個(gè)過程中產(chǎn)生。圖3a顯示在大體積基團(tuán)解鏈實(shí)驗(yàn)的電學(xué)/光學(xué)檢測(cè)中利用亞5nm孔使I比特復(fù)合物和2比特復(fù)合物解鏈的代表性事件。電流在每幅小圖頂部上的黑色跡線中,而光信號(hào)是每幅小圖中的下部淺灰色跡線,上部小圖顯示I比特樣品的跡線并且下部小圖分別顯示2比特樣品的跡線。圖3b顯示柱狀圖(每份樣品,n>600),所述柱狀圖表明I比特樣品中的大部分復(fù)合物(深灰色)產(chǎn)生一個(gè)光子爆發(fā),而2比特樣品中的大部分復(fù)合物(淺灰色)產(chǎn)生兩個(gè)光子爆發(fā)。圖3c顯示與圖3b相似但是轉(zhuǎn)換成(binned)成一個(gè)爆發(fā)脈沖、兩個(gè)爆發(fā)脈沖和3+爆發(fā)脈沖的那些實(shí)驗(yàn)的柱狀圖。圖4a顯示采用A647 (紅色)和A680 (藍(lán)色)熒光團(tuán)的兩個(gè)解鏈實(shí)驗(yàn)所獲得的累積光子強(qiáng)度。數(shù)據(jù)的顏色已經(jīng)在此變成灰度級(jí)。在每個(gè)通道中觀察到一個(gè)單一凸出峰,表示如EM-C⑶上成像的孔位置。R值(通道I對(duì)通道2中所測(cè)量的熒光強(qiáng)度的比率)對(duì)于兩種突光團(tuán)而目是O. 2和O. 4。圖4b顯示伴隨A647 (頂部)和A680 (底部)的代表性解鏈?zhǔn)录碾娦盘?hào)/光信號(hào)。圖4c顯示每份樣品的累積上百條跡線針對(duì)A647和A680分別產(chǎn)生R=O. 20±0. 06和 O. 40±0· 05。圖5a顯不使用兩種突光團(tuán)時(shí)的光納米孔核喊基鑒定。使用兩個(gè)不同的顏色以能夠構(gòu)造與全部4種DNA核堿基對(duì)應(yīng)的2比特樣品。數(shù)據(jù)的顏色已經(jīng)在此變成灰度級(jí)。圖5b顯示,采用>2000個(gè)事件生成的R分布在O. 21 ±0. 05和O. 41 ±0. 06處揭示與對(duì)照研究極好符合的兩種模式,其分別與A647和A680熒光團(tuán)對(duì)應(yīng)。圖5c顯示各個(gè)雙色2比特解鏈?zhǔn)录慕?jīng)強(qiáng)度校正的代表性熒光跡線,在事件上方顯示相應(yīng)的調(diào)用的比特、調(diào)用的堿基和確定性評(píng)分。在使用固定閾R值調(diào)用每個(gè)比特后,這兩個(gè)通道中的強(qiáng)度由計(jì)算機(jī)代碼自動(dòng)地校正。圖6a顯示多孔檢測(cè)DNA解鏈?zhǔn)录目尚行?。描述累積光強(qiáng)度的表面曲線清晰地顯示如通過EM-CXD成像的一個(gè)(左)、兩個(gè)(中間)和三個(gè)(右)納米孔的位置。圖6b說明4條代表性跡線顯示在兩個(gè)不同孔處同時(shí)出現(xiàn)的解鏈。電流跡線(黑色,頂部跡線)不含有關(guān)于孔位置的信息,而光跡線(3條下部跡線)允許建立解鏈?zhǔn)录奈恢谩?br>
圖7是顯示DNA模板分子(在5’末端處帶有C)轉(zhuǎn)化的變性凝膠圖像。該圖像顯示環(huán)化轉(zhuǎn)化產(chǎn)物(泳道E)以及線性化產(chǎn)物(泳道D)。泳道A是轉(zhuǎn)化之前的DNA模板。在凝膠中包括兩種參考分子,線性150聚體和環(huán)狀150聚體,分別是泳道B和C。圖8a顯示含有ATT0647N染料的兩種復(fù)合物的發(fā)射光譜。頂部曲線是含有雜交ATT0647N信標(biāo)的分子的歸一化測(cè)量光譜,而底部曲線是含有雜交ATT0647N信標(biāo)以及BHQ-2猝滅劑信標(biāo)的分子的測(cè)量光譜。本圖中的插圖示意性地顯示所用的復(fù)合物。圖8b顯示含有ATT0680染料的兩種復(fù)合物的發(fā)射光譜。頂部曲線是含有雜交ATT0680信標(biāo)的分子的測(cè)量光譜,而底部曲線是含有雜交ATT0680信標(biāo)以及BHQ-2猝滅劑信標(biāo)的分子的測(cè)量光譜。本圖中的插圖示意性地顯示所用的復(fù)合物。圖9顯示帶有修飾的分子信標(biāo)的雙鏈核酸納米孔解鏈的示意圖,所述修飾的分子信標(biāo)具有在其上連接的調(diào)節(jié)基團(tuán)/大體積基團(tuán)。
圖10顯示在溶液中并且不與靶核酸互補(bǔ)性雜交的分子信標(biāo)的一個(gè)實(shí)施方案的總體特性。靶核酸是來自待測(cè)序核酸的轉(zhuǎn)化的核酸。圖11A-11C顯示用于將肽與分子信標(biāo)連接的示例性3個(gè)不同的偶聯(lián)方案。圖IlA顯示鏈霉親和素-生物素連接,其中通過將生物素-dT借助碳-12間隔區(qū)導(dǎo)入莖部的猝滅劑臂而修飾分子信標(biāo)。生物素修飾的肽借助具有4個(gè)生物素結(jié)合位點(diǎn)的鏈霉親和素分子與修飾的分子信標(biāo)連接。圖IlB顯示巰基-馬來酰亞胺連接,其中通過添加巰基修飾分子信標(biāo)莖部的猝滅劑臂,所述巰基可以與置于肽的C末端的馬來酰亞胺基團(tuán)反應(yīng)以形成直接穩(wěn)定的連接。圖IlC顯示可切割的二硫鍵,其中肽通過在C末端添加與巰基修飾的分子信標(biāo)形成二硫鍵的半胱氨酸殘基被修飾。發(fā)明詳述除非另外解釋,否則本文中所用的全部技術(shù)術(shù)語和科學(xué)術(shù)語如本發(fā)明所屬領(lǐng)域的普通技術(shù)人員通常所理解的相同含義。除非另外說明,本發(fā)明是使用本領(lǐng)域已知的標(biāo)準(zhǔn)方法進(jìn)行,例如,如CurrentProtocols in Protein Science (CPPS) (John E. Coligan 等人編著,John Wiley andSons, Inc.),所述文獻(xiàn)均通過引用的方式完整地并入本文。應(yīng)當(dāng)理解本發(fā)明不限于本文所述的特定方法學(xué)、方案和試劑并且因而它們可以變動(dòng)。本文所用的術(shù)語的目的僅在于描述具體實(shí)施方案,并且不意圖限制本發(fā)明的范圍,本發(fā)明僅由權(quán)利要求書限定。除了在工作例子中或其中另外說明,表述本文所用的成分或反應(yīng)條件的量的全部數(shù)字應(yīng)當(dāng)在全部情況下理解為由術(shù)語“約”修飾。與百分?jǐn)?shù)一起使用時(shí),術(shù)語“約”可以意指 +1%。單數(shù)術(shù)語“一個(gè)(a)”、“一種(an)”和“該(the) ”包括復(fù)數(shù)稱謂,除非上下文另外清楚地指出。類似地,除非上下文另外清楚地指出,否則詞“或”意指包括“和”。將進(jìn)一步理解的是,對(duì)核酸給予的全部堿基尺寸或氨基酸尺寸和全部分子量或分子質(zhì)量值是近似值并且出于描述而提供。盡管與本文所述的那些方法和材料相似或等同的方法和材料可以用于本公開的實(shí)施或檢驗(yàn),然而現(xiàn)在描述合適的方法和材料。縮寫“例如(e.g.)”源自拉丁語exempli gratia,并且在本文用來表示非限制性例子。因此,縮寫“例如(e.g.)”是與術(shù)語
12“例如”同義的。所確定的全部專利和其他出版物明確地通過引用方式并入本文,目的在于描述和公開例如此類出版物中所述的可能與本發(fā)明一起使用的方法。這些出版物僅因它們的公開先于本申請(qǐng)的提交日而提供。就這一方面而言任何內(nèi)容均不得解釋為承認(rèn)發(fā)明人由于在先發(fā)明或由于其他任何原因而不被給予早于這種公布的權(quán)利。就這些文獻(xiàn)的日期而言的全部敘述或就這些文獻(xiàn)的日期而言的描述基于申請(qǐng)人可獲得的信息并且不構(gòu)成對(duì)這些文獻(xiàn)的日期或內(nèi)容正確性的任何承認(rèn)。本發(fā)明的實(shí)施方案基于一項(xiàng)示例性說明,S卩,對(duì)與納米孔解鏈依賴性核酸(如DNA和RNA)測(cè)序一起使用的分子信標(biāo)(MB)的修飾。在納米孔解鏈依賴性核酸測(cè)序中,雙鏈(ds) DNA的解鏈?zhǔn)菑陌琩sDNA的MB中激發(fā)信號(hào)必需的。從MB中激發(fā)的信號(hào)的時(shí)間順序與正在測(cè)序的核酸的序列對(duì)應(yīng)。用來dsDNA解鏈的納米孔的尺寸局限為小于不與任何外部分子連接或偶聯(lián)的標(biāo)準(zhǔn)dsDNA的寬度,這個(gè)寬度是大約2. 2nm。約I. 5但小于2. 2nm的孔徑可以在dsDNA試圖在電場(chǎng)影響下通過孔時(shí)使dsDNA解鏈,即,DNA的兩條鏈分開,并且一條鏈通過孔,而包含多個(gè)非共價(jià)連接的MB的另一條互補(bǔ)鏈依次地和時(shí)間地得到檢測(cè)并留在后面(見圖Ia)。任何大于2. 2nm的孔徑將不促進(jìn)對(duì)于從MB中激發(fā)信號(hào)是必需的解鏈?zhǔn)录?,其中激發(fā)的信號(hào)與正在測(cè)序的核酸的序列對(duì)應(yīng)。任何大于2. 2nm的孔徑將只允許dsDNA通過所述孔而無任何鏈分開。在ds DNA構(gòu)型中,雜交的MB不激發(fā)任何信號(hào)。發(fā)明人已經(jīng)通過增加測(cè)序期間試圖通過納米孔的dsDNA的寬度、尤其通過將調(diào)節(jié)基團(tuán)與MB連接來克服這種孔徑局限作用。如圖9中示意性顯示,調(diào)節(jié)基團(tuán)103向MBlll增添體積,從而與未修飾的MB形成的雙鏈核酸的寬度D2113相比時(shí),由單鏈核酸109與修飾的MBlll形成的雙鏈核酸具有較大的寬度D3115。因此,大于約2. 2nm的孔寬度DllOl可以用于解鏈?zhǔn)录⑶乙虼擞糜跍y(cè)序,只要孔寬度DllOl小于MB上連接大體積調(diào)節(jié)基團(tuán)的點(diǎn)處的dsDNA的寬度D3115即可。作為概念驗(yàn)證,發(fā)明人使MB生物素?;⑶覍⒖股锼氐鞍?4. 0x5. 5x6. Onm)20與生物素?;腗B連接。他們成功地使用3_6nm的納米孔使包含抗生物素蛋白-生物素酰化MB的dsDNA解鏈并且從這些抗生物素蛋白-生物素?;疢B中激發(fā)信號(hào)(圖3a)。另外,發(fā)明人還顯示,這類修飾可以適用于使包含兩個(gè)不同種類的MB的dsDNA解鏈(圖3a),如’2比特’實(shí)驗(yàn)中所顯示,其中兩個(gè)種類的MB用不同的熒光團(tuán)標(biāo)記,例如,一個(gè)種類的MB用發(fā)射紅色熒光的熒光團(tuán)標(biāo)記并且第二種類的MB用發(fā)射藍(lán)色熒光的另一種熒光團(tuán)標(biāo)記。由于在制造具有約2nm或更小尺寸的納米孔時(shí),尤其在大量生產(chǎn)制造時(shí),難以獲得一致性結(jié)果,所公開的修改的一個(gè)優(yōu)點(diǎn)是較大的孔徑可以用于依賴dsDNA解鏈的基于納米孔的DNA測(cè)序。這種修飾轉(zhuǎn)而促進(jìn)納米孔陣列的大規(guī)模制造,這為多孔檢測(cè)的簡(jiǎn)易方法鋪平道路。另一個(gè)優(yōu)點(diǎn)是較大的孔徑增加dsDNA的捕獲率至少10倍并且這也有利于陣列中的多孔檢測(cè)13。因此,本文中公開了一種用于納米孔解鏈依賴性核酸測(cè)序的分子信標(biāo)(MB)文庫(kù),所述文庫(kù)包含多種MB,其中每種MB包含寡核苷酸,所述寡核苷酸包含(I)可檢測(cè)標(biāo)記、(2)可檢測(cè)標(biāo)記封阻劑;和(3)調(diào)節(jié)基團(tuán);其中所述MB能夠與代表單鏈核酸中A、U、T、C或G核苷酸的定義序列進(jìn)行序列特異性互補(bǔ)雜交以形成雙鏈(ds)核酸。圖10中顯示一個(gè)實(shí)施方
13案的常見MB的示意圖。在一個(gè)實(shí)施方案中,MB的寡核苷酸包含兩個(gè)親和臂。在一個(gè)實(shí)施方案中,MB寡核苷酸包含5’親和臂和3’親和臂。在一個(gè)實(shí)施方案中,MB的寡核苷酸包含5’熒光團(tuán)臂和3’猝滅劑臂。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是四重體DNA。在一個(gè)實(shí)施方案中,這種四重體DNA是本文所述的MB的寡核苷酸的部分并且位于其內(nèi)部。在一個(gè)實(shí)施方案中,本文中提供了一種使雙鏈(ds)寡核苷酸解鏈用于納米孔解鏈依賴性核酸測(cè)序的方法,所述方法包括(a)通過這種方法將本文所述的分子信標(biāo)(MB)文庫(kù)與待測(cè)序的單鏈核酸雜交,從而形成具有寬度D3的雙鏈(ds)核酸,所述雙鏈核酸因調(diào)節(jié)基團(tuán)在MB上的存在而形成,其中所述待測(cè)序的單鏈核酸是包含代表A、U、T、C或G的定義序列的聚合物;(b)使步驟a)中形成的雙鏈核酸與具有寬度Dl的納米孔開口接觸,其中D3大于Dl ;并且(c)施加跨納米孔的電勢(shì)以使雜交的MB與待測(cè)序的單鏈核酸解鏈。在另一個(gè)實(shí)施方案中,本文中提供了一種用于測(cè)定核酸的核苷酸序列的方法,所述方法包括以下步驟(a)將本文所述的分子信標(biāo)(MB)文庫(kù)與待測(cè)序的單鏈核酸雜交,從而形成具有寬度D3的雙鏈(ds)核酸,所述雙鏈核酸因調(diào)節(jié)基團(tuán)的存在而形成,其中所述待測(cè)序的單鏈核酸是包含代表A、U、T、C或G的定義序列的聚合物;(b)使步驟a)中形成的雙鏈核酸與具有寬度Dl的納米孔開口接觸,其中D3大于Dl ;并且(c)施加跨納米孔的電勢(shì)以使雜交的MB與待測(cè)序的單鏈核酸解鏈;以及(d)當(dāng)MB在其出現(xiàn)時(shí)與雙鏈核酸分開時(shí),在所述孔處檢測(cè)由可檢測(cè)標(biāo)記從每種MB發(fā)射的信號(hào)。發(fā)射的信號(hào)的時(shí)間順序與單鏈核酸的序列對(duì)應(yīng)。在測(cè)定核酸的核苷酸序列的這種方法的一個(gè)實(shí)施方案中,該方法包括將待測(cè)序的核酸轉(zhuǎn)化成由MB的文庫(kù)雜交的代表性單鏈核酸。在一個(gè)實(shí)施方案中,用于測(cè)定核酸的核苷酸序列的方法進(jìn)一步包括將一串檢測(cè)到的信號(hào)的序列解碼以推導(dǎo)核酸的實(shí)際核苷酸堿基序列。這包括本文所述的文庫(kù)和方法可以在其中需要任何核酸或寡核苷酸的序列的任何情況(例如,檢測(cè)突變、DNA指紋分析、單核苷酸多態(tài)性和生物全基因組測(cè)序)下使用。如本領(lǐng)域通常已知,MB是形成莖-環(huán)結(jié)構(gòu)(見圖10)并且用來報(bào)道溶液中存在特定核酸的寡核苷酸雜交探針。莖-環(huán)結(jié)構(gòu)是在本領(lǐng)域中也稱作發(fā)夾或發(fā)夾環(huán)。MB也稱作分子信標(biāo)探針。作為示例和不應(yīng)當(dāng)解釋為限制性,常見MB寡核苷酸探針的一般設(shè)計(jì)和特征如下(見圖10) :MB可以具有多種長(zhǎng)度,例如,長(zhǎng)約15-35個(gè)核苷酸。在其中MB內(nèi)部存在DNA四重體部分的實(shí)施方案中,MB的長(zhǎng)度可以較長(zhǎng),例如,長(zhǎng)直至60個(gè)核苷酸。在一個(gè)實(shí)施方案中,中間部分形成“環(huán)”,包含與特定靶DNA或RNA或寡核苷酸互補(bǔ)的5-25個(gè)核苷酸。如在MB的背景下所用,“靶核酸”、“靶DNA”、“靶序列”、“靶RNA”或“靶寡核苷酸”是MB可以基于Watson-Crick型雜交與之互補(bǔ)性雜交即“堿基配對(duì)”的核酸。在一個(gè)實(shí)施方案中,在MB的每個(gè)末端存在彼此互補(bǔ)即可以彼此“堿基配對(duì)”的至少兩個(gè)核苷酸。在MB的每個(gè)末端或“親和臂”處的這兩個(gè)核苷酸復(fù)性在一起并且形成MB的“莖”,在MB不與其靶核酸雜交時(shí)產(chǎn)生莖-環(huán)結(jié)構(gòu)。這種莖-環(huán)結(jié)構(gòu)一般在彼此互補(bǔ)的兩個(gè)末端處在序列上長(zhǎng)2-7個(gè)核苷酸。在一個(gè)實(shí)施方案中,染料或可檢測(cè)標(biāo)記連接至常叫作5’熒光團(tuán)的MB的5’末端/臂,所述5’末端/臂在互補(bǔ)靶存在時(shí)發(fā)熒光。在一個(gè)實(shí)施方案中,猝滅劑染料或可檢測(cè)標(biāo)記封阻劑共價(jià)地連接于常叫作3’猝滅劑的MB的3’末端/臂。當(dāng)信標(biāo)處于閉合環(huán)形狀時(shí),猝滅劑阻止熒光團(tuán)發(fā)射光線。通常,MB形式帶有起初猝滅的熒光團(tuán)的莖-環(huán)型分子,所述熒光團(tuán)的熒光在這些分子與靶核酸序列結(jié)合時(shí)恢復(fù)。以下是MB的例子熒光團(tuán)在5’末端處;5’-GCGAGCTAGGAAACACCAAAGATGATAITTGCTCGC-3’-DABCYL(SEQ ID NO:2)。DABCYL(非熒光發(fā)色團(tuán))可以充當(dāng)MB中用于任何熒光團(tuán)的通用猝滅劑。在另一個(gè)實(shí)施方案中,MB沒有莖-環(huán)結(jié)構(gòu)。在MB的每個(gè)末端不存在彼此互補(bǔ)的核苷酸,因而無莖-環(huán)結(jié)構(gòu)形成。在一個(gè)實(shí)施方案中,文庫(kù)的MB不形成莖-環(huán)結(jié)構(gòu)。在一個(gè)實(shí)施方案中,MB是帶有可檢測(cè)標(biāo)記的寡核苷酸。在又一個(gè)實(shí)施方案中,MB是帶有可檢測(cè)標(biāo)記和可檢測(cè)標(biāo)記封阻劑的寡核苷酸。在一個(gè)實(shí)施方案中,MB在它們?cè)谌芤褐性诤线m的溫度和離子強(qiáng)度條件(例如,低于莖-環(huán)結(jié)構(gòu)的Tm)下游離時(shí)不發(fā)熒光。當(dāng)MB與互補(bǔ)于MB探針或環(huán)區(qū)域的核酸雜交時(shí),MB經(jīng)歷使其能夠發(fā)射明亮熒光的構(gòu)象變化。在不存在互補(bǔ)核酸的情況下,探針是晦暗的,因?yàn)榍o將熒光團(tuán)如此靠近熒光猝滅劑安置,從而熒光團(tuán)和猝滅劑臨時(shí)共享電子,這消除熒光團(tuán)發(fā)射熒光的能力。當(dāng)探針遭遇合適的互補(bǔ)核酸分子時(shí),它形成比莖合體更長(zhǎng)和更穩(wěn)定的探針-靶雜種。探針-靶雜種的剛度和長(zhǎng)度是共同存在莖雜種的前提。因此,MB經(jīng)歷自發(fā)構(gòu)象重組織,所述自發(fā)構(gòu)象重組織迫使莖雜種解離并且迫使熒光團(tuán)和猝滅劑彼此遠(yuǎn)離的,從而允許熒光團(tuán)在受合適的光源激發(fā)時(shí)發(fā)射熒光。在一個(gè)實(shí)施方案中,MB的整個(gè)寡核苷酸與靶核酸互補(bǔ)。對(duì)于解鏈DNA納米孔方法,靶核酸將是代表A、U、T、C或G的特異性核酸序列或聚合物。在一個(gè)實(shí)施方案中,MB的寡核苷酸的3’和5’親和臂在不存在靶核酸的情況下彼此互補(bǔ)。在靶核酸存在下,MB的寡核苷酸的3’和5’親和臂與靶核酸互補(bǔ)。本文所述文庫(kù)的MB的靶核酸是代表A、U、T、C或G的核酸序列或聚合物。在不存在靶核酸序列的情況下,MB的3’和5’親和臂復(fù)性并且形成MB莖-環(huán)結(jié)構(gòu)的莖部。在一些實(shí)施方案中,MB的整個(gè)寡核苷酸是具有4至60個(gè)核苷酸的序列。在其它實(shí)施方案中,MB的整個(gè)寡核苷酸是具有8至32個(gè)核苷酸的序列。例如,MB的文庫(kù)可以是這樣的,因此全部MB均是8個(gè)核苷酸長(zhǎng)度。在其他情況下,MB的文庫(kù)可以是這樣的,因此全部MB均是16個(gè)核苷酸長(zhǎng)度、32個(gè)核苷酸長(zhǎng)度、45或60個(gè)核苷酸長(zhǎng)度。在一個(gè)實(shí)施方案中,MB的文庫(kù)包含至少兩個(gè)種類的MB,其中所述兩個(gè)種類具有MB的不同寡核苷酸長(zhǎng)度。例如,對(duì)于僅具有兩個(gè)種類的文庫(kù),一個(gè)種類可以是8個(gè)核苷酸長(zhǎng)度并且另一個(gè)種類可以是16核苷酸長(zhǎng)度。在某些實(shí)施方案中,“環(huán)”區(qū)域互補(bǔ)地與靶核酸(例如,代表A、U、T、C或G的核酸序列或聚合物)雜交。在某些實(shí)施方案中,“環(huán)”區(qū)域互補(bǔ)地與具有靶核酸上4至32個(gè)核苷酸的序列雜交。在某些實(shí)施方案中,MB的莖的親和臂也互補(bǔ)地與具有4至25個(gè)核苷酸的靶序列雜父。在一個(gè)實(shí)施方案中,MB的寡核苷酸包含四重體部分。G-四重體是從圍繞形成氫鍵的鳥嘌呤堿基的四分體建立的富G序列中形成的高級(jí)DNA和RNA結(jié)構(gòu)物。這類四重體序列是本領(lǐng)域熟知的,例如,如由 Burge, S.等人,Nucleic Acids Research, 2006,34:5402-5415 ;Borman,S.,Chemical and Engineering News,2007,85:12 — 17 ;Hammond-Kosack和 Κ·Docherty,F(xiàn)EBs Letters,1992,301:79-82 ;和 Chen CY 等人,Sex Transm.Infect.,2008,84:273-6描述。這些參考文獻(xiàn)通過引用的方式完整地并入本文。因此,本領(lǐng)域技術(shù)人員可以設(shè)計(jì)四重體并且將其并入MB文庫(kù)中。在一個(gè)實(shí)施方案中,四重體部分沒有互補(bǔ)地與代表A、U、T、C或G的靶核酸序列或聚合物雜交。在一個(gè)實(shí)施方案中,四重體部分充當(dāng)大體積調(diào)節(jié)基團(tuán)。在一個(gè)實(shí)施方案中,MB的四重體部分存在于MB的寡核苷酸的3’或5’末端處。在一個(gè)實(shí)施方案中,MB的四重體部分以2-7個(gè)核苷酸相距MB寡核苷酸的3’或5’末端存在。在另一個(gè)實(shí)施方案中,MB的四重體部分以1-7個(gè)核苷酸相距MB的寡核苷酸的3’或5’末端存在。提到寡核苷酸能夠序列特異性與序列互補(bǔ)雜交或互補(bǔ)時(shí),這意指這個(gè)寡核苷酸通過氫鍵與該序列形成規(guī)范的Watson和Crick核苷酸堿基配對(duì),其中腺嘌呤(A)與胸腺嘧啶(T)形成堿基對(duì),如DNA中鳥嘌呤(G)與胞嘧啶(C)形成堿基對(duì)那樣。在RNA中,胸腺嘧啶由尿嘧啶⑶替換。在用于納米孔解鏈依賴性測(cè)序的某些實(shí)施方案中,將待測(cè)序的核酸首先轉(zhuǎn)化成代表性序列。代表性序列的功能在于將待測(cè)序核酸中的每個(gè)單堿基放大成較大的序列。較大的代表性序列由序列塊(也稱作代碼或嵌段序列)組成,所述的序列塊對(duì)于每種堿基A、T、C、G和U而言是限定的、獨(dú)特的和固定的。例如,“A”在待測(cè)序的核酸中由擴(kuò)展的10聚體嵌段序列ATTTATTAGG (SEQ ID NO. 3)代表,” T”由擴(kuò)展的10聚體嵌段序列CGGGCGGCAA (SEQID NO. 4)代表,“C”由擴(kuò)展的10聚體嵌段序列CCTTTCCTTA(SEQ ID NO. 5)代表,并且“G”由擴(kuò)展的10聚體嵌段序列AGCGCCGAAC(SEQ ID NO. 6)代表。因此,具有“TGGCA”序列的核酸將轉(zhuǎn)化成包含5個(gè)10聚體嵌段序列的代表性序列CGGGCGGCAA-AGCGCCGAAC-AGCGCCGAAC-CCTTTCCTTA-ATTTATTAGG(SEQ ID NO. 7)。由于堿基 A、T、C、G 在這個(gè)例子中由 4 個(gè)獨(dú)特10聚體嵌段序列代表,因此這是序列轉(zhuǎn)化的獨(dú)特或單個(gè)代碼系統(tǒng)。當(dāng)一個(gè)堿基由一對(duì)嵌段序列代表時(shí),它是二進(jìn)制編碼的順序轉(zhuǎn)換系統(tǒng)。例如,這種二進(jìn)制代碼是兩個(gè)獨(dú)特的 10 聚體嵌段序列ATTTATTAGG(SEQ ID NO. 3)和 CGGGCGGCAA (SEQ ID NO. 4),并且可以將它們分別稱作代碼“O”和“I”。每個(gè)堿基由一對(duì)嵌段序列代表,例如,“A”由“0,I”或ATTTATTAGG-CGGGCGGCAA (SEQ ID NO. 8)代表,“T”由“0,O”或 ATTTATTAGG-ATTTATTAGG (SEQID NO. 9)代表,“C”由“1,O”或 CGGGCGGCAA-ATTTATTAGG(SEQ ID NO. 10)代表,“G”由“1,I”或CGGGCGGCAA-CGGGCGGCAA(SEQ ID NO. 11)代表。成對(duì)嵌段序列或代碼的依次排列是重要的,這意味“0,I”與“1,O”不相同,因?yàn)樵谝陨侠又小?,I”代表A而“ 1,O”代表“C”。因此,當(dāng)使用本文所述的二進(jìn)制代碼系統(tǒng)時(shí),具有“GATGGCA”序列的核酸將轉(zhuǎn)化成二進(jìn)制代碼(II)-(01)-(00)-(11)-(11)-(10)-(01)或代表性序列(CGGGCGGCAA-CGGGCGGCAA)-(ATTTATTAGG-CGGGCGGCAA)-(ATTTATTAGG-ATTTATTAGG)-(CGGGCGGCAA-CGGGCGGCAA)-(CGGGCGGCAA-CGGGCGGCAA) - (CGGGCGGCAA-ATTTATTAGG) - (ATTTATTAGG-CGGGCGGCAA) (SEQ ID NO. 12)。對(duì)待測(cè)序核酸的轉(zhuǎn)化和用于轉(zhuǎn)化的代碼系統(tǒng)的詳細(xì)描述可以在Soni和MelIer (2007) 29、MelIer等人,2009(美國(guó)專利申請(qǐng)公開2009/0029477)以及Meller和Weng(PCT申請(qǐng)No. PCT US2009/034296)中找到。這些參考文獻(xiàn)通過引用的方式完整地并入本文。在一個(gè)實(shí)施方案中,代表單鏈核酸中的A、U、T、C或G核苷酸的定義序列包含嵌段序列,其中所述嵌段序列代表單鏈核酸中的A、U、T、C或G核苷酸。在一個(gè)實(shí)施方案中,MB的寡核苷酸與代表單鏈核酸中A、U、T、C或G核苷酸的定義序列的嵌段序列互補(bǔ)。在一個(gè)實(shí)施方案中,文庫(kù)包含幾個(gè)種類的MB,其中對(duì)于代表單鏈核酸中A、U、T、C或G核苷酸的每個(gè)嵌段序列,存在至少一個(gè)種類的MB。每種類具有與文庫(kù)中其他種類不同的可檢測(cè)標(biāo)記。例如,如果文庫(kù)中存在4個(gè)種類的MB,則存在4種不同的可檢測(cè)標(biāo)記,例如,用作可檢測(cè)標(biāo)記的紅色、綠色、藍(lán)色和黃色熒光團(tuán)。每個(gè)種類也具有與文庫(kù)中其他種類MB不同的寡核苷酸序列。例如,如果文庫(kù)中存在4個(gè)種類的MB,則存在4種不同的寡核苷酸序列,例如,在文庫(kù)的 MB 中的 ATTTATTAGG (SEQ ID NO. 3)、CGGGCGGCAA (SEQ IDN0. 4)、CCTTTCCTTA(SEQ ID NO. 5)和 AGCGCCGAAC(SEQ ID NO. 6)。在其中使用序列轉(zhuǎn)化的獨(dú)特或單一代碼系統(tǒng)的實(shí)施方案中,文庫(kù)包含至少4個(gè)種類的MB。在一個(gè)實(shí)施方案中,文庫(kù)包含至少2個(gè)種類的MB以及高達(dá)4個(gè)種類的MB,其中每個(gè)種類具有不同的熒光團(tuán)和不同的序列。在一個(gè)實(shí)施方案中,文庫(kù)包含至少2個(gè)種類的MB以及高達(dá)6個(gè)種類的MB,其中每個(gè)種類具有不同的熒光團(tuán)和不同的序列。在一個(gè)實(shí)施方案中,文庫(kù)包含高達(dá)8個(gè)種類的MB,其中每個(gè)種類具有不同的熒光團(tuán)和不同的序列。在一個(gè)實(shí)施方案中,文庫(kù)包含4個(gè)種類的MB,例如,其中每個(gè)類型具有不同熒光團(tuán)和不同序列的4種不同類型的MB。在其中使用序列轉(zhuǎn)化的二進(jìn)制代碼系統(tǒng)的實(shí)施方案中,文庫(kù)包含至少兩個(gè)種類的MB,例如,兩個(gè)不同類型的MB,其中一個(gè)類型MB具有熒光團(tuán)和代碼“O”的獨(dú)特序列和另一個(gè)類型具有不同的熒光團(tuán)和代碼“I”的獨(dú)特序列。在一個(gè)實(shí)施方案中,文庫(kù)包含兩個(gè)種類的MB。每個(gè)種類的MB具有其自身的可以與其特異性嵌段序列互補(bǔ)雜交的獨(dú)特寡核苷酸序列。在一個(gè)實(shí)施方案中,每個(gè)種類的MB具有不同的可檢測(cè)標(biāo)記。在一個(gè)實(shí)施方案中,每個(gè)種類的MB具有相同的可檢測(cè)標(biāo)記封阻劑。在另一個(gè)實(shí)施方案中,每個(gè)種類的MB具有相同的調(diào)節(jié)基團(tuán)。在一個(gè)實(shí)施方案中,本文所述的文庫(kù)包含在MB上的至少兩種不同的可檢測(cè)標(biāo)記,其中僅一種可檢測(cè)標(biāo)記位于每個(gè)MB上。在一個(gè)實(shí)施方案中,本文所述的文庫(kù)包含在MB上的兩種不同的可檢測(cè)標(biāo)記,其中僅一種可檢測(cè)標(biāo)記位于每個(gè)MB上。在一個(gè)實(shí)施方案中,本文所述的文庫(kù)包含在MB上的四種不同的可檢測(cè)標(biāo)記,其中僅一種可檢測(cè)標(biāo)記位于每個(gè)MB上。例如,在本文所述的二進(jìn)制代碼系統(tǒng)中,文庫(kù)將具有兩個(gè)種類的MB,一個(gè)第一種類的MB具有可以與具有序列ATTTATTAGG (SEQ ID NO. 3)的代碼“O”互補(bǔ)的序列并且文庫(kù)的一個(gè)第二種類的MB具有可以與具有序列CGGGCGGCAA (SEQ ID NO. 4)的代碼“I”互補(bǔ)的序列。在一個(gè)實(shí)施方案中,存在兩種或更多種類的MB,其中MB的每個(gè)種類具有不同的可檢測(cè)標(biāo)記。例如,文庫(kù)包含兩個(gè)種類的MB,一個(gè)第一個(gè)種類的MB具有ATT0647N熒光團(tuán)作為可檢測(cè)基團(tuán)并且文庫(kù)的第二種類的MB具有ATT0488熒光團(tuán)作為可檢測(cè)基團(tuán)(見實(shí)施例部分)。ATT0647N-MB和ATT0488-MB均具有相同的可檢測(cè)標(biāo)記封阻劑,猝滅劑BHQ-2。此外,ATT0647N-MB和ATT0488-MB均具有相同的調(diào)節(jié)基團(tuán),抗生物素蛋白-生物素。在納米孔解鏈依賴性測(cè)序中,多個(gè)MB以串聯(lián)排列方式結(jié)合到形成雙鏈聚合物的序列上。例如,使用本文所述的二進(jìn)制代碼系統(tǒng),具有二進(jìn)制代碼(11)-(01)-(00)-(11)-(1
1)-(10)-(01)或代表性序列(CGGGCGGCAA-CGGGCGGCAA) - (ATTTATTAGG-CGGGCGGCAA) - (ATTTATTAGG-ATTTATTAGG)_ (CGGGCGGCAA-CGGGCGGCAA)_(CGGGCGGCAA-CGGGCGGCAA)_(CGGGCGGCAA-ATTTATTAGG) - (ATTTATTAGG-CGGGCGGCAA) (SEQ ID. NO. 12)的序列將具有 14 個(gè)以串聯(lián)排列方式與所述序列互補(bǔ)性雜交以形成雙鏈聚合物的MB。MB串聯(lián)排列是這樣的,從而前一個(gè)MB的3’猝滅劑被后續(xù)MB的5’熒光團(tuán)的熒光猝滅(見圖I)。在Soni和Mel Ier (2007)29中和在美國(guó)專利申請(qǐng)公開號(hào)2009/0029477中描述了使用MB的納米孔解鏈依賴性測(cè)序的詳述公開,所述文獻(xiàn)均通過引用的方式完整地并入本文。在一個(gè)實(shí)施方案中,MB是寡核苷酸,如DNA和RNA。在一個(gè)實(shí)施方案中,寡核苷酸 是單鏈寡核苷酸。在另一個(gè)實(shí)施方案中,MB是寡核苷酸,如二醇核酸(GNA)、鎖核酸(LNA)、肽核酸(PNA)、蘇糖核酸(TNA)和Morpholino。在一個(gè)實(shí)施方案中,MB的寡核苷酸包含選自但不限于脫氧核糖核酸(DNA)、核糖核酸(RNA)、二醇核酸(GNA)、肽核酸(PNA)、鎖核酸(LNA)、蘇糖核酸(TM)和磷酰二胺嗎啉代寡聚物(PMO/Morpholino)的核酸。在另一個(gè)實(shí)施方案中,MB是嵌合寡核苷酸;例如,包含DNA、RNA、GNA、PNA、LNA、TNA和嗎啉代的混合物或組合。例子包括但不限于DNA/RNA嵌合MB、DNA/LNA嵌合MB和RNA/PNA嵌合MB。在一個(gè)實(shí)施方案中,MB的寡核苷酸包含4-60個(gè)核苷酸。在其他實(shí)施方案中,MB的寡核苷酸包含7_32個(gè)核苷酸、4-25個(gè)核苷酸、4-16個(gè)核苷酸、4_32個(gè)核苷酸、7_16個(gè)核苷酸或7-25個(gè)核苷酸。在一個(gè)實(shí)施方案中,寡核苷酸包含8-16個(gè)核苷酸。在一些實(shí)施方案中,寡核苷酸包含7、8、16或32個(gè)核苷酸。在一個(gè)實(shí)施方案中,文庫(kù)中全部種類的MB具有核苷酸數(shù)目相同的寡核苷酸。在另一個(gè)實(shí)施方案中,文庫(kù)中的MB種類具有核苷酸數(shù)眾多的寡核苷酸。在一個(gè)實(shí)施方案中,核苷酸選自脫氧核糖核酸(DNA)、核糖核酸(RNA)、二醇核酸(GNA)、肽核酸(PNA)、鎖核酸(LNA)、蘇糖核酸(TNA)和磷酰二胺嗎啉代寡聚物(ΡΜ0/Morpholino)。寡核苷酸的長(zhǎng)度通常是至少約6至約25個(gè)核苷酸、經(jīng)常至少約10至約20個(gè)核苷酸,并且往往是至少約11至約16個(gè)核苷酸。本文所述的16聚體和32聚體寡核苷酸MB是示例性的并且不應(yīng)當(dāng)以任何方式是限制性的。在一些實(shí)施方案中,MB的寡核苷酸是核苷酸、核堿基或單體的聚合物。GNA是與DNA或RNA相似但是在其“主鏈”的組成上不同的聚合物。已知GNA并不天然地存在。盡管DNA和RNA具有脫氧核糖和核糖的糖主鏈,但是GNA的主鏈由通過磷酸二酯鍵連接的重復(fù)性甘油單元組成。甘油分子僅具有3個(gè)碳原子并且能夠進(jìn)行Watson-Crick堿基配對(duì)。Watson-Crick堿基配對(duì)在GNA中比其天然對(duì)應(yīng)物DNA和RNA穩(wěn)定得多,因?yàn)樗枰邷匾允笹NA的雙鏈體解鏈。GNA的例子是由Ueda等人,(1971) Journal ofHeterocyclicChemistry 8 (5), 827-9首次制備的2,3- 二輕丙基核苷類似物。其他GNA聚合物及它們的制備和性能在 Seita 等人,(1972)Die MakromolekulareChemie, 154:255-26l;Cook 等人,(1995) PCT 國(guó)際申請(qǐng) WO 9518820,第 126 頁;美國(guó)專利 No. 5886177 ;Acevedo和 Andrews(1996)Tetrahedron Letters 37(23):3931-3934 和 Zhang 等人,(2005), J.Am. Chem. Soc. 127(12) :4174-5中公開。這些參考文獻(xiàn)均通過引用的方式完整地并入本文。TNA是與DNA或RNA相似但是在其“主鏈”的組成上不同的聚合物。已知TNA并不天然地存在。不同于具有脫氧核糖和核糖的糖主鏈的DNA和RNA,TNA的主鏈由通過磷酸二酯鍵連接的重復(fù)性蘇糖單元組成。蘇糖分子比核糖更容易裝配。TNA可以與RNA和DNA特異性堿基配對(duì)。J Am Chem Soc. 2005,127:2802-3。TNA 的例子是(3,-2,)- α-I-蘇糖核酸。其他 TNAs 由 Orgel, Leslie, 2000,Science 290 (5495) : 1306-1307 ;ffatt, Gregory,2005, Nature Chemical Biology ;和 Schoning, K.等人,2000,Science 290:1347 描述。這些參考文獻(xiàn)均通過弓I用的方式完整地并入本文。PNA是與DNA或RNA相似的人工合成的聚合物,由Peter E. Nielsen和同事在1991年(Science,254:1497)發(fā)明。PNA的主鏈由通過連接的重復(fù)性N-(2-氨基甲基)-甘氨酸單元組成。多種嘌呤和嘧啶堿基通過亞甲基羰基鍵與主鏈連接。將PNA如同肽那樣,N端在第一(左)位置處并且C端在右側(cè)。因此,PNA是具有偽肽主鏈的DNA模擬物。PNA是DNA (或RNA)的極好結(jié)構(gòu)性模擬物。由于PNA的主鏈不含帶電荷的磷酸基團(tuán),故而PNA/DNA鏈之間的結(jié)合因缺少靜電排斥作用而強(qiáng)于DNA/DNA鏈之間的結(jié)合。PNA寡聚物能夠與Watson-Crick互補(bǔ)性DNA、RNA(或PNA)寡聚物形成非常穩(wěn)定的雙鏈體結(jié)構(gòu)物,并且它們也可以通過螺旋侵入與雙鏈體DNA中的靶結(jié)合。(見Egholm, M.等人,(1993)Nature, 365,566-568 ;ffittung, P.等人,(1994)Nature, 368,561-563)。這些參考文獻(xiàn)均通過引用的方式完整地并入本文。LNA是修飾的RNA核苷酸。LNA核苷酸的核糖部分以連接2’氧和4’碳的額外橋進(jìn)行修飾。這個(gè)橋?qū)⒑颂恰版i定”處于3’ -內(nèi)(北)構(gòu)象,這種構(gòu)象經(jīng)常存在A形式的DNA或RNA中。LNA核苷酸可以在需要時(shí)與寡核苷酸中的DNA或RNA堿基混合。鎖定的核糖構(gòu)象增強(qiáng)堿基堆疊作用和主鏈預(yù)組織化。這明顯增加寡核苷酸的熱穩(wěn)定性(解鏈溫度)(Kaur,H等人,(2006), Biochemistry 45(23) :7347-55)。LNA核苷酸已經(jīng)用來增加DNA微陣列、FISH探針、實(shí)時(shí)PCR探針和基于寡核苷酸的其他分子生物學(xué)技術(shù)中表現(xiàn)的靈敏度和特異性。LNA的合成和它們的雜交性能由 Alexei A.等人,(1998),Tetrahedron 54(14) :3607-30 ;YouY.等人,(2006), Nucleic Acids Res. 34(8) :e60描述。這些參考文獻(xiàn)均通過引用的方式完整地并入本文。Morpholino是可以通過標(biāo)準(zhǔn)核酸配對(duì)與互補(bǔ)序列雜交的合成分子。Morpholino具有與嗎啉環(huán)而非與脫氧核糖環(huán)結(jié)合并且經(jīng)磷酰二胺基團(tuán)而不經(jīng)磷酸酯連接的核苷酸堿基。用不帶電荷的磷酰二胺基替換陰離子磷酸酯消除了正常生理學(xué)PH范圍內(nèi)的電離,從而Morpholino是總體上不帶電荷的分子。Morpholino的完整主鏈由這些修飾的亞單位組成。最常使用嗎啉代作為單鏈寡核苷酸,不過Morpholino鏈和互補(bǔ)性DNA鏈的異雙鏈體可以與陽離子胞質(zhì)遞送試劑組合使用。還在開發(fā)Morpholino作為靶向致病生物如細(xì)菌或病毒的藥學(xué)治療藥和用于減輕遺傳病。例如,用于反義技術(shù),用于抑制基因表達(dá)(Moulton,Jon(2007). “UsingMorpholinos to Control Gene Expression (Unit 4. 30)(使用 Morpholino 來控制基因表達(dá)(單兀4.30))” 引自 Beaucage, Serge. Current Protocols in Nucleic AcidChemistry. NewJersey: John ffiley&Sons, Inc.。這份參考文獻(xiàn)通過引用的方式完整地并入本文。因?yàn)樗鼈兺耆欠翘烊坏闹麈湥訫orpholino不被細(xì)胞蛋白識(shí)別。核酸酶不降解Morpholino,同樣它們?cè)谘寤蚣?xì)胞中不降解。Morpholino不激活toll樣受體并且因而它們不激活固有免疫反應(yīng)如干擾素誘導(dǎo)或NF- K B介導(dǎo)的炎癥反應(yīng)。已知Morpholino不修飾DNA的甲基化。在一個(gè)實(shí)施方案中,本文所述文庫(kù)的MB不與固相載體(如載玻片或微珠)連接。在一個(gè)實(shí)施方案中,本文所述文庫(kù)的MB游離于溶液中。在另一個(gè)實(shí)施方案中,本文所述文庫(kù)的MB,當(dāng)在溶液中游離時(shí),采取“環(huán)-莖”構(gòu)型,所述構(gòu)型能夠使可檢測(cè)標(biāo)記基團(tuán)封阻劑在不存在與MB復(fù)性的靶核酸的情況下封阻可檢測(cè)基團(tuán)發(fā)射信號(hào)。在另一個(gè)實(shí)施方案中,本文所述文庫(kù)的MB,當(dāng)在溶液中游離時(shí),采取一種構(gòu)型,所述構(gòu)型能夠使可檢測(cè)標(biāo)記基團(tuán)封阻劑在不存在與MB復(fù)性的靶核酸的情況下封阻可檢測(cè)基團(tuán)發(fā)射信號(hào)。在又一個(gè)實(shí)施方案中,本文所述文庫(kù)的MB,當(dāng)在溶液中游離時(shí),不采取“環(huán)-莖”構(gòu)型。在一個(gè)實(shí)施方案中,MB在它
19們?cè)谌芤褐性诤线m的溫度和離子強(qiáng)度條件(例如,低于莖-環(huán)結(jié)構(gòu)的Tm)下游離時(shí)不發(fā)熒光。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記在MB的寡核苷酸的一個(gè)末端上存在并且在文庫(kù)中全部MB寡核苷酸的相同末端上存在,其中在所述可檢測(cè)標(biāo)記不受封阻劑抑制時(shí),可檢測(cè)標(biāo)記發(fā)射可以檢測(cè)和/或測(cè)量的信號(hào)。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記位于MB的寡核苷酸的5’末端處。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記位于文庫(kù)中全部MB寡核苷酸的5’末端處。在另一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記位于MB的寡核苷酸的3’末端處。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記位于文庫(kù)中全部MB寡核苷酸的3’末端處。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記與MB的寡核苷酸的一條臂的末端、優(yōu)選地與寡核苷酸的5’臂的末端共價(jià)連接。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記與寡核苷酸的5’臂共價(jià)連接。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記與MB的寡核苷酸的3’臂共價(jià)連接。在一個(gè)實(shí)施方案中,MB的寡核苷酸上的可檢測(cè)標(biāo)記、可檢測(cè)標(biāo)記封阻劑和調(diào)節(jié)基團(tuán)不干擾MB與代表單鏈核酸中A、U、T、C或G核苷酸的定義序列進(jìn)行序列特異性互補(bǔ)雜交。在一個(gè)實(shí)施方案中,光學(xué)地檢測(cè)可檢測(cè)基團(tuán)的信號(hào)。如本文所用,“光學(xué)地檢測(cè)”就可檢測(cè)基團(tuán)信號(hào)而言指測(cè)量作為可檢測(cè)基團(tuán)所發(fā)射的信號(hào)的光能量。在一個(gè)實(shí)施方案中,發(fā)射的光能量具有380-760nm波長(zhǎng)范圍。在另一個(gè)實(shí)施方案中,發(fā)射的光能量具有700nm-1400nm波長(zhǎng)范圍。在另一個(gè)實(shí)施方案中,沒有光學(xué)地檢測(cè)可檢測(cè)基團(tuán)的信號(hào)。在一個(gè)實(shí)施方案中,可檢測(cè)基團(tuán)是熒光團(tuán)并且信號(hào)是熒光。使用廣泛類型的熒光團(tuán),可以使得MB具有許多不同的顏色(Tyagi S等人,Nature Biotechnology 1998 ;16:49-53)。隨MB使用的熒光團(tuán)的例子包括但不限于Alexa Fluor 350 ;Marina Blue ;Atto 390 ;Alexa Fluor 405 ;Pacific Blue ; Atto 425 ;Alexa Fluor 430 ;Atto 465 ;DY-485XL ;DY-475XL ;FAM 494 ;Alexa Fluor 488 ;DY-495-05 ;Atto 495 ;Oregon Green 488 ;DY-480XL 500 ;Atto 488 ;Alexa Fluor 500 ;Rhodamin Green ; DY-505-05 ;DY-500XL ;DY-510XL ;Oregon Green 514 ;Atto 520 ;Alexa Fluor 514 JOE 520 JET.TM. 521 ;CAL Fluor Gold 540 ;DY_521XL ; RhoctaminfiG ; Yakima Ydl0w⑩ 526 ;Atto532 ;Alexa Fluor 532 ;HEX 535 ;VIC 538 ;CALFluor0range560 ;DY-530 ;TAMRA ;Quasar570 ;Cy3 550 ;NED.TM. ;DY_550 ;Atto 550 ;Alexa Fluor 555 ;DY_555 ;Alexa FluOl 546 ;BMN 3 ;DY_547 ; PET ; Rhodamin Red ; Atto 565 ;CAL Fluor RED 590 ;R0X ;Alexa Fluor 568 ;Texas Red ; CAL FluorRed 610 ;LC Red 610 ;Alexa FlllOI 594 ;Atto 590 ;Atto 594 ;DY_600XL ;DY_610 ;Alexa FluOl' 610 ;CAL Fluor Red 635 ;Atto620 ;DY-615 ;LC Red 640 ;Atto 633 ;Alexa「hso!'卞.633 ;DY_630 ;DY_633 ;DY_631 ;LIZ638 ;Atto 647N ;BMN -5 ;Quasar 670 ;DY_635 ;Cy5 ;Alexa Fluor 647 ;CEQ8000D4 ;LC Red 670 ;DY_647652 ;DY_651 ;Atto 655 ;Alexa Fluor 660 ;DY_675 ;DY_676 ;Cy5. 5 675 ;Alexa Fluor 680 ;LC Red 705 ;BMN -6 ;CEQ8000D3 ; IRDye 700Dx 689 ;DY-680 ;DY-681 ;DY-700 ;Alexa Fluor 700 ;DY-701 ;DY-730 ;DY-731 ;DY-732 ;DY-750 ;Alexa Fluor 750 ;CEQ8000D2 ;DY_751 ;DY_780 ;DY_776 ; IRDye 800CW ;DY_782 ;和DY-781 ; Oyster 556 ; Oyster 645 ; IRDye 700,IRDye 800 ;WelIRED D4 ;WelIREDD3 ;WellRED D2 染料;Rhodamine Green ;Rhodamine Red ;熒光素;MAX 550 531 560JOE NHS 酯(類似 Vic) ;TYE 563 ;TEX 615 ;TYE 665 ;TYE 705 ;0DIPY 493/503TM ;
20BODIPY 558/568 ;B0DIPY564/570 ;B0DIPY 576/589 ;B0DIPY 581/591 ;B0DIPYTR-X ;B0DIPY-530/550 ;羧基-X-羅丹明 ;羧基萘熒光素;羧基羅丹明6G ;Cascade Blue ;7-甲氧基香豆素;6-J0E -J-氨基香豆素-X ;和2’,4’,5’,7’ -四溴砜熒光素菁染料;噻唑橙;洋地黃苷;熒光素(FAM);羅丹明x(ROX);四氯-6-羧基熒光素(TET);四甲基羅丹明(TAMRA) ;Alexa Fluor ; BOD IP Y ; OREGON GRE ΕΝ ; CASCADE B LUE ; Mar inaBlue ;PACIFIC BLUE ;RH0DAMINE GREEN ;RH0DAMINE RED ;和 TEXAS RED 是從 MolecularProbes, Inc.可商業(yè)獲得的。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑是熒光團(tuán)的猝滅劑。隨MB使用的熒光團(tuán)的猝滅劑的例子包括但不限于3’ I0WABLACK FQ、3’黑洞猝滅劑和3’Dabcyl ;BHQ-I ;BHQ-2 ; BBQ-650 ;DDQ-1 ;Iowa BlackRQ ;Iowa BlackFQ ; QSY-21 ; QSY-35 ;QSY-7 iQSY-9 ; QXL 490 ;QXL 570 ;QXL 610 ;QXL 670 ;QXL 680 ;DNP ;和 EDANS。存在許多猝滅劑-熒光團(tuán)組合,每種組合物產(chǎn)生獨(dú)特的顏色或熒光發(fā)射譜(見,例如,molecularbeacons. org的網(wǎng)站和其中引用的參考文獻(xiàn))。技術(shù)人員會(huì)認(rèn)識(shí)到各種突光團(tuán)和猝滅劑各自在特定的波長(zhǎng)或波長(zhǎng)范圍具有最佳活性。因此,技術(shù)人員將知道選擇熒光團(tuán)和猝滅劑對(duì),從而熒光團(tuán)的最佳激發(fā)和發(fā)射光譜與猝滅劑的有效范圍匹配。構(gòu)思的猝滅劑-熒光團(tuán)對(duì)的例子是6_FAM、HEX或TET與3’ -Dabcyl ;5’ -香豆素或伊紅與3’ -Dabcyl ;5’ -Texas Red或四甲基羅丹明與3’ -黑洞猝滅劑;和EDANS和3’ -DABCYL0在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑和可檢測(cè)標(biāo)記均位于MB的寡核苷酸的相同末端處,即,均位于MB的寡核苷酸的3’末端或5’末端上。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑不緊鄰MB的寡核苷酸上的可檢測(cè)標(biāo)記存在。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑和可檢測(cè)標(biāo)記由MB的寡核苷酸上的至少3個(gè)核苷酸或單體、MB的寡核苷酸上的至少4個(gè)核苷酸、至少5個(gè)核苷酸、至少6個(gè)核苷酸、至少7個(gè)核苷酸、至少8個(gè)核苷酸、至少9個(gè)核苷酸、至少10個(gè)核苷酸、至少11個(gè)核苷酸、至少12個(gè)核苷酸、至少13個(gè)核苷酸、至少14個(gè)核苷酸、至少15個(gè)核苷酸、至少16個(gè)核苷酸、至少17個(gè)核苷酸、至少18個(gè)核苷酸、至少19個(gè)核苷酸、至少20個(gè)核苷酸、至少21個(gè)核苷酸、至少22個(gè)核苷酸、至少23個(gè)核苷酸、至少24個(gè)核苷酸或至少25個(gè)核苷酸或單體分隔。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑位于MB的寡核苷酸的一個(gè)末端處,而可檢測(cè)標(biāo)記位于MB的寡核苷酸的另一末端處。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑與MB的寡核苷酸的一條臂、優(yōu)選地與MB的寡核苷酸的3’臂共價(jià)連接。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑與MB的寡核苷酸的3’臂共價(jià)連接。在另一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑與MB的寡核苷酸的5’臂共價(jià)連接。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑位于與MB的寡核苷酸上的可檢測(cè)標(biāo)記相對(duì)的末端。例如,如果可檢測(cè)標(biāo)記封阻劑位于MB的寡核苷酸的5’末端,則可檢測(cè)標(biāo)記位于同一個(gè)MB的寡核苷酸的3’末端。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑與MB的寡核苷酸的一條臂的末端共價(jià)連接,并且可檢測(cè)標(biāo)記與同一個(gè)寡核苷酸的另一條臂的末端共價(jià)連接。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑與MB的寡核苷酸的3’臂共價(jià)連接,并且可檢測(cè)標(biāo)記與同一個(gè)寡核苷酸的5’臂共價(jià)連接。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑與MB的寡核苷酸的5'臂共價(jià)連接,并且可檢測(cè)標(biāo)記與同一個(gè)寡核苷酸的3’臂共價(jià)連接。在一個(gè)實(shí)施方案中,熒光團(tuán)與MB的寡核苷酸的一條臂的末端共價(jià)連接,并且熒光猝滅劑與同一個(gè)
21寡核苷酸的另一條臂的末端共價(jià)連接。在一個(gè)優(yōu)選的實(shí)施方案中,熒光猝滅劑與MB的寡核苷酸的3,臂共價(jià)連接,并且熒光團(tuán)與同一個(gè)寡核苷酸的5’臂共價(jià)連接。在另一個(gè)優(yōu)選實(shí)施方案中,MB的寡核苷酸的3’臂指MB的寡核苷酸的3’末端并且MB的寡核苷酸的5’臂指MB的寡核苷酸的5’末端。在某些實(shí)施方案中,可檢測(cè)標(biāo)記、可檢測(cè)標(biāo)記封阻劑和調(diào)節(jié)基團(tuán)通過共價(jià)鍵與MB的寡核苷酸偶聯(lián)。在一個(gè)實(shí)施方案中,共價(jià)鍵包含間隔區(qū)、優(yōu)選地直鏈烷基間隔區(qū)?!芭悸?lián)”意指至少兩個(gè)分子的共價(jià)鍵。間隔區(qū)的本質(zhì)不是關(guān)鍵性的。例如,熒光猝滅劑如EDANS和DABCYL可以借助本領(lǐng)域熟知和常見使用的6個(gè)碳長(zhǎng)度的烷基間隔區(qū)連接。烷基間隔區(qū)賦予可檢測(cè)標(biāo)記和可檢測(cè)標(biāo)記封阻劑足夠柔性以便彼此相互作用以出現(xiàn)高效熒光共振能量轉(zhuǎn)移并且因此出現(xiàn)高效猝滅。本領(lǐng)域技術(shù)人員將理解合適的間隔區(qū)的化學(xué)組分。碳鏈間隔區(qū)的長(zhǎng)度可以大幅度變動(dòng),例如,從至少I個(gè)和高達(dá)15個(gè)碳或30個(gè)碳長(zhǎng)度的烷基間隔區(qū)。在一個(gè)實(shí)施方案中,可檢測(cè)標(biāo)記封阻劑還是調(diào)節(jié)基團(tuán)。這種調(diào)節(jié)基團(tuán)的非限制性例子是金。金納米粒子已經(jīng)顯示使突光團(tuán)粹滅,例如,在Ghosh等人ChemicalPhysics Letters, 2004,395:366-372 ;Dulkeith 等人 Nano Lett. , 2005, 5:585-589 ;Mayilo 等人 Nano Lett. , 2009, 9:4558-4563 ;Dulkeith 等人 Physical ReviewLetters, 2002, 89:203002 ;Fan 等人 PNAS, 2003,100:6297-6301 中描述。這些參考文獻(xiàn)通過引用的方式完整地并入本文。調(diào)節(jié)基團(tuán)的主要功能是向MB的寡核苷酸增加體積并且以這種方式向雙鏈核酸增加體積,其中所述雙鏈核酸在多個(gè)MB與代表單鏈核酸中A、U、T、C或G核苷酸的定義序列雜交以形成雙鏈核酸時(shí)形成。雙鏈核酸上所添加的體積起到以下作用(I)封阻雙鏈核酸通過直徑開口大于2. 2nm的孔;(2)促進(jìn)具有較大孔徑的納米孔用于納米孔解鏈依賴性核酸測(cè)序,和(3)輔助在納米孔解鏈依賴性核酸測(cè)序期間在單鏈核酸上雜交的多個(gè)MB的解鏈。解鏈?zhǔn)且粋€(gè)順序過程。圖9中顯示正在經(jīng)歷解鏈過程的雙鏈核酸,此時(shí)一條鏈經(jīng)過納米孔120移位。經(jīng)過具有孔寬度Dl (101)的納米孔120移位的單鏈核酸109是代表待測(cè)序的核酸中A、U、T、C或G核苷酸的定義序列。待測(cè)序的核酸已經(jīng)轉(zhuǎn)化成在這種納米孔解鏈DNA測(cè)序方法中使用的單鏈109代表性定義序列。雙鏈核酸包含單鏈序列109和在其上互補(bǔ)性雜交的多個(gè)MB111。每種MB包含帶有末端熒光團(tuán)105和熒光團(tuán)猝滅劑107的寡核苷酸117,以及調(diào)節(jié)基團(tuán)103。圖9中所示的MB具有分開和不同的封阻劑和調(diào)節(jié)基團(tuán)。如圖9中所示,不帶大體積調(diào)節(jié)基團(tuán)的雙鏈核酸的寬度是D2 (113)。當(dāng)Dl大于D2時(shí),不帶大體積調(diào)節(jié)基團(tuán)的雙鏈核酸可以經(jīng)過寬度Dl的納米孔移位。調(diào)節(jié)基團(tuán)103的存在增加帶有大體積調(diào)節(jié)基團(tuán)的雙鏈核酸的寬度到大于Dl (101)的D3 (115)。在納米孔120的入口處,帶有調(diào)節(jié)基團(tuán)的MB 111與單鏈核酸109 “敲離”,原因在于MB 111和單鏈核酸109之間的親和力弱于調(diào)節(jié)基團(tuán)103對(duì)MB 111的親和力。MB 111與單鏈核酸109的互補(bǔ)性雜交借助MB上的核堿基和單鏈核酸之間弱的非共價(jià)氫鍵進(jìn)行。在一些實(shí)施方案中,調(diào)節(jié)基團(tuán)103與MB 111共價(jià)連接。由于共價(jià)鍵強(qiáng)于氫鍵,當(dāng)雙鏈核酸在電場(chǎng)中試圖移位納米孔時(shí),較弱的氫鍵斷裂并且MB 111從雙鏈核酸中釋放出來。在一些實(shí)施方案中,調(diào)節(jié)基團(tuán)103與MB 111非共價(jià)連接,但是這種非共價(jià)連接強(qiáng)于氫鍵。強(qiáng)于氫鍵的非共價(jià)連接是離子相互作用和疏水相互作用。這種非共價(jià)連接的非限制性例子是本領(lǐng)域熟知的抗生物素蛋白-生物素連接??股锼氐鞍椎慕怆x常數(shù)經(jīng)測(cè)量是Kd約等于10_15M,從而使得它成為已知最強(qiáng)的非共價(jià)連接之一。在一個(gè)實(shí)施方案中,雜交的單鏈核酸和MB之間的結(jié)合親和力小于MB的調(diào)節(jié)基團(tuán)和寡核苷酸的結(jié)合親和力,由此當(dāng)所述雙鏈核酸試圖在電勢(shì)影響下通過納米孔的開口時(shí),所述單鏈核酸和MB之間的鍵而不是所述MB的調(diào)節(jié)基團(tuán)和寡核苷酸之間的鍵破壞。在一個(gè)實(shí)施方案中,雜交的單鏈核酸和MB之間的氫鍵弱于調(diào)節(jié)基團(tuán)和MB的寡核苷酸之間的離子相互作用和/或疏水相互作用。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)與MB的寡核苷酸共價(jià)連接。在另一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)與MB的寡核苷酸非共價(jià)連接。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)選自但不限于納米級(jí)粒子、蛋白質(zhì)分子、有機(jī)金屬粒子、金屬粒子和半導(dǎo)體粒子。以下是本文中構(gòu)思的調(diào)節(jié)基團(tuán)類型的非限制性例子。構(gòu)思可以使用在連接MB時(shí)可以向MB增加體積并且仍不干擾互補(bǔ)性堿基配對(duì)的任何分子作為調(diào)節(jié)基團(tuán)。納米級(jí)粒子低于IOOOnm的任何粒度,例如TiO2珠、金珠、銀珠或乳膠珠、富勒烯(巴克球)、脂質(zhì)體、二氧化硅-金納米殼和量子點(diǎn)。種類繁多的納米粒子是可商業(yè)獲得的,例如,來自 INVITR0GEN 的 DYNABEADS、來自 PR0MEGA 的 MAGNESPHERE、和來自 BI0CL0NE 的磁珠。聚苯乙烯乳膠納米珠與DNA的偶聯(lián)由Huang等人,在Analytical Biochemistry1996,237:115-122中描述,所述文獻(xiàn)通過引用方式完整地并入本文。蛋白質(zhì)分子DNA結(jié)合蛋白,例如,鋅指蛋白和組蛋白;tat肽;核定位信號(hào)(NLS)肽;鏈霉親和素、抗生物素蛋白和抗生物素蛋白的多種修飾形式,例如,中性抗生物素蛋白(neutravidin)。DNA結(jié)合蛋白天然地與DNA結(jié)合。在一個(gè)實(shí)施方案中,可以使用尺度范圍l-20nm的蛋白質(zhì)粒子。尺度范圍4_20nm的其他蛋白質(zhì)粒子可以通過酰胺鍵形成與蛋白質(zhì)共價(jià)連接,這在 Taylor, J. R.等人,AnalyticalChemistry 2000, 72:1979-1986 ;Pagratis, N. Nucl. Acids Res. 1996, 24:3645-3646 ;Niemeyer, C.等人,Nucl. AcidsRes. 1999,27:4553-4561 ;Stahl, S.等人,Nucleic Acids Research 1988, 16:3025-3038 ;Sun, H.等人,Biosensors and Bioelectronics 2009,24:1405-1410 中描述。這些參考文獻(xiàn)通過引用的方式完整地并入本文。有機(jī)金屬粒子可以通過Ihara, T 等人,在 Nucl.Acids Res. 1996,24:4273-4280中; 和 Navarro,A.-E.等人,Bioorganic&MedicinalChemistry Letters2004, 14:2439-2441描述的二甲氧基三苯甲基核苷磷酰亞胺偶聯(lián)法偶聯(lián)二茂鐵(0. 5nm)。這些參考文獻(xiàn)通過弓I用的方式完整地并入本文。金屬粒子金和鍍銀的金(大小可以是I. 4-100nm)和銀(25-30nm)。這些金屬粒子可以通過環(huán)狀二硫化物、二硫化物、巰基(硫氫基)和胺官能團(tuán)并且還通過生物素與MB寡核苷酸偶聯(lián)。這些方法在Mirkin,C.A.等人,Nature 1996, 382:607-609 ;Alivisatos, A.等人,Naturel996, 382:609-611 ;Mucic, R. C 等人,J. Amer. Chem.Soc. 1998, 120:2674-12675 ;Taton, T. A.等人,Science 2000,289:1757-1760 ;Taton, T. A.等人,J. Amer. Chem. Soc. 2001,123: 5164-5165 ;Segond vonBanchet, G.和 Heppelman,B. :J.Histochem.Cytochem. , 43, 821 (1995)) ;Letsinger,R.L 等人,Bioconjugate Chemistry 2000, 11:289-291 ;Tokareva,I.和 Hutter, E. J. Amer. Chem.Soc. 2004, 126:15784-15789 ;Lee, J. -S.等人,Nano Letters 2007, 7:2112-2115 ;Sun, H.等人,Biosensors and Bioelectronics 2009,24:1405-1410 中詳細(xì)描述。這些參考文獻(xiàn)
23通過引用的方式完整地并入本文。半導(dǎo)體粒子量子點(diǎn)和ZnS。多種半導(dǎo)體型納米粒子是商業(yè)可獲得的,例如,來自INVITR0GEN 。在一個(gè)實(shí)施方案中,可以使用具有15_20nm大小范圍的半導(dǎo)體粒子。這些粒子可以借助生物素、金屬-巰基相互作用、糖苷鍵和、靜電相互作用或半胱氨酸加帽的粒子與MB寡核苷酸連接。這些方法由Wu, S. -M.等人,Chem. Phys. Chem. 2006,7:1062—1067 ;Xiao, Y.和 Barker, P. E. Nucl. Acids Res. 2004, 32: e28 ;Yu, ff. ff.等人,Biochemical andBiophysical ResearchCommunications 2006, 348:781-786 ;Artemyev, M.等人,J. Amer.Chem. Soc. 2004,126:10594-10597 ;Li, Y.等人,Spectrochimica Acta Part A:Molecularand Biomolecular Spectroscopy 2004,60:1719-1724 描述。這些參考文獻(xiàn)通過引用的方式完整地并入本文。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)位于MB的寡核苷酸的5’末端或3’末端處。在另一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)在距離MB的寡核苷酸的3’或5’末端2-7個(gè)核苷酸內(nèi)部連接。調(diào)節(jié)基團(tuán)可以位于距離MB的寡核苷酸的3’或5’末端的第二核苷酸處、第三核苷酸處、第四核苷酸處、第五核苷酸處、第六核苷酸處或第七核苷酸處。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)與MB的寡核苷酸的主鏈連接。核酸的基本結(jié)構(gòu)和組分是本領(lǐng)域已知的。核酸是由主鏈和核堿基組成的聚合物,其中所述主鏈包含交替的糖和磷酸鹽或嗎啉代。在另一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)與MB的寡核苷酸的核堿基連接。在一些實(shí)施方案中,調(diào)節(jié)基團(tuán)通過碳接頭與MB的寡核苷酸連接。在一些實(shí)施方案中,這種碳接頭具有1-30個(gè)碳(烷基)殘余物。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)增加雙鏈核酸在調(diào)節(jié)基團(tuán)與寡核苷酸連接的點(diǎn)處的寬度(D3)到大于2. O納米(nm),其中通過MB與代表A、U、T、C或G的定義序列雜交形成雙鏈核酸。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)增加寬度D3大于2. 2nm。在其他實(shí)施方案中,調(diào)節(jié)基團(tuán)增加寬度 D3 大于 3. 0,3. 1,3. 2,3. 3,3. 4,3. 5,3. 6,3. 7,3. 8,3. 9,4. 0,4. 1,4. 2,4. 3,4. 4、
4.5、4. 6、4. 7、4. 8、4. 9、5. 0、5. 1、5. 2、5. 3、5. 4、5. 5、5. 6、5. 7、5,8、5. 9、6. 0、6. 1、6. 2、6. 3、
6.4、6. 5、6,6、6. 7、6. 8、6. 9、7. O、7. I、7. 2、7. 3、7. 4、7. 5、7. 6、7. 7、7. 8、7. 9、8. O、8. I、8. 2、
8.3、8· 4、8· 5、8· 6、8· 9、9· 0、9· 1、9· 2、9· 3、9· 4、9· 5、9· 6、9· 7、9· 8、9· 9 或 IOnm0在一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度(D3)是約3-7nm。在一個(gè)實(shí)施方案中,寬度D3是約3_7nm。在一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與單鏈核酸連接的點(diǎn)處的寬度可以通過側(cè)接頭,例如,C20、C15、C12、C9、C8、C6、C5、C4、C3和C2接頭進(jìn)一步增加。在一個(gè)實(shí)施方案中,MB的寡核苷酸上的調(diào)節(jié)基團(tuán)是3_5nm。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是0. 5nm至lOOOnrn。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是90_944nm。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是4-20nm。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是I. 4_100nm。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是25-30nm。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是15_20nm。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是15_30nm。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是150_300nm。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是9-50nm。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)是10-100nm。在其他實(shí)施方案中,調(diào)節(jié)基團(tuán)是3-1000nm、3-944nm、3-30nm、3-100nm、3-25nm、3-50nm、3-300nm、3-90nm、3-15nm、3-9nm 和3-4nm,包括3和IOOOnm之間的全部數(shù)字至第二小數(shù)位。在一個(gè)實(shí)施方案中,當(dāng)鏈核酸經(jīng)歷納米孔測(cè)序時(shí),調(diào)節(jié)基團(tuán)促進(jìn)雙鏈核酸的解鏈。在本文所述方法的一個(gè)實(shí)施方案中,納米孔尺寸允許待測(cè)序的單鏈核酸通過所述孔,但是不允許雙鏈核酸通過所述孔,其中所述雙鏈核酸由本文所述的MB與單鏈核酸或代表A、C、T、G或U的定義序列雜交形成。在本文所述方法的一個(gè)實(shí)施方案中,納米孔開口大于2nm但是小于lOOOnm。在一個(gè)實(shí)施方案中,納米孔開口大于2nm但是小于雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度。在本文所述方法的一個(gè)實(shí)施方案中,孔(Dl)具有約3nm至約6nm的開口直徑。在本文所述方法的又一個(gè)實(shí)施方案中,孔具有約3nm至與MB寡核苷酸連接的調(diào)節(jié)基團(tuán)的75%寬度的開口直徑。在本文所述方法的某些實(shí)施方案中,孔具有約2. 2nm至10nm、約2. 2nm至75nm或約2. 2nm至IOOnm的直徑。在其他實(shí)施方案中,孔(Dl)具有例如約3. 0,3. 1,3. 2、3. 3、3· 4、3· 5、3· 6、3· 7、3· 8、3· 9、4· 0、4· 1、4· 2、4· 3、4· 4、4· 5、4· 6、4· 7、4· 8、4· 9、5· 0、5· I、5. 2、5. 3、5. 4、5. 5、5. 6、5. 7、5,8、5. 9、6. O、6. I、6. 2、6. 3、6. 4、6. 5、6,6、6. 7、6. 8、6. 9、7. O、7. 1、7· 2、7· 3、7· 4、7· 5、7· 6、7· 7、7· 8、7· 9、8· 0、8· 1、8· 2、8· 3、8· 4、8· 5、8· 6、8· 9、9· 0、9· I、9. 2、9. 3、9. 4、9. 5、9. 6、9. 7、9. 8、9. 9 或 IOnin 直{5。在本文所述方法的一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度(D3)大于2nm。在本文所述方法的另一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度(D3)大于2. 2nm。在本文所述方法的其他實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度(D3)在直徑方面大于3. 0,3. I、3. 2、3· 3、3· 4、3· 5、3· 6、3· 7、3· 8、3· 9、4· 0、4· 1、4· 2、4· 3、4· 4、4· 5、4· 6、4· TA. 8、4· 9、5· O、
5.I、5. 2、5. 3、5. 4、5. 5、5. 6、5. 7、5,8、5. 9、6. O、6. I、6. 2、6. 3、6. 4、6. 5、6,6、6. 7、6. 8、6. 9、
7.0、7· 1、7· 2、7· 3、7· 4、7· 5、7· 6、7· 7、7· 8、7· 9、8· 0、8· 1、8· 2、8· 3、8· 4、8· 5、8· 6、8· 9、9· O、
9.1、9· 2、9· 3、9· 4、9· 5、9· 6、9· 7、9· 8、9· 9 或 10nm,其中 D3 總大于 D1。在本文所述方法的一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度(D3)是約3-5nm。在本文所述方法的一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與MB的寡核苷酸連接的點(diǎn)處的寬度(D3)是約3-6nm。在其他實(shí)施方案中,D3是約3_7nm、3-8nm、3-9nm、3-10nm、3-12nm、3-15nm、3-17nm 或 3_20nmo在本文所述方法的一個(gè)實(shí)施方案中,D3大于2nm。在本文所述方法的另一個(gè)實(shí)施方案中,D3大于2. 2nm。在一個(gè)實(shí)施方案中,D3是約3_7nm。在本文所述方法的一個(gè)實(shí)施方案中,Dl大于2nm。在本文所述方法的另一個(gè)實(shí)施方案中,Dl大于2. 2nm。在一個(gè)實(shí)施方案中,Dl是約3_6nm。在本文所述方法的一個(gè)實(shí)施方案中,雙鏈核酸在調(diào)節(jié)基團(tuán)與聚合物連接的點(diǎn)處的寬度(D3)大于納米孔的開口寬度(Dl),因而當(dāng)雙鏈核酸試圖在電勢(shì)的影響下通過這個(gè)開口時(shí),調(diào)節(jié)基團(tuán)封阻雙鏈核酸上的MB進(jìn)入所述開口并且MB從雙鏈核酸中解鏈。在本文所述方法的一個(gè)實(shí)施方案中,D3大于D1。在一個(gè)實(shí)施方案中,Dl最多為D3寬度的75%。在本文所述方法的一個(gè)實(shí)施方案中,雜交的單鏈核酸和MB之間的結(jié)合親和力小于MB的調(diào)節(jié)基團(tuán)和寡核苷酸的結(jié)合親和力,因而當(dāng)雙鏈核酸試圖在電勢(shì)影響下通過納米孔的開口時(shí),單鏈核酸和MB之間的鍵而不是MB的調(diào)節(jié)基團(tuán)和寡核苷酸之間的鍵破壞。在一個(gè)實(shí)施方案中,單鏈核酸和MB之間的鍵是非共價(jià)的氫鍵。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)和MB的寡核苷酸之間的鍵是共價(jià)鍵。在一個(gè)實(shí)施方案中,單鏈核酸和MB之間的鍵是非共
25價(jià)的氫鍵,并且調(diào)節(jié)基團(tuán)和MB的寡核苷酸之間的鍵是非共價(jià)鍵如離子相互作用和疏水相互作用。在本文所述方法的一個(gè)實(shí)施方案中,當(dāng)雙鏈核酸試圖在電勢(shì)的影響下通過這個(gè)開口時(shí),調(diào)節(jié)基團(tuán)封阻雙鏈核酸上的MB寡核苷酸進(jìn)入所述開口,單鏈核酸和MB寡核苷酸之間的非共價(jià)氫鍵變得破裂。MB寡核苷酸在納米孔的入口處逐個(gè)依次和按時(shí)間順序分離并且從單鏈核酸釋放,其中單鏈核酸進(jìn)入納米孔而分離的MB不進(jìn)入。在本文所述方法的一個(gè)實(shí)施方案中,待測(cè)序的核酸是DNA或RNA。在本文所述方法的一個(gè)實(shí)施方案中,使用單個(gè)孔。在另一個(gè)實(shí)施方案中,使用多個(gè)孔。MB的合成和將外部基團(tuán)與寡核苷酸偶聯(lián)的方法是本領(lǐng)域技術(shù)人員已知的。帶有所需官能團(tuán)的分子信標(biāo)可以使用標(biāo)準(zhǔn)寡核苷酸合成技術(shù)合成或購(gòu)買(例如,從IntegratedDNA Technologies購(gòu)買)。技術(shù)人員將認(rèn)識(shí)到許多額外的分子信標(biāo)序列是市售的并且可以設(shè)計(jì)額外的分子信標(biāo)序列用于本發(fā)明方法中。對(duì)設(shè)計(jì)有效分子信標(biāo)核苷酸序列的標(biāo)準(zhǔn)的詳細(xì)討可以在分子信標(biāo)組織(molecular-beacons organization)的互聯(lián)網(wǎng)上和在Marras 等人,(2003) ^Genotyping single nuc leoti depolymorph isms with molecularbeacons (用分子信標(biāo)對(duì)單核苷酸多態(tài)性進(jìn)行基因分型”)(引自Kwok, P. Y.(編著),Singlenucleotidepolymorphisms:methods and protocols (單核苷酸多態(tài)性:方法和操作方案)· The Humana Press Inc. , Totowa, N. J.,第 212 卷,第 111-128 頁);和 Vet 等人(2004) “ (Design and optimization of molecular beacon real-timepolymerasechain reaction assays)分子信標(biāo)實(shí)時(shí)聚合酶鏈反應(yīng)測(cè)定法的設(shè)計(jì)和優(yōu)化.”(引自Herdewi jn, P.(編著),Oligonucleotide synthesis :Methods and Applications (寡核苷酸合成方法和應(yīng)用).Humana Press, Totowa, N. J.,第288卷,第273-290頁)中找到,所述文獻(xiàn)的內(nèi)容通過引用的方式完整地并入本文。分子信標(biāo)也可以使用從PremierBiosoftInternational (Palo Alto, Calif.)可獲得的專用軟件(如名為“信標(biāo)設(shè)計(jì)師”)設(shè)計(jì),所述軟件的內(nèi)容通過引用方式完整地并入本文。許多修飾的核苷、核苷酸和適于摻入核苷中的多種堿基是從多個(gè)制造商可商業(yè)獲得的,包括 SIGMAchemical company(Saint Louis, Mo.)> R&DSystems (Minneapolis, Minn. )、Pharmacia LKBBiotechnology (Piscataway, N. J.) >CLONTECH Laboratories,Inc. (PaloAlto, Calif.)> Genes Corp. , Aldrich ChemicalCompany(Milwaukee, ffis. )> Glen Research, Inc. , GIBCO BRL Life Technologies,Inc.(Gaithersberg,Md.)、Fluka Chemica-Biochemika Analytika (FlukaChemie AG,Buchs, Switzerland)> Invitrogen , San Diego, Calif.和 Applied Biosystems(FosterCity, Calif.)以及技術(shù)人員已知的許多其他商業(yè)來源。將堿基與糖部分連接以形成核苷的方法是已知的。見,例如,Lukevics和Zablocka (1991), NucleosideSynthesis: OrganosiliconMethods (核苷合成有機(jī)娃法),Ellis Horwood LimitedChichester, WestSussex, England及其中的參考文獻(xiàn)。使核苷磷酸化以形成核苷酸和將核苷酸摻入寡核苷酸中的方法也是已知的。見,例如,Agrawal (編著)(1993)Protocols forOligonucleotides and Analogues, Synthesis andProperties (寡核苷酸及類似物的操作方案、合成和性能),Methods inMolecular Biology,第 20 卷,Humana Press, Towota, N.J.及其中的參考文獻(xiàn)。此外,定制設(shè)計(jì)的MB也是市售的,例如,GENE TOOL LLC的Morpholino ;BI0-SYNTHESIS Inc.的 PNA 及嵌合 PNA ;和 EXIQON 的 LNA。修飾的核苷、核苷酸和多種堿基提供合適的接頭用于連接本文所述的可檢測(cè)標(biāo)記、可檢測(cè)標(biāo)記封阻劑和調(diào)節(jié)基團(tuán)。接頭可以置于MB寡核苷酸的3’末端、5’末端或內(nèi)部。本領(lǐng)域技術(shù)人員將能夠選擇適宜的接頭并且在MB的合成期間摻入這些接頭。氨基接頭的非限制性例子是2’ -脫氧腺苷-8-C6氨基接頭、2’ -脫氧胞苷-5-C6氨基接頭、2’ -脫氧胞苷-5-C6氨基接頭、2’ -脫氧鳥苷-8-C6氨基接頭、3’ C3氨基接頭、3’ C6氨基接頭、3’ C7氨基接頭、5’ C12氨基接頭、5’ C6氨基接頭、C7內(nèi)部的氨基接頭、胸苷-5-C2和C6氨基接頭、胸苷-5-C6氨基接頭。巰基接頭可以用來與馬來酰亞胺形成可逆的二硫鍵或穩(wěn)定的巰基醚鍵。巰基接頭的非限制性例子是3’ C3 二硫鍵接頭、3’ C6- 二硫鍵接頭和5’ C6 二硫鍵接頭。其他接頭包括但不限于用于3’末端的醛接頭、用于5’末端的醛醛接頭、生物素酰化-dT、羧基-dT和DADE接頭。用于偶聯(lián)外部基團(tuán)的修飾的核苷、核苷酸和多種堿基是可商業(yè)獲得的,例如,來自 TriLINK BIOTECHNOLOGIES。在一些實(shí)施方案中,可檢測(cè)標(biāo)記、可檢測(cè)標(biāo)記封阻劑和調(diào)節(jié)基團(tuán)通過共價(jià)鍵借助間隔區(qū)、優(yōu)選地直鏈烷基間隔區(qū)與MB寡核苷酸偶聯(lián)。本領(lǐng)域技術(shù)人員將理解合適的間隔區(qū)的化學(xué)組分。碳鏈間隔區(qū)的長(zhǎng)度可以大幅度變動(dòng),具有至少I個(gè)至30個(gè)碳。在一些實(shí)施方案中,MB寡核苷酸具有與之連接的外部基團(tuán)。例如,基團(tuán)可以與核苷糖環(huán)上或嘌呤環(huán)或嘧啶環(huán)上的多個(gè)位置,其中所述嘌呤環(huán)或嘧啶環(huán)可以通過與帶負(fù)電荷的磷酸酯主鏈靜電相互作用或通過在大溝和小溝中的氫鍵相互作用使雙鏈體穩(wěn)定。例如,腺苷和鳥苷核苷酸任選地在N2位置處以咪唑基丙基置換,增加雙鏈體穩(wěn)定性。通用堿基類似物如3-硝基吡咯和5-硝基吲哚任選地包含于寡核苷酸探針中,以便通過堿基堆疊相互作用改善雙鏈體穩(wěn)定性。在某些實(shí)施方案中,可檢測(cè)標(biāo)記、可檢測(cè)標(biāo)記封阻劑和調(diào)節(jié)基團(tuán)的連接借助在Mb寡核苷酸和標(biāo)記/封阻劑或調(diào)節(jié)基團(tuán)上可用的伯胺(-NH2)或仲胺、羧基(-C00H)、硫氫基/巰基(-SH)、伯羥基或仲羥基和羰基(-CH0)官能團(tuán)進(jìn)行。本領(lǐng)域技術(shù)人員將認(rèn)識(shí)本文所述的可用官能團(tuán)或?qū)⒛軌蛟O(shè)計(jì)并且合成帶有用于偶聯(lián)目的的所需官能團(tuán)的MB寡核苷酸或標(biāo)記/封阻劑或調(diào)節(jié)基團(tuán)。例如,在肽不含有用于化學(xué)交聯(lián)的可用反應(yīng)性巰基的情況下,幾種方法可用于將巰基導(dǎo)入蛋白質(zhì)和肽中,包括但不限于還原固有二硫鍵以及將胺或羧酸基團(tuán)轉(zhuǎn)化成巰基。這類方法是本領(lǐng)域技術(shù)人員已知的并且存在用于此目的的許多商業(yè)試劑盒,如來自 INVITROGENtmInc.的 Molecular Probes 分公司和 Pierce Biotechnology。在一個(gè)實(shí)施方案中,偶聯(lián)可以在MB寡核苷酸上的氨基接頭上的蛋白質(zhì)的羧基基團(tuán)和胺基團(tuán)之間發(fā)生。氨基接頭可以位于MB寡核苷酸的3’、5’或內(nèi)部。使用化學(xué)交聯(lián)劑偶聯(lián)幾個(gè)分子是本領(lǐng)域熟知的。交聯(lián)試劑是可商業(yè)獲得的或可以容易地合成。本領(lǐng)域技術(shù)人員將能夠基于可用于偶聯(lián)的官能團(tuán),例如蛋白質(zhì)中半胱氨酸氨基酸殘基之間的二硫鍵選擇適宜的交聯(lián)劑。不應(yīng)當(dāng)解釋為限制性的交聯(lián)劑的例子是戊二醛、雙(亞氨酯)、雙(琥珀酰亞胺酯)、二異氰酸酯和二酰氯??梢栽贗NVITROGEN的Molecular Probe的第5. 2部分找到關(guān)于化學(xué)交聯(lián)劑的廣泛數(shù)據(jù)。圖11A-11C是用于將肽與分子信標(biāo)連接的3個(gè)不同偶聯(lián)策略的例子。這些偶聯(lián)策略適用于選擇的任何調(diào)節(jié)基團(tuán)。圖IlA顯示鏈霉親和素-生物素連接,其中通過將生物
27素-dT借助碳-12間隔區(qū)導(dǎo)入莖部的猝滅劑臂而修飾分子信標(biāo)。生物素修飾的肽借助具有4個(gè)生物素結(jié)合位點(diǎn)的鏈霉親和素分子與修飾的分子信標(biāo)連接。選擇的生物素-dT可以具有O個(gè)碳直至18個(gè)碳的長(zhǎng)度變動(dòng)的間隔區(qū)。圖IlB顯示巰基-馬來酰亞胺連接,其中通過添加巰基修飾分子信標(biāo)莖部的猝滅劑臂,所述巰基可以與置于肽的C末端的馬來酰亞胺基團(tuán)反應(yīng)以形成直接穩(wěn)定的連接。圖IlC顯示可切割的二硫鍵,其中肽通過在C末端添加與巰基修飾的分子信標(biāo)形成二硫鍵的半胱氨酸殘基被修飾。巰基-dT是向寡核苷酸添加巰基的最常見方法。巰基-dT可以具有O個(gè)碳至18個(gè)碳的不同長(zhǎng)度的間隔區(qū)。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)與MB寡核苷酸的可檢測(cè)標(biāo)記臂連接。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)與MB寡核苷酸的熒光團(tuán)臂連接。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)與MB寡核苷酸的可檢測(cè)標(biāo)記封阻劑臂連接。在一個(gè)實(shí)施方案中,調(diào)節(jié)基團(tuán)與MB寡核苷酸的熒光團(tuán)猝滅劑臂連接。在一個(gè)實(shí)施方案中,由可檢測(cè)基團(tuán)發(fā)射的信號(hào)是熒光。檢測(cè)和測(cè)量熒光的方法是本領(lǐng)域技術(shù)人員已知的,例如在美國(guó)專利No. 6,191,852和美國(guó)專利申請(qǐng)公開No. 20090056949中描述。這些參考文獻(xiàn)通過引用的方式完整地并入本文。包含合成或天然納米孔的納米孔器件是本領(lǐng)域已知的并且本文中描述。見,例如,Heng, J. B.等人,Biophysical Journal 2006,90,1098-1106 ;Fologea, D.等人,NanoLetters 20055 (10), 1905-1909 ;Heng, J. B.等人,Nano Letters 20055(10), 1883-1888 ;Fologea, D.等人,NanoLetters 2005 5 (9), 1734-1737 ;Bokhari, S. H.和 Sauer, J.R. , Bioinformatics 200521(7), 889-896 ;Mathe, J.等人,Biophysical Journal200487, 3205-3212 ;Aksimentiev, A.等人,Biophysical Journal 2004 87, 2086-2097 ;Wang, H.等 A , PNAS 2004 101(37), 13472-13477 ;Sauer-Budge, A. F.等人,PhysicalReview Letters 2003 90(23), 238101-1-238101-4 ;Vercoutere, ff. A.等人,NucleicAcids Research2003 31(4),1311-1318 ;Meller,A.等人,Electrophoresis 200223,2583-2591。納米孔和使用它們的方法在美國(guó)專利No. 7,005,264 B2及6,617,113、美國(guó)專利申請(qǐng)公開 No. 2009/0029477 及 20090298072 和在 Soni 和 Meller, Clin.Chem. 2007, 53:11中公開。這些參考文獻(xiàn)通過引用的方式完整地并入本文。本發(fā)明可以在依字母順序排列的以下段落的任一個(gè)中定義[A]用于納米孔解鏈依賴性核酸測(cè)序的分子信標(biāo)(MB)文庫(kù),所述文庫(kù)包含多種MB,其中每種MB包含寡核苷酸,所述寡核苷酸包含(I)可檢測(cè)標(biāo)記;(2)可檢測(cè)標(biāo)記封阻劑;和(3)調(diào)節(jié)基團(tuán);其中MB能夠與代表單鏈核酸中A、U、T、C或G核苷酸的定義序列進(jìn)行序列特異性互補(bǔ)雜交以形成雙鏈(ds)核酸。[B]段落[A]的文庫(kù),其中寡核苷酸包含4-60個(gè)核苷酸。[C]段落[A]或[B]的文庫(kù),其中MB的寡核苷酸包含選自脫氧核糖核酸(DNA)、核糖核酸(RNA)、肽核酸(PNA)、鎖核酸(LNA)和磷酰二胺嗎啉代寡聚物(ΡΜ0或Morpholino)的核酸。[D]段落[A]_[C]的任一段落的文庫(kù),其中可檢測(cè)標(biāo)記在寡核苷酸的一個(gè)末端上連接并且處在文庫(kù)中全部寡核苷酸的相同末端上,其中在可檢測(cè)標(biāo)記不受封阻劑抑制時(shí),可檢測(cè)標(biāo)記發(fā)射可以檢測(cè)和/或測(cè)量的信號(hào)。
[E] [A]-[D]的任一段落的文庫(kù),其中MB不與固相載體連接。[F] [A]-[E]的任一段落的文庫(kù),其中寡核苷酸上的可檢測(cè)標(biāo)記、可檢測(cè)標(biāo)記封阻劑和調(diào)節(jié)基團(tuán)不干擾MB與代表單鏈核酸中A、U、T、C或G核苷酸的定義序列進(jìn)行序列特異性互補(bǔ)雜交。[A]-[F]的任一段落的文庫(kù),其中光學(xué)地檢測(cè)可檢測(cè)基團(tuán)的信號(hào)。[A]-[G]的任一段落的文庫(kù),其中可檢測(cè)基團(tuán)是熒光團(tuán)并且信號(hào)是熒光。[A]-[H]的任一段落的文庫(kù),其中可檢測(cè)標(biāo)記封阻劑是熒光團(tuán)的猝滅劑。段落[A]_[I]的任一段落的文庫(kù),其中可檢測(cè)標(biāo)記封阻劑還是調(diào)節(jié)基團(tuán)。段落[A]-[J]的任一段落的文庫(kù),其中調(diào)節(jié)基團(tuán)位于寡核苷酸的5’末端或3’末端。[L]段落[A]_[K]的任一段落的文庫(kù),其中調(diào)節(jié)基團(tuán)增加雙鏈核酸在調(diào)節(jié)基團(tuán)與寡核苷酸連接的點(diǎn)處的寬度到大于2. O納米(nm),其中通過MB與代表A、U、T、C或G的定義序列雜交形成雙鏈核酸。[M]段落[L]的文庫(kù),其中雙鏈核酸在調(diào)節(jié)基團(tuán)與寡核苷酸連接的點(diǎn)處的寬度是約 3_7nm。[N]段落[A]_[M]的任一段落的文庫(kù),其中調(diào)節(jié)基團(tuán)選自納米級(jí)粒子、蛋白質(zhì)分子、有機(jī)金屬粒子、金屬粒子和半導(dǎo)體粒子。[O]段落[A]_[N]的任一段落的文庫(kù),其中調(diào)節(jié)基團(tuán)是3_5nm。[P]段落[A]_
的任一段落的文庫(kù),其中當(dāng)雙鏈核酸經(jīng)歷納米孔測(cè)序時(shí),所述調(diào)節(jié)基團(tuán)促進(jìn)雙鏈核酸的解鏈。[Q]段落[A]_[P]的任一段落的文庫(kù),其中存在MB的兩個(gè)或更多個(gè)種類,其中MB的每個(gè)種類具有不同的可檢測(cè)標(biāo)記。[R] 一種使雙鏈(ds)核酸解鏈用于納米孔解鏈依賴性核酸測(cè)序的方法,所述方法包括a.將權(quán)利要求[A]_[Q]的分子信標(biāo)(MB)的文庫(kù)與待測(cè)序的單鏈核酸雜交,從而形成具有寬度D3的雙鏈(ds)核酸,所述雙鏈核酸因所述調(diào)節(jié)基團(tuán)的存在而形成,其中待測(cè)序的單鏈核酸是包含代表A、U、T、C或G的定義序列的聚合物;b.使步驟a)中形成的雙鏈核酸與具有寬度Dl的納米孔開口接觸,其中D3大于Dl ;并且c.施加跨納米孔的電勢(shì)以使雜交的分子信標(biāo)與待測(cè)序的單鏈核酸解鏈。[S]段落[R]的方法,其中所述納米孔尺寸允許待測(cè)序的單鏈核酸通過所述孔,但是不允許所述雙鏈核酸通過所述孔。[T]段落[R]或[S]的方法,其中Dl大于2nm。[U]段落[R]_[T]中任一段落的方法,其中Dl是3_6nm。[V]段落[R]_[U]中任一段落的方法,其中D3大于2nm。[ff]段落[R]_[V]中任一段落的方法,其中D3是約3_7nm。[X]段落[R]_[W]中任一段落的方法,其中雜交的單鏈核酸和MB之間的結(jié)合親和力小于MB的調(diào)節(jié)基團(tuán)和寡核苷酸的結(jié)合親和力,由此當(dāng)所述雙鏈核酸試圖在電勢(shì)影響下通過納米孔的開口時(shí),所述單鏈核酸和MB之間的鍵而不是所述MB的調(diào)節(jié)基團(tuán)和寡核苷酸
29之間的鍵破壞。[Y]段落[R]_[X]中任一段落的方法,其中所述待測(cè)序的核酸是DNA或RNA。[Z] 一種用于測(cè)定核酸的核苷酸序列的方法,其包括步驟a.將權(quán)利要求[A]_[Q]的分子信標(biāo)(MB)文庫(kù)與待測(cè)序的單鏈核酸雜交,從而形成具有寬度D3的雙鏈(ds)核酸,所述雙鏈核酸因所述調(diào)節(jié)基團(tuán)的存在而形成,其中待測(cè)序的單鏈核酸是包含代表A、U、T、C或G的定義序列的聚合物;b.使步驟a)中形成的雙鏈核酸與具有寬度Dl的納米孔開口接觸,其中D3大于Dl ;c.施加跨納米孔的電勢(shì)以使雜交的MB與待測(cè)序的單鏈核酸解鏈;并且d.當(dāng)所述MB在所述孔處出現(xiàn)時(shí)與所述雙鏈核酸分開時(shí),檢測(cè)由可檢測(cè)標(biāo)記從每種MB發(fā)射的信號(hào)。[AA]段落[Z]的方法進(jìn)一步包括將檢測(cè)到的信號(hào)序列解碼成所述核酸的核苷酸堿基序列。[BB]段落[Z]或[AA]的方法,其中納米孔尺寸允許待測(cè)序的單鏈核酸通過所述孔,但是不允許所述雙鏈核酸通過所述孔。[CC]段落[Z]_[BB]中任一段落的方法,其中Dl大于2nm。[DD]段落[Z]_[CC]中任一段落的方法,其中Dl是約3_6nm。[EE]段落[Z]_[DD]中任一段落的方法,其中D3大于2nm。[FF]段落[Z]_[EE]中任一段落的方法,其中D3是約3_7nm。[GG]段落[Z]_[FF]中任一段落的方法,其中雜交的單鏈核酸和MB之間的結(jié)合親和力小于MB的調(diào)節(jié)基團(tuán)和寡核苷酸的結(jié)合親和力,由此當(dāng)所述雙鏈核酸試圖在電勢(shì)影響下通過納米孔的開口時(shí),所述單鏈核酸和MB之間的鍵而不是所述MB的調(diào)節(jié)基團(tuán)和寡核苷酸之間的鍵破壞。[HH]段落[Z]_[GG]中任一段落的方法,其中待測(cè)序的核酸是DNA或RNA。本發(fā)明由以下實(shí)施例進(jìn)一步說明,這些實(shí)施例不應(yīng)當(dāng)解釋為限制性的。本申請(qǐng)通篇范圍內(nèi)引用的全部參考文獻(xiàn)的內(nèi)容并且附圖通過引用方式并入本文。
實(shí)施例采用納米孔陣列光學(xué)識(shí)別單分子DNA測(cè)序的各個(gè)核堿基介紹高通量DNA測(cè)序技術(shù)正在深刻地影響比較基因組學(xué)、生物醫(yī)學(xué)研究和個(gè)體化醫(yī)療1O具體而言,單分子DNA測(cè)序技術(shù)使所要求的DNA材料的量最小化,并且因此被視為提供指向?qū)挿秶鶧NA讀出長(zhǎng)度的低成本和高通量測(cè)序法的突出候選物卜4。固態(tài)納米孔是一類具有廣泛應(yīng)用的單分子探針技術(shù),包括表征DNA結(jié)構(gòu)和DNA-藥物或DNA-蛋白質(zhì)相互作用5_12。不同于其他單分子技術(shù),采用納米孔檢測(cè)不要求將大分子到表面上固定,因此簡(jiǎn)化樣品準(zhǔn)備。另外,固態(tài)納米孔可以按高密度形式制造,這將允許規(guī)模平行檢測(cè)的開發(fā)。納米孔是在將含有離子溶液的兩個(gè)腔室分隔的超薄膜中納米大小的孔??缭撃J┘拥耐獠侩妶?chǎng)在孔附近產(chǎn)生離子電流和局部電勢(shì)梯度,這以單文件方式牽引生物聚合物穿過該孔并且使其線性化6’13。隨著生物聚合物進(jìn)入該孔,它移走一部分電解液,導(dǎo)致孔導(dǎo)電性變化,這可以使用靜電計(jì)直接測(cè)量。最近已經(jīng)提出許多基于納米孔的DNA測(cè)序方法14并且凸顯出兩個(gè)主要難題15 1)在各個(gè)核苷酸(nt)之間區(qū)分的能力。該系統(tǒng)必須能夠在單分子水平區(qū)別4種堿基。2)這種方法必須能夠平行讀出。由于單納米孔一次僅可以探針一個(gè)單分子,因此需要用于制造納米孔陣列和同時(shí)監(jiān)測(cè)這些納米孔的策略。最近,已經(jīng)顯示,可以在用核酸外切酶切割DNA堿基后使用修飾的α-溶血素蛋白孔鑒定各個(gè)核苷酸16。然而,酶活性的動(dòng)力學(xué)仍是讀出的限速步驟。另外,這種方法以及在讀出階段涉及酶的其他單分子方法的通量受在分子之間大幅度變化的酶持續(xù)合成能力限制。迄今,仍未展示借助任何基于納米孔的方法平行讀出。發(fā)明人提出了一種用于高通量堿基識(shí)別的基于納米孔的新方法,所述方法避免在讀出階段期間對(duì)酶的需要并且提供了用于多孔檢測(cè)的簡(jiǎn)易方法。靶DNA分子的生物化學(xué)制備將每個(gè)堿基轉(zhuǎn)化成可以使用未修飾的固態(tài)納米孔直接讀取的形式。讀出速度和長(zhǎng)度因此不是酶限制性的。盡管先前公開使用電信號(hào)探測(cè)納米孔中的生物分子,但是發(fā)明人在此使用光學(xué)感知來檢測(cè)DNA序列。發(fā)明人已經(jīng)開發(fā)了一種定制全內(nèi)反射(TIR)方法,所述方法允許高時(shí)空分辨率寬域光學(xué)檢測(cè)經(jīng)納米孔移位的各個(gè)DNA分子17。在此,發(fā)明人使用這種系統(tǒng)來實(shí)現(xiàn)從多個(gè)納米孔同時(shí)光學(xué)檢測(cè)。因此,發(fā)明人為納米孔單分子測(cè)序方法的全部關(guān)鍵組分展示原理驗(yàn)證。方法電測(cè)量自行制造納米芯片,這始于使用LPCVD以30nm厚的低應(yīng)力SiN鍍覆雙側(cè)拋光的硅晶片。使用標(biāo)準(zhǔn)方法產(chǎn)生SiN窗(30X30 μ m2)。如先前描述,使用聚焦電子束制造納米孔(直徑3-5nm)28。將鉆孔的納米芯片在受控的濕度和溫度下清潔并且在定制設(shè)計(jì)的CTFE小室上裝配,所述CTFE小室并入玻璃蓋玻片底部(詳見參考文獻(xiàn)17)。通過將脫氣和過濾的IM KCI電解液添加到順式腔并且將含有8. 6M脲的IM KCI添加到反式腔室,將納米孔水合以促進(jìn)經(jīng)過反式腔的全內(nèi)反射(TIR)成像,如下文解釋。使用IOmM Tris-HCl,將全部電解液調(diào)節(jié)至pH 8.5。將Ag/AgCl電極浸入小室的每個(gè)腔中并且與Axon 200B前級(jí)(headstage)連接,所述Axon 200B前級(jí)用來跨膜施加固定電壓(對(duì)于全部實(shí)驗(yàn)均為300mV)并且用來在需要時(shí)測(cè)量離子電流。將流體室置于中定制的法拉第籠以減少噪聲拾取,所述法拉第籠安裝在改良的倒置顯微鏡上。納米孔電流使用50kHz低通Butterworth濾波器濾波并且使用250kHz/16比特的DAQ板卡(PCI-6154, Nationallnstruments, TX)采樣。使用如先前所述的定制LabView程序取得信號(hào)9。電/光學(xué)檢測(cè)和信號(hào)同步為了在懸浮的SiN膜附近實(shí)現(xiàn)高速單分子檢測(cè)各個(gè)熒光團(tuán),開發(fā)了一種大幅度減少熒光背景的定制TIR成像法17。調(diào)節(jié)反式腔溶液的折射率,從而可以在SiN膜處產(chǎn)生TIR,防止光繼續(xù)進(jìn)入順式腔,因此減少額外的背景。將小室安裝在高NA物鏡(Olympus 60X/1. 45)上,并且通過將入射激光束640nm激光(20mW,iFlex2000,Point-Source UK)聚焦至其后焦平面處的離軸點(diǎn),因而控制入射角來優(yōu)化TIR。使用Semrock(FF685Di01) 二色鏡,將熒光發(fā)射劈裂分成兩條獨(dú)立光路,并且將兩幅圖像投射到EM-CXD照相機(jī)(Andor, iXon DU-860)上。EM-CXD在最大增益和Ims積分時(shí)間下工作。通過將照相機(jī)'拍攝’脈沖連接至計(jì)數(shù)板卡(PCI-6602, Nationallnstruments, TX)實(shí)現(xiàn)電信號(hào)和光信號(hào)之間的同步,其中所述計(jì)數(shù)板卡共享與DAQ主板相同的采樣時(shí)鐘和啟動(dòng)觸發(fā)器(start trigger)。合并數(shù)據(jù)流包括在每個(gè)CCD巾貞的起點(diǎn)處獨(dú)特的時(shí)戳(time stamp),
31所述時(shí)戳與離子電流采樣同步。兩個(gè)獨(dú)立標(biāo)準(zhǔn)用于分類每個(gè)事件。首先,離子電流必須驟降至用戶定義的閾值水平以下,并且返回原始狀態(tài)之前在該水平保持至少100μ8。其次,在事件駐留時(shí)間(信號(hào)保持在閾值以下的時(shí)間)期間的相應(yīng)CCD幀必須僅在孔區(qū)域處顯示光子計(jì)數(shù)增加。通過讀取的以孔位置為中心的3X3像素區(qū)域內(nèi)的強(qiáng)度進(jìn)行雙色強(qiáng)度分析(見例如圖4a)。使用兩個(gè)通道中的原始強(qiáng)度數(shù)據(jù)來計(jì)算比率R=Ch2/Chl,所述比率用來區(qū)分兩個(gè)比特。使用校正數(shù)據(jù),以定制LabView代碼自動(dòng)地進(jìn)行區(qū)分(圖4c)。數(shù)據(jù)分析使用IGORPro (Wavemetrics)進(jìn)行,并且產(chǎn)生擬合以優(yōu)化卡方(chi-square)。制備抗生物素蛋白-生物素酰化白分子信標(biāo)由于抗生物素蛋白/鏈霉抗生物素蛋白分子含有4個(gè)結(jié)合位點(diǎn),不可避免的是僅單分子信標(biāo)與一個(gè)抗生物素蛋白分子結(jié)合。因此,發(fā)現(xiàn)在Tris-EDTA緩沖液中與摩爾比3:1的游離生物素對(duì)抗生物素蛋白/鏈霉抗生物素蛋白預(yù)孵育30分鐘充當(dāng)了相當(dāng)適合的引發(fā)步驟。此后,將生物素酰化的DNA信標(biāo)添加至溶液,從而信標(biāo)對(duì)抗生物素蛋白的比率是5:1。這確保僅I個(gè)信標(biāo)與一個(gè)抗生物素蛋白分子結(jié)合。結(jié)果該方法包含兩個(gè)步驟(圖Ia):首先,將靶DNA(即,待測(cè)序的DNA)中4種核苷酸(A、C、G和T)的每一個(gè)轉(zhuǎn)化成預(yù)定義的寡核苷酸序列,所述寡核苷酸序列與攜帶特定熒光團(tuán)的分子信標(biāo)雜交。對(duì)于雙色讀出(即,兩個(gè)類型的熒光團(tuán)),這4種序列是兩個(gè)預(yù)定義獨(dú)特序列比特’O’和比特’I’的組合,因此A將是’1,I’,G將是’1,O’,T將是’0,I’并且最后C將是’ 0,O’(圖la,左小圖)。攜帶兩個(gè)類型熒光團(tuán)的兩個(gè)類型的分子信標(biāo)與’ O’序列和’I’序列特異性雜交。其次,通過固態(tài)孔使轉(zhuǎn)化的DNA和雜交的分子信標(biāo)以電泳方式線性化,其中隨后剝離所述信標(biāo)。每次剝離一個(gè)信標(biāo)時(shí),一個(gè)新熒光團(tuán)解猝滅,導(dǎo)致光子爆發(fā),所致爆發(fā)在孔的位置處記錄到(圖la,右小圖)。每個(gè)孔位置處雙色光子爆發(fā)的順序(將顏色轉(zhuǎn)換成圖I中的不同灰度級(jí))是靶DNA序列的二進(jìn)制代碼。發(fā)明人的方法解決了納米孔測(cè)序法遭遇的兩個(gè)難題1)避免了需要檢測(cè)各個(gè)堿基并且促進(jìn)無酶讀出;和2)寬域成像和空間固定的孔能夠進(jìn)行簡(jiǎn)單修改以使用電子倍增電荷耦合器件(EM-CCD)照相機(jī)同時(shí)檢測(cè)多個(gè)孔(圖Ib中示意性顯示)。圖2顯示了靶DNA的轉(zhuǎn)化,作為命名為環(huán)狀DNA轉(zhuǎn)化(CDC)的過程,因?yàn)樵诿總€(gè)轉(zhuǎn)化循環(huán)期間形成環(huán)狀DNA分子。圖2a示意性地顯示⑶C的3個(gè)步驟,并且圖2b顯示單個(gè)轉(zhuǎn)化循環(huán)的結(jié)果。出于原理驗(yàn)證,合成4種單鏈DNA(ssDNA)模板,全部4種模板均長(zhǎng)100_nt并且它們僅在5’末端核苷酸處不同。這些模板含有用于固定到鏈霉親和素涂覆的磁珠上的生物素部分。在初始步驟中,這些模板與DNA分子(稱作探針)的文庫(kù)雜交,每個(gè)DNA分子帶有雙鏈中央部分和兩個(gè)單鏈突出端。雙鏈部分含有匹配于模板分子5’端核苷酸的預(yù)定義的寡核苷酸代碼。僅其3’突出端完美互補(bǔ)于模板5’末端的那些探針可以與模板雜交。探針的5’突出端與相同模板的3’末端雜交以形成環(huán)狀分子。在轉(zhuǎn)化的第二步驟中,T4DNA連接酶用來將探針的兩個(gè)末端與模板連接(連接的兩個(gè)位置在圖2a中由紅色點(diǎn)指示)。T4DNA連接酶已經(jīng)因與其他酶相比的極高保真性在其他DNA測(cè)序方法中使用18。最后,探針的雙鏈部分含有IIS型限制酶的識(shí)別位點(diǎn)(以’ R’標(biāo)出)并且使它正好在模板的5’端核苷酸之后切割。在短暫熱誘導(dǎo)解鏈和隨后洗滌后,新形成的ssDNA在其3’端含有二進(jìn)制代碼,隨后是原始模板的5’端核苷酸。這種過程可以根據(jù)需要重復(fù)許多次,將核苷酸從模板的5’端轉(zhuǎn)移至3’端,與相應(yīng)代碼交錯(cuò)。不同模板分子的轉(zhuǎn)化不需要至加以同步,并且無結(jié)果的雜交將不導(dǎo)致誤差,只要沒有連接和切割接踵發(fā)生即可。環(huán)狀DNA轉(zhuǎn)化法(CDC)這種轉(zhuǎn)化方法的目的是使DNA模板中的每個(gè)單個(gè)堿基在由較長(zhǎng)的預(yù)定義序列代表。出于概念驗(yàn)證目的,合成4種DNA模板分子(每種為100聚體),其中每種模板僅因5’末端堿基的身份而不同。這些模板含有用于將模板固定到鏈霉親和素涂覆的磁珠(INVITROGENDYNABEADS MYONE Streptavidin Cl)上的生物素部分。這個(gè)固定步驟使得在轉(zhuǎn)化過程的不同期間快速移走和替換緩沖溶液成為可能,同時(shí)DNA樣品損失最小。首先將模板分子隨所述珠一起在緩沖溶液(2MNaCl,2mM EDTA, 20mM Tris)中懸浮10分鐘以允許固定發(fā)生。這之后是洗滌步驟以移去固定緩沖溶液。包覆的珠隨后重懸于含有本文中稱作探針的DNA分子的文庫(kù)的溶液中。每種探針是一種帶粘性末端的雙鏈分子,其含有特定堿基的預(yù)定義寡核苷酸代碼,如圖2a中所顯示。僅其3’突出端完美互補(bǔ)于模板5’末端的那些探針可以與模板雜交。將文庫(kù)探針設(shè)計(jì)成允許模板分子的3’末端與探針的5’突出端雜交。樣品隨經(jīng)歷過緩慢冷卻過程以允許文庫(kù)探針與它們的互補(bǔ)性模板分子雜交。這個(gè)過程在高鹽(IOOmM NaCl, IOmMMgCl2)下實(shí)施以促進(jìn)雜交。在本過程的這個(gè)階段,環(huán)狀分子已經(jīng)產(chǎn)生。樣品隨后用IOmMTris緩沖溶液洗滌以除去已經(jīng)不與固定的模板分子雜交的任何過多文庫(kù)探針。樣品隨后重懸于連接緩沖液中以允許新雜交的分子連接一起。連接緩沖液含有 Quick T4 DNA 連接酶(New England BioLabs)和 Quick 連接反應(yīng)緩沖劑(New EnglandBioLabs)。連接在室溫實(shí)施5分鐘。在這個(gè)步驟后,用IOmM Tris緩沖溶液實(shí)施另一次洗滌以除去連接酶和連接緩沖液。轉(zhuǎn)化過程的倒數(shù)第二步驟是將新環(huán)化和固定的分子重懸于含有BseGl限制酶和FASTDIGEST緩沖劑(二者均來自Fermantes)的緩沖溶液中。這個(gè)過程以如此方式再線性化環(huán)狀分子,從而預(yù)定義代碼外加它代表的堿基現(xiàn)在位于模板分子的3’末端處并且新堿基現(xiàn)在位于在5’末端,為通過轉(zhuǎn)化過程做好準(zhǔn)備。一旦樣品已經(jīng)懸浮在這種消化緩沖液中,將樣品在37°C靜置15分鐘以允許消化發(fā)生。為使用納米孔或凝膠分析分子,從珠中移出轉(zhuǎn)化的DNA。這通過將固定的樣品懸浮在95%甲酰胺緩沖液中并加熱至95°C持續(xù)10分鐘實(shí)現(xiàn)。樣品隨后在變性凝膠上運(yùn)行(圖2b和圖7)以驗(yàn)證轉(zhuǎn)化。圖7顯示了該過程的一些關(guān)鍵階段的變性凝膠(這里為清晰起見,僅顯示僅C端模板)。這種凝膠使用SYBR Green II (Invitrogen)染色。該凝膠顯示:Α·原始DNA模板分子。B.作為參考所顯示的線性150聚體ssDNA。C.作為參考所顯示的環(huán)狀150聚體DNA。D.使用BseGl線性化后轉(zhuǎn)化的產(chǎn)物。E.在線性化之前轉(zhuǎn)化的環(huán)狀產(chǎn)物。這些結(jié)果顯示在雜交步驟、連接步驟和消化步驟后延長(zhǎng)的分子長(zhǎng)度。用于環(huán)狀DNA轉(zhuǎn)化法(CDC)的原理驗(yàn)證的DNA序列下文是分子信標(biāo)的序列,所述分子信標(biāo)用來驗(yàn)證本實(shí)施例中前文所述的轉(zhuǎn)化產(chǎn)物的身份。下文的全部信標(biāo)序列均由Eurogentec NA SanDiego合成A.與 “I” 比特互補(bǔ)的 16 聚體。5’ -TAAGCGTACGTGCTTA-3’ (SEQID NO. 13)。這個(gè)序列具有5’胺修飾,并且ATT0647N(Atto-Tec)染料在5’末端偶聯(lián)。對(duì)于納米孔光學(xué)讀出實(shí)驗(yàn),合成了在3’末端帶有粹滅劑(BHQ-2, Biosearch Technologies)的相同寡核苷酸(分子信標(biāo))。B.與 “O” 比特互補(bǔ)的 16 聚體5’ -CCTGATTCATGTCAGG-3’ (SEQID. NO. 14)。這個(gè)
33序列具有5’胺修飾,并且ATT0488 (Atto-Tec)染料在5’末端偶聯(lián)。對(duì)于納米孔光學(xué)讀出實(shí)驗(yàn),合成了在3’末端帶有粹滅劑(BHQ-2, Biosearch Technologies)的相同寡聚物,ATT0680 (Atto-Tec)染料在5’末端偶聯(lián)。C.與“01”序列互補(bǔ)的 32 聚體5’-CCTGATTCATGTCAGGTAAGCGTACGTGCTTA-3’ (SEQID NO. 15)。這個(gè)序列具有5’胺修飾,并且ATT0647N(Atto-Ttec)染料在5’末端偶聯(lián)。D.與“10”序列互補(bǔ)的 32 聚體5’-TAAGCGTACGTGCTTACCTGATTCATGTCAGG-3’ (SEQID NO. 16)。這個(gè)序列具有5’胺修飾,并且TM R(INVITROGEN )染料在5’末端偶聯(lián)。通過從磁珠中取出反應(yīng)產(chǎn)物后分析它們,發(fā)明人充分驗(yàn)證了 CDC的可行性。圖2b的左小圖顯示含有一輪轉(zhuǎn)化后的產(chǎn)物的變性凝膠(SM(脲))。觀察到4種不同模板中的每一種的>50%延長(zhǎng)約50nt(100至約150nt),這表明模板與探針成功連接。為證明每種情況下使用了正確探針,合成如下4種類型的寡核苷酸,也稱作分子信標(biāo)1)帶有紅色熒光團(tuán)的與“I”比特互補(bǔ)的16聚體;2)帶有藍(lán)色熒光團(tuán)的與“O”比特互補(bǔ)的16聚體;3)帶有綠色熒光團(tuán)的與“10”雙比特序列互補(bǔ)的32聚體;和4)帶有紅色熒光團(tuán)的與“01”互補(bǔ)的32聚體。前兩種寡核苷酸的混合物與每種CDC產(chǎn)物雜交,并且作為對(duì)照,與全部4種初始模板雜交。在凝膠分離后,使用3色激光掃描儀實(shí)施圖像分析并且在圖2c中顯示。將顏色轉(zhuǎn)換成圖中的灰度級(jí)。僅觀察到“A”產(chǎn)物的一個(gè)紅色條帶,并且僅觀察到“C”產(chǎn)物的一個(gè)藍(lán)色條帶,分別編碼為“11”和“00” (泳道2和泳道3)。其他兩種產(chǎn)物“G”和“T”同時(shí)顯示紅色條帶和藍(lán)色條帶,因?yàn)樗鼈兎謩e由“ 10”和“01”編碼(泳道4和泳道5)。為區(qū)分轉(zhuǎn)化的“G”和“T”,將它們與前述兩種32聚體寡核苷酸雜交。僅“G”顯示以綠色熒光團(tuán)標(biāo)記的條帶,其對(duì)應(yīng)于“10”代碼(泳道6)并且僅“T”顯示以紅色熒光團(tuán)標(biāo)記的條帶,其對(duì)應(yīng)于“01”代碼(泳道7)。對(duì)照顯示,模板本身不與任何標(biāo)記的分子信標(biāo)雜交,并且標(biāo)記的分子信標(biāo)本身不在凝膠中顯示,因?yàn)榕c 150nt產(chǎn)物相比,它們太短(泳道1、8和9)。這些結(jié)果結(jié)論性地顯示,單個(gè)⑶C循環(huán)產(chǎn)生具有正確轉(zhuǎn)化代碼的純產(chǎn)物。發(fā)明人的方法的第二步驟使用固態(tài)納米孔將雜交的分子信標(biāo)剝離轉(zhuǎn)化的ssDNA。這需要使用小于2nm范圍的孔,因?yàn)殡p鏈DNA(dsDNA)的截面直徑是2. 2nm19。DNA分子進(jìn)入這類小孔的可能性比它們進(jìn)入較大孔的可能性小得多9’13,這需要使用更多的DNA量。另外,制造小孔帶來許多技術(shù)難題,因?yàn)榇嬖诤苄〉娜蒎e(cuò)性,并且困難對(duì)于高密度納米孔陣列而言遞增。發(fā)現(xiàn)3-5nm大小的“大體積基團(tuán)”(例如,蛋白質(zhì)或納米粒子)與分子信標(biāo)共價(jià)連接有效地將復(fù)合物的分子截面增加至5_7nm,從而允許使用尺寸范圍3_6nm的納米孔。這增加DNA分子的捕獲率10倍或更多,并且大大促進(jìn)納米孔陣列的制造過程。出于概念驗(yàn)證,將抗生物素蛋白(4. 0X5. 5X6. Onm)2(1分子與含有熒光團(tuán)-猝滅劑配對(duì)的生物素?;肿有艠?biāo)(ATT0647N-BHQ2,縮寫為“A647-BHQ”)連接。這種信標(biāo)和類似構(gòu)建的在一個(gè)末端含有猝滅劑并且在另一個(gè)末端不含熒光團(tuán)的分子信標(biāo)與靶ssDNA(’ I比特’樣品)雜交。合成含有兩個(gè)信標(biāo)分子的相似復(fù)合物C 2比特’樣品),如圖3a中示意性顯示。大體積突光(BulkFluorescenc)研究為了檢驗(yàn)BHQ-2的猝滅過程的效率,實(shí)施大體積熒光實(shí)驗(yàn)。對(duì)于每種熒光團(tuán),設(shè)計(jì)兩種分子(見圖8(a)和b)的插圖)。一個(gè)分子由在其5’末端含有熒光染料的16聚體組成,與一種66聚體雜交。第二分子也含有相同的16聚體外加在其3’末端含有BHQ-2猝滅
34劑的第二 16聚體。這兩種16聚體均與一種66聚體雜交。這兩種16聚體分子雜交,從而在一個(gè)分子5’末端上的熒光探針靠近另一個(gè)分子3’末端上的BHQ-2猝滅劑。所用的兩種熒光團(tuán)是 ATT0647N (Atto-Tec)和 ATT0680 (Atto-Tec)。ATT0647N 在 644nm 處具有最大吸收峰并且在669nm處具有最大激發(fā)峰,而ATT0680在680nm處具有最大吸收峰并且在700nm處具有最大激發(fā)峰。對(duì)于每種分子,我們使用熒光光譜儀(JASCO FP-6500)來測(cè)量復(fù)合物的熒光發(fā)射。首先,用解猝滅的熒光團(tuán)測(cè)量分子的發(fā)射光譜(圖8的(a)和(b)中的頂部跡線)。隨后,用猝滅劑-熒光團(tuán)對(duì)測(cè)量分子的發(fā)射光譜(圖8的(a)和(b)中的底部跡線)。每個(gè)實(shí)驗(yàn)含有約IOOnM的雜交樣品。這些實(shí)驗(yàn)確定,這些大體積分子出現(xiàn)時(shí),存在95-97%粹滅,如圖8中所示。因此,大體積研究展示,當(dāng)處于其雜交狀態(tài)時(shí),分子信標(biāo)上的A647熒光團(tuán)由相鄰的BHQ猝滅劑猝滅約95%。鑒于這種極高猝滅效率,只有鏈分開發(fā)生時(shí),如熒光團(tuán)在雜交雙鏈狀態(tài)下不緊挨相鄰猝滅劑時(shí)那樣,才可以在單分子水平檢測(cè)到熒光爆發(fā)。I比特樣品和2比特樣品的納米孔實(shí)驗(yàn)均使用640nm激光實(shí)施并且使用EM-CXD照相機(jī)以每秒1,000幀成像。圖3a顯示兩個(gè)樣品的常見解鏈?zhǔn)录?,I比特樣品中每個(gè)復(fù)合物帶一種信標(biāo),并且2比特樣品中每個(gè)復(fù)合物帶2種信標(biāo)。電信號(hào)以黑色跡線顯示并且在孔位置處隨電信號(hào)同步測(cè)量的光信號(hào)以淺灰色或深灰跡線顯示17。電流的驟降表示分子進(jìn)入孔,并且在清除孔時(shí),電信號(hào)返回開放孔高能態(tài)19。光信號(hào)清晰地顯示分別針對(duì)I比特樣品和2比特樣品中大部分解鏈?zhǔn)录囊粋€(gè)或兩個(gè)光子爆發(fā)。這是預(yù)期到的,因?yàn)闊晒鈭F(tuán)在抵達(dá)孔之前遭猝滅并且在信標(biāo)與模板解鏈后再次立即自我猝滅21。每個(gè)解鏈?zhǔn)录陂g如電信號(hào)所限定的光強(qiáng)度的總和產(chǎn)生兩個(gè)樣品的泊松分布(圖3b中的實(shí)線),其中I比特樣品的均值為I. 30+0. 06,并且2比特樣品的雙值是(2. 65+0. 08)(在每種情況下n>600個(gè)事件,誤差代表標(biāo)準(zhǔn)偏差)。這證明,無論用來限定光子爆發(fā)的模型是什么,平均而言,對(duì)于I比特樣品中的每個(gè)復(fù)合物出現(xiàn)單個(gè)解鏈?zhǔn)录⑶覍?duì)于2比特樣品中的每個(gè)復(fù)合物出現(xiàn)2個(gè)解鏈?zhǔn)录A硗?,采用?qiáng)度閾值分析(在平均強(qiáng)度+2std處選擇),觀察到幾乎90%在I比特樣品中收集的事件含有單熒光爆發(fā),而在2比特樣品中,大約80%所收集的事件顯示2個(gè)這類爆發(fā)(圖3c)。這份數(shù)據(jù)顯示,在使用3-5nm孔進(jìn)行的各個(gè)解鏈?zhǔn)录?,可以光學(xué)地區(qū)分I比特樣品和2比特樣品。為區(qū)別全部4種核苷酸,使用同時(shí)受相同的640nm激光激發(fā)的兩種高量子產(chǎn)率熒光團(tuán)A647 (ATT0647N)和A680 (ATT0680),將當(dāng)前系統(tǒng)從I顏色編碼方案擴(kuò)展至2顏色編碼方案。將光發(fā)射信號(hào)使用二色鏡劈分成通道I和通道2并且在相同的EM-C⑶照相機(jī)上并排成像。當(dāng)兩種熒光團(tuán)的發(fā)射光譜重疊時(shí),一部分A647發(fā)射“泄漏”入通道2中,并且一部分A680發(fā)射“泄漏”入通道I中。使用以A647或A680熒光團(tuán)標(biāo)記的I比特復(fù)合物進(jìn)行兩次校正測(cè)量(圖4a)。在每種況下多于500個(gè)解鏈?zhǔn)录e累后,清楚地見到每個(gè)通道中與納米孔的位置對(duì)應(yīng)的不同單峰。通道I對(duì)通道2中的熒光強(qiáng)度的比率(R)對(duì)于A647樣品是O. 2和并且對(duì)于A680樣品是O. 4。在圖4b和圖4c中分別描述兩份樣品中每一個(gè)的代表性事件(來自多于500個(gè)事件)和相應(yīng)的R分布。在每個(gè)移位事件期間觀察到突出的熒光單峰(以黑色顯示的電跡線),強(qiáng)度大于基線熒光波動(dòng)超過3倍。計(jì)數(shù)全部檢測(cè)到的事件分別針對(duì)A647和A680產(chǎn)生R=O. 20+0. 06和O. 40+0. 05 (平均值+std),與圖4a中所示的累積熒光比率(針對(duì)全部事件)完全一致。R服從由圖4c中實(shí)線擬合給出的高斯分布。這些對(duì)照測(cè)量顯示,R可以用來確定各個(gè)熒光團(tuán)的身份。使用圖4c中給出的校正分布,測(cè)試了鑒定來自⑶C的含有4種2比特組合即11 (A) ,00(C)、01 (T)和10(G)(其中“O”和“I”分別對(duì)應(yīng)于A647信標(biāo)和A680信標(biāo))的產(chǎn)物的能力。對(duì)多于2000個(gè)解鏈?zhǔn)录姆治鼋沂綬的雙峰分布,兩種模式在O. 21+0. 05和O. 41+0. 06處(圖5b),與校正測(cè)量完全一致(圖4c)。將R〈0. 30的全部光子爆發(fā)劃歸為“0”,并且將R>0. 30的那些劃歸為“I”(O. 30是圖5b中分布的局部最小值)。R的分布還用來計(jì)算錯(cuò)誤分類的概率。這種進(jìn)一步提供統(tǒng)計(jì)手段以校正兩個(gè)通道用于最佳區(qū)分兩種熒光團(tuán)。圖5c提供了描述全部4種DNA堿基的單分子鑒定的代表性雙色熒光強(qiáng)度事件。雙色鑒定的穩(wěn)健性主要?dú)w功于光子爆發(fā)的優(yōu)異信噪比和兩個(gè)通道的熒光團(tuán)強(qiáng)度比率之間的分離。開發(fā)了一種計(jì)算機(jī)算法以進(jìn)行熒光信號(hào)中的自動(dòng)化峰鑒定。這種算法濾出熒光信號(hào)中的隨機(jī)噪聲(例如,假峰電位)并且使用校正分布鑒定比特序列(圖4c),并且隨后進(jìn)行堿基調(diào)用(base calling)。這種算法輸出兩個(gè)確定性評(píng)分,一個(gè)評(píng)分用于比特調(diào)用并且一個(gè)評(píng)分用于堿基調(diào)用。在圖5c中顯示常見結(jié)果。在括號(hào)中顯示從原始強(qiáng)度數(shù)據(jù)自動(dòng)提取的每個(gè)堿基的確定性值(范圍在O和I之間)。本發(fā)明基于當(dāng)前廣域光學(xué)的檢測(cè)方案的主要優(yōu)點(diǎn)之一在于簡(jiǎn)單性,其中可以平行地探測(cè)多個(gè)孔,最終能夠進(jìn)行高通量讀出。作為平行讀出的概念驗(yàn)證,在相同的SiN膜上制造相隔幾個(gè)微米的多個(gè)3-5nm大小的納米孔。在圖6a中顯示在3個(gè)獨(dú)立實(shí)驗(yàn)中使用含有I個(gè)、2個(gè)或3個(gè)納米孔的膜獲得的累積熒光強(qiáng)度圖像。與單孔實(shí)驗(yàn)相似,記錄該模中來自全部孔的熒光爆發(fā)。每個(gè)實(shí)驗(yàn)中累積來自幾千個(gè)解鏈?zhǔn)录墓庾佑?jì)數(shù)在每個(gè)像素處產(chǎn)生光子強(qiáng)度的表面圖(圖6a)。如該圖中所反映,檢測(cè)到的峰數(shù)目等于每塊膜中所制造的孔數(shù)目。對(duì)于雙孔膜,3個(gè)峰之間的距離是I. 8 μ m,并且對(duì)于三孔膜,2個(gè)峰之間的距離I. 8 μ m和7. 7 μ m,與制造過程期間測(cè)量的孔之間距離完全一致。這份數(shù)據(jù)為寬域光學(xué)檢測(cè)方案的可行性提供直接證據(jù)。圖6b展示了該系統(tǒng)探測(cè)單個(gè)膜中同時(shí)來自多個(gè)納米孔的光子爆發(fā)的能力。4條代表性跡線顯示使用I比特樣品時(shí)從3個(gè)納米孔(分別是綠色標(biāo)記、紅色標(biāo)記和藍(lán)色標(biāo)記)中所探測(cè)到的電流(黑色)和光信號(hào)。在每個(gè)孔處每個(gè)分子的進(jìn)入和解鏈?zhǔn)且粋€(gè)隨機(jī)的過程。在本實(shí)驗(yàn)中所用的條件下,在多于3,000個(gè)解鏈?zhǔn)录?,涉及?jīng)兩個(gè)孔同時(shí)進(jìn)入的約50個(gè)分子。從全部孔中積累的電流跡線顯示兩個(gè)不同的封阻水平(blockade level),從而顯示在特定時(shí)刻占據(jù)的孔總數(shù),而未透露哪個(gè)孔被占據(jù)的信息。另一方面,光學(xué)跡線清晰揭示占據(jù)的孔。這種最終將消除當(dāng)本方法擴(kuò)展至較大陣列時(shí)對(duì)電流測(cè)量的需要,并且完全依賴于光測(cè)量,從而簡(jiǎn)化儀器要求。討論和結(jié)論單分子DNA測(cè)序方法已經(jīng)開始改造遺傳研究,對(duì)成本和通量提出更高要求3’22’23。預(yù)計(jì)隨著測(cè)序成本進(jìn)一步降低,人類基因組重測(cè)序?qū)⒆兊靡环N普及和可支付的醫(yī)學(xué)診斷工具。這里,已經(jīng)展示了具有低成本和超高通量潛力的一種單分子DNA測(cè)序新概念的可行性。在其最簡(jiǎn)單的形式下,使用二進(jìn)制代碼(每個(gè)堿基2比特)來代表與兩個(gè)熒光團(tuán)偶聯(lián)并且由光學(xué)檢測(cè)系統(tǒng)讀出的DNA序列。在其當(dāng)前階段,當(dāng)前系統(tǒng)可以讀取每秒每個(gè)納米孔50-250個(gè)堿基,這有利地與其他單分子方法可比較2’3。預(yù)計(jì)針對(duì)4種顏色的簡(jiǎn)易改造和使用優(yōu)化的試劑將允許該系統(tǒng)實(shí)現(xiàn)讀取每秒每個(gè)納米孔多于500個(gè)堿基。最重要地,首次對(duì)基于納米孔的方法展示了多孔讀出的可行性。來自納米孔陣列的光學(xué)檢測(cè)隨孔數(shù)目高效地改變,這不同于依賴統(tǒng)計(jì)學(xué)占有率的酶促方法。發(fā)明人的方法包括一個(gè)準(zhǔn)備步驟以將靶DNA轉(zhuǎn)化成可以用標(biāo)準(zhǔn)固態(tài)納米孔直接 探測(cè)的較長(zhǎng)DNA分子。盡管時(shí)間和復(fù)雜性增加,但是這個(gè)步驟帶來以下優(yōu)點(diǎn)1)不像其他測(cè)序平臺(tái)那樣24,這種方法不需要可能易出錯(cuò)的基于PCR的擴(kuò)增步驟2。2)讀出階段不使用任何酶如聚合酶、連接酶或核酸外切酶,因此讀出長(zhǎng)度、速度和保真性不是酶限制性的4。3)可以通過調(diào)節(jié)物理參數(shù)如跨納米孔電壓或兩個(gè)腔室中的離子強(qiáng)度,針對(duì)各個(gè)測(cè)序反應(yīng)輕易調(diào)節(jié)讀出速度。酶依賴性方法將需要所涉及酶的生物工程化。4)轉(zhuǎn)化的DNA可以設(shè)計(jì)成幾乎沒有二級(jí)結(jié)構(gòu),這可以大大促進(jìn)基因組中高度結(jié)構(gòu)化和/或重復(fù)區(qū)域的測(cè)序,避免在讀出階段需要強(qiáng)變性劑。5)讀出系統(tǒng)使用可以大量制造的尺寸范圍3-6nm的標(biāo)準(zhǔn)固態(tài)納米孔陣列。發(fā)明人的結(jié)果在此首次展示全固態(tài)DNA序列讀出和大體積基團(tuán)的摻入允許使用3-6nm孔。這些結(jié)果有力地說明使用固態(tài)納米孔用于DNA測(cè)序的可行性。最近,許多出版物已經(jīng)展示在固態(tài)材料制造相似規(guī)模的陣列25’26。參考文獻(xiàn)I. Shendure, J.等人,Advanced sequencing technologies: Methodsandgoals (高級(jí)測(cè)序技術(shù)方法和目標(biāo))· Nature Reviews Genetics 5 (5), 335-344 (2004).2. Harris, T. D.等人,Single-molecule DNA sequencing of a viralgenome (病毒基因組的單分子 DNA 測(cè)序)· Science 320 (5872),106-109 (2008) ·3. E i d, J.等人,Real-time DNA sequencing from singlepolymerasemolecules (從單個(gè)聚合酶分子實(shí)時(shí)DNA測(cè)序)· Science323(5910), 133-138(2009).4. Fuller, C. ff.等人,The challenges of sequencing by synthesis (通過合成測(cè)序的難題).Nature Biotechnology 27(11), 1013-1023(2009).5. Li, J.等人,Ion-beam sculpting at nanometre length scales (納米長(zhǎng)度級(jí)別的離子束雕刻).Nature 412,166-169(2001).6. Deamer, D. ff. &Branton, D. , Characterization of nucleic acidsbynanopore analysis (通過納米孔分析表征核酸)· Accounts of ChemicalResearch35(10),817-825(2002).7. Healy, Κ. , Nanopore-based single-molecule DNA analysis (納米孔單分子DNA 分析).Nanomedicine 2 (4),459-481 (2007).8. Dekker, C. , Solid-state nanopores (固態(tài)納米孔)· NatureNanotechnology2(4),209-215(2007).9. ffanunu, M.等人,DNA Translocation Governed by InteractionswithSolid-StateNanopores (由與固態(tài)納米孔的相互作用決定的DNA移位)· BiophysicalJournal 95 (10), 4716-4725(2008).10. ffanunu, Μ. , Sutin, J.和 Mel Ier,A.,DNA profiling us ingso I id-statenanopores: Detection of DNA-binding molecules (使用固態(tài)納米孔的 DNA 剖析檢測(cè) DNA結(jié)合分子).Nano Letters 9 (10),3498-3502 (2009).11. Singer, A.等人,Nanopore-based sequence-specific detection ofduplexDNA for genomic profiling(用于基因組剖析的雙鏈體DNA納米孔序列特異檢測(cè)).NanoLetters 10(2),738-742(2010) ·12. Liuj H.等人,Translocation of Single Stranded DNAThroughSingle-Walled Carbon Nanotubes (單鏈 DNA 穿過單壁碳納米管移位).Science327 (5961) ,64-67(2010).13. Wanunuj Μ.等人,Electrostatic Focusing of Unlabeled DNA intoNanoscalePores using a Salt Gradient (使用鹽梯度使未標(biāo)記的DNA靜電聚焦至納米級(jí)孔中)· Nature Nanotechnology 5,160-165 (2009).14. Vercouterej W.和 Akeson,Μ·,Biosensors for DNA sequencedetection (用于DNA 序列檢測(cè)的生物傳感器)· Curr. Opin. Chem. Biol. 6 (6),816-822 (2002) ·15. Brantonj D.等人,The potential and challenges ofnanoporesequencing(納米孔測(cè)序的潛力和難題).Nature Biotechnology26(10),1146-1153(2008).16. Clarke, J.等人,Continuous base identification forsingle-moleculenanopore DNA sequencing (用于單分子納米孔DNA測(cè)序的連續(xù)堿基鑒定).NatureNanotechnology 4(4),265-270(2009) ·17. Sonij V.G.等人,Synchronous optical and electrical detectionofbio-molecules traversing through solid-state nanopores (橫穿固態(tài)納米孑L的生物分子的同步光學(xué)和電學(xué)檢測(cè))· Rev. Sci. Instru. 81 (I),014301-014307 (2010) ·18. Shendure, J.等人,Accurate multiplex polony sequencing of anevolvedbacterial genome (對(duì)一種進(jìn)化的細(xì)菌基因組的精確多重聚合酶克隆).Science309 (5741),1728-1732(2005) ·19. McNally, B. , Wanunuj Μ.和 Meller,Α·,Electromechanicalunzipping ofindividual DNA molecules using synthetic sub_2nm pores (使用合成性亞 2nm 孔對(duì)單個(gè) DNA 分子的電化學(xué)解鏈).Nano Letters 8 (10),3418-3422 (2008) ·20. Green, N. Μ.矛口 Joynson,Μ·Α·,A preliminarycrystallographicinvestigation of avidin (抗生物素蛋白的初步晶體學(xué)研究)· BiochemJ118(l),71-72(1970).21. Bonnet, G. , Krichevsky, 0.和 Libchaber,A.,Kinetics of conformationalfluctuations in DNA hairpin-loops (DNA 發(fā)夾-環(huán)中構(gòu)象波動(dòng)的動(dòng)力學(xué))· Proc. Natl.Acad. Sci. U S A 95 (15),8602-8606 (1998).22. Lipsonj D.等人,Quantification of the yeast transcriptomebysingle-molecule sequencing (通過單分子測(cè)序?qū)湍皋D(zhuǎn)錄組定量).NatureBiotechnology 27(7),652_U 105(2009).23. Pushkarev,D.,Neff,Ν· F.和 Quake,S. R.,Single-moleculesequencing ofan individual human genome (個(gè)體人類基因組的單分子測(cè)序)· Nature Biotechnology27(9),847-U101(2009).CN 102918166 A
書
明
說
35/35 頁24. Li, Y. & Wang, J. , Faster human genome sequencing (News andViews)(更快的人類基因組測(cè)序(新聞和視角))· Nature Biotechnology 27 (9),820-821 (2009) · 25. Tong, H. D.等人,Silicon nitride nanosieve membrane (氮化娃納米篩
Il). Nano Letters 4 (2),283-287 (2004).26. Hopmanj W. C. L 等人,F(xiàn)ocused ion beam scan routine,dwell timeand doseoptimizations for submicrometre period planar photonic crystalcomponents andstamps in silicon(用于娃中亞微米平面光子晶體組件和戳記的聚焦離子束掃描程序、駐留時(shí)間和劑量?jī)?yōu)化)· Nanotechnologyl8 (19),195305-195311 (2007) ·27. Pipper, J.等人,Catching bird flu in a droplet (捕獲液滴中的禽流感).Nature Medicine 13 (10),1259-1263 (2007) ·28. Kim,M. J.,Wanunu,Μ·,Bell,D. C.和 Meller, A. , Rapidfabrication ofuniformly sized nanopores and nanopore arrays for paralIelDNA analysis (快速制造用于平行DNA分析的均一大小的納米孔和納米孔陣列).Advanced Materials18(23),3149-3153(2006).29. Soni G. V.和Meller A. , Progress towards ultrafast DNAsequencing usingsolid-state nanopores (使用固態(tài)納米孔的超快速DNA測(cè)序進(jìn)展)· Clinical Chemistry53,11 (2007).30.Meller Α·等人,Ultra high-throughput opti-nanopore DNAreadoutplatfonn(超高通量光學(xué)納米孔DNA讀出平臺(tái)).美國(guó)專利申請(qǐng)No. US 2009/0029477.31. Preben Lexonj Sequencing method using magnifying tags (使用放大標(biāo)簽的測(cè)序方法).美國(guó)專利No. 6,723,513.32. Juj Jingyuej Dna sequencing by nanopore using modif iednucleotides (使用修飾的核苷酸通過納米孔對(duì)DNA測(cè)序).美國(guó)專利申請(qǐng)US 2009/0298072.
39
權(quán)利要求
1.一種用于納米孔解鏈依賴性核酸測(cè)序的分子信標(biāo)(MB)文庫(kù),所述文庫(kù)包含多種MB,其中每種MB包含寡核苷酸,所述寡核苷酸包含(1)可檢測(cè)標(biāo)記;(2)可檢測(cè)標(biāo)記封阻劑;和(3)調(diào)節(jié)基團(tuán);其中所述MB能夠與代表單鏈核酸中A、U、T、C或G核苷酸的定義序列進(jìn)行序列特異性互補(bǔ)雜交以形成雙鏈(ds)核酸。
2.根據(jù)權(quán)利要求I所述的文庫(kù),其中所述寡核苷酸包含4-60個(gè)核苷酸。
3.根據(jù)權(quán)利要求I或2所述的文庫(kù),其中所述MB的寡核苷酸包含選自脫氧核糖核酸(DNA)、核糖核酸(RNA)、肽核酸(PNA)、鎖核酸(LNA)和磷酰二胺嗎啉代寡聚物(ΡΜ0或Morpholino)的核酸。
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的文庫(kù),其中所述可檢測(cè)標(biāo)記在所述寡核苷酸的一個(gè)末端上連接并且處在所述文庫(kù)中全部寡核苷酸的相同末端上,其中在所述可檢測(cè)標(biāo)記不受所述封阻劑抑制時(shí),所述可檢測(cè)標(biāo)記發(fā)射可以檢測(cè)和/或測(cè)量的信號(hào)。
5.根據(jù)權(quán)利要求1-4中任一項(xiàng)所述的文庫(kù),其中所述MB不與固相載體連接。
6.根據(jù)權(quán)利要求1-5中任一項(xiàng)所述的文庫(kù),其中寡核苷酸上的所述可檢測(cè)標(biāo)記、可檢測(cè)標(biāo)記封阻劑和調(diào)節(jié)基團(tuán)不干擾所述MB與代表單鏈核酸中A、U、T、C或G核苷酸的定義序列進(jìn)行序列特異性互補(bǔ)雜交。
7.根據(jù)權(quán)利要求1-6中任一項(xiàng)所述的文庫(kù),其中光學(xué)地檢測(cè)到所述可檢測(cè)基團(tuán)的信號(hào)。
8.根據(jù)權(quán)利要求1-7中任一項(xiàng)所述的文庫(kù),其中所述可檢測(cè)基團(tuán)是熒光團(tuán)并且所述信號(hào)是突光。
9.根據(jù)權(quán)利要求1-8中任一項(xiàng)所述的文庫(kù),其中所述可檢測(cè)標(biāo)記封阻劑是所述熒光團(tuán)的猝滅劑。
10.根據(jù)權(quán)利要求1-9中任一項(xiàng)所述的文庫(kù),其中所述可檢測(cè)標(biāo)記封阻劑還是調(diào)節(jié)基團(tuán)。
11.根據(jù)權(quán)利要求1-10中任一項(xiàng)所述的文庫(kù),其中所述調(diào)節(jié)基團(tuán)位于所述寡核苷酸的5’末端或3’末端。
12.根據(jù)權(quán)利要求1-11中任一項(xiàng)所述的文庫(kù),其中所述調(diào)節(jié)基團(tuán)增加所述雙鏈核酸在所述調(diào)節(jié)基團(tuán)與所述寡核苷酸連接的點(diǎn)處的寬度到大于2. O納米(nm),其中通過所述MB與代表A、U、T、C或G的定義序列雜交形成所述雙鏈核酸。
13.根據(jù)權(quán)利要求12所述的文庫(kù),其中所述雙鏈核酸在所述調(diào)節(jié)基團(tuán)與所述寡核苷酸連接的點(diǎn)處的寬度是約3-7nm。
14.根據(jù)權(quán)利要求1-13中任一項(xiàng)所述的文庫(kù),其中所述調(diào)節(jié)基團(tuán)選自納米級(jí)粒子、蛋白質(zhì)分子、有機(jī)金屬粒子、金屬粒子和半導(dǎo)體粒子。
15.根據(jù)權(quán)利要求1-14中任一項(xiàng)所述的文庫(kù),其中所述調(diào)節(jié)基團(tuán)是3-5nm。
16.根據(jù)權(quán)利要求1-15中任一項(xiàng)所述的文庫(kù),其中當(dāng)所述雙鏈核酸經(jīng)歷納米孔測(cè)序時(shí),所述調(diào)節(jié)基團(tuán)促進(jìn)所述雙鏈核酸的解鏈。
17.根據(jù)權(quán)利要求1-16中任一項(xiàng)所述的文庫(kù),其中存在MB的兩個(gè)或更多個(gè)種類,其中MB的每個(gè)種類具有不同的可檢測(cè)標(biāo)記。
18.一種使雙鏈(ds)核酸解鏈用于納米孔解鏈依賴性核酸測(cè)序的方法,所述方法包括a.將根據(jù)權(quán)利要求1-17所述的分子信標(biāo)(MB)文庫(kù)與待測(cè)序的單鏈核酸雜交,從而形成具有寬度D3的雙鏈(ds)核酸,所述雙鏈核酸因所述調(diào)節(jié)基團(tuán)的存在而形成,其中所述待測(cè)序的單鏈核酸是包含代表A、U、T、C或G的定義序列的聚合物;b.使步驟a)中形成的雙鏈核酸與具有寬度Dl的納米孔開口接觸,其中D3大于Dl;并且c.施加跨納米孔的電勢(shì)以使雜交的分子信標(biāo)與待測(cè)序的單鏈核酸解鏈。
19.根據(jù)權(quán)利要求18所述的方法,其中所述納米孔尺寸允許待測(cè)序的單鏈核酸通過所述孔,但是不允許所述雙鏈核酸通過所述孔。
20.根據(jù)權(quán)利要求18或19所述的方法,其中Dl大于2nm。
21.根據(jù)權(quán)利要求18-20中任一項(xiàng)所述的方法,其中Dl是3-6nm。
22.根據(jù)權(quán)利要求18-21中任一項(xiàng)所述的方法,其中D3大于2nm。
23.根據(jù)權(quán)利要求18-22中任一項(xiàng)所述的方法,其中D3是約3_7nm。
24.根據(jù)權(quán)利要求18-23中任一項(xiàng)所述的方法,其中所述雜交的單鏈核酸和MB之間的結(jié)合親和力小于所述MB的調(diào)節(jié)基團(tuán)和寡核苷酸的結(jié)合親和力,由此當(dāng)所述雙鏈核酸試圖在電勢(shì)影響下通過納米孔的開口時(shí),所述單鏈核酸和MB之間的鍵而不是所述MB的調(diào)節(jié)基團(tuán)和寡核苷酸之間的鍵破壞。
25.根據(jù)權(quán)利要求18-24中任一項(xiàng)所述的方法,其中所述待測(cè)序的核酸是DNA或RNA。
26.一種用于測(cè)定核酸的核苷酸序列的方法,其包括步驟a.將根據(jù)權(quán)利要求1-17所述的分子信標(biāo)(MB)文庫(kù)與待測(cè)序的單鏈核酸雜交,從而形成具有寬度D3的雙鏈(ds)核酸,所述雙鏈核酸因所述調(diào)節(jié)基團(tuán)的存在而形成,其中所述待測(cè)序的單鏈核酸是包含代表A、U、T、C或G的定義序列的聚合物;b.使步驟a)中形成的雙鏈核酸與具有寬度Dl的納米孔開口接觸,其中D3大于Dl;c.施加跨納米孔的電勢(shì)以使雜交的MB與待測(cè)序的單鏈核酸解鏈;并且d.當(dāng)所述MB在所述孔處出現(xiàn)時(shí)與所述雙鏈核酸分開時(shí),檢測(cè)由可檢測(cè)標(biāo)記從每種MB發(fā)射的信號(hào)。
27.根據(jù)權(quán)利要求26所述的方法,進(jìn)一步包括將一串檢測(cè)到的信號(hào)解碼成所述核酸的核苷酸堿基序列。
28.根據(jù)權(quán)利要求26或27所述的方法,其中所述納米孔尺寸允許待測(cè)序的單鏈核酸通過所述孔,但是不允許所述雙鏈核酸通過所述孔。
29.根據(jù)權(quán)利要求26-28中任一項(xiàng)所述的方法,其中Dl大于2nm。
30.根據(jù)權(quán)利要求26-29中任一項(xiàng)所述的方法,其中Dl是約3_6nm。
31.根據(jù)權(quán)利要求26-30中任一項(xiàng)所述的方法,其中D3大于2nm。
32.根據(jù)權(quán)利要求26-31中任一項(xiàng)所述的方法,其中D3是約3_7nm。
33.根據(jù)權(quán)利要求26-32中任一項(xiàng)所述的方法,其中所述雜交的單鏈核酸和MB之間的結(jié)合親和力小于所述MB的調(diào)節(jié)基團(tuán)和寡核苷酸的結(jié)合親和力,由此當(dāng)所述雙鏈核酸試圖在電勢(shì)影響下通過納米孔的開口時(shí),所述單鏈核酸和MB之間的鍵而不是所述MB的調(diào)節(jié)基團(tuán)和寡核苷酸之間的鍵破壞。
34.根據(jù)權(quán)利要求26-33中任一項(xiàng)所述的方法,其中所述待測(cè)序的核酸是DNA或RNA。
全文摘要
本文中提供了包含多種分子信標(biāo)(MB)的文庫(kù),每種MB具有可檢測(cè)標(biāo)記、可檢測(cè)標(biāo)記封阻劑和調(diào)節(jié)基團(tuán)。該文庫(kù)與納米孔解鏈依賴性核酸測(cè)序法一起使用。
文檔編號(hào)G01N33/58GK102918166SQ201180024114
公開日2013年2月6日 申請(qǐng)日期2011年3月30日 優(yōu)先權(quán)日2010年3月30日
發(fā)明者阿米特·梅勒, 阿龍·辛格 申請(qǐng)人:波士頓大學(xué)董事會(huì)