選擇性修飾聚合物亞單位以改進基于納米孔的分析的制作方法
【專利摘要】本發(fā)明提供了用于改善聚合物的基于納米孔的分析的方法和系統(tǒng)。本公開內(nèi)容提供了選擇性修飾一種預(yù)分析物聚合物的一種的一個或多個單體亞單位的方法,其導(dǎo)致聚合物分析物具有被修飾亞單位。所述聚合物分析物在基于納米孔的系統(tǒng)中產(chǎn)生可檢測的信號。所述可檢測信號和/或其與參考信號的偏差表明在所述聚合物分析物中所述被修飾亞單位的位置,從而允許在原始預(yù)分析物聚合物中那個位置的亞單位的鑒定。
【專利說明】選擇性修飾聚合物亞單位從改進基于納米孔的分析
[0001] 對相關(guān)申請的交叉引用
[0002] 本申請要求2012年8月30日遞交的美國申請?zhí)?1/872,406的權(quán)益。
[0003] 關(guān)于序列表的聲明
[0004] 與本申請相關(guān)的序列表W文本形式代替紙質(zhì)復(fù)印件進行提供,并特此通過引用將 其并入本說明書。含有序列表的文本文件的名稱是52586_SEQ_LISTING_ST25.txt。文本文 件為6邸;創(chuàng)建于2014年9月2日;并且通過EFS-Web與遞交本說明書一起進行提交。
[0005] 政府許可權(quán)聲明
[0006] 本發(fā)明是W由美國國立衛(wèi)生研究院授予的資助號R01HG005115下的政府支持進行 的。政府具有本發(fā)明的某些權(quán)利。
[0007] 發(fā)明背景
[000引聚合物分子的快速、可靠且成本節(jié)約的分析(諸如核酸和多膚的測序)是研究人員 和執(zhí)業(yè)醫(yī)師的主要祀。確定聚合物的序列(諸如DNA或RNA或多膚中的核酸序列)的能力在鑒 定遺傳突變和多態(tài)性方面具有額外的重要性。已確立的DNA測序技術(shù)在過去十年已經(jīng)有了 很大改進,但仍然需要大量的DNA和若干冗長的步驟和努力W得到大于100個核巧酸的連續(xù) 閱讀長度。然后,該信息必須鳥槍"形式進行組裝,運是費力的事,其非線性地依賴于基 因組的大小和構(gòu)建完整基因組的片段的長度。運些步驟昂貴且耗時,尤其是在對哺乳動物 基因組進行測序的時候。
[0009] 已經(jīng)將基于納米孔的分析方法作為傳統(tǒng)聚合物分析方法的替代方法進行研究。運 些方法設(shè)及將多聚分子(例如單鏈DNA("ssDNA"))通過納米級開口,同時監(jiān)測信號(諸如電 信號),在聚合物分析物通過納米孔開口時,所述信號受聚合物亞單位的物理性質(zhì)的影響。 納米孔最佳地具有使得聚合物僅W依次、單個亞單位順序(single file order)通過的大 小或Ξ維構(gòu)型。在理論最佳條件下,聚合物分子W使得聚合物的每個離散單體亞單位的通 過能夠與所監(jiān)測的信號相關(guān)聯(lián)的速率通過納米孔。構(gòu)成聚合物的每個單體亞單位(例如構(gòu) 成ssDNA的核巧酸)的化學(xué)和物理性質(zhì)的差異產(chǎn)生特征電信號,所述特征電信號能夠在每個 單體亞單位通過納米孔時鑒定它。由此,迄今為止已被用于分析DNA、RNA和多膚的納米孔 (例如保持在脂雙層膜內(nèi)的蛋白質(zhì)納米孔W及固態(tài)納米孔)提供強有力地分析甚至是低拷 貝數(shù)的聚合物的潛在優(yōu)點。
[0010] 但是,完全實現(xiàn)運樣的好處仍然存在挑戰(zhàn)。例如,在理想測序條件下,每個潛在單 體亞單位類型通過納米孔會產(chǎn)生不同的可檢測信號,其能夠容易地與任何其他單體亞單位 類型通過納米孔所產(chǎn)生的可檢測信號區(qū)分開。但是,取決于納米孔和特定聚合物分析物的 結(jié)構(gòu)特征,多個單體亞單位類型常常會產(chǎn)生難W區(qū)分的可檢測信號。例如,在使用基于恥垢 分枝桿菌(Mycobacterium smegmatis)孔蛋白A(MspA)的蛋白質(zhì)納米孔分析ssDNA中,孔收 縮部分中的核巧酸對流過該孔的離子電流(ion current)影響最大。當(dāng)監(jiān)測離子電流時,已 經(jīng)發(fā)現(xiàn)核巧酸殘基腺嚷嶺(A)產(chǎn)生最大的可檢測電流,而殘基胸腺喀晚(T)產(chǎn)生最低的可檢 測電流。盡管可W容易地區(qū)分A和T殘基,但核巧酸殘基胞喀晚(C)和鳥嚷嶺(G)產(chǎn)生類似地 在A和T殘基所產(chǎn)生的電流水平之間的電流水平。因此,C和G殘基相互之間常常難W區(qū)分。在 另一個實例中,分析蛋白質(zhì)孔α-溶血素中的ssDNA產(chǎn)生甚至更為壓縮的信號,其中對于所有 四個核巧酸殘基類型存在信號重疊,運使得堿基判定(base-calling)不確定。
[0011]因此,仍然存在便于產(chǎn)生一致、清楚和可區(qū)分的信號的需要,所述信號能夠區(qū)分聚 合物的每個潛在亞單位類型。本公開內(nèi)容的方法和組合物解決了該需要和本領(lǐng)域的相關(guān)需 要。
[0012] 概述
[0013] 提供本概述是為了 W簡化的形式介紹下面在詳述中進一步描述的概念的選擇。本 概述不旨在確定所要求保護的主題的關(guān)鍵特征,也不旨在被用于幫助確定所要求保護的主 題的保護范圍。
[0014] 在一個方面,本公開內(nèi)容提供了用于分析聚合物分析物的方法。該方法包括:
[0015] (a)將包含被修飾亞單位的聚合物分析物通過納米孔從第一導(dǎo)電液體介質(zhì)轉(zhuǎn)運至 第二導(dǎo)電液體介質(zhì),其中納米孔提供第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體介質(zhì)之間的液體連 通;
[0016] (b)測量聚合物分析物通過納米孔時第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體介質(zhì)之間 的離子電流;W及
[0017] (C)基于所測量的離子電流檢測被修飾亞單位。
[0018] 在某些實施方案中,該方法進一步包括在步驟(a)之前選擇性修飾預(yù)分析物(pre- anal}fte)聚合物中一個種類的勒1聚合物亞單位(a ta;rget polymer subunit of a kind), 由此產(chǎn)生包含被修飾亞單位的聚合物分析物。在某些實施方案中,對一個種類的祀聚合物 亞單位的修飾包括將預(yù)分析物聚合物與藥劑接觸,其中藥劑能夠選擇性修飾預(yù)分析物聚合 物中某個種類的祀聚合物亞單位。在某些實施方案中,預(yù)分析物聚合物包含核酸、PNA、多膚 或其組合。在某些實施方案中,核酸是DNA或RNA。在某些實施方案中,祀聚合物亞單位的種 類是胞喀晚殘基、鳥嚷嶺殘基、胸腺喀晚殘基、腺嚷嶺殘基或尿喀晚殘基。
[0019] 在某些實施方案中,對某個種類的祀聚合物亞單位的修飾包括將某個種類的祀聚 合物亞單位選擇性轉(zhuǎn)變成脫堿基位點。在某些實施方案中,某個種類的祀核酸聚合物亞單 位被選擇性修飾或者新的分析物序列中被修飾亞單位類似物被替代,并且被修飾亞單位隨 后用錯誤校正酶轉(zhuǎn)化成脫堿基位點。
[0020] 在某些實施方案中,步驟(C)包括:
[0021] (i)將所測量的離子電流與對應(yīng)于包含沒有進行修飾的亞單位的參考聚合物的離 子電流進行比較;W及
[0022] (ii)檢測步驟(i)中所比較的離子電流中差異的有無,其中離子電流中差異的有 無分別表示聚合物分析物中亞單位修飾的有無。
[0023] 在某些實施方案中,參考聚合物包含與預(yù)分析物聚合物相同的序列或由其組成。
[0024] 在某些實施方案中,該方法進一步包括將參考聚合物通過納米孔從第一導(dǎo)電液體 介質(zhì)轉(zhuǎn)運至第二導(dǎo)電液體介質(zhì)并測量離子電流W提供對應(yīng)于參考聚合物的離子電流。在某 些實施方案中,該方法進一步包括基于所測量的離子電流的特征確定聚合物分析物中被修 飾亞單位的位置。在某些實施方案中,該方法進一步包括確定在預(yù)分析物聚合物序列中對 應(yīng)于聚合物分析物中被修飾亞單位的位置的位置處的祀聚合物亞單位的身份。
[0025] 在某些實施方案中,該方法進一步包括:
[00%] 對于包含共同序列(common sequence)的多個預(yù)分析物聚合物執(zhí)行選擇性修飾革己 聚合物亞單位的步驟和步驟(a)和(b);
[0027] 產(chǎn)生在步驟(b)中所測量的多個離子電流的一致性圖譜(consensus map); W及
[0028] 檢測共同序列中多個被修飾亞單位的存在。
[0029] 在某些實施方案中,該方法進一步包括:
[0030] 對于包含共同序列的多個預(yù)分析物聚合物執(zhí)行選擇性修飾祀聚合物亞單位的步 驟和步驟(a)和(b);
[0031] 產(chǎn)生在步驟(b)中所測量的多個離子電流的一致性圖譜;
[0032] 將一致性圖譜與對應(yīng)于包含沒有進行修飾的亞單位的參考聚合物的離子電流進 行比較;W及
[0033] 檢測在一致性圖譜和對應(yīng)于參考聚合物的離子電流之間多個差異的存在,其中多 個差異的存在與否表示共同序列中多個被修飾亞單位的存在。
[0034] 在另一個方面,本公開內(nèi)容提供了用于分析核酸分析物的方法。該方法包括:
[0035] (a)將經(jīng)被修飾的核堿基引入核酸分析物;
[0036] (b)將核酸分析物與能夠去除被修飾的核堿基的錯誤校正酶接觸W提供核酸分析 物中的脫堿基位點;
[0037] (C)將核酸分析物通過納米孔從第一導(dǎo)電液體介質(zhì)轉(zhuǎn)運至第二導(dǎo)電液體介質(zhì),其 中納米孔提供第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體介質(zhì)之間的液體連通;
[0038] (d)測量核酸分析物通過納米孔時第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體介質(zhì)之間的 離子電流;W及
[0039] (e)基于所測量的離子電流檢測脫堿基位點。
【附圖說明】
[0040] 當(dāng)結(jié)合附圖時,參考W下詳細描述,本發(fā)明的前述方面和許多伴隨的優(yōu)點將由于 其變得更好理解而變得更容易理解,其中:
[0041 ] 圖1顯示了通過將胞喀晚殘基(下面的序列,如SEQ ID N0:9所示并且在運里W3' 至5'方向顯示)用尿喀晚殘基(上面的序列,如SEQ ID N0:8所示并且在運里W3'至5'方向 顯示)替代、但保留5-徑甲基胞喀晚(*)和5-甲基胞喀晚(**)時在納米孔系統(tǒng)中獲得的電流 差異;
[00創(chuàng)圖2顯示了與DNA寡核巧酸Μ6Γ甲基護深線)和bM6("甲基6亞硫酸氨鹽"淺線)相關(guān) 的離子電流水平的圖案;
[0043] 圖3顯示了相比于bM6DNA寡核巧酸,與Μ抓NA寡核巧酸相關(guān)的電流水平的差異(M6 減去bM6)。大部分具有C至U的轉(zhuǎn)換的區(qū)域具有顯著減小的離子電流。參考如SEQ ID Ν0:7所 示、在運里W3'至5'方向顯示的分析物序列顯示離子電流。
[0044] 詳述
[0045] 本公開內(nèi)容一般性設(shè)及有效分析聚合物特征的組合物和方法。在一些方面,本公 開內(nèi)容提供產(chǎn)生和/或分析對祀聚合物亞單位類型特異性實施的修飾的方法和組合物。運 樣的修飾能夠強調(diào)(或產(chǎn)生)通過納米孔系統(tǒng)所產(chǎn)生的可檢測信號的差異。該差異能夠增強 區(qū)分聚合物中存在的不同亞單位的能力。
[0046] 納米孔有希望用于聚合物的便宜、快速和幾乎"無試劑"的分析。在納米孔系統(tǒng)的 一般實施方案中,跨納米尺度的、填充有電解質(zhì)的孔施加外部電壓,誘導(dǎo)電場。任何分析物 (諸如接觸、駐留于或移動通過孔內(nèi)部的聚合物)基于它的物理特征調(diào)制通過孔的離子電 流。如果孔所形成的內(nèi)部通道具有足夠小的直徑和長度,通過的聚合物則必須W線性形式 通過,使得一次只有聚合物亞單位的一個子集駐留于孔通道的最收縮區(qū)。因此,當(dāng)聚合物通 過納米孔(亞單位接著亞單位)時,離子電流隨時間波動,其取決于每個重復(fù)步驟中駐留于 納米孔收縮區(qū)的亞單位的不同物理特征。亞單位通過時所測量的離子電流的波動可W與亞 單位相關(guān)聯(lián),從而提供關(guān)于聚合物中亞單位類型的序列的信息(即可鑒定的亞單位類型的 依次順序)。
[0047] 如上所述,基于納米孔的聚合物分析的主要挑戰(zhàn)在于建立納米孔系統(tǒng),其中聚合 物的每個特異性亞單位類型產(chǎn)生可區(qū)分且特征性的信號。對納米孔和納米孔系統(tǒng)的改進已 經(jīng)被設(shè)計用來減慢聚合物分析物通過納米孔的轉(zhuǎn)運并針對每個單體亞單位產(chǎn)生更加可區(qū) 分的信號。然而,本發(fā)明人已經(jīng)開發(fā)了能夠很容易地應(yīng)用于所有納米孔系統(tǒng)的替代方法。如 下文中更詳細描述的那樣,本發(fā)明人已經(jīng)發(fā)現(xiàn),可W對待分析的聚合物的特異性亞單位實 施選擇性修飾,其產(chǎn)生不同于針對原始、未被修飾亞單位所觀察到的信號差異。結(jié)果,聚合 物中特異性單體亞單位的存在能夠通過對運些單體亞單位的修飾(如果存在的話)所產(chǎn)生 的可檢測信號中可預(yù)測的改變來進行區(qū)分。因此,當(dāng)檢測到信號中運樣的改變時,從業(yè)者可 W很容易地推斷特異性單體亞單位的存在,而減少與代表其他單體亞單位類型的信號發(fā)生 潛在混淆。該信息能夠被應(yīng)用于確定聚合物分析物的總體序列。在某些實施方案中,修飾產(chǎn) 生能夠容易地與對應(yīng)于任何其他單體亞單位類型的信號區(qū)分開的信號改變,并因此僅新信 號的存在就足W確認(rèn)聚合物序列中被修飾亞單位和原始的、未被修飾的亞單位的存在(和 位置)。
[0048] 根據(jù)前文,在一個方面,本公開內(nèi)容提供了用于分析聚合物分析物的方法。該方法 包括將包含被修飾亞單位的聚合物分析物通過納米孔從第一導(dǎo)電液體介質(zhì)轉(zhuǎn)運至第二導(dǎo) 電液體介質(zhì),其中納米孔提供第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體介質(zhì)之間的液體連通。該 方法進一步包括測量聚合物分析物通過納米孔時第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體介質(zhì) 之間的離子電流。該方法進一步包括基于所測量的離子電流檢測被修飾亞單位。
[0049] 本公開內(nèi)容一般性討論了便于分析適于在基于納米孔的系統(tǒng)中進行分析的任何 聚合物分析物的方法。本文使用的術(shù)語"聚合物"是指運樣的化合物,所述化合物包含兩個 或更多個重復(fù)結(jié)構(gòu)單元,所述重復(fù)結(jié)構(gòu)單元一般性地在本文中可交換地被稱為"亞單位"、 "單體單元"或"聚體",其中每個亞單位可W是相同或不同的。取決于聚合物的類型,每個位 置的潛在亞單位可W選自一組可鑒定的亞單位結(jié)構(gòu)。待用本發(fā)明的方法進行分析的聚合物 的非限制性實例包括:核酸、多膚和蛋白質(zhì),W及多種控聚合物(例如聚乙締、聚苯乙締)和 官能化控聚合物,其中聚合物主鏈包含碳鏈(例如聚氯乙締、聚甲基丙締酸醋)。聚合物可W 包括共聚物、嵌段共聚物和支化聚合物諸如星形聚合物和樹狀聚合物。
[0050] 在某些實施方案中,聚合物是或者包含核酸。術(shù)語"核酸"是指單鏈或雙鏈形式的 脫氧核糖核巧酸聚合物(DNA)或者核糖核巧酸聚合物(RNA)。在本文中例如DNA的規(guī)范聚合 物亞單位的結(jié)構(gòu)是普遍知曉的,并被稱為腺嚷嶺(A)、鳥嚷嶺(G)、胞喀晚(C)和胸腺喀晚 (T)。在本文中,作為一組,它們一般被稱為核巧酸或核巧酸殘基。對于RNA,除了 W尿喀晚 (u)代替胸腺喀晚(T)W外,規(guī)范聚合物亞單位是相同的。
[0051] 在某些實施方案中,聚合物是或者包含多膚,即聚合物是或者包含多個氨基酸殘 基的序列。本文使用的"氨基酸"是指W下任意氨基酸:蛋白質(zhì)中發(fā)現(xiàn)的20種天然存在的氨 基酸、天然存在的氨基酸的D-立體異構(gòu)體(例如D-蘇氨酸)和非天然氨基酸。運些氨基酸類 型的每一種并不是相互排斥的。α-氨基酸包含碳原子,氨基、簇基、氨原子和被稱為"側(cè)鏈" 的獨特基團與該碳原子鍵合。天然存在的氨基酸的側(cè)鏈?zhǔn)潜绢I(lǐng)域眾所周知的,并且包括例 如氨(例如在甘氨酸中)、烷基(例如在丙氨酸、鄉(xiāng)氨酸、亮氨酸、異亮氨酸、脯氨酸中)、取代 的烷基(例如在蘇氨酸、絲氨酸、甲硫氨酸、半脫氨酸、天冬氨酸、天冬酷胺、谷氨酸、谷氨酷 胺、精氨酸和賴氨酸中)、芳基烷基(例如在苯丙氨酸和色氨酸中)、取代的芳基烷基(例如在 酪氨酸中)和雜芳基烷基(例如在組氨酸中)。
[0052] W下縮寫用于20種天然存在的氨基酸:丙氨酸(Ala;A)、天冬酷胺(Asn;N)、天冬氨 酸(Asp;D)、精氨酸(Arg;R)、半脫氨酸(切s;C)、谷氨酸(Glu;E)、谷氨酷胺(Gln;Q)、甘氨酸 (Gly;G)、組氨酸化is;H)、異亮氨酸(Ile;I)、亮氨酸化eu;L)、賴氨酸化ys;K)、甲硫氨酸 (16*;1)、苯丙氨酸。}16;。)、脯氨酸。'0少)、絲氨酸(56';5)、蘇氨酸(化';1')、色氨酸(化口; 胖)、酪氨酸(了71';¥)和鄉(xiāng)氨酸(化1;¥)。
[0053] 任何前述聚合物的實例也可W包括非規(guī)范亞單位或類似物。非規(guī)范亞單位能夠用 于提供明顯的輸出信號,W表示參考結(jié)構(gòu)域的末端已經(jīng)通過納米孔。關(guān)于核酸聚合物的實 施方案,非規(guī)范亞單位的示例性和非限制性實例包括尿喀晚(用于DNAK5-甲基胞喀晚、5- 美圣甲基胞喀晚、5 -甲酯胞喀晚(5-fo;rmethylcytosine)、5 -簇基胞喀晚(5- 。曰1'13〇巧巧1〇3;[]1日)13-葡萄糖基-5-徑甲基胞喀晚、8-氧代鳥嚷嶺、2-氨基-腺嚷嶺、2-氨基- 脫氧腺嚷嶺、2-硫代胸腺喀晚、化咯并-喀晚、2-硫代胞巧或者脫堿基損傷或位點。脫堿基位 點是脫氧核糖主鏈上缺少堿基的位置。天然核巧酸的已知類似物W類似于天然存在的核巧 酸的方式與核酸雜交,諸如膚核酸(PNA)和硫代憐酸醋DNA。
[0054] 代表性非規(guī)范膚殘基是本領(lǐng)域已知的,如例如W下文獻中所示:Williams等人, Mol.Cell.Biol.9:2574( 1989) ;Evans等人,J.Amer.Chem.Soc. 112:4011-4030( 1990);化等 人,J.Amer.化em.Soc.56:1280-1283(1991);Williams等人,J.Amer.Qiem. Soc. 113:9276- 9286(1991) 及它們之中所引用的所有參考文獻。示例性非規(guī)范氨基酸包括、但不限于: 2-氨基己二酸、N-乙基天冬酷胺、3-氨基己二酸、徑賴氨酸化yho巧lysin)、i3-丙氨酸、β-氨 基丙酸、別徑賴氨酸(日11〇-曲化〇巧173山日)、2-氨基下酸、3-徑脯氨酸、4-氨基下酸、贓晚酸 (piperidinic acid)、4-^脯氨酸、6-氨基己酸、異鎖鏈素、2-氨基庚酸、別異亮氨酸、2-氨 基異下酸、N-甲基甘氨酸、肌氨酸、3-氨基異下酸、N-甲基異亮氨酸、2-氨基庚二酸、6-N-甲 基賴氨酸、2,4-二氨基下酸、N-甲基鄉(xiāng)氨酸、鎖鏈素、正鄉(xiāng)氨酸、2,2'-二氨基庚二酸、正亮氨 酸、2,3-二氨基丙酸、鳥氨酸、N-乙基甘氨酸。引入非規(guī)范氨基酸的方法是本領(lǐng)域眾所周知 的。
[0055] 在某些實施方案中,單個聚合物可W包含任意前述聚合物和/或聚合物亞單位的 組合。例如,在某些實施方案中,聚合物分析物是DNA、RNA、PNA和/或多膚中任意兩種或更多 種的組合。
[0056] 本文使用的術(shù)語"聚合物分析物"是指在基于納米孔的系統(tǒng)中經(jīng)受分析的聚合物, 納米孔系統(tǒng)在下文中進行更詳細的描述。在某些實施方案中,聚合物分析物可W源自預(yù)分 析物聚合物,或反映其序列。本文使用的術(shù)語"預(yù)分析物聚合物"是指具有單體亞單位的原 始序列的聚合物。如上所述,預(yù)分析物聚合物可W是DNA、RNA、PNA、多膚中的任意一種,或其 組合。在某些實施方案中,預(yù)分析物聚合物包含核酸。在進一步的實施方案中,核酸是DNA或 RNA。預(yù)分析物聚合物的序列不需要事先已知,但是在某些實施方案中可W通過本發(fā)明公開 的方法所促進的分析來進行推斷。聚合物分析物包含相對于預(yù)分析物聚合物中對應(yīng)亞單位 被修飾的亞單位。在該情形下,術(shù)語"被修飾"表示在聚合物分析物的亞單位中存在結(jié)構(gòu)改 變,其產(chǎn)生可W與預(yù)分析物聚合物中對應(yīng)的未被修飾或原始亞單位所產(chǎn)生的信號可區(qū)分開 的信號。
[0057] 在某些實施方案中,該方法進一步包括在轉(zhuǎn)運步驟之前選擇性修飾預(yù)分析物聚合 物中某一種類的祀聚合物亞單位,由此產(chǎn)生包含被修飾亞單位的聚合物分析物。本文使用 的短語"選擇性修飾某一種類(一個種類)的祀聚合物亞單位"是指修飾單體亞單位中單個 種類(即類型)的一次或多次重復(fù)。例如,在預(yù)分析物聚合物是DNA的實施方案中,祀聚合物 亞單位可W是任意一個類型的或種類的亞單位,即任何具體類型的核堿基(例如腺嚷嶺 (A)、胸腺喀晚(T)、胞喀晚(C)或鳥嚷嶺(G))。在預(yù)分析物聚合物是RNA的實施方案中,祀聚 合物亞單位可W是任意一個類型或種類的亞單位,即任何具體類型的核堿基(例如腺嚷嶺 (A)、尿喀晚化)、胞喀晚(C)或鳥嚷嶺(G))。作為一個具體示例性實例,祀亞單位類型可W是 胞喀晚(C),其經(jīng)受選擇性修飾,其中其他任何類型(在該DNA實例中是A、T或G)不被修飾。當(dāng) W具有未知序列的預(yù)分析物聚合物開始時,將不會事先知道是否存在任何C亞單位,存在多 少C亞單位,或者任意C亞單位存在于序列的哪里。然而,該知識不是必須的。
[0058] 不管有無任何事先知識,被修飾的某一種類的祀聚合物亞單位的具體數(shù)目僅受到 預(yù)分析物聚合物序列中一個種類的聚合物亞單位的數(shù)目的限制。即便在預(yù)分析物聚合物中 存在多個某一種類祀聚合物亞單位,本發(fā)明的方法包括修飾小于所有現(xiàn)有的某一種類祀聚 合物亞單位。在一個實施方案中,修飾現(xiàn)有的某一種類祀聚合物亞單位中的一個。例如,即 使預(yù)分析物聚合物在序列中包含多個祀胞喀晚亞單位,只修飾胞喀晚亞單位中的一個。在 另一個實施方案中,修飾現(xiàn)有某一種類祀聚合物亞單位中的超過一個。在又一個實施方案 中,修飾所有的現(xiàn)有的某一種類祀聚合物亞單位。如下文中更詳細描述的那樣,在修飾小于 所有現(xiàn)有的某一種類祀聚合物亞單位的實施方案中,可W對多個拷貝的預(yù)分析物聚合物進 行分析W產(chǎn)生多個測量的離子電流。然后,多個離子電流的一致性(consensus)可W被用于 定位預(yù)分析物序列的原始序列內(nèi)某一種類祀聚合物亞單位的所有位置。
[0059] 在某些實施方案中,修飾某一種類祀聚合物亞單位的步驟包括將預(yù)分析物聚合物 與藥劑接觸,其中藥劑能夠選擇性修飾預(yù)分析物聚合物中某一種類祀聚合物亞單位。如上 所述,修飾是選擇性的,因為任何其他種類的聚合物亞單位不被該藥劑修飾。
[0060] 在一個實施方案中,預(yù)分析物聚合物是或者包含核酸。在一個進一步的實施方案 中,祀聚合物亞單位的種類選自腺嚷嶺(A)、胸腺喀晚(T)、胞喀晚(C)、鳥嚷嶺(G)或尿喀晚 化)(在RNA中)。
[0061] 在一個實施方案中,祀聚合物亞單位的種類是胞喀晚。在一個進一步的實施方案 中,通過將胞喀晚核堿基轉(zhuǎn)換成尿喀晚核堿基而選擇性修飾祀胞喀晚聚合物亞單位。運種 轉(zhuǎn)換也被稱為胞喀晚核堿基的脫氨基??蒞通過任何各種已知的藥劑進行胞喀晚的脫氨 基。作為非限制性實例,可W通過包括亞硫酸氨鹽、胞喀晚脫氨基酶、NO、化化和棘霉素等的 藥劑進行胞喀晚變成尿喀晚的選擇性脫氨基。參見例如Caulfield,J. L.等人"Nitric Oxide-induced Deamination of Cytosine and Guanine in Deoxynucleosides and Oligonucleotides,"The Journal of Biological Qiemistry,273:12689-12695(1998)和 Moyer,R.等人 Echinomycin,a bis-intercalating agent, induces C一 T mutations via cytosine deamination,"Mutation Research/Fundamental and Molecular Mechanisms of Mu化genesis 228:291-300( 1993),通過引用將其每一篇W全文并入本文中。
[0062] 在某些實施方案中,進一步將所得尿喀晚轉(zhuǎn)換成聚合物中的脫堿基位點。如上所 述,脫堿基位點是在脫氧核糖主鏈上缺少堿基的位置(例如缺少核堿基亞單位)。但是,與缺 失突變相反,在脫堿基位點,該位點本身仍然存在并且沒有被從聚合物上切除。如下文中更 詳細描述的那樣,核酸聚合物中的脫堿基位點在納米孔系統(tǒng)中產(chǎn)生非常獨特的信號,其傾 向于不與由任何其他可能的亞單位類型產(chǎn)生的任何信號重疊。因此,一旦尿喀晚轉(zhuǎn)換成脫 堿基位點,所得聚合物可W在該方法的轉(zhuǎn)運步驟中被用作分析物聚合物。
[0063] 在其他實施方案中,尿喀晚轉(zhuǎn)換成脫堿基位點包括將預(yù)分析物聚合物與核酸錯誤 校正酶接觸。用于核酸的錯誤校正酶是眾所周知的并可W被用來定位并從核酸聚合物去除 非規(guī)范核堿基(例如被修飾的核堿基亞單位)。例如,在一個實施方案中,核酸錯誤校正酶是 尿喀晚去糖基化酶化NG)或其類似物。能夠?qū)⒛蚩ν砗藟A基轉(zhuǎn)換成脫堿基位點的其他核酸 錯誤校正酶是已知的,并且包括在該方法內(nèi)。
[0064] 在一個實施方案中,祀聚合物亞單位的種類是胞喀晚,并且通過甲基化而選擇性 修飾預(yù)分析物聚合物中的一個或多個胞喀晚亞單位。在一個實施方案中,通過將預(yù)分析物 聚合物與甲基轉(zhuǎn)移酶接觸而直接甲基化所述一個或多個胞喀晚亞單位。甲基轉(zhuǎn)移酶不必甲 基化一種類型的祀亞單位中的每一個(例如序列中的每一個胞喀晚)。但是,可W類似地處 理多個、相同的預(yù)分析物聚合物,并且可W編譯一致山〇郵日113113)信號W確定運類型祀亞單 位的聚集分布(aggregate distribution)。在另一個實施方案中,可W在使用例如引物延 伸或PCR方法產(chǎn)生新的預(yù)分析物聚合物過程中通過取代對胞喀晚亞單位進行甲基化。例如, 可W通過使用聚合酶將甲基胞喀晚類似物引入預(yù)分析物聚合物序列中代替胞喀晚殘基來 選擇性甲基化預(yù)分析物聚合物中的一個或多個胞喀晚亞單位。在該實施方案中,所提供的 原始dNTP混合物會引入甲基-dS憐酸,例如5-甲基-dCTP代替dCTP。該實例中所得聚合物會 具有W5-甲基胞喀晚代替胞喀晚的序列。
[0065] 在進一步的實施方案中,選擇性修飾一個或多個胞喀晚殘基的步驟進一步包括將 甲基化的胞喀晚殘基轉(zhuǎn)換成脫堿基位點,從而產(chǎn)生聚合物分析物。在某些實施方案中,將甲 基化的胞喀晚殘基轉(zhuǎn)換成脫堿基位點包括將預(yù)分析物聚合物與核酸錯誤校正酶接觸。如 上,錯誤校正酶可W是能夠識別對規(guī)范核酸核堿基的修飾并去除它們而得到脫堿基位點的 任何酶。作為一個非限制性實例,DNA糖基化酶是可W被使用的主要修復(fù)酶家族。DNA糖基化 酶分成兩類:"純"糖基化酶和AP(脫嚷嶺/脫喀晚)裂合酶/糖基化酶。純糖基化酶在DNA中留 下脫堿基位點,而AP裂合酶/糖基化酶留下具有切口的AP位點,其會使DNA的單鏈斷裂。5-甲 基胞喀晚DNA糖基化酶是從DNA聚合物去除5-甲基胞喀晚堿基的核酸(例如DNA)錯誤校正酶 的一個實例。
[0066] 在一個實施方案中,祀聚合物亞單位的種類是鳥嚷嶺,并且通過甲基化來選擇性 修飾預(yù)分析物中的一個或多個鳥嚷嶺亞單位。如上面對胞喀晚的描述中所述,在一個實施 方案中,通過將預(yù)分析物與甲基轉(zhuǎn)移酶接觸來直接甲基化一個或多個鳥嚷嶺亞單位。甲基 轉(zhuǎn)移酶不需要甲基化一種類型的每個祀亞單位(例如序列中的每個鳥嚷嶺)。然而,可W類 似地處理預(yù)分析物聚合物的多個復(fù)制品,并且可W編輯一致性信號W確定該類型的祀亞單 位的聚集分布。在另一個實施方案中,可W在產(chǎn)生新的預(yù)分析物聚合物期間,使用例如引物 延伸反應(yīng)或PCR方法,通過取代來甲基化鳥嚷嶺亞單位。在一個進一步的實施方案中,所述 甲基化鳥嚷嶺是3-甲基化鳥嚷嶺。在另一個實施方案中,所述甲基化鳥嚷嶺是7-甲基化鳥 嚷嶺。如上所述,可W使用PCR或引物延伸反應(yīng)方法,在重新編碼的預(yù)分析物聚合物中通過 取代實現(xiàn)甲基化鳥嚷嶺。在運樣的方法中,提供的dNTP混合物可W含有3-甲基-dGTP或7-甲 基-dGTP,而不是dGTP。
[0067] 在進一步的實施方案中,選擇性修飾一個或多個鳥嚷嶺殘基的步驟還包括將甲基 化鳥嚷嶺殘基轉(zhuǎn)換成脫堿基位點,從而產(chǎn)生聚合物分析物。在一些實施方案中,如上所述, 將甲基化胞喀晚殘基轉(zhuǎn)換成脫堿基位點包括使預(yù)分析物聚合物接觸核酸(例如DNA)錯誤校 正酶。核酸(例如DNA)DNA誤差校正酶的說明性非限制性實例是alkA(來自大腸桿菌),W移 除7-甲基鳥嚷嶺堿基。參見例如化rilch,S.S.,等人,"Base excision repair enzyme family portrait: integrating the structure and chemistry of an entire DNA repair pathway",Sl:;ruc1:ure5(l2): 1543-1550(1997),通過引用全文并入本文。移除3-甲 基鳥嚷嶺的核酸(例如DNA)DNA錯誤校正酶的說明性、非限制性實例包括alkA(來自大腸桿 菌)、tag(也稱為"3-甲基腺嚷嶺DNA糖基化酶Γ',來自大腸桿菌)、MAG(來自釀酒酵母)、MPG (來自小鼠或人類)。參見例如Bjelland,S.,等人,Excision of 3-methylguanine from alkylated DNA by 3-methyladenine DNA glycosylase I of Escherichia coli", Nucleic Acids Res.21(9) :2045-2049(1993) 等人,"purification and properties of the alkylation repair DNA glycosylase encoded the MAG gene from Saccharomyces cerevisiae",Biochemistry34(14) :4577-4582(1995);和Roy ,R.,等人, ('Distinct substrate preference of human and mouse N-methyIpurine-DNA glycosylases",Carcinogenesis 17( 10): 2177-2182( 1996)。W上各文獻通過引用全文并 入本文。
[0068] 本領(lǐng)域技術(shù)人員會容易理解,對一種類型的祀核酸亞單位(例如4、1\6、(:或1]中的 任一個)的選擇性修飾,而不是甲基化事件,也可W被應(yīng)用于預(yù)分析物核酸聚合物。因此,例 如,根據(jù)類似的方法(例如直接用適當(dāng)?shù)倪x擇劑或通過在PCR或引物延伸反應(yīng)中取代W重新 編碼預(yù)分析物聚合物序列),可W使祀核酸堿基亞單位經(jīng)受其他修飾。使用適當(dāng)?shù)暮怂?例 如DNA)錯誤校正酶可W將所得被修飾亞單位轉(zhuǎn)換成脫堿基位點。例如,腺嚷嶺亞單位可W 接受特異性祀定的脫氨基化W提供次黃嚷嶺亞單位。運些亞單位可W被來自大腸桿菌的 DNA錯誤校正酶a化A(酵母中的Magi,人類中的MPG)檢出并移除。作為另一個實例,DNA錯誤 校正酶巧g(甲酯胺基喀晚[fapy ]-DNA糖基化酶)(也稱作8-氧代鳥嚷嶺DNA糖基化酶)識別 運樣的7,8-二氨-8-氧代鳥嚷嶺(8-氧代鳥嚷嶺)和8-氧代腺嚷嶺,它們是非-甲基化堿基改 變。盡管運種酶還含有裂解酶活性,其可W在產(chǎn)生脫堿基位點后導(dǎo)致DNA的切割,通過標(biāo)準(zhǔn) 方法(諸如用于裂解酶活性的活性位點的分子工程)可W很容易抑制裂解酶的活性。
[0069] 在很多實施方案中,在預(yù)分析物聚合物中一種類型的一個或多個祀亞單位的修 飾,W產(chǎn)生包含被修飾亞單位的分析物聚合物,將足W導(dǎo)致可檢測的離子電流,其清楚地發(fā) 出存在修飾的信號。例如,通常預(yù)計轉(zhuǎn)換任何核酸亞單位成為脫堿基位點將在大部分納米 孔系統(tǒng)產(chǎn)生明顯的信號,該信號不會與來自剩余核酸亞單位的任何離子電流信號重疊。然 而,在某些實施方案中,被修飾亞單位的存在產(chǎn)生了不同的離子電流,運種離子電流可W會 與另一種不同類型已有亞單位產(chǎn)生的離子電流重疊。因此,正是存在離子電流信號變化表 示在序列中特定位置存在被修飾亞單位。因此,在該方法的某些實施方案中,檢測被修飾亞 單位的步驟包括:將所測量的離子電流與對應(yīng)于包含沒有進行修飾的亞單位的參考聚合物 的離子電流進行比較;檢測所比較的離子電流中差異的有無,其中離子電流中差異的有無 分別表明在聚合物分析物中亞單位修飾。
[0070] 在某些實施方案中,參考聚合物包含與預(yù)分析物聚合物相同的序列。在某些實施 方案中,參考聚合物由與預(yù)分析物聚合物相同的序列組成。因此,在某些實施方案中,參考 聚合物是預(yù)分析物聚合物。
[0071] 在某些實施方案中,所述方法進一步包括通過納米孔將參考聚合物從第一導(dǎo)電液 體介質(zhì)轉(zhuǎn)運到第二導(dǎo)電液體介質(zhì),并測量離子電流,W提供對應(yīng)于參考聚合物的離子電流。 在某些實施方案中,該方法進一步包括基于所測量的聚合物分析物的離子電流的特征確定 聚合物分析物中被修飾亞單位的位置。在某些實施方案中,所測量的離子電流的特征是在 聚合物分析物的離子電流和參考聚合物的離子電流之間的差,或者是差異的范圍。在某些 實施方案中,所述方法包括確定在預(yù)分析物聚合物序列中對應(yīng)于聚合物分析物中被修飾亞 單位的位置的位置處的祀聚合物亞單位的身份。
[0072] 可W理解,對于DNA分析物的情況下,其中正(或有義)鏈與負(或反義)鏈互補,可 W在第一鏈上進行分析,W確定在第一鏈中一種第一祀聚合物亞單位的一個或多個位置。 可W在互補鏈(例如第二鏈)上進行相同的分析,由于第一鏈和第二鏈的互補性,運將指明 第一鏈中一種第二祀聚合物亞單位的一個或多個位置。例如,DNA的有義鏈可W被修飾,其 中胞喀晚被轉(zhuǎn)換成尿喀晚(且有可能被進一步修飾成脫堿基位點),如本文所述,獲得第一 聚合物分析物。被修飾亞單位會產(chǎn)生可區(qū)別的離子電流信號,其指明原胞喀晚在DNA的原始 預(yù)分析物有義鏈中的位置。可W在DNA的反義鏈上進行相同的修飾W產(chǎn)生第二聚合物分析 物,所述反義鏈?zhǔn)堑谝绘湹幕パa。得自第二聚合物分析物的離子電流信號表明原始原胞喀 晚在預(yù)分析物反義鏈中的位置。由于原始預(yù)分析物反義鏈中胞喀晚殘基與原始預(yù)分析物有 義鏈中鳥嚷嶺殘基互補,第二聚合物分析物(反義鏈)的運種分析提供了原始預(yù)分析物有義 鏈中鳥嚷嶺的位置。因此,可W清楚地識別用于有義鏈的四種類型聚合物亞單位中的兩種。 在MspA納米孔系統(tǒng)的情況下,腺嚷嶺和胸腺喀晚殘基產(chǎn)生易于分辨的離子電流,而胞喀晚 和鳥嚷嶺殘基常常具有重疊的離子電流。通過成功地識別胞喀晚和鳥嚷嶺殘基兩者的位 置,可高水平的確定性查明整個序列。
[0073] 如上所述,在某些情況下,不是一種類型的全部的已有祀聚合物亞單位都被修飾。 運可能是由于所用藥劑的限制,或者是聚合物不能穩(wěn)定地接受所有變化。因此,在該方法的 某些實施方案中,針對包含共同序列的多個預(yù)分析物聚合物進行選擇性修飾祀聚合物亞單 位W提供聚合物分析物、轉(zhuǎn)運聚合物分析物,和測量離子電電流的步驟。在該實施方案中, 產(chǎn)生多個測量的離子電流的一致性圖譜,并在共同序列中檢測存在被修飾亞單位。在進一 步的實施方案中,其中通過不同于參考信號的離子電流信號確定被修飾亞單位的存在,針 對包含共同序列的多個預(yù)分析物聚合物進行選擇性修飾祀聚合物亞單位W提供聚合物分 析物、轉(zhuǎn)運聚合物分析物和測量離子電流的步驟;產(chǎn)生多個測量的離子電流的一致性圖譜; 將該一致性圖譜與對應(yīng)于包含沒有進行修飾的亞單位的參考聚合物的離子電流進行比較; 并檢測一致性圖譜與參考聚合物的相應(yīng)離子電流之間多處差異的存在,其中多處差異的有 無表明在共同序列中多個被修飾亞單位的存在。
[0074] 在另一方面,本公開內(nèi)容提供了用于分析核酸分析物的方法,包括:
[0075] (a)將被修飾的核堿基并入核酸分析物;
[0076] (b)用能夠去除被修飾的核堿基的錯誤校正酶接觸核酸分析物,W提供核酸分析 物中的脫堿基位點;
[0077] (C)將核酸分析物從第一導(dǎo)電液體介質(zhì)通過納米孔轉(zhuǎn)運到第二導(dǎo)電液體介質(zhì),其 中所述納米孔提供第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體介質(zhì)之間的液體連通;
[0078] (d)測量核酸分析物通過所述納米孔時第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體介質(zhì)之 間的離子電流;W及
[0079] (e)基于所測量的離子電流檢測脫堿基位點。
[0080] 如上所述,可W使用已知的在祀核堿基中選擇性產(chǎn)生結(jié)構(gòu)變化的藥劑直接產(chǎn)生被 修飾的核堿基,所述結(jié)構(gòu)變化諸如甲基化、脫氨基化、氧化等等?;蛘?,可W使用祀核堿基重 新編碼核酸分析物,使用已知的對dNTP混合物的適當(dāng)修飾,W選擇的被修飾的核堿基取代 所述祀核堿基(如上所述W及下面示例的)。隨后,核酸分析物與錯誤校正酶(諸如DNA錯誤 校正酶)接觸,DNA錯誤校正酶是本領(lǐng)域已知的,并且在上文中進行了一般性描述。對本領(lǐng)域 技術(shù)人員顯而易見的是,運種策略可W針對任何核酸亞單位類型,諸如腺嚷嶺(A)、鳥嚷嶺 (G)、胞喀晚(C)和胸腺喀晚(T)(或RNA中的尿喀晚化))。
[0081] 現(xiàn)在將描述納米孔和納米孔系統(tǒng)的各個方面。"納米孔"特定地指一種孔,其具有 的開口在其最狹窄點處的直徑為大約〇.3nm至大約2nm。在本公開內(nèi)容中有用的納米孔包括 任何能夠允許聚合物W適合于監(jiān)控技術(shù)(諸如檢測電流波動的技術(shù))的速度從一邊線性轉(zhuǎn) 運到另一邊的任何孔。在某些實施方案中,納米孔包括蛋白質(zhì),諸如α溶血素、恥垢分枝桿菌 孔蛋白A(MspA)、0mpATb、它們的同系物、或其他孔蛋白,如在美國專利公開號US2012/ 0055792、PCT 國際專利公開號 W02011/106459、W02011/106456 和 Manrao 等人的'書 eading DNA at single-nucleotide resolution with a mutant MspA nanopore and phi29DNA polymerase",化t.Biotechnol.30:349-353(2012),運些文獻通過引用全文并入本文。本文 使用的"同系物"是指來自具有類似的結(jié)構(gòu)和進化起源的另一種類細菌的基因。例如,野生 型MspA的同系物,諸如MppA、PorMl、PorM2和Mmcs4296可W用作本發(fā)明的納米孔。蛋白質(zhì)納 米孔作為生物分子具有的優(yōu)勢是:它們自組裝,并且彼此基本上相同。此外,有可能賦予基 因工程蛋白質(zhì)納米孔所需的屬性,諸如用具有不同電荷的氨基酸取代氨基酸殘基,或創(chuàng)建 一種融合蛋白(例如外切核酸酶+曰溶血素)。因此,蛋白質(zhì)納米孔可W是野生型,或者可W被 修飾W含有至少一種氨基酸取代、缺失或添加。在某些實施方案中,所述至少一種氨基酸取 代、缺失或添加導(dǎo)致納米孔的不同凈電荷。在某些實施方案中,凈電荷的不同增加了與聚合 物分析物的第一荷電部分相比凈電荷的不同。例如,如果第一荷電部分具有凈負電荷,則至 少一種氨基酸取代、缺失或添加會導(dǎo)致納米孔較少荷負電。在某些情況中,所得凈電荷是負 的(但是較少運種情況)、是中性的(其之前是負的)、是正的(其之前是負的或中性的),或是 更多正電荷(其之前是正的,但較少運種情況)。
[0082] 在參見美國專利公開號2012/0055792中已經(jīng)描述了對MspA納米孔的修飾,將該文 獻通過引用全文并入本文。簡單地描述一下,可W用氨基酸取代來修飾MspA納米孔,W獲得 MspA突變體,其參考野生型氨基酸序列而言在位置93有一個突變、在位置90、位置91,或90 和91兩個位置有突變,并任選在W下氨基酸位置的任何一個發(fā)生一或多個突變:88、105、 108、118、134或139。在一個特定實施方案中,1394參考野生型序列位置而言包含突變09(^/ D91N/D93N(在其中被稱為"MlMspA"或"Ml-NNN")。在另一個實施方案中,MspA參考野生型序 列位置而言包含突變D90N/D91N/D93N/D118R/D134R/E139K (在其中被稱為"M2MspA")。參見 美國專利公開號2012/0055792。運樣的突變會產(chǎn)生一種MspA納米孔,其包括具有長度約2至 約6皿、直徑約2至約6皿的前廳(vestibule)和具有長度約0.3至約3皿和直徑約0.3至約3皿 的縮窄區(qū),其中前廳和縮窄區(qū)共同限定了通道。此外,在運些實例中描述的氨基酸取代在納 米孔的前廳提供了更大的凈正電荷,進一步增強了與荷負電的聚合物分析物端相互作用的 能量有利度。
[0083] 在某些實施方案中,納米孔可包括或包含基于DNA的結(jié)構(gòu),諸如通過DNA折紙技術(shù) 產(chǎn)生的那些。關(guān)于用于分析物檢測的基于DNA折紙的納米孔的描述,請參見PCT專利公開號 W02013/083983,將其通過引用并入本文。
[0084] 在某些實施方案中,所述納米孔可W是固態(tài)納米孔。固態(tài)納米孔可W按照美國專 利號7,258,838和7,504,058的描述來產(chǎn)生,將運兩篇文獻通過引用全文并入本文。固態(tài)納 米孔具有的優(yōu)勢是它們更堅固和穩(wěn)定。此外,在一些情況下,固態(tài)納米孔可非常高效和 成本節(jié)約的方式多路和批量生產(chǎn)。最后,它們可W與微電子制造技術(shù)結(jié)合。在某些實施方案 中,所述納米孔包括雜合蛋白/固態(tài)納米孔,其中納米孔蛋白質(zhì)被并入到固態(tài)納米孔。在某 些實施方案中,所述納米孔是生物適應(yīng)的固態(tài)孔。
[0085] 在某些實施方案中,諸如并入MspA蛋白納米孔,所述納米孔包括前廳和縮窄區(qū),它 們共同形成通道。"前廳"指的是納米孔內(nèi)部的錐形部分,其直徑一般沿中屯、軸從一端到另 一端減少,其中前廳最窄的部分連接至縮窄區(qū)。前廳通??蒞被可視化為"杯狀的"。由于前 廳是杯狀的,直徑沿著中屯、軸路徑變化,其中一端的直徑大于相對端的直徑。直徑可W在大 約化m至大約6nm的范圍。任選該直徑是大約、至少大約或至多大約2,2.1,2.2,2.3,2.4, 2.5.2.6.2.7.2.8.2.9.3.0. 3.1.3.2.3.3.3.4.3.5.3.6.3.7.3.8.3.9.4.0.4.1.4.2.4.3, 4.4.4.5.4.6.4.7.4.8.4.9.5.0. 5.1.5.2.5.3.5.4.5.5.5.6.5.7.5.8.5.9,或6. Onm,或其 中可衍生的任何范圍。中屯、軸的長度可W在大約2nm至大約6nm的范圍。任選該長度是大約、 至少大約或至多大約2,2.1,2.2,2.3,2.4,2.5,2.6,2.7,2.8,2.9,3.0,3.1,3.2,3.3,3.4, 3.5.3.6.3.7.3.8.3.9.4.0. 4.1.4.2.4.3.4.4.4.5.4.6.4.7.4.8.4.9.5.0.5.1.5.2.5.3, 5.4,5.5,5.6,5.7,5.8,5.9,或6. Onm,或其中可衍生的任何范圍。當(dāng)本文中提到"直徑"時, 可W通過測量中屯、到中屯、距離或原子表面到表面的距離來確定。
[0086] "縮窄區(qū)"是指就直徑而言的納米孔通道的最窄部分,其與前庭相連。縮窄區(qū)的長 度可W是例如大約0 .化m至大約20nm范圍。任選該長度是大約、至多大約或至少大約0.3, 0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4,1.5,1.6,1.7,1.8,1.9,2,或3nm,或其 中可衍生的任何范圍??s窄區(qū)的直徑可W為大約〇.3nm至大約2nm。任選該直徑為大約、至多 大約或至少大約 0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4,1.5,1.6,1.7, 1.8,1.9,2,或3皿,或其中可衍生的任何范圍。在其它實施方案中,諸如并入固態(tài)孔的那些, 尺寸(長度或直徑)的范圍可W延伸直到大約20nm。例如,固態(tài)納米孔的縮窄區(qū)是大約、至多 大約或至少大約 0.3,0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4,1.5,1.6,1.7, 1.8,1.9,2,3,4,5,6,7,8,9,10,11,1,213,14,15,16,17,18,19,或20皿,或其中可衍生的任 何范圍。運種納米孔中的較大尺寸可優(yōu)選依賴于……
[0087] 在某些情況中,將所述納米孔置于膜、薄膜或脂質(zhì)雙層內(nèi),其可W分隔第一和第二 導(dǎo)電液體介質(zhì),在第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體介質(zhì)之間提供了非導(dǎo)電屏障。因此,所 述納米孔提供了第一和第二導(dǎo)電液體介質(zhì)之間的液體連通。在某些實施方案中,所述孔提 供了第一和第二導(dǎo)電液體介質(zhì)之間唯一的液體連通。所述液體介質(zhì)通常包含可W通過納米 孔的內(nèi)部從第一導(dǎo)電液體介質(zhì)流向第二導(dǎo)電液體介質(zhì)的電解質(zhì)或離子。在本文所述方法中 可用的液體是本領(lǐng)域公知的。運種介質(zhì)(包括導(dǎo)電液體介質(zhì))的描述和實例被提供于例如美 國專利號7,189,503中,通過引用全文并入本文。第一和第二液體介質(zhì)可W相同或不同,并 且它們之一或兩者可W包含鹽、去垢劑或緩沖劑中的一種或多種。事實上,本文描述的任何 液體介質(zhì)都可W包含鹽、去垢劑或緩沖劑中的一種或多種。另外,本文描述的任何液體介質(zhì) 可W包含改變粘度的物質(zhì)或改變速度的物質(zhì)。
[0088] 用作祀或一種分析的焦點的聚合物分析物能夠與納米孔相互作用,并(優(yōu)選W線 性方式)通過所述孔轉(zhuǎn)運到另一側(cè)。本文使用的術(shù)語"相互作思'或"正在相互作思'指的是 分析物移動進入至少納米孔的內(nèi)部,并且任選通過納米孔移動。本文使用的術(shù)語"通過納米 孔"或"轉(zhuǎn)運"用于表達所述聚合物分析物的至少某部分(即至少一個亞單位)進入納米孔的 一側(cè),并移動進入納米孔的另一側(cè),并從納米孔的另一側(cè)移出。在某些情況中,位于納米孔 兩側(cè)的第一和第二導(dǎo)電液體介質(zhì)被稱為位于順式區(qū)域和反式區(qū)域,其中待測量的聚合物分 析物通常通過納米孔從順式區(qū)域轉(zhuǎn)運到反式區(qū)域。然而,在某些實施方案中,待測量的聚合 物分析物可W通過納米孔從反式區(qū)域轉(zhuǎn)運到順式區(qū)域。在某些情況中,不是聚合物的整個 長度通過所述孔,而是聚合物的一部分或片段通過所述納米孔用于分析。
[0089] 可W使用多種機制使聚合物分析物轉(zhuǎn)運通過所述納米孔。例如,所述聚合物分析 物和/或參考序列可W電泳轉(zhuǎn)運通過所述納米孔。還可W在納米孔系統(tǒng)中并入結(jié)構(gòu)元素 ,W 跨承載納米孔的膜或薄膜施加電場。例如,該系統(tǒng)可W包括一對驅(qū)動電流通過所述納米孔 的驅(qū)動電極。另外,該系統(tǒng)可包括一種或多種測量電極,其測量通過所述納米孔的電流。運 些可W例如是膜片錯放大器或數(shù)據(jù)采集器。例如,納米孔系統(tǒng)可包括Axopatch-IB膜片錯放 大器(Axon Ins化uments,化ion City,CA),W跨雙層應(yīng)用電壓并測量流過所述納米孔的離 子電流。所述電場足W轉(zhuǎn)運聚合物分析物通過納米孔。正如將會理解的,可W使用的電壓范 圍可W取決于所使用的納米孔系統(tǒng)的類型。例如,在某些實施方案中,對于嵌于脂質(zhì)膜中的 基于蛋白質(zhì)的納米孔而言,所應(yīng)用的電場在大約20mV和大約260mV之間。在某些實施方案 中,所應(yīng)用的電場在大約40mV和大約200mV之間。在某些實施方案中,所應(yīng)用的電場在大約 lOOmV和大約200mV之間。在某些實施方案中,所應(yīng)用的電場為大約180mV。在使用固態(tài)納米 孔的其它實施方案中,所應(yīng)用的電場可W在上述類似的范圍,可W高達IV。
[0090] 另外或者備選地,納米孔系統(tǒng)可包括酶促轉(zhuǎn)運聚合物通過所述納米孔的成分。例 如,可W包括一種分子馬達W影響聚合物通過所述納米孔的轉(zhuǎn)運。分子馬達對于促進聚合 物進入納米孔和/或促進或調(diào)節(jié)聚合物通過納米孔的轉(zhuǎn)運是有用的。理想的是,該轉(zhuǎn)運速度 或平均轉(zhuǎn)運速度小于在沒有分子馬達的情況下會出現(xiàn)的轉(zhuǎn)運速度。在本文中的任何實施方 案中,所述分子馬達可W是酶,諸如聚合酶、外切核酸酶,或Klenow片段。在一個實例中,下 面將要詳細描述,可W使用諸如phi29的DNA聚合酶來促進在兩個方向上的移動。參見 Cherf ,G.M.,等人,"Automated forward and reverse ratcheting of DNA in a nanopore atsAprecision,"化t .Biotechnol. 30: ;344-;348(2012),和Manrao等人'書eading DNA at single-nucleotide resolution with a mutant MspA nanopore and phi29DNA polymerase, "Pfet .Biotechnol. 30: 349-353(2012),運兩篇文獻通過引用將其全文并入本 文。
[0091] 聚合物分析物的特征(諸如識別它們的一些或全部亞單位的特征)可W在納米孔 系統(tǒng)中確定,運可W基于聚合物分析物在納米孔中的駐留性來進行。將會容易理解的是,運 樣確定的聚合物分析物的特征可W用來推斷所述預(yù)分析物聚合物的特征。在某些實施方案 中,確定關(guān)于一種或多種聚合物亞單位在聚合物分析物中的信息。因此,如上所述,得自選 擇性修飾的分析物的離子電流可用來推斷在預(yù)分析物聚合物中那個位置的原始亞單位。在 某些實施方案中,一種或多種亞單位的存在可用來推斷在預(yù)分析物聚合物中多個未被修飾 亞單位的存在和模式,W提供"指紋圖譜"或初始亞單位序列。在其些實施方案中,確定在預(yù) 分析物聚合物中一種、兩種或更多種聚合物亞單位的序列身份。在某些實施方案中,確定預(yù) 分析物的一些或全部序列。
[0092] 可W基于當(dāng)與納米孔相互作用(諸如與納米孔的外緣、前廳或縮窄區(qū)相互作用) 時,聚合物分析物或其亞單位在可測量信號上的作用來確定聚合物分析物或其亞單位的特 征。為了示例,在某些實施方案中,確定或影響可測量信號的聚合物亞單位是駐留在"縮窄 區(qū)"(即,具有最窄直徑的孔內(nèi)部的=維區(qū)域)的亞單位。取決于縮窄區(qū)的長度,影響電解質(zhì) 通過從而影響電流輸出信號的聚合物亞單位的數(shù)量可W變化。由納米孔系統(tǒng)產(chǎn)生的輸出信 號是提供多個依賴于聚合物或聚合物亞單位的物理特征的可區(qū)別的和可再現(xiàn)的信號的任 何可測量信號。例如,通過所述孔的離子電流水平是可W依賴于駐留在所述納米孔縮窄區(qū) 的特定聚合物亞單位而變化的輸出信號。當(dāng)聚合物在重復(fù)步驟中轉(zhuǎn)運(例如一個接一個亞 單位線性通過所述孔)時,所述電流水平可W變化,W產(chǎn)生對應(yīng)于所述聚合物亞單位的連續(xù) 序列的多個輸出信號的蹤跡或"電流圖案"。運個對電流水平或者"阻塞"事件的檢測已被用 于表征眾多關(guān)于結(jié)構(gòu)聚合物(諸如DNA)在各種環(huán)境下通過或保持在納米孔中的信息。
[0093] 一般而言,通過明顯區(qū)別于背景噪音波動的離子電流變化證實了 "阻塞",運通常 與納米孔內(nèi)(諸如在縮窄區(qū)內(nèi))存在分析物分子(例如一種或多種聚合物亞單位)相關(guān)。阻塞 的強度,或者電流的變化將依賴于存在的聚合物亞單位的特征。因此,在某些實施方案中, "阻塞"被與參考電流相對來進行定義。在某些實施方案中,參考電流相當(dāng)于當(dāng)納米孔沒有 被阻塞時的電流水平(即在納米孔內(nèi)不存在分析物結(jié)構(gòu),或分析物結(jié)構(gòu)沒有與納米孔相互 作用)。在某些實施方案中,參考電流水平相當(dāng)于當(dāng)納米孔具有已知分析物(例如已知的分 析物聚合物亞單位)駐留于納米孔中時的電流水平。在某些實施方案中,電流水平自發(fā)地返 回到參考水平(如果納米孔回復(fù)到空的狀態(tài)或者變成又被已知分析物占據(jù)的情況)。在其他 實施方案中,所述電流水平達到反映聚合物分析物通過納米孔,并且特定的亞單位駐留在 納米孔變化的下一個重復(fù)轉(zhuǎn)運事件的水平。為了示例,相對于限定為未阻塞水平的參考電 流水平,當(dāng)電流水平低于參考電流水平大約1-100%參考電流水平時,建立所述阻塞。將會 理解,參考電流水平可W立即達到阻塞事件水平,或者備選,可W與阻塞事件分開一段介于 電流測量的時段。例如,當(dāng)聚合物分析物亞單位進入到納米孔中時,離子電流可w低于參考 電流水平到一個參考電流的大約、至少約或至多約1 % ,2% ,3% ,4% ,5% ,10% ,15%, 20% ,25% ,30% ,35% ,40% ,45% ,50% ,55% ,60% ,65% ,70% ,75% ,80% ,85% ,90% , 95%,或100%,或任何其中可衍生的范圍的闊值量。相對于通過存在已知分析物(例如已知 的聚合物亞單位)限定的參考電流水平,當(dāng)電流低于或高于參考水平大約1-100%參考電流 水平的量時建立所述阻塞。將會理解,參考電流水平可W立即達到阻塞事件水平,或者備 選,可W與阻塞事件分開一段介于電流測量的時段。例如,當(dāng)聚合物亞單位進入到所述納米 孔時,離子電流可W低于或高于參考電流水平到一個參考電流的大約闊值量、至少約或至 多約1 % ,2% ,3% ,4% ,5% ,10% ,15% ,20% ,25% ,30% ,35% ,40% ,45% ,50% ,55%, 60% ,65% ,70% ,75% ,80% ,85% ,90% ,95%,或100%或任何其中可衍生的范圍的闊值。 "深度阻塞"可W被識別為運樣一個間隔,其中離子電流低于(或高于)至少50%參考水平。 離子電流下降少于50%參考水平的間隔可W被識別為"部分阻塞"。在某些實施方案中,阻 塞中的電流水平保持在至少約1.化S的減少的(或升高的)水平。
[0094] 在某些實施方案中,將獲自聚合物分析物的納米孔分析的可測量信號與已知的信 號或獲自已知分析物的信號進行比較。術(shù)語"已知分析物"被用來指關(guān)于其特定特征(諸如 亞單位序列)的狀態(tài)是已知的分析物。在某些實施方案中,已知信號獲自在相同或相似分析 條件下的已知分析物。在某些實施方案中,可測量信號(諸如獲自未知聚合物分析物和參考 標(biāo)準(zhǔn)聚合物分析物的電流圖案的比較,可W允許可識別的"指紋圖譜"的識別,所述指紋圖 譜將聚合物分析物與其他潛在分析物區(qū)別開來。在某些實施方案中,可測量信號(諸如獲自 未知聚合物分析物和參考標(biāo)準(zhǔn)聚合物分析物的電流圖案的比較允許識別在分析物結(jié)構(gòu)域 中的一種或多種聚合物亞單位。將會理解,在運些實施方案中,未知聚合物分析物和參考聚 合物分析物中的對應(yīng)聚合物亞單位身份的電流水平不必匹配。相反,可W通過對應(yīng)亞單位 身份的有限選擇的電流水平中它們的相對電流水平來確定身份。
[0095] 盡管本公開內(nèi)容支持指代唯一選擇和"和/或"的定義,但是除非明確表明指的是 唯一選擇或選擇是彼此排斥的情況,否則在權(quán)利要求書中使用術(shù)語"或"用來表示"和/或"。
[0096] 除非特別指出其他情況,否則根據(jù)現(xiàn)有的專利法術(shù)語"一個(a)"和"一種(an)"當(dāng) 與術(shù)語"包括(含Kcomprising)"結(jié)合使用在權(quán)利要求或說明書中時,指的是一個或多個。
[0097] 除非本文中清楚要求例外情況,否則遍布說明書和權(quán)利要求書中的術(shù)語"包含 (comprise)"、"包括"等等指的是涵蓋含義,與專一的或窮舉含義相反;換句話說是"包括、 但不限于"的意思。使用單數(shù)或復(fù)數(shù)形式的術(shù)語也分別包括復(fù)數(shù)和單數(shù)。另外,當(dāng)術(shù)語"本 文"、"上文"和"下文"和類似術(shù)語用于本申請時,指的是作為整體的本申請而不是本申請的 特定部分。
[0098] 本文公開的是材料、組合物和成分,其可W用于本文公開的方法和組合物的產(chǎn)品、 可W與本文公開的方法和組合物的產(chǎn)品聯(lián)合、可W用于制備本文公開的方法和組合物的產(chǎn) 品或為本文公開的方法和組合物的產(chǎn)品。可W理解,當(dāng)公開運些材料的組合、子集、相互作 用、基團等時,可具體考慮各個單獨的和集合的聯(lián)合的每一個,即使沒有明確公開特別參考 運些化合物的每一個和每一個單獨組合和排列。運個概念應(yīng)用到本公開內(nèi)容的所有方面, 包括、但不限于本文所述的方法的步驟。因此,任何前述實施方案的特定元素可W被組合或 被在其他實施方案中的元素取代。例如,如果可W進行很多附加步驟,應(yīng)當(dāng)理解,運些附加 步驟的每一個可w對任何特定方法步驟或所公開方法步驟的組合進行,并具體考慮每個運 樣的組合或組合的子集并應(yīng)該認(rèn)為已經(jīng)被公開。另外,應(yīng)當(dāng)理解,本文所述的實施方案可W 使用任何適當(dāng)?shù)牟牧?諸如在本文別處描述的或現(xiàn)有技術(shù)已知的那些)進行實施。
[0099] 本文引用的出版物和其中引用的主題在此通過引用將其全文被具體并入本文。
[0100] W下是針對ssDNA多核巧酸分子(其中胞喀晚殘基已經(jīng)被轉(zhuǎn)換成尿喀晚殘基)所確 定的離子電流的比較的描述。該數(shù)據(jù)證實在聚合物分析物中的運樣的修飾可W用來提供信 號變化,W區(qū)分胞喀晚殘基W及互補鏈中的鳥嚷嶺殘基。由于可W在兩條鏈上進行所述分 析,因此,可W容易地識別任一鏈中胞喀晚和鳥嚷嶺殘基的位置。
[0101] 之前在Manrao等人的化Uire Biotechnol. 30(4): 349-353(2012)中描述了實驗設(shè) 置,將該文獻通過引用并入本文。簡而言之,PM29DNAP用做分子馬達,W控制DNA通過在無 支撐的憐脂雙層中建立的單MspA孔的運動。用做導(dǎo)電液體介質(zhì)的緩沖液是300mM的KC1,其 具有l(wèi)OmM的HEPES,緩沖到pH 8.00±0.05。在具有定制LabVIEW軟件(National Instruments,Austin,Texas)的Axopatch 200B放大器上記錄電流,偏壓為180mV。
[0102] 常規(guī)DNA寡核巧酸和包含尿喀晚核堿基替代胞喀晚核堿基的DNA寡核巧酸購自斯 坦福大學(xué)的Protein and Nucleic Acid(PAN)部口。還訂購了用于綴合到鏈上的引物和嵌 段寡聚物。參見表1.
[0103] 表1:寡核巧酸用于比較胞喀晚至尿喀晚取代的基于納米孔的分析
[0104]
[01化]在每次實驗之前,將DNA模板、引物和嵌段寡聚物:1:1.2的比例混合至最終濃 度為50μΜ。然后通過加熱到95°C 5分鐘、冷卻到60°C 2分鐘然后再冷卻到4°C使DNA退火。實 驗濃度:對于DNA為~500nM,對于地i 29DNAP為~500nM,并且對于dNTPs為~500μΜ,對于 MgCl2~為~lOmM,并且對于DTT為~1 ml。
[0106]在對鏈測序期間,將DNA通過所述孔兩次,一次是從5'到3'方向(解鏈模式),而另 一次為從3'到5'方向(合成模式)。在運個報告中,使用來自地i29DNAP運動的合成模式的數(shù) 據(jù)。參見 Manrao等人,化Uire Biotechnol. 30(4) :349-353(2012)。所有鏈包括具有序列5'- PAAAAAAACCTTCCX-3'(在本文中示為SEQ ID N0:1)、連接到5'端的接頭序列,其中P代表憐 酸化5'端,X是脫堿基殘基。該序列不經(jīng)受修飾,如下將要描述的,并創(chuàng)建可再現(xiàn)電流基序, 其發(fā)信號通知所述讀取結(jié)束。運個區(qū)域用于校準(zhǔn)電流,W便控制緩沖液導(dǎo)電性由于蒸發(fā)或 溫度變化導(dǎo)致的小的變化。祀序列接著運一校準(zhǔn)序列。
[0107] 圖1示出了聚合物分析物通過所述MspA納米孔產(chǎn)生的離子電流差異,其中胞喀晚 殘基被尿喀晚殘基取代。通過使寡核巧酸"甲基TGCC"(參見SEQ ID N0:5)和"mTGCC Ur (參 見SEQ ID N0:3)通過MspA納米孔特異性地產(chǎn)生了該離子電流。除了胞喀晚被尿喀晚取代之 外,mTGCC U1與甲基TGCC相同,而5-甲基胞喀晚r'5mC')和5-徑甲基胞喀晚r'5hmC')在運兩 個寡核巧酸之間保持一致。給DNA寡核巧酸排序,W模擬亞硫酸氨鹽處理對DNA的作用,其中 亞硫酸氨鹽處理導(dǎo)致胞喀晚轉(zhuǎn)換成尿喀晚。圖1示出了當(dāng)對齊到測量的離子電流中圖示的 差異時(序列W3'到5'方向顯示),"甲基TGCC'DNA(下面的序列,SEQ ID N0:9)和VTGCC υΓ〇ΝΑ(上面的序列,SEQ ID N0:8)序列的內(nèi)部片段的對齊。未處理的DNA和處理的DNA讀數(shù) 之間的比較得到鏈內(nèi)胞喀晚殘基的位置,運極大地簡化了用納米孔測序的任務(wù)。運里具體 指出的實例是,兩個相鄰的尿喀晚殘基比單獨的尿喀晚殘基會產(chǎn)生更大的偏差。因此,在尿 喀晚之后跟隨鳥嚷嶺會導(dǎo)致更大的離子電流偏差,運可W與針對反義鏈時一對尿喀晚相區(qū) 另IJ(考慮到鳥嚷嶺對應(yīng)于反義鏈中的胞喀晚,因此可W適于用該方法進行轉(zhuǎn)換)。此外,因為 在雙鏈DNA分子中胞喀晚殘基與鳥嚷嶺殘基配對,所W上面的分析一般可W用雙鏈DNA分子 的有義和反義鏈兩者進行,W獲得沿單鏈的每個C和G的位置。剩下的測序單鏈分子的步驟 被極大地簡化,并著力于剩余未知核巧酸的A和T之間的區(qū)別。對于MspA, A和T殘基很容易區(qū) 另IJ,因為A產(chǎn)生最高的電流,而T產(chǎn)生最低的離子流。
[0108] 因此,顯示DNA聚合物分析物中的胞喀晚殘基向尿喀晚殘基的轉(zhuǎn)換可W被用在基 于納米孔的測序中,W區(qū)別序列中的C殘基。因為可W對雙鏈DNA分子的有義和反義鏈進行 分析,C和G殘基兩者的位置都可W被明確確定。
[0109] 下面描述了亞硫酸氨鹽處理ssDNA預(yù)分析物聚合物W產(chǎn)生聚合物分析物,其中胞 喀晚殘基已經(jīng)被修飾或轉(zhuǎn)換成尿喀晚殘基。之后的修飾的聚合物分析物和初始的預(yù)分析物 聚合物(作為參考)兩者的納米孔分析肯定了運一策略,即運樣的化學(xué)修飾可W促進預(yù)分析 物聚合物序列中胞喀晚殘基的明確的區(qū)別。
[0"0] 亞硫酸氨鹽處理^改進納米孔測序
[0111] 用納米孔MspA + phi29 DNAP測序系統(tǒng)(如上在Manrao等人的Nature Biotechnol. 30(4):349-353(2012)的文章中所述),分析具有序列 AAAAAAACCTTCCXACACCGATTCTCCCGAGTCGGCCGAATCrM護)(在本文中示為沈Q ID N0:6)的合 成DNA構(gòu)建體。運個DNA構(gòu)建體也經(jīng)受亞硫酸氨鹽轉(zhuǎn)換處理(Zymo Research,Irvine,CA)。也 用Μ S P A納米孔測序系統(tǒng)對得到的D N A進行測量,所述D N A包含序列 AAAAAAAUUTTUUXAUAUUGATTUTUUUGAGTUGGUUGAATlK "bM護)(在本文中示為沈Q ID NO: 7,并 于圖3中W3'到5'方向顯示),其所有的胞喀晚殘基都被轉(zhuǎn)換成尿喀晚殘基。
[0112] ^
[0113] 示于圖2的M6和bM6寡核巧酸序列相關(guān)的離子電流水平圖案接受如下文獻中所用 的類似數(shù)據(jù)分析工具分析,Manrao等人,Nature Biotechnol. 30(4): 349-353(2012)和 Lasz 1〇 , A . Η .,等人,"Detect ion and mapping of 5-methyl cytosine and 5- hydroxymethy1cytosine with nanopore MspA,"Proc.Natl.Acad.Sci.USA 110:18904- 18909(2013)。該離子電流水平圖案在很多位置顯著不同。
[0114] 觀察到亞硫酸氨鹽處理的DNA寡核巧酸含有很多離子電流水平,它們一致性地是 較低水平的離子電流(參見圖2)。單個胞喀晚向尿喀晚的轉(zhuǎn)換大致影響了靠近被轉(zhuǎn)換的核 巧酸位點的四個離子電流水平。多個相鄰胞喀晚向尿喀晚的轉(zhuǎn)換作用附加地疊加。預(yù)期該 環(huán)境(即在胞喀晚向尿喀晚轉(zhuǎn)換的附近的核巧酸的身份)影響了信號的強度??拷搲A基位 點(X)的尿喀晚殘基沒有顯示明顯的離子電流變化,可能是由于脫堿基位點減弱了對胞喀 晚向尿喀晚轉(zhuǎn)換附近的離子電流的沖擊??拷搲A基位點的離子電流圖案一般非常不同于 離開X的幾個核巧酸的離子電流。運些結(jié)果與上面描述的從初步比較結(jié)果獲得的發(fā)現(xiàn)相一 致。此外,尿喀晚殘基具有與胸腺喀晚類似的化學(xué)結(jié)構(gòu),胸腺喀晚是與明顯較低的離子電流 (在20pA量級)相關(guān)的堿基。未修飾的DNA與亞硫酸氨鹽處理過的DNA的電流之間的差異顯露 了亞硫酸氨鹽處理修飾的堿基的位置,并因此,顯露了初始M6構(gòu)建體內(nèi)胞喀晚殘基的位置。 考慮到運一點,運樣的技術(shù)是非常有優(yōu)勢的,在沒有修飾的情況下,胞喀晚和鳥嚷嶺的電流 常常非常相似,使得不同的殘基幾乎不可區(qū)別。一旦胞喀晚殘基被轉(zhuǎn)換成尿喀晚殘基,所觀 察到與未轉(zhuǎn)換分析物的電流水平之間的差異可W與原始序列中胞喀晚殘基的位置相關(guān)(參 見圖2)。
[0115] 下面是關(guān)于選擇性轉(zhuǎn)換祀核酸殘基成為脫堿基位置W促進在基于納米孔的系統(tǒng) 中聚合物的測序的描述。
[0116] 上文證實了在ssDNA聚合物中胞喀晚殘基轉(zhuǎn)換成尿喀晚殘基促進了胞喀晚和鳥嚷 嶺殘基的辨別,最終有助于ssDNA聚合物的序列中所有運樣的殘基的作圖。另外的策略是選 擇性創(chuàng)建脫堿基殘基,替代特定的祀聚合物亞單位。該策略可W具有的優(yōu)勢是,使用大多數(shù) 納米孔系統(tǒng)產(chǎn)生更大的信號變化。當(dāng)脫堿基位置創(chuàng)建不與聚合物中任何潛在亞單位類型重 疊的新的、獨特的信號時,可W無需將信號與參考相比就可推斷出脫堿基單位(和原始祀亞 單位)的位置。對于核酸聚合物來說,內(nèi)在的方法是用被修飾的堿基重新編碼祀亞單位堿基 類型(例如胞喀晚或鳥嚷嶺),所述被修飾的堿基可W被DNA修復(fù)酶識別,其將切除被修飾的 堿基,留下脫堿基位點。W運種方式,原始堿基被轉(zhuǎn)換成脫堿基位點,運將在納米孔系統(tǒng)中 提供獨特的信號。然而注意到,如果修飾本身提供了獨特的信號,諸如上文所述的胞喀晚到 尿喀晚的修飾,則在納米孔系統(tǒng)分析之前不需要進一步的修飾。然而,如果信號變化不大, 或與對應(yīng)于任何其他亞單位的信號有一定程度的重疊,則可能需要與參考信號的比較,W 確認(rèn)被修飾的堿基的位置。
[0117] DNA糖基化酶是修復(fù)酶的主要家族,它可W被開發(fā)用于被修飾的核酸堿基向脫堿 基位點的最終轉(zhuǎn)換。下文給出可W作用于不同堿基類型和修飾的DNA糖基化酶的特別實例。 女日在Parikh , S . S .,等人的"Base excision repair enzyme family portrait: integrating the structure and chemistry of an entire DNA repair pathway," StrucUire 5(12): 1543-1550(1997)中所述,DNA糖基化酶落入兩類:"純"糖基化酶和AP(無 嚷嶺的/無喀晚的)裂解酶/糖基化酶。純糖基化酶在DNA中留下脫堿基位點,而AP裂解酶/糖 基化酶留下帶有切口的AP位點,運將引起DNA單鏈斷裂。對于該方法的很多應(yīng)用,優(yōu)選使用 純的糖基化酶。如所熟知的,在糖基化酶中會有很大的重疊,因為單一酶可識別和去除很多 類型的被修飾的堿基。
[0118] 在第一個策略中,亞硫酸氨鹽可被用來轉(zhuǎn)換胞喀晚殘基成為尿喀晚殘基。如上所 述。該處理之后可W接著用諸如UDG的錯誤矯正酶處理,該酶是純的糖基化酶。運導(dǎo)致目前 存在于核酸中的尿喀晚殘基轉(zhuǎn)換成脫堿基位點。參見化ri化等人的"Base excision repair enzyme family portr曰it: integrating the structure 曰nd chemistry of 曰n entire DNA repair pa1:hwayZ'St;ruc1:ure 5( 12) :1543-1550( 1997),通過引用其全文將其 并入本文。
[0119] 在第二個策略中,核酸聚合物中的胞喀晚殘基可W用修飾的胞喀晚(諸如5-甲基 胞喀晚)取代。運可W通過使用聚合酶與適當(dāng)?shù)膁NTP混合物(其具有用被修飾的版本,諸如 5-甲基一dCTP替代的dC)通過進行PCR或引物延伸反應(yīng)來完成??蒞將所得DNA模板暴露于 DNA校正酶(諸如5-甲基胞喀晚DNA糖基化酶)W去除5-甲基胞喀晚堿基。參見例如化ooks, S . C .等人的"5-methylcytosine recognition by Arabidopsis thaliana DNA glycosylases DEMETER and DML3,"Biochemis化y 53( 15) :2525-2532(2014)和化ng,H.等 人的"Excision of 5-hydroxymethyl cytosine by DEMETER family DNA glycosylases," Biochem Bio地ys Res Commun.446(4): 1067-1072(2014)。每篇文獻通過引用其全文并入 本文。運些文獻描述了識別5-甲基胞喀晚并將其切除W形成脫堿基位點的相關(guān)DNA糖基化 酶 DME、R0S 巧陽 ML。
[0120] 在第Ξ個策略中,可W用被修飾的鳥嚷嶺(諸如7-甲基鳥嚷嶺)替代核酸聚合物中 的鳥嚷嶺殘基。運可W使用聚合酶與適當(dāng)dNTP混合物通過進行PCR或引物延伸反應(yīng)來完成, 所述dNTP混合物具有用7-甲基一dGTP取代的dG??蒞將所得DNA模板暴露于DNA校正酶(諸 如大腸桿菌a化A)W除7-甲基鳥嚷嶺堿基除。參見例如化ri化,S.S.等人的"Base excision repair enzyme family portr曰it: integrating the structure 曰nd chemistry of 曰n entire DNA repair pa1:hwayZ'St;ruc1:ure 5( 12) :1543-1550( 1997),通過引用將其全文并 入本文,其描述了 AlkA去除7-甲基鳥嚷嶺和幾種其它包括3-甲基腺嚷嶺的異常甲基化堿 基。
[0121] 在第四個策略中,可W用諸如3-甲基鳥嚷嶺的被修飾的鳥嚷嶺替代核酸聚合物中 鳥嚷嶺殘基。運可W使用聚合酶與適當(dāng)dNTP混合物通過進行PCR或引物延伸反應(yīng)來完成,所 述dNTP混合物具有用3-甲基-dGTP取代的dG??蒞將所得DNA模板暴露于DNA校正酶,諸如 alkA(來自大腸桿菌)aag(也稱作"3-甲基腺嚷嶺DNA糖基化酶Γ',來自大腸桿菌)、MAG(來 自釀酒酵母)、MPG(來自小鼠或人類)。參見例如B jelland , S .等人的"Excision of 3- methylguanine from alkylated DNA by 3-methyladenine DNA glycosylase I of Escherichia coli, "Nucleic Acids Res.21(9):2045-2049(1993),通過引用將其全文并 入本文。Bjelland,S.等人描述了大腸桿菌alkA將有效地移除3-甲基鳥嚷嶺。比較來說較弱 一點的程度,大腸桿菌"tag"酶也將去除3-甲基鳥嚷嶺。almA和化g都可W有效地除3-甲基 腺嚷嶺,其可W用于納米孔,產(chǎn)生核酸信號,其中腺嚷嶺信號與胸腺喀晚、鳥嚷嶺或胞喀晚 信號的任一種重疊。還可參見等人的"Purification and properties of the alkylation repair DNA glycosylase encoded the MAG gene from Saccharomyces cerevisiae,"Biochemistir 34( 14): 4577-4582( 1995),通過引用將其全文并入本文 D 等人描述了釀酒酵母的MG基因編碼烷基化修復(fù)DNA糖基化酶,其序列與來自大 腸桿菌的alkA DNA糖基化酶同源。MAG在去除3-甲基腺嚷嶺、7-甲基鳥嚷嶺和7-甲基腺嚷嶺 方面與alkA-樣有效。與alkA相比,3-甲基鳥嚷嶺被MAG切除的速度慢至1/20-1/40。發(fā)現(xiàn)3- 甲基鳥嚷嶺被MAG切除的動力學(xué)類似于被大腸桿菌的3-甲基腺嚷嶺DNA糖基化酶I(tag)催 化的3-甲基鳥嚷嶺切除的低速率。還可參見Roy,R.等人的"Distinct substrate preference of human and mouse N-methylpurine-DNA glycosylases,"Carcinogenesis 17(10) :2177-2182(1996),通過引用將其全文并入本文。Roy, R.等人公開了與人類蛋白質(zhì) 相比,當(dāng)調(diào)整到用于從DNA釋放3-甲基腺嚷嶺的相等活性時,小鼠 MPGW~2-3倍高的速率去 除7-甲基鳥嚷嶺和3-甲基鳥嚷嶺。
[0122] 因此,各種已知的核酸錯誤檢測酶可用于轉(zhuǎn)換被修飾的核酸單體亞單位成為脫堿 基殘基??蒞通過在核酸序列中實施合理的修飾,W創(chuàng)建用于錯誤檢測酶的祀,來將運種活 性杠桿作用到本發(fā)明的方法。該修飾不需要祀核酸單體亞單位的位置(或甚至初始存在)的 先驗信息。所述策略獲得對應(yīng)于任何祀核酸單體亞單位位點的脫堿基位點,因此將很容易 在納米孔系統(tǒng)中產(chǎn)生可識別信號,運可用來很容易地并且毫無疑義地鑒別在初始核酸序列 中初始祀核酸單體亞單位的位置。
[0123] 盡管上面已經(jīng)對一些示例性實施方案進行了說明和示范,但應(yīng)當(dāng)理解,可W在不 脫離本發(fā)明精神和范圍的情況下對其進行各種改變。
【主權(quán)項】
1. 用于分析聚合物分析物的方法,包括: (a) 使包含被修飾亞單位的聚合物分析物從第一導(dǎo)電液體介質(zhì)通過納米孔轉(zhuǎn)運到第二 導(dǎo)電液體介質(zhì),其中所述納米孔提供第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體介質(zhì)之間的液體連 通; (b) 測量所述聚合物分析物通過所述納米孔時所述第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體 介質(zhì)之間的離子電流;和 (c) 基于所測量的離子電流檢測被修飾亞單位。2. 權(quán)利要求1所述的方法,進一步包括在步驟(a)之前選擇性修飾預(yù)分析物聚合物中一 個種類的靶聚合物亞單位,從而產(chǎn)生包含被修飾亞單位的聚合物分析物。3. 權(quán)利要求2的方法,其中修飾一個種類的靶聚合物亞單位包括使預(yù)分析物聚合物與 藥劑接觸,其中所述藥劑能夠選擇性修飾預(yù)分析物聚合物中一個種類的革El聚合物亞單位。4. 權(quán)利要求2的方法,其中所述預(yù)分析物聚合物包含核酸、PNA、多肽或其組合。5. 權(quán)利要求4的方法,其中所述核酸是DNA或RNA。6. 權(quán)利要求5的方法,其中所述靶聚合物亞單位的種類是胞嘧啶殘基、鳥嘌呤殘基、胸 腺嘧啶殘基、腺嘌呤殘基或尿嘧啶殘基。7. 權(quán)利要求6的方法,其中選擇性修飾胞嘧啶殘基包括選擇性將所述胞嘧啶殘基轉(zhuǎn)換 成尿嘧啶殘基。8. 權(quán)利要求7的方法,其中將所述胞嘧啶殘基轉(zhuǎn)換成尿嘧啶殘基包括使預(yù)分析物聚合 物與選自亞硫酸氫鹽、胞嘧啶脫氨基酶、no、n 2〇3和棘霉素的藥劑接觸。9. 權(quán)利要求7的方法,其中選擇性修飾所述胞啼啶殘基進一步包括將所述尿啼啶殘基 轉(zhuǎn)換成脫堿基位點,從而產(chǎn)生所述聚合物分析物。10. 權(quán)利要求9的方法,其中將所述尿嘧啶殘基轉(zhuǎn)換成脫堿基位點包括使預(yù)分析物聚合 物與核酸錯誤校正酶接觸。11. 權(quán)利要求10的方法,其中所述核酸錯誤校正酶是尿嘧啶去糖基化酶(UNG)。12. 權(quán)利要求6的方法,其中選擇性修飾所述胞嘧啶殘基包括選擇性甲基化所述胞嘧啶 殘基。13. 權(quán)利要求12的方法,其中選擇性甲基化所述胞嘧啶殘基包括使預(yù)分析物聚合物與 甲基轉(zhuǎn)移酶接觸,或使用聚合酶將甲基一胞嘧啶類似物摻入預(yù)分析物聚合物序列,以替代 胞嘧啶殘基。14. 權(quán)利要求12的方法,其中選擇性修飾所述胞嘧啶殘基進一步包括將甲基化胞嘧啶 殘基轉(zhuǎn)換成脫堿基位點,從而產(chǎn)生所述聚合物分析物。15. 權(quán)利要求14的方法,其中將所述甲基化胞嘧啶殘基轉(zhuǎn)換成脫堿基位點包括使預(yù)分 析物聚合物與核酸錯誤校正酶接觸。16. 權(quán)利要求16的方法,其中選擇性修飾鳥嘌呤殘基包括選擇性甲基化所述鳥嘌呤殘 基。17. 權(quán)利要求16的方法,其中選擇性甲基化所述鳥嘌呤殘基包括使用聚合酶將甲基化 鳥嘌呤類似物摻入所述預(yù)分析物聚合物序列,以替代鳥嘌呤殘基,或使預(yù)分析物聚合物與 甲基轉(zhuǎn)移酶接觸。18. 權(quán)利要求16的方法,其中選擇性修飾所述鳥嘌呤殘基進一步包括將所述甲基化鳥 嘌呤殘基轉(zhuǎn)換成脫堿基位點,從而產(chǎn)生所述聚合物分析物。19. 權(quán)利要求18的方法,其中將所述甲基化鳥嘌呤轉(zhuǎn)換成脫堿基位點包括使預(yù)分析物 聚合物與核酸錯誤校正酶接觸。20. 權(quán)利要求2的方法,其中所述步驟(c)包括: (i) 將所測量的離子電流與對應(yīng)于包含沒有修飾的亞單位的參考聚合物的離子電流進 行比較;和 (ii) 檢測在步驟(i)中比較的離子電流中差異的有無,其中離子電流中差異的有無分 別表明在聚合物分析物中亞單位修飾的有無。21. 權(quán)利要求20的方法,其中所述參考聚合物包含與預(yù)分析物聚合物相同的序列。22. 權(quán)利要求21的方法,其中所述參考聚合物由與預(yù)分析物聚合物相同的序列組成。23. 權(quán)利要求20的方法,進一步包括將參考聚合物從第一導(dǎo)電液體介質(zhì)通過納米孔轉(zhuǎn) 運到第二導(dǎo)電液體介質(zhì),并測量離子電流,以提供對應(yīng)于所述參考聚合物的離子電流。24. 權(quán)利要求2或20的方法,進一步包括基于所測量的離子電流的特征確定所述聚合物 分析物中被修飾亞單位的位置。25. 權(quán)利要求24的方法,包括確定在預(yù)分析物聚合物序列中對應(yīng)于所述聚合物分析物 中被修飾亞單位的位置的位置處的靶聚合物亞單位的身份。26. 權(quán)利要求2的方法,進一步包括: 對包含共同序列的多個預(yù)分析物聚合物執(zhí)行選擇性修飾靶聚合物亞單位的步驟和步 驟(a)和(b); 產(chǎn)生步驟(b)中所測量的多個離子電流的一致性圖譜;以及 檢測在共同序列中多個被修飾亞單位的存在。27. 權(quán)利要求20的方法,進一步包括: 對包含共同序列的多個預(yù)分析物聚合物執(zhí)行選擇性修飾靶聚合物亞單位的步驟和步 驟(a)和(b); 產(chǎn)生步驟(b)中所測量的多個離子電流的一致性圖譜; 將該一致性圖譜與對應(yīng)于包含沒有修飾的亞單位的參考聚合物的離子電流進行比較; 以及 檢測所述一致性圖譜和對應(yīng)于參考聚合物的離子電流之間多個差異的存在,其中多個 差異的存在與否表明在共同序列中存在多個被修飾亞單位。28. 權(quán)利要求1的方法,其中所述納米孔是固態(tài)納米孔、蛋白質(zhì)納米孔、雜合固態(tài)-蛋白 質(zhì)納米孔、生物調(diào)適的固態(tài)納米孔或DNA折紙納米孔。29. 權(quán)利要求2 8的方法,其中所述蛋白質(zhì)納米孔是α -溶血素、恥垢分枝桿菌 (Mycobacterium smegmatis)孔蛋白A(MspA)或其同系物。30. 權(quán)利要求28的方法,其中修飾所述蛋白質(zhì)納米孔序列或雜合固態(tài)一蛋白質(zhì)納米孔 序列以含有至少一個氨基酸取代、缺失或添加。31. 權(quán)利要求30的方法,其中所述至少一個氨基酸取代、缺失或添加導(dǎo)致在納米孔中的 凈電荷變化。32. 權(quán)利要求1的方法,其中使聚合物分析物通過所述納米孔轉(zhuǎn)運包括施加電勢到所述 第一導(dǎo)電液體介質(zhì)或第二導(dǎo)電液體介質(zhì)。33. 權(quán)利要求32的方法,其中所述電勢在大約40mV到IV之間。34. 權(quán)利要求1的方法,其中所述納米孔與分子馬達相關(guān),其中所述分子馬達能夠以平 均轉(zhuǎn)運速度移動分析物進入或通過所述納米孔,其中所述平均轉(zhuǎn)運速度小于在沒有所述分 子馬達的情況下所述分析物電泳轉(zhuǎn)運進入或通過納米孔時的平均轉(zhuǎn)運速率。35. 用于分析核酸分析物的方法,包括: (a) 將被修飾的核堿基摻入所述核酸分析物; (b) 將核酸分析物與能夠去除被修飾的核堿基以在核酸分析物中提供脫堿基位點的錯 誤校正酶接觸; (c) 將所述核酸分析物從第一導(dǎo)電液體介質(zhì)通過納米孔轉(zhuǎn)運到第二導(dǎo)電液體介質(zhì),其 中所述納米孔提供所述第一導(dǎo)電液體介質(zhì)和第二導(dǎo)電液體介質(zhì)之間的液體連通; (d) 當(dāng)所述核酸分析物通過所述納米孔時,測量所述第一導(dǎo)電液體介質(zhì)和所述第二導(dǎo) 電液體介質(zhì)之間的離子電流;以及 (e) 基于所測量的離子電流檢測所述脫堿基位點。
【文檔編號】B01D57/02GK105992634SQ201480047714
【公開日】2016年10月5日
【申請日】2014年9月2日
【發(fā)明人】J·H·貢德拉赫, A·拉斯茲羅, I·德爾林頓, J·G·曼德爾
【申請人】華盛頓大學(xué)商業(yè)中心, 伊路明納股份有限公司