專利名稱:分子冗余測(cè)序法的制作方法
分子冗余測(cè)序法相關(guān)申請(qǐng)的交叉參考本申請(qǐng)要求2007年7月26日提交的臨時(shí)專利申請(qǐng)60/962,036作為優(yōu)先權(quán),出于 所有目的,該申請(qǐng)的全部公開內(nèi)容以引用的方式納入本文。聯(lián)邦資助研究聲明不適用。
背景技術(shù):
遺傳分析是生物學(xué)研究中的關(guān)鍵手段,且很快就成為藥物學(xué)甚至醫(yī)學(xué)診斷領(lǐng)域中 不可或缺的手段。已使用各種新舊技術(shù)實(shí)施這類遺傳分析,尤其是用于遺傳物質(zhì)的較大片 段的核苷酸序列分析的鑒定。但是,總的來說,原始的遺傳序列數(shù)據(jù)在總分析中一樣重要,就好比寫的小說中使 用的字母串一樣。雖然字母的順序是重要的,但是是字詞、句子、段落和章節(jié)中的內(nèi)容傳遞 最有用的信息。類似地,雖然純粹的核苷酸序列信息對(duì)于遺傳分析而言是非常重要的,但是 密碼子、基因、基因簇、染色體和全基因組中的序列信息傳遞更多數(shù)量的信息。除了序列前后關(guān)系(context)外,大多數(shù)的常規(guī)測(cè)序技術(shù)基于成群核酸的分析, 因此,這些技術(shù)從核酸混合物的大量分析中獲得共有序列。雖然這種方法能有效獲得全部 的共有序列,但是它忽略了分子間的差異,而這些差異對(duì)于各種不同應(yīng)用可能尤為重要。相 反,單分子測(cè)序方法則可能出現(xiàn)大量共有序列方法(bulkconsensus method)中不明顯的不 準(zhǔn)確性。本發(fā)明總的涉及提供單個(gè)核酸分子上的冗余序列信息的方法和系統(tǒng), 所述方法和系統(tǒng)可用于提高精確測(cè)定以及在測(cè)序方法中確定序列前后關(guān)系信息 (contextinformation)。下文將更詳細(xì)地描述本發(fā)明的這些和其它方面。
發(fā)明內(nèi)容
本發(fā)明總的涉及用于重復(fù)分析單個(gè)核酸分子的方法和系統(tǒng),以提供這些單個(gè)分子 的高度準(zhǔn)確的序列信息。具體而言,本發(fā)明提供改進(jìn)的方法、系統(tǒng)和組合物,它們可用于實(shí) 施單種聚合物尤其是核酸聚合物的冗余序列分析。第一方面,本發(fā)明提供鑒別靶核酸的確定序列的序列前后關(guān)系的方法。該方法包 括提供靶核酸序列中選定位置的已知登記序列(registration sequence),測(cè)定包括該登 記序列在內(nèi)的所述靶核酸的至少一部分序列,和由該序列的該部分中的該登記序列的相對(duì) 位置鑒別在該測(cè)定步驟中測(cè)定的靶核酸的該部分序列的序列前后關(guān)系。另一方面,本發(fā)明提供了給完整的靶核酸測(cè)序的方法,該方法包括提供靶核酸序 列內(nèi)的已知登記序列。將該靶核酸環(huán)化(circularize),使用不破壞該靶核酸序列的測(cè)序方 法對(duì)該靶核酸測(cè)序,直到該登記序列至少已被測(cè)序兩次。又一方面,本發(fā)明提供了測(cè)定核酸序列的方法,該方法包括提供模板核酸,該模板 核酸的一部分具有至少第一核苷酸序列和相對(duì)于該第一核苷酸序列處于選定位置的登記 序列。該第一核苷酸序列和登記序列被測(cè)序多次,至少部分基于測(cè)序步驟所鑒別的該登記序列比對(duì)測(cè)序步驟所得的序列信息。然后從比對(duì)步驟中確定共有序列,從而確定該第一核 苷酸序列的核酸序列。在相關(guān)方面,本發(fā)明提供用于實(shí)施前述方法的組合物。這些組合物通常含有核酸 合成復(fù)合物,該復(fù)合物含有含至少第一外源登記序列的第一模板核酸序列、核酸聚合酶、和 與該第一模板核酸序列的至少一部分互補(bǔ)的引物序列。該模板核酸序列針對(duì)該核酸聚合酶 設(shè)計(jì),用于在模板核酸序列的相同核苷酸序列上實(shí)施多次引物延伸反應(yīng)。該組合物通常還 包含多種類型的核苷酸或核苷酸類似物。
圖1示意性闡述本發(fā)明方法中在使用測(cè)序方法獲得的序列信息輸出的比對(duì)中使 用登記序列。圖2示意性闡述本發(fā)明用于環(huán)形模板序列獲得的序列信息的方法。圖3示意性闡述本發(fā)明方法中共有序列的測(cè)定。圖4示意性闡述使用登記序列的另外一種序列前后關(guān)系確定方法。發(fā)明詳述I.總論本發(fā)明總的涉及通過單個(gè)核酸分子的冗余測(cè)序來測(cè)定靶核酸序列信息的改進(jìn) 方法。通過重復(fù)測(cè)定相同靶序列或其部分的序列,人們可極大地提高對(duì)得自該方法的 序列信息的置信水平。在單分子測(cè)序方法中使用冗余序列分析在出版的美國(guó)專利申請(qǐng) 2006-0063264中有描述,出于所有目的,本文將其全文以引用的方式納入。雖然本文所述的冗余測(cè)序方法將會(huì)在各種測(cè)序方法中有廣泛的應(yīng)用,但是,應(yīng)理 解,在特別優(yōu)選的方面,這些方法用于單分子測(cè)序方法。美國(guó)專利7,033,764,7, 052,847、 7,056,661和7,056,676描述了單分子(測(cè)序)方法的例子,出于所有目的,本文將這些申 請(qǐng)的全文以引用的方式納入。簡(jiǎn)言之,提供靶核酸或模板核酸并對(duì)其進(jìn)行設(shè)計(jì),這樣,單分子模板依賴性測(cè)序反 應(yīng)將可在該序列中的相同核苷酸序列上進(jìn)行多次。模板內(nèi)相同的核苷酸序列的重復(fù)測(cè)序通 過提供相同堿基序列的冗余序列分析而提高該方法獲得的序列信息的置信水平。舉例而 言,當(dāng)給定測(cè)序方法中存在潛在的序列鑒定或測(cè)定相關(guān)的誤差水平時(shí),對(duì)給定序列的單次 測(cè)序?qū)⒕哂性摑撛诘腻e(cuò)誤,這是對(duì)所測(cè)得的序列的置信水平的限制。換言之,如果測(cè)序方法 具有10%的誤差比例,則人們?cè)跍y(cè)定該序列的任何堿基時(shí)將僅可獲得90%的置信水平。但 是,通過重復(fù)測(cè)定相同序列的序列,比較每一次測(cè)序的序列信息,人們可系統(tǒng)性地減少該誤 差水平。因此,對(duì)于每一次測(cè)序,與多次測(cè)序所得的堿基的鑒定相關(guān)的誤差比例將極大下 降。除了降低任何測(cè)序方法中固有的不準(zhǔn)確性外,單核酸分子的冗余測(cè)序在鑒別低拷 貝數(shù)量環(huán)境中的遺傳變異(如尋找分子間的變異)也有非常高的價(jià)值,所述變異可能無法 從較大的核酸樣品中鑒定。例如,某些遺傳異??赡艽嬖谟诮o定樣品的相對(duì)小的細(xì)胞亞組 內(nèi),或者可能僅僅是單個(gè)細(xì)胞內(nèi)的小亞組的遺傳物質(zhì)。在這些情況下,基于廣泛選擇遺傳物 質(zhì)的采樣可能遺漏掉變異材料和正常材料之間的任何不同。根據(jù)本申請(qǐng)公開的內(nèi)容將理解,本發(fā)明的方法可依賴于各種實(shí)施形態(tài)(configuration),以實(shí)現(xiàn)本文所述的冗余序列測(cè)定。這些實(shí)施形態(tài)包括單模板分子內(nèi)給定 序列的多個(gè)拷貝的測(cè)序、通過單分子復(fù)合物實(shí)施的給定模板序列內(nèi)相同核苷酸組的冗余測(cè) 序、和使用多種不同的分子復(fù)合物實(shí)施的一條或多條相同序列的測(cè)序,以及這些測(cè)序的任
思組合。除了核苷酸序列的冗余測(cè)序方法外,本發(fā)明還提供一些有助于這些冗余測(cè)序方法 的改進(jìn),以及評(píng)估和處理從這些和其它相關(guān)方法獲得的冗余序列信息的方法。除了上文所述,本發(fā)明的一個(gè)目的是提供本文所述的組合物,例如包括核酸合成 組合物,該組合物包括含有登記序列的本發(fā)明模板序列、核酸聚合酶、引物序列、以及多種 類型的核苷酸和/或核苷酸類似物,所述核苷酸和/或核苷酸類似物用于實(shí)施引物延伸,優(yōu) 選的用于核酸測(cè)序操作,如使用可檢測(cè)的類似物如熒光標(biāo)記的核苷酸或核苷酸類似物。同 樣地,本發(fā)明也包括使用這些組合物和實(shí)施這些方法的系統(tǒng)。II.冗余序列如前文所述,本發(fā)明提供對(duì)模板序列分子內(nèi)給定的核苷酸序列實(shí)施多次冗余測(cè) 序。根據(jù)本發(fā)明,對(duì)模板分子內(nèi)的給定序列的這種冗余測(cè)序可使用各種不同實(shí)施方式。例 如,在至少一個(gè)方面,待冗余測(cè)序的核苷酸的序列存在于環(huán)形模板分子內(nèi),測(cè)序方法圍繞 著該環(huán)形模板重復(fù)實(shí)施。應(yīng)理解,當(dāng)使用環(huán)形模板時(shí),圍繞該環(huán)的第一次周轉(zhuǎn)之后新生 鏈的移走將允許連續(xù)的或重復(fù)的測(cè)序。在其最簡(jiǎn)單的實(shí)施方式中,通過在測(cè)序過程中使 用取代聚合酶(displacing polymerase enzyme)而實(shí)現(xiàn)上述“移走”。已描述了各種鏈 取代聚合酶,這些酶尤其可用于結(jié)合入測(cè)序中(見,例如國(guó)際專利申請(qǐng)W0 2007/075987、 W02007/075873、W02007/076057,和它們的美國(guó)同族申請(qǐng),出于所有目的,本文將這些文獻(xiàn) 的全文以引用的方式納入)。簡(jiǎn)言之,在圍繞著環(huán)形模板完成單次周轉(zhuǎn)后,聚合酶將移走新 合成的新生鏈,以繼續(xù)圍繞該模板進(jìn)行合成。雖然在涉及環(huán)形模板時(shí)使用鏈取代聚合酶是本發(fā)明的特別優(yōu)選的實(shí)施方式,但是 也可使用大量的其它方法來移走新生鏈。例如,可使用特定的核酸外切酶來消化開口的新 生鏈,以從基礎(chǔ)模板除去該新生鏈,從而使該合成方法得以繼續(xù)進(jìn)行。在任何一種情況中, 當(dāng)需要對(duì)特定分子中的相同核苷酸組重復(fù)測(cè)序時(shí),應(yīng)理解用于測(cè)序的方法對(duì)于該模板核酸 序列是沒有破壞性的。舉例而言,在這些方面,消化性的測(cè)序方法不是優(yōu)選的。類似的,需 要重復(fù)洗滌步驟以使摻入的和/或標(biāo)記的核苷酸或終止子核苷酸去保護(hù)和/或去標(biāo)記的測(cè) 序方法往往在少數(shù)輪次后降解該模板鏈,因而不包括在本發(fā)明的使用不破壞序列的工藝的 方法中。在其它方面,可通過在單模板鏈內(nèi)提供多個(gè)拷貝的靶序列而對(duì)相同序列的核苷酸 或靶序列測(cè)序。如上所述,模板可以是環(huán)形的,以提供額外層的冗余度,或者模板可含有線 性模板。在使用具有多拷貝的核苷酸序列的線性模板中,應(yīng)理解可對(duì)相同的核苷酸序列測(cè) 序而不需要將鏈移走或除去,因?yàn)樵谠撃0迳系膯未瓮ㄟ^將提供這樣的冗余序列讀數(shù)。相 應(yīng)地,可從單一來源的模板或靶序列(例如,通過滾環(huán)過程(rolling circle process)環(huán) 化和復(fù)制)制備線性模板,以提供這些靶序列的重復(fù)模式。在另一方面,通過在給定引導(dǎo)位點(diǎn)重新啟動(dòng)模板的引導(dǎo),然后重復(fù)測(cè)定該模板相 同部分的序列,這樣就可對(duì)核苷酸的序列進(jìn)行重復(fù)測(cè)序。最簡(jiǎn)單的重新啟動(dòng)包括洗滌已 固定的模板,以除去先前的聚合反應(yīng)復(fù)合物,和重新加入新鮮的聚合酶引物混合物以重新啟動(dòng)合成,從而重新開始測(cè)序過程。已固定的模板的洗滌可包括調(diào)整反應(yīng)混合物的溫度、 PH和/或鹽濃度中一種或多種,以使聚合酶從模板上解離。同樣,也可使聚合酶合成至 (synthesize off)線性模板的末端而完成單模板分子的測(cè)序。之后,通過調(diào)整雜交條件,如 增加溫度和/或鹽濃度使新生鏈從模板解離,從而實(shí)現(xiàn)新生鏈/引物鏈的去除。在還有其它方面,可使用例如處于基底(如顯微鏡載玻片)上相鄰但光學(xué)可分辨 的部分上或者ZMW陣列中的相鄰零模式波導(dǎo)上的多個(gè)相鄰放置的聚合酶來針對(duì)相同模板 上的不同部分進(jìn)行引導(dǎo),從而它們可重復(fù)進(jìn)行并測(cè)定該模板的相同部分的序列多次。III.測(cè)定序列前后關(guān)系如上所述,通過提供給定分子的序列內(nèi)的各個(gè)堿基的共有序列鑒定,由分子冗余 測(cè)序得到的序列信息的比較或重疊(overlaying)提供了增加所獲得的序列信息的置信的 優(yōu)點(diǎn)。為了有助于比較,各部分序列信息的前后關(guān)系也是非常有價(jià)值的。為此,本發(fā)明提供 并使用模板序列內(nèi)的登記序列,以提供這些前后關(guān)系。在本發(fā)明的至少一個(gè)實(shí)施方式中,模板序列具有登記序列,該登記序列指示模板 中緊隨的序列或之前的序列的前后關(guān)系。例如,通過在序列內(nèi)各相同核苷酸鏈的起點(diǎn)提供 登記序列,可容易地鑒別該序列的起點(diǎn)。在環(huán)形模板的情況中,登記序列在該模板上提供了 一個(gè)設(shè)定點(diǎn),以及在該環(huán)形序列上提供一提示該方法已進(jìn)行到指定時(shí)間的指示。具體而言, 通過在這種序列測(cè)定中加入序列前后關(guān)系參數(shù)(而實(shí)現(xiàn))。該序列前后關(guān)系參數(shù)有助于確 定全部靶核酸序列的較大內(nèi)容內(nèi)的預(yù)定序列片段或甚至更大的序列區(qū)域的位置。根據(jù)本發(fā) 明,序列前后關(guān)系參數(shù)包括嵌埋于靶序列中的登記序列。模板中加入登記序列在該模板序 列內(nèi)的給定位點(diǎn)提供了內(nèi)部標(biāo)記物。這種標(biāo)記物可提供如下益處即允許比對(duì)來自給定模 板分子或多個(gè)拷貝的模板序列的重疊序列讀數(shù),其中該登記序列在所述模板序列的多個(gè)拷 貝中所處的位置相同。此外,這些登記序列可在環(huán)形模板分子內(nèi)提供給定的、相對(duì)位置的標(biāo) 記物,從而提供有關(guān)環(huán)形模板的復(fù)制和/或測(cè)序已結(jié)束的指示。本發(fā)明的登記序列尤其可用于已開發(fā)或正在開發(fā)的摻入測(cè)序方法的中,尤其是那 些依賴于單個(gè)模板分子的序列測(cè)定的方法。摻入測(cè)序法通?;谀0鍖?dǎo)向的引物延伸反應(yīng) 中的摻入順序而鑒定序列中的堿基。具體而言,鑒定摻入引物延伸產(chǎn)物中的堿基,通過互補(bǔ) 性鑒別模板中與其配對(duì)的堿基。這種測(cè)序方法包括那些在模板依賴性引物延伸反應(yīng)中逐步 加入堿基的方法,其中,每件摻入事件中摻入的堿基均被鑒別。通常,這類方法使用染料標(biāo)記的核苷酸,該核苷酸被封端或被阻斷,例如在所加入 的堿基的3’羥基上,以阻止超出該摻入事件以外的進(jìn)一步的引物延伸。一旦摻入,檢測(cè)該 堿基上的染料,作為該特定堿基已被摻入的指示。然后處理該復(fù)合物,以除去阻斷或封端的 基團(tuán)和染料或標(biāo)記基團(tuán),并重復(fù)該方法以鑒別隨后將摻入的堿基,從而鑒別基礎(chǔ)模板的序 列。此方法的不同變化為,在某個(gè)時(shí)間使用單類型的堿基來詢問(interrogate)該復(fù)合物, 鑒別該堿基是否已被摻入,然后嘗試不同的堿基?;蛘?,可同時(shí)使用多個(gè)不同標(biāo)記的堿基, 并根據(jù)所摻入的核苷酸上的染料的光譜特性鑒別哪種堿基被摻入。其它方法使用非熒光檢 測(cè)技術(shù),這類技術(shù)通過使用發(fā)光酶報(bào)道子系統(tǒng)檢測(cè)摻入反應(yīng)的副產(chǎn)物(如焦磷酸鹽/酯) 的存在而評(píng)估摻入。在特別優(yōu)選的方面,在實(shí)時(shí)單分子測(cè)序法中使用本發(fā)明。這些方法在例如美國(guó)專 利7,033,764,7, 052,847,7, 056,661和7,056,676中有描述,出于所有目的,本文將這些專利的全文以應(yīng)用的方式納入。簡(jiǎn)言之,這些方法通常提供固定在固相支持物上的模板/引 物聚合酶復(fù)合物,這樣單個(gè)復(fù)合物可與其它復(fù)合物光學(xué)分辨。將標(biāo)記的核苷酸導(dǎo)入復(fù)合物 中,可直接觀察到它們的摻入。通過使用互相作用的標(biāo)記物可以實(shí)現(xiàn)直接觀察,所述標(biāo)記 物如能量轉(zhuǎn)移供體/受體熒光團(tuán)對(duì),其中供體或受體熒光團(tuán)之一連接于復(fù)合物活性位點(diǎn)近 端,如在聚合酶分子的分開的位置上,而該對(duì)的另一成員則連接于被摻入的核苷酸。當(dāng)摻入 受體標(biāo)記的核苷酸時(shí),它被帶至聚合酶上的供體附近,并產(chǎn)生可檢測(cè)的熒光信號(hào)。其它策略 使用熒光團(tuán),這些熒光團(tuán)自身在多聚磷酸酯鏈從核苷酸類似物上解離時(shí)猝滅,在摻入過程 中,它產(chǎn)生未猝滅的染料。其它優(yōu)選的策略提供固定復(fù)合物的光學(xué)封閉(optical confinement),這樣摻入 會(huì)將標(biāo)記的核苷酸帶入該封閉的照射/檢測(cè)空間內(nèi),并持續(xù)足夠的時(shí)間,從而可檢測(cè)熒光, 并使其與隨機(jī)擴(kuò)散的標(biāo)記物或標(biāo)記核苷酸(具有更短暫的信號(hào)特征)相區(qū)分。特別優(yōu)選的 封閉例子包括零模式波導(dǎo)的陣列。參見,例如美國(guó)專利7, 033,764,7, 052,847,7, 056,661 和7,056,676 (先前已在本文中以引用的方式納入本文)、和美國(guó)專利6,991,726、 7,013,054和7,181,122,出于所有目的,本文將其全文以應(yīng)用的方式納入。具體而言,這些 ZMW的特征是置于透明基底之上的覆層,該覆層具有中空的芯,通過該芯可到達(dá)底層的基 底,該芯被安排為跨過該覆層/基底。當(dāng)光的頻率低于芯的截留頻率時(shí),具有納米級(jí)橫截面 大小(例如橫截面(長(zhǎng)、寬或直徑)約為20到約200nm)的這些芯通過減弱光通過該芯的 傳播而提供了光學(xué)封閉。結(jié)果,光僅能在芯內(nèi)穿透短的距離,從而在該芯的末端(光從該處 導(dǎo)出)提供非常小的照射體積。如前所述,用于這些測(cè)序方法的模板中摻入登記序列為這些方法所獲得的序列信 息提供了參比或比對(duì)序列。這些比對(duì)序列可用于鑒別對(duì)環(huán)形模板測(cè)序獲得的重復(fù)節(jié)段,或 用于比對(duì)從相同的或同樣的線性或環(huán)形模板序列組獲得的序列。圖1闡述了這些登記序列 在獲得這些比對(duì)中的應(yīng)用。具體而言,如圖I所示,在適當(dāng)?shù)囊镄蛄?04和核酸聚合酶 106結(jié)合到模板分子102后進(jìn)行引物延伸反應(yīng)。模板序列102具有登記序列108。該模板 可以是與引物和聚合酶在引物延伸反應(yīng)中反復(fù)反應(yīng)的單模板分子,例如是可重復(fù)反應(yīng)的線 性分子,或者是適于進(jìn)行連續(xù)反應(yīng)的環(huán)形分子,或者該模板可含有多條與一種或多種不同 的聚合酶和引物反應(yīng)的相同模板序列。不論模板是單分子還是多個(gè)相同序列,在它的序列 的某個(gè)位置上都包括登記序列(以有陰影線的框表示)。如圖II所示,從這些模板獲得的序列信息本質(zhì)上是有所不同的,例如,它們獲自 該靶/模板序列的不同部分,因此使用聚合酶106實(shí)施的重復(fù)模板導(dǎo)向的引物延伸產(chǎn)生了 衍生自模板序列的序列信息或讀數(shù)110、112、114和116,其中包括與登記序列108互補(bǔ)的序 列,分別顯示為登記互補(bǔ)物118、120、122和124。利用登記互補(bǔ)物118-124的存在,可確定這些測(cè)得的序列如何比對(duì),如圖III所示。如本文其它地方所述,這可提供關(guān)于序列測(cè)定的程度的指示,例如,是否已測(cè)到給定的 點(diǎn),或者可使用該指示確定已獲得的序列覆蓋水平。具體而言,在核酸測(cè)序中,測(cè)序方法的 精確性通常依賴于給定序列區(qū)域的多倍測(cè)序或覆蓋水平。通過鑒定每次通過模板序列的給 定部分的開始和結(jié)束,可容易地確定單模板分子或其部分的覆蓋水平。同樣地,在測(cè)序登記 序列在序列中處于相同位置的多個(gè)相同的模板分子(或重疊模板分子)時(shí),提供了已圍繞 該登記序列進(jìn)行的特定序列區(qū)域的測(cè)序的次數(shù)。例如,結(jié)合圖1的III,從比對(duì)的序列可鑒定序列的A和F部分已被覆蓋兩次,B和E部分已被覆蓋了 3次,C部分(登記序列)和D 部分具有四倍序列覆蓋。在一些情況中,可能需要將一個(gè)以上登記序列摻入給定模板分子中,以將測(cè)序過 程中獲得的序列信息歸在一起。這允許鑒別特定靶序列節(jié)段的起點(diǎn)和終點(diǎn)。給定模板中的 這種多登記序列可含有相同或不同的堿基序列,以有助于它們的鑒定和區(qū)分。
在其它方面,可在用于測(cè)序的遺傳物質(zhì)的分開片段中使用登記序列,各片段來自 遺傳物質(zhì)較大部分(如基因組)的給定區(qū)域,用給定登記序列標(biāo)記,而來自不同區(qū)域的模板 則用不同的登記序列標(biāo)記。然后,登記序列的測(cè)序提供測(cè)序方法所測(cè)的模板內(nèi)的登記,和特 定片段獲自該較大基因組內(nèi)容何處的鑒定。實(shí)踐中,可將較大遺傳靶材料如基因組分成獨(dú) 立的部分,如lOOkb,或100萬堿基,或染色體。然后將登記序列加到各部分的多個(gè)位置中, 如通過部分限制性消化和標(biāo)記的連接。通過這種方法,給定部分中的每一段(piece)都具 有相同的登記序列,該登記序列將起到鑒定標(biāo)簽的作用,而所有的部分都提供有不同的登 記序列。然后可合并所有部分的所有段,并測(cè)序。然后使用登記序列信息集合單個(gè)讀數(shù),如 所有登記序列1的讀數(shù)得自部分1,所有登記序列2的讀數(shù)得自部分2。這種分成部分的方 法對(duì)大靶標(biāo)中的重復(fù)序列特別有幫助,因此這些重復(fù)可指定到其原始的位置。分成部分的 方法還有助于集合通常難以集合的大靶標(biāo)內(nèi)的短讀數(shù)。如本文其它地方已間接提到的,除了它們?cè)诒葘?duì)序列信息的用途中外,某些模 板(如登記序列位于模板的5’端的線性、或環(huán)形模板)內(nèi)的登記序列的鑒定可提供 整個(gè)模板序列已被測(cè)序或者已至少通過所述模板的5’端測(cè)序過的元件信息(element information)。具體而言,對(duì)于環(huán)形模板,模板測(cè)序中出現(xiàn)至少兩次的登記序列的鑒定證實(shí) 了該模板的整條序列在一倍覆蓋中已被詢問/測(cè)到。此外,如圖1所示,這種登記序列可提 供單個(gè)環(huán)形模板或多個(gè)相同模板的序列覆蓋水平的直接讀數(shù)。前述內(nèi)容在圖2中示意性闡述。如圖I所示,提供環(huán)形模板分子200,其與引物序 列202和鏈取代聚合酶204形成復(fù)合物。模板序列200包括登記序列部分206。在引物延伸 反應(yīng)期間(圖II),產(chǎn)生延伸反應(yīng)產(chǎn)物208或新生鏈,其包括登記序列206的互補(bǔ)序列210。 使用例如優(yōu)選的實(shí)時(shí)單分子測(cè)序方法從該反應(yīng)獲得的序列信息示意性地顯示在圖ΠΙΑ、B 和/或C中。具體而言,如圖IIIA所示,獲得了從登記序列212的至少第一鑒定至該序列 214的第二鑒定的序列信息,其中居間節(jié)段216的序列已被測(cè)定。結(jié)果,可容易地確定已對(duì) 整個(gè)環(huán)形模板序列測(cè)序了至少一次。通過持續(xù)圍繞著環(huán)形模板進(jìn)行測(cè)序而獲得多覆蓋測(cè) 序,如圖IIIB所示。覆蓋水平的測(cè)定僅僅需要登記序列的鑒定之間的居間序列的通過次數(shù) 即可(所示的為6倍覆蓋)。另一方面,可通過使用登記序列比對(duì)在相同環(huán)形模板序列上或多條相同模板序列 上進(jìn)行的多個(gè)不同的延伸反應(yīng)獲得的序列信息,并將其歸類(coordinate),如圖IIIC所 示。例如,在某些情況中,可從環(huán)形模板不同部分的引物延伸獲得序列信息的分立的、非連 續(xù)的段。這可能是聚合酶解離、反應(yīng)條件變化(有意或其它)或在相同模板序列上發(fā)生的 多種不同的延伸反應(yīng)(其中各不同反應(yīng)提供可鑒別的序列輸出)所得的給定引物延伸反應(yīng) 的中斷導(dǎo)致的結(jié)果。然后,通過其登記序列可將序列信息的這些多個(gè)分立的片段相關(guān)聯(lián),如 圖IIIC所示。如前所述,可使用登記序列從給定模板分子獲得共有序列信息。具體而言,通過基于所鑒別的登記序列比對(duì)序列(包括例如至少部分比對(duì)),以及通過增加的比較,將其相同 的核苷酸序列被重復(fù)測(cè)序的單模板分子的序列信息與它自身比較,獲得該序列內(nèi)各堿基位 置的共有序列信息。這種共有序列測(cè)定的一個(gè)闡述性例子闡述于圖3中。如圖所示,基于 它們的登記序列節(jié)段314比對(duì)其相同的核苷酸序列被重復(fù)測(cè)序的單模板獲得的序列讀數(shù) (顯示為序列302-312)。如圖所示,從相同模板(如環(huán)形模板或重復(fù)的序列模板,如本文其 它地方所述)內(nèi)的相同序列的重復(fù)測(cè)序獲得相同序列。將在一種或多種序列讀數(shù)中有不同 稱謂的堿基(如堿基316和318)與相同位置上的共有序列鑒定結(jié)果(如堿基320和322) 比較。通過獲得給定序列位置的足夠的共有序列信息,可獲得所需的置信水平、該位置的堿 基,并從而確定該模板的共有序列324。應(yīng)理解,可在給定位置獲得的置信將依賴于通過該位置的重復(fù)序列讀數(shù)的數(shù)量以 及所使用的測(cè)序系統(tǒng)的固有的誤差比例。但是,應(yīng)注意的是,如果假定摻入期間非系統(tǒng)性的 誤差比例(如隨機(jī)序列誤差的比例)高達(dá)25%,則對(duì)于給定序列,冗余測(cè)序法中5倍的序列 覆蓋將產(chǎn)生非常低的誤差比例,理論上低于0. 1 %。對(duì)于從冗長(zhǎng)測(cè)序中讀取(call)堿基,應(yīng)理解的是必須建立給定讀取的共有序列。 因此,如果給定位置的反復(fù)測(cè)序產(chǎn)生不確定性,如在各測(cè)序輪次中鑒定的結(jié)果不同,那么共 有序列的讀取將需要在該位置讀取至少2次,以建立多數(shù)一致性。此外,為了增加這種共有 序列讀取的置信,將需要在該位置進(jìn)行三次、四次、五次、十次或更多次的讀取。舉例而言, 如果鑒定給定位置,一次為A,一次為C,沒有更多的鑒定,則將難以鑒定該位置的正確堿基 讀數(shù),不確定性超過50%。但是,在該位置實(shí)施一次額外的讀取,如第3次讀取為A,則可以 合理的確定性確定C讀數(shù)是錯(cuò)誤的。因此,結(jié)合本發(fā)明,比較給定模板的序列數(shù)據(jù)包括將該模板的相同核苷酸序列組 的至少兩個(gè)序列讀數(shù)、優(yōu)選至少5個(gè)序列讀數(shù)、在某些情況中至少10個(gè)序列讀數(shù)、在其它情 況中至少15個(gè)甚至20個(gè)序列讀數(shù)進(jìn)行比較。一旦從給定靶序列獲得多個(gè)讀數(shù),比對(duì)這些讀數(shù),產(chǎn)生共有序列。最簡(jiǎn)單的是,比 對(duì)可通過人工地將共有序列元件置于相同序列位置中并針對(duì)遺漏或取代的堿基而調(diào)整來 實(shí)現(xiàn)。但是,在優(yōu)選的方面,通過計(jì)算機(jī)使用比對(duì)軟件比對(duì)各序列讀數(shù)。可容易地獲得各種 基因比對(duì)程序,包括例如BLAST、FASTA、SSEARCH、SAM、DNABaser等等。再次,一旦比對(duì)各序列讀數(shù),可建立共有序列。最簡(jiǎn)單的,可使用簡(jiǎn)單多數(shù)性讀數(shù) 建立給定位置的一致讀數(shù)。但是,在一些情況下,可能需要建立絕對(duì)多數(shù)性的一致堿基讀 數(shù),以消除可能產(chǎn)生自測(cè)序方法的誤差比例的不確定性。例如,可能需要51 %的多數(shù)性來建 立一致讀數(shù),在優(yōu)選的方面將需要大于60 %、大于70 %、大于75 %、大于80 %甚至大于90 % 的一致性,以建立給定位置的一致讀數(shù)。在優(yōu)選的實(shí)施方式中,同樣可通過適當(dāng)編程以接受 序列數(shù)據(jù)的計(jì)算機(jī)來實(shí)施序列比較和一致堿基測(cè)定,基于所有比對(duì)序列的一致性百分百認(rèn) 定一致讀數(shù)。III.登記序列登記序列的特性將至少一定程度上依賴于使用該序列的應(yīng)用的性質(zhì)。具體而言, 登記序列的長(zhǎng)度、序列組成和在模板序列內(nèi)所希望的位置(如果需要的話)可能會(huì)根據(jù)該 應(yīng)用而變化,下文將對(duì)此有更詳細(xì)的描述。已知的登記序列優(yōu)選是外源導(dǎo)入的登記序列,也 稱為“外源序列”或類似稱呼,以與靶核酸序列中以其原始狀態(tài)存在的已知部分相區(qū)別。通
10常,可預(yù)先選擇這種外源序列,在樣品制備步驟中將其導(dǎo)入靶序列中,在某些情況中根據(jù)待 測(cè)序的模板的性質(zhì),例如長(zhǎng)度、預(yù)期的序列前后關(guān)系、該模板中天然存在的該登記序列的復(fù) 制可能性等等來設(shè)計(jì)該外源序列,以提供最佳的登記序列的識(shí)別。除了預(yù)先選擇和/或設(shè) 計(jì)外源登記序列外,通常還將登記序列置于靶序列內(nèi)的某個(gè)可被選擇的位置上。該選擇的 位置可以是確實(shí)已知的,或者是相對(duì)已知的,如已知在給定模板序列如環(huán)形模板中存在一 定數(shù)量的次數(shù)(如一次),或者很靠近給定模板序列的3’或5’端,或者在該3’或5’端??蛇x擇登記序列,使其在靶序列內(nèi)被復(fù)制的可能性最小,確定地鑒別登記序列的 機(jī)會(huì)最大。通常,靶序列內(nèi)登記序列不被復(fù)制的可能性的變化將是該登記序列長(zhǎng)度的函數(shù)。 因此,靶序列內(nèi)登記序列的長(zhǎng)度通常將根據(jù)待測(cè)的靶序列的長(zhǎng)度而變化。舉例而言,5堿基登記序列存在于隨機(jī)的lkb靶核酸內(nèi)的可能性(雖然不高)將比 lkb靶序列內(nèi)出現(xiàn)的給定10堿基序列的可能性高。將理解,模板序列越長(zhǎng),登記序列的所需 長(zhǎng)度也越長(zhǎng),以解決提高的復(fù)制可能性。同樣地,越希望避免模板序列內(nèi)的天然復(fù)制,所需 的登記序列將越長(zhǎng)。為了大多數(shù)測(cè)序應(yīng)用,如實(shí)時(shí)測(cè)序,其中通常需要對(duì)模板序列內(nèi)的100 到1000、10000或更多個(gè)連續(xù)堿基進(jìn)行測(cè)序,通常登記序列的長(zhǎng)度將為約5個(gè)到約100個(gè)堿 基,甚至更長(zhǎng),優(yōu)選的登記序列的長(zhǎng)度為約10到約50個(gè),在某些優(yōu)選方法,為約10到約20 個(gè)堿基。登記序列中的堿基的特定序列并不是關(guān)鍵的因素,因?yàn)檩^大序列中存在的n個(gè)堿 基的任意序列的可能性都是相同的,而不論該序列中的所述特定堿基是什么。但是,在某些 情況下,可能需要選擇登記序列中的堿基的特定序列,以利用某些堿基優(yōu)于其它堿基的測(cè) 序精確性、易于可鑒別的染料組合、靶序列中的預(yù)期的序列偏差等等。不管靶序列中堿基的 情況如何,根據(jù)本發(fā)明,登記序列由已知堿基序列組成,這樣可易于從它所嵌埋的靶序列中 鑒別該登記序列。如上所述,登記序列通讀在模板序列的某個(gè)選定的相對(duì)位置提供?!斑x定的相對(duì)位 置”指登記序列的位置未必確切知曉,但至少部分相對(duì)于一些其它成分而選擇它的位置。例 如,在某些情況中,如線性靶序列,登記序列可靠近或在該靶序列3’或5’端。但在環(huán)形序列的情況中,環(huán)形靶標(biāo)內(nèi)任意位置放置的登記序列都被視為是選定的 相對(duì)位置,因?yàn)樗奈恢孟鄬?duì)于它自身(一條全長(zhǎng)的靶序列)是已知的。通??赏ㄟ^多種方法實(shí)現(xiàn)靶序列或模板序列內(nèi)登記序列的放置。例如,登記序列 可作為復(fù)制靶序列(例如使用PCR或其它非線性擴(kuò)增方法)而使用的引物序列上的粘附的 標(biāo)簽提供,這樣該靶序列基本上以登記序列位于待測(cè)序的鏈的3’或5’端的狀態(tài)存在于樣 品內(nèi)。也可使用連接方法將登記序列連接到雙鏈序列的一條鏈的一端或另一端。隨后的雙 鏈模板的解鏈和與聚合酶和引物的結(jié)合提供了包含有該登記序列的新合成的模板。在至少一個(gè)優(yōu)選的方面,使用環(huán)形靶核酸作為測(cè)序的模板核酸,例如,如圖2示意性所述。在某些例子中,由于能夠被重復(fù)測(cè)序而不需要重新啟動(dòng)復(fù)合物的形成,因此這類環(huán) 形模板特別優(yōu)選。通過圍繞著該環(huán)形模板重復(fù)測(cè)序,可獲得序列冗余或多序列覆蓋,結(jié)果, 可證實(shí)所測(cè)定的序列。但是,在使用這種冗余測(cè)序法時(shí),特別有用的是能夠認(rèn)識(shí)到模板已被 完全測(cè)序或者被測(cè)了指定的次數(shù)。通過在模板中引入登記序列部分,可在每一次對(duì)環(huán)形模 板進(jìn)行測(cè)序后提供計(jì)數(shù)。除了證實(shí)環(huán)形模板已被測(cè)序至少一次外,登記序列還提供關(guān)于模 板多次測(cè)序的比對(duì)的記錄,以比對(duì)倍數(shù)覆蓋(fold coverage)。可為單環(huán)形分子的測(cè)序提供這種比對(duì),或者,在某些情況中,為相同環(huán)形模板分子(其中登記序列在各模板中處于相同 的位置)的多次測(cè)序提供比對(duì)。舉例而言,在采用摻入的測(cè)序方法中,當(dāng)采用環(huán)形模板時(shí),直到有足夠的序列冗余 (達(dá)到所需的可能性水平)指示測(cè)序方法已圍繞該環(huán)形模板實(shí)施了至少一次后才能夠確定 已獲得整個(gè)模板序列。在重新對(duì)給定模板測(cè)序時(shí),由于正確的序列是未知的,因此通常需要 在獲得結(jié)論之前將整個(gè)模板序列覆蓋幾次。在使用已知的登記序列的情況下,在已知的登 記序列已被通讀和鑒別兩次時(shí),可確定該序列已被通讀過至少一次,從而保證已圍繞該環(huán) 完成了至少一次通讀。此外,在尋求多倍覆蓋的情況中,對(duì)單反應(yīng)獲得的序列輸出內(nèi)的登記 序列的反復(fù)鑒定將提供獲自該模板的序列覆蓋水平的直接指示。可采用已知的樣品制備方法容易地獲得環(huán)形模板,其中,將登記序列附加或連接 到線性模板的末端部分(或作為預(yù)先合成的引物上的標(biāo)簽而加入,該引物用于從基礎(chǔ)靶序 列上制備模板),接著使用例如環(huán)化連接酶或其它已知的環(huán)化技術(shù)將模板環(huán)化。應(yīng)理解,登記序列可以以其它序列部分的整合的成分存在。例如,登記序列可作為 測(cè)序引物識(shí)別序列,或連接到測(cè)序引物識(shí)別序列上。這樣,登記序列的引入可與引導(dǎo)序列的 引入同時(shí)進(jìn)行。其它功能性序列組分可包括限制性位點(diǎn)、二級(jí)結(jié)構(gòu)誘導(dǎo)序列,如發(fā)夾等。雖然本發(fā)明以實(shí)時(shí)讀取序列信息的方式進(jìn)行一般性的描述,但是應(yīng)理解的是,優(yōu) 選的是提供測(cè)序部分或整個(gè)模板序列的序列數(shù)據(jù),接著根據(jù)登記序列的存在評(píng)估該序列數(shù) 據(jù)。序列數(shù)據(jù)中鑒定到轉(zhuǎn)錄的登記序列指示兩次表明該整個(gè)模板序列已提供在該讀數(shù)中。雖然以固定的模板長(zhǎng)度進(jìn)行闡述,也應(yīng)理解的是本文所述的登記序列可包括在不 同長(zhǎng)度模板的一端,該模板然后被環(huán)化。如此處理將為該模板序列的節(jié)段提供差異化的登 記序列讀數(shù),所述節(jié)段在線性模板中與登記序列的距離不同,但環(huán)化時(shí)將位于靠近登記序 列的位置上??刹捎酶鞣N方法提供不同長(zhǎng)度的模板序列,例如沿著模板的長(zhǎng)度在不同的位 點(diǎn)限制或切割模板序列,以產(chǎn)生原始模板序列嵌套片段組,各片段在一個(gè)末端有登記序列, 而整條序列的另一末端有不同的位點(diǎn)。當(dāng)模板片段被環(huán)化時(shí),從登記序列開始向新連接的 片段末端的方向進(jìn)行測(cè)序,結(jié)合其它不同長(zhǎng)度的片段的其它測(cè)定序列,可從該新序列獲得 序列前后關(guān)系信息。結(jié)果將通過對(duì)該多嵌套模板片段進(jìn)行測(cè)序而提供虛擬的模板序列的倍 數(shù)覆蓋。這在附圖4由示意性闡述。如圖4A所示,提供共用序列的一組不同長(zhǎng)度的片段(402,404,406)。將登記序列 408連接到這些片段的相同末端,如在相同的序列位置上,然后將它們環(huán)化。然后使用該登 記序列作為環(huán)形序列的共同的起始位點(diǎn)的指示,這樣將知道靠近該登記序列的非共有區(qū)域 被連接,但與該共同的起始位點(diǎn)的距離不同。具體而言,單模板序列的各不同長(zhǎng)度的嵌套片 段(402,404,406)的共同末端連接有登記序列408。然后環(huán)化各片段,提供環(huán)形模板(如環(huán) 形模板412,414,416)。在從該登記序列向環(huán)化片段的未共有末端進(jìn)行測(cè)序時(shí)(如箭頭所 示),可從各環(huán)形模板412、414和416產(chǎn)生不同的序列信息(分別如圖4B示意性所示的序 列讀數(shù)422、424和426)。由于各序列讀數(shù)得自相同的基礎(chǔ)模板,可以知曉這些片段得自相同的序列前后關(guān)系。此外,通過確認(rèn)不同片段的相對(duì)長(zhǎng)度(例如通過對(duì)這些片段實(shí)施基于大小的分離),可 提供整個(gè)模板序列前后關(guān)系內(nèi)各非共有序列的相對(duì)位置。這在圖4C有示意性闡述。如圖 所示,基于特定大小的片段的來源,能夠確定各測(cè)定序列讀數(shù)在基礎(chǔ)序列430中的前后關(guān)系。此外,如果任意重疊的序列部分存在于任意兩個(gè)或多個(gè)序列讀數(shù)的話,可確定這些讀數(shù)的連續(xù)的前后關(guān)系。
權(quán)利要求
一種鑒別靶核酸的已確定序列的序列前后關(guān)系的方法,該方法包括在該靶核酸序列的選定位置提供已知的登記序列;測(cè)定包括該登記序列在內(nèi)的靶核酸的至少一部分序列;根據(jù)該登記序列在該部分序列中的相對(duì)位置鑒定該測(cè)定步驟中測(cè)定的靶核酸的該部分序列的序列前后關(guān)系。
2.如權(quán)利要求1所述的方法,其特征在于,所述測(cè)定步驟包括對(duì)核苷酸的相同序列測(cè) 序多次,且其中相對(duì)于該核苷酸的相同序列在選定位置提供所述登記序列。
3.如權(quán)利要求1所述的方法,其特征在于,所述靶核酸包括環(huán)形核酸。
4.如權(quán)利要求1所述的方法,其特征在于,在所述靶核酸序列內(nèi)多次提供所述核苷酸 的相同序列。
5.如權(quán)利要求1所述的方法,其特征在于,所述測(cè)定步驟包括測(cè)定所述靶核酸序列的 所述部分的序列,其中所述登記序列被測(cè)定至少2次,所述鑒定序列前后關(guān)系的步驟包括 確定該完整環(huán)形核酸至少已被測(cè)序一次。
6.如權(quán)利要求1所述的方法,其特征在于,所述靶核酸包括線性核酸。
7.如權(quán)利要求6所述的方法,其特征在于,在所述靶核酸序列內(nèi)的多個(gè)位點(diǎn)提供所述 登記序列。
8.如權(quán)利要求6所述的方法,其特征在于,在靠近所述靶核酸序列的一個(gè)末端提供所 述登記序列。
9.如權(quán)利要求1所述的方法,其特征在于,所述測(cè)定靶核酸的至少一部分序列的步驟 包括通過在聚合酶介導(dǎo)的模板依賴性引物延伸反應(yīng)中摻入堿基而測(cè)定該序列。
10.如權(quán)利要求9所述的方法,其特征在于,所述測(cè)定靶核酸的至少一部分序列的步驟 包括通過摻入方法的實(shí)時(shí)測(cè)序。
11.如權(quán)利要求1所述的方法,其特征在于,所述登記序列包括至少5個(gè)到約100個(gè)堿基。
12.如權(quán)利要求1所述的方法,其特征在于,所述登記序列包含至少5個(gè)到約50個(gè)堿基。
13.如權(quán)利要求1所述的方法,其特征在于,所述登記序列包含約10個(gè)到約20個(gè)堿基。
14.一種對(duì)完整的靶核酸進(jìn)行測(cè)序的方法,其特征在于,所述方法包括 在該靶核酸序列內(nèi)提供已知的登記序列;環(huán)化該靶核酸序列;和采用在該登記序列至少被測(cè)序兩次前不破壞該靶核酸序列的測(cè)序方法對(duì)該靶核酸序 列進(jìn)行測(cè)序。
15.如權(quán)利要求14所述的方法,其特征在于,所述測(cè)序方法包括在模板導(dǎo)向的聚合酶 介導(dǎo)的引物延伸反應(yīng)中摻入后鑒別堿基,其中,所述靶核酸序列含有該模板。
16.如權(quán)利要求14所述的方法,其特征在于,所述測(cè)序方法包括對(duì)所述靶核酸序列的 滾環(huán)復(fù)制的產(chǎn)物進(jìn)行測(cè)序。
17.如權(quán)利要求14所述的方法,其特征在于,所述測(cè)序方法包括Sanger測(cè)序法。
18.如權(quán)利要求14所述的方法,其特征在于,所述測(cè)序方法包括在模板導(dǎo)向的聚合酶 介導(dǎo)的引物延伸反應(yīng)中摻入后鑒別堿基,其中,所述滾環(huán)復(fù)制產(chǎn)物含有所述模板。
19. 一種確定核酸序列的方法,其特征在于,所述方法包括提供模板核酸,該模板核酸的一部分具有至少第一核苷酸序列和在相對(duì)于該第一核苷 酸序列的選定位置的登記序列;對(duì)所述第一核苷酸序列和登記序列進(jìn)行測(cè)序多次;至少部分基于測(cè)序步驟所鑒別的登記序列比對(duì)測(cè)序步驟所得的序列信息;和確定比對(duì)步驟所得的共有序列,以確定所述第一核苷酸序列的核酸序列。
20.如權(quán)利要求20所述的方法,其特征在于,所述模板核酸是環(huán)形核酸,所述對(duì)該第一 核苷酸序列測(cè)序多次的步驟包括對(duì)該環(huán)形核酸測(cè)序多次。
21.如權(quán)利要求20所述的方法,其特征在于,所述第一核苷酸序列在所述模板核酸中 存在多次。
22.如權(quán)利要求20所述的方法,其特征在于,所述第一核苷酸序列被測(cè)序至少5次。
23.如權(quán)利要求20所述的方法,其特征在于,所述第一核苷酸序列被測(cè)序至少10次。
24.如權(quán)利要求20所述的方法,其特征在于,所述第一核苷酸序列被測(cè)序至少20次。
25.如權(quán)利要求20所述的方法,其特征在于,采用計(jì)算機(jī)實(shí)施所述比對(duì)步驟。
26.一種組合物,其特征在于,所述組合物包括核酸分析復(fù)合物,該復(fù)合物包括含有至少第一外源登記序列的第一模板核酸序列;核酸聚合酶;和與所述第一模板核酸序列的至少一部分互補(bǔ)的引物序列,其中,針對(duì)核酸聚合酶設(shè)計(jì) 所述模板核酸,以在該模板核酸序列的相同序列上實(shí)施引物延伸反應(yīng)多次;和多種類型的核苷酸或核苷酸類似物。
27.如權(quán)利要求27所述的組合物,其特征在于,所述第一模板核酸序列是環(huán)形的,所述 核酸聚合酶圍繞著該環(huán)形模板實(shí)施多次引物延伸反應(yīng)。
28.如權(quán)利要求27所述的組合物,其特征在于,所述模板含有多條亞序列,所述亞序列 含有相同的核苷酸序列。
29.如權(quán)利要求27所述的組合物,其特征在于,所述引物序列與所述外源登記序列的 至少一部分互補(bǔ)。
30.如權(quán)利要求30所述的組合物,其特征在于,所述多種類型的核苷酸或核苷酸類似 物包含可檢測(cè)的標(biāo)記。
全文摘要
公開了方法、系統(tǒng)和組合物,其中靶核酸含有置于其中的登記序列,該登記序列用于鑒別該靶核酸的測(cè)定序列的數(shù)量或相對(duì)位置。特別優(yōu)選的方面包括環(huán)形模板核酸序列內(nèi)的登記序列,該環(huán)形模板核酸序列相應(yīng)地被用于摻入測(cè)序法中用于鑒定該模板的序列,該方法依賴于模板依賴性聚合酶介導(dǎo)的引物延伸。
文檔編號(hào)C12Q1/68GK101802220SQ200880100371
公開日2010年8月11日 申請(qǐng)日期2008年7月25日 優(yōu)先權(quán)日2007年7月26日
發(fā)明者F·克里斯蒂安, S·特納 申請(qǐng)人:加利福尼亞太平洋生物科學(xué)股份有限公司