專利名稱:用于檢測hiv整合酶變體的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明提供了用于檢測和分析與HIV-I相關(guān)的序列變體的方法、試劑和系統(tǒng),所述序列變體特別是在HIV進(jìn)化枝B和進(jìn)化枝C亞型中的那些。變體可以包括在平行的靶多核苷酸群體中的單核苷酸多態(tài)性(SNPs)、插入/缺失變體(被稱為“indels”)和等位基因頻率。本發(fā)明還涉及通過平行焦磷酸鹽測序研究通過聚合酶鏈反應(yīng)(PCR)復(fù)制的核酸的方法,用于鑒定已知和未知序列的突變和多態(tài)性。本發(fā)明涉及使用特異性設(shè)計為擴(kuò)增HIV RNA 或其互補(bǔ)DNA與特定HIV特征或功能相關(guān)的特定區(qū)域和/或一系列重疊區(qū)的核酸引物,所述區(qū)域例如與HIV將病毒DNA整合到細(xì)胞DNA內(nèi)的能力相關(guān)的整合酶區(qū)域。此外,關(guān)于引物的靶位點(diǎn)具有低突變率,使得核酸能夠在靶HIV核酸群體中一致擴(kuò)增,所述靶HIV核酸群體被懷疑包含變體(也被稱為準(zhǔn)種),以生成個別擴(kuò)增子。數(shù)千個個別HIV擴(kuò)增子以大量平行、有效和節(jié)省成本的方式進(jìn)行測序,以生成在擴(kuò)增子群體中發(fā)現(xiàn)的序列變體分布,這使得能夠進(jìn)行超過先前采用方法的更大檢測靈敏度。
背景技術(shù):
人免疫缺陷病毒(一般被稱為HIV)依然是全世界的主要問題,盡管許多化合物已得到批準(zhǔn)用于治療。由于病毒逆轉(zhuǎn)錄酶的易錯性質(zhì)和高病毒周轉(zhuǎn)(伐=1-3天),HIV基因組非??焖俚赝蛔儭@?,逆轉(zhuǎn)錄酶估計平均生成一個突變/9. 7 Kb基因組復(fù)制,這不顯著影響病毒繁殖的能力。這導(dǎo)致其中許多不同突變體以動態(tài)關(guān)系存在的“準(zhǔn)種”形成。HIV病毒顆粒經(jīng)由⑶4受體和共受體分子進(jìn)入細(xì)胞,其中在進(jìn)入后,HIV整合酶執(zhí)行將HIV原病毒整合到細(xì)胞機(jī)構(gòu)內(nèi)的功能,如由Lataillade和Kozal描述的(Lataillade, Μ.禾口 Kozal, Μ· J. , The hunt for HIV-I integrase inhibitors, AIDS Patient Care and STDs (2006) 20:489,其為了所有目的在此整體引入本文作為參考)。整合包括步驟(1)裝配在整合酶蛋白質(zhì)和在病毒基因組末端上的特異性DNA序列之間的穩(wěn)定復(fù)合物;(2)病毒基因組的3’加工;(3)鏈轉(zhuǎn)移;和(4) DNA缺口修復(fù)和連接。HIV整合酶基因編碼序列定位于Pol區(qū)的3’末端附近,在基因組中側(cè)面為逆轉(zhuǎn)錄酶RNA酶和Vif —后者具有在整合酶的3’末端上開始的部分重疊讀碼框。整合酶蛋白質(zhì)由288個氨基酸(32 kDa)編碼,并且通過病毒蛋白酶從Pol多聚蛋白質(zhì)中釋放。它由3個結(jié)構(gòu)域組成包含鋅指基序的N末端結(jié)構(gòu)域、C末端結(jié)構(gòu)域和兩者之間的催化核心結(jié)構(gòu)域。 核心包含酶促功能必需的 DDE 基序(Freed,E. 0.,HIV-I r印lication,Somat. Cell and Mol. Genet. (2001)沈13,其為了所有目的在此整體引入本文作為參考)。在臨床試驗(yàn)中顯示功效后,F(xiàn)DA已批準(zhǔn)了可從Merck & Co.獲得的在商業(yè)上被稱為 Isentress (雷特格韋(Raltegravir))的整合酶抑制劑的使用(Grinsztejn等人,Protocol 005 Team. Safety and efficacy of the HIV-I integrase inhibitor raltegravir (MK-0518) in treatment-experienced patients with multidrug-resistant virus :a phase II randomised controlled trial. Lancet(2007)369:1261 ;禾口 Steigbigel 等人, Raltegravir with optimized background therapy for resistant HIV-I infection.N. Engl. J. Med. (2008). 359 339,其各自為了所有目的在此整體引入本文作為參考)。雷特格韋靶向病毒基因組整合中的第三個步驟一一鏈轉(zhuǎn)移,并且減少對這種藥物的敏感性的幾個突變已得到描述(Lataillade和Kozal,上文引入作為參考;Van Laethem等人,A genotypic assay for the amplification and sequencing of integrase from diverse HIV-I group M subtypes. J. Virol. Methods (2008) 153:176 ;禾口 Paar 等人,Genotypic antiretroviral resistance testing for human immunodeficiency virus type 1 integrase inhibitors on the TruGene sequencing system, J. Clin. Microbiol. 2008 Dec ;46( 12):4087-90. Epub 2008年 10月 22 日,其各自為了所有目的在此整體引入本文作為參考)。除雷特格韋外,眾多整合酶抑制劑也在大型制藥公司的流水線上(Lataillade和Kozal,上文引入作為參考)。以類似于用于蛋白酶和逆轉(zhuǎn)錄酶基因中的抗性連鎖突變基因分型的方式,能夠檢測抗性連鎖突變以便預(yù)測對HIV整合酶抑制劑的應(yīng)
D. R. ^A, Performance characteristics of the TRUGENE HIV-I genotyping kit and the Opengene DNA sequencing system,J. Clin. Microbiol. (2003) 41:1594,其為了所有目的在此整體引入本文作為參考)。目前的HIV藥物抗性測定一般作為群體測定執(zhí)行(Kuritzkes,D. R.等人,Van Laethem等人,Paar等人,各自在上文引入作為參考),其就其性質(zhì)而言,比基于每種病毒株的克隆分離的測定更不靈敏。然而,先前采用的克隆分析測定是極端勞動密集的,并且需要分開測試來自每個受試者的數(shù)千種細(xì)胞克隆,以便達(dá)到高靈敏度。長讀取長度妨4測序理想地適合于在單次測序運(yùn)行中生成來自多個受試者的數(shù)千個克隆讀數(shù)。因此,這些突變通過基于序列的HIV整合酶抑制劑抗性決定測定的有效檢測——其中克隆序列直接得自病毒RNA準(zhǔn)種而無需勞動密集的克隆步驟——是高度希望的并且使得來自早期檢測的疾病了解和治療可能性中的重要進(jìn)展成為可能。進(jìn)一步地,高流通量測序技術(shù)的實(shí)施方案使得可以被稱為“大量平行(Massively Parallel)”處理的技術(shù)具有比先前測序技術(shù)實(shí)質(zhì)上更有力的分析、靈敏度和流通量特征成為可能。例如,采用目前描述的本發(fā)明HIV特異性引物的高流通量測序技術(shù)能夠達(dá)到檢測低豐度等位基因的靈敏度,這包括在群體中或更少的等位基因變體頻率。如上所述,這在檢測HIV變體的背景中是重要的,特別是對于其中高靈敏度提供重要早期檢測機(jī)制的整合酶變體,這導(dǎo)致重要治療利益。發(fā)明概述
本發(fā)明的實(shí)施方案涉及核酸序列的測定。更具體而言,本發(fā)明的實(shí)施方案涉及使用高流通量測序技術(shù)用于檢測序列變體的方法和系統(tǒng)。描述了用于檢測與整合酶相關(guān)的一種或多種HIV序列變體的低頻率出現(xiàn)的方法的一個實(shí)施方案,其包括步驟(a)生成來自HIV樣品群體中的多個RNA分子的cDNA種類; (b)由cDNA種類擴(kuò)增多個第一擴(kuò)增子,其中每個第一擴(kuò)增子用一對核酸引物進(jìn)行擴(kuò)增;(c) 克隆擴(kuò)增第一擴(kuò)增子的擴(kuò)增拷貝,以產(chǎn)生多個第二擴(kuò)增子;(d)測定第二擴(kuò)增子的核酸序列組成;(e)檢測在第二擴(kuò)增子的核酸序列組成中以5%或更少的頻率出現(xiàn)的一種或多種序列變體;和(f)使檢測出的序列變體與和HIV整合酶相關(guān)的變異關(guān)聯(lián)。此外,描述了試劑盒的一個實(shí)施方案,所述試劑盒包括選自IN12F (SEQ ID No 1) 和 IN2R (SEQ ID No :3);IN1F (SEQ ID No :2)和 IN2R (SEQ ID No :3);IN3F (SEQ ID No 4)和 IN3R (SEQ ID No 5) ;IN4F (SEQ ID No :6)和 IN4R (SEQ ID No 7) ;IN5F (SEQ ID No :8)和 IN5R (SEQ ID No :9);和 IN6F (SEQ ID No :10)和 IN6R (SEQ ID No 11)的一個或多個引物對。上述實(shí)施方案和實(shí)現(xiàn)不一定彼此包括或排除,并且可以以不沖突和在其它方面可能的任何方式組合,無論它們是與相同還是不同實(shí)施方案或?qū)崿F(xiàn)結(jié)合呈現(xiàn)。一個實(shí)施方案或?qū)崿F(xiàn)的描述不意圖就其它實(shí)施方案和/或?qū)崿F(xiàn)而言是限制性的。此外,本說明書中其它地方描述的任何一個或多個功能、步驟、操作或技術(shù),在可替代實(shí)現(xiàn)中可以與概述中描述的任何一個或多個功能、步驟、操作或技術(shù)組合。因此,上述實(shí)施方案和實(shí)現(xiàn)是舉例說明性而不是限制性的。
當(dāng)與附圖結(jié)合考慮時,上述和進(jìn)一步特征根據(jù)下述詳述將是更明確理解的。在附圖中,相似參考數(shù)字指示相似結(jié)構(gòu)、元件或方法步驟,并且參考數(shù)字最左邊的阿拉伯?dāng)?shù)字指示參考元件首次出現(xiàn)于其中的圖編號(例如,元件160首次出現(xiàn)于圖1中)。然而,所有這些慣例意圖是一般的或舉例說明性的而不是限制性的。圖1是在計算機(jī)控制下的測序儀器和反應(yīng)基底的一個實(shí)施方案的功能方框圖; 圖2是擴(kuò)增子相對于HIV整合酶區(qū)域的位置關(guān)系的一個實(shí)施方案的簡化圖示例子;
圖3是得自多種HIV RNA的序列數(shù)據(jù)針對關(guān)于HIV整合酶區(qū)域的節(jié)段的共有序列比較的一個實(shí)施方案的簡化圖示例子。圖3中提供的序列從上到下如下SEQ ID NO :12,SEQ ID NO :13, SEQ ID N0:14、SEQ ID N0:14、SEQ ID NO :14, SEQ ID NO : 15、SEQ ID NO :14, SEQ ID NO :14, SEQ ID NO :14、SEQ ID NO :14、SEQ ID NO :14、SEQ ID NO :14、SEQ ID NO :14、 SEQ ID NO :13,SEQ ID NO :14,SEQ ID NO : 14、SEQ ID NO : 14、SEQ ID NO :14, SEQ ID NO: 14、和 SEQ ID NO :15 ;和
圖4是用于鑒定與HIV整合酶相關(guān)的變異的方法的一個實(shí)施方案的功能方框圖。發(fā)明詳述
如下文將更詳細(xì)地描述的,目前描述的本發(fā)明的實(shí)施方案包括用于設(shè)計靶特異性序列或?qū)IV變體特異的引物種類,并且使用這些引物用于序列變體的高靈敏度檢測的系統(tǒng)和方法。a. 一般概括
術(shù)語“流動圖(flowgram)”一般指通過SBS法特別是基于焦磷酸鹽的測序方法(也被稱為“焦磷酸測序”)生成的序列數(shù)據(jù)的圖解表示,并且可以更特別地被稱為“程序”。如本文使用的,術(shù)語“讀數(shù)”或“序列讀數(shù)” 一般指得自單核酸模板分子或多個基本上等同的模板核酸分子拷貝群體的完整序列數(shù)據(jù)。如本文使用的,術(shù)語“運(yùn)行”或“測序運(yùn)行” 一般指在一種或多種模板核酸分子的測序操作中執(zhí)行的一系列測序反應(yīng)。如本文使用的,術(shù)語“流動”一般指溶液對包括模板核酸分子的環(huán)境的系列或迭代添加循環(huán),其中溶液可以包括用于加入新生分子中的核苷酸種類或其它試劑,例如可以在測序反應(yīng)中采用的,或用于減少來自核苷酸種類的先前流動循環(huán)的滯后(carryover)或噪聲效應(yīng)的緩沖液或酶。
6
如本文使用的,術(shù)語“流動循環(huán)”一般指其中核苷酸種類在循環(huán)過程中流動一次的順次系列流動(即,流動循環(huán)可以包括以T、A、C、G核苷酸種類次序的順次添加,盡管其它序列組合也視為該定義的部分)。一般地,流動循環(huán)是在循環(huán)之間具有相同流動順序的重復(fù)循環(huán)。如本文使用的,術(shù)語“讀取長度”一般指可以可靠測序的模板分子長度的上限。存在促成系統(tǒng)和/或過程的讀取長度的眾多因素,包括但不限于模板核酸分子中的GC含量程度。如本文使用的,術(shù)語“測試片段”或“TF” 一般指已知序列組成的核酸元件,其可以用于質(zhì)量控制、校正或其它相關(guān)目的?!靶律肿印?一般指通過摻入核苷酸種類通過模板依賴性DNA聚合酶延伸的DNA 鏈,所述核苷酸種類與模板分子中的相應(yīng)核苷酸種類互補(bǔ)。術(shù)語“模板核酸”、“模板分子”、“靶核酸”或“靶分子” 一般指作為由其生成序列數(shù)據(jù)或信息的測序反應(yīng)的對象的核酸分子。如本文使用的,術(shù)語“核苷酸種類”一般指一般摻入新生核酸分子內(nèi)的核酸單體的特性,所述核酸單體包括嘌呤(腺嘌呤、鳥嘌呤)和嘧啶(胞嘧啶、尿嘧啶、胸腺嘧啶)。如本文使用的,術(shù)語“單體重復(fù)”或“同聚物” 一般指包括相同核苷酸種類(即重復(fù)核苷酸種類)的2個或更多個序列位置。如本文使用的,術(shù)語“同質(zhì)延伸”一般指其中基本上等同的模板分子群體的每個成員在反應(yīng)中同質(zhì)地執(zhí)行相同延伸步驟的延伸反應(yīng)關(guān)系或時期。如本文使用的,術(shù)語“完成效率”一般指在給定流動過程中適當(dāng)延伸的新生分子百分比。如本文使用的,術(shù)語“不完全延伸率”一般指未能適當(dāng)延伸超過所有新生分子數(shù)目的新生分子數(shù)目比值。如本文使用的,術(shù)語“基因組文庫”或“鳥槍(shotgun)文庫”一般指衍生自和/或代表生物或個體的整個基因組(即基因組的所有區(qū)域)的分子集合。如本文使用的,術(shù)語“擴(kuò)增子” 一般指選擇的擴(kuò)增產(chǎn)物,例如由聚合酶鏈反應(yīng)或連接酶鏈反應(yīng)技術(shù)產(chǎn)生的那些。如本文使用的,術(shù)語“變體”或“等位基因” 一般指各自編碼相似序列組成的多個種類之一,但彼此具有區(qū)別度。區(qū)別可以包括相關(guān)領(lǐng)域普通技術(shù)人員已知的任何類型的遺傳變異,這包括但不限于單核苷酸多態(tài)性(SNPs)、插入或缺失(插入/缺失事件的組合也被稱為“indels”)、重復(fù)序列(也被稱為串聯(lián)重復(fù))數(shù)目中的差異和結(jié)構(gòu)變異。如本文使用的,術(shù)語“等位基因的頻率”或“等位基因頻率” 一般指由特定變體組成的群體中所有變體的比例。如本文使用的,術(shù)語“關(guān)鍵序列”或“關(guān)鍵元件” 一般指包括已知序列組成的在已知定位(即,一般包括在連接的銜接頭元件中)中與模板核酸分子相關(guān)的核酸序列元件(一般約4個序列位置即TGAC或核苷酸種類的其它組合),其采用作為用于由模板分子生成的序列數(shù)據(jù)的質(zhì)量控制參考。如果序列數(shù)據(jù)在正確定位中包括與關(guān)鍵元件相關(guān)的已知序列組成,則序列數(shù)據(jù)通過質(zhì)量控制。如本文使用的,術(shù)語“關(guān)鍵通過(keypass)”或“關(guān)鍵通過孔” 一般指在反應(yīng)孔中具有已知序列組成的全長核酸測試序列(即,如上文提及的“測試片段”或“TF”)的測序,其中衍生自關(guān)鍵通過測試序列的序列準(zhǔn)確度與已知序列組成比較,并且用于測量測序的準(zhǔn)確度和用于質(zhì)量控制。在一般實(shí)施方案中,測序運(yùn)行中的總孔數(shù)的一部分將是關(guān)鍵通過孔,這在某些實(shí)施方案中可以是按區(qū)域分布的。如本文使用的,術(shù)語“平頭末端”與相關(guān)領(lǐng)域普通技術(shù)人員理解一致地解釋,并且一般指具有以一對互補(bǔ)核苷酸堿基種類終止的末端的線性雙鏈核酸分子,其中一對平頭末端對于彼此連接總是相容的。如本文使用的,術(shù)語“粘性末端”或“突出端”與相關(guān)領(lǐng)域普通技術(shù)人員理解一致地解釋,并且一般指在分子的一條鏈的末端上具有一個或多個不成對核苷酸種類的線性雙鏈核酸分子,其中不成對核苷酸種類可以存在于任一鏈上,并且包括單個堿基位置或多個堿基位置(有時也被稱為“粘著末端”)。如本文使用的,術(shù)語“珠”或“珠基底”一般指具有任何方便大小且由任何數(shù)目的已知材料制造的任何類型的珠,所述已知材料例如纖維素、纖維素衍生物、丙烯酸樹脂、玻璃、 硅膠、聚苯乙烯、明膠、聚乙烯吡咯烷酮、乙烯和丙烯酰胺的共聚物、與二乙烯基苯交聯(lián)的聚苯乙烯等(如例如在Merrifield,Biochemistry 1964,3,1385-1390中描述的)、聚丙烯酰胺、乳膠凝膠、聚苯乙烯、右旋糖酐、橡膠、硅、塑料、硝酸纖維素、天然海綿、硅膠、控制孔玻璃、金屬、交聯(lián)右旋糖酐(例如kphadex )瓊脂糖凝膠(S^harose )、和本領(lǐng)域技術(shù)人員已知的其它固相珠載體。下文一般描述了與樣品制備和處理、序列數(shù)據(jù)生成、和序列數(shù)據(jù)分析相關(guān)的系統(tǒng)和方法的某些示例性實(shí)施方案,其中一些或所有順應(yīng)用于與目前描述的本發(fā)明的實(shí)施方案一起使用。特別地,描述了用于制備模板核酸分子、擴(kuò)增模板分子、生成靶特異性擴(kuò)增子和 /或基因組文庫的系統(tǒng)和方法,測序方法和實(shí)現(xiàn),和計算機(jī)系統(tǒng)的示例性實(shí)施方案。在一般實(shí)施方案中,衍生自實(shí)驗(yàn)或診斷樣品的核酸分子必須由其原始形式制備且處理成順應(yīng)高流通量測序的模板分子。處理方法可以在應(yīng)用之間不同,導(dǎo)致包括各種特征的模板分子。例如,在高流通量測序的某些實(shí)施方案中,優(yōu)選生成具有下列序列或讀取長度的模板分子,所述序列或讀取長度是至少具體測序方法可以準(zhǔn)確地產(chǎn)生關(guān)于其的序列數(shù)據(jù)的長度。在呈現(xiàn)的例子中,長度可以包括約25-30個堿基對、約50-100個堿基對、約200-300 個堿基對、約350-500個堿基對、超過500個堿基對、或順應(yīng)具體測序應(yīng)用的其它長度。在某些實(shí)施方案中,來自樣品例如基因組樣品的核酸使用本領(lǐng)域普通技術(shù)人員已知的許多方法進(jìn)行斷裂。在優(yōu)選實(shí)施方案中,方法隨機(jī)斷裂(即不選擇特定序列或區(qū)域)核酸,且可以包括被稱為霧化或超聲處理方法的方法。然而,應(yīng)當(dāng)理解可以采用其它斷裂方法例如使用限制性核酸內(nèi)切酶的消化,用于斷裂目的。同樣在呈現(xiàn)的例子中,某些處理方法可以采用本領(lǐng)域已知的大小選擇方法,以選擇性分離所需長度的核酸片段。此外,在某些實(shí)施方案中優(yōu)選使另外的功能元件與每個模板核酸分子結(jié)合??梢圆捎糜糜诟鞣N功能的元件,包括但不限于用于擴(kuò)增和/或測序方法的引物序列,質(zhì)量控制元件,編碼例如與起源或患者樣品的各種關(guān)系的獨(dú)特標(biāo)識符(也被稱為多路標(biāo)識符或 “MID”),或其它功能元件。所述功能元件中的一些或所有可以組合到銜接頭元件內(nèi),所述銜接頭元件在特定處理步驟中與核苷酸序列偶聯(lián)。例如,某些實(shí)施方案可以使引發(fā)序列元件或包括互補(bǔ)序列組成的區(qū)域與用于擴(kuò)增和/或測序的引物序列結(jié)合。進(jìn)一步地,相同元件可以用于可以被稱為“鏈選擇”和使核酸分子與固相基底固定的那種元件。在某些實(shí)施方案中,2組引發(fā)序列區(qū)域(下文被稱為引發(fā)序列A和引發(fā)序列B)可以用于鏈選擇,其中僅選擇具有引發(fā)序列A的一個拷貝和引發(fā)序列B的一個拷貝的單鏈且包括所述單鏈作為制備樣品。在可替代實(shí)施方案中,銜接頭元件的設(shè)計特征消除了對鏈選擇的需要。相同引發(fā)序列區(qū)域可以用于擴(kuò)增和固定方法中,其中例如引發(fā)序列B可以固定在固體基底上,并且擴(kuò)增產(chǎn)物由其延伸。用于斷裂、鏈選擇以及功能元件和銜接頭添加的樣品處理的另外例子在下述中描述于 2004 年 1 月 28 日提交,名稱為 “Method for pr印aring single-stranded DNA libraries”的美國專利申請序列號10/767, 894 ;于2008年5月29日提交,名稱為“System and Method for Identification of Individual Samples from a Multiplex Mixture,, 的美國專利申請序列號12/156J42 ;和于2009年2月23日提交,名稱為“System and Method for Improved Processing of Nucleic Acids for Production of Sequencable Libraries”的美國專利申請序列號12/380,139,其各自為了所有目的在此整體引入本文作為參考。描述了用于執(zhí)行模板核酸分子擴(kuò)增以生成基本上等同拷貝群體的系統(tǒng)和方法的各種例子。對于普通技術(shù)人員顯而易見的是,當(dāng)一個或多個核苷酸種類摻入與模板分子拷貝結(jié)合的每個新生分子內(nèi)時,在SBS的某些實(shí)施方案中希望生成每個核酸元件的許多拷貝,以生成更強(qiáng)的信號。存在用于生成核酸分子拷貝的本領(lǐng)域已知的許多技術(shù),例如使用被稱為細(xì)菌載體、“滾環(huán)”擴(kuò)增(在上文引入作為參考的美國專利號6,274,320和7,211,390 中描述)和聚合酶鏈反應(yīng)(PCR)法的方法的擴(kuò)增,所述技術(shù)各自可應(yīng)用于與目前描述的本發(fā)明一起使用。特別順應(yīng)高流通量應(yīng)用的一種PCR技術(shù)包括被稱為乳狀液PCR法(也被稱為 emPCR 法)的技術(shù)。乳狀液PCR法的一般實(shí)施方案包括制備2種不能混合物質(zhì)的穩(wěn)定乳狀液,所述2 種不能混合物質(zhì)產(chǎn)生可以在其內(nèi)發(fā)生反應(yīng)的水滴。特別地,順應(yīng)在PCR法中使用的乳狀液的水滴可以包括作為小滴懸浮或分散于另一種流體、例如疏水流體(也被稱為連續(xù)相)內(nèi)的第一種流體,例如基于水的流體(也被稱為間斷相),所述疏水流體一般包括一些類型的油。 可以采用的油的例子包括但不限于,礦物油、基于硅酮的油或氟化油。進(jìn)一步地,某些乳狀液實(shí)施方案可以采用作用于穩(wěn)定乳狀液的表面活性劑,其對于特異性處理方法例如PCR可以特別有用。表面活性劑的某些實(shí)施方案可以包括一種或多種硅酮或氟化表面活性劑。例如,可以采用一種或多種非離子型表面活性劑,其包括但不限于,失水山梨醇單油酸酯(也被稱為Span 80)、聚氧乙烯失水山梨醇單油酸酯(也被稱為Tween 80),或在某些優(yōu)選實(shí)施方案中,聚二甲基硅氧烷共聚醇(也被稱為Abil EM90)、聚硅氧烷、多烷基聚醚共聚物、聚甘油酯、泊洛沙姆和PVP/十六烷共聚物(也被稱為 Unimer U-151 ),或在更優(yōu)選的實(shí)施方案中,在環(huán)戊硅氧烷中的高分子量硅酮聚醚(可從Dow Corning獲得的也被稱為DC 5225C)。乳狀液的小滴也可以被稱為區(qū)室、微膠囊、微型反應(yīng)器、微環(huán)境或相關(guān)領(lǐng)域中通常使用的其它名稱。依賴于乳狀液組分或組合物的組成、其中包含的內(nèi)容物、和采用的形成技術(shù),水滴在大小方面可以變動。所述乳狀液產(chǎn)生可以在其內(nèi)執(zhí)行化學(xué)反應(yīng)例如PCR的微環(huán)境。例如,可以將模板核酸和執(zhí)行所需PCR反應(yīng)所需的所有試劑封裝和化學(xué)隔離在乳狀液的小滴中。另外的表面活性劑或其它穩(wěn)定劑可以在某些實(shí)施方案中采用,以如上所述促進(jìn)小滴的另外穩(wěn)定性。PCR法一般的熱循環(huán)操作可以使用小滴執(zhí)行,以擴(kuò)增封裝的核酸模板, 導(dǎo)致生成包括模板核酸的許多基本上等同拷貝的群體。在某些實(shí)施方案中,小滴內(nèi)的群體可以被稱為“克隆分離的”、“區(qū)室化的”、“隔離的”、“封裝的”、或“局限的”群體。同樣在呈現(xiàn)的例子中,所述小滴中的一些或所有可以進(jìn)一步封裝固體基底,例如用于附著模板和模板的擴(kuò)增拷貝、與模板互補(bǔ)的擴(kuò)增拷貝、或其組合的珠。進(jìn)一步地,固體基底可以使得能夠附著其它類型的核酸、試劑、標(biāo)記或其它目的分子。對于目前描述的本發(fā)明有用的乳狀液的實(shí)施方案可以包括使得所述化學(xué)反應(yīng)能夠以大量平行方式執(zhí)行的極高密度小滴或微膠囊。用于擴(kuò)增的乳狀液的另外例子及其用于測序應(yīng)用的用途在美國專利申請序列號10/861,930 ; 10/866, 392 (現(xiàn)在的美國專利號 7,622, 280);10/767,899 ; 11/045, 678中描述,其各自為了所有目的在此整體引入本文作為參考。此外,對于目前描述的本發(fā)明可以采用生成用于測序的靶特異性擴(kuò)增子的實(shí)施方案,其包括使用特異性核酸引物組以擴(kuò)增來自包括靶核酸的樣品的一個或多個選擇靶區(qū)域。進(jìn)一步地,樣品可以包括已知或懷疑包含序列變體的核酸分子群體,并且引物可以用于擴(kuò)增且提供樣品中的序列變體分布的了解。例如,可以執(zhí)行通過特異性擴(kuò)增和測序核酸樣品中的多重等位基因而鑒定序列變體的方法。首先對核酸實(shí)施通過一對PCR引物的擴(kuò)增, 所述PCR引物設(shè)計為擴(kuò)增目的區(qū)域周圍的區(qū)域或核酸群體共同的節(jié)段。PCR反應(yīng)產(chǎn)物(第一擴(kuò)增子)各自隨后在分開的反應(yīng)容器例如上文描述的基于乳狀液的容器中進(jìn)一步個別擴(kuò)增。測序所得到的擴(kuò)增子(在本文中被稱為第二擴(kuò)增子),其各自衍生自第一個擴(kuò)增子群體的一個成員,并且來自不同乳狀液PCR擴(kuò)增子(即第二擴(kuò)增子)的序列集合用于測定等位基因頻率。所述靶特異性擴(kuò)增和測序方法的一些優(yōu)點(diǎn)包括比先前達(dá)到的更高水平的靈敏度。進(jìn)一步地,采用高流通量測序使用儀器的實(shí)施方案,如例如采用由454 Life Sciences Corporation提供的被稱為PicoTiterPlate 陣列(有時也被稱為PTP 板或陣列)孔的儀器的實(shí)施方案,所述方法可以用于生成關(guān)于超過100,000、超過300,000、超過500,000、或超過1,000,000個核酸區(qū)域/運(yùn)行或?qū)嶒?yàn)的序列組成,并且可以至少部分依賴于用戶優(yōu)先選擇,例如通過使用墊圈等成為可能的泳道配置。此外,所述方法提供了低豐度等位基因的檢測靈敏性,這可以代表或更少的等位基因變體。該方法的另一個優(yōu)點(diǎn)包括生成包括分析區(qū)域序列的數(shù)據(jù)。重要的是,無需具有待分析基因座的序列的先前了解。用于測序的靶特異性擴(kuò)增子的另外例子在下述中描述于2005年4月12日提交、 名禾爾為"Methods for determining sequence variants using ultra-deep sequencing" 的美國專利申請序列號11/104,781 ;于2008年3月14日提交、名稱為“System and Method for Detection of HIV Drug Resistant Variants" ^ PCT ^M^lmFfHj^ US 2008/003424 ;和于 2009 年 6 月 17 日提交、名稱為"System and Method for Detection of HIV Tropism Variants”的美國專利申請序列號12/456,5 ,其各自為了所有目的在此整體引入本文作為參考。進(jìn)一步地,測序?qū)嵤┓桨缚梢园⊿anger型技術(shù)、一般被稱為雜交測序(SBH) 的技術(shù)、連接測序(SBL)、或摻入測序(SBI)的技術(shù)。進(jìn)一步地,測序技術(shù)可以包括被稱為polony測序技術(shù);納米孔、波導(dǎo)管和其它單分子檢測技術(shù);或可逆終止子技術(shù)的技術(shù)。如上所述,優(yōu)選技術(shù)可以包括合成法測序。例如,某些SBS實(shí)施方案對基本上等同的核酸模板拷貝的群體測序且一般采用一種或多種寡核苷酸引物,其設(shè)計為對樣品模板分子或與模板分子附著的一個或多個銜接頭的預(yù)定、互補(bǔ)位置退火。在核酸聚合酶的存在下,引物/模板復(fù)合物與核苷酸種類一起存在。如果核苷酸種類與對應(yīng)于樣品模板分子上的序列位置的核酸種類互補(bǔ),所述序列位置與寡核苷酸引物的3’末端直接相鄰,那么聚合酶將用核苷酸種類延伸引物。可替代地,在某些實(shí)施方案中,引物/模板復(fù)合物與多個目的核苷酸種類(一般為A、G、C和T)同時存在,并且摻入在樣品模板分子上的相應(yīng)序列位置互補(bǔ)的核苷酸種類, 所述相應(yīng)序列位置與寡核苷酸引物的3’末端直接相鄰。在所述實(shí)施方案的任一中,核苷酸種類可以在化學(xué)上封閉(例如在3’ -0位置上),以阻止進(jìn)一步延伸,并且需要在下一輪合成前解封閉。還應(yīng)當(dāng)理解給新生分子末端添加核苷酸種類的過程與上文描述的用于給引物末端添加的過程基本上相同。如上所述,核苷酸種類的摻入可以通過本領(lǐng)域已知的各種方法進(jìn)行檢測,例如通過檢測焦磷酸鹽(PPi)的釋放(例子在美國專利號6,210,891 ;6, 258,568 ;和6,828,100中描述,其各自為了所有目的在此整體引入本文作為參考),或經(jīng)由與核苷酸結(jié)合的可檢測標(biāo)記??蓹z測標(biāo)記的某些例子包括但不限于質(zhì)量標(biāo)記和熒光或化學(xué)發(fā)光標(biāo)記。在一般實(shí)施方案中,例如通過洗滌去除未摻入的核苷酸。進(jìn)一步地,在某些實(shí)施方案中,可以對未摻入的核苷酸實(shí)施酶促降解,如例如使用腺苷三磷酸雙磷酸酶或焦磷酸酶的降解,如于2008年6 月 27 日提交、名稱為"System and Method for Adaptive Reagent Control in Nucleic Acid Sequencing”的美國專利申請序列號12/215,455 ;和于2009年1月29日提交、名稱為"System and Method for Improved Signal Detection in Nucleic Acid Sequencing,, 的12/322,284中所述;其各自為了所有目的在此整體引入本文作為參考。在其中使用可檢測標(biāo)記的實(shí)施方案中,它們在隨后合成循環(huán)前一般必須被滅活 (例如通過化學(xué)切割或光漂白)。如上所述,隨后可以用另一個核苷酸種類或多個目的核苷酸種類查詢模板/聚合酶復(fù)合物中的下一個序列位置。核苷酸添加、延伸、信號采集和洗滌的重復(fù)循環(huán)導(dǎo)致模板鏈的核苷酸序列的測定。作為本實(shí)例的繼續(xù),大量基本上等同的模板分子或基本上等同的模板分子群體(例如103、104、IO5UO6或IO7個分子)一般在任何一個測序反應(yīng)中同時進(jìn)行分析,以便達(dá)到對于可靠檢測足夠強(qiáng)的信號。此外,在某些實(shí)施方案中,通過采用可以被稱為“配對末端”測序策略的策略來改善測序過程的讀取長度容量和數(shù)量,可以是有利的。例如,測序方法的某些實(shí)施方案對可以由其生成高質(zhì)量和可靠讀數(shù)的分子總長度具有限制。換言之,可靠讀取長度的序列位置總數(shù)目可以不超過25、50、100或500個堿基,這依賴于所采用的測序?qū)嵤┓桨?。通過分開測序分子的每個末端(有時被稱為“標(biāo)記”末端),所述分子包括通過接頭序列在中心連接的每個末端上的原始模板核酸分子的片段,配對末端測序策略延長可靠讀取長度。模板片段的原始位置關(guān)系是已知的,并且因此來自序列讀數(shù)的數(shù)據(jù)可以重組為具有更長的高質(zhì)量讀取長度的單個讀數(shù)。配對末端測序?qū)嵤┓桨傅倪M(jìn)一步例子在名稱為“l(fā)aired end sequencing" 的美國專利號7, 601,499 ;和于2009年1月28日提交、名稱為"Paired end sequencing” 的美國專利申請序列號12/322,119中描述,其各自為了所有目的在此整體引入本文作為參考。
SBS器械的某些例子可以實(shí)現(xiàn)上文描述的一些或所有方法,并且可以包括一種或多種檢測裝置,例如電荷耦合裝置(即CCD照相機(jī))或共焦型構(gòu)造、微流體室或流動池、反應(yīng)基底和/或泵和流動閥。考慮基于焦磷酸鹽測序的例子,器械的實(shí)施方案可以采用化學(xué)發(fā)光檢測策略,其產(chǎn)生固有低水平的本底噪聲。在某些實(shí)施方案中,用于測序的反應(yīng)基底可以包括由纖維光學(xué)面板形成的、如上所述可從454 Life Sciences Corporation獲得的被稱為PTP 陣列的基底,所述纖維光學(xué)面板進(jìn)行酸蝕刻,以獲得成百上千或更多個極小的孔,各自使得能夠容納基本上等同的模板分子群體(即某些優(yōu)選實(shí)施方案包括在70 χ 75mm PTP 陣列上以35 μ m孔與孔間距的約3. 3百萬個孔)。在某些實(shí)施方案中,基本上等同的模板分子的每個群體可以排列在固體基底例如珠上,其各自可以排列在所述孔之一中。例如,器械可以包括試劑遞送元件用于給 PTP板夾提供流動試劑,以及使得能夠收集由PTP板上的每個孔發(fā)出的光的光子的CCD型檢測裝置。包括用于改善的信號識別特征的反應(yīng)基底的例子在于2005年8月30日提交、 名稱為 “THIN-FILM COATED MICROffELL ARRAYS AND METHODS OF MAKING SAME” 的美國專利申請序列號11/215,458中描述,其為了所有目的在此整體引入本文作為參考。用于執(zhí)行 SBS型測序和焦磷酸鹽測序的器械和方法的進(jìn)一步例子在美國專利號7,323,305和美國專利申請序列號11/195,254中描述,其均在上文引入作為參考。此外,可以采用使一個或多個樣品制備過程自動化的系統(tǒng)和方法,例如上文描述的emPCR 過程。例如,自動化系統(tǒng)可以用于提供有效溶液用于生成乳狀液用于emPCR處理, 執(zhí)行PCR熱循環(huán)操作,且富集成功制備的核酸分子群體用于測序。自動化樣品制備系統(tǒng)的例子在于 2005 年 1 月 28 日提交、名稱為“Nucleic acid amplification with continuous flow emulsion”的美國專利申請序列號11/045,678中描述,其為了所有目的在此整體引入本文作為參考。此外,目前描述的本發(fā)明實(shí)施方案的系統(tǒng)和方法可以包括某些設(shè)計、分析或其它操作的實(shí)現(xiàn),其使用貯存用于在計算機(jī)系統(tǒng)上執(zhí)行的計算機(jī)可讀介質(zhì)。例如,下文詳細(xì)描述了幾個實(shí)施方案,以處理檢測到的信號和/或分析使用SBS系統(tǒng)和方法生成的數(shù)據(jù),其中處理和分析實(shí)施方案可在計算機(jī)系統(tǒng)上實(shí)現(xiàn)。用于與目前描述的本發(fā)明一起使用的計算機(jī)系統(tǒng)的示例性實(shí)施方案可以包括任何類型的計算機(jī)平臺,例如工作站、個人計算機(jī)、服務(wù)器或任何其它目前或未來的計算機(jī)。 然而,本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)理解,如本文描述的前述計算機(jī)平臺特別配置為執(zhí)行本發(fā)明的專門操作,并且不考慮一般目的計算機(jī)。計算機(jī)一般包括已知組件,例如處理器、操作系統(tǒng)、系統(tǒng)存儲器、記憶儲存裝置、輸入-輸出控制器、輸入-輸出裝置和顯示裝置。相關(guān)領(lǐng)域普通技術(shù)人員還應(yīng)當(dāng)理解,存在許多可能的計算機(jī)配置和組件,并且還可以包括高速緩沖存儲器、數(shù)據(jù)備份單元和許多其它裝置。顯示裝置可以包括提供視覺信息的顯示裝置,這種信息一般可以在邏輯和/或物理上組構(gòu)為像素陣列。還可以包括界面控制器,其可以包括用于提供輸入和輸出界面的各種已知或未來軟件程序中的任一種。例如,界面可以包括一般被稱為“圖形用戶界面”(通常被稱為GUI's)的界面,其給用戶提供一種或多種圖解表示。界面一般使得能夠使用相關(guān)領(lǐng)域普通技術(shù)人員已知的選擇或輸入方式來接受用戶輸入。在相同或可替代實(shí)施方案中,在計算機(jī)上的應(yīng)用程序可以采用包括被稱為“命令行接口”(通常被稱為CLI’ s)的那種界面。CLI’ s 一般在應(yīng)用程序和用戶之間提供基于文本的界面。一般地,命令行接口通過顯示裝置呈現(xiàn)作為文本行的輸出且接受輸入。例如,某些實(shí)現(xiàn)可以包括被稱為“外殼程序”的那種,例如相關(guān)領(lǐng)域普通技術(shù)人員已知的Unix Siells、或采用面向?qū)ο笮统绦蝮w系結(jié)構(gòu)例如Microsoft . NET框架的Microsoft Windows Powershell ο相關(guān)領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)理解,界面可以包括一種或多種⑶I’ s、CLI’ s或其組
Π O處理器可以包括商購可得的處理器,例如由htel Corporation制造的 Centrino 、Core 2、Itanium 或 Pentium 處理器,由 Sun Microsystems 制造的 SPARC 處理器,由AMD公司制造的Athalon 或Opteron 處理器,或它可以是可獲得或?qū)⒆兊每色@得的其它處理器之一。處理器的某些實(shí)施方案可以包括被稱為多核處理器和/或使得能夠在單或多核配置中采用平行處理技術(shù)的那種。例如,多核體系結(jié)構(gòu)一般包括2個或更多個處理器“執(zhí)行核”。在呈現(xiàn)的例子中,每個執(zhí)行核可以作為獨(dú)立處理器執(zhí)行,這使得多線程平行執(zhí)行成為可能。此外,相關(guān)普通技術(shù)人員應(yīng)當(dāng)理解,處理器可以配置為一般被稱為32或 64位體系結(jié)構(gòu)的那種,或目前已知的其它體系結(jié)構(gòu)配置或可以在未來開發(fā)的那種。處理器一般執(zhí)行操作系統(tǒng),這可以是例如來自Microsoft Corporation的 Windows 型操作系統(tǒng)(例如 Windows XP 或 Windows Vista );來自 Apple Computer Corp. 的 Mac OS X 操作系統(tǒng)(例如 Mac OS X vlO. 5 “Leopard” 或“Snow Leopard” 操作系統(tǒng));可從許多廠商獲得的Unix 或Linux型操作系統(tǒng)或被稱為開放源的那種;另一種或未來的操作系統(tǒng);或其某些組合。操作系統(tǒng)以眾所周知的方式與固件和硬件對接,并且促進(jìn)處理器協(xié)調(diào)和執(zhí)行各種計算機(jī)程序的功能,所述計算機(jī)程序可以以各種編程語言書寫。一般與處理器協(xié)作的操作系統(tǒng)協(xié)調(diào)且執(zhí)行計算機(jī)的其它組件的功能。操作系統(tǒng)還提供調(diào)度、輸入-輸出控制、歸檔和數(shù)據(jù)管理、存儲管理、以及通信控制和相關(guān)服務(wù),全部依照已知技術(shù)。系統(tǒng)存儲器可以包括各種已知或未來記憶儲存裝置中的任一種。例子包括任何通常可獲得的隨機(jī)存取存儲器(RAM)、磁性介質(zhì)例如駐留硬盤或磁帶、光學(xué)介質(zhì)例如讀寫光盤、或其它記憶儲存裝置。記憶儲存裝置可以包括各種已知或未來裝置中的任一種,包括光盤驅(qū)動器、磁帶驅(qū)動器、可移動硬盤驅(qū)動器、USB或閃存驅(qū)動器、或軟盤驅(qū)動器。此種類型的記憶儲存裝置一般從程序儲存介質(zhì)(未顯示)中讀取和/或向程序儲存介質(zhì)寫入,所述程序儲存介質(zhì)例如分別地光盤、磁帶、可移動硬盤、USB或閃存驅(qū)動器或軟盤。這些程序儲存介質(zhì)中的任一種或目前在使用中的其它介質(zhì)或可能以后開發(fā)的介質(zhì),可以視為計算機(jī)程序產(chǎn)物。如應(yīng)當(dāng)理解的,這些程序儲存介質(zhì)一般儲存計算機(jī)軟件程序和/或數(shù)據(jù)。計算機(jī)軟件程序也稱為計算機(jī)控制邏輯,一般儲存于與記憶儲存裝置結(jié)合使用的系統(tǒng)存儲器和/或程序儲存裝置中。在某些實(shí)施方案中,描述了計算機(jī)程序產(chǎn)物,其包括具有儲存于其中的控制邏輯 (計算機(jī)軟件程序,包括程序編碼)的計算機(jī)可用介質(zhì)??刂七壿嫯?dāng)由處理器執(zhí)行時,促使處理器執(zhí)行本文描述的功能。在其它實(shí)施方案中,某些功能主要使用例如硬件狀態(tài)機(jī)在硬件中實(shí)現(xiàn)。為了執(zhí)行本文描述的功能的硬件狀態(tài)機(jī)實(shí)現(xiàn)對于相關(guān)領(lǐng)域技術(shù)人員將是顯而易見的。輸入-輸出控制器可以包括用于接受且處理來自用戶的信息的各種已知裝置中的任一種,所述用戶無論是人還是機(jī)器,無論是本地還是遠(yuǎn)程的。此類裝置包括例如調(diào)制解調(diào)卡、無線卡、網(wǎng)絡(luò)接口卡、聲卡或用于各種已知輸入裝置中的任一種的其它類型控制器。 輸出控制器可以包括用于各種已知顯示裝置中的任一種的控制器,用于給用戶呈遞信息, 所述用戶無論是人還是機(jī)器,無論是本地還是遠(yuǎn)程的。在目前描述的實(shí)施方案中。計算機(jī)的功能元件經(jīng)由系統(tǒng)總線彼此通信。計算機(jī)的某些實(shí)施方案可以使用網(wǎng)絡(luò)或其它類型的遠(yuǎn)程通信與某些功能元件通信。如對于相關(guān)領(lǐng)域技術(shù)人員將是顯而易見的,如果在軟件中實(shí)現(xiàn),那么儀器控制和/ 或數(shù)據(jù)處理應(yīng)用程序可以裝載到系統(tǒng)存儲器和/或記憶儲存裝置內(nèi)且由其執(zhí)行。所有或部分儀器控制和/或數(shù)據(jù)處理應(yīng)用程序還可以位于只讀存儲器或記憶儲存裝置的相似裝置中,此類裝置不需要儀器控制和/或數(shù)據(jù)處理應(yīng)用程序首先通過輸入-輸出控制器裝載。相關(guān)領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,儀器控制和/或數(shù)據(jù)處理應(yīng)用程序或其部分可以通過處理器以已知方式裝載到系統(tǒng)存儲器、或高速緩沖存儲器或兩者中,如對于執(zhí)行有利的。此外,計算機(jī)可以包括一個或多個庫文件、實(shí)驗(yàn)數(shù)據(jù)文件、和儲存于系統(tǒng)存儲器中的互聯(lián)網(wǎng)客戶程序。例如,實(shí)驗(yàn)數(shù)據(jù)可以包括與一個或多個實(shí)驗(yàn)或測定相關(guān)的數(shù)據(jù),例如檢測到的信號值、或與一個或多個SBS實(shí)驗(yàn)或過程相關(guān)的其它值。另外,因特網(wǎng)客戶程序可以包括使得能夠使用網(wǎng)絡(luò)訪問在另一個計算機(jī)上的遠(yuǎn)程服務(wù)的應(yīng)用程序,并且可以例如包括一般被稱為“網(wǎng)絡(luò)瀏覽器”的那種。在呈現(xiàn)的例子中,某些通常采用的網(wǎng)絡(luò)瀏覽器包括可從 Microsoft Corporation 獲得的 Microsoft Internet Explorer 7、可從 Mozilla Corporation 獲得的 Mozilla Firefox 2、可從 Apple Computer Corp.獲得的 Safari 1. 2、可從Google Corporation獲得的Google Chrome、和本領(lǐng)域目前已知或未來待開發(fā)的其它類型網(wǎng)絡(luò)瀏覽器。此外,在相同或其它實(shí)施方案中,因特網(wǎng)客戶程序可以包括或可以是使得能夠經(jīng)由網(wǎng)絡(luò)訪問遠(yuǎn)程信息的專門軟件應(yīng)用程序的元件,例如用于生物學(xué)應(yīng)用的數(shù)據(jù)處理應(yīng)用程序。網(wǎng)絡(luò)可以包括本領(lǐng)域普通技術(shù)人員眾所周知的許多各種類型網(wǎng)絡(luò)中的一種或多種。例如,網(wǎng)絡(luò)可以包括采用通常被稱為TCP/IP協(xié)議套以通信的局域網(wǎng)或廣域網(wǎng)。網(wǎng)絡(luò)可以包括包含互聯(lián)計算機(jī)網(wǎng)絡(luò)的全世界系統(tǒng)的網(wǎng)絡(luò),其通常被稱為因特網(wǎng),或還可以包括各種內(nèi)聯(lián)網(wǎng)體系結(jié)構(gòu)。相關(guān)領(lǐng)域普通技術(shù)人員還應(yīng)當(dāng)理解,網(wǎng)絡(luò)環(huán)境中的一些用戶可以優(yōu)先采用一般被稱為“防火墻”(有時也被稱為數(shù)據(jù)包過濾(Packet Filters)或邊界保護(hù)裝置 (Border Protection Devices))的那種,以控制去往和來自硬件和/或軟件系統(tǒng)的信息流量。例如,防火墻可以包括硬件或軟件元件或其某些組合,并且一般設(shè)計為實(shí)施由用戶例如網(wǎng)絡(luò)管理員等放置在合適位置的安全策略。b. M激漏殺方案
如上所述,本發(fā)明的實(shí)施方案涉及檢測來自樣品的HIV整合酶序列變體的方法,和通過使變體序列組成與整合酶藥物抗性和/或敏感性類型相關(guān),檢測抗性和/或敏感性與目前的靶向HIV整合酶功能的藥物關(guān)聯(lián)的方法。普通技術(shù)人員應(yīng)當(dāng)理解,關(guān)聯(lián)可以包括檢測到的變體與已知和藥物抗性和/或敏感性相關(guān)的變異的診斷關(guān)聯(lián),以及檢測到的變體與樣品的藥物抗性和/或敏感性表型的發(fā)現(xiàn)關(guān)聯(lián)。靶向可替代HIV區(qū)域例如逆轉(zhuǎn)錄酶區(qū)域和用于決定向性類型的區(qū)域的其它發(fā)明,在于2008年3月14日提交、名稱為“SYSTEM AND METHOD FOR DETECTION OF HIV DRUG RESISTANT VARIANTS” 的 PCT 專利申請序列號 US2008/003424 中;和于 2009 年 6 月 17 日提交、名稱為“SYSTEM AND METHOD FOR DETECTION OF HIV TROPISM VARIANTS”的美國專利申請序列號12/456,5 中描述,其各自在上文引入
作為參考。本發(fā)明的實(shí)施方案包括靶向已知與藥物抗性和/或敏感性類型相關(guān)的HIV整合酶區(qū)域的兩階段PCR技術(shù)(S卩,如上所述產(chǎn)生第一和第二擴(kuò)增子),加上平行產(chǎn)生來自數(shù)千個病毒顆粒的序列信息的測序技術(shù),這使得能夠鑒定HIV整合酶類型的出現(xiàn)(基于整合酶類型與樣品中檢測到的變體序列組成的相關(guān)),甚至在樣品中以低頻率出現(xiàn)的那些類型。事實(shí)上,本發(fā)明的實(shí)施方案可以檢測到包含以非計量等位基因量的HIV病毒顆粒的樣品中存在的整合酶序列變體,如例如以大于50%、小于50%、小于25%、小于10%、小于5%或小于
存在的HIV整合酶變體。所述實(shí)施方案使得以快速、可靠和節(jié)省成本方式的此類鑒定成為可能?!愕?,可以采用使一個或多個過程步驟自動化的一種或多種儀器元件。例如,測序方法的實(shí)施方案可以使用使一些或所有過程步驟自動化且執(zhí)行的儀器執(zhí)行。圖1提供了測序儀器100的舉例說明性例子,其包括光學(xué)子系統(tǒng)和流體子系統(tǒng),用于測序反應(yīng)的執(zhí)行和在反應(yīng)基底105上發(fā)生的數(shù)據(jù)截獲。用于執(zhí)行測序過程的測序儀器100的實(shí)施方案可以包括流體子系統(tǒng)中的各種流體組分、光學(xué)系統(tǒng)中的各種光學(xué)組件、以及在圖1中未舉例說明的另外組件,其可以包括微處理器和/或用于某些功能的局部控制的微控制器組件。在某些實(shí)施方案中,可以任選制備樣品用于以自動化或部分自動化的形式測序,其使用配置為執(zhí)行關(guān)于使用儀器100測序的一些或所有必需準(zhǔn)備的樣品制備儀器180。進(jìn)一步地,如圖 1中舉例說明的,測序儀器100可以與一種或多種外部計算機(jī)組件可操作地連接,所述外部計算機(jī)組件例如可以例如執(zhí)行系統(tǒng)軟件或固件例如應(yīng)用程序135的計算機(jī)130,所述應(yīng)用程序135可以提供一種或多種儀器例如測序儀器100或樣品制備儀器180的指導(dǎo)控制,和 /或某些數(shù)據(jù)分析功能。計算機(jī)130可以另外經(jīng)由網(wǎng)絡(luò)150與其它計算機(jī)或服務(wù)器可操作地連接,所述網(wǎng)絡(luò)150可以使得能夠遠(yuǎn)程操作儀器系統(tǒng)和將大量數(shù)據(jù)輸出至能夠儲存和處理的系統(tǒng)。在呈現(xiàn)的例子中,測序儀器100和/或計算機(jī)130可以包括上文一般描述的實(shí)施方案的一些或所有組件和特征。在本發(fā)明的一個方面,根據(jù)超過1,300種已知HIV-I pol序列的比對設(shè)計靶特異性引物,其設(shè)計為以極端低偏差方式生成擴(kuò)增子用于直接在所述測序應(yīng)用中使用。已知HIV序列的比對可以使用相關(guān)領(lǐng)域普通技術(shù)人員已知的方法執(zhí)行。例如,眾多序列比對方法、算法和應(yīng)用程序是本領(lǐng)域可獲得的,包括但不限于Smith-Waterman算法(Smith, Τ. F. , Waterman, Μ. S. (1981) . Identification of Common Molecular Subsequences, J. Mol. Biol. 147 :195-197,其為了所有目的在此整體引入本文作為參考)、BLAST算法 (Altschul, S. F. , Gish, W. , Miller, W. , Myers, Ε. W. & Lipman,D. J. (1990) Basic local alignment search tool. J. Mol. Biol. 215:403-410,其為了所有目的在此整體引入本文作為參考)、禾口 Clustal (Thompson, J. D. , Gibson, Τ. J. , Plewniak, F. , Jeanmougin, F., Higgins, D. G. (1997). The ClustalX windows interface :flexible strategies for multiple sequence alignment aided by quality analysis tools. Nucleic Acids Res. 25:4876-4882,其為了所有目的在此整體弓|入本文作為參考)。序列成為單個序列的比對提供了 HIV序列群體的最頻繁序列組成的共有區(qū)。此外在呈現(xiàn)的例子中,軟件應(yīng)用程序可以
15劃分用于整合酶分型的目的區(qū)域,以及用于針對比對的共有序列的引物序列的靶區(qū)域。目的區(qū)域包括已知對突變敏感的區(qū)域,并且可以促成整合酶抑制劑的病毒抗性。隨后可以設(shè)計針對共有序列區(qū)域的引物組,所述共有序列區(qū)域比已知突變易感性的區(qū)域更保守(即更不可能突變)。此外,引物設(shè)計包括另外的考慮,例如就用于測定擴(kuò)增產(chǎn)物序列組成的測序技術(shù)的讀取長度容量而言,所得到的擴(kuò)增產(chǎn)物的長度。本文公開的引物組針對共有序列區(qū)域進(jìn)行設(shè)計,所述共有序列區(qū)域比已知突變易感性的區(qū)域更保守(即更不可能突變)。具有低突變率的靶序列區(qū)域用于引物設(shè)計的優(yōu)點(diǎn)包括可靠地使用設(shè)計引物而沒有會使得引物無法結(jié)合的靶區(qū)域上的變異所引起的失敗的實(shí)質(zhì)危險的能力,以及使用相同引物組用于多個進(jìn)化枝的可能性。此外,本領(lǐng)域普通技術(shù)人員理解,在可以被視為共有序列的“保守”區(qū)內(nèi)的特定位置在其組成方面仍可以是可變的且被視為“簡并”位置。在某些優(yōu)選實(shí)施方案中,用于引物設(shè)計的參數(shù)包括在引物組成中的位置上插入簡并堿基——在其中在用于測定共有序列的多重序列比對中在那個位置上存在小于98%頻率的核苷酸種類的情況下。此外,影響結(jié)合靶區(qū)域的選擇和引物組成的其它參數(shù)包括使簡并位置限制于僅具有2個可替代核苷酸種類的那些,以及使引物組成限制于不超過2個簡并位置,以減少在擴(kuò)增反應(yīng)中形成引物二聚體的危險。在某些實(shí)施方案中,還希望使簡并位置限制于引物組成的最后5 個序列位置(即,在正向引物的3’末端和反向引物的5’末端上),因?yàn)榫哂凶詈?個位置高度保守對于結(jié)合效率是有利的。例如,簡并序列位置一般具有多個可能不同的核苷酸種類, 其作為在那個位置上的可替代序列組成出現(xiàn)。簡并堿基是本領(lǐng)域眾所周知的,并且各自類型的簡并性由IUPAC符號表示,其表明與類型相關(guān)的可替代核苷酸組成。例如,IUPAC符號 R表示嘌呤堿基(即A和G)是可替代的可能物。所述本發(fā)明的實(shí)施方案包括設(shè)計為產(chǎn)生順應(yīng)高流通量測序的擴(kuò)增子的下述引物種類
IN12F5’ CTATTTTTAGATGGAATAGANAARGC 3,(SEQ ID NO :1) INlF 5,GTACCAGCACACAAAGGRATTGG 3,(SEQ ID NO 2) IN2R 5,TTGATCCCTGCCCACCARCA 3,(SEQ ID NO 3) IN3F 5,GGAAAAATTATCCTRGTAGCAGT 3,(SEQ ID NO 4) IN3R 5,CCTGCACTGTAYCCCCCAAT 3,(SEQ ID NO 5) IN4F 5,GTAAAAACAATACATACAGAYAATGG 3,(SEQ ID NO 6) IN4R 5,CTGTCCCTGTAATAAACCCGAA 3,(SEQ ID NO 7) IN5F 5,GACAGCAGTACAAATGGCAGT 3,(SEQ ID NO 8) IN5R 5,GTGTTTTACTAAACTDTTCCATG 3,(SEQ ID NO 9) IN6F 5,GAATAATAGACATAATAGCAffCAGA 3,(SEQ ID NO 10) IN6R 5,TGTTCTAATCCTCATCCTGTC 3,(SEQ ID NO 11)。本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)理解,存在對于引物組的序列組成的某些變異性,并且與所公開的引物序列90%或更大的同源性視為在目前描述的本發(fā)明的范圍內(nèi)。例如,關(guān)于引物組的靶區(qū)域可以輕微轉(zhuǎn)移,并且因此預(yù)期在引物序列組成中的某些差異。此外,可以進(jìn)行對共有序列的改進(jìn),或可以開發(fā)在特定位置上的新序列簡并性,導(dǎo)致在靶區(qū)域中序列組成的輕微差異,并且類似地預(yù)期在引物序列組成中的某些變異。圖2提供了由上文舉例說明的引物生成的擴(kuò)增子205和擴(kuò)增子215的舉例說明性例子。在圖2中,擴(kuò)增子210、220、230、240、250和沈0以跨越整合酶區(qū)域205的交錯關(guān)系排列,然而,應(yīng)當(dāng)理解圖2中舉例說明的擴(kuò)增子的確切關(guān)系提供用于示例性目的不應(yīng)視為限制性的。還應(yīng)當(dāng)理解不同擴(kuò)增子產(chǎn)物可以使用本文公開的引物序列的不同組合產(chǎn)生,導(dǎo)致具有與圖2中舉例說明的那些不同的長度和覆蓋的擴(kuò)增子。在本發(fā)明的某些實(shí)施方案中,產(chǎn)生具有整合酶區(qū)域的重疊覆蓋的擴(kuò)增子產(chǎn)物是有利的,這提供可以賦予質(zhì)量控制中的實(shí)質(zhì)利益的“雙重覆蓋”,以及擴(kuò)增子產(chǎn)物之一未能適當(dāng)擴(kuò)增或遭受某些其它類型的實(shí)驗(yàn)假象的事件中的冗余。在一般實(shí)施方案中,每個擴(kuò)增子在分開反應(yīng)中生成,其使用用于所需擴(kuò)增子的相關(guān)引物組合。進(jìn)一步地,在某些實(shí)施方案中,擴(kuò)增子長于可以通過擴(kuò)增技術(shù)例如PCR可靠地產(chǎn)生(即具有低擴(kuò)增誤差率等)的長度,并且因此每個擴(kuò)增子可以是使用相同引物組合的2個擴(kuò)增產(chǎn)物的結(jié)果。例如,如圖2中舉例說明的,擴(kuò)增子210可以是產(chǎn)物205和207的組合;220可以是產(chǎn)物215和217的組合;230 可以是產(chǎn)物225和227的組合;240可以是產(chǎn)物235和237的組合;250可以是產(chǎn)物245和 247的組合;并且260可以是產(chǎn)物255和257的組合。在呈現(xiàn)的例子中,產(chǎn)物一般將具有重疊的測量,這再次提供擴(kuò)增子產(chǎn)物的裝配和質(zhì)量控制。下表1提供了擴(kuò)增子、擴(kuò)增子長度和用于其生成的引物的關(guān)系的例子。表 權(quán)利要求
1.一種用于檢測與整合酶相關(guān)的一種或多種HIV序列變體的低頻率出現(xiàn)的方法,其包括步驟(a)生成來自HIV樣品群體中的多個RNA分子的cDNA種類;(b)由cDNA種類擴(kuò)增多個第一擴(kuò)增子,其中每個第一擴(kuò)增子用一對核酸引物進(jìn)行擴(kuò)增;(c)克隆擴(kuò)增所述第一擴(kuò)增子的擴(kuò)增拷貝,以產(chǎn)生多個第二擴(kuò)增子;(d)測定所述第二擴(kuò)增子的核酸序列組成;(e)檢測在所述第二擴(kuò)增子的核酸序列組成中以5%或更少的頻率出現(xiàn)的一種或多種序列變體;和(f)使所述檢測出的序列變體和與HIV整合酶相關(guān)的變異關(guān)聯(lián)。
2.權(quán)利要求1的方法,其中所述與HIV整合酶相關(guān)的變異已知與針對整合酶抑制劑的抗性相關(guān)。
3.權(quán)利要求1的方法,其中 所述HIV樣品群體衍生自單個患者。
4.權(quán)利要求1的方法,其中所述多個第一擴(kuò)增子包括6個擴(kuò)增子。
5.權(quán)利要求1的方法,其中用于所述第一擴(kuò)增子的所述引物對靶向低突變頻率的區(qū)域。
6.權(quán)利要求1的方法,其中所述第一擴(kuò)增子靶向與HIV整合酶功能性相關(guān)的HIV區(qū)域。
7.權(quán)利要求1的方法,其中所述第二擴(kuò)增子使用一對共用弓I物進(jìn)行擴(kuò)增。
8.權(quán)利要求1的方法,其中一種或多種序列變體在99%的置信水平下檢測到。
9.權(quán)利要求1的方法,其中測定來自至少400個固定群體的基本上等同拷貝的核酸組成,并且一種或多種檢測到的序列變體以1.85%或更低的頻率出現(xiàn)。
10.權(quán)利要求1的方法,其中測定來自至少10000個固定群體的基本上等同拷貝的核酸組成,并且一種或多種檢測到的序列變體以0. 74%或更低的頻率出現(xiàn)。
11.權(quán)利要求1的方法,其中測定來自至少200000個固定群體的基本上等同拷貝的核酸組成,并且一種或多種檢測到的序列變體以0. 003%或更低的頻率出現(xiàn)。
12.權(quán)利要求1的方法,其中所述檢測步驟采用包括單個檢測裝置的儀器,所述檢測裝置能夠檢測在單個基底上由多個測序反應(yīng)生成的信號。
13.權(quán)利要求1的方法,其中 所述單個基底包括多個反應(yīng)位點(diǎn)。
14.一種用于檢測與整合酶區(qū)域相關(guān)的一種或多種HIV序列變體的試劑盒,其包括用于擴(kuò)增權(quán)利要求1的第一擴(kuò)增子的多個核酸引物對。
15. 一種用于檢測與整合酶區(qū)域相關(guān)的一種或多種HIV序列變體的試劑盒,其包括 選自 IN12F (SEQ ID N0:1)禾口 IN2R (SEQ ID NO 3) ;INlF (SEQ ID NO :2)禾口 IN2R (SEQ ID NO 3) ;IN3F (SEQ ID NO :4)禾口 IN3R (SEQ ID NO 5) ;IN4F (SEQ ID NO :6)禾口 IN4R (SEQ ID NO 7) ;IN5F (SEQ ID NO :8)禾口 IN5R (SEQ ID N0:9);以及 IN6F (SEQ ID NO 10)和IN6R (SEQ ID NO 11)的一個或多個引物對。
全文摘要
描述了用于檢測與整合酶相關(guān)的一種或多種HIV序列變體的低頻率出現(xiàn)的方法的一個實(shí)施方案,其包括步驟(a)生成來自HIV樣品群體中的多個RNA分子的cDNA種類;(b)由cDNA種類擴(kuò)增多個第一擴(kuò)增子,其中每個第一擴(kuò)增子用一對核酸引物進(jìn)行擴(kuò)增;(c)克隆擴(kuò)增第一擴(kuò)增子的擴(kuò)增拷貝,以產(chǎn)生多個第二擴(kuò)增子;(d)測定第二擴(kuò)增子的核酸序列組成;(e)檢測在第二擴(kuò)增子的核酸序列組成中以5%或更少的頻率出現(xiàn)的一種或多種序列變體;和(f)使檢測出的序列變體與和HIV整合酶相關(guān)的變異關(guān)聯(lián)。
文檔編號C12Q1/70GK102227507SQ200980147652
公開日2011年10月26日 申請日期2009年11月27日 優(yōu)先權(quán)日2008年12月1日
發(fā)明者B. 西門 B., P. 圣約翰 E. 申請人:霍夫曼-拉羅奇有限公司