專利名稱:用于檢測hiv-1分化體及逆轉(zhuǎn)錄酶和蛋白酶區(qū)的重組體的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明提供用于檢測和分析與Hiv-1有關(guān)的序列變體、特別是HIV分化體A、B、C、D、F和G及其相關(guān)重組體的序列變體的方法、試劑和系統(tǒng)。本文所用術(shù)語“分化體”總的來講具有與相關(guān)領(lǐng)域普通技術(shù)人員所理解的相同含義,是指通常存在于特定地理區(qū)域的HIV-1病毒的遺傳獨(dú)特亞群。例如在歐洲,約75%的HIV感染為HIV-B (即分化體B)感染,約25%由HIV-A、HIV-C和其它分化體群組成。變體可包括在平行的靶多核苷酸群體中的單核苷酸多態(tài)性(SNP)、插入/缺失變體(稱為“indel”)和等位基因頻率。本發(fā)明還涉及通過平行焦磷酸測序研究通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)復(fù)制的核酸以鑒定已知和未知序列的突變和多態(tài)性的方法。本發(fā)明包括使用特別設(shè)計(jì)的核酸引物,以擴(kuò)增與特定HIV特性或功能有關(guān)的HIV RNA或其互補(bǔ)DNA的特定區(qū)和/或一系列重疊區(qū),例如分別與HIV將病毒RNA轉(zhuǎn)錄成雙鏈DNA (dsDNA)以備整合至宿主細(xì)胞中和適當(dāng)裝配/使病毒多蛋白成熟以產(chǎn)生感染性病毒粒的能力有關(guān)的逆轉(zhuǎn)錄酶(RT)和蛋白酶(Prot)區(qū)。此外,引物的靶位點(diǎn)具有低突變率,使得疑似含有變體(亦稱為準(zhǔn)種)的靶HIV核酸群中的核酸能夠穩(wěn)定擴(kuò)增以產(chǎn)生各自的擴(kuò)增子。以大量平行、有效和有成本效益的方式,對數(shù)千獨(dú)特的HIV擴(kuò)增子進(jìn)行測序,以產(chǎn)生擴(kuò)增子群中存在的序列變體的分布,這使得高于先前所用方法的更大檢測靈敏度成為可能。
背景技術(shù):
人免疫缺陷病毒(一般稱為HIV)依然是世界范圍的主要問題,盡管許多化合物獲準(zhǔn)用于治療。由于病毒逆轉(zhuǎn)錄酶的易錯(cuò)性質(zhì)和高病毒周轉(zhuǎn)(找=1-3天)所致,HIV基因組突變得非???。鑒于在其9.7 Kb基因組復(fù)制期間的高突變率,‘準(zhǔn)種’的形成導(dǎo)致以動態(tài)關(guān)系存在的許多不同的突變體。
HIV RT基因編碼序列位于pol區(qū)的5’端附近,在基因組中兩側(cè)是Prot區(qū)和RNA酶區(qū)——前者具有部分重疊的讀框,該讀框始于gag基因的p6蛋白的3’端。RT蛋白由440個(gè)氨基酸(51 kDa)編碼,其主要功能產(chǎn)生于作為異二聚體的組合,所述異二聚體具有由560個(gè)氨基酸(66 kDa)編碼的RT/RNA酶H多蛋白。它包括3個(gè)主要的酶功能:1)使互補(bǔ)DNA鏈與基因組RNA聚合,2)使親本RNA鏈降解,留下由酶的逆轉(zhuǎn)錄酶活性產(chǎn)生的互補(bǔ)DNA,和3)產(chǎn)生第一鏈的第二互補(bǔ)鏈,從而通過聚合酶活性產(chǎn)生dsDNA原病毒(Lu等,J.Biol.Chem.279 (2004) 54529-54532,其通過引用以其整體結(jié)合到本文中用于所有目的)。對于任何HIV-1病毒基因,引物設(shè)計(jì)的一個(gè)主要困難是因?yàn)檫@種酶的保真度低,這就導(dǎo)致甚至在病毒RNA至dsDNA的單一 RT轉(zhuǎn)化中的高頻率突變。文獻(xiàn)指出HIV-1RT在單條DNA鏈聚合期間引起1/2000-1/4000的取代差錯(cuò)頻率(substitution errorfrequencies)。由于第一鏈和第二鏈相繼聚合,因此對于各HIV-1基因組轉(zhuǎn)化,這些出錯(cuò)率可相當(dāng)于每輪復(fù)制共5-10個(gè)突變(Preston等,Science 242 (1988) 1168-1171)。這種突變的dsDNA病毒基因組然后整合到宿主生物將要全體復(fù)制的染色體中,用于感染并隨后整合到其它宿主細(xì)胞中。針對逆轉(zhuǎn)錄酶功能的藥物是減少病毒繁殖的極好靶標(biāo),因此,F(xiàn)DA批準(zhǔn)了適于以下兩種類別的藥物:核苷/核苷酸類似物逆轉(zhuǎn)錄酶抑制劑(NRTI/NtRTI)和非核苷逆轉(zhuǎn)錄酶抑制劑(NNRTI),兩者靶向逆轉(zhuǎn)錄酶,但卻通過不同方式靶向逆轉(zhuǎn)錄酶??鼓孓D(zhuǎn)錄病毒藥物的NRTI類別由RNA和DNA的核苷酸結(jié)構(gòu)單元(buiIdingblock)的結(jié)構(gòu)類似物組成。當(dāng)整合到病毒DNA中時(shí),這些有缺陷的核苷酸類似物防止與下一個(gè)核苷酸形成新的3’ 一5’磷酸二酯鍵,引起鏈合成提前終止,并有效地抑制病毒復(fù)制(Zapor, M.J.等,Pyschosomatics 45 (2004) 524-535)。NRTI 通常耐受:性良好,但仍可能具有一些難題。在這些難題中有:線粒體毒性(由外周神經(jīng)病表明(Moyle,G.J.等,Drug Saf 6 (1998) 481-494 ;Simpson, D.Μ.等,J.Acquir.1mmune Defic.Syndr.Hum.Retrovirol.9 (1995) 153-161)、肌病(Gold,R.等,N.Engl.J.Med.323(1990) 994 ;de la Asuncion, J.G.等,J.Clin.1nvest.102 (1998) 4-9)、乳酸性酸中毒(Carr, A.Clin.1nfect.Dis.36,增刊 2 (2003) S96-S100)和外周脂肪營養(yǎng)不良(Carr,Α.等,AIDS 14 (2000) F25-32)、造血系統(tǒng)毒性(表現(xiàn)為貧血、中性粒細(xì)胞減少或血小板減少;Gallicchio, V.S.等,Int.J.1mmunopharmaco1.15 (1993) 263-268)、耳毒性(Simdon, J.Clin.1nfect.Dis.32 (2001) 1623-1627)和多種不良的藥物相互作用。齊多夫定,通常稱為AZT或Retrovir ,是最早獲得FDA批準(zhǔn)的NRTI藥物。這種藥物通常與其它抗逆轉(zhuǎn)錄病毒藥物(例如用于高效抗逆轉(zhuǎn)錄病毒治療(HAART)方案的抗逆轉(zhuǎn)錄病毒藥物)聯(lián)合,并且還用來防止病毒由母親傳給兒童。齊多夫定的毒性和副作用與其它NRTI的類似,最見的是血液學(xué)毒性。可得到許多其它經(jīng)批準(zhǔn)的核苷類似物藥物,但本文仍列舉這些核苷類似物藥物(齊多夫定是一種胸苷類似物):阿巴卡韋(Ziagen ),一種由GlaxoSmithKline 銷售的 鳥苷類似物;去輕肌苷(Videx ),—種由 Bristol Myers Squibb銷售的腺苷類似物;以及恩曲他濱(Emtriva ), 一種由Gilead Sciences銷售的胞卩密唳類似物。至今唯一經(jīng)FDA批準(zhǔn)的核苷酸RT抑制劑是藥物Viread ,亦稱富馬酸替諾福韋二索羅基酯,一種由Gilead Sciences銷售的腺苷5’ -單磷酸類似物。盡管NRTI是競爭結(jié)合到HIV基因組中的核苷或核苷酸類似物,但是NNRTI通過與酶直接非競爭地結(jié)合而阻斷互補(bǔ)DNA延伸。這就影響蛋白質(zhì)在其活性部位的構(gòu)象變化,降低對核苷結(jié)合的親和力。NNRTI不需要胞內(nèi)磷酸化以變得有活性和抑制HIV-1。它們的抗病毒效能和耐受性使NNRTI成為HAART方案的有利組分,且毒性和病毒交叉耐藥性不與NRTI重疊(Zapor等,Pyschosomatics 45 (2004) 524-535)。常見的副作用包括輕度皮疹(Scott, L.J.等,Drugs 2 (2000) 373-407)、肝酶水平升高(Dieterich, D.T.等,Clin.1nfect.Dis.38,增刊 2 (2004) S80-89)和脂肪重新分布(Adkins,J.C.等,Drugs 56(1998) 1055-1066)。常用于治療的NNRTI包括但不限于:依法韋侖(Sustiva /Stocrin )、奈韋拉平(Viramune )和依曲韋林(Intelence )。蛋白酶基因編碼區(qū)直接位于RT基因的上游。該基因編碼99個(gè)氨基酸單體,所述單體與另一個(gè)單體配對以作為同二聚體起作用。所得天冬氨酰基蛋白酶同二聚體負(fù)責(zé)切割HIV-1病毒裝配所需要的Gag和Gag-Pol蛋白。前體多蛋白的切割發(fā)生在宿主細(xì)胞表面,在時(shí)間上與其從細(xì)胞中的釋放接近。成熟,即gag、gag-pol和nef區(qū)的HIV-1多蛋白的切害I],是復(fù)制病毒粒的存活力所必需的。由于蛋白酶在病毒RNA轉(zhuǎn)化時(shí)通過逆轉(zhuǎn)錄酶復(fù)制,因此在其核苷酸序列內(nèi)無疑將具有突變。某些突變可導(dǎo)致功能喪失,然而,其它突變能夠保持功能,并賦予蛋白酶抑制劑抗性。隨后在整個(gè)復(fù)制子代中這些突變體的選出,使得更難以適當(dāng)?shù)刂委焸€(gè)體和提供有效的HAART混合物。蛋白酶抑制劑(PI)是與蛋白酶同二聚體催化部位結(jié)合的極好的藥物類別。根據(jù)通過蛋白質(zhì)三維結(jié)構(gòu)解析獲得的信息,對這些藥物進(jìn)行特殊改造。每一種PI都競爭催化部位,并防止蛋白酶接受對病毒存活和整體感染是必需的Gag和Gag-Pol多蛋白。經(jīng)改造以恰在從細(xì)胞釋放之前阻止病毒蛋白質(zhì)活化,PI終止病毒生命周期而不是阻止病毒生命周期,例如治療藥的NRTI/NNRTI類別。因此,PI并不“殺死”病毒,而是降低受感染個(gè)體的病毒載量,并減慢感染對宿主T細(xì)胞的攻擊。PI的一些實(shí)例包括但不限于:氨普那韋(Agenerase )、阿扎那韋(Reyataz )、利托那韋(Norvir )和洛匹那韋/利托那韋(Kaletra )?,F(xiàn)有的HIV藥物抗性測定法通常作為群體測定法進(jìn)行(Kuritzkes, D.R.等,J.1nfect.Dis.203 (2011) 146-148 ;Van Laethem,K.等,J.Virol.Methods 153 (2008)176-181 ;Paar,C.等,J.Clin.Microbiol.49 2697-2699),所述測定法就其性質(zhì)而言,比基于克隆分離的每個(gè)病毒毒株的測定法較不靈敏。然而,之前所采用的克隆分析測定法是極為勞動密集型的,需要分別測試來自各受試者的數(shù)千細(xì)胞克隆以獲得高的靈敏度。由454測序平臺提供的長的讀取長度(read-length)理想地適于在單次測序運(yùn)行中自多個(gè)受試者產(chǎn)生數(shù)千個(gè)克隆讀數(shù)。因此,通過基于序列的HIV逆轉(zhuǎn)錄酶和蛋白酶抑制劑抗性測定法對這些突變的有效檢測(其中克隆序列直接獲自病毒RNA準(zhǔn)種而無需勞動密集型克隆步驟)是十分需要的,并且能夠從早期檢測中切實(shí)加深對疾病和治療可能性的認(rèn)識。此外,使可被稱為“大量平行”的處理成為可能的高通量測序技術(shù)的實(shí)施方案,具有比現(xiàn)有測序技術(shù)實(shí)質(zhì)上更強(qiáng)大的分析、靈敏度和通量特征。例如,使用本發(fā)明的HIV特異性引物的高通量測序技術(shù)能夠達(dá)到檢測低豐度等位基因(包括群體中頻率為1%或更低的等位基因變體)的靈敏度。如上所述,這在檢測HIV變體的情況下很重要,其中高靈敏度提供重要的早期檢測機(jī)制 ,這產(chǎn)生顯著的治療益處。發(fā)明概沭
本發(fā)明的實(shí)施方案涉及核酸序列的測定。更具體地講,本發(fā)明的實(shí)施方案涉及采用高通量測序技術(shù)檢測序列變體的方法和系統(tǒng)。本文描述了用于檢測低頻率出現(xiàn)的與逆轉(zhuǎn)錄酶和/或蛋白酶有關(guān)的一種或多種HIV序列變體的方法,所述方法包括以下步驟:(a)從HIV樣品群的多種RNA分子中產(chǎn)生cDNA物類;(b)由cDNA物類擴(kuò)增多種第一擴(kuò)增子,其中各第一擴(kuò)增子用能夠從HIV分化體產(chǎn)生擴(kuò)增子的核酸引物對擴(kuò)增,所述HIV分化體包括分化體A、分化體B、分化體C、分化體D、分化體F和分化體G ; (c)克隆擴(kuò)增第一擴(kuò)增子的擴(kuò)增拷貝以產(chǎn)生多種第二擴(kuò)增子;(d)測定第二擴(kuò)增子的核酸序列組成;和(e)檢測第二擴(kuò)增子的核酸序列組成中的一種或多種序列變體。上述實(shí)施方案和實(shí)施不必彼此相容或排斥,可以不相沖突和其它可能的任何方式組合,不論它們是與相同還是不同的實(shí)施方案或?qū)嵤┞?lián)合提供。相對于其它實(shí)施方案和/或?qū)嵤?,一個(gè)實(shí)施方案或?qū)嵤┑拿枋霾⒎鞘窍拗菩缘?。此外,在備選實(shí)施中,本說明書中其它部分描述的任一個(gè)或多個(gè)功能、步驟、操作或技術(shù)可與概述中描述的任一個(gè)或多個(gè)功能、步驟、操作或技術(shù)組合。因此,上述實(shí)施方案和實(shí)施是說明性的而不是限制性的。附圖簡沭當(dāng)結(jié)合附圖考慮時(shí),可從下列詳細(xì)描述中更清楚地理解上述特征和更多的特征。附圖中,相似的參考數(shù)字表示相似的結(jié)構(gòu)、元件或方法步驟,參考數(shù)字最左邊的數(shù)字表示其中參考元件最早出現(xiàn)的附圖數(shù)(例如元件160最早出現(xiàn)在
圖1中)。然而所有這些約定只是代表性的或說明性的,而不是限制性的。圖1是計(jì)算機(jī)控制下的測序儀器和反應(yīng)基質(zhì)(reaction substrate)的一個(gè)實(shí)施方案的原理框 圖2是6種擴(kuò)增子相對于HIV逆轉(zhuǎn)錄酶和蛋白酶區(qū)的位置關(guān)系的實(shí)施方案的簡化圖
例;
圖3是4種擴(kuò)增子相對于HIV逆轉(zhuǎn)錄酶和蛋白酶區(qū)的位置關(guān)系的一個(gè)實(shí)施方案的簡化圖例;
圖4A是圖2的6擴(kuò)增子策略提供的HIV逆轉(zhuǎn)錄酶和蛋白酶區(qū)的覆蓋的一個(gè)實(shí)施方案的簡化圖例;
圖4B是圖3的4擴(kuò)增子策略提供的HIV逆轉(zhuǎn)錄酶和蛋白酶區(qū)覆蓋的一個(gè)實(shí)施方案的簡化圖例;
圖5是軟件界面的一個(gè)實(shí)施方案的簡化圖例,其提供得自多個(gè)分化體的樣品與通過圖2的6擴(kuò)增子策略產(chǎn)生的已知變體 的測定頻率的關(guān)聯(lián);
圖6是軟件界面的一個(gè)實(shí)施方案的簡化圖例,其提供得自多個(gè)分化體的樣品與圖3的4擴(kuò)增子策略產(chǎn)生的已知變體的測定頻率的關(guān)聯(lián);
圖7是采用圖2的6擴(kuò)增子策略檢測的K65R逆轉(zhuǎn)錄酶突變的一個(gè)實(shí)施方案的簡化圖例。圖 7 以出現(xiàn)順序分別展示 SEQ ID NO 16-18、18、19-20、21、20、19-20、19-20、22-23、24、20、19-20 和 25 ;
圖8是用于產(chǎn)生檢測藥物抗性或靈敏度變體的HIV-1擴(kuò)增子序列數(shù)據(jù)的工作流程的一個(gè)實(shí)施方案的簡化圖例。發(fā)明詳沭
按下文中將更詳細(xì)的描述,本發(fā)明的實(shí)施方案包括使用設(shè)計(jì)成在單次測序測定中同時(shí)檢測分化體A、B、C、D、F和G的HIV變體的靶特異性序列或引物物類以及使用這些引物用于高靈敏度檢測逆轉(zhuǎn)錄酶和蛋白酶區(qū)的HIV序列變體的系統(tǒng)和方法。a.概論
術(shù)語“流動圖(flowgram)”一般是指通過SBS方法、特別是基于焦磷酸的測序方法(亦稱為“焦磷酸測序(pyrosequencing)”)產(chǎn)生的序列數(shù)據(jù)的圖示,并可更準(zhǔn)確地稱為“熱解圖(pyrogram)”。本文所用術(shù)語“讀數(shù)”或“序列讀數(shù)” 一般是指由單個(gè)核酸模板分子或模板核酸分子的大量基本相同的拷貝群獲得的全部序列數(shù)據(jù)。本文所用術(shù)語“運(yùn)行”或“測序運(yùn)行” 一般是指在一種或多種模板核酸分子的測序操作中進(jìn)行的一系列測序反應(yīng)。本文所用術(shù)語“流動/流”一般是指單循環(huán),通常是將流體溶液引入包括模板核酸分子的反應(yīng)環(huán)境的重復(fù)過程的部分,其中所述溶液可包括用于添加至新生分子的核苷酸物類或其它試劑,例如可用于測序方法或減少來自之前核苷酸物類流動的滯留物(carryover)或噪聲影響的緩沖液、洗漆溶液或酶。
本文所用術(shù)語“流動循環(huán)(flow cycle) ”一般是指序貫的系列流動,其中包含核苷酸物類的流體在循環(huán)中流動一次(即流動循環(huán)可包括以T、A、C、G核苷酸物類的次序順次加入,但是其它序列組合也視為該定義的部分)。通常,流動循環(huán)是在循環(huán)之間具有相同流動順序的重復(fù)循環(huán)。本文所用術(shù)語“讀取長度” 一般是指可被可靠測序的模板分子長度的上限。存在對系統(tǒng)和/或方法的讀取長度產(chǎn)生影響的多個(gè)因素,包括但不限于模板核酸分子中GC含量的程度。本文所用術(shù)語“試驗(yàn)片段”或“TF” 一般是指可用于質(zhì)量控制、校準(zhǔn)或其它相關(guān)目的的已知序列組成的核酸元件。本文所用術(shù)語“引物”一般是指在其中在合適的溫度下,在合適的緩沖液中誘導(dǎo)與核酸鏈互補(bǔ)的引物延伸產(chǎn)物的合成的條件下,用作DNA合成起始點(diǎn)的寡核苷酸。引物優(yōu)選為單鏈寡脫氧核糖核苷酸?!靶律肿印币话闶侵竿ㄟ^摻入與模板分子中的相應(yīng)核苷酸物類互補(bǔ)的核苷酸物類,由模板依賴性DNA聚合酶延伸的DNA鏈。
術(shù)語“模板核酸”、“模板分子”、“靶核酸”或“靶分子” 一般是指作為從中產(chǎn)生序列數(shù)據(jù)或信息的測序反應(yīng)的對象的核酸分子。本文所用術(shù)語“核苷酸物類”一般是指通常被摻入新生核酸分子中的核酸單體的特性,包括嘌呤(腺嘌呤、鳥嘌呤)和嘧啶(胞嘧啶、尿嘧啶,胸腺嘧啶)?!疤烊弧焙塑账嵛镱惏ɡ缦汆堰省ⅧB嘌呤、胞嘧啶、尿嘧啶和胸腺嘧啶。上述天然核苷酸物類的修飾形式包括而不限于次黃嘌呤、黃嘌呤、7-甲基鳥嘌呤、5,6- 二氫尿嘧啶和5-甲基胞嘧啶。本文所用術(shù)語“單體重復(fù)”或“均聚物” 一般是指包含相同核苷酸物類(即重復(fù)核苷酸物類)的兩個(gè)或更多個(gè)序列位置。本文所用術(shù)語“均質(zhì)延伸”一般是指延伸反應(yīng)的關(guān)系或階段,其中基本相同的模板分子群的各個(gè)成員在反應(yīng)中均一地進(jìn)行相同的延伸步驟。本文所用術(shù)語“完成效率”一般是指在給定流動過程中適當(dāng)延伸的新生分子的百分比。本文所用術(shù)語“不完全延伸率” 一般是指不能適當(dāng)延伸的新生分子數(shù)相對于總的新生分子數(shù)的比率。本文所用術(shù)語“基因組文庫”或“鳥槍法文庫(shotgun library) ” 一般是指來源于和/或代表生物或個(gè)體的整個(gè)基因組(即基因組的全部區(qū))的分子集合體。本文所用術(shù)語“擴(kuò)增子”一般是指選擇的擴(kuò)增產(chǎn)物,例如自聚合酶鏈?zhǔn)椒磻?yīng)或連接酶鏈?zhǔn)椒磻?yīng)技術(shù)產(chǎn)生的擴(kuò)增產(chǎn)物。本文所用術(shù)語“變體”或“等位基因” 一般是指各自編碼相似序列組成但彼此有某種程度的差別的多個(gè)基因物類之一。差別可包括相關(guān)領(lǐng)域普通技術(shù)人員已知的任何變異類型,包括但不限于多態(tài)性例如單核苷酸多態(tài)性(SNP)、插入或缺失(插入/缺失事件的組合亦稱為“indel”)、重復(fù)序列(亦稱為串聯(lián)重復(fù))數(shù)目的差異和結(jié)構(gòu)變異。本文所用術(shù)語“等位基因頻率”或“等位基因的頻率” 一般是指由特定變體組成的群體中所有變體的比例。本文所用術(shù)語“key序列”或“key元件” 一般是指包括已知序列組成的在已知位置上(即通常包括在連接的銜接元件中)與模板核酸分子締合的核酸序列元件(通常約4個(gè)序列位置,即TGAC或核苷酸物類的其它組合),其用作從模板分子產(chǎn)生的序列數(shù)據(jù)的質(zhì)量控制參考。如果序列數(shù)據(jù)在正確位置上包括與Key元件締合的已知序列組成,則序列數(shù)據(jù)通過質(zhì)量控制。本文所用術(shù)語“關(guān)鍵通過(keypass) ”或“關(guān)鍵通過孔”一般是指在反應(yīng)孔中已知序列組成的全長核酸試驗(yàn)序列(即上文提及的“試驗(yàn)片段”或“TF”)的測序,其中將來源于TF序列和/或與TF締合的Key序列的或與靶核酸締合的銜接頭中的序列的準(zhǔn)確性與TF和/或Key的已知序列組成相比較,并用來衡量測序的準(zhǔn)確性和用于質(zhì)量控制。在典型的實(shí)施方案中,測序運(yùn)行中孔的總數(shù)的一部分將是關(guān)鍵通過孔,這在某些實(shí)施方案中可以是按區(qū)域分布的。本文所用術(shù)語“平端” 一貫按相關(guān)領(lǐng)域普通技術(shù)人員的理解來解釋,一般是指具有以一對互補(bǔ)核苷酸堿基物類結(jié)束的末端的線性雙鏈核酸分子,其中一對平端通常適于彼此連接。本文所用術(shù)語“粘性末端”或“突出端” 一貫按相關(guān)領(lǐng)域普通技術(shù)人員的理解來解釋,一般是指在分子一條鏈的末端具有一個(gè)或多個(gè)不配對核苷酸物類的線性雙鏈核酸分子,其中不配對核苷酸物類可存在于任一條鏈上,并包括單個(gè)堿基位置或多個(gè)堿基位置(有時(shí)亦稱“粘端”)。 本文所用術(shù)語“SPRI ” 一貫按相關(guān)領(lǐng)域普通技術(shù)人員的理解來解釋,一般是指“固相可逆固定法(Solid Phase Reversible Immobilization) ”的專利技術(shù),其中在特定的緩沖條件下在珠粒存在時(shí)使靶核酸選擇性沉淀,其中所述珠粒常被羧化并且是順磁的。使沉淀的靶核酸固定在所述珠粒上,使之保持結(jié)合直到按照操作者的需要用洗脫緩沖液除去(DeAngelis,M.M.等,Nucleic Acids Res.23 (1995) 4742-4743)。本文所用術(shù)語“羧化” 一貫 按相關(guān)領(lǐng)域普通技術(shù)人員的理解來解釋,一般是指通過加入至少一個(gè)羧基基團(tuán)對材料(例如微粒)的修飾。羧基為COOH或C00-。本文所用術(shù)語“順磁性的” 一貫按相關(guān)領(lǐng)域普通技術(shù)人員的理解來解釋,一般是指材料的特性,其中所述材料的磁性只在外部施加的磁場存在下發(fā)生,一旦外部施加的磁場被撤除,則不保持任何磁化作用。本文所用術(shù)語“珠粒”或“珠?;|(zhì)” 一般是指形狀不規(guī)則或規(guī)則的任何合適大小的任何類型的固相顆粒,其由任何數(shù)目的已知材料制造,所述材料例如纖維素、纖維素衍生物、丙烯酸樹脂、玻璃、硅膠、聚苯乙烯、明膠、聚乙烯吡咯烷酮、乙烯基與丙烯酰胺共聚物、二乙烯基苯交聯(lián)的聚苯乙烯等(例如Merrifield, Biochemistry 3 (1964) 1385-1390中的描述)、聚丙烯酰胺、乳膠、聚苯乙烯、葡聚糖、橡膠、娃、塑料、硝化纖維素、天然海綿、硅膠、可控孔度玻璃、金屬、交聯(lián)葡聚糖(例如Sephadex )瓊脂糖凝膠(Sepharose )和本領(lǐng)域技術(shù)人員已知的其它固相珠粒支持體。本文所用術(shù)語“反應(yīng)環(huán)境” 一般是指其中通??砂l(fā)生反應(yīng)的空間體積,其中至少暫時(shí)包含反應(yīng)物或?qū)⒎磻?yīng)物限制在內(nèi)以允許檢測至少一種反應(yīng)產(chǎn)物。反應(yīng)環(huán)境的實(shí)例包括但不限于杯、管、瓶以及平面或非平面基質(zhì)上的一個(gè)或多個(gè)凹陷、孔或室。本文所用術(shù)語“實(shí)際終止劑(virtual terminator) ” 一般是指大大減慢反應(yīng)動力學(xué)的終止劑,其中可采用其它步驟終止反應(yīng),例如除去反應(yīng)物。
下文概括地描述了與樣品制備與加工、序列數(shù)據(jù)生成和序列數(shù)據(jù)分析有關(guān)的系統(tǒng)和方法的一些不例性實(shí)施方案,其一些或全部適用于本發(fā)明的實(shí)施方案。具體地說,描述了用于制備模板核酸分子、擴(kuò)增模板分子、產(chǎn)生靶特異性擴(kuò)增子和/或基因組文庫的系統(tǒng)和方法、測序方法和儀器以及計(jì)算機(jī)系統(tǒng)的示例性實(shí)施方案。在典型的實(shí)施方案中,來源于實(shí)驗(yàn)或診斷樣品的核酸分子應(yīng)由其未加工形式制備并處理成適于高通量測序的模板分子。處理方法在應(yīng)用之間可以不同,產(chǎn)生包括不同性質(zhì)的模板分子。例如,在高通量測序的某些實(shí)施方案中,優(yōu)選產(chǎn)生這樣的模板分子,其具有與特定測序方法可準(zhǔn)確生成序列數(shù)據(jù)的長度至少相當(dāng)?shù)男蛄谢蜃x取長度。在本實(shí)例中,長度可包括約25-30個(gè)堿基、約50-100個(gè)堿基、約200-300個(gè)堿基、約350-500個(gè)堿基、約500-1000個(gè)堿基的范圍、大于1000個(gè)堿基或適于特定測序應(yīng)用的任何其它長度。在某些實(shí)施方案中,采用本領(lǐng)域普通技術(shù)人員已知的多種方法,使樣品(例如基因組樣品)的核酸斷裂。在優(yōu)選的實(shí)施方案中,使核酸隨機(jī)斷裂(即不選擇特異性序列或區(qū))的方法可包括所謂的噴霧處理或超聲處理方法。然而,應(yīng)了解斷裂的其它方法(例如使用限制性內(nèi)切核酸酶消化)可用于斷裂的目的。此外,在本實(shí)例中,某些處理方法可采用本領(lǐng)域已知的大小選擇方法以選擇性地分離所需長度的核酸片段。此外,在某些實(shí)施方案中,優(yōu)選使另外的功能元件與每個(gè)模板核酸分子締合。所述元件可用于多種功能,包括但不限于用于擴(kuò)增和/或測序方法的引物序列、質(zhì)量控制元件(即例如Key元件或其它類型的質(zhì)量控制元件)、編碼例如與起始或患者樣品的各種關(guān)聯(lián)的獨(dú)特標(biāo)識(亦稱為多重標(biāo)識(multiplex identifier)或“MID”)或其它功能元件。例如,本發(fā)明的某些實(shí)施方案包括使具有已知和可鑒定的序列組成的MID元件的一個(gè)或多個(gè)實(shí)施方案與樣品關(guān)聯(lián),并且使MID元件的實(shí)施方案與來自相關(guān)樣品的模板核酸分子偶聯(lián)。將來自多種不同樣品的MID偶聯(lián)的模板核酸分子合并成單一的“多重”樣品或組合物,其然后可被有效處理以生成各MID偶聯(lián)的模板核酸分子的序列數(shù)據(jù)。使各模板核酸的序列數(shù)據(jù)去卷積以鑒定偶聯(lián)的MID元件的序列組成,并與已鑒定的起始樣品相關(guān)聯(lián)。在本實(shí)例中,多重組合 物可包括約384種樣品、約96種樣品、約50種樣品、約20種樣品、約16種樣品、約12種樣品、約10樣品或其它數(shù)目的樣品的代表。在研究的情況下,可使各樣品與不同的實(shí)驗(yàn)條件、治療、種類或個(gè)體相關(guān)聯(lián)。同樣地,在診斷的情況下,可使各樣品與不同的組織、細(xì)胞、個(gè)體、病況、藥物或其它治療相關(guān)聯(lián)。相關(guān)領(lǐng)域普通技術(shù)人員應(yīng)了解,提供上列樣品數(shù)用于示例性目的,因此不應(yīng)視為限制。在優(yōu)選的實(shí)施方案中,各MID元件的序列組成易于鑒定,并抵抗因測序方法引入的錯(cuò)誤。一些MID元件的實(shí)施方案包括與天然存在的序列具有最小序列相似性的核酸物類的獨(dú)特序列組成?;蛘撸琈ID元件的實(shí)施方案可包括與天然存在的序列有某種程度的序列相似性。此外,在優(yōu)選的實(shí)施方案中,相對于模板核酸分子和/或與模板分子偶聯(lián)的銜接元件的某些特征,各MID元件的位置是已知的。具有已知的各個(gè)MID的位置可用于發(fā)現(xiàn)序列數(shù)據(jù)中的MID元件,并解釋MID序列組成的可能錯(cuò)誤及隨后與起始樣品相關(guān)聯(lián)。例如,可用作針對MID元件的位置關(guān)系的錨的一些特征可包括但不限于模板分子的長度(即已知MID元件是自5’或3’端的如此多的序列位置)、可識別的序列標(biāo)記例如Key元件和/或定位于MID元件附近的一個(gè)或多個(gè)引物元件。在本實(shí)例中,Key元件和引物元件一般包含通常在多重組合物中在樣品之間不變化的已知序列組成,并可用作搜索MID元件的位置參考。通過應(yīng)用程序135執(zhí)行的分析算法可在計(jì)算機(jī)130上執(zhí)行以分析每個(gè)MID偶聯(lián)的模板所生成的序列數(shù)據(jù),來鑒定較易識別的Key元件和/或引物元件,并從這些位置推算,以鑒定假定包括MID元件的序列的序列區(qū)。應(yīng)用程序135然后可處理假定區(qū)和可能的與假定區(qū)相距的側(cè)翼區(qū)中某種距離的序列組成,以確定地鑒定MID元件及其序列組成??稍谀承┨幚聿襟E中,將所述功能元件的一些或全部組成與核苷酸序列偶聯(lián)的銜接元件。例如,某些實(shí)施方案可使包含互補(bǔ)序列組成的引發(fā)序列(priming sequence)元件或區(qū)與用于擴(kuò)增和/或測序的引物序列締合。此外,相同元件可用于所謂的“鏈選擇”和用于將核酸分子固定在固相基質(zhì)上。在某些實(shí)施方案中,兩類引發(fā)序列區(qū)(以下稱引發(fā)序列A和引發(fā)序列B)可用于鏈選擇,其中僅選擇和包括具有一拷貝引發(fā)序列A和一拷貝引發(fā)序列B的的單鏈作為制備的樣品。在備選實(shí)施方案中,銜接元件的設(shè)計(jì)特征消除了對鏈選擇的需要。相同引發(fā)序列區(qū)可用于擴(kuò)增和固定的方法中,例如,引發(fā)序列B可被固定在固相基質(zhì)上,擴(kuò)增產(chǎn)物可在其上延伸。用于斷裂、鏈選擇及加入功能元件和銜接頭的樣品處理的其它實(shí)例描述于2004年I月28日提交的美國專利申請順序號10/767,894,標(biāo)題為“Method for preparingsingle-stranded DNA libraries (用于制備單鏈DNA文庫的方法)”;2008年5月29日提交的美國專利申請順序號 12/156,242,標(biāo)題為 “System and Method for Identificationof Individual Samples from a Multiplex Mixture (用于鑒定來自多重混合物的各個(gè)樣品的系統(tǒng)和方法)”;以及2009年2月23日提交的美國專利申請順序號12/380,139,標(biāo)題為“System and Method for Improved Processing of Nucleic Acids for Productionof Sequencable Libraries (用于產(chǎn)生可測序文庫的核酸的改良處理的系統(tǒng)和方法)”,其每一份均通過引用以其整體結(jié)合到本文中用于所有目的。描述了用于進(jìn)行模板核酸分子擴(kuò)增以產(chǎn)生基本相同的拷貝群的系統(tǒng)和方法的各種實(shí)例。對普通技術(shù)人員將是顯而易見的是,當(dāng)一種或多種核苷酸物類摻入與一拷貝模板分子締合的各新生分子 中時(shí),在某些SBS的實(shí)施方案中需要產(chǎn)生許多拷貝的各種核酸元件,以產(chǎn)生更強(qiáng)的信號。存在許多本領(lǐng)域已知的產(chǎn)生核酸分子拷貝的技術(shù),例如使用所謂的細(xì)菌載體的擴(kuò)增、“滾環(huán)”擴(kuò)增(描述于上文通過引用結(jié)合的美國專利號6,274,320和7,211,390)和聚合酶鏈?zhǔn)椒磻?yīng)(PCR)方法,所述每種技術(shù)均適用于本發(fā)明。特別適于高通量應(yīng)用的一種PCR技術(shù)包括所謂的乳液PCR方法(亦稱為emPCR 方法)。乳液PCR方法的典型實(shí)施方案包括產(chǎn)生兩種不混溶物質(zhì)的穩(wěn)定乳液,以產(chǎn)生在其內(nèi)可以發(fā)生反應(yīng)的水性液滴。具體地說,適用于PCR方法的乳液的水性液滴可包括第一液體,例如作為液滴懸浮或分散在另一液體(例如通常包括某些類型的油的疏水液體(亦稱為連續(xù)相))中的水基液體(亦稱為不連續(xù)相)??墒褂玫挠偷膶?shí)例包括但不限于礦物油、硅基油或氟化油。此外,一些乳液實(shí)施方案可使用起穩(wěn)定乳液的作用的表面活性劑,其可特別用于特定的處理方法,例如PCR。表面活性劑的某些實(shí)施方案可包括硅酮或氟化表面活性劑的一種或多種。例如,可使用的一種或多種非離子型表面活性劑包括但不限于失水山梨醇單油酸酯(亦稱為Span 80)、聚氧乙烯失水山梨醇單油酸酯(亦稱為Tween 80),或者在一些優(yōu)選的實(shí)施方案中,聚二甲基硅氧烷共聚醇(亦稱為Abil EM90)、聚硅氧烷、多烷基聚醚共聚物、聚甘油脂、泊洛沙姆和PVP/十六烷共聚物(亦稱為Unimer U-151),或者在更優(yōu)選的實(shí)施方案中,在環(huán)戍娃氧燒(cyclopentasi1xane)中的高分子量娃酮聚醚(亦稱為DC5225C,可獲自 Dow Corning)。乳液的液滴亦可稱為區(qū)室、微囊體、微型反應(yīng)器、微環(huán)境或相關(guān)領(lǐng)域常用的其它名稱。水性液滴的大小可變化,這取決于乳液組分或組合物的組成、其中所含內(nèi)容物和所采用的形成技術(shù)。所述乳液產(chǎn)生微環(huán)境,在其中可進(jìn)行化學(xué)反應(yīng),例如PCR。例如,可將進(jìn)行所需PCR反應(yīng)需要的模板核酸和所有試劑包封和化學(xué)隔離在乳液的液滴中。如上所述,在某些實(shí)施方案中可采用其它表面活性劑或其它穩(wěn)定劑促進(jìn)液滴的額外穩(wěn)定性。PCR方法的典型熱循環(huán)操作可使用液滴實(shí)現(xiàn),以擴(kuò)增被包封的核酸模板,導(dǎo)致產(chǎn)生包括許多基本相同的拷貝的模板核酸的群。在某些實(shí)施方案中,液滴內(nèi)的群體可稱為“克隆隔離的”、“區(qū)室化的”、“隔離的”、“包封的”或“局部化”群體。同樣在本實(shí)例中,所述液滴的一些或全部可進(jìn)一步包封固相基質(zhì),例如用于連接模板和模板的擴(kuò)增拷貝、與模板互補(bǔ)的擴(kuò)增拷貝或其組合的珠粒。此外,可使固相基質(zhì)能夠連接其它類型的核酸、試劑、標(biāo)記或其它目標(biāo)分子。在破乳和珠?;厥蘸?,在典型的實(shí)施方案中還可能需要“富集”具有成功擴(kuò)增的模板核酸分子的基本相同的拷貝群固定在其上的珠粒。例如,用于富集“DNA陽性”珠粒的方法可包括使引物物類與固定的擴(kuò)增拷貝的游離端上的區(qū)(通常存在于銜接序列中)雜交,采用聚合酶介導(dǎo)的延伸反應(yīng)使引物延伸,并使引物與富集基質(zhì)(例如磁珠或瓊脂糖珠粒)結(jié)合??蓪⑦x擇性條件(例如磁場或離心)施加于包含珠粒的溶液,其中富集珠粒對選擇性條件起反應(yīng),并與“DNA陰性”珠粒(即沒有或很少固定的拷貝)相分離??捎糜诒景l(fā)明的乳液的實(shí)施方案可包括能夠使所述化學(xué)反應(yīng)以大量平行方式進(jìn)行的極高密度的液滴或微囊體。用于擴(kuò)增的乳液及其用于測序應(yīng)用的用途的其它實(shí)例描述于美國專利號 7,638,276,7, 622,280,7, 842,457,7, 927,797 和 8,012,690 以及美國專利申請順序號13/033,240,其每一份均通過引用以其整體結(jié)合到本文中用于所有目的。
`
此外,產(chǎn)生用于測序的靶特異性擴(kuò)增子的實(shí)施方案(有時(shí)稱為超深度測序(Ultra-Deep Sequencing))可用于本發(fā)明,其包括使用特異性核酸引物組以擴(kuò)增來自包含靶核酸的樣品的選定靶區(qū)。此外,樣品可包括已知含有或疑似含有序列變體的核酸分子群,所述序列變體包含與研究或診斷效用有關(guān)的序列組成,其中可使用引物擴(kuò)增,并提供對樣品中的序列變體分布的深入了解。例如,可以進(jìn)行通過核酸樣品中的多個(gè)等位基因的特異性擴(kuò)增和測序來鑒定序列變體的方法。先通過設(shè)計(jì)的PCR引物對對核酸進(jìn)行擴(kuò)增,以擴(kuò)增目標(biāo)區(qū)或核酸群的共有區(qū)段附近的區(qū)。隨后使PCR反應(yīng)的每種產(chǎn)物(第一擴(kuò)增子)在單獨(dú)的反應(yīng)容器(例如上述基于乳液的容器)中分別進(jìn)一步擴(kuò)增。對各來源于第一擴(kuò)增子群的一個(gè)成員的所得擴(kuò)增子(本文稱為第二擴(kuò)增子)進(jìn)行測序,序列集合體用來測定存在的一種或多種變體的等位基因頻率。重要的是,該方法不需要存在變體的先有知識,且通??设b定以頻率〈1%存在于核酸分子群中的變體。所述靶特異性擴(kuò)增和測序方法的一些優(yōu)勢包括比之前達(dá)到的更高水平的靈敏度,并且特別可用于包括模板核酸分子的混合群體的策略。此外,使用高通量測序儀器的實(shí)施方案,例如使用由454 Life Sciences Corporation提供的孔的所謂PicoTiterPlate 陣列(有時(shí)亦稱PTP 板或陣列)的實(shí)施方案,所述方法可用來產(chǎn)生每次運(yùn)行或?qū)嶒?yàn)超過100,000、超過300,000、超過500,000或超過1,000, 000核酸區(qū)的序列組成,且至少部分可
取決于用戶偏好,例如通過使用墊圈能用的通道配置等。此外,所述方法提供檢測低豐度等位基因的靈敏度,低豐度等位基因可代表樣品中存在1%或以下的等位基因變體。該方法的另一個(gè)優(yōu)點(diǎn)包括成生包括分析區(qū)的序列的數(shù)據(jù)。重要的是,不必具有待分析基因座的序列的先有知識。用于測序的靶特異性擴(kuò)增子的其它實(shí)例描述于2005年4月12日提交的美國專利申請順序號 11/104,781,標(biāo)題為 “Methods for determining sequence variants usingultra-deep sequencing (使用超深度測序測定序列變體的方法)”;2008年3月14日提交的 PCT 專利申請順序號 US2008/003424,標(biāo)題為“System and Method for Detection ofHIV Drug Resistant Variants (用于HIV藥物抗性變體檢測的系統(tǒng)和方法)”;以及2009年6月 17 日提交的美國專利號7,888,034,標(biāo)題為“System and Method for Detection ofHIV Tropism Variants (用于HIV向性變體檢測的系統(tǒng)和方法)”,其每一份均通過引用以其整體結(jié)合到本文中用于所有目的。此外,測序的實(shí)施方案可包括Sanger型技術(shù),通常稱為雜交測序(SBH)、連接測序(SBL)或摻入測序(SBI)技術(shù)的技術(shù)。測序技術(shù)還可包括所謂的polony測序技術(shù);納米孔(nanopore)、波導(dǎo)和其它單一分子檢測技術(shù);或可逆終止子技術(shù)。如上所述,優(yōu)選的技術(shù)可包括合成測序方法。例如,一些SBS實(shí)施方案對核酸模板的基本相同的拷貝群進(jìn)行測序,并且通常使用一種或多種寡核苷酸引物,其被設(shè)計(jì)成退火至樣品模板分子或與模板分子連接的一個(gè)或多個(gè)銜接頭的預(yù)先確定的互補(bǔ)位置。在核酸聚合酶存在下,引物/模板復(fù)合物與核苷酸物類一起存在。如果核苷酸物類與對應(yīng)于樣品模板分子上的序列位置(其與寡核苷酸引物3’端直接相鄰)的核酸物類互補(bǔ),則聚合酶可用核苷酸物類使引物延伸?;蛘?,在某些實(shí)施方案中,引物/模板復(fù)合物與大量目標(biāo)核苷酸物類(通常A、G、C和T)同時(shí)存在,并摻入與樣品模板分子上的相應(yīng)序列位置(其與寡核苷酸引物的3’端直接相鄰)互補(bǔ)的核苷酸物類。在所述實(shí)施方案的任一個(gè)中,核苷酸物類可被化學(xué)封閉(例如在3’-0位上)以防止進(jìn)一步延伸,并且需要在下一輪合成時(shí)解封閉。還應(yīng)理解將核苷酸物類添加到新生分子末端的方法是與上述添加至引物末端的方法基本相同的。如上所述,可通過本領(lǐng)域已知的各種方法,來檢測核苷酸物類的摻入,例如通過利用酶促反應(yīng)方法以產(chǎn)生光來檢測焦磷酸(PPi)的釋放,或者通過檢測H+的釋放和測量pH的變化(描述于美國專利號6,210,891,6, 258,568和6,828,100的實(shí)施例,其每一份均通過引用以其整體結(jié)合到本文中用于所有目的),或者通過與核苷酸結(jié)合的可檢測標(biāo)記。可檢測標(biāo)記的一些實(shí)例包括但不限于質(zhì)量標(biāo)簽(mass tag)和熒光或化學(xué)發(fā)光標(biāo)記。在典型的實(shí)施方案中,例如通過洗漆除去未摻入的核苷酸。此外,在某些實(shí)施方案中,可對未摻入的核苷酸進(jìn)行酶促降解,例如使用描述于以下文獻(xiàn)的腺苷三磷酸雙磷酸酶或焦磷酸酶的降解:2008年6月27日提交的美國專利申請順序號12/215,455,標(biāo)題為“System and Method forAdaptive Reagent Control in Nucleic Acid Sequencing (核酸測序中適應(yīng)性試劑控制的系統(tǒng)和方法)”;以及2009年I月29日提交的12/322,284,標(biāo)題為“System and Methodfor Improved Signal Detection in Nucleic Acid Sequencing (核酸測序中改進(jìn)的信號檢測的系統(tǒng)和方法)”;其每一份均通過引用以其整體結(jié)合到本文中用于所有目的。在使用可檢測標(biāo)記的實(shí)施方案中, 在隨后的合成循環(huán)之前,可檢測標(biāo)記通常須被滅活(例如通過化學(xué)裂解或光漂白)。如上所述,可用另一核苷酸物類或大量的目標(biāo)核苷酸物類查詢模板/聚合酶復(fù)合物中的下一個(gè)序列位置。核苷酸添加、延伸、信號采集和洗滌的重復(fù)循環(huán)導(dǎo)致模板鏈的核苷酸序列的確定。隨著本實(shí)例的繼續(xù),通常在任一測序反應(yīng)中同時(shí)分析大量或大批基本相同的模板分子(例如103、104、105、IO6或IO7個(gè)分子),以獲得強(qiáng)到足以可靠檢測的信號。另外,在某些實(shí)施方案中,通過應(yīng)用所謂的“配對末端(paired-end) ”測序策略改進(jìn)測序方法的讀取長度容量和質(zhì)量可能是有利的。例如,測序方法的某些實(shí)施方案對從中可生成高質(zhì)量的可靠讀數(shù)的分子總長度有限制。換句話說,可靠讀取長度的序列位置總數(shù)可不超過25、50、100或500個(gè)堿基,這取決于所采用的測序?qū)嵤┓桨?。配對末端測序策略通過對分子的每個(gè)末端(有時(shí)稱為“標(biāo)簽”端)進(jìn)行分別測序來延長可靠讀取長度,所述分子包括通過接頭序列在中心連接的每個(gè)末端上的原始模板核酸分子的片段。模板片段的原始位置關(guān)系是已知的,因此來自序列讀數(shù)的數(shù)據(jù)可重新組合成為具有更長的高質(zhì)量讀取長度的單一讀數(shù)。配對末端測序?qū)嵤┓桨傅钠渌鼘?shí)例描述于美國專利號7,601,499,標(biāo)題為“Paired end sequenci ng (配對末端測序)”;以及2009年I月28日提交的美國專利申請順序號12/322,119,標(biāo)題為“Paired end sequencing (配對末端測序)”,其每一份均通過引用以其整體結(jié)合到本文中用于所有目的。SBS儀器的一些實(shí)例可執(zhí)行上述某些或全部方法,并可包括一種或多種檢測設(shè)備,例如用于光學(xué)檢測的電荷耦合裝置(即CCD攝影機(jī))或共焦型體系結(jié)構(gòu)(confocal typearchitecture)、用于離子或化學(xué)檢測體系結(jié)構(gòu)的離子敏場效應(yīng)晶體管(亦稱為“ISFET”)或化學(xué)敏場效應(yīng)晶體管(亦稱為“ChemFET” )、微流體室或流動池、反應(yīng)基質(zhì)和/或泵和流動閥。以基于焦磷酸的測序?yàn)槔瑑x器的某些實(shí)施方案可利用產(chǎn)生固有低水平的本底噪聲的化學(xué)發(fā)光檢測策略。在某些實(shí)施方案中,用于測序的反應(yīng)基質(zhì)可包括平面基質(zhì),例如載玻片型基質(zhì)、包含其中含有ISFET檢測元件的孔型結(jié)構(gòu)的半導(dǎo)體芯片,或在某些實(shí)施方案中可包括孔型結(jié)構(gòu)的波導(dǎo)型反應(yīng)基質(zhì)。此外,反應(yīng)基質(zhì)可包括如上所述可獲自454 Life SciencesCorporation的、由光纖面板形成的所謂PTP 陣列,所述光纖面板經(jīng)酸蝕刻以產(chǎn)生幾十萬或更多極小孔,各孔能夠容納基本相同的模板分子群(即一些優(yōu)選的實(shí)施方案,在孔與孔的間距為35 μπι的70 X 75mm PTP 陣列上包括約330萬個(gè)孔)。在某些實(shí)施方案中,可將基本相同的模板分子的每個(gè)群體布置在固相基質(zhì)(例如珠粒)上,其每一個(gè)都可被置于所述孔之一中。例如,儀器可包括試劑遞送元件用于將流體試劑供給PTP板架,以及能夠收集從PTP板上的各孔中發(fā)出的光的光子的CCD型檢測裝置。包括改進(jìn)的信號識別的特征的反應(yīng)基質(zhì)的實(shí)例描述于2005年8月30日提交的美國專利號7,682,816,標(biāo)題為“1'!1爪41111COATED MICROffELL ARRAYS AND METHODS OF MAKING SAME (薄膜包被的微孔陣列和制備所述微孔陣列的方法)”,其通過引用以其整體結(jié)合到本文中用于所有目的。用于進(jìn)行SBS型測序和焦磷酸測序的儀器和方法的其它實(shí)例描述于美國專利號7,323,305和7,575,865,均在上文中通過引用予以結(jié)合。另外,可采用使一個(gè)或多個(gè)樣品制備過程自動化的系統(tǒng)和方法,例如上述emPCR 方法。例如,可采用自動化系統(tǒng)以提供有效溶液用于產(chǎn)生用于emPCR處理的乳液、進(jìn)行PCR熱循環(huán)操作,并富集成功制備的核酸分子群用于測序。自動化樣品制備系統(tǒng)的實(shí)例描述于美國專利號7,927,797和美國專利申請順序號13/045,210,其每一份均通過引用以其整體結(jié)合到本文中用于所有目的。此外,目前描述的本發(fā)明的實(shí)施方案的系統(tǒng)和方法可包括使用存儲用于在計(jì)算機(jī)系統(tǒng)中執(zhí)行的計(jì)算機(jī)可讀介質(zhì)的一些設(shè)計(jì)、分析或其它操作的執(zhí)行。例如,下面詳細(xì)描述了處理采用SBS系統(tǒng)和方法生成的檢測信號和/或分析數(shù)據(jù)的若干實(shí)施方案,其中處理和分析實(shí)施方案可在計(jì)算機(jī)系統(tǒng)中執(zhí)行。用于本發(fā)明的計(jì)算機(jī)系統(tǒng)的示例性實(shí)施方案可包括任何類型的計(jì)算機(jī)平臺,例如工作站、個(gè)人計(jì)算機(jī)、服務(wù)器或任何其它現(xiàn)有的或未來的計(jì)算機(jī)。然而,本領(lǐng)域普通技術(shù)人員應(yīng)了解,本文所述的前述計(jì)算機(jī)平臺經(jīng)過特殊配置以執(zhí)行本發(fā)明的專門操作,不得視為通用計(jì)算機(jī)。計(jì)算機(jī)通常包括已知部件,例如處理器、操作系統(tǒng)、系統(tǒng)存儲器、存儲設(shè)備、輸入輸出控制器、輸入輸出設(shè)備和顯示設(shè)備。相關(guān)領(lǐng)域普通技術(shù)人員還應(yīng)了解,有許多可能的計(jì)算機(jī)配置和部件,還可包括高速緩沖存儲器、數(shù)據(jù)備份設(shè)備和許多其它設(shè)備。顯示設(shè)備可包括提供視覺信息的顯示設(shè)備,這種信息通??稍谶壿嫼?或物理上經(jīng)組構(gòu)成為像素陣列。還可包括接口控制器,其可包括用于提供輸入和輸出接口的各種已知的或未來的軟件程序的任一種。例如,接口可包括通常所謂的“圖形用戶界面”(通常稱為GUI),為用戶提供一個(gè)或多個(gè)圖示。接口通常能夠接受使用相關(guān)領(lǐng)域普通技術(shù)人員已知的選擇或輸入方式的用戶輸入。在相同或備選實(shí)施方案中,在計(jì)算機(jī)上的應(yīng)用程序可采用包括所謂的“命令行接口”(通常稱為CLI)的接口。CLI通常提供應(yīng)用程序與用戶間的基于文本的互動。通常,命令行接口作為通過顯示設(shè)備的文本行顯示輸出并接收輸入。例如,一些實(shí)施可包括所謂的“外殼程序”,例如相關(guān)領(lǐng)域普通技術(shù)人員已知的Unix Shells或采用面向?qū)ο笮途幊腆w系結(jié)構(gòu)的 Microsoft Windows Powershel I,例如 Microsoft.NET 框架。相關(guān)領(lǐng)域普通技術(shù)人員應(yīng)了解接口可包括一個(gè)或多個(gè)⑶1、CLI或其組合。
處理器可包括市售處理器,例如Intel Corporation制造的Celeron 、Core 或Pentium 處理器、由Sun Microsystems制造的SPARC 處理器、由AMD公司制造的Athlon 、Sempix)nTM、Phen0mTM或Opteixm 處理器,或者可以是市售的或?qū)⒖色@得的其它處理器之一。處理器的某些實(shí)施方案可包括所謂的多核處理器和/或能夠采用單核或多核配置的平行處理技術(shù)。例如,多核體系結(jié)構(gòu)通常包括兩個(gè)或更多個(gè)處理器“執(zhí)行核”。在本實(shí)例中,各執(zhí)行核可作為獨(dú)立處理器執(zhí)行,使得多線程平行執(zhí)行成為可能。另外,相關(guān)領(lǐng)域普通技術(shù)人員應(yīng)了解,處理器可以一般稱之為32位或64位的多核體系結(jié)構(gòu)或目前已知或未來可開發(fā)的其它體系結(jié)構(gòu)配置進(jìn)行配置。處理器通常執(zhí)行操作系統(tǒng),操作系統(tǒng)可為例如來自Microsoft Corporation的Windows 型操作系統(tǒng)(例如 Windows XP> Windows Vista 或 Windows _7);來自 AppleComputer Corp 的Mac OS X操作系統(tǒng)(例如Mac OS X vl0.6 “Snow Leopard”操作系統(tǒng));可獲自許多廠商的Unix 或Linux型操作系統(tǒng)或所謂的開放源碼;其它操作系統(tǒng)或未來的操作系統(tǒng);或其某些組合。操作系統(tǒng)以眾所周知的方式與固件和硬件對接,便于處理器協(xié)調(diào)和執(zhí)行可用各種編程語言編寫的各種計(jì)算機(jī)程序的功能。通常與處理器協(xié)作的操作系統(tǒng)協(xié)調(diào)并執(zhí)行功能計(jì)算機(jī)的其它部件的功能。操作系統(tǒng)還提供調(diào)度、輸入-輸出控制、文檔和數(shù)據(jù)管理、存儲管理和通信控制和相關(guān)服務(wù),所有這些都依照已知的技術(shù)。
系統(tǒng)存儲器可包括各種已知的或未來的存儲設(shè)備的任一種。實(shí)例包括任何普遍可獲得的隨機(jī)存取存儲器(RAM)、磁性介質(zhì)例如常駐硬盤或磁帶、光學(xué)介質(zhì)例如讀寫光盤或其它存儲設(shè)備。存儲設(shè)備可包括各種已知的或未來的設(shè)備的任一種,包括磁盤驅(qū)動器、磁帶驅(qū)動器、移動硬盤驅(qū)動器、USB或閃速驅(qū)動器或軟盤驅(qū)動器。這類類型的存儲設(shè)備通常分別由程序存儲介質(zhì)(未顯示)讀取和/或?qū)懭氤绦虼鎯橘|(zhì),例如光盤、磁帶、移動硬盤、USB或閃速驅(qū)動器或軟盤。目前在用或可稍后開發(fā)的這些程序存儲介質(zhì)的任一種,都可視為計(jì)算機(jī)程序產(chǎn)品。應(yīng)了解這些程序存儲介質(zhì)通常存儲計(jì)算機(jī)軟件程序和/或數(shù)據(jù)。計(jì)算機(jī)軟件程序,亦稱計(jì)算機(jī)控制邏輯,通常存儲在系統(tǒng)存儲器和/或與存儲設(shè)備聯(lián)用的程序存儲設(shè)備中。在某些實(shí)施方案中,描述了包括計(jì)算機(jī)可用介質(zhì)的計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)可用介質(zhì)具有存儲在其中的控制邏輯(計(jì)算機(jī)軟件程序,包括程序代碼)??刂七壿嫯?dāng)通過處理器執(zhí)行時(shí),致使處理器執(zhí)行本文所述功能。在其它實(shí)施方案中,某些功能主要在硬件中使用例如硬件狀態(tài)機(jī)來執(zhí)行。為了執(zhí)行本文所述功能,硬件狀態(tài)機(jī)的執(zhí)行對相關(guān)領(lǐng)域技術(shù)人員而言將是顯而易見的。輸入輸出控制器可包括接受和處理用戶信息的各種已知設(shè)備的任一種,用戶不論是人還是機(jī)器,不論是本地的還是遠(yuǎn)程的。這類設(shè)備包括例如調(diào)制解調(diào)卡、無線卡、網(wǎng)絡(luò)接口卡、聲卡或用于各種已知輸入設(shè)備任一種的其它類型的控制器。輸出控制器可包括用于向用戶提供信息的各種已知顯示設(shè)備任一種的控制器,用戶不論是人還是機(jī)器,不論是本地的還是遠(yuǎn)程的。在所述實(shí)施方案中,計(jì)算機(jī)的功能元件通過系統(tǒng)總線彼此通信。計(jì)算機(jī)的某些實(shí)施方案可利用網(wǎng)絡(luò)或其它類型的遠(yuǎn)程通信與某些功能元件通信。對相關(guān)領(lǐng)域技術(shù)人員將是顯而易見的是,如果在軟件中執(zhí)行,則可將儀器控制和/或數(shù)據(jù)處理應(yīng)用程序裝載到系統(tǒng)存儲器和/或存儲設(shè)備內(nèi)并由其執(zhí)行。儀器控制和/或數(shù)據(jù)處理應(yīng)用程序的全部或部分還可駐留在只讀存儲器或存儲設(shè)備的類似設(shè)備中,這類設(shè)備不需要儀器控制和/或數(shù)據(jù)處理應(yīng)用程序先通過輸入輸出控制器裝載。相關(guān)領(lǐng)域技術(shù)人員應(yīng)了解儀器控制和/或數(shù)據(jù)處理應(yīng)用程序或其部分,可以已知方式通過處理器裝載到系統(tǒng)存儲器或高速緩沖存儲器 或兩者中以利于執(zhí)行。此外,計(jì)算機(jī)可包括一個(gè)或多個(gè)庫文件、實(shí)驗(yàn)數(shù)據(jù)文件和存儲在系統(tǒng)存儲器中的互聯(lián)網(wǎng)客戶程序。例如,實(shí)驗(yàn)數(shù)據(jù)可包括一個(gè)或多個(gè)實(shí)驗(yàn)或測定的相關(guān)數(shù)據(jù),例如檢出信號值或與一個(gè)或多個(gè)SBS實(shí)驗(yàn)或方法相關(guān)的其它值。另外,互聯(lián)網(wǎng)客戶程序可包括能夠利用網(wǎng)絡(luò)訪問另一臺計(jì)算機(jī)的遠(yuǎn)程服務(wù)的應(yīng)用程序,并且可包括例如一般所稱的“網(wǎng)頁瀏覽器”。在本實(shí)例中,一些常用的網(wǎng)頁瀏覽器包括可獲自Microsoft Corporation的Microsoft Internet Explorer 8、來自 Mozilla Corporation 的Mozilla Firefox 3.6、來自 Apple Computer Corp.的 Safari 4、來自 Google Corporation 的 Google Chrome 或本領(lǐng)域目前已知或未來開發(fā)的其它類型的網(wǎng)頁瀏覽器。此外,在相同實(shí)施方案或其它實(shí)施方案中,互聯(lián)網(wǎng)客戶程序可包括能夠通過網(wǎng)絡(luò)訪問遠(yuǎn)程信息的專業(yè)軟件應(yīng)用程序或可以是其組件,例如用于生物應(yīng)用的數(shù)據(jù)處理應(yīng)用程序。網(wǎng)絡(luò)可包括本領(lǐng)域普通技術(shù)人員熟知的多種不同網(wǎng)絡(luò)類型的一種或多種。例如,網(wǎng)絡(luò)可包括利用通常所稱的TCP/IP協(xié)議套進(jìn)行通信的局域網(wǎng)或廣域網(wǎng)。網(wǎng)絡(luò)可包括這樣的網(wǎng)絡(luò),其包括通常稱為互聯(lián)網(wǎng)的互連計(jì)算機(jī)網(wǎng)絡(luò)全球系統(tǒng),或者還可包括各種內(nèi)聯(lián)網(wǎng)體系結(jié)構(gòu)。相關(guān)領(lǐng)域普通技術(shù)人員還應(yīng)了解,聯(lián)網(wǎng)環(huán)境中一些用戶可能更喜歡利用所謂的“防火墻”(有時(shí)亦稱數(shù)據(jù)包過濾器(Packet Filter)或邊界保護(hù)裝置(Border ProtectionDevices))以控制信息在硬件和/或軟件系統(tǒng)間的往返通信。例如,防火墻可包括硬件或軟件組件或其某些組合,通常被設(shè)計(jì)成強(qiáng)制執(zhí)行用戶(例如網(wǎng)絡(luò)管理員等)設(shè)定的安全策略。b.本發(fā)明的實(shí)施方案
如上所述,本發(fā)明的實(shí)施方案涉及檢測樣品中的分化體A、B、C、D、F和G或多種分化體的重組體的HIV逆轉(zhuǎn)錄酶和蛋白酶序列變體和通過使變體序列組成與藥物抗性和/或靈敏度類型關(guān)聯(lián)而檢測抗性和/或靈敏度與靶向存在的HIV逆轉(zhuǎn)錄酶和蛋白酶功能的藥物的相關(guān)性的方法。另外,本發(fā)明的實(shí)施方案涉及多重測序測定法,該測定法將多個(gè)樣品混入混合庫中,并進(jìn)行測序以對來自分化體A、B、C、D、F和G或其重組體的各個(gè)樣品變體的同時(shí)檢測進(jìn)行平行檢測,其中為各樣品指派多重標(biāo)識序列(MID)以使已鑒定的變體與樣品關(guān)聯(lián)。本領(lǐng)域普通技術(shù)人員應(yīng)了解,樣品通??蓙碓从趩蝹€(gè)分化體或者兩個(gè)或更多個(gè)分化體之間的重組。還應(yīng)了解,所述相關(guān)性可包括檢出變體與已知與藥物抗性和/或靈敏度有關(guān)的變異的診斷相關(guān)性,以及檢出變體與樣品的藥物抗性和/或靈敏度表型的發(fā)現(xiàn)相關(guān)性。本發(fā)明的實(shí)施方案包括靶向已知與藥物抗性和/或靈敏度類型有關(guān)的HIV逆轉(zhuǎn)錄酶和蛋白酶的區(qū)、與由數(shù)千病毒顆粒平行生成序列信息的測序技術(shù)聯(lián)用的兩階段PCR技術(shù)(即如上所述產(chǎn)生第一和第二擴(kuò)增子),該技術(shù)能夠鑒定HIV逆轉(zhuǎn)錄酶和蛋白酶類型的出現(xiàn)(根據(jù)類型與樣品中變體的檢出序列組成的關(guān)聯(lián)),甚至以低頻率出現(xiàn)在樣品中的類型。實(shí)際上,本發(fā)明的實(shí)施方案可 檢出含有非化學(xué)計(jì)量的等位基因量的HIV病毒顆粒的樣品中存在的序列變體,例如以大于50%、小于50%、小于25%、小于10%、小于5%或小于1%存在的HIV逆轉(zhuǎn)錄酶和蛋白酶變體。所述實(shí)施方案使得以快速可靠且具成本效益的方式的這種鑒定成為可能。在一個(gè)典型的測序?qū)嵤┓桨钢校墒褂檬挂粋€(gè)或多個(gè)工序自動化的一種或多種儀器組件。例如,可使用使一些或全部工序自動化并進(jìn)行一些或全部工序的儀器來實(shí)現(xiàn)測序方法的實(shí)施方案。圖1提供測序儀器100的說明性實(shí)例,其對于需要俘獲光學(xué)信號的測序過程,通常包括光學(xué)子系統(tǒng)和流體子系統(tǒng),以執(zhí)行發(fā)生在反應(yīng)基質(zhì)105上的測序反應(yīng)和數(shù)據(jù)捕獲。然而,應(yīng)了解對于需要數(shù)據(jù)捕獲的其它方式(即pH、溫度、電化學(xué)等)的測序過程,可采用相關(guān)領(lǐng)域普通技術(shù)人員已知的用于數(shù)據(jù)捕獲方式的子系統(tǒng)。例如,可通過用戶101或一些自動化實(shí)施方案將模板分子樣品加載到反應(yīng)基質(zhì)105上,然后使用測序儀器100以大量平行方式測序,以生成代表各模板分子的序列組成的序列數(shù)據(jù)。重要的是,用戶101可包括任何這樣的用戶,包括但不限于獨(dú)立研究人員、技術(shù)人員、臨床醫(yī)生、大學(xué)或法人實(shí)體。在某些實(shí)施方案中,樣品可任選使用樣品制備儀器180以完全自動化或部分自動化方式制備用于測序,樣品制備儀器180經(jīng)配置以進(jìn)行一些或全部必要制備物以用于使用儀器100的測序。本領(lǐng)域普通技術(shù)人員應(yīng)了解,樣品制備儀器180為用于說明目而提供,并且可代表一種或多種儀器,所述儀器各自經(jīng)設(shè)計(jì)以進(jìn)行與特定測序測定所需要的樣品制備有關(guān)的一些或全部步驟。樣品制備儀器的實(shí)例可包括機(jī)器人平臺,例如可獲自HamiltonRobotics、Beckman Coulter 或 Caliper Life Sciences 的機(jī)器人平臺。此外,如圖1所示,測序儀器100可與一個(gè)或多個(gè)外部計(jì)算機(jī)組件有效連接,外部計(jì)算機(jī)組件例如可執(zhí)行系統(tǒng)軟件或固件例如應(yīng)用程序135的計(jì)算機(jī)130,應(yīng)用程序135可提供對一個(gè)或多個(gè)儀器例如測序儀器100或樣品制備儀器180的指令控制和/或數(shù)據(jù)分析功能。計(jì)算機(jī)130還可通過網(wǎng)絡(luò)150與其它計(jì)算機(jī)或服務(wù)器有效連接,網(wǎng)絡(luò)150能夠遠(yuǎn)程操作儀器系統(tǒng)和將大量數(shù)據(jù)輸出至能夠存儲和處理的系統(tǒng)。在本實(shí)例中,測序儀器100和/或計(jì)算機(jī)130可包括上文概述的實(shí)施方案的一些或全部組件和特性。在本發(fā)明的一個(gè)方面,根據(jù)被設(shè)計(jì)成以極低偏差方式產(chǎn)生擴(kuò)增子的分化體A(>500個(gè)序列)、B (>1000個(gè)序列)、C (>4000個(gè)序列)、D (>800個(gè)序列)和F/G (約300個(gè)序列)的HIV序列比對,設(shè)計(jì)靶特異性引物直接用于所述測序應(yīng)用。已知HIV序列的比對可采用相關(guān)領(lǐng)域普通技術(shù)人員已知的方法進(jìn)行。例如,本領(lǐng)域可獲得多種序列比對方法、算法和應(yīng)用程序,包括但不限于Smith-Waterman算法(Smith, T.F.和Waterman, M.S.147 (1981) J.Mol.Biol.195-197) ;BLAST 算法(Altschul,S.F.等,J.Mol.Biol.215 (1990) 403-410);以及 Clustal (Thompson,J.D.等,Nucl.Acids Res.25 (1997)4876-4882)。序列與單一序列的比對提供HIV序列群最常見序列組成的共有序列。同樣在本實(shí)例中,軟件應(yīng)用程序可標(biāo)出HIV分型的目標(biāo)區(qū),以及針對比對的共有序列的引物序列的靶區(qū)。目標(biāo)區(qū)包括已知對突變敏感的區(qū)和可促成HIV抑制劑抗性的區(qū)。然后可以設(shè)計(jì)針對共有序列區(qū)的引物組,所述共有序列區(qū)比已知突變易感性的區(qū)更保守(即較不可能突變)。此外,引物設(shè)計(jì)包括其它考慮,例如就用于測定擴(kuò)增產(chǎn)物序列組成的測序技術(shù)的讀取長度容量而言,所得到的擴(kuò)增產(chǎn)物的長度。對于引物設(shè)計(jì),具有低突變率的靶向序列區(qū)的優(yōu)點(diǎn)包括可靠地使用設(shè)計(jì)引物而沒有因可能使引物不能結(jié)合的靶區(qū)上的變異所致失敗的實(shí)質(zhì)危險(xiǎn)的能力。重要的是,設(shè)計(jì)本發(fā)明的引物,使得每個(gè)引物組可從多個(gè)HIV分化體產(chǎn)生擴(kuò)增子,具體地說每個(gè)引物組可從HIV分化體A、B、C、D、F和G及兩個(gè)或更多個(gè)分化體的相關(guān)重組體產(chǎn)生擴(kuò)增子。實(shí)際上,本發(fā)明特別可用于檢測分化體間發(fā)生的重組事件。例如,由于本發(fā)明的引物對分化體A 、B、C、D、F和G群內(nèi)的特定分化體無選擇性,因此來自至少兩種不同分化體的重組變體可按所述方法擴(kuò)增和測序,至少部分是因?yàn)楸景l(fā)明的測序方法對其中來自分化體的序列元件重組的“折點(diǎn)”不敏感的事實(shí)。因此,可分析所生成的序列數(shù)據(jù),并鑒定重組事件,因?yàn)槌伺c分化體特異性序列特征的關(guān)聯(lián)外,不需要事前信息。另外,本領(lǐng)域普通技術(shù)人員了解,可視為共有序列“保守”區(qū)的區(qū)內(nèi)的某些位置在其組成方面仍是可變的,被視為“簡并”位置。在某些優(yōu)選的實(shí)施方案中,用于引物設(shè)計(jì)的參數(shù)包括:在其中在用于確定共有序列的多重序列比對中在某位置上存在小于98%頻率的核苷酸物類的情況下,在引物組成中的該位置上取代入簡并堿基。另外,影響結(jié)合靶區(qū)選擇和引物組成的其它參數(shù)包括限制簡并位置在僅有兩個(gè)備選核苷酸物類的簡并位置上,并且限制引物組成不超過兩個(gè)簡并位置以降低在擴(kuò)增反應(yīng)中形成引物二聚物的風(fēng)險(xiǎn),以及增加可通過保持引物重復(fù)數(shù)至最低限度而產(chǎn)生足量的擴(kuò)增產(chǎn)物的可能性(各簡并位置需要至少兩個(gè)重復(fù),每個(gè)具有備選核苷酸物類之一)。在某些實(shí)施方案中,還需要將簡并位置限于引物組成的最后5個(gè)序列位置(即在正向引物的3’端和反向引物的5’端上),因?yàn)樽詈?個(gè)位置高度保守對結(jié)合效率是有利的。例如,簡并序列位置通常具有至少兩個(gè)不同的作為該位置上的備選序列組成出現(xiàn)的核苷酸物類。在本文所述實(shí)施方案中,無簡并核苷酸摻入代表大于兩個(gè)核苷酸的引物設(shè)計(jì)中(即不使用可代表3或4個(gè)核苷酸的H、B、V或N),這再次增加可產(chǎn)生的足量擴(kuò)增產(chǎn)物的可能性。簡并堿基是本領(lǐng)域眾所周知的,并且各種類型的簡并用表不與該類型有關(guān)的備選核苷酸組成的IUPAC符號表不。例如,IUPAC符號R表不嘌呤堿基(即A和G)是可能的備選物。本發(fā)明的一個(gè)實(shí)施方案包括下列設(shè)計(jì)成產(chǎn)生適于高通量測序的6種擴(kuò)增子的引物物類:
TOFMuW
5' C:Xn;4TCG(XlXtXTC:CirCJC,C'ATC,ACiAAT('AC,TrnTGGC,ARCGAC'C.3' tSEQ ID NO:1)
Mil.Niifih
5' CTATCK:CiC:C:mit:CACKX:CCiC'TCACiWOCi€CT:ATC:(:AWrtTCi(i 3'
CSEQ ID NO; >)
Iili Mtilii l>-2
5' CGTAT€G(:€TCTX.TCGC.G€CATCAGGCAATTGGAGG1T1TATCAA RGTI'
(SEC) ID NO: J)
權(quán)利要求
1.一種用于檢測低頻率出現(xiàn)的與逆轉(zhuǎn)錄酶和/或蛋白酶有關(guān)的一種或多種Hiv序列變體的方法,所述方法包括以下步驟: (a)自HIV樣品群中的多種RNA分子中產(chǎn)生cDNA物類; (b)由所述cDNA物類擴(kuò)增多種第一擴(kuò)增子以產(chǎn)生第一擴(kuò)增子的擴(kuò)增拷貝,其中各第一擴(kuò)增子用能夠從HIV分化體產(chǎn)生擴(kuò)增子的核酸引物對擴(kuò)增,所述HIV分化體包括分化體A、分化體B、分化體C、分化體D、分化體F和分化體G ; (c)對第一擴(kuò)增子的擴(kuò)增拷貝進(jìn)行克隆擴(kuò)增以產(chǎn)生多種第二擴(kuò)增子; (d)測定第二擴(kuò)增子的核酸序列組成;和 (e)檢測第二擴(kuò)增子的核酸序列組成中的一種或多種序列變體。
2.權(quán)利要求1的方法,所述方法還包括以下步驟: (f)使檢出的序列變體與HIV逆轉(zhuǎn)錄酶或蛋白酶相關(guān)變異關(guān)聯(lián)。
3.權(quán)利要求1的方法,其中: 已知HIV逆轉(zhuǎn)錄酶或蛋白酶相關(guān)變異與對抑制劑的抗性有關(guān)。
4.權(quán)利要求1的方法,其中: 所述核酸引物對能夠由包含兩個(gè)分化體的重組體的重組體HIV分化體產(chǎn)生擴(kuò)增子,所述分化體選自分化體A、分化體B、分化體C、分化體D、分化體F和分化體G。
5.權(quán)利要求1的方法,其中: 所述多種擴(kuò)增子包括6種擴(kuò)增子。
6.權(quán)利要求5的方法,其中: 用于擴(kuò)增6種擴(kuò)增子的引物對包括Til3F Multi引物和TilR Multi引物;Ti2F MultiD-2 引物和 Ti2R Multi E_2 引物;Til3F Multi 引物和 Ti3R Multi B 引物;Ti4F Multi D2引物和Ti4R Multi B引物;Ti5F Multi引物和Ti5R Multi B引物;以及Ti6F Multi引物和 Ti6R Multi 引物。
7.權(quán)利要求5的方法,其中: 所述6種擴(kuò)增子提供與逆轉(zhuǎn)錄酶和蛋白酶相關(guān)的HIV區(qū)的完全覆蓋。
8.權(quán)利要求7的方法,其中: 所述6種擴(kuò)增子提供至少與逆轉(zhuǎn)錄酶和蛋白酶相關(guān)的HIV區(qū)的雙重覆蓋。
9.權(quán)利要求1的方法,其中: 所述多種擴(kuò)增子包括4種擴(kuò)增子。
10.權(quán)利要求9的方法,其中: 用于擴(kuò)增4種擴(kuò)增子的引物對包括Til3F Multi引物和Ti3R Multi B引物;Ti4FMulti A引物和Ti5R引物;Ti5Fn引物和Ti2R引物;以及Ti6F Multi引物和Ti6R Multi引物。
11.權(quán)利要求9的方法,其中: 所述4種擴(kuò)增子提供與轉(zhuǎn)錄酶和蛋白酶有關(guān)的HIV區(qū)的完全覆蓋。
12.權(quán)利要求1的方法,其中:檢出的序列變體在HIV病毒群中以1%或以下的頻率出現(xiàn)。
13.一種用于檢測與逆轉(zhuǎn)錄酶和/或蛋白酶區(qū)有關(guān)的一個(gè)或多個(gè)HIV序列變體的試劑盒,其包括:用于擴(kuò)增權(quán)利要求1的第一擴(kuò)增子的多個(gè)核酸引物對。
14.權(quán)利要求13的試劑盒,其中: 一個(gè)或多個(gè)引物對選自Til3F Multi引物和TilR Multi引物;Ti2F Multi D-2引物和 Ti2R Multi E-2 引物;Til3F Multi 引物和 Ti3R Multi B 引物;Ti4F Multi D2 引物和Ti4R Multi B 引物;Ti5F Multi 引物和 Ti5R Multi B 引物;Ti6F Multi 引物和 Ti6R Multi引物。
15.權(quán)利要求13的試劑盒,其中: 一個(gè)或多個(gè)引物對選自Til3F Multi引物和Ti3R Multi B引物;Ti4F Multi A引物和Ti5R引物;Ti5Fn引物和Ti2R引物;以及Ti6F Multi引物和Ti6R Multi引物。
全文摘要
本文描述了用于檢測低頻率出現(xiàn)的與逆轉(zhuǎn)錄酶和/或蛋白酶有關(guān)的一種或多種HIV序列變體的方法,所述方法包括以下步驟(a)從HIV樣品群的多種RNA分子中產(chǎn)生cDNA物類;(b)由cDNA物類擴(kuò)增多種第一擴(kuò)增子,其中各第一擴(kuò)增子用能夠從HIV分化體產(chǎn)生擴(kuò)增子的核酸引物對擴(kuò)增,所述HIV分化體包含分化體A、分化體B、分化體C、分化體D、分化體F和分化體G;(c)克隆擴(kuò)增第一擴(kuò)增子的擴(kuò)增拷貝以產(chǎn)生多種第二擴(kuò)增子;(d)測定第二擴(kuò)增子的核酸序列組成;和(e)檢測第二擴(kuò)增子的核酸序列組成中的一種或多種序列變體。
文檔編號C12Q1/70GK103154274SQ201180048703
公開日2013年6月12日 申請日期2011年10月6日 優(yōu)先權(quán)日2010年10月8日
發(fā)明者B.B.西門, E.P.圣約翰 申請人:霍夫曼-拉羅奇有限公司