交叉引用
本申請(qǐng)要求于2014年6月13日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?2/012,238、于2014年4月14日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/979,448、于2013年12月5日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/912,027、于2014年3月28日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/971,536、于2014年4月2日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/973,864、于2014年4月25日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/984,057、于2014年6月6日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?2/008,985、于2014年4月14日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/979,431、于2014年3月28日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?1/971,542以及于2014年8月4日提交的美國(guó)臨時(shí)申請(qǐng)?zhí)?2/033,125的權(quán)益,上述每一個(gè)申請(qǐng)均通過(guò)引用以其全文并入本文。
背景技術(shù):
人類(lèi)基因組計(jì)劃已經(jīng)導(dǎo)致測(cè)序成本顯著降低,從完成每個(gè)堿基約需10美元降低至少于0.00001美元。現(xiàn)在可以在研究和臨床設(shè)置中均常規(guī)地使用外顯子組測(cè)序,以用于檢測(cè)與疾病有關(guān)的遺傳性或獲得性突變,并且fda已經(jīng)列出了超過(guò)100種在其標(biāo)簽上具有基因型信息的藥物。此外,全基因組測(cè)序(wgs)的使用已經(jīng)變得十分普遍。然而,當(dāng)前的核酸測(cè)序技術(shù)可能受到測(cè)序長(zhǎng)度的限制。就這一點(diǎn)而言,當(dāng)前的技術(shù)仍然可能存在較大的局限性,這可能?chē)?yán)重限制wgs用于許多研究的可行性和實(shí)用性。也就是說(shuō),這些“下一代測(cè)序”(ngs)技術(shù)的讀取長(zhǎng)度可能相對(duì)較短。測(cè)序的工業(yè)標(biāo)準(zhǔn)或許可以說(shuō)是illuminahiseq2500,其可以對(duì)成對(duì)的150個(gè)堿基讀取(read)進(jìn)行測(cè)序。鑒于這種相對(duì)較短的讀取長(zhǎng)度,全基因組重新測(cè)序研究通??赡軐?duì)鑒別單核苷酸變體(snv)十分有用;然而,相對(duì)較短的讀取長(zhǎng)度對(duì)于鑒別大的插入/缺失(indel)以及結(jié)構(gòu)變體也可能是非常不可靠的。
此外,通??赡茈y以在不進(jìn)行相當(dāng)多的額外實(shí)驗(yàn)的情況下采用短讀取對(duì)變體進(jìn)行定相(phase)。因此,許多臨床應(yīng)用需要長(zhǎng)測(cè)序或可能從長(zhǎng)測(cè)序受益。
目前,可以生成長(zhǎng)讀取的技術(shù)具有低準(zhǔn)確率、低通量并且是昂貴的。因此,它們不是全基因組測(cè)序的可行選擇。最后,其他測(cè)序技術(shù)沒(méi)有提供詳細(xì)的序列信息。
為了解決這些問(wèn)題,提供了本文所述的方法、組合物、系統(tǒng)和試劑盒,以產(chǎn)生非常長(zhǎng)的讀取,即,百萬(wàn)堿基范圍,以及準(zhǔn)確鑒別許多(如果不是全部的話)遺傳變體(例如,單核苷酸多態(tài)性、插入/缺失、多倍性、轉(zhuǎn)座、重復(fù)和/或結(jié)構(gòu)變體)并將任何鑒別的變體定相至適當(dāng)?shù)耐慈旧w。
技術(shù)實(shí)現(xiàn)要素:
本公開(kāi)內(nèi)容的一個(gè)方面提供了一種制備修飾的表面的方法,其包括:(a)提供表面;(b)使引發(fā)劑物質(zhì)與所述表面共價(jià)鍵合;(c)從該引發(fā)劑物質(zhì)進(jìn)行聚合物的表面引發(fā)聚合,由此產(chǎn)生包含多個(gè)聚合物鏈的聚合物涂層;以及(d)將標(biāo)志物偶聯(lián)至該聚合物涂層。
在本文提供的方面的一些實(shí)施方案中,所述表面選自玻璃、二氧化硅、氧化鈦、氧化鋁、氧化銦錫(ito)、硅、聚二甲基硅氧烷(pdms)、聚苯乙烯、多環(huán)烯烴、聚甲基丙烯酸甲酯(pmma)、鈦和金。在本文提供的方面的一些實(shí)施方案中,所述表面包含玻璃。在本文提供的方面的一些實(shí)施方案中,所述表面包含硅。在本文提供的方面的一些實(shí)施方案中,所述表面選自流動(dòng)池、測(cè)序流動(dòng)池、流動(dòng)通道、微流體通道、毛細(xì)管、壓電表面、孔、微孔、微孔陣列、微陣列、芯片、晶片、非磁性珠、磁珠、鐵磁珠、順磁珠、超順磁珠以及聚合物凝膠。在本文提供的方面的一些實(shí)施方案中,所述引發(fā)劑物質(zhì)包含有機(jī)硅烷。在本文提供的方面的一些實(shí)施方案中,所述引發(fā)劑物質(zhì)包含圖40所示的分子。在本文提供的方面的一些實(shí)施方案中,所述聚合物物質(zhì)包含聚丙烯酰胺。在本文提供的方面的一些實(shí)施方案中,所述聚合物物質(zhì)包含pmma。在本文提供的方面的一些實(shí)施方案中,所述聚合物物質(zhì)包含聚苯乙烯。在本文提供的方面的一些實(shí)施方案中,所述進(jìn)行表面引發(fā)聚合包括原子轉(zhuǎn)移自由基聚合(atrp)。在本文提供的方面的一些實(shí)施方案中,所述進(jìn)行表面引發(fā)聚合包括可逆加成斷裂鏈轉(zhuǎn)移(raft)。在本文提供的方面的一些實(shí)施方案中,所述標(biāo)志物包含寡核苷酸。在本文提供的方面的一些實(shí)施方案中,所述標(biāo)志物包含5’acrydite修飾的寡核苷酸。
本公開(kāi)內(nèi)容的一個(gè)方面提供了一種用于轉(zhuǎn)移陣列的組合物,其包含:(a)基底;(b)偶聯(lián)至所述基底的涂層;以及(c)偶聯(lián)至所述涂層的多個(gè)第一接受體寡核苷酸,其中所述多個(gè)第一接受體寡核苷酸中的每一個(gè)均包含與附加至多個(gè)模板寡核苷酸中的每一個(gè)上的第一銜接子序列互補(bǔ)的序列,其中所述多個(gè)模板寡核苷酸存在于待轉(zhuǎn)移的陣列上。
在本文提供的方面的一些實(shí)施方案中,所述方法進(jìn)一步包括:(d)偶聯(lián)至所述涂層的多個(gè)第二接受體寡核苷酸,其中所述多個(gè)第二接受體寡核苷酸中的每一個(gè)均包含與待轉(zhuǎn)移的模板寡核苷酸的第二銜接子序列互補(bǔ)的序列。在本文提供的方面的一些實(shí)施方案中,所述第一銜接子序列位于或靠近所述待轉(zhuǎn)移的模板寡核苷酸的3’端。在本文提供的方面的一些實(shí)施方案中,所述第一銜接子序列位于或靠近所述待轉(zhuǎn)移的模板寡核苷酸的5’端。在本文提供的方面的一些實(shí)施方案中,所述第二銜接子序列位于或靠近所述待轉(zhuǎn)移的模板寡核苷酸的3’端。在本文提供的方面的一些實(shí)施方案中,所述第二銜接子序列位于或靠近所述待轉(zhuǎn)移的模板寡核苷酸的5’端。在本文提供的方面的一些實(shí)施方案中,所述涂層包括聚合物凝膠或涂層。在本文提供的方面的一些實(shí)施方案中,所述涂層包括丙烯酰胺或聚丙烯酰胺凝膠或涂層。
本公開(kāi)內(nèi)容的一個(gè)方面提供了一種用于轉(zhuǎn)移陣列的方法,其包括:(a)提供基底并提供偶聯(lián)至所述基底的多個(gè)第一接受體寡核苷酸,所述多個(gè)第一接受體寡核苷酸中的每一個(gè)均包含與附加至多個(gè)模板寡核苷酸上的第一銜接子序列互補(bǔ)的序列;(b)向所述基底的表面施加包含酶和dntp的反應(yīng)混合物;(c)使所述基底與包含所述模板寡核苷酸的陣列接觸;以及(d)使用所述多個(gè)模板寡核苷酸作為模板,進(jìn)行所述多個(gè)第一接受體寡核苷酸的延伸反應(yīng)。
在本文提供的方面的一些實(shí)施方案中,所述第一銜接子序列位于或靠近所述模板寡核苷酸的3’端處。在本文提供的方面的一些實(shí)施方案中,所述第一銜接子序列位于或靠近所述模板寡核苷酸的5’端。在本文提供的方面的一些實(shí)施方案中,所述基底包含聚合物。在本文提供的方面的一些實(shí)施方案中,所述基底包含丙烯酰胺或聚丙烯酰胺。
本公開(kāi)內(nèi)容的一個(gè)方面提供了一種用于生成陣列的方法,其包括:提供包含與其偶聯(lián)的至少1,000個(gè)不同寡核苷酸的模板陣列;將所述模板陣列與接受體陣列偶聯(lián),該接受體陣列具有與所述至少1,000個(gè)不同寡核苷酸的部分互補(bǔ)的多個(gè)寡核苷酸;以及在該模板陣列與酶陣列彼此偶聯(lián)時(shí)進(jìn)行酶促反應(yīng),由此生成包含接受體寡核苷酸的接受體陣列,其中至少40%的接受體寡核苷酸與來(lái)自所述至少1,000個(gè)不同寡核苷酸的全長(zhǎng)寡核苷酸互補(bǔ)或相同。
在本文提供的方面的一些實(shí)施方案中,該模板陣列包含至少100個(gè)斑點(diǎn)(spot)。在本文提供的方面的一些實(shí)施方案中,該模板陣列包含大小至多為約500μm的斑點(diǎn)。在本文提供的方面的一些實(shí)施方案中,接受體寡核苷酸相對(duì)于接受體陣列的方向性與模板寡核苷酸相對(duì)于模板陣列的方向性相同。在本文提供的方面的一些實(shí)施方案中,接受體寡核苷酸相對(duì)于接受體陣列的方向性與模板寡核苷酸相對(duì)于模板陣列的方向性相反。在本文提供的方面的一些實(shí)施方案中,生成多個(gè)接受體陣列。在本文提供的方面的一些實(shí)施方案中,在接受體陣列彼此之間,所述多個(gè)接受體寡核苷酸平均至少99%相同。在本文提供的方面的一些實(shí)施方案中,在接受體陣列彼此之間,所述接受體寡核苷酸至少99%相同。
本公開(kāi)內(nèi)容的一個(gè)方面提供了一種用于生成陣列的方法,其包括:使用包含模板寡核苷酸的模板陣列合成包含接受體寡核苷酸的接受體陣列,其中在合成期間,該接受體陣列與該模板陣列偶聯(lián)。
在本文提供的方面的一些實(shí)施方案中,至少40%的接受體寡核苷酸包含全長(zhǎng)產(chǎn)物。在本文提供的方面的一些實(shí)施方案中,至少50%的接受體寡核苷酸包含全長(zhǎng)產(chǎn)物。在本文提供的方面的一些實(shí)施方案中,至少60%的接受體寡核苷酸包含全長(zhǎng)產(chǎn)物。在本文提供的方面的一些實(shí)施方案中,接受體寡核苷酸相對(duì)于接受體陣列的方向性與模板寡核苷酸相對(duì)于模板陣列的方向性相同。在本文提供的方面的一些實(shí)施方案中,接受體寡核苷酸相對(duì)于接受體陣列的方向性與模板寡核苷酸相對(duì)于模板陣列的方向性相反。在本文提供的方面的一些實(shí)施方案中,生成多個(gè)接受體陣列。在本文提供的方面的一些實(shí)施方案中,在接受體陣列彼此之間,所述多個(gè)接受體寡核苷酸平均至少99%相同。在本文提供的方面的一些實(shí)施方案中,在接受體陣列彼此之間,所述接受體寡核苷酸至少99%相同。
本公開(kāi)內(nèi)容的一個(gè)方面提供了一種用于對(duì)模板核酸分子進(jìn)行測(cè)序的方法,其包括:(a)將一個(gè)或多個(gè)引物結(jié)合位點(diǎn)引入到所述模板核酸分子中,以生成引發(fā)的模板核酸分子;(b)使所述引發(fā)的模板核酸分子與包含固定于其上的引物的基底接觸,每個(gè)引物包含:(i)與引物結(jié)合位點(diǎn)互補(bǔ)的區(qū)域,和(ii)指示所述引物在所述基底上的物理位置的條形碼序列;(c)使用所述引物和模板核酸分子作為模板進(jìn)行延伸反應(yīng),由此生成延伸產(chǎn)物,每個(gè)延伸產(chǎn)物包含(i)所述模板核酸的片段或該片段的互補(bǔ)體的序列,和(ii)所述條形碼序列或其互補(bǔ)體的序列;(d)對(duì)所述延伸產(chǎn)物進(jìn)行測(cè)序以確定所述片段或其互補(bǔ)體以及條形碼序列或其互補(bǔ)體的序列;以及(e)采用所述條形碼序列組裝所述片段的序列,由此確定所述模板核酸分子的序列。
在本文提供的方面的一些實(shí)施方案中,所述方法進(jìn)一步包括在步驟(b)之前使所述核酸分子拉伸(stretching)。在本文提供的方面的一些實(shí)施方案中,所述拉伸通過(guò)分子梳理(molecularcombing)進(jìn)行。在本文提供的方面的一些實(shí)施方案中,所述拉伸通過(guò)分子穿線(molecularthreading)進(jìn)行。在本文提供的方面的一些實(shí)施方案中,所述拉伸通過(guò)轉(zhuǎn)移打印進(jìn)行。在本文提供的方面的一些實(shí)施方案中,所述拉伸在納米通道中進(jìn)行。在本文提供的方面的一些實(shí)施方案中,所述拉伸通過(guò)磁性鑷子進(jìn)行。在本文提供的方面的一些實(shí)施方案中,所述拉伸通過(guò)光學(xué)鑷子進(jìn)行。在本文提供的方面的一些實(shí)施方案中,所述基底包含玻璃。在本文提供的方面的一些實(shí)施方案中,所述基底包含疏水性玻璃。在本文提供的方面的一些實(shí)施方案中,所述基底包含聚合物涂層。
基于以下詳細(xì)描述,本發(fā)明的其他方面和優(yōu)點(diǎn)對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)將會(huì)變得顯而易見(jiàn),在以下詳細(xì)描述中僅顯示和描述了本發(fā)明的說(shuō)明性實(shí)施方案。應(yīng)當(dāng)理解,本發(fā)明允許有其他不同的實(shí)施方案,并且其一些細(xì)節(jié)能夠在各個(gè)明顯的方面發(fā)生改變,均不會(huì)偏離本公開(kāi)內(nèi)容。相應(yīng)地,附圖和說(shuō)明書(shū)將被視為在本質(zhì)上是說(shuō)明性的,而非限制性的。
援引并入
本說(shuō)明書(shū)中提及的全部出版物、專(zhuān)利和專(zhuān)利申請(qǐng)均通過(guò)引用并入本文,其程度如同特別且單獨(dú)地指出每個(gè)單獨(dú)的出版物、專(zhuān)利或?qū)@暾?qǐng)通過(guò)引用并入本文。
附圖簡(jiǎn)述
本發(fā)明的新特征在隨附的權(quán)利要求中具體闡述。通過(guò)參考以下對(duì)利用了本發(fā)明原理的說(shuō)明性實(shí)施方案進(jìn)行闡述的詳細(xì)描述和附圖,將會(huì)獲得對(duì)本發(fā)明特征和優(yōu)點(diǎn)的更好的理解,附圖中:
圖1示出了核酸分子測(cè)序過(guò)程的流程圖。
圖2示出了核酸分子測(cè)序過(guò)程的流程圖。
圖3示出了采用本文所述的面對(duì)面酶促轉(zhuǎn)移方法制備的高特征陣列。通過(guò)bst將棋盤(pán)樣dna陣列酶促轉(zhuǎn)移至10μm的薄丙烯酰胺凝膠涂覆的第二表面上。
圖4示出了采用光解保護(hù)基化學(xué)法,利用常規(guī)接觸光刻逐步錯(cuò)位(stepwisemisalignment)生成的20-聚體寡核苷酸陣列。
圖5示出了寡核苷酸500的示意圖,其從5’到3’包含pcr引物序列501、條形碼序列502以及用于結(jié)合與靶多核苷酸(即,模板核酸)上的限定序列互補(bǔ)的序列的限定序列(例如,銜接子或通用的)503。
圖6a示出了具有空間編碼的陣列的基底的示意圖。
圖6b示出了具有空間編碼的行或列的基底的示意圖。
圖6c示出了具有空間編碼的簇的基底的示意圖。
圖7示出了用于將模板核酸(例如,dna)陣列拷貝到第二表面(即,接受體陣列)上的面對(duì)面酶促轉(zhuǎn)移方法。將合成的陣列(5’朝上)壓靠在含有均勻分布的固定引物和反應(yīng)混合物的第二凝膠覆蓋的表面上(圖7a)。一經(jīng)加熱,引物與互補(bǔ)的底部銜接子雜交(圖7b)并通過(guò)bst聚合而延伸(圖7c)。將表面分離產(chǎn)生原始寡核苷酸陣列的3’朝上的拷貝(圖7d)。
圖8a示出了通過(guò)合成的酶促轉(zhuǎn)移(ets)的一般示意圖。
圖8b示出了導(dǎo)致核酸相對(duì)于基底的不同朝向的酶促轉(zhuǎn)移的示意圖。
圖8c示出了導(dǎo)致全長(zhǎng)鏈的轉(zhuǎn)移的酶促轉(zhuǎn)移的示意圖。
圖9示出了在接受體表面上從模板表面合成的示意圖。
圖10示出了用于去除銜接子序列的探針末端剪切(pec)的示意圖。
圖11示出了在切口位點(diǎn)處的探針末端剪切(pec)的示意圖。
圖12示出了具有通過(guò)酶促延伸轉(zhuǎn)移的簇的模板載玻片(左側(cè))和凝膠芯片(右側(cè))。
圖13示出了來(lái)自圖12的模板(左側(cè))和凝膠拷貝(右側(cè))的放大圖像。
圖14示出了模板(左側(cè))和凝膠拷貝(右側(cè))的強(qiáng)度的比較,后者具有比前者低約100倍的強(qiáng)度。
圖15示出了與不存在模板的陰性對(duì)照表面相比,向凝膠拷貝的酶促轉(zhuǎn)移。
圖16示出了與不存在酶的陰性對(duì)照表面(右側(cè))相比,向凝膠拷貝(左側(cè))的酶促轉(zhuǎn)移。
圖17示出了寡核苷酸固定化轉(zhuǎn)移(oit)的第一階段的示意圖。
圖18示出了寡核苷酸固定化轉(zhuǎn)移(oit)的第二階段的示意圖。
圖19示出了非酶促凝膠轉(zhuǎn)移的示意圖。
圖20示出了采用交聯(lián)劑1,4-亞苯基二異硫氰酸酯(pditc)將寡核苷酸附接至硅烷化后的玻璃表面的第一階段的示意圖。
圖21示出了采用pditc將寡核苷酸附接至硅烷化后的玻璃表面的第二階段的示意圖。
圖22示出了如圖20-21所示采用pditc附接至硅烷化的玻璃表面上的寡核苷酸的凝膠轉(zhuǎn)移。
圖23示出了包含以棋盤(pán)樣圖案附接至表面的熒光標(biāo)記的寡核苷酸的模板陣列。
圖24示出了圖23中的表面的放大視圖。
圖25示出了非酶促凝膠轉(zhuǎn)移后的模板,具有來(lái)自合成鏈(左側(cè))和另一條鏈(右側(cè))的信號(hào)。
圖26示出了非酶促凝膠轉(zhuǎn)移之前(左側(cè))和之后(右側(cè))的模板。
圖27示出了來(lái)自凝膠延伸的鏈轉(zhuǎn)移(左側(cè))和撕下凝膠的模板鏈轉(zhuǎn)移(右側(cè))的拷貝。
圖28示出了采用10x2s2bin(左側(cè))和10x0.5s10bin(右側(cè))的凝膠圖像。
圖29示出了酶促轉(zhuǎn)移后的簇?cái)U(kuò)增。
圖30示出了采用本文所述的面對(duì)面酶促凝膠轉(zhuǎn)移過(guò)程(例如,通過(guò)合成的酶促轉(zhuǎn)移或ets)進(jìn)行5次酶促轉(zhuǎn)移之前(左側(cè))和之后(右側(cè))的模板陣列。
圖31示出了通過(guò)轉(zhuǎn)座子插入將可延伸的序列添加至長(zhǎng)核酸的示意圖。
圖32示出了使用隨機(jī)引物將可延伸的序列添加至長(zhǎng)核酸的示意圖。
圖33示出了在具有空間編碼的簇的基底上的核酸鏈的示意圖。
圖34示出了在具有空間編碼的陣列的基底上的核酸鏈的示意圖。
圖35示出了將具有經(jīng)梳理的核酸的蓋玻片向具有空間編碼的基底上放置的示意圖。
圖36示出了利用基底特征,使用隨機(jī)引物將可延伸的序列添加至長(zhǎng)核酸的示意圖。
圖37示出了利用基底特征,通過(guò)轉(zhuǎn)座子插入將可延伸的序列添加至長(zhǎng)核酸的示意圖。
圖38示出了用于在寡核苷酸芯片(dna陣列)上構(gòu)建下一代測(cè)序(ngs)文庫(kù)的步驟a)到步驟f)。步驟a)示出了固定的寡核苷酸,其包含與采用分子梳理在整個(gè)寡核苷酸陣列上拉伸的靶多核苷酸(拉伸的dna)雜交的條形碼。步驟b)示出了經(jīng)梳理的靶多核苷酸的延伸以及由此的拷貝,從而產(chǎn)生雙鏈靶多核苷酸(dsdna)。步驟c)示出了雙鏈靶多核苷酸的酶切,其后為步驟d)中的末端修復(fù)。步驟e)示出了將銜接子附加至片段化的雙鏈靶多核苷酸上,隨后將該雙鏈靶多核苷酸從寡核苷酸陣列上釋放以用于步驟f)中的測(cè)序。
圖39示出了使用隨機(jī)引物制備芯片上文庫(kù)的示意圖。
圖40示出了引發(fā)劑硅烷的實(shí)例。
圖41示出了磷酰膽堿-丙烯酰胺單體的實(shí)例。
圖42示出了甜菜堿-丙烯酰胺單體的實(shí)例。
圖43示出了用于生產(chǎn)具有寡核苷酸的聚丙烯酰胺表面涂層的過(guò)程的實(shí)例。
具體實(shí)施方式
概述
本文提供了用于制備dna芯片、控制寡核苷酸在陣列上的朝向、使核酸拉伸、制備測(cè)序文庫(kù)以及對(duì)長(zhǎng)度可以為數(shù)百個(gè)千堿基至百萬(wàn)堿基的核酸進(jìn)行測(cè)序的方法、組合物和試劑盒。本發(fā)明的方法整合了幾種技術(shù),以克服當(dāng)前的下一代測(cè)序(ngs)的局限性。盡管ngs已經(jīng)取得長(zhǎng)足的進(jìn)步,使得外顯子組或全基因組測(cè)序?qū)θ魏螜C(jī)構(gòu)的研究者均可用,但對(duì)結(jié)果進(jìn)行解釋可能極具挑戰(zhàn)性。序列變異和突變的定相單元型信息是當(dāng)前全基因組測(cè)序策略缺失的關(guān)鍵信息,并且可以顯著地輔助對(duì)基因組測(cè)序數(shù)據(jù)的分析和解釋。
本公開(kāi)內(nèi)容提供了關(guān)于可用于陣列的表面上的改善的聚合物涂層的方法和組合物。該聚合物涂層可以通過(guò)結(jié)合至表面的引發(fā)劑物質(zhì)經(jīng)由表面引發(fā)聚合(sip)而產(chǎn)生。該聚合物涂層可以并入修飾的單體,以調(diào)節(jié)該涂層的物理化學(xué)性質(zhì)。該聚合物涂層可以并入寡核苷酸。
本文提供了用于生成包含寡核苷酸(“oligos”)的陣列的方法,其中每個(gè)寡核苷酸均包含標(biāo)記陣列上的位置或地址的條形碼(即,位置條形碼)。在一些情況下,本文提供了寡核苷酸陣列(“芯片”)制備方法,該方法被優(yōu)化以(a)減小特征(“斑點(diǎn)”)大小和間距(pitch),(b)任選地,反轉(zhuǎn)陣列上寡核苷酸的朝向以使陣列上每個(gè)寡核苷酸的3’端自由地用于延伸(例如,核苷酸堿基的酶促添加),以及(c)提高寡核苷酸合成的長(zhǎng)度和準(zhǔn)確度??墒褂猛队肮饪谭ê凸?酸生成的聚合物膜來(lái)合成高特征(“斑點(diǎn)”)密度(>108/cm2)的寡核苷酸陣列。特征大小為1μm時(shí),陣列上條形碼化的寡核苷酸可以將通過(guò)本文提供的方法獲得的序列讀取定位至基因組dna的約2000bp區(qū)域。陣列的每個(gè)斑點(diǎn)中的寡核苷酸可以包含相同的條形碼序列,而在不同陣列斑點(diǎn)中的寡核苷酸可以包含不同的條形碼序列。
為生成具有所需朝向(例如,5’端附接至陣列基底)的陣列的拷貝,可以采用面對(duì)面凝膠轉(zhuǎn)移過(guò)程。該面對(duì)面凝膠轉(zhuǎn)移過(guò)程可以顯著降低單位制備成本,同時(shí)翻轉(zhuǎn)寡核苷酸朝向以便將5’端固定,這可以具有如本文所述的測(cè)定優(yōu)勢(shì)。此外,全長(zhǎng)寡核苷酸的選擇性轉(zhuǎn)移以及隨后的全長(zhǎng)寡核苷酸的擴(kuò)增可以使寡核苷酸陣列含有非常長(zhǎng)的寡核苷酸(50+個(gè)堿基)而不會(huì)導(dǎo)致如本文所述的低產(chǎn)率或部分長(zhǎng)度產(chǎn)物。該轉(zhuǎn)移可以包括生成與模板寡核苷酸序列互補(bǔ)的核酸序列。該轉(zhuǎn)移過(guò)程可以通過(guò)酶復(fù)制或通過(guò)陣列組分在表面之間的非酶促物理轉(zhuǎn)移而發(fā)生。轉(zhuǎn)移可以包括制備已附接至接受體/轉(zhuǎn)移陣列的互補(bǔ)序列。例如,結(jié)合至接受體/轉(zhuǎn)移陣列的引物與模板陣列上的銜接子互補(bǔ),并且可以采用模板陣列序列作為模板進(jìn)行延伸,由此生成全長(zhǎng)或部分長(zhǎng)度的轉(zhuǎn)移陣列。轉(zhuǎn)移可包括從模板陣列制備互補(bǔ)序列,隨后將該互補(bǔ)序列附接至轉(zhuǎn)移陣列。
轉(zhuǎn)移可以保留核酸相對(duì)于其偶聯(lián)的陣列表面的朝向(例如,模板核酸的3’端結(jié)合至模板陣列,并且轉(zhuǎn)移的核酸互補(bǔ)體的3’端結(jié)合至轉(zhuǎn)移陣列)。轉(zhuǎn)移可以逆轉(zhuǎn)核酸相對(duì)于其偶聯(lián)的陣列表面的朝向(例如,模板核酸的3’端結(jié)合至模板陣列,并且轉(zhuǎn)移的核酸互補(bǔ)體的5’端結(jié)合至轉(zhuǎn)移陣列)。
在一些情況下,本文所述的陣列轉(zhuǎn)移方法對(duì)于生成具有增加或富集量或百分比的寡核苷酸的轉(zhuǎn)移或接受體陣列是有用的,該寡核苷酸偶聯(lián)至轉(zhuǎn)移或接受體陣列表面,并且該寡核苷酸的長(zhǎng)度為用作轉(zhuǎn)移程序的模板的陣列(即,模板陣列)上相應(yīng)寡核苷酸的長(zhǎng)度的100%(即,相同或等同的長(zhǎng)度)。該轉(zhuǎn)移程序可以是如本文提供的面對(duì)面酶促轉(zhuǎn)移。該面對(duì)面酶促轉(zhuǎn)移方法還可以被稱(chēng)為通過(guò)合成的酶促轉(zhuǎn)移或ets。陣列轉(zhuǎn)移可以產(chǎn)生包含至少、至多、多于、少于或大約30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.9%轉(zhuǎn)移的寡核苷酸的轉(zhuǎn)移或接受體陣列,該轉(zhuǎn)移的寡核苷酸的長(zhǎng)度為用于生成該轉(zhuǎn)移或接受體陣列的模板陣列上相應(yīng)寡核苷酸的長(zhǎng)度的100%或與該相應(yīng)寡核苷酸的長(zhǎng)度相同或等同。長(zhǎng)度為模板寡核苷酸的長(zhǎng)度的100%(即,相同或等同的長(zhǎng)度)的轉(zhuǎn)移的寡核苷酸可以被稱(chēng)為全長(zhǎng)產(chǎn)物(例如,全長(zhǎng)產(chǎn)物寡核苷酸)。通過(guò)本領(lǐng)域已知的方法(例如,點(diǎn)印法或原位合成)制備的模板陣列可以包含約20%的所需長(zhǎng)度的寡核苷酸(即,全長(zhǎng)寡核苷酸)和約80%的非所需長(zhǎng)度的寡核苷酸(即,部分長(zhǎng)度寡核苷酸)。采用如本文提供的陣列轉(zhuǎn)移方法(例如,ets)轉(zhuǎn)移通過(guò)本領(lǐng)域已知的方法生成的、包含約20%全長(zhǎng)寡核苷酸和約80%部分長(zhǎng)度寡核苷酸的陣列可以導(dǎo)致生成包含至多約20%全長(zhǎng)產(chǎn)物寡核苷酸的轉(zhuǎn)移或接受體陣列??墒褂冒c模板陣列上全長(zhǎng)寡核苷酸的未結(jié)合端處的序列互補(bǔ)的引物的轉(zhuǎn)移陣列進(jìn)行轉(zhuǎn)移;包含約20%全長(zhǎng)寡核苷酸和約80%部分長(zhǎng)度寡核苷酸的模板陣列上的許多或全部部分長(zhǎng)度產(chǎn)物缺少在本文提供的陣列轉(zhuǎn)移(例如,ets)中使用的序列的未結(jié)合端部,并因此不能被轉(zhuǎn)移。在一些情況下,根據(jù)本文的方法制備的陣列具有更大百分比的具有所需長(zhǎng)度的寡核苷酸(即,全長(zhǎng)寡核苷酸),使得采用本文提供的陣列轉(zhuǎn)移方法(即,ets)轉(zhuǎn)移根據(jù)本文的方法制備的陣列導(dǎo)致生成與本領(lǐng)域已知的制備和轉(zhuǎn)移方法相比具有更高百分比的全長(zhǎng)產(chǎn)物寡核苷酸的轉(zhuǎn)移或接受體陣列。采用本文提供的方法制備的陣列(例如,模板陣列)上的全長(zhǎng)寡核苷酸可以為大約、至多或至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個(gè)堿基長(zhǎng)。采用本文提供的陣列轉(zhuǎn)移方法(即,ets)轉(zhuǎn)移的轉(zhuǎn)移或接受體陣列上的全長(zhǎng)產(chǎn)物寡核苷酸可以為大約、至多或至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個(gè)堿基長(zhǎng)。
如本文提供的陣列轉(zhuǎn)移可以進(jìn)行多次。在一些情況下,模板陣列(例如,寡核苷酸陣列)經(jīng)歷多次陣列轉(zhuǎn)移過(guò)程。模板陣列可以經(jīng)歷至少、至多、多于、少于或大約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、600、700、800、900或1000次陣列轉(zhuǎn)移過(guò)程。陣列轉(zhuǎn)移過(guò)程可以是如本文提供的面對(duì)面酶促轉(zhuǎn)移方法??梢圆捎孟嗤0尻嚵杏啥啻侮嚵修D(zhuǎn)移生成多個(gè)轉(zhuǎn)移或接受體陣列。采用本文提供的陣列轉(zhuǎn)移方法從單個(gè)模板陣列生成的每個(gè)轉(zhuǎn)移或接受體陣列均可以與該模板陣列和/或從該模板陣列生成的每一個(gè)其他轉(zhuǎn)移或接受體陣列至少、至多、大于、小于或大約30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.9%相同。通過(guò)使用來(lái)自一次陣列轉(zhuǎn)移的轉(zhuǎn)移陣列作為隨后轉(zhuǎn)移的模板陣列,陣列轉(zhuǎn)移可以在一系列的轉(zhuǎn)移中多次進(jìn)行。例如,可以從具有在其3’端處與陣列結(jié)合的寡核苷酸的模板陣列到具有在其5’端處與陣列結(jié)合的互補(bǔ)寡核苷酸的第一轉(zhuǎn)移陣列進(jìn)行第一次轉(zhuǎn)移,并且可以從該第一轉(zhuǎn)移陣列(現(xiàn)在充當(dāng)模板陣列)到第二轉(zhuǎn)移陣列進(jìn)行第二次轉(zhuǎn)移。在一些情況下,在如本文提供的一系列陣列轉(zhuǎn)移反應(yīng)中的每一個(gè)漸進(jìn)轉(zhuǎn)移或接受體陣列均產(chǎn)生具有富集百分比的全長(zhǎng)產(chǎn)物寡核苷酸(即,長(zhǎng)度為模板寡核苷酸長(zhǎng)度的100%的轉(zhuǎn)移的寡核苷酸)和與原始模板陣列匹配的序列的接受體或轉(zhuǎn)移陣列。
在一些情況下,可以通過(guò)使用在模板寡核苷酸陣列上的寡核苷酸上的銜接子序列來(lái)幫助陣列轉(zhuǎn)移。寡核苷酸可以包含所需的最終序列,外加一個(gè)或多個(gè)銜接子序列。該一個(gè)或多個(gè)銜接子序列可以在模板陣列上的寡核苷酸的5’或3’端上。在一些情況下,該一個(gè)或多個(gè)銜接子序列在模板陣列上的寡核苷酸的3’端上。在一些情況下,該一個(gè)或多個(gè)銜接子序列在模板陣列上的寡核苷酸的5’端上。在接受體/轉(zhuǎn)移陣列上的引物可以與銜接子序列互補(bǔ),從而允許該引物與模板陣列上的寡核苷酸之間的雜交(通過(guò)與該銜接子序列的全部或一部分雜交)。這樣的雜交可以幫助從一個(gè)陣列到另一個(gè)陣列的轉(zhuǎn)移??梢栽谵D(zhuǎn)移后通過(guò)例如酶切、消化或限制性處理,從轉(zhuǎn)移陣列寡核苷酸中去除一些或全部銜接子序列。
在一些情況下,可以通過(guò)陣列或陣列上的表面涂層的柔性或可變形性來(lái)幫助陣列轉(zhuǎn)移。例如,可以在陣列轉(zhuǎn)移中使用包含具有偶聯(lián)的寡核苷酸的聚丙烯酰胺凝膠涂層的陣列。該凝膠涂層的可變形性可以允許陣列組分彼此接觸,即使存在表面粗糙度。該可變形性可以允許酶促陣列轉(zhuǎn)移方法(例如,本文提供的ets)中需要的酶與不包含聚丙烯酰胺凝膠的陣列相比更有效地與反應(yīng)組分接觸。這種更有效的接觸可以允許與不包含聚丙烯酰胺凝膠的陣列相比更大數(shù)目的酶促轉(zhuǎn)移。這種更有效的接觸可以允許生成更大百分比的轉(zhuǎn)移或接受體陣列,該陣列包含長(zhǎng)度為陣列轉(zhuǎn)移方法中使用的模板陣列上寡核苷酸的長(zhǎng)度的100%的寡核苷酸。
可以通過(guò)酶促反應(yīng)擴(kuò)增或再生陣列組分。例如,可以通過(guò)陣列組分上的銜接子序列與結(jié)合至表面的寡核苷酸引物之間的雜交,及隨后的酶促延伸或擴(kuò)增,來(lái)對(duì)陣列組分寡核苷酸進(jìn)行橋式擴(kuò)增??梢允褂脭U(kuò)增來(lái)恢復(fù)損失的陣列組分密度或?qū)㈥嚵薪M分的密度增加至超出其原始密度。
可以制備模板核酸分子以用于在通過(guò)如本文提供的方法產(chǎn)生的條形碼化寡核苷酸陣列中拉伸??梢蕴幚砟0搴怂岱肿右圆⑷肱c存在于條形碼化的寡核苷酸陣列上的寡核苷酸中的那些互補(bǔ)的序列。示例性的方法在圖1和圖2中示出??梢蕴峁┐郎y(cè)序的模板核酸分子(101、201)。可以通過(guò)轉(zhuǎn)座子插入(102)或通過(guò)與游離引物雜交(202),將通用引物結(jié)合位點(diǎn)并入到模板核酸分子中??梢允鼓0搴怂岱肿永?103、203)??梢圆捎萌绫疚奶峁┑姆椒ㄟM(jìn)行核酸拉伸。可以提供具有位置編碼的條形碼以及與引物結(jié)合位點(diǎn)雜交的銜接子的引物/寡核苷酸陣列(104、204)??梢允估斓哪0搴怂岱肿优c引物/寡核苷酸陣列接觸(105、205)??梢圆捎靡镞M(jìn)行延伸反應(yīng),從而生成位置編碼的延伸產(chǎn)物,該延伸產(chǎn)物包含與模板核酸分子的區(qū)段互補(bǔ)的序列(106、206),以及條形碼,使得該條形碼與對(duì)應(yīng)于與其接觸的陣列斑點(diǎn)的給定模板核酸區(qū)段相關(guān)聯(lián)。
可以使用拉伸的核酸分子生成測(cè)序文庫(kù),隨后可以在如圖1和圖2所示的位置條形碼的輔助下對(duì)該文庫(kù)進(jìn)行測(cè)序。在一些情況下,使多個(gè)模板核酸分子(例如,dna)在采用本文提供的方法生成的條形碼化寡核苷酸陣列表面(例如,30-40x二倍體基因組覆蓋率)上拉伸。陣列表面上的寡核苷酸可以引發(fā)拉伸的核酸分子(例如,dna),該核酸分子隨后可以充當(dāng)用于生成下一代測(cè)序(ngs)文庫(kù)的模板(如圖3所示)。然后可以采用如本文所述的任意ngs平臺(tái)或任何其他合適的序列讀出技術(shù)(例如,illuminahiseq)對(duì)該ngs文庫(kù)進(jìn)行測(cè)序。由于用于生成測(cè)序文庫(kù)的寡核苷酸被條形碼化,因此獲得了用于組裝較短ngs讀取的位置信息。利用條形碼,可以將短讀取連接至對(duì)應(yīng)于衍生出該短讀取的拉伸的dna分子的長(zhǎng)串中。該長(zhǎng)串可以允許從頭組裝、核苷酸變體檢測(cè)、結(jié)構(gòu)變體檢測(cè)以及來(lái)自二倍體樣品的單元型分辨。該長(zhǎng)串可以為多于或大約500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500或10,000個(gè)堿基。
本文提供的方法對(duì)確定長(zhǎng)核酸分子例如具有超過(guò)100,000個(gè)堿基的核酸分子的序列是特別有用的。這些方法還可用于對(duì)具有插入、缺失、轉(zhuǎn)座、重復(fù)區(qū)、端粒、snp、癌細(xì)胞基因組、病毒細(xì)胞基因組以及甲氧西林抗性區(qū)(mec區(qū))的核酸分子或其區(qū)域進(jìn)行測(cè)序。由條形碼序列傳達(dá)的位置信息可用于組裝或比對(duì)來(lái)自至少100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500或10,000個(gè)模板核酸片段或延伸產(chǎn)物的核酸分子讀取。
核酸及其來(lái)源
除非另有說(shuō)明,如本文提及的“核酸分子”或“核酸”可以是脫氧核糖核酸(dna)或核糖核酸(rna),包括其已知的類(lèi)似物或組合。本文中待測(cè)序的核酸分子可以從任何核酸來(lái)源獲得。該核酸分子可以是單鏈或雙鏈的。在一些情況下,該核酸分子是dna。該dna可以采用本領(lǐng)域的標(biāo)準(zhǔn)技術(shù)來(lái)獲得和純化,并且包括純化或未純化形式的dna。該dna可以是線粒體dna、無(wú)細(xì)胞dna、互補(bǔ)dna(cdna)或基因組dna。在一些情況下,該核酸分子是基因組dna(gdna)。該dna可以是質(zhì)粒dna、粘粒dna、細(xì)菌人工染色體(bac)或酵母人工染色體(yac)。該dna可以來(lái)源于一個(gè)或多個(gè)染色體。例如,如果該dna來(lái)自人類(lèi),則該dna可以來(lái)源于染色體1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、x或y中的一個(gè)或多個(gè)。該rna可以采用本領(lǐng)域的標(biāo)準(zhǔn)技術(shù)來(lái)獲得和純化,并且包括純化或未純化形式的rna,包括但不限于mrna、trna、snrna、rrna、逆轉(zhuǎn)錄病毒、小的非編碼rna、微rna、多核糖體rna、前mrna、內(nèi)含子rna、病毒rna、無(wú)細(xì)胞rna及其片段。非編碼rna或ncrna可以包括snorna、微rna、sirna、pirna和長(zhǎng)ncrna。
供本文所述的方法和組合物使用的核酸的來(lái)源可以是包含該核酸的樣品。該核酸可以從該樣品中分離并通過(guò)本領(lǐng)域已知用于從樣品中純化核酸的任何方法純化。該樣品可以來(lái)源于包含多核苷酸的非細(xì)胞實(shí)體(例如,病毒)或來(lái)源于基于細(xì)胞的生物體(例如,古細(xì)菌、細(xì)菌或真核生物域的成員)。在一些情況下,該樣品從諸如門(mén)或臺(tái)面等表面的拭子獲得。
該樣品可以來(lái)自受試者,例如,植物、真菌、真細(xì)菌、古細(xì)菌、原生生物(protest)或動(dòng)物。該受試者可以是生物體,無(wú)論是單細(xì)胞的還是多細(xì)胞的生物體。該受試者可以是培養(yǎng)的細(xì)胞,其可以是原代細(xì)胞或來(lái)自建立的細(xì)胞系的細(xì)胞,等等。樣品可以最初以任何合適的形式從多細(xì)胞生物體中分離。該動(dòng)物可以是魚(yú),例如,斑馬魚(yú)。該動(dòng)物可以是哺乳動(dòng)物。該哺乳動(dòng)物可以是例如狗、貓、馬、牛、小鼠、大鼠或豬。該哺乳動(dòng)物可以是靈長(zhǎng)類(lèi)動(dòng)物,例如人、黑猩猩、猩猩或大猩猩。該人可以是男性或女性。該樣品可以來(lái)自人類(lèi)胚胎或人類(lèi)胎兒。該人可以是嬰兒、兒童、少年、成人或老人。該女性可以是妊娠的、疑似妊娠的或計(jì)劃妊娠的女性。在一些情況下,該樣品是來(lái)自受試者的單一或單個(gè)細(xì)胞,并且該多核苷酸來(lái)源于該單一或單個(gè)細(xì)胞。在一些情況下,該樣品是單個(gè)微生物,或微生物群體,或微生物和宿主細(xì)胞或無(wú)細(xì)胞核酸的混合物。
該樣品可以來(lái)自健康的受試者(例如,人類(lèi)受試者)。在一些情況下,該樣品取自妊娠至少4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26周的受試者(例如,待產(chǎn)婦女)。在一些情況下,該受試者患有遺傳性疾病,是遺傳性疾病的攜帶者,或處于遺傳或發(fā)展出遺傳性疾病的風(fēng)險(xiǎn)中,其中遺傳性疾病是可能與遺傳變異如突變、插入、添加、缺失、易位、點(diǎn)突變、三核苷酸重復(fù)障礙和/或單核苷酸多態(tài)性(snp)有關(guān)的任何疾病。
該樣品可以來(lái)自患有特定疾病、病癥或病況,或疑似患有特定疾病、病癥或病況(或處于患有該特定疾病、病癥或病況的風(fēng)險(xiǎn)中)的受試者。例如,該樣品可以來(lái)自癌癥患者,疑似患有癌癥的患者,或處于患有癌癥的風(fēng)險(xiǎn)中的患者。該癌癥可以是例如急性成淋巴細(xì)胞性白血病(all)、急性髓樣白血病(aml)、腎上腺皮質(zhì)癌、卡波西肉瘤、肛門(mén)癌、基底細(xì)胞癌、膽管癌、膀胱癌、骨癌、骨肉瘤、惡性纖維組織細(xì)胞瘤、腦干膠質(zhì)瘤、腦癌、顱咽管瘤、室管膜母細(xì)胞瘤、室管膜瘤、髓母細(xì)胞瘤、髓上皮瘤、松果體實(shí)質(zhì)腫瘤、乳腺癌、支氣管腫瘤、伯基特淋巴瘤、非霍奇金淋巴瘤、類(lèi)癌瘤、宮頸癌、脊索瘤、慢性淋巴細(xì)胞性白血病(cll)、慢性髓性白血病(cml)、結(jié)腸癌、結(jié)直腸癌、皮膚t細(xì)胞淋巴瘤、原位導(dǎo)管癌、子宮內(nèi)膜癌、食管癌、尤文肉瘤、眼癌、眼內(nèi)黑素瘤、視網(wǎng)膜母細(xì)胞瘤、纖維組織細(xì)胞瘤、膽囊癌、胃癌、膠質(zhì)瘤、毛細(xì)胞白血病、頭頸癌、心臟癌、肝細(xì)胞(肝)癌、霍奇金淋巴瘤、下咽癌、腎癌、喉癌、唇癌、口腔癌、肺癌、非小細(xì)胞癌、小細(xì)胞癌、黑素瘤、口癌、骨髓增生異常綜合征、多發(fā)性骨髓瘤、髓母細(xì)胞瘤、鼻腔癌、鼻竇癌、神經(jīng)母細(xì)胞瘤、鼻咽癌、口腔癌、口咽癌、骨肉瘤、卵巢癌、胰腺癌、乳頭狀瘤病、副神經(jīng)節(jié)瘤、甲狀旁腺癌、陰莖癌、咽癌、垂體瘤、漿細(xì)胞腫瘤、前列腺癌、直腸癌、腎細(xì)胞癌、橫紋肌肉瘤、唾液腺癌、塞扎里綜合征、皮膚癌、非黑素瘤、小腸癌、軟組織肉瘤、鱗狀細(xì)胞癌、睪丸癌、咽喉癌、胸腺瘤、甲狀腺癌、尿道癌、子宮癌、子宮肉瘤、陰道癌、外陰癌、waldenstrom巨球蛋白血癥或腎母細(xì)胞瘤。該樣品可以來(lái)自癌癥患者的癌和/或正常組織。
該樣品可以是房水、玻璃狀液、膽汁、全血、血清、血漿、乳汁、腦脊液、耵聹、內(nèi)淋巴、外淋巴、胃液、粘液、腹膜液、唾液、皮脂、精液、汗液、淚液、陰道分泌物、嘔吐物、糞便或尿液。該樣品可以從醫(yī)院、實(shí)驗(yàn)室、臨床或醫(yī)學(xué)實(shí)驗(yàn)室獲得。該樣品可以取自受試者。
該樣品可以是包含諸如水、土壤、空氣等介質(zhì)的環(huán)境樣品。該樣品可以是法醫(yī)樣品(例如,毛發(fā)、血液、精液、唾液等)。該樣品可以包含在生物恐怖襲擊(例如,流感、炭疽、天花)中使用的試劑。
該樣品可以包含核酸。該樣品可以包含無(wú)細(xì)胞核酸。該樣品可以是細(xì)胞系、基因組dna、無(wú)細(xì)胞血漿、福爾馬林固定石蠟包埋的(ffpe)樣品或快速冷凍的樣品。福爾馬林固定石蠟包埋的樣品可以在提取核酸之前脫蠟。該樣品可以來(lái)自器官,例如心臟、皮膚、肝、肺、乳房、胃、胰、膀胱、結(jié)腸、膽囊、腦等??梢酝ㄟ^(guò)本領(lǐng)域普通技術(shù)人員可用的手段從樣品中提取核酸。
可對(duì)樣品進(jìn)行處理以使其能夠進(jìn)行片段化、連接、變性、擴(kuò)增、拉伸和/或測(cè)序或本文提供的任何方法。示例性的樣品處理可以包括裂解樣品的細(xì)胞以釋放核酸,純化樣品(例如,以將核酸與可能抑制酶促反應(yīng)的其他樣品組分分離),稀釋/濃縮樣品,和/或?qū)悠放c用于進(jìn)一步核酸處理的試劑合并。在一些實(shí)例中,可以將樣品與限制酶、逆轉(zhuǎn)錄酶或任何其他核酸處理酶合并。
本文所述的方法可以用于對(duì)一種或多種靶核酸或多核苷酸進(jìn)行測(cè)序。術(shù)語(yǔ)多核苷酸或語(yǔ)法等同語(yǔ)可以指共價(jià)連接在一起的至少兩個(gè)核苷酸。本文所述的多核苷酸可含有磷酸二酯鍵,雖然在如下所示的一些情況下(例如在引物和探針如標(biāo)記探針的構(gòu)建中),也包括可具有替代骨架的核酸類(lèi)似物,其包含例如磷酰胺(beaucage等人,tetrahedron49(10):1925(1993)及其中的參考文獻(xiàn);letsinger,j.org.chem.35:3800(1970);sprinzl等人,eur.j.biochem.81:579(1977);letsinger等人,nucl.acidsres.14:3487(1986);sawai等人,chem.lett.805(1984),letsinger等人,j.am.chem.soc.110:4470(1988);和pauwels等人,chemicascripta26:14191986))、硫代磷酸酯(mag等人,nucleicacidsres.19:1437(1991);和美國(guó)專(zhuān)利5,644,048)、二硫代磷酸酯(briu等人,j.am.chem.soc.111:2321(1989)、o-甲基亞磷酰胺(methylphophoroamidite)連接(參見(jiàn)eckstein,oligonucleotidesandanalogues:apracticalapproach,oxforduniversitypress)和肽核酸(此處也稱(chēng)為“pna”)骨架和連接(參見(jiàn)egholm,j.am.chem.soc.114:1895(1992);meier等人,chem.int.ed.engl.31:1008(1992);nielsen,nature,365:566(1993);carlsson等人,nature380:207(1996),其全部通過(guò)引用并入本文)。其他核酸類(lèi)似物包括那些具有雙環(huán)結(jié)構(gòu)的核酸,包括鎖定核酸(此處也稱(chēng)為“l(fā)na”),koshkin等人,j.am.chem.soc.120.132523(1998);陽(yáng)性骨架(denpcy等人,proc.natl.acad.sci.usa92:6097(1995);非離子骨架(美國(guó)專(zhuān)利5,386,023、5,637,684、5,602,240、5,216,141和4,469,863;kiedrowshi等人,angew.chem.intl.ed.english30:423(1991);letsinger等人,j.am.chem.soc.110:4470(1988);letsinger等人,nucleoside&nucleotide13:1597(1994);ascsymposiumseries580第2和3章,"carbohydratemodificationsinantisenseresearch",y.s.sanghui和p.dancook編;mesmaeker等人,bioorganic&medicinalchem.lett.4:395(1994);jeffs等人,j.biomolecularnmr34:17(1994);tetrahedronlett.37:743(1996))和非核糖骨架,包括在美國(guó)專(zhuān)利5.235,033和5,034,506和ascsymposiumseries580第6和7章,y.s.sanghui和p.dancook編著的"carbohydratemodificationsinantisenseresearch"中描述的那些。含有一個(gè)或更多個(gè)碳環(huán)糖的核酸也包括在核酸的定義內(nèi)(參見(jiàn)jenkins等人,chem.soc.rev.(1995)pp169176)。一些核酸類(lèi)似物描述于rawls,c&enews,1997年6月2日,第35頁(yè)。“鎖定核酸”也包括在核酸類(lèi)似物的定義內(nèi)。lna是一類(lèi)核酸類(lèi)似物,其中核糖環(huán)被連接2'-o原子和4'-c原子的亞甲基橋所“鎖定”。全部這些參考文獻(xiàn)均在此明確地通過(guò)引用并入本文??梢詫?duì)這些核糖-磷酸骨架進(jìn)行修飾以增強(qiáng)該分子在生理環(huán)境中的穩(wěn)定性和延長(zhǎng)其半衰期。例如,pna:dna和lna-dna雜合體能夠表現(xiàn)出更高的穩(wěn)定性,從而可以在一些情況下使用。按照說(shuō)明,該核酸可以是單鏈或雙鏈的,或者既含有雙鏈序列部分又含有單鏈序列部分。根據(jù)應(yīng)用,該核酸可以是dna(包括,例如,基因組dna、線粒體dna和cdna)、rna(包括,例如,mrna和rrna)或雜合體,其中該核酸含有脫氧核糖核苷酸和核糖核苷酸的任意組合,以及包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鳥(niǎo)嘌呤、肌苷、黃嘌呤、次黃嘌呤、異胞嘧啶、異鳥(niǎo)嘌呤等的堿基的任意組合。
如本文中提及的“核酸分子”或“核酸”可以是“寡核苷酸”、“適體”或“多核苷酸”。術(shù)語(yǔ)“寡核苷酸”可以指通常小于200個(gè)殘基長(zhǎng),例如15到100個(gè)核苷酸長(zhǎng)的核苷酸鏈。寡核苷酸可以包含至少或大約1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50個(gè)堿基。寡核苷酸可以為約3至約5個(gè)堿基、約1至約50個(gè)堿基、約8至約12個(gè)堿基、約15至約25個(gè)堿基、約25至約35個(gè)堿基、約35至約45個(gè)堿基或約45至約55個(gè)堿基。寡核苷酸(也被稱(chēng)為“寡核苷酸(oligo)”)可以是任何類(lèi)型的寡核苷酸(例如,引物)。在一些情況下,寡核苷酸是5’-acrydite修飾的寡核苷酸。寡核苷酸可以偶聯(lián)至在如本文提供的表面上的如本文提供的聚合物涂層。寡核苷酸可以包含可切割的連接??汕懈畹倪B接可以是酶可切割的。寡核苷酸可以是單鏈或雙鏈的。術(shù)語(yǔ)“引物”和“寡核苷酸引物”可以指能夠與互補(bǔ)核苷酸序列雜交的寡核苷酸。術(shù)語(yǔ)“寡核苷酸”可以與術(shù)語(yǔ)“引物”、“銜接子”和“探針”互換使用。術(shù)語(yǔ)“多核苷酸”可以指通常大于200個(gè)殘基長(zhǎng)的核苷酸鏈。多核苷酸可以是單鏈或雙鏈的。
術(shù)語(yǔ)“雜交”和“退火”可互換使用并可以指互補(bǔ)核酸的配對(duì)。
術(shù)語(yǔ)“引物”可以指通常具有游離的3’羥基基團(tuán)的寡核苷酸,其能夠與模板核酸或核酸分子(諸如靶多核苷酸、靶dna、靶rna或引物延伸產(chǎn)物)雜交,并且還能夠促進(jìn)與模板互補(bǔ)的多核苷酸的聚合。引物可以含有構(gòu)成該引物的尾部的非雜交序列。即使引物的序列可能不與靶標(biāo)完全互補(bǔ),該引物仍可以與該靶標(biāo)雜交。
例如,引物可以是可以在通過(guò)聚合酶沿著多核苷酸模板進(jìn)行的延伸反應(yīng)中,諸如在pcr或cdna合成中采用的寡核苷酸。寡核苷酸引物可以是單鏈的合成多核苷酸,在其3′端含有能夠與靶多核苷酸的序列雜交的序列。通常,與靶核酸雜交的引物的3′區(qū)與序列或引物結(jié)合位點(diǎn)具有至少80%、90%、95%或100%的互補(bǔ)性。
為了避免二級(jí)結(jié)構(gòu)和自雜交,可以根據(jù)已知參數(shù)設(shè)計(jì)引物。不同的引物對(duì)可以在大致相同的溫度下,例如,在另一個(gè)引物對(duì)的約1、2、3、4、5、6、7、8、9或10℃內(nèi)退火并解鏈。在一些情況下,最初使用多于約1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、100、200、500、1000、5000、10,000個(gè)或更多個(gè)引物。這樣的引物可以能夠與本文所述的遺傳靶標(biāo)雜交。在一些情況下,使用約2至約10,000、約2至約5,000、約2至約2,500、約2至約1,000、約2至約500、約2至約100、約2至約50、約2至約20、約2至約10或約2至約6個(gè)引物。
可以通過(guò)多種方法制備引物,該方法包括但不限于適當(dāng)序列的克隆以及采用本領(lǐng)域公知方法的直接化學(xué)合成(narang等人,methodsenzymol.68:90(1979);brown等人,methodsenzymol.68:109(1979))。引物還可以從商業(yè)來(lái)源如integrateddnatechnologies、operontechnologies、amershampharmaciabiotech、sigma和lifetechnologies獲得。引物可以具有相同的解鏈溫度。引物的解鏈溫度可以為大約、高于、低于或至少30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、81、82、83、84或85℃。在一些情況下,引物的解鏈溫度為約30至約85℃、約30至約80℃、約30至約75℃、約30至約70℃、約30至約65℃、約30至約60℃、約30至約55℃、約30至約50℃、約40至約85℃、約40至約80℃、約40至約75℃、約40至約70℃、約40至約65℃、約40至約60℃、約40至約55℃、約40至約50℃、約50至約85℃、約50至約80℃、約50至約75℃、約50至約70℃、約50至約65℃、約50至約60℃、約50至約55℃、約52至約60℃、約52至約58℃、約52至約56℃或約52至約54℃。
引物的長(zhǎng)度可以在5'端或3'端處延伸或縮短,以產(chǎn)生具有所需解鏈溫度的引物。引物對(duì)中的一個(gè)引物可以比另一個(gè)引物長(zhǎng)。在引物對(duì)內(nèi),引物的3'退火長(zhǎng)度可以不同。還可以設(shè)計(jì)每個(gè)引物對(duì)的退火位置,使得該引物對(duì)的序列和長(zhǎng)度產(chǎn)生所需的解鏈溫度。用于確定小于25個(gè)堿基對(duì)的引物的解鏈溫度的等式為wallace法則(td=2(a+t)+4(g+c))。還可以采用計(jì)算機(jī)程序來(lái)設(shè)計(jì)引物,該計(jì)算機(jī)程序包括但不限于arraydesignersoftware(arrayitinc.)、oligonucleotideprobesequencedesignsoftwareforgeneticanalysis(olympusopticalco.)、netprimer以及來(lái)自hitachisoftwareengineering的dnasis。每個(gè)引物的tm(解鏈或退火溫度)均可以采用軟件程序如netprimer(http://www.premierbiosoft.com/netprimer/index.html上基于網(wǎng)絡(luò)的免費(fèi)程序)來(lái)計(jì)算。在任意擴(kuò)增循環(huán)后,包括但不限于約1、2、3、4、5次循環(huán)、約6次循環(huán)至約10次循環(huán)、約10次循環(huán)至約15次循環(huán)、約15次循環(huán)至約20次循環(huán)、約20次循環(huán)至約25次循環(huán)、約25次循環(huán)至約30次循環(huán)、約30次循環(huán)至約35次循環(huán)或約35次循環(huán)至約40次循環(huán)之后,引物的退火溫度可重新計(jì)算并可能增加。在最初的擴(kuò)增循環(huán)之后,引物的5'一半可以從每一個(gè)感興趣的基因座并入到產(chǎn)物中;因此可以根據(jù)每個(gè)引物的5'一半和3'一半的序列來(lái)重新計(jì)算tm。
在任意擴(kuò)增循環(huán)后,包括但不限于約1、2、3、4、5次循環(huán)、約6次循環(huán)至約10次循環(huán)、約10次循環(huán)至約15次循環(huán)、約15次循環(huán)至約20次循環(huán)、約20次循環(huán)至約25次循環(huán)、約25次循環(huán)至約30次循環(huán)、約30次循環(huán)至約35次循環(huán)或約35次循環(huán)至約40次循環(huán)之后,引物的退火溫度可重新計(jì)算并可能增加。在最初的擴(kuò)增循環(huán)之后,引物的5'一半可以從每一個(gè)感興趣的基因座并入到產(chǎn)物中,因此可以根據(jù)每個(gè)引物的5'一半和3'一半的序列來(lái)重新計(jì)算tm。
“互補(bǔ)的”可以指與序列(例如,模板核酸)的全部或僅一部分的互補(bǔ)性。特定寡核苷酸引物的可雜交序列中的核苷酸的數(shù)目應(yīng)該使得用于雜交該寡核苷酸引物的嚴(yán)格性條件將阻止過(guò)度的隨機(jī)非特異性雜交。通常,寡核苷酸引物的雜交部分中的核苷酸的數(shù)目將至少與該寡核苷酸引物所雜交的靶多核苷酸(例如,模板核酸)上確定的序列一樣多,即,至少5個(gè)、至少6個(gè)、至少7個(gè)、至少8個(gè)、至少9個(gè)、至少10個(gè)、至少11個(gè)、至少12個(gè)、至少13個(gè)、至少14個(gè)、至少15個(gè)、至少約20個(gè),并且通常為約6個(gè)至約10個(gè)或6個(gè)至約12個(gè)或12個(gè)至約200個(gè)核苷酸,通常為約10個(gè)至約50個(gè)核苷酸。靶多核苷酸可以大于如上文所述的寡核苷酸引物或引物。
如本文所用的術(shù)語(yǔ)“約”是指指定量的+/-10%、9%、8%、7%、6%、5%、4%、3%、2%或1%。
如本文所用的,術(shù)語(yǔ)“較長(zhǎng)的dna”、“長(zhǎng)dna”、“較長(zhǎng)的核酸”或“長(zhǎng)核酸”可以包括超過(guò)、至少或大約100、200、300、400、500、600、700、800、900kb,或超過(guò)、至少或大約1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100mb的核酸(例如,dna)。長(zhǎng)核酸的上限可以包括例如,100、90、80、70、60、50、40、30、20、10、9、8、7、6、5或4.5mb。長(zhǎng)核酸可以在100kb到4.6mb的范圍內(nèi)。長(zhǎng)核酸可以在100kb到10mb的范圍內(nèi)。在一些情況下,長(zhǎng)核酸可以在100kb到20mb的范圍內(nèi)。長(zhǎng)核酸可以在100kb到30mb的范圍內(nèi)。長(zhǎng)核酸可以在100kb到40mb的范圍內(nèi)。長(zhǎng)核酸可以在100kb到50mb的范圍內(nèi)。在一些情況下,大核酸由生物體(例如,大腸桿菌)的整個(gè)基因組組成。應(yīng)理解,本文提供的方法、組合物、系統(tǒng)和試劑盒并不限于dna,而是可以包括如本文所述的其他核酸分子,并且可以采用與如下所述相同的方法進(jìn)行測(cè)序。
在一些情況下,提供一組條形碼。術(shù)語(yǔ)“條形碼”可以指允許與該條形碼相關(guān)聯(lián)的核酸(例如,寡核苷酸)的一些特征得到鑒別的已知核酸序列。在一些情況下,待鑒別的核酸的特征是每個(gè)核酸(例如,寡核苷酸)在陣列或芯片上的空間位置。條形碼可以針對(duì)精確序列性能來(lái)設(shè)計(jì),例如,在40%到60%之間的gc含量,沒(méi)有長(zhǎng)于2的均聚物運(yùn)行,沒(méi)有長(zhǎng)于3的自互補(bǔ)的序列段,并且由不存在于人類(lèi)基因組參照中的序列構(gòu)成。條形碼序列可以為至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個(gè)堿基。條形碼序列可以為至多5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個(gè)堿基。條形碼序列可以為約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個(gè)堿基。寡核苷酸(例如,引物或銜接子)可以包含大約、多于、少于或至少1、2、3、4、5、6、7、8、9或10個(gè)不同的條形碼。條形碼可以具有足夠的長(zhǎng)度,并可以包含可能足夠不同的序列以允許根據(jù)與每個(gè)核酸相關(guān)聯(lián)的條形碼鑒別每一個(gè)核酸(例如,寡核苷酸)的空間位置。在一些情況下,每個(gè)條形碼與陣列中的任何其他條形碼相差例如四個(gè)缺失或插入或置換。在條形碼化的寡核苷酸陣列上的每個(gè)陣列斑點(diǎn)中的寡核苷酸可以包含相同的條形碼序列,而在不同陣列斑點(diǎn)中的寡核苷酸可以包含不同的條形碼序列。在一個(gè)陣列斑點(diǎn)中使用的條形碼序列可以與在任何其他陣列斑點(diǎn)中的條形碼序列不同?;蛘撸灰獌蓚€(gè)陣列斑點(diǎn)不相鄰,在一個(gè)陣列斑點(diǎn)中使用的條形碼序列可以與在另一個(gè)陣列斑點(diǎn)中使用的條形碼序列相同??梢詮年嚵械氖芸睾铣芍獣耘c特定陣列斑點(diǎn)相對(duì)應(yīng)的條形碼序列?;蛘撸梢酝ㄟ^(guò)對(duì)來(lái)自特定陣列斑點(diǎn)的材料進(jìn)行提取和測(cè)序而知曉與特定陣列斑點(diǎn)相對(duì)應(yīng)的條形碼序列。作為一個(gè)示例設(shè)計(jì)了含有150萬(wàn)個(gè)18堿基條形碼的一組候選的條形碼。
酶
供本文提供的方法和組合物使用的rna依賴(lài)性dna聚合酶可以能夠根據(jù)本文提供的方法實(shí)現(xiàn)引物的延伸。因此,rna依賴(lài)性dna聚合酶可以是能夠使核酸引物沿著至少主要包含核糖核苷酸的核酸模板延伸的聚合酶。供本文提供的方法、組合物和試劑盒使用的合適的rna依賴(lài)性dna聚合酶包括逆轉(zhuǎn)錄酶(rt)。rt是本領(lǐng)域公知的。rt的實(shí)例包括但不限于莫洛尼鼠白血病病毒(m-mlv)逆轉(zhuǎn)錄酶、人免疫缺陷病毒(hiv)逆轉(zhuǎn)錄酶、勞斯肉瘤病毒(rsv)逆轉(zhuǎn)錄酶、禽成髓細(xì)胞白血病病毒(amv)逆轉(zhuǎn)錄酶、勞斯相關(guān)病毒(rav)逆轉(zhuǎn)錄酶以及成髓細(xì)胞白血病相關(guān)病毒(mav)逆轉(zhuǎn)錄酶或其他禽肉瘤白血病病毒(aslv)逆轉(zhuǎn)錄酶,以及由其衍生的修飾的rt。參見(jiàn)例如us7056716。許多逆轉(zhuǎn)錄酶,如來(lái)自禽成髓細(xì)胞白血病病毒(amv-rt)以及莫洛尼鼠白血病病毒(mmlv-rt)的逆轉(zhuǎn)錄酶,包含超過(guò)一種活性(例如,聚合酶活性和核糖核酸酶活性),并且可以在雙鏈cdna分子的形成中起作用。然而,在一些情況下,優(yōu)選地使用缺少rna酶h活性或具有顯著降低的rna酶h活性的rt。缺乏rna酶h活性的rt是本領(lǐng)域已知的,包括包含野生型逆轉(zhuǎn)錄酶的突變的那些rt,其中該突變消除rna酶h活性。具有降低的rna酶h活性的rt的實(shí)例在us20100203597中描述。在這些情況下,來(lái)自其他來(lái)源的rna酶h如從大腸桿菌分離的rna酶h的添加可用于起始rna樣品的降解和雙鏈cdna的形成。還可以考慮rt的組合,包括不同非突變r(jià)t的組合,不同突變r(jià)t的組合,以及一種或多種非突變r(jià)t與一種或多種突變r(jià)t的組合。
供本文提供的方法和組合物使用的dna依賴(lài)性dna聚合酶可以能夠根據(jù)本文提供的方法實(shí)現(xiàn)引物的延伸。因此,dna依賴(lài)性dna聚合酶可以是在rna模板的存在下或在選擇性去除rna模板后,能夠使核酸引物沿著第一鏈cdna延伸的聚合酶。適合用于本文提供的方法的示例性dna依賴(lài)性dna聚合酶包括但不限于有或沒(méi)有3'-外切核酸酶活性的klenow聚合酶、bstdna聚合酶、bca聚合酶、phi.29dna聚合酶、vent聚合酶、deepvent聚合酶、taq聚合酶、t4聚合酶和大腸桿菌dna聚合酶1,其衍生物,或聚合酶的混合物。在一些情況下,該聚合酶不包含5'-外切核酸酶活性。在其他情況下,該聚合酶包含5'外切核酸酶活性。在一些情況下,可以采用包含強(qiáng)鏈置換活性的聚合酶例如bst聚合酶進(jìn)行引物延伸。在其他情況下,可以采用包含弱鏈置換活性或不包含鏈置換活性的聚合酶進(jìn)行引物延伸。本領(lǐng)域技術(shù)人員可以認(rèn)識(shí)到在引物延伸步驟期間使用鏈置換活性的優(yōu)勢(shì)和劣勢(shì),以及哪些聚合酶預(yù)期可以提供鏈置換活性(參見(jiàn)例如,newenglandbiolabspolymerases)。例如,鏈置換活性可能對(duì)在隨機(jī)引發(fā)和延伸步驟期間確保整個(gè)轉(zhuǎn)錄組覆蓋是有用的。鏈置換活性還可能對(duì)在引發(fā)和延伸步驟期間雙鏈擴(kuò)增產(chǎn)物的生成是有用的?;蛘?,包含弱鏈置換活性或不包含鏈置換活性的聚合酶可能對(duì)在引物雜交和延伸期間可以與模板核酸雜交的單鏈核酸產(chǎn)物的生成是有用的。
在一些情況下,可以對(duì)通過(guò)本文所述的方法生成的任何雙鏈產(chǎn)物進(jìn)行末端修復(fù),以產(chǎn)生用于本文所述的銜接子連接應(yīng)用的平端。雙鏈產(chǎn)物上的平端的生成可以通過(guò)使用單鏈特異性dna外切核酸酶例如外切核酸酶1、外切核酸酶7或其組合降解該雙鏈產(chǎn)物的突出單鏈末端而實(shí)現(xiàn)?;蛘?,可以通過(guò)使用單鏈特異性dna內(nèi)切核酸酶,例如但不限于綠豆內(nèi)切核酸酶或s1內(nèi)切核酸酶,將通過(guò)本文提供的方法生成的任何雙鏈產(chǎn)物平端化?;蛘?,可以通過(guò)使用包含單鏈外切核酸酶活性的聚合酶例如t4dna聚合酶、包含單鏈外切核酸酶活性的任何其他聚合酶或其組合降解雙鏈產(chǎn)物的突出單鏈末端,來(lái)將通過(guò)本文提供的方法生成的任何雙鏈產(chǎn)物平端化。在一些情況下,可以將包含單鏈外切核酸酶活性的聚合酶在包含或不包含一種或多種dntp的反應(yīng)混合物中溫育。在其他情況下,可使用單鏈核酸特異性外切核酸酶與一種或多種聚合酶的組合將引物延伸反應(yīng)的雙鏈產(chǎn)物平端化。在另外的其他情況下,可以通過(guò)補(bǔ)平雙鏈產(chǎn)物的突出單鏈末端而使延伸反應(yīng)的產(chǎn)物成為平端。例如,可以在一種或多種dntp的存在下將片段與聚合酶如t4dna聚合酶或klenow聚合酶或其組合一起溫育,以補(bǔ)平雙鏈產(chǎn)物的單鏈部分。或者,可以通過(guò)采用外切核酸酶和/或聚合酶的單鏈突出端降解反應(yīng)與在一種或多種dntp的存在下使用一種或多種聚合酶的補(bǔ)平反應(yīng)的組合來(lái)使通過(guò)本文提供的方法生成的任何雙鏈產(chǎn)物成為平端。
在另一個(gè)實(shí)施方案中,本文所述的銜接子連接應(yīng)用可以在銜接子的非連接鏈與雙鏈產(chǎn)物的鏈之間留下缺口。在這些情況下,可以采用缺口修復(fù)或補(bǔ)平反應(yīng)來(lái)為雙鏈產(chǎn)物附上與銜接子的連接鏈互補(bǔ)的序列??梢圆捎萌我鈹?shù)目的本文所述的dna依賴(lài)性dna聚合酶來(lái)進(jìn)行缺口修復(fù)。在一些情況下,可以采用具有鏈置換活性的dna依賴(lài)性dna聚合酶來(lái)進(jìn)行缺口修復(fù)。在一些情況下,可以采用具有弱鏈置換活性或不具有鏈置換活性的dna依賴(lài)性dna聚合酶來(lái)進(jìn)行缺口修復(fù)。在一些情況下,銜接子的連接鏈可以充當(dāng)缺口修復(fù)或補(bǔ)平反應(yīng)的模板。在一些情況下,可以采用taqdna聚合酶進(jìn)行缺口修復(fù)。
多種連接方法和試劑是本領(lǐng)域已知的并且可用于實(shí)施本文提供的方法。例如,可以采用平端連接。相似地,可以通過(guò)缺少3′-外切核酸酶活性的聚合酶將單個(gè)da核苷酸添加至雙鏈dna產(chǎn)物的3′-端,并且該da核苷酸可以與包含dt突出端的銜接子退火(或者反過(guò)來(lái))。這一設(shè)計(jì)使得雜交的組分隨后被連接(例如,通過(guò)t4dna連接酶)。本領(lǐng)域已知的其他連接策略和相應(yīng)的試劑以及試劑盒和用于進(jìn)行有效連接反應(yīng)的試劑可商購(gòu)獲得(例如,從newenglandbiolabs,roche獲得)。
就兩個(gè)多核苷酸如莖–環(huán)銜接子/引物寡核苷酸和靶多核苷酸而言,如本文所用的術(shù)語(yǔ)“聯(lián)接(joining)”、“附加”和“連接(ligation)”是指兩個(gè)單獨(dú)的多核苷酸的共價(jià)附接以產(chǎn)生具有連續(xù)骨架的單個(gè)較大的多核苷酸。用于聯(lián)接兩個(gè)多核苷酸的方法是本領(lǐng)域已知的,并且包括但不限于酶和非酶(例如,化學(xué))方法。非酶促連接反應(yīng)的實(shí)例包括在美國(guó)專(zhuān)利號(hào)5,780,613和5,476,930中描述的非酶促連接技術(shù),該專(zhuān)利通過(guò)引用并入本文。在一些實(shí)施方案中,通過(guò)連接酶,例如dna連接酶或rna連接酶,使銜接子寡核苷酸與靶多核苷酸聯(lián)接。各自具有特征反應(yīng)條件的多種連接酶是本領(lǐng)域已知的,并且包括但不限于nad+依賴(lài)性連接酶,包括trna連接酶、taq酶dna連接酶、絲狀棲熱菌(thermusfiliformis)dna連接酶、大腸桿菌dna連接酶、tthdna連接酶、水管致黑棲熱菌(thermusscotoductus)dna連接酶(i和ii)、熱穩(wěn)定連接酶、ampligase熱穩(wěn)定dna連接酶、vanc型連接酶、9°ndna連接酶、tspdna連接酶以及通過(guò)生物勘測(cè)發(fā)現(xiàn)的新型連接酶;atp依賴(lài)性連接酶,包括t4rna連接酶、t4dna連接酶、t3dna連接酶、t7dna連接酶、pfudna連接酶、dna連接酶1、dna連接酶iii、dna連接酶iv以及通過(guò)生物勘測(cè)發(fā)現(xiàn)的新型連接酶;及其野生型、突變同種型及遺傳工程變體。連接可以在具有可雜交序列如互補(bǔ)突出端的多核苷酸之間。連接還可以在兩個(gè)平端之間。通常,在連接反應(yīng)中采用5’磷酸。5’磷酸可以由靶多核苷酸、銜接子寡核苷酸或這兩者提供。根據(jù)需要,可以將5’磷酸添加至待聯(lián)接的多核苷酸或從該多核苷酸上去除。用于添加或去除5’磷酸的方法是本領(lǐng)域已知的,并且包括但不限于酶促和化學(xué)方法。在5’磷酸的添加和/或去除中有用的酶包括激酶、磷酸酶和聚合酶。
擴(kuò)增方法
本文所述的方法、組合物和試劑盒對(duì)生成用于下游應(yīng)用如大規(guī)模平行測(cè)序(即,下一代測(cè)序方法)或雜交平臺(tái)的擴(kuò)增就緒產(chǎn)物可能是有用的。擴(kuò)增的方法是本領(lǐng)域公知的??梢允褂玫膒cr技術(shù)的實(shí)例包括但不限于定量pcr、定量熒光pcr(qf-pcr)、多重?zé)晒鈖cr(mf-pcr)、實(shí)時(shí)pcr(rt-pcr)、單細(xì)胞pcr、限制性片段長(zhǎng)度多態(tài)性pcr(pcr-rflp)、pcr-rflp/rt-pcr-rflp、熱啟動(dòng)pcr、巢式pcr、原位聚合酶群落(polony)pcr、原位滾環(huán)擴(kuò)增(rca)、橋式pcr、皮滴定pcr(picotiterpcr)、數(shù)字pcr、小滴數(shù)字(dropletdigital)pcr和乳液pcr。其他合適的擴(kuò)增方法包括連接酶鏈反應(yīng)(lcr)、轉(zhuǎn)錄擴(kuò)增、分子倒置探針(mip)pcr、自動(dòng)維持序列復(fù)制、靶多核苷酸序列的選擇性擴(kuò)增、共有序列引發(fā)的聚合酶鏈反應(yīng)(cp-pcr)、隨機(jī)引發(fā)的聚合酶鏈反應(yīng)(ap-pcr)、簡(jiǎn)并寡核苷酸引發(fā)的pcr(dop-pcr)以及基于核酸的序列擴(kuò)增(nabsa)、單引物等溫?cái)U(kuò)增(spia,參見(jiàn)例如,美國(guó)專(zhuān)利號(hào)6,251,639)、ribo-spia或其組合。可以在本文中使用的其他擴(kuò)增方法包括在美國(guó)專(zhuān)利號(hào)5,242,794、5,494,810、4,988,617和6,582,938中描述的那些。靶核酸的擴(kuò)增可以在珠子上發(fā)生。在其他實(shí)施方案中,擴(kuò)增不在珠子上發(fā)生。擴(kuò)增可以通過(guò)等溫?cái)U(kuò)增例如等溫線性擴(kuò)增來(lái)進(jìn)行??梢赃M(jìn)行熱啟動(dòng)pcr,其中在添加聚合酶之前將反應(yīng)加熱至95℃持續(xù)兩分鐘,或者可以使該聚合酶保持失活,直到第1循環(huán)的第一加熱步驟。可以使用熱啟動(dòng)pcr來(lái)使非特異性擴(kuò)增最小化。用于擴(kuò)增的其他策略和擴(kuò)增的方面在2010年7月8日公開(kāi)的美國(guó)專(zhuān)利申請(qǐng)公開(kāi)號(hào)2010/0173394a1中進(jìn)行了描述,該專(zhuān)利申請(qǐng)通過(guò)引用并入本文。在一些情況下,可以在限制條件下進(jìn)行擴(kuò)增方法,使得僅進(jìn)行較少輪次的擴(kuò)增(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30等)例如用于cdna生成而通常進(jìn)行的。擴(kuò)增的輪數(shù)可以為約1-30、1-20、1-15、1-10、5-30、10-30、15-30、20-30、10-30、15-30、20-30或25-30。
用于靶序列和參考序列的擴(kuò)增的技術(shù)是本領(lǐng)域已知的,并且包括美國(guó)專(zhuān)利號(hào)7,048,481中描述的方法。簡(jiǎn)言之,該技術(shù)可以包括將樣品分離成小液滴的方法和組合物,在一些情況下其中每個(gè)小滴平均含有少于約5、4、3、2或1個(gè)靶核酸分子(多核苷酸),擴(kuò)增每個(gè)小滴中的核酸序列并檢測(cè)靶核酸序列的存在。在一些情況下,擴(kuò)增的序列存在于基因組dna的探針上,而非該基因組dna自身上。在一些情況下,至少200、175、150、125、100、90、80、70、60、50、40、30、20、10或0個(gè)小滴具有靶核酸的零個(gè)拷貝。
pcr可以包括基于變性、寡核苷酸引物退火以及通過(guò)嗜熱模板依賴(lài)性多核苷酸聚合酶進(jìn)行的引物延伸的反復(fù)循環(huán)的體外擴(kuò)增,這可以導(dǎo)致側(cè)翼為引物的多核苷酸分析物的所需序列的拷貝呈指數(shù)式增加。在一些情況下,可以將與dna的相對(duì)鏈退火的兩個(gè)不同的pcr引物定位,使得一個(gè)引物的聚合酶催化的延伸產(chǎn)物可以充當(dāng)另一個(gè)引物的模板鏈,從而導(dǎo)致長(zhǎng)度由寡核苷酸引物的5'端之間的距離限定的離散雙鏈片段的積累。
lcr采用連接酶來(lái)聯(lián)接成對(duì)的預(yù)先形成的核酸探針。該探針可以與核酸分析物的每條互補(bǔ)鏈(若存在)雜交,并且可以采用連接酶來(lái)將每對(duì)探針結(jié)合在一起,從而產(chǎn)生可以在下一循環(huán)中用來(lái)重復(fù)特定核酸序列的兩個(gè)模板。
sda(westin等人2000,naturebiotechnology,18,199-202;walker等人1992,nucleicacidsresearch,20,7,1691-1696)可以包括等溫?cái)U(kuò)增,該等溫?cái)U(kuò)增基于限制性內(nèi)切核酸酶如hincii或bsobi在其識(shí)別位點(diǎn)的半硫代磷酸酯形式的未修飾鏈上產(chǎn)生切口的能力,以及缺乏外切核酸酶的dna聚合酶如klenowexominus聚合酶或bst聚合酶在該缺口處延伸3'-端并置換下游dna鏈的能力。指數(shù)式擴(kuò)增由偶聯(lián)有義和反義反應(yīng)導(dǎo)致,在該反應(yīng)中由有義反應(yīng)置換的鏈充當(dāng)反義反應(yīng)的靶標(biāo)并且反之亦然。
在一些情況下,在例如dna的特定雙鏈序列通過(guò)聚合酶鏈反應(yīng)(pcr)的酶促擴(kuò)增中,擴(kuò)增是指數(shù)式的。
用于生成寡核苷酸陣列的表面的制備
本公開(kāi)內(nèi)容中提供的方法和組合物可以包括制備用于生成陣列的表面。在一些情況下,該陣列是寡核苷酸的陣列(寡核苷酸陣列或oligo陣列)。該表面的制備可以包括在該表面上形成聚合物涂層。該表面可以包括玻璃、二氧化硅、氧化鈦、氧化鋁、氧化銦錫(ito)、硅、聚二甲基硅氧烷(pdms)、聚苯乙烯、聚環(huán)烯烴、聚甲基丙烯酸甲酯(pmma)、環(huán)烯烴共聚物(coc)、其他塑料、鈦、金、其他金屬或其他合適的材料。該表面可以是平坦的或圓的、連續(xù)的或非連續(xù)的、光滑的或粗糙的。表面的實(shí)例包括流動(dòng)池、測(cè)序流動(dòng)池、流動(dòng)通道、微流體通道、毛細(xì)管、壓電表面、孔、微孔、微孔陣列、微陣列、芯片、晶片、非磁性珠、磁珠、鐵磁珠、順磁珠、超順磁珠以及聚合物凝膠。
引發(fā)劑物質(zhì)附接
在一些情況下,用于生成如本文提供的寡核苷酸陣列的、如本文所述的表面的制備包括將引發(fā)劑物質(zhì)與表面鍵合。在一些情況下,該引發(fā)劑物質(zhì)包含至少一種有機(jī)硅烷。在一些情況下,該引發(fā)劑物質(zhì)包含一個(gè)或多個(gè)表面鍵合基團(tuán)。在一些情況下,該引發(fā)劑物質(zhì)包含至少一種有機(jī)硅烷,并且該至少一種有機(jī)硅烷包含一個(gè)或多個(gè)表面鍵合基團(tuán)。該有機(jī)硅烷可以包含一個(gè)表面鍵合基團(tuán),導(dǎo)致單足(mono-pedal)結(jié)構(gòu)。該有機(jī)硅烷可以包含兩個(gè)表面鍵合基團(tuán),導(dǎo)致雙足(pi-pedal)結(jié)構(gòu)。該有機(jī)硅烷可以包含三個(gè)表面鍵合基團(tuán),導(dǎo)致三足(tri-pedal)結(jié)構(gòu)。該表面鍵合基團(tuán)可以包含meo3si、(meo)3si、(eto)3si、(aco)3si、(me2n)3si和/或(ho)3si。在一些情況下,該表面鍵合基團(tuán)包含meo3si(例如,參見(jiàn)圖40中的4000)。在一些情況下,該表面鍵合基團(tuán)包含(meo)3si。在一些情況下,該表面鍵合基團(tuán)包含(eto)3si。在一些情況下,該表面鍵合基團(tuán)包含(aco)3si。在一些情況下,該表面鍵合基團(tuán)包含(me2n)3si。在一些情況下,該表面鍵合基團(tuán)包含(ho)3si。在一些情況下,該有機(jī)硅烷包含多個(gè)表面鍵合基團(tuán)。該多個(gè)表面鍵合基團(tuán)可以是相同的或可以是不同的。該有機(jī)硅烷可以包含圖40中示出的硅烷試劑。在一些情況下,該引發(fā)劑物質(zhì)包含至少一種有機(jī)膦酸,其中表面鍵合基團(tuán)包含(ho)2p(=o)。該有機(jī)膦酸可以包含一個(gè)表面鍵合基團(tuán),導(dǎo)致單足結(jié)構(gòu)。該有機(jī)膦酸可以包含兩個(gè)表面鍵合基團(tuán),導(dǎo)致雙足結(jié)構(gòu)。該有機(jī)膦酸可以包含三個(gè)表面鍵合基團(tuán),導(dǎo)致三足結(jié)構(gòu)。
表面引發(fā)聚合(sip)
在一些情況下,如本文提供的表面包含如本文提供的與表面結(jié)合的引發(fā)劑物質(zhì),該引發(fā)劑物質(zhì)用于生成包含表面涂層或功能化的寡核苷酸陣列。該表面涂層或功能化可以是疏水或親水的。該表面涂層可以包含聚合物涂層或聚合物刷,如聚丙烯酰胺或修飾的聚丙烯酰胺。該表面涂層可以包含凝膠,如聚丙烯酰胺凝膠或修飾的聚丙烯酰胺凝膠。該表面涂層可以包含金屬,如圖案化的電極或電路。該表面涂層或功能化可以包含結(jié)合劑,如鏈霉親和素、親和素、抗體、抗體片段或適體。該表面涂層或功能化可以包含多種要素,例如聚合物或凝膠涂層以及結(jié)合劑。在一些情況下,用于生成如本文提供的寡核苷酸陣列的、如本文所述的表面的制備包括在與表面結(jié)合的引發(fā)劑物質(zhì)上形成聚合物涂層。該與表面結(jié)合的引發(fā)劑物質(zhì)可以是本領(lǐng)域已知的任何與表面結(jié)合的引發(fā)劑物質(zhì)。在一些情況下,該與表面結(jié)合的引發(fā)劑物質(zhì)包含如本文提供的有機(jī)硅烷。該有機(jī)硅烷可以包含如本文所述的一個(gè)或多個(gè)表面鍵合基團(tuán)。在一些情況下,該有機(jī)硅烷包含至少兩個(gè)表面鍵合基團(tuán)。兩個(gè)或更多個(gè)表面鍵合基團(tuán)的存在可以用于提高引發(fā)劑物質(zhì)-聚合物涂層復(fù)合物的穩(wěn)定性。該一個(gè)或多個(gè)表面鍵合基團(tuán)可以是如本文提供的任何表面鍵合基團(tuán)。所得到的聚合物涂層可以包含線性鏈。所得到的聚合物涂層可以包含支化的鏈。該支化的鏈可以是輕度支化的。輕度支化的鏈可以包含少于或大約1、2、3、4、5、6、7、8、9或10個(gè)分支。該聚合物涂層可以形成聚合物刷薄膜。該聚合物涂層可以包含一定的交聯(lián)。該聚合物涂層可以形成接枝結(jié)構(gòu)。該聚合物涂層可以形成網(wǎng)絡(luò)結(jié)構(gòu)。該聚合物涂層可以形成支化結(jié)構(gòu)。該聚合物可以包含均勻的聚合物。該聚合物可以包含嵌段聚合物。該聚合物可以包含梯度共聚物。該聚合物可以包含周期共聚物。該聚合物可以包含統(tǒng)計(jì)共聚物。
在一些情況下,在與表面結(jié)合的引發(fā)劑物質(zhì)上形成的聚合物涂層包含聚丙烯酰胺(pa)。該聚合物可以包含聚丙烯酰胺(pa)。該聚合物可以包含聚甲基丙烯酸甲酯(pmma)。該聚合物可以包含聚苯乙烯(ps)。該聚合物可以包含聚乙二醇(peg)。該聚合物可以包含聚丙烯腈(pan)。該聚合物可以包含聚(苯乙烯-r-丙烯腈)(psan)。該聚合物可以包含單一類(lèi)型的聚合物。該聚合物可以包含多種類(lèi)型的聚合物。該聚合物可以包含如ayres,n.(2010).polymerbrushes:applicationsinbiomaterialsandnanotechnology.polymerchemistry,1(6),769-777中描述的聚合物或如barbey,r.,lavanant,l.,paripovic,d.,schüwer,n.,sugnaux,c.,tugulu,s.,&klok,h.a.(2009)polymerbrushesviasurface-initiatedcontrolledradicalpolymerization:synthesis,characterization,properties,andapplications.chemicalreviews,109(11),5437-5527中描述的聚合物,每篇文獻(xiàn)的公開(kāi)內(nèi)容均通過(guò)引用以其全文并入本文。
與表面結(jié)合的引發(fā)劑物質(zhì)上的聚合物涂層的聚合可以包括用于控制聚合物鏈長(zhǎng)度、涂層均勻性或其他性質(zhì)的方法。該聚合可以包括受控的自由基聚合(crp)、原子轉(zhuǎn)移自由基聚合(atrp)或可逆加成斷裂鏈轉(zhuǎn)移(raft)。該聚合可以包括如在ayres,n.(2010).polymerbrushes:applicationsinbiomaterialsandnanotechnologypolymerchemistry,1(6),769-777中描述的,或者如在barbey,r.,lavanant,l.,paripovic,d.,schüwer,n.,sugnaux,c.,tugulu,s.,&klok,h.a.(2009)polymerbrushesviasurface-initiatedcontrolledradicalpolymerization:synthesis,characterization,properties,andapplications.chemicalreviews,109(11),5437-5527中描述的活性聚合過(guò)程,每篇文獻(xiàn)的公開(kāi)內(nèi)容均通過(guò)引用以其全文并入本文。
在如本文提供的與表面結(jié)合的引發(fā)劑物質(zhì)上形成的聚合物涂層可以在該聚合物涂層的整個(gè)區(qū)域上具有均勻的厚度。在如本文提供的與表面結(jié)合的引發(fā)劑物質(zhì)上形成的聚合物涂層可以在整個(gè)聚合物涂層區(qū)域上具有變化的厚度。該聚合物涂層可以為至少1μm、2μm、3μm、4μm、5μm、7μm、8μm、9μm、10μm、15μm、20μm、25μm、30μm、40μm厚。該聚合物涂層可以為至少50μm厚。該聚合物涂層可以為至少75μm厚。該聚合物涂層可以為至少100μm厚。該聚合物涂層可以為至少150μm厚。該聚合物涂層可以為至少200μm厚。該聚合物涂層可以為至少300μm厚。該聚合物涂層可以為至少400μm厚。該聚合物涂層可以為至少500μm厚。該聚合物涂層可以為約1μm到約10μm厚。該聚合物涂層可以為約5μm到約15μm厚。該聚合物涂層可以為約10μm到約20μm厚。該聚合物涂層可以為約30μm到約50μm厚。該聚合物涂層可以為約10μm到約50μm厚。該聚合物涂層可以為約10μm到約100μm厚。該聚合物涂層可以為約50μm到約100μm厚。該聚合物涂層可以為約50μm到約200μm厚。該聚合物涂層可以為約100μm到約30μm厚。該聚合物涂層可以為約100μm到約500μm厚。
聚合物涂層的物理化學(xué)特征的修飾
在一些情況下,對(duì)本文的聚合物涂層的物理化學(xué)性質(zhì)進(jìn)行修飾。該修飾可以通過(guò)在聚合過(guò)程中并入修飾的丙烯酰胺單體來(lái)實(shí)現(xiàn)。在一些情況下,在聚合過(guò)程中并入乙氧基化的丙烯酰胺單體。該乙氧基化的丙烯酰胺單體可以包含ch2=ch-co-nh(-ch2-ch2-o-)nh形式的單體。該乙氧基化的丙烯酰胺單體可以包含羥乙基丙烯酰胺單體。該乙氧基化的丙烯酰胺單體可以包含乙二醇丙烯酰胺單體。該乙氧基化的丙烯酰胺單體可以包含甲基丙烯酸羥乙酯(hema)。乙氧基化的丙烯酰胺單體的并入可以導(dǎo)致更加疏水的聚丙烯酰胺表面涂層。在一些情況下,在聚合過(guò)程中并入磷酰膽堿丙烯酰胺單體。該磷酰膽堿丙烯酰胺單體可以包含具有圖41中示出的結(jié)構(gòu)的單體。該磷酰膽堿丙烯酰胺單體可以包含其他磷酰膽堿丙烯酰胺單體。在一些情況下,在聚合過(guò)程中并入甜菜堿丙烯酰胺單體。該甜菜堿丙烯酰胺單體可以包含具有圖42中示出的結(jié)構(gòu)的單體。該甜菜堿丙烯酰胺單體可以包含其他甜菜堿丙烯酰胺單體。
寡核苷酸陣列在制備的表面上的生成
在一些情況下,使用如本文提供的方法處理從而包含如本文提供的聚合物涂層的、如本文提供的表面用于生成寡核苷酸陣列。在一些情況下,該寡核苷酸或oligo陣列在包含如本文提供的聚合物涂層的表面上生成,該聚合物涂層在如本文提供的與表面結(jié)合的引發(fā)劑物質(zhì)上形成。該寡核苷酸陣列可以是高密度寡核苷酸陣列。該寡核苷酸陣列可以包含至少10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000、100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或1,000,000,000個(gè)偶聯(lián)至如本文提供的表面上的寡核苷酸。該寡核苷酸陣列可以包含至多10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000、100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或1,000,000,000個(gè)偶聯(lián)至如本文提供的表面上的寡核苷酸。該寡核苷酸陣列可以包含約10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000、100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或1,000,000,000個(gè)偶聯(lián)至如本文提供的表面上的寡核苷酸。如本文提供的寡核苷酸陣列可以具有在其上以至少10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000、100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或1,000,000,000個(gè)寡核苷酸/平方毫米的密度排列的寡核苷酸。在如本文提供的寡核苷酸陣列上的寡核苷酸可以被組織成斑點(diǎn)(特征)、區(qū)域或像素。每個(gè)斑點(diǎn)(特征)或區(qū)域中的寡核苷酸可以彼此相同或彼此相關(guān)(例如,全部或基本上全部都包括共有或共同序列)。每個(gè)斑點(diǎn)或區(qū)域中的寡核苷酸可以彼此超過(guò)55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或99.9%相同。如本文提供的寡核苷酸陣列可以包含至少1、2、3、4、5、6、7、8、9、10、100、1000、10,000、50,000、100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或1,000,000,000個(gè)斑點(diǎn)(特征)或區(qū)域。每個(gè)斑點(diǎn)或區(qū)域可以具有至多約1cm、1mm、500μm、200μm、100μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm、1μm、800nm、500nm、300nm、100nm、50nm或10nm的大小。在一些情況下,寡核苷酸偶聯(lián)至表面上的聚合物涂層。該聚合物涂層可以是如本文提供的聚丙烯酰胺涂層。在一些情況下,如本文提供的組合物包含表面、與所述表面共價(jià)結(jié)合的聚丙烯酰胺涂層;以及偶聯(lián)至所述聚丙烯酰胺涂層的至少一個(gè)寡核苷酸。
在一些情況下,寡核苷酸在聚合過(guò)程中并入至聚合物涂層(例如,聚丙烯酰胺涂層)中。例如,可以在丙烯酰胺聚合過(guò)程中添加5’-acrydite修飾的寡核苷酸鏈,以允許寡核苷酸并入至正在聚合的聚丙烯酰胺結(jié)構(gòu)中。在一些情況下,寡核苷酸在5’端處偶聯(lián)至聚合物涂層(例如,聚丙烯酰胺涂層)。在一些情況下,寡核苷酸在3’端處偶聯(lián)至聚合物涂層(例如,聚丙烯酰胺涂層)。在一些情況下,一些寡核苷酸在3’端處偶聯(lián)至聚合物涂層(例如,聚丙烯酰胺涂層),而一些寡核苷酸在5’端處偶聯(lián)至聚合物涂層(例如,聚丙烯酰胺涂層)。
在一些情況下,寡核苷酸在聚合過(guò)程之后并入至聚合物涂層(例如,聚丙烯酰胺涂層)中。例如,可以在聚合過(guò)程中將反應(yīng)性位點(diǎn)添加至聚合物(例如,聚丙烯酰胺)結(jié)構(gòu)中。然后,可在聚合物(例如,聚丙烯酰胺)聚合后,將寡核苷酸在反應(yīng)性位點(diǎn)處并入。該反應(yīng)性位點(diǎn)可以包括溴乙酰基位點(diǎn)、疊氮基位點(diǎn)或與疊氮基-炔huisgen環(huán)加成相容的位點(diǎn)。在一些情況下,該反應(yīng)性位點(diǎn)包含溴乙?;稽c(diǎn)。在一些情況下,該反應(yīng)性位點(diǎn)包含疊氮基。在一些情況下,該反應(yīng)性位點(diǎn)包含與疊氮基-炔huisgen環(huán)加成相容的位點(diǎn)。
在一些情況下,將寡核苷酸以受控方式并入到聚合物涂層(例如,聚丙烯酰胺涂層)中,其中特定的寡核苷酸位于該聚合物涂層(例如,聚丙烯酰胺涂層)的特定區(qū)域??梢詫⒐押塑账犭S機(jī)并入到聚合物涂層(例如,聚丙烯酰胺涂層)中,其中特定的寡核苷酸隨機(jī)地分布在整個(gè)聚合物涂層(例如,聚丙烯酰胺涂層)中。
可以通過(guò)多種手段在如本文所述制備的表面上制備寡核苷酸(“oligo”)陣列。該表面可以包含如本文提供的與表面結(jié)合的引發(fā)劑物質(zhì)。該表面可以包含如本文提供的與表面結(jié)合的引發(fā)劑物質(zhì),其中聚合物涂層(例如,聚丙烯酰胺涂層)在如本文提供的所述與表面結(jié)合的引發(fā)劑物質(zhì)上形成。該手段可以包括但不限于原位合成(例如,光引導(dǎo)的合成)、打印(例如,噴墨打印)、點(diǎn)印法、轉(zhuǎn)移、橋式擴(kuò)增或重組酶聚合酶擴(kuò)增。
在一些情況下,供本文提供的方法使用的寡核苷酸陣列通過(guò)原位合成來(lái)合成。例如,如在gao等人,2004,biopolymers,73(5):579-596中描述的,可以通過(guò)原位合成制備寡核苷酸區(qū)域,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入本文。陣列表面上寡核苷酸的原位合成可以通過(guò)打印進(jìn)行;例如,噴墨打印或者可以將a、c、g或t亞磷酰胺遞送至特定陣列區(qū)域并由此控制在每個(gè)區(qū)域處的合成的其他打印技術(shù)。原位合成可以通過(guò)電反應(yīng)進(jìn)行;例如,可以將陣列區(qū)域包含在單獨(dú)可尋址的電反應(yīng)單元中,并且可以電控制每個(gè)區(qū)域處的合成。
在一些情況下,供本文提供的方法使用的寡核苷酸陣列通過(guò)點(diǎn)印法合成。點(diǎn)印法可以如gao等人,2004,biopolymers,73(5):579-596中所述,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入本文??梢允褂梅墙佑|或接觸打印法(例如,機(jī)器人針、壓電式噴墨打印機(jī))使預(yù)合成的寡核苷酸沉積到陣列的寡核苷酸或引物區(qū)域上。然后可以例如通過(guò)經(jīng)由官能團(tuán)的化學(xué)附接將寡核苷酸連接或固定至表面。在一些情況下,該官能團(tuán)可以與寡核苷酸的5’端結(jié)合,導(dǎo)致寡核苷酸的3’端遠(yuǎn)離表面。
在一些情況下,原位合成可以通過(guò)光刻法進(jìn)行。光刻法可以在使用或不使用掩模的情況下進(jìn)行。在一些情況下,使用光不穩(wěn)定的保護(hù)基團(tuán)來(lái)控制每個(gè)陣列區(qū)域處的合成,并且采用光掩?;虿捎脽o(wú)掩模光刻系統(tǒng)進(jìn)行圖案化。
在一些情況下,組合使用投影光刻法與對(duì)比度增強(qiáng)光-酸生成聚合物膜,以合成供本文提供的方法使用的寡核苷酸陣列。目前,探針長(zhǎng)度可達(dá)60bp的高密度寡核苷酸(“oligo”)陣列可從affymetrix、nimblegen和agilent(即,sureprinttechnology)商購(gòu)獲得,如fodor,s.p.等人,light-directed,spatiallyaddressableparallelchemicalsynthesis.science251,767-773,(1991),mcgall,g.h.&christians,f.c.high-densitygenechipoligonucleotideprobearrays.advbiochemengbiotechnol77,21-42,(2002),以及nuwaysir,e.f.等人,geneexpressionanalysisusingoligonucleotidearraysproducedbymasklessphotolithography.genomeres12,1749-1755,(2002)中所描述的,每篇文獻(xiàn)的公開(kāi)內(nèi)容均通過(guò)引用以其全文并入本文。然而,在這些陣列中制備的最小特征間距分別為5μm、13μm和30μm。圖4示出了采用光解保護(hù)基化學(xué)法,利用常規(guī)接觸光刻逐步錯(cuò)位生成的20-聚體寡核苷酸陣列。如圖4所示,通過(guò)光解保護(hù)基化學(xué)法,使用常規(guī)接觸光刻逐步錯(cuò)位將所生成的寡核苷酸陣列的可實(shí)現(xiàn)的最小特征大小限制到1μm至2μm。在本文提供的方法中,投影光刻法與對(duì)比度增強(qiáng)光-酸生成聚合物膜的組合使用可以允許等于或小于1μm的分辨率。這可以有利于條形碼特征的緊密封裝,同時(shí)使串?dāng)_誤差最小化。在一些情況下,通過(guò)組合使用投影光刻法與對(duì)比度增強(qiáng)光酸生成聚合物膜生成的寡核苷酸陣列包含1500萬(wàn)個(gè)特征,每個(gè)特征大小為1μmx1μm,總陣列大小為3mmx5mm。寡核苷酸陣列上的每個(gè)寡核苷酸可以為具有約20個(gè)堿基條形碼的約60個(gè)堿基,其側(cè)翼為兩個(gè)約20個(gè)堿基的通用銜接子。可以使用知名的(established)步進(jìn)器(例如,asmlpas5500)來(lái)生成寡核苷酸陣列。知名的步進(jìn)器(例如,asmlpas5500)以±0.060um的放置準(zhǔn)確度常規(guī)地打印縮小5倍的、在亞微米范圍內(nèi)的圖案。條形碼區(qū)可以<1μm,使得每個(gè)特征(“斑點(diǎn)”)跨越采用本文提供的方法在整個(gè)陣列中拉伸的模板核酸(例如,dna)的2000bp部分。該通用銜接子可以包含頂部銜接子和底部銜接子。該頂部銜接子可用于引發(fā)拉伸的核酸(例如,dna),而該底部銜接子可以充當(dāng)ngs文庫(kù)制備的第一銜接子。該條形碼可以是一組寡核苷酸條形碼。這組條形碼可以唯一地鑒別每個(gè)寡核苷酸在寡核苷酸陣列或芯片上的空間位置。條形碼可以針對(duì)精確序列性能來(lái)設(shè)計(jì),例如,在40%到60%之間的gc含量,沒(méi)有長(zhǎng)于2的均聚物運(yùn)行,沒(méi)有長(zhǎng)于3的自互補(bǔ)的序列段,不存在于人類(lèi)基因組參照中。在一些情況下,為了誤差檢驗(yàn)可尋址性,每個(gè)條形碼與陣列中的任何其他條形碼相差四個(gè)缺失或插入或置換。在一些情況下,將采用計(jì)算機(jī)輔助重疊比對(duì)的多次曝光接觸光刻法用于采用已證明的光解保護(hù)基化學(xué)法實(shí)現(xiàn)1μm特征分辨率。
在一些情況下,采用例如如本文以及美國(guó)臨時(shí)申請(qǐng)?zhí)?1/979,448或62/012,238所述的橋式擴(kuò)增或重組酶聚合酶擴(kuò)增生成寡核苷酸陣列,每篇申請(qǐng)的公開(kāi)內(nèi)容均通過(guò)引用以其全文并入本文。陣列的基底可以包含結(jié)合的銜接子或能夠與單獨(dú)寡核苷酸上的區(qū)域結(jié)合的寡核苷酸,從而允許該基底上的單獨(dú)寡核苷酸的橋式擴(kuò)增或重組酶聚合酶擴(kuò)增??梢韵蚧咨辖臃N具有已知條形碼序列的寡核苷酸(即,引物),隨后擴(kuò)增以生成寡核苷酸區(qū)域?;蛘?,可以向寡核苷酸基底接種具有隨機(jī)或未知條形碼序列的寡核苷酸,隨后擴(kuò)增以生成寡核苷酸區(qū)域,并對(duì)來(lái)自每個(gè)寡核苷酸區(qū)域的寡核苷酸進(jìn)行測(cè)序以確定與每個(gè)寡核苷酸區(qū)域?qū)?yīng)的條形碼序列。可以制備用于生成如本文提供的寡核苷酸陣列的基底。
采用本文提供的任意方法生成的寡核苷酸陣列(例如,模板和/或接受體陣列)上的寡核苷酸可以包含多個(gè)區(qū)段或序列,如pcr或延伸反應(yīng)引物序列、條形碼序列以及銜接子或通用序列。例如,圖5示出了寡核苷酸500的示意圖,其從5’到3’包含pcr引物序列501、條形碼序列502和用于結(jié)合的限定序列503。限定序列(503)可以是銜接子序列,通用序列,或與通過(guò)本文提供的方法(例如,轉(zhuǎn)座子插入)引入到靶多核苷酸中的隨機(jī)引物或引物結(jié)合位點(diǎn)的特定區(qū)域互補(bǔ)的序列。寡核苷酸的5'端可以結(jié)合至該陣列。如本文提供的寡核苷酸陣列(例如,模板和/或接受體陣列)上的寡核苷酸可以包含單獨(dú)或單個(gè)的區(qū)段或序列。該單獨(dú)的區(qū)段可以是pcr或延伸反應(yīng)引物序列、條形碼序列或銜接子或通用序列。
在包含pcr引物序列的寡核苷酸中的pcr引物序列可以是在采用聚合酶的pcr反應(yīng)中使用的序列,該聚合酶包括但不限于poli、polii、poliii、klenow、t4dnapol、修飾的t7dnapol、突變的修飾的t7dnapol、tdt、bst、taq、tth、pfu、pow、vent、pab和phi-29。例如,可以采用bst聚合酶,通過(guò)將模板核酸和引物與bst聚合酶和dntp一起在65℃下在1x等溫?cái)U(kuò)增緩沖液(例如,20mmtris-hcl,10mm(nh4)2so4,50mmkcl,2mmmgso4和0.1%吐溫20)中溫育來(lái)進(jìn)行反應(yīng)??梢圆捎胮cr引物序列來(lái)引發(fā)延伸反應(yīng)??梢圆捎胮cr引物序列來(lái)引發(fā)pcr反應(yīng)??梢酝ㄟ^(guò)pcr來(lái)擴(kuò)增從包含pcr引物序列的寡核苷酸生成的延伸產(chǎn)物,以在測(cè)序前增加其濃度或量。pcr引物序列可以為至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35bp。pcr引物序列可以為至多5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個(gè)堿基。
寡核苷酸陣列上的寡核苷酸中的銜接子或通用序列可以包含能夠與模板或靶核酸直接(例如,通過(guò)與模板核酸內(nèi)的序列雜交)或間接(例如,通過(guò)與雜交至模板核酸內(nèi)的序列的游離引物雜交)雜交的銜接子或通用序列。銜接子或通用序列可以為至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個(gè)堿基。銜接子或通用序列可以為至多5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個(gè)堿基。
寡核苷酸陣列(例如,模板和/或接受體寡核苷酸陣列)上的寡核苷酸區(qū)可以在寡核苷酸陣列600上以不同的排列方式來(lái)組織。例如,如圖6a所示,寡核苷酸區(qū)可以在寡核苷酸陣列上以寡核苷酸區(qū)610的二維陣列的方式排列。例如,如圖6b所示,寡核苷酸區(qū)可以在寡核苷酸陣列上以跨越寡核苷酸陣列在一個(gè)方向上延伸的行或列620、621、622、623、624的方式排列。例如,如圖6c所示,寡核苷酸區(qū)可以在寡核苷酸陣列600上以簇630的方式排列。
寡核苷酸(oligo)可以在陣列表面上以5’至3’朝向或以3’至5’朝向排列。單個(gè)陣列斑點(diǎn)或區(qū)域可以具有最大約15μm、最大約14μm、最大約13μm、最大約12μm、最大約11μm、最大約10μm、最大約5μm、最大約3μm、最大約1μm、最大約0.3μm或最大約0.1μm的尺寸。引物區(qū)可以在基底上以至少100、1,000、10,000、100,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、50,000,000、100,000,000、200,000,000或500,000,000個(gè)區(qū)域每cm2的密度排列。
用于生成轉(zhuǎn)移或接受體陣列的轉(zhuǎn)移技術(shù)
本文的方法還可用于生成具有所需朝向的寡核苷酸陣列。在一些情況下,在為了生成本文提供的寡核苷酸陣列而制備的表面上生成如本文提供的寡核苷酸陣列的方法用來(lái)生成用作模板的寡核苷酸陣列(即,模板陣列),以用于生成一個(gè)或多個(gè)寡核苷酸陣列,該寡核苷酸陣列包含與其偶聯(lián)的且與模板陣列上的寡核苷酸互補(bǔ)的寡核苷酸。包含與其偶聯(lián)的且與模板陣列互補(bǔ)的寡核苷酸的寡核苷酸陣列可以被稱(chēng)為接受體陣列(或者可替代地,被稱(chēng)為轉(zhuǎn)移陣列)。該轉(zhuǎn)移或接受體寡核苷酸陣列可以包含具有所需朝向的寡核苷酸??梢圆捎藐嚵修D(zhuǎn)移過(guò)程從模板陣列生成轉(zhuǎn)移或接受體陣列。在一些情況下,使具有所需特征(“斑點(diǎn)”)密度(例如,特征或斑點(diǎn)大小為約1μm)的模板寡核苷酸陣列經(jīng)歷如本文提供的陣列轉(zhuǎn)移過(guò)程,以便生成具有所需朝向的轉(zhuǎn)移或接受體寡核苷酸陣列。該所需朝向可以是包含寡核苷酸的轉(zhuǎn)移或接受體寡核苷酸陣列,其中該陣列的每個(gè)寡核苷酸的5’端均附接至陣列基底。用于生成具有所需朝向的寡核苷酸的轉(zhuǎn)移或接受體寡核苷酸陣列(即,該陣列的每個(gè)寡核苷酸的5’端均附接至陣列基底)的模板寡核苷酸陣列,可使模板陣列的每個(gè)寡核苷酸的3’端均附接至該基底。該陣列轉(zhuǎn)移過(guò)程可以是面對(duì)面轉(zhuǎn)移過(guò)程。在一些情況下,該面對(duì)面轉(zhuǎn)移過(guò)程通過(guò)酶促轉(zhuǎn)移或通過(guò)合成的酶促轉(zhuǎn)移(ets)發(fā)生。圖7、8a和9中總體上描繪了ets。在一些情況下,該面對(duì)面轉(zhuǎn)移過(guò)程通過(guò)非酶促轉(zhuǎn)移過(guò)程發(fā)生。該非酶促轉(zhuǎn)移過(guò)程可以是寡核苷酸固定化轉(zhuǎn)移(oit)。圖4和圖5中總體上描繪了oit。
面對(duì)面凝膠轉(zhuǎn)移過(guò)程(例如,ets或oit)可以顯著降低單位制備成本,同時(shí)翻轉(zhuǎn)寡核苷酸朝向(5’固定的),這可以具有測(cè)定優(yōu)勢(shì),如允許與陣列結(jié)合的寡核苷酸的3’端的酶促延伸。而且,ets或oit可以導(dǎo)致更大數(shù)目或更高百分比的具有所需或限定長(zhǎng)度的寡核苷酸(即,全長(zhǎng)寡核苷酸)從模板陣列轉(zhuǎn)移至接受體陣列。隨后接受體寡核苷酸陣列上的轉(zhuǎn)移的全長(zhǎng)產(chǎn)物寡核苷酸的擴(kuò)增(例如,如本文提供的擴(kuò)增特征再生或afr)可以使該接受體寡核苷酸陣列含有包含超過(guò)50個(gè)核苷酸堿基的寡核苷酸,而不會(huì)導(dǎo)致低產(chǎn)率或部分長(zhǎng)度產(chǎn)物。
在一些情況下,模板和/或接受體陣列包含聚合物。該聚合物可以是適體或寡核苷酸。在一些情況下,模板或接受體陣列包含寡核苷酸。模板或接受體陣列可以具有至少10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000或100,000、200,000、500,000、1,000,000、2,000,000、5,000,000、10,000,000、20,000,000、100,000,000、200,000,000、500,000,000或十億個(gè)與其偶聯(lián)的模板聚合物(例如,寡核苷酸)。模板陣列可以具有以至少10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、50,000或100,000個(gè)聚合物(例如,寡核苷酸)/平方毫米的密度在其上排列的模板聚合物??蓪⒛0寤蚪邮荏w陣列上的聚合物(例如,寡核苷酸)組織成斑點(diǎn)、區(qū)域或像素。每個(gè)斑點(diǎn)或區(qū)域中的聚合物(例如,寡核苷酸)可以彼此相同或彼此相關(guān)(例如,全部或基本上全部都包括共有或共同序列)。每個(gè)斑點(diǎn)或區(qū)域中的聚合物(例如,寡核苷酸)可以彼此超過(guò)55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或99.9%相同。該模板或接受體陣列可以包含至少1、2、3、4、5、6、7、8、9、10、100、1000、10,000、100,000、1,000,000或10,000,000個(gè)斑點(diǎn)或區(qū)域。每個(gè)斑點(diǎn)或區(qū)域可以具有至多約1cm、1mm、500μm、200μm、100μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm、1μm、800nm、500nm、300nm、100nm、50nm或10nm的大小。
如本文提供的生成的接受體或轉(zhuǎn)移陣列可以包含在其序列和/或數(shù)目方面與模板陣列上的寡核苷酸完全互補(bǔ)、完全相同、部分互補(bǔ)或部分相同的寡核苷酸,其中該接受體陣列從該模板陣列轉(zhuǎn)移。部分互補(bǔ)可以指具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.9%的序列互補(bǔ)性的接受體陣列。部分相同可以指具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.9%的序列同一性的接受體陣列。接受體陣列可以具有與模板陣列相同的寡核苷酸數(shù)目,和/或具有模板陣列的至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.9%的寡核苷酸數(shù)目,其中該接受體陣列從該模板陣列轉(zhuǎn)移。
如本文提供的陣列制備方法可以產(chǎn)生具有設(shè)計(jì)的、所需的或預(yù)期的長(zhǎng)度的、可以被稱(chēng)為全長(zhǎng)產(chǎn)物的聚合物(例如,寡核苷酸)的陣列。例如,預(yù)期生成具有10個(gè)堿基的寡核苷酸的制備方法可以生成偶聯(lián)至陣列的、具有10個(gè)堿基的全長(zhǎng)寡核苷酸。陣列制備過(guò)程可以產(chǎn)生具有小于設(shè)計(jì)的、所需的或預(yù)期的長(zhǎng)度的、可以被稱(chēng)為部分長(zhǎng)度產(chǎn)物的聚合物(例如,寡核苷酸)。部分長(zhǎng)度的寡核苷酸的存在可以在給定的特征(斑點(diǎn))內(nèi)或在特征(斑點(diǎn))之間。例如,預(yù)期生成具有10個(gè)堿基的寡核苷酸的制備方法可以生成偶聯(lián)至陣列的、僅具有8個(gè)堿基的部分長(zhǎng)度寡核苷酸。也就是說(shuō),合成的寡核苷酸陣列可以包含許多核酸,這些核酸沿其長(zhǎng)度是同源的或接近同源的,但其長(zhǎng)度可以彼此不同。在這些同源或接近同源的核酸中,具有最長(zhǎng)長(zhǎng)度的那些可以被認(rèn)為是全長(zhǎng)產(chǎn)物。長(zhǎng)度比最長(zhǎng)長(zhǎng)度短的核酸可以被認(rèn)為是部分長(zhǎng)度產(chǎn)物。本文提供的陣列制備方法可以產(chǎn)生偶聯(lián)至陣列的給定特征(斑點(diǎn))內(nèi)的一些全長(zhǎng)產(chǎn)物(例如,寡核苷酸)和一些部分長(zhǎng)度產(chǎn)物(例如,寡核苷酸)。偶聯(lián)至特定陣列或在給定特征內(nèi)的部分長(zhǎng)度產(chǎn)物在長(zhǎng)度上可以不同。由全長(zhǎng)產(chǎn)物生成的互補(bǔ)核酸也可以被認(rèn)為是全長(zhǎng)產(chǎn)物。由部分長(zhǎng)度產(chǎn)物生成的互補(bǔ)核酸也可以被認(rèn)為是部分長(zhǎng)度產(chǎn)物。
可以使用如本文提供的轉(zhuǎn)移方法(例如,ets或oit)增加或富集偶聯(lián)至接受體陣列表面的全長(zhǎng)產(chǎn)物(例如,寡核苷酸)的量或百分比。陣列轉(zhuǎn)移(例如,ets或oit)可以產(chǎn)生包含至少、至多、大于、小于或大約30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或99.9%轉(zhuǎn)移的寡核苷酸的轉(zhuǎn)移或接受體陣列,其中該轉(zhuǎn)移的寡核苷酸的長(zhǎng)度是用于生成該轉(zhuǎn)移或接受體陣列的模板陣列上相應(yīng)寡核苷酸的長(zhǎng)度的100%。長(zhǎng)度為模板寡核苷酸的長(zhǎng)度的100%(即,相同或等同長(zhǎng)度)的轉(zhuǎn)移的寡核苷酸可以被稱(chēng)為全長(zhǎng)產(chǎn)物(例如,全長(zhǎng)產(chǎn)物寡核苷酸)。通過(guò)本領(lǐng)域已知的方法(例如,點(diǎn)印法或原位合成)制備的模板陣列可以包含約20%的所需長(zhǎng)度的寡核苷酸(即,全長(zhǎng)寡核苷酸)和約80%的非所需長(zhǎng)度的寡核苷酸(即,部分長(zhǎng)度寡核苷酸)。采用如本文提供的陣列轉(zhuǎn)移方法轉(zhuǎn)移通過(guò)本領(lǐng)域已知的方法生成的、包含約20%全長(zhǎng)寡核苷酸和約80%部分長(zhǎng)度寡核苷酸的陣列可以導(dǎo)致生成包含至多約20%全長(zhǎng)產(chǎn)物寡核苷酸的轉(zhuǎn)移或接受體陣列。在一些情況下,根據(jù)本文的方法制備的陣列具有更大百分比的所需長(zhǎng)度的寡核苷酸(即,全長(zhǎng)寡核苷酸),使得采用本文提供的陣列轉(zhuǎn)移方法轉(zhuǎn)移根據(jù)本文的方法制備的陣列導(dǎo)致生成與本領(lǐng)域已知的制備和轉(zhuǎn)移方法相比具有更高百分比的全長(zhǎng)產(chǎn)物寡核苷酸的轉(zhuǎn)移或接受體陣列。
在一些情況下,本文提供的轉(zhuǎn)移方法(例如,ets或oit)包括生成與模板序列互補(bǔ)的核酸(例如,寡核苷酸)序列。該轉(zhuǎn)移可以通過(guò)酶復(fù)制(例如,ets)或通過(guò)陣列組分在陣列表面之間的非酶促物理轉(zhuǎn)移(例如,oit)而發(fā)生。該陣列表面可以是如本文提供的任何陣列表面。模板陣列和接受體陣列的基底可以是相同的或可以是不同的。該轉(zhuǎn)移可以包括制備已附接至接受體陣列的互補(bǔ)序列;例如,結(jié)合至接受體陣列的引物,并且它與模板陣列上的銜接子互補(bǔ),可以采用模板陣列序列作為模板進(jìn)行延伸,從而生成全長(zhǎng)或部分長(zhǎng)度接受體陣列。轉(zhuǎn)移可包括從模板陣列制備互補(bǔ)序列,隨后將該互補(bǔ)序列附接至接受體陣列。
如本文提供的轉(zhuǎn)移方法(例如,ets或oit)可以生成接受體陣列,使得模板核酸(例如,寡核苷酸)相對(duì)于其偶聯(lián)的接受體陣列表面的朝向得以保留(例如,模板核酸(例如,寡核苷酸)的3’端結(jié)合至模板陣列,而轉(zhuǎn)移的核酸(例如,寡核苷酸)互補(bǔ)體的3’端結(jié)合至接受體陣列)。轉(zhuǎn)移可以逆轉(zhuǎn)核酸相對(duì)于其偶聯(lián)的陣列表面的朝向(例如,模板核酸的3’端結(jié)合至模板陣列,而轉(zhuǎn)移的核酸互補(bǔ)體的5’端結(jié)合至接受體陣列)。
陣列轉(zhuǎn)移(例如,ets或oit)可以多次進(jìn)行??梢圆捎孟嗤哪0尻嚵卸啻芜M(jìn)行陣列轉(zhuǎn)移(例如,ets或oit)。可以使用與模板基底結(jié)合的模板聚合物的模板陣列來(lái)產(chǎn)生至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、500、1,000、5,000、10,000、50,000或100,000個(gè)接受體陣列。通過(guò)使用來(lái)自一次陣列轉(zhuǎn)移的轉(zhuǎn)移陣列作為隨后轉(zhuǎn)移的模板陣列,陣列轉(zhuǎn)移可以在一系列的轉(zhuǎn)移中多次進(jìn)行。例如,可以從具有在其3’端處與陣列結(jié)合的寡核苷酸的模板陣列到具有在其5’端處與陣列結(jié)合的互補(bǔ)寡核苷酸的第一轉(zhuǎn)移陣列進(jìn)行第一次轉(zhuǎn)移,并且可以從該第一轉(zhuǎn)移陣列(現(xiàn)在充當(dāng)模板陣列)到第二轉(zhuǎn)移陣列進(jìn)行第二次轉(zhuǎn)移,該第二轉(zhuǎn)移陣列比采用本領(lǐng)域常用的轉(zhuǎn)移技術(shù)生成的接受體陣列具有更高百分比的全長(zhǎng)產(chǎn)物以及匹配原始模板陣列的序列,同時(shí)保留5’-表面結(jié)合的朝向。在一些情況下,采用本文提供的陣列轉(zhuǎn)移方法(例如,ets或oit)生成的接受體陣列上的全長(zhǎng)產(chǎn)物寡核苷酸進(jìn)一步通過(guò)接受體陣列上的全長(zhǎng)產(chǎn)物寡核苷酸的擴(kuò)增而富集??梢圆捎帽疚奶峁┑姆椒ㄟM(jìn)行擴(kuò)增。該陣列轉(zhuǎn)移方法可以是如本文提供的面對(duì)面酶促轉(zhuǎn)移方法(例如,ets)或非酶促(例如,oit)方法。
在一些情況下,可以通過(guò)使用在模板聚合物(例如,寡核苷酸)上的銜接子序列來(lái)幫助通過(guò)ets或oit進(jìn)行的陣列轉(zhuǎn)移。聚合物(例如,寡核苷酸)可以包含所需的最終序列,外加一個(gè)或多個(gè)銜接子序列。例如,模板寡核苷酸可以按順序包含具有第一銜接子序列的3’端、具有第二銜接子序列的5’端以及在中間的所需最終序列。第一和第二銜接子序列可以是相同的或可以是不同的。在一些情況下,在相同陣列斑點(diǎn)中的寡核苷酸包含相同的第一和第二銜接子序列以及最終序列,而在不同陣列斑點(diǎn)中的寡核苷酸包含相同的第一和第二銜接子序列以及不同的最終序列。在轉(zhuǎn)移/接受體陣列上的引物可以與銜接子序列互補(bǔ),從而允許引物與模板聚合物(例如,寡核苷酸)之間的雜交。這樣的雜交可有助于從一個(gè)陣列到另一個(gè)陣列的轉(zhuǎn)移。
可以在轉(zhuǎn)移后通過(guò)例如酶切、消化或限制性處理,從轉(zhuǎn)移/接受體陣列聚合物(例如,轉(zhuǎn)移的寡核苷酸)中去除一些或全部銜接子序列??梢栽谵D(zhuǎn)移后通過(guò)例如酶切、消化或限制性處理,從轉(zhuǎn)移/接受體陣列聚合物(例如,轉(zhuǎn)移的寡核苷酸)中去除一些或全部銜接子序列。例如,可以經(jīng)由通過(guò)雙鏈dna酶進(jìn)行的探針末端剪切(pec)將寡核苷酸陣列組分的銜接子去除。可以添加與銜接子序列互補(bǔ)的寡核苷酸并將該寡核苷酸與陣列組分雜交。然后可以采用對(duì)雙鏈dna具有特異性的dna酶消化寡核苷酸(參見(jiàn)圖10)。或者,可以將一個(gè)或多個(gè)可切割的堿基如du摻入到待去除的鏈的引物中。然后可以將該引物在緊挨著探針的最3’堿基的位置處產(chǎn)生切口,并且該切口位點(diǎn)可以由合適的酶如綠豆s1或p1核酸酶切割(見(jiàn)圖11)。還可以使用許多種限制酶及其相關(guān)的限制酶切位點(diǎn),包括但不限于ecori、ecorii、bamhi、hindiii、taqi、noti、hinfi、sau3ai、pvuii、smai、haeiii、hgai、alui、ecorv、ecop15i、kpni、psti、saci、sali、scai、spei、sphi、stui和xbai。在一些情況下,從第二表面(接受體表面)到含有與頂部銜接子互補(bǔ)的引物(例如,寡核苷酸)的新的第三表面重復(fù)上述轉(zhuǎn)移過(guò)程。因?yàn)橹挥腥L(zhǎng)寡核苷酸可以具有完整的頂部銜接子,所以只有這些寡核苷酸可以被拷貝到第三陣列表面(即,新的或第三受體或轉(zhuǎn)移陣列)上。該過(guò)程可以從部分產(chǎn)物中純化或富集全長(zhǎng)寡核苷酸,由此產(chǎn)生高特征密度、高質(zhì)量的全長(zhǎng)寡核苷酸陣列。純化或富集可以意指接受體陣列的生成,使得所述接受體陣列比用作生成所述接受體陣列的模板的陣列具有更大百分比或數(shù)目的所需長(zhǎng)度(即,全長(zhǎng))的寡核苷酸。該全長(zhǎng)寡核苷酸可以是含有所有所需特征(例如,銜接子、條形碼、靶核酸或其互補(bǔ)體,和/或通用序列等)的寡核苷酸。
在一些情況下,可以通過(guò)陣列(例如,模板陣列)的或陣列(例如,模板陣列)上表面涂層的柔性或可變形性來(lái)幫助陣列轉(zhuǎn)移。例如,可以在陣列轉(zhuǎn)移(例如,ets、oit)中使用包含具有偶聯(lián)的寡核苷酸的聚丙烯酰胺凝膠涂層的陣列(例如,模板陣列)。該凝膠涂層的可變形性可以允許陣列組分(寡核苷酸、試劑(例如,酶))彼此接觸,即使存在表面粗糙度。表面粗糙度可以是表面的形貌的變化性。
可以通過(guò)被稱(chēng)為擴(kuò)增特征再生(afr)的酶促反應(yīng)擴(kuò)增或再生陣列組分。afr可以在模板陣列和/或接受體陣列上進(jìn)行??墒褂胊fr在陣列(例如,模板和/或接受體)上再生全長(zhǎng)寡核苷酸,以便確保陣列(例如,模板和/或接受體陣列)上的特征(斑點(diǎn))中的每個(gè)寡核苷酸均包含所需組分(例如,銜接子、條形碼、靶核酸或其互補(bǔ)體,和/或通用序列等)??梢詫?duì)包含銜接子和/或引物結(jié)合位點(diǎn)(pbs)的寡核苷酸進(jìn)行afr,使得寡核苷酸各自包含第一銜接子(或第一pbs)、探針序列和第二銜接子(或第二pbs)。優(yōu)選地,陣列(例如,模板和/或接受體陣列)上的每個(gè)特征中的寡核苷酸均包含兩個(gè)或更多個(gè)引物結(jié)合位點(diǎn)(或銜接子序列)。可以采用本領(lǐng)域已知的核酸擴(kuò)增技術(shù)進(jìn)行afr。該擴(kuò)增技術(shù)可以包括但不限于等溫橋式擴(kuò)增或pcr。例如,可以通過(guò)陣列(例如,模板和/或接受體陣列)組分上的銜接子序列與結(jié)合至表面的寡核苷酸引物之間的雜交,及隨后的酶促延伸或擴(kuò)增,來(lái)對(duì)陣列(例如,模板和/或接受體陣列)組分寡核苷酸進(jìn)行橋式擴(kuò)增??梢允褂脭U(kuò)增來(lái)恢復(fù)損失的陣列(例如,模板和/或接受體陣列)組分密度或?qū)㈥嚵?例如,模板和/或接受體陣列)組分的密度增加至超過(guò)其原始密度。
如本文提供的陣列(例如,模板和/或接受體陣列)上的固定的寡核苷酸、核苷酸或引物可以在長(zhǎng)度上彼此相等,或可以具有不同的長(zhǎng)度。固定的寡核苷酸、核苷酸或引物可以包含至少約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195或200個(gè)堿基。在一些情況下,固定的寡核苷酸、核苷酸或引物為71個(gè)堿基長(zhǎng)(71-聚體)。
可以使轉(zhuǎn)移陣列的接受體表面與模板陣列的模板表面緊密靠近或接觸。在一些情況下,可以通過(guò)可變形的涂層如聚合物凝膠(例如,聚丙烯酰胺)的存在來(lái)幫助模板陣列與轉(zhuǎn)移陣列之間的接觸。該涂層的可變形性可以允許偶聯(lián)的聚合物(例如,寡核苷酸或引物)進(jìn)行足夠緊密的接觸,以使雜交發(fā)生。該涂層的可變形性可以幫助克服由于表面粗糙度(例如,表面形貌變化性)或其他特征導(dǎo)致的間隙,該間隙將會(huì)阻止用于雜交的足夠緊密接觸??勺冃瓮繉拥囊粋€(gè)額外的益處是它可以預(yù)加載有酶促反應(yīng)試劑,因此充當(dāng)用于通過(guò)合成的酶促轉(zhuǎn)移(ets)的界面反應(yīng)的儲(chǔ)器。陣列之一或兩者可以包含具有偶聯(lián)有聚合物分子的凝膠涂層的基底。例如,轉(zhuǎn)移陣列可以包含與聚丙烯酰胺凝膠偶聯(lián)的基底,其中寡核苷酸引物偶聯(lián)至該凝膠。表面和涂層在本公開(kāi)內(nèi)容的其他地方進(jìn)一步討論。
通過(guò)合成的酶促轉(zhuǎn)移(ets)
ets可以包括如圖7、8a和9中描繪的面對(duì)面聚合酶延伸反應(yīng),該反應(yīng)用于將一個(gè)或多個(gè)模板寡核苷酸(例如,dna寡核苷酸)從模板寡核苷酸陣列拷貝到第二表面(例如,接受體陣列)上??梢园磯旱诙砻?例如,接受體陣列),使其與模板寡核苷酸(例如,dna寡核苷酸)陣列接觸,其中該第二表面均勻覆蓋有與模板寡核苷酸陣列中的寡核苷酸上的序列(例如,包含銜接子序列的寡核苷酸陣列中的底部銜接子序列)互補(bǔ)的固定的引物。接受體陣列表面可以包含表面固定的寡聚物(寡核苷酸)、核苷酸或者與模板寡核苷酸陣列上的模板核酸或寡核苷酸至少部分互補(bǔ)的引物。在一些情況下,轉(zhuǎn)移或接受體陣列包含與模板陣列上的適體選擇性雜交或結(jié)合的寡核苷酸。轉(zhuǎn)移或接受體陣列上的固定的寡核苷酸、核苷酸或引物可以與模板聚合物(例如,寡核苷酸)上的銜接子區(qū)域互補(bǔ)。
圖8a-c中示出了如本文提供的ets陣列轉(zhuǎn)移過(guò)程的實(shí)例。模板核酸(寡核苷酸)可以與接受體表面上的固定的引物或探針雜交,該引物或探針也被稱(chēng)為接受體引物或探針,或者轉(zhuǎn)移引物或探針??梢岳缤ㄟ^(guò)dna聚合酶對(duì)雜交的復(fù)合物(例如,雙鏈體)進(jìn)行酶促延伸(見(jiàn)圖8a),該dna聚合酶包括但不限于poli、polii、poliii、klenow、t4dnapol、修飾的t7dnapol、突變的修飾的t7dnapol、tdt、bst、taq、tth、pfu、pow、vent、pab、pyrophage。
轉(zhuǎn)移過(guò)程可以保留寡核苷酸的朝向,即,如果5’端結(jié)合至模板表面,則合成的寡核苷酸的5’端將結(jié)合至接受體表面,或者反之亦然。如圖8a所示,在其5’端結(jié)合的轉(zhuǎn)移引物可以在其3’端與模板核酸結(jié)合,隨后進(jìn)行酶促延伸以產(chǎn)生與模板寡核苷酸互補(bǔ)并在其5’端與接受體陣列表面結(jié)合的核酸。
在一些情況下,僅使用全長(zhǎng)模板核酸產(chǎn)物在接受體陣列上生成互補(bǔ)體。圖8c示出了僅采用全長(zhǎng)模板核酸產(chǎn)物的酶促轉(zhuǎn)移(即,ets)的實(shí)例,該產(chǎn)物包含第一銜接子區(qū)域a、中間區(qū)域b和第二銜接子區(qū)域c。在圖8c中,接受體陣列表面包含與在模板核酸末端處的第二銜接子序列c互補(bǔ)的引物。模板陣列上的全長(zhǎng)產(chǎn)物包含整個(gè)序列(即,第一銜接子a-中間區(qū)域b-第二銜接子c),而部分長(zhǎng)度產(chǎn)物不包含整個(gè)序列(即,第一銜接子a-中間區(qū)域b)。在圖8c中,模板陣列上的部分長(zhǎng)度產(chǎn)物沒(méi)有被轉(zhuǎn)移,因?yàn)樗鼈內(nèi)鄙俚诙暯幼觕,因此不能被包含與第二銜接子c互補(bǔ)的序列的接受體陣列上的引物(寡核苷酸)結(jié)合。在一些情況下,模板陣列上的模板核酸寡核苷酸的至少30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.9%或100%是全長(zhǎng)產(chǎn)物(寡核苷酸)。在一些情況下,在接受體陣列上生成的轉(zhuǎn)移或接受體核酸產(chǎn)物(寡核苷酸)的至少30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、99.9%或100%是全長(zhǎng)產(chǎn)物。ets期間接受體陣列上部分長(zhǎng)度產(chǎn)物的生成可能是由于全長(zhǎng)模板寡核苷酸在聚合酶驅(qū)動(dòng)的合成期間的不完全延伸而引起的。接受體陣列上全長(zhǎng)產(chǎn)物的生成可以采用如本文提供的afr來(lái)實(shí)現(xiàn)。
在一些情況下,接受體陣列上包含與模板聚合物(例如,寡核苷酸)的一部分雜交的引物,使得發(fā)生延伸反應(yīng),直到所有的模板聚合物(例如,寡核苷酸)都用作互補(bǔ)陣列(或接受體陣列)上互補(bǔ)接受體寡核苷酸合成的模板。在一些情況下,發(fā)生接受體陣列的合成,使得平均至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%或50%的模板聚合物(例如,寡核苷酸)用于在該接受體陣列上生成互補(bǔ)序列。換句話說(shuō),轉(zhuǎn)移后,接受體陣列可以包含采用至少100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%或50%的模板寡核苷酸作為模板合成的接受體核苷酸(例如,寡核苷酸)。
陣列轉(zhuǎn)移過(guò)程(例如,ets)可以逆轉(zhuǎn)模板核酸的朝向(見(jiàn)圖8b、圖9)。也就是說(shuō),如果5’端結(jié)合至模板表面,則合成的寡核苷酸的3’端將結(jié)合至接受體表面,或者反之亦然。例如,圖8b示出了模板陣列表面上的模板核酸(例如,寡核苷酸)的酶促轉(zhuǎn)移(即,ets),該模板核酸可以包含第一銜接子區(qū)域a、中間區(qū)域b和第二銜接子區(qū)域c中的一些或全部。在圖8b中,與位于模板核酸的基底端處并被指定為a的銜接子序列互補(bǔ)的接受體表面引物(a')用于進(jìn)行酶促轉(zhuǎn)移。在這種情況下,部分長(zhǎng)度和全長(zhǎng)互補(bǔ)產(chǎn)物(寡核苷酸)均被轉(zhuǎn)移,并且其相對(duì)于模板陣列的基底表面的朝向得到逆轉(zhuǎn)。
如圖9所示,在其3’端與模板陣列表面(模板表面)結(jié)合的模板核酸(例如,寡核苷酸)可以與接受體陣列上、在其5’端與接受體陣列表面結(jié)合的轉(zhuǎn)移引物雜交。轉(zhuǎn)移引物的酶促延伸產(chǎn)生與模板核酸(例如,寡核苷酸)互補(bǔ)并在其5’端與接受體陣列表面結(jié)合的核酸(例如,寡核苷酸)。在一些情況下,利用模板陣列的特征(斑點(diǎn))中的部分長(zhǎng)度寡核苷酸在接受體陣列上生成互補(bǔ)的部分長(zhǎng)度寡核苷酸。在一些情況下,利用模板陣列的特征(斑點(diǎn))中的全長(zhǎng)寡核苷酸在接受體陣列上生成互補(bǔ)的全長(zhǎng)寡核苷酸。
模板和接受體表面可以是可生物相容的,如聚丙烯酰胺凝膠,修飾的聚丙烯酰胺凝膠,pdms,二氧化硅,硅,coc,金屬如金、鉻合金或鉻,或任何其他生物相容的表面。如果表面包含聚合物凝膠層,則厚度可影響其可變形性或柔性。凝膠層的可變形性或柔性可以使其對(duì)保持表面之間的接觸是有用的,即使存在表面粗糙度。在本文中進(jìn)一步討論了表面的細(xì)節(jié)。
試劑和其他化合物,包括酶、緩沖液和核苷酸,可以放置在表面上或包埋在相容的凝膠層中。該酶可以是聚合酶、核酸酶、磷酸酶、激酶、解旋酶、連接酶、重組酶、轉(zhuǎn)錄酶或逆轉(zhuǎn)錄酶。在一些情況下,在表面上或包埋在相容的凝膠層中的酶包括聚合酶。聚合酶可以包括但不限于poli、polii、poliii、klenow、t4dnapol、修飾的t7dnapol、突變的修飾的t7dnapol、tdt、bst、taq、tth、pfu、pow、vent、pab、phusion、pyrophage及其他聚合酶。在本文中進(jìn)一步討論了表面的細(xì)節(jié)。在一些情況下,在表面上或包埋在相容的凝膠層中的酶包括連接酶。連接酶可以包括但不限于大腸桿菌連接酶、t4連接酶、哺乳動(dòng)物連接酶(例如,dna連接酶i、dna連接酶ii、dna連接酶iii、dna連接酶iv)、熱穩(wěn)定連接酶以及快速連接酶。
圖12、圖13和圖14中示出了模板表面以及通過(guò)酶促延伸生成的轉(zhuǎn)移后的接受體表面。接受體陣列的表面可以是在模板陣列的頂部上形成的凝膠。圖15示出了在反應(yīng)混合物(例如,如本文概述的引物、酶、緩沖液)和模板的存在下,如本文所述的、從模板陣列表面向接受體表面(即,凝膠拷貝(具有模板))的酶促延伸反應(yīng)以及陰性對(duì)照的實(shí)例,在該陰性對(duì)照中,在存在反應(yīng)混合物(例如,如本文概述的引物、酶、緩沖液)但沒(méi)有模板核酸的情況下,模板陣列經(jīng)歷如本文所述的、向接受體表面(凝膠拷貝(沒(méi)有模板))的酶促延伸反應(yīng)。陰性對(duì)照(即,凝膠拷貝(無(wú)模板))中熒光的缺乏證明了在不存在模板核酸的情況下生成的產(chǎn)物的缺乏。圖16示出了來(lái)自另外的對(duì)照實(shí)驗(yàn)的結(jié)果,其中模板陣列表面(左側(cè))與接受體轉(zhuǎn)移表面在存在反應(yīng)混合物(即,引物、緩沖液)(右側(cè))但不存在酶的情況下接觸。圖16中的接受體陣列(右側(cè))上的熒光缺乏證明了轉(zhuǎn)移的缺乏。可以將反應(yīng)混合物放置在接受體陣列的表面上或包埋在接受體表面中。在一些情況下,將反應(yīng)混合物放置在接受體陣列的表面上。在一些情況下,將反應(yīng)混合物包埋在接受體表面中。該接受體表面可以是相容的凝膠層。該反應(yīng)混合物可以包含進(jìn)行通過(guò)合成的酶促轉(zhuǎn)移(ets)所必需的任何試劑。該試劑可以包含
模板陣列通過(guò)ets的酶促轉(zhuǎn)移可以如下進(jìn)行:1.)制備酶混合物(例如,37μlh2o,5μl10xthermopol緩沖液,5μl10mg/mlbsa,1μl10mmdntp以及2μl8u/μlbst酶);2.)將酶混合物施加到接受體陣列(例如,如本公開(kāi)內(nèi)容其他地方所述制備的、偶聯(lián)有寡核苷酸引物的丙烯酰胺凝膠涂覆的載玻片);3.)將模板陣列與接受體陣列面對(duì)面放置并使其反應(yīng)(例如,在55℃下在濕度室內(nèi)夾緊在一起持續(xù)2小時(shí));4.)將模板陣列與接受體陣列分開(kāi)(例如,通過(guò)施加4xssc緩沖液而松開(kāi)并在剃須刀片的輔助下拉開(kāi));5.)將模板陣列漂洗(例如,在去離子水中)并干燥(例如,用n2);以及6.)漂洗接受體陣列(例如,用4xssc緩沖液和2xssc緩沖液)。在一些情況下,模板陣列上的寡核苷酸包含銜接子,使得底部銜接子位于鄰近該模板陣列表面的位置,而頂部銜接子位于遠(yuǎn)離該模板陣列表面的位置。當(dāng)將該夾心結(jié)構(gòu)加熱至55℃時(shí),thermopolpcr緩沖液中的bst聚合酶可以延伸來(lái)自接受體陣列的、與該模板陣列的底部銜接子雜交的引物,這可以在模板與接受體陣列表面之間產(chǎn)生dsdna分子橋。一經(jīng)物理分離,第二表面(即,接受體陣列)可以含有互補(bǔ)ssdna條形碼陣列,其中寡核苷酸的5’端附接至該表面并且3’端可用于聚合酶延伸。由于模板陣列上的均勻分散的引物和接受體陣列上的條形碼寡核苷酸都可以栓系至其各自的表面,因此可以保持轉(zhuǎn)移的特征的相對(duì)位置(以鏡像形式)。為了實(shí)現(xiàn)密切接觸并因此在整個(gè)芯片區(qū)域上均勻轉(zhuǎn)移,可以使用寬范圍的表面材料(pdms、聚丙烯酰胺)、厚度和工藝條件。圖3示出了在大的(約150μm)陣列特征上如本文所述的面對(duì)面酶促轉(zhuǎn)移過(guò)程的實(shí)例。面對(duì)面轉(zhuǎn)移的效率可能導(dǎo)致每個(gè)拷貝的陣列特征內(nèi)的寡核苷酸密度降低。本領(lǐng)域技術(shù)人員可以理解,可以通過(guò)例如改變凝膠轉(zhuǎn)移條件,例如酶、過(guò)程溫度和時(shí)間、引物長(zhǎng)度或表面材料性質(zhì)的選擇來(lái)優(yōu)化轉(zhuǎn)移條件?;蛘撸梢允褂媒?jīng)由固相pcr(例如,橋式pcr)的轉(zhuǎn)移后表面擴(kuò)增來(lái)使條形碼密度增加至如本文所述的所需水平。
寡核苷酸固定化轉(zhuǎn)移(oit)
在一些情況下,通過(guò)非酶促轉(zhuǎn)移來(lái)進(jìn)行接受體陣列的生成。非酶促轉(zhuǎn)移的一種形式是寡核苷酸固定化轉(zhuǎn)移(oit)。在oit中,模板陣列上的模板核酸(例如,寡核苷酸)可以是單鏈的。包含與模板寡核苷酸的一部分互補(bǔ)的序列的引物可以與該模板寡核苷酸雜交并通過(guò)引物延伸而延伸,以便生成并可以在模板陣列上制備雙鏈模板寡核苷酸。用于引物延伸的引物可以在溶液中。許多聚合酶可以用于oit,包括poli、polii、poliii、klenow、t4dnapol、修飾的t7dnapol、突變的修飾的t7dnapol、tdt、bst、taq、tth、pfu、pow、vent、pab、phusion及其他。在一些情況下,用于引物延伸的引物包含連接體,該連接體用于固定或結(jié)合接受體陣列表面上通過(guò)引物延伸(見(jiàn)圖17)生成的雙鏈模板寡核苷酸的鏈。該接受體陣列表面可以是如本文提供的平坦表面、珠子或凝膠。在一些情況下,該接受體陣列表面是在oit期間形成的聚丙烯酰胺凝膠(如圖18中所示)。在一些情況下,在延伸后,該連接體可以結(jié)合至接受體陣列表面。該接受體陣列表面可以是如本文提供的任何陣列表面,如聚合物凝膠或修飾的玻璃表面。在oit中,隨后可以將該模板和接受體陣列表面分離??梢栽诜蛛x前使dna(即,雙鏈模板寡核苷酸)解鏈。
在一些情況下,oit中使用的引物是5’-acrydite修飾的引物。5’-acrydite修飾的引物可以能夠在如本文提供的聚合期間并入到聚合物凝膠(例如,聚丙烯酰胺)中。然后可以采用該acrydite引物生成來(lái)自模板核酸(例如,寡核苷酸)的延伸產(chǎn)物,使該延伸產(chǎn)物與經(jīng)結(jié)合處理(例如,未聚合的聚丙烯酰胺涂料前體)的基底接觸,在聚合期間并入,并分離(說(shuō)明見(jiàn)圖19)。該引物可以是5'-己炔基-聚t-dna。在一些情況下,通過(guò)互補(bǔ)的5'-己炔基-聚t-dna引物的結(jié)合和延伸生成來(lái)自模板核酸的引物延伸產(chǎn)物。在延伸后,可以將該5'-己炔基-聚t-dna引物:1.)與經(jīng)結(jié)合處理的基底(如采用硅烷處理的玻璃)接觸,2.)與交聯(lián)劑例如同雙功能連接體如1,4-亞苯基二異硫氰酸酯(pditc)連接,3.)使用peg連接體與n3結(jié)合基團(tuán)連接(例如,圖20),4.)在n3基團(tuán)處鍵合至基底(例如,圖21),以及5.)在oit的第二階段期間分離(圖18)。圖22和圖23示出了核酸的pditc-n3附接的實(shí)例。該表面可以是如本文討論的任何表面??梢源鎝ditc使用的其他交聯(lián)劑可以包括辛二亞氨酸二甲酯(dms)、二琥珀酰亞胺基碳酸酯(dsc)和/或二琥珀酰亞胺基草酸酯(dso)。該過(guò)程可以保留寡核苷酸的朝向,即,如果5’端結(jié)合至模板陣列表面,則合成的寡核苷酸的5’端將結(jié)合至接受體陣列表面,或者反之亦然。盡管可以在轉(zhuǎn)移之前使用酶促延伸,但轉(zhuǎn)移自身可以在沒(méi)有酶促反應(yīng)的情況下進(jìn)行。
圖23示出了熒光標(biāo)記的模板陣列的圖片,其中模板分子具有結(jié)構(gòu)5'cagaagacggcatacgagat_gactggagttcagacgtgtgctcttcc_gtgtagatctcggtggtcgccgta-3't*―(heg)2―(基底表面)。在成像前,使該陣列與在4xssc緩沖液中的500nmqcfc2-cy3在55℃下雜交60分鐘。圖24示出了同一模板陣列的區(qū)域的放大視圖。圖25示出了同一模板陣列以及非酶促轉(zhuǎn)移后的接受體轉(zhuǎn)移陣列。模板核酸與acr-fc1(例如,5’acrydite-ttttttttttaatgatacggcgaccaccgagauctacac)引物雜交并用bst聚合酶延伸,然后并入到接受體轉(zhuǎn)移陣列基底上的聚合物凝膠中并與模板陣列分離。該模板陣列的轉(zhuǎn)移后的信號(hào)沒(méi)有顯示明顯下降,而轉(zhuǎn)移陣列在10x曝光下顯示小信號(hào)。圖26示出了轉(zhuǎn)移前后模板陣列的并排比較。可以看出,模板陣列的轉(zhuǎn)移后的信號(hào)沒(méi)有明顯下降。圖27示出了非酶促轉(zhuǎn)移(oit)后的接受凝膠表面。在左側(cè),在凝膠表面上探測(cè)通過(guò)與模板雜交、延伸以及隨后固定化而獲得的所需鏈。另外,在右側(cè),模板鏈也在oit期間被轉(zhuǎn)移至接受凝膠表面,推測(cè)可能是通過(guò)從模板陣列上物理脫離。值得注意的是,模板鏈的物理轉(zhuǎn)移比延伸引物的固定化更強(qiáng)。圖28示出了凝膠圖像之間的曝光設(shè)置的比較,其中一個(gè)采用10x2s2bin而另一個(gè)采用10x0.5s1bin。
在一些情況下,可以在沒(méi)有酶促轉(zhuǎn)移的情況下生成具有5’至3’朝向的寡核苷酸陣列。例如,模板寡核苷酸陣列上的合成核酸序列的未結(jié)合端可以包含與在該寡核苷酸的陣列結(jié)合端處或該結(jié)合端附近的序列互補(bǔ)的連接體序列,從而使該寡核苷酸環(huán)化。該寡核苷酸可以進(jìn)一步在相同末端處包含限制性序列。環(huán)化的寡核苷酸上的限制性序列的消化起到翻轉(zhuǎn)含有連接體序列的全長(zhǎng)寡核苷酸并切斷該陣列上缺乏連接體序列的任何部分長(zhǎng)度的寡核苷酸產(chǎn)物的作用。可以使用許多限制酶及其相關(guān)的限制酶切位點(diǎn),包括但不限于ecori、ecorii、bamhi、hindiii、taqi、noti、hinfi、sau3ai、pvuii、smai、haeiii、hgai、alui、ecorv、ecop15i、kpni、psti、saci、sali、scai、spei、sphi、stui和xbai。
用于寡核苷酸陣列轉(zhuǎn)移方法的表面
用于如本文提供的轉(zhuǎn)移方法的表面(例如,模板表面和/或接受體表面)可以包含一系列可能的材料。在一些情況下,該表面包含在基底上的聚合物凝膠,如聚丙烯酰胺凝膠或pdms凝膠。在一些情況下,該表面包含沒(méi)有基底支持物的凝膠。在一些情況下,該表面包含在基底上的薄涂層,如聚合物的200nm以下的涂層。在一些情況下,該表面包含未涂覆的基底,如玻璃或硅。
該涂層和/或凝膠可以具有一定范圍的厚度或?qū)挾?。該凝膠或涂層可以具有約0.0001、0.00025、0.0005、0.001、0.005、0.01、0.025、0.05、0.1、0.2、0.5、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175或200mm的厚度或?qū)挾?。該凝膠或涂層可以具有小于0.0001、0.00025、0.0005、0.001、0.005、0.01、0.025、0.05、0.1、0.2、0.5、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175或200mm的厚度或?qū)挾?。該凝膠或涂層可以具有大于0.0001、0.00025、0.0005、0.001、0.005、0.01、0.025、0.05、0.1、0.2、0.5、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175或200mm的厚度或?qū)挾?。該凝膠或涂層可以具有至少0.0001、0.00025、0.0005、0.001、0.005、0.01、0.025、0.05、0.1、0.2、0.5、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175或200mm的厚度或?qū)挾取T撃z或涂層可以具有至多0.0001、0.00025、0.0005、0.001、0.005、0.01、0.025、0.05、0.1、0.2、0.5、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175或200mm的厚度或?qū)挾?。該凝膠或涂層可以具有0.0001至200mm、0.01至20mm、0.1至2mm或1至10mm的厚度或?qū)挾取T撃z或涂層可以具有約0.0001至約200mm、約0.01至約20mm、約0.1至約2mm或約1至約10mm的厚度或?qū)挾?。在一些情況下,該凝膠或涂層包含約10微米的寬度或厚度。
凝膠和涂層可以另外包含用于修飾其物理化學(xué)性質(zhì)例如疏水性的組分。例如,聚丙烯酰胺凝膠或涂層可以在其聚合物結(jié)構(gòu)中包含修飾的丙烯酰胺單體,如乙氧基化的丙烯酰胺單體、磷酰膽堿丙烯酰胺單體和/或甜菜堿丙烯酰胺單體。
凝膠和涂層可以另外包含標(biāo)志物或允許標(biāo)志物并入的反應(yīng)性位點(diǎn)。標(biāo)志物可以包括寡核苷酸。例如,可以在聚丙烯酰胺凝膠或涂層的聚合過(guò)程中添加5’-acrydite修飾的寡核苷酸。用于并入標(biāo)志物的反應(yīng)性位點(diǎn)可以包括溴乙?;稽c(diǎn)、疊氮基、與疊氮基-炔huisgen環(huán)加成相容的位點(diǎn)或其他反應(yīng)性位點(diǎn)??梢詫?biāo)志物以受控的方式并入到聚合物涂層中,其中特定的標(biāo)志物位于該聚合物涂層的特定區(qū)域??梢詫?biāo)志物隨機(jī)并入到聚合物涂層中,由此特定的標(biāo)志物可以隨機(jī)地分布在整個(gè)聚合物涂層中。
在一些情況下,具有凝膠涂層的表面可以如下制備:將載玻片清洗(例如,用nanostrip溶液)、漂洗(例如,用去離子水)并干燥(例如,用n2);將該載玻片表面用丙烯酰胺單體功能化;制備硅烷化溶液(例如,在乙醇和水中的5體積%(3-丙烯酰氨基丙基)三甲氧基硅烷);將該載玻片浸沒(méi)在硅烷化溶液中(例如,在室溫下5小時(shí)),漂洗(例如,用去離子水),并干燥(例如,用n2);制備12%丙烯酰胺凝膠混合物(例如,5mlh2o,1mg明膠,600mg丙烯酰胺,32mg雙丙烯酰胺);制備6%丙烯酰胺凝膠混合物(例如,50μl12%丙烯酰胺凝膠混合物,45μl去離子水,5μl5’-acrydite修飾的寡核苷酸引物(1mm),渦旋混合);使6%丙烯酰胺凝膠混合物活化(例如,每100μl凝膠混合物分別添加1.3μl的5%過(guò)硫酸銨和1.3μl的5%temed并渦旋);將凝膠混合物施加至表面(例如,硅烷化功能化的載玻片表面),使其均勻分布(例如,通過(guò)用蓋玻片按壓或通過(guò)旋涂),并使其聚合(例如,在室溫下20分鐘)。
寡核苷酸陣列擴(kuò)增和再生
在一些情況下,陣列(例如,模板和/或接受體)上每個(gè)特征中的陣列組分(例如,核酸、寡聚物)的數(shù)目可以通過(guò)一種被稱(chēng)為擴(kuò)增特征再生或afr的過(guò)程來(lái)擴(kuò)增或再生。如果模板陣列上的陣列組分已經(jīng)利用本文提供的陣列轉(zhuǎn)移方法(例如ets或oit)變得耗盡(例如,由于轉(zhuǎn)移過(guò)程中的損失),則對(duì)于該模板或接受體陣列,afr可能是期望的。如果接受體陣列上的陣列組分的數(shù)目較低(例如,由于從具有低密度或小數(shù)目的陣列組分的模板陣列轉(zhuǎn)移),則對(duì)于該接受體陣列,擴(kuò)增可能是期望的。例如,圖29示出了在酶促轉(zhuǎn)移中使用并隨后通過(guò)50-70次擴(kuò)增循環(huán)來(lái)擴(kuò)增的模板陣列。
可以通過(guò)在模板和/或接受體聚合物(例如,寡核苷酸)上使用銜接子序列來(lái)輔助擴(kuò)增(例如,通過(guò)afr)。除了一種或多種銜接子序列之外,該模板和/或接受體聚合物(例如,寡核苷酸)還可以包含所需的最終序列。例如,模板和/或接受體聚合物可以按順序包含具有第一銜接子序列的3’端、具有第二銜接子序列的5’端以及在中間的所需最終序列。第一和第二銜接子序列可以是相同的或可以是不同的。在一些情況下,在同一陣列斑點(diǎn)中的寡核苷酸包含相同的第一和第二銜接子序列以及最終序列,而在不同陣列斑點(diǎn)中的寡核苷酸包含相同的第一和第二銜接子序列以及不同的最終序列。在接受體陣列上的引物可以與銜接子序列互補(bǔ),這可以允許引物與模板聚合物(例如,寡核苷酸)之間的雜交。這樣的雜交可有助于陣列的擴(kuò)增或再生。偶聯(lián)至陣列的引物(例如,寡核苷酸)可以是一般的引物,例如,通用或隨機(jī)引物,或靶標(biāo)特異性引物。
陣列(例如,模板或接受體)組分的擴(kuò)增(例如,通過(guò)afr)可以酶促發(fā)生。例如,如果該陣列(例如,模板和/或接受體)組分包含寡核苷酸,則擴(kuò)增可以通過(guò)核酸擴(kuò)增反應(yīng)如聚合酶鏈反應(yīng)(pcr)、橋式擴(kuò)增、橋式pcr、等溫pcr、等溫橋式擴(kuò)增、等溫橋式pcr、連續(xù)流pcr、重組酶聚合擴(kuò)增(rpa)或其他反應(yīng)而發(fā)生。所用的酶可以包括多種酶,如poli、polii、poliii、klenow、t4dnapol、修飾的t7dnapol、突變的修飾的t7dnapol、tdt、bst、taq、tth、pfu、pow、vent、pab或其他聚合酶;解旋酶;重組酶;或其他酶。
陣列(例如,模板和/或接受體)上偶聯(lián)的聚合物(例如,核酸、寡核苷酸)的強(qiáng)度或密度可以通過(guò)擴(kuò)增來(lái)恢復(fù)。陣列(例如,模板和/或接受體)上偶聯(lián)的聚合物(例如,核酸、寡核苷酸)的強(qiáng)度或密度可以通過(guò)擴(kuò)增而增加至超過(guò)其初始值。陣列(例如,模板和/或接受體)斑點(diǎn)可以在擴(kuò)增期間擴(kuò)大。例如,在28次擴(kuò)增循環(huán)期間,橋式擴(kuò)增或橋式pcr可以導(dǎo)致核酸分子擴(kuò)大或移行50-100nm。
陣列表面可以包含障礙物,以防止陣列組分?jǐn)U增超出其單獨(dú)的特征邊界。障礙物可以包含物理邊界、反應(yīng)邊界或其他邊界??梢酝ㄟ^(guò)表面偶聯(lián)的特征(例如,核酸或其他聚合物)的激光消融來(lái)制備邊界??梢酝ㄟ^(guò)光激活的保護(hù)性基團(tuán)來(lái)制備邊界;例如,可以將光激活的保護(hù)性基團(tuán)與整個(gè)陣列上的核酸偶聯(lián),隨后可僅將所需的區(qū)域去保護(hù)。
在一些情況下,可以通過(guò)標(biāo)準(zhǔn)手段生成模板寡核苷酸陣列,并可以從該模板生成作為互補(bǔ)或接受體陣列的多個(gè)接受體轉(zhuǎn)移寡核苷酸陣列。接受體陣列可以采用本文提供的面對(duì)面轉(zhuǎn)移過(guò)程(例如,ets或oit)來(lái)生成。這可以導(dǎo)致制備成本降低。在一些情況下,可以從每個(gè)模板寡核苷酸陣列生成至少5、10、20、50、100、200、500、1,000、2,000、5,000、10,000、20,000、100,000、200,000、500,000個(gè)互補(bǔ)陣列或接受體陣列。例如,圖30示出了在如本文提供的面對(duì)面酶促凝膠轉(zhuǎn)移(即,ets)之后,在轉(zhuǎn)移前(左側(cè))和五次轉(zhuǎn)移后(右側(cè))的模板陣列的圖像。每個(gè)互補(bǔ)陣列可以產(chǎn)生與該模板陣列上的至少50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%的模板分子互補(bǔ)的寡核苷酸探針。
接受體轉(zhuǎn)移寡核苷酸陣列可以包含比通過(guò)標(biāo)準(zhǔn)手段制備的陣列更加酶促有利的環(huán)境,因此使得更寬范圍的反應(yīng)能夠在該陣列表面之上或附近進(jìn)行。例如,接受體轉(zhuǎn)移陣列可以包含聚合物凝膠或涂層如聚丙烯酰胺,其可能比未涂覆的表面如玻璃或硅更加有利于酶活性。
可以制備包含3’端朝上的寡核苷酸的接受體轉(zhuǎn)移寡核苷酸陣列。這可以為雜交提供降低的空間位阻。這還可以提供對(duì)包括合成測(cè)序或基因分型(例如,snp檢測(cè))在內(nèi)的進(jìn)一步延伸有用的構(gòu)型的寡核苷酸。
可以生成具有非常長(zhǎng)的寡核苷酸(例如,大于50個(gè)堿基對(duì))的接受體轉(zhuǎn)移寡核苷酸陣列。雖然非常長(zhǎng)的寡核苷酸的合成可能導(dǎo)致非常少的全長(zhǎng)寡核苷酸產(chǎn)物,但本公開(kāi)內(nèi)容中描述的組合物和方法可以生成主要包含或僅包含全長(zhǎng)寡核苷酸的接受體轉(zhuǎn)移陣列。
在一些情況下,本公開(kāi)內(nèi)容中描述的組合物和方法可以提供具有高分辨率、5’至3’朝向的限定(即,非隨機(jī))序列并在酶相容表面上的陣列。
對(duì)于酶促轉(zhuǎn)移方法,寡核苷酸的固定化可以減少陣列特征之間的交叉污染。此外,對(duì)于單鏈模板,可以消除轉(zhuǎn)移前制備互補(bǔ)鏈的需要。
陣列表面上核酸的位置測(cè)序
在使用如本文提供的方法合成(和/或轉(zhuǎn)移)寡核苷酸陣列或芯片后,可以如圖1和圖2中概述并在圖3中描繪的,使包含核酸(“靶多核苷酸”)的樣品拉伸并固定在寡核苷酸陣列的表面上。該包含核酸的樣品可以是如本文提供的任何樣品。該核酸可以是如本文提供的任何核酸。在一些情況下,該核酸是dna。在一些情況下,該dna是基因組dna。該基因組dna可以是染色體或染色體的片段??梢詫⒉捎帽疚奶峁┑姆椒ㄖ苽涞墓押塑账彡嚵杏糜诖_定多核苷酸或核酸分子如rna、dna、染色體及其片段的序列。這樣的多核苷酸在本文中被稱(chēng)為模板或靶多核苷酸。在一些情況下,使靶多核苷酸在采用本文提供的方法生成的寡核苷酸陣列上拉伸。該陣列上的寡核苷酸可以包含如本文所述的位置條形碼。該寡核苷酸陣列可以是模板或接受體陣列。在一些情況下,在使靶多核苷酸在寡核苷酸陣列(例如,模板或接受體陣列)上拉伸之前,對(duì)其進(jìn)行處理。
靶多核苷酸處理
在一些情況下,在使靶多核苷酸在如本文提供的寡核苷酸陣列上拉伸之前對(duì)其進(jìn)行處理包括從樣品中分離或提取靶多核苷酸。該樣品可以是如本文提供的任何樣品??梢圆捎帽绢I(lǐng)域已知的用于提取mb長(zhǎng)dna的任意方法,例如,zhang,m.等人,preparationofmegabase-sizeddnafromavarietyoforganismsusingthenucleimethodforadvancedgenomicsresearch.natureprotocols7,467-478,(2012)中描述的方法,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入本文。在一個(gè)實(shí)例中,可以使用bioradmammaliangenomicdnaplug試劑盒。簡(jiǎn)言之,洗滌柱塞(plug),將瓊脂糖熔融并隨后用β-瓊脂糖酶消化。一旦分離,可以如下所述進(jìn)一步處理待用于本文提供的方法的靶多核苷酸。
在一些情況下,進(jìn)一步處理從樣品中分離的靶多核苷酸,使得引物(例如,寡核苷酸)結(jié)合位點(diǎn)添加至該靶多核苷酸。例如,如圖31和圖32所示,可以將通用引物結(jié)合位點(diǎn)并入到模板核酸分子3102、3202中。引物結(jié)合位點(diǎn)為可以包含與引物中的限定序列互補(bǔ)的序列的核酸區(qū)域。包含限定序列的引物可以是與如本文提供的模板或接受體陣列結(jié)合的寡核苷酸。該限定序列可以是銜接子序列。該限定序列可以是通用序列。模板核酸中的引物結(jié)合位點(diǎn)可用于使包含該引物結(jié)合位點(diǎn)的模板核酸與包含與該引物結(jié)合位點(diǎn)互補(bǔ)的序列的引物偶聯(lián)或結(jié)合。結(jié)合陣列的引物的限定序列(例如,銜接子或通用的)可以能夠與包含互補(bǔ)引物結(jié)合位點(diǎn)的模板核酸直接偶聯(lián),諸如通過(guò)與模板核酸內(nèi)的引物結(jié)合位點(diǎn)序列雜交。結(jié)合陣列的引物的限定序列(例如,銜接子或通用的)可以能夠與模板核酸間接偶聯(lián),諸如通過(guò)與互補(bǔ)于游離引物中的限定序列的引物結(jié)合位點(diǎn)序列雜交,同時(shí)該游離引物可以能夠與模板核酸雜交。在一些情況下,引物以確定的間隔雜交。在其他情況下,引物以隨機(jī)的間隔雜交。引物(例如,與陣列結(jié)合的或非陣列結(jié)合的)優(yōu)選以沿著靶多核苷酸至少50、100、200、300、400、500、1,000、1,200、1,400、1,600、1,800或2,000個(gè)堿基對(duì)的間隔與該靶多核苷酸雜交。引物(例如,與陣列結(jié)合的或非陣列結(jié)合的)可以與靶多核苷酸上的隨機(jī)序列雜交,或與采用本文提供的方法引入的、靶多核苷酸上的引物結(jié)合位點(diǎn)雜交。引物結(jié)合位點(diǎn)可以包含至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個(gè)堿基。引物結(jié)合位點(diǎn)可以包含至多5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個(gè)堿基。
在一些情況下,采用切口酶將引物(例如,寡核苷酸)結(jié)合位點(diǎn)添加至靶多核苷酸,隨后連接該引物(例如,寡核苷酸)結(jié)合位點(diǎn)。該方法可以包括采用nt.cvipii或僅在ccd位點(diǎn)處切割一條鏈的任何其他合適的切口酶對(duì)靶多核苷酸(例如,長(zhǎng)dna分子)進(jìn)行酶切。在靶多核苷酸上產(chǎn)生切口后,可以用磷酸酶(例如,nextshrimp堿性磷酸酶(rsap))處理該靶多核苷酸的切口端,以去除5’磷酸并防止靶多核苷酸的切口端的連接。在一些情況下,靶多核苷酸的切口產(chǎn)生和5’磷酸的去除在單個(gè)反應(yīng)中進(jìn)行。例如,用nt.cvipii和rsap處理靶多核苷酸可以在單個(gè)反應(yīng)緩沖液(即,nebuffer2.1,newenglandbiolabs)中進(jìn)行。隨后,可以對(duì)該酶進(jìn)行熱滅活,隨后將引物結(jié)合位點(diǎn)與該切口內(nèi)的靶多核苷酸的3’端連接。最后,可以將附有引物結(jié)合位點(diǎn)的經(jīng)處理的靶多核苷酸在0.5mph5.5緩沖液中稀釋并將其倒入拉伸儲(chǔ)器中,以準(zhǔn)備用于在采用本文提供的方法制備的寡核苷酸陣列上進(jìn)行梳理(拉伸)。
在一些情況下,例如,如圖1,102中概述和圖31中示出的,可以通過(guò)轉(zhuǎn)座子插入將通用引物結(jié)合位點(diǎn)并入到靶多核苷酸(也被稱(chēng)為模板核酸分子)中。優(yōu)選地,沿著靶多核苷酸的長(zhǎng)度平均每隔至少50、100、200、300、400、500、1,000、1,200、1,400、1,600、1,800或2,000個(gè)堿基對(duì)插入這樣的引物結(jié)合位點(diǎn)??梢砸圆煌拈g隔將轉(zhuǎn)座子整合到靶多核苷酸如dna中??梢砸云骄s100、200、500、1000、1500或2000個(gè)堿基對(duì)插入轉(zhuǎn)座子。圖31示出了引物結(jié)合位點(diǎn)3101通過(guò)轉(zhuǎn)座子插入添加至靶多核苷酸3100。該引物結(jié)合位點(diǎn)可以包含限定序列。該限定序列可以是通用序列、銜接子序列和/或條形碼序列。該引物結(jié)合位點(diǎn)可以包含通用序列、銜接子序列和/或條形碼序列。用于轉(zhuǎn)座子的整合的方法在例如美國(guó)專(zhuān)利申請(qǐng)公開(kāi)號(hào)us2012/0208724a1中進(jìn)行了描述,該專(zhuān)利申請(qǐng)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入本文。
在一些情況下,例如如圖2,202中概述的,可以通過(guò)與非基底或陣列結(jié)合的引物雜交,將通用引物結(jié)合位點(diǎn)并入至靶多核苷酸中。該非基底結(jié)合的引物可以被稱(chēng)為游離引物。該非基底結(jié)合的引物可以在溶液中。例如,如圖32所示,可以使模板核酸(靶多核苷酸)3200與包含與模板核酸分子3200雜交的隨機(jī)序列3201(例如,隨機(jī)五聚體、隨機(jī)六聚物或隨機(jī)九聚體(nonomer))以及不與該模板核酸分子3200雜交的引物結(jié)合位點(diǎn)序列3202的游離引物接觸。如本文所述,該引物結(jié)合位點(diǎn)可以包含限定序列。該限定序列可以是通用序列、銜接子序列和/或條形碼序列。該引物結(jié)合位點(diǎn)可以包含通用序列、銜接子序列和/或條形碼序列。用于將引物結(jié)合位點(diǎn)引入到如本文提供的靶多核苷酸中的游離引物中的隨機(jī)序列的長(zhǎng)度可以為至少5、6、7、8、9、10、11、12、13、14或15個(gè)堿基對(duì)。在一些情況下,該隨機(jī)序列的長(zhǎng)度可以為至多5、6、7、8、9、10、11、12、13、14或15個(gè)堿基對(duì)。在一些情況下,該隨機(jī)序列的長(zhǎng)度可以為5、6、7、8、9、10、11、12、13、14或15個(gè)堿基對(duì)。在一些情況下,該隨機(jī)序列的長(zhǎng)度可以為大于5、6、7、8、9、10、11、12、13、14或15個(gè)堿基對(duì)。在一些情況下,該隨機(jī)序列的長(zhǎng)度可以為小于5、6、7、8、9、10、11、12、13、14或15個(gè)堿基對(duì)。與陣列結(jié)合的引物可以包含與游離引物的引物結(jié)合位點(diǎn)序列互補(bǔ)并可以通過(guò)互補(bǔ)序列之間的結(jié)合與該游離引物的引物結(jié)合位點(diǎn)序列雜交的限定序列(例如,銜接子序列、通用序列和/或條形碼序列),由此間接地將模板核酸偶聯(lián)至寡核苷酸陣列(模板或接受體陣列)。這種的實(shí)例在圖36中示出并且在本文中進(jìn)行了描述。可以采用本文所提供的任何方法生成寡核苷酸陣列。
在一些情況下,可以在靶多核苷酸上產(chǎn)生切口,并且可以通過(guò)引物延伸將生物素化的核苷酸添加至所得的核酸片段,由此產(chǎn)生在一端處或一端附近具有生物素的核酸片段?;蛘?,使用生物素標(biāo)記的隨機(jī)引物(例如,隨機(jī)六聚體或隨機(jī)九聚體(nonomer))進(jìn)行與靶多核苷酸的延伸,由此產(chǎn)生在一端處或一端附近具有生物素的核酸延伸產(chǎn)物。在任何情況下,可以通過(guò)合適的酶進(jìn)行引物延伸,該酶包括聚合酶如poli、polii、poliii、klenow、t4dnapol、修飾的t7dnapol、突變的修飾的t7dnapol、tdt、bst、taq、tth、pfu、pow、vent、pab、phusion和phi-29。例如,可以采用bst聚合酶,通過(guò)將靶多核苷酸和引物與bst聚合酶和dntp一起在65℃下在1x等溫?cái)U(kuò)增緩沖液(例如,20mmtris-hcl,10mm(nh4)2so4,50mmkcl,2mmmgso4和0.1%吐溫20)中溫育來(lái)進(jìn)行反應(yīng)。然后,可以將包含生物素的dna分子如dna片段或如上所述制備的dna延伸產(chǎn)物與其模板dna分子一起在拉伸基底上拉伸。
在一些情況下,可以在靶多核苷酸上產(chǎn)生切口,并將可逆終止核苷酸添加至所得dna片段的3’端以防止或減少連接。在一些情況下,使用隨機(jī)引物(例如,隨機(jī)六聚體或隨機(jī)九聚體(nonomer))在具有靶多核苷酸模板的核苷酸的存在下進(jìn)行延伸,由此產(chǎn)生dna延伸產(chǎn)物。如本文所述,隨機(jī)引物可以在一端處或一端附近用生物素標(biāo)記,使得延伸產(chǎn)生在一端處或一端附近具有生物素的dna延伸產(chǎn)物。用于延伸的核苷酸可以是混合有小百分比的終止子核苷酸的天然核苷酸,由此產(chǎn)生在所得dna延伸產(chǎn)物的3’端處具有終止核苷酸的一些延伸產(chǎn)物。這樣的dna延伸產(chǎn)物可能不大可能被連接。可以通過(guò)合適的酶進(jìn)行引物延伸,該酶包括聚合酶如poli、polii、poliii、klenow、t4dnapol、修飾的t7dnapol、突變的修飾的t7dnapol、tdt、bst、taq、tth、pfu、pow、vent、pab和phi-29。例如,可以采用bst聚合酶,通過(guò)將靶多核苷酸和引物與bst聚合酶和dntp一起在65℃下在1x等溫?cái)U(kuò)增緩沖液(例如,20mmtris-hcl,10mm(nh4)2so4,50mmkcl,2mmmgso4和0.1%吐溫20)中溫育來(lái)進(jìn)行反應(yīng)。dntp可以具有小百分比的終止子核苷酸。然后,可以將dna分子如dna片段或如上所述制備的dna延伸產(chǎn)物與其靶多核苷酸一起在拉伸基底上拉伸。
靶多核苷酸拉伸
在一些情況下,使供本文提供的方法使用的靶多核苷酸拉伸。該靶多核苷酸可以是dna??梢酝ㄟ^(guò)多種方法進(jìn)行拉伸,該方法包括但不限于分子梳理、轉(zhuǎn)移打印、分子穿線、納米通道、電力、磁力、光力和流體動(dòng)力??梢酝ㄟ^(guò)方法的組合來(lái)進(jìn)行拉伸。例如,分子梳理和納米通道的使用。dna拉伸可以是這樣的過(guò)程,通過(guò)該過(guò)程,溶液中的dna(“游離dna”)可以被放置在儲(chǔ)器中,并且可以將疏水涂覆的載玻片浸入到dna溶液中并收回。雖然該過(guò)程的物理學(xué)可能尚未被完全理解,但dna末端可以通過(guò)疏水相互作用與載玻片的表面相互作用,并且收回載玻片的過(guò)程可以產(chǎn)生后退彎月面,該彎月面可以用于以線性方式拉動(dòng)dna橫跨表面(在表面上拉伸的標(biāo)記的dna的實(shí)例參見(jiàn)圖31和圖34)。dna拉伸可以是高度平行的過(guò)程,其可以產(chǎn)生在表面或基底上拉伸的高密度堆積的dna分子。本領(lǐng)域技術(shù)人員可以理解,dna拉伸可以在多種表面上進(jìn)行,并且用于在特定表面上拉伸的具體條件可以采用本領(lǐng)域已知的方法進(jìn)行優(yōu)化。該多種表面或基底可以是玻璃、硅和/或聚合物或聚合物涂覆的表面。拉伸基底可以包含特征,如微通道、納米通道、微柱(micropost)或納米柱(nanopost)。該拉伸基底可以與引物陣列相同或可以是單獨(dú)的基底。dna分子的大小可以在數(shù)百kb到超過(guò)1mb的范圍內(nèi)。幾kb至百萬(wàn)堿基長(zhǎng)度的完整靶多核苷酸(例如,dna分子)通過(guò)拉伸的固定可以提供在基因組的復(fù)雜重復(fù)區(qū)中分辨序列的能力,并且可以進(jìn)一步降低與wgs有關(guān)的測(cè)序成本。拉伸可以為與模板核酸分子的雜交提供改善的可及性。拉伸可以增加模板核酸分子的線性。使核酸拉伸可增加核酸區(qū)域之間的分辨率或距離。拉伸可以將dna的長(zhǎng)度增加至dna的結(jié)晶學(xué)長(zhǎng)度的1.5倍。一旦靶多核苷酸(例如,dna)已拉伸并結(jié)合至固體表面,則可以探測(cè)該靶多核苷酸以形成用于組裝如本文所述的短ngs讀取的支架。例如,如圖1和圖2中所示,為了準(zhǔn)備用條形碼進(jìn)行的位置標(biāo)記和隨后的應(yīng)用(例如,ngs),可以使如本文提供的處理的靶多核苷酸(也被稱(chēng)為模板核酸)拉伸或伸長(zhǎng)(103、203)。該模板核酸可以在寡核苷酸陣列(例如,模板或接受體寡核苷酸陣列)上拉伸。
雖然拉伸可以在溶液中或基底上發(fā)生,但拉伸的靶多核苷酸可以最終置于基底上或可以以伸長(zhǎng)的方式定位在基底上。例如,圖33示出了包含簇陣列斑點(diǎn)3301的陣列基底3300上的拉伸的核酸分子3302。在另一個(gè)實(shí)例中,圖34示出了包含陣列斑點(diǎn)3401的二維陣列的陣列基底3400上的拉伸的核酸分子3402。該陣列基底可以是如本文所述的模板和/或接受體寡核苷酸陣列。
拉伸基底可以包含表面涂層或功能化。該表面涂層或功能化可以是疏水或親水的。該拉伸基底可以是具有基于聚(馬來(lái)酸酐)的梳狀共聚物的胺衍生化的載玻片。該表面涂層可以包含聚合物涂層,如聚丙烯酰胺。該表面涂層可以包含凝膠,如聚丙烯酰胺凝膠。該表面涂層可以包含金屬,如圖案化的電極或電路。該表面涂層或功能化可以包含結(jié)合劑,如鏈霉親和素、親和素、抗體、抗體片段或適體。該表面涂層或功能化可以包含用于例如將拉伸核酸的片段伸長(zhǎng)的引物。該表面涂層或功能化可以包含多種要素,例如聚合物或凝膠涂層和結(jié)合劑,或聚合物凝膠涂層以及引物。拉伸基底可以包含引物陣列。引物陣列在本公開(kāi)內(nèi)容的其他地方進(jìn)一步討論。
在一些情況下,使靶多核苷酸經(jīng)歷分子梳理(也被稱(chēng)為dna梳理或染色體梳理)。分子梳理法可以是如gueroui,z.,place,c.,freyssingeas,e.&berge,b.observationbyfluorescencemicroscopyoftranscriptiononsinglecombeddna.proceedingsofthenationalacademyofsciencesoftheunitedstatesofamerica99,6005-6010,(2002),或bensimon,a等人,alignmentandsensitivedetectionofdnabyamovinginterface.science265,2096-2098,(1994),或michalet,x.等人,dynamicmolecularcombing:stretchingthewholehumangenomeforhigh-resolutionstudies.science277,1518-1523,(1997),或allemand等人,1997,biophysicaljournal73:2064-2070中描述的一種,上述每篇文獻(xiàn)的公開(kāi)內(nèi)容均通過(guò)引用以其全文并入本文??梢允购怂?例如,dna)鏈末端與基底鍵合,例如與基底(例如,硅烷化的玻璃板)上的可離子化基團(tuán)鍵合。核酸(例如,dna分子)與基底的鍵合可以在特定ph,如低于可離子化基團(tuán)的pka的ph下完成??梢酝ㄟ^(guò)使溶液的后退彎月面在整個(gè)基底上移動(dòng)來(lái)梳理和拉伸溶液中的核酸分子(例如,dna分子)。可以通過(guò)相對(duì)于拴系的分子末端拉動(dòng)的后退彎月面來(lái)使核酸(例如,dna)拉伸。拉伸的程度可能與核酸(例如,dna)的長(zhǎng)度無(wú)關(guān)。在一些情況下,拉伸的核酸(例如,dna)每1μm包含約2kb。
在一些情況下,如本文提供的靶多核苷酸的拉伸通過(guò)轉(zhuǎn)移打印來(lái)實(shí)現(xiàn)。轉(zhuǎn)移打印法可以是如zhang等人,2005,langmuir21:4180-4184中描述的方法,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入于此??梢酝ㄟ^(guò)采用分子梳理的拉伸,在印章(stamp)如pdms印章上制備和比對(duì)拉伸的核酸。可以通過(guò)例如以氨基為末端的表面修飾將印章上拉伸的核酸錨定或鍵合至表面??梢允褂媒佑|或轉(zhuǎn)移打印將比對(duì)的核酸從印章轉(zhuǎn)移至表面。在一些情況下,彎月面速度可以影響表面上的核酸密度。
在一些情況下,如本文提供的靶多核苷酸的拉伸通過(guò)分子穿線來(lái)實(shí)現(xiàn)。分子穿線法可以是如payne等人,2013,plosone8:e69058中描述的方法,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入于此。可以將溶液中核酸分子(例如,dna分子)的小滴定位于表面附近??梢允褂锰结樔鏿mma處理的玻璃針抓取溶液中的單個(gè)核酸分子(例如,dna分子)。然后可以將探針從溶液中拉出,使關(guān)聯(lián)的核酸分子(例如,dna分子)拉伸。然后可以使拉伸的核酸分子(例如,dna分子)沉積在表面上。在一些情況下,可以將拉伸的核酸分子(例如,dna分子)相隔小于或等于約100nm放置。
在一些情況下,如本文提供的靶多核苷酸的拉伸通過(guò)使用納米通道進(jìn)行。通過(guò)使用納米通道進(jìn)行的拉伸可以如reisner等人,2012,rep.prog.phys.,75(10):106601或美國(guó)專(zhuān)利號(hào)7,670,770中所述,這些文獻(xiàn)的公開(kāi)內(nèi)容分別通過(guò)引用以其全文并入于此。納米通道的寬度、高度、直徑或流體動(dòng)力學(xué)半徑可以為約200、190、180、170、160、150、140、130、120、110、100、90、80、70、60、50、40、30、20或10nm。納米通道可以在包括聚合物、玻璃和硅在內(nèi)的材料中形成。由于自回避作用,核酸分子(例如,dna分子)在被限制在納米通道中時(shí),可以拉伸開(kāi)。核酸(例如,dna)在納米通道中的延伸或拉伸可能依賴(lài)于核酸(例如,dna)溶液的離子強(qiáng)度。
在一些情況下,如本文提供的靶多核苷酸的拉伸通過(guò)使用納米結(jié)構(gòu)來(lái)進(jìn)行。通過(guò)使用納米結(jié)構(gòu)進(jìn)行的拉伸可以如美國(guó)專(zhuān)利號(hào)re42315中所述,該專(zhuān)利的公開(kāi)內(nèi)容通過(guò)引用以其全文并入于此?;咨系募{米結(jié)構(gòu)可以包括納米槽,并且該基底可以具有懸浮在其上的脂雙層。核酸分子(例如,dna分子)可以被驅(qū)使通過(guò)該膜進(jìn)入槽中并拉伸。
在一些情況下,如本文提供的靶多核苷酸的拉伸通過(guò)磁力(如磁性鑷子)進(jìn)行。磁力法可以是如haber和wirtz,2000,rev.sci.instrum.71:4561中描述的方法,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入于此??梢詫⒑怂岱肿?例如,dna分子)連接至磁性顆粒或珠子,隨后可以通過(guò)施加的磁場(chǎng)對(duì)其進(jìn)行操縱。例如,當(dāng)核酸分子的一端連接至磁性顆粒并且該分子的另一端連接或栓系至基底時(shí),可以使用施加的磁力來(lái)使該核酸分子(例如,dna分子)拉伸。
在一些情況下,如本文提供的靶多核苷酸的拉伸通過(guò)光力(如光學(xué)鑷子)進(jìn)行。光力法可以是如wang等人,1997,biophysicaljournal,72(3):1335-1346中描述的方法,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入于此。可以將核酸分子(例如,dna分子)連接至顆?;蛑樽?,隨后可以通過(guò)光學(xué)陷阱對(duì)其進(jìn)行操縱。例如,當(dāng)核酸分子的一端連接至捕獲的顆粒并且該分子的另一端連接或栓系至基底時(shí),可以使用光阱力使該核酸分子(例如,dna分子)拉伸。
在一些情況下,如本文提供的靶多核苷酸的拉伸通過(guò)電場(chǎng)進(jìn)行。電場(chǎng)法可以是如ferree和blanch,2003,biophysicaljournal,85(4):2539-2546中描述的方法,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入于此??梢岳缤ㄟ^(guò)生物素-鏈霉親和素結(jié)合或其他方法將核酸分子(例如,dna分子)栓系至基底。然后可以用施加的電場(chǎng)產(chǎn)生使分子拉伸的力。
在一些情況下,如本文提供的靶多核苷酸的拉伸通過(guò)流體動(dòng)力進(jìn)行。流體動(dòng)力法可以是如kim等人,2007,naturemethods,4:397-399中描述的方法,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入于此??梢岳缤ㄟ^(guò)生物素-鏈霉親和素結(jié)合或其他方法將靶多核苷酸栓系至基底。圍繞靶多核苷酸的流體流動(dòng)可以提供使分子拉伸的力。
在一些情況下,靶多核苷酸可以在拉伸基底上拉伸并隨后與引物陣列(例如,模板和/或接受體寡核苷酸陣列)接觸?;蛘?,靶多核苷酸可以直接在引物陣列(例如,模板和/或接受體寡核苷酸陣列)上拉伸。
在一些情況下,使用分子梳理使靶多核苷酸在如本文提供的寡核苷酸陣列(例如,模板和/或接受體寡核苷酸陣列)上拉伸。該靶多核苷酸可以是來(lái)自如本文提供的任意模板核酸來(lái)源的任意模板核酸??赡艽嬖诙鄠€(gè)影響dna與陣列結(jié)合的變量。兩個(gè)關(guān)鍵變量可能是載玻片表面特性和緩沖液的化學(xué)組成。本領(lǐng)域技術(shù)人員將理解,改變不同的參數(shù)如表面性質(zhì)以優(yōu)化寡核苷酸芯片或陣列上的分子梳理可能是期望的。在一些情況下,將乙烯基功能化的載玻片用于分子梳理。表面特性可以是如allemand,j.f.,bensimon,d.,jullien,l.,bensimon,a.&croquette,v.ph-dependentspecificbindingandcombingofdna.biophysj73,2064-2070,(1997)中描述的影響dna梳理的因素,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入本文。在一些情況下,靶多核苷酸的分子梳理在氨基-硅烷和乙烯基-硅烷涂覆的載玻片上進(jìn)行。在一些情況下,模板寡核苷酸陣列向如本文所述的接受體陣列的面對(duì)面酶促凝膠轉(zhuǎn)移在已經(jīng)用乙烯基-硅烷或氨基-硅烷處理的功能化的pdms上進(jìn)行。在一些情況下,模板寡核苷酸陣列向如本文所述的接受體陣列的面對(duì)面酶促凝膠轉(zhuǎn)移在已經(jīng)用乙烯基-硅烷或氨基-硅烷處理的功能化的丙烯酰胺表面上進(jìn)行??梢圆捎萌鐂eiffert,s.&oppermann,w.amine-functionalizedpolyacrylamideforlabelingandcrosslinkingpurposes.macromolecularchemistryandphysics208,1744-1752,(2007)中描述的各種修飾的單體對(duì)丙烯酰胺進(jìn)行功能化,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用以其全文并入本文。
此外,本領(lǐng)域技術(shù)人員將理解,針對(duì)如本文提供的分子梳理來(lái)優(yōu)化表面處理并由此允許酶接近靶多核苷酸可能是期望的。在一些情況下,靶多核苷酸的拉伸常數(shù)在表面上降低,以便獲得更高的聚合酶效率。該表面可以是已經(jīng)用乙烯基-硅烷或氨基-硅烷處理的功能化的pdms。該表面可以是已經(jīng)用乙烯基-硅烷或氨基-硅烷處理的功能化的丙烯酰胺表面。
固定
本公開(kāi)內(nèi)容提供了用于將核酸固定在基底上的方法和組合物。任選地,可以使用固定來(lái)幫助從模板核酸(“靶多核苷酸”)分離延伸或擴(kuò)增產(chǎn)物。在一些情況下,將靶多核苷酸固定至固定基底上。
許多不同的材料適合用作固定基底。該固定基底可以包含玻璃、硅、聚合物(例如,聚丙烯酰胺、pmma)或金屬。該固定基底可以包含物理特征,如微通道或納米通道。
固定基底可以包含表面涂層或功能化。該表面涂層或功能化可以是疏水或親水的。該表面涂層可以包含聚合物涂層,如聚丙烯酰胺。該表面涂層可以包含凝膠,如聚丙烯酰胺凝膠。該表面涂層可以包含金屬,如圖案化的電極或電路。該表面涂層或功能化可以包含結(jié)合劑,如鏈霉親和素、親和素、抗體、抗體片段或適體。該表面涂層或功能化可以包含多種要素,例如聚合物或凝膠涂層以及結(jié)合劑。
在一些情況下,可以在靶多核苷酸上產(chǎn)生切口,并且可以通過(guò)引物延伸將生物素化的核苷酸添加至所得的核酸片段,由此產(chǎn)生在一端處或一端附近具有生物素的核酸片段。或者,使用生物素標(biāo)記的隨機(jī)引物(例如,隨機(jī)六聚體或隨機(jī)九聚體(nonomer))進(jìn)行與核酸分子模板的延伸,由此產(chǎn)生在一端處或一端附近具有生物素的核酸延伸產(chǎn)物。在任何情況下,可以通過(guò)合適的酶進(jìn)行引物延伸,該酶包括聚合酶如poli、polii、poliii、klenow、t4dnapol、修飾的t7dnapol、突變的修飾的t7dnapol、tdt、bst、taq、tth、pfu、pow、vent、pab和phi-29。例如,可以采用bst聚合酶,通過(guò)將模板核酸和引物與bst聚合酶和dntp一起在65℃下在1x等溫?cái)U(kuò)增緩沖液(例如,20mmtris-hcl,10mm(nh4)2so4,50mmkcl,2mmmgso4和0.1%吐溫20)中溫育來(lái)進(jìn)行反應(yīng)。在一些情況下,靶多核苷酸是包含生物素的dna分子。然后,可以將包含生物素的dna分子如dna片段或如上所述制備的dna延伸產(chǎn)物與其模板dna分子一起在拉伸基底上拉伸。然后,可以使拉伸基底上的dna與固定基底接觸。該固定基底可以包含結(jié)合劑,如親和素或鏈霉親和素。該生物素可以用于通過(guò)親和素或鏈霉親和素結(jié)合將dna分子結(jié)合至固定基底。可以通過(guò)使用熱或其他變性方法將拉伸基底與固定基底分離。然后可以使固定基底與包含如本公開(kāi)內(nèi)容中描述的位置編碼的引物(寡核苷酸)的引物基底(例如,如本文提供的寡核苷酸陣列)接觸??梢詫⒁镞B接至固定基底上的dna片段或dna延伸產(chǎn)物,以用條形碼編碼位置信息,或者添加對(duì)測(cè)序文庫(kù)構(gòu)建有用的銜接子。
在一些情況下,可以在dna分子上產(chǎn)生切口,并將可逆終止核苷酸添加至所得dna片段的3’端以防止或減少連接。在一些情況下,使用隨機(jī)引物(例如,隨機(jī)六聚體或隨機(jī)九聚體(nonomer))在具有靶多核苷酸模板的核苷酸的存在下進(jìn)行延伸,由此產(chǎn)生dna延伸產(chǎn)物。如本文所述,隨機(jī)引物可以在一端處或一端附近用生物素標(biāo)記,使得延伸產(chǎn)生在一端處或一端附近具有生物素的dna延伸產(chǎn)物。用于延伸的核苷酸可以是混合有小百分比的終止子核苷酸的天然核苷酸,由此產(chǎn)生在所得dna延伸產(chǎn)物的3’端處具有終止核苷酸的一些延伸產(chǎn)物。這樣的dna延伸產(chǎn)物可能不大可能被連接??梢酝ㄟ^(guò)合適的酶進(jìn)行引物延伸,該酶包括聚合酶如poli、polii、poliii、klenow、t4dnapol、修飾的t7dnapol、突變的修飾的t7dnapol、tdt、bst、taq、tth、pfu、pow、vent、pab和phi-29。例如,可以采用bst聚合酶,通過(guò)將模板核酸和引物與bst聚合酶和dntp一起在65℃下在1x等溫?cái)U(kuò)增緩沖液(例如,20mmtris-hcl,10mm(nh4)2so4,50mmkcl,2mmmgso4和0.1%吐溫20)中溫育來(lái)進(jìn)行反應(yīng)。dntp可以具有小百分比的終止子核苷酸。然后,可以將dna分子如dna片段或如上所述制備的dna延伸產(chǎn)物與其模板dna分子一起在拉伸基底上拉伸。然后,可以使拉伸基底上的dna與固定基底接觸。該固定基底可以包含結(jié)合劑,如親和素或鏈霉親和素。該生物素可以用于通過(guò)親和素或鏈霉親和素結(jié)合將dna分子結(jié)合至固定基底。可以通過(guò)使用熱或其他變性方法將拉伸基底與固定基底分離。然后可以使固定基底與包含如本公開(kāi)內(nèi)容中描述的位置編碼的引物的引物基底接觸。可以將引物連接至固定基底上的dna片段或dna延伸產(chǎn)物,以用條形碼編碼位置信息,或者添加對(duì)測(cè)序文庫(kù)構(gòu)建有用的銜接子。
延伸反應(yīng)
一旦如本文提供的將靶多核苷酸得到分離并處理,則可以從該靶多核苷酸生成位置條形碼化的延伸產(chǎn)物。在一些情況下,如圖1和圖2所概述的,使如本文提供的經(jīng)處理的靶多核苷酸在拉伸基底上拉伸并在經(jīng)歷引物延伸反應(yīng)之前與引物陣列(例如,模板和/或接受體寡核苷酸陣列)上的引物接觸。
如圖35所示,可以使包含凝膠表面涂層3502的引物基底3500與包含拉伸的靶多核苷酸的拉伸基底3501接觸。或者,可以使靶多核苷酸拉伸,固定在固定基底上,并與引物陣列(例如,模板和/或接受體寡核苷酸陣列)上的引物接觸?;蛘?,可以直接使靶多核苷酸在引物陣列(例如,模板和/或接受體寡核苷酸陣列)基底上拉伸。引物陣列(例如,模板和/或接受體寡核苷酸陣列)上的引物可以與采用本文提供的方法引入到靶多核苷酸中的引物結(jié)合位點(diǎn)雜交。
可以進(jìn)行延伸反應(yīng)以采用靶多核苷酸的區(qū)段作為模板延伸與靶多核苷酸雜交的引物。該靶多核苷酸可以是拉伸的靶多核苷酸。與該靶多核苷酸(例如,拉伸的多核苷酸)雜交的引物可以是非基底結(jié)合的(例如,游離于溶液中的)或基底結(jié)合的。在一些情況下,如圖1和圖2概述的,采用與引物陣列(例如,模板和/或接受體寡核苷酸陣列)結(jié)合的引物進(jìn)行延伸反應(yīng),以生成包含與靶多核苷酸的區(qū)段互補(bǔ)的序列的位置編碼的延伸產(chǎn)物(106、206)。所得延伸產(chǎn)物可以保持與該引物陣列(例如,模板和/或接受體寡核苷酸陣列)結(jié)合。所得延伸產(chǎn)物可以包含pcr引物位點(diǎn),條形碼序列,和存在于原始的與陣列結(jié)合的引物中的銜接子序列,以及與靶多核苷酸的區(qū)段互補(bǔ)的序列。
在一些情況下,引物陣列(例如,模板和/或接受體寡核苷酸陣列)上的引物(例如,寡核苷酸)在采用本文提供的方法引入到靶多核苷酸中的引物結(jié)合位點(diǎn)處與拉伸的靶多核苷酸雜交或偶聯(lián)??梢允褂秒s交或偶聯(lián)的引物(例如,寡核苷酸)進(jìn)行延伸反應(yīng)。圖36示出了采用引物陣列(例如,模板和/或接受體寡核苷酸陣列)生成與靶多核苷酸互補(bǔ)的延伸產(chǎn)物的多步過(guò)程,其中該引物陣列采用本文提供的方法生成。在第一步中,使非陣列結(jié)合的引物3622與靶多核苷酸雜交,可以在雜交之前采用本文所提供的任意方法使該靶多核苷酸拉伸??梢酝ㄟ^(guò)非陣列結(jié)合的引物3622上的隨機(jī)序列3613以及靶多核苷酸3630上與該隨機(jī)序列3613互補(bǔ)的序列來(lái)促進(jìn)非陣列結(jié)合的引物3622與靶多核苷酸之間的雜交。這與圖32中示出的方法類(lèi)似。雜交后,可以采用靶多核苷酸3630作為模板,利用本文提供的任意聚合酶來(lái)延伸雜交的非陣列結(jié)合的引物3622,以便生成與該靶多核苷酸3630互補(bǔ)的延伸產(chǎn)物。非陣列結(jié)合的引物3622可以進(jìn)一步包含引物結(jié)合位點(diǎn)3612,使得引物結(jié)合位點(diǎn)3612不與靶多核苷酸雜交。引物結(jié)合位點(diǎn)3612可以包含限定序列。該限定序列可以是通用序列、銜接子序列、pcr引物序列和/或條形碼序列。引物結(jié)合位點(diǎn)3612可以包含通用序列、銜接子序列、pcr引物序列和/或條形碼序列。該條形碼序列可以以本文所述的方式編碼位置信息。在一些情況下,所使用的聚合酶包含鏈置換活性。在一些情況下,所使用的聚合酶不包含鏈置換活性??梢允寡由飚a(chǎn)物與包含引物區(qū)3610、3620的引物陣列(例如,模板和/或接受體寡核苷酸陣列)3600接觸。每個(gè)引物區(qū)均可包含與引物陣列3600在引物區(qū)3610、3620中的一個(gè)處結(jié)合的引物(例如,寡核苷酸,3621)。每一個(gè)與陣列結(jié)合的引物(例如,寡核苷酸;3621)均可以包含與引物結(jié)合位點(diǎn)3612互補(bǔ)的序列3611,并且可因此在與引物結(jié)合位點(diǎn)3612雜交時(shí)將提供的延伸產(chǎn)物栓系至基底,以生成如圖36所示的與陣列結(jié)合的延伸產(chǎn)物3614?;蛘撸趫D36中的延伸反應(yīng)期間,可以發(fā)生從游離引物到靶多核苷酸的模板轉(zhuǎn)換,從而允許延伸產(chǎn)物并入與靶多核苷酸的區(qū)段互補(bǔ)的序列。
在一些情況下,從與靶多核苷酸偶聯(lián)的與陣列結(jié)合的引物生成延伸產(chǎn)物,其中該靶多核苷酸包含通過(guò)如本文提供的轉(zhuǎn)座子插入引入的引物結(jié)合位點(diǎn)。例如,圖37示出了包含引物區(qū)3710、3720的引物基底3700。引物區(qū)3710和3720中的每一個(gè)均包含結(jié)合至引物基底3700的引物(例如,寡核苷酸),使得每一個(gè)引物(例如,寡核苷酸)均能夠與拉伸的靶多核苷酸3730在引物結(jié)合位點(diǎn)3731處結(jié)合,所述引物結(jié)合位點(diǎn)如本文所述并且如圖31中示出,采用轉(zhuǎn)座子并入到靶多核苷酸3730中。隨后,將雜交或偶聯(lián)的引物(例如,寡核苷酸)延伸,以生成與陣列結(jié)合的延伸產(chǎn)物3712。引物結(jié)合位點(diǎn)3731可以包含限定序列。該限定序列可以是通用序列、銜接子序列、pcr引物序列和/或條形碼序列。引物結(jié)合位點(diǎn)3731可以包含通用序列、銜接子序列、pcr引物序列和/或條形碼序列。該條形碼序列可以以本文所述的方式編碼位置信息。
可以用酶如本文提供的任何dna聚合酶進(jìn)行延伸反應(yīng)。該聚合酶可以包括但不限于poli、polii、poliii、klenow、t4dnapol、修飾的t7dnapol、突變的修飾的t7dnapol、tdt、bst、taq、tth、pfu、pow、vent、pab、phusion和phi-29。例如,可以采用bst聚合酶,通過(guò)將模板核酸和引物與bst聚合酶和dntp一起在65℃下在1x等溫?cái)U(kuò)增緩沖液(例如,20mmtris-hcl,10mm(nh4)2so4,50mmkcl,2mmmgso4和0.1%吐溫20)中溫育來(lái)進(jìn)行延伸反應(yīng)??梢杂媚孓D(zhuǎn)錄酶進(jìn)行延伸反應(yīng)。在一些情況下,模板核酸包含rna,并且酶延伸反應(yīng)使用rna作為模板使引物延長(zhǎng)。采用與陣列結(jié)合的引物和靶多核苷酸進(jìn)行延伸反應(yīng)可以生成與陣列結(jié)合的延伸產(chǎn)物,該延伸產(chǎn)物包含模板核酸序列或其互補(bǔ)體的一部分以及如本文提供的條形碼標(biāo)簽序列。
在一些情況下,從在如本文提供的陣列上的、與靶多核苷酸偶聯(lián)的與陣列結(jié)合的引物生成延伸產(chǎn)物,該靶多核苷酸包含通過(guò)采用切口酶在靶多核苷酸上產(chǎn)生切口并隨后附加引物結(jié)合位點(diǎn)而引入的引物結(jié)合位點(diǎn)。該切口酶可以是如本文提供的任意切口酶。在一些情況下,該切口酶是nt.cvipii??梢酝ㄟ^(guò)連接進(jìn)行該引物結(jié)合位點(diǎn)的附加。連接可以是如本文所述的任何連接方法。靶多核苷酸的拉伸可以是本文提供的任何拉伸方法。在一些情況下,采用分子梳理使靶多核苷酸拉伸??梢圆捎梅肿邮崂硎拱郊拥囊锝Y(jié)合位點(diǎn)的靶多核苷酸在寡核苷酸陣列上拉伸,使得一個(gè)或多個(gè)引物結(jié)合位點(diǎn)包含與寡核苷酸陣列上的寡核苷酸互補(bǔ)的序列??梢酝ㄟ^(guò)本文提供的方法制備寡核苷酸陣列。寡核苷酸陣列可以是模板或接受體陣列。可以采用如本文提供的轉(zhuǎn)移方法生成接受體陣列。轉(zhuǎn)移方法可以是如本文提供的面對(duì)面酶促轉(zhuǎn)移方法。在一些情況下,在寡核苷酸陣列上拉伸的靶多核苷酸上的引物結(jié)合位點(diǎn)與包含互補(bǔ)序列的寡核苷酸結(jié)合,使得包含結(jié)合的引物結(jié)合位點(diǎn)的靶多核苷酸的鏈充當(dāng)模板以采用聚合酶延伸包含互補(bǔ)序列的寡核苷酸,由此生成與陣列結(jié)合的雙鏈靶多核苷酸。例如,圖38示出了包含通過(guò)切口酶和引物結(jié)合位點(diǎn)的附加而引入的引物結(jié)合位點(diǎn)且隨后在如通過(guò)本文提供的方法制備的寡核苷酸陣列上拉伸的靶多核苷酸。圖38步驟a)示出了固定的寡核苷酸,其包含在寡核苷酸陣列上的、與在整個(gè)寡核苷酸陣列上拉伸的靶多核苷酸(拉伸的dna)雜交的條形碼(密碼/密碼’)??梢酝ㄟ^(guò)使用分子梳理進(jìn)行靶多核苷酸的拉伸。該條形碼可以是如本文提供的位置條形碼。圖38步驟b)示出了靶多核苷酸(拉伸的dna)的延伸以及由此的拷貝,從而產(chǎn)生固定在寡核苷酸陣列上的雙鏈靶多核苷酸(dsdna)(圖38步驟c)??梢栽诳捎糜谝曈X(jué)確認(rèn)聚合酶延伸的修飾的核苷酸(用熒光團(tuán)標(biāo)記)的存在下,用熱穩(wěn)定酶—ventexo-聚合酶進(jìn)行引物延伸。然而,本領(lǐng)域技術(shù)人員可以理解,可以使用如本文提供的任何合適的聚合酶。在一些情況下,使用包含鏈置換性質(zhì)的聚合酶。該鏈置換聚合酶可以是ventexo-聚合酶以及phi29和bst。圖38步驟d)示出了該雙鏈靶多核苷酸的片段化,隨后為末端修復(fù)。在一些情況下,可以通過(guò)本領(lǐng)域已知的方法實(shí)現(xiàn)片段化。可以通過(guò)物理片段化方法和/或酶片段化方法進(jìn)行片段化。物理片段化方法可以包括霧化、聲處理和/或流體動(dòng)力學(xué)剪切。在一些情況下,可以機(jī)械地實(shí)現(xiàn)片段化,包括使核酸經(jīng)受聲處理。在一些情況下,該片段化包括在適合于一種或多種酶在雙鏈核酸中產(chǎn)生斷裂的條件下,用該一種或多種酶處理核酸。對(duì)核酸片段的生成有用的酶的實(shí)例包括序列特異性和非序列特異性核酸酶。核酸酶的非限制性實(shí)例包括dna酶i、片段化酶(fragmentase)、限制性內(nèi)切核酸酶、其變體及其組合。用于進(jìn)行酶片段化反應(yīng)的試劑是可商購(gòu)的(例如,從newenglandbiolabs)。例如,用dna酶i消化可以包括在不存在mg++但存在mn++的情況下誘導(dǎo)dna中的隨機(jī)雙鏈斷裂。在一些情況下,片段化包括用一種或多種限制性內(nèi)切核酸酶處理靶多核苷酸。片段化可以產(chǎn)生具有5’突出端、3’突出端、平端或其組合的片段。在一些情況下,諸如當(dāng)片段化包括使用一種或多種限制性內(nèi)切核酸酶時(shí),靶多核苷酸的切割留下具有可預(yù)測(cè)的序列的突出端。在一些情況下,如本文所述對(duì)片段化的雙鏈靶多核苷酸進(jìn)行末端修復(fù),由此產(chǎn)生平端。在一些情況下,如本文所述對(duì)片段化的雙鏈靶多核苷酸進(jìn)行末端修復(fù),并隨后如本文所述使其經(jīng)歷a-加尾反應(yīng)。圖38步驟e)示出了將銜接子附加至片段化的雙鏈靶多核苷酸上,隨后將該雙鏈靶多核苷酸從寡核苷酸陣列上釋放以用于圖38步驟f)中的測(cè)序??梢酝ㄟ^(guò)雙鏈靶多核苷酸從寡核苷酸陣列基底的片段化來(lái)實(shí)現(xiàn)該雙鏈靶多核苷酸從寡核苷酸陣列上的釋放??梢酝ㄟ^(guò)使用本文提供的任何方法來(lái)進(jìn)行片段化。在一些情況下,與陣列結(jié)合的引物(寡核苷酸)優(yōu)選地在其5’或3’端具有限制酶切位點(diǎn),該位點(diǎn)并入到雙鏈靶多核苷酸中并允許該雙鏈靶多核苷酸或其部分的選擇性切割和釋放。在一些情況下,采用neb片段化酶對(duì)雙鏈靶多核苷酸進(jìn)行酶切。在一些情況下,可以采用熱能破壞雙鏈靶多核苷酸與引物基底之間的鍵。在一些情況下,可以通過(guò)機(jī)械破壞或剪切將雙鏈靶多核苷酸從引物基底上分離。將銜接子附加至片段化的雙鏈靶多核苷酸上可以包括連接??梢酝ㄟ^(guò)本文證明的任何連接方法進(jìn)行連接。在一些情況下,附加至雙鏈靶多核苷酸上的銜接子包含與如本文提供的下一代測(cè)序平臺(tái)(ngs)相容的序列。在一些情況下,該測(cè)序平臺(tái)是illumina平臺(tái)。在一些情況下,附加至雙鏈靶多核苷酸上的銜接子包含用于illuminahiseq2500的illumina引物序列。illumina引物序列可以是第二illumina引物??梢圆捎帽绢I(lǐng)域已知的任何測(cè)序方法對(duì)釋放的雙鏈靶多核苷酸進(jìn)行測(cè)序。在一些情況下,采用ngs方法對(duì)釋放的雙鏈靶多核苷酸進(jìn)行測(cè)序。該ngs方法可以是如本文提供的任何ngs方法。
從延伸產(chǎn)物產(chǎn)生測(cè)序文庫(kù)
一旦從靶多核苷酸產(chǎn)生延伸產(chǎn)物,如本公開(kāi)內(nèi)容中其他地方所述,該延伸產(chǎn)物可以直接進(jìn)行測(cè)序或用來(lái)生成用于隨后測(cè)序的測(cè)序文庫(kù)。在一些情況下,在處理靶多核苷酸,使其在寡核苷酸陣列上拉伸以及如本文所述將拉伸的靶多核苷酸延伸之后,產(chǎn)生了核酸文庫(kù)。如圖1和圖2中概述的,該核酸文庫(kù)可以是可以從延伸產(chǎn)物產(chǎn)生的測(cè)序文庫(kù)(107、207)。
在一些情況下,在測(cè)序之前,將通過(guò)本文所述的方法產(chǎn)生的延伸產(chǎn)物從寡核苷酸陣列上釋放。這種實(shí)施方案的實(shí)例在圖38的步驟f中示出。在一些情況下,可以采用熱能破壞延伸產(chǎn)物與引物基底之間的鍵。在一些情況下,可以通過(guò)機(jī)械破壞或剪切將延伸產(chǎn)物從引物基底上分離。在一些情況下,與陣列結(jié)合的引物(寡核苷酸)優(yōu)選地在其5’或3’端具有限制酶切位點(diǎn),該位點(diǎn)并入到延伸產(chǎn)物中并允許該延伸產(chǎn)物或其部分的選擇性切割和釋放。在一些情況下,可以通過(guò)采用用于如本文提供的對(duì)核酸進(jìn)行片段化的酶消化延伸產(chǎn)物來(lái)將延伸產(chǎn)物從寡核苷酸陣列上釋放。在一些情況下,通過(guò)用限制酶消化來(lái)將延伸產(chǎn)物從寡核苷酸陣列上釋放。該限制酶可以是本領(lǐng)域已知的和/或本文提供的任何限制酶。在一些情況下,使用neb片段化酶對(duì)延伸產(chǎn)物進(jìn)行酶切。可以調(diào)整延伸產(chǎn)物的酶消化的消化時(shí)間以獲得選定的片段大小。在一些情況下,可以將延伸產(chǎn)物片段化成具有一個(gè)或多個(gè)特定大小范圍的片段化延伸產(chǎn)物的群體。在一些情況下,該片段可以具有約10至約10,000個(gè)核苷酸或堿基對(duì)的平均長(zhǎng)度。在一些情況下,該片段具有約50至約2,000個(gè)核苷酸或堿基對(duì)的平均長(zhǎng)度。在一些情況下,該片段具有約100至約2,500、約10至約1000、約10至約800、約10至約500、約50至約500、約50至約250或約50至約150個(gè)核苷酸或堿基對(duì)的平均長(zhǎng)度。在一些情況下,該片段具有少于10,000個(gè)核苷酸或bp、少于7,500個(gè)核苷酸或bp、少于5,000個(gè)核苷酸或bp、少于2,500個(gè)核苷酸或bp、少于2,000個(gè)核苷酸或bp、少于1,500個(gè)核苷酸或bp、少于1,000個(gè)核苷酸或bp、少于500個(gè)核苷酸或bp、少于400個(gè)核苷酸或bp、少于300個(gè)核苷酸或bp、少于200個(gè)核苷酸或bp或少于150個(gè)核苷酸或bp的平均長(zhǎng)度。在一些情況下,該片段具有大約、多于、少于或至少10、20、30、40、50、60、70、80、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500或10,000個(gè)核苷酸或堿基對(duì)的平均長(zhǎng)度。
在一些情況下,通過(guò)由本文提供的方法生成的寡核苷酸陣列上延伸產(chǎn)物的片段化生成的多核苷酸片段經(jīng)歷末端修復(fù)。末端修復(fù)可以包括生成平端、非平端(即,粘端或粘性末端)或單堿基突出端(如單個(gè)da核苷酸通過(guò)缺乏3’外切核酸酶活性的聚合酶添加至雙鏈核酸產(chǎn)物的3’端)。在一些情況下,對(duì)片段進(jìn)行末端修復(fù)以產(chǎn)生平端,其中該片段的末端含有5’磷酸和3’羥基??梢圆捎帽绢I(lǐng)域已知的任意數(shù)目的酶和/或方法進(jìn)行末端修復(fù)。突出端可以包含大約、多于、少于或至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個(gè)核苷酸。
在一些情況下,通過(guò)本文提供的方法生成并結(jié)合至如本文提供的寡核苷酸陣列的延伸產(chǎn)物保持與該寡核苷酸陣列結(jié)合,并且從該結(jié)合的延伸產(chǎn)物生成測(cè)序文庫(kù)。從通過(guò)本文提供的方法生成的與寡核苷酸陣列結(jié)合的延伸產(chǎn)物生成測(cè)序文庫(kù)可以通過(guò)采用與陣列結(jié)合的延伸產(chǎn)物作為模板生成第二組延伸產(chǎn)物來(lái)實(shí)現(xiàn)。這些第二延伸產(chǎn)物可以包含與條形碼序列互補(bǔ)的序列。與條形碼序列互補(bǔ)的序列可以與原始條形碼序列相關(guān),并因此傳達(dá)與原始條形碼相同的位置信息。由于第二延伸產(chǎn)物可以與第一延伸產(chǎn)物的區(qū)域互補(bǔ)(該第一延伸產(chǎn)物可以與生成與陣列結(jié)合的延伸產(chǎn)物的靶多核苷酸互補(bǔ)),因此該第二延伸產(chǎn)物還可以包含與靶多核苷酸的區(qū)域或區(qū)段對(duì)應(yīng)的序列。
在一些情況下,通過(guò)將非基底結(jié)合的引物(即,溶液中的引物或“游離”引物)與陣列結(jié)合的延伸產(chǎn)物雜交并采用該陣列結(jié)合的延伸產(chǎn)物作為模板將雜交的非基底結(jié)合的引物延伸以生成非陣列結(jié)合的(或游離的)延伸產(chǎn)物,來(lái)從通過(guò)本文提供的方法生成的與寡核苷酸陣列結(jié)合的延伸產(chǎn)物制備測(cè)序文庫(kù)。可以例如通過(guò)如本文所述的非基底結(jié)合引物的隨機(jī)序列區(qū)段(例如,隨機(jī)六聚體等),將該非基底結(jié)合的引物與陣列結(jié)合的延伸產(chǎn)物雜交。該隨機(jī)序列可以為至少5、6、7、8、9、10、11、12、13、14或15個(gè)堿基對(duì)或核苷酸。該隨機(jī)序列可以為至多5、6、7、8、9、10、11、12、13、14或15個(gè)堿基對(duì)或核苷酸。游離引物可以包含pcr引物序列。pcr引物序列可以為至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個(gè)堿基對(duì)或核苷酸。pcr引物序列可以為至多5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35個(gè)堿基對(duì)或核苷酸。該非基底結(jié)合的引物可以包含銜接子序列。該銜接子序列可以與本領(lǐng)域已知的任何測(cè)序平臺(tái)相容。在一些情況下,該銜接子序列包含適用于illuminangs測(cè)序方法如illuminahiseq2500系統(tǒng)的序列。該銜接子序列可以是y形銜接子,或雙鏈體或部分雙鏈體銜接子。與該陣列結(jié)合的延伸產(chǎn)物雜交的非基底結(jié)合的引物的延伸可以采用酶如dna聚合酶進(jìn)行。該聚合酶可以包括但不限于poli、polii、poliii、klenow、t4dnapol、修飾的t7dnapol、突變的修飾的t7dnapol、tdt、bst、taq、tth、pfu、pow、vent、pab和phi-29。例如,可以采用bst聚合酶,通過(guò)將模板核酸和引物與bst聚合酶和dntp一起在65℃下在1x等溫?cái)U(kuò)增緩沖液(例如,20mmtris-hcl,10mm(nh4)2so4,50mmkcl,2mmmgso4和0.1%吐溫20)中溫育來(lái)進(jìn)行延伸反應(yīng)。
采用非基底結(jié)合的引物從與寡核苷酸陣列結(jié)合的延伸產(chǎn)物制備測(cè)序文庫(kù)的實(shí)例在圖39中示出。引物陣列(例如,模板和/或接受體寡核苷酸陣列)3900可以包含引物(寡核苷酸)區(qū)3910、3920,該引物區(qū)包含與陣列結(jié)合的延伸產(chǎn)物3913。與陣列結(jié)合的延伸產(chǎn)物3913可以包含pcr引物序列3911和條形碼序列3912,以及與靶多核苷酸或其互補(bǔ)體對(duì)應(yīng)的序列??梢蕴砑臃腔捉Y(jié)合的引物以通過(guò)例如該非基底結(jié)合引物的隨機(jī)六聚體或隨機(jī)九聚體區(qū)段3932的結(jié)合而結(jié)合與陣列結(jié)合的延伸產(chǎn)物3913,并且該非基底結(jié)合的引物可以用于延伸反應(yīng)??梢援a(chǎn)生含有與陣列結(jié)合的延伸產(chǎn)物的部分以及條形碼序列或其互補(bǔ)體的非陣列結(jié)合的延伸產(chǎn)物3931。非基底結(jié)合的引物可以包含含有限定序列的尾部區(qū)段3933,該限定序列不與陣列結(jié)合的延伸產(chǎn)物中的序列互補(bǔ),因此不與該陣列結(jié)合的延伸產(chǎn)物雜交。該限定序列可以包含通用序列、銜接子序列和/或條形碼序列。
通過(guò)本文提供的方法生成的非陣列結(jié)合的延伸產(chǎn)物(例如,如圖39所示)可以包含與靶多核苷酸的區(qū)段對(duì)應(yīng)的序列。即,非陣列結(jié)合的延伸產(chǎn)物可以包含與產(chǎn)生所述非陣列結(jié)合的延伸產(chǎn)物的與陣列結(jié)合的延伸產(chǎn)物的一些或全部區(qū)段互補(bǔ)的序列,該序列可以包含與靶多核苷酸的區(qū)段對(duì)應(yīng)或互補(bǔ)的序列。非陣列結(jié)合的延伸產(chǎn)物可以包含條形碼,該條形碼包含與陣列結(jié)合的延伸產(chǎn)物的條形碼序列互補(bǔ)的序列。通過(guò)將互補(bǔ)條形碼序列與原始條形碼序列相互關(guān)聯(lián),該互補(bǔ)條形碼可以傳達(dá)與原始條形碼序列所傳達(dá)的相同的位置信息。在非陣列結(jié)合的延伸產(chǎn)物中,可以將由條形碼或互補(bǔ)條形碼所傳達(dá)的位置信息與和靶多核苷酸的區(qū)段對(duì)應(yīng)的序列相互關(guān)聯(lián),由此沿著拉伸的靶多核苷酸分子的長(zhǎng)度定位該靶多核苷酸的區(qū)段。非陣列結(jié)合的延伸產(chǎn)物可以包含一種或多種pcr引物序列。非陣列結(jié)合的延伸產(chǎn)物可以包含與產(chǎn)生所述非陣列結(jié)合的延伸產(chǎn)物的陣列結(jié)合的延伸產(chǎn)物中的pcr引物序列互補(bǔ)的pcr引物序列。非陣列結(jié)合的延伸產(chǎn)物可以包含來(lái)自非陣列結(jié)合的引物的pcr引物序列,該引物被延伸以生成非陣列結(jié)合的延伸產(chǎn)物。非陣列結(jié)合的延伸產(chǎn)物可以包含銜接子序列如測(cè)序銜接子。在一些情況下,附加至非陣列結(jié)合的延伸產(chǎn)物上的銜接子序列包含適用于illuminangs測(cè)序方法如illuminahiseq2500系統(tǒng)的序列。
可以例如通過(guò)測(cè)序來(lái)擴(kuò)增和/或進(jìn)一步分析延伸產(chǎn)物(非陣列結(jié)合的或從如本文所述的寡核苷酸陣列上釋放的)或其片段。該測(cè)序可以是本領(lǐng)域已知的任何測(cè)序方法??梢酝ㄟ^(guò)本領(lǐng)域已知或本文提供的任何擴(kuò)增方法進(jìn)行擴(kuò)增??梢杂萌绫疚奶峁┑娜魏蚊高M(jìn)行擴(kuò)增。例如,可以采用bst聚合酶,通過(guò)將模板核酸和引物與bst聚合酶和dntp一起在65℃下在1x等溫?cái)U(kuò)增緩沖液(例如,20mmtris-hcl,10mm(nh4)2so4,50mmkcl,2mmmgso4和0.1%吐溫20)中溫育來(lái)進(jìn)行反應(yīng)。擴(kuò)增可以利用并入到延伸產(chǎn)物中的例如來(lái)自與陣列結(jié)合的引物(寡核苷酸)和非基底結(jié)合引物的pcr引物位點(diǎn)。可以使用擴(kuò)增將銜接子如測(cè)序銜接子并入至擴(kuò)增的延伸產(chǎn)物中。該測(cè)序銜接子可以與本領(lǐng)域已知的任何測(cè)序方法相容。
測(cè)序
一旦延伸產(chǎn)物被制備成測(cè)序文庫(kù),則可以對(duì)其進(jìn)行測(cè)序。在測(cè)序前,可以通過(guò)變性、選擇性切割或pcr擴(kuò)增將與寡核苷酸陣列結(jié)合的制備的測(cè)序文庫(kù)從該寡核苷酸陣列上釋放。例如如圖1和圖2中概述的,可以對(duì)測(cè)序文庫(kù)進(jìn)行測(cè)序,并且可以通過(guò)使用位置條形碼信息確定序列讀取的順序和比對(duì)(108、208)??梢詫?lái)自延伸產(chǎn)物的序列讀取比對(duì)或組裝成靶多核苷酸??梢酝ㄟ^(guò)由與靶多核苷酸的每個(gè)區(qū)段相關(guān)的條形碼序列傳達(dá)的位置信息來(lái)輔助比對(duì)或組裝??梢詫⒂蓷l形碼傳達(dá)的位置信息與和靶多核苷酸的區(qū)段對(duì)應(yīng)的序列相互關(guān)聯(lián),由此沿著拉伸的靶多核苷酸的長(zhǎng)度定位該靶多核苷酸的區(qū)段。當(dāng)對(duì)長(zhǎng)核酸分子或含有長(zhǎng)重復(fù)序列、插入、缺失、轉(zhuǎn)座或其他特征的核酸分子進(jìn)行測(cè)序時(shí),位置信息的使用可能是特別有益的。
可以通過(guò)任何適當(dāng)?shù)臏y(cè)序技術(shù)進(jìn)行測(cè)序文庫(kù)的測(cè)序,該測(cè)序技術(shù)包括但不限于單分子實(shí)時(shí)(smrt)測(cè)序、聚合酶克隆測(cè)序(polonysequencing)、連接測(cè)序(例如,solid測(cè)序)、可逆終止子測(cè)序、質(zhì)子檢測(cè)測(cè)序、離子半導(dǎo)體(例如,iontorrent)測(cè)序、納米孔測(cè)序、電子測(cè)序、焦磷酸測(cè)序(例如,454)、maxam-gilbert測(cè)序、鏈終止(例如,sanger)測(cè)序、+s測(cè)序,或合成測(cè)序(例如,illuminahiseq)。
可以通過(guò)如美國(guó)專(zhuān)利號(hào)7462452、7476504、7405281、7170050、7462468、7476503、7315019、7302146、7313308以及美國(guó)專(zhuān)利申請(qǐng)公開(kāi)號(hào)us20090029385、us20090068655、us20090024331和us20080206764中描述的單分子實(shí)時(shí)(smrt)測(cè)序(例如,pacificbiosciences)進(jìn)行測(cè)序,上述每一篇文獻(xiàn)的公開(kāi)內(nèi)容均通過(guò)引用以其全文并入本文。來(lái)自采用本文所述的方法制備的文庫(kù)的核酸插入物或從寡核苷酸陣列上釋放的延伸產(chǎn)物可以固定在零模式波導(dǎo)陣列中??梢詫我籨na聚合酶固定在具有單一靶多核苷酸的零模式波導(dǎo)的底部??梢詫晒鈽?biāo)記的核苷酸并入到核酸合成中,并且可以使用零模式波導(dǎo)在熒光染料從核苷酸上切割時(shí)檢測(cè)該熒光染料。這可以允許模板核酸序列的實(shí)時(shí)逐堿基(base-by-base)測(cè)量。將熒光標(biāo)記物作為核苷酸并入的一部分剪掉。在一些情況下,采用環(huán)形模板以使得能夠?qū)崿F(xiàn)單分子上的多個(gè)讀取。
可以通過(guò)聚合酶克隆測(cè)序進(jìn)行測(cè)序。例如,可以將來(lái)自采用本文所述的方法制備的文庫(kù)的核酸插入物或從寡核苷酸陣列上釋放的延伸產(chǎn)物剪切成長(zhǎng)度約為1kb的鏈。這些鏈可以通過(guò)滾環(huán)擴(kuò)增進(jìn)行環(huán)化和擴(kuò)增??梢酝ㄟ^(guò)例如mmeliis限制酶來(lái)消化擴(kuò)增的環(huán)化產(chǎn)物,從而產(chǎn)生側(cè)翼是標(biāo)簽的t30片段??梢酝ㄟ^(guò)例如pcr將片段擴(kuò)增并形成文庫(kù)??梢酝ㄟ^(guò)與珠子結(jié)合的引物對(duì)文庫(kù)進(jìn)行乳液pcr,并且使用捕獲珠子來(lái)富集具有擴(kuò)增的dna的珠子。然后可以通過(guò)離心分離珠子,將其以單層的形式結(jié)合至基底并與測(cè)序試劑接觸。對(duì)熒光標(biāo)記的簡(jiǎn)并九聚體進(jìn)行成像,從而允許測(cè)量片段序列,并且可以組裝片段序列。
在一些情況下,本文所述的方法可用于制備釋放的延伸產(chǎn)物或文庫(kù),其插入物通過(guò)由appliedbiosystems商業(yè)化的連接測(cè)序法(例如,solid測(cè)序)進(jìn)行測(cè)序??梢詫?lái)自采用本文所述的方法制備的文庫(kù)的核酸插入物或從寡核苷酸陣列上釋放的延伸產(chǎn)物與聚苯乙烯珠子一起并入到油包水乳液中,并通過(guò)例如pcr進(jìn)行擴(kuò)增。在一些情況下,可以在油包水乳液中采用備選的擴(kuò)增方法,如本文提供的任何方法。由乳液形成的每個(gè)水微滴中的擴(kuò)增產(chǎn)物與存在于該微滴中的一個(gè)或多個(gè)珠子相互作用、結(jié)合或雜交,產(chǎn)生具有多個(gè)基本上一個(gè)序列的擴(kuò)增產(chǎn)物的珠子。當(dāng)破乳時(shí),珠子漂浮至樣品的頂部并被放置到陣列上。該方法可以包括使結(jié)合至珠子的核酸成為鏈狀或部分單鏈的步驟。然后添加測(cè)序引物以及四種不同熒光標(biāo)記的寡核苷酸探針的混合物。該探針與待測(cè)序的多核苷酸中緊鄰測(cè)序引物并且位于測(cè)序引物3’的兩個(gè)堿基特異性結(jié)合,以確定四種堿基中的哪些在那些位置處。在洗滌并讀取來(lái)自第一并入探針的熒光信號(hào)后,添加連接酶。該連接酶在第五與第六個(gè)堿基之間切割寡核苷酸探針,從而將熒光染料從待測(cè)序的多核苷酸中去除。采用不同的測(cè)序引物重復(fù)整個(gè)過(guò)程,直到序列中所有的中間位置都成像。該過(guò)程允許以“大規(guī)模平行”方式同時(shí)讀取數(shù)百萬(wàn)個(gè)dna片段。這種“連接測(cè)序”技術(shù)使用編碼兩個(gè)堿基而不是僅編碼一個(gè)堿基的探針,以允許通過(guò)信號(hào)錯(cuò)配進(jìn)行錯(cuò)誤識(shí)別,從而導(dǎo)致堿基確定準(zhǔn)確率提高。
可以通過(guò)可逆終止子測(cè)序進(jìn)行測(cè)序。例如,可以將熒光標(biāo)記的可逆終止子結(jié)合的dntp并入到從模板核酸插入物形成的核酸產(chǎn)物中,該模板核酸插入物來(lái)自采用本文提供的方法制備的文庫(kù)或從寡核苷酸陣列釋放的延伸產(chǎn)物。然后可以對(duì)熒光標(biāo)記的終止子進(jìn)行成像并切割,以允許并入和成像的另外的循環(huán)。熒光標(biāo)記物可以指示并入了哪些堿基,并且可以推導(dǎo)出模板核酸的序列。
可以在本文所述的方法中使用的測(cè)序技術(shù)的另一個(gè)實(shí)例是由iontorrent提供的半導(dǎo)體測(cè)序(例如,采用ionpersonalgenomemachine(pgm))。iontorrent技術(shù)可以采用具有多層例如具有微加工孔的層、離子敏感層和離子傳感器層的半導(dǎo)體芯片??梢詫?lái)自采用本文所述的方法制備的文庫(kù)的核酸插入物或從寡核苷酸陣列上釋放的延伸產(chǎn)物引入到孔中,例如,單個(gè)核酸的克隆群體可以附接至單個(gè)珠子上,并且可以將該珠子引入到孔中。為了啟動(dòng)珠子上核酸的測(cè)序,將一種類(lèi)型的脫氧核糖核苷酸(例如,datp、dctp、dgtp或dttp)引入到孔中。當(dāng)一個(gè)或多個(gè)核苷酸通過(guò)dna聚合酶摻入時(shí),質(zhì)子(氫離子)在孔中釋放,其可以通過(guò)離子傳感器檢測(cè)到。然后可以洗滌半導(dǎo)體芯片,并可以用不同的脫氧核糖核苷酸重復(fù)該過(guò)程??梢栽诎雽?dǎo)體芯片的孔中對(duì)多個(gè)核苷酸進(jìn)行測(cè)序。該半導(dǎo)體芯片可以包含化學(xué)敏感的場(chǎng)效應(yīng)晶體管(chemfet)陣列以對(duì)dna進(jìn)行測(cè)序(例如,如美國(guó)專(zhuān)利申請(qǐng)公開(kāi)號(hào)20090026082中所述的)。可以經(jīng)由chemfet的電流的變化檢測(cè)一個(gè)或多個(gè)三磷酸在測(cè)序引物的3’端向新核酸鏈的摻入。陣列可以具有多個(gè)chemfet傳感器。添加至微孔的dntp的種類(lèi)與氫離子檢測(cè)之間的相互關(guān)系可以允許確定靶多核苷酸序列。
可以在本文所述的方法中使用的測(cè)序技術(shù)的另一個(gè)實(shí)例是納米孔測(cè)序(參見(jiàn)例如,sonigv和mellera.(2007)clinchem53:1996-2001)。納米孔可以是直徑為1納米數(shù)量級(jí)的小孔。將納米孔浸沒(méi)在導(dǎo)電流體中并在其上施加電勢(shì)可以產(chǎn)生由于離子通過(guò)該納米孔傳導(dǎo)的細(xì)微電流。流過(guò)的電流的量對(duì)納米孔的大小敏感。當(dāng)來(lái)自采用本文所述的方法制備的文庫(kù)的核酸插入物或從寡核苷酸陣列上釋放的延伸產(chǎn)物穿過(guò)納米孔時(shí),核酸插入物或釋放的延伸產(chǎn)物上的每個(gè)核苷酸均不同程度地阻塞納米孔。因此,核酸插入物或釋放的延伸產(chǎn)物穿過(guò)納米孔時(shí)穿過(guò)該納米孔的電流變化可以代表該核酸插入物或釋放的延伸產(chǎn)物序列的讀取。
可以通過(guò)如margulies等人,nature(2005)437:376-380(2005)以及美國(guó)專(zhuān)利號(hào)7,244,559、7,335,762、7,211,390、7,244,567、7,264,929和7,323,305中描述的焦磷酸測(cè)序(例如,454)來(lái)進(jìn)行測(cè)序,上述每篇文獻(xiàn)的公開(kāi)內(nèi)容均通過(guò)引用以其全文并入本文??梢詫?lái)自采用本文所述的方法制備的文庫(kù)的核酸插入物或從寡核苷酸陣列上釋放的延伸產(chǎn)物固定在珠子上并在適用于pcr擴(kuò)增的油包水乳液中分區(qū)。在一些情況下,可以在油包水乳液中采用除pcr外的備選擴(kuò)增方法,如本文提供的任何方法。當(dāng)破乳時(shí),擴(kuò)增的片段保持與珠子結(jié)合。該方法可以包括使結(jié)合至珠子的核酸成為單鏈或部分單鏈的步驟。可以將珠子富集并加載到光纖載玻片的孔中,使得每個(gè)孔中約有1個(gè)珠子。在聚合酶、硫化氫解酶和螢光素酶的存在下,使核苷酸以固定的順序流經(jīng)并流入孔中??梢詫我籨ntp物質(zhì)添加至反應(yīng)區(qū)。dntp的摻入可以產(chǎn)生焦磷酸(ppi),焦磷酸可以被atp硫酸化酶轉(zhuǎn)化成atp。然后atp可以為螢光素酶提供能量以產(chǎn)生可以檢測(cè)到的光。與靶鏈互補(bǔ)的核苷酸的添加產(chǎn)生化學(xué)發(fā)光信號(hào),例如通過(guò)相機(jī)記錄該信號(hào)。這允許監(jiān)測(cè)所添加的dntp物質(zhì)是否被摻入,并因此允許分析靶多核苷酸。信號(hào)強(qiáng)度與板上產(chǎn)生的位置信息的組合使得軟件能夠確定dna序列。
可以通過(guò)maxam-gilbert測(cè)序進(jìn)行測(cè)序。例如,可以將來(lái)自采用本文所述的方法制備的文庫(kù)的核酸插入物或從寡核苷酸陣列上釋放的延伸產(chǎn)物在雙鏈核酸分子的一個(gè)5’端處進(jìn)行放射性標(biāo)記??梢允褂没瘜W(xué)處理在小部分的核苷酸堿基處產(chǎn)生斷裂??梢圆捎盟姆N不同的反應(yīng),每一種反應(yīng)在特定堿基或堿基對(duì)(例如,g、a+g、c和c+t)處產(chǎn)生斷裂。然后可以切割核酸分子,產(chǎn)生在一端上具有放射標(biāo)記并且長(zhǎng)度取決于斷裂位點(diǎn)的片段。然后可以在凝膠上分離反應(yīng)產(chǎn)物并且根據(jù)其長(zhǎng)度以及標(biāo)記的存在對(duì)其進(jìn)行分析??梢愿鶕?jù)長(zhǎng)度將反應(yīng)產(chǎn)物排序,并且可以確定靶多核苷酸的序列。
可以通過(guò)鏈終止(例如,sanger)測(cè)序進(jìn)行測(cè)序。例如,可以將來(lái)自采用本文所述的方法制備的文庫(kù)的核酸插入物或從寡核苷酸陣列上釋放的延伸產(chǎn)物用聚合酶、正常dntp和修飾的ddntp(如果其摻入到核酸鏈中會(huì)終止鏈伸長(zhǎng))進(jìn)行擴(kuò)增??梢詫?duì)ddntp進(jìn)行標(biāo)記(例如,熒光地或放射性地)??梢詫我坏膁dntp物質(zhì)與全部四種dntp物質(zhì)添加至模板核酸的延伸反應(yīng)中。然后可以在凝膠上分離反應(yīng)產(chǎn)物并根據(jù)其長(zhǎng)度以及標(biāo)記的存在對(duì)其進(jìn)行分析。可以根據(jù)長(zhǎng)度將反應(yīng)產(chǎn)物排序,并且可以確定模板核酸分子的序列。
可以通過(guò)由illumina商業(yè)化的合成測(cè)序方法進(jìn)行測(cè)序,如美國(guó)專(zhuān)利號(hào)5,750,341、6,306,597和5,969,119中描述的??梢允箒?lái)自采用本文所述的方法制備的文庫(kù)的核酸插入物或從寡核苷酸陣列上釋放的延伸產(chǎn)物變性,并且可以將單鏈的擴(kuò)增的多核苷酸隨機(jī)地附接至流動(dòng)池通道的內(nèi)表面上。可以添加未標(biāo)記的核苷酸來(lái)引發(fā)固相橋式擴(kuò)增,以產(chǎn)生雙鏈dna的密集簇。為了引發(fā)第一堿基測(cè)序循環(huán),可添加四種標(biāo)記的可逆終止子、引物和dna聚合酶。在激光激發(fā)后,對(duì)來(lái)自流動(dòng)池上的每個(gè)簇的熒光進(jìn)行成像。然后記錄每個(gè)簇的第一堿基的身份??梢赃M(jìn)行測(cè)序循環(huán),從而以每次一個(gè)堿基的方式確定片段序列。
可以通過(guò)如wo2012134602中描述的+s測(cè)序進(jìn)行測(cè)序,該文獻(xiàn)的公開(kāi)內(nèi)容通過(guò)引用并入本文。在一些情況下,對(duì)來(lái)自采用本文所述的方法制備的文庫(kù)的核酸插入物或從如本文提供的寡核苷酸陣列上釋放的延伸產(chǎn)物進(jìn)行+s測(cè)序。+s測(cè)序可能需要重復(fù)輪次的受控延伸和洗滌循環(huán)。與脈沖延伸相似,可以通過(guò)限制核苷酸的可用性或通過(guò)添加可逆終止子核苷酸來(lái)進(jìn)行受控延伸。可以使用核酸聚合酶以及一組或多組核苷酸來(lái)進(jìn)行受限延伸。該一組或多組通常各自包含不超過(guò)三種不同的核苷酸。在一些情況下,+s測(cè)序中采用的一組或多組核苷酸包含一到四種核苷酸并且至少一種核苷酸為可逆終止子核苷酸??梢圆捎贸^(guò)一組核苷酸,如至少1、2、3組或更多組來(lái)進(jìn)行延伸。一組核苷酸可包含一種、兩種或三種不同的核苷酸。在一些情況下,+s測(cè)序法進(jìn)一步包括例如通過(guò)重復(fù)從模板(例如,來(lái)自采用本文所述的方法制備的文庫(kù)的核酸插入物或從寡核苷酸陣列上釋放的延伸產(chǎn)物)上釋放引物延伸產(chǎn)物的步驟來(lái)獲得一個(gè)或多個(gè)額外的序列讀取;使額外的測(cè)序引物(或延伸引物)與模板雜交;通過(guò)經(jīng)由受控延伸來(lái)延伸該額外的測(cè)序引物而生成額外的引物延伸產(chǎn)物;以及通過(guò)進(jìn)一步延伸該額外的引物延伸產(chǎn)物以生成額外的引物延伸產(chǎn)物來(lái)對(duì)該模板的一個(gè)或多個(gè)堿基進(jìn)行測(cè)序,由此獲得額外的序列讀取。該額外的測(cè)序引物可以針對(duì)該模板的相同或相似區(qū)域??梢酝ㄟ^(guò)采用本文提供的任何測(cè)序方法延伸該測(cè)序引物來(lái)進(jìn)行模板的測(cè)序。在一些情況下,在隨后添加核苷酸組之前進(jìn)行洗滌步驟或核苷酸降解步驟。
生物信息學(xué)和軟件
在測(cè)序后,可以比對(duì)序列數(shù)據(jù)??梢愿鶕?jù)已知設(shè)計(jì)的引物/標(biāo)簽序列以及靶多核苷酸信息將每個(gè)序列讀取分離成引物/標(biāo)簽序列信息。可以通過(guò)編碼的位置條形碼信息來(lái)輔助比對(duì),該信息通過(guò)其引物/標(biāo)簽序列與靶多核苷酸的每個(gè)片段相關(guān)聯(lián)。測(cè)序文庫(kù)或釋放的延伸產(chǎn)物的測(cè)序可以產(chǎn)生具有相同或相鄰條形碼序列的重疊讀取。例如,一些延伸產(chǎn)物可能足夠長(zhǎng),從而到達(dá)與靶多核苷酸有關(guān)的下一個(gè)特定序列位點(diǎn)。條形碼序列信息的使用可以將類(lèi)似的重疊讀取聚集在一起,這可以提高準(zhǔn)確率并減少計(jì)算時(shí)間或工作量。
在一些情況下,通過(guò)軟件對(duì)序列讀取以及通過(guò)本文提供的方法獲得的相關(guān)條形碼序列信息進(jìn)行分析。該序列讀取可以是短序列讀取(例如,<100bp)或長(zhǎng)序列讀取(例如,>100bp)。該軟件可以進(jìn)行對(duì)衍生自相同模板的序列讀取進(jìn)行排列的步驟??梢酝ㄟ^(guò)例如搜索具有來(lái)自包含如本文提供的斑點(diǎn)或區(qū)域的寡核苷酸陣列中的相同或相鄰列的條形碼的讀取來(lái)鑒別這些讀取。在一些情況下,只有某些范圍的距離、水平行和/或垂直列的讀取被推定認(rèn)為是來(lái)自相同模板。在讀取條形碼時(shí),軟件可以將基于條形碼設(shè)計(jì)的潛在測(cè)序(及其他)錯(cuò)誤考慮在內(nèi)。該錯(cuò)誤可以是具有為四的編輯距離的條形碼,以允許某些錯(cuò)誤。在一些情況下,如果條形碼含有過(guò)多錯(cuò)誤并且不能被唯一地鑒別,則不直接使用其相關(guān)讀取來(lái)組裝序列。盡管許多讀取可以根據(jù)相對(duì)條形碼位置(例如,行數(shù))組裝,但一些空白可以通過(guò)對(duì)來(lái)自相同基因組區(qū)的讀取進(jìn)行比對(duì)來(lái)填充。本領(lǐng)域技術(shù)人員將會(huì)理解,軟件產(chǎn)品可以根據(jù)條形碼將讀取串在一起,并且可以解釋如本文提供的寡核苷酸陣列上的靶多核苷酸的拉伸朝向。
例如,如果在dna陣列上拉伸后,dna分子不是嚴(yán)格垂直的,則可以通過(guò)例如摻加(spikedin)的已知參考dna樣品來(lái)分析該dna分子相對(duì)于條形碼列的朝向。該參考dna樣品可用于檢測(cè)拉伸的相對(duì)角度,其中假設(shè)拉伸的角度與所有dna分子相似。為了例如在重新測(cè)序中根據(jù)與參考dna樣品(例如,基因組)的比較來(lái)組裝序列讀取,可以使用對(duì)重新測(cè)序組裝有用的軟件。所使用的軟件可以與所使用的測(cè)序平臺(tái)的類(lèi)型相兼容。如果采用illumnia系統(tǒng)進(jìn)行測(cè)序,則可以使用軟件包如partek、bowtie、stampy、shrimp2、snp-o-matic、bwa、bwa-mem、clcworkstation、mosaik、novoalign、tophat、splicemap、mapsplice、abmapper.erne-map(rna)和mrsfast-ultra。對(duì)于基于solid的ngs測(cè)序,可以使用bfast、partek、mosaik、bwa、bowtie和clc工作站。對(duì)于基于454的測(cè)序,可以使用partek、mosaic、bwa、clc工作站、gsmapper、ssaha2、blat、bwa-sw和bwa-mem。對(duì)于基于iontorrent的測(cè)序,可以使用partek、mosaic、clc工作站、tmap、bwa-sw和bwa-mem。對(duì)于從本文提供的方法獲得的序列讀取的從頭組裝,可以使用本領(lǐng)域已知的任何比對(duì)軟件。所使用的軟件可以采用針對(duì)長(zhǎng)讀取(即,>100bp)的重疊布局方法,或針對(duì)短讀取(即,<100bp讀取)的基于debruijn圖的基于k-mer的方法。用于從頭組裝的軟件可以是可公開(kāi)獲得的軟件(例如,abyss、trans-abyss、trinity、ray、contrail)或商業(yè)軟件(例如,clcbiogenomicsworkbench)。
以上的描述公開(kāi)了本發(fā)明的幾種方法和系統(tǒng)。本發(fā)明容許方法和材料的修改以及制備方法和設(shè)備的改變。從本公開(kāi)內(nèi)容或本文公開(kāi)的發(fā)明的實(shí)踐考慮,這樣的修改將對(duì)本領(lǐng)域技術(shù)人員變得顯而易見(jiàn)。例如,本發(fā)明已采用核酸進(jìn)行例證,但其也可以適用于其他聚合物。因此,并不意味著將本發(fā)明限制于本文公開(kāi)的具體實(shí)施方案,而是意味著其涵蓋在本發(fā)明的真正范圍和精神內(nèi)的所有修改和改變。
應(yīng)用和優(yōu)勢(shì)
在一些情況下,本文所述的裝置和方法可以用于對(duì)長(zhǎng)核酸分子如dna或rna分子進(jìn)行測(cè)序。例如,大腸桿菌具有約4.6mb的基因組,可以在一個(gè)過(guò)程中對(duì)其進(jìn)行測(cè)序。對(duì)dna或rna的較大區(qū)段(例如50kb或100kb)進(jìn)行測(cè)序可以準(zhǔn)確表征一些重復(fù)序列和較大的結(jié)構(gòu)變化,但可能錯(cuò)誤表征百萬(wàn)堿基數(shù)量級(jí)的結(jié)構(gòu)變化。本文所述的裝置和方法可以更加準(zhǔn)確地表征重復(fù)序列、較大結(jié)構(gòu)變化和百萬(wàn)堿基規(guī)模的結(jié)構(gòu)變化。測(cè)序的核酸分子可以是整個(gè)基因組,例如大腸桿菌基因組。測(cè)序的核酸分子可以是人dna或染色體的非常長(zhǎng)的鏈。
雖然本文已經(jīng)顯示和描述了本發(fā)明優(yōu)選的實(shí)施方案,但是對(duì)于本領(lǐng)域技術(shù)人員而言顯然這些實(shí)施方案僅僅是作為示例提供的。本領(lǐng)域技術(shù)人員在不偏離本發(fā)明的前提下將會(huì)想到大量的變化、改變和替換。應(yīng)當(dāng)理解,在本發(fā)明的實(shí)踐中可以使用本文描述的本發(fā)明實(shí)施方案的各種替代方案。以下權(quán)利要求旨在限定本發(fā)明的范圍,由此覆蓋在這些權(quán)利要求的范圍內(nèi)的方法和結(jié)構(gòu)及其等同物。
實(shí)施例
實(shí)施例1-平坦表面陣列的產(chǎn)生
使具有圖40所示結(jié)構(gòu)的引發(fā)劑硅烷在etoh的存在下結(jié)合至平坦的二氧化硅基底,從而形成雙足表面聚合物引發(fā)位點(diǎn)。在cubr、pmdeta和h2o的存在下,使丙烯酰胺和乙氧基化丙烯酰胺的混合物與acrydite修飾的寡核苷酸一起在基底上經(jīng)歷原子轉(zhuǎn)移自由基聚合(atrp)。這形成了結(jié)合至表面引發(fā)劑位點(diǎn)的、共價(jià)鍵合的、輕微交聯(lián)的聚丙烯酰胺表面涂層,其厚度在約50nm至約200nm之間,并且其結(jié)構(gòu)中并入了寡核苷酸。該過(guò)程在圖43中示出。
實(shí)施例2-平坦表面陣列在測(cè)序中的應(yīng)用
如實(shí)施例1中所述制備聚丙烯酰胺涂覆的基底。使待測(cè)序的dna與并入至該聚合物結(jié)構(gòu)中的寡核苷酸結(jié)合。向該基底添加合成測(cè)序試劑,并使合成測(cè)序進(jìn)行40個(gè)循環(huán)。至少90%的聚合物鏈保持完整并與表面鍵合。
實(shí)施例3-通過(guò)單次延伸、凝膠-芯片表面的硅烷化、陣列表面的制備,模板的酶促轉(zhuǎn)移
將載玻片在nanostrip溶液中清洗過(guò)夜,用去離子(di)水漂洗并用n2干燥。然后,用丙烯酰胺單體將表面功能化,這將使聚丙烯酰胺凝膠結(jié)合至表面。用475ml乙醇、25ml去離子水和26ml(3-丙烯酰氨基丙基)三甲氧基硅烷制備硅烷化溶液,使硅烷的最終濃度為5%v/v。將一架(arackof)清洗和干燥后的載玻片浸沒(méi)在硅烷化溶液中,并在室溫下輕輕地?cái)嚢?小時(shí)。隨后將載玻片放置在新鮮的乙醇浴中,總共五次。然后,將載波片在去離子水浴中漂洗并用n2干燥。將載玻片儲(chǔ)存在干燥室中直到進(jìn)一步使用。
丙烯酰胺凝膠混合物的制備
用5.00mlh2o、1.00mg明膠、600.00mg丙烯酰胺和32.00mg雙丙烯酰胺制備12%的丙烯酰胺凝膠混合物。將組分溶解并混合在一起,得到最終濃度為12%的丙烯酰胺凝膠混合物。對(duì)于6%的凝膠芯片,將50μl的12%丙烯酰胺凝膠混合物、45μl的去離子水以及μl的5’-acrydite-fc1(1mm濃度)功能化的寡核苷酸合并以得到50μl的總體積并渦旋。
薄凝膠的聚合
對(duì)于以上制備的6%凝膠芯片的混合物,每100μl反應(yīng)混合物添加1.3μl的5%過(guò)硫酸銨和1.3μl的5%temed作為活化劑,最終活化劑濃度各為0.065%。然后將混合物渦旋。將15μl的凝膠混合物用移液管移到干凈的平坦表面例如載玻片或硅晶片上。用如上制備的凝膠-芯片載玻片表面面朝下覆蓋表面上的凝膠混合物。向下按壓該玻璃芯片以實(shí)現(xiàn)凝膠混合物的更加均勻的分布。使凝膠在室溫下聚合20分鐘。將凝膠結(jié)合至該芯片,并將該凝膠-芯片基底從干凈的平坦表面上去除,如需要,在剃須刀片或其他器具的輔助下進(jìn)行。將凝膠芯片在去離子水中漂洗,并從芯片邊緣去除過(guò)量的凝膠。凝膠芯片可以立即使用或儲(chǔ)存在4x鹽水-檸檬酸鈉(ssc)緩沖液中。
酶混合物的制備
用37μlh2o、5μl10xthermopol緩沖液、5μlbsa(10mg/ml)、1μldntp(10mm)和2μlbstdna聚合酶(8u/μl)制備酶混合物。
模板通過(guò)單次延伸的酶促轉(zhuǎn)移
將如上制備的18μl酶混合物放置在制備的凝膠芯片的頂部。使該酶混合物溶液向凝膠內(nèi)滲透30秒。然后,將該凝膠芯片面朝下放置在模板芯片上。模板芯片表面如實(shí)施例1所述制備。將一片pdms放置在兩個(gè)芯片的頂部作為順應(yīng)層,并將芯片堆疊放置在夾具如鋁制夾具中。將該芯片堆疊在濕度室中在55℃下溫育2小時(shí)。然后,在該芯片堆疊的邊緣周?chē)砑宇~外的4x鹽水-檸檬酸鈉(ssc)緩沖液,并使其被吸入以使凝膠芯片松開(kāi)。然后將凝膠芯片表面與模板芯片表面拉開(kāi),如需要,在剃須刀片或其他器具的輔助下進(jìn)行。凝膠仍結(jié)合至凝膠芯片,并具有轉(zhuǎn)移的寡核苷酸。將模板芯片在去離子水中洗滌并用n2干燥。將凝膠芯片用4xssc緩沖液洗滌三次并用2xssc緩沖液洗滌三次。
轉(zhuǎn)移的圖案的成像
將fc2qc-cy3寡核苷酸與如上文中使用的模板芯片在55℃下雜交35分鐘。雜交后,將該模板芯片漂洗并成像。將sp2-cy3寡核苷酸與如上制備的具有轉(zhuǎn)移寡核苷酸的凝膠芯片在55℃下雜交30分鐘。隨后將該凝膠芯片用4xssc緩沖液漂洗兩次并用2xssc緩沖液漂洗兩次,并讓其在4xssc緩沖液中浸泡3小時(shí)以降低背景信號(hào)??梢詡溥x地將該凝膠芯片在4xssc緩沖液中搖動(dòng)20分鐘,而非浸泡3小時(shí)。然后,在落射熒光顯微鏡下,在所需放大倍數(shù)如10x和40x下對(duì)該凝膠芯片進(jìn)行成像。然后,將該凝膠芯片剝離并與針對(duì)模板芯片的fc2qc-cy3寡核苷酸雜交。然后,將該凝膠芯片再成像,并且觀察指示模板分子的物理轉(zhuǎn)移的信號(hào)。
按成分體積制備用于模板擴(kuò)增的反應(yīng)緩沖液
用1.5ml的10xtaq緩沖液、750μl100%dmso、3ml5m甜菜堿、120μl25mmdntp、75μl5000u/mltaq聚合酶和9.555ml無(wú)核酸酶h2o制備反應(yīng)緩沖液。
按最終濃度制備用于模板擴(kuò)增的反應(yīng)緩沖液
在無(wú)核酸酶h2o中以1xtaq緩沖液、5%dmso、1m甜菜堿、0.2mmdntp、25u/mltaq聚合酶的最終濃度制備反應(yīng)緩沖液。
通過(guò)熱循環(huán)的模板擴(kuò)增
將具有寡核苷酸的凝膠芯片用添加有0.1%吐溫-20的0.3xssc緩沖液洗滌。然后使該凝膠芯片經(jīng)歷50個(gè)浸沒(méi)于溶液浴中的循環(huán),該循環(huán)如下:a)在94℃下在具有0.1%吐溫-20的0.3xssc緩沖液中45秒;b)在60℃下在具有0.1%吐溫-20的5xssc緩沖液中2分鐘;以及c)在72℃下在按照上文制備的反應(yīng)緩沖液中1分鐘。該凝膠芯片上的模板得到擴(kuò)增。
芯片上的探針雜交
將具有雙鏈dna(dsdna)的待成像的芯片放置在0.1nnaoh溶液中3分鐘以使該dna變性。洗滌后,用4xssc緩沖液洗滌該芯片。然后該芯片與20ml的100nm熒光標(biāo)記的雜交探針溶液在章動(dòng)器(nutator)上在55℃下溫育40分鐘。溫育后,將該芯片用4xssc緩沖液洗滌兩次并用2xssc緩沖液洗滌兩次,每個(gè)洗滌步驟持續(xù)20分鐘。然后對(duì)該芯片進(jìn)行成像。
實(shí)施例4-從光引導(dǎo)的3’-5’陣列到5’-3’全長(zhǎng)陣列
通過(guò)標(biāo)準(zhǔn)的光引導(dǎo)合成,制備具有3’-5’寡核苷酸特征的模板微陣列,其中該寡核苷酸含有銜接子1序列、在特征之間不同的探針序列以及銜接子2序列。將模板寡核苷酸與還含有可固定的連接體的、與銜接子1互補(bǔ)的引物雜交。用聚合酶進(jìn)行引物延伸反應(yīng)。使第一接受體陣列表面與模板陣列接觸,并將該連接體結(jié)合至其表面。將兩個(gè)表面分開(kāi),并且該接受體陣列含有5’-3’朝向的部分長(zhǎng)度和全長(zhǎng)產(chǎn)物兩者。將寡核苷酸與還含有可固定的連接體的、與銜接子2互補(bǔ)的引物雜交。用聚合酶進(jìn)行引物延伸反應(yīng)。使第二接受體陣列表面與第一接受體(現(xiàn)在為模板)陣列接觸,并將該連接體結(jié)合至其表面。將兩個(gè)表面分開(kāi),并且該第二接受體陣列主要含有5’-3’朝向的全長(zhǎng)產(chǎn)物。
實(shí)施例5-采用結(jié)合引物對(duì)長(zhǎng)dna分子的標(biāo)記和測(cè)序
制備dna提取物的溶液,其包含約4mb長(zhǎng)的模板dna分子的長(zhǎng)片段。通過(guò)分子梳理使模板dna拉伸到包含納米通道特征的載玻片上。將游離引物添加至拉伸的模板dna分子,每個(gè)游離引物均包含隨機(jī)六聚體序列和引物結(jié)合位點(diǎn)序列。游離引物通過(guò)其隨機(jī)六聚體區(qū)域結(jié)合在沿著模板dna分子的不同位置。提供了具有凝膠涂層的基底,該凝膠涂層包含結(jié)合引物的空間限定的陣列。每個(gè)與陣列結(jié)合的引物均具有與引物結(jié)合位點(diǎn)序列互補(bǔ)的銜接子序列、核酸擴(kuò)增引物序列以及條形碼序列,其中給定陣列斑點(diǎn)中的所有引物共享對(duì)該區(qū)域獨(dú)特的條形碼序列。該銜接子序列與該引物結(jié)合位點(diǎn)序列雜交。進(jìn)行延伸反應(yīng)以生成模板dna分子的區(qū)域(片段)的拷貝,其中該延伸反應(yīng)從與陣列結(jié)合的引物上的核酸擴(kuò)增引物序列處開(kāi)始,并將條形碼序列并入到所得的延伸產(chǎn)物中。產(chǎn)生了含有條形碼序列以及與該模板dna分子的區(qū)域互補(bǔ)的序列的與陣列結(jié)合的延伸產(chǎn)物。將延伸產(chǎn)物組裝成測(cè)序文庫(kù)并測(cè)序。通過(guò)條形碼信息來(lái)輔助序列讀取的比對(duì)和組裝,并產(chǎn)生了完整的4mb模板dna序列。
實(shí)施例6-采用轉(zhuǎn)座子位點(diǎn)對(duì)長(zhǎng)dna分子的標(biāo)記和測(cè)序
制備dna提取物的溶液,其包含約4mb長(zhǎng)的模板dna分子的長(zhǎng)片段。將引物結(jié)合位點(diǎn)通過(guò)轉(zhuǎn)座子整合以平均500bp間隔添加至模板dna分子中。通過(guò)分子梳理使該模板dna拉伸到包含納米通道特征的載玻片(第一基底)上。提供了具有凝膠涂層的第二基底。該凝膠涂層包含結(jié)合引物的空間限定的陣列。每個(gè)與陣列結(jié)合的引物均具有與引物結(jié)合位點(diǎn)序列互補(bǔ)的銜接子序列、核酸擴(kuò)增引物序列(例如,pcr引物序列)和條形碼序列。給定陣列斑點(diǎn)或區(qū)域中的所有引物共享對(duì)該區(qū)域獨(dú)特的條形碼序列。與陣列結(jié)合的引物與先前整合到模板dna分子中的引物結(jié)合位點(diǎn)雜交。進(jìn)行延伸反應(yīng)以生成模板dna分子(或其互補(bǔ)體)的區(qū)域的多個(gè)拷貝,該延伸反應(yīng)采用與陣列結(jié)合的引物的核酸擴(kuò)增(例如,pcr)引物序列開(kāi)始于5’端,接下來(lái)并入條形碼序列,接著并入引物結(jié)合位點(diǎn)序列,并隨后延伸以將模板核酸序列并入到所得的延伸產(chǎn)物中。因此,產(chǎn)生了包含條形碼序列以及與該模板dna分子的區(qū)域互補(bǔ)的序列的與陣列結(jié)合的延伸產(chǎn)物。將延伸產(chǎn)物組裝成測(cè)序文庫(kù)并測(cè)序。通過(guò)條形碼信息來(lái)輔助序列讀取的比對(duì)和組裝,并產(chǎn)生了完整的4mb模板dna序列。
實(shí)施例7-延伸產(chǎn)物的pcr擴(kuò)增
使用包含與陣列結(jié)合的引物區(qū)的引物基底生成延伸產(chǎn)物的陣列。每個(gè)延伸產(chǎn)物均包含與模板核酸分子互補(bǔ)的核酸的一部分,以及pcr引物序列和位置編碼的條形碼序列。對(duì)于給定陣列斑點(diǎn)或區(qū)域中的所有產(chǎn)物,條形碼序列是相同的。引入了pcr引物,其在一端的pcr引物序列處,通過(guò)在另一端的隨機(jī)六聚體結(jié)合序列與延伸產(chǎn)物雜交。進(jìn)行pcr以擴(kuò)增該延伸產(chǎn)物。對(duì)包含模板核酸序列以及與條形碼序列互補(bǔ)的序列的pcr擴(kuò)增產(chǎn)物進(jìn)行測(cè)序。在位置條形碼信息的幫助下比對(duì)序列讀取。
實(shí)施例8-對(duì)rna分子的標(biāo)記和測(cè)序
制備了包含rna分子片段的rna提取物溶液。通過(guò)分子梳理使rna拉伸到包含納米通道特征的載玻片上。將游離(即,非陣列結(jié)合的)引物添加到拉伸的rna分子,每個(gè)游離引物均包含隨機(jī)六聚體序列和引物結(jié)合位點(diǎn)序列。游離引物通過(guò)其隨機(jī)六聚體區(qū)域雜交在沿著拉伸的rna分子的不同位置。提供了具有如實(shí)施例1中所述制備的凝膠涂層的基底,該凝膠涂層包含在其5’端處粘附于陣列表面的引物的空間限定陣列。每個(gè)與陣列結(jié)合的引物從3’到5’具有與游離引物上的引物結(jié)合位點(diǎn)序列互補(bǔ)的銜接子序列、條形碼序列以及核酸擴(kuò)增引物序列,其中給定陣列斑點(diǎn)或區(qū)域中的所有引物共享對(duì)該區(qū)域獨(dú)特的位置條形碼序列。銜接子序列與游離引物的引物結(jié)合位點(diǎn)序列雜交,其中該游離引物與rna分子雜交。用逆轉(zhuǎn)錄酶進(jìn)行延伸反應(yīng),以產(chǎn)生該rna分子的區(qū)域或片段的拷貝。該延伸反應(yīng)從引物上的核酸擴(kuò)增引物序列處開(kāi)始,并將條形碼序列并入到所得的延伸產(chǎn)物中。產(chǎn)生了含有條形碼序列以及與該rna分子的區(qū)域互補(bǔ)的序列的延伸產(chǎn)物,并且將該延伸產(chǎn)物結(jié)合至基底。將延伸產(chǎn)物組裝成測(cè)序文庫(kù)。為了生成測(cè)序文庫(kù),添加非基底結(jié)合的引物以與陣列結(jié)合的延伸產(chǎn)物結(jié)合,并且將該引物用于延伸反應(yīng)。產(chǎn)生了含有與陣列結(jié)合的延伸產(chǎn)物的一部分以及條形碼序列或其互補(bǔ)體的非陣列結(jié)合的延伸產(chǎn)物。非基底結(jié)合的引物包含含有限定序列的尾部區(qū)段,該限定序列不與陣列結(jié)合的延伸產(chǎn)物中的序列互補(bǔ),并因此不與該陣列結(jié)合的延伸產(chǎn)物雜交。該限定序列包含與illuminangs測(cè)序系統(tǒng)相容的銜接子和擴(kuò)增引物序列。因此,該非陣列結(jié)合的延伸產(chǎn)物包含用于illuminahiseq2500系統(tǒng)的序列,并因此采用該illuminahiseq2500系統(tǒng)進(jìn)行測(cè)序。
通過(guò)條形碼信息來(lái)輔助序列讀取的比對(duì)和組裝,并通過(guò)在計(jì)算機(jī)中組裝該序列讀取產(chǎn)生完整的rna序列。對(duì)于從新基因獲得的序列讀取,采用了可用于從頭組裝的軟件。用于從頭組裝的軟件是可公開(kāi)獲得的軟件(例如,abyss、trans-abyss、trinity、ray、contrail)或商業(yè)軟件(例如,clcbiogenomicsworkbench)。對(duì)于從重新測(cè)序獲得的序列讀取,采用了用于重新測(cè)序組裝的軟件。所采用的軟件與illumnia系統(tǒng)兼容,如bwa、bwa-mem、novoalign、tophat、splicemap、mapsplice、abmapper或erne-map(rna)。
實(shí)施例9-寡核苷酸固定化轉(zhuǎn)移
根據(jù)以下方案進(jìn)行寡核苷酸固定化轉(zhuǎn)移(oit):
將引物與模板表面雜交并延伸:a)將200ul的500nmacr-fc1引物在55℃下在gracehyb室中溫育1小時(shí)。b)用4xssc(2次)、2xssc(2次)漂洗。c)在grace室(200ul)中將引物用bst延伸,37℃下10min+55℃下20min。用38ulh2o、5ul10xthermopol、5ulbsa(10mg/ml)、1uldntps(10mm)、1ulbst(8u/ul)制備bst混合物。d)用4xssc(2次)、2xssc(2次)漂洗。
用h2o(0.50ml)、明膠(0.10mg)、丙烯酰胺(60.00mg)、雙丙烯酰胺(3.20mg)制備2x濃度的凝膠混合物。通過(guò)將50ul的2x丙烯酰胺混合物與50ul的2xssc合并來(lái)制備主混合物(mastermix)。
丙烯酰胺凝膠的活化(每種活化劑最終濃度=0.065%):a)每100ul反應(yīng)添加1.3ul的5%過(guò)硫酸銨。b)每100ul反應(yīng)添加1.3ul的5%temed。c)渦旋。
薄凝膠的聚合:a)將20ul的凝膠混合物用移液管移至模板玻璃上。b)用硅烷化的玻璃芯片(受體表面)面朝下覆蓋模板,并按壓以得到均勻無(wú)氣泡的鋪展。c)使其聚合10-15分鐘。
變性/分離:a)將結(jié)合的芯片放置在1xte浴中并將其加熱至65℃。b)用剃刀將表面拉下。凝膠應(yīng)留在芯片側(cè)上。
成像:a)將來(lái)自模板表面的任何剩余的acr-fc1在0.1nnaoh中變性3分鐘。b)用4xssc(3次)、2xssc(3次)漂洗。c)在芯片側(cè)上與sp2-cy3寡核苷酸(500nm)在55℃下雜交45min。使用具有濃nacl溶液的濕度室(74%rh)。d)在模板側(cè)上與fc2-qc-cy3寡核苷酸(500nm)在55℃下雜交1小時(shí)。e)用4xssc(3次)、2xssc(3次)漂洗。f)采用落射熒光顯微鏡對(duì)凝膠或模板進(jìn)行成像。