国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      雙鏈核酸的合成的制作方法

      文檔序號(hào):12285399閱讀:2326來源:國知局
      雙鏈核酸的合成的制作方法與工藝

      發(fā)明背景

      核酸的大規(guī)模平行測序(Massive parallel sequencing,MPS)需要制備擴(kuò)增文庫,其中待測序的DNA區(qū)域位于已知的5’-和3’-末端序列之間。用于MPS文庫構(gòu)建的當(dāng)前方法利用RNA或DNA接頭(adaptor)連接到RNA或DNA樣品的5’和3’末端。接頭的連接不僅耗時(shí),而且是需要以微克級(jí)輸入(microgram inputs)核酸樣品的低效率過程。此外,所得cDNA文庫受到接頭交叉和自我連接副產(chǎn)物污染,并且在預(yù)擴(kuò)增之前和之后需要額外的純化步驟。十多年前,Clontech實(shí)驗(yàn)室描述了利用莫洛尼鼠白血病病毒逆轉(zhuǎn)錄酶(MMLV-RT)的模板轉(zhuǎn)換活性選擇地將接頭連接至由聚(A)加尾的mRNA分子產(chǎn)生cDNA的5’-末端的方法。同時(shí),將3’-接頭序列并入聚(dT)逆轉(zhuǎn)錄引物中。這種稱為SMART的原理目前用于Illumina Ultra Low RNA測序試劑盒(Clontech)中以從單個(gè)細(xì)胞產(chǎn)生mRNA分子的全長cDNA拷貝。然而,該方法仍然需要在模板合成后進(jìn)行:(1)擴(kuò)增的cDNA的片段化,(2)平臺(tái)特異性5’/3’-端接頭的連接和(3)接頭連接的DNA片段的預(yù)擴(kuò)增。雖然SMART方法能夠從單細(xì)胞量的RNA制備用于測序的cDNA,但是其耗時(shí)、昂貴并且限于mRNA測序。到目前為止,使用MMLV-RT的模板轉(zhuǎn)換活性的方法還沒有應(yīng)用于對(duì)(1)除長RNA之外的RNA分子和(2)任何DNA分子進(jìn)行測序。本發(fā)明描述了在僅幾小時(shí)的時(shí)間范圍內(nèi)從皮克(pg)量的RNA或DNA分子產(chǎn)生即時(shí)可測序的雙鏈或單鏈DNA,優(yōu)選DNA文庫的方法。小的(<150bp)RNA或DNA(例如miRNA(微小RNA)、piRNA(piwiRNA)、降解的或亞硫酸氫鹽轉(zhuǎn)化的DNA)可直接用作輸入。然而,長的RNA或DNA必須首先通過相應(yīng)的方法(例如,對(duì)于DNA進(jìn)行超聲處理或?qū)τ赗NA進(jìn)行Mg2+孵育)片段化。本發(fā)明的方法提供了若干優(yōu)點(diǎn),其包括明顯降低提供即時(shí)可測序DNA(其可基于DNA或RNA)所需的時(shí)間,所述方法與任何現(xiàn)有技術(shù)方法相比,明顯成本更低。目前用于RNA和DNA的新一代測序之cDNA文庫制備的商業(yè)試劑盒,根據(jù)應(yīng)用、試劑盒類型和供應(yīng)商品牌,樣品定價(jià)在200至500美元之間。使用本發(fā)明的方法進(jìn)行單個(gè)DNA文庫制備所需的成本的粗略估計(jì)至少低20倍,并且本發(fā)明的方法將允許對(duì)來自由于可從樣品獲得最小量的DNA和/或RNA之前不可能測序來源的核酸進(jìn)行測序。那些樣品的實(shí)例包括:來自小(診斷)量的液體和固體活檢樣品的DNA和RNA、細(xì)胞的靶區(qū)室(例如,微核、內(nèi)質(zhì)網(wǎng))、化石、滅絕生物體的殘余物和含有微小和高度片段化的DNA分子的法醫(yī)學(xué)樣品。本發(fā)明在一定程度上基于這樣的發(fā)現(xiàn),即DNA也可作為逆轉(zhuǎn)錄酶的底物。



      技術(shù)實(shí)現(xiàn)要素:

      在第一方面,本發(fā)明提供了用于從包含單鏈核酸的樣品合成具有限定的3’和5’端核苷酸序列的雙鏈核酸的方法,所述方法包括以下步驟:

      a)提供包含單鏈核酸或雙鏈核酸的樣品,任選地使所述雙鏈核酸變性;

      b)向單鏈核酸或雙鏈核酸的3’-端添加至少5個(gè),優(yōu)選10至50個(gè)連續(xù)的核苷酸,

      c)使與所添加核苷酸序列互補(bǔ)的引發(fā)寡核苷酸雜交并用模板依賴性DNA或RNA聚合酶合成cDNA或cRNA以產(chǎn)生雙鏈核酸,

      d)使模板轉(zhuǎn)換寡核苷酸(TSO)與所述雙鏈核酸雜交,以及

      e)使cDNA或cRNA鏈的3’末端延伸以合成雙鏈核酸,其中所述核酸的一條鏈包含所述引發(fā)寡核苷酸以及與所述單鏈核酸和所述模板轉(zhuǎn)換寡核苷酸互補(bǔ)的cDNA或cRNA。

      在第二方面,本發(fā)明提供了包含以下序列元件的引發(fā)寡核苷酸:

      3’-Wm-X-Yn-Z1o-Qt-Z2s-5’,

      其中

      W在每種情況下獨(dú)立地選自:dA、dG、dC、dT和dU;

      X選自:dA、dG、dC、dT、dU、rA、rG、rC、rT和rU;

      Y是至少10個(gè)核苷酸長度的多核苷酸,其中所述序列的80%或更多由選自以下的相同的核苷酸或二核苷酸構(gòu)成:dA、dG、dC、dT、dU、rA、rG、rC、rT、rU、AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和UT,其中所述序列的另外至多20%或更少由不同于主要核苷酸或二核苷酸并且也選自以下的核苷酸或二核苷酸構(gòu)成:dA、dG、dC、dT、dU、rA、rG、rC、rT、rU、AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和/或UT,前提條件是X不同于構(gòu)成Y大部分的核苷酸或二核苷酸;

      Q是連續(xù)的簡并(擺動(dòng))DNA堿基的序列,優(yōu)選地選自:N、V、H、D、B和J,其中N是并入來自dA、dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;B是并入來自dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;D是并入來自dA、dT和dG等摩爾混合物的核苷酸的產(chǎn)物;H是并入來自dA、dT和dC等摩爾混合物的核苷酸的產(chǎn)物;V是并入來自dA、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,J是并入來自(0-100%dA)比(0-100%dG)比(0-100%dC)比(0-100%dT)比(0-100%dU)比(0-100%rA)比(0-100%rG)比(0-100%rC)比(0-100%rT)比(0-100%rU)的混合物的核苷酸的產(chǎn)物;

      Z1是限定序列的至少5個(gè)核苷酸長度的多核苷酸,其中所述序列不同于Wm-X-Yn,優(yōu)選地所述序列也不同于Qt-Z2s;

      Z2是限定序列的至少5個(gè)核苷酸長度的多核苷酸,其中所述序列不同于Wm-X-Yn-Z1o-Qt;

      m是0至6的整數(shù),即0、1、2、3、4、5或6;

      如果Y選自dA、dG、dC、dT、dU、rA、rG、rC、rT和rU,則n是10至100的整數(shù),如果Y選自AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和UT,則n是5至50的整數(shù);

      o是0或1;

      s是0或1;并且

      t是0至6的整數(shù),即0、1、2、3、4、5或6。

      在第三方面,本發(fā)明提供了包含以下序列元件的模板轉(zhuǎn)換寡核苷酸

      5’-Xp-Y-Qt-Zq-Ar-3’

      其中

      X是選自氨基、生物素、甘油、膽固醇、地高辛、氟殘基或核苷酸衍生物的化學(xué)基團(tuán),所述核苷酸衍生物包括脫堿基核苷酸、雙脫氧核糖核苷酸、3’-脫氧核苷酸、2’-脫氧肌苷、2’-脫氧尿苷;

      Y是已知的寡核苷酸序列;

      Q是連續(xù)的簡并(擺動(dòng))DNA堿基的序列,優(yōu)選地選自:N、V、H、D、B和J,其中N是并入來自dA、dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;B是并入來自dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;D是并入來自dA、dT和dG等摩爾混合物的核苷酸的產(chǎn)物;H是并入來自dA、dT和dC等摩爾混合物的核苷酸的產(chǎn)物;V是并入來自dA、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,J是并入來自(0-100%dA)比(0-100%dG)比(0-100%dC)比(0-100%dT)比(0-100%dU)比(0-100%rA)比(0-100%rG)比(0-100%rC)比(0-100%rT)比(0-100%rU)的混合物的核苷酸的產(chǎn)物;

      Z是選自AMP、CMP、GMP、TMP和UMP的核糖核苷酸,

      A是選自氨基、生物素、甘油、膽固醇、地高辛、磷酸/鹽/酯、氟殘基或核苷酸衍生物的化學(xué)基團(tuán),所述核苷酸衍生物包括脫堿基核苷酸、雙脫氧核糖核苷酸、3’-脫氧核苷酸、2’-脫氧肌苷、2’-脫氧尿苷;

      t是0至6的整數(shù),即0、1、2、3、4、5或6;

      p是0至10的整數(shù),即0、1、2、3、4、5、6、7、8、9或10;

      q是至少為1的整數(shù);并且

      r是0至10的整數(shù),即0、1、2、3、4、5、6、7、8、9或10。

      在第四方面,本發(fā)明提供了包含本發(fā)明第二方面的引發(fā)寡核苷酸的核酸。

      在第五方面,本發(fā)明提供了試劑盒,其包含:

      a)能夠向單鏈核酸的3’-端添加核苷酸的試劑,優(yōu)選酶,更優(yōu)選聚(A)聚合酶或末端轉(zhuǎn)移酶(terminal transferase,TT)以及任選嵌段核苷酸,優(yōu)選3d-NTP、3-Me-NTP和ddNTP,

      b)逆轉(zhuǎn)錄酶,

      c)根據(jù)第二方面的引發(fā)寡核苷酸,和

      d)根據(jù)第三方面的模板轉(zhuǎn)換寡核苷酸。

      在第六方面,本發(fā)明提供了包含至少一種核酸的陣列,所述核酸包含本發(fā)明第四方面的引發(fā)寡核苷酸。

      在第七方面,本發(fā)明提供所述試劑盒和合成的雙鏈核酸在以下方面的用途:個(gè)體化醫(yī)療;治療監(jiān)測;人或動(dòng)物疾病的預(yù)測、預(yù)后、早期檢測或法醫(yī)學(xué);病毒、細(xì)菌、動(dòng)物或植物或由其來源的細(xì)胞的核酸序列的分析。

      附圖說明

      在下文中,描述了包含在本說明書中的附圖的內(nèi)容。在這種情況下,還請參考上文和/或下文的本發(fā)明的詳細(xì)描述。

      圖1:使用聚A(dA)加尾和MMLV-RT的模板轉(zhuǎn)換能力的組合之cDNA制備方法的示意圖。簡言之,用聚(A)聚合酶或末端脫氧轉(zhuǎn)移酶將短的單鏈RNA或DNA片段聚腺苷酸化或聚脫氧腺苷酸化。然后,在含有定制的3’-接頭序列的錨定的聚(dT)寡核苷酸的存在下進(jìn)行互補(bǔ)DNA鏈合成。任選地,寡核苷酸在其3’末端(prime end)包含三個(gè)不同的核苷酸,即,C,G或A(=圖1的示意圖中的V)。當(dāng)逆轉(zhuǎn)錄酶到達(dá)RNA(或DNA)模板的5’末端時(shí),酶的末端轉(zhuǎn)移酶活性添加不由模板編碼的額外的核苷酸(主要是dC)。在下一步驟中,含有三個(gè)末端rG核苷酸和定制5’-接頭序列的模板轉(zhuǎn)換寡核苷酸被添加到RT反應(yīng)中并用作逆轉(zhuǎn)錄酶的第二模板。認(rèn)為在TSO的3’末端的三個(gè)連續(xù)的rG核苷酸與富含dC的cDNA的延伸序列的互補(bǔ)相互作用促進(jìn)模板轉(zhuǎn)換。在標(biāo)準(zhǔn)PCR反應(yīng)的第一個(gè)循環(huán)期間由與第一cDNA鏈的3’-端完全或部分互補(bǔ)的正向引物產(chǎn)生第二cDNA鏈。此外,用于cDNA的PCR擴(kuò)增的反向引物(與正向引物一起)與第二cDNA鏈的3’-端完全或部分互補(bǔ)。

      圖2:為了構(gòu)建適于Illumina MiSeq或HiSeq平臺(tái)的DNA文庫,我們使用來自NEBnext Small RNA測序試劑盒(New England Biolabs)的接頭序列。將對(duì)應(yīng)于5’-接頭的序列并入TSO中,并使用3’-接頭序列來設(shè)計(jì)聚(dT)引物的末端標(biāo)簽(圖2A)。使用1ng或5pg的22nt RNA和DNA作為DNA文庫制備的輸入(圖2B)。對(duì)于DNA和RNA,cDNA合成的效力相同。當(dāng)使用1ng的核酸時(shí),在17輪PCR預(yù)擴(kuò)增循環(huán)后(1/100cDNA進(jìn)行PCR稀釋)出現(xiàn)單個(gè)PCR產(chǎn)物。當(dāng)使用5pg的核酸作為輸入時(shí),預(yù)擴(kuò)增cDNA所需的PCR循環(huán)數(shù)量增加至26。當(dāng)使用10/100cDNA進(jìn)行PCR稀釋時(shí),產(chǎn)生DNA文庫所需的循環(huán)數(shù)量成比例地減少(數(shù)據(jù)未示出)。反應(yīng)中唯一的污染副產(chǎn)物是過量的PCR引物,其大部分可通過柱純化除去。Sanger測序已進(jìn)一步證實(shí)了由合成的短DNA制備的cDNA是純的(數(shù)據(jù)未示出)。

      圖3:DNA文庫制備方案I的關(guān)鍵參數(shù)。首先,聚(A)加尾反應(yīng)對(duì)于cDNA的最佳產(chǎn)量是至關(guān)重要的。過長的聚(A)尾部將最終降低聚(dT)引物的有效濃度,這不僅降低cDNA的量,而且導(dǎo)致凝膠上具有更大的副產(chǎn)物的污點(diǎn),因?yàn)榫?dT)引物將與聚(A)尾部內(nèi)的多個(gè)位點(diǎn)雜交。圖3A在上方的圖中示出了使用不同的孵育時(shí)間和ATP濃度之聚(A)加尾的1ng cel-miR-39進(jìn)行3%瓊脂糖凝膠電泳后獲得的電泳圖。下方的圖示出了使用100nM ILPdTPo由1ng相應(yīng)的聚(A)加尾的cel-miR-39產(chǎn)生的DNA文庫進(jìn)行3%瓊脂糖凝膠電泳后獲得的電泳圖。在圖3B中,示出了在使用100nM單堿基錨定的聚dT引物(ILPdTPo)或100nM雙堿基錨定的聚dT引物(ILPcTPt)由1ng的cel-miR-39(使用不同濃度的ATP進(jìn)行聚(A)加尾10分鐘)產(chǎn)生的DNA文庫進(jìn)行3%瓊脂糖凝膠電泳后獲得的電泳圖。圖3C示出了在使用不同品牌的MMLV-RT以及使用1μM或0.1μM的TSO8由1ng的cel-miR-39(使用0.1mM ATP聚(A)加尾10分鐘)產(chǎn)生的DNA文庫進(jìn)行3%瓊脂糖凝膠電泳后獲得的電泳圖。上圖:cDNA的PCR擴(kuò)增進(jìn)行17個(gè)循環(huán)。下圖:cDNA的PCR擴(kuò)增進(jìn)行21個(gè)循環(huán)。10分鐘聚(A)加尾時(shí)間和最終為0.1mM的ATP得到22nt RNA克隆的最佳結(jié)果。其次,MMLV-RT的供應(yīng)商和品牌似乎對(duì)該方法的靈敏度至關(guān)重要。因此,在6家商用MMLV-RT中,SuperScribe II(Invitrogen)、SMARTScribe RT(Clontech)和SMART RT(Clontech)在用當(dāng)前方案預(yù)擴(kuò)增后最有效地提供可檢測量的cDNA,而SuperScribe III Invitrogen)、Multiscribe RT(Applied Biosystems)和來自NEB的M-MLV需要4個(gè)額外的預(yù)擴(kuò)增循環(huán)以使DNA文庫在瓊脂糖凝膠上可見(圖3C)。這種現(xiàn)象可通過不同的MMLV-RT變體可能具有不同的RNA酶H和末端轉(zhuǎn)移酶活性(后者被認(rèn)為促進(jìn)模板轉(zhuǎn)換反應(yīng))的事實(shí)來解釋。因此,優(yōu)選選擇具有RNA酶H活性的RT。

      圖4:cDNA文庫方案II的關(guān)鍵參數(shù)。示出了在使用1μM的終濃度的不同模板轉(zhuǎn)換寡核苷酸(TSO)由1ng的cel-miR-39(使用0.1mM ATP聚(A)加尾10分鐘)產(chǎn)生的DNA文庫進(jìn)行3%瓊脂糖凝膠電泳后獲得的電泳圖。上圖:cDNA的PCR擴(kuò)增進(jìn)行17個(gè)循環(huán)。下圖:cDNA的PCR擴(kuò)增進(jìn)行21個(gè)循環(huán)(圖4A)。TSO的結(jié)構(gòu)似乎對(duì)該方法的靈敏度和性能至關(guān)重要。純DNA和純RNA TSO兩者在17個(gè)循環(huán)的預(yù)擴(kuò)增PCR后均未能產(chǎn)生任何足夠量的靶向cDNA。這可通過以下事實(shí)來解釋:三個(gè)鳥嘌呤核糖核酸(riboG)序列對(duì)模板轉(zhuǎn)換的親和力比三個(gè)鳥嘌呤脫氧核糖強(qiáng)得多,而純RNA寡核苷酸傾向于形成明顯的二級(jí)結(jié)構(gòu),所述二級(jí)結(jié)構(gòu)減少了3’-端的可用性。此外,當(dāng)使用具有四個(gè)而不是三個(gè)末端鳥嘌呤核糖核苷酸的TSO時(shí),cDNA的產(chǎn)量顯著降低(圖4A),推測是因?yàn)樗膫€(gè)連續(xù)的G能夠形成四鏈體結(jié)構(gòu)(quadruplex structure)。還測試了選擇封閉TSO的末端3-OH基團(tuán)以防止當(dāng)聚(A)聚合酶沒有完全失活時(shí)其可能發(fā)生的聚(A)加尾。盡管大腸桿菌(E.coli)聚(A)聚合酶在RT反應(yīng)完成之前在65℃下熱失活20分鐘,但在以下情況下要強(qiáng)制使用3-OH封閉的TSO:(1)聚(A)加尾和RT同時(shí)進(jìn)行或(2)RNA的聚(A)加尾不能被熱滅活。出乎意料地,用單磷酸或生物素封閉TSO的3-OH末端在所使用的條件下消除了有效的cDNA合成(圖4A)。然而,當(dāng)用磷酸酯或雙脫氧胞苷(ddC)封閉TSO的3-OH基團(tuán)時(shí),在四個(gè)PCR循環(huán)后出現(xiàn)類似量的cDNA產(chǎn)物。在圖4B中,示出了在使用5’端未封閉的TSO3或5’-生物素封閉的TSO8由1ng的cel-miR-39(使用0.1mM ATP聚(A)加尾10分鐘)產(chǎn)生的DNA文庫進(jìn)行4%瓊脂糖凝膠電泳(左)和Agilent Bioanalyser(右)后獲得的電泳圖。注意~30bp更長的DNA文庫的小部分,其可能對(duì)應(yīng)于第二模板轉(zhuǎn)換事件的產(chǎn)物(白色箭頭)。

      圖5:DNA文庫制備方案III的關(guān)鍵參數(shù)。圖A:示出了由1ng的不同的模板cel-miR-39寡核苷酸(使用0.1mM ATP對(duì)RNA進(jìn)行聚(A)加尾10分鐘;使用0.1mM ATP對(duì)DNA進(jìn)行聚(dA)加尾30分鐘)產(chǎn)生的DNA文庫進(jìn)行3%瓊脂糖凝膠電泳后獲得的電泳圖。與5’-OH或5’-磷酸模板相比,由含有5’-生物素的DNA模板合成DNA文庫的效力顯著更低。圖B:示出了使用水或20%DMSO(最終反應(yīng)中5%)作為RT反應(yīng)的介質(zhì)由1ng的cel-miR-39RNA(使用0.1mM ATP聚(A)加尾10分鐘)產(chǎn)生的DNA文庫進(jìn)行3%瓊脂糖凝膠電泳后獲得的電泳圖。DMSO的加入不干擾DNA文庫制備的效力。

      圖6:由人RNA和DNA制備DNA文庫。圖A:由1ng的對(duì)照cel-miR-39(C39R)和1ng分離自U2OS細(xì)胞的富含聚(A)的RNA(其通過用鎂離子孵育10分鐘片段化)(R10)產(chǎn)生的DNA文庫進(jìn)行4%瓊脂糖凝膠電泳(左)后獲得的電泳圖。此外,由聚(A)加尾(-RNK標(biāo)記的)之前沒有用T4PNK預(yù)處理的R10樣品產(chǎn)生一個(gè)DNA文庫。在電泳圖下方對(duì)于每個(gè)樣品示出了用于cDNA文庫的預(yù)擴(kuò)增的PCR循環(huán)的數(shù)目和聚(dT)反向引物(ILPdTPo)的濃度。從瓊脂糖凝膠上切下在Illumina MiSeq上測序的DNA文庫,通過PureLink凝膠純化試劑盒分離并通過Agilent Bioanalyser高靈敏度DNA芯片(右)進(jìn)行分析。圖B:左:示出了由來自U2OS細(xì)胞的約3ng亞硫酸氫鹽轉(zhuǎn)化的DNA產(chǎn)生的DNA文庫進(jìn)行3%瓊脂糖凝膠電泳后獲得的電泳圖(圖6B)。此外,由聚(dA)反應(yīng)之前用T4PNK預(yù)處理的B樣品產(chǎn)生一個(gè)DNA文庫(+RNK標(biāo)記的)。在陰性對(duì)照文庫中,使用1μL水(H2O)。右:示出了由1ng的來自U2OS細(xì)胞的富含聚(A)的RNA(其通過用鎂離子孵育5分鐘片段化)(R5)、亞硫酸氫鹽轉(zhuǎn)化的DNA(B)和1ng對(duì)照的cel-miR-39 RNA(C39R)產(chǎn)生的凝膠純化的DNA文庫之Agilent Bioanalyser電泳圖。圖C:由分離自兩個(gè)健康供體(DI和DII)的約150pg的人血漿DNA產(chǎn)生的DNA文庫進(jìn)行4%瓊脂糖凝膠電泳(左)和Agilent Bioanalyser(右)后獲得的電泳圖。在對(duì)照實(shí)驗(yàn)中,使用水(H2O)或1ng的合成cel-miR-39DNA(C39D)。在電泳圖下方對(duì)于每個(gè)樣品示出了用于cDNA文庫的預(yù)擴(kuò)增的PCR循環(huán)數(shù)目和聚(dT)反向引物(ILPdTPo)的濃度。圖D:由分離自兩個(gè)健康供體(RI和RII)的約200pg的人血漿RNA產(chǎn)生的DNA文庫進(jìn)行4%瓊脂糖凝膠電泳后獲得的電泳圖。在對(duì)照實(shí)驗(yàn)中,使用水(H2O)或1ng的合成cel-miR-39 RNA(C39R)。此外,由聚(A)加尾(-RNK標(biāo)記的)之前未用T4 PNK預(yù)處理的循環(huán)RNA樣品產(chǎn)生DNA文庫。在電泳圖下方對(duì)于每個(gè)樣品示出了用于cDNA文庫的預(yù)擴(kuò)增的PCR循環(huán)數(shù)目和聚(dT)反向引物(ILPdTPo)的濃度。由瓊脂糖凝膠純化來自兩個(gè)個(gè)體的循環(huán)血漿RNA的DNA文庫,但是,僅RI文庫在Illumina MiSeq上進(jìn)行測序。

      圖7:根據(jù)引發(fā)寡核苷酸的序列,在一個(gè)測序通道中多重樣品文庫索引讀取的準(zhǔn)確度。示出了根據(jù)用于產(chǎn)生雙鏈核酸的引發(fā)寡核苷酸的序列組成,更精確地根據(jù)與在該方法的先前步驟中所產(chǎn)生的聚(A)尾部互補(bǔ)的部分以零錯(cuò)誤和一個(gè)錯(cuò)誤鑒定的索引讀取的各個(gè)比率。使用所示的四種不同引發(fā)寡核苷酸和每種寡核苷酸的兩個(gè)重復(fù),由相同量(1ng)的輸入來源材料(人基因組DNA)平行地產(chǎn)生8個(gè)DNA片段文庫。將8個(gè)所得的文庫用適當(dāng)?shù)囊镞M(jìn)行預(yù)擴(kuò)增以用于在目前的Illumina測序系統(tǒng)上進(jìn)行多重測序,每個(gè)反向引物包括不同的索引序列,其用于確定所鑒定的讀數(shù)的來源文庫。所使用的索引序列對(duì)應(yīng)于Illumina索引序列1-8,并且每個(gè)索引序列在至少3個(gè)位置與所有其他索引序列不同。匯集等摩爾量的各個(gè)文庫,并在Illumina MiSeq系統(tǒng)上在一個(gè)泳道上進(jìn)行單端測序,針對(duì)讀取#1以70個(gè)循環(huán),針對(duì)索引讀取以6個(gè)循環(huán)。對(duì)于具有不同的索引序列的8個(gè)文庫中的每一個(gè),記錄不含錯(cuò)誤或含有1個(gè)錯(cuò)誤的索引序列讀取的相應(yīng)數(shù)量。以0或1個(gè)錯(cuò)誤描繪了分別用四種不同類型的引發(fā)寡核苷酸中的每一種產(chǎn)生的兩個(gè)文庫之索引序列讀取的平均頻率值,誤差條表示平均值與單個(gè)文庫的值的差異。顯然,與“30A”引發(fā)寡核苷酸相比,使用引發(fā)寡核苷酸“20G”使得索引讀取序列的精確性顯著增加,同時(shí)維持相同效率的DNA片段文庫產(chǎn)生。

      圖8:在DNA和RNA模板上可控的與非可控的多核苷酸加尾的優(yōu)點(diǎn)。

      證明了可控的聚(A)加尾和聚(dA)加尾對(duì)由合成cel-miR-39DNA(左)和cel-miR-39RNA(右)產(chǎn)生的cDNA的產(chǎn)量的有益效果的實(shí)例。使用相同濃度的RT引物和/或當(dāng)溶液中ATP的濃度為次優(yōu)時(shí),可控的聚(A)和聚(dA)加尾使得更有效地產(chǎn)生文庫。如果ATP(或dATP)與RNA(或DNA)模板的比率高于最佳,則會(huì)產(chǎn)生長(>300nt)尾部。長的多核苷酸尾部降低了聚(dT)引物的有效濃度,降低了文庫的產(chǎn)量并在凝膠上產(chǎn)生較大的副產(chǎn)物的污點(diǎn),原因是過量的聚(dT)引物與大的聚(A)尾部內(nèi)的位點(diǎn)雜交。A:在1ng的cel-miR-39 DNA模板進(jìn)行聚(dA)加尾并且使用10nM的聚(dT)反向引物(ILPdTPo)在封閉ddATP核苷酸(dATP/ddATP比1/50)存在(C)或不存在(NC)的情況下獲得的DNA文庫進(jìn)行3%瓊脂糖凝膠電泳后的電泳圖。注意,使用相同濃度的反向引物在可控的聚(dA)加尾后實(shí)現(xiàn)顯著更高的文庫產(chǎn)量。B:在封閉3d-ATP核苷酸(ATP/3d-ATP比1/30)存在(C)或不存在(NC)的情況下,1ng的cel-miR-39 RNA模板的聚(A)加尾后獲得的DNA文庫在進(jìn)行3%瓊脂糖凝膠電泳后獲得的電泳圖。注意,ATP與RNA模板的比(1mM ATP與1ng 22nt模板)為次優(yōu)的。注意,通過可控的加尾可實(shí)現(xiàn)顯著更高的文庫產(chǎn)量并且不存在更大副產(chǎn)物的污點(diǎn)。

      發(fā)明詳述

      在下面詳細(xì)描述本發(fā)明之前,應(yīng)理解,本發(fā)明不限于本文描述的特定方法、方案和試劑,因?yàn)檫@些可以變化。還應(yīng)理解,本文所使用的術(shù)語僅僅是為了描述特定實(shí)施方案,并不旨在限制本發(fā)明的范圍,本發(fā)明的范圍將僅由所附權(quán)利要求所限定。除非另有定義,否則本文使用的所有技術(shù)術(shù)語和科學(xué)術(shù)語具有與本領(lǐng)域普通技術(shù)人員通常理解的相同的含義。

      在本說明書的整個(gè)文本中引用了若干文件。無論是在上文還是下文中,本文引用的每個(gè)文件(包括所有專利、專利申請、科學(xué)出版物、制造商的說明書、用法指導(dǎo)等)通過引用整體并入本文。本文中的任何內(nèi)容都不應(yīng)被解釋為承認(rèn)本發(fā)明沒有權(quán)利由于在先發(fā)明而早于這樣的公開。本文引用的一些文件的特征在于“通過引用并入”。在這些并入的參考文獻(xiàn)的定義或教導(dǎo)與本說明書中所述的定義或教導(dǎo)之間存在沖突的情況下,本說明書的文本優(yōu)先。

      在下文中,將描述本發(fā)明的元件。這些元件用具體實(shí)施方案列出,然而,應(yīng)理解,它們可以以任何方式和任何數(shù)量組合以產(chǎn)生另外的實(shí)施方案。多種描述的實(shí)施例和優(yōu)選實(shí)施方案不應(yīng)被解釋為將本發(fā)明僅限于明確描述的實(shí)施方案。該描述應(yīng)被理解為支持并涵蓋將明確描述的實(shí)施方案與任何數(shù)量的所公開和/或優(yōu)選的元件組合的實(shí)施方案。此外,除非上下文另有說明,否則本申請中所有描述的元件的任何排列和組合應(yīng)被認(rèn)為通過本申請的說明書被公開。

      定義

      在下文中,提供了本說明書中經(jīng)常使用的一些術(shù)語的定義。這些術(shù)語在其使用的每個(gè)實(shí)例中和說明書的其余部分中將具有相應(yīng)的限定含義和優(yōu)選含義。

      如在本說明書和所附權(quán)利要求中所使用的,除非內(nèi)容另有明確說明,否則沒有數(shù)量詞修飾的名詞表示一個(gè)/種和/或更多個(gè)/種。

      如在本說明書中使用的術(shù)語“核酸”包括對(duì)所有已知形式的生命所必需的多聚或寡聚的大分子或大的生物分子。包括DNA(脫氧核糖核酸)和RNA(核糖核酸)的核酸是由稱為核苷酸的單體形成的。大多數(shù)天然存在的DNA分子由兩個(gè)互補(bǔ)的生物聚合物鏈組成,這兩個(gè)互補(bǔ)的生物聚合物鏈彼此纏繞以形成雙螺旋。DNA鏈也稱為由核苷酸組成的多核苷酸。每個(gè)核苷酸由含氮核堿基和稱為脫氧核糖或核糖的單糖以及磷酸基團(tuán)構(gòu)成。天然存在的核堿基包括鳥嘌呤(G)、腺嘌呤(A)、胸腺嘧啶(T)、尿嘧啶(U)或胞嘧啶(C)。核苷酸通過一個(gè)核苷酸的糖和下一個(gè)核苷酸的磷酸之間的共價(jià)鍵彼此連接成鏈,產(chǎn)生交替的糖-磷酸骨架。如果糖是脫氧核糖,則聚合物是DNA。如果糖是核糖,則聚合物是RNA。通常,通過單個(gè)核苷酸單體之間的磷酸二酯鍵形成多核苷酸。在本發(fā)明的上下文中,術(shù)語“核酸”包括但不限于核糖核酸(RNA)、脫氧核糖核酸(DNA)及其混合物,例如,RNA-DNA雜交體(在一條鏈內(nèi))以及cDNA、基因組DNA、重組DNA、cRNA和mRNA。核酸可以由完整基因或其部分組成,核酸也可以是miRNA、siRNA或piRNA。miRNA是短的核糖核酸(RNA)分子,其平均為22個(gè)核苷酸長,但可以更長,并且其在所有真核細(xì)胞(即植物、動(dòng)物和一些病毒)中發(fā)現(xiàn),其在基因表達(dá)的轉(zhuǎn)錄和轉(zhuǎn)錄后調(diào)控中起作用。miRNA是與靶信使RNA轉(zhuǎn)錄物(mRNA)上的互補(bǔ)序列結(jié)合的轉(zhuǎn)錄后調(diào)控因子,通常導(dǎo)致翻譯抑制和基因沉默。小干擾RNA(siRNA)(有時(shí)稱為短干擾RNA或沉默RNA)是長度在20-25個(gè)核苷酸之間的短核糖核酸(RNA分子)。它們參與RNA干擾(RNAi)途徑,其中它們干擾特定基因的表達(dá)。piRNA也是短RNA,其通常包含26-31個(gè)核苷酸并且從它們所結(jié)合的所謂的piwi蛋白獲得它們的名稱。核酸也可以是人工核酸。人工核酸包括聚酰胺或肽核酸(PNA)、嗎啉代和鎖核酸(LNA)以及乙二醇核酸(glycol nucleic acid,GNA)和蘇糖核酸(TNA)。這些中的每一種通過改變分子的骨架與天然存在的DNA或RNA有區(qū)別。

      本說明書中使用的術(shù)語“單鏈核酸”(ss核酸)是指僅由一條多核苷酸鏈組成的核酸。相比之下,“雙鏈核酸”(ds核酸)由兩條多核苷酸鏈組成,其中大部分核苷酸根據(jù)堿基配對(duì)規(guī)則(在DNA的情況下,A與T而C與G配對(duì),在RNA的情況下A與U而C與G配對(duì),在RNA/DNA雜交體的情況下A與U、T與A或C與G配對(duì))配對(duì),氫鍵結(jié)合兩條分開的多核苷酸鏈的含氮堿基以形成雙鏈核酸。雙鏈也容許錯(cuò)配。如果位于相對(duì)鏈中相同位置處的兩個(gè)核苷酸不遵循堿基配對(duì)規(guī)則,則在雙鏈內(nèi)發(fā)生錯(cuò)配。在給定雙鏈內(nèi)容忍的錯(cuò)配數(shù)由雙鏈的長度、堿基組成、溫度和緩沖液條件(例如,鹽濃度)決定。這些參數(shù)如何影響雙鏈形成是本領(lǐng)域熟知的。

      在本說明書的上下文中使用的術(shù)語“擺動(dòng)堿基”或“簡并堿基”是指合成DNA或RNA寡核苷酸內(nèi)其中可能存在多于一種堿基的特定核苷酸位置?!皵[動(dòng)堿基”或“簡并堿基”是dA、dT、dG、dC、dU、A、T、G、C或U以所有可能摩爾比的組合。常用的“擺動(dòng)堿基”或“簡并堿基”是連續(xù)的簡并(擺動(dòng))DNA堿基序列,優(yōu)選地選自N、V、H、D、B和J,其中N是并入來自dA、dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,即,其代表dA、dT、dC和dG中的任一種;B是并入來自dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,即,其代表dT、dC和dG中的任一種;D是并入來自dA、dT和dG等摩爾混合物的核苷酸的產(chǎn)物,即,其代表dA、dT和dG中的任一種;H是并入來自dA、dT和dC等摩爾混合物的核苷酸的產(chǎn)物,即,其代表dA、dT和dC中的任一種;V是并入來自dA、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,即,其代表dA、dC和dG中的任一種,J是并入來自(0-100%dA)比(0-100%dG)比(0-100%dC)比(0-100%dT)比(0-100%dU)比(0-100%rA)比(0-100%rG)比(0-100%rC)比(0-100%rT)比(0-100%rU)的混合物的核苷酸的產(chǎn)物。因此,在一個(gè)位置包含擺動(dòng)堿基的寡核苷酸將包含來自相應(yīng)指定混合物的一個(gè)特定核苷酸。另一方面,寡核苷酸混合物將包含不同的寡核苷酸,其在相應(yīng)位置所含相應(yīng)混合物包含的所有核苷酸。包含不同核苷酸的寡核苷酸的比例由給定位置處并入的核苷酸的各自比例確定。通過序列ANG來說明這點(diǎn),序列ANG是四種不同寡核苷酸(即,AAG、ACG、AGG和ATG)等摩爾混合物的縮寫。因此,如果指示引物或寡核苷酸包含擺動(dòng)堿基,這意味著引物或寡核苷酸混合物在該位置處存在包含不同的核苷酸。

      術(shù)語“樣品”是指旨在表示整個(gè)組織、器官或個(gè)體的組織、器官或個(gè)體的一部分或一片,通常比該組織、器官或個(gè)體小。在分析后,樣品提供關(guān)于組織狀態(tài)或器官或個(gè)體的健康或疾病狀態(tài)的信息。樣品的實(shí)例包括但不限于流體樣品,例如血液、血清、血漿、滑液、淋巴液、腦脊液、腦膜液、腺體液、細(xì)針抽吸物、脊髓液和其他體液(尿液、唾液)。樣品的另一些實(shí)例包括細(xì)胞培養(yǎng)物或組織培養(yǎng)物。另外的實(shí)例還包括液體和固體活檢樣品或固體樣品例如組織提取物。樣品可包括化石、來自滅絕生物體的殘余物、植物、果實(shí)、動(dòng)物、微生物、細(xì)菌、病毒、真菌或由其來源的細(xì)胞。

      本說明書中使用的“連續(xù)的核苷酸”是指由彼此連續(xù)的不間斷的核苷酸構(gòu)成的序列。

      本說明書中使用的術(shù)語“脫堿基核苷酸”是指可通過與一個(gè)核苷酸的3’末端和另一個(gè)核苷酸的5’末端形成磷酸二酯鍵而連接兩個(gè)核苷酸的化合物,其缺乏能夠與任何天然存在的核苷酸堿基配對(duì)的結(jié)構(gòu)(即嘧啶或嘌呤衍生物),并且跨越側(cè)翼核苷酸的5’-OH和3’-OH之間的距離為天然存在的核苷酸的5’-OH和3’-OH之間距離的至少90%。優(yōu)選地,該距離為天然存在的核苷酸的5’-OH和3’-OH之間距離的至少91%、92%、93%、94%、95%、96%、97%、98%、99%或100%?!懊搲A基核苷酸”充當(dāng)所謂的“占位符(place holder)”來替代天然存在的核苷酸。本領(lǐng)域技術(shù)人員應(yīng)理解,占位符應(yīng)通過與添加天然存在的核苷酸進(jìn)行延伸相似的長度來延伸核苷酸鏈。因此,脫堿基核苷酸允許在前面和后面的核苷酸與三個(gè)連續(xù)的核苷酸形成Watson-Crick堿基對(duì),其中第一個(gè)和最后一個(gè)堿基與前面和后面的核苷酸配對(duì)。本領(lǐng)域技術(shù)人員還理解,提及3’-OH和5’-OH是指在不存在脫堿基核苷酸時(shí)將存在于前面核苷酸的糖骨架的3’-位置的化學(xué)基團(tuán)和后面核苷酸的5’OH。如果存在脫堿基核苷酸,優(yōu)選其通過磷酸二酯鍵與前面和后面的核苷酸連接。在DNA中,通過糖苷鍵水解成核苷酸堿基僅在該位置留下糖-磷酸骨架而產(chǎn)生脫堿基位點(diǎn)。在細(xì)胞中,在自發(fā)的脫嘌呤/脫嘧啶事件之后、通過UV電離輻射或作為堿基切除修復(fù)中間體發(fā)生脫堿基位點(diǎn)的形成。因?yàn)檫@樣的位點(diǎn)是脆弱的,它們易于遭受單鏈/雙鏈斷裂,并且如果不通過堿基切除修復(fù)機(jī)制進(jìn)行修復(fù),脫堿基損傷通常在復(fù)制期間通過跨損傷合成(translesion synthesis)導(dǎo)致突變。在損傷對(duì)面并入的特定堿基根據(jù)生物體和環(huán)境條件而變化。通常使用的合成脫堿基核苷酸包括稱為dSpacer(1,2-雙脫氧核糖)的脫堿基呋喃,其是四氫呋喃衍生物,其中亞甲基占據(jù)2-脫氧核糖的1位。dSpacer通常用于模擬寡核苷酸中的脫堿基位點(diǎn)。另一些可用的脫堿基核苷酸包括rSpacer、Spacer 18、Spacer 9、Spacer C3、Spacer C12。

      術(shù)語“雜交”是指在根據(jù)核堿基的組分和核苷酸的長度所確定的特定溫度條件下單鏈核酸(優(yōu)選序列已知的寡核苷酸)與序列部分或完全互補(bǔ)的單核苷酸的連接?!半s交”也可理解為是指檢測特定核酸序列的過程。根據(jù)標(biāo)準(zhǔn)雜交技術(shù),可以將編碼待檢測序列的互補(bǔ)序列的核酸序列用作雜交探針。“原位雜交”使用標(biāo)記的互補(bǔ)核酸分子,例如,DNA或RNA鏈(即,探針)來定位樣品(例如,組織的一部分或切片)(原位)中特定的核酸分子,例如DNA或RNA序列。雜交條件是本領(lǐng)域技術(shù)人員已知的,并且可以在例如Current Protocols in Molecular Biology,John Wiley&Sons,NY,6.3.1-6.3.6、1991中找到。術(shù)語“中度雜交條件”用于本發(fā)明上下文中是指在30℃下在2X氯化鈉/檸檬酸鈉(SSC)中雜交,然后在50℃下在1X SSC,0.1%SDS中洗滌?!案叨葒?yán)格條件”是在45℃下在6X氯化鈉/檸檬酸鈉(SSC)中雜交,然后在65℃下在0.2X SSC,0.1%SDS中洗滌。

      在本說明書中使用的“互補(bǔ)”是指通過非共價(jià)鍵與靶核酸的全部或一個(gè)區(qū)域堿基配對(duì)的核苷酸序列。在規(guī)范的Watson-Crick堿基配對(duì)中,DNA中腺嘌呤(A)與胸腺嘧啶形成堿基對(duì),鳥嘌呤與胞嘧啶也是如此。在RNA中,胸腺嘧啶被尿嘧啶替代。因此,A與T互補(bǔ),G與C互補(bǔ)。在RNA中,A與U互補(bǔ),反之亦然。通常,互補(bǔ)是指至少部分互補(bǔ)的核苷酸序列。術(shù)語互補(bǔ)還可包括完全互補(bǔ)的雙鏈體,使得一條鏈中的每個(gè)核苷酸與另一條鏈相應(yīng)位置中的每個(gè)核苷酸互補(bǔ)。在某些情況下,核苷酸可以與靶標(biāo)部分互補(bǔ),其中并非所有的核苷酸都與靶核酸所有相應(yīng)位置中的每個(gè)核苷酸互補(bǔ)。例如,引物可以與靶核酸完全(即100%)互補(bǔ),或者引物和靶核酸可共享一定程度的不夠完全的互補(bǔ)性(即70%、75%、80%85%、90%、95%、99%)。

      在本說明書中使用的“互補(bǔ)DNA”(cDNA)是在通過酶(例如逆轉(zhuǎn)錄酶和DNA聚合酶等)催化的反應(yīng)中由RNA模板合成的DNA。cDNA通常用于在原核生物中克隆真核基因。cDNA也通過逆轉(zhuǎn)錄病毒(例如HIV-1、HIV-2或猿猴免疫缺陷病毒)天然產(chǎn)生,然后整合到宿主的基因組中,在其中產(chǎn)生原病毒(provirus)。術(shù)語cDNA通常也用于生物信息學(xué)背景中以指代mRNA轉(zhuǎn)錄物序列,表達(dá)為DNA堿基(GCAT)而不是RNA堿基(GCAU)?!盎パa(bǔ)RNA”(cRNA)被理解為與給定RNA模板互補(bǔ)的RNA鏈。

      如本說明書所使用的術(shù)語“模板依賴性DNA或RNA聚合酶”是指包含能夠使用模板核酸鏈并合成與模板鏈互補(bǔ)的第二核酸鏈的催化活性的酶。這些酶需要用作合成鏈的基礎(chǔ)的模板。優(yōu)選的實(shí)例是“逆轉(zhuǎn)錄酶”(RT),其是指也稱為RNA依賴性DNA聚合酶并且通常用于從RNA模板產(chǎn)生互補(bǔ)DNA的酶,該過程稱為逆轉(zhuǎn)錄。在第一步中酶的催化活性將單鏈基因組RNA轉(zhuǎn)化為RNA/DNA雜交體,在第二步中轉(zhuǎn)化為雙鏈DNA。RT的來源是逆轉(zhuǎn)錄病毒,例如,需要RT用于其復(fù)制的人免疫缺陷病毒(HIV)。RT活性也與染色體末端(端粒酶)和一些移動(dòng)遺傳元件(轉(zhuǎn)座子)的復(fù)制相關(guān)。通常,RT包含兩個(gè)順序的生化活性,RNA依賴性DNA聚合酶和DNA聚合酶,其一起工作以進(jìn)行轉(zhuǎn)錄。除了轉(zhuǎn)錄功能,逆轉(zhuǎn)錄病毒RT具有對(duì)于復(fù)制所必需的屬于RNA酶H家族的結(jié)構(gòu)域。優(yōu)選地,使用具有RNA酶H活性的RT。在實(shí)驗(yàn)室中RT用于分子克隆、RNA測序、聚合酶鏈?zhǔn)椒磻?yīng)和基因組分析。已經(jīng)顯示RT具有模板轉(zhuǎn)換活性,這意味著它能夠從一個(gè)模板轉(zhuǎn)換到另一個(gè)模板。特別適用于本發(fā)明的方法、試劑盒和用途的RT包括但不限于:來自人免疫缺陷病毒1型的HIV-1逆轉(zhuǎn)錄酶(PDB 1HMV)、來自莫洛尼鼠白血病病毒的M-MLV逆轉(zhuǎn)錄酶、來自禽成髓細(xì)胞瘤病毒的AMV逆轉(zhuǎn)錄酶和端粒酶。RT可包含可從NEB獲得的MMLV逆轉(zhuǎn)錄酶、可從Invitrogen獲得的Superscript II或Superscript III逆轉(zhuǎn)錄酶、可從Applied Biosystems獲得的Multiscribe逆轉(zhuǎn)錄酶、可從Clontech獲得的SMART MMLV逆轉(zhuǎn)錄酶或SMARTScribe逆轉(zhuǎn)錄酶。端粒酶是在許多真核生物(包括人)中發(fā)現(xiàn)的逆轉(zhuǎn)錄酶的另一個(gè)實(shí)例,其攜帶其自身RNA模板;該RNA用作DNA復(fù)制的模板,并且其可以用于本發(fā)明的上下文中。

      術(shù)語“模板獨(dú)立的DNA/RNA聚合酶”是指催化將核苷酸添加到DNA和/或RNA分子的3’端的酶。與大多數(shù)DNA和/或RNA聚合酶不同,這些聚合酶不需要模板用作合成相應(yīng)鏈的基礎(chǔ)的。這樣的酶的優(yōu)選實(shí)例是DNA/RNA連接酶、末端轉(zhuǎn)移酶和聚(A、U或C)-聚合酶。這些酶的優(yōu)選底物是雙鏈核酸的3’突出端或單鏈核酸的3’端,但它們也可以添加核苷酸以使3’端鈍化或凹入。對(duì)于這些酶中一些,特別是對(duì)于末端轉(zhuǎn)移酶,鈷是必需的輔因子,然而該酶還在體外施用Mg和Mn后催化反應(yīng)。在本發(fā)明上下文中使用的末端轉(zhuǎn)移酶的優(yōu)選實(shí)例是也稱為DNA核苷酸外切轉(zhuǎn)移酶(DNA nucleotidylexotransferase,DNTT)的末端脫氧核苷酸轉(zhuǎn)移酶(TdT)或聚-(N)-聚合酶,其中N表示A、G或U。聚(N)-聚合酶在本發(fā)明的上下文中是優(yōu)選的酶,并且包含聚-(A)-聚合酶,其是能夠?qū)⒕跘尾添加到單鏈核酸的一類酶。天然地,聚-(A)加尾反應(yīng)發(fā)生在初級(jí)轉(zhuǎn)錄物RNA的3’端。聚-(A)尾由多個(gè)腺苷單磷酸組成,其為僅由腺嘌呤堿基組成的段。天然存在的聚(A)加尾產(chǎn)生用于翻譯的成熟mRNA。聚-A-聚合酶可以使用胞嘧啶作為底物產(chǎn)生聚-(C)尾。此外,可使用具有功能上等同的聚-(U)-聚合酶和聚-(G)-聚合酶,但要分別使用尿嘧啶、腺嘌呤和鳥嘌呤進(jìn)行加尾反應(yīng)。例如,聚-(U)-聚合酶可用于催化向RNA的3’端模板獨(dú)立地添加來自UTP的UMP或來自ATP的AMP,因此可用于聚A或聚U加尾?!癉NA連接酶”是模板非依賴性聚合酶的另一個(gè)優(yōu)選實(shí)例,并且是指特定類型的酶,一種通過催化一個(gè)DNA末端的3’-羥基與另一個(gè)的5’-磷酰基之間形成磷酸二酯鍵而促進(jìn)DNA鏈連接在一起的連接酶。RNA也可以類似地連接。輔因子通常參與反應(yīng),其通常是ATP或NAD+。DNA連接酶可使用單核苷酸、二、三或n-核苷酸來產(chǎn)生由單、二、三、n-核苷酸組成的尾,其中“n”優(yōu)選為4至100個(gè)核苷酸。

      在本發(fā)明的上下文中,優(yōu)選將已知序列的寡核苷酸連接到單鏈DNA的3’-羥基末端。類似地,RNA連接酶是催化在一個(gè)RNA或DNA末端的3’-羥基與一個(gè)RNA或DNA的5’-磷酰基之間形成一個(gè)或更多個(gè)磷酸二酯鍵的特定類型的酶。在本發(fā)明的上下文中使用的優(yōu)選的RNA連接酶是T4 RNA連接酶或T7 RNA連接酶,其通過形成3’→5’磷酸二酯鍵催化5’磷酰基封端的核酸供體與3’羥基封端的核酸受體的連接,將ATP水解為AMP和PPi。RNA連接酶可使用二核苷焦磷酸作為底物來產(chǎn)生單核苷酸的尾部,并且還可使用二、三、n-核苷酸來產(chǎn)生由二、三、n-核苷酸組成的尾部。

      本說明書中使用的術(shù)語“固定化”是指能夠?qū)⒑怂峁潭ㄔ诒砻嫔系娜魏畏椒?。除了基因遞送裝置之外,表面固定化的DNA需要開發(fā)DNA芯片和陣列、DNA傳感器或包括微流體的其他感測裝置。所有這些基于DNA的系統(tǒng)的應(yīng)用范圍廣泛,主要見于醫(yī)學(xué)領(lǐng)域中,在DNA測序中也使用該裝置,此外其用于食品和環(huán)境或法醫(yī)分析。根據(jù)不同的表面,開發(fā)和優(yōu)化了多種固定化技術(shù)(例如通過物理吸附、共價(jià)、親和結(jié)合和基質(zhì)包埋),已描述其用于碳質(zhì)材料(例如,碳納米管)、二氧化硅和硅表面、金表面,以及最近復(fù)雜的生物相容性表面(例如,聚合物凝膠)。

      “聚合酶鏈?zhǔn)椒磻?yīng)”(PCR)是分子生物學(xué)中用于跨過幾個(gè)數(shù)量級(jí)擴(kuò)增一段DNA的單個(gè)或幾個(gè)拷貝,產(chǎn)生數(shù)千到數(shù)百萬拷貝的特定DNA序列的生物化學(xué)技術(shù)。幾乎所有的PCR應(yīng)用都使用熱穩(wěn)定的DNA聚合酶,例如Taq聚合酶(最初從細(xì)菌棲熱水生菌(Thermus aquaticus)中分離的酶)。該DNA聚合酶通過使用單鏈DNA作為模板和啟動(dòng)DNA合成所需的DNA寡核苷酸(也稱為DNA引物從DNA結(jié)構(gòu)單元(building-blocks)、核苷酸中酶促地裝配新的DNA鏈。絕大多數(shù)PCR方法使用熱循環(huán),即通過限定的一系列溫度步驟交替地加熱和冷卻PCR樣品?;镜腜CR設(shè)置需要幾種組分和試劑。這些組分包括含有待擴(kuò)增的DNA區(qū)域(靶標(biāo))的DNA模板、與DNA靶標(biāo)的有義鏈和反義鏈各自的3’端互補(bǔ)的兩個(gè)引物、Taq聚合酶或最適溫度為約70℃的另一種DNA聚合酶、脫氧核苷三磷酸(dNTP)、DNA聚合酶由其合成新DNA鏈的結(jié)構(gòu)單元、緩沖溶液、為DNA聚合酶的最佳活性和穩(wěn)定性提供合適的化學(xué)環(huán)境、二價(jià)陽離子、鎂或錳離子或一價(jià)陽離子鉀離子;通常使用Mg2+,但Mn2+可用于PCR介導(dǎo)的DNA誘變,因?yàn)檩^高的Mn2+濃度增加DNA合成期間的錯(cuò)誤率。上述方法可以包括核酸標(biāo)記。本領(lǐng)域技術(shù)人員已知允許標(biāo)記DNA、RNA或寡核苷酸的一系列技術(shù)。這些包括例如Nick翻譯標(biāo)記、隨機(jī)引發(fā)的DNA標(biāo)記、DNA探針的PCR標(biāo)記和寡核苷酸3’/5’末端標(biāo)記、RNA探針的轉(zhuǎn)錄標(biāo)記、寡核苷酸3’/5’末端標(biāo)記和寡核苷酸加尾。PCR可用于本發(fā)明方法的某些優(yōu)選實(shí)施方案中,優(yōu)選在合成雙鏈核酸之后使用。

      在本說明書中使用的術(shù)語“序列測定”是指用于確定DNA或RNA分子內(nèi)的核苷酸的精確順序的多種方法,換句話說,確定DNA鏈中的四種堿基-腺嘌呤、鳥嘌呤、胞嘧啶和胸腺嘧啶,或在RNA的情況下尿嘧啶而不是胸腺嘧啶的順序。DNA測序可以用于測定單個(gè)基因、更大的遺傳區(qū)域(即基因或操縱子的簇)、全染色體或整個(gè)基因組的序列。測序可以提供從動(dòng)物、植物、細(xì)菌、古菌或幾乎任何其他遺傳信息來源的細(xì)胞分離的DNA或RNA中單個(gè)核苷酸的順序。

      本說明書中使用的術(shù)語“陣列”是指核酸微陣列(如果DNA被固定化,通常也稱為DNA芯片或生物芯片)是在固體表面上各自包含相同或不同的核酸的有序排列的點(diǎn)。優(yōu)選地,每個(gè)點(diǎn)僅包含相同的核酸分子。所述點(diǎn)可以呈任何形狀,優(yōu)選圓形或正方形。這種微陣列用于同時(shí)測量大量基因的表達(dá)水平或?qū)蚪M的多個(gè)區(qū)域進(jìn)行基因分型。每個(gè)點(diǎn)通常含有皮摩爾(10-12皮摩爾)的特定序列的DNA,稱為探針(或報(bào)告子或寡核苷酸)。這些可以是用于在高嚴(yán)格條件下與cDNA或cRNA(也稱為反義RNA)樣品(稱為靶標(biāo))雜交的基因或其他DNA元件的短片段。探針-靶標(biāo)雜交通常通過檢測熒光團(tuán)標(biāo)記、銀標(biāo)記或化學(xué)發(fā)光標(biāo)記的靶標(biāo)來檢測和定量以確定靶標(biāo)中核酸序列的相對(duì)豐度。合成所述探針,然后通過表面改造經(jīng)由化學(xué)基質(zhì)(通過環(huán)氧基-硅烷、氨基-硅烷、賴氨酸、聚丙烯酰胺或其他)的共價(jià)鍵連接到固體表面。固體表面可以是玻璃或硅芯片。DNA微陣列可用于測量表達(dá)水平的變化以檢測單核苷酸多態(tài)性(SNP)或進(jìn)行基因分型或靶向重測序。

      實(shí)施方案

      在下面的段落中,更詳細(xì)地限定了本發(fā)明的不同方面。除非明確指示相反,否則如此限定的各個(gè)方面可以與任何其他方面或多個(gè)方面組合。特別地,指示為優(yōu)選或有利的任何特征可以與指示為優(yōu)選或有利的任何其他特征組合。

      在產(chǎn)生本發(fā)明的工作中,出人意料地顯示,可以以快速方式將單鏈核酸合成為具有限定的3’和5’末端的雙鏈核酸,其中獲得的雙鏈核酸即時(shí)可通過當(dāng)前的下一代測序技術(shù)進(jìn)行測序,而不需要本發(fā)明中所述的方法之外的任何額外的步驟。

      基于這些結(jié)果,本發(fā)明在第一方面提供了用于從包含單鏈核酸的樣品合成具有限定的3’和5’端核苷酸序列的雙鏈核酸的方法,所述方法包括以下步驟:

      a)提供包含單鏈核酸或雙鏈核酸的樣品,任選地使所述雙鏈核酸變性;

      b)向單鏈核酸或雙鏈核酸的3’-末端添加至少5個(gè)連續(xù)的核苷酸,

      c)使與所添加核苷酸序列互補(bǔ)的引發(fā)寡核苷酸雜交,并用模板依賴性DNA或RNA聚合酶合成cDNA或cRNA以產(chǎn)生雙鏈核酸,

      d)使模板轉(zhuǎn)換寡核苷酸與所述雙鏈核酸雜交,以及

      e)使cDNA或cRNA鏈的3’末端延伸以合成雙鏈核酸,其中核酸的一條鏈包含引發(fā)寡核苷酸,以及與單鏈核酸以及模板轉(zhuǎn)換寡核苷酸互補(bǔ)的cDNA或cRNA。

      本發(fā)明方法的目的之一是將已知的核苷酸序列(在本發(fā)明的上下文中也稱為限定序列)添加到未知序列的單鏈核酸或雙鏈核酸3’和5’末端二者。這些添加的核苷酸序列允許與作為本發(fā)明方法的產(chǎn)物的雙鏈核酸具有相同和/或互補(bǔ)序列的寡核苷酸特異性退火,從而允許雙鏈核酸的許多后續(xù)操作,包括捕獲、擴(kuò)增、延伸等。優(yōu)選地,每個(gè)3’末端和5’末端“限定序列”彼此不雜交,并且也不可能在選擇用于對(duì)作為本發(fā)明方法的產(chǎn)物的雙鏈核酸進(jìn)行后續(xù)操作的條件下與樣品中存在的任何核苷酸雜交。

      在本發(fā)明第一方面的優(yōu)選實(shí)施方案中,樣品是從液體或固體活檢樣品獲得的或由其來源,更優(yōu)選血液樣品、血漿樣品、血清樣品、體液樣品、唾液樣品、尿樣品、精液樣品、來自胸膜腔的流體法樣品、來自腹膜腔的流體的樣品、腦脊液的樣品、來自上皮表面的涂片、痰樣品、糞便樣品、射精樣品、眼淚樣品、汗液樣品、淋巴液樣品、支氣管灌洗液樣品、胸腔積液樣品、腦膜液樣品、腺液樣品、細(xì)針抽吸樣品、微切割細(xì)胞、乳頭抽吸液樣品、脊髓液樣品、結(jié)膜液樣品、陰道液樣品、十二指腸液樣品、胰液樣品或膽汁樣品。在另一個(gè)優(yōu)選的實(shí)施方案中,所述樣品是法醫(yī)用樣品或考古樣品。更優(yōu)選地,所述樣品是從化石、滅絕生物體的殘余物、植物、果實(shí)和動(dòng)物、微生物、細(xì)菌、病毒獲得的。在另一個(gè)更優(yōu)選的實(shí)施方案中,所述樣品是從哺乳動(dòng)物,更優(yōu)選人對(duì)象獲得的。在另一個(gè)優(yōu)選的實(shí)施方案中,樣品來自患有病癥的人對(duì)象。更優(yōu)選地,所述樣品包含人靜脈血,甚至更優(yōu)選人血漿。在另一個(gè)優(yōu)選的實(shí)施方案中,包含單鏈核酸或雙鏈核酸的所述樣品,優(yōu)選人血液、血清樣品或血漿樣品,其直接用于本發(fā)明的方法,而不需要將核酸從患者獲得樣品中分離的在先步驟。當(dāng)單鏈核酸或雙鏈核酸是DNA時(shí),這是優(yōu)選的實(shí)施方案。更優(yōu)選地,在樣品直接用于本發(fā)明的方法的情況下,所述樣品是用能夠切割蛋白質(zhì)中肽鍵的酶(優(yōu)選蛋白酶,特別是蛋白酶K)處理并在合適的溫度下孵育適當(dāng)時(shí)間的樣品。優(yōu)選地,通過不對(duì)患者造成實(shí)質(zhì)性健康風(fēng)險(xiǎn)的方法提供樣品,例如,通過從外周靜脈或動(dòng)脈抽出血液。步驟a)中使用的樣品可包含單鏈和/或雙鏈核酸。如果樣品包含雙鏈DNA,優(yōu)選在步驟a)之前進(jìn)行變性步驟。這樣的步驟可以包含熱或化學(xué)變性。

      在本發(fā)明第一方面的優(yōu)選實(shí)施方案中,單鏈核酸或雙鏈核酸是DNA或RNA。DNA或RNA可以是片段化的或亞硫酸氫鹽轉(zhuǎn)化的RNA或DNA。在一個(gè)更優(yōu)選的實(shí)施方案中,包含在樣品中的RNA或DNA的平均長度為5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、43、44、45、46、47、48、49、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590或600個(gè)核苷酸。更優(yōu)選地,所述單鏈核酸是RNA,甚至更優(yōu)選地,所述單鏈核酸是miRNA、小RNA或piRNA。在另一個(gè)優(yōu)選的實(shí)施方案中,所述RNA天然不包含連續(xù)的一段聚腺苷,優(yōu)選至少30個(gè)聚腺苷。在另一個(gè)優(yōu)選的實(shí)施方案中,所述單鏈核酸是DNA。

      由于本發(fā)明方法的靈敏性,需要在步驟a)中提供的單鏈核酸或雙鏈核酸的量可以非常低,并且仍然可以導(dǎo)致產(chǎn)生雙鏈核酸。因此,在一個(gè)優(yōu)選的實(shí)施方案中,步驟a)中提供的樣品的DNA和/或RNA的濃度小于1μg/μl,優(yōu)選小于0.1μg/μl,更優(yōu)選小于0.01μg/μl,更優(yōu)選小于1ng/μl,更優(yōu)選小于0.1ng/μl,甚至更優(yōu)選小于0.01ng/μl,更優(yōu)選小于1pg/μl,甚至更優(yōu)選小于0.1pg/μl,更優(yōu)選小于0.01pg/μl,最優(yōu)選小于1fg/μl。樣品中的總DNA和/或RNA也可以非常低,優(yōu)選為5pg。優(yōu)選地,如果本發(fā)明第一方面的步驟a)中提供的核酸是小RNA,則可以使用5pg/μl,如果在所述步驟a)中提供的核酸是DNA,則可以使用5pg或者如果在所述步驟a)中提供的核酸是miRNA或siRNA,則可使用1pg/μl至5ng/μl。

      該方法的步驟b)需要向單鏈核酸的3’-端添加至少5個(gè)連續(xù)的核苷酸。這段連續(xù)的核苷酸用于允許引發(fā)寡核苷酸的隨后雜交的目的。其可以充當(dāng)在本發(fā)明的方法中引入的3’末端限定序列。因此,引發(fā)寡核苷酸和連續(xù)的核苷酸必須包含彼此互補(bǔ)的序列。如果添加已知序列的連續(xù)的核苷酸,例如通過添加已知序列的引物或通過添加連續(xù)的一段已知單核苷酸或二核苷酸,則可以達(dá)到這個(gè)目的。不需要將這段核苷酸立即添加到單鏈核酸的3’端,只要其包含在所添加的連續(xù)的核苷酸段中即可。本發(fā)明第一方面的另一個(gè)優(yōu)選實(shí)施方案包括向單鏈核酸的3’端添加相同的連續(xù)核苷酸。優(yōu)選地,添加選自A、T、G、C或U的相同的連續(xù)核苷酸。優(yōu)選地,相同的連續(xù)核苷酸的數(shù)目范圍為10至500個(gè)連續(xù)核苷酸,即10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490或500個(gè)。更優(yōu)選地,連續(xù)的相同核苷酸的數(shù)目為10至100個(gè)連續(xù)相同核苷酸,更優(yōu)選15至50個(gè)連續(xù)的相同核苷酸,更優(yōu)選20至40個(gè)連續(xù)的相同核苷酸或30至100個(gè)連續(xù)的相同核苷酸,即10、15、20、25、30、40、50、60、70、80、90或100。因此,優(yōu)選較短的連續(xù)核苷酸段。在3’末端的有限突出端導(dǎo)致:(1)在本發(fā)明方法的步驟c)中添加的引發(fā)寡核苷酸在相同濃度下成比例地引發(fā)更高的逆轉(zhuǎn)錄的能力;(2)允許精確計(jì)算在本發(fā)明方法的步驟c)中添加的引發(fā)寡核苷酸的最佳量,當(dāng)引發(fā)寡核苷酸直接地與TSO相互作用時(shí)導(dǎo)致“空”DNA副產(chǎn)物的較低發(fā)生率(3)因?yàn)樵陔x模板的3’-末端的遠(yuǎn)端位點(diǎn)引發(fā)逆轉(zhuǎn)錄,所以含有大于30個(gè)核苷酸的多核苷酸段的DNA產(chǎn)物的發(fā)生率較低。優(yōu)點(diǎn)(1)、(2)和(3)導(dǎo)致方法的靈敏度具有統(tǒng)計(jì)學(xué)顯著的增加,并允許由較低濃度的模板合成DNA。此外,當(dāng)產(chǎn)生文庫時(shí),較短的連續(xù)核苷酸段提供生成更好的(例如,更復(fù)雜)的文庫的額外優(yōu)勢。

      在另一個(gè)優(yōu)選的實(shí)施方案中,相同的連續(xù)核苷酸包含選自AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TG、TC或TU的連續(xù)二核苷酸。在另一個(gè)優(yōu)選的實(shí)施方案中,添加相同的連續(xù)三、四或五核苷酸。為了僅添加一種類型的核苷酸,優(yōu)選在反應(yīng)步驟b)中添加的核苷酸包含、基本上僅包含一個(gè)待添加的特定類型的核苷酸結(jié)構(gòu)單元或僅由其組成,例如,僅有A、G、C或T。然而,可以設(shè)想,在步驟b)中使用的核苷酸結(jié)構(gòu)單元不是完全同質(zhì)的(homogenous),而是還包含其他核苷酸結(jié)構(gòu)單元。在這種情況下,不同的核苷酸結(jié)構(gòu)單元將以反映其在反應(yīng)混合物中的相應(yīng)濃度的隨機(jī)方式添加。因此,在本發(fā)明方法的一個(gè)實(shí)施方案中,期望將其他核苷酸的濃度保持在最小以確保形成連續(xù)段的預(yù)期核苷酸序列。然而,本發(fā)明的方法不排除使用結(jié)構(gòu)單元的混合物的實(shí)施方案,只要大部分添加的核苷酸包含已知序列的至少10個(gè)連續(xù)核苷酸即可。

      存在不同的方式以限制在本領(lǐng)域技術(shù)人員已知的加尾反應(yīng)中添加的核苷酸的數(shù)量。一個(gè)優(yōu)選的實(shí)施方案是使用并入的次優(yōu)濃度的核苷酸或二核苷酸。次優(yōu)濃度是核苷酸或二核苷酸的摩爾濃度,其低于模板獨(dú)立的DNA和RNA聚合酶的供應(yīng)商/生產(chǎn)商推薦的核苷酸或二核苷酸的摩爾濃度;并且在這種情況下模板獨(dú)立的DNA和RNA聚合酶合成短于1000nt的多核苷酸尾部。在其中模板獨(dú)立的DNA和RNA聚合酶用于加尾反應(yīng)的情況下,本領(lǐng)域技術(shù)人員可以對(duì)于各個(gè)酶確定相應(yīng)反應(yīng)混合物中的核苷酸或二核苷酸的濃度,其在給定時(shí)間內(nèi)達(dá)到添加的核苷酸或者二核苷酸的最大數(shù)目,即最大酶持續(xù)合成能力(processivity)的濃度。然后將該濃度視為該酶在給定的反應(yīng)條件(例如緩沖液、pH、溫度等)下的最適濃度。核苷酸/二核苷酸的“次優(yōu)濃度”是比最優(yōu)核苷酸濃度低至少10倍,更優(yōu)選低100倍的濃度。優(yōu)選地,次優(yōu)濃度導(dǎo)致酶持續(xù)合成能力降低,即在給定時(shí)間段內(nèi)添加的核苷酸/二核苷酸的數(shù)目比在最優(yōu)核苷酸濃度下添加的核苷酸/二核苷酸的數(shù)目低至少10倍,更優(yōu)選低100倍。優(yōu)選地,次優(yōu)濃度在以下范圍內(nèi):對(duì)于10-20分鐘在聚(A)聚合酶反應(yīng)緩沖液(50mM Tris-HCl,250mM NaCl,10mM MgCl2 pH 7.9,25℃)中大腸桿菌聚(A)聚合酶介導(dǎo)的反應(yīng)為0.1mM-0.01 mM ATP;對(duì)于10-20分鐘在MMLV逆轉(zhuǎn)錄酶反應(yīng)緩沖液(50mM Tris-HCl,75mM KCl,3mM MgCl2,10mM DTT pH8.3,25℃)大腸桿菌聚(A)聚合酶介導(dǎo)的反應(yīng)為0.001mM-0.0001mM ATP;對(duì)于10-20分鐘在MMLV逆轉(zhuǎn)錄酶反應(yīng)緩沖液(50mM Tris-HCl,75mM KCl,3mM MgCl2,10mM DTT pH 8.3,25℃)中酵母聚(A)聚合酶介導(dǎo)的反應(yīng)為0.1mM-0.01mM ATP;對(duì)于10-30分鐘末端轉(zhuǎn)移酶反應(yīng)緩沖液(50mM乙酸鉀,20mM Tris-乙酸鹽,10mM乙酸鎂,pH7.9,25℃)或MMLV逆轉(zhuǎn)錄酶反應(yīng)緩沖液(50mM Tris-HCl,75mM KCl,3mM MgCl2,10mM DTT,pH8.3,25℃)中末端轉(zhuǎn)移酶介導(dǎo)的反應(yīng)為0.1mM-0.01mM的dATP。最優(yōu)濃度是核苷酸或二核苷酸的摩爾濃度,在該濃度下模板獨(dú)立的DNA和RNA聚合酶向DNA和RNA模板添加至少30nt但不超過1000nt的多核苷酸尾。在其中模板獨(dú)立的DNA和RNA聚合酶用于加尾反應(yīng)的情況下,本領(lǐng)域技術(shù)人員可以對(duì)各個(gè)酶確定在給定時(shí)間內(nèi)導(dǎo)致添加最佳數(shù)目的核苷酸或者二核苷酸之相應(yīng)反應(yīng)混合物中的核苷酸或二核苷酸的濃度。然后將該濃度視為在給定的反應(yīng)條件(例如緩沖液、pH、溫度等)下該酶的最適濃度。核苷酸/二核苷酸的“次優(yōu)濃度”是比最優(yōu)核苷酸濃度至少高10倍,更優(yōu)選高100倍的濃度。優(yōu)選最適濃度導(dǎo)致酶持續(xù)合成能力降低,即在給定時(shí)間段內(nèi)添加的核苷酸/二核苷酸的數(shù)量比在次優(yōu)核苷酸濃度下添加的核苷酸/二核苷酸的數(shù)量低至少10倍,更優(yōu)選低100倍。優(yōu)選地,最適濃度在以下范圍內(nèi):對(duì)于10-20分鐘在聚(A)聚合酶反應(yīng)緩沖液(50mM Tris-HCl,250mM NaCl,10mM MgCl2pH 7.9,25℃)中大腸桿菌聚(A)聚合酶介導(dǎo)的反應(yīng)為0.1mM-0.01mM ATP;對(duì)于10-20分鐘在MMLV逆轉(zhuǎn)錄酶反應(yīng)緩沖液(50mM Tris-HCl,75mM KCl,3mM MgCl2,10mM DTT pH 8.3,25℃)中大腸桿菌聚(A)聚合酶介導(dǎo)的反應(yīng)為0.001mM-0.0001mM ATP;對(duì)于10-20分鐘在MMLV逆轉(zhuǎn)錄酶反應(yīng)緩沖液(50mM Tris-HCl,75mM KCl,3mM MgCl2,10mM DTT pH8.3,25℃)中酵母聚(A)聚合酶介導(dǎo)的反應(yīng)為0.1mM-0.01mM ATP;對(duì)于10-30分鐘在末端轉(zhuǎn)移酶反應(yīng)緩沖液(50mM乙酸鉀,20mM Tris-乙酸鹽,10mM乙酸鎂,pH 7.9,25℃)或MMLV逆轉(zhuǎn)錄酶反應(yīng)緩沖液(50mM Tris-HCl,75mM KCl,3mM MgCl2,10mM DTT,pH 8.3,25℃)中末端轉(zhuǎn)移酶介導(dǎo)的反應(yīng)中為0.1mM-0.01mM dATP。

      在另一個(gè)優(yōu)選的實(shí)施方案中,通過使用封閉核苷酸或二核苷酸實(shí)現(xiàn)這點(diǎn)。封閉核苷酸或二核苷酸是這樣的核苷酸或二核苷酸:其一旦添加,防止添加其他核苷酸或二核苷酸。通常通過將下一個(gè)核苷酸添加到位于核糖或脫氧核糖的3’位置的羥基來延伸寡核苷酸。如果核糖或脫氧核糖的3’位置被封閉,則不能加入其他核苷酸或二核苷酸。因此,封閉核苷酸的核糖或脫氧核糖或二核苷酸的3’-末端核苷酸不允許添加其他核苷酸或二核苷酸。優(yōu)選的封閉核苷酸是3d-ATP、3-Me-ATP和ddATP。更優(yōu)選地,使用ddATP或3d-ATP。如果使用封閉核苷酸和非封閉核苷酸的混合物,則將第一封閉核苷酸并入到生長的寡核苷酸鏈中是隨機(jī)事件,并且在并入給定數(shù)量的非封閉的核苷酸后并入第一封閉核苷酸的可能性取決于反應(yīng)混合物中存在的封閉和非封閉核苷酸的比例。因此,反應(yīng)混合物中這些封閉核苷酸或二核苷酸的濃度低于非封閉核苷酸或二核苷酸的濃度。封閉核苷酸或二核苷酸的相對(duì)量越低,延伸將進(jìn)行得越長。由于并入第一封閉寡核苷酸是隨機(jī)事件,因此在加尾反應(yīng)中添加的寡核苷酸的長度將在給定范圍內(nèi)變化。優(yōu)選地,封閉與非封閉核苷酸或二核苷酸的濃度比在1∶1至1∶1000之間。通常使用的濃度范圍為0.1至0.001mM,即0.09、0.08、0.07、0.06、0.05、0.04、0.03、0.02、0.01、0.009、0.008、0.007、0.006、0.005、0.004、0.003、0.002、0.001nM。最優(yōu)選地,對(duì)于酵母聚(A)聚合酶,以相對(duì)于ATP濃度為1至30的比例使用3d-ATP,而對(duì)于大腸桿菌聚(A)聚合酶以相對(duì)于ATP濃度為1至1.7的比例使用3d-ATP,得到平均大小為30nt的延伸產(chǎn)物。最優(yōu)選地,對(duì)于末端轉(zhuǎn)移酶以相對(duì)于dATP的濃度為1至30的比例使用ddATP以獲得平均大小為30nt的延伸產(chǎn)物,優(yōu)選地選擇條件以使添加平均不超過50個(gè)核苷酸,優(yōu)選不超過40,更優(yōu)選不超過35,更優(yōu)選不超過30,優(yōu)選不超過25,最優(yōu)選不超過20。

      在其中需要一段短的相同連續(xù)的核苷酸的那些實(shí)施方案中,優(yōu)選通過提供混合物或核糖或脫氧核糖核苷酸和鏈終止核苷酸來實(shí)現(xiàn)這點(diǎn)。如果需要10個(gè)連續(xù)核苷酸的長度,則鏈終止核苷酸和核糖或脫氧核糖核苷酸的1至10種混合物將平均導(dǎo)致這樣的長度。因此,技術(shù)人員知道如何產(chǎn)生平均具有如上所述長度且優(yōu)選在30至100個(gè)核苷酸范圍內(nèi)的連續(xù)的核苷酸段。優(yōu)選的鏈終止核苷酸是雙脫氧核苷酸。

      在另一個(gè)優(yōu)選的實(shí)施方案中,連續(xù)相同的核苷酸包含至少兩個(gè)核糖核苷酸或脫氧核糖核苷酸的混合物。

      在多核苷酸加尾反應(yīng)中包含一些量的一個(gè)另外的核苷酸可具有有益效果,這是由于多核苷酸尾部不再是同質(zhì)的,同時(shí)仍然具有類似的與引發(fā)寡核苷酸的結(jié)合效率。同時(shí),非同質(zhì)多核苷酸尾可有利于使用Illumina平臺(tái)進(jìn)行配對(duì)末端測序(pair-end sequencing),因?yàn)橥|(zhì)核苷酸測序非常容易出錯(cuò)。在優(yōu)選的實(shí)例中,期望產(chǎn)生包含非同質(zhì)核苷酸的混合物,因?yàn)閷⒃摶旌衔锾砑拥奖景l(fā)明方法的步驟a)中提供的單鏈核酸或雙鏈核酸而得到的多核苷酸尾對(duì)于在完成步驟e)之后使產(chǎn)生的核酸使用例如Illumina平臺(tái)進(jìn)行配對(duì)末端測序進(jìn)行序列測定方法是有益的,因?yàn)槭褂猛酆塑账峥赡馨l(fā)生不期望的干擾。

      優(yōu)選地,在單鏈DNA的情況下使用A、T、G或C,在單鏈RNA的情況下使用U或A。

      在本發(fā)明第一方面的另一個(gè)實(shí)施方案中,通過模板獨(dú)立的DNA和RNA聚合酶進(jìn)行步驟b)中相同核苷酸的添加。優(yōu)選地,這些蛋白質(zhì)是末端轉(zhuǎn)移酶、DNA或RNA連接酶或聚N聚合酶,其中N選自A、G或U。具有末端轉(zhuǎn)移酶活性的酶能夠?qū)⒑颂呛塑账峄蛎撗鹾颂呛塑账峄蚱涠嗑垠w添加到核酸的3’-OH末端,而不需要互補(bǔ)模板鏈。具有這種活性的優(yōu)選的酶選自:末端轉(zhuǎn)移酶、聚-(A)-聚合酶、聚-(U)-聚合酶和聚-(G)-聚合酶。RNA連接酶或DNA連接酶可添加單核苷酸、二核苷酸、三核苷酸或寡核苷酸,優(yōu)選添加單核苷酸、二核苷酸、三核苷酸。優(yōu)選的連接酶是T4RNA連接酶或T7RNA連接酶。所述連接酶可以有效地對(duì)在末端的3’-端核苷酸含有2’-O-甲基的RNA模板進(jìn)行加尾。優(yōu)選當(dāng)添加單核苷酸時(shí),RNA連接酶使用焦磷酸二核苷酸作為底物。

      步驟c)包括使引發(fā)寡核苷酸與先前添加的核苷酸序列雜交。該步驟優(yōu)選包括升高溫度以使得在引發(fā)寡核苷酸和添加的連續(xù)核苷酸之間形成堿基對(duì)。除了能夠與添加的連續(xù)核苷酸雜交的序列外,引發(fā)寡核苷酸還包含另外的限定序列,優(yōu)選5’-末端,其可以用于與另一個(gè)寡核苷酸特異性雜交,例如,用于PCR擴(kuò)增的寡核苷酸。該部分優(yōu)選長度為5至100個(gè)核苷酸。優(yōu)選地,其在3’端還包含所謂的鉤(hook)結(jié)構(gòu)。所述鉤優(yōu)選是與能夠與添加的連續(xù)核苷酸雜交之核苷酸不同的核苷酸,并且用于將引發(fā)寡核苷酸直接定位到步驟b)中添加的連續(xù)核苷酸的5’-末端或其附近的目的。優(yōu)選地,在本發(fā)明的方法中使用的引發(fā)寡核苷酸包含以下序列元件:

      3’-Wm-X-Yn-Z1o-Qt-Z2s-5‘

      其中

      W在每種情況下獨(dú)立地選自:dA、dG、dC、dT和dU;

      X選自:dA、dG、dC、dT、dU、rA、rG、rC、rT和rU;

      Y是至少10個(gè)核苷酸長度的多核苷酸,其中所述序列的80%或更多由選自以下的相同的核苷酸或二核苷酸構(gòu)成:dA、dG、dC、dT、dU、rA、rG、rC、rT、rU、AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和UT,其中所述序列的另外20%或更少由不同于主要核苷酸或二核苷酸并且也選自以下的核苷酸或二核苷酸構(gòu)成:dA、dG、dC、dT、dU、rA、rG、rC、rT、rU、AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和/或UT,前提條件是X不同于構(gòu)成Y大部分的核苷酸或二核苷酸;

      Q是連續(xù)的簡并(擺動(dòng))DNA堿基的序列,優(yōu)選地選自N、V、H、D、B和J,其中N是并入來自dA、dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;B是并入來自dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;D是并入來自dA、dT和dG等摩爾混合物的核苷酸的產(chǎn)物;H是并入來自dA、dT和dC等摩爾混合物的核苷酸的產(chǎn)物;V是并入來自dA、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,J是并入來自(0-100%dA)比(0-100%dG)比(0-100%dC)比(0-100%dT)比(0-100%dU)比(0-100%rA)比(0-100%rG)比(0-100%rC)比(0-100%rT)比(0-100%rU)的混合物的核苷酸的產(chǎn)物;

      Z1是限定序列的至少5個(gè)核苷酸長度的多核苷酸,其中所述序列不同于Wm-X-Yn,優(yōu)選所述序列也不同于Qt-Z2s;

      Z2是限定序列的至少5個(gè)核苷酸長度的多核苷酸,其中所述序列不同于Wm-X-Yn-Z1o-Qt

      m是0至6的整數(shù),即0、1、2、3、4、5或6;

      如果Y選自dA、dG、dC、dT、dU、rA、rG、rC、rT和rU,則n是10至100的整數(shù),如果Y選自AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和UT,則n是5至50的整數(shù);

      o是0或1;

      s是0或1;和

      t是0至6的整數(shù),即0、1、2、3、4、5或6。

      Y是能夠與添加的連續(xù)核酸雜交的引發(fā)寡核苷酸部分。因此,優(yōu)選其與添加的核酸具有至少90%的序列互補(bǔ)性。因此,優(yōu)選其具有對(duì)應(yīng)于所添加的連續(xù)核苷酸長度的長度,更優(yōu)選地長度為10至100個(gè)核苷酸,即10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個(gè)核苷酸。本發(fā)明人已經(jīng)發(fā)現(xiàn),短Y提高了序列精確度。然而,為了進(jìn)行雜交,優(yōu)選在嚴(yán)格條件下,優(yōu)選Y具有11至50,更優(yōu)選12至40,更優(yōu)選13至30,最優(yōu)選14至20的長度。

      本發(fā)明人已經(jīng)發(fā)現(xiàn),低數(shù)目的不相同的核苷酸和/或二核苷酸的存在提高了測序精確度。因此,優(yōu)選Y的序列由選自以下的至少80%的相同核苷酸和/或二核苷酸構(gòu)成:dA、dG、dC、dT、dU、rA、rG、rC、rT、rU、AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和UT,其中另外20%或更少由不同于主要核苷酸和/或二核苷酸并且也選自以下的核苷酸或二核苷酸構(gòu)成:dA、dG、dC、dT、dU、rA、rG、rC、rT、rU、AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和UT。在優(yōu)選的實(shí)施方案中,主要核苷酸是A和/或T。在另一個(gè)優(yōu)選的實(shí)施方案中,核苷酸是二核苷酸,優(yōu)選AA、TT、AT或TA。在另一個(gè)優(yōu)選的實(shí)施方案中,少數(shù)核苷酸是C和/或G。在另一個(gè)優(yōu)選的實(shí)施方案中,核苷酸是二核苷酸,優(yōu)選CC、GG、CG和/或GC。在優(yōu)選的實(shí)施方案中,Y的序列的80%至99%是由相同核苷酸和/或二核苷酸構(gòu)成,更優(yōu)選85%至95%(本領(lǐng)域技術(shù)人員清楚,在這種情況下,“n”必須至少為20),更優(yōu)選88%至92%,最優(yōu)選約90%。因此,在一個(gè)示例性優(yōu)選實(shí)施方案中,Y可以包含9個(gè)T核苷酸和一個(gè)G或C核苷酸或14個(gè)T和一個(gè)G或C。

      在Y包含一個(gè)或兩個(gè)不同核苷酸的情況下,優(yōu)選這個(gè)(這些)核苷酸位于Y的中間或接近中間(即在1至4個(gè)堿基內(nèi))。

      在本發(fā)明第二方面的另一個(gè)優(yōu)選實(shí)施方案中,優(yōu)選Y是僅由T組成的連續(xù)核苷酸段并且n的范圍為10至60、即50、45、40、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11或10,更優(yōu)選為11至50,更優(yōu)選12至40,更優(yōu)選13至30,最優(yōu)選14至20。更優(yōu)選n為30、20、16或15。最優(yōu)選n為20或16。在該優(yōu)選的實(shí)施方案的替選中,Y包含一個(gè)或兩個(gè)不同的核苷酸,進(jìn)一步優(yōu)選G或C。

      在一個(gè)替選的優(yōu)選實(shí)施方案中,Y的序列是除了1或2個(gè)G和/或C殘基之外僅由T組成的連續(xù)的核苷酸段。

      Z1是引發(fā)寡核苷酸的一部分,其在合成雙鏈核酸分子之后使用以進(jìn)行另一寡核苷酸的序列特異性雜交。因此,Z1優(yōu)選是添加至包含在樣品中的核酸的3’末端的限定序列。Z1的長度為至少5個(gè)核苷酸,更優(yōu)選在5至50個(gè)核苷酸的范圍內(nèi),更優(yōu)選在10至30個(gè)核苷酸的范圍內(nèi)。選擇長度以使引物可在隨后的PCR擴(kuò)增反應(yīng)中與Z1特異性雜交。在優(yōu)選的實(shí)施方案中,Z1的核酸序列選自:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15和SEQ ID NO:16。

      優(yōu)選地,Z1不同于Z2。

      Z2是引發(fā)寡核苷酸的一部分,其在合成雙鏈核酸分子之后使用以進(jìn)行另一寡核苷酸的序列特異性雜交。因此,Z2優(yōu)選是添加到包含在樣品中的核酸的3’-末端的限定序列。Z2的長度為至少5個(gè)核苷酸,更優(yōu)選在5至50個(gè)核苷酸的范圍內(nèi),更優(yōu)選在10至30個(gè)核苷酸的范圍內(nèi)。選擇長度以使引物可在隨后的PCR擴(kuò)增反應(yīng)中與Z1特異性雜交。在優(yōu)選的實(shí)施方案中,Z2的核酸序列選自:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15和SEQ ID NO:16或相應(yīng)的序列。

      優(yōu)選地,Z2不同于Z1。

      在引物中(即在Z1和Z2之間)包含1至6個(gè),更優(yōu)選2至4個(gè),即1、2、3、4、5或6個(gè)連續(xù)擺動(dòng)堿基將允許在文庫中分辨PCR重復(fù)。優(yōu)選地,Q是連續(xù)的簡并(擺動(dòng))DNA堿基的序列,優(yōu)選在每種情況下獨(dú)立地選自N、V、H、D、B和J,其中N是并入來自dA、dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;B是并入來自dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;D是并入來自dA、dT和dG等摩爾混合物的核苷酸的產(chǎn)物;H是并入來自dA、dT和dC等摩爾混合物的核苷酸的產(chǎn)物;V是并入來自dA、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,J是并入來自(0-100%dA)比(0-100%dG)比(0-100%dC)比(0-100%dT)比(0-100%dU)比(0-100%rA)比(0-100%rG)比(0-100%rC)比(0-100%rT)比(0-100%rU)的混合物的核苷酸的產(chǎn)物。優(yōu)選將連續(xù)的擺動(dòng)堿基包含在引發(fā)寡核苷酸中,因?yàn)槠溆兄谠谒a(chǎn)生的DNA文庫中分辨PCR重復(fù)。最優(yōu)選Q位于Z1和Z2之間并且為N。優(yōu)選地,Q為N,t為至少2,更優(yōu)選為4。

      在另一個(gè)優(yōu)選的實(shí)施方案中,t和s的和為0,例如,Z2和Q不存在。

      特別優(yōu)選的引發(fā)寡核苷酸的實(shí)例是具有根據(jù)SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20的核苷酸序列的核苷酸。

      一旦引發(fā)寡核苷酸退火,其3’末端通過模板依賴性DNA或RNA聚合酶(優(yōu)選還具有末端轉(zhuǎn)移酶活性的DNA或RNA聚合酶)延伸。這樣的酶的優(yōu)選實(shí)例是逆轉(zhuǎn)錄酶(reverse transcriptase,RT),特別是MMLV RT。一旦達(dá)到模板的末端,模板依賴性DNA或RNA聚合酶使用其末端轉(zhuǎn)移酶活性以不依賴于模板的形式添加額外的核苷酸。因此,步驟c)的產(chǎn)物是在新合成的鏈的3’-末端具有突出端的雙鏈核酸(DNA/DNA、RNA/RNA或DNA/RNA)。優(yōu)選地,該突出端的長度為至少1個(gè)核苷酸,優(yōu)選至少3個(gè)核苷酸。優(yōu)選地,這些核苷酸相同。它們優(yōu)選選自:dA、dC、dG、dT、rA、rC、rG和rU,最優(yōu)選地選自dC。因此,特別優(yōu)選的突出端由三個(gè)胞嘧啶核苷酸的連續(xù)段組成。

      在步驟d)中,模板轉(zhuǎn)換寡核苷酸(template switching oligonucleotide,TSO)與步驟c)的產(chǎn)物雜交,其允許模板依賴性DNA或RNA聚合酶(優(yōu)選RT)將限定序列添加到包含在樣品中的單鏈核酸或雙鏈核酸的5’末端。這通過進(jìn)一步延伸在步驟c)中合成的核酸鏈的3’末端來實(shí)現(xiàn)這點(diǎn)。術(shù)語“模板轉(zhuǎn)換寡核苷酸”指聚合酶活性從初始模板(例如通過本發(fā)明樣品提供的單鏈核酸)切換至的寡核苷酸模板。在本發(fā)明的一個(gè)實(shí)施方案中,模板轉(zhuǎn)換寡核苷酸是DNA/RNA雜交寡核苷酸,其被模板依賴性DNA或RNA聚合酶(優(yōu)選RT,優(yōu)選MMLV RT)用來在酶(優(yōu)選MMLV RT)到達(dá)模板核酸的5’-端并通過其末端轉(zhuǎn)移酶活性將核苷酸添加到合成的cDNA或cRNA鏈的3’-端之后繼續(xù)進(jìn)行逆轉(zhuǎn)錄,即,不依賴于模板的。TSO的3’-端與通過模板依賴性DNA或RNA聚合酶的末端轉(zhuǎn)移酶活性添加的核苷酸雜交,有效地延伸模板DNA或RNA的5’-端,從而使模板依賴性DNA或RNA聚合酶(優(yōu)選RT,更優(yōu)選MMLV RT)也逆轉(zhuǎn)錄TSO的剩余5’-部分,其包含將被添加到模板核酸的5’-末端的限定序列。如上文關(guān)于引發(fā)寡核苷酸所述的,這種限定序列不會(huì)與引發(fā)寡核苷酸序列或其互補(bǔ)序列雜交,并且優(yōu)選也不會(huì)與樣品中所含的核酸中存在的序列雜交。優(yōu)選地,其不會(huì)在雙鏈核酸(其是本發(fā)明方法的產(chǎn)物)的后續(xù)操作(特別是PCR或序列測定)中通常采用的條件下雜交。技術(shù)人員熟知如何選擇可用作TSO的限定序列的合適序列。此外,TSO在其3’末端包含一個(gè)或更多個(gè)核苷酸,優(yōu)選與步驟c)中通過RT酶添加的核苷酸互補(bǔ)的核糖核苷酸。優(yōu)選地,TSO在其3’-端包含1至10個(gè),即1、2、3、4、5、6、7、8、9或10個(gè),優(yōu)選3個(gè)連續(xù)的核苷酸,優(yōu)選核糖核苷酸。優(yōu)選地,如果添加兩個(gè)或更多個(gè)核苷酸,則這些核苷酸是相同的。

      在一個(gè)優(yōu)選的實(shí)施方案中,在本發(fā)明的方法中使用的TSO表示為以下序列元件

      5’-Xp-Y-Qt-Zq-Ar-3’

      其中

      X是選自氨基、生物素、甘油、膽固醇、地高辛、氟殘基或核苷酸衍生物的化學(xué)基團(tuán),所述核苷酸衍生物包括脫堿基核苷酸、雙脫氧核糖核苷酸、3’-脫氧核苷酸、2’-脫氧肌苷、2’-脫氧尿苷;

      Y是已知的寡核苷酸序列;

      Q是連續(xù)的簡并(擺動(dòng))DNA堿基的序列,優(yōu)選選自:N、V、H、D、B和J,其中N是并入來自dA、dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;B是并入來自dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;D是并入來自dA、dT和dG等摩爾混合物的核苷酸的產(chǎn)物;H是并入來自dA、dT和dC等摩爾混合物的核苷酸的產(chǎn)物;V是并入來自dA、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,J是并入來自(0-100%dA)比(0-100%dG)比(0-100%dC)比(0-100%dT)比(0-100%dU)比(0-100%rA)比(0-100%rG)比(0-100%rC)比(0-100%rT)比(0-100%rU)的混合物的核苷酸的產(chǎn)物;

      Z是選自AMP、CMP、GMP、TMP和UMP的核糖核苷酸,

      A是選自氨基、生物素、甘油、膽固醇、地高辛、磷酸/鹽/酯、氟殘基或核苷酸衍生物的化學(xué)基團(tuán),所述核苷酸衍生物包括脫堿基核苷酸、雙脫氧核糖核苷酸、3’-脫氧核苷酸、2’-脫氧肌苷、2’-脫氧尿苷;

      t是0至6的整數(shù),即0、1、2、3、4、5或6;

      p是0至10的整數(shù),即0、1、2、3、4、5、6、7、8、9或10;

      q是至少為1的整數(shù);和

      r是0至10的整數(shù),即0、1、2、3、4、5、6、7、8、9或10。

      本領(lǐng)域技術(shù)人員應(yīng)理解,在其中包含擺動(dòng)堿基的情況下,權(quán)利要求實(shí)際上是指在擺動(dòng)堿基處序列存在差異的TSO的混合物,其中一種核苷酸相對(duì)于另一種核苷酸的相對(duì)豐度由相應(yīng)的用于合成TSO中該核苷酸位置的核苷酸混合物中的核苷酸的摩爾比確定。

      向TSO的5’-末端添加大的化學(xué)基團(tuán)(例如生物素、幾種脫堿基核苷酸、熒光染料等)降低了第二模板轉(zhuǎn)換事件的可能性,并且因而降低了含有兩個(gè)或更多個(gè)拷貝的5’-末端序列的DNA產(chǎn)物的發(fā)生率。優(yōu)選X是生物素。

      Y是已知序列,也稱為限定序列,因而在步驟a)的核酸的5’-端添加核苷酸序列,隨后添加到本發(fā)明方法中產(chǎn)生的雙鏈核酸中,其可以是單獨(dú)或與添加到步驟b)中單鏈核酸或雙鏈核酸的3’-端的限定核酸序列一起用于隨后的步驟中,例如,擴(kuò)增、檢測或修飾從本發(fā)明方法的步驟e)得到的雙鏈核酸。因此,優(yōu)選Y具有足夠的長度以允許寡核苷酸(例如具有15至50個(gè)核苷酸長度,更優(yōu)選20至40個(gè)核苷酸的寡核苷酸)特異性雜交。優(yōu)選地,其序列不同于步驟a)的單鏈核酸或雙鏈核酸中發(fā)現(xiàn)的任何序列,也不同于步驟b)中添加至3’的任何序列。在優(yōu)選的實(shí)施方案中,Y選自:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15和SEQ ID NO:16或相應(yīng)的序列。

      在反向引物中包含1至6個(gè),更優(yōu)選2至4個(gè),即1、2、3、4、5或6個(gè)連續(xù)的擺動(dòng)堿基將有助于在文庫中分辨PCR重復(fù)。因此,在一個(gè)優(yōu)選的實(shí)施方案中,Q是N、V、H、D、B或J,其中J為包含以下的混合物:(0-100%dA)比(0-100%dA)dG比(0-100%dA)dC比(0-100%dA)dT比(0-100%dA)dU比(0-100%dA)rA比(0-100%dA)rG比(0-100%dA)rC比(0-100%dA)rT比(0-100%dA)rU。優(yōu)選將連續(xù)的擺動(dòng)堿基包含在引發(fā)寡核苷酸中,因?yàn)槠溆兄谠谒a(chǎn)生的DNA文庫中分辨PCR重復(fù)。最優(yōu)選Q位于Z1和Z2之間并且為N。優(yōu)選地,Q為N,t為至少2,更優(yōu)選為4。

      連續(xù)的擺動(dòng)堿基的添加將有助于分辨所產(chǎn)生的文庫中的PCR重復(fù)。優(yōu)選地,Q為N,t為至少2,更優(yōu)選為4。

      向TSO的3’-末端的3’-OH基團(tuán)添加化學(xué)“封閉”基團(tuán)(例如磷酸/鹽/酯、生物素、甲基、熒光染料等)防止TSO的多核苷酸加尾,如果同時(shí)進(jìn)行多核苷酸加尾和逆轉(zhuǎn)錄二者,則TSO的多核苷酸加尾將發(fā)生。此外,向TSO的3’末端添加化學(xué)“封閉”基團(tuán)將不再需要在RT反應(yīng)之前的加尾反應(yīng)中使用熱失活模板非依賴性DNA或RNA聚合酶或連接酶。最后,向TSO添加化學(xué)“封閉”基團(tuán)可以減少對(duì)于在5’端攜帶rG核苷酸的模板的偏向,當(dāng)在RNA模板上使用3’-OH未封閉的TSO時(shí)會(huì)觀察到這種現(xiàn)象。優(yōu)選A選自氨基、生物素、甘油、膽固醇、地高辛、磷酸/鹽/酯、氟殘基或包括脫堿基核苷酸、雙脫氧核糖核苷酸、3’-脫氧核苷酸、2’-脫氧肌苷、2’-脫氧尿苷的核苷酸衍生物。更優(yōu)選地,A是選自脫堿基呋喃、rSpacer、Spacer 18、Spacer 9、Spacer C3或Spacer C12的脫堿基核苷酸。甚至更優(yōu)選地,A包含多于一個(gè)脫堿基位點(diǎn),并且是脫堿基呋喃,即三個(gè)連續(xù)的脫堿基呋喃。

      本發(fā)明的步驟c)包括引發(fā)寡核苷酸的雜交和用合適的酶(例如逆轉(zhuǎn)錄酶)合成cDNA或cRNA以產(chǎn)生雙鏈核酸。在一個(gè)優(yōu)選的實(shí)施方案中,用末端脫氧核苷酸轉(zhuǎn)移酶(步驟b))進(jìn)行加尾反應(yīng)并用逆轉(zhuǎn)錄酶進(jìn)行雜交反應(yīng)(步驟c))。更優(yōu)選地,所用的逆轉(zhuǎn)錄酶同時(shí)具有聚合酶活性和末端轉(zhuǎn)移酶活性,因此,所述酶可用于進(jìn)行本發(fā)明方法的步驟b)以及步驟c)。甚至更優(yōu)選地,所述逆轉(zhuǎn)錄酶選自,例如可從NEB獲得的MMLV RT,例如可從Invitrogen獲得的Superscript II RT或Superscript III RT,例如可從Applied Biosystems獲得的Multiscribe RT,例如可從Clontech獲得的SMART MMLV RT或SMARTScribe RT。在一個(gè)甚至更優(yōu)選的實(shí)施方案中,使用M-MLV SuperScribe II RT或SmartScribe RT。優(yōu)選選擇具有聚合酶活性(即,可基于模板核酸合成互補(bǔ)核酸)和末端轉(zhuǎn)移酶活性(即,當(dāng)?shù)竭_(dá)單鏈核酸的5’末端時(shí),在沒有模板的情況下能夠添加額外的核糖核苷酸和/或脫氧核糖核苷酸)二者的聚合酶。優(yōu)選地,它們能夠向單鏈核酸的5’末端引入1個(gè)或更多個(gè),優(yōu)選2至20個(gè),即2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個(gè)額外的核糖核苷酸和/或脫氧核糖核苷酸雜交,從而使模板轉(zhuǎn)換寡核苷酸與核酸鏈的3’末端之間雜交。優(yōu)選逆轉(zhuǎn)錄酶主要包含同質(zhì)核苷酸段,優(yōu)選同質(zhì)三核苷酸段,其隨后促進(jìn)逆轉(zhuǎn)錄酶從模板核酸到模板轉(zhuǎn)換寡核苷酸的雜交。更優(yōu)選地,添加三種dCTP或rCTP。

      在本發(fā)明的另一個(gè)實(shí)施方案中,通過根據(jù)本發(fā)明方法的步驟e)的cDNA或cRNA的3’末端的延伸來合成雙鏈核酸需要酶活性。TSO與本發(fā)明方法的步驟c)中產(chǎn)生的雙鏈核酸的添加的同質(zhì)三核苷酸的雜交允許使用TSO作為新模板延伸合成的核酸鏈。優(yōu)選地,通過逆轉(zhuǎn)錄酶,更優(yōu)選通過MLLV逆轉(zhuǎn)錄酶進(jìn)行反應(yīng)。在另一個(gè)優(yōu)選的實(shí)施方案中,所用的逆轉(zhuǎn)錄酶能夠轉(zhuǎn)換至包含DNA/RNA和/或DNA/DNA雙鏈核酸的模板。

      通過本發(fā)明的方法合成的核酸可以在下游應(yīng)用中進(jìn)行進(jìn)一步分析,即深度測序、基因分型或克隆。

      在本發(fā)明的一個(gè)實(shí)施方案中,優(yōu)選通過物理吸附、共價(jià)結(jié)合、親和結(jié)合或基質(zhì)包埋將雙鏈核酸固定到表面上。更優(yōu)選地,將本發(fā)明的核酸固定到微芯片、微陣列表面、二氧化硅基支持物、下一代測序平臺(tái)特異性固體支持物上。

      本發(fā)明的方法還可包括使用合成的雙鏈核酸作為PCR擴(kuò)增的模板的步驟。根據(jù)一個(gè)實(shí)施方案,本發(fā)明的方法還包括使合成的雙鏈核酸或由其來源的單鏈經(jīng)受擴(kuò)增條件。這樣的條件可包括添加被配置為擴(kuò)增合成的雙鏈核酸的全部或期望部分的正向或反向引物、dNTP和適于有效擴(kuò)增的聚合酶,優(yōu)選熱穩(wěn)定聚合酶。進(jìn)行擴(kuò)增的初始步驟可包括雙鏈合成核酸的變性,并使合成的核酸可用于引物結(jié)合。合成的雙鏈核酸優(yōu)選包含引發(fā)寡核苷酸序列的至少一部分、所提供的單鏈核酸的互補(bǔ)鏈以及TSO的至少一部分。這些關(guān)于兩條合成的核酸鏈的信息能夠提供與各自序列互補(bǔ)的寡核苷酸以產(chǎn)生更大量的合成的雙鏈核酸。在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明的方法包括使至少一種能夠至少與步驟c)的引發(fā)寡核苷酸的一部分或步驟d)的模板轉(zhuǎn)換寡核苷酸雜交的寡核苷酸與步驟e)中合成的雙鏈核酸雜交。優(yōu)選地,一個(gè)引物與引發(fā)寡核苷酸互補(bǔ),另一個(gè)引物與模板轉(zhuǎn)換寡核苷酸互補(bǔ)。引物濃度可在200-300nM的濃度范圍內(nèi)使用,即210、220、230、240、250、260、270、280、290、300nM。

      可以在下游應(yīng)用中進(jìn)一步分析本發(fā)明方法的步驟f)的擴(kuò)增產(chǎn)物,即深度測序、基因分型或克隆。在本發(fā)明的一個(gè)實(shí)施方案中,優(yōu)選通過物理吸附、共價(jià)結(jié)合、親和結(jié)合或基質(zhì)包埋將擴(kuò)增產(chǎn)物固定到表面上。

      通過擴(kuò)增合成的雙鏈核酸,可以產(chǎn)生大量能夠?qū)崿F(xiàn)多種下游操作技術(shù)的核酸。由于合成的核酸具有限定的3’末端和5’末端,使得能夠在本發(fā)明的方法所提供的單鏈核酸內(nèi)測定目的序列。因此,在一個(gè)優(yōu)選的實(shí)施方案中,本發(fā)明的方法還包括確定單鏈核酸序列的至少一部分的步驟。優(yōu)選地,確定單鏈核酸的完整序列。

      本發(fā)明的第二方面提供了包含以下序列元件的引發(fā)寡核苷酸:

      3’-Wm-X-Yn-Z1o-Qt-Z2s-5‘

      其中

      W在每種情況下獨(dú)立地選自:dA、dG、dC、dT和dU;

      X選自:dA、dG、dC、dT、dU、rA、rG、rC、rT和rU;

      Y是至少10個(gè)核苷酸長度的多核苷酸,其中所述序列的80%或更多由選自以下的相同的核苷酸或二核苷酸構(gòu)成:dA、dG、dC、dT、dU、rA、rG、rC、rT、rU、AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和UT,其中所述序列的另外20%或更少由不同于主要核苷酸或二核苷酸并且也選自以下的核苷酸或二核苷酸構(gòu)成:dA、dG、dC、dT、dU、rA、rG、rC、rT、rU、AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和/或UT,前提條件是X不同于構(gòu)成Y大部分的核苷酸或二核苷酸;

      Q是連續(xù)的簡并(擺動(dòng))DNA堿基的序列,優(yōu)選地選自:N、V、H、D、B和J,其中N是并入來自dA、dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,即為dA、dT、dC或dG;B是并入來自dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,即為dT、dC或dG;D是并入來自dA、dT和dG等摩爾混合物的核苷酸的產(chǎn)物,即為dA、dT或dG;H是并入來自dA、dT和dC等摩爾混合物的核苷酸的產(chǎn)物,即為dA、dT或dC;V是并入來自dA、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,即為dA、dC或dG,J是并入來自(0-100%dA)比(0-100%dG)比(0-100%dC)比(0-100%dT)比(0-100%dU)比(0-100%rA)比(0-100%rG)比(0-100%rC)比(0-100%rT)比(0-100%rU)的混合物的核苷酸的產(chǎn)物;

      Z1是限定序列的至少5個(gè)核苷酸長度的多核苷酸,其中所述序列不同于Wm-X-Yn,優(yōu)選所述序列也不同于Qt-Z2s;

      Z2是限定序列的至少5個(gè)核苷酸長度的多核苷酸,其中所述序列不同于Wm-X-Yn-Z1o-Qt;

      m是0至6的整數(shù),即0、1、2、3、4、5或6;

      如果Y選自dA、dG、dC、dT、dU、rA、rG、rC、rT和rU,則n是10至100的整數(shù),如果Y選自AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和UT,則n是5至50的整數(shù);

      o是0或1;

      s是0或1;和

      t是0至6的整數(shù),即0、1、2、3、4、5或6。

      Y是能夠與添加的連續(xù)核酸雜交的引發(fā)寡核苷酸的一部分。因此,優(yōu)選其與添加的核酸具有至少90%的序列互補(bǔ)性。因此,其優(yōu)選具有對(duì)應(yīng)于所添加的連續(xù)核苷酸的長度的長度,更優(yōu)選地具有10至100個(gè)核苷酸的長度,即10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100個(gè)核苷酸。本發(fā)明人已經(jīng)發(fā)現(xiàn),短Y提高了序列精確度。然而,為了進(jìn)行雜交,優(yōu)選在嚴(yán)格條件下,優(yōu)選Y具有11至50,更優(yōu)選12至40,更優(yōu)選13至30,最優(yōu)選14至20的長度。

      本發(fā)明人已經(jīng)發(fā)現(xiàn),低數(shù)目的不相同的核苷酸和/或二核苷酸的存在提高了測序精確度。因此優(yōu)選Y的序列由選自以下的至少80%的相同核苷酸或二核苷酸構(gòu)成:dA、dG、dC、dT、dU、rA、rG、rC、rT、rU、AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和UT,其中另外20%或更少由不同于主要核苷酸和/或二核苷酸并且也選自以下的核苷酸和/或二核苷酸構(gòu)成:dA、dG、dC、dT、dU、rA、rG、rC、rT、rU、AC、AG、AT、AU、CA、CG、CT、CU、GA、GC、GT、GU、TA、TC、TG、TU、AA、CC、GG、TT、UU、UA、UC、UG和UT。在一個(gè)優(yōu)選的實(shí)施方案中,主要核苷酸是A和/或T。在另一個(gè)優(yōu)選的實(shí)施方案中,核苷酸是二核苷酸,優(yōu)選AA、TT、AT或TA。在另一個(gè)優(yōu)選的實(shí)施方案中,次要核苷酸C和/或G。在另一個(gè)優(yōu)選的實(shí)施方案中,核苷酸是二核苷酸,優(yōu)選CC、GG、CG和/或GC。在優(yōu)選的實(shí)施方案中,Y的序列的80%至99%由相同的核苷酸和/或二核苷酸組成,更優(yōu)選85%至95%(本領(lǐng)域技術(shù)人員清楚,在這種情況下,“n”必須至少為20),更優(yōu)選88%至92%,最優(yōu)選約90%。因此,在一個(gè)示例性的優(yōu)選實(shí)施方案中,Y可包含9個(gè)T核苷酸和一個(gè)G或C核苷酸或者14個(gè)T和一個(gè)G或C。

      在其中Y包含一個(gè)或兩個(gè)不同核苷酸的情況下,優(yōu)選這個(gè)(這些)核苷酸位于Y的中間或接近中間(即在1至4個(gè)堿基內(nèi))。

      在本發(fā)明第二方面的另一個(gè)優(yōu)選實(shí)施方案中,優(yōu)選Y是僅由T組成的連續(xù)核苷酸段并且n的范圍為10至60、即50、45、40、35、34、33、32、31、30、29、28、27、26、25、24、23、22、21、20、19、18、17、16、15、14、13、12、11或10,更優(yōu)選11至50,更優(yōu)選12至40,更優(yōu)選13至30,最優(yōu)選14至20。更優(yōu)選n為30、20、16或15。最優(yōu)選n為20或16。在該優(yōu)選實(shí)施方案的替選中,Y包含一個(gè)或兩個(gè)不同的核苷酸,還優(yōu)選G或C。

      在一個(gè)替選的優(yōu)選實(shí)施方案中,Y的序列是除了1或2個(gè)G和/或C殘基之外僅由T組成的連續(xù)核苷酸段。

      Z1是引發(fā)寡核苷酸的一部分,其在合成雙鏈核酸分子之后使用以進(jìn)行另一寡核苷酸的序列特異性雜交。因此,Z1優(yōu)選是添加到包含在樣品中的核酸的3’末端的限定序列。Z1的長度為至少5個(gè)核苷酸,更優(yōu)選在5至50個(gè)核苷酸的范圍內(nèi),更優(yōu)選在10至30個(gè)核苷酸的范圍內(nèi)。選擇長度以使引物可在隨后的PCR擴(kuò)增反應(yīng)中與Z1特異性雜交。在一個(gè)優(yōu)選的實(shí)施方案中,Z1的核酸序列選自:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15和SEQ ID NO:16。

      優(yōu)選地,Z1不同于Z2。

      Z2是引發(fā)寡核苷酸的一部分,其在合成雙鏈核酸分子之后使用以進(jìn)行另一寡核苷酸的序列特異性雜交。因此,Z2優(yōu)選是添加到包含在樣品中的核酸的3’-末端的限定序列。Z2的長度為至少5個(gè)核苷酸,更優(yōu)選在5至50個(gè)核苷酸的范圍內(nèi),更優(yōu)選在10至30個(gè)核苷酸的范圍內(nèi)。選擇長度以使得引物可在隨后的PCR擴(kuò)增反應(yīng)中與Z1特異性雜交。在一個(gè)優(yōu)選的實(shí)施方案中,Z2的核酸序列選自:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ ID NO:14、SEQ ID NO:15和SEQ ID NO:16或相應(yīng)的序列。

      優(yōu)選地,Z2不同于Z1。

      在引物中(即,在Z1和Z2之間)包含1至6個(gè),更優(yōu)選2至4個(gè),即1、2、3、4、5或6個(gè)連續(xù)的擺動(dòng)堿基將允許在文庫中分辨PCR重復(fù)。優(yōu)選地,Q是連續(xù)的簡并(擺動(dòng))DNA堿基的序列,優(yōu)選在每種情況下獨(dú)立地選自:N、V、H、D、B和J,其中N是并入來自dA、dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;B是并入來自dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;D是并入來自dA、dT和dG等摩爾混合物的核苷酸的產(chǎn)物;H是并入來自dA、dT和dC等摩爾混合物的核苷酸的產(chǎn)物;V是并入來自dA、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,J是并入來自(0-100%dA)比(0-100%dG)比(0-100%dC)比(0-100%dT)比(0-100%dU)比(0-100%rA)比(0-100%rG)比(0-100%rC)比(0-100%rT)比(0-100%rU)的混合物的核苷酸的產(chǎn)物。優(yōu)選將連續(xù)的擺動(dòng)堿基包含在引發(fā)寡核苷酸中,因?yàn)槠溆兄谠谒a(chǎn)生的DNA文庫中分辨PCR重復(fù)。最優(yōu)選Q位于Z1和Z2之間并且為N。優(yōu)選地,Q為N,t為至少2,更優(yōu)選為4。

      在另一個(gè)優(yōu)選的實(shí)施方案中,t和s的和為0,例如,Z2和Q不存在。

      特別優(yōu)選的引發(fā)寡核苷酸的實(shí)例是具有根據(jù)SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20的核苷酸序列的核苷酸。

      在第三方面,本發(fā)明提供了包含以下序列元件的模板轉(zhuǎn)換寡核苷酸

      5’-Xp-Y-Qt-Zq-Ar-3’

      其中

      X是選自氨基、生物素、甘油、膽固醇、地高辛、氟殘基或核苷酸衍生物的化學(xué)基團(tuán),所述核苷酸衍生物包括脫堿基核苷酸、雙脫氧核糖核苷酸、3’-脫氧核苷酸、2’-脫氧肌苷和2’-脫氧尿苷,優(yōu)選生物素;

      Y是已知(限定)的寡核苷酸序列;

      Q是連續(xù)的簡并(擺動(dòng))DNA堿基的序列,優(yōu)選選自:N、V、H、D、B和J,其中N是并入來自dA、dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;B是并入來自dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;D是并入來自dA、dT和dG等摩爾混合物的核苷酸的產(chǎn)物;H是并入來自dA、dT和dC等摩爾混合物的核苷酸的產(chǎn)物;V是并入來自dA、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,J是并入來自(0-100%dA)比(0-100%dG)比(0-100%dC)比(0-100%dT)比(0-100%dU)比(0-100%rA)比(0-100%rG)比(0-100%rC)比(0-100%rT)比(0-100%rU)的混合物的核苷酸的產(chǎn)物;

      Z是選自AMP、CMP、GMP、TMP和UMP的核糖核苷酸,優(yōu)選GMP,

      A是選自氨基、生物素、甘油、膽固醇、地高辛、磷酸/鹽/酯、氟殘基或核苷酸衍生物的化學(xué)基團(tuán),所述核苷酸衍生物包括脫堿基核苷酸、雙脫氧核糖核苷酸、3’-脫氧核苷酸、2’-脫氧肌苷和2’-脫氧尿苷;

      p是0至10的整數(shù),即1、2、3、4、5、6、7、8、9或10;更優(yōu)選1或2,最優(yōu)選1,

      q是至少為1的整數(shù);優(yōu)選1至10,即,1、2、3、4、5、6、7、8、9或10,最優(yōu)選3,

      r是0至10的整數(shù),即0、1、2、3、4、5、6、7、8、9或10,優(yōu)選0或1,最優(yōu)選0,并且

      t是0至6的整數(shù),即0、1、2、3、4、5或6。

      向TSO的5’-端添加大體積的化學(xué)基團(tuán)(例如生物素、幾個(gè)脫堿基位點(diǎn)、熒光染料等)降低了第二模板轉(zhuǎn)換事件的可能性,并因此降低了含有兩個(gè)或更多個(gè)拷貝的5’-端序列的DNA產(chǎn)物的發(fā)生率。優(yōu)選X是生物素。

      Y是也稱為限定序列的已知序列,從而在步驟a)的核酸的5’-端添加核苷酸序列,隨后添加到本發(fā)明方法中產(chǎn)生的雙鏈核酸中,其可以是單獨(dú)或與在步驟b)中添加到單鏈核酸或雙鏈核酸的3’-末端的限定核酸序列一起用于隨后的步驟中,從而例如,擴(kuò)增、檢測或修飾從本發(fā)明方法的步驟e)得到的雙鏈核酸。因此,優(yōu)選Y具有足夠的長度以使例如具有15至50個(gè)核苷酸(更優(yōu)選20至40個(gè)核苷酸)的寡核苷酸特異性雜交。優(yōu)選地,其序列不同于步驟a)的單鏈核酸或雙鏈核酸中發(fā)現(xiàn)的任何序列,也不同于步驟b)中添加至3’的任何序列。在優(yōu)選的實(shí)施方案中,Y選自:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:12、SEQ ID NO:13、SEQ IDNO:14、SEQ ID NO:15和SEQ ID NO:16或相應(yīng)的序列。

      在另一個(gè)優(yōu)選的實(shí)施方案中,Q是連續(xù)的簡并(擺動(dòng))DNA堿基序列,優(yōu)選選自:N、V、H、D、B和J,其中N是來自并入dA、dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;B是并入來自dT、dC和dG等摩爾混合物的核苷酸的產(chǎn)物;D是并入來自dA、dT和dG等摩爾混合物的核苷酸的產(chǎn)物;H是并入來自dA、dT和dC等摩爾混合物的核苷酸的產(chǎn)物;V是并入來自dA、dC和dG等摩爾混合物的核苷酸的產(chǎn)物,J是并入來自(0-100%dA)比(0-100%dA)dG比(0-100%dA)dC比(0-100%dA)dT比(0-100%dA)dU比(0-100%dA)rA比(0-100%dA)rG比(0-100%dA)rC比(0-100%dA)rT比(0-100%dA)rU的混合物的核苷酸的的產(chǎn)物。

      A具有如上在本發(fā)明的第一方面的上下文中所述的功能。優(yōu)選地,A選自:氨基、生物素、甘油、膽固醇、地高辛、磷酸/鹽/酯、氟殘基或者包括脫堿基核苷酸、雙脫氧核糖核苷酸、3’-脫氧核苷酸、2’-脫氧肌苷、2’-脫氧尿苷的核苷酸衍生物。更優(yōu)選地,A為選自:脫堿基呋喃、rSpacer、Spacer 18、Spacer 9、Spacer C3或Spacer C12的脫堿基核苷酸。甚至更優(yōu)選地,A包含一個(gè)以上的脫堿基位點(diǎn),即三個(gè)連續(xù)的脫堿基呋喃。

      在第四方面,本發(fā)明提供了包含本發(fā)明第二方面的引發(fā)寡核苷酸的核酸。優(yōu)選地,核酸含有所使用的引發(fā)寡核苷酸的序列。

      在本發(fā)明的第五方面提供了試劑盒,所述試劑盒提供本發(fā)明的第一方面的方法的性能。試劑盒可包含進(jìn)行本發(fā)明每個(gè)方法步驟a)至f)所必需的試劑。試劑盒可包括例如一種或更多種關(guān)于方法步驟a)至f)的主題描述的任何反應(yīng)混合物組分。例如,試劑盒可包含聚合酶(例如,能夠模板轉(zhuǎn)換的聚合酶、熱穩(wěn)定聚合酶或其組合)、引發(fā)寡核苷酸、模板轉(zhuǎn)換寡核苷酸、dNTP、鹽、酶的合適輔因子、核酸酶抑制劑(例如RNA酶抑制劑或DNA酶抑制劑)、用于促進(jìn)富含GC序列的擴(kuò)增或復(fù)制的一種或更多種添加劑(例如甜菜堿、二甲亞砜、乙二醇或1、2-丙二醇或其組合、一種或更多種去穩(wěn)定劑(例如,二硫蘇糖醇),能夠產(chǎn)生具有3’突出端的雙鏈核酸的酶(例如限制性內(nèi)切核酸酶、末端轉(zhuǎn)移酶或其組合)和封閉核苷酸,優(yōu)選3d-NTP、3-Me-NTP和ddNTP或任何其他所需的試劑盒組分,例如管、珠、微流體芯片等。在本發(fā)明試劑盒的優(yōu)選實(shí)施方案中,本發(fā)明試劑盒包括能夠?qū)⒑塑账崽砑拥絾捂満怂岬?-端的試劑,優(yōu)選酶,更優(yōu)選聚A聚合酶或末端轉(zhuǎn)移酶。優(yōu)選試劑盒還包含引發(fā)寡核苷酸和模板轉(zhuǎn)換寡核苷酸以及任選地能夠切割蛋白質(zhì)中肽鍵的酶,更優(yōu)選地,該酶是內(nèi)肽酶或外肽酶,最優(yōu)選蛋白酶K。在該方面的另一個(gè)優(yōu)選實(shí)施方案中,試劑盒可提供進(jìn)行序列測定方法所需的試劑。更優(yōu)選地,試劑盒提供的試劑提供用于下一代測序的工具,例如使用捕獲探針的靶標(biāo)富集。

      在第六方面,本發(fā)明提供了包含至少一種本發(fā)明第四方面的核酸的陣列。優(yōu)選地,陣列允許所述核酸序列的序列測定。更優(yōu)選地,所述陣列可用于測量表達(dá)水平的變化、檢測單核苷酸多態(tài)性(SNP)或用于基因分型或靶向重測序或提供用于深度測序的工具。

      大規(guī)模平行測序(MPS)技術(shù)在例如個(gè)體化醫(yī)學(xué)的若干研究領(lǐng)域中開辟了進(jìn)入新領(lǐng)域的途徑。期望提供在特定細(xì)胞類型、組織或器官中在任何特定時(shí)間存在的核酸分子的序列和頻率。例如,計(jì)數(shù)由單個(gè)基因編碼的mRNA的數(shù)目(所謂的轉(zhuǎn)錄組)提供了蛋白質(zhì)編碼潛力的指示,蛋白質(zhì)編碼潛力是表型的主要貢獻(xiàn)者。在第七方面,本發(fā)明提供了通過本發(fā)明的方法合成的雙鏈核酸或由其來源的單鏈核酸的用途。在一個(gè)優(yōu)選的實(shí)施方案中,通過本發(fā)明的方法合成的核酸可以用于測序或表達(dá)分析、克隆、標(biāo)記、用于鑒定基因或特定核苷酸序列。優(yōu)選地,所述用途包括在以下方面的用途:個(gè)性化醫(yī)療;治療監(jiān)測;人或動(dòng)物疾病的預(yù)測、預(yù)后、早期檢測或法醫(yī)學(xué);病毒、細(xì)菌、真菌、動(dòng)物或植物或其來源之細(xì)胞的核酸序列的分析,優(yōu)選用于植物的表征;果實(shí)育種檢查;植物、種子或果實(shí)的疾病檢測。

      實(shí)施例

      實(shí)施例1:RNA和DNA樣品

      使用合成cel-miR-39(Sigma-Aldrich),來自線蟲(C.elegans)的22nt微小RNA作為小RNA測序?qū)φ盏妮斎?。使用序列與cel-miR-39等同的合成22nt DNA(Sigma-Aldrich)作為DNA測序?qū)φ盏妮斎?。從來自兩個(gè)自愿健康供體(DI,女性和DII,男性)血液樣品的血漿級(jí)分中分離循環(huán)DNA。從兩個(gè)自愿的女性健康供體(RI和RII)的血漿中分離循環(huán)RNA。該樣品收集經(jīng)海德堡醫(yī)學(xué)院倫理委員會(huì)批準(zhǔn)。將從人血漿分離的循環(huán)DNA和RNA、來自U2OS細(xì)胞的亞硫酸氫鹽轉(zhuǎn)化的DNA和來自U2OS細(xì)胞的Mg2+分級(jí)的聚A富集的總RNA用作cDNA文庫制備和隨后的Illumina MiSeq測序的輸入。

      實(shí)施例2:用于cDNA合成的寡核苷酸

      在圖2-5中提供了在本工作中使用的所有引物的序列。在該方法的開發(fā)期間測試了幾種不同結(jié)構(gòu)的模板轉(zhuǎn)換寡核苷酸(TSO)。

      實(shí)施例3:第一鏈cDNA合成和模板轉(zhuǎn)換

      將合成的小RNA或DNA在水中稀釋以達(dá)到1ng/μl和5pg/μl的濃度,并用作合成第一鏈cDNA的起始材料。生成隨時(shí)可測序的DNA文庫的優(yōu)化方案如下。使用大腸桿菌聚(A)聚合酶(New England Biolabs)在含有10單位重組RNAse抑制劑(Clontech)和0.1mM ATP的1×PAP緩沖液中在37℃下將RNA聚腺苷酸化10分鐘,并通過在65℃加熱20分鐘終止。在37℃下,使用末端脫氧核苷酸轉(zhuǎn)移酶(New England Biolabs)在1×TdT緩沖液和0.1mM dATP中對(duì)DNA進(jìn)行30分鐘聚(dA)加尾,并在70℃下熱滅活10分鐘。在聚(dA)加尾之前,通過在95℃加熱5分鐘將循環(huán)DNA和亞硫酸氫鹽轉(zhuǎn)化的DNA樣品變性并在冰上快速冷卻。在一些實(shí)驗(yàn)中,在聚(A/dA)加尾之前,將RNA和DNA模板在1×PAP/TdT緩沖液中用T4多核苷酸激酶(New England Biolabs)預(yù)處理10分鐘。對(duì)于逆轉(zhuǎn)錄,將1μl的聚(A)加尾的RNA或聚(dA)加尾的DNA與2.5μl含有20%DMSO的1×第一鏈RT緩沖液和1μl單堿基錨定的Illumina聚(dT)引物混合(對(duì)于1ng的RNA或DNA,終濃度為0.1μM,對(duì)于5pg的RNA或DNA,終濃度為0.001μM)。將整個(gè)溶液在72℃下孵育2分鐘,然后42℃下冷卻1分鐘。在下一步中,將含有2μl 5×第一鏈RT緩沖液(Clontech)、1μl dNTP(各10mM)、1μl SmartScribe RT聚合酶(Clontech)、0.25μl DTT(100mM)和0.25μl重組RNAse抑制劑(Clontech)的主混合物(master mix)添加到DNA(RNA)/引物溶液中,并在42℃下孵育15分鐘。接下來,將1μl的10μM 5’-生物素封閉的模板轉(zhuǎn)換寡核苷酸(TSO)添加到RT反應(yīng)中,并在42℃下再溫育15分鐘。通過在70℃下加熱10分鐘終止RT反應(yīng)。在100μl的總體積中,使用1μl或10μl的RT反應(yīng)進(jìn)行cDNA擴(kuò)增。使用終濃度為250nM的cDNA擴(kuò)增引物在2×Taq聚合酶主混合物(Qiagen)中進(jìn)行cDNA的擴(kuò)增(圖2A)。使用Qiaquick PCR純化試劑盒(Qiagen)對(duì)擴(kuò)增的cDNA進(jìn)行柱純化,并通過GATC GmbH(Konstanz,Germany)的Sanger自動(dòng)測序進(jìn)行測序。對(duì)于下一代測序,使用PureLink Gel Extraction試劑盒(Life Technologies)從4%瓊脂糖凝膠中另外純化DNA片段,并用Agilent Bioanalyser高靈敏度DNA芯片進(jìn)行分析。

      實(shí)施例4:深度測序

      Illumina MiSeq平臺(tái)用于對(duì)通過上述方法制備的DNA文庫進(jìn)行測序。使用由Illumina標(biāo)準(zhǔn)測序引物和3’-端GGG三核苷酸組成的定制測序引物進(jìn)行Illumina MiSeq測序以成功解決進(jìn)行簇(cluster)鑒定所需的前幾個(gè)堿基的必需復(fù)雜度的問題。定制的聚(T)測序引物可用于在相反方向進(jìn)行測序,使得能夠產(chǎn)生配對(duì)的末端測序數(shù)據(jù)。將DNA文庫稀釋至5nM的濃度,用0.2N NaOH變性5分鐘,并進(jìn)一步稀釋至11pM之后立即裝載到MiSeq盒中。使用MiSeq Reagent試劑盒(50個(gè)循環(huán))進(jìn)行77個(gè)循環(huán)的MiSeq運(yùn)行。

      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1