国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于分析核酸混合物的探針、文庫(kù)和試劑盒及其構(gòu)建方法

      文檔序號(hào):426462閱讀:493來(lái)源:國(guó)知局
      專(zhuān)利名稱(chēng):用于分析核酸混合物的探針、文庫(kù)和試劑盒及其構(gòu)建方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及用于檢測(cè)、分類(lèi)或定量復(fù)雜的核酸混合物,例如轉(zhuǎn)錄物組(transcriptome)中的成分的核酸探針、核酸探針文庫(kù)和試劑盒,以及它們的使用方法。
      背景技術(shù)
      隨著用于描繪成千上萬(wàn)基因的表達(dá)譜的微陣列,例如GeneChipTM陣列(Affymetrix,Inc.,Santa Clara,CA)的出現(xiàn),利用傳統(tǒng)方法例如Northern分析和點(diǎn)印跡分析所需的財(cái)力和物力的一小部分,就可以鑒定出表達(dá)的基因和細(xì)胞表型之間的相關(guān)性。微陣列允許開(kāi)發(fā)多個(gè)平行試驗(yàn)以鑒定和驗(yàn)證疾病的生物學(xué)標(biāo)記和可以用于診斷和治療的藥物靶標(biāo)。此外,基因表達(dá)譜也可以用于評(píng)估和預(yù)測(cè)暴露于某種因子(例如,藥物、潛在的毒素或致癌物等)或情況(例如,溫度、pH等)的代謝和毒理學(xué)后果。
      微陣列實(shí)驗(yàn)常常產(chǎn)生僅其中一小部分對(duì)于實(shí)驗(yàn)者是有價(jià)值的冗余數(shù)據(jù)。此外,由于基于微陣列的分析的高度平行模式,對(duì)于各個(gè)捕獲探針而言,條件可能不是最佳的。基于這些原因,微陣列實(shí)驗(yàn)十分經(jīng)常地尾隨使用單基因均相試驗(yàn)的驗(yàn)證研究或被該驗(yàn)證研究隨后替代。這些單基因均相試驗(yàn)經(jīng)常是基于定量PCR的方法,例如5′核酸酶試驗(yàn)或其它類(lèi)型的雙標(biāo)記探針定量實(shí)驗(yàn)。然而,這些實(shí)驗(yàn)仍是耗時(shí)的單反應(yīng)實(shí)驗(yàn),受到高成本和耗時(shí)的探針設(shè)計(jì)程序的阻礙。而且,5′核酸酶試驗(yàn)的探針相對(duì)較大(例如,15-30個(gè)核苷酸)。因此,目前已知的均相試驗(yàn)系統(tǒng)中的這些限制性對(duì)微陣列發(fā)現(xiàn)結(jié)果的驗(yàn)證以及對(duì)聚焦的靶驗(yàn)證方法均構(gòu)成了瓶頸。
      用于避免此瓶頸的一個(gè)方法是省去5′核酸酶試驗(yàn)中使用的昂貴雙標(biāo)記指示探針和分子信標(biāo),代之使用在結(jié)合雙鏈而非單鏈DNA時(shí)發(fā)熒光的非序列特異性DNA嵌入染料,例如SYBR Green。使用該染料,可以無(wú)任何例外地實(shí)時(shí)檢測(cè)任何擴(kuò)增的序列。然而,該技術(shù)受到幾個(gè)問(wèn)題的阻礙。例如,PCR擴(kuò)增過(guò)程中的非特異引物引發(fā)可以產(chǎn)生參與定量過(guò)程的與目的無(wú)關(guān)的非靶擴(kuò)增子。而且,在該反應(yīng)中普遍存在PCR引物之間的相互作用,從而形成“引物二聚體”。由于PCR反應(yīng)中典型使用高濃度的引物,這可以導(dǎo)致顯著數(shù)量的短雙鏈非靶擴(kuò)增子,該擴(kuò)增子也結(jié)合嵌合染料。因此,通過(guò)實(shí)時(shí)PCR定量mRNA的優(yōu)選方法是使用序列特異性檢測(cè)探針。
      用于避免隨機(jī)擴(kuò)增和引物二聚體形成問(wèn)題的一個(gè)方法是使用可以用于檢測(cè)大量不同類(lèi)型的核酸分子但又保持一定的序列特異性的通用檢測(cè)探針,該方法已經(jīng)由Simeonov等(Nucleic Acid Research30(17)91,2002;美國(guó)專(zhuān)利公布20020197630)描述,其涉及使用包含了具有給定的某個(gè)(或某些)長(zhǎng)度的所有可能序列中10%以上的序列的探針文庫(kù)。該文庫(kù)可以包括各種非天然核酸堿基和其它修飾以穩(wěn)定文庫(kù)中探針/引物與靶序列的結(jié)合。即使如此,對(duì)于大多數(shù)序列,也需要至少8個(gè)堿基的最短長(zhǎng)度來(lái)獲得可以與大多數(shù)和應(yīng)用(例如實(shí)時(shí)PCR)相關(guān)的試驗(yàn)條件相容的穩(wěn)定程度。由于具有所有可能的8聚體(8-mer)的通用文庫(kù)將含有65,536個(gè)不同序列,因此先前由Simeonov等考慮的甚至最小的文庫(kù)也含有所有可能性的10%以上,即,至少6554個(gè)序列,這在操作上是不實(shí)際的而且其構(gòu)建成本巨大。
      從實(shí)踐的角度出發(fā),幾個(gè)因素限制了當(dāng)前的均相試驗(yàn)應(yīng)用的方便性和利用度。常規(guī)試驗(yàn)技術(shù)的使用者面臨的問(wèn)題包括.由于購(gòu)買(mǎi)針對(duì)每個(gè)轉(zhuǎn)錄物的探針的價(jià)格很高,當(dāng)嘗試在少數(shù)樣本中檢測(cè)許多不同基因時(shí),將會(huì)價(jià)格高得驚人。
      .合成標(biāo)記探針是耗時(shí)的,而且從訂貨到收到廠(chǎng)家發(fā)出的貨物的時(shí)間常常超過(guò)1周。
      .用戶(hù)設(shè)計(jì)的試劑盒可能不會(huì)在第一次時(shí)起作用,因此,按每試驗(yàn)計(jì),有效的試劑盒是昂貴的。
      .難于快速地檢測(cè)新靶標(biāo)或反復(fù)地改進(jìn)探針設(shè)計(jì)。
      .商業(yè)有效探針的確切探針序列可能不為消費(fèi)者所知,從而導(dǎo)致在結(jié)果的評(píng)估和科學(xué)出版的適宜性上出現(xiàn)問(wèn)題。
      .當(dāng)試驗(yàn)條件或成分不清時(shí),可能不能從替代來(lái)源定購(gòu)試劑。
      本發(fā)明解決了這些實(shí)際問(wèn)題并旨在確??焖俸蛢r(jià)廉地開(kāi)發(fā)出用于定量基因轉(zhuǎn)錄物的準(zhǔn)確而特異的試驗(yàn)。
      發(fā)明簡(jiǎn)述期望能夠使用有限數(shù)量的寡核苷酸檢測(cè)探針在均相試驗(yàn)系統(tǒng)中定量例如人類(lèi)轉(zhuǎn)錄物組(transcriptome)中的大多數(shù)基因(例如,>98%)的表達(dá)。本發(fā)明通過(guò)提供構(gòu)建如下通用多探針的方法解決了當(dāng)前方法在均相試驗(yàn)方面面臨的上述問(wèn)題,其中所述通用多探針(genericmulti-probes)具有足夠的序列特異性以致它們不可能檢測(cè)隨機(jī)擴(kuò)增的序列片段或引物二聚體,但各自仍能夠檢測(cè)許多不同的靶序列。這些探針可以用于不同的試驗(yàn)中,并可以組合在小探針文庫(kù)(50至500個(gè)探針)中,當(dāng)與靶特異性引物組聯(lián)合時(shí)其可以用于檢測(cè)和/或定量由成千上萬(wàn)個(gè)不同核酸組成的復(fù)雜混合物中的各成分(例如在由>30,000個(gè)不同核酸組成的人類(lèi)轉(zhuǎn)錄物組中檢測(cè)各轉(zhuǎn)錄物)。
      每一個(gè)多探針(multi-probe)包含兩個(gè)元件1)由一個(gè)或多個(gè)標(biāo)記物組成以檢測(cè)探針和靶的結(jié)合的檢測(cè)元件或檢測(cè)部分;和2)確保與目的特異靶(一個(gè)或多個(gè))結(jié)合的識(shí)別元件或識(shí)別序列標(biāo)簽。檢測(cè)元件可以是均相試驗(yàn)中使用的任何檢測(cè)原理??梢酝ㄟ^(guò)與靶結(jié)合后一個(gè)或多個(gè)標(biāo)記物的可測(cè)量的性質(zhì)改變直接地檢測(cè)結(jié)合(例如,有或沒(méi)有莖結(jié)構(gòu)的分子信標(biāo)類(lèi)試驗(yàn)),或者可以通過(guò)結(jié)合后的隨后反應(yīng)(例如在5′核酸酶試驗(yàn)中通過(guò)DNA聚合酶的5′核酸酶活性進(jìn)行的切割)來(lái)間接地檢測(cè)結(jié)合。
      識(shí)別元件是新的本發(fā)明成分。它包含序列經(jīng)選擇以致能夠檢測(cè)給定的復(fù)雜樣品混合物中一個(gè)大的靶核苷酸子集(subset)的短寡核苷酸部分。分別被設(shè)計(jì)用于檢測(cè)許多不同靶分子的這些新探針被稱(chēng)作多探針。通過(guò)選擇最頻繁遇到的序列和利用短識(shí)別序列的重現(xiàn)來(lái)設(shè)計(jì)用于多個(gè)靶的探針的概念是新的,并與設(shè)計(jì)出來(lái)以便盡可能具有針對(duì)單個(gè)靶序列的特異性的常規(guī)探針不同。隨后,周?chē)锖瓦x擇的探針序列相組合將確保該多探針的特異性。由試圖用最少量的探針處理最大量的靶而產(chǎn)生的此新的設(shè)計(jì)原理同樣是本發(fā)明的一部分。這通過(guò)如下發(fā)現(xiàn)得以實(shí)現(xiàn)非常短的8-9聚體LNA mix-mer探針與基于PCR的試驗(yàn)是相容的。在本發(fā)明的一個(gè)方面,在識(shí)別元件中摻入核酸堿基、核苷堿基或核苷酸的修飾物或類(lèi)似物,以及可能地小溝結(jié)合劑及其它修飾,所有這些均旨在穩(wěn)定探針和靶分子之間形成的雙螺旋,以便可以使用最短的可能探針序列與最寬的靶范圍。在本發(fā)明的一個(gè)優(yōu)選方面,所述修飾是摻入LNA殘基以將識(shí)別元件的長(zhǎng)度減少至8或9個(gè)核苷酸并同時(shí)保持所形成的雙螺旋的足夠穩(wěn)定性以便可以在通常試驗(yàn)條件下進(jìn)行檢測(cè)。
      優(yōu)選地,修飾多探針,以使該探針與具有相同序列但無(wú)修飾的探針相比在相同檢測(cè)條件,例如PCR條件或嚴(yán)緊雜交條件下對(duì)靶序列的結(jié)合親和力增加至少兩倍。優(yōu)選的修飾包括,但不限于,包含已經(jīng)通過(guò)化學(xué)部分修飾或已經(jīng)被類(lèi)似物(例如,包括核糖或脫氧核糖類(lèi)似物)替代或者已經(jīng)通過(guò)使用非磷酸二酯鍵的核苷酸間鍵(例如非磷酸酯的核苷酸間鍵)進(jìn)行過(guò)修飾的核酸堿基、核苷堿基或核苷酸,以增加結(jié)合親和力。優(yōu)選的修飾還可以包括附著雙螺旋穩(wěn)定劑,例如小溝結(jié)合劑(MGB)或嵌入核酸(INA)。此外,優(yōu)選的修飾還可以包括添加不管靶鏈相對(duì)位置上的核酸堿基如何均能夠穩(wěn)定雙螺旋形成的無(wú)區(qū)分性堿基,例如5-硝基吲哚。最后,能夠序列特異地與靶序列結(jié)合的、由非糖-磷酸主鏈組成的多探針,例如PNA,也是所考慮的修飾。所有上述增加結(jié)合親和力的不同修飾在下文中將稱(chēng)作“穩(wěn)定化修飾”(stabilizingmodification),由此產(chǎn)生的多探針在下文中也將稱(chēng)作“修飾的寡核苷酸”。更優(yōu)選地,修飾的寡核苷酸比具有相同序列但無(wú)該穩(wěn)定化修飾的探針具有高至少大約3倍、4倍、5倍或20倍的結(jié)合親和力。
      最優(yōu)選地,穩(wěn)定化修飾是包括一個(gè)或多個(gè)LNA核苷酸類(lèi)似物。根據(jù)本發(fā)明的6至12個(gè)核苷酸的探針可以包含1至8個(gè)穩(wěn)定化核苷酸,例如LNA核苷酸。當(dāng)包括至少兩個(gè)LNA核苷酸時(shí),這些核苷酸可以是連續(xù)的,或被一個(gè)或多個(gè)非LNA核苷酸隔開(kāi)。在一方面,LNA核苷酸是α和/或xylo LNA核苷酸。
      本發(fā)明還提供可以在NASBA試驗(yàn)條件下使用的寡聚體多探針文庫(kù)。
      NASBA是一種適于擴(kuò)增RNA的、特異性等溫核酸擴(kuò)增方法。通過(guò)用硫氰酸胍加上Triton X-100裂解以及最后從二氧化硅顆粒上洗脫純化的核酸,進(jìn)行核酸分離。通過(guò)NASBA進(jìn)行的擴(kuò)增涉及三種酶,即,AMV逆轉(zhuǎn)錄酶、RNase H和T7 RNA聚合酶的協(xié)同活性。通過(guò)在分離時(shí)加入的內(nèi)部校準(zhǔn)物實(shí)現(xiàn)定量檢測(cè),其中所述內(nèi)部校準(zhǔn)物與野生型RNA一起擴(kuò)增并隨后使用電化學(xué)發(fā)光進(jìn)行鑒定。
      本發(fā)明還提供包含多探針的寡聚體多探針陣列,其中所述多探針包含至少一個(gè)以上定義的穩(wěn)定化修飾。優(yōu)選地,探針的長(zhǎng)度小于大約20個(gè)核苷酸,更優(yōu)選地小于12個(gè)核苷酸,最優(yōu)選地大約8或9個(gè)核苷酸。此外,優(yōu)選地,文庫(kù)包含大約3000個(gè)以下的探針,更優(yōu)選地,文庫(kù)包含500個(gè)以下的探針,最優(yōu)選地大約100個(gè)探針。含有標(biāo)記的多探針的文庫(kù)根據(jù)識(shí)別元件所連接的檢測(cè)元件的類(lèi)型,可以用于多種應(yīng)用中。這些應(yīng)用包括,但不限于,雙或單標(biāo)記試驗(yàn),例如5′核酸酶試驗(yàn),分子信標(biāo)應(yīng)用(參見(jiàn)例如Tyagi和Kramer Nat.Biotechnol.14303-308,1996)和其它基于FRET的試驗(yàn)。
      在本發(fā)明的一個(gè)方面,對(duì)上述多探針一起進(jìn)行設(shè)計(jì)以便可以彼此補(bǔ)充成為具有給定長(zhǎng)度的所有可能序列的一個(gè)如下預(yù)定子集,該子集經(jīng)選擇能夠使用最少數(shù)量的多探針序列檢測(cè)/表征/定量復(fù)雜混合物中最大數(shù)量的核酸。這些預(yù)先設(shè)計(jì)的所有可能序列的小子集構(gòu)成多探針文庫(kù)。本發(fā)明的多探針文庫(kù)通過(guò)如下方式以極大降低的復(fù)雜度實(shí)現(xiàn)該功能性有意地選擇最常出現(xiàn)的、具有一種或多種給定長(zhǎng)度的寡聚體、同時(shí)努力地使該選擇多樣化以在復(fù)雜核酸靶群體中達(dá)到最佳可能的覆蓋率。在一個(gè)優(yōu)選方面,文庫(kù)的探針與核酸靶群體(例如,人類(lèi)mRNA群體)中的大約60%以上雜交。更優(yōu)選地,探針與靶分子群體的所有靶核酸分子中的70%以上、80%以上、90%以上、95%以上,甚至98%以上雜交(見(jiàn),例如

      圖1)。
      在本發(fā)明的一個(gè)最優(yōu)選方面,包含具有選定的探針長(zhǎng)度的所有可能序列中的大約0.1%的探針文庫(kù)(即,例如,大約100個(gè)多探針)能夠檢測(cè)、分類(lèi)和/或定量任何特定物種,尤其是哺乳動(dòng)物,更尤其是人的轉(zhuǎn)錄物組中98%以上的mRNA轉(zhuǎn)錄物(即,>35,000個(gè)不同的mRNA序列)。事實(shí)上,優(yōu)選本發(fā)明多探針文庫(kù)覆蓋靶群體的所有靶核酸中的至少85%。
      在現(xiàn)有均相試驗(yàn)中存在的上述問(wèn)題通過(guò)使用本發(fā)明的多探針文庫(kù)得以解決,所述文庫(kù)由短檢測(cè)探針最小的組合組成,該探針經(jīng)選擇能夠識(shí)別或檢測(cè)給定生物的給定細(xì)胞類(lèi)型中所有表達(dá)基因的大多數(shù)。一方面,文庫(kù)包含可以檢測(cè)具有超過(guò)大約10,000個(gè)基因、超過(guò)大約15,000個(gè)基因、超過(guò)大約20,000個(gè)基因、超過(guò)大約25,000個(gè)基因、超過(guò)大約30,000個(gè)基因或超過(guò)大約35,000個(gè)基因或者等同數(shù)量的不同mRNA轉(zhuǎn)錄物的轉(zhuǎn)錄物組中的每一個(gè)轉(zhuǎn)錄物的探針。一個(gè)優(yōu)選方面,文庫(kù)包含可以檢測(cè)哺乳動(dòng)物轉(zhuǎn)錄物序列,例如,小鼠、大鼠、兔、猴或人序列的探針。
      通過(guò)提供可以用于快速開(kāi)發(fā)定量實(shí)時(shí)終點(diǎn)PCR試驗(yàn)的成本有效的多探針集合,本發(fā)明克服了在目前均相試驗(yàn)中存在的上述限制性。本發(fā)明多探針的檢測(cè)元件可以是單標(biāo)記的或雙標(biāo)記的(例如,通過(guò)在探針的每一個(gè)末端或在探針的內(nèi)部位置包含標(biāo)記物)。因此,可以調(diào)整本發(fā)明探針使其適用于5′核酸酶試驗(yàn)、分子信標(biāo)試驗(yàn)、FRET試驗(yàn)和其它相似試驗(yàn)。一方面,檢測(cè)多探針包括能夠彼此相互作用以產(chǎn)生信號(hào)或改變信號(hào)的兩個(gè)標(biāo)記物,由此可以在探針與靶序列雜交后檢測(cè)到信號(hào)或信號(hào)改變。一個(gè)特別的方面是兩個(gè)標(biāo)記物包含淬滅分子和報(bào)道分子。
      另一方面,探針包含靶特異性識(shí)別片段,該片段能夠特異地與包含互補(bǔ)識(shí)別序列的多個(gè)不同核酸分子雜交。本發(fā)明的一個(gè)特定的檢測(cè)方面稱(chēng)作“具有莖區(qū)的分子信標(biāo)”,即,識(shí)別片段的兩側(cè)為可以退火形成發(fā)夾的第一和第二互補(bǔ)發(fā)夾形成序列。報(bào)道標(biāo)記物連接于一個(gè)互補(bǔ)序列的末端,而淬滅部分連接于另一互補(bǔ)序列的末端。在第一和第二互補(bǔ)序列雜交時(shí)(即,探針識(shí)別片段未與其靶雜交時(shí))形成的莖使得這兩個(gè)標(biāo)記物彼此緊靠,從而導(dǎo)致報(bào)道分子產(chǎn)生的信號(hào)由于熒光共振能量轉(zhuǎn)移(FRET)而被淬滅。當(dāng)探針與靶序列雜交時(shí)降低了兩個(gè)標(biāo)記物之間的接近度,接近度的改變引起兩個(gè)標(biāo)記物之間的相互作用發(fā)生改變。由此探針的雜交致使從報(bào)道分子產(chǎn)生信號(hào)(例如,熒光),該信號(hào)可以被檢測(cè)和/或定量。
      另一方面,多探針包含位于短識(shí)別序列的相對(duì)末端的報(bào)道分子和淬滅分子,這樣兩個(gè)部分彼此充分接近以致淬滅分子可以實(shí)質(zhì)上地降低報(bào)道分子所產(chǎn)生的信號(hào)。這在探針游離于溶液中以及其與靶核酸結(jié)合時(shí)均是如此。在本發(fā)明的一個(gè)稱(chēng)作“5′核酸酶試驗(yàn)”的特定檢測(cè)方面,多探針可以容易地被DNA聚合酶的5′核酸酶活性切割。該反應(yīng)可能可以導(dǎo)致淬滅分子和報(bào)道分子分離以及可檢測(cè)信號(hào)產(chǎn)生。由此,可以在基于擴(kuò)增的試驗(yàn)中使用這樣的探針以檢測(cè)和/或定量靶核酸的擴(kuò)增過(guò)程。
      第一方面,本發(fā)明涉及上述多探針文庫(kù)。在該寡核苷酸探針文庫(kù)中,每一個(gè)探針都包含具有大約x個(gè)核苷酸長(zhǎng)度的識(shí)別片段和檢測(cè)元件,其中所述核苷酸中的一些核苷酸或所有核苷酸被相較于天然核酸堿基能夠增加結(jié)合親和力的非天然堿基替代,和/或所述寡核苷酸探針中的一些或所有核苷酸單元被化學(xué)部分修飾以增加結(jié)合親和力,這樣探針在適于檢測(cè)的條件下將具有與靶序列結(jié)合的充分穩(wěn)定性,而且,其中,不同識(shí)別片段的數(shù)量占給定長(zhǎng)度的所有可能片段的10%以下,而且其中90%以上的探針可以檢測(cè)靶核酸群體中的一個(gè)以上互補(bǔ)靶,由此該寡核苷酸探針文庫(kù)可以檢測(cè)靶核酸群體的所有靶序列中的實(shí)質(zhì)上大部分靶序列。
      因此,本發(fā)明涉及寡核苷酸探針文庫(kù),其中文庫(kù)中的每一個(gè)探針都由識(shí)別序列標(biāo)簽和檢測(cè)部分組成,其中每一個(gè)寡核苷酸探針中的至少一個(gè)單體是修飾的單體類(lèi)似物,從而與相應(yīng)的未修飾寡脫氧核糖核苷酸相比,增加了對(duì)互補(bǔ)靶序列的結(jié)合親和力,這樣,文庫(kù)探針具有充分的穩(wěn)定性可以用于序列特異性地結(jié)合和檢測(cè)任何給定靶群體中的靶核酸的實(shí)質(zhì)性部分,而且,其中不同識(shí)別序列的數(shù)量占給定長(zhǎng)度的所有可能序列標(biāo)簽的10%以下。
      本發(fā)明還涉及寡核苷酸探針文庫(kù),其中文庫(kù)探針的識(shí)別序列標(biāo)簽片段已經(jīng)以至少一種以下方式進(jìn)行了修飾i)被至少一個(gè)非天然核苷酸替代;和ii)被至少一個(gè)化學(xué)部分替代以增加探針的穩(wěn)定性。
      而且,本發(fā)明還涉及寡核苷酸探針文庫(kù),其中識(shí)別序列標(biāo)簽長(zhǎng)6-12個(gè)核苷酸(即,6、7、8、9、10、11或12),而且其中優(yōu)選長(zhǎng)度是8或9個(gè)核苷酸。
      此外,本發(fā)明還涉及具有LNA核苷酸替代的識(shí)別序列標(biāo)簽。
      本發(fā)明還涉及本發(fā)明的文庫(kù),其中,90%以上的寡核苷酸探針可以結(jié)合并檢測(cè)核酸群體中的至少兩個(gè)靶序列——優(yōu)選地這是因?yàn)樗Y(jié)合的靶序列與探針的識(shí)別序列互補(bǔ)。
      而且,優(yōu)選地,探針能夠檢測(cè)靶核酸群體中的一個(gè)以上靶標(biāo),例如,探針能夠與靶核酸群體中所含的多個(gè)不同核酸分子雜交。
      本發(fā)明還提供用于設(shè)計(jì)包含至少一個(gè)穩(wěn)定化核苷酸堿基的多探針的方法、系統(tǒng)和寫(xiě)在計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)程序(“計(jì)算機(jī)程序產(chǎn)品”)。所述方法包括查詢(xún)靶序列數(shù)據(jù)庫(kù)(例如,表達(dá)序列數(shù)據(jù)庫(kù))和設(shè)計(jì)一個(gè)小的探針集合(例如,50或100或200或300或500個(gè)),其中所述探針1)具有在PCR條件下結(jié)合其相應(yīng)靶序列的充分結(jié)合穩(wěn)定性,ii)具有有限的自身形成雙螺旋結(jié)構(gòu)的傾向,和iii)能夠結(jié)合和檢測(cè)/定量給定序列數(shù)據(jù)庫(kù)(例如,表達(dá)序列數(shù)據(jù)庫(kù))的所有序列中的至少大約60%、至少大約70%、至少大約80%、至少大約90%或至少大約95%。
      計(jì)算機(jī)(Insilico)設(shè)計(jì)探針,以包含具有給定長(zhǎng)度的所有可能核苷酸組合,從而形成虛擬(virtual)候選探針數(shù)據(jù)庫(kù)。這些虛擬探針相對(duì)于靶序列數(shù)據(jù)庫(kù)進(jìn)行檢索,以鑒定具有檢測(cè)數(shù)據(jù)庫(kù)中最多不同靶序列的最大能力的探針(“最佳探針”)。從虛擬探針數(shù)據(jù)庫(kù)取出如此鑒定的最佳探針。此外,從靶核酸數(shù)據(jù)庫(kù)中扣除通過(guò)此先前的最佳探針集合鑒定的靶核酸。然后剩余的探針相對(duì)于剩余的靶序列進(jìn)行檢索以鑒定第二組最佳探針。重復(fù)該方法直到鑒定到能夠所需地覆蓋靶序列數(shù)據(jù)庫(kù)的一組探針??梢詫⒃摻M探針存儲(chǔ)在數(shù)據(jù)庫(kù)中作為序列來(lái)源用于轉(zhuǎn)錄物組分析??梢院铣删哂邢鄳?yīng)于該數(shù)據(jù)庫(kù)中序列的識(shí)別序列的多探針,以產(chǎn)生多探針文庫(kù)。
      在一個(gè)優(yōu)選方面,靶序列數(shù)據(jù)庫(kù)包含相應(yīng)于人類(lèi)mRNA的核酸序列(例如,mRNA分子、cDNA等等)。
      另一方面,本發(fā)明方法還包括基于識(shí)別序列包含至少一個(gè)穩(wěn)定化核苷酸(例如,LNA分子)的前提的計(jì)算穩(wěn)定性。在一個(gè)優(yōu)選方面,利用計(jì)算的穩(wěn)定性,在首次相對(duì)于靶序列數(shù)據(jù)庫(kù)進(jìn)行查詢(xún)以起始最佳探針識(shí)別序列的鑒定之前,從虛擬候選探針數(shù)據(jù)庫(kù)中除去穩(wěn)定性不足的探針識(shí)別序列。
      另一方面,本發(fā)明方法還包括基于識(shí)別序列包含至少一個(gè)穩(wěn)定化核苷酸(例如LNA分子)的前提,計(jì)算給定探針識(shí)別序列自身形成雙螺旋結(jié)構(gòu)的傾向。在一個(gè)優(yōu)選方面,利用計(jì)算的傾向性,在首次相對(duì)于靶序列數(shù)據(jù)庫(kù)進(jìn)行查詢(xún)以起始最佳探針識(shí)別序列的鑒定之前,從虛擬候選探針數(shù)據(jù)庫(kù)中中除去可能形成探針雙螺旋的探針識(shí)別序列。另一方面,本發(fā)明方法還包括通過(guò)相對(duì)于剩余靶序列的查詢(xún)以及相對(duì)于起始靶序列集合的查詢(xún)計(jì)算包含不斷增長(zhǎng)的最佳探針候選物的給定候選探針識(shí)別序列的通用性。在一個(gè)優(yōu)選方面,只有同時(shí)頻繁出現(xiàn)在剩余靶序列和最初靶序列中的探針識(shí)別序列才被添加至正在增長(zhǎng)的最佳探針識(shí)別序列集合中。在最優(yōu)選的方面,這通過(guò)如下方式實(shí)現(xiàn)計(jì)算由這些查詢(xún)得到的分?jǐn)?shù)的乘積,并選擇具有最高乘積并且在針對(duì)當(dāng)前靶標(biāo)的查詢(xún)中仍屬于具有最佳分?jǐn)?shù)的20%的探針識(shí)別序列的探針識(shí)別序列。
      本發(fā)明還提供寫(xiě)入計(jì)算機(jī)可讀介質(zhì)的計(jì)算機(jī)程序,所述程序包含用于檢索包含多個(gè)不同靶序列的數(shù)據(jù)庫(kù)和用于鑒定能夠確定所述數(shù)據(jù)庫(kù)中的至少大約60%、大約70%、大約80%、大約90%和大約95%序列的一組探針識(shí)別序列的指令。一方面,該程序提供實(shí)施如上所述方法的指令。另一方面,該程序提供實(shí)施如圖2所示的算法的指令。本發(fā)明還提供系統(tǒng),其中所述系統(tǒng)包括用于儲(chǔ)存包含多個(gè)不同靶序列的序列信息的數(shù)據(jù)庫(kù)的儲(chǔ)存器,還包括用于執(zhí)行如下程序指令的應(yīng)用程序,所述程序指令用于從數(shù)據(jù)庫(kù)中檢索出能夠與數(shù)據(jù)庫(kù)中至少大約60%、大約70%、大約80%、大約90%和大約95%序列雜交的一組探針識(shí)別序列。
      本發(fā)明另一方面涉及包含各自獨(dú)立地具有大約1至8個(gè)核苷酸長(zhǎng)度的識(shí)別片段和檢測(cè)元件的寡核苷酸探針,其中寡核苷酸中的一些或所有核苷酸被相對(duì)于天然核苷酸堿基而言能夠增加結(jié)合親和力的非天然堿基或堿基類(lèi)似物替代,和/或寡核苷酸探針的一些或所有核苷酸單元被化學(xué)部分修飾或被類(lèi)似物置換以增加結(jié)合親和力,和/或其中所述寡核苷酸被化學(xué)部分修飾或是寡核苷酸類(lèi)似物以增加結(jié)合親和力,這樣,探針具有在適于檢測(cè)的條件下結(jié)合靶序列的充分穩(wěn)定性,而且其中探針能夠檢測(cè)靶核酸群體中一個(gè)以上的互補(bǔ)靶標(biāo)。
      本發(fā)明的一個(gè)優(yōu)選實(shí)施方式是表征或檢測(cè)或定量靶核酸的試劑盒,所述試劑盒包含多探針文庫(kù)樣品。一方面,試劑盒包含針對(duì)其用途的計(jì)算機(jī)(insilico)操作方案。另一方面,試劑盒包含與獲得廉價(jià)DNA引物的建議相關(guān)的信息。這些試劑盒中所包含的探針可以具有上述的任一或所有特征。在一個(gè)優(yōu)選方面,多個(gè)探針都包含至少一個(gè)穩(wěn)定化核苷酸,例如LNA核苷酸。另一方面,多個(gè)探針都包含與至少一個(gè)化學(xué)部分偶聯(lián)或穩(wěn)定結(jié)合的核苷酸以增加探針的結(jié)合穩(wěn)定性。在再一優(yōu)選方面,試劑盒包含大約100個(gè)不同探針。根據(jù)本發(fā)明的試劑盒允許用戶(hù)快速且有效地開(kāi)發(fā)用于成千上萬(wàn)個(gè)不同核酸靶標(biāo)的試驗(yàn)。
      本發(fā)明還提供包含一個(gè)或多個(gè)LNA核苷酸、具有大約8或9個(gè)核苷酸的減少長(zhǎng)度的多探針。通過(guò)選擇通常出現(xiàn)的8和9-mer作為靶,可以使用相同探針檢測(cè)許多不同基因。每一8或9-mer探針可以用于檢測(cè)7000個(gè)以上的不同人類(lèi)mRNA序列。而必需的特異性由針對(duì)靶基因的廉價(jià)DNA引物以及靶向所擴(kuò)增的DNA的該8或9-mer探針序列的組合作用來(lái)保證(圖1)。
      在一個(gè)優(yōu)選實(shí)施方案中,本發(fā)明涉及包含LNA替代的八聚體和九聚體的寡核苷酸多探針文庫(kù),該文庫(kù)具有不超過(guò)大約1000個(gè)的所選序列,優(yōu)選不超過(guò)500個(gè)的所選序列,或更優(yōu)選地不超作大約200個(gè)的所選序列,例如由大約100個(gè)不同的所選序列組成,由此該文庫(kù)能夠識(shí)別靶生物或靶器官中大約90%以上、更優(yōu)選地大約95%以上,更優(yōu)選地大約98%以上的mRNA序列。
      陽(yáng)性對(duì)照樣品在設(shè)計(jì)用于多基因的實(shí)時(shí)PCR檢測(cè)試驗(yàn)時(shí)反復(fù)出現(xiàn)的問(wèn)題是這些從頭設(shè)計(jì)的成功率小于100%。查明非功能性試驗(yàn)可能是棘手的,因?yàn)槔硐氲孛恳粋€(gè)探針需要一個(gè)靶特異性模板以檢驗(yàn)該檢測(cè)探針的功能性。而且,如果未知在測(cè)試樣品中是否存在靶標(biāo),則靶特異性模板可以用作陽(yáng)性對(duì)照。當(dāng)使用本發(fā)明所述探針文庫(kù)試劑盒中的有限數(shù)量的檢測(cè)探針(例如,90個(gè))進(jìn)行操作時(shí),也可以提供PCR可擴(kuò)增模板形式的陽(yáng)性對(duì)照靶,該陽(yáng)性對(duì)照靶含有針對(duì)該有限數(shù)量的探針的所有可能靶標(biāo)(例如,90個(gè))。該特征允許用戶(hù)評(píng)價(jià)各探針的功能,而對(duì)于非重現(xiàn)的以探針為基礎(chǔ)的試驗(yàn),該特征是不適宜的,由此該特征構(gòu)成了本發(fā)明的又一有益特征。針對(duì)圖13列出的優(yōu)選的提議探針識(shí)別序列,我們?cè)O(shè)計(jì)了用于所有探針的對(duì)照序列多聯(lián)體,以包含用于此頭40個(gè)探針中每一個(gè)探針的PCR可擴(kuò)增靶。
      探針序列選擇本發(fā)明的一個(gè)重要方面是在給定靶選擇標(biāo)準(zhǔn)的情況下選擇最佳的探針靶序列以便使用盡可能少的探針靶向眾多靶標(biāo)。這可以通過(guò)如下方式實(shí)現(xiàn)有意地選擇出現(xiàn)頻率高于從隨機(jī)分布可預(yù)期到的出現(xiàn)頻率的靶序列。
      因此,本發(fā)明一方面涉及選擇可在本發(fā)明多探針文庫(kù)中使用的寡核苷酸序列的方法,該方法包括a)提供第一集合(first list)——具有預(yù)定核苷酸數(shù)量N(典型地選自6、7、8、9、10、11和12的整數(shù),優(yōu)選地8或9)的所有可能寡核苷酸,所述寡核苷酸具有至少50℃(優(yōu)選地至少60℃)的熔解溫度Tm;b)提供第二集合(second list)——靶核酸序列(例如本文討論的一組靶核酸的群體);c)針對(duì)所述第一集合的每一成員,分別地從所述第二集合鑒定并存儲(chǔ)包括了該成員的互補(bǔ)序列的第二集合成員的數(shù)目;d)選擇在步驟c的鑒定中與步驟c中鑒定出的最大數(shù)量的第二集合成員匹配的所述第一集合成員;e)將步驟d中選擇的成員添加至第三集合,其中該第三集合由選擇的可用于前述權(quán)利要求之任一項(xiàng)的文庫(kù)中的寡核苷酸組成;f)從所述第一集合中扣除步驟d中選擇的成員以提供修訂的第一集合;m)重復(fù)步驟d至f,直到所述第三集合由下述成員組成,所述的組成成員合在一起能夠與步驟b的該靶核酸序列集合中的至少30%成員互補(bǔ)(通常地,該百分?jǐn)?shù)將更高,例如,至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%,或甚至更高,例如至少97%、至少98%,甚至高達(dá)至少99%)。
      優(yōu)選,該第一集合僅僅包括不能自我雜交的寡核苷酸,以便在隨后的探針使用中具有較少的假陽(yáng)性?xún)A向。
      所述選擇方法可以在步驟f之后但在步驟m之前包括數(shù)個(gè)步驟g)從所述第二集合中扣除所有如下成員以獲得修訂的第二集合,其中所述成員包括與在步驟d中選出的成員互補(bǔ)的序列;h)針對(duì)所述修訂的第一集合的每一成員,從所述修訂的第二集合中鑒定和存儲(chǔ)包括與所述每一成員互補(bǔ)的序列的成員的數(shù)量;i)選擇在步驟h的鑒定中與步驟h中鑒定到的最大數(shù)量的第二集合成員匹配的所述第一集合的成員;或者,選擇通過(guò)步驟h中鑒定的數(shù)量和步驟c中鑒定的數(shù)量的乘積能夠給出最大數(shù)的所述第一集合成員;j)將步驟i中選擇的成員加入所述第三集合;k)從所述修訂的第一集合中扣除步驟i中選出的成員;和l)從所述修訂的第二集合中扣除所有如下成員,所述成員包括與步驟i中選出的成員互補(bǔ)的序列。
      步驟c后步驟d的選擇可以方便地在鑒定所述第一集合中的如下成員之后進(jìn)行,所述成員與所述第二集合中超過(guò)選定百分?jǐn)?shù)(60%或更高,例如,優(yōu)選地80%)的最大的成員數(shù)的成員雜交,由此在步驟d中僅僅選擇如此鑒定的成員。
      在該選擇方法的實(shí)際實(shí)施中,所述第一、第二和第三集合存儲(chǔ)在計(jì)算機(jī)系統(tǒng)的存儲(chǔ)器,優(yōu)選地?cái)?shù)據(jù)庫(kù)中。存儲(chǔ)器(也稱(chēng)作“計(jì)算機(jī)可讀介質(zhì)”)可以是易失性的和非易失性的,即,常規(guī)用于計(jì)算機(jī)系統(tǒng)中的任何存儲(chǔ)裝置隨機(jī)存取存儲(chǔ)器(RAM)、只讀內(nèi)存(ROM)、數(shù)據(jù)存儲(chǔ)裝置例如硬盤(pán)、CD-ROM、DVD-ROM和任何其它已知的存儲(chǔ)裝置。
      本發(fā)明還提供在計(jì)算機(jī)可讀介質(zhì)(如上定義)中寫(xiě)入了實(shí)施本發(fā)明選擇方法的指令的計(jì)算機(jī)程序產(chǎn)品。即,可以在快速計(jì)算機(jī)存儲(chǔ)器中編譯和負(fù)載該計(jì)算機(jī)程序,或者可以在永久性存儲(chǔ)裝置上(任選地以壓縮格式)負(fù)載并從該存儲(chǔ)裝置執(zhí)行該計(jì)算機(jī)程序。因此,本發(fā)明也包括如下系統(tǒng),該系統(tǒng)包含靶序列數(shù)據(jù)庫(kù)和用于執(zhí)行該計(jì)算機(jī)程序的應(yīng)用程序。圖17中給出了用于該計(jì)算機(jī)程序的源代碼。
      在隨機(jī)分布的核酸群體中,具有給定長(zhǎng)度的選定序列的出現(xiàn)率將遵循以下定義的統(tǒng)計(jì)學(xué)分布N1=該給定的核酸群體的全長(zhǎng)(例如,在2003年6月30日第1次發(fā)布的RefSeq中為76,002,917堿基對(duì))。
      N2=包含該核酸群體的片段的數(shù)目(例如,在2003年6月30日第1次發(fā)布的RefSeq中為38,556個(gè)基因)。
      N3=識(shí)別序列的長(zhǎng)度(例如,9個(gè)堿基對(duì))
      N4=出現(xiàn)率N4=(N1-((N3-1)×2×N2))/(4N3)例如, 或者 因此,如在以上實(shí)例中所述,隨機(jī)的8-mer和9-mer序列在具有所述38,556個(gè)mRNA序列的隨機(jī)群體中分別地平均出現(xiàn)1,151次和287次。
      在以上實(shí)例中,源于38,556個(gè)基因的76,002,917個(gè)堿基對(duì)將相應(yīng)于平均1971bp的轉(zhuǎn)錄物長(zhǎng)度,各含有1971-16或者1955個(gè)9-mer靶序列。因此,作為統(tǒng)計(jì)學(xué)最小值,對(duì)于一個(gè)探針靶向一個(gè)基因而言,將需要38,556/1955/287或5671個(gè)9-mer探針。
      然而,9-mer序列的出現(xiàn)并非隨機(jī)分布的。事實(shí)上,一小組序列有驚人的高出現(xiàn)率,高達(dá)從隨機(jī)分布預(yù)期到的出現(xiàn)率的30倍以上。在根據(jù)優(yōu)選標(biāo)準(zhǔn)選擇的一個(gè)特定靶群體中,優(yōu)選地,應(yīng)當(dāng)選擇最常見(jiàn)的序列以增加所選的探針靶序列文庫(kù)的覆蓋率。如前所述,應(yīng)當(dāng)逐步實(shí)施選擇,以便在起始的靶群體中以及在每一個(gè)選擇步驟之后的剩余群體中都對(duì)選擇的最常見(jiàn)的靶序列作出評(píng)價(jià)。
      在本發(fā)明的一個(gè)優(yōu)選實(shí)施方案中,探針文庫(kù)的靶標(biāo)是整個(gè)表達(dá)的轉(zhuǎn)錄物組。
      由于逆轉(zhuǎn)錄酶反應(yīng)的成功率縮短了與所用的RT引物的距離,而且,由于通常使用poly-T引物靶向mRNA的poly-A尾,故上述靶標(biāo)可以進(jìn)一步被限制到僅僅包括每個(gè)mRNA中的1000個(gè)最近側(cè)的堿基。這可以導(dǎo)致對(duì)另一組最佳探針靶序列的選擇以獲得最佳覆蓋率。
      同樣地,上述靶標(biāo)也可以被限制到僅僅包括基因內(nèi)含子側(cè)翼50bp的編碼區(qū)序列,從而確保試驗(yàn)優(yōu)選地僅監(jiān)測(cè)mRNA而不監(jiān)測(cè)基因組DNA,或者,可以限制到僅僅包括不含有二-、三或四重復(fù)序列的區(qū)域,以避免探針或引物與不含已知等位基因變異的區(qū)域的反復(fù)結(jié)合,避免由于極高GC含量的靶序列或區(qū)域中的序列變異導(dǎo)致的引物或探針的錯(cuò)誤退火,從而避免對(duì)PCR擴(kuò)增的抑制作用。
      取決于每一個(gè)靶選擇,最佳探針集合可以隨著每一個(gè)靶選擇中的靶序列的普遍性而發(fā)生變化。
      選擇鑒定方式和鑒定單核酸本發(fā)明的另一部分涉及用于鑒定靶核酸的鑒定方法,該方法包括A)向計(jì)算機(jī)系統(tǒng)輸入唯一地確定所述靶核酸的核酸序列的數(shù)據(jù),其中所述計(jì)算機(jī)系統(tǒng)包含容納有至少一個(gè)本發(fā)明核酸探針文庫(kù)的組成信息的數(shù)據(jù)庫(kù),而且,其中所述計(jì)算機(jī)系統(tǒng)還包含針對(duì)所述至少一個(gè)文庫(kù)的每一探針的靶核酸序列數(shù)據(jù)庫(kù)和/或還包含獲取和比較核酸序列數(shù)據(jù)的手段;B)在該計(jì)算機(jī)系統(tǒng)中從所述至少一個(gè)文庫(kù)鑒定探針,其中所述探針的序列存在于靶核酸序列中或存在于該靶核酸序列的互補(bǔ)序列中;C)在計(jì)算機(jī)系統(tǒng)中鑒定可以擴(kuò)增所述靶核酸序列的引物;和D)提供指出步驟B中鑒定的探針和步驟C中鑒定的引物序列的輸出結(jié)果,作為用于檢測(cè)的特定鑒定方式。
      當(dāng)期望快速而特異地鑒定特定核酸時(shí),上述方法有幾個(gè)優(yōu)點(diǎn)。如果研究者已經(jīng)獲得了適宜的本發(fā)明多探針文庫(kù),該方法使得可以在數(shù)秒內(nèi)獲取有關(guān)應(yīng)當(dāng)應(yīng)用于隨后試驗(yàn)的文庫(kù)探針的相關(guān)信息以及應(yīng)當(dāng)合成的引物的相關(guān)信息。由于引物對(duì)能夠過(guò)夜合成,而探針的合成通常是十分費(fèi)時(shí)而繁瑣的,因此時(shí)間因素是重要的。
      為了有利于該方法的應(yīng)用,可以標(biāo)識(shí)探針文庫(kù)(例如,通過(guò)可以基本上告知計(jì)算機(jī)系統(tǒng)該探針文庫(kù)的組成的產(chǎn)品代碼)。由此,步驟A包含向計(jì)算機(jī)系統(tǒng)輸入標(biāo)識(shí)所述至少一個(gè)核酸文庫(kù)的數(shù)據(jù),從該核酸文庫(kù)將期望選出在特定檢測(cè)方式中使用的成員。
      優(yōu)選的輸入界面是基于因特網(wǎng)的網(wǎng)絡(luò)界面,因?yàn)樵摲椒梢苑奖愕卮鎯?chǔ)在網(wǎng)絡(luò)服務(wù)器上以允許已經(jīng)獲得本發(fā)明探針文庫(kù)的用戶(hù)進(jìn)入。然而,該方法也可以用作可以安裝在單個(gè)計(jì)算機(jī)或局域網(wǎng)上的安裝型計(jì)算機(jī)應(yīng)用的一部分。
      在該方法的優(yōu)選實(shí)施方案中,選擇步驟C中鑒定的引物以便最小化在PCR反應(yīng)中擴(kuò)增基因組核酸的可能性。這當(dāng)然只有在樣品可能含有基因組物質(zhì)的情況下是恰當(dāng)?shù)?。一種簡(jiǎn)單的使擴(kuò)增基因組核酸的可能性最小化的方式是,在至少一個(gè)引物中包括在基因組DNA中被內(nèi)含子打斷的核苷酸序列。以此方式,引物將只引發(fā)已經(jīng)拼接去除了內(nèi)含子的轉(zhuǎn)錄物的擴(kuò)增。
      本發(fā)明方法的另一優(yōu)化是選擇步驟C中的引物以最小化從靶核酸序列的PCR擴(kuò)增獲得的擴(kuò)增子的長(zhǎng)度,此外,還優(yōu)選選擇該引物以?xún)?yōu)化GC含量以便實(shí)施隨后的PCR。
      就此探針選擇方法而言,可以以提供寫(xiě)在計(jì)算機(jī)可讀介質(zhì)上的實(shí)施本發(fā)明的指令的計(jì)算機(jī)程序產(chǎn)品形式,為終端用戶(hù)提供選擇檢測(cè)手段的方法。因此,本發(fā)明還涉及包含本發(fā)明探針文庫(kù)數(shù)據(jù)庫(kù)和執(zhí)行該計(jì)算機(jī)程序的應(yīng)用程序的系統(tǒng)。
      該方法和計(jì)算機(jī)程序和系統(tǒng)允許定性或定量地確定樣品中靶核酸的存在,其包括i)通過(guò)本發(fā)明的檢測(cè)手段選擇方法,鑒定用于檢測(cè)靶核酸的特異手段,其中用于檢測(cè)的該特定手段包含寡核苷酸探針和一組引物;ii)獲得在步驟i)中鑒定的引物和寡核苷酸探針;iii)在來(lái)自步驟ii)的引物和寡核苷酸探針的存在下對(duì)樣品實(shí)施分子擴(kuò)增程序;和iv)基于步驟iii)的結(jié)果確定靶核酸的存在。
      方便地,步驟ii)中獲得的引物是通過(guò)合成獲得的,而且優(yōu)選地該寡核苷酸探針獲自本發(fā)明文庫(kù)。
      分子擴(kuò)增方法典型地是PCR或NASBA程序,但是任何用于核酸特異擴(kuò)增(和可能地檢測(cè))的體外方法也均是有用的。優(yōu)選的PCR方法是qPCR(也稱(chēng)作實(shí)時(shí)逆轉(zhuǎn)錄PCR或動(dòng)態(tài)RT-PCR)。
      本發(fā)明的其它方面在以下進(jìn)行討論。
      附圖簡(jiǎn)述圖1在(A)圖中說(shuō)明常規(guī)長(zhǎng)探針的使用,并在(B)圖中說(shuō)明來(lái)自根據(jù)本發(fā)明構(gòu)建的文庫(kù)的短多探針的特性和使用。該短多探針包含選擇的識(shí)別片段,這樣每個(gè)探針序列均可以用于檢測(cè)和/或定量包含互補(bǔ)識(shí)別序列的幾個(gè)不同靶序列。圖1A顯示根據(jù)現(xiàn)有技術(shù)的方法。圖1B顯示根據(jù)本發(fā)明一方面的方法。
      圖2是顯示用于設(shè)計(jì)根據(jù)本發(fā)明一方面的文庫(kù)多探針序列的方法的流程圖。該方法可以通過(guò)執(zhí)行寫(xiě)在計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)程序所提供的指令來(lái)實(shí)施。在一個(gè)方面,該程序指令通過(guò)包含序列數(shù)據(jù)庫(kù),例如表達(dá)序列數(shù)據(jù)庫(kù)的系統(tǒng)來(lái)執(zhí)行。
      圖3說(shuō)明在根據(jù)本發(fā)明一方面的100個(gè)探針的文庫(kù)中靶向每一基因的探針的冗余性。Y軸顯示了人類(lèi)轉(zhuǎn)錄物組中被文庫(kù)中不同數(shù)量的探針靶向的基因數(shù)。明顯地,在所有基因中大多數(shù)基因都被幾個(gè)探針靶向。每基因的平均探針數(shù)為17.4。
      圖4顯示選擇的具有給定長(zhǎng)度的超冗余寡核苷酸對(duì)人類(lèi)轉(zhuǎn)錄物組的覆蓋率。該圖顯示了大約38,000個(gè)人類(lèi)mRNA序列中可以通過(guò)遞增數(shù)量的不同長(zhǎng)度的所選短多探針檢測(cè)的百分?jǐn)?shù)。該圖說(shuō)明不同長(zhǎng)度的最佳選擇的(即,超冗余的、非自我互補(bǔ)的、熱穩(wěn)定的)短多探針對(duì)人類(lèi)轉(zhuǎn)錄物組的理論覆蓋率。該人類(lèi)(Homo sapiens)轉(zhuǎn)錄物組序列從歐洲生物信息機(jī)構(gòu)(EMBL-EBI)獲得。最接近每個(gè)mRNA序列3′末端的1000nt區(qū)域(3′末端上游50nt至1050nt)被用于分析。在每個(gè)序列通過(guò)PCR擴(kuò)增后,擴(kuò)增的雙螺旋的兩條鏈都被認(rèn)為是探針文庫(kù)中的多探針的有效靶標(biāo)。排除甚至在具有LNA替代的情況下也不具有適當(dāng)Tm的探針序列和自身互補(bǔ)的探針序列。
      圖5顯示寡核苷酸探針EQ13992的MALDI-MS譜,說(shuō)明[M-H]-=4121,3Da。
      圖6顯示在雙標(biāo)記探針試驗(yàn)中使用9-mer多探針檢測(cè)靶序列的典型實(shí)時(shí)PCR曲線(xiàn)。結(jié)果來(lái)自使用LNA增強(qiáng)的雙標(biāo)記9nt長(zhǎng)探針靶向同一基因內(nèi)的不同9-mer序列的實(shí)時(shí)PCR反應(yīng)。在PCR中分別分析三個(gè)不同的雙標(biāo)記探針,產(chǎn)生469、570或671的SSA4擴(kuò)增子(每一個(gè)長(zhǎng)81至95nt)。圖a、b和c分別顯示雙標(biāo)記探針469、570和671。每個(gè)探針僅僅檢測(cè)其設(shè)計(jì)用于檢測(cè)的擴(kuò)增子。對(duì)于雙標(biāo)記探針469、570和671,Ct值分別是23.7、23.2和23.4。加入2×107個(gè)拷貝的SSA4cDNA作為模板。盡管在探針序列和其相應(yīng)的引物對(duì)上均存在差異,但結(jié)果之間高度相似,這說(shuō)明該試驗(yàn)是十分可靠的。
      圖7顯示具有9-mer和10-mer識(shí)別位點(diǎn)的分子信標(biāo)的實(shí)時(shí)PCR曲線(xiàn)的實(shí)例。圖(A)具有10-mer識(shí)別位點(diǎn)的分子信標(biāo)探針檢測(cè)469SSA4擴(kuò)增子。僅僅在添加有SSA4 cDNA的樣品中獲得信號(hào)。得到24.0的Ct值。圖(B)顯示了使用具有9-mer識(shí)別位點(diǎn)的分子信標(biāo)檢測(cè)570SSA4擴(kuò)增子的相似實(shí)驗(yàn)。僅僅在添加SSA4 cDNA(2×107個(gè)拷貝)時(shí)獲得信號(hào)。
      圖8顯示使用具有9-mer識(shí)別位點(diǎn)的SYBR探針靶向570 SSA4擴(kuò)增子的實(shí)時(shí)PCR曲線(xiàn)實(shí)例。僅僅在添加了SSA4 cDNA(2×107個(gè)拷貝)的樣品中獲得信號(hào),而在不添加模板時(shí)檢測(cè)不到信號(hào)。
      圖9顯示使用雙標(biāo)記探針試驗(yàn)原理得到的三個(gè)不同9-mer多探針的校準(zhǔn)曲線(xiàn)。通過(guò)三個(gè)雙標(biāo)記探針檢測(cè)不同拷貝數(shù)水平的SSA4 cDNA。循環(huán)閾值nr定義各PCR首次檢測(cè)到信號(hào)時(shí)的循環(huán)數(shù)。三個(gè)線(xiàn)性回歸線(xiàn)的斜率(α)和相關(guān)系數(shù)(R2)為α=-3.456&amp;R2=0.9999(雙標(biāo)記的469);α=-3.468&amp;R2=0.9981(雙標(biāo)記的570);α=-3.499&amp;R2=0.9993(雙標(biāo)記的671)。
      圖10顯示在暴露于熱休克之前和之后在野生型酵母菌株以及突變菌株中利用9-mer雙標(biāo)記的多探針定量熱休克蛋白,其中在所述突變菌株中已經(jīng)缺失了該相應(yīng)的基因。顯示了利用雙標(biāo)記的570探針對(duì)野生型(wt)酵母和SSA4敲除突變體中的SSA4轉(zhuǎn)錄物水平的實(shí)時(shí)檢測(cè)。所述不同菌株在30℃培養(yǎng)直到收獲(-HS)或者在收獲前暴露于40℃30分鐘。在本實(shí)例中使用雙標(biāo)記的570探針。僅僅在wt型菌株中檢測(cè)到該轉(zhuǎn)錄物,在+HS培養(yǎng)物中該轉(zhuǎn)錄物極其大量。對(duì)于+HS和-HS培養(yǎng)物,Ct值分別為26.1和30.3。
      圖11顯示如何通過(guò)相同的9-mer探針檢測(cè)一個(gè)以上基因同時(shí)不檢測(cè)不含探針靶序列(即,與識(shí)別序列互補(bǔ))的核酸分子的一個(gè)實(shí)例。在(a)中,雙標(biāo)記的469既檢測(cè)SSA4(469擴(kuò)增子)也檢測(cè)POL5轉(zhuǎn)錄物,Ct值分別為29.7和30.1。從APG9和HSP82轉(zhuǎn)錄物未檢測(cè)到信號(hào)。在(b)中,雙標(biāo)記的570既檢測(cè)SSA4(570擴(kuò)增子)也檢測(cè)APG9轉(zhuǎn)錄物,Ct值分別為31.3和29.2。從POL5和HSP82轉(zhuǎn)錄物未檢測(cè)到信號(hào)。在(c)中,雙標(biāo)記的671既檢測(cè)SSA4(671擴(kuò)增子)也檢測(cè)HSP82轉(zhuǎn)錄物,Ct值分別為29.8和25.6。從POL5和APG9轉(zhuǎn)錄物未檢測(cè)到信號(hào)。圖注中顯示在不同PCR中產(chǎn)生的擴(kuò)增子。使用與圖10所述試驗(yàn)相同量的cDNA。僅僅使用來(lái)自未熱休克的野生型酵母的cDNA。
      圖12顯示在圖11的實(shí)例所示的PCR反應(yīng)中產(chǎn)生的部分?jǐn)U增子的瓊脂糖凝膠電泳,說(shuō)明探針對(duì)包含識(shí)別序列的靶序列是特異的,但是其不與不含該靶序列的核酸分子雜交。泳道1含有SSA4-469擴(kuò)增子(81bp),泳道2含有POL5擴(kuò)增子(94bp),泳道3含有APG9擴(kuò)增子(97bp),泳道4含有HSP82擴(kuò)增子(88bp)。泳道M含有50bp梯作為大小指示劑。明顯地,在所有4種情況中都形成了產(chǎn)物;然而,僅僅包含正確的多探針靶序列的擴(kuò)增(即,SSA4-467和POL5)被雙標(biāo)記的探針467檢測(cè)到。從泳道1和2中檢測(cè)到的片段的大小差異,說(shuō)明事實(shí)上產(chǎn)生并檢測(cè)到了兩種不同的擴(kuò)增。
      圖13優(yōu)選的靶序列。
      圖14其它優(yōu)選的靶序列。
      圖15長(zhǎng)聚物(longmer)(陽(yáng)性對(duì)照)。序列顯示在SEQ ID NOs.32-46中。
      圖16選擇探針和設(shè)計(jì)用于qPCR的引物的方案。
      圖17在多探針數(shù)據(jù)集的計(jì)算中使用的程序的源代碼。
      發(fā)明詳述本發(fā)明涉及短寡核苷酸探針或多探針,這些探針或多探針被選擇和設(shè)計(jì)用于檢測(cè)、分類(lèi)或表征和/或定量許多不同的靶核酸分子。這些多探針包含至少一個(gè)用于增加探針對(duì)識(shí)別序列的結(jié)合親和力的非天然修飾(例如,LNA核苷酸),其中所述識(shí)別序列是靶核酸分子的子序列。這些靶核酸分子在該識(shí)別序列之外是不同的。
      一方面,多探針包含至少一個(gè)用化學(xué)部分修飾以增加探針對(duì)識(shí)別序列——靶核酸序列的子序列——的結(jié)合親和力的核苷酸。另一方面,探針包含至少一個(gè)非天然核苷酸和至少一個(gè)被化學(xué)部分修飾的核苷酸。再一方面,所述至少一個(gè)非天然核苷酸被化學(xué)部分修飾。本發(fā)明還提供包含所述探針的試劑盒、文庫(kù)和其它組合物。
      本發(fā)明還提供i)針對(duì)給定的靶序列混合物選擇和設(shè)計(jì)適宜的寡核苷酸探針的方法,ii)具有這些能力的單個(gè)探針,和iii)經(jīng)選擇和設(shè)計(jì)以致能夠用最少數(shù)量的探針序列檢測(cè)、分類(lèi)和/或定量最大數(shù)量的靶核苷酸的探針文庫(kù)。根據(jù)本發(fā)明的每一探針因此均能夠結(jié)合許多不同的靶,并且當(dāng)與PCR試驗(yàn)中的一組特異引物組合時(shí)可以用于創(chuàng)建特異試驗(yàn)。
      本發(fā)明的優(yōu)選核苷酸由大約8至9個(gè)核苷酸單元組成,其實(shí)質(zhì)性部分包含穩(wěn)定化核苷酸,例如LNA核苷酸。優(yōu)選的文庫(kù)含有大約100個(gè)這樣的探針,這些探針經(jīng)選擇和設(shè)計(jì)可以表征一組特異核酸,例如,mRNA、cDNA或基因組DNA。該文庫(kù)可以有多種用途,例如,基因表達(dá)分析、SNP檢測(cè)等(見(jiàn)例如圖1)。
      定義針對(duì)本發(fā)明公開(kāi)中使用的特定術(shù)語(yǔ),提供如下定義。
      除非上下文有清楚的另行說(shuō)明,如本文中所用,單數(shù)形式“a”、“an”和“the”包括復(fù)數(shù)的情況。例如,術(shù)語(yǔ)“細(xì)胞”包括多個(gè)細(xì)胞,包括其混合物。術(shù)語(yǔ)“核酸分子”包括多個(gè)核酸分子。
      在本文中,術(shù)語(yǔ)“轉(zhuǎn)錄物組”(transcriptome)指由任何物種基因組中的所有被轉(zhuǎn)錄的元件構(gòu)成的集合。
      除了mRNA外,該術(shù)語(yǔ)也指用于結(jié)構(gòu)和調(diào)節(jié)目的的非編碼RNA。
      在本文中,術(shù)語(yǔ)“擴(kuò)增子”指小的復(fù)制DNA片段。
      本文中,“樣品”指從一個(gè)或多個(gè)生物體分離的組織或體液樣品,包括但不限于,例如,皮膚、血漿、血清、脊髓液、淋巴液、滑液、尿、眼淚、血液細(xì)胞、器官、腫瘤以及體外細(xì)胞培養(yǎng)成分(包括但不限于通過(guò)細(xì)胞在細(xì)胞培養(yǎng)基中的生長(zhǎng)而產(chǎn)生的條件培養(yǎng)基、重組細(xì)胞和細(xì)胞成分)的樣品。
      本文中,“生物”指活的實(shí)體,包括但不限于,例如,人、小鼠、大鼠、果蠅(Drosophila)、秀麗隱桿線(xiàn)蟲(chóng)(C.elegans)、酵母、擬南芥(Arabidopsis)、斑馬魚(yú)、靈長(zhǎng)類(lèi)動(dòng)物、家畜等。
      術(shù)語(yǔ)“SBC核酸堿基”指“選擇性結(jié)合的互補(bǔ)”核酸堿基,即,可以與其互補(bǔ)核酸堿基形成穩(wěn)定的氫鍵但不能與其它SBC核酸堿基形成穩(wěn)定氫鍵的修飾的核酸堿基。例如,SBC核酸堿基A′可以與其互補(bǔ)的非修飾核酸堿基T形成穩(wěn)定的氫鍵鍵合對(duì)。同樣,SBC核酸堿基T′可以與其互補(bǔ)的非修飾核酸堿基A形成穩(wěn)定的氫鍵鍵合對(duì)。然而,SBC核酸堿基A′和T′與堿基對(duì)A′-T和A-T′相比將形成不穩(wěn)定的氫鍵鍵合對(duì)。同樣地,SBC核酸堿基C被稱(chēng)作C′,可以與其互補(bǔ)的非修飾核酸堿基G形成穩(wěn)定的氫鍵鍵合對(duì),而SBC核酸堿基G被稱(chēng)作G′,可以與其互補(bǔ)的非修飾核酸堿基C形成穩(wěn)定的氫鍵鍵合對(duì);而與堿基對(duì)C′-G和C-G′相比,C′和G′將形成不穩(wěn)定的氫鍵鍵合對(duì)。當(dāng)形成2個(gè)或2個(gè)以上的氫鍵時(shí)獲得穩(wěn)定的氫鍵鍵合對(duì),例如,A′和T、A和T′、C和G′以及C′和G之間形成的對(duì)。當(dāng)形成1個(gè)氫鍵或不形成氫鍵時(shí)獲得不穩(wěn)定的氫鍵鍵合對(duì),例如,A′和T′以及C′和G′之間的對(duì)。
      尤其有意義的SBC核酸堿基是2,6-二氨基嘌呤(A′,也稱(chēng)作D)以及2-硫代尿嘧啶(U′,也稱(chēng)作2SU)(2-硫代-4-氧代-嘧啶)和2-硫代胸腺嘧啶(T′,也稱(chēng)作2ST)(2-硫代-4-氧代-5-甲基-嘧啶)。圖4說(shuō)明A-2ST以及D-T對(duì)具有2個(gè)或2個(gè)以上的氫鍵,而D-2ST對(duì)形成單一一個(gè)(不穩(wěn)定的)氫鍵。同樣地,圖9顯示了SBC核酸堿基吡咯并-[2,3-d]嘧啶-2(3H)-酮(C′,也稱(chēng)作PyrroloPyr)以及次黃嘌呤(G′,也稱(chēng)作I)(6-氧代-嘌呤),其中PyrroloPyr-G以及C-I對(duì)各具有2個(gè)氫鍵,而PyrroloPyr-I對(duì)形成單一一個(gè)氫鍵。
      “SBC LNA寡聚體”指含有至少一個(gè)“LNA單元”的“LNA寡聚體”,其中該核酸堿基是“SBC核酸堿基”?!熬哂蠸BC核酸堿基的LNA單元”是指“SBC LNA單體”。一般來(lái)講,SBC LNA寡聚體包括除了SBCLNA單體外還含有其它修飾的或天然的核苷酸或核苷的寡聚體?!癝BC單體”是指具有SBC核酸堿基的非LNA單體?!暗刃蛄泄押塑账帷笔侵冈赪atson-Crick意義上與相應(yīng)的修飾寡核苷酸具有相同序列的寡核苷酸,例如,序列agTtcATg等價(jià)于agTscD2SUg,其中s等價(jià)于SBCDNA單體2-硫代-t或2-硫代-u,D等價(jià)于SBC LNA單體LNA-D,2SU等價(jià)于SBC LNA單體LNA2SU。
      如本文所用,術(shù)語(yǔ)“核酸”、“多核苷酸”和“寡核苷酸”指引物、探針、待檢測(cè)的寡聚體片段、寡聚體對(duì)照和未標(biāo)記的封閉寡聚體,并且應(yīng)當(dāng)屬于多聚脫氧核糖核苷酸(含有2-脫氧-D-核糖)、多聚核糖核苷酸(含有D-核糖)、以及作為嘌呤或嘧啶堿基或修飾的嘌呤或嘧啶堿基的N糖苷的任何其它類(lèi)型的多核苷酸。術(shù)語(yǔ)“核酸”、“多核苷酸”和“寡核苷酸”之間并不存在有意的長(zhǎng)度區(qū)別,這些術(shù)語(yǔ)可以互換使用。這些術(shù)語(yǔ)僅僅指分子的一級(jí)結(jié)構(gòu)。因此,這些術(shù)語(yǔ)包括雙鏈和單鏈DNA以及雙鏈和單鏈RNA。寡核苷酸由相應(yīng)于指定的核苷酸序列區(qū)域的大約至少3個(gè)核苷酸、優(yōu)選至少大約6個(gè)核苷酸,更優(yōu)選至少大約8至30個(gè)核苷酸的序列組成。“相應(yīng)”指與該指定的序列相同或互補(bǔ)。
      物理上,寡核苷酸不一定來(lái)源于任何已有或天然的序列,而是可以以任何方式產(chǎn)生,包括化學(xué)合成、DNA復(fù)制、逆轉(zhuǎn)錄或其組合。術(shù)語(yǔ)“寡核苷酸”或“核酸”意指半合成來(lái)源的或合成來(lái)源的基因組DNA或RNA、cDNA的多核苷酸,根據(jù)其來(lái)源或操作,該多核苷酸(1)與天然和其連接的所有或部分多核苷酸均不相連;和/或(2)與非其天然連接的多核苷酸連接;和(3)是天然中不存在的。
      由于單核苷酸之間的反應(yīng)通過(guò)一個(gè)單核苷酸的戊糖環(huán)的5′磷酸與其相鄰單核苷酸的3′氧按一定方向借助磷酸二酯鍵連接而形成寡核苷酸,故當(dāng)寡核苷酸的5′磷酸未與單核苷酸戊糖環(huán)的3′氧連接時(shí)寡核苷酸的末端被稱(chēng)作“5′末端”,而如果其3′氧未與隨后的單核苷酸的戊糖環(huán)的5′磷酸連接時(shí)則該寡核苷酸的末端被稱(chēng)作“3′末端”。在本文中,一段核酸序列,即使位于更大寡核苷酸的內(nèi)部,也可以說(shuō)具有5′和3′末端。
      當(dāng)兩個(gè)不同的非重疊的寡核苷酸與同一個(gè)線(xiàn)性互補(bǔ)核酸序列的不同區(qū)域退火時(shí),一個(gè)寡核苷酸的3′末端將對(duì)著另一個(gè)寡核苷酸的5′末端;前者可以被稱(chēng)作“上游”寡核苷酸,而后者被稱(chēng)作“下游”寡核苷酸。
      術(shù)語(yǔ)“引物”可以指一個(gè)以上引物,其是指當(dāng)被放置在催化與核酸鏈互補(bǔ)的引物延伸產(chǎn)物合成的條件下時(shí),能夠作為沿著互補(bǔ)鏈的合成的起始點(diǎn)起作用的寡核苷酸,而無(wú)論該寡核苷酸是天然的——以純化的限制性消化產(chǎn)物的形式——還是合成產(chǎn)生的。所述條件包括在適宜的緩沖液(“緩沖液”包括作為輔因子或影響pH、離子強(qiáng)度等的組分)中以及在適宜溫度下存在4種不同的脫氧核糖核苷三磷酸以及聚合誘導(dǎo)劑例如DNA聚合酶或逆轉(zhuǎn)錄酶。引物優(yōu)選是單鏈的以便獲得最大擴(kuò)增效率。
      如本文所用,術(shù)語(yǔ)“PCR反應(yīng)”、“PCR擴(kuò)增”、“PCR”和“實(shí)時(shí)PCR”是可以互換使用的術(shù)語(yǔ),其用于意指應(yīng)用核酸擴(kuò)增系統(tǒng)以擴(kuò)增所檢測(cè)的靶核酸。該系統(tǒng)的實(shí)例包括聚合酶鏈?zhǔn)椒磻?yīng)(PCR)系統(tǒng)和連接酶鏈?zhǔn)椒磻?yīng)(LCR)系統(tǒng)。本領(lǐng)域技術(shù)人員已知的和近來(lái)描述的其它方法有基于核酸序列的擴(kuò)增(NASBATM,Cangene,Mississauga,Ontario)和Qβ復(fù)制酶系統(tǒng)。通過(guò)所述擴(kuò)增反應(yīng)形成的產(chǎn)物可以進(jìn)行實(shí)時(shí)檢測(cè)或也可以不進(jìn)行實(shí)時(shí)監(jiān)測(cè),或者僅在反應(yīng)后進(jìn)行終點(diǎn)測(cè)量。
      本文中,核酸序列的互補(bǔ)物是指當(dāng)與該核酸序列對(duì)齊以致一個(gè)序列的5′末端與另一序列的3′末端配對(duì)時(shí)與該核酸序列存在反平行關(guān)系的寡核苷酸。在本發(fā)明的核酸中可以包括在天然核酸中不常見(jiàn)的堿基,這些堿基包括例如次黃嘌呤核苷和7-脫氮雜鳥(niǎo)嘌呤(7-deazaguanine)?;パa(bǔ)可以不是完全的;穩(wěn)定的雙螺旋可以含有錯(cuò)配堿基對(duì)或未配對(duì)的堿基。核酸技術(shù)領(lǐng)域的技術(shù)人員可以通過(guò)經(jīng)驗(yàn)地考慮多個(gè)變量,包括例如寡核苷酸的長(zhǎng)度、寡核苷酸中胞嘧啶和鳥(niǎo)嘌呤堿基的濃度百分?jǐn)?shù)、離子強(qiáng)度以及錯(cuò)配堿基對(duì)的發(fā)生率,以確定雙螺旋的穩(wěn)定性。
      核酸雙螺旋的穩(wěn)定性可以通過(guò)熔解溫度或“Tm”測(cè)定。在規(guī)定條件下特定核酸雙螺旋的Tm是半數(shù)堿基對(duì)解離時(shí)的溫度。
      本文中,術(shù)語(yǔ)“探針”指標(biāo)記的寡核苷酸,其與靶核酸中的序列由于探針中的至少一段序列與該靶區(qū)中的序列互補(bǔ)而形成雙螺旋結(jié)構(gòu)。探針優(yōu)選地不含有與用作聚合酶鏈?zhǔn)椒磻?yīng)引物的序列互補(bǔ)的序列。一般地,探針的3′端被“封閉”以阻止探針摻入引物延伸產(chǎn)物。“封閉”可以通過(guò)使用非互補(bǔ)堿基或通過(guò)向最后一個(gè)核苷酸的3′羥基添加化學(xué)部分例如生物素或甚至磷酸基團(tuán)(取決于所選的部分,這可以通過(guò)還起到標(biāo)記的作用而達(dá)到雙重目的)來(lái)實(shí)現(xiàn)。
      術(shù)語(yǔ)“標(biāo)記物”在本文中指可以用于提供可檢測(cè)(優(yōu)選地可定量的)信號(hào)并且可以與核酸或蛋白質(zhì)連接的任何原子或分子。標(biāo)記物可以提供能夠通過(guò)熒光、放射性、比色、X射線(xiàn)衍射或吸收、磁性、酶活性等檢測(cè)的信號(hào)。
      本文中,“5′→3′核酸酶活性”或“從5′至3′的核酸酶活性”是指模板特異性核酸聚合酶的活性,包括常規(guī)與一些DNA聚合酶相關(guān)的5′→3′外切核酸酶活性——通過(guò)該活性,核苷酸順序地從寡核苷酸的5′末端被除去(例如,大腸桿菌DNA聚合酶I具有該活性而Klenow片段則不具備該活性)——或者5′→3′內(nèi)切核酸酶活性——其中從5′末端發(fā)生一個(gè)以上的核苷酸切除——或者兩者。
      本文中,術(shù)語(yǔ)“熱穩(wěn)定核酸聚合酶”指與例如來(lái)自大腸桿菌的核苷酸聚合酶相比對(duì)加熱具有相對(duì)較高的穩(wěn)定性并且催化核苷聚合的酶。一般地,該酶在與靶序列退火的引物的3′末端起始合成,并沿著模板朝著5′方向前進(jìn),而且,如果其具有5′至3′的核酸酶活性時(shí),將水解或置換介入其間的退火探針以釋放標(biāo)記和未標(biāo)記的探針片段或完整探針,直到合成終止。分離自水生棲熱菌(Thermus aquaticus)的代表性熱穩(wěn)定酶(Taq)描述在美國(guó)專(zhuān)利4,889,818中,在常規(guī)PCR中使用它的方法描述在Saiki等(1988),Science 239487中。
      術(shù)語(yǔ)“核酸堿基”包括天然核酸堿基腺嘌呤(A)、鳥(niǎo)嘌呤(G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)以及非天然核酸堿基例如黃嘌呤、二氨基嘌呤、8-氧代-N6-甲基腺嘌呤、7-脫氮雜黃嘌呤、7-脫氮雜鳥(niǎo)嘌呤、N4,N4-橋亞乙基胞嘧啶、N6,N6-橋亞乙基-2,6-二氨基嘌呤、5-甲基胞嘧啶、5-(C3-C6)-炔基-胞嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、假尿嘧啶、2-羥基-5-甲基-4-三唑并吡啶、異胞嘧啶、異鳥(niǎo)嘌呤、次黃苷和Benner等的美國(guó)專(zhuān)利5,432,272以及Susan M.Freier和Karl-Heinz Altmann,Nucleic Acid Research,254429-4443,1997中描述的“非天然”核酸堿基。術(shù)語(yǔ)“核酸堿基”由此不僅包括已知的嘌呤和嘧啶雜環(huán),還包括它們的雜環(huán)類(lèi)似物和互變異構(gòu)體。其它天然和非天然核酸堿基包括如下文獻(xiàn)中描述的那些美國(guó)專(zhuān)利3,687,808;Antisense Research and Application,S.T.Crooke和B.Lebleu編,CRC Press,1993中Sanghvi著的第15章;Englisch等,Angewandte Chemie,International Edition,30613-772,1991(見(jiàn),尤其是第622和623頁(yè));以及Concise Encyclopedia of PolymerScience and Engineering,J.I.Kroschwitz Ed.,John Wiley&amp;Sons,858-859頁(yè),1990;Cook,Anti-Cancer DrugDesign 6585-607,1991;所有上述文獻(xiàn)特此完整并入作為參考。
      術(shù)語(yǔ)“核苷堿基”或“核酸堿基類(lèi)似物”也旨在包括可以象核苷堿基一樣起作用的雜環(huán)化合物,包括某些“通用堿基”,這些堿基按最經(jīng)典的意義不是核苷堿基但是其可以充當(dāng)核苷堿基。尤其可以提及的“通用堿基”是3-硝基吡咯和5-硝基吲哚。其它優(yōu)選化合物包括芘和吡啶并噁唑衍生物、芘基、芘基甲基丙三醇衍生物等。其它優(yōu)選的通用甲基包括,吡咯、二唑或三唑衍生物,包括本領(lǐng)域已知的那些通用堿基。
      “通用堿基”是指天然的或期望地非天然的化合物或部分,其可以與天然堿基(例如,腺嘌呤、鳥(niǎo)嘌呤、胞嘧啶、尿嘧啶和/或胸腺嘧啶)配對(duì)并且如本文所述具有差15、12、10、8、6、4或2℃或更少的Tm。
      “寡核苷酸”、“寡聚體”或“Oligo”指通過(guò)核苷間鍵連接的一條連續(xù)的單體(例如,雜環(huán)堿基的糖苷)鏈。在Oligo中兩個(gè)連續(xù)單體之間的鍵由2至4個(gè),期望地3個(gè)基團(tuán)/原子組成,所述基團(tuán)/原子選自-CH2-、-O-、-S-、-NRH-、>C=O、>C=NRH、>C=S、-Si(R″)2-、-SO-、-S(O)2-、-P(O)2-、-PO(BH3)-、-P(O,S)-、-P(S)2-、-PO(R″)-、-PO(OCH3)-和-PO(NHRH)-,其中RH選自氫和C1-4-烷基,R″選自C1-6-烷基和苯基。該鍵的說(shuō)明性實(shí)例有-CH2-CH2-CH2-、-CH2-CO-CH2-、-CH2-CHOH-CH2-、-O-CH2-O-、-O-CH2-CH2-、-O-CH2-CH=(當(dāng)用作與隨后單體形成的鍵時(shí)包括R5)、-CH2-CH2-O-、-NRH-CH2-CH2-、-CH2-CH2-NRH-、-CM2-NRH-CH2-、-O-CH2-CH2-NRH-、-NRH-CO-O-、-NRH-CO-NRH-、-NRH-CS-NRH-、-NRH-C(=NRH)-NRH-、-NRH-CO-CH2-NRH-、-O-CO-O-、-O-CO-CH2-O、-O-CH2-CO-O-、-CH2-CO-NRH-、-O-CO-NRH-、-NRH-CO-CH2-、-O-CH2-CO-NRH-、-O-CH2-CH2-NRH-、-CH=N-O-、-CH2-NRH-O-、-CH2-O-N=(當(dāng)用作與隨后單體形成的鍵時(shí)包括R5)、-CH2-O-NRH-、-CO-NRH-CH2-、-CH2-NRH-O-、-CH2-NRH-CO-、-O-NRH-CH2-、-O-NRH-、-O-CH2-S-、-S-CH2-O-、-CH2-CH2-S-、-O-CH2-CH2-S-、-S-CH2-CH=(當(dāng)用作與隨后單體形成的鍵時(shí)包括R5)、-S-CH2-CH2-、-S-CH2-CH2-O-、-S-CH2-CH2-S-、-CH2-S-CH2-、-CH2-SO-CH2-、-CH2-SO2-CH2-、-O-SO-O-、-O-S(O)2-O-、-O-S(O)2-CH2-、-O-S(O)2-NRH-、-NRH-S(O)2-CH2-、-O-S(O)2-CH2-、-O-P(O)2-O-、-O-P(O,S)-S-、-O-P(S)2-O-、-S-P(O)2-O-、-S-P(O,S)-O-、-S-P(S)2-O-、-O-P(O)2-S-、-O-P(O,S)-S-、-O-P(S)2-S-、-S-P(O)2-S-、-S-P(O,S)-S-、-S-P(S)2-S-、-O-PO(R″)-O-、-O-PO(OCH3)-O-、-O-PO(OCH2CH3)-O-、-O-PO(OCH2CH2S-R)-O-、-O-PO(BH3)-O-、-O-PO(NHRN)-O-、-O-P(O)2-NRH、-NRH-p(O)2-O-、-O-P(O,NRH)-O-、-CH2-P(O)2-O-、-O-P(O)2-CH2-和-O-Si(R″)2-O-;尤其期望的是其中的-CH2-CO-NRH-、-CH2-NRH-O-、-S-CH2-O-、-O-P(O)2-O-、-O-P(O,S)-O-、-O-P(S)2-O-、-NRH-P(O)2-O-、-O-P(O,NRH)-O-、-O-PO(R″)-O-、-O-PO(CH3)-O-和-O-PO(NHRN)-O-,其中RH選自氫和C1-4-烷基,R″選自C1-6-烷基和苯基。其它舉例說(shuō)明性實(shí)例可見(jiàn)于Mesmaeker等,Current Opinion inStructural Biology 1995,5,343-355和Susan M.Freier和Karl-Heinz Altmann,Nucleic Acids Research,1997,25卷,4429-4443頁(yè)。核苷間鍵的左側(cè)作為取代基P*與5元環(huán)的3′位置連接,而其右側(cè)與前一單體的5′位置連接。
      “LNA單元”指單個(gè)LNA單體(例如,LNA核苷或LNA核苷酸)或包括至少一個(gè)LNA單體的寡聚體(例如,寡核苷酸或核酸)。一般地,描述于WO99/14226中的LNA單元是尤其期望摻入本發(fā)明寡核苷酸中的修飾核酸。此外,該核酸可以在3′和/或5′末端被本領(lǐng)域已知的任何修飾類(lèi)型修飾。例如,任一端或兩端可以用保護(hù)基加帽、連接柔性連接基團(tuán)、連接反應(yīng)性基團(tuán)以有助于附著基質(zhì)表面,等等。期望的LNA單元及其合成方法也公開(kāi)在如下文獻(xiàn)中WO 00/47599、US 6,043,060、US 6,268,490、PCT/JP98/00945、WO 0107455、WO 0100641、WO 9839352、WO 0056746、WO0056748、WO 0066604;Morita等,Bioorg.Med.Chem.Lett.12(1)73-76,2002;Hakansson等,Bioorg.Med.Chem.Lett.11(7)935-938,2001;Koshkin等,J.Org.Chem.66(25)8504-8512,2001;Kvaerno等,J.Org.Chem.66(16)5498-5503,2001;Hakansson等,J.Org.Chem.65(17)5161-5166,2000;Kvaerno等,J.Org.Chem.65(17)5167-5176,2000;Pfundheller等,Nucleosides Nucleotides 18(9)2017-2030,1999;和Kumar等,Bioorg.Med.Chem.Lett.8(16)2219-2222,1998。
      優(yōu)選的LNA單體,也稱(chēng)作“氧基-LNA”,是包括PCT公布WO03/020739中所述雙環(huán)化合物的LNA單體,其中下式(I)中所示R4′和R2′之間的橋在一起表示-CH2-O-(甲基氧基LNA)或-CH2-CH2-O-(乙基氧基LNA,也稱(chēng)作ENA)。
      其它優(yōu)選的LNA單體稱(chēng)作“硫基-LNA”或“氨基-LNA”,包括WO99/14226中所公開(kāi)的雙環(huán)結(jié)構(gòu),其中下式(I)所示R4′和R2′之間的橋中的雜原子在一起表示-CH2-S-、-CH2-CH2-S-、-CH2-NH-或-CH2-CH2-NH-。
      “LNA修飾的寡核苷酸”是指包含至少一個(gè)下式(I)的LNA單體單元的寡核苷酸及其堿式鹽和酸加成鹽,其具有以下描述的舉例說(shuō)明性修飾實(shí)例 其中,X選自-O-、-S-、-N(RN)-、-C(R6R6*)-、-O-C(R7R7*)-、-C(R6R6*)-O-、-S-C(R7R7*)-、-C(R6R6*)-S-、-N(RN*)-C(R7R7*)-、-C(R6R6*)-N(RN*)-和-C(R6R6*)-C(R7R7*)。
      B選自如上所述的修飾堿基,例如,任選取代的碳環(huán)芳基,例如,任選取代的芘或任選取代的芘基甲基丙三醇,或任選取代的雜脂環(huán)或任選取代的雜芳族,例如,任選取代的吡啶并噁唑、任選取代的吡咯、任選取代的二唑或任選取代的三唑部分;氫、羥基、任選取代的C1-4-烷氧基、任選取代的C1-4-烷基、任選取代的C1-4-酰氧基、核酸堿基、DNA嵌入劑、光化學(xué)活性基團(tuán)、熱化學(xué)活性基團(tuán)、螯合基團(tuán)、報(bào)道基團(tuán)和配體。
      P表示用于和隨后的單體形成核苷間鍵的基團(tuán)位置或表示5′末端基團(tuán),該核苷間鍵或5′末端基團(tuán)任選地包括取代基R5。取代基R2、R2*、R3及R3*中的一個(gè)是基團(tuán)P*,P*表示與前面的單體形成的核苷間鍵或2′/3′-末端基團(tuán)。R1*、R4*、R5、R5*、R6、R6*、R7、R7*、RN取代基以及不表示P*的R2、R2*、R3和R3*取代基各自可以表示選自如下的包含大約1-8個(gè)基團(tuán)/原子的雙基-C(RaRb)-、-C(Ra)=C(Ra)-、-C(Ra)=N-、-C(Ra)-O-、-O-、-Si(Ra)2-、-C(Ra)-S、-S-、-SO2-、-C(Ra)-N(Rb)-、-N(Ra)-和>C=Q,其中Q選自-O-、-S-和-N(Ra)-,且Ra和Rb各自獨(dú)立地選自氫、任選取代的C1-12-烷基、任選取代的C2-12-鏈烯基、任選取代的C2-12-炔基、羥基、C1-12-烷氧基、C2-12-鏈烯基氧基、羧基、C1-12-烷氧羰基、C1-12-烷基羰基、甲?;?、芳基、芳基氧基羰基、芳基氧基、芳基羰基、雜芳基、雜芳基氧基羰基、雜芳基氧基、雜芳基羰基、氨基、單和雙(C1-6-烷基)氨基、氨基甲?;?、單和雙(C1-6-烷基)氨基羰基、氨基-C1-6-烷基-氨基羰基、單和雙(C1-6-烷基)氨基-C1-6-烷基-氨基羰基、C1-6-烷基-羰基氨基、脲基、C1-6-烷?;趸ulphono、C1-6-烷基磺?;趸?、硝基、疊氮基、硫烷基(sulphanyl)、C1-6-烷基硫基、鹵素、DNA嵌入劑、光化學(xué)活性基團(tuán)、熱化學(xué)活性基團(tuán)、螯合基團(tuán)、報(bào)道基團(tuán)和配體,其中芳基和雜芳基可以被任選地取代,并且其中兩個(gè)孿位取代基Ra和Rb一起可以是任選取代的亞甲基,而且其中兩個(gè)選自Ra、Rb非孿位的或?qū)\位的取代基和存在的且不參與P、P*或所述雙基的取代基R1*、R2、R2*、R3、R3*、R4*、R5、R5*、R6、R6*、R7、R7*之任一的可以一起形成選自前述相同類(lèi)型的雙基的連接的雙基;由此非孿位取代基對(duì)與(i)和所述非孿位取代基結(jié)合的原子及(ii)任何介于其間的原子一起形成單或雙環(huán)實(shí)體。
      存在的但不參與P、P*或雙基的取代基R1*、R2、R2*、R3、R4*、R5、R5*、R6、R6*、R7、R7*各自獨(dú)立地選自氫、任選取代的C1-12-烷基、任選取代的C2-12-鏈烯基、任選取代的C2-12-炔基、羥基、C1-12-烷氧基、C2-12-鏈烯基氧基、羧基、C1-12-烷氧羰基、C1-12-烷基羰基、甲酰基、芳基、芳基氧基羰基、芳基氧基、芳基羰基、雜芳基、雜芳基氧基羰基、雜芳基氧基、雜芳基羰基、氨基、單和雙(C1-6-烷基)氨基、氨基甲酰基、單和雙(C1-6-烷基)氨基羰基、氨基-C1-6-烷基-氨基羰基、單和雙(C1-6-烷基)氨基-C1-6-烷基-氨基羰基、C1-6-烷基-羰基氨基、脲基、C1-6-烷酰基氧基、sulphono、C1-6-烷基磺?;趸?、硝基、疊氮基、硫烷基(sulphanyl)、C1-6-烷基硫基、鹵素、DNA嵌入劑、光化學(xué)活性基團(tuán)、熱化學(xué)活性基團(tuán)、螯合基團(tuán)、報(bào)道基團(tuán)和配體,其中芳基和雜芳基可以被任選地取代,并且其中兩個(gè)孿位取代基可以一起表示氧代、硫代(thioxo)、亞氨基或任選取代的亞甲基,或者可以一起形成由1-5個(gè)碳原子亞烷基鏈組成的螺雙基,其中所述亞烷基鏈任選地被選自-O-、-S-和-(NRN)-(其中RN選自氫和C1-4-烷基)的一個(gè)或多個(gè)雜原子/基團(tuán)中斷和/或終止,并且其中兩個(gè)相鄰(非孿位)取代基可以表示導(dǎo)致雙鍵的另一鍵;而且,當(dāng)存在但不參與雙基時(shí),RN*選自氫和C1-4-烷基。
      示例性5′、3′和/或2′末端基團(tuán)包括-H、-OH、鹵代(例如,氯代、氟代、碘代或溴代)、任選取代的芳基(例如苯基或芐基)、烷基(例如,甲基或乙基)、烷氧基(例如甲氧基)、?;?例如,乙酰基或苯甲?;?、芳?;?、芳烷基、羥基、羥基烷基、烷氧基、芳基氧基、芳烷氧基、硝基、氰基、羧基、烷氧羰基、芳氧羰基、芳烷氧基羰基、酰基氨基、芳?;被⑼榛酋;⒎蓟酋;?、雜芳基磺酰基、烷基亞磺?;?、芳基亞磺?;?、雜芳基亞磺酰基、烷基硫基、芳基硫基、雜芳基硫基、芳烷基硫基、雜芳烷基硫基、脒基、氨基、氨基甲?;?、氨磺酰基、鏈烯基、炔基、保護(hù)基(例如,甲硅烷基、4,4′-二甲氧基三苯甲基、單甲氧基三苯甲基、或三苯甲基(trityl))、接頭(例如,含有胺、乙二醇、醌、蒽醌的接頭)、可檢測(cè)標(biāo)記物(例如,放射性標(biāo)記或熒光標(biāo)記)和生物素。
      可以理解,此處提及核酸單元、核酸殘基、LNA單元或類(lèi)似術(shù)語(yǔ)時(shí)包括單個(gè)的核苷單元和核苷酸單元以及寡核苷酸中的核苷單元和核苷酸單元。
      “修飾的堿基”或其它類(lèi)似術(shù)語(yǔ)指可以與天然堿基(例如,腺嘌呤、鳥(niǎo)嘌呤、胞嘧啶、尿嘧啶和/或胸腺嘧啶)配對(duì)和/或可以與非天然核酸堿基或核苷堿基配對(duì)的合成物(例如,非天然的核酸堿基或核苷堿基)。期望地,修飾的堿基提供如所述的差15、12、10、8、6、4或2℃或更少的Tm。示例性修飾堿基描述在EP 1072 679和WO 97/12896中。
      術(shù)語(yǔ)“化學(xué)部分”指分子的一部分?!氨换瘜W(xué)部分修飾”由此指通過(guò)包括不尋常的化學(xué)結(jié)構(gòu)對(duì)標(biāo)準(zhǔn)分子結(jié)構(gòu)所進(jìn)行的修飾。所述結(jié)構(gòu)的附著可以是共價(jià)的或非共價(jià)的。
      術(shù)語(yǔ)在寡核苷酸探針中“包括化學(xué)部分”由此指附著分子結(jié)構(gòu)。該化學(xué)部分包括但不限于共價(jià)地和/或非共價(jià)地結(jié)合的小溝結(jié)合劑(MGB)和/或嵌入核酸(INA)——選自花菁染料、DAPI、SYBR Green I、SYBR Green II、SYBR Gold、PicoGreen、噻唑橙、Hoechst 33342、溴化乙啶、1-O-(1-芘基甲基)丙三醇和Hoechst 33258。其它化學(xué)部分包括修飾的核酸堿基、核苷堿基或LNA修飾的寡核苷酸。
      術(shù)語(yǔ)“雙標(biāo)記的探針”指具有兩個(gè)附著的標(biāo)記物的寡核苷酸。一方面,一個(gè)標(biāo)記物附著于探針?lè)肿拥?′端,而另一標(biāo)記物附著于分子的3′端。本發(fā)明的一個(gè)特定方面包含附著于一端的熒光分子和附著于另一端的能夠通過(guò)熒光共振能量轉(zhuǎn)移(FRET)淬滅該熒光團(tuán)的分子。5′核酸酶試驗(yàn)探針和一些分子信標(biāo)是雙標(biāo)記的探針的實(shí)例。
      術(shù)語(yǔ)“5′核酸酶試驗(yàn)探針”指可以被DNA聚合酶的5′-3′外切核酸酶活性水解的雙標(biāo)記探針。在特定的PCR試驗(yàn)所用條件下,5′核酸酶試驗(yàn)探針不一定被DNA聚合酶的5′-3′外切核酸酶活性水解。名稱(chēng)“5′核酸酶試驗(yàn)”的使用與所觀(guān)察到的水解程度無(wú)關(guān),其并不表示實(shí)驗(yàn)者的任何預(yù)期。術(shù)語(yǔ)“5′核酸酶試驗(yàn)探針”和“5′核酸酶試驗(yàn)”僅僅指這樣的試驗(yàn),在該試驗(yàn)中并不特別關(guān)注避免所涉及的探針的水解?!?′核酸酶試驗(yàn)探針”常常被稱(chēng)作“TaqMan試驗(yàn)探針”,而“5′核酸酶試驗(yàn)”則常常被稱(chēng)作“TaqMan試驗(yàn)”。這些名稱(chēng)在本申請(qǐng)中可以互換使用。
      術(shù)語(yǔ)“寡核苷酸類(lèi)似物”指能夠識(shí)別特定的靶核苷酸序列的核酸結(jié)合分子。一種特定的寡核苷酸類(lèi)似物是肽核酸(PNA),在PNA中,寡核苷酸的糖磷酸主鏈被蛋白樣主鏈替代。在PNA中,核酸堿基與不帶電荷的聚酰胺主鏈結(jié)合,產(chǎn)生嵌合的假肽-核酸結(jié)構(gòu),該結(jié)構(gòu)與核酸形式同形。
      術(shù)語(yǔ)“分子信標(biāo)”指不可能受到DNA聚合酶的5′-3′外切核酸酶活性影響的單或雙標(biāo)記的探針。對(duì)探針、聚合酶或試驗(yàn)條件的特定修飾可以避免由于DNA聚合酶的5′-3′外切核酸酶活性而分離標(biāo)記物或核苷酸組分。因此,檢測(cè)的原則取決于分子信標(biāo)與其靶序列結(jié)合后在標(biāo)記物引起的信號(hào)上出現(xiàn)的可檢測(cè)的差異。在本發(fā)明的一個(gè)方面,該寡核苷酸探針通過(guò)其5′和3′端的互補(bǔ)序列的介導(dǎo)而在選定的試驗(yàn)溫度下形成分子內(nèi)發(fā)夾結(jié)構(gòu)。所述的寡核苷酸可以在一端結(jié)合熒光分子,在另一端結(jié)合當(dāng)與發(fā)夾結(jié)構(gòu)中的熒光團(tuán)互相靠近時(shí)能淬滅該熒光團(tuán)的分子。在本發(fā)明的另一方面,并不基于探針序列兩端的互補(bǔ)結(jié)構(gòu)形成發(fā)夾結(jié)構(gòu),而是可以由于一個(gè)或兩個(gè)標(biāo)記物與所形成的雙螺旋結(jié)構(gòu)之間的相互作用,或由于結(jié)合后探針空間構(gòu)象的一般改變——或由于結(jié)合后標(biāo)記物之間的降低的相互作用,而導(dǎo)致結(jié)合后所檢測(cè)到的信號(hào)改變。分子信標(biāo)的一個(gè)特定方面包含多個(gè)LNA殘基以抑制DNA聚合酶的5′-3′外切核酸酶活性的水解作用。
      術(shù)語(yǔ)“多探針”在本文中指含有識(shí)別片段的探針,其中所述識(shí)別片段是與靶核酸分子中的識(shí)別序列充分互補(bǔ)以致可以在中等嚴(yán)緊條件下和/或適于PCR、5′核酸酶試驗(yàn)和/或分子信標(biāo)分析(或一般地任何基于FRET的方法)的條件下與該序列結(jié)合的探針序列。所述條件是本領(lǐng)域技術(shù)人員熟知的。優(yōu)選地,識(shí)別序列存在于所評(píng)價(jià)的多個(gè)序列,例如轉(zhuǎn)錄物組中。本發(fā)明的多探針可以含有非天然核苷酸(“穩(wěn)定化核苷酸”)并且可以比含有相同序列但無(wú)穩(wěn)定化修飾的探針具有更高的識(shí)別序列結(jié)合親和力。優(yōu)選地,多探針的至少一個(gè)核苷酸被化學(xué)部分修飾(例如,在PCR反應(yīng)的至少雜交階段,共價(jià)地或以其它方式穩(wěn)定地結(jié)合),以增加識(shí)別片段對(duì)識(shí)別序列的結(jié)合親和力。
      本文中,對(duì)識(shí)別序列比含有相同序列但無(wú)穩(wěn)定化核苷酸的探針具有增加的“結(jié)合親和力”的多探針是指這樣的探針,該探針的識(shí)別片段的結(jié)合常數(shù)(Ka)比雙鏈分子的互補(bǔ)鏈的結(jié)合常數(shù)高。在另一優(yōu)選實(shí)施方案中,該探針的識(shí)別片段的結(jié)合常數(shù)比雙鏈分子中靶序列的識(shí)別序列的互補(bǔ)鏈的解離常數(shù)(Kd)高。
      “多探針文庫(kù)”或“多探針的文庫(kù)”包含多個(gè)多探針,由此文庫(kù)中探針的總數(shù)能夠識(shí)別轉(zhuǎn)錄物組的大部分(包括豐度最高的序列),這樣轉(zhuǎn)錄物組中大約60%、大約70%、大約80%、大約85%,更優(yōu)選地大約90%,甚至更優(yōu)選地95%的靶核酸可以被探針檢測(cè)。
      當(dāng)單體含有能夠根據(jù)Watson-Crick堿基配對(duì)原則(例如,G與C、A與T或A與U)形成氫鍵或者能夠形成其它氫鍵鍵合基序(例如二氨基嘌呤與T、次黃嘌呤與C、假異胞嘧啶與G等)的核酸堿基時(shí),該單體被稱(chēng)作是“互補(bǔ)的”。
      術(shù)語(yǔ)“隨后的單體”涉及沿著5′端方向的相鄰單體,“前面的單體”涉及沿著3′端方向的相鄰單體。
      本文中,術(shù)語(yǔ)“靶群體”是指多個(gè)不同的核酸序列,例如來(lái)自特定物種的基因組或其它核酸,包括基因組的轉(zhuǎn)錄物組,其中轉(zhuǎn)錄物組指任何物種的基因組的所有轉(zhuǎn)錄的元件的集合。通常,核酸群體中不同靶序列的數(shù)目為至少100,但是清楚地,該數(shù)目常常高得多(超過(guò)200、500、1000和10000——當(dāng)靶群體是真核生物的轉(zhuǎn)錄物組時(shí)。
      本文中,術(shù)語(yǔ)“靶核酸”指任何相關(guān)的具有單一特定序列的核酸,例如,生物核酸,例如來(lái)源于患者、動(dòng)物(人或非人動(dòng)物)、植物、細(xì)菌、真菌、古細(xì)菌(archae)、細(xì)胞、組織、生物體等。例如,當(dāng)靶核酸來(lái)源于細(xì)菌、古細(xì)菌、植物、非人動(dòng)物、細(xì)胞、真菌或非人生物時(shí),本發(fā)明方法任選地還包括基于靶核酸的檢測(cè),選擇該細(xì)菌、古細(xì)菌、植物、非人動(dòng)物、細(xì)胞、真菌或非人生物。一個(gè)實(shí)施方案中,靶核酸來(lái)源于患者,例如人類(lèi)患者。在該實(shí)施方案中,本發(fā)明任選地還包括基于靶核酸的檢測(cè),選擇療法、診斷疾病、或診斷疾病的遺傳易感性。
      本文中,術(shù)語(yǔ)“靶序列”指任何靶核酸中的特定核酸序列。
      術(shù)語(yǔ)“嚴(yán)緊條件”在本文中是指在大約Tm-5℃(低于探針熔解溫度(Tm)5℃)至大約低于Tm 20℃-25℃的范圍內(nèi)出現(xiàn)的嚴(yán)緊性。本領(lǐng)域技術(shù)人員將理解,可以改變雜交的嚴(yán)緊性以鑒定或檢測(cè)相同或相關(guān)的多核苷酸序列。雜交技術(shù)一般地可以參見(jiàn)Nucleic AcidHybridization,A practical Approach,Ed.Hames,B.D.和Higgins,S.J.,IRL Press,1985;Gall和Pardue,Proc.Natl.Acad.Sci.,USA 63378-383,1969;和John等,Nature 223582-587,1969。
      多探針現(xiàn)參考圖1B,根據(jù)本發(fā)明的多探針優(yōu)選為短的序列探針,其可以與多個(gè)不同靶核酸中存在的識(shí)別序列結(jié)合,由此該多探針特異地與靶核酸雜交但不與不含有該識(shí)別序列的核酸分子發(fā)生可檢測(cè)水平的雜交。優(yōu)選地,多探針的集合,或多探針文庫(kù),能夠識(shí)別轉(zhuǎn)錄物組的大部分(包括豐度最高的序列),例如轉(zhuǎn)錄物組中的大約60%、大約70%、大約80%、大約85%、更優(yōu)選地大約90%、甚至更優(yōu)選地95%的靶核酸可以被探針檢測(cè)。本發(fā)明的多探針包含“穩(wěn)定化修飾”,例如非天然核苷酸(“穩(wěn)定化核苷酸”),其比包含相同序列但無(wú)該穩(wěn)定化序列的探針對(duì)識(shí)別序列具有更高的結(jié)合親和力。優(yōu)選地,多探針的至少一個(gè)核苷酸被化學(xué)部分修飾(例如,在PCR反應(yīng)的至少雜交階段,與探針共價(jià)地或以其它方式穩(wěn)定地結(jié)合),以增加識(shí)別片段對(duì)識(shí)別序列的結(jié)合親和力。
      一方面,具有6至12個(gè)核苷酸的多探針包含1至6個(gè)或甚至多達(dá)12個(gè)的穩(wěn)定化核苷酸,例如LNA核苷酸。LNA增強(qiáng)的探針文庫(kù)含有識(shí)別短識(shí)別序列(例如,8至9個(gè)核苷酸)的短探針。LNA核酸堿基可以包含α-LNA分子(見(jiàn)例如,WO 00/66604)或xylo-LNA分子(見(jiàn)例如,WO00/56748)。
      一方面,優(yōu)選地,多探針與其識(shí)別序列結(jié)合時(shí)的Tm為大約55℃至70℃。
      另一方面,多探針包含一個(gè)或多個(gè)修飾的核酸堿基。修飾的堿基單元可以含有與核酸單元,例如呋喃糖基(furasonyl)環(huán)的1′位通過(guò)接頭,例如直鏈或支鏈亞烷基或亞鏈烯基基團(tuán)連接環(huán)單元(例如,碳環(huán)單元如芘基)。亞烷基基團(tuán)適宜地具有1個(gè)(即,-CH2-)至大約12個(gè)碳原子,更典型地1至大約8個(gè)碳原子,甚至更典型地1至大約6個(gè)碳原子。亞鏈烯基基團(tuán)適宜地具有1、2或3個(gè)碳-碳雙鍵以及2至大約12個(gè)碳原子,更典型地2至大約8個(gè)碳原子,甚至更典型地2至大約6個(gè)碳原子。
      本發(fā)明的多探針對(duì)于實(shí)施諸如實(shí)時(shí)PCR等試驗(yàn)是理想的,因?yàn)楸景l(fā)明的探針優(yōu)選具有大約25個(gè)核苷酸、大約15個(gè)核苷酸、大約10個(gè)以下的核苷酸,例如8或9個(gè)核苷酸。優(yōu)選地,多探針可以在PCR條件下與靶序列中的識(shí)別序列特異地雜交,并且優(yōu)選地該識(shí)別序列存在于至少大約50個(gè)、至少大約100個(gè)、至少大約200個(gè)、至少大約500個(gè)不同的靶核酸分子中。本發(fā)明的多探針文庫(kù)包含含有不同識(shí)別序列的多探針,這樣任何兩個(gè)多探針都可以與不同的靶核酸分子組雜交。在一方面,所述的靶核酸分子組包含一些相同的靶核酸分子,即,含有目的基因序列的靶核酸分子可以被一個(gè)以上的多探針結(jié)合。該靶核酸分子將含有至少兩個(gè)不同的識(shí)別序列,這些序列可以重疊1個(gè)或多個(gè)多核苷酸,但少于包含x個(gè)核苷酸的識(shí)別序列的x個(gè)核苷酸。
      一方面,多探針文庫(kù)包含多個(gè)不同的多探針,每一個(gè)不同的探針?lè)謩e地定位在固體基質(zhì)上的離散位置。在本文中,“定位”指被限制于或定址于所述位置上,這樣,可以沿著在該位置檢測(cè)到的雜交事件跟蹤到具有已知序列身份的探針。定位的探針可以和基質(zhì)穩(wěn)定地結(jié)合或可以不和基質(zhì)穩(wěn)定地結(jié)合。例如,探針可以處于微滴定板孔中的溶液中,并由此被定位或定址于該孔。作為備選方案,或者此外地,探針可以與基質(zhì)穩(wěn)定地結(jié)合,這樣在一次或多次使用緩沖液洗滌該基質(zhì)后探針仍保留在基質(zhì)上的確定位置上。例如,探針可以通過(guò)化學(xué)方式與基質(zhì)直接地或通過(guò)接頭分子結(jié)合,其中所述接頭分子可以是核酸序列、肽或?qū)|(zhì)上的分子具有親和力的任何類(lèi)型的分子。
      或者,靶核酸分子可以定位在基質(zhì)上(例如,以細(xì)胞、細(xì)胞裂解物或核酸的形式點(diǎn)在基質(zhì)上)。
      一旦確定了適當(dāng)?shù)男蛄?,?yōu)選地多LNA探針使用現(xiàn)有技術(shù)中(Tetrahedron 543607-30,1998)描述的商業(yè)上可獲得的方法以及設(shè)備,通過(guò)化學(xué)方式合成。例如,可以使用固相亞磷酰胺方法制備短LNA探針(Caruthers等,Cold Spring Harbor Symp.Quant.Biol.47411-418,1982;Adams等,J.Am.Chem.Soc.105661(1983))。
      多探針文庫(kù)中的多探針與一個(gè)或一個(gè)以上靶序列(優(yōu)選地與多個(gè)靶序列)的雜交程度可以通過(guò)本領(lǐng)域已知的任何方法進(jìn)行測(cè)定。如果沒(méi)有可檢測(cè)的雜交,雜交程度是0。典型地,使用標(biāo)記的信號(hào)核酸檢測(cè)雜交?;パa(bǔ)核酸或信號(hào)核酸可以通過(guò)典型地用于檢測(cè)是否存在雜交的多核苷酸的幾種方法中的任一種進(jìn)行標(biāo)記。最常見(jiàn)的檢測(cè)方法是使用與標(biāo)記的抗體結(jié)合的配體、熒光團(tuán)或化學(xué)發(fā)光試劑。其它標(biāo)記物包括可以充當(dāng)特異結(jié)合對(duì)的成員用于標(biāo)記的配體的抗體。標(biāo)記的選擇取決于所需的靈敏性與探針綴合的容易程度、穩(wěn)定性要求和可用的設(shè)備。
      含有LNA的探針典型地在合成過(guò)程中進(jìn)行標(biāo)記。亞磷酰胺合成方法的靈活性還有利于容易地產(chǎn)生帶有可用于該標(biāo)準(zhǔn)化學(xué)的所有商業(yè)接頭、熒光團(tuán)和標(biāo)記分子的LNA。LNA也可以通過(guò)酶反應(yīng),例如激酶反應(yīng)來(lái)標(biāo)記。
      本發(fā)明的多探針可以含有單個(gè)標(biāo)記物或多個(gè)標(biāo)記物。在一個(gè)方面,所述多個(gè)標(biāo)記物包含在多探針與靶序列發(fā)生雜交時(shí)可以彼此相互作用以產(chǎn)生信號(hào)或產(chǎn)生信號(hào)改變的成對(duì)標(biāo)記物。
      另一方面,多探針包含熒光團(tuán)部分和淬滅劑部分,這兩個(gè)部分在多探針中所處的位置使得該探針的雜交狀態(tài)可以通過(guò)來(lái)自該核酸的熒光信號(hào)的增加而區(qū)別于該探針的未雜交狀態(tài)。一方面,多探針除了含有識(shí)別元件外還含有第一和第二互補(bǔ)序列,這兩個(gè)序列在探針未與靶分子中的識(shí)別序列雜交時(shí)將彼此特異地雜交,從而使得淬滅分子與所述報(bào)道分子足夠接近以淬滅報(bào)道分子的熒光。靶分子的雜交使得淬滅分子與報(bào)道分子遠(yuǎn)離,導(dǎo)致與雜交量成比例的信號(hào)。
      另一方面,可以使用具有5′核酸酶活性的聚合酶檢測(cè)核酸鏈的聚合。將熒光團(tuán)和淬滅分子以充分接近的方式摻入探針中,以致在探針與其識(shí)別序列雜交時(shí)淬滅分子淬滅熒光團(tuán)分子的信號(hào)。具有5′核酸酶活性的聚合酶對(duì)探針的切割將導(dǎo)致淬滅分子和熒光團(tuán)分子分離以及隨著核酸序列存在遞增信號(hào)量。
      在本文中,術(shù)語(yǔ)“標(biāo)記物”指報(bào)道基團(tuán),其本身可以被檢測(cè)或者可以作為檢測(cè)系列的一部分被檢測(cè)。報(bào)道基團(tuán)的功能性部分的實(shí)例是生物素、地高辛配基、熒光基團(tuán)(能夠吸收特定波長(zhǎng)的電磁輻射,例如光或x射線(xiàn),并隨后以更長(zhǎng)波長(zhǎng)的輻射形式放出所吸收的能量的基團(tuán);舉例說(shuō)明實(shí)例有DANSYL((5-二甲基氨基)-1-萘磺?;?、DOXYL(N-氧基-4,4-二甲基噁唑烷)、PROXYL(N-氧基-2,2,5,5-四甲基吡咯烷)、TEMPO(N-氧基-2,2,6,6-四甲基哌啶)、二硝基苯基、吖啶、香豆素、Cy3及Cy5(Biological Detection Systems,Inc.的商標(biāo))、赤蘚紅、香豆酸、7-羥基香豆素、得克薩斯紅、羅丹明、四甲基羅丹明、Rox、7-硝基苯并-2-噁-1-二唑(NBD)、芘、熒光素、銪、釕、釤和其它稀土金屬)、放射性同位素標(biāo)記物、化學(xué)發(fā)光標(biāo)記物(可以通過(guò)化學(xué)反應(yīng)過(guò)程中釋放的光而得到檢測(cè)的標(biāo)記物)、自旋標(biāo)記物(與生物分子結(jié)合的自由基(例如,取代的有機(jī)氨基氧)或其它順磁探針(例如,Cu2+、Mg2+),其可以通過(guò)使用電子自旋共振譜法檢測(cè))。尤其有意義的實(shí)例是生物素、熒光素、得克薩斯紅、羅丹明、二硝基苯基、地高辛配基、釕、銪、Cy5、Cy3等。
      靶核酸分子的適宜實(shí)例可以包含多種多樣的真核和原核細(xì)胞,包括原生質(zhì)體;或可以含有靶核酸的其它生物材料。因此,本發(fā)明的方法可以應(yīng)用于組織培養(yǎng)動(dòng)物細(xì)胞、動(dòng)物細(xì)胞(例如,血液、血清、血漿、網(wǎng)織紅細(xì)胞、淋巴細(xì)胞、尿、骨髓組織、腦脊液或從血液或淋巴制備的任何產(chǎn)物)或任何類(lèi)型的組織活檢物(例如,肌肉活檢物、肝活檢物、腎活檢物、膀胱活檢物、骨活檢物、軟骨活檢物、皮膚活檢物、胰腺活檢物、腸道活檢物、胸腺活檢物、乳腺活檢物、子宮活檢物、睪丸活檢物、眼活檢物或腦活檢物,例如在裂解緩沖液中勻漿)、歸檔的組織核酸、植物細(xì)胞或?qū)B透壓休克敏感的其它細(xì)胞、以及細(xì)菌細(xì)胞、酵母、病毒、支原體、原生動(dòng)物、立克次氏體、真菌和其它小微生物細(xì)胞等等。
      可以分析被多個(gè)多探針識(shí)別的靶核酸以檢測(cè)在靶核酸分子群體中占10%以下、大約5%以下、大約1%以下、大約0.1%以下、大約0.01%以下的序列(例如,特定的基因序列)。用于檢測(cè)該序列的試驗(yàn)類(lèi)型不是本發(fā)明的限制性特征,可以包括PCR或本領(lǐng)域已知的或開(kāi)發(fā)用于檢測(cè)靶核酸分子群體中所占不足10%的識(shí)別序列的一些其它適宜試驗(yàn)。
      一方面,檢測(cè)較低豐度的識(shí)別序列的試驗(yàn)包括與至少一個(gè)引物雜交,其中所述引物能夠特異地與該識(shí)別序列雜交,但是其不能實(shí)質(zhì)性地與群體中大約50個(gè)以上、大約25個(gè)以上、大約10個(gè)以上、大約5個(gè)以上、大約2個(gè)以上(例如,該探針識(shí)別純合基因序列的兩個(gè)拷貝)的靶核酸分子,或1個(gè)以上的靶核酸(例如,樣品中存在的單拷貝雜合基因序列的等位基因)雜交。在一個(gè)優(yōu)選的方面,提供一對(duì)此類(lèi)引物,該對(duì)引物位于多探針?biāo)b定的識(shí)別序列側(cè)翼,即,位于識(shí)別序列的可擴(kuò)增距離內(nèi),由此可以產(chǎn)生大約40至5000個(gè)堿基的擴(kuò)增子,優(yōu)選地產(chǎn)生50至500個(gè)或更優(yōu)選地60至100個(gè)堿基的擴(kuò)增子??梢詷?biāo)記這些引物中的一個(gè)或多個(gè)。
      多種擴(kuò)增反應(yīng)是本領(lǐng)域技術(shù)人員熟知的,包括但不限于PCR、RT-PCR、LCR、體外轉(zhuǎn)錄、滾環(huán)PCR、OLA等。也可以在多重PCR中使用多個(gè)引物以檢測(cè)一組特定的靶分子。
      本發(fā)明還提供設(shè)計(jì)用于本發(fā)明方法和試劑盒中的多探針序列的方法。圖2顯示了略述該方法步驟的流程圖。
      一方面,計(jì)算機(jī)(insilico)產(chǎn)生多個(gè)具有n個(gè)核苷酸的n聚體(n-mer),以包含所有可能的n聚體。選擇具有Tm≥60℃的n聚體的子集。另一方面,選擇探針子集,在所述子集中的探針不能自身雜交,從而提供一列候選n聚體或一個(gè)候選n聚體數(shù)據(jù)庫(kù)。使用每一個(gè)n聚體的序列查詢(xún)包含多個(gè)靶序列的數(shù)據(jù)庫(kù)。優(yōu)選地,該靶序列數(shù)據(jù)庫(kù)含有表達(dá)的序列,例如人類(lèi)mRNA序列。
      從用于查詢(xún)數(shù)據(jù)庫(kù)的該列候選n聚體,選擇鑒別最大數(shù)量的靶序列的n聚體(例如,包含與靶數(shù)據(jù)庫(kù)中最大數(shù)量的靶序列的子序列互補(bǔ)的識(shí)別片段的n聚體),以產(chǎn)生n聚體/靶序列矩陣。將與最大數(shù)量的靶序列結(jié)合的n聚體的序列存儲(chǔ)在最佳探針序列數(shù)據(jù)庫(kù)中,并且從候選n聚體數(shù)據(jù)庫(kù)中扣除這些n聚體。從靶序列數(shù)據(jù)庫(kù)中除去被此第一組最佳探針鑒別的靶序列。然后針對(duì)剩余的候選探針重復(fù)該過(guò)程,直到鑒定到包含了能夠覆蓋大約60%以上、大約80%以上、大約90%以上,大約95%的靶序列的多個(gè)n聚體的一組多探針??梢允褂妹恳徊借b定的最佳序列產(chǎn)生虛擬(virtual)多探針序列數(shù)據(jù)庫(kù)。然后可以合成含有來(lái)自該多探針數(shù)據(jù)庫(kù)的序列的多探針。
      另一方面,該方法還包括通過(guò)在剩余靶序列中進(jìn)行查詢(xún)和在最初的靶序列組中進(jìn)行查詢(xún)來(lái)評(píng)價(jià)將給定候選探針包括在不斷增長(zhǎng)的最佳候選探針組中的一般適用性。在一個(gè)優(yōu)選方面,僅僅頻繁地出現(xiàn)在剩余靶序列以及最初的靶序列中的探針識(shí)別序列才被加入到不斷增長(zhǎng)的該組最佳探針識(shí)別序列中。在一個(gè)最優(yōu)選的方面,這通過(guò)如下方式實(shí)現(xiàn)計(jì)算從這些查詢(xún)獲得的分?jǐn)?shù)的乘積(product),并選擇具有最高乘積并且在相對(duì)于當(dāng)前的靶進(jìn)行的查詢(xún)中仍屬于具有20%的最佳得分的探針識(shí)別序列的探針識(shí)別序列。
      本發(fā)明還提供有利于上述方法實(shí)施的計(jì)算機(jī)程序產(chǎn)品(見(jiàn),例如圖2)。一方面,該計(jì)算機(jī)程序產(chǎn)品包含能夠通過(guò)可與網(wǎng)絡(luò)連接進(jìn)行內(nèi)存交流的計(jì)算機(jī)或用戶(hù)設(shè)備來(lái)執(zhí)行的程序指令。
      本發(fā)明還提供包含含有靶序列數(shù)據(jù)庫(kù)的計(jì)算機(jī)存儲(chǔ)器和用于執(zhí)行該計(jì)算機(jī)程序產(chǎn)品提供的指令的應(yīng)用系統(tǒng)的系統(tǒng)。
      包含多探針的試劑盒本發(fā)明的一個(gè)優(yōu)選實(shí)施方案是多探針文庫(kù)用于表征或檢測(cè)或定量包含靶核酸的樣品的試劑盒。一方面,該試劑盒含有針對(duì)其應(yīng)用的計(jì)算機(jī)(in silico)操作方案。另一方面,該試劑盒含有與得到低價(jià)DNA引物的建議有關(guān)的信息。試劑盒中所含的探針可以具有上述的任何或所有特征。在一個(gè)優(yōu)選方面,多個(gè)探針包含至少一個(gè)穩(wěn)定化核酸堿基,例如LNA核酸堿基。
      另一方面,多個(gè)探針包含與至少一個(gè)化學(xué)部分偶聯(lián)或穩(wěn)定結(jié)合以增加該探針的結(jié)合穩(wěn)定性的核苷酸。在再一優(yōu)選方面,試劑盒包含多個(gè)不同的探針以覆蓋具有不同靶序列的群體,例如轉(zhuǎn)錄物組的至少60%。在一個(gè)優(yōu)選方面,該轉(zhuǎn)錄物組是人類(lèi)轉(zhuǎn)錄物組。
      另一方面,試劑盒包含至少一個(gè)用一個(gè)或多個(gè)標(biāo)記物標(biāo)記的探針。在再一方面,一個(gè)或多個(gè)探針包含能夠在基于FRET的試驗(yàn)中彼此相互作用的標(biāo)記物,即,這些探針可以設(shè)計(jì)用于基于5′核酸酶或分子信標(biāo)的試驗(yàn)。
      本發(fā)明的試劑盒允許用戶(hù)快速且有效地開(kāi)發(fā)用于許多不同核酸靶的試驗(yàn)。該試劑盒還可以包含一種或多種用于實(shí)施擴(kuò)增反應(yīng)例如PCR的試劑。
      實(shí)施例本發(fā)明現(xiàn)將參考如下實(shí)施例作進(jìn)一步說(shuō)明。應(yīng)當(dāng)理解,以下僅僅是舉例的形式,并且可以對(duì)細(xì)節(jié)進(jìn)行修改而仍落入本發(fā)明的范圍內(nèi)。
      在以下實(shí)施例中,探針的引用編號(hào)代表在以下合成實(shí)施例中所示的LNA-寡核苷酸序列。
      實(shí)施例1轉(zhuǎn)錄物組數(shù)據(jù)的來(lái)源從ENSEMBL獲得人類(lèi)轉(zhuǎn)錄物組mRNA序列。ENSEMBL是EMBL-EBI與Sanger Institute的協(xié)作項(xiàng)目,用于開(kāi)發(fā)軟件系統(tǒng)以產(chǎn)生并維持對(duì)真核基因組的自動(dòng)注釋(見(jiàn),例如,Butler,Nature 406(6794)333,2000)。ENSEMBL主要由Wellcome Trust資助。應(yīng)當(dāng)注意的是,序列數(shù)據(jù)可以從包含表達(dá)序列的任何類(lèi)型數(shù)據(jù)庫(kù)獲得,然而,ENSEMBL是尤其有吸引力的,因?yàn)槠浣o出最新的序列數(shù)據(jù)以及對(duì)后生動(dòng)物基因組的最佳可能注釋。2003年5月14日自ENSEMBL ftp站點(diǎn)ftp://ftp.ensembl.org/pub/current_human/data下載了“Homo_sapiens.cdna.fa”。該文件含有所有ENSEMBL轉(zhuǎn)錄物預(yù)報(bào)(即,37347個(gè)不同序列)。從每一個(gè)序列中選取3′末端上游50個(gè)核苷酸至3′末端上游1050個(gè)核苷酸的區(qū)域。進(jìn)一步相對(duì)于來(lái)自NCBI的參考序列(RefSeq)集中的人類(lèi)mRNA序列,評(píng)價(jià)所選的探針序列組(見(jiàn)以下最佳方式)。RefSeq標(biāo)準(zhǔn)被用作醫(yī)學(xué)、功能性和多樣性研究的基礎(chǔ);其為基因鑒定和表征、突變分析、表達(dá)研究、多態(tài)性的發(fā)現(xiàn)以及比較分析提供了穩(wěn)定了參照。RefSeq集旨在為主要研究的生物提供一組全面的、完整的非冗余序列,包括基因組DNA、轉(zhuǎn)錄物(RNA)和蛋白質(zhì)產(chǎn)物。對(duì)于來(lái)自ENSEMBL的37347個(gè)序列以及RefSeq集中的19567個(gè)序列,均發(fā)現(xiàn)了相似的覆蓋率,即,說(shuō)明數(shù)據(jù)庫(kù)的類(lèi)型不是本發(fā)明的限制性特征。
      實(shí)施例2計(jì)算多探針數(shù)據(jù)集(dataset)(α文庫(kù))設(shè)計(jì)在UNIX計(jì)算機(jī)上運(yùn)行的特定軟件以計(jì)算文庫(kù)中的最佳探針集合。圖2的流程圖舉例說(shuō)明了該算法。
      分兩步獲得對(duì)轉(zhuǎn)錄物組的最佳覆蓋。第一步,確定n聚物與基因的稀疏矩陣,由此可以容易地發(fā)現(xiàn)含有給定的n聚體的基因的數(shù)量。這通過(guò)使用-p選項(xiàng)以及FASTA格式輸入的序列文件運(yùn)行g(shù)etcover程序來(lái)進(jìn)行。
      第二步,基于第一步確定的矩陣,使用算法確定最佳覆蓋率。為此目的,輸入所述矩陣以運(yùn)行程序,例如getcover程序。然而,本領(lǐng)域技術(shù)人員可以容易地設(shè)計(jì)出實(shí)現(xiàn)相似功能并用于執(zhí)行相似步驟的程序。
      獲得對(duì)轉(zhuǎn)錄物組的良好寡核苷酸覆蓋1.產(chǎn)生所有的4n個(gè)n聚體,并計(jì)算預(yù)期的熔解溫度。從該集合中除去具有60℃以下熔解溫度以及具有高自身雜交能量的n聚體。這給出具有可接受的物理性質(zhì)的一列n聚體。
      2.從ENSEMBL數(shù)據(jù)庫(kù)中選取代表人類(lèi)轉(zhuǎn)錄物組的一列基因序列。
      3.起始主循環(huán)給定該n聚體和基因列,通過(guò)在給定基因中鑒定所有的n聚體并將結(jié)果存儲(chǔ)在矩陣中,產(chǎn)生n聚體相對(duì)于基因的稀疏矩陣。
      4.如果這是第一次迭代,存儲(chǔ)該矩陣的拷貝備用,并命名為“總n聚體/基因矩陣”。
      5.鑒定覆蓋最多基因的n聚體并將其所覆蓋的基因的數(shù)目存儲(chǔ)為“max_gene”。
      6.確定矩陣中剩余基因的覆蓋率,并將覆蓋率達(dá)到至少80%的max_gene的基因存儲(chǔ)在“具有良好覆蓋率的n聚體集合”中。
      7.最佳n聚體是其當(dāng)前的覆蓋率與總覆蓋率的乘積為最大的n聚體。
      8.從該n聚體集合中去除該最佳n聚體(步驟1)。
      9.從該基因集合中去除此n聚體所覆蓋的基因(步驟2)。
      10.將該n聚體添加至最佳n聚體集合中,從步驟3開(kāi)始繼續(xù)該程序直到不再能找到n聚體。
      用于計(jì)算多探針數(shù)據(jù)集的程序代碼(Niels Tolstrup 2003的“getcover”1.0版)列在圖17中。其由三個(gè)專(zhuān)利模塊getcover.c,dyp.c,dyp.h組成。
      該程序還并入了被GNU Lesser General Public Licence覆蓋的4個(gè)模塊getopt.c,getopt.h,getopt1.c,getopt_init.c/*Copyright(C)1987,88,89,90,91,92,93,94,95,96,98,99,2000,2001Free Software Foundation,Inc.
      這些文件是GNU C Library的一部分。GNU C Library是免費(fèi)軟件;可以在Free Software Foundation公布的GNU Lesser General PublicLicense的條件下對(duì)其進(jìn)行重現(xiàn)分配和/或修改*/該軟件用aap編譯。用于制備該程序的main.aap文件同樣列在圖17中。
      為了運(yùn)行已編譯的程序,使用以下命令getcover -1 9 -p -f&lt;h_sap_cdna_50_1050.fasta&gt;
      h_sap_cdna_50_1050_19.statgetcover -1 9 -i 1 -d 10 -t 60 -c -n -m -s&lt;h_sap_cdna_50_1050_19.stat&gt;
      h_sap_cdna_50_1050_19.cover使用該計(jì)算機(jī)程序與用于執(zhí)行上述算法的指令,利用如下參數(shù)設(shè)置分析人類(lèi)轉(zhuǎn)錄物組
      L89探針長(zhǎng)度=8或9個(gè)核苷酸i1包含分?jǐn)?shù)(inclusion fraction)=100%d10靶雙螺旋相對(duì)于自身雙螺旋所需的ΔTm=10℃t60靶雙螺旋的最小Tm=60℃c還使用的互補(bǔ)靶序列m80使用乘積規(guī)則和80%規(guī)則從處理剩余靶的最一般探針中選擇的最佳探針nLNA核苷酸優(yōu)選包括在識(shí)別片段的中心部分;結(jié)果鑒定到多探針靶序列數(shù)據(jù)庫(kù)。
      該數(shù)據(jù)庫(kù)中的靶序列是用于多探針文庫(kù)的示例性最佳靶。這些最佳多探針列在下表1中,其包含5′熒光素?zé)晒鈭F(tuán)和3′Eclipse淬滅劑(見(jiàn)下)。
      表1雙標(biāo)記的寡核苷酸探針cagcctcccagagccaagctgtgaaggagggaaggaggagctggaagccagagagctgtggagacccaggagcagccagatgaggagactggggaactccagcccttctgggacagtggactcctgcactcctccattctgccaacagccattgaggtggctgctgccaggagagatttctccaaaggcagcctccagcattcctgcacagtggtgctgtggcactgctgggtttggggaaaaggggaagaagggccttcctggcaggcagatgtgggaatggatggaacagcagcctgtgccaactgggaattctggcacagctccattccctggtcacaggacagaaggcccccacccaaccccatttcctcccatcccagatggtggtgctgcccagaggtggaacaggtgctttcctccactgaggcatgtggacactgtctccctgctccactgctggttggaggcctgctgtgatggagagacagtgccaatggtgaaagctggataaggcagaatggggaactggaaggtggagagccagccaggagggagagcaggcagccttggtggcagcaggactctgccatcaggagccaccttggctgtgctgctgctgagacacacaccagccaccagaggagaccctcccacatcttcactgtgaccctgtggctaggaggcacacctgcaagggggaacagtggctcactgccaccagggcctgggacca
      ttctcccactgtgtggcagaggcaacagggaacctggagcttcccagtctgggactctgggcaacccagcagtccagtgtctgcctgtctggaggattctcctgctcctccctggaaggctccactgccttcctgccttccccactgtgcctctgccaccccacctccctctgccactgtgctcacagcctcattcctctgcagcaggtctgtgagcctgtggtctggtgatgctccatcctcctcctccttcaggctgtggctgtgctgtccctcagccatctgggtccttctccctcctctccctcttccccttggagcctgcctccctctgcctctgggcacccaggctcctccttccctggctgctgggcatctctctggttcctgctcccgccgccctctggctcttgggctcatcctccctcctccttgctgggcctgccatcaggagctgcagcctggctgctctccactgggatcctgctgcagcagccctggagtctgccctgactcctccatgctggagcttcagccttggtggtccagccagcttcctcccttccagcttgggactcagcccagttcctggctccaggtcctgctggactccaccatcctcagccagcatcccaggagctctccagccaggagcagcagaggctctcagccttggctctgccaggaggctgccttcttctggctcaggcagccagcctccctgggagactgtctgcctgcctctagctggagcccagcccctgtcccacttctgccctgctgcccagctccctctgcccactgctccctggctgtgccagccgcctggacactggtggaacctggagacctcagccttgccatcagctgggaccagggcctcctcttct cttcccctctgcttccccaccaccctggctcccttgggcacagcaggctctgctgcccagggcattctggtctctggagccagccaccctccacctccgccgcccatccagccagaggagctgccccacttcttctcatggctgcctctcctctgggcagcttccctccctcctgcccaggagccctggtctcttcctcagatggtggcctctggtccctggggcctccaaggcctggggctctgtctcccagtggcattggggtc
      這些超高豐度的9-mer和8-mer序列滿(mǎn)足圖2中的選擇標(biāo)準(zhǔn),即,.每一個(gè)探針的靶在人類(lèi)轉(zhuǎn)錄物組的序列中占至少6%(即,各2200個(gè)以上的靶序列,在最接近轉(zhuǎn)錄物3′末端的1000nt內(nèi)靶向800個(gè)以上的序列)。
      .這些9-mer和8-mer序列不自身互補(bǔ)(即,不可能形成探針雙螺旋)。
      自身得分低于所估計(jì)的與靶形成的雙螺旋的Tm至少10。
      .與其靶序列形成的雙螺旋具有60℃或大約60℃的Tm。
      這些9-mer和8-mer序列當(dāng)組合在一起時(shí)覆蓋人類(lèi)轉(zhuǎn)錄物組中>98%的mRNA。
      下表1a中給出了表1中尤其優(yōu)選的多探針形式表1a100個(gè)LNA替代的寡核苷酸cAgCCTCccAGAGCCaaGCTGTGaaGGAGGGaaGGAGGAgcTGGAAGccAGAGAGctGTGGAGaccCAGGAgcAGCCAGatGAGGAGactGGGGAacTCCAgCccTTCTGGgaCAGTGGacTCCtGCacTCCTCCatTCTGCCaaCAGCCAttGAGGtGgcTgCTGCcaGGAGAGatTTCTCCaaAGGCAGccTCCAGCatTCCTGCacAGTGGTgctGTGGCacTGCTGggtTTGGGGaaAAGGGGaaGAAGGGccTTCCTGgcAGGCAGatGTGGGAatGGATGGaaCAGCAGcctGTGCCaaCTGGGAatTCTGGCacaGCTCCatTCCCTGgtCACAGGacAGAAGGccCCCACCcaACCCCAttTCCTCCcaTCCCAGatGGTGGTgctGCCCagaGGTGGAacAGGtGCttTCCTCCacTGAGGCatGTGGACacTGTCTCccTGCTCCacTGCtGGttGGAGgCctGCTGTGatGGAGAGacAGtGCCaatGGTGAAaGCTGGAtaAGGCAGaaTGGGGAacTGGAAGgtGGAGAGccAGCcAGgaGGGAGAgcAGGcAGccTTGGTGgcAGCAGGacTCtGCCatCAGGaGccACCTTGgcTGTGCTgcTGCTGAgaCACACACcAgCCACcaGAGGAGacCCtCCCacATCTTCAcTGTGACcctGTGGCtaGGAGGcacACCtGCaaGGGGGAacaGTGGCtcACtGCCacCAGgGcctGgGACCatTCTCCCacTGTGTGgcAGAGGCaaCAGGGAa
      -其中,小寫(xiě)字母表示DNA單體,大寫(xiě)字母表示LNA核苷酸。
      >95.0%的mRNA序列在接近其3′末端的1000nt內(nèi)(距離3′末端50至1050位)被靶向,而且>95%的mRNA含有針對(duì)文庫(kù)中一個(gè)以上探針的靶序列。在含有37,347個(gè)核酸序列的人類(lèi)轉(zhuǎn)錄物組中鑒定到此100個(gè)多探針的超過(guò)650,000個(gè)的靶位點(diǎn)。在該轉(zhuǎn)錄物組中針對(duì)每一個(gè)轉(zhuǎn)錄物,多探針的平均數(shù)目是17.4,中值是14個(gè)不同探針的靶位點(diǎn)。
      盡管未選擇上述序列以針對(duì)特定的生物體進(jìn)行優(yōu)化,但是上述序列也是用于其它轉(zhuǎn)錄物組的優(yōu)異探針選擇。因此,盡管事實(shí)上上述探針設(shè)計(jì)用于僅在人類(lèi)轉(zhuǎn)錄物組中鑒定/表征/定量轉(zhuǎn)錄物,但我們?cè)u(píng)價(jià)了上述文庫(kù)對(duì)小鼠和大鼠基因組的覆蓋率。例如,見(jiàn)表2。

      nt~核苷酸。
      實(shí)施例3頻繁出現(xiàn)的9-mer寡核苷酸對(duì)人類(lèi)轉(zhuǎn)錄物組的預(yù)期覆蓋率示例性試驗(yàn)數(shù)據(jù)(類(lèi)似于圖6)說(shuō)明,如果實(shí)時(shí)PCR試驗(yàn)所用的雙標(biāo)記探針用LNA進(jìn)行增強(qiáng),則可以將該探針的識(shí)別序列的長(zhǎng)度根據(jù)該序列而減少到8或9個(gè)核苷酸。LNA的獨(dú)特雙螺旋穩(wěn)定化性質(zhì)對(duì)于確保該短的雙螺旋具有足夠的穩(wěn)定性(即,Tm>60℃)是必需的。該功能性實(shí)時(shí)PCR探針將幾乎是純的LNA,在識(shí)別序列中具有6至10個(gè)LNA寡核苷酸。然而,該短識(shí)別序列使得可以使用相同的LNA探針檢測(cè)和定量許多不同基因的豐度。通過(guò)根據(jù)圖2所示算法適當(dāng)?shù)剡x擇最佳(即,最常見(jiàn)的)8或9-mer識(shí)別序列,可以覆蓋含有大約37347個(gè)mRNA的人類(lèi)轉(zhuǎn)錄物組(圖3)。
      圖3顯示了可以在各序列的近3′末端的長(zhǎng)1000nt鏈(即,距離3′末端50nt至1050nt的序列)中被不同長(zhǎng)度的優(yōu)化探針檢測(cè)到的人類(lèi)轉(zhuǎn)錄物組中的mRNA序列的預(yù)期覆蓋率,表示為人類(lèi)轉(zhuǎn)錄物組中mRNA序列總數(shù)的百分?jǐn)?shù)。這些探針被要求足夠穩(wěn)定(Tm>60℃)并具有低的形成自身雙螺旋的傾向,這就消除了許多9-mer以及甚至更多的8-mer探針序列。
      如果可以將具有給定長(zhǎng)度的所有探針序列用作探針,則明顯地可以通過(guò)這些最短的可能探針序列獲得對(duì)轉(zhuǎn)錄物組的最佳覆蓋。當(dāng)僅有有限數(shù)量的探針(<55個(gè))被包括在文庫(kù)中時(shí),這確是如此(圖4)。然而,由于許多具有低GC含量的短探針不具有充分的熱穩(wěn)定性,故將其從文庫(kù)中刪除??山邮艿?-mer探針的有限多樣性在檢測(cè)低GC含量的基因方面效力較低,因此,由100個(gè)不同的9-mer探針組成的文庫(kù)比類(lèi)似的8-mer文庫(kù)對(duì)轉(zhuǎn)錄物組具有更好的覆蓋。然而,最佳選擇是由不同長(zhǎng)度的序列組成的混合文庫(kù),例如以上列出的最佳文庫(kù)模式提議。在圖4中未顯示該文庫(kù)的覆蓋率。
      所設(shè)計(jì)的含有100個(gè)最常見(jiàn)的9-mer和8-mer的探針文庫(kù),即,“人類(lèi)mRNA探針文庫(kù)”可以以方便的盒子或微量滴定板格式操作。
      可以改變此用于人類(lèi)mRNA的100個(gè)探針的初始集合以產(chǎn)生相似文庫(kù)試劑盒用于來(lái)自其它物種(小鼠、大鼠、果蠅(Drosophila)、秀麗隱桿線(xiàn)蟲(chóng)(C.elegans)、酵母、擬南芥、斑馬魚(yú)、靈長(zhǎng)類(lèi)動(dòng)物、家畜等)的轉(zhuǎn)錄物組。構(gòu)建這些新的探針文庫(kù)幾乎不需要費(fèi)力,因?yàn)檫@些人類(lèi)mRNA探針中大多數(shù)都可以重新用于這些新的文庫(kù)試劑盒(表2)。
      實(shí)施例4文庫(kù)中靶向每一基因的探針數(shù)目不僅所提議的文庫(kù)中的有限數(shù)量的探針可以靶向人類(lèi)轉(zhuǎn)錄物組的大部分,而且存在大程度的冗余,因?yàn)榇蠖鄶?shù)基因(幾乎95%)可以被一個(gè)以上的探針檢測(cè)。針對(duì)上述最佳文庫(kù)模式中的100個(gè)探針,已經(jīng)在人類(lèi)轉(zhuǎn)錄物組(37347個(gè)基因)中鑒定到650,000個(gè)以上的靶位點(diǎn)。這導(dǎo)致每個(gè)探針平均6782個(gè)靶位點(diǎn)(即,轉(zhuǎn)錄物組的18%),范圍是每個(gè)探針2527個(gè)序列至12066個(gè)序列。能夠檢測(cè)一個(gè)特定基因的平均探針數(shù)是17.4,中值為14。由此,在僅100個(gè)探針的該文庫(kù)中,我們有至少14個(gè)探針針對(duì)所有人類(lèi)mRNA序列中的50%以上序列。
      可以被文庫(kù)中給定數(shù)目的探針?biāo)邢虻幕驍?shù)顯示在圖4中。
      實(shí)施例5設(shè)計(jì)9-mer探針以證實(shí)可行性選擇來(lái)自酵母(釀酒酵母(Saccharomyces cerevisiae))的SSA4基因用于表達(dá)試驗(yàn),因?yàn)樵摶蜣D(zhuǎn)錄水平可以通過(guò)熱休克誘導(dǎo),而且可以獲得敲除表達(dá)的突變體。從人類(lèi)轉(zhuǎn)錄物組中常見(jiàn)的9mer序列中選擇3個(gè)不同的9-mer序列(表3)。這些序列存在于人類(lèi)轉(zhuǎn)錄物組中1.8至6.4%的mRNA序列的3′末端附近。進(jìn)一步的選擇標(biāo)準(zhǔn)是中等水平的自身互補(bǔ)性和等于或大于60℃的Tm。所有三個(gè)序列都存在于SSA4ORF的末端1000個(gè)堿基內(nèi)。通過(guò)合成在5′末端帶有FITCH熒光團(tuán)而在3′末端帶有Eclipse淬滅劑(Epoch Biosciences)的這三個(gè)序列,構(gòu)建了5′核酸酶試驗(yàn)探針。根據(jù)探針在ORF YER103W(SSA4)——其中位置1201被設(shè)定為位置1——中的位置,對(duì)探針進(jìn)行命名。設(shè)計(jì)三對(duì)引物以產(chǎn)生各含有這三個(gè)探針序列之一的三個(gè)不重疊的擴(kuò)增子。根據(jù)擴(kuò)增子所包含的探針序列,命名擴(kuò)增子。
      表3設(shè)計(jì)的5′核酸酶試驗(yàn)探針和引物

      bp~堿基對(duì)還設(shè)計(jì)了兩個(gè)分子信標(biāo)以檢測(cè)SSA4 469-和SSA4 570序列,并分別命名為信標(biāo)-469和信標(biāo)-570。SSA4 469信標(biāo)的序列是CAAGGAGAAGTTG(SEQ ID NO7,10-mer識(shí)別位點(diǎn)),該序列應(yīng)當(dāng)使得該寡核苷酸形成分子內(nèi)信標(biāo)結(jié)構(gòu),具有通過(guò)5′-CAA和TTG-3′之間的LNA-LNA相互作用形成的莖。SSA4 570信標(biāo)的序列是CAAGGAAAGttG(9-mer識(shí)別位點(diǎn)),其中該分子內(nèi)信標(biāo)結(jié)構(gòu)可以在5′-CAA和ttG-3′之間形成。合成在5′末端帶有熒光素?zé)晒鈭F(tuán)而在3′末端帶有Dabcyl淬滅劑的兩個(gè)序列。
      還設(shè)計(jì)了一個(gè)SYBR Green標(biāo)記的探針以檢測(cè)SSA4 570序列,并將該探針命名為SYBR-探針-570。該探針的序列是CAAGGAAaG。合成在5′末端具有氨基-C6接頭的該探針,在該5′末端將熒光團(tuán)SYBR Green101(Molecular Probes)根據(jù)廠(chǎng)商說(shuō)明書(shū)附著于其上。在與靶序列雜交后,接頭附著的熒光團(tuán)應(yīng)嵌入產(chǎn)生的LNA-DNA雙螺旋區(qū),造成來(lái)自SYBR Green 101的增加的熒光。
      表4序列

      實(shí)施例6合成、去保護(hù)和純化雙標(biāo)記的寡核苷酸在自動(dòng)DNA合成儀(Expedite 8909 DNA合成儀,PerSeptiveBiosystems,0.2μmol規(guī)模)上使用亞磷酰胺方法(Beaucage和Caurthers,Tetrahedron Lett.221859-1862,1981)以及2-氰基乙基保護(hù)的LNA和DNA亞磷酰胺(Sinha等,Tetrahedron Lett.245843-5846,1983),制備雙標(biāo)記的寡核苷酸EQ13992至EQ14148(表4)。用Eclipse淬滅劑(EQ13992-EQ13996)或Dabcyl(EQ13997-EQ14148)以及5′-熒光素亞磷酰胺(GLEN Research,Sterling,Virginia,USA)衍生CPG固相支持物。相較于DNA亞磷酰胺,針對(duì)LNA亞磷酰胺(250s偶聯(lián)時(shí)間)改變合成循環(huán)。在偶聯(lián)步驟,使用1H-四唑或4,5-二氰基咪唑(Proligo,Hamburg,德國(guó))作為活化劑。
      使用32%氨水對(duì)該寡核苷酸進(jìn)行去保護(hù)(室溫1小時(shí),然后60℃ 2小時(shí)),并通過(guò)HPLC(Shimadzu-SpectraChrom系列;XterraTMRP18柱,10?m 7.8×150mm(Waters)純化。緩沖液A0.05M乙酸三乙銨pH 7.4;B50%乙腈水溶液。洗脫液0-25min10-80%B;25-30min80%B)。寡核苷酸的組成和純度通過(guò)MALDI-MS(PerSeptiveBiosystem,Voyager DE-PRO)分析進(jìn)行驗(yàn)證,見(jiàn)表5。圖5是EQ13992的MALDI-MS譜,顯示[M-H]-=4121,3Da。這是本發(fā)明9-mer探針的典型MALDI-MS譜。
      表5

      大寫(xiě)表示LNA單體(A,G,mC,T),其中mC是LNA甲基胞嘧啶。小寫(xiě)表示DNA單體(a,g,c,t)。Fitc=熒光素;EQL=Eclipse淬滅劑;Dabcyl=Dabcyl淬滅劑。MW=分子量。
      實(shí)施例7制備用9-mer探針進(jìn)行檢測(cè)的SSA4 cDNA標(biāo)準(zhǔn)在PCR試驗(yàn)中分析構(gòu)建的9mer探針的功能,其中檢查能夠檢測(cè)不同SSA4PCR擴(kuò)增子的探針。體外轉(zhuǎn)錄表達(dá)載體pTRIamp18(Ambion)中的SSA4基因下游區(qū),將得到的cRNA逆轉(zhuǎn)錄,獲得用作上述PCR反應(yīng)的模板的cDNA。SSA4基因的下游區(qū)按如下方式克隆PCR擴(kuò)增使用酵母基因組DNA作為模板,通過(guò)標(biāo)準(zhǔn)PCR擴(kuò)增該部分酵母基因。從野生型釀酒酵母標(biāo)準(zhǔn)實(shí)驗(yàn)室菌株,使用Nucleon MIY DNA提取試劑盒(Amersham Biosciences),根據(jù)供應(yīng)商的說(shuō)明書(shū),制備基因組DNA。在PCR擴(kuò)增的第一步,使用含有限制性酶位點(diǎn)的正向引物和含有通用接頭序列的反向引物。在該步中,向擴(kuò)增子的3′末端,鄰近終止密碼子的地方,添加20bp。在擴(kuò)增的第二步,用含有poly-T20尾和限制性酶位點(diǎn)的嵌套引物更換反向引物。該SSA4擴(kuò)增子含有729bp的SSA4 ORF加上一個(gè)20bp的通用接頭序列以及一個(gè)poly-A20尾。
      所用PCR引物如下YER103W-For-SacIacgtgagctcattgaaactgcaggtggtattatga(SEQ ID NO23)YER103W-Rev-Unigatccccgggaattgccatgctaatcaacctcttcaaccgttgg(SEQ ID NO24)Unl-polyT-BamHIacgtggatccttttttttttttttttttttgatccccgggaattgccatg(SEQ ID NO25).
      質(zhì)粒DNA構(gòu)建體用限制性酶,EcoRI+BamHI,切割PCR擴(kuò)增子。使用QuickLigation試劑盒(New England Biolabs),根據(jù)供應(yīng)商的說(shuō)明書(shū),將該DNA片段與pTRIamp18載體(Ambion)連接,并通過(guò)標(biāo)準(zhǔn)方法轉(zhuǎn)化大腸桿菌DH-5。
      DNA測(cè)序?yàn)榱蓑?yàn)證PCR擴(kuò)增子的克隆,使用M13正向引物和M13反向引物測(cè)序質(zhì)粒DNA,并在ABI 377上分析。
      體外轉(zhuǎn)錄使用Megascript T7試劑盒(Ambion),根據(jù)供應(yīng)商的說(shuō)明書(shū),實(shí)施體外轉(zhuǎn)錄,獲得SSA4cRNA。
      逆轉(zhuǎn)錄用1μg cRNA和0.2U逆轉(zhuǎn)錄酶Superscript II RT(Invitrogen),根據(jù)供應(yīng)商的說(shuō)明書(shū)——除了添加20U Suprase-In(RNAse抑制劑-Ambion)——進(jìn)行逆轉(zhuǎn)錄。在QiaQuick PCR純化柱(Qiagen)上,根據(jù)供應(yīng)商的說(shuō)明書(shū),使用所提供的EB-緩沖液進(jìn)行洗脫,純化產(chǎn)生的cDNA。測(cè)定洗脫的cDNA的DNA濃度,并將該cDNA稀釋成相應(yīng)于2×107個(gè)拷貝/μl的SSA4cDNA拷貝濃度。
      實(shí)施例8用于雙標(biāo)記探針試驗(yàn)的方案根據(jù)如下方案(表6),混合用于雙標(biāo)記探針PCR的試劑表6

      *)5′核酸酶試驗(yàn)探針的終濃度為0.1μM而信標(biāo)/SYBR-探針的終濃度為0.3μM。
      在本實(shí)驗(yàn)中,加入2×107個(gè)拷貝的SSA4 cDNA作為模板。在DNAEngine Opticon(MJ Research)中,使用如下PCR循環(huán)方案,實(shí)施試驗(yàn)表7

      *對(duì)于具有9-mer識(shí)別位點(diǎn)的信標(biāo)-570,退火溫度降至44℃。
      表6中所示PCR反應(yīng)的組成以及表7中所列PCR循環(huán)方案將稱(chēng)作標(biāo)準(zhǔn)5′核酸酶試驗(yàn)或標(biāo)準(zhǔn)信標(biāo)試驗(yàn)條件。
      實(shí)施例99-mer 5′核酸酶試驗(yàn)探針的特異性在如下試驗(yàn)中證實(shí)這些5′核酸酶試驗(yàn)探針的特異性,在該試驗(yàn)中向3個(gè)不同的PCR反應(yīng)分別加入各探針,產(chǎn)生不同的SSA4 PCR擴(kuò)增子。如圖6所示,每一個(gè)探針僅產(chǎn)生熒光信號(hào)以及其所設(shè)計(jì)檢測(cè)的擴(kuò)增子(也見(jiàn)圖10、11和12)。重要的是,不同探針具有十分相似的循環(huán)閾值Ct(從23.2至23.7),說(shuō)明這些試驗(yàn)和探針具有十分等同的效力。而且,說(shuō)明當(dāng)將所述試驗(yàn)用于真實(shí)表達(dá)試驗(yàn)時(shí),這些試驗(yàn)應(yīng)當(dāng)檢測(cè)到相似的表達(dá)水平。這是一個(gè)重要發(fā)現(xiàn),因?yàn)椴煌结樤谛阅苌系淖兓允遣槐黄谕摹?br> 實(shí)施例109-mer和10-mer分子信標(biāo)探針的特異性此外,還針對(duì)分子信標(biāo)設(shè)計(jì)概念,證實(shí)了檢測(cè)實(shí)時(shí)新產(chǎn)生的PCR擴(kuò)增子的能力。設(shè)計(jì)用于469擴(kuò)增子、具有10-mer識(shí)別序列的分子信標(biāo),在PCR中存在用于產(chǎn)生該469擴(kuò)增子的SSA4 cDNA模板和引物時(shí),產(chǎn)生了清晰的信號(hào),圖7A。所觀(guān)察到的Ct值為24.0,十分類(lèi)似于使用5′核酸酶試驗(yàn)探針獲得的Ct值,這再次說(shuō)明不同探針的十分相似的靈敏度。當(dāng)不加入SSA4模板時(shí),無(wú)信號(hào)產(chǎn)生。利用設(shè)計(jì)用于570擴(kuò)增子、具有9-mer識(shí)別序列的分子信標(biāo),得到相似結(jié)果,見(jiàn)圖7B。
      實(shí)施例119-mer SYBR-探針的特異性還針對(duì)SYBR-探針設(shè)計(jì)概念證實(shí)了檢測(cè)新產(chǎn)生的PCR擴(kuò)增子的能力。設(shè)計(jì)用于該SSA4 cDNA的570擴(kuò)增子的此9-mer SYBR-探針,在PCR中存在用于產(chǎn)生該570擴(kuò)增子的SSA4 cDNA模板和引物時(shí),產(chǎn)生了清晰的信號(hào),見(jiàn)圖8。當(dāng)不加入SSA4模板時(shí),無(wú)信號(hào)產(chǎn)生。
      實(shí)施例12定量轉(zhuǎn)錄物拷貝數(shù)檢測(cè)不同水平的基因轉(zhuǎn)錄物的能力是探針在真實(shí)表達(dá)試驗(yàn)中使用的基本需要。在如下試驗(yàn)中通過(guò)三個(gè)5′核酸酶試驗(yàn)探針,證實(shí)了該需要得到滿(mǎn)足,其中,在所述試驗(yàn)中將不同水平的來(lái)源于表達(dá)載體的SSA4 cDNA以及所述5′核酸酶試驗(yàn)探針之一一起加入不同PCR反應(yīng)中(圖9)。根據(jù)標(biāo)準(zhǔn)5′核酸酶試驗(yàn)條件測(cè)定組成和循環(huán)條件。
      循環(huán)開(kāi)始前PCR中的cDNA拷貝數(shù)通過(guò)循環(huán)閾值Ct,即,首先檢測(cè)到信號(hào)時(shí)的循環(huán)數(shù),來(lái)反映。在此,信號(hào)僅定義為當(dāng)熒光高于3至10個(gè)PCR循環(huán)中檢測(cè)到的熒光的標(biāo)準(zhǔn)差5倍時(shí)的信號(hào)。結(jié)果顯示在起始cDNA拷貝數(shù)的對(duì)數(shù)和Ct值之間存在良好的總體相關(guān)性(圖9)。這種相關(guān)性表現(xiàn)為取決于探針而具有-3.456至-3.499的斜率的直線(xiàn)以及0.9981至0.9999的相關(guān)系數(shù)。曲線(xiàn)的斜率反映PCR的效率,其中,假設(shè)在每一個(gè)PCR循環(huán)中擴(kuò)增子加倍,則100%效率相應(yīng)于-3.322的斜率。目前PCR的斜率指示94%至100%的PCR效率。該相關(guān)系數(shù)和PCR效率與在使用17至26個(gè)核苷酸長(zhǎng)度的DNA 5′核酸酶試驗(yàn)探針檢測(cè)相同SSA4 cDNA水平的試驗(yàn)中獲得值(結(jié)果未顯示)同樣高或更高。因此,這些結(jié)果證實(shí)這3個(gè)9-mer 5′核酸酶試驗(yàn)探針滿(mǎn)足用于真實(shí)表達(dá)探針的要求,說(shuō)明這些探針應(yīng)當(dāng)可以用于表達(dá)譜分析。
      實(shí)施例13檢測(cè)酵母中SSA4轉(zhuǎn)錄物水平在生長(zhǎng)在不同培養(yǎng)條件(±熱休克)下的不同酵母菌株中,檢測(cè)SSA4轉(zhuǎn)錄物的表達(dá)水平。標(biāo)準(zhǔn)實(shí)驗(yàn)室釀酒酵母菌株在上述實(shí)驗(yàn)中用作野生型酵母。從EUROSCARF(登記號(hào)Y06101)獲得SSA4敲除突變體。該菌株在此稱(chēng)作SSA4突變體。兩個(gè)酵母菌株均于30℃生長(zhǎng)于YPD培養(yǎng)基中,直到OD600等于0.8A。將待進(jìn)行熱休克的酵母培養(yǎng)物轉(zhuǎn)移至40℃放置30分鐘,之后離心收獲細(xì)胞并將沉淀冷凍在-80℃。同時(shí),未熱休克的細(xì)胞保留在30℃生長(zhǎng)30分鐘,之后按如上方式收獲。
      使用FastRNA試劑盒(Bio 101)以及FastPrep儀器根據(jù)供應(yīng)商說(shuō)明書(shū)從收獲的酵母分離RNA。
      使用5μg錨定oligo(dT)引物以便在1μg總RNA上引發(fā)反應(yīng),并使用0.2U逆轉(zhuǎn)錄酶Superscript II RT(Invitrogen),根據(jù)供應(yīng)商說(shuō)明書(shū)——除了加入20U Superase-In(RNAse抑制劑-Ambion)——進(jìn)行逆轉(zhuǎn)錄。2小時(shí)孵育后,70℃5分鐘使酶失活。用10mM Tris緩沖液pH 8.5將cDNA反應(yīng)物稀釋5倍,并通過(guò)在MicroSpinTMS-400HR柱(Amersham Pharmacia Biotech)上純化而去除寡核苷酸和酶。在實(shí)施表達(dá)試驗(yàn)前,將cDNA稀釋20倍。使用標(biāo)準(zhǔn)5′核酸酶試驗(yàn)條件——除了加入2μL模板外——以及雙標(biāo)記-570探針,進(jìn)行該表達(dá)試驗(yàn)。模板是最初逆轉(zhuǎn)錄反應(yīng)物的100倍稀釋物。所用的4種不同cDNA模板來(lái)源于進(jìn)行或未進(jìn)行熱休克的野生型或突變體。該試驗(yàn)產(chǎn)生預(yù)期的結(jié)果(圖10),顯示與未接受升高溫度的野生型酵母(Ct=30.3)相比,熱休克的野生型酵母的SSA4轉(zhuǎn)錄物水平(Ct=26.1)增加。無(wú)論培養(yǎng)條件如何,在突變酵母中均未檢測(cè)到轉(zhuǎn)錄物。3.5的Ct值差相應(yīng)于熱休克的野生型酵母相對(duì)于未熱休克的野生型酵母而言誘導(dǎo)了17倍的表達(dá)水平,該值接近文獻(xiàn)(Causton等,2001)中報(bào)道的大約19的值。這些值通過(guò)使用標(biāo)準(zhǔn)曲線(xiàn)獲得,其中所述標(biāo)準(zhǔn)曲線(xiàn)利用雙標(biāo)記的-570探針在具有已知量的SSA4轉(zhuǎn)錄物的定量實(shí)驗(yàn)中獲得(見(jiàn)圖9)。這些實(shí)驗(yàn)說(shuō)明,這些9-mer探針能夠檢測(cè)到與公開(kāi)的結(jié)果十分相符的表達(dá)水平。
      實(shí)施例14使用單9-mer探針(individual 9-mer probes)進(jìn)行多轉(zhuǎn)錄物檢測(cè)為了驗(yàn)證這三個(gè)5′核酸酶試驗(yàn)探針檢測(cè)其它基因的表達(dá)水平的能力,選擇了其中各存在所述探針序列之一的三個(gè)不同酵母基因。設(shè)計(jì)引物以擴(kuò)增圍繞探針序列的60-100堿基對(duì)區(qū)域。下表中顯示了所選的三個(gè)酵母基因和相應(yīng)的引物。
      表8設(shè)計(jì)另一種表達(dá)試驗(yàn)

      來(lái)源于未熱休克的野生型酵母的總cDNA用作該表達(dá)試驗(yàn)的模板,該表達(dá)試驗(yàn)利用標(biāo)準(zhǔn)5′核酸酶試驗(yàn)條件——除了加入2μL模板外——進(jìn)行。如圖11所示,根據(jù)表8所列的試驗(yàn)設(shè)計(jì),所有的三個(gè)探針均能夠檢測(cè)到基因的表達(dá)。使用表8所列之外的任何其它探針和引物組合均未檢測(cè)到表達(dá)。對(duì)于SSA4、POL5、HSP82和APG9,在文獻(xiàn)中可以獲得表達(dá)數(shù)據(jù)(Holstege,等,1998)。對(duì)于未熱休克的酵母,對(duì)于SSA4(0.8個(gè)轉(zhuǎn)錄物拷貝/細(xì)胞)、POL5(0.8個(gè)轉(zhuǎn)錄物拷貝/細(xì)胞)和HSP82(1.3個(gè)轉(zhuǎn)錄物拷貝/細(xì)胞),這些數(shù)據(jù)描述了相似的表達(dá)水平,而APG9轉(zhuǎn)錄物水平稍低(0.1個(gè)轉(zhuǎn)錄物拷貝/細(xì)胞)。
      該數(shù)據(jù)與所獲得的結(jié)果十分相符,因?yàn)槌薍SP82具有25.6的Ct值外,所有其它基因均表示現(xiàn)出相似的Ct值。這提示,HSP82轉(zhuǎn)錄物在這些實(shí)驗(yàn)所用的菌株中的豐度比文獻(xiàn)顯示的豐度要高。使用圖11a所示針對(duì)雙標(biāo)記-469探針的PCR,進(jìn)行瓊脂糖凝膠電泳。瓊脂糖凝膠(圖12)顯示,在未獲得信號(hào)的反應(yīng)中實(shí)際上產(chǎn)生了PCR產(chǎn)物,因此缺乏來(lái)自這些反應(yīng)的熒光信號(hào)并非由PCR失敗所致。而且,在表達(dá)試驗(yàn)中針對(duì)不同基因產(chǎn)生的不同長(zhǎng)度的擴(kuò)增子說(shuō)明,在表達(dá)試驗(yàn)中針對(duì)不同基因產(chǎn)生的信號(hào)實(shí)際上是特異于所涉及的基因的。
      實(shí)施例15選擇靶標(biāo)使用來(lái)自http://www.ensembl.org/EnsMart的EnsMart軟件16.1版,從Homo Sapiens NCBI 33 dbSNP115 Ensembl Genes的所有外顯子,提取分別距各外顯子的任一端的50bp,形成人類(lèi)Exon50靶集合。使用GetCover程序(參見(jiàn)圖17),計(jì)算所有探針靶序列的出現(xiàn)率,除去根據(jù)過(guò)度自我互補(bǔ)、過(guò)度GC含量等未通過(guò)選擇標(biāo)準(zhǔn)的探針靶序列。在剩余序列中,選擇豐度最高的探針靶序列(No.1,覆蓋3200個(gè)靶),之后選擇出現(xiàn)率高于豐度最高的探針靶序列的出現(xiàn)率的0.8倍(3200×0.8)或2560個(gè)靶的所有探針靶。從剩余的樣品中計(jì)算各探針的新命中數(shù),而且計(jì)算每個(gè)探針靶的新命中數(shù)相較于已有選擇的乘積以及該相同探針靶的總出現(xiàn)率,并通過(guò)選擇最高的乘積數(shù)來(lái)選擇下一個(gè)豐度最高的探針靶序列。下表示例了探針靶的長(zhǎng)度(n)、序列(nmer)和在所有靶標(biāo)中的出現(xiàn)率(cover),以及每個(gè)探針靶選擇的新命中數(shù)(Newhit)、Newhit與cover的乘積(newhit×cover)和從所有累計(jì)的探針得到的靶群體中的累計(jì)命中數(shù)(sum)。



      實(shí)施例16人類(lèi)基因的qPCR將該探針文庫(kù)與如下實(shí)時(shí)PCR設(shè)計(jì)軟件聯(lián)合使用,其中所述軟件能夠.通過(guò)獨(dú)特的標(biāo)識(shí)符或通過(guò)注冊(cè)提交的核酸序列,識(shí)別輸入的序列.鑒別可以靶向該核酸的所有探針.根據(jù)靶序列選擇標(biāo)準(zhǔn),例如最接近3′末端或最接近內(nèi)含子-外顯子邊界,分揀探針.如果可以的話(huà),根據(jù)PCR設(shè)計(jì)規(guī)則,設(shè)計(jì)位于靶向該核酸序列的探針側(cè)翼的PCR引物.基于以上步驟,提出可用的實(shí)時(shí)PCR試驗(yàn)。
      通過(guò)www.probelibrary.com上的軟件可以設(shè)計(jì)用于人類(lèi)基因的有效和可靠的qPCR試驗(yàn)。
      ProbeFinder軟件可以針對(duì)給定的人類(lèi)基因快速而可靠地設(shè)計(jì)出最佳的qPCR探針和引物。
      該設(shè)計(jì)包括如下步驟1)確定內(nèi)含子的位置通過(guò)選擇跨qPCR的內(nèi)含子,消除來(lái)自染色體DNA的噪音。通過(guò)blast檢索人類(lèi)基因組確定內(nèi)含子。出現(xiàn)在DNA上但不出現(xiàn)在轉(zhuǎn)錄物上的區(qū)域被認(rèn)為是內(nèi)含子。
      2)將探針文庫(kù)與基因匹配這90個(gè)探針中的至少一個(gè)可以覆蓋幾乎所有人類(lèi)轉(zhuǎn)錄物,識(shí)別序列標(biāo)簽的LNA修飾使得這種高覆蓋率成為可能。
      3)設(shè)計(jì)引物和選擇最佳的qPCR試驗(yàn)用‘Primer3′(Whitehead Inst.For Biomedical Research,S.Rozen和H.J.Skaletsky),設(shè)計(jì)引物。最后,根據(jù)選定的規(guī)則排列探針的等級(jí),從而確保最佳可能的qPCR。這些規(guī)則有利于跨擴(kuò)增子的內(nèi)含子以除去來(lái)自DNA污染的假信號(hào)、并有利于用于可重復(fù)的相似試驗(yàn)的小的擴(kuò)增子尺寸以及優(yōu)化用于PCR的GC含量。
      實(shí)施例17制備ena-單體和寡聚體制備ENA-T單體并將其用于制備本發(fā)明的雙標(biāo)記探針。
      在如下序列中,X代表2′-O,4′-C-亞乙基-5-甲基尿嘧啶(ENA-T)。該單體的合成在WO 00/47599中描述。用于摻入5′-O-二甲氧基三苯甲基-2′-O,4′-C-亞乙基-5-甲基尿嘧啶-3′-O-(2-氰基乙基-N,N,-二異丙基)亞磷酰胺的反應(yīng)條件相應(yīng)于用于制備實(shí)施例6中所述LNA寡聚體的反應(yīng)條件。
      制備如下三個(gè)雙標(biāo)記的探針

      X表示ENA-T單體。小寫(xiě)字母表示DNA單體(a,g,c,t)。Fitc=熒光素;EQL=Eclipse淬滅劑;Dabcyl=Dabcyl淬滅劑。MW=分子量。除了‘X′之外的大寫(xiě)字母表示甲氧基LNA核苷酸。
      參考文獻(xiàn)及注釋1.Helen C.Causton,Bing Ren,Sang Seok Koh,Christopher T.Harbison,Elenita Kanin,Ezra G.Jennings,Tong Ihn Lee,HeatherL.True,Eric S.Lander,和Richard A.Young(2001).重建響應(yīng)于環(huán)境改變的酵母基因組表達(dá).Mol.Biol.Cell 12323-337(2001)。
      2.Frank C.P.Holstege,Ezra G.Jennings,John J.Wyrick,TongIhn Lee,Christoph J.Hengartner,Michael R Green,Todd R.Golub,Eric S.Lander,和Richard A.Young(1998),解剖真核基因組的調(diào)節(jié)線(xiàn)路,Cell 1998 95717-728。
      3.Simeonov,Anton和Theo T.Nikiforov,使用短的固定熒光標(biāo)記的核酸(LNA)探針以及熒光偏振檢測(cè)進(jìn)行單核苷酸多態(tài)性基因分型,Nucleic Acid Research,2002,Vol.30,No.17 e 91。
      本領(lǐng)域技術(shù)人員可以改變、修飾和以其它方式實(shí)施本文的描述而不偏離此處描述和所要求保護(hù)的本發(fā)明的精神和范圍,這些改變、修飾和實(shí)施方式均包括在本發(fā)明的范圍內(nèi)。
      以上公開(kāi)的參考文獻(xiàn)、專(zhuān)利、專(zhuān)利申請(qǐng)和國(guó)際申請(qǐng)完整地并入此處作為參考。
      序列表&lt;110&gt;Exiqon A/S&lt;120&gt;用于分析核酸混合物的探針、文庫(kù)和試劑盒及其構(gòu)建方法&lt;130&gt;15769PCT00&lt;160&gt;46&lt;170&gt;PatentIn version 3.2&lt;210&gt;1&lt;211&gt;23&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;1cgcgtttact ttgaaaaatt ctg23&lt;210&gt;2&lt;211&gt;20&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;2gcttccaatt tcctggcatc20&lt;210&gt;3&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;3gcccaagatg ctataaattg gttag 25&lt;210&gt;4&lt;211&gt;23&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;4gggtttgcaa caccttctag ttc23
      &lt;210&gt;5&lt;211&gt;18&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;5tacggagctg caggtggt 18&lt;210&gt;6&lt;211&gt;18&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;6gttgggccgt tgtctggt 18&lt;210&gt;7&lt;211&gt;13&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;7caaggagaag ttg 13&lt;210&gt;8&lt;211&gt;13&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;8caaggagaag ttg 13&lt;210&gt;9&lt;211&gt;12&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;9
      caaggaaagt tg12&lt;210&gt;10&lt;211&gt;23&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;10cgcgtttact ttgaaaaatt ctg23&lt;210&gt;11&lt;211&gt;20&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;11gcttccaatt tcctggcatc20&lt;210&gt;12&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;12gcccaagatg ctataaattg gttag 25&lt;210&gt;13&lt;211&gt;23&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;13gggtttgcaa caccttctag ttc23&lt;210&gt;14&lt;211&gt;18&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列
      &lt;400&gt;14tacggagctg caggtggt 18&lt;210&gt;15&lt;211&gt;18&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;15gttgggccgt tgtctggt 18&lt;210&gt;16&lt;211&gt;20&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;16gcgagagaaa acaagcaagg20&lt;210&gt;17&lt;211&gt;20&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;17attcgtcttc actggcatca20&lt;210&gt;18&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;18cagctaaaaa tgatgacaat aatgg 25&lt;210&gt;19&lt;211&gt;23&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列
      &lt;400&gt;19attacatcat gattagggaa tgc23&lt;210&gt;20&lt;211&gt;21&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;20gggtttgaac attgatgagg a 21&lt;210&gt;21&lt;211&gt;20&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;21ggtgtcagct ggaacctctt20&lt;210&gt;22&lt;211&gt;13&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;220&gt;
      &lt;221&gt;修飾的堿基&lt;222&gt;(1)..(1)&lt;223&gt;N是LNA甲基胞嘧啶&lt;220&gt;
      &lt;221&gt;misc_特征&lt;222&gt;(1)..(1)&lt;223&gt;n是a,c,g,或t&lt;400&gt;22naaggagaag ttg 13&lt;210&gt;23&lt;211&gt;35&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列
      &lt;400&gt;23acgtgagctc attgaaactg caggtggtat tatga 35&lt;210&gt;24&lt;211&gt;44&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;24gatccccggg aattgccatg ctaatcaacc tcttcaaccg ttgg 44&lt;210&gt;25&lt;211&gt;50&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;25acgtggatcc tttttttttt tttttttttt gatccccggg aattgccatg 50&lt;210&gt;26&lt;211&gt;20&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;26gcgagagaaa acaagcaagg20&lt;210&gt;27&lt;211&gt;20&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;27attcgtcttc actggcatca20&lt;210&gt;28&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;28cagctaaaaa tgatgacaat aatgg 25&lt;210&gt;29&lt;211&gt;23&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;29attacatcat gattagggaa tgc23&lt;210&gt;30&lt;211&gt;21&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;30gggtttgaac attgatgagg a 21&lt;210&gt;31&lt;211&gt;20&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;31ggtgtcagct ggaacctctt20&lt;210&gt;32&lt;211&gt;164&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;32caccgttcgg catatccata tttcccacag ccaccaccag gaaggcagca gccaggagga60gcagcctcct cagagaagca gcctggagac ttcctccagc tccagggccg ccgcctgctg 120gagcagcagc accagaagag ggggaggtac ggttggttgt acga164&lt;210&gt;33
      &lt;211&gt;108&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;33tggcggacgc acaccgctta cccctgctgg aggaagctga ggaggagcag cctggagcag60cagcagccag ctccgccgcc aggaagccga ctcacgggcc acgcatta 108&lt;210&gt;34&lt;211&gt;115&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;34gggtgcgacc gtgagtcaat ggtctccagg aggctgtctt ctggtgctgc tcctctgctg60cctccagctt ctctggccct ggtggtggct gtgggtaatg cgtggcccgt gagtc115&lt;210&gt;35&lt;211&gt;106&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;35attgactcac ggtcgcacca aactctgctg ggctgcctgg aagctccagg agaacttcca60gccagctcct ccaccagcag gaagaataac cgtggaacgc ggtcat 106&lt;210&gt;36&lt;211&gt;124&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;36atacccatcc aaggcgtccc taaaggaggc agaggaaggg agctgccttc ccagcccttc60tcccagcaca gcagagcaga gccacctcca gccacatcac caaaatgacc gcgttccacg 120gtta124&lt;210&gt;37&lt;211&gt;115
      &lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;37attgactcac ggtcgcacca aacctggaag gcagaggaac tgcctcctcc accatcacca60ctgctgggct gggaagcttc cagcacagca ggaaataacc gtggaacgcg gtcat115&lt;210&gt;38&lt;211&gt;121&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;38atacccatcc aaggcgtccc taaacttctc ccagagccac ctccagccag ccacaccagc60agagcaggaa ggagctgcct ggagcagctc ccaggagaaa aatgaccgcg ttccacggtt 120a 121&lt;210&gt;39&lt;211&gt;115&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;39attgactcac ggtcgcacca aattcctctg ccttcctgct ctgctgggag aaggaggtgg60tgatgtggct ggaaggaggc agctccagga gaaaataacc gtggaacgcg gtcat115&lt;210&gt;40&lt;211&gt;114&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;40atacccatcc aaggcgtccc taaacttcca ggcagctccc tccagccagc aggacttccc60agcccagctc ctccaccagc acagcagagc caaaatgacc gcgttccacg gtta 114&lt;210&gt;41&lt;211&gt;114&lt;212&gt;DNA
      &lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;41ttagggacgc cttggatggg tatggctgag gcggctggct cctgcatcct cttctgcctc60tgctcccagc tgagccatgc cctggcttcc accaattgcc gacccaccgg gata 114&lt;210&gt;42&lt;211&gt;122&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;42attcgctacg gcccaacacc ttactccacc tcctgcccca ctggggctga agtccagtgt60ctggagctgc ttcccagtgg gcagccatcc agcaggccac catatcccgg tgggtcggca 120at 122&lt;210&gt;43&lt;211&gt;124&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;43taaggtgttg ggccgtagcg aatcgctctg ccactggggc ctggtctcca tcctctcctc60cctgggcaac ctgctgtcct tggcagtggg gaagctgtgc caattgtcct ccgcccggac 120tcat124&lt;210&gt;44&lt;211&gt;122&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;44ttagggacgc cttggatggg tatctctgcc actggctcca gatcctcttc tgccccactg60ccatgggcag ctggggcctc ctccctccac ctggcttccc caattgccga cccaccggga 120ta 122
      &lt;210&gt;45&lt;211&gt;118&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;45attcgctacg gcccaacacc ttacctcagc cccagctcca tccagccgcc aaggactggt60ctcctgccct gggcaactgg gaatggctgc ttccaccata tcccggtggg tcggcaat118&lt;210&gt;46&lt;211&gt;124&lt;212&gt;DNA&lt;213&gt;人工序列&lt;220&gt;
      &lt;223&gt;合成序列&lt;400&gt;46taaggtgttg ggccgtagcg aatctgcctc ttcagccgct ctgctcccag ctgagccatc60cagtgtgcag gagaggacag caggtggcac agcaggccac caattgtcct ccgcccggac 120tcat12權(quán)利要求
      1.寡核苷酸探針文庫(kù),其中文庫(kù)中的每一個(gè)探針均由識(shí)別序列標(biāo)簽和檢測(cè)部分組成,其中,在每一個(gè)寡核苷酸探針中至少一個(gè)單體是修飾的單體類(lèi)似物,從而相對(duì)于相應(yīng)的未修飾寡脫氧核苷酸而言增加了對(duì)互補(bǔ)靶序列的結(jié)合親和力,由此這些文庫(kù)探針具有足夠的穩(wěn)定性可以用于序列特異性地結(jié)合和檢測(cè)任何給定靶群體中的靶核酸的實(shí)質(zhì)性部分,并且,其中,不同識(shí)別序列的數(shù)目占具有給定長(zhǎng)度的所有可能序列標(biāo)簽的不到10%。
      2.根據(jù)權(quán)利要求1的寡核苷酸探針文庫(kù),其中文庫(kù)中探針的識(shí)別序列標(biāo)簽片段已經(jīng)以至少一種如下方式被修飾i)用至少一個(gè)非天然核苷酸進(jìn)行替代;ii)用至少一個(gè)化學(xué)部分進(jìn)行替代以增加探針的穩(wěn)定性。
      3.根據(jù)權(quán)利要求1或2的寡核苷酸探針文庫(kù),其中識(shí)別序列標(biāo)簽長(zhǎng)6至12個(gè)核苷酸。
      4.根據(jù)權(quán)利要求3的寡核苷酸探針文庫(kù),其中識(shí)別序列標(biāo)簽長(zhǎng)8或9個(gè)核苷酸。
      5.根據(jù)權(quán)利要求4的寡核苷酸探針文庫(kù),其中識(shí)別序列標(biāo)簽用LNA核苷酸替代。
      6.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中90%以上的寡核苷酸探針可以結(jié)合并檢測(cè)核酸群體中的至少兩個(gè)靶序列。
      7.根據(jù)權(quán)利要求6的文庫(kù),其中識(shí)別序列標(biāo)簽與核酸群體中的至少兩個(gè)靶序列互補(bǔ)。
      8.具有8和9個(gè)核苷酸長(zhǎng)度的寡核苷酸探針的文庫(kù),其包含權(quán)利要求1-7之任一項(xiàng)中定義的寡核苷酸探針的子集的混合物。
      9.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中核酸群體中的不同靶序列的數(shù)目是至少100。
      10.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中每一個(gè)寡核苷酸探針中的至少一個(gè)核苷酸用非天然核苷酸類(lèi)似物、脫氧核糖或核糖類(lèi)似物或非磷酸二酯鍵的核苷酸間鍵替代。
      11.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中檢測(cè)部分是共價(jià)地或非共價(jià)地結(jié)合的小溝結(jié)合劑或嵌入劑,選自不對(duì)稱(chēng)花菁染料、DAPI、SYBR Green I、SYBR Green II、SYBR Gold、PicoGreen、噻唑橙、Hoechst 33342、溴化乙啶、1-O-(1-芘基甲基)丙三醇和Hoechst 33258。
      12.根據(jù)權(quán)利要求10或11的寡核苷酸探針文庫(kù),其中所述非磷酸二酯鍵的核苷酸間鍵是非磷酸酯的核苷酸間鍵。
      13.根據(jù)權(quán)利要求12的寡核苷酸探針文庫(kù),其中所述核苷酸間鍵選自烷基膦酸酯、亞磷酰胺、烷基磷酸三酯、硫代磷酸酯和二硫代磷酸酯鍵。
      14.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中所述寡核苷酸探針含有非天然核苷酸,例如2′-O-甲基、二胺嘌呤、2-硫代尿嘧啶、5-硝基吲哚、通用或簡(jiǎn)并堿基、嵌入核酸或小溝結(jié)合劑,以增強(qiáng)探針與互補(bǔ)核酸序列的結(jié)合。
      15.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中所述不同識(shí)別序列占具有給定長(zhǎng)度的所有可能寡核苷酸的1%以下。
      16.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中每一個(gè)探針都可以使用雙標(biāo)記物利用分子信標(biāo)試驗(yàn)原理進(jìn)行檢測(cè)。
      17.根據(jù)權(quán)利要求1-15之任一項(xiàng)的寡核苷酸探針文庫(kù),其中每一個(gè)探針都可以使用雙標(biāo)記物利用5′核酸酶試驗(yàn)原理進(jìn)行檢測(cè)。
      18.根據(jù)前述任一項(xiàng)權(quán)利要求的文庫(kù),其中每一個(gè)探針都含有單一一個(gè)檢測(cè)部分,該檢測(cè)部分可以通過(guò)分子信標(biāo)試驗(yàn)原理檢測(cè)。
      19.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中靶核酸群體是mRNA樣品、cDNA樣品或基因組DNA樣品。
      20.根據(jù)權(quán)利要求19的寡核苷酸探針文庫(kù),其中所述靶mRNA或靶cDNA群體來(lái)源于人類(lèi)、小鼠或大鼠的轉(zhuǎn)錄物組。
      21.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中所述探針靶序列在靶核酸群體的4%以上不同靶核酸中出現(xiàn)至少一次。
      22.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中從所述文庫(kù)中已經(jīng)除去自身互補(bǔ)的探針序列。
      23.根據(jù)權(quán)利要求22的寡核苷酸探針文庫(kù),其中所述自身互補(bǔ)的序列已經(jīng)被選擇除去。
      24.根據(jù)權(quán)利要求22的寡核苷酸探針文庫(kù),其中所述自身互補(bǔ)的序列已經(jīng)通過(guò)序列特異性修飾,例如非標(biāo)準(zhǔn)核苷酸、具有SBC核酸堿基的核苷酸、2′-O-甲基、二胺嘌呤、2-硫代尿嘧啶、通用或簡(jiǎn)并堿基或小溝結(jié)合劑,而被消除。
      25.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中每個(gè)探針的熔解溫度(Tm)通過(guò)用非天然修飾,例如,LNA——任選地用SBC核酸堿基、2′-O-甲基、二胺嘌呤、2-硫代尿嘧啶、5-硝基吲哚、通用或簡(jiǎn)并堿基、嵌入核酸或小溝結(jié)合劑修飾——進(jìn)行替代以增強(qiáng)探針與互補(bǔ)核酸序列的結(jié)合,而被調(diào)整以適用于基于PCR的試驗(yàn)。
      26.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中每個(gè)探針的熔解溫度(Tm)為至少50℃。
      27.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中每個(gè)探針在5′末端具有DNA核苷酸。
      28.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中每個(gè)探針含有熒光團(tuán)-淬滅劑對(duì)用于檢測(cè)。
      29.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中每個(gè)探針都可以通過(guò)分子信標(biāo)原理進(jìn)行檢測(cè)。
      30.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中每個(gè)探針與一旦結(jié)合雙鏈DNA或DNA-RNA異源雙鏈靶后將改變熒光的嵌入熒光團(tuán)或小溝結(jié)合劑附著。
      31.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中靶群體是人類(lèi)轉(zhuǎn)錄物組。
      32.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中每個(gè)寡核苷酸探針檢測(cè)最大可能數(shù)目的不同靶核酸,從而導(dǎo)致所述文庫(kù)對(duì)給定靶核酸群體的最大覆蓋。
      33.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中為了獲得最大程度的檢測(cè),這些寡核苷酸探針經(jīng)選擇在靶核酸群體中具有盡可能多的靶序列或結(jié)合位點(diǎn)。
      34.根據(jù)前述任一項(xiàng)權(quán)利要求的寡核苷酸探針文庫(kù),其中為了獲得最大程度的檢測(cè),這些寡核苷酸探針經(jīng)選擇在靶核酸群體中盡可能多的靶核酸內(nèi)具有至少一個(gè)靶序列。
      35.表1或表1a或圖13或圖14的寡核苷酸探針文庫(kù),其能夠檢測(cè)任何給定核酸群體中的互補(bǔ)序列。
      36.根據(jù)前述任一項(xiàng)權(quán)利要求的文庫(kù),其包含各具有說(shuō)明書(shū)中表1或表1a所列的識(shí)別元件的探針和/或其包含各具有與所述表1中所列的識(shí)別元件互補(bǔ)的識(shí)別元件的探針。
      37.可用于根據(jù)前述任一項(xiàng)權(quán)利要求的文庫(kù)中的寡核苷酸探針,所述探針選自與表1、圖13或圖14所示序列互補(bǔ)或相同的探針。
      38.根據(jù)權(quán)利要求37的寡核苷酸探針,其具有選自表1的確切核苷酸序列。
      39.選擇可用于前述任一項(xiàng)權(quán)利要求的文庫(kù)中的寡核苷酸序列的方法,包括a)提供具有預(yù)定核苷酸數(shù)目N的所有可能寡核苷酸的第一集合,其中所述寡核苷酸具有至少50℃的熔解溫度Tm,b)提供靶核酸序列的第二集合,c)針對(duì)所述第一集合的每一個(gè)成員,分別從所述第二集合中鑒定和存儲(chǔ)包括與所述第一集合的該成員互補(bǔ)的序列的成員的數(shù)目,d)選擇在步驟c的鑒定中與步驟c中鑒定到的最大數(shù)目的所述第二集合的成員匹配的所述第一集合的成員,e)將步驟d中選擇的成員添加至由選出的、可用于前述任一項(xiàng)權(quán)利要求的文庫(kù)中的寡核苷酸組成的第三集合中,f)從所述第一集合中扣除步驟d中選擇的成員以提供修訂的第一集合,m)重復(fù)步驟d至f,直到所述第三集合的組成成員組合在一起可以與來(lái)自步驟b的靶核酸序列集合中的至少30%成員互補(bǔ)為止。
      40.根據(jù)權(quán)利要求39的方法,其中Tm是至少60℃。
      41.根據(jù)權(quán)利要求39或40的方法,其中所述寡核苷酸的第一集合僅僅包括不能夠自身雜交的寡核苷酸。
      42.根據(jù)權(quán)利要求39-41之任一項(xiàng)的方法,其在步驟f之后并在步驟m之前包括如下步驟g)從所述第二集合中扣除包括了與步驟d中選出的成員互補(bǔ)的序列的所有成員,以獲得修訂的第二集合,h)針對(duì)所述修訂的第一集合中的每一個(gè)成員,分別地鑒定和存儲(chǔ)包括了與所述該成員互補(bǔ)的序列的所述修訂的第二集合的成員的數(shù)目,i)選擇在步驟h的鑒定中與步驟h中鑒定到的最大數(shù)目的所述第二集合成員匹配的所述第一集合的成員,或者選擇可以通過(guò)步驟h中鑒定到的數(shù)目與步驟c中鑒定的數(shù)目的乘積產(chǎn)生最大數(shù)目的所述第一集合的成員,j)將步驟i中選擇的成員添加至所述第三集合,k)從所述修訂的第一集合中扣除步驟i中選擇的成員,和l)從所述修訂的第二集合中扣除包括了與步驟i中選擇的成員的序列或與之互補(bǔ)的序列的所有成員。
      43.根據(jù)權(quán)利要求39-42之任一項(xiàng)的方法,其中持續(xù)步驟m中的重復(fù)步驟,直到所述第三集合的組成成員組合在一起可以與來(lái)自步驟b的靶核酸序列集合中的至少85%成員互補(bǔ)為止。
      44.根據(jù)權(quán)利要求39-43之任一項(xiàng)的方法,其中,在選出所述第三集合的第一個(gè)成員后,在步驟c之后并在步驟d中的選擇之前鑒定在所述第一集合中與超過(guò)所述最大數(shù)目的選定百分?jǐn)?shù)的所述第二集合成員雜交的成員,由此僅有如此鑒定到的這些成員進(jìn)行步驟d中的選擇。
      45.根據(jù)權(quán)利要求44的方法,其中所述選定的百分?jǐn)?shù)為80%。
      46.根據(jù)權(quán)利要求39-45之任一項(xiàng)的方法,其中N是選自6、7、8、9、10、11和12的整數(shù)。
      47.根據(jù)權(quán)利要求46的方法,其中N是8或9。
      48.根據(jù)權(quán)利要求39-47之任一項(xiàng)的方法,其中步驟b的所述第二集合包含權(quán)利要求19或20中定義的靶核酸序列。
      49.根據(jù)權(quán)利要求39-48之任一項(xiàng)的方法,其基本上按照?qǐng)D2所示方式實(shí)施。
      50.根據(jù)權(quán)利要求39-49之任一項(xiàng)的方法,其中,所述第一、第二和第三集合存儲(chǔ)在計(jì)算機(jī)系統(tǒng)的存儲(chǔ)器中,優(yōu)選地存儲(chǔ)在數(shù)據(jù)庫(kù)中。
      51.提供執(zhí)行根據(jù)權(quán)利要求39-50之任一項(xiàng)的方法的指令的計(jì)算機(jī)程序產(chǎn)品,其寫(xiě)在計(jì)算機(jī)可讀介質(zhì)中。
      52.包含靶序列的數(shù)據(jù)庫(kù)以及用于執(zhí)行權(quán)利要求51的計(jì)算機(jī)程序的應(yīng)用程序的系統(tǒng)。
      53.鑒定用于檢測(cè)靶核酸的特定手段的方法,該方法包括A)向計(jì)算機(jī)系統(tǒng)中輸入唯一地標(biāo)識(shí)所述靶核酸的核酸序列的數(shù)據(jù),其中所述計(jì)算機(jī)系統(tǒng)包含容納有至少一個(gè)根據(jù)權(quán)利要求1-36之任一項(xiàng)的核酸探針文庫(kù)的組成信息的數(shù)據(jù)庫(kù),并且,其中該計(jì)算機(jī)系統(tǒng)還包含針對(duì)所述至少一個(gè)文庫(kù)中的每一個(gè)探針的靶核酸序列的數(shù)據(jù)庫(kù)和/或還包含用于獲取和比較核酸序列數(shù)據(jù)的手段,B)在該計(jì)算機(jī)系統(tǒng)中鑒定來(lái)自所述至少一個(gè)文庫(kù)的探針,其中該探針的序列存在于所述靶核酸序列中或存在于與該靶核酸序列互補(bǔ)的序列中,C)在該計(jì)算機(jī)系統(tǒng)中鑒定可以擴(kuò)增該靶核酸序列的引物,和D)提供指出步驟B中鑒定的探針和步驟C中鑒定的引物序列的輸出結(jié)果,作為對(duì)特定檢測(cè)手段的鑒定。
      54.根據(jù)權(quán)利要求53的方法,其中步驟A還包括向所述計(jì)算機(jī)系統(tǒng)輸入標(biāo)識(shí)期望從中選出用于該特定檢測(cè)手段中的成員的至少一個(gè)核酸文庫(kù)的數(shù)據(jù)。
      55.根據(jù)權(quán)利要求54的方法,其中標(biāo)識(shí)該至少一個(gè)文庫(kù)的組成的數(shù)據(jù)是產(chǎn)品代碼。
      56.根據(jù)權(quán)利要求53-55之任一項(xiàng)的方法,其中步驟A中的輸入通過(guò)因特網(wǎng)界面實(shí)現(xiàn)。
      57.根據(jù)權(quán)利要求53-55之任一項(xiàng)的方法,其中選擇步驟C中鑒定到的引物,以最小化在PCR反應(yīng)中擴(kuò)增基因組核酸的可能性。
      58.根據(jù)權(quán)利要求57的方法,其中至少一個(gè)引物經(jīng)選擇包括在基因組DNA中被內(nèi)含子中斷的核苷酸序列。
      59.根據(jù)權(quán)利要求53-58之任一項(xiàng)的方法,其中選擇步驟C中選出的引物,以最小化在靶核酸序列上實(shí)施PCR獲得的擴(kuò)增子的長(zhǎng)度。
      60.根據(jù)權(quán)利要求53-59之任一項(xiàng)的方法,其中選擇步驟C中選出的引物,以?xún)?yōu)化GC含量以便實(shí)施PCR。
      61.計(jì)算機(jī)程序產(chǎn)品,其提供用于執(zhí)行根據(jù)權(quán)利要求53-60之任一項(xiàng)的方法的指令,該指令寫(xiě)在計(jì)算機(jī)可讀介質(zhì)上。
      62.包含權(quán)利要求1-36之任一項(xiàng)中定義的核酸探針的數(shù)據(jù)庫(kù)和用于執(zhí)行權(quán)利要求61的計(jì)算機(jī)程序的應(yīng)用程序的系統(tǒng)。
      63.剖析多個(gè)靶序列的方法,其包括使靶序列的樣品與根據(jù)權(quán)利要求1-36之任一項(xiàng)的文庫(kù)接觸,和檢測(cè)、表征或定量與所述靶序列結(jié)合的探針序列。
      64.根據(jù)權(quán)利要求63的方法,其檢測(cè)所述多探針序列結(jié)合的所述多個(gè)序列中低于10%中存在的核酸序列。
      65.根據(jù)權(quán)利要求64的方法,其中所述靶mRNA序列或cDNA序列包含轉(zhuǎn)錄物組。
      66.根據(jù)權(quán)利要求65的方法,其中所述轉(zhuǎn)錄物組是人類(lèi)轉(zhuǎn)錄物組。
      67.根據(jù)權(quán)利要求63-66之任一項(xiàng)的方法,其中所述探針文庫(kù)與固相支持物共價(jià)結(jié)合。
      68.根據(jù)權(quán)利要求67的方法,其中所述固相支持物包括微量滴定板,該微量滴定板的每個(gè)孔包含一個(gè)不同的文庫(kù)探針。
      69.根據(jù)權(quán)利要求63-68之任一項(xiàng)的方法,其中檢測(cè)步驟通過(guò)擴(kuò)增包含與文庫(kù)探針互補(bǔ)的識(shí)別序列的靶核酸序列來(lái)進(jìn)行。
      70.權(quán)利要求69的方法,其中使用位于與文庫(kù)探針互補(bǔ)的識(shí)別序列側(cè)翼的一對(duì)寡核苷酸引物進(jìn)行靶核酸擴(kuò)增。
      71.權(quán)利要求63-70之任一項(xiàng)的方法,其中一個(gè)或多個(gè)靶核酸序列的存在或表達(dá)水平與物種的表型相關(guān)。
      72.權(quán)利要求71的方法,其中所述表型是疾病。
      73.使用根據(jù)權(quán)利要求1-36之任一項(xiàng)的文庫(kù)分析核酸混合物的方法,其包括步驟(a)使靶寡核苷酸與標(biāo)記的寡核苷酸探針的文庫(kù)接觸,以便所述靶寡核苷酸與所述探針文庫(kù)的至少一個(gè)成員雜交,由此形成雜交的文庫(kù),其中所述寡核苷酸探針的每一個(gè)都具有已知的序列并與固相支持物上在已知位置結(jié)合;(b)使所述雜交的文庫(kù)與能夠切割雙鏈寡核苷酸的核酸酶接觸以從所述雜交的文庫(kù)中釋放出所述標(biāo)記的寡核苷酸探針的一部分或其片段;和(c)鑒定所述雜交的文庫(kù)上已經(jīng)除去了標(biāo)記的探針或其片段的位置,以確定所述未標(biāo)記的靶寡核苷酸的序列。
      74.使用權(quán)利要求1-36之任一項(xiàng)的文庫(kù)分析核酸混合物的方法,其包括步驟(a)使靶寡核苷酸與標(biāo)記的寡核苷酸探針的文庫(kù)接觸,以使所述靶寡核苷酸與所述探針文庫(kù)的至少一個(gè)成員雜交,由此形成雜交的文庫(kù),其中所述寡核苷酸探針的每一個(gè)都具有已知的序列并與固相支持物上在已知位置結(jié)合;(b)鑒定所述雜交的文庫(kù)上標(biāo)記的探針或其片段已發(fā)生雜交的位置,以確定所述靶寡核苷酸的序列;和(c)鑒定所述雜交的文庫(kù)上已經(jīng)除去了標(biāo)記的探針或其片段的位置,以確定所述未標(biāo)記的靶寡核苷酸的序列。
      75.定性或定量地確定樣品中靶核酸的存在的方法,該方法包括i)利用根據(jù)權(quán)利要求53-60之任一項(xiàng)的方法鑒定檢測(cè)所述靶核酸的特定手段,其中所述特定檢測(cè)手段包括寡核苷酸探針和一組引物,ii)獲得步驟i)中鑒定的引物和寡核苷酸探針,iii)在存在來(lái)自步驟ii)的引物和寡核苷酸探針的情況下對(duì)樣品實(shí)施分子擴(kuò)增操作,和iv)基于步驟iii)的結(jié)果,確定靶核酸的存在。
      76.根據(jù)權(quán)利要求75的方法,其中步驟ii)中獲得的引物是通過(guò)合成獲得的。
      77.根據(jù)權(quán)利要求75或76的方法,其中寡核苷酸探針是從根據(jù)權(quán)利要求1-36之任一項(xiàng)的文庫(kù)中獲得的。
      78.根據(jù)權(quán)利要求75-77之任一項(xiàng)的方法,其中步驟iii)中的所述操作是PCR或NASBA操作。
      79.根據(jù)權(quán)利要求78的方法,其中所述PCR操作是qPCR。
      全文摘要
      本發(fā)明涉及用于檢測(cè)、分類(lèi)或定量復(fù)雜的核酸混合物,例如轉(zhuǎn)錄物組中的成分的核酸探針、核酸探針文庫(kù)和試劑盒、以及它們的使用方法。本發(fā)明還涉及鑒定可用于該探針文庫(kù)的核酸探針的方法和鑒定可用于檢測(cè)給定核酸的手段的方法。
      文檔編號(hào)C12Q1/68GK1833034SQ200480022775
      公開(kāi)日2006年9月13日 申請(qǐng)日期2004年6月18日 優(yōu)先權(quán)日2003年6月20日
      發(fā)明者N·B·拉姆辛, P·莫里特曾, S·M·埃赫沃爾德, N·托爾斯特魯普 申請(qǐng)人:埃克斯魁恩公司
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1