專利名稱:寡核苷酸及其應(yīng)用的制作方法
寡核苷酸及其應(yīng)用本發(fā)明涉及寡核苷酸,特別涉及寡核苷酸在檢測DNA內(nèi)串聯(lián)重復(fù)中的應(yīng)用。已知多種用于檢測特異DNA序列并評價已知單核苷酸多態(tài)性(SNP)的技術(shù)和探針 系統(tǒng),包括均相聚合酶鏈?zhǔn)椒磻?yīng)(PCR)、TaqMan 探針、Eclipse探針、分子信標(biāo)、Scorpion 引物、簡便雜交探針、ResonSense探針、GenePin探針和雜交信標(biāo)(HyBeacOIlS )。這些內(nèi)容 例如在本申請人較早期的專利申請WO 01/73118和WO 2007/010268中被討論。盡管許多DNA多態(tài)性和突變是SNP,但很多是由于DNA序列的串聯(lián)重復(fù)造成的。目 前,通常通過如在PCR擴(kuò)增靶DNA序列后的大小分析或DNA測序來分析基因組DNA中的此 類重復(fù)。盡管曾嘗試使用寡核苷酸探針系統(tǒng)來鑒定DNA中的串聯(lián)重復(fù)(例如,參見Radtkey et al (2000)Nucl. Acids Res. 28, el7 (i_vi)),但迄今為止尚沒有使用雜交探針分析這些 重復(fù)序列的實踐方法。Alec Jeffreys根據(jù)其有關(guān)人類基因組內(nèi)重復(fù)DNA序列的發(fā)現(xiàn)(JeffreyS1985a, 1985b),發(fā)明了 DNA指紋或DNA圖譜分析(DNA profiling)。發(fā)現(xiàn)所謂STR(短串聯(lián)重復(fù)) 或VNTR(可變數(shù)目串聯(lián)重復(fù))的重復(fù)序列在不同個體內(nèi)的長度不同。在首次描述的DNA圖 譜分析中,通過使用限制性酶(在特異的核苷酸序列處切割DNA的酶)分型了很多此類基 因座,其中該限制性酶基于酶識別序列之間重復(fù)序列的重復(fù)數(shù)目釋放長度不同的片段。在 那些早期的DNA圖譜分析中,在瓊脂糖凝膠上分離片段,并且通過使用放射性DNA探針鑒定 包含目標(biāo)STR的特異片段。這是復(fù)雜且耗時的方法,而自從首次描述DNA圖譜分析和特性 確定(identity determination)后,大量的改進(jìn)和研發(fā)已經(jīng)對此方法產(chǎn)生了極大的影響, 提高了分析的容易性,并由此提高了可處理樣品的數(shù)量,以及辨識能力和成本。在該方法的最新形式中,使用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴(kuò)增STR基因座,隨后通過如 毛細(xì)管電泳(CE)的技術(shù)將其分離。在英國,每年處理包括從常規(guī)口腔拭樣到嚴(yán)重犯罪現(xiàn)場 樣品在內(nèi)的數(shù)以萬計的樣品,用于與目前擁有超過200萬此類圖譜的國家DNA數(shù)據(jù)庫進(jìn)行 比較。盡管在緊急情況下,實驗室具有在短至單個工作日內(nèi)由例如口腔拭樣的簡單樣品 生成圖譜的能力,但是難以想象如何能對于所有的樣品在常規(guī)基礎(chǔ)上實現(xiàn)這一點。此外,如 果考慮從樣品收集至到達(dá)實驗室的時間,顯然無法及時測定大部分圖譜。結(jié)果,常常在DNA 圖譜被獲得并分析前在沒有其他證據(jù)的情況下而不得不釋放被捕的嫌疑人。這樣做的結(jié)果 可能是,某個因相對較小的犯罪而被逮捕并隨后又被釋放的個體在此后可能被確定為嚴(yán)重 犯罪的主犯,對于此類主犯,如果真的能確定其位置,則必須將其重新逮捕。這個過程不僅 耗時多且成本高,而且還存在該個體實施其他潛在的嚴(yán)重犯罪的風(fēng)險,而如果能夠在該個 體仍被拘留期間獲得所述圖譜分析,則完全可能防范這種風(fēng)險。目前基于PCR的方法包括DNA提取、STR擴(kuò)增、基于CE的大小分離和分析,此方法 的各個方面以及所用設(shè)備的成本和復(fù)雜性意味著STR圖譜分析主要局限于專業(yè)實驗室,其 結(jié)果又制約了最終完成的周轉(zhuǎn)時間。然而,如果要使圖譜分析變得足夠快速以至于能夠在 個體仍被拘留期間通過常規(guī)方式獲得結(jié)果,就必須找到能夠進(jìn)行原位分析的方法。在其他非法醫(yī)DNA分析中,已有使用均相PCR的適合方法,其中通過熒光的簡單變化在同一試管中進(jìn)行DNA的擴(kuò)增和分析。現(xiàn)已將多種此類基于熒光的探針系統(tǒng),包括 HyBeacon和TaqMan探針(參見WO 01/73118和WO 2007/010268的綜述)用于測定DNA序 列中的變異,例如單核苷酸多態(tài)性(SNP)插入和刪除。然而,此類探針尚未用于測定對于如 STR或其他DNA序列分析所要求的較長的長度多態(tài)性,實際上也不知道使用均相探針系統(tǒng) 如何能夠測定這些長度多態(tài)性。已有多個小組描述了均相探針系統(tǒng),其能夠使在單個管中進(jìn)行PCR產(chǎn)物分析,該 分析使用例如擴(kuò)增首先被檢測的循環(huán)以提供一條DNA序列在另一條中的相對定量(例如用 于食品分析中各類動物樣品的混合物),或者提供一個等位基因變體在另一個中的相對定 量(例如用于關(guān)于單核苷酸多態(tài)性或SNP的基因分型以及載體狀態(tài))。本發(fā)明的發(fā)明人此 前描述了新型的熒光探針系統(tǒng)HyBeacons,其能夠鑒定微小的序列差異,例如SNP,或者小 插入或缺失,因為這些差異顯著地影響解鏈溫度,HyBeacons結(jié)構(gòu)的新性質(zhì)使其能夠完成這 一點。此類方法可通過SNP分型以均相且可能便攜的方式鑒別個體。然而,現(xiàn)有的數(shù)據(jù)庫 通?;赟TR,這是因為與在每個基因座通常僅具有2個等位基因的SNP相比,在每個基因 座平均具有10個等位基因的STR的可變性明顯大很多。因此,英國法醫(yī)DNA圖譜分析的工 業(yè)標(biāo)準(zhǔn)為來自AppliedBiosystems的包含10個STR的SGM+試劑盒,而性別測試優(yōu)先可選 的 SNP 分型組(alternative SNP typing panel),SNP 分型組需要約 50-100 個 SNP 的區(qū)域 以獲得個體鑒定的可比較水平。顯然,盡管SNP組可用于比較個體樣品,但是目前只有基于 STR的數(shù)據(jù)庫,個體樣品可與之進(jìn)行比較。在使STR分型能夠在專業(yè)實驗室之外的背景中應(yīng)用的嘗試中,曾試圖通過使用微 型化CE而將標(biāo)準(zhǔn)圖譜分析方法的各個步驟組合成均相的形式。此類微型化系統(tǒng)的主要優(yōu) 點是由較短的毛細(xì)管獲得更快速的分析。通常將此類毛細(xì)管蝕刻在顯微鏡載玻片中,并且 通常深10-50 μ m,寬50 μ m,長度在幾個厘米的范圍,并且由玻璃蓋玻片密封(Wooley and Mathies,1994)。還描述過其他可選形式,例如使用注入成型的塑料(McCormick et al, 1997)。與更為常見的柱長36cm的ABI系統(tǒng)相反,用于Promega PowerPlex l. ISTR試劑盒 的長數(shù)個厘米的微型化CE柱能夠?qū)⒎蛛x時間從約45分鐘減少至僅2. 5分鐘(Schmalzing et al,1999)。還曾描述過可在僅2分鐘內(nèi)同時分析多達(dá)96個樣品的毛細(xì)管陣列系統(tǒng) (Shi et al,1999),以及最近開發(fā)的多色系統(tǒng),不過其分離時間相對較長(Goedecke et al, 2004)。還需要在分離前擴(kuò)增DNA的便攜式PCR系統(tǒng),現(xiàn)已證明了多種此類系統(tǒng),范圍涉及 從已證實用于4個基因座的由電池供電的系統(tǒng)(Belgrader et al,1998),到集成微芯片CE 裝置的系統(tǒng)(Lagally et al,2001)。今后面臨的挑戰(zhàn)之一將是使用具有快速擴(kuò)增技術(shù)的 多STR試劑盒。多重PCR需要仔細(xì)的優(yōu)化,并且必須在不同引物對的反應(yīng)優(yōu)化之間進(jìn)行折 衷和平衡??焖貾CR的反應(yīng)條件通常更為嚴(yán)謹(jǐn),因此,其對多重PCR系統(tǒng)特別需要的任何折 衷的容忍性都較小。在進(jìn)一步簡化STR分析的嘗試中,Nanogen Inc. (San Diego, CA)試圖使用雜交的 形式,其中將PCR擴(kuò)增的靶與固定在微型硅芯片不同位置的長度不同的捕獲探針雜交。隨 后使用帶有末端標(biāo)記的長度恒定的探針檢測靶序列的其余部分,所述探針主要靶向非重復(fù) 序列。在需要由電場嚴(yán)格控制的嚴(yán)謹(jǐn)條件以及用于控制重復(fù)單元在雜交期間滑移的溫度下,只有能夠使探針和捕獲序列在彼此靠近時立即雜交的靶才能允許末端堿基參與堿基堆 疊并穩(wěn)定此結(jié)構(gòu)。此類復(fù)合物是足夠穩(wěn)定的,以允許通過微芯片上熒光的位置確定給定基 因座的不同等位基因(Radtkey et al,2000,Westin et al,2000),不過從較短的捕獲探針 序列也產(chǎn)生信號。此類探針由單個熒光團(tuán)進(jìn)行末端標(biāo)記,并且其熒光不隨其雜交狀態(tài)而改 變。因此,為了檢測給定位點的給定序列,必須依賴探針的捕獲并且洗去任何未雜交的探 針。長度多態(tài)性,特別是重復(fù)長度多態(tài)性的鑒定為法醫(yī)提供了大量情報。然而,此 類多態(tài)性還有很多其他的應(yīng)用。在整個人類基因組中有15,000多個STR標(biāo)記物,并且 基于該信息(informity),可用于在繪圖(mapping)研究中排除直到數(shù)個厘摩的基因組 (Weissenbach et al,1992)。舉例而言,STR繪圖研究已經(jīng)用于鑒定與肥厚型心肌病相關(guān) 的新基因座(Watkins et al, 1993, Carrier etal, 1993, Thierfelder et al,1993)。已知其他長度多態(tài)性,特別是三聯(lián)體重復(fù)擴(kuò)增導(dǎo)致疾病,特別是神經(jīng)變性疾病和 其他類型的疾病,包括強(qiáng)直性肌營養(yǎng)不良、脆性X綜合征、亨廷頓病,多種脊髓小腦型共濟(jì) 失調(diào)癥和弗里德里希共濟(jì)失調(diào)癥(Friedreich ataxia) (Sinden 1999)。還有其他長度多態(tài) 性與疾病易感性相關(guān)。例如,在胰島素基因上游600堿基由14bp重復(fù)單元構(gòu)成的微小衛(wèi)星 影響個體患糖尿病的風(fēng)險(Bell et al,1982),而微衛(wèi)星不穩(wěn)定性和雜合性的損失也是包 括肺癌在內(nèi)的很多癌癥的特征(Ionov et al,1993)?,F(xiàn)已將微衛(wèi)星不穩(wěn)定性與高突變率及 DNA 修復(fù)過程相關(guān)連(Loeb, L. A. 1994,F(xiàn)rayling, I. M. 1999)。在很多其他物種中發(fā)現(xiàn)長度多態(tài)性,并可有利地用于分型的目的。例如,巴西副 球孢子菌(Paracoccidioides brasiliensis)是拉丁美洲地方性疾病,副球孢子菌病的病 原因子,在拉丁美洲估計有1000萬人受此病影響(Restr印o-Moreno,2003)。為進(jìn)一步了 解該具有臨床重要性的生物體而進(jìn)行的個體分離物和系統(tǒng)分類物種的研究直到最近仍受 到缺少用于分型目的的分子標(biāo)記物而被阻礙,但近期Matute基于其他人的成功對其進(jìn)行 了整理(Matute etal,2006)。微衛(wèi)星標(biāo)記物系統(tǒng)為大量其他生物體的DNA圖譜分析提供 了高度有效的方法,并已經(jīng)成功地用于真菌,例如釀酒酵母(Saccharomyces cerevisiae) (Hennequin 2001)、煙曲霄(Aspergillus fumigatus) (Bart—Delabesse et al,2001)禾口fi 絲酵母(Candida spp.) (Foulet et al,2005)的分型?,F(xiàn)已公開用于植物物種的類似分型方法?,F(xiàn)已從測序的水稻基因組鑒定出多于 2,000個簡單序列重復(fù)標(biāo)記物(McCouch et al,2002),還在小麥基因組(Roder et al, 1998)和水稻基因組(Brondani et al,1998,2003)等中鑒定出其他的標(biāo)記物。不應(yīng)將本說明書列出或討論的明顯先公開文件視為承認(rèn)所述文件是現(xiàn)有技術(shù)的 一部分或承認(rèn)所述文件是公知常識。本發(fā)明提供了寡核苷酸,以及使用寡核苷酸的方法,其可用于檢測并區(qū)分多核苷 酸序列中不同數(shù)目的串聯(lián)重復(fù)。因此,本發(fā)明可應(yīng)用于醫(yī)學(xué)診斷學(xué)和法醫(yī)科學(xué)領(lǐng)域,并且可 以應(yīng)用于親子和親緣關(guān)系測定,連鎖制圖、微生物分型,以及食物鏈內(nèi)的示蹤能力等。本發(fā)明的第一方面提供了用于確定靶多核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目的方法,所述方 法包括(a)提供包含所述靶多核苷酸的樣品,其中所述靶多核苷酸內(nèi)的一個或多個串聯(lián) 重復(fù)是單鏈形式,
9
(b)使經(jīng)標(biāo)記的探針寡核苷酸與靶多核苷酸的單鏈部分雜交,其中所述探針寡核 苷酸與所述靶多核苷酸的單鏈部分中的至少一個串聯(lián)重復(fù)互補(bǔ),并且所述探針寡核苷酸中 的至少5個核苷酸與所述靶多核苷酸的單鏈部分中的串聯(lián)重復(fù)互補(bǔ),和(c)基于所述探針寡核苷酸與所述靶多核苷酸的單鏈部分的雜交,確定所述靶多 核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目。此方法也可被視為確定靶多核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目的測定法。所述靶多核苷酸可以是DNA或可以是RNA。通常為DNA。眾所周知,很多天然存在的多核苷酸,特別是DNA分子包含串聯(lián)重復(fù),例如 (AB⑶....)n形式的重復(fù),其中A、B、C和D為核苷酸,η是此核苷酸序列重復(fù)的次數(shù)。重復(fù) 可能比該形式更復(fù)雜,并且特定的重復(fù)可能散布在其他特定重復(fù)中。通常,每個串聯(lián)重復(fù)包 含2、3、4、5或6個核苷酸,并可重復(fù)2-50次或更多,即η可以是2_50或更大。部分重復(fù)可 能出現(xiàn)在重復(fù)的靶序列中。此外,STR等位基因可包含多于一種類型的重復(fù),并可包含位于 重復(fù)元件之間的非重復(fù)序列,例如,對于D251338和FGA STR基因座分別為(TGCC)m(TTCC)n 和(TTTC)3 TTTTTTCT(CTTT)nCTCC(TTCC)2(SEQ ID No. 1 和 SEQ ID No. 2)。下表 21 給出了 常見的串聯(lián)重復(fù)序列。常見的串聯(lián)重復(fù)的實例為(GATA)n、(CAG)1^P (TCTTA)n。在某些串聯(lián)重復(fù)中,重復(fù)序列可具有多態(tài)性,致使例如一個或多個重復(fù)序列與核 心重復(fù)序列略有不同。例如,STR THOl具有特異的核心重復(fù)序列AATG。然而,在被稱作9. 3 的一個等位基因中,第七個重復(fù)缺少A堿基。如實施例12中的詳細(xì)討論,某些STR包含可 變的TCTA和TCTG重復(fù)。在此方法的步驟(a)中,提供包含所述靶多核苷酸的樣品,其中所述靶多核苷酸 內(nèi)的一個或多個串聯(lián)重復(fù)是單鏈形式。如下文詳述,這允許探針寡核苷酸與靶的單鏈區(qū)雜 交。靶多核苷酸可以是合成的DNA分子的一部分,或者是可以是天然DNA分子的一部分。當(dāng) 靶多核苷酸為DNA時,通常通過擴(kuò)增另一個DNA分子例如天然DNA分子的一部分而產(chǎn)生。在 此實施方案中,通過擴(kuò)增方法本身或者擴(kuò)增產(chǎn)物的進(jìn)一步加工產(chǎn)生其中一個或多個串聯(lián)重 復(fù)是單鏈形式的靶DNA。例如,可使用PCR反應(yīng),其中采用與天然DNA (例如人基因組DNA) 內(nèi)側(cè)翼于串聯(lián)重復(fù)的區(qū)域雜交的引物。如本領(lǐng)域所熟知的,可通過例如其中一種引物相對 于另一條引物摩爾過量的不對稱PCR而將PCR產(chǎn)物制成單鏈,或者可通過例如解鏈將雙鏈 PCR產(chǎn)物制成單鏈。應(yīng)理解,給定的串聯(lián)重復(fù)可出現(xiàn)在天然DNA的多于一個的區(qū)域。因此,通??善谕?從天然DNA(例如基因組DNA)擴(kuò)增特定的目標(biāo)靶多核苷酸(如DNA),例如使用與獨特區(qū)域 雜交的PCR引物,所述獨特區(qū)域側(cè)翼于在天然DNA內(nèi)存在的目標(biāo)串聯(lián)重復(fù)區(qū)域。當(dāng)所述靶多核苷酸是RNA分子時,通常通過轉(zhuǎn)錄由適合的DNA模板產(chǎn)生。例如,靶 RNA可通過DNA分子的體外轉(zhuǎn)錄產(chǎn)生,其中所述DNA分子包含位于待分析基因座上游的啟 動子。適合用于產(chǎn)生靶RNA的RNA聚合酶包括SP6和T7 RNA聚合酶。因此,例如,可使用 PCR從天然DNA擴(kuò)增DNA,其中引物之一包含RNA聚合酶的識別位點。在存在RNA聚合酶和 適合的核苷酸的條件下,可產(chǎn)生單鏈RNA。在優(yōu)選的實施方式中,所述方法包括在步驟(a)后或同時進(jìn)行的另外的步驟(al)使阻斷寡核苷酸與步驟(a)中提供的靶多核苷酸中的至少一個但并非全部串聯(lián)重復(fù)雜交,從而使所述靶多核苷酸中的一個或多個串聯(lián)重復(fù)在與阻斷寡核苷酸雜交后 保持單鏈的形式。在一個實施方式中,在步驟(al)中,將兩個或更多個阻斷寡核苷酸與步驟(a)中 提供的靶多核苷酸中的至少一個但并非全部串聯(lián)重復(fù)雜交,從而使所述靶多核苷酸中的一 個或多個串聯(lián)重復(fù)在與阻斷寡核苷酸雜交后保持單鏈的形式。應(yīng)理解,通過使用一個或多個阻斷寡核苷酸,可限制樣品中靶寡核苷酸內(nèi)存在的 單鏈形式串聯(lián)重復(fù)的數(shù)目。例如,如果靶多核苷酸(在沒有阻斷寡核苷酸時)在靶多核苷 酸內(nèi)包含12個單鏈形式的串聯(lián)重復(fù),而阻斷寡核苷酸能夠與其中3個雜交(因為其包含與 3個串聯(lián)重復(fù)互補(bǔ)的多核苷酸部分),那么在存在阻斷寡核苷酸的條件下,在樣品中靶多核 苷酸存在的單鏈形式重復(fù)的數(shù)目是9。通常,一個或多個阻斷寡核苷酸與靶DNA單鏈部分中的至少兩個串聯(lián)重復(fù)雜交, 例如3或4或5或6或7或8或9或10或20或30或40個。通過可存在于待分析的具體 基因座的串聯(lián)重復(fù)的可能數(shù)目確定阻斷寡核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目。通常,阻斷寡核苷酸 與存在于靶DNA單鏈部分的串聯(lián)重復(fù)中的至少8個核苷酸(或至少12個,或至少16個,或 至少20個核苷酸)互補(bǔ)。利用現(xiàn)有技術(shù)能夠合成長達(dá)250個核苷酸單元的寡核苷酸,而預(yù) 期在未來能夠合成更長的寡核苷酸。優(yōu)選阻斷寡核苷酸(沿其長度與靶DNA中的單鏈DNA互補(bǔ)時)的長度為12-150 個核苷酸,例如12-120,12-100或12-90個核苷酸。當(dāng)阻斷寡核苷酸具有如下文所述的其 他功能時,寡核苷酸可更長,例如20-180個核苷酸,通常其長度為30-150個核苷酸,例如 30-120,30-100或30-80個核苷酸的長度。所述一個或多個阻斷寡核苷酸無需是串聯(lián)重復(fù)中堿基的整數(shù)倍。實際上,它們可 包括部分重復(fù),這樣阻斷寡核苷酸以“偏置(off-set)”的方式與串聯(lián)重復(fù)結(jié)合。在使用兩個或更多個阻斷寡核苷酸時,特別優(yōu)選使用“偏置”型阻斷寡核苷酸,而 且此類“偏置”型阻斷寡核苷酸也可用于例如以下情況中。在存在7個重復(fù)的阻斷劑的條件下分析包含類型8、10個重復(fù)的樣品時,表現(xiàn)出1 和3個重復(fù)單元的組合供探針與之雜交。然而,這似乎與存在10個重復(fù)的阻斷劑的條件下 分析包含11、13個重復(fù)的樣品時獲得的結(jié)果類似。因此,當(dāng)兩種阻斷劑同時存在時,將難以 確定樣品中存在哪種重復(fù)組合。在上述實例中,如果使用10. 2個重復(fù)的阻斷劑(其中".2"代表下一個重復(fù)的最 開始的兩個堿基)代替10個重復(fù)的阻斷劑,那么包含11、13個重復(fù)的樣品將僅具有供雜交 的0. 2和2. 2個重復(fù)序列,這將導(dǎo)致解鏈峰移動。因此,偏置型阻斷方法在解鏈峰可能重疊 的情況下特別有用。例如,偏置型阻斷方法可用于將多至4個阻斷劑與4個堿基重復(fù)序列 組合(通過使用由添加1個堿基而具有長度偏移的大小增加的阻斷劑),或用于5個堿基重 復(fù)的5個阻斷劑,以此類推。這樣,阻斷寡核苷酸可被“重疊”以提供“完全在同一試管中進(jìn)行”的測定法,其可 用于區(qū)分相同樣品內(nèi)不同數(shù)目的重復(fù)。通常選擇具有部分重復(fù)的可重疊的偏置型阻斷寡核 苷酸,這樣在(串聯(lián)重復(fù)數(shù)目中的)各個不同長度變體之間具有至少0.5°C的解鏈峰Tm差 異。通常,通過使用不同的偏置型阻斷寡核苷酸,可以在單個PCR中分析可能包含串聯(lián)重復(fù) 數(shù)目不同的多個等位基因的單個可變基因座。此實施方案在實施例12中更詳細(xì)地被描述。
為了避免爭議,可通過使用能夠與y串聯(lián)重復(fù)雜交的一個或多個阻斷寡核苷酸, 將包含單鏈形式的X串聯(lián)重復(fù)的本發(fā)明的靶DNA轉(zhuǎn)化成包含單鏈形式的(X-y)串聯(lián)重復(fù)的 本發(fā)明的靶DNA。通常,在靶多核苷酸中有單鏈形式的2或3或4或5或6或7或8或9或10或11 或12或13或14或15個串聯(lián)重復(fù)。優(yōu)選其在2-10個之間,更優(yōu)選4-8個之間。靶多核苷 酸中單鏈形式的這些串聯(lián)重復(fù)的通常數(shù)目可在阻斷寡核苷酸存在或不存在下獲得。包含串 聯(lián)重復(fù)的靶多核苷酸的單鏈部分通常包含至少8個,優(yōu)選至少12個,更優(yōu)選至少16或至少 20個核苷酸。眾所周知,多態(tài)性的常見類型涉及在具體基因座的串聯(lián)重復(fù)的數(shù)目,其可發(fā)生顯 著的變化。應(yīng)理解,本發(fā)明的方法是用于測定串聯(lián)重復(fù)的數(shù)目,并且優(yōu)選在任何給定的測定 中,小范圍的串聯(lián)重復(fù)是單鏈形式。因此,為了確定可能存在于具體基因座的串聯(lián)重復(fù)的數(shù) 目,有必要進(jìn)行不使用阻斷寡核苷酸的方法,并且進(jìn)行分別使用一個或多個阻斷寡核苷酸 的方法,其中所述阻斷寡核苷酸能夠與不同數(shù)目的串聯(lián)重復(fù)雜交。這樣,對于已知具有串聯(lián) 重復(fù)數(shù)目不同的多個等位基因的任何給定基因座,可產(chǎn)生具有類似大小的單鏈部分的靶多 核苷酸(例如,單鏈形式的重復(fù)的數(shù)目的可變性降低)。應(yīng)理解,可以使用多于一個的阻斷 寡核苷酸,只要在與所述阻斷寡核苷酸雜交后,在靶多核苷酸中保留單鏈形式的一個或多 個串聯(lián)重復(fù)。在串聯(lián)重復(fù)序列具有多態(tài)性(例如STR THOl或?qū)嵤├?2中描述的STR)的一個 實施方式中,可期望阻斷寡核苷酸阻斷具有可變性的區(qū)域,從而使單鏈形式的靶多核苷酸 僅包含相同的重復(fù)。例如,如實施例12所述,用于STRD8S1179的阻斷寡核苷酸僅留下可與 探針寡核苷酸雜交的TCTA重復(fù)。優(yōu)選地,除非按照上文使用偏置型阻斷劑,優(yōu)選通過阻斷劑生成在與阻斷寡核苷 酸雜交后包含保持單鏈形式的一個或多個串聯(lián)重復(fù)的不同靶多核苷酸,從而避免不同的等 位基因具有相同的Tm。如下文詳述,所述阻斷寡核苷酸也可以是用于生產(chǎn)靶多核苷酸的寡核苷酸,其中 所述靶多核苷酸中的一個或多個串聯(lián)重復(fù)是單鏈形式,例如作為PCR反應(yīng)中使用的引物部 分。步驟(b)中的經(jīng)標(biāo)記的探針寡核苷酸可以是任何適合的探針寡核苷酸。所述探針 寡核苷酸通常與至少2個或3個或4個或5個或6個或7個或8個串聯(lián)重復(fù)互補(bǔ),這可基 于待分析的基因座而確定。優(yōu)選探針寡核苷酸與4-10個串聯(lián)重復(fù)互補(bǔ),不過對于雙核苷酸 重復(fù),可優(yōu)選探針寡核苷酸與至少5個或6個串聯(lián)重復(fù)互補(bǔ)。通常,探針寡核苷酸中5-40 個核苷酸部分與靶多核苷酸中單鏈形式的串聯(lián)重復(fù)互補(bǔ)。探針寡核苷酸通常與靶多核苷酸 內(nèi)以單鏈部分存在的串聯(lián)重復(fù)中的至少8個核苷酸互補(bǔ)更優(yōu)選其與存在的串聯(lián)重復(fù)中的 至少10個、12個、15個或20個核苷酸互補(bǔ)。如下文詳述,優(yōu)選寡核苷酸探針能夠與單鏈靶多核苷酸結(jié)合,且其Tm在 400C -70°C的范圍。在優(yōu)選的實施方式中,所述寡核苷酸探針是熒光標(biāo)記的。其可包含單個熒光標(biāo)記 物,或者可包含多個熒光標(biāo)記物。所述熒光標(biāo)記物通常與內(nèi)部殘基相連。寡核苷酸通常具有2或3或4或5或6或7或8或9或10個由熒光團(tuán)標(biāo)記的內(nèi)
12部殘基。其數(shù)目可取決于寡核苷酸的長度。通常使用熒光團(tuán)標(biāo)記約三分之一的內(nèi)部殘基, 但更少的標(biāo)記也是可以的。優(yōu)選本發(fā)明的探針寡核苷酸的長度適合與靶多核苷酸的單鏈部分雜交,從而提供 穩(wěn)定的雜交體,此雜交體的解鏈溫度取決于靶的精確序列以及靶單鏈部分內(nèi)串聯(lián)重復(fù)的數(shù) 目,但通常在40°C至70°C的范圍內(nèi)。在很多情況下,包含小于15個核苷酸殘基的寡核苷酸 不形成足夠穩(wěn)定的雜交體,特別是在兩條雜交序列不完全地互補(bǔ)的情形下,不過它們可以 在某些情況下使用。長度大于約40個核苷酸殘基的寡核苷酸可形成雜交體,其解鏈溫度對 于可能存在的單核苷酸錯配相對較不敏感,不過它們可以在某些情況下使用。對于具有長 度多態(tài)性的靶,長寡核苷酸探針與長重復(fù)序列的雜交產(chǎn)生的Tm的差異小。如下文詳述,使 用與靶多核苷酸中大于約30-40個的核苷酸雜交的寡核苷酸探針通常需要使用高度敏感 的方法進(jìn)行解鏈曲線和解鏈峰的分析。探針寡核苷酸的長度通常為10-60個核苷酸殘基,優(yōu)選長度為15-50個核苷酸殘 基,更優(yōu)選長度為15-40個核苷酸殘基。因此,寡核苷酸的長度為從10或11或12或13或 14或15個核苷酸殘基至(并包括)35或36或37或38或39或40或45個核苷酸殘基。 因此,本發(fā)明包括大小在上述任意范圍內(nèi)的探針寡核苷酸的應(yīng)用。長度范圍在15-60個核苷酸的寡核苷酸可以是單個標(biāo)記的,或者具有至多約14個 (對于60mer的寡核苷酸)由熒光團(tuán)標(biāo)記的內(nèi)部核苷酸殘基,但長度在此范圍內(nèi)的寡核苷酸 通常具有2或3或4或5或6個由熒光團(tuán)標(biāo)記的內(nèi)部殘基。通常在非末端熒光標(biāo)記的核苷 酸之間有大約3個堿基。核苷酸堿基通常衍生自天然存在的核苷A、C、G、T和U。然而,可在用于本發(fā)明的 探針寡核苷酸的一個或多個位點使用核苷酸類似物,例如核苷酸類似物在堿基部分和/或 糖部分和/或磷酸連接處被修飾。堿基修飾如丙炔基dU(dT-類似物)和2-氨基dA(dA類 似物)通常改變雜交性質(zhì),并可使得具有小于15個核苷酸殘基的寡核苷酸的應(yīng)用更具吸引 力。對于包含丙炔基dU的寡核苷酸的情況,其長度為約10個殘基,這取決于與所需靶序列 的解鏈溫度。也可使用如N4-乙基-dC(dC類似物)的堿基修飾使長寡核苷酸探針去穩(wěn)定, 從而增大在與長靶序列的解鏈溫度上的差異。因此,在一些實施方式中,可使用堿基修飾獲 得適合的Tm變化?;蛘?,也可以使用包含肽核酸(PNA)、鎖核酸(LNA)、2’ _0_甲基RNA、亞磷酰胺 DNA、硫代磷酸酯DNA、甲基膦酸酯DNA或磷酸三酯DNA的寡核苷酸,或者由肽核酸(PNA)、鎖 核酸(LNA)、2 ‘ -0-甲基RNA、亞磷酰胺DNA、硫代磷酸酯DNA、甲基膦酸酯DNA或磷酸三酯 DNA組成的寡核苷酸,以形成化學(xué)或酶促更穩(wěn)定的與靶序列的相互作用。優(yōu)選在用于本發(fā)明的探針核苷酸中使用同一熒光團(tuán)。然而,在寡核苷酸被復(fù)用時, 在該同一寡核苷酸中使用兩種或多種不同熒光團(tuán)可能特別有利。例如,可在不同探針上使 用譜性不同的熒光團(tuán),從而在單個反應(yīng)管中同時分析多個STR等位基因。只要不阻止寡核 苷酸與其靶序列的雜交,可使用能夠與核苷酸殘基相連的任何熒光團(tuán)。(也可以通過使用長 度不同的寡核苷酸探針,并使用或不使用不同的阻斷寡核苷酸來增強(qiáng)多倍分析,特別是對 于極長STR等位基因)。適合的熒光團(tuán)包括基于熒光素的熒光團(tuán),例如FAM(6_羧基熒光素)、TET(四 氯熒光素)、HEX(六氯熒光素);基于羅丹明的熒光團(tuán),例如ROX(6-羧基-X-羅丹明)和TAMRA(6-羧基四甲基羅丹明);Cy類染料,特別是Cy3和Cy5,上述均可得自于Glen Research,22825 Davis Drive, Sterling, VA 20164,USA。也可使用其他熒光素染料,例如具有不同發(fā)射譜的那些,例如NED和JOE。也可使 用其他熒光團(tuán),例如Alexa、Atto、Dyomics、Dyomics Megastokes和Thilyte染料類中的那 些,詳見下表14-20。在本發(fā)明優(yōu)選的實施方式中,分別使用C6 FAM dU(可得自于Universityof Southampton, UK)或熒光素dT(可得自于Glen Research, Sterling, VA)標(biāo)記探針寡核苷 酸內(nèi)部尿嘧啶/胸腺嘧啶堿基的5-位(在本文中,dT和dU的結(jié)構(gòu)相同,因此這兩個術(shù)語可 互換)??蓪MOC-保護(hù)的亞磷酰胺加入寡核苷酸的內(nèi)部T位點,并可將其用作各種熒光染 料的連接位點,所述熒光染料包括但不限于FAM、ΤΕΤ、HEX、ROX, TAMRA, Cy3和Cy5,上述所 有染料均由Glen Research獲得。在合成寡核苷酸后,可從2 ‘-保護(hù)的尿苷除去FMOC基 團(tuán),并且將熒光亞磷酰胺,例如適當(dāng)保護(hù)的6-羧酸熒光素亞磷酰胺偶聯(lián)到游離的2'-羥基 基團(tuán)。在另一個實施方式中,可在內(nèi)部的A、C或G位點標(biāo)記寡核苷酸,其中在固相寡核苷酸 合成期間加入作為亞磷酰胺的標(biāo)記核苷酸,或者在合成寡核苷酸后使用受保護(hù)的亞磷酰胺 (例如,8-氨基烷基-dA、7-氨基烷基7-脫氮-dA、N(4)_氨基烷基dC和5-氨基烷基_dC) 來連接熒光團(tuán)。特別優(yōu)選的標(biāo)記探針寡核苷酸為wo 01/73118公開的HyBeacon 探針,或者如 WO 2007/010268公開的寡核苷酸探針。應(yīng)理解,在另一個實施方式中,可使用淬滅分子標(biāo)記探針寡核苷酸,并且靶多核苷 酸包含熒光分子,當(dāng)探針寡核苷酸與靶多核苷酸結(jié)合時,所述熒光分子的熒光被淬滅?;?者,可使用熒光分子標(biāo)記探針寡核苷酸,并且靶多核苷酸包含淬滅分子,當(dāng)探針寡核苷酸與 靶多核苷酸結(jié)合時,所述淬滅分子使探針寡核苷酸上熒光分子的熒光淬滅。在另一個實施 方式中,可使用熒光團(tuán)和淬滅部分標(biāo)記探針和阻斷寡核苷酸,以在與相鄰靶序列雜交(或 分離)后增強(qiáng)/淬滅熒光發(fā)射。在另一個實施方案中,使用一個熒光團(tuán)標(biāo)記探針寡核苷酸,且靶多核苷酸包含另 一個熒光團(tuán),這樣在探針寡核苷酸與靶多核苷酸結(jié)合時有能夠被測量的熒光共振能量轉(zhuǎn)移 (FRET)。在另一個實施方式中,可使用供體和受體熒光團(tuán)標(biāo)記探針和阻斷寡核苷酸,以在與 相鄰靶序列雜交后促進(jìn)FRET。在使用步驟(al)并且由此使用一個或多個阻斷寡核苷酸的本發(fā)明的方法的實施 方式中,如果阻斷寡核苷酸包含熒光團(tuán)且探針寡核苷酸包含淬滅劑,則是方便的,反之亦 然。適合的熒光團(tuán)/淬滅劑對在本領(lǐng)域是眾所周知的。類似地,如果使用能夠相互參與FRET 的熒光團(tuán)來標(biāo)記探針寡核苷酸和阻斷寡核苷酸,則是方便的。適合的熒光團(tuán)對在本領(lǐng)域是 也公知的。應(yīng)理解,當(dāng)攜帶熒光團(tuán)的一條或多條寡核苷酸以某種構(gòu)型雜交時,能夠參與FRET 的兩個熒光團(tuán)應(yīng)當(dāng)在適合發(fā)生FRET的距離之內(nèi),以指示特定的期望結(jié)果。類似地,熒光團(tuán) 和淬滅劑應(yīng)當(dāng)在適合發(fā)生淬滅的距離之內(nèi),當(dāng)淬滅發(fā)生時指示特定的期望結(jié)果。在阻斷寡 核苷酸包含淬滅劑且探針寡核苷酸包含熒光團(tuán)的實施方式中(或者阻斷寡核苷酸和探針 寡核苷酸分別包含能夠進(jìn)行FRET的熒光團(tuán)的實施方式中),所述阻斷寡核苷酸和探針寡核 苷酸相鄰地與串聯(lián)重復(fù)雜交,從而使熒光團(tuán)/淬滅劑(或熒光團(tuán)/熒光團(tuán))對彼此相鄰。
14
應(yīng)理解,在優(yōu)選的實施方式中,在與適當(dāng)標(biāo)記的阻斷寡核苷酸結(jié)合后,標(biāo)記物(例 如,淬滅分子或熒光分子)可與靶多核苷酸結(jié)合并成為靶多核苷酸的一部分。在優(yōu)選的實施方式中,探針寡核苷酸與靶多核苷酸的單鏈部分中的至少一個串聯(lián) 重復(fù)完全地互補(bǔ)。換句話說,在靶多核苷酸的單鏈部分與探針寡核苷酸之間的整個雜交區(qū)域上存在 Watson-Crick堿基配對。然而,應(yīng)理解,可存在某些錯配或非Watson-Crick堿基配對,但探 針仍然能夠雜交。在這種情況下,探針寡核苷酸與單鏈靶多核苷酸部分地互補(bǔ)。在一些情 況下,可能期望探針寡核苷酸與靶多核苷酸的單鏈部分部分地互補(bǔ),這是因為錯配能夠降 低寡核苷酸-靶雜交體的Tm,從而在一定程度上控制Tm(以及Δ Tm,即取決于與探針寡核 苷酸雜交的串聯(lián)重復(fù)的數(shù)目而出現(xiàn)的Tm差異)。與此類似,阻斷寡核苷酸可以與單鏈靶多核苷酸完全地互補(bǔ)(優(yōu)選),或部分地互 補(bǔ)(次優(yōu)選)。在另一個優(yōu)選實施方式中,靶多核苷酸內(nèi)的串聯(lián)重復(fù)由一個或兩個單鏈區(qū)域側(cè) 翼。在這種情況下,阻斷寡核苷酸(如果使用)或探針寡核苷酸或這二者(如果靶多核苷 酸內(nèi)的兩個側(cè)翼區(qū)域均為單鏈)可包含與串聯(lián)重復(fù)側(cè)翼區(qū)域互補(bǔ)的錨定部分。應(yīng)理解,如 果所使用的阻斷寡核苷酸和探針寡核苷酸均包含錨定部分,那么寡核苷酸之一中的錨定部 分將與一個側(cè)翼區(qū)域互補(bǔ),而另一條寡核苷酸內(nèi)的錨定部分將與另一個側(cè)翼區(qū)域互補(bǔ)。阻斷寡核苷酸或探針寡核苷酸的錨定部分可包含3-40個核苷酸;通常為4-30個 核苷酸,例如4-20個核苷酸。對于探針寡核苷酸,錨定部分通常為5-10個核苷酸。錨定部 分通常與側(cè)翼區(qū)域完全地互補(bǔ)。應(yīng)理解,阻斷寡核苷酸(如果使用)和探針寡核苷酸的錨 定部分的大小和組成可影響阻斷寡核苷酸和探針寡核苷酸的Tm,因此通過改變探針寡核苷 酸錨定區(qū)域,可以在一定程度上控制Tm(和ΔΤπι)。此外,還應(yīng)理解,錨定區(qū)域可用于減少或防止“滑移”(即,其錨定寡核苷酸與側(cè)翼 區(qū)域的雜交)。這可以改進(jìn)寡核苷酸與靶多核苷酸雜交的選擇性,并且改進(jìn)與寡核苷酸(特 別是探針寡核苷酸)結(jié)合的不同數(shù)目的串聯(lián)重復(fù)之間的差異。在優(yōu)選的實施方式中,同時進(jìn)行此方法的步驟(a)和(al)。因此,在此實施方式 中,在提供包含靶多核苷酸的樣品的同時提供一條或多條阻斷寡核苷酸,這樣在一條或多 條阻斷寡核苷酸的存在下,樣品中的靶多核苷酸包含被一條或多條阻斷寡核苷酸阻斷的一 些串聯(lián)重復(fù),以及有(保持)單鏈形式的一些串聯(lián)重復(fù),從而可以自由地與探針寡核苷酸雜 交。在一個實施方式中,阻斷寡核苷酸與靶多核苷酸分離(即沒有共價結(jié)合)。在一個實施 方式中,在圖6中以圖示的方式例示了此實施方式。至少在靶多核苷酸的產(chǎn)生和阻斷方面, 可將其視為雙分子反應(yīng)。在特別優(yōu)選的實施方式中,PCR產(chǎn)生靶DNA,其中所述靶DNA內(nèi)的一個或多個串聯(lián) 重復(fù)為單鏈形式,并且在PCR中使用的引物也包含阻斷寡核苷酸。在一個實施方式中,在圖 8中以圖示的方式例示了此實施方式。至少在靶多核苷酸的產(chǎn)生和阻斷方面,可將其視為單 分子反應(yīng)。優(yōu)選還包含阻斷寡核苷酸的PCR引物不具有基本自身互補(bǔ)的任何區(qū)域。在優(yōu)選的實施方式中,在PCR中使用的引物(此引物還包含阻斷寡核苷酸)在其 3'端包含與靶DNA中待分析的串聯(lián)重復(fù)的3'端區(qū)域互補(bǔ)的部分,并且在其5'端包含與 通過所述引物合成的PCR產(chǎn)物的鏈中至少一個串聯(lián)重復(fù)互補(bǔ)的部分。因此,此引物是在PCR反應(yīng)中產(chǎn)生DNA鏈的引物,其中所述DNA鏈包含靶DNA中的串聯(lián)重復(fù)。因為此引物還包含與 一個或多個這些串聯(lián)重復(fù)互補(bǔ)的部分,所以其由引物的5'部分(在此實施方式中,其還是 阻斷寡核苷酸)與通過在PCR中使用此引物合成的一個或多個串聯(lián)重復(fù)之間的分子內(nèi)雜交 形成發(fā)卡結(jié)構(gòu)。引物的5'部分不與引物或寡核苷酸探針的任何部分互補(bǔ),并且在通過PCR 擴(kuò)增靶序列之前不參與雜交。應(yīng)理解,如果引物在其5'端包含與y串聯(lián)重復(fù)互補(bǔ)的部分, y將被阻斷。如果在PCR擴(kuò)增的位點存在χ串聯(lián)重復(fù),那么在所產(chǎn)生的單鏈形式的靶DNA中 將存在x_y串聯(lián)重復(fù)。在本發(fā)明的此實施方式中,特別優(yōu)選引物從3'向5'方向包含(i)與靶DNA內(nèi) 串聯(lián)重復(fù)3'端區(qū)域互補(bǔ)的部分,(ii)任選的間隔子部分,(iii)與通過所述引物合成的 PCR產(chǎn)物的鏈中的側(cè)翼區(qū)域互補(bǔ)的錨定部分,和(iv)與通過所述引物合成的PCR產(chǎn)物的鏈 中的至少一個串聯(lián)重復(fù)互補(bǔ)的部分。在另一個實施方式中,此引物進(jìn)一步包含(ν)與探針寡核苷酸3'端的鉗部分互 補(bǔ)的鉗部分。所述鉗部分位于(iv)(與通過所述引物合成的PCR產(chǎn)物的鏈中的至少一個串 聯(lián)重復(fù)互補(bǔ)的部分)的5'端。在另一個實施方式中,使用至少兩對不同的PCR引物和探針寡核苷酸,其中每對 阻斷寡核苷酸和探針寡核苷酸各自的鉗部分彼此互補(bǔ)。優(yōu)選地,選擇鉗部分的核苷酸序列, 以使每對互補(bǔ)的鉗部分具有不同的Tm。不同Tm之間的差別通常為至少0. 5°C。在PCR引物包含鉗部分的實施方式中,所述鉗部分具有如下文詳述的阻斷寡核苷 酸的鉗部分的性質(zhì)。
圖15中以圖示的方式例示此實施方式。特別優(yōu)選使用不對稱PCR增強(qiáng)阻斷劑和探針與合成的靶的雜交。例如,與可在PCR 中以有限濃度使用的其他引物相比,單分子阻斷寡核苷酸/引物以過量的濃度存在,使得 在PCR中早早地耗盡其他引物,從而產(chǎn)生單鏈DNA靶。圖8中以圖示的方式顯示了此實施方式的實例(在此實施方式中,PCR引物和探 針寡核苷酸不包含鉗部分)。在不同的實施方式中,PCR中使用的引物(此引物還包含阻斷寡核苷酸)還包含探 針寡核苷酸。圖16中以圖示的方式例示此實施方式。通常在探針寡核苷酸和阻斷寡核苷 酸之間還存在間隔子部分。因此,在典型的實施方式中,所述引物從3響5'方向包含(i) 與靶DNA內(nèi)串聯(lián)重復(fù)的3'端區(qū)域互補(bǔ)的部分,(ii)任選的間隔子部分,(iii)與通過所述 引物合成的PCR產(chǎn)物的鏈中的側(cè)翼區(qū)域互補(bǔ)的錨定部分,(iv)與通過所述引物合成的PCR 產(chǎn)物的鏈中的至少一個串聯(lián)重復(fù)互補(bǔ)的部分,(ν)第二間隔子部分,和(vi)探針寡核苷酸。 探針寡核苷酸(vi)包含在PCR引物中,并可被視為探針部分。其通常具有熒光標(biāo)記,并且 與通過所述引物合成的PCR產(chǎn)物的鏈中的至少一個串聯(lián)重復(fù)互補(bǔ)。與靶DNA內(nèi)串聯(lián)重復(fù)的 3'端區(qū)域互補(bǔ)的引物部分能夠在例如PCR條件下,與串聯(lián)重復(fù)的3'端雜交。通常,此引物 部分包含與3'側(cè)翼區(qū)域互補(bǔ)的10-30個核苷酸,例如15-30或15-20個核苷酸。優(yōu)選其包 含18-25個核苷酸。3'側(cè)翼區(qū)域通常位于靶序列3'端的1-200個核苷酸。優(yōu)選此部分與靶DNA內(nèi)串聯(lián)重復(fù)的3'端區(qū)域完全地互補(bǔ);不過其可以是部分互 補(bǔ)的,只要其能夠雜交并參與PCR。引物的3'端自由參與鏈延伸反應(yīng),并且因此包含3' OH 基團(tuán)。引物還可包含“通用”堿基,例如5-硝基吲哚和肌苷,從而“中和”在人群中鑒定的已知單核苷酸多態(tài)性。間隔子部分(ii)是任選的。當(dāng)存在時,其可包含任何適合的間隔子,其含義包括 占據(jù)約1-20個核苷酸殘基的長度,但不參與堿基配對的化學(xué)單元。所述間隔子通??梢允?六甘醇(HEG)或四甘醇(TEG)基團(tuán)。在另一個實施方式中,所述間隔子可以是一個或多個 無堿基殘基。無堿基殘基保留核苷酸殘基的間隔,但不參與堿基配對(因為沒有堿基)。在 另一個實施方式中,存在核苷酸殘基,但這些殘基與靶鏈中的核苷酸殘基錯配,因此不參與 堿基配對。所述間隔子通常占據(jù)約1、2、3、4或5個核苷酸殘基的長度。在探針寡核苷酸包含在PCR引物中(圖16)的實施方式中,探針寡核苷酸和阻斷 寡核苷酸之間的間隔子(ν)通常具有以下性質(zhì)。其充當(dāng)允許探針寡核苷酸與阻斷寡核苷酸 獨立雜交的物理間隔子,而沒有對穩(wěn)定性和探針Tm的累計作用。適合地,使用如碳水化合 物或肽聚合物的簡單線性分子,從而具有最小的三維轉(zhuǎn)動限制,并且長度足以在空間中完 成環(huán)形結(jié)構(gòu)(這樣其末端能夠返回到非常接近)。優(yōu)選間隔子不具有對核酸的內(nèi)在親和力, 并且不與核酸結(jié)合。優(yōu)選間隔子對靶序列的雜交過程保持中立。顯然,間隔子必須能夠與 阻斷寡核苷酸和探針寡核苷酸化學(xué)結(jié)合。引物中與通過所述引物合成的PCR產(chǎn)物的鏈中的側(cè)翼區(qū)域互補(bǔ)的錨定部分可包 含5-25個核苷酸,通常為5-20個核苷酸,例如10-20個核苷酸。這可以隨側(cè)翼區(qū)域的序列 組成而改變。方便地,引物的錨定部分具有的Tm高于探針寡核苷酸錨定部分。錨定部分通 常與側(cè)翼區(qū)域完全地互補(bǔ)。與通過所述引物合成的PCR產(chǎn)物的鏈中的至少一個串聯(lián)重復(fù)互補(bǔ)的部分(其是 引物的一部分)通常與至少一個,或兩個,或三個,或四個或五個串聯(lián)重復(fù)互補(bǔ)。其通常與 2-20個之間,例如4-8個串聯(lián)重復(fù)互補(bǔ)。優(yōu)選此部分與串聯(lián)重復(fù)完全地互補(bǔ),但也可部分地 互補(bǔ),只要其仍能夠與通過所述弓I物合成的PCR產(chǎn)物內(nèi)的串聯(lián)重復(fù)雜交。上述間隔子部分也可存在于探針寡核苷酸內(nèi)或阻斷寡核苷酸內(nèi)。在這些情況下, 優(yōu)選所述間隔子的長度約為1或2或3或4或5個或更多個核苷酸。應(yīng)理解,在阻斷寡核苷酸不是PCR引物一部分的實施方式中,優(yōu)選其3'端不包含 OH基團(tuán)。這樣使其不能參與鏈延伸反應(yīng)。因此,通常使用例如磷酸基團(tuán)或辛二醇封閉其3' 端。類似地,應(yīng)理解,通??善谕结樄押塑账岵话? ‘ -0H,并且通過例如磷酸或 辛二醇封閉以防止鏈延伸。這樣,在使用PCR實施本發(fā)明的方法時,探針寡核苷酸(如果在 PCR期間存在)不會被存在的DNA聚合酶延伸。在另一個實施方式中,阻斷寡核苷酸在其3'(或5')端包含與存在于探針寡核 苷酸5'(或3')端的鉗部分互補(bǔ)的鉗部分。在此實施方式中,當(dāng)阻斷寡核苷酸和探針寡 核苷酸與靶多核苷酸的單鏈部分雜交時,阻斷寡核苷酸的鉗部分與探針寡核苷酸的鉗部分 雜交在一起。在一個具體實施方式
中,圖12中以圖示的方式例示了此實施方式。鉗部分通 常具有3-10個核苷酸,例如4-8個,如6-8個核苷酸。鉗部分通常主要包含G或C殘基;優(yōu) 選大于75%的堿基為G或C。鉗部分的序列優(yōu)選不與STR的任何部分互補(bǔ)。方便地,鉗部 分對熱穩(wěn)定性貢獻(xiàn)10°C到30°C,通常確保探針與正確的序列雜交并且防止滑移。鉗部分的 Tm不應(yīng)將探針寡核苷酸的Tm提高到阻止區(qū)分相似長度的靶重復(fù)的程度。在一個實施方式中,探針寡核苷酸的鉗部分包含熒光標(biāo)記物,且阻斷寡核苷酸的鉗部分包含淬滅分子(反 之亦然),從而使熒光團(tuán)和淬滅劑在與靶多核苷酸的單鏈部分結(jié)合后發(fā)生相互作用?;蛘撸?探針寡核苷酸和阻斷寡核苷酸的鉗部分均包含熒光團(tuán),從而能夠在與靶多核苷酸雜交后參 與FRET(參見圖17)。在優(yōu)選的實施方式中,使用至少兩對不同的阻斷寡核苷酸和探針寡核苷酸,其中 每對阻斷寡核苷酸和探針寡核苷酸各自的鉗部分彼此互補(bǔ)。通常,不同的阻斷寡核苷酸和 探針寡核苷酸對具有不同的鉗部分。因此,一對可具有表示為Al:Al' (Al和Al'互補(bǔ)) 的鉗部分,而另一對可具有表示為Bl :B1 ‘的鉗部分,等等,其中,例如Al存在于阻斷寡核 苷酸上,而Al'存在于探針寡核苷酸上。通常選擇鉗部分的核苷酸序列,以使每對互補(bǔ)的鉗 部分具有不同的Tm。帶有鉗(clamp)部分的阻斷寡核苷酸和帶有鉗部分的探針寡核苷酸可被視為接 頭寡核苷酸(junction oligonucleotide)。在雙分子形式中,阻斷寡核苷酸通常將包含(i)與緊鄰于串聯(lián)重復(fù)5'或3'端的 側(cè)翼區(qū)域互補(bǔ)的錨定部分,(ii)與所合成的PCR產(chǎn)物中的至少一個串聯(lián)重復(fù)互補(bǔ)的部分, 和(iii)與連接到待使用的探針寡核苷酸5'或3'端的鉗序列互補(bǔ)的富含G/C的短鉗序 列。在單分子模式中,阻斷寡核苷酸/引物從3'至5'通常包含(i)與靶DNA內(nèi)串聯(lián) 重復(fù)的3'端區(qū)域互補(bǔ)的部分,(ii)任選的間隔子部分,(iii)與通過所述引物合成的PCR 產(chǎn)物的鏈中的側(cè)翼區(qū)域互補(bǔ)的錨定部分,(iv)與通過所述引物合成的PCR產(chǎn)物的鏈中的至 少一個串聯(lián)重復(fù)互補(bǔ)的部分,和(ν)與連接至待使用的探針寡核苷酸5'端的鉗序列互補(bǔ) 的富含G/C的短鉗序列??梢苑奖愕貙嵤┍景l(fā)明的方法,其中選擇探針寡核苷酸以使可以根據(jù)其解鏈溫度 (Tm)區(qū)分靶多核苷酸的單鏈部分中的串聯(lián)重復(fù)的數(shù)目。因此,相同的探針寡核苷酸能夠區(qū) 分存在的不同數(shù)目的串聯(lián)重復(fù)。通常,探針寡核苷酸可區(qū)分靶多核苷酸中以單鏈形式存在 的2個、3個和4個串聯(lián)重復(fù),或者3個、4個和5個,或者4個、5個和6個,或者5個、6個 和7個,或者6個、7個和8個,或者7個、8個和9個,或者8個、9個和10個,或者9個、10 個和11個串聯(lián)重復(fù),等等。探針寡核苷酸可以方便地區(qū)分靶多核苷酸中以單鏈形式存在的 2個、3個、4個、5個和6個串聯(lián)重復(fù)。然而,通過使用適合的阻斷寡核苷酸,可以分析帶有 很多種可能的串聯(lián)重復(fù)的STR。優(yōu)選連續(xù)數(shù)目的重復(fù)之間的ΔΤΠ1(即,取決于與探針寡核苷酸雜交的串聯(lián)重復(fù)的 數(shù)目的Tm差異)不小于0. 50C。更優(yōu)選Δ Tm為至少1°C,通常為至少2 V,例如至少3°C。 可通過改變其長度、組成、與單鏈多核苷酸靶的互補(bǔ)程度、錨定部分(如果存在)或鉗部分 (如果存在)來調(diào)整探針寡核苷酸的雜交性質(zhì)。優(yōu)選此方法的雜交步驟(b)在接近由靶多核苷酸的單鏈部分和探針寡核苷酸之 間形成的一個或多個雜合體的一個或多個Tm的指定溫度下進(jìn)行??梢酝ㄟ^參考靶多核苷 酸的單鏈部分中待分析的串聯(lián)重復(fù)的數(shù)目,是否存在單鏈側(cè)翼區(qū)域,以及上述探針寡核苷 酸的形式來選擇預(yù)定的溫度。更優(yōu)選此方法的雜交步驟(b)在包括由靶多核苷酸的單鏈部分和探針寡核苷酸 之間形成的一個或多個雜合體的Tm的一定溫度范圍內(nèi)進(jìn)行。
方便地,所述溫度范圍可以為30°C -75°C。形成的雜交體通常具有在40°C -65°C 范圍內(nèi)的Tm。解鏈峰分析通常應(yīng)用一套算法以平滑數(shù)據(jù)(即除去熒光噪聲),其在ATm較 小時降低區(qū)分等位基因的潛能。通過解鏈峰的Tm確定重復(fù)的數(shù)目。高分辨率解鏈曲線分 析將溫度范圍的低溫區(qū)域和高溫區(qū)域內(nèi)熒光發(fā)射水平進(jìn)行平均,以進(jìn)行背景校正。具有小 Δ Tm的多態(tài)性等位基因更可能通過使用高分辨率解鏈曲線分析來區(qū)分??赏ㄟ^解鏈曲線的 形狀區(qū)分STR等位基因,但確定重復(fù)數(shù)目可能需要一整套互補(bǔ)的長度標(biāo)準(zhǔn)品進(jìn)行比較??色@得具有低熱分辨率限的各種儀器,可將其用于區(qū)分Tm非常接近的分子的解 鏈。例如,來自Idaho Technologies的高分辨率解鏈(HRM)HR-I儀器能夠區(qū)別差別小 于TC,例如0. 5°C,乃至僅差別0. TC的Tm。其他適合的儀器包括LightScarmer (Idaho Technologies)、Light Cycler 480(RocheDiagnostics)禾口 Rotor-Gene 6000 (Corbett Life Sciences),據(jù)報道,其可處理超過1. 0°C的熱分辨率。Corbett聲稱其Rotor-Gene 6000具有0. 02°C的熱分辨率,不過這是基于解鏈曲線,而非解鏈峰。靶多核苷酸可以是包含串聯(lián)重復(fù)的任何靶多核苷酸。靶多核苷酸通常是由待分析 的天然DNA生成的DNA或RNA。天然DNA通常是來自植物、動物或微生物的基因組DNA。如 引言部分所述,在很多基因組中發(fā)現(xiàn)串聯(lián)重復(fù)序列,其分析可用于很多情況。對人和其他哺 乳動物DNA內(nèi)串聯(lián)重復(fù)的分析可用于醫(yī)學(xué)診斷、法醫(yī)學(xué)、親子和親緣關(guān)系測試,以及繪制連 鎖圖。對微生物基因組內(nèi)串聯(lián)重復(fù)的分析可用于疾病控制(例如菌株鑒定)和工業(yè)情況 (例如,鑒定釀酒酵母和面包酵母株)。對食品中DNA內(nèi)串聯(lián)重復(fù)的分析可用于跟蹤食物鏈中的材料,例如所使用的植物 材料的類型等。特別優(yōu)選的天然DNA是人基因組DNA。如上所述,靶DNA通常通過擴(kuò)增反應(yīng),例如 PCR生成。本發(fā)明的第二方面提供了用于確定靶多核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目的系統(tǒng),其中所 述靶多核苷酸內(nèi)一個或多個串聯(lián)重復(fù)為單鏈形式,所述系統(tǒng)包括(a)與靶多核苷酸的單鏈部分中的至少一個串聯(lián)重復(fù)互補(bǔ)的標(biāo)記探針寡核苷酸, 且所述探針寡核苷酸的至少5個核苷酸與靶多核苷酸的單鏈部分中的串聯(lián)重復(fù)互補(bǔ),和(b)與靶多核苷酸中至少一個但并非全部串聯(lián)重復(fù)互補(bǔ)的阻斷寡核苷酸。所述標(biāo)記探針寡核苷酸和阻斷寡核苷酸優(yōu)選具有如本發(fā)明第一方面的方法中所 述的性質(zhì)。方便的系統(tǒng)包括但不限于(1) (a)包含鉗部分的標(biāo)記探針寡核苷酸,和(b)包含互補(bǔ)鉗部分的阻斷寡核苷 酸;(2) (a)標(biāo)記探針寡核苷酸,和(b)包含上述阻斷寡核苷酸的PCR引物;(3) (a)包含鉗部分的標(biāo)記探針寡核苷酸,和(b)包含上述阻斷寡核苷酸和鉗部分 的PCR引物;和(4)包含上述阻斷寡核苷酸和探針寡核苷酸的PCR引物??蓪⒋讼到y(tǒng)視為包含兩條寡核苷酸(或者在某些實施方式中為一條寡核苷酸)的 “組分試劑盒”。方便地,此試劑盒也可包含用于從天然存在的DNA分子產(chǎn)生靶多核苷酸的PCR成分。此試劑盒還可包含用于檢測探針寡核苷酸與靶多核苷酸的雜交的方法。本發(fā)明的第三方面提供了寡核苷酸,其包含含有與錨定部分結(jié)合的至少兩個串聯(lián) 重復(fù)的部分,其中所述錨定部分的序列和所述至少兩個串聯(lián)重復(fù)在靶多核苷酸中連續(xù)地存 在。優(yōu)選所述寡核苷酸是標(biāo)記的。優(yōu)選寡核苷酸的標(biāo)記如上所述。在本文第三方面, 靶DNA通常是全部或部分的人STR及其側(cè)翼區(qū)域。優(yōu)選所述靶DNA是表21所示任何STR 和側(cè)翼區(qū)域的全部或部分。優(yōu)選所述錨定部分具有與上述阻斷寡核苷酸或探針寡核苷酸的優(yōu)選性質(zhì)相同的 性質(zhì)。優(yōu)選本發(fā)明此方面的寡核苷酸還包含間隔子部分。優(yōu)選所述間隔子部分具有上述 間隔子部分的性質(zhì)。本發(fā)明的第四方面提供了參與PCR反應(yīng)以擴(kuò)增包含串聯(lián)重復(fù)的靶DNA的寡核苷酸 引物,所述引物從3'向5'方向包含(i)與靶DNA內(nèi)串聯(lián)重復(fù)的3'端區(qū)域互補(bǔ)的部分, ( )任選的間隔子部分,(iii)與通過所述引物合成的PCR產(chǎn)物的鏈中的側(cè)翼部分互補(bǔ)的 錨定部分,和(iv)與通過所述引物合成的PCR產(chǎn)物的鏈中的至少一個串聯(lián)重復(fù)互補(bǔ)的部 分。任選地,所述寡核苷酸還進(jìn)一步包含(V)鉗部分。此寡核苷酸可用于上述本發(fā)明 的適合的實施方式中。任選地,在不同的實施方式中,寡核苷酸可進(jìn)一步包含(ν)間隔子部分和(Vi)探 針寡核苷酸。此寡核苷酸可用于上述本發(fā)明的適合的實施方式中。優(yōu)選寡核苷酸引物不具有基本自身互補(bǔ)的任何區(qū)域。錨定部分和阻斷部分(即 (iv)部分)在靶DNA合成之前不參與雜交。在本文第四方面,靶DNA優(yōu)選如上述第三方面所述。與此類似,錨定部分和間隔子部分優(yōu)選如上述第三方面所述。本發(fā)明還包括用于測定靶DNA內(nèi)串聯(lián)重復(fù)的數(shù)目的系統(tǒng),所述系統(tǒng)包含本發(fā)明第 三方面和第四方面的寡核苷酸。本發(fā)明還包括用于制備本發(fā)明第三方面的寡核苷酸的方法,所述方法包括(a)選擇包含串聯(lián)重復(fù)的靶DNA,(b)獲得串聯(lián)重復(fù)的序列以及一個或多個側(cè)翼區(qū)域的序列,(c)合成寡核苷酸,該寡核苷酸包含含有與錨定部分結(jié)合的至少兩個串聯(lián)重復(fù)的 部分和任選的在其3'端的鉗部分,其中所述錨定部分的序列和所述至少兩個串聯(lián)重復(fù)在 靶DNA中連續(xù)地存在。本發(fā)明還包括用于制備本發(fā)明第四方面的寡核苷酸的方法,所述方法包括(a)選擇包含串聯(lián)重復(fù)的靶DNA,(b)獲得串聯(lián)重復(fù)的序列以及一個或多個側(cè)翼區(qū)域的序列,(c)合成寡核苷酸,其從3響5'方向包含(i)與靶DNA內(nèi)串聯(lián)重復(fù)的3'端區(qū)域 互補(bǔ)的部分,( )任選的間隔子部分,(iii)與通過所述引物合成的PCR產(chǎn)物的鏈中的側(cè)翼 區(qū)域互補(bǔ)的錨定部分,(iv)與通過所述引物合成的PCR產(chǎn)物的鏈中的至少一個串聯(lián)重復(fù)互 補(bǔ)的部分,和任選的(ν)鉗部分,或任選的(ν)間隔子部分,和(vi)探針寡核苷酸。
20
應(yīng)理解,如果此寡核苷酸是具有阻斷重復(fù)的引物,則優(yōu)選其中存在間隔子,從而能 夠形成用于雜交的莖環(huán)。本發(fā)明這些方面選擇的靶DNA可以是包含串聯(lián)重復(fù)的任何DNA。靶DNA通常是基 因組DNA。優(yōu)選其為哺乳動物基因組DNA,更優(yōu)選人基因組DNA。然而,也可以是來自植物、 酵母或細(xì)菌的DNA。優(yōu)選所述靶DNA含有包括側(cè)翼序列的人STR。更優(yōu)選所述STR是表21中所述之
ο本文引用的所有文獻(xiàn)均并入本說明書中?,F(xiàn)在將參考以下附圖和實施例更詳細(xì)地描述本發(fā)明。圖1 由STRV2寡核苷酸與寡核苷酸靶的雜交產(chǎn)生的解鏈峰。由左向右的各個解 鏈峰分別是由具有5、7、8、10和11個TATC串聯(lián)重復(fù)的靶產(chǎn)生的。圖2 :A) 150nM STRV2寡核苷酸與75nM RC7靶寡核苷酸及75nMRCll靶寡核苷酸的 雜交的解鏈曲線分析。產(chǎn)生Δ Tm為6.6°C的兩個清晰解鏈峰。B)150nM STRV2探針與75ηΜ RClO靶寡核苷酸及75nM RCll靶寡核苷酸的雜交的解鏈曲線分析。產(chǎn)生的寬解鏈峰阻礙了 對等位基因組成的清楚鑒定。C)STRV2探針與RC8和RClO寡核苷酸混合物的雜交產(chǎn)生了 ATm為3. 7°C的兩個清晰解鏈峰。圖3 :A)由STRV3探針與RClOd和RClld靶寡核苷酸的雜交產(chǎn)生的解鏈峰。觀察 到兩個解鏈峰。B)由于沒有錨定序列,HYBSTR探針與RClOe靶寡核苷酸的雜交產(chǎn)生寬且多 噪音的解鏈峰。圖4 從 NCBI 數(shù)據(jù)庫獲得的 D16S539 STR 序列(登錄號 G07925) (SEQ IDNo. :70)。圖5 =A)使用LightCycler儀器和HYBSTR寡核苷酸探針對D16S539序列進(jìn)行的實 時擴(kuò)增和檢測。B)使用11和13個重復(fù)的雜合樣品產(chǎn)生的解鏈峰。C)使用8和13個重復(fù) 的雜合樣品產(chǎn)生的解鏈峰。圖6 =A)使用雙分子阻斷劑策略分析STR靶。STR靶以黑色方格表示;阻斷寡核苷 酸中的重復(fù)以網(wǎng)紋方格表示;熒光探針中的重復(fù)以灰色方格表示。當(dāng)重復(fù)數(shù)目小于15時, 阻斷劑的長錨定部分以及所使用的摩爾過量(相對于探針)阻止探針與靶完全雜交。B)在 Bl阻斷劑存在下,使用FLl探針與靶寡核苷酸產(chǎn)生的解鏈峰。由左向右的各個解鏈峰分別 是由具有8、9、10、11和12個GATA重復(fù)的靶產(chǎn)生的。C)在沒有Bl阻斷劑時,使用FLl探針 與靶寡核苷酸產(chǎn)生的解鏈峰。由左向右的各個解鏈峰分別是由具有5、6、7、8和9個GATA 重復(fù)的靶產(chǎn)生的。圖7 =A)使用LightCycler儀器、FLl探針和Bl阻斷劑對來自提取DNA和唾液樣 品的STR靶進(jìn)行的實時擴(kuò)增。雙分子Bl阻斷劑降低了 PCR的效率,從而將檢測循環(huán)(Cts) 推遲到約38-40個循環(huán)。省略PCR分析中的阻斷劑獲得約32個循環(huán)的Cts。B)使用9和 12個重復(fù)的等位基因的雜合樣品產(chǎn)生的解鏈峰。圖8 :A)使用單分子阻斷劑/引物策略分析STR靶。STR靶以黑色方格表示;阻斷 寡核苷酸中的重復(fù)以網(wǎng)紋方格表示;熒光探針中的重復(fù)以灰色方格表示。阻斷劑重復(fù)、錨 定序列和正向引物均包含在單個寡核苷酸內(nèi)。阻斷劑和擴(kuò)增的靶序列成為同一 DNA鏈的部 分,因此單分子阻斷劑不會通過妨礙Taq聚合酶的行進(jìn)而抑制PCR。在熱力學(xué)上,阻斷劑與 擴(kuò)增的重復(fù)之間的單分子結(jié)合比探針雜交更為有利,從而在重復(fù)數(shù)目小于15時,阻止探針全長結(jié)合。提供了與具有8和13個重復(fù)的D16S539等位基因的探針雜交的例示。圖9 =A)使用LightCycler儀器、FLl探針和單分子BPl阻斷劑/引物對來自提取 DNA和唾液樣品的STR靶進(jìn)行的實時擴(kuò)增。擴(kuò)增產(chǎn)品的檢測Cts為約32個循環(huán)。B)由左 向右,由11、12和13個重復(fù)的等位基因的純合樣品產(chǎn)生的的解鏈峰。C)使用8和13個重 復(fù)的等位基因的雜合樣品產(chǎn)生的解鏈峰。D)具有9和12個重復(fù)的等位基因的雜合樣品。 D)具有11和13個重復(fù)的等位基因的雜合樣品。D)具有11和12個重復(fù)的等位基因的雜 合樣品。D)具有12和13個重復(fù)的等位基因的雜合樣品。圖10 由FL4探針和BPl阻斷劑產(chǎn)生的解鏈峰。A)提取的具有9和12個重復(fù)的 等位基因的雜合DNA樣品。B)未純化的11/13基因型唾液樣品的直接分析。C)未純化的 8/13基因型唾液樣品的直接分析。D)提取的10/11基因型DNA樣品。E)提取的10/13基 因型DNA樣品。圖11 使用HR-I高分辨率解鏈儀器重新分析包含擴(kuò)增的靶序列、BPl單分子阻斷 劑/探針和FLl寡核苷酸的LightCycler毛細(xì)管。A)由左向右,由11、12和13個重復(fù)的 等位基因產(chǎn)生的解鏈峰。純合的11/11、12/12和13/13基因型產(chǎn)生單個解鏈峰,而雜合的 11/12和12/13基因型產(chǎn)生帶有肩峰的較寬的峰型。B)高分辨率解鏈曲線數(shù)據(jù)證實11、12 和13個重復(fù)的等位基因的可靠區(qū)別。C) 11/12和12/13基因型與11/11、12/12和13/13 基因型的區(qū)別。D)使用 OriginPro 7. 5 軟件(OriginLab, Massachusetts, USA)重新分析 LightCycler數(shù)據(jù)。在BPl阻斷劑存在下,F(xiàn)Ll探針對11/13基因型唾液樣品產(chǎn)生寬解鏈 峰,對11個重復(fù)的等位基因僅表現(xiàn)出小的肩峰。OriginPro軟件將此肩峰鑒定為真峰(true peak),并且繪制了 11和13個重復(fù)的等位基因的兩個組分的解鏈峰。圖12 合成具有5和7個TATC重復(fù)、錨定序列和富含GC的鉗的阻斷寡核苷酸。合 成具有10和8個TATC重復(fù),并且?guī)в信c阻斷劑中的鉗互補(bǔ)的GC鉗的寡核苷酸。A)在5LSB1 阻斷劑的存在下,IOSFLl寡核苷酸中僅有5個重復(fù)與10個重復(fù)的靶雜交。B)在7LSB2阻斷 劑的存在下,8SFL2寡核苷酸中僅有3個重復(fù)與10個重復(fù)的靶雜交。C)使用具有8_14個 GATA重復(fù)的互補(bǔ)寡核苷酸由5LSB1和10SFL1產(chǎn)生的解鏈峰。D)使用具有10-15個GATA 重復(fù)的互補(bǔ)寡核苷酸由7LSB2和8SFL2產(chǎn)生的解鏈峰。圖13 從 NCBI 數(shù)據(jù)庫獲得的 TH01STR 序列(登錄號 NT_009237) (SEQID No. 71)。圖14 使用HYBTH01探針和雙分子阻斷劑TH01_BL,由擴(kuò)增的TH01STR等位基因獲 得的解鏈峰。顯示了代表8、9、9.3和10個重復(fù)的等位基因的解鏈峰。圖15 單分子阻斷劑可具有長度和/或組成不同的鉗部分(Al、Al、A3等),探針 寡核苷酸可具有與PCR引物上鉗部分互補(bǔ)的鉗部分(Al'、A2'、A3'等)。圖16 與單分子構(gòu)建物中PCR引物相連的探針寡核苷酸。圖17 包含能夠進(jìn)行FRET的熒光團(tuán),或熒光團(tuán)淬滅劑對的互補(bǔ)鉗部分。圖18 使用兩個“偏置”D8S1179阻斷劑的結(jié)果,允許檢測8、9、10、11、12和13個 重復(fù)的等位基因。標(biāo)為“ + ”的解鏈峰來自于全長探針與未阻斷的靶重復(fù)的雜交。圖19 11和15個重復(fù)的D8S1179等位基因的檢測。分別使用HYBD8探針與7. 2 個重復(fù)和10. 3個重復(fù)的阻斷劑同時檢測11和15個重復(fù)的等位基因,所有的寡核苷酸均包 含在同一個管中。實施例1
用于實施例的材料和方法寡核苷酸探針的設(shè)計和合成標(biāo)準(zhǔn)DNA亞磷酰胺(DNA phosphoramidite)、固相支持物和其他試劑購自于Link Technologies 或 Applied Biosystems Ltd。補(bǔ)骨脂素 C6 亞磷酰胺購自于 Glen Research Inc0所有的寡核苷酸均使用0. 2微摩爾亞磷酰胺進(jìn)行的酸催化脫三苯甲基作用、偶聯(lián)、加 帽和碘氧化循環(huán)在Applied Biosystems 394自動DNA/RNA合成儀上合成。使正常單體 (A、G、C和T)偶聯(lián)25秒,并允許所有其他單體再偶聯(lián)額外的300秒。通過測量三苯甲基 陽離子導(dǎo)電性來測定分步偶聯(lián)效率以及帶有DMT保護(hù)的單體的總產(chǎn)量,在所有情況下均> 98.0%。在密封試管中在55°C下于濃氨水(33%)中將寡核苷酸從固相支持物上斷裂去 除,反應(yīng)進(jìn)行 5 小時。使用 C6FAM dU(University of Southampton,UK)或熒光素 dT(Glen Research, Sterling,VA)將熒光團(tuán)連接到探針序列的內(nèi)部殘基上。在C6 FAM dU的情況 下,通過本領(lǐng)域技術(shù)人員熟知的DNA合成方法將6-羧基熒光素(FAM)連接到尿嘧啶堿基的 5-位。本發(fā)明的寡核苷酸具有3'-磷酸組分或其他阻斷劑以阻止將探針加入實時PCR測 定中時由Taq介導(dǎo)的延伸。通過將寡核苷酸探針等分試樣溶解在指定體積的水中并測量 260nm處的紫外吸收來測量合成獲得的探針的量。由寡核苷酸的UV吸收及其在260nm處的 消光系數(shù)計算探針的濃度。通過將構(gòu)成此寡核苷酸的未修飾的和熒光標(biāo)記的核苷酸的單個 消光系數(shù)的加和來計算寡核苷酸的消光系數(shù)。寡核苷酸的純化使用由Gilson 7. 12 軟件控制的 ABI Aquapore 柱(C8),8mm χ 250mm,孔徑 300入, 在Gilson系統(tǒng)上通過反相HPLC進(jìn)行寡核苷酸的純化。使用以下程序運行時間30分鐘; 流速3mL/分鐘;二元系統(tǒng)時間按分鐘計(緩沖液8%) ;0(0) ;3(0) ;5 (20) ;22 (100); 25(100) ;27(0) ;30(0)。洗脫緩沖液A 0. IM乙酸銨,pH7. 0 ;緩沖液B :0. IM乙酸銨和25% 乙腈,PH7.0。通過310nm處(熒光素寡聚物)或295nm處(所有其他寡聚物)檢測洗脫過 程。HPLC純化后,按照廠商的說明,使用一次性NAP 10 S印hadex柱(Pharmacia)對寡核苷 酸進(jìn)行脫鹽,等分取樣至Eppendorf管中,并在-20°C下貯存于蒸餾去離子水中。聚合酶鏈?zhǔn)椒磻?yīng)PCR的體積通常為20 μ 1,一般包含2 μ 1樣品,Ix QIAGEN PCR緩沖液、0. 5 μ M正向 引物、0. ΙμΜ反向引物、1 單位 Taq HotStarTaq 聚合酶、3mM 總 MgCl 2、5ng/μ 1 BSA (Roche Diagnostics)、ImM dNTPs (GE Healthcare)和 150nM 探針。使用 LightCycler 儀器(Roche Diagnostics)進(jìn)行靶的均相擴(kuò)增和檢測,其中在初步的變性反應(yīng)步驟(95°C,15min)后,使 用包括變性(95°C,5s)、引物退火(55°C,10s)和產(chǎn)物延伸(72°C,10s)的50個循環(huán)來擴(kuò)增 靶。在每個循環(huán)中的每個引物退火步驟結(jié)束時進(jìn)行熒光采集。在LightCycler擴(kuò)增后,立 即進(jìn)行解鏈曲線分析,其中快速地將樣品變性(95°C,5秒)并冷卻(35°C,30秒),然后使 用0. 1°C /秒的轉(zhuǎn)變率將溫度從35°C升高到95°C,并進(jìn)行連續(xù)的熒光采集。通過繪制熒光 相對于溫度的負(fù)導(dǎo)函數(shù)(y軸上的-dF/dT)與溫度(χ軸)的曲線,使用LightCycler軟件 (3. 5版)獲得解鏈峰。使用探針峰的解鏈溫度(Tm)檢測并鑒定靶。還使用384 孔 PCR 白板(Bio-Rad)和 384 孔 Tetrad 熱循環(huán)儀(MJ ResearchInc) 進(jìn)行靶序列的擴(kuò)增。熱程序通常由以下組成用于激活熱啟動酶的初步變性階段(95°C,15 分鐘),隨后進(jìn)行包含變性(95°C,15s)、引物退火(55°C,30s)和產(chǎn)物延伸(72°C,30s)的50
23個PCR循環(huán)。在擴(kuò)增后,立即使用LightTyper儀器(Roche Diagnostics)進(jìn)行解鏈曲線分 析,使用0. 1°C /秒或0. 050C /秒的轉(zhuǎn)變率將樣品從35°C逐步加熱至75°C。短串聯(lián)重復(fù)的分析使用一系列寡核苷酸靶研究寡核苷酸探針分析短串聯(lián)重復(fù)(STR)的可能性。合成 3種探針,用于檢測和區(qū)分D16S539等位基因(表1),D16S539等位基因可包含5_15個GATA 重復(fù)。所有探針均包含5' -GGTG錨定序列,發(fā)現(xiàn)此錨定序列降低探針沿重復(fù)序列滑移的 可能性,從而防止產(chǎn)生寬且多噪音的解鏈峰。在沒有錨的情況下,STR探針的5'重復(fù)可能 與靶重復(fù)中的任意一個相互作用,從而可能出現(xiàn)全長雜交或部分雜交的事件。緊側(cè)翼于重 復(fù)序列的錨定序列促使探針在特異位點雜交,并且有助于防止DNA滑移的現(xiàn)象。錨的穩(wěn)定 性和有效性在很大程度上由其長度和序列組成決定。穩(wěn)定性不足將導(dǎo)致一定程度的DNA滑 移,而Tm過大的錨可能妨礙對STR等位基因的區(qū)分。因此,錨序列有助于優(yōu)先于探針在任 何數(shù)目的位點中結(jié)合之前完成靶序列的第一重復(fù)與寡核苷酸探針的第一同源重復(fù)的雜交。STRV2和STRV3探針還包含試圖將探針分隔成兩個分離組分的六甘醇(HEG)修飾, 從而降低整個探針的Tm并改進(jìn)用于區(qū)分等位基因的可能性。探針由兩個熒光素部分標(biāo)記 并具有3'-磷酸以阻止其在包括于PCR測定中時被Taq聚合酶的延伸。表1 寡核苷酸和寡核苷酸靶序列,其中5、(HEG)和3P分別代表熒光團(tuán)C6FAM dU、 六甘醇和3'-磷酸。
探針HYBSTR為研發(fā)的起點。對探針Δ Tm和等位基因鑒別的改進(jìn)應(yīng)當(dāng)再參考此探 針。合成寡核苷酸靶用于模擬各種D16S539等位基因,該D16S539等位基因具有5、7、 8、10和11個TATC重復(fù)以及與探針錨互補(bǔ)的3' -CACC序列(表1)。在TaKaRa PCR緩沖 液和總計3mM的MgCl2中,將150nM的D16寡核苷酸探針與150nM的各靶寡核苷酸雜交。使 用LightCycler儀器進(jìn)行解鏈曲線分析,其中在將初步變性(95°C,5秒)并冷卻(35°C,30 秒)后,使用0. 1°C/秒的轉(zhuǎn)變率將反應(yīng)從35°C加熱到95°C。表2中詳細(xì)列出了由合成靶序列觀察到的探針解鏈溫度。圖1中顯示了由STRV2探針和各寡核苷酸靶產(chǎn)生的解鏈峰。另外,還使用靶寡核苷酸的組合分析了探針,其中所述組合模擬了具有不同重復(fù) 數(shù)目的等位基因的雜合基因型。對雜合樣品進(jìn)行基因分型的能力取決于所存在的兩個D16 等位基因的ΔΤπι。LightCycler儀器通常需要至少;TC的Tm差異以產(chǎn)生具有清晰組分峰的 雜合解鏈印跡(然而,可獲得提供更好分辨率的其他儀器,例如高分辨率解鏈儀器,如來自 Idaho Technologies的HR-1)。較短的D16靶(例如5和7個重復(fù))顯示出比較長的序列 (例如10和11個重復(fù))大很多的Δ Tm,因此更易于區(qū)分。圖2顯示了使用STRV2可清楚 地區(qū)分7/11和8/10基因型,而10和11個重復(fù)的Tm過于類似而不能同時檢測。(然而,如 上所述,使用阻斷寡核苷酸(BPl)和不同的探針寡核苷酸(FLl)實現(xiàn)了 10和11個重復(fù)的 同時檢測,顯示ATm*3.5°C)。表2 探針Tm和由與寡核苷酸靶序列的雜交獲得的ATm 實施例2使用實施例1中所述的寡核苷酸設(shè)計不是總可以準(zhǔn)確地分辨出包含長重復(fù)序列 的雜合樣品。由于探針ΔΤπι的量級依賴于STR靶的長度和組成,使雜交不穩(wěn)定化可能提高 對長度多態(tài)性的敏感度??赏ㄟ^如下策略完成探針的不穩(wěn)定化 引入核苷酸錯配以降低探針Tm。錯配的數(shù)目取決于探針的長度和序列組成以及 所采用的錯配的類型??稍谘靥结橀L度上的多個重復(fù)中使用較大量的穩(wěn)定錯配,例如G/T以降低Tm。可能需要較少量高度不穩(wěn)定的錯配,例如C/A以完成相同的Tm降低。沿探針 長度上分配錯配的另一種方式是將錯配成簇,從而從寡核苷酸上除去整個重復(fù),例如,將15 個重復(fù)的探針分成5個重復(fù)和9個重復(fù)組分?!ぜ尤雺A基類似物,例如N4-乙基-dC7_脫氮-dG、7_脫氮_dC、C_5丙炔基_dC、 C-5丙炔基-dU、5-甲基-dC、2-氨基-dA、G-鉗1 (三環(huán)氨基乙基吩噁嗪2' -dC類似物)、 鎖核酸(LNA)、5'-三甲氧基芪帽、5'-芘帽。使用這些類似物在提高Tm方面具有優(yōu)點, 可進(jìn)一步區(qū)分不同探針區(qū)域?qū)φw解鏈溫度的貢獻(xiàn),從而進(jìn)一步增強(qiáng)在不同重復(fù)長度之間 的觀測的Δ Tm,以改進(jìn)探針Tm?!ぐ^長的HEG、TEG(或其他)間隔子以將探針拆分成單獨的組分?!な褂脙蓚€以上的熒光團(tuán)標(biāo)記寡核苷酸。為了研究核苷酸錯配對探針Tm和△ Tm的影響,將堿基取代加入寡核苷酸靶而非 探針中,以便于試驗評估。表1中詳細(xì)列出了對包含10和11個重復(fù)的靶序列的修飾。RClOb, RClOc, RCllb和RCllc中加入了有規(guī)則地分布在整個探針/靶雙鏈中的5 和10個G/T核苷酸錯配。堿基取代顯著地降低了探針/靶雙鏈的Tm(比較表2和表3), 并且還提高了 HYBSTR、STRV2和STRV3探針的Δ Tm。然而,Δ Tm增加的量級不足以使用 LightCycler軟件對10和11個STR重復(fù)的等位基因進(jìn)行可靠的區(qū)分。 RClOd和RCl Id寡核苷酸在STR靶共有的第六個重復(fù)中加入了 4個核苷酸錯配。這 些錯配降低了 D16寡核苷酸的Tm,并且提高了 10和11個重復(fù)的寡核苷酸之間的Δ Tm(表 3)。使用STRV3探針可見到10和11個重復(fù)的兩個峰(圖3Α)。然而,還需要進(jìn)一步增強(qiáng)探 針Δ Tm,從而能夠使用LightCycler軟件可靠地鑒定并區(qū)分長STR靶,下文對此進(jìn)行了詳 述。RClOe和RClle靶寡核苷酸證明HYBSTR探針需要4bp的錨。寡核苷酸對所有其 他修飾和未修飾的靶產(chǎn)生確定的平滑曲線,但在沒有錨時產(chǎn)生寬且多噪音的印跡(圖3B)。 峰質(zhì)量的下降是由于探針沿靶序列滑移造成的。值得注意的是,STRV2在不存在錨的情況 下沒有顯示出此類峰質(zhì)量的下降,這可能是由于存在內(nèi)部HEG修飾造成的。表3 探針與錯配寡核苷酸靶的Tm和Δ Tm 實施例3使用引物STRF2和STRR2,通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴(kuò)增D16S539靶序列。擴(kuò)增 子的大小隨重復(fù)數(shù)目而變化,范圍從133bp至173bp (基因序列參見圖4)。STRF2 CAGATCCCAAGCTCTTCCTCTTCCCTAG (SEQ ID 19)
STRR2 ACGTTTGTGTGTGCATCTGTAAGCATGTATC (SEQ ID 20)未經(jīng)DNA純化,使用HYBSTR探針和LightCycler儀器直接分析7份唾液樣品。唾 液樣品均為具有9/12、13/15、9/13、11/14、9/12、11/13和8/13個重復(fù)基因型的雜合樣品。 實時熒光的增加以及產(chǎn)生的解鏈峰確認(rèn)了從唾液樣品有效地擴(kuò)增出D16靶。具有相差2、3 或4個重復(fù)的D16等位基因的雜合基因型沒有對每個組成等位基因產(chǎn)生清晰的個體峰。反 而產(chǎn)生了由各D16重復(fù)的峰組合而成的寬解鏈圖譜。8/13D16基因型的5個重復(fù)差異足以 對每個等位基因產(chǎn)生清晰的峰(圖5)。實施例4使用既具有5' _又具有3' _錨定序列的探針以及僅具有3'-錨定序列的探針 來研究無堿基位點對雙鏈穩(wěn)定性的影響(表4)。根據(jù)DNA的負(fù)鏈(minus)設(shè)計探針,增加 用于連接熒光團(tuán)的可能位點的數(shù)目(表5)。探針與具有5、7、10、12和15個重復(fù)的互補(bǔ)寡 核苷酸雜交(表5)。表4 用于分析無堿基位點的影響的寡核苷酸探針,其中4和5分別代表無堿基位 點和熒光素dT熒光標(biāo)記。
表5:用于探針評估的作為靶使用的寡核苷酸,其中(GATA)n代表STR重復(fù)的數(shù) 包含無堿基位點通常將探針雜交的Tm降低約1_2°C。然而,沒有獲得Δ Tm的改進(jìn) (表6)。使用包含5和6個熒光標(biāo)記的T堿基的探針產(chǎn)生了高質(zhì)量的解鏈峰。其他探針設(shè) 計在具有多至8個熒光標(biāo)記堿基時產(chǎn)生高質(zhì)量的解鏈峰。迄今為止尚未測試具有超過8個 熒光團(tuán)的探針,但預(yù)期在適合的探針長度和標(biāo)記之間的間隔時,此類探針具有功能性。表6 無堿基位點對探針Tm的影響 實施例5D16S539的等位基因總是具有至少5個GATA重復(fù)。因此,如果將STR重復(fù)分成兩 個寡核苷酸,可以降低探針雜交的Tm(表7)。第一寡核苷酸沒有熒光,作為阻斷劑,其包含 前面5個共有重復(fù)。第二寡核苷酸是僅與其他重復(fù)雜交的熒光探針,即僅檢測10個重復(fù)的 等位基因中的5個重復(fù)(圖6A)。阻斷劑的目的是減少熒光探針可利用的STR重復(fù)的數(shù)目, 從而提高長度類似的等位基因之間的ΔΤπι。阻斷寡核苷酸(Bi)由5個d(TATC)重復(fù)、用于防止滑移的31-mer錨定序列(其 與側(cè)翼序列完全地互補(bǔ))和用于防止探針在PCR期間延伸的3'-磷酸組成。熒光寡核苷 酸探針(FLl)具有10個d(TATC)重復(fù)、5個內(nèi)部熒光素dT堿基(Glen Research)、6個核苷酸的短錨(其與另一個側(cè)翼序列完全地互補(bǔ))和位于3'-端的辛二醇PCR阻斷劑(表 7)。表7 使用雙分子阻斷劑和寡核苷酸探針的STR分析,其中P、5和6T分別代表 3' _磷酸、熒光素dT和辛二醇。 使用摩爾過量的阻斷寡核苷酸有利于與5個共有重復(fù)的雜交。使用IOOnM FLl探 針和600nM Bl阻斷劑分析具有8、9、10、11和12個GATA重復(fù)的互補(bǔ)寡核苷酸(圖6Β)。表 8中列出了對每個靶的探針Tm和Δ Tm。將STR探針分成兩個組分的設(shè)計顯著改進(jìn)了 ATm 以及區(qū)分長度類似的等位基因的能力。例如,在使用全長HYBSTR探針進(jìn)行分析時,10/11基 因型的Δ Tm為0.92°C,但使用此雙分子阻斷策略,可將八1^提高至2.21。檢測5和7個重復(fù)的等位基因可能需要省略反應(yīng)中的阻斷寡核苷酸。圖6C說明 了在沒有Bl阻斷劑時,使用FLl探針產(chǎn)生的解鏈峰。需要平行進(jìn)行具有和沒有阻斷寡核苷 酸的分析,以檢測和鑒定所有范圍的D16S539等位基因。表8 在雙分子阻斷劑Bl的存在下,由FLl探針與寡核苷酸靶序列的雜交獲得的 探針Tm和Δ Tm。
實施例6使用引物STRF2和STRR2從提取的DNA擴(kuò)增D16S539靶序列,并直接從唾液樣品 擴(kuò)增D16S539靶序列。需要優(yōu)化Bl阻斷劑和FLl探針寡核苷酸的相對濃度,從而能夠有效 地擴(kuò)增靶,同時防止探針與具有不到15個重復(fù)的靶全長雜交。通過分析阻斷寡核苷酸和探 針寡核苷酸的各種濃度和比例完成優(yōu)化。發(fā)現(xiàn)阻斷寡核苷酸與探針寡核苷酸之間的比例為 6 1是有用的。Bl阻斷劑不足導(dǎo)致在約59°C時產(chǎn)生常規(guī)峰,其中FLl探針沒有被完全阻 斷,從而可以與全部10個重復(fù)雜交。反之,過量的Bl阻斷劑抑制靶的擴(kuò)增,增加了檢測靶 所需的循環(huán)數(shù)(圖7A)。發(fā)現(xiàn)最佳濃度為使用37. 5nM FLl探針和225nM Bl阻斷劑。使用 具有 11/11、10/11、12/12、10/13、11/12、13/13、12/13 和 9/12 基因型的提取 DNA 和唾液樣 品進(jìn)行分析。對應(yīng)于9、10、11、12和13個重復(fù)的解鏈峰Tm分別為47. 0°C、51. 5°C、53. 5°C、 56.0°C和57.5°C。9/12基因型的樣品是唯一獲得兩個清晰峰的解鏈圖譜(圖7B)。使用 任何樣品都不能有效地檢測10個重復(fù)的峰。與11和13個重復(fù)相比,10個重復(fù)的峰具有 降低的高度。小ΔΤπι意味著10個重復(fù)的峰被隱藏在11和13個重復(fù)的印跡中,從而導(dǎo)致 連肩峰也觀察不到。如FL4所示提高Δ Tm或者試著標(biāo)準(zhǔn)化或改進(jìn)較短重復(fù)的峰高度應(yīng)克 服這個問題。11/12和12/13雜合樣品產(chǎn)生Tm介于純合峰之間的單個解鏈峰(即分別約 54. 5°C和57. O0C )。HRM儀器的應(yīng)用應(yīng)當(dāng)有助于使用這些中間峰Tm鑒定雜合體。通過加入修飾堿基丙炔基dU和丙炔基dC,以及通過加入G-鉗和5'-三甲氧基 芪修飾提高了阻斷劑的穩(wěn)定性。實施例7將STRF2正向引物和Bl阻斷劑序列組合到單條非熒光寡核苷酸中,使用六甘醇 (HEG)作為連接子和PCR阻斷劑。單分子引物/阻斷劑寡核苷酸(BPl)包含5個d(TATC) 重復(fù)、用于防止滑移的10-mer錨定序列、HEG和正向引物(表9)。表9 使用單分子阻斷劑/引物和寡核苷酸探針的STR分析,其中P、5、6T和(HEG)
分別代表3'-磷酸、熒光素dT、辛二醇和六甘醇。 此方法的優(yōu)點是阻斷劑和靶序列在擴(kuò)增后成為同一 DNA鏈的一部分。在熱力學(xué) 上,阻斷劑和靶之間的單分子相互作用比探針雜交更為有利。此外,由于阻斷劑在靶序列擴(kuò) 增后才能雜交,所以PCR效率沒有損失(圖8)。使用0. 5μΜ BPl和0. 05 μ M STRR2反向引物從提取的DNA和直接從唾液樣品擴(kuò)增 D16S539 靶序列。使用 50ηΜ 的 FLl 探針檢測并鑒定從 11/11、12/12、13/13、10/11、10/13、 11/12、12/13、9/12、11/13和8/13基因型的樣品擴(kuò)增的靶序列。實時LightCycler熒光數(shù) 據(jù)證明靶擴(kuò)增和檢測的效率高于使用雙分子阻斷劑方法獲得的效率(圖9Α)。另外,還使 用384孔PCR板進(jìn)行靶擴(kuò)增,隨后使用LightTyper儀器進(jìn)行解鏈分析。對應(yīng)于8、9、11、12 和13個重復(fù)的解鏈峰的Tm分別為40. O0C >46. 0°C >53. 0°C >55. 5°C和57. 5°C (圖9)。在這 些樣品的任一個中都沒能可靠地檢測到10個重復(fù)的峰,這是因為由于10個重復(fù)的峰的小 ATm和降低的峰高度使其被隱藏在11和13個重復(fù)的印跡中。這可以通過上文討論的方式 克服。8/13和9/12基因型的樣品產(chǎn)生了代表組分等位基因的兩個清晰解鏈峰(圖9C-D)。 另一方面,11/12、12/13基因型的雜合樣品產(chǎn)生Tm介于純合等位基因Tm之間的單個解鏈峰 (即約54. 5°C和56. 0°C,分別顯示在圖9F-G中)。使用BPl和寡核苷酸探針FL2、FL3、FL4和FL5重復(fù)對DNA和唾液樣品的分析,其 中上述探針具有不同數(shù)目的熒光團(tuán)標(biāo)記堿基和在熒光團(tuán)之間不同的間隔子(表9)。由擴(kuò)增 的STR靶產(chǎn)生的解鏈峰Tm顯示在表10中。與FLl探針類似,F(xiàn)L3和FL5構(gòu)建物不能可靠地 檢測雜合基因型例如10/11和10/13中具有10個重復(fù)的等位基因。熒光標(biāo)記堿基的數(shù)目 和間隔影響探針的信噪比和解鏈峰質(zhì)量。探針FL2和FL4僅具有3個熒光團(tuán)標(biāo)記的堿基, 并且能夠檢測10/11和10/13基因型中的10個重復(fù)的等位基因(圖10D-E)。線性的未修 飾HYBSTR探針對10和11個重復(fù)的等位基因顯示出0. 92°C的Tm。使用單分子阻斷劑BPl 和 FL4HyBeacon 獲得了 3. 5°C 的 Δ Tm。表10 使用單分子BPl阻斷劑/引物從提取的DNA和未提取的唾液樣品擴(kuò)增出的 靶產(chǎn)生的解鏈峰的Tms。
32 實施例8使用高分辨率解鏈曲線儀器(HR-1,Idaho Technology Inc,Utah,USA)重新分析 包含擴(kuò)增的D16S539靶、BPl阻斷劑和F6A寡核苷酸的LightCycler毛細(xì)管。HR-I能夠清楚 地區(qū)分由11、12和13個重復(fù)序列產(chǎn)生的解鏈峰(圖11A)。然而,如上所述,解鏈峰不能用 于鑒定雜合基因型,例如11/12。高分辨率解鏈曲線軟件的確能夠清楚地區(qū)分9/12、11/11、 11/12、12/12、12/13和13/13基因型(圖11B-C)。高分辨率分析在區(qū)分長度類似的等位基 因時不需要超過;TC的ΔΤπι。此外,改進(jìn)的數(shù)據(jù)分析方法能夠?qū)挿搴头寮缜宄胤殖山M 分等位基因(圖11D)。實施例9重復(fù)阻斷方法的另一個實施方式是將探針錨定至阻斷劑而不是錨定至側(cè)翼于重 復(fù)靶的DNA序列。此方法提高了在阻斷劑存在下探針雜交的穩(wěn)定性,從而提高了阻斷效率。 在雙分子形式中,阻斷寡核苷酸可包含指定數(shù)目的序列重復(fù)、用于防止滑移的適合的錨定 序列和富含GC的鉗(圖12)。阻斷寡核苷酸的鉗與探針寡核苷酸中的互補(bǔ)鉗雜交。在單分 子形式中,可通過適合的間隔子/PCR阻斷劑(例如HEG)將阻斷重復(fù)、錨定序列和富含GC 的鉗連接到PCR引物之一上。用于這些阻斷劑的熒光探針可具有與阻斷劑中富含GC的序 列互補(bǔ)的富含GC的序列。當(dāng)阻斷劑與鄰近的探針寡核苷酸雜交時,富含GC的鉗將形成接 頭(junction)。對于D16S539的情況,當(dāng)靶重復(fù)數(shù)目小于15時,可防止探針全長雜交(圖 12A-B)。分別將具有5個D16重復(fù)(5LSB1)和7個重復(fù)(7LSB2)的阻斷寡核苷酸與具有 10個重復(fù)(10SFL1)和8個重復(fù)(8SFL2)的熒光探針組合。使這些接頭探針和阻斷劑(表 11)與具有8-15個重復(fù)的互補(bǔ)靶寡核苷酸(表5)雜交,并使用LightCycler儀器分析(圖 12C-D)。表12中列出了探針的Tm。由于探針長度減小,7LSB2的ATm ±曾大。在沒有阻斷 劑分子時,可分析包含9個或更少重復(fù)的等位基因。表11 接頭探針和阻斷劑的序列,其中6為吡咯-脫氧胞嘧啶(PdC),5為熒光素 dT,P為3'-磷酸,而(HEG)為六甘醇。
表12 使用寡核苷酸同源物由接頭探針和阻斷劑產(chǎn)生的解鏈峰的Tm。 作為上述實施方式的變式,單分子阻斷劑(PCR引物)可具有長度和/或組成不同 的鉗部分(A1、A1、A3等),探針寡核苷酸可包含與PCR引物上鉗部分互補(bǔ)的鉗部分(Al'、 A2'、A3'等)。這樣,例如在PCR分析中可包含3種或更多探針,并可將鉗部分的序列用 于修飾峰Tm。圖15中給出了此變式的圖示說明。實施例10研究了第二個STR基因座,以證明通過解鏈曲線分析來檢測并區(qū)分重復(fù)序列并 非僅適用于D16S539。THOl基因座包含(AATG)n的重復(fù),并且報道了具有3_14個重復(fù) 的等位基因(基因序列參見圖13)。THOl序列可包含部分重復(fù),例如在9. 3等位基因 (AATG)6ATG(AATG) 3 (SEQ ID NO. 47)中。在設(shè)計驗證原理的THOl分析時,僅考慮最常見的 重復(fù)等位基因,其中99. 5%的等位基因包含6個重復(fù)(23% )、7個重復(fù)(24. 1%),8個重復(fù) (11. 6% )、9個重復(fù)(20% )、9· 3個重復(fù)(17. 9% )或10個重復(fù)(2. 9% )。THOl等位基因
34分析的其他挑戰(zhàn)是不僅要區(qū)分長度相差4個堿基的一倍或多倍的完整重復(fù)等位基因,而且 還要區(qū)分長度僅相差單個核苷酸的9. 3個部分重復(fù)和10個完整重復(fù)的等位基因。設(shè)計探針HYBTH01以用于檢測和區(qū)分THOl等位基因。此探針包含6. 1個AATG重 復(fù)(表13)和5' -TGGR;錨定序列。使用相隔7個核苷酸的兩個熒光素dT染料標(biāo)記探針, 其中一個標(biāo)記位于錨定序列中。使用圖6所示的雙分子阻斷策略。設(shè)計雙分子阻斷劑TH01_ BL以防止HYBTH01探針在靶等位基因內(nèi)的重復(fù)數(shù)目小于10時與靶序列完全雜交。TH01_BL 阻斷劑包含3. 3個AATG重復(fù)和3 ‘ -AGGGAAATAAGGG錨定序列(表13)。使用引物TH01_F和TH01_R(表13)從純化DNA樣品以及未純化的唾液擴(kuò)增THOl 靶序列。使用不對稱PCR增強(qiáng)探針與擴(kuò)增靶序列雜交的效率,其中引物TH01_F和TH01_R的 濃度分別為0. 1 μ M和1 μ M。所使用的探針和阻斷寡核苷酸的濃度分別為75ηΜ和375ηΜ。 使用5倍摩爾過量的阻斷寡核苷酸以防止探針與THOl等位基因共有的3. 1個AATG重復(fù)雜 交。阻斷寡核苷酸限制了可用于探針雜交的靶序列的量,有效地將6-10個重復(fù)的等位基因 的長度縮短至2. 1-6. 1個重復(fù),從而改進(jìn)了基于解鏈峰Tm區(qū)分THOl等位基因的能力。表13 =THOl重復(fù)的分析,其中5和P分別代表熒光素dT和3'-磷酸。 HYBTHO1探針和TH01_BL阻斷劑的組合能夠可靠地檢測并鑒定擴(kuò)增的8、9、9. 3和 10個重復(fù)的等位基因,顯示出分別為約53°C、57°C、60. 5°C和61. 5°C的解鏈峰Tm(圖14)。 由于6和7個重復(fù)的等位基因的解鏈峰太低,不能可靠地通過這一設(shè)計用于檢測在此基因 座內(nèi)更具挑戰(zhàn)性的較長重復(fù)序列的具體探針結(jié)構(gòu)形式進(jìn)行檢測。顯而易見地,通過減少阻 斷劑中重復(fù)的數(shù)目,增加探針中重復(fù)的數(shù)目或提高探針的Tm(通過增加錨定序列的長度, 或通過加入DNA堿基類似物或亞磷酰胺帽,例如5'-三甲氧基芪)能夠應(yīng)用本發(fā)明所述的 相同原理檢測6和7個重復(fù)的等位基因。與此類似,預(yù)期在使用包含通過六甘醇(HEG)修 飾分隔的TH01_BL阻斷劑和TH01_R引物序列的長寡核苷酸的單分子模式中,該THOl分析 也有效地發(fā)揮功能。結(jié)論可使用寡核苷酸探針分析重復(fù)序列,其中通過靶長度和雜交探針的比例確定重復(fù) 的數(shù)目。需要超過60個核苷酸的長寡核苷酸探針分析短串聯(lián)重復(fù)。長重復(fù)之間的探針Tm 差異通常小,妨礙了某些等位基因的可靠鑒定??赏ㄟ^使探針不穩(wěn)定化或通過將重復(fù)序列 分隔成長度減小的非熒光阻斷劑和熒光探針來提高△ Tm。本文描述的各種阻斷策略均具有 增加的探針ΔΤπι,以及區(qū)分具有大量重復(fù)的D16S539和THOl等位基因的能力。本發(fā)明的實施例可延伸至其他STR,包括但不限于D19S433和D18S51。實施例11預(yù)防探針與阻斷劑的交叉雜交D8S1179和D3S1358基因座均包含(TCTA)n重復(fù)序列。探針和阻斷劑可能交叉雜 交,妨礙有效的靶檢測或?qū)е洛e誤的結(jié)果。將阻斷劑與引物相連(即單分子阻斷)防止了 交叉雜交。將探針與單分子構(gòu)建物相連防止了對錯誤靶等位基因的檢測。出于雜交穩(wěn)定性 的目的使用將阻斷劑和探針組分分成兩個單獨部分的寡核苷酸間隔子來實現(xiàn)這一點(參 見圖16)。實施例12將多個阻斷劑包含在單個管中,利用解鏈峰Tm的移動來檢測其他重復(fù)等位基因。
這通過使用部分重復(fù)(偏置)阻斷劑而實現(xiàn),該阻斷劑允許(長度/序列)不等的探針雜 、-父。盡管已報道D8S1179等位基因包含TCTA和TCTG元件,但TCTG重復(fù)僅限于具有 13個或更多個重復(fù)的等位基因并且僅位于第二、第三和第四個重復(fù)位置(GenBank登錄號 AF216671)。因此,可變的TCTA和TCTG重復(fù)位于阻斷寡核苷酸中,僅留下TCTA重復(fù)可與探 針雜交。已報道D8S1179基因座具有6-25個四核苷酸重復(fù),然而,在設(shè)計D8S1179分析時, 僅考慮了最常見的重復(fù)等位基因,其中99. 9%的等位基因包含8個重復(fù)(0. 9% )、9個重復(fù) (0.8%)、10個重復(fù)(8.8%)、11 個重復(fù)(7.3%)、12個重復(fù)(12. 6% )、13個重復(fù)(27.6%), 14個重復(fù)(22. 6% ),15個重復(fù)(14. 1% ),16個重復(fù)(4. 3% )或17個重復(fù)(0. 9% )。設(shè)計探針HYBD8以用于檢測和區(qū)分D8S1179等位基因。此探針包含8個TCTA重 復(fù)(表14)和3' -FTCCCCP錨定序列。使用相隔5個核苷酸的兩個熒光素dT染料標(biāo)記探 針,其中一個標(biāo)記位于錨定序列中。使用圖6所示的雙分子阻斷策略,其中使用3個阻斷寡 核苷酸來檢測和區(qū)分全長的常見D8S1179等位基因。設(shè)計雙分子阻斷劑D8BL5、D8BL8和 D8BL11 (表14),分別用于防止HYBD8探針在靶等位基因內(nèi)重復(fù)的數(shù)目小于13、16和19時 與靶序列完全雜交。使用引物D8F和D8R(表14)從純化DNA樣品以及未純化的唾液擴(kuò)增D8S1179靶 序列。使用不對稱PCR增強(qiáng)探針與擴(kuò)增靶序列雜交的效率,其中引物D8F和D8R的濃度分 別為0.1 μ M和1 μ M。所使用的探針和阻斷劑寡核苷酸的濃度分別為75ηΜ和375ηΜ。使用 5倍摩爾過量的阻斷寡核苷酸以防止全長探針與不恰當(dāng)?shù)陌械任换螂s交。在D8BL5存在下的解鏈曲線分析能夠可靠地檢測并鑒定8、9和10個重復(fù)的等位 基因(表15)。D8BL8阻斷劑用于檢測11、12和13個重復(fù)的等位基因,而0881^11能夠鑒定 14、15、16和17個重復(fù)的等位基因。在分別與D8BL5、D8BL8和D8BL11阻斷劑組合使用時,HYBD8探針與9個重復(fù)、12 個重復(fù)和15個重復(fù)靶等位基因的雜交產(chǎn)生了 44. 7344. 4°C和44. 4°C的解鏈峰Tm。由于 D8BL5、D8BL8和D8BL11各留下與探針雜交的3個靶重復(fù),預(yù)期9、12和15個重復(fù)的等位基 因產(chǎn)生類似的解鏈峰Tm。因此,在單一試管中同時檢測9、12和15個重復(fù)的等位基因時,不 能將D8BL5、D8BL8和D8BL11阻斷寡核苷酸一起使用。表14:D8S1179重復(fù)的分析,其中5、P和X分別代表熒光素dT、3'-磷酸和3'-氨 基C7
使用帶有部分重復(fù)的阻斷寡核苷酸可導(dǎo)致解鏈峰Tm的移動(“偏置”),增加可 同時檢測的STR等位基因的數(shù)目。使用具有11-17個重復(fù)的擴(kuò)增靶評估包含7. 2個(即 (TCTA)7TC)和10. 3個(即(TCTA)10TCT)重復(fù)的部分重復(fù)阻斷劑。相對于D8BL8和D8BL11, 減少阻斷劑的長度能夠使更長的探針雜交,從而提高了解鏈峰Tm(表15)。例如,在D8BL7. 2 阻斷劑存在下,探針與12個重復(fù)的靶的雜交產(chǎn)生46. 88 0C的解鏈峰Tm,這樣,D8BL5和 D8BL7. 2阻斷劑可用于同時檢測9和12個重復(fù)的等位基因(圖18)。圖19說明使用D8BL7. 2 和D8BL10. 3阻斷劑在單一試管中同時檢測11和15個重復(fù)的等位基因。表15 適合的染料列表表14 用于寡核苷酸標(biāo)記的通用熒光染料 表 15 :Alexa 染料(Invitrogen)
表16 =ATTO 染料(ATTO-TEC GmbH) 表18 =Dyomics Megastokes 染料(Dyomics GmbH)。均能在 488nm 激發(fā)。
表19 =Hilyte 染料(Cambridge Bioscience) 表20 低激發(fā)波長(UV)熒光團(tuán) 表21:常見 STR a.在一些文獻(xiàn)中,將此基因座命名為D6S502。b. R可代表A或G核苷酸。常用的STR在英國使用的SGM+基因座為D3S1358、VffA,D16S539、D2S1338、D8S1179、D21S11、D18S51、D19S433、THOl FGA。在美國使用的13C0DIS基因座為CSF1P0、FGA、THOU TPOX、VffA, D3S1358、D5S818、D7S820、D8S1179、D13S317、 D16S539、D18S51 和 D21S11。世界各地的實驗室廣泛使用一套核心Y-染色體STR(Y-STR)基因座進(jìn)行個人身份 鑒定和遺傳譜系學(xué)。在20世紀(jì)90年代晚期從可用的Y-STR小集合中選擇了最小的單倍型 基因位點(MHL)。MHL 包括 DYS19、DYS389I、DYS389II、DYS390、DYS391、DYS392、DYS393 和 多態(tài)性多拷貝標(biāo)記DYS385。2003年,美國DNA分析方法科學(xué)工作組(Scientific Working Groupon DNA Analysis Methods, SWGDAM)的 Y-染色體小組推薦了命名為DYS438和DYS439 的另外兩個Y-STR。參考文獻(xiàn)Bart-Delabesse, E. , Sarfati, J. , Debeaupuis, J. P, van Leeuwen, W. , vanBelkum, Α. , Bretagne, S. , Latge, J. P. (2001).Comparison ofrestriction fragmentlength polymorphism, microsatellite length polymorphism, and randomamplification ofpolymorphic DNA analyses for fingerprinting Aspergillusfumigatus isolates. J. Clin. Microbiol. 39 :2683_6.Bel grader, P. , Smith,J. K. ,Weedn, V. W. ,Northrup, Μ. Α. (1998). RapidPCR for identity testing using a battery-powered miniature thermal cycler.JForensic Sci. 43(2) :315-9.Bell, GI. , SeIby, M. J. , Rutter, W. J. (1982). The highly polymorphic regionnear the human insulin gene is composed of simple tandemly repeating sequences. Nature 295:31—5.Brondani,C.,Borba,T. C.,Rangel,P. H. N.,and Brondani,R. P. V. (1998). Determination of genetic variability of traditional varieties of Brazilian rice usingmicrosatellite markers. Genetics 149 :2007_2023·Brondani,C.,Rangel,P. H.,Borba, Τ. C,. Brondani,R. P. (2003). Transferability of microsatellite and sequence tagged site markers in Oryzaspecies. Hereditas. 138(3) 187-92.Carrier. L,,Hengstenberg. C,,Beckmann. J,S,,Guicheney. P.,Dufour, C., Bercovici, J.,Dausse,Ε.,Berebbi-Bertrand, I.,Wisnewsky, C.,Pulvenis,D. et al (1993). Mapping of a novel gene for familial hypertrophic cardiomyopathy tochromosome 11. Nat. Genet. 4 :311_3.Frayling, I. M. (1999). Microsatellite instability. Gut 45:1—4.Goedecke,N.,McKenna,B.,El-Difrawy, S.,Carey, L,Matsudaira,P.,Ehrlich D. (2004). A high-performance multilane microdevice system designedfor the DNA forensics laboratory. Electrophoresis 25 1678-86.Ionov, Y.,Peinado,M. A.,Malkhosyan, S.,Shibata D.,and Perucho. Μ. (1993). Ubiquitous somatic mutations in simple repeated sequences reveal a newmechanism for colonic carcinogenesis. Nature 363:558—561·Jeffreys AJiWilson V,Thein SL. (1985a). Natuer 314 :67-73. Hypervariable 'ITiinisatelliter regions in human DNA.Jeffreys AJ,Wilson V,Thein SL. Nature. (1985b) · 316 :76_9· Individual-spe cific' fingerprints' of human DNA.Lagally, Ε. T. , Emrich, C. Α. , Mathies, R. A. (200 1 ) . Fully integratedPCR-capilIary electrophoresis microsystem for DNA analysis.Lab Chipl :102-7.Loeb,L. A. (1994). Microsatel lite instability : marker of a mutatorphenotype in cancer. Cancer Res. 54 :5059_5063·Matute,D. R.,Sepulveda,V. E.,Quesada,LM.,Goldman,GH.,Taylor, J. W., Restrepo,A.,McEwen, J. G. (2006). Microsatellite analysis of threephylogenetic species of Paracoccidioides brasiliensis. J. Clin. Microbiol. 44 :2153-7.McCormick,R. M.,Nelson,R. J.,Alonso-Amigo,M. G,Benvegnu, D. J.,Hooper, H.H. (1997). MicroChannel electrophoretic separations of DNA ininjection-moIdedplastic substrates. Anal Chem. 69 2626-30.McCouch, S. R.,Teytelman,L.,Xu, Y.,Lobos K. B.,Clare K.,Walton, Μ.,F(xiàn)u, B., Maghirang R.,Li,Ζ.,Xing,Y,Zhang,Q.,Kono,I.,Yano M.,F(xiàn)jellstrom, R.,DeClerk, G., Schneider,D.,Cartinhour, S.,Ware, D. and Stein, L (2002). Development and mapping of 2240new SSR markers for rice(Oryza sativa L). DNA Res. 9 199-207.Radtkey, R.,F(xiàn)eng,L,Muralhidar, Μ.,Duhon, Μ.,Canter,D.,DiPierro,D., Fallon,S.,Tu, Ε.,McElfresh,K.,Nerenberg,Μ.,Sosnowski, R. (2000). Rapid, high fidelity analysis of simple sequence repeats on an electronically active DNAmicrochip. Nucleic Acids Res. 28 :E17.Roder.,M. S.,Korzun, V.,Wendehake, K.,Plaschke,J.,Tixier, Μ. H.,Leroy, P., Ganal, Μ. W. (1998). Genetics 149 :2007_23· A microsatellite map ofwheat.Schmalzing,D.,Koutny, L.,Chisholm,D.,Adourian,Α.,Matsudaira,P., Ehrlich, D. (1999).Two-color mnltiplexed analysis of eight short tandem repeatloci with an electrophoretic microdevice. Anal. Biochem. 270 148-52.Shi, Y.,Simpson,P. C.,Scherer, J. R.,Wexler, D.,Skibola,C.,Smith, Μ. Τ.,Mathies,R. Α. (1999). Radial capillary array electrophoresis microplate andscanner for high-performance nucleic acid analysis. Anal Chem. 71 :5354_6LSinden, R. R. (1999) . Biological implications of the DNA structuresassociated with disease-causing triplet repeats. Am. J. Hum. Genet. 64 346-53.Thierfelder, L. , MacRae, C. , Watkins, H. , Tomfohrde, J. , Williams, Μ., McKenna.,W.,Bohm K.,Noeske, G.,Schlepper, M.,Bowcock, A. et al (1993). A familial hypertrophic cardiomyopathy locus maps to chromosome 15q2. Proc. Natl. Acad. Sci U S A. 90 :6270-4.Watkins, H.,MacRae, C.,Thierfelder, L,Chou, Y. H.,F(xiàn)renneaux, Μ.,McKenna, W.,Seidman,J. G.,Seidman,C. Ε. (1993). A disease locus for familialhypertrophic cardiomyopathy maps to chromosome lq3. Nat. Genet. 3 :333_7.Weissenbach, J.,Gyapay, G.,Dib,C.,Vignal, Α.,Morissette,J.,Millasseau, P.,Vaysseix, G.,Lathrop, Μ. (1992). A second-generation linkage map of thehuman genome. Nature 359:794-801.Westin, L. , Xu, X. , Miller, C. , Wang, L. , Edman, C. Ε, Nerenberg, Μ. (2000). Anchored multiplex amplification on a microelectronic chip array. NatureBiotechnol. 18 199-204.Wooley, A. T. and Mathies, R. A. (1994). Proc. Natl. Acad. Sci. USA91 11348-11352.
權(quán)利要求
用于確定靶多核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目的方法,所述方法包括(a)提供包含所述靶多核苷酸的樣品,其中所述靶多核苷酸內(nèi)的一個或多個串聯(lián)重復(fù)是單鏈形式,(b)使經(jīng)標(biāo)記的探針寡核苷酸與所述靶多核苷酸的單鏈部分雜交,其中所述探針寡核苷酸與所述靶多核苷酸的單鏈部分中的至少一個串聯(lián)重復(fù)互補(bǔ),并且所述探針寡核苷酸中的至少5個核苷酸與所述靶多核苷酸的單鏈部分中的串聯(lián)重復(fù)互補(bǔ),和(c)基于所述探針寡核苷酸與所述靶多核苷酸的單鏈部分的雜交,確定所述靶多核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目。
2.如權(quán)利要求1所述的方法,其中,所述靶多核苷酸是DNA。
3.如權(quán)利要求1或2所述的方法,包括在步驟(a)后或同時進(jìn)行的另外的步驟(al)使阻斷寡核苷酸與步驟(a)中提供的所述靶多核苷酸中的至少一個但并非全部 串聯(lián)重復(fù)雜交,從而使所述靶多核苷酸中的一個或多個串聯(lián)重復(fù)在與阻斷寡核苷酸雜交后 保持單鏈形式。
4.如權(quán)利要求1-3中任一項所述的方法,其中,在步驟(a)中,所述靶多核苷酸內(nèi)的兩 個或更多個串聯(lián)重復(fù)為單鏈形式。
5.如權(quán)利要求1-4中任一項所述的方法,其中,在步驟(a)中,所述靶多核苷酸內(nèi)的三 個或更多個串聯(lián)重復(fù)為單鏈形式。
6.如權(quán)利要求4或5所述的方法,其中,在步驟(b)中,所述探針寡核苷酸與所述靶多 核苷酸的單鏈部分中的至少兩個串聯(lián)重復(fù)互補(bǔ)。
7.如權(quán)利要求5所述的方法,其中,在步驟(b)中,所述探針寡核苷酸與所述靶多核苷 酸的單鏈部分中的至少三個串聯(lián)重復(fù)互補(bǔ)。
8.如前述權(quán)利要求中任一項所述的方法,其中,在步驟(a)中,所述包含串聯(lián)重復(fù)的靶 多核苷酸的單鏈部分包含至少8個核苷酸。
9.如前述權(quán)利要求中任一項所述的方法,其中,在步驟(a)中,所述包含串聯(lián)重復(fù)的靶 多核苷酸的單鏈部分包含至少16個核苷酸。
10.如前述權(quán)利要求中任一項所述的方法,其中,在步驟(b)中,所述探針寡核苷酸與 存在于所述靶多核苷酸的單鏈部分中的串聯(lián)重復(fù)中的至少8個核苷酸互補(bǔ)。
11.如前述權(quán)利要求中任一項所述的方法,其中,在步驟(b)中,所述探針寡核苷酸與 存在于所述靶多核苷酸的單鏈部分中的串聯(lián)重復(fù)中的至少16個核苷酸互補(bǔ)。
12.如權(quán)利要求3所述的方法,其中,在步驟(al)中,所述阻斷寡核苷酸與所述靶多核 苷酸的單鏈部分中的至少兩個串聯(lián)重復(fù)雜交。
13.如權(quán)利要求12所述的方法,其中,在步驟(al)中,所述阻斷寡核苷酸與所述靶多核 苷酸的單鏈部分中的至少三個串聯(lián)重復(fù)雜交。
14.如權(quán)利要求3所述的方法,其中,在步驟(al)中,所述阻斷寡核苷酸與存在于所述 靶多核苷酸的單鏈部分中的串聯(lián)重復(fù)中的至少8個核苷酸互補(bǔ)。
15.如權(quán)利要求14所述的方法,其中,在步驟(al)中,所述阻斷寡核苷酸與存在于所述 靶多核苷酸的單鏈部分中的串聯(lián)重復(fù)中的至少16個核苷酸互補(bǔ)。
16.如權(quán)利要求3所述的方法,其中,在步驟(al)中,兩個或更多個串聯(lián)重復(fù)在與所述 阻斷寡核苷酸雜交后保持單鏈形式。
17.如權(quán)利要求16所述的方法,其中,在步驟(al)中,三個或更多個串聯(lián)重復(fù)在與所述 阻斷寡核苷酸雜交后保持單鏈形式。
18.如權(quán)利要求3所述的方法,其中,在步驟(al)中,所述串聯(lián)重復(fù)的至少8個核苷酸 在與所述阻斷寡核苷酸雜交后保持單鏈形式。
19.如權(quán)利要求18所述的方法,其中,在步驟(al)中,所述串聯(lián)重復(fù)的至少16個核苷 酸在與所述阻斷寡核苷酸雜交后保持單鏈形式。
20.如權(quán)利要求3所述的方法,其中,在步驟(al)中,將兩個或更多個阻斷寡核苷酸與 步驟(a)中提供的至少一個但并非全部串聯(lián)重復(fù)雜交,從而使所述靶多核苷酸中的一個或 多個串聯(lián)重復(fù)在與阻斷寡核苷酸雜交后保持單鏈形式。
21.如權(quán)利要求20所述的方法,其中一個或多個阻斷寡核苷酸與部分?jǐn)?shù)目的串聯(lián)重復(fù) 雜交。
22.如前述權(quán)利要求中任一項所述的方法,其中,在步驟(a)中的樣品在擴(kuò)增反應(yīng)期間 或之后產(chǎn)生。
23.如權(quán)利要求22所述的方法,其中所述擴(kuò)增反應(yīng)是PCR。
24.如權(quán)利要求22或23所述的方法,其中,在步驟(a)中的樣品通過從基因組DNA的 擴(kuò)增產(chǎn)生。
25.如權(quán)利要求1-21中任一項所述的方法,其中,在步驟(a)中的樣品包含通過體外轉(zhuǎn) 錄產(chǎn)生的單鏈靶RNA。
26.如前述權(quán)利要求中任一項所述的方法,其中所述探針寡核苷酸是熒光標(biāo)記的。
27.如權(quán)利要求26所述的方法,其中所述探針寡核苷酸是HyBeacon 探針。
28.如權(quán)利要求3所述的方法,其中所述阻斷寡核苷酸包含熒光團(tuán)而所述探針寡核苷 酸包含淬滅劑,或者所述阻斷寡核苷酸包含淬滅劑而所述探針寡核苷酸包含熒光團(tuán)。
29.如權(quán)利要求3所述的方法,其中使用能夠相互參與FRET的熒光團(tuán)來標(biāo)記所述探針 寡核苷酸和所述阻斷寡核苷酸。
30.如前述權(quán)利要求中任一項所述的方法,其中所述探針寡核苷酸與所述靶多核苷酸 的單鏈部分中的至少一個串聯(lián)重復(fù)完全地互補(bǔ)。
31.如權(quán)利要求1-27中任一項所述的方法,其中所述探針寡核苷酸與所述靶多核苷酸 的單鏈部分中的至少一個串聯(lián)重復(fù)部分地互補(bǔ)。
32.如權(quán)利要求3所述的方法,其中所述阻斷寡核苷酸與所述靶多核苷酸中的至少一 個串聯(lián)重復(fù)完全地互補(bǔ)。
33.如權(quán)利要求3所述的方法,其中所述阻斷寡核苷酸與所述靶多核苷酸中的至少一 個串聯(lián)重復(fù)部分地互補(bǔ)。
34.如前述權(quán)利要求中任一項所述的方法,其中,在步驟(a)中,在所述靶多核苷酸中 側(cè)翼于串聯(lián)重復(fù)的一個區(qū)域或兩個區(qū)域都為單鏈形式。
35.如權(quán)利要求34所述的方法,其中,在步驟(b)中,所述探針寡核苷酸包含錨定部分, 該錨定部分與所述靶多核苷酸中側(cè)翼于串聯(lián)重復(fù)的區(qū)域互補(bǔ)。
36.如權(quán)利要求3所述的方法,其中,在步驟(a)中,在所述靶多核苷酸中側(cè)翼于串聯(lián)重 復(fù)的一個或兩個區(qū)域都為單鏈形式,并且所述阻斷寡核苷酸包含錨定部分,該錨定部分與 側(cè)翼于所述串聯(lián)重復(fù)的區(qū)域互補(bǔ)。
37.如權(quán)利要求36所述的方法,其中,在步驟(b)中,所述探針寡核苷酸包含錨定部分, 該錨定部分與側(cè)翼于所述串聯(lián)重復(fù)的區(qū)域互補(bǔ),但該側(cè)翼于所述串聯(lián)重復(fù)的區(qū)域不與所述 阻斷寡核苷酸的錨定部分互補(bǔ)。
38.如權(quán)利要求3所述的方法,其中所述阻斷寡核苷酸在其3'(或5')端包含鉗部 分,該鉗部分與在所述探針寡核苷酸的5'(或3')端的鉗部分互補(bǔ)。
39.如權(quán)利要求38所述的方法,其中使用至少兩對不同的阻斷寡核苷酸和探針寡核苷 酸,其中每對阻斷寡核苷酸和探針寡核苷酸各自的鉗部分彼此互補(bǔ)。
40.如權(quán)利要求39所述的方法,其中選擇所述鉗部分的核苷酸序列,以使每對互補(bǔ)的 鉗部分具有不同的Tm。
41.如權(quán)利要求3所述的方法,其中所述步驟(a)和(al)同時進(jìn)行。
42.如權(quán)利要求41所述的方法,其中PCR產(chǎn)生靶DNA(多核苷酸),其中所述靶DNA內(nèi) 的一個或多個串聯(lián)重復(fù)為單鏈形式,并且在所述PCR中使用的引物也包含所述阻斷寡核苷 酸。
43.如權(quán)利要求42所述的方法,其中所述引物在其3'端包含與靶DNA內(nèi)串聯(lián)重復(fù)的 3'端區(qū)域互補(bǔ)的部分,并且在其5'端包含與通過所述引物合成的PCR產(chǎn)物的鏈中的至少 一個串聯(lián)重復(fù)互補(bǔ)的部分。
44.如權(quán)利要求43所述的方法,其中所述引物從3'向5'方向包含(i)與所述靶DNA 內(nèi)串聯(lián)重復(fù)的3'端區(qū)域互補(bǔ)的部分,(ii)任選的間隔子部分,(iii)與通過所述引物合成 的PCR產(chǎn)物的鏈中的側(cè)翼部分互補(bǔ)的錨定部分,和(iv)與通過所述引物合成的PCR產(chǎn)物的 鏈中的至少一個串聯(lián)重復(fù)互補(bǔ)的部分。
45.如權(quán)利要求44所述的方法,其中所述引物進(jìn)一步包含(ν)鉗部分,該鉗部分與探針 寡核苷酸的3'端的鉗部分互補(bǔ)。
46.如權(quán)利要求44所述的方法,其中使用至少兩對不同的PCR引物和探針寡核苷酸,其 中每對阻斷寡核苷酸和探針寡核苷酸各自的鉗部分彼此互補(bǔ)。
47.如權(quán)利要求46所述的方法,其中所述鉗部分的核苷酸序列具有不同的Tm。
48.如權(quán)利要求42所述的方法,其中所述PCR中使用的引物還包含探針寡核苷酸。
49.如權(quán)利要求44所述的方法,其中所述引物進(jìn)一步包含(ν)間隔子部分和(vi)探針 寡核苷酸。
50.如前述權(quán)利要求中任一項所述的方法,其中選擇所述探針寡核苷酸,以允許根據(jù)其 解鏈溫度(Tm)區(qū)分所述靶多核苷酸的單鏈部分中串聯(lián)重復(fù)的數(shù)目。
51.如權(quán)利要求50所述的方法,其中由所述探針寡核苷酸和包含所述串聯(lián)重復(fù)的靶 DNA的單鏈部分之間形成的雜交體的Tm之間的解鏈溫度差異(Δ Tm)為至少0. 5°C。
52.如前述權(quán)利要求中任一項所述的方法,其中所述雜交步驟(b)在所述靶多核苷酸 的單鏈部分和探針寡核苷酸之間形成的一個或多個雜合體的解鏈點附近的預(yù)定溫度下,或 包含該解鏈點的一定的溫度范圍內(nèi)進(jìn)行。
53.用于確定靶多核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目的系統(tǒng),其中所述靶多核苷酸內(nèi)的一個或 多個串聯(lián)重復(fù)為單鏈形式,所述系統(tǒng)包括(a)經(jīng)標(biāo)記的探針寡核苷酸,其與所述靶多核苷酸的單鏈部分中的至少一個串聯(lián)重復(fù) 互補(bǔ),且所述探針寡核苷酸的至少5個核苷酸與所述靶多核苷酸的單鏈部分中的串聯(lián)重復(fù)互補(bǔ),和(b)阻斷寡核苷酸,其與所述靶多核苷酸中至少一個但并非全部串聯(lián)重復(fù)互補(bǔ)。
54.寡核苷酸,其包含含有與錨定部分結(jié)合的至少兩個串聯(lián)重復(fù)的部分,其中所述錨定 部分的序列和所述至少兩個串聯(lián)重復(fù)在靶多核苷酸中連續(xù)地存在。
55.如權(quán)利要求54所述的寡核苷酸,其進(jìn)一步在其3'端包含鉗部分。
56.如權(quán)利要求54或55所述的寡核苷酸,其是標(biāo)記的寡核苷酸。
57.寡核苷酸引物,其用于參與PCR反應(yīng)以擴(kuò)增包含串聯(lián)重復(fù)的靶DNA,所述引物從3' 向5'方向包含(i)與靶DNA內(nèi)串聯(lián)重復(fù)的3'端區(qū)域互補(bǔ)的部分,(ii)任選的間隔子部 分,(iii)與通過所述引物合成的PCR產(chǎn)物的鏈中的側(cè)翼部分互補(bǔ)的錨定部分,和(iv)與 通過所述引物合成的PCR產(chǎn)物的鏈中的至少一個串聯(lián)重復(fù)互補(bǔ)的部分。
58.如權(quán)利要求57所述的寡核苷酸,其進(jìn)一步包含(ν)鉗部分。
59.如權(quán)利要求57所述的寡核苷酸,其進(jìn)一步包含(ν)間隔子部分和(vi)探針寡核苷酸。
60.用于確定靶多核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目的系統(tǒng),所述系統(tǒng)包括權(quán)利要求56所述的 寡核苷酸和權(quán)利要求57所述的寡核苷酸。
61.用于確定靶多核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目的系統(tǒng),所述系統(tǒng)包括權(quán)利要求55所述的 寡核苷酸和權(quán)利要求58所述的寡核苷酸引物,其中所述鉗部分是彼此互補(bǔ)的。
62.如權(quán)利要求61所述的系統(tǒng),其包含兩對或更多對權(quán)利要求55所述的寡核苷酸和權(quán) 利要求58所述的寡核苷酸引物,其中所述寡核苷酸對具有互補(bǔ)的鉗部分。
63.權(quán)利要求54或55所述的寡核苷酸的制備方法,所述方法包括;(a)選擇包含串聯(lián)重復(fù)的靶DNA,(b)獲得串聯(lián)重復(fù)的序列以及一個或多個側(cè)翼區(qū)域的序列,(c)合成寡核苷酸,該寡核苷酸包含含有與錨定部分結(jié)合的至少兩個串聯(lián)重復(fù)的部分 和任選的在其3'端的鉗部分,其中所述錨定部分的序列和所述至少兩個串聯(lián)重復(fù)在靶多 核苷酸中連續(xù)地存在。
64.權(quán)利要求57-59中任一項所述的用于參與PCR反應(yīng)以擴(kuò)增包含串聯(lián)重復(fù)的靶DNA 的寡核苷酸引物的制備方法,所述方法包括(a)選擇包含串聯(lián)重復(fù)的靶DNA,(b)獲得串聯(lián)重復(fù)的序列以及一個或多個側(cè)翼區(qū)域的序列,(c)合成寡核苷酸,該寡核苷酸從3'向5'方向包含(i)與靶DNA內(nèi)串聯(lián)重復(fù)的3' 端區(qū)域互補(bǔ)的部分,( )任選的間隔子部分,(iii)與通過所述引物合成的PCR產(chǎn)物的鏈中 的側(cè)翼區(qū)域互補(bǔ)的錨定部分,(iv)與通過所述引物合成的PCR產(chǎn)物的鏈中的至少一個串聯(lián) 重復(fù)互補(bǔ)的部分,和任選的(ν)鉗部分,或任選的(ν)間隔子部分,和(vi)探針寡核苷酸。
65.權(quán)利要求60所述的系統(tǒng)的制備方法,所述方法包括(a)選擇包含串聯(lián)重復(fù)的靶DNA,(b)獲得串聯(lián)重復(fù)的序列以及一個或多個側(cè)翼區(qū)域的序列,(c)通過權(quán)利要求63所述的方法制備權(quán)利要求54或55所述的寡核苷酸,其中標(biāo)記所 述寡核苷酸,并且通過權(quán)利要求64所述的方法制備權(quán)利要求57-59中任一項所述的寡核苷
66.如權(quán)利要求1-52或63-65中任一項所述的方法,或者如權(quán)利要求53或60-62中任 一項所述的系統(tǒng),或者如權(quán)利要求54-59中任一項所述的寡核苷酸,其中所述靶DNA是人基 因組DNA。
全文摘要
本發(fā)明涉及用于確定靶多核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目的方法,所述方法包括(a)提供包含所述靶多核苷酸的樣品,其中所述靶多核苷酸內(nèi)的一個或多個串聯(lián)重復(fù)是單鏈形式,(b)使經(jīng)標(biāo)記的探針寡核苷酸與靶多核苷酸的單鏈部分雜交,其中所述探針寡核苷酸與所述靶多核苷酸的單鏈部分中的至少一個串聯(lián)重復(fù)互補(bǔ),并且所述探針寡核苷酸中的至少5個核苷酸與所述靶多核苷酸的單鏈部分中的串聯(lián)重復(fù)互補(bǔ),和(c)基于所述探針寡核苷酸與所述靶多核苷酸的單鏈部分的雜交,確定所述靶多核苷酸內(nèi)串聯(lián)重復(fù)的數(shù)目。
文檔編號C12Q1/68GK101896623SQ200880119985
公開日2010年11月24日 申請日期2008年10月21日 優(yōu)先權(quán)日2007年10月22日
發(fā)明者麗貝卡·霍華德, 保羅·德貝納姆, 尼特亞·加雷, 戴維·戈登·麥克道爾, 戴維·約翰·弗倫奇, 湯姆·布朗 申請人:Lgc有限公司