專利名稱:對dna的特性分析的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及對DNA,尤其是cDNA進行特性描述的方法,由此可以從一群DNA中鑒定出某DNA。本發(fā)明還涉及檢測DNA的方法。
背景技術(shù):
在分子生物學(xué)的許多領(lǐng)域,特別是在分析基因的表達方式時,分析復(fù)雜的核酸樣群是一個常見的問題。已經(jīng)發(fā)展出了許多方法能夠同時分析整個mRNA樣群或其對應(yīng)的cDNA樣群,使我們能夠開始理解基因的體內(nèi)表達方式。
“扣除克隆(subtractive clone)”法(Lee等,Proc.Nat.Acad.Sci.USA 88,2825-2829)能夠鑒定在兩種相關(guān)細胞類型中有著不同表達的mRNA(或者,更多的是其對應(yīng)cDNA)。通過將一個細胞類型文庫的cDAN與大大過量的相關(guān)但不同細胞類型的mRNA雜交,可以選擇性地去除兩種相關(guān)細胞類型共有的cDNA.與第一類型cDNA互補的第二細胞類型的mRNA將與之形成雜交雙鏈。存在著許多酶能夠降解這樣的雜交雙鏈,將雜交雙鏈去除從而富集了剩下的樣群,這是第一細胞類型特有的cDAN。該方法能夠得出相關(guān)細胞類型間有關(guān)基因表達差異的高度特異性比較信息,并且已經(jīng)在分離稀有cDAN中獲得中等程度的成功。
“差異展示(differential display)”法(Laing和Pardee,Science 257,967-971,1992)利用PCR引物選擇性擴增某mRNA樣群的特定亞組來分類mRNA。用通用聚T引物處理mRNA樣群以擴增一條鏈,并用約10核苷酸的特異性引物處理以擴增特異性更高的反向鏈。由此,只有具有第二引物序列的mRNA被擴增;第二引物越長,總cDNA樣群被擴增的比例越小,或所用長度的給定序列越小。擴增所得的亞群然后可進行克隆用于篩選和測序,或者可以在測序凝膠上簡單地分離所得片段。與(例如)扣除克隆法相比,在此類方案中,低拷貝數(shù)mRAN不大可能丟失,因此可能更具有重復(fù)性。雖然此方法比扣除克隆法更通用,但它需要耗費時間的分析。
“分子指標(biāo)(molecular indexing)”法(PCT/GB93/01452)使用銜接子(adaptor)分子群與用Ⅱs型限制性核酸內(nèi)切酶切割核酸所產(chǎn)生的多義(ambiguous)粘端雜交,以分類切斷的片段。使用特殊工程化的銜接子,可以類似于差異展示的方式,特異性地固定或擴增,或克隆特定的片段亞組,但是達到了更大程度的控制。同樣,需要耗費時間的分析。
Kato法(Nucleic Acids Research 12,3685-3690,1995)通過將末端cDNA片段分類成亞群,然后選擇性擴增特定的cDNA片段亞組舉例說明了上述分子指標(biāo)法并實現(xiàn)了對cDAN樣群的分析。使用Ⅱs型限制性核酸內(nèi)切酶和銜接子進行分類,銜接子也帶有引物位點,與通用聚T引物相連的該位點能夠象在差異展示中那樣選擇性擴增末端cDNA片段。它可能比差異展示更精確,因為它進行了更細的分類一個給定亞組中將只有大約100個cDNA,分類可以與特定的序列特性相關(guān)聯(lián)而不是使用試錯(trialand error)選出的引物。
“基因表達的連續(xù)分析(serial analysis)”法(SAGE,Science 270,484-487,1995)能夠識別在給定細胞類型中表達的mRNA(或者,更多的是其對應(yīng)cDNA)。它還提供有關(guān)那些cDNA水平的定量信息。該方法包括用銜接子和Ⅱs型限制性核酸內(nèi)切酶從樣群中的每個cDNA分離出一個“標(biāo)簽(tag)”。標(biāo)簽是核苷酸數(shù)固定的cDNA序列的樣品,該固定的核苷酸數(shù)足以在樣群中特異性地鑒定出該cDNA。然后使各標(biāo)簽連在一起并測序。該方法提供了基因表達的定量信息,而且便于鑒定新的cDAN。但是,由于需要進行大量的測序,所以該方法極其費時。
上述方法都比較繁復(fù),依賴于常規(guī)的凝膠測序法。而且,這些方法都需要采用PCR擴增,容易產(chǎn)生人為假象。
包括雜交載網(wǎng)、芯片和陣列的方法較有利,因為它們避免了用于測序的凝膠法,而且是定量性的。它們可以完全在溶液中進行,因此容易自動化。這些方法具有兩種形式。第一種將靶核酸固定到與靶核酸末端序列互補的寡核苷酸陣列上。固定后通過單堿基法對那些片段進行部分測序,例如,使用Ⅱs型限制性核酸內(nèi)切酶和銜接子。該方法具體由Brenner在PCT/US95/12678中提倡。
第二種形式涉及N個bp長度的寡核苷酸陣列。此陣列在載網(wǎng)上的特定點上帶有4N種可能的寡核苷酸。核酸以單鏈形式與陣列雜交。通過熒光標(biāo)記各核酸,并確定載網(wǎng)上發(fā)出熒光的點來檢測雜交,由此確定核酸與之結(jié)合的寡核苷酸。熒光標(biāo)記還提供有多少核酸與給定寡核苷酸雜交的定量信息。對各核酸相對數(shù)量信息的了解應(yīng)該足以重建雜交樣群的序列和數(shù)量。Lehrah在許多論文中提出過該方法,Nucleic Acids Research 22,3423具有最新的有關(guān)論述。該方法的缺點在于,構(gòu)建大型寡核苷酸陣列有極高的技術(shù)要求而且昂貴。
發(fā)明概述本發(fā)明提供了一種對cDNA進行特性分析的方法,它包括(a)用第一取樣核酸內(nèi)切酶在第一取樣位點切割一群含單一或多種cDNA或其分離片段的樣品,以產(chǎn)生各cDNA或其分離片段的第一和第二次級片段,所述的cDNA或其分離片段各包含一段與mRNA 3’聚末端A互補的鏈并帶有尾序列,所述的第一取樣位點相距靠近尾序列的參照位點已知距離,所述的次級片段各包含既定長度和未知序列的粘端序列,第一次級片段具有尾序列;(b)根據(jù)粘端序列將第一或第二次級片段分類成亞群,并記錄各亞群的粘端序列作為第一粘端;(c)在各亞群中用第二取樣核酸內(nèi)切酶在第二取樣位點切割次級片段以產(chǎn)生各次級片段的次次級片段。所述的酶與第一取樣核酸內(nèi)切酶相同或不同,所述的第二取樣位點相距第一取樣位點已知距離,次次級片段包含既定長度和未知序列的第二粘端序列;和(d)測定各第二粘端的序列;其中,各次級片段的第一和第二粘端序列長度之和為6至10;參照位點和第一及第二粘端的序列和相對位置,特征性地說明了各個cDNA?;蛘哂玫谝蝗雍怂醿?nèi)切酶切割的樣品包含如下所得cDNA的分離片段,即用限制性核酸內(nèi)切酶切割含一種或多種cDNA樣群的樣品,和分離限制性位點在參照位點上的片段。
本發(fā)明涉及能將各種方法產(chǎn)生的cDNA樣群分類成為亞群或亞組的方法。該方法還可以鑒定一個亞組內(nèi)的單個分子,而且它可以測定這些個體分子的量。更具體地說,本發(fā)明能夠分析特定細胞類型的cDNA樣群,以得出該細胞基因表達的全貌。該全貌將揭示存在著怎樣的cDNA及各自存在多少量。然后,據(jù)此應(yīng)能夠確定細胞內(nèi)mRNA的最初量,這可以通過與可直接測得其體內(nèi)水平的已知管家基因的表達對比來校準(zhǔn)cDNA量。
以人基因組內(nèi)大約80,000個的總cDNA樣群為例,不必對完整的cDNA測序來特異性地鑒定其存在;只要幾個堿基對的短“簽名”(Signature,即特異性的短序列)就足以特異性地鑒定全部cDNA。而且,假如在今后幾年完成了全部人類基因組的測序,應(yīng)能夠用該方法得到的簽名從序列數(shù)據(jù)庫中獲得原始cDNA的全部序列。利用已有的不完整的數(shù)據(jù)庫,沒有從該數(shù)據(jù)庫中取回(reture)任何序列的簽名就可能是新的,而且,該方法將很方便地分離它們以完成測序。如果一個給定簽名取回了一個以上的序列,則本方法能夠通過獲取特異性來自有意義序列的進一步序列資料而方便地分辨取回的序列。這是本發(fā)明極大地優(yōu)于SAGE之類方法的一個特征。
Velculescu等,Science 270,484-487(1995)已經(jīng)用各種可能的9bp序列(開始于一個特定的參照位點,即其“錨定酶”切割位點)來檢測GenBank序列數(shù)據(jù)庫87發(fā)行版本中的人序列,他們的結(jié)果表明,用一個9bp序列,95.5%的標(biāo)簽對應(yīng)于獨特的轉(zhuǎn)錄產(chǎn)物或高度保守性(至少250bp以上有>95.5%的序列相同)轉(zhuǎn)錄產(chǎn)物家族。將標(biāo)簽中bp數(shù)增加到11bp,用于測試數(shù)據(jù)庫,結(jié)果,從數(shù)據(jù)庫取回一段以上序列的標(biāo)簽數(shù)只下降了6%。
在統(tǒng)計學(xué)上,可用Bayer定理計算具有相同“簽名”的兩序列是同一序列的可能性(概率)
其中“/”表示“假使”,類似地,
(1)除以(2)得
其中,N是簽名中的堿基數(shù)。顯然,4N將隨N迅速上升。在先同一序列概率是已知的兩條隨機序列為同一序列的概率。就一個非多余序列數(shù)據(jù)庫來說,該值實際上為零。所以,我們有4N個簽名來檢索一個人序列數(shù)據(jù)庫。這種分析方法采用概率相同而空間上無關(guān)的堿基,對真的序列來說它們顯然不是真的。如果存在堿基的空間相關(guān)性等,可能需要大得多的簽名,但是正如Velculescu等的分析所得出的那樣,情況并不如此,簽名的加長并不提高序列分辨率;如前所述,當(dāng)人基因組可能含有約80,000種序列(其中大量密切相關(guān))時,9bp已足夠。8bp的簽名提供了65536種不同的簽名。為了實驗?zāi)康?,即為了分析組織樣品,這將足以分辨出據(jù)估計一般細胞內(nèi)的約15000種不同的cDNA,但是,有可能許多簽名將取回一段以上的序列。幸運的是,如后文所述,這可以通過進一步的分析方便地加以分辨。
所以,至少對人cDNA而言,各次級片段的第一和第二粘端序列的長度之和宜為8,各粘端的長度宜為4。
非人類cDNA也可以用本發(fā)明方法方便地加以分析。用類似于后文所述的優(yōu)化程序,根據(jù)對特定物種估計的cDNA樣群大小來設(shè)定第一和第二粘端序列的長度之和。簽名的大小可隨待分析基因組的大小而異。對更普通的核酸樣群也可以進行分析,例如質(zhì)粒或細菌或病毒小基因組產(chǎn)生的限制性酶切片段。對其它類似方式產(chǎn)生的樣群也可以類似地加以分析。
當(dāng)用限制性核酸內(nèi)切酶從cDNA切下片段時,較好的是,第一取樣核酸內(nèi)切酶與第一識別位點結(jié)合,并在相距限制性核酸內(nèi)切酶限制性位點既定距離的第一取樣位點切斷。較好的是,第一識別位點在第一銜接子寡核苷酸內(nèi),該寡核苷酸與分離片段的限制性位點雜交或連接。在此方法中,分離片段需要不含第一取樣核酸內(nèi)切酶的識別位點。較好的是,使用嚴(yán)謹(jǐn)性低的限制性核酸內(nèi)切酶來產(chǎn)生cDNA片段,例如識別4堿基對結(jié)合位點的酶(例如NlaⅢ,它在CATG處切割,產(chǎn)生一4bp的粘端)。如果需要識別的結(jié)合位點太大,在特定cDNA中沒有可識別的結(jié)合位點的可能性將太高。
如果不使用限制性核酸內(nèi)切酶,第一取樣核酸內(nèi)切酶可結(jié)合參照位點并在相距參照位點既定距離的第一取樣位點切割。在這兩種安排中,都必需使用參照位點,因為該位點提供確立各種“簽名”所需的信息。
關(guān)于分析cDNA樣群,必需注意到這一步驟的重要性。用“參照酶”(即限制性核酸內(nèi)切酶或,第一取樣酶)切割固定的cDNA將產(chǎn)生已知終端位于cDNA最近3’端的參照位點處的片段。要記住,目的是檢索數(shù)據(jù)庫,這大大減少了從最靠近3’末端限制性位點開始的檢索(見圖8)。它還提供有關(guān)“簽名”位置的其它空間信息,即8bp簽名與參照位點(圖8中的兩方框)之間有確定的間隔。與出現(xiàn)在全部cDNA或整個基因組中隨機位置的一段給定8bp序列相比,與確定的限制性位點具有給定空間關(guān)系的8bp簽名發(fā)生的可能性較低。由此提高了8bp簽名的確定能力,使得它足以特異性地鑒定所有或至少絕大部分cDNA。
確保在加入帶有取樣核酸內(nèi)切酶識別位點的銜接子之前,cDNA片段內(nèi)沒有取樣核酸內(nèi)切酶識別位點也很重要。為了避免這一問題,可以在使用限制性核酸內(nèi)切酶之前先用取樣核酸內(nèi)切酶處理cDNA,或者,為此,取樣核酸內(nèi)切酶和限制性核酸內(nèi)切酶可以是同一酶。這將產(chǎn)生具有多義粘端的片段。如果要使用不同的“參照酶”,這些粘端的大部分將隨后被“參照酶”的剪切而去除,因為可能更經(jīng)常地選這些酶來切割。其余的那些將在分類過程中說明。這意味著實際上將有兩種“參照酶”,在此后就兩種可能的參照序列進行數(shù)據(jù)庫檢索中,必需對此加以考慮。這可能取回較多的針對各種不同序列的各個8bp區(qū)域的序列,所以,最好避免使用兩種不同的參照酶。
作為較好的另一種方法,為了確保取樣核酸內(nèi)切酶只結(jié)合銜接子內(nèi)的其識別位點而不結(jié)合cDNA中的,可以用5-甲基胞嘧啶合成cDNA,而用普通胞嘧啶核苷酸合成銜接子。只要使用的是甲基化敏感性取樣核酸內(nèi)切酶,該取樣核酸內(nèi)切酶將只結(jié)合銜接子內(nèi)的其識別序列。
較好的是,第二取樣核酸內(nèi)切酶結(jié)合第二識別位點并在相距第一取樣位點既定距離的第二取樣位點切割。用這種方法,由第一和第二取樣位點獲取信息(以第一和第二粘端序列的形式),而且還知道它們彼此之間和距離參照位點的距離。
較好的是,第一和第二取樣核酸內(nèi)切酶各自含有Ⅱs型核酸內(nèi)切酶,它們可以彼此相同或不同。第二識別位點可以與第一粘端雜交或連接的第二銜接子寡核苷酸內(nèi)。
本發(fā)明方法獲得的是最小的序列信息,所以不依賴于過多的測序。它不需要用常規(guī)凝膠法來獲取基本序列信息。因為整個過程在溶液中進行,其中的各步驟可以由一臺液體處理自動化設(shè)備(liquid-handling robot)實施,所以,該方法可高度自動化??梢栽谧詣酉到y(tǒng)中,同樣獲得細胞全部cDNA樣群的序列信息。
混合核酸樣群↓將核酸分類成亞組↓在亞組內(nèi)同時對樣品序列或?qū)Ψ肿舆M行特性分析用上述取樣程序,本方法避免了過多的測序,來產(chǎn)生一樣群內(nèi)各cDNA的簽名。這些簽名的較好的形式是5’-CATGNNNNNXXXXNNNNNYYYYNNN…NNNAAAAAAAA-3’參照…間隔…樣品1…間隔…樣品2…未知間隔…聚A尾序列較好的是,從一固定的cDNA樣群來獲取這種簽名,但是顯然,可以從一序列內(nèi)的任意位置獲取簽名,但是如果要令基本序列資料有用,它必需來自各待比較序列中相同的確定的參照位點。cDNA樣群最好用例如固相基質(zhì),在3’末端的聚A尾序列來固定化。簽名的前4bp是已知的,因為它對應(yīng)于可能來自低嚴(yán)謹(jǐn)性常規(guī)Ⅱ型限制性核酸內(nèi)切酶的參照位點。這可以用來將cDNA樣群片段化,先產(chǎn)生一個參照點,從這點取樣產(chǎn)生細胞內(nèi)各個cDNA的獨特簽名信息。通常,下一個4bp是“第一取樣核酸內(nèi)切酶”(最好是Ⅱ型限制性核酸內(nèi)切酶)在距離“參照位點”已知數(shù)量bp(該數(shù)量對一個樣群內(nèi)的各個cDNA都是相同的)處獲得的。這4bp是未知的,但顯然只有256種可能性。按以下分類程序所述,用帶有與可能序列之一互補的微珠,分離出對應(yīng)于各種可能4bp序列的亞組,可以確定這些4bp。通常,再下一個4bp也可能用相同的Ⅱs型“取樣酶”在相距第一取樣序列已知距離(對一個樣群內(nèi)的各個cDNA都是相同的)處產(chǎn)生,并且可以如后文所述用“銜接子循環(huán)”來確定。所以,對每個cDNA而言,我們有一個已知限制性位點,它是同類位點中聚A尾序列之前cDNA上的最后一個,并與一已知長度cDNA序列樣品間隔已知距離。該樣品又與下一樣品間隔已知數(shù)量的bp,且第二樣品的長度也是確定了的。
正如用當(dāng)前可得酶所測定的那樣,樣品長度可達5bp。樣品之間或第一樣品和參照位點之間的距離可達20堿基,但是確切距離并不重要,除非必需知道這點。限制性核酸內(nèi)切酶的切割序列可以是任意長度的,只要它是被Ⅱs型限制性核酸內(nèi)切酶所識別的序列,但在實踐上說來,必需確保該酶實際上切割每個cDNA,并確保剩余的cDNA末端片段有適當(dāng)長度,以便隨后用取樣核酸內(nèi)切酶來取樣。
顯然,如果用一限制性核酸內(nèi)切酶來剪切核酸樣群,核酸片段的兩端都將是粘端,在大多數(shù)情況下,兩端的粘端是不同的。這可能為分類分離過程帶來問題。
為了本發(fā)明的目的,使用mRNA避免了這一問題,因為mRNA的3’末端UTR特征是有聚A尾。這個聚A尾可用來將存在的各mRNA的一個末端,通過附著在基質(zhì)表面的互補聚T寡核苷酸固定到基質(zhì)上。這確保了cDNA合成后,只有一個末端暴露于隨后的Ⅱs型限制性核酸內(nèi)切酶的切割。限制性酶切后,所有的非固定片段,即沒有聚A尾的片段都被洗去,而只留下固定末端的片段。本方法的目的是得出足夠的信息來特異性鑒定樣群中存在的每個cDNA分子。假設(shè)人基因組最大總樣群大約為100,000種cDNA,只要末端片段從終止密碼子起長約10至20核苷酸,這應(yīng)該足以獲得各個cDNA的獨特簽名。
Ⅱs型限制性核酸內(nèi)切酶,“取樣核酸內(nèi)切酶”具有以下特性,即它們識別并結(jié)合靶DNA分子內(nèi)一段特殊序列,但是它們在相距該序列確定距離處切割,在限制性酶切產(chǎn)物的被切割端產(chǎn)生已知長度但序列未知的單鏈粘端。
例如,酶fokl產(chǎn)生一個4bp的多義(即未知)粘端,在其識別序列下游9bp處。所以,該多義粘端可能是256種可能的4bp寡核苷酸之一(見
圖1)。還有許多其它Ⅱs型限制性核酸內(nèi)切酶,并且如后文在限制性核酸內(nèi)切酶部分所述,可以用于上述過程。它們的結(jié)合位點可由(例如)圖2所用的銜接子提供。
有許多Ⅱs型限制性核酸內(nèi)切酶可用作上述過程的取樣酶。表1給出了實例的名單,但不包括全部。有關(guān)限制性核酸內(nèi)切酶的文獻總的可參見Roberts,R.,J.Nucl.Acid.Res.18,2351-2365,1988。發(fā)現(xiàn)新酶的速度越來越快,專業(yè)數(shù)據(jù)庫(例如REBase在英特網(wǎng)上可方便地進入)中記錄了更新的名單,使用例如Netscape或Mosaic等軟件包可方便地進入上述數(shù)據(jù)庫,并可在以下全球性Web網(wǎng)址找到http://www.neb.com/rebase/。REBase列出了所有已發(fā)現(xiàn)的限制性酶,并且定期更新,而且它列出各酶的識別序列和同切點酶,及其制造商和供應(yīng)商。根據(jù)需要和酶的切割特性,可以在銜接子內(nèi)為某給定酶特制識別位點間的間隔。(參見圖2)。
酶名稱識別序列切割位點Fokl GGATG9/13BstFslGGATG2/0SfaNⅠGCATC5/9HgaⅠ GACGC5/10BbvⅠ GCAGC8/12表1部分典型的Ⅱs型限制性核酸內(nèi)切酶該過程的要求是在被分析核酸的末端產(chǎn)生多義粘端。這也可以通過控制性使用5’至3’的核酸外切酶來達到。顯然,產(chǎn)生所述粘端的任何方法都滿足該過程的要求。
同樣,為了只切割各個cDNA一次,并最好留下粘端,必需使用低嚴(yán)謹(jǐn)性限制性核酸內(nèi)切酶。但是,任何剪切固定化核酸的方法都能滿足本發(fā)明的要求。Chu,.B.C.F.和Orgel,L.E.在Proc.Natl.Acad.Sci.USA,1985,963-967中報道了位點特異性化學(xué)剪切。也可以使用產(chǎn)生平頭片段的非特異性核酸酶。但是,較好的是使用Ⅱ型限制性核酸內(nèi)切酶,因為它識別其位點準(zhǔn)確、最易處理、價廉且容易得到。
在步驟(b)中用任何適合產(chǎn)生亞群按其粘端序列的分類方法對第一和第二次級片段進行分類。方法之一包括,將次級片段分成一個樣品陣列,各個樣品處在單獨的容器內(nèi);將樣品陣列與一固相親和性基質(zhì)陣列接觸,各固相親和性基質(zhì)具有相同于第一粘端預(yù)定長度的獨特堿基序列,所以,各個樣品都與一個可能的堿基序列接觸從而樣品陣列則與具有預(yù)定長度的所有可能的堿基序列接觸,以便只在各個獨特堿基序列和彼此互補的第一粘端之間發(fā)生雜交;從容器中洗去不雜交的物質(zhì)。
所以,用fokl之類取樣核酸內(nèi)切酶剪切得到的異源核酸樣群可以通過分離出以粘端特定序列為特征的亞組而分類成亞群。例如,可以用帶有粘端(此粘端與靶核酸亞組上的粘端互補)的寡核苷酸包被的微珠來分離此亞群。然后可以分離這些微珠,洗滌并釋放到一個干凈的容器中,就本方法目的而言此容器最好是一個陣列中的一孔。顯然,各種分離cDNA的方法都適用于本發(fā)明,包括將互補寡核苷酸固定到任何不溶性固相載體上。這可以包括親和性層析、惰性微珠和離心等各種類似手段,但是以磁性或非磁性的微珠為佳??梢允褂酶鞣N合適的容器,但是在本方法的一個自動化實施方案中,為了使用液體處理自動化設(shè)備,以孔陣列為佳。
在另一實施方案中,為了產(chǎn)生多義粘端而以Ⅱs型限制性核酸內(nèi)切酶第一次切割產(chǎn)生的cDNA片段,可以用雜交陣列根據(jù)其粘端分成亞群。通常,該方法包括(ⅰ)次級片段與雜交陣列結(jié)合,所述陣列包含一個寡核苷酸組陣列,各組帶有一段獨特的堿基序列,所述堿基序列具有相同于第一粘端的預(yù)定長度并且能夠通過在陣列中的位置來鑒定,所述陣列中存在著預(yù)定長度的所有可能的堿基序列,所以,帶有各自獨特第一粘端的各個亞群在陣列中的一個可鑒定位置雜交;(ⅱ)確定位置來鑒定第一粘端的序列。
對于一個4bp的多義粘端來說,用一個256組寡核苷酸的陣列可分辨所有可能的堿基組合。
理想的是,所用的片段應(yīng)是第一取樣核酸內(nèi)切酶切割產(chǎn)生的游離于溶液中的片段。這些片段在5’末端帶有一個銜接子。為了允許用取樣核酸內(nèi)切酶作第二次切割,陣列上的寡核苷酸必須具有第二取樣核酸內(nèi)切酶的識別位點??梢酝ㄟ^許多方法來完成對第二粘端的測序。使用第二取樣核酸內(nèi)切酶產(chǎn)生了兩個次次級片段。
通常,會產(chǎn)生固定化的片段和游離在溶液中的片段。兩組片段都帶有多義粘端,對它們都可進行分析來測定其它的序列信息。
當(dāng)使用雜交陣列來分類次級片段,在步驟(c)中切割的次級片段最好是與雜交陣列結(jié)合的,使得由其產(chǎn)生的次次級片段仍然結(jié)合在雜交陣列上。在此實施方案中,測定各第二粘端序列的步驟(d)包括,次次級片段在雜交條件下與一個銜接子寡核苷酸陣列接觸,各銜接子寡核苷酸帶有一個標(biāo)記和一段既定長度與第二粘端相同的獨特堿基序列,此陣列包含了既定長度的所有可能的堿基序列,去除不雜交的銜接子寡核苷酸,通過檢測標(biāo)記確定雜交的銜接子寡核苷酸的位置。
該實施方案特別有益,因為這樣的陣列可以構(gòu)建在很小的芯片上,也許為2mm2或更小。這就可以使用盡可能少的試劑,而如此高的濃度可以用來加快銜接子雜交的速度,這正是本方法的限速步驟。
另一種方法是,如果次級片段亞群已經(jīng)被分類,測定各第二粘端序列的步驟包括分離來自步驟(c)的次次級片段,將次次級片段與一個銜接子寡核苷酸陣列循環(huán)接觸,各銜接子寡核苷酸帶有一個標(biāo)記和一段既定長度與第二粘端相同的獨特堿基序列,此陣列包含了既定長度的所有可能的堿基序列;其中所述的循環(huán)包括使陣列中的各銜接子寡核苷酸在雜交條件下與分離的次級片段的各亞群接觸,去除所有不雜交的銜接子,通過測定標(biāo)記確定雜交的銜接子寡核苷酸的存在,然后重復(fù)此循環(huán),直到陣列中的所有銜接子都受到的測試。
本方法的這一特殊部分可稱為“銜接子循環(huán)”。
本方法的這一部分實際上就是通過雜交來測序,可以先以一單個核酸來說明以便理解。假使用一單個核酸,其一端固定于固體不溶性基質(zhì)上,其游離端已如前所述被fokl切割過,由此產(chǎn)生了一段4bp的多義粘端。
為了測定該粘端的序列,可以用銜接子分子來探測固定化的核酸。該分子是具有一段已知序列的4bp寡核苷酸,是256種可能序列中的一種。此銜接子還另外帶有一個熒光探針(和可能的一個取樣核酸內(nèi)切酶的結(jié)合位點)。如果銜接子與靶核酸的多義粘端互補,就會與之雜交,然后有可能使銜接子與靶序列連接??梢韵礈旃潭ɑ|(zhì)去除所有不結(jié)合的銜接子。要確定銜接子是否與固定化的靶核酸雜交,只需測定基質(zhì)的熒光即可。這還將揭示有多少銜接子發(fā)生了雜交,由此可知固定化cDNA的量。檢測雜交情況的其它方法也可用于本發(fā)明。除了熒光探針,還可以使用放射性標(biāo)記銜接子、染料、穩(wěn)定的同位素、標(biāo)記寡核苷酸、酶、碳水化合物生物素,及其它。
構(gòu)建銜接子寡核苷酸是眾所周知的,其細節(jié)和論述可在許多論文中找到,包括Gait,M.J.編輯的“寡核苷酸的合成一種實用方法”,IRL Press,Oxford,1990;Eckstein編輯的“寡核苷酸及其類似物一種實用方法”IRL Press,Oxford,1991;Kricka編輯的“非同位素DNA探針技術(shù)”,Academic Press,San Diego,1992;Haugland,“熒光探針和化學(xué)檢測手冊”,Molecular Probes,Inc.,Eugene,1992;Keller和Manack,“DNA探針,第2版”,Stockton Press,New York,1993;和Kessler編輯的“非放射性標(biāo)記和生物分子檢測”,Springer-Verlag,Berlin,1992。
使用這些銜接子的條件也是眾所周知的。有關(guān)核酸探針雜交條件效果的細節(jié)是可以獲知的,例如在以下文章中Wetmur,Critical Reviews in Biochemistry andMolecular Biology,26,227-259,1991;Sambrook等,“Molecular Cloning:Alaboratory Manual,第2版”Cold Spring Harbour Laboratory,New York,1989;和Hames,B.D.,Higgins,S.J.,“核酸雜交一種實用方法”IRL Press,Oxford,1988。
同樣,銜接子的連接也是眾所周知的,在以下文獻中對連接的化學(xué)方法有所論述Ferris等,Nucleosides and Nucleotides 8,407-414,1989;和Shabarova等,Nucl.Acid.Res.19,4247-4251,1991。
較好的是使用酶連接,而較好的連接酶是T4DNA連接酶、T7DNA連接酶、大腸桿菌DNA連接酶、Taq連接酶、pfu連接酶和Tth連接酶。這些連接酶的詳細信息可參見Lehman,Science 186,790-797,1974;和Engler等,“DNA連接酶”,3-30頁,Boyer編輯的“The Enzymes Vol.15B”,Academic Press,NewYork,1982。使用這些連接酶的方案可參見Sambrook等的上述著作;Barany,PCR方法和應(yīng)用,1:5-16,1991;和Marsh等,Strategies 5,73-76,1992。
如果銜接子與靶核酸的多義粘端不互補,可以試用第二探針,并重復(fù)上述過程,直到對256種可能的探針都進行了測試。
顯然,其中一個探針將是與多義粘端互補的。一旦發(fā)現(xiàn)了該探針,靶核酸的末端也將攜帶一個取樣核酸內(nèi)切酶的結(jié)合位點,該酶將切割靶核酸進一步暴露出堿基供分析,對于靶核酸下一個4bp可重復(fù)上述過程。該相互作用過程可重復(fù),直至整個靶核苷酸序列被測定。
另一方面,本發(fā)明提供了一種鑒定樣品中DNA的方法。該方法包括如上所述對cDNA進行特性分析,以便獲得參照位點和第一及第二粘端的序列和相對位置,將這些序列和相對位置與已知cDNA(例如從DNA數(shù)據(jù)庫中獲得的那些)的參照位點和第一及第二粘端的序列和相對位置作比較以簽定樣品中的各個cDNA。該方法可以用來鑒定單獨一種cDNA或一個cDNA樣群。
另一方面,本發(fā)明提供了一種測試樣品中一種或多種特殊cDNA的方法。該試驗方法包括如前文所述對cDNA樣品進行特性分析的方法,其中的參照位點是既定的,分類步驟(b)中各第一粘端的序列是既定的第一粘端序列,而步驟(d)中的各第二粘端序列通過檢測既定的第二粘端序列來確定。在該試驗方法中,參照位點和既定第一和第二粘端的相對位置特征性地說明了各種特定的cDNA。該試驗方法可用來檢測一種特殊cDNA或一群特殊cDNA的存在。參照位點和第一及第二粘端序列以通過選擇來自一種或多種已知靶cDNA(例如可從一cDNA數(shù)據(jù)庫獲得的那些)的相應(yīng)序列來預(yù)先確定為宜。
以下,將參照實施例和附圖對本發(fā)明進行更詳細的說明。
附圖簡述圖1顯示fokl的限制性酶切活動;圖2顯示對銜接子核苷酸的切割活動;圖3顯示優(yōu)選銜接子寡核苷酸的結(jié)構(gòu);圖4顯示自清除(self-removing)銜接子寡核苷酸的結(jié)構(gòu);圖5顯示寡核苷酸銜接子上的一組多重染色;圖6a-c顯示本發(fā)明實施方案之一的流程圖;圖7a-c顯示本發(fā)明另一實施方案的流程圖;圖8顯示一種檢索序列數(shù)據(jù)庫以分離與簽名對應(yīng)的人cDNA的運算法。
本發(fā)明的方法可用于一群異源的固定化核酸,對它們進行平行分析。要成功用于核酸樣群,本發(fā)明基于以下事實,即從統(tǒng)計學(xué)上說,在用fokl切割后,總樣群中256種分子有一個將帶有一種可能的4bp粘端。估計通常人細胞表達大約15000種不同類型的mRNA。如果一個cDNA樣群由上述分類程序分成256種亞群,各亞群將平均含約60種不同cDNA,此cDNA產(chǎn)生一個大約15000轉(zhuǎn)錄物的mRNA樣群。如果用fokl對它們進行切割,估計幾乎全部都將具有不同的多義粘端(兩段不同的cDNA具有相同的前4bp粘端的機會約為1/1000),所以,對大多數(shù)目的而言,可以假設(shè),一個雜交信號只對應(yīng)一種cDNA類型。所以,隨后加入熒光標(biāo)記的銜接子序列將允許測定出cDNA混合樣群中的末端4bp,總的說來對該樣群中各個cDNA產(chǎn)生9bp的簽名。
只要信號到達光電倍增器,熒光檢測儀通常能夠檢測出單個分子的熒光,所以,為了確保該過程的可靠性,在固定化基質(zhì)設(shè)計時選擇是十分重要的。然而,這意味著,當(dāng)使用熒光標(biāo)記銜接子時,雜交信號是定量性的,這將揭示有多少銜接子分子與固定化片段發(fā)生了雜交。顯然,這與存在的各個cDNA的拷貝數(shù)成正比。所以,各雜交信號還將揭示各個cDNA在樣群中的相對比例。這可能回過來與體內(nèi)mRNA水平相關(guān),通過直接測定體內(nèi)某特定mRNA(以具有高拷貝的為佳,例如管家基因)的量而確定。該含量與通過銜接子循環(huán)測得的mRNA相對量之比將作為計算各種mRNA體內(nèi)原始量的轉(zhuǎn)變系數(shù)。
熒光信號檢測可用易得到的光學(xué)儀器進行。熒光標(biāo)記通常具有最適激發(fā)頻率,和然后在特定波長處由激發(fā)態(tài)回到基態(tài)的熒光。可以用激光在特定頻率進行激發(fā),然后用集光透鏡、光束分離器和信號分布鏡片檢測熒光。由此將熒光信號直接送至光電倍增器,它將光信號轉(zhuǎn)化為可用合適的電子系統(tǒng)解讀的電信號。例如,參見PCT/US95/12678的pp26-28。有關(guān)固相支持物的論述可參見該文獻的第12至14頁。
在將cDNA分類成亞組的過程中獲得了4bp序列的信息,只需要進行銜接子循環(huán)一次就可以獲得測試孔內(nèi)各cDNA的8bp簽名。利用液體處理自動化設(shè)備,這可在分類過程產(chǎn)生的全部256個測試孔同時進行。
確定銜接子內(nèi)fokl的識別位置將確定暴露出下一個4bp是否是該序列中的下一個4bp。或者它們可能與最后的4堿基對部分重疊,產(chǎn)生部分多余的信息,或者它們是更下游遺漏的數(shù)個堿基,所以,只對固定化靶核酸的序列樣品取樣。圖2說明了這一點。銜接子切割方式涉及到那些核苷酸在靶核酸中留下了單鏈,決定于fokl識別位點與靶DNA之間的間隔。序列堿基可以與銜接子1接觸,而在一定間隔后由銜接子2取樣堿基。用銜接子3,將獲得多余信息。銜接子核酸以粗體(字母)顯示,fokl結(jié)合位點以下劃線表示。
不論用何種間隔,涉及4bp寡核苷酸的空間信息被保留了。就本發(fā)明的目的而言,取樣方法足以構(gòu)建出最小最經(jīng)濟的銜接子。圖3顯示了在本發(fā)明中用于獲取簽名的優(yōu)選最小銜接子。fokl的識別位點以粗體表示。
圖6a至c顯示了本發(fā)明方法的一個較好的實施方案。在步驟1中,mRNA通過與生物素化的聚T雜交而固定。這樣能夠在將mRNA逆轉(zhuǎn)錄到親和素化玻珠上后捕獲樣群。在步驟2中,用限制性核酸內(nèi)切酶處理帶有聚A的cDNA,并洗去自由的片段。在步驟3中,加入粘端序列與限制性核酸內(nèi)切酶粘端互補的銜接子寡核苷酸。此銜接子帶有一個第一取樣核酸內(nèi)切酶的識別位點,和任選的一個標(biāo)記。在步驟4中,用第一取樣核酸內(nèi)切酶處理固定的cDNA片段,首次產(chǎn)生具有粘端的固定片段和游離在溶液中的片段(如果要分析的是固定的粘端片段,步驟2和3是可選性的)。在步驟5中,溶液中的自由次級片段與固定片段分離,并被再分入256個測試孔中。每孔含有一個不溶性基質(zhì),以玻珠為佳,此基質(zhì)由粘端與256種可能的粘端之一互補的寡核苷酸產(chǎn)生。這樣,在步驟6中,每孔中的微珠將固定樣品中256種可能粘端中的一種,這樣的粘端將與微珠連接。然后可將沒被固定的片段洗去,由此產(chǎn)生了cDNA片段256個亞群的一個分類樣群。
在步驟8中,將第二取樣核酸內(nèi)切酶加入含有步驟7產(chǎn)生的固定片段亞群的各孔中。在本實施例中,第二取樣酶是BspM1,它的識別位點在附著于微珠的相同取樣銜接子寡核苷酸中。
在溶液中次次級片段和固定在微珠上的次次級片段上都有步驟8產(chǎn)生的多義粘端YYYY。所以,如步驟9所示,通過洗滌固定化基質(zhì)以去除經(jīng)切割的銜接子和試劑,可方便地分離得到次次級片段。
在本方法的此階段,對分析方法的一種選擇是以固定化片段進入“銜接子循環(huán)”進行的。后文將對此進一步加以說明。如果欲經(jīng)銜接子循環(huán)進行分析的片段是游離在溶液中的,那么必須先將它們固定化。第二種選擇是,兩種片段都可以利用許多其它方法來進一步分析。如果片段用熒光染料標(biāo)記,可用雜交芯片來測定末端序列。如果標(biāo)記是固定化效應(yīng)物,那么可以用單堿基法將切割片段分離、固定化并分析。
至于圖6c中步驟10顯示,附著于微珠的次次級片段進入銜接子循環(huán),后文有詳細說明。
在圖7a至c所示的本發(fā)明第二種較好的實施方案中,步驟1至4如前文所述。在步驟5,是固定化片段被分成亞組進行進一步的分析。微珠上的cDNA被分成256份樣品,從微珠上釋放cDNA并回收微珠。在圖7b的第6步中,在各孔中加入磁性微珠,各微珠帶有的寡核苷酸序列與第一取樣核酸內(nèi)切酶產(chǎn)生的256種4bp模糊粘端之一互補。雜交后,回收微珠并洗滌,結(jié)合該片段一個亞群(亞群內(nèi)的片段帶有獨特的第一粘端)的各個微珠被逐一釋放到256個干凈的測試孔中。這些測試孔中含有永久性固定cDNA的基質(zhì),例如親和素化的玻珠。
在步驟8中,改變雜交條件以釋放微珠,然后回收這些微珠。經(jīng)步驟8后,各測試孔中現(xiàn)含有的微珠具有已知第一粘端,向其中加入帶有相同取樣核酸內(nèi)切酶(此處為fikl)識別位點的已知銜接子。步驟9顯示的是加入與固定片段雜交的銜接子寡核苷酸。在步驟10中,加入取樣核酸內(nèi)切酶,產(chǎn)生都帶有第二粘端的自由次級片段和固定化次級片段。和在第一實施方案中一樣,對兩種片段都可作進一步分析。
在第一實施方案的圖6c和第二實施方案的圖7c中對銜接子循環(huán)的應(yīng)用作了進一步的說明。參見圖6c,帶有第二粘端的微珠在第10步用銜接子循環(huán)進行分析。在微珠中加入帶有熒光標(biāo)記的銜接子寡核苷酸。此銜接子含有獨特的粘端,該粘端將與固定化片段中可能存在的256種4堿基第二粘端中的一種互補。各銜接子核苷酸的粘端序列是既定的。洗去未雜交的銜接子并測得熒光。重復(fù)該循環(huán),直至所有的銜接子都被測試過。
如果一個簽名從數(shù)據(jù)庫中取回了一段以上的序列,可償試用已知簽名信息分辨這些序列。如果需要分辨序列,可以用圖4所示形式的銜接子修改銜接子循環(huán)。該圖顯示了一種自清除銜接子,此時,加入取樣核酸內(nèi)切酶會導(dǎo)致銜接子切割只切除由銜接子加給靶核酸的核苷酸,由此重新暴露出正在接受測序的堿基。圖中銜接子中顯示的識別序列是BspM1序列。
在用以上形式的銜接子測定了簽名的第二方框后,就可以將其去除,然后,如果一個特定的簽名取回了一段以上序列,則可加入針對末端4bp的特異性第二銜接子,獲取下一步的樣品。采用合適的取樣酶,根據(jù)要求,這可能是一段寡聚的2、3或4bp的序列,但是顯然,附加序列的堿基越少,確定所得粘端序列所需的銜接子越少。
一旦獲得了某cDNA的序列信息(也許用原有技術(shù)方案),通過使用相同的方法但集中針對一種特定的cDNA本發(fā)明可用于分離該特定cDNA。所以,如果已知簽名的前4bp,就可以用在分類過程中所用的相應(yīng)磁性微珠在全部cDNA中篩選此亞組。然后由銜接子循環(huán)產(chǎn)出的下一個4bp可以用來構(gòu)建一個帶有合適粘端和一個特異性PCR引物的銜接子。然后,可以用通用的聚T引物和銜接子上的特異性引物來擴增所需的cDNA。此擴增片段將提供獨特探針,可用于在Southern或Northern印跡上鑒定完整的cDNA或mRNA。
為了加速銜接子循環(huán),可以成組地加入銜接子,只要各亞組的銜接子以不同的熒光標(biāo)志標(biāo)記以便區(qū)分各銜接子亞組的雜交。這種類型的修飾仍然可以得出定量信息,但測定各個標(biāo)記將需要4種不同的光電倍增器。圖5顯示了在銜接子上使用多種染料,這將可以同時測定成組的銜接子。
“銜接子循環(huán)”的一個潛在問題是確保探針雜交的準(zhǔn)確性。在含所有Watson-Crick堿基對的短寡核苷酸雙螺旋的穩(wěn)定性之間存在著較大的差異。例如,只含腺嘌呤和胸腺嘧啶的雙螺旋不如只含鳥嘌呤和胞嘧啶的雙螺旋穩(wěn)定。在試圖令短寡核苷酸混合物(例如4聚體)與互補靶DNA雜交時,這些穩(wěn)定性的差異可能造成問題。雜交富含A-T的序列需要低溫,而在此溫度富含G-C的序列將與并不完全互補的序列雜交。這意味著,可能發(fā)生某些錯配,可能喪失對富含G-C的序列的特異性。在較高溫度下,富含G-C的序列將發(fā)生特異性的雜交,而富含A-T的序列將不雜交。
為了使這些作用標(biāo)準(zhǔn)化,可對Watson-Crick堿基進行修飾。以下是舉例,但不限制·腺苷酸的類似物2,6-二氨基嘌呤與胸腺嘧啶形成三個氫鍵而非兩個氫鍵,所以形成更穩(wěn)定的堿基對。
·胸腺嘧啶類似物5-丙?;鵧U與腺苷酸形成更穩(wěn)定的堿基對。
·鳥嘌呤類似物次黃嘌呤與胞嘧啶形成兩個氫鍵而非三個氫鍵,所以形成較不穩(wěn)定的堿基對。
以上以及其它可能的修飾可能使溫度范圍縮小,在此溫度范圍內(nèi),短核苷酸的隨機混合物能夠特異性地與它們的互補序列雜交。
還可以設(shè)計帶有能結(jié)合多個堿基的堿基類似物的更小的銜接子組,所述的類似物例如脫氧肌苷、2-氨基嘌呤等(Kong Thoo Lin等,Nucl.Acid.Res.,20,5149-5152)。這樣的組可能具有以下形式的銜接子GGATGGGATGCCTACAANGCCTACANTGN代表該位置上的所有4種堿基。所以,上述各個銜接子代表了一組4種銜接子。上面的兩組只具有一個共有成員,每組與其它四組有一個共有成員。N在粘端的第3位,只有64組,類似地,N在粘端的第2位,也只有64組。所以,為了特異性地鑒定每種堿基,可以使用128組銜接子而非全部256組。為了分辨重疊組,可能需要有關(guān)256種樣品中的每一個cDNA數(shù)量的某些最初信息。用于該方法的經(jīng)分類的cDNA組將平均具有60種cDNA,它們可以在測序凝膠上加以分辨。如果進行了放射性標(biāo)記或熒光標(biāo)記,可以測定各種cDNA的量。其價值可能在于節(jié)省時間,因為在銜接子循環(huán)中加入每一組銜接子都需要花約1小時使雜交完全。所以,任何加快該過程的方法都可能有用,而且制作凝膠的附加勞動也是值得的。
顯然,也可以使用更大的組織樣品。如果可以用“擺動(wobble)”微珠來減少簡并性,構(gòu)建前述的多余組將比較便宜。
已經(jīng)提出了多種分析核酸的單堿基法,也許都適用于本發(fā)明。其中大多數(shù)避免了DNA測序的凝膠技術(shù),可能適合平行分析上述分類過程產(chǎn)生的亞群。單堿基法已公開,可參見,例如美國專利5,302,509;WO91/06678;J.D.Harding和R.A.Keller,Trends in Biotechnology 10,55-58,1992;WO93/21340;Canard等,Gene 148,1-6,1994;Metzker等,Nucl.Acid.Res.,22,4259-4267,1994;PCT/US95/03678和PCT/GB95/00109。
在本發(fā)明中還可以使用雜交芯片、載網(wǎng)和陣列。一個寡核苷酸陣列只需含有256種寡核苷酸,它們分別對應(yīng)于用“取樣酶”第二次處理cDNA片段產(chǎn)生的256種可能的4bp粘端。如果被分析的片段用熒光染料標(biāo)記,可以從載網(wǎng)上看到熒光的位置來確定cDNA各亞組內(nèi)的粘端。在用雜交載網(wǎng)分析時也將以和“銜接子循環(huán)”相同的方式提供定量信息。這類方法可參見Lehrach et Poutska,Trends Genet.2,174-179,1986;和Pevzner等,Journal of Biomolecular Structure and Dynamics 9,399-410,1991。
由于獲取了更多的信息,就可能開發(fā)出更多的方法來利用(例如)數(shù)據(jù)庫信息。
顯然,通過使用本發(fā)明方法,將獲得簽名以及它們對應(yīng)的基因的簽名數(shù)據(jù)庫。據(jù)估計可能有多達10,000條管家基因。為了眾多目的,研究者感興趣的是組織特異性cDNA。管家基因的存在是肯定的,所以,除非為了校準(zhǔn)表達水平,在每次使用該方法時都必須對它們進行鑒定是極大的浪費。如果它們簽定的基因是已知的管家基因,采用銜接子循環(huán)有可能忽略某些cDNA亞組或者遺漏某些銜接子。這將大大加快了解細胞cDNA全貌的過程。而且,很可能大多數(shù)銜接子將不與任何序列雜交。如果組織特異性基因是已知的,所要的只是豐度信息,那么只需要使用對應(yīng)于所需簽名的銜接子即可。
這類過程中的修飾可能需要液體處理自動化設(shè)備,因為它們在程序處理上有靈活性。
作為進一步的改進,可以優(yōu)化限制性酶的選擇。因為在活的生物體基因組內(nèi),堿基間的空間關(guān)系和核苷酸頻度不是隨機的,憑經(jīng)驗可能發(fā)現(xiàn),使用8bp的簽名,有些取樣酶組合比其它組合能分辨更多的序列,這顯然具有極大的價值,因為這將節(jié)省用于分辨返回多條序列的簽名的時間。
同樣,一旦建立了一個細胞類型特異性基因數(shù)據(jù)庫,將可能不需要分辨步驟,因為將會知道在給定細胞類型中將有哪些基因、因而有哪些簽名。
分析cDNA以確定特定基因的等位序列變異是極具開發(fā)價值的另一用途,繼而分析這些改變?nèi)绾胃淖兞嘶蛟诩毎麅?nèi)的表達方式。等位變異可能改變簽名,而這類作用將只有通過使用本發(fā)明才會顯現(xiàn),而且就長遠來看,可以形成另外的極有用的數(shù)據(jù)庫來改進本發(fā)明的用途。
實施例實驗設(shè)計三種不同的PCR產(chǎn)物用來代表3種不同表達水平的基因。用于該目的的PCR產(chǎn)物是陰離子交換蛋白(AE1)的外顯子14、16和19,因為我們的實驗室已經(jīng)對這些PCR產(chǎn)物進行了優(yōu)化。它們將被稱為AE14、AE16和AE19。
這些產(chǎn)物被捕捉到Dynalbead上(通過在PCR引物之一內(nèi)引人生物素)并有效地代表被捕捉的cDNA。AE16的濃度是AE14的一半,而AE19的濃度是AE14的五分之一。
AE14的序列ccaaagctgggagagaacagaatgccttggttttctgctgcagatcttccaggaccacccactacagaagacttataactacaacgtgttgatggtgcccaaacctcagggccccctgcccaacacagccctcctctcccttgtgctcatggccggtaccttcttctttgccatgatgctgcgcaagttcaagaacagctcctatttccctggcaagtcagcataccctcctcgcctgtccttgccaacactgcAE16的序列ctgggagaatgccagggaaaggtctctgcctcccaccctcccaggcccagcccccaccctgtctctcacgtggtgatctgagactccaggaatatgaggatgaagaccagcagagcaggcagggcggaggcaaaatcatccagatgggaaactcggaacgcaagcccagtgggtggatgacccagccccgggctgaggagttgacaccttgaagccatcaggcaccgagagtttctgtgggagggggtagcaggtaagaatgccaagggcAE19的序列g(shù)tgataggcactgaccccagcctccgcctgcaggtgaagacctggcgcatgcacttattcacgggcatccagtcatctgcctggcagtgctgtgggtggtgaagtccacgccggcctccctggccctgcccttcgtcctcatcctcactgtgccgctgcggcgcgtcctgctgccgctcatcttcaggaacgtggagcttcagtgtgtgagtggctgcctgggcctggggcacaagagactgggagcatgcg在捕捉之后,先用高頻切割酶Sau 3Al消化。該酶識別序列GATC。
由此產(chǎn)生各種產(chǎn)物的如下4bp突出端AE14TTCCAGGACCACC...
CTAGAAGGTCCTGGTGG...
AE16TGAGACTCCAGGAATAT...
CTAGACTCTGAGGTCCTTATA...
AE19ATCTGCCTGGCAG...
CTAGTAGACGGACCGTC...
以下銜接子與Sau 3Al暴露出的4bp突出端互補并含有一個FokⅠ位點,將這些銜接子與捕獲片段連接。
銜接子SauFAMFAM-CTAGAGGACGATCGA.GGATG.
GATCTCCTGCTAGCT.CCTAC.GATC|FokⅠ位點這將產(chǎn)生以下序列AE14FAM-CTAGAGGACGATCGA.GGATG.GATC.TTCCAGGACCACC…GATCTCCTGCTAGCT.CCTAC.CTAG.AAGGTCCTGGTGG…AE16FAM-CTAGAGGACGATCGA.GGATG.GATC.TGAGACTCCAGGAATAT…GATCTCCTGCTAGCT.CCTAC.CTAG.ACTCTGAGGTCCTTATA…AE19FAM-CTAGAGGACGATCGA.GGATG.GATC.ATCTGCCTGGCAG…GATCTCCTGCTAGCT.CCTAC.CTAG.TAGACGGACCGTC...
然后用FokⅠ消化上述序列,它在相距GGATG 9個和13個堿基處切割,并向溶液中釋放以下片段AE14FAM-CTAGAGGACGATCGA.GGATG.GATC.TTCCAGATCTCCTGCTAGCT.CCTAC.CTAG.AAGGTCCTGAE16FAM-CTAGAGGACGATCGA.GGATG.GATC.TGAGAGATCTCCTGCTAGCT.CCTAC.CTAG.ACTCTGAGGAE19FAM-CTAGAGGACGATCGA.GGATG.GATC.ATCTGGATCTCCTGCTAGCT.CCTAC.CTAG.TAGACGGAC
然后,通過與微滴板上3個不同的測試孔連接來捕獲切斷的片段,各測試孔含有一特異性銜接子(含有BbvⅠ的識別位點“GCAGC”),模擬分成256亞組的第一階段,并提供前4bp。BbvⅠ在相距GCAGC 8個和12個堿基處切割。
全序列的銜接子AE14的銜接子(銜接子Bbv14)生物素-N-GCAGC.AGA.
N-CGTCG.TCT.CAGG|BbvⅠ位點AE16的銜接子(銜接子Bbv16)生物素-N-GCAGC.AGA.
N-CGTCG.TCT.CTCCAE19的銜接子(銜接子Bbv19)生物素-N-GCAGC.AGA.
N-CGTCG.TCT.GTCC其中的N是若干堿基。
由此產(chǎn)生以下序列AE14的序列生物素-N-GCAGC.AGA.GTCCTGGAAGATC.CATCC.AGCTAGCAGGAGATCN-CGTCG.TCT.CAGGACCTTCTAG.GTAGG.TCGATCGTCCTCTAG-FAMAE16的序列生物素-N-GCAGC.AGA.GGAGTCTCAGATC.CATCC.AGCTAGCAGGAGATCN-CGTCG.TCT.CCTCAGAGTCTAG.GTAGG.TCGATCGTCCTCTAG-FAMAE19的序列生物素-N-GCAGC.AGA.CAGGCAGATGATC.CATCC.AGCTAGCAGGAGATCN-CGTCG.TCT.GTCCGTCTACTAG.GTAGG.TCGATCGTCCTCTAG-FAM此時,通過FAM標(biāo)記的熒光來測定濃度,并測定前4個堿基(XXXX)。
接著,用BbvⅠ消化上述片段,暴露出下一個4bp:
AE14的序列生物素-N-GCAGC.AGA.GTCCTN-CGTCG.TCT.CAGGACCTTAE16的序列生物素-N-GCAGC.AGA.GGAGTN-CGTCG.TCT.CCTCAGAGTAE19的序列生物素-N-GCAGC.AGA.CAGGCN-CGTCG.TCT.GTCCGTCTA消化之后,將與3種不同4bp突出端互補的3種不同銜接子與各測試孔連接,依次在各階段模仿“銜接子循環(huán)”和熒光測定。
這些銜接子是AE14(銜接子C14)GGAA.GATCCTGGACAGTTGCTAGGACCTGTCAAC-FAMAE16(銜接子C16)CTCA.GATCCTGGACAGTTGCTAGGACCTGTCAAC-FAMAE19(銜接子C19)AGAT.GATCCTGGACAGTTGCTAGGACCTGTCAAC-FAM通過熒光測定,成功的連接給出了濃度信息和此“標(biāo)簽”(Tag)的后4個堿基(YYYY)。
標(biāo)簽-GATC.YYYY.N.XXXXGATC對應(yīng)于Sau 3Al位點,F(xiàn)okⅠ消化揭示了頭4個堿基XXXX,間隔未知堿基N,對應(yīng)于BbvⅠ暴露出的下4個堿基的是YYYY。
材料和方法銜接子序列及制備SauFam5′-FAM-CTAGAGGACGATCGAGGATG-3′3′-GATCTCCTGCTAGCTCCTACCTAG-PO4-5′“Bbv”銜接子Bbv145′生物素-6C-CCTAGACTAGAGGACCGATCGAATCAGCAGCAGA-3′3′-GATCTGATCTCCTGGCTAGCTTAGTCGTCGTCTCAGG-PO4-5′Bbv165′生物素-6C-CCTAGACTAGAGGACCGATCGAATCAGCAGCAGA-3′3′-GATCTGATCTCCTGGCTAGCTTAGTCGTCGTCTCCTC-PO4-5′Bbv195′生物素-6C-CCTAGACTAGAGGACCGATCGAATCAGCAGCAGA-3′3′-GATCTGATCTCCTGGCTAGCTTAGTCGTCGTCTGTCC-PO4-5′循環(huán)銜接子C145′FAM-CAACTGTCCAGGATC-3′3′-GTTGACAGGTCCTAGAAGG-PO4-5′C165′FAM-CAACTGTCCAGGATC-3′3′-GTTGACAGGTCCTAGACTC-PO4-5′C195′FAM-CAACTGTCCAGGATC-3′3′-GTTGACAGGTCCTAGTAGA-PO4-5′BioFAMFok5′生物素-GGTCACTTAGATCGATCCATGAGGATGCTTCATTCTGATTCAGTCC-3′3′-CCAGTGAATCTAGCTAGGTACTCCTACGAAGTAAGACTAAGTCAGG-FAMBioG5′生物素-GCATCTGGAGTCTACAGTCGTCTATTGACG-3′3′-CGTAGACCTCAGATGTCAGCAGATAACTGCCGGC-PO4-5′GCCG5′FAM-GCATCAGGATGTACAG-3′3′-CGTAGTCCTACATGTCGCCA-PO4-5′FAM-熒光素PO4-磷酸所有引物都購自O(shè)swell DNA Services。
如下制備各種銜接子,在Teckne Dryblock中將含有20pmol/μl濃度的各種引物的200μl TE在90℃加熱,然后經(jīng)2小時令模塊(block)冷卻至室溫。然后將銜接子在冰上孵育1小時,再冷藏于-20℃直至使用。
令Bbv14、16和19銜接子與微滴板結(jié)合。
為了通過連接將FokⅠ切割片段捕捉到“Bbv”銜接子上,將“Bbv”銜接子與包被有鏈霉親和素的黑色96孔微滴板(Boehringer Mannheim)結(jié)合。即通過在各測試孔中將10pmol合適的銜接子(在35μl 1xTE+0.1M NaCl中)4℃通宵孵育。在通宵孵育后,各測試孔用50μl 1xTE+0.1M NaCl洗滌3次。去除1xTE+0.1MNaCl,然后在各孔中加入50μl 1x連接酶緩沖液,將測試板保藏于4℃直至使用。
測試板容量為了測定各測試孔的結(jié)合容量(capacity),取10pmol的BioFAMFok銜接子與8個測試孔結(jié)合,即將10pmol銜接子(在25μl 1xTE+0.1M NaCl中)4℃通宵孵育。在通宵孵育后,各測試孔用50μl 1xTE+0.1M NaCl洗滌3次。在測試孔系列中加入BioFAMFok的1xTE+0.1M NaCl稀釋液(5,2.5,1.25,0.675,0.3375pmol),然后在Biolumin微滴板讀數(shù)儀(Molecular Dynamics)中讀取測試板的熒光度。
得到以下讀數(shù)(以相對熒光單位表示)稀釋液測試孔5pmol 74575RFU2.5pmol 35429RFU1.25pmol 16232RFU0.625pmol 9388RFU0.3375pmol4807RFU與10pmol銜接子孵育并經(jīng)洗滌的測試孔20872RFU21516RFU22519RFU21679RFU22685RFU21517RFU21742RFU22417RFU平均值=21865根據(jù)以上數(shù)據(jù),可以計算出21856RFU相對于1.5pmol的BioFAMFok。這個數(shù)據(jù)與Boehringer Mannheim technical help line提供的測試孔結(jié)合生物素化雙鏈DNA的容量(在200μl中有5pmol雜交)是一致的。
吐溫(Tween)20對連接的影響在Fokl酶用的反應(yīng)緩沖液中加入0.1%吐溫20,據(jù)稱降低了與該酶相關(guān)的核酸外切酶活性(Fokl信息資料-New England Biolabs)。為了確定加入吐溫對隨后切割片段的連接是否有影響而進行了以下實驗。
建立了9個反應(yīng)體系,每3個反應(yīng)體系為一組,在25μl 1x連接酶緩沖液、10pmol BioG銜接子、10pmol GCCG銜接子和200μl連接酶中分別含0、0.05或0.1%的吐溫(New England Biolabs)。如上所述建立一個三反應(yīng)組,含有0.1%吐溫但是沒有連接酶。以上反應(yīng)系然后在16℃孵育1小時,再將各反應(yīng)系轉(zhuǎn)移到包被有鏈霉親和素的黑色微滴板(Boehringer Mannheim)的一個測試孔中。該微滴板在室溫下孵育1小時,用100μl TES洗滌3次,在Biolumin微滴板讀數(shù)儀(Molecular Dynamics)中讀取熒光度。
得到以下讀數(shù)(以相對熒光單位表示)0%吐溫20 0.05%吐溫20 0.1%吐溫20 0.1%吐溫20(無連接酶)8592 874210213 36608083 871210605 39678720 851911598 34688465 865710805 3698-平均值以上數(shù)據(jù)表明,加入0.1%吐溫20提高了連接效率,所以應(yīng)該無損于Fokl切割片段與“Bbv”銜接子的連接。
PCR引物,條件和純化用來代表不同濃度cDNA轉(zhuǎn)錄產(chǎn)物的3種PCR產(chǎn)物是人染色體17q21-22上人紅細胞陰離子交換蛋白基因的外顯子14、16和19。
用于擴增外顯子14、16和19的引物序列外顯子14正向引物5′-GTATTTTCCAGCCCAAGCCAAAGCTGG-3′反向引物5′生物素-GCAGTGTTGGCAAGGACAGGC-3′外顯子16正向引物5′生物素-GCCCTTGGCATTCTTACCTGC-3′反向引物5′-CTGGGAGAATGCCAGGGAAAGG-3′外顯子19
正向引物5′GTGATAGGCACTGACCCCAG-3′反向引物5′生物素-CGCATGCTCCCAGCTCTTGTGC-3′將生物素加入各組中的一個引物內(nèi)使它們被包被鏈霉親和素的微珠(DynalUK)捕獲。
全部PCR反應(yīng)都在50μl體積中進行,其中含有1xAmplitaq緩沖液(PerkinElmer)、30pmol正向和反向引物、200μM dNTP、1.25單位Amplitaq(PerkinElmer)和100ng人基因組DNA。在反應(yīng)物上覆蓋50μl礦物油,在Techne’Genie’PCR儀中,在以下條件下循環(huán)外顯子141輪,95℃2分鐘35輪,57.5℃45秒,72℃1分鐘,95℃35秒1輪,72℃5分鐘外顯子161輪,95℃2分鐘35輪,52℃45秒,72℃1分鐘,95℃35秒1輪,72℃5分鐘外顯子191輪,95℃2分鐘35輪,57.5℃45秒,72℃1分鐘,95℃35秒1輪,72℃5分鐘純化在PCR產(chǎn)物與DynaBead結(jié)合前需去除過量的引物和鹽,這是如下進行的PCR后,純化前,分別匯集各外顯子的10次反應(yīng)物然后加入2.5體積100%乙醇和1/10體積的3M乙酸鈉沉淀PCR產(chǎn)物。再將溶液-20℃孵育30分鐘,然后在Heraeus A13臺式(benchtop)離心機中以13000rpm離心15分鐘,沉淀出DNA。倒掉上清液,將沉淀空氣自然干燥。再將干燥后的沉淀重懸在150μl水中。然后,為各樣品準(zhǔn)備2Chromospin-100層析柱(Clonetech),即按照生產(chǎn)商的說明,將層析柱在Heraeus 17RS離心機中以3500rpm離心3分鐘。離心后,將75μl的DNA溶液上樣在準(zhǔn)備好的各層析柱上,并如上所述進行離心,將純化的DNA收集在1.5m1的Eppendorf試管中。然后將各外顯子的2份樣品匯集,在PharmaciaGenequant分光光度計中讀取260nm和280nm處的吸光值來測定濃度。
溶液和緩沖液1xTE,pH7.610mM Tris HCl1mMEDTATES,pH7.510mM Tris HCl1mM EDTA2MNaCl1xFokⅠ緩沖液,pH7.950mM乙酸鉀20mM Tris乙酸10mM乙酸鎂1mM DTT1xBbvⅠ緩沖液,pH7.950mM NaCl10mM Tris HCl10mM MgCl21mMDTT1xSau 3A緩沖液,pH7.933mM Tris乙酸66mM乙酸鉀10mM乙酸鎂0.5mM DTT
1x連接酶緩沖液,pH7.850mM Tris-HCl10mM MgCl210mM DTT1mMATP50μg/ml BSA結(jié)果層析柱純化的DNA的濃度外顯子14-130ng/μl外顯子16-120ng/μl外顯子19-115ng/μl1μg外顯子14(255bp)=5.9pmol,1μg外顯子16(272bp)=5.58pmol,1μg外顯子19(252bp)=6.03pmol1μg外顯子14=7.7μl,1μg外顯子16=8.3μl,1μg外顯子19=8.7μl,所以,外顯子14=0.76pmol/μl,外顯子16=0.67pmol/μl,外顯子19=0.69pmol/μl。
Sau 3Al消化30、15、6pmol的層析柱純化的外顯子14、16和19分別用20單位Sau 3Al在100μl Sau 3Al緩沖液中37℃消化4小時。
外顯子1439.5μl外顯子1622.4μl外顯子198.7μlSau 3Al 5μl10xSau 3Al緩沖液10μlH2O14.4μl消化后,反應(yīng)混合物在Techne Dryblock中65℃加熱20分鐘以滅活酶。DynaBead M280的制備根據(jù)生產(chǎn)商的說明,3mgDynaBead M280將結(jié)合60至120pmol生物素化的雙鏈DNA。
300μl濃度為1mg/ml的DynaBead M280用100μl TES洗滌,即用磁性粒子濃縮器(Dynal UK)將微珠保持在Eppendorf試管的側(cè)面以便去除上清液。此過程重復(fù)3次(根據(jù)生產(chǎn)商的說明,以后所有的微珠操作都如此進行)。將微珠重懸在100μl TES中,加入Sau 3Al消化的DNA,在室溫下孵育1小時,令生物素化的DNA與微珠結(jié)合。
然后,如上所述,用磁性粒子濃縮器、1x連接酶緩沖液將微珠/DNA洗滌3次。
SauFAM銜接子的連接(含F(xiàn)okⅠ位點)去除上清液,將微珠/DNA重懸在75μl連接酶緩沖液中(含300pmol SauFAM銜接子和4000單位連接酶(New England Biolabs))。
微珠/DNA,7.5μl 10連接酶緩沖液,15μl SauFAM(20pmol/μl),10μl連接酶(400單位/μl),42.5μlH2O然后,將反應(yīng)物16℃孵育2小時。
FokⅠ消化連接后,微珠/DNA用75μl 1xFokⅠ緩沖液洗滌2次,然后重懸在100μl 1xFokⅠ緩沖液中,在Techne Dryblock中65℃加熱20分鐘滅活所有殘留的連接酶。然后去除緩沖液,微珠/DNA重懸在95μl含20單位FokⅠ的1xFokⅠ緩沖液中(NewEngland Biolabs)。
微珠/DNA,9.5μl 10xFokⅠ緩沖液,5μlFokⅠ(4單位/μl)然后,微珠/DNA在37℃孵育2小時。
孵育后,將含有被FokⅠ切割的片段的上清液轉(zhuǎn)移到新的eppendorf試管中,在Techne Dryblock中65℃加熱20分鐘滅活FokⅠ在微滴板上將FokⅠ切割片段與Bbv銜接子連接然后將FokⅠ片段分人3支試管,各含30μl FokⅠ切割片段、50μl 10x連接酶緩沖液、3μl連接酶(400單位/μl-New England Biolabs)和12μlH2O。
微滴板的各孔中連接酶緩沖液分別含有Bbv 14、16和19銜接子(如前所述制備),去除板上的連接酶緩沖液,在各孔中加入含F(xiàn)okⅠ切割片段和連接酶的上述反應(yīng)混合物。
各孔在16℃孵育l小時,然后用50μl TES洗滌3次。去除孔中的TES,再加入50μl TES,在Biolumin微滴板讀數(shù)儀(Molecular Dynamics)中測定熒光度。以沒有加過片段,只含Bbv銜接子的測試孔作為空白孔。
以RFU表示數(shù)據(jù)Bbv14測試孔1774RFUBbv16測試孔1441RFUBbv19測試孔1192RFU空白 1010RFU從其它各孔讀數(shù)減去中作為背景讀數(shù)的空白孔的讀數(shù),得到以下結(jié)果。Bbv14測試孔764RFUBbv16測試孔431RFUBbv19測試孔182RFU因為上述加入過程中的外顯子16是外顯子14的一半(15pmol外顯子16,30pmol外顯子14),Bbv16測試孔的讀數(shù)應(yīng)該是Bbv14測試孔的一半(即50%),因為外顯子19的量是外顯子14的五分之一(6pmol外顯子19,30pmol外顯子14),Bbv19測試孔的讀數(shù)應(yīng)該是Bbv14測試孔的五分之一(即20%)。
以百分比表示的理想讀數(shù)Bbv14測試孔 100Bbv16測試孔 50Bbv19測試孔 20以百分比表示的實際讀數(shù)(以Bbv14測試孔為100%)Bbv14測試孔 100Bbv16測試孔 56.4Bbv19測試孔 23.8Bbv16測試孔的誤差為6.4%Bbv19測試孔的誤差為3.8%所以,該方法能夠?qū)⒁蝗夯旌系腄NA分開來,進行4bp的鑒定,同時將原混合物的相對比例保持在最小誤差。然后,依次再進行探測以獲得另一個4bp和其相關(guān)的定量數(shù)據(jù)。
權(quán)利要求
1.一種對DNA進行特性分析的方法,它包括(a)用第一取樣核酸內(nèi)切酶在第一取樣位點切割一個樣品,該樣品含一種或多種cDNA樣群或其分離片段,以產(chǎn)生各cDNA或其分離片段的第一和第二次級片段,所述的cDNA或其分離片段各包含一段與mRNA 3’聚A末端互補的鏈并具有尾序列,所述的第一取樣位點相距尾序列附近的參照位點已知距離,所述的第一和第二次級片段都包含既定長度但序列未知的粘端序列,第一次級片段具有尾序列;(b)根據(jù)粘端序列將第一或第二次級片段分類成亞群,并記錄各亞群的粘端序列作為第一粘端;(c)在各亞群中用第二取樣核酸內(nèi)切酶在第二取樣位點切割次級片段以產(chǎn)生各次級片段的次次級片段,所述的內(nèi)切酶與第一取樣核酸內(nèi)切酶相同或不同,所述的第二取樣位點相距第一取樣位點已知距離,次次級片段包含既定長度和未知序列的第二粘端序列;和(d)測定各第二粘端的序列;其中,各次級片段的第一和第二粘端序列長度之和為6至10;參照位點和第一及第二粘端的序列和相對位置特征性說明了該cDNA或各個cDNA。
2.根據(jù)權(quán)利要求1所述的方法,其中用第一取樣酶切割的的樣品包含,用限制性核酸內(nèi)切酶切割含一種或多種cDNA樣群的樣品而產(chǎn)生的該cDNA的分離片段,與分離限制性位點就在參照位點的分離片段。
3.根據(jù)權(quán)利要求2所述的方法,其中的第一取樣核酸內(nèi)切酶結(jié)合于第一識別位點,并在相距該限制性核酸內(nèi)切酶限制性位點既定距離的第一取樣位點處切割。
4.根據(jù)權(quán)利要求3所述的方法,其中的第一識別位點在第一銜接子寡核苷酸中,該寡核苷酸與分離片段的限制性位點雜交。
5.根據(jù)權(quán)利要求2至4中任一項所述的方法,其中的限制性核酸內(nèi)切酶識別4堿基結(jié)合位點。
6.根據(jù)權(quán)利要求2至5中任一項所述的方法,其中的第二次級片段在步驟(b)中接受分類。
7.根據(jù)權(quán)利要求1所述的方法,其中的第一取樣酶結(jié)合于參照位點,并在相距參照位點既定距離處的第一取樣位點切割。
8.根據(jù)前述權(quán)利要求中任一項所述的方法,其中的第一取樣核酸內(nèi)切酶包含Ⅱs型核酸內(nèi)切酶。
9.根據(jù)前述權(quán)利要求中任一項所述的方法,其中的第二取樣核酸內(nèi)切酶結(jié)合第二識別位點并在相距第一取樣位點既定距離處的第二取樣位點切割。
10.根據(jù)權(quán)利要求9所述的方法,其中的第二取樣核酸內(nèi)切酶包含Ⅱs型核酸內(nèi)切酶。
11.根據(jù)權(quán)利要求9或權(quán)利要求10所述的方法,其中的第二識別位點在與第一粘端雜交的第二銜接子寡核苷酸中。
12.根據(jù)前述權(quán)利要求中任一項所述的方法,其中cDNA或其片段的尾序列結(jié)合于固體基質(zhì)。
13.根據(jù)前述權(quán)利要求中任一項所述的方法,其中各次級片段第一和第二粘端序列長度之和為8。
14.根據(jù)權(quán)利要求13所述的方法,其中各粘端的長度為4。
15.根據(jù)前述權(quán)利要求中任一項所述的方法,其中將次級片段分類的步驟(b)包括將次級片段分成樣品陣列,即各樣品分別在不同的容器內(nèi);樣品陣列與固相親和性基質(zhì)陣列接觸,各固相親和性基質(zhì)帶有既定長度與第一粘端相同的獨特堿基序列,這樣,各樣品與可能的堿基序列之一接觸,而整個樣品陣列則與所有可能既定長度的堿基序列接觸,使得雜交只在彼此互補的獨特堿基序列和第一粘端之間發(fā)生;從容器中洗去未雜交的材料。
16.根據(jù)前述權(quán)利要求中任一項所述的方法,其中測定第二粘端序列的步驟(d)包括分離步驟(c)產(chǎn)生的次次級片段,并令其與銜接子核苷酸陣列循環(huán)接觸,各銜接子寡核苷酸帶有一個標(biāo)記和一段既定長度與第二粘端一樣的獨特堿基序列,陣列中包含了既定長度的所有可能的堿基序列;其中的循環(huán)包括按次序在雜交條件下將陣列的各銜接子寡核苷酸與分離的次級片段的各亞群接觸,去除所有未雜交銜接子寡核苷酸,并通過檢測標(biāo)記來測定雜交銜接子寡核苷酸的存在,然后重復(fù)此循環(huán),直至陣列中的所有銜接子都受到測試。
17.根據(jù)權(quán)利要求1至14中任一項所述的方法,其中分類次級片段的步驟(b)包括(ⅰ)次級片段與雜交陣列結(jié)合,所述的陣列包含多組寡核苷酸的陣列,各組帶有既定長度與第一粘端相同的獨特堿基序列,而且所述的組能夠通過在陣列中的位置加以鑒別,該陣列中存在既定長度的所有可能堿基序列,使得帶有獨特第一粘端的各亞群在陣列中的可鑒別位置上發(fā)生雜交;和(ⅱ)確定雜交位置來鑒定第一粘端序列。
18.根據(jù)權(quán)利要求17所述的方法,其中在步驟(c)中切割的次級片段是與雜交陣列結(jié)合的片段,由此產(chǎn)生的次次級片段仍然與雜交陣列結(jié)合;并且其中測定各第二粘端序列的步驟(d)包括次次級片段在雜交條件下與銜接子寡核苷酸陣列接觸,各銜接子寡核苷酸帶有一個標(biāo)記和既定長度與第二粘端相同的獨特堿基序列。所述的陣列中包含了既定長度的所有可能的堿基序列,去除所有未雜交銜接子寡核苷酸,通過檢測標(biāo)記來確定各雜交銜接子寡核苷酸的位置。
19.一種鑒定樣品中DNA的方法,它包括為了鑒定樣品中某一種或各種cDNA,按照前述權(quán)利要求中任一項所述的方法對cDNA進行特性分析,將由此獲得的序列、參照位點和第一第二粘端的相對位置與已知cDNA的序列、參照位點和第一第二粘端的相對位置比較。
20.一種分析樣品中一種或多種特異性cDNA的方法,它包括實施根據(jù)權(quán)利要求1至14中任一項所述的方法,其中的參照位點是既定的,分類步驟(b)中的各第一粘端序列是既定的,步驟(d)中的第二粘端序列是通過檢測既定的第二粘端序列來確定的,參照位點的相對位置與第一和第二粘端的相對位置特征性地說明了各特定的cDNA。
21.根據(jù)權(quán)利要求20所述的方法,其中的參照位點和第一和第二粘端序列是通過從一種或多種已知靶cDNA中選擇相應(yīng)序列來預(yù)先確定的。
全文摘要
一種對cDNA進行特性分析的方法,它包括:(a)用第一取樣核酸內(nèi)切酶在第一取樣位點切割一群含一種或多種cDNA或其分離片段的樣品,以產(chǎn)生各cDNA或其分離片段的第一和第二次級片段,所述的cDNA或其分離片段都包含一段與mRNA3’聚A末端互補的鏈并具有尾序列,所述的第一取樣位點相距尾序列附近的參照位點已知距離,所述的第一和第二次級片段都包含具有既定長度序列但未知的粘端序列,第一次級片段具有尾序列;(b)根據(jù)粘端序列將第一或第二次級片段分類成亞群,并記錄各亞群的粘端序列作為第一粘端;c)在各亞群中用第二取樣核酸內(nèi)切酶在第二取樣位點切割次級片段以產(chǎn)生各次級片段的次次級片段。所述的內(nèi)切酶與第一取樣核酸內(nèi)切酶相同或不同,所述的第二取樣位點相距第一取樣位點已知距離,次次級片段包含具有既定長度但序列未知的第二粘端序列;和(d)測定各第二粘端的序列;其中,各次級片段的第一和第二粘端序列長度之和為6至10;參照位點和第一及第二粘端的序列和相對位置特征性地說明了該cDNA或各個cDNA。
文檔編號C12N15/10GK1234076SQ9719889
公開日1999年11月3日 申請日期1997年9月5日 優(yōu)先權(quán)日1996年9月5日
發(fā)明者G·施密特, A·H·湯普森 申請人:布拉克斯基因組有限公司