本發(fā)明涉及基因檢測(cè)領(lǐng)域,特別是涉及融合基因的測(cè)序檢測(cè),更具體地說,是涉及融合基因的dna測(cè)序文庫(kù)的制備,以及使用該dna測(cè)序文庫(kù)進(jìn)行融合基因的高通量測(cè)序檢測(cè)的方法。
背景技術(shù):
自20世紀(jì)80年代早期第一個(gè)融合基因(bcr/abl1)被檢測(cè)證實(shí),融合基因已成為多個(gè)癌種的重要標(biāo)志,例如:bcr/abl1用于檢測(cè)慢性骨髓性白血?。籩ml4/alk用于檢測(cè)惡性肺腺癌;tmprss2/erg用于檢測(cè)前列腺癌,等等。
21世紀(jì)開始,隨著靶向藥物的興起,癌癥治療藥物,尤其非小細(xì)胞肺癌(nsclc)的治療藥物,也開始使用融合基因所在的代謝通路。例如,2011年克唑替尼獲得fda許可用于alk和ros1基因融合的治療;2015年艾樂替尼獲得fda許可用于alk基因融合的治療;索拉非尼和舒尼替尼獲得ret基因融合的治療許可。
在惡性腫瘤精準(zhǔn)檢測(cè)及個(gè)性化治療概念被提出的今天,為了避免藥物禁忌和耐受引起無效治療,耽誤寶貴的治療時(shí)間,對(duì)于融合基因的有效特異檢測(cè)成為臨床醫(yī)師給藥的重要依據(jù)。早期的融合基因檢測(cè)是在傳統(tǒng)組織活檢的基礎(chǔ)上,采用熒光原位雜交、染色體條帶分析以及rt-pcr分析技術(shù)來確認(rèn)患者的腫瘤細(xì)胞是否發(fā)生了特定基因的基因融合。但是這些早期的細(xì)胞學(xué)及分子生物學(xué)技術(shù)對(duì)于融合基因的檢測(cè)存在以下缺陷:1)檢測(cè)時(shí)間久;2)假陽性率偏高;3)檢測(cè)技術(shù)要求高,需要熟練有經(jīng)驗(yàn)的檢測(cè)人員,不利于標(biāo)準(zhǔn)化;4)在融合基因基因型細(xì)胞在癌組織中含量少的情況下,無法有效檢出。隨著ngs(高通量測(cè)序)技術(shù)的日益成熟,并全面進(jìn)入臨床基因檢測(cè)領(lǐng)域,上述問題得到了有效解決。ngs檢測(cè)技術(shù)具有靈敏度、特異性高,檢測(cè)樣本dna需要量少,以及技術(shù)成熟、操作簡(jiǎn)便快速等一系列優(yōu)點(diǎn),在技術(shù)應(yīng)用成本降低和通量不斷增高的發(fā)展背景下,ngs技術(shù)成為融合基因檢測(cè)的主流平臺(tái)。
對(duì)于用測(cè)序或pcr方法檢測(cè)融合基因,最為直接的方式是提取組織樣本的rna,通過反轉(zhuǎn)錄技術(shù)合成cdna,捕獲發(fā)生融合的外顯子來分析完成。這樣的方式是基于在基因組dna層次,兩個(gè)基因的融合點(diǎn)都發(fā)生融合的外顯子序列間的內(nèi)含子序列區(qū)域,而這個(gè)區(qū)域可能>1kb,即使是讀長(zhǎng)較長(zhǎng)的一代測(cè)序技術(shù),也無法有效覆蓋(ngs測(cè)序技術(shù)的讀長(zhǎng)一般在100-400bp),無法直接分析融合的內(nèi)含子區(qū)域;有些基因融合的融合點(diǎn)的位置僅僅在cosmic數(shù)據(jù)庫(kù)中有報(bào)導(dǎo)的就超過20個(gè),無法確認(rèn)融合位置的位置樣本,也不可能通過特異pcr來富集融合位置的序列用于測(cè)序,而發(fā)生剪切后的成熟融合基因rna的兩側(cè)序列則是已知的,可以通過pcr擴(kuò)增富集長(zhǎng)度小于200bp的序列,用于ngs高通量測(cè)序?;谝陨显?,目前主流的融合基因測(cè)序檢測(cè)技術(shù)是基于rna的。但是,隨著液態(tài)活檢概念的引入及其優(yōu)勢(shì)性,基于rna的融合基因檢測(cè)方法突顯了其局限性。
液態(tài)活檢技術(shù),是指僅提取患者的血漿或尿液中游離的腫瘤dna(ctdna,circulatingtumordna),通過基因捕獲技術(shù)來快速檢測(cè)腫瘤細(xì)胞基因型。在腫瘤細(xì)胞的生活周期中,會(huì)發(fā)生細(xì)胞死亡(發(fā)生的多種原因,此處不再贅述),從而將內(nèi)部核酸物質(zhì)釋放出來,并進(jìn)入循環(huán)系統(tǒng)或排泄系統(tǒng),當(dāng)然這里也存在健康細(xì)胞的核酸,常規(guī)情況下每毫升血漿中游離dna的得率是5-20ng,這樣少量的游離dna中,ctdna的含量可能只有0.1-5%,而正因?yàn)楦哽`敏的ngs技術(shù)的應(yīng)用,使檢測(cè)ctdna成為可能??梢钥吹揭簯B(tài)活檢技術(shù)相比傳統(tǒng)組織活檢具有多種優(yōu)勢(shì):1)對(duì)患者侵害??;2)可多次取樣監(jiān)測(cè);3)無需對(duì)取樣進(jìn)行病理區(qū)分。因此,各種腫瘤細(xì)胞的檢測(cè)技術(shù)都紛紛改進(jìn),以適用于液態(tài)活檢。
然而,相比于ctdna,ctrna的碎片化程度更為嚴(yán)重,一般在10-25bp(ctdna的碎片化程度一般在150-200bp),因此,ctrna在現(xiàn)有技術(shù)下并不適合用于融合基因的檢測(cè),這使得基于rna的融合基因檢測(cè)很難在液態(tài)活檢中應(yīng)用。
此外,基于rna的融合基因檢測(cè)還面臨著大部分患者很難接受多次穿刺取樣,只能取得病理檢測(cè)剩余的ffpe(福爾馬林固定石蠟包埋)樣本的問題。ffpe樣本由于甲醛固定的原因,其中的rna已經(jīng)發(fā)生了嚴(yán)重的降解,很難提供檢測(cè)需要的足夠長(zhǎng)度的rna片段。
目前,基于dna的融合基因測(cè)序方法是通過在基因組文庫(kù)中用探針捕獲融合基因區(qū)域來進(jìn)行鑒定的,這種方法的優(yōu)點(diǎn)是目的性強(qiáng),可以節(jié)約數(shù)據(jù)量和成本;缺點(diǎn)是容易脫靶,尤其是在液態(tài)活檢中檢測(cè)游離dna時(shí),有效數(shù)據(jù)比例低,需要提高起始dna量和測(cè)序數(shù)據(jù)量,從而導(dǎo)致成本高,操作時(shí)間長(zhǎng),操作難度高,甚至影響檢測(cè)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明要解決的技術(shù)問題之一是提供一種基于dna的融合基因定量測(cè)序建庫(kù)方法,該方法建庫(kù)時(shí)間短,成本低,可應(yīng)用于液態(tài)活檢。
為解決上述技術(shù)問題,本發(fā)明的基于dna的融合基因定量測(cè)序建庫(kù)方法,包括以下步驟:
1)構(gòu)建基因組片段化dna文庫(kù),并純化;
2)以步驟1)純化后的dna文庫(kù)為模板,通過pcr擴(kuò)增反應(yīng)捕獲融合基因發(fā)生區(qū)域,對(duì)擴(kuò)增產(chǎn)物進(jìn)行純化,并富集包含有引物特異片段的序列;
3)以步驟2)所得產(chǎn)物為模板,用巢式pcr擴(kuò)增反應(yīng)捕獲包含有融合基因的目的片段;
4)用步驟3)所得產(chǎn)物構(gòu)建用于高通量測(cè)序的dna測(cè)序文庫(kù)。
上述步驟1)進(jìn)一步包括:
末端修復(fù)及加a尾的步驟;
在末端修復(fù)及加a尾產(chǎn)物上連接文庫(kù)接頭,并對(duì)接頭連接產(chǎn)物進(jìn)行純化的步驟;
以純化后的接頭連接產(chǎn)物為模板,進(jìn)行dna文庫(kù)擴(kuò)增反應(yīng),并對(duì)擴(kuò)增產(chǎn)物進(jìn)行純化的步驟。
對(duì)于ctdna,上述步驟1)在末端修復(fù)及加a尾的步驟前,還包括dna酶切片段化步驟。
上述步驟2),pcr反應(yīng)的正向引物為通用引物;反向引物為一組序列與編碼鏈方向反向互補(bǔ)的特異引物,且5’端帶有標(biāo)簽。較佳的,通用引物為p5引物;反向引物的序列如seqidno:1~20所示,反向引物的5’端用生物素修飾。
上述步驟3),較佳的,巢式pcr擴(kuò)增反應(yīng)的引物組的序列如seqidno:21~40所示。
上述步驟4)進(jìn)一步包括:
對(duì)步驟3)所得產(chǎn)物進(jìn)行末端修復(fù)及磷酸化,并進(jìn)行純化的步驟;
在純化后的末端修復(fù)及磷酸化產(chǎn)物上連接通用測(cè)序接頭,并對(duì)連接產(chǎn)物進(jìn)行純化的步驟;
以純化后的連接產(chǎn)物為模板,進(jìn)行文庫(kù)擴(kuò)增反應(yīng),并對(duì)文庫(kù)擴(kuò)增產(chǎn)物進(jìn)行純化的步驟;
對(duì)純化后的文庫(kù)進(jìn)行定量、質(zhì)檢,獲得用于高通量測(cè)序的dna文庫(kù)。
本發(fā)明要解決的技術(shù)問題之二是提供一種用上述建庫(kù)方法制備的dna測(cè)序文庫(kù)對(duì)融合基因進(jìn)行高通量定量測(cè)序檢測(cè)的方法,該方法可應(yīng)用于ffpe樣本或液態(tài)活檢。
本發(fā)明要解決的技術(shù)問題之三是提供一種融合基因定量測(cè)序檢測(cè)試劑盒,該試劑盒包含有用上述建庫(kù)方法制備的dna測(cè)序文庫(kù)。
本發(fā)明要解決的技術(shù)問題之四是提供上述融合基因定量測(cè)序檢測(cè)方法在ffpe樣本或液態(tài)活檢中的應(yīng)用。
本發(fā)明要解決的技術(shù)問題之五是提供一組特異性擴(kuò)增融合基因發(fā)生區(qū)域的引物,該引物組的序列如seqidno:1~20所示。
本發(fā)明使用單向特異引物來錨定融合斷點(diǎn)發(fā)生的下游,通過特異引物和通用引物配對(duì),運(yùn)用pcr方式來獲取需要的序列,再運(yùn)用標(biāo)簽富集和巢式pcr進(jìn)一步降低背景,最后在捕獲的目的片段兩端加上通用測(cè)序接頭,構(gòu)建成最終的融合基因測(cè)序文庫(kù)。相比傳統(tǒng)的基于rna的融合基因檢測(cè)方法和探針捕獲建庫(kù)方法,本發(fā)明的融合基因建庫(kù)和檢測(cè)方法具有以下優(yōu)點(diǎn)和有益效果:
1.特異性高,背景低,測(cè)序數(shù)據(jù)中不匹配讀數(shù)的比例低。
2.只需運(yùn)用簡(jiǎn)便的pcr技術(shù),無需探針雜交、封閉等繁瑣的過程,操作簡(jiǎn)單,建庫(kù)時(shí)間短(建庫(kù)時(shí)間可從3天縮短至1-1.5天),成本低(成本可降低50%)。
3.樣本起始量可低至10ng,適用于血漿游離dna(ctdna和cfdna)的檢出。
4.可適用于目前所有的alk(間變性淋巴瘤激酶)融合基因型,不限制上游是哪個(gè)基因與alk融合,甚至可發(fā)現(xiàn)未知的融合型或已知融合型中的未知斷點(diǎn)。
5.解決了現(xiàn)有的基于rna的融合基因檢測(cè)難以獲得適當(dāng)質(zhì)量的rna的問題,可應(yīng)用于ffpe樣本或液態(tài)活檢。
6.對(duì)照樣本檢測(cè)結(jié)果表明,和金標(biāo)準(zhǔn)的rna捕獲測(cè)序結(jié)果高度一致。
附圖說明
圖1為本發(fā)明實(shí)施例的基因融合reads分布圖。其中,(a)圖為eml4基因,(b)圖為alk基因。
具體實(shí)施方式
為對(duì)本發(fā)明的技術(shù)內(nèi)容、特點(diǎn)與功效有更具體的了解,現(xiàn)結(jié)合具體實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步詳細(xì)的說明。
實(shí)施例中所用儀器設(shè)備、實(shí)驗(yàn)材料和試劑如下:
一、儀器
abproflexpcr儀、ikams3digital漩渦振蕩器、ivgnqubit3.0熒光光度計(jì)、ikaminig掌上離心機(jī);
二、材料
rainin移液器(規(guī)格10、20、200、1000μl)、axygen通用過濾接頭(universalfitfiltertips,規(guī)格10、20、200、1000μl)、dynaldynamagtm-2magnet磁力架、ambionmagneticstand-96、axygen0.2ml透明平蓋低吸附pcr薄壁管、axygen無色低吸附離心管(1.5ml、2.0ml);
三、試劑
分析純無水乙醇、ivgn
實(shí)施例中未注明具體條件的實(shí)驗(yàn)方法,通常按照常規(guī)條件,例如sambrook等人,分子克隆:實(shí)驗(yàn)室手冊(cè)(newyork:coldspringharborlaboratorypress,1989)中所述的條件,或按照制造廠商所建議的條件。
本實(shí)施例的基于dna的alk融合基因定量測(cè)序建庫(kù)方法流程如下:
一、基因組片段化dna建庫(kù)
采用kapahyperpluslibrarypreparationkit構(gòu)建基因組片段化dna文庫(kù)(如果是cfdna,則不需要進(jìn)行dna酶切片段化步驟,且保證起始量10ng)。
1.dna酶切片段化
1)在冰上的0.2ml離心管中混合下列組分:dna100ng(提取自患者ffpe、血漿或活組織)35μl,10xkapa片段化反應(yīng)緩沖液5μl,kapa片段酶10μl,總計(jì)50μl。
2)渦旋震蕩3秒,短暫離心,盡快進(jìn)行下一步。
3)在熱循環(huán)儀上進(jìn)行片段化反應(yīng)(不使用熱蓋),反應(yīng)程序?yàn)椋?℃預(yù)冷10min;37℃片段化反應(yīng)20min;4℃保持。
2.末端修復(fù)及加“a”(a-tailing)
1)在完成dna酶切片段化的離心管中添加以下成分:50μl片段化dna或cfdna,末端修復(fù)和加“a”尾緩沖液7μl,末端修復(fù)和加“a”尾酶混合物3μl,總計(jì)60μl。
2)渦旋震蕩,短暫離心,盡快進(jìn)行下一步。
3)在熱循環(huán)儀上進(jìn)行末端修復(fù)及加“a”尾反應(yīng),反應(yīng)程序?yàn)椋?5℃末端修復(fù)及加“a”尾反應(yīng)30min;4℃保持。反應(yīng)結(jié)束后盡快進(jìn)行下一步。
3.接頭連接并純化
1)在完成末端修復(fù)及加“a”尾反應(yīng)的體系中加入以下成分:末端修復(fù)及加“a”尾產(chǎn)物60μl,文庫(kù)接頭15μl,水(pcr級(jí)別)5μl,連接緩沖液(ligationbuffer)30μl;dna連接酶10μl,總計(jì)110μl。
其中,文庫(kù)接頭由p5和p7退火得到。
p5序列為:
aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct(seqidno:41)
p7序列為:
gatcggaagagcacacgtctgaactccagtcacatcacgatctcgtatgccgtcttctgcttg(seqidno:42)
2)用移液器小心吸打混勻,短暫離心,20℃孵育15min。
3)在110μl接頭連接產(chǎn)物中加入88μl
4)反應(yīng)管保持在磁架上,加入200μl80%新鮮制備的乙醇,保持至少30s,隨后小心棄去上清。重復(fù)本步驟一次,保證乙醇被充分吸去。
5)反應(yīng)管保持在磁架上,室溫干燥3min(不要過度干燥,可能會(huì)導(dǎo)致回收率較低),取下,加入25μl0.1×te(tris-edta緩沖液),吸打混勻5次,室溫放置2分鐘。將反應(yīng)管放回磁架,直至溶液澄清,吸取25μl上清放入新的0.2ml反應(yīng)管中。
4.dna文庫(kù)擴(kuò)增并純化
1)在離心管中加入2×kapahifihotstartreadymix(熱啟動(dòng)高保真酶)25μl,10×kapalibraryamplificationprimermix(文庫(kù)擴(kuò)增引物混合物)5μl,純化后的接頭連接產(chǎn)物20μl,總計(jì)50μl。吸打混勻,短暫離心。
2)在熱循環(huán)儀上進(jìn)行文庫(kù)擴(kuò)增反應(yīng),反應(yīng)程序?yàn)椋?8℃預(yù)變性45s;98℃變性15s,60℃復(fù)性30s,72℃延伸30s,5個(gè)循環(huán);72℃后延伸1min;4℃保持。
3)取50μl擴(kuò)增產(chǎn)物,加入50μl
4)反應(yīng)管保持在磁架上,加入200μl80%新鮮制備的乙醇,保持至少30s,隨后小心棄去上清。重復(fù)本步驟一次,保證乙醇被充分吸去。
5)反應(yīng)管保持在磁架上,室溫干燥3min,取下,加入22μl0.1×te,吸打混勻5次,室溫放置2分鐘。將反應(yīng)管放回磁架,直至溶液澄清,吸取20μl上清放入新的0.2ml反應(yīng)管中。
二、目的區(qū)域擴(kuò)增捕獲
1.第一輪融合基因發(fā)生區(qū)域擴(kuò)增捕獲
在pcr管中混合如下反應(yīng)體系:2×phusionhfpcrmastermix25μl,taq聚合酶1μl,dmso(二甲亞砜)1μl,1μmfusionpanel引物混合物10μl,純化后的dna文庫(kù)10μl,無核酸酶水3μl,總計(jì)50μl。吸打混勻,短暫離心后,按表1程序進(jìn)行pcr擴(kuò)增。
其中,引物混合物中,正向引物使用基因組文庫(kù)的p5通用引物序列(seqidno:41),反向引物是一組與編碼鏈方向反向互補(bǔ)的特異序列,且5’端用生物素修飾,以便后一步富集特異序列時(shí),降低測(cè)序背景。這組反向引物的序列為:
表1第一輪擴(kuò)增捕獲pcr反應(yīng)程序
2.擴(kuò)增產(chǎn)物純化
1)向擴(kuò)增產(chǎn)物中加入50μl無核酸酶水,轉(zhuǎn)入1.5ml低吸附管中,加入90μl(0.9倍體積)
2)將反應(yīng)管置于磁架上2min或直至溶液澄清,將上清吸入新的反應(yīng)管中(上清中是需要的文庫(kù)片段,不要丟棄),加入15μl(0.15倍體積)
3)將反應(yīng)管置于磁架上2min或直至溶液澄清,棄去上清。
4)加入500μl新鮮制備的80%乙醇,保持大于30s,然后吸去上清。重復(fù)本步驟一次,保證乙醇被充分吸去。
5)反應(yīng)管保持在磁架上,室溫干燥3min,取下,加入200μl無核酸酶水,吸打混勻5次,放在磁架上靜置2min,吸取上清至新的1.5ml反應(yīng)管,再加入200μl2×b&w緩沖液,吸打混勻。
3.富集引物特異片段
1)取50μl10mg/ml的bsa(標(biāo)準(zhǔn)蛋白質(zhì)溶液)加無核酸酶水450μl,稀釋成1×bsa。
2)漩渦振蕩
3)將含磁珠的離心管置于磁架上,等溶液變清后,吸掉上清,向洗好的磁珠中加入純化后的第一輪擴(kuò)增產(chǎn)物,室溫(20-25℃)垂直轉(zhuǎn)動(dòng)反應(yīng)管,雜交30min。
4)將雜交好的磁珠dna混合物短暫離心,置于磁架上至少1min,等溶液變清后,吸去上清。
5)用500μl1×b&w緩沖液懸浮磁珠,漩渦振蕩15s,短暫離心后置于磁架上至少1min,等溶液變清后,吸去上清。重復(fù)本步驟2次,共清洗3次磁珠。
6)用500μl0.1×te懸浮磁珠,放置備用。
4.第二輪目的片段擴(kuò)增(巢式pcr)
1)將上一步所得含有磁珠的反應(yīng)管置于磁架上,待溶液澄清后,盡量棄去上清,用20μl巢式pcr擴(kuò)增反應(yīng)體系再懸浮磁珠,一起轉(zhuǎn)入新的0.2ml反應(yīng)管中,在熱循環(huán)儀上按照表2所示程序進(jìn)行巢式pcr擴(kuò)增反應(yīng)。
20μl巢式pcr擴(kuò)增反應(yīng)體系包含:2×phusionhfpcrmastermix10μl,taq聚合酶0.5μl,dmso0.5μl,1μm巢式fusionpanel引物混合物9μl。其中,引物混合物包含有以下引物:
表2第二輪巢式pcr擴(kuò)增反應(yīng)程序
2)擴(kuò)增反應(yīng)結(jié)束后,將反應(yīng)管置于磁架上,待溶液澄清后,吸取最終捕獲產(chǎn)物至新的反應(yīng)管中,可在-20℃保存1-2周。
三、建庫(kù)
1.末端修復(fù)及磷酸化
在pcr反應(yīng)管中加入以下成分:上一步所得最終捕獲產(chǎn)物20μl,t4連接酶緩沖液10μl,10mg/mlbsa1μl,10mmdntps2μl,t4聚合酶1μl,t4多聚核苷酸激酶1μl,無核酸酶水75μl,總計(jì)100μl。小心吸打混勻,室溫孵育20min。
2.末端修復(fù)產(chǎn)物純化
1)在末端修復(fù)產(chǎn)物中加入
2)加入200μl新鮮配置的80%乙醇,貼著磁架輕輕地上下移動(dòng)反應(yīng)管來清洗磁珠,然后吸去上清。重復(fù)本步驟一次,并確保所有的80%乙醇都被吸去。
3)將反應(yīng)管保持在磁架上,室溫干燥3min,取下,加入42μl無核酸酶水,旋渦振蕩2s,短暫離心2s,放回磁架上,靜置2min或待溶液澄清,吸取40μl上清至新的0.2ml低吸附pcr管中,避免碰到磁珠。
3.測(cè)序接頭連接
向40μl純化后的末端修復(fù)產(chǎn)物中加入如下試劑:t4連接酶緩沖液5μl,barcodex(不同樣本所用barcode不同,x編號(hào)不同)1μl,p1接頭1μl,10mmdntps1μl,t4連接酶1μl,taq聚合酶1μl,總體積50μl。用移液器小心吸打混勻5次,在熱循環(huán)儀上進(jìn)行測(cè)序接頭連接反應(yīng)。連接反應(yīng)條件為:22℃20min,72℃10min,10℃保持。產(chǎn)物可在-20℃保存。
4.連接產(chǎn)物純化
1)在連接產(chǎn)物中加入30μl
2)在上一步吸取的上清中加入20μl
3)加入200μl新鮮配制的80%乙醇,貼著磁架輕輕上下移動(dòng)反應(yīng)管來清洗磁珠,然后吸去上清。重復(fù)本步驟一次,保證乙醇被充分吸去。
4)保持在磁架上,室溫干燥3min(干燥期間馬上開始下一步文庫(kù)擴(kuò)增)。
5.文庫(kù)擴(kuò)增
1)向上一步純化后的連接產(chǎn)物中加入2×phusionhfpcrmastermix25μl、文庫(kù)擴(kuò)增引物1μl、無核酸酶水24μl,將反應(yīng)管從磁架上取下,用移液器吸打混勻5次,放回磁架上,靜置2min或待溶液澄清。
其中,文庫(kù)擴(kuò)增引物由20μmaf和pf引物等體積混合而成,af、pf引物序列如下:
af:ccatctcatccctgcgtgtctccgactcag(seqidno:43)
pf:gtctcagcctctctatgggcagtcggtgat(seqidno:44)
2)小心將上清移入新的反應(yīng)管中,避免吸到磁珠。對(duì)上清反應(yīng)體系進(jìn)行pcr擴(kuò)增。pcr擴(kuò)增反應(yīng)程序?yàn)椋?8℃2min;98℃15s,60℃1min,共5個(gè)循環(huán);10℃保持。
6.文庫(kù)擴(kuò)增產(chǎn)物純化
1)在文庫(kù)擴(kuò)增中加入
2)將反應(yīng)管置于磁架上,靜置2min或待溶液澄清,小心吸去上清,避免碰到磁珠沉淀。
3)加入200μl新鮮配制的80%乙醇,貼著磁架輕輕上下移動(dòng)反應(yīng)管來清洗磁珠,然后吸去上清。重復(fù)本步驟一次,確保所有80%乙醇都被吸去。
4)將反應(yīng)管保持在磁架上,室溫干燥3min,取下,加入50μl無核酸酶水,吸打混勻5次,放置在磁架上靜置2min,待溶液澄清后,吸取上清至新的反應(yīng)管,用于qubit定量。
7.qubit2.0定量
1)用
2)在一個(gè)1.5ml離心管中,合并597μlqubitdsdnahs緩沖液和3μlqubitdsdnahs試劑,漩渦振蕩混勻,制備成qubit工作溶液。
3)分別標(biāo)記3個(gè)qubit試管:#1標(biāo)準(zhǔn)品管、#2標(biāo)準(zhǔn)品管、#3樣品管。在#1標(biāo)準(zhǔn)品管和#2標(biāo)準(zhǔn)品管中,加入190μlqubit工作溶液,然后分別將qubitstandardhs#1和#2標(biāo)準(zhǔn)品10μl加入相應(yīng)的#1標(biāo)準(zhǔn)品管和#2標(biāo)準(zhǔn)品管中,漩渦振蕩混勻。在#3樣品管中加入198μlqubit工作溶液和2μl純化后的文庫(kù)擴(kuò)增產(chǎn)物,漩渦振蕩混勻。
4)靜置2min后,打開qubit,選擇dna測(cè)定,校正#1標(biāo)準(zhǔn)品管和#2標(biāo)準(zhǔn)品管中的標(biāo)準(zhǔn)品。
5)將#3樣品管放入qubit中讀數(shù)定量,并計(jì)算使用2μl樣品的定量值。
6)將文庫(kù)稀釋至100pm(約20ng/ml),獲得可用于iontorrent高通量測(cè)序儀的dna文庫(kù)。
將上述dna文庫(kù)送入iontorrent高通量測(cè)序儀進(jìn)行測(cè)序檢測(cè)。
基因融合檢測(cè)方法的原理是:利用二代測(cè)序的單分子reads(每個(gè)read來自于一個(gè)單分子dna序列),如果同一個(gè)reads(包含雙端和單端)的兩部分分別比對(duì)到基因組的不同位置,且不為repeat(重復(fù))區(qū)域,那么這個(gè)read就可能是潛在的發(fā)生融合的reads。最后根據(jù)cutoff>100,篩選出陽性的融合基因及其配對(duì)基因。具體步驟如下:
1)使用fastqc對(duì)所有原始測(cè)序的reads進(jìn)行質(zhì)量控制,然后去除接頭序列。
2)取質(zhì)量合格的序列,用bwa比對(duì)軟件,與hg19基因組染色體進(jìn)行比對(duì)。
3)篩選出目的基因(alk)上的非正常比對(duì)的reads。
4)將非正常比對(duì)的reads,轉(zhuǎn)化成fasta格式,利用blat軟件比對(duì)到基因組上,找出所有可能的匹配位置,與hg19中基因的位置做maping,并計(jì)算個(gè)數(shù)。
5)根據(jù)reads個(gè)數(shù)>100個(gè),并去掉幾個(gè)基因組經(jīng)常出現(xiàn)的重復(fù)區(qū)間,用igv查看基因融合reads分布,篩選出陽性的融合基因及其配對(duì)基因。
檢測(cè)結(jié)果顯示eml4與alk基因發(fā)生融合(參見圖1所示)。
序列表
<110>領(lǐng)星生物科技(上海)有限公司
<120>基于dna的融合基因定量測(cè)序建庫(kù)、檢測(cè)方法及其應(yīng)用
<130>cpc-np-17-100461
<160>44
<170>patentinversion3.3
<210>1
<211>21
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>1
tttgtggctagaggagtctgc21
<210>2
<211>18
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>2
agggcgctcaccgaatga18
<210>3
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>3
agctccatctgcatggcttg20
<210>4
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>4
tcctcccctgagctctgaac20
<210>5
<211>22
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>5
ggcagagtcatgttagtctggt22
<210>6
<211>19
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>6
cagggaaggctgggtgaac19
<210>7
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>7
gtgccatggagcctaaggaa20
<210>8
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>8
ctgtgctcagccattgggta20
<210>9
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>9
ccaagccacagagttggaga20
<210>10
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>10
acaggacctctttggactgc20
<210>11
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>11
cccaccctctagggttgtca20
<210>12
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>12
gcaaactccatggaagccag20
<210>13
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>13
cgctatgtgctcagttccct20
<210>14
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>14
gccgagcacgtagtaaccat20
<210>15
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>15
ctaccggcagatccctttgc20
<210>16
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>16
gcagtaagagctggttggga20
<210>17
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>17
atctctctgcctggagggtg20
<210>18
<211>21
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>18
caccatcgtgatggacactga21
<210>19
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>19
gagcttccgttttggcttgg20
<210>20
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>20
ggctctgtgcactcaccaat20
<210>21
<211>19
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>21
ctagaggagtctgcggagc19
<210>22
<211>21
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>22
ctcaccgaatgagggtgatgt21
<210>23
<211>19
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>23
atctgcatggcttgcagct19
<210>24
<211>21
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>24
cctgagctctgaacctttcca21
<210>25
<211>23
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>25
agtcatgttagtctggttcctcc23
<210>26
<211>18
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>26
ggctgggtgaaccagcag18
<210>27
<211>22
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>27
tggagcctaaggaagtttcagc22
<210>28
<211>19
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>28
cagccattgggtagggcag19
<210>29
<211>22
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>29
cacagagttggagaagagccac22
<210>30
<211>21
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>30
cctctttggactgcagtttcc21
<210>31
<211>24
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>31
cctctagggttgtcaatgaaatga24
<210>32
<211>22
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>32
tccatggaagccagaacaaaat22
<210>33
<211>22
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>33
gtgctcagttccctcctctatg22
<210>34
<211>23
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>34
acgtagtaaccatgcaacaagtg23
<210>35
<211>20
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>35
cagatccctttgcctgcagg20
<210>36
<211>19
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>36
agagctggttgggaccaca19
<210>37
<211>17
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>37
ctgcctggagggtggtg17
<210>38
<211>21
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>38
gtgatggacactgaaggagct21
<210>39
<211>18
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>39
ccgttttggcttggcctg18
<210>40
<211>21
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>40
tgcactcaccaatcatgatgc21
<210>41
<211>58
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>41
aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct58
<210>42
<211>63
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>42
gatcggaagagcacacgtctgaactccagtcacatcacgatctcgtatgccgtcttctgc60
ttg63
<210>43
<211>30
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>43
ccatctcatccctgcgtgtctccgactcag30
<210>44
<211>30
<212>dna
<213>人工序列
<220>
<221>misc_feature
<223>引物
<400>44
gtctcagcctctctatgggcagtcggtgat30