本發(fā)明涉及分子生物學(xué)與基因檢測(cè),具體涉及病毒整合位點(diǎn)的檢測(cè)方法、裝置、存儲(chǔ)介質(zhì)和電子設(shè)備。
背景技術(shù):
1、細(xì)胞與基因治療(cgt,cellular?and?gene?therapy)是指將外源核酸(dna,rna等)轉(zhuǎn)移至患者的特定靶細(xì)胞內(nèi)(體內(nèi)和體外兩種方式),通過基因添加、基因修正、基因沉默等方式修飾個(gè)體基因的表達(dá)或修復(fù)異常基因,達(dá)到治愈或減緩疾病的過程。例如,嵌合抗原受體t細(xì)胞療法(car-t)屬于免疫細(xì)胞療法,是使用慢病毒載體將一個(gè)帶有特異性抗原識(shí)別結(jié)構(gòu)域及t細(xì)胞激活信息的遺傳物質(zhì)轉(zhuǎn)入t細(xì)胞,使其具有特定攻擊腫瘤細(xì)胞的能力。隨著基因遞送載體和基因編輯等生物技術(shù)的快速發(fā)展,基因治療產(chǎn)品的臨床應(yīng)用不斷取得新的進(jìn)展。與此同時(shí),美國fda(food?and?drug?administration)和歐盟ema(europeanmedicines?agency)等機(jī)構(gòu)制定了一系列法規(guī)和指南,用于規(guī)范化該類產(chǎn)品研發(fā)、試驗(yàn)和上市過程。此外,我國藥品監(jiān)督管理局藥品審批中心也根據(jù)產(chǎn)品特征發(fā)布了一系列的指導(dǎo)原則,如《基因修飾細(xì)胞治療產(chǎn)品非臨床研究與技術(shù)指導(dǎo)原則(試行)》提出“基因與細(xì)胞治療藥物將遺傳物質(zhì)轉(zhuǎn)移到宿主細(xì)胞內(nèi)或整合到宿主基因組中或?qū)λ拗骰蚪M進(jìn)行編輯,存在潛在的遺傳毒性風(fēng)險(xiǎn),需要分析基因組改變的特征,并評(píng)估相關(guān)潛在風(fēng)險(xiǎn)”。《基因治療產(chǎn)品非臨床研究與評(píng)價(jià)技術(shù)指導(dǎo)原則(試行)》指出“需根據(jù)基因治療產(chǎn)品的特點(diǎn)、產(chǎn)品的具體適應(yīng)癥、載體的已有信息、導(dǎo)入基因序列結(jié)構(gòu)等,評(píng)估基因治療產(chǎn)品整合進(jìn)基因組的可能性,判斷是否需要開展另外的遺傳毒性研究,如評(píng)估插入突變(插入位點(diǎn)、插入拷貝數(shù)等)引起的遺傳毒性風(fēng)險(xiǎn)”?!扼w內(nèi)基因治療產(chǎn)品藥學(xué)研究與評(píng)價(jià)技術(shù)指導(dǎo)原則(試行)》指出“分析載體在基因組中的整合方式和整合位點(diǎn)的分布趨勢(shì),評(píng)估其插入導(dǎo)致細(xì)胞發(fā)生基因突變、基因失活/激活,或細(xì)胞癌變的風(fēng)險(xiǎn)”。準(zhǔn)確的檢測(cè)病毒整合位點(diǎn)能夠降低生物制品安全性風(fēng)險(xiǎn),促進(jìn)細(xì)胞和基因治療相關(guān)產(chǎn)品的應(yīng)用和發(fā)展。
2、以往常用的整合位點(diǎn)鑒定是基于lam-pcr及其衍生技術(shù),即利用線性擴(kuò)增和磁珠分離來富集載體(已知序列)與基因組連接處的核酸片段,隨后通過雙鏈合成,限制性酶切,巢式pcr,接頭連接等步驟進(jìn)行建庫和高通量測(cè)序,從而鑒定整合位點(diǎn)的方法。然而,由于lam-pcr需要針對(duì)不同的病毒載體類型,各自設(shè)計(jì)特異性引物進(jìn)行擴(kuò)增,確定載體的整合情況;多步驟的pcr過程和需要使用限制性酶切增加了操作的復(fù)雜性;可能對(duì)某些基因組區(qū)域有擴(kuò)增偏向性;載體ltr變異可能導(dǎo)致引物脫扣等。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明要解決的技術(shù)問題在于提供病毒整合位點(diǎn)的檢測(cè)方法、裝置、存儲(chǔ)介質(zhì)和電子設(shè)備,本發(fā)明提供了利用液相探針雜交捕獲技術(shù)進(jìn)行整合位點(diǎn)的檢測(cè)方法,該方法提高了捕獲的均一性,降低了序列變異導(dǎo)致引物脫扣導(dǎo)致的假陰性。
2、本發(fā)明提供了病毒整合位點(diǎn)的檢測(cè)方法,包括如下步驟:
3、步驟1、獲取樣本dna,并打斷至主峰為200~500bp的片段,所述片段經(jīng)末端修復(fù)、加接頭及pcr擴(kuò)增后獲得預(yù)文庫;
4、步驟2、獲取病毒遞送載體的序列,經(jīng)序列截取、比對(duì)、異常序列剔除及去重后獲得目標(biāo)序列組,基于所述目標(biāo)序列組設(shè)計(jì)并合成用于檢測(cè)病毒整合位點(diǎn)的探針組;
5、步驟3、取所述預(yù)文庫與所述探針組經(jīng)液相雜交后上機(jī)測(cè)序;
6、步驟4、根據(jù)所述測(cè)序的結(jié)果分別與宿主基因組、所述目標(biāo)序列組進(jìn)行比對(duì),并基于所述比對(duì)的結(jié)果進(jìn)行整合情況分析、整合比例統(tǒng)計(jì)和檢出閾值過濾后,獲得病毒整合位點(diǎn)的信息。
7、與現(xiàn)有技術(shù)相比,本發(fā)明提供的病毒整合位點(diǎn)的檢測(cè)方法,通過設(shè)計(jì)不同的探針,可以針對(duì)不同的病毒載體進(jìn)行整合位點(diǎn)的捕獲,且由于探針捕獲技術(shù)相較于傳統(tǒng)的lam-pcr技術(shù),具有捕獲序列容錯(cuò)率高,可以均一性捕獲整合位點(diǎn)、且可捕獲不易pcr擴(kuò)增區(qū)域等優(yōu)勢(shì),進(jìn)一步提高了捕獲的均一性,降低了序列變異導(dǎo)致引物脫扣導(dǎo)致的假陰性,從而獲得更準(zhǔn)確的技術(shù)效果。
8、在一些實(shí)施例中,所述病毒遞送載體中病毒包括慢病毒、腺病毒、腺相關(guān)病毒、逆轉(zhuǎn)錄病毒、鼠白血病病毒,和禽白血病病毒中的至少一種。
9、在一些實(shí)施例中,所述步驟2中,所述病毒遞送載體的序列包括所述病毒遞送載體的itr序列和/或ltr序列。
10、與其他序列相比,病毒遞送載體的ltr和itr形成的特殊結(jié)構(gòu)有助于維持整合過程中的穩(wěn)定性,且二者通常包含與整合相關(guān)的信號(hào)和特異性識(shí)別元件,穩(wěn)定的結(jié)構(gòu)可以促進(jìn)整合酶與dna的相互作用,使整合反應(yīng)更有效地進(jìn)行,從而獲得更準(zhǔn)確的技術(shù)效果。
11、在一些實(shí)施例中,所述步驟2中,
12、所述病毒遞送載體的序列利用bedtools軟件按照特征信息文件中的ltr和itr位置信息進(jìn)行所述序列截??;
13、經(jīng)所述序列截取后的序列利用mafft軟件進(jìn)行所述比對(duì),并基于mega進(jìn)行可視化,評(píng)估序列的保守性以及所述異常序列剔除。
14、在一些實(shí)施例中,所述步驟3中,所述液相雜交包括文庫雜交、文庫捕獲和洗脫后獲得雜交捕獲文庫,所述雜交捕獲文庫經(jīng)pcr擴(kuò)增、純化和定量后進(jìn)行上機(jī)測(cè)序。
15、在一些具體實(shí)施例中,所述液相雜交中,所述預(yù)文庫的樣本數(shù)取自1~6中的整數(shù)。
16、實(shí)驗(yàn)表明,本發(fā)明的檢測(cè)方法能一批對(duì)多個(gè)樣本以及多種整合類型進(jìn)行判定,能在短周期內(nèi)完成多個(gè)樣本整合情況分析,從而獲得更準(zhǔn)確的技術(shù)效果。
17、在一些實(shí)施例中,所述步驟4中,所述測(cè)序的結(jié)果經(jīng)數(shù)據(jù)質(zhì)控后再進(jìn)行所述比對(duì)。
18、在一些實(shí)施例中,所述步驟4中,所述步驟4中,所述比對(duì)的結(jié)果包括質(zhì)控后reads數(shù)、比對(duì)上所述目標(biāo)序列組的斷點(diǎn)支持reads數(shù)以及同時(shí)比對(duì)上所述宿主宿主基因組和所述目標(biāo)序列組的嵌合reads數(shù);
19、所述檢出閾值根據(jù)以下①和/或②確定:
20、①、所述斷點(diǎn)支持reads數(shù)和所述質(zhì)控后reads數(shù)的比值;
21、②、所述斷點(diǎn)支持reads數(shù)和所述嵌合reads數(shù)的比值。
22、在一些具體實(shí)施例中,所述病毒遞送載體包括腺相關(guān)病毒遞送載體、慢病毒遞送載體和逆轉(zhuǎn)錄病毒遞送載體中的至少一種。
23、目前主流的病毒遞送載體系統(tǒng)包括慢病毒(lv)、逆轉(zhuǎn)錄病毒(retrovirus)、腺相關(guān)病毒(aav)載體等。首先,慢病毒載體是目前應(yīng)用最為成熟和廣泛的病毒載體類型,尤其是在免疫細(xì)胞治療領(lǐng)域,并且該體系完整保留了原本逆轉(zhuǎn)錄病毒高表達(dá)效率和長表達(dá)時(shí)間的優(yōu)點(diǎn),并且在感染能力上有了巨大的提升,但其也保留了隨機(jī)插入的不穩(wěn)定性。第二,γ逆轉(zhuǎn)錄病毒(如鼠白血病病毒)也是一種常用的遞送方式,由于其基因組相對(duì)簡(jiǎn)單,且整合位點(diǎn)相對(duì)穩(wěn)定,常用于轉(zhuǎn)導(dǎo)造血干細(xì)胞、神經(jīng)干細(xì)胞等細(xì)胞類型轉(zhuǎn)導(dǎo)。第三,腺相關(guān)病毒aav載體作為一種新型病毒載體遞送技術(shù),在多款獲批的基因治療產(chǎn)品中也得到了應(yīng)用。該病毒相較于前面兩種病毒載體來說,通常以外源dna的形式存在與細(xì)胞核中,具有整合風(fēng)險(xiǎn)低,安全性更高,但載體容量小,表達(dá)水平低等特點(diǎn),但基因編輯通常需要在細(xì)胞基因組中引入特定的變化,需要獲得較高的整合率來確保編輯基因的穩(wěn)定性,相較于基因治療類產(chǎn)品,基因編輯類產(chǎn)品用aav遞送時(shí)載體整合到基因組的概率相對(duì)較高。由于慢病毒和逆轉(zhuǎn)錄病毒載體均能整合到宿主基因組上,且整合位點(diǎn)具有不確定性。據(jù)以往報(bào)道,腺相關(guān)病毒載體也存在一定的基因組整合概率。然而不確定的整合位點(diǎn),可能引起原癌基因的激活、抑癌基因的失活等安全性問題。因此本發(fā)明采用腺相關(guān)病毒遞送載體、慢病毒遞送載體和逆轉(zhuǎn)錄病毒遞送載體作為探針設(shè)計(jì)的靶標(biāo)序列,可以針對(duì)不同的病毒載體進(jìn)行整合位點(diǎn)的捕獲,能夠全面檢測(cè)多種病毒遞送載體序列的整合情況,從而獲得更準(zhǔn)確的技術(shù)效果。
24、在一些具體實(shí)施例中,所述目標(biāo)序列組包括所述腺相關(guān)病毒遞送載體目標(biāo)序列組、所述慢病毒遞送載體目標(biāo)序列組和所述逆轉(zhuǎn)錄病毒遞送載體目標(biāo)序列組中的至少一種,其中:
25、所述腺相關(guān)病毒遞送載體目標(biāo)序列組具有如seq?id?no:1~13所示的核苷酸序列中的至少一種;
26、所述慢病毒遞送載體目標(biāo)序列組具有如seq?id?no:14~40所示的核苷酸序列中的至少一種;
27、所述逆轉(zhuǎn)錄病毒遞送載體目標(biāo)序列組具有如seq?id?no:41~89所示的核苷酸序列中的至少一種。
28、在一些具體實(shí)施例中,所述檢測(cè)閾值設(shè)定為:
29、所述斷點(diǎn)支持reads數(shù)和所述質(zhì)控后reads數(shù)的比值大于5e-6;且
30、所述斷點(diǎn)支持reads數(shù)和所述嵌合reads數(shù)的比值大于0.01。
31、本發(fā)明還提供了整合位點(diǎn)檢測(cè)裝置,包括:
32、數(shù)據(jù)獲取模塊:用于獲取樣本測(cè)序數(shù)據(jù);
33、分析模塊:按照所述的方法,分析獲得病毒整合位點(diǎn);
34、輸出模塊:用于輸出顯示所述分析模塊得到的結(jié)果。
35、本發(fā)明提供了存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)包括存儲(chǔ)的程序,其中,所述程序被處理器運(yùn)行時(shí)執(zhí)行所述的病毒整合位點(diǎn)的檢測(cè)方法。
36、本發(fā)明提供了電子設(shè)備,包括處理器、存儲(chǔ)器和總線,所述處理器與所述存儲(chǔ)器通過所述總線連接;
37、所述存儲(chǔ)器用于存儲(chǔ)程序,所述處理器用于運(yùn)行程序,其中,所述程序被處理器運(yùn)行時(shí)執(zhí)行所述的病毒整合位點(diǎn)的檢測(cè)方法。
38、本發(fā)明提供了病毒整合位點(diǎn)的檢測(cè)方法、裝置、存儲(chǔ)介質(zhì)和電子設(shè)備,本發(fā)明針對(duì)所有慢病毒,逆轉(zhuǎn)錄病毒和腺相關(guān)病毒載體整合邊界序列批量設(shè)計(jì)探針后,可以用于上述所有載體類型的整合位點(diǎn)鑒定,可以同時(shí)對(duì)多個(gè)樣本進(jìn)行整合位點(diǎn)的捕獲和鑒定,從而可以明顯減少實(shí)驗(yàn)成本和周期,提升檢測(cè)樣本通量和準(zhǔn)確性。
39、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點(diǎn):
40、1.高通量:采用本發(fā)明種探針捕獲技術(shù)能一批對(duì)多個(gè)樣本以及多種整合類型進(jìn)行判定,并且結(jié)合高通量測(cè)序技術(shù)和生信分析方案,能在短周期內(nèi)完成多個(gè)樣本整合情況分析。
41、2.高普適性:本發(fā)明中生信分析流程能夠適用于不同整合位點(diǎn)檢測(cè)技術(shù)的高通量測(cè)序分析,例如lam-pcr和wgs測(cè)序等。
42、3.實(shí)驗(yàn)和分析流程簡(jiǎn)便易操作:本發(fā)明中實(shí)驗(yàn)流程在樣本建庫后進(jìn)行一輪探針捕獲即完成整合位點(diǎn)區(qū)域富集;分析流程部署簡(jiǎn)單,使用方便,在計(jì)算服務(wù)器上部署后可快速應(yīng)用于相關(guān)數(shù)據(jù)檢測(cè),從而可以明顯減少實(shí)驗(yàn)成本和周期。
43、4.高靈敏度:采用本發(fā)明的檢測(cè)方法進(jìn)行養(yǎng)樣本檢測(cè),檢測(cè)準(zhǔn)確率達(dá)到100%。