本發(fā)明涉及基因測(cè)序分析,特別涉及單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法。
背景技術(shù):
1、在生物醫(yī)學(xué)研究和臨床實(shí)踐中,單細(xì)胞分析技術(shù)在揭示細(xì)胞異質(zhì)性,解析復(fù)雜生物過(guò)程及疾病發(fā)病機(jī)制中正在發(fā)揮越來(lái)越關(guān)鍵的作用。傳統(tǒng)的群體級(jí)分析方法掩蓋了細(xì)胞間的細(xì)微差異,這些差異對(duì)于理解疾病發(fā)展、細(xì)胞決策過(guò)程以及對(duì)環(huán)境變化的響應(yīng)至關(guān)重要。單細(xì)胞rna測(cè)序(scrna-seq)技術(shù)已經(jīng)極大地推動(dòng)了從單一細(xì)胞分辨成千上萬(wàn)個(gè)rna分子的檢測(cè)和量化,為深入探索生物系統(tǒng)的內(nèi)部機(jī)制提供了獨(dú)特視角。
2、盡管scrna-seq技術(shù)取得了顯著進(jìn)展,但在捕獲和分析全長(zhǎng)rna分子方面的局限性,削弱了從單細(xì)胞獲得的轉(zhuǎn)錄本完整信息,限制了對(duì)轉(zhuǎn)錄后修飾、可變剪接事件及基因表達(dá)調(diào)控機(jī)制的全面理解。
3、在此背景下,oxford?nanopore?technologies(ont)的單細(xì)胞全長(zhǎng)測(cè)序技術(shù)應(yīng)運(yùn)而生,它通過(guò)直接測(cè)序單個(gè)細(xì)胞中的全長(zhǎng)rna分子,提供了前所未有的轉(zhuǎn)錄本完整視角。這一技術(shù)不僅揭示了5’和3’末端、編碼區(qū)、內(nèi)含子和可變剪接事件,而且極大地拓寬了對(duì)單細(xì)胞基因表達(dá)復(fù)雜性的認(rèn)識(shí),為生物學(xué)研究和臨床診斷提供了新的路徑。
4、然而,ont單細(xì)胞全長(zhǎng)測(cè)序技術(shù)在樣本制備、數(shù)據(jù)處理和成本效益方面面臨著挑戰(zhàn)。這些挑戰(zhàn)涉及保持rna分子的完整性、提升測(cè)序數(shù)據(jù)的質(zhì)量和降低操作成本。因此,針對(duì)這些挑戰(zhàn)開(kāi)發(fā)新的優(yōu)化方法,對(duì)擴(kuò)大ont單細(xì)胞全長(zhǎng)測(cè)序技術(shù)在科研和診斷中的應(yīng)用具有至關(guān)重要的意義。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供了一種基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,本方法利用10×genomics單細(xì)胞捕獲、標(biāo)記技術(shù)和ont測(cè)序技術(shù),能夠更準(zhǔn)確、更全面地分析細(xì)胞中的轉(zhuǎn)錄本和基因,深入挖掘生命過(guò)程中的轉(zhuǎn)錄信息,從而為生命科學(xué)研究、醫(yī)學(xué)診斷和藥物開(kāi)發(fā)等領(lǐng)域提供更多有價(jià)值的數(shù)據(jù)和應(yīng)用。本發(fā)明提供的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法具體通過(guò)以下技術(shù)實(shí)現(xiàn)。
2、一種基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,包括以下步驟:
3、制備、構(gòu)建待測(cè)樣品的cdna文庫(kù),測(cè)序,獲得所述待測(cè)樣品的三代原始數(shù)據(jù);對(duì)所述三代原始數(shù)據(jù)進(jìn)行質(zhì)控,得到所述待測(cè)樣品的三代有效數(shù)據(jù);
4、對(duì)參考基因組的基因和轉(zhuǎn)錄本進(jìn)行功能注釋;
5、結(jié)合所述三代有效數(shù)據(jù)和所述參考基因組的基因數(shù)據(jù),使用軟件ont-sc-pipeline進(jìn)行數(shù)據(jù)過(guò)濾、數(shù)據(jù)拆分、比對(duì)和定量,得到定量數(shù)據(jù);
6、對(duì)所述定量數(shù)據(jù)進(jìn)行雙細(xì)胞識(shí)別和去除,并對(duì)數(shù)據(jù)進(jìn)一步的過(guò)濾;
7、對(duì)過(guò)濾后的數(shù)據(jù)依次進(jìn)行基礎(chǔ)分析、marker基因富集分析和高級(jí)分析;所述基礎(chǔ)分析包括top基因分布分析、高變基因分析、聚類分群分析、各細(xì)胞類群的相關(guān)性分析、降維分析和marker基因識(shí)別;所述高級(jí)分析包括細(xì)胞注釋分析、細(xì)胞通訊分析、細(xì)胞軌跡分析、可變剪切分析和融合基因分析。
8、進(jìn)一步地,所述質(zhì)控處理的方法為:根據(jù)測(cè)序質(zhì)量值進(jìn)行篩選,剔除長(zhǎng)度≤30bp和質(zhì)量值≤5的序列。
9、進(jìn)一步地,利用軟件ont-sc-pipeline進(jìn)行數(shù)據(jù)拆分、比對(duì)和定量的方法為:使用vsearch進(jìn)行數(shù)據(jù)拆分,同時(shí)使用minimap2進(jìn)行數(shù)據(jù)比對(duì),提取拆分結(jié)果和比對(duì)結(jié)果二者信息合并得到所述定量數(shù)據(jù)。
10、進(jìn)一步地,使用scdblfinder軟件識(shí)別和去除雙細(xì)胞和低活性細(xì)胞,并剔除核糖體rna比例較高、線粒體基因比例較高的細(xì)胞。
11、進(jìn)一步地,使用seuratv5軟件進(jìn)行top基因分布分析;采用函數(shù)findvariablefeatures進(jìn)行高變基因分析;使用seuratv5軟件進(jìn)行聚類分群分析、降維分析和marker基因識(shí)別。
12、更進(jìn)一步地,所述降維分析具體采用seuratv5軟件中的pca、t-sne、umap分析方法中的至少一種進(jìn)行。
13、具體地,若待測(cè)樣本為多樣本,則使用harmony軟件代替原本的pca分析方法,對(duì)過(guò)濾后的多樣本單細(xì)胞數(shù)據(jù)進(jìn)行校正和整合。
14、進(jìn)一步地,采用超幾何分布算法進(jìn)行marker基因的富集分析。
15、進(jìn)一步地,結(jié)合已知marker基因和scina軟件進(jìn)行細(xì)胞注釋分析。
16、進(jìn)一步地,采用cellphonedb?v5進(jìn)行細(xì)胞通訊分析。
17、進(jìn)一步地,使用軟件monocle3進(jìn)行細(xì)胞軌跡分析。
18、進(jìn)一步地,采用isoswitch軟件進(jìn)行可變剪切分析。
19、進(jìn)一步地,采用軟件jaffa進(jìn)行融合基因分析。
20、進(jìn)一步地,使用monocle3軟件進(jìn)行細(xì)胞軌跡分析。
21、進(jìn)一步地,使用isoswitch軟件進(jìn)行可變剪切分析。
22、進(jìn)一步地,使用jaffa軟件進(jìn)行融合基因分析。
23、進(jìn)一步地,基于cellphonedb?v5結(jié)果,利用ggplot2和igraph方法對(duì)單通路在各個(gè)細(xì)胞亞群之間的通訊結(jié)果進(jìn)行可視化;將各亞基對(duì)配受體整體的貢獻(xiàn)度和通路中單個(gè)配受體對(duì)的亞基進(jìn)行可視化。
24、與現(xiàn)有技術(shù)相比,本發(fā)明的有益之處在于:
25、1、ont測(cè)序相比于二代測(cè)序手段,無(wú)需對(duì)片段進(jìn)行打斷,能夠測(cè)到完整的轉(zhuǎn)錄本,能夠?qū)D(zhuǎn)錄本進(jìn)行定量。
26、2、相對(duì)于現(xiàn)有的pacbio三代測(cè)序而言更具有成本優(yōu)勢(shì),在兼顧測(cè)序多種結(jié)果的同時(shí)具有極高的性價(jià)比。
1.一種基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,其特征在于,所述質(zhì)控處理的方法為:根據(jù)測(cè)序質(zhì)量值進(jìn)行篩選,剔除長(zhǎng)度≤30bp和質(zhì)量值≤5的序列。
3.根據(jù)權(quán)利要求1所述的基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,其特征在于,利用軟件ont-sc-pipeline進(jìn)行數(shù)據(jù)拆分、比對(duì)和定量的方法為:使用vsearch進(jìn)行數(shù)據(jù)拆分,同時(shí)使用minimap2進(jìn)行數(shù)據(jù)比對(duì),提取拆分結(jié)果和比對(duì)結(jié)果二者信息合并得到所述定量數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,其特征在于,使用scdblfinder軟件識(shí)別和去除雙細(xì)胞和低活性細(xì)胞,并剔除核糖體rna比例較高、線粒體基因比例較高的細(xì)胞。
5.根據(jù)權(quán)利要求1所述的基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,其特征在于,使用seuratv5軟件進(jìn)行top基因分布分析;采用函數(shù)findvariablefeatures進(jìn)行高變基因分析;使用seuratv5軟件進(jìn)行聚類分群分析、降維分析和marker基因識(shí)別。
6.根據(jù)權(quán)利要求5所述的基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,其特征在于,所述降維分析具體采用seuratv5軟件中的pca、t-sne、umap分析方法中的至少一種進(jìn)行。
7.根據(jù)權(quán)利要求6所述的基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,其特征在于,若待測(cè)樣本為多樣本,則使用harmony軟件代替所述pca分析方法,對(duì)過(guò)濾后的多樣本單細(xì)胞數(shù)據(jù)進(jìn)行校正和整合。
8.根據(jù)權(quán)利要求1所述的基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,其特征在于,采用超幾何分布算法進(jìn)行marker基因的富集分析。
9.根據(jù)權(quán)利要求1所述的基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,其特征在于,結(jié)合已知marker基因和scina軟件進(jìn)行細(xì)胞注釋分析;采用cellphonedb?v5進(jìn)行細(xì)胞通訊分析;使用軟件monocle3進(jìn)行細(xì)胞軌跡分析;采用isoswitch軟件進(jìn)行可變剪切分析;采用軟件jaffa進(jìn)行融合基因分析;使用monocle3軟件進(jìn)行細(xì)胞軌跡分析;使用isoswitch軟件進(jìn)行可變剪切分析;使用jaffa軟件進(jìn)行融合基因分析。
10.根據(jù)權(quán)利要求9所述的基于ont測(cè)序的單細(xì)胞轉(zhuǎn)錄組的測(cè)序分析方法,其特征在于,基于cellphonedb?v5結(jié)果,利用ggplot2和igraph方法對(duì)單通路在各個(gè)細(xì)胞亞群之間的通訊結(jié)果進(jìn)行可視化;將各亞基對(duì)配受體整體的貢獻(xiàn)度和通路中單個(gè)配受體對(duì)的亞基進(jìn)行可視化。