同時(shí)確定胎兒核酸含量和染色體非整倍性的方法及裝置制造方法
【專利摘要】本發(fā)明提供了確定孕婦體液樣本中胎兒核酸含量的方法、同時(shí)確定孕婦體液樣本中胎兒核酸含量和胎兒染色體變異信息的方法、檢測孕婦體液樣本中胎兒核酸變異的非診斷方法及各自的裝置,所說的確定孕婦體液樣本中胎兒核酸含量的方法包括:獲取孕婦體液樣本;從樣本中提取第一DNA和第二DNA,第一DNA為母體和胎兒DNA混合物,第二DNA為母體基因組DNA;對至少一部分的第一DNA和至少一部分的第二DNA測序以獲得第一讀段和第二讀段,第一讀段和第二讀段中包含多個(gè)多態(tài)性位點(diǎn);將第一讀段和第二讀段分別與參考序列比對,基于獲得的比對結(jié)果,篩選出多態(tài)性位點(diǎn)中在第二DNA只有一種基因型并且在第一DNA有兩種基因型的多態(tài)性位點(diǎn);依據(jù)比對結(jié)果中的第一讀段中支持篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目,確定樣本中的胎兒核酸含量。
【專利說明】同時(shí)確定胎兒核酸含量和染色體非整倍性的方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于生物醫(yī)學(xué)領(lǐng)域,特別地,涉及確定孕婦樣本中的胎兒核酸含量的方法、 同時(shí)確定孕婦樣本中胎兒核酸含量和染色體變異的方法、檢測孕婦體液樣本中胎兒核酸變 異的方法及各裝置。
【背景技術(shù)】
[0002] 出生缺陷指的是嬰兒在出生前發(fā)生的身體結(jié)構(gòu)、功能或代謝異常。目前,全世界 已經(jīng)發(fā)現(xiàn)7000多種遺傳或半遺傳性出生缺陷疾病。根據(jù)2001美國MARCH OF DMES(MOD) 基金會(huì)報(bào)告顯示,排在前5位的嚴(yán)重遺傳或半遺傳性出生缺陷分別是心血管缺陷、神經(jīng)管 畸形、血紅蛋白疾病(地中海貧血和鐮狀細(xì)胞性貧血)、唐氏綜合征和葡萄糖-6-磷酸酶脫 氫酶(G6PD)缺乏癥。這5種疾病約占全部出生缺陷的25% [U.S. Department of Health And Human Services,Centers for Disease Control and Prevention. Centers for Birth Defects Research and Prevention[R]. Atlanta:CDC. 2003 ;Hsu L YF. Prenatal diagnosis of chromosomal abnormalities through amniocentesis. InMilunsky A ed. Genetic Disorders and the Fetus: diagnosis, prevention,and treatment.4th ed.Baltimore:Johns Hop-kins University Press,1998:179]〇
[0003] 染色體異常是最常見的導(dǎo)致出生缺陷的遺傳因素,其發(fā)生率隨著母親年齡的增高 而上升。國外的統(tǒng)計(jì)資料表明,在每150個(gè)新生兒中就有一個(gè)染色體異常患者。臨床上較 常見的常染色體非整倍體有21-三體綜合征(Down綜合征,DS),18-三體綜合征,13-三體 綜合征,性染色體非整倍體有Klinefelter綜合征,Turner綜合征,ΧΥΥ綜合征,X三體綜合 征等。這四種常見染色體異常占所有染色體異常的65% - 80%,且占出生后染色體異常導(dǎo) 致出生缺陷的85% - 95%。其中21-三體綜合征是最常見的常染色體非整倍體病,在新生 兒中發(fā)病率約為1/600-1/1000,占小兒三體型染色體病的70%-80%。根據(jù)2003年的資料 測算,我國每年新出生的唐氏綜合征生命周期的總經(jīng)濟(jì)負(fù)擔(dān)超過100億元。針對這四種常 見染色體異常的研究、檢測、輔助篩查、篩查和及時(shí)診斷,能夠起到降低出生缺陷的發(fā)生,提 高出生人口素質(zhì)的作用。
[0004] 隨著近年來,母體外周血中發(fā)現(xiàn)的胎兒游離DNA[Lo ΥΜ,CorbettaN, Chamberlain PF, et al. Presence of fetal DNA inmaternal plasma and serum. Lancet 1997 ; 350 (9560):485 - 487] , RNA [Ferguson-Smith, M. A. Placental mRNA inmaternal plasma:prospects for fetal screen-ing. Proc. Natl. Acad. Sci. USA 100,4360 -4362 (2003)]及胎兒細(xì)胞[Bischoff,F(xiàn)_ Z_,Sinacori, M_ K_,Dang, D_ D_, Marquez-Do, D., H orne, C. , Lewis, D. E. , &Simpson, J. L. (2002). Cell-free fetal DNA and intact fetal cells in maternal blood circulation:implications for first and second trimester non-invasive prenatal diagnosis· Human reproduction update, 8 (6) ,493 - 500_]為無 創(chuàng)產(chǎn)前診斷提供新的可能。基于孕婦外周血中胎兒游離DNA及二代測序的胎兒染色體非 整倍性無創(chuàng)基因檢測技術(shù)現(xiàn)階段主要定位于21、18、13三體及部分性染色體異常的產(chǎn)前篩 查。相較于傳統(tǒng)的血清學(xué)篩查方法,該方法檢出率可達(dá)98%,其假陽性率僅為0.2%或更 低。該方法在國際國內(nèi)得到了普遍的認(rèn)可,提供了一種新型的染色體非整倍體產(chǎn)前輔助篩 查及診斷模式。然而由于早孕期母體外周血漿中的胎兒游離DNA含量相對偏低,可能存在 檢出率偏低的問題,因此目前無創(chuàng)產(chǎn)前檢測非整倍體的技術(shù)主要針對16孕周之后的孕婦 群體提供服務(wù)。
[0005] 高靈敏度、高特異性的無創(chuàng)產(chǎn)前篩查技術(shù)能夠最大限度的預(yù)防漏檢、錯(cuò)檢,減少不 必要的有創(chuàng)性產(chǎn)前診斷,減輕臨床診斷壓力,避免不必要的流產(chǎn)。目前,仍缺乏一種適用于 在大規(guī)模人群對特定一種或幾種單基因病相關(guān)基因進(jìn)行檢測的技術(shù)。也缺乏在早孕期(16 孕周之前)的非整倍體與單基因病的同步篩查方法。
【發(fā)明內(nèi)容】
[0006] -方面,本發(fā)明提供一種確定孕婦體液樣本中胎兒核酸含量的方法,該方法包括: ⑴獲得孕婦體液樣本;(2)從⑴中的樣本提取第一DNA和第二DNA,第一 DNA為母體和胎 兒DNA混合物,第二DNA為母體基因組DNA ; (3)對⑵中至少一部分的第一 DNA測序以獲 得第一讀段,對(2)中至少一部分的第二DNA進(jìn)行測序以獲得第二讀段,所述第一讀段和所 述第二讀段中包含多個(gè)多態(tài)性位點(diǎn);(4)將(3)的第一讀段和第二讀段分別與參考序列比 對,基于獲得的比對結(jié)果,篩選出(3)中的多態(tài)性位點(diǎn)中在第二DNA只有一種基因型并且在 第一 DNA有兩種基因型的多態(tài)性位點(diǎn);(5)依據(jù)(4)中的比對結(jié)果中的第一讀段中支持(4) 中篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目,確定所述孕婦體液樣本中胎兒核酸含量。所說的孕婦 體液樣本可以來源于孕婦外周血、孕婦尿液等。
[0007] 本發(fā)明還提供了 一種同時(shí)確定孕婦體液樣本中胎兒核酸含量和胎兒染色體變異 信息的方法,該方法包括:(1)獲得孕婦體液樣本;(2)從(1)中的樣本提取第一DNA和第二 DNA,第一 DNA為母體和胎兒DNA混合物,第二DNA為母體基因組DNA ; (3)對(2)中至少一 部分的第一 DNA測序以獲得第一讀段,對(2)中至少一部分的第二DNA進(jìn)行測序以獲得第 二讀段,所述第一讀段和所述第二讀段中包含多個(gè)多態(tài)性位點(diǎn);(4)將(3)的第一讀段和第 二讀段分別與參考序列比對,基于獲得的比對結(jié)果,篩選出(3)中的多態(tài)性位點(diǎn)中在第二 DNA只有一種基因型并且在第一DNA有兩種基因型的多態(tài)性位點(diǎn);(5)依據(jù)(4)中的比對結(jié) 果中的第一讀段中支持(4)中篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目,同時(shí)確定所述孕婦體液樣 本中胎兒核酸含量和胎兒染色體變異信息。所說的孕婦體液樣本可以來源于孕婦外周血、 孕婦尿液等。所說的胎兒染色體變異信息包括胎兒染色體非整倍性、染色體部分非整倍性、 CNV 等。
[0008]另一方本發(fā)明提供了一種檢測孕婦體液樣本中胎兒核酸變異的方法,所述核 酸變異包括SNP、剪切位點(diǎn)突變、CNV和染色體非整倍性的至少一種,所述方法包括:利用本 發(fā)明一方面的確定孕婦體液樣本中胎兒核酸含量的方法確定孕婦體液樣本中胎兒核酸含 量;基于所述胎兒核酸含量確定所述胎兒核酸變異檢測所需的最低數(shù)據(jù)量;對第一 DNA進(jìn) 行測序,獲得不小于所述最低數(shù)據(jù)量的測序數(shù)據(jù);基于所述測序數(shù)據(jù),檢測所述胎兒核酸變 異。該方法可以實(shí)現(xiàn)利用一次實(shí)驗(yàn)獲得最低數(shù)據(jù)量對多種核酸變異類型的同時(shí)準(zhǔn)確檢測。 當(dāng)胎兒核酸含量大于等于4%,所述最低數(shù)據(jù)量為〇· 18Gbp ;當(dāng)胎兒核酸含量為3 %?4%, 所述最低數(shù)據(jù)量為0. 54Gbp。
[0009]再一方面,本發(fā)明提供了一種確定孕婦體液樣本中胎兒核酸含量的裝置,該裝置 能夠用于執(zhí)行本發(fā)明一方面提供的確定孕婦體液樣本中胎兒核酸含量的方法的部分或所 有步驟,該裝置包括:A1.樣本獲取單元,用以獲取孕婦體液樣本;M.核酸提取單元,與 A1 單元連接,用于提取樣本中的第一 DNA和第二DNA,第一 DNA為母體和胎兒DNA混合物,第二 DNA為母體基因組DNA ;C1.測序單元,與B1單元連接,用于對至少一部分的第一 DNA測序以 獲得第一讀段,對至少一部分的第二DNA進(jìn)行測序以獲得第二讀段,所述第一讀段和所述 第二讀段中包含多個(gè)多態(tài)性位點(diǎn);D1.比對篩選單元,與 C1單元連接,接收B1單元的數(shù)據(jù), 用于實(shí)現(xiàn)將第一讀段和第二讀段分別與參考序列比對,基于獲得的比對結(jié)果,篩選出 C1中 的多態(tài)性位點(diǎn)中在第二DNA只有一種基因型并且在第一 DNA有兩種基因型的多態(tài)性位點(diǎn); E1.核酸含量確定單元,與D1單元連接,接收D1單元的數(shù)據(jù),用于依據(jù)獲自D1的比對結(jié)果 中的第一讀段中支持D1中篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目,確定所述孕婦體液樣本中胎 兒核酸含量。
[0010]又一方面,本發(fā)明提供了一種同時(shí)確定孕婦體液樣本中胎兒核酸含量和胎兒染色 體變異彳曰息的裝置,在該裝置中,能夠執(zhí)行本發(fā)明一方面提供的同時(shí)確定孕婦體液樣本中 胎兒核酸含量和胎兒染色體變異信息的方法的全部或部分步驟,該裝置包括:A2.樣本獲 取單元,用以獲取孕婦體液樣本;B2.核酸提取單元,與A2單元連接,用于提取樣本中的第 一 DNA和第二DNA,第一 DNA為母體和胎兒DNA混合物,第二DNA為母體基因組DNA ;C2.測 序單元,與B2單元連接,用于對至少一部分的第一 DNA測序以獲得第一讀段,對至少一部分 的第二DNA進(jìn)行測序以獲得第二讀段,所述第一讀段和所述第二讀段中包含多個(gè)多態(tài)性位 點(diǎn);D 2·比對篩選單元,與C2單元連接,接收B2單元的數(shù)據(jù),用于實(shí)現(xiàn)將第一讀段和第二讀 段分別與參考序列比對,基于獲得的比對結(jié)果,篩選出C2中的多態(tài)性位點(diǎn)中在第二DNA只 有一種基因型并且在第一 DNA有兩種基因型的多態(tài)性位點(diǎn);E2.核酸含量和變異確定單元, 與D2單元連接,接收D2單元的數(shù)據(jù),用于依據(jù)獲自D2的比對結(jié)果中的第一讀段中支持D2 中篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目,同時(shí)確定所述孕婦體液樣本中胎兒核酸含量和胎兒染 色體變異信息。
[0011] 本發(fā)明還提供了一種檢測孕婦體液樣本中胎兒核酸變異的裝置,利用該裝置能夠 執(zhí)行或?qū)崿F(xiàn)本發(fā)明一方面的檢測孕婦體液樣本中胎兒核酸變異的方法的部分或所有步驟, 該裝置包括:胎兒核酸含量確定單元,所述胎兒核酸含量的確定是通過本發(fā)明一方面的確 定孕婦體液樣本中胎兒核酸含量的方法進(jìn)行的,獲得胎兒核酸含量;最低數(shù)據(jù)量確定單元, 與所述胎兒核酸含量確定單元連接,用于基于所述胎兒核酸含量確定所述胎兒核酸變異檢 測所需的最低數(shù)據(jù)量;測序單元,與所述最低數(shù)據(jù)量確定單元連接,用于對第一 DNA進(jìn)行測 序,獲得不小于所述最低數(shù)據(jù)量的測序數(shù)據(jù),所述第一 DNA獲自所述孕婦體液樣本,所述第 一 DNA為母體和胎兒DNA混合物;變異檢測單元,與所述測序單元連接,接收來自所述測序 單元的測序數(shù)據(jù),基于所述測序數(shù)據(jù),檢測所述胎兒核酸變異。
[0012] 本發(fā)明的上述方法和/或裝置適合于在早孕期(16孕周之前,特別是8-12孕周) 對產(chǎn)前人群中進(jìn)行大規(guī)模地同時(shí)對胎兒非整倍體患病風(fēng)險(xiǎn)及單基因病患病風(fēng)險(xiǎn)進(jìn)行預(yù)測 或輔助篩查。本發(fā)明的方法和/裝置能夠在早孕期抽血孕婦外周血,通過離心實(shí)現(xiàn)血漿及 血細(xì)胞的分離,通過血漿DNA實(shí)現(xiàn)對胎兒非整倍體的檢測,通過孕婦血細(xì)胞實(shí)現(xiàn)對孕婦SNP 檢測、對孕婦單基因病攜帶情況的篩查,并根據(jù)孕婦單基因病致病基因攜帶情況,確定是否 對其丈夫進(jìn)行攜帶者篩查,以確定胎兒某種單基因病的患病風(fēng)險(xiǎn)。能夠?qū)崿F(xiàn)利用一次實(shí)驗(yàn) 獲得最低數(shù)據(jù)量對多種核酸變異類型的同時(shí)準(zhǔn)確檢測。
[0013]利用本發(fā)明的上述方法和/或裝置能夠?qū)崿F(xiàn)早孕期的基于胎兒游離DNA的無創(chuàng)產(chǎn) 前非整倍體檢測和/或輔助篩查。本發(fā)明的方法和/或裝置還能通過胎兒游離DN定量獲 得最低要求的數(shù)據(jù)量進(jìn)行無創(chuàng)產(chǎn)前檢測非整倍體,實(shí)現(xiàn)早孕期的無創(chuàng)非整倍體檢測。本發(fā) 明的方法和/或裝置還能基于目標(biāo)區(qū)域捕獲的高通量測序用于大量樣品的大規(guī)模篩查,目 前目標(biāo)區(qū)域捕獲檢測技術(shù)多使用于單堿基突變、以及一些小片段堿基的插入及缺失檢測, 而對于涉及大片段缺失,如缺失型alpha地中海貧血,缺失DMD等仍需通過QPCR,gap-PCR 等技術(shù)進(jìn)行檢測。因使用目標(biāo)區(qū)域捕獲無法實(shí)現(xiàn)對已知致病突變的完全準(zhǔn)確唯一覆蓋,而 通過多種技術(shù)結(jié)合使用則存在費(fèi)時(shí)費(fèi)力的問題。本發(fā)明方法和/或裝置通過探針設(shè)計(jì)及信 息分析方法的改進(jìn),實(shí)現(xiàn)通過目標(biāo)區(qū)域捕獲同時(shí)檢測點(diǎn)突變、小片段插入缺失、常見缺失型 致病突變以及染色體非整倍性的檢測。檢測快速準(zhǔn)確,適用于產(chǎn)前檢測或者輔助產(chǎn)前檢測。
【專利附圖】
【附圖說明】
[0014]本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對實(shí)施方式的描述中將 變得明顯和容易理解,其中:
[0015]圖1是本發(fā)明的一個(gè)【具體實(shí)施方式】中的基于孕婦外周血樣本檢測胎兒非整倍體、 胎兒SNP基因型和孕婦SNP基因型的流程圖;
[0016]圖2是本發(fā)明的一個(gè)【具體實(shí)施方式】中的確定孕婦體液樣本中胎兒核酸含量的裝 置示意圖。
【具體實(shí)施方式】
[0017]根據(jù)本發(fā)明的一個(gè)實(shí)施方式,提供了一種確定孕婦體液樣本中胎兒核酸含量的方 法,該方法包括:(1)獲得孕婦體液樣本;(2)從(1)中的樣本提取第一 DNA和第二DNA,第 一 DNA為母體和胎兒DNA混合物,第二DNA為母體基因組DNA ; (3)對⑵中至少一部分的 第一 DNA測序以獲得第一讀段,對(2)中至少一部分的第二DNA進(jìn)行測序以獲得第二讀段, 所述第一讀段和所述第二讀段中包含多個(gè)多態(tài)性位點(diǎn);(4)將(3)的第一讀段和第二讀段 分別與參考序列比對,基于獲得的比對結(jié)果,篩選出(3)中的多態(tài)性位點(diǎn)中在第二DNA只有 一種基因型并且在第一 DNA有兩種基因型的多態(tài)性位點(diǎn);(5)依據(jù)(4)中的比對結(jié)果中的 第一讀段中支持(4)中篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目,確定所述孕婦體液樣本中胎兒核 酸含量。在本發(fā)明的一個(gè)【具體實(shí)施方式】中,所述孕婦體液樣本來源于孕婦外周血和孕婦尿 液的至少一種。孕婦^液樣本比如孕婦外周血,包含孕婦的紅細(xì)胞、白細(xì)胞,血漿或血清中 包含孕婦及胎兒的游離核酸混合物即為第一 DNA,第二DNA來源于孕婦紅細(xì)胞、白細(xì)胞基因 組。所以,若是獲得孕婦血液樣本,還包括對血液樣本進(jìn)行處理,獲得血清/血楽和母體細(xì) 胞,分別提取核酸。
[0018]在本發(fā)明的一個(gè)【具體實(shí)施方式】中,多態(tài)性位點(diǎn)為在群體中次等位基因頻率不小于 0· 4的SNP。群體為不少于3〇個(gè)人樣本,可以利用已公開的千人基因組數(shù)據(jù)獲得上述SNP, 也可以對多個(gè)人樣本進(jìn)行測定識(shí)別出SNP,挑選出次等位基因頻率不小于〇. 4的SNP,這些 高次等位基因頻率的SNP雜合率高,利于基于少量數(shù)據(jù)中挑出胎兒不同于母體的基因型, 利于胎兒的SNP檢測和確定混合核酸中的胎兒核酸含量。
[0019]在本發(fā)明的一個(gè)【具體實(shí)施方式】,(4)中篩選出的多態(tài)性位點(diǎn)的基因型組合為:(i) 在第二DNA中只有純合基因型、而在第一 DNA中存在純合和雜合基因型,或者(π)在第二 DNA中只有雜合基因型、而在第一 DNA中存在純合和雜合基因型。當(dāng)(4)中的多態(tài)性位點(diǎn)的 基因型組合為(i)時(shí),(5)中胎兒核酸含量的確定公式為f = 2d/(c+d),當(dāng)(4)中的多態(tài)性 似點(diǎn)的基因型組合為(ii)時(shí),(5)中胎兒核酸含量的確定公式為f= (c-d)/(c+d),其中,c 為第一讀段中支持純合基因型的讀段的數(shù)目,d為第一讀段中支持雜合基因型的讀段的數(shù) 目。
[0020]根據(jù)本發(fā)明的另一個(gè)實(shí)施方式,提供了一種同時(shí)確定孕婦體液樣本中胎兒核酸含 量和胎兒染色體變異信息的方法,該方法包括:(1)獲得孕婦體液樣本;(2)從(1)中的樣 本提取第一 DNA和第二DNA,第一 DNA為母體和胎兒DNA混合物,第二DNA為母體基因組 DNA;(3)對(2)中至少一部分的第一DNA測序以獲得第一讀段,對(2)中至少一部分的第二 DNA進(jìn)行測序以獲得第二讀段,所述第一讀段和所述第二讀段中包含多個(gè)多態(tài)性位點(diǎn);(4) 將(3)的第一讀段和第二讀段分別與參考序列比對,基于獲得的比對結(jié)果,篩選出(3)中的 多態(tài)性位點(diǎn)中在第二DNA只有一種基因型并且在第一 DNA有兩種基因型的多態(tài)性位點(diǎn);(5) 依據(jù)(4)中的比對結(jié)果中的第一讀段中支持(4)中篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目,同時(shí) 確定所述孕婦體液樣本中胎兒核酸含量和胎兒染色體變異信息。在本發(fā)明的一個(gè)具體實(shí)施 方式中,孕婦體液樣本來源于孕婦外周血和孕婦尿液的至少一種,胎兒染色體變異包括胎 兒整條染色體非整倍性變異、胎兒染色體部分非整倍性變異,部分非整倍性變異包括 CNV、 片段的插入缺失等。
[0021]在本發(fā)明的一個(gè)【具體實(shí)施方式】中,所說的多態(tài)性位點(diǎn)為在群體中次等位基因頻率 不小于0· 4的SNP ;所說的群體,為包含不少于30個(gè)人樣本,可以利用已公開的千人基因組 數(shù)據(jù)獲得上述SNP,也可以對多個(gè)人樣本進(jìn)行測定識(shí)別出SNP,挑選出次等位基因頻率不小 于0. 4的SNP,這些高次等位基因頻率的SNP雜合率高,利于基于少量數(shù)據(jù)中挑出胎兒不同 于母體的基因型,利于胎兒的SNP檢測、確定混合核酸中的胎兒核酸含量和胎兒染色體非 整倍性檢測。
[0022]在本發(fā)明的一個(gè)【具體實(shí)施方式】中,(4)中篩選出的多態(tài)性位點(diǎn)的基因型組合為: (i)在第二DNA中只有純合基因型、而在第一 DNA中存在純合和雜合基因型,或者(?)在 第二DNA中只有雜合基因型、而在第一 DNA中存在純合和雜合基因型,當(dāng)(4)中的多態(tài)性位 點(diǎn)的基因型組合為(i)時(shí),(5)中胎兒核酸含量的確定公式為f = 2d/(c+d),當(dāng)(4)中的多 態(tài)性位點(diǎn)的基因型組合為(ii)時(shí),(5)中胎兒核酸含量的確定公式為f = (c-d)/(c+d),其 中,c為第一讀段中支持純合基因型的讀段的數(shù)目,d為第一讀段中支持雜合基因型的讀段 的數(shù)目。
[0023]在本發(fā)明的一個(gè)【具體實(shí)施方式】中,(5)中胎兒染色體變異信息的確定包括:依據(jù) (4)中的比對結(jié)果中的第一讀段中支持(4)中篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目,計(jì)算所述 多態(tài)性位點(diǎn)的測序深度;利用全部或部分(4)中篩選出的位于同一染色體的多態(tài)性位點(diǎn)的 測序深度,和/或所述多態(tài)性位點(diǎn)所在染色體的全部或部分區(qū)域的GC含量對所述多態(tài)性位 點(diǎn)的測序深度進(jìn)行校正,獲得所述多態(tài)性位點(diǎn)的相對測序深度;將所述相對測序深度與正 常對照樣本同樣位點(diǎn)的相對測序深度比較,二者具有顯著性差異則確定所述多態(tài)性位點(diǎn)區(qū) 域存在變異。
[0024]在本發(fā)明的一個(gè)【具體實(shí)施方式】中,(5)中胎兒染色體變異信息的確定,還包括:依 據(jù)(4)中ρ比對結(jié)果中的第一讀段中的有固定距離關(guān)系的成對讀段的兩個(gè)讀段在參考序 列士的距離,確定所述變異的類型,以L表示一對成對讀段中的兩個(gè)讀段的固定距離,以 L, 表示該對成對讀段中的兩個(gè)讀段在參考序列上的距離,當(dāng)L,> L,則判定所述變異是缺失 變異,當(dāng)L' < L,則判定所述變異為插入變異;其中,所述有固定距離關(guān)系的成對讀段來自 一個(gè)測序文庫的兩端,所述測序文庫的構(gòu)建包含于( 3)中的測序;在本發(fā)明的一個(gè)具體實(shí) 施方式中,因?qū)嶋H建庫時(shí),獲得的文庫的大小通常不是一個(gè)固定數(shù)值而是處于一數(shù)值范圍, 比如建庫時(shí)沒有精確切膠或以其它方式純化獲得一固定大小的文庫,這樣,比如預(yù)構(gòu)建的 文庫大小為500bp,最后獲得的文庫大小通常處于 300-900bp,所以,更佳地,當(dāng)L,彡2L,判 定所述變異是缺失變異,當(dāng)L' <〇· 2L,判定所述變異為插入變異,檢測更準(zhǔn)確。
[0025]在本發(fā)明的一個(gè)【具體實(shí)施方式】中,(5)中胎兒染色體變異信息的確定,還包括:依 據(jù)⑷中的比對結(jié)果中的第一讀段中的不完全比對到參考序列上的所述多態(tài)性位點(diǎn)區(qū)域 的讀段信息,確定所述變異的精確位置和大小。確定所述變異的精確位置和大小包括:截取 所述比對結(jié)果中的第一讀段中的不完全比對到參考序列上的所述多態(tài)性位點(diǎn)區(qū)域的讀段 的不能比對上的部分,將截取的部分定義為一個(gè)割裂片段;將割裂片段比對到參考序列,獲 得割裂片段在參考序列上的位置;基于割裂片段在參考序列上的位置和該割裂片段所屬讀 段在參考序列上的位置、以及所述兩個(gè)位置在參考序列上的距離,確定所述變異的精確位 置和大小。在本發(fā)明的一個(gè)【具體實(shí)施方式】中,覆蓋了變異發(fā)生邊界(斷點(diǎn))的包含割裂片 斷的割裂讀段(soft clip reads),在比對過程中,割裂reads中主要的一部分會(huì)被正確比 對上,另一部分同樣具有高測序質(zhì)量的序列,被標(biāo)記為割裂片段( soft clip),用于進(jìn)一步 的數(shù)據(jù)分析。在利用這些割裂reads進(jìn)行變異發(fā)生位置的精確檢測之前,對這些割裂讀段 進(jìn)行過濾,使得留下來的割裂讀段的平均質(zhì)量高于5、N的數(shù)目小于reads總長度的0. 05、 錯(cuò)配(mismatch)的個(gè)數(shù)不超過主要比對上的部分的0.〇5、并且 soft (^讓部分的長度大于 25bp。這樣過濾進(jìn)行割裂reads的質(zhì)量控制可以保證割裂reads的主要比對的位置的準(zhǔn)確 性,而設(shè)置soft clip序列的長度使其不會(huì)太短,能使得soft clip部分的二次比對位置更 加可信。
[0026]根據(jù)本發(fā)明的另一個(gè)^施方式,提供了一種檢測孕婦體液樣本中胎兒核酸變異的 方法,所述核酸變異包括SNP、剪切位點(diǎn)突變、CNV和染色體非整倍性的至少一種,所述方法 包括:利用本發(fā)明一方面的方法確定孕婦體液樣本中胎兒核酸含量;基于所述胎兒核酸含 量確定所述胎兒核酸變異檢測所需的最低數(shù)據(jù)量;對第一 DNA進(jìn)行測序,獲得不小于所述 最低數(shù)據(jù)量的測序數(shù)據(jù);基于所述測序數(shù)據(jù),檢測所述胎兒核酸變異。
[0027]在本發(fā)明的一個(gè)【具體實(shí)施方式】中,確定檢測所需的最低數(shù)據(jù)量,包括:當(dāng)胎兒核酸 含量大于等于4%,所述最低數(shù)據(jù)量為〇. 18Gbp ;當(dāng)胎兒核酸含量為3%?4%,所述最低數(shù) 據(jù)量為0. 54Gbp。利用本發(fā)明一方面得方法確定胎兒核酸含量,當(dāng)胎兒核酸含量低于3%, 建議仍舊使用高深度測序獲得大量數(shù)據(jù)并且開發(fā)其它數(shù)據(jù)處理方法以保證檢測高準(zhǔn)確率。 [0028]在本發(fā)明的一個(gè)【具體實(shí)施方式】中,所說的胎兒核酸變異檢測包括檢測以下基因的 外顯子區(qū)域的 SNP :HBA1、HBA2、HBB、GJB2、SLC26A4、SMN1、DMD、GALT、PAH、F8、F9、ATP7B、 GM和PKHD1。進(jìn)一步地,還包括檢測以下基因的外顯子的上下游各10bp區(qū)域中的剪切位點(diǎn) 突變:HBA1、HBA2、HBB、GJB2、SLC26A4、SMN1、DMD、GALT、PAH、F8、F9、ATP7B、GAA 和 PKHD1。 這些基因區(qū)域?yàn)榈湫瓦z傳病發(fā)生相關(guān)區(qū)域。
[0029]根據(jù)本發(fā)明的再一個(gè)實(shí)施方式,提供了一種確定孕婦體液樣本中胎兒核酸含量的 裝置,如圖2所不,該裝置包括:Α1·樣本獲取單元,用以獲取孕婦體液樣本;B1.核酸提取 單元,與Α1單元連接,用于提取樣本中的第一 DNA和第二DNA,第一 DNA為母體和胎兒DNA 混合物,第二DNA為母體基因組DNA ;C1.測序單元,與B1單元連接,用于對至少一部分的第 一 DNA測序以獲得第一讀段,對至少一部分的第二DNA進(jìn)行測序以獲得第二讀段,所述第一 讀段和所述第二讀段中包含多個(gè)多態(tài)性位點(diǎn);D1.比對篩選單元,與C1單元連接,接收B1 單兀的數(shù)據(jù),用于實(shí)現(xiàn)將第一讀段和第二讀段分別與參考序列比對,基于獲得的比對結(jié)果, 篩選出C1中的多態(tài)性位點(diǎn)中在第二DNA只有一種基因型并且在第一 DNA有兩種基因型的 多態(tài)性位點(diǎn);E1.核酸含量確定單元,與D1單元連接,接收D1單元的數(shù)據(jù),用于依據(jù)獲自D1 的比對結(jié)果中的第一讀段中支持D1中篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目,確定所述孕婦體 液樣本中胎兒核酸含量。該裝置能夠用于執(zhí)行本發(fā)明一個(gè)實(shí)施方式中提供的確定孕婦體液 樣本中胎兒核酸含量的方法的部分或所有步驟,關(guān)于本發(fā)明一個(gè)實(shí)施方式中的確定孕婦體 液樣本中胎兒核酸含量的方法的優(yōu)點(diǎn)及特征的描述,仍舊適用于該裝置,在此不再贅述。 [00 30] 根據(jù)本發(fā)明的再一個(gè)實(shí)施方式,提供了一種同時(shí)確定孕婦體液樣本中胎兒核酸 含量和胎兒染色體變異信息的裝置,該裝置包括:A2.樣本獲取單元,用以獲取孕婦體液樣 本;B2.核酸提取單元,與A2單元連接,用于提取樣本中的第一 DNA和第二DNA,第一 DNA為 母體和胎兒DNA混合物,第二DNA為母體基因組DNA ;C2.測序單元,與B2單元連接,用于對 至少一部分的第一 DNA測序以獲得第一讀段,對至少一部分的第二DNA進(jìn)行測序以獲得第 二讀段,所述第一讀段和所述第二讀段中包含多個(gè)多態(tài)性位點(diǎn);D2.比對篩選單元,與C2單 元連接,接收B2單元的數(shù)據(jù),用于實(shí)現(xiàn)將第一讀段和第二讀段分別與參考序列比對,基于 獲得的比對結(jié)果,篩選出C2中的多態(tài)性位點(diǎn)中在第二DNA只有一種基因型并且在第一 DNA 有兩種基因型的多態(tài)性位點(diǎn);E2.核酸含量和變異確定單元,與D2單元連接,接收D2單元 的數(shù)據(jù),用于依據(jù)獲自D2的比對結(jié)果中的第一讀段中支持D2中篩選出的多態(tài)性位點(diǎn)的讀 段數(shù)目,同時(shí)確定所述孕婦體液樣本中胎兒核酸含量和胎兒染色體變異信息。該裝置能夠 用于執(zhí)行本發(fā)明一個(gè)實(shí)施方式中提供的同時(shí)確定孕婦體液樣本中胎兒核酸含量和染色變 異信息的方法的部分或所有步驟,關(guān)于本發(fā)明一個(gè)實(shí)施方式中的同時(shí)確定孕婦體液樣本中 胎兒核酸含量和染色體變異的方法的優(yōu)點(diǎn)及特征的描述,仍舊適用于該裝置,在此不再贅 述。
[0031] 根據(jù)本發(fā)明的再一個(gè)實(shí)施方式,提供了一種檢測孕婦體液樣本中胎兒核酸變異的 裝置,該裝置包括:胎兒核酸含量確定單元,所述胎兒核酸含量的確定是通過本發(fā)明一方面 提供的確定孕婦體液樣本中胎兒核酸含量的方法進(jìn)行的,獲得胎兒核酸含量;最低數(shù)據(jù)量 確定單元,與所述胎兒核酸含量確定單元連接,用于基于所述胎兒核酸含量確定所述胎兒 核酸變異檢測所需的最低數(shù)據(jù)量;測序單元,與所述最低數(shù)據(jù)量確定單元連接,用于對第一 DNA進(jìn)行測序,獲得不小于所述最低數(shù)據(jù)量的測序數(shù)據(jù),所述第一 DNA獲自所述孕婦體液樣 本,所述第一 DNA為母體和胎兒DNA混合物;變異檢測單元,與所述測序單元連接,接收來自 所述測序單元的測序數(shù)據(jù),基于所述測序數(shù)據(jù),檢測所述胎兒核酸變異。該裝置能夠用于執(zhí) 行本發(fā)明一個(gè)實(shí)施方式中提供的檢測孕婦體液樣本中胎兒核酸變異的方法的部分或所有 步驟,關(guān)于本發(fā)明一個(gè)實(shí)施方式中的檢測孕婦體液樣本中胎兒核酸變異的方法的優(yōu)點(diǎn)及特 征的描述,仍舊適用于該裝置,在此不再贅述。
[0032] 本發(fā)明的實(shí)施方式中的方法和/或裝置將胎兒DNA含量測定方法引入到變異檢測 中,使得可以在懷孕早期同步篩查孕婦單基因攜帶情況、胎兒SNP變異情況以及胎兒染色 體非整倍性檢測提供了可能。本發(fā)明提供了一種高效的、適于人群大規(guī)模使用的SNP或單 基因病攜帶篩查的方法/裝置。利用本發(fā)明的方法或裝置,可以通過目標(biāo)區(qū)域捕獲同時(shí)實(shí) 現(xiàn)點(diǎn)突變及拷貝數(shù)變異的檢測,增加了目標(biāo)區(qū)域捕獲所能檢出的致病突變類型,覆蓋突變 范圍更廣,減少了所需補(bǔ)充的實(shí)驗(yàn)種類。更適合于人群大規(guī)模檢測使用,更適應(yīng)于產(chǎn)前檢測 或者輔助產(chǎn)前檢測??梢岳帽景l(fā)明的方法或裝置,將單基因病檢測引入到產(chǎn)前階段,進(jìn)一 步豐富了可在產(chǎn)前進(jìn)行檢測的出生缺陷的種類,為早期預(yù)防出生缺陷提供了更多的可能。 [0033] 在本發(fā)明中的"變異"、"核酸變異"、"基因變異"、"染色體變異"可通用,本發(fā)明中的 "SNP"、"CNV"、"插入缺失"(indel)、"染色體非整倍性"、"剪切位點(diǎn)突變"同通常定義,但本 發(fā)明中對各種變異的大小不作特別限定,這樣這幾種變異之間有的有交叉,比如SNP為單 核酸突變,包括單核苷酸的插入和/或缺失,這樣與插入缺失變異概念有交叉;又比如,CNV 為拷貝數(shù)變異,當(dāng)重復(fù)/缺失的為整條染色體時(shí),即屬于染色體異倍體。這些類型變異的大 小交叉并不妨礙本領(lǐng)域人員通過上述描述執(zhí)行實(shí)現(xiàn)本發(fā)明的方法和/或裝置并且達(dá)到所 描述的結(jié)果。
[0034] 下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。需要說明 的是在本文中所使用的術(shù)語"第一"、"第二"等僅用于方便描述目的,而不能理解為指示或 暗示相對重要性,也不能理解為之間有先后順序關(guān)系。在本發(fā)明的描述中,除非另有說明, "多個(gè)"的含義是兩個(gè)或兩個(gè)以上。
[0035] 除另有交待,以下實(shí)施例中涉及的試劑及儀器,都是常規(guī)市售產(chǎn)品,比如購自 Illumina 公司。
[0036] 實(shí)施例一:胎兒核酸含量確定
[0037] 圖1是基于一孕婦外周血樣本檢測胎兒非整倍體及孕婦SNP基因型、判斷孕婦單 基因病相關(guān)突變攜帶情況的流程圖。圖1流程可用于在早孕期進(jìn)行胎兒非整倍體性及單基 因病致病基因風(fēng)險(xiǎn)預(yù)測。該流程方法通過在早孕期(孕8-12周)采集孕婦外周血,通過兩 步離心法實(shí)現(xiàn)血漿與血細(xì)胞的分離。通過微量DNA提取技術(shù)實(shí)現(xiàn)血漿游離DNA的提取。使 用血漿分離后剩余的血細(xì)胞直接提取孕婦DNA,或通過富集白細(xì)胞提取孕婦白細(xì)胞DNA。通 過對血漿游離DNA進(jìn)行高通量測序文庫的構(gòu)建,取部分文庫DNA進(jìn)行目標(biāo)區(qū)域捕獲檢測,以 確定相應(yīng)樣品血漿DNA中胎兒DNA的含量。根據(jù)胎兒DNA含量檢測結(jié)果,確定血漿DNA測 序文庫所需的測序深度。通過對血漿DNA目標(biāo)區(qū)域捕獲測序或者全基因組低覆蓋度測序數(shù) 據(jù)的分析,得到胎兒染色體非整倍性的信息。同時(shí),通過對孕婦白細(xì)胞DNA進(jìn)行常見隱性遺 傳病待檢區(qū)域的目標(biāo)區(qū)域捕獲測序,實(shí)現(xiàn)對孕婦單基因病攜帶情況的檢測。根據(jù)孕婦血細(xì) 胞DNA或白細(xì)胞DNA的檢測結(jié)果,確定胎兒是否有攜帶某種致病突變的風(fēng)險(xiǎn)。若孕婦不攜 帶相應(yīng)致病突變,則表明胎兒患病風(fēng)險(xiǎn)較低。若孕婦攜帶了相應(yīng)的隱性遺傳病的致病突變, 則需對孕婦的丈夫進(jìn)行相同基因的隱性遺傳病致病突變的檢測,若其丈夫相同基因不攜帶 致病突變,則胎兒患病風(fēng)險(xiǎn)低。若其丈夫相同基因攜帶致病突變,則胎兒患病風(fēng)險(xiǎn)較高。
[0038] 胎兒非整倍體的檢測流程是血漿及孕婦血細(xì)胞提取DNA后,分別將DNA進(jìn)行加上 帶有樣品識(shí)別標(biāo)簽的測序接頭。對加接頭后的DNA進(jìn)行PCR擴(kuò)增。取部分DNA進(jìn)行目標(biāo)區(qū) 域捕獲測序,所用捕獲方法可以為液相捕獲也可以使用固相捕獲的方式。捕獲區(qū)域?yàn)槿巳?中雜合率尚的SNP位點(diǎn)(minor allele frequency, MAF在0.4?0.5之間),平均每條染 色體分布至少1〇〇個(gè)需捕獲的SNP位點(diǎn)。通過對血漿游離DNA目標(biāo)區(qū)域捕獲文庫及孕婦血 細(xì)胞DNA目標(biāo)區(qū)域捕獲文庫的的高通量測序,利用獲得的數(shù)據(jù)對血漿DNA中胎兒DNA含量 進(jìn)行估計(jì)。根據(jù)胎兒DNA含量,確定使用孕婦血漿DNA進(jìn)行胎兒染色體非整倍體性檢測時(shí), 所要達(dá)到的整體的測序深度。測序按照常規(guī)測序方法進(jìn)行,測序平臺(tái)可選擇如Hi Seq2000、 HiSeq25〇0、MiSeq和單分子測序平臺(tái)等等,根據(jù)測序量的不同和樣本數(shù),可以靈活選擇合適 的測序平臺(tái),依據(jù)所選測序平臺(tái)構(gòu)建適合該平臺(tái)的測序文庫。
[0039] 具體的檢測流程如下:
[0040] 采集孕婦5ml外周血(樣本來自天津市婦幼保健院),將采血管(內(nèi)裝有全血)置 于離心機(jī)內(nèi),在4°C條件下以1600g離心lOmin,離心結(jié)束后將上清(血漿)平均分裝到多 個(gè)置于冰盒上且已編號(hào)的2. OmL的EP管中。將8. 1分離好的血漿置于離心機(jī)內(nèi),在4°C條 件下以16000g離心lOmin,以去除殘余細(xì)胞,離心結(jié)束后在冰盒上將上清轉(zhuǎn)入新的已編號(hào) 2.0mL EP管中,得到孕婦血漿。
[0041] 通過微量DNA提取技術(shù)提取血漿游離DNA,使用TIANamp Micro DNA Kit(DP316) 基因組DNA提取試劑盒,具體操作見操作手冊(www. tiangen. com)。
[0042] 在血漿游離DNA模板兩端加上接頭,并通過PCR對所得DNA片段進(jìn)行擴(kuò)增,并同時(shí) 給各樣品加上唯一識(shí)別序列用于區(qū)分不同的樣品。最終獲得高通量測序文庫。
[0043] 通過目標(biāo)區(qū)域特異探針對血漿游離DNA文庫中特定的SNP位點(diǎn)進(jìn)行捕獲富集。所 選用的SNP位點(diǎn)為可用于胎兒DNA含量測定的SNP位點(diǎn)。該SNP類位點(diǎn)人群中雜合率高的 SNP位點(diǎn)(minor allele frequency, MAF在0.4?0.5之間),平均每條染色體可以分布 1〇〇個(gè)需捕獲的SNP位點(diǎn)。后續(xù)可以依據(jù)這些SNP檢測染色體非整倍性。
[0044]同時(shí)對孕婦外周血細(xì)胞所提取DNA構(gòu)建文庫進(jìn)行相同的SNP位點(diǎn)的目標(biāo)區(qū)域捕獲 富集。
[0045] 對血漿游離DNA及孕婦外周血細(xì)胞DNA目標(biāo)區(qū)域捕獲測序文庫進(jìn)行高通量測序。 測序平臺(tái)可選擇如Hiseq2000,或者HiSeq2500,MiSeq或單分子測序平臺(tái)等等,根據(jù)測序量 的不同和樣本數(shù),可以靈活選擇合適的測序平臺(tái)。
[0046] 選擇孕婦外周血細(xì)胞DNA測序?yàn)榧兒希谘獫{中出現(xiàn)與孕婦外周血細(xì)胞DNA不 同的基因型的SNP位點(diǎn)進(jìn)行血漿中胎兒DNA含量的估計(jì)。假設(shè)某一 SNP位點(diǎn)孕婦外周血DNA 測序數(shù)據(jù)為AA,而血漿游離DNA測序結(jié)果顯示該位點(diǎn)存在a基因型,若支持A的測序reads 數(shù)為c,支持a的測序reads數(shù)為d,則血漿游離DNA中胎兒DNA含量為f = 2cV(c+d)。
[0047] 實(shí)施例二:胎兒SNP基因型及單基因病風(fēng)險(xiǎn)判斷、胎兒染色體變異檢測
[0048] 根據(jù)上述胎兒DNA含量,選定相應(yīng)的低覆蓋度測序乘數(shù)及相應(yīng)的生物信息分析方 法。對未經(jīng)目標(biāo)區(qū)域捕獲的血漿DNA來源的測序文庫文庫進(jìn)行全基因組低覆蓋的測序,并 進(jìn)行胎兒非整倍性判斷。對于胎兒DNA含量在4%以上的血漿樣品,測序數(shù)據(jù)量需0. 18Gbp, 對于胎兒DNA含量在3-4 %的樣品,測序數(shù)據(jù)量需達(dá)〇. 54Gbp,對胎兒DNA含量不足3 %的不 進(jìn)行分析。
[0049] 根據(jù)所選的測序平臺(tái),在這邊使用的Illumina Hiseq2000,通過孕婦白細(xì)胞提取 DNA,打斷成小片段DNA后,將DNA進(jìn)行加上帶有樣品識(shí)別標(biāo)簽的測序接頭。通過PCR進(jìn)行 DNA擴(kuò)增。將DNA進(jìn)行芯片捕獲,該芯片上覆蓋有相應(yīng)的單基因病相關(guān)基因的目標(biāo)區(qū)域捕獲 探針,可以和DNA進(jìn)行目標(biāo)區(qū)域捕獲,探針芯片可以定制,比如向Agilent公司或NimbleGen 公司定制,也可自己設(shè)計(jì)合成。捕獲到的目的DNA進(jìn)行PCR富集后,按照常規(guī)測序方法進(jìn)行 測序。具體的檢測流程如下:
[0050] a)采集孕婦5ml外周血,通過兩步離心法,分離血漿與血細(xì)胞
[0051] b)通過孕婦白細(xì)胞提取孕婦DNA
[0052] c)將樣本DNA超聲打斷成100-200bp小片段
[0053] d)文庫構(gòu)建:在小片段DNA模板兩端加接頭,并通過PCR進(jìn)行擴(kuò)增,并同時(shí)給樣品 加上唯一識(shí)別序列,同時(shí)實(shí)現(xiàn)測序所需序列的添加
[0054] e)目標(biāo)區(qū)域文庫:通過目標(biāo)區(qū)域特異探針捕獲富集待測單基因病的關(guān)鍵基因區(qū) 域。該實(shí)施例種芯片設(shè)計(jì)的基因涵蓋了常見高發(fā)的幾種單基因病關(guān)鍵區(qū)域,如表1所示, 探針覆蓋范圍為各基因的外顯子區(qū)以及外顯子向內(nèi)含子區(qū)域延伸30bp的區(qū)域,這邊,延伸 30bp是為了捕獲相應(yīng)區(qū)域使得可以獲得相應(yīng)區(qū)域的數(shù)據(jù)以及檢測到外顯子正負(fù)10bp內(nèi) 發(fā)生的剪切突變,其中,對于地中海貧血基因,還在常見的alpha地中海貧血缺失型所涉及 的斷裂點(diǎn),以及beta地中海貧血缺失型所涉及的斷裂點(diǎn)附近設(shè)計(jì)捕獲探針,如表2。針對 CYP21A2基因,除去捕獲外顯子區(qū)域外,還在已報(bào)道的重組位點(diǎn)處設(shè)計(jì)捕獲探針,位置如表 3所示。
[0055] f)目標(biāo)區(qū)域捕獲文庫上機(jī)測序,各樣品總體測序深度300-500X。本實(shí)驗(yàn)采用 hiseq2000PE101+8+101 (雙末端測序,reads長度lOlbp,標(biāo)簽長度8bp)程序進(jìn)行上機(jī)測序。
[0056] 表1疾病名稱及基因
[0057]
【權(quán)利要求】
1. 確定孕婦體液樣本中胎兒核酸含量的方法,包括: (1) 獲得孕婦體液樣本; (2) 從(1)中的樣本提取第一 DNA和第二DNA,第一 DNA為母體和胎兒DNA混合物,第 二DNA為母體基因組DNA ; (3) 對(2)中至少一部分的第一DNA測序以獲得第一讀段,對(2)中至少一部分的第二 DNA進(jìn)行測序以獲得第二讀段,所述第一讀段和所述第二讀段中包含多個(gè)多態(tài)性位點(diǎn); (4) 將(3)的第一讀段和第二讀段分別與參考序列比對,基于獲得的比對結(jié)果,篩選出 (3)中的多態(tài)性位點(diǎn)中在第二DNA只有一種基因型并且在第一 DNA有兩種基因型的多態(tài)性 位點(diǎn); (5) 依據(jù)⑷中的比對結(jié)果中的第一讀段中支持⑷中篩選出的多態(tài)性位點(diǎn)的讀段數(shù) 目,確定所述孕婦體液樣本中胎兒核酸含量。
2. 權(quán)利要求1的方法,其特征在于,所述孕婦體液樣本來源于孕婦外周血和孕婦尿液 的至少一種。
3. 權(quán)利要求1的方法,其特征在于,所述多態(tài)性位點(diǎn)為在群體中次等位基因頻率不小 于 0. 4 的 SNP。
4. 權(quán)利要求1的方法,其特征在于,(4)中篩選出的多態(tài)性位點(diǎn)的基因型組合為:(i) 在第二DNA中只有純合基因型、而在第一 DNA中存在純合和雜合基因型,或者(ii)在第二 DNA中只有雜合基因型、而在第一 DNA中存在純合和雜合基因型。
5. 權(quán)利要求4的方法,其特征在于,當(dāng)(4)中的多態(tài)性位點(diǎn)的基因型組合為(i)時(shí),(5) 中胎兒核酸含量的確定公式為f = 2cV(C+d),當(dāng)(4)中的多態(tài)性位點(diǎn)的基因型組合為(ii) 時(shí),(5)中胎兒核酸含量的確定公式為f = (c-dV(c+d),其中,c為第一讀段中支持純合基 因型的讀段的數(shù)目,d為第一讀段中支持雜合基因型的讀段的數(shù)目。
6. 同時(shí)確定孕婦體液樣本中胎兒核酸含量和胎兒染色體變異信息的方法,包括: (1) 獲得孕婦體液樣本; (2) 從(1)中的樣本提取第一 DNA和第二DNA,第一 DNA為母體和胎兒DNA混合物,第 二DNA為母體基因組DNA ; (3) 對(2)中至少一部分的第一DNA測序以獲得第一讀段,對(2)中至少一部分的第二 DNA進(jìn)行測序以獲得第二讀段,所述第一讀段和所述第二讀段中包含多個(gè)多態(tài)性位點(diǎn); (4) 將(3)的第一讀段和第二讀段分別與參考序列比對,基于獲得的比對結(jié)果,篩選出 (3)中的多態(tài)性位點(diǎn)中在第二DNA只有一種基因型并且在第一 DNA有兩種基因型的多態(tài)性 位點(diǎn); (5) 依據(jù)⑷中的比對結(jié)果中的第一讀段中支持⑷中篩選出的多態(tài)性位點(diǎn)的讀段數(shù) 目,同時(shí)確定所述孕婦體液樣本中胎兒核酸含量和胎兒染色體變異信息; 任選的,所述孕婦體液樣本來源于孕婦外周血和孕婦尿液的至少一種; 任選的,所述胎兒染色體變異包括胎兒整條染色體非整倍性變異、胎兒染色體部分非 整倍性變異; 任選的,所述多態(tài)性位點(diǎn)為在群體中次等位基因頻率不小于〇. 4的SNP ; 任選的,(4)中篩選出的多態(tài)性位點(diǎn)的基因型組合為:(i)在第二DNA中只有純合基因 型、而在第一 DNA中存在純合和雜合基因型,或者(ii)在第二DNA中只有雜合基因型、而在 第一 DNA中存在純合和雜合基因型; 任選的,當(dāng)(4)中的多態(tài)性位點(diǎn)的基因型組合為(i)時(shí),(5)中胎兒核酸含量的確定公 式為f = 2cV(C+d),當(dāng)(4)中的多態(tài)性位點(diǎn)的基因型組合為(ii)時(shí),(5)中胎兒核酸含量 的確定公式為f = (c-d) Ac+d),其中,c為第一讀段中支持純合基因型的讀段的數(shù)目,d為 第一讀段中支持雜合基因型的讀段的數(shù)目。
7. 權(quán)利要求6的方法,其特征在于,(5)中胎兒染色體變異信息的確定,包括: 依據(jù)⑷中的比對結(jié)果中的第一讀段中支持⑷中篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目, 計(jì)算所述多態(tài)性位點(diǎn)的測序深度; 利用全部或部分(4)中篩選出的位于同一染色體的多態(tài)性位點(diǎn)的測序深度,和/或所 述多態(tài)性位點(diǎn)所在染色體的全部或部分區(qū)域的GC含量對所述多態(tài)性位點(diǎn)的測序深度進(jìn)行 校正,獲得所述多態(tài)性位點(diǎn)的相對測序深度; 將所述相對測序深度與正常對照樣本同樣位點(diǎn)的相對測序深度比較,二者具有顯著性 差異則確定所述多態(tài)性位點(diǎn)區(qū)域存在變異。
8. 權(quán)利要求7的方法,其特征在于,(5)中胎兒染色體變異信息的確定,還包括: 依據(jù)(4)中的比對結(jié)果中的第一讀段中的有固定距離關(guān)系的成對讀段的兩個(gè)讀段在 參考序列上的距離,確定所述變異的類型,以L表示一對成對讀段中的兩個(gè)讀段的固定距 離,以L'表示該對成對讀段中的兩個(gè)讀段在參考序列上的距離, 當(dāng)L' > L,則判定所述變異是缺失變異, 當(dāng)L' < L,則判定所述變異為插入變異;其中, 所述有固定距離關(guān)系的成對讀段來自一個(gè)測序文庫的兩端,所述測序文庫的構(gòu)建包含 于⑶中的測序; 任選地,當(dāng)L' > 2L,則判定所述變異是缺失變異, 當(dāng)L' < 0. 2L,則判定所述變異為插入變異。
9. 權(quán)利要求8的方法,其特征在于,(5)中胎兒染色體變異信息的確定,還包括: 依據(jù)(4)中的比對結(jié)果中的第一讀段中的不完全比對到參考序列上的所述多態(tài)性位 點(diǎn)區(qū)域的讀段信息,確定所述變異的精確位置和大小。
10. 權(quán)利要求9的方法,其特征在于,確定所述變異的精確位置和大小包括: 截取所述比對結(jié)果中的第一讀段中的不完全比對到參考序列上的所述多態(tài)性位點(diǎn)區(qū) 域的讀段的不能比對上的部分,將截取的部分定義為一個(gè)割裂片段; 將割裂片段比對到參考序列,獲得割裂片段在參考序列上的位置; 基于割裂片段在參考序列上的位置和該割裂片段所屬讀段在參考序列上的位置、以及 所述兩個(gè)位置在參考序列上的距離,確定所述變異的精確位置和大小。
11. 檢測孕婦體液樣本中胎兒核酸變異的非診斷方法,所述核酸變異包括SNP、剪切位 點(diǎn)突變、CNV和染色體非整倍性的至少一種,所述方法包括: 利用權(quán)利要求1-5任一方法確定孕婦體液樣本中胎兒核酸含量; 基于所述胎兒核酸含量確定所述胎兒核酸變異檢測所需的最低數(shù)據(jù)量; 對第一 DNA進(jìn)行測序,獲得不小于所述最低數(shù)據(jù)量的測序數(shù)據(jù); 基于所述測序數(shù)據(jù),檢測所述胎兒核酸變異。
12. 權(quán)利要求8的方法,其特征在于,所述基于胎兒核酸含量確定檢測所需的最低數(shù)據(jù) 量,包括: 當(dāng)胎兒核酸含量大于等于4%,所述最低數(shù)據(jù)量為0. 18Gbp ; 當(dāng)胎兒核酸含量為3%?4%,所述最低數(shù)據(jù)量為0. 54Gbp。
13. 權(quán)利要求8的方法,其特征在于,所述胎兒核酸變異檢測包括檢測以下基因的外顯 子區(qū)域的 SNP :HBA1、HBA2、HBB、GJB2、SLC26A4、SMN1、DMD、GALT、PAH、F8、F9、ATP7B、GAA 和 PKHD1。
14. 權(quán)利要求11的方法,其特征在于,所述胎兒核酸變異檢測還包括檢測以下基因的 外顯子的上下游各l〇bp區(qū)域中的剪切位點(diǎn)突變:HBA1、HBA2、HBB、GJB2、SLC26A4、SMN1、 DMD、GALT、PAH、F8、F9、ATP7B、GAA 和 PKHD1。
15. 確定孕婦體液樣本中胎兒核酸含量的裝置,包括: A1.樣本獲取單元,用以獲取孕婦體液樣本; B1.核酸提取單元,與A1單元連接,用于提取樣本中的第一 DNA和第二DNA,第一 DNA 為母體和胎兒DNA混合物,第二DNA為母體基因組DNA ; C1.測序單元,與B1單元連接,用于對至少一部分的第一 DNA測序以獲得第一讀段,對 至少一部分的第二DNA進(jìn)行測序以獲得第二讀段,所述第一讀段和所述第二讀段中包含多 個(gè)多態(tài)性位點(diǎn); D1.比對篩選單元,與C1單元連接,接收B1單元的數(shù)據(jù),用于實(shí)現(xiàn)將第一讀段和第二讀 段分別與參考序列比對,基于獲得的比對結(jié)果,篩選出C1中的多態(tài)性位點(diǎn)中在第二DNA只 有一種基因型并且在第一 DNA有兩種基因型的多態(tài)性位點(diǎn); E1.核酸含量確定單元,與D1單元連接,接收D1單元的數(shù)據(jù),用于依據(jù)獲自D1的比對 結(jié)果中的第一讀段中支持D1中篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目,確定所述孕婦體液樣本 中胎兒核酸含量。
16. 同時(shí)確定孕婦體液樣本中胎兒核酸含量和胎兒染色體變異信息的裝置,包括: A2.樣本獲取單元,用以獲取孕婦體液樣本; B2.核酸提取單元,與A2單元連接,用于提取樣本中的第一 DNA和第二DNA,第一 DNA 為母體和胎兒DNA混合物,第二DNA為母體基因組DNA ; C2.測序單元,與B2單元連接,用于對至少一部分的第一 DNA測序以獲得第一讀段,對 至少一部分的第二DNA進(jìn)行測序以獲得第二讀段,所述第一讀段和所述第二讀段中包含多 個(gè)多態(tài)性位點(diǎn); D2.比對篩選單元,與C2單元連接,接收B2單元的數(shù)據(jù),用于實(shí)現(xiàn)將第一讀段和第二讀 段分別與參考序列比對,基于獲得的比對結(jié)果,篩選出C2中的多態(tài)性位點(diǎn)中在第二DNA只 有一種基因型并且在第一 DNA有兩種基因型的多態(tài)性位點(diǎn); E2.核酸含量和變異確定單元,與D2單元連接,接收D2單元的數(shù)據(jù),用于依據(jù)獲自D2 的比對結(jié)果中的第一讀段中支持D2中篩選出的多態(tài)性位點(diǎn)的讀段數(shù)目,同時(shí)確定所述孕 婦體液樣本中胎兒核酸含量和胎兒染色體變異信息。
17. 檢測孕婦體液樣本中胎兒核酸變異的裝置,包括: 胎兒核酸含量確定單元,所述胎兒核酸含量的確定是通過權(quán)利要求1-5任一方法進(jìn)行 的,獲得胎兒核酸含量; 最低數(shù)據(jù)量確定單元,與所述胎兒核酸含量確定單元連接,用于基于所述胎兒核酸含 量確定所述胎兒核酸變異檢測所需的最低數(shù)據(jù)量; 測序單元,與所述最低數(shù)據(jù)量確定單元連接,用于對第一 DNA進(jìn)行測序,獲得不小于所 述最低數(shù)據(jù)量的測序數(shù)據(jù),所述第一 DNA獲自所述孕婦體液樣本,所述第一 DNA為母體和胎 兒DNA混合物; 變異檢測單元,與所述測序單元連接,接收來自所述測序單元的測序數(shù)據(jù),基于所述測 序數(shù)據(jù),檢測所述胎兒核酸變異。
【文檔編號(hào)】C12M1/00GK104232777SQ201410484128
【公開日】2014年12月24日 申請日期:2014年9月19日 優(yōu)先權(quán)日:2014年9月19日
【發(fā)明者】袁媛, 劉濤, 曹飛, 郭俊甫, 王垚燊, 吳仁花, 阿叁, 楊玲, 易鑫 申請人:天津華大基因科技有限公司, 深圳華大基因醫(yī)學(xué)有限公司