的核酸總數(shù)的比例; 其中相對(duì)于正常懷孕中的比例,所測(cè)比例中的統(tǒng)計(jì)顯著差異,表明靶染色體中的胎兒 異常。
[0018] 依照本發(fā)明的第二方面,提供在懷孕的女性受試者中預(yù)測(cè)胎兒性別的方法,所述 方法包括以下步驟: (a) 自所述懷孕的女性受試者中獲得生物樣品; (b) 獲得在所述生物樣品內(nèi)的核酸分子的序列數(shù)據(jù); (c) 在所述序列數(shù)據(jù)內(nèi)的每個(gè)核酸序列和對(duì)應(yīng)于參考基因組的獨(dú)特部分的序列之間 進(jìn)行匹配分析,使得每個(gè)匹配的核酸被指定到所述參考基因組內(nèi)的特定染色體或所述染色 體的一部分,其中所述匹配分析對(duì)于對(duì)應(yīng)于所述參考基因組中的堿基的每個(gè)核酸內(nèi)的每個(gè) 堿基產(chǎn)生準(zhǔn)確率分值并對(duì)于任何插入、缺失、模糊和/或取代產(chǎn)生罰分,使得如果每個(gè)核酸 的總分值達(dá)到預(yù)定分值閾值,匹配被指定;和 (d) 測(cè)定指定到Y(jié)染色體的匹配的核酸總數(shù)相對(duì)于指定到一個(gè)或多個(gè)參考染色體的 每個(gè)的匹配的核酸總數(shù)的比例; 其中高于預(yù)定比例的匹配的Y染色體序列的存在表明存在男性胎兒,而低于預(yù)定比例 的匹配的Y染色體序列的存在表明存在女性胎兒。
[0019]附圖簡(jiǎn)述 圖1:Prinseq序列重復(fù)概括統(tǒng)計(jì)學(xué)。
[0020] 在產(chǎn)生簡(jiǎn)明概括統(tǒng)計(jì)學(xué)和重要地是還在產(chǎn)生在樣品中普遍的重復(fù)序列數(shù)量中使 用Prinseq的范例,其原始數(shù)據(jù)顯示在下表中:
圖2:依照本發(fā)明的方法分析27個(gè)血漿樣品。圖2顯示來自正常懷孕的血漿樣品(樣 品1-15)和來自三體性21懷孕的血漿樣品(樣品16-27)的Z分值。
[0021] 發(fā)明詳述 依照本發(fā)明的第一方面,提供在得自女性受試者的生物樣品中檢測(cè)胎兒染色體異常的 方法,所述方法包括以下步驟: (a) 獲得在所述生物樣品內(nèi)的核酸分子的序列數(shù)據(jù); (b) 在所述序列數(shù)據(jù)內(nèi)的每個(gè)核酸序列和對(duì)應(yīng)于參考基因組的獨(dú)特部分的序列之間 進(jìn)行匹配分析,使得每個(gè)匹配的核酸被指定到所述參考基因組內(nèi)的特定染色體或所述染色 體的一部分,其中所述匹配分析對(duì)于對(duì)應(yīng)于所述參考基因組中的堿基的每個(gè)核酸內(nèi)的每個(gè) 堿基產(chǎn)生準(zhǔn)確率分值并對(duì)于任何插入、缺失、模糊和/或取代產(chǎn)生罰分,使得如果每個(gè)核酸 的總分值達(dá)到預(yù)定分值閾值,匹配被指定;和 (c) 測(cè)定指定到靶染色體的匹配的核酸總數(shù)相對(duì)于指定到一個(gè)或多個(gè)參考染色體的 每個(gè)的匹配的核酸總數(shù)的比例; 其中相對(duì)于正常懷孕中的比例,所測(cè)比例中的統(tǒng)計(jì)顯著差異表明靶染色體中的胎兒異 常。
[0022] 本發(fā)明指定合適的生物信息學(xué)處理,其尤其容忍非常頻繁的取代和indel誤差和 誤操作的短均聚物運(yùn)行。該生物信息學(xué)處理允許以合適有效方式將序列可靠地指定到染色 體,即結(jié)合可靠性而不拋棄實(shí)際上不可行的、大的、序列數(shù)據(jù)部分作為不可匹配到任何染色 體,或?qū)⑵溴e(cuò)誤指定到不準(zhǔn)確的染色體位置。
[0023] 染色體異常 本發(fā)明用于檢測(cè)的合適的染色體異常的實(shí)例包括:唐氏綜合征(三體性21)、Edward's綜合征(三體性18)、Patau綜合征(三體性13)、三體性9、Warkany綜合征(三體性8)、 CatEye綜合征(4拷貝的染色體22)、三體性22和三體性16。
[0024]另外,或或者,在基因、染色體或染色體部分、拷貝數(shù)的異常性檢測(cè)可包括選自以 下病況的檢測(cè)和/或診斷:Wolf_Hirschhorn綜合征(4p_)、Criduchat綜合征(5p_)、 Wi11iams-Beuren綜合征(7_)、Jacobsen綜合征(11-)、Miller-Dieker綜合征(17_)、 Smith-Magenis綜合征(17_)、22ql1.2 缺失綜合征(也稱為Velocardiofacial綜合征、 DiGeorge綜合征、椎體畸形臉(conotruncalanomalyface)綜合征、先天性胸腺發(fā)育不全 和Strong綜合征)、Angelman綜合征(15-)和Prader-Willi綜合征(15-)。
[0025]另外,或或者,染色體拷貝數(shù)的異常性檢測(cè)可包括選自以下的病況的檢測(cè)和/或 診斷:Turner綜合征(Ullrich-Turner綜合征或單體性X)、Klinefelter's綜合征、47,XXY或XXY綜合征、48,XXYY綜合征、49,XXXXY綜合征、三聯(lián)體X綜合征、XXXX綜合征(也稱為四 體性X、四倍X、或48,XXXX)、XXXXX綜合征(也稱為五體性X或49,XXXXX)和XYY綜合征。
[0026] 在一個(gè)實(shí)施方案中,所述靶染色體是染色體13、染色體18、染色體21、X染色體或 Y染色體。
[0027] 在一個(gè)實(shí)施方案中,所述胎兒染色體異常是胎兒染色體非整倍性。在又一實(shí)施方 案中,所述胎兒染色體非整倍性是三體性13、三體性18或三體性21。在還一個(gè)實(shí)施方案 中,所述胎兒染色體非整倍性是三體性21 (唐氏綜合征)。在該實(shí)施方案中,本領(lǐng)域技術(shù)人 員將容易理解,本發(fā)明的方法學(xué)可用于診斷胎兒攜帶染色體21的大部分、而非完整染色體 的情況。
[0028] 樣品提取 可以理解,樣品可以依照常規(guī)程序得自懷孕的女性受試者。在一個(gè)實(shí)施方案中,所述生 物樣品是母體血液、血漿、血清、尿或唾液。在進(jìn)一步的實(shí)施方案中,所述生物樣品是母體血 漿。
[0029] 獲得母體血漿的步驟典型地包括自懷孕的女性受試者抽?。ǖ湫偷赝ㄟ^靜脈穿 刺)5-20ml血液樣品(典型地外周血樣品)。因此,獲得這樣的樣品的特征是對(duì)胎兒空間是 非侵入性的,并且對(duì)于母親是最小侵入性的。在通過離心去除細(xì)胞材料后,通過常規(guī)方法制 備血漿(Maron等人,2007,MethodsMolMed132,51-63)〇
[0030] 通過常規(guī)方法自母體血漿提取DNA,該法對(duì)于血漿DNA的核苷酸序列而言是無偏 倚的(Maron等人,2007,出處同上)。血漿DNA分子群體典型地包含胎兒來源部分和母 體來源部分。
[0031] 獲得序列數(shù)據(jù) 通常獲得和制備足夠量的血漿DNA分子(至少500, 000和典型地?cái)?shù)百萬分子)的DNA序列數(shù)據(jù)(Fan和Quake, 2010,PLoSOne5),用于生物信息學(xué)分析。對(duì)于待檢測(cè)的異常性 類型,經(jīng)統(tǒng)計(jì)學(xué)方法測(cè)定足夠量。生物信息學(xué)分析經(jīng)特別設(shè)計(jì),以容忍indel和錯(cuò)配誤差, 同時(shí)以與特定染色體的獨(dú)特序列可靠匹配的形式有效地提取所需信息。
[0032] 技術(shù)人員將理解,本發(fā)明不限于用于獲得序列數(shù)據(jù)的任何具體技術(shù)。然而,可以 理解,當(dāng)序列數(shù)據(jù)的質(zhì)量次于常規(guī)基因組測(cè)序通常觀察到的那樣時(shí),本發(fā)明的方法找到更 大用途。例如,在一個(gè)實(shí)施方案中,所述序列數(shù)據(jù)通過包括使用聚合酶鏈?zhǔn)椒磻?yīng)的測(cè)序平 臺(tái)而獲得。在又一實(shí)施方案中,所述序列數(shù)據(jù)使用下一代測(cè)序平臺(tái)而獲得。這樣的測(cè)序 平臺(tái)已經(jīng)在以下文獻(xiàn)中有廣泛討論和綜述:Loman等人(2012)NatureBiotechnology 30(5),434-439;Quail等人(2012)BMCGenomics13,341;Liu等人(2012)Journal ofBiomedicineandBiotechnology2012, 1-11 ;和Meldrum等人(2011)ClinBiochem Rev. 32(4): 177 - 195;其測(cè)序平臺(tái)通過引用結(jié)合到本文中。
[0033] 合適的下一代測(cè)序平臺(tái)的實(shí)例包括:Roche454 (即Roche454GSFLX)、Applied Biosystems'SOLiD系統(tǒng)(即S0LiDv4)、Illumina'sGAIIx、HiSeq2000 和MiSeq測(cè)序儀、 LifeTechnologies'IonTorrent基于半導(dǎo)體的測(cè)序儀、PacificBiosciences'PacBio RS和Sanger's3730xl〇
[0034] 每個(gè)Roche's454平臺(tái)使用焦磷酸測(cè)序,藉此化學(xué)發(fā)光信號(hào)表明堿基摻入并且通 過均聚物閱讀,信號(hào)強(qiáng)度關(guān)系到摻入的堿基數(shù)量。
[0035] 在一個(gè)實(shí)施方案中,序列數(shù)據(jù)得自測(cè)序平臺(tái),其包括使用基于半導(dǎo)體的測(cè)序方法 學(xué)?;诎雽?dǎo)體的測(cè)序方法學(xué)的優(yōu)點(diǎn)是,儀器、芯片和試劑的制造非常廉價(jià),測(cè)序過程快速 (盡管被emPCR偏置)并且系統(tǒng)可擴(kuò)展,盡管這可能會(huì)略微受到用于emPCR的珠的大小的限 制。
[0036] 在一個(gè)實(shí)施方案中,序列數(shù)據(jù)是通過測(cè)序平臺(tái)而獲得,其包括使用通過合成的測(cè) 序(sequencing-by-synthesis)。Illumina's通過合成的測(cè)序(SBS)技術(shù)是目前成功的和 在全世界被廣泛接受的下一代測(cè)序平臺(tái)。TruSeq技術(shù)支持大規(guī)模平行測(cè)序,使用具有專利 權(quán)的基于可逆終止子的方法,當(dāng)單個(gè)堿基摻入生長(zhǎng)中的DNA鏈時(shí),所述方法能夠檢測(cè)它們。 當(dāng)加入每個(gè)dNTP并隨后切割以允許摻入下一個(gè)堿基時(shí),熒光標(biāo)記的終止子被成像。因?yàn)樗?有4種可逆終止子結(jié)合的dNTP在每個(gè)測(cè)序周期中都存在,所以天然競(jìng)爭(zhēng)使得摻入偏倚最小 化。
[0037] 在一個(gè)實(shí)施方案中,序列數(shù)據(jù)得自包括使用基于納米孔的測(cè)序方法學(xué)的測(cè)序平 臺(tái)。在又一實(shí)施方案中,所述基于納米孔的方法學(xué)包括使用有機(jī)型納米孔,其模擬活細(xì)胞中 的細(xì)胞膜和蛋白通道的環(huán)境,例如在OxfordNanoporeTechnologies所用的技術(shù)中(例如 BrantonD,BayleyH,等人(2008).NatureBiotechnology2