eTech.度illerica,Mass.)的ddPCR設(shè)備 或可得或?qū)⒆兊每傻玫念愃圃O(shè)備)進(jìn)行。在一些實(shí)施方案中,整個(gè)ddPCR步驟用專口設(shè)備 來進(jìn)行。在其他實(shí)施方案中,一個(gè)或多個(gè)步驟,例如,數(shù)字稀釋、熱循環(huán)、檢測和分析用選自 例如手動(dòng)或自動(dòng)通用移取設(shè)備、熱循環(huán)儀、電泳裝置等的通用設(shè)備來進(jìn)行。
[0039]ddPCR產(chǎn)物的檢測可W通過檢測核酸的任何通用或序列特異性方式來進(jìn)行。該檢 測可W在反應(yīng)體積內(nèi)或額外步驟諸如電泳或?qū)游鲋蟀l(fā)生。該檢測可W在擴(kuò)增(實(shí)時(shí)PCR) 過程中或擴(kuò)增(終點(diǎn)PCR)完成之后發(fā)生。可檢測標(biāo)記可W綴合至PCR試劑,諸如引物或 探針。所述標(biāo)記可W通過光譜學(xué)、光化學(xué)、生物化學(xué)、免疫化學(xué)、化學(xué)技術(shù)進(jìn)行檢測,或者可 W使用其他技術(shù)。為了說明,有用的標(biāo)記包括;放射性同位素、巧光染料、電子致密試劑、酶 (如化ISA中所常用)、半抗原和針對(duì)其的抗血清或單克隆抗體可用的蛋白。作為標(biāo)記的 PCR試劑的替代方案,可W在PCR后用分開的標(biāo)記試劑(例如,序列特異性標(biāo)記的探針)進(jìn) 行檢測?;蛘?,可W使用檢測核酸的非特異性方法,諸如電泳,隨后染色。
[0040] 不像測序,本文公開的基于ddPCR的方法得益于何種HLA基因座在父母之間是有 信息的(即,多態(tài)性的)的知識(shí)。在一些實(shí)施方案中,所述方法包括將父母基因分型W鑒定 有信息的HLA基因座的第一步驟。如果此類信息是可用的,則PCR試劑的單一集合可用于祀 向母本血漿樣品中的有信息的基因座?;蛘?,希望至少一個(gè)基因座在母親和胎兒之間是多 態(tài)性的,在沒有父本信息的情況下,母本樣品可W經(jīng)受使用一個(gè)或多個(gè)選自HLA-A、HLA-B、 化八-(:、01?1、01?3、01?4、01?5、0941、0地1、0?41、和0?81的基因座的(1(1?〇?分析。在一些實(shí) 施方案中,祀向HLA基因的特定外顯子或外顯子的部分,例如,HLA-A,外顯子2和3 ;HLA-B, 外顯子2和3 ;HLA-C,外顯子2和3 ;DQA1:外顯子2 ;D地1:外顯子2和3 ;DPA1:外顯子 2 ;DPB1:外顯子2 ;DRB1:外顯子2、DRB3:外顯子2 ;DRB4:外顯子2 ;和DRB5:外顯子2。在 其他實(shí)施方案中,多態(tài)性HLA基因序列包含內(nèi)含子序列或外顯子和內(nèi)含子序列的組合。
[0041] 目前使用的HLA引物目的在于擴(kuò)增和檢測整個(gè)HLA外顯子的序列。編碼膚結(jié)合 溝的HLAII類外顯子(外顯子2)的平均大小為約270個(gè)堿基對(duì)。因此,典型的HLA分 型測定設(shè)及約300個(gè)堿基對(duì)的擴(kuò)增子度entl巧,G.,等人,(2009)化礎(chǔ)rew扣。口打, hi邑hthrou邑hputHLA邑enotypin邑bynext-邑enerationsequencin邑,TissueAntigens, 74:393.)相反,由于母體血液或血漿中發(fā)現(xiàn)的胎兒DM的片段化的性質(zhì),本發(fā)明中的引物 目的在于擴(kuò)增和檢測長度不長于160個(gè)堿基對(duì)的片段的序列。本發(fā)明中使用的引物獨(dú)特地 組合擴(kuò)增短無細(xì)胞DNA的能力與祀向HLA基因的有信息的(即,最多態(tài)性的)區(qū)域的能力。 在一些實(shí)施方案中,用包括具有表1中列出的HLA-雜交區(qū)域的至少一個(gè)引物的引物實(shí)踐本 發(fā)明的方法。
[0042] 在一些實(shí)施方案中,擴(kuò)增子通過W下測序:堿基滲入方法,例如,焦憐酸測序方 法(美國專利號(hào)6, 274, 320、6, 258, 568和6, 210, 891);氨離子檢測方法(IS陽T)(例如, 美國專利號(hào)8, 262, 900),或染料-終止子檢測方法(美國專利號(hào)7, 835, 871、8, 244, 479、 8, 315, 817 和 8, 412, 467)。
[004引由本發(fā)明的方法生成的HLA序列數(shù)據(jù)包含個(gè)體DNA分子的HLA序列。本發(fā)明的 方法中使用的典型NGS儀器(例如,GS家族,454LifeSciences,Branford,Conn.; IONPROTON? 和PGM?,LifeTechnologies,GrandIsland,N.Y.;HI沈Q? 和MI沈Q?, Illumina,SanDiego,Cal.)含有能夠定量檢測樣品中存在的各序列(例如,樣品中存在 的在相同的基因座的各HLA等位基因序列)的數(shù)據(jù)分析模塊。然后計(jì)數(shù)對(duì)應(yīng)于胎兒和母本 等位基因序列的讀數(shù)的數(shù)目W測定樣品中的胎兒等位基因和胎兒DNA的分?jǐn)?shù)。
[0044] 計(jì)算步驟通常通過能夠執(zhí)行軟件程序的函數(shù)的計(jì)算機(jī)來進(jìn)行。本發(fā)明可W用可 用于或?qū)⒆兊每捎糜诜治鲇煽寺y序生成的個(gè)別核酸序列讀數(shù)的任何合適的軟件來實(shí)施。 所述軟件可W具有獨(dú)特適合于分析HLA序列和分配HLA基因型的特定特征。例如,軟件 可W將從樣品獲得的序列讀數(shù)與已知HLA等位基因的數(shù)據(jù)庫進(jìn)行比較。此數(shù)據(jù)庫的一個(gè) 實(shí)例是在歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL)維護(hù)的IMGT/HLA序列數(shù)據(jù)庫,參見Robinson等 K但003) IMGT/HLA and IMGT/MHC: sequence dat油ases for the slMdy of the major 如別〇。〇曲仍。如7_/冰 NucleicAcidsResearch, 31:311。用于分析HLA序列讀 數(shù)的典型軟件鑒定樣品中存在的讀數(shù)間的大多數(shù)組。在典型的人樣品中,對(duì)于測試的各HLA序列存在不多于四組序列讀數(shù):對(duì)于在相同基因座的兩個(gè)HLA等位基因中的每個(gè)的正向和 反向讀數(shù)。(僅兩個(gè)序列將存在于源自純合個(gè)體的樣品中)。在本發(fā)明的背景下,所述軟件 (如預(yù)編程或用戶通過用戶接口的輸入)執(zhí)行鑒定第=等位基因(除了樣品中存在的在相 同基因座的兩個(gè)母本HLA等位基因W外的非母本(胎兒)HLA等位基因)的額外函數(shù)。所 述軟件(如預(yù)編程或用戶通過用戶接口的輸入)必須將W低濃度(通常為1%至15% )存 在的少數(shù)非母本等位基因與由于例如PCR錯(cuò)誤插入、測序誤差、相關(guān)的假基因、樣品中的輕 微DNA污染物等導(dǎo)致且W比非母本(胎兒)等位基因更低濃度(例如,《0.5%)存在的人 為結(jié)果進(jìn)行區(qū)分。
[0045] 在一些實(shí)施方案中,所述軟件將序列讀數(shù)與HLA序列數(shù)據(jù)庫進(jìn)行比較且將兩個(gè) (或在純合母親的情況下,一個(gè))最普遍的序列鑒定為在特定HLA基因座的母本等位基 因。不限制本發(fā)明的范圍,但僅僅通過實(shí)例的方式,ConexioHLA基因分型軟件(Conexio Genomics,Ltd.,Perth,Australia)將已經(jīng)比對(duì)的合并的序列讀數(shù)與給定擴(kuò)增子的參考 序列(例如,D地1外顯子2)進(jìn)行比較,且將觀察到的序列讀數(shù)與IMGT/HLA序列數(shù)據(jù)庫進(jìn) 行比較。對(duì)應(yīng)于該擴(kuò)增子的所有讀數(shù)被分選至D地1外顯子2"箱化in)",且該軟件假設(shè)對(duì) 于任何一個(gè)樣品存在僅兩個(gè)等位基因序列(兩個(gè)正向讀數(shù)和兩個(gè)反向讀數(shù))。運(yùn)些序列被 分選至"主要層(MasterLayer)"且用于基因型分配。通常豐度比真實(shí)等位基因小得多、對(duì) 應(yīng)于人為物或污染物的所有其他序列讀數(shù)被分選至"失敗層(FailedLayer)"且不用于基 因型分配。
[0046] 本發(fā)明的方法需要檢測多于一種基因型,即樣品中存在的多于兩個(gè)等位基因。在 一些實(shí)施方案中,所述軟件(如預(yù)編程或用戶通過用戶接口的輸入)鑒定且將少數(shù)組分分 選至多個(gè)"箱化ins)",其代表對(duì)應(yīng)于擴(kuò)增子(例如,D地1基因座)的不同的等位基因組。 例如,代替對(duì)于D地1外顯子2僅具有一個(gè)"箱化in)",所述方法包括對(duì)于在D地1基因座的 多個(gè)等位基因生成多個(gè)"箱化1113)"(例如,0地1*01:01、*02:01、*03:01等)。在一些實(shí)施 方案中,生成多于2個(gè),例如,3、4、5、6和多達(dá)15或20個(gè)此類箱。將對(duì)應(yīng)于少數(shù)組分的HLA 類型的序列分選至適當(dāng)箱中。噪聲(即,PCR和測序誤差、假基因等)仍然通常分選至每個(gè) 箱的失敗層。該步驟允許快速鑒定多數(shù)組分的等位基因(母本等位基因),W及鑒定對(duì)應(yīng)于 少數(shù)組分的讀數(shù)。值得注意的是,該方法適合于鑒定胎兒等位基因,即使親本基因型是未知 的。在一些實(shí)施方案中,所述親本基因型是已知的。在此類實(shí)施方案中,可W修改所述軟件 W鑒定和計(jì)數(shù)特定的母本和父本等位基因且丟棄作為"失敗"讀數(shù)的與其不同的所有讀數(shù)。
[0047] 在一些實(shí)施方案中,所述方法包括盡可能減少由于例如PCR錯(cuò)誤插入、測序誤差、 相關(guān)的假基因、樣品中的輕微DNA污染物等產(chǎn)生的人為結(jié)果導(dǎo)致的誤差的步驟。PCR或測序 誤差可W將母本等位基因"轉(zhuǎn)化"成另一種已知的HLA等位基因是可能的。盡管預(yù)期該事 件是稀少的,即,頻率比非母本等位基因的頻率低得多,但在一些實(shí)施方案中,本發(fā)明的方 法包括盡可能減少此類誤差的步驟。例如,所述方法可W包括分析處于強(qiáng)連鎖不平衡的基 因的兩種擴(kuò)增子,例如,DQA1和D地1。如果誤差將多數(shù)等位基因轉(zhuǎn)化成對(duì)應(yīng)于D地1的已知 第S非母本等位基因的序列,則隨機(jī)誤差也應(yīng)當(dāng)將母本DQA1等位基因轉(zhuǎn)化成對(duì)應(yīng)于與人 為D地1等位基因連鎖不平衡的DQA1等位基因的序列是極不可能的。
[0048] 本發(fā)明是測定樣品中胎兒核酸的分?jǐn)?shù)或濃度的方法,其包括:定量檢測所述樣品 中的至少一種非母本HLA等位基因,定量檢測在相同基因座的至少一種母本HLA等位基因; 且使用所述母本和非母本等位基因的量,測定所述樣品中的胎兒分?jǐn)?shù)。在一些實(shí)施方案中, 至少一種HLA等位基因選自HLA-A、HLA-B、HLA-C、DRB1、DRB3、DRB4、DRB5、DQA1、D地 1、DPA1、 和DPBl等位基因,具體地在一些實(shí)施方案中,所述等位基因包含選自W下的序列:HLA-A, 外顯子2和3;HLA-B,外顯子2和3;HLA-C,外顯子2和3;DQA1,外顯子2;D地1,外顯子 2和3 ;DPA1,外顯子2 ;DPB1,外顯子2 ;DRB1,外顯子2 ;DRB3,外顯子2 ;DRB4,外顯子2 ;和 DRB5,外顯子2、或內(nèi)含子序列或來自運(yùn)些基因的外顯子和內(nèi)含子序列的組合。在一些實(shí)施 方案中,所述定量檢測包括克隆測序。在一些實(shí)施方案中,所述方法包括在測序之前的目標(biāo) 富集步驟。在本實(shí)施方案的變型中,所述富集通過DNA擴(kuò)增進(jìn)行。在本實(shí)施方案的其他變 型中,所述富集通過目標(biāo)捕獲進(jìn)行。
[0049] 所述方法進(jìn)一步包括使用母本和非母本序列讀數(shù)的量測定樣品中的胎兒分?jǐn)?shù)。所 述測定步驟包括計(jì)算非母本(胎兒)讀數(shù)與母本讀數(shù)或與讀數(shù)的總數(shù)減去背景噪聲的比 率。因?yàn)楸嚷史从硟蓚€(gè)胎兒等位基因中的僅一個(gè)的比例,所朗尋該比率加倍W獲得胎兒DNA 的分?jǐn)?shù)。
[0050] 不將本發(fā)明限于單一技術(shù)或儀器、但僅僅通過實(shí)例的方式,可W使用測序儀器的 GS家族包括如下所述的GS化X?、GS化X+?、GS化XTITANIUM?或GS化nior? (454Life Sciences,Branford,Conn.)進(jìn)行該方法的實(shí)施方案。
[0051] 在本實(shí)施方案中,所述目標(biāo)富集和測序步驟包括:(a)在第一擴(kuò)增反應(yīng)中,使用擴(kuò) 增引物擴(kuò)增包含多態(tài)性位點(diǎn)的一個(gè)或多個(gè)HLA-A、HLA-B、HLA-C、DRB1、DRB3、DRB4、DRB5、 DQAUD地UDPA1和DPB1的外顯子或內(nèi)含子,所述擴(kuò)增引物包含5' -至3' -引發(fā)方向列出 的W下序列:銜接序列、分子識(shí)別序列和HLA-雜交序列;化)在第二擴(kuò)增反應(yīng)中,進(jìn)行乳液 PCR; (C)使用焦憐酸測序測定步驟化)中獲得的各擴(kuò)增子的序列;(d)通過將步驟(C)中測 定的HLA擴(kuò)增子的序列與已知的HLA序列進(jìn)行比較而將HLA等位基因分配至母親或胎兒, W確定何種HLA等位基因存在于母體血液或血漿中;(e)對(duì)于一個(gè)或多個(gè)HLA等位基因, 定量對(duì)應(yīng)于步驟(C)中獲得的各等位基因的胎兒和母本測序讀數(shù)的數(shù)目;和(f)使用步驟 (e)中獲得的量,通過計(jì)算非母本(胎兒)讀數(shù)與母本讀數(shù)或與讀數(shù)的總數(shù)減去背景或與讀 數(shù)的總數(shù)的比率來測定母體血液或血漿中存在的胎兒DNA的分?jǐn)?shù)。
[0052] 在本實(shí)施方案的變型中,所述方法包括在步驟(a)之后,合并來自多個(gè)個(gè)體的擴(kuò) 增子且對(duì)來自多個(gè)個(gè)體的擴(kuò)增子的合并物進(jìn)行隨后的步驟化)-(C)。在該變型中,所述 擴(kuò)增引物進(jìn)一步包括也稱為多重識(shí)別(MID)標(biāo)簽的個(gè)體識(shí)別標(biāo)簽。
[0053] 在其他實(shí)施方案中,使用任何可用的深度測序技術(shù)和儀器(即,能夠數(shù)字序列讀 出的技術(shù)和儀器)進(jìn)行步驟化)-(e)或其等效物。沒有限制,儀器的實(shí)例包括儀器的GS家 族(454LifeSciences,化anford.Conn.) ;I0NPROTON?和PGM?(LifeTechnologies, GrandIsland,N.Y.);HI沈Q? 和MI沈Q? (Illumina,SanDiego,Cal.)或其