本申請(qǐng)要求2015年1月14日提交的美國臨時(shí)申請(qǐng)?zhí)?2/103,524、2014年8月28日提交的美國臨時(shí)申請(qǐng)?zhí)?2/043,060和2014年2月18日提交的美國臨時(shí)申請(qǐng)?zhí)?1/940,942的優(yōu)先權(quán),這些申請(qǐng)的內(nèi)容通過引用以其整體并入本文。序列表、表格或計(jì)算機(jī)程序列表的引用本申請(qǐng)與電子格式的序列表一起提交。序列表作為命名為ILLINC276WO_Sequence_Listing.TXT的文件提供,創(chuàng)建日期為2015年2月13日,該序列表大小為55Kb。該電子格式的序列表中的信息通過引用以其整體并入本文。公開內(nèi)容的領(lǐng)域本文提供的實(shí)施方案涉及用于DNA譜系分析(DNAprofiling)的方法及組合物。一些實(shí)施方案涉及在單個(gè)反應(yīng)中擴(kuò)增不同尺寸的靶序列,隨后進(jìn)行文庫的后續(xù)測序的方法。公開內(nèi)容的背景在歷史上,在人類基因組中的標(biāo)志物的子集的使用已被用來確定個(gè)體的個(gè)人身份或DNA指紋或譜。這些標(biāo)志物包括短串聯(lián)重復(fù)序列(STR)和中度串聯(lián)重復(fù)序列(ITR)的位置或基因座,它們組合起來在從基因水平上鑒定一個(gè)個(gè)體與另一個(gè)個(gè)體中是有用的。這些標(biāo)志物的分析已在犯罪現(xiàn)場發(fā)現(xiàn)的DNA的分析中變得標(biāo)準(zhǔn)化。例如,在美國,這些重復(fù)序列中的許多已被組合,以創(chuàng)建聯(lián)合DNA索引系統(tǒng)(CombinedDNAIndexSystem,CODIS),聯(lián)合DNA索引系統(tǒng)(CODIS)在刑事案件中用作用于DNA譜系分析的實(shí)驗(yàn)室標(biāo)準(zhǔn)。其他國家同樣也采用了用于DNA譜系分析的標(biāo)準(zhǔn)系統(tǒng)。這些系統(tǒng)也被用來確定親子鑒定和家庭關(guān)系。然而,目前的系統(tǒng)都基于這些重復(fù)的基因座在電泳系統(tǒng)上的尺寸分離,并因此受到可在此類系統(tǒng)中區(qū)分的基因座數(shù)目的限制。例如,由于電泳檢測方法的限制,用于法醫(yī)學(xué)目的的DNA譜系分析的一些目前的商業(yè)系統(tǒng)僅區(qū)分16個(gè)標(biāo)志物。公開內(nèi)容的概述實(shí)施方案涉及不受含量限制,并且使有關(guān)個(gè)體的遺傳信息的不同碎片(pieces)匯集在一起,以提供個(gè)體的全面的、更完整的DNA譜的系統(tǒng)和方法。本公開內(nèi)容描述了使個(gè)體的該譜成為可能,從而推進(jìn)個(gè)人和法醫(yī)基因組學(xué)領(lǐng)域的方法及組合物。DNA譜系分析目前使用選擇的生物標(biāo)志物以用于確定DNA樣品身份。例如,用于確定DNA譜的最常用的分析是確定在生物體的基因組中發(fā)現(xiàn)的許多短串聯(lián)重復(fù)(STR)序列的譜。分析由以下組成:擴(kuò)增定義的STR序列,該定義的STR序列可多達(dá)400bp長,可通過在電泳凝膠上的尺寸或通過使用毛細(xì)管電泳(CE)來區(qū)分。電泳用來檢測由于在給定基因座處的重復(fù)的STR的數(shù)目差異以及因此的PCR擴(kuò)增子的長度差異帶來的尺寸變化,這對(duì)于CE系統(tǒng)在50-500bp之間。為了幫助克服由尺寸區(qū)分方法產(chǎn)生的限制(即,具有重疊擴(kuò)增子尺寸的STR不能被區(qū)分),DNA譜系分析的目前的方法利用標(biāo)記的引物的不同集合,使得尺寸重疊的擴(kuò)增子可用不同的熒光染料標(biāo)記,在激發(fā)后,所述不同的熒光染料上的發(fā)射光譜不同,從而允許使用染料激發(fā)和發(fā)射光譜的差異來區(qū)分重疊的擴(kuò)增子。使用差異化標(biāo)記,目前的方法允許在一個(gè)DNA譜系分析運(yùn)行中使用6種不同的可檢測的染料使得24個(gè)不同的STR基因座多重復(fù)用(multiplexing)。目前的DNA譜系分析方法存在許多限制。如先前提及的,尺寸區(qū)分系統(tǒng)限制可在給定時(shí)間離散地確定的基因座的數(shù)目。用于DNA譜系分析的已建立方法的另一個(gè)限制是,待分析的DNA常常降解,且一些標(biāo)志物的尺寸范圍不容納降解的DNA,例如,擴(kuò)增子可大于降解的DNA的片段的尺寸。對(duì)于降解的DNA,400bp的擴(kuò)增子被認(rèn)為是非常長的,并且可導(dǎo)致那些更長基因座的擴(kuò)增的損失。當(dāng)DNA分析者擴(kuò)增降解的DNA樣品以鑒定它們的STR譜,例如,在犯罪現(xiàn)場發(fā)現(xiàn)的樣品時(shí),通常他們不能檢測到所有的基因座,導(dǎo)致部分譜,這可使犯罪現(xiàn)場中的犯罪嫌疑人與犯罪樣品難以或不可能匹配。默認(rèn)對(duì)于此類樣品(Asadefaultwithsuchsamples),DNA分析者幾乎沒有選擇,且如果任何樣品有剩余(leftover),需要進(jìn)行另外的測定,以鑒定可能給出關(guān)于個(gè)體身份的線索的其他標(biāo)志物,諸如單核苷酸多態(tài)性(SNP)、微-STR或線粒體DNA(mtDNA)分析。然而,珍貴的樣品必須被耗費(fèi)在每一次測定上,而并不具有最終鑒定個(gè)體的成功的確定性。圖1A示出了DNA鑒定的潛在的不同路徑,它們?nèi)渴菃为?dú)的工作流程并要求珍貴樣品的等分試樣。當(dāng)一個(gè)或更多個(gè)簡單的工作流程需要被組合并可能重復(fù)多次時(shí),則所得的過程不再簡單或有效使用珍貴的樣品。在本申請(qǐng)中描述的實(shí)施方案提供了用于通過下一代測序(NGS)確定個(gè)體或有機(jī)體的DNA譜的方法、組合物及系統(tǒng),從而提供對(duì)DNA譜系分析的目前方法的問題和限制的解決方案。圖1B示出了在一個(gè)實(shí)施方案中,公開的方法的示例性工作流程。本文公開了用于將大量法醫(yī)相關(guān)的標(biāo)志物組合進(jìn)一個(gè)測定的方法及組合物,所述法醫(yī)相關(guān)的標(biāo)志物包括,但不限于,短串聯(lián)重復(fù)(STR)、中度串聯(lián)重復(fù)(ITR)、身份信息單核苷酸多態(tài)性(iSNP)、祖先信息單核苷酸多態(tài)性(aSNP)以及表型信息單核苷酸多態(tài)性(pSNP)。本公開內(nèi)容描述了克服DNA譜系分析的目前方法的限制的測定。公開的實(shí)施方案提供了用于在單個(gè)多重反應(yīng)中從一個(gè)核酸樣品多重?cái)U(kuò)增、文庫制備及測序組合的STR、ITR、iSNP、aSNP和pSNP的方法及組合物。公開的方法在具有最小樣品處理的一個(gè)實(shí)驗(yàn)測定中使用低量的包含降解的DNA的樣品DNA分析多個(gè)標(biāo)志物。一些描述的實(shí)施方案可被用于數(shù)據(jù)庫分析(databanking)DNA譜和/或可用于刑事案件的DNA譜。一些實(shí)施方案提供了被開發(fā)為足夠靈敏的以檢測亞納克量的DNA的PCR方法及組合物。此外,非常規(guī)的引物設(shè)計(jì)參數(shù)允許高度多重復(fù)用的PCR以用于在一個(gè)多重反應(yīng)中鑒定STR、ITR和SNP。對(duì)于刑事案件,本發(fā)明的方法及組合物摻入獨(dú)特分子標(biāo)識(shí)符(UMI),該獨(dú)特分子標(biāo)識(shí)符(UMI)有助于從測序結(jié)果去除,例如,PCR和測序誤差、掃描殘跡(stutter)等。參見Kivioja等,Nat.Meth.9,72–74(2012)。同樣,來自本文公開的方法及組合物的結(jié)果與現(xiàn)有的數(shù)據(jù)庫兼容。因此,本文公開的實(shí)施方案提供了用于構(gòu)建DNA譜的方法,所述方法包括:提供核酸樣品,在多重反應(yīng)中用多種引物擴(kuò)增該核酸樣品以生成擴(kuò)增產(chǎn)物,所述多種引物與包含單核苷酸多態(tài)性(SNP)的至少一種靶序列和包含串聯(lián)重復(fù)的至少一種靶序列特異性雜交,并且確定在該擴(kuò)增產(chǎn)物中的至少一種SNP和至少一種串聯(lián)重復(fù)的基因型,從而構(gòu)建該核酸樣品的DNA譜。在一些實(shí)施方案中,該方法包括從擴(kuò)增產(chǎn)物生成核酸文庫。在一些實(shí)施方案中,該方法包括確定核酸文庫的序列。在一些實(shí)施方案中,核酸樣品來自人類。在一些實(shí)施方案中,核酸樣品來自環(huán)境樣品、植物、非人類動(dòng)物、細(xì)菌、古細(xì)菌(archaea)、真菌或病毒。在一些實(shí)施方案中,DNA譜被用于疾病診斷或預(yù)后、癌癥生物標(biāo)志物鑒定、遺傳異常鑒定或遺傳多樣性分析的一種或更多種。在一些實(shí)施方案中,DNA譜被用于數(shù)據(jù)庫分析、法醫(yī)、刑事案件工作、親子鑒定或個(gè)人鑒定的一種或更多種。在一些實(shí)施方案中,至少一種SNP指示核酸樣品的來源的祖先或表型特征。在一些實(shí)施方案中,多種引物的每種具有低的解鏈溫度和/或具有至少24個(gè)核苷酸的長度。在一些實(shí)施方案中,多種引物的每種具有小于60℃的解鏈溫度。在一些實(shí)施方案中,多種引物的每種具有為約50℃至約60℃的解鏈溫度。在一些實(shí)施方案中,多種引物的每種具有至少24個(gè)核苷酸的長度。在一些實(shí)施方案中,多種引物的每種具有約24個(gè)核苷酸至約38個(gè)核苷酸的長度。在一些實(shí)施方案中,多種引物的每種包含同聚物核苷酸序列。在一些實(shí)施方案中,核酸樣品通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴(kuò)增。在一些實(shí)施方案中,在具有相比于連同常規(guī)設(shè)計(jì)的引物一起使用的擴(kuò)增緩沖液的鹽濃度增加的鹽濃度的擴(kuò)增緩沖液中擴(kuò)增核酸樣品。在一些實(shí)施方案中,鹽包括KCl、LiCl、NaCl或其組合。在一些實(shí)施方案中,鹽包括KCl。在一些實(shí)施方案中,擴(kuò)增緩沖液中的KCl的濃度為約100mM至約200mM。在一些實(shí)施方案中,擴(kuò)增緩沖液中的KCl的濃度小于約150mM。在一些實(shí)施方案中,擴(kuò)增緩沖液中的KCl的濃度為約145mM。在一些實(shí)施方案中,SNP是祖先SNP、表型SNP、身份SNP或其組合。在一些實(shí)施方案中,多種引物與至少30種SNP特異性雜交。在一些實(shí)施方案中,多種引物與至少50種SNP特異性雜交。在一些實(shí)施方案中,串聯(lián)重復(fù)是短串聯(lián)重復(fù)(STR)、中度串聯(lián)重復(fù)(ITR)或其變體。在一些實(shí)施方案中,多種引物與至少24種串聯(lián)重復(fù)序列特異性雜交。在一些實(shí)施方案中,多種引物與至少60種串聯(lián)重復(fù)序列特異性雜交。在一些實(shí)施方案中,核酸樣品包含約100pg至約100ngDNA。在一些實(shí)施方案中,核酸樣品包含約10pg至約100pgDNA。在一些實(shí)施方案中,核酸樣品包含約5pg至約10pgDNA。在一些實(shí)施方案中,核酸樣品包括基因組DNA。在一些實(shí)施方案中,基因組DNA來自法醫(yī)樣品。在一些實(shí)施方案中,基因組DNA包含降解的DNA。在一些實(shí)施方案中,至少一種SNP和至少一種串聯(lián)重復(fù)的基因型的至少50%被確定。在一些實(shí)施方案中,至少一種SNP和至少一種串聯(lián)重復(fù)的基因型的至少80%被確定。在一些實(shí)施方案中,至少一種SNP和至少一種串聯(lián)重復(fù)的基因型的至少90%被確定。在一些實(shí)施方案中,至少一種SNP和至少一種串聯(lián)重復(fù)的基因型的至少95%被確定。在一些實(shí)施方案中,多種引物的每種包含一種或更多種標(biāo)簽序列。在一些實(shí)施方案中,一種或更多種標(biāo)簽序列包括引物標(biāo)簽、捕獲標(biāo)簽、測序標(biāo)簽、獨(dú)特分子標(biāo)識(shí)符標(biāo)簽或其組合。在一些實(shí)施方案中,一種或更多種標(biāo)簽序列包括引物標(biāo)簽。在一些實(shí)施方案中,一種或更多種標(biāo)簽序列包括獨(dú)特分子標(biāo)識(shí)符標(biāo)簽。本文公開的實(shí)施方案提供了構(gòu)建核酸文庫的方法,所述方法包括:提供核酸樣品,以及在多重反應(yīng)中用多種引物擴(kuò)增核酸樣品以生成擴(kuò)增產(chǎn)物,所述多種引物與包含單核苷酸多態(tài)性(SNP)的至少一種靶序列和包含串聯(lián)重復(fù)序列的至少一種靶序列特異性雜交。在一些實(shí)施方案中,在擴(kuò)增之前,核酸樣品不被片段化。在一些實(shí)施方案中,在擴(kuò)增之前,靶序列不被富集。在一些實(shí)施方案中,至少一種SNP指示核酸樣品的來源的祖先或表型特征。在一些實(shí)施方案中,多種引物的每種包含一種或更多種標(biāo)簽序列。在一些實(shí)施方案中,一種或更多種標(biāo)簽序列包括引物標(biāo)簽、捕獲標(biāo)簽、測序標(biāo)簽、或獨(dú)特分子標(biāo)識(shí)符標(biāo)簽或其組合。在一些實(shí)施方案中,該方法包括用第二多種引物擴(kuò)增所述擴(kuò)增產(chǎn)物。在一些實(shí)施方案中,第二多種引物的每種包含對(duì)應(yīng)于多種引物的引物標(biāo)簽的部分和一種或更多種標(biāo)簽序列。在一些實(shí)施方案中,第二多種引物的一種或更多種標(biāo)簽序列包括捕獲標(biāo)簽或測序標(biāo)簽或其組合。在一些實(shí)施方案中,該方法包括將單鏈結(jié)合蛋白(SSB)添加至擴(kuò)增產(chǎn)物。在一些實(shí)施方案中,核酸樣品和/或擴(kuò)增產(chǎn)物通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴(kuò)增。在一些實(shí)施方案中,在具有相比于連同常規(guī)設(shè)計(jì)的引物一起使用的擴(kuò)增緩沖液的鹽濃度增加的鹽濃度的擴(kuò)增緩沖液中擴(kuò)增核酸樣品和/或擴(kuò)增產(chǎn)物。在一些實(shí)施方案中,鹽包括KCl、LiCl、NaCl或其組合。在一些實(shí)施方案中,鹽包括KCl。在一些實(shí)施方案中,擴(kuò)增緩沖液中的KCl的濃度為約100mM至約200mM。在一些實(shí)施方案中,擴(kuò)增緩沖液中的KCl的濃度小于約150mM。在一些實(shí)施方案中,擴(kuò)增緩沖液中的KCl的濃度為約145mM。本文公開的實(shí)施方案提供了一種核酸文庫,所述核酸文庫包含多種核酸分子,其中該多種核酸分子包括側(cè)翼為第一對(duì)標(biāo)簽序列的至少一種串聯(lián)重復(fù)序列和側(cè)翼為第二對(duì)標(biāo)簽序列的至少一種單核苷酸多態(tài)性(SNP)序列。還提供了使用本文公開的方法及組合物構(gòu)建的核酸文庫。在一些實(shí)施方案中,至少一種SNP指示多個(gè)核酸分子的來源的祖先或表型特征。本文公開的實(shí)施方案提供了多種引物,該多種引物與核酸樣品中的至少一種短靶序列和至少一種長靶序列特異性雜交,其中在單個(gè)多重反應(yīng)中使用多種引物擴(kuò)增核酸樣品產(chǎn)生至少一種短擴(kuò)增產(chǎn)物和至少一種長擴(kuò)增產(chǎn)物,其中多種引物的每種包含一種或更多種標(biāo)簽序列。在一些實(shí)施方案中,短靶序列包含單核苷酸多態(tài)性(SNP)且長靶序列包含串聯(lián)重復(fù)。在一些實(shí)施方案中,一種或更多種標(biāo)簽序列包括引物標(biāo)簽、捕獲標(biāo)簽、測序標(biāo)簽、獨(dú)特分子標(biāo)識(shí)符標(biāo)簽或其組合。在一些實(shí)施方案中,多種引物的每種具有低的解鏈溫度和/或具有至少24個(gè)核苷酸的長度。在一些實(shí)施方案中,多種引物的每種具有小于60℃的解鏈溫度。在一些實(shí)施方案中,多種引物的每種具有為約50℃至約60℃的解鏈溫度。在一些實(shí)施方案中,多種引物的每種具有至少24個(gè)核苷酸的長度。在一些實(shí)施方案中,多種引物的每種具有約24個(gè)核苷酸至約38個(gè)核苷酸的長度。在一些實(shí)施方案中,多種引物的每種包含同聚物核苷酸序列。在一些實(shí)施方案中,核酸樣品通過聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴(kuò)增。在一些實(shí)施方案中,SNP是祖先SNP、表型SNP、身份SNP或其組合。在一些實(shí)施方案中,多種引物與至少30種SNP特異性雜交。在一些實(shí)施方案中,多種引物與至少50種SNP特異性雜交。在一些實(shí)施方案中,串聯(lián)重復(fù)是短串聯(lián)重復(fù)(STR)、中度串聯(lián)重復(fù)(ITR)或其變體。在一些實(shí)施方案中,多種引物與至少24種串聯(lián)重復(fù)序列特異性雜交。在一些實(shí)施方案中,多種引物與至少60種串聯(lián)重復(fù)序列特異性雜交。本文公開的實(shí)施方案提供了試劑盒,所述試劑盒包含至少一種容器裝置(means),其中該至少一種容器裝置包含本文公開的多種引物。在一些實(shí)施方案中,試劑盒包含用于擴(kuò)增反應(yīng)的試劑。在一些實(shí)施方案中,試劑是用于聚合酶鏈?zhǔn)椒磻?yīng)(PCR)的擴(kuò)增緩沖液。在一些實(shí)施方案中,擴(kuò)增緩沖液包括相比于連同常規(guī)設(shè)計(jì)的引物一起使用的擴(kuò)增緩沖液的鹽濃度增加的鹽濃度。在一些實(shí)施方案中,鹽包括KCl、LiCl、NaCl或其組合。在一些實(shí)施方案中,鹽包括KCl。在一些實(shí)施方案中,擴(kuò)增緩沖液中的KCl的濃度為約100mM至約200mM。在一些實(shí)施方案中,擴(kuò)增緩沖液中的KCl的濃度小于約150mM。在一些實(shí)施方案中,擴(kuò)增緩沖液中的KCl的濃度為約145mM。附圖簡述圖1A和圖1B示出了A)用于DNA譜系分析的目前的工作流程對(duì)B)本公開內(nèi)容的一個(gè)示例性實(shí)施方案的工作流程的差異。圖2示出了用于創(chuàng)建對(duì)DNA譜系分析有用的文庫的方法的一個(gè)示例性實(shí)施方案。圖3示出了用于創(chuàng)建對(duì)DNA譜系分析有用的文庫的方法的另一個(gè)示例性實(shí)施方案。圖4A、圖4B、圖4C和圖4D是顯示如下的電泳圖結(jié)果的線形圖:通過傳統(tǒng)方法和遵循已建立的PCR引物設(shè)計(jì)方案及限制設(shè)計(jì)的引物對(duì)當(dāng)與遵循本發(fā)明公開內(nèi)容的方法設(shè)計(jì)的引物組合時(shí)可如何引起基因組靶的非特異性擴(kuò)增、以及期望的擴(kuò)增子檢測的遮蔽(obscuration);A)針對(duì)SNP基因座通過本公開內(nèi)容的方法設(shè)計(jì)的10對(duì)引物對(duì),B)和D)所述10對(duì)引物加上通過傳統(tǒng)方法設(shè)計(jì)的另外的引物對(duì),顯示在擴(kuò)增期間所述另外的引物對(duì)干擾所述10對(duì)引物對(duì),和C)所述10對(duì)引物對(duì)加上另外的引物對(duì),其中所述另外的引物對(duì)也通過遵循本公開內(nèi)容的方法設(shè)計(jì),導(dǎo)致所有靶向的SNP的成功擴(kuò)增。X-軸是文庫片段的尺寸(bp),且Y軸是擴(kuò)增的片段的擴(kuò)增峰的熒光單位(FU)。圖5A、圖5B、圖5C、圖5D和圖5E是箱形圖,顯示遵循圖2中概述的工作流程的實(shí)驗(yàn)的示例性結(jié)果,該實(shí)驗(yàn)被用來在多重?cái)U(kuò)增和測序反應(yīng)中從樣品鑒定56個(gè)STR的組和75個(gè)身份信息SNP(iSNP)、祖先信息SNP(aSNP)和表型信息SNP(pSNP)的混合物。報(bào)道了顯示來自組的STR基因座的成功擴(kuò)增和測序的重復(fù)的結(jié)果;A)顯示來自組的25個(gè)雜合STR的基因座內(nèi)平衡的箱形圖,B)顯示對(duì)于56個(gè)STR基因座的大多數(shù)的低掃描殘跡的箱形圖,C)顯示STR基因座的測序覆蓋(sequencingcoverage)的箱形圖,D)顯示SNP的序列覆蓋的箱形圖,且E)顯示對(duì)于來自組的22個(gè)雜合SNP的平衡的箱形圖。下部誤差棒指示最小值,上部誤差棒指示最大值,下部箱報(bào)道第25個(gè)百分位,且上部箱報(bào)道第75個(gè)百分位,而平均值是在下部箱和上部箱之間的交叉處。圖6示出了顯示來自圖5的實(shí)驗(yàn)的示例性STR基因座繪圖(plot)的一系列柱狀圖。該繪圖顯示圖5的組中的STR的不同等位基因調(diào)用。圖7A、圖7B、圖7C、圖7D和圖7E是箱形圖,顯示遵循圖3中概述的工作流程的實(shí)驗(yàn)的示例性結(jié)果,該實(shí)驗(yàn)被用來在多重?cái)U(kuò)增和測序反應(yīng)中從樣品鑒定26個(gè)STR的組和94個(gè)iSNP、aSNP和pSNP的混合物。報(bào)道了顯示來自組的STR的成功擴(kuò)增和測序的重復(fù)的結(jié)果;A)顯示來自組的21個(gè)雜合STR基因座的基因座內(nèi)平衡的箱形圖,B)顯示對(duì)于26個(gè)STR基因座的低掃描殘跡的箱形圖(26個(gè)基因座的47個(gè)等位基因中的39個(gè)未顯示掃描殘跡),C)顯示STR基因座的測序覆蓋的箱形圖(使用UMI歸一化讀段數(shù)(readnumbers)),D)顯示SNP的序列覆蓋的箱形圖,且E)顯示對(duì)于來自組的21個(gè)雜合iSNP的平衡的箱形圖。下部誤差棒指示最小值,上部誤差棒指示最大值,下部箱報(bào)道第25個(gè)百分位,且上部箱報(bào)道第75個(gè)百分位,其中平均值是在下部箱和上部箱之間的交叉處。圖8示出了顯示來自圖7的實(shí)驗(yàn)的示例性STR基因座繪圖(plot)的一系列柱狀圖。該繪圖顯示圖7的組中的STR的不同等位基因調(diào)用。圖9示出了未用UMI和用UMI分析的樣品的柱狀圖。各組的左圖代表未用UMI分析的樣品,且各組的右圖代表用UMI分析的樣品。X軸標(biāo)出STR的重復(fù)數(shù),且Y軸標(biāo)出特定等位基因的計(jì)數(shù)數(shù)值。柱內(nèi)的誤差線分離STR序列內(nèi)的測序誤差(棒的上部)與正確序列(棒的下部)。圖10A和圖10B示出了來自實(shí)驗(yàn)的示例性結(jié)果,其中DNA比率為90:10的雌性:雄性。A)當(dāng)使用目前的毛細(xì)管電泳DNA譜系分析方法時(shí),STR基因座的STR基因座調(diào)用結(jié)果的子集,以及B)當(dāng)使用本申請(qǐng)的方法時(shí),數(shù)個(gè)STR基因座的數(shù)個(gè)STR基因座調(diào)用結(jié)果。CE方法和本申請(qǐng)的方法兩者確實(shí)檢測到低水平的雄性DNA污染。圖11示出了顯示在圖9的實(shí)驗(yàn)中檢測到對(duì)Y染色體特異的STR基因座的柱狀圖,還示出了本申請(qǐng)能夠檢測到污染性的雄性DNA和來自該雄性DNA的特定STR基因座,而用目前的CE方法將需要運(yùn)行兩個(gè)實(shí)驗(yàn)來做到這些圖12是示出來自使用12個(gè)樣品個(gè)體和1個(gè)參考個(gè)體的實(shí)驗(yàn)的示例性高水平測序結(jié)果,顯示在兩個(gè)重復(fù)之間的STR和SNP調(diào)用的一致性的表。圖13是示出來自圖12中顯示的實(shí)驗(yàn)的示例性群體統(tǒng)計(jì)信息的表。圖14是示出基于來自圖12中顯示的實(shí)驗(yàn)的pSNP的基因型的示例性表型預(yù)測的表。圖15是顯示基于來自圖12中顯示的實(shí)驗(yàn)的aSNP的基因型的示例性祖先映射的圖。圖16A、圖16B、圖16C、圖16D和圖16E是顯示來自圖12的實(shí)驗(yàn)的示例性STR基因座繪圖的柱狀圖。圖17A和圖17B是顯示來自圖12的實(shí)驗(yàn)的示例性SNP繪圖的柱狀圖。圖18A和圖18B示出了顯示來自圖12的實(shí)驗(yàn)的示例性STR和SNP基因座的基因座內(nèi)平衡的箱形圖。圖19A和圖19B是顯示來自圖12的實(shí)驗(yàn)的示例性STR基因座的掃描殘跡分析的圖。圖20是示出來自圖12的實(shí)驗(yàn)的STR基因座中的示例性等距雜合子(isometricheterozygotes)的表。圖21是顯示基于來自圖12的實(shí)驗(yàn)的STRD8S1179內(nèi)的變體的示例性遺傳繪圖的框圖。圖22是顯示基于來自圖12的實(shí)驗(yàn)的STRD13S317內(nèi)的變體的示例性遺傳繪圖的框圖。圖23是示出使用降解的DNA的示例性基因分型結(jié)果的表。圖24A和圖24B示出了在不同DNA輸入下的示例性STR基因分型結(jié)果和基因座內(nèi)平衡。圖25A和圖25B示出了在不同DNA輸入下的示例性SNP基因分型結(jié)果和基因座內(nèi)平衡。詳述定義本文提及的所有專利、申請(qǐng)、公布的申請(qǐng)及其他出版物通過對(duì)所引用的材料的引用并以其整體并入。如果術(shù)語或措辭以與通過引用并入本文的專利、申請(qǐng)、公布的申請(qǐng)及其他出版物中陳述的定義相反或以其他方式不一致的方式在本文使用,則本文的使用優(yōu)先于通過引用并入本文的定義。如本文使用的,單數(shù)形式“一個(gè)(a)”、“一個(gè)(an)”和“該(the)”包括復(fù)數(shù)指代物,除非清楚或上下文另外指示。例如,“一個(gè)”二聚體包括一個(gè)或更多個(gè)二聚體,除非另外明示或根據(jù)上下文指示。如本文使用的,術(shù)語“DNA譜”、“遺傳指紋”和“基因型譜”在本文可互換使用,以指多態(tài)基因座的集合中的等位基因變異,諸如串聯(lián)重復(fù)、單核苷酸多態(tài)性(SNP),等等。DNA譜在用于基于核酸樣品鑒定個(gè)體的法醫(yī)學(xué)中是有用的。如本文使用的DNA譜還可被用于其他應(yīng)用,諸如,包括癌癥的疾病的診斷和預(yù)后、癌癥生物標(biāo)志物鑒定、遺傳分析、遺傳多樣性分析、遺傳異常鑒定、數(shù)據(jù)庫分析、法醫(yī)、刑事案件工作、親子鑒定、個(gè)人鑒定等等。術(shù)語“多核苷酸”、“寡核苷酸”、“核酸”和“核酸分子”在本文可互換使用,以指任何長度的核苷酸的聚合形式,并且可包括核糖核苷酸、脫氧核糖核苷酸、其類似物或其混合物。該術(shù)語僅指分子的一級(jí)結(jié)構(gòu)。因此,該術(shù)語包括三鏈、雙鏈和單鏈的脫氧核糖核酸(“DNA”),以及三鏈、雙鏈和單鏈的核糖核酸(“RNA”)。如本文使用的,在兩個(gè)核苷酸序列的上下文中的“序列同一性”或“同一性”或“同源性”包括提及兩個(gè)序列中當(dāng)在指定的比較窗上為了最大對(duì)應(yīng)性比對(duì)時(shí)相同的殘基。核苷酸序列在比較窗中的部分與參考序列相比可包括添加或缺失(即,缺口),以用于兩條序列的最佳比對(duì)。百分比通過如下計(jì)算:確定兩個(gè)序列中出現(xiàn)相同的核酸堿基殘基的位置的數(shù)目,以產(chǎn)生匹配位置的數(shù)目,將匹配位置的數(shù)目除以比較窗中位置的總數(shù)目,并將結(jié)果乘以100以得到序列同一性的百分比。如本文使用的,“基本上互補(bǔ)或基本上匹配”意指,兩個(gè)核酸序列具有至少90%序列同一性。優(yōu)選地,兩個(gè)核酸序列具有至少95%、96%、97%、98%、99%或100%的序列同一性??蛇x地,“基本上互補(bǔ)或基本上匹配”意指,兩個(gè)核酸序列可在高嚴(yán)格條件下雜交??梢岳斫獾氖牵疚拿枋龅陌l(fā)明的各方面和實(shí)施方案包括由各方面和實(shí)施方案“組成”和/或“主要組成”。本發(fā)明的其他目的、優(yōu)勢和特征從結(jié)合附圖考慮的以下描述將變得明顯。用于構(gòu)建DNA譜的方法用于確定DNA譜的已建立方法在許多方面受到限制。例如,目前的方法檢測由于在DNA樣品中發(fā)現(xiàn)的串聯(lián)重復(fù)序列的長度改變而不同的擴(kuò)增的基因座的尺寸改變。為了多重STR擴(kuò)增可視化,擴(kuò)增必須被設(shè)計(jì)成在電泳系統(tǒng)的尺寸分離限值內(nèi)隔開(space)不同的擴(kuò)增子尺寸,電泳系統(tǒng)的尺寸分離限值對(duì)于CE為從約50-500bp。因此,僅有限數(shù)目的重復(fù)序列可在一個(gè)測定中被可視化。例如,GLOBALFILERPCR擴(kuò)增試劑盒(APPLIEDBIOSYSTEMS)據(jù)報(bào)道能夠通過使用6種不同的染料區(qū)分24個(gè)STR基因座。此外,當(dāng)樣品DNA被降解時(shí)(如來自犯罪現(xiàn)場的DNA樣品常見的),此類方法就有問題,使得較長的擴(kuò)增產(chǎn)物是不可能的,產(chǎn)生不完整的DNA譜。對(duì)于檢測微量的污染性DNA,目前的方法還常常不是足夠靈敏的,所以可使混合的樣品未被檢測到且未被報(bào)告,這可能對(duì)刑事案件是關(guān)鍵的。因此,目前的方法可導(dǎo)致不完整的結(jié)果,這導(dǎo)致不確定的結(jié)果,這可能對(duì)DNA譜系分析是有害的。另外,目前的靶不包括關(guān)于樣品祖先、表型性狀諸如可能的眼睛顏色的信息以及其他個(gè)性化樣品信息。一些測序方法已嘗試包括STR和SNP檢測兩者。例如,已嘗試文庫制備隨后是對(duì)于STR和SNP的定制富集,然而不是所有的STR完全被覆蓋,由于文庫制備方法通常包括可能消除靶向的序列的樣品剪切。此外,已建立的引物設(shè)計(jì)方法和方案可提供用于擴(kuò)增長序列(例如,STR)或短序列(例如,SNP)的引物組,但兩者在一個(gè)反應(yīng)中的組合還未成功。本公開內(nèi)容描述了對(duì)目前的DNA譜系分析系統(tǒng)的問題和限制的解決方案。本文描述的方法及組合物允許使用PCR將STR和SNP組合進(jìn)一個(gè)測定,以擴(kuò)增靶并產(chǎn)生用于測序的文庫。當(dāng)開發(fā)本發(fā)明的測定時(shí),意外地發(fā)現(xiàn),例如,當(dāng)利用非常規(guī)和違反直覺的引物設(shè)計(jì)時(shí),STR和SNP兩者可在一個(gè)反應(yīng)中被擴(kuò)增,這允許確定所有靶向基因座的序列。出人意料地,當(dāng)使用與目前的有關(guān)引物設(shè)計(jì)的教義相反的參數(shù)設(shè)計(jì)擴(kuò)增引物時(shí),創(chuàng)建了以幾乎平衡的方式允許更長的STR區(qū)域被擴(kuò)增和短SNP區(qū)域被擴(kuò)增,從而允許STR和SNP兩者被一起多重?cái)U(kuò)增的引物。在DNA譜系分析之外,每當(dāng)擴(kuò)增子的不同大小的集合被期望來自一個(gè)擴(kuò)增反應(yīng)時(shí),可使用本文公開的用于確定生物體的DNA譜的方法及組合物。例如,如果對(duì)于PCR感興趣的靶包括大基因區(qū)域和短SNP區(qū)域兩者,這可分別導(dǎo)致尺寸從數(shù)百個(gè)至數(shù)千個(gè)堿基對(duì)變化的擴(kuò)增子和(versus)小于100個(gè)堿基對(duì)的擴(kuò)增子,則本文描述的方法及組合物可允許成功同時(shí)擴(kuò)增基因和SNP靶,不實(shí)踐本文公開的方法這將是不可能的。此外,本文公開的方法及組合物可應(yīng)用于任何生物體,例如人類,非人類靈長類、動(dòng)物、植物、病毒、細(xì)菌、真菌等。因此,本發(fā)明的方法及組合物不僅對(duì)DNA譜系分析(例如,法醫(yī)、親子鑒定、個(gè)體鑒定等等)以及人類作為靶基因組是有用的,而且還可用于其他靶諸如癌癥和疾病標(biāo)志物、遺傳異常標(biāo)志物和/或當(dāng)靶基因組不是基于人類時(shí)。因此,本文公開的實(shí)施方案提供了用于構(gòu)建DNA譜的方法,所述方法包括:提供核酸樣品,用多種引物擴(kuò)增該核酸樣品,所述多種引物與包含單核苷酸多態(tài)性(SNP)的至少一種靶序列和包含串聯(lián)重復(fù)的至少一種靶序列特異性雜交,并且確定在擴(kuò)增產(chǎn)物中的至少一種SNP和至少一種串聯(lián)重復(fù)的基因型,從而構(gòu)建該核酸樣品的DNA譜。本領(lǐng)域技術(shù)人員將理解,任何適合的技術(shù)可在確定靶序列的基因型中被使用,任何適合的技術(shù)包括,但不限于,基于陣列的雜交、測序等。因此,在一些實(shí)施方案中,本文公開的方法可包括從擴(kuò)增產(chǎn)物生成核酸文庫,諸如測序文庫,以及確定核酸文庫的序列。在一些實(shí)施方案中,本公開內(nèi)容提供了用于DNA譜系分析的方法及組合物,所述方法及組合物包括,例如用于在群體或個(gè)人數(shù)據(jù)庫分析中同時(shí)鑒定STR和iSNP。在此類數(shù)據(jù)庫中,由于個(gè)體通常是已知的,不一定需要個(gè)人數(shù)據(jù)。然而,如果期望另外的信息,則另外的信息目標(biāo)可被添加用于同時(shí)鑒定。短串聯(lián)重復(fù)在本領(lǐng)域是熟知的,并且由重復(fù)的二或三核苷酸序列組成。中度串聯(lián)重復(fù)通常被認(rèn)為是在4個(gè)至7個(gè)核苷酸序列之間的重復(fù)序列。本文采用的SNP可呈可能提供對(duì)個(gè)人的身體特征的深刻理解的任何形式。本文例示的那些是提供用于祖先或遺傳性的線索的SNP(aSNP)、以及提供用于表型特征(表型信息SNP)的線索的那些。在本文描述的方法中,DNA譜測定可能包括與STR和ITR基因座確定組合的任何數(shù)目的這些SNP。例如,本公開內(nèi)容提供了另外的方法及組合物,其中連同STR和iSNP一起的另外的靶被包括。如果期望有關(guān)個(gè)體的更多信息,例如,當(dāng)樣品屬于未知個(gè)體或個(gè)體的群體(如對(duì)于刑事案件可能的情形)時(shí),其他信息標(biāo)志物可被添加至STR和iSNP,諸如涉及祖先的SNP(aSNP)以及涉及表型變體的SNP(表型信息SNP)。然后,可使用另外的信息以例如,通過提供對(duì)未知個(gè)體的遺傳性、眼睛顏色、發(fā)色等的深刻理解幫助調(diào)查員。如此,所有組合的信息的添加可提供先前使用DNA譜系分析的目前方法未知的個(gè)體的更完整的DNA譜。本文公開的方法及組合物被設(shè)計(jì)成是足夠靈敏的以檢測亞納克量的核酸分子。此外,本文公開的方法及組合物可對(duì)擴(kuò)增核酸樣品是有用的,該核酸樣品由具有低質(zhì)量的核酸分子,諸如來自法醫(yī)樣品的降解的和/或片段化的基因組DNA構(gòu)成。核酸樣品可以是純化的樣品或含粗制DNA的裂解物,例如來源于口腔拭子、紙、纖維或可被唾液、血液或其他體液浸漬的其他物質(zhì)。如此,在一些實(shí)施方案中,核酸樣品可包含低量的或片段化部分的DNA,諸如基因組DNA。例如,核酸樣品可包含如下的量的核酸(例如,基因組DNA),該量為、為約或小于1pg、2pg、3pg、4pg、5pg、6pg、7pg、8pg、9pg、10pg、11pg、12pg、13pg、14pg、15pg、16pg、17pg、18pg、19pg、20pg、30pg、40pg、50pg、60pg、70pg、80pg、90pg、100pg、200pg、300pg、400pg、500pg、600pg、700pg、800pg、900pg、1ng、10ng、100ng,或者在這些值的任何兩個(gè)限定的范圍內(nèi),例如,10pg至100pg、10pg至1ng、100pg至1ng、1ng至10ng、10ng至100ng,等等。在一些實(shí)施方案中,核酸樣品可包含為約100pg至約1ng的量的核酸(例如,基因組DNA)。在一些實(shí)施方案中,核酸樣品可包含多于約62.5pg的量的核酸(例如,基因組DNA)。在一些實(shí)施方案中,另外的片段化步驟,諸如超聲處理或內(nèi)切核酸酶消化,不被包括在片段化程序中。在一些實(shí)施方案中,本文公開的方法及組合物能夠甚至用亞納克量的和/或降解的核酸樣品成功地確定一個(gè)或更多個(gè)的靶序列的基因型,例如,SNP、STR等等。例如,本文公開的方法及組合物能夠成功地確定為、為約或多于以下的靶序列的基因型:10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、100%、或在以上值的任何兩個(gè)之間的范圍。在一些實(shí)施方案中,本文公開的方法及組合物能夠成功地確定多于約50%、80%、90%、95%、98%或更多的靶序列的基因型。在一些實(shí)施方案中,本文公開的方法及組合物能夠?qū)崿F(xiàn)多于以下的靶序列的基因座內(nèi)平衡:約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、100%,或在以上值的任何兩個(gè)之間的范圍。對(duì)于法醫(yī)調(diào)查,多種引物可摻入獨(dú)特分子標(biāo)識(shí)符(UMI),該獨(dú)特分子標(biāo)識(shí)符(UMI)有助于從測序結(jié)果去除,例如,PCR和測序誤差、掃描殘跡等。參見Kivioja等,同上。如在本公開內(nèi)容別處進(jìn)一步詳細(xì)討論的,引物中UMI的包含還允許鑒定在串聯(lián)重復(fù)基因座內(nèi)的變體,進(jìn)一步增強(qiáng)本發(fā)明方法及組合物用于DNA譜系分析及其他目的諸如遺傳分析的有用性。因此,在一些實(shí)施方案中,如本文中公開的串聯(lián)重復(fù)序列的基因型可包括在串聯(lián)重復(fù)基因座內(nèi)的序列變體。因此,使用傳統(tǒng)方法時(shí)的串聯(lián)重復(fù)的純合子(例如,對(duì)于D9S1122的13,13)可基于在串聯(lián)重復(fù)內(nèi)的序列變體被鑒定為等距雜合子。如將被本領(lǐng)域技術(shù)人員所理解的,考慮到基因座內(nèi)序列變體將大大增強(qiáng)本文公開的方法,例如,對(duì)于遺傳分析的有用性。用于構(gòu)建核酸文庫的方法本文公開的實(shí)施方案提供了構(gòu)建核酸文庫的方法,所述方法包括:提供核酸樣品,以及用多種引物擴(kuò)增核酸樣品,所述多種引物與包含單核苷酸多態(tài)性(SNP)的至少一種靶序列和包含串聯(lián)重復(fù)序列的至少一種靶序列特異性雜交。本文公開的方法及組合物被設(shè)計(jì)成是足夠靈敏的以檢測亞納克量的核酸分子。此外,本文公開的方法及組合物可對(duì)擴(kuò)增核酸樣品是有用的,該核酸樣品由低質(zhì)量的核酸分子,諸如來自法醫(yī)樣品的降解的和/或片段化的基因組DNA組成。核酸樣品可以是純化的或含粗制DNA的裂解物,例如來源于口腔拭子、紙、纖維或可被唾液、血液或其他體液浸漬的其他物質(zhì)。因此,在一些實(shí)施方案中,核酸樣品可包含低量的或片段化的DNA,諸如基因組DNA。例如,核酸樣品可包含如下的量的核酸(例如,基因組DNA),該量為、為約或小于1pg、2pg、3pg、4pg、5pg、6pg、7pg、8pg、9pg、10pg、11pg、12pg、13pg、14pg、15pg、16pg、17pg、18pg、19pg、20pg、30pg、40pg、50pg、60pg、70pg、80pg、90pg、100pg、200pg、300pg、400pg、500pg、600pg、700pg、800pg、900pg、1ng、10ng、100ng,或者在這些值的任何兩個(gè)限定的范圍內(nèi),例如,10pg至100pg、10pg至1ng、100pg至1ng、1ng至10ng、10ng至100ng,等等。在一些實(shí)施方案中,核酸樣品可包含為約100pg至約1ng的量的核酸(例如,基因組DNA)。在一些實(shí)施方案中,核酸樣品可包含多于約62.5pg的量的核酸(例如,基因組DNA)。在一些實(shí)施方案中,另外的片段化步驟,諸如超聲處理或內(nèi)切核酸酶消化不被包括。在一些實(shí)施方案中,預(yù)期到下游并行測序,本文公開的方法包括擴(kuò)增和文庫制備。測定可包括兩種PCR主混合物(mastermix)、兩種熱穩(wěn)定聚合酶、兩種引物混合物及文庫銜接子。在一些實(shí)施方案中,DNA樣品可通過使用包含靶特異性區(qū)域和非靶特異性標(biāo)簽區(qū)域的第一組擴(kuò)增引物和第一PCR主混合物被擴(kuò)增許多個(gè)循環(huán)。標(biāo)簽區(qū)域可以是任何序列,諸如通用標(biāo)簽區(qū)域、捕獲標(biāo)簽區(qū)域、擴(kuò)增標(biāo)簽區(qū)域、測序標(biāo)簽區(qū)域、UMI標(biāo)簽區(qū)域等。例如,標(biāo)簽區(qū)域可以是用于在第二或隨后輪的擴(kuò)增,例如,用于文庫制備中采用的擴(kuò)增引物的模板。在一些實(shí)施方案中,該方法包括將單鏈結(jié)合蛋白(SSB)添加至第一擴(kuò)增產(chǎn)物。第一擴(kuò)增樣品的等分試樣可被取出并使用第二組擴(kuò)增引物和第一PCR主混合物或第二PCR主混合物進(jìn)行第二次擴(kuò)增,該第二組擴(kuò)增引物特異于第一擴(kuò)增引物的標(biāo)簽區(qū)域,例如,通用標(biāo)簽區(qū)域或擴(kuò)增標(biāo)簽區(qū)域,該第二組擴(kuò)增引物可包含一個(gè)或更多個(gè)另外的標(biāo)簽序列,諸如對(duì)一個(gè)或更多個(gè)下游測序工作流程特異的序列標(biāo)簽。如此,原始DNA樣品的文庫準(zhǔn)備用于測序??蛇x的方法可包括,在小體積(例如,15ul)中進(jìn)行第一擴(kuò)增,且代替將等分試樣轉(zhuǎn)移至用于第二輪擴(kuò)增的新位置,可將另外的試劑添加至該管以進(jìn)行第二輪擴(kuò)增。在文庫被創(chuàng)建之后,該文庫可被純化和定量。在一些實(shí)例中,純化可通過經(jīng)由用來純化DNA片段以與反應(yīng)組分分開的基底諸如AMPUREXP珠(BeckmanCoulter)處理樣品來進(jìn)行。另一種方法可以是將純化部分,諸如半抗原部分摻入進(jìn)第二組擴(kuò)增引物中。例如,如果生物素被摻入進(jìn)第二擴(kuò)增引物組的一個(gè)引物中,則文庫片段可使用例如在珠上的鏈霉親和素部分來捕獲。采用捕獲策略,文庫還可使用基于珠的歸一化(BeadBasedNormalization,BBN)被歸一化并定量。然而,如果多個(gè)反應(yīng)被進(jìn)行,文庫可被純化并定量,或匯集并定量,而不使用BBN。例如,文庫還可通過如本領(lǐng)域已知的凝膠電泳方法、BioAnalyzer、qPCR、分光光度法、定量試劑盒(例如,PicoGreen等等)等來定量。在定量后,文庫然后可通過并行測序來測序。在一些實(shí)施方案中,提供了第一組擴(kuò)增引物,該第一組擴(kuò)增引物用來以如此有限的濃度擴(kuò)增靶DNA,使得當(dāng)?shù)谝粩U(kuò)增反應(yīng)的等分試樣被添加至新管且來自第二擴(kuò)增反應(yīng)的試劑被添加時(shí),存在由第一組擴(kuò)增引物產(chǎn)生的極小的到檢測不到的(minimaltoundetectable)遺留擴(kuò)增,并且不需要在第一擴(kuò)增反應(yīng)和第二擴(kuò)增反應(yīng)之間的清理步驟。在一些實(shí)例中,用于第一PCR的擴(kuò)增引物的濃度為、為約或小于0.5nM、0.6nM、0.7nM、0.8nM、0.9nM、1.0nM、1.5nM、2.0nM、3.0nM、4.0nM、5.0nM、6.0nM、7.0nM、8.0nM、9.0nm10.0nM、11.0nM、12.0nM或者在任何這些值之間的范圍,例如,0.5nM至1.0nM、1.0nM至12nM、0.8nM至1.5nM等等。在一些實(shí)施方案中,用于第一PCR的擴(kuò)增引物的濃度為約0.9nM至約10nM。圖2示出了在一個(gè)實(shí)施方案中,本發(fā)明公開的方法的示例性工作流程。靶基因組DNA序列使用第一組引物來擴(kuò)增,該第一組引物包含在靶序列側(cè)翼的區(qū)域和擴(kuò)增標(biāo)簽區(qū)域(其可以是相同的或不同的),導(dǎo)致包含靶序列和在兩個(gè)末端上的標(biāo)簽的擴(kuò)增子。來自第一PCR的擴(kuò)增子的等分試樣使用第二組引物來進(jìn)一步擴(kuò)增,該第二組引物特異于還包含測序引物序列(i5和i7銜接子序列)的第一標(biāo)簽序列,從而生成包含側(cè)翼為并行測序中使用的序列的靶DNA序列的文庫,在該情況下,通過Illumina,Inc.推廣的合成方法在序列中采用i5和i7序列。用于確定來自樣品的DNA譜的可選的工作流程的實(shí)例被描述于圖3中。在該實(shí)例中,DNA靶用第一引物對(duì)來擴(kuò)增,該第一引物對(duì)包含在靶序列側(cè)翼的序列、非靶標(biāo)簽序列(相同或不同的)以及包括隨機(jī)堿基的另外的獨(dú)特分子標(biāo)識(shí)符序列或UMI??墒褂肬MI,例如,以在生物信息學(xué)上減少或消除在文庫制備過程期間發(fā)生的誤差(例如,PCR假象(artifact)或錯(cuò)誤摻入,等等)。UMI的使用對(duì)DNA譜系分析可以是重要的,但對(duì)用于輔助消除當(dāng)樣品用于刑事案件測序時(shí)的誤差是特別重要的。在該實(shí)例中,第一輪擴(kuò)增進(jìn)行2個(gè)循環(huán),隨后添加單鏈結(jié)合蛋白(SSB)并在37℃孵育15分,隨后是95℃/5分滅活,這有效猝滅第一組擴(kuò)增引物在第二輪擴(kuò)增期間的另外的擴(kuò)增。盡管機(jī)制是未知的,預(yù)期添加SSB不可逆地結(jié)合單鏈第一擴(kuò)增引物,并阻止它們參與隨后的擴(kuò)增反應(yīng)。在SSB孵育后,包含序列標(biāo)簽的第二組引物和第二PCR混合物被添加,產(chǎn)生測序文庫。核酸文庫本文公開的實(shí)施方案提供了核酸文庫,該核酸文庫可被用于測序。在一些實(shí)施方案中,本文公開的核酸文庫可包含多個(gè)核酸分子,其中該多個(gè)核酸分子包含側(cè)翼為第一對(duì)標(biāo)簽序列的至少一種串聯(lián)重復(fù)序列和側(cè)翼為第二對(duì)標(biāo)簽序列的至少一種單核苷酸多態(tài)性(SNP)序列。如本文概述的,使用本文公開的方法及組合物,核酸分子的尺寸可有很大變化。本領(lǐng)域技術(shù)人員將理解,從包含串聯(lián)重復(fù)(例如,STR)的靶序列擴(kuò)增的核酸分子可具有大尺寸,而從包含SNP的靶序列擴(kuò)增的核酸分子可具有小尺寸。例如,核酸分子可包括從少于一百個(gè)核苷酸至數(shù)百個(gè)或甚至數(shù)千個(gè)核苷酸。因此,核酸分子的尺寸可具有在以下的任何兩個(gè)值之間的范圍:約50bp、約60bp、約70bp、約80bp、約90bp、約100bp、約110bp、約120bp、約130bp、約140bp、約150bp、約200bp、約300bp、約400bp、約500bp、約600bp、約700bp、約800bp、約900bp、約1kb或更多。在一些實(shí)施方案中,核酸分子的最小尺寸可以是為、為約或少于50bp、60bp、70bp、80bp、90bp或100bp的長度。在一些實(shí)施方案中,核酸分子的最大尺寸可以是為、為約或多于100bp、150bp、200bp、250bp、300bp、350bp、400bp、450bp、500bp或1kb的長度。對(duì)于簇生成,文庫片段被固定化在基底,例如,載玻片上,其包含用于捕獲和固定DNA文庫片段的同源寡核苷酸序列。固定化的DNA文庫片段使用簇?cái)U(kuò)增方法來擴(kuò)增,如由美國專利號(hào)7,985,565和7,115,400的公開內(nèi)容所例示的,其每個(gè)的內(nèi)容通過引用以全文并入本文。美國專利號(hào)7,985,565和7,115,400的并入的材料描述了固相核酸擴(kuò)增的方法,其允許擴(kuò)增產(chǎn)物被固定在固體支持物上,以形成包括固定的核酸分子的簇或“集群”的陣列。在如此陣列上的每個(gè)簇或集群從多個(gè)相同的固定的多核苷酸鏈和多個(gè)相同的固定的互補(bǔ)多核苷酸鏈形成。如此形成的陣列通常被稱為“成簇的陣列”。固相擴(kuò)增反應(yīng)的產(chǎn)物諸如在美國專利號(hào)7,985,565和7,115,400中描述的那些是通過固定化的多核苷酸鏈和固定化的互補(bǔ)的鏈的對(duì)的退火形成的所謂的“橋接的”結(jié)構(gòu),兩種鏈在5'末端被固定在固體支持物上,優(yōu)選地經(jīng)由共價(jià)附接。簇?cái)U(kuò)增方法是其中固定化的核酸模板被用來產(chǎn)生固定化的擴(kuò)增子的方法的實(shí)例。其他適合的方法也可被用來從根據(jù)本文提供的方法產(chǎn)生的固定化的DNA片段產(chǎn)生固定化的擴(kuò)增子。例如一個(gè)或更多個(gè)簇或集群可經(jīng)由固相PCR來形成,每對(duì)擴(kuò)增引物中的一個(gè)或兩個(gè)引物是被固定化的。然而,本文描述的方法不限于任何特定的測序制備方法或測序平臺(tái),并且可服從于其他并行測序平臺(tái)制備方法及相關(guān)的測序平臺(tái)。引物本文公開的實(shí)施方案提供了多種引物,該多種引物與核酸樣品中的至少一種短靶序列和至少一種長靶序列特異性雜交,其中在單個(gè)多重反應(yīng)中使用多種引物擴(kuò)增核酸樣品產(chǎn)生至少一種短擴(kuò)增產(chǎn)物和至少一種長擴(kuò)增產(chǎn)物,其中多種引物的每種包含一種或更多種標(biāo)簽序列。本文還公開了多種引物,該多種引物具有表1-2中列出的序列。對(duì)于大的靶序列(例如,STR、ITR)和小的靶序列(例如,SNP)的多重?cái)U(kuò)增,引物被設(shè)計(jì)為將允許跨越所有的靶類型的平衡擴(kuò)增。本文公開的方法及組合物可被用來在單個(gè)多重反應(yīng)中擴(kuò)增多種串聯(lián)重復(fù)靶序列。例如,多種引物可與為、為約或多于以下的許多串聯(lián)重復(fù)序列特異性雜交:4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100、或者在任何兩個(gè)值之間的范圍,諸如4至12、10至24、30至100等等。在一些實(shí)施方案中,多種引物可與至少24種串聯(lián)重復(fù)序列特異性雜交。在一些實(shí)施方案中,多種引物可與至少60種串聯(lián)重復(fù)序列特異性雜交。本文公開的方法及組合物可被用來在單個(gè)反應(yīng)中擴(kuò)增多種SNP靶序列。例如,多種引物可與為、為約或多于以下的許多SNP序列特異性雜交:4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100或者在任何兩個(gè)值之間的范圍,諸如4至12、10至24、30至100等等。在一些實(shí)施方案中,多種引物可與至少30種SNP序列特異性雜交。在一些實(shí)施方案中,多種引物可與至少50種SNP序列特異性雜交。在實(shí)驗(yàn)期間發(fā)現(xiàn),當(dāng)使用遵循用于成功的引物設(shè)計(jì)的已建立的標(biāo)準(zhǔn)和智慧設(shè)計(jì)的引物時(shí),相比于較長的STR靶序列,短SNP靶序列被優(yōu)先擴(kuò)增。此外,至少在合成測序(sequencebysynthesis)工作流程中,其中簇被生成且簇被自身測序(例如,當(dāng)按照合成測序(本文別處公開的SBS)與Illumina,Inc.測序儀聯(lián)合時(shí)),還發(fā)生較短文庫SNP片段的優(yōu)先簇?cái)U(kuò)增。為了克服這兩個(gè)偏差,需要引物設(shè)計(jì)的新策略,其將允許短SNP靶序列和長STR靶序列之間的平衡擴(kuò)增。策略之一包括設(shè)計(jì)用于STR擴(kuò)增的引物。對(duì)于STR,重復(fù)序列常常被嵌入在較大的重復(fù)區(qū)域;因此設(shè)計(jì)用于STR擴(kuò)增的特異性引物可能是有問題的。此外,STR及它們的側(cè)翼區(qū)域往往是AT豐富的。在一種情況下,使用不同于常規(guī)和已良好建立的PCR設(shè)計(jì)標(biāo)準(zhǔn)的設(shè)計(jì)策略針對(duì)有問題的區(qū)域設(shè)計(jì)引物。用于PCR引物設(shè)計(jì)的已建立標(biāo)準(zhǔn)以及其他標(biāo)準(zhǔn)規(guī)定,1)對(duì)于引物的最佳長度為18-22個(gè)核苷酸,2)Tm應(yīng)該在55℃-58℃的范圍內(nèi),3)GC含量應(yīng)該在約40%-60%,4)且應(yīng)該避免重復(fù)的AT二核苷酸區(qū)域,其中<4的二核苷酸AT重復(fù)是最大的。設(shè)計(jì)以下引物:該引物長于典型的PCR引物,例如23-35個(gè)核苷酸長而不是18-22個(gè)核苷酸,它們具有低的解鏈溫度(Tm),例如約54℃而不是約58℃,且該引物是AT豐富的,這三個(gè)參數(shù)是常規(guī)已建立的PCR標(biāo)準(zhǔn)教導(dǎo)對(duì)于最佳的引物設(shè)計(jì)應(yīng)該避免的。事實(shí)上,非最佳的引物被設(shè)計(jì)。出人意料地,發(fā)現(xiàn),這些長的、AT豐富的、低Tm的引物事實(shí)上比短的、高Tm的、含低AT的引物更好地使STR多重復(fù)用。不束縛于任何理論,預(yù)期了,遵循已建立的PCR設(shè)計(jì)標(biāo)準(zhǔn)設(shè)計(jì)的較短的引物可能形成具有高解鏈溫度的二聚體以及因此在標(biāo)準(zhǔn)PCR條件下有效形成二聚體,而較長的、低Tm引物可能在實(shí)際上低的Tm下形成二聚體并因此將對(duì)于二聚體形成是不穩(wěn)定的,從而與短的、高Tm引物(例如,18-22個(gè)核苷酸、60℃的Tm、50%GC含量)相比,允許較長的、低Tm引物在正常擴(kuò)增條件下的增加的參與。用于STR擴(kuò)增的較長的、低Tm的、AT豐富的引物然后用靶向SNP的常規(guī)設(shè)計(jì)的、高Tm的較短的引物來多重?cái)U(kuò)增。然而,在一個(gè)多重反應(yīng)中提供STR和SNP兩者的平衡擴(kuò)增的方面,多重?cái)U(kuò)增反應(yīng)再次不成功。預(yù)期了,也許將非常規(guī)引物設(shè)計(jì)應(yīng)用于擴(kuò)增沒有問題的靶,例如,擴(kuò)增SNP靶,可能產(chǎn)生成功的多重?cái)U(kuò)增。如此,設(shè)計(jì)用于STR的非最佳引物使用的同一標(biāo)準(zhǔn)被應(yīng)用于SNP的引物設(shè)計(jì)(長的、低Tm、AT豐富的)。出人意料地,新設(shè)計(jì)的引物導(dǎo)致在多重反應(yīng)中的STR和SNP的擴(kuò)增之間的更好的平衡。圖4示出了多重反應(yīng)中的常規(guī)和非常規(guī)設(shè)計(jì)的引物之間的相互影響的實(shí)例。在圖4A中,10種SNP靶的多重反應(yīng)顯示在用于文庫的約200-350bp的期望范圍內(nèi)的預(yù)期擴(kuò)增。用來多重地?cái)U(kuò)增10種SNP的引物被設(shè)計(jì)成是更長的,具有更低的Tm且是更AT豐富的,這是被已建立的PCR引物設(shè)計(jì)標(biāo)準(zhǔn)建議的。當(dāng)?shù)?1種引物對(duì)使用已建立的PCR設(shè)計(jì)標(biāo)準(zhǔn)(即,引物是短的,具有高的Tm且不是AT豐富的)來設(shè)計(jì)并被添加至10對(duì)時(shí),所得的多重復(fù)用顯示靶DNA的非特異性擴(kuò)增。如在圖4B和4D中所見,第11種常規(guī)設(shè)計(jì)的引物對(duì)的添加干擾10種非常規(guī)引物對(duì)并導(dǎo)致靶向的SNP的不成功的多重?cái)U(kuò)增。然而,也是遵循與10種引物對(duì)相同標(biāo)準(zhǔn)非常規(guī)設(shè)計(jì)的第11種引物對(duì)的添加導(dǎo)致SNP靶的成功擴(kuò)增(圖4C)。因此,在一些實(shí)施方案中,多種引物的每種具有低的解鏈溫度,例如,小于60℃或約50℃至約60℃,和/或具有至少24個(gè)核苷酸的長度,例如,約24個(gè)核苷酸至約38個(gè)核苷酸。在一些實(shí)施方案中,多種引物的每種包含同聚物核苷酸序列。在一些實(shí)例中,非常規(guī)設(shè)計(jì)的引物包含在靶向的STR和SNP側(cè)翼的序列以及另外的非模板序列。另外的序列可以是,例如,在文庫制備或測序方法期間服務(wù)一定目的的標(biāo)簽序列。例如,標(biāo)簽序列可以是捕獲序列,諸如可通過用于純化文庫片段的固定化伴侶部分捕獲的半抗原部分。半抗原部分的實(shí)例是可通過用于從反應(yīng)組分等分離文庫片段的鏈霉親和素捕獲的生物素。標(biāo)簽序列還可以是擴(kuò)增序列,例如,該擴(kuò)增序列與擴(kuò)增引物互補(bǔ)并被用于一個(gè)或更多個(gè)擴(kuò)增反應(yīng)。圖2和3示出了在第一輪擴(kuò)增后的第二輪擴(kuò)增中使用的標(biāo)簽序列的實(shí)例。標(biāo)簽序列也可以是序列標(biāo)簽。圖2和3還示出了序列標(biāo)簽的實(shí)例,在測序中,i5銜接子和i7銜接子被用作如本文描述的合成測序反應(yīng)期間的雜交、簇生成和測序引物。標(biāo)簽序列的另一個(gè)實(shí)例是獨(dú)特分子標(biāo)識(shí)符或UMI,如圖3中所示。UMI包含可在測序期間被使用以校正PCR和測序誤差的隨機(jī)核苷酸段,從而將另外層次的誤差校正添加至測序結(jié)果。UMI可為從,例如,3-10個(gè)核苷酸長,然而數(shù)目將取決于輸入DNA的量。例如,如果使用1ngDNA以靶向約250個(gè)位點(diǎn),則預(yù)期將需要約350個(gè)拷貝x250個(gè)靶,所以約90,000個(gè)不同的UMI。如果采用更多的DNA,例如,10ng,則可能需要約1百萬個(gè)不同的UMI。來自同一PCR反應(yīng)的所有PCR重復(fù)將具有相同的UMI序列,因此,可將重復(fù)進(jìn)行比較,且序列中的任何誤差,諸如單個(gè)堿基取代、缺失、插入(即,PCR中的掃描殘跡)可經(jīng)生物信息學(xué)從測序結(jié)果中排除。獨(dú)特分子標(biāo)識(shí)符也可被用于混合的樣品的分析中?;旌系臉悠罚?,被雄性DNA污染的雌性DNA樣品,可使用UMI序列被解卷積以報(bào)告雌性DNA和雄性DNA貢獻(xiàn)兩者。例如,對(duì)于兩種混合的DNA,可存在總計(jì)四種不同的重復(fù)數(shù)目;然而,如果兩種樣品的混合物共享在特定基因座處的等位基因,則可存在少于四種。可使用用于確定DNA分子的初始群體中的不同等位基因的數(shù)目的UMI區(qū)分這些共享的等位基因并確定近似百分比。例如,初始分子可被計(jì)數(shù),并且如果較少貢獻(xiàn)者以,例如,5%存在,則5%的UMI將鑒定一種基因型,且95%將鑒定第二基因型。在PCR之后,如果在擴(kuò)增后等位基因中的一個(gè)(或也許更多個(gè))是偏倚的,則將觀察不到5:95的比率。然而,在使用UMI檢測和校正精簡PCR重復(fù)之后,可使用UMI校正偏比。當(dāng)試圖區(qū)分來自PCR的掃描殘跡假象和真正的較小貢獻(xiàn)者時(shí),這是重要的。本發(fā)明方法的引物可包含一種或更多種標(biāo)簽序列。標(biāo)簽序列可以是與靶序列不同源的一個(gè)或更多個(gè)引物序列,但例如可被用作用于一個(gè)或更多個(gè)擴(kuò)增反應(yīng)的模板。標(biāo)簽序列可以是捕獲序列,例如半抗原序列諸如可被用來純化擴(kuò)增子以與反應(yīng)組分分開的生物素。標(biāo)簽序列可以是諸如銜接子序列的序列,該銜接子序列有利于捕獲在基底上的文庫擴(kuò)增子,例如,用于如本文描述的合成測序技術(shù)的預(yù)期中的橋式擴(kuò)增。此外,標(biāo)簽序列可以是通常在,例如3-10個(gè)核苷酸之間的,構(gòu)成可在文庫制備和/或測序方法期間被用于誤差校正的隨機(jī)核苷酸段的獨(dú)特分子標(biāo)識(shí)符標(biāo)簽。另外,對(duì)于多重PCR反應(yīng),包含寡核苷酸引物以將基本上所有的靶一起匯集成一種混合物是有利的。然而,如本文公開的,寡核苷酸一反常態(tài)地長于使用傳統(tǒng)參數(shù)設(shè)計(jì)的引物。標(biāo)簽序列至引物的進(jìn)一步添加,諸如附加基因靶特異性序列的UMI的添加創(chuàng)建仍更長的引物序列。在一些實(shí)施方案中,可將甘氨酸甜菜堿(約1.5M)添加至多種引物。例如,在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液包含如下的甜菜堿濃度,該甜菜堿濃度為、為約或多于100mM、200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1M、1.2M、1.3M、1.4M、1.5M、1.6M、1.7M、1.8M、1.9M、2M、3M、4M、5M、6M、7M、8M、9M、10M、或在這些值的任何兩個(gè)之間的范圍,例如,從500mM至2M、從1M至1.5M等等。因此,當(dāng)實(shí)踐本公開內(nèi)容的方法時(shí),如本文描述的用例如,以約1.5M甜菜堿補(bǔ)充的引物混合物將是有利的。在一些實(shí)施方案中,可將甜菜堿添加至多種引物。例如,在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液包含如下的甘油濃度,該甘油濃度為、為約或多于100mM、200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1M、1.2M、1.3M、1.4M、1.5M、1.6M、1.7M、1.8M、1.9M、2M、3M、4M、5M、6M、7M、8M、9M、10M,或在這些值的任何兩個(gè)之間的范圍,例如,從500mM至2M、從1M至1.5M等等。因此,當(dāng)實(shí)踐本公開內(nèi)容的方法時(shí),如本文描述的用例如,以約1.5M甘油補(bǔ)充的引物混合物將是有利的。在一些實(shí)施方案中,還可修改與在本公開內(nèi)容的擴(kuò)增方法中使用的非常規(guī)引物設(shè)計(jì)相關(guān)的緩沖液。例如,在一些實(shí)施方案中,與連同常規(guī)設(shè)計(jì)的引物一起使用的擴(kuò)增緩沖液的鹽濃度相比,擴(kuò)增緩沖液的鹽濃度,諸如KCl、LiCl、NaCl或其組合增加。在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液包含以下KCl濃度,該KCl濃度為、為約或多于60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mM、或在這些值的任何兩個(gè)之間的范圍,例如,從60mM至200mM、從100mM至250mM,等等。在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液包含為約145mM的KCl濃度。在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液包含以下LiCl濃度,該LiCl濃度為、為約或多于60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mM、或在這些值的任何兩個(gè)之間的范圍,例如,從60mM至200mM、從100mM至250mM,等等。在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液包含為約145mM的LiCl濃度。在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液包含以下NaCl濃度,該NaCl濃度為、為約或多于60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mM,或在這些值的任何兩個(gè)之間的范圍,例如,從60mM至200mM、從100mM至250mM,等等。在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液包含為約145mM的NaCl濃度。在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液可包含MgSO4、MgCl2或其組合。試劑盒本文公開的實(shí)施方案提供了試劑盒,所述試劑盒包含至少一種容器裝置,其中該至少一種容器裝置包含如本文公開的多種引物。在一些實(shí)施方案中,容器裝置可以是管、孔、微量滴定板等等。在一些實(shí)施方案中,多種引物可與為、為約或多于以下的許多串聯(lián)重復(fù)序列特異性雜交:4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100,或者在任何兩個(gè)值之間的范圍,諸如4至12、10至24、30至100,等等。在一些實(shí)施方案中,多種引物可與至少24種串聯(lián)重復(fù)序列特異性雜交。在一些實(shí)施方案中,多種引物可與至少60種串聯(lián)重復(fù)序列特異性雜交。本文公開的方法及組合物可被用來在單個(gè)反應(yīng)中擴(kuò)增多種SNP靶序列。例如,多種引物可與為、為約或多于以下的許多SNP序列特異性雜交:4、6、8、10、12、14、16、18、24、30、40、50、60、70、80、90、100或者在任何兩個(gè)值之間的范圍,諸如4至12、10至24、30至100,等等。在一些實(shí)施方案中,多種引物可與至少30種SNP序列特異性雜交。在一些實(shí)施方案中,多種引物可與至少50種SNP序列特異性雜交。在一些實(shí)施方案中,至少一個(gè)容器裝置包含擴(kuò)增緩沖液。在一些實(shí)施方案中,還可修改與在本公開內(nèi)容的擴(kuò)增方法中使用的非常規(guī)引物設(shè)計(jì)相關(guān)的緩沖液。例如,在一些實(shí)施方案中,與連同常規(guī)設(shè)計(jì)的引物一起使用的擴(kuò)增緩沖液的鹽濃度相比,擴(kuò)增緩沖液的鹽濃度,諸如KCl、LiCl、NaCl或其組合增加。在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液包含以下KCl、NaCl或LiCl濃度,該KCl、NaCl或LiCl濃度為、為約或多于60mM、70mM、80mM、90mM、100mM、110mM、120mM、130mM、140mM、150mM、160mM、170mM、180mM、190mM、200mM、250mM、300mM、400mM、500mM,或在這些值的任何兩個(gè)之間的范圍,例如,從60mM至200mM、從100mM至250mM,等等。在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液包含為約145mM的KCl、NaCl或LiCl濃度。在一些實(shí)施方案中,在用如本文公開的非常規(guī)引物的擴(kuò)增反應(yīng)中使用的擴(kuò)增緩沖液可包含MgSO4、MgCl2或其組合。測序方法本發(fā)明方法不限于任何特定的測序平臺(tái),然而,本文關(guān)于SBS或合成測序例示了并行測序的類型。特別可適用的技術(shù)是以下的那些:其中核酸被附加在陣列中的固定位置處,使得它們的相對(duì)位置不改變且其中陣列被反復(fù)成像。其中以不同顏色通道獲得圖像的實(shí)例是特別可適用的,所述不同顏色通道例如,與用于區(qū)分一種核苷酸堿基類型與另一種的不同標(biāo)記物相符。SBS技術(shù)通常包括通過迭代添加針對(duì)模板鏈的核苷酸來酶促延伸新生核酸鏈。在傳統(tǒng)的SBS方法中,在每個(gè)遞送中在聚合酶的存在下,可提供針對(duì)靶核苷酸的單個(gè)核苷酸單體。然而,在本文描述的方法中,在每個(gè)遞送中在聚合酶的存在下,可提供針對(duì)靶核酸的多于一種類型的核苷酸單體。SBS技術(shù)可采用具有標(biāo)記物部分的核苷酸單體或缺失標(biāo)記物部分的那些。因此,摻入事件可基于以下來檢測:標(biāo)記物的特性,諸如標(biāo)記物的熒光;核苷酸單體的特性,諸如分子量或電荷;摻入核苷酸的副產(chǎn)物,諸如釋放的焦磷酸鹽;等。在其中兩個(gè)或更多個(gè)不同的核苷酸存在于測序試劑中的一些實(shí)例中,不同的核苷酸可以是彼此可區(qū)分的,或可選地,兩個(gè)或更多個(gè)不同的標(biāo)記物可在使用的檢測技術(shù)下是難區(qū)分的。例如,存在于測序試劑中的不同的核苷酸可具有不同的標(biāo)記物,并且它們可使用適當(dāng)?shù)墓鈱W(xué)器件來區(qū)分,如通過由Solexa(現(xiàn)為Illumina,Inc.)開發(fā)的測序方法例示的。一些實(shí)例包括焦磷酸測序技術(shù)。焦磷酸測序檢測隨特定核苷酸被摻入到新生鏈釋放的無機(jī)焦磷酸(PPi)(Ronaghi,M.,Karamohamed,S.,Pettersson,B.,Uhlen,M.和Nyren,P.(1996)"Real-timeDNAsequencingusingdetectionofpyrophosphaterelease."AnalyticalBiochemistry242(1),84-9;Ronaghi,M.(2001)"PyrosequencingshedslightonDNAsequencing."GenomeRes.11(1),3-11;Ronaghi,M.,Uhlen,M.andNyren,P.(1998)"Asequencingmethodbasedonreal-timepyrophosphate."Science281(5375),363;美國專利號(hào)6,210,891;美國專利號(hào)6,258,568以及美國專利號(hào)6,274,320,其公開內(nèi)容通過引用以其整體并入本文)。在焦磷酸測序中,釋放的PPi可通過立即被ATP硫酸化酶轉(zhuǎn)化成腺苷三磷酸(ATP)來檢測,并且產(chǎn)生的ATP的水平經(jīng)由螢光素酶產(chǎn)生的質(zhì)子來檢測。待測序的核酸可被附連至在陣列中的特征,并且可將陣列成像以捕獲由于核苷酸在陣列的特征處的摻入產(chǎn)生的化學(xué)發(fā)光信號(hào)。在陣列用特定核苷酸類型(例如,A、T、C或G)處理之后,可獲得圖像。在添加每個(gè)核苷酸類型之后獲得的圖像將在陣列中哪個(gè)特征被檢測到的方面不同。圖像中的這些差異反映陣列上的特征的不同序列內(nèi)容。然而,每個(gè)特征的相對(duì)位置將在圖像中保持不變。圖像可使用本文陳述的方法來儲(chǔ)存、處理并分析。例如,在用每種不同核苷酸類型處理陣列之后獲得的圖像可以以與本文例示的用于從基于可逆終止子的測序方法的不同檢測通道獲得的圖像相同的方式來處理。在SBS的另一個(gè)實(shí)例中,循環(huán)測序通過逐步添加包含以下的可逆終止子核苷酸來完成:例如,如,例如,在WO04/018497和美國專利號(hào)7,057,026中描述的可切割或可光漂白的染料標(biāo)記物,其公開內(nèi)容通過引用并入本文。該方法被Solexa(現(xiàn)為IlluminaInc.)商業(yè)化,并且被描述于WO91/06678和WO07/123,744中,其中的每個(gè)通過引用并入本文。其中終止可被翻轉(zhuǎn)且熒光標(biāo)記物被切割的熒光標(biāo)記的終止子的可用性促進(jìn)高效循環(huán)可逆終止(cyclicreversibletermination,CRT)測序。聚合酶還可被共工程化,以高效摻入并延伸這些修飾的核苷酸??膳c本文描述的方法和系統(tǒng)一起使用的另外的示例性SBS系統(tǒng)和方法被描述于美國專利申請(qǐng)公布號(hào)2007/0166705、美國專利申請(qǐng)公布號(hào)2006/0188901、美國專利號(hào)7,057,026、美國專利申請(qǐng)公布號(hào)2006/0240439、美國專利申請(qǐng)公布號(hào)2006/0281109、PCT公布號(hào)WO05/065814、美國專利申請(qǐng)公布號(hào)2005/0100900、PCT公布號(hào)WO06/064199、PCT公布號(hào)WO07/010,251、美國專利申請(qǐng)公布號(hào)2012/0270305以及美國專利申請(qǐng)公布號(hào)2013/0260372中,其公開內(nèi)容通過引用以其整體并入本文。一些實(shí)例可采用使用少于四種不同標(biāo)記物檢測四種不同的核苷酸。例如,SBS可采用在美國專利申請(qǐng)公布號(hào)2013/0079232的并入的材料中描述的方法和系統(tǒng)來進(jìn)行。作為第一實(shí)例,一對(duì)核苷酸類型可在相同波長進(jìn)行檢測,但基于對(duì)該對(duì)的一個(gè)成員相比于另一個(gè)的強(qiáng)度差異,或基于該對(duì)的一個(gè)成員的變化(例如,經(jīng)由化學(xué)修飾、光化學(xué)修飾或物理修飾)進(jìn)行區(qū)分,該變化引起相比于該對(duì)的另一個(gè)成員檢測的信號(hào)的明顯信號(hào)出現(xiàn)或消失。作為第二實(shí)例,可在特定條件下檢測四種不同核苷酸類型中的三種,同時(shí)第四種核苷酸類型缺乏在那些條件下可被檢測到的標(biāo)記物,或在那些條件下被最低限度檢測到(例如,由于背景熒光的最低限度檢測(minimaldetection)等等)。前三種核苷酸類型向核酸的摻入可基于它們各自信號(hào)的存在來確定,且第四核苷酸類型向核酸的摻入可基于任何信號(hào)的不存在或最低限度檢測來確定。作為第三實(shí)例,一種核苷酸類型可包括在兩個(gè)不同通道中被檢測到的標(biāo)記物,而其他核苷酸類型在這些通道的不超過一個(gè)通道中被檢測到。前述提及的三種示例性構(gòu)型不被視為是相互排斥的,且可以以多種組合一起使用。將所有三個(gè)實(shí)例組合的示例性實(shí)施方案是基于熒光的SBS方法,該基于熒光的SBS方法使用在第一通道被檢測到的第一核苷酸類型(例如dATP具有當(dāng)被第一激發(fā)波長激發(fā)時(shí)在第一通道被檢測到的標(biāo)記物)、在第二通道被檢測到的第二核苷酸類型(例如dCTP具有當(dāng)被第二激發(fā)波長激發(fā)時(shí)在第二通道被檢測到的標(biāo)記物)、在第一通道和第二通道兩者中被檢測到的第三核苷酸類型(例如dTTP具有當(dāng)被第一和/或第二激發(fā)波長激發(fā)時(shí)在兩個(gè)通道中被檢測到的至少一個(gè)標(biāo)記物)、以及在任一通道未被檢測到或最低限度被檢測到的缺乏標(biāo)記物的第四核苷酸類型(例如dGTP不具有標(biāo)記物)。此外,如在美國專利申請(qǐng)公布號(hào)2013/0079232的并入的材料中描述的,測序數(shù)據(jù)可使用單個(gè)通道來獲得。在此類所謂的單染料(one-dye)測序方法中,第一核苷酸類型被標(biāo)記但標(biāo)記物在第一圖像生成之后被去除,且第二核苷酸類型僅在第一圖像生成之后被標(biāo)記。第三核苷酸類型在第一和第二圖像兩者中均保留其標(biāo)記物,且第四核苷酸類型在兩個(gè)圖像中保持未被標(biāo)記。一些實(shí)例可采用連接測序技術(shù)。此類技術(shù)采用DNA連接酶以摻入寡核苷酸并鑒定此類寡核苷酸的摻入。寡核苷酸通常具有與該寡核苷酸雜交的序列中的特定核苷酸的身份相關(guān)的不同的標(biāo)記物。如同其他SBS方法,可在用標(biāo)記的測序試劑處理核酸特征的陣列之后獲得圖像。每個(gè)圖像將顯示具有摻入的特定類型的標(biāo)記物的核酸特征。由于每個(gè)特征的不同的序列內(nèi)容,不同的特征將存在于或不存在于不同的圖像中,但特征的相對(duì)位置將在圖像中保持不變。由基于連接的測序方法獲得的圖像可如本文陳述來儲(chǔ)存、處理和分析??膳c本文描述的方法和系統(tǒng)一起采用的示例性SBS系統(tǒng)和方法被描述于美國專利號(hào)6,969,488、美國專利號(hào)6,172,218以及美國專利號(hào)6,306,597,其公開內(nèi)容通過引用以其整體并入本文。一些實(shí)例可采用納米孔測序(Deamer,D.W.&Akeson,M."Nanoporesandnucleicacids:prospectsforultrarapidsequencing."TrendsBiotechnol.18,147-151(2000);Deamer,D.和D.Branton,"Characterizationofnucleicacidsbynanoporeanalysis".Acc.Chem.Res.35:817-825(2002);Li,J.,M.Gershow,D.Stein,E.Brandin,和J.A.Golovchenko,"DNAmoleculesandconfigurationsinasolid-statenanoporemicroscope"Nat.Mater.2:611-615(2003),其公開內(nèi)容通過引用以其整體并入本文)。在此類實(shí)施方案中,靶核酸通過納米孔。納米孔可以是合成的孔或生物膜蛋白,諸如α-溶血素。當(dāng)靶核酸通過納米孔時(shí),每個(gè)堿基對(duì)可通過測量孔的電導(dǎo)率的波動(dòng)來鑒定。(美國專利號(hào)7,001,792;Soni,G.V.&Meller,"A.ProgresstowardultrafastDNAsequencingusingsolid-statenanopores."Clin.Chem.53,1996-2001(2007);Healy,K."Nanopore-basedsingle-moleculeDNAanalysis."Nanomed.2,459-481(2007);Cockroft,S.L.,Chu,J.,Amorin,M.&Ghadiri,M.R."Asingle-moleculenanoporedevicedetectsDNApolymeraseactivitywithsingle-nucleotideresolution."J.Am.Chem.Soc.130,818-820(2008),其公開內(nèi)容通過引用以其整體并入本文)。從納米孔測序獲得的數(shù)據(jù)可如本文陳述來儲(chǔ)存、處理和分析。特別地,可根據(jù)本文陳述的光學(xué)圖像和其他圖像的示例性處理,將數(shù)據(jù)處理為圖像。一些實(shí)例可采用包括DNA聚合酶活性的實(shí)時(shí)監(jiān)測的方法。核苷酸摻入可通過如被描述于,例如,美國專利號(hào)7,329,492和美國專利號(hào)7,211,414(其中的每一個(gè)通過引用并入本文)中的載有熒光團(tuán)的聚合酶和γ-磷酸標(biāo)記的核苷酸之間的熒光共振能量轉(zhuǎn)移(FRET)相互作用來檢測,或者核苷酸摻入可用如被描述于,例如,美國專利號(hào)7,315,019(其通過引用并入本文)中的零模波導(dǎo)以及使用如被描述于,例如,美國專利號(hào)7,405,281及美國專利申請(qǐng)公布號(hào)2008/0108082(其中的每一個(gè)通過引用并入本文)的熒光核苷酸類似物和工程化聚合酶來檢測。光照可被限制于在表面栓系的(surface-tethered)聚合酶周圍的仄升(zeptoliter)-規(guī)模體積,使得熒光標(biāo)記的核苷酸的摻入可以以低背景來觀察(Levene,M.J.等"Zero-modewaveguidesforsingle-moleculeanalysisathighconcentrations."Science299,682-686(2003);Lundquist,P.M.等"Parallelconfocaldetectionofsinglemoleculesinrealtime."Opt.Lett.33,1026-1028(2008);Korlach,J.等"SelectivealuminumpassivationfortargetedimmobilizationofsingleDNApolymerasemoleculesinzero-modewaveguidenanostructures."Proc.Natl.Acad.Sci.USA105,1176–1181(2008),其公開內(nèi)容通過引用以其整體并入本文)。由此類方法獲得的圖像可如本文陳述來儲(chǔ)存、處理和分析。一些SBS實(shí)施方案包括檢測將核苷酸摻入延伸產(chǎn)物后釋放的質(zhì)子。例如,基于檢測釋放的質(zhì)子的測序可使用電子檢測器和從IonTorrent(Guilford,CT,aLifeTechnologiessubsidiary)商業(yè)可得的相關(guān)技術(shù),或在US2009/0026082A1;US2009/0127589A1;US2010/0137143A1;或US2010/0282617A1中描述的測序方法和系統(tǒng),其中的每一個(gè)通過引用并入本文。本文陳述的用于使用動(dòng)力學(xué)排除擴(kuò)增靶核酸的方法可容易地應(yīng)用于被用來檢測質(zhì)子的基底。更具體地,本文陳述的方法可被用來產(chǎn)生用來檢測質(zhì)子的擴(kuò)增子的克隆群體。以上的SBS方法可以以使多種不同的靶核酸同時(shí)操作的多重格式有利地進(jìn)行。在特定的實(shí)施方案中,不同的靶核酸可以在共同反應(yīng)容器中或在特定基底的表面上被處理。這允許以多重方式便利遞送測序試劑、去除未反應(yīng)的試劑以及檢測摻入事件。在使用表面結(jié)合的靶核酸的實(shí)施方案中,靶核酸可呈陣列格式。在陣列格式中,靶核酸可通常以空間上可區(qū)分的方式與表面結(jié)合。靶核酸可通過直接共價(jià)附連、與珠或其他顆粒附連或者與被附連至表面的聚合酶或其他分子結(jié)合來結(jié)合。陣列可包括在每個(gè)位點(diǎn)(還稱為特征)處的單拷貝的靶核酸或者具有相同序列的多個(gè)拷貝可存在于每個(gè)位點(diǎn)或特征處。多個(gè)拷貝可通過擴(kuò)增方法,諸如,如在下文進(jìn)一步詳細(xì)描述的橋式擴(kuò)增或乳液PCR來產(chǎn)生。本公開內(nèi)容的方法采用Illumina,Inc.技術(shù),以用于測序通過實(shí)踐本文描述的方法創(chuàng)建的DNA譜文庫。MiSeq測序儀被用于本文描述的實(shí)例的成簇和測序。然而,如先前陳述的和如本領(lǐng)域技術(shù)人員理解的,本發(fā)明方法不受使用的測序平臺(tái)的類型限制。實(shí)施例以下實(shí)施例公開了用于DNA譜系分析的數(shù)種方法及材料。可對(duì)這些方法及材料進(jìn)行修改,同時(shí)保持本發(fā)明的精神和范圍。依據(jù)本公開內(nèi)容的考慮或本文公開的方法的實(shí)踐,此類修改對(duì)本領(lǐng)域技術(shù)人員將變得明顯。因此,不意圖這些方法或材料被限制于本文公開的具體實(shí)施例,但它覆蓋落入本公開內(nèi)容的范圍和精神內(nèi)的所有修改和可選方案。實(shí)施例1-非常規(guī)引物設(shè)計(jì)來自Illumina,Inc.(SanDiego,CA)的計(jì)算機(jī)設(shè)計(jì)程序DesignStudio被修改并用于引物設(shè)計(jì)。當(dāng)然,本領(lǐng)域技術(shù)人員將理解,還可使用可選的引物設(shè)計(jì)程序諸如Primer3,并且將缺省參數(shù)重置以模仿修改參數(shù)用于引物設(shè)計(jì)的意圖。設(shè)置通常在軟件自帶的config.xml文件中被重置,然而,當(dāng)使用不同的軟件時(shí)這可不同,且典型的做法是咨詢具體材料以訪問每個(gè)軟件的缺省參數(shù)。以下參數(shù)可在引物設(shè)計(jì)軟件中被重置:1)期望的最小長度的擴(kuò)增子重置為>60<2)期望的最大長度的擴(kuò)增子重置為>120<3)緊密的候選間距重置為>3<(缺省為30bp)4)%GC最大探針重置為>60<,以允許增加AT豐富的重復(fù)段的數(shù)目5)平均Tm重置為>57<(缺省為59C),以降低平均Tm6)最大的Tm重置為>60<(缺省為71)7)最小的Tm重置為>51<(缺省為55)8)平均探針長度重置為>28<(缺省為27)9)最大的探針長度重置為>38<(缺省為30)10)最小的探針長度重置為>25<(缺省為22)對(duì)于設(shè)計(jì)SNP引物,用于引物的3’末端的靶的范圍設(shè)置為“小的”,以保持引物距離靶向的SNP約1bp。在所有的參數(shù)重置后,可對(duì)序列運(yùn)行引物設(shè)計(jì)程序,以確定落入新參數(shù)下的引物對(duì)候選者。例如,軟件的使用者可生成靶列表,其告訴軟件訪問基因組哪里,以用于設(shè)計(jì)引物。在本實(shí)施例中,靶向的區(qū)域被拷貝并粘貼到DesignStudio軟件用來定位和靶向引物設(shè)計(jì)的圖形用戶界面應(yīng)用程序。在將靶向的區(qū)域輸入進(jìn)程序后,程序指導(dǎo)創(chuàng)建Design文件以啟動(dòng)工具并創(chuàng)建引物設(shè)計(jì)。在本實(shí)施例中,主要的輸出是.txt文件,該.txt文件包括引物序列和/或一些包含失敗且是“不可設(shè)計(jì)(undesignable)”的區(qū)域,在該點(diǎn)靶向的序列需要被重新定義并重新運(yùn)行。在本實(shí)驗(yàn)中使用的軟件提供映射到被指定為靶向的區(qū)域的序列上的設(shè)計(jì)的引物。遵循重置的參數(shù),設(shè)計(jì)用于擴(kuò)增的不遵循常規(guī)引物設(shè)計(jì)標(biāo)準(zhǔn)的引物;然而,這允許長STR和短SNP的多重?cái)U(kuò)增。在本文公開的方法中有利的設(shè)計(jì)的STR靶向的引物的實(shí)例包括在表1中列出的那些。在本文公開的方法中有利的SNP靶向的引物的實(shí)例包括在表2中列出的那些。表1-無標(biāo)簽的STR靶向的引物及擴(kuò)增子尺寸表2-SNP靶向的引物實(shí)施例2-用于數(shù)據(jù)庫分析的DNA譜系分析本實(shí)施例描述遵循圖2的工作流程的實(shí)驗(yàn)。由于可假定,獲得的樣品來自其身份已知的個(gè)體,本實(shí)施例不采用UMI。對(duì)于該實(shí)驗(yàn),STR用如在表3中發(fā)現(xiàn)的iSNP多重復(fù)用。表3-身份信息SNP和STR常染色體STR當(dāng)然,另外的SNP和STR可被添加至以上的列表。其他潛在靶的實(shí)例包括,但不限于,在表4中發(fā)現(xiàn)的那些標(biāo)志物。表4-用于多重復(fù)用的另外的STR和SNP的實(shí)例引物被設(shè)計(jì)成包含在3’末端處的基因特異的PCR引物序列和在5’末端處的銜接子標(biāo)簽序列。在該實(shí)驗(yàn)中,正向引物包含用于TruSeqCustom擴(kuò)增子i5銜接子的標(biāo)簽序列,且反向引物包含用于TruSeq小RNA試劑盒i7銜接子的標(biāo)簽序列。標(biāo)簽可被用作擴(kuò)增引物位點(diǎn),以及測序引物位點(diǎn)。連接物i5標(biāo)簽序列5’TACACGACGCTCTTCCGATCT3’(SEQIDNO:403)連接物i7標(biāo)簽序列5’CTTGGCACCCGAGAATTCCA3’(SEQIDNO:404)為平衡在多重中的STR和SNP之間的擴(kuò)增,如在實(shí)施例1中描述的修改SNP的引物設(shè)計(jì)參數(shù)。使用Illumina的DesignStudio設(shè)計(jì)的原始集合的SNP引物是典型的PCR引物-具有高解鏈溫度且?guī)缀鯖]有二級(jí)結(jié)構(gòu)的短序列。DesignStudio被用來設(shè)計(jì)TruSeqCustom擴(kuò)增子探針并創(chuàng)建下游探針的反向互補(bǔ)物,以制備反向PCR引物。然而,這些引物不能良好地多重復(fù)用,且一個(gè)劣質(zhì)引物可能將測定從好的轉(zhuǎn)為劣質(zhì)的(例如,全部為引物二聚體及無產(chǎn)物)(圖4)。在創(chuàng)建用于多重復(fù)用的更好引物的嘗試中,使用包含錯(cuò)誤引發(fā)文庫特征的Primer3(共享軟件)。發(fā)現(xiàn)Primer3設(shè)計(jì)的引物比DesignStudio引物在多重測定中表現(xiàn)得甚至更差。出人意料地,生成的數(shù)據(jù)顯示,STR引物是多重復(fù)用良好的。觀察到,針對(duì)STR靶不良設(shè)計(jì)的引物對(duì)沒有像SNP引物那樣引起多重復(fù)用失敗。與被稱為“良好”的引物不同,STR引物是長的、AT豐富的,并具有低的解鏈溫度。SNP引物遵循實(shí)施例1的參數(shù)被重新設(shè)計(jì)。將用于所有靶的引物混合在一起。對(duì)于本實(shí)施例,將用于56種STR的引物對(duì)與用于75種iSNP、aSNP及表型信息SNP的引物對(duì)混合。將聚合酶(在本實(shí)施例中為熱啟動(dòng)PhusionII)添加至PCR所需的所有組分的主混合物,并添加引物。將混合物用移液器吸取進(jìn)PCR板的孔中,但,擴(kuò)增還可在管等中進(jìn)行。將DNA以在15微升體積中的純化的DNA添加至板,然而,還可使用來自拭子或未處理的濾紙的血液或口腔樣品或者直接來自FTA卡上的血液或口腔樣品等的裂解提取物。對(duì)于該實(shí)驗(yàn),純化的對(duì)照2800MDNA以1ng和100pg來使用。使反應(yīng)物經(jīng)歷按照以下方案的確定數(shù)目循環(huán)(在本實(shí)施例的情況下,25個(gè)循環(huán))的PCR:在循環(huán)之后,將板從熱循環(huán)儀中取出。用以下使反應(yīng)物至50微升:聚合酶(KapaHiFi,KapaBiosystems)、包含PCR所需的所有組分的PCR主混合物以及一對(duì)銜接子(一個(gè)為i7銜接子且一個(gè)為i5銜接子)。將第二輪PCR進(jìn)行按照以下方案的確定數(shù)目的循環(huán)(在本實(shí)施例的情況下為10個(gè)循環(huán)),以生成測序文庫:在循環(huán)之后,將包含完成的文庫的板從熱循環(huán)儀中取出。這時(shí),可將樣品以體積匯集并使用例如磁珠(SPRI)進(jìn)行純化為單一樣品。樣品還可被單獨(dú)地純化。池(pool)或單獨(dú)的文庫可通過使用基于qPCR的方法、通過使用片段分析儀(FragmentAnalyzer)或BioAnalyzer或通過使用PicoGreen和板閱讀器(如在本實(shí)施例的情況一樣)進(jìn)行定量。熟練的技術(shù)人員將知道許多用于文庫定量的選項(xiàng)。如果文庫被單獨(dú)地純化,它們可被歸一化至每個(gè)濃度2nM,并以體積匯集。將純化的文庫的池變性、稀釋、成簇并以350個(gè)循環(huán)測序運(yùn)行及兩個(gè)索引讀段(indexread)在MiSeq測序儀上測序。在測序之后,使樣品根據(jù)銜接子序列解多重復(fù)用,并通過取證基因組管道(ForensicsGenomicspipeline)(Illumina,Inc.)進(jìn)行分析。將STR讀段與SNP讀段分離,并獨(dú)立地進(jìn)行分析。STR使用在先專利申請(qǐng)(PCT/US2013/30867,通過引用以其整體并入本文)中描述的算法進(jìn)行分析。重復(fù)數(shù)目和任何序列變異連同讀段數(shù)目一起被報(bào)告。SNP使用清單(manifest)進(jìn)行分析,且調(diào)用連同讀段數(shù)目一起被報(bào)告。計(jì)算STR基因座的等位基因之間的相對(duì)平衡(最小/最大%)、基因座之間的平衡(%CV)、誤差率以及掃描殘跡率。初始數(shù)據(jù)庫分析多重中的STR的結(jié)果示于圖5A-C中。平衡(平均平衡80%)、掃描殘跡(~3%)及誤差率(小于5%)滿足針對(duì)被包括在本實(shí)施例中的基因座的設(shè)計(jì)輸入要求。%CV(~142%)使用所有56個(gè)基因座來計(jì)算。盡管所用的引物顯示基因座間平衡,預(yù)期了另外的引物優(yōu)化以改進(jìn)基因座間平衡。對(duì)于已知基因座的調(diào)用匹配對(duì)于2800M的發(fā)表結(jié)果。對(duì)于SNP的結(jié)果示于圖5D-E中。對(duì)于在大的多重中的56個(gè)STR基因座的覆蓋、等位基因調(diào)用及其他假象示于圖6中。這些圖模擬由CE技術(shù)產(chǎn)生的電泳圖。柱類似于對(duì)于指定的等位基因的峰(X軸),且讀段計(jì)數(shù)(Y軸)類似于RFU。取決于SNP,對(duì)于SNP的覆蓋是從10-2500X的任何處,然而,被多重復(fù)用的每個(gè)SNP被計(jì)數(shù)并提供準(zhǔn)確調(diào)用。實(shí)施例3-用于刑事案件的DNA譜系分析本實(shí)施例描述遵循圖3的工作流程的實(shí)驗(yàn)。由于可假定獲得的樣品來自其身份尚未知曉的個(gè)體,本實(shí)施例將UMI摻入引物。對(duì)于該實(shí)驗(yàn),STR用如見于表5中的iSNP、aSNP及表型信息SNP多重復(fù)用。表5-案件工作STR和SNP本實(shí)施例將UMI摻入STR引物。對(duì)于這些實(shí)例,僅STR引物包含UMI,然而,如果需要,STR引物和SNP引物兩者可包括UMI,且實(shí)踐中不排除該選項(xiàng)。然而,對(duì)于本實(shí)施例,出于證實(shí)的目的,僅STR引物摻入U(xiǎn)MI。在兩個(gè)循環(huán)的PCR期間,引入獨(dú)特分子標(biāo)識(shí)符(圖3)。首先,如同對(duì)于實(shí)施例2,PCR引物包含在3’末端處的基因特異性PCR引物序列和在5’末端處的銜接子標(biāo)簽序列,與在實(shí)施例2中對(duì)于i5和i7序列使用的標(biāo)簽序列相同。在該實(shí)驗(yàn)中,UMI被放置在基因特異性引物序列和標(biāo)簽序列之間。在本實(shí)施例的情況下,存在用于針對(duì)正向引物和反向引物兩者上的UMI的五種隨機(jī)堿基。將對(duì)于所有靶的引物混合在一起。引物混合物包括26種常染色體STR引物對(duì)和86種SNP引物對(duì)(覆蓋92種SNP)。將聚合酶(在本實(shí)施例中為熱啟動(dòng)PhusionII)添加至PCR所需的所有組分的主混合物,并添加引物。將混合物用移液器吸取進(jìn)PCR板的孔。DNA以純化的DNA,最佳地1ng被添加至板。如在實(shí)施例2中一樣,來自2800M對(duì)照的純化的DNA以1ng來測試。使多重反應(yīng)混合物經(jīng)歷按照以下方案的兩個(gè)循環(huán)的PCR:在循環(huán)之后,將樣品從熱循環(huán)儀中取出,并將大腸桿菌(E.coli)單鏈DNA結(jié)合蛋白(SSB)添加至反應(yīng)。預(yù)期,SSB通過未使用的加標(biāo)簽的基因特異性引物減少引物二聚體,并阻止來自這些引物的任何更多的擴(kuò)增。將SSB與樣品在冰上孵育,可選地還可使用RT或37C孵育。在該孵育之后,將聚合酶(在本實(shí)施例中為熱啟動(dòng)PhusionII)添加至PCR所需的所有組分的主混合物,且將主混合物與一對(duì)銜接子(i7和i5銜接子)添加至樣品,并按照以下方案循環(huán)確定數(shù)目的循環(huán)(在該實(shí)驗(yàn)中為34個(gè)循環(huán)):95C3分95C30秒66C30秒72C1分72C5分10C保持樣品用SPRI珠純化,且單獨(dú)的文庫可通過使用基于qPCR的方法、通過使用片段分析儀(如在本實(shí)施例的情況一樣)或BioAnalyzer或通過使用PicoGreen和板閱讀器進(jìn)行定量。文庫被歸一化至每個(gè)濃度2nM,并以體積匯集。將純化的文庫的池變性、稀釋、成簇并以350x100個(gè)循環(huán)測序運(yùn)行及兩個(gè)索引讀段使用MiSeq測序儀測序。在測序之后,數(shù)據(jù)如在實(shí)施例2中報(bào)告的來確定。然而,由于引物包含UMI,使用UMI以通過使用PCR重復(fù)瓦解(collapse)數(shù)據(jù),以去除測序和PCR誤差及假象。SNP使用清單(manifest)進(jìn)行分析,且調(diào)用連同讀段數(shù)目一起被報(bào)告。計(jì)算等位基因之間的相對(duì)平衡(最小/最大%)、基因座之間的平衡(%CV)、誤差率以及掃描殘跡率(僅對(duì)于STR)。對(duì)于初始案件工作多重復(fù)用的結(jié)果示于圖7A-E中。對(duì)于在大的多重中的26個(gè)STR基因座的覆蓋、等位基因調(diào)用及其他假象示于圖8中。這些圖模擬由CE產(chǎn)生的電泳圖。柱類似于峰,且讀段計(jì)數(shù)類似于RFU。取決于SNP,對(duì)于SNP的覆蓋是從10-5500X的任何處,然而,被多重復(fù)用的每個(gè)SNP被計(jì)數(shù)并提供有用的結(jié)果。由這些研究產(chǎn)生的一個(gè)結(jié)果是,掃描殘跡被顯示為PCR假象。這已被許多研究者假設(shè)(且聚合酶滑移已在人結(jié)腸癌中被指示),但這尚未對(duì)取證測定證實(shí)。UMI可被用來顯示掃描殘跡確實(shí)是PCR假象。具有n+1或n-1個(gè)重復(fù)的產(chǎn)物具有與具有正確數(shù)目重復(fù)的產(chǎn)物相同的UMI(圖9)。與進(jìn)行UMI校正的圖9B相比,在圖9A中,每個(gè)基因座顯示沒有UMI校正的結(jié)果。如顯示的,沒有UMI校正,在等位基因之間的平衡沒有進(jìn)行UMI校正時(shí)那么好。此外,沒有UMI校正時(shí),存在明顯的相當(dāng)多的掃描殘跡。柱間線以上的柱的部分代表測序誤差,而在線的下部代表在STR序列內(nèi)的正確序列。使用UMI校正,誤差被大大減少。例如,SE33基因座具有用UMI校正去除的誤差。誤差校正可對(duì)于為刑事案件提供可能的最準(zhǔn)確的DNA譜系分析是非常重要的。實(shí)施例4-使用12個(gè)樣品個(gè)體的DNA譜系分析方法和材料遵循圖3的工作流程,測試來自12個(gè)樣品個(gè)體的DNA(樣品編號(hào):1、3、4、5、6、7、10、13、14、15、16、17)和一個(gè)參考基因組(2800M)。該實(shí)驗(yàn)將UMI摻入進(jìn)STR引物中,如在實(shí)施例3中描述的。每個(gè)樣品的兩個(gè)重復(fù)用ForenSeqDNA簽名文庫制備試劑盒在MiSeq測序儀上進(jìn)行分析。1ngDNA被用于每個(gè)重復(fù),使用DNA引物混合物B:收集的樣品混合物,其包含用于61種STR加上牙釉蛋白、95種身份信息SNP、56種祖先信息SNP、22種表型信息SNP(2種祖先SNP還被用于表型預(yù)測)的引物。缺省設(shè)置STR:分析閾值=6.5%;解釋閾值=15%。SNP:分析閾值=3%;解釋閾值=15%。12個(gè)樣品個(gè)體的DNA譜系分析的高水平測序調(diào)用,諸如覆蓋和調(diào)用的基因座示于圖12中。如可觀察到的,在兩個(gè)重復(fù)中,每個(gè)基因座被至少100,000個(gè)讀段覆蓋。僅兩個(gè)樣品產(chǎn)生失敗的STR調(diào)用(61個(gè)中的一個(gè))。在兩個(gè)重復(fù)中,在所有個(gè)體中,所有173種SNP被成功調(diào)用。兩個(gè)樣品個(gè)體的樣品STR調(diào)用示于圖16中。兩個(gè)樣品個(gè)體的樣品SNP調(diào)用示于圖17中。圖13示出了群體統(tǒng)計(jì),諸如美國國家標(biāo)準(zhǔn)與技術(shù)研究所(NationalInstituteofStandardsandTechnology)(NIST)常染色體STR(auto-STR)的隨機(jī)匹配概率(RMP)、NISTY-STR的95%置信單倍型頻率、dbSNPiSNP的RMP、以及來自美國Y-STR數(shù)據(jù)庫的STR的RMP。12個(gè)樣品個(gè)體和參考個(gè)體的表型,諸如眼睛顏色和頭發(fā)顏色基于實(shí)驗(yàn)中pSNP的基因型進(jìn)行預(yù)測,并與自報(bào)告的表型進(jìn)行比較(圖14)。觀察到在預(yù)測的和報(bào)告的表型之間的高度相關(guān)性。12個(gè)樣品個(gè)體的祖先使用實(shí)驗(yàn)中的56種aSNP的基因型進(jìn)行預(yù)測。對(duì)每個(gè)樣品個(gè)體的PCA1和PCA3評(píng)分進(jìn)行計(jì)算,并針對(duì)參考樣品繪制在祖先圖上。如圖15中示出的,樣品個(gè)體的祖先可基于祖先圖上的位置進(jìn)行預(yù)測。十四個(gè)質(zhì)心點(diǎn)(centroidpoint)被包括在祖先圖(圓圈)中?;谧罱馁|(zhì)心點(diǎn)預(yù)測每個(gè)樣品個(gè)體的祖先。DNA譜系分析實(shí)驗(yàn)還顯示在STR基因座和SNP基因座兩者內(nèi)的高水平的基因座內(nèi)平衡(如可在圖18中所見的),及低水平的掃描殘跡(如可在圖19中所見的)。12個(gè)個(gè)體中的六個(gè)加上2800M具有至少一個(gè)等距雜合子基因座,這示于圖20中。等距雜合子基因座被定義為具有相同重復(fù)數(shù)、是同樣平衡的兩個(gè)不同序列的STR。使用關(guān)于STRD8S1179中的變體的信息,樣品15的13個(gè)等位基因被追溯至祖母樣品17(圖21)。STRD13S317中的類似變體信息被用來追溯樣品15的等位基因。然而,在該情況下,不能確定任一等位基因的起源(圖22)。實(shí)施例5-用于研究、法醫(yī)或親子鑒定用途的DNA譜系分析本實(shí)施例是基于在ForenSeqTMDNA簽名制備指南(Illumina,SanDiego,CA)中描述的工作流程,其內(nèi)容在此通過引用以其整體并入。純化的DNA或粗制裂解物可被用于本實(shí)施例。對(duì)于純化的DNA,各自1ng樣品用不含核酸酶的水稀釋至0.2ng/μl。對(duì)于粗制裂解物,將各自2μl樣品用3μl不含核酸酶的水稀釋。主混合物被設(shè)置為用于八個(gè)或更多個(gè)反應(yīng)。對(duì)于每個(gè)反應(yīng),將5.4μlForenSeqPCR1反應(yīng)混合物、0.4μlForenSeq酶混合物和5.8μlDNA引物混合物(A或B)添加進(jìn)1.5ml微量離心管中。將10μl主混合物轉(zhuǎn)移至PCR板的每個(gè)孔中,并添加DNA或裂解物。使多重反應(yīng)混合物經(jīng)歷按照以下方案的PCR:98℃持續(xù)3分。以下的8個(gè)循環(huán):96℃持續(xù)45秒80℃持續(xù)30秒以指定的斜坡模式(rampingmode),54℃持續(xù)2分以指定的斜坡模式,68℃持續(xù)2分以下的10個(gè)循環(huán):96℃持續(xù)30秒以指定的斜坡模式68℃持續(xù)3分68℃持續(xù)10分。在10℃保持。在循環(huán)之后,將樣品從熱循環(huán)儀中取出。將ForenSeqPCR2反應(yīng)混合物與一對(duì)銜接子(i7和i5銜接子)添加至樣品,并按照以下方案循環(huán)15個(gè)循環(huán):98℃持續(xù)30秒。以下的15個(gè)循環(huán):98℃持續(xù)20秒66℃持續(xù)30秒68℃持續(xù)90秒68℃持續(xù)10分在10℃保持。樣品用樣品純化珠來純化,且文庫以體積歸一化和匯集。匯集的文庫在雜交緩沖液(HT1)中稀釋,添加人類測序?qū)φ?HSC),并且熱變性以準(zhǔn)備用于測序。實(shí)施例6-對(duì)降解的DNA的基因分型圖23示出了使用代表降解的DNA的剪切和/或DNA酶處理的DNA的基因分型結(jié)果。如圖顯示的,對(duì)于剪切的DNA,多于50%STR和SNP基因座被正確調(diào)用。對(duì)于少于100bp的DNA,實(shí)現(xiàn)了10-19的隨機(jī)匹配概率(RMP)。還使用降解的DNA預(yù)測了正確的祖先。實(shí)施例7-基因分型靈敏度圖24和25示出了在從7.82pg至1ng的亞納克DNA輸入水平的基因分型靈敏度結(jié)果。如顯示的,對(duì)于STR和SNP兩者,在125ng輸入DNA下,100%等位基因成功調(diào)用。在低至7.82pg輸入DNA下,多于50%的等位基因成功調(diào)用。對(duì)于大部分基因座,在1ng輸入DNA下,基因座內(nèi)平衡大于70%。在說明書中使用的表示成分、反應(yīng)條件等的數(shù)量的所有數(shù)字在所有情況下被理解為由術(shù)語“約”修飾。因此,除非相反指示,否則在其中陳述的數(shù)值參數(shù)是近似值,該近似值可取決于試圖獲得的期望性能而變化。至少且不是為了試圖限制將等同原則應(yīng)用于在要求本申請(qǐng)的優(yōu)先權(quán)的任何申請(qǐng)的任何權(quán)利要求的范圍,每個(gè)數(shù)值參數(shù)應(yīng)根據(jù)有效數(shù)字的數(shù)目和普通的修約方法來解釋。本文引用的所有參考文獻(xiàn),包括但不限于公布和未公布的申請(qǐng)、專利及著作參考文獻(xiàn)通過引用以其整體并入本文,且在此構(gòu)成本說明書的一部分。在某種程度上,通過引用并入的出版物及專利或?qū)@暾?qǐng)與被包含在本說明書中的公開內(nèi)容抵觸時(shí),本說明書旨在取代和/或優(yōu)先于任何此類矛盾的材料。以上出版物或文件的引用不被理解為任何前述是相關(guān)現(xiàn)有技術(shù)的承認(rèn),其也不構(gòu)成作為這些出版物或文件的內(nèi)容或日期的任何承認(rèn)。盡管本發(fā)明已結(jié)合其實(shí)施方案參考附圖被充分地描述,應(yīng)該注意,多種變化和修改將對(duì)本領(lǐng)域技術(shù)人員變得明顯。此類變化和修改被理解為被包括在本發(fā)明的范圍內(nèi)。本發(fā)明的多種實(shí)施方案應(yīng)該被理解為,它們僅通過示例的方式而非通過限制的方式來呈現(xiàn)。同樣地,多種圖表可描繪用于本發(fā)明的示例性結(jié)構(gòu)或其他配置,這樣做是為了有助于理解可被包括在本發(fā)明中的特征和功能。本發(fā)明不限于說明的示例性結(jié)構(gòu)或配置,而是可使用多種可選的結(jié)構(gòu)及配置來實(shí)施。另外,盡管以上根據(jù)多種示例性實(shí)施方案和實(shí)施來描述本發(fā)明,應(yīng)該理解,在一個(gè)或更多個(gè)單獨(dú)的實(shí)施方案中描述的多種特征及功能在它們的適用性方面不限于用它們來描述的特定實(shí)施方案。反而,它們可單獨(dú)地或以一些組合被應(yīng)用于本發(fā)明的一個(gè)或更多個(gè)其他實(shí)施方案,不管此類實(shí)施方案是否被描述,且不管此類特征是否被呈現(xiàn)為是描述的實(shí)施方案的一部分。因此,本發(fā)明的寬度和范圍不應(yīng)該受到任何以上描述的示例性實(shí)施方案的限制。除非另外明確指明,在該文件中使用的術(shù)語和措辭以及其實(shí)施方案應(yīng)被理解為是開放式的,而非限制性的。作為前述的實(shí)例:術(shù)語“包括(including)”應(yīng)該被讀為意指“包括,但不限于”等;術(shù)語“實(shí)例(example)”被用來提供討論的項(xiàng)目的示例性實(shí)例,而非其窮舉或有限的列表;且形容詞諸如“常規(guī)的(conventional)”、“傳統(tǒng)的(traditional)”、“正常的(normal)”、“標(biāo)準(zhǔn)的(standard)”、“已知的(known)”以及類似含義的術(shù)語不應(yīng)該被解釋為將所描述的項(xiàng)目限制于給定的時(shí)間段或在給定的時(shí)間時(shí)可用的項(xiàng)目。而且相反地,這些術(shù)語應(yīng)該被讀為包括可以是現(xiàn)在或在將來的任何時(shí)候可用、知曉的常規(guī)的、傳統(tǒng)的、正常的或標(biāo)準(zhǔn)的技術(shù)。同樣地,與連詞“和(and)”連接的一組項(xiàng)目不應(yīng)該被讀為要求那些項(xiàng)目的每個(gè)及每一個(gè)存在于該組內(nèi),而(butrather)應(yīng)該被讀為“和/或”,除非從上下文明顯或另外明確指明。類似地,與連詞“或(or)”連接的一組項(xiàng)目不應(yīng)該被讀為要求該組之中相互排他性,而應(yīng)該被讀為“和/或”,除非它從上下文明顯或另外明確指明。此外,盡管本發(fā)明的項(xiàng)目、要素或組分可以以單數(shù)來描述或要求保護(hù),復(fù)數(shù)也被預(yù)期在其范圍內(nèi),除非明確指明限制為單數(shù)。例如,“至少一種”可指單數(shù)或復(fù)數(shù),并且不限于任一種。擴(kuò)展詞和措辭諸如“一種或更多種”、“至少”、“但不限于”或其他類似的措辭在一些情況的存在不應(yīng)被讀為意指,在此類擴(kuò)展措辭可以不存在的情況下意圖或要求較窄的情況。當(dāng)前第1頁1 2 3 當(dāng)前第1頁1 2 3