從混合核酸中獲得目標核酸的方法
【專利摘要】本發(fā)明公開一種從混合核酸中獲得大量目標核酸的方法,所述混合核酸包括目標核酸和非目標核酸,所述方法包括:從所述混合核酸中富集所述目標核酸,所述富集包括利用甲基結(jié)合域蛋白結(jié)合所述非目標核酸,去除形成的甲基結(jié)合域蛋白-非目標核酸結(jié)合物;擴增經(jīng)過所述富集的目標核酸,所述擴增包括利用N6隨機引物;其中,所述大量目標核酸指所述目標核酸的量達到或者超過測序要求的最低核酸量,所述N6隨機引物為由A、T、C和G隨機排列組合成的長度為6bp的序列。本發(fā)明還公開一種鑒定人源宏基因組樣本中的低豐度菌種的方法。
【專利說明】
從混合核酸中獲得目標核酸的方法
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及生物樣品處理領(lǐng)域,具體的,本發(fā)明涉及一種從混合核酸中獲得大量目標核酸的方法,以及一種鑒定人源宏基因組樣本中低豐度菌種的方法。
【背景技術(shù)】
[0002]宏基因組(Metagenome,簡稱meta),也稱微生物環(huán)境基因組或元基因組,其定義為特定環(huán)境中全部微小生物遺傳物質(zhì)的總和,其包含微生物群落所有物種的基因組。
[0003]來源于人的宏基因組樣本(人源宏基因組樣本),如來自人的皮膚、糞便、唾液等的核酸樣本,包含的微生物核酸是微量的,且不同來源的人源m e t a樣本中的主要菌種不同,有的菌種的豐度極低,難以獲得有效的擴增,難以被檢測到。
[0004]微量人源meta樣本中宿主DNA占絕大部分,對人源meta樣本的測序分析,利用宏基因組建庫測序技術(shù)對微量低豐度的人源meta樣本中的低豐度菌種進行分析,之前的策略是在混合核酸測序數(shù)據(jù)中取出宿主DNA,這一策略對于微量的、低豐度的樣本而言,存在浪費數(shù)據(jù),成本高,低豐度微生物分析困難的問題。而且,在測序文庫構(gòu)建時,因為樣本起始核酸量過低,文庫構(gòu)建的成功率很低,而且即便構(gòu)建的測序文庫符合上機要求,一般在測序時只能根據(jù)經(jīng)驗在常規(guī)相關(guān)樣本研究背景的基礎(chǔ)上增加測序深度來獲得大量測序數(shù)據(jù),接著利用生物信息分析技術(shù)對測序數(shù)據(jù)中包含的來自低豐度菌種的序列進行分析,測序成本高,且由于數(shù)據(jù)量大分析工作量大。
【發(fā)明內(nèi)容】
[0005]本發(fā)明旨在解決上述問題至少之一或者提出一種商業(yè)選擇。
[0006]依據(jù)本發(fā)明的一方面,本發(fā)明提供一種從混合核酸中獲得大量目標核酸的方法,所述混合核酸包括目標核酸和非目標核酸,所述方法包括以下步驟:從所述混合核酸中富集所述目標核酸,所述富集包括利用甲基結(jié)合域蛋白結(jié)合所述非目標核酸,去除形成的甲基結(jié)合域蛋白-非目標核酸結(jié)合物;擴增經(jīng)過所述富集的目標核酸,所述擴增包括利用N6隨機引物;其中,所述大量目標核酸指所述目標核酸的量達到或者超過測序所需要的最低核酸量,所述N6隨機引物為由A、T、C和G隨機排列組合成的長度為6bp的序列。
[0007]在本發(fā)明的一個實施例中,所述混合核酸來自人源meta樣本,例如人皮膚meta樣本,人皮膚meta樣本中的核酸混有大量來自人的核酸,其中的目標核酸為meta核酸。人源meta樣本中,在富集meta核酸之前所含的人核酸的量可能是目標meta核酸的量的5倍、10倍、20倍、30倍、40倍、50倍、100倍、150倍、200倍或者250倍。一般的,只要非目標核酸的量達到目標核酸的量的5倍,測序?qū)崿F(xiàn)的就基本是獲得非目標核酸的序列了。
[0008]所說的甲基結(jié)合域蛋白包括能夠與DNA中的CpG-甲基化胱氨酸特異性結(jié)合的MeCP2、甲基化CpG結(jié)合域蛋白I (MBDl)、MBD2、MBD3或者MBD4(US7, 670, 773),在本發(fā)明的一個實施例中,所說的甲基結(jié)合域蛋白為甲基化CpG結(jié)合域蛋白2 (MBD2),MBD2能夠與人DNA上甲基化的CpG區(qū)域結(jié)合。在本發(fā)明的一個實施例中,先將MBD2結(jié)合到磁珠(MagneticBeads)上,MBD2與磁珠的結(jié)合是通過將磁珠包被上蛋白A或者蛋白G,將MBD2與抗體Fe部分結(jié)合,接著通過Fe與蛋白A或蛋白G的結(jié)合實現(xiàn)MBD2和磁珠的結(jié)合,一個包被的磁珠可以與多個MBD2結(jié)合,接著加入人源meta DNA樣本,樣本中的宿主DNA(人DNA)與MBD2-磁珠結(jié)合,在磁力架作用下,宿主DNA-MBD2-磁珠復(fù)合物被吸附沉降,富集得到存在于上清液中的meta DNA,實現(xiàn)所說的目標核酸富集。蛋白A是一種細胞壁蛋白,具有不在抗原結(jié)合點而與免疫球蛋白結(jié)合的性質(zhì)。蛋白G能與多種動物的IgG的Fe區(qū)發(fā)生結(jié)合。磁珠是指具有細小粒徑的超順磁微球,磁珠一般具有超強的順磁性,在磁場中能夠迅速聚集,離開磁場后又能夠有助于磁分離的均勻分散,其次,具有合適的且差別較小的粒徑,如粒徑為4.0-4.5 μπι或者3.0-3.9 μ m,保證足夠強的磁響應(yīng)性又不會沉降。鹽的存在被證明能夠加強MBD2-磁珠與人DNA的結(jié)合,在本發(fā)明的一個實施例中,富集所使用的緩沖液包含150-400mM NaCl和非離子表面活性劑小于1%,其中,非離子表面活性劑可以為Tween 20 (吐溫20)、Tween80或者Tween 100。利用上述的包含鹽和表面活性劑的緩沖液來進行所說的富集,能夠顯著降低非甲基化CpG核酸與MBD2的非特異性結(jié)合。
[0009]在本發(fā)明的一些實施例中,所述擴增是多重置換擴增(MDA),MDA能對有限的核酸樣品進行快速、均勻、無偏向的等溫全基因組擴增。所述MDA擴增包含多條N6隨機引物與富集后的變性目標DNA的結(jié)合過程,以及使用Phi 29聚合酶在恒定溫度下進行的鏈置換合成過程,置換鏈作為模板結(jié)合引物,從而生成了大量的擴增目標DNA。Phi 29聚合酶源于噬菌體,是一種具有3’端一5’端外切酶活性(校正活性)的DNA聚合酶,能夠提供比TaqDNA聚合酶高100倍的保真性。多條N6隨機引物(隨機六聚體)能夠結(jié)合到(互補配對至IJ)模板的多個位置,利于對目標DNA整體的無偏向擴增,多條N6隨機引物可以為2條、3條、4 條、5 條、10 條、15 條、20 條、30 條、40 條、50 條、60 條、70 條、80 條、100 條、150 條、200條、250條或300條隨機引物,基本上,N6隨機引物的條數(shù)可以根據(jù)目標DNA的大小來調(diào)整,利用多組不同條數(shù)的N6隨機引物來試驗,使相鄰兩條N6的結(jié)合位置之間的序列可以得以有效擴增。在本發(fā)明的一個實施例中,一組共用的N6隨機序列為ATCACG、CGATGT、TTAGGC、TGACCA、ACAGTG、GCCAAT、CAGATC、ACTTGA、GATCAG、TAGCTT、GGCTAC 和 CTTGTA。在本發(fā)明的一個實施例中,擴增的緩沖液體系的pH值為5?10,包含Mg2+0.l-25mM、NaCl或KCl l_150mM和銨鹽,例如,擴增緩沖體系為 Tris, pH 8.5, 1mM MgCl2, 50mM KCl,20mM(NH4) 2S04。Phi 29聚合酶結(jié)合這一緩沖體系,能夠方便的克服如發(fā)卡環(huán)一類的二級結(jié)構(gòu)困難,在擴增過程中避免滑脫、聚合酶解離等現(xiàn)象的發(fā)生。這樣無偏差的DNA片段能夠合成至10kb的長度。
[0010]在本發(fā)明的一個實施例中,所述最低核酸量為20ng。利用本發(fā)明這一方面的方法能夠從微量人源meta樣本中簡單準確獲得大于20ng的meta核酸,使能夠滿足一般文庫構(gòu)建對起始核酸量的要求,易于meta文庫構(gòu)建、測序,獲得目標核酸序列,與常規(guī)方法相比,提高建庫成功率,降低測序成本,而且,因為測序數(shù)據(jù)中中的大部分為目標核酸數(shù)據(jù),沒有大量宿主數(shù)據(jù)的干擾,使得后續(xù)基于測序數(shù)據(jù)的分析變得相對簡單。
[0011]可以將上述本發(fā)明這一方面的或者任一【具體實施方式】中涉及的試劑配方、酶、反應(yīng)體系和/或序列等組合成試劑盒,試劑盒還可進一步包括擴增核苷酸底物dNTP、擴增產(chǎn)物檢測引物、其它緩沖液等。該試劑盒可以用于從混合核酸中獲得大量目標核酸,特別是從微量人源meta樣本中獲取微量的meta DNA。
[0012]依據(jù)本發(fā)明的另一方面,本發(fā)明提供一種構(gòu)建宏基因組測序文庫的方法,該方法包括:獲取宏基因組樣本中的核酸,所述核酸包含來自宿主的核酸和來自微生物的核酸;富集所述核酸中的來自微生物的核酸,所述富集包括,利用甲基結(jié)合域蛋白結(jié)合來自宿主的核酸,去除形成的甲基結(jié)合域蛋白-宿主核酸結(jié)合物;擴增經(jīng)過所述富集的核酸,所述擴增包括利用N6隨機引物;對獲得的擴增產(chǎn)物進行測序文庫構(gòu)建,以獲得所述宏基因組測序文庫。
[0013]依據(jù)本發(fā)明的再一方面,本發(fā)明提供一種測序方法,其包括,利用上述宏基因組測序文庫構(gòu)建方法構(gòu)建宏基因組測序文庫,以及對獲得的測序文庫進行測序。可依據(jù)所選擇的測序平臺進行相應(yīng)的測序文庫構(gòu)建,例如,可以進行單端測序文庫構(gòu)建、雙末端文庫構(gòu)建等,測序可以選擇現(xiàn)有平臺來進行,包括但不限于Illumina Hiseq2000/2500、LifeTechnologies 1n Torrent、Complete Genomics CGA 和 Roche 454 測序平臺。前述對本發(fā)明一方面的從混合核酸中獲得大量目標核酸的方法的技術(shù)特征和優(yōu)點的描述,同樣適用本發(fā)明這一方面的測序文庫構(gòu)建方法和測序方法,在此不再贅述。
[0014]依據(jù)本發(fā)明的另一方面,本發(fā)明提供一種鑒定人源宏基因組樣本中低豐度菌種的方法,包括:獲取所述人源宏基因組樣本中的核酸,所述核酸包含來自人的核酸和來自微生物的核酸;富集所述核酸中的來自微生物的核酸,所述富集包括,利用甲基結(jié)合域蛋白結(jié)合來自人的核酸,去除形成的甲基結(jié)合域蛋白-人核酸結(jié)合物;擴增經(jīng)過所述富集的核酸,所述擴增包括利用N6隨機引物;對擴增后的核酸進行序列測定,獲得測序數(shù)據(jù);將所述測序數(shù)據(jù)與微生物參考序列比對,獲得比對結(jié)果;依據(jù)所述比對結(jié)果鑒定所述低豐度菌種。比對可以利用 S0AP(Short OligonucleotideAnalysis Package),bwa,GATK等軟件進行,本發(fā)明對此不作限制。微生物參考序列指已知的微生物序列,可以是預(yù)先獲得的微生物基因組或者片段,例如,可以為自己測定組裝出的或者從公開數(shù)據(jù)庫能夠獲取的多種微生物的基因組或者片段的組合。進一步地,根據(jù)人源meta樣本來源的部位,可能包含的主要菌種或者菌種,可以預(yù)先配置包含更多參考序列的序列庫,有助于獲得更準確的鑒定分析結(jié)果。前述對本發(fā)明一方面或者任一【具體實施方式】中的從混合核酸中獲得大量目標核酸的方法的技術(shù)特征和優(yōu)點的描述,同樣適用本發(fā)明這一方面的方法。在本發(fā)明的一個實施例中,利用本發(fā)明的這一方法能夠鑒定出人源meta樣本中的豐度低至0.4%的菌種。
[0015]本發(fā)明的這一方法提供了一種微量人源meta樣本中低豐度菌種測序分析策略,即先去除微量人源meta樣本中的大部分(可以達90%以上)宿主DNA,再擴增微量metaDNA,使微量meta DNA的總量達到測序文庫構(gòu)建的需求。這一發(fā)明方法很好地改善了之前通過增大測序數(shù)據(jù)量,以提高微量人源宏基因組樣本中低豐度菌種的鑒定率的策略,達到了減少測序數(shù)據(jù)浪費、微量人源宏基因組樣本測序分析成本,以及提高微量人源宏基因組樣本中低豐度菌種的鑒定率的效果。
【附圖說明】
[0016]本發(fā)明的上述和/或附加的方面和優(yōu)點從結(jié)合下面附圖對實施方式的描述中將變得明顯和容易理解,其中:
[0017]圖1是本發(fā)明的一個實施例中的MDA后的擴增產(chǎn)物的電泳結(jié)果圖,其中Ml泳道為λ Hind III酶切DNA,I泳道為富集后meta DNA, 2泳道為富集后人DNA,3泳道為陰性對照,M2泳道為標準分子量Maker (D2000),單位bp ;
[0018]圖2是本發(fā)明的一個實施例中的擴增產(chǎn)物的管家基因檢測電泳圖,其中M泳道為標準分子量(Maker,單位bp),I泳道為YH標準品,2泳道為富集后meta DNA的全基因組擴增(WGA)產(chǎn)物,3泳道為富集后人源DNA的WGA產(chǎn)物,4泳道為NTC (陰性對照)的WGA產(chǎn)物。
【具體實施方式】
[0019]以下結(jié)合對具體樣本依據(jù)本發(fā)明的方法進行目標核酸獲取、低豐度菌種鑒定等進行詳細的描述及結(jié)果展示。下面示例,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。本發(fā)明的描述中,除非另有說明,“多個”的含義是兩個或兩個以上。
[0020]除另有交待,以下實施例中涉及的未特別交待的試劑、序列(接頭、標簽和引物)、軟件及儀器,都是常規(guī)市售產(chǎn)品或者公開的,比如購自Illumina公司的hiseq2000測序平臺建庫相關(guān)試劑盒來進行測序文庫構(gòu)建等。
[0021]實施例
[0022](一 )材料準備
[0023]獲取微量人源meta樣本,獲取的是人體皮膚meta樣本包含核酸共32ng,濃度為
1.1ng/ μ 10
[0024]( 二)方法可以分以下幾個步驟
[0025]1、富集微量的meta核酸
[0026]利用該步去除了 90%以上的人源DNA,使meta DNA的含量大大提高,實現(xiàn)所說的富集微量meta DNA。
[0027]具體的,將MBD2-FC與包被有蛋白A的磁珠結(jié)合,用垂直混懸儀室溫下結(jié)合lOmin,用結(jié)合緩沖液洗滌2次,結(jié)合緩沖液由1mM Tris, pH7.5,ImM EDTA,0.2% Tween20和300mMNaCl組成,接著以結(jié)合緩沖液重懸MBD2-FC-磁珠,與DNA樣本結(jié)合50min,將反應(yīng)管置于磁力架上靜置至液體澄清,吸取上清即可得到meta DNA。管中的磁珠用蛋白酶K(20mg/ml,2 μ I)和 TE buffer (1mMTris, ImM EDTA,pH8.0)于 75°C 下孵育 20min,將反應(yīng)管置于磁力架上靜置至液體澄清,吸取上清即可得到宿主DNA。對上清液和回溶液進行核酸提取純化,例如用AMPure XP Bead純化可得到能進行后續(xù)反應(yīng)的DNA樣品。
[0028]對上清液及回溶液中回收的人DNA進行定量,Qubit檢測濃度:得到18ul 0.76ng/ul 的 Meta DNA,共 14.4ng ;得到得到 9.5ul 0.749ng/ul 的人源 DNA,共 7.12ng,其他核酸為實驗中的損失。
[0029]2、MDA 擴增
[0030]用一組N6隨機序引物和Phi29DNA聚合酶對得到的meta DNA和宿主DNA分別進行全基因組擴增,一組 N6 隨機引物包括 ATCACG、CGATGT、TTAGGC、TGACCA、ACAGTG、GCCAAT、CAGATC、ACTTGA、GATCAG、TAGCTT、GGCTAC和 CTTGTA。首先,將樣品溶解在 TE buffer 中,加入變性溶液進行溫和的堿變性,避免變性時發(fā)生片段化和損害模板DNA,變性溶液包含0.25mMKOH和0.625 μ M EDTA。然后,用中和緩沖液將樣本中和,再和MDA擴增反應(yīng)液在30°C下孵育,中和緩沖液為 3mol/LNaAc,pH = 5.2,MDA 擴增反應(yīng)液由 Tris, pH 8.5,1mM MgCl2, 50mMKCl,20mM (NH4)2SO4組成。使用多重置換擴增(MDA)技術(shù),隨機引物與變性DNA結(jié)合,等溫環(huán)境下利用Phi29聚合酶進行置換合成反應(yīng)。每個置換的單鏈作為模板,與引物結(jié)合,擴增生成高產(chǎn)量的DNA。擴增反應(yīng):30°C 16h,65°C 3min,維持4°C。
[0031]利用0.6%的瓊脂糖電泳對擴增產(chǎn)物檢測,檢測結(jié)果如圖1,圖中Ml為AHind III酶切DNA、1為富集后meta DNA, 2為富集后人DNA、3為NTC(陰性對照,微生物DNA)、M2為Marker (D2000),從圖1可看出全基因組得以擴增或者獲得的擴增產(chǎn)物為大片段。利用宿主管家基因?qū)U增產(chǎn)物進行檢測,2%瓊脂糖電泳檢測擴增結(jié)果,結(jié)果如圖2,圖中各個泳道,M為Maker、I為YH(炎黃,來自炎黃項目)標準品、2為富集后meta DNA的全基因組擴增(WGA)產(chǎn)物、3為富集后人源DNA的WGA產(chǎn)物、4為NTC的WGA產(chǎn)物。
[0032]擴增管家基因的引物可采用CN201010619689中的多對管家基因引物,或者市售人管家基因檢測試劑盒中的引物。
[0033]從圖2可看出,MDA擴增后的宿主DNA的管家基因檢測結(jié)果顯示8條管家基因條帶,而MDA擴增富集后的meta DNA的管家基因檢測結(jié)果顯示無管家基因條帶,說明富集后的meta DNA中基本不含有宿主DNA,至少在瓊脂糖電泳檢測靈敏度下不含宿主DNA。經(jīng)過全基因組擴增后的meta DNA構(gòu)建小片段文庫后用HiSeq測序儀測序,生物信息分析結(jié)果顯示富集能夠去除91%的宿主DNA,降低了人源meta樣本對測序數(shù)據(jù)量的要求,并能夠分析得到極低豐度的微生物序列。從該人體皮膚meta樣本中,找到了極低豐度的不動桿菌屬。人源皮膚樣本中不動桿菌屬含量很低,含量低于0.5%,之前同一樣本相同核酸含量,多次利用目前的研究方法,包括多次建庫、增大測序數(shù)據(jù)量,和/或從大量混合測序數(shù)據(jù)中去除人DNA數(shù)據(jù),結(jié)果要么找不到不動桿菌要么找到的不動桿菌少于3種。但是,利用該示例方法,總數(shù)據(jù)量不到之前的1/10但可以找到了 7種不動桿菌。該示例中,鑒定meta數(shù)據(jù)中是否包含某一菌屬的標準與通常鑒定標準的是一致的,例如,可以基于測序數(shù)據(jù)中有讀段或者有一定比例的讀段比對到該菌屬的特異參考序列上,來說明該人源meta樣本中包含該菌屬。以上說明了利用本發(fā)明方法能夠?qū)崿F(xiàn)微量人源meta樣本的建庫測序,能夠降低對測序數(shù)據(jù)量的需求,并能夠提高低豐度微生物的檢測靈敏度。
【主權(quán)項】
1.一種從混合核酸中獲得大量目標核酸的方法,所述混合核酸包括目標核酸和非目標核酸,其特征在于,包括以下步驟: 從所述混合核酸中富集所述目標核酸,所述富集包括利用甲基結(jié)合域蛋白結(jié)合所述非目標核酸,去除形成的甲基結(jié)合域蛋白-非目標核酸結(jié)合物; 擴增經(jīng)過所述富集的目標核酸,所述擴增包括利用N6隨機引物;其中, 所述大量目標核酸指所述目標核酸的量達到或者超過測序要求的最低核酸量, 所述N6隨機引物為由A、T、C和G隨機排列組合成的長度為6bp的序列。2.權(quán)利要求1的方法,其特征在于,所述混合核酸來自人源meta樣本,所述目標核酸為meta核酸。3.權(quán)利要求2的方法,其特征在于,所述甲基結(jié)合域蛋白結(jié)合在磁珠上; 任選的,所述去除是通過磁力實現(xiàn)所述甲基結(jié)合域蛋白-非目標核酸結(jié)合物與所述目標核酸的分尚。4.權(quán)利要求2的方法,其特征在于,所述擴增是多重置換擴增。5.權(quán)利要求2的方法,其特征在于,進行所述擴增包括利用多條N6隨機引物。6.權(quán)利要求2的方法,其特征在于,所述擴增利用的聚合酶為Phi29聚合酶。7.權(quán)利要求1-6任一方法,其特征在于,所述最低核酸量為20ng。8.一種構(gòu)建宏基因組測序文庫的方法,其特征在于,包括, 獲取宏基因組樣本中的核酸,所述核酸包含來自宿主的核酸和來自微生物的核酸;富集所述核酸中的來自微生物的核酸,所述富集包括,利用甲基結(jié)合域蛋白結(jié)合來自宿主的核酸,去除形成的甲基結(jié)合域蛋白-宿主核酸結(jié)合物; 擴增經(jīng)過所述富集的核酸,所述擴增包括利用N6隨機引物; 對獲得的擴增產(chǎn)物進行測序文庫構(gòu)建,以獲得所述宏基因組測序文庫。9.一種測序方法,其特征在于,包括, 利用權(quán)利要求8的方法構(gòu)建宏基因組測序文庫, 對獲得的測序文庫進行測序。10.一種鑒定人源宏基因組樣本中低豐度菌種的方法,其特征在于,包括, 獲取所述人源宏基因組樣本中的核酸,所述核酸包含來自人的核酸和來自微生物的核酸; 富集所述核酸中的來自微生物的核酸,所述富集包括,利用甲基結(jié)合域蛋白結(jié)合來自人的核酸,去除形成的甲基結(jié)合域蛋白-人核酸結(jié)合物; 擴增經(jīng)過所述富集的核酸,所述擴增包括利用N6隨機引物; 對擴增后的核酸進行序列測定,獲得測序數(shù)據(jù); 將所述測序數(shù)據(jù)與微生物參考序列比對,獲得比對結(jié)果; 依據(jù)所述比對結(jié)果鑒定所述低豐度菌種; 任選的,所述低豐度菌種包括在所述人源宏基因組樣本中的豐度大于0.4%的菌種。
【文檔編號】C40B50/06GK105861486SQ201510026998
【公開日】2016年8月17日
【申請日】2015年1月19日
【發(fā)明人】韋金池, 王娟
【申請人】深圳華大基因科技服務(wù)有限公司