本發(fā)明涉及基因組育種、功能基因組學(xué)和分子生物學(xué)領(lǐng)域,具體說(shuō)是一種生物育種基因分型方法及應(yīng)用。
背景技術(shù):
1、2001年,theo?meuwissen等人首次提出了全基因組選擇(genomic?selection,gs)技術(shù)的創(chuàng)新思想,這是繼上世紀(jì)blup育種技術(shù)實(shí)施以來(lái)的又一項(xiàng)創(chuàng)新技術(shù),它利用覆蓋全基因組的高密度標(biāo)記進(jìn)行選擇育種,通過(guò)①早期選擇縮短世代間隔,②提高育種值(genomic?estimated?breeding?value,gebv)估計(jì)準(zhǔn)確性等加快遺傳進(jìn)展,尤其對(duì)低遺傳力、難測(cè)定的復(fù)雜性狀具有較好的預(yù)測(cè)效果,真正將基因組技術(shù)用于了育種實(shí)踐,目前正在推動(dòng)動(dòng)植物育種的革命性進(jìn)步,是現(xiàn)代種業(yè)中最重要、最前沿的共性技術(shù)之一。
2、單核苷酸多態(tài)性(single?nucleotide?polymorphisms,snp)作為目前主流的遺傳標(biāo)記,在基因組中數(shù)量眾多,分布廣泛,遺傳穩(wěn)定性好。在人類和動(dòng)植物研究中被廣泛用于各類性狀遺傳機(jī)制的解析、選擇進(jìn)化研究和基因組選擇等研究方向。在基因組選擇應(yīng)用中,過(guò)去十余年,高通量snp分析主要依賴于snp芯片技術(shù),但傳統(tǒng)的固相snp芯片存在著①標(biāo)記固定無(wú)法拓展、②不同群體的通用性差、③不同表型的育種效果差別大、④成本高昂等缺陷,上述問(wèn)題均限制了全基因組選擇技術(shù)在育種中大規(guī)模推廣應(yīng)用。近幾年來(lái),基于測(cè)序的snp分型方法快速發(fā)展,其中比較有代表性的是一種所謂“液相芯片”的方法,其核心原理是通過(guò)對(duì)基因組目標(biāo)區(qū)域進(jìn)行靶向富集測(cè)序,來(lái)完成數(shù)千至數(shù)萬(wàn)個(gè)位點(diǎn)的snp基因分型。雖然該技術(shù)比傳統(tǒng)固相芯片在設(shè)計(jì)位點(diǎn)上更靈活,但由于基因組不同位置測(cè)序的靶向性存在極大差異,導(dǎo)致其分析和使用成本從原理上無(wú)法有效降低,限制了大規(guī)模的育種應(yīng)用。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)中存在的缺陷,本發(fā)明的目的在于提供一種生物育種基因分型方法。本發(fā)明利用大規(guī)模低深度全基因組重測(cè)序技術(shù)得到的遺傳標(biāo)記特異性篩選特定生物性狀相關(guān)的功能標(biāo)記信息,極大剔除了測(cè)序數(shù)據(jù)信息中的噪音位點(diǎn),同時(shí)保留與待篩選生物性狀相關(guān)的功能位點(diǎn),最終形成一種應(yīng)用于生物育種的基因分型方法,降低分型成本的同時(shí),極大地提升了特定生物性狀的育種準(zhǔn)確性。
2、為達(dá)到以上目的,本發(fā)明采取的技術(shù)方案是:
3、一種生物育種基因分型方法,其特征在于,包括以下步驟:
4、步驟1,提取生物候選群體中每個(gè)個(gè)體基因組dna;
5、步驟2,對(duì)步驟1得到的生物候選群體中的每個(gè)個(gè)體基因組dna進(jìn)行低深度重測(cè)序,測(cè)序深度為0.4×-0.8×/樣本;
6、步驟3,對(duì)步驟2中得到的低質(zhì)量數(shù)據(jù)進(jìn)行過(guò)濾;
7、步驟4,將經(jīng)過(guò)過(guò)濾的數(shù)據(jù)與生物參考基因組進(jìn)行比對(duì);上述生物參考基因組版本采用ensembl數(shù)據(jù)庫(kù)中(網(wǎng)址:http://asia.ensembl.org/index.html)記錄的對(duì)應(yīng)物種的最新版參考基因組;
8、步驟5,進(jìn)行基因組snp標(biāo)記檢測(cè),所述snp標(biāo)記包括通過(guò)全基因組關(guān)聯(lián)分析找到的與待培育的生物性狀有關(guān)聯(lián)的全部snp位點(diǎn)和全部基因組骨架位點(diǎn);
9、步驟6,對(duì)上述snp位點(diǎn)和基因組骨架位點(diǎn)進(jìn)行基因填充分型,得到待培育生物性狀的基因分型結(jié)果。
10、在上述方案的基礎(chǔ)上,
11、步驟1中所述生物候選群體中的樣本數(shù)量大于1000個(gè);
12、步驟6中所述基因填充分型的方法為基于隱馬爾可夫的無(wú)參基因型填充法。
13、在上述方案的基礎(chǔ)上,
14、所述的生物群體包括:?jiǎn)我患倚笕后w、單一家禽群體;
15、所述的待培育的生物性狀包括:家禽開產(chǎn)日齡、家禽產(chǎn)蛋數(shù)、家禽屠宰體重、家禽屠宰率、家禽預(yù)設(shè)日齡體重、家畜乳頭數(shù)、家畜預(yù)設(shè)體重日齡、家畜背膘厚等特定生物性狀。
16、本發(fā)明的另一個(gè)目的在于提供一種豬背膘厚性狀育種30k?snp測(cè)序分型芯片。
17、為達(dá)到以上目的,本發(fā)明采取的技術(shù)方案是:
18、一種豬背膘厚性狀育種30k?snp測(cè)序分型芯片,其特征在于,包含31633個(gè)snp位點(diǎn)。
19、上述測(cè)序分型芯片中snp位點(diǎn)如下表所示,基因組坐標(biāo)所使用的的參考基因組版本為sscrofa11.1(gca_000003025.6):
20、
21、
22、
23、
24、
25、
26、
27、
28、
29、
30、
31、
32、
33、
34、
35、
36、
37、
38、
39、
40、
41、
42、
43、
44、
45、
46、
47、
48、
49、
50、
51、
52、本發(fā)明的又一個(gè)目的在于提供一種豬背膘厚性狀育種30k?snp測(cè)序分型芯片在選擇育種中的應(yīng)用。
53、為達(dá)到以上目的,本發(fā)明采取的技術(shù)方案是:
54、一種豬背膘厚性狀育種30k?snp測(cè)序分型芯片在基因組選擇育種中的應(yīng)用,其特征在于,包括如下步驟:
55、步驟1,建立初始豬參考群體,豬參考群體規(guī)模大于1000個(gè),利用所述豬背膘厚性狀育種30k?snp測(cè)序分型芯片獲得豬參考群體中每個(gè)個(gè)體的基因型數(shù)據(jù),同時(shí)記錄上述豬參考群體表型數(shù)據(jù);
56、步驟2,對(duì)豬候選群體的每個(gè)個(gè)體,利用所述豬背膘厚性狀育種30k?snp測(cè)序分型芯片進(jìn)行基因分型,使用blupf90軟件,使用的gblup模型為:
57、y=xβ+zu+e?u~n(0,gσ2g)e~n(0,iσ2e)
58、其中y為表型值,β為固定效應(yīng)向量,包括代次、批次、舍位、性別等因素,u為育種值向量,e為隨機(jī)殘差,g為基于基因組標(biāo)記構(gòu)建的親緣關(guān)系系數(shù)矩陣;利用上述模型來(lái)計(jì)算豬候選群體中每個(gè)個(gè)體的基因組估計(jì)育種值;
59、步驟3,根據(jù)育種值的排名和育種實(shí)際制定的選擇壓對(duì)優(yōu)秀個(gè)體進(jìn)行選留。
60、在上述方案的基礎(chǔ)上,所述的選擇壓為1%-10%。
61、本發(fā)明所述的一種生物育種基因分型方法及應(yīng)用,其有益效果為:
62、1.不依賴傳統(tǒng)snp芯片的探針雜交、靶向測(cè)序等復(fù)雜實(shí)驗(yàn)流程,而是通過(guò)低深度測(cè)序技術(shù)結(jié)合定點(diǎn)分型填充方法識(shí)別多態(tài)位點(diǎn)并進(jìn)行基因分型,不僅降低了芯片設(shè)計(jì)的成本,更顯著降低了芯片應(yīng)用于基因組選擇育種的成本,其分型的準(zhǔn)確性高達(dá)98%以上。該技術(shù)低成本、高準(zhǔn)確性、方便快捷,可以快速推廣至基因組選擇育種實(shí)踐。
63、2.本發(fā)明提供的豬全基因組測(cè)序分型芯片在降低傳統(tǒng)snp芯片標(biāo)記數(shù)目的前提下,還顯著增加了背膘厚性狀基因組育種的準(zhǔn)確性,這將大幅加速背膘厚性狀基因組選擇的遺傳進(jìn)展,帶來(lái)顯著的經(jīng)濟(jì)效益,在豬分子育種中極具價(jià)值。