專利名稱:利用est序列的冗余性開發(fā)辣椒ssr標記及其方法
利用EST序列的冗余性開發(fā)辣椒SSR標記及其方法技術(shù)領(lǐng)域
本發(fā)明屬于植物分子標記開發(fā)技術(shù)領(lǐng)域,具體涉及到利用公共序列數(shù)據(jù)庫中EST 序列的冗余性開發(fā)辣椒SSR標記的方法,所開發(fā)的標記可用于辣椒分子標記輔助選擇育種等研究。
背景技術(shù):
SSR(simple sequence repeats,簡單序列重復(fù))標記因具有數(shù)量豐富、多態(tài)性高、 重復(fù)性好、呈共顯性遺傳等優(yōu)良特性,而被廣泛地應(yīng)用于高密度連鎖圖譜的構(gòu)建、基因定位和分子標記輔助選擇等研究。但按照傳統(tǒng)的方法,SSR標記的開發(fā)需要構(gòu)建基因組文庫和篩選陽性克隆等操作,不僅費時費力而且成本高。
對于有一定數(shù)量DNA序列信息的物種來講,一個實用、經(jīng)濟和直接的方法是利用已有的DNA序列搜尋SSR位點。
隨著測序技術(shù)的發(fā)展,全基因組測序的速度越來越快,成本也在逐漸降低,已有一些具有重要經(jīng)濟價值的作物被測序。利用全基因組序列可以開發(fā)大量的SSR標記,從而避免傳統(tǒng)的SSR標記開發(fā)所需的復(fù)雜操作(Ren Y,Zhang ZH, Liu JH, Staub JE, Han YH, Cheng ZC, Li XF, Lu JY, Miao H, Kang HX, Xie BY, GuXF, Wang Xff, Du YC, Jin ffff, Huang SW.1ntegrated Genetic and Cytogenetic Map of the Cucumber Genome. Plos One. 2009, 4(6) :e5795)。但目前僅有一些模式作物和主要的農(nóng)作物完成了基因組測序,對于大多數(shù)農(nóng)作物而言,尚無全基因組序列可以利用。
當前,開發(fā)SSR標記的另一個序列來源是EST (expressed sequence tags,表達序列標簽)。隨著功能基因組學(xué)的發(fā)展,EST被大規(guī)模測序,并存放在公共序列數(shù)據(jù)庫中。利用EST序列,采用in silico的方法篩選SSR已經(jīng)成為一個簡單易行的開發(fā)SSR標記的方 法。目前已開發(fā)出多種軟件可用于SSR位點的鑒定,極大地提高了 SSR標記的開發(fā)效率。因此,采用數(shù)據(jù)挖掘技術(shù),利用公共序列數(shù)據(jù)庫中豐富的EST序列鑒定和開發(fā)SSR標記,已經(jīng)成為當前開發(fā)SSR標記的主要方法。
利用EST序列開發(fā)SSR標記的主要障礙是EST序列的冗余性,即在基因組上同一個位點可能產(chǎn)生多個重復(fù)的SSR標記。冗余性是EST序列的特征之一,其產(chǎn)生的原因主要是很多EST可能是來自于同一個高豐度表達的基因。因此,為克服EST序列的冗余性,避免同一位點的SSR標記被重復(fù)開發(fā),在鑒定SSR位點之前需要對EST序列進行拼接,產(chǎn)生一致的基因序列,即Unigene,然后再基于Unigene來開發(fā)SSR標記,則可以克服EST序列冗余性的缺點(Kong Q, Xiang C, Yu Z. 2006. Development of EST-SSRs in Cucumis sativusfrom sequence database. Molecular Ecology Notes, 6 :1234-1236 ;王長彪等,一種 SSR 分子標記冗余性的生物信息學(xué)分析方法.專利申請?zhí)?01010601582. O)。
目前利用公共序列數(shù)據(jù)庫中的EST開發(fā)EST-SSR的一般程序是獲得EST序列,對 EST序列進行拼接處理獲得Unigene,消除序列冗余性并延長轉(zhuǎn)錄片段長度,然后利用SSR 位點搜尋軟件以一定的標準(通常是5次以上重復(fù))在Unigene上鑒定SSR位點,最后用實驗驗證 SSR 位點的多態(tài)性(Kong Q, XiangC, Yu Z. 2006. Development of EST-SSRs inCucumis sativus from sequence database. Molecular Ecology Notes, 6 :1234-1236.)。這一方法雖然可以大量地鑒定出SSR位點,但通常獲得的多態(tài)性的SSR位點的比率比較低。因為很多基于序列特征被鑒定出來的SSR位點,可能是基因組上特有的序列結(jié)構(gòu),并不具有SSR的變異性。此外,以往的研究很少去開發(fā)5次重復(fù)以下的SSR位點。公共序列數(shù)據(jù)庫具有開放性的特點,這一特點也使得數(shù)據(jù)庫中的序列來源具有高度異質(zhì)性,即這些序列是不同實驗室、利用不同基因型的材料所獲得的,同時,這也是EST序列產(chǎn)生冗余性的原因之一。因此,冗余序列可能含有SSR長度多態(tài)性的信息。而這些信息當前都被忽略了,因為SSR鑒定前通常要消除序列的冗余性。 李文濱等(李文濱等,一種獲得EST-SSR標記的方法.專利申請?zhí)?00910090407. 7)也曾考慮到將含有相同SSR重復(fù)單元的EST序列進行拼接,然后在重疊群中尋找重復(fù)單元數(shù)目有變異的EST序列用來開發(fā)SSR標記,這種方法顯著提高了多態(tài)性EST-SSR效率。但這種方面也有著明顯的缺陷首先,該方法是在鑒定出潛在的SSR位點基礎(chǔ)上,再來拼接尋找有變異的位點,這樣SSR位點的鑒定還是受限于鑒定最初尋找含有SSR位點的EST序列時所采用的標準,不容易發(fā)現(xiàn)更低重復(fù)次數(shù)的SSR位點;其次,這種方法需要先手工挑出含有相同重復(fù)單元的EST序列,然后再進行EST序列拼接,操作比較復(fù)雜,效率低,無法實現(xiàn)自動化的高通量操作,因此,無法適應(yīng)目前處理海量EST序列的要求。辣椒(Capsicum annuum L.)是主要的蔬菜作物之一,具有重要的經(jīng)濟價值。開發(fā)辣椒的SSR標記,對于辣椒的遺傳育種研究具有非常重要的意義。目前利用基因組文庫或公共數(shù)據(jù)庫中的序列信息,在辣椒上總共開發(fā)了 500多個SSR標記(Huang S,ZhangB,Milbourne D,Cardie L,Yang G,Guo J. 2000. Development of pepper SSR markersfrom sequence databases. Euphytica,117 :163_167 ;Lee J M,Nahm S H,Kim Y M,KimB D.2004.Characterization and molecular genetic mapping of microsatelliteloci in pepper. Theoretical and Applied Genetics,108 :619_627 ;Minamiyama Y,Tsuro M,Hirai M. 2006. An SSR-based linkage map of Capsicum annuum. MolecularBreeding 18:157-169 ;Yi G. B,Lee J M,Lee S,Choi D,Kim B D. 2006. Exploitation ofpepper EST-SSRs and an SSR-based linkage map. Theoretical and Applied Genetics114,113-130. ;Nagy I,Stagel A,Sasvari Z,Roder M,Ganal M. 2007. Development,characterization, and transferability to other Solanaceae of microsatellitemarkers in pepper (Capsicum annuum L.)· Genome,50,668-688 ;Portis E,Nagy I,Sasvari Z, Stagel A, Barchi L, Lanteri S.2007.The design of Capsicum spp.SSRassays via analysis of in silico DNA sequence, and their potential utility forgenetic mapping. Plant Science,172 :640_648.;李晶晶,王述彬,劉金兵,潘寶貴,陳勁楓.2008.辣椒 EST-SSR 標記的開發(fā).分子植物育種,6(6) :1219_1222 ;Ince A G,KaracaM,Onus A N. 2010. Polymorphic Microsatellite Markers Transferable Across CapsicumSpecies. Plant Molecular Biology Reporter 28,285-291.) 但這些標記開發(fā)時利用的EST序列數(shù)量都非常有限,最多的也只用了 2萬多條,而且都是利用去除EST序列冗余性后的Unigene開發(fā)的。辣椒具有相對比較大的基因組,辣椒屬不同種的基因組大小在3753 4763Mb之間,而辣椒栽培種內(nèi)DNA水平上的多態(tài)性也比較低。因此,已有的辣椒SSR標記,還遠不能滿足辣椒高密度作圖的需要。
目前在GenBank數(shù)據(jù)庫中保存的辣椒EST序列已經(jīng)超過了 11萬條,這些序列為辣椒SSR標記的開發(fā)提供了豐富的資源,但絕大部分序列尚沒有被用來開發(fā)SSR標記,尤其是低重復(fù)次數(shù)的SSR標記。
本發(fā)明利用公共序列數(shù)據(jù)庫中EST來源的異質(zhì)性和冗余性的特點,另辟蹊徑地通過對冗余性EST進行序列比對分析,鑒定出多態(tài)性SSR位點,然后再實驗驗證該位點的多態(tài)性,顯著地提高了多態(tài)性EST-SSR標記的開發(fā)效率。發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺陷,提供一種利用EST序列的冗余性開發(fā)的辣椒SSR標記及其制備方法。
本發(fā)明是利用公共序列數(shù)據(jù)庫中EST來源的異質(zhì)性和冗余性的特點,以冗余的 EST為研究對象,通過對冗余EST序列的比對,鑒定多態(tài)性的EST-SSR位點并實驗驗證其多態(tài)性,為辣椒遺傳育種研究提供有力的遺傳工具。
本發(fā)明的總體技術(shù)方案如下所示(本發(fā)明的技術(shù)流程圖見圖1)
(I)從NCBI數(shù)據(jù)庫中檢索并下載辣椒的EST序列;
(2)對辣椒EST序列進行拼接;
(3)拼接后產(chǎn)生的Contig (重疊群)含有所有冗余的EST序列,在Contig序列比對結(jié)果中,用office軟件提供的查找功能,以“一”為檢索符,查找序列比對結(jié)果中的序列缺失部分(gap),再分析其緊鄰的非缺失序列是否具有SSR特征。SSR位點的判斷標 準為 重復(fù)基序長度為2-6bp,重復(fù)次數(shù)> 2。如沒有SSR特征,則放棄該序列;如果有SSR特征, 則被認為是一個潛在的多態(tài)性EST-SSR位點;
(4)利用拼接所產(chǎn)生一致性序列,設(shè)計多態(tài)性EST-SSR位點側(cè)翼引物;
(5)從不同基因型的辣椒材料的嫩綠葉片中提取總DNA ;
(6)用步驟(4)的側(cè)翼引物分別擴增步驟(5)所述的材料,驗證EST-SSR位點的多態(tài)性,具有多態(tài)性的EST-SSR位點的引物的核苷酸序列如序列表SEQ ID NO :1_66所示;
(7)計算每對引物的多態(tài)性信息含量,并對EST-SSR標記進行功能注釋。
本發(fā)明的具體實施方案如下所示
1.辣椒 EST 序列的獲得:登錄 NCBI 的主頁(http://www. ncb1. nlm. nih. gov/),在 All database數(shù)據(jù)庫中,利用“capsicum annuum[orgn]and EST”詞條檢索來自辣椒的EST 序列。獲得檢索結(jié)果后,將辣椒的EST序列下載到本地計算機中。
2.辣椒 EST 序列的拼接利用 CAP3 (Huang X,Madan A. 1999. CAP 3 a DNA sequence assembly program. Genome Research, 9 :868-877.)軟件對 EST 序列進行拼接。 CAP3的參數(shù)取默認值,其中,重疊一致百分比域值(Overlap percent identity cutoff) N > 80 ;重疊長度域值(Overlap length cutoff) N > 40。
3.多態(tài)性EST-SSR位點的鑒定在CAP3軟件產(chǎn)生的CAP3out文件中提取 “detailed display ofcontigs”比對的結(jié)果,用office軟件提供的查找功能,以“一”為檢索符,查找序列比對和拼接結(jié)果中的序列缺失部分(gap),再分析其緊鄰的非缺失序列是否具有SSR特征。SSR位點的判斷標準為重復(fù)基序長度為2-6bp,重復(fù)次數(shù)> 2。如沒有SSR特征,則放棄該序列;如果有SSR特征,則被認為是一個潛在的多態(tài)性EST-SSR位點。4. EST-SSR引物的設(shè)計對含有多態(tài)性EST-SSR的位點,以CAP3軟件產(chǎn)生的一致性序列為基礎(chǔ),利用 Primer3 (http ://frodo. w1. mit. edu/cg1-bin/primer3/primer3_www.cgi)軟件設(shè)計SSR位點兩側(cè)引物,軟件參數(shù)設(shè)置為引物最適長度為20bp,退火溫度為58°C,擴增產(chǎn)物大小為100-300bp。5.供試材料用從市場上購買的31份辣椒商品品種為植物材料,驗證EST-SSR位點的多態(tài)性。按照常規(guī)方法將所購買的辣椒品種種植于田間,在辣椒4葉幼苗期,采集其嫩葉,用天根生化科技(北京)有限公司生產(chǎn)的DNA Isolation Kit試劑盒(按照說明書上描述的方法)提取辣椒基因組DNA,用NAR0DR0P2000 (Thermo公司產(chǎn)品)檢測DNA濃度和純度。將A260與A280比值大于1. 8的高質(zhì)量DNA樣本,稀釋成20ng/μ L工作液,用于PCR擴增。6. PCR擴增和電泳PCR 反應(yīng)的總體積為 IOyL,含有 Ix Buffer, 2mM MgCl2, 200 μ M dNTPs,0.2y]\^|*,0· 5U Taq酶,20ng DNA15PCR反應(yīng)程序為94°C 5min ;94°C 30s,55°C 30s72°C 45s,35個循環(huán);72°C 5min ;12°C保存。PCR反應(yīng)產(chǎn)物采用8%非變性PAGE膠檢測,電泳在DYCZ-30型電泳儀(北京市六一儀器廠產(chǎn)品)上進行,以120V恒壓電泳2h,銀染染色。7.多態(tài)性信息含量的計算根據(jù)下列公式計算EST-SSR標記的多態(tài)性信息含量(Polymorphic Information Content, PIC), PIC是度量標記多態(tài)性檢測能力的一個工具,PIC值越高,表明該位點的多態(tài)性越高。HC=1- Σ/f
尸I式中k是一個SSR所檢測到的等位基因的數(shù)量,P1是第i個等位基因的頻率。同時,利用 P0PGENE1. 32 軟件(Yeh F C,Boyle TJB. 1997. Population geneticanalysis ofco-dominant and dominant markers and quantitative traits. BelgianJournal of Botany,129 :157.)計算每個EST-SSR的觀測雜合度、期望雜合度。8. EST-SSR標記的功能注釋對具有多態(tài)性的SSR位點,將其所在的EST序列用 Blastx(http://blast, ncb1. nlm. nih. gov/Blast. cgi PROGRAM = blastx&BLAST_PROGRAMS = blastx&PAGE_TYPE = BlastSearch&SHOff_DEFAULTS = on&LINK_L0C =blasthome)工具,以E值< 1(T7為標準搜尋NCBI的非冗余蛋白質(zhì)數(shù)據(jù)庫(Non-redundantprotein sequences (nr)),對含有多態(tài)性EST-SSR位點序列進行功能注釋。本發(fā)明的特點在于利用公共序列數(shù)據(jù)庫中EST來源的異質(zhì)性和冗余性,通過對冗余序列的比對,直接獲得多態(tài)性EST-SSR位點。本發(fā)明的優(yōu)點在于1.新穎性。在利用EST序列開發(fā)EST-SSR標記的過程中,EST序列的冗余性是一把雙刃劍。早期利用EST序列開發(fā)SSR標記時,并不對EST序列進行拼接處理,也就無法排除EST冗余性的影響,導(dǎo)致同一 SSR位點被重復(fù)開發(fā)。而后隨著EST序列數(shù)量的急劇增長和EST處理軟件的不斷完善和應(yīng)用,人們在利用EST序列時,通常都會對EST序列進行處理和拼接,以去除載體序列的污染和消除EST序列的冗余性,然后利用一致性序列開發(fā)EST-SSR標記,這種方法提高了 EST-SSR標記開發(fā)的準確性,但忽略了冗余性EST中所含有的多態(tài)性信息。本發(fā)明利用公共數(shù)據(jù)庫中冗余的EST序列來開發(fā)SSR標記,大大地提高了 EST-SSR標記開發(fā)的成功率,具有方法上的新穎性。
本發(fā)明對118,060條來自NCBI的辣椒EST序列進行處理和拼接,獲得了 12,292 個重疊群(contig)和18,467個singleton,覆蓋基因組的長度為23. 12Mbp。對含有冗余 EST序列的contig進行搜索,鑒定出68個多態(tài)性的SSR位點,其中有65個位點可以設(shè)計弓丨物。
2.高效性。利用一致性序列(即去除冗余性以后的序列)開發(fā)SSR標記的方法當前被廣泛使用,這種方法具有高通量的特點,一次能鑒定和開發(fā)出大量的EST-SSR標記。但是由于有些被鑒定出來的串聯(lián)重復(fù)序列本身就是基因組上的序列結(jié)構(gòu),并不具有SSR位點的可變性,因此,利用這種方法開發(fā)出來的多態(tài)性EST-SSR位點的比率通常都不高。而公共序列數(shù)據(jù)庫中的EST序列具有高度的異質(zhì)性和冗余性,即由不同實驗室利用不同基因型材料測序獲得,本發(fā)明直接利用公共序列數(shù)據(jù)庫中EST序列的這一特點,通過對冗余的EST序列比對,直接而高效地鑒定多態(tài)性EST-SSR位點。與傳統(tǒng)的開發(fā)EST-SSR標記的方法相比, 本研究所利用的這種方法雖不具有高通量的特點,但卻顯著地提高了多態(tài)性EST-SSR位點的開發(fā)效率。
本發(fā)明利用31份辣椒材料對65個可設(shè)計引物的EST-SSR位點的多態(tài)性進行實驗驗證,獲得了 33個多態(tài)性EST-SSR標記,其基序重復(fù)次數(shù)分布在2-10次之間,重復(fù)次數(shù)在 5次以下的多態(tài)性EST-SSR位點有18個,占總數(shù)的55%。
因此,本發(fā)明為在辣椒和其它作物上進一步挖掘公共序列數(shù)據(jù)庫中的序列信息, 開發(fā)低重復(fù)次數(shù)的SSR標記提供了一種高效的實驗方法。
3.實用性。通常對EST序列的處理都需要用專業(yè)的生物信息學(xué)軟件,或者專業(yè)人員通過自編程序來完成,這極大限制了育種家對EST-SSR標記的開發(fā)和利用。本發(fā)明利用常用的文字處理軟件的查找功能,鑒定多態(tài)性SSR位點,具有簡單實用的特點。
4.前瞻性。隨著轉(zhuǎn)錄組測序技術(shù)的大規(guī)模應(yīng)用和測序成本的降低,EST序列的數(shù)量已經(jīng)呈現(xiàn)出爆炸式的增長,公共序列數(shù)據(jù)庫中EST序列的冗余量也會越來越豐富。而本發(fā)明所采用的利用EST的冗余性開發(fā)EST-SSR標記的優(yōu)勢逐漸會得到體現(xiàn),可以預(yù)見隨著 EST序列數(shù)量的增多,本方法將來可能會成為開發(fā)EST-SSR標記的主要方法之一。
序列表SEQ IDNO :1_66是本發(fā)明開發(fā)的EST-SSR標記引物的核苷酸序列。
圖1 :利用序列數(shù)據(jù)庫中EST序列的冗余性開發(fā)辣椒SSR標記的流程圖。
圖2 :利用EST序列的冗余性開發(fā)辣椒CAK6標記舉例。A =Contig中序列比對的結(jié)果:多態(tài)性驗證的電泳結(jié)果。圖中箭頭標注的地方為引物結(jié)合位點,方框標注地方為多態(tài)性SSR位點,重復(fù)基序為(GCC) 3-(GCC) 6。
圖3CAK6在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。
圖4CAK7在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。
圖5CAK10在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。
圖6CAK12在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖7CAK13在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖8CAK14在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖9CAK15在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒·品種,M :是 Marker)。圖10CAK18在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖11CAK18在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖12CAK20在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖13CAK21在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖14CAK22在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖15CAK24在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖16CAK28在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖17CAK30在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖18CAK31在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖19CAK33在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖20CAK35在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖21CAK36在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖22CAK40在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖23CAK41在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖24CAK43在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M :是 Marker)。圖25CAK45在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1_31對應(yīng)的是表2中的辣椒品種,M:是 Marker)。
圖26CAK46在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1-31對應(yīng)的是表2中的辣椒品種,M:是 Marker)。
圖27CAK47在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1-31對應(yīng)的是表2中的辣椒品種,M:是 Marker)。
圖28CAK52在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1-31對應(yīng)的是表2中的辣椒品種,M:是 Marker)。
圖29CAK54在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1-31對應(yīng)的是表2中的辣椒品種,M:是 Marker)。
圖30CAK55在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1-31對應(yīng)的是表2中的辣椒品種,M:是 Marker)。
圖31CAK56在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1-31對應(yīng)的是表2中的辣椒品種,M:是 Marker)。
圖32CAK58在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1-31對應(yīng)的是表2中的辣椒品種,M:是 Marker)。
圖33CAK59在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1-31對應(yīng)的是表2中的辣椒品種,M:是 Marker)。
圖34CAK61在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1-31對應(yīng)的是表2中的辣椒品種,M:是 Marker)。
圖35CAK64在31份辣椒種質(zhì)上的擴增結(jié)果(圖中1-31對應(yīng)的是表2中的辣椒品種,M:是 Marker)。
具體實施例方式
實施例1
(I)辣椒EST序列的獲得和拼接登錄NCBI的主頁(http://www.ncb1.nlm.nih.gov/),在 All database 數(shù)據(jù)庫中,利用 “capsicum annuum [orgn] and EST” 詞條檢索來自辣椒的EST序列。獲得檢索結(jié)果后,將辣椒的EST序列下載到本地計算機。截止到2011年 3月31日,在NCBI數(shù)據(jù)庫中共檢索到118,060條來自辣椒的EST序列。利用CAP3軟件對來自于辣椒的EST序列進行拼接,產(chǎn)生了 30,759個Unigene,其中包括12,292個contig和 18,467個singleton,覆蓋基因組的長度為23. 12Mbp。
(2)多態(tài)性EST-SSR位點的鑒定在CAP3軟件產(chǎn)生的CAP3out文件中提取 “detailed display of contigs”比對的結(jié)果,用off ice軟件提供的查找功能,以“一”為檢索符,查找序列比對和拼接結(jié)果中的序列缺失部分(gap),再分析其緊鄰的非缺失序列是否具有SSR特征。SSR位點的判斷標準為重復(fù)基序長度為2-6bp,重復(fù)次數(shù)> 2。如沒有 SSR特征,則放棄該序列;如果有SSR特征,則被認為是一個潛在的多態(tài)性EST-SSR位點。共鑒定出68個含有多態(tài)性SSR位點的contig。
(3)引物設(shè)計對含有多態(tài)性EST-SSR的位點,以CAP3軟件產(chǎn)生的一致性序列為基石出,利用 Primer3 (http://frodo. w1. mit. edu/cg1-bin/primer3/primer3_www. cgi)軟件設(shè)計SSR位點兩側(cè)引物。引物設(shè)計參數(shù)設(shè)定為引物最適長度為20bp,退火溫度為58°C,擴增產(chǎn)物大小為100-300bp。在鑒定出的68個多態(tài)性SSR位點中,有65個位點可以設(shè)計引物。65個EST-SSR位點的特征及引物序列信息見表I。表I從辣椒冗余EST序列中鑒定出來的多態(tài)性EST-SSR位點信息及其引物核苷酸序列
權(quán)利要求
1.一種辣椒EST-SSR標記,其特征在于,所述的EST-SSR標記的核苷酸序列如序列表SEQIDNO :1-66 所示。
2.利用EST序列的冗余性開發(fā)辣椒SSR標記的方法,其特征在于包括下述步驟 (1)從NCBI數(shù)據(jù)庫中檢索并下載辣椒的EST序列; (2)利用CAP3軟件對對辣椒EST序列進行拼接; (3)對拼接后產(chǎn)生的重疊群(Contig)含有所有冗余的EST序列,在Contig序列比對結(jié)果中,用office軟件提供的查找功能,以“一”為檢索符,查找序列比對結(jié)果中的序列缺失部分(gap),再分析其緊鄰的非缺失序列是否具有SSR特征,SSR位點的判斷標準為重復(fù)基序長度為2-6bp,重復(fù)次數(shù)> 2,如沒有SSR特征,則放棄該序列;如果有SSR特征,則被認為是一個潛在的多態(tài)性EST-SSR位點; (4)利用拼接所產(chǎn)生一致性序列,設(shè)計多態(tài)性EST-SSR位點側(cè)翼引物; (5)從不同基因型的辣椒材料的嫩綠葉片中提取總DNA; (6)用步驟⑷的側(cè)翼引物分別擴增步驟(5)所述的材料,驗證EST-SSR位點的多態(tài)性,具有多態(tài)性的EST-SSR位點的引物的核苷酸序列如序列表SEQ ID N0:l_66所示; (7)計算每對引物的多態(tài)性信息含量,并對EST-SSR標記進行功能注釋; 其中步驟¢)的擴增條件如下PCR 反應(yīng)的總體積為 IOii L,含有 Ix Buffer, 2mM MgCl2, 200 u M dNTPs,0. 2 y M 引物,.0.5U Taq 酶,20ng DNA ;PCR 反應(yīng)程序為94°C 5min ;94°C 30s, 55°C 30s, 72°C 45s,35 個循環(huán);72°C 5min ;12°C保存; 其中步驟(7)的計算公式如下
全文摘要
本發(fā)明屬于分子標記開發(fā)技術(shù)領(lǐng)域。具體涉及一種利用EST序列的冗余性開發(fā)辣椒SSR標記及其制備方法。本發(fā)明是利用公共序列數(shù)據(jù)庫中EST來源的異質(zhì)性和冗余性的特點,以冗余的辣椒EST為研究對象,通過對冗余EST序列的比對,鑒定出多態(tài)性的EST-SSR位點并實驗驗證其多態(tài)性。本發(fā)明獲得33個辣椒EST-SSR標記,其核苷酸序列如序列表SEQ ID NO1-66所示。本發(fā)明不僅效率高,而且開發(fā)了大量低重復(fù)次數(shù)的SSR標記,顯著地增加了SSR標記的數(shù)量,為辣椒遺傳育種研究提供了有力的遺傳工具。
文檔編號C12Q1/68GK103013986SQ20111027944
公開日2013年4月3日 申請日期2011年9月20日 優(yōu)先權(quán)日2011年9月20日
發(fā)明者鄒學(xué)校, 孔秋生, 陳文超, 張竹青, 張廣平 申請人:湖南省蔬菜研究所, 華中農(nóng)業(yè)大學(xué)