專利名稱:一種分子標記及其開發(fā)方法
技術領域:
本發(fā)明涉及基因組學、生物信息學和分子生物學三個領域,特別地,涉及一種分子標記以及利用基因組測序和cDNA測序數(shù)據(jù)開發(fā)這種分子標記的方法。
背景技術:
遺傳標記是指可以明確反映遺傳多態(tài)性的生物特征。根據(jù)生物特征所表現(xiàn)的層次,遺傳標記可分成形態(tài)標記、細胞學標記、生化標記、分子標記四種類型。其中分子標記是DNA水平上遺傳變異的直接反映,具有數(shù)量豐富,信息量大,與基因表達無關,檢測不受季節(jié)、環(huán)境和個體發(fā)育階段的影響等優(yōu)點,因而是最理想的遺傳標記。分子標記廣泛應用于遺傳作圖、基因定位、基因克隆、動植物育種、遺傳多樣性分析、親緣關系鑒定、遺傳病鑒定、法醫(yī)學鑒定等許多領域,因而具有重要的理論和應用價值。
自1980年首次提出分子標記的概念以來,已經(jīng)發(fā)展出十多種分子標記。但除了第一代分子標記RFLP(限制性片段長度多態(tài)性)是基于DNA Southern雜交技術的之外,后來發(fā)展的分子標記皆是基于DNA擴增(PCR)技術的。PCR技術由于操作方便,因而更受歡迎。早期發(fā)展出的基于PCR的分子標記主要有RAPD(隨機擴增多態(tài)DNA)、AFLP(擴增片段長度多態(tài)性)、ISSR(簡單序列重復間區(qū))等。這些標記的特點是擴增產(chǎn)物是隨機的,且一般表現(xiàn)為顯性,因而不太理想,目前已用得較少。隨著分子標記技術的發(fā)展,人們越來越青睞特異引物的分子標記,因為它們在染色體上的位置是已知的,而且通常表現(xiàn)為共顯性。目前最受歡迎的特異引物標記是微衛(wèi)星(或稱SSR)標記,它具有多態(tài)性高、數(shù)量豐富、在基因組中分布均勻等優(yōu)點。SSR標記的不足是前期開發(fā)需要很高的投入,但一旦開發(fā)成功,使用起來就非常方便,使用戶受益無窮。目前,對于已完成全基因組測序的擬南芥和水稻來說,借助生物信息學手段,開發(fā)SSR標記已不太困難。目前在水稻中已開發(fā)出將近3000個SSR標記。另外,數(shù)量最為豐富的SNP(單核苷酸多態(tài)性)也正成為一種極具應用潛力的新型分子標記。SNP不僅可以通過PCR進行檢測,也可以通過DNA芯片來檢測。但目前對SNP的檢測在技術上還顯得太復雜,難度較大,因而還難以廣泛應用。
發(fā)明內(nèi)容
本發(fā)明的目的是利用已完成基因組測序及大量cDNA測序的動植物,提供一種分子標記。
該發(fā)明目的是通過以下技術方案來實現(xiàn)的一種分子標記,其特征在于,它是基因的內(nèi)含子。進一步地,所述分子標記基于基因的內(nèi)含子長度的多態(tài)性。
本發(fā)明的目的還在于提供一種分子標記的開發(fā)方法。
該發(fā)明目的是通過以下技術方案來實現(xiàn)的一種權利要求1所述的分子標記的開發(fā)方法,其特征在于,包括以下步驟(1)序列下載獲得基因組序列和cDNA序列;(2)序列分析將獲得的基因組序列與cDNA序列進行聯(lián)配,得到每個基因的內(nèi)含子數(shù)量及長度,對相應的內(nèi)含子進行比較,從而得到兩基因組間有長度差異的內(nèi)含子;(3)引物設計引物設計在兩側的外顯子上或在內(nèi)含子內(nèi)部差異位點兩側的保守序列上;(4)電子PCR利用設計的引物和基因組序列進行電子PCR,選擇只有一個PCR產(chǎn)物的標記作為分子標記;(5)命名將通過電子PCR獲到的分子標記進行命名;(6)建立數(shù)據(jù)庫建立分子標記的數(shù)據(jù)庫,內(nèi)容包括標記的序列、引物及其所在的基因組DNA克隆和cDNA的名稱以及實際PCR產(chǎn)物的電泳結果照片。
進一步地,所述步驟(3)中,所述引物長度一般在18-25堿基之間;所述步驟(5)中,所述命名方式為用RI開頭,后面跟上數(shù)字,每一個標記的名稱都是唯一的;所述步驟(6)中,所述數(shù)據(jù)庫采用MySQL作為關系數(shù)據(jù)庫,采用PHP語言來編寫Web檢索系統(tǒng)。
本發(fā)明具有以下技術效果本發(fā)明的基于內(nèi)含子長度多態(tài)性的分子標記具有共顯性、數(shù)量豐富、穩(wěn)定性好、在基因組中位置已知、特異性高等優(yōu)點,而且實驗操作簡單方便,結果可靠。利用本發(fā)明的技術方法對93-11,日本晴,F(xiàn)1(93-11/日本晴),廣陸矮,協(xié)青早,IR64,越光,秀水11,Merim,Katy,Kyeema進行實驗,所有品種都有擴增產(chǎn)物,差異明顯,多態(tài)性水平高。這一內(nèi)含子長度多態(tài)性的分子標記可應用于遺傳圖譜構建、基因或QTL定位和圖位克隆、標記輔助育種、遺傳多樣性分析、基因組研究等許多方面。
圖1是本發(fā)明的開發(fā)方法的流程圖;圖2是本發(fā)明ILP的示意圖;圖3是本發(fā)明引物設計的示意圖;圖4是本發(fā)明的分子標記的PCR擴增的實例圖,泳道1-12分別為Marker,93-11,日本晴,F(xiàn)1(93-11/日本晴),廣陸矮,協(xié)青早,IR64,越光,秀水11,Merim,Katy,Kyeema。
具體實施例方式
本發(fā)明的分子標記基于內(nèi)含子長度多態(tài)性(Intron Length Polymorphism,ILP)。內(nèi)含子是基因中的非編碼區(qū)段,具有很高的遺傳多態(tài)性,因而可以作為一種分子標記。水稻和擬南芥已經(jīng)完成全基因組測序,并且已在兩個亞種或生態(tài)型上完成測序,并已測定了大量的全長cDNA序列,有關資料可以從互聯(lián)網(wǎng)數(shù)據(jù)庫[如TIGR(http//www.tigr.org)、RGP(http//rgp.dna.affrc.go.jp/)、BGI(http//rise.genomics.org.ac)等]獲得。借助生物信息學的方法,對DNA序列數(shù)據(jù)進行有效的分析。這為大規(guī)模檢索和開發(fā)基于內(nèi)含子多態(tài)性的分子標記提供了可能。
下面根據(jù)附圖,以水稻為例詳細說明本發(fā)明分子標記的開發(fā)方法。
如圖1所示,本發(fā)明的分子標記的開發(fā)方法包括以下步驟1、序列下載利用國際水稻測序中心發(fā)布的粳稻品種Nipponbare的基因組序列數(shù)據(jù)和華大基因中心發(fā)布的秈稻品種93-11的基因組序列數(shù)據(jù),分別從TIGR網(wǎng)站(http//www.tigr.org)和Rise網(wǎng)站(http//rise.genomics.org.cn)下載。此外,還利用已公布的水稻全長cDNA序列數(shù)據(jù),從日本的KOME網(wǎng)站http//cdna01.dna.affrc.go.jp/cDNA/)下載。
2、序列分析通過BLASTN程序(參數(shù)為e值<10-20),把cDNA與Nipponbare和93-11的基因組序列進行聯(lián)配,獲得匹配最好的基因組序列,然后通過SIM4程序把cDNA序列與基因組序列進行精確聯(lián)配,獲得每個基因的內(nèi)含子數(shù)量及長度,并對相應的內(nèi)含子進行比較,獲得兩亞種基因組間有長度差異的內(nèi)含子,如圖2所示。
3、引物設計對于長度較短(<500bp)的內(nèi)含子,PCR引物設計在兩側的外顯子上,其好處是外顯子較基因組的其它序列要保守。但對于長度較長(>500bp)的內(nèi)含子,則在內(nèi)含子內(nèi)部差異位點兩側的保守序列上設計引物。引物長度一般在18-25堿基之間,退火溫度一般在54-60℃之間。用primer3的程序進行引物設計,如圖3所示。一般在不同的位置設計出五對引物,供選擇。
4、電子PCR在進行電子PCR時,將誤配堿基數(shù)設定為0個。選擇只有一個PCR產(chǎn)物的標記作為候選標記,去除一對引物在不同克隆上擴增到多個PCR產(chǎn)物的標記。
5、命名將通過電子PCR獲到的分子標記進行命名,命名方式為用RI開頭,后面跟上數(shù)字,例如RI00008。每一個標記的名稱都是唯一的。
6、建立數(shù)據(jù)庫在前面開發(fā)工作的基礎上,建立水稻ILP標記的數(shù)據(jù)庫(基于多態(tài)性的關系數(shù)據(jù)庫),內(nèi)容包括標記的序列、引物及其所在的秈、粳稻基因組DNA克隆和cDNA的名稱以及實際PCR產(chǎn)物的電泳結果照片。本數(shù)據(jù)庫采用MySQL作為關系數(shù)據(jù)庫,采用PHP語言來編寫Web檢索系統(tǒng)。
下面實驗驗證本發(fā)明分子標記引物的正確性和可行性,并檢驗引物的通用性和多態(tài)性水平。
圖4是本發(fā)明的分子標記的PCR擴增的實例,泳道1-12分別為Marker,93-11,日本晴,F(xiàn)1(93-11/日本晴),廣陸矮,協(xié)青早,IR64,越光,秀水11,Merim,Katy,Kyeema為了驗證分子標記引物的正確性和可行性,合成標記的引物,以Nipponbare和93-11為材料,剪取幼嫩葉片提取基因組DNA作為模板,按常規(guī)PCR程序進行擴增。退火溫度設定在54-60℃之間,循環(huán)35次。根據(jù)預測的擴增產(chǎn)物大小的不同,在瓊脂糖凝膠或非變性聚丙烯酰胺凝膠上進行電泳分離,用紫外線照射或銀染顯帶。擴增結果與預期吻合的,說明引物設計是正確的和可行的。
為了檢驗引物的通用性和多態(tài)性水平,選擇若干個不同亞種或生態(tài)類型的水稻品種,用上述合成的引物,按上述相同的方法進行實驗,觀察各個品種的擴增情況和差異條帶數(shù)目。在所有品種中皆有擴增產(chǎn)物的,說明通用性好;差異條帶數(shù)多的,說明多態(tài)性水平高。
上述實施例用來解釋說明本發(fā)明,而不是對本發(fā)明進行限制,在本發(fā)明的精神和權利要求的保護范圍內(nèi),對本發(fā)明作出的任何修改和改變,都落入本發(fā)明的保護范圍。
權利要求
1.一種分子標記,其特征在于,它是基因的內(nèi)含子。
2.根據(jù)權利要求1所述的分子標記,其特征在于,所述分子標記基于基因的內(nèi)含子長度的多態(tài)性。
3.根據(jù)權利要求1所述的分子標記,其特征在于,該分子標記的PCR產(chǎn)物長度在100~1100bp以內(nèi)。
4.一種權利要求1所述的分子標記的開發(fā)方法,其特征在于,包括以下步驟(1)序列下載獲得基因組序列和cDNA序列。(2)序列分析將獲得的基因組序列與cDNA序列進行聯(lián)配,得到每個基因的內(nèi)含子數(shù)量及長度,對相應的內(nèi)含子進行比較,從而得到兩基因組間有長度差異的內(nèi)含子。(3)引物設計引物設計在兩側的外顯子上或在內(nèi)含子內(nèi)部差異位點兩側的保守序列上。(4)電子PCR利用設計的引物和基因組序列進行電子PCR,選擇只有一個PCR產(chǎn)物的標記作為分子標記。(5)命名將通過電子PCR獲到的分子標記進行命名。(6)建立數(shù)據(jù)庫建立分子標記的數(shù)據(jù)庫,內(nèi)容包括標記的序列、引物及其所在的基因組DNA克隆和cDNA的名稱以及實際PCR產(chǎn)物的電泳結果照片。
5.根據(jù)權利要求4所述的開發(fā)方法,其特征在于,所述步驟(3)中,所述引物長度一般在18-25堿基之間。
6.根據(jù)權利要求4所述的開發(fā)方法,其特征在于,所述步驟(5)中,所述命名方式為用RI開頭,后面跟上數(shù)字,每一個標記的名稱都是唯一的。
7.根據(jù)權利要求4所述的開發(fā)方法,其特征在于,所述步驟(6)中,所述數(shù)據(jù)庫采用MySQL作為關系數(shù)據(jù)庫,采用PHP語言來編寫Web檢索系統(tǒng)。
全文摘要
本發(fā)明公開了一種分子標記及其開發(fā)方法,本發(fā)明依據(jù)內(nèi)含子長度的不同,在內(nèi)含子兩側外顯子上或在內(nèi)含子內(nèi)部差異位點兩側保守序列上設計引物,并通過電子PCR和實際PCR進行檢驗,從而將ILP開發(fā)成能夠用PCR進行檢測的分子標記。這種標記具有共顯性、數(shù)量豐富、實驗簡單、穩(wěn)定性好、特異性高等優(yōu)點,可應用于遺傳圖譜構建、基因或QTL定位、標記輔助育種、遺傳多樣性分析、基因組研究等許多方面。
文檔編號C12N15/11GK1632117SQ200410084499
公開日2005年6月29日 申請日期2004年11月22日 優(yōu)先權日2004年11月22日
發(fā)明者吳為人, 汪旭升, 趙向前 申請人:浙江大學