專利名稱:新的hmga等位基因及作為生長、脂肪量、肉質(zhì)及飼料消耗比性狀遺傳標記的應(yīng)用的制作方法
背景技術(shù):
遺傳多態(tài)性存在于動物個體之間,也存在于通過育種技術(shù)得到的具有所需特征的品種之間。例如,中國品種已知性成熟早、產(chǎn)崽數(shù)高,而美國品種已知生長迅速、瘦肉率高。然而,所需性狀的遺傳度往往較低,而且依據(jù)表型變異選擇動物的傳統(tǒng)育種方法并沒有充分地考慮存在的遺傳變異和復雜的基因相互作用。
已經(jīng)有幾個研究小組用限制性片段長度多態(tài)性(RFLP)分析研究了豬的DNA。在此并入?yún)⒖嫉腏ung等Theor.Appl.Genet.,77271-274(1989)報道了他們使用RFLP技術(shù)顯示兩個豬品種間的遺傳變異。這些品種中證明了豬白細胞抗原(SLA)I類基因的多態(tài)性。在此并入?yún)⒖嫉腍oganson等在Abstract for Annual Meeting ofMidwestern Section of the American Society of Animal Science,March26-28,1990中也報道了RFLP分析所證明的中國豬豬主要組織相容性復合體(MHC)基因的多態(tài)性。在此并入?yún)⒖嫉腏ung等在Theor.Appl.Genet.,77271-274(1989)中還報道了對某些公豬中SLA I類基因的RFLP分析。作者提出結(jié)果提示豬SLA/MHC I類基因和豬的生殖及行為性狀之間可能相關(guān)。他們進一步提出應(yīng)用SLA I類限制性片段作為遺傳標記,將來很可能會有助于我們改良豬的生長行為。
要追蹤特定有利遺傳等位基因包括新的及冗長的鑒別主要效應(yīng)基因的DNA分子標記的方法。。標記可能與具有主效的單個基因連鎖,也可能與具有附加效果的多個基因連鎖。DNA標記有一些優(yōu)點易于分離測量而且明確,并且DNA標記是共顯性的,即能明確地區(qū)分雜合子和純合子動物。一旦建立了一個標記系統(tǒng),那么選擇就很容易進行了,因為從動物幼體甚至是胚胎中獲得組織或血液樣本后,可以隨時進行DNA標記的檢測。
受體基因遺傳差異的應(yīng)用已經(jīng)成為了進行選擇的一個重要標記系統(tǒng)。例如,Rothschild等人的美國專利5,550,024和5,374,526揭示了與產(chǎn)崽數(shù)提高相關(guān)的豬雌激素受體基因的多態(tài)性,其在此并入?yún)⒖?;美國專利?,935,784揭示了與產(chǎn)崽數(shù)提高和總體繁殖率相關(guān)的豬促乳素受體基因的多態(tài)性標記。
生豬肉的質(zhì)量受到多種遺傳和非遺傳因素的影響。后者包括農(nóng)場、運輸、屠宰和加工條件。肉類科學家針對這些因素已經(jīng)進行了大量的研究,從而大大提高了豬肉的質(zhì)量。部分研究針對動物的遺傳背景,而且一些研究揭示了遺傳因素的重要性。這使工業(yè)上意識到動物選擇性育種和基因技術(shù)在提高豬肉質(zhì)量方面可以起到重要的作用。
DNA水平的信息可以有助于確定特定的主效基因,但它同時也有助于就我們選定的數(shù)量性狀進行選擇。除了表型數(shù)據(jù),分子信息可以提高選擇的精確度從而提高選擇應(yīng)答。許多科研工作者已經(jīng)從理論角度對這樣一個標記輔助選擇系統(tǒng)(Marker Assisted Selection)(MAS)程序中的額外應(yīng)答的大小進行了研究??偟膩碚f,MAS對于遺傳度低及測量表型昂貴的表型而言更為有益。盡管如生長、脂肪量、肉質(zhì)及飼料消耗比的性狀通常并不用這種方法來考量,但就這些性狀而言,使用標記進行選擇仍然有非常明顯的優(yōu)點。例如,Meuwissen和goddard分析了MAS對不同類型性狀的影響。如肉質(zhì)的性狀在屠宰后測量的性狀中受到的影響最大并且結(jié)合標記信息信息額外的應(yīng)答可以達到64%。對生長性狀這種在活體動物上測量的性狀而言,這個數(shù)字相對要小,是8%。但是,一旦證明這種關(guān)聯(lián)的存在,那么在表型測試或是選擇動物之前(參見下文),可以使用這個標記信息,這樣預計可以取得最高達38%的應(yīng)答。
確實,從遺傳上改良經(jīng)濟性狀的最佳途徑是在待選的群體中直接尋找相關(guān)的DNA標記。在育種機構(gòu)的核心動物群的一些動物中可以連續(xù)進行表型測量。由于這些性狀中的絕大多數(shù)只能在屠宰后才能得到完整評估,因此數(shù)據(jù)只能取自被選擇的動物而不能得自潛在的育種動物。
收集這些表型數(shù)據(jù)以便能夠檢測出相關(guān)的DNA標記,并使用實驗種群確證鑒別的標記或測試候選基因。明顯的標記或基因可以直接運用到選擇方法中。這種分子信息的一個優(yōu)點在于我們能在育種動物還非常年幼時就獲得它,意味著可以在完成生長行為測試之前就基于DNA標記預選擇動物。這對總體測試和選擇系統(tǒng)而言是非常有利的。
從前述的內(nèi)容我們可以看到,需要鑒別遺傳標記,其可以用于在基因水平通過鑒別及選擇具有改良性狀的動物而改良具有經(jīng)濟價值的有益性狀。
本發(fā)明的一個目的是提供基于或在編碼HMGA的核苷酸序列中的遺傳標記,其是如生長、脂肪量、肉質(zhì)及飼料消耗比等具有經(jīng)濟價值的有利性狀的一個表征。
本發(fā)明的另一個目的是提供確定這個遺傳標記是否存在的檢測方法。
另一個目的是提供一種評估動物的方法,該方法提高了針對所需性狀的選擇及育種方法的精確性。
此外本發(fā)明的另一個目的是提供一種PCR擴增的檢測方法,其可以快速確定該標記是否存在。
本發(fā)明的其他目的和優(yōu)點一部分將在下文說明書中得到說明,而且也可以部分地由說明書中明顯得出,或是通過實施本發(fā)明了解到。本發(fā)明的目的和優(yōu)點可以通過所附權(quán)利要求中的手段及特別指出的組合實現(xiàn)。
發(fā)明概述本發(fā)明涉及編碼HMGA的核苷酸序列的不同基因形式的發(fā)現(xiàn),其可以用于對追蹤動物品系的遺傳鑒別及作為與動物的生長、脂肪量、肉質(zhì)和飼料消耗比性狀相關(guān)的遺傳標記。這些基因在物種和動物之間都是保守的,預計此處揭示的不同等位基因也與其它經(jīng)濟或產(chǎn)肉動物如牛、羊、雞等的這些基因的多態(tài)性相關(guān)。
為了達到所述目的并依照本發(fā)明的目的,如此處包含及廣泛描述的,本發(fā)明提供了不同基因型的發(fā)現(xiàn),其提供了遺傳分型動物及篩選動物以確定更有可能具備有利的生長、脂肪量、肉質(zhì)及飼料消耗比性狀的動物或選擇淘汰具有表明較不利的生長、脂肪量、肉質(zhì)及飼料消耗比性狀的動物的方法。此處所說的“有利的生長、脂肪量、肉質(zhì)、飼料消耗比性狀”是指多個可測量的生長、脂肪量、肉質(zhì)、飼料消耗比性狀中之一相比一個給定群體的平均值,有顯著的改良(增高或降低),所以這個信息可以用于育種中以獲得一個在生長、脂肪量、類質(zhì)、飼料消耗比方面優(yōu)化的均一群體,這可以包括根據(jù)所需性狀,提高某些性狀或降低其它性狀。如欲了解一些經(jīng)濟性狀的例子,可參考以下文獻Sosnicki,A.A.,E.R.Wilson,E.B.Sheiss,A.deVries,1998“Is there a cost effective way to produce high quality pork?”,ReciprocalMeat Conference Proceedings,Vol.51.
因此,本發(fā)明提供了篩選動物以鑒別更可能產(chǎn)生有利的生長、脂肪量、肉質(zhì)及飼料消耗比,或不太可能產(chǎn)生這些有利的生長、脂肪量、肉質(zhì)及飼料消耗比的動物的的方法,以對最佳生長、脂肪量、肉質(zhì)及飼料消耗比優(yōu)化育種及選擇技術(shù)。
檢測這些性狀的方法一般包括以下步驟1)從動物中獲取生物學樣品;及2)分析1)中獲得的基因組DNA或蛋白質(zhì),確定存在哪種HMGA等位基因。也可以使用單元型數(shù)據(jù),其將HMGA基因的一系列多態(tài)性運用到選擇或鑒別方案中以最大化這些標記的益處。
由于一些多態(tài)性可能在于HMGA蛋白氨基酸組成的變化,或是表明存在這種變化,因此檢測方法甚至也可以包括對HMGA蛋白氨基酸組成的確定。進行這樣的純化和分析的方法典型地涉及通過包括熒光標記抗體的手段分離蛋白,分離純化蛋白(即利用反相HPLC系統(tǒng)),及使用自動蛋白質(zhì)測序儀鑒定存在的氨基酸序列。這些檢測使用的方法是本領(lǐng)域中已經(jīng)標準化并已知的,如Ausubel等(eds.),ShortProtocols in Molecular Biology Fourth ed.John Wiley and Sons 1999所揭示。
一個優(yōu)選的實施方案中,分析了遺傳樣品。簡而言之,從動物中獲取遺傳物質(zhì)樣品,并分析該樣品以確定是否含有與改良的生長、脂肪量、肉質(zhì)、飼料消耗比相關(guān)的HMGA核苷酸序列多態(tài)性。
本領(lǐng)域技術(shù)人員熟知,要比較核酸分子之間的序列差異,有多種技術(shù)可以應(yīng)用。這些包括比如限制性片段長度多態(tài)性分析、異源雙鏈分析、單鏈構(gòu)象多態(tài)性分析、變性梯度電泳和溫度梯度電泳。
一個優(yōu)選的實施方案中,多態(tài)性是限制性片段長度多態(tài)性,其檢測包括以下步驟從分離的遺傳物質(zhì)中鑒定動物的HMGA基因;將該基因暴露于限制性酶以產(chǎn)生該基因的長度不同的限制片段;分離限制片段形成限制性圖譜,如通過電泳或HPLC分離;及比較從已知含有或不含有所述標記的HMGA核苷酸序列得到的限制性片段圖譜。如果一個動物對標記測試呈陽性,可以考慮將這樣的動物納入育種計劃。如果動物對標記基因型測試不呈陽性,則可以將它挑出用作他用。單元型數(shù)據(jù)的應(yīng)用還可以與篩選與生長、脂肪量、肉質(zhì)和飼料消耗比的不同方面的復等位基因相組合。
最優(yōu)選的實施方案中,通過使用引物及DNA聚合酶擴增含有多態(tài)性的這些基因的特異區(qū)域來分離這些基因。然后用限制性酶消化擴增的區(qū)域并分離得到的片段。顯示RFLP圖譜可以通過對片段進行簡單染色進行,或者通過標記擴增過程中使用的引物或核苷三磷酸。
另一個實施方案中,本發(fā)明包含了在特定的動物群體中鑒定有關(guān)生長、脂肪量、肉質(zhì)及飼料消耗比的遺傳標記的方法。繁殖同一個品種或雜交種或是相似遺傳品系的雌性動物和雄性動物,并確定每個動物的生長、脂肪量、肉質(zhì)和飼料消耗比。鑒別每個動物的一個或全部兩個HMGA等位基因的多態(tài)性,并將其與生長、脂肪量、肉質(zhì)及飼料消耗比相關(guān)聯(lián)。優(yōu)選地,使用RFLP分析確定多態(tài)性。
另一個實施方案中,本發(fā)明包含了對任意的一種特定經(jīng)濟動物進行生長、脂肪量、肉質(zhì)及飼料消耗比的遺傳標記鑒別的方法?;谶@個基因在不同動物中的高度保守性,推測僅用上述常規(guī)檢測方法可以將該標記應(yīng)用到不同動物中,以基于此處的教導進行生長、脂肪量、肉質(zhì)、飼料消耗比的選擇。繁殖同一個品種或雜交種或是具有相似遺傳品系的雌性和雄性動物,并確定每個動物的生長、脂肪量、肉質(zhì)和飼料消耗比并相關(guān)聯(lián)。對于可以獲取其序列的其它動物,可以使用BLAST對比確定特定等位基因是否與此處揭示的一個等位基因相似。這種相似的多態(tài)性存在于其它動物和其他緊密相關(guān)的基因中。術(shù)語“相似的多態(tài)性”應(yīng)該是由BLAST對比確定的與上述任一相同的多態(tài)性。
以下術(shù)語用于描述兩個或多個核酸或多核苷酸之間的序列關(guān)系(a)“參考序列”,(b)“對比窗”,(c)“序列一致性”,(d)“序列一致性比例”和(e)“實質(zhì)一致性”。
(a)此處所用“參考序列”是一個用于序列對比基礎(chǔ)的確定的序列,此處指參考HMGA序列。一個參考序列可以是一個特異序列的一部分或全部,例如全長cDNA或基因序列的一部分,或是全部cDNA或基因序列。
(b)此處所用“對比窗”指一個多核苷酸序列的一個連續(xù)且特異的片段,其中該多核苷酸序列可以與一個參考序列相對比,而且其中對比窗中的該部分多核苷酸序列與參考序列(其沒有添加或缺失)相比,可以包含添加或缺失(即,缺口),以充分地對比這兩個序列。一般而言,對比窗在長度上至少要有20個連續(xù)的核苷酸,也任意地可以是30、40、50、100甚至更多。本領(lǐng)域技術(shù)人員了解為避免由于多核苷酸序列含有缺口而導致的與參考序列的高相似性,典型地要引入一個缺口懲罰值,并從匹配數(shù)中減去。
本領(lǐng)域熟知對比序列的對比方法。最佳的序列對比的對比可以采用局部同源性算法(Local Homology Algorithm),Smith and Waterman,Adv.Appl.Math.2482(1981);同源性對比算法(Homology AlignmentAlgorithm),Needleman and Wunsch,J.Mol.Biol.48443(1970);尋似法(Search for Similarity Method),Pearson and Lipman,Proc.Natl.Acad.Sci.852444(1988);以及這些算法的計算機化應(yīng)用,包括但非限于Intelligenetics,Mountain View,California開發(fā)的PC/Gene程序中的CLUSTAL;Genetics Computer Group(GCG),575 Science Dr.,Madison,Wisconsin,USA開發(fā)的Wisconsin Genetics Software Package中的GAP、BESTFIT、BLAST、FASTA和TFASTA;CLUSTAL程序在以下文獻中有詳細的描述Higgins and Sharp,Gene 73237-244(1988);Higgins and Sharp,CABIOS 5151-153(1989);Corpet,et al.,NucleicAcids Research 1610881-90(1988);Huang,et al.,ComputerApplications in the Biosciences 8155-65(1992);及Pearson,et al.,Methods in Molecular Biology 24307-331(1994)??捎糜跀?shù)據(jù)庫相似性搜尋的BLAST系列程序包括用于將核苷酸查詢序列與核苷酸數(shù)據(jù)庫序列進行對比的BLASTN;用于將核苷酸查詢序列與蛋白質(zhì)數(shù)據(jù)庫序列進行對比的BLASTX;用于將蛋白質(zhì)查詢序列與蛋白質(zhì)數(shù)據(jù)庫序列進行對比的BLASTP;用于將蛋白質(zhì)查詢序列與核苷酸數(shù)據(jù)庫序列進行對比的TBLASTN;以及用于將核苷酸查詢序列與核苷酸數(shù)據(jù)庫序列進行對比的TBLASTX。參見Current Protocols in MolecularBiology,Chapter 19,Ausubel,et al.,Eds.,Greene Publishing andWiley-Interscience,New York(1995)。
除非另有說明,本文提供的序列一致性/相似性數(shù)值指的是使用BLAST 2.0版本中的全套程序、在參數(shù)設(shè)為默認值下獲得的數(shù)值。參見Altschul et al.,Nucleic Acids Res.253389-3402(1997)。進行BLAST分析的軟件可公開獲得,例如國家生物技術(shù)信息中心(http//www.hcbi.nlm.nih.gov/)。
這個算法首先要確定“高得分序列對”(high scoring sequencepairs)(HSPs),從查詢序列中鑒定一個長度為W的短字,與數(shù)據(jù)庫序列中相同長度的一個字對比時,其匹配或滿足某個正數(shù)閾值分值T。T被稱為鄰近字分值閾值(neighborhood word score threshold)(Altschul et al.,同上)。這些初始的鄰近字采樣(neighborhood wordhits)作為起始搜尋發(fā)現(xiàn)含有其的更長的HSPs的種子。只要累積對比分值還能增加,字采樣就沿每個序列向兩個方向延伸。對于核苷酸序列,使用參數(shù)M(一對匹配殘基的獎勵分值,總是>0)和N(對錯配殘基的懲罰分值,總是<0)計算累積分值。對于氨基酸序列,利用一個得分矩陣(scoring matrix)來計算累積分值。字采樣向每個方向延伸在下列情況時停止累積對比分值比其得到的最大值小X;由于一或多個負分值殘基對比的累積,累積分值等于或小于0;或者到了一個序列的端點。BLAST算法的參數(shù)W、T和X決定了對比的靈敏度和速度。(核苷酸序列)BLASTN程序使用的缺省設(shè)置為字長(W)為11,期望值(E)為10,落差值為100,M=5,N=-4,并且對比兩條鏈。對于氨基酸序列,BLASTP程序使用的缺省設(shè)置為字長(W)為3,期望值(E)為10,及得分矩陣為BLOSUM62(參見Henikoff& Henikoff(1989)Proc.Natl.Acad.Sci.USA 8910915)。
除計算序列一致性百分比外,BLAST算法也可對兩個序列之間的相似性進行統(tǒng)計分析(參見,例如Karlin & Altschul,Proc.Natl.Acad.Sci.USA 905873-5787(1993))。BLAST算法提供的相似性的一種測量方法是最小總可能性(smallest sum probability)(P(N)),其表示兩個核苷酸或氨基酸序列隨機配對的可能性。
BLAST搜尋假設(shè)蛋白質(zhì)可以被模型化為隨機序列。然而,很多真實的蛋白質(zhì)包含非隨機序列區(qū)域,其可能是同聚物序列(homopolymeric tracts)、短周期重復序列或是富含一或多種氨基酸的區(qū)域。可以在非相關(guān)蛋白質(zhì)之間對比這些低復雜性區(qū)域,盡管其它區(qū)域可能完全不同。可以使用多個低復雜性過濾程序減少這些低復雜性對比。例如,可以單獨或組合使用SEG(Wooten and Federhen,Comput.Chem.,17149-163(1993))和XNU(Claverie and States,Comput.Chem.,17191-201(1993))低復雜性過濾程序。
(c)本文中兩個核酸或多肽序列的“序列一致性”或“一致性”是指當就一個特異的對比窗進行最大對應(yīng)對比時,兩序列中相同的殘基。當在蛋白質(zhì)中使用序列一致性百分比時,認為不一致的殘基位置通常由保守的氨基酸取代造成不同,其中氨基酸殘基被其它有相似化學性質(zhì)(比如帶電情況和疏水性)的氨基酸殘基所取代,因此并不改變分子的功能性質(zhì)。當序列在保守取代上有差異,可以上調(diào)序列一致性百分比以校正該取代的保守性質(zhì)。由于保守取代有差異的序列被稱為具有“序列相似性”或“相似性”。本領(lǐng)域技術(shù)人員熟知進行這種調(diào)整的方法。典型地,這需要將一個保守取代看作部分的而不是完全的錯配來得分,因而提高了序列一致性百分比。因此,例如,當一個相同氨基酸給1分,一個非保守取代給0分時,那么一個保守取代給分在0到1之間。保守取代的得分是通過計算得出的,比如可以依照Meyers and Miller,Computer Applic.Biol.Sci.,411-17(1988)例如,如程序PC/GENE(Intelligenetics,Mountain View,California,USA)中提到的算法。
(d)“序列一致性百分比”指通過對一個對比窗對比兩條最佳對比的序列確定的數(shù)值,其中與參考序列(其不包含添加或缺失)相比,該對比窗的多核苷酸序列部分可以包含添加或缺失(即,缺口),以最佳對比這兩個序列。通過如下方法計算該百分比確定兩個序列中相同核酸堿基或氨基酸殘基所在的位點數(shù)以確定匹配位點數(shù),將匹配位點數(shù)除以對比窗中所有位點數(shù)再乘以100以計算出序列一致性百分比。
(e)術(shù)語多核苷酸序列的“實質(zhì)一致性”是指一個多核苷酸包含這樣一段序列,使用上述標準參數(shù)設(shè)置的對比程序之一確定,其相比于一個參考序列具有至少70%序列一致性、優(yōu)選至少80%,更優(yōu)選至少90%及最優(yōu)選至少95%的序列一致性。本領(lǐng)域技術(shù)人員已知可以在考慮密碼子兼并性、氨基酸相似性、閱讀框的定位等的前提下,可以適當?shù)卣{(diào)整這些值以確定兩個核苷酸序列所編碼的蛋白質(zhì)的一致性。為此目的,氨基酸序列的實質(zhì)一致性一般是指序列的一致性至少為60%,或優(yōu)選至少為70%、80%、90%,及最優(yōu)選至少為95%。
這些程序和算法可以在一個靶基因中確定特定多態(tài)性與本文所述的多態(tài)性之間的相似性。預計這種多態(tài)性在其它動物中也存在,而且在其它動物中對這種多態(tài)性的利用可以依照本文的提示,通過簡單地參數(shù)優(yōu)化就可以實現(xiàn)。
另外,還可能在不同DNA標記的特異等位基因與已知與特定基因(如本文討論的HMGA基因)相關(guān)的DNA標記的等位基因之間建立連鎖,其已顯示與特定性狀相關(guān)。因此,在現(xiàn)有情況下,利用一個或全部兩個HMGA基因,通過選擇不同染色體標記的特異等位基因而選擇HMGA相關(guān)標記的某些等位基因,至少在短期內(nèi)可以間接選擇可能產(chǎn)生所需的生長、脂肪量、肉質(zhì)和飼料消耗比的動物,或是淘汰在可能產(chǎn)生非所需的生長、脂肪量、肉質(zhì)和飼料消耗比的動物。本文所說的“遺傳標記”不應(yīng)該僅僅包括通過檢測多態(tài)性相關(guān)的蛋白質(zhì)變化、連鎖標記、使用微衛(wèi)星手段揭示的核苷酸多態(tài)性,還甚至包括檢測標記表明的蛋白變化及使用其影響動物生長、脂肪量、肉質(zhì)和飼料消耗比的手段揭示的核苷酸多態(tài)性。
正如本文所用,通常一個特定多態(tài)性是以一個特定限制性酶的名稱來命名。這并不意味著識別該位點的唯一途徑就是使用這種限制性酶。本領(lǐng)域技術(shù)人員可以獲得許多數(shù)據(jù)庫和資源鑒定其他可用于鑒定特定多態(tài)性的限制性酶例如http//darwin.bio.geneseo.edu,其可以依據(jù)待鑒定的序列和多態(tài)性的分析,給出限制性酶。實際上,本文也表明有多種不同方法可以鑒定特定多態(tài)性或等位基因,其可能甚至都不使用限制性酶,但其檢測相同的遺傳或蛋白質(zhì)組的不同形式。
并入的作為本文說明書組成部分的附圖闡明了本發(fā)明的一個實施方案,并且與說明書一起闡明本發(fā)明的原理。
圖1a和b示出了HMGA I的BanI(a)和NaeI(b)PCR-RFLP測試結(jié)果。
圖2示出了HMGA2的HhaI PCR-RFLP測試結(jié)果。
圖3是豬hmga1的共有序列(SEQ ID NO19)。
下劃線及粗體字標示出的是兩個BanI識別位點。其中一個在54位含有單核苷酸多態(tài)性。NaeI多態(tài)性位點(GCYGGC)以下劃線表示。
Y=C或T。
圖4是豬hmga2的一個共有序列,長度1168。三個HhaI識別位點(GCGC)以下劃線表示,其中兩個同時加亮,其含有DNA多態(tài)性。SEQ ID NO20。
框1是Mix1的近似PCR片段。
框2是Mix2的近似PCR片段。
K=G或T
Y=C或T圖5是表中所示的Berkshire和Yorkshire雜交品種豬1號染色體的重組頻率圖(recomb.Frac.,Kosambi cM)圖6是Berkshire和Yorkshire雜交品種豬7號染色體的遺傳圖譜。性平均值圖(recomb.frac.,Kosambi cM)。
圖7總結(jié)了HMGA1的其它引物位置和區(qū)域。
圖8是豬HMGA1的DNA序列(重疊群(contig)1)長度2484bp.SEQ ID NOS21-24圖9是豬HMGA1的DNA序列(重疊群2)長度1103 bp.NOS25-29發(fā)明詳述以下參考文獻將詳細說明本發(fā)明的實施方案,與以下的實施例一起解釋本發(fā)明的原理。
本發(fā)明涉及與動物有經(jīng)濟價值的性狀有關(guān)的遺傳標記。該標記代表與生長、脂肪量、肉質(zhì)及飼料消耗比性狀顯著相關(guān)的等位基因,因此本發(fā)明提供了一種育種時篩選動物以確定可能更可能產(chǎn)生所需生長、脂肪量、肉質(zhì)及飼料消耗比(一個或全部這些性狀)的動物的方法,通過鑒別與所需生長、脂肪量、肉質(zhì)及飼料消耗比相關(guān)的一或兩個HMGA核苷酸序列多態(tài)性的存在與否來進行。
因此,本發(fā)明涉及鑒別特定品種(breed)、種系(strain)、種群(population)或群體(group)動物的遺傳標記以及鑒定這些標記的方法,由此可以篩選出具備所需的生長、脂肪量、肉質(zhì)及飼料消耗比的動物。
本發(fā)明鑒定了與動物改良性狀相關(guān)的HMGA核苷酸序列的新等位基因。本發(fā)明的一個實施方案中,已經(jīng)示出通過BanI或NaeI限制性位點識別的新的豬HMGA1等位基因與較低的脂肪含量和其它如脂肪、生長、肉質(zhì)和/或飼料消耗比性狀相關(guān)。另一個實施方案中,已經(jīng)鑒定了與脂肪和生長性狀相關(guān)的HMGA2基因的一個新的HhaI識等位基因。在另一個實施方案中,已經(jīng)示出所述標記一起具有加性效應(yīng)(additive effect)。
可以使用任何可以鑒定這個標記存在與否的方法,包括例如單鏈構(gòu)象多態(tài)性(SSCP)分析、堿基切除序列掃描(BESS)、RFLP分析、異源雙鏈分析、變性梯度凝膠電泳及溫度梯度電泳、等位基因PCR、連接酶鏈式反應(yīng)直接測序、微測序、核酸雜交、微陣列檢測HMGA基因或其它HMGA基因連鎖序列。而且本發(fā)明的范圍還包括了在這個多態(tài)性存在的情況下對蛋白質(zhì)構(gòu)象或序列變化的檢測。多態(tài)性可能不是導致突變出現(xiàn)的原因,但它指示這個變化的存在,而且可以同時檢測表型差異的遺傳或蛋白質(zhì)基礎(chǔ)。
以下內(nèi)容是可以用于檢測本發(fā)明的多態(tài)性的技術(shù)的一般性回顧。
本發(fā)明中,從動物中取得遺傳物質(zhì)樣品。樣品可以來自血液、組織、精液等。一般常使用外周血細胞作為來源,并且遺傳物質(zhì)是DNA。獲得足夠量的細胞以提供供分析用的足量的DNA。本領(lǐng)域技術(shù)人員已知或容易確定這個量。通過本領(lǐng)域技術(shù)人員已知的技術(shù)從血細胞中分離DNA。
核酸的分離和擴增基因組DNA樣品可以分離自任何方便地來源,所述來源包括唾液、口腔細胞、毛根、血液、臍帶血(cord blood)、羊水、組織液、腹膜液、絨毛膜絨毛,以及有完整分裂間期(interphase)細胞核的其它合適的細胞或組織樣品或分裂中期細胞。這些細胞可以取自實體組織,如新鮮或保存的器官或組織樣品或活檢組織。所述樣品可以含有在自然狀態(tài)下不與生物物質(zhì)如防腐劑、抗凝劑、緩沖液、固定劑、營養(yǎng)物質(zhì)、抗生素等混合的化合物。
從多種這些來源中分離基因組DNA的方法在例如Kirby,DNAFingerprinting,An Introduction,W.H.Freeman & Co.New York(1992)中描述?;蚪MDNA還可以分離自來自任一上述組織樣品的培養(yǎng)的原代或二級細胞培養(yǎng)物或轉(zhuǎn)化細胞系。
還可以使用動物的RNA樣品。RNA可以依照Sambrook et al.,如上描述的從表達HMGA基因的組織中分離。RNA可以是總細胞RNA、mRNA、poly A+RNA或其任意組合。為獲得最好的效果,純化該RNA,但也可以用未經(jīng)純化的胞漿RNA??梢詫NA逆轉(zhuǎn)錄出DNA,所得DNA用作擴增模板,以便PCR間接擴增特定RNA轉(zhuǎn)錄產(chǎn)物。見,例如Sambrook,同上,Kawasaki et al.,Chapter 8 in PCRTechnology,(1992)同上,和Berg et al.,Hum.Genet.85655-658(1990)。
PCR擴增最常用的擴增手段是聚合酶鏈式反應(yīng)(PCR),如美國專利Nos.4,683,195、4,683,202、4,965,188,全部在此并入?yún)⒖肌H绻肞CR來擴增血細胞中的靶區(qū)域,應(yīng)該將加有肝素的全血抽入密封的真空管中,比與其他樣品隔離開來保存,處理時也應(yīng)戴上干凈的手套。為獲得最佳效果,最好在采血后立即對血液進行處理;如果做不到這一點的話,那么血液應(yīng)該一直被保存在4℃的密封容器中至使用。也可以檢測其他生理體液中的細胞。當使用這些體液時,體液中的細胞應(yīng)該通過離心與其他體液成分分離開來。
組織應(yīng)該先用一把已消毒的一次性解剖刀和一根消毒的解剖針(或者用兩把解剖刀)在5mm的培養(yǎng)皿中初步剪碎。從組織塊中去除石蠟的方法在本領(lǐng)域技術(shù)人員所熟知的多種專業(yè)手冊中都有描述。
為通過PCR擴增樣品中的靶核酸序列,該序列必須要能接觸到擴增系統(tǒng)中的成分。一種分離靶DNA的方法是用于較大樣品的粗提取方法。簡而言之,血樣樣品中的單核細胞、羊水細胞中的羊膜細胞(amniocyte)、培養(yǎng)的絨毛膜絨毛細胞等通過標準方法在無菌的Ficoll-Hypaque梯度上分層(layering)分離。再收集間期細胞,并在提取DNA之前在無菌磷酸鹽緩沖鹽溶液中洗滌3次。如果測試外周血淋巴細胞的DNA,建議再進行滲壓震擾(將在蒸餾水中處理沉淀10秒),然后如果還可見殘留有紅細胞,在第一次洗滌后再洗滌兩次。這樣可以避免血紅蛋白中的血紅素基團對PCR反應(yīng)的抑制作用。如果PCR測試不在采樣后立即進行,則將細胞均分為106個細胞一份,沉淀在Eppendorf管中并在-20℃冷凍干燥,保存至使用。
將細胞重懸在補充了100μg/ml蛋白酶K的50mM Tris-HCl(pH8.3),50mM KCl,1.5mM MgCl2,0.5%Tween 20,0.5%NP40的緩沖液中(每100μl有106個有核細胞)。在56℃孵育兩小時后,將細胞在95℃加熱10分鐘以滅活蛋白酶K,然后迅速移至于冰上降溫(驟凍)。如果存在較大的聚集物,則還需在同樣的緩沖液中再進行另一次消化循環(huán)。取出10μl提取物用作擴增。
從組織例如絨毛膜絨毛細胞或鋪滿培養(yǎng)的細胞中提取DNA時,那么根據(jù)組織樣品的大小不同,上述含有蛋白酶K的緩沖液量也可有所差別。提取物在50-60℃孵育4-10個小時,之后在95℃處理10分鐘滅活蛋白酶。在更長時間的孵育過程中,以原始濃度孵育4小時后,需要再補加新鮮的蛋白酶K。
樣品含有細胞含量少時,提取可以參照下述的方法完成,Higuchi,“Simple and Rapid Preparation of Samples for PCR”,PCR Technology,Ehrlich,H.A.(ed.),Stockton Press,New York,其并入?yún)⒖?。可以?yīng)用PCR擴增來自骨髓和外周血細胞培養(yǎng)物的單個集落的很少量細胞(1000-5000個)中的靶區(qū)域。將樣品中的細胞懸浮在20μl PCR裂解緩沖液(10mM Tris-HCl(Ph8.3),50mM KCl,2.5mM MgCl2,0.1mg/ml明膠,0.45%NP40,0.45%Tween 20)中并凍存直至使用。當要進行PCR時,向在PCR裂解緩沖液中的細胞加入0.6μl蛋白酶K(2mg/ml)。然后將樣品加熱至大約60℃并孵育1小時。然后將樣品加熱至95℃10分鐘滅活蛋白酶K而終止消化,再在冰上冷卻。
下面還有一種相對比較簡便的提取用于PCR的DNA的方法,是根據(jù)Miller et al.,Nucleic Acids Res.161215(1988)的方法改進的鹽析法,所述文獻并入?yún)⒖?。在Ficoll-Hypaque梯度上分離單核細胞。將細胞重懸在3ml裂解緩沖液(10mM Tris-HCl,400mM Nacl,2mMNa2EDTA,pH8.2)中。然后向細胞中加入50μl 20mg/ml的蛋白酶K和150μl 20%的SDS的溶液,然后在37℃孵育過夜。孵育過程中搖動試管促進樣品的消化。如果孵育過夜后蛋白酶K的消化仍不完全(即還有可見的片段),可以在體系中再加入50μl 20mg/ml的蛋白酶K溶液,再在37℃輕輕搖動或在搖床上孵育過夜。在充分消化后,向樣品中加入1ml 6M的NaCl溶液并劇烈混勻。所得溶液在3000rpm離心15分鐘。沉淀含有沉淀的細胞蛋白質(zhì),而上清液中含有DNA。將上清液轉(zhuǎn)移到裝有4ml異丙醇的15ml試管中。輕輕混勻試管中的內(nèi)容物至水相與醇相混合并形成白色的DNA沉淀。將DNA沉淀移出并滴入至70%乙醇中,輕輕混合。再將DNA沉淀從乙醇中取出并在空氣中干燥。向沉淀中加入蒸餾水將其溶解。
用于PCR的提取高分子量DNA的試劑盒包括Genomic IsolationKit A.S.A.P(Boehringer Mannheim,Indianapolis,Ind.)、Genomic DNAIsolation System(GIBCO BRL,Gaithersburg Md.)、Elu-Quik DNAPurification Kit(Schleicher & Schuell,Keene,N.H.)、DNA extraction Kit(Stratagene,LaJolla,Calif.)、TurboGen Isolation Kit(Invitrogen,SanDiego,Calif.)等等。一般而言可以在實踐本發(fā)明的方法前,按照廠商說明使用這些試劑盒來純化DNA。
提取出的DNA的濃度和純度可以通過對稀釋等份樣品在260nm和280nm的光吸收分光光度分析來確定。提取出DNA后,可以進行PCR擴增。PCR每一次循環(huán)的第一步需要將引物延伸獲得的核酸雙鏈分開。一旦雙鏈分開,PCR的下一步是使分開的鏈與在靶序列側(cè)翼的引物雜交。引物接下來可以延伸以形成靶鏈的互補拷貝。為成功進行PCR擴增,設(shè)計引物以便要使一個引物與母鏈雜交后,延伸產(chǎn)生的子鏈在與母鏈變性分開后,可以與另一個引物雜交并作為該引物延伸的模板。變性、雜交及延伸的循環(huán)重復所需的次數(shù)以獲得所需量的擴增核酸。
PCR擴增的一個特別有用的實施方案中,通過將反應(yīng)體系加熱到足夠高的溫度并進行足夠長的時間以引起雙鏈變性但不引起聚合酶發(fā)生不可逆變性而分開鏈(見U.S.Pat.No.4,965,188,并入?yún)⒖?。典型地熱變性涉及的溫度在80℃到105℃之間,時間長短數(shù)秒至數(shù)分鐘。然而鏈的分開則可以任何合適的方法包括物理、化學或酶學手段實現(xiàn)。例如,可以用解旋酶或有解旋酶活性的酶誘導鏈分開。例如,在有ATP存在的情況下酶RecA具有解旋酶活性。通過解旋酶的鏈分開的適宜反應(yīng)條件是本領(lǐng)域已知的(見Kuhn Hoffman-Berling,1978,CSH-Quantitative Biology,4363-67;和Radding,1982,Ann.Rev.Genetics 16405-436,全部并入?yún)⒖?。
PCR中模板依賴的引物延伸由聚合劑(polymerizing agent)在存在足量的4種去氧核苷三磷酸(一般是dATP、dGTP、dCTP和dTTP)的情況下在包含有適當?shù)柠}、金屬陽離子以及pH緩沖系統(tǒng)的反應(yīng)介質(zhì)中催化進行。適當?shù)木酆蟿┦且阎呋0逡蕾嚨腄NA合成的酶。某些情況下,靶區(qū)域可能編碼細胞表達的蛋白的至少一部分。這樣,mRNA也可用于擴增靶區(qū)域?;蛘撸琍CR還可用于從RNA構(gòu)建一個cDNA文庫以進行進一步的擴增,引物延伸的最初模板是RNA。適于從RNA模板合成互補拷貝DNA(cDNA)序列的聚合劑是逆轉(zhuǎn)錄酶(RT),如禽成髓細胞瘤病毒RT、Moloney鼠白血病病毒RT、嗜熱棲熱菌(Thermus Thermophilus)(Tth)DNA聚合酶,一種由PerkinElmer Cetus,Inc.開發(fā)的具有逆轉(zhuǎn)錄酶活性和熱穩(wěn)定DNA聚合酶。典型地,最初逆轉(zhuǎn)錄步驟后的第一次變性步驟過程中,基因組RNA模板被熱降解,只留下DNA模板。適用于以DNA作模板的聚合酶包括,例如,大腸桿菌(E.coli)DNA聚合酶I或者其Klenow片段、T4 DNA聚合酶、Tth聚合酶和Taq聚合酶,分離自水生棲熱菌(Thermus aquaticus)的一種熱穩(wěn)定DNA聚合酶,從Perkin ElmerCetus,Inc.可以買到。后一種酶廣泛用于核酸的擴增和測序。本領(lǐng)域已知使用Taq聚合酶的反應(yīng)條件并在Gelfand,1989,PCR Technology,同上中也有描述。
等位基因特異PCR等位基因特異的PCR可以區(qū)分存在缺少變異或多態(tài)性的靶區(qū)域。選擇只結(jié)合靶序列的某種等位基因的PCR擴增引物。Gibbs,NucleicAcid Res.1712427-2448(1989)中描述了這一方法。
等位基因特異寡核苷酸篩選方法進一步診斷篩選方法使用了等位基因特異寡核苷酸(ASO)篩選方法(allele-specific oligonucleotide screening method),如Saiki等在Nature 324163-166(1986)中所描述。對任意特定等位基因產(chǎn)生一或多個堿基對錯配的寡核苷酸。ASO篩選方法檢測變體靶基因組或PCR擴增DNA和非突變寡核苷酸之間的錯配,示出相較于突變寡核苷酸,減少的寡核苷酸結(jié)合。寡核苷酸探針可以設(shè)計來在低嚴格條件下與等位基因的兩種多態(tài)性形式都能結(jié)合,而在高嚴格條件下,結(jié)合其所對應(yīng)的等位基因。另外,可以控制嚴格條件,獲得基本的二元應(yīng)答,即對應(yīng)于一個靶基因變體形式的ASO將與那個等位基因雜交,而不與野生型等位基因雜交。
連接酶介導的等位基因檢測方法通過連接酶介導的等位基因檢測,可以對比測試對象DNA靶區(qū)域和未影響和影響的家族成員中的靶區(qū)域。見Landegren et al.,Science 241107-1080(1988)。連接酶也可用于在Wu et al.,Genomics4560-569(1989)中描述的連接擴增反應(yīng)中檢測點突變。連接擴增反應(yīng)(LAR)通過連續(xù)多輪模板依賴的連接,實現(xiàn)了特定DNA序列的擴增,如Wu,同上和Barany,Proc.Nat.Acad.Sci.88189-193(1990)中所述。
變性梯度凝膠電泳使用聚合酶鏈式反應(yīng)得到的擴增產(chǎn)物可以用變性梯度凝膠電泳分析。不同的等位基因可以通過基于序列依賴解鏈性質(zhì)和在溶液中DNA電泳遷移的不同得以鑒別。在溫度升高或變性強度增大時,DNA分子區(qū)段解鏈,這些區(qū)段稱為解鏈結(jié)構(gòu)域(melting domain)。每個解鏈結(jié)構(gòu)域在不同的、堿基特異的解鏈溫度(TM)下協(xié)同解鏈。解鏈結(jié)構(gòu)域長度至少為20個堿基對,也可以高達數(shù)百個堿基對。
可以用聚丙烯酰胺凝膠電泳評估基于序列特異解鏈結(jié)構(gòu)域不同的等位基因的分化,如Chapter 7,Erlich,ed.,PCR Technology,Principles and Applications for DNA Amplification,W.H.Freeman andCo.,New York(1992)所述,其內(nèi)容并入?yún)⒖肌?br>
一般而言,通過變性梯度凝膠電泳分析的靶區(qū)域使用靶區(qū)域側(cè)翼的PCR引物擴增。擴增的PCR產(chǎn)物用線性變性梯度的聚丙烯酰胺凝膠分析,如Myers et al.,Meth.Enzymol.155501-527(1986)和Myers etal.,Genomic Analysis,A Practical Approach,K.Davies Ed.IRL PressLimited,Oxford,pp.95-139(1988)所述,其內(nèi)容并入?yún)⒖?。電泳系統(tǒng)維持在稍稍低于靶序列解鏈結(jié)構(gòu)域的Tm的溫度。
另一種變性梯度凝膠電泳的方法中,將靶序列可以先附于一段稱為GC夾(GC clamp)的GC核苷酸,如Chapter 7,Erlich,同上所述。優(yōu)選地,GC夾中至少有80%的核苷酸是鳥嘌呤或胞嘧啶。優(yōu)選地,GC夾至少長達30個堿基。這種方法特別適用于高Tm的靶序列。
通常,通過上述聚合酶鏈式反應(yīng)擴增靶區(qū)域。一個寡核苷酸PCR引物在5’端帶有至少30個堿基的富含GC序列的GC夾,其在擴增過程中摻入到靶區(qū)域的5’端。所得擴增的靶區(qū)域在上述變性梯度條件下進行電泳。只相差一個堿基變化的DNA片段在凝膠上遷移的位置不同,通過溴化乙錠染色可見。
溫度梯度凝膠電泳溫度梯度凝膠電泳(TGGE)與變性梯度凝膠電泳基于相同的原理,只是變性梯度是由溫度差異產(chǎn)生,而不是化學變性劑的濃度不同而產(chǎn)生的。標準的TGGE使用的是隨電泳路徑具有溫度梯度的電泳儀。當樣品在化學變性劑濃度一致的凝膠里遷移時,其面對升高的溫度。另一種TGGE的方法是時間溫度梯度凝膠電泳(TTGE或tTGGE),即逐步地升高整塊電泳凝膠的溫度以達到同樣的結(jié)果。隨著樣品在凝膠中遷移,整塊凝膠的溫度升高,因此隨樣品通過凝膠遷移,它們遇到越來越高的溫度。樣品準備,包括摻入GC夾的PCR擴增,以及產(chǎn)物的顯示都與變性梯度凝膠電泳相同。
單鏈構(gòu)象多態(tài)性分析HMGA基因座的靶序列或等位基因可以使用單鏈構(gòu)象多態(tài)性分析區(qū)分,其根據(jù)單鏈PCR產(chǎn)物電泳遷移的改變來區(qū)分堿基的差別,如Orita et al.,Proc.Nat.Acad.Sci.852766-2770(1989)所述。擴增的PCR產(chǎn)物可以按上述方法產(chǎn)生,然后加熱或其它方法變性,從而形成單鏈擴增產(chǎn)物。單鏈核酸可能會部分地根據(jù)堿基序列重新折疊或形成二級結(jié)構(gòu)。因此,單鏈擴增產(chǎn)物的電泳遷移率可以檢測等位基因或靶序列之間堿基順序的差別。
錯配堿基的化學或酶學方法切割靶序列間的差異還可以通過錯配堿基對的差異化學切割區(qū)分,如Grompe et al.,Am.J.Hum.Genet.48212-222(1991)所述。另一種方法中,可以通過錯配堿基對的酶切割檢測靶序列之間的差異,如Nelsonet al.,Nature Genetics 411-18(1993)所述。簡而言之,來自一個動物或一個受影響家族成員的遺傳物質(zhì)可以用于產(chǎn)生錯配游離異源雜交DNA雙鏈。本文所指的“異源雜交”指DNA雙鏈的包含來自一個動物的一條鏈,及來自另外一個動物的第二條鏈,而且通常是在感興趣的性狀的表型上有差別的動物。沒有錯配的異源雙鏈的正選擇可以確定可能與HMGA多態(tài)性相關(guān)的小的插入、缺失或其它多態(tài)性。
非凝膠系統(tǒng)其它可能的技術(shù)包括非凝膠系統(tǒng),如TaqManTM(Perkin Elmer)。這一系統(tǒng)中,設(shè)計要研究的突變側(cè)翼的寡核苷酸PCR引物,并通過PCR擴增該區(qū)域。另外還要設(shè)計第三個寡核苷酸探針以與在基因的不同等位基因中含有堿基對象變化的區(qū)域雜交。這一探針的5’和3’端都用熒光染料標記。選擇這些染料以便當其互相臨近時,其中之一的熒光被另一種染料的熒光淬滅而不能被檢測到。相對于探針,PCR引物在Taq DNA聚合酶的作用下從模板的5’端開始延伸,導致附于退火探針的染料通過Taq DNA聚合酶的5’核酸酶活性而切割。這樣除去了淬滅效應(yīng)使得可以檢測到探針3’端染料的熒光。如果探針與模板分子的雜交不完全,即存在某種形式的錯配,那么染料就不會被切割,這樣就可以區(qū)分不同的DNA序列。因此只有當寡核苷酸探針的核苷酸序列與它結(jié)合的模板分子完全互補,才會除去淬滅。一個反應(yīng)混合物中,可能含有兩種不同探針的序列,每個針對可能存在的不同等位基因設(shè)計,從而可以在一次反應(yīng)中檢測兩個等位基因。
還有一種技術(shù)稱為Invader Assay,其包括依賴于熒光催化釋放的等溫擴增。見Third Wave Technology,www.twt.com.
不依賴PCR的DNA診斷可以基于多態(tài)性包括一個動物和家族成員的限制性片段長度多態(tài)性在內(nèi)的多態(tài)性而不用擴增步驟鑒定與HMGA序列連鎖的DNA序列。雜交探針一般是通過互補堿基配對結(jié)合全長或部分靶核酸的寡核苷酸。探針典型地依賴于雜交條件的嚴格程度與缺少與探針序列完全互補的靶序列結(jié)合。探針優(yōu)選直接或間接標記,因此可以通過檢測探針的存在與否來檢測靶序列的存在與否。直接標記方法包括放射性同位素標記,如用32P或35S。間接標記方法包括熒光標簽、能結(jié)合抗生物素蛋白或鏈霉抗生物素蛋白的生物素復合體,或肽或蛋白質(zhì)標簽等。可見檢測辦法包括光致發(fā)光劑(photoluminescent)、德克薩斯紅、羅丹明及其衍生物、red leuco dye、3,3’,5,5’-四甲聯(lián)苯胺(TMB)、熒光素及其衍生物、丹磺酰、傘形酮及其類似化合物或辣根過氧化物酶、堿性磷酸酶等。
雜交探針包括任意能與一個HMGA編碼序列所在的豬染色體雜交核苷酸序列,因此確定與HMGA基因之一連鎖的遺傳標記,包括限制性片段長度多態(tài)性、高度可變區(qū)、重復元件,或是可變數(shù)目的串聯(lián)重復。雜交探針可以是任何基因或適合的類似物。其它合適的雜交探針包括已知定位在染色體相關(guān)區(qū)域的cDNA或基因的外顯子片段或部分。
優(yōu)選地用于本發(fā)明的串聯(lián)重復雜交探針是在高嚴格的雜交條件下,識別特異基因座的少量片段或是降低嚴格條件時識別該基因座的較大量片段的探針。
可以使用一或多個限制性酶和/或探針和/或引物。其它的酶、構(gòu)建的探針以及引物可以通過本領(lǐng)域技術(shù)人員的常規(guī)實驗確定,其也包含在本發(fā)明的范圍內(nèi)。
盡管本文所述方法可以使用單一的限制性酶和單一的一組引物,但是這些方法不限于此。如果需要,可以使用一或多種其它的限制性酶和/或探針和/或引物。確實在有些情況下,可能優(yōu)選使用給出特異單元型的標記組合。結(jié)合本文提供和引用的的教導,通過常規(guī)實驗可以確定其它的酶、構(gòu)建的探針和引物。
按照本發(fā)明,在一個或全部兩個HMGA核苷酸序列中,鑒定了與生長、脂肪量、肉質(zhì)和飼料消耗比相關(guān)的多態(tài)性。這些標記的存在與否,在一個實施方案中可以通過使用限制性內(nèi)切核酸酶的PCRRFLP分析來檢測,并且由于多態(tài)性周圍區(qū)域的高度同源性,可以使用類似的人、豬或其它HMGA序列設(shè)計擴增引物,或者可以使用GenBank中的已知HMGA序列(例如人的)設(shè)計或者甚至可以根據(jù)從鄰近密切的基因的連鎖數(shù)據(jù)得出的序列設(shè)計,如本文的教導和參考文獻。多態(tài)性周圍的序列可以有助于設(shè)計另外的PCR測試,其中從緊挨多態(tài)性的序列中挑出大約4-30個連續(xù)堿基的引物用于聚合酶鏈式反應(yīng)以在用所需的限制性酶處理前大大擴增該區(qū)域。引物不必精確互補,滿基本等同序列就可以。本領(lǐng)域技術(shù)人員已知PCR擴增引物的設(shè)計,詳細討論見Ausubel(ed.),“Short Protocols in MolecularBiology,F(xiàn)ourth Edition”John Wiley and Sons 1999中有詳細介紹。下文是對引物設(shè)計的簡要說明。
引物設(shè)計策略聚合酶鏈式反應(yīng)(PCR)方法的廣泛應(yīng)用促使開發(fā)很多程序輔助設(shè)計或選擇用作PCR引物的寡核苷酸。下面是可以通過因特網(wǎng)免費獲得的4個這樣的程序Whitehead Institute的Mark Daly和SteveLincoln開發(fā)的PRIMER(UNIX、VMS、DOS和Macintosh)、WashingtonUniversity in St.Louis的Phil Green和LaDeana Hiller開發(fā)的Oligonucleotide Selection Program(OSP)(UNIX、VMS、DOS和Macintish)、Yoshi開發(fā)的PGEN(只用于DOS)以及University ofWisconsin的Bill Engels開發(fā)的Amplify(只用于Macintosh)。通常這些程序通過尋找已知重復序列元件的比特并通過分析推定引物的長度和GC含量來優(yōu)化Tm來輔助引物設(shè)計。還可以獲得商業(yè)軟件,而且引物方法正迅速地被包含在大多數(shù)的普通序列分析軟件包中。
測序和PCR引物設(shè)計用作測序或PCR引物的寡核苷酸需要選擇一個特異識別靶的適當序列,然后需測試該序列以排除該寡核苷酸具有穩(wěn)定二級結(jié)構(gòu)的可能。序列中的反向重復可以使用上述的重復鑒別或RNA折疊程序來鑒別(見Prediction of Nucleic Acid Structure)。如果觀察到了可能的莖環(huán)結(jié)構(gòu),那么引物的序列可以向任意方向移動幾個核苷酸以最小化可能的二級結(jié)構(gòu)。寡核苷酸的序列也應(yīng)該與恰當?shù)妮d體和插入DNA的雙鏈序列進行比較。很明顯,測序引物與靶DNA應(yīng)該只有單一的匹配。還建議不要選用與非所需靶DNA序列只有一個錯配的引物。對用于擴增基因組DNA的PCR引物,該引物序列應(yīng)該與GenBank數(shù)據(jù)庫中的序列進行比較,以確定是否有任何顯著的匹配。如果寡核苷酸序列出現(xiàn)在任何已知的DNA序列中,或者更關(guān)鍵的是在任何已知的重復元件中,就應(yīng)該改變對引物序列。
本發(fā)明的方法和材料也可以更廣泛應(yīng)用以評價動物DNA、在基因定型個體動物及檢測動物中的遺傳差異。特別地,動物基因組DNA的樣品可以通過與一或多個對照參比評價,以確定是否存在HMGA序列之一的多態(tài)性。優(yōu)選地,對該動物的HMGA序列進行RFLP分析,并將結(jié)果與對照進行比較。對照的結(jié)果來自于另一個動物一或全部兩條HMGA序列的RFLP分析,其中這個動物的HMGA基因的多態(tài)性是已知的。與此類似,一個動物的HMGA基因型可以通過以下方法確定取得其基因組DNA樣品,對DNA中HMGA基因進行RFLP分析,再將結(jié)果與對照對比。同樣,對照結(jié)果來源于另一個動物的一條HMGA序列的RFLP分析。這個結(jié)果通過確定HMGA基因的多態(tài)性,對動物進行基因定型。最后,動物之間的遺傳差異可以通過以下方法檢測從至少兩個動物中獲取基因組DNA樣品,在一條HMGA核苷酸序列上鑒別多態(tài)性的存在與否,并比較結(jié)果。
這些檢測用于鑒別與生長、脂肪量、肉質(zhì)和飼料消耗比相關(guān)的遺傳標記,如上所述,鑒別HMGA基因中可能與其它特征相關(guān)的其他多態(tài)性,以及動物基因型和表型的一般科學分析。
本文的例子和方法揭示了一些已被鑒別具有多態(tài)性的基因,所述多態(tài)性與一種有利性狀相關(guān),而該性狀又會對攜帶這種多態(tài)性的動物的生長、脂肪量、肉質(zhì)及飼料消耗比產(chǎn)生影響。一基因是否帶有多態(tài)性通常通過導致在某些等位基因形式中出現(xiàn)一個限制性位點的單個堿基變換進行鑒定。然而,如本文證明和討論的那樣,某個等位基因可能有多個堿基改變,這些改變可以被檢測相同多態(tài)性(等位基因)的表征。此外,其它遺傳標記或基因可能與本文所述的多態(tài)性連鎖,因此檢測也可能涉及鑒定其它的基因或基因片段,但是最終還是需要依賴于動物的遺傳分析以尋找相同的多態(tài)性。本發(fā)明期冀能夠涵蓋任何基于本文所揭示的等位基因差異分選和鑒別動物的檢測方法。
本領(lǐng)域技術(shù)人員知道,一旦鑒定了一個多態(tài)性并將其與特定的性狀建立了聯(lián)系,那么就有多種方法可以根據(jù)這個多態(tài)性基因定型(genotype)動物。這些替代測試方案只是本領(lǐng)域技術(shù)人員已知的對參數(shù)的優(yōu)化,本發(fā)明也期冀能涵蓋這些內(nèi)容。
實施例HMGI(在新命名系統(tǒng)下HMGA的名稱;Bustin,2001)基因家族由兩個基因組成,其編碼三種與染色質(zhì)結(jié)構(gòu)和轉(zhuǎn)錄控制相關(guān)的蛋白質(zhì)(HMG-I、-Y和C)。HMGI/Y蛋白是同一個基因RNA選擇性剪接的產(chǎn)物,而HMGIC則由不同的基因編碼。
人的HMGIY(HMGA1)基因定位在染色體區(qū)域6p21處(Friedmann et al.,1993),并且可能參與細胞生長和分化的基因表達的調(diào)節(jié)(Reeves and Beckerbauer,2001)。因此,HMGI/Y蛋白的異?;蜻^表達與多種癌癥的形成強烈相關(guān)(Hess,1998;Tallini and DalCin,1999;Reeves,2000)。由于HMGI/Y蛋白在脂肪細胞特異基因的表達中起著轉(zhuǎn)錄作用,HMGI/Y可能在脂肪細胞生長和分化中起著重要的作用(Melillo et al.,2001)。
人HMGIC(HMGA2)基因被物理定位在染色體12q14-12處,而這一區(qū)域示出是經(jīng)常引起脂瘤(lipoma)的染色體重排的位點,所述脂瘤主要由成熟脂肪細胞組成(Asher et al.,1995)。這些發(fā)現(xiàn)在表達截短的HMGIC基因結(jié)構(gòu)域的轉(zhuǎn)基因小鼠中得到了證實。這些轉(zhuǎn)基因小鼠都發(fā)生肥胖并有異常的脂瘤高發(fā)率(Arlotta et al.,2000)。與此相反,HMGIC基因敲除的小鼠示出成年體重降低,主要影響脂肪組織(Zhou et al.1995)。這些結(jié)果表明HMGA基因的變異可能與人肥胖的變異和動物脂肪量相關(guān)。
HMGA1PCR-RFLP測試引物正向(HMGY1)-5′AGA AGG AGC CCA GCG AAG T3′SEQ ID NO1反向(HMYS2)-5′ACA GTG CTC ACC CAA TGG C3′SEQ ID NO2位置兩個都位于外顯子中PCR條件Mix110XPCR緩沖液 1.0μlMgCl2(25mM) 0.6μldNTPs(2.5mM) 0.5μlHMGYl(25pmol/μl) 0.1μlHMYS2(25pmol/μl) 0.1μlTaq聚合酶(5U/μl) 0.07μlddH2O 7.63μl基因組DNA 1.0μl在一個PCR反應(yīng)管中將Mix1和DNA組合。在Mix上覆蓋礦物油。按以下PCR程序進行反應(yīng)94℃3分鐘;然后94℃30秒,63.8℃1分鐘,及72℃1分30秒,這樣的循環(huán)進行36次;然后進行最后72℃10分鐘的延伸。取出2μl的PCR反應(yīng)產(chǎn)物在1.6%的瓊脂糖凝膠上證實擴增成功和陰性對照的理想結(jié)果。
消化可按以下步驟進行BanI消化反應(yīng)NaeI消化反應(yīng)
PCR產(chǎn)物4.0μlPCR產(chǎn)物 4.0μlNE緩沖液4 1.0μlNE緩沖液1 1.0μlBSA(10mg/ml) 0.1μlBSA(10mg/ml) 0.1μlBanI(20U/μl) 0.2μlNaeI(10U/μl) 0.4μlddH2O 4.7μlddH2O 4.5μl混合PCR產(chǎn)物、緩沖液、酶和水。在37℃孵育至少4小時或過夜。然后將消化溶液與上樣染料(loading dye)混合(2∶5),在3%的NuSieve瓊脂糖凝膠上電泳。
HMGA2HhaI PCR-RFLP測試引物HMGIC-55′ACT GAA GAG ACA TCC TCA CA3′SEQ ID NO3HMGIC-T15′CTA AAC CIG GGA CIG TGA AG3′SEQ ID NO4Mix2的引物660bpHMGIC-SF5′GAT AGG ACT AGA TAC AAC TTA C3′SEQ ID NO5HMGIC-T25′GGA TAT ATT GCA TCT CTG GC3′SEQ ID NO6Mix1250bpPCR條件Mix1 Mix210X Promega緩沖液 1.0μl 10X Promega緩沖液 1.0μl25mM MgCl20.6μl 25mM MgCl20.6μldNTPs混合物(每種2.5mM) 0.5μl dNTPs混合物(每種2.5mM) 0.5μl25pmol/μl HMGIC 5 0.1μl 25pmol/μl HMGIC SF 0.1μl25pmol/μl HMGIC T1 0.1μl 25pmol/μl HMGIC T2 0.1μldd無菌H2O 7.4μl dd無菌H2O 7.4μlTaq聚合酶(5U/μl) 0.07μl Taq聚合酶(5U/μl) 0.07μl基因組DNA(12.5ng/μl) 1.0μl 基因組DNA(12.5ng/μl) 1.0μl1、按以下PCR程序進行反應(yīng)94℃2分鐘;然后94℃30秒,56℃(Mix1)和52℃(Mix2)1分鐘,再72℃1分30秒,循環(huán)35次;然后最后在72℃延伸10分鐘。當HMGIC-5和HMGIC-T2引物用于PCR擴增時(退火溫度為56℃),PCR片段(1.2kb)含有全部兩個HhaI多態(tài)性位點。
2、在標準的1%瓊脂糖凝膠上檢測3μl的PCR反應(yīng)產(chǎn)物以證實擴增成功和陰性對照的理想結(jié)果。
3、HhaI消化反應(yīng)在每個含有DNA的管里加入5μl擴增產(chǎn)物。在37℃孵育至少4小時或過夜。然后將反應(yīng)混合物與上樣染料混合,將全部體積上樣在3%的瓊脂糖凝凝膠上。
PCR產(chǎn)物 5.0μl10X NE緩沖液41.0μlBSA(10mg/ml) 0.3μlHhaI酶(20U/μl) 0.3μldd無菌H2O 3.6μl圖2中BanI的識別位點用下劃線及粗體字表示。其中一個在第54位含有單核苷酸多態(tài)性。
圖1示出HMGA的序列,其具有下劃線表示的NaeI多態(tài)性位點(GCYGGC)。
Y=C或T三個HhaI識別位點(GCGC)均用下劃線表示,其中用灰色加亮的兩個含有DNA多態(tài)性。
框1是Mix1的大致PCR片段。
框2是Mix2的大致PCR片段。
K=G或TY=C或T我們測序并分析了用聚合酶鏈式反應(yīng)擴增的豬HMGA1和HMGA2片段。豬HMGA2基因片段的序列覆蓋了外顯子5到3’UTR,在DNA水平示出與相應(yīng)人序列大約79%的一致性。豬HMGA1基因片段序列覆蓋了外顯子6和7,在DNA水平示出與相應(yīng)人外顯子序列大約93%的一致性。
我們還在豬HMGA1和HMGA2基因中鑒別出了一些單核苷酸取代(SNPs)。HMGA1基因中鑒別的兩個SNPs分別位于BanI和NaeI限制性酶識別位點內(nèi),而HMGA2基因中鑒別的另兩個SNPs位于HhaI識別位點內(nèi)。發(fā)展了這些SNPs的PCR RFLP測試并測試了來自Berkshire×Yorkshire 3代家系中和PIC商用群體的動物的DNA樣品。利用上述DNA樣品的PCR RFLP測試的基因型進行了QTL和相關(guān)分析。對于Berkshire和Yorkshire雜交參考家系中脂肪相關(guān)性狀,兩個HMGA基因都位于QTL區(qū)域內(nèi)。在幾個商用PIC群體的動物中,HMGA1基因的等位基因1 NaeI多態(tài)性的存在明顯地與較少的背部脂相關(guān)。此外,這些商用群體中,HMGA2基因型也與脂肪和生長性狀相關(guān)。這個參考家系中的兩個基因的組合分析清楚地表明兩個基因?qū)χ拘誀钣屑有孕?yīng)。
這些結(jié)果表明,這些多態(tài)性與生產(chǎn)豬和肉質(zhì)的多種具有重要經(jīng)濟價值的性狀相關(guān),而且利用這些多態(tài)性能夠在育種工作中準確選擇具有所需性狀及表型的動物。
在PIC群體中HMGA基因的相關(guān)分析2000年8月1日針對肉質(zhì)在所有動物中計算了平均值(s.e.)和Sigma P。
所有結(jié)果都由mixed model得出,將父系作為隨機影響,并固定屠宰日期。
LS平均值顯著性水平 α和δ顯著性水平水平a-bp<.3 ap<.3c-dp<.1 bp<.1
e-fp<.05 cp<.05g-hp<.01 dp<.01i-jp<.005 ep<.005k-lp<.001 fp<.001m-np<.0005gp<.0005o-pp<.0001hp<.0001估計值是有偏倚(biased)的。
geno p性狀=父系+屠宰日期+基因型的模型中基因型的p值。
Expl.%σe2由“基因型”導致的誤差方差的減少。
α和δ性狀=父系+屠宰日期+ADD+DOM的模型的標記的加合和上位效應(yīng)。
結(jié)果以性狀值給出。
US-Landrace中HMGA1 NaeI的肉質(zhì)和生產(chǎn)性狀的分析
US-Large white中HMGA1 NaeI的肉質(zhì)和生產(chǎn)性狀的分析
US-Large white×Duroc中HMGA1 NaeI的肉質(zhì)和生產(chǎn)性狀的分析
所有品系中HMGA1 NaeI的肉質(zhì)和生產(chǎn)性狀的分析
US-Landrace中HMGA2的肉質(zhì)和生產(chǎn)性狀的分析
US-Large white中HMGA2的肉質(zhì)和生產(chǎn)性狀的分析
US-Duroc中HMGA2的肉質(zhì)和生產(chǎn)性狀的分析
US-Large white×Duroc中HMGA2的肉質(zhì)和生產(chǎn)性狀的分析
在參考家系中具有脂肪性狀的HMGA基因之間的相互作用分析A.Berkshire和Yorkshire雜交家系F2代動物1)基因頻率HMGA1(BanI) 頻率百分比頻率 百分比11 8817.8588 17.8512 232 47.06320 64.9122 173 35.09493 100.00HMGA2 頻率百分比頻率 百分比11 6412.7564 12.7512 234 46.61298 59.3622 204 40.64502 100.00HMGA2
B)對最后一根肋骨上脂肪(lrib)性狀的影響HMGA1和HMGA2基因型都與最后一根肋骨性狀的變化相關(guān)。HMGA2等位基因2的存在適度增加了最后一根肋骨脂肪含量(比較12和22號基因型)。HMGA1等位基因1的存在示出與脂肪含量的增加強烈相關(guān)。
HMGA2lrib LSMEAN 誤差11 3.18575614 0.1160333612 3.12045322 0.0488531822 3.22801544 0.04984788HMGA1lrib LSMEAN 誤差11 3.35804436 0.0779811812 3.16165424 0.0477134022 3.07576363 0.04890591
3)對腰部脂肪(lum)性狀的影響
HMGA1和HMGA2基因型都示出與腰部脂肪(lumbar fat)相關(guān)。HMGA1和HMGA2的組合結(jié)果示出對腰部脂肪的明顯的加性效應(yīng)。
HMGA2 lum LSMEAN誤差113.470036850.13421404123.537041660.05650774223.554019300.05765829HMGA1 lum LSMEAN誤差113.775070260.08990991123.556168110.05501209223.399479340.05638702
C)對總脂質(zhì)(tlip)性狀的影響HMGA2基因型與總脂質(zhì)(total lipid)的變化相有關(guān)HMGA2 tlip LSMEAN誤差112.88214497 0.23811466123.06472896 0.10025272223.23158737 0.10229396
HMGA1tlip LSMEAN 誤差11 3.33719722 0.1634492512 3.03313238 0.1000077122 3.10162605 0.10250722
5)對第10根肋骨脂肪(trib)性狀的影響HMGA1基因型與第10根肋骨脂肪顯著相關(guān)。
HMGA2 trib LSMEAN誤差113.00876115 0.13088375123.08337129 0.05507852223.11863733 0.05619663HMGA1 trib LSMEAN誤差113.28558871 0.08686549123.07574337 0.05310117222.98812120 0.05442963
1.Berkshire和Yorkshire雜交家系的豬1號染色體的遺傳圖譜見圖4性平均圖譜(recomb.frac.,Kosambi cM)9 SW1515 0.00.17 17.32 S0316 17.30.03 3.411 SWR230020.80.11 10.910 S0008 31.60.16 16.04 SW781 47.70.04 4.38 S0312 51.90.13 13.47 S0331 65.40.03 3.31 MC4R 68.60.04 4.00 HMGA2 72.60.15 15.26 SW974 87.80.17 17.13 SW373 104.90.22 23.05 SW1301 128.0*表示recomb.frac.在這個分析中保持不變log10_like=-1425.68性特異圖譜(recomb.frac.,Kosambi cM--雌性,雄性)9 SW1515 0.0 0.00.19 19.70.15 14.92 S0316 19.714.90.03 3.2 0.02 2.311 SWR230022.917.20.08 7.6 0.16 16.110 S0008 30.533.30.16 16.60.14 14.84 SW781 47.148.10.02 2.0 0.07 7.08 S0312 49.155.10.22 23.40.04 4.17 S0331 72.559.20.04 4.5 0.02 2.11 MC4R 77.061.30.06 5.6 0.02 2.20 HMGA2 82.563.50.20 21.30.09 9.56 SW974 103.8 73.00.20 21.60.13 13.33 SW373 125.4 86.30.19 19.40.24 26.45 SW1301 144.8 112.7*表示recomb.frac.在這個分析中保持不變
log10_like=-1396.972.Berkshire和Yorkshire雜交家系的豬7號染色體的遺傳圖譜見圖5性平均圖譜(recomb.frac.,Kosambi cM)10 S00250.00.27 29.79 S006429.70.17 18.18TNFB47.80.04 4.40 HMGA152.30.12 12.57 SWR1928 64.70.109.72 SW2040 74.40.099.05 SW25283.50.066.11 SW63289.60.055.54 SW1083 95.10.20 21.63 S0101116.70.21 22.66 SW764139.3*表示recomb.frac.在這個分析中保持不變log10_like=-1441.45性特異圖譜(recomb.frac.,Kosambi cM--雌性,雄性)10 S00250.0 0.00.30 35.4 0.23 24.99 S006435.424.9 0.14 14.2 0.21 22.18 TNFB 9.6 47.0 0.06 5.60.04 3.50 HWGA155.250.5 0.17 17.8 0.08 7.97 SWR1928 72.958.4 0.08 7.80.12 11.92 SW2040 80.770.3 0.12 12.1 0.06 5.95 SW25292.976.2 0.09 9.00.04 3.81 SW632101.8 80.0 0.05 5.00.06 6.34 SW1083 106.9 86.3 0.21 21.8 0.20 21.33 S0101128.7 107.6 0.25 27.3 0.17 17.86 SW764156.0 125.5log10_like=-1428.65
HMGA1的另一些引物和新序列引物HMA1-F1(正向)5′AAG CAG CCT CCG GTG AGT C3′SEQ ID NO7HMA1-R1(正向)5′CAC TTC GCT GGG CTC CTT CT3′SEQ ID NO8位于外顯子5到內(nèi)含子5之間(~1800bp,退火溫度Ta是65℃)HM766F(正向)5′TCT CTA GTT CCT CAT TCC3′SEQ ID NO9HM766R(正向)5′CCC AAG ACA GAA TAA AAA G3′SEQ ID NO10兩者都位于內(nèi)含子5內(nèi)(~800bp,Ta是51.7℃)HM867F(正向)5′CCT CTT GTC ATT TTA CTG TC3′SEQ ID NO11HM867R(正向)5′ACC CCA CTT TCC TCA ACT3′SEQ ID NO12位于內(nèi)含子5到內(nèi)含子6之間(~390bp,Ta是57.4℃)HM978F(正向)5′CTC TGC CTC CAC TCT CTA3′SEQ ID NO13HM978R(正向)5′TGC CAA AGG TGA CAA GAC3′SEQ ID NO14均位于內(nèi)含子5內(nèi)(~1000bp,Ta是59.3℃)HMAI2F(正向)5′CCA GGA AGG AAA CCA AGG G3′SEQ ID NO15HMAI2R(正向)5′TGA CTC AGC AAC CTC CAC G3′SEQ ID NO16位于外顯子7到內(nèi)含子7之間(~1200bp,Ta是60℃)HMAI2F(正向)5′CCA GGA AGG AAA CCA AGG G3′SEQ ID NO17HMAI3R(正向)5′TGA CTC AGC AAC CTC CAC G3′SEQ ID NO18位于外顯子7到內(nèi)含子7之間(~800bp,Ta是56℃)PCR條件Mix110X PCR緩沖液 1.0μlMgCl2(25mM) 0.6μldNTPs(2.5mM) 0.5μlHMGY1(25pmol/μl) 0.1μlHMYS2(25pmol/μl) 0.1μl
Taq聚合酶(5U/μl) 0.07μlddH2O7.63μl基因組DNA 1.0μl在PCR反應(yīng)管中組合Mix1與DNA。在混合物上方覆蓋礦物油。按以下PCR程序進行反應(yīng)94℃3分鐘;36個循環(huán)的94℃30秒、Ta1分鐘及72℃1分40秒;然后在72℃進行10分鐘的最后延伸。在1.6%瓊脂糖凝膠上檢測2μl的PCR反應(yīng)產(chǎn)物以證實擴增成功和陰性對照的所需理想結(jié)果。(每套引物組在相同的程序中在適當?shù)耐嘶饻叵逻M行,如上述)注意另外的SNPs通過序列分析來鑒別。SNP位置以粗體字(boldfont)來表示。
各品種間重疊群(contig)序列對比及HMGA1的共有序列注另外的SNPS通過序列分析來鑒別。對4個不同品種的豬的測序表明HMGA1基因DNA序列中存在一些多態(tài)性。SNP位置以符號(*、+)和箭頭來表示。下面是對SNPs的描述。
表1通過重疊群1和2的序列分析鑒別的新SNPs的位置和堿基變化的描述
注重疊群2還有其它通過序列分析無法證實的潛在SNPs。
參考文獻Arlotta,P.,Tai,A.K.,Manfioletti,G.,Clifford,C.,Jay,G.,Ono,S.J.2000.Transgenic mice expressing a truncated form of the high mobilitygroup I-C protein develop adiposity and an abnormally high prevalenceof lipomas.J.Biol.Chem.275,14394-14400.
Ashar,H.R.,F(xiàn)ejzo,M.S.,Tkachenko,A.,Zhou,X.,F(xiàn)letcher,J.A.,Weremowicz,S.,Morton,C.C.,Chada,K.1995.Disruption of thearchitectural factor HMGI-CDNA-binding AT hook motifs fused inlipomas to distinct transcriptional regulatory domains.Cell 8257-65.
Bustin,M.,2001.Revised nomenclature for high mobility group(HMG)chromosomal proteins.Trends Biochem.Sci.26,152-153.
Friedmann,M.,Holth,L.T.,Zoghhbi,H.Y.,Reeves,R.1993.Organization,inducible-expression and chromosome localization of thehuman HMGI(Y)nonhistone protein gene.Nucleic Acids Res.21,4259-4267.
Hess,J.L.1998.Chromosomal translocaitons in benign tumors.Am.J.Clin.Path.109,251-261.
Melillo,R.M,,Pierantoni,G.M,,Scala.S.,Battista,S.,F(xiàn)edele,M.,Stella,A.,De Biasio,M.C.,Chiappetta,G.,F(xiàn)idanza,V.,Condorelli,G.,Santoro,M.,Croce,C.M.,Viglietto,G.,F(xiàn)usco,A.2001.Critical role ofthe HMGI(Y)proteins in adipocytic cell growth and differentiation.Mol.Cell.Biol.21,2485-2495.
Tallini,G.,Dal Cin,P.1999.HMGI(Y)and HMGI-C dysregulationa common occurrence in human tumors.Adv.Anat.Pathod.6,237-246.
Reeves,R.2000.Structure and function of the HMGI(Y)family ofarchitectural transcription and chromatin structure.Environ.HealthPerspect.108,803-809.
Reeves,R.,Beckerbauer,L.2001.HMGI/Y proteinsflexibleregulators of transcription and chromatin structure.Biochim.Biophy.Acta 1519,13-29.
Zhou,X.,Benson,K.F.,Ashar,H.R.,Chada,K.1995.Mutationresponsible for the mouse pygmy phenotype in the developmentallyregulated factor HMGI-C.Nature 376,771-774.
序列表<110>衣阿華州立大學研究基金公司<120>新的HMGA等位基因及作為生長、脂肪量、肉質(zhì)及飼料消耗比性狀遺傳標記的應(yīng)用<130>ISURF 2900<150>60/364,959<151>2002-03-15<160>30<170>PatentIn version 3.1<210>1<211>19<212>DNA<213>porcine<400>1agaaggagcc cagcgaagt19<210>2<211>19<212>DNA<213>porcine<400>2acagtgctca cccaatggc19<210>3
<211>20<212>DNA<213>porcine<400>3actgaagaga catcctcaca20<210>4<211>20<212>DNA<213>porcine<400>4ctaaacctgg gactgtgaag20<210>5<211>22<212>DNA<213>porcine<400>5gataggacta gatacaactt ac 22<210>6<211>20<212>DNA<213>porcine<400>6ggatatattg catctctggc20<210>7<211>19
<212>DNA<213>porcine<400>7aagcagcctc cggtgagtc 19<210>8<211>20<212>DNA<213>porcine<400>8cacttcgctg ggctccttct20<210>9<211>18<212>DNA<213>porcine<400>9tctctagttc ctcattcc 18<210>10<211>19<212>DNA<213>porcine<400>10cccaagacag aataaaaag 19<210>11<211>20<212>DNA<213>porcine
<400>11cctcttgtca ttttactgtc20<210>12<211>18<212>DNA<213>porcine<400>12accccacttt cctcaact 18<210>13<211>18<212>DNA<213>porcine<400>13ctctgcctcc actctcta 18<210>14<211>18<212>DNA<213>porcine<400>14tgccaaaggt gacaagac 18<210>15<211>19<212>DNA<213>porcine
<400>15ccaggaagga aaccaaggg 19<210>16<211>19<212>DNA<213>porcine<400>16tgactcagca acctccacg 19<210>17<211>19<212>DNA<213>porcine<400>17ccaggaagga aaccaaggg 19<210>18<211>19<212>DNA<213>porcine<400>18tgactcagca acctccacg 19<210>19<211>703<212>DNA<213>porcine<400>19ccaacaccta aaagacctcg gggccgacca aaggggagca aaaacaaggg cgcygccaag 60
acccgggtga ggcttgaagg ggtggctcct ggtggaggga agtgggaagt aaccccccgc120cccctgcaag cagctgaggg aggtctggga aggggtgggc ttgtcctgat tctctgcatg180ccctttctct ggtacgtggg cccgatgggt cttggctagt tgaggaaagt ggggtgatgg240ccgaggccta acttctaggg ccttgtcttg cccaggacac tggggaagtc aagtcagatg300tcccagagct ttcctggtct ggagggaggc cagttgggca gaatggaggg ctgttccccc360tgggctgaga tgtcacctcc cccccaaccc caggccgcct gggtcctgag ggtgggggag420caggcaaggc cagatctaca gtggcattgg cctttggaga agttgttttg ttttttattt480tattttttct aagacacgac tcatatcctc tgagtcacgg gtgaaggagg gagtgggggc540gtgtgtgtgt atgttggggt ggggggcggt gtggcyggcc agtcatcccc agctggactc600cggtgggcct gctgggctga gagtcccggc tgcccctccc tgctcgccct cgccctccag660ggcactggtc actgcggggc acccgccatt gggtgagcac tgt 703<210>20<211>1168<212>DNA<213>porcine<400>20actgaagaga catcctcaca gaagtctgca gaagaggatt aggaggckcc aacattcaac 60gtccacctca gcagcagttg aatcttttga agggagaact acttactccc tattgccatg120gtttttccac tttcatctgg ggttgcaggg gaagggtggg ggtggggtgg gaggagaagg180gacataacct tgaaaaggac tgtattaatc accttctttg taatcccttc acagtcccag240gtttagtgga aaactgctgt aaacacagga gacacagttt aacaatgcaa cttttaatga300ctgttttcat tttccttaac ctactaatag tttgtggatc tgatgagcag gagtgggtgg360gtgagaaaaa ctctgaatgg gtttagccaa tcactgtact gcatccaaac cagaaacgtg420tcacctgcgt gacagtgggc attcctctag gcaaggtgca gtaggaaatg ctgcccacct480cagacgtcac ccagccccct ctcagtggtg aagcttctgt ttagaacacc aaagatagga540ctagatacta cttactttct catataacct ggtagacact tacttgatga tgtttttatt600tttaccttta tttctaagtg agaggaaatg ctgatgtatc ytttcatcca actaaccaga660aaaggtgatg ttctcttttc aaaaagggaa gtaagcaaac tcagattgcc aactcctata720tttatggatg ctatacattg cttatttaat acacagttaa cagtaatggt gagttttaat780
tctctccgta gcgcctttgg taattcacaa tagtgatgga tctaatggtt ctagcatttt 840aagaaaccta gacaagtaaa attattctct ttatgatttc atgaaaaggt acaacagaat 900aacccatgat gaacttacct ggattatgag acgggagaag caaaatctaa atctattttg 960ctatagttat actacaattt aaagaacaac aacaaagcag gctctcttgt ctctttcttt1020ytctctctgt ctctctctcc attgtgtatg agtttctgtg aaagatctaa ataccatgtt1080cctcaaatga agcttatgtg ttactccagg taatacgttt tgacatagga tggttggctg1140aagtgctttt ctttgacatc agcgycgc 1168<210>21<211>1838<212>DNA<213>porcine<220>
<221>misc_feature<222>(725)..(725)<223>n can be any nucleotide<400>21aaaaagtttc tgggctagca cctgttcatg ggcctccttg agtggccctg ggttgggctc 60tgcctccact ctctaaaagg aaattgaagc ccaagaagtt gacagtgttg aggagttggt120gcagagtgac tcagagccct gattctgtcc cacccctccc cccaaaggtc acgtgaggtt180aaaaggccac cctggcactt tgtgcgcccc agggagcttg gcccgtcagg ctgtggggac240cacctgttat atggtggaga tcttggtgtc tgttacaggg gggcagctgt ccccaagtga300ggggcagcgg ctggtggtga agcccagtta cttccttttc aggggggaga ggaaaggaat360tgaggtcgat ccctggcctt tagatggcag gcagtttgtg tacctgggcc tccggcttcc420ccgtctgtag gtggagagac ctggcggagc caggggtcat gagaagtcca atgggtgctg480gactcgagct gcctcatgga gggccctcag ctcgtgggga acttgtcctc ttcatctggt540cctttggcct ctcccagcck cctgttagcg gcggtcatgg ttgcgggggg atcagaaggg600gtgttgggtt actggaccac gcgcagcctg gggaaaccat agctgacgtg cctttgctgc660
ccagagcctg tgctgcatgt agcagctttt tattctgtct tgggttagta caatttcagt 720ggcantaatg ggcagggatc tggggctcca agatctggac agaatcctct gggggaggca 780gcctggaggt cccttctgtt tggggggatg tcctctccca cctcctgcat cgccctggac 840actggcacgt ccttcattgt acattgttca gtttttttta ctgtcacagg gaagcaaggg 900gagaggcctt gcaaaggatg ttcagactgg gaacctgaat ccccagggct gtgcctgcca 960tgattcctgt ggattctgga gtggggctgt cggggtgggg gtggggtggg gcagagactg1020tctggtgaaa gaggtgggac actggtgtct atgccctgac cgttccatct gtctttgcag1080aaggagccca gcgaagtgcc aacacctaaa agacctcggg gccgaccaaa ggggagcaaa1140aacaagggcg ccgccaagac ccgggtgagg cttgaagggg tggctcctgg tggagggaag1200tgggaagtaa cccccagccc cctgcaagca gctgagggag gtctgggaag gggtgggctt1260gtcctgattc tctgcatgcc ctttctctgg tacgtgggcc cgatgggtct tggctagttg1320aggaaagtgg ggtgatggcc gaggcctaac ttctagggcc ttgtcttgcc caggacactg1380gggaagtcaa gtcagatgtc ccagagcttt cctggtctgg agggaggcca gttgggcaga1440atggagggct gttccccctg ggctgagatg tcacctcccc cccaacccca ggccgcctgg1500gtcctgaggg tgggggagca ggcaaggcca gatctacagt ggcattggcc tttggagaag1560ttgttttgtt ttttatttta ttttttctaa gacacgactc atatcctctg agtcacgggt1620gaaggaggga gtgggggcgt gtgtgtgtat gttggggtgg ggggcggtgt ggcyggccag1680tcatccccag ctggactccg gtgggcctgc tgggctgaga gtcccggctg cccctccctg1740ctygccctcg ccctccaggg cactggtcac tgcggggcac ccgccattgg gtgagcactg1800tcagggacat ttttgacaat ggatcttttc tctgcaca1838<210>22<211>2484<212>DNA<213>porcine<400>22ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag 60gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca120tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc180caagccgaag ggaccctgtg gtcaggcagg ccagtgctca caccggggta aagcacccag240
cctttgtttc cacctcattg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat 300agaaacgcaa aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca 360cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc 420tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc 480cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga 540agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc 600tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag 660cttggcccgt caggctgtgg ggaccacctg ttatatggtg gagatcttgg tgtctgttac 720aggggggcag ctgtccccaa gtgaggggca gcggctggtg gtgaagccca gttacttcct 780tttcaggggg gagaggaaag gaattgaggt cgatccctgg cctttagatg gcaggcagtt 840tgtgtacctg ggcctccggc ttccccgtct gtaggtggag agacctggcg gagccagggg 900tcatgagaag tctaatgggt gctggactcg agctgcctca tggagggccc tcagctcgtg 960gggaacttgt cctcttcatc tggtcctttg gcctctccca gcctcctgtt agcggcggtc1020atggttgtgg ggggatcaga aggggtgttg ggttactgga ccacacgcag cctggggaaa1080ccatagctga cgtgcctttg ctgcccagag cctgtgctgc atgtagcagc tttttattct1140gtcttgggct tagtacaatt tcagtgacac taatgggcag ggatctgggg ctccaagatc1200tggacagaat cctctggggg aggcagcctg gaggtccctt ctgtttgggg ggatgtcctc1260tcccacctcc tgcatcgccc tggacactgg cacgtccttc attgtacatt gttcagtttt1320cgtgactcta caaggtaggt cttgtcacct ttggcagatg aggggaactg tagctcaagc1380ataaagcgtc ttgcccaaga tcttagacct aggcaatggc agagctggga tgcgaacaga1440gcagcctaag aaggggtttc tgtccccatg acacccttcc caatgggctt ctagcctctt1500gtcattttac tgtcacaggg aagcaagggg agaggccttg caaaggatgt tcagactggg1560aacctgaatc cccagggctg tgcctgccat gattcctgtg gattctggag tggggctgtc1620ggggtggggg tggggtgggg cagagactgt ctggtgaaag aggtgggaca ctggtgtcta1680tgccctgacc gttccatctg tctttgcaga aggagcccag cgaagtgcca acacctaaaa1740gacctcgggg ccgaccaaag gggagcaaaa acaagggcgc tgccaagacc cgggtgaggc1800ttgaaggggt ggctcctggt ggagggaagt gggaagtaac cccccgcccc ctgcaagcag1860ctgagggagg tctgggaagg ggtgggcttg tcctgattct ctgcatgccc tttctctggt1920acgtgggccc gatgggtctt ggctagttga ggaaagtggg gtgatggccg aggcctaact1980
tctagggcct tgtcttgccc aggacactgg ggaagtcaag tcagatgtcc cagagctttc2040ctggtctgga gggaggccag ttgggcagaa tggagggctg ttccccctgg gctgagatgt2100cacctccccc ccaaccccag gccgcctggg tcctgagggt gggggagcag gcaaggccag2160atctacagtg gcattggcct ttggagaagt tgttttgttt tttattttat tttttctaag2220acacgactca tatcctctga gtcacgggtg aaggagggag tgggggcgtg tgtgtgtatg2280ttggggtggg gggcggtgtg gccggccagt catccccagc tggactccgg tgggcctgct2340gggctgagag tcccggctgc ccctccctgc tygccctcgc cctccagggc actggtcact2400gcggggcacc cgccattggg tgagcactgt cagggacatt tttgacaatg gatcttttct2460ctgaccatct agaaaaccac caca 2484<210>23<211>2484<212>DNA<213>porcine<400>23ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag 60gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca120tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc180caagccgaag ggacccggtg gtcaggcagg ccagtgctca caccggggta aagcacccag240cctttgtttc cacctcatcg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat300agaaacgcga aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca360cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc420tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc480cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga540agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc600tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag660cttggcccgt caggctgtgg ggaccacctg ttatatggtg gagatcttgg tgtctgttac720aggggggcag ctgtccccaa gtgaggggca gcggctggtg gtgaagccca gttacttcct780tttcaggggg gagaggaaag gaattgaggt cgatccctgg cctttagatg gcaggcagtt840tgtgtacctg ggcctccggc ttccccgtct gtaggtggag agacctggcg gagccagggg900
tcatgagaag tctaatgggt gctggactcg agctgcctca tggagggccc tcagctcgtg 960gggaacttgt cctcttcatc tggtcctttg gcctctccca gcctcctgtt agcggcggtc1020atggttgtgg ggggatcaga aggggtgttg ggttactgga ccacgcgcag cctggggaaa1080ccatagctga cgtgcctttg ctgcccagag cctgtgctgc atgtagcagc tttttattct1140gtcttgggct tagtacaatt tcagtggcac taatgggcag ggatctgggg ctccaagatc1200tggacagaat cctctggggg aggcagcctg gaggtccctt ctgtttgggg ggatgtcctc1260tcccacctcc tgcatcgccc tggacactgg cacgtccttc attgtacatt gttcagtttt1320cgtgactctg caaggtaggt cttgtcacct ttggcagatg aggggaactg tagctcaagc1380ataaagcatc ttgcccaaga tcttagacct aggcaatggc agagctggga tgcgaacaga1440gcagcctaag aaggggtttc tgtccccatg acacccttcc caatgggctt ctagcctctt1500gtcattttac tgtcacaggg aagcaagggg agaggccttg caaaggatgt tcagactggg1560aacctgaatc cccagggctg tgcctgccat gattcctgtg gattctggag tggggctgtc1620ggggtggggg tggggtgggg cagagactgt ctggtgaaag aggtgggaca ctggtgtcta1680tgccctgacc gttccatctg tctttgcaga aggagcccag cgaagtgcca acacctaaaa1740gacctcgggg ccgaccaaag gggagcaaaa acaagggcgc cgccaagacc cgggtgaggc1800ttgaaggggt ggctcctggt ggagggaagt gggaagtaac cccccgcccc ctgcaagcag1860ctgagggagg tctgggaagg ggtgggcttg tcctgattct ctgcatgccc tttctctggt1920acgtgggccc gatgggtctt ggctagttga ggaaagtggg gtgatggccg aggcctaact1980tctagggcct tgtcttgccc aggacactgg ggaagtcaag tcagatgtcc cagagctttc2040ctggtctgga gggaggccag ttgggcagaa tggagggctg ttccccctgg gctgagatgt2100cacctccccc ccaaccccag gccgcctggg tcctgagggt gggggagcag gcaaggccag2160atctacagtg gcattggcct ttggagaagt tgttttgttt tttattttat tttttctaag2220acacgactca tatcctctga gtcacgggtg aaggagggag tgggggcgtg tgtgtgtatg2280ttggggtggg gggcggtgtg gctggccagt catccccagc tggactccgg tgggcctgct2340gggctgagag tcccggctgc ccctccctgc tcgccctcgc cctccagggc actggtcact2400gcggggcacc cgccattggg tgagcactgt cagggacatt tttgacaatg gatcttttct2460ctgaccatct agaaaaccac caca 2484<210>24<211>1950
<212>DNA<213>porcine<400>24ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag 60gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca 120tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc 180caagccgaag ggacccggtg gtcaggcagg ccagtgctca caccggggta aagcacccag 240cctttgtttc cacctcatcg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat 300agaaacgcga aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca 360cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc 420tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc 480cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga 540agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc 600tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag 660cttggcccgt caggctgtgg actttgtgcg ccccagggag cttggcccgt caggctgtgg 720ggaccacctg ttatatggtg gagatcttgg tgtctgttac aggggggcag ctgtccccaa 780gtgaggggca gcggctggtg gtgaagccca gttacttcct tttcaggggg gagaggaaag 840gaattgaggt cgatccctgg cctttagatg gcaggcagtt tgtgtacctg ggcctccggc 900ttccccgtct gtaggtggag agacctggcg gagccagggg tcatgagaag tctaatgggt 960gctggactcg agctgcctca tggagggccc tcagctcgtg gggaacttgt cctcttcatc1020tggtcctttg gcctctccca gcctcctgtt agcggcggtc atggttgtgg ggggatcaga1080aggggtgttg ggttactgga ccacgcgcag cctggggaaa ccatagctga cgtgcctttg1140ctgcccagag cctgtgctgc atgtagcagc tttttattct gtcttgggct tagtacaatt1200tcagtggcac taatgggcag ggatctgggg ctccaagatc tggacagaat cctctggggg1260aggcagcctg gaggtccctt ctgtttgggg ggatgtcctc tcccacctcc tgcatcgccc1320tggacactgg cacgtccttc attgtacatt gttcagtttt cgtgactctg caaggtaggt1380cttgtcacct ttggcagatg aggggaactg tagctcaagc ataaagcatc ttgcccaaga1440tcttagacct aggcaatggc agagctggga tgcgaacaga gcagcctaag aaggggtttc1500tgtccccatg acacccttcc caatgggctt ctagcctctt gtcattttac tgtcacaggg1560
aagcaagggg agaggccttg caaaggatgt tcagactggg cacctgaatc cccagggctg1620tgcctgccat gattcctgtg gattctggag tggggctgtc ggggtggggg tggggtgggg1680cagagactgt ctggtgaaag aggtgggaca ctggtgtcta tgccctgacc gttccatctg1740tctttgcaga aggagcccag cgaagtgcca acacctaaaa gacctcgggg ccgaccaaag1800ttgaaggggt ggctcctggt ggagggaagt gggaagtaac cccccgcccc ctgcaagcag1860ctgagggagg tctgggaagg ggtgggcttg tcctgattct ctgcatgccc tttctctggt1920acgtgggccc gatgggtctt ggctagttga 1950<210>25<211>2404<212>DNA<213>porcine<400>25ctggtaggag tcaggtgggt gtcaaacctt tgcctctgtt tacttctttg ggctagggag 60gtgccaggcg tcttggcagc tgagagcaga actggcgggg cgcagagtcc ttcctgtaca120tgtgtgttct gtccacacgt gcacatacct ctcagaggag tgcgagcctc tgccagggtc180caagccgaag ggacccggtg gtcaggcagg ccagtgctca caccggggta aagcacccag240cctttgtttc cacctcatcg gggcacagtg catttgtgaa acgtggtaaa ggtgaattat300agaaacgcga aatgacacat gtgtaagccc ggggttttca cttgttatat tcctcacaca360cagtattagc ctgttagttt actccaaagg tttctaatta cttaacttac tgtccatttc420tctagttcct cattccagta cagtaaaaag tttctgggct agcacctgtt catgggcctc480cttgagtggc cctgggttgg gctctgcctc cactctctaa aaggaaattg aagcccaaga540agttgacagt gttgaggagt tggtgcagag tgactcagag ccctgattct gtcccacccc600tccccccaaa ggtcacgtga ggttaaaagg ccaccctggc actttgtgcg ccccagggag660cttggcccgt caggctgtgg ggaccacctg ttatatggtg gagatcttgg tgtctgttac720aggggggcag ctgtccccaa gtgaggggca gcggctggtg gtgaagccca gttacttcct780tttcaggggg gagaggaaag gaattgaggt cgatccctgg cctttagatg gcaggcagtt840tgtgtacctg ggcctccggc ttccccgtct gtaggtggag gctggactcg agctgcctca900tggagggccc tcagctcgtg gggaacttgt cctcttcatc tggtcctttg gcctctccca960
gcctcctgtt agcggcggtc atggttgtgg ggggatcaga aggggtgttg ggttactgga1020ccacgcgcag cctggggaaa ccatagctga cgtgcctttg ctgcccagag cctgtgctgc1080atgtagcagc tttttattct gtcttgggct tagtacaatt tcagtggcac taatgggcag1140ggatctgggg ctccaagatc tggacagaat cctctggggg aggcagcctg gaggtccctt1200ctgtttgggg ggatgtcctc tcccacctcc tgcatcgccc tggacactgg cacgtccttc1260attgtacatt gttcagtttt cgtgactctg caaggtaggt cttgtcacct ttggcagatg1320aggggaactg tagctcaagc ataaagcatc ttgcccaaga gcagcctaag aaggggtttc1380tgtccccatg acacccttcc caatgggctt ctagcctctt gtcattttac tgtcacaggg1440aagcaagggg agaggccttg caaaggatgt tcagactggg aacctgaatc cccagggctg1500tgcctgccat gattcctgtg gattctggag tggggctgtc ggggtggggg tggggtgggg1560cagagactgt ctggtgaaag aggtgggaca ctggtgtcta tgccctgacc gttccatctg1620tctttgcaga aggagcccag cgaagtgcca acacctaaaa gacctcgggg ccgaccaaag1680gggagcaaaa acaagggcgc cgccaagacc cgggtgaggc ttgaaggggt ggctcctggt1740ggagggaagt gggaagtaac cccccgcccc ctgcaagcag ctgagggagg tctgggaagg1800ggtgggcttg tcctgattct ctgcatgccc tttctctggt acgtgggccc gatgggtctt1860ggctagttga ggaaagtggg gtgatggccg aggcctaact tctagggcct tgtcttgccc1920aggacactgg ggaagtcaag tcagatgtcc cagagctttc ctggtctgga gggaggccag1980ttgggcagaa tggagggctg ttccccctgg gctgagatgt cacctccccc ccaaccccag2040gccgcctggg tcctgagggt gggggagcag gcaaggccag atctacagtg gcattggcct2100ttggagaagt tgttttgttt tttattttat tttttctaag acacgactca tatcctctga2160gtcacgggtg aaggagggag tgggggcgtg tgtgtgtatg ttggggtggg gggcggtgtg2220gcyggccagt catccccagc tggactccgg tgggcctgct gggctgagag tcccggctgc2280ccctccctgc tcgccctcgc cctccagggc actggtcact gcggggcacc cgccattggg2340tgagcactgt cagggacatt tttgacaatg gatcttttct ctgaccatct agaaaaccac2400caca 2404<210>26<211>1103<212>DNA<213>porcine
<400>26tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt 60aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc 120tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc 180aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag 240cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta 300gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc 360ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt 420gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca 480aatagctga gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct 540tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc 600accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag 660tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt 720gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc 780tggggtcagc ccgcggccag cctgttgtgg ccgctccaca gcccagcagc tgcccctgcg 840ggccaaggcc acctgggtcc ccggcaccca ccagtgcagt gagggggctc attgcaccct 900ccaggcaccc tgtcccattt cctcccctga ccacctccct gctcccccca ccacccagcc 960agtcacttcc tccagcctag tgctgccctg ggccctgcca ggtccctgcc ttgggcctgg1020gggccaaggg cctggctcgg tgagagcagc ccatgtgtgt ggtttttttc cctcccttta1080aattcttcct tttttatgaa tga1103<210>27<211>1103<212>DNA<213>porcine<400>27tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt 60aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc 120tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc 180
aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag 240cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta 300gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc 360ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt 420gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca 480aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct 540tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc 600accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag 660tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt 720gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc 780tggggtcagc ccgcggccag cctgttgtgg ccgctccaca gcccagcagc tgcccctgcg 840ggccaaggcc acctgggtcc ccggcaccca ccagtgcagt gagggggctc attgcaccct 900ccaggcaccc tgtcccattt cctcccctga ccacctccct gctcccccca ccacccagcc 960agtcacttcc tccagcctag tgctgccctg ggccctgcca ggtccctgcc ttgggcctgg1020gggccaaggg cctggctcgg tgagagcagc ccatgtgtgt ggtttttttc cctcccttta1080aattcttcct tttttatgaa tga1103<210>28<211>1102<212>DNA<213>porcine<220>
<221>misc_feature<222>(949)..(949)<223>n is any nucleotide<220>
<221>misc_feature<222>(957)..(957)
<223>n is any nucleotide<400>28tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt 60aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc 120tgmggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc 180aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag 240cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta 300gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc 360ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt 420gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca 480aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct 540tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc 600accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag 660tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt 720gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc 780tggggtagcc cgcggccagc ctgttgtggc cgctccacag cccagcagct gcccctgcgg 840gccaaggcca cctgggtccc cggcacccac cagtgcagtg agggggctca ttgcaccctc 900caggcaccct gtcccatttc ctcccctgac cacctccctg ctccccccnc cacccancca 960gtcacttcct ccagcctagt gctgccctgg gccctgccag gtccctgcct tgggcctggg1020ggccaagggc ctggctcggt gagagcagcc catgtgtgtg gtttttttcc ctccctttaa1080attcttcctt ttttatgaat ga 1102<210>29<211>1059<212>DNA<213>porcine<400>29tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt 60aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc 120
tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc 180aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag 240cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta 300gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc 360ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt 420gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca 480aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct 540tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc 600accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag 660tgagtaacag gaaacaagtt gttttggagt ttgtgctggc acgggggccc ccatgtggtg 720tcccaacatt ccggcccagt gagtgagccc cacacttccc tttcctcccc gccctggcct 780ggggtcagcc cgcggccagg gccaaggcca cctgggtccc cggcacccac cagtgcagtg 840agggggctca ttgcaccctc caggcaccct gtcccatttc ctcccctgac cacctccctg 900ctccccccac cacccagcca gtcattcctc cagctagtgc tgccctgggc cctgccaggt 960ccctgccttg ggcctggggg ccaagggctg gctcggtgag agcagcccat gtgtgtggtt1020tttttccctc cctttaaatt cttccttttt tatgaatga 1059<210>30<211>1103<212>DNA<213>porcine<400>30tggtaggtga agaggctggg aaagcagcgg cggcagcttg gctcctctgg ggaggctctt 60aagactgggt ggagccccct gtcttgtgtg tccgatacag agagacagac ttttctgacc120tgcggggcca cgagcgctgg gacttcgcac ttagccaggc ccaggaggga ggatctgccc180aggcccgggc tgttgggggg ctgtgtccac gagcagtgaa gcggcccagg tgcaaagcag240cccgcactcc ttgccctgcc ccactgggcc tggtctcacg ctctcttccc tcgacttcta300gaccaggctc agaacttcta gggcgaacga aatgagggag ggatcaggtc cattttgacc360ctggggcagg aggaagcagc agcagtggag ccccatcctg gggcgggtgg tgtccgtgtt420gggtggcagc tgaggtggga cacctcctca ccaggaggca ccatccactt ctgggcccca480
aatagctgag gccagaggct gcctgcaggg ggcgcactgc agtgagggcc accagggcct 540tcctctaggc ctcccctgct ccccacctgt gctccctggg gccttctttc ctccaccgcc 600accaccatca ctgggtgcag ggggtgaggg ggtgagggga tgctggcagg gccccaagag 660tgagtaacag gaaacaagtt gttttggagt ttgtgcctgg cacgggggcc cccatgtggt 720gtcccaacat tccggcccag tgagtgagcc ccacacttcc ccttcctccc cgccctggcc 780tggggtcagc ccgcggccag cctgttgtgg ccgctccaca gcccagcagc tgcccctgcg 840ggccaaggcc acctgggtcc ccggcaccca ccagtgcagt gagggggctc attgcaccct 900ccaggcaccc tgtcccattt cctcccctga ccacctccct gctcccccca ccacccagcc 960agtcacttcc tccagcctag tgctgccctg ggccctgcca ggtccctgcc ttgggcctgg1020gggccaaggg cctggctcgg tgagagcagc ccatgtgtgt ggtttttttc cctcccttta1080aattcttcct tttttatgaa tga110權(quán)利要求
1.一種鑒別具有表征一種表型性狀的基因型的動物的方法,所述方法包括從所述動物中獲取核酸樣品,檢測樣品中是否存在特征為HMGA1或HMGA2基因多態(tài)性的基因型或者是否存在與其連鎖的多態(tài)性,所述基因型是已表明與一種表型性狀顯著相關(guān)的基因型;及根據(jù)所述動物中存在的基因型將所述動物與所述表型性狀相關(guān)聯(lián)。
2.權(quán)利要求1的方法,其中經(jīng)BLAST對比確定所述多態(tài)性導致HMGA基因或其等價物的氨基酸變化。
3.權(quán)利要求1的方法,其中所述多態(tài)性位于HMGA1基因中。
4.權(quán)利要求3的方法,其中所述基因型是NaeI或BanI多態(tài)性。
5.權(quán)利要求1的方法,其中所述多態(tài)性定位在HMGA2基因中。
6.權(quán)利要求5的方法,其中所述基因型是HhaI多態(tài)性。
7.權(quán)利要求1的方法,其中所述檢測步驟選自以下一組中限制性片段長度多態(tài)性(RFLP)分析、微測序、MALD-TOF、SINE、異源雙鏈分析、單鏈構(gòu)象多態(tài)性(SSCP)、變性梯度凝膠電泳(DGGE)和溫度梯度凝膠電泳(TGGE)。
8.權(quán)利要求1的方法,其中所述動物是豬。
9.權(quán)利要求1的方法,所述方法進一步包括擴增HMGA核苷酸序列或其含有所述多態(tài)性部分的量的方法。
10.權(quán)利要求9的方法,其中所述擴增包括以下步驟選擇能夠擴增含有一個或多個多態(tài)性NaeI、BanI或HhaI位點的HMGA核苷酸序列的一個區(qū)域的正向和反向引物。
11.權(quán)利要求9的方法,其中所述正向和反向引物選自以下一組SEQ ID No1和2、3和4、5和6、7和8、9和10、11和12、13和14、15和16,或17和18。
12.一種篩選動物以確定更可能示出改良的生長、脂肪量、肉質(zhì)和飼料消耗比性狀的動物的方法,包括從所述動物中獲取生物學樣品;檢測所述動物中是否存在與改良的生長、脂肪量、肉質(zhì)、飼料消耗比性狀相關(guān)的基因型,所述基因型的特征為a)在HMGA核苷酸序列中的多態(tài)性,所述多態(tài)性導致一或多個NaeI、BanI或HhaI位點。
13.權(quán)利要求12的方法,所述方法進一步包括擴增HMGA編碼核苷酸序列基因或其含有所述多態(tài)性部分的量的步驟。
14.一種在表達時編碼HMGA蛋白的核苷酸序列或等位基因,所述核苷酸序列包含由NaeI、BanI或HhaI多態(tài)性位點所致的變體。
15.權(quán)利要求11的HMGA蛋白。
16.一種鑒別具有表征一種顯著相關(guān)的表型性狀的所需基因型的動物的方法,,該方法包括從動物中獲取包含HMGA1或HMGA2基因的核酸樣品,將該樣品用與BanI、NaeI或HhaI識別位點相同的限制性酶消化以獲得片段,將消化產(chǎn)生的片段從消化物中分離出來,鑒別HMGA1或HMGA2基因的等位基因上是否存在BanI、NaeI或HhaI位點,其中存在所述等位基因表明動物具有表征一種顯著相關(guān)的表型性狀的基因型。
17.一種選擇具有所需性狀的動物的方法,包括如下步驟從動物中獲取核酸樣品,鑒別多態(tài)性,所述多態(tài)性是特征為BanI、NaeI或HhaI限制位點的HMGA1或HMGA2基因中的核苷酸,然后選擇具有與所需性狀相關(guān)的核苷酸的動物。
18.一種間接選擇HMGA基因中多態(tài)性的方法,所述方法包括從一個動物中獲取核酸樣品,并用已知與HMGA基因相關(guān)的DNA標記在HMGA1或HMGA2基因中鑒別特征為BanI、NaeI或HhaI限制位點的多態(tài)性,所述DNA標記進一步是已知與用于間接鑒別核苷酸取代的有利性狀相關(guān)的標記,并根據(jù)核苷酸取代的存在來選擇所述動物。
19.一種鑒別具有表征表型性狀的所需基因型的動物的方法,該方法包括通過從感興趣的品系或品種的動物中獲取樣品、從各樣品中制備每個動物的核酸樣品、篩選多態(tài)性而確定HMGA基因的基因型來確定HMGA基因型和感興趣的性狀間的關(guān)聯(lián),其中該多態(tài)性的存在表明該動物具有表征有利表型性狀的基因型,然后計算該HMGA基因型與所述性狀之間的關(guān)聯(lián)。
20.一種選擇育種用動物的方法,所述方法包括從所述動物中獲取核酸樣品;檢測樣品HMGA1或HMGA2基因是否存在多態(tài)性,所述多態(tài)性已示出與表型性狀顯著相關(guān);然后根據(jù)標記基因型的效應(yīng)估計值,將HMGA1或HMGA2基因型用在選擇模型中,并從而根據(jù)得出的估計值選擇用作育種的動物。
21.一種隔離動物以在屠宰時提供均一性的方法,該方法包括從所述動物中獲取核酸樣品;檢測樣品中與肉質(zhì)相關(guān)的多態(tài)性在HMGA基因中存在與否,然后根據(jù)存在于所述動物中的多態(tài)性對所述動物進行隔離。
22.一種篩選更可能產(chǎn)生所需的生長、脂肪量、肉質(zhì)和飼料消耗比的動物的方法,該方法包括從所述動物中獲取遺傳物質(zhì)樣品;并檢測在所述動物中與提高的生長、脂肪量、肉質(zhì)和飼料消耗比相關(guān)的基因型存在,所述基因型具有以下特征a)HMGA基因中的多態(tài)性。
23.權(quán)利要求22的方法,其中用BLAST對比確定所述多態(tài)性導致HMGA基因或其等價物的氨基酸變化。
24.權(quán)利要求22的方法,其中所述多態(tài)性位于HMGA1或HMGA2基因中。
25.權(quán)利要求22的方法,其中所述基因型為NaeI、BanI或HhaI多態(tài)性。
26.權(quán)利要求22的方法,其中所述檢測步驟選自以下一組限制性片段長度多態(tài)性(RFLP)分析、微測序、MALD-TOF、SINE、異源雙鏈分析、單鏈構(gòu)象多態(tài)性(SSCP)、變性梯度凝膠電泳(DGGE)和溫度梯度凝膠電泳(TGGE)。
27.權(quán)利要求22的方法,其中所述動物是豬。
28.權(quán)利要求22的方法,進一步包括擴增含有所述多態(tài)性的HMGA核苷酸序列或其部分量的步驟。
29.權(quán)利要求28的方法,其中所述擴增包括以下步驟選擇能夠擴增含有一或多個NaeI、BanI或HhaI位點的HMGA核苷酸序列的一個區(qū)域的正向和反向引物。
30.一個在表達時編碼HMGA蛋白的核苷酸序列或等位基因,所述核苷酸序列包含SEQ ID NOS19、20、21、22、23、24、25、26、27、28或29。
31.權(quán)利要求30的HMGA蛋白。
全文摘要
本發(fā)明揭示了可用作動物生長、脂肪量、肉質(zhì)和飼料消耗比的遺傳標記,鑒別這些標記的方法,及篩選動物以確定更可能產(chǎn)生所需生長、脂肪量、肉質(zhì)及飼料消耗比的方法,并優(yōu)選選擇那些動物進行以后的育種目的。所述遺傳標記基于HMGA核苷酸序列中存在或缺少某種多態(tài)性。
文檔編號C12N15/09GK1643162SQ03806119
公開日2005年7月20日 申請日期2003年3月14日 優(yōu)先權(quán)日2002年3月15日
發(fā)明者馬克斯·F·羅思柴爾德, 金關(guān)石, 月·樹·阮 申請人:衣阿華州立大學研究基金公司