本發(fā)明屬于植物生物學(xué)技術(shù)和基因工程
技術(shù)領(lǐng)域:
,具體涉及一個(gè)控制水稻胚乳蛋白質(zhì)含量的主效QTL(qPC-10)的基因克隆與應(yīng)用。
背景技術(shù):
:世界超過一半的人口利用稻米作為主要的糧食來源。近十年來,隨著人們生活水平的不斷提高,稻米品質(zhì)受到越來越多的消費(fèi)者關(guān)注。但是,我國稻米的品質(zhì)則普遍偏低,在南方稻區(qū)大面積栽培的秈稻的品質(zhì)普遍低于國標(biāo)二級(jí),而在北方栽培的粳稻的品質(zhì)與日本品種也存在較大的差距。這一方面滿足不了我國消費(fèi)者對(duì)優(yōu)質(zhì)稻米的日益增長的消費(fèi)需求,同時(shí)也嚴(yán)重影響了我國稻米在世界市場上的競爭力。因此,近十幾年來,我國在水稻品種培育上,除了將高產(chǎn)作為主要目標(biāo)外,稻米品質(zhì)的提高已成為另一個(gè)十分重要的育種目標(biāo)。優(yōu)質(zhì)稻米的理化指標(biāo)包括營養(yǎng)品質(zhì)、蒸煮食味品質(zhì)、加工品質(zhì)和外觀品質(zhì)等。經(jīng)研究表明,稻米的組成及其結(jié)構(gòu)決定了稻米的蒸煮和營養(yǎng)品質(zhì)。稻米是由兩大主要成分所組成:一是占90%左右的淀粉;二是稻米中蛋白質(zhì)。目前對(duì)于淀粉的生物合成機(jī)制已經(jīng)比較明確,參與合成淀粉的基因、以及各個(gè)基因之間的調(diào)控網(wǎng)絡(luò)已經(jīng)明晰。這些研究成果的取得為水稻淀粉品質(zhì)的改良提供了有力的理論支撐。然而,決定稻米蒸煮和營養(yǎng)品質(zhì)的另一個(gè)重要因子:蛋白質(zhì)的遺傳機(jī)理至今不是很明了。水稻胚乳蛋白質(zhì)含量是典型的數(shù)量性狀,具有比較復(fù)雜的遺傳基礎(chǔ)。利用分子標(biāo)記技術(shù)可以對(duì)控制數(shù)量性狀的QTL進(jìn)行定位和分解,將復(fù)雜的數(shù)量性狀分解為簡單的孟德爾因子進(jìn)行研究。近十幾年來已經(jīng)發(fā)現(xiàn)了許多控制水稻蛋白質(zhì)含量的QTLs,而這些QTLs的定位還處于初級(jí)階段。不同的研究者利用不同的材料在不同的環(huán)境中所定位的QTLs不盡相同,且很少有能被重復(fù)檢測到。到目前為止,只有在第一條染色體長臂上編碼氨基酸跨膜轉(zhuǎn)運(yùn)蛋白的qPC1已被成功克隆。因此,本發(fā)明克隆的qPC-10對(duì)于水稻品質(zhì)性狀的改良有巨大的應(yīng)用潛力和前景,為水稻的品種育種提供新的重要基因資源。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的是從水稻中分離克隆一個(gè)控制水稻胚乳蛋白質(zhì)含量和品質(zhì)的主效基因的完整編碼區(qū)段DNA片段,利用這個(gè)基因改良水稻品質(zhì)的能力。申請(qǐng)人將克隆的這個(gè)基因命名為qPC-10。本發(fā)明提供的qPC-10序列片段是如下1)或2)的蛋白質(zhì):1)由序列表中的SEQID№.2的氨基酸殘基序列組成的蛋白質(zhì);2)將序列表中的SEQID№.2氨基酸殘基序列經(jīng)過一個(gè)或幾個(gè)氨基酸殘基的取代和/或缺失和/或添加且具有SEQID№.2的氨基酸殘基序列相同活性的蛋白質(zhì)。序列表中序列2由499個(gè)氨基酸殘基組成。為了便于qPC-10的純化,可在由序列2的氨基酸殘基序列組成的蛋白質(zhì)的氨基端或羧基端連接上如表1所示的標(biāo)簽。表1標(biāo)簽的序列標(biāo)簽殘基序列Poly-Arg5-6(通常為5個(gè))RRRRRPoly-His2-10(通常為6個(gè))HHHHHHFLAG8DYKDDDDKStrep-tagII8WSHPQFEKc-myc10EQKLISEEDL上述2)中的qPC-10可人工合成,也可先合成其編碼基因,再進(jìn)行生物表達(dá)得到。上述2)中的qPC-10的編碼基因可通過將序列表中序列1所示的DNA序列中缺失一個(gè)或幾個(gè)氨基酸殘基的密碼子,和/或進(jìn)行一個(gè)或幾個(gè)堿基對(duì)的錯(cuò)義突變,和/或在其5′端和/或3′端連上表1所示的標(biāo)簽的編碼序列得到。編碼上述水稻qPC-10的基因也屬于本發(fā)明的保護(hù)范圍。所述水稻qPC-10蛋白cDNA基因可為如下1)或2)或3)或4)的DNA分子:1)序列表中SEQID№.1的DNA序列;2)編碼序列表中SEQID№.2蛋白質(zhì)序列的多核苷酸;3)與序列表中SEQID№.1限定的DNA序列具有90%以上同源性,且編碼相同功能蛋白質(zhì)的DNA序列;4)在嚴(yán)格條件下可與序列表中序列1)限定的DNA序列雜交的核苷酸序列。序列表中的序列1由1500個(gè)堿基組成,其開放閱讀框架(ORF)為自5′末端第1-1500位核苷酸。上述嚴(yán)格條件可為在0.1×SSPE(或0.1×SSC),0.1%SDS的溶液中,在65℃條件下雜交并洗膜。含有以上任一所述基因的重組載體也屬于本發(fā)明的保護(hù)范圍,如重組表達(dá)載體??捎矛F(xiàn)有的植物表達(dá)載體構(gòu)建含有所述基因的重組表達(dá)載體。所述植物表達(dá)載體包括雙元農(nóng)桿菌載體(如pBI121、pBin19、pCAMBIA2301、pCAMBIA3301、pCAMBIA1301-UbiN、pCAMBIA1300等)和可用于植物微彈轟擊的載體等。所述植物表達(dá)載體還可包含外源基因的3’端非翻譯區(qū)域,即包含聚腺苷酸信號(hào)和任何其它參與mRNA加工或基因表達(dá)的DNA片段。所述聚腺苷酸信號(hào)可引導(dǎo)聚腺苷酸加入到mRNA前體的3’端,如農(nóng)桿菌冠癭瘤誘導(dǎo)(Ti)質(zhì)?;?如胭脂合成酶Nos基因)、植物基因(如大豆貯存蛋白基因)3’端轉(zhuǎn)錄的非翻譯區(qū)均具有類似功能。使用所述基因構(gòu)建重組植物表達(dá)載體時(shí),在其轉(zhuǎn)錄起始核苷酸前可加上任何一種增強(qiáng)型啟動(dòng)子、組成型啟動(dòng)子或誘導(dǎo)型啟動(dòng)子,如花椰菜花葉病毒(CAMV)35S啟動(dòng)子、玉米的泛素啟動(dòng)子(Ubiquitin)、脅迫誘導(dǎo)型啟動(dòng)子Rd29A等,它們可單獨(dú)使用或與其它的植物啟動(dòng)子結(jié)合使用;此外,使用本發(fā)明的基因構(gòu)建植物表達(dá)載體時(shí),還可使用增強(qiáng)子,包括翻譯增強(qiáng)子或轉(zhuǎn)錄增強(qiáng)子,這些增強(qiáng)子區(qū)域可以是ATG起始密碼子或鄰接區(qū)域起始密碼子等,但必需與編碼序列的閱讀框相同,以保證整個(gè)序列的正確翻譯。所述翻譯控制信號(hào)和起始密碼子的來源是廣泛的,可以是天然的,也可以是合成的。翻譯起始區(qū)域可以來自轉(zhuǎn)錄起始區(qū)域或結(jié)構(gòu)基因。為了便于對(duì)轉(zhuǎn)基因植物細(xì)胞或植物進(jìn)行鑒定及篩選,可對(duì)所用植物表達(dá)載體進(jìn)行加工,如加入可在植物中表達(dá)的編碼可產(chǎn)生顏色變化的酶或發(fā)光化合物的基因(GUS基因、螢光素酶基因等)、具有抗性的抗生素標(biāo)記物(慶大霉素標(biāo)記物、卡那霉素標(biāo)記物等)或是抗化學(xué)試劑標(biāo)記基因(如抗除莠劑基因)等。從轉(zhuǎn)基因植物的安全性考慮,可不加任何選擇性標(biāo)記基因,直接以逆境篩選轉(zhuǎn)化植株。含有以上任一所述基因(qPC-10)的表達(dá)盒、轉(zhuǎn)基因細(xì)胞系及重組菌均屬于本發(fā)明的保護(hù)范圍。擴(kuò)增上述基因的全長或任一片段的引物對(duì)也屬于本發(fā)明的保護(hù)范圍之內(nèi)。所述蛋白、所述基因、所述重組表達(dá)載體、表達(dá)盒、轉(zhuǎn)基因細(xì)胞系或重組菌中的任意一種均可應(yīng)用于培育“高蛋白質(zhì)含量稻米”表型的水稻。利用任何一種可以引導(dǎo)外源基因在植物中表達(dá)的載體,將編碼所述蛋白的基因?qū)胫参锛?xì)胞,可獲得谷蛋白含量提高,總蛋白質(zhì)含量升高的轉(zhuǎn)基因細(xì)胞系及轉(zhuǎn)基因植株。攜帶有所述基因的表達(dá)載體可通過使用Ti質(zhì)粒、Ri質(zhì)粒、植物病毒載體、直接DNA轉(zhuǎn)化、顯微注射、電導(dǎo)、農(nóng)桿菌介導(dǎo)等常規(guī)生物學(xué)方法轉(zhuǎn)化植物細(xì)胞或組織,并將轉(zhuǎn)化的植物組織培育成植株。為了便于識(shí)別攜帶控制稻米蛋白質(zhì)含量qPC-10的基因型,在啟動(dòng)子+546bp的位置上設(shè)計(jì)一個(gè)能夠鑒別qPC-10等位基因型的功能標(biāo)記G2。該標(biāo)記為CAPs標(biāo)記,引物序列為:F:5’-TGTGTCACGCCTAATACT-3’(SEQIDNO.17),R:5’-ATGAAAGAAGATGTGGTG-3’(SEQIDNO.18)。對(duì)于攜帶有qPC-10粳型等位基因的片段能夠被限制性內(nèi)切酶ClaI切開,而攜帶qPC-10秈型等位基因的片段則不能被切開。本發(fā)明對(duì)Sasanishiki/Habataki所衍生的CSSLs群體進(jìn)行精米蛋白質(zhì)含量的QTL分析,鑒定出含有qPC-10基因的材料,與Sasanishiki雜交并自交,構(gòu)建qPC-10的分離群體,選擇具有極端蛋白質(zhì)含量的植株成功將qPC-10基因定位到第10號(hào)染色體上的LOC_Os10g26060處。該基因包含4個(gè)外顯子,共編碼499個(gè)氨基酸,通過生物信息學(xué)技術(shù)預(yù)測該蛋白質(zhì)為谷蛋白。Real-TimePCR表達(dá)分析發(fā)現(xiàn),該基因只在水稻籽粒中表達(dá),且在胚乳中蛋白質(zhì)含量高的品種(如Habataki)比蛋白質(zhì)含量低的品種(如Sasanishiki)的表達(dá)量高。預(yù)測表達(dá)量其關(guān)鍵作用,于是利用PCR技術(shù)獲得Habataki的克隆,亞克隆后,進(jìn)行轉(zhuǎn)基因CRISPR-Cas9干涉表達(dá)和互補(bǔ)轉(zhuǎn)化實(shí)驗(yàn)驗(yàn)證,在CRISPR-Cas9干涉表達(dá)的T0代陽性植株中蛋白質(zhì)含量存在降低,而互補(bǔ)轉(zhuǎn)化T0代陽性單株均表現(xiàn)出胚乳蛋白質(zhì)含量存在不同程度的升高。此外,利用稻米蛋白質(zhì)含量高的品種(如Habataki)和蛋白質(zhì)含量低的品種(如Sasanishiki)進(jìn)行比較測序,發(fā)現(xiàn)在2Kb的啟動(dòng)子區(qū)和編碼區(qū)范圍內(nèi)兩品種存在7個(gè)共同的SNP和Indel差異,其中有6個(gè)突變位于啟動(dòng)子區(qū),1個(gè)位于3’UTR編碼非翻譯區(qū)。利用PCR技術(shù)同時(shí)獲得Habataki和Sasanishiki啟動(dòng)子區(qū)的克隆,構(gòu)建GUS載體。結(jié)果表明在籽粒發(fā)育不同時(shí)期Habataki啟動(dòng)子的表達(dá)量均高于Sasanishiki啟動(dòng)子表達(dá)量。以上結(jié)果說明了啟動(dòng)子區(qū)的變異是導(dǎo)致表達(dá)量變化的原因,進(jìn)而導(dǎo)致水稻胚乳中蛋白質(zhì)含量的變化。本發(fā)明在水稻胚乳中克隆了一個(gè)對(duì)稻米蛋白質(zhì)含量具有正調(diào)控效應(yīng)的基因,這為水稻的優(yōu)質(zhì)育種提供了新的基因資源。附圖說明圖1qPC-10基因的精細(xì)定位。圖2qPC-10候選基因LOC_Os10g26060的表達(dá)分析。圖3G2標(biāo)記在Habataki和Sasanishiki品種中的檢測帶型。具體實(shí)施方式下述實(shí)施例中的實(shí)驗(yàn)方法,如無特別說明,均為常規(guī)方法。下述實(shí)施例中的百分含量,如無特別說明,均為質(zhì)量百分含量本發(fā)明所設(shè)計(jì)的生物材料來源如下:Sasanishiki、Habataki、CSSL:引自日本國立遺傳研究所,載體pCAMBIA1301:公開材料,該載體購自Takara公司載體p-MD18-T:公開材料,該載體購自Takara公司載體p1022:公開材料,該載體購自Takara公司大腸桿菌DH5α:公開材料,該載體購自Generay公司農(nóng)桿菌EHA105:公開材料,該載體購自Takara公司。實(shí)施例1:精米蛋白含量的QTL定位1、稻米蛋白質(zhì)含量表型的測量谷粒自然干燥后放在至于室溫下至少3個(gè)月以上以保證谷粒的干燥和各株系間含水量相對(duì)一致。利用稻谷出糙機(jī)上脫殼得到糙米,將糙米在精米機(jī)上研磨成精米。在近紅外快速分析儀上快速檢測精米的蛋白質(zhì)含量。2、利用單片段代換系鑒定精米蛋白質(zhì)含量QTL2007-2008年,在3個(gè)不同環(huán)境中鑒定了典型秈稻品種Habataki和粳稻品種Sasanishiki的蛋白質(zhì)含量,發(fā)現(xiàn)在不同的環(huán)境中其蛋白質(zhì)含量均存在顯著差異(表1)。在39個(gè)染色體單片段代換系群體中,精米蛋白質(zhì)含量也分離顯著。在2007年揚(yáng)州,蛋白質(zhì)含量變化范圍為8.6%到11%;在2008年海南,變化范圍為7.8%到9.4%;在2008年揚(yáng)州,變化范圍為8.7%到11.7%。QTL分析后共檢測到10個(gè)QTLs:qPC-1,qPC-3,qPC-5,qPC-6,qPC-10,qPC-11和qPC-12。其中,在第1號(hào)染色體的qPC-1在三個(gè)不同的環(huán)境中均能被檢測到;在第10號(hào)染色體的qPC-10在兩個(gè)環(huán)境中能夠被重復(fù)檢測到;其他的位點(diǎn)只能被檢測到一次。表2水稻籽粒蛋白質(zhì)含量QTL檢測實(shí)施例2:qPC-10的精細(xì)定位和圖位克隆1、分子標(biāo)記的發(fā)展本發(fā)明中所用到SSR標(biāo)記信息全部來自于Gramene網(wǎng)站數(shù)據(jù)庫(http://www.gramene.org./)。此外,還根據(jù)網(wǎng)上公布的粳稻品種Nipponbare的基因組序列(http://rgp.dna.affrc.go.jp),以及秈稻品種93-11的基因組序列(http://rise.genomics.org.cn/)設(shè)計(jì)了在Habataki和Sasanishiki間具有多態(tài)的InDel(Insert/Deletion)標(biāo)記,用于qPC-10的精細(xì)定位分析。2、重組單株的分析和qPC-10的精細(xì)定位及候選基因確定對(duì)39個(gè)單片段代換系群體的基因型和表型進(jìn)行鑒定,SL431被認(rèn)為含有qPC-10且其精米蛋白質(zhì)含量顯著高于背景親本Sasanishiki。SL431是以Sasanishiki為背景且在第10號(hào)染色體上有且只有一個(gè)片段被Habataki替換。因此,為了精細(xì)定位qPC-10,將SL431和Sasanishiki雜交后自交獲得2237株F2單株。在F2群體中,精米蛋白質(zhì)含量呈典型的正態(tài)分布,變化范圍從8.3%到14.5%。為了消除環(huán)境對(duì)精米蛋白質(zhì)含量的影響,挑選出1060株具有極端精米蛋白質(zhì)含量的單株形成亞定位群體,極端值變化范圍分別是8.3%到9.5%和11.5%到14.5%。為了縮小目標(biāo)區(qū)段,在代換片段上均勻地設(shè)計(jì)標(biāo)記,共篩選出9個(gè)具有多態(tài)的SSR標(biāo)記(RM3882、RM7217、RM217、RM5348、RM6142、RM5758、RM467、RM8201和RM1859)和1個(gè)InDel(YYH-4)標(biāo)記,該InDel標(biāo)記序列為:F:5’-AAGGATTGGATGTGGGAAGC-3’(SEQIDNO.3);R:5’-AGCAACTTCGGGATGGGT-3’(SEQIDNO.4)。經(jīng)基因型鑒定,在該代換區(qū)段里共存在228個(gè)重組單株。結(jié)合1060個(gè)F2單株的基因型和表型數(shù)據(jù),QTL軟件分析結(jié)果表明在標(biāo)記RM467和RM5658之間存在一個(gè)峰,LOD值為18.8,共可以解釋19.6%的變異,這兩個(gè)標(biāo)記的物理距離為579Kb,初步判斷qPC-10處于該區(qū)段里。為進(jìn)一步確定qPC-10的位置,選取在區(qū)段RM467和RM5658間基因型為雜合的F2單株繼續(xù)種植,形成2000株F3單株。單株收種并考察精米蛋白質(zhì)含量,同時(shí)在標(biāo)記RM467和RM5658之間開發(fā)STS標(biāo)記飽和圖譜。定位結(jié)果表明,在標(biāo)記Y1和Y6區(qū)段里共有8種不同的重組基因型,并對(duì)這8種基因型的精米蛋白質(zhì)含量比較分析。利用重疊作圖法最終將qPC-10鎖定在Y1和Y3之間,該區(qū)段的物理距離約為35Kb。經(jīng)生物信息學(xué)分析表明,在該區(qū)段里共有4個(gè)開放閱讀框,分別是LOC_Os10g26050,LOC_Os10g26060,LOC_Os10g26070和LOC_Os10g26110。在這之中,LOC_Os10g26060是一個(gè)編碼谷蛋白的基因。因此該基因被認(rèn)為是qPC-10的候選基因(附圖1)。實(shí)施例3:qPC-10的候選基因表達(dá)和轉(zhuǎn)基因驗(yàn)證Real-Time表達(dá)譜分析發(fā)現(xiàn),該基因只在胚乳中表達(dá),在全生育期的其他組織中均無表達(dá).為了進(jìn)一步明確qPC-10基因引起蛋白質(zhì)含量變異的原因,我們構(gòu)建了qPC-10基因的近等基因系,NIL-qPC-10H和NIL-qPC-10S。利用real-timeRT-PCR分析了qPC-10基因的表達(dá)情況。結(jié)果表明來自于秈稻Habataki中的qPC-10H等位基因的表達(dá)要顯著高于粳稻中的qPC-10S等位基因(附圖2)。為了驗(yàn)證qPC-10基因的功能,根據(jù)預(yù)測的候選基因全長cDNA序列(SEQIDNO.1的2001-3500bp),設(shè)計(jì)一對(duì)特異引物擴(kuò)增Habataki啟動(dòng)子和編碼區(qū)的序列,然后連接到TA克隆載體上,挑選出含有候選基因的無突變的正確克隆,再進(jìn)行亞克隆,連接到雙元表達(dá)載體pCAMBIA1301上。在該基因編碼區(qū)尋找一段特異的23bp的序列連接到SK-gRNA載體后測序挑選出無突變的正確克隆,酶切后連接到終載體pC1300-Cas9上對(duì)該基因進(jìn)行敲除。采用轉(zhuǎn)基因的方法,將得到的正確克隆的質(zhì)粒通過農(nóng)桿菌介導(dǎo)的水稻遺傳轉(zhuǎn)化體系導(dǎo)入到Sasanishiki和SL431中,經(jīng)過誘導(dǎo)、繼代、侵染、共培養(yǎng)、篩選具有潮霉素抗性的愈傷、分化、生根、煉苗移栽得到轉(zhuǎn)基因的水稻植株。對(duì)轉(zhuǎn)基因株系進(jìn)行蛋白質(zhì)含量等品質(zhì)相關(guān)指標(biāo)測定,結(jié)果表明qPC-10H可以顯著提高粳稻的蛋白質(zhì)含量(表3)。表3轉(zhuǎn)基因株系中總蛋白質(zhì)含量和四種貯藏蛋白含量比較注:表中數(shù)據(jù)為mean±SD。實(shí)施例4:比較測序確定qPC-10等位基因間的自然變異(1)序列測定對(duì)精米蛋白質(zhì)含量高的品種Habataki和精米蛋白質(zhì)含量低的品種Sasanishiki進(jìn)行目標(biāo)基因的測序。利用6對(duì)PCR引物(表4)相互組合,采用高保真度的PrimerStar從這兩個(gè)品種的基因組中進(jìn)行PCR擴(kuò)增,擴(kuò)增成功后交南京金斯瑞公司進(jìn)行測序拼接。表4序列測定引物序列(2)發(fā)生自然變異的序列比較目標(biāo)區(qū)段的序列比較分析在精米蛋白質(zhì)含量高的品種Habataki和精米蛋白質(zhì)含量低的品種Sasanisiki之間進(jìn)行,發(fā)現(xiàn)在4.5Kb的啟動(dòng)子和編碼區(qū)范圍內(nèi)精米蛋白質(zhì)含量高和低的兩個(gè)品種間存在7個(gè)SNP和InDel差異,其中6個(gè)處于啟動(dòng)子區(qū),1個(gè)處于3’UTR區(qū),在基因的編碼區(qū)不存在差異(表5)。因此,這些變異很可能是引起基因表達(dá)變異的原因,進(jìn)而導(dǎo)致水稻精米蛋白質(zhì)含量的變異。表5不同秈粳品種間候選基因的序列差異實(shí)施例5:鑒別qPC-10不同等位基因的分子標(biāo)記為了便于識(shí)別Habataki和Sasanishiki中所攜帶控制稻米蛋白質(zhì)含量qPC-10的基因型,我們?cè)趩?dòng)子+546bp(SEQIDNO.1的1455bp)的位置上設(shè)計(jì)一個(gè)能夠鑒別qPC-10等位基因型的功能標(biāo)記G2。該標(biāo)記為CAPs標(biāo)記,引物序列為:F:5’-TGTGTCACGCCTAATACT-3’(SEQIDNO.17),R:5’-ATGAAAGAAGATGTGGTG-3’(SEQIDNO.18)。對(duì)于攜帶有qPC-10粳型等位基因的片段能夠被限制性內(nèi)切酶ClaI切開(如圖3泳道1Sasanishiki),而攜帶qPC-10秈型等位基因的片段則不能被切開(如圖3泳道2秈稻Habataki)。該標(biāo)記可以較好地區(qū)分qPC-10座位上的不同等位基因(附圖3),為進(jìn)一步利用qPC-10基因改良稻米品質(zhì)提供了快捷的工具。當(dāng)前第1頁1 2 3