本發(fā)明屬于基因工程領域,具體涉及一種與棉纖維發(fā)育相關的wrky轉錄因子基因及其應用。
背景技術:
棉花是世界上最主要的農(nóng)作物之一,也是我國最大的經(jīng)濟作物。棉花是關系著國計民生的特殊商品,在我國國民經(jīng)濟中占有重要地位。棉纖維作為重要的天然纖維,是紡織工業(yè)的主要原材料,其產(chǎn)量和纖維品質(zhì)直接決定了棉花的商業(yè)價值。隨著世界紡織工業(yè)的發(fā)展,對棉纖維強度、細度和成熟度等內(nèi)在品質(zhì)的要求更高,然而目前大多國產(chǎn)原棉的棉纖維長度和強度都達不到紡織工業(yè)的要求。因此,提高棉纖維的產(chǎn)量,改良棉纖維的品質(zhì),一直是棉花產(chǎn)業(yè)發(fā)展的研究方向和育種目標。
棉花纖維細胞的形態(tài)發(fā)生包含了一個高度調(diào)控的細胞分化過程。每個纖維細胞都是由胚珠表面的外表皮細胞分化而來的單細胞毛狀突起。纖維發(fā)育經(jīng)歷幾個連續(xù)又重疊的階段,即纖維細胞的起始、伸長、次生壁增厚和脫水成熟。棉纖維細胞壁持續(xù)約50天的形態(tài)發(fā)生過程決定了棉纖維的品質(zhì)參數(shù)。胚珠表皮細胞纖維的起始數(shù)目決定成熟纖維的產(chǎn)量,纖維的伸長和次生壁的增厚程度決定成熟纖維的長度和強度。因此,深入研究棉纖維發(fā)育過程及調(diào)控機理,可望為提高棉纖維產(chǎn)量和品質(zhì)開辟新的途徑。
棉花纖維發(fā)育過程受轉錄水平的調(diào)控。目前已發(fā)現(xiàn)的主要轉錄因子家族hd-zip蛋白、myb蛋白、nac蛋白等都在纖維細胞起始或發(fā)育過程中起到至關重要的作用。wrky轉錄因子是近年來在植物中發(fā)現(xiàn)的特有新型轉錄調(diào)控因子,因在其n端含有由wrkygqk組成的高度保守的氨基酸序列而得名。已有研究表明,wrky轉錄因子在植物的生長發(fā)育、衰老、生物和非生物脅迫應答中發(fā)揮非常重要的作用。但是對于wrky轉錄因子是否參與調(diào)控棉花纖維發(fā)育還尚無報道。因此,闡明wrky轉錄因子在棉纖維發(fā)育中的作用以及調(diào)控機理,分離鑒定相關的重要調(diào)控基因,對于棉花纖維品質(zhì)改良,具有重要意義。
wrky蛋白家族屬于鋅指型轉錄調(diào)控因子,最主要的結構特點是其dna結合域中至少含有一個wrky結構域,該結構域是一段由大約60個高度保守的氨基酸殘基所組成的多肽序列,在其n端有一個具有高度保守的7肽區(qū)域(wrkygqk),為其核心區(qū)域,其c末端為一個鋅指結構(zincfingermotif),一般組成為cx4~5cx22~23hx1h。依據(jù)wrky結構域中wrky基序數(shù)目和鋅指結構特征的差異,將wrky家族分成3類:第i類成員含有2個wrky基序和c2h2型鋅指結構,第ii類成員含有1個wrky基序和c2h2型鋅指結構,第iii類成員則含有1個wrky基序和c2hc型鋅指結構。研究發(fā)現(xiàn),大多數(shù)wrky轉錄因子都只含有1個wrky結構域,屬于ⅱ類,而ⅲ類wrky轉錄因子只存在于高等植物中,在一些低等植物如苔蘚植物中卻不存在。同時,高等植物中幾乎所有的ⅲ類wrky轉錄因子都與植物的生物脅迫應答反應有關,這說明ⅲ類wrky轉錄因子可能是由于植物受環(huán)境壓力通過適應性進化所產(chǎn)生。
wrky蛋白能特異的與dna結合區(qū)的(t)(t)tgac(c/t)序列結合,這一結合區(qū)稱為w-box,其中包含一個tgac保守核心序列,它對于wrky轉錄因子的結合必不可少。此外,zn2+等金屬離子的參與和磷酸化作用等也利于wrky轉錄因子與w-box的結合。大多數(shù)wrky轉錄因子的目標基因啟動子中都含有數(shù)量不定的w-box,它們之間或同向排列或形成回文結構。wrky轉錄因子與功能基因或其他調(diào)控因子基因啟動子中存在的w-box結合,調(diào)節(jié)這些下游基因的表達。
wrky轉錄因子參與調(diào)控植物的一些生長發(fā)育過程。如大豆gmwrky13和擬南芥atwrky75與側根的生長有關;水稻oswrky31也與側根的形成和延伸有關。擬南芥atwrky6和水稻oswrky23可以引發(fā)衰老的進程,而atwrky70可以負調(diào)控衰老反應。擬南芥atttg2是一個編碼wrky轉錄因子的基因,它在擬南芥表皮毛狀體以及種皮的形成中起了重要的作用。另外,wrky轉錄因子還參與了植物的一些新陳代謝過程,如大麥susiba2參與了體內(nèi)的糖代謝,棉花gawrky1調(diào)控倍半烯的生物合成。水稻oswrky71以及大麥hvwrky38可以抑制糊粉細胞中ga誘導的α-淀粉酶的活性,從而抑制種子的萌發(fā)。但是,wrky轉錄因子在棉花纖維發(fā)育過程中的調(diào)控功能至今未見研究報道。因此,研究闡明wrky轉錄因子在棉纖維發(fā)育中的調(diào)控作用,具有重要的理論和實踐意義。
技術實現(xiàn)要素:
本發(fā)明針對現(xiàn)有技術的不足,目的在于提供一種與棉纖維發(fā)育相關的wrky轉錄因子基因及其應用。
本發(fā)明提供與棉纖維發(fā)育相關的wrky轉錄因子基因,其具有:
1)核苷酸序列如seqidno.1所示;或
2)如seqidno.1所示核苷酸序列經(jīng)取代、缺失和/或增加一個或幾個核苷酸;或
3)在嚴格條件下與1)限定的dna序列雜交的核苷酸序列。
本發(fā)明還提供與棉纖維發(fā)育相關的wrky轉錄因子基因的cdna序列,核苷酸序列如seqidno.2所示。
本發(fā)明還提供與棉纖維發(fā)育相關的wrky轉錄因子基因編碼的蛋白質(zhì),氨基酸序列如seqidno.3所示。
上述與棉纖維發(fā)育相關的wrky轉錄因子基因在改良棉纖維產(chǎn)量和品質(zhì)方面的應用。
本發(fā)明的有益效果:本發(fā)明提供了一個新的與棉纖維發(fā)育相關的ghwrky16基因序列及cdna序列,該基因在棉纖維中高水平表達,表明該基因可能在調(diào)控棉纖維起始和伸長發(fā)育過程中起重要作用;在ghwrky16rnai轉基因棉花中,在棉纖維發(fā)育過程中發(fā)揮重要作用的ghhox3和ghmyb109等重要調(diào)控基因的表達下調(diào),纖維素合酶基因表達量也下降;與野生型相比,ghwrky16rnai轉基因棉花成熟纖維長度顯著變短,而且短絨較少或缺失;ghwrky16蛋白定位于細胞核中,能夠直接與ghhox3和ghmyb109基因啟動子上的w-box順式元件結合,這表明ghwrky16基因可能通過調(diào)控棉纖維相關的下游靶基因來調(diào)節(jié)棉纖維細胞起始和伸長發(fā)育過程,影響棉纖維產(chǎn)量和品質(zhì)。
附圖說明
圖1為熒光定量rt-pcr分析ghwrky16在棉花組織中的表達,其中r:根;l:葉片;c:子葉;h:下胚軸;p:花瓣;a:花藥;f:纖維;0d:開花當天胚珠;3d:開花后3天纖維;6d:開花后6天纖維;9d:開花后9天纖維;12d:開花后12天纖維;15d:開花后15天纖維;18d:開花后18天纖維,誤差線代表標準誤差。
圖2為ghwrky16蛋白在擬南芥下胚軸細胞中的亞細胞定位,其中a:擬南芥植株下胚軸細胞中ghwrky16-gfp熒光信號;b:gfp熒光圖像與同一細胞的明視野圖像的重合。
圖3為ghwrky16轉基因棉花表型分析,其中a:熒光定量rt-pcr分析ghwrky16基因在野生型(wt)和轉基因棉花株系(l1~l8)開花9天后的纖維中的表達;b:野生型和ghwrky16rnai轉基因棉花株系(l1、l3、l5)開花當天的胚珠體外離體培養(yǎng);c:野生型和ghwrky16rnai離體胚珠培養(yǎng)12天、15天和18天后纖維長度統(tǒng)計分析(n>30);d:野生型和ghwrky16rnai轉基因棉花成熟纖維長絨和短絨形態(tài)比較;e:野生型和ghwrky16rnai轉基因棉花成熟纖維長度測量及統(tǒng)計分析(n>50);f:野生型和ghwrky16rnai轉基因棉花開花當天(0d)及開花后1天(1d)、2天(2d)胚珠橫切片,顯示開花0天、1天、2天后的纖維細胞突起分化情況;誤差線代表標準誤差,*表示轉基因與野生型在t-檢驗中p值<0.05,存在顯著差異;**表示轉基因與野生型在t-檢驗中p值<0.01,存在極顯著差異。wt,野生型;l1~l8,ghwrky16-rnai轉基因棉花株系。
圖4為纖維素合酶ghcesa3、ghcesa5、ghcesa10在野生型(wt)及ghwrky16rnai轉基因棉花(l1、l3、l5)開花后9天的纖維中的表達情況。wt,野生型;l1,l3和l5,ghwrky16-rnai轉基因棉花株系。
圖5為與棉纖維發(fā)育相關基因ghhox3、ghrdl1、ghexp1以及ghmyb109在野生型(wt)和ghwrky16rnai轉基因棉花(l1、l3、l5)開花后9天的纖維中的表達情況。wt,野生型;l1,l3和l5,ghwrky16-rnai轉基因棉花株系。
圖6為ghwrky16蛋白與ghhox3和ghmyb109啟動子結合的emsa分析。
具體實施方式
為了更好地理解本發(fā)明,下面結合實施例進一步闡明本發(fā)明的內(nèi)容,但本發(fā)明的內(nèi)容不僅僅局限于下面的實施例。
實施例1棉花wrky家族基因ghwrky16全長序列的克隆鑒定和功能分析
1.ghwrky16基因及cdna序列的分離鑒定:
在棉花基因組及est數(shù)據(jù)庫中篩查相關的ghwrky基因及cdna序列,鑒定了22個棉花wrky基因,其中有一個基因(命名為ghwrky16)在棉纖維中優(yōu)勢表達,通過dna和蛋白質(zhì)序列分析,利用棉花纖維細胞的轉錄本(總rna),分離獲得ghwrky16全長cdna序列。按照ghwrky16cdna序列設計引物,以棉花基因組dna為模板,采用pcr技術擴增獲得該基因的dna全長序列。序列分析表明,ghwrky16基因全長序列(如seqidno.1所示)包含5’-上游啟動子區(qū)(1~2000bp)、3個外顯子、2個內(nèi)含子(下劃線)和3’-utr(3527–3649bp);ghwrky16基因的cdna序列如seqidno.2所示,其中含有957bp開放閱讀框(從起始密碼子atg到終止密碼子taa),編碼318個氨基酸(氨基酸序列如seqidno.3所示),分子量為34kda。ghwrky16蛋白dna結合域中含有一個wrky結構域,該結構域的n端有一個具有高度保守的wrkygqk7肽區(qū)域,為其核心區(qū)域,其c末端鋅指基序為c2h2,屬于二類wrky轉錄因子。
2.定量rt-pcr分析ghwrky16基因的表達:
利用rna提取試劑盒(qiagin)提取純化棉花不同組織和纖維的總rna,實時熒光定量rt-pcr研究基因的表達(按照lixb,fanxp,wangxl,cail,yangwc,2005.thecottonactin1geneisfunctionallyexpressedinfibersandparticipatesinfiberelongation.plantcell17:859–875進行)。首先,將棉花不同組織(根、葉片、子葉、下胚軸、花瓣、花藥、開花后0天胚珠、開花后3、6、9、12、15和18天纖維等)的總rna(2μg/樣)用m-mlvrnaseh-reversetranscriptase(promega)反轉錄成cdna;然后,以cdna為模板,用基因特異的引物(ghwrky16rtp1:5’-gaagtgtaattccatggatg-3’和ghwrky16rtp2:5’-tgactaatctgaacaaccct-3’)和real-timepcrmastermix(toyobo,japan)進行定量pcr反應。棉花ghubi1基因作為rt-pcr反應的內(nèi)標,目標基因每一個循環(huán)的擴增都被sybr-green熒光檢測,計算目標基因的表達水平相對值。每一實驗重復3次,統(tǒng)計分析實驗結果。熒光定量rt-pcr結果顯示ghwrky16在棉花各組織和棉纖維不同發(fā)育階段均有不同程度的表達,在開花后3~9天的棉纖維中優(yōu)勢表達(圖1),推測該基因可能在伸長期的棉纖維細胞中發(fā)揮調(diào)控作用。
3.ghwrky16蛋白的細胞亞定位分析
構建ghwrky16:egfp植物表達載體,將該載體通過電轉化法轉入gv3101農(nóng)桿菌中,通過浸花法轉化擬南芥,收獲成熟擬南芥的t0代種子,篩選陽性植株。將轉基因擬南芥t2代種子在含卡那霉素的ms培養(yǎng)基上萌發(fā)生長5天后,置于共聚焦顯微鏡下觀察轉基因擬南芥小苗的下胚軸細胞的綠色熒光蛋白(gfp)的熒光信號。亞細胞定位分析結果顯示,gfp熒光信號主要分布在下胚軸細胞的細胞核中,ghwrky16蛋白位于細胞核中(圖2)。
4.ghwrky16rnai轉基因棉花表型分析:
構建35s啟動子驅(qū)動的pmd-ghwrky16rnai載體,轉化農(nóng)桿菌lba4404。利用農(nóng)桿菌浸染棉花下胚軸外植體,共培養(yǎng)2天后,將下胚軸轉移到選擇培養(yǎng)基上培養(yǎng),誘導并篩選到轉化愈傷組織。將該愈傷組織經(jīng)過8~10個月的繼代培養(yǎng)后,誘導分化出胚性愈傷組織和體細胞胚,體細胞胚進而萌發(fā)再生為轉基因棉花幼苗。將棉花幼苗移栽至土中,生長發(fā)育至開花結實。提取棉花基因組dna,利用pcr技術檢測鑒定轉基因棉花植株。
(1)實時熒光定量rt-pcr研究基因的表達:按照lixb,fanxp,wangxl,cail,yangwc,2005.thecottonactin1geneisfunctionallyexpressedinfibersandparticipatesinfiberelongation.plantcell17:859–875進行,提取開花后9天的纖維rna,逆轉錄成cdna后,以cdna為模板,用基因特異的引物(ghwrky16rtp1和ghwrky16rtp2)和real-timepcrmastermix(toyobo,japan)進行定量pcr反應。以ghubi1做為內(nèi)參分析ghwrky16在野生型(wt)及轉基因植株各株系中的表達情況。重復3次,統(tǒng)計分析實驗結果。
(2)離體胚珠培養(yǎng)實驗:選取開花當天的野生型(wt)及3個ghwrky16rnai轉基因棉花株系(l1、l3和l5)的胚珠置于bt培養(yǎng)基中分別無菌培養(yǎng)(暗處理,30℃)12天、15天和18天后,用固定液固定后測量胚珠表面纖維長度進行統(tǒng)計分析,誤差線代表標準誤差,*表示轉基因與野生型在t-test中p值<0.05存在顯著差異,**表示轉基因與野生型在t-test中p值<0.01存在極顯著差異。
(3)成熟棉纖維統(tǒng)計測量:纖維成熟后,對野生型(wt)及ghwrky16rnai轉基因植株各株系成熟纖維長度進行測量與統(tǒng)計(n>50)。ck為兩個分離出來的非轉基因植株,剩下都為不同的ghwrky16rnai轉基因株系。誤差線代表標準誤差,*表示轉基因與野生型在t-test中p值<0.05存在顯著差異,**表示轉基因與野生型在t-test中p值<0.01存在極顯著差異。
(4)胚珠徒手切片:取野生型(wt)及ghwrky16rnai轉基因植株開花當天(0天)、1天和2天的胚珠進行徒手切片,切成約1mm的薄片在顯微鏡下觀察并拍照。
本發(fā)明構建了ghwrky16rna干擾(rnai)載體,轉化棉花,獲得了轉基因棉花植株。首先對ghwrky16轉基因植株進行rna水平上表達量的檢測,結果顯示在大多數(shù)ghwrky16rnai轉基因植株中,ghwrky16基因的表達量均大幅度下調(diào)(圖3a)。ghwrky16rnai轉基因植株的棉桃相較與野生型要小一些。對開花當天的ghwrky16rnai轉基因棉花及野生型胚珠進行體外培養(yǎng),12~18天后觀察發(fā)現(xiàn),轉基因棉花胚珠發(fā)育遲緩,纖維長度明顯短于野生型(圖3b、c)。對rnai轉基因植株成熟棉纖維長度進行測量分析,結果表明,大多數(shù)ghwrky16rnai轉基因棉花植株的成熟纖維長度均顯著短于野生型(圖3e)。而且,剝除長纖維后,發(fā)現(xiàn)rnai轉基因棉花種子上的短絨也變少,一些株系的種子表面幾乎沒有短絨(圖3d)。上述結果表明,ghwrky16表達下調(diào)可能影響棉花纖維發(fā)育過程,導致成熟棉纖維長度變短,甚至短絨缺失現(xiàn)象。為進一步研究ghwrky16是否影響棉纖維細胞的起始分化,對開花當天、開花后1天和2天的胚珠進行徒手切片,在顯微鏡下觀察胚珠表面纖維細胞突起的數(shù)目及排列方式是否發(fā)生變化,發(fā)現(xiàn)rnai轉基因棉花胚珠表面的纖維細胞突起明顯減少,纖維細胞伸長發(fā)育遲緩(圖3f)。這說明ghwrky16在棉纖維發(fā)育的起始和伸長階段都發(fā)揮重要作用。
5.ghwrky16rnai轉基因棉花中纖維素合酶及其他相關基因表達分析
按照lixb,fanxp,wangxl,cail,yangwc,2005.thecottonactin1geneisfunctionallyexpressedinfibersandparticipatesinfiberelongation.plantcell17:859–875進行。提取野生型(wt)及ghwrky16rnai轉基因棉花植株開花后9天的纖維rna,以ghubi1為內(nèi)參進行實時定量pcr分析纖維素合酶以及棉纖維發(fā)育相關基因的表達。誤差線代表標準誤差,*表示轉基因與野生型在t-test中p值<0.05存在顯著差異,**表示轉基因與野生型在t-test中p值<0.01存在極顯著差異。
本發(fā)明分析了ghwrky16rnai轉基因棉花中ghcesa3、ghcesa5和ghcesa10等纖維素合酶基因的表達情況(圖4)。結果顯示,與野生型相比,在ghwrky16下調(diào)比較顯著的兩個轉基因株系l1、l3、l5中,ghcesa3、ghcesa5和ghcesa10的表達量明顯下調(diào)。同時對這三個基因的啟動子進行分析時發(fā)現(xiàn),ghcesa3和ghcesa5的啟動子中均有wrky家族特異性結合元件“w-box”。我們推斷ghwrky16可能通過與ghcesa3和ghcesa5的啟動子中的“w-box”元件結合而調(diào)控它們的表達,從而影響棉花纖維的早期發(fā)育。
6.emsa實驗分析ghwrky16蛋白與ghhox3、ghmyb109啟動子上w-box元件的結合
在大腸桿菌中表達純化帶有his標簽的ghwrky16蛋白,從ghhox3和ghmyb109啟動子上選取含有w-box的dna序列片段,合成帶有生物素標記探針。以帶有生物素標記的上述dna序列為探針,以未標記的同一dna序列作為冷探針競爭,進行emsa實驗。結果顯示,ghwrky16蛋白能夠與ghhox3和ghmyb109啟動子上的w-box順式元件結合,加入未標記的探針能夠減弱所標記探針的熒光強度,使emsa實驗中的結合條帶減弱或消失。這表明ghwrky16可能通過調(diào)控下游ghhox3和ghmyb109基因的表達來調(diào)節(jié)棉纖維發(fā)育。
ghhox3在棉纖維發(fā)育初期表達量較高,且通過調(diào)控其下游的靶基因ghexp1以及ghrdl1的表達來影響棉纖維伸長。ghmyb109在起始和伸長的棉花纖維中表達量較高且調(diào)控棉纖維發(fā)育,在ghmyb109表達下調(diào)的轉基因棉花中成熟纖維長度變短。因此分析了這些基因在ghwrky16rnai轉基因棉花纖維中的表達情況(圖5)。結果顯示,與野生型相比,ghhox3、ghrdl1、ghexp1及ghmyb109在ghwrky16rnai轉基因植株中的表達量均明顯下降。分析它們的啟動子序列發(fā)現(xiàn),只有ghhox3及ghmyb109的啟動子序列中含有wrky家族特異性結合元件“w-box”。因此,我們推測ghwrky16可能通過與ghhox3、ghmyb109啟動子區(qū)域的“w-box”結合來調(diào)控其表達,從而影響棉纖維發(fā)育。進一步實驗證實,ghwrky16轉錄因子能夠與ghhox3、ghmyb25和ghmyb109基因的啟動子結合。如圖6所示,esma實驗結果顯示ghwrky16蛋白可以與ghhox3和ghmyb109的dna探針結合形成復合物,且隨著競爭性探針的增加,檢測到的結合復合物減少或消失。上述實驗結果表明,ghwrky16可能通過調(diào)控下游ghhox3和ghmyb109等來調(diào)節(jié)棉纖維發(fā)育過程,影響棉纖維產(chǎn)量和品質(zhì)。
顯然,上述實施例僅僅是為清楚地說明所作的實例,而并非對實施方式的限制。對于所屬領域的普通技術人員來說,在上述說明的基礎上還可以做出其它不同形式的變化或變動。這里無需也無法對所有的實施方式予以窮舉。而因此所引申的顯而易見的變化或變動仍處于本發(fā)明創(chuàng)造的保護范圍之內(nèi)。
序列表
<110>華中師范大學
<120>一種與棉纖維發(fā)育相關的wrky轉錄因子基因及其應用
<160>3
<210>1
<211>3649bp
<212>dna
<213>棉花ghwrky16基因序列
<400>1
gagtttaatttttattttgagtataaaataattttaaaattttttattaacatttacctc60
ttaataaattaataaaatacgaaaaattaattattaaatttaccccaagaaataatttaa120
aatataaaaaaattcgaactgtttatattaaatcaaaatggctaagggttccactttttt180
gaggaaaaaaaaagagaatcccatgtgacttgtgggatgagactttgtcacattgaccgc240
cgtttccagtttccggtgaaaaagtagatcggggccccactttttattgtgggtcccact300
aataactttaaaatttattattgtttattaattttgtttttaaggtcaactctaatcact360
gtctccaactccaacctaaaataaataaataaaaggtttaatttttttaaaattataata420
atagagtaaagttcgaataacaaacacgattagctcgatttaaatataggctatacttga480
ggcggtgaacacccttagcaatcacatgggattcaaataaaaggtttaattttataatcc540
tatttttaaattttaaaatattataattgagttattaaagtatgaattttttttgtcaat600
ttaatcataaattcgagtattaaatgttattttgaatgtgacgtggaatataactaaaac660
acgtaacataaattattaaatgaagtttgatacgattggtaaagaagaagattcaagacc720
taccacatgtaaaagttaaattcgagtactaaatgttattttgaaagtgacgtaaaatat780
aattaaaatacgtaaattatttaatgaagttttggcatgattggtaaagaggaagactta840
ctgcatgcaaaagttagatttgagtattaaatgttattttgattgtgacgtgaaatataa900
ttaaaacacgtaaattattaaatgaataatttgcacgaatttttgagtctcatggtaaag960
ttttagtccagttgtcagttttagcccgaatcgtattagctcttaatctacttgtgttgt1020
aataatttgatcctattttgtgattagttcataattgtattgtatttgtaatacttaaaa1080
aaacacgtaatttaaattgtaggcaagtgtaaaatcaacccatacttagatctaacctgt1140
taaaaaaatttaacatcaataaattttaagaaaattatttatttatttttgaacacgata1200
tattcaaattttgtatgtaactgttttttcgtttttaaaatgttttcaaatatctttcgt1260
gttaaatttaaattggcatttaatatctacattaattattaagttaccaaaatgatggga1320
caacaaattaaaattatgactaaataagaaaaattaagaaatcaaaaatcgatacaaatt1380
aggtaaaattactacaaaactccttatatcatacacacactagatgagttagcataacaa1440
tttatctgttaaaatttggtgtttatatataaagtataataatatatttagctatcaact1500
tttacatatttataaaatttagcctatactcttttattgggtcgatattattattttaac1560
agaagattgttttactcacgcatccaatgtaaatagaatactttatttattttttaaata1620
aagaaaataaaatgcaattcttggtacagtttttagaatacaattaaaaagaaatcagaa1680
tttatttatgagaaattaatattaaatatttttttagaaaaaaaatcccaaatttacaga1740
gtcatcaatttcaaacggctaatccccaccttttgaccttatctcttgtcagtgacccaa1800
tgagaaaggcatccctttgacgaaaactcgaatctctttcatcataaatcataatcaatc1860
tttcactttttcttcgtaattaaatctcaattcatttcagttcccccctctttgttctgc1920
ttcatctatataataaactctgcttttatttgggagtttctcaaaagggctgggtgttct1980
ttgttttcgtatgagcagagatgacggtggaattgatgatgggtcacggcggcgttggcg2040
gtggaggcaacagttttacagtcaaaatggaggaaactgctttgaaagaagctgctaatg2100
ctgggattcaaggttttgaagaactgataagattgatgtctaaaagtcaacagcttcgct2160
cgcaagatgtttgttttaatgccccttcaagttcagaaccagctatggaaatccaagctg2220
ttacagataagactgtaagttcctttaaaaaagttatttcgttattgggtcgacctagaa2280
ctggtcatgctcggttcagacgagctcctcttaatcatctcccacaacaacaacagattc2340
aagtgagcaaagatgaagaagtatcgacttttaagcctttatgttcaaccccaagttata2400
agttacctcctttgccaaccaaaagtagccatgttttaaagactggtgttttagagcctg2460
ggaattctgttatgtcttcattgactggggatactgatagcatacaacaccaaccgtgtt2520
tctctattggttttcaattcactaacccttcttctcatggcaaacctcctttgtcttcaa2580
aaaggaagtgtaattccatggatgatgttgctaatctcaagtgtggatcatcatcctctg2640
ctcgttgccattgttccaagaagaggttggtccttggtgcttggttcttcactttttgat2700
tgtgatctttgatggtttcatttgattttgattatgtatgtgttcatgtaggaaatcaag2760
agtgaaaagagtcattagagtcccagctgttagcaacaaaatggctgatattcctcacga2820
tgattattcttggagaaaatatggccaaaaaccaatcaaaggttctcctcatccaaggtg2880
tgttttttcgattaaatttcgaatggattctaatagagtgaattctacaccaaagtttca2940
atttttttgaagttgactaaagggttccaaagttttcaaacaataattcatgtatgtatt3000
gaatgcctttttgtttggttttcaactacaaacattaatcatattctatttggcaaaaaa3060
ttaattgttaatttgactttttgcggggaagtgcatggagacttttgaattagaaattct3120
ttttactagaaaaatagataaattagtatttagattaaagagtaaatttgtatgggatga3180
aatttttaataaaaataattaatttactcttttatttaggactaatttattaaattttca3240
taatagagatttaaaatacaatagtatttgtattataacattgaattattgccttactac3300
cgagttggttcattgagttcgcttttttaactcagtcccatatgttttaacaaatttcag3360
gggctattacaaatgtagcagtgtcagaggttgtcctgcaaggaagcatgtagaaagagc3420
tgtcgaggatccaaggatgttgattgtaacatacgaaggtgatcacaatcatagccataa3480
tatcaccacagatgtcccatcggcgctagttcttgaatcatcataaagatcatcccatcc3540
aacggctaaaatatctatagggttgttcagattagtcaatttagatccataggttctgtc3600
tccaacaagacaaaagaagattgattagtgggtaagtttagctgtttct3649
<210>2
<211>1109bp
<212>dna
<213>棉花ghwrky16基因的cdna序列
<400>2
atgacggtggaattgatgatgggtcacggcggcgttggcggtggaggcaacagttttaca60
gtcaaaatggaggaaactgctttgaaagaagctgctaatgctgggattcaaggttttgaa120
gaactgataagattgatgtctaaaagtcaacagcttcgctcgcaagatgtttgttttaat180
gccccttcaagttcagaaccagctatggaaatccaagctgttacagataagactgtaagt240
tcctttaaaaaagttatttcgttattgggtcgacctagaactggtcatgctcggttcaga300
cgagctcctcttaatcatctcccacaacaacaacagattcaagtgagcaaagatgaagaa360
gtatcgacttttaagcctttatgttcaaccccaagttataagttacctcctttgccaacc420
aaaagtagccatgttttaaagactggtgttttagagcctgggaattctgttatgtcttca480
ttgactggggatactgatagcatacaacaccaaccgtgtttctctattggttttcaattc540
actaacccttcttctcatggcaaacctcctttgtcttcaaaaaggaagtgtaattccatg600
gatgatgttgctaatctcaagtgtggatcatcatcctctgctcgttgccattgttccaag660
aagaggaaatcaagagtgaaaagagtcattagagtcccagctgttagcaacaaaatggct720
gatattcctcacgatgattattcttggagaaaatatggccaaaaaccaatcaaaggttct780
cctcatccaaggggctattacaaatgtagcagtgtcagaggttgtcctgcaaggaagcat840
gtagaaagagctgtcgaggatccaaggatgttgattgtaacatacgaaggtgatcacaat900
catagccataatatcaccacagatgtcccatcggcgctagttcttgaatcatcataaaga960
tcatcccatccaacggctaaaatatctatagggttgttcagattagtcaatttagatcca1020
taggttctgtctccaacaagacaaaagaagattgattagtgggtaagtttagctgtttct1080
aaaaagtaaaaaaaaaaaaaaaaaaaaaa1109
<210>3
<211>318
<212>prt
<213>棉花ghwrky16基因編碼的蛋白質(zhì)
<400>3
metthrvalgluleumetmetglyhisglyglyvalglyglyglyglyasnserphethr
15101520
vallysmetglugluthralaleulysglualaalaasnalaglyileglnglypheglu
25303540
gluleuiieargleumetserlysserglnglnleuargserglnaspvalcyspheasn
45505560
alaprosersersergluproalametgluiieglnalavalthrasplysthrvalser
65707580
serphelyslysvaliieserleuleuglyargproargiieglyhisalaargphearg
859095100
argalaproleuasnhisleuproglnglnglnglniieglnvalserlysaspgluglu
105110115120
valserthrphelysproleucysserthrprosertyrlysleuproproleuprothr
125130135140
lysserserhisvalleulysthrglyvalleugluargglyasnservalmetserser
145150155160
leuthrglyaspthraspseriieglnhisglnprocyspheserleuglypheglnphe
165170175180
thrasnproserserhisglylysproproleuserserlysarglyscysasnsermet
185190195200
aspaspvalalaasnleulyscysglyserserserseralaargcyshiscysserlys
205210215220
lysarglysserargvallysargvaliieargvalproalavalserasnlysmetala
225230235240
aspiiephohisaspasptyrsertrparglystyrglyglnlysproiielysglyser
245250255260
prohisproargglytyrtyrlyscysserservalargglycysproalaarglyshis
265270275280
valgluargalavalgluaspproargmetleuiievalthrtyrgluglyasphisasn
285290295300
hisserhisasniiethrthraspvalproseralaleuvalleugluserser
305310315318