專利名稱:具有可耐低溫丙酮酸磷酸雙激酶活性的多肽與將其編碼的dna和含有該dna的重組載體以 ...的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及作為賦予植物以耐低溫性的手段的、具有新型可耐低溫丙酮酸磷酸雙激酶(以下簡稱“PPDK”)活性的多肽,將其編碼的無性系化DNA,和含有該DNA的重組載休。此外,還涉及用上述本發(fā)明DNA轉(zhuǎn)型的植物。
背景技術(shù):
C4植物在強(qiáng)光、高溫、低CO2的條件下有高的光合作用能力,但除一部分能適應(yīng)低溫條件外,一般在低溫時(shí)光合成量大大降低。PPDK(EC 2.7.9.1,能催化從ATP、丙酮酸和正磷酸生成AMP、磷酸烯醇丙酮酸和焦磷酸的反應(yīng))是C4途徑的重要酶之一,但其活性與葉組織的光合作用速度相比是不夠的,因而成為C4光合作用中制約二氧化碳固定速度的酶之一。此外,在人們發(fā)現(xiàn)PPDK的同時(shí),就已指出它是低溫敏感酶。在玉米PPDK的情況下,酶活性的內(nèi)彎點(diǎn)是11.7℃,這個(gè)溫度與玉米的生長極限溫度是一致的。從這些事實(shí),可以認(rèn)為PPDK是C4植物低溫光合成速度低的原因之一,通過改善PPDK的低溫敏感性,說不定能降低玉米這種C4植物的生長極限溫度。菊科植物棕黃花菊(Flaveria brownii)屬于C3/C4中間型類別,已知它的PPDK即使在0℃的低溫處理時(shí)也幾乎不會(huì)失活(Burnell JNA comparative study of the cold-sensitivityof pyruvate,Pi dikinase in Flaveria species.Plant CellPhysiol,31,295-297(1990))。
如果使將上述棕黃花菊的耐低溫PPDK編碼的基因無性系化,再用它使植物轉(zhuǎn)型,則可望能賦予植物以耐低溫性。
發(fā)明公開因此,本發(fā)明的目的是提供作為賦予植物以耐低溫性的手段的、具有新型可耐低溫PPDK活性的多肽,將其編碼的無性系化DNA以及含有該DNA的重組載體。此外,本發(fā)明的目的還提供用上述本發(fā)明的DNA轉(zhuǎn)型的植物。
本申請(qǐng)的發(fā)明者等人進(jìn)行深入研究的結(jié)果,成功地使棕黃花菊的全PPDK基因無性系化并確定了其堿基序列和將其編碼的氨基酸序列,此外,還成功地在該P(yáng)PDK基因中識(shí)別出賦予耐低溫性的區(qū)域,從而完成了本發(fā)明。
即,本發(fā)明提供在下列(1)、(2)任意一種中,具有在從氨基酸序列的C端算起占全長1/6的范圍內(nèi)至少一個(gè)以上的氨基酸殘基置換成其它氨基酸殘基的氨基酸序列,且具有可耐低溫丙酮酸磷酸雙激酶活性的多肽(1)具有序列表序列號(hào)1至4任意一種中所示氨基酸序列的丙酮酸磷酸雙激酶;(2)具有與(1)中所示氨基酸序列50%以上相同的氨基酸序列、且具有丙酮酸磷酸雙激酶活性的多肽。
此外,本發(fā)明還提供將具有本發(fā)明可耐低溫PPDK活性的多肽編碼的無性系化DNA。而且,本發(fā)明還提供含有本發(fā)明DNA、可在宿主中表達(dá)具有可耐低溫PPDK的多肽的重組載體。進(jìn)而,本發(fā)明還提供用本發(fā)明DNA轉(zhuǎn)型的植物。
本發(fā)明使具有耐低溫性的PPDK基因無性系化,并確定了其堿基序列。而且,也確定了該基因中賦予耐低溫性的區(qū)域。因此,通過用本發(fā)明的基因使具有低溫敏感性PPDK的植物轉(zhuǎn)型,可使低溫敏感性的PPDK變成耐低溫性。此外,通過使上述賦予耐低溫性的區(qū)域組合到低溫敏感性PPDK的相同部分,也可以使低溫敏感性PPDK變成耐低溫性。通過這樣做,使得即使在原來不能栽培該植物的塞冷地區(qū)也有可能栽培該植物。因此,本發(fā)明可望對(duì)農(nóng)業(yè)做出巨大貢獻(xiàn)。
附圖簡單說明
圖1是一幅模式圖,說明含有本發(fā)明PPDK基因之一例的表達(dá)載體的構(gòu)建方法。
圖2是說明用大腸菌表達(dá)的棕黃花菊、雙齒黃花菊(Flaveriabidentis)和玉米的PPDK在0℃保存時(shí)酶活性隨時(shí)間變化的圖。
圖3是一幅模式圖,說明玉米PPDK和棕黃花菊PPDK的嵌合體基因的構(gòu)建方法。
實(shí)施本發(fā)明的最佳形態(tài)按照本發(fā)明,使具有耐低溫性的棕黃花菊PPDK基因無性系化,并確定了其堿基序列及將其編碼的推算氨基酸序列。該堿基序列和氨基酸序列用序列表的序列號(hào)5表示。這個(gè)序列如以下實(shí)施例中詳細(xì)敘述的那樣,是從棕黃花菊的綠葉提取全RNA,按常法制作cDNA庫,以雙齒黃花菊(Flaveria bidentis)(序列號(hào)1)和玉米的PPDK基因堿基序列(序列號(hào)2)的高同系性區(qū)域作為探子進(jìn)行噬菌斑雜化,選擇陽性無性系進(jìn)行無性系化,再用雙脫氧法確定堿基序列而確定的。這個(gè)序列具有與同屬棕黃花菊PPDK基因一樣高的同系性,也具有比玉米PPDK還要高的同系性,而且還與從棕黃花菊綠葉直接精制的PPDK的N末端序列、C末端序列和內(nèi)部序列完全一致,因而,顯然是棕黃花菊的PPDK基因。而且,雙齒黃花菊的PPDK基因序列也是以玉米cDNA作為探子進(jìn)行噬菌斑雜化、選擇陽性無性系進(jìn)行無性系化再用雙脫氧法確定的。
序列號(hào)與所示氨基酸序列是新型的,與同屬雙齒黃花菊的PPDK氨基酸序列相比,有40個(gè)氨基酸殘基不同。而且,與玉米的PPDK氨基酸序列相比,也有大約180個(gè)氨基酸殘基不同。序列號(hào)5所示的棕黃花菊PPDK氨基酸序列,尤其與同屬雙齒黃花菊PPDK氨基酸序列相比,盡管有如此高的同系性,但雙齒黃花菊的PPDK是低溫敏感的,而棕黃花菊的PPDK則是耐低溫的,這表明氨基酸序列的微小差異引起了性狀上的重要差異。本發(fā)明提供將這種序列號(hào)5所示氨基酸序列編碼的無性系化PPDK基因。如上所述,這種氨基酸序列是新型的,而且有具有耐低溫性這樣的顯著效果。本發(fā)明的基因不限于有序列號(hào)5所示堿基序列的基因,只要是能將這種氨基酸序列編碼,也可以有任何堿基序列。
本申請(qǐng)的諸發(fā)明者也曾試圖識(shí)別序列號(hào)5所示棕黃花菊PPDK基因中與賦予耐低溫性有關(guān)的區(qū)域。即,如以下實(shí)施例中詳述的那樣,用限制性內(nèi)切酶把棕黃花菊的PPDK基因切成大小均等的三部分,把分割的區(qū)域與玉米PPDK基因的對(duì)應(yīng)區(qū)域交換而形成嵌合體PPDK基因,確定該嵌合體基因編碼的PPDK是否有耐低溫性。結(jié)果確認(rèn)在棕黃花菊的最后1/3區(qū)域中存在著賦予耐低溫性的領(lǐng)域。此外,這個(gè)最后1/3區(qū)域又用限制性內(nèi)切酶進(jìn)一步切割成兩等分,用同樣方法確認(rèn)其任意一部分中是否存在賦予耐低溫性的區(qū)域。其結(jié)果確認(rèn)了在序列號(hào)5所示棕黃花菊PPDK基因的XhoI部位下游,即在序列號(hào)5所示氨基酸序列中從第832號(hào)精氨酸至第955號(hào)纈氨酸的氨基酸序列(以下稱這個(gè)序列為“賦予耐低溫性序列”)中,存在著賦予耐低溫性的功能。
即,判明了PPDK與耐低溫性有關(guān)的區(qū)域存在于從C末端起占全長1/6的范圍內(nèi)。另一方面,在序列表序列號(hào)1中列出了雙齒黃花菊PPDK編碼基因的堿基序列及推斷的氨基酸序列,而在序列號(hào)2中列出了玉米PPDK編碼基因的堿基序列及推斷的氨基酸序列(Journalof Biochemistry 263,11080-11083(1988))。序列號(hào)3中列出了細(xì)菌類共生擬桿菌(Bacteroides symbiosus)的PPDK編碼基因的堿基序列及推斷氨基酸序列(Biochemistry 29,10757-10765(1990))。序列號(hào)4中列出了細(xì)菌類組織溶解內(nèi)變形蟲(Entamoebahistolytiea)的PPDK編碼基因的堿基序列及推斷氨基酸序列(Molecular and Biochemical Parasitology 62,153-156(1993))。如上所述,賦予PPDK以耐低溫性的區(qū)域由于已由本發(fā)明判明是在從C末端算起占全長的1/6范圍內(nèi),因而通過使序列號(hào)1至4所示這些氨基酸序列從C末端算起占全長1/6范圍內(nèi)的至少1個(gè)以上氨基酸殘基置換成其它氨基酸殘基,有可能得到耐低溫性PPDK。此外,這里的所謂“耐低溫性”系指酶在0℃的溫度下放置20分鐘時(shí)其活性是放置前的60%以上。
如上所述,序列號(hào)5所示氨基酸序列中從第832號(hào)精氨酸至第955號(hào)纈氨酸的區(qū)域決定了耐低溫性,因而把序列號(hào)1至4中所述低溫敏感性PPDK的對(duì)應(yīng)部分置換成序列號(hào)5所示氨基酸序列中從第832號(hào)精氨酸至第955號(hào)纈氨酸的氨基酸序列,可以使其低溫敏感性PPDK變成耐低溫性。這個(gè)發(fā)現(xiàn)非常重要,因?yàn)槔眠@個(gè)結(jié)果可以賦予所希望的PPDK以耐低溫性。此外,作為賦予PPDK以耐低溫性的方法,如以下實(shí)施例所述,不限于通過使棕黃花菊PPDK中的賦予耐低溫性序列與低溫敏感性PPDK的對(duì)應(yīng)部分交換來制作嵌合體基因的方法,也可以使其植物本身的低溫敏感性PPDK的對(duì)應(yīng)部分發(fā)生部位特異性變異(site-directed mutagenesis),從而改變成與棕黃花菊PPDK的賦予低溫性序列相同的序列。因此,包含上述賦予低溫性序列、具有PPDK活性的多肽編碼無性系化DNA均屬于本發(fā)明的范圍。具體地說,序列號(hào)1所示氨基酸序列的第869號(hào)置換成脯氨酸的PPDK,以及第885號(hào)和第952號(hào)分別置換成亮氨酸和纈氨酸的PPDK,都有耐低溫性。
賦予耐低溫性的PPDK不限于序列表1至4中所示的那些,只要是有其各自同系性50%以上者即可。較好的是與棕黃花菊PPDK堿基序列的同系性可以在48.5%以上,更好的是可以在90%以上。
一般來說,即使在有生理活性的肽的氨基酸序列發(fā)生微小改變的情況下,即,即使在該氨基酸序列中有1個(gè)或多個(gè)氨基酸被置換或缺失或者增加了1個(gè)或多個(gè)氨基酸的情況下,該肽的生理活性仍可保持的情況是眾所周知的事實(shí)。因此,有序列號(hào)5所示氨基酸序列的多肽中進(jìn)行這樣的改性后仍具有耐低溫性PPDK活性的多肽也屬于本發(fā)明的范圍。即,在序列號(hào)5所示氨基酸序列中,加成、缺失或置換了1個(gè)或多個(gè)氨基酸后仍具有耐低溫性PPDK活性的多肽也屬于本發(fā)明的范圍。同樣,在序列號(hào)5所示堿基序列中,加成、缺失或置換了1個(gè)或多個(gè)核苷酸后仍具有耐低溫性PPDK活性的多肽編碼DNA也屬于本發(fā)明的范圍。
引起氨基酸加成、缺失或置換的DNA可諸如借助于誘發(fā)部位特異性變異這種眾所周知的技術(shù)(例如,Nucleic Acid Research,Vol.10,No.20,p 6487-6500,1982)實(shí)施,本說明書中所謂“1個(gè)或多個(gè)氨基酸”系指可借助于部位特異性變異誘發(fā)法加成、缺失或置換的氨基酸數(shù)目。
部位特異性變異的誘發(fā),可諸如利用除所希望變異的特定不一致外與應(yīng)受到變異的單鏈?zhǔn)删wDNA互補(bǔ)的合成寡核苷酸引子按如下進(jìn)行。即,用上述合成寡核苷酸作為引子在噬菌體中合成互補(bǔ)鏈,再用所得到的雙鏈DNA使可載帶噬菌體的宿主細(xì)菌轉(zhuǎn)型。把轉(zhuǎn)型細(xì)菌的培養(yǎng)物涂在瓊脂上,從含有噬菌體的單細(xì)胞形成噬菌斑。如果這樣進(jìn)行,在理論上,50%的新菌落含有作為單鏈、有變異的噬菌體,其余50%則含有原來的序列。然后,使所得到的噬菌斑在一個(gè)能和與具有上述所希望變異的DNA完全一致的DNA雜化但不和與原有鏈不一致的DNA雜化的溫度,與激酶處理的合成探子發(fā)生雜化。然后收集、培養(yǎng)與該探子雜化的噬菌斑,回收DNA。
此外,作為在酶的氨基酸序列中置換、缺失或插入1個(gè)或多個(gè)氨基酸又不使之喪失酶活性的方法,除上述部位特異性變異誘發(fā)法外,還有用變異原處理基因的方法,以及使基因發(fā)生選擇性斷裂、然后脫除、加成或置換所選擇的核苷酸再將其連接起來的方法。
通過用棕黃花菊的PPDK基因或含有其賦予耐低溫性序列并具有PPDK活性的DNA使植物轉(zhuǎn)型,可以獲得耐低溫性的植物。此時(shí),作為轉(zhuǎn)型植物的較好實(shí)例,可以列舉玉米、甘蔗、稷(粟)、稗子和高梁等,但不限于這些。
植物的轉(zhuǎn)型方法是已經(jīng)成熟的,較好采用基于腫脹土壤桿菌(Agrobacterium tumefaciens)的方法。利用腫脹土壤桿菌的植物轉(zhuǎn)型方法在本領(lǐng)域中是眾所周知的,用這種方法,無論雙子葉植物(例如特開平4-330234號(hào)公報(bào))還是單子葉植物(W0 94/00977)都能轉(zhuǎn)型。或者,還可以用常用方法如electroporation法等導(dǎo)入植物的原生質(zhì)中,以及使DNA附著在鎢粒子等上、打入植物的胚中等辦法,也可以進(jìn)行轉(zhuǎn)型。這些轉(zhuǎn)型的具體方法在以下實(shí)施例中敘述。
實(shí)施例以下參照實(shí)施更具體地說明本發(fā)明。當(dāng)然,本發(fā)明不限于下述實(shí)施例。
1.棕黃花菊PPDK基因的無性系化和堿基序列的確定(1)cDNA庫的制作和全長cDNA的無性系化(i)cDNA庫的制作從棕黃花菊(F.brownii)的綠葉(60g),用鹽酸胍/苯酚法分離全RNA。用這種方法可以在鋰沉淀后得到26.5mg RNA。然后用填充了oligo dT Cellulose Type 7(Pharmacia公司)的柱子,按常用方法從13.2mg RNA得到118.9μg poly A(+)RNA。在cDNA庫的制備中,使用了TimeSaver cDNA Synthesis kit(Pharmacia公司)、Lambda ZAPII載體(Stratagene公司)和cDNA無性系化系統(tǒng)λgt10(Amersham公司)附帶的填料試劑。用EcoRI/NotI銜接物把DNA片段插入Lambda ZAPII載體的EcoRI部位,從而制作了cDNA庫。所制作的cDNA庫的尺寸是41.5萬pfu。還使用了XL1-Blue作為宿主細(xì)胞。
(ii)探子的制備利用相當(dāng)于加工部位附近的引子5′GACGGCTAAAAAGAGGGT(根據(jù)雙齒黃花菊PPDK的cDNA和玉米PPDK的cDNA同系性高的部分設(shè)計(jì)的)和引子RTATCGAGAAACCTTCTATAC(雙齒黃花菊PPDK序列的一部分,互補(bǔ)鏈)進(jìn)行逆轉(zhuǎn)錄PCR使棕黃花菊RNA擴(kuò)大,用具有擴(kuò)大片段的pCRII載體(可購自Invitrogen公司)作為模板,用同樣的引子進(jìn)行PGR使該片段擴(kuò)大、電泳后,用SUPREC-01(寶酒造)從凝膠中回收DNA。用這種工藝,可以得到成熟蛋白質(zhì)N末端下游24bp開始的428bp(bp=堿基對(duì))的DNA片段。用Multiprime DNA標(biāo)記系統(tǒng)(Amersham公司)對(duì)這個(gè)片段進(jìn)行32P標(biāo)記來制備探子。
(iii)全長棕黃花菊cDNA的無性系化以上述DNA片段作為探子,用噬菌斑雜化法篩選cDNA庫。用Hybond N+(Amersham公司)作為雜化過濾器,雜化條件是在6×SSC、5×Denhalt′s溶液、0.1%SDS、100μg/ml變性鮭魚精巢DNA中于65℃過夜。洗滌條件是用2×SSC、0.1%SDS在室溫進(jìn)行5分鐘,用2×SSC、0.1%SDS在室溫進(jìn)行90分鐘,進(jìn)一步用1×SSC、0.1%SDS在68℃進(jìn)行90分鐘。其結(jié)果,得到了28個(gè)獨(dú)立的陽性噬菌斑。從其中選擇信號(hào)強(qiáng)的11個(gè)噬菌斑進(jìn)行第二次篩選。第二次篩選除第二次洗滌時(shí)間為60分鐘外按照與上述第一次篩選同樣的方法進(jìn)行。其結(jié)果,從6個(gè)無性系得到了由單一噬菌體產(chǎn)生的獨(dú)立陽性噬菌斑。為了核對(duì)所插入DNA片段部分的尺寸,以上述R引子和M13PrimerM4(GTTTTCCCAGTCACGAC,寶酒造)以及M13PrimerRV(CAGGAAACAGCTATGAC,寶酒造)作為引子,用噬菌體作為模板進(jìn)行PCR。結(jié)果,有2個(gè)無性系是全長的。然后,進(jìn)行活體切割,在質(zhì)粒載體pBruescript II SK(-)(Stratagene公司)中使插入DNA片段部分亞無性系化。亞無性系化的重組質(zhì)粒命名為p 411和p 631。
通過上述PCR發(fā)現(xiàn),如上所述制作的庫是含有足夠長插入物、適合于cDNA篩選的庫。因此,為了分離棕黃花菊的mRNA,有利的是采用如上所述的方法,而且一旦進(jìn)行如上所述的大量RNA處理,就能得到大量mRNA。
此外,由于上述cDNA庫大量含有如上所述的足夠長插入物,因而通過使用如上所述標(biāo)的蛋白質(zhì)加工部位附近的引子來制備探子,可以容易地進(jìn)行全長cDNA的篩選。
(2)cDNA全堿基序列的確定和預(yù)想氨基酸序列的比較為了確定p631的插入cDNA片段的全堿基序列,制作了缺失突變體(Deletion mutants)。缺失突變體的制作是用Kilo-Sequence專用Deletion Kit(寶酒造公司)進(jìn)行的。然而,核酸外切酶III的反應(yīng)是通過轉(zhuǎn)移到事先保溫在65℃的綠豆核酸酶緩沖劑中而使之停止的。堿基序列的確定是采用以Qiagen Plasmid Mini Kit(Diagen公司)精制的質(zhì)粒、用Taq DyeDeoxy Terminator Cycle Sequencing Kit(ABI公司)和Applied Biosystems 373A DNA Sequencer(ABI公司)進(jìn)行的。兩條鏈除一部分外都確定了其堿基序列。根據(jù)所確定的堿基序列,也確定了氨基酸序列。所確定的堿基序列和氨基酸序列表示在序列表序列號(hào)5中。
應(yīng)當(dāng)注意,在制備用于確定所分離cDNA的堿基序列的缺失無性系時(shí),重要的是要把綠豆核酸酶緩沖液事先加熱到65℃,因?yàn)橹皇前逊磻?yīng)液轉(zhuǎn)移到綠豆核酸緩沖液中是不能使核酸外切酶III引起的缺失反應(yīng)停止的。此外,由于無法通過只從上游側(cè)缺失所插入的基因來確定從與載體的聯(lián)結(jié)點(diǎn)算起可多達(dá)約600~900bp部分的堿基序列,因而有必要從兩個(gè)方向缺失。
另一方面,從棕黃花菊直接精制了PPDK,并確定了其N末端區(qū)域、C末端區(qū)域和內(nèi)部區(qū)域的氨基酸序列。PPDK的精制進(jìn)行如下。用3倍量的萃取緩沖劑研磨棕黃花菊的綠葉→離心后上清液中添加硫酸銨使之達(dá)到30%飽和并除去沉淀的蛋白質(zhì)→進(jìn)一步添加硫酸銨使之達(dá)到70%飽和、回收蛋白、用Sephadex G25(Pharmacia公司制)脫鹽→通過DEASE-Sepharose柱(Pharmacia公司制)→用50-400mM的KCl濃度梯度淋洗柱中吸附的蛋白質(zhì)→合并有活性的級(jí)分、用70%飽和硫酸銨濃縮、用Sephadex G25脫鹽→注入羥磷灰石柱中→用磷酸濃度梯度為10mM~40mM的磷酸緩沖劑淋洗柱上吸附的蛋白質(zhì)→合并有活性的級(jí)分、用70%飽和硫酸銨濃縮、用Sephadex G25脫鹽。此后進(jìn)行SDS-PAGE電泳、切取PPDK帶,用電溶出法回收凝膠中的蛋白質(zhì)。用這種工藝精制,得到PPDK樣品約5~10nmol。這樣得到的精制PPDK在SDS-PAGE上顯示單一條帶。
然后,確定了所得到的精制PPDK的N末端序列、C末端序列和內(nèi)部序列。即,N末端的氨基酸序列是通過把蛋白質(zhì)轉(zhuǎn)錄在PVDF膜上、用氣相氨基酸定序器確定的。C末端序列是用羧肽酶Y消化精制的PPDK、再根據(jù)游離出來的氨基酸組成與消化時(shí)間的關(guān)系推斷。內(nèi)部的氨基酸序列是通過從用蛋白酶消化蛋白質(zhì)時(shí)產(chǎn)生的肽的N末端判明氨基酸序列來確定的。詳細(xì)方法如下。首先,按照確定N末端氨基酸序列時(shí)的方法把從棕黃花菊的綠葉得到的PPDK精制到一定程度,進(jìn)行通常的SDS-PAGE電泳之后,凝膠用Coomassie Brilliant BlueR250染色,切取PPDK條帶。所切取的凝膠在平衡化緩沖劑(Tris-HCl pH 6.8 125mM、EDTA 1mM、0.1%SDS)中平衡化并插入井中,進(jìn)行第二次SDS-PAGE電泳。此時(shí),將平衡化的凝膠與重層液(Tris-HCl pH 6.8 125mM、EDTA 1mM、0.1%SDS、0.01%BPB、20%甘油)和酶溶液(Tris-HCl pH 6.8 125mM、EDTA 1mM、0.1%SDS、0.01%BPB、10%甘油、賴氨酰端肽酶1~5μg或V8蛋白酶0.01~0.1μg)一起添加稍候電泳后,在濃縮凝膠中進(jìn)行蛋白質(zhì)消化(切斷電源、放置45分鐘)。此后再開電泳,按照確定N末端氨基酸序列時(shí)的方法轉(zhuǎn)錄到PVDF膜上,用氣相氨基酸定序器確定消化片段從N末端起的氨基酸序列。
如上所述確定的N末端序列、C末端序列和內(nèi)部序列如下所示。N末端序列Asn Pro Val Ser Pro Pro Val(72~78)C末端序列Leu-Ala Ala*-Val Val(948~955)內(nèi)部序列(1)Lys Leu Tyr Gly Glu Phe Leu Val Asn Ala Gln Gly-Asp ValVal Ala(349~365)內(nèi)部序列(2)Gln Leu Leu Ala Pro Pro Ala Met Ser Asn Ala Leu-Thr(592~605)內(nèi)部序列(3)Leu Thr Ala Asp Thr Gly Met Ser Lys Asp Glu Ile Tyr Ser ArgIle Glu(721~738)內(nèi)部序列(4)Ala - - - Ser Phe Gly Thr Asn Asp Leu Cys Gln Met ValPhe Gly-Ser(844~862)此外,在上述氨基酸序列中,“*”系指谷氨酰胺但不能用所用分析儀器分析,而“-”系指分析結(jié)果不清楚。括號(hào)內(nèi)的號(hào)碼系指序列號(hào)5所示氨基酸序列對(duì)應(yīng)部分的氨基酸號(hào)碼。內(nèi)部序列(2)和(4)中有一部分與序列號(hào)5對(duì)應(yīng)部分的序列不同,但這可以認(rèn)為是由于氨基酸定序器的誤差所致。眾所周知,氨基酸定序器的誤差以相當(dāng)高的頻率發(fā)生,而DNA定序器的誤差則幾乎不發(fā)生。
序列號(hào)5所示氨基酸序列與從上述精制PPDK直接確定的部分氨基酸序列有很好的一致性,因而可以確認(rèn)序列號(hào)所示氨基酸序列就是PPDK的氨基酸序列。此外,序列號(hào)5所示氨基酸序列與眾所周知的雙齒黃花菊PPDK和玉米PPDK的氨基酸序列比較時(shí),發(fā)現(xiàn)成熟蛋白質(zhì)部分不同的氨基酸分別為40個(gè)(雙齒黃花菊)和大約180個(gè)(玉米)。從上述結(jié)果還可以了解到,在序列號(hào)5所示氨基酸序列中第1號(hào)至第71號(hào)的氨基酸序列在成熟蛋白質(zhì)中不存在,而是一種通過膜時(shí)必要的轉(zhuǎn)送肽,是在通過膜后加工而成的。棕黃花菊和雙齒黃花菊的成熟蛋白質(zhì)中氨基酸殘基的差異如以下表1所示。
表1
<
2.棕黃花菊PPDK在大腸菌中的生產(chǎn)及其耐低溫性的測(cè)定為了確認(rèn)從如上所述分離的棕黃花菊PPDK cDNA確實(shí)產(chǎn)生了耐低溫性酶,在大腸菌中的表達(dá)進(jìn)行如下。
為了除去轉(zhuǎn)送肽并使表達(dá)載體與解讀密碼結(jié)合在一起,限制性內(nèi)切酶部位的導(dǎo)入進(jìn)行如下。以p631用SacI切斷再環(huán)化得到的p631Sac(缺失了SacI下游區(qū)域的p631質(zhì)粒)作為模板,用以加工部位附近的序列為基礎(chǔ)、含EcoRV的引子4GATATCAATCCGGTGTCTCCTCC與載體序列的互補(bǔ)引子M13RV(寶酒造)的組合進(jìn)行PCR,并使擴(kuò)大的片段在pCRII中進(jìn)行亞無性系化。用限制性內(nèi)切酶EcoRV和SacI,把含N末端部分的片段從pCRII上切下來,再與p631的SacI-HindIII(含有PPDK CDNA的殘余部分),和用NcoI切斷、用Klenow酶使末端平滑化后用HindIII切斷的pKK233-2一起進(jìn)行三個(gè)片段的連接反應(yīng)(圖1)。用這種質(zhì)粒使E.coli MV1184轉(zhuǎn)型并用于表達(dá)實(shí)驗(yàn)。1ml前培養(yǎng)液用9ml新LB培養(yǎng)基(含50mg/l氨芐青霉素)稀釋,在37℃振蕩培養(yǎng)3小時(shí)后添加IPTG使之達(dá)到5mM,進(jìn)一步培養(yǎng)3小時(shí)后用離心法回收菌體。將菌體懸浮在0.5ml萃取緩沖劑(50mMHepes-KOH pH 7.5,10mM MgSO4,1mM EDTA,5mM DTT)中,添加溶菌酶使之達(dá)到約0.5mg/ml,在冰上處理5分鐘后,用超聲波破碎裝置(COSMOBIO UCD-130T型)邊用冰冷卻邊按30秒鐘間隔處理5分鐘,提取酶。用微量離心機(jī)離心10分鐘,上清液通過用柱緩沖劑(50mM Hepes-KOH pH 7.0,10mM MgCl2,2mM EDTA,10mMDTT)平衡化的Sephadex G25柱除去低分子物質(zhì)后,在25℃放置30分鐘,進(jìn)行4聚體締合,用于活性測(cè)定。
在大腸菌內(nèi)從棕黃花菊、雙齒黃花菊和玉米(Harvest Queen)的PPDK cDNA生產(chǎn)的PPDK在SDS-PAGE上顯示出與源于植物的酶幾乎相同的淌度。從各種cDNA預(yù)期的成熟酶的分子量都大致相同,但在SDS-PAGE上的表觀分子量則有頗大差異。這顯然是由于各多肽中所含的氨基酸組成不同,而不是由于蛋白質(zhì)的缺失加工或糖鏈加成等的翻譯后修飾。用大腸菌生產(chǎn)的各種PPDK的耐低溫性與對(duì)應(yīng)的植物酶是一致的。即,棕黃花菊PPDK的耐低溫性無需用該植物特有的輔助因子或翻譯后的加工就能得到,如果把這種cDNA導(dǎo)入玉米中予以表達(dá),就可望產(chǎn)生耐低溫性PPDK。圖2顯示酶在0℃的溫度放置后所經(jīng)歷的時(shí)間與PPDK的相對(duì)活性之間的關(guān)系。
此外,在上述工藝中,為了用大腸菌生產(chǎn)有活性的PPDK,制作脫除了轉(zhuǎn)送肽編碼區(qū)的cDNA并將其插入表達(dá)載體中,但此時(shí)重要的是準(zhǔn)確地使要切取的位置匹配于與源于植物的酶的N末端位置對(duì)應(yīng)的部位。(棕黃花菊) 在大腸菌中的產(chǎn)量 (所使用的引子)MITAKKRVFTF…- 2MIPVSPPVTTTKKRVFTF…+ 3MINPVSPPVTTTKKRVFTF…++ 4NPVSPPVTTTKKRVFTF…(源于葉的酶)(雙齒黃花菊)MITAKKRVFTF… ++MIPVSPPVTTAKKRVFTF… --TAKKRVFTF…(源于葉的酶)(玉米)MATKKRVFTF… ++TTKKRVFTF…(源于葉的酶)即,在進(jìn)行棕黃花菊cDNA的表達(dá)實(shí)驗(yàn)時(shí),既成功地表達(dá)了玉米和雙齒黃花菊,也能參照玉米的切斷部位進(jìn)行表達(dá)。因此,即使在棕黃花菊cDNA中,也使用引子2在相同位置切斷來制作表達(dá)載體并試圖予以表達(dá),但PPDK根本沒有產(chǎn)生。然后,基于源于葉的酶的N末端序列,用引子3制作了在N末端多含7個(gè)殘基的表達(dá)載體,在試圖予以表達(dá)時(shí)確認(rèn)產(chǎn)生了PPDK。但是,即使在這個(gè)階段表達(dá)量也很少,還不能得到足以測(cè)定耐低溫性的酶量。然后,進(jìn)一步用引子4制作了在N末端側(cè)延長1個(gè)殘基的表達(dá)載體,在進(jìn)行表達(dá)實(shí)驗(yàn)時(shí)能產(chǎn)生大量PPDK,因而能確認(rèn)其耐低溫性。引子2和引子3的堿基序列如下所示引子-2CGGTGTCTCCTCCGGATATCACGGCTAAAAAGAG引子-3TTGATATCCCGGTTGTCTCCTCCGGTA3.棕黃花菊PPDK基因中賦予耐低溫性區(qū)域的確定(1)棕黃花菊和雙齒黃花菊的嵌合體按常法用限制性內(nèi)切酶重組。使pKK-brownii的EcoRI-HindIII片段與pKK-bidentis(采用與pKK-brownii的構(gòu)建方法相同的方法使雙齒黃花菊的cDNA插入pKK-223-2中而得到的質(zhì)粒)的對(duì)應(yīng)片段交換來制作pKK-011,反之,使pKK-bidentis的EcoRI-HindIII片段與pKK-brownii的對(duì)應(yīng)片段交換來制作pKK-100。同樣,使NdeI-HindIII片段相互交換制作了pKK-001和pKK-110。此外,使pKK-110的Xho-HindIII片段與pKK-bidentis的對(duì)應(yīng)片段交換制作了pKK-1101,而使pKK-bidentis的XhoI-HindIII片段與pKK-brownii的對(duì)應(yīng)片段交換制作了pKK-1110。為了使XhoI-HindIII片段進(jìn)一步精細(xì)地相互重組,用PCR法(linking PCR法)進(jìn)行這些片段的聯(lián)接。在bidentis(雙齒黃花菊)和brownii(棕黃花菊)的XhoI-HindIII片段中堿基序列相同的情況下,制作了互補(bǔ)的引子link-FGCAGAGATGATGTTGGCAAG和link-RCTTGCCAACATCATCTCTGC。以用pBluescript SK(-)亞無性系化的brownii或bidentis的XhoI-HindIII片段作為模板,用link-F/RV、M4/link-R的組合進(jìn)行第一次PCR。所得到的片段(共4種)用凝膠切出法精制,用brownii前半部和bidentis后半部或bidentis前半部和brownii后半部的片段混合物作為模板,用引子M4/RV進(jìn)行第二次PCR。擴(kuò)大的結(jié)合片段用XhoI和HindIII切斷,與pKK-bidentis的對(duì)應(yīng)部分交換,制作了pKK-link01和pKK-link10。利用linking PCR的重組部位與HindIII之間的PstI部位,制作了另一組嵌合體基因。把pKK-link10的XhoI-PstI片段和pKK-bidentis的PstI-HindIII片段插入pKK-bidentis的XhoI-HindIII部位(3片段連接反應(yīng)),制作了pKK-link101。pKK-bidentis的XhoI-PstI片段和pKK-brownii的PstI-HindIII片段也按同樣方法插入pKK-bidentis的XhoI-HindIII部位,制作了pKK-link110。
棕黃花菊和雙齒黃花菊的PPDK在成熟蛋白質(zhì)部分出現(xiàn)的40個(gè)部位的氨基酸置換較多地靠近酶的N末端和C末端區(qū)域,而在中部活性中心附近較少。因此,首先利用兩種基因中共同存在的限制性內(nèi)切酶EcoRI和NdeI部位把cDNA分成前、中、后三個(gè)部分,使這些片段相互交換來制作嵌合體基因,考察了到底哪一部分與耐低溫性有關(guān)。其結(jié)果是,在含有棕黃花菊cDNA后1/3的情況下獲得了耐低溫性,反之,在含有雙齒黃花菊cDNA后1/3的情況下具有低溫敏感性。然后,用限制性內(nèi)切酶XhoI把后1/3區(qū)域分成兩個(gè)部分,分別導(dǎo)入pKK-bidentis的對(duì)應(yīng)部分中,測(cè)定耐低溫性。其結(jié)果是,獲得耐低溫性的必要且充分條件是含有XhoI部位的下游區(qū)域(距C最末端1/6的區(qū)域)。然后,用linking PCR法制作含有后1/6區(qū)域(XhoI-HindIII片段,含有7個(gè)氨基酸置換)的嵌合體基因,導(dǎo)入pKK-bidentis中,測(cè)定其耐低溫性。其結(jié)果是,具有含4個(gè)置換的最后區(qū)域的嵌合體酶pKK-link10有耐低溫性,而具有含3個(gè)置換的前半?yún)^(qū)域的嵌合體酶pKK-link01則在低溫失活。因此,用限制性內(nèi)切酶PstI使這個(gè)后半?yún)^(qū)域重組,制作了各有2個(gè)氨基酸置換的嵌合體基因,測(cè)定耐低溫性,但其中任何一個(gè)嵌合體酶都顯示耐低溫性,因而推測(cè)存在2個(gè)以上與耐低溫性有關(guān)的區(qū)域。
(2)玉米和棕黃花菊的嵌合體用引子PPDK-FCTCACTGTTCGAAGAGAAGC和含有NdeI部位的mNdeICATATGCTCTGTCCGGCATAATC(互補(bǔ)鏈上),以玉米PPDK cDNA為模板進(jìn)行PCR,所得到的片段在pCRII中進(jìn)行亞無性系化。用SacI和NdeI把這個(gè)片段從pCRII上切下來,pKK-PPDK的ScaI-SmaI片段(載體片段)和棕黃花菊PPDK cDNA用HindIII切斷,用Klenow酶使末端平滑化后用NdeI切斷得到的片段,將其一起進(jìn)行了3個(gè)片段連接反應(yīng)(圖3),得到了pKK-mz/bro(Nde)。此外,用引子PPDK-F和含XhoI部位的mXhoICTCGAGGGATCTCAATCATTG(互補(bǔ)鏈上)以玉米PPDK cDNA為模板進(jìn)行PCR,所得到的片段在pCRII中亞無性系化后用SacI和XhoI從pCRII上切下來,與pKK-mz/bro(Nde)的ScaI-XhoI片段(載體片段)結(jié)合,得到pKK-mz/bro(Xho)。
玉米PPDK和棕黃花菊PPDK C末端1/3區(qū)域(NdeI-HindIII片段)或1/6區(qū)域(XhoI-HindIII片段)的嵌合體酶均顯示與棕黃花菊相同水平的強(qiáng)耐低溫性。這樣,便可以使氨基酸序列頗為不同的玉米PPDK具有耐低溫性,因而可以認(rèn)為,通過導(dǎo)入這個(gè)最后1/3區(qū)域或1/6區(qū)域就能使源于各種植物的PPDK具有耐低溫性。由于由此制作的玉米/棕黃花菊嵌合體PPDK可以對(duì)玉米PPDK的轉(zhuǎn)送肽以其原來形式加以利用,因而若其轉(zhuǎn)送部分也源于棕黃花菊PPDK的轉(zhuǎn)型體在耐低溫性PPDK向葉綠體輸送上有問題,則可考慮用導(dǎo)入這種嵌合體基因來取而代之的辦法加以解決。
(3)點(diǎn)變異無性系對(duì)于pKK-brownii的XhoI-HindIII片段,制作了棕黃花菊→雙齒黃花菊型的氨基酸殘基逐一置換。而對(duì)于pKK-bidentis的XhoI-HindIII片段,也制作了雙齒黃花菊型→棕黃花菊型的氨基酸殘基逐一置換。變異導(dǎo)入是通過使棕黃花菊和雙齒黃花菊PPDK cDNA的XhoI-HindIII片段分別在pBluescript II SK(-)中亞無性系化,再用Megalabel Kit(寶酒造)和Mutan-K Kit(寶酒造)按照Kunkel法進(jìn)行的。用于變異導(dǎo)入的引子序列如表2中所示。變異的堿基序列用DNA定序器確認(rèn)后,把這些片段插入pKK-bidentis的XhoI-HindIII部位中。
表2 用于點(diǎn)變異無性系制作的引子
使pKK-1110的XhoI-HindIII區(qū)域中不同的氨基酸逐一置換成雙齒黃花菊型的酶全都顯示耐低溫性,因而可以認(rèn)為存在著多個(gè)賦予耐低溫性的變異(只改變一個(gè)殘基無損于抗性)。然后,與此相反,使pKK-bidentis的XhoI-HindIII區(qū)域中不同的氨基酸逐一置換成棕黃花菊型,考察其是否變成耐低溫性酶。即,在0℃處理20分鐘后,測(cè)定酶活性。其結(jié)果是,896Gln→Pro變異獲得耐低溫性(上述低溫處理后的活性是原來的60~70%),而885Ile→Leu和952Ile→Val變異使得低溫失活稍難以發(fā)生,如果綜合考慮上述(1)嵌合體酶pKK-link110的結(jié)果,則可以推測(cè)這兩種變異共存時(shí)仍能獲得耐低溫性。從以上結(jié)果可以斷言869Pro、885Leu、925Val這三個(gè)殘基與耐低溫性有關(guān)。然而,在棕黃花菊與耐低溫性有關(guān)的這些殘基中,就869Pro和885Leu而言,玉米PPDK也具有棕黃花菊型。因此,僅僅這些殘基是棕黃花菊型的不一定就能獲得耐低溫性,但可以認(rèn)為在棕黃花菊或雙齒黃花菊的氨基酸序列中它們最初就賦予了完全的抗性,因而,在使氨基酸序列差異頗大的其它物種PPDK耐低溫性化的情況下不宜導(dǎo)入點(diǎn)變異,較好是像對(duì)玉米PPDK進(jìn)行的那樣,制作以區(qū)域單位導(dǎo)入的嵌合體基因。
4.用棕黃花菊PPDK基因進(jìn)行的玉米轉(zhuǎn)型按照Gordon-Kamm W.J.等人(The Plant Cell 2603-618,1990)或Koziel M.G.等人(Bio/Technology 11194-200,1993)的方法,把pKK-brownii包覆在鎢或金的微細(xì)粒子上,將其植入玉米的未成熟胚或懸浮培養(yǎng)細(xì)胞中。從導(dǎo)入處理的細(xì)胞篩選轉(zhuǎn)型細(xì)胞,然后,將所得到的轉(zhuǎn)型體愈傷組織(callus)按常法培養(yǎng),再生植物體。轉(zhuǎn)型方法不限于粒子槍法,還包括Electro-poration法(Rhodes C.A.et al.,Science 240204-207,1988)、PEG法(Armstrong C.L.et al.,Plant Cell Reports 9335-339,1990)、Tissue-electroporation法(D′Halluin K.et al.,ThePlant Cell 41495-1505,1992)或土壤桿菌法(Hiei Y.andKomari T.,WO 9400977)等。從所得到的植物體回收種子并使之發(fā)芽,再從所得到的植物的葉分離PPDK、測(cè)定其耐低溫性。測(cè)定溫度對(duì)轉(zhuǎn)型植物和未轉(zhuǎn)型植物光合成速度的影響。通過使那些在低溫顯示較高光合成速度的玉米植株繁育多代、測(cè)定不同溫度的光合成速度和測(cè)定從植物體分離的PPDK的耐低溫性,確保了所研究的轉(zhuǎn)型的穩(wěn)定性。
5.用棕黃花菊PPDK基因進(jìn)行的雙齒黃花菊轉(zhuǎn)型把含有序列號(hào)5所示全長cDNA并含有信息基因的中間載體導(dǎo)入腫脹土壤桿菌(Agrobacterium tumefaciens)的無害化Ti質(zhì)粒中。這可以按照Draper J et al.eds.,Plant Genetic Transfomationand Gene Expression-a laboratory manual,BlackwellScientific Publications(ISBN 0-632-02172-1)中所述方法進(jìn)行。
另一方面,使雙齒黃花菊(F.bidentis)的葉組織或愈傷組織(callus)感染上述腫脹土壤桿菌(A.tumefaciens)。這可以通過使該組織或愈傷組織與腫脹土壤桿菌共存培養(yǎng)來進(jìn)行。感染細(xì)胞根據(jù)抗藥性進(jìn)行選擇。從所選擇的愈傷組織按常法再生植物體。從所得到植物體得到種子、使之發(fā)芽,從所得到的植物的葉分離PPDK并測(cè)定其耐低溫性。對(duì)于轉(zhuǎn)型植物和未轉(zhuǎn)型植物,考察溫度對(duì)光合成速度的影響。通過使那些在低溫顯示較高光合成速度的雙齒黃花菊植株繁育多代、測(cè)定不同溫度的光合成速度和測(cè)定從植物體分離的PPDK的耐低溫性,確保所研究的轉(zhuǎn)型的穩(wěn)定性。
序列表序列號(hào)1序列長2915序列型核酸序列CGATCTCCTT CTGCTATTGC TGATATCTCA ATTTCACAGG TGAAGAAGG ATG ATG AGT 58Met Met Ser1TCG TTG TCT GTT GAA GGT ATG CTT CTC AAG TCA GCC CGT GAG TCG TGC106Ser Leu Ser Val Glu Gly Met Leu Leu Lys Ser Ala Arg Glu Ser Cys5 10 15TTA CCG GCG AGA GTG AAG CAA CGG CGA AAC GGT GAT CTC CGG CGA TTG154Leu Pro Ala Arg Val Lys Gln Arg Arg Asn Gly Asp Leu Arg Arg Leu20 25 30 35AAC CAC CAC CGT CAA TCG TCG TTT GTC CGG TGT TTA ACT CCG GCG AGA202Asn His His Arg Gln Ser Ser Phe Val Arg Cys Leu Thr Pro Ala Arg40 45 50GTT AGC AGA CCA GAG TTG CGC AGC AGT GGC TTA ACT CCG CCG CGA GCA250Val Ser Arg Pro Glu Leu Arg Ser Ser Gly Leu Thr Pro Pro Arg Ala55 60 65GTT CTT AAT CCG GTG TCT CCT CCG GTG ACG ACG GCT AAA AAG AGG GTT298Val Leu Asn Pro Val Ser Pro Pro Val Thr Thr Ala Lys Lys Arg Val70 75 80TTC ACT TTT GGT AAA GGA AGA AGT GAA GGC AAC AGG GAC ATG AAA TCC346Phe Thr Phe Gly Lys Gly Arg Ser Glu Gly Asn Arg Asp Met Lys Ser85 90 95TTG TTG GGA GGA AAA GGA GCA AAT CTT GCT GAG ATG TCA AGC ATT GGT394Leu Leu Gly Gly Lys Gly Ala Asn Leu Ala Glu Met Ser Ser Ile Gly100 105 110 115CTA TCA GTT CCT CCT GGG CTC ACT ATT TCA ACT GAA GCA TGT GAG GAA442Leu Ser Val Pro Pro Gly Leu Thr Ile Ser Thr Glu Ala Cys Glu Glu120 125 130TAT CAA CAA AAT GGA AAG AGC CTA CCT CCA GGT TTG TGG GAT GAG ATT490Tyr Gln Gln Asn Gly Lys Ser Leu Pro Pro Gly Leu Trp Asp Glu Ile135 140 145TCA GAA GGC TTA GAT TAT GTC CAG AAA GAG ATG TCT GCA TCT CTC GGT538Ser Glu Gly Leu Asp Tyr Val Gln Lys Glu Met Ser Ala Ser Leu Gly150 155 160GAC CCG TCT AAA CCT CTC CTC CTT TCC GTC CGT TCG GGT GCT GCC ATA586Asp Pro Ser Lys Pro Leu Leu Leu Ser Val Arg Ser Gly Ala Ala Ile165 170 175TCT ATG CCT GGT ATG ATG GAC ACT GTA TTG AAT CTC GGG CTT AAT GAT634Ser Met Pro Gly Met Met Asp Thr Val Leu Asn Leu Gly Leu Asn Asp180 185 190 195GAG GTC GTA GCT GGT CTA GCT GGC AAA AGT GGA GCA CGG TTT GCC TAT682Glu Val Val Ala Gly Leu Ala Gly Lys Ser Gly Ala Arg Phe Ala Tyr200 205 210GAC TCG TAT AGA AGG TTT CTC GAT ATG TTT GGC AAC GTT GTA ATG GGT730Asp Ser Tyr Arg Arg Phe Leu Asp Met Phe Gly Asn Val Val Met Gly215 220 225ATC CCG CAT TCA TTA TTT GAC GAA AAG TTA GAG CAG ATG AAA GCT GAA778Ile Pro His Ser Leu Phe Asp Glu Lys Leu Glu Gln Met Lys Ala Glu230 235 240AAA GGG ATT CAT CTC GAC ACC GAT CTC ACT GCT GCT GAT CTT AAA GAT826Lys Gly Ile His Leu Asp Thr Asp Leu Thr Ala Ala Asp Leu Lys Asp245 250 255CTT GTT GAG AAA TAC AAG AAC GTG TAT GTG GAA GCA AAG GGC GAA AAG874Leu Val Glu Lys Tyr Lys Asn Val Tyr Val Glu Ala Lys Gly Glu Lys260 265 270 275TTT CCC ACA GAT CCA AAG AAA CAG CTA GAG TTA GCA GTG AAT GCT GTT922Phe Pro Thr Asp Pro Lys Lys Gln Leu Glu Leu Ala Val Asn Ala Val280 285 290TTT GAT TCT TGG GAC AGC CCA AGG GCC AAT AAG TAC AGA AGT ATT AAC970Phe Asp Ser Trp Asp Ser Pro Arg Ala Asn Lys Tyr Arg Ser Ile Asn295 300 305CAG ATA ACT GGA TTA AAG GGG ACT GCA GTT AAC ATT CAA AGC ATG GTG 1018Gln Ile Thr Gly Leu Lys Gly Thr Ala Val Asn Ile Gln Ser Met Val310 315 320TTT GGC AAC ATG GGA AAC ACT TCA GGA ACT GGT GTT CTT TTC ACT AGG 1066Phe Gly Asn Met Gly Asn Thr Ser Gly Thr Gly Val Leu Phe Thr Arg325 330 335AAC CCA AGC ACC GGT GAG AAG AAG CTA TAC GGG GAG TTT TTA ATC AAT 1114Asn Pro Ser Thr Gly Glu Lys Lys Leu Tyr Gly Glu Phe Leu Ile Asn340 345 350 355GCT CAG GGA GAG GAT GTT GTT GCT GGG ATC AGA ACA CCA GAA GAT TTG 1162Ala Gln Gly Glu Asp Val Val Ala Gly Ile Arg Thr Pro Glu Asp Leu360 365 370GGG ACC ATG GAG ACT TGC ATG CCT GAT GCA TAC AAA GAG CTT GTG GAG 1210Gly Thr Met Glu Thr Cys Met Pro Asp Ala Tyr Lys Glu Leu Val Glu375 380 385AAC TGC GAG ATC TTA GAG GGA CAC TAC AAA GAT ATG ATG GAT ATT GAA 1258Asn Cys Glu Ile Leu Glu Gly His Tyr Lys Asp Met Met Asp Ile Glu390 395 400TTC ACA GTT CAA GAA AAC AGG CTT TGG ATG TTG CAA TGC CGA ACA GGG 1306Phe Thr Val Gln Glu Asn Arg Leu Trp Met Leu Gln Cys Arg Thr Gly405 410 415AAA CGT ACT GGT AAA GGT GCA GTG AGA ATT GCA GTA GAT ATG GTG AAC 1354Lys Arg Thr Gly Lys Gly Ala Val Arg Ile Ala Val Asp Met Val Asn420 425 430 435GAA GGG CTA ATT GAT ACT AGA ACA GCA ATT AAG AGG GTT GAG ACT CAA 1402Glu Gly Leu Ile Asp Thr Arg Thr Ala Ile Lys Arg Val Glu Thr Gln440 445 450CAT CTA GAT CAG CTT CTT CAT CCA CAG TTT GAG GAT CCG TCT GCT TAC 1450His Leu Asp Gln Leu Leu His Pro Gln Phe Glu Asp Pro Ser Ala Tyr455 460 465AAA AGC CAT GTG GTA GCA ACC GGT TTG CCA GCA TCC CCC GGG GCA GCT 1498Lys Ser His Val Val Ala Thr Gly Leu Pro Ala Ser Pro Gly Ala Ala470 475 480GTG GGA CAG GTT TGT TTT AGT GCA GAG GAT GCA GAA ACA TGG CAT GCA 1546Val Gly Gln Val Cys Phe Ser Ala Glu Asp Ala Glu Thr Trp His Ala485 490 495CAA GGA AAG AGT GCT ATC TTG GTA AGG ACC GAA ACA AGC CCA GAA GAT 1594Gln Gly Lys Ser Ala Ile Leu Val Arg Thr Glu Thr Ser Pro Glu Asp500 505 510 515GTT GGT GGT ATG CAT GCA GCA CCT GGA ATC TTA ACC GCT AGA GGA GGC 1642Val Gly Gly Met His Ala Ala Ala Gly Ile Leu Thr Ala Arg Gly Gly520 525 530ATG ACA TCA CAT GCA GCG GTG GTG GCT CGC GGA TGG GGC AAA TGT TGT 1690Met Thr Ser His Ala Ala Val Val Ala Arg Gly Trp Gly Lys Cys Cys535 540 545GTT TCC GGT TGT GCT GAT ATT CGT GTG AAC GAT GAT ATG AAG ATT TTT 1738Val Ser Gly Cys Ala Asp Ile Arg Val Asn Asp Asp Met Lys Ile Phe550 555 560ACG ATT GGC GAC CGT GTG ATT AAA GAA GGC GAC TGG CTT TCT CTT AAT 1786Thr Ile Gly Asp Arg Val Ile Lys Glu Gly Asp Trp Leu Ser Leu Asn565 570 575GGT ACA ACT GGT GAA GTC ATA TTG GGT AAA CAG CTA CTG GCT CCA CCT 1834Gly Thr Thr Gly Glu Val Ile Leu Gly Lys Gln Leu Leu Ala Pro Pro580 585 590 595GCA ATG AGC AAT GAC TTA GAA ATA TTC ATG TCA TGG GCT GAT CAA GCA 1882Ala Met Ser Asn Asp Leu Glu Ile Phe Met Ser Trp Ala Asp Gln Ala600 605 610AGG CGT CTC AAG GTT ATG GCA AAT GCA GAC ACA CCT AAT GAT GCA TTA 1930Arg Arg Leu Lys Val Met Ala Asn Ala Asp Thr Pro Asn Asp Ala Leu615 620 625ACA GCC AGA AAC AAT GGT GCA CAA GGG ATC GGG CTC TGT AGA ACT GAA 1978Thr Ala Arg Asn Asn Gly Ala Gln Gly Ile Gly Leu Cys Arg Thr Glu630 635 640CAT ATG TTT TTC GCT TCT GAT GAG AGG ATC AAA GCT GTA AGA AAG ATG 2026His Met Phe Phe Ala Ser Asp Glu Arg Ile Lys Ala Val Arg Lys Met645 650 655ATC ATG GCG GTC ACT CCA GAA CAA AGA AAA GTG GCT CTA GAT CTC TTA 2074Ile Met Ala Val Thr Pro Glu Gln Arg Lys Val Ala Leu Asp Leu Leu660 665 670 675CTC CCA TAC CAA AGA TCC GAT TTT GAG GGC ATT TTC CGA GCA ATG GAT 2122Leu Pro Tyr Gln Arg Ser Asp Phe Glu Gly Ile Phe Arg Ala Met Asp680 685 690GGA CTT CCT GTA ACT ATC CGC CTT CTA GAC CCT CCA CTT CAT GAG TTT 2170Gly Leu Pro Val Thr Ile Arg Leu Leu Asp Pro Pro Leu His Glu Phe695 700 705TTA CCC GAA GGT GAT CTA GAA CAC ATA GTG AAC GAA CTT GCA GTC GAC 2218Leu Pro Glu Gly Asp Leu Glu His Ile Val Asn Glu Leu Ala Val Asp710 715 720ACA GGC ATG AGT GCA GAT GAA ATC TAT TCA AAA ATC GAA AAT CTA TCT 2266Thr Gly Met Ser Ala Asp Glu Ile Tyr Ser Lys Ile Glu Asn Leu Ser
725730 735GAA GTG AAC CCT ATG CTT GGT TTC CGT GGT TGC AGA TTA GGG ATT TCA 2314Glu Val Asn Pro Met Leu Gly Phe Arg Gly Cys Arg Leu Gly Ile Ser740 745 750 755TAC CCC GAG CTA ACA GAA ATG CAA GTT CGT GCG ATC TTT CAA GCT GCA 2362Tyr Pro Glu Leu Thr Glu Met Gln Val Arg Ala Ile Phe Gln Ala Ala760 765 770GTG TCT ATG ACC AAT CAG GGG GTG ACT GTA ATA CCA GAG ATC ATG GTT 2410Val Ser Met Thr Asn Gln Gly Val Thr Val Ile Pro Glu Ile Met Val775 780 785CCG TTA GTG GGG ACA CCT CAG GAA TTA CGT CAT CAA ATC AGT GTA ATT 2458Pro Leu Val Gly Thr Pro Gln Glu Leu Arg His Gln Ile Ser Val Ile790 795 800CGT GGA GTA GCT GCA AAT GTG TTT GCT GAA ATG GGG GTG ACA TTG GAA 2506Arg Gly Val Ala Ala Asn Val Phe Ala Glu Met Gly Val Thr Leu Glu805 810 815TAT AAA GTG GGA ACG ATG ATT GAG ATT CCT CGA GCT GCT TTA ATA GCT 2554Tyr Lys Val Gly Thr Met Ile Glu Ile Pro Arg Ala Ala Leu Ile Ala820 825 830 835GAA GAG ATT GGA AAA GAA GCT GAT TTC TTT TCG TTT GGA ACC AAT GAT 2602Glu Glu Ile Gly Lys Glu Ala Asp Phe Phe Ser Phe Gly Thr Asn Asp840 845 850CTG ACC CAG ATG ACA TTT GGG TAC AGC AGA GAT GAT GTT GGC AAG TTT 2650Leu Thr Gln Met Thr Phe Gly Tyr Ser Arg Asp Asp Val Gly Lys Phe855 860 865TTG CAG ATT TAT CTT GCT CAA GGC ATT CTG CAG CAT GAT CCA TTT GAG 2698Leu Gln Ile Tyr Leu Ala Gln Gly Ile Leu Gln His Asp Pro Phe Glu870 875 880GTT ATT GAC CAG AAA GGG GTG GGT CAG TTG ATT AAG ATG GCT ACG GAG 2746Val Ile Asp Gln Lys Gly Val Gly Gln Leu Ile Lys Met Ala Thr Glu885 890 895AAA GGT CGT GCA GCA AAT CCT AAC TTA AAG GTT GGG ATA TGT GGG GAG 2794Lys Gly Arg Ala Ala Asn Pro Asn Leu Lys Val Gly Ile Cys Gly Glu900 905 910 915CAT GGT GGG GAG CCT TCT TCT GTT GCA TTT TTT GAT GGA GTT GGA CTA 2842His Gly Gly Glu Pro Ser Ser Val Ala Phe Phe Asp Gly Val Gly Leu920 925 930GAT TAT GTG TCG TGC TCT CCA TTT AGG GTT CCT ATC GCA AGG TTG GCC 2890Asp Tyr Val Ser Cys Ser Pro Phe Arg Val Pro Ile Ala Arg Leu Ala935 940 945GCT GCA CAA GTC ATT GTT TAAGCTT 2915Ala Ala Gln Val Ile Val950序列號(hào)2序列長2880序列型核酸序列CGGCGCAGTA GGGGATCGGA AGG ATG GCG GCA TCG GTT TCC AGG GCC ATC TGC 53Met Ala Ala Ser Val Ser Arg Ala Ile Cys1 5 10GTA CAG AAG CCG GGC TCA AAA TGC ACC AGG GAC AGG GAA GCG ACC TCC101Val Gln Lys Pro Gly Ser Lys Cys Thr Arg Asp Arg Glu Ala Thr Ser15 20 25TTC GCC CGC CGA TCG GTC GCA GCG CCG AGG CCC CCG CAC GCC AAA GCC149Phe Ala Arg Arg Ser Val Ala Ala Pro Arg Pro Pro His Ala Lys Ala30 35 40CGC CGG CGT CAT CCG CTC CGA CTC CGG CGC GGG ACG GGG CCA CAT TGC197Arg Arg Arg His Pro Leu Arg Leu Arg Arg Gly Thr Gly Pro His Cys45 50 55TCG CCG CTG AGG GCC GTC GTT GAC GCC GCG CCG ATA CAG ACG ACC AAA245Ser Pro Leu Arg Ala Val Val Asp Ala Ala Pro Ile Gln Thr Thr Lys60 65 70AAG AGG GTG TTC CAC TTC GGC AAG GGC AAG AGC GAG GGC AAC AAG ACC293Lys Arg Val Phe His Phe Gly Lys Gly Lys Ser Glu Gly Asn Lys Thr75 80 85 90ATG AAG GAA CTG CTG GGC GGC AAG GGC GCG AAC CTG GCG GAG ATG GCG341Met Lys Glu Leu Leu Gly Gly Lys Gly Ala Asn Leu Ala Glu Met Ala95 100 105AGC ATC GGG CTG TCG GTG CCG CCA GGG TTC ACG GTG TCG ACG GAG GCG389Ser Ile Gly Leu Ser Val Pro Pro Gly Phe Thr Val Ser Thr Glu Ala110 115 120TGC CAG CAG TAC CAG GAC GCC GGG TGC GCC CTC CCC GCG GGG CTC TGG437Cys Gln Gln Tyr Gln Asp Ala Gly Cys Ala Leu Pro Ala Gly Leu Trp125 130 135GCC GAG ATC GTC GAC GGC CTG CAG TGG GTG GAG GAG TAC ATG GGC GCC485Ala Glu Ile Val Asp Gly Leu Gln Trp Val Glu Glu Tyr Met Gly Ala140 145 150ACC CTG GGC GAT CCG CAG CGC CCG CTC CTG CTC TCC GTC CGC TCC GGC533Thr Leu Gly Asp Pro Gln Arg Pro Leu Leu Leu Ser Val Arg Ser Gly155 160 165 170GCC GCC GTG TCC ATG CCC GGC ATG ATG GAC ACG GTG CTC AAC CTG GGG581Ala Ala Val Ser Met Pro Gly Met Met Asp Thr Val Leu Asn Leu Gly175 180 185CTC AAC GAC GAA GTG GCC GCC GGG CTG GCG GCC AAG AGC GGG GAG CGC629Leu Asn Asp Glu Val Ala Ala Gly Leu Ala Ala Lys Ser Gly Glu Arg190 195 200TTC GCC TAC GAC TCC TTC CGC CGC TTC CTC GAC ATG TTC GGC AAC GTC677Phe Ala Tyr Asp Ser Phe Arg Arg Phe Leu Asp Met Phe Gly Asn Val205 210 215GTC ATG GAC ATC CCC CGC TCA CTG TTC GAA GAG AAG CTT GAG CAC ATG725Val Met Asp Ile Pro Arg Ser Leu Phe Glu Glu Lys Leu Glu His Met220 225 230AAG GAA TCC AAG GGG CTG AAG AAC GAC ACC GAC CTC ACG GCC TCT GAC773Lys Glu Ser Lys Gly Leu Lys Asn Asp Thr Asp Leu Thr Ala Ser Asp235 240 245 250CTC AAA GAG CTC GTG GGT CAG TAC AAG GAG GTC TAC CTC TCA GCC AAG821Leu Lys Glu Leu Val Gly Gln Tyr Lys Glu Val Tyr Leu Ser Ala Lys255 260 265GGA GAG CCA TTC CCC TCA GAC CCC AAG AAG CAG CTG GAG CTA GCA GTG869Gly Glu Pro Phe Pro Ser Asp Pro Lys Lys Gln Leu Glu Leu Ala Val270 275 280CTG GCT GTG TTC AAC TCG TGG GAG AGC CCC AGG GCC AAG AAG TAC AGG917Leu Ala Val Phe Asn Ser Trp Glu Ser Pro Arg Ala Lys Lys Tyr Arg285 290 295AGC ATC AAC CAG ATC ACT GGC CTC AGG GGC ACC GCC GTG AAC GTG CAG965Ser Ile Asn Gln Ile Thr Gly Leu Arg Gly Thr Ala Val Asn Val Gln300 305 310TGC ATG GTG TTC GGC AAC ATG GGG AAC ACT TCT GGC ACC GGC GTG CTC 1013Cys Met Val Phe Gly Asn Met Gly Asn Thr Ser Gly Thr Gly Val Leu315 320 325 330TTC ACC AGG AAC CCC AAC ACC GGA GAG AAG AAG CTG TAT GGC GAG TTC 1061Phe Thr Arg Asn Pro Asn Thr Gly Glu Lys Lys Leu Tyr Gly Glu Phe335 340 345CTG GTG AAC GCT CAG GGT GAG GAT GTG GTT GCC GGA ATA AGA ACC CCA 1109Leu Val Asn Ala Gln Gly Glu Asp Val Val Ala Gly Ile Arg Thr Pro
350 355 360GAG GAC CTT GAC GCC ATG AAG AAC CTC ATG CCA CAG GCC TAC GAC GAG 1157Glu Asp Leu Asp Ala Met Lys Asn Leu Met Pro Gln Ala Tyr Asp Glu365 370 375CTT GTT GAG AAC TGC AAC ATC CTG GAG AGC CAC TAC AAG GAA ATG CAG 1205Leu Val Glu Asn Cys Asn Ile Leu Glu Ser His Tyr Lys Glu Met Gln380 385 390GAT ATC GAG TTC ACT GTC CAG GAA AAC AGG CTG TGG ATG TTG CAG TGC 1253Asp Ile Glu Phe Thr Val Gln Glu Asn Arg Leu Trp Met Leu Gln Cys395 400 405 410AGG ACA GGG AAA CGT ACG GGC AAA AGT GCC GTG AAG ATC GCC GTG GAC 1301Arg Thr Gly Lys Arg Thr Gly Lys Ser Ala Val Lys Ile Ala Val Asp415 420 425ATG GTT AAC GAG GGC CTT GTT GAG CCC CGC TCA GCG ATC AAG ATG GTA 1349Met Val Asn Glu Gly Leu Val Glu Pro Arg Ser Ala Ile Lys Met Val430 435 440GAG CCA GGC CAC CTG GAC CAG CTT CTT CAT CCT CAG TTT GAG AAC CCG 1397Glu Pro Gly His Leu Asp Gln Leu Leu His Pro Gln Phe Glu Asn Pro445 450 455TCG GCG TAC AAG GAT CAA GTC ATT GCC ACT GGT CTG CCA GCC TCA CCT 1445Ser Ala Tyr Lys Asp Gln Val Ile Ala Thr Gly Leu Pro Ala Ser Pro460 465 470GGG GCT GCT GTG GGC CAG GTT GTG TTC ACT GCT GAA GAT GCT GAA GCA 1493Gly Ala Ala Val Gly Gln Val Val Phe Thr Ala Glu Asp Ala Glu Ala475 480 485 490TGG CAT TCC CAA GGG AAA GCT GCT ATT CTG GTA ACG GCG GAG ACC AGC 1541Trp His Ser Gln Gly Lys Ala Ala Ile Leu Val Arg Ala Glu Thr Ser495 500 505CCT GAG GAC GTT GGT GGC ATG CAC GCT GCT GTG GGG ATT CTT ACA GAG 1589Pro Glu Asp Val Gly Gly Met His Ala Ala Val Gly Ile Leu Thr Glu510 515 520AGG GGT GGC ATG ACT TCC CAC GCT GCT GTG GTC GCA CGT TGG TGG GGG 1637Arg Gly Gly Met Thr Set His Ala Ala Val Val Ala Arg Trp Trp Gly525 530 535AAA TGC TGC GTC TCG GGA TGC TCA GGC ATT CGC GTA AAC GAT GCG GAG 1685Lys Cys Cys Val Ser Gly Cys Ser Gly Ile Arg Val Asn Asp Ala Glu540 545 550AAG CTC GTG ACG ATC GGA AGC CAT GTG CTG CGC GAA GGT GAG TGG CTG 1733Lys Leu Val Thr Ile Gly Ser His Val Leu Arg Glu Gly Glu Trp Leu555 560 565 570TCG CTG AAT GGG TCG ACT GGT GAG GTG ATC CTT GGG AAG CAG CCG CTT 1781Ser Leu Asn Gly Ser Thr Gly Glu Val Ile Leu Gly Lys Gln Pro Leu575 580 585TCC CCA CCA GCC CTT AGT GGT GAT CTG GGA ACT TTC ATG GCC TGG GTG 1829Ser Pro Pro Ala Leu Ser Gly Asp Leu Gly Thr Phe Met Ala Trp Val590 595 600GAT GAT GTT AGA AAG CTC AAG GTC CTG GCT AAC GCC GAT ACC CCT GAT 1877Asp Asp Val Arg Lys Leu Lys Val Leu Ala Asn Ala Asp Thr Pro Asp605 610 615GAT GCA TTG ACT GCG CGA AAC AAT GGG GCA CAA GGA ATT GGA TTA TGC 1925Asp Ala Leu Thr Ala Arg Asn Asn Gly Ala Gln Gly Ile Gly Leu Cys620 625 630CGG ACA GAG CAC ATG TTC TTT GCT TCA GAC GAG AGG ATT AAG GCT GTC 1973Arg Thr Glu His Met Phe Phe Ala Ser Asp Glu Arg Ile Lys Ala Val635 640 645 650AGG CAG ATG ATT ATG GCT CCC ACG CTT GAG CTG AGG CAG CAG GCG CTC 2021Arg Gln Met Ile Met Ala Pro Thr Leu Glu Leu Arg Gln Gln Ala Leu655 660 665GAC CGT CTC TTG ACG TAT CAG AGG TCT GAC TTC GAA GGC ATT TTC CGT 2069Asp Arg Leu Leu Thr Tyr Gln Arg Ser Asp Phe Glu Gly Ile Phe Arg670 675 680GCT ATG GAT GGA CTC CCG GTG ACC ATC CGA CTC CTG GAC CAT CCT TCT 2117Ala Met Asp Gly Leu Pro Val Thr Ile Arg Leu Leu Asp His Pro Ser685 690 695TAC GAG TTC CTT CCA GAA GGG AAC ATC GAG GAC ATT GTA AGT GAA TTA 2165Tyr Glu Phe Leu Pro Glu Gly Asn Ile Glu Asp Ile Val Ser Glu Leu700 705 710TGT GCT GAG ACG GGA GCC AAC CAG GAG GAT GCC CTC GCG CGA ATT GAA 2213Cys Ala Glu Thr Gly Ala Asn Gln Glu Asp Ala Leu Ala Arg Ile Glu715 720 725 730AAG CTT TCA GAA GTA AAC CCG ATG CTT GGC TTC CGT GGG TGC AGG CTT 2261Lys Leu Ser Glu Val Asn Pro Met Leu Gly Phe Arg Gly Cys Arg Leu735 740 745GGT ATA TCG TAC CCT GAA TTG ACA GAG ATG CAA GCC CGG GCC ATT TTT 2309Gly Ile Ser Tyr Pro Glu Leu Thr Glu Met Gln Ala Arg Ala Ile Phe750 755 760GAA GCT GCT ATA GCA ATG ACC AAC CAG GGT GTT CAA GTG TTC CCA GAG 2357Glu Ala Ala Ile Ala Met Thr Asn Gln Gly Val Gln Val Phe Pro Glu765 770 775ATA ATG GTT CCT CTT GTT GGA ACA CCA CAG GAA CTG GGG CAT CAA GTG 2405Ile Met Val Pro Leu Val Gly Thr Pro Gln Glu Leu Gly His Gln Val780 785 790ACT CTT ATC CGC CAA GTT GCT GAG AAA GTG TTC GCC AAT GTG GGC AAG 2453Thr Leu Ile Arg Gln Val Ala Glu Lys Val Phe Ala Asn Val Gly Lys795 800 805 810ACT ATC GGG TAC AAA GTT GGA ACA ATG ATT GAG ATC CCC AGG GCA GCT 2501Thr Ile Gly Tyr Lys Val Gly Thr Met Ile Glu Ile Pro Arg Ala Ala
815 820 825CTG GTG GCT GAT GAG ATA GCG GAG CAG GCT GAA TTC TTC TCC TTC CGA 2549Leu Val Ala Asp Glu Ile Ala Glu Gln Ala Glu Phe Phe Ser Phe Gly830 835 840ACG AAC GAC CTG ACG CAG ATG ACC TTT GGG TAC AGC AGG GAT GAT GTG 2597Thr Asn Asp Leu Thr Gln Met Thr Phe Gly Tyr Ser Arg Asp Asp Val845 850 855CGA AAG TTC ATT CCC GTT CAT CTT GCT CAG CGC ATC CTC CAA CAT GAC 2645Gly Lys Phe Ile Pro Val His Leu Ala Gln Gly Ile Leu Gln His Asp860 865 870CCC TTC GAG GTC CTG GAC CAG AGG GGA GTG GGC GAG CTG GTG AAG TTT 2693Pro Phe Glu Val Leu Asp Gln Arg Gly Val Gly Glu Leu Val Lys Phe875 880 885 890GCT ACA GAG AGG GGC CGC AAA GCT AGG CCT AAC TTG AAG GTG GGC ATT 2741Ala Thr Glu Arg Gly Arg Lys Ala Arg Pro Asn Leu Lys Val Gly Ile895 900 905TGT GGA GAA CAC GGT GGA GAG CCT TCG TCT GTG GCC TTC TTC GCG AAG 2789Cys Gly Glu His Gly Gly Glu Pro Ser Ser Val Ala Phe Phe Ala Lys910 915 920GCT GGG CTG GAT TTC GTT TCT TGC TCC CCT TTC AGG GTT CCG ATT GCT 2837Ala Gly Leu Asp Phe Val Ser Cys Ser Pro Phe Arg Val Pro Ile Ala925 930 935ACG CTA GCT GCA GCT CAG GTG CTT GTC TGACGCTGCC TCCTCG 2880Arg Leu Ala Ala Ala Gln Val Leu Val940945序列號(hào)3序列長2610序列型核酸序列GAATTCTCAA TCCTTTGCTC ATCGCAGCAT ATCAATGTTA ACACATAAAC TTTAGGAGGA 60AGAAAACTT ATG GCA AAA TGG GTT TAT AAG TTC GAA GAA GGC AAT GCA TCT 111Met Ala Lys Trp Val Tyr Lys Phe Glu Glu Gly Asn Ala Set1 510ATG AGA AAC CTT CTT GGA GGC AAA GGC TGC AAC CTT GCA GAG ATG ACC159Met Arg Asn Leu Leu Gly Gly Lys Gly Cys Asn Leu Ala Glu Met Thr15 20 25 30ATC TTA GGA ATG CCG ATT CCA CAG GGC TTT ACT GTA ACA ACA GAA GCT207Ile Leu Gly Met Pro Ile Pro Gln Gly Phe Thr Val Thr Thr Glu Ala35 40 45TGT ACA GAG TAC TAC AAC AGT GGA AAA CAG ATC ACA CAG GAA ATT CAG255Cys Thr Glu Tyr Tyr Asn Set Gly Lys Gln Ile Thr Gln Glu Ile Gln50 55 60GAT CAG ATT TTC GAA GCT ATC ACA TGG TTA GAG GAA CTG AAC GGC AAG303Asp Gln Ile Phe Glu Ala Ile Thr Trp Leu Glu Glu Leu Asn Gly Lys65 70 75AAG TTC GGC GAC ACT GAA GAT CCG TTA TTA GTA TCT GTA CGT TCC GCG351Lys Phe Gly Asp Thr Glu Asp Pro Leu Leu Val Set Val Arg Set Ala80 85 90GCC CGC GCA TCC ATG CCG GGT ATG ATG GAT ACC ATC CTG AAC CTT GGT399Ala Arg Ala Ser Met Pro Gly Met Met Asp Thr Ile Leu Asn Leu Gly95 100 105 110TTA AAC GAC GTT GCA GTA GAG GGC TTT GCA AAG AAA ACG GGA AAT CCA447Leu Asn Asp Val Ala Val Glu Gly Phe Ala Lys Lys Thr Gly Asn Pro115 120 125AGA TTT GCA TAT GAT TCT TAC AGA AGA TTT ATC CAG ATG TAT TCC GAC495Arg Phe Ala Tyr Asp Ser Tyr Arg Arg Phe Ile Gln Met Tyr Set Asp130 135 140GTA GTT ATG GAA GTT CCG AAG TCC CAT TTC GAG AAA ATC ATC GAT GCG543Val Val Met Glu Val Pro Lys Ser His Phe Glu Lys Ile Ile Asp Ala145 150 155ATG AAA GAA GAA AAG GGC GTT CAC TTC GAT ACA GAC CTG ACT GCC GAT591Met Lys Glu Glu Lys Gly Val His Phe Asp Thr Asp Leu Thr Ala Asp160 165 170GAT TTA AAA GAG CTG GCT GAG AAG TTC AAA GCT GTT TAC AAA GAG GCT639Asp Leu Lys Glu Leu Ala Glu Lys Phe Lys Ala Val Tyr Lys Glu Ala175 180 185 190ATG AAC GGC GAA GAG TTC CCA CAG GAG CCG AAG GAT CAG TTA ATG GGC687Met Asn Gly Glu Glu Phe Pro Gln Glu Pro Lys Asp Gln Leu Met Gly195 200 205GCT GTT AAA GCA GTT TTC CGT TCC TGG GAC AAC CCT CGT GCA ATC GTA735Ala Val Lys Ala Val Phe Arg Ser Trp Asp Asn Pro Arg Ala Ile Val210 215 220TAC CGC CGT ATG AAC GAT ATC CCT GGA GAC TGG GGT ACT GCA GTT AAC783Tyr Arg Arg Met Asn Asp Ile Pro Gly Asp Trp Gly Thr Ala Val Asn225 230 235GTT CAG ACC ATG GTA TTT GGT AAC AAG GGC GAG ACC AGC GGT ACA GGC831Val Gln Thr Met Val Phe Gly Asn Lys Gly Glu Thr Ser Gly Thr Gly240 245 250GTT GCC TTC ACA CGT AAC CCA TCC ACA GGT GAA AAA GGC ATC TAC GGT879Val Ala Phe Thr Arg Asn Pro Ser Thr Gly Glu Lys Gly Ile Tyr Gly255 260 265 270GAG TAC CTG ATC AAT GCA CAG GGC GAG GAC GTA GTT GCA GGT GTC CGC927Glu Tyr Leu Ile Asn Ala Gln Gly Glu Asp Val Val Ala Gly Val Arg275 280 285ACA CCA CAG CCT ATC ACC CAG TTA GAG AAC GAT ATG CCT GAC TGC TAC975Thr Pro Gln Pro Ile Thr Gln Leu Glu Asn Asp Met Pro Asp Cys Tyr
290 295 300AAG CAG TTC ATG GAT CTG GCC ATG AAG CTG GAG AAA CAT TTC CGT GAC 1023Lys Gln Phe Met Asp Leu Ala Met Lys Leu Glu Lys His Phe Arg Asp305 310 315ATG CAG GAT ATG GAG TTC ACA ATC GAG GAA GGT AAA TTA TAC TTC TTA 1071Met Gln Asp Met Glu Phe Thr Ile Glu Glu Gly Lys Leu Tyr Phe Leu320 325 330CAG ACA CGT AAC GGC AAG AGA ACA GCT CCG GCT GCT CTT CAG ATT GCC 1119Gln Thr Arg Asn Gly Lys Arg Thr Ala Pro Ala Ala Leu Gln Ile Ala335 340 345 350TGC GAT TTA GTA GAC GAA GGC ATG ATC ACA GAG GAA GAG GCT GTT GTA 1167Cys Asp Leu Val Asp Glu Gly Met Ile Thr Glu Glu Glu Ala Val Val355 360 365AGA ATC GAA GCA AAA TCT CTT GAT CAG TTA CTT CAC CCG ACC TTC AAC 1215Arg Ile Glu Ala Lys Ser Leu Asp Gln Leu Leu His Pro Thr Phe Asn370 375 380CCG GCT GCT TTA AAG GCC GGC GAA GTA ATC GGT TCC GCT CTT CCG GCA 1263Pro Ala Ala Leu Lys Ala Gly Glu Val Ile Gly Ser Ala Leu Pro Ala385 390 395TCT CCT GGC GCA GCA GCA GGT AAA GTA TAC TTC ACC GCT GAT GAG GCT 1311Ser Pro Gly Ala Ala Ala Gly Lys Val Tyr Phe Thr Ala Asp Glu Ala400 405 410AAG GCT GCC CAC GAG AAG GGT GAG AGA GTT ATC CTT GTT CGT CTT GAG 1359Lys Ala Ala His Glu Lys Gly Glu Arg Val Ile Leu Val Arg Leu Glu415 420 425 430ACA TCT CCG GAA GAT ATC GAA GGT ATG CAT GCA GCC GAA GGT ATC CTG 1407Thr Ser Pro Glu Asp Ile Glu Gly Met His Ala Ala Glu Gly Ile Leu435 440 445ACA GTG CGC GGC GGT ATG ACA AGC CAT GCA GCC GTA GTT GCA CGT GGT 1455Thr Val Arg Gly Gly Met Thr Ser His Ala Ala Val Val Ala Arg Gly450 455 460ATG GGA ACA TGC TGC GTA TCC GGA TGC GGT GAG ATC AAG ATC AAC GAA 1503Met Gly Thr Cys Cys Val Ser Gly Cys Gly Glu Ile Lys Ile Asn Glu465 470 475GAA GCT AAG ACA TTC GAA CTT GGC GGA CAC ACA TTT GCA GAG GGA GAT 1551Glu Ala Lys Thr Phe Glu Leu Gly Gly His Thr Phe Ala Glu Gly Asp480 485 490TAC ATC TCC TTA GAT GGT TCC ACA GGT AAG ATT TAC AAG GGC GAC ATC 1599Tyr Ile Ser Leu Asp Gly Ser Thr Gly Lys Ile Tyr Lys Gly Asp Ile495 500 505 510GAG ACT CAG GAA CGT TCC GTA AGC GGA AGC TTC GAG CGT ATC ATG GTA 1647Glu Thr Gln Glu Arg Ser Val Ser Gly Ser Phe Glu Arg Ile Met Val515 520 525TGG GCT GAC AAG TTC AGA ACA TTA AAG GTT CGT ACA AAT GCC GAC ACA 1695Trp Ala Asp Lys Phe Arg Thr Leu Lys Val Arg Thr Asn Ala Asp Thr530 535 540CCG GAA GAT ACA CTC AAT GCC GTT AAA CTG GGT GCA GAG GGC ATC GGT 1743Pro Glu Asp Thr Leu Asn Ala Val Lys Leu Gly Ala Glu Gly Ile Gly545 550 555CTT TCC CGT ACA GAG CAT ATG TTC TTC GAG CCT GAC AGA ATC ATG AAG 1791Leu Cys Arg Thr Glu His Met Phe Phe Glu Ala Asp Arg Ile Met Lys560 565 570ATC AGA AAG ATG ATC CTT TCC GAT TCA GTG GAA GCA AGA GAA GAG GCT 1839Ile Arg Lys Met Ile Leu Ser Asp Ser Val Glu Ala Arg Glu Glu Ala575 580 585 590CTG AAC GAA TTA ATC CCG TTC CAG AAG GGC GAT TTC AAG GCT ATG TAC 1887Leu Asn Glu Leu Ile Pro Phe Gln Lys Gly Asp Phe Lys Ala Met Tyr595 600 605AAA GCT CTG GAA GGC AGG CCA ATG ACG GTT CGC TAC CTG GAT CCG CCG 1935Lys Ala Leu Glu Gly Arg Pro Met Thr Val Arg Tyr Leu Asp Pro Pro610 615 620CTG CAT GAG TTC GTT CCT CAT ACA GAA GAG GAG CAG GCT GAA CTG GCT 1983Leu His Glu Phe Val Pro His Thr Glu Glu Glu Gln Ala Glu Leu Ala625 630 635AAG AAC ATG GGC CTT ACT TTA GCA GAA GTA AAA GCA AAA GTT GAC GAA 2031Lys Asn Met Gly Leu Thr Leu Ala Glu Val Lys Ala Lys Val Asp Glu640 645 650TTA CAC GAG TTC AAC CCA ATG ATG GGC CAT CGT GGC TGC CGT CTT GCA 2079Leu His Glu Phe Asn Pro Met Met Gly His Arg Gly Cys Arg Leu Ala655 660 665 670GTT ACC TAT CCG GAA ATT GCA AAG ATG CAG ACA AGA GCC GTT ATG GAA 2127Val Thr Tyr Pro Glu Ile Ala Lys Met Gln Thr Arg Ala Val Met Glu675 680 685GCT GCT ATC GAA GTG AAG GAA GAG ACA GGA ATC GAT ATT GTT CCT GAG 2175Ala Ala Ile Glu Val Lys Glu Glu Thr Gly Ile Asp Ile Val Pro Glu690 695 700ATC ATG ATT CCG TTA GTT GGC GAG AAG AAA GAG CTT AAG TTC GTT AAG 2223Ile Met Ile Pro Leu Val Gly Glu Lys Lys Glu Leu Lys Phe Val Lys705 710 715GAC GTA GTT GTG GAA GTA GCT GAG CAG GTT AAG AAA GAG AAA GGT TCC 2271Asp Val Val Val Glu Val Ala Glu Gln Val Lys Lys Glu Lys Gly Ser720 725 730GAT ATG CAG TAC CAC ATC GGT ACC ATG ATC GAA ATT CCT CGT GCA GCT 2319Asp Met Gln Tyr His Ile Gly Thr Met Ile Glu Ile Pro Arg Ala Ala735 740 745 750CTC ACA GCA GAT GCC ATC GCT GAG GAA GCA GAG TTC TTC TCC TTC GGT 2367Leu Thr Ala Asp Ala Ile Ala Glu Glu Ala Glu Phe Phe Ser Phe Gly
755 760 765ACA AAC GAC TTA ACA CAG ATG ACA TTC GGC TTC TCC CGT GAC GAC GCC 2415Thr Asn Asp Leu Thr Gln Met Thr Phe Gly Phe Ser Arg Asp Asp Ala770 775 780GGC AAG TTC CTG GAT TCC TAC TAT AAA GCA AAA ATT TAT GAG TCC GAT 2463Gly Lys Phe Leu Asp Ser Tyr Tyr Lys Ala Lys Ile Tyr Glu Ser Asp785 790 795CCA TTC GCA AGA CTT GAC CAG ACA GGC GTT GGC CAG TTA GTA GAG ATG 2511Pro Phe Ala Arg Leu Asp Gln Thr Gly Val Gly Gln Leu Val Glu Met800 805 810GCA GTT AAG AAA GGC CGT CAG ACA CGT CCG GGC CTT AAG TGC GGC ATC 2559Ala Val Lys Lys Gly Arg Gln Thr Arg Pro Gly Leu Lys Cys Gly Ile815 820 825 830TGC GGC GAG CAC GGC GAG ATC CTT CTT CCG TAGAGTTCTG CCACAAAGTA 2609Cys Gly Glu His Gly Glu Ile Leu Leu Pro835 840G2610序列號(hào)4序列長2722序列型核酸序列GAACTATTTA AGGAATTTGT AAGAATTTAG AGTTCATTCA GATAATA ATG CAA AGA 56Met Gln Arg1GTA TAT GCT TTC GAA GAT GGT GAT GGA ACC AAC AAG AAA CTC CTT GGA104Val Tyr Ala Phe Glu Asp Gly Asp Gly Thr Asn Lys Lys Leu Leu Gly5 10 15GGA AAG GGA GCT GGA CTT TGC ACA ATG ACA AAA ATT GGA CTT CCA GTT152Gly Lys Gly Ala Gly Leu Cys Thr Met Thr Lys Ile Gly Leu Pro Val20 25 30 35CCA CAA GGA TTT GTT ATT ACA ACT GAA ATG TGT AAA CAA TTC ATT GCT 200Pro Gln Gly Phe Val Ile Thr Thr Glu Met Cys Lys Gln Phe Ile Ala40 45 50AAT GGA AAC AAA ATG CCA GAA GGA TTA ATG GAA GAA GTT AAA AAA GAA 248Asn Gly Asn Lys Met Pro Glu Gly Leu Met Glu Glu Val Lys Lys Glu55 60 65TAT CAA TTA GTT GAA AAG AAA TCA GGA AAA GTC TTT GGA GGA GAA GAA 296Tyr Gln Leu Val Glu Lys Lys Ser Gly Lys Val Phe Gly Gly Glu Glu70 75 80AAT CCA CTT CTT GTT TCA GTC AGA TCA GGA GCT GCT ATG TCT ATG CCA 344Asn Pro Leu Leu Val Ser Val Arg Ser Gly Ala Ala Met Ser Met Pro85 90 95GGT ATG ATG GAT ACT ATT CTT AAT CTT GGA CTT AAT GAT AAA ACT GTT 392Gly Met Met Asp Thr Ile Leu Asn Leu Gly Leu Asn Asp Lys Thr Val100 105 110 115GTT GCT CTT GCT AAA TTA ACC AAC AAT GAA AGA TTT GCA TAT GAT TCA 440Val Ala Leu Ala Lys Leu Thr Asn Asn Glu Arg Phe Ala Tyr Asp Ser120 125 130TAC AGA AGA TTT GTT TCC CTC TTC GGA AAG ATT GCT CTT AAT GCT TGT 488Tyr Arg Arg Phe Val Ser Leu Phe Gly Lys Ile Ala Leu Asn Ala Cys135 140 145GAT GAA GTT TAT GAT AAG ACT CTT GAA AAC AAA AAA GTT GAA AAG GGA 536Asp Glu Val Tyr Asp Lys Thr Leu Glu Asn Lys Lys Val Glu Lys Gly150 155 160GTT AAA TTA GAT ACT GAA TTA GAT GCT AAT GAT ATG AAA GAA CTT GCA 584Val Lys Leu Asp Thr Glu Leu Asp Ala Asn Asp Met Lys Glu Leu Ala165 170 175CAA GTC TTC ATT AAA AAG ACT GAA GAA TTC ACT AAA CAA CCA TTC CCA632Gln Val Phe Ile Lys Lys Thr Glu Glu Phe Thr Lys Gln Pro Phe Pro180 185 190 195GTT GAT CCA TAT GCT CAA TTA GAA TTT GCC ATT TGT GCT GTA TTC AGA680Val Asp Pro Tyr Ala Gln Leu Glu Phe Ala Ile Cys Ala Val Phe Arg200 205 210TCA TGG ATG GGA AAG AGA GCT GTT GAT TAC AGA AGA GAA TTC AAG ATT728Ser Trp Met Gly Lys Arg Ala Val Asp Tyr Arg Arg Glu Phe Lys Ile215 220 225ACT CCA GAA CAA GCT GAT GGA ACT GCT GTT TCA GTT GTT TCT ATG GTT776Thr Pro Glu Gln Ala Asp Gly Thr Ala Val Ser Val Val Ser Met Val230 235 240TAT GGT AAT ATG GGT AAT GAT TCA GCT ACT GGT GTT TGT TTC ACT AGA824Tyr Gly Asn Met Gly Asn Asp Ser Ala Thr Gly Val Cys Phe Thr Arg245 250 255GAT CCA GGA ACA GGA GAA AAT ATG TTC TTC GGA GAA TAT CTT AAG AAT872Asp Pro Gly Thr Gly Glu Asn Met Phe Phe Gly Glu Tyr Leu Lys Asn260 265 270 275GCA CAA GGA GAA GAT GTT GTT GCT GGT ATT AGA ACA CCA CAA ATT ATT920Ala Gln Gly Glu Asp Val Val Ala Gly Ile Arg Thr Pro Gln Ile Ile280 285 290TCA AAG ATG GCA GAA GAT CGA GAT CTT CCA GGT TGC TAT GAA CAA CTT968Ser Lys Met Ala Glu Asp Arg Asp Leu Pro Gly Cys Tyr Glu Gln Leu295 300 305CTT GAT ATT AGA AAG AAA TTA GAA GGA TAT TTC CAT GAA GTA CAA GAC 1016Leu Asp Ile Arg Lys Lys Leu Glu Gly Tyr Phe His Glu Val Gln Asp310 315 320TTT GAA TTC ACT ATT GAA AGA AAG AAA CTT TAC ATG CTC CAA ACT AGA 1064Phe Glu Phe Thr Ile Glu Arg Lys Lys Leu Tyr Met Leu Gln Thr Arg
325 330 335AAT GGA AAG ATG AAT GCA ACT GCT ACT GTC AGA ACA GGA GTT GAT ATG 1112Asn Gly Lys Met Asn Ala Thr Ala Thr Val Arg Thr Gly Val Asp Met340 345 350 355GTT GAA GAA GGA CTT ATT ACA AAA GAA CAA GCC ATT ATG AGA ATT GCA 1160Val Glu Glu Gly Leu Ile Thr Lys Glu Gln Ala Ile Met Arg Ile Ala360 365 370CCA CAA TCA GTT GAT CAA TTA CTT CAT AAG AAT ATG CCA GCT AAT TAT 1208Pro Gln Ser Val Asp Gln Leu Leu His Lys Asn Met Pro Ala Asn Tyr375 380 385GCA GAA GCT CCA TTA GTT AAA GGA CTT CCA GCA TCA CCA GGA GCT GCT 1256Ala Glu Ala Pro Leu Val Lys Gly Leu Pro Ala Ser Pro Gly Ala Ala390 395 400ACA GGA GCT GTT GTT TTT GAT GCC GAT GAT GCA GTT GAA CAA GCT AAA 1304Thr Gly Ala Val Val Phe Asp Ala Asp Asp Ala Val Glu Gln Ala Lys405 410 415GGA AAG AAA GTT CTT CTT CTT AGA GAA GAA ACT AAA CCA GAA GAT ATT 1352Gly Lys Lys Val Leu Leu Leu Arg Glu Glu Thr Lys Pro Glu Asp Ile420 425 430 435CAT GGA TTC TTT GTT GCT GAA GGT ATT TTA ACC TGC AGA GGA GGA AAA 1400His Gly Phe Phe Val Ala Glu Gly Ile Leu Thr Cys Arg Gly Gly Lys440 445 450ACA TCA CAC GCA GCT GTC GTT GCT AGA GGT ATG GGT AAA CCA TGT GTT 1448Thr Ser His Ala Ala Val Val Ala Arg Gly Met Gly Lys Pro Cys Val455 460 465TCA GGA GCT GAA GGA ATT AAA GTT GAT GTT GCT AAG AAA ATT GCT AAG 1496Ser Gly Ala Glu Gly Ile Lys Val Asp Val Ala Lys Lys Ile Ala Lys470 475480ATT GGA AGC CTT GAA GTT CAT GAA GGA GAT ATT TTA ACT ATT GAT GGA 1544Ile Gly Ser Leu Glu Val His Glu Gly Asp Ile Leu Thr Ile Asp Gly485 490 495TCA ACT GGA TGT GTC TAT AAG GGA GAA GTT CCA TTA GAA GAA CCA CAA 1592Ser Thr Gly Cys Val Tyr Lys Gly Glu Val Pro Leu Glu Glu Pro Gln500 505 510 515GTT GGA TCA GGA TAT TTC GGA ACC ATC TTA AAA TGG GCC AAT GAA ATT 1640Val Gly Ser Gly Tyr Phe Gly Thr Ile Leu Lys Trp Ala Asn Glu Ile520 525 530AAA AAG ATT GGA GTT TTT GCT GCT GGA GAT CTT CCA TCA GCT GCT AAG 1688Lys Lys Ile Gly Val Phe Ala Ala Gly Asp Leu Pro Ser Ala Ala Lys535 540 545AAA GCC CTT GAA TTT GGA GCT GAA GGT ATT GGA CTT TGC AGA ACT GAA 1736Lys Ala Leu Glu Phe Gly Ala Glu Gly Ile Gly Leu Cys Arg Thr Glu550 555 560CGT ATG TTC AAT GCA GTT GAA AGA CTT CCA ATT GTT GTC AAG ATG ATT 1784Arg Met Phe Asn Ala Val Glu Arg Leu Pro Ile Val Val Lys Met Ile565 570 575CTT TCA AAT ACC CTT GAA GAA AGA AAG AAA TAT CTT AAT GAA CTT ATG 1832Leu Ser Asn Thr Leu Glu Glu Arg Lys Lys Tyr Leu Asn Glu Leu Met580 585 590 595CCA CTT CAA AAA CAA GAT TTC ATT GGA TTA TTG AAG ACT ATG AAT GGA 1880Pro Leu Gln Lys Gln Asp Phe Ile Gly Leu Leu Lys Thr Met Asn Gly600 605 610CTT CCA GTC ACT GTC AGA CTT CTT GAT CCA CCA TTA CAT GAA TTC CTC 1928Leu Pro Val Thr Val Arg Leu Leu Asp Pro Pro Leu His Glu Phe Leu615 620 625CCA ACT CTT GAA GAG TTA ATG AGA GAA ATC TTT GAA ATG AAA CTT TCA 1976Pro Thr Leu Glu Glu Leu Met Arg Glu Ile Phe Glu Met Lys Leu Ser630 635 640GGT AAG ACT GAA GGA CTT GCA GAA AAA GAA GTT GTT CTT AAG AAA GTT 2024Gly Lys Thr Glu Gly Leu Ala Glu Lys Glu Val Val Leu Lys Lys Val645 650 655AAA GAA CTT ATG GAA GTT AAT CCA ATG ATT GGA CAC AGA GGA ATT AGA 2072Lys Glu Leu Met Glu Val Asn Pro Met Ile Gly His Arg Gly Ile Arg660 665 670 675CTT GGA ACT ACT AAT CCA GAA ATT TAT GAA ATG CAA ATT AGA GCA TTC 2120Leu Gly Thr Thr Asn Pro Glu Ile Tyr Glu Met Gln Ile Arg Ala Phe680 685 690TTA GAA GCT ACT CGT GAA GTT ATT AAG GAA GGA ATT AAC GAT CAT CGA 2168Leu Glu Ala Thr Arg Glu Val Ile Lys Glu Gly Ile Asn Asp His Arg695 700 705GAA ATT ATG ATT CCA AAT GTT ACA GAA GTT AAT GAA CTT ATT AAC TTA 2216Glu Ile Met Ile Pro Asn Val Thr Glu Val Asn Glu Leu Ile Asn Leu710 715 720AGA AAG AAT GTT CTT GAA CCA GTT CAT GAA GAA GTT GAA AAG AAA TAT 2264Arg Lys Asn Val Leu Glu Pro Val His Glu Glu Val Glu Lys Lys Tyr725 730 735GGT ATT AAA GTA CCA TTC TCG TAT GGT ACT ATG GTT GAA TGT GTT AGA 2312Gly Ile Lys Val Pro Phe Ser Tyr Gly Thr Met Val Glu Cys Val Arg740 745 750 755GCA GCA TTA ACA GCT GAT AAG ATT GCT ACA GAA GCT TCA TTC TTC TCA 2360Ala Ala Leu Thr Ala Asp Lys Ile Ala Thr Glu Ala Ser Phe Phe Ser760 765 770TTC GGA ACT AAT GAT CTT ACA CAA GGA ACA TTC TCA TAC TCA CGT GAA 2408Phe Gly Thr Asn Asp Leu Thr Gln Gly Thr Phe Ser Tyr Ser Arg Glu775 780 785GAT TCA GAA AAC AAA TTC ATT CCA AAA TAT GTT GAA CTT AAG ATT CTT 2456Asp Ser Glu Asn Lys Phe Ile Pro Lys Tyr Val Glu Leu Lys Ile Leu
790 795 800CCA GCT AAT CCA TTT GAA ATT CTT GAT AGA CCA GGT GTT GGA GAA GTT 2504Pro Ala Asn Pro Phe Glu Ile Leu Asp Arg Pro Gly Val Gly Glu Val805 810 815ATG AGA ATT GCT GTT ACT AAA GGA AGA CAA ACA AGA CCA GAA TTA CTT 2552Met Arg Ile Ala Val Thr Lys Gly Arg Gln Thr Arg Pro Glu Leu Leu820 825 830 835GTT GGT ATT TGT GGA GAA CAC GGA GGA GAA CCA TCA TCA ATT GAA TGG 2600Val Gly Ile Cys Gly Glu His Gly Gly Glu Pro Ser Ser Ile Glu Trp840 845 850TGC CAC ATG ATT GGA TTG AAC TAT GTT TCA TGT TCT TCA TAC AGA ATT 2648Cys His Met Ile Gly Leu Asn Tyr Val Ser Cys Ser Ser Tyr Arg Ile855 860 865CCA GTT GCT AGA ATT GCT GCT GCT CAA GCC CAA ATT AGA CAT CCA AGA 2696Pro Val Ala Arg Ile Ala Ala Ala Gln Ala Gln Ile Arg His Pro Arg870 875 880GAA AAT TAAATTAACT TTTTTGGTTT 2722Glu Asn885序列號(hào)5序列長3180序列型核酸序列CTGAAATTCC CGTAATCTAT CATCATTTAC ACCACAAATC GATTCACATC CTCACCGAAT 60AGAAATCAAA TATCATTTAC TCCATCTCAC GATCTCCTTT TGCTATTGCT GATACCTCAA 120TTTCGCAGGT GAAGGCGGAC G ATG AGT TCG TTG TTT GTT GAA GGT ATG CCT171Met Ser Ser Leu Phe Val Glu Gly Met Pro1 5 10CTG AAG TCA GCC AAT GAG TCG TGC TTA CCG GCG AGC GTG AAG CAA CGG219Leu Lys Ser Ala Asn Glu Ser Cys Leu Pro Ala Ser Val Lys Gln Arg15 20 25CGA ACC GGT GAT CTC AGG CGA TTG AAC CAC CAC CGT CAA CCG GCG TTT267Arg Thr Gly Asp Leu Arg Arg Leu Asn His His Arg Gln Pro Ala Phe30 35 40GTC CGG GGG ATT TGC CGT CGG AAG TTG AGT GGA GTT AGC AGA ATA GAG315Val Arg Gly Ile Cys Arg Arg Lys Leu Ser Gly Val Ser Arg Ile Glu45 50 55TTG CGC ACC GGT GGT TTA ACT CTG CCA CGA GCG GTG CTT AAT CCG GTG363Leu Arg Thr Gly Gly Leu Thr Leu Pro Arg Ala Val Leu Asn Pro Val60 65 70TCT CCT CCG GTA ACG ACG ACT AAA AAG AGG GTT TTC ACT TTT GGT AAA411Ser Pro Pro Val Thr Thr Thr Lys Lys Arg Val Phe Thr Phe Gly Lys75 80 85 90GGA AAC AGT GAA GGC AAC AAG GAC ATG AAA TCC TTG TTG GGA GGA AAA459Gly Asn Ser Glu Gly Asn Lys Asp Met Lys Ser Leu Leu Gly Gly Lys95 100 105GGT GCA AAT CTT GCA GAG ATG GCA AGC ATT GGC CTA TCA GTT CCT CCT507Gly Ala Asn Leu Ala Glu Met Ala Ser Ile Gly Leu Ser Val Pro Pro110 115 120GGG CTC ACT ATT TCA ACT GAA GCA TGT GAG GAA TAT CAA CAA AAT GGA555Gly Leu Thr Ile Ser Thr Glu Ala Cys Glu Glu Tyr Gln Gln Asn Gly125 130 135AAA AAA CTG CCT CCA GGT TTA TGG GAT GAG ATT CTG GAA GGC TTA CAG603Lys Lys Leu Pro Pro Gly Leu Trp Asp Glu Ile Leu Glu Gly Leu Gln140 145 150TAT GTC CAG AAA GAG ATG TCT GCA TCT CTC GGT GAC CCG TCT AAA GCT651Tyr Val Gln Lys Glu Met Ser Ala Ser Leu Gly Asp Pro Ser Lys Ala155 160 165 170CTC CTC CTT TCC GTC CGT TCG GGT GCT GCC ATA TCG ATG CCT GGT ATG699Leu Leu Leu Ser Val Arg Ser Gly Ala Ala Ile Ser Met Pro Gly Met175 180 185ATG GAC ACT GTA TTG AAT CTC GGG CTT AAT GAT GAG GTC GTA GAT GGT747Met Asp Thr Val Leu Asn Leu Gly Leu Asn Asp Glu Val Val Asp Gly190 195 200CTA GCT GCC AAA AGT GGA GCT CGC TTT GCC TAT GAC TCG TAT AGG AGG795Leu Ala Ala Lys Ser Gly Ala Arg Phe Ala Tyr Asp Ser Tyr Arg Arg205 210 215TTT CTA GAT ATG TTT GGC AAC GTT GTA ATG GGT ATC CCA CAT TCG TTA843Phe Leu Asp Met Phe Gly Asn Val Val Met Gly Ile Pro His Ser Leu220 225 230TTT GAT GAA AAG TTA GAG CAG ATG AAA GCT GAA AAA GGG ATT CAT CTC891Phe Asp Glu Lys Leu Glu Gln Met Lys Ala Glu Lys Gly Ile His Leu235 240 245 250GAC ACT GAT CTC ACT GCT GCT GAT CTT AAA GAT CTT GCT GAG CAA TAC939Asp Thr Asp Leu Thr Ala Ala Asp Leu Lys Asp Leu Ala Glu Gln Tyr255 260 265AAG AAC GTG TAT GTG GAA GCA AAG GGC GAA AAG TTT CCC ACA GAT CCA987Lys Asn Val Tyr Val Glu Ala Lys Gly Glu Lys Phe Pro Thr Asp Pro270 275 280AAG AAA CAG CTA GAG TTA GCA GTG AAT GCG GTT TTT GAT TCT TGG GAC 1035Lys Lys Gln Leu Glu Leu Ala Val Asn Ala Val Phe Asp Ser Trp Asp285 290 295AGC CCA AGG GCC AAT AAG TAC AGG AGT ATT AAC CAG ATA ACT GGG TTA 1083Ser Pro Arg Ala Asn Lys Tyr Arg Ser Ile Asn Gln Ile Thr Gly Leu300 305 310AAG GGG ACC GCG GTT AAC ATT CAA TGG ATG GTG TTT GGC AAC ATG GGG 1131Lys Gly Thr Ala Val Asn Ile Gln Cys Met Val Phe Gly Asn Met Gly315 320 325 330AAC ACT TCA GGA ACC GGT GTT CTT TTC ACT AGG AAC CCA AGC ACT GGT 1179Asn Thr Ser Gly Thr Gly Val Leu Phe Thr Arg Asn Pro Ser Thr Gly335 340 345GAG AAG AAG CTG TAT GGG GAG TTT TTA GTC AAT GCT CAG GGA GAG GAT 1227Glu Lys Lys Leu Tyr Gly Glu Phe Leu Val Asn Ala Gln Gly Glu Asp350 355 360GTT GTT GCT GGG ATC AGA ACA CCA GAA GAT TTG GTG ACC ATG GAG ACT 1275Val Val Ala Gly Ile Arg Thr Pro Glu Asp Leu Val Thr Met Glu Thr365 370 375TGC ATG CCT GAA GCA TAC AGA GAG CTT GTG GAG AAC TGT GTG ATT TTA 1323Cys Met Pro Glu Ala Tyr Arg Glu Leu Val Glu Asn Cys Val Ile Leu380 385 390GAG AGA CAC TAC AAA GAT ATG ATG GAT ATT GAA TTC ACA GTT CAA GAA 1371Glu Arg His Tyr Lys Asp Met Met Asp Ile Glu Phe Thr Val Gln Glu395 400 405 410AAC AGA CTT TGG ATG CTG CAA TGC CGA ACA GGG AAA CGT ACT GGG AAA 1419Asn Arg Leu Trp Met Leu Gln Cys Arg Thr Gly Lys Arg Thr Gly Lys415 420 425GGT GCG GTG AGA ATT GCA GTA GAT ATG GTG AAC GAA GGG CTA ATT GAT 1467Gly Ala Val Arg Ile Ala Val Asp Met Val Asn Glu Gly Leu Ile Asp430 435 440ACT AGA ACA GCA ATT AAG AGG GTT GAG ACT CAA CAT CTA GAT CAG CTT 1515Thr Arg Thr Ala Ile Lys Arg Val Glu Thr Gln His Leu Asp Gln Leu445 450 455CTT CAT CCA CAG TTT GAG AAT CCG TCT GCT TAC AAA AGC CAT GTG GTA 1563Leu His Pro Gln Phe Glu Asn Pro Ser Ala Tyr Lys Ser His Val Val460 465 470GCA ACC GGT TTG CCA GCA TCC CCT GGG GCA GCC GTG GGG CAG GTT GTG 1611Ala Thr Gly Leu Pro Ala Ser Pro Gly Ala Ala Val Gly Gln Val Val475 480 485 490TTC AGC GCA GAG GAT GCT GAA ACA TGG CAT GCA CAA GGA AAG AGT GCT 1659Phe Ser Ala Glu Asp Ala Glu Thr Trp His Ala Gln Gly Lys Ser Ala495 500 505ATC TTG GTA AGG ACT GAA ACA AGC CCA GAA GAT GTT GGT GGT ATG CAT 1707Ile Leu Val Arg Thr Glu Thr Ser Pro Glu Asp Val Gly Gly Met His510 515 520GGA GCA GCT GGA ATC TTA ACC GCT AGA GGA GGA ATG ACA TCA CAT GCA 1755Ala Ala Ala Gly Ile Leu Thr Ala Arg Gly Gly Met Thr Ser His Ala525 530 535GCA GTG GTG GCT CGG GGA TGG GGC AAA TGT TGT GTT TCT GGT TGT GCT 1803Ala Val Val Ala Arg Gly Trp Gly Lys Cys Cys Val Ser Gly Cys Ala540 545 550GAT ATT CGT GTG AAC GAT GAT ATG AAG GTT TTT ACG ATA GGT GAC CGT 1851Asp Ile Arg Val Asn Asp Asp Met Lys Val Phe Thr Ile Gly Asp Arg555 560 565 570GTG ATT AAA GAA GGT GAC TGG CTT TCA CTT AAT GGT TCA ACT GGC GAA 1899Val Ile Lys Glu Gly Asp Trp Leu Ser Leu Asn Gly Ser Thr Gly Glu575 580 585GTC ATA TTG GGT AAA CAG CTA CTG GCT CCA CCT GCA ATG AGC AAT GAT 1947Val Ile Leu Gly Lys Gln Leu Leu Ala Pro Pro Ala Met Ser Asn Asp590 595 600TTA GAA ACA TTC ATG TCA TGG GCT GAT CAA GCA AGG CGT CTC AAG GTT 1995Leu Glu Thr Phe Met Ser Trp Ala Asp Gln Ala Arg Arg Leu Lys Val605 610 615ATG GCA AAT GCA GAC ACA CCT AAT GAT GCA TTA ACA GCC AGA AAC AAT 2043Met Ala Asn Ala Asp Thr Pro Asn Asp Ala Leu Thr Ala Arg Asn Asn
620625 630GGT GCA CAA GGG ATC GGA CTC TGT AGA ACT GAA CAT ATG TTT TTC GCT 2091Gly Ala Gln Gly Ile Gly Leu Cys Arg Thr Glu His Met Phe Phe Ala635 640 645 650TCT GAC GAG AGG ATC AAA GCT GTA AGA AAG ATG ATC ATG GCG GTC ACT 2139Ser Asp Glu Arg Ile Lys Ala Val Arg Lys Met Ile Met Ala Val Thr655 660 665CCA GAA CAA AGA AAA GCG GCT CTA GAC CTC TTA CTC CCA TAC CAA AGA 2187Pro Glu Gln Arg Lys Ala Ala Leu Asp Leu Leu Leu Pro Tyr Gln Arg670 675 680TCC GAT TTT GAG GGC ATT TTC CGA GCA ATG GAT GGA CTT CCT GTA ACA 2235Ser Asp Phe Glu Gly Ile Phe Arg Ala Met Asp Gly Leu Pro Val Thr685 690 695ATC CGC CTT CTA GAC CCT CCA CTT CAT GAG TTT CTA CCC GAA GGT GAT 2283Ile Arg Leu Leu Asp Pro Pro Leu His Glu Phe Leu Pro Glu Gly Asp700 705 710CTA GAA CAC ATA GTG AAT GAA CTT ACA GCG GAT ACA GGC ATG AGC AAA 2331Leu Glu His Ile Val Asn Glu Leu Thr Ala Asp Thr Gly Met Ser Lys715 720 725 730GAT GAA ATC TAT TCA AGA ATC GAA AAA TTA TCC GAA GTG AAC CCT ATG 2379Asp Glu Ile Tyr Ser Arg Ile Glu Lys Leu Ser Glu Val Asn Pro Met735 740 745CTT GGT TTC CGT GGT TGC CGA TTA GGG ATT TCA TAC CCC GAG CTA ACA 2427Leu Gly Phe Arg Gly Cys Arg Leu Gly Ile Ser Tyr Pro Glu Leu Thr750 755 760GAA ATG CAA GTT CGT GCG ATC TTT CAA GCT GCA GTG TCT ATG AAC AAT 2475Glu Met Gln Val Arg Ala Ile Phe Gln Ala Ala Val Ser Met Asn Asn765 770 775CAG GGG GTG ACT GTA ATA CCA GAG ATC ATG GTT CCG TTA GTC GGA ACA 2523Gln Gly Val Thr Val Ile Pro Glu Ile Met Val Pro Leu Val Gly Thr780 785 790CCT CAG GAA TTA CGG CAT CAA ATC GGC GTA ATT CGT GGT GTA GCT GGA 2571Pro Gln Glu Leu Arg His Gln Ile Gly Val Ile Arg Gly Val Ala Ala795 800 805 810AAT GTT TTT GCT GAA ATG GGG CTG ACG TTG GAG TAT AAA GTG GGA ACG 2619Asn Val Phe Ala Glu Met Gly Leu Thr Leu Glu Tyr Lys Val Gly Thr815 820 825ATG ATT GAG ATT CCT CGA GCT GCT TTG ATT GGT GAT GAG ATT GCA AAA 2667Met Ile Glu Ile Pro Arg Ala Ala Leu Ile Ala Asp Glu Ile Ala Lys830 835 840GAA GCC GAG TTC TTT TCG TTT GGA ACC AAT GAT TTG ACC CAG ATG ACA 2715Glu Ala Glu Phe Phe Ser Phe Gly Thr Asn Asp Leu Thr Gln Met Thr845 850 855TTT GGG TAC AGG AGA GAT GAT GTT GGC AAG TTT TTG CCG ATT TAT CTT 2763Phe Gly Tyr Ser Arg Asp Asp Val Gly Lys Phe Leu Pro Ile Tyr Leu860 865 870TCT CAA GGC ATT CTG CAG CAT GAT CCA TTT GAG GTT CTT GAC CAG AAA 2811Ser Gln Gly Ile Leu Gln His Asp Pro Phe Glu Val Leu Asp Gln Lys875 880 885 890GGG GTG GGT CAA TTG ATC AAG ATG GCC ACG GAG AAA GGT CGT GCA GCC 2859Gly Val Gly Gln Leu Ile Lys Met Ala Thr Glu Lys Gly Arg Ala Ala895 900 905AAT CCT AAC TTA AAG GTT GGG ATA TGT GGG GAG CAT GGT GGA GAA CCT 2907Asn Pro Asn Leu Lys Val Gly Ile Cys Gly Glu His Gly Gly Glu Pro910 915 920TCT TCT GTT GCA TTT TTT GAC GGA GTT GGA CTA GAT TAT GTG TCG TGC 2955Ser Ser Val Ala Phe Phe Asp Gly Val Gly Leu Asp Tyr Val Ser Cys925 930 935TCT CCA TTC AGG GTT CCT ATC GCA AGG TTG GCC GCT GCA CAA GTC GTT3003Ser Pro Phe Arg Val Pro Ile Ala Arg Leu Ala Ala Ala Gln Val Val940 945 950GTT TAAGCTTTGA AAGGAGGATG GCTTATTTGC TTCATGTTTT CCGCCATTGT 3056Val955ATATTATTTT GGTTTCATCC TTATTGTAAT GGTGAAAATG AACGATGTTT AAACAAAACA 3116ACCCATTATA TTTTGGTTTG GTATGCAATA ATCTACTTTT CAAACAAAAA AAAAAAAAAA 3176AAAA 3180序列號(hào)6序列長18序列型核酸序列GACGGCTAAA AAGAGGGT18序列號(hào)7序列長20序列型核酸序列TATCGAGAAA CCTTCTATAC 20序列號(hào)8序列長17序列型核酸序列GTTTTCCCAG TCACGAC17序列號(hào)9序列長17序列型核酸序列CAGGAAACAG CTATGAC17序列號(hào)10序列長23序列型核酸序列GATATCAATC CGGTGTCTCC TCC 23序列號(hào)11序列長34序列型核酸序列CGGTGTCTCC TCCGGATATC ACGGCTAAAA AGAG 34序列號(hào)12序列長27序列型核酸序列TTGATATCCC GGTTGTCTCC TCCGGTA 27序列號(hào)13序列長20序列型核酸序列GCAGAGATGA TGTTGGCAAG20序列號(hào)14序列長20序列型核酸序列CTTGCCAACA TCATCTCTGC20序列號(hào)15序列長20序列型核酸序列CTCACTGTTC GAAGAGAAGC20序列號(hào)16序列長23序列型核酸序列CATATGCTCT GTCCGGCATAATC 23序列號(hào)17序列長21序列型核酸序列CTCGAGGGAT CTCAATCATT G 21序列號(hào)18序列長18序列型核酸序列GCAATCTCTT CAGCAATC 18序列號(hào)19序列長20序列型核酸序列GCTTCTTTTC CAATCTCATC20序列號(hào)20序列長18序列型核酸序列CGAAAAGAAA TCGGCTTC 18序列號(hào)21序列長24序列型核酸序列GAAAGATAAA TCTGCAAAAA CTTG24序列號(hào)22序列長19序列型核酸序列GCCTTGAGCA AGATAAATC 19序列號(hào)23序列長21序列型核酸序列TTCTGGTCAA TAACCTCAAT G 21序列號(hào)24序列長20序列型核酸序列GCTTAAACAA TGACTTGTGC 20序列號(hào)25序列長22序列型核酸序列CCAATCTCAT CAGCTATTAA AG 22序列號(hào)26序列長20序列型核酸序列GCTTCTTTTG CAATCTCTTC20序列號(hào)27序列長18序列型核酸序列CGAAAAGAAC TCAGCTTC 18序列號(hào)28序列長23序列型核酸序列CAAGATAAAT CGGCAAAAAC TTG23序列號(hào)29序列長23序列型核酸序列GAATGCCTTG AGAAAGATAA ATC 23序列號(hào)30序列長24序列型核酸序列CTTTCTGGTC AAGAACCTCA AATG24序列號(hào)31序列長20序列型核酸序列GCTTAAACAA CGACTTGTGC 20
權(quán)利要求
1.一種多肽,其氨基酸序列系下列(1)(2)中任意一種在從氨基酸序列的C末端起占全長1/6的范圍內(nèi)有至少一個(gè)以上氨基酸殘基置換成其它氨基酸殘基,并具有耐低溫性丙酮酸磷酸雙激酶活性(1)一種丙酮酸磷酸雙激酶,其氨基酸序列如序列表序列號(hào)1~4中任意一種所示;(2)一種多肽,其氨基酸序列有50%以上與(1)所示氨基酸序列相同,并具有丙酮酸磷酸雙激酶活性。
2.一種多肽,其氨基酸序列如序列表序列號(hào)5所示,或在該氨基酸序列中增加、缺失或置換了一個(gè)或多個(gè)氨基酸,并具有耐低溫性丙酮酸磷酸雙激酶活性。
3.權(quán)利要求2所述多肽,其氨基酸序列如序列表序列號(hào)5所示。
4.一種多肽,其中含有序列表序列號(hào)5所示氨基酸序列第832~955號(hào)部分,或在該部分氨基酸序列中增加、缺失或置換了一個(gè)或多個(gè)氨基酸并可賦予有丙酮酸磷酸雙激酶活性的肽以耐低溫性的序列,并具有耐低溫性丙酮酸磷酸雙激酶活性。
5.權(quán)利要求4所述多肽,其中含有序列表序列號(hào)5所示氨基酸序列第832~955號(hào)部分,并具有耐低溫性丙酮酸磷酸雙激酶活性。
6.權(quán)利要求1所述多肽,其中,序列表序列號(hào)5所示氨基酸序列第832~955號(hào)部分,或在部分氨基酸序列中增加、缺失或置換了一個(gè)或多個(gè)氨基酸并能賦予丙酮酸磷酸雙激酶以耐低溫性的序列,置換了丙酮酸磷酸雙激酶氨基酸序列的對(duì)應(yīng)部分。
7.權(quán)利要求6所述多肽,其中,序列表序列號(hào)5所示氨基酸序列第832~955號(hào)部分置換了丙酮酸磷酸雙激酶氨基酸序列的對(duì)應(yīng)部分。
8.權(quán)利要求1所述多肽,其中,序列表序列號(hào)1所示氨基酸序列第869號(hào)置換成脯氨酸。
9.權(quán)利要求1所述多肽,其中,序列表序列號(hào)1所示氨基酸序列第885號(hào)和第952號(hào)分別置換成亮氨酸和纈氨酸。
10.權(quán)利要求1~9中任何一項(xiàng)所述多肽的編碼無性系化DNA。
11.權(quán)利要求10的DNA,對(duì)具有序列表序列號(hào)5所示堿基序列或在該堿基序列中增加、缺失或置換了一個(gè)或多個(gè)核苷酸并有耐低溫性丙酮酸磷酸雙激酶活性的多肽編碼。
12.一種重組載體,其中含有權(quán)利要求10所述DNA,可在宿主中表達(dá)具有耐低溫性丙酮酸磷酸雙激酶活性的多肽。
13.用權(quán)利要求10所述DNA轉(zhuǎn)型的植物。
全文摘要
公開了作為賦予植物以耐低溫性的手段、新型有耐低溫性丙酮酸磷酸雙激酶活性的多肽、對(duì)此類多肽編碼的無性系化DNA和含有該DNA的重組載體。本發(fā)明多肽有下列(1)(2)任意一種在從氨基酸序列的C末端起占全長1/6的范圍內(nèi)至少一個(gè)以上氨基酸殘基置換成其它氨基酸殘基的氨基酸序列,并具有耐低溫性丙酮酸磷酸雙激酶活性(1)一種丙酮酸磷酸雙激酶,其氨基酸序列如序列表序列號(hào)1~4中任何一種所示;(2)一種多肽,其氨基酸序列有50%以上與(1)所示氨基酸序列相同,并具有丙酮酸磷酸雙激酶活性。
文檔編號(hào)C12N9/12GK1135770SQ9519094
公開日1996年11月13日 申請(qǐng)日期1995年5月30日 優(yōu)先權(quán)日1994年7月29日
發(fā)明者太田象三, 宇佑美悟, N·J·賓柰爾 申請(qǐng)人:日本煙草產(chǎn)業(yè)株式會(huì)社