專利名稱:蔗糖結合蛋白的制作方法
技術領域:
本發(fā)明涉及植物中的碳水化合物代謝,具體地講,涉及蔗糖結合蛋白(SBP)。本發(fā)明內容包括從大豆中分離出來新的SBP基因,以及表現增強的蔗糖攝取活性的修飾的SBP。同時也提供了具有被改變的蔗糖攝取活性的核酸載體、轉基因細胞和轉基因植物。本發(fā)明還涉及用于調控轉基因(包括SBP轉基因)在植物中表達的啟動子序列。發(fā)明背景在植物中蔗糖運輸的調節(jié)是影響植物生長和生產力的主要因素。通過光和作用,植物將大氣中的二氧化碳固定為磷酸丙糖,然后磷酸丙糖用于生產蔗糖和其它碳水化合物。然后這些碳水化合物被運輸到植物各處作為能源蔗糖、生物合成的碳骨架以及未來生長需要的儲備。蔗糖是被輸送的碳水化合物的主要形式。植物細胞主動運輸蔗糖穿過原生質膜的能力,以至于固定在韌皮部的蔗糖能夠被吸收到細胞中使用,是蔗糖利用的關鍵步驟。
植物種子的形成涉及碳的累積和氮的儲備,儲備的形式既可以抵御干燥又可以用作在萌發(fā)過程中胚的發(fā)育能源。種子形成過程中碳的累積由特異的原生質膜蛋白質介導(Overvoorde等,1996;Riesmeier等,1992;Bush,1993)。用可光解蔗糖類似物對從大豆子葉組織分離出來的膜經光親和力標記鑒定出一種獨特的62 kD蔗糖結合蛋白,或稱SBP(Ripp等,1988)。對編碼SBP的cDNA及由其推斷出來的氨基酸序列分析表明,SBP在其N-末端有一個疏水區(qū),除此之外,SBP是一個缺乏普遍存在于運輸蛋白質中的跨膜疏水片段的親水蛋白質(Grimes等,1992)。SBP的拓撲學的生化分析證明它與原生質膜的外部小葉密切相關(Overvorrde和Grimes,1994)。免疫定位試驗證實SBP是細胞原生質膜上涉及蔗糖主動吸收的唯一相關蛋白質,說明SBP可能在蔗糖的攝取過程中發(fā)揮作用(Grimes等,1992)。在酵母系統中由SBP介導的蔗糖攝取的動力學分析表明,該攝取雖為蔗糖特異性,但是質子非依賴性的,且為相對不飽和性的,因此界定了一種新的蔗糖攝取機制(Overvoorde等,1996)。
種子形成中對蔗糖的攝取影響成熟種子的兩個典型農業(yè)特征所結籽粒的碳水化合物含量,以及籽粒種植后長出的幼苗的活力。當對增加種子中的碳水化合物含量有利時(例如,種子是收獲的主要植物材料,例如大豆),在種子形成中增強蔗糖攝取活性應該是理想的。相反,當收獲的是植物的無性材料時,降低種子中的蔗糖攝取活性就應當是理想的。因此,種子形成過程中,蔗糖攝取活性改變的植物將具有顯著的農業(yè)重要性,本發(fā)明即是針對這些植物。發(fā)明概述本發(fā)明提供了編碼植物蔗糖結合蛋白的分離的核酸分子,該蔗糖結合蛋白是種子形成過程中負責蔗糖攝取的關鍵蛋白質。在一個實施方案中,本發(fā)明提供了蔗糖結合蛋白的修飾型,其表現出增強的蔗糖攝取活性。
以前描述的來源于大豆的蔗糖結合蛋白(Overvoode等,1996)在本文中稱為SBP1。本文提供了一種新的SBP,稱為SBP2。SBP2多肽的長度為489個氨基酸殘基,在種子形成過程中顯示其表達水平增強。在異源酵母分析系統中SBP2多肽顯示具有蔗糖攝取活性。
另外,本發(fā)明提供了SBP1和SBP2蛋白質的修飾形式,其具有增強的蔗糖攝取活性。在一個實施方案中,這種形式是去除上述蛋白質C-末端氨基酸殘基的缺失突變體。舉例說明,去除SBP1蛋白質C-末端的80個氨基酸殘基,得到的蛋白質在酵母分析系統中表現出增強的蔗糖攝取活性。
本發(fā)明還提供了大豆SBP1和SBP2基因的5’調節(jié)區(qū)(包括啟動子序列)。這些調節(jié)區(qū)允許種子形成中的特異性的或增強的表達,因此可以用于表達種子形成中的任何轉基因。
因此,本發(fā)明一方面提供了一種經修飾的植物蔗糖結合蛋白,其中與相應的野生型蔗糖結合蛋白相比,經修飾的蔗糖結合蛋白具有被改變的氨基酸序列,并且與相應的野生型蔗糖結合蛋白相比,經修飾的蔗糖結合蛋白在酵母分析系統中的表達使蔗糖攝取增強。在具體實施方案中,本發(fā)明的經修飾的蔗糖結合蛋白與野生型蔗糖結合蛋白相比,在酵母分析系統中使蔗糖攝取增加至少10%,優(yōu)選至少25%。在某些實施方案中,經修飾的植物蔗糖結合蛋白與野生型蔗糖結合蛋白相比,具有改變的氨基酸序列,包括C-末端截短。這種截短典型地在10-100個氨基酸之間,優(yōu)選約80個氨基酸。雖然可以從任何已知的蔗糖結合蛋白中制備該經修飾的SBP,然而SBP1和SBP2的修飾形式則是本發(fā)明所舉出的實例。SBP1和SBP2的修飾形式包括分別具有Seq.I.D.No.2和4所示氨基酸序列的那些形式。
另一方面,本發(fā)明提供了編碼經修飾的植物蔗糖結合蛋白的核酸分子,以及包括這種核酸分子的載體。本發(fā)明還提供了表達經修飾的蔗糖結合蛋白的轉基因植物。這種轉基因植物可能具有被改變的蔗糖攝取活性,特別是在種子形成過程中。
再一方面,本發(fā)明提供了編碼蔗糖結合蛋白SBP2或SBP2蛋白變異體的分離的核酸分子。上述蛋白質可以包括Seq.I.D.No.3和4所示的氨基酸序列,或者包含與這些序列至少70%、優(yōu)選至少90%的序列相同的序列。本發(fā)明還提供包括上述核酸分子的重組表達盒序列,以及包含該重組表達盒序列的轉基因植物。
本發(fā)明的又一方面是包括啟動子序列的重組核酸分子,該啟動子序列可操作地與核酸序列連接,其中啟動子序列包括SBP1或SBP2啟動子。該啟動子優(yōu)選包括Seq.I.D.No.6和7所示的5’調節(jié)序列的至少25個連續(xù)核苷酸。在具體實施例中,所述核酸序列包括植物蔗糖結合蛋白編碼序列。包括該重組核酸分子的轉基因植物也是本發(fā)明的一方面。
本發(fā)明的上述方面和其它方面,將在下面的描述中詳細討論。附圖簡述
圖1顯示SBP1和SBP2蛋白質序列的排列。
圖2是在酵母分析系統中的蔗糖攝取活性圖。序列表序列表中列出的核酸和氨基酸序列是通過核酸堿基的標準單字母縮寫和氨基酸的三字母代碼表示。每個核酸序列僅列出一條鏈,但是應當理解通過參考已被展示鏈的互補鏈也包括在內。
Seq.I.D.No.1表示SBP1蛋白質的氨基酸序列。
Seq.I.D.No.2表示C-末端80個氨基酸被去除的截短的SBP1蛋白質的氨基酸序列。
Seq.I.D.No.3表示SBP2蛋白質的氨基酸序列。
Seq.I.D.No.4表示C-末端80個氨基酸被去除的截短的SBP2蛋白質的氨基酸序列。
Seq.I.D.No.5表示SBP2 cDNA序列。
Seq.I.D.No.6表示SBP2基因的5’調節(jié)區(qū)。
Seq.I.D.No.7表示SBP1基因的5’調節(jié)區(qū)。
Seq.I.D.No.8-14表示可以用于擴增SBP2 cDNA的各區(qū)或5’調節(jié)區(qū)的寡核苷酸。發(fā)明詳述I.方法本發(fā)明可以使用標準分子生物學方法操作。這些方法在一些出版物中已有描述,包括Sambrook等(1989),Ausubel等(1994),Innis等(1990),Weissbach和Weissbach(1989),Tijssen(1993)。
II.定義除非另有說明,使用的技術術語按照常規(guī)的用法應用。分子生物學一般術語的定義可以在以下出版物中找到Benjamin Lewin,基因V,Oxford University Press出版,1994(ISBN 0-19-854287-9);Kendrew等(編),分子生物學大全,Blackwell Science Ltd.出版,1994(ISBN0-632-02182-9);Robert A.Meyers(編),分子生物學和生物技術案頭參考大全(Comprehensive Desk Rererence),VCH Publishers,Inc.出版,1995(ISBN 1-56081-569-8)。DNA堿基的命名如37 CFR§1.822的規(guī)定,本文使用氨基酸殘基的標準三字母代碼。
為了便于查閱本發(fā)明的各實施方案,提供下列術語的定義蔗糖結合蛋白(SBP)SBP涉及植物中蔗糖的攝取??梢酝ㄟ^最早由Overvoorde等(1996)描述的酵母蔗糖攝取分析方法方便地確定和檢測該蔗糖攝取活性,下面還將詳細描述該方法;在這種分析系統中,SBP賦予酵母細胞以蔗糖攝取能力,否則酵母細胞不能夠攝取蔗糖。術語SBP的應用通常指任何蔗糖結合蛋白,包括以前由Grimes等(1992)描述的蔗糖結合蛋白。本發(fā)明提供了一種編碼以前未曾報道的蔗糖結合蛋白的cDNA,該蛋白是來自大豆(Glycine max)的SBP2蛋白。然而本發(fā)明不限于這種特述的SBP其它編碼SBP酶的核苷酸序列也是本發(fā)明的一部分,這些核苷酸序列包括已公開的甘氨酸基因序列的變異體和來自其它植物種的直向同源序列,現在已能夠對它們進行克隆了。這些序列都具有基本的功能特征編碼能夠在所述酵母分析系統中介導蔗糖攝取的酶。編碼SBP的核酸序列和這些核酸序列編碼的蛋白質不僅均具有這種功能特征,而且均具有特異水平的序列相似性(或序列同一性),如下面將要說明的。序列同一性的概念也可以表示為嚴謹條件下兩個序列相互雜交的能力。
本發(fā)明還提供了功能特征得到改變的經修飾的SBP,以及編碼這種蛋白質的核酸序列。從一種未轉化(野生型)植物中分離出來的SBP可以認為具有野生型氨基酸序列。經修飾的SBP的氨基酸序列與野生型氨基酸序列不同。這種不同可以采取氨基酸缺失、增加、取代或截短的形式。氨基酸序列缺失的蛋白質沒有了野生型序列中存在的一個或多個氨基酸殘基;上述殘基可以從蛋白質的任何部分刪除。相比較而言,截短的蛋白質是上述蛋白質的N和/或C末端的一個或多個氨基酸被刪除的形式。因此,截短的蛋白質是氨基酸缺失蛋白質中的小類。
編碼被改變的SBP的核酸序列可以容易地利用標準方法制備,例如位點定向誘變和聚合酶鏈反應擴增。
序列同一性兩個核酸序列或兩個氨基酸之間的相似性用術語序列間的相似性,或者稱為序列同一性表示。序列同一性通常以等同百分比(或相似百分比或同源百分比)度量;百分數越高,兩個序列越相似。
氨基酸序列的序列同一性百分數的計算可以考慮保守氨基酸取代。保守氨基酸取代涉及將一種氨基酸殘基用另一種具有類似化學和生物學性質(例如,電荷或疏水性)的殘基取代。這種取代通常不改變蛋白質的功能特征,因此可以考慮通過賦予一個在等同(即,在該氨基酸位置無改變)和非保守殘基變化值之間的值計算序列同一性。因此,保守氨基酸改變認為是部分的而不是全部的錯配,從而增加了百分序列同一性。例如,如果相同氨基酸打分為1,非保守取代打分為0,則保守取代應該打分為0.5。保守取代的打分按照,例如,Meyers和Miller(1988)的運算法則計算,例如,在PC/GENE程序中(Intelligenetics,Mountain View,California,USA)執(zhí)行。
用于比較的序列排比方法是本領域公知的。以下出版物描述了各種程序和排序運算法則Smith和Waterman(1981);Needleman和Wunsch(1970);Pearson和Lipman(1988);Higgins和Sharp 1988);Higgins和Sharp(1989);Corpet等(1988);Huang等(1992);和Pearson等(1994)。Altschul等(1994)記載了序列排比方法和同源性計算的全面周到的考慮。
NCBI Basic Local Alignment Search Tool(BLAST)(Altschul等,1990)可由以下幾個來源獲得,包括國家生物信息中心(NCBI,Bethesda,MD)和Internet,并結合序列分析程序blastp,blastn,blastx,tblastn和tblastx一起使用??梢园凑眨糷ttp//www.ncbi.nlm.nih.gov/BLAST>網址登錄。如何利用這些程序來確定序列同一性的描述可在<http//www.ncbi.nlm.nih.gov/BLAST/blast_help.html>上獲得。
已公開的SBP2蛋白類似物的特征在于擁有覆蓋大豆SBP2氨基酸序列的已公開的氨基酸序列全長序列至少80%的序列同一性,其中應用NCBI Blast 2.0,設置blastp為默認指標。這種同源多肽優(yōu)選擁有至少85%、更優(yōu)選至少90%,最優(yōu)選至少95%的序列同一性,這些值均通過上述方法確定。如果比較序列同一性時使用不完整序列,以10-20個氨基酸序列的短窗(short windows)計,類似物應當擁有至少90%、優(yōu)選至少95%,最優(yōu)選至少98%的序列同一性。經這種短窗確定序列同一性的方法在<http//www.ncbi.nlm.nih.gov/BLAST/blast_FAQs.html>有描述。具有上述序列同一性的類似物也擁有在所述酵母分析系統中介導蔗糖攝取的能力。本發(fā)明不僅提供上述多肽類似物,還提供編碼這種類似物的核酸分子。
大豆SBP2基因的類似物具有相似的特征,即擁有與已公開的甘氨SBP2基因序列全長序列有至少70%的序列同一性,該分析使用NCBI Blast 2.0,設置blastn為默認值。這種同源核酸優(yōu)選擁有至少75%的的序列同一性,更優(yōu)選至少80%的等同性,最優(yōu)選至少90%或95%的序列同一性,這些值均通過上述方法確定。如果比較序列同一性時使用不完整序列,以30個核苷酸框計,類似物應當擁有至少85%,優(yōu)選至少90%,最優(yōu)選至少95%的序列同一性。具有上述序列同一性的類似物在某些實施方案中,在所述酵母分析系統中也編碼具有介導蔗糖攝取能力的多肽。然而,如果上面定義的類似物不編碼功能多肽,它們也用于改變轉基因植物中的蔗糖攝取活性(例如,用于構建反義鏈)。
兩個核酸分子基本上同源的另一種表示方法是,當一個分子用作雜交探針,另一個存在于生物樣品中,例如細胞的基因組材料中時,這兩個分子可以在嚴謹條件下彼此雜交。特異性雜交意味著兩個分子基本上僅彼此雜交,而不與基因組材料中可能存在的其它分子雜交。嚴謹條件是序列依賴性的,其在不同環(huán)境因素下表現不同。嚴謹條件通常被選擇為在一定離子強度和pH下,比特異序列熱熔點(Tm)低5℃-20℃的溫度。Tm是50%的目標序列與最佳匹配探針雜交的溫度(在一定離子強度和pH下)。核酸雜交的條件和嚴謹度計算方法可以在Sambrook等(1989)和Tijssen(1993)中找到。雜交條件和嚴謹度將在下面進一步討論。
然而由于遺傳密碼子的間并性,不表現高度等同性的核酸序列同樣可以編碼類似的氨基酸序列。應當理解利用這種間并性可以進行核酸序列的改變,從而制備基本上都編碼同樣蛋白質的多種核酸序列。
探針和引物基于本發(fā)明提供的核酸,可以很容易地制備核酸探針和引物。探針包括分離出的核酸,其與可檢測標記物或報告分子相連。典型的標記物包括放射性同位素、配基、化學發(fā)光試劑、以及酶。標記方法和適合各種目的的標記物的選擇指導在Sambrook等(1989)和Ausubel等(1987)中有探討。
引物是短核酸,優(yōu)選長度為15個核苷酸或更多一點的DNA寡核苷酸。通過核酸雜交形成引物和目標DNA鏈的雜合體,可以將引物退火形成互補的目標DNA鏈,然后通過DNA聚合酶延伸目標DNA鏈。引物對可以用于擴增核酸序列,例如,通過聚合酶鏈反應(PCR),或者本領域已知的其它核酸擴增方法。
制備和使用探針和引物的方法在,例如Sambrook等(1989),Ausubel等(1987)和Innis等(1990)中有述。PCR引物對可以來源于已知序列,例如,使用為該目的設計的計算機程序例如Primer(Version 0.5,1991,Whitehead Institute for Biomedical Research,Cambridge,MA)。本領域技術人員可以理解,特別探針或引物的特異性隨其長度的增加而增加。因此,例如,含SBP1或SBP2基因5’調節(jié)區(qū)20個連續(xù)核苷酸的引物與目標序列(例如,來自Faba bean相應的SBP調節(jié)區(qū))的退火比僅有15個核苷酸的相應引物具有更高的特異性。因此,為了獲得較高的特異性,可以選擇含本文公開的核酸序列的20、25、30、35、40、50或更多連續(xù)核苷酸的探針和引物。
轉化轉化細胞是通過分子生物學技術將核酸分子導入其中的細胞。就象本文中用到的,術語“轉化”包括將核酸分子導入所述細胞的所有技術,包括農桿菌轉化、質粒轉化、病毒轉染、以及裸DNA通過電穿孔、脂轉染和加速粒子槍的導入。
載體是被導入宿主細胞的核酸分子,從而產生轉化的宿主細胞。載體可以包括允許它在宿主細胞中復制的核酸序列,例如復制起點。載體還可以包括一種或多種可選擇標識基因和其它本領域已知的遺傳單元。
分離的一種“分離的”生物成分(例如核酸或蛋白質)是已經從有機體的細胞中與其它天然存在的生物成分(即其它染色體和染色體外的DNA和RNA,以及蛋白質)中基本上分離或純化出來的成分。因此已經“分離的”核酸和蛋白質包括用標準純化方法純化的核酸和蛋白質。該術語還包括通過在宿主細胞中的重組表達制備的核酸和蛋白質以及化學合成的核酸。
純化的術語“純化的”不需要絕對地純凈;實際上,它傾向于表示一個相對概念。因此,例如,一種純化的SBP制品是比蛋白質在細胞的自然環(huán)境中更富含SBP的制品。SBP制品優(yōu)選被純化到SBP占該制品總蛋白質含量的至少50%。
有效地連接當第一種核酸序列被置于與第二種核酸序列具有功能關系的位置時,稱為第一種核酸序列與第二種核酸序列有效地連接。例如,如果一種啟動子影響編碼序列的轉錄或表達,則可將啟動子有效地連接于編碼序列。通常,有效連接的DNA序列非??拷渲斜仨殞蓚€蛋白編碼區(qū)連接在一個讀碼框中。
重組重組核酸具有非自然發(fā)生序列,或具有將兩個分開的序列部分進行人工組合得到的序列。上述人工組合通常通過化學合成或更普遍地通過對分離的核酸片段進行人工操作,例如通過基因工程技術實現。
直向同源如果兩個核苷酸或氨基酸序列具有共同的祖先序列,當帶有祖先序列的種分成兩個種時這兩個序列分開,那么這兩個核苷酸序列或氨基酸序列是直向同源序列。直向同源序列也是同源序列。
轉基因植物就象本文用到的,該術語指植物中含有在該類型的植物中通常不會存在的重組遺傳材料,而且該種遺傳材料通過人類操作被導入所討論的植物(或者導入該植物的親本)。因此,從通過轉化導入重組DNA的植物細胞生長成的植物是轉基因植物,含有被導入DNA的植物的所有子代(無論有性生殖還是無性生殖)也都是轉基因植物。可以從任何可轉化植物種生產轉基因植物,包括單子葉植物和雙子葉植物,包括(但不限于)大豆、水稻、小麥、大麥和玉米。
III.SBP2 cDNA和其編碼的SBP2多肽SBP2 cDNA的核酸序列如Seq.I.D.No.5所示,SBP2蛋白質的氨基酸序列如Seq.I.D.No.3所示。SBP1和SBP2氨基酸序列的比較如
圖1所示。
i.SBP1和SBP2基因在大豆葉和子葉中的不同表達離體合成32P-標記的SBP1和SBP2 5’-側翼區(qū)的有義和反義RNA,5.3×105cpm的SBP1有義RNA探針、SBP1反義RNA探針、SBP2有義RNA探針或SBP2反義RNA探針與5μg來自大豆葉和子葉的poly(A+)mRNA雜交。觀察到SBP1和SBP2的轉錄物在大豆子葉中有相似水平的累積。相比較而言,4周齡的大豆葉中沒有檢測到SBP1和SBP2的轉錄物。
ii.大豆SBP1和SBP2基因的不同表達用RNase保護法檢查大豆種子中SBP1和SBP2基因的表達模式。種子子葉的發(fā)育描述為5個狀態(tài)(狀態(tài)1=或<4mm,狀態(tài)2=5-6mm,狀態(tài)3=7mm,狀態(tài)4=9mm,狀態(tài)5=11-12mm)。子葉形成過程中,SBP1反義探針保護三個主要片段(119,111,和97個核苷酸),表明其中用到3個不同的轉錄起始位點。SBP1mRNA水平在第3狀態(tài)達到峰值,這種表達水平一直持續(xù)到第5狀態(tài)。相比較而言,當使用SBP2反義探針時檢測到5種被保護的片段,SBP2mRNA的水平連續(xù)增長直到種子達到11-12mm。定量數據表明SBP1mRNA的水平比SBP2mRNA的水平高出3倍多。葉尖mRNA的水平非常低。然而,延長照射后,在3mm葉尖中觀察到低水平的SBP1mRNA。這些數據表明種子形成過程中SBP1mRNA和SBP2mRNA的轉錄均很活躍,但轉錄狀況不同。
IV.SBP1和SBP2的5’調節(jié)區(qū)假定SBP1和SBP2的表達為組織特異性表達,則承擔這種表達的基因的調節(jié)區(qū)值得關注,它們可以用于在相似組織特異性模式中調節(jié)轉基因的表達。
SBP1和SBP2的5’調節(jié)區(qū)分別如Seq.I.D.No.6和7所示。
V.具有增強的蔗糖攝取活性的經修飾的SBPOvervoorede等(1996)描述的酵母分析系統用于確定修飾SBP蛋白質的氨基酸序列的效能。該分析中使用酵母菌株susy7(Riesmeier等,1992)的衍生物,該衍生物具有穩(wěn)定整合到其基因組中的菠菜蔗糖合成酶的cDNA,該酶介導細胞內蔗糖的水解。然而,這種酵母菌株缺乏運輸蔗糖的能力,因此不能夠在蔗糖作為唯一碳源的培養(yǎng)基中生長(Riesmeier等,1992)。為了產生能夠選擇被蔗糖結合蛋白基因轉化的酵母的宿主菌株,通過讓susy7菌株在含5’-氟-4-羧基尿嘧啶的培養(yǎng)基上生長,選擇尿嘧啶營養(yǎng)缺陷型susy7菌株(Overvoorede等,1996)。得到的菌株,susy7/ura3不能夠在缺乏尿嘧啶且只含蔗糖作為單一碳源的培養(yǎng)基上生長。
如Overvoorede等(1996)的描述在酵母載體pMK195中構建由酵母乙醇脫氫酶1(ADH1)啟動子、SBP開放讀碼框和ADH1多聚腺苷化信號序列組成的嵌合基因,以制備命名為pYESBP的質粒。利用基本上如Gietz等(1992)描述的基于LiOAc的小規(guī)模方法,用上述構建體轉化susy7/ura3酵母菌株。然后將轉化的酵母在含2%葡萄糖(CM[GLU])或2%蔗糖(CM[SUC])的排除尿嘧啶的選擇培養(yǎng)基上鋪板(Ausubel等,1994)。
通過下述操作分析蔗糖的攝取讓轉化的酵母細胞生長到在YPD中OD600為0.5-1.3,離心收獲細胞,用25mM Mes-KOH,pH5.5,0.5-2.5μCi14C蔗糖溶液漂洗細胞兩次,并以終濃度未標記蔗糖漂洗兩次。在特定時間點收集等分量的攝取溶液和細胞,然后轉移到5ml冰水中以停止攝取。用玻璃纖維濾器過濾收集細胞,用5ml冰冷水沖洗5次。通過液體閃爍計數確定細胞吸收的放射性。所有攝取分析均在1mM蔗糖終濃度中進行。
構建編碼修飾形式的SBP1蛋白質的核酸序列,并將其導入上述pYESBP構建體。圖2顯示由pMK195載體單獨轉化的酵母細胞得到的蔗糖攝取速率(實心圓),用表達全長SBP1蛋白質的構建體轉化的酵母細胞得到的蔗糖攝取速率(實心方框),以及用表達失去C-末端80個氨基酸的截短SBP1蛋白質的構建體轉化的酵母細胞得到的蔗糖攝取速率(實心三角)。這種截短的SBP1蛋白質的氨基酸序列如Seq.I.D.No.2所示。截短的蛋白質包括全長SBP1的第1-444殘基。
這種出乎意料的結果表明增強植物中的蔗糖攝取能力可以通過將編碼經修飾的SBP的轉基因導入植物獲得。經修飾的具有增強的蔗糖攝取活性的SBP包括C-末端刪除的SBP1和SBP2形式。這種刪除包括從C-末端除去約80個氨基酸,但也可以應用多于或少于80個氨基酸的刪除。任何具有特別刪除的蔗糖攝取活性可以容易地利用上述酵母蔗糖攝取分析系統確定。因此,以舉例說明的方式,C-末端刪除10-100個氨基酸的SBP蛋白質可以作為具有增強的蔗糖攝取活性蛋白質的侯選,并且可以利用該系統分析。實施例下列實施例作為本發(fā)明各種具體實施方式
的說明。實施例1制備SBP核酸的優(yōu)選方法本發(fā)明提供SBP2 cDNA序列和SBP2蛋白質的氨基酸序列、經修飾的具有增強的蔗糖攝取活性的SBP蛋白質的氨基酸序列,以及SBP1和SBP2基因的5’調節(jié)區(qū)。目前在制備編碼本發(fā)明所述的各種SBP蛋白質的核酸序列以及SBP基因5’調節(jié)區(qū)的優(yōu)選方法中可以使用聚合酶鏈反應(PCR)。編碼本發(fā)明SBP蛋白質的cDNA的PCR擴增可以通過對植物cDNA文庫進行直接PCR實現,或者利用從植物細胞中提取出來的RNA作為模版進行逆轉錄PCR(RT-PCR)實現。SBP基因序列和5’調節(jié)區(qū)的擴增可以通過對植物基因組DNA或者對植物基因組文庫進行直接PCR擴增實現。直接PCR和RTPCR的方法和條件是本領域已知的,Innis等(1990)對此有描述。
按照將被擴增的cDNA或基因部分選擇PCR引物??梢赃x擇引物來擴增cDNA、開放讀碼框、完整cDNA分子或完整基因序列中的小片段。為適應不同長度的引物,需要調整擴增條件;這種考慮是本領域的公知常識,并在Innis等(1990)、Sambrook等(1989)、和Ausubel等(1992)中有探討。僅作為舉例說明的方式,Seq.I.D.No.5所示的完整SBP2 cDNA分子可以利用下列組合引物擴增引物15’TGTAAAACGACGGCCAGTGAATT 3’(Seq.I.D.No.8)引物25’GATTACGCCAAGCTCGAAATTAA 3’(Seq.I.D.No.9)SBP2 cDNA的開放讀碼框部分可以用下列引物對擴增引物35’ATGGCGACCAGAGCCAAGCTTTCTTTA 3’(Seq.I.D.No.10)引物45’CGCAACAGCGCGACGACCACGCTCGCT 3’(Seq.I.D.No.11)編碼截短的SBP2蛋白質(從C-末端除去80個氨基酸)的cDNA可以用下列引物對擴增引物35’ATGGCGACCAGAGCCAAGCTTTCTTTA 3’(Seq.I.D.No.10)引物55’GAAGGGATGACCAGGAGGGACAACAAA 3’(Seq.I.D.No.12)SBP2的5’調節(jié)序列可以用下列引物對擴增引物65’TTGTAAACGACGGCCAGTGAATT 3’(Seq.I.D.No.13)引物75’GGTGAGGTCAGTGAGGAACAACA 3’(Seq.I.D.No.14)這些引物僅作為說明;本領域技術人員應當理解從已經提供的核酸序列中可以得到很多不同的引物,從而擴增這些分子的特別區(qū)域。推薦對這些擴增程序得出的PCR產物進行重新測序;它將有利于確定擴增序列,并將提供不同生態(tài)型和植物種群中該序列天然變異的信息。
來源于SBP2 cDNA或SBP1和SBP2 5’調節(jié)區(qū)的寡核苷酸包括在本發(fā)明的范圍內。這種寡核苷酸引物優(yōu)選包括來自SBP2 cDNA或基因序列的至少15-20個連續(xù)核苷酸的序列。為了增強擴增特異性,可以使用含有這些序列的至少25、30、35、40、45或50個連續(xù)核苷酸的寡核苷酸引物。
另外,可以利用來源于已公開的cDNA序列的引物,通過PCR擴增獲得SBP2基因序列,以便作為探針對基因組文庫或基因組DNA進行篩選,或者通過利用來源于SBP2 cDNA序列的標記探針對基因組DNA文庫進行篩選。這些研究中可以使用標準PCR擴增或雜交方法。實施例2從其它植物品種分離同源基因序列本文除提供大豆SBP2 cDNA、SBP5’調節(jié)區(qū),以及對SBP蛋白質、尤其是C-末端截短的SBP蛋白質進行修飾導致蔗糖攝取活性增強這一發(fā)現外,本發(fā)明還能夠從其他植物品種得到相應分子。因此,本發(fā)明可以從其他植物品種分離SBP2類似物,以及從其他植物品種生產效能增強的SBP蛋白質??梢允褂贸R?guī)雜交和PCR擴增方法從其他品種獲得相應的cDNA,以及制備編碼活性增強的SBP蛋白質的核酸。這兩種技術的共同之處在于來源于SBP2 cDNA或基因序列的探針或引物與目標核苷酸的雜交,在常規(guī)雜交研究中,它們可以是cDNA或基因組文庫;在PCR擴增情況下,它們可以是cDNA或基因組文庫或者是mRNA制品。
可以對從需要的植物品種制備的cDNA或基因組文庫進行直接PCR擴增,或者利用植物細胞的mRNA提取物采用標準方法進行RT-PCR。PCR引物包括SBP2 cDNA的至少15個連續(xù)核苷酸。本領域技術人員將能夠理解大豆SBP2 cDNA和將被擴增的目標核酸之間的序列差異可能導致擴增效率降低。為了彌補這一缺陷,在擴增循環(huán)中將使用較長的PCR引物或較低的退火溫度。應用較低的退火溫度時,在后續(xù)擴增循環(huán)中需應用嵌套引物對來增強特異型。
對于常規(guī)雜交,雜交探針優(yōu)選與可檢測標記例如放射性標記結合,并且探針優(yōu)選長度至少為20個核苷酸。如同本領域已知的,增加雜交探針的長度有助于增強特異性。來源于大豆SBP2 cDNA或基因序列的標記探針可以與植物cDNA或基因組文庫進行雜交,應用本領域已知的方法檢測雜交信號。然后純化雜交克隆或噬菌斑(依賴于使用的文庫的種類),從克隆或噬菌斑中分離和鑒別其中含有的克隆序列。
或者可以通過免疫篩選表達文庫來獲得大豆SBP2 cDNA的類似物。按照本文公開的SBP2核酸序列,可以在異源表達系統(例如,E.coli)中表達和純化該酶,用于生產對SBP2蛋白質特異的抗體(單克隆抗體或多克隆抗體)。也可以生產抗來源于本文提供的SBP2氨基酸序列的合成多肽的抗體。生產抗體的方法是本領域已知的,Harlow和Lane(1988)曾有描述。然后可以用這種抗體利用上述方法篩選表達cDNA文庫,該cDNA文庫是由需要從其中克隆SBP2定向進化同源物的植物制備的。選擇出來的cDNA可以通過測序和酶活性進行確定。
大豆SBP2基因或cDNA、以及其他植物來源的上述序列類似物,可以整合到轉化載體中,并導入植物,用以改變這種植物中的SBP活性,如下述實施例3中所描述。另外,如本文的指教,編碼經修飾的SBP蛋白質的核酸也可以用于生產蔗糖攝取活性改變的植物??梢灶A料,SBP基因自身啟動子特別適用于本發(fā)明的實踐,因它可以用于驅動SBP轉基因例如反義構建物的表達。通過利用SBP基因自身啟動子,并協同自身SBP基因(例如,在同樣的時序或組織特異性表達模式中)可以調節(jié)這些轉基因的表達。實施例3蔗糖攝取活性改變了的轉基因植物一旦分離出編碼涉及決定特定的植物特征的蛋白質的基因后,可以使用標準技術在轉基因植物中表達cDNA,以便改變上述特定的植物特征。基本研究是將cDNA克隆到轉化載體中,使它有效地與調控序列(例如,啟動子)連接,從而使cDNA在植物細胞中表達。然后從多種方法中選擇一種(例如,電穿孔),用于將轉化載體導入植物細胞,然后篩選含有被導入cDNA的子代植物。優(yōu)選所有或部分轉化載體穩(wěn)定整合到植物細胞的基因組中。整合到植物細胞并含有被導入的cDNA和控制表達的相關序列(導入的“轉基因”)的轉化載體部分,可以稱作重組表達盒序列。
可以通過檢測表現型的改變篩選含有被導入轉基因的子代植物。這種表現型可以直接來源于克隆到轉化載體中的cDNA,或者可以通過將可選擇標識基因整合到轉化載體中導致對某種化學試劑的抗性增強,從而驗證轉基因的導入。
調控序列(a)的選擇和cDNA(或者篩選出的部分cDNA)在轉化載體中相對于調控序列如何排列(b)的選擇,將在一定程度上決定由導入cDNA影響的植物特征如何改變。例如,調控序列可以是組織特異性的,從而cDNA只能在植物的特殊組織(例如,花粉、種子)中表達,因此由導入cDNA影響的特征僅在這些組織中有所改變。可以使cDNA轉錄物得以正常表達的方式相對于調控序列安排cDNA序列,或者將cDNA序列安排在反義方向上??寺DNA對應的反義RNA的表達將導致目標基因產物的減少(目標基因產物是由提供被導入cDNA的植物基因編碼的蛋白質)。被導入cDNA的過表達(是由載體中相對于調控序列正義方向上的cDNA產生的)可能導致基因產物水平的增加,或者導致該基因產物的共抑制(也稱為“有義抑制”)。
由克隆cDNA序列轉化導致植物特征改變的成功例子在技術和科學文獻中非常多。選擇用于說明本技術領域目前知識水平,通過參考引入本文的例子包括U.S.專利No.5451514,Boudet(利用反義RNA和共抑制改變木質素的合成);U.S.專利No.5443974,Hitz(利用反義RNA和共抑制改變飽和脂肪酸和不飽和脂肪酸的水平);U.S.專利No.5530192,Murase(利用反義RNA改變氨基酸和脂肪酸組成);U.S.專利No.5455167,Voelker(改變中鏈脂肪酸);U.S.專利No.5231020,Jorgensen(利用共抑制改變類黃酮);U.S.專利No.5583021,Dougherty(通過正義不可翻譯RNA的表達改變病毒抗性);WO96/13582(利用過表達、共抑制和反義RNA并協同ArabidopsisFAE1基因改變種子VLCFA的組成);WO95/15387(利用西蒙得木臘合成基因的過表達改變種子VLCFA的組成)。
這些例子包括以下描述轉化載體的選擇、轉化方法和設計用于過表達被導入cDNA或用于表達cDNA對應的反義RNA的構建體的構建。根據以前描述的和本文提供的SBP2基因和關于編碼具有增強的蔗糖攝取活性的改變SBP蛋白的核酸的指示,因此以下是顯而易見的,即本領域的技術人員能夠將這些核酸或這些分子的同源物或衍生形式(例如,反義形式)導入植物,從而生產在種子或其他組織形成過程中蔗糖攝取活性改變的植物。該結果可以改變具有農業(yè)和經濟重要性的植物。
a.植物種類按照本發(fā)明的核酸分子(例如,SBP2基因、編碼經修飾的SBP蛋白質的核酸、這些序列的同源物和例如反義形式的衍生物)可以導入任何植物類型,從而改變該植物的蔗糖攝取活性。因此,本發(fā)明的序列可以用于改變任何高等植物中的蔗糖攝取活性,包括單子葉植物和雙子葉植物,包括(但不限于)玉米、小麥、水稻、大麥、大豆、大多數豆類、蕓苔/canola、苜蓿、亞麻、向日葵、紅花、蔓菁、棉花、亞麻、花生、三葉草;蔬菜例如萵苣、番茄、葫蘆、土豆、胡羅卜、小羅卜、豌豆、兵豆、卷心菜、花椰菜、brussel sprouts、辣椒;樹木果實例如蘋果、梨、桃、杏;花例如康乃馨和玫瑰。
b.載體的構建、啟動子的選擇很多適于穩(wěn)定轉染植物細胞或者適于建立轉基因植物的重組載體已有描述,包括Pouwels等(1987);Weissbach和Weissbach(1989);和Gelvin等(1990)中描述的。典型地,植物轉化載體包括,在5’和3’調節(jié)序列的轉錄調控下的一種或多種克隆植物基因(或cDNA)和顯性可選擇標識基因。這種植物轉化載體典型地還含有啟動子調節(jié)區(qū)(例如,調控誘導或組成型的表達、環(huán)境調節(jié)或發(fā)育調節(jié)型的表達、或者細胞特異性或組織特異性表達的調控區(qū))、轉錄起始位點、核糖體結合位點、RNA加工信號、轉錄終止位點、和/或多聚腺苷化信號。
可以用于表達核酸的組成型啟動子的例子包括花椰菜花葉病毒(CaMV)35S啟動子,其在大多數植物組織中能夠啟動組成型的、高水平表達(參見例如,Odel等1985;Dekeyser等1990;Terada和Shimamoto,1990;Benfey和Chua.1990);胭脂堿合成酶啟動子(An等1988);以及章魚堿合成酶啟動子(Fromm等,1989)。
各種各樣受調節(jié)的以對環(huán)境、激素、化學物質、和/或發(fā)育信號進行應答的植物基因啟動子也可以用于在植物細胞中表達cDNA,包括受以下信號調節(jié)的啟動子(a)熱(Callis等,1988;Ainley,等1993;Gilmartin等1992);(b)光(例如,豌豆rbcS-3A啟動子,Kuhlemeier等,1993;玉米rbcS啟動子,Schaffner和Sheen,1991);(c)激素,例如脫落酸(Marcotte等,1989);(d)受傷(例如wunI,Siebertz等,1989);以及(e)化學物質例如甲基茉莉醇酯或水楊酸(也參見Gatz等,1997),它們也能夠用于調控基因表達。
或者,可以將組織(例如根、葉、花和種子)特異性啟動子(Carpenter等,1992;Denis等,1993;Opperman等,1993;Stockhause等,1997;Roshal等,1987;Schernthaner等,1988;和Bustos等,1989)融合到編碼序列中,以便獲得在各種器官中的特殊表達。另外,可以利用例如在衰老過程中(Gan和Amasino,1995)或種子形成后期(Odell等,1994)起作用的啟動子來調控表達時間。
本文公開的SBP1和SBP2基因的啟動子區(qū)賦予大豆在形成種子時的特異性表達。因此,這些啟動子可以用于使導入的轉基因在正在形成種子中獲得特異性表達。
植物轉化載體還可以包括RNA加工信號,例如,可以定位于轉基因中ORF的上游或下游的內含子。另外,表達載體還包括來源于植物基因3’-非翻譯區(qū)例如3’終止子區(qū)的附加調控序列,以便增加mRNA的穩(wěn)定性,例如土豆mRNA的PI-II終止子區(qū)或章魚堿或胭脂堿合成酶mRNA的3’終止子區(qū)。
最后,如上文的記載,植物轉化載體還可以包括顯性可選擇標記基因,其使得轉化體易于篩選。這類基因包括編碼抗生素抗性的基因(例如,對潮霉素、卡那霉素、博萊霉素、G418、鏈霉素或壯觀霉素抗性)以及除草劑抗性基因(例如,phosphinothricin乙?;D移酶)。
c.SBP序列在載體中的分布將按照所希望的所述序列的表達類型來選擇SBP序列在轉化載體中的特定排布。
如果需要增強植物的蔗糖攝取活性,SBP ORF可以有效地連接到組成型高水平啟動子例如CaMV 35S啟動子上。也可以通過將含有SBP2基因變異形式的轉化載體導入植物實現蔗糖攝取活性的改變,所述SBP2基因的變異形式可以是,例如從SBP2 ORF的準確核苷酸序列變化得到的形式,但其編碼的蛋白質保留了SBP2蛋白質的功能特征,即賦予蔗糖攝取活性。以舉例的方式說明,還可以利用編碼上述經修飾的SBP的核酸序列得到增強的蔗糖攝取活性。這種經修飾的SBP包括C-末端刪除的SBP,通常刪除10-100個氨基酸殘基,優(yōu)選約80個氨基酸殘基。
相反,可以通過將SBP基因序列的反義構建體導入植物實現轉基因植物中蔗糖攝取活性的降低。對于反義抑制,在轉化載體中SBP基因定位于相對于啟動子序列的反方向上。這種被導入的序列不必為全長SBP基因,不必完全同源于即將被轉化植物類型中存在的SBP基因。然而通常導入序列的長度越短,產生有效反義抑制越需要被導入序列與自身SBP序列同源性程度越高。載體中導入的反義序列長度優(yōu)選至少為30個核苷酸,同時普遍觀察到隨著反義序列長度增加,反義抑制作用越強。載體中反義序列的長度優(yōu)選超過100個核苷酸。所述反義構建體的轉錄導致RNA分子的產生,該RNA分子與植物細胞SBP基因轉錄得到的mRNA分子反向互補。雖然反義RNA分子干擾基因表達的準確機制還未曾闡述,然而可以相信反義RNA分子與mRNA分子結合,從而抑制內源mRNA的翻譯。
還可以利用核酶實現SBP基因表達的抑制。核酶是合成的RNA分子,其具有高度特異性核糖核酸內切酶活性。核酶的制備和應用公開在授權給Cech的美國專利No.4987071和授權給Haselhoff的美國專利No.5543508中。核酶序列在反義RNA中的包含可以用于使反義RNA具有RNA裂解活性,使得與反義RNA結合的內源mRNA分子裂解,從而導致內源基因表達的反義抑制增強。
SBP核酸(或其變異體)過表達的構建體也可以用于實現內源SBP基因的共抑制,作用方式如授權給Jorgensen的美國專利No.5231021中所述。這種共抑制(也稱為有義抑制)不需要將SBP基因導入植物細胞,也不需要被導入序列與內源性SBP基因完全等同。然而,與反義抑制同樣,有義抑制效能將隨著以下兩個因素增強(1)導入序列加長;和(2)導入序列和內源SBP基因序列間的序列相似性增加。
表達SBP mRNA的不可翻譯形式的構建體也可以用于抑制內源性SBP活性的表達。制備這種構建體的方法如授權給Dougherty等的美國專利No.5583021所述。優(yōu)選將未成熟終止密碼子導入SBP ORF來制備這種構建體。
最后,公開序列的顯性陰性突變體形式可以用于阻斷內源性SBP的活性。這種突變體需要制備與蔗糖結合但不催化蔗糖攝取的SBP蛋白質的突變形式。
d.轉化和再生方法目前單子葉和雙子葉植物細胞的轉化和再生都是常規(guī)技術,選擇最合適的轉化方法將由操作者決定。方法的選擇將隨著將被轉化的植物類型而改變;本領域技術人員將能夠認識到用于給定植物類型的特定方法的合適程度。合適的方法可以包括,但不限于植物原生質體的電穿孔;脂質體介導的轉化;聚乙二醇(PEG)介導的轉化;利用病毒的轉化;植物細胞的微注射;植物細胞的微發(fā)射轟擊;真空滲透;以及根瘤農桿菌(AT)介導的轉化。轉化和再生植物的典型程序在這部分開始處列出的專利文獻中有所描述。
c.轉化植物的篩選用轉化載體轉化和再生植物后,優(yōu)選利用整合到轉化載體中的顯性可選擇標記篩選轉化植物。通常,這種標記將使轉化植物的幼苗產生抗生素抗性,通過將幼苗與適當濃度的抗生素接觸實現轉化體的篩選。
當篩選出轉化植物并使之生長成熟后,可以用已知方法對它們進行分析,確定SBP活性是否由于導入了轉基因而改變。另外,可以通過分析Northern印跡上mRNA的表達,檢測內源性SBP基因的反義或有義抑制。實施例4序列變異體的制備如同上面的闡述,植物細胞中蔗糖攝取活性的改變可以通過用SBP2 cDNA或基因、SBP2 cDNA或基因序列的反義構建體、或編碼經修飾的SBP蛋白質的核酸序列轉化植物實現。對于本文提供的SBP2cDNA和基因序列以及SBP 5’調節(jié)區(qū),利用標準誘變方法制備這些序列的變異體在目前是可能的。
變異DNA分子包括由標準DNA誘變技術生產的DNA分子,例如,M13引物誘變。這些技術的細節(jié)在Sambrook等(1989),第15章中有提供。使用這種技術,可以制備與公開序列有較少差異的變異體。由本文特別公開的那些序列衍生而來的,由于核苷酸缺失、添加或取代導致與已公開序列不同但仍然編碼具有SBP蛋白功能特征(即,在酵母分析系統中介導蔗糖攝取)的蛋白質的DNA分子和核苷酸序列通過本發(fā)明可以得到理解。來源于已公開的SBP2 cDNA和基因序列的DNA分子和核苷酸序列包括,能夠在嚴謹條件下與已公開DNA序列或其片段雜交的DNA序列。
導致特定程度的嚴謹度的雜交條件將依賴于所選擇的雜交方法和使用的雜交DNA的組成和長度而改變。通常,雜交溫度和雜交緩沖液中的離子強度(尤其是Na+濃度)將決定雜交嚴謹度。得到特定程度的嚴謹度需要的雜交條件的計算由Sambrook等(1989),在第9和11章中討論,本文將其作為參考引入。僅僅作為舉例說明的方式,可以通過下述方法進行雜交試驗將DNA分子(例如,大豆SBP2 cDNA序列)和目標DNA分子(例如,番茄中相應的SBP2 cDNA序列)雜交,該目標DNA分子已經進行了瓊脂糖凝膠電泳,并通過Southern印跡(Southern,1975)轉移到硝基纖維素薄膜上,該技術是本領域已知技術,并在Sombrook等(1989)中有描述。如下述,利用[32P]dCTP標記目標探針的雜交通常在高離子強度例如6×SSC的溶液中進行,溫度為熔點溫度(Tm)以下20-25℃。對于這種在Southern印跡中目標DNA分子含10ng DNA或更多的Southern雜交試驗,利用12ng/ml放射標記探針(其比活性等于或高于109CPM/μg)進行雜交,典型進行68小時。雜交后,清洗硝基纖維素濾膜,除去背景雜交。清洗條件應當盡可能嚴緊,以便除去背景雜交同時保留特異雜交信號。術語Tm代表這樣一種溫度,在該溫度以上,在占優(yōu)勢的離子強度條件下,放射標記的探針分子將不與其目標DNA分子雜交。這種雜交分子Tm的可以從下列等式中推算(Bolton和McCatthy,1962)Tm=81.5C 16.6(log10[Na+])+0.41(%G+C)-0.63(%甲酰胺)(600/l)其中l(wèi)=雜交的堿基對的長度。
該等式對于Na+濃度在0.01M到0.4M范圍內有效,在更高[Na+]溶液中,計算Tm的準確性較低。該等式對于G+C含量在30%-75%范圍內的DNA也基本上有效,它應用于長度超過100個核苷酸的雜交體(寡核苷酸探針的行為在Sambrook等,1989,第11章中有詳細描述)。
因此,以舉例的方式,對于來源于大豆SBP2 cDNA開放讀碼框的前150個堿基對的150個堿基對DNA探針(假設%GC=45%),可以如下計算需要給出特定嚴謹度的雜交條件例如,假設濾膜在0.3×SSC溶液中漂洗,隨后雜交,由此[Na+]=0.045M;%GC=45%;甲酰胺濃度=0;l=150個堿基對;Tm=81.516(log10[Na+])+(0.41×45)(600/150),因此Tm=74.4 C。
對于雙鏈DNA,隨著同源性每降低1%,Tm則降低1-1.5℃(Bonner等,1973)。因此,對于這個假設的例子,雜交濾膜于59.4-64.4℃之間在0.3×SSC溶液中漂洗,將產生相當于90%的雜交嚴謹度?;蛘?,雜交濾膜于65.4-68.4℃的溫度之間,在0.3×SSC溶液中漂洗,將產生94%的雜交嚴謹度。上述例子是完全以理論說明的方式給出的。本領域技術人員將能夠理解,其它雜交技術也可以使用,試驗條件的改變將需要改變嚴謹度的計算。
來源于植物,編碼具有SBP活性,并在嚴謹度至少為75%、優(yōu)選至少80%、更優(yōu)選至少85%、還更優(yōu)選至少90%、最優(yōu)選至少95%的雜交條件下與已公開的SBP2序列雜交的DNA序列包括在本發(fā)明范圍內。
遺傳密碼的間并性進一步拓寬了本發(fā)明的范圍,因為它允許在保留被編碼蛋白的氨基酸序列的同時,使DNA分子的核苷酸序列中存在大量的變異。例如,大豆SBP2蛋白的第二個氨基酸殘基是丙氨酸。它在大豆SBP2開放讀碼框內由核苷酸密碼三聯體GCG編碼。由于遺傳密碼的間并性,其它三種核苷酸密碼三聯體-GCA、GCC和GCT也編碼丙氨酸。因此,大豆SBP2 ORF的核苷酸序列在該位置可以為這些三聯體密碼子的任意一個,而不影響編碼蛋白質的氨基酸組成或者蛋白質的特征?;谶z傳密碼的間并性,可以利用上述標準DNA誘變技術,或者通過合成DNA序列,從本文公開的cDNA和基因序列衍生出變異DNA分子。因此,本發(fā)明還包括編碼SBP蛋白的核酸序列,但該核酸序列是依據遺傳密碼的間并性從已公開的核酸序列得到的。
本發(fā)明指出可以通過修飾植物SBP序列,例如刪除C-末端80個氨基酸,實現蔗糖攝取活性的增加。本領域的技術人員將能夠認識到DNA誘變技術不僅可以用于制備變異DNA分子,還將促進這種經修飾的SBP蛋白的產生。另外,也可以進行氨基酸序列的其它改變,包括缺失、添加和取代。
引入氨基酸序列變異的位點是預先確定的,而突變本身不需要預先確定。例如,為了優(yōu)化對給定位點的突變,可以在目標密碼子或區(qū)域實施隨機誘變,然后篩選具有所需活性的優(yōu)化組合的表達蛋白質變異體。如上述在已知序列的DNA的預定位點進行替代突變的技術是公知的。
氨基酸取代典型為單殘基取代;插入通常為1到10個氨基酸殘基;刪除的范圍約為1到多于100個殘基。取代、刪除、插入或它們的任意組合可以混合使用,產生最終的構建體。顯然,在編碼蛋白質的DNA中進行的突變必須不在讀碼框序列內,并且最好不產生能夠生產二級mRNA結構的互補區(qū)。
取代變異體是氨基酸序列中至少一個殘基被除去,同時一個不同的殘基插入該位置的氨基酸序列。如果需要精確調節(jié)蛋白質的特征,通常按照下表1進行這種取代。表1顯示蛋白質中的原始氨基酸被取代的氨基酸,認為它是保守取代。
表1原始殘基 保守取代AlaSerArgLysAsngln;hisAspGluCysSerGlnAsnGluAspGlyProHisasn;glnIleleu;valLeuile;valLysarg;gln;gluMetleu;ilePhemet;leu;tyrSerthrThrserTrptyrTyrtrp;pheValile;leu通過選擇低于表1所列保守性的取代實現酶功能或其它特征的基本改變,即選擇在維持以下方面具有顯著不同作用的殘基(a)取代區(qū)的多肽骨架結構,例如,片層構型或螺旋構型;(b)分子在目標位點的電荷或疏水性;或(c)側鏈的空間體積。通常預期產生最大蛋白質性質改變的取代將是以下幾種情況的取代(a)親水殘基例如絲氨酰或蘇氨酰被(或由)疏水殘基例如亮氨酰、異亮氨酰、苯丙氨酰、纈氨?;虮滨H〈?;(b)半胱氨酸或脯氨酸被(或由)任何其它殘基取代;(c)具有正電荷的殘基例如賴氨酰、精氨?;蚪M氨酰被(或由)負電荷殘基例如谷氨?;蛱於滨H〈?;或(d)具有大空間體積側鏈的殘基例如苯丙氨酸被(或由)無側鏈的殘基例如甘氨酸取代。
可以通過分析衍生蛋白質在上述酵母分析系統中催化蔗糖攝取的能力,評價這些氨基酸取代或缺失或添加對SBP蛋白衍生物的作用。實施例5SBP 5’調節(jié)區(qū)調控轉基因表達的應用甘氨酸SBP1和SBP2基因的啟動子賦予種子形成中特異性表達。因此,Seq.I.D.Nos.7(SBP2)和8(SBP1)所示的啟動子序列可以用于制備在正在形成的種子中特異性表達的轉基因構建體。本領域技術人員將能夠認識到,可以用比Seq.I.D.Nos.7和8所示的完全5’調節(jié)區(qū)更少的調節(jié)序列實現在正在形成的種子中調節(jié)轉基因表達。因此,例如,種子形成中的特異性表達可以通過應用已公開啟動子序列的50個堿基對或100個堿基對實現。利用已知方法將能夠確定已公開序列的特定小片段是否能夠在特定系統中(考慮構建體將被導入其中的植物品種,所需的表達水平等)操縱有效的種子特異性表達,例如將小片段啟動子與標識基因(例如GUS)有效地連接起來,將這種構建體導入植物,然后確定在正在形成的種子和其它植物組織中標識基因的表達水平。
因此本發(fā)明有利于通過標準分子生物學方法制備含有有效地與核酸序列例如開放讀碼框連接的SBP1或SBP2啟動子序列的核酸分子。合適的開放讀碼框包括編碼任何期望在正在形成的種子中表達的蛋白質的開放讀碼框。在已公開的SBP啟動子的調控下,適于以種子特異性方式表達的基因的例子包括,但不限于(1)增強種子的營養(yǎng)質量的基因,例如通過增加包括賴氨酸、蛋氨酸和半胱氨酸在內的限制性氨基酸的含量。這可以通過在種子中表達含高水平的這類氨基酸的蛋白質實現。這樣的例子包括來自巴西堅果(Saalbach等,1996)和向日葵(Molvig等,1997)的高蛋氨酸儲備蛋白。
(2)增加小麥中麥麩的基因,從而提高該種小麥粉制作的面包的質量(Shewry等1995)。
(3)增強種子中昆蟲抗性(例如,象鼻蟲抗性)的基因。適當的基因包括殺死象鼻蟲卵的α-淀粉酶抑制劑基因(Schmidt,1994)。
參考文獻Ainley等(1993)植物分子生物學2213-23Altschul和Gish.(1996)酶學方法266460-80Altschul等(1990)基本定位排列的檢索工具,分子生物學雜志215403-410Altschul等(1994)自然遺傳(Nature Genet.),6119-29An等(1988)植物生理88547Ausubel等(1987)當前分子生物學方法,Greene出版學會和Wiley-IntersciencesAusubel等編,當前分子生物學方法,John Wiley和Sons,New York,1994Benfey和Chua(1990)科學250959-966Birch等(1997)植物生理和植物分子生物學年度綜述48297-326Bolton和McCarthy(1962)美國國家科學院進展481390Bonner等(1973)分子生物學雜志81123Bush(1993)植物生理和植物分子生物學年度綜述44513-542Bustos等(1989)植物細胞1839Callis等(1988)植物生理88965Carpenter等(1992)植物細胞4557-571Corpet等(1988)核酸研究1610881-90Dekeyser等(1990)植物細胞2591Denis等(1993)植物生理1011295-1304Fromm等(1989)植物細胞1977Gan和Amansino(1995)科學2701986-1988Gatz等(1977)植物生理和植物分子生物學年度綜述4889-108
Gelvin等(1990)植物分子生物學手冊,Kluwer AcademicPublishers出版Gietz等(1992)核酸研究201425Gilmartin等(1992)植物細胞4839-949Grimes等(1992)植物細胞41561-1574Harlow和Lane(1988)抗體,試驗室手冊,冷泉港實驗室,紐約Higgins和Sharp(1988)基因73237-244Higgins和Sharp(1989)CABIOS 5151-153Huang等(1992)計算機在生物科學中的應用8155-65Innis等(1990)PCR草案,方法和應用指南Innis等(編),AcademicPress,Inc.,San Diego,CaliforniaKawasaki等(1990)PCR草案,方法和應用指南,Innis等(編),2127,Academic Press,Inc.,San Diego,CaliforniaKuhlemeier等(1989)植物細胞1471Meyer和Horgan(1996)植物生理和植物分子生物學年度綜述4723-48Meyers和Miller(1988)計算機在生物科學中的應用411-17Molvig等(1997)美國國家科學院進展948393-8398Needleman和Wunsch(1970)分子生物學雜志48443Odel等(1985)自然313810Odell等(1994)植物生理106447-458Opperman等(1993)科學263221-223Overvoorde和Grimes(1994)生物化學雜志26915154-15161Overvoorde等(1996)植物細胞8271-280Pearson和Lipman(1988)美國國家科學院進展852444Pearson等(1994)分子生物學方法24307-31Pouwels等(1987)克隆載體實驗室手冊1985,增刊Riesmeier等(1992)EMBO雜志114705-4713Ripp等(1988)植物生理881435-1445Roshal等(1987)EMBO雜志61155
Saalbach等(1996)植物生理112975-985Sambrook等(1989)分子克隆試驗室手冊,冷泉港實驗室,紐約Schaffner和Sheen(1991)植物細胞3997Schernthaner等(1988)EMBO雜志71249Schmidt(1994)科學265739Shewry等(1995)植物細胞7945-956Siebertz等(1989)植物細胞1961Smith和Waterman(1981)應用數學進展2482Southern(1975)分子生物學雜志98Southern等(1982)分子應用遺傳學雜志(J.Mol.Appl.Genet.)1327-341Stockhause等(1997)植物細胞9479-489Terada和Shimamoto(1990)分子和基因遺傳學(Mol.Gen.Genet.)220389Tijssen(1993)生物化學和分子生物學實驗室技術--與核酸探針的雜交,第1部分第2章“雜交原理概述和核酸探針的分析方法”,Elsevier,New York.
Weissbach和Weissbach(1989)植物分子生物學方法,AcademicPress
序列表(1)一般資料(i)申請人Grimes(ii)發(fā)明題目蔗糖結合蛋白(iii)序列數15(iv)通訊地址(A)收件人Klarquist Sparkman Campbell Leigh &Whinston,LLP(B)街道One World Trade Center121 S.W.Salmon StreetSuite 1600(C)城市Portland(D)州Oregon(E)國家美國(F)郵政編碼97204-2988(v)計算機可讀形式(A)介質類型軟盤,3-1/2英寸(B)計算機IBM PC可兼容機(C)操作系統Windows NT(D)軟件Word 97 & ASCII(vi)目前的申請資料(A)申請?zhí)?B)申請日(C)分類號(vii)在先申請資料(A)申請?zhí)?0/047568(B)申請日1997.5.22(C)分類號(viii)代理人/代理資料(A)姓名David J.Earp
(B)登記號41401(C)資料/文檔號4630-50206/KJE(ix)通訊資料(A)電話(503)226-7391(B)傳真(503)228-9446(2)SEQ ID NO1的資料(i)序列特征(A)長度524(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO1Met Gly Met Arg Thr Lys Leu Ser Leu Ala Ile Phe Phe Phe Phe1 5 10 15Leu Leu Ala Leu Phe Ser Asn Leu Ala Phe Gly Lys Cys Lys Glu20 25 30Thr Glu Val Glu Glu Glu Asp Pro Glu Leu Val Thr Cys Lys His35 40 45Gln Cys Gln Gln Gln Gln Gln Tyr Thr Glu Gly Asp Lys Arg Val50 55 60Cys Leu Gln Ser Cys Asp Arg Tyr His Arg Met Lys Gln Glu Arg65 70 75Glu Lys Gln Ile Gln Glu Glu Thr Arg Glu Lys Lys Glu Glu Glu80 85 90Ser Arg Glu Arg Glu Glu Glu Gln Gln Glu Gln His Glu Glu Gln95 100 105Asp Glu Asn Pro Tyr Ile Phe Glu Glu Asp Lys Asp Phe Glu Thr110 115 120Arg Val Glu Thr Glu Gly Gly Arg Ile Arg Val Leu Lys Lys Phe125 130 135Thr Glu Lys Ser Lys Leu Leu Gln Gly Ile Glu Asn Phe Arg Leu140 145 150Ala Ile Leu Glu Ala Arg Ala His Thr Phe Val Ser Pro Arg His155 160 165Phe Asp Ser Glu Val Val Phe Phe Asn Ile Lys Gly Arg Ala Val170 175 180Leu Gly Leu Val Ser Glu Ser Glu Thr Glu Lys Ile Thr Leu Glu185 190 195Pro Gly Asp Met Ile His Ile Pro Ala Gly Thr Pro Leu Tyr Ile200 205 210Val Asn Arg Asp Glu Asn Asp Lys Leu Phe Leu Ala Met Leu His215 220 225Ile Pro Val Ser Val Ser Thr Pro Gly Lys Phe Glu Glu Phe Phe230 235 240Ala Pro Gly Gly Arg Asp Pro Glu Ser Val Leu Ser Ala Phe Ser245 250 255Trp Asn Val Leu Gln Ala Ala Leu Gln Thr Pro Lys Gly Lys Leu260 265 270Glu Asn Val Phe Asp Gln Gln Asn Glu Gly Ser Ile Phe Arg Ile275 280 285Ser Arg Glu Gln Val Arg Ala Leu Ala Pro Thr Lys Lys Ser Ser290 295 300Trp Trp Pro Phe Gly Gly Glu Ser Lys Pro Gln Phe Asn Ile Phe305 310 315Ser Lys Arg Pro Thr Ile Ser Asn Gly Tyr Gly Arg Leu Thr Glu320 325 330Val Gly Pro Asp Asp Asp Glu Lys Ser Trp Leu Gln Arg Leu Asn335 340 345Leu Met Leu Thr Phe Thr Asn Ile Thr Gln Arg Ser Met Ser Thr350 355 360Ile His Tyr Asn Ser His Ala Thr Lys Ile Ala Leu Val Ile Asp365 370 375Gly Arg Gly His Leu Gln Ile Ser Cys Pro His Met Ser Ser Arg380 385 390Ser Ser His Ser Lys His Asp Lys Ser Ser Pro Ser Tyr His Arg395 400 405Ile Ser Ser Asp Leu Lys Pro Gly Met Val Phe Val Val Pro Pro410 415 420Gly His Pro Phe Val Thr Ile Ala Ser Asn Lys Glu Asn Leu Leu425 430 435Met Ile Cys Phe Glu Val Asn Ala Arg Asp Asn Lys Lys Phe Thr440 445 450Phe Ala Gly Lys Asp Asn Ile Val Ser Ser Leu Asp Asn Val Ala455 460 465Lys Glu Leu Ala Phe Asn Tyr Pro Ser Glu Met Val Asn Gly Val470 475 480Phe Leu Leu Gln Arg Phe Leu Glu Arg Lys Leu Ile Gly Arg Leu485 490 495Tyr His Leu Pro His Lys Asp Arg Lys Glu Ser Phe Phe Phe Pro500 505 510Phe Glu Leu Pro Arg Glu Glu Arg Gly Arg Arg Ala Asp Ala515 520(2)SEQ ID NO2的資料(i)序列特征(A)長度444(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO2Met Gly Met Arg Thr Lys Leu Ser Leu Ala Ile Phe Phe Phe Phe5 10 15Leu Leu Ala Leu Phe Ser Asn Leu Ala Phe Gly Lys Cys Lys Glu20 25 30Thr Glu Val Glu Glu Glu Asp Pro Glu Leu Val Thr Cys Lys His35 40 45Gln Cys Gln Gln Gln Gln Gln Tyr Thr Glu Gly Asp Lys Arg Val50 55 60Cys Leu Gln Ser Cys Asp Arg Tyr His Arg Met Lys Gln Glu Arg65 70 75Glu Lys Gln Ile Gln Glu Glu Thr Arg Glu Lys Lys Glu Glu Glu80 85 90Ser Arg Glu Arg Glu Glu Glu Gln Gln Glu Gln His Glu Glu Gln95 100 105Asp Glu Asn Pro Tyr Ile Phe Glu Glu Asp Lys Asp Phe Glu Thr110 115 120Arg Val Glu Thr Glu Gly Gly Arg Ile Arg Val Leu Lys Lys Phe125 130 135Thr Glu Lys Ser Lys Leu Leu Gln Gly Ile Glu Asn Phe Arg Leu140 145 150Ala Ile Leu Glu Ala Arg Ala His Thr Phe Val Ser Pro Arg His155 160 165Phe Asp Ser Glu Val Val Phe Phe Asn Ile Lys Gly Arg Ala Val170 175 180Leu Gly Leu Val Ser Glu Ser Glu Thr Glu Lys Ile Thr Leu Glu185 190 195Pro Gly Asp Met Ile His Ile Pro Ala Gly Thr Pro Leu Tyr Ile200 205 210Val Asn Arg Asp Glu Asn Asp Lys Leu Phe Leu Ala Met Leu His215 220 225Ile Pro Val Ser Val Ser Thr Pro Gly Lys Phe Glu Glu Phe Phe230 235 240Ala Pro Gly Gly Arg Asp Pro Glu Ser Val Leu Ser Ala Phe Ser245 250 255Trp Asn Val Leu Gln Ala Ala Leu Gln Thr Pro Lys Gly Lys Leu260 265 270Glu Asn Val Phe Asp Gln Gln Asn Glu Gly Ser Ile Phe Arg Ile275 280 285Ser Arg Glu Gln Val Arg Ala Leu Ala Pro Thr Lys Lys Ser Ser290 295 300Trp Trp Pro Phe Gly Gly Glu Ser Lys Pro Gln Phe Asn Ile Phe305 310 315Ser Lys Arg Pro Thr Ile Ser Asn Gly Tyr Gly Arg Leu Thr Glu320 325 330Val Gly Pro Asp Asp Asp Glu Lys Ser Trp Leu Gln Arg Leu Asn335 340 345Leu Met Leu Thr Phe Thr Asn Ile Thr Gln Arg Ser Met Ser Thr350 355 360Ile His Tyr Asn Ser His Ala Thr Lys Ile Ala Leu Val Ile Asp365 370 375Gly Arg Gly His Leu Gln Ile Ser Cys Pro His Met Ser Ser Arg380 385 390Ser Ser His Ser Lys His Asp Lys Ser Ser Pro Ser Tyr His Arg395 400 405Ile Ser Ser Asp Leu Lys Pro Gly Met Val Phe Val Val Pro Pro410 415 420Gly His Pro Phe Val Thr Ile Ala Ser Asn Lys Glu Asn Leu Leu425 430 435Met Ile Cys Phe Glu Val Asn Ala Arg440(2)SEQ ID NO3的資料(i)序列特征(A)長度489(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO3Met Ala Thr Arg Ala Lys Leu Ser Leu Ala Ile Phe Leu Phe Phe5 10 15Leu Leu Ala Leu Ile Ser Asn Leu Ala Leu Gly Lys Leu Lys Glu20 25 30Thr Glu Val Glu Glu Asp Pro Glu Leu Val Thr Cys Lys His Gln35 40 45Cys Gln Gln Gln Arg Gln Tyr Thr Glu Ser Asp Lys Arg Thr Cys50 55 60Leu Gln Gln Cys Asp Ser Met Lys Gln Glu Arg Glu Lys Gln Val65 70 75Glu Glu Glu Thr Arg Glu Lys Glu Glu Glu His Gln Glu Gln His80 85 90Glu Glu Glu Glu Asp Glu Asn Pro Tyr Val Phe Glu Glu Asp Lys95 100 105Asp Phe Ser Thr Arg Val Glu Thr Glu Gly Gly Ser Ile Arg Val110 115 120Leu Lys Lys Phe Thr Glu Lys Ser Lys Leu Leu Gln Gly Ile Glu125 130 135Asn Phe Arg Leu Ala Ile Leu Glu Ala Arg Ala His Thr Phe Val140 145 150Ser Pro Arg His Phe Asp Ser Glu Val Val Leu Phe Asn Ile Lys155 160 165Gly Arg Ala Val Leu Gly Leu Val Arg Glu Ser Glu Thr Glu Lys170 175 180Ile Thr Leu Glu Pro Gly Asp Met Ile His Ile Pro Ala Gly Thr185 190 195Pro Leu Tyr Ile Val Asn Arg Asp Glu Asn Glu Lys Leu Leu Leu200 205 210Ala Met Leu His Ile Pro Val Ser Thr Pro Gly Lys Phe Glu Glu215 220 225Phe Phe Gly Pro Gly Gly Arg Asp Pro Glu Ser Val Leu Ser Ala230 235 240Phe Ser Trp Asn Val Leu Gln Ala Ala Leu Gln Thr Pro Lys Gly245 250 255Lys Leu Glu Arg Leu Phe Asn Gln Gln Asn Glu Gly Ser Ile Phe260 265 270Lys Ile Ser Arg Glu Arg Val Arg Ala Leu Ala Pro Thr Lys Lys275 280 285Ser Ser Trp Trp Pro Phe Gly Gly Glu Ser Lys Ala Gln Phe Asn290 295 300Ile Phe Ser Lys Arg Pro Thr Phe Ser Asn Gly Tyr Gly Arg Leu305 310 315Thr Glu Val Gly Pro Asp Asp Glu Lys Ser Trp Leu Gln Arg Leu320 325 330Asn Leu Met Leu Thr Phe Thr Asn Ile Thr Gln Arg Ser Met Ser335 340 345Thr Ile His Tyr Asn Ser His Ala Thr Lys Ile Ala Leu Val Met350 355 360Asp Gly Arg Gly His Leu Gln Ile Ser Cys Pro His Met Ser Ser365 370 375Arg Ser Asp Ser Lys His Asp Lys Ser Ser Pro Ser Tyr His Arg380 385 390Ile Ser Ala Asp Leu Lys Pro Gly Met Val Phe Val Val Pro Pro395 400 405Gly His Pro Phe Val Thr Ile Ala Ser Asn Lys Glu Asn Leu Leu410 415 420Ile Ile Cys Phe Glu Val Asn Val Arg Asp Asn Lys Lys Phe Thr425 430 435Phe Ala Gly Lys Asp Asn Ile Val Ser Ser Leu Asp Asn Val Ala440 445 450Lys Glu Leu Ala Phe Asn Tyr Pro Ser Glu Met Val Asn Gly Val455 460 465Ser Glu Arg Lys Glu Ser Leu Phe Phe Pro Phe Glu Leu Pro Ser470 475 480Glu Glu Arg Gly Arg Arg Ala Val Ala485(2)SEQ ID NO4的資料(i)序列特征(A)長度409(B)類型氨基酸(C)鏈型單鏈(D)拓撲結構線性(ii)分子類型蛋白質(xi)序列描述SEQ ID NO4Met Ala Thr Arg Ala Lys Leu Ser Leu Ala Ile Phe Leu Phe Phe5 10 15Leu Leu Ala Leu Ile Ser Asn Leu Ala Leu Gly Lys Leu Lys Glu20 25 30Thr Glu Val Glu Glu Asp Pro Glu Leu Val Thr Cys Lys His Gln35 40 45Cys Gln Gln Gln Arg Gln Tyr Thr Glu Ser Asp Lys Arg Thr Cys50 55 60Leu Gln Gln Cys Asp Ser Met Lys Gln Glu Arg Glu Lys Gln Val65 70 75Glu Glu Glu Thr Arg Glu Lys Glu Glu Glu His Gln Glu Gln His80 85 90Glu Glu Glu Glu Asp Glu Asn Pro Tyr Val Phe Glu Glu Asp Lys95 100 105Asp Phe Ser Thr Arg Val Glu Thr Glu Gly Gly Ser Ile Arg Val110 115 120Leu Lys Lys Phe Thr Glu Lys Ser Lys Leu Leu Gln Gly Ile Glu125 130 135Asn Phe Arg Leu Ala Ile Leu Glu Ala Arg Ala His Thr Phe Val140 145 150Ser Pro Arg His Phe Asp Ser Glu Val Val Leu Phe Asn Ile Lys155 160 165Gly Arg Ala Val Leu Gly Leu Val Arg Glu Ser Glu Thr Glu Lys170 175 180Ile Thr Leu Glu Pro Gly Asp Met Ile His Ile Pro Ala Gly Thr185 190 195Pro Leu Tyr Ile Val Asn Arg Asp Glu Asn Glu Lys Leu Leu Leu200 205 210Ala Met Leu His Ile Pro Val Ser Thr Pro Gly Lys Phe Glu Glu215 220 225Phe Phe Gly Pro Gly Gly Arg Asp Pro Glu Ser Val Leu Ser Ala230 235 240Phe Ser Trp Asn Val Leu Gln Ala Ala Leu Gln Thr Pro Lys Gly245 250 255Lys Leu Glu Arg Leu Phe Asn Gln Gln Asn Glu Gly Ser Ile Phe260 265 270Lys Ile Ser Arg Glu Arg Val Arg Ala Leu Ala Pro Thr Lys Lys275 280 285Ser Ser Trp Trp Pro Phe Gly Gly Glu Ser Lys Ala Gln Phe Asn290 295 300Ile Phe Ser Lys Arg Pro Thr Phe Ser Asn Gly Tyr Gly Arg Leu305 310 315Thr Glu Val Gly Pro Asp Asp Glu Lys Ser Trp Leu Gln Arg Leu
320 325 330Asn Leu Met Leu Thr Phe Thr Asn Ile Thr Gln Arg Ser Met Ser335 340 345Thr Ile His Tyr Asn Ser His Ala Thr Lys Ile Ala Leu Val Met350 355 360Asp Gly Arg Gly His Leu Gln Ile Ser Cys Pro His Met Ser Ser365 370 375Arg Ser Asp Ser Lys His Asp Lys Ser Ser Pro Ser Tyr His Arg380 385 390Ile Ser Ala Asp Leu Lys Pro Gly Met Val Phe Val Val Pro Pro395 400 405Gly His Pro Phe(2)SEQ ID NO5的資料(i)序列特征(A)長度1924(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO5TGTAAAACGA CGGCCAGTGA ATTGTAATAC GACTCACTAT AGGGCGAATT50GGGTACCGGG CCCCCCCTCG AGGTCGACGG TATCGATAAG CTTGATTTTG 100TTCCTCACTG ACCTCACC ATG GCG ACC AGA GCC AAG CTT TCT TTA 145Met Ala Thr Arg Ala Lys Leu Ser Leu5GCT ATC TTC CTT TTC TTT CTT TTA GCC TTG ATT TCA AAC CTA GCC 190Ala Ile Phe Leu Phe Phe Leu Leu Ala Leu Ile Ser Asn Leu Ala10 15 20TTG GGC AAA CTT AAA GAA ACC GAG GTC GAA GAA GAT CCC GAG CTC 235Leu Gly Lys Leu Lys Glu Thr Glu Val Glu Glu Asp Pro Glu Leu25 30 35GTA ACA TGC AAA CAC CAG TGC CAA CAG CAA CGG CAA TAC ACT GAG 280Val Thr Cys Lys His Gln Cys Gln Gln Gln Arg Gln Tyr Thr Glu40 45 50AGT GAC AAG CGA ACA TGC TTG CAA CAA TGT GAC AGT ATG AAG CAA 325Ser Asp Lys Arg Thr Cys Leu Gln Gln Cys Asp Ser Met Lys Gln55 60 65GAG CGA GAG AAA CAA GTC GAA GAG GAA ACT CGC GAG AAG GAA GAA 370Glu Arg Glu Lys Gln Val Glu Glu Glu Thr Arg Glu Lys Glu Glu70 75 80GAA CAT CAA GAG CAG CAT GAG GAG GAG GAA GAC GAA AAT CCC TAC 415Glu His Gln Glu Gln His Glu Glu Glu Glu Asp Glu Asn Pro Tyr85 90 95GTT TTT GAA GAA GAT AAG GAT TTT TCG ACC AGA GTC GAA ACA GAA 460Val Phe Glu Glu Asp Lys Asp Phe Ser Thr Arg Val Glu Thr Glu100 105 110GGT GGC AGC ATT CGG GTT CTC AAG AAG TTC ACT GAG AAA TCC AAG 505Gly Gly Ser Ile Arg Val Leu Lys Lys Phe Thr Glu Lys Ser Lys115 120 125CTT CTT CAA GGC ATT GAG AAT TTC CGT TTG GCC ATC TTA GAA GCT 550Leu Leu Gln Gly Ile Glu Asn Phe Arg Leu Ala Ile Leu Glu Ala130 135 140AGA GCA CAC ACG TTC GTG TCC CCA CGC CAC TTT GAT TCC GAG GTT595Arg Ala His Thr Phe Val Ser Pro Arg His Phe Asp Ser Glu Val145 150 155GTC TTG TTC AAC ATT AAG GGG AGA GCC GTA CTT GGG TTG GTG AGG640Val Leu Phe Asn Ile Lys Gly Arg Ala Val Leu Gly Leu Val Arg160 165 170GAA AGT GAA ACA GAA AAA ATC ACC CTA GAA CCT GGA GAC ATG ATA685Glu Ser Glu Thr Glu Lys Ile Thr Leu Glu Pro Gly Asp Met Ile175 180 185CAC ATA CCA GCA GGC ACA CCA CTG TAC ATC GTT AAC AGA GAT GAG730His Ile Pro Ala Gly Thr Pro Leu Tyr Ile Val Asn Arg Asp Glu190 195 200AAT GAG AAG CTC CTC CTT GCC ATG CTC CAT ATA CCT GTC TCT ACT775Asn Glu Lys Leu Leu Leu Ala Met Leu His Ile Pro Val Ser Thr205 210 215CCT GGA AAA TTT GAG GAA TTT TTC GGG CCT GGA GGA CGA GAC CCA820Pro Gly Lys Phe Glu Glu Phe Phe Gly Pro Gly Gly Arg Asp Pro220 225 230GAA TCG GTC CTC TCA GCA TTC AGC TGG AAT GTG CTG CAA GCT GCG865Glu Ser Val Leu Ser Ala Phe Ser Trp Asn Val Leu Gln Ala Ala235 240 245CTC CAA ACC CCA AAA GGA AAG TTA GAA AGG CTT TTT AAT CAA CAG910Leu Gln Thr Pro Lys Gly Lys Leu Glu Arg Leu Phe Asn Gln Gln250 255 260AAC GAG GGA AGT ATT TTC AAA ATA AGC AGA GAA CGG GTG CGT GCG955Asn Glu Gly Ser Ile Phe Lys Ile Ser Arg Glu Arg Val Arg Ala265 270 275TTG GCC CCC ACC AAG AAA AGC TCT TGG TGG CCA TTC GGC GGC GAA 1000Leu Ala Pro Thr Lys Lys Ser Ser Trp Trp Pro Phe Gly Gly Glu280 285 290TCC AAG GCT CAA TTC AAT ATT TTC AGC AAG CGT CCC ACT TTC TCC 1045Ser Lys Ala Gln Phe Asn Ile Phe Ser Lys Arg Pro Thr Phe Ser295 300 305AAC GGA TAT GGC CGT TTA ACT GAA GTT GGT CCT GAT GAT GAA AAG 1090Asn Gly Tyr Gly Arg Leu Thr Glu Val Gly Pro Asp Asp Glu Lys310 315 320AGT TGG CTT CAA AGA CTC AAC CTC ATG CTT ACC TTT ACC AAC ATC 1165Ser Trp Leu Gln Arg Leu Asn Leu Met Leu Thr Phe Thr Asn Ile325 330 335ACC CAG AGA TCT ATG AGT ACT ATT CAC TAC AAC TCA CAT GCA ACG 1180Thr Gln Arg Ser Met Ser Thr Ile His Tyr Asn Ser His Ala Thr340 345 350AAG ATA GCA CTG GTG ATG GAT GGT AGA GGG CAT CTT CAA ATA TCA 1225Lys Ile Ala Leu Val Met Asp Gly Arg Gly His Leu Gln Ile Ser355 360 365TGT CCA CAC ATG TCA TCA AGG TCA GAC TCA AAG CAT GAT AAG AGT 1270Cys Pro His Met Ser Ser Arg Ser Asp Ser Lys His Asp Lys Ser370 375 380AGC CCC TCA TAC CAT AGA ATC AGT GCG GAC TTG AAG CCT GGA ATG1315Ser Pro Ser Tyr His Arg Ile Ser Ala Asp Leu Lys Pro Gly Met385 390 395GTG TTT GTT GTC CCT CCT GGT CAT CCC TTC GTC ACT ATA GCT TCC1360Val Phe Val Val Pro Pro Gly His Pro Phe Val Thr Ile Ala Ser400 405 410AAT AAA GAG AAT CTC CTC ATA ATT TGC TTC GAG GTT AAC GTT CGA1405Asn Lys Glu Asn Leu Leu Ile Ile Cys Phe Glu Val Asn Val Arg415 420 425GAC AAC AAG AAG TTT ACG TTT GCA GGG AAG GAC AAC ATT GTG AGC1450Asp Asn Lys Lys Phe Thr Phe Ala Gly Lys Asp Asn Ile Val Ser430 435 440TCT CTG GAC AAC GTA GCT AAG GAG CTG GCC TTT AAC TAT CCT TCT1495Ser Leu Asp Asn Val Ala Lys Glu Leu Ala Phe Asn Tyr Pro Ser445 450 455GAG ATG GTG AAC GGA GTC TCC GAA AGA AAG GAG AGT CTC TTT TTC1540Glu Met Val Asn Gly Val Ser Glu Arg Lys Glu Ser Leu Phe Phe460 465 470CCC TTC GAG TTG CCG AGC GAG GAG CGT GGT CGT CGC GCT GTT GCG 1585Pro Phe Glu Leu Pro Ser Glu Glu Arg Gly Arg Arg Ala Val Ala475 480 485TGA GAAGCAGTGT GGAGGTGGCT GATAACGGGG AATGTATTTA GCTTTGAGAG 1638TCTTTAAATT TTCTGTATTT GTTGTAATGT TAGTAGTTCC TTAAATTGGC 1688CAGATGGAGT TTATGTGTTT GTAAATGCAG GGATGCTAAC GGAATAAAAT 1738GGCCACTTGT ATTGCTAAAG AAAAAAACCA GCCCGGGCCG TCGACCACGC 1788GTGCCCTATA GTGAGTCGTA TTACAATCGA ATTCCTGCAG CCCGGGGGAT 1838CCACTAGTTC TAGAGCGGCC GCCACCGCGG TGGAGCTCCA GCTTTTGTTC 1888CCTTTAGTGA GGGTTAATTT CGAGCTTGGC GTAATC 1924(2)SEQ ID NO6的資料(i)序列特征(A)長度3718(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO6TTGTAAACGA CGGCCAGTGA ATTGTAATAC GACTCACTAT AGGGCGAATT 50GGGTACCGGG CCCCCCCTCG AGGTCGACGG TATCGATAAG CTTGATTGTA 100ATACGACTCA CTATAGGGCA CGCGTGGTCG ACGGCCCGGG CTGGTCTGAG 150AAACTCATTA GGCACTGGAA AATTCTCAAA GGAAATAATG TGAGTCAGCC 200AATTCAAACC CACCATATCT TTATTAATTT CACTTTTTTC TTTATTTTAT 250AATTTTTAGT CTCACAGTCA CACATTTTAA CAGGYYATGA TAACAAGGGG 300CAAAGATAAG GGTGAGACCG GGATTATAAA GCGTGTCATT CGCTCTCAAA 350ATCGTGTCAT TGTAGAGAGT AAAAACCTGG TGAGAGATAT TATCATCACA 400ATTTGGTCCT TCTGTTTTTC TAATGCCCTA TCTTCCTTAG ATTATGTTTT 450CAATTCCACT GTCAATGTGT CTTGCATCAG AATATTAATC AATTGTGACA 500TTGAGCATGT GATTGTGTAA ATTTTCCTGA TAGGTTTCTC ACTCCAATGC 550CTTTTGTCAT CCTCTTTATA GGTAAAGAAG CATATAAAGC AAGGGCAAGG 600TCATGAAGGG GGCATCTTTA CAGTGGAAGC CCCACTGCAT GCCTCCAATG 650TGCAAGTTCT TGACCCAGTG ACAGGGTATG TCATTGTTCA GATATTGAAC 700TGGTGATTGC ATCTCCAAAC GGGATAACAT CATTAACATG TATGAAAGTA 750AGAGTTACCA ACTTTTACTT GTGCAGCAAG CCTTGCAAGG TTGGAGTTAA 800ATATCTTGAA GATGGTACTA AAGTCAGAGT GTCCAGAGGA ATAGGAACCT 850CAGGGTCCAT AGTCCCTCGT CCTGAGATTT TAAAGATAAG AACTACCCCA 900AGACCTGCAG TCCGTAAGTA TCTAACAAGC TTAATTATGC TTTTTCATGT .950ATGAGTTGTT GACAAAACAT GGCCAGAGCC AATAGAGAAT CGAGAAAAAG 1000TGAGACGGAA AATGAACTTG AATTATGAGA AAGGTGTGTG AAACAAACAA 1050GCCAATAATG TGGCTTATAT AATATATAAT ATATAGATAT AGACCAGAGT 1100GAGTAACGAA TCACTAACTA ATTACATGTG TATATCTACC TAATTAGATG 1150ACTCATCAAA CAAAGCGAAC TATTGTGATA GAGACTTTAT TTTTCGCAAT 1200TAATTCAAAG ATGTACTGCT TATCTTCTTT GCTACATGTC TGTTGACATG 1250CATTGTTATC CATAACCTTG TTATTATACT TGGTGTTGAG AAAGGAGAGT 1300CTCCTTGCAC TTTAGAGACA TTCTTTAAAC TGACTTGACC TTATTGAAAA 1350TTCGAGATAG CAACTTAGCA CCACACCTTA AAAAGAAAGA TTTTTTAGAG 1400GGTAGATTAA TTGTTGAATA ATGTTAATCA TCAAAGGTTT AAGATTTATT 1450AAGTGCTTTC CATTGTCTTA AAAATCTTGC TTCTAGGACT AGGATGTGTA 1500TTGTTACATG ATTTCCCCCC CTTGGTATCA ACTAAAGCAT GTTGGACTTG 1550CGCTCCATAT GCAGAAACTC AAATTAAAAA CATCATTTGT AATGTATAGT 1600AAGTGTATAT ATAACATTGT AAGTTGTCGA TCAAAGTTAT TTGGATTAAT 1650GGATTTAAGT CTTCTATAAT ATTCCATTGA GAGCCAGAAG CCAGGTCCAA 1700AGGAATAAGT AACTCGCATG AATTCATTCT CTTGCTTCTA TACAGCTATT 1750TTTCCATCTT AGTGTTGCGG GAAACTACTT CAGTTCTCGC AGATGTGCAA 1800AACTTGTAGG GATCCATGTA GTTCAGTGAA ACCCATGCTT TCTTAATTGA 1850CAGAGATACA TTAAAACTTT TTACAGAATT GAGAAACCCA AGCCTTGTTA 1900ATTCTCAAAG ATACATTTAA ACTTTTTTCA GAAACGTGCT GAGTATTTTA 1950TCCTGTTTGT TATTCATTTT TGGCAGTTGG TCCTAAAAAT ACTCCTATGA 2000ATCTTGTGCT AGAGAAGACT TGCAATGCTA AAACAGGACG GGGCATGCCT 2050GAACTTTAAG GAGACGTTGC CTTGTTCCGA TTAGGTAATT GCTATCGTGA 2100TGAACAAAAA TTTGGTGTGA ATTTATCCCC TTGCCCTTTG CCATGATTCA 2150ATTAAAGACG TGTTTGGAAC CACATTCTAA CACCACTTTA TGATGGGTTA 2200GACGCAAAAT CTAGATTGGG TAGTGTTTAC ACACAGTTAC AAACACATTC 2250CTTGTTTAAT GTTATCATGC CTAGGAGTTG AATAACTTGT AACTTTACCA 2300ATTAGACATT ACTACTAGCA TTCTTTTTCC TATTCAAGTT GATGTTATCT 2350CCAGTTAGTG ATGGTCATTT CATTCCATAA ACTTCAATTG TTAAAATGAG 2400TGAAAAGGGA AAAAGGAACC CGTTTGATTG TTATGGTTCT AGTGATTTTT 2450ATTAATTGGG TTTGTCCATT AGTGTCGATT TGAGCTAAAT AGTTTCCCCC 2500CCCCAAAAGA TCAGTCTTCT CACATGTCAT ATTCATGCGC TGGTACCCTT 2550TTCATCCAGT TCCAACAAAC TTGCTGTACG AAGTCAGGTT GCATGAAAAT 2600AGTCAAATTT TCTTTAAGGG GGATATTATA CGTAAATAAA TAACGTAACC 2650CAAAAGTCTT ACTTGTTGGG TAACGTGGGT TTTGGTGTTT GATGGACCTA 2700GAACACTGTT TGTTGCTCTT ATATGCTTAC AAAGTAAAAA TGGTTATCAC 2750ATTTGGGGAA AAAATGTAGG CCCACTTATG ATATTTCGAC CTAAATGCAA 2800AATGGTTTAT CAATTTTTTT ATACTTAGTA TGATAAAACT CCTTTTTTTT 2850TTCCACTGGC ATACTATTTC TCTAAGACTT TTTAATAGTT CCGATAATTC 2900TTAGCTTAAA GAAATACGAC AAGGTTAGGA ATATTTTTTT ATTATGTGAC 2950ATTATTTTTT AAATATTTTG CTTCATATGA ATTTATACAA TCATTATAAT 3000TTGACCTTTT AAATGACTTT TAAAAATGAT CAGACCTAAA ATTTGAGTCT 3050TCTGATTGAG ATGCAAACTT ATTTCTTTTT ATATTTTATA TTTTATACTC 3100ATTTGTTTCT CTTTCTATTA TATTTCTTTT TTTTCTTCTC TTTATGCAAA 3150AACGTATGAC GTTGATTGGT GTCTTTGGCA ATCTTTTTAT GACGCTCAAA 3200AGTGAAAATA AATATTGTTC ACTTTCACCT CACGCTGGCC TTCCGCTGAT 3250GGTGGTTGTA CGCACTTATT TGATTTTTTT TTCTTCCACA TTTAATGAGG 3300TGAATCAGTT AGAGAAATAT TAAAAAAAAT AAATAAATAA AGGAAGACGA 3350CTAATACAAT AAAGAATACG AAACTCACAA TGAATAGACC CAATTAGAAC 3400CATTTATTTT CCTTACAAAT TAAAGAAAAC GTTTTTTTAA CAATATATCA 3450CATTATCATC TATTATATTT TTATTTATAT TTTTTATAAC TTTCTCTATC 3500TAGGTGTAGA TTGACATGAG TATACGCACG CACACCCAGC TCTACTTAGC 3550AGCAATTACC CGTTTTACTT GCTACTTAAG AGACACGTAC ATTAACACTT 3600GTCCTTGTGC ATGCAATTGC CACCACATTC CTCACTCCAC CCTTTTCTTT 3650ATATATAAAC AAACACAATG GATCATCTCA AACCAAGAGT GAGTTTGTTG 3700TTCCTCACTG ACCTCACC3718(2)SEQ ID NO7的資料(i)序列特征(A)長度4476(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO7TTGTAAAACG ACGGCCAGTG AATTGTAATA CGACTCACTA TAGGGCGAAT 50TGGGTACCGG GCCCCCCCTC GAGGTCGACG GTATCGATAA GCTTGATTAC 100TATAGGGCAC GCGTGGTCGA CGGCCCGGGC TGGTACTTTT GACTCCCTAA 150TTGACAACTA CTGCATTGTA TCGATATTAA TATGGAATTT GGAATCATGG 200TCCATGCTTC ATGTATTGTG TACCTCATAT TCAACAGCTA GTGAACACAA 250AATCTTACAT ACTTTTGTAT TTCTATCAGT TTATACCTTC CCAAATAAAT 300GGCTTATATT GCATTGAGTT ACATATTATT GTTTAGTTGG ATTGTAATTT 350ACGAGTAGTT TGTCACGACT GAAGAAATTA ATAAGGTATA AGACACGTCC 400TGCTCCCGCG AAATTCATTT TCTGTTTATT CTCTGTCTCT GTCTCTATTC 450AATTCAACCT TCCATTTGTT TTCGCCAGCA TCCAGATTTG TGCTTTCTCT 500ATCATTTCAT TTAATTAATG TGATGTATGT ATGGCTGAAT AAAAGATGGA 550TTCCTCTTTT TTGTGGGGTG GAAGCTTAAT CTATGGGGCT AGATAAAAAA 600ATTCATCTGT TTGTTGCACA GAATAAAATA TAAATTAATA ATTAATTAAA 650CTTCAAACAT GGACAGGGCA CCTCCAAGTT ATTTTAAAAC CGACCATGGC 700CATTTTTGCT TTCTGTTGGT GTTCTTGGCT CAGCTTTTGT AATTTTAGAC 750TGCAGAAACA TCCTGTATGG GTTGGAAAGC AGCTGAGAAA CTCATTAGGC 800GCTGGAAAAT TCTAAGAGGG GATAATGTAT GTGAGTCAAT TCAAACCCAC 850CATATGTTTG TCTCTGTGCT CTTTATTAAT TTCACTTTTT TATTTTATAA 900TTTTAGTCTC ACAGTCACAG AGTCACTTAT GTATTCATCT AACAGGTTAT 950GATAACAAGG GGCAAAGATA AGGGTGAGAC CGGGATTATA AAGCGTGTCA 1000TTTGCTCTCA AAATCGTGTC ATTGTAGAGG GTAAAAATCT GGTGAGATAT 1050TATAATCACT ATTTGGTCCT TCTGTTTTTC TAATGCCCTA TCTTCTGTAG 1100CTTTTGTTTT CAATTCCACT GTCAGTGTGT CTTGCATCAG AATATTAATC 1150GGTTGTCAGT GACATTGAGC ATTTAATTGT GTAAATTTTC CTGTTAGATT 1200TCTCACTCCA ATGCCTTTTG CCGTCCTCTT TATAGGTAAA GAAGCATATC 1250AAGCAAGGGC AAGGTCATAA AGGGGGAATC TTTACAGTGG AAGCCCCACT 1300GCATGCCTCC AATGTGCAAG TTCTTGACCC AGTGACAGGG TATGTACATG 1350TTAGATATTG AACTGGTGAT TGCTTCTCCA AATGGGATAA CATGTATGTA 1400AGTAAGAGTA ACCTACTTTT ACTTGTGCAG CAAGCCTTGC AAGGTTAGAG 1450TTAAAATATC TTGAAGATGG TACTAAAGTC AGAGTGTCCA GAGGAATAGG 1500AGCATCAGGG TTCATAGTCC CTCGTCCCAA GATCTTAAAG ATAAGAACTA 1550CCCCAAGACC TACAGTCCGT AAGTATCTAA CAAGCTTATG TTTTTTCCTT 1600GTATGAGTTG TTGATAAAAC ATGGCCAGAG CCAATAGAGA ATTGAGAAAA 1650GGTGAGAAAC AGAAAATGAA CTTGAATTAT GAGAAAGGTG TGGGAAACAA 1700ACAAGCCAAT AATGTGGCTT ATATAATATA TAGATATAGA CTAGAGTGAG 1750TAACGAATCA CTAACTAATT ACATGTGCAT ATCTACCTAA TTAGATGATT 1800CGTCAAACGA AGCAAAGTAT TGTGATAGAT AGTTGATTTT TCTCAAATAA 1850TTCTAAGATG TAATACTTAT ATTCTTTGCT ACATGTCTGT TGACATACAT 1900TGTTATCCAT AACCTTGTTA TTATACTTGG TGTTAAAAAA GGAGAGTCTC 1950CTTGCACTTT AGAGACATTC TTTAAACTGA CTTGACCTTA TTGAAATACA 2000TAATTCTAGT TACCAACTTA GCACCACACC ATAAAAGGAA AGATTTTTAA 2050ACGGTAGATT GATTGTTGAA TGTTGTTAAT CATCAAAGGT TTAAGATTTA 2100TTAAGTGCTT TCCATTGTCT TAAAATATTG CTTCTAGGAC TAGGATGTGT 2150ATATTGGTTA CATGATTTCC CCGCCTTCGT ATCAACTTAA GCATGTTGGA 2200CTTGCACCCA TATGCAGAAA CTCAAATAAA AAACTTCATT TGTAAGGTAT 2250AATAAGTGTA TATATAACAT TGTAAGTTGT CAATCAGAGT AATTTGGATT 2300GATGGATATT TAAGTCTTCT ATAATATTTC ATTTAGAGCC AGAAGCCAGG 2350TTCAAAGGAA TAGGTAATTC ACATGAATTC ATTCTCTTGT TTCTATACAG 2400TTATTATTTT TTCCATCTTA GTGTTGCAGG AAACTACCTC AGTTGTTGTA 2450GATGTGCAAA ACTTGTATGG ATATATATAC TGTTCAGTGT TGGGAAACCC 2500ATGCTTTCTT AATTCACAGA GATACATTTA AACTTTTTTT AGAAACTTGC 2550TTAGTATCTT ATCCTGTTAT TCATTTTTGG CAGTTGGTCC TAAAGATACT 2600CCTATGAATC TTGTGCTAGA GAAGACTTAC GATGCTAAAA CAGGACGGGG 2650CATGCCTGAA CTTTAAGGAG ACGTTGCCCT GTTCCACTTC CAATTAGGTA 2700ACTGCTATCG TGATGAACAA AAATTTGGTG TGAGTTTATC ACCTTGTCCT 2750TTGCCATGAT TCAATTAAAA GCGTGTTTGG ACTTTGGAAC CTCATTCTAA 2800CACCACCCTA TGATGGGTTA GACGCAAAAT CTAGACTGGG TAGTGTTTAA 2850CGTGTATCTG TGTGAACACA GTTACAAACG CATTCCATGT TTAATGCTAC 2900CATGCCTAGG AGTTGAATCA TTTGTAACTT TACCAATTTA GTCATTACTA 2950CTAGCATTCT TTTCCCTATT CAAGTTGATG TTAGCTCCAG TTAGGGATGG 3000TCATTTCACT CCATAAACTT TAATTGTTAG GTGAGTGGAA GAGGAACCCG 3050TTTGATTGTT ATGGTTCTAG TTCTAGTGAT TTTTATTAAT TGGGTTCGAC 3100CATATTAGTG TTTGATTTGA GCTATAGATA GTTTTTTCCC CAAAAGATCA 3150GTTTTCTCAC ATGTCAGATT CATGGGTTGG TACTCTTTTC ATCCAGTTCC 3200AACAAACTTG CTGTTCGAAC TACGAAGTCA GTCTTACTTA TTGGGTAACA 3250TGTGGGTTTT GGTGTTTAAT GGATCTAGAA TACTGTTTGT AGCTAAACCT 3300ATCTTATCAT ATAGGGCCTA AAAAGTAAAA TTGGTTATTA CATTTGGAAA3350AAAAGAAATA ATCTAGGCCC ACTGGCACAC TGAAAAACGT TTTCAATGAA3400TAATTTAATA GTTTTTTTTT TATAAAAAAA TTTTAATAAA AAATAATGGA3450GTTTTTAAAA ATATTACAAC AATCTGTTTC TCTAAGGTTT TTTAATAGTT3500CAGATAATTC ATAGCTTAGA GCAATACGAC ATGGTTAGGA AGCATAAAAA3550AAATATACGA CATGGTTAGG AATTTTTTTT TAGTATGTCT GACATAATTT3600TTTAAATGTT TTGGCTTCAT ATGAATTTAA CAGTGCGTCA TATGAACTTA3650CACACTCATT ATATTTTTTA ACCTTTTAAA TGATTTTTAA AAAATATGAC3650AGATGCAATC TTATTCTCAC TTTTTATACT TTCACTACTG CTTCATATGA3700CCTAAAGTCA GAGAAATATT TTAAAAAGAT AAATACGATA AAGAATACGA3750TGAGAAAGAA ACCTCACACA ATGAATAGAC CAAATTAGAC CTATTTATTT3800TCCTTAGAAA TAAAGAAAAT AATTATTTTT TATTTTTTCA CATTACATTT3850ATATTTTTCT ATCACTTTCT CTATTTAGGT ATTGATTGAC ATATGAGTGT3900ACATGAACTT TTTTTAAAAA AAAAGCGTAA ATATTAATTA TATTCATGCA3950TTTGTTTTCT GTCTTTCATT TTCTATTTAA TCTTACGTTA TCAATAATCT4000ATTATTAAAT TTTATAGTTG ATGATGAATA TATAAGAGAT ATAAATAAAA4050AAATAATTAA TTTTATAATA AAAATTAAAA AATAATTAAT TATTTTGAGA4100TAAATTTTTT TTAAGAGAAC AATTATAAAC GGAGAGTATT ATATTTAGTT4150TTATGTGTAC CGGGTACGTG TCTACTAACA TGGTGTCTCT CCATCATTTT4200CGTAGGAAAA AACATTATAG GAGTATGAAA AAAGCAAAAG TTTTGTCTGT4250TTATGGTTTT GTATATACCC AGCTCTACTT GGCAGCAATT ACCCGTCTTG4300CTTGCTACTT ACGAGACACG TACATTAACA CTTGTCCTAG CTAGTGCATG4350CAATTGCCAC CCCATTCCTC ACTCCTCCCT TTTCCTTCTC TTTATATTTA4400TATATATAAA TAAACAAACA CAATGCATCA TCTCAAAGAA ATTAAGAGAG4450TTTTTTTGTT CCTCACTGAC CAAGCC 4476(2)SEQ ID NO8的資料(i)序列特征(A)長度23(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO8TGTAAAACGA CGGCCAGTGA ATT 23(2)SEQ ID NO9的資料(i)序列特征(A)長度23(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO9GATTACGCCA AGCTCGAAAT TAA 23(2)SEQ ID NO10的資料(i)序列特征(A)長度27(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO10ATGGCGACCA GAGCCAAGCT TTCTTTA 27(2)SEQ ID NO11的資料(i)序列特征(A)長度27(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO11CGCAACAGCG CGACGACCAC GCTCGCT27(2)SEQ ID NO12的資料(i)序列特征(A)長度27(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO12ATGGCGACCA GAGCCAAGCT TTCTTTA27(2)SEQ ID NO13的資料(i)序列特征(A)長度27(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO13GAAGGGATGA CCAGGAGGGA CAACAAA27(2)SEQ ID NO14的資料(i)序列特征(A)長度23(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO14TTGTAAACGA CGGCCAGTGA ATT23(2)SEQ ID NO15的資料(i)序列特征(A)長度23(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(xi)序列描述SEQ ID NO15GGTGAGGTCA GTGAGGAACA ACA2權利要求
1.一種經修飾的植物蔗糖結合蛋白,其中所述經修飾的蔗糖結合蛋白與相應的野生型蔗糖結合蛋白相比,其氨基酸序列有所改變,并且與相應的野生型蔗糖結合蛋白相比,經修飾的蔗糖結合蛋白在酵母分析系統中的表達使蔗糖增強。
2.按照權利要求1的經修飾的植物蔗糖結合蛋白,其中所述經修飾的蔗糖結合蛋白比野生型蔗糖結合蛋白在酵母分析系統中增強蔗糖攝取至少達10%。
3.按照權利要求1的經修飾的植物蔗糖結合蛋白,其中所述經修飾的蔗糖結合蛋白比野生型蔗糖結合蛋白在酵母分析系統中增強蔗糖攝取至少達25%。
4.按照權利要求1的經修飾的植物蔗糖結合蛋白,其中所述有所改變的氨基酸序列包括比野生型蔗糖結合蛋白的C-末端截短。
5.按照權利要求4的經修飾的植物蔗糖結合蛋白,其中所述C-末端截短導致除去10到100個范圍之間的氨基酸。
6.一種經修飾的植物蔗糖結合蛋白,其中相應的野生型蔗糖結合蛋白選自SBP1和SBP2。
7.按照權利要求6的經修飾的植物蔗糖結合蛋白,其中所述蛋白具有選自Seq.I.D.Nos.2和4的氨基酸序列。
8.編碼權利要求1的經修飾的植物蔗糖結合蛋白的核酸分子。
9.含有權利要求8的核酸分子的載體。
10.表達權利要求1的經修飾的植物蔗糖結合蛋白的轉基因植物。
11.編碼權利要求6的經修飾的蔗糖結合蛋白的核酸分子。
12.表達權利要求6的經修飾的植物蔗糖結合蛋白的轉基因植物。
13.一種編碼植物蔗糖結合蛋白的分離的核酸分子,其中所述蛋白質含有選自下列組中的氨基酸序列(a)Seq.I.D.No.3所示的氨基酸序列;(b)Seq.I.D.No.4所示的氨基酸序列;(c)與(a)或(b)的氨基酸序列具有至少70%序列同一性的氨基酸序列;和(d)與(a)或(b)的氨基酸序列具有至少90%序列同一性的氨基酸序列。
14.含有與權利要求13的核酸分子有效連接的啟動子序列的重組表達盒序列。
15.含有權利要求14的重組表達盒序列的轉基因植物。
16.含有與核酸序列有效連接的啟動子序列的重組核酸分子,其中所述啟動子序列包括SBP1或SBP2啟動子。
17.按照權利要求16的重組核酸分子,其中所述啟動子序列包括選自以下組中序列的至少25個連續(xù)核苷酸(a)Seq.I.D.No.7;和(b)Seq.I.D.No.8。
18.按照權利要求17的重組核酸分子,其中所述核酸序列編碼植物蔗糖結合蛋白。
19.含有權利要求17的重組核酸分子的轉基因植物。
20.含有權利要求18的重組核酸分子的轉基因植物。
全文摘要
本發(fā)明提供了一種編碼植物蔗糖結合蛋白(SBP)的cDNA,以及在酶母分析系統中表現增強的蔗糖攝取活性的修飾SBP。同時也提供了具有改變的蔗糖攝取活性的核酸載體、轉基因細胞和轉基因植物。本發(fā)明還涉及用于調控轉基因(包括SBP轉基因)在植物中表達的啟動子序列。
文檔編號A01H5/00GK1257547SQ98805333
公開日2000年6月21日 申請日期1998年5月21日 優(yōu)先權日1997年5月22日
發(fā)明者霍華德·D·格里姆斯, 趙少武 申請人:華盛頓州立大學研究基金會