br>[0051] 預測第五TM結(jié)構(gòu)域平均是由23個氨基酸(但是可W在20和巧之間變化)組成。 在該一TM結(jié)構(gòu)域內(nèi),存在至少3種高度保守的氨基酸;G、P和L。
[0052] 該第五環(huán),將TM日和6連接在一起,具有2種高度保守的氨基酸;V和T。
[0053] 預測第六TM結(jié)構(gòu)域平均是由23個氨基酸(但是可W在19和巧之間變化)組成。 在該一TM結(jié)構(gòu)域內(nèi),存在至少7種高度保守的氨基酸;3、¥、1、口、1、3和丫。
[0054] 該第六環(huán),將TM6和7連接在一起,具有一種高度保守的氨基酸;D。
[0055] 預測第屯TM結(jié)構(gòu)域平均是由23個氨基酸(但是可W在20和巧之間變化)組成。 在該一TM結(jié)構(gòu)域內(nèi),存在至少5種高度保守的氨基酸;P、N、G、Q和Y。
[0056] 對于該一蛋白超家族而言,糖轉(zhuǎn)運和屯TM=維結(jié)構(gòu)是兩個關(guān)鍵特征。盡管在大小 或序列方面有大的可變性,并且盡管從中可W分離它們的生物體具有廣大數(shù)量,還是使用 已經(jīng)示出糖轉(zhuǎn)運功能的不同異源系統(tǒng)測試了所有SWEET。
[0057] 在本發(fā)明的一個實施例中,在本發(fā)明的該些方法、構(gòu)建體、植物和植物種子中利用 的SWEET轉(zhuǎn)運體蛋白是薦糖或己糖單向傳遞體。顧名思義,己糖單向傳遞體是轉(zhuǎn)運己糖(例 如環(huán)己糖、己醒醋和己麗糖)的轉(zhuǎn)運體蛋白。在本發(fā)明的該些方法、構(gòu)建體、植物和植物種 子中利用的薦糖或己糖單向傳遞體的實例包括但不限于葡萄糖單向傳遞體和果糖單向傳 遞體。
[0058] 一般而言,基于氨基酸序列相似性,可W將來自具體植物物種的的SWEET分類為 多個分支或組。在玉蜀泰中,例如基于每個分支內(nèi)的序列相似性,存在四個SWEET蛋白分 支。例如,在玉蜀泰中分支I包含SWEETla、lb、2、3a和3b;分支II包含SWEET4a、4b、4d、 6a和 6b;分支III包含SWEET11、12a、12b、13a、13b、13c、14a、14b、15a和 15b;分支IV包 含SWEET16a、1化和17。使用玉蜀泰中特定SWEET蛋白的個數(shù)W反映與擬南芥SWEET的系 統(tǒng)發(fā)育關(guān)系,例如通過序列比較,玉蜀泰中SWEET11是與擬南芥中的SWEET11最相關(guān)的,并 且使用更小的字母W指示相對擬南芥的可能的基因擴增。
[0059] 相應地,SWEET蛋白的編號,例如SWEET1、SWEET2等,是指基于氨基酸序 列比較,如源自擬南芥的特定SWEET蛋白連同其他物種中的直向同源物的氨基酸序 列。因此,雖然基因和蛋白命名法是指在擬南芥信息資源訂AIR)數(shù)據(jù)庫(在WWW. ar油idopsis.org的萬維網(wǎng)上可得)中鑒定的基因和蛋白,但是應理解,本發(fā)明并不 限于僅在擬南芥中的基因和蛋白,并且本發(fā)明涵蓋了其他物種中的基因的直向同源 物。例如,應理解,利用由擬南芥中的基因AtSweetl-AtlG21460、AtSweet2-A口G14770、 AtSweet3-At5巧3190、AtSweet4-At3G28007、AtSweet5-At5G62850、AtSweet6-AtlG66770、 AtSweet7-At4G10850、AtSweet8-At5G40260、AtSweet9-At2G39060、AtSweetl0-At5(;50790、 AtSweetll-At3G48740、AtSweetl2-At5G23660、AtSweetl3-At5G50800、 AtSweetl4-At4G25010、AtSweetl5-At5G13170、AtSweetl6-At3G16690 和 AtSweetl7-At4G15920編碼的一個或多個轉(zhuǎn)運體的本發(fā)明的該些方法、構(gòu)建體、植物和植物 種子(登錄號是按照基因名,例如"AtlG21460"是指來自TAIR數(shù)據(jù)庫的登錄號,如W上所描 述的)可W被應用至利用由另一物種中的直向同源基因編碼的一個或多個轉(zhuǎn)運體的方法、 構(gòu)建體、植物和植物種子。如在此使用,直向同源基因是執(zhí)行相同或相似功能的來自不同物 種的基因,并且認為它們是遺傳自共同祖先基因并且因此在它們的序列中共享了某個量的 氨基酸一致性。通常,由直向同源基因編碼的蛋白具有彼此類似的或幾乎相同的氨基酸序 列一致性,并且直向同源基因自身具有類似的核巧酸序列,特別是當考慮了遺傳密碼的冗 余度時。因此,通過舉例,擬南芥中薦糖轉(zhuǎn)運體的直向同源物將成為另一植物物種中的薦糖 轉(zhuǎn)運體,不管兩個蛋白的氨基酸序列如何。
[0060] 在特定實施例中,用于本發(fā)明的方法、構(gòu)建體、植物和植物種子中的SWEET轉(zhuǎn)運體 蛋白是來自作物植物,例如食用作物、飼料作物或生物燃料作物的SWEET蛋白。示例性重 要作物可W包括玉米、小麥、大豆、棉花和稻。作物還包括玉米、小麥、大麥、黑小麥、大豆、 棉花、小米、高梁、甘薦、甜菜、馬鈴墓、番茄、葡萄藤、巧橘類(樓子、梓樣、葡萄抽、等)、窩 宦、首猜、菜豆、蠶豆和草替、向日葵和油菜巧、木墓、芒屬和柳枝稷。植物的其他實例包括 但不限于非洲維菊、非洲堇、首猜、扁桃、銀蓮花、蘋果、杏、蘆資、鱷梨、杜醇花、香蕉和大蕉、 甜菜、風鈴草、黑胡桃、荷包牡丹、蝴蝶花、可可、蔓越橘、卡諾拉(canola)、康乃馨、胡蘿K 木墓、疾病、鷹嘴豆、瓜葉菊、枯橘、挪子樹、咖啡、菜豆、玉蜀泰、棉花、十字花科植物、葫蘆、 仙客來、大麗花、要挪樹、花旗松、偷樹、英國胡桃、亞麻、爵床科、龍舌蘭科、天南星科、五加 科、南洋杉科、蘿摩科、紫蔵科、鳳梨科、仙人掌科、鴨妬草科、大戟科、龍膽科、苦宦苔科、竹 芋科、??啤澩┛?、胡椒科、水龍骨科、等麻科、葡萄科、倒掛金鐘屬、天竺葵、葡萄、棲子、大 麻、蟹爪蘭、蛇麻子、八仙花、鳳仙花屬、耶路撒冷樓桃、高涼菜屬、窩宦、濱豆、洋枯梗、芒果、 溝酸漿屬、猴面花、薄荷、芥菜、燕麥、番木瓜、魏豆、桃和油桃、落花生、梨、珍珠粟、美洲山核 桃、胡椒、紫芳草、木豆、波蘿、阿月渾子、荷包花、一品紅、馬鈴墓、報春花、紅王葉草、杜醇花 屬、稻、玫瑰、黑麥、紅花、監(jiān)寶石花、波菜、草替、甘薦、向日葵、楓香屬、甘墓、美國梧桐、茶、 煙草、番茄、美女樓、和野生稻。
[0061] 基于在此披露的SWEET轉(zhuǎn)運體的氨基酸序列的描述,技術(shù)人員可W容易地從幾乎 任何植物種中鑒定任何SWEET轉(zhuǎn)運體。一旦鑒定,本領(lǐng)域普通技術(shù)人員可W使用用于從給 定物種中分離鑒定SWEET蛋白的編碼序列的容易獲得的方法,來產(chǎn)生編碼希望的SWEET蛋 白的核酸。
[0062] 在特定實施例中,用于本發(fā)明的方法、構(gòu)建體、植物和植物種子的SWEET蛋白是 來自玉蜀泰的SWEET蛋白。SWEET蛋白的核酸序列和/或氨基酸序列的實例包括但不限 于ZmSweetla-GRMZM2G039365、ZmSweet化-GRMZM2G巧3358、ZmSweet2-GRMZM2G324903、 ZmSweet3a-邸MZM2G179679、ZmSweet3b-GRMZM2G060974、ZmSweet4a-邸MZM2G000812、 ZmSweet4b-邸MZM2G144581、ZmSweet4d-GRMZM2G137954、ZmSweet6a-邸MZM2G157675、 ZmSweet加-GRMZM2G416965、ZmSweetll-GRMZM2G368827、ZmSweetl2a-GRMZM2G133322、 ZmSwee11 化-GRMZM2G099609、ZmSwee113a-GRMZM2Gl73669、ZmSweet13b-GRMZM2G021706、 ZmSweetl3c-GRMZM2G179349、ZmSweetl4a-GRMZM2G094955、ZmSweet14b-GRMZM2G015976、 ZmSweetl5a-GRMZM2G168365、ZmSweet巧b-GRMZM5G872392、ZmSweet16a-GRMZM2G106462、 ZmSweetl6b-GRMZM2G111926、ZmSweetl7-GRMZM2G107597。基因名后的登錄號,例如 "GRMZM2G0393化",是指來自在如W上所描述的WWW.maiz巧化.o巧處的玉蜀泰遺傳學和基 因組學數(shù)據(jù)庫的登錄號。
[0063] 在特定實施例中,用于本發(fā)明的方法、構(gòu)建體、植物和植物種子的SWEET蛋 白是來自稻的SWEET蛋白。SWEET蛋白的核酸序列和/或氨基酸序列的實例包括但 不限于 0sSweetla-0s01g65880、OsSweet化-0s05g35140、0sSweet2a-0s01g36070、 0sSweet2b-0s01g50460、 0sSweet3a-0s05gl2320、 0sSweet3b-0s01gl2130、 0sSweet4-0s02gl9820、 0sSweet5-0s05g51090、 0sSweet6a-0s01g42110、 0sSweet6b-0s01g42090、 0sSweet7a-0s09g08030、 0sSweet7b-0s09g08440、 0sSweet7c-0sl2g07860、 0sSweet7d-0s09g08490、0sSweet7e-0s09g08270、 OsSweetIl-0s08g42350>OsSweet12-0s03g22590>OsSweet13-Os12g29220. 0sSweetl4-0sllg31190、0sSweetl5-0s02g30910、0sSweetl6-0s03g22200?;蛎蟮牡卿?號,例如"化01g65880",是指來自在如在此描述的WWW.gree叩hyl.org處的化eenphyl數(shù)據(jù) 庫、或在ice.plantbiology.msu.e化處的TI邸數(shù)據(jù)庫的登錄號。
[0064] 在特定實施例中,用于本發(fā)明的方法、構(gòu)建體、植物和植物種子的SWEET蛋白是來 自擬南芥的SWEET蛋白。SWEET蛋白的核酸序列和/或氨基酸序列的實例包括但不限于 AtSweetl-AtlG21460、AtSweet2-At3G14770、AtSweet3-At5(;53190、AtSweet4-At3G28007、 AtSweet5-At5G62850、AtSweet6-AtlG66770、AtSweet7-At4G10850、AtSweet8-At5G40260、AtSweet9-At2G39060、AtSweetl〇-At5G50790、AtSweetll-At3G48740、 AtSweetl2-At5G23660、AtSweetl3-At5G50800、AtSweetl4-At4G25010、 AtSweetl5-A巧G13170、AtSweetl6-A口G16690、AtSweetl7-At4G15920。基因名后的登錄號, 例如"A巧G23660",是指來自如W上所描述的TAIR數(shù)據(jù)庫的登錄號。
[0065] 在特定實施例中,用于本發(fā)明的方法、構(gòu)建體、植物和植物種子的SWEET蛋白是 來自漠襲狀首猜的SWEET蛋白。SWEET蛋白的核酸序列和/或氨基酸序列的實例包括但 不限于MtSWEET化-AC235677_9、MtSWEET3c-Med化lg028460、MtSWEETla-Med化lg029380、 MtSWEEH5a-Medtr2g007890、MtSWEET6-Medtr3g080990、MtSWEETlb-Medtr3g089125、 MtSWEET3a-Medtr3g090940、MtSWEET3b-Medtr3g090950、MtSWEET13-Medtr3g098910、 MtSWEETll-Medtr3g098930、MtSWEET4-Medtr4gl06990、MtSWEET巧b-Medtr5g067530、 MtSWEET9a-Medt巧g092600、MtSWEET5a-Medtr6g007610、MtSWEET5c-Medtr6g007623、 MtSWEET5d-Medtr6g007633、MtSWEET5b-Medtr6g007637、MtSWEET2c-Medtr6g034600、 MtSWEET9b-Medti7g007490、MtSWEEH5d-Medtr7g405710、MtSWEEn5c-Medtr7g405730、 MtSWEET2a-Medtr8g042490、MtSWEET14-Medtr8g096310、MtSWEET12-Medtr8g096320、 MtSWEET7-Med化8g099730、MtSWEET16-M化.42164. 1.SI?;蛎蟮牡卿浱?,例如 "Mecltrlg028460",是指來自在如在此描述的WWW.plantgrn.noble. 〇巧處的豆類基因組數(shù) 據(jù)庫的登錄號。
[0066] 在特定實施例中,用于本發(fā)明的方法、構(gòu)建體、植物和植物種子的SWEET蛋 白是來自大豆。SWEET蛋白的核酸序列和/或氨基酸序列的實例包括但不限于 GmSWEETla-XP003526670、GmSWEETlb-Glymal3g09140、GmSWEETlc-Glymal4g27610、 GmSWEET2-XP003540515、GmSWEET3a-XP003544116、GmSWEET3b-Glymal3g08190、 GmSWEET3c-ACU24301、GmSWEET3d-Glyma04g41680、GmSWEET4-Glymal7g09840、 GmSWEET5a-Glymal9g01280、GmSWEET5b-Glymal9g01270、GmSWEET6a-Glyma20gl6160、 GmSWEET6b-Glymal3gl0560. 1、GmSWEET7-Glyma08g02890、GmSWEET9a-XP00355271、 GmSWEET9b-XP003552719、GmSWEET9c-Glyma08g48281、GmSWEET10a-XP003532478、 GmSWEET10b-Glyma05g38340、GmSWEET10c-NP001237418、GmSWEET10d-XP003523161、 GmSWEET10e-Glyma06gl7540、GmSWEETlla-XP003532471、GmSWEETl化-Glyma05g38351、 GmSWEET12a-Glyma04g37530、GmSWEET12b-XP003526939、GmSWEET15a-Glyma08gl9580、 GmSWEET15b-Glymal5g05470、GmSWEEn5c-XP003524088、GmSWEET15d-XP003551863、 GmSW邸T15e-Glyma08g47561、GmSW邸T15f-Glymal始53930、GmSWEET16a-Glyma09g04840、 GmSWEET16b-Glymal5gl6030、GmSWEET17-Glymal9g42040?;蛎蟮牡卿浱?,例如 "Glymal9g42040",是指來自在如在此描述的WWW.plantgrn.noble,o巧處的豆類基因組數(shù) 據(jù)庫、或在WWW.photozome.net處的植物基因組數(shù)據(jù)庫(Phytozomedat油ase)的登錄號。
[0067] 在其他實施例中,本發(fā)明的該些方法、構(gòu)建體、植物和植物種子可W包括或包括至 少一個編碼SWEET蛋白或其變體的外源核酸的用途,其中該外源核酸編碼包括與SEQID NO;1-410 的氨基酸序列中的任一個至少 75%、80%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%或 99%-致的氨基酸序列的SWEET或其變 體。在另一實施例中,本發(fā)明的該些方法、構(gòu)建體、植物和植物種子可W包括或包括編碼 SWEET蛋白或其變體的至少一個外源核酸的用途,其中該外源核酸編碼由與SEQIDNO: 1-410 的氨基酸序列中的任一個至少 75%、80%、85%、86%、87%、88%、89%、90%、91%、 92 %、93 %、94 %、95 %、96 %、97 %、98 %或99 % -致的氨基酸序列組成的SWEET或其變體。
[0068]
[0069]
[0070] 本發(fā)明涉及編碼SWEET或其變體的分離的核酸,并且涉及包含該些核酸的構(gòu)建 體、宿主細胞、植物組織和植物種子。本發(fā)明的核酸可W是DNA或RNA。核酸分子可W是單 鏈的或雙鏈的RM或DM;單鏈的RM或DM可W是編碼鏈、或有義鏈,或非編碼鏈、或反義 鏈。具體地,該些核酸可W編碼任何SWEET、或其變體、連同融合蛋白。例如,本發(fā)明的核酸 包括編碼谷脫甘膚-S-轉(zhuǎn)移酶(GST)融合蛋白、多組氨酸(例如His6)、多HN、聚賴氨酸、血 球凝集素、監(jiān)V標記的多核巧酸序列。如果希望,分離的核酸的核巧酸序列可W包括另外的 非編碼序列,例如非編碼3'和5'序列(例如包括調(diào)節(jié)序列)。
[0071] 本發(fā)明的核酸分子可W是"分離的"。如在此使用的,"分離的"核酸分子或核巧酸 序列意思是指側(cè)翼不是正常插入基因或核巧酸序列的側(cè)翼的核巧酸序列的(如在基因組 序列中)和/或已經(jīng)完全地或部分地從其天然環(huán)境(例如細胞、組織)去除的核酸分子或 核巧酸序列。例如,已經(jīng)從細胞去除或純化的核酸分子被認為是分離的。在一些實例中,分 離的材料將形成組合物的一部分,例如包含其他物質(zhì)、緩沖系統(tǒng)或試劑混合物的粗提物。在 其他情況下,可W將該材料純化至接近均質(zhì),例如,如通過PA姐或柱色譜法(例如H化C)確 定。因此,分離的核酸分子或核巧酸序列可W包括使用重組DNA技術(shù)或使用任何其他適合 的方法化學合成的核酸分子或核巧酸序列。為了清楚,包含在載體中的核酸將被包括在如 在此使用的"分離的"的定義中。而且分離的核巧酸序列包括異源生物體中的重組核酸分 子,例如DNA、RNA,連同溶液中部分地或基本上純化的核酸。另一方面,"純化的"是本領(lǐng)域 中很好理解的并且一般是指核酸分子基本上不含細胞材料、細胞組分、化學前體或可能是 緩沖液或溶劑之外的其他化學品。"基本上不含"意思是指新穎的核酸分子之外的其他組分 是不可檢測的。本發(fā)明的核酸分子可W是分離的或純化的。在體內(nèi)和在體外,"分離的"核 巧酸序列還涵蓋本發(fā)明的DNA分子的RNA轉(zhuǎn)錄物。
[0072] 本發(fā)明還涵蓋了本發(fā)明的核巧酸序列的變化,例如,如在此描述的多膚的那些編 碼功能片段或變體。此類變體可W是天然存在的、或非天然存在的,例如通過不同誘變劑和 誘變程序誘導的那些。有意的變化包括但不限于可W導致保守的或非保守的氨基酸改變 (包括添加和缺失)的一個或多個核巧酸的添加、缺失和取代。
[0073] 在此描述的本發(fā)明還涉及在此描述的分離的核酸分子的片段。術(shù)語"片段"意思 是涵蓋形成至少約20個連續(xù)核巧酸到至少約50個連續(xù)核巧酸或更長長度的在此描述的核 巧酸序列的一部分。此類片段可W用作探針和引物。具體地,引物和探針可W選擇性地與 編碼在此描述的多膚的核酸分子雜交。例如,如W下描述,編碼保留活性的多膚的片段是特 別有用的。
[0074] 本發(fā)明還提供了在高嚴謹度雜交條件下(例如用于選擇性雜交)與在此描述的核 巧酸序列雜交的核酸分子(例如與編碼在此描述的多膚的核巧酸序列特異性雜交并且編 碼修飾的生長因子isooherin的核酸分子)。雜交探針包括W堿基特異性方式與核酸的互 補鏈結(jié)合的合成寡核巧酸。適合的探針包括如在尼爾森的ielsen)等人,科學(Science), 巧4:1497-1500(1991)中描述的多膚核酸。
[0075] 可W通過特異性雜交,例如在高嚴謹度條件下,檢測和/或分離此類核酸分子。對 于雜交而言,"嚴謹度條件"是本領(lǐng)域的術(shù)語,是指允許具體核酸與第二核酸雜交的解育和 洗漆條件,例如溫度條件和緩沖液濃度;第一核酸可W是與第二核酸完全互補,即100%, 或者第一核酸和第二核酸可W共享一定程度的互補性,該互補性是低于完全的,例如60%、 75%、85%、95%或更多。例如,某些高嚴謹度條件可W用來區(qū)別完全互補的核酸與具有更 差互補性的那些。
[0076]在現(xiàn)代分子生物學實驗指南(CurrentProtocolsinMole州larBiology),約翰 威立父子出版公司JohnWiley&Sons),(1988)中解釋了用于核酸雜交的"高嚴謹度條件"、 "中嚴謹度條件"和"低嚴謹度條件",通過引用將其結(jié)合。決定雜交的嚴謹度的額外條件不 僅取決于離子強度(例如洗漆緩沖液的化2XSSC、化IXSSC),溫度(例如室溫、42°C、68°C、 等),W及去穩(wěn)定劑(例如甲酯胺)或變性劑(例如SDS)的濃度,而是還取決于多種因素, 例如核酸序列的長度、堿基組成、雜交序列之間的錯配百分比W及其他非一致序列內(nèi)的該 序列的子集的出現(xiàn)頻率。因此,可W按照經(jīng)驗確定高、中或低嚴謹度條件。
[0077] 通過從不發(fā)生雜交的嚴謹度水平至初次觀察到雜交的水平改變雜交條件,可W確 定將允許給定序列與樣品中的最類似序列雜交的條件。
[0078] 在克勞斯化rause,M.H.)和阿倫森(S.A.Aaronson),酶學方法(Methodsin 化zymology),200:546-556 (1991)中描述了示例性條件,通過引用將其結(jié)合。洗漆是其中 通常設(shè)置條件為W便確定雜交的互補性的最低水平的步驟。一般,從僅發(fā)生同源雜交的最 低溫度開始,最終洗漆溫度降低每一度(°C),同時保持SSC濃度恒定,允許在雜交的序列間 錯配的最大程度上增加1%。一般,SSC濃度加倍導致Tm增加。使用該些準則,可W取決于 尋找的錯配水平,針對高、中或低嚴謹度按照經(jīng)驗確定洗漆溫度。示例性高嚴謹度條件包括 但不限于在50%甲酯胺、1MNaCl、l%細S中在37°C下雜交,并且在化IXSSC在60°C下洗 漆。漸進地更高嚴謹度條件的實例包括在雜交后,在約室溫下,用0. 2XSSC和0. 1 %SDS洗 漆(低嚴謹