專利名稱:顯性失活突變體krp蛋白保護活性細胞周期蛋白-cdk復合物不受野生型krp抑制的制作方法
顯性失活突變體KRP蛋白 保護活性細胞周期蛋白-CDK復合物 不受野生型KRP抑制
相關(guān)申請
本申請要求于2005年7月29日提交的美國申請?zhí)?0/703, 999 的優(yōu)先權(quán),所述專利整體引入本文作為參考。
背景技術(shù):
植物具有與真核生物相同的基本細胞周期。并不令人意外地,它
南芥這一用于研究細胞周期的模型植物系統(tǒng)具有幾個CDK亞群。CDKA 最類似于哺乳動物的cdc2 (CDK1),并且在介導與其細胞周期蛋白配 偶體的相互作用的區(qū)域中包含高度保守的Pro Ser Thr Ala lie Arg Glu (PSTAIRE)氨基酸序列(SEQ ID NO: 1)。擬南芥還具有被稱為 CDKB的植物特異性CDK群體,所述CDKB在高等動物中不是保守的。 然而,植物缺乏關(guān)于d CDKs-CDK4和CDK6的哺乳動物對應物。CDKA 被提議為d CDK (它由植物D型細胞周期蛋白激活),而CDKB顯示在 S期中和以后是占優(yōu)勢表達的,因此可能被鑒定為G2/M特異性CDK。
這些CDKs的激活/失活驅(qū)動細胞通過細胞周期,并且還指示細胞 何時退出細胞周期。擬南齊包含分成10個亞類的高達49種細胞周期 蛋白(參見,Wang等人,尸/a" 135: 1084-1099, 2004 )。
只有A、 B和D類似乎在細胞周期中起作用并且激活CDKs ( Wang等人, 7aW 135: 1084-1099, 2004 )。 CDKA由D型細胞周期蛋白激活,而CDKB由A和B型細胞周期蛋白激活。
在動物中,CDKs由2個CDK抑制劑(CKIs)家族負調(diào)節(jié)。被稱為 CDK4的抑制劑(INK4)的一類由4個成員(pl5、 p16、 pl8和pl9) 組成,所述4個成員與G! CDKs即CDK4和CDK6結(jié)合且抑制d CDKs 結(jié)合細胞周期蛋白。另一組抑制劑被稱為激酶抑制劑蛋白(KIPs)或 CIP (CDK相互作用蛋白)蛋白質(zhì),并且它們在所有動物中是高度保守 的。CIP/KIP家族主要抑制細胞周期蛋白A-和E-CDK2激酶活性。在植 物中,推定的CKIs已被鑒定(Wang等人,^"re 386: 451-452, 1997; Wang等人,戶/aW /. 15: 501—510, 1998; De Veylder等人,?7a/^ CW/ 13: 1653—1667, 2001; Jasinski等人,戶/M腳"o/. 130: 1871-1882, 2002 ),并且顯示出在體外抑制純化的細胞周期蛋白/CDK 激酶活性(Wang等人,1997,同上;Wang等人,戶/a/^/. 24: 613-623, 2000; Lui等人,戶/a"f /. 21: 379-385, 2000 )。使用包含較大細 胞的較小器官,植物CKIs的表達顯示出生長減少(參見Wang等人, 2000,同上;Jasinski等人,/. Ce〃 Sc/'. 115: 973-982, 2001; DeVeylder等人,同上;Zhou等人,戶細"e//i ep. 20: 967-975, 2002; Zhou等人,尸/s/7t /. 35: 476-489, 2003; Schnittger等人, 戶/a/^ Ce// 15: 303-315, 2003 )。在擬南芥中,這些CKIs被稱為 CDK的抑制劑(ICKs)或KIP相關(guān)蛋白(KRPs)。已鑒定了七個ICK 家族成員,其最接近地類似CKIs的CIP/KIP家族。這些ICK/KRP家族 成員中的每一個與p27,具有高度的氨基酸序列同一性,但該同一性 限于最C-末端的30個氨基酸。迄今為止,沒有在任何植物中鑒定出 INK相關(guān)CKIs。
細胞周期蛋白的過表達或CKI的敲除表明,良好平衡的細胞周期
引擎在哺乳動物中可以容易地被擾亂。這種不平衡可以最終導致細胞 周期加速、動物大小增加和/或腫瘤形成。降低或完全消除CKI "活性" 導致細胞周期蛋白/CDK激酶活性增加。這種增加的活性導致細胞周期 進展所需的下游靶的磷酸化,并且動物最終產(chǎn)生細胞過度增殖(Coats 等人,^c/e/2ce 272: 877-880, 199"。由于導致過量細胞增殖的過量的細胞周期蛋白/cdk活性,小鼠中p27,基因的缺失導致較大的小 鼠(Fero等人,Ce// 85: 733-744, 1996; Kiyokawa等人,Ce//85: 721-732, 1996; Nakayama等人,Ce// 85: 707-720, 1996 )。
存在抑制KRP家族中的各個成員的表達的機制。植物中的轉(zhuǎn)錄后 基因沉默(PTGS)是類似于動物中的RNA干擾(RNAi)的RNA降解機 制。RNAi導致雙鏈RNA (dsRNA)特異性降解成短的21-23 bp dsRNA 片段,所述dsRNA片段最終在同源RNAs群體的降解中起作用。在植物 中,PTGS使用反向重復(IR)策略以抑制許多植物種類中的基因表達, 所述植物種類包括作物植物,僅舉幾個例子例如玉米、大豆和卡諾拉 油菜(canola)。然而,IR技術(shù)具有幾個缺點,例如IR序列的效率、 脫靼基因調(diào)節(jié)(Jackson等人,^"z;re Wo/ec力,21: 635—637, 2003 )、 瞬時沉默、總體IR穩(wěn)定性等。這些缺點由對于同時沉默超過一種基因 的需要而在目前情況下復合。
常規(guī)植物育種在過去的75年里已成為用于增加作物產(chǎn)量的主要 驅(qū)動力(J. Fernandez-Corne jo, ^r/cw"i/re Zo,oms〃0/7 ^///e〃/ vVa 0/^74^第81頁,2004年2月)。最近,例如對昆蟲害蟲和除 草劑具有抗性的轉(zhuǎn)基因作物已變得可獲得。然而,這些轉(zhuǎn)基因作物確 伴隨產(chǎn)量損失發(fā)生(Elmore等人,j^n i7. /. 93: 408-412, 2001; Elmore等人,Jgro". /. 93: 404-407, 2001 )。迄今為止,還沒有 這樣的已知轉(zhuǎn)基因作物是商購可得的,所述轉(zhuǎn)基因作物具有種子大小 的增加或作物產(chǎn)量的增加。
法,所述對于特性的修飾包括例如但不限于,增加作物產(chǎn)量、增加種 子大小、增加萌芽率、增加根群(root mass )等。如本文所述,本發(fā) 明滿足這些和其他需要。
發(fā)明概述
本發(fā)明提供了相對于野生型CKI多肽具有至少一個修飾的變體植物細胞周期蛋白依賴性激酶抑制劑(CKI)多肽。在某些實施方案中, 所述修飾在CDK結(jié)合區(qū)域內(nèi),以便相對于野生型CKI蛋白質(zhì),賦予對 于CDK蛋白的經(jīng)修飾的結(jié)合親和力,同時基本上維持對于細胞周期蛋 白的結(jié)合親和力。本發(fā)明的變體CKI多肽具有針對野生型CKI功能的 顯性失活拮抗活性。當所述變體在下述細胞內(nèi)表達時,野生型CKI的 生物活性被抑制,導致通過細胞周期的進展加速和細胞增殖增加表 達相應野生型CKI蛋白的細胞,或表達與相應野生型蛋白質(zhì)異源但尤 其在細胞周期蛋白和CDK結(jié)合方面具有基本上等價的野生型功能的野 生型CKI的細胞。
在其他方面,本發(fā)明提供了編碼變體CKI多肽的重組核酸,或包 含所述重組核酸的載體??梢詫⒆凅wCKI編碼核酸或載體引入宿主細 胞中以用于擴增或表達所述核酸。宿主細胞可以例如在本發(fā)明的方法 中用于產(chǎn)生變體CKI多肽。此外,變體CKI多肽在細胞中的表達可以 在本發(fā)明的方法中用于調(diào)節(jié)細胞分裂。例如,變體CKI多肽在細胞中 的表達可以導致通過細胞周期的進展加速和細胞增殖增加。
在另外其他的方面,提供了包含編碼變體CKI多肽的轉(zhuǎn)基因的轉(zhuǎn) 基因植物。所述變體CKI多肽在轉(zhuǎn)基因植物中的表達可以在本發(fā)明的 方法中用于例如,增加植物活力、增加根群、增加植物大小、或增加 早期萌芽等。
定義
除非另有說明,本文使用的所有技術(shù)和科學術(shù)語具有與本發(fā)明所 述領(lǐng)域的普通技術(shù)人員通常理解相同的含義。盡管與本文所述那些相 似的任何方法和材料都可以在本發(fā)明的實踐或測試中使用,但只描述 了示例性方法和材料。為了本發(fā)明的目的,下述術(shù)語如下定義。
如本文使用的,術(shù)語"a" 、 "an"和"the"包括復數(shù)指示物, 除非上下文另外清楚地指出。
如本文使用的,術(shù)語"細胞周期蛋白依賴性激酶抑制劑"(在本文中也稱為"CDK抑制劑"或"CKI")指負調(diào)節(jié)細胞周期蛋白依賴性 激酶(CDKs )的一類蛋白質(zhì)。順應于本發(fā)明的CKIs是具有能夠獨立地 結(jié)合細胞周期蛋白和CDK的分開的多肽區(qū)域的那些CKIs。此類CHs 包括例如,經(jīng)鑒定的植物CKIs家族(7個鑒定的擬南芥CKIs ),所述 植物CKIs與動物中的激酶抑制蛋白(KIPs)具有同源性,稱為KIP 相關(guān)蛋白(KRPs)(也稱為"CDKs,,的抑制劑或"ICKs")。
術(shù)語"多肽"和"蛋白質(zhì)"在本文中可互換地用于指氨基酸殘基 的聚合物。
術(shù)語"核酸"指脫氧核糖核苷酸或核糖核苷酸及其單或雙鏈形式 的聚合物。除非具體限制,該術(shù)語包含含有天然核苷酸的已知類似物 的核酸,所述類似物具有與參考核酸類似的結(jié)合性質(zhì),并且以與天然 存在的核苷酸類似的方式代謝。除非另有說明,特定核酸序列還含蓄 地包括其保守修飾變體(例如,簡并密碼子置換)。具體而言,簡并 密碼子置換可以通過產(chǎn)生這樣的序列來達到,在所述序列中一個或多 個所選(或全部)密碼子的第3個位置用混合堿基和/或脫氧肌苷殘基 置換(參見,例如,Batzer等人,腸/e/"c/"es. 19: 5081, 1991; 0htsuka等人,/. A/o/. C/ e瓜260: 2605-2608, 1985; Rossolini 等人,Ce//.戶ro6es 8: 91-98, 1994 )。術(shù)語核酸可與基因、 cDNA和由基因編碼的iiiRNA互換使用。
在CKI多肽和核酸的情況下,術(shù)語"天然存在的"意指具有在自 然界中發(fā)現(xiàn)的氨基酸或核苷酸序列(即可以從自然界中的來源(生物) 分離且仍未通過人為干預有意修飾的氨基酸或核苷酸序列)的多肽或 核酸。如本文使用的,可能已根據(jù)常規(guī)遺傳學進行選擇性育種的植物 實驗室林系被視為天然存在的植物。
如本文使用的,"野生型CKI基因"或"野生型CKI核酸"指相 應于生物基因組中的CKI基因座的核酸序列,所述核酸序列編碼的基 因產(chǎn)物執(zhí)行由相應于該基因座的天然存在核苷酸序列所編碼的CKI蛋 白質(zhì)的正常功能?;蜃梢栽趥€體群體中具有超過一種序列或等位 基因,和術(shù)語"野生型"包括編碼執(zhí)行正常功能的基因產(chǎn)物的所有此類天然存在的等位基因。"野生型,,還包括不一定天然存在但仍編碼 具有正常功能的基因產(chǎn)物的基因序列(例如,具有沉默突變或編碼具 有保守置換的蛋白質(zhì)的基因)。
術(shù)語"野生型CKI多肽"或"野生型CKI蛋白"指由野生型基因 編碼的CKI多肽?;蜃梢栽趥€體群體中具有超過一種序列或等位 基因,和術(shù)語"野生型"包括編碼執(zhí)行正常功能的基因產(chǎn)物的所有此
類天然存在的等位基因。
在本發(fā)明的CKI多肽和核酸的情況下,術(shù)語"突變體"或"變體"
意指相對于相應野生型多肽或核酸為經(jīng)修飾的多肽或核酸。
術(shù)語"參考CKI多肽"是為了定義突變體或變體CKI多肽的目的 而在本文中使用的術(shù)語該術(shù)語指為了定義氨基酸序列中的修飾的目 的,將突變體CKI多肽與之進行比較的CKI多肽。因此,"相對于參 考CKI多肽包含具有至少一個修飾的CKI氨基酸序列"的突變體CKI 多肽意指,除了一個或多個氨基酸修飾外,突變體CKI多肽在其他方 面包含參考多肽的氨基酸序列。在如本文所述執(zhí)行本發(fā)明的過程中, 參考CKI多肽是預先確定的。參考CKI多肽可以是例如野生型和/或天 然存在的CKI多肽,或已進行有意修飾的CKI多肽。
術(shù)語"經(jīng)修飾的結(jié)合,,或"經(jīng)改變的結(jié)合"指由野生型基因編碼 的突變體CKI多肽,所述野生型基因的參考CKI多肽結(jié)合細胞周期蛋 白/CDK復合物。術(shù)語"經(jīng)修飾的結(jié)合"或"經(jīng)改變的結(jié)合"在本文中 指突變體CKI與細胞周期蛋白/CDK激酶復合物的結(jié)合。術(shù)語"經(jīng)修飾 的結(jié)合"或"經(jīng)改變的結(jié)合"指與參考CKI多肽相比較,突變體CKI 多肽的相對結(jié)合。"經(jīng)修飾的結(jié)合"或"經(jīng)改變的結(jié)合"可以指這樣 的突變體CKI多肽,其與參考CKI多肽相比較,具有與細胞周期蛋白 /CDK復合物的相同的結(jié)合、減少的結(jié)合、或等價的結(jié)合。
如本文使用的,"重組體"指已通過重組方法進行有意修飾的氨 基酸序列或核苷酸序列。術(shù)語"重組核酸"在本文中意指一般而言通 過核酸內(nèi)切酶處理核酸,以自然界中通常未發(fā)現(xiàn)的形式,最初在體外 形成的核酸。因此,線性形式的分離的突變體或變體CKI核酸,或通過使通常不連接的DNA分子連接在一起而在體外形成的表達載體,為 了本發(fā)明的目的都被視為重組體。應當理解, 一旦制備了重組核酸并 將其再引入宿主細胞或生物內(nèi)后,它將非重組地,即使用宿主細胞的 體內(nèi)細胞機構(gòu)而不是體外操作進行復制;然而,此類核酸一旦重組產(chǎn) 生后,盡管隨后非重組地進行復制,但為了本發(fā)明的目的仍被視為重 組體。"重組蛋白質(zhì)"是使用重組技術(shù),即通過如上文所述的重組核 酸表達來制備的蛋白質(zhì)。重組蛋白質(zhì)通過至少一個或多個特征與天然 存在的蛋白質(zhì)區(qū)分開。
關(guān)于氨基酸,"非保守的"修飾意指其中野生型殘基和突變體殘 基在一個或多個物理性質(zhì)方面顯著不同的修飾,所述物理性質(zhì)包括疏 水性、電荷、大小和形狀。例如,從極性殘基到非極性殘基的修飾或 反之亦然,從帶正電荷殘基到帶負電荷殘基的修飾或反之亦然,和從 大殘基到小殘基的修飾或反之亦然是非保守的修飾。例如,可以進行 更顯著影響下述性質(zhì)的置換改變區(qū)域中的多肽主鏈的結(jié)構(gòu),例如ot 螺旋或P折疊結(jié)構(gòu);靶位點上的分子的電荷或疏水性;或側(cè)鏈的松密 度。 一般被預期在多肽性質(zhì)中產(chǎn)生最大變化的置換是下述那些其中 (a )親水殘基例如絲氨?;蛱K氨酰被置換成疏水殘基例如亮氨酰、異 亮氨酰、苯丙氨酰、纈氨酰或丙氨酰(或反之亦然);(b)半胱氨酸 或脯氨酸被置換成任何其他殘基(或反之亦然);(c )具有電正性側(cè) 鏈的殘基例如賴氨酰、精氨酰或組氨酰被置換成電負性殘基例如谷氨 ?;蛱於滨?或反之亦然);或(d)具有大體積側(cè)鏈的殘基例如苯 丙氨酸被置換成無側(cè)鏈的氨基酸例如甘氨酸(或反之亦然)。
保守修飾一般是下文顯示的那些,然而,如本領(lǐng)域已知的,其他 置換也可以被視為是保守的。
Ala: Ser
Arg: Lys
Asn: Gln, His
Asp: Glu
Cys: SerGin:Asn
Glu:Asp
Gly:Pro
His:Asn,Gin
lie:Leu,Val
Leu:lie,Val
Lys:Arg,Gin
Met:Leu,Ile
Phe:Met,Leu
Ser:Thr
Thr:Ser
Trp:Tyr
Tyr:Trp,Phe
Val:Ile,Leu,
在蛋白質(zhì)作用機理或基因表型的情況下,術(shù)語"顯性失活的"指 基本上阻止具有野生型功能的相應蛋白質(zhì)執(zhí)行野生型功能的突變體或
變體蛋白質(zhì)、或者編碼所述突變體或變體蛋白質(zhì)的基因。
如本文使用的,短語"野生型CKI的拮抗劑"意指,與在不存在 該拮抗劑的情況下經(jīng)由野生型CKI多肽的激酶活性抑制相比較,突變 體CKI多肽顯著減少(抑制)野生型CKI多肽抑制CDK/細胞周期蛋白 復合物的激酶活性的能力。
當將核酸置于與另一種核酸序列處于功能性關(guān)系的狀況時,該核 酸是"可操作地連接的"。例如,如果啟動子或增強子影響編碼序列 的轉(zhuǎn)錄,那么它與該序列是可操作地連接的;或如果核糖體結(jié)合位點 如此放置以便促進翻譯,那么它與該編碼序列是可操作地連接的。
術(shù)語"植物"包括完整植物、植物器官(例如,葉、莖、花、根 等)、種子、和植物細胞(包括組織培養(yǎng)細胞)及其后代??梢栽诒?發(fā)明的方法中使用的植物種類一般與適合于轉(zhuǎn)化技術(shù)的高等植物種類 一樣廣泛,包括棵子植物和被子植物,單子葉和雙子葉植物,以及某些低等植物例如藻類。它包括各種倍性水平的植物,包括多倍體、二 倍體和單倍體。單子葉被子植物的例子包括,例如天門冬、野生甜玉
米、大麥、小麥、稻、高粱、甘蔗、洋蔥、粟、黑麥和燕麥及其他谷
類作物。雙子葉被子植物的例子包括但不限于,西紅柿、煙草、棉花、
油菜(卡諾拉油菜)、亞麻齊、蠶豆、大豆、胡椒、萵苣等。木本種
類的例子包括楊樹、松樹、雪松、橡樹、冷杉等。
"異源序列"是來源于不同物種的序列,或如果來自相同物種, 那么與其最初形式而言是實質(zhì)上經(jīng)過修飾的。例如,與結(jié)構(gòu)基因可操
作地連接的異源啟動子來自與結(jié)構(gòu)基因所來源的物種不同的物種,或 如果來自相同物種,那么與其最初形式而言是實質(zhì)上經(jīng)過修飾的。
術(shù)語"載體"指通常為雙鏈的DNA片,在所述DNA片中可以已插 入了外源DNA片。載體或復制子可以例如具有質(zhì)?;虿《緛碓?。載體 包含促進載體在宿主細胞內(nèi)自主復制的"復制子"多核苷酸序列。在 本公開內(nèi)容的情況下,術(shù)語"復制子"還包括,使載體序列靶向重組 到宿主染色體內(nèi)或者促進載體序列重組到宿主染色體內(nèi)的多核苷酸序 列區(qū)域。此外,盡管外源DNA最初可以例如插入DNA病毒載體內(nèi),但 病毒栽體DNA轉(zhuǎn)化到宿主細胞內(nèi)可以導致病毒DNA轉(zhuǎn)變成病毒RNA載 體分子。外源DNA被定義為異源DNA,所述異源DNA是在宿主細胞中 未天然發(fā)現(xiàn)的DNA,其例如復制載體分子、編碼可選擇的或可篩選的 標記或轉(zhuǎn)基因。載體用于將外源或異源DNA運輸?shù)胶线m的宿主細胞內(nèi)。 一旦進入宿主細胞內(nèi)后,載體可以與宿主染色體DNA獨立地或同時復 制,且可以產(chǎn)生載體及其插入DNA的幾個拷貝。備選地,載體可以使 外源或異源DM的靶向插入宿主染色體內(nèi)。此外,載體還可以包含允 許插入DNA轉(zhuǎn)錄成mRNA分子,或者引起插入DNA復制成多個拷貝的 RNA的必需元件。某些表達載體另外還包含鄰近于插入DNA的序列元 件,所述序列元件允許mRNA翻譯成蛋白質(zhì)分子。因此,可以快速合成 由插入DNA編碼的mRNA和多肽的許多分子。
術(shù)語"轉(zhuǎn)基因栽體"指包含DNA插入?yún)^(qū)段("轉(zhuǎn)基因")的載體, 所述DNA插入?yún)^(qū)段在宿主細胞內(nèi)被轉(zhuǎn)錄成mRNA或復制為RNA。術(shù)語"轉(zhuǎn)基因"不僅指轉(zhuǎn)變成RNA的插入DNA的部分,還指轉(zhuǎn)錄或復制所述RNA
所需的載體的那些部分。此外,轉(zhuǎn)基因不一定必需包含含有能夠產(chǎn)生 蛋白質(zhì)的開放讀碼框的多核苷酸序列。
術(shù)語"轉(zhuǎn)化的宿主細胞"、"轉(zhuǎn)化的"和"轉(zhuǎn)化"指將DNA引入 細胞內(nèi)。該細胞被稱為"宿主細胞",并且它可以是原核或真核細胞。 通常的原核宿主細胞包括各種大腸桿菌(A co//)的菌抹。通常的真 核宿主細胞是植物細胞(例如,卡諾拉油菜、大豆、稻或玉米細胞等)、 酵母細胞、昆蟲細胞、或動物細胞。引入的DNA通常為包含插入的DNA 片的載體形式。引入的DNA序列可以來自與宿主細胞相同的物種或來 自與宿主細胞不同的物種,或者它可以是雜合DNA序列,包含某些外 源DNA和某些來源于宿主物種的DNA。
在CKI多肽和核酸的情況下,與另一個序列(例如,區(qū)域、片段、 核苷酸或氨基酸位置等)的"相應性"基于這樣的慣例,即根據(jù)核苷 酸或氨基酸位置數(shù)目進行編號,隨后以使匹配每個位置的核苷酸或氨 基酸數(shù)目最大化的方式,即以使序列同一性百分比最大化的方式比對 所述序列。因為并非所有具有給定"相應區(qū)域"的位置都必需是相同 的,所以相應區(qū)域內(nèi)的非匹配位置可以被視為"相應位置"。因此, 如本文使用的,當提及"相應于特定CKI多肽的氨基酸位置X的氨基 酸位置"時表示提及在其他所認可的CKI多肽以及結(jié)構(gòu)同系物和家族
中的等價位置的集合。
在涉及CKI多肽和核酸的KRP超家族的典型的本發(fā)明實施方案中, 氨基酸或核苷酸位置的"相應性"通常相關(guān)于CDK結(jié)合區(qū)域內(nèi)的氨基 酸、或編碼CDK結(jié)合區(qū)域的核普酸而言進行確定。 一般地,與KRP多 肽的其他區(qū)域相比較,KRPCKIs的CDK結(jié)合區(qū)域共享基本的序列同一 性或相似性。因此,用于確定KRP CKI多肽的CDK結(jié)合區(qū)域的一種合 適技術(shù)是,鑒定與第二種KRP CKI的已知CDK結(jié)合區(qū)域(例如,來自 歐洲油菜(Ara^y/ca / fl/7"s) Krpl ( Bn Krpl)的大約氨基酸位置145 -168)共享基本的序列同一性或相似性的氨基酸區(qū)域。(參見,例如,
圖1,顯示了幾個CKI家族成員與BnKrpl的氨基酸序列比對)。 一旦已通過序列比對確定了相應于CDK結(jié)合區(qū)域的序列后,那么因而就可 以確定相應的氨基酸或核苷酸位置。
如本文使用的,"序列同一性百分比"通過在比較窗上比較2個 經(jīng)最佳比對的序列來測定,其中對于所述2個序列的最佳比對,與參 考序列(它不包含添加或缺失)相比較,比較窗中的序列部分可以包 含添加或缺失(即,缺口 )。百分比通過下述方式來計算測定2個 序列中出現(xiàn)相同核酸堿基或氨基酸殘基的位置的數(shù)目,以得到匹配位 置的數(shù)目,將匹配位置的數(shù)目除以比較窗中的位置的總數(shù)目,并將結(jié) 果乘以100,從而得到序列同一性百分比。
在2個或更多個核酸或多肽序列的情況下,術(shù)語"同一的,,或"同 一性"百分比涉及,如使用下述序列比較算法之一或通過手工比對和 目測檢查所測量的,當在比較窗或指定區(qū)域上就最大相應性進行比較 和比對時,相同或具有指定百分比的相同核苷酸或氨基酸殘基(例如, 在指定區(qū)域上60%同一性,任選地65%、 70%、 75%、 80%、 85%、 90%或95%同一性)的2個或更多個序列或子序列。如果序列至少約 25%、至少30%、至少35%、至少40%、至少45%、至少50%、或 至少55%同一,那么它們是彼此"基本上同一的"。這些定義還涉及 測試序列的互補序列。任選地,同一性存在于長度為至少約6個氨基 酸殘基、長度為至少約15個氨基酸殘基、長度為至少約25個氨基酸 殘基、長度為至少約35個氨基酸殘基、長度為至少約50個氨基酸殘 基、或長度為至少約IOO個或更多氨基酸的多肽區(qū)域上,或存在于編 碼此類多肽區(qū)域的核酸區(qū)域上。在本發(fā)明的某些優(yōu)選方面,用于比較 的指定區(qū)域是CKI多肽的CDK結(jié)合區(qū)域、包含此類CDK結(jié)合區(qū)域的部 分的多肽區(qū)域、或包含此類CDK結(jié)合區(qū)域的多肽區(qū)域。
在2個或更多個多肽序列的情況下,術(shù)語"相似性"或"相似性 百分比,,涉及,如使用下述序列比較算法之一或通過手工比對和目測 檢查所測量的,當在比較窗或指定區(qū)域上就最大相應性進行比較和比 對時,具有指定百分比的由保守氨基酸置換限定為相同或相似的氨基 酸殘基(例如,在指定區(qū)域上60%相似性,任選65%、 70%、 75%、80%、 85%、 90%或95%相似的)的2個或更多個序列或子序列。如 果序列彼此至少20%、至少25%、至少30%、至少35%、至少40%、 至少45%、至少50%、或至少55%相似,那么它們是彼此"基本上 相似的"。任選地,這種相似性存在于長度為至少約6個氨基酸殘基、 長度為至少約15個氨基酸殘基、長度為至少約25個氨基酸殘基、長 度為至少約35個氨基酸殘基、長度為至少約50個氨基酸殘基、或長 度為至少約IOO個或更多氨基酸殘基的區(qū)域上。
在本發(fā)明的某些方面,為了測定序列同一性或相似性,用于比較 的指定區(qū)域是CKI多肽的CDK結(jié)合區(qū)域、包含此類CDK結(jié)合區(qū)域的部 分的多肽區(qū)域、或包含此類CDK結(jié)合區(qū)域的多肽區(qū)域。
對于序列比較,通常一個序列充當參考序列,將測試序列與之進 行比較。當使用序列比較算法時,將測試和參考序列輸入計算機內(nèi), 指定子序列坐標(coordinates),必要時還指定序列算法程序參數(shù)。 可以使用缺省程序參數(shù),或可以指定其他參^t。序列比較算法隨后根 據(jù)程序參數(shù)來計算相對于參考序列而言的測試序列的序列同 一 性或相 似性百分比。
如本文使用的,"比較窗,,包括涉及鄰接氨基酸或核苷酸位置的 區(qū)段,其中在2個序列最佳比對后,序列可以與相同鄰接位置數(shù)目的 參考序列進行比較。就根據(jù)本發(fā)明進行CKI多肽的比較而言,比較窗 通常為約6個-約200個或更多個鄰接氨基酸,通常為約6個-約50 個,約6個-約25個,約15個-約100個,約15個-約50個,約 15個-約30個,約20個-約50個,或約25個-約50個鄰接氨基 酸。用于比較的序列比對方法是本領(lǐng)域眾所周知的。用于比較的序列 的最佳比對可以通過下述來進行例如,Smith和Waterman ( j^/f. J; / /.他".2: 482, 1970 )的局部同源性算法;Needleman和Wunsch (/. 48: 443, 1970 )的同源性比對算法;Pearson和
Lipman (尸roc. A""/. Jcad. Sc/. ^^ 85: 2444, 1988 )的相似性 搜索方法;這些算法的計算機化實施(例如,Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr.,Madison, Wis.中的GAP、 BESTFIT、 FASTA和TFASTA );或手工比對 和目觀,J檢查(參見,例i口 Ausubel等人,Cwrre/^尸ro"co7s //2 M 7ec""r A/o/o^f ( 1995增刊))。
一個有用算法的例子是PILEUP。 PILEUP使用漸進的成對比對而由 一組相關(guān)序列產(chǎn)生多重序列比對,以顯示相互關(guān)系和序列同 一性百分 比。它還繪制顯示出用于產(chǎn)生比對的聚類關(guān)系的樹或樹狀圖。PILEUP使 用簡化的Feng & Doolittle, (/. M /.五ra/. 35: 351-360, 1987 )的 漸進比對方法。所使用的方法類似于由Higgins & Sharp, (CABI0S 5: 151-153, 1989 )描述的方法。該程序可以比對高達300個序列,每個序 列的最大長度為5, 000個核苷酸或氨基酸。多重比對操作從2個最相似 序列的成對比對開始,產(chǎn)生2個經(jīng)比對的序列的聚蔟(cluster)。這個 聚簇隨后可以與下一個最相關(guān)序列或經(jīng)比對的序列的聚簇進行比對。2 個序列聚簇可以通過2個獨個序列的成對比對的簡單延伸來進行比對。 最終比對通過一系列漸進的成對比對來完成。該程序通過指定序列比較
區(qū)域的特定序列及其氨基酸或核苷酸坐標和通過指定程序參數(shù)來運行。 使用PILEUP,將參考序列與其他測試序列進行比較以測定序列同一性 百分比關(guān)系,使用下述參數(shù)缺省缺口權(quán)重(3.00)、缺省缺口長度 權(quán)重(0.10)、和加權(quán)末端缺口。 PILEUP可以從GCG序列分析軟件包
(例如,版本7. 0 ( Devereaux等人,腸/. ^c油紐12: 387-395, 1984 ))中獲得。
適合于測定序列同 一性和序列相似性百分比的算法的另 一個例子 是BLAST和BLAST 2.0算法,其分別在Altschul等人(^;c/. Jc/& 25: 3389-3402, 1977 )和Altschul等人(/. 215: 403-410, 1990 )中描述。用于進行BLAST分析的軟件可通過國家生物 技術(shù)信息中心(National Center for Biotechnology Information) 公開獲得。這種算法包括,首先通過在查詢序列中鑒定長度W的短字
(word)來鑒定高得分序列對(HSPs),當與數(shù)據(jù)庫序列中相同長度 的字進行比對時,所述HSPs匹配或滿足某一正值閾值得分T。 T稱為 鄰近字得分閾值(neighborhood word score threshold) (Altschul等人,同上)。這些最初鄰近字的命中用作起始搜索的種子,以找到
包含它們的更長HSPs。在累積比對得分可以增加的情況下,字命中 (word hits )沿著每個序列在2個方向上進行延伸。對于核苷酸序列, 累積得分使用參數(shù)M (關(guān)于一對匹配殘基的獎勵得分;總是>0)和N (關(guān)于錯配殘基的罰分;總是〈0)進行計算。對于氨基酸序列,使用 評分矩陣計算累積得分。在下列情況時,停止字命中在每個方向上的 延伸累積比對得分比其達到的最大值減少X量;由于一個或多個負 得分殘基比對的積聚,累積得分變成零或零以下;或達到任一序列的 末端。BLAST算法參數(shù)W、 T和X決定比對的靈敏度和速度。BLASTN 程序(對于核苷酸序列)使用下列作為缺省值字長(W)為11、期 望值(E)為10、 M=5、 N=-4和兩條鏈的比較。對于氨基酸序列,BLASTP 程序使用下列作為缺省值字長為3、和期望值(E )為10,以及BLOSUM62 評分矩陣(參見Henikoff和Henikoff,^〃. Jc<sA 〃W 89: 10915-10919, 1992 )比對(B)為50、期望值(E)為10、 M=5、 N=-4和兩條鏈的比較。
BLAST算法還進行兩個序列之間相似性的統(tǒng)計分析(參見,例如 Karlin和Altschul,^"/. Jcad. Sc/. 90: 5873-5787,
1993 )。由BLAST算法提供的相似性的一種量度是最小加和概率(P(N)), 它提供了對兩個核苷酸或M酸序列之間的匹配偶然發(fā)生的概率指示。 例如,如果測試核酸與參考核酸比較中的最小加和概率小于約0.2,通 常小于約O. 01,和更通常小于約0.001,那么該核酸#皮浮見為類似于參考 序列。
還可以使用國家生物技術(shù)信息中心(NCBI)的HonioloGene資源來 鑒定基因同系物和直向同源物。第一種基因的同系物或直向同源物可 以編碼具有與由第一種基因編碼的基因產(chǎn)物相同或相似功能的基因產(chǎn) 物。2個核酸序列或多肽是直向同源物的另一個指示是,該異源基因 可以在真核細胞表達系統(tǒng)中補足(例如,援救)內(nèi)源基因的無效等位 基因。附圖簡述
圖1顯示了擬南芥屬植物KRP家族成員與蕓莒屬植物Krp家族成 員的氨基酸序列比對。擬南芥屬植物KRPs的序列從公共數(shù)據(jù)庫獲得 AtKrpl(Genbank#U94772 )( SEQ ID NO: 2);AtKrp2(Genbank#CAB76424 )
(SEQ ID NO: 3); AtKrp3 ( Genbank#CAC41617 ) ( SEQ ID NO: 4); AtKrp4 ( Genbank#CAC41618 )( SEQ ID NO : 5 ) ; AtKrp5
(Genbank#CAC41619) ( SEQ ID NO: 6); AtKrp6 ( Genbank#CAC41620 )
(SEQ ID NO: 7);和AtKrp7 ( Genbank#CAC41621 ) ( SEQ ID NO: 8)。 蕓苜屬植物KRPs的序列(BnKrpl ( SEQ ID NO: 68 ) 、 BnKrp3 ( SEQ ID NO: 69) 、 BnKrp4 (SEQ ID NO: 70) 、 BnKrp5 (SEQ ID NO: 71)和 BnKrp6 (SEQ ID NO: 72))如下文實施例1中所述獲得。還顯示了 p27的氨基酸序列(SEQ ID NO: 73)。
圖2顯示了玉米(SEQ IDNO: 9)、卡諾拉油菜、大豆(SEQ ID NO: 11)、楊樹(SEQ ID NO: 12)、煙草(SEQ ID NO: 13)、小麥、稻
(SEQ ID NO: 15)、和馬鈴薯(SEQ ID NO: 16 )細胞周期蛋白和CDK 結(jié)合結(jié)構(gòu)域的氨基酸序列比對,其圖解說明了 CDK結(jié)合結(jié)構(gòu)域內(nèi)的高 度序列同一性。
圖3顯示了編碼BnKrpl F151A; 153A ( SEQ ID NO: 74 )或BnKrpl Y149A; F151A; F153A ( SEQ ID NO: 75)中任一個的突變體BnKrpl 核酸序列,其已就在玉米中的表達進行了密碼子優(yōu)化。
發(fā)明詳述
本發(fā)明包括用于調(diào)節(jié)植物細胞分裂的組合物和方法。特別地,提 供了經(jīng)由顯性失活機制來拮抗野生型CKI蛋白功能的多肽,以及相關(guān) 的多核苷酸、宿主細胞、轉(zhuǎn)基因植物、及其使用方法。包含編碼顯性 失活的變體CKI多肽的多核苷酸的廣泛多樣的轉(zhuǎn)基因載體,可以用于 實踐本發(fā)明。當本發(fā)明的CKI轉(zhuǎn)基因被引入植物內(nèi)并表達時,調(diào)節(jié)了植物細胞分裂。取決于與變體CKI轉(zhuǎn)基因可操作地連接的啟動子序列 的類型,細胞分裂的調(diào)節(jié)可以在植物體各處發(fā)生,或以組織或器官特 異性方式發(fā)生。特別地,本文提供的組合物和方法可以用于加速植物 細胞通過細胞周期的進展,伴隨著細胞增殖增加。以這種方式使用組 合物和方法允許例如在廣泛多樣植物中的任何植物之中產(chǎn)生作物產(chǎn)量 和/或種子大小增加。作物產(chǎn)量的增加可以包括,例如,葉組織增加、 果實增加、花的產(chǎn)生增加、根群增加等。
在本發(fā)明的具體實施方案中,變體CKI多肽是KRP家族成員。本 發(fā)明的這個方面至少部分基于下述發(fā)現(xiàn)KRP家族成員的CDK結(jié)合區(qū) 域主要負責抑制細胞周期蛋白-CDK復合物。因此,瞄準KRP家族成員 中的CDK結(jié)合區(qū)域(與細胞周期蛋白結(jié)合區(qū)域相對)允許產(chǎn)生突變體 蛋白,所述突變體蛋白是野生型CKI功能的特別有效的顯性失活拮抗 劑。
突變體CKI多肽、核酸和載體
本發(fā)明的CKI多肽是可與天然存在的或野生型的CKIs區(qū)分的突變 體或變體蛋白質(zhì)。相對于參考CKI多肽(例如,野生型CKI蛋白), 變體CKI多肽在蛋白質(zhì)的CDK或細胞周期蛋白結(jié)合區(qū)域中包含至少一 個修飾。與相應的野生型序列相比較,通常的修飾包括氨基酸置換、 插入和/或缺失。特別合適的修飾是氨基酸置換。在某些實施方案中, 變體CKI多肽包含至少一個非保守修飾(例如,置換)。
本發(fā)明的突變體CKI多肽是顯性失活蛋白質(zhì)。顯性失活方法特別 順應于具有分別參與CDK和細胞周期蛋白結(jié)合的2個多肽區(qū)域的CKI 多肽。用于形成本發(fā)明的顯性失活突變體的 一般方法包括修飾獨個 CDK和細胞周期蛋白結(jié)合區(qū)域之一,以便修飾"野生型"CDK或細胞周 期蛋白結(jié)合。這種經(jīng)修飾的CDK或細胞周期蛋白結(jié)合區(qū)域可以導致與 野生型多肽相比較,與細胞周期蛋白或CDK的結(jié)合相等、減少或消除。 在任一情況下,突變可以減少或消除CKIs激酶抑制活性。為了設(shè)計可 以干擾野生型功能的顯性失活CKI多肽,突變體多肽必須(l)基本上與細胞周期蛋白/CDK復合物結(jié)合;(2)即使在高濃度下也基本上不 抑制細胞周期蛋白CDK復合物;和(3 )與野生型CKI多肽竟爭結(jié)合細 胞周期蛋白/CDK復合物。在體內(nèi),符合所有這些要求的突變體CKI多 肽導致細胞中的細胞周期蛋白/CDK激酶活性升高,這依次導致細胞增 殖增加和更高的有絲分裂指數(shù),這最終導致植物具有增加的產(chǎn)量、更 大的種子、和/或與植物的一個或多個區(qū)域中的細胞周期蛋白/CDK激 酶活性升高相關(guān)的某些其他特征。
在KRP多肽的具體情況下,瞄準CDK結(jié)合區(qū)域用于修飾,所述CDK 結(jié)合區(qū)域主要負責這個CKI多肽家族中的細胞周期蛋白/CDK激酶抑 制。
特別合適的修飾包括氨基酸置換、插入或缺失。例如,氨基酸置 換可以作為減少或消除結(jié)合的在CDK或細胞周期蛋白結(jié)合區(qū)域中的修 飾而產(chǎn)生。類似地,氨基酸置換可以作為減少或消除CKI抑制活性的 在CDK或細胞周期蛋白結(jié)合區(qū)域中的修飾而產(chǎn)生。在典型實施方案中, 在CDK或細胞周期蛋白結(jié)合區(qū)域中進行至少一個非保守氨基酸置換、 插入或缺失,以破壞或修飾CKI多肽與CDK或細胞周期蛋白的結(jié)合。
置換型CKI多肽突變體是在參考CKI蛋白序列中已去除至少一個 氨基酸殘基且在相同位置上插入不同氨基酸以替代之的那些突變體。 置換可以是單個的,其中在分子中只有一個氨基酸被置換,或者置換 可以是多個的,其中同一分子中的2個或更多個氨基酸被置換。本發(fā) 明的CKI蛋白分子活性的實質(zhì)改變可以通過用下列氨基酸置換一個氨 基酸來獲得側(cè)鏈在電荷和/或結(jié)構(gòu)方面顯著不同于天然氨基酸的另一 個氨基酸,具有與天然氨基酸相反的電荷的氨基酸,或具有與天然氨 基酸相反的親水性的氨基酸等。這些類型的置換預期將影響置換區(qū)域 中多肽主鏈的結(jié)構(gòu)和/或分子的電荷或疏水性。在本發(fā)明的某些示例性 實施方案中,置換型CKI突變體包括用丙氨酸置換非丙氨酸殘基。在 其他變化形式中,置換型CKI包括用下述氨基酸置換氨基酸殘基例 如,帶相反電荷的氨基酸,具有更大側(cè)鏈的氨基酸殘基,具有相反親 水性的氨基酸,小的非極性氨基酸(例如,Cys、 Thr、 Ser、 Ala或Gly ),或極性氨基酸(例如,Pro、 Glu、 Asp、 Asn或Gln)。
插入型CKI多肽突變體是具有與在參考CKI蛋白分子中特定位置 處的氨基酸緊鄰地插入的一個或多個氨基酸的突變體。與氨基酸緊鄰 意指與所述氨基酸的ot -羧基或oc -氨基官能團連接。插入可以是一個 或多個氨基酸。插入可以例如由1個或2個保守氨基酸組成。在電荷 和/或結(jié)構(gòu)方面與鄰近插入位點的氨基酸類似的氨基酸被定義為保守 的。備選地,突變體CKI包括插入這樣的氨基酸,所述氨基酸具有與 鄰近插入位點的氨基酸基本上不同的電荷和/或結(jié)構(gòu)。
缺失型CKI多肽突變體是其中已去除了參考CKI蛋白分子中的一 個或多個氨基酸的突變體。在某些實施方案中,缺失型突變體在CKI 蛋白分子的特定區(qū)域中將具有缺失的1個、2個或更多個氨基酸。缺 失型突變體可以包括例如,具有氨基或羧基末端截短的突變體。
本發(fā)明的方法可以應用于其中獨個區(qū)域參與結(jié)合CDK和細胞周期 蛋白以抑制CDK功能的蛋白質(zhì)的CKI家族中的任何公認的成員。在一 個實施方案中,突變體CKI蛋白質(zhì)是屬于CKIs的KRP家族的蛋白質(zhì)的 突變或變體。如上所述,KRP家族成員的CDK結(jié)合區(qū)域主要負責激酶 抑制。因此,在變體KRP CKI多肽的設(shè)計中優(yōu)選瞄準CDK結(jié)合區(qū)域以 用于修飾。KRP蛋白的CDK結(jié)合區(qū)域一般相應于歐洲油菜Krpl( BnKrpl ) (SEQIDN0: 17 )的氨基酸145 - 168。在某些實施方案中,KRP家族 成員的CDK結(jié)合區(qū)域的修飾包括在相應于BnKrpl位置145 - 168的區(qū) 域內(nèi)的至少1個氨基酸位置、2個氨基酸位置、或更多個氨基酸位置 上的修飾。(擬南芥Krpl中的相應區(qū)域包括氨基酸167 - 190 )。用 于修飾的特別合適的氨基酸位置包括相應于歐洲油菜Krpl (BnKrpl ) 的氨基酸145、 148、 149、 151、 153、 155、 163、 164、 165和/或167 的那些位置。通過使用已知方法和如本文進一步描述的進行序列比對, 可容易地確定其他CKI多肽中的相應氨基酸殘基。
在每種情況下,上述氨基酸在哺乳動物p27中是保守的,且在與 細胞周期蛋白A和CDK2復合的p27的晶體結(jié)構(gòu)中全都接觸CDK。在一 個實施方案中,KRPCDK結(jié)合區(qū)域的修飾包括相應于BnKrpl的氨基酸位置151和153的氨基酸的修飾(例如,在這些位點中每一個上的氨 基酸置換,例如,至丙氨酸或帶相反電荷的氨基酸)。在其他示例性 變化形式中,除了相應于BnKrpl位置151和153的氨基酸修飾外,KRP CDK結(jié)合區(qū)域的修飾進一步包括在相應于BnKrpl的氨基酸149、 164 和/或165的位置上的修飾(例如,在相應于BnKrpl的氨基酸149的 位置上的另外氨基酸置換;或在相應于BnKrpl的氨基酸164和氨基酸 165的位置上的2個另外氨基酸置換)。對于KRP CKI多肽的此類修 飾改變對于CDK蛋白的結(jié)合親和力,而基本上保留變體蛋白質(zhì)結(jié)合細
胞周期蛋白的能力。
特別感興趣的Krp CDK結(jié)合區(qū)域的修飾包括但不限于,相應于任
何下述氨基酸置換的修飾
BnKrpl BnKrpl BnKrpl BnKrpl BnKrpl BnKrpl BnKrpl BnKrpl BnKrpl BnKrpl BnKrpl BnKrpl BnKrpl BnKrpl
F145A F145A F145A Y149A Y149A F151A F151A F151A F151A F151A F151A F151A F151A E164A
Y149A
Y149A;
Y149A;
F151A
F153A
F153A
F153A
F153A
F153A
F153A
F153A
F153A
F153A
W165A
F151A F151A;
F153A
Y149A E164A W165A E164A Y149A Y149A Y149A
W165A E164A W165A E164A:
W165A
在某些實施方案中,如上進行修飾的CKI多肽是BnKrpl。在其他 變化形式中,如上進行修飾的CKI不是具有相應于上述那些的經(jīng)置換 的氨基酸的BnKrpl (例如,擬南芥)。
影響CDK或細胞周期蛋白結(jié)合的其他修飾(例如,置換、插入、缺失)包括KRP家族成員中的另外修飾,其可以使用各種技術(shù)包括結(jié) 構(gòu)比對法、序列比對法等來鑒定。突變體或變體蛋白質(zhì)可以通過下述 方法來產(chǎn)生例如,使用先前在美國專利號6, 188,965、 6, 296, 312 和6, 403, 312中描述的PDA頂系統(tǒng),丙氨酸掃描(參見美國專利號 5, 506, 107 ),基因改組(WO 01/25277 ),位點飽和誘變,平均場(mean field),序列同源性,或本領(lǐng)域技術(shù)人員已知的指導選擇點突變位點 和類型的其他方法,如下文進一步描述的。
本發(fā)明的CKI多肽變體可以通過使編碼相應的野生型CKI或由其 衍生出該變體的其他相應CKI的DNA序列突變來構(gòu)建,例如通過使用 通常被稱為定點誘變的技術(shù)。編碼CKI蛋白的核酸分子可以通過各種 本領(lǐng)域普通技術(shù)人員眾所周知的聚合酶鏈式反應(PCR)技術(shù)來突變。 (參見,例如,戶(^ ^r"eg/es (M. A. Innis, D. H. Gelfand和 J. J. Sninsky eds. , 1995 , Academic Press, San Diego, CA)第 14章;戶6!/ 尸rc^oc(7/s.. J 6^/de a/7d Jp/^/'caf/o/^ ( M.
A. Innis, D. H. Gelfand, J. J. Sninsky和T. J. White eds., Academic Press, NY, 1990 )。此外,眾所周知的化學和/或輻射誘變 方法也是本領(lǐng)域眾所周知的,其可以用于誘導KRP家族成員蛋白質(zhì)的 編碼區(qū)中的突變。可以進行篩選以找出可能包含所需核苷酸序列的那 些植物,所述核苷酸序列編碼本發(fā)明的突變體或變體Krp。可以就CKI 氨基酸序列的變化、激酶活性的變化或表型的預期變化來篩選植物, 隨后為序列分析。
作為非限制性例子,在來自 Clontech 的 Transformer Site-Directed Mutagenesis試劑盒中使用的2個引物系統(tǒng),可以用 于將定點突變引入編碼CKI蛋白的基因內(nèi)。靶質(zhì)粒在這個系統(tǒng)中變性 后,2個引物同時與該質(zhì)粒退火;這些引物之一包含所需的定點突變, 另一個包含在該質(zhì)粒中另一個點上的突變,從而導致限制位點消除。
隨后進行緊密連接這兩個突變的第二條鏈合成,并將所得到的質(zhì)粒轉(zhuǎn) 化到大腸桿菌的mutS菌林內(nèi)。從轉(zhuǎn)化的細菌中分離質(zhì)粒DNA,用相關(guān)
限制酶進行限制性消化(從而使未突變的質(zhì)粒線性化),然后再轉(zhuǎn)化到大腸桿菌內(nèi)。這個系統(tǒng)允許直接在表達質(zhì)粒中產(chǎn)生突變,無需亞克 隆或產(chǎn)生單鏈噬菌粒。這兩個突變的緊密連接和未突變質(zhì)粒的隨后線 性化導致高突變效率且允許最低限度的篩選。在合成最初限制位點引 物后,這種方法對于每個突變位點只需要使用一個新引物類型。不是 分別制備每個位置突變體,而是可以合成一組"設(shè)計簡并"寡核苷酸 引物,以便在給定位點上同時引入所有所需突變。轉(zhuǎn)化體可以通過如
此來進行篩選經(jīng)過誘變區(qū)域?qū)|(zhì)粒DM進行測序,以鑒定和分選突 變體克隆。然后,每個突變體DNA可以進行限制性消化,并通過例如 在Mutation Detection Enhancement凝膠(J. T. Baker)上的電泳 來進行分析,以證實在序列中沒有發(fā)生其他改變(通過與未誘變對照 的帶移比較)。備選地,可以對整個DNA區(qū)域進行測序,以證實在靶 區(qū)域外沒有發(fā)生另外的突變事件。
pET (或其他)過表達載體中的經(jīng)驗證的突變體雙鏈體可以用于轉(zhuǎn) 化大腸桿菌,例如菌林大腸桿菌BL21 (DE3) pLysS,用于高水平產(chǎn)生 突變蛋白,和通過標準方案的純化。FAB-MS作圖法可以用于快速檢查 突變體表達的保真度。這種技術(shù)為測序完整蛋白質(zhì)各處的區(qū)段作準備, 并提供序列分配中的必需置信度。在這種類型的作圖實驗中,蛋白質(zhì) 用蛋白酶進行消化(選擇將取決于待修飾的具體區(qū)域,因為這個區(qū)段 具有主要意義,和剩余的圖應等同于未誘變蛋白質(zhì)的圖)。該組切割 片段通過例如微孔HPLC (反相或離子交換,再次取決于待修飾的具體 區(qū)域)來分級以在每個級分中提供幾種肽,和肽分子量通過標準方法 例如FAB-MS來測定。隨后將每個片段的測定質(zhì)量與從預測序列的消化 中預期的肽分子量進行比較,并快速確定序列的正確性。因為這種對 于蛋白質(zhì)修飾的誘變方法是定向的,所以當MS數(shù)據(jù)與預測一致時,對 于改變的肽進行測序?qū)⒉皇潜匦璧?。如果必需驗證改變的殘基,那么 可以使用CAD-串聯(lián)MS/MS來測序所述混合物的肽,或者取決于修飾的 部位,把肽可以進行純化以用于消減式Edman降解或羧肽酶Y消化。
在具體的定點誘變的設(shè)計中, 一般希望首先制備非保守置換,和 確定(a)所靶向的CDK或細胞周期蛋白結(jié)合活性是否受損和(b)任何未靼向的活性(例如,如果靼向CDK結(jié)合區(qū)域,那么細胞周期蛋白 結(jié)合)是否因此極大受損。如果殘基通過這種方法被證明對于未靶向 的生物活性是重要的,那么可以進行保守置換。
對于CKI核苷酸序列也可以使用其他定點誘變技術(shù)。例如,如一 般在Sambrook等人,#o/eci//ar {7/o/7//7g .. ^ "6or"or/他/7i/s/ (第 2版,1989 Cold Spring Harbor Laboratory Press, New York, NY) 的第15. 3節(jié)中所述,限制性核酸內(nèi)切酶消化DNA并隨后連接可以用于 產(chǎn)生CKIs的缺失變體。如Sambrook等人(同上)的第15. 3節(jié)中所述, 類似策略可以用于構(gòu)建插入變體。最近,Zhu等人(戶roc. Ws〃. JcaA 96: 8768-8773, 1999 )已設(shè)計出了使用嵌合RNA/DNA寡核 苷酸在體內(nèi)將突變靶向至植物基因的方法。
具有超過一個氨基酸置換的突變體多肽可以以幾種方法之一來產(chǎn) 生。如果所述氨基酸在多肽鏈中緊密地在一起,那么它們可以使用編 碼所有所需氨基酸置換的一個寡核苷酸同時進行突變。然而,如果所
述氨基酸彼此定位相隔一定距離(例如,由超過10個氨基酸隔開), 那么較難產(chǎn)生編碼所有所需變化的單個寡核苷酸。作為替代,可以使 用兩種備選方法之一。在第一種方法中,對于每個待置換的氨基酸產(chǎn) 生分開的寡核苷酸。隨后,將所述寡核苷酸同時對單鏈模板DNA進行 退火,和從該模板合成的DM的第二條鏈將編碼所有所需的氨基酸置 換。另一種備選方法包括2輪或更多輪誘變以產(chǎn)生所需突變體。如所 述的,第一輪關(guān)于單突變體野生型CKI DNA用于模板,將編碼第一 個所需氨基酸置換的寡核苷酸與這個模板進行退火,隨后產(chǎn)生異雙鏈 體DNA分子。第二輪誘變使用在第一輪誘變中產(chǎn)生的突變DNA作為模 板。因此,這個模板已包含一個或多個突變。然后,將編碼另外所需 氨基酸置換的寡核苷酸與這個模板進行退火,且所得到的DNA鏈現(xiàn)在 編碼來自第一和第二輪誘變的突變。這種所得到的DNA可以用作第三 輪誘變中的模板,等等。
用于指導鑒定合適修飾的一種特別合適的技術(shù)包括通過序列比對 來比對CKI蛋白。存在許多可以使用的上文討論的序列比對方法?;谛蛄械谋葘Τ绦虬ɡ? Smith-Waterman 搜索、 Needleman-Wunsch 、 Double Affine Smith-Waterman 、 框搜索、 Gribskov/GCG輪廓(profile)搜索、Gr ibskov/GCG輪廓掃描、輪廓 框搜索、Bucher—般化輪廓、Hidden Markov模型、Hframe、 Double Frame、 Blast、 Psi-Blast、 Clustal和GeneWise。(參見,例i口, Altschul等人,/,淑,倫厶215: 403-410, 1990; Altschul等 人,^/c7e/c Jc/" Wes, 25: 3389-3402, 1997,所述兩個參考文獻 引入作為參考)。
相關(guān)CKI多肽的氨基酸序列可以例如在多重序列比對(MSA)中進
行比對。(參見,例如,圖1) 。 MSA也可以用于將關(guān)于一種或多種 CKI多肽已知的結(jié)構(gòu)信息擴展至可能仍未被鑒定的另外CKI多肽(通 常擴展至共享基本序列同一性的CKI多肽)。由于不同CKI多肽之間 的高度結(jié)構(gòu)同源性,所以MSA可以用作在該比對內(nèi)在各個位置上的修 飾效應的可靠預報器。因此,在KRP家族成員的情況下,例如,圖1 中所示的CKI序列和編號可以用作關(guān)于任何其他KRP家族成員蛋白質(zhì) 序列的MSA參考點。如上所述,用于修飾的特別合適的氨基酸位置包 括相應于歐洲油菜KRPl(BnKrpl)的氨基酸位置145、 148、 149、 151、 153、 155、 163、 164、 165和/或167的那些。使用圖1中所示的比對, 和/或使用本領(lǐng)域已知的比對程序,例如本文描述的那些,可以使用比 對程序的編號系統(tǒng)作為參考點,且可以使該CKI多肽的相關(guān)位置與 CKIs的其他公認成員或結(jié)構(gòu)同系物和家族中的等價位置相關(guān)聯(lián)。類似 方法可以用于比對仍未被測序的CKI多肽的氨基酸序列。
在某些情況下,CKI多肽中與CDK或細胞周期蛋白相互作用的氨 基酸可以直接從CKI/CDK或CKI/細胞周期蛋白復合物的三維結(jié)構(gòu)中鑒 定。等價的信息可以通過分析相關(guān)CKI多肽的CKI/CDK或CKI/細胞周 期蛋白復合物來獲得。因此,結(jié)構(gòu)比對可以用于產(chǎn)生本發(fā)明的變體CKI 多肽。存在廣泛多樣的本領(lǐng)域已知的結(jié)構(gòu)比對程序。參見,例如,來 自NCBI網(wǎng)站的VAST; SSAP( 0rengo和Taylor,266: 617-635, 1996 ); SARF2 (Alexandrov, /V"e//7 9: 727-732,1996 ); CE ( Shinydyalov和Bourne, _Pr"e//7*. 11: 739-747, 1998 ); (0rengo等人,^ru""re 5: 1093-108, 1997 ); Dali(Holm 等人,Yyc/. JcA/ 26: 316-9, 1998,所有這些參考文獻引入
作為參考)。
因此,有用的在CKI/CDK或CKI/細胞周期蛋白界面處的修飾可以 使用蛋白質(zhì)設(shè)計或建模算法例如PDATM技術(shù)(參見美國專利號 6,188, 965; 6, 269,312;和6, 403, 312,所述專利在此引入作為參考) 來進行選擇。這類算法一般使用原子水平或氨基酸水平評分函數(shù),以 評估氨基酸序列與蛋白質(zhì)整體三級和四級結(jié)構(gòu)的兼容性。因此,這類 算法可以用于選擇CDK或細胞周期蛋白結(jié)合的修飾和/或破壞,所述修 飾和/或破壞基本上不干擾變體CKI蛋白正確折疊并與天然存在的靶 相互作用的能力,所述天然存在的靶相應于該蛋白質(zhì)的非修飾區(qū)域。 這些技術(shù)通常使用靶蛋白的高分辨率結(jié)構(gòu)信息作為輸入。在一個實施 方案中,經(jīng)實驗測定的合適CKI蛋白的結(jié)構(gòu)用作輸入。在備選實施方 案中,基于其三維結(jié)構(gòu)已使用結(jié)晶法或相關(guān)方法測定的家族亞群,MSA 可以用于指導關(guān)于CKI成員的原子水平同源性模型的構(gòu)建。在另外一 個實施方案中,哺乳動物p27/細胞周期蛋白界面的結(jié)構(gòu)模型可以用于 預測關(guān)于植物CKI的接觸氨基酸殘基。
具有經(jīng)修飾的例如減少的與CDK或細胞周期蛋白的結(jié)合的突變體 CKI多肽也可以通過大量各種其他方法來進行鑒定,所述方法包括例 如,定向進化(例如,易錯PCR, DNA改組等)、單位點飽和誘變、和 丙氨酸掃描誘變。在KRP CKIs的情況下,例如,使用這些和/或其他 方法可以允許鑒定另外的修飾,所述另外的修飾減少CDK結(jié)合活性且 位于本文所述的CDK結(jié)合區(qū)域外。
此外,分子動力學計算可以用于通過獨個地計算突變體序列得分 并匯編成列表來經(jīng)計算機篩選序列。此外,在計算機篩選期間殘基對 可能性(residue pair potentials )可以用于給序歹寸評分(Miyazawa 等人,他c層o/eci/7es 18: 534-552, 1985,引入本文作為參考)。
備選地,可以制備變體CKI蛋白文庫以用于測試。例如,可以使用變體CKI氨基酸序列文庫來設(shè)計編碼變體CKI序列的核酸,并且所 述核酸隨后可以克隆到宿主細胞內(nèi)、表達和測定。密碼子、合適的表 達載體、和合適的宿主細胞的選擇通常將依眾多因素而變,且可以根
據(jù)需要容易地進行優(yōu)化。
在用于篩選突變體文庫的一種特別合適的方法中,就顯性失活拮 抗劑活性和/或如本文所述的其他所需活性進行測試,進行使用合并的 寡核苷酸的多重PCR反應。合成相應于全長基因的重疊寡核苷酸。這 些寡核苷酸可以代表在每個變體位置或亞群處的所有不同氨基酸。這 些寡核苷酸可以以相等比例合并,并且進行多重PCR反應,以形成包 含由該文庫限定的突變組合的全長序列。此外,這可以使用易錯PCR 方法來完成。
通常,每個重疊寡核苷酸只包含一個待改變的位置。備選地,變 體位置太靠近在一起而不允許使用每寡核苷酸這個和多個變體來允許 完全組合所有可能性(即,每個oligo可以包含被突變的單個位置, 或超過一個被突變的位置的密碼子)。被突變的多個位置在序列中優(yōu) 選是接近的,以阻止oligo核苷酸長度不切實際。為了使寡核苷酸上 的多個位置突變,通過包括或排除編碼那個組合的寡核苷酸可以在文 庫中包括或排除特定的突變組合。例如,如本文討論的,在可變區(qū)之 間可能存在關(guān)聯(lián);即,當位置X是某一殘基時,位置Y—定(或不一 定)是特定殘基。這些可變位置組在本文中有時稱為"聚類(cluster )"。 當聚類由靠近在一起的殘基組成,并因此可以位于一個寡核苷酸引物 上時,聚類可以被設(shè)定為"良好"關(guān)聯(lián),且消除了可能減少文庫效率 的不利組合。然而,如果聚類的殘基在序列中相隔很遠,并因此將位 于用于合成的不同寡核苷酸上,那么可能希望將殘基設(shè)定為"良好" 關(guān)聯(lián),或?qū)⑺鼈冏鳛榭勺儦埢耆?。備選地,文庫可以在幾個步 驟中產(chǎn)生,從而使得聚類突變只能一起出現(xiàn)。這個操作程序,即,鑒 定突變聚類以及將它們置于同一寡核苷酸上或在保存聚類的幾個步驟 中將它們從文庫或文庫產(chǎn)生中清除的操作程序,可以相當大地富集具 有經(jīng)適當折疊的蛋白質(zhì)的文庫。聚類的鑒定可以通過許多方法來進行,例如,使用已知的模式識別方法,突變出現(xiàn)頻率的比較,或使用待經(jīng) 實驗產(chǎn)生的序列的能量分析(例如,如果相互作用能量很高,那么位
置是相關(guān)聯(lián)的)。這些關(guān)聯(lián)可以是位置關(guān)聯(lián)(例如,可變位置1和2 總是一起改變或從不一起改變)或序列關(guān)聯(lián)(例如,如果殘基A在位 置1,那么在位置2上總是殘基B)。(參見戶a"eri3 "/sc^ery 5/o邁o/ecw7ar/ a7bo/s, TecAn/gi/es, a/7f/^pp/ic<2 t/0/2s; ( Jason T. L. Wang, Bruce A. Shapiro, Dennis Shasha eds. , New York, Oxford University, 1999 ); Andrews, //7"0^/c〃0/7 fol"力e咖〃ca/ rec力/2/《wes //7/^"er/ 7 eco^73/'〃an(NewYork , Wiley-lnterscience, 1972 ); j"http://ca〃0/2s o尸戶a"er" Aecog/7/〃0/7 (K. S. Fu ed. , Boca Raton, FL, CRC Press, 1982 ) ; Ce/7e〃c j/^ r"力釘尸or戶a〃er/7 Aeco#/7/〃an( Sankar K. Pal和Paul P. Wang eds. , Boca Raton, FL, CRC Press, 1996 ); Pandya, Z^〃eiT2 Aecog/2/〃o;7 Wefwori^/力C++(Boca Raton, FL, CRCPress, 1996 ); i7s/^/6ooir 0/"戶a〃e/V7 Aecog/7/'〃0/7》Co/z7/7i/f" f7"'o/ ( C. H. Chen, L. F. Pau和P. S. P. Wang, eds.,第2版,Singapore; River Edge, N. J. , World Scientific, c1999 ) ; Friedman, //2"0^c〃an &
丄og/c J/ /7roac力es ( River Edge, NJ. , World Scientific, 1999,
Series title: Series in machine perception and artificial
intelligence;第32巻);所有這些參考文獻特別引入作為參考。此
外,用于搜索共有基序的程序也可以使用。
具有密碼子插入或缺失的寡核苷酸可以用于形成表達不同長度蛋
白質(zhì)的文庫。特別地,篩選插入或缺失的計算機序列可以導致產(chǎn)生限 定不同長度蛋白質(zhì)的次級文庫,所述文庫可以由合并的具有不同長度 的寡核苷酸的文庫來表達。
在另 一個實施方案中,本發(fā)明的突變體CKI多肽通過改組家族(例 如,突變體組)來形成;即,某些頂部序列組(如果使用按等級分級 的列表)可以使用或不使用易錯PCR來進行改組。在這種情況下的"改組"意指一般以隨機方式進行的相關(guān)序列重組。它可以包括如美國專
利號5, 830, 721; 5, 811,238; 5, 605, 793; 5, 837, 458和PCT US/19256 中定義和示例的"改組",所有這些專利引入本文作為參考。這組序 列也可以是人造組;例如,來自概率表(例如使用SCMF產(chǎn)生的)或 Monte Carlo組。類似地,"家族"可以是頂部10個和底部10個序 列,頂部100個序列等。這也可以使用易錯PCR來完成。
因此,可以使用本文所述的計算機方法來進行在計算機上的改組 (例如,從2個文庫或2個序列開始,可以產(chǎn)生并評估序列的隨機重 組)。
可以進行易錯PCR以產(chǎn)生變體CKI多肽的文庫。參見美國專利號 5, 605, 793, 5, 811, 238和5, 830, 721,所述專利在此引入作為參考。 這可以對文庫或某些其他人造組或家族的最佳序列或頂部成員來進 行。在這種方法中,可以合成在初級文庫的計算機篩選中發(fā)現(xiàn)的最佳 序列的基因。隨后在編碼在文庫的變體位置上的突變的寡核苷酸(偏 向寡核苷酸)存在下對最佳序列基因進行易錯PCR。寡核苷酸的添加 將形成支持突變摻入文庫中的偏向。備選地,只有關(guān)于某些突變的寡 核苷酸可以用于使文庫產(chǎn)生偏向。
在偏向寡核苷酸的存在下,可以用易錯PCR對最佳序列的基因來 進行基因改組,以形成反映在CKI文庫中發(fā)現(xiàn)的突變比例的DNA序列 文庫。偏向寡核苷酸的選擇可以以各種方法來完成;它們可以基于其 頻率來選擇,例如,可以使用編碼高突變頻率位置的寡核苷酸;備選
地,可以使用包含最可變位置的寡核苷酸,從而使得多樣性增加;如 果次級文庫進行排序,那么可以使用一定數(shù)目的頂部評分位置來產(chǎn)生 偏向寡核苷酸;可以選擇隨機位置;可以選擇少數(shù)頂部評分和少數(shù)低 評分位置;等等。重要的是基于優(yōu)選的可變位置和序列來產(chǎn)生新序列。 在另一種變化形式中,可以采用使用野生型基因或其他基因的 PCR。在這個實施方案中,使用起始基因(例如,野生型基因,編碼總 體優(yōu)化序列或例如由比對來自不同生物的同源序列而獲得的共有序列 的基因)。在這個實施方案中,使用相應于變體位置且包含文庫的不同氨基酸的寡核苷酸。PCR使用在末端的PCR引物來完成。這提供了 兩個益處。首先,這一般需要較少的寡核香酸且可以導致較少的誤差。 其次,它具有實驗優(yōu)點,因為如果使用野生型基因,那么它不需要被 合成。
突變體CKI多肽可以來自任何數(shù)目的生物,其中來自植物的CKI 多肽是特別優(yōu)選的。合適的植物包括,例如順應于轉(zhuǎn)化技術(shù)的高等植 物種類,包括單子葉和雙子葉植物,以及某些低等植物例如藻類。它 包括各種倍性水平的植物,包括多倍體、二倍體和單倍體。在具體實 施方案中,植物是歐洲油菜、擬南芥、大豆(67yc/"e邁a力、玉米、
稻、小麥、苜蓿、棉花、楊樹等。
如上所述,本發(fā)明的突變體CKI多肽是野生型CKI多肽的顯性失 活拮抗劑。在某些實施方案中,突變體CKI多肽只與其相應的細胞周 期蛋白或CDK蛋白(即,來自CKI突變體所源自的物種的內(nèi)源性的、 天然存在的CDK或細胞周期蛋白)之一或兩者物理地相互作用,從而 使得包含突變體CKI的CDK/細胞周期蛋白復合物被保護而不遭受經(jīng)由 野生型CKI蛋白引起的CDK/細胞周期蛋白激酶抑制。
在備選的、非互相排斥的實施方案中,突變體CKI多肽只與異源 CDK或細胞周期蛋白(即,來自與CKI突變體所源自的物種不同的物 種的天然存在的CDK或細胞周期蛋白)之一或兩者物理地相互作用,
遭受經(jīng)由野生型CKI蛋白引起的CDK/細胞周期蛋白激酶抑制,所述野 生型CKI蛋白相應于在該復合物內(nèi)的CDK和細胞周期蛋白(即,通過 對于所述CDK和細胞周期蛋白而言內(nèi)源的野生型CKI蛋白)。
在某些實施方案中,本發(fā)明的突變體CKI多肽是對于相應野生型 CKI蛋白的高特異性拮抗劑。在備選實施方案中,本發(fā)明的突變體CKI 多肽是對于超過一種野生型CKI多肽的特異性拮抗劑。例如,突變體 擬南芥屬植物CKI多肽可以只是野生型擬南芥屬植物CKI多肽的特異 性拮抗劑,或?qū)τ谝吧蛿M南芥屬植物、歐洲油菜、大豆、玉米、稻、 棉花和/或楊樹CKI多肽是特異的。同樣地,突變體蕓苔屬植物CKI多肽可以只是野生型蕓苜屬植物CKI多肽的特異性拮抗劑,或是野生 型擬南芥屬植物、歐洲油菜、大豆、玉米、稻、小麥、苜蓿、棉花和/ 或楊樹的特異性拮抗劑。
與野生型CKI多肽相比較,突變體CKI多肽顯示出實質(zhì)上減少的 生物活性,包括,例如,修飾的與CDK或細胞周期蛋白之一的結(jié)合以 及減少的CDK/細胞周期蛋白激酶復合物的抑制。此類減少的生物活性 可以使用體內(nèi)和/或體外測定法進行測試和驗證。合適的測定法包括但 不限于,CDK/細胞周期蛋白激酶活性測定法;CDK或細胞周期蛋白結(jié) 合測定法;和細胞增殖測定法。與野生型CKI多肽相比較生物活性的 實質(zhì)減少意指,變體CKI多肽的生物活性為相應野生型CKI多肽的80 %或70%,通常60%或50%,更通常40%或30%,且優(yōu)選20%或 10%。
在某些實施方案中,與野生型CKI多肽相比較,突變體CKI多肽 包括修飾,除了本文所述的那些(即,與除了用于產(chǎn)生顯性失活蛋白 質(zhì)的那些之外,與相應野生型CKI蛋白相比較,突變體CKI蛋白可以 包含另外的修飾)。例子包括但不限于,被引入以使得能夠在大腸桿 菌中進行可溶性表達的氨基酸置換,和被引入以優(yōu)化溶解行為的氨基 酸置換。此外,如本文所述,本文所述的任何突變可以以各種方法組 合以形成另外的變體CKI多肽。此外,可以制備比相應的野生型蛋白 質(zhì)更長的突變體CKI多肽,例如,通過添加表位或純化標記,添加其 他融合序列等,或者它們可以更短。
突變體CKI多肽也可以鑒定為由突變體CKI核酸來編碼。在核酸
的情況下,核酸序列的總體序列同一性與氨基酸序列同一性相稱,但 要考慮不同生物的遺傳密碼的簡并性和密碼子偏愛。因此,核酸序列 同 一性可以比蛋白質(zhì)序列同 一性更低或更高,其中更低的序列同 一性 是通常的。
如本領(lǐng)域技術(shù)人員將會意識到的,由于遺傳密碼的簡并性,可以 制備非常大量的核酸,所有這些核酸都編碼本發(fā)明的突變體CKI多肽。 因此,如果已鑒定了特定氨基酸序列,任何數(shù)目的編碼突變體蛋白的不同核酸可以通過以不改變突變體CKI多肽的氨基酸序列的方式簡單 地修飾一個或多個密碼子的順序來制備。
本發(fā)明的突變體CKI多肽和核酸優(yōu)選是重組的(除非合成制備)。 如上所述,突變體通常通過在編碼相應CKI蛋白的DNA中的核苷酸的 定點誘變來制備,使用盒或PCR誘變或另一種本領(lǐng)域眾所周知的技術(shù), 以產(chǎn)生編碼突變體的DNA,并且此后在重組細胞培養(yǎng)中表達該DNA。氨 基酸序列突變體通過預定的突變性質(zhì)來表征,即將它們遠離該突變體 CKI蛋白氨基酸序列的天然存在的等位基因或種間變異的特征。如上 所述,變體通常顯示出相似的CDK或細胞周期蛋白結(jié)合(因此,與相 應的野生型CKI蛋白相比較,突變體顯示出其抑制活性的實質(zhì)減少; 盡管也可以選擇具有另外變體特征的變體)。
盡管用于引入氨基酸序列變異的位點或區(qū)域是預定的,但突變本 身無需是預定的。例如,為了使給定位點上的突變表現(xiàn)進行優(yōu)化,隨 機誘變可以在靼密碼子或區(qū)域上進行,并就所需活性的最佳組合來篩 選表達的變體CKI蛋白。用于在具有已知序列的DNA中的預定位點處 制備置換突變的技術(shù)是眾所周知的,例如,M13引物誘變和PCR誘變。 突變體的篩選使用對于最佳特征的突變體CKI蛋白活性測定法來完 成。
在某些實施方案中,氨基酸置換是單個殘基。在其他實施方案中, 多個氨基酸殘基被置換(例如,2、 3、 4或更多個氨基酸可以被置換)。 插入片段通常為約1-約20個氨基酸的級別,盡管可以耐受相當更大 的插入片段。缺失為約1-約20個殘基,或約1-約30個殘基,盡管 在某些情況下缺失可以大得多。在某些實施方案中,突變體CKI多肽 是來源于兩個或更多個野生型CKI蛋白的嵌合體,其中具有至少一個 如本文所述的在CDK或細胞周期蛋白結(jié)合區(qū)域中的修飾。
置換、缺失、插入或其任何組合用于達到最終突變體。 一般地, 修飾就相對少數(shù)的氨基酸而言來進行,以使分子改變最小化。然而, 在某些情況下,可以耐受較大的變化。
使用編碼突變體CKI多肽的本發(fā)明核酸,可以制備各種載體。包含復制子和控制序列(來源于與宿主細胞相容的物種)的任何載體可 以在本發(fā)明的實踐中使用。載體可以是自主復制的染色體外載體或整
合到宿主基因組內(nèi)的載體。 一般地,表達載體包括與編碼突變體CKI 多肽的核酸可操作地連接的轉(zhuǎn)錄和翻譯調(diào)節(jié)核酸區(qū)域。術(shù)語"控制序 列"指對于在特定宿主生物中表達可操作地連接的編碼序列而言所需 的DNA序列。適合于原核生物的控制序列,例如,包括啟動子,任選 地操縱子序列,和核糖體結(jié)合位點。轉(zhuǎn)錄和翻譯調(diào)節(jié)核酸區(qū)域一般將 會適合于用于表達該多肽的宿主細胞。
在某些實施方案中,CKI核酸通過使用密碼子優(yōu)化來進行修飾以 用于增強在宿主細胞中的基因表達,所述密碼子優(yōu)化涉及用在待表達 所述DNA分子的細胞種類中高度使用的翻譯密碼子(相應于同 一氨基 酸)替換密碼子序列。已就在玉米中表達進行優(yōu)化的BnKrpl突變體編 碼序列(BnKrpl F151A; F153A和Y149A; F151A; F153A)的例子顯 示于圖3中。密碼子優(yōu)化操作一般是本領(lǐng)域眾所周知的,且可以由本 領(lǐng)域技術(shù)人員使用來獲得依照本發(fā)明的其他經(jīng)密碼子優(yōu)化的突變體 Krpl序列。
對于各種宿主細胞,本領(lǐng)域中已知眾多類型的合適的表達載體和 合適的調(diào)節(jié)序列。 一般而言,轉(zhuǎn)錄和翻譯調(diào)節(jié)序列可以包括,例如, 啟動子序列、核糖體結(jié)合位點、轉(zhuǎn)錄起始和終止序列、翻譯起始和終 止序列、和增強子或激活子序列。在典型的實施方案中,調(diào)節(jié)序列包 括啟動子以及轉(zhuǎn)錄起始和終止序列。載體通常還包括包含用于插入外 源DNA的幾個限制位點的多位點接頭區(qū)域。使用標準重組DNA操作程 序來進行合適載體的構(gòu)建,所述合適載體包含編碼復制序列的DNA、 調(diào)節(jié)序列、表型選擇基因、和目的變體CKI DNA。如本領(lǐng)域眾所周知 的(參見,例如,Maniatis,同上;和Sambrook等人,同上),分離 的質(zhì)粒、病毒載體和DNA片段被切割、剪切并以特定次序連接在一起, 以產(chǎn)生所需載體。
啟動子序列編碼組成型或誘導型啟動子。所述啟動子可以是天然 存在的啟動子或雜合啟動子。組合了超過一種啟動子的元件的雜合啟動子也是本領(lǐng)域已知的,并且在本發(fā)明中是有用的。在典型的實施方 案中,所述啟動子是強啟動子,其允許在細胞特別是植物細胞中高表 達。特別適合于依照本發(fā)明使用的啟動子在下文進一步描述。
此外,表達載體可以包含另外元件。例如,表達載體可以具有2 個復制系統(tǒng),從而允許它在2種生物中維持,例如在植物或昆蟲細胞 中用于表達和在原核宿主中用于克隆和擴增。進一步地,為了整合表 達載體,表達載體包含至少一個與宿主細胞基因組同源的序列,并且 優(yōu)選包含位于該表達構(gòu)建體側(cè)翼的2個同源序列。通過選擇用于包含 在載體中的合適同源序列,可以將整合型載體導向宿主細胞中的特定 基因座。關(guān)于整合型載體的構(gòu)建是本領(lǐng)域眾所周知的。
在某些實施方案中,表達載體包含選擇標記基因以允許選擇轉(zhuǎn)化 的宿主細胞。選擇基因是本領(lǐng)域眾所周知的,并且將依所使用的宿主 細胞而變。合適的選擇基因可以包括,例如編碼氨千青霉素和/或四環(huán) 素抗性的基因,這使得用這些載體轉(zhuǎn)化的細胞能夠在這些抗生素的存 在下生長。
在本發(fā)明的一個方面,將突變體CKI核酸引入細胞之內(nèi),單獨地 或與栽體一起。"引入......之內(nèi)"或語法上的等價形式意指,核酸以
適合于核酸的后續(xù)整合、擴增和/或表達的方式進入細胞。引入方法在 很大程度上由所靶向的細胞類型指定。示例性方法包括CaP0,沉淀、 脂質(zhì)體融合、lipofectin 、電穿孔、病毒感染等。特別適合于引入植 物細胞內(nèi)的方法是本領(lǐng)域已知的,并且也在下文描述(參見,部分II, "轉(zhuǎn)基因植物")。此類方法包括例如,用裝載有DNA的微粒轟擊細 胞。突變體CKI核酸可以穩(wěn)定地整合到宿主細胞的基因組內(nèi),或可以 瞬時或穩(wěn)定地存在于細胞質(zhì)中(例如,通過使用傳統(tǒng)質(zhì)粒,使用標準 調(diào)節(jié)序列、選擇標記等)。
原核生物可以用作宿主細胞以用于本發(fā)明的起始克隆步驟。它們 特別可用于大量DNA的快速生產(chǎn),用于產(chǎn)生在定點誘變中使用的單鏈 DNA模板,用于同時篩選許多突變體,和用于所產(chǎn)生的突變體的DNA 測序。合適的原核宿主細胞包括大腸桿菌K12菌林94 (ATCC No.31,446 )、大腸桿菌菌林W3110 ( ATCCNo. 27, 325 )、大腸桿菌X1776 (ATCC No. 31, 537 )和大腸桿菌B;然而,許多其他大腸桿菌菌林, 例如HBIOI、 JMIOI、歷522、 NM538、 NM539,以及原核生物的許多其 他種和屬,包括桿菌例如枯草芽胞桿菌(勘w7/^^/Wi/"),其他 腸桿菌科例如鼠傷寒沙門氏菌(^27/z o/7e/7s 077力/zz/"W咖)或粘質(zhì)沙 雷氏菌(Serra〃a鵬rce5^/ s), 和各種假單胞菌屬(/^ewf/o邁ooas) 物種都可以用作宿主。具有堅硬細胞壁的原核宿主細胞或其他宿主細 胞通常使用如在Sambrook等人(同上)的第1.82節(jié)中描述的氯化鈣 方法進行轉(zhuǎn)化。備選地,電穿孔可以用于轉(zhuǎn)化這些細胞。原核細胞轉(zhuǎn) 化技術(shù)在下述參考文獻中描述,例如,Dower, to e〃""^7/7eeWi^, 戶r/"c/; 7es a/7d12: 275-296 (Plenum Publishing Corp., 1990 ) ; Hanahan等人,,204: 63, 1991。通常用于 轉(zhuǎn)化大腸桿菌的質(zhì)粒包括pBR322、 pUCI8、 pUCI9、 pUCI18、 pUC119 和Bluescript M13,所有這些質(zhì)粒在Sambrook等人(同上)的第 1. 12-1. 20節(jié)中描述。然而,許多其他合適載體也是可用的。
本發(fā)明的突變體CKI多肽通常通過下述來產(chǎn)生在合適條件下培 養(yǎng)用包含編碼突變體CKI多肽的核酸的表達載體轉(zhuǎn)化的宿主細胞,以 誘導或引起突變體CKI多肽表達。為了調(diào)節(jié)細胞分裂,CKI蛋白以其 正常的細胞內(nèi)形式表達。對于包括收獲或分離突變體CKI多肽的本發(fā) 明應用,可以將CKI突變體表達為細胞內(nèi)蛋白質(zhì),或備選地,以從宿 主細胞中分泌的形式。通常從細胞中分泌的許多真核蛋白質(zhì)包含內(nèi)源 分泌信號序列作為氨基酸序列的一部分。因此,通過將信號序列與蛋 白質(zhì)連接可以將通常在細胞質(zhì)中發(fā)現(xiàn)的蛋白質(zhì)靶向至分泌。這通過下 述容易地完成使編碼信號序列的DNA與編碼蛋白質(zhì)的DNA的5'末端 連接,并隨后在合適的宿主細胞中表達這種融合蛋白。編碼信號序列 的DNA可以作為任何編碼具有信號序列的蛋白質(zhì)的基因的限制性片段 而獲得。因此,取決于用于實踐本發(fā)明的宿主細胞類型,可以在本文 中使用原核、酵母和真核信號序列。編碼幾種真核基因的信號序列部 分的DNA和氨基酸序列是已知的,所述幾種真核基因包括例如人生長激素、胰島素原和白蛋白原(參見Stryer, A/oc力e/z /"iT (W. H. Freeman and Company, New York, NY, 1988,第769頁)),并且 所述序列可以在合適的真核宿主細胞中用作信號序列。酵母信號序列 例如酸性磷酸酶(Arima等人,iV"c. ^c/'^ Wes. 11: 1657, 1983 )、 oc-因子、堿性磷酸酶和轉(zhuǎn)化酶可以用于指導從酵母宿主細胞中的分 泌。來自編碼例如LamB或OmpF (Wong等人,Ce/2e68: 193, 1988 )、 MalE、 PhoA或p-內(nèi)酰胺酶的基因以及其他基因的原核信號序列,可 以用于將在原核細胞中表達的蛋白質(zhì)靶向進入培養(yǎng)基內(nèi)。
對于突變體CKI多肽表達來說適當?shù)臈l件將依所選表達載體和宿 主細胞而變,并且將由本領(lǐng)域技術(shù)人員通過常規(guī)試驗容易地確定。例 如,表達栽體中組成型啟動子的使用將需要優(yōu)化宿主細胞的生長和增 殖,而誘導型啟動子的使用需要合適的生長條件以用于誘導。此外, 在某些實施方案中,收獲的時間選擇是重要的。例如,在昆蟲細胞表 達中使用的桿狀病毒系統(tǒng)是裂解性病毒,因此收獲時間的選擇對于產(chǎn) 物得率可以是重要的。
原核載體中最常使用的啟動子包括p-內(nèi)酰胺酶(青霉素酶)和乳 糖啟動子系統(tǒng)(Chang等人,A"由re 375: 615, 1978; Itakura等人, Sc/e/2ce 198: 1056, 1977; Goeddel等人,#"〃" 281: 544, 1979 ) 和色氨酸(trp)啟動子系統(tǒng)(Goeddel等人,iVwcA Jc2 s Wes. 8: 4057, 1980; EP0申請
發(fā)明者J·德洛舍爾, P·奧利維爾 申請人:目標栽培公司