專利名稱:人工植物微染色體的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及植物生物工程領(lǐng)域,具體地講,涉及人工微染色體以及在植物中制備這類微染色體的方法。
背景技術(shù):
目前在染色體工程上的進(jìn)展使得改變植物基因組成為可能,因此可改變其表型。當(dāng)轉(zhuǎn)基因整合到植物基因組時(shí),通常是以隨機(jī)方式,而且拷貝數(shù)無法預(yù)知。因此,研究工作直接針對(duì)更好地控制轉(zhuǎn)基因整合。如果有這樣的需要,研究人員想知道答案是否在于使用人工微染色體。它們是由順式作用(cis-acting)DNA序列元件構(gòu)建的人工制備的線狀或環(huán)狀DNA分子,所述序列元件可提供所構(gòu)建微染色體的復(fù)制和分配。據(jù)信,人工染色體的產(chǎn)生將會(huì)減少或消除與隨機(jī)基因組整合到天然植物染色體相關(guān)的問題,例如因轉(zhuǎn)基因與宿主植物基因組材料結(jié)合而造成的連鎖拖曳(linkage drag)。人工染色體也可提供比標(biāo)準(zhǔn)轉(zhuǎn)化載體多10-100倍的基因的遞送方法,并提供大染色體區(qū)段,用于互補(bǔ)和/或基于圖譜的克隆。對(duì)于人工染色體復(fù)制、穩(wěn)定性和維持/遺傳,已經(jīng)鑒定出3種組分:(i)作為復(fù)制起點(diǎn)的自主復(fù)制序列;(ii)起到穩(wěn)定和維持線狀染色體末端作用的端粒,(iii)作為動(dòng)粒裝配位點(diǎn)的著絲粒,用于有絲分裂和減數(shù)分裂中染色體的適當(dāng)分離。來自單細(xì)胞生物(例如酵母)的分離著絲粒在高等真核生物中不起作用。美國專利5,270,201 (1993年12月14日授予Richards等人)描述了基于端粒和任選著絲粒的植物人工染色體。美國專利7,119,250(2006年10月10日授予Luo等人)描述了植物著絲粒的組成。美國專利7,132,240 (2006年11月7日授予Richards等人)描述了從任何生物
的著絲粒中有效分離甲基化著絲粒DNA的可行方法。美國專利7,193,128 (2007年3月20日授予Copenhaver等人)描述了用植物著絲粒的核酸序列來產(chǎn)生或增加作物收益的方法。2007年3月15日公布的公布號(hào)為W02007/030510的PCT申請(qǐng)描述了用自主微染色體轉(zhuǎn)化植物的制備方法。發(fā)明概沭 本發(fā)明涉及包含功能性著絲粒的人工植物微染色體,其包含:(a)至少2個(gè)反向CentC串聯(lián)重復(fù)序列陣列,其中第I陣列包含至少50個(gè)拷貝的CentC,第2陣列包含至少50個(gè)拷貝的CentC ;和(b)至少一個(gè)拷貝的反轉(zhuǎn)錄轉(zhuǎn)座元件,其中反轉(zhuǎn)錄轉(zhuǎn)座元件位于第I陣列和第2陣列之間。
在第2個(gè)實(shí)施方案中,本發(fā)明的人工植物微染色體包含選自CentA、CRMl和CRM2的反轉(zhuǎn)錄轉(zhuǎn)座元件。在第3個(gè)實(shí)施方案中,本發(fā)明的人工植物微染色體還包含至少一個(gè)功能性端粒。在第4個(gè)實(shí)施方案中,人工植物微染色體所包含的功能性著絲粒與著絲粒蛋白C(CENPC)特異性結(jié)合。在第5個(gè)實(shí)施方案中,玉米植物(corn plant)可包含任何本發(fā)明的人工微染色體。在第6個(gè)實(shí)施方案中,本發(fā)明涉及包含功能性著絲粒的人工植物微染色體,其中著絲粒與著絲粒蛋白C(CENPC)特異性結(jié)合。在第7個(gè)實(shí)施方案中,本發(fā)明涉及分離的多核苷酸,其包含:(a)至少2個(gè)反向CentC串聯(lián)重復(fù)序列陣列,其中第I陣列包含至少10個(gè)拷貝的CentC,第2陣列包含至少10個(gè)拷貝的CentC ;和(b)至少一個(gè)拷貝的反轉(zhuǎn)錄轉(zhuǎn)座元件,其中反轉(zhuǎn)錄轉(zhuǎn)座元件位于第I陣列和第2陣列之間。在第8個(gè)實(shí)施方案中,本發(fā)明的分離多核苷酸包含選自CentA、CRMl和CRM2的反轉(zhuǎn)錄轉(zhuǎn)座元件。在第9個(gè)實(shí)施方 案中,本發(fā)明涉及分離的多核苷酸,其包含:(a)至少一個(gè)CentC串聯(lián)重復(fù)序列陣列,該陣列包含至少10個(gè)拷貝的CentC;和(b)至少一個(gè)拷貝的選自CentA、CRMl和CRM2的反轉(zhuǎn)錄轉(zhuǎn)座元件。在第10個(gè)實(shí)施方案中,本發(fā)明涉及分離的多核苷酸,其包含:(a)至少一個(gè)CentC串聯(lián)重復(fù)序列陣列,該陣列包含至少10個(gè)拷貝的CentC ;和(b)CentA、CRMl和CRM2各自至少一個(gè)拷貝。在第11個(gè)實(shí)施方案中,本發(fā)明涉及重組構(gòu)建體以及包含這類重組構(gòu)建體的轉(zhuǎn)基因玉米植物,所述構(gòu)建體包含本發(fā)明的分離多核苷酸。在第12個(gè)實(shí)施方案中,本發(fā)明涉及包含具有功能性著絲粒的人工植物微染色體的轉(zhuǎn)基因玉米植物的制備方法,所述方法包括:(a)使至少一個(gè)玉米植物細(xì)胞與包含本發(fā)明重組構(gòu)建體的混合物接觸;(b)鑒定來自步驟(a)并包含具有功能性著絲粒的人工植物微染色體的至少一個(gè)玉米植物細(xì)胞;和(C)使來自步驟(b)的玉米植物細(xì)胞再生出能育的玉米植物,其中所述玉米植物包含具有功能性著絲粒的人工植物微染色體。所述混合物還可包含編碼用于刺激細(xì)胞生長的多肽的多核苷酸,其中該多肽選自wuschel、baby boom、RepA或Lecl。附圖簡沭本專利或申請(qǐng)文件包括至少一幅彩色附圖。如有需要并支付必要費(fèi)用后,專利辦公室將會(huì)提供帶彩圖的本專利或?qū)@暾?qǐng)公布說明書副本。根據(jù)作為本申請(qǐng)組成部分的以下詳述和附圖及序列表,可以更全面地理解本發(fā)明。
圖1.來自H1-1I轉(zhuǎn)化CMC3庫I事件#14的玉米胚胎發(fā)生愈傷組織(embryogeniccalli)的有絲分裂染色體鋪片(spread)的熒光原位雜交(FISH)。愈傷組織源自用Tn5_3改型(retrofit)的線性化BAC克隆庫I轉(zhuǎn)化的未成熟胚。前中期(左)和中期(右)核都顯示出20條天然染色體和I條微染色體(箭頭和插圖)。這兩種微染色體對(duì)CentC(綠色一顏色;白色一灰度)著絲粒特異性重復(fù)序列和對(duì)轉(zhuǎn)化構(gòu)建體具有特異性的獨(dú)特標(biāo)記探針23715(紅色一顏色;白色一灰度)都呈陽性,其中CentC和23715基本上共同定位(colocalize)于微染色體(插圖)。圖2.來自H1-1I轉(zhuǎn)化CMC3庫I事件#14的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的FISH。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫I轉(zhuǎn)化的未成熟胚。圖A顯示中期核,顯示出20條天然染色體和2條微染色體(方框)。這兩種微染色體對(duì)CentC (綠色一顏色;白色一灰度)著絲粒特異性重復(fù)序列和對(duì)轉(zhuǎn)化構(gòu)建體具有特異性的獨(dú)特標(biāo)記探針23715 (紅色一顏色;白色一灰度)都呈陽性。圖B-D是該方框的更高放大倍數(shù)圖,顯示出微染色體(箭頭),其中:B-RDAPI ;C-DAPI+23715探針(紅色一顏色;白色一灰度);和D-DAPI+CentC探針(綠色一顏色;白色一灰度)。圖3.來自H1-1I轉(zhuǎn)化CMC3庫I事件#14的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的免疫熒光。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫I轉(zhuǎn)化的未成熟胚。圖A顯示中期核,顯示出20條天然染色體和I條微染色體(箭頭)。天然染色體和微染色體的所有著絲粒對(duì)著絲粒蛋白C(即CENPC,一種著絲粒/動(dòng)粒特異性蛋白)(紅色一顏色;白色一灰度)都呈陽性。圖B-C是微染色體的更高放大倍數(shù)圖,其中=B-RDAPI ;和C-DAPI+CENPC(紅色一顏色;白色一灰度)。CENPC的形態(tài)和免疫學(xué)定位表明,微染色體由各自具有功能性著絲粒的兩條姊妹染色單體組成。圖4.圖A-來自H1-1I轉(zhuǎn)化CMC3庫I事件#14的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的免疫熒光。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫I轉(zhuǎn)化的未成熟胚。在分裂后期觀察到天然染色體和微染色體(方框)的姊妹染色單體分離。天然染色體和微染色體的所有著絲粒對(duì)著絲粒蛋白C(即CENPC,一種著絲粒/動(dòng)粒特異性蛋白)(紅色一顏色;白色一灰度)都呈陽性。圖B是A中方框的更高放大倍數(shù)圖,顯示出微染色體姊妹染色單體的分 離(雙箭頭),表明微染色體同正常染色體一樣,在有絲分裂中可以分離。圖5.來自H1-1I轉(zhuǎn)化CMC3庫3事件#12的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的FISH。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫3轉(zhuǎn)化的未成熟胚。顯示了四-非整倍體(tetra-aneuploid) (39條染色體,缺乏I個(gè)拷貝的染色體6)中期核,顯示出天然染色體和I條微染色體(箭頭)。微染色體對(duì)CentC (綠色一顏色;白色一灰度)著絲粒特異性重復(fù)序列和對(duì)轉(zhuǎn)化構(gòu)建體具有特異性的獨(dú)特標(biāo)記探針23715(紅色一顏色;白色一灰度)都呈陽性。圖B-D是方框區(qū)的更高放大倍數(shù)圖,顯示出微染色體(箭頭)和天然染色體,其中:A-僅DAPI ;B-DAPI+CentC探針(綠色一顏色;白色一灰度);和D-DAPI+23715探針(紅色一顏色;白色一灰度)。如微染色體的FISH染色所示,CentC重復(fù)序列的兩極定位表明它是由兩條姊妹染色單體組成,這與天然染色體中所觀察的一樣。圖6.來自H1-1I轉(zhuǎn)化CMC3庫3事件#12的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的FISH。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫3轉(zhuǎn)化的未成熟胚。圖A-四-非整倍體(39條染色體,缺乏I個(gè)拷貝的染色體6)中期核,顯示出天然染色體和2條微染色體(箭頭)。 微染色體對(duì)CentC (綠色一顏色;白色一灰度)著絲粒特異性重復(fù)序列和對(duì)轉(zhuǎn)化構(gòu)建體具有特異性的獨(dú)特標(biāo)記探針23715 (紅色一顏色;白色一灰度)都呈陽性。圖B是2條微染色體的更高放大倍數(shù)圖,顯示出CentC重復(fù)序列和獨(dú)特標(biāo)記23715的豐度的變化。圖7.來自H1-1I轉(zhuǎn)化CMC3庫3事件#12的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的FISH。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫3轉(zhuǎn)化的未成熟胚。圖A-四-非整倍體(39條染色體,缺乏I個(gè)拷貝的染色體6)核,顯示出在早后期天然染色體和2條微染色體(方框)的姊妹染色單體的分離。2條微染色體的姊妹染色單體對(duì)CentC(綠色一顏色;白色一灰度)著絲粒特異性重復(fù)序列和對(duì)轉(zhuǎn)化構(gòu)建體具有特異性的獨(dú)特標(biāo)記探針23715 (紅色一顏色;白色一灰度)都呈陽性。圖B-C是2條微染色體(雙箭頭)的更高放大倍數(shù)圖,顯示出B-DAPI+CentC探針(綠色一顏色;白色一灰度);和C-DAPI+23715探針(紅色一顏色;白色一灰度)。在后期,微染色體姊妹染色單體的分離表明,功能性著絲粒的存在允許在有絲分裂期間進(jìn)行分離。圖8.來自H1-1I轉(zhuǎn)化CMC3庫3事件#12的玉米胚胎發(fā)生愈傷組織的有絲分裂染色體鋪片的免疫熒光。愈傷組織源自用Tn5-3改型的線性化BAC克隆庫3轉(zhuǎn)化的未成熟胚。圖A表明四-非整倍體(39條染色體,缺乏I個(gè)拷貝的染色體6)中期核,顯示出39條天然染色體和2條微染色體(箭頭)。天然染色體和微染色體的所有著絲粒對(duì)著絲粒蛋白C (即CENPC,一種著絲粒/動(dòng)粒特異性蛋白)(紅色一顏色;白色一灰度)都呈陽性。圖B-C是微染色體的更高放大倍數(shù)圖。CENPC免疫學(xué)定位模式(每條微染色體2次聚焦)表明,微染色體由兩條姊妹染色單體組成,而且各自具有能形成動(dòng)粒復(fù)合物的功能性著絲粒。
圖9.來自H1-1I玉米轉(zhuǎn)化事件的再生植物根尖的有絲分裂染色體鋪片的FISH。植物源自用Tn5-3改型的線性化bacm.pkl28.j21轉(zhuǎn)化的未成熟胚。圖A顯示非整倍體中期核,顯示出19條天然染色體和I條微染色體(箭頭)。微染色體對(duì)CentC (綠色一顏色;白色一灰度)著絲粒特異性重復(fù)序列和對(duì)轉(zhuǎn)化構(gòu)建體具有特異性的獨(dú)特標(biāo)記探針23715(紅色一顏色;白色一灰度)呈陽性。圖B-D是微染色體的更高放大倍數(shù)圖,其中=B-RDAPI ;C-DAPI+CentC探針(綠色一顏色;白色一灰度);和D-DAPI+23715探針(紅色一顏色;白色一灰度)。圖10.來自H1-1I玉米轉(zhuǎn)化事件的再生植物根尖的有絲分裂染色體鋪片的免疫熒光。植物源自用Tn5-3改型的線性化bacm.pkl28.j21轉(zhuǎn)化的未成熟胚。圖A顯示非整倍體中期核,顯示出19條天然染色體和I條微染色體(箭頭)。天然染色體和微染色體的所有著絲粒對(duì)著絲粒蛋白C(即CENPC,一種著絲粒/動(dòng)粒特異性蛋白)(紅色一顏色;白色一灰度)都呈陽性。圖B-C是微染色體的更高放大倍數(shù)圖,其中=B-RDAPI ;和C-DAPI+CENPC。CENPC免疫學(xué)定位模式(每條微染色體2次聚焦)表明,微染色體由兩條姊妹染色單體組成,而且各自具有能形成動(dòng)粒復(fù)合物的功能性著絲粒。圖11.經(jīng)纖維-FISH顯示的玉米著絲粒精細(xì)結(jié)構(gòu)。4個(gè)著絲粒重復(fù)序列CentC(綠色一顏色;白色一灰度)以及CentA、CRMl和CRM2的總和(紅色一顏色;灰色一灰度)用于含單條玉米染色體的燕麥-玉米附加系(addition line)的伸展DNA纖維的多色FISH。這顯示了長達(dá)百萬堿基的雜交延伸,這對(duì)每條染色體都是唯一的。圖12.玉米著絲粒模型。著絲粒的組成用玉米著絲粒重復(fù)序列名稱來表示。CentC的連續(xù)陣列可由成百上千個(gè)重復(fù)元件組成。其它玉米著絲粒特異性反轉(zhuǎn)錄轉(zhuǎn)座元件(例如CentAXRMl和/或CRM2)可整合到CentC陣列中,在彼此之間和/或在著絲粒區(qū)中。除了著絲粒特異性反轉(zhuǎn)錄轉(zhuǎn)座子以外,其它反轉(zhuǎn)錄轉(zhuǎn)座子可整合在陣列中,整合到元件(例如CentA, CentC, CRMl和CRM2)中和/或整合而形成中斷CentC串聯(lián)重復(fù)序列陣列的插入序列。該圖表示玉米CentC元件(箭頭)的一個(gè)組成模型,構(gòu)成2組頭尾串聯(lián)的重復(fù)序列??砂l(fā)現(xiàn)相反方向的CentC陣列,形成著絲粒DNA的大區(qū)段。減數(shù)分裂后期染色體的纖維-FISH和FISH以及克隆著絲粒DNA區(qū)段的斑點(diǎn)雜交分析表明,具有高密度的所有4個(gè)著絲粒重復(fù)序列(CentC、CRMUCentA和CRM2)的區(qū)域都參與了動(dòng)粒的形成。
圖13.BAC克隆的改型和體外轉(zhuǎn)化到線狀人工微染色體中。BAC克隆DNA用定制的轉(zhuǎn)座子Tn5-3改型,所述轉(zhuǎn)座子Tn5-3包含氨芐青霉素抗性基因(APlr),復(fù)制起點(diǎn)(ori),選擇標(biāo)記(MO-PAT)和可見標(biāo)記(DS-RED2)標(biāo)記(處于泛蛋白啟動(dòng)子(UBI1ZMPR0)之下),被卡那霉素抗性gen(KAN1O基因分開的處于反向的端粒序列(TEL),以及歸巢限制酶1-PpoI>1-Ceu I和P1-Sce I的位點(diǎn)。ME位于轉(zhuǎn)座子嵌合末端。用歸巢限制酶1-Ceu I消化BAC構(gòu)建體,將環(huán)狀BAC轉(zhuǎn)化為鄰接端粒序列的線狀DNA分子。
圖14.對(duì)于來自CMC3庫I事件#14的愈傷組織中期核,探測著絲粒和端粒元件。用熒光標(biāo)記探針,對(duì)著絲粒特異性CentC重復(fù)序列(綠色一顏色;白色一灰度)和端粒特異性telo-31重復(fù)序列(紅色一顏色;白色一灰度)進(jìn)行FISH分析。標(biāo)明這些探針的定位,用于天然染色體,CentC用星號(hào)(*)標(biāo)明,telo-31用雙箭頭標(biāo)明。圖B-E顯示微染色體的更高放大倍數(shù)圖。圖B-DAPI+CentC+tel031 (綠色/紅色一顏色;白色一灰度);C_僅DAPI ;D-DAPI+CentC探針(綠色一顏色;白色一灰度);和E-DAPI+23715探針(紅色一顏色;白色一灰度)。telo-31雜交模式表明,微染色體(箭頭)具有與天然染色體類似的功能性端粒。
圖15.對(duì)于來自CMC3亞庫1.3事件#27的愈傷組織中期核,探測著絲粒和端粒元件。用熒光標(biāo)記探針,對(duì)著絲粒特異性CentC重復(fù)序列(綠色一顏色;白色一灰度)和端粒特異性telo-31重復(fù)序列(紅色一顏色;白色一灰度)進(jìn)行FISH分析。標(biāo)明這些探針的定位,用于天然染色體,CentC用星號(hào)(*)標(biāo)明,telo-31用雙箭頭標(biāo)明。圖B-E顯示微染色體的更高放大倍數(shù)圖。圖B-DAPI+CentC+telo-31 (綠色/紅色一顏色;白色一灰度);C_僅DAPI ;D-DAPI+CentC探針(綠色一顏色;白色一灰度);和E-DAPI+23715探針(紅色一顏色;白色一灰度)。 telo-31雜交模式表明,微染色體(箭頭)具有與天然染色體類似的功能性端粒。
發(fā)明詳沭
本文所提出的各參考文獻(xiàn)的公開內(nèi)容通過引用全部結(jié)合到本文中。
除非另有說明,否則本文和所附權(quán)利要求書所用的術(shù)語前未加數(shù)詞修飾時(shí)包括其復(fù)數(shù)形式。因此,例如“植物”包括多種(個(gè))這樣的植物,“細(xì)胞”包括一種(個(gè))或多種(個(gè))細(xì)胞以及本領(lǐng)域技術(shù)人員已知的等價(jià)物,等等。
就本說明書而言,使用了大量術(shù)語和縮略語。提供以下定義。
“可讀框”縮寫為0RF。
“美國典型培養(yǎng)物保藏中心(American Type Culture Collection) ”縮寫為 ATCC。
本文所用的術(shù)語“人工植物微染色體(artificial plant minichromosome) ”是指包含著絲粒和端粒的任何人工產(chǎn)生的染色體,其具有與天然染色體類似的性質(zhì),例如在有絲分裂和減數(shù)分裂期間可復(fù)制和分離并因而在細(xì)胞分裂期間是自主的并可傳遞。術(shù)語人工微染色體、微染色體和人工染色體在本文中可互換使用。
術(shù)語“功能性著絲?!笔侵刚婧思?xì)胞的染色體紡錘體附著區(qū),其功能與天然染色體的著絲粒類似。它是染色體的最凝聚和縊縮區(qū),在有絲分裂期間紡錘絲與它連接在一起。在典型的動(dòng)植物細(xì)胞有絲分裂期間,每條染色體縱向分裂成2個(gè)姊妹染色體,最終分離并進(jìn)入有絲分裂紡錘體的兩極。在有絲分裂一開始,當(dāng)姊妹染色體分裂但仍成對(duì)時(shí),每條染色體沿其長度附著在紡錘體特定位點(diǎn)。該位點(diǎn)稱為著絲?;蚣忓N體附著區(qū)。著絲粒由高度重復(fù)DNA組成,也就是說DNA序列在基因組中存在許多拷貝。
術(shù)語“陣列”是指元件的有序排列。
術(shù)語“串聯(lián)重復(fù)序列”是指呈相同方向的相同堿基序列的多個(gè)拷貝。因此,它們是例如沿染色體方向多次重復(fù)的串聯(lián)核苷酸序列的拷貝。任何串聯(lián)重復(fù)序列陣列可包括單個(gè)元件的多個(gè)拷貝,或者可具有至少一個(gè)散布在陣列內(nèi)或陣列元件內(nèi)的其它元件。
術(shù)語“相反方向”是指相同序列的兩個(gè)或更多拷貝呈相反形式。
術(shù)語“反轉(zhuǎn)錄轉(zhuǎn)座元件”和“反轉(zhuǎn)錄轉(zhuǎn)座子”在本文中可互換使用,是指可轉(zhuǎn)移到DNA新位置上的遺傳元件,即可通過先制備本身的RNA拷貝,再用逆轉(zhuǎn)錄酶制備該RNA的DNA拷貝,然后將該DNA拷貝插入靶DNA。反轉(zhuǎn)錄轉(zhuǎn)座子是可在基因組中擴(kuò)增自己的遺傳元件,是在許多真核生物DNA中廣泛存在的組分。它們是轉(zhuǎn)座子的一個(gè)亞類。它們?cè)谥参镏刑貏e豐富,常常是植物細(xì)胞核DNA的主要成分。
術(shù)語“功能性端?!笔侵冈谡婧思?xì)胞染色體末端發(fā)現(xiàn)的結(jié)構(gòu)。端粒的功能是通過保護(hù)染色體末端,以免重組、與其它染色體融合或被核酸酶降解。它們?cè)试S細(xì)胞區(qū)分隨機(jī)DNA斷裂與染色體末端。它們?cè)诖_定正常細(xì)胞分裂次數(shù)方面也起到重要作用。端粒是線狀染色體末端的高度重復(fù)DNA區(qū),其功能是作為可任意使用的緩沖物質(zhì)(disposable buffer)。每當(dāng)線狀真核染色體在晚S期復(fù)制時(shí),DNA聚合酶復(fù)合物不能一路復(fù)制到染色體末端;如果沒有端粒,這將會(huì)很快導(dǎo)致維持細(xì)胞活性所需的重要遺傳信息的丟失。
本文所用的“核酸”是指多核苷酸,包括脫氧核糖核苷酸或核糖核苷酸堿基的單鏈或雙鏈多聚體。核酸也可包括片段和修飾核苷酸。因此,術(shù)語“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”是可互換使用的,是指單鏈或雙鏈RNA或DNA的多聚體,任選包含合成、非天然或改變的核苷酸堿基。核苷酸(通常呈5’-單磷酸形式)用如下單字母命名:“A”代表腺苷或脫氧腺苷(分別對(duì)于RNA或DNA),“C”代表胞苷或脫氧胞苷?!癎”代表鳥苷或脫氧鳥苷?!癠”代表尿苷 ,“T”代表脫氧胸苷,“R”代表嘌呤(A或G),“Y”代表嘧啶(C或T),“K”代表G或T,“H”代表A或C或T,“ I ”代表肌苷,“N”代表任何核苷酸。
術(shù)語“在功能上等同的亞片段”和“功能等同的亞片段”在本文中可互換使用。這些術(shù)語是指分離的核酸片段的一部分或亞序列,其中保留了改變基因表達(dá)或產(chǎn)生某種表型的能力,無論所述片段或亞片段是否編碼活性酶。例如,片段或亞片段可用于設(shè)計(jì)嵌合基因,以在轉(zhuǎn)化植物中產(chǎn)生所需表型??稍O(shè)計(jì)嵌合基因,用于通過連接核酸片段或其亞片段而進(jìn)行抑制,無論它是否編碼活性酶、相對(duì)于植物啟動(dòng)子序列而言呈有義或反義方向。
術(shù)語“保守區(qū)”或“基序”是指在進(jìn)化相關(guān)蛋白質(zhì)的比對(duì)序列的特定位置上保守的一組氨基酸。盡管在其它位置的氨基酸可在同源蛋白質(zhì)之間變化,但是在特定位置上高度保守的氨基酸表明是蛋白質(zhì)結(jié)構(gòu)、穩(wěn)定性或活性必不可少的氨基酸。因?yàn)樗鼈兺ㄟ^蛋白質(zhì)同源物家族比對(duì)序列的高度保守而鑒定,所以它們可用作標(biāo)識(shí)物或“標(biāo)記(signature) ”,以確定具有新測定序列的蛋白質(zhì)是否屬于先前已鑒定的蛋白質(zhì)家族。
術(shù)語“同源性”、“同源”、“基本相似”、“基本相同”和“基本對(duì)應(yīng)”在本文中可互換使用。它們是指這樣的核酸片段:其中一個(gè)或多個(gè)核苷酸堿基的改變不影響核酸片段介導(dǎo)基因表達(dá)或產(chǎn)生某種表型的能力。這些術(shù)語也指本發(fā)明核酸片段的修飾(例如缺失或插入一個(gè)或多個(gè)核苷酸),而與未修飾的原始片段相比,基本上不改變所得核酸片段的功能特性。這些術(shù)語還指具有或沒有修飾、缺失、插入或取代的氨基酸序列、多肽或肽片段,與未修飾的原始序列相比,所述修飾、缺失、插入或取代基本上不改變功能特性。因此,本領(lǐng)域技術(shù)人員可以理解,本發(fā)明包括的不止是具體的示例性序列。
此外,技術(shù)人員知道,本發(fā)明所包括的基本相似的核酸序列也可按照它們與本文舉例的序列雜交(在中等嚴(yán)格性條件下,例如0.5XSSC、0.1%SDS, 60°C )的能力,或與本文所公開的核苷酸序列的任何部分和本文所公開的任何核酸序列的功能等同物雜交的能力來定義。嚴(yán)格性條件可調(diào)節(jié)到從篩選中度類似片段(例如遠(yuǎn)緣相關(guān)生物體的同源序列),到篩選高度類似片段(例如能復(fù)制密切相關(guān)生物的功能性酶的基因)。雜交后洗滌確定嚴(yán)格性條件。
術(shù)語“選擇性雜交”包括這樣的雜交:在嚴(yán)格性雜交條件下,核酸序列與特定核酸靶序列雜交,檢測到其雜交程度比其與非靶核酸序列雜交程度高(例如超過背景至少2倍),因而可基本上排除非靶核酸。選擇性雜交序列通常彼此具有約至少80%序列同一性,或90%序列同一性,至多100%序列同一性并包括100%序列同一性(即完全互補(bǔ))。
術(shù)語“嚴(yán)格性條件”或“嚴(yán)格性雜交條件”包括探針將會(huì)與其靶序列選擇性雜交的條件。嚴(yán)格性條件是序列依賴性的,在不同情況下將會(huì)不同。對(duì)于控制雜交和/或洗滌條件的嚴(yán)格性而言,可鑒定出與探針100%互補(bǔ)的靶序列(同源探測)。或者,嚴(yán)格性條件可調(diào)節(jié)到允許序列中的某些錯(cuò)配,使得可檢測較低程度的相似性(異源探測)。通常,探針長度小于約1000個(gè)核苷酸,任選小于500個(gè)核苷酸。
通常,嚴(yán)格性條件如下:其中鹽濃度小于約1.5MNa離子,通常約0.01-1.0MNa離子濃度(或其它鹽), PH7.0-8.3,而溫度至少約30°C (對(duì)于短探針,例如10-50個(gè)核苷酸)和至少約60°C (對(duì)于長探針,例如大于50個(gè)核苷酸)。通過添加去穩(wěn)定劑(destabilizing agent)例如甲酰胺,也可得到嚴(yán)格性條件。示例性的低嚴(yán)格性條件包括在緩沖液(30-35%甲酰胺、lMNaCl、l%SDS(十二烷基硫酸鈉))中在37 °C雜交,并在1X-2XSSC(20XSSC=3.0MNaCl/0.3M檸檬酸三鈉)中在50-55°C洗滌。示例性的中等嚴(yán)格性條件包括在40-45%甲酰胺、IMNaCl、1%SDS中在37°C雜交,并在0.5X-1XSSC中在55_60°C洗滌。示例性的高嚴(yán)格性條件包括在50%甲酰胺、IMNaCl、1%SDS中在37V雜交,并在0.1XSSC中在60-65 °C洗滌。
特異性通常因雜交后洗滌而異,關(guān)鍵因素是最終洗滌液的離子強(qiáng)度和溫度。對(duì)于 DNA-DNA 雜合體,Tni 可按 Meinkoth 等((1984)AnalBiocheml38:267-284)的等式來求出:Tm=81.5 °C +16.6 (1gM) +0.41 (%GC) -0.61 (% 甲酰胺)-500/L ;其中 M 是單價(jià)陽離子的體積摩爾濃度,%GC是鳥苷酸和胞苷酸在DNA中所占的百分率,%甲酰胺是雜交溶液中甲酰胺的百分率,而L是按堿基對(duì)計(jì)雜合體的長度。Tm是50%互補(bǔ)靶序列與完全匹配的探針雜交的溫度(在指定離子強(qiáng)度和PH下)。每錯(cuò)配1%,Tffl降低約TC ;因此,Tm、雜交和/或洗滌條件可調(diào)整到與所需同一性的序列雜交。例如,如果尋找具有>90%同一性的序列,則Tm可下降10°C。通常,在指定離子強(qiáng)度和pH下,對(duì)于特定序列及其互補(bǔ)序列而言,選擇嚴(yán)格性條件比熱解鏈溫度(Tm)低約5°C。然而,高嚴(yán)格性條件可使用在比熱解鏈溫度(Tm)低1°C、2°C、3°C或4°C的溫度下進(jìn)行雜交和/或洗滌;中等嚴(yán)格性條件可使用在比熱解鏈溫度(Tm)低6°C、7°C、8°C、9°C或10°C的溫度下進(jìn)行雜交和/或洗滌;低嚴(yán)格性條件可使用比熱解鏈溫度(Tm)低11°C、12°C、13°C、14°C、15°C或20°C的溫度下進(jìn)行雜交和/或洗滌。用該等式、雜交和洗滌液組成以及所需要的Tm,本領(lǐng)域普通技術(shù)人員將會(huì)知道雜交和/或洗滌液嚴(yán)格性的變化如上所述是固有的。如果所需錯(cuò)配程度導(dǎo)致Tm低于45°C (水溶液)或32°C (甲酰胺溶液),最好提高SSC濃度,使得可以使用更高溫度。有關(guān)核酸雜交的更詳細(xì)指南可參見Ti jssen, Laboratory Techniques in Biochemistryand Molecular Biology—Hybridization with Nucleic Acid Probes,第 I 部分,第2 章,uOverview of principles of Hybridization and the strategy of NucleicAcid Probe assays,,,Elsevier, New York(1993);和 Current Protocols in MolecularBiology,第 2 章,Ausubel 等主編,Greene Publishing and ffiley-1nterscience, NewYork (1995)。雜交和/或洗滌條件可用至少10分鐘、30分鐘、60分鐘、90分鐘、120分鐘或240分鐘。
對(duì)于核酸或多肽序列而言,術(shù)語“序列同一性”或“同一性”是指兩個(gè)序列中的核酸堿基或氨基酸殘基當(dāng)在特定比較窗口比對(duì)最大對(duì)應(yīng)性時(shí)是相同的。術(shù)語“%序列同一性”是指通過在一個(gè)比較窗口比較兩個(gè)優(yōu)化比對(duì)序列所求出的值,其中對(duì)于兩個(gè)序列優(yōu)化比對(duì)而言,當(dāng)與參考序列(其不包括插入或缺失)比較時(shí),在比較窗口中多核苷酸或多肽序列部分可包括插入或缺失(即空位)。百分率是這樣求出的:通過測定兩條序列中存在的相同核酸堿基或氨基酸殘基的位置數(shù)而得到匹配位置數(shù),再用匹配位置數(shù)除以比較窗口的總位置數(shù),并將結(jié)果乘以100,就得到%序列同一性。%序列同一性的有用實(shí)例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%、或95%、或50%_100%之間的任何整數(shù)百分?jǐn)?shù)。這些同一性可用本文所述的任何程序來測定。
用設(shè)計(jì)用于測定同源序列的各種比較方法,可進(jìn)行序列比對(duì)和%同一性或相似性計(jì)算,這些方法包括但不限于LASERGENE生物信息學(xué)計(jì)算套餐的MegAl ign 程序(DNASTARInc., Madison, WI)。就本申請(qǐng)的內(nèi)容而言,可以理解,當(dāng)用序列分析軟件進(jìn)行分析時(shí),分析結(jié)果可根據(jù)所用程序的“默認(rèn)值”,除非另有說明。本文所用的“默認(rèn)值”是指軟件在首次初始化時(shí)原本帶有的任何一組數(shù)值或參數(shù)。術(shù)語“Clustal V比對(duì)方法”相當(dāng)于標(biāo)記為 Clustal V 的比對(duì)方法(描述于 Higgins 和 Sharp (1989) CAB10S5:151-153 ;Higgins等(1992)Comput Appl Biosci8:189-191)并可參見LASERGENE生物信息學(xué)計(jì)算套餐的MegAlign 程序(DNASTARInc.,Madison, WI)。對(duì)于多重比對(duì),默認(rèn)值相當(dāng)于空位罰分=10,空位長度罰分=10。采用Clustal方法,對(duì)于成對(duì)比對(duì)和蛋白質(zhì)序列的%同一性計(jì)算的默認(rèn)參數(shù)為KTUPLE=I,空位罰分=3,WIND0ff=5和DIAG0NALSSAVED=5。對(duì)于核酸,這些參數(shù)為KTUPLE=2,空位罰分=5,WIND0W=4 和 DIAGONALS SAVED=4。當(dāng)用 Clustal V 程序比對(duì)序列后,可通過查看同一程序中的“序列距離”表而得到“%同一性”。術(shù)語“Clustal W比對(duì)方法”相當(dāng)于標(biāo)記為Clustal W的比對(duì)方法(描述于Higgins和Sharp (1989) CAB10S5:151-153 ;Higgins 等(1992)Comput Appl Biosci 8:189-191)并可參見 LASERGENE 生物信息學(xué)計(jì)算套餐的MegAlign 第6.1版程序(DNASTAR Inc.,Madison, WI)。多重比對(duì)的默認(rèn)參數(shù)是空位罰分=10,空位長度罰分=0.2,延遲發(fā)散序列(%)=30,DNA轉(zhuǎn)換權(quán)重=0.5,蛋白質(zhì)權(quán)重矩陣=GonnetSeries, DNA權(quán)重矩陣=IUB。當(dāng)用ClustalW程序比對(duì)序列后,可通過查看同一程序中的“序列距離”表而得到“%同一性”。術(shù)語“BLASTN比對(duì)方法”是由國立生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)提供的算法,用于用默認(rèn)參數(shù)比較核苷酸序列。
本領(lǐng)域技術(shù)人員都知道,多個(gè)水平的序列同一性可用于從其它物種中鑒別出多肽,其中這樣的多肽具有相同或相似功能或活性。%同一性的有用實(shí)例包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%、或 95% 或 50%_100% 的任何整數(shù)百分率。的確,50%-100%的任何整數(shù)的氨基酸同一性可用于描述本發(fā)明,例如51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99%。
術(shù)語“基因”是指表達(dá)特定蛋白質(zhì)的核酸片段,其包含編碼序列之前(5’非編碼序列)和之后(3’非編碼序列)的調(diào)節(jié)序列?!疤烊换颉笔侵冈谧匀唤绨l(fā)現(xiàn)的帶有其自身調(diào)節(jié)序列的基因?!扒逗匣颉笔侵覆⒎翘烊换虻娜魏位?,其包含在自然界中不在一起的調(diào)節(jié)序列和編碼序列。因此,嵌合基因可包含來自不同來源的調(diào)節(jié)序列和編碼序列,或來自同一來源、但與自然界中所排列方式不同的調(diào)節(jié)序列和編碼序列?!巴庠础被蚴侵冈谒拗魃镏胁⒎钦4嬖诘?、而是通過基因轉(zhuǎn)移而導(dǎo)入宿主生物的基因。外源基因可包含插入到非天然生物體或嵌合基因中的天然基因?!稗D(zhuǎn)基因”是通過轉(zhuǎn)化方法導(dǎo)入基因組的基因。
術(shù)語“基因組”當(dāng)用于植物細(xì)胞時(shí),不僅包括細(xì)胞核內(nèi)染色體DNA,而且還包括細(xì)胞的亞細(xì)胞組分(例如線粒體或質(zhì)體)內(nèi)的細(xì)胞器DNA。
“密碼子優(yōu)化基因”或“密碼子優(yōu)選基因”是指經(jīng)設(shè)計(jì)其密碼子使用頻率模擬宿主細(xì)胞的優(yōu)選密碼子使用頻率的基因。
“等位基因”是占據(jù)染色體上特定位置的基因的若干替代形式之一。當(dāng)在染色體上特定位置存在的所有等位基因都相同時(shí),則植物在該基因座上就是純合的。如果在染色體上特定位置存在的等位基因不同,則植物在該基因座上就是雜合的。
術(shù)語“編碼序 列”是指編碼特定氨基酸序列的多核苷酸序列?!罢{(diào)節(jié)序列”是指位于編碼序列上游(5’非編碼序列)、中間或下游(3’非編碼序列)并可影響轉(zhuǎn)錄、RNA加工或穩(wěn)定性、或所連接編碼序列的翻譯的核苷酸序列。調(diào)節(jié)序列可包括但不限于:啟動(dòng)子、翻譯前導(dǎo)序列、內(nèi)含子、聚腺苷酸化識(shí)別序列、RNA加工位點(diǎn)、效應(yīng)物結(jié)合位點(diǎn)和莖-環(huán)結(jié)構(gòu)(stem-loop structure)。
術(shù)語“啟動(dòng)子”是指能控制編碼序列或功能性RNA的表達(dá)的DNA序列。啟動(dòng)子序列由近側(cè)和遠(yuǎn)側(cè)上游元件組成,后者常稱為增強(qiáng)子。因此,“增強(qiáng)子”是能刺激啟動(dòng)子活性的DNA序列,它可以是啟動(dòng)子的天然元件或者是插入其中以增強(qiáng)啟動(dòng)子水平或組織特異性的異源元件。啟動(dòng)子可全部來自天然基因,或者是由來自在自然界發(fā)現(xiàn)的不同啟動(dòng)子的不同元件組成,或者甚至包含合成DNA區(qū)段。本領(lǐng)域技術(shù)人員知道,不同啟動(dòng)子可指導(dǎo)不同組織或細(xì)胞類型或不同發(fā)育時(shí)期的基因表達(dá)、或響應(yīng)不同環(huán)境條件的基因表達(dá)。本領(lǐng)域技術(shù)人員還知道,因?yàn)樵诖蠖鄶?shù)情況下并未完全界定調(diào)節(jié)序列的準(zhǔn)確邊界,所以某些變異的DNA片段可具有相同的啟動(dòng)子活性。在大多數(shù)細(xì)胞種類中、在大多數(shù)時(shí)間都能使基因得以表達(dá)的啟動(dòng)子通常稱為“組成型啟動(dòng)子”。不斷發(fā)現(xiàn)用于植物細(xì)胞的不同類型的新啟動(dòng)子;大量實(shí)例可參見 Okamuro 和 Goldberg(1989)Biochemistry ofPlantsl5:1-82。
術(shù)語“翻譯前導(dǎo)序列”是指位于基因的啟動(dòng)子序列與編碼序列之間的多核苷酸序列。翻譯前導(dǎo)序列存在于翻譯起始序列的完全加工的mRNA上游。翻譯前導(dǎo)序列可影響初級(jí)轉(zhuǎn)錄物成為mRNA的加工、mRNA穩(wěn)定性或翻譯效率。翻譯前導(dǎo)序列的實(shí)例已有描述(Turner和 Foster(1995)MolBiotechnol3:225-236)。
術(shù)語“3’非編碼序列”、“轉(zhuǎn)錄終止子”或“終止序列”是指位于編碼序列下游的DNA序列,包括聚腺苷酸化識(shí)別序列和編碼調(diào)節(jié)信號(hào)的其它序列,所述信號(hào)能夠影響mRNA加工或基因表達(dá)。聚腺苷酸化信號(hào)通常表征為影響聚腺苷酸鏈添加到mRNA前體的3’端。不同3’非編碼序列的使用實(shí)例可參見Ingelbrecht等(1989)Plant Cell 1:671-680。
術(shù)語“RNA轉(zhuǎn)錄物”是指由RNA聚合酶催化DNA序列轉(zhuǎn)錄而產(chǎn)生的產(chǎn)物。當(dāng)RNA轉(zhuǎn)錄物是DNA序列的完全互補(bǔ)拷貝時(shí),它就稱為初級(jí)轉(zhuǎn)錄物。當(dāng)初級(jí)轉(zhuǎn)錄物經(jīng)轉(zhuǎn)錄后加工而得到RNA序列時(shí),該RNA轉(zhuǎn)錄物則稱為成熟RNA?!靶攀筊NA”或“mRNA”是指不含內(nèi)含子并可由細(xì)胞翻譯為蛋白質(zhì)的RNA?!癱DNA”是指采用逆轉(zhuǎn)錄酶由mRNA模板合成并與之互補(bǔ)的DNA。cDNA可以是單鏈或使用DNA聚合酶I克列諾(Klenow)片段而轉(zhuǎn)化為雙鏈形式?!坝辛x”RNA是指包含mRNA并可在細(xì)胞內(nèi)或體外翻譯為蛋白質(zhì)的RNA轉(zhuǎn)錄物?!胺戳xRNA”是指與靶初級(jí)轉(zhuǎn)錄物或mRNA的全部或部分互補(bǔ)的RNA轉(zhuǎn)錄物,其可阻斷靶基因的表達(dá)(美國專利5,107,065)。反義RNA可以與特定基因轉(zhuǎn)錄物的任何部分(即5’非編碼序列、3’非編碼序列、內(nèi)含子或編碼序列)互補(bǔ)?!肮δ苄訰NA”是指不能翻譯、但能影響細(xì)胞加工的反義RNA、核酶RNA或其它RNA。對(duì)于mRNA轉(zhuǎn)錄物而言,術(shù)語“互補(bǔ)”和“反向互補(bǔ)”在本文中可互換使用,用于限定反義信使RNA。
術(shù)語“有效連接”是指單一核酸片段上核酸序列的連接使得一個(gè)序列的功能由其它序列調(diào)節(jié)。例如,當(dāng)啟動(dòng)子能夠調(diào)節(jié)編碼序列的表達(dá)(即編碼序列處于啟動(dòng)子的轉(zhuǎn)錄控制之下),則該啟動(dòng)子與編碼序列的連接就是有效連接。編碼序列可以有義或反義方向與調(diào)節(jié)序列有效連接。在另一實(shí)例中,本發(fā)明的互補(bǔ)RNA區(qū)可直接或間接地有效連接到靶mRNA的5’、或靶mRNA的3’、或連接在靶mRNA內(nèi),或第一互補(bǔ)區(qū)為靶mRNA的5’,而其互補(bǔ)序列為靶 mRNA 的 3’。
本文所用 的標(biāo)準(zhǔn)重組DNA和分子克隆技術(shù)是本領(lǐng)域眾所周知的,詳見Sambrook等,MolecularCloning:ALaboratoryManual ;Cold Spring Harbor Laboratory:Cold SpringHarbor, NY(1989)。轉(zhuǎn)化方法是本領(lǐng)域技術(shù)人員眾所周知的,在下文進(jìn)行描述。
“PCR”或“聚合酶鏈?zhǔn)椒磻?yīng)”是特定DNA區(qū)段的合成技術(shù),由一系列重復(fù)的變性、退火和延伸循環(huán)組成。通常,雙鏈DNA經(jīng)熱變性,與靶區(qū)段的3’邊界互補(bǔ)的兩個(gè)引物在低溫下退火,然后在中溫下延伸。一組這樣的3個(gè)連續(xù)步驟稱為一次“循環(huán)”。
術(shù)語“重組”是指兩個(gè)不同的分離的序列區(qū)段的人工組合,例如通過化學(xué)合成或通過遺傳工程技術(shù)操作分離的核酸區(qū)段。
術(shù)語“質(zhì)?!薄ⅰ拜d體”和“盒”是指額外的染色體元件,其通常攜帶并非細(xì)胞重要代謝組成部分的基因,通常呈環(huán)狀雙鏈DNA片段形式。這樣的元件可以是自主復(fù)制序列、基因組整合序列、噬菌體或核苷酸序列、線狀或環(huán)狀、單鏈或雙鏈DNA或RNA,來自任何來源,其中許多核苷酸序列連接或重組成獨(dú)特構(gòu)建體,這樣的構(gòu)建體可將啟動(dòng)子片段和選定基因產(chǎn)物的DNA序列以及合適的3’非翻譯序列引入細(xì)胞中。“轉(zhuǎn)化盒”是指含有外源基因以及除外源基因以外的能促進(jìn)特定宿主細(xì)胞轉(zhuǎn)化的元件的特定載體。“表達(dá)盒”是指含有外源基因以及除外源基因以外的能允許該基因在外源宿主中表達(dá)的元件的特定載體。
術(shù)語“重組構(gòu)建體”、“表達(dá)構(gòu)建體”、“嵌合構(gòu)建體”、“構(gòu)建體”和“重組DNA構(gòu)建體”在本文中可互換使用。重組構(gòu)建體包含核酸片段的人工組合,例如在自然界并不在一起的調(diào)節(jié)序列和編碼序列。例如,嵌合構(gòu)建體可包含來自不同來源的調(diào)節(jié)序列和編碼序列,或來自同一來源、但排列方式與自然界不同的調(diào)節(jié)序列和編碼序列。這樣的構(gòu)建體可單獨(dú)使用或與載體聯(lián)用。如果使用載體,則載體的選擇取決于轉(zhuǎn)化宿主細(xì)胞所用的方法,這是本領(lǐng)域技術(shù)人員眾所周知的。例如,可使用質(zhì)粒載體。技術(shù)人員非常清楚,遺傳元件必須存在于載體中,以便成功地轉(zhuǎn)化、選擇和擴(kuò)增含有任何本發(fā)明分離核酸片段的宿主細(xì)胞。技術(shù)人員也將會(huì)知道,不同的獨(dú)立轉(zhuǎn)化事件可導(dǎo)致不同水平和模式的表達(dá)(Jones等(1985)EMB0J4:2411-2418 ;De Almeida 等(1989)Mol Gen Genet 218:78-86),因此必須篩選多個(gè)事件,以便獲得表現(xiàn)出所需表達(dá)水平和模式的品系??赏ㄟ^DNA的DNA印跡分析、mRNA表達(dá)的RNA印跡分析、蛋白質(zhì)表達(dá)的免疫印跡分析或表型分析等方法來完成這樣的篩選。
本文所用的術(shù)語“表達(dá)”是指產(chǎn)生功能性終產(chǎn)物(例如前體或成熟形式的mRNA或蛋白質(zhì))。
術(shù)語“導(dǎo)入”是指將核酸(例如表達(dá)構(gòu)建體)或蛋白質(zhì)導(dǎo)入細(xì)胞中。導(dǎo)入包括將核酸導(dǎo)入真核細(xì)胞或原核細(xì)胞中并結(jié)合到細(xì)胞基因組中,還包括將核酸或蛋白質(zhì)瞬時(shí)提供給細(xì)胞。導(dǎo)入包括穩(wěn)定或瞬時(shí)轉(zhuǎn)化方法,以及有性雜交。因此,就將核酸片段(例如重組DNA構(gòu)建體/表達(dá)構(gòu)建體)插入到細(xì)胞中而言,“導(dǎo)入”是指“轉(zhuǎn)染”或“轉(zhuǎn)化”或“轉(zhuǎn)導(dǎo)”并包括將核酸片段導(dǎo)入真核細(xì)胞或原核細(xì)胞中,在其中核酸片段可結(jié)合到細(xì)胞基因組(例如染色體、質(zhì)粒、質(zhì)體或線粒體的DNA)上,轉(zhuǎn)變成為自主復(fù)制子或瞬時(shí)表達(dá)(例如轉(zhuǎn)染mRNA)。
術(shù)語“成熟”蛋白質(zhì)是指經(jīng)翻譯后加工的多肽(即已除去初級(jí)翻譯產(chǎn)物中存在的任何前肽(prepeptide)或肽原(propeptide)的多肽)?!扒绑w”蛋白是指mRNA翻譯的初級(jí)產(chǎn)物(即仍然含有前肽和肽原)。前肽和肽原可能是但不限于胞內(nèi)定位信號(hào)。
術(shù)語“穩(wěn)定的轉(zhuǎn)化”是指核酸片段轉(zhuǎn)移到宿主生物基因組(包括核基因組和細(xì)胞器基因組)中而產(chǎn)生遺傳穩(wěn)定的遺傳。相反,“瞬時(shí)轉(zhuǎn)化”是指核酸片段轉(zhuǎn)移到宿主生物的細(xì)胞核或含DNA的細(xì)胞器中而導(dǎo)致非整合或非穩(wěn)定遺傳的基因表達(dá)。含轉(zhuǎn)化核酸片段的宿主生物稱為“轉(zhuǎn)基因”生物。
術(shù)語“轉(zhuǎn)基因”是指基因組內(nèi)含有異源多核苷酸的植物或細(xì)胞。優(yōu)選異源多核苷酸是穩(wěn)定整合到基因組中,使多核苷酸可連續(xù)傳代。異源多核苷酸可單獨(dú)整合到基因組上或作為表達(dá)構(gòu)建體的組成部分而整合。本文所用的轉(zhuǎn)基因包括其基因型已因異源核酸的存在而改變的任何細(xì)胞、細(xì)胞系、愈傷組織、組織、植物部分或植物,其包括起先這樣改變的轉(zhuǎn)基因以及由起先的轉(zhuǎn)基因經(jīng)有性雜交或無性繁殖而產(chǎn)生的那些。本文所用的術(shù)語“轉(zhuǎn)基因”不包括由常規(guī)植物育種方法或天然發(fā)生事件導(dǎo)致基因組(染色體或染色體外)的改變,例如隨機(jī)交叉受精、非重組病毒感染、非重組細(xì)菌轉(zhuǎn)化、非重組轉(zhuǎn)座或自發(fā)突變。
術(shù)語“植物”是指整株植物、植物器官、植物組織、種子、植物細(xì)胞、種子及其后代。植物細(xì)胞包括但不限于來自種子、懸浮培養(yǎng)物、胚、分生組織區(qū)、愈傷組織、葉、根、芽、配子體、孢子體、花粉和小孢子的細(xì)胞。 植物部分包括分化和未分化組織,包括但不限于以下:根、莖、芽、葉、花粉、種子、腫瘤組織以及各種細(xì)胞和培養(yǎng)物形式(例如單細(xì)胞、原生質(zhì)體、胚和愈傷組織)。植物組織可以在植物或植物器官、組織或細(xì)胞培養(yǎng)物中。術(shù)語“植物器官”是指組成形態(tài)和功能獨(dú)特的植物部分的植物組織或一組組織。術(shù)語“基因組”是指以下:(I)在生物體、或病毒或細(xì)胞器的每個(gè)細(xì)胞中都存在的遺傳材料的完全互補(bǔ)序列(基因和非編碼序列);和/或(2)作為來自一個(gè)親本的(單倍體)單位而遺傳的一整套染色體?!昂蟠卑ㄖ参锏娜魏魏罄m(xù)世代。
本發(fā)明涉及包含功能性著絲粒的人工植物微染色體,其包含:(a)至少2個(gè)反向的CentC串聯(lián)重復(fù)序列陣列,其中第I陣列包含至少50個(gè)拷貝的CentC,第2陣列包含至少50個(gè)拷貝的CentC ;和(b)至少一個(gè)拷貝的反轉(zhuǎn)錄轉(zhuǎn)座元件,其中反轉(zhuǎn)錄轉(zhuǎn)座元件位于第I陣列和第2陣列之間。優(yōu)選反轉(zhuǎn)錄轉(zhuǎn)座元件選自CentA、CRMl和CRM2。
人工染色體包含具有CentC串聯(lián)重復(fù)序列陣列的功能性著絲粒。每個(gè)CentC重復(fù)序列陣列可包含至少 30、40、50、60、70、80、90、100、120、140、150、160、180、200、220、240、250、260、280、300、320、340、360、380、400、450 或 500 個(gè)拷貝的 CentC0 此外,每個(gè) CentC 串聯(lián)重復(fù)序列陣列中可間插另一序列元件,包括但不限于反轉(zhuǎn)錄轉(zhuǎn)座子(其插入到CentC拷貝之間或CentC元件內(nèi)或反轉(zhuǎn)錄轉(zhuǎn)座子內(nèi)),或陣列中的任何其它序列元件。反轉(zhuǎn)錄轉(zhuǎn)座子包括但不限于CentA、CRMl和CRM2。
在大多數(shù)真核生物中,著絲粒作為染色體中動(dòng)粒形成和紡錘體附著的位點(diǎn),嵌入異染色質(zhì)中。釀酒酵母(S.cerevisiae)染色體缺乏隨體序列,而具有精確定位的小著絲粒,它限定紡錘體連接 125bp DNA (Blackburn 和 Szostak(1984)Ann Rev Biochem53:163-194)。
然而,來自其它真菌譜系的著絲粒包含與動(dòng)植物中發(fā)現(xiàn)的更類似的重復(fù)序列陣列(Fishel等(1988) Mol Cell Biol 8:754-763)。在高等真核生物中,細(xì)胞學(xué)研究和生物化學(xué)研究顯示出串聯(lián)重復(fù)的隨體DNA、著絲粒區(qū)和特定著絲粒相關(guān)蛋白之間的物理連接(Henikoff 等(2OOl)Science 293:1O98-1lO2 ;Yu 和 Dawe(2OOO)J Cell Biol151:131-142)。
盡管缺乏通用序列基序,但大多數(shù)著絲粒隨體重復(fù)序列在不同生物體間都具有明顯類似的單元長度,例如基本隨體單元為171bp(靈長類)、186bp (魚金頭鯛(Sparusaurata))和 155bp(昆蟲 Chironomus Pallidivittatus)(Henikoff 等(2001)Science293:1098-1102)。
植物著絲粒具有類似單元長度重復(fù)序列,例如,156bp重復(fù)序列(玉米)(Ananiev 等(1998) Proc Natl Acad Sci USA 95:13073-13078)、168bp 重復(fù)序列(水稻)(Dong 等(1998) Proc Natl Acad Sci USA 95:8135-8140)和 180bp 重復(fù)序列(擬南芥(Arabidopsis)) (Copenhaver (2003)Chromosome Res 11:255-262)。在擬南芥中,著絲粒通常含有2.8-4Mb串聯(lián)重復(fù)的178bp隨體序列段(Hall等(2004)Curr Opin PlantBiol7:108-114)。在玉米中,完整功能的額外B染色體著絲粒含有約500kb串聯(lián)重復(fù)序列,其中部分缺失減少了傳遞(Alfenito 和 Birchler (1993)Geneticsl35:589-597)。含有額外B染色體的玉米染色體鋪片與來自位于A染色體著絲粒區(qū)的不同重復(fù)元件(包括CentC、CRM和CentA)的探針雜交。這些重復(fù)元件(主要存在于A染色體著絲粒附近)與不同于B染色體著絲粒的許多位點(diǎn)雜交(Lamb等(2005) Chromosomal 13:337-349)。
至少兩個(gè)實(shí)例違背了著絲粒隨體DNA基礎(chǔ)上的著絲粒形成的基本原則。首先,外來著絲粒(aliencentromere)在體細(xì)胞雜合體或燕麥-玉米漸滲系中的明確正常功能(Ananiev 等(1998)Proc Natl Acad Sci USA95:13073-13078)表明保留了著絲粒功能和相應(yīng)蛋白質(zhì)復(fù)合物。支持含無關(guān)著絲粒隨體DNA的外來著絲粒功能的所有著絲粒蛋白明顯都由宿主提供(Jin等(2004)Plant Cell 16:571-81)。第二,新著絲粒是最近描述于人和果妮(Drosophila)的基于非重復(fù)DNA的一類新型著絲粒(Williams (1998) Nat Genet18:30-37 ;Choo (1997) Am J Hum Genet 61:1225-1233)。新著絲粒在正常染色體經(jīng)多次染色體重排的衍生物中存在,新著絲粒在明顯的常染色質(zhì)DNA區(qū)形成,缺乏通常與著絲粒功能相關(guān)重復(fù)序列。具有新著絲粒的染色體具有不同的有絲分裂或減數(shù)分裂穩(wěn)定性。
著絲粒的特性和功能尚未完全清楚,還需要更多分析。迄今為止,大多數(shù)人工染色體都具有基于天然著絲粒隨體DNA的功能性著絲粒。knob重復(fù)序列,例如180bp和350bp (TRI)可用作新著絲粒的組分。已經(jīng)知道某些knob在減數(shù)分裂玉米染色體中可獲得著絲粒功能,這些新著絲粒僅包含180bp和350bp的串聯(lián)重復(fù)序列。對(duì)人和低等生物的新著絲粒進(jìn)行研究,解決了先前未知的著絲粒DNA動(dòng)態(tài)特性的現(xiàn)象(Choo等(1997) Am J HumGenet.61:1225-33)。在該現(xiàn)象的核心中,著絲粒功能看來并不是特定DNA序列的需要;而響應(yīng)合適的外來影響的大量序列看來才提供該功能。
對(duì)著絲粒序列的深入表征來自對(duì)酵母的研究,例如釀酒酵母(S.cerevisaie)和粟酒裂殖酵母(S.pombe),已經(jīng)定義了功能性酵母著絲粒元件和組構(gòu)。例如在釀酒酵母著絲粒中,3個(gè)必需區(qū)域(⑶E1、⑶EII和⑶EIII)的結(jié)構(gòu)和功能總共才125bp,即占每條染色體的 0.006-0.06%(Carbon 等(1990)New Biologist2:10—19 ;Bloom(1993)Cell73:621-624)。
粟酒裂殖酵母著絲粒介于40_100kb之間,由重復(fù)元件組成,占每條染色體的1-3% (Baum等(1 994) Mo I Cell Biol5:747-761)。后續(xù)研究表明,不到1/3的天然粟酒裂殖酵母著絲粒對(duì)著絲粒功能而言是足夠的(Baum等(1994)MolCellBiol5:747-761)。在粟酒裂殖酵母中,已經(jīng)知道反向重復(fù)序列區(qū)是著絲粒功能必不可少的,但是無論是中部核心(central core)還是反向重復(fù)序列的一條臂都不能賦予功能。側(cè)接中部核心的重復(fù)序列部分的缺失對(duì)有絲分裂分離功能或微染色體分離成為單倍體后代的減數(shù)分裂都沒有影響,但在減數(shù)分裂1期間能顯 著破壞著絲粒介導(dǎo)的對(duì)同源姊妹染色單體配對(duì)的維持。在粟酒裂殖酵母3條不同染色體之間有明顯變異性,不同粟酒裂殖酵母菌株之間的任何特定染色體的著絲粒都具有明顯變異性。然而,基礎(chǔ)DNA結(jié)構(gòu)基序(即反向重復(fù)序列)是粟酒裂殖酵母著絲粒的通用參數(shù)(Clarke 等(1993) Cold Spring Harb Symp Quant Biol58:687-695)。
高等真核生物著絲粒很少有表征。雖然已鑒定出與高等真核生物著絲粒區(qū)雜交的DNA片段,但是對(duì)這些序列的結(jié)構(gòu)、組織和/或功能的了解甚少。然而,水稻卻是個(gè)例夕卜,因其具有不同的著絲粒大小。雖然某些水稻染色體具有的著絲粒與其它物種大小類似OlMb),但一些染色體的著絲粒卻驚人地小,可以被采用標(biāo)準(zhǔn)技術(shù)構(gòu)建的BAC毗連群(contig)完全覆蓋。水稻著絲粒4和8的完全測序表明,染色體區(qū)段內(nèi)存在認(rèn)為是著絲粒的著絲粒串聯(lián)重復(fù)序列的反向區(qū)組(inverted block),類似于酵母中觀察到的反向重復(fù)序列結(jié)構(gòu)(Zhang等(2004) Nucl Acids Res32:2023-2030 ;Wu等(2004) PlantCel116:967-976)。
就許多情況而言,著絲粒重復(fù)序列的探針與著絲粒位置具有細(xì)胞學(xué)和遺傳學(xué)關(guān)系,許多這樣的序列以串聯(lián)重復(fù)隨體元件和分散重復(fù)序列形式存在,其陣列長度范圍為300-5000kb (Willard(1990)Trends Genet 6:410-416)。原位雜交已經(jīng)顯不出每個(gè)人類著絲粒中都存在 alphoid 隨體 171bp 重復(fù)序列(Tyler-Smith 等(1993)CurrBiol390_397)。尚未確定這些重復(fù)序列是否組成功能性著絲粒,但看來需要其它基因組DNA賦予DNA遺傳性。用alphoid隨體轉(zhuǎn)染細(xì)胞系,得到新染色體,但這些新染色體也含有宿主DNA,其可影響著絲粒活性(Haaf 等(1992)Cell70:681-696 ;ffi I lard (1997) NatGenet 15:345-354) 此夕卜,新染色體可顯示出其全長alphoidDNA鋪片僅具有一個(gè)著絲粒纟益痕,這表明alphoidDNA區(qū)組可能不足以賦予著絲粒功能。
植物著絲粒的遺傳表征采用染色體片段的分離分析,包括分析攜帶遺傳標(biāo)記的端著絲粒片段的三體品系(例如Koornneef (1983) Genetica62:33-40)。已經(jīng)鑒定出與著絲粒遺傳連鎖(Richards 等(1991))或物理連接(Alfenito 等(1993)Geneticsl35:589-597 ;Maluszynska等(1991) PlantJl: 159-166)的植物著絲粒重復(fù)元件,但是涉及著絲粒功能的這些序列的重要性尚未充分表征其功能。
在擬南芥(Arabidopsis thaliana)中進(jìn)行的細(xì)胞學(xué)研究,已經(jīng)找出著絲粒結(jié)構(gòu)與重復(fù)序列之間的關(guān)系。用非特異性熒光DNA結(jié)合劑(例如4’,6-二脒基-2-苯基吲哚(DAPI))染色,可觀察到中期染色體的著絲粒染色質(zhì)區(qū)。針對(duì)180bp pALI重復(fù)序列的突光原位雜交(FISH)探針與所有5條擬南芥(Arabidopsis)染色體著絲粒附近的 DAPI 標(biāo)記共同定位(Maluszynska 等(1991)PlantJl:159-166 ;Martinez-Zapater等(1986) MolGenGenet204:417-423)。提出了 pALI的功能性作用,但新近研究沒有檢測到擬南芥(Arabidopsis)密切相關(guān)物種的著絲粒附近的該序列(Maluszynska等(1993)AnnBotany71:479-484)。據(jù)信,所檢測的一個(gè)物種小擬南芥(A.pumila)是擬南芥(A.thaliana)與另一密切相關(guān)物種雜交而來的雙二倍體(Maluszynska等(1991)PlantJl: 159-166 ;Price 等(1995)載于 Arabidopsis, Somerville 和 Meyerowitz (主編)Cold Spring Harbor Press, NY)。另一重復(fù)序列(pAtl2)遺傳作圖到I號(hào)染色體著絲粒5cM 和 5 號(hào)染色體中心區(qū)之內(nèi)(Richards 等(1991)Nucl Acids Res 19:3351-3357),但它在著絲粒功能上的作用仍然不清楚。
植物著絲粒區(qū)主要由著絲粒特異性重復(fù)序列、著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子和主要分散在植物基因組中的少量其它重復(fù)元件組成。例如著絲粒重復(fù)序列(例如CentO和CRR)已知來自水稻。已經(jīng)描述了玉米的4個(gè)著絲粒重復(fù)元件:CentA、CentC、CRMl和CRM2 (SEQIDN0:1-4) 在玉米中,第一個(gè)發(fā)現(xiàn)的串聯(lián)重復(fù)著絲粒特異性元件是CentC(Ananiev 等(1998)ProcNatlAcadSciUSA95:13073-13078)。CentC 形成多個(gè)不同長度的串聯(lián)陣列,其中一些串聯(lián)陣列包含多達(dá)I千個(gè)拷貝的CentC重復(fù)序列。CentC串聯(lián)重復(fù)序列與著絲粒核小體中的CENH3蛋白相互作用。
根據(jù)玉米著絲粒特異性元件CentA的結(jié)構(gòu)和性質(zhì),看來它是反轉(zhuǎn)錄轉(zhuǎn)座子(Ananiev 等(1998)ProcNatlAcadSciUSA95:13073-13078 ;GenBankAF078917)。玉米的另一高度保守的著絲粒特異性反轉(zhuǎn)錄轉(zhuǎn)座子CRM2于2003年發(fā)現(xiàn)(Nagaki等(2003)Geneticsl63:759-770 ;GenBankAY129008)。通過公開的兩個(gè)玉米著絲粒BAC克隆DNA序列(Nagaki 等(2003) Geneticsl63:759-770)和有產(chǎn)權(quán)的玉米基因組DNA序列(Ananiev (2005)未公開)的比較分析,鑒定出第4個(gè)著絲粒特異性反轉(zhuǎn)錄轉(zhuǎn)座子CRMl (SEQIDN0:3)。在密切相關(guān)物種的著絲粒重復(fù)元件中檢測到某些同源性,所述物種例如高粱和甘蔗(Miller等(1998)Geneticsl50:1615-1623 ;Nagaki 等(1998)ChromosomeRes6:295-302 ;Zwick 等(2000) AmJBot87:1757-1764);以及玉米和水稻(Ananiev 等(1998) ProcNatlAcadSciUSA95:13073-13078) ;Cheng 等(2002)Plant Celll4:1691-1704)。
另外,植物著絲粒含有冗余反轉(zhuǎn)錄轉(zhuǎn)座子(CR),在谷物中,許多CR元件屬于高度保守的 Ty3/gypsy 元件種系發(fā)生進(jìn)化枝(Miller 等(1998)TheorApplGenet96:832-839 ;Presting 等(1998)PlantJ16:721-728 ;Langdon 等(2000)Geneticsl56:313_325)。 DNA同源性足夠高,使得來自高粱或短柄草(Brachypodium sylvaticum)的CR探針可鑒定大多數(shù)或所有農(nóng)業(yè)上重要谷物的著絲粒,這些谷物例如水稻、玉米、小麥、高粱、大麥和黑麥(Aragon-Alcaide 等(1996) Chromosoma 105:261-268 ;Jiang等(1996) Proc Natl Acad SciUSA93:14210-14213 ;Miller 等(1998)TheorApplGenet96:832-839)。
反轉(zhuǎn)錄轉(zhuǎn)座子(也稱為進(jìn)化枝I轉(zhuǎn)座元件)由2個(gè)亞型(長末端重復(fù)序列(LTR)和非LTR反轉(zhuǎn)錄轉(zhuǎn)座子)組成。長末端重復(fù)序列亞型具有直接LTR,其大小范圍為 IOObp至5kb。根據(jù)LTR反轉(zhuǎn)錄轉(zhuǎn)座子的序列相似性程度和所編碼基因產(chǎn)物的順序,將其進(jìn)一步分為 Tyl-copia 樣組(Pseudoviridae)和 Ty3_gypsy 樣組(Metaviridae)。反轉(zhuǎn)錄轉(zhuǎn)座子的Tyl-copia組和Ty3_gypsy組通常在大基因組植物中具有高拷貝數(shù)(每個(gè)單倍體核中高達(dá)幾百萬拷貝)。Tyl-copia反轉(zhuǎn)錄轉(zhuǎn)座子在包括單細(xì)胞藻類到苔蘚植物、裸子植物和被子植物在內(nèi)的物種中含量豐富。Ty3_gypsy反轉(zhuǎn)錄轉(zhuǎn)座子的分布也很廣泛,包括裸子植物和被子植物。LTR反轉(zhuǎn)錄轉(zhuǎn)座子占人類基因組的約8%。非LTR反轉(zhuǎn)錄轉(zhuǎn)座子由兩個(gè)亞型(長散在核元件(LINE)和短散在核元件(SINE))組成。它們?cè)谥参镏幸簿哂懈呖截悢?shù)(高達(dá)250,000)。有關(guān)植物轉(zhuǎn)座子(包括反轉(zhuǎn)錄轉(zhuǎn)座子)的綜述可參見Feschotte等(2002)NatRevGenet3:329-341。有關(guān)植物反轉(zhuǎn)錄轉(zhuǎn)座子的綜述可參見Kumar和Bennetzen (1999)Ann Rev Genet33:479-532。
根據(jù)用于系統(tǒng)發(fā)育和分類學(xué)研究的逆轉(zhuǎn)錄元件統(tǒng)一分類,可以鑒別著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子。完整的反轉(zhuǎn)錄 元件和逆轉(zhuǎn)錄病毒包含編碼單種蛋白或多蛋白的兩個(gè)或更多個(gè)可讀框(ORF)。元件中基因的順序不同,根據(jù)逆轉(zhuǎn)錄酶(RT)、RNA酶Hl 5 (RH)、整合酶(INT)和天冬氨酸蛋白酶(PR)基因和保守半胱氨酸-組氨酸(CH)鋅指樣結(jié)構(gòu)域中的氨基酸比對(duì)和關(guān)鍵保守殘基或結(jié)構(gòu)域來分類。反轉(zhuǎn)錄元件也包含側(cè)接反轉(zhuǎn)錄元件內(nèi)部區(qū)的長末端重復(fù)(LTR)序列。反轉(zhuǎn)錄轉(zhuǎn)座子的每個(gè)家族都具有不同的非交叉雜交LTR,家族內(nèi)的組分在其LTR序列中可不同(0-50%)。在轉(zhuǎn)座過程中,兩個(gè)LTR在插入時(shí)間通常相同,但隨時(shí)間變化,替代可引起序列趨異。已知許多反轉(zhuǎn)錄元件,包括著絲粒特異性反轉(zhuǎn)錄轉(zhuǎn)座子(參見例如 SanMiguel 等(1998)NatGenet20:43-45 ;Turcotte 等(2001)PlantJ25:169-179 ;Feng等(2002)Nature420:316 ;Nagaki 等(2004)NatGenet36:138 ;Nagaki 等(2003)Genetics163:750-770:Wu 等(2004)PlantCel116:967-976 ;Hansen 和 Haslop-Harrison(2004)AdvBot Res 41:165-193)。
就相對(duì)大小和重復(fù)序列組成而言,不同玉米染色體著絲粒之間存在明顯差異。在玉米不同染色體中,CentC簇可小至約IOOkb或大于約2000kb,但是常見范圍為約200kb至約300kb。假設(shè)更小的大小祀1圍,可能在單個(gè)BAC克隆中發(fā)現(xiàn)玉米著絲粒區(qū)的完整中心部分。所觀察到的結(jié)構(gòu)多態(tài)性表明,玉米著絲粒由多個(gè)功能性區(qū)組(block)組成,每個(gè)區(qū)組都可支持著絲粒功能。在不同玉米染色體中觀察到受到CentC著絲粒串聯(lián)重復(fù)序列的長度和/或拷貝數(shù)限制的著絲粒大小上的顯著(至少10倍)差異。在不同的近交系的同源染色體著絲粒之間也具有明顯差異。
另一方面,本發(fā)明的人工植物微染色體可包含至少一個(gè)功能性端粒。
端粒是線狀真核染色體末端的核蛋白封端(cap),是維持染色體末端必不可少的。端粒DNA是通過端粒末端轉(zhuǎn)移酶、具有逆轉(zhuǎn)錄酶活性的核糖核蛋白而合成的(McKnight等(2002)Plant Mol Biol 48:331-337)。端粒末端轉(zhuǎn)移酶通過在其RNA亞基內(nèi)拷貝短模板序列,而將端粒DNA加到染色體3'端。大多數(shù)生物的端粒由高度保守的不對(duì)稱短重復(fù)序列組成。
已知許多端粒重復(fù)序列,包括CCCCAA (C4A2,四膜蟲屬(Tetrahymena)和草履蟲屬(Paramecium)) ;C4A4(尖毛蟲屬(Oxytricha)和游仆蟲屬(Euplotes)) ;C3TA(錐蟲屬(Trypanosoma)、利什曼原蟲屬(Leishmania)和絨泡菌屬(Physarum)) ;Q_3A(酵母屬(Saccharomyces)) ;(V8T(網(wǎng)柄菌屬(Dictyostelium));和 C3TA3(擬南芥屬(Arabidopsis)、人類、小鼠、新小桿線蟲屬(Caenrhabditis))。在各生物的天然染色體中觀察到的重復(fù)序列數(shù)差異很大,例如某些纖毛蟲具有約50個(gè)重復(fù)序列,而在擬南芥中觀察到小于350個(gè)重復(fù)序列,在酵母屬中觀察到重復(fù)序列共約300-500bp。
植物的端粒長度(通常范圍為約2_75kb)受到遺傳因素和發(fā)育因子的控制。已經(jīng)從擬南芥中分離出端粒區(qū),顯示串聯(lián)重復(fù)序列的大小不同(Richards和Ausubel (1988)Cell53:127-136)。在玉米近親交配系中,端粒長度有25倍差異,范圍為小于2kb (WF9系)至約40kb(CM37系)(Burr等(1992)PlantCell4:953-960)。越靠近著絲粒,經(jīng)常發(fā)現(xiàn)正則端粒重復(fù)序列與植物基因組的其它重復(fù)元件混合。相比之下,果蠅屬(Drosophila)在其染色體末端使用轉(zhuǎn)座子。在每條染色體末端都發(fā)現(xiàn)多拷貝的轉(zhuǎn)座子(HeT-A和TART元件)。通過新轉(zhuǎn)座子重復(fù)序列轉(zhuǎn)座到末端,可以逆轉(zhuǎn)端粒的逐漸縮短。與端粒末端轉(zhuǎn)移酶對(duì)端粒的維持類似,果蠅的轉(zhuǎn)座模型采用這樣的機(jī)制:使用RNA轉(zhuǎn)座媒介,通過逆轉(zhuǎn)錄酶將其轉(zhuǎn)化到末端DNA上。
DNA復(fù)制是這樣的過程:通過該過程,細(xì)胞在細(xì)胞分裂前制造其遺傳信息的一個(gè)完整拷貝。在大腸桿菌(E.coli)、哺乳動(dòng)物病毒和釀酒酵母(S.cerevisiae)中,DNA復(fù)制的起始受到反式作用起始蛋白的控制,反式作用起始蛋白又與順式作用DNA復(fù)制基因序列相互作用。對(duì)于釀酒酵母,復(fù)制基因包含100-200bp并包括DNA合成開始的主要復(fù)制起始位點(diǎn)。這些復(fù)制基因含有保守Ilbp自主復(fù)制序列(ARS),其結(jié)合起始識(shí)別復(fù)合物(ORC)產(chǎn)生前復(fù)制復(fù)合物(prereplication complex)的核酸形成(Gilbert (2001)Science294:96-100)。
在高等真核生物中,DNA復(fù)制可在成百上千個(gè)染色體位點(diǎn)上同時(shí)開始。限定的起點(diǎn)序列是不需要的,存在許多潛在復(fù)制起點(diǎn),由接近間隔的起始位點(diǎn)的廣泛區(qū)域組成,其中的有些可能會(huì)頻繁使用。
然而,已知若干特定真核細(xì)胞的復(fù)制起點(diǎn),例如18S-26S rDNA的復(fù)制起點(diǎn),其位于非轉(zhuǎn)錄間隔區(qū)內(nèi)(Ivessa和Zakian(2002)Genes Dev 16:2459-2464)。該區(qū)能促進(jìn)轉(zhuǎn)基因構(gòu)建體的擴(kuò)增(Hemann等(1994)DNA Cell Biol 13:437-445)。另一特定起點(diǎn)是在中國倉鼠卵巢(CHO)細(xì)胞的二氫葉酸還原 酶(DHFR)基因下游區(qū)內(nèi)發(fā)現(xiàn)的(Altman和Fanning (2001)Mol Cell Biol 21:1098-1110)。在含有chorion基因的果蠅染色體區(qū)段中也發(fā)現(xiàn)了優(yōu)選的復(fù)制起始位點(diǎn)(Levine 和 Spradling (1985) Chromosoma92:136-142)。
動(dòng)植物細(xì)胞的復(fù)制機(jī)器很可能可復(fù)制任何類型的漸滲DNA,包括整合構(gòu)建體、附加體、完整染色體或其片段(Gilbert (2001) Science 294:96-100)。
人工微染色體是由順式作用DNA序列元件構(gòu)建的線狀或環(huán)狀DNA分子,所述元件負(fù)責(zé)適當(dāng)復(fù)制并將染色體分配給子細(xì)胞。順式作用元件包括:復(fù)制起點(diǎn)(ori),DNA復(fù)制的起始位點(diǎn)(也稱為自主復(fù)制序列(ARS));著絲粒,動(dòng)粒裝配位點(diǎn),用于在有絲分裂和減數(shù)分裂中適當(dāng)分離復(fù)制的染色體;和端粒,特化DNA重復(fù)序列結(jié)構(gòu),其可使線狀染色體末端穩(wěn)定并促進(jìn)染色體末端的完全復(fù)制。
產(chǎn)生真核微染色體的若干策略是可行的,包括但不限于:通過真核細(xì)胞中的內(nèi)源細(xì)胞染色體維持機(jī)器,自組分元件體內(nèi)自我裝配微染色體,自原核細(xì)胞中的組分元件裝配真核微染色體,以及自組分元件體外裝配真核微染色體。
人工微染色體首先是在釀酒酵母中構(gòu)建的(Murray等(1986)Mol Cell Biol6:3166-3172 ;Blackburn 和 Szostak (1984) Ann Rev Biochem 53:163-194)。通過常規(guī)重組DNA技術(shù),裝配環(huán)狀質(zhì)粒,其包含酵母125bp著絲粒、復(fù)制起點(diǎn)、選擇標(biāo)記和回文排列的兩個(gè)延伸端粒DNA,然后通過原生質(zhì)球轉(zhuǎn)化引入酵母,在其中成為簡單線狀分子。含著絲粒、復(fù)制起點(diǎn)和兩個(gè)端粒且長度為50kb的線狀構(gòu)建體,在有絲分裂時(shí)復(fù)制并分離,準(zhǔn)確度為 99%,并在分裂培養(yǎng)物中維持至少20代。YAC的世代顯示出在其它真核生物例如動(dòng)植物中裝配人工染色體的潛力。在YAC上進(jìn)行的實(shí)驗(yàn)表明,需要3個(gè)順式作用DNA序列以構(gòu)建人工染色體:端粒、復(fù)制起點(diǎn)和著絲粒。
可通過兩種不同方法產(chǎn)生動(dòng)物人工染色體:自克隆DNA區(qū)段,從頭合成染色體;或通過天然染色體的斷裂和重排(Brown等(2000) TrendsBiotechnol 18:402-403 ;Cooke (2001) Cloning Stem Cells 3:243-249 ;Lipps 等(20030 基因 304:23-33)。從頭合成方法(即裝配或自下而上(bottom-up)方法)通過組合必需的克隆組分產(chǎn)生人工染色體。用人類alphoidDNA、端粒、人類基因組DNA和選擇標(biāo)記的混合物共轉(zhuǎn)染HT1080細(xì)胞,導(dǎo)致形成微染色體(Harrington 等(1997) Nat Genet 15:345-355)。
微染色體的表征表明,它們都具有復(fù)雜的細(xì)胞遺傳結(jié)構(gòu),并且在沒有任何選擇時(shí)能穩(wěn)定維持。結(jié)論是,可通過 復(fù)合物重排,自輸入DNA從頭合成微染色體及其著絲粒。此后,其它研究小組也使用HT1080細(xì)胞以引入含人alphoid DNA和在YAC、PAC或BAC中克隆的端粒的線狀或環(huán)狀 DNA 構(gòu)建體(Compton 等(1999) Nucleic Acids Res27:1762-1765 ;Grimes等(2001)EMB0Rep2:910-914)。觀察到不同頻率的微染色體,顯示出不同的有絲分裂穩(wěn)定性。所產(chǎn)生的所有微染色體都明顯大于原始構(gòu)建體,變動(dòng)范圍為5-10Mb。因此,可自克隆DNA (作為從頭裝配的主鏈)開始產(chǎn)生完整功能的哺乳動(dòng)物染色體。
保留著絲粒和端粒區(qū)的天然染色體的斷裂和重排是產(chǎn)生微染色體的另一策略。小染色體片段可通過脈沖場凝膠電泳進(jìn)行分離,用所需基因改型,再重新導(dǎo)入宿主細(xì)胞中。在輻射后,在癌細(xì)胞和其它細(xì)胞類型中觀察到斷裂的微染色體,但是,片段太大則無法分離,而且無法控制基因組成。
一個(gè)控制降低染色體大小的方法是根據(jù)端粒相關(guān)的染色體斷裂(TACF)或端粒定向截短(TDT) (Heller 等(1996)Proc Natl Acad Sci USA 93:7125-7130 ;Shen 等(1997)Hum Mol Genet 6:1375-1382)。該方法涉及特定人類宿主染色體連續(xù)斷裂成較小的微染色體,使用打靶載體,其包含末端端粒區(qū)段、選擇標(biāo)記和有時(shí)包含靶染色體的同源區(qū)。所得“工程微染色體”保留自主并能正常分離。已經(jīng)產(chǎn)生小至0.5Mb的微染色體,其含有alphoidDNA,作為人、倉鼠-人體細(xì)胞雜合系或雞細(xì)胞的功能性著絲粒序列。
目前,人類人工染色體用于產(chǎn)生轉(zhuǎn)染色體-克隆的牛,其能產(chǎn)生人免疫球蛋白。在同源重組的雞DT40細(xì)胞中,由Cre/loxP介導(dǎo)的染色體易位和端粒定向的染色體截短而構(gòu)建人類微染色體(HAC)載體,通過微細(xì)胞介導(dǎo)的染色體轉(zhuǎn)移(MMCT),將該載體導(dǎo)入牛的原代胎兒成纖維細(xì)胞。將來自具有HAC的胎兒成纖維細(xì)胞的分離核轉(zhuǎn)移到去核的成熟卵母細(xì)胞中,產(chǎn)生克隆牛(Kuroiwa等(2002)Nat Biotechnol 20:889-894)。根據(jù)誘導(dǎo)哺乳動(dòng)物細(xì)胞內(nèi)在的大規(guī)模擴(kuò)增機(jī)制,已經(jīng)開發(fā)出在體內(nèi)產(chǎn)生人工染色體的方法。將著絲粒隨體DNA和非轉(zhuǎn)錄的rDNA間隔區(qū)定向整合到特定染色體上,導(dǎo)致著絲粒區(qū)的大規(guī)模擴(kuò)增。這些擴(kuò)增的染色體不穩(wěn)定,經(jīng)歷明顯重排,產(chǎn)生優(yōu)先由隨體DNA組成的穩(wěn)定微染色體(Kereso等(1996)Chromosome Res 4:226-239 ;Hadlaczky(2001)Curr Opin Mol Ther 3:125-132)。
開發(fā)出含多個(gè)序列特異性重組接受位點(diǎn)的人工染色體(ACE平臺(tái))。在打靶載體中提供目標(biāo)序列,用、(lambda)整合酶催化ACE平臺(tái)和打靶載體間的重組。
在植物中也觀察到類似過程。觀察到植物天然染色體的自發(fā)斷裂。在擬南芥(Murata 等(2006) Chromosoma, 2006 年 4 月 11 日在線公布)和玉米(Brock 和 Pryor (1996)Chromosomal04:575-584 ;Kato 等(2005)Cytogenet Genome Res 109:156-165)中發(fā)現(xiàn)了微染色體。在某些情況下,電離福射可誘導(dǎo)微染色體(Riera-Lizarazu等(2000)Genetics156:327-339)。
已經(jīng)構(gòu)建了水稻著絲粒5的物理圖譜,可用于產(chǎn)生水稻人工染色體(Nonomura和Kurata(2001)Chromosoma 110:284-291)。提出構(gòu)建人工染色體的類似方法,用于平匐甜菜(Beta procumbens) (Gindullis 等(2001)Genome 44:846-855)。在植物轉(zhuǎn)化事件中可發(fā)現(xiàn)轉(zhuǎn)基因構(gòu)建體多聯(lián)體化、連接和重排。用標(biāo)準(zhǔn)構(gòu)建體的通用植物轉(zhuǎn)化可產(chǎn)生復(fù)雜的重排、多聯(lián)體化和構(gòu)建體擴(kuò)增(Svitashev 和 Somers (2001) Genome 44:691-697 ;Svitashev等(2002)PlantJ32:443-445)。用多個(gè)質(zhì)粒共轉(zhuǎn)化植物,可產(chǎn)生含不同轉(zhuǎn)基因組合的轉(zhuǎn)基因基因座(Wu等(2002) Transgene Resll: 533-541)。類似于在動(dòng)物細(xì)胞中進(jìn)行的研究,在植物細(xì)胞中可通過各組分的自發(fā)多聯(lián)體化和連接,從頭裝配人工微染色體(參見圖1-10和14-15)。
本發(fā)明涉及包含功能性著絲粒的人工植物微染色體,其中著絲粒與著絲粒蛋白C特異性結(jié)合。
動(dòng)粒將著絲粒DNA與紡錘絲連接在一起。在著絲粒附近特異性結(jié)合的人類自身抗體可促進(jìn)著絲粒相關(guān)蛋白的克隆(CENP, Rattner (1991) Bioassaysl3:51-56)。這些蛋白質(zhì)中的至少一種屬于微管動(dòng)力蛋白的驅(qū)動(dòng)蛋白超家族(Yen(1991)EMB0J10:1245-1254)。通過遺傳和生化研究已經(jīng)鑒定出酵母著絲粒結(jié)合蛋白(Bloom(1993)Cell 73:621-624 ;Lechner等(1991) Cell64:717-725)。CENH3是取代著絲粒中的組蛋白H3的高度保守蛋白,認(rèn)為它能募集染色體運(yùn)動(dòng)所需的 其它蛋白質(zhì)。CENH3在整個(gè)細(xì)胞周期中都存在,并與減數(shù)分裂細(xì)胞中的動(dòng)粒著絲粒蛋白C(CENPC)共同定位。
可使用著絲粒相關(guān)蛋白的特異性抗體,以證實(shí)DNA構(gòu)建體和/或微染色體中的著絲粒裝配。CENP(例如CENH3和/或CENPC)免疫定位在微染色體著絲粒上,表明形成包含著絲粒DNA元件和相關(guān)結(jié)合蛋白的功能性著絲粒。制備針對(duì)玉米著絲粒組蛋白H3(CENH3, 17kD)的抗血清,并在天然玉米染色體上進(jìn)行了測試(Zhong等(2002)PlantCell 14:2825-2836)。染色質(zhì)免疫沉淀表明,CentC和CRM2與CENH3特異性相互作用。約38%和33%CentC和CRM2在染色質(zhì)免疫沉淀測定中沉淀下來,證明大部分CENH3與CentC共同定位。Dawe等((1999)Plant Cellll: 1227-1238)分離出哺乳動(dòng)物CENPC的玉米同源物,其顯示出是玉米動(dòng)粒的組分。使用來自氨基端結(jié)構(gòu)域的20個(gè)氨基酸的保守肽,產(chǎn)生對(duì)玉米CENPC具有特異性的抗血清,其經(jīng)直接標(biāo)記并用于證明CENPC特異性定位到玉米天然和人工微染色體的著絲粒上(參見例如圖3、4、8和10)。
著絲粒重復(fù)元件CentA、CentC、CRMl 和 CRM2 包括與 SEQ ID NO: 1-4 中的 CentA、CentCXRMl和CRM2的玉米序列基本相同的序列?;鞠嗤男蛄邪ū舜烁叨韧吹男蛄?,例如具有顯著%序列同一性和/或在嚴(yán)格性條件下與CentA、CentC、CRMl或CRM2 (SEQID NO: 1-4)或其互補(bǔ)序列選擇性雜交。在嚴(yán)格性雜交條件下選擇性雜交的序列包括這樣的序列:其與靶序列雜交比背景至少高2倍并可基本上排除非靶核酸。選擇性雜交序列通常與靶序列具有約至少80%、85%、90%、95%、96%、97%、98%、99%或100%序列同一性。可使用本領(lǐng)域已知的任何合適雜交條件和緩沖液,其實(shí)例在本文中有描述。序列同一性可用于比較兩個(gè)多核苷酸或多肽序列的一級(jí)結(jié)構(gòu)。序列同一性測定兩個(gè)序列中的相同殘基,當(dāng)比對(duì)最大對(duì)應(yīng)性時(shí)??捎糜?jì)算機(jī)執(zhí)行的算法來分析序列關(guān)系。兩個(gè)或更多個(gè)多核苷酸、或者兩個(gè)或更多個(gè)多肽之間的序列關(guān)系測定如下:通過測定序列的最佳比對(duì),給比對(duì)中的匹配和空位打分,得到%序列同一性和%序列相似性。根據(jù)比較各自所編碼的多肽,也可描述多核苷酸的關(guān)系。已知許多用于序列比較和分析的程序和算法。除非另有說明,否則本文提供的序列同一丨I"生/相似性值是指用GAP第10版(GCG, Accelrys, San Diego, CA)并用以下參數(shù)得到的值:對(duì)于核苷酸序列的%同一性和%相似性,用空位權(quán)重(GAPWeight)為50和長度權(quán)重(LengthWeight)為3, nwsgapdna.cmp打分矩陣;對(duì)于氨基酸序列的%同一性和%相似性,用空位權(quán)重(GAP Weight)為8和長度權(quán)重(Length Weight)為2,BL0SUM62打分矩陣(Henikoff 和 Heniko ff (1992) Proc Natl Acad Sci USA 89:10915-10919)。GAP 使用Needleman和Wunsch ((1970) J Mol Biol 48:443-453)的算法,得到兩個(gè)完整序列最大匹配數(shù)和最小空位數(shù)的比對(duì)?;鞠嗤ň哂兄辽?0%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的序列,其中序列有望保留天然功能,根據(jù)總體%序列同一性、序列相似性、一級(jí)序列的總體比對(duì)、保守殘基區(qū)組的存在、保守元件和/或結(jié)構(gòu)域的存在、保守功能性結(jié)構(gòu)域的存在、結(jié)合區(qū)的存在、催化殘基的存在、預(yù)測的二級(jí)和/或三級(jí)結(jié)構(gòu)、已知三維結(jié)構(gòu)的可利用性和本領(lǐng)域技術(shù)人員采用的其它標(biāo)準(zhǔn),來鑒定和預(yù)測任何特定序列的功能性同源序列。
與天然多核苷酸相比,多核苷酸變異體包括在5’端、3’端、和/或內(nèi)部位點(diǎn)(包括內(nèi)含子或外顯子)中的至少一個(gè)具有至少一個(gè)缺失、添加和/或取代的多核苷酸。多核苷酸變異體包括天然存在的變異體以及人工衍生的多核苷酸,例如,用定點(diǎn)誘變產(chǎn)生的那些。保守變異體包括這樣的序列:與天然多核苷酸相比,所述序列保留其功能,編碼相同的多肽,或編碼具有基本類似的同一性、功能和/或活性的多肽變異體。用聚合酶鏈?zhǔn)椒磻?yīng)(PCR)和/或雜交技術(shù)等已知技術(shù)可鑒定變異體。通常,特定多核苷酸的變異體與特定多核苷酸具有至少約 40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。也可采用標(biāo)準(zhǔn)比對(duì)程序和參數(shù),通過比較所編碼多肽間的%序列同一性,評(píng)價(jià)多核苷酸變異體。當(dāng)通過比較各自所編碼的兩個(gè)多肽共享的%序列同一性時(shí),這兩個(gè)所編碼的多肽的%序列同一性通常為至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更高序列同一性。
與天然多肽相比,蛋白變異體包括在N-末端、C-末端和/或內(nèi)部位點(diǎn)中的至少一個(gè)具有至少一個(gè)缺失、添加和/或取代的蛋白質(zhì)。蛋白變異體具有蛋白質(zhì)所需生物活性。變異體包括天然存在的多肽,以及通過人工操作的那些。經(jīng)序列比對(duì)程序測定,蛋白質(zhì)的生物活性變異體通常與天然蛋白的氨基酸序列具有至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或更高序列同一性。蛋白質(zhì)的生物活性變異體與所述蛋白質(zhì)的差異可能僅在1-15個(gè)氨基酸殘基上。保守取代通常是指一個(gè)氨基酸被另一個(gè)具有相似特性的氨基酸交換。例如Dayhoff等(1978) Atlas ofProtein Sequence and Structure (Natl Biomed Res Found, Washington, D.C.)的模型提供了不希望影響蛋白質(zhì)生物活性的氨基酸取代的指南。
多核苷酸和蛋白質(zhì)變異體包含來自誘變和/或重組方法(例如誘變和/或DNA改組)的序列。誘變和改變核苷酸序列的方法是已知的(參見例如Kunkel (1985)ProcNatl Acad Sci USA 82:488-492 ;Kunkel 等(1987)Methods Enzymol 154:367-382 ;美國專利 4,873,192 ;Walker 和 Gaastra 編著(1983) Techniques in Molecular Biology(MacMillan Publ.C0.,NY)及其中引用的參考文獻(xiàn))。例如,可操作一個(gè)或多個(gè)不同的重組酶編碼序列,產(chǎn)生和選擇具有所需特性的新的重組酶蛋白。通常,從相關(guān)序列群體中產(chǎn)生重組多核苷酸文庫,并且可在體外或體內(nèi)同源重組(參見例如Stemmer (1994)Proc NatlAcad Sci USA 91:10747-10751 ;Stemmer(1994)Nature370:389-391 ;Crameri 等(1997)Nat Biotechnol15:436-438 ;Moore 等(1997)J Mol Biol272:336-347 ;Zhang 等(1997)Proc Natl Acad Sci USA94:4504-4509 ;Crameri 等(1998)Nature391:288-291 ;和美國專利5,605,793和5,837,458)。通常,編碼多肽的多核苷酸的修飾不應(yīng)改變讀框,或產(chǎn)生和/或改變DNA或mRNA的二級(jí)結(jié)構(gòu)。參見EP專利申請(qǐng)公布號(hào)75,444。
重疊寡核苷酸(縮寫為overgo)是長度跨越約40bp的引物對(duì),通常由在3’端具有Sbp重疊區(qū)的2個(gè)24bp寡核苷酸組成。該特征允許重疊寡核苷酸弓I物對(duì)彼此弓I導(dǎo),并通過克列諾(Klenow)填補(bǔ)法,用標(biāo)記核苷酸合成其互補(bǔ)鏈(McPherson(1999)GenomeAnalysis:ALaboratory Manual,第 4 卷,第 207-213 頁,Birren 等主編,Cold Spring HarborLaboratory Press, Cold Spring Harbor, NY)??墒褂酶鞣N標(biāo)記核苷酸,包括但不限于放射性標(biāo)記的核苷酸或突光標(biāo)記的核苷酸。這用于產(chǎn)生探針,用于不同的雜交方法,包括但不限于菌落雜交、斑點(diǎn)印跡、DNA印跡和原位雜交,例如FISH。對(duì)于文庫雜交而言,與常規(guī)探針相比,重疊寡核苷酸探針的主要優(yōu)勢(shì)在于可選擇用于設(shè)計(jì)重疊寡核苷酸的序列,因此可避免常規(guī)DNA片段探針中存在的重復(fù)序列;因此,可減少大基因組DNA文庫篩選中經(jīng)常會(huì)出現(xiàn)的交叉雜交問題。因?yàn)橛性搩?yōu)勢(shì),所以重疊寡核苷酸雜交結(jié)合探針庫策略(Cai等(1998) Genomics 54:387-397 ;Chang 等(2001)Genetics 159:1231-1242 ;Tao 等(2001)Geneticsl58:1711-1724 ;Romanov 等(2003)Cytogenet Genome Res 101:277-281)已經(jīng)成為用于高通量BAC文庫篩選的方法,用于克隆鑒定和物理基因作圖。
在某些實(shí)例中,與DNA構(gòu)建體一起或在該構(gòu)建體內(nèi)提供可增強(qiáng)或刺激細(xì)胞生長的基因或所編碼的多肽。增強(qiáng)或刺激細(xì)胞生長的基因包括這樣的基因:其參與轉(zhuǎn)錄調(diào)節(jié)、同源異型基因調(diào)節(jié)、干細(xì)胞維持和增殖、細(xì)胞分裂和/或細(xì)胞分化,例如WUS同源序列(Mayer等(1998)Cell95:805-815 ;W001/0023575 ;US2004/0166563) ;aintegumenta(ANT)(Klucher等(1996)PlantCell8:137-153 ;Elliott 等(1996)Plant Cell 8:155-168 ;GenBank 檢索號(hào) U40256、U41339、Z47554) ;clavata(例如 CLVl、CVL2、CLV3) (W003/093450 ;Clark 等(1997)Cell 89:575-585 Jeong 等(1999)PlantCellll:1925-1934 ;Fletcher 等(1999)Science283:1911-1914) ;Clavata 和 Embryo Surround region 基因(例如 CLE) (Sharma等(2003)PlantMolBiol51:415-425 ;Hobe 等(2003)Dev Genes Evol 213:371-381 ;Cock和 McCormick(2001)Plant Physiol 126:939-942 ;Casamitjana-Martinez 等(2003)CurrBioll3:1435-1441) ;baby boom(例如 BNM3、BBM、ODPl、0DP2) (W000/75530 ;Boutileir等(2002)Plant Celll4:1737-1749) ;Zwille(Lynn 等(1999)Dev 126:469-481);leafy cotyledon(例 如 Lecl、Lec2) (Lotan 等(1998)Cell 93:1195-1205 ;W000/28058 ;Stone 等(2001)ProcNatl Acad Sci USA 98:11806-11811 ;美國專利 6,492,577);Shoot Meristem-1ess(STM)(Long 等(1996)Nature379:66-69) ;ultrapetala (ULT)(Fletcher(2001)Devl28:1323-1333);促分裂原激活蛋白激酶(MAPK) (Jonak 等(2002)Curr Opin Plant Biol5:415);激酶相關(guān)蛋白憐酸酶(KAPP) (Williams 等(1997) ProcNatl Acad Sci USA94:10467-10472 ;Trotochaud 等(1999)Plant Cellll:393-406);ROP GTPase(Wu 等(2001)PlantCelll3:2841-2856 ;Trotochaud 等(1999)PlantCellll:393-406) ;fasciata(例如 FASU FAS2) (Kaya 等(2001) Celll04:131-142);細(xì)胞周期基因(美國專利 6, 518, 487 ;W099/61619 ;W002/074909)、Shepherd (SHD)(Ishiguro 等(2002)EMB0J.21:898-908) !Poltergeist(Yu 等(2000)Devl27:1661-1670 ;Yu 等(2003)Curr Biol13:179-188) ;Pickle (PKL) (Ogas 等(1999)Proc Natl Acad SciUSA96:13839-13844) ;knox 基因(例如 KN1、KNAT1) (Jackson 等(1994)Devl20:405-413 ;Lincoln 等(1994)Plant Cell6:1859-1876 ;Venglat 等(2002)Proc Natl Acad SciUSA99:4730-4735);受精獨(dú)立性胚乳(fertilization independent endosperm (FIE)(Ohad等(1999)PlantCellll:407-415)等等。多核苷酸組合包括多拷貝的任何一個(gè)目標(biāo)多核苷酸,而且組合可具有上調(diào)和下調(diào)所組合多核苷酸表達(dá)的任何組合。組合可以在或不在一個(gè)用于轉(zhuǎn)化宿主細(xì)胞的構(gòu)建體上組合,因此可相繼或同時(shí)提供。宿主細(xì)胞可以是野生型或突變型的細(xì)胞,以正?;蚍钦扼w狀態(tài)。
位點(diǎn)特異性重組酶系統(tǒng)可以與任何微染色體系統(tǒng)一起使用。在植物細(xì)胞中建立了DNA構(gòu)建體或微染色體之后,能催化正向和反向反應(yīng)的整合酶和重組酶都可用于引入修飾??蛇M(jìn)行不同分子內(nèi)的修飾,例如給定序列的缺失或倒位。此外,可進(jìn)行分子間的插入和交換,包括用含有相容的位點(diǎn)特異性重組位點(diǎn)的內(nèi)源染色體來易位。也可使用重組酶系統(tǒng),在微染色體內(nèi)建立靶位點(diǎn)(泊靠位點(diǎn)),用于隨后通過任何方法(包括雜交或直接遞送)進(jìn)行目標(biāo)多核苷酸的位點(diǎn)特異性整合。
可使用來自重組系統(tǒng)的元件,例如重組酶和重組位點(diǎn),例如在DNA構(gòu)建體內(nèi)、靶位點(diǎn)和/或轉(zhuǎn)移盒中。靶位點(diǎn)包括整合到基因組的多核苷酸,所述多核苷酸包含有效連接至少一個(gè)重組位點(diǎn)的啟動(dòng)子。轉(zhuǎn)移盒包括有效連接目標(biāo)多核苷酸和/或編碼選擇標(biāo)記的多核苷酸的至少一個(gè)第一重組位點(diǎn),其中第一重組位點(diǎn)是用靶位點(diǎn)中的重組位點(diǎn)重組產(chǎn)生的。中靶種子或植物已將DNA構(gòu)建體穩(wěn)定結(jié)合在其基因組中,所述構(gòu)建體是通過使用重組系統(tǒng)而產(chǎn)生和/或操作的??梢圆捎脤?dǎo)致不同整合、改變和/或切除事件而產(chǎn)生所述的DNA構(gòu)建體的位點(diǎn)特異性重組方法,得到中靶種子。參見例如W099/25821、W099/25854、W099/25840、W099/25855、W099/25853, W099/23202, W099/5585U W001/07572, W002/08409和 TO03/08045。
重組酶是在其相容重組位點(diǎn)間催化位點(diǎn)特異性重組的多肽,包括天然存在的重組酶序列、變異體和/或保留活性的片段。重組位點(diǎn)是由重組酶特異性識(shí)別的核苷酸序列,包括天然存在的重組位點(diǎn)序列、變異體和/或保留活性的片段。有關(guān)位點(diǎn)特異性重組酶的綜述可參見 Sauer (1994) Curr0pBiotech5:521-527 ;Sadowski (1993)FASEB7:760-767 ;Groth 和 Calos (2004)JMolBiol335:667-678 ;和 Smith 和 Thorpe(2002)MolMicrobiol44:299-307。任何重組系統(tǒng)或系統(tǒng)組合都可采用,包括但不限于重組酶和來自整合酶和/或解離酶家族的重組位點(diǎn)、生物活性變異體和其片段、和/或任何其它天然存在的或重組產(chǎn)生的酶或其變異體(其催化特定重組位點(diǎn)間的保守位點(diǎn)特異性重組)、和天然存在的或修飾的重組位點(diǎn)或其變異體(其由重組酶特異性識(shí)別而產(chǎn)生重組事件)。
所用的重組位 點(diǎn)可以是相應(yīng)位點(diǎn)或不相似位點(diǎn)。相應(yīng)重組位點(diǎn)、或一組相應(yīng)重組位點(diǎn)是具有相同核苷酸序列的位點(diǎn)。在合適重組酶存在下,一組相應(yīng)重組位點(diǎn)將會(huì)與彼此有效重組。不相似重組位點(diǎn)具有不同序列,彼此間含有至少一個(gè)核苷酸差異。一組不相似重組位點(diǎn)中的重組位點(diǎn)可以彼此重組或不重組。一組不相似位點(diǎn)中的每個(gè)重組位點(diǎn)都具有生物活性,可以與相同位點(diǎn)重組。在合適重組酶的存在下,致重組位點(diǎn)能彼此重組。致重組位點(diǎn)包括這樣的位點(diǎn):其中在切除測定中,在標(biāo)準(zhǔn)條件下,與野生性對(duì)照相比,致重組位點(diǎn)之間重組的相對(duì)切除效率在檢出限之上,通常高出2%、5%、10%、20%、50%、100%或更高。在合適重組酶存在下,非致重組位點(diǎn)彼此不重組,或位點(diǎn)之間的重組無法檢出。非致重組的重組位點(diǎn)包括這樣的位點(diǎn):在切除測定中,在標(biāo)準(zhǔn)條件下,與野生性對(duì)照相比,其彼此重組的頻率低于檢出限,通常低于 2%、1.5%、1%、0.75%,0.5%、0.25%,0.1%、0.075,0.005%,0.001%。任何合適的非致重組的重組位點(diǎn)都可利用,包括FRT位點(diǎn)或其活性變異體、1x位點(diǎn)或其活性變異體、att位點(diǎn)或其活性變異體、其任何組合、或非致重組的重組位點(diǎn)的任何其它組合。一組致重組的重組位點(diǎn)中的同向重復(fù)的重組位點(diǎn)以同一方向排列,這些位點(diǎn)之間的重組導(dǎo)致間插DNA序列的切除。一組致重組的重組位點(diǎn)中的反向重組位點(diǎn)以相反方向排列,這些位點(diǎn)之間的重組導(dǎo)致間插DNA序列的倒位。
重組酶的整合酶家族成員超過100個(gè),包括例如FLP、Cre, Dre, Int和R。對(duì)于整合酶家族的其它成員,參見例如Esposito等(1997)NucleicAcidsRes25:3605-3614 ;Nunes-Duby 等(1998)NucIeic Acids Res26:391-406 ;Abremski 等(1992)ProteinEng5:87-91 ;Groth 和 Calos (2004)JMolBiol335:667-678 ;和 Smith 和Thorpe (2002) Mo I Microbiol 44:299-307。其它重組系統(tǒng)包括例如鏈霉菌噬菌體 phiC31(Kuhstoss 等(1991)JMol Biol20:897-908);噬菌體入(Landy(1989)AnnRev Biochem58:913-949 和 Landy(1993)Curr Op GenetDev3:699-707);希氏硫化葉菌(Sulfolobus shibatae)的 SSVl 位點(diǎn)特異性重組系統(tǒng)(Maskhelishvili 等(1993)Mol Gen Genet237:334-342);和基于逆轉(zhuǎn)錄病毒整合酶的整合系統(tǒng)(Tanaka等(1998)Genel7:67-76)。在某些實(shí)例中,重組酶是不需要輔因子或超螺旋底物的酶。這樣的重組酶包括Cre、FLP、phiC31Int、突變?nèi)隝nt、R、SSVl、Dre或其活性變異體或其片段。FLP重組酶催化兩個(gè)FRT位點(diǎn)間的位點(diǎn)特異性反應(yīng),并在DNA復(fù)制期間參與擴(kuò)增釀酒酵母2 U質(zhì)粒的拷貝數(shù)。FLP蛋白已克隆并表達(dá)。參見例如Cox(1993)Proc Natl Acad Sci USA80:4223-4227。所用的FLP重組酶可來自酵母屬。在某些實(shí)例中,采用由植物優(yōu)選密碼子編碼的重組酶合成的多核苷酸。由包含玉米優(yōu)選密碼子的核苷酸序列編碼的催化位點(diǎn)特異性重組事件的FLP酶(FLPm)是已知的(美國專利5,929,301)。額外的功能性變異體和FLP片段是已知的。參見例如 Buchholz 等(1998) NatBiotechnol 16:617-618, Hartung 等(1998) J Biol Chem273:22884-22891,Saxena 等(1997)Biochim Biophys Acta 1340:187-204, Hartley 等(1980)Nature286:860-864, Shaikh 和 Sadowski (2000)J Mol Biol302:27-48, Voziyanov等(2002)Nucleic Acids Res 30:1656-1663和Voziyanov等(2003) J Mol Biol326:65-76。噬菌體Pl重組酶Cre催化兩個(gè)1x位點(diǎn)之間的位點(diǎn)特異性重組。參見例如Guo等(1997)Nature389:40-46;Abremski 等(1984)J Biol Chem259:1509-1514 ;Chen 等(1996)SomatCellMolGenet22:477-488 ;Shaikh 等(1977)J Biol Chem272:5695-5702 ;和Buchholz等(1998)NatBiotechnol 16:617-618。Cre多核苷酸序列也可使用植物優(yōu)選密碼子來合成,例如moCre (參見例如W099/25840),其它變異體是已知的,參見例如Vergunst 等(2000)Science290:979-982,Santoro 和 Schulz(2002)Proc Natl Acad SciUSA99:4185-4190,Shaikh和 Sadowski(2000)J Mol Biol302:27-48,Rufer和 Sauer(2002)Nucleic Acids Res30:2764-2771, Wierzbicki 等(1987)Mol Biol 195:785-794, Petyuk等(2004)J Biol Chem279:37040-37048,Hartung 和 Kisters-Wolke(1998)JBiolChem273:22884-22891, Koresawa 等(2000)J Biochem (Tokyo) 127:367-372,美國專利6,890,726 和 Buchholz 和 Stewart (2001)NatBiotechnoll9:1047-1052。在 Pl 相關(guān)噬菌體中已經(jīng)鑒定出Cre同源序列,從噬菌體D6中分離的重組酶稱為Dre,它是與Cre密切相關(guān)的酪氨酸重組酶,但它識(shí)別不同32bp rox位點(diǎn)(Sauer和McDermott (2004) NucleicAcids Res32:l_10)。phiC31 整合酶和變異體是已知的(Kushtoss 等(1991) J Mol Biol222:897-908, W003/066867, W005/017170,US2005/0003540 和 Sclimenti 等(2001)Nucleic Acids Res 29: 5044-5051。入整合酶和輔因子(Hoess 等(1980)Proc Natl AcadSciUSA77:2482-2486,Blattner 等(1997) Science277:1453-1474)及其變異體是已知的,包括輔因子-獨(dú)立型 Int 變異體(Miller 等(1980)Cell20:721-729, Lange-Gustafson和 Nash(1984)J Biol Chem259:12724-12732,Christ 等(1998)J Mol Biol288:825-836和 Lorbach 等(2000) J Mol Biol296:1175-1181)、att 位點(diǎn)識(shí)別變異體(Dorgai 等(1995)J Mol Biol252:178-188, Yagu 等(1995)J Mol Biol252:163-167 和 Dorgai 等(1998)J Mol Biol277:1059-1070)、以及玉米密碼子優(yōu)化的Int、變異體和輔因子序列(W003/08045)。其它整合酶和變異體是已知的,例如HK022整合酶(Kolot等(1999)Mol Biol R印26:207-213)和變異體,例如att位點(diǎn)識(shí)別變異體(Dorgai等(1995) J MolBiol252:178-188, Yagu 等(1995)J Mol Biol252:163-167 和 Dorgai 等(1998)J MolBiol277:1059-1070)。
野生型重組位點(diǎn)、突變型或者野生型和/或突變型位點(diǎn)的任何組合都可使用。這樣的重組位點(diǎn)包括例如野生型的lox、FRT和att位點(diǎn),以及突變型的lox、FRT和att位點(diǎn)。突變型1x位點(diǎn)的重組活性分析可參見Lee等(1998) Gene216:55_65。其它重組位點(diǎn)和變異體是已知的,參見例如Hoess等(1982)Proc Natl Acad SciUSA79:3398-3402 ;Hoess 等(1986)Nucleic Acids Resl4:2287-2300 !Thomson 等(2003)Genesis36:162-167 ;Schlake 和 Bode(1994)Biochemistry33:12746-12751 ;Siebler 和 Bode(1997)Biochemistry36:1740-1747 ;Huang 等(1991)Nucleic AcidsResl9:443-448 ;Sadowski(1995)載于 Progress in Nucleic Acid Research andMolecular Biology 第 51 卷,第 53-91 頁;Cox (1989)載于 Mobile DNA, Berg 和 Howe (主編)AmericanSociety of Microbiology, Washington D.C.,第 116-670 頁;Dixon 等(1995)Mol Microbiol18:449-458 ;Umlauf 和 Cox(1988)EMBO J7:1845-1852 ;Buchholz等(1996)Nucleic Acids Res24:3118_3119 ;Kilby 等(1993)Trends Genet9:413-421 ;Rossant 和Geagy (1995)Nat Medl:592-594 ;Bayley 等(1992)Plant Mol Bioll8:353_361 ;Odell 等(1990)Mol Gen Genet223:369-378 ;Dale 和 0w(1991)Proc Natl AcadSciUSA88:10558-10562 ;Qui 等(1994)Proc Natl Acad Sci USA91:1706-1710 ;Stuurman等(1996)Plant Mol Biol32:901-913 ;Dale 等(1990)Gene91:79-85 ;Albert 等(1995)Plant J7:649-659,美國專利 6,465,254,TO01/23545, TO99/55851 和 TO01/11058。在某些實(shí)例中,可使用多組不相似和相應(yīng)重組位點(diǎn),例如來自不同重組系統(tǒng)的位點(diǎn)。因此,任何合適的重組位點(diǎn)或重組位點(diǎn)組都可使用,包括FRT位點(diǎn)、FRT位點(diǎn)的生物活性變異體、1x位點(diǎn)、1x位點(diǎn)的生物活性變異體、att位點(diǎn)、att位點(diǎn)的生物活性變異體、其任何組合或重組位點(diǎn)的任何其它組合。FRT位點(diǎn)的實(shí)例包括例如最小野生型FRT位點(diǎn)(FRTl)和各種突變型FRT位點(diǎn),包括但不限于FRT5、FRT6和FRT7(參見美國專利6,187,994)。額外的變異FRT位點(diǎn)是已知的,(參見例如WOOI/23545和美國公布說明書2007/0015195,通過引用結(jié)合到本文中)??墒褂玫钠渌亟M位點(diǎn)包括att位點(diǎn),例如以下文獻(xiàn)中公開的那些:Landy (1989)Ann Rev Biochem58:913-949, Landy(1993)Curr Op Genet Dev3:699-707,美國專利 5,888,732,W001/07572 和 Thygarajan 等(2001)MolCellBiol21:3926-3934。所用的位點(diǎn)特異性重組酶取決于靶位點(diǎn)和轉(zhuǎn)移盒中的重組位點(diǎn)。如果使用FRT位點(diǎn),則提供FLP重組酶,當(dāng)使用1x位點(diǎn)時(shí),則提供Cre重組酶,當(dāng)使用\ att位點(diǎn)時(shí),則提供\ Int,當(dāng)使用phiC31att位點(diǎn)時(shí),則提供phiC31Int。如果所用的重組位點(diǎn)包括來自不同系統(tǒng)的位點(diǎn),例如FRT和1x位點(diǎn),可提供這兩種重組酶活性,無論是作為獨(dú)立的實(shí)體還是嵌合重組酶,例如 FLP/Cre (參見例如 W099/25840)。
提供標(biāo)記,用于鑒定和/或選擇表達(dá)標(biāo)記的細(xì)胞、植物和/或種子。標(biāo)記包括例如篩選標(biāo)記、可見標(biāo)記和/或選擇標(biāo)記。選擇標(biāo)記是任何這樣的標(biāo)記:當(dāng)以足夠量表達(dá)時(shí),賦予對(duì)選擇試劑的抗性。例如可使用可見標(biāo)記鑒定含有導(dǎo)入DNA構(gòu)建體的轉(zhuǎn)化細(xì)胞。在一個(gè)實(shí)例中,可見標(biāo)記是熒光蛋白。這樣的熒光蛋白包括但不限于黃色熒光蛋白(YFP)、綠色熒光蛋白(GFP)、藍(lán)色熒光蛋白(CFP)和紅色熒光蛋白(RFP)。在再一個(gè)實(shí)例中,可見標(biāo)記是由具有玉米優(yōu)選密碼子的多核苷酸所編碼的。在又一個(gè)實(shí)例中,可見標(biāo)記包括GFPm、AmCyan、ZsYellow 或 DsRed。參見 Wenck 等(2003)PlantCellRep.22:244-251。
選擇標(biāo)記及其相應(yīng)選擇試劑包括但不限于除草劑抗性基因和除草劑;抗生素抗性基因和抗生素;和其它化學(xué)抗性基因及其相應(yīng)的化學(xué)試劑。細(xì)菌藥物抗性基因包括但不限于新霉素磷酸轉(zhuǎn)移酶IUnptII)(其賦予 對(duì)卡那霉素、巴龍霉素、新霉素和G418的抗性)和潮霉素磷酸轉(zhuǎn)移酶(hph)(其賦予對(duì)潮霉素B的抗性)。另見Bowen (1993)Markersfor PlantGene Transfer, Transgenic Plants,第 I 卷,Engineering andUtilization ;Everett等(1987)Bio/Technology5:1201-1204 ;Bidney 等(1992)PlantMolBioll8:301_313 ;和W097/05829。
若干類群也可賦予除草劑抗性,包括氨基酸合成抑制劑、光合作用抑制劑、脂質(zhì)抑制劑、生長調(diào)節(jié)劑、細(xì)胞膜破壞劑、色素抑制劑、幼苗生長抑制劑,包括但不限于咪唑啉酮、磺酰脲、三唑并嘧啶、草甘膦、烯禾啶、_唑禾草靈、草銨膦、草丁膦、均三氮苯類、溴苯腈等。參見例如 Holt (1993)Ann Rev Plant Physiol Plant Mol Biol44:203_229 ;和 Miki 等(2004)J Biotechnoll07:193-232。選擇標(biāo)記包括賦予除草劑抗性的序列,包括但不限于bar基因,其編碼賦予草銨膦抗性的膦絲菌素乙酰轉(zhuǎn)移酶(PAT) (Thompson等(1987)EMB0J6:2519-2523);草甘膦氧化還原酶(GOX)、草甘膦N-乙酰轉(zhuǎn)移酶(GAT)和5-烯醇丙酮酰莽草酸-3-磷酸合酶(EPSPS),其賦予對(duì)草甘膦的抗性(Barry等(1992)載于Biosynthesisand Molecular Regulation of Amino Acids in Plants, B.K.Singh等(主編)第 139-145頁;Kishore等(1992)ffeed Tech6:626-634 ;Castle(2004)Science304:1151-1154 ;Zhou等(1995)PlantCell R印 15:159-163 ;W097/04103 ;W002/36782 ;和 W003/092360)。其它選擇標(biāo)記包括二氫葉酸還原酶(DHFR),其賦予對(duì)甲氨蝶呤的抗性(參見例如Dhir等(1994)Improvements of CerealQuality by Genetic Engineering, R.J.Henry (主編),PlenumPress, New York ;和 Hauptmann 等(1988)Plant Physiol86:602-606)。乙酸輕酸合酶(AHAS或ALS)突變序列導(dǎo)致對(duì)咪唑啉酮類(imidiazolinones)和/或磺酰脲類(例如咪草煙和/或氯磺隆)的抗性(參見例如Zu等(2000)Nat Biotechnoll8:555_558 ;美國專利 6,444, 875 和 6, 660, 910 ;Sathasivan 等(1991)Plant Physiol97:1044-1050 ;0tt 等(1996)JMol Biol263:359-368 ;和 Fang 等(1992)PlantMolBioll8:1185-1187)。
另外,化學(xué)物質(zhì)抗性基因還包括賦予4-甲基色氨酸(4-mT)抗性的色氨酸脫羧酶(Goodijn等(1993) Plant Mol Biol22:907-912);和賦予溴苯腈抗性的溴苯腈腈水解酶。選擇標(biāo)記可包括氨腈水合酶(Cah),參見例如Greiner等(1991)ProcNatlAcadSciUSA88:4260-4264 ;和 Weeks 等(2000) CropSci40:1749-1754。氨腈水合酶將氨腈轉(zhuǎn)化為脲,因而賦予氨腈抗性。氨腈的任何形式或衍生物都可用作選擇試劑,包括但不限于氰氨基 1丐(Perlka (SKff, Trotberg Germany)和氰胺(Dormex (SKW))。另見美國專利6,096,947和6,268,547。氨腈水合酶的多核苷酸和/或多肽的變異體將會(huì)保留氨腈水合酶活性。氨腈水合酶的生物活性變異體將會(huì)保留將氨腈轉(zhuǎn)化為脲的能力。這類活性的測定方法包括測定表達(dá)氨腈水合酶的植物對(duì)氨腈的抗性。額外的測定包括氨腈水合酶比色測定(參見例如 Weeks 等(2000) CropSci40:1749-1754 ;和美國專利 6,268,547)。
本發(fā)明也涉及分離的多核苷酸,其包含:(a)至少2個(gè)反向CentC串聯(lián)重復(fù)序列陣列,其中第I陣列包含至少10個(gè)拷貝的CentC,第2陣列包含至少10個(gè)拷貝的CentC ;和(b)至少一個(gè)拷貝的反轉(zhuǎn)錄轉(zhuǎn)座元件,其中反轉(zhuǎn)錄轉(zhuǎn)座元件位于第I陣列和第2陣列之間。合適的反轉(zhuǎn)錄轉(zhuǎn)座元件討論同上。
本發(fā)明范圍之內(nèi)還包括分離的多核苷酸,其包含:(a)至少一個(gè)CentC串聯(lián)重復(fù)序列陣列,該陣列包含至少10個(gè)拷貝的CentC ;和,(b)至少一個(gè)拷貝的選自CentA、CRMl和CRM2的反轉(zhuǎn)錄轉(zhuǎn)座元件。
再一方面,本發(fā)明涉及分離的多核苷酸,其包含:(a)至少一個(gè)CentC串聯(lián)重復(fù)序列陣列,該陣列包含至少10個(gè)拷貝的CentC ;和,(b)CentA、CRMl和CRM2各自至少一個(gè)拷貝。
分離的多核苷酸包含至少一個(gè)CentC串聯(lián)重復(fù)序列陣列。每個(gè)CentC重復(fù)序列陣列可包含至少 5、10、15、20、25、30、40、50、60、70、80、90、100、120、140、150、160、180、200、220、240、250、260、280或300個(gè)拷貝的CentC。此外,每個(gè)CentC串聯(lián)重復(fù)序列陣列中可間插另一序列元件,包括但不限于反轉(zhuǎn)錄轉(zhuǎn)座子(其插入到CentC拷貝之間或CentC元件內(nèi)或反轉(zhuǎn)錄轉(zhuǎn)座子內(nèi)),或陣列中的任何其它序列元件。反轉(zhuǎn)錄轉(zhuǎn)座子包括但不限于CentA、CRMl 和 CRM2。
多核苷酸包括任何核酸分子,并且包含天然存在的、合成的和/或修飾的核糖核苷酸、脫氧核糖核苷酸以及核糖核苷酸和脫氧核糖核苷酸的組合。多核苷酸包括所有序列形式,包括但不限于單鏈、雙鏈、線狀、環(huán)狀、分枝、發(fā)夾、莖-環(huán)結(jié)構(gòu)等。
本發(fā)明范圍之內(nèi)還包括重組構(gòu)建體,其包含本發(fā)明的任何分離的多核苷酸。
重組DNA構(gòu)建體包含多核苷酸,當(dāng)存在于植物基因組中時(shí),所述多核苷酸是對(duì)植物基因組的該染色體位置而言是異源的或外源的。在制備DNA構(gòu)建體中,可操作不同片段,以提供合適方向和/或合適讀框的序列。連接基或接頭可用于連接各片段??墒褂闷渌僮饕蕴峁┓奖愕南拗莆稽c(diǎn)、除去冗余DNA或除去限制位點(diǎn)。例如,可使用體外誘變、引物修復(fù)、限制、退火、重新取代、轉(zhuǎn)換、倒位或重組系統(tǒng)。目標(biāo)多核苷酸是指DNA構(gòu)建體中包含的用于任何目的的任何核酸分子,包括但不限于非翻譯區(qū)、調(diào)節(jié)區(qū)、轉(zhuǎn)錄起始區(qū)、翻譯起始區(qū)、內(nèi)含子、外顯子、編碼RNA的多核苷酸、選擇標(biāo)記、篩選標(biāo)記、表型標(biāo)記、編碼重組酶的多核苷酸、重組位點(diǎn)、靶位點(diǎn)、轉(zhuǎn)移盒、限制位點(diǎn)、識(shí)別位點(diǎn)、絕緣子、增強(qiáng)子、間隔/填充序列、復(fù)制起點(diǎn)、端粒序列、操縱基因等,都可在DNA構(gòu)建體中提供。構(gòu)建體可包含與合適序列有效連接的5’和3’調(diào)節(jié)序列。DNA構(gòu)建體可包含在植物中有功能的、以5’至3’方向轉(zhuǎn)錄的至少一個(gè)以下區(qū)域:轉(zhuǎn) 錄和翻譯的起始區(qū)、多核苷酸、和轉(zhuǎn)錄和翻譯的終止區(qū)?;蛘撸珼NA構(gòu)建體可缺乏至少一個(gè)5’和/或3’調(diào)節(jié)元件。例如,可設(shè)計(jì)DNA構(gòu)建體,使得一旦導(dǎo)入細(xì)胞且存在合適的重組酶時(shí),在靶位點(diǎn)的重組事件將5’和/或3’調(diào)節(jié)區(qū)與DNA構(gòu)建體的合適序列有效連接。
根據(jù)所用的多核苷酸元件、重組位點(diǎn)、轉(zhuǎn)移盒和/或靶位點(diǎn),可按多種方式使用調(diào)節(jié)元件。在某些實(shí)例中,間插序列可存在于有效連接元件之間而不破壞功能性連接。例如,啟動(dòng)子和目標(biāo)多核苷酸之間的有效連接允許啟動(dòng)子啟動(dòng)和介導(dǎo)目標(biāo)多核苷酸的轉(zhuǎn)錄。在某些實(shí)例中,翻譯起始位點(diǎn)與重組位點(diǎn)有效連接。在某些實(shí)例中,重組位點(diǎn)位于內(nèi)含子中。
盒可另外含有至少一個(gè)要導(dǎo)入植物的額外序列。或者,可分別提供額外序列??山oDNA構(gòu)建體提供多個(gè)限制位點(diǎn)或重組位點(diǎn),用于操作不同組分和元件。DNA構(gòu)建體可另外含有選擇標(biāo)記基因。
轉(zhuǎn)錄起始區(qū)對(duì)植物宿主或目標(biāo)多核苷酸而言可以是天然的、類似的、外源或異源的,并且可以是天然序列、修飾序列或合成序列。大量啟動(dòng)子可用于表達(dá)編碼序列。
有關(guān)用于植物的各種啟動(dòng)子的綜述可參見Potenza等(2004) InVitro Cell DevBiol Plant40:l-22。在某些實(shí)例中,表達(dá)選擇標(biāo)記的啟動(dòng)子在種子中具有活性。在種子中具有活性的啟動(dòng)子包括組成型啟動(dòng)子,例如,Rsyn7啟動(dòng)子的核心啟動(dòng)子和以下文獻(xiàn)中公開的其它組成型啟動(dòng)子:W099/43838和美國專利6,072, 050 ;核心CaMV35S啟動(dòng)子(Odell等(1985)Nature313:810-812) ;MVV(紫茉莉花葉病毒)啟動(dòng)子(Dey 和 Maiti (1999)PlantMol Biol40:771-782);水稻肌動(dòng)蛋白(McElroy 等(1990)Plant Cell2:163-171);泛蛋白(Christensen等(1989)Plant Mol Biol.12:619-632和 Christensen 等(1992)Plant MolBiol18:675-689) ;pEMU(Last 等(1991)Theor Appl Genet81:581-588) ;MAS(Velten 等(1984)EMBO J3:2723-2730) ;ALS啟動(dòng)子(美國專利5,659,026)等。其它組成型啟動(dòng)子包括以下文獻(xiàn)中公開的那些:例如美國專利5,608,149,5,608, 144,5,604, 121,5, 569,597、5,466,785,5, 399,680,5, 268,463,5, 608,142 和 6,177,611。
啟動(dòng)子可以是組織優(yōu)選的啟動(dòng)子,以便在特定植物組織中增強(qiáng)表達(dá)。在某些實(shí)例中,種子優(yōu)選的啟動(dòng)子用于表達(dá)選擇標(biāo)記。種子優(yōu)選的啟動(dòng)子包括種子特異性啟動(dòng)子(其在種子發(fā)育中具有活性)以及種子萌發(fā)啟動(dòng)子(其在種子萌發(fā)中具有活性)。參見Thompson等(1989)BioEssayslO: 108。種子優(yōu)選的啟動(dòng)子包括但不限于Ciml (細(xì)胞分裂素誘導(dǎo)的信息);cZ19Bl (玉米19kDa玉米醇溶蛋白);milps (肌醇-1-磷酸合酶)(參見W000/11177和美國專利6,225,529)、豆類P -菜豆蛋白、油菜籽蛋白、P _伴大豆球蛋白、大豆凝集素、十字花科蛋白(cruciferin)、玉米15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、糯質(zhì)蛋白(waxy)、超甜蛋白I (shrunkenl)、超甜蛋白2 (shrunken2)、球蛋白Uendl和end2啟動(dòng)子(W000/12733)等。
化學(xué)物質(zhì)調(diào)節(jié)的啟動(dòng)子可通過利用外源化學(xué)調(diào)節(jié)劑來調(diào)節(jié)種子中的表達(dá)。啟動(dòng)子可以是化學(xué)物質(zhì)誘導(dǎo)型啟動(dòng)子(其中利用化學(xué)物質(zhì)誘導(dǎo)基因表達(dá))或化學(xué)物質(zhì)阻遏型啟動(dòng)子(其中利用化學(xué)物質(zhì)阻遏基因表達(dá))?;瘜W(xué)物質(zhì)誘導(dǎo)型啟動(dòng)子包括但不限于玉米In2-2啟動(dòng)子(由苯磺酰胺除草劑類安全劑(safener)活化);玉米GST啟動(dòng)子(由疏水親電化合物(例如某些芽前除草劑)活化);和煙草PR-1a啟動(dòng)子(由水楊酸活化)。其它化學(xué)物質(zhì)調(diào)節(jié)的目標(biāo)啟動(dòng)子包括留體響應(yīng)型啟動(dòng)子(參見例如糖皮質(zhì)激素誘導(dǎo)型啟動(dòng)子,參見 Schena 等(1991) Proc Natl Acad Sci USA88:10421-10425 和 McNellis 等(1998)PlantJ14:247-257)以及四環(huán)素誘導(dǎo)型和四環(huán)素阻遏型啟動(dòng)子(參見例如Gatz等(1991)Mol Gen Genet227:229-237 和美國專利 5,814,618 和 5,789,156)。
DNA構(gòu)建體可包含表達(dá)單元。表達(dá)單元可具有包括但不限于以下的元件:內(nèi)含子、增強(qiáng)子、前導(dǎo)序列、絕緣子、 間隔序列、RNA編碼區(qū)、標(biāo)記基因、重組位點(diǎn)、終止區(qū)、重組酶的編碼序列、增強(qiáng)子、接頭、識(shí)別位點(diǎn)等。另外,DNA構(gòu)建體可包含轉(zhuǎn)移盒、祀位點(diǎn)或其任何部分或組合??梢愿鞣N方式修飾DNA構(gòu)建體,包括但不限于位點(diǎn)特異性重組/整合方法或基于轉(zhuǎn)座子的轉(zhuǎn)座,以使DNA構(gòu)建體中具有各種變化。可以修飾多核苷酸序列,用于在植物中表達(dá)。參見例如Campbell和Gowri (1990)PlantPhysiol92:1_11。合成植物優(yōu)選基因的方法包括例如美國專利 5,380,831,5, 436,391 和 Murray 等(1989)NucleicAcidsResl7:477-498。
已知額外的序列修飾在細(xì)胞宿主內(nèi)能增強(qiáng)基因表達(dá)。這些修飾包括消除編碼假聚腺苷酸化信號(hào)的序列、外顯子-內(nèi)含子剪接位點(diǎn)信號(hào)、轉(zhuǎn)座子樣重復(fù)序列和對(duì)基因表達(dá)有害的其它已充分表征的序列。序列的G-C含量可調(diào)節(jié)到給定宿主的平均水平,該水平是通過參考該宿主中表達(dá)的內(nèi)源基因而求出的。也可修飾序列以避免二級(jí)mRNA結(jié)構(gòu)。DNA盒中可另外含有5’前導(dǎo)序列,其可起到增強(qiáng)翻譯的作用。翻譯前導(dǎo)序列包括例如 pimaizeavirus 前導(dǎo)序列例如 EMCV 前導(dǎo)序列(Elroy-Stein 等(1989) Proc Natl AcadSci USA86:6126-6130);馬鈴薯Y病毒(Potyvirus)前導(dǎo)序列例如TEV前導(dǎo)序列(Gallie等(1995) Genel65:233-238)、MDMV 前導(dǎo)序列(Kong 等(1988) Arch Virol 143:1791-1799)和人免疫球蛋白重鏈結(jié)合蛋白(BiP) (Macejak等(1991)Nature353:9094);苜?;ㄈ~病毒外殼蛋白 mRNA 的非翻譯前導(dǎo)序列(AMV RNA4) (Jobling 等(1987)Nature325:622-625);煙草花葉病毒前導(dǎo)序列(TMV) (Gallie 等(1989)載于 Molecular BiologyofRNA, ed.Cech (Liss, New York),第237-256頁);和玉米褪綠斑駁病毒前導(dǎo)序列(MCMV) (Lommel等(1991)Virology81:382-385)。另見 Della-Cioppa 等(1987)Plant Physiol84:965_968。已知能增強(qiáng)翻譯的其它方法或序列也可采用,例如內(nèi)含子等。
目標(biāo) 序列包括例如鋅指、激酶、熱激蛋白、轉(zhuǎn)錄因子、DNA修復(fù)、農(nóng)藝學(xué)性狀、抗蟲性、抗病性、除草劑抗性、不育性、油、蛋白質(zhì)、淀粉、可消化性、果仁大小、成熟度、營養(yǎng)組成、含量或代謝等。抗蟲基因可編碼對(duì)害蟲的抗性,例如根蟲(線蟲)、地老虎、歐洲玉米螟等。這樣的基因包括例如蘇云金芽孢桿菌(B.thuringiensis)毒蛋白基因(美國專利 5,366,892 ;5,747,450 ;5,736,514 ;5,723,756 ;5,593,881 ;Geiser 等(1986)Gene48:109)等??共⌒誀畎ń舛净?例如針對(duì)伏馬毒素(fumonosin)的基因(美國專利 5, 792, 931);減毒(avr)和抗病(R)基因(Jones 等(1994) Science266:789 ;Martin 等(1993)Science262:1432 ;Mindrinos 等(1994)Cell78:1089)等。除草劑抗性性狀包括編碼除草劑抗性的基因,包括磺酰脲型除草劑(例如ALS的S4和/或Hra突變)、抑制谷氨酰胺合酶作用的除草劑,例如草丁膦或草銨膦(basta)(例如bar基因)、EPSPS (美國專利6,867,293 ;5,188,642 ;和5,627,061)、GOX(Zhou等(1995)Plant Cell R印 15:159-163)和GAT(美國專利6,395,485)。也可使用抗生素抗性基因,例如編碼抗生素卡那霉素和慶大霉素抗性的nptll基因。也可使用不育基因,例如作為去雄的替代方法,包括雄性組織優(yōu)選的基因和具有雄性不育表型的基因例如QM(例如美國專利5,583,210)、激酶和編碼對(duì)雌雄配子體發(fā)育具有毒性的化合物的基因。
需要降低特定基因的活性、沉默和/或抑制。用于基因沉默的許多技術(shù)是已知的,包括但不限于反義技術(shù)(參見例如Sheehy等(1988) ProcNatl Acad SciUSA85:8805-8809 ;和美國專利 5,107,065 ;5,453,566 ;和 5,759,829);共抑制(例如 Taylor (1997)PlantCell9:1245 ;Jorgensen(1990)Trends Biotech8:340-344 ;Flavell(1994)Proc Natl Acad Sci USA91:3490-3496 ;Finnegan 等(1994)Bio/Technologyl2:883-888 ;和 Neuhuber 等(1994)Mol Gen Genet244:230-241);RNA 干擾(Napoli 等(1990)Plant Cell2:279-289 ;美國專利 5,034,323;Sharp(1999)GenesDevl3:139-141 ;Zamore 等(2000) Cel1101:25-33 Javier(2003)Nature425:257-263 ;和Montgomery 等(1998) ProcNatl Acad Sci USA95:15502-15507)、病毒誘導(dǎo)的基因沉默(Burton 等(2000)Plant Celll2:691_705 ;和Baulcombe (1999) Curr OpPlant Bio2:109-113);靶向 RNA 特異性核酶(Haseloff 等(1988)Nature334:585-591);發(fā)夾結(jié)構(gòu)(Smith 等(2000)Nature407:319-320 ;W099/53050 ;W002/00904 ;和 W098/53083);核酶(Steinecke 等(1992)EMBO Jll:1525 ;美國專利 4,987, 071 ;和 Perriman 等(1993) Antisense Res Dev3:253);寡核苷酸介導(dǎo)的定向修飾(例如W003/076574 ;和W099/25853) ;Zn 指靶向分子(例如 W001/52620 ;TO03/048345 ;和 W000/42219);和其它方法或上述方法的組合。
終止區(qū)可以是天然的,轉(zhuǎn)錄起始區(qū)可天然帶有有效連接的目標(biāo)DNA序列,或可來自另一來源。方便的終止區(qū)可得自根癌土壤桿菌(Agrobacterium tumefaciens)T1-質(zhì)粒,例如章魚堿合酶和胭脂堿合酶的終止區(qū)。另見Guerineau等(1991)Mol Gen Genet262:141-144 ;Proudfoot(1991)Cell64:671-674 ;Sanfacon 等(1991)Genes Dev5:141-149 ;Mogen 等(1990)Plant Cell2:1261-1272 ;Munroe 等(1990)Gene91:151-158 ;Ballas 等(1989)Nucleic Acids Resl7:7891-7903 ;和 Joshi 等(1987)Nucleic Acids Resl5:9627-9639。
再一方面,本發(fā)明涉及包含具有功能性著絲粒的人工植物微染色體的轉(zhuǎn)基因玉米植物的制備方法,所述方法包括:
(a)使至少一個(gè)玉米植物細(xì)胞與包含本發(fā)明重組構(gòu)建體的混合物接觸;
(b)鑒定來自步驟(a)并包含具有功能性著絲粒的人工植物微染色體的至少一個(gè)玉米植物細(xì)胞;和
(C)使來自步驟(b)的玉米植物細(xì)胞再生出能育的玉米植物,其中所述玉米植物包含具有功能性著絲粒的人工植物微染色體。
混合物還可包含編碼用于刺激細(xì)胞生長的多肽的多核苷酸。刺激細(xì)胞生長的多肽的實(shí)例包括但不限于wuschel、babyboom、RepA或Lecl。
將序列導(dǎo)入植物的任何方法都可使用,只要多核苷酸或多肽能夠進(jìn)入至少一個(gè)細(xì)胞內(nèi)部。將序列導(dǎo)入植物的方法是已知的,包括但不限于穩(wěn)定轉(zhuǎn)化、瞬時(shí)轉(zhuǎn)化、病毒介導(dǎo)的方法和有性育種。穩(wěn)定結(jié)合是指導(dǎo)入的多核苷酸整合到基因組中并由后代遺傳下去。瞬時(shí)轉(zhuǎn)化是指導(dǎo)入的序列沒有整合到基因組中,使得從宿主遺傳給后代。所用的植物和種子可具有穩(wěn)定結(jié)合在其基因組上的DNA構(gòu)建體。任何方案都可使用,以導(dǎo)入DNA構(gòu)建體、任何組分的位點(diǎn)特異性重組系統(tǒng)、多肽或任何其它目標(biāo)多核苷酸。提供包含將任何多肽和/或多核苷酸與任何其它所述組分結(jié)合在一起的任何方法。任何方法都可采用,以將靶位點(diǎn)、轉(zhuǎn)移盒和合適的重組酶結(jié)合在一起,所述方法包括例如穩(wěn)定轉(zhuǎn)化、瞬時(shí)遞送和有性雜交(參見例如W099/25884)。在某些實(shí)例中,可提供多肽或mRNA形式的重組酶??刹捎靡幌盗蟹桨福詫⒉煌M分結(jié) 合在一起。例如,可通過各種方法將這些組分中的至少一種提供給細(xì)胞,所述方法包括瞬時(shí)和穩(wěn)定的轉(zhuǎn)化方法;將重組酶DNA、mRNA或蛋白質(zhì)直接共同引入細(xì)胞;使用可表達(dá)重組酶的生物(例如株或品系);或讓攜帶靶位點(diǎn)的細(xì)胞或生物生長/培養(yǎng),與表達(dá)活性重組酶蛋白的生物雜交,然后在后代選擇事件。當(dāng)轉(zhuǎn)移盒主要在靶位點(diǎn)整合時(shí),得到簡單的整合模式。能夠在生物體內(nèi)調(diào)節(jié)表達(dá)的任何啟動(dòng)子,包括組成型、誘導(dǎo)型、發(fā)育型、時(shí)間和/或空間調(diào)節(jié)型啟動(dòng)子等,都可使用。
轉(zhuǎn)化方案以及將多肽或多核苷酸序列引入植物的方案因轉(zhuǎn)化所靶向的植物或植物細(xì)胞種類不同而異。將多肽或多核苷酸引入植物細(xì)胞的合適方法包括顯微注射(Crossway 等(1986)Biotechniques4:320-334,美國專利 6, 300, 543 ;和美國申請(qǐng)11/427,947和11/427,371,所有這些文獻(xiàn)都通過引用結(jié)合到本文中)、電穿孔(Riggs 等(1986) ProcNatl Acad Sci USA83:5602-5606)、土壤桿菌介導(dǎo)的轉(zhuǎn)化(美國專利 5,563,055 ;和 5,981,840)、直接基因轉(zhuǎn)移(Paszkowski 等(1984) EMBOJ3:2717-2722)和生物射彈粒子加速(ballistic particle acceleration)(美國專利 4,945,050 ;5,879,918 ;5,886,244 ;和 5,932,782 ;Tomes 等(1995)載于 PlantCell, Tissue, and Organ Culture:Fundamental Methods, Gamborg 和 Phillips 主編(Springer-Verlag, Berlin) ;McCabe 等(1988)Biotechnology6:923-926);和 Lecl 轉(zhuǎn)化(W000/28058)。另見 Weissinger 等(1988)Ann Rev Genet22:421-477 ;Sanford 等(1987)ParticulateScience and Technology5:27-37 (洋蔥);Christou 等(1988)Plant Physio187:671-674 (大豆);Finer 和 McMullen (1991)In Vitro Cell DevBiol27P:175-182(大豆);Singh 等(1998)Theor Appl Genet96:319-324(大豆);Datta 等(1990) Biotechnology8:736-740 (水稻);Klein 等(1988) ProcNatl Acad SciUSA85:4305-4309(玉米);Klein 等(1988) Biotechnology6:559-563 (玉米);美國專利 5,240,855 ;5,322,783 ;和 5,324,646 ;Klein 等(1988)Plant Physiol91:440-444(玉米);Fromm 等(I99O) Biotechnology8:833_839 (玉米);Hooykaas_Van Slogteren 等(1984) Nature311:763-764 ;美國專利 5,736,369 (谷物類);Bytebier 等(1987) ProcNatl Acad Sci USA84:5345-5349 (百合科(Liliaceae)) ;De Wet 等(1985)載于 TheExperimental Manipulation of Ovule Tissues, Chapman 等主編(Longman, NewYork),第 197-209 頁(花粉);Kaeppler 等(1990)Plant Cell Rep9:415-418 ;和 Kaeppler 等(1992) Theor Appl Genet84:560-566 (頸須(whisker)介導(dǎo)的轉(zhuǎn)化);D’Halluin 等(1992)Plant Cell4:1495-1505(電穿孔);Li 等(1993)Plant Cell R印 12:250-255 ;Christou 和Ford (1995) Ann Bot75:407-413 (水稻);0sjoda 等(1996) NatBiotechnol 14:745-750 (玉米,通過根癌土壤桿菌);和載于 Advances inCellular and Molecular Biology ofPlants,第 5 卷,第 8 章,第 189-253 頁,Vasil 主編,Kluwer Acad Publ (Dordrecht, TheNetherlands)1999。
不同化合物可與任何直接遞送方法一起用于將任何多核苷酸、多肽或其組合(任選包含其它組分)導(dǎo)入植物細(xì)胞中。例如,在陽離子型脂質(zhì)溶液、脂質(zhì)體溶液、陽離子型聚合物、DNA結(jié)合蛋白、陽離子蛋白、陽離子肽、陽離子聚氨基酸或其組合的存在下,可通過使DNA構(gòu)建體與微彈結(jié)合而制備用于基因槍(particle gun)方法的微彈。在某些實(shí)例中,在以下物質(zhì)存在下,通過使DNA構(gòu)建體與微彈相結(jié)合,制備用于基因槍方法的微彈:Tfx-10、Tfx-20、Tfx-50、脂轉(zhuǎn)染試劑 (Lipofectin)、脂轉(zhuǎn)染胺試劑(Lipofectamine)、細(xì)胞轉(zhuǎn)染試劑(Cellfectin)、Effectene、細(xì)胞轉(zhuǎn)染試劑 GSV(CytofectinGSV)、PerfectLipids、D0TAP、DMRIE_C、FuGENE_6、Superfect、Polyfect、聚乙烯亞胺、脫乙酰殼多糖、魚精蛋白C1、DNA結(jié)合蛋白、組蛋白Hl、組蛋白CENH3、聚-L-賴氨酸、DMSA等。
可通過用病毒或病毒核酸與植物接觸,將多核苷酸導(dǎo)入植物中。通常,這樣的方法包括將所需多核苷酸結(jié)合在病毒DNA或RNA分子中。序列開始可合成在病毒多蛋白中,然后在體內(nèi)或體外加工產(chǎn)生所需蛋白質(zhì)。有用的啟動(dòng)子包括病毒RNA聚合酶轉(zhuǎn)錄所用的啟動(dòng)子。將多核苷酸(包括病毒DNA或RNA分子)引入植物并表達(dá)所編碼的蛋白質(zhì)的方法是已知的,參見例如美國專利 5,889,191 ;5, 889, 190 ;5,866,785 ;5,589,367 ;5,316,931 ;和Porta 等(1996)MolBiotech5:209-221。
使用各種瞬時(shí)方法,可將不同組分(包括來自位點(diǎn)特異性重組系統(tǒng)的那些)提供給植物。這樣的瞬時(shí)轉(zhuǎn)化方法包括但不限于向植物中直接弓I入重組酶或其活性片段或其變異體、引入重組酶mRNA或使用非整合方法、或引入低水平的DNA。這樣的方法包括例如顯微注射、粒子轟擊、病毒載體系統(tǒng)和/或多核苷酸沉淀,其中轉(zhuǎn)錄是自結(jié)合粒子的DNA發(fā)生的,而基本不自粒子中釋放或不整合到基因組中,這樣的方法通常使用包被聚乙烯亞胺(polyethylimine)的粒子(參見例如 Crossway 等(1986)MolGenGenet202:179-185 ;Nomura等(1986) PlantSci44:53-58 ;Ifepler 等(1994) ProcNatlAcadSciUSA91:2176-2180 ;和 Hush 等(1994)JCellScil07:775-784)。
采用標(biāo)準(zhǔn)方案和介質(zhì),可將轉(zhuǎn)化細(xì)胞再生為植物,參見例如McCormick等(1986)PlantCellRep5:81_84。然后可培養(yǎng)這些植物并自花授粉、回交和/或遠(yuǎn)交,鑒定具有所需性狀的所得后代。培養(yǎng)兩代或更多代,以保證性質(zhì)能穩(wěn)定維持并遺傳,然后收獲種子。按照該方法,提供具有所述DNA構(gòu)建體穩(wěn)定地結(jié)合在基因組的轉(zhuǎn)化/轉(zhuǎn)基因種子。具有穩(wěn)定結(jié)合的DNA構(gòu)建體的植物和/或種子可進(jìn)一步表征其表達(dá)、位點(diǎn)特異性整合潛力、農(nóng)業(yè)經(jīng)濟(jì)學(xué)和拷貝數(shù)(參見例如美國專利6,187,994)。
可使用目標(biāo)重組位點(diǎn)、重組酶、選擇標(biāo)記和核苷酸序列的片段和變異體,除非另有說明,否則是指所述變異體或片段保留了至少某些原始組成的活性/功能。就多核苷酸編碼蛋白質(zhì)而言,多核苷酸片段可編碼保留全長蛋白生物活性的蛋白片段。多核苷酸片段的范圍為至少約20個(gè)核苷酸、約50個(gè)核苷酸、約100個(gè)核苷酸和至多全長多核苷酸。編碼蛋白質(zhì)生物活性部分的多核苷酸片段通常編碼至少15、25、30、50、100、150、200、250、300、325、350、375、400、420或450個(gè)連續(xù)氨基酸,或該范圍內(nèi)的任何整數(shù),至多并包括全長蛋白質(zhì)所含的氨基酸總數(shù)??赏ㄟ^分離編碼目標(biāo)多肽部分的一個(gè)多核苷酸部分而制備多肽的生物活性片段,然后表達(dá)蛋白質(zhì)片段并評(píng)價(jià)其活性。
或者,可通過選擇性化學(xué)裂解或蛋白酶裂解全長多肽而制備多肽的生物活性片段,再測定其活性。例如,編碼重組酶多肽片段的多核苷酸可包括這樣的核苷酸序列:其包含至少 16、20、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、800、900、1,000、1,100、1,200、1,300或I, 400個(gè)核苷酸,或該范圍內(nèi)的任何整數(shù),至多并包括全長多核苷酸的核苷酸總數(shù)。另外,在合適的重組酶存在下,在經(jīng)歷重組事件后,重組位點(diǎn)片段保留重組位點(diǎn)的生物活性。重組位點(diǎn)片段的范圍為至少約5、10、15、20、25、30、35、40個(gè)核苷酸,至多達(dá)全長重組位點(diǎn)。例如全長FRT、lox、attB和attP位點(diǎn)是已知的,其范圍為約50個(gè)核苷酸至約250個(gè)核苷酸,而完全活性的最小值是已知的,范圍為約20、25、30、35、40、45和50個(gè)核苷酸。
重組位點(diǎn)和重組酶生物活性的測定是已知的(參見例如Senecoll等(1988)J Mol Biol201:406-421 ;Voziyanov 等(2002)NucleicAcids Res30:7 ;美國專利6,187,994 ;TO01/00158 ;Albert 等(1995)Plant J7:649-659;Hartang 等(1998)J BiolChem273:22884-22891 ;Saxena 等(1997)Biochim Biophy Actal340:187-204 ;和 Hartley等(1980)Nature280-860-864)。重組酶活性測定通常測定酶對(duì)含重組位點(diǎn)的DNA底物的總體活性。例如,為了測定FLP的活性,可檢測含兩個(gè)反向FRT位點(diǎn)的環(huán)狀質(zhì)粒中的DNA序列倒位,因?yàn)橄拗泼肝稽c(diǎn)的位置發(fā)生改變(參見例如Vetter等(1983)Proc Natl Acad SciUSA80:7284)?;蛘撸梢詼y定從線狀分子切除的DNA或由酶誘導(dǎo)的分子間重組頻率(參見例如 Babineau 等(1985) J Biol Chem260:12313 ;Meyer_Leon 等(1987) Nucleic AcidsResl5:6469 ;和 Gronostajski 等(1985) J Biol Chem260:12328)。也可測定重組酶活性,即通過切除致重組FRT位點(diǎn)側(cè)接的序列,以激活可測定的標(biāo)記基因。實(shí)施例
以下實(shí)施例進(jìn)一步界定了本發(fā)明,其中份和百分比以重量計(jì),溫度以攝氏度計(jì),除非另有說明。應(yīng)當(dāng)理解,當(dāng)這些實(shí)施例表示本發(fā)明的優(yōu)選實(shí)施方案時(shí),它們僅用于說明性目的。根據(jù)以上討論和這些實(shí)施例,本領(lǐng)域技術(shù)人員可以確定本發(fā)明的基本特征,而且在不偏離其精神和范圍下,可對(duì)本發(fā)明作出不同的改動(dòng)和修飾,以適用于不同用途和條件。因此,根據(jù)上述描述,對(duì)本發(fā)明進(jìn)行除本文所示和所述之外的各種修飾,將會(huì)是本領(lǐng)域技術(shù)人員顯而易見的。這樣的修飾也落入所附權(quán)利要求書的范圍之內(nèi)。
縮略語的含義如下:“sec”表示秒,“min”表示分鐘,“h”表示小時(shí),“d”表示天,“ Ul ”表示微升,“mL”表示毫升,“L”表示升,“ u M”表示微摩爾濃度,“mM”表示毫摩爾濃度,“M”表示摩爾濃度,“mmol”表示毫摩爾,“ ii mole”表示微摩爾,“g”表示克,“ u g”表示微克,“ng”表示納克,“U”表示單位,“bp”表示堿基對(duì),“kB”表示千堿基對(duì)。實(shí)施例1.玉米著絲粒的鑒定和分離
為了評(píng)價(jià)單個(gè)著絲粒的大小、組成和結(jié)構(gòu)組織,單獨(dú)和/或在合劑中使用對(duì)CentC、CentA、CRMl和/或CRM2具有特異性的標(biāo)記探針,用于對(duì)玉米減數(shù)分裂粗線期、中期、后期I的染色體進(jìn)行熒光原位雜交(FISH)和對(duì)延伸DNA分子進(jìn)行熒光原位雜交(纖維-FISH)。這4個(gè)探針也用于篩選基因組玉米BAC文庫。
A.原位雜奪
玉米中期染色體的多色FISH表明,這4個(gè)著絲粒重復(fù)序列是著絲粒特異性的并共同定位于體細(xì)胞所有染色體的著絲粒區(qū)。FISH分析表明,反轉(zhuǎn)錄轉(zhuǎn)座子CRM1、CRM2和CentA占據(jù)在玉米著絲粒中大致相同的區(qū)域。在不同玉米染色體的著絲粒之間,重復(fù)序列的組成和重復(fù)序列區(qū)相對(duì)大小有顯著差異。
FISH結(jié)果表明,CentA探針具有最微弱的雜交信號(hào);CRM1探針表現(xiàn)出梯度樣雜交模式,在中期染色體最初縊痕周圍具有最強(qiáng)信號(hào),在著絲粒區(qū)外圍信號(hào)逐漸減弱;而0^2探針表現(xiàn)出最清楚而致密的雜交信號(hào)。CentC重復(fù)序列的FISH信號(hào)強(qiáng)度高度依賴于CentC拷貝數(shù),這在不同玉米染色體著絲粒之間是不同的。在某些著絲粒中,CentC緊密簇集,表現(xiàn)出與其它著絲粒重復(fù)序列的輕微重疊,在其它染色體中,CentC重復(fù)序列分布顯示出與所有其它重復(fù)序列更多的重疊。具有所有4個(gè)著絲粒重復(fù)序列的花粉母細(xì)胞減數(shù)分裂后期I染色體的FISH表明,這一時(shí)期的著絲粒區(qū)高度延伸,完整著絲粒區(qū)中僅有小區(qū)段實(shí)際上與動(dòng)粒連接。所有4個(gè)重復(fù)序列共同定位于微管連接區(qū)段,這表明天然功能性著絲粒區(qū)包含所有4個(gè)著絲粒重復(fù)序列。延伸DNA分子的纖維-FISH用于以更高分辨率進(jìn)一步表征著絲粒重復(fù)序列的分布和排列。
燕麥與玉米雜交產(chǎn)生的Fl胚保留一條或多條玉米染色體(參見例如 Riera-Lizarazu 等(1996) TheorApplGenet93:123-135 ;Ananiev 等(1997)ProcNatIAcadSciUSA94:3524-3529)。這些品系提供了研究一條玉米染色體、而沒有其它9條玉米染色體的復(fù)雜背景的方法。大量燕麥-玉米附加系可得自明尼蘇達(dá)大學(xué)(University of Minnesota, St.Paul, MN, USA)的 Ron Phillips,包括本文所用的Seneca60、A188和B73燕麥-玉米附加系。
燕麥-玉米染色體附加系的DNA用于分析一條玉米染色體的著絲粒區(qū)。燕麥-玉米染色體附加系的多色纖維-FISH顯示每 條染色體獨(dú)特的長達(dá)百萬堿基的著絲粒重復(fù)序列雜交延伸(圖11)。在染色體1、7和8中,所有4個(gè)重復(fù)序列分散在整個(gè)著絲粒區(qū)中。在其它染色體中,CentC呈現(xiàn)出比較短的延伸(約300kb),其側(cè)接其它3個(gè)著絲粒重復(fù)序列的“松散”陣列。經(jīng)FISH觀察,不同玉米染色體之間著絲粒區(qū)的總長度有很大差異。在該重復(fù)序列的豐度方面,CentC表現(xiàn)出一條染色體的著絲粒之間的顯著多態(tài)性,在任何給定基因型中觀察到的差異高達(dá)10倍。在中期和粗線期染色體中,染色體7具有最大的CentC串聯(lián)重復(fù)序列區(qū)組。同樣,具有玉米染色體7的燕麥-玉米附加系具有最長延伸的DNA纖維,其與CentC探針雜交。相反,在中期染色體中,玉米染色體4的著絲粒卻具有最小段的CentC重復(fù)序列區(qū)組,而最小的CentC在燕麥-玉米染色體4附加系、尤其是在玉米系B73染色體4中。當(dāng)通過纖維-FISH分析時(shí),著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子CentA、CRMl和CRM2顯示出斑點(diǎn)樣模式,在陽性雜交信號(hào)之間具有大的缺口。當(dāng)這3個(gè)反轉(zhuǎn)錄轉(zhuǎn)座子的探針混合在一起并用作一個(gè)混合探針時(shí),它們顯示出分散在CentC重復(fù)序列區(qū)組中的更連續(xù)的標(biāo)記DNA纖維。連續(xù)標(biāo)記著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子的側(cè)翼顯示出沿DNA分子的斑點(diǎn)樣模式,表明其它類型的DNA序列散布在著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子中,包括非著絲粒特異性元件。著絲粒反轉(zhuǎn)錄轉(zhuǎn)座子在具有小的CentC重復(fù)序列區(qū)組的染色體(例如染色體4)著絲粒中可形成至多IMb的松散陣列。玉米雜種 Zapalote chico 具有額外的(supernumary)B-染色體。Zapalote chico 的減數(shù)分裂染色體的FISH表明,玉米B-染色體功能性著絲粒含有所有4個(gè)著絲粒重復(fù)序列,與在所有A-染色體中觀察到的一樣。然而,在B-染色體長臂的若干非著絲粒位點(diǎn)中也發(fā)現(xiàn)了 CentC重復(fù)序列簇集。這些位點(diǎn)顯然不含其它著絲粒重復(fù)序列。
有絲分裂和減數(shù)分裂染色體的FISH和纖維FISH的結(jié)果表明,負(fù)責(zé)在玉米染色體上形成動(dòng)粒的功能性天然著絲粒區(qū)段通常包含CentC串聯(lián)重復(fù)序列陣列以及其它3個(gè)著絲粒重復(fù)序列:CRMUCRM2 和CentA (圖12)。
B.BAC f 庫
BAC載體允許克隆大片段的基因組DNA,其大小至多達(dá)約300kb,其在細(xì)菌宿主(典型的是大腸桿菌)中可維持。已經(jīng)從動(dòng)植物中產(chǎn)生了各種各樣的BAC文庫并成為公眾可得的,參見例如以下信息:Clemson University Genome Institute (CUGI ;參見以下網(wǎng)站:genome, clemson.edu)和Children’s Hospital Oakland Research Institiute(CH0RI ;參見以下網(wǎng)站:chor1.0rg)。使用多種酶,用分別代表Dent和Lancaster雜種群的兩種不同玉米基因型(B73和Mol7)進(jìn)行文庫構(gòu)建,篩選大于13X覆蓋面的玉米基因組BAC文庫中的玉米著絲粒序列。
1.玉米Mol7基因組BAC文庫
自 pBAC108L(Shizuya 等(1992)Proc Natl Acad Sci USA89:8794-8797)開發(fā)出pIndigoBac536 (Shizuya,未發(fā)表)和 pBeloBACll (Kim 等(1996) Genomics34:213-218) BAC克隆載體。PBAC108L是基于小F因子的質(zhì)粒。F因子編碼調(diào)節(jié)其自身在細(xì)胞中的復(fù)制和拷貝數(shù)的基因。載體PBeloBACll是通過引入LacZ基因而產(chǎn)生,以便通過藍(lán)色或無色(白色)表型而鑒定重組克隆。pBeloBACll具有3個(gè)獨(dú)特的克隆位點(diǎn):BamH1、SphI和HindIII,這些位點(diǎn)側(cè)接17和SP6啟動(dòng)子。稀有切點(diǎn)酶(rare-cutter)限制位點(diǎn)Notl、EagI, XmaI,Sma1、BglI和SfiI可用于切除來自pBeloBACll的插入序列。在載體pIndigoBac536中,EcoRI位點(diǎn)在氯霉素(CMk)基因中被修飾,使得克隆位點(diǎn)中的EcoRI位點(diǎn)可用于文庫構(gòu)建。pBeloBACll載體和pIndigoBac536載體具有2個(gè)選擇標(biāo)記(LacZ和CMk)用于轉(zhuǎn)化體的選擇。
基本上按照Kim等((1996)Genomics34:213-218)所述,在與加州理工學(xué)院(California Institute of Technology)的 Shizuya 實(shí)驗(yàn)室的合同之下,自玉米 Mol7 公用近交系,在pBeloBACll或pIndigoBac536中構(gòu)建了有產(chǎn)權(quán)的玉米基因組BAC文庫。簡而言之,Mol7基因組DNA用HindIII或EcoRI限制酶部分消化。在瓊脂糖凝膠中對(duì)DNA片段進(jìn)行大小分級(jí)分離后,克隆在PBeloBACllHindIII位點(diǎn)或PIndigoBac536EcoRI位點(diǎn)中。平均插入序列 大小為約150kb。完整Mol7基因組BAC文庫由433個(gè)384孔板或總共166,272個(gè)BAC克隆組成。包括214板的文庫的一半含有具有HindIII插入序列的BAC克隆,而包括219板的文庫的另一半則含有具有EcoRI插入序列的BAC克隆。BAC克隆維持在大腸桿菌 DHlOB (BRL Life Technologies)中。
i1.玉米B73基因組BAC文庫
得到兩個(gè)公用玉米B73基因組BAC文庫。文庫ZMMBBb可得自Clemson UniversityGenome Institute (CUGI, University of Georgia, Athens, GA, USA) ZMMBBb BAC 文庫在CUGI產(chǎn)生,即通過將HindIII部分消化的玉米B73基因組DNA克隆到包含氯霉素(CMk)抗性基因的pIndigoBac536載體中。ZMMBBb BAC文庫包含總共247,680個(gè)BAC克隆,平均插入序列大小為約137kb,代表14X基因組的覆蓋度。第二個(gè)B73BAC文庫CH0R1-201 (ZMMBBc)是由 Children’sHospital Oakland Research Institiute (CHORI)的 Pieter de Jong 實(shí)驗(yàn)室的制備的,該文庫可得自CHORI的BACPAC Resource Center。為了構(gòu)建該文庫,從玉米B73核中分離出基因組DNA。用經(jīng)EcoRI和EcoRI甲基化酶的組合部分消化的DNA構(gòu)建了文庫的第一區(qū)段,用MboI部分消化的DNA構(gòu)建了第二區(qū)段。將經(jīng)大小選擇的DNA克隆到PTARBAC2.1載體(區(qū)段I,板1-288)的EcoRI位點(diǎn)之間,并克隆到pTARBACl.3載體(區(qū)段2,板289-576)的BamHI位點(diǎn)之間。用連接產(chǎn)物轉(zhuǎn)化大腸桿菌DHlOB電感受態(tài)細(xì)胞(BRLLife Technologies)。將每個(gè)載體中用于各文庫區(qū)段的BAC克隆排列到288個(gè)384孔微量滴定板中。區(qū)段I包含106,637個(gè)單個(gè)BAC克隆,平均插入序列大小為163kb,代表6.9X基因組覆蓋度。區(qū)段2包含105,579個(gè)單個(gè)BAC克隆,平均插入序列大小為1671*,代表7.0父基因組覆蓋度??俍MMBBc文庫包含212,216個(gè)單個(gè)BAC克隆,平均插入序列大小為165kb,代表13.9X基因組覆蓋度。
C.BAC f 庫篩詵
用4個(gè)針對(duì)著絲粒序列CentA、CentC、CRMl和CRM2的單獨(dú)探針篩選玉米B73和Mol7BAC文庫。探針經(jīng)設(shè)計(jì)成為40bp長的0VERG0寡核苷酸,并且對(duì)每個(gè)著絲粒元件而言都是獨(dú)特的。通過使用合適標(biāo)記,這些探針可用于菌落、和斑點(diǎn)雜交以及FISH和纖維-FISH。
1.重疊寡核苷酸探針
重疊寡核苷酸探針通常設(shè)計(jì)為具有8bp互補(bǔ)重疊區(qū)的兩個(gè)短寡核苷酸。短寡核苷酸通常范圍為23-28bp,其中24bp是最常用的。退火后,寡核苷酸形成二聚體,其中16bp單鏈DNA位于兩側(cè)。標(biāo)記部分雙鏈探針,即在標(biāo)記核苷酸存在下,通過用克列諾(Klenow)酶的聚合活性填補(bǔ)凹進(jìn)的3’端。最終重疊寡核苷酸探針包含標(biāo)記雙鏈40bp探針。表I列出引物和探針,用于產(chǎn)生、篩選和表征BAC克隆、DNA構(gòu)建體和玉米微染色體事件。
表I
權(quán)利要求
1.一種用于制備包含具有功能性著絲粒的人工植物微染色體的轉(zhuǎn)基因玉米植物的方法,所述方法包括: (a)使至少一個(gè)玉米植物細(xì)胞與下述混合物接觸,所述混合物包含具有相反方向CentC重復(fù)序列的、庫化的著絲粒特異性的BAC組或單個(gè)的BAC克??; (b)鑒定來自步驟(a)并包含具有功能性著絲粒的人工植物微染色體的至少一個(gè)玉米植物細(xì)胞;所述的著絲粒具有至少2個(gè)反向CentC串聯(lián)重復(fù)序列陣列;和 (c)使來自步驟(b)的玉米植物細(xì)胞再生出能育的玉米植物,其中所述玉米植物包含具有功能性著絲粒的人工植物微染色體。
2.權(quán)利要求1的方法,其中所述庫化的著絲粒特異性的BAC組包含CentA、CentC、CRMl和CRM2各一。
3.權(quán)利要求1或2的方法,其中,所述混合物還包含刺激細(xì)胞生長的多肽。
4.權(quán)利要求3的方法,其中所述多肽選自wuschel、babyboom、RepA或Lecl。
5.包含功能性著絲粒的人工植物微染色體,其中所述功能性著絲粒特異性結(jié)合著絲粒蛋白C(CENPC),并包含至少2個(gè)反向CentC串聯(lián)重復(fù)序列陣列和至少一個(gè)拷貝的反轉(zhuǎn)錄元件。
6.權(quán)利要求5的人工植物微染色體,其中所述的反轉(zhuǎn)錄轉(zhuǎn)座元件選自CentA、CRMl和CRM2。
7.包含權(quán)利 要求5的人工微染色體的玉米植株。
全文摘要
描述了包含能特異性結(jié)合著絲粒蛋白C(CENPC)的功能性著絲粒的人工植物微染色體以及所述微染色體的制備方法。
文檔編號(hào)C12N15/82GK103215304SQ20131008190
公開日2013年7月24日 申請(qǐng)日期2007年5月17日 優(yōu)先權(quán)日2006年5月17日
發(fā)明者E.阿納尼伊夫, M.A.錢伯林, W.J.戈頓坎姆, S.斯維塔舍, 吳成倉 申請(qǐng)人:先鋒高級(jí)育種國際公司