專利名稱:一對轉(zhuǎn)錄激活子樣效應因子核酸酶及其編碼基因與應用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及基因工程領(lǐng)域,尤其涉及一對轉(zhuǎn)錄激活子樣效應因子核酸酶及其編碼基因與應用。
背景技術(shù):
按照人類的意愿對基因組進行定向靶向修飾一直是許多科學家的夢想。在內(nèi)源的基因組上特異地刪除或加入我們需要的序列,一方面可以構(gòu)建出各種動物模型用于生物學基礎(chǔ)研究和疾病機理研究,另ー方面可以生產(chǎn)動物反應器用以廉價生產(chǎn)我們需要的又很難從其他途徑得到的生物組分。朊蛋白類疾病,也叫傳染性海綿狀腦病,是ー類致命的傳染性中樞神經(jīng)系統(tǒng)退行性疾病,主要包括發(fā)生在綿羊和山羊的羊搔癢病,發(fā)生在牛的牛海綿狀腦病(即瘋牛病),以及發(fā)生在人的克雅氏病(CJD)、G綜合癥、致死性家族失眠癥(FFI)等。動物基因組編碼的朊蛋白(prpC,一種錨定在神經(jīng)細胞、淋巴細胞和別的細胞外表面的膜糖蛋白)是ー種與傳染性海綿狀腦病的發(fā)生直接相關(guān)的分子。雖然已有實驗證明缺失PrpC的小鼠不僅能夠正常發(fā)育和繁殖后代并且具有抵抗傳染性海綿狀腦病的能力,然而缺失PrpC的大型動物,尤其是那些在自然條件下可以自發(fā)感染該類疾病的大型動物,目前的研究距離實用性差距仍然很遠。2001年英國的科學家使用綿羊胎兒成纖維細胞基因打靶再通過體細胞克隆獲得了四只Prnp+/-的羊羔,但其中三只都在出生后死亡,存活最久的也僅僅在世12天。2004年Kuroiwa等使用胎牛成纖維細胞敲除了牛編碼PrP的基因。2006年,Golding MC等利用RNAi干涉技術(shù)針對引起牛瘋牛病和羊搔癢病的PRNP基因序列設(shè)計有效的siRNA,獲得ー頭轉(zhuǎn)基因羊胎兒,對其檢測發(fā)現(xiàn)siRNA很好地抑制了體內(nèi)PRNP基因的表達。我國科學家也致カ于羊瘙癢癥的研究,成國祥等獲得了 5只成活的Prnp+/-山羊。此后,他們將Prnp+/-的成年山羊體細胞進行二次基因打靶,將獲得的Prnp-/-體細胞進行克隆,但僅僅獲得了孕73天的Prnp-/-山羊胎兒,未得到成活的轉(zhuǎn)基因羊。從中我們可以推測Prnp+/-山羊的繁育情況并不容樂觀,二次基因打靶加再次的體細胞克隆的難度遠遠大于Prnp+/-山羊的自然交配獲得純合體。目前為止,雖然國內(nèi)外的科學家們付出了艱苦的努力,但仍未獲得Prnp-/-的成年羊。此外,綿羊和山羊雖然都可能得羊瘙癢癥,但該病是主要發(fā)生于綿羊中的,而綿羊與山羊是同科而不同屬的動物,綿羊和山羊之間不能交配產(chǎn)羔,因此獲得PRNP基因敲除的綿羊是具有重要的科學和經(jīng)濟價值的。但人們一直沒有找到簡單高效的方法對基因組進行基因組靶向修飾。傳統(tǒng)的基因打靶技術(shù)依賴于細胞內(nèi)自然發(fā)生的同源染色體隨機交換,其打靶效率非常低,通常只有10_6-10_8,這種打靶方法只在小鼠中得到了廣泛了應用,而在其他模式動物及大型哺乳動物中都因效率太低而得不到廣泛應用。近年發(fā)展很快的序列特異的核酸酶可以用于精確的基因組靶向修飾。一般由序列特異的核酸酶由ー個DNA識別結(jié)構(gòu)域和ー個非特異性核酸內(nèi)切酶結(jié)構(gòu)域構(gòu)成。原理是首先由DNA識別域把核酸酶定位到需要編輯的基因組區(qū)域,然后非特異性核酸內(nèi)切酶切斷雙鏈DNA從而造成DNA雙鏈斷裂(double-strand break,DSB),引入的DSB激活的DNA自我修復可以引起基因的突變和促進該位點DNA同源重組。鋅指核酸酶(Zinc-finger nucleases,ZFN)是現(xiàn)在研究最清楚也是應用最廣的序列特異的核酸酶。其原理是兩個鋅指蛋白特異識別兩段相隔5-7bp的DNA序列,并把與之融合表達的非特異性DNA切割蛋白Fokl的兩個單聚體定位到了一起,DNA切割蛋白形成雙聚體時可以切斷該位置的雙鏈DNA,從而造成DSB0 ZFN的出現(xiàn)使基因組靶向修飾技術(shù)向前邁進了一大歩,然而,ZFN技術(shù)還存在靶向不確定性、效率低、拖把率高等問題,研究者很難自行設(shè)計出特異和高效的靶向基因組目的序列的鋅指核酸酶仍然是制約ZFN廣泛應用的瓶頸。而商業(yè)購買高效特異的鋅指核酸酶又價格昂貴(20萬人民幣/基因),一般研究者或商業(yè)公司根本無法承受這筆費用。2009年兩個研究組發(fā)現(xiàn)植物病原體Xanthomonas中的ー種可以調(diào)節(jié)植物基因表達的轉(zhuǎn)錄激活子樣效應因子(transcription activator-like effector, TALE)表現(xiàn)出DNA 結(jié)合特異性,而其識別密碼具有模塊化和簡單化的特點,為科學家們開發(fā)出更簡易的新型基因組祀向修飾技術(shù)帶來了新希望。TALE與Fokl融合后即形成轉(zhuǎn)錄激活子樣效應因子核酸酶(transcriptionactivator-like effector nucleases, TALEN)。TALEN 的打革巴原理與 ZFN 相同,只是識別特異DNA的蛋白不同。TALEs由數(shù)十個特異性識別DNA的串聯(lián)“蛋白模塊”和兩側(cè)的N-末端及C-末端序列組成。每個“蛋白模塊”包含34個氨基酸,第12和13位殘基是靶向識別的關(guān)鍵位點,被稱作重復可變的di-residues (RVDs)位點。然而不同于姆個鋅指蛋白識別特異性的三聯(lián)體堿基,TALEs上的每個RVDs僅能識別ー個堿基。Sangamo BioSciences公司和哈佛大學的兩個研究小組分別利用TALEs技術(shù)進行了基因組靶向修飾相關(guān)研究,兩篇研究論文發(fā)表在同一期的《自然生物技木》(NatureBiotecJinology)雜志上。Edward Rebar領(lǐng)導的研究小組將帶有不同C-末端TALE的截短片段連接到核酸酶FokI的催化結(jié)構(gòu)域上。當研究人員將構(gòu)建的TALENs靶向內(nèi)源性的人類NTF3和CCR5基因吋,證實TALENs能夠特異性地對這些基因片段進行剪切。哈佛大學研究小組開發(fā)了ー種基于分層連接的策略來構(gòu)建包含12個重復模塊的TALEs。他們在保留RVDs的基礎(chǔ)上減少了每個模塊的DNA序列,同時將剩余序列的重復性降到最低。進而通過12重PCR獲得了帶有特異性連接序列的単體,并將其克隆至包含TALE N-末端和C-末端序列的骨架載體中。為了構(gòu)建TALE轉(zhuǎn)錄因子,研究人員又將TALE融合到一個轉(zhuǎn)錄因子的激活域。在接下來的靶向性檢測中,研究人員證實其能特異地使四個檢測內(nèi)源基因中的兩個基因表達上調(diào)。今年7月MIT的Rudolf Jaenisch小組也驗證了 TALEN在人胚胎干細胞和人iPSC中的打靶效果。其通過在五個位點的TALENs與之前其在相同位置的ZFNs的打靶效果作對比,得出五組TALENs在打靶效率和精確度上都與從Sangamo BioSciences公司購買的ZFNs相似,進ー步驗證了 TALENs是非常好的基因組編輯工具。
發(fā)明內(nèi)容
本發(fā)明提供了一對短肽,利用這對短肽構(gòu)建獲得的一對轉(zhuǎn)錄激活子樣效應因子(TALE)能夠特異性地識別山羊或綿羊朊蛋白基因(PRNP)基因組上的ニ段相鄰核苷酸;利用這對轉(zhuǎn)錄激活子樣效應因子構(gòu)建獲得的一對轉(zhuǎn)錄激活子樣效應因子核酸酶(TALEN),能夠?qū)ι窖蚧蚓d羊朊蛋白基因進行準確、高效地打靶。一對短肽,所述ー對短肽分別具有如SEQ ID NO. I和SEQ ID NO. 2所示的氨基酸序列。
本發(fā)明提供了ー對多核苷酸,所述ー對多核苷酸分別編碼上述的ー對短肽。優(yōu)選地,所述ー對多核苷酸分別具有如SEQ ID NO. 3和SEQ ID NO. 4所示的堿基序列。其中,所述的多核苷酸由分別識別山羊或綿羊朊蛋白基因上核苷酸序列SEQ IDNO 16和SEQ ID NO 20中相應堿基的TALENs識別模塊依序連接而成,其中,識別堿基A的TALENs識別模塊為NI-A (如SEQ ID NO 22所示),識別堿基T的TALENs識別模塊為NG-T (如SEQ ID NO 23所示),識別堿基C的TALENs識別模塊為HD-C (如SEQ ID NO 24所示),識別堿基G的TALENs識別模塊為NK-G (如SEQ ID NO 25所示)。本發(fā)明還提供了ー對蛋白質(zhì),所述ー對蛋白質(zhì)由上述的ー對短肽兩端分別加上轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端組成;其中,所述的轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端為天然的或經(jīng)過人工改造的序列。這對蛋白質(zhì)可以分別特異性地識別山羊或綿羊朊蛋白基因(PRNP)上的ニ段核苷酸序列,所述ニ段核苷酸序列分別選自以下ニ個核苷酸序列(I)SEQ ID N0:16序列或SEQ ID NO : 16序列的一個或ニ個核苷酸經(jīng)過取代所衍生的核苷酸序列;(2) SEQ ID NO :20序列或SEQ ID NO :20序列的一個或ニ個核苷酸經(jīng)過取代所衍
生的核苷酸序列。優(yōu)選地,所述的這對蛋白質(zhì)分別具有如SEQ ID NO. 5和SEQ ID NO. 6所示的氨基酸序列。該蛋白質(zhì)為轉(zhuǎn)錄激活子樣效應因子,命名為PRNP-TALE-L613和PRNP-TALE-R629。本發(fā)明還提供了ー對多核苷酸,所述ー對多核苷酸分別編碼上述的ー對蛋白質(zhì)。優(yōu)選地,所述ー對多核苷酸分別具有如SEQ ID NO. 7和SEQ ID NO. 8所示的堿基序列。本發(fā)明還提供了ー對融合蛋白,所述ー對融合蛋白由上述的ー對蛋白質(zhì)分別與DNA切割蛋白融合而成。優(yōu)選地,所述的DNA切割蛋白為DNA內(nèi)切酶。優(yōu)選地,所述的ー對蛋白質(zhì)分別與DNA切割蛋白的ニ個亞基融合。更優(yōu)選地,所述的DNA切割蛋白為天然的或經(jīng)過人工改造的FoklDNA內(nèi)切酶。最優(yōu)選地,所述ー對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列。該融合蛋白為轉(zhuǎn)錄激活子樣效應因子核酸酶,命名為PRNP-TALEN-L613和PRNP-TALEN-R629。本發(fā)明還提供了ー對多核苷酸,所述ー對多核苷酸分別編碼上述的ー對融合蛋白質(zhì)。優(yōu)選地,所述ー對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID NO. 12所示的堿
基序列。本發(fā)明還提供了ー種包含上述一對多核苷酸中的任意一條多核苷酸的載體。
優(yōu)選地,可以先將能特異性識別SEQ ID NO. 16或SEQ ID NO. 20所示堿基序列的多核苷酸連接到中間載體pCMV-NLS-TALE backbone-Fokl (R) -intermediate上,再將該中間載體連接到最終載體 pEFla-NLS-TALE backbone-Fokl (R) -pA 或最終載體 pEFIa-NLS-TALEbackbone-Fokl (L)-IRES-PURO-pA上,構(gòu)建獲得包含編碼轉(zhuǎn)錄激活子樣效應因子核酸酶基因的質(zhì)粒載體,能表達轉(zhuǎn)錄激活子樣效應因子核酸酶。本發(fā)明 還提供了 ー種用上述載體轉(zhuǎn)化的宿主細胞。優(yōu)選地,所述宿主細胞為山羊或綿羊細胞;更優(yōu)選地,所述宿主細胞為山羊或綿羊IPS細胞。本發(fā)明還提供了ー種上述ー對融合蛋白或上述ー對多核苷酸在對山羊或綿羊朊蛋白基因靶向修飾中的應用。優(yōu)選地,所述ー對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列;所述ー對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID NO. 12所示的堿基序列。本發(fā)明還提供了ー種山羊或綿羊朊蛋白基因打靶的方法,包括將上述ー對融合蛋白或者上述一對多核苷酸或者含有這對多核苷酸的載體轉(zhuǎn)入山羊或綿羊IPS細胞,于30-37°C擴增培養(yǎng)3-7天,得到朊蛋白基因被靶向修飾的細胞。優(yōu)選地,所述ー對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列;所述ー對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID NO. 12所示的堿基序列。優(yōu)選地,所述山羊或綿羊IPS細胞中還轉(zhuǎn)入有抗puro蛋白或能表達抗puro蛋白的質(zhì)粒,便于篩選。優(yōu)選地,所述擴增培養(yǎng)過程中至少有I天在30°C下進行,能獲得更好的打靶效果。本發(fā)明針對山羊或綿羊PRNP基因的一個位點設(shè)計了一對轉(zhuǎn)錄激活子樣效應因子核酸酶(PRNP-TALEN-L613和PRNP-TALEN-R629),這對TALENs分別由可以識別PRNP基因上一段核苷酸的DNA識別結(jié)構(gòu)域與ー個Fokl DNA內(nèi)切酶的兩個異源亞基融合得到。將這對轉(zhuǎn)錄激活子樣效應因子核酸酶同時轉(zhuǎn)入宿主細胞時,其能對宿主細胞PRNP基因的位點打靶,并使打靶位點發(fā)生基因突變,包括堿基缺失、堿基插入等,從而實現(xiàn)對山羊或綿羊PRNP基因的靶向修飾,具有特異性強、打靶效率高、準確度高等優(yōu)點。
圖I為人工設(shè)計的轉(zhuǎn)錄激活子樣效應因子核酸酶識別的DNA序列及位點;圖2為18個識別模塊連接策略示意圖;其中,A =PCR為每個識別模塊添加酶切識別序列和連接接頭過程示意圖;B =PCR為每個識別模塊添加酶切識別序列和連接接頭后示意圖;C =PCR擴增6模塊片段與中間載體示意圖;D :最終構(gòu)建的TALEN質(zhì)粒示意圖;圖3 為中間載體 pCMV-NLS-TALE backbone-Fokl (R)-intermediate 不意圖;圖4 為最終載體 pEFla-NLS-TALE backbone-Fokl (R)-pA 不意圖;圖5 為最終載體 pEF la-NLS-TALE backbone-Fokl (L) -IRES-PURO-pA 示意圖;圖6為PRNP基因在打靶位點的基因型變化;其中,-表示堿基缺失。
具體實施例方式以下實施例中所使用的技術(shù),包括PCR擴增與檢測、細胞轉(zhuǎn)染等分子生物學技木,以及細胞培養(yǎng)、檢測技術(shù)等,除非特別說明,均為本領(lǐng)域內(nèi)的技術(shù)人員已知的常規(guī)技木;所使用的儀器設(shè)備、試劑和細胞系等,除非是本說明書特別注明,均為一般本領(lǐng)域的研究和技術(shù)人員可以通過公共途徑獲得的。實施例ITALENs靶序列的設(shè)計
I、從NCBI上下載山羊和綿羊PRNP基因組序列(綿羊Gene ID :493887,山羊PRNP 基因序列與綿羊的相同)2、設(shè)計引物并PCR擴增基因組上打靶位點片段,并測序,其中,PCR引物及測序引物見表I ;表I
權(quán)利要求
1.一對短肽,其特征在于,所述一對短肽分別具有如SEQ ID NO. I和SEQ ID NO. 2所示的氨基酸序列。
2.—對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權(quán)利要求I所述的一對短肽。
3.如權(quán)利要求2所述一對多核苷酸,其特征在于,所述一對多核苷酸分別具有如SEQID NO. 3和SEQ ID NO. 4所示的堿基序列。
4.一對蛋白質(zhì),其特征在于,所述一對蛋白質(zhì)由權(quán)利要求I所述的一對短肽兩端分別加上轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端組成;其中,所述的轉(zhuǎn)錄激活子樣效應因子氨基酸序列框架的N端和C端為天然的或經(jīng)過人工改造的序列。
5.如權(quán)利要求4所述一對蛋白質(zhì),其特征在于,所述一對蛋白質(zhì)分別具有如SEQID NO. 5和SEQ ID NO. 6所示的氨基酸序列。
6.—對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權(quán)利要求4或5所述的一對蛋白質(zhì)。
7.如權(quán)利要求6所述一對多核苷酸,其特征在于,所述一對多核苷酸分別具有如SEQID NO. 7和SEQ ID NO. 8所示的堿基序列。
8.一對融合蛋白,其特征在于,所述一對融合蛋白由權(quán)利要求4所述的一對蛋白質(zhì)分別與DNA切割蛋白融合而成。
9.如權(quán)利要求8所述一對融合蛋白,其特征在于,所述的一對蛋白質(zhì)分別與DNA切割蛋白的二個亞基融合。
10.如權(quán)利要求9所述一對融合蛋白,其特征在于,所述的DNA切割蛋白為天然的或經(jīng)過人工改造的Fokl DNA內(nèi)切酶。
11.如權(quán)利要求8-10任一權(quán)利要求所述一對融合蛋白,其特征在于,所述一對融合蛋白分別具有如SEQ ID NO. 9和SEQ ID NO. 10所示的氨基酸序列。
12.—對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權(quán)利要求8-10任一權(quán)利要求所述的一對融合蛋白。
13.—對多核苷酸,其特征在于,所述一對多核苷酸分別編碼如權(quán)利要求11所述的一對融合蛋白。
14.如權(quán)利要求13所述的一對多核苷酸,其特征在于,所述一對多核苷酸分別具有如SEQ ID NO. 11和SEQ ID NO. 12所示的堿基序列。
15.—種包含權(quán)利要求2_3、6_7、13或14任一權(quán)利要求所述一對多核苷酸中的任意一條多核苷酸的載體。
16.一種用權(quán)利要求15所述載體轉(zhuǎn)化的宿主細胞。
17.—種包含權(quán)利要求12所述一對多核苷酸中的任意一條多核苷酸的載體。
18.一種用權(quán)利要求17所述載體轉(zhuǎn)化的宿主細胞。
19.如權(quán)利要求16或18所述宿主細胞,其特征在于,所述宿主細胞為山羊或綿羊IPS細胞。
20.一種如權(quán)利要求11所述一對融合蛋白或如權(quán)利要求14所述一對多核苷酸在對山羊或綿羊朊蛋白基因靶向修飾中的應用。
21.—種山羊或綿羊朊蛋白基因打靶的方法,其特征在于,包括將權(quán)利要求11所述一對融合蛋白或者權(quán)利要求13或14所述一對多核苷酸或者含有權(quán)利要求13或14所述一對多核苷酸的載體轉(zhuǎn)入山羊或綿羊IPS細胞,于30-37°C擴增培養(yǎng)3-7天,得到朊蛋白基因被靶向修飾的細胞。
22.如權(quán)利要求21所述的方法,其特征在于,所述山羊或綿羊IPS細胞中還轉(zhuǎn)入有抗puro蛋白或能表達抗puro蛋白的質(zhì)粒。
23.如權(quán)利要求21或22所述的方法,其特征在于,所述擴增培養(yǎng)過程中至少有I天在30°C下進行。
全文摘要
本發(fā)明公開了一對轉(zhuǎn)錄激活子樣效應因子核酸酶及其編碼基因與應用。這對轉(zhuǎn)錄激活子樣效應因子核酸酶(TALEN)由一對DNA識別蛋白分別與Fok1 DNA內(nèi)切酶的兩個異源亞基融合得到,可以特異性地識別山羊或綿羊朊蛋白基因(PRNP)exon2上的兩個相鄰位點。將這對轉(zhuǎn)錄激活子樣效應因子核酸酶同時轉(zhuǎn)入宿主細胞時,其能對宿主細胞PRNP基因的exon2位點打靶,并使打靶位點發(fā)生基因突變,從而實現(xiàn)對山羊或綿羊PRNP基因的靶向修飾,具有特異性強、打靶效率高、準確度高等優(yōu)點。
文檔編號C12N15/63GK102627690SQ20121009675
公開日2012年8月8日 申請日期2012年4月5日 優(yōu)先權(quán)日2012年4月5日
發(fā)明者莊慶剛, 肖磊 申請人:浙江大學