具有靶向結合特異性的嵌合多肽的制作方法
【專利說明】具有靶向結合特異性的嵌合多肽 相關申請的交叉引用
[0001] 本申請根據(jù)35 U.S.C. §119(e)要求于2012年9月4日提交的美國序列號為 61/696,689的申請、于2013年1月17日提交的美國序列號為61/753,763的申請以及于 2013年5月1日提交的美國序列號為61/818, 364的申請的優(yōu)先權的利益,上述申請的全部 內(nèi)容通過引用并入本文。
技術領域
[0002] 本發(fā)明總體上涉及生物技術領域,并且更具體地涉及識別特異性DNA序列的嵌合 重組酶。
【背景技術】
[0003] 蛋白質以序列依賴性的方式識別DNA的能力對生命是至關重要的,因為各種蛋白 質結構域已經(jīng)發(fā)展到提供序列特異性DNA識別。由這些結構域中的少數(shù)幾個的DNA識別也 是各種各樣的生物技術應用的基礎。特別是,C 2H2型鋅指蛋白(ZFPs)是第一批被設計以識 別用戶定義的DNA序列的DNA結合蛋白質之一并且已被不同程度的成功用于許多應用,該 應用包括轉錄調控、基因組工程和后天修飾。ZFPs的模塊化裝配促進了這些方法。然而,盡 管ZFP技術取得了進步且具有前景,但是對某些序列的特異性、高親和性ZFPs的構建仍然 困難并且在選擇的情況下,需要使用不易被非專業(yè)實驗室采用的耗時和勞動密集型的選擇 系統(tǒng)。
[0004] 轉錄激活子樣效應因子(TALE)結構域是代表ZFP技術的可能的替代方案的一類 天然存在的DNA結合結構域(DBD)。被發(fā)現(xiàn)于植物病原體黃單胞桿菌屬中的TALE包含一系 列的33至35個氨基酸重復序列,該重復序列發(fā)揮功能以選擇性地結合靶DNA序列。這些 重復序列除了兩個相鄰的重復可變二殘基(RVD)之外是相同的,該重復可變二殘基通過介 導結合到單個的核苷酸而賦予DNA特異性。已經(jīng)描述了結合到DNA位點的類似數(shù)目的堿基 對(bp)的超過30個重復序列的陣列。雖然每個RVD的結合中固有簡并性,但是最近的報 告表明,合成的TALE蛋白質具有足夠的特異性以靶向人類基因組內(nèi)的單個位點。
[0005] 通過嵌合核酸酶(例如,鋅指核酸酶(ZFN))引入DNA雙鏈斷裂(DSB)可以用來敲 除基因功能或者在外源添加的DNA的存在下驅動在目標位點的盒整合。在過去十年中,ZFN 已被廣泛研宄,并且在某些情況下,正在接近臨床應用進行基因治療。最近,一些團體已經(jīng) 探索了利用將TALE DNA結合結構域與核酸酶(TALEN)融合進行靶向基因組編輯。事實上, 許多使用ZFN的工作已使用TALE核酸酶來復制,因為較之ZFN,TALEN可具有關于DNA結合 模塊化的優(yōu)點。然而,盡管對ZFN和TALEN進行了令人印象深刻的研宄,還仍然存在關于其 安全性和特異性的問題。特別是,脫靶裂解事件仍難以檢測,脫靶DSB最有可能的結果是引 入小插入或小缺失。此外,DSB的修復依賴于隨細胞類型而變化的細胞機制。
[0006] 一個實現(xiàn)靶向基因組修飾的替代方法是使用位點特異性重組酶(SSR)。諸如酪氨 酸重組酶Cre和Flp之類的SSR是被常規(guī)用于操縱在細胞內(nèi)的染色體結構的有價值的分子 生物學工具。因為這些酶依賴于若干復雜的蛋白質-蛋白質和蛋白質-DNA相互作用以協(xié) 調催化,SSR表現(xiàn)出顯著的靶位點特異性。然而,迄今為止,已經(jīng)證明許多SSR的特異性的 改變非常困難。解離酶型/轉化酶型絲氨酸重組酶為酪氨酸重組酶進行基因組工程提供了 靈活多樣的可變性。在自然界中,這些酶具有以高度模塊化的方式協(xié)調重組的多域蛋白復 合物的功能。然而,幾種絲氨酸重組酶突變體已經(jīng)確定不需要用于重組的輔助因子。此外, 許多研宄已經(jīng)表明,絲氨酸重組酶的天然DBD能夠被定制設計的ZFP代替,以產(chǎn)生嵌合鋅指 重組酶(ZFR)。原則上,可以產(chǎn)生能夠識別擴展數(shù)目的序列的ZFR,但是,由于缺乏能夠識別 所有可能的DNA三聯(lián)體的鋅指結構域,導致限制這些酶的潛在的模塊化靶向能力。
[0007] ZFR是由來源于解離酶系/轉化酶系的絲氨酸重組酶的激活的催化結構域和能被 定制設計以識別幾乎任何DNA序列的鋅指DNA結合結構域組成(圖30A)。ZFR催化特定ZFR 靶位點之間的重組,該特定ZFR靶位點由側接由重組酶催化結構域識別的中央20bp核心序 列的雙倒位(two-inverted)的鋅指結合位點(ZFB)組成(圖30B)。與鋅指核酸酶(ZFN) 和TAL效應物核酸酶(TALEN)相比,ZFR自動發(fā)揮作用并能在不激活細胞DNA損傷應答途 徑的情況下切除并整合人類和小鼠細胞中的轉基因。然而,與常規(guī)的位點特異性重組酶一 樣,ZFR的應用已經(jīng)受到由重組酶催化結構域強加的序列要求的限制,其決定了 ZFR靶位點 包含來源于天然絲氨酸解離酶/轉化酶重組位點的20-bp核心。
[0008] 諸如Cre-loxP、FLP-FRT *AC31-att之類的位點特異性DNA重組系統(tǒng)已成為基因 工程的強大工具。促進這些DNA重排的位點特異性重組酶識別短的(30-bp至40-bp)序列 并且通過不需要DNA合成或高能輔助因子的機制協(xié)調DNA裂解、鏈交換以及重新連接。這 種簡單性使得研宄人員能夠以非凡的空間和時間的敏感性研宄基因功能。然而,由位點特 異性重組酶所強加的嚴格的序列要求已限制它們應用于包含人工引入重組位點的細胞和 生物體。為了解決此限制,定向進化已經(jīng)被用于朝向天然存在的DNA序列改變幾種重組酶 的序列特異性。盡管取得了進步,但是對于復雜的誘變和選擇策略的需要以及關于重新設 計的重組酶變體通常表現(xiàn)出寬松的底物特異性的發(fā)現(xiàn)已阻礙了這種技術的廣泛使用。
[0009] 因此,需要一種催化內(nèi)源性基因組的靶向和位點特異性重組、尤其是用于基因治 療的更一般化的方法以及用于可以催化這類靶向和位點特異性重組的酶。這種方法對于基 因療法特別有用,但也在分子生物學領域具有許多其它應用,該應用包括在基因克隆中的 應用以及在工業(yè)微生物和農(nóng)業(yè)植物和動物的修飾中的應用。
【發(fā)明內(nèi)容】
[0010] 本文公開了用于產(chǎn)生轉基因細胞、組織、植物和動物的靶向嵌合多肽,其包括它們 的組合物、表達載體、以及使用它們的方法。本發(fā)明的組合物、載體和方法在基因治療技術 中也是非常有用的。
[0011] -方面,本發(fā)明提供了嵌合多肽。該多肽包括:a)重組酶、核酸酶或轉錄因子、或 其片段;和b)轉錄激活子樣效應因子(TALE)蛋白。在各實施方式中,該TALE蛋白是截短 的,并且包括C-末端或N-末端截短。在實施方式中,TALE蛋白是AcrXa7、Tallc和PthXol。 在實施方式中,TALE蛋白包括如SEQ ID N0:2中所列的所有或一部分氨基酸序列。在一些 實施方式中,TALE蛋白是在SEQ ID N0:2的氨基酸殘基27和268、92和134、120和129、74 和147、或87和120之間被截短。在一些實施方式中,TALE蛋白是在SEQ ID N0:2的氨基 酸殘基 28、74、87、92、95、120、124、128、129、147 和 150 處被截短。
[0012] 另一方面,本發(fā)明提供產(chǎn)生特異性結合期望的核苷酸的轉錄激活子樣效應因子 (TALE)蛋白結合結構域的方法。該方法包括:a)通過使可變二殘基(RVD)內(nèi)的氨基酸殘基 突變,或者通過使該RVD的1至2個氨基酸殘基N-末端或C-末端內(nèi)的氨基酸殘基突變使 TALE蛋白結合結構域的氨基酸序列隨機化;以及b)選擇(a)中的隨機化的TALE蛋白結合 結構域,其中TALE蛋白結合結構域特異性結合到期望的核苷酸。
[0013]另一方面,本發(fā)明提供分離的多肽,其包括黃單胞桿菌屬衍生的轉錄激活子樣效 應因子(TALE)蛋白,該TALE蛋白具有包括如SEQ ID N0:3(VGKQWSGARAL)中所列的氨基酸 序列的N-末端結構域(NTD),該氨基酸序列具有選自以下的一個或多個突變或缺失:Q是 Y、Q是S、Q是R、W是R、W是G、W缺失、S是R、S是H、S是A、S是N、以及S是T。
[0014]另一方面,本發(fā)明提供分離的多肽,其包含羅爾斯通菌屬衍生的轉錄激活子樣效 應因子(TALE)蛋白,該TALE蛋白具有包含如SEQIDNOAaVDIARiQI^SOTLA)中所列的氨 基酸序列的N-末端結構域(NTD),該氨基酸序列具有選自以下的一個或多個突變或缺失: 札是K、Q是Y、Q是S、Q是R、R2是W、R2是G、R2缺失、S是R、S是H、S是A、S是N、以及S 是T。
[0015] 在另一個實施方式中,本發(fā)明提供產(chǎn)生轉錄激活子樣效應因子(TALE)蛋白N-末 端結構域(NTD)的方法。該方法包括:a)通過使NTD內(nèi)的一個或多個氨基酸殘基突變或缺 失而使NTD的氨基酸序列隨機化,其中該氨基酸序列是SEQ ID N0:14(VGKXXXGAR)或SEQ ID NO: 15(VDIAXXXX⑶LA);以及b)選擇(a)中的隨機化的TALE蛋白NTD,其中TALE蛋白 NTD特異性結合到期望的核苷酸或表現(xiàn)出增強的活性。
[0016] 本文還公開了用于產(chǎn)生轉基因細胞、組織、植物和動物的嵌合蛋白,其包括絲氨酸 重組酶和一種或多種鋅指結合結構域、產(chǎn)生ZFR的方法、它們的組合物、表達載體、以及使 用它們的方法。本發(fā)明的組合物、載體和方法在基因治療技術中也是非常有用的。
[0017] -方面,本發(fā)明提供產(chǎn)生具有比對應的野生型重組酶高的催化特異性的多個鋅指 重組酶(ZFR)蛋白的方法。該方法包括在重組酶催化結構域的相當于Gin Ilel20、Thrl23、 Leul27、Ilel36和Glyl37或其組合的位置進行隨機誘變,使在每個氨基酸的位置2和位 置3處的DNA突變;使重組酶催化結構域與多個鋅指結合結構域融合以形成ZFR,并且富集 具有比對應的野生型重組酶高的催化特異性的ZFR。在一些實施方式中,ZFR對選自GC、 GT、CA、TT和AC的DNA靶具有增強的催化活性。在一個實施方式中,重組酶催化結構域在 Ilel36和/或Glyl37處發(fā)生誘變。
[0018] 在各方面中,本文所述的嵌合多肽包括來源于如本文所公開的以下物質或 者由如本文所公開的以下物質隨機誘變的重組酶催化結構域:a) Tn3,也稱為EcoTn3 ; Hin,也稱為 StyHin ;Gin,也稱為 MuGin ;Sin ;Beta ;Pin ;Min ;Din ;Cin ;EcoTn21 ; SfaTn917 ;BmeTn5083 ;Bme53;Cpe ;SauSKl ;SauSK41 ;SauTn552 ;Ran;Aac ;Lla ;pMER05 ; Mlo92 ;M1〇90 ;Rrh ;Pje ;Req ;PpsTn5501 ;Pae ;Xan ;ISXc5 ;Spy ;RhizY4cG ;SarpNLl ; SsolSC1904a ;SsolSC1904b ;SsoISC1913 ;Aam606 ;MjaM0014 ;Pab ;HpylS607 ;MtulS_Y349 ; MtuRv2792c ;MtuRv2979c ;MtuRv3828c ;MtuRv0921 ;MceRv0921 ;TnpX ;TndX ;WwK ;乳球菌 (lactococcal)噬菌體TP901-1絲氨酸重組酶;化膿性鏈球菌噬菌體<i>370. 1絲氨酸重組 酶;化膿性鏈球菌噬菌體巾FC1絲氨酸重組酶;李斯特菌屬噬菌體A118絲氨酸重組酶;天 藍色鏈霉菌染色體SC3C8. 24絲氨酸重組酶;天藍色鏈霉菌染色體SC2E1. 37絲氨酸重組酶; 天藍色鏈霉菌染色體S⑶78. 04c絲氨酸重組酶;天藍色鏈霉菌染色體SC8F4. 15c絲氨酸重 組酶;天藍色鏈霉菌染色體S⑶12A. 23絲氨酸重組酶;天藍色鏈霉菌染色體SCH10. 38c絲 氨酸重組酶;天藍色鏈霉菌染色體SCC88. 14絲氨酸重組酶;鏈霉菌噬菌體<i>C31絲氨酸重 組酶;鏈霉菌噬菌體R4絲氨酸重組酶;芽孢桿菌噬菌體巾105絲氨酸重組酶;芽孢桿菌噬 菌體SPBc2絲氨酸重組酶;芽孢桿菌前噬菌體SKIN絲氨酸重組酶;金黃色葡萄球菌ccrA絲 氨酸重組酶;金黃色葡萄球菌ccrB絲氨酸重組酶;結核分枝桿菌菌體Bxbl絲氨酸重組 酶;結核分枝桿菌前噬菌體巾RV1絲氨酸重組酶;YBCK_ECOLI ;Y4bA ;Bja ;Spn ;Cac 1956 ; 和Cac 1954;或b) a)的突變蛋白。
[0019] 在又一方面,本發(fā)明提供分離的核酸分子,其編碼本文所述的嵌合多肽。
[0020] 在又一方面,本發(fā)明提供表達盒,其包含編碼本文所述的嵌合多肽的核酸分子。
[0021] 在又一方面,本發(fā)明提供載體,其包含本文所述的表達盒。
[0022] 在又一方面,本發(fā)明提供分離的宿主細胞,其含有本文所述的載體。
[0023] 在又一方面,本發(fā)明提供用于位點特異性整合入DNA序列的方法。該方法包括使 DNA序列與本發(fā)明的嵌合多肽接觸,其中該嵌合多肽催化位點特異性整合。
[0024] 在又一方面,本發(fā)明提供用于基因治療的方法。該方法包含向受試者施用包括編 碼本文所述的嵌合多肽的核酸分子的組合物,其中該核酸分子一經(jīng)表達,存在于受試者的 基因組中的基因就被特異性地去除或失活。
[0025] 在又一方面,本發(fā)明提供藥物組合物。該組合物包含本文所述的嵌合多肽;以及藥 學上可接