用于核酸酶介導的基因組工程改造的遞送方法和組合物的制作方法
【專利摘要】本公開內容涉及基因組工程領域,特別是細胞的基因組的靶向修飾。
【專利說明】
用于核酸酶介導的基因組工程改造的遞送方法和組合物
[0001] 相關申請的交叉引用
[0002] 本申請主張2013年10月17日申請的美國臨時申請No.61/892,348和2014年8月5日 申請的美國臨時申請No. 62/033,424的權益,所述申請的公開內容以其全文引用的方式并 入本文。
技術領域
[0003 ]本公開內容涉及基因組工程領域,特別是細胞的基因組的靶向修飾。
[0004] 發(fā)明背景
[0005] 已描述用于基因組DNA的靶向切割的各種方法和組合物??墒褂眠@些靶向切割事 件,例如,引起靶向突變,引起細胞DNA序列的靶向缺失,及促使在預定染色體基因座靶向重 組。參見,例如,美國專利No .8,586,526;8,329,986 ;8,399,218 ;6,534,261 ;6,599,692 ;6, 503,717;6,689,558;7,067,317;7,262,054;7,888,121;7,972,854;7,914,796;7,951, 925 ;8,110,379;8,409,861;美國專利公開 20030232410;20050208489;20050026157; 20050064474;20060063231;20080159996;201000218264;20120017290;20110265198; 20130137104; 20130122591; 20130177983 和 20130177960 及美國申請 No .14/278,903,所述 專利申請的公開內容針對所有目的以其全文引用的方式并入本文。
[0006] 這些方法通常涉及使用工程改造的切割系統(tǒng)以引起雙鏈斷裂(DSB)或靶DNA序列 缺口,因此,通過產生錯誤的過程諸如非同源末端連接(NHEJ)修復斷裂或使用修復模板(同 源導向的修復或HDR)修復可導致基因敲除或受關注的序列插入(靶向整合)??赏ㄟ^使用特 定核酸酶諸如工程改造的鋅指核酸酶(ZFN)、轉錄激活因子樣效應物核酸酶(TALEN),使用 以工程改造的crRNA/tracr RNA('單導向RNA')導引特定切割的CRISPR/Cas系統(tǒng)和/或使用 基于Argonaute系統(tǒng)的核酸酶(例如,從高度好熱菌得到,稱為'TtAgo',(Swarts等人(2014) Nature 507(7491) :258-261),進行切割。
[0007] 使用一種上述核酸酶系統(tǒng)的靶向切割可采用HDR或NHEJ介導的過程中任何一種過 程用于將核酸插入到特定靶位置。然而,將核酸酶系統(tǒng)和供體同時遞送到細胞可能是問題 所在。例如,通過轉導質體進入到細胞中來遞送供體或核酸酶可能對受體細胞,尤其對為初 級細胞且不如來自細胞系的細胞強健的細胞有毒。
[0008] CD34+干細胞或祖細胞是特征為其自我更新和/或分化為淋巴細胞(例如T細胞、B 細胞、NK細胞)和髓系(例如單核細胞、紅血球、嗜酸性粒細胞、嗜堿性粒細胞和嗜中性粒細 胞)能力的異質性細胞組。其異質性源自CD34+干細胞群體中存在多個常反映特定群的多能 性(不論定向的譜系)的子群的事實。例如,為CD38-的CD34+細胞是較為原始的未成熟的 CD34+祖細胞(也稱為長期造血祖細胞),而那些為⑶34+CD38+的細胞(短期造血祖細胞)是 定向的譜系(參見Stella等人(1995)Hematologica 80:367-387)。當這一群體接著進一步 以分化途徑發(fā)展時,CD34標記物失去。CD34+干細胞在臨床細胞療法中具有巨大的潛力。然 而,部分地歸因於其異質性,可能難以在細胞上進行基因操作,諸如基因敲除、轉基因插入 等。具體來說,這些細胞通過常規(guī)的遞送載體轉導是不充分的,最原始的干細胞對修飾敏 感,在引起的DNA DSB后,HDR受到限制,及在延長時間的標準培養(yǎng)條件中HSC維持不足。另 外,其它受關注的細胞(僅舉非限制性實例來說,心肌細胞、中型棘突神經(jīng)元、初級肝細胞、 胚胎干細胞、誘導型多能干細胞和肌細胞)轉導以進行基因組編輯可能不如其它細胞成功。
[0009] 因此,仍需要用于對CD34+細胞和其它受關注的毒性較小但更有效的細胞基因組 工程改造的組合物和方法。 發(fā)明概要
[0010] 本發(fā)明描述適用于基因療法和基因組工程改造中的組合物和方法。具體來說,所 述的方法和組合物涉及將核酸引入到細胞諸如初級細胞包括造血干細胞/祖細胞(HSC/PC) 和T細胞中。此外,本發(fā)明的方法和組合物適用于遞送包含受關注的供體DNA的AAV顆粒到這 些細胞。
[0011] 在一些方面,本發(fā)明包括出于基因組工程改造的目的而遞送至少一種核酸酶到細 胞(例如,HSC/PC)。在一些實施方案中,核酸酶呈肽遞送,而在其它實施方案中,核酸酶呈編 碼核酸酶的核酸遞送。在一些實施方案中,使用不只一種核酸酶。在一些優(yōu)選的實施方案 中,編碼核酸酶的核酸為mRNA,及在一些情況中,mRNA經(jīng)過保護。核酸酶可包括鋅指核酸酶 (ZFN)、TALE核酸酶(TALEN)或CRISPR/Cas或TtAgo核酸酶系統(tǒng)或其組合。在一個優(yōu)選的實施 方案中,通過電穿孔遞送編碼核酸酶的核酸。
[0012] -方面,本文提供一種將一個或多個轉基因整合到分離的細胞的基因組中的方 法,所述方法包括按順序將轉基因和至少一種核酸酶引入到細胞中以使核酸酶介導轉基因 的靶向整合。因此,在某些方面,提供一種將一個或多個轉基因整合到分離的細胞的基因組 中的方法,所述方法包括:將(a)包含一個或多個轉基因的供體載體和(b)至少一種核酸酶 引入到細胞中,其中所述至少一種核酸酶切割細胞的基因組以使所述一個或多個轉基因整 合到細胞的基因組中,及進一步地,其中(i)如果供體載體先于所述至少一種核酸酶之前被 弓丨入到細胞中,則在引入供體載體后的48小時內引入所述至少一種核酸酶到細胞中;及 (ii)如果所述至少一種核酸酶先于供體載體被引入,則在引入所述至少一種核酸酶后的4 小時內引入所述供體載體到細胞中。在某些實施方案中,所述方法可以包括(a)將包含一個 或多個轉基因的供體載體引入到細胞中;(b)培養(yǎng)所述細胞48小時以下(例如,幾秒到48小 時或其間的任何時間);及(c)將至少一種核酸酶引入到所述細胞中,其中所述至少一種核 酸酶切割所述細胞的基因組以使所述一個或多個轉基因被整合到所述細胞的所述基因組 中?;蛘?,所述方法可以包括:(a)將至少一種核酸酶引入到細胞中;(b)培養(yǎng)所述細胞24小 時以下(例如,幾秒到24小時或其間的任何時間);及(c)將包含一個或多個轉基因的供體載 體引入到所述細胞中,其中所述至少一種核酸酶切割所述細胞的基因組以使所述一個或多 個轉基因被整合到所述細胞的所述基因組中??梢灾貜退龇椒ú襟E以將額外的轉基因整 合到相同和/或不同的基因座中。在某些實施方案中,將所述細胞培養(yǎng)(步驟(b))24小時以 下(例如,幾秒到24小時或其間的任何時間)。在其它的實施方案中,例如,當核酸酶在引入 供體載體之前被引入時,將所述細胞培養(yǎng)4小時以下。
[0013] 可以使用任何細胞,例如,造血干細胞(例如,CD34+細胞)或T細胞(例如,CD4+或 CD8+細胞)。供體載體可以呈病毒或非病毒載體例如AAV載體(例如,AAV6或AAV6嵌合載體 (諸如AAV2/6)等)引入。核酸酶(例如,ZFN、TALEN、TtAgo和/或CRISPR/Cas)還可以使用病毒 或非病毒載體例如呈mRNA形式引入。在某些實施方案中,核酸酶靶向安全港基因(例如, CCR5基因、AAVS1基因、Rosa基因、白蛋白基因等)。轉基因可以編碼罹患疾?。ɡ?,溶酶體 儲積病、血紅蛋白病、血友病等)的受試者中所缺少或缺乏的蛋白質,例如,治療性蛋白質。 在某些實施方案中,描述一種對有此需要的受試者提供一種或多種蛋白質的方法,所述方 法包括:根據(jù)任何本文所述的方法將一個或多個編碼一種或多種蛋白質的轉基因引入到分 離的細胞中及將所述細胞引入到所述受試者中以使得所述一種或多種蛋白質提供給所述 受試者。
[0014] 在其它方面,本發(fā)明包括遞送供體核酸到靶細胞。供體可以在編碼核酸酶的核酸 之前、之后或與其同時進行遞送。在某些實施方案中,供體與核酸酶同時地遞送。在其它實 施方案中,供體是先于核酸酶,包括先于核酸酶任何時間,例如,緊接核酸酶前、先于核酸酶 1至60分鐘(或其間的任何時間)、先于核酸酶1至24小時(或其間的任何時間)、1至48小時 (或其間的任何時間)或先于核酸酶48小時以上進行遞送。在某些實施方案中,供體是在核 酸酶之后(優(yōu)選地,在4小時內)進行遞送。供體核酸包含將被整合到細胞的基因組(例如內 源基因座)中的外源序列(轉基因)。轉基因優(yōu)選地在核酸酶切割位點或接近核酸酶切割位 點(例如,在1至50個堿基對以內)進行整合。在一些實施方案中,供體包含側懸與靶向切割 位點同源的區(qū)域的全長基因或其片段。在一些實施方案中,供體缺少同源區(qū)且通過無關同 源的機制(即NHEJ)整合到靶基因座中。在其它實施方案中,供體包含一更小段的側懸用于 細胞(即,用于基因修正)的同源區(qū)的核酸。在一些實施方案中,供體包含編碼功能性或結構 性組分諸如shRNA、RNAi、miRNA或類似組分的基因。在其它實施方案中,供體包含編碼結合 到受關注的基因和/或調節(jié)受關注的基因的表達的調節(jié)元件的基因。
[0015] 在其它方面,由病毒和/或非病毒基因轉移方法遞送供體。在優(yōu)選的實施方案中, 供體通過腺相關病毒(AAV)遞送到細胞??梢允褂萌魏蜛AV載體,包括但不限于AAV1、AAV2、 AAV3、AAV4、AAV5、AAV6、AAV7、AAV8和其組合。在一些情況中,AAV包含與衣殼血清型(例如, 具有AAV5、AAV6或AAV8衣殼的AAV2ITR)比較而言的異源血清型的LTR。供體可以使用與遞送 核酸酶(包括位于相同載體上的)所用相同的基因遞送系統(tǒng)遞送或可以使用一不同的用于 核酸酶的遞送系統(tǒng)遞送。在某些實施方案中,供體是使用病毒載體(例如,AAV)來遞送及核 酸酶是呈mRNA形式進行遞送。
[0016] 供體分子的受關注的序列可以包含一個或多個編碼功能性多肽(例如,cDNA)的含 有或不含啟動子的序列。在某些實施方案中,核酸序列包含編碼抗體、抗原、酶、生長因子、 受體(細胞表面或細胞核)、激素、淋巴細胞活素、細胞介素、受體、任何上述的功能性片段和 上述的組合的序列。在功能性多肽編碼序列是無啟動子的實施方案中,經(jīng)過整合的序列的 表達則通過受關注的區(qū)域中的內源啟動子或其它對照元件驅動轉錄得以確保。在其它實施 方案中,"串接"盒如此地整合到所選位點中,所述盒的第一組分包含如上所述的無啟動子 序列,接著是轉錄終止序列,然后是編碼自主表達盒的第二序列。額外的序列(編碼或非編 碼序列)可以包含在位于同源臂(包括但不限于編碼2A肽的序列、SA位點、IRES等)之間的供 體分子中。
[0017] 另一方面,本文描述供體核酸通過同源性獨立機制整合到細胞的基因組中的方 法。所述方法包括在細胞的基因組中產生雙鏈斷裂(DSB)及使用核酸酶切割供體分子,使得 供體核酸在DSB的位點得以整合。在某些實施方案中,供體核酸通過非同源性依賴方法(例 如,NHEJ)進行整合。如上所述,在活體內切割后,供體序列可以用有針對性的方法在DSB的 位置整合到細胞的基因組中。供體序列可以包含用于產生DSB的核酸酶中一種或多種核酸 酶的相同靶位點中的一或多者。因此,供體序列可以由用于切割需要整合的內源基因的相 同核酸酶中一種或多種核酸酶切割。在某些實施方案中,供體序列包含與用于引起DSB的核 酸酶不同的核酸酶靶位點??梢酝ㄟ^任何機制產生靶細胞基因組中的DSB。在某些實施方案 中,通過一種或多種鋅指核酸酶(ZFN)、包含經(jīng)過工程改造以使序列結合于受關注的區(qū)域中 的鋅指結合域的融合蛋白和切割域或切割半域產生DSB。在其它實施方案中,通過一個或多 個融合到核酸酶域(TALEN)的TALE DNA結合域(天然生成或非天然存在的)產生DSB。在其它 實施方案中,使用經(jīng)過工程改造的單導引RNA或其功能性等效物視需要用于導引核酸酶到 基因組中的靶位點的CRISPR/Cas或TtAgo核酸酶系統(tǒng)產生DSB。
[0018] 在其它方面,核酸酶與哺乳動物細胞中的安全港的基因(例如CCR5基因、PPP1R12C (也稱為AAVS1)基因、Rosa基因或白蛋白基因)結合和/或將其切割。此外,為有助于哺乳動 物系統(tǒng)中的選擇,可以使用HPRT基因座。
[0019] -方面,供體為與受關注的基因結合和/或調節(jié)受關注的基因的表達的受關注的 調節(jié)蛋白(例如ZFP TF、TALE TF或CRISPR/Cas TF)。在一個實施方案中,調節(jié)蛋白與DNA序 列結合并防止其它調節(jié)因子的結合。在另一實施方案中,調節(jié)蛋白的結合可以調節(jié)(即,引 起或抑制)靶DNA的表達。
[0020] 在其它方面,本文提供一種已如本文所述例如使用核酸酶以引入基因修飾進行基 因修飾(例如,轉基因)的細胞。在某些實施方案中,由本文所述的方法制得所述細胞。在某 些實施方案中,所述細胞包含整合到安全港基因座(諸如(:〇?5^4¥51)1^、1? 0^26和/或 HPRT)中的轉基因。所述的包含所整合轉基因的細胞可以從內源啟動子表達轉基因,或者, 所述轉基因可以包括調節(jié)元件和控制元件,諸如驅動轉基因的表達(例如,當被整合到安全 港基因座中時)的外源啟動子。在某些實施方案中,所述的包含轉基因的細胞不含任何被整 合到基因組中的病毒載體序列。所述細胞可以是任何真核細胞,例如CD34+干細胞(例如,患 者中通過粒細胞集落刺激因子(GCSF)或其它移動劑投與從骨髓移動進入周邊血液中或直 接從骨髓或臍帶血收集得的源自患者的干細胞)??梢允斋@所述細胞,純化,培養(yǎng),且通過任 一適合的方法將核酸酶和/或供體引入到所述細胞中。
[0021 ]還提供包含如本文所述的經(jīng)過基因修飾的細胞的組合物諸如藥物組合物。在一些 實施方案中,所述組合物包含⑶34+HSC/PC或HSC/PC細胞群體。在其它實施方案中,所述組 合物包含T細胞(例如CD4+和/或CD8+T細胞)。在其它實施方案中,所述T細胞組合物僅包含 ⑶4+或僅包含⑶8+細胞。
[0022]另一方面,提供使用如本文所述的經(jīng)過基因修飾的細胞的方法。在某些實施方案 中,經(jīng)過基因修飾的血液細胞前體("HSC/PC")以骨髓移植提供且所述HSC/PC在活體內分化 并成熟。在一些實施方案中,在G-CSF引起的移動后分離得所述HSC/PC,及在其它實施方案 中,從人骨髓或臍帶分離得所述細胞。在一些方面,通過用經(jīng)過設計以敲除特異性基因或調 節(jié)序列的核酸酶處理來編輯所述HSC/PC。在其它方面,用經(jīng)過工程改造的核酸酶和供體核 酸修飾所述HSC/PC使得野生型基因或其它受關注的基因得以插入并表達和/或內源異常基 因得以校正。在一些實施方案中,在溫和的清髓預處理后向患者投與經(jīng)過修飾的HSC/PC。在 其它方面,完全清髓后投與所述HSC/PC以便隨后的移植,造血細胞100%源自經(jīng)過修飾的 HSC/PC。而且,可以在細胞周期的G2階段中將所述細胞阻滯。
[0023]在一些實施方案中,轉基因 HSC/PC細胞和/或動物包括編碼人基因的轉基因。在一 些情況中,轉基因動物包含內源基因座處對應于外源轉基因的敲除基因,由此允許發(fā)展人 蛋白質可以在分離中研究的活體內系統(tǒng)。這些轉基因模型可以出于篩選目的而用于識別小 分子或大生物分子或其它可修飾受關注的人蛋白質或與其相互作用的實體。在一些方面, 將轉基因整合到由本文所述的任何方法得到的干細胞(例如,胚胎干細胞、誘導型多潛能干 細胞、造血干細胞或祖細胞等)或動物胚胎中的所選基因座(例如,安全港)中,且接著植入 胚胎,因此,活的動物出生。然后將所述動物養(yǎng)到性成熟并讓其產出后代,其中后代中的至 少一些包含經(jīng)過編輯的內源性基因序列或所整合的轉基因。
[0024] 還提供一種包括本發(fā)明的AAV和核酸的試劑盒。所述試劑盒可以包括編碼核酸酶 的核酸(例如編碼包含在適宜的表達載體中的基因的RNA分子或ZFN、TALEN、T t Ago或 CRISPR/Cas系統(tǒng))、或核酸酶蛋白的等分部分、供體分子、適宜的干性改性劑、用于進行本發(fā) 明方法的使用說明等。所述試劑盒還可以包括受關注的供體分子,諸如選擇或篩選標記物。
[0025] 本領域技術人員總體上根據(jù)公開內容當可輕易了解這些與其它方面。
[0026] 附圖簡述
[0027]圖1的圖A和B描繪經(jīng)過ZFN-AAV修飾的⑶34+細胞中的GFP表達。圖1A描繪用指定的 含有CMV驅動的eGFP轉基因的AAV載體轉導的流通外周血液⑶34+細胞(mPB⑶34+)中的GFP 表達。圖1A中所顯示的數(shù)據(jù)源自于轉導后2天的細胞。接著在感染后2和5天(dpi)收集細胞 且使用流式細胞儀(Guava,Millip 〇re)進行分析。圖1B描繪各群體中為GFP陽性的細胞的百 分比。
[0028]圖2的圖A到C描繪⑶34+細胞中經(jīng)過ZFN介導的AAV供體的插入。圖2A描繪用于本研 究中的AAV6-R5-160-XhoI供體構建體的概視圖。用于這些研究中的AAV6為包含AAV2ITR和 AAV6衣殼(SrAAV2/6")的假型病毒。供體DNA構建在AAV2左ITR(L-ITR)與右ITR(R-ITR)之 間,其中Xhol位點引入在CCR5特異性ZFN結合位點之間。CCR5左臂和右臂表示源自CCR5基因 座的側懸CCR5ZFN結合位點的基因組序列的序列。第二Xho I位點(在圖2A中CCR5左同源臂的 左邊)在供體整合后由于其在同源臂外而將不被整合。圖2B和2C描繪用劑量在300-le5vg/ 細胞之間的AAV6-R5-160-XhoI供體轉導接著在轉導后24小時通過使用BTX ECM830 (Harvard Apparatus)電穿孔引入CCR5特異性ZFN mRNA(120ug/ml)的CD34+細胞。在5dpi 收 集細胞以進行基因組DNA(gDNA)純化且經(jīng)過處理以用于隨后的圖2B中所描繪的RFLP分析和 圖2C中所描繪的Illumina深度測序。野生型(未消化的DNA)和RFLP帶在圖2B中由箭頭表示, 所檢測到的RFLP的百分比也是。圖2C為描繪通過Illumina深度測序發(fā)現(xiàn)的基因組修飾或插 入缺失的百分比的圖。
[0029]圖3的圖A和B為描繪響應于核酸酶和供體投與的時序和次序的核酸酶修飾的圖。 引入AAV6-R5-160-XhoI供體直到使用BTX ECM830(Harvard Apparatus)電穿孔(EP)具有 CCR5特異性ZFN mRNA的CD34+細胞前48小時(-48小時)至后20小時(+20小時)(圖3A中,_ 48hr到-6hr,圖3B中,-20hr到+20hr)。稍后收集細胞以進行基因組DNA(gDNA)純化且經(jīng)過處 理以進行隨后的Illumina深度測序。圖3A和3B為展示通過Illumina深度測序:插入或缺失 ("插入缺失")、或在指定的時間點由供體分子提供的RFLP的靶向整合(TI)檢測到的基因組 修飾的量的兩個圖。
[0030] 圖4的圖A到D展示由ZFN和AAV供體修飾的CD34+的結果。圖4A描繪用于本研究中的 R5-pgk-GFP-pA供體構建體的概視圖。供體DNA構建在AAV2L-ITR與R-ITR之間,其中經(jīng)過PGK 啟動子驅動的eGFP表達盒(1.6kb)插入在CCR5ZFN結合位點之間。CCR5左臂和右臂表示源自 CCR5基因座的側懸CCR5ZFN結合位點的基因組序列的序列。圖4B描繪用劑量在300-3e3vg/ 細胞之間的AAV6-R5-pgk-GFP-pA供體轉導的⑶34+細胞的流動式細胞測量術分析結果。24 小時后通過使用BTX ECM830(Harvard Apparatus)電穿孔引入CCR5特異性ZFN mRNA (120ug/ml)到經(jīng)過轉導的細胞中。收集細胞以在15dpi進行流動式細胞測量術分析。圖左下 象限中的數(shù)值指示存在于活細胞群體(PI-)中的eGFP+細胞的百分率。圖4C描繪一種展示使 用半定量"進-出(Ιη-Out)"PCR分析檢測GFP盒靶向整合到CCR5基因座中的凝膠。通過連續(xù) 稀釋已知頻率的具有未修飾的野生型基因組DNA的CCR5基因座(由南方墨點法判定)處GFP 轉基因整合的基因組DNA池來制備一組標準對照。使用等量的基因組DNA和存在于polyA區(qū) (存在于eGFP盒中)中的引物及位于CCR5同源臂區(qū)外的引物在ZFN靶位點的3'側進行PCR。圖 4D描繪一種展示使用用一個額外的引物對使得這一對中的兩個引物在靶位點的5'側而這 兩個引物中的一個引物位于CCR5同源區(qū)外的第二組PCR反應的結果的凝膠。這一第二對包 括在與圖2C相同的PCR反應中,因此,存在兩個引物對。所述第二引物對用作測量基因組DNA 輸入的量度。GFP-ΤΙ特異性PCR產物和非TI特異性PCR產物(總體)由箭頭表示。
[0031] 圖5的圖A和B描繪⑶34+細胞的ZFN-AAV修飾。圖5A描繪用于本研究中的AAVS1-HindIII供體的概視圖。供體DNA插入介于AAV2L-ITR與R-ITR之間,其中HindIII位點引入介 于A A V S1特異性ZFN對的結合位點之間。A A V S1左臂和右臂指示源自A A V S1基因座的側懸 AAVS1ZFN結合位點的基因組序列的同源臂序列。圖5B描繪用1000或3000vg/ml的AAV6-AAVSl-Hindlll供體轉導的CD34+細胞的圖。24小時后通過使用BTX ECM830(Harvard Apparatus)電穿孔將AAVS1ZFN mRNA(40ug/ml)引入到經(jīng)過轉導的細胞中。在5dpi收集細胞 以進行基因組DNA(gDNA)純化且經(jīng)過處理以進行隨后的Illumina深度測序。本圖描繪如通 過插入缺失形式或靶向整合測得的基因組修飾的量。
[0032]圖6為描繪CD34 +細胞以指定的TALEN對進行CCR5修飾的圖。本圖描繪通過 Illumina深度測序:插入或缺失("插入缺失")、或靶向整合(TI)供體分子所提供的RFLP檢 測到的基因組修飾的量。
[0033]圖7的圖A和B為描繪使用指定的核酸酶進行AAV6供體所提供的RFLP (Hindll I位 點)進入到AAVS1基因座中的CRISPR/Cas9介導的靶向整合的圖。通過AAVS1ZFN對(30054: 30035)和CRISPR/Cas9試劑("Cas9-gRNA-TΓ 和 "Cas9-gRNA-T2")靶向相同的AAVS1 區(qū)域(切 割位點距其短于SSbp)。^"和"T-2"表示不同的導引RNA。圖7A展示指定的條件下基因組 修飾(靶向整合("ΤΓ )和插入/缺失("插入缺失"的百分率。圖7B展示指定的條件下靶向 整合("%TI)的百分率。
[0034]圖8的圖Α和Β描繪CD4+初級Τ細胞中核酸酶介導的整合的結果。圖8Α展示在指定的 條件下引入CCR5特異性ZFN和包含供體的AAV2、AAV6或IDLV后CCR5的基因組修飾(靶向整合 ("TI")和插入/缺失("插入缺失")的百分率。圖8B展示在指定的條件下引入AAVS1核酸酶 和AAV6供體后靶向整合("ΤΙ")和插入/缺失("插入缺失")后AAVS1的基因組修飾的百分率。 在這些條件下使用AAV6供體與使用AAV2或IDLV供體相比觀察到ΤΙ增加。
[0035]圖9的圖Α和Β描繪CD8+初級Τ細胞中核酸酶介導的整合的結果。圖9Α展示在指定的 條件下引入CCR5特異性ZFN和包含供體的AAV2、AAV6或IDLV后CCR5的基因組修飾(靶向整和 ("TI")和插入/缺失("插入缺失")的百分率。圖9B展示在指定的條件下引入AAVS1核酸酶 和AAV6供體后AAVS1的基因組修飾(靶向整合("ΤΙ")和插入/缺失("插入缺失"的百分率。 在這些條件下使用AAV6供體與使用AAV2或IDLV供體相比觀察到ΤΙ增加。
【具體實施方式】
[0036]本文公開用于轉導細胞以適用于基因療法或基因組工程改造的組合物和方法。特 定來說,通過靶向切割接著非同源末端連接進行外源序列或基因組修改的核酸酶介導的 (即ZFN、TALEN、TtAgo或CRISPR/Cas系統(tǒng))靶向整合可有效地在細胞中實現(xiàn)。所述方法和組 合物尤其可用于HSC/PC和T細胞的轉導和工程改造,然而,其還可以用于其它的細胞類型。 [0037]如詳述將ZFN和供體模板DNA的遞送最優(yōu)化及細胞類型包括任何造血干細胞或前 體細胞(包括CD34+細胞)。0)34+細胞可以包括原始(CD133+CD90+或CD90-)、早期(CD34+、 CD133+)和定向(CD34+CD133-)CD34+子組以及T細胞。本文所述的方法導致用修飾細胞治療 的動物中的長期多向移植。
[0038] 綜述
[0039] 除非另有指示,否則所述方法的操作以及本文所公開的組合物的制備和用途采用 相關技術中的分子生物學、生物化學、染色質結構和分析、計算化學、細胞培養(yǎng)、重組DNA和 相關領域的常規(guī)技術。在文獻中充分闡釋這些技術。參見,例如,Sambrook等人MOLE⑶LAR CL0NING:A LABORATORY MANUAL,第二版,Cold Spring Harbor Laboratory Press, 1989和 第三版,2001 ;Ausubel 等人,CURRENT PROTO ⑶LS IN MOLECULAR BIOLOGY John Wiley& Sons,New York, 1987 和定期更新;系列METHODS IN ENZYM0L0GY,Academic Press, San Diego;Wolffe,CHR0MATIN STRUCTURE AND FUNCTION,第三版,Academic Press, San Diego,1998;METH0DS IN ENZYM0L0GY,第304卷,"Chromatin"(P.M.Wassarman與 A.P.Wolffe編),Academic Press,San Diego,1999;和METHODS IN MOLECULAR BIOLOGY,第 119卷,"Chromatin Protocols"(P.B.Becker編)Humana Press,Totowa,1999。
[0040] 定義
[0041] 術語"核酸"、"多核苷酸"和"寡核苷酸"可互換使用且是指呈線性或圓形構形、和 呈單鏈或雙鏈形式中任何一種形式的脫氧核糖核苷酸或核糖核苷酸聚合物。為本發(fā)明的目 的,這些術語不應解釋為針對聚合物的長度的限制。所述術語可以包涵天然核苷酸的已知 的類似物、以及堿基、糖和/或磷酸酯部分(例如,硫代磷酸酯主鏈)經(jīng)過修飾的核苷酸。一般 來說,特定核苷酸的類似物具有相同的堿基配對特異性;即,A的類似物將與T堿基配對。 [0042]術語"多肽"、"肽"和"蛋白質"可互換使用以指代氨基酸殘基的聚合物。所述術語 還適用于一個或多個氨基酸為對應的天然存在的氨基酸的化學類似物或經(jīng)過修飾的衍生 物的氨基酸聚合物。
[0043] "結合"是指大分子之間(例如,在蛋白質與核酸之間)的序列特異性、非共價鍵相 互作用。并非結合相互作用的所有分量需要具有序列特異性(例如,與DNA主鏈中的磷酸酯 殘基接觸),只要相互作用總體上具序列特異性即可。這些相互作用一般由或更小的 解離常數(shù)(Kd)表征。"親和力"是指結合的強度:較大的結合親和力與較小的K d相關聯(lián)。
[0044] "結合蛋白"為能夠與另一分子結合的蛋白。結合蛋白可與例如DNA分子(DNA結合 蛋白)、RNA分子(RNA結合蛋白)和/或蛋白質分子(蛋白結合蛋白)結合。就蛋白結合蛋白來 說,其可以與自身結合(以形成同質二聚體、同質三聚體等)和/或其可以與一種或多種不同 蛋白的一個或多個分子結合。結合蛋白可以具有多于一種類型的結合活性。例如,鋅指蛋白 具有DNA結合、RNA結合和蛋白結合活性。
[0045] "鋅指DNA結合蛋白"(或結合域)為蛋白或較大蛋白中以序列特異性方式通過一個 或多個鋅指與DNA結合的域,所述域為其結構通過鋅離子的配位得以穩(wěn)定的結合域中的氨 基酸序列區(qū)域。術語鋅指DNA結合蛋白通??s寫為鋅指蛋白或ZFP。
[0046] "TALE DNA結合域"或"TALE"為包含一個或多個TALE重復域/單元的多肽。所述重 復域參與TALE與其同源靶DNA序列的結合。單一"重復單元"(也稱為"重復")通常為33-35個 氨基酸長且顯示與天然存在的TALE蛋白中的其它TALE重復序列的至少一些序列同源性。 [0047]鋅指和TALE結合域可以例如通過天然存在的鋅指或TALE蛋白的識別螺旋區(qū)的工 程改造(改變一個或多個氨基酸)"工程改造"以與預定的核苷酸序列結合。因此,經(jīng)過工程 改造的DNA結合蛋白(鋅指或TALE)為非天然存在的蛋白。用于工程改造 DNA結合蛋白的方法 的非限制性實例為設計和選擇。所設計的DNA結合蛋白為設計/組成主要來自理性標準的非 天然存在的蛋白。用于設計的理性標準包括應用替代規(guī)則和計算機算法以處理儲存現(xiàn)有的 ZFP和/或TALE設計和結合數(shù)據(jù)的信息的數(shù)據(jù)庫中的信息。參見,例如,美國專利8,586,526; 6,140,081 ;6,453,242;和6,534,261;還可參見恥 98/53058;恥 98/53059;恥 98/53060; W0 02/016536和W0 03/016496。
[0048] "所選的"鋅指蛋白或TALE為其產生主要歸因于經(jīng)驗性過程諸如噬菌體展示、相互 作用陷阱或混合選擇的不在自然中發(fā)現(xiàn)的蛋白。參見,例如,美國專利No . 8,586,526 ; 5, 789,538;US 5,925,523;US 6,007,988;US 6,013,453;US 6,200,759;W0 95/19431;W0 96/06166;W0 98/53057;W0 98/54311;W0 00/27878;W0 01/60970^W0 01/88197^W0 02/ 099084。
[0049] "TtAgo"是被認為參與基因沉默的原核Argonaute蛋白。TtAgo源自于細菌嗜熱棲 熱菌(Thermus thermophilus)。(參見,例如,Swarts等人,同上,G · Sheng等人,(2013) Proc · Nat 1 · Acad · Sci · U· S · A · 111,652)。"TtAgo系統(tǒng)"為TtAgo酶切割需要的所有組分,包括 (例如)導引DNA〇
[0050] "重組"是指在兩種多核苷酸間交換基因信息的方法,包括但不限于通過非同源末 端連接(NHEJ)和同源重組的供體捕獲。為本發(fā)明的目的,"同源重組(HR)"是指這種例如在 通過同源定向修復機制修復細胞中雙鏈斷裂發(fā)生的交換的特定的形式。這一過程需要核苷 酸序列同源性,使用"供體"分子以模板修復"祀"分子(即,發(fā)生雙鏈斷裂的分子),且可不同 地稱為"非交叉基因轉化"或"短道基因轉化",這是因為其導致基因信息從供體轉移到標 靶。在不希望受任何特定理論約束下,這一轉移可能涉及形成于斷裂的靶與供體之間的異 源雙鏈DNA的失配校正、和/或"合成依賴性鏈退火",其中所述供體是用于再合成將成為靶 的一部分的基因信息、和/或相關過程。這一特定的HR通常導致靶分子的序列改變使得供體 多核苷酸的部分或所有序列并入到靶多核苷酸中。
[0051] 在本發(fā)明的方法中,一種或多種如本文所述的靶向核酸酶在預定位點于靶序列 (例如,細胞染色質)中引起雙鏈斷裂,及具有與斷裂區(qū)域中的核苷酸序列的同源性的"供 體"多核苷酸可以被引入到細胞中。已顯示雙鏈斷裂的存在有利于供體序列的整合。供體序 列可以在物理上進行整合,或者,供體多核苷酸用作模板以通過同源重組修復斷裂,導致供 體中的所有或部分核苷酸序列引入到細胞染色質中。因此,可以改變細胞染色質中的第一 序列,及在某些實施方案中,可以轉化成存于供體多核苷酸中的序列。因此,使用術語"置 換"可以理解為表示一個核苷酸序列改由另一個核苷酸序列置換,(即,序列在信息意義上 的置換),但不一定需要一個多核苷酸改由另一個多核苷酸物理或化學置換。
[0052] 在本文所述的任何方法中,額外的鋅指蛋白或TALEN對可用于細胞中額外的靶位 點的額外的雙鏈切割。
[0053] 本文所述的任何方法可用于任何尺寸的供體的插入和/或細胞中一個或多個靶序 列通過靶向整合破壞受關注的基因的表達的供體序列的部分或完全失活。還提供具有部分 或完全失活的基因的細胞系。
[0054]而且,如本文所述的靶向整合的方法還可以用于整合一個或多個外源序列。外源 核酸序列可以包含(例如)一個或多個基因或cDNA分子或任何類型的編碼或非編碼序列以 及一個或多個控制元件(例如,啟動子)。此外,外源核酸序列可以產生出一種或多種RNA分 子(例如,小發(fā)夾RNA(shRNA)、抑制RNA(RNAi)、微RNA(miRNA)等)。
[0055] 在用于靶向重組和/或置換和/或改變細胞染色質中受關注的區(qū)域中序列的方法 的某些實施方案中,通過與外源"供體"核苷酸序列同源重組改變染色體序列。細胞染色質 中雙鏈斷裂的存在會刺激這種同源重組,如果存在與斷裂的區(qū)域同源的序列。
[0056] 在本文所述的任何方法中,外源核苷酸序列("供體序列"或"轉基因")可以包含與 受關注的區(qū)域中的基因組序列同源但不相同的序列,由此刺激同源重組以在受關注的區(qū)域 中插入非同一的序列。因此,在某些實施方案中,供體序列的與受關注的區(qū)域中的序列同源 的部分展示與所置換的基因組序列在約80與99%之間(或其間的任何整數(shù))的序列同一性。 在其它實施方案中,供體與基因組序列間的同源性高于99%,例如,如果供體與超過100個 相鄰堿基對的基因組序列間僅1個核苷酸不同。在某些情形中,供體序列的非同源部分可以 包含不存在于受關注的區(qū)域中的序列,因此,將新穎的序列引入到受關注的區(qū)域中。在這些 情形中,非同源序列一般側懸與受關注的區(qū)域中的序列同源或相同的50-1,000個堿基對 (或其間的任何整數(shù)值)或多于1,〇〇〇個的任何數(shù)量的堿基對的序列。在其它實施方案中,供 體序列與第一序列非同源,且通過非同源重組機制插入到基因組中。
[0057] "切割"是指DNA分子的共價主鏈的斷裂??梢杂啥喾N方法包括但不限于磷酸二酯 鍵的酶水解或化學水解引起切割。單鏈切割和雙鏈切割均可行,且雙鏈切割可以由于兩個 不同單鏈切割事件而發(fā)生。DNA切割可以導致產生出鈍端或交錯端。在某些實施方案中,使 用融合多肽以進行靶向雙鏈DNA切割。
[0058] "切割半域"為與第二多肽(相同或不同)結合形成具有切割活性(優(yōu)選的是雙鏈切 割活性)的復合物的多肽序列。術語"第一和第二切割半域";"+和-切割半域"和"右和左切 割半域"可互換使用以指二聚合的切割半域對。
[0059] "經(jīng)過工程改造的切割半域"為已經(jīng)過修飾以形成具有另一切割半域(例如,另一 經(jīng)過工程改造的切割半域)的必需異二聚體的切割半域。還可參見美國專利公開No.2005/ 0064474、20070218528、2008/0131962和2011/0201055,所述專利以其全文引用的方式并入 本文。
[0060]術語"序列"是指任何長度的核苷酸序列,其可以是DNA或RNA;可以是直鏈、圓形或 支鏈且可以是單鏈或雙鏈。術語"供體序列"是指插入到基因組中的核苷酸序列。供體序列 可以是任何長度,例如,長度在2與100,000,000個核苷酸之間(或其間或超過其的任何整數(shù) 值),優(yōu)選地,長度在約100與100,〇〇〇個核苷酸之間(或其間的任何整數(shù)),更優(yōu)選地,長度在 約100與5,000個核苷酸之間(或其間的任何值),且甚至更優(yōu)選地,在約100與2,000個堿基 對之間(或其間的任何值)。
[0061] "同源、非同一序列"是指與第二序列共有一定程度的序列一致性但其序列不與第 二序列的序列相同的第一序列。例如,包含突變基因的野生型序列的多核苷酸與突變基因 的序列同源但非同一。在某些實施方案中,使用正常細胞機制,兩個序列之間的同源程度足 夠允許其間的同源重組。兩個同源非同一序列可以是任何長度及其非同源程度可以小到單 一核苷酸(例如,就通過靶向同源重組校正基因組點突變來說)或大到10個或更多個千堿基 (例如,就染色體中預定抗原決定基位點處插入基因來說)。兩個包含同源非同一序列的多 核苷酸無需長度相同。例如,可以使用20到10,000個核苷酸或核苷酸對的外源多核苷酸 (即,供體多核苷酸)。
[0062] 相關技術中已知用于判定核酸和氨基酸序列同一性的技術。通常,這些技術包括 判定mRNA的核苷酸序列的基因和/或判定由其編碼的氨基酸序列,且將這些序列與第二核 苷酸或氨基酸序列進行比較。還可以判定基因組序列且以這一方式進行比較。一般來說,同 一性是指兩個多核苷酸或多肽序列各自的確切核苷酸-對-核苷酸或氨基酸-對-氨基酸對 應??梢酝ㄟ^使用標準技術判定其同一性百分比來比較兩個或更多個序列(多核苷酸或氨 基酸)。通常,序列之間的同一性百分比為至少70-75 %,優(yōu)選地,80-82 %,更優(yōu)選地,85-90%,甚至更優(yōu)選地,92 %,仍更優(yōu)選地,95 %,且最優(yōu)選地,98 %序列同一性。
[0063] 或者,可以通過在允許同源區(qū)域間形成穩(wěn)定二螺旋的條件下雜交多核苷酸,接著 用單鏈特異性核酸酶消化,且對經(jīng)過消化的片段尺寸測定來判定多核苷酸之間的序列相似 性程度。兩核酸或兩多肽序列當在所述序列在分子的整個定義長度展示如使用相關技術中 已知的方法測得至少約70 %-75%,優(yōu)選地,80%-82%,更優(yōu)選地,85%-90%,甚至更優(yōu)選 地,92%,又更優(yōu)選地,95%,且最優(yōu)選地,98%序列同一性時彼此實質上同源。本領域技術 人員熟知用于雜交的條件。雜交嚴格度是指雜交條件不利于形成包含錯配核苷酸的雜交物 的程度,較高的嚴格度與較低的對錯配雜交物的容許度相關聯(lián)。本領域技術人員熟知影響 雜交嚴格度的因素且包括但不限于溫度、PH、離子強度、和有機溶劑諸如(例如)甲酰胺和二 甲亞砜的濃度。如本領域技術人員已知,雜交嚴格度隨著溫度的升高、離子強度的減小和溶 劑濃度的變小而增加。
[0064] "染色質"為包含細胞基因組的核蛋白結構。細胞染色質包含核酸(主要是DNA)和 蛋白質(包括組蛋白和非組蛋白染色體蛋白)。大多數(shù)真核細胞染色質呈核小體的形式存 在,其中核小體核包含約150個與包含組蛋白H2A、H2B、H3和H4中各兩個的八聚物相關聯(lián)的 DNA堿基對;及(隨生物改變的可變長度的)連接子DNA在核小體核之間延伸。組蛋白H1的分 子一般與連接子DNA相關聯(lián)。為本發(fā)明的目的,術語"染色質"意在涵蓋所有類型的細胞核蛋 白(原核和真核)。細胞染色質不但包括染色體而且包括游離染色質。
[0065] "染色體"為包含所有或部分細胞基因組的染色質復合物。細胞的基因組通常由其 核型表征,核型是所有包含細胞基因組的染色體的總稱。細胞的基因組可包含一種或多種 染色體。
[0066] "游離體"為復制核酸、核蛋白復合物或其它不為細胞染色體核型的一部分的包含 核酸的結構。游離體的實例包括質體和某些病毒基因組。
[0067] "可接近的區(qū)域"為細胞染色質中的存在于核酸中的靶位點可以為識別靶位點的 外源分子所結合的位點。在不希望受任何特定理論約束下,拒信可接近的區(qū)域為非裝入核 小體結構中的區(qū)域??梢酝ǔMㄟ^其對化學和酶探針例如核酸酶敏感性來檢測可接近的區(qū) 域的獨特的結構。
[0068] "靶位點"或"靶序列"是定義核酸的為結合性分子所將結合的部分的核酸序列,條 件是存在足以結合的條件。
[0069] "外源"分子為通常不存在于細胞中但可以通過一種或多種基因、生物化學或其它 方法引入到細胞中的分子。相對于細胞的特定發(fā)育階段和環(huán)境條件來判定"通常存在于細 胞中"。因此,例如,僅存在于胚胎肌肉發(fā)育中的分子相對成人肌肉細胞來說為外源分子。類 似地,由熱休克引起的分子相對非熱休克細胞來說為外源分子。外源分子可以包括(例如) 故障內源分子的發(fā)揮作用的形式或正常發(fā)揮作用的內源分子的故障形式。
[0070] 外源分子可以尤其是諸如通過組合化學方法產生的小分子、或大分子(諸如蛋白 質、核酸、碳水化合物、脂質、醣蛋白、脂蛋白、多醣、上述分子的任何經(jīng)過修飾的衍生物)、或 包含一種或多種上述分子的任何復合物。核酸包括DNA和RNA,可以是單鏈或雙鏈;可以是直 鏈、支鏈或圓形;且可以是任何長度。核酸包括能夠形成二螺旋的核酸以及形成三螺旋的核 酸。參見,例如,美國專利如.5,176,996和5,422,251。蛋白質包括但不限于0嫩結合蛋白、轉 錄因子、染色質重塑因子、甲基化DNA結合蛋白、聚合酶、甲基化酶、去甲基化酶、乙?;浮?去乙?;?、激酶、磷酸酶、整合酶、重組酶、連接酶、拓撲異構酶、螺旋酶和解螺旋酶。
[0071] 外源分子可以是與內源分子相同類型的分子,例如,外源蛋白或核酸。例如,外源 核酸可以包含感染性病毒基因組、引入到細胞中的質體或游離體、或通常不存在于細胞中 的染色體。本領域技術人員已知用于引入外源分子到細胞中的方法且包括但不限于脂質介 導的轉移(即,脂質體,包括中性脂質和陽離子脂質)、電穿孔、直接注射、細胞融合、粒子轟 擊、生物聚合物納米粒子遞送(參見Nitta與Numata(2013)Int JMol Sci 14:1629)、磷酸 鈣共沉淀、DEAE-聚葡萄糖-介導的轉移和病毒載體介導的轉移。外源分子還可以是與內源 分子相同類型但源自一來源不同于細胞的物種的分子。例如,可以將人核酸序列引入到最 初源自小鼠或倉鼠的細胞系中。
[0072] 相反,"內源"分子為通常在特定發(fā)育階段于特定環(huán)境條件下存在于特定細胞中的 分子。例如,內源核酸可以包括染色體、線粒體或其它細胞器的基因組或天然存在的游離核 酸。額外的內源分子可以包括蛋白質,例如,轉錄因子和酶。
[0073] 如本文中所使用,術語"外源核酸的產物"不但包括多核苷酸產物而且包括多肽產 物,例如,轉錄產物(多核苷酸,諸如RNA)和翻譯產物(多肽)。
[0074] "融合"分子為兩個或更多個子單元分子優(yōu)選地以共價鍵連接的分子。子單元分子 可以是相同化學類型的分子,或可以是不同化學類型的分子。第一類型的融合分子的實例 包括但不限于融合蛋白(例如,ZFP或TALE DNA結合域與一個或多個活化域間的融合)和融 合核酸(例如,編碼前述融合蛋白的核酸)。第二類型的融合分子的實例包括但不限于形成 三螺旋的核酸與多肽間的融合和小溝粘結劑與核酸間的融合。
[0075] 可以從遞送融合蛋白到細胞或通過遞送編碼融合蛋白的核苷酸到細胞實現(xiàn)細胞 中融合蛋白的表達,其中所述多核苷酸經(jīng)過轉錄,且轉錄體經(jīng)過轉譯,以形成融合蛋白。反 式接合、多肽切割和多肽連接也可能參與細胞中蛋白質的表達。在本發(fā)明的其它地方提出 用于遞送多核苷酸和多肽到細胞的方法。
[0076] 為本發(fā)明的目的,"基因"包括編碼基因產物的DNA區(qū)(參見以下)以及所有調芐基 因產物的產生的DNA區(qū),不論這些調節(jié)序列是否與編碼序列和/或經(jīng)過轉錄的序列相鄰。因 此,基因包括但不一定限于啟動子序列、終止子、翻譯調節(jié)序列(諸如核糖體結合位點和內 部核糖體進入位點)、增強子、沉默子、絕緣子、邊界元件、復制源、基質附著位點和基因座控 制區(qū)。
[0077] "基因表達"是指包含在基因中的信息轉化成基因產物?;虍a物可以是基因的直 接轉錄產物(例如,mRNA、tRNA、rRNA、反義RNA、核酶、結構性RNA、或RNA的任何其它類型)或 通過mRNA的翻譯所產生的蛋白質?;虍a物還包括通過方法諸如封端、聚腺苷酸化、甲基化 和編輯修飾的RNA、和通過例如甲基化、乙?;⒘姿峄?、泛素化、ADP-核糖基化、肉豆蔻?;?和醣化修飾的蛋白質。
[0078] 對基因表達的"調節(jié)"是指基因活性的改變。對表達的調節(jié)可以包括但不限于基因 活化和基因抑制?;蚪M編輯(例如,切割、改變、失活、隨機突變)可用于調節(jié)表達?;蚴?活是指與不包括如本文所述的ZFP、TALE或CRISPR/Cas系統(tǒng)的細胞相比基因表達的任何降 低。因此,基因失活可以是部分或完全的。
[0079] "受關注的區(qū)域"為細胞染色質的需要與外源分子結合的任何區(qū)域,諸如,例如,基 因或在基因中或與基因相鄰的非編碼序列。結合可以是針對靶向DNA切割和/或靶向重組的 目的。受關注的區(qū)域可以存在于例如染色體、游離體、細胞器基因組(例如,線粒體、葉綠體) 或感染性病毒基因組中。受關注的區(qū)域可以在基因的編碼區(qū)中,在經(jīng)過轉錄的非編碼區(qū)諸 如(例如)前導序列、拖尾序列或內含子中,或在編碼區(qū)上游或下游的未經(jīng)轉錄的區(qū)域中。受 關注的區(qū)域可以小到一個核苷酸對或長度達2,000個核苷酸對、或任何整數(shù)值的核苷酸對。
[0080] "真核"細胞包括但不限于真菌細胞(諸如酵母)、植物細胞、動物細胞、哺乳動物細 胞和人類細胞(例如,T細胞)。
[0081] "分泌組織"為那些在動物中從個別細胞分泌出產物進入某種類型的腔中的通常 源自上皮的組織。定位到胃腸道的分泌組織的實例包括襯里于腸、胰臟和膽囊的細胞。其它 分泌組織包括肝臟、與眼睛相關聯(lián)的組織和粘膜,諸如唾液腺、乳腺、前列腺、腦下垂體和內 分泌系統(tǒng)的其它成員。另外,分泌組織包括能夠分泌的組織類型的個別細胞。
[0082] 術語"有效連接"和"有效地連接"(或"經(jīng)過有效連接的")在關于兩個或更多個元 件(諸如序列元件)的并置時可互換使用,其中所述元件經(jīng)過配置使得兩個元件正常起作用 且允許這兩個元件的至少一個可介導對其它元件中的至少一個所起到的功能的可能性。舉 例來說,如果轉錄調節(jié)序列響應于一種或多種轉錄調節(jié)因素的存在或不存在控制編碼序列 的轉錄水平,則轉錄調節(jié)序列諸如啟動子與編碼序列有效連接。轉錄調節(jié)序列一般以順式 與編碼序列有效連接,但不需要直接鄰接編碼序列。例如,增強子為與編碼序列有效連接的 轉錄調節(jié)序列,盡管它們是非鄰接的。
[0083] 就融合多肽來說,術語"經(jīng)過有效連接的"可以指所述元件各自執(zhí)行如假如其不是 這樣連接將進行的相同的連接其它元件的功能的事實。例如,就ZFP、TALE或Cas DNA結合域 融合到活化域的融合多肽來說,如果在融合多肽中,ZFP、TALE或Cas DNA結合域部分能夠將 其靶位點與/或其結合位點結合,同時活化域能夠下調基因表達,則ZFP、TALE或Cas DNA結 合域與活化域有效連接。當融合多肽中的ZFP、TALE或Cas DNA結合域融合到切割域時,如果 在融合多肽中,ZFP、TALE或Cas DNA結合域部分能夠將其靶位點與/或其結合位點結合,同 時切割域能夠切割靶位點附近的DNA (例如,靶位點任一側上的1到500個堿基對或其間的任 何值),則ZFP、TALE或Cas DNA結合域與切割域有效連接。
[0084] 蛋白、多肽或核酸的"功能性片段"為其序列不與全長蛋白、多肽或核酸相同但保 留與全長蛋白、多肽或核酸相同的功能的蛋白、多肽或核酸。功能性片段可以帶有與對應的 天然分子相同、更多或更少數(shù)量的殘基,和/或可以包含一種或多種氨基酸或核苷酸取代。 用于判定核酸的功能(例如,編碼功能、與另一核酸雜交的能力)的方法是本領域眾所周知 的。類似地,用于判定蛋白功能的方法是眾所周知的。例如,多肽的DNA結合功能可以通過例 如濾紙結合分析、電泳迀移率變動分析或免疫沉淀分析來判定??梢酝ㄟ^凝膠電泳來分析 DNA切割。參見Ausubel等人,同前述??赏ㄟ^例如共免疫沉淀、雙雜交分析或互補來判定蛋 白與另一蛋白相互作用的能力(基因學和生化血)。參見,例如,F(xiàn)ields等人(1989)Nature 340:245-246;美國專利No.5,585,245和PCT W0 98/44350。
[0085] "載體"能夠將基因序列轉移到靶細胞。通常,"載體構建體"、"表達載體"和"基因 轉移載體"意指能夠導引受關注的基因的表達且可將基因序列轉移到靶細胞的任何核酸結 構。因此,所述術語包括克隆和表達媒介以及整合載體。
[0086] "報導子基因"或"報導子序列"是指產生優(yōu)選地然而不一定需要在常規(guī)分析中容 易測得的蛋白產物的任何序列。適合的報導子基因包括但不限于編碼介導抗生素抗性(例 如,氨節(jié)西林(ampici 11 in)抗性、新霉素(neomycin)抗性、G418抗性、噪呤霉素抗性)的蛋白 的序列、編碼有色或熒光或發(fā)光蛋白(例如,綠色熒光蛋白、增強型綠色熒光蛋白、紅色熒光 蛋白、熒光素酶)的序列和介導增強的細胞生長和/或基因擴增的蛋白(例如,二氫葉酸還原 酶)。表位標簽包括(例如)FLAG、Hi s、myc、Tap、HA的一個或多個拷貝或任何可檢測氨基酸序 列。"表達標簽"包括編碼可以與所需基因序列有效連接以監(jiān)測受關注的基因的表達的報導 子的序列。
[0087] "安全港"基因座為在基因組內的基因座,其中可以插入基因而對寄主細胞無任何 有害影響的。最有利的是所插入的基因序列的表達不受鄰近基因的任何通讀表達干擾的安 全港基因座。哺乳動物細胞中安全港基因座的非限制性實例為AAVS1基因(美國專利No. 8, 110,379)、CCR5基因(美國公開No. 20080159996)、Rosa基因座(W0 2010/065123)和/或白蛋 白基因座(美國公開No. 20130177960和20130177983)。植物細胞中的安全港為ZP15基因座 (美國專利公開20100199389)。
[0088] 術語"受試者"和"患者"可互換使用,且是指哺乳動物(諸如人類患者和非人類的 靈長類動物)以及實驗動物(諸如兔、狗、貓、大鼠、小鼠)和其它動物。因此,術語"受試者"或 "患者"如本文中所使用是指本發(fā)明的或干細胞可以投與的任何哺乳動物患者或受試者。本 發(fā)明的受試者包括那些已暴露于一種或多種化學毒素(包括(例如)神經(jīng)毒素)的受試者。
[0089] "干性"是指任何細胞的以干細胞方式作用的相對能力,即,全能、多能或寡能的程 度和任何特定干細胞可能具有的膨脹或不定的自我更新。
[0090] 核酸酶
[0091] 本文描述適用于活體內切割帶有轉基因和核酸酶以切割細胞的基因組使得轉基 因以靶向方式整合到基因組中的供體分子的組合物,特別是核酸酶,諸如ZFN、TALE、歸巢核 酸內切酶、Ttago和/或CRISPR/Cas系統(tǒng)。在某些實施方案中,核酸酶中的一種或多種是天然 存在的。在其它實施方案中,核酸酶中的一種或多種是非天然存在的,即,DNA結合域和/或 切割域經(jīng)過工程改造。例如,可以改變天然存在的核酸酶的DNA結合域以與所選靶位點(例 如,已經(jīng)過工程改造以與不同于同源結合位點的位點結合的大范圍核酸酶)結合。在其它實 施方案中,核酸酶包含異源DNA結合域和切割域(例如,鋅指核酸酶;TAL效應子域DNA結合蛋 白;具有異源切割域的大范圍核酸酶DNA結合域)。在其它實施方案中,核酸酶包含系統(tǒng)諸如 CRISPR/Cas 或 Ttago 系統(tǒng)。
[0092] A.DNA-結合域
[0093] 在某些實施方案中,本文所述的組合物和方法使用用于與供體分子結合和/或與 細胞基因組中受關注的區(qū)域結合的大范圍核酸酶(歸巢核酸內切酶)DNA結合域。天然存在 的大范圍核酸酶識別15 -40個堿基對切割位點且通常分組為四個家族:LAGLIDADG家族、 GIY-YIG家族、His-Cyst盒家族和HNH家族。示例性的歸巢核酸內切酶包括I-SCeI、I-CeuI、 PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-Ppol、I-SceIII、I-Crel、I-TevI、I-丁6¥11和1-了6¥111。已知其識別序列。還可參見美國專利如.5,420,032;美國專利如.6,833, 252;Belfort等人(1997)Nucleic Acids Res.25:3379-3388;Dujon等人(1989)Gene 82: 115-118;Perler等人(1994)Nucleic Acids Res .22,1125-1127; Jasin(1996)Trends Genet. 12 :224-228 ;Gimble 等人(1996) J .Mol .Biol .263:163-180; Argast 等人(1998) J.Mol.Biol.280:345-353 和新英格蘭生物實驗室目錄(New England Biolabs catalogue)〇
[0094] 在某些實施方案中,本文所述的方法和組合物使用包含經(jīng)過工程改造(非天然存 在)的歸巢核酸內切酶(大范圍核酸酶)的核酸酶。已知歸巢核酸內切酶和大范圍核酸酶諸 如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、 I-Crel、I-TevI、I-TevII和I-TevII I的識別序列。還可參見美國專利No · 5,420,032;美國專 利No .6,833,252;Belfort等人(1997)Nucleic Acids Res .25 :3379-3388 ;Du jon等人 (1989)Gene 82:115-118;Perler等人(1994)Nucleic Acids Res.22,1125-1127;Jasin (1996)Trends Genet .12:224-228 ;Gimble等人(1996) J.Mol.Biol .263:163-180 ;Argast等 人(1998) J .Mol .Biol. 280:345-353和新英格蘭生物實驗室目錄。此外,歸巢核酸內切酶和 大范圍核酸酶的D N A結合特異性可以經(jīng)過工程改造以與非天然靶位點結合。參見,例如, Chevalier 等人(2002) Mo lee. Cell 10 : 895-905; Epinat 等人(2003) Nucleic Acids Res·31:2952-2962;Ashworth等人(2006)Nature 441:656-659;Paques等人(2007)Current Gene Therapy 7:49-66;美國專利公開No. 20070117128。歸巢核酸內切酶和大范圍核酸酶 的DNA結合域可以總體上在核酸酶的背景內容中改變(即,使得核酸酶包括同源切割域)或 可以融合到異源切割域。
[0095] 在其它實施方案中,用于本文所述的方法和組合物中的核酸酶中的一種或多種核 酸酶的DNA結合域包含天然存在的或經(jīng)過工程改造的(非天然存在的)TAL效應子DNA結合 域。參見,例如,美國專利No. 8,586,526,所述專利以其全文引用的方式并入本文。已知黃單 孢菌屬的植物致病菌引起重要作物中的許多疾病。黃單孢菌屬的病原取決于將多于25種不 同效應子蛋白注入植物細胞中的保守的III型分泌(T3S)系統(tǒng)而改變。這些所注入的蛋白中 包括模擬植物轉錄活化子且操縱植物轉錄組的類轉錄活化子(TAL)效應子(參見Kay等人 (2007) Sci ence 318:648-651)。這些蛋白包含DNA結合域和轉錄活化域。一種最為良好表征 的TAL效應子為源自野油菜黃單抱菌葉斑病(Xanthomonas campestgris pv · Vesicatoria) 的AvrBs3(參見Bonas等人(1989)Mol Gen Genet 218:127-136和恥2010079430)<^41^效應 子包含串接重復的集中域,各重復包含約34個對這些蛋白的DNA結合特異性具關鍵性的氨 基酸。此外,它們包含細胞核定位序列和酸性轉錄活化域(參見Schornack S等人(2006)J Plant Physiol 163(3) :256_272)。此外,在植物病原細菌青枯雷爾氏菌(Ralstonia solanacearum)中,已發(fā)現(xiàn)命名為brgll和hpxl7的兩種基因與青枯雷爾氏菌biovar 1品系 GMI1000和biovar 4品系RS1000中的黃單孢菌的AvrBs3家族同源(參見Heuer等人(2007) ApplandEnvirMicro 73(13):4379-4384)。這些基因的核苷酸序列彼此為98.9%同一性 但因 hpxl7的重復域中缺失1,575bp而不同。然而,兩種基因產物具有與黃單孢菌的AvrBs3 家族蛋白小于40 %的序列同一性。參見,例如,美國專利公開No. 8,586,526,所述公開以其 全文引用的方式并入本文。
[0096] 這些TAL效應子的特異性取決于在串接重復中發(fā)現(xiàn)的序列而改變。重復序列包含 約102bp且所述重復通常彼此91-100%同源(Bona s等人,同上)。重復的多晶型物通常位于 位置12和13且位置12和13處超變雙殘基的同一性與TAL效應子靶序列中鄰接核苷酸的同一 性之間似乎存在一對一的對應性(參見Moscou與Bogdanove,(2009)Science 326 :1501和 Boch等人(2009)Science 326:1509-1512)。實驗上,已判定用于這些TAL效應子的DNA識別 的自然密碼使得位置12和13處的HD序列導致與胞嘧啶(C)的結合,NG與T結合,NI與A、C、G或 T結合,NN與A或G結合,及ING與T結合。這些DNA結合重復已組裝成具有新的組合和許多重復 的蛋白,以制得能夠與新的序列相互作用且活化植物細胞中非內源報導子基因的表達的人 工轉錄因子(Boch等人,同上)。經(jīng)過工程改造的TAL蛋白與FokI切割半域連接以產生在酵母 報導子分析中展現(xiàn)活性的TAL效應子域核酸酶融合(TALEN)(基于質體的靶)。參見,例如,美 國專利No.8,586,526;Christian 等人((2010)〈Genetics epub 10.1534/ genetics.110.120717)。
[0097] 在某些實施方案中,用于活體內切割和/或細胞基因組的靶向切割的核酸酶中一 種或多種核酸酶的DNA結合域包含鋅指蛋白。優(yōu)選地,鋅指蛋白因為其經(jīng)過工程改造以與所 選的靶位點結合而是非天然存在的。參見,例如,參見,例如,Beerli等人(2002)Nature Biote chnol · 20:135-141 ;Pabo等人(2001)Ann · Rev · Biochem. 70: 313-340; I salan等人 (2001 )Nature Biotechnol · 19:656-660 ; Segal等人(2001 )Curr · Opin · Biotechnol · 12: 632-637;Choo等人(2000)Curr ·Opin· Struct ·Biol · 10:411-416;美國專利No ·6,453,242; 6,534,261;6,599,692;6,503,717;6,689,558;7,030,215;6,794,136;7,067,317;7,262, 054; 7,070,934; 7,361,635; 7,253,273;和美國專利公開 No · 2005/0064474; 2007/0218528; 2005/0267061,所述專利均以其全文引用的方式并入本文。
[0098] 經(jīng)過工程改造的鋅指結合域可以具有相比天然存在的鋅指蛋白新穎的結合特異 性。工程改造方法包括但不限于理性的設計和各種類型的選擇。理性的設計包括(例如)使 用包含三重(或四重)核苷酸序列和個別鋅指氨基酸序列的資料庫,其中各三重或四重核苷 酸序列與鋅指的與特定三重或四重序列結合的一個或多個氨基酸序列相關聯(lián)。參見,例如, 共同擁有的美國專利6,453,242和6,534,261,所述專利以其全文引用的方式并入本文。
[0099] 示例性選擇方法(包括噬菌體展示和雙雜交系統(tǒng))在美國專利5,789,538; 5,925, 523;6,007,988 ;6,013,453 ;6,410,248;6,140,466 ;6,200,759;和6,242,568;以及TO 98/ 37186;W0 98/53057;W0 00/27878;和W0 01/88197中公開。此外,對鋅指結合域的結合特異 性的增強已在例如共同擁有的W0 02/077227中描述。
[0100] 此外,如這些與其它參考文獻中所公開,鋅指域和/或多指鋅指蛋白可以使用任何 合適的連接子序列,包括(例如)長為5個或更多個氨基酸的連接子連接在一起。關于示例性 連接子序列,還可以參見,美國專利No.8,772,453;6,479,626;6,903,185;和7,153,949。本 文所述的蛋白質可以包括蛋白的個別鋅指之間的合適連接子的任何組合。
[0101] 靶位點的選擇;用于設計和構建融合蛋白(和編碼融合蛋白的多核苷酸)的ZFP和 方法為本領域技術人員已知且詳細描述在美國專利No. 6,140,815; 5,789,538; 6,453,242; 6,534,261;5,925,523;6,007,988;6,013,453;6,200,759;W0 95/19431;W0 96/06166;W0 98/53057;W0 98/54311;W0 00/27878;W0 01/60970;W0 01/88197;W0 02/099084;W0 98/ 53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496中。
[0102] 此外,如這些與其它參考文獻中所公開,鋅指域和/或多指鋅指蛋白可以使用任何 合適的連接子序列(包括(例如)長為5個或更多個氨基酸的連接子)連接在一起。關于長為6 個或更多個氨基酸的示例性連接子序列,還可以參見美國專利No. 6,479,626; 6,903,185; 和7,153,949。本文所述的蛋白可以包括蛋白的個別鋅指之間的合適連接子的任何組合。 [0103]在某些實施方案中,DNA結合域為CRISPR/Cas核酸酶系統(tǒng)的一部分。參見,例如,美 國專利No. 8,697,359和美國專利申請No. 14/278,903。CRI SPR(成簇的規(guī)律間隔的短回文重 復)基因座(其編碼所述系統(tǒng)的RNA元件)和cas(與CRISPR相關聯(lián)的)基因座(其編碼蛋白質) (Jansen等人,2002 ·Mol .Microbiol ·43 :1565-1575;Makarova等人,2002 .Nucleic Acids Res . 30 : 482-496 ; Makarova^A , 2006 . Biol . Direct 1 :7 ;Haft 等人, 2005 .PLoSComput · Biol. 1: e60)組成CRISPR/Cas核酸酶系統(tǒng)的基因序列。微生物寄主中的 CRI SPR基因座包含與CRI SPR相關聯(lián)(Cas)的基因的組合以及能夠對CRI SPR介導的核酸切割 的特異性計劃的非編碼RNA元件。
[0104] II型CRI SPR為最為良好表征的系統(tǒng)中的一種且以四個連續(xù)步驟進行靶向DNA雙鏈 斷裂。首先,自CRISPR基因座轉錄兩個非編碼RNA預-crRNA陣列和tracrRNA。其次,tracrRNA 與預-crRNA的重復區(qū)域雜交且介導將預-crRNA處理成為包含個別間隔序列的成熟crRNA。 第三,成熟crRNA: tracrRNA復合物通過crRNA上的間隔序列與靶DNA上鄰接原型間隔序列鄰 近基序(PAM)的原型間隔序列之間的Watson-Crick堿基配對導引Cas9到革EDNA,這是對革巴識 別一額外的要求。最后,Cas9介導靶DNA的切割以在原型間隔序列中產生雙鏈斷裂。CRISPR/ Cas系統(tǒng)的活性由三個步驟組成:(i)將外來DNA序列插入CRISPR陣列中以防止未來的襲擊, 在一種方法中稱為'調適相關蛋白的表達以及陣列的表達和處理,接著,(iii)RNA介 導的對外來核酸的干擾。因此,在細菌細胞中,幾種所謂的'Cas'蛋白涉及到CRISPR/Cas系 統(tǒng)的自然功能且在諸如插入外來DNA等的功能上充當角色。
[0105] 在某些實施方案中,Cas蛋白可以是天然存在的Cas蛋白的"功能性衍生物"。天然 序列多肽的"功能性衍生物"為具有與天然序列多肽共同的定性生物性質的化合物。"功能 性衍生物"包括但不限于天然序列的片段和天然序列多肽和其片段的衍生物,條件是其具 有與對應的天然序列多肽共同的生物活性。本文所述的生物活性為功能性衍生物的將DNA 基質水解成片段的能力。術語"衍生物"不但包含多肽的氨基酸序列變體(共價修飾)而且包 含其融合物。Cas多肽或其片段的合適的衍生物包括但不限于Cas蛋白或其片段的突變體、 融合物、共價修飾物。Cas蛋白(包括Cas蛋白或其片段)以及Cas蛋白或其片段的衍生物可以 從細胞得到或以化學方式或通過組合這兩種程序合成。所述細胞可以是天然產生Cas蛋白 的細胞或天然產生Cas蛋白的細胞且經(jīng)過基因工程改造以產生較高表達水平的內源Cas蛋 白或以從外源用進入的核酸產生Cas蛋白,所述核酸編碼與內源Cas相同或不同的Cas。在某 些情況中,所述細胞并不天然產生Cas蛋白且經(jīng)過基因改造以產生出Cas蛋白。
[0106] 在一些實施方案中,DNA結合域為TtAgo系統(tǒng)的一部分(參見Swarts等人,同上; Sheng等人,同上)。在真核生物中,由蛋白的Argonaute(Ago)家族介導基因沉默。在這一范 例中,Ago與小的(19-31 nt) RNA結合。這一蛋白-RNA沉默復合物通過小RNA與靶之間的 Watson-Crick堿基配對識別靶RNA且以核酸內切酶切割靶RNA(Vogel(2014)Science 344: 972-973)。相反,原核Ago蛋白與小的單鏈DNA片段結合且極有可能用于檢測并移除外來(通 常是病毒)DNA(Yuan等人,(2005)M〇1 .Cell 19,405;01ovnikov等人(2013)M〇1 .Cell 51, 594; Swarts等人,同上)。示例性原核Ago蛋白包括那些源自超嗜熱菌(Aquifex aeolicus)、 類球紅細菌(Rhodobacter sphaeroides)和嗜熱棲熱菌的蛋白。
[01 07] -種最為良好表征的原核Ago蛋白為源自嗜熱棲熱菌的蛋白(TtAgo; Swart s等人 同上hTtAgo與具有5'磷酸基的15nt或13-25nt單鏈DNA片段中任何一種片段相關聯(lián)。這種 為TtAgo所結合的"導引DNA"用于導引蛋白-DNA復合物呈DNA的第三方分子與Watson-Crick 互補DNA序列結合。一旦這些導引DNA中的序列信息已允許識別靶DNA,TtAgo導引DNA復合物 即切割靶DNA。這一機制還受到TtAgo導引DNA復合物的結構所支持但受限于其靶DNA (G.Sheng等人,同上)。源自類球紅細菌的Ago(RsAgo)具有相似的性質(Olivnikov等人.同 上)。
[0108] 任意DNA序列的外源導弓|DNA可以負載到TtAgo蛋白上(Swarts等人同上)。因為 TtAgo切割的特異性通過導引DNA導引,所以與外源、研究人員指定的導引DNA形成的TtAgo-DNA復合物將因此導引TtAgo靶DNA序列到互補的研究人員指定的靶DNA。依此方式,可在DNA 中產生靶向雙鏈斷裂。使用TtAgo導引DNA系統(tǒng)(或來自其它生物體的直系同源Ago導引DNA 系統(tǒng))可以靶向切割細胞中的基因組DNA。這種切割可以是單鏈或雙鏈的。就哺乳動物基因 組DNA的切割來說,將優(yōu)選使用經(jīng)過最優(yōu)化以用于哺乳動物細胞中的表達的TtAgo密碼子形 式。另外,可以優(yōu)選地用在活體外形成的TtAgo蛋白融合到細胞穿透肽的TtAgo-DNA復合物 處理細胞。另外,可以優(yōu)選地使用已通過突變改變以具有37攝氏度下增強的活性的TtAgo蛋 白形式。使用本領域技術中對于利用DNA斷裂來說為標準的技術,Ago-RNA介導的DNA切割可 以用于影響許多結果,包括基因敲除、靶向基因新增、基因校正、靶向基因缺失。
[0109]因此,核酸酶包含尤其與任何基因中的需要插入供體(轉基因)的靶位點結合的 DNA結合域。
[0110] B.切割域
[0111] 任何合適的切割域可以有效地連接到DNA結合域以形成核酸酶。例如,ZFP DNA結 合域已融合到核酸酶域以產生ZFN-是一能夠通過其經(jīng)過工程改造的(ZFP)DNA結合域識別 其所預期的核酸標靶且引起DNA在ZFP結合位點附近通過核酸酶活性被切割的功能性實體。 參見,例如,Kim等人(1996)Proc Natl Acad Sci USA 93(3): 1156-1160。近來,ZFN已用于 多種生物體中的基因組修飾。參見,例如,美國專利公開20030232410; 20050208489; 20050026157; 20050064474; 20060188987; 20060063231;和國際公開TO 07/014275。同樣 地,TALE DNA結合域融合到核酸酶域以建立TALEN。參見,例如,美國專利No. 8,586,526。 [0112]如上所述,切割域可以與DNA結合域異源,例如鋅指DNA結合域與源自核酸酶的切 割域或TALEN DNA結合域與切割域,或大范圍核酸酶DNA結合域與源自一不同核酸酶的切割 域??梢詮娜魏蝺惹泻怂崦富蛲馇泻怂崦傅玫疆愒辞懈钣???梢匝苌们懈钣虻氖纠詢?切核酸酶包括但不限于限制內切核酸酶和歸巢內切核酸酶。參見,例如,2002_ 2003Catalogue,New England Biolabs,Beverly,MA;和Belfort等人(1997)Nucleic Acids Res. 25: 3379-3388。已知額外的切割DNA的酶(例如,SI核酸酶;綠豆核酸酶;胰臟DNase I; 微球菌核酸酶;酵母H0內切核酸酶;還可以參見Linn等人(編)Nucleases,Cold Spring Harbor Laboratory Press, 1993) 〇一種或多種這些酶(或其功能性片段)可以用為切割域 和切割半域的來源。
[0113]類似地,切割半域可以源自如上所述的切割活性需要二聚合的任何核酸酶或其部 分。一般來說,如果融合蛋白包含切割半域,則兩種融合蛋白需要切割?;蛘?,可以使用一種 包含兩個切割半域的蛋白。這兩個切割半域可以源自相同的內切核酸酶(或其功能性片 段),或各切割半域可以源自一不同內切核酸酶(或其功能性片段)。此外,針對這兩種融合 蛋白的靶位點優(yōu)選地相對彼此配置使得這兩種融合蛋白與其各自的靶位點的結合將切割 半域以空間定向彼此置放而允許切割半域例如通過二聚合形成功能性切割域。因此,在某 些實施方案中,靶位點的近邊由5-8個核苷酸或15-18個核苷酸間隔。然而,任何整數(shù)個核苷 酸或核苷酸對可以位于兩個靶位點之間(例如,2到50個核苷酸對或更多)。一般來說,切割 位點位于靶位點之間。
[0114]限制內切核酸酶(限制酶)存在于許多物種中且能夠與DNA(在識別位點)序列特異 性結合,并在結合位點或結合位點附近切割DNA。某些限制酶(例如,IIS型)在從識別位點移 去的位點切割DNA且具有分開的結合域和切割域。例如,IIS型酶Fok I在一個鏈上從其識別 位點算起第9個核苷酸處和在另一個鏈上從其識別位點算起第13個核苷酸處催化DNA的雙 鏈切割。參見,例如,美國專利5,356,802; 5,436,150和5,487,994;以及Li等人(1992) Proc ·Natl ·Acad.Sci.USA 89 :4275-4279;Li等人(1993)Proc.Natl .Acad. Sci.USA 90: 2764-2768; Kim 等人(1994a)Proc. Natl .Acad. Sci .USA 91:883-887 ; Kim 等人(1994b) J.Biol.Chem.269:31,978-31,982。因此,在一個實施方案中,融合蛋白包含源自至少一種 IIS型限制酶的切割域(或切割半域)和一個或多個可以或可以不經(jīng)過工程改造的鋅指結合 域。
[0115] 切割域可與結合域分離的示例性的IIS型限制酶為Fok I。這種特定的酶與二聚物 一樣具有活性。Bitinaite等人(1998)Proc.Natl.Acad.Sci.USA 95:10,570-10,575。因此, 為本發(fā)明的目的,用于所公開的融合蛋白中的Fok頂每的部分視為切割半域。因此,就細胞 序列的使用鋅指-Fok I融合的靶向雙鏈切割和/或靶向置換來說,兩各包含F(xiàn)okI切割半域 的融合蛋白可以用于識別催化活性切割域?;蛘撸€可以使用單個的含有鋅指結合域和兩 Fok I切割半域的多肽分子。在本文其它地方提供用于使用鋅指-Fok I融合的靶向切割和 靶向序列改變的參數(shù)。
[0116] 切割域或切割半域可以是蛋白的保留切割活性或保留可多聚合(例如,二聚合)以 形成功能性切割域的能力的任何部分。
[0117] 示例性的IIS型限制酶描述在美國專利7,888,121中,所述專利以其全文引用的方 式并入本文。額外的限制酶還包含分開的結合域和切割域,且本發(fā)明包含這些結合域和切 割域。參見,例如,Roberts等人(2003)Nucleic Acids Res.31:418_420〇
[0118] 在某些實施方案中,切割域包含一個或多個防止同源二聚合或降低同源二聚合到 最低的經(jīng)過工程改造的切割半域(也稱為二聚合域突變體),如例如美國專利No. 8,772, 453;8,623,618;8,409,861;8,034,598 ;7,914,796;和7,888,121中所述,所有所述專利的 公開內容以其全文引用的方式并入本文。在Fok I的位置446、447、479、483、484、486、487、 490、491、496、498、499、500、531、534、537和538的氨基酸殘基為用于影響?〇1^1切割半域的 二聚合的全部標靶。
[0119] Fok I的形成專性異二聚物的示例性的經(jīng)過工程改造的切割半域包括第一切割半 域包括在Fok I的位置490和538的氨基酸殘基的突變且第二切割半域包括在氨基酸殘基 486和499的突變的對。
[0120] 因此,在一個實施方案中,在490的突變將Glu(E)改由Lys(K)置換;在538的突變將 Iso(I)改由Lys(K)置換;在486的突變將Gln(Q)改由Glu(E)置換;和在位置499的突變將Iso (I)改由Lys(K)置換。具體來說,通過在一個切割半域中突變位置490(E-K)和538(I-K)以 產生出命名為"Ε490Κ:Ι538Κ"的經(jīng)過工程改造的切割半域及通過在另一切割半域中突變位 置486(Q-E)和499(I-L)以產生出命名為"Q486E:I499L"的經(jīng)過工程改造的切割半域,得 到本文所述的經(jīng)過工程改造的切割半域。本文所述的經(jīng)過工程改造的切割半域為消除異常 切割或降低異常切割到最低的專性異二聚物突變體。參見,例如,美國專利No. 7,914,796和 8,034,598,所述專利的公開內容針對所有目的以其全文引用的方式并入本文。在某些實施 方案中,經(jīng)過工程改造的切割半域包含在位置486、499和496(相對野生型FokI編號)的突 變,例如,位置486的野生型Gln(Q)殘基改由Glu(E)殘基置換的突變、位置499的野生型Iso (I)殘基改由Leu(L)殘基置換的突變和位置496的野生型Asn(N)殘基改由Asp(D)或Glu(E) 殘基置換的突變(也分別稱為"ELD"和"ELE"域)。在其它實施方案中,經(jīng)過工程改造的切割 半域包含在位置490、538和537(相對野生型FokI編號)的突變,例如,位置490的野生型Glu (E)殘基改由Lys(K)殘基置換的突變、位置538的野生型Iso(I)殘基改由Lys(K)殘基置換的 突變、和位置537的野生型His(H)殘基改由Lys(K)殘基或Arg(R)殘基置換的突變(還分別稱 為"KKK"和"KKR"域)。在其它實施方案中,經(jīng)過工程改造的切割半域包含在位置490和537 (相對野生型FokI編號)的突變,例如,位置490的野生型Glu(E)殘基改由Lys(K)殘基置換的 突變和位置537的野生型His(H)殘基改由Lys(K)殘基或Arg(R)殘基置換的突變(還分別稱 為"KIK"和"KIR"域)。參見,例如,美國專利No.8,772,453。在其它實施方案中,經(jīng)過工程改 造的切割半域包含"Sharkey"和/或"Sharkey '"突變(參見Guo等人,(2010) J ·Mo 1 · Biο 1 · 400 (1):96-107)〇
[0121] 可以使用任何合適的方法,例如,如美國專利No. 8,772,453; 8,623,618 ;8,409, 861;8,034,598;7,914,796;和7,888,121中所述,通過野生型切割半域卬〇1^1)的定點突 變,得到本文所述的經(jīng)過工程改造的切割半域。
[0122] 或者,可以在核酸靶位點使用所謂的"裂解酶"技術(參見,例如,美國專利公開 No. 20090068164)活體內組裝核酸酶。這些裂解酶的組分可以在單獨的表達構建體上得以 表達,或可以在一個個別組分例如由自切割2A肽或IRES序列間隔的開放閱讀框架中連接。 這些組分可以是個別鋅指結合域或大范圍核酸酶核酸結合域的域。
[0123] 可以在用于例如如美國專利No.8,563,314中所述的以酵母為基礎的染色體系統(tǒng) 中之前針對活性篩選核酸酶。
[0124] 核酸酶的表達可以在組成型啟動子或誘導型啟動子,例如,在棉子糖和/或半乳糖 的存在下活化(去抑制)但在葡萄糖的存在下抑制的半乳糖激酶啟動子的控制下進行。
[0125] 與Cas9相關的CRISPR/Cas系統(tǒng)包含兩RNA非編碼組分:tracrRNA和包含間隔相同 直接重復(DR)的核酸酶導引序列(間隔序列)的預-crRNA陣列。為使用CRISPR/Cas系統(tǒng)以實 現(xiàn)基因組工程改造,這些RNA的兩種功能必須存在(參見Cong等人,(2013)Sciencexpress 1/10.1126/science 1231143)。在一些實施方案中,tracrRNA和預-crRNA通過單獨的表達 構建體或呈單獨的RNA提供。在其它實施方案中,構建嵌合RNA,其中經(jīng)過工程改造的成熟 crRNA(賦予革E特異性)融合到tracrRNA(與Cas9相互作用)以建立嵌合cr-RNA-tracrRNA雜 交(也稱為單一導引RNA)。(參見Jinek同上和Cong,同上)。
[0126] 靶位點
[0127] 如上詳細描述,DNA域可以經(jīng)過工程改造以與所選任何序列結合。經(jīng)過工程改造的 DNA結合域可以具有相比天然存在的DNA結合域新穎的結合特異性。工程改造方法包括但不 限于理性設計和各種類型的選擇。理性設計包括(例如)使用包含三重(或四重)核苷酸序列 和個別鋅指氨基酸序列的資料庫,其中各三重或四重核苷酸序列與鋅指的與特定三重或四 重序列結合的一個或多個氨基酸序列相關聯(lián)。參見,例如,共同擁有的美國專利6,453,242 和6,534,261,所述專利以其全文引用的方式并入本文。還可以進行了六1^效應子域的理性設 計。參見,例如,美國專利No.8,586,526。
[0128] 可應用于DNA結合域的示例性的選擇方法,包括噬菌體展示和雙雜交系統(tǒng),在美國 專利 5,789,538;5,925,523;6,007,988;6,013,453 ;6,410,248;6,140,466;6,200,759;和 6,242,568;以及WO 98/37186;W0 98/53057;W0 00/27878;W0 01/88197和GB 2,338,237中 公開。此外,對鋅指結合域結合特異性的增強已在例如共同擁有的WO 02/077227中進行描 述。
[0129] 靶位點的選擇;用于設計和構建融合蛋白(和編碼融合蛋白的多核苷酸)的核酸酶 和方法為本領域技術人員已知且詳細述于美國專利申請公開No. 20050064474和 20060188987中,所述公開以其全文引用的方式并入本文。
[0130] 此外,如這些與其它參考文獻中所公開,DNA結合域(例如,多指鋅指蛋白)可以使 用任何合適的連接子序列,包括(例如)5個或更多個氨基酸的連接子連接在一起。關于長為 6個或更多個氨基酸的示例性的連接子序列,參見,例如,美國專利N〇.6,479,626;6,903, 185;和7,153,949。本文所述的蛋白可以包括蛋白的個別DNA結合域之間的合適的連接子的 任何組合。還可以參見美國專利No. 8,586,526。
[0131] 合適的靶基因的非限制性實例包括貝塔(β)球蛋白基因(HBB)、伽瑪(δ)球蛋白基 因(HBG1)、Β細胞淋巴瘤/白血病llA(BCLllA)基因、Kruppel樣因子1 (KLF1)基因、CCR5基因、 CXCR4基因、PPP1R12C (AAVS1)基因、次黃嘌呤磷酸核糖轉移酶(HPRT)基因、白蛋白基因、因 子VIII基因、因子IX基因、富含亮胺酸的重復激酶2(LRRK2)基因、亨廷頓(Htt)基因、視紫紅 質(RH0)基因、囊性纖維化跨膜轉運調節(jié)(CFTR)基因、表面活性蛋白B基因(SFTPB)、T細胞受 體α (TRAC)基因、T細胞受體β(TRBC)基因、程序化細胞死亡1 (PD 1)基因、細胞毒性T淋巴細胞 抗原4 (CTLA-4)基因、人白細胞抗原(HLA)Α基因 、HLA Β基因 、HLA C基因、HLA-DPA基因、HLA-DQ基因、HLA-DRA基因、LMP7基因、與抗原處理相關聯(lián)的轉運體(TAP)l基因、TAP2基因、 tapasin基因(TAPBP)、II類主要組織相容性復合物反式激活因子(CIITA)基因、肌營養(yǎng)不良 蛋白基因(DMD)、糖皮質激素受體基因(GR)、IL2RG基因、Rag-Ι基因、RFX5基因、FAD2基因、 FAD3基因、ZP15基因、KASII基因、MDH基因和/或EPSPS基因。
[0132] 在某些實施方案中,核酸酶靶向"安全港"基因座,諸如,人細胞中的AAVS1、HPRT、 白蛋白和CCR5基因、和鼠細胞中的Rosa26(參見,例如,美國專利No.7,888,121;7,972,854; 7,914,796 ;7,951,925;8,110,379;8,409,861 ;8,586,526;美國專利公開20030232410; 20050208489;20050026157;20060063231;20080159996;201000218264;20120017290; 20110265198; 20130137104; 20130122591; 20130177983 和 20130177960)和植物中的 Zpl5 基 因座(參見美國專利U.S.8,329,986)。
[0133] 供體
[0134] 本發(fā)明涉及HSC/PC的基因組中外源序列的核酸酶介導的靶向整合。如上所述,插 入外源序列(也稱為"供體序列"或"供體"或"轉基因"),例如,以校正突變基因或以增加野 生型基因的表達或以表達轉基因。將輕易地明白供體序列通常與其所放置的基因組序列不 同。供體序列可以包含側懸兩同源區(qū)以允許在受關注的位置有效HDR的非同源序列。另外, 供體序列可以包含包含不與細胞染色質中受關注的區(qū)域同源的序列的載體分子。供體分子 可以包含幾個不連續(xù)的與細胞染色質同源的區(qū)域。例如,就靶向插入通常不存在于受關注 的區(qū)域中的序列來說,所述序列可以存在于供體核酸分子中且側懸與受關注的區(qū)域中的序 列同源的區(qū)域。
[0135] 本文描述靶向插入任何多核苷酸以插入所選位置中的方法。用于插入的多核苷酸 也可以稱為"外源"多核苷酸、"供體"多核苷酸或分子或"轉基因"。所述供體多核苷酸可以 是DNA、單鏈和/或雙鏈的且可以呈直鏈或圓環(huán)形式被引入到細胞中。參見,例如,美國專利 公開No. 20100047805和20110207221。所述供體序列還可以呈可以呈圓形或直鏈形式被引 入到細胞中的DNA MC形式被引入。如果呈直鏈形式被引入,則可以通過本領域技術人員已 知的方法保護供體序列的末端(例如,以防外切核酸酶降解)。例如,將一個或多個雙脫氧核 苷酸殘基新增到直鏈分子的3 '端和/或將自互補寡核苷酸拼接到一段或兩端。參見,例如, Chang等人(1987)Proc · Natl · Acad · Sci · USA 84:4959-4963 ;Nehls等人(1996)Science 272:886-889。額外的用于保護外源多核苷酸以防降解的方法包括但不限于新增末端氨基, 及使用經(jīng)過修飾的核苷酸間連接,諸如(例如)硫代磷酸酯、氨基磷酸酯和0-甲基核糖或脫 氧核糖殘基。如果呈雙鏈形式被引入,則供體可以包括一個或多個核酸酶靶位點,例如,側 懸打算整合到細胞基因組中的轉基因的核酸酶靶位點。參見,例如,美國專利公開 No.20130326645。
[0136] 可以將多核苷酸引入到細胞中作為具有額外的序列的載體分子的一部分,諸如 (例如)復制起點、啟動子和編碼抗生素抗性的基因。此外,供體多核苷酸可以呈裸核酸、呈 與試劑諸如脂質體、納米粒子或泊洛沙姆(P〇 1 oxamer)復合的核酸引入,或可以由病毒(例 如,腺病毒、AAV、皰疹病毒、逆轉錄病毒、慢病毒和整合酶缺陷型慢病毒(IDLV))遞送。
[0137] 在某些實施方案中,雙鏈供體包括長度大于lkb,例如,在2與200kb之間、在2與 lOkb之間(或其間的任何值)的序列(例如,編碼序列,也稱為轉基因)。雙鏈供體還包括例如 至少一個核酸酶靶位點。在某些實施方案中,例如,就一對ZFN或TALEN來說,供體包括至少2 個靶位點。通常,就切割轉基因來說,核酸酶靶位點在轉基因序列外(例如,轉基因序列的5 ' 和/或3')。核酸酶切割位點可以針對任何核酸酶。在某些實施方案中,包含于雙鏈供體中的 核酸酶靶位點是針對用于切割其中通過同源無關方法整合經(jīng)過切割的供體的內源靶的相 同核酸酶來說的。
[0138] -般插入供體以在整合位點由內源啟動子(即,驅動插入供體的內源基因的表達 的啟動子(例如,球蛋白、AAVS1等))驅動供體的表達。然而,應明白所述供體可以包含啟動 子和/或增強子,例如,組成型啟動子或誘導型或組織特異性啟動子。
[0139] 可以將供體分子插入到內源基因中以表達所有、部分內源基因或不表達內源基 因。在其它實施方案中,將轉基因(例如,包含或不含肽編碼序列)整合到任何內源基因座 (例如安全港基因座)中。參見,例如,美國專利公開20080299580; 20080159996和 201000218264。
[0140] 另外,雖然不需要表達,但外源序列還可以包括轉錄或翻譯調節(jié)序列,例如,啟動 子、增強子、絕緣子、內部核糖體進入位點、序列編碼2A肽和/或聚腺核苷酸化信號。另外,可 以包括剪接受體序列。示例性的剪接受體位點序列為本領域技術人員已知且包括(僅舉例 來說)CTGACCTCTTCTCTTCCTCCCACAG(SEQ ID N0: 29)(源自人類HBB基因)和TTTCTCTCCACAG (SEQ ID N0:30)(源自人類免疫球蛋白-γ基因)。
[0141] 可以使用本領域中已知的標準技術諸如PCR從質體、細胞或其它來源分離得本文 所述供體序列上所攜載的轉基因。適用的供體可以包括各種類型的拓撲,包括圓形超螺旋、 圓形松弛、線性等?;蛘?,它們可以使用標準寡核苷酸合成技術來化學合成。此外,供體可以 進行甲基化或不進行甲基化。供體可以呈細菌或酵母人工染色體(BAC或YAC)形式。
[0142] 本文所述的雙鏈供體多核苷酸可以包括一個或多個非天然堿基和/或主鏈。特定 來說,可以采用本文所述的方法進行供體分子中甲基化胞嘧啶的插入以實現(xiàn)受關注的區(qū)域 中轉錄靜止的狀態(tài)。
[0143] 外源(供體)多核苷酸可以包含任何受關注的序列(外源序列)。示例性的外源序列 包括但不限于任何多肽編碼序列(例如,cDNA或其片段)、啟動子序列、增強子序列、表位標 簽、標記基因、切割酶識別位點和各種類型的表達構建體。標記基因包括但不限于介導抗生 素抗性(例如,氨芐西林抗性、新霉素抗性、G418抗性、嘌呤霉素抗性)的序列編碼蛋白、序列 編碼有色或熒光或發(fā)光蛋白(例如,綠色熒光蛋白、增強型綠色熒光蛋白、紅色熒光蛋白、熒 光素酶)和介導增強型細胞生長和/或基因擴增的蛋白(例如,二氫葉酸還原酶)。表位標簽 包括(例如)FLAG、Hi s、myc、Tap、HA或任何可檢測的氨基酸序列的一個或多個拷貝。
[0144] 在一個優(yōu)選的實施方案中,外源序列(轉基因)包含編碼任何需要在細胞中表達的 多肽的多核苷酸,包括但不限于抗體、抗原、酶、受體(細胞表面或細胞核)、激素、淋巴因子、 細胞激素、報導子多肽、生長因子和任何上述的功能性片段。所述編碼序列可以是例如 cDNA。所述外源序列還可以是轉基因的用于與受關注的內源基因序列連接的片段。例如,轉 基因的在受關注的基因的3'端包含序列的片段可以通過插入或置換用于校正編碼內源基 因序列的3'端中突變的序列。類似地,所述片段可以包含類似于內源基因的5'端的用于插 入/置換內源序列以校正或修飾這些內源序列的序列。另外,所述片段可以編碼用于在原位 連接到內源基因序列以產生融合蛋白的受關注的功能性域(催化、分泌或類似)。
[0145] 例如,所述外源序列可以包含編碼罹患遺傳病的受試者中所缺少或無功能性的多 肽的序列,所述遺傳病包括但不限于任何以下遺傳病:軟骨發(fā)育不全、全色盲、酸性麥芽糖 酵素缺乏、腺苷脫氨酶缺乏癥(OMIM No. 102700)、腎上腺腦白質營養(yǎng)不良、艾氏綜合征 (aicardi syndrome)、α-l抗胰蛋白酶缺乏癥、α-地中海貧血、雄激素不敏感綜合征、阿佩爾 氏綜合癥(apert syndrome)、致心律失常型右室發(fā)育不全、毛細血管擴張性共濟失調、巴氏 綜合征(barth syndrome)、β_地中海貧血、藍色橡皮泡癒綜合征、卡納萬病(canavan disease)、慢性肉芽腫病(CGD)、貓叫綜合征、囊性纖維化、德爾肯病(dercum' s disease)、 外胚層發(fā)育不良、范可尼貧血(fanconi anemia)、進行性肌肉骨化癥、脆性X染色體綜合征、 半乳糖血癥、高雪氏病(Gaucher ' s disease)、全身型神經(jīng)節(jié)苷脂積病(例如,GM1 )、血色 素沉著病、β球蛋白第6個密碼子中的血紅蛋白C突變(HbC)、血友病、亨廷頓氏病 (Huntington ' s disease)、赫爾勒綜合征(Hurler Syndrome)、低磷酸酶癥、克氏綜合征 (Klinef leter syndrome)、克拉貝?。↘rabbes Disease)、蘭-吉綜合征(Langer-Giedion Syndrome)、白細胞粘附缺陷病(LAD,0M頂No. 116920)、腦白質營養(yǎng)不良、長QT綜合征、馬凡 綜合征(Marfan syndrome)、莫比斯綜合征(Moebius syndrome)、粘多糖積癥(MPS)、指甲 髕骨綜合征、腎性尿崩癥、神經(jīng)纖維瘤病、尼曼-匹克病(Neimann-Pick disease)、成骨不全 癥、卟啉癥、普瑞德-威利綜合征(Prader-Wi 11 i syndrome)、早衰癥、變形綜合征、視網(wǎng)膜母 細胞瘤、雷特綜合征(Rett syndrome )、魯賓斯坦-泰比綜合征(Rubinstein-Taybi syndrome)、沙費利波綜合征(Sanfilippo syndrome)、重癥聯(lián)合免疫缺陷癥(SCID)、舒瓦克 曼綜合征(Shwachman syndrome)、鐮狀細胞病(鐮狀細胞性貧血)、史密斯-馬吉利綜合癥 (Smith-Magenis syndrome)、斯蒂克勒綜合征(Stickler syndrome)、戴薩克斯癥(Tay-Sachs disease)、血小板減少-燒骨缺失(TAR)綜合征、特雷徹柯林斯綜合征(Treacher Collins syndrome)、三體癥、結節(jié)性硬化癥、特納氏綜合征(Turner ' s syndrome)、尿素循 環(huán)障礙、合并希-林病(von Hippel-Landau disease)、瓦登伯革綜合癥(Waardenburg syndrome)、威廉氏綜合征(Williams syndrome)、威爾森氏癥(Wilson's disease)、維斯科 特-奧爾德里奇綜合征(Wiskott-Aldrich syndrome)、X連鎖淋巴細胞增殖綜合征(XLP, OMIM No.308240)。
[0146] 額外的可通過靶向整合治療的示例性的疾病包括后天免疫缺陷、溶酶體貯積病 (例如,高雪氏病、GM1、法布里病(Fabry disease)和戴薩克斯癥)、粘多糖癥(例如亨特氏病 (Hunter ' s disease)、赫爾勒氏?。℉urler ' s disease))、血紅蛋白病(例如,鐮狀細胞病、 HbC、a-地中海貧血、β-地中海貧血)和血友病。
[0147] 在某些實施方案中,外源序列可以包含允許選擇已經(jīng)過靶向整合的細胞的標記基 因(如上所述)、和編碼額外功能性的連接的序列。標記基因的非限制性實例包括GFP、藥物 選擇標記等。
[0148] 可以插入的額外的基因序列可以包括(例如)野生型基因以置換突變的序列。例 如,可以將野生型因子IX基因序列插入到基因的內源拷貝經(jīng)過突變的干細胞的基因組中。 野生型拷貝可以在內源基因座插入,或可以替代性地靶向于安全港基因座。
[0149] 遵循本說明書的教導,這些表達盒的構建采用分子生物學領域中熟知的方法(參 見,例如,Ausubel或Maniatis)。在使用表達盒以得到轉基因動物之前,可以通過引入表達 盒到合適的細胞系(例如,初級細胞、經(jīng)過轉變的細胞或永生化細胞系)中來測試表達盒對 與所選控制元件相關聯(lián)的壓力誘發(fā)子的反應性。
[0150] 此外,雖然不需要表達,但外源序列還可以是轉錄或翻譯調節(jié)序列,例如,啟動子、 增強子、絕緣子、內部核糖體進入位點、編碼2A肽和/或聚腺苷核酸化信號的序列。另外,受 關注的基因的控制元件可以有效地連接到報導子基因以建立嵌合基因(例如,報導子表達 盒)。
[0151] 還可以實現(xiàn)非編碼核酸序列的靶向插入。編碼反義RNA、RNAi、shRNA和微RNA (miRNA)的序列還可以用于靶向插入。
[0152] 在額外的實施方案中,供體核酸可以包含為額外的核酸酶設計的特異性靶位點的 非編碼序列。接著,額外的核酸酶可以在細胞中得以表達,因此,初始供體分子被切割且通 過插入另一受關注的供體分子修飾。依此方式,可以發(fā)生供體分子的反復整合而允許在受 關注的特定基因座或在安全港基因座特性堆積。
[0153] 可以在核酸酶引入到細胞之前、同時或之后遞送供體。在某些實施方案中,與核酸 酶同時地遞送供體。在其它實施方案中,在核酸酶之前,例如,先于供體幾秒到幾小時到幾 天,包括但不限于先于核酸酶1到60分鐘(或其間的任何時間)、先于核酸酶1到24小時(或其 間的任何時間)或先于核酸酶24小時以上,遞送供體。在某些實施方案中,在核酸酶之后,優(yōu) 選地在4小時內,遞送供體。
[0154] 可以使用與核酸酶相同的遞送系統(tǒng)遞送供體。當同時地遞送時,供體和核酸酶可 以在相同載體(例如AAV載體(例如AAV6))上。在某些實施方案中,使用AAV載體遞送供體及 核酸酶呈mRNA形式進行遞送。
[0155] 細胞
[0156] 因此,本文提供包含轉基因(包括在細胞中表達功能性蛋白的轉基因)的經(jīng)過基因 修飾的細胞,例如,初級HSC/PC或T細胞。還提供由本文所述的方法產生出的細胞。使用一種 或多種核酸酶以針對性方法將轉基因整合到細胞基因組中。在某些實施方案中,將轉基因 整合到安全港基因中。
[0157] 不同于隨機整合,靶向整合確保將轉基因整合到特定的基因或基因座中??梢詫?轉基因整合到靶基因的任何地方。在某些實施方案中,將轉基因整合在核酸酶切割位點或 核酸酶切割位點附近,例如,切割位點上游或下游的1 - 3 0 0 (或其間的任何值)個堿基對以 內,更優(yōu)選地切割位點任一側的1-100各堿基對(或其間的任何值)以內,甚至更優(yōu)選地切割 位點任一側的1到50個堿基對(或其間的任何值)以內。在某些實施方案中,整合的包含轉基 因的序列不包括任何載體序列(例如,病毒載體序列)。
[0158] 可以如本文所述對任何細胞類型包括但不限于細胞和細胞系基因修飾。如本文所 述的細胞的其它的非限制性實例包括T細胞(例如,CD4+、CD3+、CD8+等);樹突細胞;B細胞; 自體(例如,源自患者的)或異源多潛能、全能或多能干細胞(例如,CD34+細胞、誘導型多潛 能干細胞(iPSC)、胚胎干細胞或類似細胞)。在某些實施方案中,如本文所述的細胞為源自 罹患需要治療的疾病的患者的CD34+細胞。
[0159] 如本文所述的細胞適用于例如通過間接活體內療法治療和/或預防疾病。經(jīng)過核 酸酶修飾的細胞可以經(jīng)過增殖且接著采用標準技術重新引入到患者中。參見,例如,Tebas 等人(2014)New Eng J Med 370(10) :901。就干細胞來說,在融合到受試者中之后,還發(fā)生 這些前體細胞活體內分化為表達功能性轉基因的細胞。還提供包含如本文所述的細胞的藥 物組合物。此外,可以在投與患者前冷凍保存所述細胞。
[0160] 遞送
[0161] 核酸酶、編碼這些核酸酶的多核苷酸、供體多核苷酸和包含本文所述的蛋白質和/ 或多核苷酸的組合物可以在活體內或間接活體內通過任何合適的方法遞送到任何細胞類 型中。
[0162] 合適的細胞包括真核(例如,動物)和原核細胞和/或細胞系。由這些細胞產生的這 些細胞或細胞系的非限制性實例包括⑶S、CH0 (例如,(:!10-3、(^0-1(1、(^0-0644、(:!10-DUXBll、CH0-DUKX、CH0KlSV)、VER0、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Agl4、HeLa、HEK293(例如,HEK293-F、HEK293-H、HEK293-T)和 perC6 細胞以及昆蟲細胞(諸如 草地夜蛾(Spodoptera fugiperda) (Sf))或真菌細胞(諸如酵母屬(Saccharomyces)、畢赤 酵母屬(Pichia)和裂殖酵母屬(Schizosaccharomyces))。在某些實施方案中,所述細胞系 為CHO、MDCK或HEK293細胞系。合適的細胞還包括干細胞,諸如(舉例來說)胚胎干細胞、誘導 型多潛能干細胞、造血干細胞、神經(jīng)元干細胞和間質干細胞。
[0163] 遞送本文所述的核酸酶的方法描述在例如美國專利No. 6,453,242; 6,503,717; 6, 534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013, 219;和7,163,824中,所述所有專利的公開內容以其全文引用的方式并入本文。
[0164] 如本文所述的核酸酶和/或供體構建體還可以使用包含編碼ZFN、TALEN或CRIPSR/ Cas系統(tǒng)中的一個或多個系統(tǒng)的序列的載體遞送??梢允褂萌魏屋d體系統(tǒng),包括但不限于質 體載體、反轉錄病毒載體、慢病毒載體、腺病毒載體、痘病毒載體;皰疹病毒載體和腺相關病 毒載體等。還可以參見,美國專利 Ν〇·6,534,261;6,607,882;6,824,978;6,933,113;6,979, 539;7,013,219;和7,163,824,所述專利以其全文引用的方式并入本文。此外,應明白所有 這些載體可以包含為治療所需要的序列中的一個或多個序列。因此,當在將一種或多種核 酸酶和供體構建體引入到細胞中時,核酸酶和/或供體多核苷酸可以攜載于相同載體或不 同載體(DNA MC)上。當在使用多個載體時,各載體可以包含編碼一種或多種核酸酶和/或供 體構建體的序列。
[0165] 常規(guī)的病毒和非病毒基因轉移方法可以用于將編碼核酸酶和供體構建體的核酸 引入細胞(例如,哺乳動物細胞)和靶組織中。非病毒載體遞送系統(tǒng)包括DNA或RNA質體、DNA MC、裸核酸和與遞送媒介諸如脂質體、納米粒子或泊洛沙姆復合的核酸。病毒載體遞送系統(tǒng) 包括在遞送到細胞后具有游離型或整合型基因組中任何一種的DNA和RNA病毒。關于活體內 遞送經(jīng)過工程改造的DNA結合蛋白和包含這些結合蛋白的融合蛋白的評論,參見,例如, Rebar(2004)Expert Opinion Invest.Drugs 13(7) :829_839;Rossi等人(2007)Nature Biotech.25( 12) :1444-1454以及一般基因遞送參考文獻,諸如Anderson,Science 256: 808-813(1992);Nabel&Felgner,TIBTECH 11:211-217(1993);Mitani&Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature 357:455-460 (1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer&Perricaudet,British Medical Bulletin 51 (1): 31-44( 1995);Haddada等人,Current Topics in Microbiology and Immunology Doerfler與.-BdhmK編)(1995);和Yu等人,Gene Therapy 1:13-26(1994)。
[0166] 核酸的非病毒遞送方法包括電穿孔、脂質體轉染、微量注射、基因槍、病毒體、脂質 體、免疫脂質體、其它納米粒子、聚陽離子或脂質:核酸偶聯(lián)物、裸DNA、人工病毒粒子和DNA 的經(jīng)過試劑增強的吸收。使用例如Soni tron 2000系統(tǒng)(Ri ch-Mar)的聲致穿孔還可以用于 遞送核酸。
[0167] 額外的示例性的核酸遞送系統(tǒng)包括那些由Amaxa Biosystems ( Co logne, Germany)、Maxcyte,Inc·(Rockville,Maryland)、BTX Molecular Delivery Systems (Hoi 1 iston,MA)和Copernicus Therapeutics Inc(參見(例如)US6008336)提供的系統(tǒng)。月旨 質體轉染描述在例如美國專利No. 5,049,386; 4,946,787;和4,897,355)中及脂質體轉染試 劑在商業(yè)上進行銷售(例如,Transfectam?和Lipofectin?)。適用于多核苷酸的有效受體 識別脂質體轉染的陽離子和中性脂質包括Feigner,W0 91/17424,W0 91/16024的那些脂 質。
[0168] 脂質:核酸復合物(包括靶向脂質體,諸如免疫脂質復合物)的制備為本領域技術 人員所熟知(參見,例如,Crystal,Science 270:404-410(1995) ;Blaese等人,Cancer Gene Ther · 2 : 291-297( 1995); Behr等人,Biocon jugate Chem. 5:382-389(1994); Remy等人, Bioconjugate Chem.5:647_654(1994);Gao等人,Gene Therapy 2:710-722(1995) ;Ahmad 等人,Cancer Res.52:4817-4820( 1992);美國專利No.4,186,183、4,217,344、4,235,871、 4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。
[0169] 額外的遞送方法包括使用包裝打算遞送到EnGeneIC遞送媒介(EDV)中的核酸。這 些EDV具體來說是使用抗體的一個臂對靶組織具特異性而另一個臂對EDV具有特異性的雙 特異性抗體而特異性遞送到靶組織。所述抗體將H)V帶到靶細胞表面且接著通過內吞將EDV 帶到細胞中。一旦位于細胞中,即釋放內含物(參見MacDiarmid等人(2009)Nature Biotechnology 27(7):643)〇
[0170] 使用以RNA或DNA病毒為基礎的系統(tǒng)以遞送編碼經(jīng)過工程改造的ZFP、TALE和/或 CRISPR/Cas系統(tǒng)的核酸利用用于將病毒靶向體內特定細胞且運輸病毒有效負載到細胞核 的高度進化方法。病毒載體可以直接地投與患者(活體內)或它們可以用于活體外處理且將 經(jīng)過修飾的細胞投與患者(間接活體內)。常規(guī)的用于遞送ZFP的基于病毒的系統(tǒng)包括但不 限于用于基因轉移的反轉錄病毒、慢病毒、腺病毒、腺相關病毒、牛痘病毒和單純皰疹病毒 載體。利用反轉錄病毒、慢病毒和腺相關病毒基因轉移方法,寄主基因組中的整合是可行 的,通常引起插入的轉基因的長期表達。另外,已在許多不同細胞類型和靶組織中觀察到高 轉導效率。
[0171] 可以通過并入外源包膜蛋白改變反轉錄病毒的向性,從而擴大靶細胞的潛在靶群 體。慢病毒載體為能夠傳導或感染非分裂細胞且通常產生高病毒效價的反轉錄病毒載體。 反轉錄病毒基因轉移系統(tǒng)的選擇取決于靶組織。反轉錄病毒載體由具有對多達6-10kb外來 序列的包裝容量的順式起作用的長末端重復序列組成。最少量的順式起作用的LTR足以復 制并包裝載體,所述載體接著用于將治療劑整合到靶細胞中以提供永久的轉基因表達。廣 泛使用的反轉錄病毒載體包括那些以鼠白血病病毒(MuLV)、長臂猿白血病病毒(GaLV)、猿 免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)和其組合為主的反轉錄病毒載體(參見,例如, Buchscher等人,J. Virol .66:2731-2739(1992); Johann等人,J. Virol .66:1635-1640 (1992); Sommerfelt等人,Virol .176:58-59( 1990);Wilson等人,J. Virol .63:2374-2378 (1989) ;Miller等人,J· Virol · 65:2220-2224( 1991) ;PCT/US94/05700)。
[0172] 在暫態(tài)表達為優(yōu)選的應用中,可以使用以腺病毒為主的系統(tǒng)。以腺病毒為主的載 體在許多細胞類型中能夠極高效率地轉導而不需要細胞分裂。就這些載體來說,已實現(xiàn)高 效價且高水平的表達。可以在相對簡單的系統(tǒng)中大量產生這種載體。例如,在活體外產生核 酸和肽中,及就活體內和間接活體內基因療法程序來說,腺相關病毒("AAV")載體還用于轉 導具有靶核酸的細胞(參見,例如,West等人,Virology 160: 38-47(1987);美國專利No. 4, 797,368;W0 93/24641;Kotin , Human Gene Therapy 5:793-801(1994);Muzyczka, J.Clin. Invest.94:1351 (1994)。重組AAV載體的構建描述在許多公開中,包括美國專利 No. 5,173,414;Tratschin等人,Mol .Cell .Biol .5:3251-3260(1985) ;Tratschin等人, Mol·Cell·Biol·4:2072-2081(1984);Hermonat&Muzyczka,PNAS 81:6466-6470(1984);和 Samulski等人,J· Virol · 63:03822-3828( 1989)。
[0173] 目前有至少六種病毒載體方法可用于臨床試驗中的基因轉移,所述臨床試驗采用 涉及由插入到輔助細胞系中以產生轉導劑的基因互補缺陷型載體的方法。
[0174] pLASN和MFG-S為已用于臨床試驗中的反轉錄病毒載體的實例(Dunbar等人,Blood 85:3048-305(1995) ;Kohn等人,Nat .Med. 1:1017-102(1995) ;Malech等人,PNAS 94:22 12133-12138(1997) hPASH/pLASN為用于基因療法試驗中的第一治療性載體。(Blaese等 人,Science 270:475-480(1995))。就MFG-S包裝載體來說觀察到50%或更高的轉導效率。 (Ellem 等人,Immunol Immunother. 44( 1): 10-20( 1997) ;Dranoff等人,Hum .Gene Ther. 1: 111-2(1997)。
[0175] 重組型腺相關病毒載體(rAAV)為有前景的以缺陷和非致病性細小病毒腺相關2型 病毒為主的替代性基因遞送系統(tǒng)。所有載體均源自僅保留AAV 145bp側懸轉基因表達盒的 末端反向重復序列的質體。由于整合到經(jīng)過轉導的細胞的基因組中引起的有效的基因轉移 和穩(wěn)定的轉基因遞送是這種載體系統(tǒng)的關鍵特征。(Wagner等人,Lancet 351:9117 1702-3 (1998),1^3?18等人,66116 11^^.9:748-55(1996))。還可以根據(jù)本發(fā)明使用其它的六六¥血清 型,包括 AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9 和 AAVrh · 10 和任何新穎的 AAV 血清型。在一些實施方案中,使用嵌合AAV,其中病毒核酸的LTR序列的病毒來源與衣殼序列 的病毒來源不同。實例包括具有源自AAV2的LTR和源自AAV5、AAV6、AAV8或AAV9的衣殼(即, 分別為 AAV2/5、AAV2/6、AAV2/8 和 AAV2/9)的嵌合病毒。
[0176] 復制缺陷性重組腺病毒載體(Ad)可以在高效價產生且輕易地感染多種不同細胞 類型。大多數(shù)腺病毒載體經(jīng)過工程改造使得轉基因置換Ad Ela、Elb和/或E3基因;隨后,復 制缺陷性載體在提供反式消除基因功能的人293細胞中傳播。Ad載體可以活體內轉導多種 類型的組織,包括非分裂、分化細胞,諸如那些在肝臟、腎臟和肌肉中發(fā)現(xiàn)的細胞。常規(guī)的Ad 載體具有大的攜載容量。臨床試驗中使用Ad載體的實例涉及用于肌肉內注射抗腫瘤免疫接 種的多核苷酸療法(Sterman等人,Hum.Gene Ther.7:1083-9(1998))。臨床試驗中使用腺病 毒載體以進行基因轉移的額外的實例包括Rosenecker等人,Infection 24:1 5-10(1996); Sterman等人,Hum.Gene Ther.9:7 1083-1089(1998) ;Welsh等人,Hum.Gene Ther.2:205_ 18( 1995);Alvarez等人,Hum.Gene Ther · 5:597-613( 1997) ;Topf等人,Gene Ther · 5:507-513( 1998); Sterman等人,Hum.Gene Ther · 7:1083-1089( 1998) 〇
[0177] 包裝細胞用于形成能夠感染寄主細胞的病毒顆粒。這些細胞包括包裝AAV和腺病 毒的293細胞、和包裝反轉錄病毒的Φ2細胞或PA317細胞。用于基因療法中的病毒載體通常 由包裝核酸載體在病毒顆粒中的生產細胞系產生。所述載體通常包含包裝且隨后整合到寄 主(如果適用)中所需要的最小病毒序列、其它的由編碼打算表達的蛋白的表達盒置換的病 毒序列。缺失的病毒功能由包裝細胞系反式提供。例如,用于基因療法中的AAV載體通常僅 具有源自包裝且插入到寄主基因組中所需要的AAV基因組的末端反向重復(ITR)序列。將病 毒DNA包裝在細胞系中,其包含編碼其它AAV基因(即rep和cap)但缺少ITR序列的輔助質體。 所述細胞系還受到作為輔助的腺病毒感染。所述輔助病毒啟動AAV載體的復制和AAV基因從 輔助質體的表達。輔助質體因缺少ITR序列而無法顯著量地被包裝。通過例如腺病毒相比 AAV更敏感的熱處理降低受腺病毒污染。在一些實施方案中,使用桿狀病毒表達系統(tǒng)產生出 AAV〇
[0178] 在許多基因療法應用中,希望基因療法載體以高度特異性被遞送到特定組織類 型。因此,病毒載體可以通過表達呈融合蛋白的病毒的外表面上具有病毒外殼蛋白的配體 修飾以對指定的細胞類型具有特異性。選擇對已知存于受關注的細胞類型上的受體具有親 和力的配體。例如,Han等人,Proc.Natl.Acad.Sci .USA 92:9747-9751(1995)報告稱莫洛尼 氏鼠白血病病毒可以經(jīng)過修飾以表達融合到gp70的人調節(jié)蛋白,及重組病毒感染某些表達 人表皮生長因子受體的人乳癌細胞。這種原理可以延伸到其它病毒靶細胞對,其中所述靶 細胞表達受體及所述病毒表達包含針對細胞表面受體的配體的融合蛋白。例如,絲狀噬菌 體可以經(jīng)過工程改造以展示對幾乎任何所選細胞受體具有特定結合親和力的抗體片段(例 如,F(xiàn)AB或Fv)。雖然上述描述主要應用于病毒載體,但相同的原理可以應用于非病毒載體。 這些載體可以經(jīng)過工程改造以包含有利于由特定靶細胞吸收的特定的吸收序列。
[0179] 可以通過投與個別患者,如下所述,通常通過全身投與(例如,靜脈內、腹膜內、肌 肉內、真皮下、或顱內注射)或局部施用,來活體內遞送基因療法載體?;蛘撸梢蚤g接活體 內遞送載體到細胞,諸如從個別患者組織的細胞(例如,淋巴細胞、骨髓穿刺液、組織活檢) 或萬能供體造血干細胞,接著通常在選擇已并有載體的細胞后將所述細胞重新植入患者。
[0180] 包含核酸酶和/或供體構建體的載體(例如,反轉錄病毒、腺病毒、脂質體等)還可 以直接投與生物以活體內轉導細胞?;蛘?,可以投與裸DNA。通過通常用于引入分子最終與 血液或組織細胞接觸的任何途徑投與,包括但不限于注射、輸注、局部施用和電穿孔。投與 這些核酸的合適的方法可用且為本領域技術人員所熟知,及雖然可以使用多于一種途徑以 投與特定組合物,但特定途徑可能通常通過相比另一途徑更直接且更有效的反應。
[0181] 本文所述的適用于引入多核苷酸的載體(例如,核酸酶編碼和/或雙鏈供體)包括 非整合性慢病毒載體(IDLV)。參見,例如,Ory等人(1996)Proc .Natl. AcacL Sci .USA 93 : 11382-11388 ;Dull等人(1998)J. Virol .72:8463-8471 ;Zuffery等人(1998)J. Virol .72: 9873-9880;Follenzi等人(2000)Nature Genetics 25:217-222;美國專利公開No 2009/ 054985〇
[0182] 部分地通過投與的特定組合物以及通過用于投與組合物的特定方法來判定可藥 用載劑。因此,如下文所述,存在多種合適的可用藥物組合物的調配物(參見,例如, Remington's Pharmaceutical Sciences,第17版,1989)〇
[0183] 應明白可以使用相同或不同系統(tǒng)來遞送核酸酶編碼序列和供體構建體。例如,核 酸酶和供體可以由相同DNA MC攜載?;蛘?,供體多核苷酸可以由MC攜載,而一種或多種核酸 酶可以由標準質體或AAV載體攜載。此外,可以通過相同或不同途徑(肌肉內注射、尾靜脈注 射、其它靜脈內注射、腹膜內投與和/或肌肉內注射投與不同載體??梢酝瑫r或按任何連續(xù) 順序遞送所述載體。
[0184] 因此,本公開內容包括活體內或間接活體內治療適合插入編碼治療性蛋白的轉基 因的疾病和病狀,例如,通過核酸酶介導整合凝血因子諸如因子VIII (F8)來治療血友病。所 述組合物以可有效實現(xiàn)血清或靶器官或細胞中所需濃度的治療性多肽的量投與人類患者。 可以通過將多核苷酸遞送到所需靶細胞的任何方法投與。例如,涵蓋活體內和間接活體內 方法。門靜脈的靜脈內注射是一種優(yōu)選的投與方法。其它的活體內投與模式包括(例如)直 接注射到肝葉或膽管中和靜脈內注射到遠端肝(包括通過肝動脈),直接注射到肝實質中 (通過肝動脈注射),和/或通過膽管樹逆行注射。離體投與模式包括活體外轉導切除的肝細 胞或肝臟的其它細胞,接著輸注經(jīng)過轉導、切除的肝細胞回到人類患者的門靜脈管系統(tǒng)、肝 實質或膽管樹中,參見,例如,Grossman等人,(1994)Nature Genetics ,6:335-341。
[0185] 待投與的核酸酶和供體的有效量將根據(jù)患者和受關注的治療性多肽改變。因此, 最好由醫(yī)生判定投與組合物的有效量及可以由本領域技術人員輕易地確定合適的劑量。在 允許整合和表達足夠的時間(例如,通常4-15天)后,治療性多肽的血清或其它組織水平的 分析及與投與前初始水平的比較將判定投與的量是過低、在正確的范圍內或過高。就初始 投與和隨后的投與來說合適的方案也是可變的,但通常是通過初始投與,接著視需要進行 隨后的投與。隨后的投與可以以范圍從每日到每年到每幾年的可變時間間隔進行投與。本 領域技術人員應明白可以建議合適的免疫抑制技術以避免因遞送載體的免疫抑制作用而 抑制或阻斷轉導,參見,例如,Vilquin等人,(1995)Human Gene Ther.,6:1391-1401。
[0186] 適于離體和活體內投與的調配物包括呈液體或乳化液體形式的懸浮液。通常將活 性成分與可藥用且與所述活性成分相容的賦形劑混合。合適的賦形劑包括(例如)水、鹽水、 葡萄糖、甘油、乙醇等和其組合。此外,所述組合物可以包含少量的輔助物質,諸如,潤濕劑 或乳化劑、pH緩沖劑、穩(wěn)定劑或其它的提高藥物組合物的有效性的試劑。
[0187] 隨后的實例涉及本發(fā)明的示例性的實施方案,其中核酸酶包括鋅指核酸酶(ZFN)、 TALEN或CRISPR/Cas核酸酶系統(tǒng)。應明白這僅出于舉例的目的,可以使用其它核酸酶,例如 Ttago系統(tǒng)、具有經(jīng)過工程改造的DNA結合域的歸巢內切核酸酶(大范圍核酸酶)和/或經(jīng)過 工程改造的歸巢內切核酸酶(大范圍核酸酶)DNA結合域和異源切割域的天然存在的融合 和/或大范圍核酸酶和TALE蛋白的融合。
[0188] 實施例
[0189] 實施例1:鋅指核酸酶的組裝
[0190] ZFN相對人CCR5和AAVS1基因進行組裝且通過如Mi 1 ler等人(200 7 ) Nat.Biotechnol.25:778-785中所述的ELISA和CELl分析測試。關于CCR5特異性ZFN,參見美 國專利No. 7,951,925,關于AAVS1特異性ZFN,參見美國專利No. 8,110,379,所述兩專利以引 用的方式并入本文。
[0191] 實施例2:將AAV-GFP供體遞送到⑶34+細胞
[0192] 為測試AAV用作用于遞送供體分子到CD34+系統(tǒng)的媒介,評估四種不同AAV血清型。 構建攜載插在血清型特異性LTR之間的CMV驅動的eGFP轉基因的AAV載體。所測試的AAV血清 型包括AAV2/5、AAV2/6、AAV2/8和AAV2。在這些AAV載體中,編碼核酸序列的所有ZFN側懸 △△¥21了1?,且接著使用分別源自44¥5、6或8的衣殼蛋白封裝。(參見64臟和1(&7(2003) Current Gene Therapy 3:281-304)。
[0193] 包含病毒顆粒的供體的產生通過使用HEK293系統(tǒng)采用本領域標準方法制備進行 (See Li等人,同上,參見(例如)US6723551)。用指定的包含CMV驅動的eGFP轉基因的AAV載 體通過在AAV載體的存在下培養(yǎng)細胞轉導源自G-CSF移動式白血球分離術且通過使用 Milenyi CliniMACS系統(tǒng)(Miltenyi Biotech,Germany)陽性選擇進行純化的流通外周血液 CD34+細胞UPBCD34+)。接著在感染后第2天和第5天(dpi)收集細胞且使用流式細胞儀 (Guava,Mi 11 ipore)依制造商方案分析GFP表達。
[0194] 如圖1中所展示的結果證實在這些條件中AAV2/6-GFP供體顆粒能夠產生相比經(jīng)過 其它AAV血清型轉導的細胞多6倍多的GFP表達CD34+HSC/PC。
[0195] 實施例3:使用AAV2/6遞送載有RFLP的轉基因
[0196] 為測試⑶34+細胞中的靶向整合,產生出AAV6-R5-160-XhoI供體。在這種病毒載體 中轉基因的插入中,將XhoI限制酶位點引入兩個CCR5特異性ZFN結合位點之間(圖2A),即 ZFN對8267:20505(也稱為81962)31101位點側懸序列與基因組中的基因組中側懸ZFN切割 位點的區(qū)域同源的同源臂。具體來說,右同源臂為約1351個堿基對而左同源臂為約509個堿 基對。如上所述以介于300-le5vg/細胞之間的劑量將AAV6-R5-160-XhoI供體轉導到CD34+ 細胞中。一天后,通過電穿孔使用BTX ECM830(Harvard Apparatus)將編碼CCR5特異性ZFN 的mRNA(120μg/ml)引入到經(jīng)過轉導的細胞中。mRNA由六811瓜8611(六1181:;[11,1乂)制造呈2六構建 體(8267-2A-2050)且以 120ug/ml 使用。
[0197] 在感染后第5天(dpi)收集細胞以進行基因組DNA(gDNA)純化且經(jīng)過處理以用于隨 后的RFLP分析(圖2B)和Illumina深度測序(圖2C)。使用NucleoSpin Tissue XS試劑盒 (1&1吐6代7-似861,86讓16116111,?4)分離得基因組0嫩。使用先用以下引物擴增2?財?shù)陡钗稽c 周圍的區(qū)域的巢套式PCR方法進行RFLP分析:5 ' -CTGTGCTTCAAGGTCCTTGTCTGC-3 '(SEQ ID NO: 1)和5 ' -CTCTGTCTCCTTCTACAGCCAAGC-3 '( SEQ ID NO: 2)。凝膠純化PCR產物且再次用以 下引物對進行PCR擴增:5 ' -AAGATGGATTATCAAGTGTCAAGTCC-3 '( SEQ ID N0: 3)和5'-CAAAGTCCCACTGGGCG-3'(SEQ ID N0:4)。
[0198] 經(jīng)過擴增的DNA接著進行Xhol的限制酶切分析且通過凝膠電泳分析產物。如圖2B 中所展示,所述分析證實包含轉基因的Xho I以占存在的DNA分子至多約18 %的水平存在,但 僅存在于已經(jīng)過AAV6供體和編碼CCR5特異性ZFN的mRNA二者處理的CD34+樣品中。
[0199] 11 lumina深度測序允許同時地通過NHEJ (通常是小插入和/或缺失,稱為"插入缺 失")和HDR(TI)途徑(圖2C)檢測ZFN誘導型基因組修飾。簡單地說,先使用位于同源臂外的 引物擴增CCR5ZFN切割位點周圍的區(qū)域,所述引物如下:5 ' -CTGTGCTTCAAGGTCCTTGTCTGC-3 ' (SEQ ID N0:1)和5'-CTCTGTCTCCTTCTACAGCCAAGC-3'(SEQ ID 如:2)。凝膠純化?0?產物且 接著使用一對融合引物進行PCR擴增,這對融合引物不但包含靶特異性序列而且包含用戶 I 1 1 u m i n a 深度測序的連接子:5'- ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNGCCAGGTTGAGCAGGTAGATG-3'(SEQIDN0:5WP 5 ' -AGACGTGTGCTCTTCCGATCTGCTCTACTCACTGGTGTTCATCTTT-3 '( SEQ ID NO: 6)。最后,使用以 下引物對將樣品條碼添加于最終P C R反應中:5'_ AATGATACGGCGACCACCGAGATCTACACNNNNNNNNACACTCTTTCCCTACACGACGCTCTT-3'(SEQ ID NO: 7)和5 '-CAAGCAGAAGACGGCATACGAGATNNNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3 ' (SEQ ID N0:8)。在MiSeq系統(tǒng)(Illumina,San Diego,CA)中操作最終的PCR產物。使用定制 的指令分析數(shù)據(jù)。
[0200] 觀測到TI頻率發(fā)生AAV6供體劑量依賴性地增加。在10,000vg/ml AAV6供體時達到 TI的峰值水平(22% )(圖2C)。此外,插入缺失頻率展示與AAV6供體的劑量和TI頻率具反向 相關性。
[0201] 實施例4:供體和ZFN處理的時序和次序的最優(yōu)化
[0202] 檢查AAV6轉導和ZFN mRNA電穿孔的最優(yōu)的時間設定和次序以使通過HDR靶向整合 轉基因最大化。在CCR5特異性ZFN mRNA的電穿孔(EP)之前最長48小時(_48hr)到之后20小 時(+20hr),將AAV6-R5-160-XhoI供體引入到CD34+細胞中。收集細胞且在某一稍后的時間 點處理以用于gDNA純化和隨后的11 lumina深度測序。
[0203] 如圖3A和B中所展示,在編碼CCR5ZFN的mRNA的電穿孔之前以AAV6-R5-160-XhoI供 體進行短暫的處理(6小時以內)引起大于20%的靶向整合。在16、20或24小時的預處理時觀 測到效率略降低,而如果使用48小時的預處理則觀測到TI效率顯著降低。如圖3B中所展示, 即使在核酸酶轉染后(1小時以內)提供供體,核酸酶刺激CD34+細胞中有效的靶向整合。然 而,當在核酸酶轉染后第4小時提供供體時觀測到TI效率顯著降低,且當在核酸酶轉染后第 20小時提供供體時幾乎無 TI。數(shù)據(jù)表明在ZFN mRNA的電穿孔前24小時或后一小時內以AAV6 供體轉導⑶34+細胞對于通過HDR有效地基因組修飾來說是最優(yōu)的。
[0204] 實施例5:較大轉基因的整合
[0205] 為測試供體的AAV6介導的遞送是否還對異源DNA的較大片段諸如完整轉基因表達 盒的靶向整合有效,構建pgk啟動子驅動的eGFP表達盒(1.6kb)插在CCR5同源臂之間的R5-pgk-GFP-pA供體(圖 4A)。
[0206] 用如上所述的AAV6-R5-pgk-GFP-pA供體和CCR5ZFN mRNA處理CD34+細胞,且接著 收集以用于流式細胞儀分析。
[0207] 如圖4B中所展示,約15 %GFP+細胞存在于經(jīng)過供體(1000和3000vg/ml)和ZFN二者 處理的樣品而非在15dpi(圖4B)或在更早的時間點僅經(jīng)過供體處理的樣品中。
[0208]使用半定量進-出PCR分析進一步證實存在CCR5基因座中GFP盒的靶向整合。通過 連續(xù)稀釋已知頻率的在CCR5基因座(通過南方墨點法判定)GFP轉基因整合未經(jīng)修飾的野生 型gDNA的gDNA池制備一組標準對照。使用等量的gDNA和存在于polyA區(qū)中(存在于eGFP盒 中)的引物和位于ZFN靶位點的3'側的CCR5同源臂區(qū)外的引物(圖4C)進行PCR。以下展示所 使用的引物:
[0209] 5'-GAGGATTGGGAAGACAATAGCAG-3'(SEQ ID N0:9)和5'_ CCAGCAATAGATGATCCAACTCAAATTCC-3 '(SEQ ID NO:10)。
[0210]在第二組PCR反應中,兩個引物均位于靶位點的5'側而另一個引物位于CCR5同源 區(qū)外的一個額外的引物對也包括在相同PCR反應中(2個引物對)。使用所述第二引物對作為 測量gDNA輸入的量度。以下展示這一額外的引物對:
[0211] 5,-GATTTGCACAGCTCATCTGGC-3,(SEQ ID NO:11)和5,-CCATCTTGTTCCACCCTGTGC- 3'(SEQ ID N0:12)。
[0212] 根據(jù)GFP-ΤΙ帶的強度(圖4C)和GFP-ΤΙ帶對總CCR5帶的相對強度(圖3D),經(jīng)過1000 或3000vg/ml AAV6供體和CCR5ZFN mRNA處理的CD34+HSC/PC在CCR5基因座的GFP具有多于 10%的靶向整合。
[0213] 總之,這些結果證實使用AAV6供體還對用這一方法靶向整合較大DNA片段來說高 度有效。
[0214] 實施例6:基因組第二位置中的靶向整合
[0215]為排除這些高效靶向整合具CCR5基因座特異性的可能性,構建Hindlll位點引入 AAVS1靶向ZFN對30035:30054的結合位點之間的AAVS1特異性Hindlll供體,包括具有如下 表1中所展示的6個指狀物的鋅指蛋白。各指狀物的識別螺旋區(qū)在表1中以一行F1-F6展示而 ZFP所結合的靶位點在表1第一列中展示。還可以參見,美國專利N〇.8,110,379。在靶序列 中,ZFN所結合的核苷酸以大寫字母展示而未結合的核苷酸以小寫字母展示。
[0216] 表1 :AAVS1特異性ZFN、設計和靶序列
[0218] 用AAV6-AAVSl-HindIII供體和AAVS1ZFN mRNA處理CD34+HSPC。5天后收集細胞且 處理以用于如上所述使用AAVS1特異性引物的Illumina深度測序。
[0219] 如圖5B中所展示,使用較低劑量的AAV6供體(lOOOvg/ml),多于30%的等位基因具 有靶向整合(TI),而在AAVS1ZFN的存在下使用較高劑量的AAV6供體,多于50%的等位基因 具有TI。
[0220] 實施例7:TALEN介導的靶向整合
[0221] 用AAV6-R5-160-XhoI供體(2000vg/細胞)轉導CD34+細胞。在37°C培養(yǎng)20小時后, 通過使用BTX ECM830(Harvard Apparatus)的電穿孔將如美國專利No. 8,586,526中所述的 CCR5特異性TALEN mRNA(各80ug/ml)引入到經(jīng)過轉導的細胞中。5天后收集細胞以用于基因 組DNA( gDNA)純化且處理以用于隨后的11 lumina深度測序。
[0222] 圖6描繪通過測序:插入或缺失(插入缺失)、或靶向整合(TI)由供體分子提供的 RFLP所檢測到基因組修飾的量。如所示,TALEN刺激初級CD34+細胞中由AAV6供體提供的 RFLP的超過10%的靶向整合。
[0223] 實施例8:CRISPR/Cas介導的靶向整合
[0224] 用 rAAV6-AAVSl-HindIII 供體(500 或 2000vg/細胞)轉導 CD34+細胞。在 37°C 培養(yǎng) 20 小時后,通過使用BTX ECM830(Harvard Apparatus)的電穿孔將AAVS1特異性ZFNs(30054: 30035,40ug/ml)或 Cas9mRNA( 20ug/ml)和 AAVS1 特異性嵌合導引 RNA(gRNA)DNA( 10-40ug/ ml)引入到經(jīng)過轉導的細胞中。gRNA-T 1和gRNA-T2為設計以分別結合到以下AAVS1基因組序 列的導引RNA: GTCCCCTCCACCCCACAGTGGGG(SEQ ID NO :27)和GGGGCCACTAGGGACAGGATTGG (SEQ ID NO: 28)。下劃線為PAM區(qū)。5天后收集細胞以用于基因組DNA(gDNA)純化且處理以用 于隨后的Illumina深度測序。
[0225] 圖7描繪通過測序:插入或缺失(插入缺失)、或靶向整合(TI)由供體分子提供的 RFLP所檢測到基因組修飾的量。如所示,在這一實驗中,CRISPR/Cas9刺激初級⑶34+細胞中 由AAV6供體提供的RFLP的超過1 %的靶向整合。
[0226] 實施例9:⑶4+T細胞中的AAV轉導和TI
[0227] 在IL2(20ng/ml)和Dynabeads?Human T-活化因子CD3/CD28(Life Technology) 的存在下用包含CMV驅動的eGFP轉基因的AAV2、AAV5、AAV6、AAV8或AAV9載體轉導初級CD4+T 細胞。接著在感染后第5天(dpi)收集細胞且使用流式細胞儀(Guava, Mill ipore)分析。
[0228] GFP陽性細胞的頻率(%)展示在下表2中。AAV6相比其它血清型(AAV2、AAV5、AAV8 和AAV9)來說以最高效率轉導初級CD4+T細胞。
[0229] 表2:⑶4+T細胞中的AAV血清型依賴性GFP報導子轉導
[0231] 此外,用指定劑量的rAAV2、rAAV6或IDLV R5-160-XhoI供體轉導CD4+細胞。在37°C 培養(yǎng)20小時后,通過使用BTX ECM830(Harvard Apparatus)的電穿孔將CCR5-或AAVS1-特異 性ZFN mRNA(60ug/ml)引入到經(jīng)過轉導的細胞中。4天后收集細胞以用于基因組DNA(gDNA) 純化且處理以用于隨后的11 lumina深度測序。
[0232] 圖8描繪通過測序:插入或缺失(插入缺失)、或靶向整合(TI)由供體分子提供的 RFLP于經(jīng)過CCR5-核酸酶(圖8A)和AAVS1-核酸酶(圖8B)處理的CD4+T細胞中所檢測到基因 組修飾的量。如所示,ZFN刺激初級CD4+細胞中由AAV6供體提供的RFLP的超過40 %的靶向整 合
[0233] 實施例10:⑶8+T細胞中的AAV轉導和TI
[0234] 用包含 CMV 驅動的 eGFP 轉基因的 AAV2、AAV5、AAV6、AAV8 或 AAV9 載體在 IL2 (20ng/ ml)和Dynabeads? Human T-活化因子⑶3/⑶28(Life Technology)的存在下轉導初級 CD8+T細胞。接著在感染后第5天(dpi)收集細胞且使用流式細胞儀(Guava,Millip〇re)分 析。
[0235] GFP陽性細胞的頻率(% )展示于下表3中。AAV6相比其它血清型(AAV2、AAV5、AAV8 和AAV9)來說在相對更低的劑量下以最高效率轉導CD8+T細胞。
[0236] 表3: CD8+T細胞中的AAV血清型依賴性GFP報導子轉導
[0238] 此外,用指定劑量的rAAV2、rAAV6或IDLV R5-160-XhoI供體轉導CD8+細胞。在37°C 培養(yǎng)20小時后,通過使用BTX ECM830(Harvard Apparatus)的電穿孔將CCR5-或AAVS1-特異 性ZFN mRNA引入到經(jīng)過轉導的細胞中。4天后收集細胞以用于基因組DNA(gDNA)純化且處理 以用于隨后的Illumina深度測序。圖9描繪通過測序:插入或缺失(插入缺失)、或靶向整合 (TI)由供體分子提供的RFLP于經(jīng)過CCR5-核酸酶(圖9A)和AAVS1-核酸酶(圖9B)處理的⑶8+ T細胞中所檢測到基因組修飾的量。如所示,ZFN刺激初級CD8+細胞中由AAV6供體提供的 RFLP的超過30 %的靶向整合。
[0239] 實施例11:離體方法
[0240] 包含如先前所述(Aiuti等人(2013)Science 341,1233151)的0)34+批?(:(例如,源 自患者的⑶34+細胞和/或經(jīng)過修飾的⑶4+和/或⑶8+T細胞)、如本文所述的表達IL2RG的經(jīng) 過基因修飾的細胞如先前所述(Aiuti等人同上)投與受試者,導致用經(jīng)過修飾的細胞治療 的受試者中的長期多向移植。
[0241] 本文述及的所有專利、專利申請和公開以其全文引用的方式并入本文。
[0242]雖然為清楚理解起見已通過插圖和實施例相當詳細地提供公開內容,但本領域技 術人員應明白可以在不脫離本公開內容的精神或范圍下實施各種改變和修改。因此,不應 將前述說明和實施例理解為限制性。
【主權項】
1. 一種將一個或多個轉基因整合到分離的細胞的基因組中的方法,所述方法包括: 將(a)包含所述一個或多個轉基因的供體載體和(b)至少一種核酸酶引入到細胞中,其 中所述至少一種核酸酶切割所述細胞的基因組以使所述一個或多個轉基因整合到所述細 胞的基因組中,且進一步而言,其中 (i) 如果所述供體載體是在所述至少一種核酸酶之前被引入到所述細胞中,則在引入 供體載體后的48小時內將所述至少一種核酸酶引入到所述細胞中,及; (ii) 如果所述至少一種核酸酶是在所述供體載體之前被引入,則在引入所述至少一種 核酸酶后的4小時內將所述供體載體引入到所述細胞中。2. 根據(jù)權利要求1所述的方法,其中所述供體載體是在所述至少一種核酸酶之前被引 入到所述細胞中且在將所述供體載體引入到所述細胞后培養(yǎng)所述細胞1至24小時。3. 根據(jù)權利要求1或2所述的方法,其中所述細胞為造血干細胞或T細胞。4. 根據(jù)權利要求1到3中任何一項權利要求所述的方法,其中所述供體載體為AAV載體。5. 根據(jù)權利要求4所述的方法,其中所述AAV載體包括AAV6。6. 根據(jù)權利要求1到5中任何一項權利要求所述的方法,其中所述至少一種核酸酶是呈 mRNA被引入到所述細胞中。7. 根據(jù)權利要求1到6中任何一項權利要求所述的方法,其中所述至少一種核酸酶是選 自由鋅指核酸酶(ZFN)、TALE核酸酶(TALEN)、CRISPR/Cas核酸酶系統(tǒng)和其組合組成的組。8. 根據(jù)權利要求1到7中任何一項權利要求所述的方法,其中所述核酸酶切割安全港基 因。9. 根據(jù)權利要求8所述的方法,其中所述安全港基因是選自由CCR5基因、AAVSl基因、 Rosa基因和白蛋白基因組成的組。10. 根據(jù)權利要求1到9中任何一項權利要求所述的方法,其中所述轉基因編碼治療性 蛋白。11. 一種細胞,其是通過如權利要求1到10中任何一項權利要求所述的方法產生。12. -種向有此需要的受試者提供一種或多種蛋白質的方法,所述方法包括: 根據(jù)權利要求1到11中任何一項權利要求所述的方法將一個或多個編碼所述一種或多 種蛋白質的轉基因引入到分離的細胞中; 將所述細胞引入到所述受試者中以使所述一種或多種蛋白質提供給所述受試者。13. -種藥物組合物,其包含根據(jù)權利要求11所述的細胞。
【文檔編號】C12N15/85GK105899665SQ201480055149
【公開日】2016年8月24日
【申請日】2014年10月16日
【發(fā)明人】M·C·霍爾姆斯, 汪建斌
【申請人】桑格摩生物科學股份有限公司