本申請要求英國專利申請1422511.4、1512467.0、1512595.8和1521987.6(分別于2014年12月17日、2015年7月16日、2015年7月17日和2015年12月14日提交),其每個的全部內容并入本文作為參考用于所有目的。
本發(fā)明在rna編輯領域中,由此對靶rna序列的核苷酸序列進行修飾例如以糾正突變。
背景技術:
rna編輯是一種天然的過程,通過這個過程,真核細胞通常以位點特異性和精確的方式改變rna分子的序列,從而將基因組編碼的rna的全部數(shù)量(repertoire)增加數(shù)個數(shù)量級。已經描述了用于整個動物和植物界的真核物種的rna編輯的酶,并且這些過程在從最簡單的生命形式比如秀麗隱桿線蟲(caenorhabditiselegans)到人類的后生動物中管理細胞穩(wěn)態(tài)方面起重要作用。rna編輯的實例是分別通過稱為腺苷脫氨酶和胞苷脫氨酶的酶的腺苷至肌苷以及胞苷至尿苷轉變。最廣泛研究的rna編輯體系是腺苷脫氨酶。腺苷脫氨酶是包含識別結構域和催化結構域的多結構域蛋白。識別結構域識別特定的dsrna序列和/或構象,而催化結構域通過核堿基(nucleobase)的脫氨基作用在靶rna附近或多或少預定的位置將腺苷轉變?yōu)榧≤铡Mㄟ^細胞的翻譯裝置將肌苷讀作鳥嘌呤,這意味著如果編輯的腺苷在mrna或mrna前體的編碼區(qū)中,則可以重新編碼蛋白質序列。a至i轉變也可以發(fā)生在靶mrna的5’非編碼序列中,在原始起始位點上游產生新的翻譯起始位點,這產生n-末端延長的蛋白質。此外,a至i轉換可以發(fā)生在mrna前體中的內含子或外顯子的剪接元件中,從而改變剪接模式。作為這種rna編輯的結果,可以包含或跳過外顯子。腺苷脫氨酶是稱為作用于rna的腺苷脫氨酶(adar)的酶的廣大家族的一部分,包括人類脫氨酶hadar1、hadar2和hadar3。
使用寡核苷酸來編輯靶rna在本領域是已知的,例如,參見montiel-gonzalez等人(proceedingsofthenationalacademyofsciences2013,2013年11月5日,第110卷,第45期,第18285-18290頁)。作者描述了使用基因工程化的融合蛋白靶向編輯靶rna,該融合蛋白包含hadar1蛋白的腺苷脫氨酶結構域,與噬菌體λ蛋白n的所謂b-box結合結構域融合。已將hadar1的天然識別結構域去除以消除天然adar的底物識別性質,并由λn-蛋白的b-box識別結構域代替。b-box是由n-蛋白b-box結合結構域識別的17個核苷酸的短鏈rna。作者構建了一種包含與用于編輯的靶序列互補的向導rna部分的反義寡核苷酸,其通過n-結構域-脫氨酶融合蛋白融合至用于序列特異性識別的b-box部分。作者巧妙地表明,向導rna寡核苷酸如實地將腺苷脫氨酶融合蛋白引導至靶位點,導致靶rna的grna定向的位點特異性a至i編輯。
所提出的方法的缺點是需要由噬菌體λn-蛋白的b-box結合結構域基因地融合至截短的天然adar蛋白的腺苷脫氨酶結構域而組成的融合蛋白。這需要用融合蛋白轉導靶細胞(這是主要障礙),或者用編碼工程化的腺苷脫氨酶融合蛋白的核酸構建體轉染靶細胞,以在靶細胞中表達。當在多細胞生物體中實現(xiàn)編輯時,比如在針對人類疾病的治療中,后者構成不小的障礙。
vogel等人(angewandtechemie.int.ed.2014,53,6267-71)公開了使用芐基鳥嘌呤取代的向導rna和基因工程化的融合蛋白編輯ecfp和第五凝血因子編碼rna,該融合蛋白包含adar1或adar2的腺苷脫氨酶結構域基因地融合至snap-標簽結構域(工程化的o6-烷基鳥嘌呤-dna-烷基轉移酶)。盡管使用共價連接的向導rna(通過芐基鳥嘌呤),基因工程化的人工脫氨酶融合蛋白可以靶向培養(yǎng)中的hela細胞的靶rna中的所需編輯位點,但該體系具有與上述基因工程化的adar類似的缺點,因為不清楚如何應用該體系而不必首先基因地修飾adar,然后轉染或轉導攜帶靶rna的細胞,從而為細胞提供這種基因工程化的蛋白質。顯然,該體系不容易適用于人類,例如在治療環(huán)境中。
使用寡核苷酸的另一種編輯技術稱為crispr/cas9體系,但這種編輯復合物對dna起作用。后一種方法具有與上述工程化的adar體系相同的缺點,因為它需要將向導寡核苷酸與crispr/cas9酶或編碼它們的表達構建體共同遞送至靶細胞。
因此,仍然需要可以利用內源性細胞通路以在哺乳動物細胞中甚至在整個生物體中編輯內源性核酸的新技術,而沒有與現(xiàn)有技術的方法相關的問題。
技術實現(xiàn)要素:
本發(fā)明通過提供使用寡核苷酸構建體進行rna編輯的靶向方法來避免根據(jù)現(xiàn)有技術的方法的缺點,所述寡核苷酸構建體包含對于待編輯的靶核酸序列特異性的靶向部分和能夠結合和募集天然存在于細胞中的核酸編輯實體的募集部分。寡核苷酸構建體的募集部分的功能是以足夠的親和力選擇性地結合至細胞中內源的和存在的rna編輯實體,通過本發(fā)明的寡核苷酸構建體的靶向部分將這種實體重定向至預選的靶位點,從而促進在靶rna中對應于寡核苷酸構建體的靶向部分的區(qū)域中對預選的核苷酸殘基的編輯。
寡核苷酸構建體的靶向部分通常包含與待編輯的rna序列中的靶位點互補的反義寡核苷酸序列。用于編輯靶rna的這種靶向方法的一個優(yōu)選實施方式是包含兩部分的寡核苷酸構建體:包含與靶rna序列互補的反義序列的靶向部分,和包含rna編輯酶的識別序列的募集部分。
募集部分可以包含具有莖和環(huán)的發(fā)夾結構形式的dsrna。發(fā)夾可以位于靶向部分的上游(5’)或下游(3’)(優(yōu)選在上游)?;蛘?,寡核苷酸構建體的募集部分可以以靶向部分中一部分位于募集部分的上游并且靶向部分中一部分位于募集部分的下游這樣的方式中斷靶向部分,導致寡核苷酸構建體的募集部分在寡核苷酸構建體退火至靶rna后環(huán)出(loopout)。
根據(jù)另一個實施方式,募集部分包含模擬(即在結構上相同或相似于)已知待由天然存在的rna編輯實體編輯的rna序列的dsrna片段。已知成為rna編輯的天然底物的該rna序列包含dsrna片段,優(yōu)選包含通過互補核堿基配對在自身上折疊回來的單個rna片段,從而形成發(fā)夾或莖環(huán)結構。已經詳細表征的已知的編輯的rna序列的兩個實例是3-氨基-3-羥基-5-甲基-4-異唑丙酸(ampa)亞型谷氨酸受體的b亞基(glur-b)中。該模型體系包括兩個頻繁編輯的位點,其中將dna編碼的aga編碼為iga,導致精氨酸至甘氨酸替換(r/g位點)以及不同的谷氨酰胺至精氨酸替換(q/r位點)。已知glur-b(r/g)位點包含莖環(huán)結構,其由包含3個錯配、2個a·c和1個g·u搖擺堿基對的71個核苷酸組成。有趣的是,該環(huán)由符合系統(tǒng)發(fā)育保守的gcuma序列的保守性好的五環(huán)結構gcuaa結構組成,其中m為a或c(aruscavagep.j.和bassb.l.rna.2000;6:257-269)。對于兩個搖擺腺苷的編輯似乎有一些偏好,當與所編輯腺苷相對的堿基選自胞苷或尿苷時,優(yōu)選胞苷,效率會提高。
該結構可以方便地按原樣使用,或者在根據(jù)本發(fā)明的寡核苷酸構建體中使用時,通過減少或增加莖中搖擺核堿基對的數(shù)目以修飾編輯的特異性和/或重定向編輯至靶rna序列中的優(yōu)選位點,作為募集部分加以改編。此外,或者也可以通過縮短莖而不完全地消除識別,來修飾對于hadar1的glur-b的識別位點。這種縮短從可制造性或良好前景的成本等可以是方便的。
衍生自glur-b結構域的募集部分的實例包括序列:5’-(auana)nuauaacaauaugcuaaauguuguuaua(nbuau)n-3’,其中na和nb各自為可以是a、g、c或u的單個核苷酸,其條件是在形成莖環(huán)結構時na和nb形成錯配堿基對,并且n為1或0(即seqidno:6和seqidno:7)。這種募集部分的一個有用的實例包括這樣的序列,其中n=1,在5’和3’方向上進一步延伸,例如其中每個延伸為1至10個核苷酸長(或更長,例如1至20個核苷酸或更多)。例如,如在seqidno:20至seqidno:22(其中na=nb=g)中所示,在每個方向上延伸3個另外的核苷酸得到(seqidno:23)5’-ggaauanauauaacaauaugcuaaauguuguuauanbuauccc-3’。這種進一步擴展可以提高校正效率。
基于全長天然glur-b受體底物的募集部分的另一個實例是如下面在實施例中使用的5’-guggaauanauauaacaauaugcuaaauguuguuauanbuaucccac-3’(seqidno:24;相對于前一段的延伸序列以下劃線示出)。在實施例4中描述全長glur-b受體募集部分與用于a1at-轉錄物的具有與a1at缺陷相關的9989位g至a突變的靶向部分組合。在實施例5中描述全長glur-b受體募集部分與用于lrrk2轉錄物的具有與帕金森氏病相關的g2019s突變的靶向部分組合。
募集部分可以在5’或3’端連接到靶向部分,任選地通過包含一個或多個核苷酸的接頭“l(fā)”、寡肽或另一種化學接頭如聚乙二醇(peg)連接。
靶向部分可以包含與由以下通式表示的靶rna序列互補的序列:
n1n2n3n4n5n6n7n8n9n10n11n12n13n14n15n16n17cn18n19n20(seqidno:8),
其中n1至n20取決于靶rna序列中的互補序列,各自獨立地為a、g、c或u,其中當靶向部分退火至其靶rna序列時,n4優(yōu)選與靶rna序列中的相對核苷酸形成錯配堿基對,并且當靶向部分與其靶rna序列退火時,n10和n16與靶rna序列中的相對核苷酸形成搖擺堿基對,并且c是與靶rna序列中的作為脫氨基靶標的腺苷相對的胞苷。
錯配堿基對是g-a、c-a、u-c、a-a、g-g、c-c、u-u堿基對。搖擺堿基對是:g-u、i-u、i-a和i-c堿基對。靶向部分可以長于20個核苷酸,多達200個核苷酸或更多,盡管認為長于50個是不必要的,并且優(yōu)選短于40個。更優(yōu)選的是募集部分短于30個核苷酸,優(yōu)選短于25個核苷酸。
優(yōu)選地,當靶向部分與靶rna序列退火時,靶向部分在每個與腺苷(如果靶rna序列中的該腺苷不是編輯的靶標)相對的位置包含2’-o甲基。更通常地,為了保護靶向部分免于核酸酶降解,優(yōu)選所有核苷酸都包含2’-o-甲基,除了與靶腺苷相對的核苷酸和所述相對核苷酸的相鄰核苷酸(一個5’和一個3’),其應包含2’-oh基團。
根據(jù)優(yōu)選實施方式,募集部分包含dna序列:(cg)3n1-nn(cg)3,其中n1至nn各自可以相同或不同,并且選自鳥苷、腺苷、胸苷、胞苷和肌苷,‘n’在2和20之間,優(yōu)選在2和10之間,更優(yōu)選在2和5之間,還更優(yōu)選地在3和5之間,最優(yōu)選地是4或5。因此,有三個cg重復位于至多20個中間核苷酸的側翼。該dna序列能夠形成莖環(huán)結構。根據(jù)另外的優(yōu)選實施方式,寡核苷酸構建體的募集部分是包含序列:(cg)3tn(cg)3的dna結構,其中n是3至5的整數(shù),優(yōu)選為4(cgcgcgttttcgcgcg;seqidno:5)。該dna序列能夠形成莖環(huán)結構。此外,在本領域中已經描述了(cg)3t4(cg)3序列在生理條件下形成z-dna構象,并且該z-dna結構被hadar1識別并結合(febsletters458:11999sep10pg27-31)。如上所述對于dsrna募集部分,該z-dna募集部分可以位于靶向部分的上游或下游,或者中斷靶向部分,在上游部分和下游部分中分開靶向部分,由此dna募集部分在靶向部分退火至靶rna時環(huán)出。根據(jù)本實施方式,胞苷堿基優(yōu)選為5-甲基胞苷,以降低與cpg序列相關的潛在的免疫原性。
根據(jù)本發(fā)明的寡核苷酸包含靶向部分(即將寡核苷酸靶向至靶rna序列中正確位置的部分)和募集部分(即具有募集編輯實體(例如adar)的主要功能的部分,并且不必要與作為編輯靶標的腺苷區(qū)域中的靶rna互補、優(yōu)選不互補)。這種二分體結構將本發(fā)明的寡核苷酸與已知的寡核苷酸比如現(xiàn)有技術(例如wo2014/011053、wo2005/094370、和woolf等人,1995.pnasusa92,8298-8302)中公開的寡核苷酸清楚地區(qū)分開,后者基本上在整個長度上與靶標互補,并且不包含募集部分(當然不是不與靶rna互補的部分,而是與本發(fā)明一樣對編輯實體具有親和力)。因此,根據(jù)本發(fā)明優(yōu)選提供一種用于在真核細胞中定點編輯靶rna序列中的核苷酸的寡核苷酸構建體,所述寡核苷酸構建體包含:
(a)靶向部分,其包含與該靶rna的一部分互補的反義序列;和
(b)募集部分,其不與靶rna序列互補,并且其能夠結合和募集天然存在于所述細胞中的rna編輯實體并能夠進行所述核苷酸的編輯。
根據(jù)另一個實施方式,本發(fā)明提供寡核苷酸構建體,其包含:
(a)靶向部分,其包含與該靶rna的一部分互補的反義序列;和
(b)募集部分,其能夠形成分子內莖環(huán)結構、結合和募集天然存在于所述細胞中的rna編輯實體并進行所述核苷酸的編輯。
根據(jù)另一個實施方式,募集部分可以是選擇用于結合至細胞中存在的編輯實體的適配體(aptamer)。選擇適配體的步驟在本領域中是眾所周知的??梢赃x擇與編輯實體結合而不消除脫氨酶活性的適配體作為募集部分,并且易于使用任何類型的接頭包括規(guī)則(磷酸二酯)或修飾的(例如硫代磷酸酯或二硫代磷酸酯)核苷間鍵、肽基連接或任何其他化學連接比如聚乙二醇,與本發(fā)明的寡核苷酸構建體的靶向部分融合。
根據(jù)本發(fā)明的另一個實施方式,可以選擇與細胞中存在的編輯實體結合而不消除編輯活性的抗體、抗體片段、其結合結構域、或駱駝抗體,作為募集部分并且與本發(fā)明的寡核苷酸構建體的靶向部分融合。
術語“寡核苷酸構建體”可以指單個寡核苷酸、兩個或多個對彼此有親和力(反義互補或其它)的寡核苷酸(包含適配體)的復合物、或寡核苷酸和蛋白質的結合部分(比如抗體、抗體片段或結合結構域)的復合物,其可以直接或通過peg或其它接頭連接。
因此,本發(fā)明提供寡核苷酸構建體和用于細胞中靶rna序列的位點特異性編輯的方法,而不需要用基因工程化的編輯酶轉導或轉染細胞。由于寡核苷酸構建體的設計,將編輯實體比如adar募集并引導到由實驗者選擇的編輯位點。本發(fā)明的這些寡核苷酸構建體和方法可以方便地用于在靶rna序列中進行改變,例如逆轉參與或引起疾病的突變,從而減輕疾病的癥狀。已知rna編輯實體非常有效地編輯其底物,其頻率遠遠超過寡核苷酸介導的dna或rna修復。當用在治療疾病時,這是非常有利的。
根據(jù)本發(fā)明的寡核苷酸構建體中的靶向部分和募集部分可以直接相鄰?;蛘?,靶向部分和募集部分可以通過接頭共價連接。接頭可以包含非特異性核苷酸殘基(非特異性,在某種意義上,它們不必要與靶rna序列互補,也不對細胞中存在的編輯實體具有親和力)、(寡)肽接頭或其它化學接頭。根據(jù)另一個實施方式,可以將靶向部分和募集部分提供為兩個分開的即非共價連接的寡核苷酸序列,其包含能夠形成dsrna或雜合dna:rna結構的反義互補序列。這種dsrna或雜合寡核苷酸構建體的形成可以在施用于細胞或待治療受試者之前或在體外或體內(例如,在待治療受試者中)施用兩個分開的寡核苷酸之后進行。
本發(fā)明提供用于在真核細胞、優(yōu)選哺乳動物細胞中進行靶rna序列改變的方法,包括以下步驟:(i)向所述細胞中引入包含靶向部分和募集部分的寡核苷酸構建體,靶向部分包含與靶rna序列充分互補的序列以通過核堿基配對結合至所述靶rna,募集部分包含由天然存在于所述真核(優(yōu)選哺乳動物)細胞中的rna編輯實體識別的序列;(ii)允許足夠的時間用于使rna編輯實體對靶rna序列進行編輯反應;和(iii)鑒定rna序列中改變的存在。
根據(jù)優(yōu)選的實施方式,編輯反應由所述編輯實體在靶rna序列與寡核苷酸構建體的靶向部分之間的重疊區(qū)域內的一個或多個核堿基上進行。根據(jù)優(yōu)選的實施方式,寡核苷酸構建體的靶向部分包含與待編輯的核堿基相對的錯配。根據(jù)另一個優(yōu)選的實施方式,編輯反應包括通過靶rna序列中腺苷核堿基的脫氨基作用進行的a至i轉變。根據(jù)后一種方法,優(yōu)選其中寡核苷酸構建體包含與待編輯的腺苷相對的c。根據(jù)另一個優(yōu)選的方法,編輯反應是通過胞苷核堿基的脫氨基作用進行的c至u轉變;根據(jù)后一種方法,優(yōu)選寡核苷酸構建體的靶向部分包含與待編輯的靶rna序列中的c相對的a。
本發(fā)明還提供一種用于在人細胞中編輯突變型cftr靶rna序列的方法,包括以下步驟:(i)向所述細胞中引入包含與cftr靶rna序列互補的靶向部分和能夠募集hadar編輯實體的募集部分的寡核苷酸構建體;和(ii)允許hadar編輯實體有足夠的時間在靶rna序列與寡核苷酸構建體的靶向部分之間的重疊區(qū)域處或附近編輯核堿基。在根據(jù)本發(fā)明的優(yōu)選的實施方式中,突變型cftr靶rna(mrna前體或mrna)包含g551d突變,并且編輯反應導致腺苷轉變?yōu)榧≤?,從而逆轉所述靶rna序列中的g551d突變。對于天冬氨酸(d)有兩個密碼子:gau和gac。因此,具有g551d突變的囊性纖維化患者可以在cfir蛋白的密碼子551的對應位置具有突變gau或gac。在密碼子的第二個位置的a的脫氨基作用將導致形成i,其將由翻譯裝置讀取為g。因此,在突變的密碼子的第二個位置中a的脫氨基作用分別產生giu或gic,其實際上被讀作ggu和ggc。ggu和ggc均編碼甘氨酸,因此,通過腺苷脫氨酶對兩種突變的g551d密碼子進行rna編輯將產生適當?shù)母拾彼峋幋a的三聯(lián)體,有效地將突變逆轉成正常的cftr蛋白。
本領域技術人員將清楚,g551d突變僅用作實例,而不以任何方式限制本發(fā)明的范圍。確實存在由單堿基對替換引起的數(shù)千種遺傳疾病,使用根據(jù)本發(fā)明的寡核苷酸構建體和方法、募集脫氨酶比如本文詳細描述的腺苷脫氨酶或者胞苷脫氨酶用于逆轉,單堿基對替換是可修改的。
將胞苷脫氨酶募集到靶位點的工作方式與腺苷脫氨酶hadar1和hadar2的工作方式相同。然而,胞苷脫氨酶具有不同的結合要求,并識別靶rna序列中的不同結構,這決定著胞苷編輯。一個深入研究的胞苷脫氨酶(aminase)是人apobec1。使用寡核苷酸構建體靶向編輯位點并募集存在的、天然存在的編輯實體的rna編輯的一般原理對于胞苷脫氨酶保持不變,并且是本文公開和要求保護的發(fā)明的一部分。
具體實施方式
根據(jù)本發(fā)明的寡核苷酸構建體是獨特的,因為它們組合兩個基本功能;它們以一定的親和力結合到天然存在的rna編輯實體,并且它們通過反義互補(watson-crick)堿基配對至待發(fā)生編輯的靶rna序列中的位點,從而將rna編輯實體募集到編輯位點?!疤烊淮嬖诘摹睂嶓w存在于細胞中,而不需要在先的人為干預。因此,截短的或重組的酶(比如montiel-gonzalez等人和vogel等人所述)不是天然存在于細胞中;它們可以存在于細胞中,但僅在人為干預(轉導或轉染)后才能存在。因此,本發(fā)明可以使用細胞內源的野生型rna編輯實體來操作。
應當理解,這種募集不需要是定量的,因為細胞中存在的所有rna編輯實體將被募集用于編輯所選擇的靶rna序列。如果存在編輯實體的百分比保持可用以對其天然底物起作用,則是期望的甚至認為是可取的。此外,在某些實施方式中,例如,其中寡核苷酸構建體的募集部分是包含腺苷的dsrna序列,一旦rna編輯實體的催化結構域由寡核苷酸構建體募集,則其可以作用于寡核苷酸構建體的募集部分,以及作用于通過靶向部分退火至靶rna序列中的互補序列而產生的dsrna部分的編輯底物上。這在所有情況下都不是問題,因為可能存在需要過度編輯的應用。在要避免過度編輯的情況下,靶向部分可以整體地化學修飾,例如通過向所有核苷酸提供2’-o-甲基化糖部分,除了與靶腺苷相對的核苷酸和位于與靶腺苷酸相對的每個核苷酸的側翼的兩個核苷酸(一個5’和一個3’)。通常,通過向相對的核苷酸提供2’-ome基團,或者通過提供鳥嘌呤或腺嘌呤作為相對的堿基,可以保護靶rna中的腺苷免于編輯,因為這兩個核堿基能夠阻止相對腺苷的編輯。
寡核苷酸構建體
根據(jù)本發(fā)明的寡核苷酸構建體的募集部分的特征在于dsrna或dsdna結構。在單個分子中建立雙鏈寡核苷酸結構的一種方式是通過建立能夠在其長度的至少一部分上在自身折疊回來的回文序列。這種莖環(huán)結構可能產生自(1)能夠形成莖環(huán)結構的人工rna序列、(2)能夠形成莖環(huán)結構的人工dna序列、(3)從細胞中存在的編輯實體的已知的底物rna中獲取的rna序列。例如,根據(jù)本發(fā)明的寡核苷酸構建體可以包括在序列上與用于編輯活性的天然識別位點相似的募集部分,或者可以以適配體樣的方式模擬該識別位點。以下將更詳細地描述這些實施方式中的每一個。此外,本領域技術人員將能夠基于更詳細描述的每個實施方式來制備和設計募集部分。設計和測試對蛋白質具有親和力的核酸結構的方法是本領域眾所周知的。
根據(jù)本發(fā)明的寡核苷酸構建體的靶向部分應當具有與靶位點的充分的重疊和互補性,以允許寡核苷酸構建體與靶rna序列的序列特異性雜交。重疊的長度和量可以根據(jù)靶標而不同,但是可以由本領域普通技術人員常規(guī)地確定。通常,更長的序列提供更多的特異性——并因此提供更少的脫靶效應(例如通過非特異性結合)——和更強的與靶位點的結合。通常根據(jù)本發(fā)明的寡核苷酸構建體的靶向部分應該長于10個核苷酸,優(yōu)選大于11個、12個、13個、14個、15個、16個、更優(yōu)選多于17個核苷酸。靶向部分優(yōu)選短于200個核苷酸,更優(yōu)選短于100個核苷酸,還更優(yōu)選短于50個核苷酸,還更優(yōu)選25個或更少的核苷酸。
根據(jù)一個實施方式,本發(fā)明提供用于在細胞中的靶rna序列的一個或多個特定位置進行所需變化的寡核苷酸構建體,其通過募集天然存在于所述細胞中的rna編輯實體,該寡核苷酸構建體具有序列5’-x-(y-x′)n-l-z-3’,其中x與特定位置下游的靶rna序列互補,x′與特定位置上游的靶rna序列互補,y包含一個或多個核苷酸(例如,至多10個,優(yōu)選在1個和5個之間,更優(yōu)選在1個和3個之間,比如1個或2個),其與靶rna序列不互補,n為1至10的整數(shù)(優(yōu)選1至5,更優(yōu)選1至3,或為1),l是任選的接頭序列,并且可以包含任意數(shù)目的核苷酸(包括零),并且z是由所述rna編輯實體識別并結合的序列。l還可以由不同的化學連接比如(寡)肽鍵、或peg連接組成。
當n大于或等于1時,寡核苷酸構建體的靶向部分與靶rna序列不完全互補,而是包含一個或多個錯配或搖擺堿基,其通過增加靶rna序列中的相對核苷酸的編輯頻率而用于增強特異性。當n是兩個或多個時,x′出現(xiàn)多于一次,并且兩個或多個x′可以相同,這取決于靶rna序列中的互補堿基的序列,但是很可能,兩個或多個x′不相同。當n為0時,靶向部分與靶rna序列在靶向部分的整個長度上完全互補,即與靶rna序列沒有任何錯配。該實施方式可能導致腺苷脫氨酶以非特異性方式進行rna編輯,這意味著寡核苷酸構建體的靶向部分與靶rna序列之間的重疊區(qū)域中的所有腺苷同等可能轉化為肌苷??梢酝ㄟ^確保不應被靶向或至少以較低頻率靶向的腺苷遇到具有2’-o修飾的核糖部分比如2’-ome的相對核苷酸(因為后者已知降低相對腺苷編輯的效率),來限制腺苷的任何非特異性編輯?;蛘呋蛄硗猓梢蕴峁┳鳛轼B嘌呤或腺嘌呤的相對堿基,因為這些核堿基通常阻礙相對堿基的脫氨基作用。
根據(jù)另一個實施方式,本發(fā)明提供用于在細胞中的靶rna序列的特定位置進行所需變化的寡核苷酸構建體,其通過募集天然存在于所述細胞中的rna編輯實體,該寡核苷酸構建體具有序列5’-z-l-(x′-y)n-x-3’,其中x與特定位置上游的靶rna序列互補,x′與特定位置下游的靶rna序列互補,y包含一個或多個核苷酸,其與靶rna序列不互補(例如,至多10個,優(yōu)選1至5個,更優(yōu)選1至3個,比如1或2個),n為1至10的整數(shù)(優(yōu)選1至5,更優(yōu)選1至3,或為1),l是任選的接頭序列,并且可以包含任意數(shù)目的核苷酸,包括零,并且z是由所述rna編輯實體識別并結合的序列。l還可以由不同的化學連接,比如(寡)肽連接組成。
當n大于或等于1時,寡核苷酸構建體的靶向部分與靶rna序列不完全互補,而是包含一個或多個錯配或搖擺堿基,其通過增加靶rna序列中的相對核苷酸的編輯頻率而用于增強特異性。當n是兩個或多個時,x′出現(xiàn)多于一次,并且兩個或多個x′可以相同,這取決于靶rna序列中的互補堿基的序列,但是很可能,兩個或多個x′不相同。當n為0時,靶向部分與靶rna序列在靶向部分的整個長度上完全互補,即與靶rna序列沒有任何錯配。該實施方式可能導致腺苷脫氨酶以非特異性方式進行rna編輯,這意味著寡核苷酸構建體的靶向部分與靶rna序列之間的重疊區(qū)域中的所有腺苷同等可能轉化為肌苷。可以通過確保不應被靶向或至少以較低頻率靶向的腺苷遇到具有2’-o修飾的核糖部分比如2’-ome的相對核苷酸(因為后者已知降低相對腺苷編輯的效率),來限制腺苷的任何非特異性編輯。
本發(fā)明的寡核苷酸可以是雜和dna/rna分子,即在同一寡核苷酸內包含脫氧核糖核苷酸和核糖核苷酸。
募集部分:優(yōu)選的實施方式
募集部分應該足夠長以提供由根據(jù)本發(fā)明的編輯實體識別的優(yōu)選以z-rna或z-dna構象的結構,比如莖環(huán)rna或dna結構。如果編輯實體是hadar1,則已知核酸序列通過hadar1的150kda突變體的z-α結構域提供以識別和結合。
來自人工rna或dna莖環(huán)結構的募集部分
作為根據(jù)本發(fā)明的優(yōu)選的募集部分的人工rna或dna莖環(huán)結構的實例包括序列(ry或yr)nnm(ry或yr)n,其中r、y和n表示核糖核苷酸或脫氧核糖核苷酸,并且其中r為a或g,y為t、u或c,n為a、g、c、t或u,n為大于或等于3,m為大于或等于1(優(yōu)選m為大于或等于2,更優(yōu)選m為大于或等于3,還更優(yōu)選m為大于或等于4),并且,其中n形成環(huán)并且兩個(ry)n或(yr)n序列通過互補的watson-crick核堿基配對形成dsrna莖結構(當所有核苷酸均為核糖核苷酸時)或dsdna結構(當所有核苷酸都是脫氧核糖核苷酸時)。募集部分優(yōu)選由所有核糖核苷酸或所有脫氧核糖核苷酸組成,盡管不排除包含核糖核苷酸和脫氧核糖核苷酸兩者的募集部分。
已知結合hadar1的募集部分的特別優(yōu)選的實例是(i)由(cg)ntm(cg)n表示的dna結構,其中n為3,并且m為大于或等于4、優(yōu)選4或5,該dna結構具有形成所謂z-dna結構的傾向,(ii)由式(ry)nnm(ry)n表示的rna結構,其中r是a或g,y是c或u,n是任意的a、g、c或u,并且其中n可以全部相同或不同,n為大于或等于3,m為大于或等于4、優(yōu)選為4或5,該rna結構具有形成z-rna結構的傾向。z-dna和z-rna結構因下述事實在其較常見的對應體方面不同(對于dsdna,b構象是最常見的形式,而對于dsrna,a型最常見):雙螺旋是左旋的,與兩者都是右旋的a和b形式相對,并且z-dna和z-rna的骨架中的核堿基在空間上以“之”字形排列的方式進行排列(因此是前綴“z”)。
來自天然底物rna的募集部分
形成莖環(huán)結構和凸起的非z-rna形成的dsrna序列也作為募集部分發(fā)揮作用。除了上文詳細描述的glur-b,本領域已經描述了具有莖環(huán)和錯配或搖擺堿基對的各種dsrna結構,其與編輯實體的結合結構域相互作用,比如glur-c和glur-d、5-ht2c血清素受體和幾種初級轉錄物(pri-mirna)和mirna前體和mirna。根據(jù)本發(fā)明的寡核苷酸構建體的募集部分中優(yōu)選的環(huán)分別符合保守序列uncg的四元環(huán),其中n可以是任意的a、g、c或u,或者符合保守序列gcuma的五元環(huán),其中m為a或c。當募集部分包含來自本領域已知rna編輯位點的莖環(huán)段時,可以“原樣”采用該莖,或者可以以其它方式改變序列或長度、縮短或修飾,以改變其特征比如對于rna編輯實體的親和力,或出于可制造性或處理性、成本的原因或任何其他原因,只要募集功能不完全受到損害。這些結構可以容易地在體外制備并測試其結合、募集和重定向編輯實體的能力。本領域已知幾種可以商業(yè)獲得的編輯實體,包括hadar,并且在根據(jù)本發(fā)明的寡核苷酸構建體中結合至dsrna或dsdna結構的試驗中進行測試。這種試驗對蛋白質-核酸相互作用領域的技術人員來說是容易獲得的,并且包括電泳遷移率位移分析(emsa)。
已經詳細表征的已知的編輯的rna序列的兩個實例是3-氨基-3-羥基-5-甲基-4-異唑丙酸(ampa)亞型谷氨酸受體的b亞基(glur-b)中。該模型體系包括兩個頻繁編輯的位點,其中將dna編碼的aga編碼為iga,導致精氨酸至甘氨酸替換(r/g位點)以及不同的谷氨酰胺至精氨酸替換(q/r位點)。已知glur-b(r/g)位點包含莖環(huán)結構,其由包含3個錯配、2個a·c和1個g·u搖擺堿基對的71個核苷酸組成。有趣的是,該環(huán)由符合系統(tǒng)發(fā)育保守的gcuma序列的保守性好的五環(huán)結構gcuaa結構組成,其中m為a或c(aruscavagep.j.和bassb.l.rna.2000;6:257-269)。對于兩個搖擺腺苷的編輯似乎有一些偏好,當與所編輯腺苷相對的堿基選自胞苷或尿苷時,優(yōu)選胞苷,效率會提高。
該結構可以方便地按原樣使用,或者在根據(jù)本發(fā)明的寡核苷酸構建體中使用時,通過減少或增加莖中搖擺核堿基對的數(shù)目以修飾編輯的特異性和/或重定向編輯至靶rna序列中的優(yōu)選位點,作為募集部分加以改編。此外,或者也可以通過縮短莖而不完全地消除識別,來修飾對于hadar1的glur-b的識別位點。這種縮短從可制造性或良好前景的成本等可以是方便的。
作為根據(jù)本發(fā)明的優(yōu)選的實施方式的衍生自glur-b結構域的募集部分的實例,其包含序列:5’-(auana)nuauaacaauaugcuaaauguuguuaua(nbuau)n-3’,其中na和nb各自是可以為a、g、c或u的單個核苷酸,其條件是在形成莖環(huán)結構時na和nb形成錯配堿基對,并且n為1或0(即seqidno:6和seqidno:7)。
另一個優(yōu)選的募集部分包括或由以下序列組成:5’-guggncauanauauaacaauaugcuaaauguuguuauanbuaundccac-3’(seqidno:25),其中:na、nb、nc和nd各自可以是核苷酸a、g、c或u,其條件是在莖環(huán)形成時na和nb形成錯配的堿基對且nc和nd形成錯配的堿基對;并且其中gcuaa五核苷酸形成環(huán),并且與gcuaa相鄰的上游和下游序列通過堿基配對形成莖。
募集部分可以在5’或3’端連接到靶向部分,任選地通過包含一個或多個核苷酸的接頭“l(fā)”、寡肽或另一種化學接頭如聚乙二醇(peg)連接。
寡核苷酸構建體的化學修飾
寡核苷酸領域中已知各種可以根據(jù)本發(fā)明容易地使用的化學物質和修飾。核苷酸之間的常規(guī)核苷間鍵可以通過磷酸二酯鍵的一巰基化(thioation)或二巰基化作用以分別產生硫代磷酸酯或二硫代磷酸酯來改變。核苷間鍵的其他修飾是可能的,包括酰胺化和肽接頭。可以通過用低級烷基(c1-4,比如2’-o-me)、烯基(c2-4)、炔基(c2-4),甲氧基乙基(2’-moe)或其它取代基替換2’-o部分來修飾核糖。2’oh基團的優(yōu)選的取代基是甲基、甲氧基乙基或3,3’-二甲基烯丙基基團。已知后者由于其蓬松性(bulkiness)而抑制核酸酶敏感性、同時提高雜交效率的性質(angus和sproatfebs1993vol.325,no.1,2,123-7)?;蛘?,可以應用在核糖環(huán)內部包含2’-4’分子內橋(通常為2’氧和4’碳之間的亞甲基橋)鍵的閉鎖核酸序列(lna)??梢孕揎椸堰屎藟A基和/或嘧啶核堿基以改變其性質,例如通過雜環(huán)的胺化作用或脫氨基作用。確切的化學物質和形式可以取決于寡核苷酸構建體和應用,并且可以根據(jù)本領域技術人員的愿望和偏好來制定。
長度
根據(jù)本發(fā)明的寡核苷酸構建體可以包含20至幾百個核苷酸。由于實際原因比如可制造性和成本,寡核苷酸構建體應優(yōu)選短于200個核苷酸。優(yōu)選地,寡核苷酸構建體的長度為20至100個核苷酸,更優(yōu)選為24至60個核苷酸,還更優(yōu)選為30至50個核苷酸。寡核苷酸構建體的靶向部分優(yōu)選包含多于10個核苷酸,優(yōu)選多于11個、12個、13個、14個、15個、16個、還更優(yōu)選多于17個核苷酸。更長的靶向部分為待編輯的rna序列的靶位點提供更多的特異性,更少的由于無意的(脫靶)結合而導致的脫靶效應,以及更多的空間以產生二級結構,比如在靶向部分本身中的莖環(huán)結構、錯配或搖擺堿基(由于與待編輯的位點處或其附近的靶rna序列中的一個或多個互補堿基的錯配)等等。優(yōu)選的靶向部分與靶rna序列在靶向部分的整個長度上互補,除了與待編輯的核苷酸相對的錯配,以及任選的一個或兩個搖擺堿基。
構象(conformation)
本領域已知的,rna編輯實體(比如hadar)根據(jù)許多因素以不同特異性編輯dsrna結構。一個重要因素是構成dsrna序列的兩條鏈的互補程度。兩條鏈的完美互補通常導致hadar的催化結構域以不區(qū)分的方式使腺苷脫去氨基,或多或少與其遇到的任何腺苷反應。通過提供包含與待編輯的腺苷相對的錯配的靶向部分,可以通過確保dsrna的錯配來增加hadar1的特異性以僅轉變特定的腺苷。優(yōu)選通過提供具有與待編輯的腺苷相對的胞苷或尿苷、最優(yōu)選胞苷的靶向部分來產生錯配。在靶標鏈中的腺苷脫氨時,靶標鏈將獲得肌苷,對于大多數(shù)生物化學過程,細胞的生物化學裝置將該肌苷“讀取”為g。因此,在a至i轉變后,已經解決了錯配,因為i完全能夠與根據(jù)本發(fā)明的寡核苷酸構建體的靶向部分中的相對c進行堿基配對。在因為編輯而解決了錯配之后,釋放底物,并且從靶rna序列中釋放寡核苷酸構建體-編輯實體復合物,然后其可用于下游生物化學過程,比如剪接和翻譯。
編輯靶rna序列所需的特異性水平可以取決于應用。根據(jù)本專利申請中的說明書,本領域技術人員將能夠根據(jù)需要設計寡核苷酸構建體的靶向部分,并且通過一些反復嘗試獲得期望的結果。
本發(fā)明的寡核苷酸構建體的靶向部分通常包含正常的核苷酸a、g、u和c,但也可以包含肌苷(i),例如代替一個或多個g核苷酸。在根據(jù)本發(fā)明的寡核苷酸構建體的募集部分中,g也可以由i替代,但是必須注意,在期望的那些實施方式中,莖或環(huán)中的i不干擾z-dna或z-rna構象的形成。
編輯特異性
為了防止靶rna序列在與寡核苷酸構建體重疊的區(qū)域中的不期望的腺苷編輯,可以對寡核苷酸構建體的靶向部分進行化學修飾。在本領域中已經表明,與靶rna序列中腺苷相對的核苷的核糖基部分的2’-o-甲基化顯著減少adar對該腺苷的脫氨基作用(vogel等人,2014angewandtechemieint.ed.53,6267-71)。因此,通過在寡核苷酸構建體的所需位置包含2’-甲氧基(2’-ome)核苷酸,可以顯著提高編輯的特異性。設想核糖基部分的其它2’-o取代,比如2’-甲氧基乙基(2’-moe)和2’-o-二甲基烯丙基也可以減少靶rna序列中相應(相對)腺苷的不必要的編輯。寡核苷酸合成和設計領域的普通技術人員容易獲得其它化學修飾。這種化學修飾的寡核苷酸構建體的合成以及在根據(jù)本發(fā)明的方法中對它們進行測試不會造成不必要的負擔,并且本發(fā)明也包括其它修飾。
編輯實體
編輯實體通常在性質上是蛋白質的,比如在后生動物包括哺乳動物中發(fā)現(xiàn)的adar酶。編輯實體還可以包括核酸和蛋白質或肽的復合物,比如核糖核蛋白。編輯酶可以僅包括核酸或由核酸組成,比如核酶。所有這些編輯實體都包括在本發(fā)明中,只要它們是由根據(jù)本發(fā)明的寡核苷酸構建體募集的。優(yōu)選地,編輯實體是酶,更優(yōu)選為腺苷脫氨酶或胞苷脫氨酶,還更優(yōu)選為腺苷脫氨酶。當編輯實體是腺苷脫氨酶時,y優(yōu)選為胞苷或尿苷、最優(yōu)選胞苷。最感興趣的之一是人adar,hadar1和hadar2,包括其任何亞型,比如hadar1p110和p150。
可以方便地設計根據(jù)本發(fā)明的寡核苷酸構建體的本領域已知的rna編輯酶,包括作用于rna的腺苷脫氨酶(adar),比如人或人細胞中的hadar1和hadar2,以及胞苷脫氨酶。人adar3(hadar3)已經在現(xiàn)有技術中描述,但據(jù)報道沒有脫氨酶活性。
已知hadar1以兩種亞型存在;長150kda的干擾素誘導型和較短的100kda的型式,其通過來自普通mrna前體的選擇性剪接產生。有趣的是,只有較長的亞型能夠結合至可以包含在根據(jù)本發(fā)明的寡核苷酸構建體的募集部分中的z-dna結構。因此,細胞中存在的150kda亞型的水平可以受到干擾素、特別是干擾素-γ(ifn-γ)的影響。hadar1也可由tnf-α誘導。這提供了開發(fā)聯(lián)合療法的機會,其中將干擾素-γ或tnf-α和包含作為根據(jù)本發(fā)明的募集部分的z-dna的寡核苷酸構建體作為組合產品或作為單獨的產品同時或以任何順序隨后施用給患者。某些疾病狀況可能與患者的某些組織中增加的ifn-γ或tnf-α水平相一致,創(chuàng)造了進一步使編輯對病變組織更特異性的機會。
靶向部分和募集部分都可以包括具有改變核酸酶抗性、改變結合的親合力(表示為解鏈溫度)或其它性質的化學修飾的核苷酸或由其組成?;瘜W修飾的實例是糖部分的修飾,包括通過在糖(核糖)部分中交聯(lián)取代基(例如像在lna或閉鎖核酸中),通過用具有上述長度的烷基(例如2’-o-甲基)、炔基(2’-o-炔基)、烯基(2’-o-烯基)、烷氧基烷基(例如甲氧基乙基,2’-moe)基團等替換2’-o原子。此外,骨架的磷酸二酯基團可以通過巰基化、二巰基化、酰胺化等進行修飾,以產生硫代磷酸酯、二硫代磷酸酯、氨基磷酸酯等核苷間鍵。核苷間鍵可以全部或部分地由肽鍵取代,以產生肽核酸(peptidonucleicacid)序列等?;蛘呋蛄硗?,核堿基可以通過(脫)氨化來修飾,以產生肌苷或2’6’-二氨基嘌呤等。
進一步的修飾可以是核苷酸的胞苷部分中的c5的甲基化,以減少已知與cpg序列相關的潛在的免疫原性。
根據(jù)本發(fā)明的寡核苷酸構建體的總體結構可以從“一條腿的”發(fā)夾(圖1和2)向“兩條腿的”發(fā)夾(圖3)變化,由此腿部包括一個或多個靶向部分,并且發(fā)夾的身體或核心提供募集部分(圖1-3)。寡核苷酸構建體的腿將提供錯配或搖擺核堿基來表示靶rna中編輯位點(例如待編輯的腺苷或胞苷)的相對位點。例如,在寡核苷酸構建體募集adar活性的情況下,為了編輯靶rna中的a至i轉變,錯配或搖擺可以包括腺苷、鳥嘌呤、尿苷或胞苷殘基,優(yōu)選胞苷殘基。除了與編輯位點相對的錯配或搖擺之外,靶向部分通常將與靶rna完全互補,盡管可以允許有限數(shù)量的不完全匹配,比如搖擺或錯配的堿基,而其不會不可接受地損害寡核苷酸構建體和靶rna序列之間的特異性和/或結合強度。發(fā)夾的莖可以由完全互補的核苷酸序列組成,在整個長度上形成雙鏈rna結構?;蛘?,發(fā)夾的莖可以包含一個或多個搖擺或非匹配的相對核苷酸,只要通過編輯活性對寡核苷酸構建體的識別沒有不可接受地損壞。應當理解,細胞中編輯活性的功能作用在其天然編輯位點可能會降低,因為由根據(jù)本發(fā)明的寡核苷酸構建體對負責編輯活性的實體的募集。本領域普通技術人員將理解,將細胞內的編輯實體重定向到其他靶位點的程度可以通過改變根據(jù)本發(fā)明的寡核苷酸構建體的募集部分對編輯實體的識別結構域的親和力來調節(jié)。通過降低寡核苷酸構建體的募集部分對編輯實體的親和力可以通過以下方式中的任何一種或其組合來進行:包括通過改變莖的序列、環(huán)的大小或結構(序列、骨架的化學特性、核糖基、或核苷堿基)或兩者的組合??梢酝ㄟ^一些反復嘗試和/或通過基于寡核苷酸構建體的募集部分與編輯實體的識別結構域之間的結構相互作用的計算方法來確定確切的修飾。
另外或替代地,細胞中存在的編輯實體的募集和重定向的程度可以通過寡核苷酸構建體的配量(dosing)和配量方案來調節(jié)。通常在i期和/或ii期臨床試驗中,這是由實驗者(體外)或臨床醫(yī)生確定的。
優(yōu)選地,本發(fā)明提供由包含用于編輯核酸序列的靶向部分和募集部分的單一寡核苷酸(圖1、圖2a、圖3)組成的寡核苷酸構建體的用途。然而,包括使用兩種寡核苷酸的寡核苷酸構建體(圖2b)(例如一種包含靶向部分的寡核苷酸和一種包含募集部分的寡核苷酸)當然在本發(fā)明的范圍內。因此,根據(jù)另一個實施方式,本發(fā)明提供兩種單獨的寡核苷酸,一種包含靶向部分并且另一種包含募集部分,由此以使得它們彼此具有親和力的方式設計兩種寡核苷酸,例如通過在兩個功能部分之間的反義watson-crick堿基配對或者通過不具有特定的靶向或募集功能的序列,例如接頭序列。這樣的兩組分體系在靈活性、可用性(例如在個性化醫(yī)學的背景下)、可制造性、商品成本或其他方面可能具有優(yōu)勢。依照多組分體系的兩種(或多種)寡核苷酸不一定必須嚴格區(qū)分不同的功能(靶向和募集)。例如,寡核苷酸可以僅在組裝成復合物后產生靶向和募集功能。在兩個寡核苷酸退火、形成dsrna部分的情況下,它們實際上可以在退火時產生募集功能。退火是形成復合物的一種方式,但是很明顯,兩種(或多種)寡核苷酸組分可以通過其它方式聚合在一起,從而聯(lián)合靶向和募集功能。包含多于兩個寡核苷酸的寡核苷酸構建體并不排除在本發(fā)明的范圍之外,盡管每個構建體的寡核苷酸的數(shù)目越大,該體系根據(jù)制造、分析、配方、給藥或處理其他方面(包括物流和成本)越復雜。
哺乳動物細胞
本發(fā)明涉及真核細胞(優(yōu)選后生動物、更優(yōu)選哺乳動物細胞)中靶rna序列的修飾。原則上,本發(fā)明可用于來自任何哺乳動物物種的細胞,但優(yōu)選用于人細胞。
本發(fā)明可用于來自以下任何器官的細胞:例如皮膚、肺、心臟、腎臟、肝臟、胰腺、腸、肌肉、腺體、眼睛、腦、血液等。本發(fā)明特別適用于修飾在(人)受試者的患病狀態(tài)中密切相關的細胞、組織或器官中的序列。這樣的細胞包括但不限于肺或胃腸道的上皮細胞、生殖器官的細胞、肌肉細胞、眼的細胞、皮膚的細胞、來自組織和器官(比如肝臟、腎臟、胰腺)的細胞、免疫細胞、癌細胞、腺細胞、腦細胞等。
本發(fā)明也可以用于并非天然存在于生物體中的哺乳動物細胞,例如,用于細胞系或胚胎干(es)細胞。
本發(fā)明可用于各種類型的干細胞,包括多能干細胞、全能干細胞、胚胎干細胞、誘導的多能干細胞等。
細胞可以定位于體外或體內。本發(fā)明的一個優(yōu)勢是其可以用于活體中原位的細胞,但也可以用于培養(yǎng)的細胞。在一些實施方式中,將細胞離體處理,然后將其引入活體(例如,重新引入至最初從其中衍生的生物體)。
本發(fā)明也可用于在所謂的類器官內的細胞中編輯靶rna序列。可以認為類器官是三維體外衍生的組織,但是使用特定條件驅動以產生單獨的分離的組織(例如,參見lancaster和knoblich,science2014,vol.345no.61941247125)。在治療環(huán)境中,它們是有用的,因為它們可以在體外從患者的細胞中衍生出來,然后可以將類器官作為自體移植材料重新引入患者,該材料與正常移植相比不太可能被排斥。因此,根據(jù)另一個優(yōu)選的實施方式,本發(fā)明可以在從患者取得的組織樣品(例如從其胃腸道,參見sala等人jsurgres.2009;156(2):205-12,以及sato等人gastroenterology2011;141:1762-72)中生長的類器官上實施;在根據(jù)本發(fā)明進行rna編輯時,可以使用類器官或類器官中存在的干細胞,移植回患者以改善器官功能。
待治療的細胞通常具有遺傳突變。突變可以是雜合的或純合的。本發(fā)明通常用于修飾點突變,比如n至a突變,其中n可以是g、c、u(在dna水平上為t),優(yōu)選g至a突變;或n至c突變,其中n可以是a、g、u(在dna水平上為t),優(yōu)選u至c突變。包含特別感興趣的突變的基因將在下面討論。然而,在一些實施方式中,以相反的方式通過將疾病相關的突變引入細胞系或動物中來使用本發(fā)明,以便為討論中的疾病提供有用的研究工具。作為創(chuàng)建疾病模型的例子,我們提供了一個寡核苷酸序列,其在人細胞中提供用于編輯活性的募集,以在cep290基因中產生突變,產生隱蔽剪接位點,其形成先天性兒童失明的最常見形式先天性利伯氏黑蒙(leber’scongenitalamaurosis)。
有待通過rna編輯恢復的突變可以出現(xiàn)在染色體或dna的某些其他形式(比如線粒體dna)或rna(包括mrna前體、核糖體rna或線粒體rna)的水平上。待進行的改變可以在已經感染細胞或受試者的以下病原體的靶rna中:包括真菌、酵母、寄生蟲、動粒細胞、細菌、噬菌體、病毒等。隨后,編輯可以在這種細胞、受試者或病原體內的靶序列的rna水平上發(fā)生。某些病原體,比如病毒,將其核酸、dna或rna釋放到感染的宿主(細胞)的細胞中。其他病原體在受感染的宿主中存在或循環(huán)。本發(fā)明的寡核苷酸構建體可用于編輯受感染真核宿主細胞中存在的靶rna序列,或編輯真核宿主中存在或循環(huán)的病原體細胞內的rna序列,只要待發(fā)生編輯的細胞包含與施用于其中的寡核苷酸構建體相容的編輯實體。
不希望束縛于理論,認為通過hadar1和hadar2的rna編輯在轉錄或剪接期間發(fā)生在細胞核中的mrna前體上。認為通過胞苷脫氨酶的rna編輯發(fā)生在mrna水平上。不排除成熟mrna中線粒體rna密碼子或非編碼序列的編輯。
靶序列和變化
本發(fā)明通過使用寡核苷酸構建體而用于使真核細胞中的靶rna序列發(fā)生變化,該寡核苷酸構建體能夠靶向待編輯的位點并募集細胞中存在的rna編輯實體以引起編輯反應。優(yōu)選的編輯反應是腺苷脫氨基作用和胞苷脫氨基作用,分別將腺苷轉變成肌苷以及將胞苷轉變成尿苷。這些變化可能是在靶rna的5’或3’非翻譯區(qū)、(隱蔽)剪接位點、外顯子(改變從靶rna翻譯的蛋白質中的氨基酸,通過改變外顯子剪接沉默子或增強子而改變密碼子使用或剪接行為,通過引入或去除起始或終止密碼子)、內含子(通過改變內含子剪接沉默子或內含子剪接增強子、分支點而改變剪接)以及通常影響rna穩(wěn)定性、結構或功能性的任何區(qū)域中。靶rna序列可以包含可能希望校正或改變的突變,比如(轉變或轉換)?;蛘撸室獾貙衦na突變以產生之前沒有突變的改變的表型(或基因型,在基于rna的生物體例如rna病毒的情況下)。例如,可以制備攜帶靶rna序列中的變化(突變)的細胞系或動物,其可用于試驗中,或作為(動物、類器官等等)模型體系來研究疾病,測試針對疾病的實驗化合物等。根據(jù)本發(fā)明的寡核苷酸構建體和方法可以用于高通量篩選系統(tǒng)(以陣列形式),用于制備具有大量靶rna的細胞庫,例如編碼大量蛋白質亞型、用于進一步實驗包括復合篩選、蛋白質工程等。
靶rna可以是任何細胞的或病毒的rna序列,但更通常是具有蛋白質編碼功能的mrna前體或mrna。
為了便于參考,并且并不意在限制本發(fā)明,提供下表以說明由本發(fā)明的寡核苷酸引導的腺苷脫氨酶編輯可引起的潛在的密碼子變化。不應將該表具體解釋為將本發(fā)明的適用性限制于任何rna的編碼序列;如已經指出的,本發(fā)明可以在包含腺苷的任何rna靶標上實施,無論是編碼區(qū)、內含子、非編碼外顯子(比如5’-或3’非翻譯區(qū))、mirna、trna、rrna等。為了避免對適用性的范圍的任何誤解,從編碼的角度來看,無關緊要(“沉默的”)的變化可能仍然會改變某種蛋白質的基因表達,因為相同氨基酸的某些密碼子可能比其他氨基酸的更優(yōu)選,并且可能導致例如不同的轉錄穩(wěn)定性或翻譯效率,導致編碼的蛋白質相比于沒有變化者而更加或者更不豐足。
用于使用根據(jù)本發(fā)明的寡核苷酸進行編輯的特別令人感興趣的靶腺苷酸是那些作為定義關鍵功能或特征的氨基酸殘基的密碼子的一部分,這種氨基酸殘基比如催化位點、其他蛋白質的結合位點、用于底物結合的結合位點、用于共翻譯修飾或翻譯后修飾比如糖基化、羥基化、肉豆蔻?;⒌鞍酌傅牡鞍浊懈?以成熟蛋白質和/或作為細胞內途徑的一部分)等的定位結構域。
許多遺傳性疾病是由g至a突變引起的,并且這些是優(yōu)選的靶疾病,因為突變靶腺苷處的腺苷脫氨基作用會將突變逆轉為野生型。然而,逆轉至野生型對于獲得有益的效果可能并不總是必要的。如果野生型核苷酸不是g,則靶標中a至g的修飾也可以是有益的。在某些情況下,可以預測是這種情況,其他可能需要進行一些測試。在某些情況下,從野生型不是g的靶rna中的a至g的修飾可以是沉默的(未翻譯成不同的氨基酸)、或其他方式無結果的(例如氨基酸被替換但它構成了不破壞蛋白質結構和功能的保守替換)、或者氨基酸是具有一定的變化穩(wěn)定性(robustness)的功能結構域的一部分。如果根據(jù)本發(fā)明通過編輯產生的a至g轉變是在非編碼rna或rna的非編碼部分中,則結果也可能與原始突變相比無關緊要的或不那么嚴重。本領域普通技術人員將理解,本發(fā)明的適用性非常廣泛,并且甚至不限于預防或治療疾病。本發(fā)明也可用于修飾轉錄物以研究其效果,即使或特別是當這種修飾在例如細胞或非人動物模型中誘導患病狀態(tài)時。
可以用根據(jù)本發(fā)明的寡核苷酸預防和/或治療的遺傳性疾病的優(yōu)選的實例是其中靶rna中的一個或多個腺苷的修飾將帶來(潛在的)有益變化的任何疾病。
作為根據(jù)本發(fā)明的潛在靶rna序列的轉錄rna序列,其包含特別感興趣的突變,包括但不限于轉錄自cftr基因(囊性纖維化跨膜電導調節(jié)子)、肌營養(yǎng)不良蛋白、亨廷頓蛋白(huntingtin)、神經纖維瘤蛋白1、神經纖維瘤蛋白2、血紅蛋白的β-球蛋白鏈、cep290(中心體蛋白質290kda)、β-氨基己糖苷酶a的hexa基因和負責稱為尤塞氏綜合癥(ushersyndrome)的遺傳性失明的一種形式的尤塞氏(usher)基因(例如編碼usherin的ush2b)的任何一種的那些。下面進一步提供一個更廣泛的列表。將相應地選擇靶序列,并且寡核苷酸構建體將包括所需的修飾以校正突變。
cf突變領域的技術人員認識到在cftr基因中1000和2000之間的突變包括r117h、g542x、g551d、r553x、w1282x和n1303k是已知的。
通常,使用本發(fā)明的寡核苷酸構建體可逆轉的任何靶rna中的突變,在腺苷脫氨酶募集的情況下為g至a突變,并且在胞苷脫氨酶募集的情況下為u至c突變,并且能夠相應地設計寡核苷酸構建體??梢允褂酶鶕?jù)本發(fā)明的寡核苷酸構建體進行靶向的突變,在募集腺苷脫氨酶的情況下還包括c至a、u至a(在dna水平上為t至a),并且在募集胞苷脫氨酶的情況下為a至c和g至c突變。盡管在后一種情況下的rna編輯可能不一定將突變恢復為野生型,但編輯的核苷酸可能會比原始突變產生改善。例如,可以將引起讀碼框終止密碼子的突變——在翻譯后產生截短的蛋白質——改變成一個密碼子,其編碼的氨基酸可能不是該位置的原始氨基酸,但是其產生具有至少一些功能性(至少比截短的蛋白質更多功能性)的(全長)蛋白質。
靶序列對于真核細胞、優(yōu)選哺乳動物、更優(yōu)選人細胞是內源的。因此,靶序列不是例如已經在細胞經歷中的某一點人工引入的轉移基因或標志物基因,而是天然存在于細胞中的基因(無論是突變還是非突變形式)。
本發(fā)明不限于校正突變,因為相反,其可以通過應用本發(fā)明的寡核苷酸,用于將野生型序列改變?yōu)橥蛔兊男蛄?。其中對于修飾野生型腺苷可能有利的一個實例是引起外顯子的跳過,例如通過修飾恰好是剪接所述外顯子所需的分支位點的腺苷。另一個實例是其中腺苷界定或者是用于蛋白質結合的識別序列的一部分的情形,或者參與限定mrna穩(wěn)定性的二級結構的情形。因此,如上所述,本發(fā)明可用于為疾病提供研究工具、引入比現(xiàn)有突變不那么有害的新突變等。
寡核苷酸構建體的應用
待施用的寡核苷酸構建體的量、劑量和配量方案可以根據(jù)細胞類型、待治療的疾病、靶群體、給藥模式(例如全身與局部相比)、疾病的嚴重程度和可接受的副作用水平而不同,但是在體外研究、臨床前和臨床試驗中,這些可以并且應該通過反復嘗試來評估。當修飾的序列導致容易檢測到的表型變化時,這些試驗特別明確??赡茌^高劑量的寡核苷酸可以競爭結合細胞內的核酸編輯實體(例如adar),從而消耗可以自由參與rna編輯的實體的量,但常規(guī)配量試驗將顯示任何給定寡核苷酸和給定靶標的這種效應。
一種合適的試驗技術包括將寡核苷酸構建體遞送至細胞系或測試生物體,然后在其后的不同時間點取活檢樣本??梢栽诨顧z樣本中評估靶rna的序列,并且隨后可以容易地評估具有修飾的細胞的比例。在已經進行一次該試驗之后,然后可以保留知識并且可以進行將來的遞送,而無需采取活檢樣本。
因此,本發(fā)明的方法可以包括鑒定細胞的靶rna序列中所需變化的存在的步驟,從而驗證已經修飾了靶rna序列。該步驟通常包括靶rna或其cdna拷貝(或如果靶rna是mrna前體的情況下,其剪接產物的cdna拷貝)的相關部分的測序,如上所述,并且因此可以容易地驗證序列變化。或者,該變化可以在蛋白質的水平(長度、糖基化、功能等)或通過某種功能的讀出比如(誘導型)電流(例如當由靶rna編碼的蛋白質是離子通道時)來進行評估。在cftr功能的情況下,包括人在內的哺乳動物的ussing小室測定或npd測試是本領域技術人員熟知的,以評估功能的恢復或獲得。
在細胞中發(fā)生rna編輯之后,修飾的rna可以隨時間而稀釋,例如由于細胞分裂、編輯的rna的有限半衰期等等。因此,在實際治療條件中,本發(fā)明的方法可以包括重復遞送寡核苷酸構建體,直到已經修飾足夠的靶rna,以向患者提供切實的益處和/或隨時間而維持該益處。
寡核苷酸構建體的遞送
本發(fā)明的寡核苷酸構建體特別適用于治療用途,并因此本發(fā)明提供包含本發(fā)明的寡核苷酸構建體和藥學上可接受的載體的藥物組合物。在本發(fā)明的一些實施方式中,藥學上可接受的載體可以簡單地是鹽水溶液。這可以有用地是等滲或低滲的,特別是用于肺部輸送。
本發(fā)明還提供包括本發(fā)明的藥物組合物的遞送裝置(例如注射器、吸入器、霧化器)。
本發(fā)明還提供本發(fā)明的寡核苷酸構建體,如本文所述,其用于在哺乳動物、優(yōu)選人細胞中進行靶rna序列改變的方法。類似地,本發(fā)明提供本發(fā)明的寡核苷酸構建體如本文所述的在制備用于在哺乳動物、優(yōu)選人細胞中進行靶rna序列改變的藥物中的用途。
用于治療的配方、配量和給藥模式
根據(jù)本發(fā)明的寡核苷酸構建體適當?shù)匾运芤哼M行施用,例如鹽水或懸浮液,其任選地包含與藥物使用相容的添加劑、賦形劑和其它成分,濃度范圍為1ng/ml至1g/ml,優(yōu)選為10ng/ml至500mg/ml,更優(yōu)選為100ng/ml至100mg/ml。劑量可以適當?shù)卦诩s1μg/kg至約100mg/kg之間,優(yōu)選在約10μg/kg至約10mg/kg,更優(yōu)選在約100μg/kg至約1mg/kg的范圍內。給藥可以通過吸入(例如通過霧化)(鼻內、口服)、通過注射或灌注(靜脈內、皮下、皮內、顱內、肌內、氣管內、腹膜內、直腸內)、通過直接注射入腫瘤等。給藥可以以固體形式、粉末形式、丸劑形式,或以相容于在人中的藥物使用的任何其它形式。
本發(fā)明特別適用于治療遺傳性疾病,比如囊性纖維化、白化病、α-1-抗胰蛋白酶缺乏癥、阿爾茨海默病、肌萎縮性側索硬化癥、哮喘、β地中海貧血癥、cadasil綜合征、進行性腓肌萎縮(charcot-marie-tooth)病、慢性阻塞性肺疾病(copd)、遠端脊髓性肌萎縮(dsma)、杜氏型和貝氏型肌營養(yǎng)不良(duchenne/beckermusculardystrophy)、營養(yǎng)不良性大皰性表皮松解癥、大皰性表皮松解癥、法布里病、第五凝血因子相關疾病(factorvleidenassociateddisorders)、家族性腺瘤、息肉病、半乳糖血癥、高歇氏病(gaucher’sdisease)、葡萄糖-6-磷酸脫氫酶、血友病、遺傳性血色素沉著病、亨特氏綜合征(huntersyndrome)、亨廷頓氏病(huntington’sdisease)、赫勒氏綜合癥(hurlersyndrome)、炎性腸病(ibd)、繼發(fā)性多聚凝集綜合征(inheritedpolyagglutinationsyndrome)、leber先天性黑內障、自毀容貌綜合癥(lesch-nyhansyndrome)、林奇綜合征(lynchsyndrome)、馬凡氏綜合癥(marfansyndrome)、粘多糖貯積癥、肌肉萎縮癥、i型和ii型強直性營養(yǎng)不良、神經纖維瘤病、a、b和c型尼曼-皮克病(niemann-pickdisease)、ny-eso1相關的癌癥、帕金森氏病、黑斑息肉綜合征(peutz-jegherssyndrome)、苯丙酮酸尿癥、龐貝氏病(pompe’sdisease)、原發(fā)性睫狀病、凝血酶原突變相關疾病比如凝血酶原g20210a突變、肺動脈高壓、色素性視網(wǎng)膜炎、sandhoff病、嚴重聯(lián)合免疫缺陷綜合征(scid)、鐮刀形細胞貧血癥、脊髓性肌肉萎縮癥、stargardt病、tay-sachs病、尤塞氏綜合癥(ushersyndrome)、x連鎖免疫缺陷癥、各種形式的癌癥(例如brca1和brca2連鎖的乳腺癌和卵巢癌)等。
在一些實施方式中,寡核苷酸構建體可以全身遞送,但更有代表性的是將寡核苷酸構建體遞送到在其中觀察到靶序列表型的細胞。例如,cftr中的突變導致囊性纖維化,其主要在肺上皮組織中觀察到,因此對于cftr靶序列,優(yōu)選將寡核苷酸構建體特異性地并直接地遞送至肺。這可以通過例如粉末或氣溶膠的吸入方便地實現(xiàn),通常通過使用霧化器。特別優(yōu)選的是使用所謂的振動篩網(wǎng)的噴霧器,其包括來自偉康公司(respironics)的parieflow(rapid)或i-neb。本發(fā)明人已經發(fā)現(xiàn),寡核苷酸構建體的吸入使用可導致寡核苷酸構建體的全身分布并由腸、肝、胰腺、腎和唾液腺組織等中的細胞攝取。因此,預期根據(jù)本發(fā)明的寡核苷酸構建體的吸入遞送也可以有效地靶向這些細胞,在cftr基因靶向的情況下,這可以導致與囊性纖維化相關的胃腸道癥狀的改善。對于其它靶序列,取決于疾病和/或靶器官,給藥可以是局部的(例如在皮膚上)、皮內、皮下、肌肉內、靜脈內、口服、眼睛注射等。
在某些疾病中,粘液層顯示厚度增加,導致藥物通過肺的吸收減少。一種這樣的疾病是慢性支氣管炎,另一個實例是囊性纖維化。各種形式的粘液正?;瘎?normalizer)是可用的,比如dna酶、高滲鹽水或可以以bronchitol的名稱商購的甘露醇。當粘液正?;瘎┡crna編輯寡核苷酸構建體(比如本發(fā)明的寡核苷酸構建體)組合使用時,它們可能增加這些藥物的有效性。因此,將根據(jù)本發(fā)明的寡核苷酸構建體施用于受試者、優(yōu)選人受試者,優(yōu)選與粘液正?;瘎?yōu)選本文所述的那些粘液正?;瘎┙M合。此外,施用根據(jù)本發(fā)明的寡核苷酸構建體可以與施用用于治療cf的小分子組合,比如增效劑化合物例如kalydeco(ivacaftor;vx-770),或校正化合物,例如vx-809(lumacaftor)和/或vx-661。cf的其它組合療法可以包括本發(fā)明的寡核苷酸構建體與腺苷脫氨酶的誘導劑(使用ifn-γ或tnf-α)組合使用。
或者,或與粘液正常化劑組合,可以應用粘液穿透顆?;蚣{米顆粒中的遞送,用于將rna編輯分子有效遞送至例如肺和腸的上皮細胞。因此,將本發(fā)明的寡核苷酸構建體施用于受試者、優(yōu)選人受試者,優(yōu)選使用粘液穿透顆?;蚣{米顆粒中的遞送。
慢性和急性肺部感染通常存在于患有比如囊性纖維化的疾病的患者中??股刂委煖p少細菌感染和比如粘液增厚和/或生物膜形成的癥狀。與根據(jù)本發(fā)明的寡核苷酸構建體組合使用抗生素可以增加rna編輯的有效性,這是由于寡核苷酸構建體更容易接近靶細胞。因此,將本發(fā)明的寡核苷酸構建體施用于受試者、優(yōu)選人受試者,優(yōu)選與抗生素治療組合以減少細菌感染和比如粘液增厚和/或生物膜形成的癥狀。施用抗生素可以全身或局部或兩者進行。
為了應用于例如囊性纖維化患者中,根據(jù)本發(fā)明的寡核苷酸構建體或根據(jù)本發(fā)明的包裝或復合的寡核苷酸構建體可以與任何粘液正?;瘎┤鏳na酶、甘露醇、高滲鹽水和/或抗生素和/或用于治療cf的小分子比如增效劑化合物例如ivacaftor或校正化合物例如lumacaftor和/或vx-661組合。
為了增加對靶細胞的接近,可以在施用根據(jù)本發(fā)明的寡核苷酸構建體之前,應用支氣管肺泡灌洗液(bal)來清潔肺。
本發(fā)明還提供包含seqidno:1至seqidno:3中任一個的核苷酸序列的寡核苷酸構建體:
gfpseqidno:15′-cgcgcgttttcgcgcg
cep290seqidno:25′-cgcgcgttttcgcgcg
cftrseqidno:35′-cgcgcgttttcgcgcg
相應序列seqidno:9g551dmrna3′-gcaacua*gaggugag-5′
小寫字母=具有形成z-dna結構傾向的dna
粗體帶下劃線=2’-o-甲基
斜體=硫代磷酸酯核苷間鍵和2’-o-甲基
c*=與待編輯的靶腺苷相對的堿基
類似地,本發(fā)明還提供包含seqidno:16至seqidno:22中任一個的核苷酸序列的寡核苷酸構建體(以及任選地,對這樣的核苷酸序列的實施例1中所述的核酸修飾)或seqidno:2、seqidno:3、seqidno:28、seqidno:38、seqidno:39、seqidno:40和seqidno:41(以及任選地對這些核苷酸序列的實施例2至5中所述的核酸修飾)。
通用
術語“腺嘌呤”、“鳥嘌呤”、“胞嘧啶”、“胸腺嘧啶”、“尿嘧啶”和次黃嘌呤(肌苷中的核堿基)是指這樣的核堿基。
術語腺苷、鳥苷、胞苷、胸苷、尿苷和肌苷是指與(脫氧)核糖基糖連接的核堿基。
術語“核苷”是指與(脫氧)核糖基糖連接的核堿基。
術語核苷酸是指各自的核堿基-(脫氧)核糖基-磷酸連接物,以及核糖部分或磷酸基團的任何化學修飾。因此,該術語將包括:包含閉鎖的核糖基部分(包含2’-4’橋、包含亞甲基或本領域中熟知的任何其它基團)的核苷酸、包含接頭的核苷酸,該接頭包括磷酸二酯、磷酸三酯、(二)硫代磷酸酯、甲基膦酸酯類、氨基磷酸酯接頭等。
有時術語腺苷和腺嘌呤、鳥苷和鳥嘌呤、胞嘧啶和胞苷、尿嘧啶和尿苷、胸腺嘧啶和胸苷、肌苷和次黃嘌呤,可互換使用以指相應的核堿基、核苷或核苷酸。
有時術語核堿基、核苷和核苷酸可互換使用,除非上下文明確要求不同。
無論何時提及“寡核苷酸”,都是指寡核糖核苷酸和脫氧寡核糖核苷酸二者,除非上下文另有說明。無論何時提及寡核糖核苷酸,其可以包含堿基a、g、c、u或i。無論何時提及脫氧寡核糖核苷酸時,其可以包含堿基a、g、c、t或i。
無論何時提及寡核苷酸構建體中的核苷酸,包括比如胞嘧啶、5-甲基胞嘧啶、5-羥甲基胞嘧啶和β-d-葡糖基-5-羥基-甲基胞嘧啶;當提及腺嘌呤時,包括n6-甲基腺嘌呤和7-甲基腺嘌呤;當提及尿嘧啶時,包括二氫尿嘧啶、4-硫尿嘧啶和5-羥甲基尿嘧啶;當提及鳥嘌呤時,包括1-甲基鳥嘌呤。
無論何時提及核苷或核苷酸,都包括呋喃核糖衍生物比如2’-脫氧,2’-羥基,和2’-o-替換的變體比如2’-o-甲基,以及包括2’-4’橋連突變體的其它修飾。
無論何時提及寡核苷酸,兩個單核苷酸之間的鍵可以是磷酸二酯鍵以及其修飾,包括磷酸二酯、磷酸三酯、(二)硫代磷酸酯、甲基膦酸酯、氨基磷酸酯接頭等。
術語“包括(comprising)”涵蓋“包含(including)”以及“組成”。例如,“包括”x的組合物可以僅由x組成,或者可以包含另外的某物,例如x+y。
與數(shù)值x有關的術語“約”是任選的,并且指例如x±10%。
單詞“基本上(substantially)”不排除“完全地”。例如“基本上不含”y的組合物可以完全不含y。在相關的情況下,從本發(fā)明的定義中可以省略“基本上”一詞。
與核酸序列的術語“下游”是指在3’方向進一步延伸序列;術語“上游”是指反過來。因此,在編碼多肽的任何序列中,起始密碼子在有義鏈中在終止密碼子的上游,但在反義鏈中在終止密碼子的下游。
提及“雜交”通常是指特異性雜交,并排除非特異性雜交。特異性雜交可以使用本領域熟知的技術在所選擇的實驗條件下發(fā)生,以確保探針和靶標之間大部分穩(wěn)定的相互作用,其中探針和靶標具有至少70%、優(yōu)選至少80%、更優(yōu)選至少90%的序列同一性。
附圖說明
圖1:靶rna序列和根據(jù)本發(fā)明的寡核苷酸構建體的簡圖;a:寡核苷酸構建體設計為單個寡核苷酸“單腿”構建體,其靶向部分在其3’端并且募集部分在其5’端。b:寡核苷酸構建體設計為單個寡核苷酸“單腿”構建體,其靶向部分在其5’末端并且募集部分在其3’端;將編輯實體描繪為灰色結構,描繪了左側的識別結構域和右側的催化結構域,表明靶位點處的脫氨基反應(閃光符號)。
圖2:靶rna結構與寡核苷酸構建體的簡圖:a示出在靶向部分和募集部分之間具有接頭的寡核苷酸構建體;b示出其中寡核苷酸構建體包含兩個寡核苷酸序列——非共價結合——通過watson-crick反義堿基配對通過它們各自的3’部分相互作用的實施方式。
圖3:靶rna結構與以“雙腿”形式的寡核苷酸構建體的簡圖,其中靶向部分由募集部分分開(或“分裂”);a示出相對于寡核苷酸構建體的募集部分,在靶rna序列中的上游的編輯位點;b示出相對于寡核苷酸構建體的募集部分,在靶rna序列中的下游的編輯位點。
圖4:用pgfpstop57和指定的寡核苷酸進行脂質體轉染后hela細胞中顯示綠色熒光的孔的熒光顯微法,除了:左上孔道(panel)是未處理的細胞;底部四個孔道是沒有接收指定成分中的至少一個的對照。圖4a和4b僅通過對比度不同。
圖5:用pgfpstop57、padar2和寡核苷酸#11以兩種質粒的不同比例進行脂質體轉染后,hela細胞中顯示綠色熒光的孔的熒光顯微法。左上方孔道是未處理的細胞;底部孔道示出具有編碼非突變gfp而不是pgfpstop57的質粒的細胞。
圖6:未處理或用50nm或200nm寡核苷酸#11(或500nm對照寡核苷酸)與pgfpstop57一起轉染后24或48小時,在hela細胞中顯示綠色熒光的孔的熒光顯微法。
圖7:未處理(左峰)或轉染的(右峰)hela細胞的facs光譜。在7a-7f中,細胞用pgfpstop57和寡核苷酸#11轉染。在7b-7f(但不是7a)中,細胞用padar2也進行轉染。在7g和7h中,表達非突變型gfp。
如本文中對本發(fā)明的詳細描述中所解釋的,附圖中所示的所有實施方式可以組合。
實施例
實施例1:通過定點a至i編輯,逆轉gfp靶rna中的無義突變
待使用的寡核苷酸構建體:5’-cgcgcgttttcgcgcg
進一步的實驗再次使用由質粒(‘pgfpstop57’)表達的由于g→a點突變而具有內部tag終止密碼子的突變型gfp。另外用編碼adar2的質粒轉染細胞,以確保細胞能夠進行rna編輯?;趃fp突變特異性的靶向部分和基于glur-b的募集部分的原理,制備各種寡核苷酸用于通過突變的a殘基的脫氨基作用來恢復gfp表達。
測試了7種rna寡核苷酸,以及這些靶向的短、中或長形式的glur-b(s/m/l;募集部分的不同長度)。此外,它們具有任一順序(上游/下游)的靶向和募集部分,并且在一些情況下,寡核苷酸包括化學修飾區(qū)域(對募集部分進行化學修飾以包含2’-ome糖和硫代磷酸酯鍵;以相同的方式修飾靶向部分,除了突變的a位置(雙下劃線)及其兩側翼核苷酸)。所有寡核苷酸包含seqidno:7(下劃線),并且gfp靶向部分以粗體顯示:
hela細胞在補充有10%熱滅活的胎牛血清的dmem培養(yǎng)基中培養(yǎng)。將細胞保持在具有5%co2的加濕空氣氣氛中。在轉染前一天將8x104個細胞接種在24孔板的一個孔中,并且當它們達到70-80%融合時,根據(jù)制造商的程序通過使用lipocetamine2000用(i)寡核苷酸+gfpstop57質?;?ii)寡核苷酸+gfpstop57+adar2質粒進行瞬時轉染。在轉染后24小時更新培養(yǎng)基,并且24小時后在熒光顯微鏡下檢查gfp表達。
還進行facs分析。將細胞用胰蛋白酶消化并收集在微量離心管中,然后重懸于流式細胞術染色緩沖液中。基于使用前向散射和側向散射(不包括碎屑)的形態(tài)特性來選擇完整細胞。在完整細胞中,計算gfp平均熒光強度(mfi)的中值和平均值。使用布局編輯器創(chuàng)建疊加直方圖。
未用adar質粒轉染的細胞的結果在圖4中示出,并且高于對照所見水平(其由于細胞和/或培養(yǎng)基成分的自發(fā)熒光)的綠色熒光對于所有七種寡核苷酸都是清楚可見的。寡核苷酸#10和#11得到最好的結果(兩者都具有長的glur-b募集部分),并且具有上游募集部分(#11)的寡核苷酸稍好一些。
因此選擇寡核苷酸#11用于進一步與編碼adar2的質粒組合的研究。圖5再次示出用寡核苷酸#11處理的細胞發(fā)出熒光高于在陰性對照中所見的水平。為了比較,用編碼非突變gfp的質粒轉染細胞,并且看到預期的熒光(圖5,底部孔道)。
測試不同濃度的寡核苷酸#11,范圍為50-1500nm。圖6示出在使用50nm和200nm的24或48小時后,連同未處理的細胞(左)和用500nm具有與寡核苷酸#11相同長度和化學修飾的對照寡核苷酸進行測試的對照細胞的實例結果。寡核苷酸#11顯示熒光隨時間依賴性增加,這用對照寡核苷酸未見。
通過facs,寡核苷酸對gfp表達的影響也是可見的(圖7)。用寡核苷酸#11與(7b-7f)或不與(7a)adar2質粒處理的細胞相對于未處理的細胞(左側峰)顯示gfp熒光的增加。非突變型gfp用作陽性對照(7g-7h)。
實施例2:通過定點的a至i編輯,在cep290靶rna中引入隱蔽剪接位點
待使用的寡核苷酸構建體:5’-cgcgcgttttcgcgcg
所有細胞系都是由皮膚活檢產生的人成纖維細胞。fbl1(cl10-00008)和fbl2(cl12-00027)是野生型,并代表對照細胞系,fbl3(cl12-00035)和fbl4(cl12-00036)均為cep290突變的純合突變體(c.2991+1655a>g)。所有細胞系在補充有20%的fbs、1%pen/strep和1%丙酮酸鈉的dmem培養(yǎng)基(lifetechnologies)中生長。
在轉染前一天,將細胞以2x105/孔的密度接種在6孔板中,總體積為2.5ml的培養(yǎng)基。轉染之日,使用maxpei(poliscience)作為轉染劑,將待測試的aon以100nm的終濃度加入到每個孔中,質量比寡核苷酸∶pei為1∶4。24小時后,用pbs洗滌細胞,收集細胞裂解物并在-80℃冷凍。
使用promega試劑盒reliapreprnacellminiprepsystem,從已經保存在-80℃的細胞裂解液中分離rna。使用nanodrop2000分光光度計對總rna進行定量。
根據(jù)制造商的說明書,使用versocdna合成試劑盒(thermoscientific),將400ngrna用作模板用于cdna合成。
將cdna稀釋2.5倍用于該反應,并將2μl這些稀釋的cdna用作模板。靶序列的擴增使用來自lifetechnologies的amplitaq
使用來自agilenttechnologies的agilentdna1000kit,在agilent2100bioanalyzer中分析pcr片段。該試劑盒包含由相互連接的微通道組成的芯片,通過該芯片,將片段基于它們的尺寸分離,因為它們通過該芯片進行電泳驅動。為了測量cep290mrna的表達水平,分別將野生型和突變型轉錄物擴增為93bp和117bp片段。人p0大核糖體蛋白mrna(rplp0)用作標準化。使用的引物是wt_fw(seqidno:12)、wt-rv(seqidno:13)、mt_fw(seqidno:14)和mt_rv(seqidno:15)。對于該反應,來自lifetechnologies的sybr選擇的主混合物以及稀釋10倍的cdna作為模板。pcr程序為50℃進行2分鐘,95℃進行2分鐘,50個循環(huán):95℃進行15秒、62.5℃進行1分鐘。
實施例3:通過定點的a至i編輯,逆轉突變型cftrg551d靶rna中的氨基酸替換
待使用的寡核苷酸構建體:5’-cgcgcgttttcgcgcg
細胞系是分別由皮膚和心臟心包膜活檢產生的人成纖維細胞gm00142和gm03465,coriellinstitutecellrepository)。它們都是雜合子:一個等位基因攜帶deltaf508缺失突變(phe508del),并且第二個等位基因攜帶核苷酸1784處的g至a轉變(1784g>a),其將gly-551密碼子(ggt)轉變?yōu)閍sp(gat),導致cftr基因中外顯子11的錯義突變[gly551asp(g551d)]。所有的細胞系都在補充有15%的未滅活fbs和1%的pen/strep的具有earle氏鹽和非必需氨基酸的emem(lifetechnologies)中生長。
在轉染前一天,將細胞以2x105/孔的密度接種在6孔板中,總體積為2.5ml的培養(yǎng)基。轉染當日,使用maxpei(poliscience)作為轉染劑,將待測試的寡核苷酸以100nm的終濃度加入到每個孔中,質量比寡核苷酸∶pei為1∶4。24小時后,用pbs洗滌細胞,收集細胞裂解物并在-80℃冷凍。
使用promega試劑盒reliapreprnacellminiprepsystem,從已經保存在-80℃的細胞裂解液中分離rna。使用nanodrop2000分光光度計對總rna進行定量。根據(jù)制造商的說明書,使用versocdna合成試劑盒(thermoscientific),將400ngrna用作模板用于cdna合成。首先將0.4μm正向和反向引物、25μm的各dntp、1×amplitaq
實施例4:通過靶向的a至i編輯來逆轉α-1-抗胰蛋白酶(a1at)轉錄物中的氨基酸替換突變,用于治療a1at缺陷癥
寡核苷酸(seqidno:28):
adar45:rgrgrararurargrurarurararcrararurarurgrcrurarararurgrururgrururarurargrurarurcrcrcmc*ma*mg*mu*mcmcmcmumumumcrurcrgmumcmgmamumgmg*mu*mc*ma*mg
adar47:mg*mg*ma*ma*mu*ma*mg*mu*ma*mu*ma*ma*mc*ma*ma*mu*ma*mu*mg*mc*mu*ma*ma*ma*mu*mg*mu*mu*mg*mu*mu*ma*mu*ma*mg*mu*ma*mu*mc*mc*mcmc*ma*mg*mu*mcmcmcmumumumcrurcrgmumcmgmamumgmg*mu*mc*ma*mg
r=無修飾
m=2’o-me
*=硫代磷酸酯鍵
肝成纖維細胞的轉染
肝成纖維細胞提供自coriellcellrepository(gm11423),其從z等位基因(zz)純合的供體受試者中分離,該z等位基因由serpina1基因的外顯子5的核苷酸9989處的g>a轉變[9989g>a]產生,導致在賴氨酸替換密碼子342處的谷氨酸[glu342lys(e342k)]。將細胞保持在emem培養(yǎng)基(lifetechnologies)中并以15%fbs進行補充。在轉染前一天,將細胞接種在6孔板中,總體積為2ml的培養(yǎng)基。在轉染當天,將寡核苷酸加入到1.5ml微量離心管中的1xpbs(thermofisherscientific)中,并與maxpei(polysciences)混合并共同孵育,并孵育20分鐘。同時,從細胞中除去細胞培養(yǎng)基,并加入適量的含15%fbs的新鮮emem。然后將dna/寡核苷酸-maxpei稀釋的混合物逐滴加入細胞。細胞在37℃下孵育,并且培養(yǎng)基在6-24小時后更新。
rna分離
使用reliapreprnacellminiprepsystem(promega)根據(jù)制造商的程序進行rna分離。簡言之,除去培養(yǎng)基,并用冷pbs洗滌細胞。在6孔板的每個孔中加入250μl裂解緩沖液。將板緩緩搖動,并通過在孔表面上重復移液將細胞完全裂解。將85μl異丙醇按推薦的方式加入到裂解物中,并將裂解物轉移至小柱,并以12,000-14,000g(rt)離心30秒,棄去液體。加入500μlrna洗滌溶液,并以12,000-14,000g再次離心30秒。在無菌管中,通過將樣品與24μl黃色核心緩沖液(yellowcorebuffer)、3μl0.09mmncl2、3μldna酶i合并來制備dna酶i孵育主混合物,并將30μl新鮮制備的dna酶i混合物加入至每個樣品的柱中的膜,在室溫下孵育15分鐘。然后加入200μl柱洗滌溶液,并以12,000-14,000g離心15秒。然后加入500μlrna洗滌溶液,并以12,000-14,000g離心30秒,并棄去液體。將小柱放入新的收集管中,并加入300μlrna洗滌溶液,并以14,000g離心2分鐘。將每個小柱放入洗脫管中,并將無核酸酶的水加入至膜并離心1分鐘。最后,在nanodrop測量rna濃度。
cdna合成
使用具有500ng或1000ngrna輸入的versocdna合成試劑盒(thermofisher)進行cdna合成。通過取所需量的rna并通過加入水將其完成至總體積為11μl來制備rna混合物。將混合物在70℃下加熱5分鐘,然后冷卻。根據(jù)供應商提供的移液方案制備cdna混合物。將9μlcdna混合物放入反應管中,并加入11μlrna混合物,并在熱循環(huán)儀上在42℃下保持30分鐘以及在95℃下保持2分鐘。
pcr
使用amplitaqgold360dna聚合酶1000u試劑盒(appliedbiosystems)進行pcr。通過加入1μlcdna、2.5μl10x緩沖液、3μlmgcl2、0.5μl各dntp、1μl各引物、0.5μltaq聚合酶,并通過加入水至完成25μl,來制備pcr主混合物。pcr程序如下:95℃進行5分鐘,進行35個循環(huán)的95℃30秒、55℃30秒、72℃1分鐘,以及72℃進行7分鐘。pcr后,在bioanalyzer上使用dna1000試劑盒(agilent)和程序運行樣品。
pcr樣品純化
使用nucleospinpcr清除試劑盒(macherey-nagel)純化樣品,以確保除去pcr產物的污染。將1體積的pcr樣品與2體積nt1混合并將樣品加載至
將
限制性消化
pcr清除后,對serpina1擴增子進行hyp99i限制性消化。該酶識別wt中cgacg序列中的最后一個g,并將擴增子切割成兩段,但由于不存在第二個g,因此其不能在突變體型式中切割cgaca序列。因此,如果編輯成功,將會有一些wtdna作為hyp99i限制性消化的底物。1單位的hyp99i(neb)用于消化0.1μgdna。使用0.5μg的dna輸入。將樣品在不含核酸酶的水中稀釋,并在37℃下孵育1-1.5小時,然后將樣品在65℃下孵育20分鐘后使酶失活。孵育后,使用dna1000試劑盒(agilent)和程序將樣品加載到bioanalyzer上,以顯示結果。
taqmanpcr
使用定制的serpina1snp基因分型測定(thermofisherscientific)進行snp基因分型測定。該測定與限制酶消化測定并行進行,以探究哪種測定對于編輯檢測更敏感。野生型和突變體serpina1特異性的探針分別附有不同的熒光基團vic和fam。因此,我們可以量化wt/突變體轉錄物的量的增加或減少。通過加入5μl主混合物和0.5μl探針-引物混合物制備反應混合物。使用的寡核苷酸序列是:wt探針(seqidno:29)、突變探針(seqidno:30)、正向引物(seqidno:31)和反向引物(seqidno:32)。將5.5μl反應混合物加入到96孔板的指定孔中。向每個孔中加入4.5μlcdna。pcr程序運行如下:95℃進行10分鐘,進行50個循環(huán)的92℃15秒和60℃90秒。通過使用cfxmanager分析結果。
實施例5:通過靶向的a至i編輯逆轉lrrk2轉錄物中的氨基酸替換突變g2019s,用于治療帕金森病
富含亮氨酸重復激酶2基因(lrrk2基因id:120892)的催化性roc-cor和激酶結構域的突變是家族性帕金森病(pd)的常見病因。我們開始使用aon靶向lrrk2mrna前體轉錄物(轉錄refseqnm_198578.3)中的g2019s突變,aon能夠通過全長或縮短的glurb部分作為募集部分來募集adar1和adar2,該募集部分連接至對g6055位置處(參見下面的序列,突變的g帶下劃線)外顯子41中的g至a突變周圍的序列具有互補性的靶向部分。該突變也被鑒定為genbankdbsnp變異rs34637584,通常稱為g2019s。
在位置6055處突出顯示wtg殘基的lrrk2外顯子41序列:
atacctccactcagccatgattatataccgagacctgaaaccccacaatgtgctgcttttcacactgtatcccaatgctgccatcattgcaaagattgctgactacggcattgctcagtactgctgtagaatggggataaaaacatcagagggcacaccag(seqidno:33)
突變體等位基因和翻譯:
正常的等位基因和翻譯(a至i編輯后)
已經設計了以下序列,以靶向lrrk2g2019s突變。粗體的核苷酸形成靶向部分;所有核苷酸均為2’-ome,除了帶下劃線的那些;*表示ps鍵。aon的靶向部分的長度不同,為25個核苷酸(lrrk2-adar1和lrrk2-adar3)或30個核苷酸(lrrk-adar2和lrrk-adar4)。aon的募集部分的長度不同:縮短的glurb募集部分(lrrk2-adar3和lrrk-adar4)和全長glurb募集部分(irrk2-adar1和lrrk-adar2)。
通過rna測序、lrrk2(自)磷酸化狀態(tài)的蛋白質印跡分析和建立的lrrk2相關線粒體表型(耗氧率和線粒體膜電位)的功能讀數(shù),在lrrk2g6055a突變體成纖維細胞中評估lrrk2的校正。參見:tatiana等人(2012)hum.mol.genet.21(19):4201-4213;smith等人(2015)molecularneurobiology,1-17;以及grünewald等人(2014)antioxidants&redoxsignaling,20(13),1955-1960。
使用lipofectamine2000將lrrk2g6055a純合子成纖維細胞系fff-028(telethonnetworkofgeneticbiobanks)、雜合子g6055a系nd29492、nd29542、nd29802和健康對照系gm023074、gm08402(coriellinstitute)用lrrk2-adaraon轉染。48-96小時孵育后,進行以下分析:
1)為了檢測a至i編輯的lrrk2轉錄物,裂解細胞,通過標準方法分離rna,并使用以下seqidno:42和seqidno:43的測序引物進行半定量rna測序分析。a至i編輯的mrna序列在lrrk2-adar-aon的轉染后出現(xiàn)。
2)先前已經證實(smith等人,2015)lrrk2g6055a蛋白在用線粒體膜去極化劑纈氨霉素(10μm)應激處理(24小時)后,由于激酶結構域的催化活性升高,與lrrk2wt相比表現(xiàn)出絲氨酸955處的自磷酸化水平升高。用lrrk2-adar-aon處理將纈氨霉素處理的lrrk2g6055a細胞的絲氨酸-955磷酸化至少部分降低,可能甚至完全達到野生型水平。這可以通過使用lrrk2磷酸化s955(abcam克隆mjf-r11-(75-1))和總lrrk2(abcam克隆mjff2(c41-2))抗體的蛋白質印跡分析(smith等人)進行評估。
3)lrrk2g6055a成纖維細胞顯示線粒體呼吸(oxphos)的改變,包括增加的質子泄漏(smith等人,2015;grünewald等人,2014),這在lrrk2-adar-aon轉染后可逆轉。使用seahorsexf24細胞外通量分析儀(seahorsebioscience)評估基礎和強制呼吸條件下的耗氧率,該儀器是通過固態(tài)傳感器探針以2秒的時間間隔測量培養(yǎng)基中溶解氧的濃度的裝置。該分析可以與xfxellmito壓力測試試劑盒(seahorsebioscience)一起進行,其通過用寡霉素、羰基氰-4-(三氟甲氧基)苯基腙(fccp)、魚藤酮和抗霉素-a順序處理,可以測定代謝參數(shù)比如基礎呼吸、atp產生、質子泄漏和最大呼吸。該測定根據(jù)制造商的說明書進行,并且質子泄漏定義為寡霉素處理后的剩余氧消耗。
4)與對照細胞相比,lrrk2g6055a成纖維細胞顯示降低的線粒體膜電位(smith等人,2015;grünewald等人,2014)。線粒體膜電位用親脂性陽離子染料四甲基羅丹明甲酯(tmrm)評估,其以非猝滅模式使用(0.5-30nm,經驗確定),負載在無酚紅培養(yǎng)基中20分鐘。染料負載后,通過活細胞共聚焦顯微鏡和圖像分析測量穩(wěn)態(tài)線粒體tmrm熒光。lrrk2-adar-aon轉染可以將線粒體膜電位至少部分增加,可能甚至完全達到對照水平。
結論
上述實施例示出如何通過使用根據(jù)本發(fā)明的寡核苷酸構建體對靶rna分子中的核苷酸進行定點編輯以在靶rna序列進行所需的改變。實施例教導如何去除終止密碼子以重新打開gfp表達構建體的讀碼框、創(chuàng)建剪接位點以改變編碼cep290的靶rna的剪接模式、以及如何通過在編碼突變體g551dcftr蛋白的靶rna序列中的密碼子中進行改變以建立所需的氨基酸替換??梢苑奖愕卮_認成功的rna編輯,例如通過在gfp無義突變逆轉的情況下觀察熒光細胞、通過在cep290編碼rna中引入隱蔽剪接位點的情況下觀察來自野生型到突變體的凝膠中的rt-pr帶的移位、以及在cftr編碼rna中逆轉g551d突變的情況下通過測序或通過使用功能測定法(例如ussing小室測定法),等等。也可以對α-1-抗胰蛋白酶(a1at)和lrrk2進行類似的工作。
應當理解,本發(fā)明僅通過示例的方式進行描述,并且可以在保持在本發(fā)明的范圍和精神內的同時進行修改。
序列表
seqidno:1編碼egfp中無義突變的dna-rna寡核苷酸構建體:
cgcgcgttttcgcgcggcugaaccacugcac
seqidno:2在hcep290中創(chuàng)建隱蔽剪接位點的dna-rna寡核苷酸構建體:
cgcgcgttttcgcgcggagauacucacaauu
seqidno:3編輯hcftr中g551d突變的dna-rna寡核苷酸構建體:
cgcgcgttttcgcgcgcguugaccuccacuc
seqidno:4以小寫示出g551dhcftr突變的hcftrdna(n為t或c):
atgcagaggtcgcctctggaaaaggccagcgttgtctccaaactttttttcagctggaccagaccaattttgaggaaaggatacagacagcgcctggaattgtcagacatataccaaatcccttctgttgattctgctgacaatctatctgaaaaattggaaagagaatgggatagagagctggcttcaaagaaaaatcctaaactcattaatgcccttcggcgatgttttttctggagatttatgttctatggaatctttttatatttaggggaagtcaccaaagcagtacagcctctcttactgggaagaatcatagcttcctatgacccggataacaaggaggaacgctctatcgcgatttatctaggcataggcttatgccttctctttattgtgaggacactgctcctacacccagccatttttggccttcatcacattggaatgcagatgagaatagctatgtttagtttgatttataagaagactttaaagctgtcaagccgtgttctagataaaataagtattggacaacttgttagtctcctttccaacaacctgaacaaatttgatgaaggacttgcattggcacatttcgtgtggatcgctcctttgcaagtggcactcctcatggggctaatctgggagttgttacaggcgtctgccttctgtggacttggtttcctgatagtccttgccctttttcaggctgggctagggagaatgatgatgaagtacagagatcagagagctgggaagatcagtgaaagacttgtgattacctcagaaatgattgaaaatatccaatctgttaaggcatactgctgggaagaagcaatggaaaaaatgattgaaaacttaagacaaacagaactgaaactgactcggaaggcagcctatgtgagatacttcaatagctcagccttcttcttctcagggttctttgtggtgtttttatctgtgcttccctatgcactaatcaaaggaatcatcctccggaaaatattcaccaccatctcattctgcattgttctgcgcatggcggtcactcggcaatttccctgggctgtacaaacatggtatgactctcttggagcaataaacaaaatacaggatttcttacaaaagcaagaatataagacattggaatataacttaacgactacagaagtagtgatggagaatgtaacagccttctgggaggagggatttggggaattatttgagaaagcaaaacaaaacaataacaatagaaaaacttctaatggtgatgacagcctcttcttcagtaatttctcacttcttggtactcctgtcctgaaagatattaatttcaagatagaaagaggacagttgttggcggttgctggatccactggagcaggcaagacttcacttctaatgatgattatgggagaactggagccttcagagggtaaaattaagcacagtggaagaatttcattctgttctcagttttcctggattatgcctggcaccattaaagaaaatatcatctttggtgtttcctatgatgaatatagatacagaagcgtcatcaaagcatgccaactagaagaggacatctccaagtttgcagagaaagacaatatagttcttggagaaggtggaatcacactgagtggagancaacgagcaagaatttctttagcaagagcagtatacaaagatgctgatttgtatttattagactctccttttggatacctagatgttttaacagaaaaagaaatatttgaaagctgtgtctgtaaactgatggctaacaaaactaggattttggtcacttctaaaatggaacatttaaagaaagctgacaaaatattaattttgcatgaaggtagcagctatttttatgggacattttcagaactccaaaatctacagccagactttagctcaaaactcatgggatgtgattctttcgaccaatttagtgcagaaagaagaaattcaatcctaactgagaccttacaccgtttctcattagaaggagatgctcctgtctcctggacagaaacaaaaaaacaatcttttaaacagactggagagtttggggaaaaaaggaagaattctattctcaatccaatcaactctatacgaaaattttccattgtgcaaaagactcccttacaaatgaatggcatcgaagaggattctgatgagcctttagagagaaggctgtccttagtaccagattctgagcagggagaggcgatactgcctcgcatcagcgtgatcagcactggccccacgcttcaggcacgaaggaggcagtctgtcctgaacctgatgacacactcagttaaccaaggtcagaacattcaccgaaagacaacagcatccacacgaaaagtgtcactggcccctcaggcaaacttgactgaactggatatatattcaagaaggttatctcaagaaactggcttggaaataagtgaagaaattaacgaagaagacttaaaggagtgcttttttgatgatatggagagcataccagcagtgactacatggaacacataccttcgatatattactgtccacaagagcttaatttttgtgctaatttggtgcttagtaatttttctggcagaggtggctgcttctttggttgtgctgtggctccttggaaacactcctcttcaagacaaagggaatagtactcatagtagaaataacagctatgcagtgattatcaccagcaccagttcgtattatgtgttttacatttacgtgggagtagccgacactttgcttgctatgggattcttcagaggtctaccactggtgcatactctaatcacagtgtcgaaaattttacaccacaaaatgttacattctgttcttcaagcacctatgtcaaccctcaacacgttgaaagcaggtgggattcttaatagattctccaaagatatagcaattttggatgaccttctgcctcttaccatatttgacttcatccagttgttattaattgtgattggagctatagcagttgtcgcagttttacaaccctacatctttgttgcaacagtgccagtgatagtggcttttattatgttgagagcatatttcctccaaacctcacagcaactcaaacaactggaatctgaaggcaggagtccaattttcactcatcttgttacaagcttaaaaggactatggacacttcgtgccttcggacggcagccttactttgaaactctgttccacaaagctctgaatttacatactgccaactggttcttgtacctgtcaacactgcgctggttccaaatgagaatagaaatgatttttgtcatcttcttcattgctgttaccttcatttccattttaacaacaggagaaggagaaggaagagttggtattatcctgactttagccatgaatatcatgagtacattgcagtgggctgtaaactccagcatagatgtggatagcttgatgcgatctgtgagccgagtctttaagttcattgacatgccaacagaaggtaaacctaccaagtcaaccaaaccatacaagaatggccaactctcgaaagttatgattattgagaattcacacgtgaagaaagatgacatctggccctcagggggccaaatgactgtcaaagatctcacagcaaaatacacagaaggtggaaatgccatattagagaacatttccttctcaataagtcctggccagagggtgggcctcttgggaagaactggatcagggaagagtactttgttatcagcttttttgagactactgaacactgaaggagaaatccagatcgatggtgtgtcttgggattcaataactttgcaacagtggaggaaagcctttggagtgataccacagaaagtatttattttttctggaacatttagaaaaaacttggatccctatgaacagtggagtgatcaagaaatatggaaagttgcagatgaggttgggctcagatctgtgatagaacagtttcctgggaagcttgactttgtccttgtggatgggggctgtgtcctaagccatggccacaagcagttgatgtgcttggctagatctgttctcagtaaggcgaagatcttgctgcttgatgaacccagtgctcatttggatccagtaacataccaaataattagaagaactctaaaacaagcatttgctgattgcacagtaattctctgtgaacacaggatagaagcaatgctggaatgccaacaatttttggtcatagaagagaacaaagtgcggcagtacgattccatccagaaactgctgaacgagaggagcctcttccggcaagccatcagcccctccgacagggtgaagctctttccccaccggaactcaagcaagtgcaagtctaagccccagattgctgctctgaaagaggagacagaagaagaggtgcaagatacaaggctt
seqidno:5-募集部分實例
cgcgcgttttcgcgcg
seqidno:6-募集部分實例
auanuauaacaauaugcuaaauguuguuauanuau
seqidno:7-募集部分實例
uauaacaauaugcuaaauguuguuaua
seqidno:8-基因靶向部分
nnnnnnnnnnnnnnnnncnnn
seqidno:9
gcaacuagaggugag
seqidno:10
tgctaagtacagggacatcttgc
seqidno:11
agactccacttgttcttttaaggag
seqidno:12
tgactgctaagtacagggacatcttg
seqidno:13
aggagatgttttcacactccaggt
seqidno:14
ctggccccagttgtaatttgtga
seqidno:15
ctgttcccaggcttgttcaatagt
seqidno:16
guguuggccauggaacauauaacaauaugcuaaauguuguuaua
seqidno:17
uauaacaauaugcuaaauguuguuauaguguuggccauggaaca
seqidno:18
guguuggccauggaacauauaacaauaugcuaaauguuguuaua
seqidno:19
guguuggccauggaacaauaguauaacaauaugcuaaauguuguuauaguau
seqidno:20
ggaauaguauaacaauaugcuaaauguuguuauaguaucccguguuggccauggaaca
seqidno:21
guguuggccauggaacaggaauaguauaacaauaugcuaaauguuguuauaguauccc
seqidno:22
ggaauaguauaacaauaugcuaaauguuguuauaguaucccguguuggccauggaaca
seqidno:23
ggaauanuauaacaauaugcuaaauguuguuauanuauccc
seqidno:24
guggaauanuauaacaauaugcuaaauguuguuauanuaucccac
seqidno:25
guggnauanuauaacaauaugcuaaauguuguuauanuaunccac
seqidno:26
gcctggcaccattaaagaaa
seqidno:27
gcatctttgtatactgctcttgct
seqidno:28
ggaauaguauaacaauaugcuaaauguuguuauaguauccccagucccuuucucgucgauggucag
seqidno:29
ccatcgacgagaaag
seqidno:30
catcgacaagaaag
seqidno:31
tccaggccgtgcataagg
seqidno:32
gccccagcagcttcag
seqidno:33
atacctccactcagccatgattatataccgagacctgaaaccccacaatgtgctgcttttcacactgtatcccaatgctgccatcattgcaaagattgctgactacggcattgctcagtactgctgtagaatggggataaaaacatcagagggcacaccag
seqidno:34
gctgactacagcattgctcag
seqidno:35
adysiaq
seqidno:36
gctgactacggcattgctcag
seqidno:37
adygiaq
seqidno:38
guggaauaguauaacaauaugcuaaauguuguuauaguaucccacacugagcaaugccguagucagcaau
seqidno:39
guggaauaguauaacaauaugcuaaauguuguuauaguaucccacguacugagcaaugccguagucagcaaucuu
seqidno:40
ggaauaguauaacaauaugcuaaauguuguuauaguaucccacugagcaaugccguagucagcaau
seqidno:41
ggaauaguauaacaauaugcuaaauguuguuauaguaucccguacugagcaaugccguagucagcaaucuu
seqidno:42
gtttgagatacctccactcagc
seqidno:43
aggtgcacgaaaccctggtg