專利名稱:隨機(jī)化的dna文庫和雙鏈rna文庫,其用途及生產(chǎn)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及以質(zhì)?;虿《据d體為基礎(chǔ)的DNA文庫,它能夠表達(dá)長度為10-30個(gè)堿基對(duì)雙鏈RNA的所有可能序列,其中每條雙鏈RNA由單個(gè)發(fā)夾式的RNA分子形成,或由兩個(gè)分開的具有不同3’突出端的RNA分子所形成。這種DNA文庫中的每個(gè)單獨(dú)成員編碼上面說明的雙鏈RNA的所有組分。該文庫可以在沒有預(yù)先了解其靶基因的情況下,用于篩選能夠誘導(dǎo)特定表型的雙鏈RNA。本發(fā)明還涉及產(chǎn)生這種DNA文庫的方法。
背景技術(shù):
信使RNA(mRNA)通常被理解為蛋白合成中攜帶信息的中間體,它通過RNA聚合酶由DNA模板轉(zhuǎn)錄,隨后通過核糖體翻譯而產(chǎn)生蛋白分子。近來,更多的論據(jù)證明,很多基因轉(zhuǎn)錄為根本就不翻譯成蛋白的RNA分子(Okazaki Y等,Nature;420(6915)563-573(2002))。人們發(fā)現(xiàn),一些未翻譯的RNA通過序列特異的方式誘導(dǎo)mRNA降解而實(shí)施其調(diào)節(jié)其mRNA的功能(Ambros V,Cell;113(6)673-676(2003))。該發(fā)現(xiàn)與最近的發(fā)現(xiàn)非常一致,即雙鏈RNA和合成的siRNA也能在廣泛的生物體中誘導(dǎo)同源mRNA的降解(McManus MT,Sharp PA.,Nature Rev Genet.;3(10)737-747(2002))。已發(fā)現(xiàn),長的雙鏈RNA對(duì)哺乳動(dòng)物細(xì)胞中的RNA合成產(chǎn)生強(qiáng)的非特異性抑制,但siRNA能避開這種障礙而對(duì)與該siRNA序列具有序列同一性的靶基因,仍然保持其強(qiáng)的抑制效果(Elbashir SM等,Nature;411(6836)494-498(2001))。這樣,使得siRNA成為功能基因組中基因敲毀的主要工具。siRNA還有可能通過降低與疾病相關(guān)基因的活性而成為可以治療某種疾病的藥物。
siRNA通常是19-25個(gè)堿基對(duì)的雙鏈RNA,它由發(fā)夾形式的單個(gè)RNA分子形成,或者由兩個(gè)分開的RNA分子形成并具有不同3’突出端。siRNA可由三種途徑產(chǎn)生化學(xué)合成;在啟動(dòng)子的驅(qū)動(dòng)下,由DNA載體表達(dá);或用RNA酶III(Dicer)切割長的雙鏈RNA。迄今為止,所有使用的siRNA都是以一段預(yù)定基因?yàn)榘卸O(shè)計(jì)的。
發(fā)明內(nèi)容
本發(fā)明涉及DNA文庫,每個(gè)文庫含有一定長度雙鏈RNA的所有可能排列(排列是指不同的序列)。這種文庫很容易構(gòu)成,以用來產(chǎn)生所有排列的siRNA。該文庫提供了一種以不依賴靶基因的方式,針對(duì)與任何特定表型有關(guān)的表征的高通量篩選雙鏈RNA(以及siRNA)的方法。更具體地說,由這種文庫編碼的siRNA可以用于單個(gè)進(jìn)行的篩選,或用于作為任何復(fù)雜程度的混合物進(jìn)行的篩選,而不必要知道其序列或其靶基因。這種方法可以克服siRNA應(yīng)用中的兩個(gè)主要障礙(1)關(guān)于每種生物體的轉(zhuǎn)錄組的知識(shí)不完全。根據(jù)最近的小鼠轉(zhuǎn)錄組分析資料看,我們對(duì)這個(gè)認(rèn)識(shí)最多的模式動(dòng)物的轉(zhuǎn)錄組的知識(shí)仍遠(yuǎn)不完全。有關(guān)人和任何其他動(dòng)物的轉(zhuǎn)錄組知道得就更少。因?yàn)閼?yīng)用我們的文庫不需要預(yù)先知道任何關(guān)于靶序列的信息,這樣就可以直接在任何生物體中完成全基因組的siRNA篩選。(2)siRNA的成本非常高。無論如何制備siRNA,要制備以某種生物體的所有已知mRNA為靶的siRNA,其費(fèi)用是非常高的。實(shí)際上,包含能夠應(yīng)用于任何生物體的所有siRNA排列的可再生單個(gè)DNA文庫可使生產(chǎn)siRNA的費(fèi)用減少到最低的水平。
因此,本發(fā)明的一個(gè)方面涉及一種用于在活細(xì)胞中生產(chǎn)預(yù)定長度為10-30個(gè)堿基對(duì)的雙鏈RNA分子文庫的DNA文庫,其中,在編碼雙鏈RNA分子的雙鏈部分的DNA區(qū)序列中,隨機(jī)化的位置選自4個(gè)至所有核苷酸,以及,此中所說的雙鏈RNA分子的每條鏈由該DNA文庫的單個(gè)成員產(chǎn)生。本發(fā)明還提供包含該DNA文庫的試劑盒。
另一方面本發(fā)明提供一種制備該DNA文庫的方法。
本發(fā)明還有一個(gè)方面涉及由該DNA文庫獲得的RNA文庫。
根據(jù)以下的詳細(xì)描述和附屬的權(quán)利要求,在下文中,本發(fā)明的其他方面及優(yōu)點(diǎn)會(huì)更清楚。
圖1表示構(gòu)建可編碼所有排列的特定長度雙鏈RNA的DNA文庫的實(shí)施例。實(shí)施例1,可編碼所有含有19個(gè)堿基對(duì)的雙鏈體區(qū)和3’Poly U突出端的雙鏈RNA的DNA文庫。圖1A表明克隆的技術(shù)方案。圖1B表示該文庫質(zhì)量的實(shí)驗(yàn)證明。如瓊脂糖凝膠中所示,單個(gè)克隆(1x)和10個(gè)克隆(10x)集合,以及30個(gè)克隆的集合在酶切后都產(chǎn)生預(yù)期的單一條帶,表明文庫中的大多數(shù)克隆含有預(yù)期的插入片段。同樣的步驟可以用于產(chǎn)生編碼不同長度(10-30個(gè)堿基對(duì))雙鏈RNA的此類DNA文庫,以及產(chǎn)生只有部分DNA序列(4-30nt)隨機(jī)化的此類DNA文庫。
圖2表示一種質(zhì)粒的結(jié)構(gòu),用以證明存在于RNA編碼區(qū)相對(duì)兩側(cè)的2個(gè)啟動(dòng)子和2個(gè)終止子可以對(duì)靶基因的表達(dá)給予有效的向下調(diào)節(jié)。根據(jù)目前已獲得的所有科學(xué)知識(shí),這種有效的向下調(diào)節(jié)只能通過由這種質(zhì)粒有效地生產(chǎn)雙鏈RNA而實(shí)現(xiàn)。因此,可以斷定,這種質(zhì)粒能夠在活細(xì)胞中有效地生產(chǎn)雙鏈RNA。A表明克隆的技術(shù)方案。B表示凝膠分析證明了設(shè)計(jì)的片段已插入該質(zhì)粒。C說明細(xì)胞分析證明了所產(chǎn)生的質(zhì)粒導(dǎo)致對(duì)靶基因海腎熒光素酶的有效抑制。
圖3表示產(chǎn)生編碼特定長度雙鏈RNA所有排列的DNA文庫的另一種方法實(shí)例。圖A表明克隆的技術(shù)方案。圖B表示圖A中不同片段的序列,下劃線為重要的限制酶位點(diǎn)。同樣的步驟可以用于產(chǎn)生編碼不同長度(10-30個(gè)堿基對(duì))雙鏈RNA的此類DNA文庫,以及產(chǎn)生只有該DNA序列(4-30nt)部分隨機(jī)化的此類DNA文庫。
圖4表示另一種產(chǎn)生編碼所有排列的特定長度雙鏈RNA的DNA文庫的替代方法。A表明克隆的技術(shù)方案。B表示A中不同片段的序列,下劃線為重要的限制酶位點(diǎn)。同樣的步驟可以用于產(chǎn)生編碼不同長度(10-30個(gè)堿基對(duì))雙鏈RNA的此類DNA文庫,以及產(chǎn)生只有該DNA序列(4-30nt)部分隨機(jī)化的此類DNA文庫。
具體實(shí)施例方式
小片段干擾核酸(siRNA)最初是用來定義位于3’-UU或TT或其他單鏈突出端之間的,具有19-21nt雙鏈區(qū)的短雙鏈RNA的術(shù)語。近來,又引入了若干這種原始形式siRNA的變體(例如發(fā)夾型)。這種siRNA可以用于在各種不同生物體細(xì)胞中,減少與該siRNA雙鏈區(qū)有相同序列的基因的表達(dá)。雖然較長的雙鏈DNA和RNA也能用本發(fā)明的方法產(chǎn)生,但是本發(fā)明的文庫限于長度為10-30個(gè)堿基對(duì)的雙鏈DNA和RNA,因?yàn)殚L度超過30個(gè)堿基對(duì)的核苷酸,在其轉(zhuǎn)染到活細(xì)胞中后,產(chǎn)生免疫應(yīng)答和其他干擾的副作用的可能性增大。siRNA最初是用化學(xué)法合成的,但現(xiàn)已引入數(shù)種采用病毒啟動(dòng)子,如T7啟動(dòng)子,或微小RNA啟動(dòng)子,例如H1或U6,以游離的方式或在質(zhì)?;虿《据d體中用酶法產(chǎn)生siRNA的方法。
本發(fā)明提供一種構(gòu)建編碼隨機(jī)siRNA文庫的DNA文庫的方法。此類文庫與現(xiàn)有技術(shù)的不同在于,在現(xiàn)有技術(shù)中,人們必須按照已知的基因序列來設(shè)計(jì)siRNA,而根據(jù)本發(fā)明的文庫,可以對(duì)一組完全隨機(jī)的不同siRNA進(jìn)行篩選(不需要了解其序列或其靶基因的序列),以尋找與每一siRNA相關(guān)的表型,然后再鑒定與每個(gè)siRNA有關(guān)的基因。
構(gòu)建含有單個(gè)隨機(jī)化區(qū)的DNA文庫制備以質(zhì)?;虿《据d體為基礎(chǔ)、并編碼所有排列的siRNA的完全隨機(jī)化DNA文庫,必需要確保DNA文庫的每個(gè)成員表達(dá)一條獨(dú)特、完整的雙鏈RNA。現(xiàn)有的制備基于載體的siRNA(短的雙鏈RNA)的方法中,沒有一種能滿足上述要求。
本發(fā)明描述了只有一個(gè)隨機(jī)化區(qū)域的隨機(jī)DNA文庫的構(gòu)建。對(duì)于每個(gè)質(zhì)粒,2個(gè)啟動(dòng)子分別從相對(duì)的方向驅(qū)動(dòng)該區(qū)域的轉(zhuǎn)錄,從而產(chǎn)生2條互補(bǔ)的RNA鏈。2個(gè)終止子置于隨機(jī)化區(qū)域的每一端,以確保可以從每個(gè)方向產(chǎn)生限定長度的RNA。該方法的優(yōu)點(diǎn)是避免了如以下所述的,在雙區(qū)域系統(tǒng)中,為了在每個(gè)單獨(dú)的質(zhì)粒中產(chǎn)生2個(gè)反向的互補(bǔ)區(qū)所帶來的麻煩的克隆步驟??梢杂糜谶@類系統(tǒng)的啟動(dòng)子的一個(gè)例子是RNA聚合酶III啟動(dòng)子H1或U6。RNA聚合酶III需要一段TTTTT才能進(jìn)行正確的轉(zhuǎn)錄終止。為使用此RNA聚合酶從2個(gè)方向驅(qū)動(dòng)同一區(qū)域的表達(dá),必須將TTTTT插入隨機(jī)化區(qū)的兩端,不過有一個(gè)問題RNA聚合酶III啟動(dòng)子必須放在緊靠著隨機(jī)化區(qū)域的位置,以確保從隨機(jī)區(qū)域起始處的準(zhǔn)確部位開始正確轉(zhuǎn)錄,但是這些啟動(dòng)子并不含有可以使相對(duì)的方向出現(xiàn)TTTTT終止子的AAAAA鏈段。唯一可采取的方法是使RNA聚合酶III啟動(dòng)子突變,插入AAAAA鏈段,但尚不知道該AAAAA鏈段的插入會(huì)如何影響轉(zhuǎn)錄的起始和轉(zhuǎn)錄的速率。如以下將要描述的,我們使RNA聚合酶III H1啟動(dòng)子突變,并在該啟動(dòng)子的末端插入AAAAA鏈段,結(jié)果證實(shí)了該突變的啟動(dòng)子可以正確啟動(dòng)轉(zhuǎn)錄和產(chǎn)生了有效的siRNA。因此,我們首先著手于構(gòu)建將終止信號(hào)置于隨機(jī)區(qū)域兩側(cè)的質(zhì)粒庫(圖1)。
構(gòu)建雙H1啟動(dòng)子緊靠海腎熒光素酶的載體構(gòu)建含有2個(gè)突變的RNA聚合酶III啟動(dòng)子的質(zhì)粒,其中每個(gè)啟動(dòng)子插入另一啟動(dòng)子所需的轉(zhuǎn)錄終止子序列,siRNA區(qū)域以模式分子海腎熒光素酶為靶進(jìn)行設(shè)計(jì)(圖2)。這種質(zhì)??梢杂蓡蝹€(gè)19bp的靶序列成功地產(chǎn)生有效的siRNA雙鏈體,這一個(gè)重要發(fā)現(xiàn)構(gòu)成了構(gòu)建僅有一個(gè)隨機(jī)化區(qū)域的完全隨機(jī)化的siRNA文庫的基礎(chǔ)(圖2)。
RNA聚合酶III H1啟動(dòng)子的突變和樣本質(zhì)粒的構(gòu)建詳述如下。
1、刪除pBluescript II KS-H1載體(Brummelkamp TR等,Science,296(5567)550-553(2002))中緊靠Bgl II位點(diǎn)上游的3個(gè)核苷酸用以下引物PCR擴(kuò)增原載體中EcoR I-Bgl II(H1啟動(dòng)子)之間的片段5’引物GGAATTCGAACGCTGACGTCATCAACCCG3’引物GAAGATCTGTCTCATACAGAACTTATAAGATTCCC(突變按照下面所述插入AAAAA序列后,為了使轉(zhuǎn)錄由正確的位置開始,刪去正好在Bgl II位點(diǎn)上游的3個(gè)核苷酸)將PCR產(chǎn)物中的EcoR I-Bgl II片段克隆到原pBluescript IIKS-H1(Brummelkamp TR等,上面提及的)載體中,通過序列測定驗(yàn)證該質(zhì)粒DNA修飾后的序列001 TCCAGGNANC GCGGGCCCAG TGTCACTAGGCGGGAACACC CAGCGCGCGT051 GCGCCCTGGC AGGAAGATGG CTGTGAGGGACAGGGGAGTG GCGCCCTGCA101 ATATTTGCAT GTCGCTATGT GTTCTGGGAA ATCACCATAAACGTGAAATG151 TCTTTGGATT TGGGAATCTT ATAAGTTCTG TATGAGACAGATCTTCAATA
201 TTGGCCATTA GCCATATTAT TCATTGGTTA TATAGCATAAATCAATATTG251 GCTATTGGCC ATTGCATACG TTGTATCTAT ATCATAATATGTACATTTAT301 ATTGGCTCAT GTCCAATATG ACCGCCATGT TGGCATTGATTATTGACTAG351 TTATTAATAG TAATCAATTA CGGGGTCATT AGTTCATAGCCCATTATGGG401 AGTTCCGCGT TACATAACTT ACGGTAAATG GCCCGCCTGGCTGACCGCCC451 AACGACCCCC GCCCATTGAC GTCAATAATG ACGTATGTTCCCATAGTAAC2、構(gòu)建含有突變的雙H1啟動(dòng)子的載體(以下稱為pDH,代表含有雙H1啟動(dòng)子的質(zhì)粒)用以下引物PCR擴(kuò)增上述修飾的載體中的EcoR I-Bgl II片段5’引物ACGCGTCGACGAATTCGAACGCTGACGTCATCAACCCG3’引物CCCAAGCTTGTCTCATACAGAACTTATAAGATTCCC將上述PCR產(chǎn)物的Sal I-Hind III片段反向克隆到上述修飾的載體中,用Bgl II+Sal I消化,檢驗(yàn)該質(zhì)粒DNA,正確的克隆應(yīng)含有~1000bp的片段。結(jié)果表明,所有檢查的10個(gè)克隆都是正確的(注意pDH實(shí)際上含有2個(gè)截短的H1啟動(dòng)子,這是因?yàn)殡S后克隆過程的需要。該啟動(dòng)子的缺失部分會(huì)在隨后的克隆過程中補(bǔ)回)。
3、將海腎熒光素酶靶序列放入pDH,構(gòu)成pDHRL相應(yīng)于海腎熒光素酶的mRNA nt82-100的序列用作測試DNA。以海腎熒光酶素該位點(diǎn)為目標(biāo)的siRNA即鑒別為有活性(Brummelkamp TR等,上面提及的)。合成2個(gè)寡聚DNA并相互退火,制備雙鏈DNA5’GGGGAAGATCTAAAAAAATAAATGAATCAAGAACATTTTTAAGCTTGGGG5’CCCCAAGCTTAAAAATGTTCTTGATTCATTTATTTTTTTAGATCTTCCCC上述的雙鏈DNA用Bgl II-Hind III酶切,然后克隆到pDH的BglII-Hind III位點(diǎn)之間。用Bgl II+SaI消化以檢驗(yàn)DNA片段在質(zhì)粒中的正確插入,正確的克隆應(yīng)產(chǎn)生~250bp的片段。所有測試的3個(gè)克隆都表明具有正確的插入(圖2)。
pDHRL對(duì)熒光素酶表達(dá)的有效抑制。取上述的3個(gè)克隆克隆1,克隆2和克隆3,各按1.2μg和0.6μg的量,分別與海腎熒光素酶質(zhì)粒和編碼蟲熒光素酶的質(zhì)粒一起,在24孔板上轉(zhuǎn)染HEK293細(xì)胞。48小時(shí)后,測定海腎熒光素酶和螢火蟲熒光素酶的活性。(圖2C)。結(jié)果表明,采用突變的啟動(dòng)子,該質(zhì)粒能夠?qū)Π谢蚝DI熒光素酶的表達(dá)產(chǎn)生非常有效的抑制,這表明了在本發(fā)明構(gòu)建的雙啟動(dòng)子/雙終止子質(zhì)粒中,采用突變的H1啟動(dòng)子,有效地產(chǎn)生了siRNA。該結(jié)果尤其表明,使用突變的H1啟動(dòng)子,由RNA聚合酶III驅(qū)動(dòng)的RNA轉(zhuǎn)錄可以正確地起始和終止,而導(dǎo)致有效地產(chǎn)生正確長度的雙鏈體RNA,該RNA能有效導(dǎo)致RNA干擾和基因表達(dá)的抑制。
將隨機(jī)化的DNA克隆到pDH中,構(gòu)成編碼所有排列的siRNA的文庫采用類似于在pDHRL構(gòu)建中,構(gòu)建編碼抗熒光素酶的siRNA的質(zhì)粒的方法,構(gòu)建編碼所有siRNA排列的隨機(jī)化DNA文庫,其唯一的不同在于測試序列的第二條鏈采用酶法產(chǎn)生,以保持該序列的隨機(jī)化性質(zhì)。
合成在兩個(gè)已知序列中插入具有19、20和21nt的隨機(jī)化區(qū)域的三種寡核苷酸。
19聚體隨機(jī)化區(qū)域GGGGAAGATCTAAAAA NNNNNNNNNNNNNNNNNNN TTTTTAAGCTTGGGG20聚體隨機(jī)化區(qū)域GGGGAAGATCTAAAAA NNNNNNNNNNNNNNNNNNNN TTTTTAAGCTTGGGG21聚體隨機(jī)化區(qū)域GGGGAAGATCTAAAAA NNNNNNNNNNNNNNNNNNNNN TTTTTAAGCTTGGGG使上述寡核苷酸與引物CCCCAAGCTTAAAAA退火,并在1mM濃度的dNTP存在下,在合適的緩沖液中用Klenow片段補(bǔ)平(除非另有說明,除了DNA寡核苷酸之外,所有化學(xué)試劑均購自New EnglandBiolabs Inc)。用Bgl II-Hind III酶切所得的雙鏈寡聚體,然后克隆到pDH的Bgl II-Hind III位點(diǎn),構(gòu)成pDH-文庫A。
pDH-文庫A的質(zhì)量首先用41個(gè)克隆的克隆長度分析進(jìn)行估價(jià),用單個(gè)克隆、10個(gè)克隆的集合和30個(gè)克隆的集合制備質(zhì)粒DNA,然后用限制酶切割。該結(jié)果表明所有的克隆都含有同樣長度的插入(圖1B)。將上述的10個(gè)克隆分別制備質(zhì)粒DNA并測定序列。如所預(yù)期的一樣,所有測序的克隆含有預(yù)期的19個(gè)堿基對(duì)。
這些克隆的序列也表現(xiàn)出預(yù)期的隨機(jī)性(參見以下的序列)。
AAAGGGTTTACGTGGTTGGAATCGTCTTATTTGCATGCAATTGACATGTGAGCTTGGAGTAGCTTGTTGAGGTTGGCAGCATCACTGTATGTGTCCTATCTTCGTGGAGGTTGGCTATGAAGGTGGTGATGCGCTTAATTGGTGGTGGTAGGTGGCTGTATGTGAGTGGCTTTAATCTCTGGTGTCCTAATTGTAGGGACTTGGATGAT代替供外源基因異位表達(dá)的質(zhì)粒載體的另一種載體是各種類型的病毒載體。因?yàn)橛糜跇?gòu)建病毒載體的所有克隆技術(shù)都是公知的,具有本領(lǐng)域適當(dāng)知識(shí)的任何人都能制備可以實(shí)現(xiàn)類似于質(zhì)粒的表達(dá)功能的病毒結(jié)構(gòu)體,上述制備DNA文庫的公開也使得在病毒載體中產(chǎn)生此類DNA文庫得以實(shí)現(xiàn)。
構(gòu)建含有一對(duì)序列方向相反的隨機(jī)化區(qū)域的DNA文庫雖然pDHRL和pDH文庫A所代表的具有2個(gè)啟動(dòng)子和2個(gè)終止子的載體是本發(fā)明的優(yōu)選模式,但是一旦在此公開了編碼所有排列的siRNA的DNA文庫的概念后,其他構(gòu)建編碼所有排列的siRNA的DNA文庫的方法就變得顯而易見了。這些方法之一是構(gòu)成編碼所有排列的發(fā)夾形式的該siRNA的質(zhì)粒文庫。作為實(shí)施例,這樣的文庫可按照以下步驟構(gòu)成。
1、合成文庫的寡核苷酸,使其包含一19nt隨機(jī)化序列的完全隨機(jī)化區(qū)域,這些19nt隨機(jī)化序列位于2個(gè)5’端磷酸化的預(yù)定序列(P1和P2)之間。合成形成發(fā)夾的寡核苷酸,使其含有5’端磷酸化和3’突出端并含有P1區(qū)互補(bǔ)序列的鏈段。使文庫核苷酸和發(fā)夾DNA退火并用T4DNA連接酶連接,然后用Klenow片段補(bǔ)平(圖3)。
2、將上述的延伸混合物純化后,用BamH 1酶切并連接到雙鏈?zhǔn)荏w中,該受體的一端為粘末端,其3’突出端則作為進(jìn)一步引發(fā)合成的位點(diǎn)(P3)。連接后,對(duì)該DNA通過分子大小選擇,只收集含有文庫寡核苷酸和發(fā)夾寡核苷酸,以及受體接頭的全長片段。
3、使純化的全長片段與引物3(引物3與P3引發(fā)合成位點(diǎn)互補(bǔ))退火,并用鏈置換DNA聚合酶phage29 DNA聚合酶推動(dòng)DNA片段ALPHA的合成。每個(gè)ALPHA DNA片段含有在序列兩端完全雙鏈的受體接頭,以相反方向排列的兩個(gè)相同的隨機(jī)化序列拷貝,該兩個(gè)拷貝通過雙鏈形式的線性化發(fā)夾接頭序列連接。
4、對(duì)DNA片段ALPHA在其受體接頭區(qū)的適當(dāng)位置進(jìn)行切割,再連接到質(zhì)粒中,供進(jìn)一步操作(α質(zhì)粒)。
5、α質(zhì)粒先用Sam I和Bpm I酶切,然后用Klenow補(bǔ)平并連接。產(chǎn)生的質(zhì)粒在大腸桿菌中增殖,然后用Bcg I酶切插入片段,以除去兩個(gè)隨機(jī)化區(qū)之間的多余序列,留下9nt的鏈段(TTCAAGAGA)在以后siRNA發(fā)夾中形成環(huán)狀結(jié)構(gòu)(圖4)。
6、隨后,可用Hind III和Bgl II將質(zhì)粒中的該插入片段全部切下,插入pBluescript-H1載體中,構(gòu)成文庫。此文庫編碼所有排列的發(fā)夾形式siRNA。在這種情況下,該質(zhì)粒質(zhì)只需要1個(gè)啟動(dòng)子和1個(gè)終止子用于在細(xì)胞中形成發(fā)夾RNA。
如圖4所說明的,上述克隆方案稍加修飾可以產(chǎn)生有2個(gè)野生型H1啟動(dòng)子和2個(gè)轉(zhuǎn)錄終止子的DNA文庫,其中該文庫的每個(gè)成員編碼雙鏈RNA的2條分開的鏈。如圖4所說明,該修飾包括第2個(gè)啟動(dòng)子和TTTTT終止子在該DNA文庫的2個(gè)反向的隨機(jī)化區(qū)之間的插入。根據(jù)以上所述及圖1-3的詳細(xì)公開,對(duì)于本領(lǐng)域的技術(shù)人員來說,這種取代的方案是顯而易見的。
必須強(qiáng)調(diào),由于該文庫采用酶操作,所以丟失了所有含有該限制酶位點(diǎn)的siRNA。每用一種限制性酶將導(dǎo)致約0.025%siRNA的丟失。因此,從這意義上來看,本發(fā)明優(yōu)選的基于2個(gè)啟動(dòng)子和2個(gè)終止子的模式與根據(jù)上述發(fā)夾文庫方案所產(chǎn)生的文庫相比,其丟失的siRNA較少,因而是更完全的文庫,這是由于在兩種方案中所用酶的數(shù)目不同的緣故。因?yàn)樵诶碚撋?,文庫含有約2.75×1011種排列,因使用限制性酶而造成丟失的siRNA種類對(duì)于文庫的質(zhì)量以及對(duì)于抗任何特定基因的活性siRNA的篩選僅產(chǎn)生可忽略的影響。在本發(fā)明的正文中,所提及的“所有排列的siRNA”應(yīng)理解為已考慮到并包括了這種影響。通過在構(gòu)建文庫中去除限制酶的使用,可以進(jìn)一步消除該影響。
另一要注意的方面是序列和限制酶只是用于質(zhì)粒構(gòu)建的一組實(shí)例。本領(lǐng)域的技術(shù)人員很容易選擇不同的限制酶和相應(yīng)的寡核苷酸序列,按照上述公開的原理,以類似的方式在質(zhì)粒和病毒載體中進(jìn)行構(gòu)建。
產(chǎn)生編碼細(xì)胞特異、組織特異或種特異的雙鏈RNA的DNA文庫根據(jù)公開的編碼一特定長度的所有排列的雙鏈RNA的隨機(jī)DNA文庫,建立編碼細(xì)胞特異、組織特異或種特異的雙鏈RNA的DNA文庫的方法,對(duì)于本領(lǐng)域的技術(shù)人員來說是顯而易見的。一個(gè)構(gòu)建這種DNA文庫的例子陳述如下。
使含有19nt隨機(jī)區(qū)的寡核苷酸與由特定類型細(xì)胞純化的mRNA雜交。該mRNA可以通過用Poly(A)聚合酶添加在其末端的生物素固定在涂布鏈霉抗生物蛋白的固體載體(如塑料珠)上。mRNA的固定化也可以用其他方法進(jìn)行。雜交后,洗去所有未結(jié)合的DNA寡核苷酸,收集結(jié)合的DNA亞隨機(jī)寡核苷酸,并以所述用于完全隨機(jī)的DNA寡核苷酸的相同方案,將其克隆到載體中。由此制備方法產(chǎn)生的文庫將會(huì)高度富集編碼與來源mRNA序列相同的雙鏈RNA的分子。應(yīng)該特別提到,雖然在這里的上下文中,所有的克隆步驟都以1種質(zhì)粒載體來描述,但其原理應(yīng)該可應(yīng)用于所有類型的質(zhì)粒,而且含有突變的啟動(dòng)子、終止子和該DNA文庫編碼區(qū)的表達(dá)盒可以在這些不同類型的質(zhì)粒間轉(zhuǎn)移。
還應(yīng)特別指出,雖然在上下文中所有的克隆步驟都以1種類型的啟動(dòng)子即H1啟動(dòng)子描述,但其原理應(yīng)該可應(yīng)用于所有類型的RNA聚合酶III型的啟動(dòng)子。
一種取代質(zhì)粒載體用作外源基因異位表達(dá)的載體是各種類型的病毒載體。因?yàn)樗杏糜跇?gòu)建病毒載體的克隆技術(shù)都是公知的知識(shí),而且具有本領(lǐng)域相當(dāng)知識(shí)的任何人都能夠制備出可以實(shí)現(xiàn)類似于質(zhì)粒的表達(dá)功能的病毒結(jié)構(gòu)體,上述制備DNA文庫的公開,也使得在病毒載體中產(chǎn)生這類DNA文庫能夠?qū)崿F(xiàn)。
總結(jié)本發(fā)明涉及DNA文庫,它可產(chǎn)生長度為10-30個(gè)堿基對(duì)的雙鏈RNA,該雙鏈RNA中的至少一條鏈含有單鏈突出端,本發(fā)明還涉及生產(chǎn)這種DNA文庫的方法。長度為19-21個(gè)堿基對(duì)的siRNA被公認(rèn)為最常用的雙鏈RNA,通常在其至少一條鏈上有TT或UU突出端。因而,在此對(duì)本發(fā)明的優(yōu)點(diǎn)通過與其他方法產(chǎn)生的siRNA作比較來進(jìn)行討論。
實(shí)際上,只有1/3至1/5左右的短雙鏈RNA滿足基本的結(jié)構(gòu)要求(19-21個(gè)堿基對(duì)的雙鏈區(qū),3’單鏈突出,(通常為TT,或UU,但不限于這種突出))。對(duì)于用siRNA敲毀30000個(gè)人類基因,必須要合成90,000-150,000個(gè)siRNA,費(fèi)用為1800-3000萬美元。對(duì)于其他生物體,要產(chǎn)生針對(duì)其所有基因的siRNA,也必須撥給同樣數(shù)量的費(fèi)用。
本發(fā)明可產(chǎn)生一種在質(zhì)粒中編碼的siRNA文庫,該文庫理論上含有所有排列(419=2.75×1011)的siRNA(19個(gè)堿基對(duì)的雙鏈加上突出端)(其他長度的雙鏈RNA文庫的大小用類似的方法很容易計(jì)算),并可用于能找到其合適的啟動(dòng)子的任何生物體。產(chǎn)生這種文庫的費(fèi)用僅是化學(xué)合成所有siRNA的費(fèi)用的一小部分。換句話說,這是一個(gè)復(fù)雜程度為2.75×1011的文庫,它含有能使哺乳動(dòng)物和非哺乳動(dòng)物系統(tǒng)的任何基因沉默的反應(yīng)物。對(duì)于高產(chǎn)量基因組范圍的功能基因組學(xué)和藥物靶篩選,以及核酸藥物的開發(fā)來說,這種文庫是很有用的工具箱。
通過對(duì)文庫寡核苷酸進(jìn)行一步寡核苷酸選擇,這種文庫的復(fù)雜程度可進(jìn)一步顯著降低。這種方法導(dǎo)致產(chǎn)生復(fù)雜性非常低(102-108)的編碼對(duì)基因、細(xì)胞/組織、或生物體特異的siRNA文庫,而不會(huì)損失該文庫的實(shí)用性。這種低復(fù)雜程度的文庫可以采用不同的序列測定方法,測定其部分或全部序列,并能夠?qū)崿F(xiàn)產(chǎn)生含有已知的針對(duì)某生物體,例如人、小鼠、或大鼠的每個(gè)基因的siRNA編碼物質(zhì)的質(zhì)粒集合物。
以上的描述大多是基于質(zhì)粒系統(tǒng),但利用同樣的原理,很容易在病毒載體中建立同樣的文庫和集合物。
本發(fā)明的一些重要類別的應(yīng)用在此列出,作為例子(1)由此文庫通過標(biāo)準(zhǔn)的篩選(可以是自動(dòng)化的),可以選擇用于任何特定基因的siRNA編碼質(zhì)粒的完全集合物。
(2)根據(jù)本發(fā)明,可以選擇用于任何特定細(xì)胞類型、組織和生物體的siRNA編碼質(zhì)粒的完全集合物。
(3)然后,對(duì)此類編碼siRNA的質(zhì)粒的完全集合物,很容易評(píng)價(jià)其各自的敲毀基因表達(dá)的能力。
(4)最重要的是,此類DNA文庫可以在沒有預(yù)先了解該靶基因的序列或其siRNA的序列的情況下,用于基于表型的靶基因篩選,因此,技術(shù)員可以避開預(yù)選擇靶基因的彎路。這種方法將會(huì)成為功能注解和藥物靶篩選最有價(jià)值的方法。
權(quán)利要求
1.一種用于在活性細(xì)胞中產(chǎn)生預(yù)定長度為10-30個(gè)堿基對(duì)的雙鏈RNA分子文庫的DNA文庫,其中編碼雙鏈RNA分子的雙鏈部分的DNA區(qū)的序列在所有的核苷酸位置上隨機(jī)化,以及其中所說的雙鏈RNA分子的兩條鏈都由該DNA文庫的單個(gè)成員產(chǎn)生。
2.一種用于在活性細(xì)胞中產(chǎn)生預(yù)定長度為19-30個(gè)堿基對(duì)的雙鏈RNA分子文庫的DNA文庫,其中編碼雙鏈RNA分子雙鏈部分的DNA區(qū)的序列在至少19個(gè)核苷酸位置上隨機(jī)化,以及其中所說的雙鏈RNA分子的兩條鏈都由該DNA文庫的單個(gè)成員產(chǎn)生。
3.一種用于在活性細(xì)胞中產(chǎn)生預(yù)定長度為15-30個(gè)堿基對(duì)的雙鏈RNA分子文庫的DNA文庫,其中編碼雙鏈RNA分子雙鏈部分的DNA區(qū)的序列至少在15個(gè)核苷酸位置上隨機(jī)化,以及其中所說的雙鏈RNA分子的兩條鏈都由該DNA文庫的單個(gè)成員產(chǎn)生。
4.一種用于在活性細(xì)胞中產(chǎn)生預(yù)定長度為10-30個(gè)堿基對(duì)的雙鏈RNA分子文庫的DNA文庫,其中編碼雙鏈RNA分子的雙鏈部分的DNA區(qū)的序列在至少4、7、10個(gè)核苷酸位置上隨機(jī)化,以及其中所說的雙鏈RNA分子的兩條鏈都由該DNA文庫的單個(gè)成員產(chǎn)生。
5.一種用于在活性細(xì)胞中產(chǎn)生預(yù)定長度為10-30個(gè)堿基對(duì)的雙鏈RNA分子文庫的DNA文庫,其中編碼雙鏈RNA分子雙鏈部分的DNA區(qū)的序列在4至所有的核苷酸位置上隨機(jī)化,以及其中所說的雙鏈RNA分子的兩條鏈都由該DNA文庫的單個(gè)成員產(chǎn)生。
6.根據(jù)權(quán)利要求1-5中任何一項(xiàng)所述的DNA文庫,其中所說的雙鏈RNA分子在其一端或兩端還含有單鏈區(qū)。
7.根據(jù)權(quán)利要求1-6中任何一項(xiàng)所述的DNA文庫,其中該DNA文庫的每個(gè)成員含有一個(gè)用于轉(zhuǎn)錄雙鏈RNA分子的啟動(dòng)子和一個(gè)用于轉(zhuǎn)錄雙鏈RNA分子的終止子,以及其中所形成的雙鏈RNA為發(fā)夾形的雙鏈分子。
8.根據(jù)權(quán)利要求1-6中任何一項(xiàng)所述的DNA文庫,其中該DNA文庫的每個(gè)成員含有至少兩個(gè)用于轉(zhuǎn)錄雙鏈RNA分子組分的啟動(dòng)子和兩個(gè)用于轉(zhuǎn)錄雙鏈RNA分子組分的終止子,以及其中該雙鏈RNA由雙鏈區(qū)的2個(gè)分開的并相互互補(bǔ)的RNA分子形成。
9.根據(jù)權(quán)利要求1-8所述的DNA文庫,其中該DNA文庫構(gòu)建在質(zhì)粒載體中。
10.根據(jù)權(quán)利要求1-8所述的DNA文庫,其中該DNA文庫構(gòu)建在病毒載體中。
11.根據(jù)權(quán)利要求1-10所述的DNA文庫,其中該DNA文庫的隨機(jī)性可通過選擇隨機(jī)的DNA寡核苷酸,然后將所說的隨機(jī)的DNA寡核苷酸克隆到載體中的方法修飾,即將隨機(jī)的DNA寡核苷酸與從某個(gè)來源的總RNA制備物或總mRNA制備物雜交,隨后只將可與此總RNA制備物或總mRNA制備物雜交的寡核苷酸克隆到載體中,其中該RNA來源可以是細(xì)胞、細(xì)胞系、組織或生物體。
12.含有根據(jù)權(quán)利要求1-11中任何一項(xiàng)所述的DNA文庫的試劑盒。
13.一種構(gòu)建根據(jù)權(quán)利要求1-6和8-11中任何一項(xiàng)所述的DNA文庫的方法,其中一對(duì)突變的H1啟動(dòng)子以相反的方向放置,用以推動(dòng)插入該兩個(gè)啟動(dòng)子之間的DNA片段的RNA表達(dá),其中所說的突變的H1啟動(dòng)子在緊靠轉(zhuǎn)錄起始點(diǎn)之前至少5個(gè)核苷酸區(qū)的序列與野生型的H1啟動(dòng)子的不同,所說的突變的H1啟動(dòng)子的5個(gè)核苷酸區(qū)為AAAAA。
14.由根據(jù)權(quán)利要求1-12中任何一項(xiàng)所述的DNA文庫得到的RNA文庫,其中所產(chǎn)生的雙鏈RNA的長度在10-30個(gè)核苷酸的范圍。
15.一種使用根據(jù)權(quán)利要求1-12中任何一項(xiàng)所述的DNA文庫的方法,其中該文庫作為一種混合物暫時(shí)或永久地導(dǎo)入細(xì)胞中。
16.一種利用根據(jù)權(quán)利要求1-12所述的DNA文庫篩選具有生物功能的雙鏈RNA的方法。
17.一種使用根據(jù)權(quán)利要求1-12所述的DNA文庫篩選新基因的方法。
18.根據(jù)權(quán)利要求15-17中任何一項(xiàng)所述的方法獲得的新基因。
19.根據(jù)權(quán)利要求15-17中任何一項(xiàng)所述的方法獲得的基因的新功能。
20.根據(jù)權(quán)利要求15-17中任何一項(xiàng)所述的方法獲得的藥物組合物。
全文摘要
本發(fā)明涉及以質(zhì)?;虿《据d體為基礎(chǔ)的DNA文庫,它能夠表達(dá)長度為10-30個(gè)堿基對(duì)的所有可能序列的雙鏈RNA,其中每條雙鏈RNA由單個(gè)發(fā)夾式的RNA分子形成,或由兩個(gè)分開的具有不同3’突出端的RNA分子所形成。這種DNA文庫中的每個(gè)單獨(dú)成員編碼上面說明的雙鏈RNA的所有組分。該文庫可以在沒有預(yù)先了解其靶基因的情況下,用于篩選能夠誘導(dǎo)特定表型的雙鏈RNA。本發(fā)明還涉及產(chǎn)生這種DNA文庫的方法。
文檔編號(hào)C12N15/11GK1662652SQ03814361
公開日2005年8月31日 申請(qǐng)日期2003年6月23日 優(yōu)先權(quán)日2002年6月21日
發(fā)明者梁子才, 張宏彥, 陳梅紅, 沈巖 申請(qǐng)人:北京諾塞基因組研究中心有限公司