核酸文庫及其制造方法
【專利摘要】本發(fā)明提供了用于設(shè)計和產(chǎn)生非隨機(jī)核酸文庫的方法。具體地,采用通過多重多聚核苷酸合成進(jìn)行的非隨機(jī)文庫合成。各文庫成員可編碼啟動子、核糖體結(jié)合位點和多肽。
【專利說明】核酸文庫及其制造方法
[0001] 相關(guān)申請
[0002] 本申請要求2013年11月27日提交的美國臨時申請?zhí)?1/909,537的權(quán)益和優(yōu)先權(quán), 其全部內(nèi)容通過引用納入本文。
[0003] 關(guān)于序列表
[0004] 本說明書包括所附序列表,其包括創(chuàng)建于20 14年11月25日,名為"127662- 014601PCT_ST25.txt"、大小為6,327字節(jié)的文件,其內(nèi)容通過引用全文納入本文。 發(fā)明領(lǐng)域
[0005] 本發(fā)明的方法和組合物設(shè)及核酸文庫,具體設(shè)及包含非隨機(jī)變體的核酸文庫的設(shè) 計和組裝。
[0006] 背景
[0007]重組和合成核酸在研究、工業(yè)、農(nóng)業(yè)和醫(yī)學(xué)中有許多應(yīng)用??蒞使用重組和合成核 酸來表達(dá)和獲得大量的多膚,包含酶、抗體、生長因子、受體和其它可用于多種醫(yī)學(xué)、工業(yè)或 農(nóng)業(yè)目的的多膚。也可W使用重組和合成核酸來產(chǎn)生遺傳修飾的生物體,包含修飾的細(xì)菌、 酵母、哺乳動物、植物和其它生物體。遺傳修飾的生物體可W用于研究(例如,疾病的動物模 型、理解生物過程的工具等)、工業(yè)(例如,作為蛋白表達(dá)的宿主生物體、用于產(chǎn)生工業(yè)產(chǎn)物 的生物反應(yīng)器、環(huán)境補(bǔ)救的工具、分離或修飾具有工業(yè)應(yīng)用的天然化合物等)、農(nóng)業(yè)(例如, 具有增加的產(chǎn)率或增加的對疾病或環(huán)境壓力的抗性的經(jīng)修飾作物等)和用于其它應(yīng)用。重 組和合成核酸也可W用作治療組合物(例如,用于修飾基因表達(dá)、用于基因治療等)或用作 診斷工具(例如,病癥的探針等)。
[000引已經(jīng)開發(fā)了多種技術(shù)用于修飾存在的核酸(例如,天然存在的核酸)來產(chǎn)生重組核 酸和核酸變體。具體而言,已采用變體文庫來選擇或篩選具有所需性質(zhì)的核酸或蛋白質(zhì)產(chǎn) 物。因此,極其需要核酸的從頭合成法,用于更廣泛的應(yīng)用。
【發(fā)明內(nèi)容】
[0009] 本發(fā)明的方面設(shè)及生成非隨機(jī)核酸文庫的方法,所述非隨機(jī)核酸文庫包含多種感 興趣的預(yù)選定或預(yù)定序列。本發(fā)明的其它方面設(shè)及非隨機(jī)核酸文庫,其包含多種感興趣的 預(yù)選定或預(yù)定序列。
[0010] 本發(fā)明的方面設(shè)及生成非隨機(jī)核酸文庫的方法,所述方法包括如下步驟:(a)提供 第一體積的第一組部分雙鏈核酸(partial double-stranded nucleic acid),其中第一組 雙鏈核酸中的各核酸具有相同的單鏈突出端,其中第一組部分雙鏈核酸中的各核酸具有不 同于第一組部分雙鏈核酸中的另一核酸的預(yù)定序列的預(yù)定序列;(b)提供第二體積的第二 組部分雙鏈核酸,其中第二組部分雙鏈核酸中的各核酸具有與第一組部分雙鏈核酸中的突 出端互補(bǔ)的相同的單鏈突出端,和(C)通過將第一組部分雙鏈核酸與第二組部分雙鏈核酸 混合來組裝所述核酸文庫,所述混合在使互補(bǔ)的突出端雜交的條件下進(jìn)行,W形成非隨機(jī) 變體祀核酸的文庫。在一些實施方式中,第二組部分雙鏈核酸具有預(yù)定序列,所述預(yù)定序列 可W不同于第二組部分雙鏈核酸中的另一序列。而在其它實施方式中,第二組部分雙鏈核 酸具有預(yù)定序列,所述預(yù)定序列可與第二組部分雙鏈核酸中的另一序列相同。
[0011] 在一些實施方式中,第一和第二組部分雙鏈核酸具有3'突出端。而在其它實施方 式中,第一和第二組部分雙鏈核酸具有5 '突出端。
[0012] 在一些實施方式中,組裝步驟可W在單一反應(yīng)體積中進(jìn)行。
[0013] 在一些實施方式中,在組裝步驟中,互補(bǔ)的突出端雜交W形成無缺口的接合 (gapless化nction)。在一些實施方式中,連接所述無缺口的接合。
[0014] 在一些實施方式中,所述方法包括:提供第一體積的第一組純端雙鏈核酸集,其中 第一純端雙鏈核酸集里的第一核酸具有從第一純端雙鏈核酸集里的第二核酸偏移n個堿基 的序列,并且,其中各純端雙鏈核酸集中的各雙鏈核酸是該集中另一雙鏈核酸的變體。在一 些實施方式中,所述方法還包括提供第二體積的第二組純端雙鏈核酸集,其中第二純端雙 鏈核酸集里的第一核酸具有從第二純端雙鏈核酸集里的第二核酸偏移n個堿基的序列。在 一些實施方式中,n可W是2、3、4、5、6、7,或8個堿基。在一些實施方式中,n可W是大于8個堿 基。例如,n可W是9、10、11、12、13、14、15、16、17、18、19、20或更多堿基。第一組純端雙鏈核 酸集可W在第一體積中解鏈或去雜交,W形成第一體積的單鏈核酸。類似地,第二體積的第 二組純端雙鏈核酸集可W經(jīng)變性或去雜交W形成第二體積的單鏈核酸。多個單鏈寡核巧酸 可退火W形成第一體積的具有單鏈突出端的第一組部分雙鏈寡核巧酸和第二體積的具有 單鏈突出端的第二組部分雙鏈寡核巧酸。
[0015] 在一些實施方式中,第二組純端雙鏈核酸集中的各雙鏈核酸是該集中的另一雙鏈 核酸的變體。
[0016] 在一些實施方式中,所述方法還包括第=體積的第=組部分雙鏈核酸,其中第= 組雙鏈核酸中的各核酸具有相同的單鏈突出端,其中第=組部分雙鏈核酸中的各核酸具有 預(yù)定序列,該預(yù)定序列不同于第=組部分雙鏈核酸中的另一核酸的預(yù)定序列。
[0017] 在一些實施方式中,所述方法還包括組裝變體核酸的文庫,該組裝通過在足W與 互補(bǔ)的突出端雜交的條件下混合第一、第二和第=組部分雙鏈核酸來進(jìn)行,由此形成非隨 機(jī)變體祀核酸的文庫。
[0018] 在一些實施方式中,所生成的文庫可W是基因文庫。在一些實施方式中,各雙鏈核 酸的大小可W是約20個堿基對-約200個堿基對。
[0019] 在一些實施方式中,所生成的文庫可W是基因文庫。在一些實施方式中,各雙鏈核 酸的大小可W是約200個堿基對-約500個堿基對。
[0020] 而在其它實施方式中,所生成的文庫可W是代謝通路文庫。在一些實施方式中,各 雙鏈核酸的大小可W是約500個堿基對-約3,000個堿基對。在一些實施方式中,各雙鏈核酸 可W是基因或基因的集。在一些實施方式中,各雙鏈核酸可包含遺傳元件。在一些實施方式 中,各雙鏈核酸可W是操縱子,其包括啟動子序列、核糖體結(jié)合位點序列、基因或基因的集、 終止子或其任何組合。在一些實施方式中,所述文庫可W是操縱子文庫,其包含具有不同強(qiáng) 度的啟動子。在一些實施方式中,所述文庫可W是操縱子文庫,其包含具有不同強(qiáng)度的核糖 體結(jié)合位點。
[0021] 根據(jù)本發(fā)明的一些方面,生成核酸文庫的方法包括如下步驟:鑒定祀核酸、在祀核 酸中鑒定第一區(qū)域,其中第一區(qū)域包含變體核酸序列;和在祀核酸中鑒定第二區(qū)域,其中第 二區(qū)域包含非變體序列。在一些實施方式中,祀核酸可包含一個或多個非變體區(qū)或恒定區(qū)、 一個或多個可變區(qū)及其組合。
[0022] 然后,可在包含變體核酸序列的至少第一組寡核巧酸和包含非變體核酸序列的至 少第二組寡核巧酸中解析祀核酸。可提供并組裝至少第一和第二組寡核巧酸。在一些實施 方式中,該文庫可W采用基于聚合酶的組裝反應(yīng)、基于連接酶的組裝反應(yīng),或其組合來組 裝。
[0023] 在一些實施方式中,祀核酸可編碼具有一個或多個結(jié)構(gòu)域的多膚。在一些實施方 式中,變體核酸序列可包含編碼一個或多個結(jié)構(gòu)域的至少部分的核酸序列的缺失、編碼一 個或多個結(jié)構(gòu)域的至少部分的核酸序列的插入,或其組合。在一些實施方式中,所述變體核 酸序列可具有如下任何情況:一個或多個核酸序列的缺失、一個或多個核酸序列的插入、一 個或多個取代,或前述任何情況的兩種或更多種的任意組合。在一些實施方式中,所述缺失 可W是編碼一個或多個結(jié)構(gòu)域的至少部分的核酸序列的缺失。在一些實施方式中,所述插 入可W是編碼一個或多個結(jié)構(gòu)域的至少部分的核酸序列的插入。在一些實施方式中,所述 取代可W是編碼一個或多個結(jié)構(gòu)域的至少部分的核酸序列中的核巧酸的取代。在一些實施 方式中,所述缺失、插入或取代(或前述任何組合)可W是一個或多個倍數(shù)的3核巧酸。在一 些實施方式中,所述缺失、插入或取代(或前述任何組合)可包含單一倍數(shù)的3個連續(xù)核巧 酸。在其它實施方式中,所述缺失、插入或取代(或前述任何組合)可包含五組或更少組的3 個連續(xù)核巧酸。在一些實施方式中,所述缺失、插入或取代(或前述任何組合)可包含6個或 更少,7個或更少,8個或更少,10個或更少,11個或更少,11個或更少,12個或更少,或更多組 的3個連續(xù)核巧酸。在一些實施方式中,取代可W是3個連續(xù)核巧酸取代的倍數(shù),或可涵蓋任 何數(shù)量的核巧酸,包括但不限于,一個核巧酸,或兩個核巧酸,或多于兩個核巧酸。
[0024] 在一些實施方式中,所述祀核酸是基因或基因的集。在一些實施方式中,所述缺 失、插入或取代(或前述任何組合)在所述基因或基因的集的非編碼序列中。在一些實施方 式中,基因或基因的集的非編碼序列可包含缺失、插入或取代(或前述任何組合)。尤其在位 于非編碼序列時,缺失、插入或取代(或前述任何組合)可包含任何數(shù)量的核巧酸,包括一個 或多個倍數(shù)(一組或多組)的3個連續(xù)核巧酸。根據(jù)本發(fā)明的一個實施方式,缺失、插入或取 代(或前述任何組合)可見于編碼區(qū)、非編碼區(qū),或兩者。
[0025] 在一些實施方式中,用于生成核酸文庫的方法包括:選擇祀核酸序列,選擇待在一 個或多個選定位置缺失或插入的至少一個核酸序列,設(shè)計在該選定位置具有變體序列的第 一集的寡核巧酸和具有非變體序列的至少第二集的寡核巧酸,和組裝第一和至少第二集的 寡核巧酸。在一些實施方式中,在所述選擇步驟中,待缺失、插入或取代(或前述任何組合) 的核酸序列可W是一組或多組的3核巧酸。在一些實施方式中,在所述選擇步驟中,待缺失、 插入或取代(或前述任何組合)的核酸序列可包含5組或更少組的3個連續(xù)核巧酸。在一些實 施方式中,在所述選擇步驟中,待缺失、插入或取代(或前述任何組合)的核酸序列可包含6 個或更少,7個或更少,8個或更少,10個或更少,11個或更少,11個或更少,12個或更少,或更 多組的3個連續(xù)核巧酸。在一些實施方式中,取代可W是3個連續(xù)核巧酸取代的倍數(shù),或可涵 蓋任何數(shù)量的核巧酸,包括但不限于,一個核巧酸,或兩個核巧酸,或多于兩個核巧酸。
[0026] 在一些實施方式中,第一和第二集一起可包含祀核酸序列。在一些實施方式中,第 一和第二集一起可包含祀核酸序列的片段。在一些實施方式中,所述選定位置可包含核巧 酸、密碼子、核巧酸序列或其組合。
[0027] 在一些實施方式中,祀核酸是基因或基因的集。在一些實施方式中,所述缺失、插 入或取代(或前述任何組合)在所述基因或基因的集的非編碼序列中。尤其在位于非編碼序 列時,缺失、插入或取代(或前述任何組合)可包含任何數(shù)量的核巧酸,包括一組或多組的3 核巧酸。根據(jù)本發(fā)明的一個實施方式,插入和/或缺失可見于編碼區(qū)、非編碼區(qū),或上述兩 者。
【附圖說明】
[0028] 圖1A-1B說明產(chǎn)生用于構(gòu)建非隨機(jī)變體文庫的突出端核酸的非限制性示例性方 法。圖IA顯示在第一集合中產(chǎn)生具有3'突出端的核酸雙鏈體。圖IB顯示在第二集合中產(chǎn)生 具有3 '突出端的核酸雙鏈體。
[0029] 圖2A和2B說明用于產(chǎn)生非隨機(jī)變體文庫的,組裝具有突出端的核酸雙鏈體的非限 制性示例性方法。
[0030] 圖3A-3C說明構(gòu)建非隨機(jī)變體文庫的非限制性示例性方法。圖3A顯示在第一單一 反應(yīng)體積中制備的雙鏈文庫核酸或片段。圖3B顯示在第一單一反應(yīng)體積中制備的雙鏈文庫 片段。圖3C顯示單一體積中雙鏈文庫片段混合物的生成。
[0031] 圖4A-B說明構(gòu)建非隨機(jī)變體文庫的非限制性示例性方法。圖4A顯示一個實施方 式,其中兩個片段A交錯雜交產(chǎn)物{A1,A2}、四個片段B交錯雜交產(chǎn)物郵,82,83,84},和兩個 片段C交錯雜交產(chǎn)物{C1,C2}合并形成核酸的非隨機(jī)文庫。圖4B顯示運些集的交錯雜交產(chǎn)物 A、B、C在單一反應(yīng)體積的連接。
[0032] 圖5說明在密碼子、核巧酸和多個核巧酸水平具有缺失和/或插入的離散合成的序 列和所述序列的組合組裝的非限制性實施方式。缺失和插入W下劃線標(biāo)示。合成在密碼子 水平具有缺失和/或插入的離散序列:寡聚物1,寡聚物Ia具有核巧酸CTG的缺失和3核巧酸 CCG的插入(下劃線標(biāo)示),寡聚物化具有3核巧酸插入CTG、3核巧酸插入CCG(下劃線標(biāo)示)和 3核巧酸CCG(下劃線標(biāo)示)。合成在核巧酸水平具有缺失和/或插入的離散序列:寡聚物2,寡 聚物2a具有單一核巧酸缺失,寡聚物化具有單一核巧酸A插入(下劃線標(biāo)示)。合成在多重核 巧酸水平具有缺失和/或插入的離散序列:寡聚物3,寡聚物3a具有12個核巧酸缺失(下劃線 標(biāo)示),寡聚物3b具有12個核巧酸插入(下劃線標(biāo)示)??蓪⒐押饲伤峤M裝成具有由用戶指定 的精確序列的完全變體構(gòu)建體:變體1:寡聚物1+寡聚物2+具有12個核巧酸缺失的寡聚物 3a,和變體2:具有3核巧酸缺失和3核巧酸插入的寡聚物Ia+具有單一核巧酸缺失的寡聚物 2a+具有12個核巧酸缺失的寡聚物3曰。
[0033] 發(fā)明詳述
[0034] 本發(fā)明的方面設(shè)及用于生成非隨機(jī)核酸文庫的方法和組合物,所述非隨機(jī)核酸文 庫包含多種感興趣的預(yù)選定或預(yù)定序列。本發(fā)明的一些方面設(shè)及化學(xué)合成用于廣泛應(yīng)用的 核酸文庫,包括抗體設(shè)計和代謝通路最優(yōu)化。制造核酸文庫的一般方法是由終產(chǎn)物的單一 示例開始(例如,可能編碼抗體的基因),然后隨機(jī)突變該基因,例如通過采用易錯聚合酶進(jìn) 行擴(kuò)增。用于產(chǎn)生變體文庫的另一方法是將變異引入DNA合成,例如,通過在DNA合成反應(yīng)的 具體偶聯(lián)步驟中偶聯(lián)核巧酸堿基(例如a、c、t和g)的混合物。運些方法的不足之處在于,運 些方法產(chǎn)生的隨機(jī)文庫包含大量的文庫成員,其不太可能是感興趣的變體,但又必須經(jīng)過 篩選。此外,運些方法可能會占據(jù)可用篩選資源的大部分。
[0035] 本發(fā)明的方面設(shè)及合理設(shè)計并生成合理設(shè)計的變體文庫的方法,其中所述文庫的 基本每個成員或所述文庫成員的大部分經(jīng)設(shè)計或工程改造W具有非隨機(jī)序列。所述方法能 夠限制經(jīng)合成和篩選的文庫成員的數(shù)量,W更好地利用可用的文庫篩選資源。因此,本發(fā)明 的方面設(shè)及能夠減小變體核酸文庫的復(fù)雜性的方法和組合物,由此減少在篩選過程中對運 些文庫的過度取樣,并提高篩選效率。
[0036] 本發(fā)明的方面可納入核酸組裝過程來,例如,提高組裝保真度、通量和/或效率,降 低成本,和/或縮短組裝時間。在一些實施方式中,本發(fā)明的方面可W自動化和/或在高通量 組裝環(huán)境下進(jìn)行來促進(jìn)平行產(chǎn)生祀核酸序列的許多不同變體。
[0037] 本文使用的術(shù)語"核酸"、"多核巧酸"、"寡核巧酸"可互換使用,并且指核巧酸的天 然產(chǎn)生或合成的聚合物形式。本發(fā)明所述寡核巧酸和核酸分子可W從天然產(chǎn)生的核巧酸形 成,例如形成脫氧核糖核酸化NA)或核糖核酸(RNA)分子。在一些實施方式中,寡核巧酸和核 酸分子可被甲基化?;蛘?,該天然產(chǎn)生的寡核巧酸可W包含改變其性質(zhì)的結(jié)構(gòu)修飾,例如膚 核酸(PM)或鎖核酸(LNA)。用天然產(chǎn)生堿基或人工堿基的寡核巧酸和核酸分子的固相合成 為本領(lǐng)域熟知。應(yīng)理解,運些術(shù)語包含從核巧酸類似物中生成的RNA或DNA的等同物、類似物 和應(yīng)用于要描述的實施方式時的單鏈或雙鏈多核巧酸。本發(fā)明中可用的核巧酸包含例如天 然產(chǎn)生的核巧酸(例如核糖核巧酸或脫氧核糖核巧酸),或者核巧酸的天然或合成修飾、或 者人工堿基。本文使用的術(shù)語單體指小分子組成員,其是并且能結(jié)合在一起W形成低聚物、 聚合物或由兩個或更多成員構(gòu)成的化合物。聚合物中所述單體的特定順序在本文中稱為聚 合物的"序狎'。所述單體組包含但不限于例如常見k氨基酸組、D-氨基酸組、合成和/或天 然氨基酸組、核巧酸組及戊糖和己糖組。本發(fā)明所述方面主要設(shè)及制備和應(yīng)用寡核巧酸,也 可容易地用于制備其它聚合物例如膚或多膚、多糖、憐脂、異聚物、聚醋、聚碳酸醋、聚脈、聚 酷胺、聚乙締亞胺、聚芳撐硫、聚硅氧烷、聚酷亞胺、聚乙酸醋或任何其它聚合物。
[0038] 術(shù)語"基因"指的是,表達(dá)特定蛋白質(zhì)的核酸片段,包括調(diào)控序列,例如處于編碼序 列之前巧/非編碼序列)和之后(3/非編碼序列)的調(diào)控序列。
[0039] "啟動子"指的是能夠控制編碼序列或功能性RNA的表達(dá)的核巧酸序列。通常,編碼 序列位于啟動子序列的3'。
[0040] 本文使用的術(shù)語"預(yù)確定序列"、"預(yù)定序列"或"預(yù)選定序列"可互換使用,并且指 在所述聚合物合成或組裝前已知并選擇聚合物的序列。具體地,本文所述本發(fā)明的各方面 主要設(shè)及核酸分子的制備,在核酸分子合成或組裝前已知且已選擇核酸的序列。在本文所 提供技術(shù)的一些實施方式中,固定的寡核巧酸或多核巧酸被用作材料來源。在各種實施方 式中,本文所述方法使用合成的寡核巧酸,其序列基于待合成的最終多核巧酸構(gòu)建體的序 列確定。在一個實施方式中,寡核巧酸是短核酸分子。例如,寡核巧酸的長度可W是10至約 300個核巧酸、20至約400個核巧酸、30至約500個核巧酸、40至約600個核巧酸,或超過約600 個核巧酸。然而,可W使用更短或更長的寡核巧酸。寡核巧酸可設(shè)計成具有不同長度。在一 些實施方式中,多核巧酸構(gòu)建體序列可W分成多個更短序列,該序列能使用本文所述方法 平行合成并組裝成單個或多個所需多核巧酸構(gòu)建體。在一些實施方式中,所述組裝過程可 W包括數(shù)種平行和/或順序反應(yīng)步驟,其中多個不同核酸或寡核巧酸被合成或固定、引物延 伸或擴(kuò)增,并且合并W組裝(如通過本文所述延伸或連接)生成更長核酸產(chǎn)物,從而用于進(jìn) 一步組裝、克隆或其它應(yīng)用。
[0041] 本文所用的"非隨機(jī)"核酸文庫序列指的是所述文庫中的祀核酸序列在組裝之前 是基本預(yù)選定或預(yù)定的,運與經(jīng)變性或隨機(jī)衍生不同。本文所用的術(shù)語"非隨機(jī)變體文庫" 和"通過多重多核巧酸合成的變體文庫(VL-MPS)"可互換使用。在一些實施方式中,根據(jù)本 發(fā)明方面的非隨機(jī)文庫基本不含隨機(jī)序列變異(例如包含少于10%,少于5%,少于1%,少 于0.1%,或少于0.01%的隨機(jī)變異)。本領(lǐng)域技術(shù)人員應(yīng)理解,變體核酸可包括待變化的參 照核酸序列的任意各種變異位點。
[0042] 在一些實施方式中,非隨機(jī)文庫的變體成員可W是基于預(yù)定的參照序列而言包含 單一或多個序列變異的相關(guān)序列。根據(jù)本發(fā)明的一些方面,非隨機(jī)文庫可W從多種核酸(例 如,多核巧酸、寡核巧酸等)組裝,W形成較長的核酸產(chǎn)物。文庫可包含包括相同的(非變異) 區(qū)域和序列變異區(qū)域的核酸。因此,某些待組裝的核酸可與非變體序列區(qū)域相對應(yīng),而其它 待組裝的核酸可與預(yù)定的序列變異區(qū)域中的若干預(yù)定序列變體之一相對應(yīng)。在一些實施方 式中,非隨機(jī)核酸文庫可包含編碼兩種或更多種感興趣的多膚的兩種或更多種核酸。在一 些實施方式中,非隨機(jī)文庫可經(jīng)設(shè)計W表達(dá)任何類型的多膚,例如支架蛋白質(zhì)、抗體、酶 ......
[00創(chuàng)合成寡核巧酸
[0044] 在一些實施方式中,本文提供的方法和裝置使用固定在表面或基底上的寡核巧酸 (如結(jié)合支持物的寡核巧酸)。結(jié)合支持物的寡核巧酸包括例如與構(gòu)建寡核巧酸互補(bǔ)的寡核 巧酸、錯定寡核巧酸和/或間隔子寡核巧酸。本文使用的術(shù)語"支持物"、"基底"和"表面"可 互換使用,并且指聚合物例如核酸在上面合成或固定的多孔或非多孔溶劑不溶性材料。本 文使用的"多孔"是指所述材料包含有基本一致直徑(例如nm范圍內(nèi))的孔。多孔材料包括 紙、合成濾器等。在運種多孔材料中,所述反應(yīng)可W在孔中進(jìn)行。所述支持物能具有很多形 狀中的任何一種,例如銷型、條、板、平盤、桿狀、彎曲、圓柱形結(jié)構(gòu)、顆粒(包含珠、納米顆粒) 等。所述支持物可有可變寬度。所述支持物可W是親水性的,或可W制成親水性的,并且包 含無機(jī)粉末(如二氧化娃、硫酸儀和氧化侶)、天然聚合材料(特別是纖維素材料和纖維素衍 生材料,例如包含纖維的紙(如濾紙、色譜紙等))、合成或改性天然產(chǎn)生的聚合物(如硝酸纖 維素、乙酸纖維素、聚(氯乙締)、聚丙締酷胺、交聯(lián)的葡聚糖、瓊脂糖、聚丙締酸醋、聚乙締、 聚丙締、聚(4-甲基下締)、聚苯乙締、聚甲基丙締酸醋、聚(對苯二甲酸乙二醋)、尼龍、聚(下 酸乙締醋)、聚偏二氣乙締(PVDF)膜、玻璃、可控孔度玻璃、磁性可控孔度玻璃、陶瓷、金屬 等),或者單獨使用或與其它材料聯(lián)用。在一些實施方式中,W陣列形式合成寡核巧酸。例 如,在常見支持物上原位合成單鏈寡核巧酸,其中在基底上的單獨或離散的部位(或點)上 合成各寡核巧酸。在一個實施方式中,單鏈寡核巧酸結(jié)合到所述支持物或特征部位的表面 上。本文所用的術(shù)語"陣列"是指用于存儲、擴(kuò)增和釋放寡核巧酸或互補(bǔ)寡核巧酸用于進(jìn)一 步反應(yīng)的離散特征的排列。在一個優(yōu)選實施方式中,所述支持物或陣列是可尋址的:所述支 持物在該支持物上具體的預(yù)定位置(即,"地址")處包括兩個或更多個離散的可尋址特征。 因此,陣列上的各寡核巧酸分子位于所述支持物上已知和確定的位置。各寡核巧酸序列能 從其在所述支持物上的位置來確定。所述陣列可W包含特征部位之間的區(qū)域。特征部位之 間可W在其表面載有任何寡核巧酸,并且可對應(yīng)惰性空間。
[0045] 在一些實施方式中,寡核巧酸在表面或陣列的離散特征上連接、點樣、固定、表面 結(jié)合、支持或合成。
[0046] 本發(fā)明的一些方面設(shè)及多核巧酸組裝過程,其中,合成的寡核巧酸經(jīng)設(shè)計并且用 作引物延伸反應(yīng)、合成互補(bǔ)寡核巧酸的模板,并用于組裝多核巧酸成為更長多核巧酸構(gòu)建 體。在一些實施方式中,該方法包含在鏈延伸反應(yīng)中使用第一組單鏈寡核巧酸作為模板合 成多個寡核巧酸或多核巧酸。如前所述,可W首先在表面的多個離散特征部位上或在多個 支持物(如珠)上合成寡核巧酸,或可將寡核巧酸置于支持物的多個特征部位上或多個支持 物上。支持物可W包含至少100、至少1,000、至少1〇4、至少1〇5、至少1〇6、至少1〇 7、至少IO8個 特征。在一些實施方式中,所述寡核巧酸共價連接至所述支持物。在一些實施方式中,所述 多個寡核巧酸固定在固體表面上。
[0047] 在一些實施方式中,所述結(jié)合支持物的寡核巧酸可通過其5'末端連接。在其它實 施方式中,所述結(jié)合支持物的寡核巧酸通過其3'末端連接。在一些實施方式中,所述結(jié)合支 持物的寡核巧酸可W通過核巧酸序列(如簡并結(jié)合序列)、接頭或間隔子(如光可切割的接 頭或化學(xué)接頭)固定在支持物上。應(yīng)理解,3 '末端是指所述5 '末端的下游序列,和5 '末端是 指所述3'末端的上游序列。例如,寡核巧酸可通過不參與雜交的間隔子、核巧酸序列或接頭 固定在支持物上。然后,所述結(jié)合支持物的寡核巧酸的3'末端表示接頭或間隔子的上游序 列。
[0048] 在某些實施方式中,寡核巧酸可W設(shè)計成具有與要組裝的預(yù)測定祀標(biāo)多核巧酸序 列的不同部分相同或互補(bǔ)的序列。因此,在一些實施方式中,每條寡核巧酸可W具有與雙鏈 祀核酸的兩條鏈之一的部分相同或互補(bǔ)的序列。本文使用的術(shù)語"互補(bǔ)"指兩個核巧酸之間 精確配對的能力。例如,如果在核酸給定位點的核巧酸能與另一核酸的核巧酸形成氨鍵,貝U 認(rèn)為兩個核酸分子在該位點彼此互補(bǔ)。兩條單鏈核酸間的互補(bǔ)性可W是"部分的",其中僅 有一些核巧酸結(jié)合,或者當(dāng)單鏈分子間存在完全互補(bǔ)性時為完全互補(bǔ)。術(shù)語"正交"表示所 述序列不同、不具干擾性或不互補(bǔ)。
[0049] 在一些實施方式中,提供多種傳導(dǎo)寡核巧酸(conduction oligonucleotide)。在 一些實施方式中,構(gòu)建寡核巧酸山〇郵化11(31:;[0]1 oligonucleotide)采用結(jié)合支持物的寡核 巧酸作為模板來合成。
[0050] 在一些實施方式中,設(shè)計多個構(gòu)建寡核巧酸,例如多個構(gòu)建寡核巧酸各在其5 '末 端具有與另一個構(gòu)建寡核巧酸5'末端的序列區(qū)域互補(bǔ)的序列區(qū)域,和在其3'末端具有與不 同構(gòu)建寡核巧酸3'末端的序列區(qū)域互補(bǔ)的序列區(qū)域。在一些實施方式中,設(shè)計多個構(gòu)建寡 核巧酸,例如多個構(gòu)建寡核巧酸各在其5'末端具有與另一個構(gòu)建寡核巧酸5'末端的序列區(qū) 域相同的序列區(qū)域,和在其3'末端具有與不同構(gòu)建寡核巧酸3'末端的序列區(qū)域相同的序列 區(qū)域。本文所用的"構(gòu)建"寡核巧酸指的是,用于生成偏移二聚體W用于核酸組裝的多個單 鏈或雙鏈寡核巧酸或其群之一。多個構(gòu)建寡核巧酸可W是雙鏈的,并且可包含針對祀多核 巧酸的正義和反義鏈的寡核巧酸。構(gòu)建寡核巧酸可W是純端寡核巧酸雙鏈體。構(gòu)建寡核巧 酸可有任何長度,所述長度設(shè)計為適合重疊或互補(bǔ)序列。構(gòu)建寡核巧酸可具有相同大小或 不同大小。在優(yōu)選實施方式中,所述構(gòu)建寡核巧酸跨越祀多核巧酸的整個序列且無缺口。在 其他實施方式中,所述構(gòu)建寡核巧酸部分重疊,使得在互相雜交時產(chǎn)生構(gòu)建寡核巧酸之間 的缺口。在一些實施方式中,構(gòu)建寡核巧酸可具有除所述祀多核巧酸序列W外的其它序列。 例如,構(gòu)建寡核巧酸可W是具有插入和/或缺失的經(jīng)修飾的構(gòu)建寡核巧酸。在一些實施方式 中,所述構(gòu)建寡核巧酸可具有一個或多個取代。在一些實施方式中,所述構(gòu)建寡核巧酸可具 有一個或多個插入、一個或多個缺失、一個或多個取代,或前述任何組合。在一些實施方式 中,構(gòu)建寡核巧酸的集合或群包含具有重疊序列(互補(bǔ)的或相同)的構(gòu)建寡核巧酸。
[0051] 本文所用術(shù)語"二聚體"指寡核巧酸雙鏈體或雙鏈寡核巧酸分子。術(shù)語"偏移二聚 體"和"偏移雙鏈體"可互換使用,并且指具有3 '和/或5 '突出端(或粘性末端,即,非純端)的 寡核巧酸雙鏈體。在一些實施方式中,偏移二聚體是部分雙鏈核酸(例如寡核巧酸),由此, 所述核酸包含第一單鏈突出端和第二單鏈突出端。例如,所述偏移二聚體可具有3 '突出端 或所述偏移二聚體可具有5 '突出端。
[0052] 在一些實施方式中,所述偏移二聚體通過對集合中的構(gòu)建寡核巧酸進(jìn)行變性和重 新雜交來產(chǎn)生。
[0053] 應(yīng)該理解不同的寡核巧酸可W設(shè)計成有重疊序列區(qū)域的不同長度。重疊序列區(qū)域 可W是相同的(即對應(yīng)核酸片段的相同鏈)或互補(bǔ)的(即對應(yīng)核酸片段的互補(bǔ)鏈)。重疊序列 可W具有任何合適的長度。重疊序列可W長約5-約500個核巧酸(如長約10-100、約10-75、 約10-50、約20、約25、約30、約35、約40、約45、約50個核巧酸等)。然而,可W使用更短、更長 或中間的重疊長度。應(yīng)該理解用于組裝反應(yīng)的不同輸入核酸之間的重疊(5'或3'區(qū)域)可W 有不同長度。
[0054] 在一些實施方式中,核酸采用基于連接酶的組裝技術(shù)組裝。在一些實施方式中,寡 核巧酸經(jīng)設(shè)計W提供祀多核巧酸構(gòu)建體的全長正義(或正鏈)和反義(或負(fù)鏈)鏈。在正義和 反義寡核巧酸雜交W形成偏移二聚體之后,偏移二聚體經(jīng)歷連接,W形成祀多核巧酸構(gòu)建 體或亞組裝產(chǎn)物。參考美國專利號5,942,609,其全文納入本文?;谶B接酶的組裝技術(shù)可 W設(shè)及一種或多種合適的連接酶,所述酶能催化臨近3'和5'核酸末端的共價連接(如在互 補(bǔ)模板核酸上退火的核酸的5'憐酸和3'徑基,從而所述3'末端緊鄰5'末端)。因此,如果第 一和第二核酸在模板核酸上互相臨近退火,連接酶可W催化第一核酸的5'憐酸和第二核酸 的3'徑基之間的連接反應(yīng)。連接酶可W獲自重組或天然來源。連接酶可W是熱穩(wěn)定的連接 酶。在一些實施方式中,可W使用來自嗜熱生物的熱穩(wěn)定連接酶。熱穩(wěn)定DNA連接酶的例子 包括但不限于:Tth DNA連接酶(來自嗜熱棲熱菌(Thermus thermophiIus),可來自例如歐 基公司化urogentec)和GeneCraft公司);P化DNA連接酶(來自激烈火球菌(Pyrococcus 化riosus)的超嗜熱連接酶);Taq連接酶(來自水生棲熱菌(Thermus aquaticus)) ,Ampli 連?酶?(來自化icenter生物技術(shù)公司)任何其它合適的熱穩(wěn)定連接酶,或其任意組合。在 一些實施方式中,可W使用一種或多種較低溫度的連接酶(如T4DNA連接酶)。較低溫度的連 接酶可W用于可能在較高溫度下不穩(wěn)定的更短突出端(如約3、約4、約5、或約6個堿基的突 出端)。非酶促技術(shù),例如化學(xué)連接,可用于連接核酸。
[00巧]多重多核巧酸合成
[0056]本發(fā)明的方面設(shè)及用于廣泛應(yīng)用的核酸文庫的化學(xué)合成。本發(fā)明的一些實施方式 設(shè)及用于合成核酸文庫的快速且經(jīng)濟(jì)的方法。應(yīng)理解,多核巧酸合成成本的主要部分是進(jìn) 行多核巧酸合成反應(yīng)的試劑成本。為了降低成本,反應(yīng)可在較小體積中進(jìn)行。在一些實施方 式中,反應(yīng)可在個體微體積(例如液滴)中進(jìn)行。根據(jù)本發(fā)明的一些方面,多種不同核酸可W 在多重核酸合成中的單一合成反應(yīng)體積中合成。本領(lǐng)域技術(shù)人員應(yīng)理解,所述文庫可通過 依序、平行或分級多重組裝過程來組裝。在一些實施方式中,可在單一反應(yīng)中組裝所述文 庫,或分開組裝中間核酸片段然后在一輪或多輪組裝(例如雜交和連接)中將其合并。
[0057] 應(yīng)理解,在第一步中,設(shè)計構(gòu)建核酸序列或構(gòu)建寡核巧酸。構(gòu)建核酸可W是合成的 寡核巧酸,如本文中所述,擴(kuò)增產(chǎn)物、限制片段或其它合適的核酸。在一些實施方式中,某些 構(gòu)建核酸可包括一種或多種序列變異。在一些實施方式中,可設(shè)計所述構(gòu)建核酸,從而在第 一集合中的第一構(gòu)建核酸的5'端與第二集合中的第二構(gòu)建核酸的3'端相同。
[0058] 根據(jù)本發(fā)明的一些方面,非隨機(jī)文庫可通過合并兩個或更多個核酸集合(各核酸 具有預(yù)定序列)來組裝。在一些實施方式中,一個或多個池可具有核酸變體序列。例如,所述 核酸文庫可通過合并一個核酸變體集合和具有不可變(或恒定)序列的一個核酸集合來組 裝。而在其它實施方式中,所述核酸文庫可通過合并多個核酸變體集合來組裝。因此,可設(shè) 計并組裝具有不同類型或變體或不同變體密度的不同文庫。
[0059] 在一些實施方式中,合并的各核酸的濃度可W經(jīng)調(diào)節(jié)W改善組裝反應(yīng)并驅(qū)動所述 反應(yīng),W形成全長核酸。在一些實施方式中,各核酸的濃度是偏向(biased)的,W改變代表 的核酸變體的比例。在一些實施方式中,可W預(yù)確定的比例添加各構(gòu)建核酸,W使所得核酸 文庫偏向。例如,如果需要該文庫具有某一水平的特定變異并在相同或不同位點具有較低 水平的另一變異,可通過添加較高水平的所需變異來使該文庫偏向。在一些實施方式中,具 有可變序列的核酸可與具有不可變序列的核酸W預(yù)定比例合并,W使核酸文庫偏向。
[0060] 用于產(chǎn)生具有預(yù)定序列的核酸的文庫的多重核酸組裝反應(yīng)的某些實施方式參照 圖1-4進(jìn)行說明。應(yīng)理解,本文所述的合成和組裝方法(包含,例如,寡核巧酸合成、分步組 裝、多重核酸組裝、核酸片段的等級組裝或其任意組合)可W任意合適的模式實施,包含在 反應(yīng)試管中、在多孔平板中、在表面上、在柱中、在微流體裝置(例如,微流體管)中、毛細(xì)管 中等。
[0061] 在多重組裝反應(yīng)(例如,多重的酶介導(dǎo)反應(yīng)、多重化學(xué)組裝反應(yīng)或其組合)中可W 從多個不同起始核酸(例如,寡核巧酸)組裝成文庫的預(yù)定核酸成員。通過對多重寡核巧酸 組裝反應(yīng)的某些實施方式的W下描述顯示了多重核酸組裝反應(yīng)的某些方面。應(yīng)該理解寡核 巧酸環(huán)境下組裝反應(yīng)的描述并不意在構(gòu)成限制??蒞使用從一個或多個不同來源(例如,合 成或天然多核巧酸、核酸擴(kuò)增產(chǎn)物、核酸降解產(chǎn)物、合成或天然寡核巧酸、合成或天然基因 等)得到的起始核酸,來實施本文所述的組裝反應(yīng)。起始核酸可W被稱為組裝核酸(例如,組 裝寡核巧酸)。如本文所用,組裝核酸或偏移二聚體具有的序列設(shè)計為待納入組裝過程所產(chǎn) 生核酸產(chǎn)物中的序列。然而,應(yīng)該理解在雙鏈核酸環(huán)境下組裝反應(yīng)的描述并不意在構(gòu)成限 審IJ。在一些實施方式中,在圖中所示和本文所述的起始核酸的一個或多個可W單鏈核酸提 供。因此,應(yīng)理解,當(dāng)圖和說明表示粘性末端雙鏈核酸的組裝時,考慮一個或多個單鏈核酸 的存在。
[0062] 在各個實施方式中,祀核酸首先可被分成兩個或更多重疊的核酸片段(亞組裝片 段)。每個核酸片段然后被再分為兩個或更多的重疊的更小核酸片段。
[0063] 可W使用任意合適的技術(shù)來合成寡核巧酸。例如,可W在柱或其它支持物(例如, 忍片或陣列)上合成寡核巧酸?;谌唐暮铣杉夹g(shù)的例子包括自CombiMatrix、安捷倫 (Agilent)、艾菲美特(Affymetrix)或其它來源可得的合成裝置或方法中使用的技術(shù)。合成 寡核巧酸可W是任意合適的大小,例如10-1000個核巧酸長(例如,10-200、200-500、500- 1000個核巧酸長或其任意組合)。組裝反應(yīng)可W包含多個寡核巧酸,每個寡核巧酸的長度可 W各自獨立為10-300個核巧酸(例如,20-250、30-200、50-150、50-1OO或任意中間數(shù)的核巧 酸)。然而,在某些實施方式中可W使用一個或多個較短或較長的寡核巧酸。
[0064] 如本文所用,寡核巧酸可W是包括至少兩個共價結(jié)合的核巧酸殘基的核酸分子。 在一些實施方式中,寡核巧酸長度可W是10-1000個核巧酸。例如,寡核巧酸長度可W是約 10~約500個核巧酸,或約500~約1,000個核巧酸。在一些實施方式中,寡核巧酸長度可W 是約20-約300個核巧酸(例如,約30-250、40-220、50-200、60-180,或約65或約150個核巧 酸)、約100-約200、約200-約300個核巧酸、約300-約400,或約400-約500個核巧酸。然而,可 W使用更短或更長的寡核巧酸。寡核巧酸可W是單鏈核酸。然而,在一些實施方式中,可W 如本文所述使用雙鏈寡核巧酸。在某些實施方式中,寡核巧酸可W是化學(xué)合成的,如W下詳 述。在一些實施方式中,可W在使用前擴(kuò)增輸入的核酸(例如,合成寡核巧酸或核酸片段)。 所得的產(chǎn)物可W是雙鏈的。
[0065] 在某些實施方式中,每條寡核巧酸可W設(shè)計成具有與待組裝的預(yù)定祀核酸的序列 的不同部分相同的序列。因此,在一些實施方式中,每條寡核巧酸可W具有與雙鏈祀核酸的 兩條鏈之一的部分相同的序列。為清楚起見,雙鏈核酸的兩條互補(bǔ)鏈在本文中被稱為正鏈 (P)和負(fù)鏈(N)。運種名稱并不意在暗示鏈?zhǔn)蔷幋a序列的正義鏈和反義鏈。它們僅僅是指核 酸(例如,祀核酸,中間體核酸片段等)的兩條互補(bǔ)鏈,無關(guān)核酸的序列或功能。因此,在一些 實施方式中,P鏈可W是編碼序列的正義鏈,而在其它實施方式中,P鏈可W是編碼序列的反 義鏈。應(yīng)理解,本文提及的互補(bǔ)核酸或互補(bǔ)核酸區(qū)域是指具有互相反向互補(bǔ)使得它們能夠 W天然DNA典型的反向平行方式雜交的核酸或其區(qū)域。
[0066] 按照本發(fā)明的一個方面,祀核酸可W是P鏈、N鏈或包括P鏈和N鏈的雙鏈核酸。應(yīng)理 解,不同的寡核巧酸可W被設(shè)計為具有不同的長度。在一些實施方式中,一種或多種不同的 偏移寡核巧酸可W具有重疊的序列區(qū)域或突出端(例如,重疊的5'區(qū)域和/或重疊的3'區(qū) 域)。重疊序列區(qū)域可W是相同的(即對應(yīng)核酸片段的相同鏈)或互補(bǔ)的(即對應(yīng)核酸片段的 互補(bǔ)鏈)。多種偏移寡核巧酸二聚體可W包含有相同重疊序列區(qū)域的一個或多個寡核巧酸 對、有重疊互補(bǔ)序列區(qū)域的一個或多個寡核巧酸對,或其組合。重疊序列可W具有任何合適 的長度。例如,重疊序列可W包括在組裝反應(yīng)中使用的一個或多個核酸的全長。重疊序列可 W是約2-約50(例如,3-20、3-10、3-8、或4、5、6、7、8、9個等核巧酸長)。然而,可W使用更短、 更長或中間的重疊長度。應(yīng)該理解用于組裝反應(yīng)的不同偏移寡核巧酸二聚體之間的重疊可 W有不同長度和/或序列。例如,重疊序列可W與另一個序列差異至少1個核巧酸、2個核巧 酸、3個核巧酸或更多。
[0067] 在一個設(shè)計為產(chǎn)生預(yù)定核酸片段的多重寡核巧酸組裝反應(yīng)中,在反應(yīng)中不同寡核 巧酸的合并序列可W在正鏈、負(fù)鏈、兩條鏈或正鏈的部分和負(fù)鏈的部分的結(jié)合上跨越完整 核酸片段的序列。多個不同的寡核巧酸可W對應(yīng)待組裝核酸片段的完整序列提供正鏈序 列、負(fù)鏈序列或正鏈和負(fù)鏈序列的組合。
[0068] 在本發(fā)明的一個方面,核酸片段可W在連接酶介導(dǎo)的組裝反應(yīng)中組裝自多個在一 輪或多輪連接酶介導(dǎo)的連接中合并并且連接的寡核巧酸。基于連接酶的組裝技術(shù)可W設(shè)及 一種或多種合適的連接酶,所述酶能催化臨近3'和5'核酸末端的共價連接(如在互補(bǔ)模板 核酸上退火的核酸的5'憐酸和3'徑基,從而所述3'末端緊鄰5'末端)。因此,如果第一和第 二核酸彼此相鄰地在模板核酸上退火,連接酶可W催化所述第一核酸的5'憐酸和第二核酸 的3'徑基之間的連接反應(yīng)。
[0069] 應(yīng)理解,多重多核巧酸組裝反應(yīng)可在單一體積例如孔中進(jìn)行,或可在局部單獨微 體積中進(jìn)行。在一些實施方式中,所述延伸和/或組裝反應(yīng)在微滴中進(jìn)行(見PCT申請PCT/ US2009/55267和PCT申請PCT/US2010/055298,各通過引用全文納入本文)。
[0070] 文庫構(gòu)建
[0071] 本發(fā)明的一些方面設(shè)及具有粘性末端的偏移雙鏈體(本文中也稱為偏移二聚體) 的設(shè)計和產(chǎn)生,W及該偏移雙鏈體的組裝,W形成變體文庫。圖1A-1B顯示多重偏移雙鏈體 (或二聚體)制備的示例方法。圖1A-1B說明偏移二聚體結(jié)構(gòu)模塊(本文中也稱為具有雙鏈突 出端的寡核巧酸)的多重制備。
[0072] 在一些實施方式中,第一和至少第二組具有雙鏈突出端的核酸W結(jié)構(gòu)模塊的形式 生成,用于非隨機(jī)核酸文庫的組裝。在一些實施方式中,來自該文庫的各核酸通過對具有互 補(bǔ)的突出端(或粘性末端)的核酸進(jìn)行雜交和連接來組裝。
[0073] 根據(jù)本發(fā)明的一些方面,所述方法包括,提供部分雙鏈寡核巧酸的第一群,由此各 第一寡核巧酸包含第一和第二單鏈突出端,和提供部分雙鏈寡核巧酸的第二群,由此各第 二寡核巧酸包含第一單鏈突出端和第二單鏈突出端。在一些實施方式中,第一群中的第一 突出端是相同的,且第一群中的第二突出端是相同的。在一些實施方式中,第一群的寡核巧 酸的相同的第一突出端與第二寡核巧酸群的相同第一突出端互補(bǔ)。根據(jù)本發(fā)明的一些方 面,第一寡核巧酸可W通過第一寡核巧酸的單鏈突出端和第二寡核巧酸的單鏈突出端連接 至第二寡核巧酸,產(chǎn)生第一連接產(chǎn)物。第一連接產(chǎn)物可包含第一寡核巧酸的第一突出端和 第二寡核巧酸的第二突出端。
[0074] 參照圖1A,產(chǎn)生具有交錯突出端的第一組核酸(A)。在一些實施方式中,構(gòu)建寡核 巧酸可W從模板支持物結(jié)合的寡核巧酸擴(kuò)增。例如,寡核巧酸〇\'九、〇\'北、〇\"九、〇\"北可 W從模板寡核巧酸擴(kuò)增,W形成單一第一反應(yīng)體積的多種純端雙鏈寡核巧酸。應(yīng)理解,多種 雙鏈構(gòu)建寡核巧酸可獲自市售來源,或可設(shè)計和/或合成至固體支持物(例如陣列)之上。然 而,應(yīng)理解,可采用其它核酸(例如,單鏈或雙鏈核酸降解產(chǎn)物、限制片段、擴(kuò)增產(chǎn)物、天然產(chǎn) 生的小核酸、其它多核巧酸等)。
[0075] 在一些實施方式中,設(shè)計第一集的純端雙鏈寡核巧酸(例如KAli、KA"孔)的寡核巧 酸,從而各序列從該集的另一序列偏移n個堿基。在一些實施方式中,偏移n可W是2~8個堿 基。例如,該偏移可W是2個堿基、3個堿基、4個堿基、5個堿基、6個堿基、7個堿基、8個堿基或 更多。例如,參照圖1A,設(shè)計寡核巧酸,從而第一集的純端雙鏈寡核巧酸KA'化和KA"孔W及第 二集的純端雙鏈寡核巧酸KA '北和〇〇2具有彼此偏移4個堿基的序列。
[0076] 在一些實施方式中,提供第二集的純端雙鏈寡核巧酸。在一些實施方式中,純端雙 鏈寡核巧酸的第二集的純端雙鏈寡核巧酸可W是純端雙鏈寡核巧酸的第一集的純端雙鏈 寡核巧酸的序列變體。例如,第二集的寡核巧酸可包含突變、取代等。所述突變可W位于預(yù) 定的位點或隨機(jī)位點。在一些實施方式中,第二集的純端雙鏈寡核巧酸包含來自核酸變體 文庫的核酸。在一些實施方式中,核酸變體文庫可從參照基因設(shè)計,并且可包含預(yù)定數(shù)量的 突變(n)。各集中的突變可位于相同或不同位置;和位于任何位置。
[0077] 在一些實施方式中,各集中的純端雙鏈寡核巧酸可經(jīng)歷促進(jìn)變性的條件(例如通 過將溫度升高至高于解鏈溫度),然后允許重新雜交W形成具有突出端的雙鏈寡核巧酸。
[007引參照圖 IA 下部,雙鏈寡核巧酸 KA'3i(SEQ ID N0:1)、KA']2(SEQ ID N0:2)、KA"九 (SEQ ID N0;3)、DTl2(SEQ ID N0;4)可去雜交或變性(例如通過解鏈)并重新雜交W形成 交錯雜交產(chǎn)物。根據(jù)一些實施方式,具有突出端的雙鏈寡核巧酸可具有不同的內(nèi)部雙鏈序 列但相同的單鏈突出端。仍參照圖1A,偏移二聚體產(chǎn)物(例如Al和A2)可具有相同的n個堿基 突出端(例如3'端突出端)但可具有不同內(nèi)部序列。如圖IA中所示,偏移二聚體Al具有序列 (tccgatttacgggt,沈Q ID N0:1),其與偏移二聚體A2(tccgat卻acgggt,沈Q ID N0:2)的不 同之處在于存在't'核巧酸替代'C'核巧酸。參照圖IA,雜交產(chǎn)生產(chǎn)物AUSEQ ID NO: 1,SEQ ID N0:7)和A2(SEQ ID N0:2和SEQ ID N0:8)。雜交反應(yīng)還可產(chǎn)生產(chǎn)物Al*(沈Q ID N0:1, 沈Q ID N0:9)和A2*(沈Q ID N0:2,沈Q ID N0:10)。
[0079] 參照圖1B,具有交錯突出端的第二組核酸(B)可W是按照對于第一組核酸(例如核 酸A)描述的相同方法來生成。在變性和重新雜交后,所述核酸能形成具有單鏈突出端的部 分雙鏈核酸。例如,如圖IB所示,可形成具有3'突出端的核酸Bi(SEQ ID NO: 5,SEQ ID NO: 11)。此外,也可形成具有5'突出端的核酸Bi*(SEQ ID N0:6,SEQ ID N0:12)。
[0080] 圖2A-2B說明采用S個偏移二聚體組裝兩種核酸變體的非限制性示例。根據(jù)一些 實施方式,具有互補(bǔ)的突出端的核酸可雜交W形成無缺口可連接的接合,并且可經(jīng)連接W 形成較長的核酸序列。例如,具有3'突出端的核酸可與具有互補(bǔ)的3'單鏈突出端的核酸雜 交。參照圖2A-2B,變體文庫可通過混合并組裝具有圖1的互補(bǔ)的突出端的核酸來產(chǎn)生。仍參 照圖2A-2B,具有與變體Al和A2互補(bǔ)的突出端的偏移二聚體Bl可在單一反應(yīng)體積中連接至變 體八1(圖24)和42(圖28),^形成變體文庫產(chǎn)物4181(569 10顯:13,569 10^):14)和八281 (沈Q ID NO: 15,沈Q ID NO: 16)。
[0081] 本發(fā)明的方面設(shè)及復(fù)雜變體文庫的合成。圖3A-3C和圖4A-4B說明通過多重多核巧 酸組裝產(chǎn)生更復(fù)雜的變體文庫的實施方式。參照圖3A,雙鏈文庫核酸或片段化A'm、KA' ?、KA'?…KA'?}可在第一單一反應(yīng)體積中制備。例如,雙鏈核酸可通過陣列上結(jié)合支持物 的寡核巧酸的擴(kuò)增來合成。雙鏈文庫片段化B'化、防'龍、防'北…防'恥}可在第二單一反應(yīng) 體積中制備,并且雙鏈文庫片段化C'孔、防'北、防13…防'M可在第S反應(yīng)體積中制備等。
[0082] 參照圖3B,雙鏈文庫片段化A"九、〇\"龍、〇\"恥''〇\"恥}可在第一單一反應(yīng)體積中 制備。在一個示例性實施方式中,雙鏈寡核巧酸可采用陣列上模板結(jié)合支持物的寡核巧酸 來擴(kuò)增。雙鏈文庫片段化B"化、防"龍,…防"恥}可在第二單一反應(yīng)體積中制備,化(Tli、防" 北、防"孔…防"亦何在第S反應(yīng)體積中制備等。
[0083] 參照圖3C,雙鏈文庫片段化4'九、〇\'龍,〇\'北。'〇\'恥}與雙鏈文庫片段{:〇\"九、^ A"恥、KA"]3…KA"3n}在單一體積中合并。雙鏈核酸可經(jīng)歷一定條件W去雜交(例如通過解 鏈),然后經(jīng)歷促進(jìn)重新雜交的條件W形成交錯雜交產(chǎn)物{Al、A2、A3…AN},如上所述。類似 地,雙鏈文庫片段化B'孔、防'恥,陽'北…防'恥}可W與雙鏈文庫片段化B"孔、陽"恥,防" 孔…防"亦}在單一體積中合并,然后去雜交(例如通過解鏈)并重新雜交,W形成交錯雜交產(chǎn) 物{Bi,化,B3...Bn}等。
[0084] 圖4A顯示特定示例,其中兩個片段A交錯雜交產(chǎn)物{Ai,A2},四個片段B交錯雜交產(chǎn) 物{Bi,化,B3,B4},和兩個片段C交錯雜交產(chǎn)物ICi,C2}合并,W形成非隨機(jī)核酸文庫。
[0085] 交錯雜交產(chǎn)物A的上游單鏈突出端序列(全部右端的序列)經(jīng)設(shè)計W彼此相同,并 且與交錯雜交產(chǎn)物B的下游單鏈突出端序列(全部左端的序列)(其進(jìn)而全部設(shè)計為相同)互 補(bǔ)(且能夠雜交)。類似地,交錯雜交產(chǎn)物B的上游單鏈突出端序列(全部右端的序列)經(jīng)設(shè)計 W彼此相同,并且與交錯雜交產(chǎn)物C的下游單鏈突出端序列(全部左端的序列)(其均設(shè)計為 相同)互補(bǔ)并雜交。
[0086] 參照圖4B,然后,運些集的交錯雜交產(chǎn)物A、B、C可在單一反應(yīng)體積中連接,W形成 16 ( = 2*4*2)個變體{A巧iCi,AiBiC2,A巧iC3.... A2B4C2}。
[0087] 在一些實施方式中,變體文庫的成員總數(shù)與各片段A,B,C等的變體數(shù)量的產(chǎn)物相 等。實踐中,連接反應(yīng)可對連接的2~10個片段而言高效。在示例性的實施方式中,10個片段 (八,8,〇,^),各自有4個變體,將產(chǎn)生410~1百萬個成員的變體文庫。
[0088] 一些實施方式中,所述片段的尺寸可W是約20bp、約30bp、約40bp、約50bp、約 6化P、約70bp、約SObp、約90bp、約10化P或更大。而在一些實施方式中,所述片段的尺寸可W 是約 200bp、約 300bp、約 400bp、約 400bp、約 500bp、約 600bp、約 700bp、約 800bp、約 900bp、約 1000 bp、約 2000bp、約 3000bp 或更大。
[0089] 應(yīng)理解,如果片段A、B、C等是寡核巧酸(約20bp~2(K)bp)的尺寸,那么10個片段的 組裝產(chǎn)生的文庫產(chǎn)物可在個體基因(約200bp~2肺P)的尺寸范圍內(nèi)。其中各成員可W是基 因變體的所述變體文庫可能高度有利于感興趣的蛋白質(zhì)的最優(yōu)化。例如,該變體文庫可有 利于抗體(例如具有特定或改善的結(jié)合性質(zhì)的抗體)的最優(yōu)化。在一些實施方式中,篩選可 W通過采用隧菌體或酵母展示或本領(lǐng)域已知的任何合適的方法來高效地完成。感興趣的產(chǎn) 物可經(jīng)反向測序W尋求對具有所需性質(zhì)(例如結(jié)合性質(zhì))的文庫成員的鑒定。
[0090] 還應(yīng)理解,如果片段A、B、C等是基因尺寸(例如5(K)bp~2.5Kbp,包括啟動子和核糖 體結(jié)合位點(RBS)),那么該文庫產(chǎn)物可導(dǎo)致代謝通路。由此,所述變體文庫可導(dǎo)致代謝通路 變體文庫。在一些實施方式中,對于具有包含啟動子或核糖體結(jié)合位點的M個核酸和編碼蛋 白質(zhì)的基因的代謝通路,可優(yōu)化M個酶,從而來自各酶反應(yīng)的催化輸出產(chǎn)物與下一酶的輸入 匹配,并且最優(yōu)化代謝物的整體輸出流。假設(shè)啟動子保持恒定并且2個RBS水平足W用于產(chǎn) 生足夠的變體W調(diào)節(jié)代謝通路,運代表2*2M個通路。如果M=IO,那么所需通路的數(shù)量是巧 2iD = 2,048個通路。如果各由平均長度為約10肺P的序列編碼,則通路的總數(shù)可由約20Mbp的 DNA合成(其代表數(shù)百萬美元)來表示。通過采用本文所述的方法,變體文庫(例如通過多重 通路合成法(化-MPS)的變體文庫)有可能在單一反應(yīng)中構(gòu)建,其中各片段(A、B、C等)可代表 啟動子+RBS+酶編碼基因,并且其中各片段集合(A、B、C等)具有針對啟動子或RBS的強(qiáng)度的 若干(例如2-4)個變異??赏ㄟ^通路變體文庫的鳥槍(shotgun)轉(zhuǎn)化進(jìn)入表達(dá)宿主細(xì)胞來篩 選所述文庫。質(zhì)譜可用于所需代謝物生成的讀出?;蛘?,基于細(xì)胞的傳感器(例如基于轉(zhuǎn)錄 因子的那些)可用于檢測所需代謝物生成(參考文獻(xiàn):化OU,化ward H.和化y D.Keasling." 改進(jìn)增加的代謝物產(chǎn)生的編程適應(yīng)性控制(Programming adaptive conhol to evolve increased metabolite production)."化 1:ure Communications 4(2013))。例如,可產(chǎn)生 允許細(xì)胞通過流式細(xì)胞術(shù)分選的視覺信號(例如通過啟動綠色巧光蛋白)。在一些實施方式 中,可產(chǎn)生允許所述代謝物生產(chǎn)型細(xì)胞在藥物標(biāo)志物或缺陷型培養(yǎng)基下存活的因子,因此 選擇最佳代謝生產(chǎn)通路。
[0091 ]插入和/或缺失變體文庫
[0092]插入和/或缺失可W是生成可具有所需性質(zhì)的獨特序列的變體文庫的有力工具。 然而,本領(lǐng)域技術(shù)人員應(yīng)理解,易錯聚合酶鏈?zhǔn)椒磻?yīng)(PCR),或采用簡并堿基的核酸合成,可 能不足W產(chǎn)生預(yù)定序列(本文中也稱為離散特定序列)的插入或缺失。同樣地,取代可W是 產(chǎn)生獨特序列的變體文庫的有力工具。根據(jù)本發(fā)明,取代可單獨利用,或與插入和/或缺失 聯(lián)用。在一些實施方式中,取代可通過如下組合來實現(xiàn):在核酸序列的編碼區(qū)的相同位置中 發(fā)生的至少(1)1、2、3或更多個核巧酸的缺失,和(2)相同數(shù)量的核巧酸的插入。在一些實施 方式中,取代可W是3個連續(xù)核巧酸取代的倍數(shù),或可涵蓋任何數(shù)量的核巧酸,包括但不限 于,一個核巧酸,或兩個核巧酸,或多于兩個核巧酸。
[0093] 易錯PCR是用于將變異引入DNA序列的群的成熟方法,其中易錯聚合酶在擴(kuò)增DNA 時產(chǎn)生錯誤。然而,該方法會導(dǎo)致位于隨機(jī)位置上的變體,并且不允許設(shè)計排除不需要的變 體的具體序列。類似地,當(dāng)顯示具體位置上的簡并堿基導(dǎo)致在該位置添加任何可能的核巧 酸來確定變體時,進(jìn)行采用簡并堿基的DNA的合成。在合成過程中,核巧酸可隨機(jī)選自可能 的核巧酸的集合。因為相對于先前隨機(jī)選擇的核巧酸的下一個簡并堿基不受控制,該方法 不允許排除或納入具體的序列段,例如不需要的密碼子或相關(guān)序列的較長片段。由此,運些 方法均不允許預(yù)定位置上具體堿基的插入或缺失。
[0094] 在本發(fā)明的一些方面中,精確預(yù)定序列的核酸合成和組裝可W是獨特適合的,W 產(chǎn)生包含插入和/或缺失的遺傳物質(zhì)文庫。在一些實施方式中,所述方法允許產(chǎn)生幾乎不包 含或不包含具有預(yù)定序列的祀核酸的外源序列變體的文庫。在一些實施方式中,提供合成 在個體堿基水平、密碼子水平或較長核巧酸序列水平具有核酸序列插入和/或核酸序列缺 失的核酸的方法。在一些實施方式中,所述方法可采用核酸合成法,例如DNA合成法,W允許 在個體堿基、密碼子水平或W較大核酸序列部分包括DNA區(qū)段插入和/或缺失的用戶定制序 列。參照圖5,合成在密碼子水平(例如56〇10顯:17,569 10^:18,56〇10^:19),核巧 酸水平(例如沈Q ID N0:20,沈Q ID N0:21,沈Q ID N0:22)和多重核巧酸水平(例如沈Q ID NO:23,SEQ ID NO:24,SEQ ID NO:25)具有缺失和/或插入的離散序列。解析各特定序列,從 而寡核巧酸可被分開合成并組裝成具有由用戶定制的精確序列的完整變體構(gòu)建體(參見圖 5,SEQ ID N0:26和SEQ ID N0:27)。仍參照圖5,合成并組裝在密碼子、核巧酸和多重核巧酸 水平具有缺失和/或插入的離散序列。合成在密碼子水平具有缺失和/或插入的離散序列: 寡聚物1,具有核巧酸CTG的缺失和3核巧酸CCG的插入(下劃線標(biāo)示)的寡聚物la,具有CTG、 CCG(下劃線標(biāo)示)和CCG(下劃線標(biāo)示)的插入的寡聚物化。合成在核巧酸水平具有缺失和/ 或插入的離散序列:寡聚物2,具有單一核巧酸缺失的寡聚物2a,具有單一核巧酸A插入(下 劃線標(biāo)示)的寡聚物化。合成在多重核巧酸水平具有缺失和/或插入的離散序列:寡聚物3, 具有12個核巧酸缺失(下劃線標(biāo)示)的寡聚物3a,具有12個核巧酸插入(下劃線標(biāo)示)的寡聚 物3b??蓪⒐押饲伤峤M裝成具有由用戶指定的精確序列的完全變體構(gòu)建體:變體1:寡聚物1 +寡聚物2+具有12個核巧酸缺失的寡聚物3a,和變體2:具有3核巧酸缺失和3核巧酸插入的 寡聚物Ia+具有單一核巧酸缺失的寡聚物2a+具有12個核巧酸缺失的寡聚物3曰。在一些其它 實施方式中,在多重核巧酸水平具有缺失和/或插入的離散序列可包含不是3核巧酸的倍數(shù) 的缺失和/或插入,例如,13個核巧酸缺失和/或插入。
[0095] 核酸合成(例如脫氧多核巧酸合成)化學(xué)是成熟方法。近期,可被合成的序列的長 度已經(jīng)變長,而合成的成本已下降。此外,新組裝方法允許多重連續(xù)的合成產(chǎn)物的構(gòu)建形成 用于合成生物學(xué)的相關(guān)模塊,例如基因、小遺傳網(wǎng)絡(luò)、甚至基因組。在已經(jīng)擁有了產(chǎn)生該遺 傳物質(zhì)的能力的情況下,在一些實施方式中,核酸合成能夠杠桿式地產(chǎn)生許多個體序列的 獨特變體。所述序列可用于產(chǎn)生,例如,藥物和化學(xué)生產(chǎn)者或可用于學(xué)術(shù)研究。
[0096] 核酸(例如DNA)個體序列的高度多樣化的文庫可通過相關(guān)篩選和/或選擇來發(fā)掘, W尋找具有用于所需應(yīng)用的希望的性質(zhì)的文庫個體成員。因此,可采用相對較小的文庫來 篩選或選擇感興趣的功能或結(jié)構(gòu)。在一些實施方式中,變體文庫在預(yù)定數(shù)量的位置具有大 量的可能有用的氨基酸取代,或在更多位置具有可能有用的氨基酸取代,或其組合。
[0097] 在一些實施方式中,為了產(chǎn)生包含插入和/或缺失的不同但可控的序列含量,各離 散、獨特的序列可分開合成并組裝。在一些實施方式中,可采用特別設(shè)計的構(gòu)建寡核巧酸的 各種組合。本文所用的術(shù)語"構(gòu)建寡核巧酸"指的是可用于組裝比構(gòu)建寡核巧酸本身要長的 核酸分子的單鏈或雙鏈寡核巧酸。構(gòu)建寡核巧酸可用于通過本文所述的方法組裝核酸分 子。術(shù)語"多核巧酸構(gòu)建體"指的是具有比構(gòu)建寡核巧酸長的預(yù)定序列的核酸分子。多核巧 酸構(gòu)建體可從構(gòu)建寡核巧酸的集和/或亞組裝物的集組裝。
[0098] 在一些實施方式中,具有指示變體的參照序列可首先被斷裂或解析成處于可被合 成的長度范圍內(nèi)的較小的寡核巧酸。一些寡核巧酸可W是當(dāng)與原先的"野生型"序列相比包 括插入或缺失的堿基的變體寡核巧酸。具有缺失、插入、變異、其組合或無變化的全部可能 的寡核巧酸可被合成,組成整體所需序列的部分。在一些實施方式中,待組裝的變體寡核巧 酸的納入需要W運樣的方式解析運些序列:避免寡核巧酸待組裝的接合處附近的變異。然 后可合成組成整體較大序列的所有部分的個體寡核巧酸。運些變體序列可W組合地組裝, 產(chǎn)生包含插入和/或缺失的構(gòu)建體序列的所有可能的變體。
[0099] 根據(jù)一些實施方式,所述方法可允許采用單獨合成的寡核巧酸中的各指定變體從 寡核巧酸區(qū)段構(gòu)建每個特定序列。組裝后,各核酸序列(例如完整構(gòu)建體或亞組裝構(gòu)建體) 可僅包含明確指示的變體,由此,通過組合將會產(chǎn)生較少的外來的構(gòu)建體變體至不產(chǎn)生外 來的構(gòu)建體變體。
[0100] 因此,本發(fā)明的方面特別有用于產(chǎn)生包含大量指定序列變體的文庫。本發(fā)明的一 些方面設(shè)及具有包含大量的指定序列變體和較少或沒有指定序列的外來變體的文庫。本發(fā) 明的文庫可用于選擇性地篩選或分析大量的不同預(yù)定核酸和/或由所述核酸編碼的不同的 膚。
[0101] 在一些實施方式中,本發(fā)明的方法允許核酸文庫,例如DNA文庫,編碼具有缺失和/ 或插入的變體序列。在一些實施方式中,插入可W是3核巧酸的倍數(shù)。在一些實施方式中,缺 失可W是3核巧酸的倍數(shù)。在一些實施方式中,插入可包含5組或更少組3核巧酸。在一些實 施方式中,插入可包含6或更少、7或更少、8或更少、9或更少、10或更少、11或更少、12或更 少,或更多組3核巧酸。在一些實施方式中,缺失可包含5組或更少組3核巧酸。在一些實施方 式中,缺失可包含6或更少、7或更少、8或更少、9或更少、10或更少、11或更少、12或更少,或 更多組3核巧酸。而在一些實施方式中,插入或缺失不是3核巧酸的倍數(shù)。所述文庫可允許新 蛋白質(zhì)修飾。在一些實施方式中,本發(fā)明的方法允許核酸文庫編碼具有較大缺失和/或較大 插入的變體序列。所述文庫可允許,例如,編碼一種或多種蛋白質(zhì)結(jié)構(gòu)域或蛋白質(zhì)結(jié)構(gòu)域的 部分的核酸序列的入環(huán)(loop-in)或出環(huán)(loop-out)。
[0102] 本發(fā)明的方面設(shè)及合并和組裝構(gòu)建寡核巧酸變體的一個或多個(例如,1、2、3、4、 5、6、7、8、9、10或更多)集合和構(gòu)建寡核巧酸變體或非變體序列的一個或多個集合,各集合 對應(yīng)于祀文庫的不同區(qū)域。各集合包含針對祀核酸區(qū)域選擇的核酸序列。因此,本發(fā)明的方 面特別有用于產(chǎn)生包含大量的預(yù)定序列變體的文庫。
[0103] 根據(jù)本發(fā)明的一些方面,生成核酸文庫的方法包括如下步驟:鑒定祀核酸、在祀核 酸中鑒定第一區(qū)域,其中第一區(qū)域包含變體核酸序列;和在祀核酸中鑒定第二區(qū)域,其中第 二區(qū)域包含非變體序列。在一些實施方式中,祀核酸可包含一個或多個恒定區(qū)、一個或多個 可變區(qū)及其組合。本文中所用的術(shù)語"恒定"、"非變體"和"不可變"序列可互換使用。
[0104] 然后,可在包含變體核酸序列的至少第一組寡核巧酸和包含非變體核酸序列的至 少第二組寡核巧酸中解析祀核酸??商峁?,例如,合成并組裝至少第一和第二組寡核巧酸。 在一些實施方式中,該文庫可W采用基于聚合酶的組裝反應(yīng)、基于連接酶的組裝反應(yīng),或其 組合來組裝。
[0105] 在一些實施方式中,祀核酸可編碼具有一個或多個結(jié)構(gòu)域的多膚。在一些實施方 式中,變體核酸序列可包含編碼一個或多個結(jié)構(gòu)域的至少部分的核酸序列的缺失、編碼一 個或多個結(jié)構(gòu)域的至少部分的核酸序列的插入,或其組合。在一些實施方式中,所述缺失 和/或插入可W是3核巧酸的倍數(shù)。在一些實施方式中,所述缺失和/或插入可包含五組或更 少組3核巧酸。在一些實施方式中,所述缺失和/或插入可包含6或更少、7或更少、8或更少、 10或更少、11或更少、11或更少、12或更少,或更多組3核巧酸。
[0106] 在一些實施方式中,所述插入和/或缺失可在核酸的非編碼區(qū)中,例如在基因的非 編碼調(diào)控元件中。例如,所述插入和/或缺失可W是非編碼序列。在一些實施方式中,所述缺 失和 / 或插入可 W是單一核巧酸,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20 或更多核巧酸。在一些實施方式中,所述缺失和/或插入可W是多于20、多于25、多于30、多 于35、多于40、多于45、多于50、多于55、多于60個核巧酸。
[0107] 在一些實施方式中,用于生成核酸文庫的方法包括:選擇祀核酸序列,選擇待在一 個或多個選定位置缺失或插入的至少一個核酸序列,設(shè)計在該選定位置具有變體序列的第 一集的寡核巧酸和具有非變體序列的至少第二集的寡核巧酸,和組裝第一和至少第二集的 寡核巧酸。在一些實施方式中,在選擇步驟中,待缺失或插入的核酸序列可W是3核巧酸的 倍數(shù)。在一些實施方式中,在選擇步驟中,待缺失或插入的核酸序列可包含五組或更少組3 核巧酸。在一些實施方式中,在選擇步驟中,待缺失或插入的核酸序列可包含6或更少、7或 更少、8或更少、9或更少、10或更少、11或更少、12或更少,或更多組3核巧酸。在一些實施方 式中,第一和第二集一起可包含所述祀核酸序列。在一些實施方式中,第一和第二集一起可 包含祀核酸序列的片段。在一些實施方式中,所述選定位置可包含核巧酸、密碼子、核巧酸 序列或其組合。
[0…引單鏈突出端
[0109] 在某些實施方式中,相鄰核酸片段之間的重疊互補(bǔ)區(qū)域設(shè)計(或選擇)成有足夠的 差異來促進(jìn)(例如,熱力學(xué)上有利)核酸片段的唯一排列(例如,選定或設(shè)計的片段排列)。例 如,可設(shè)計或選擇相鄰核酸片段之間的重疊互補(bǔ)區(qū)域W實現(xiàn)核酸片段的獨特比對(例如,選 定或設(shè)計的片段比對)的足夠熱動力有利的組裝。驚人地,在合適的連接條件下,少至一個 核巧酸的差異在完美匹配(100%互補(bǔ)粘性末端)和錯配(低于100%的互補(bǔ)粘性末端)之間 產(chǎn)生足夠的區(qū)分力。如此,4-堿基突出端能允許高至(4~4+1) = 257個不同片段的高特異性 和高保真連接。
[0110] 應(yīng)理解,可W使用不同長度的重疊區(qū)域。在一些實施方式中,當(dāng)組裝較大數(shù)量的核 酸片段時,可W使用較長的粘性末端。較長的粘性末端可W提供更多的靈活性來設(shè)計或選 擇充分區(qū)別的序列來區(qū)分正確粘性末端退火(例如,設(shè)及設(shè)計互相退火結(jié)合的粘性末端)和 錯誤粘性末端退火(例如,在非互補(bǔ)粘性末端之間)。
[0111] 為了實現(xiàn)運樣的高保真組裝,可W使用一種或多種合適的連接酶。連接酶可W獲 自重組或天然來源。在一些實施方式中,可W使用T3DNA連接酶、T4DNA連接酶、T7DNA連接酶 和/或大腸桿菌DNA連接酶。運些連接酶可W在相對低的溫度下(例如,室溫)使用并且特別 用于相對短的突出端(例如,約3、約4、約5或約6個堿基的突出端)。在某些連接反應(yīng)(例如, 室溫下30分鐘的解育)中,對于多重方式的連接,T7DNA連接酶可W比其它連接酶更高效。也 可W使用熱穩(wěn)定的連接酶,如Tth DNA連接酶、P化DNA連接酶、Taq連接酶、任意其它合適的 熱穩(wěn)定的連接酶或其任意組合中的一種或多種。
[0112] 在一些實施方式中,可W在不同核酸片段間設(shè)計或選擇兩對或更多對互補(bǔ)粘性末 端使其具有相同或相似的序列來促進(jìn)含有相對隨機(jī)排列(和/或數(shù)量)的具有相似或相同粘 性末端的片段的產(chǎn)物的組裝。運可W用于產(chǎn)生具有某些內(nèi)部序列區(qū)域的不同序列排列和/ 或不同拷貝數(shù)量的核酸產(chǎn)物的庫。
[0113] 應(yīng)注意為了確保連接特異性,突出端可W被選擇或設(shè)計為對每個連接位點唯一, 即被設(shè)計為在組裝產(chǎn)物中相鄰的兩個片段的每對互補(bǔ)突出端應(yīng)該是唯一的并且與任何其 它對互補(bǔ)突出端的差異至少1個核巧酸。
[0114] 也可W使用其它用于產(chǎn)生粘性末端的方法。例如,可W使用基于聚合酶的方法(例 如,T4DNA聚合酶)來合成需要的粘性末端。無論用何種方法產(chǎn)生特異性突出端(例如,用于 設(shè)計在組裝核酸產(chǎn)物中相鄰的核酸的互補(bǔ)突出端),可W設(shè)計和/或產(chǎn)生不同長度的突出 端。在一些實施方式中,可W使用長單鏈突出端(3'或5')來促進(jìn)特異性和/或高效組裝。例 如,3'或5'單鏈突出端可W長于8個堿基長,例如長S-HaA-SOJO-SSJS-SCKSO-lOOaOO- SOO 個或更多堿基。
[0115] 在一些實施方式中,突出端的長度可W是1~4個堿基、5-12個堿基、1-12個堿基、 5-13個堿基、6-12個堿基。在一些實施方式中,突出端的長度可W是至多12、至多13、至多 14、至多15、至多16、至多17、至多18、至多19、至多20個堿基。
[0116] 在一些實施方式中,突出端可W由IIS型限制酶產(chǎn)生。例如,突出端長度可W是1~ 4個堿基,或更長。有特異性結(jié)合和/或切割位點的多種限制性內(nèi)切核酸酶市售可得,例如來 自肥B公司巧薩諸塞州貝弗利)。在各種實施方式中,可采用產(chǎn)生3'突出端、5'突出端的限 制性核酸內(nèi)切酶。在一些實施方式中,特異性限制性內(nèi)切核酸酶形成的粘性末端可W用于 促進(jìn)W所需排列組裝子組件。所述術(shù)語"IIs型限制性內(nèi)切核酸酶"指有非回文識別序列和 在所述識別位點外(如識別位點遠(yuǎn)端0-約20核巧酸)出現(xiàn)的剪切位點的限制性內(nèi)切核酸酶。 IIs型限制性內(nèi)切核酸酶可W在雙鏈核酸分子上生成切口,或者生成產(chǎn)生純末端或粘性末 端的雙鏈斷裂(如5'或3 '突出端)。IIS型限制性內(nèi)切核酸酶的示例包括例如生成3 '突出端 的酶,例如但不限于Bsr I、Bsm I、BstF5I、BsrD I、Bts I、Mnl I、BciV I、H地 I、Mbo II、 Eci I、Acu I、Bpm I、Mme KBsaX I、Bc邑 I、Bae I、Bfi KTspDT KTspGW I、Taq II、 Eco57I、Eco57M I、Gsu I、Ppi I、和Psr I;生成5'突出端的酶,如BsmA I、Ple I、Fau I、Sap I、BspM I、SfaN I、Hga I、Bvb I、Fok I、BceA I、BsmF I、Ksp632I、Eco31I、Esp3I、Aar I;和 生成純末端的酶,如Mly I和化r KIIs型限制性內(nèi)切核酸酶市售可得并且為本領(lǐng)域所熟知 (馬薩諸塞州貝弗利的肥B公司)。
[0117]在一些實施方式中,可設(shè)計突出端,從而它們具有最小的自互補(bǔ)。例如,可將突出 端設(shè)計成5~12個堿基長,并且具有最小的形成發(fā)卡的趨勢。而在其它實施方式中,突出端 可經(jīng)設(shè)計W具有自互補(bǔ)。例如,突出端可經(jīng)設(shè)計W具有3~12個堿基的長度,具有形成發(fā)夾 的趨勢。
[011引高保真組裝
[0119] 按照本發(fā)明的方面,可W在單個過程中組裝多個核酸片段,其中在促進(jìn)片段的共 價組裝的條件下將多個片段混合在一起來產(chǎn)生特異性的較長核酸。按照本發(fā)明的方面,可 W使用連接酶在體外共價組裝多個核酸片段。在一些實施方式中,可W組裝5個或更多(例 如,10 個或更多、15 個或更多、15-20、20-25、25-30、30-35、35-40、40-45、45-50、50個或更多 等)不同的核酸片段。然而,應(yīng)理解,可W使用合適的組裝技術(shù)組裝任意數(shù)量的核酸(例如, 2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20個等)。組裝的每個核酸片段可^ 是約100個核巧酸-約1000個核巧酸長(例如,約200、約300、約400、約500、約600、約700、約 800、約900)。然而,可W使用組裝技術(shù)(例如,鳥槍組裝進(jìn)入質(zhì)粒載體)組裝更長(例如,約 2500個或更多核巧酸長、約5000個或更多核巧酸長、約7500個或更多核巧酸長、約10000個 或更多核巧酸長等)或更短的核酸片段。應(yīng)理解,每個核酸片段的大小獨立于加入組裝的其 它核酸片段的大小。然而,在一些實施方式中,每個核酸片段可W是大約相同的大小或長度 (例如,約100個核巧酸長-約400個核巧酸長)。例如,寡核巧酸的長度可W是中值長度在約 100個核巧酸長和約400個核巧酸長之間,并且變化范圍為約+/-1個核巧酸、+/-4個核巧酸、 +/-10個核巧酸。應(yīng)理解,雙鏈核酸片段的長度可W由堿基對的數(shù)量來表示。如本文所用,當(dāng) 稱為V'個核巧酸長的核酸片段用于雙鏈核酸片段的內(nèi)容中時對應(yīng)于V'個堿基對的長度。 在一些實施方式中,在一個反應(yīng)中組裝的一個或多個核酸(例如,1-5、5-10、10-15、15-20個 等)可W是密碼子優(yōu)化的和/或非天然存在的。在一些實施方式中,在一個反應(yīng)中組裝的所 有核酸都是密碼子優(yōu)化的和/或非天然存在的。
[0120] 在本發(fā)明的一些方面中,組裝的核酸片段被設(shè)計為具有重疊互補(bǔ)序列。在一些實 施方式中,核酸片段是具有3'和/或5'單鏈突出端的雙鏈核酸片段。運些突出端可W是能與 不同核酸片段上的互補(bǔ)粘性末端退火結(jié)合的粘性末端。按照本發(fā)明的方面,在兩個核酸片 段上的互補(bǔ)序列(和特定互補(bǔ)粘性末端)的存在促進(jìn)了它們的共價組裝。在一些實施方式 中,組裝了具有不同重疊互補(bǔ)單鏈粘性末端的多個核酸片段并且通過在每個片段上的粘性 末端的特性確定它們在組裝的核酸產(chǎn)物中的順序。例如,可W設(shè)計核酸片段使得第一核酸 具有與第二核酸的第一個粘性末端互補(bǔ)的第一粘性末端W及與第=核酸的第一個粘性末 端互補(bǔ)的第二粘性末端。第二核酸的第二個粘性末端可W與第四核酸的第一個粘性末端互 補(bǔ)。第=核酸的第二個粘性末端可W與第五核酸的第一個粘性末端互補(bǔ)。W此類推至最后 的核酸。按照本發(fā)明的一些方面,可W使用該技術(shù)來產(chǎn)生含有W預(yù)定線性順序(例如,第一、 第二、第=、第四……最后)組裝的核酸片段的線性排列。
[0121] 在某些實施方式中,相鄰核酸片段之間的重疊互補(bǔ)區(qū)域設(shè)計(或選擇)成有足夠的 差異來促進(jìn)(例如,熱力學(xué)上有利)核酸片段的唯一排列(例如,選定或設(shè)計的片段排列)的 組裝。驚人地,在合適的連接條件下,少至一個核巧酸的差異在完美匹配(100%互補(bǔ)粘性末 端)和錯配(低于100%的互補(bǔ)粘性末端)之間產(chǎn)生足夠的區(qū)分力。如此,4-堿基突出端理論 上能允許高至(4~4+1)=257個不同片段的高特異性和高保真連接。
[0122] 應(yīng)理解,可W使用不同長度的重疊區(qū)域。在一些實施方式中,當(dāng)組裝較大數(shù)量的核 酸片段時,可W使用較長的粘性末端。較長的粘性末端可W提供更多的靈活性來設(shè)計或選 擇充分區(qū)別的序列來區(qū)分正確粘性末端退火(例如,設(shè)及設(shè)計互相退火結(jié)合的粘性末端)和 錯誤粘性末端退火(例如,在非互補(bǔ)粘性末端之間)。
[0123] 為了實現(xiàn)運樣的高保真組裝,可W使用一種或多種合適的連接酶。連接酶可W獲 自重組或天然來源。在一些實施方式中,可W使用T3DNA連接酶、T4DNA連接酶、T7DNA連接酶 和/或大腸桿菌DNA連接酶。運些連接酶可W在相對低的溫度下(例如,室溫)使用并且特別 用于相對短的突出端(例如,約3、約4、約5或約6個堿基的突出端)。在某些連接反應(yīng)(例如, 室溫下30分鐘的解育)中,對于多重方式的連接,T7DNA連接酶可W比其它連接酶更高效。也 可W使用熱穩(wěn)定的連接酶,如Tth DNA連接酶、P化DNA連接酶、Taq連接酶、任意其它合適的 熱穩(wěn)定的連接酶或其任意組合中的一種或多種。
[0124] 在一些實施方式中,可W在不同核酸片段間設(shè)計或選擇兩對或更多對互補(bǔ)粘性末 端使其具有相同或相似的序列來促進(jìn)含有相對隨機(jī)排列(和/或數(shù)量)的具有相似或相同粘 性末端的片段的產(chǎn)物的組裝。運可W用于產(chǎn)生具有某些內(nèi)部序列區(qū)域的不同序列排列和/ 或不同拷貝數(shù)量的核酸產(chǎn)物的庫。
[0125] 在一些實施方式中,混合核酸片段并且用連接酶解育。應(yīng)理解,在促進(jìn)粘性末端的 特異性退火的條件下的解育可W增加組裝(例如,正確組裝)頻率。在一些實施方式中,設(shè)計 具有相似解鏈溫度(例如,互相差5°C W內(nèi))的不同粘性末端,使得在相同的條件下促進(jìn)所有 片段的正確退火。不同溫度可W促進(jìn)正確退火,所述溫度取決于所用粘性末端長度。在一些 實施方式中,可W使用約4-約30個核巧酸長度的粘性末端(例如,約5、約10、約15、約20、約 25或約30個核巧酸長度)。解育溫度可W為約20°C-約50°C (包含,例如室溫)。然而,可W使 用更高或更低的溫度。解育的長度可W基于混合在一起的不同核酸的數(shù)量(和因此不同突 出端的數(shù)量)、突出端的長度、突出端的復(fù)雜度來優(yōu)化。解育時間也可W取決于退火溫度和 混合物中是否存在其它試劑。例如,可W加入核酸結(jié)合蛋白和/或重組酶(例如,RecA,例如 熱穩(wěn)定的RecA蛋白)。
[0126] 所得的核酸復(fù)合物可W在一對祀序列特異性引物的存在下經(jīng)過聚合酶鏈反應(yīng),來 擴(kuò)增并且選擇正確的連接產(chǎn)物(例如,祀核酸)?;蛘?,所得的核酸復(fù)合物可W被連接入合適 的載體中并轉(zhuǎn)化到宿主細(xì)胞中用于進(jìn)一步菌落篩選。
[0127] 支持物
[0128] 本文使用的術(shù)語"支持物"和"基底"可互換使用,并且是指多孔或非孔的溶劑不溶 性材料,在其上合成或固定聚合物例如核酸。本文使用的"多孔"是指所述材料包含有基本 一致直徑(例如納米范圍內(nèi))的孔。多孔材料可W包含但不限于,紙張、合成過濾器等。在運 種多孔材料中,所述反應(yīng)可W在孔中進(jìn)行。所述支持物能有很多形狀中的任意一種,例如 銷、條、板、盤、桿、彎曲、圓柱形結(jié)構(gòu)、顆粒(包含珠、納米顆粒)等。所述支持物可有可變寬 度。
[0129] 支持物可W是親水性的或能夠呈現(xiàn)出親水性的。所述支持物可W包含無機(jī)粉末如 二氧化娃、硫酸儀、和氧化侶;天然聚合材料,特別是纖維素材料和纖維素衍生材料,例如包 含纖維的紙,如濾紙、色譜紙等;合成或改性天然產(chǎn)生的聚合物,如硝酸纖維素、乙酸纖維 素、聚(氯乙締)、聚丙締酷胺、交聯(lián)葡聚糖、瓊脂糖、聚丙締酸醋、聚乙締、聚丙締、聚(4-甲基 下締)、聚苯乙締、聚甲基丙締酸醋、聚(對苯二甲酸乙二醋)、尼龍、聚(下酸乙締醋)、聚偏二 氣乙締(PVDF)膜、玻璃、可控孔度玻璃、磁性可控孔度玻璃、陶瓷、金屬等;運些材料或單獨 使用或與其它材料聯(lián)用。
[0130]在一些實施方式中,在陣列形式上合成寡核巧酸。例如,在常見支持物上原位合成 單鏈寡核巧酸,其中在基底上的單獨或離散的特征(或點)上合成各寡核巧酸。在優(yōu)選實施 方式中,單鏈寡核巧酸結(jié)合到所述支持物或特征的表面上。本文所用的術(shù)語"陣列"是指為 進(jìn)一步反應(yīng)存儲、定向(routing)、擴(kuò)增和釋放寡核巧酸或互補(bǔ)寡核巧酸的離散特征的排 列。在優(yōu)選實施方式中,所述支持物或陣列是可尋址的:所述支持物包含在所述支持物上特 定預(yù)定位置(即"地址")上的兩個或更多離散的可尋址特征。因此,陣列上的各寡核巧酸分 子位于所述支持物上已知和確定的位置。各寡核巧酸序列能從其在所述支持物上的位置來 確定。另外,可尋址的支持物或陣列能夠直接控制單獨分離的體積如液滴??蒞選擇限定特 征的大小來使得在所述特征上形成微體積的液滴,每個液滴保持互相分離。如本文所述,多 個特征通常(但不必需)由特征間的間隔分離從而確保兩個相鄰部位之間的液滴不會融合。 特征間通常在其表面上不攜帶任何寡核巧酸,并且對應(yīng)惰性空間。在一些實施方式中,特征 間和特征通常在其親水性或疏水性性質(zhì)上不同。在一些實施方式中,特征間和特征可W包 含本文所述的改性劑。
[0131]陣列可W被構(gòu)建、定制或購自供應(yīng)商(例如,CombiMatrix、Agilent (安捷倫)、 Affymetrix(艾菲美特)、Nimblegen)。寡核巧酸被連接、點樣、固定、表面結(jié)合、支持或合成 在表面或陣列的離散特征上。寡核巧酸可W共價連接到表面或在表面上沉積。各種構(gòu)建方 法為本領(lǐng)域熟知,如無掩膜陣列合成器、利用掩膜的光導(dǎo)向法、流動通道方法、點樣法等。
[0132] 在另一個實施方式中,多個寡核巧酸可W合成或固定(連接)在多個支持物,如珠 上。一個示例是描述于例如美國專利號5,770,358、5,639,603和5,541,061的基于珠的合成 方法。為了在珠上合成分子例如寡核巧酸,大量的珠懸浮于容器中的合適運載體(如水)中。 所述珠具有任選的間隔子分子,所述分子有供復(fù)合的活性位點,任選地是保護(hù)基團(tuán)。在合成 的各步驟中,所述珠分到多個容器中來偶聯(lián)。新生寡核巧酸鏈脫保護(hù)后,不同單體溶液加入 到各容器中,從而在給定容器內(nèi)的所有珠上,發(fā)生相同的核巧酸加成反應(yīng)。然后,所述珠用 過量試劑洗涂,并入單個容器中,混合并重新分到另一組多個容器W準(zhǔn)備下一輪合成。應(yīng)注 意到由于在開始利用了大量珠,相似地在容器內(nèi)隨機(jī)分布了大量珠,在多輪隨機(jī)加入堿基 后,各自在其表面具有合成的獨特寡核巧酸序列。個體珠可標(biāo)記有對其上的雙鏈寡核巧酸 而言獨特的序列,W允許應(yīng)用過程中的鑒定。
[0133] 在另一個實施方式中,可W在納米顆粒上連接或合成多個寡核巧酸。納米顆粒包 括但不限于金屬(例如,金、銀、銅和銷)、半導(dǎo)體(例如,CdSe、CdS和用化S涂覆的CdS)和磁性 (例如,鐵磁體)膠體材料。將寡核巧酸連接到納米顆粒的方法在本領(lǐng)域中已知。在另一個實 施方式中,納米顆粒連接到基底上。含有或不含固定的寡核巧酸的納米顆??蒞連接到基 底上,如Grabar等,Anal}ft.化em. ,67,73-743(1995) ;Bethell等,J.Electroanal.化em., 409,137( 1996) ;Bar等,Langmuir ,12,1172( 1996);Colvin等,J.Am.Chem. Soc. ,114,5221 (1992)中所述。裸納米顆??蒞首先連接到基底上并且寡核巧酸可W連接到固定的納米顆 粒上。
[0134] 預(yù)合成的寡核巧酸和/或多核巧酸序列可連接至支持物或用下述方法原位合成: 本領(lǐng)域已知的光定向法、流體通道和定點法、噴墨法、銷型方法(pin-basedmethod)和珠基 方法。在一些實施方式中,預(yù)合成的寡核巧酸連接到支持物上或使用點樣方法合成,其中單 體溶液通過從區(qū)域到區(qū)域移動的分配器(如噴墨)逐滴置入。在一些實施方式中,使用例如 機(jī)械波驅(qū)動的分配器將寡核巧酸點樣在支持物上。
[0135] 麵
[0136] 本發(fā)明各方面可W用于設(shè)及合成核酸的生成和/或使用的多種應(yīng)用。如本文所述, 本發(fā)明提供了具有提高的效率的組裝合成核酸的方法。所得組裝核酸可W體外擴(kuò)增(如使 用PCR、LCR,或任何合適的擴(kuò)增技術(shù)),體內(nèi)擴(kuò)增(如通過克隆到合適的載體中),分離和/或 純化。組裝的核酸(單獨或克隆到載體中)可W轉(zhuǎn)化入宿主細(xì)胞(如原核、真核、昆蟲、哺乳動 物或其它宿主細(xì)胞)。在一些實施方式中,所述宿主細(xì)胞可W用于增殖所述核酸。在某些實 施方式中,所述核酸可W整合到所述宿主細(xì)胞的基因組中。在一些實施方式中,所述核酸可 W取代細(xì)胞基因組上的對應(yīng)核酸區(qū)域(如通過同源重組)。因此,核酸可W用于生成重組生 物體。在一些實施方式中,祀核酸可W是用于取代全部或部分宿主生物體的基因組的整個 基因組或基因組大片段。重組生物體也可W用于多種研究、工業(yè)、農(nóng)業(yè)、和/或醫(yī)學(xué)應(yīng)用。
[0137] 許多本文所述的技術(shù)可W-起使用,在一個或多個點上應(yīng)用合適的組裝技術(shù)來產(chǎn) 生長核酸分子。例如,可W使用基于連接酶的組裝來組裝低于100到超過10000個堿基對長 度(例如,100聚體-500聚體、500聚體-1000聚體、1000聚體-5000聚體、5000聚體-10000聚 體、25000聚體、50000聚體、75000聚體、100000聚體等)的寡核巧酸雙鏈體和核酸片段。在示 例性實施方式中,本文所述方法可W在組裝生物體(如病毒、細(xì)菌、酵母或其它原核或真核 生物)的整個基因組(或其大片段,如約10%、20%、30%、40%、50%、60%、70%、80%、90% 或更多)中使用,可選將特異性修飾整合到序列中一個或多個所需位置處。
[0138] 可W任意合適的形式(例如,在穩(wěn)定的緩沖液中,凍干等)包裝任意的核酸產(chǎn)物(例 如,包含經(jīng)擴(kuò)增、克隆、純化、分離等的核酸)用于存儲和/或運輸(例如,用于運輸至分配中 屯、或客戶)。相似地,可W在合適的緩沖液中制備任意的宿主細(xì)胞(例如,用載體轉(zhuǎn)化的或具 有經(jīng)修飾基因組的細(xì)胞)用于儲存和/或運輸(例如,用于分配至客戶)。在一些實施方式中, 可W冷凍細(xì)胞。然而,也可W使用其它穩(wěn)定的細(xì)胞制品。
[0139] 宿主細(xì)胞可W在培養(yǎng)中生長和擴(kuò)增??蒞使用宿主細(xì)胞來表達(dá)一個或多個感興趣 的RNA或多膚(例如,治療用、工業(yè)用、農(nóng)業(yè)用和/或醫(yī)用蛋白)。表達(dá)的多膚可W是天然多膚 或非天然多膚??蒞分離或純化多膚用于后續(xù)使用。
[0140] 因此,使用本發(fā)明的方法產(chǎn)生的核酸分子可W被納入到載體中。載體可W是克隆 載體或表達(dá)載體。在一些實施方式中,載體可W是病毒載體。病毒載體可W包含能夠感染祀 細(xì)胞的核酸序列。相似地,在一些實施方式中,可操作地連接至合適啟動子系統(tǒng)的原核表達(dá) 載體可W用于轉(zhuǎn)化祀細(xì)胞。在其它實施方式中,可操作連接至合適啟動子系統(tǒng)的真核載體 可W用于轉(zhuǎn)染祀細(xì)胞或組織。
[0141] 本文所述的構(gòu)建體的轉(zhuǎn)錄和/或翻譯可W在體外(例如,使用不含細(xì)胞的系統(tǒng))或 體內(nèi)(例如,在細(xì)胞中表達(dá))進(jìn)行。在一些實施方式中,可W制備細(xì)胞裂解液。在某些實施方 式中,可W分離或純化表達(dá)的RNA或多膚。本發(fā)明的核酸也可W用于向表達(dá)的多膚或其片段 添加檢測和/或純化標(biāo)簽。基于多膚的融合/標(biāo)簽的例子包含但不限于六組氨酸化is6)Myc 和HA,和其它有用的多膚,如GFPsGST、MBP、幾下質(zhì)等。在一些實施方式中,多膚可W包含一 個或多個非天然氨基酸殘基。
[0142] 在一些實施方式中,可W針對由一個或多個合成核酸編碼的多膚或其片段制備抗 體。在某些實施方式中,合成核酸可W提供為文庫用于研究和開發(fā)中的篩選(例如,鑒定潛 在的治療性蛋白或多膚,鑒定用于藥物開發(fā)的潛在蛋白祀標(biāo)等)。在一些實施方式中,合成 核酸可用作治療物(例如,用于基因治療,或用于基因調(diào)控)。例如,可W向患者提供足量合 成核酸W表達(dá)治療量的蛋白。在其它實施方式中,可向患者給予足量合成核酸W調(diào)控(例 如,下調(diào))基因表達(dá)。
[0143] 應(yīng)理解,本文所述的不同行動或?qū)嵤┓绞娇蒞獨立實施并且可W在美國或美國W 外的不同地方實施。例如,接受祀核酸的訂單、分析祀核酸序列、設(shè)計一個或多個起始核酸 (例如,寡核巧酸)、合成起始核酸、純化起始核酸、組裝起始核酸、分離組裝的核酸、確認(rèn)組 裝的核酸的序列、處理組裝的核酸(例如,擴(kuò)增、克隆、插入宿主基因組等)中的每個行動和 任意其它行動或運些行動中的任意部分可W在美國或美國W外的一個位置或不同地點單 獨實施。在一些實施方式中,組裝過程可W包括在一個地點(在美國或美國W外)實施的多 個行動和在一個或多個遠(yuǎn)程地點(在美國W內(nèi)或美國W外)實施的多個行動的組合。
[0144] 自動化應(yīng)用
[0145] 本文提供的方法和設(shè)備方面可W包含自動操作本文所述的一個或多個行動 (act)。在一些實施方式中,擴(kuò)增和/或組裝反應(yīng)中的一個或多個步驟可W使用一個或多個 自動化樣品處理裝置(如一個或多個自動化液體或流體處理設(shè)備)來自動操作。自動化設(shè)備 和方法可W用于遞送反應(yīng)試劑,包含下列中的一種或多種:起始核酸、緩沖液、酶(如一種或 多種連接酶和/或聚合酶)、核巧酸、鹽、和任何其它試劑如穩(wěn)定劑。自動化設(shè)備和方法也可 W用于控制反應(yīng)條件。例如,自動化熱循環(huán)儀可W用于控制可W使用的反應(yīng)溫度和任何溫 度循環(huán)。在一些實施方式中,掃描激光器可W被自動化W提供適于解育多核巧酸的一個或 多個反應(yīng)溫度或溫度循環(huán)。相似地,經(jīng)組裝多核巧酸產(chǎn)物的后續(xù)分析可W自動進(jìn)行。例如, 測序可W使用測序設(shè)備和自動化測序方案自動進(jìn)行。其它步驟(如擴(kuò)增、克隆等)也可W使 用一種或多種合適設(shè)備和相關(guān)方案自動進(jìn)行。應(yīng)理解,本文所述的一個或多個設(shè)備或設(shè)備 組件可W組合在某一系統(tǒng)(如機(jī)器人系統(tǒng))或微環(huán)境(如微流體反應(yīng)室)中。組裝反應(yīng)混合物 (如液體反應(yīng)樣品)可W從所述系統(tǒng)的一個組件向另一個組件轉(zhuǎn)移,使用自動化設(shè)備和過程 (如樣品和/或樣品容器的機(jī)械化操作和/或轉(zhuǎn)移,包含自動化移液設(shè)備、微系統(tǒng)等)。所述系 統(tǒng)和其任何組件可W通過控制系統(tǒng)來控制。
[0146] 由此,本文所提供設(shè)備的方法步驟和/或方面可W使用例如計算機(jī)系統(tǒng)(如計算機(jī) 控制系統(tǒng))自動進(jìn)行。能實施本文所提供技術(shù)方面的計算機(jī)系統(tǒng)可W包含用于任何處理類 型(如本文所述序列分析和/或自動化設(shè)備控制)的計算機(jī)。然而,應(yīng)該理解某些處理步驟可 W通過作為所述組裝系統(tǒng)一部分的一種或多種自動化設(shè)備來提供。在一些實施方式中,計 算機(jī)系統(tǒng)可包含兩臺或更多臺計算機(jī)。例如,一臺計算機(jī)可W通過網(wǎng)絡(luò)連接第二臺計算機(jī)。 一臺計算機(jī)可W進(jìn)行序列分析。第二臺計算機(jī)可W控制系統(tǒng)中的一個或多個自動化合成和 組裝設(shè)備。其它方面中,其它計算機(jī)可W包含在網(wǎng)絡(luò)中W控制一個或多個分析或處理運行。 各計算機(jī)可W包含內(nèi)存和處理器。所述計算機(jī)可采用任何形式,因為本文提供的技術(shù)方面 對在任何特定計算機(jī)平臺上實施沒有限制。相似地,所述網(wǎng)絡(luò)能采用任何形式,包含專用網(wǎng) 絡(luò)或公共網(wǎng)絡(luò)(如互聯(lián)網(wǎng))。顯示設(shè)備能與一個或多個設(shè)備和計算機(jī)關(guān)聯(lián)。替代或補(bǔ)充地,根 據(jù)本文提供的技術(shù),顯示設(shè)備可W位于遠(yuǎn)程位點并且連接用于顯示分析輸出。所述系統(tǒng)不 同組件之間的連接可W通過有線、光纖、無線傳送,衛(wèi)星傳送,任何其它合適的傳送,或者上 述兩種或多個的任意組合。
[0147] 本文所提供技術(shù)的各個不同方面、實施方式、或行動能W多種方式中的任一種獨 立自動進(jìn)行和實施。例如,各個方面、實施方式或運行能使用硬件、軟件或其組合獨立實施。 當(dāng)W軟件實施時,所述軟件密碼能在任何合適的處理器或處理器集合上執(zhí)行,無論在單獨 計算機(jī)中提供或分布在多個計算機(jī)上。應(yīng)該理解完成上述功能的任何組件或組件集合能通 ??醋骺刂粕厦嫠懻摴δ艿囊粋€或多個控制器。所述一個或多個控制器能W多種方式實 施,例如有使用微碼或軟件程序控制的專用硬件或通用目的硬件(例如,一個或多個處理 器)W完成上述功能。
[0148] 在運方面,應(yīng)該理解本文所提供技術(shù)實施方式的一種實現(xiàn)中包含了編碼有計算機(jī) 程序(例如,多種指令)的至少一種計算機(jī)可讀介質(zhì)(例如,計算機(jī)內(nèi)存、軟盤、光盤、磁帶 等),當(dāng)在處理器上運行時,完成本文所提供技術(shù)的一種或多種上述功能。所述計算機(jī)可讀 介質(zhì)可運輸,從而其上存儲的程序能加載到任何計算機(jī)系統(tǒng)來源W運行本文所提供技術(shù)的 一種或多種功能。另外,應(yīng)該理解執(zhí)行時,提及完成上面討論功能的計算機(jī)程序不限于在主 機(jī)上運行應(yīng)用程序。相反,所述術(shù)語計算機(jī)程序在本文W-般意義使用,指任何類型的計算 機(jī)編碼(如軟件或微碼),能用于編程處理器W進(jìn)行上面討論的本文所提供的技術(shù)方面。
[0149] 應(yīng)該理解與處理存儲于計算機(jī)可讀介質(zhì)上的數(shù)個本文所提供技術(shù)的實施方式一 致,所述計算機(jī)實施的處理在其執(zhí)行過程中可W接收手工輸入(如來自用戶)。
[0150] 因此,本文所述組裝設(shè)備或組件的整體系統(tǒng)水平控制可W通過系統(tǒng)控制器進(jìn)行, 所述系統(tǒng)控制器可W提供控制信號給:相關(guān)的核酸合成器、液體處理設(shè)備、熱循環(huán)儀、測序 設(shè)備、相關(guān)的機(jī)械化組件,W及其它合適系統(tǒng)來運行所需的輸入/輸出或其它控制功能。因 此,所述系統(tǒng)控制器與任何設(shè)備控制器一起形成控制核酸組裝系統(tǒng)運作的控制器。所述控 制器可W包含通用目的數(shù)據(jù)處理系統(tǒng)和其它相關(guān)設(shè)備,所述通用目的數(shù)據(jù)處理系統(tǒng)可W是 通用目的計算機(jī)或通用目的計算機(jī)的網(wǎng)絡(luò),所述其它相關(guān)設(shè)備包含通信設(shè)備、調(diào)制解調(diào)器、 和/或其它回路或組件,W進(jìn)行所需的輸入/輸出或其它功能。所述控制器也能(至少部分) 作為單個特定目的集成電路(例如,ASIC)或ASIC陣來實施,各有用于整體、系統(tǒng)水平控制的 主要或中央處理器部分,和專用的分離部分W在中央處理器部分控制下進(jìn)行多種不同特定 計算、功能和其它處理。所述控制器也能使用多種分離的專用程序集成或其它電子回路或 設(shè)備實施,例如硬連線電子或邏輯回路如分立元件電路或可編程邏輯設(shè)備。所述控制器也 能包含任何其它組件或設(shè)備,如用戶輸入/輸出設(shè)備(監(jiān)控器、顯示器、打印機(jī)、鍵盤、用戶點 擊設(shè)備、觸摸屏、或其它用戶界面等)、數(shù)據(jù)存儲設(shè)備、驅(qū)動馬達(dá)、連接、閥控制器、機(jī)械化設(shè) 備、真空和其它累、壓力傳感器、檢測器、電源供應(yīng)、脈沖源、通信設(shè)備或其它電子電路或組 件等。所述控制器也可W控制系統(tǒng)其它部分的運作,如自動化客戶訂單處理、質(zhì)量控制、包 裝、運輸、開票等,W進(jìn)行本領(lǐng)域已知而本文沒有詳述的其它合適功能。
[0151] 本發(fā)明的各方面可W單獨使用、聯(lián)用或W前述實施方式未具體討論的各種排列來 使用,并且因此其應(yīng)用并不限制于前面描述或【附圖說明】所示組件的細(xì)節(jié)和排列。例如,一個 實施方式的所述方面可與其它實施方式所述方面W任何方式組合。
[0152] 權(quán)利要求中修飾所提要素使用的順序術(shù)語"第一"、"第二"、"第="等本身并不暗 指所提要素其一相對另一個的任何優(yōu)先、居先或級別高低,或?qū)嵭蟹椒ǘ鄠€行動的時間順 序,而是僅僅用作標(biāo)記把有某一名稱的所提要素與有相同名稱的另一要素(但是就順序術(shù) 語使用而言)區(qū)分開W區(qū)別所提的多個要素。
[0153] 而且,本文所用的詞語和術(shù)語是為了描述目的,而不是限制性的。本文使用"包 含"、"包括"、或"具有"、"含有"、"設(shè)及"及其變化意味著涵蓋其后列出的項目及其等價物, W及額外的項目。
[0154] 等同形式
[0155] 本發(fā)明提供合成核酸文庫的新方法。盡管討論了本發(fā)明的【具體實施方式】,但W上 說明書僅為說明性而非限制性的。本領(lǐng)域的技術(shù)人員在閱讀本說明書后將清楚了解本發(fā)明 的許多變化。本發(fā)明的全部范圍應(yīng)該通過參考所附權(quán)利要求書連同其等同物的全部范圍, W及說明書連同此類變化來確定。
[0156] 通過引用納入
[0157] 參考國際專利申請公開號口機(jī)/11512/052036和美國臨時申請序列號61/792,245 (2013年3月15日提交),題為"用于多重核酸合成的組合物和方法",其各自通過引用其全文 納入本文。本文提到的所有發(fā)表物、專利和序列數(shù)據(jù)庫條目在此通過引用全文納入,就好像 各個單獨發(fā)表物或?qū)@囟ê蛦为毜乇砻魍ㄟ^引用納入。
【主權(quán)項】
1. 一種用于產(chǎn)生核酸文庫的方法,所述核酸文庫包含多個非隨機(jī)變體靶核酸,所述方 法包括: (a) 提供第一體積的第一組部分雙鏈核酸,其中所述第一組雙鏈核酸中的各核酸具有 相同的單鏈突出端,其中所述第一組部分雙鏈核酸中的各核酸具有預(yù)定序列,所述預(yù)定序 列不同于所述第一組部分雙鏈核酸中的另一核酸的預(yù)定序列; (b) 提供第二體積的第二組部分雙鏈核酸,其中所述第二組部分雙鏈核酸中的各核酸 具有與所述第一組部分雙鏈核酸中的突出端互補(bǔ)的相同的單鏈突出端;和 (c) 通過將第一組部分雙鏈核酸與第二組部分雙鏈核酸混合來組裝核酸文庫,所述混 合在使互補(bǔ)的突出端雜交的條件下進(jìn)行,以形成非隨機(jī)變體靶核酸的文庫。2. 如權(quán)利要求1所述的方法,其中,在組裝步驟中,所述互補(bǔ)的突出端雜交以形成無缺 口的接合,并被連接。3. 如權(quán)利要求1所述的方法,其中,在提供步驟中,第一和第二組部分雙鏈核酸具有3 ' 突出端,或者第一和第二組部分雙鏈核酸具有5 '突出端。4. 如權(quán)利要求1所述的方法,其中,組裝步驟在單一反應(yīng)體積中進(jìn)行。5. 如權(quán)利要求1所述的方法,其中,提供第一和第二組部分雙鏈核酸的步驟包括: (i)提供第一體積的第一組鈍端雙鏈核酸集, 其中,第一鈍端雙鏈核酸集里的第一核酸具有從第一鈍端雙鏈核酸集里的第二核酸偏 移η個堿基的序列,和 其中,各鈍端雙鏈核酸集里的各雙鏈核酸是所述集里另一雙鏈核酸的變體; (i i)提供第二體積的第二組鈍端雙鏈核酸集,其中第二鈍端雙鏈核酸集里的第一核 酸具有從第二鈍端雙鏈核酸集里的第二核酸偏移η個堿基的序列; (i ii)使第一體積的第一組鈍端雙鏈核酸集解鏈,由此形成第一體積的單鏈核酸,和, 使第二體積的第二組鈍端雙鏈核酸集解鏈,由此形成第一體積的單鏈核酸;和 (i V)使多個單鏈寡核苷酸退火,以形成第一體積的具有單鏈突出端的第一組部分雙鏈 寡核苷酸和第二體積的具有單鏈突出端的第二組部分雙鏈寡核苷酸。6. 如權(quán)利要求5所述的方法,其中,η是2、3、4、5、6、7或8個堿基。7. 如權(quán)利要求5所述的方法,其中,第二組鈍端雙鏈核酸集里的各雙鏈核酸是所述集里 的另一雙鏈核酸的變體。8. 如權(quán)利要求1所述的方法,其中,第二組部分雙鏈核酸中的各核酸具有預(yù)定序列,所 述預(yù)定序列不同于第二組部分雙鏈核酸中的另一序列。9. 如權(quán)利要求1所述的方法,其中,第二組部分雙鏈核酸中的各核酸具有相同的預(yù)定序 列。10. 如權(quán)利要求1-9中任一項所述的方法,其還包括:第三體積的第三組部分雙鏈核酸, 其中,所述第三組雙鏈核酸中的各核酸具有相同的單鏈突出端,其中,所述第三組部分雙鏈 核酸中的各核酸具有預(yù)定序列,所述預(yù)定序列不同于所述第一組部分雙鏈核酸中的另一核 酸的預(yù)定序列。11. 如權(quán)利要求10所述的方法,其還包括:通過將第一、第二和第三組部分雙鏈核酸混 合來組裝變體核酸的文庫,所述混合在使互補(bǔ)的突出端雜交的條件下進(jìn)行,以形成非隨機(jī) 變體靶核酸的文庫。12. 如權(quán)利要求1所述的方法,其中,所述文庫是基因文庫。13. 如權(quán)利要求1所述的方法,其中,各雙鏈核酸的大小是約20個堿基對-約200個堿基 對。14. 如權(quán)利要求1所述的方法,其中,所述文庫是代謝通路文庫。15. 如權(quán)利要求1所述的方法,其中,各雙鏈核酸的大小是約500個堿基對-約3000個堿 基對。16. 如權(quán)利要求1所述的方法,其中,各雙鏈核酸是基因或基因的集。17. 如權(quán)利要求1所述的方法,其中,各雙鏈核酸是操縱子,其包含啟動子序列、核糖體 結(jié)合位點序列,和基因或基因的集,及其任何組合。18. 如權(quán)利要求1所述的方法,其中,所述文庫是包含不同長度的啟動子的操縱子的文 庫。19. 如權(quán)利要求1所述的方法,其中,所述文庫是包含不同長度的核糖體結(jié)合位點的操 縱子的文庫。20. -種產(chǎn)生核酸文庫的方法,所述方法包括: (a) 鑒定靶核酸; (b) 在所述靶核酸中鑒定第一區(qū)域,其中所述第一區(qū)域包含變體核酸序列; (c) 在所述靶核酸中鑒定第二區(qū)域,其中所述第二區(qū)域包含非變體序列; (d) 在包含所述變體核酸序列的至少第一組寡核苷酸和包含所述非變體核酸序列的至 少第二組寡核苷酸中解析所述靶核酸; (e) 提供所述至少第一組寡核苷酸和至少第二組寡核苷酸;和 (f) 組裝所述至少第一組寡核苷酸和至少第二組寡核苷酸。21. 如權(quán)利要求20所述的方法,其中,所述靶核酸編碼具有一個或多個結(jié)構(gòu)域的多肽。22. 如權(quán)利要求20所述的方法,其中,在提供步驟中,第一組寡核苷酸包含編碼所述一 個或多個結(jié)構(gòu)域的至少部分的核酸序列的缺失。23. 如權(quán)利要求20所述的方法,其中,在提供步驟中,第一組寡核苷酸包含編碼所述一 個或多個結(jié)構(gòu)域的至少部分的核酸序列的插入。24. 如權(quán)利要求20所述的方法,其中,在提供變體核酸序列的步驟中,第一組寡核苷酸 包含編碼所述一個或多個結(jié)構(gòu)域的至少部分的核酸序列的插入、編碼所述一個或多個結(jié)構(gòu) 域的至少部分的核酸序列的缺失,或其組合。25. 如權(quán)利要求20所述的方法,其中,所述靶核酸包含一個或多個恒定區(qū)。26. 如權(quán)利要求20所述的方法,其中,所述靶核酸包含一個或多個可變區(qū)。27. 如權(quán)利要求20所述的方法,其中,所述文庫采用基于聚合酶、基于連接酶或其組合 的方式組裝。28. 如權(quán)利要求22-24中任一項所述的方法,其中,所述缺失或所述插入是3核苷酸的倍 數(shù)。29. 如權(quán)利要求22-24中任一項所述的方法,其中,所述缺失或所述插入包含5組或更少 組的3核苷酸。30. 如權(quán)利要求22-24中任一項所述的方法,其中,所述缺失或所述插入包含至多12組 的3核苷酸。31. 如權(quán)利要求20所述的方法,其中,所述靶核酸是基因或基因的集。32. 如權(quán)利要求31所述的方法,其中,所述核酸文庫在所述基因或基因的集的非編碼序 列中包含缺失、插入或其組合。33. -種產(chǎn)生核酸文庫的方法,所述方法包括: (a) 選擇靶核酸序列; (b) 選擇至少在一個或多個選定位置待缺失或插入的核酸序列; (c) 設(shè)計在所述選定位置具有變體序列的第一寡核苷酸集,和具有非變體序列的至少 第二寡核苷酸集;和 (d) 組裝所述第一寡核苷酸集和所述至少第二寡核苷酸集。34. 如權(quán)利要求33所述的方法,其中,第一和第二集一起包含所述靶核酸序列。35. 如權(quán)利要求33所述的方法,其中,第一和第二集一起包含所述靶核酸序列的片段。36. 如權(quán)利要求33-35中任一項所述的方法,其中,所述選定位置包含核苷酸、密碼子、 核苷酸序列或其組合。37. 如權(quán)利要求33所述的方法,其中,在選擇步驟中,待缺失或插入的核酸序列是3核苷 酸的倍數(shù)。38. 如權(quán)利要求33所述的方法,其中,在選擇步驟中,待缺失或插入的核酸序列包含5組 或更少組的3核苷酸。39. 如權(quán)利要求33所述的方法,其中,所述缺失或所述插入包含至多12組的3核苷酸。40. 如權(quán)利要求33所述的方法,其中,所述靶核酸是基因或基因的集。41. 如權(quán)利要求40所述的方法,其中,所述核酸文庫在所述基因或基因的集的非編碼序 列中包含缺失、插入或其組合。
【文檔編號】C40B50/00GK105934541SQ201480074047
【公開日】2016年9月7日
【申請日】2014年11月25日
【發(fā)明人】J·雅各布森, D·辛德勒, I·薩奧爾默, N·J·圭多
【申請人】Gen9股份有限公司