專利名稱:合成基因組的制作方法
合成基因組
Craig Venter, Hamilton O. Smith及Clyde A. Hutchison III相關(guān)申請的交叉引用
本申請要求2005年12月6日提交的專利申請?zhí)枮镹o. 60/742,542,標(biāo)題為"合成基因組(Synthetic Genomes),,的美國臨時專利申請的優(yōu)先權(quán),本申請與2005年12月23日提交的專利申請?zhí)枮镹o. 60/752,965,標(biāo)題為"將基因組導(dǎo)入孩丈生物(Introduction of Genomes into Microorganisms)"的美國臨時專利申請;2005年12月2日提交的專利申請?zhí)枮镹o. 6(V741,469,標(biāo)題為"糾錯方法(Error Correction Method)"的美國臨時專利申請;2006年8月11曰提交的專利申請?zhí)枮镹o. 11/502,746,標(biāo)題為"體外重組方法(/"附ra RecombinationMethod)"的美國非臨時專利申請相關(guān),以上所有通過引用納入本文。
聯(lián)邦政府資助研究或開發(fā)的相關(guān)聲明
本發(fā)明由美國政府支持(DOE資助號DE-FG02-02ER63453)。政府擁有發(fā)明中的某些權(quán)益。
背景技術(shù):
發(fā)明領(lǐng)域
本發(fā)明概括地涉及分子生物學(xué),更具體地涉及到合成基因組。相關(guān)領(lǐng)域描述
常規(guī)遺傳工程技術(shù)僅限于允許對現(xiàn)有的序列進行修飾。因此如果具備對遺傳內(nèi)容進行顯著變更和排列的能力,超過常規(guī)技術(shù)能力所及,將會是非常有意義的。因此,存在對合成基因組的需求。
發(fā)明概述
為合成基因組的設(shè)計、合成、裝配及表達提供了實施方式與方法。包括用于以下各項的方法基因組組分的合理設(shè)計;小核酸片段的制備以及將它
5們組裝成包含基因組組分的表達盒(cassette);表達盒序列中錯誤的糾正;表 達盒的克隆(例如,通過如滾環(huán)擴增等體外方法);將表達盒組裝成合成基因組 (例如,通過體外重組的方法);和將合成基因組轉(zhuǎn)入進生物化學(xué)系統(tǒng)(例如, 通過將其植入完整細胞,無功能DNA的影細胞(ghostcell),或其他小泡中)。 在一個實施方式中,合成基因組包含可使其所在的小泡(例如,細胞)完成復(fù)制 的足夠的遺傳信息。所述技術(shù)可擴展至合成基因組系統(tǒng)可以制備的有用的終 產(chǎn)物,如能源(例如,氫或乙醇),以及生物大分子,例如治療學(xué)和工業(yè)的聚合 物。
本發(fā)明包含構(gòu)建合成基因組的方法,包括制備和組裝基因組核酸組分, 其中至少部分基因組是由已經(jīng)化學(xué)合成的核酸組分,或化學(xué)合成的核酸組分 的拷貝構(gòu)建而成。在一個體實施方式中, 一個完整的合成基因組全部由已經(jīng) 化學(xué)合成的核酸組分或化學(xué)合成的核酸組分的拷貝構(gòu)建而成。更進一步地, 合成基因組可以是合成的細胞基因組(包含其所存在的小泡(例如,細胞或合成 小泡)復(fù)制所需全部序列的基因組)。
本發(fā)明提供用于構(gòu)建合成細胞的方法,包括使用某些示例性的方法來構(gòu) 建合成基因組以及將合成基因組導(dǎo)入(植入)小泡中(例如,細胞或合成膜結(jié)合 小泡(synthetic membrane bound vesicle))。 另 一種方法包4舌構(gòu)建一種自我復(fù)制 的合成細胞,包括應(yīng)用示例性的方法構(gòu)建出合成細胞基因組并且在能夠使合 成細胞有效復(fù)制的條件下將合成細胞基因組導(dǎo)入(植入)小泡中(例如,細胞或 合成膜結(jié)合小泡)。進一步的方法包括制備感興趣的產(chǎn)物,包括在有效產(chǎn)生所 述產(chǎn)物的條件下對示例性的合成細胞進行培養(yǎng)。當(dāng)產(chǎn)物產(chǎn)自包含合成細胞基 因組的合成細胞時,在有效復(fù)制合成細胞并且有效產(chǎn)生所述產(chǎn)物的條件下, 使基因組與小泡接觸。
其他示例性的方法包括制備合成細胞,其包含4巴部分或全部的固有 (resident)(原始)基因組從微生物,如單細胞微生物(例如,細菌,真菌等)中移 除,并且將其替換為對于該生物是外源的合成基因組(例如,來自另一種微生 物(如,細菌)),所述合成基因組至少表現(xiàn)出一種與固有基因組不同的性質(zhì)。
一個示例性的實施方式中包含能夠在特定環(huán)境條件下(例如,營養(yǎng)條件或 物理條件)引導(dǎo)其所存在的小泡(例如,細胞)進行復(fù)制的合成基因組。在一個 實施方式中,在小泡中將諸如營養(yǎng)物,ATP,脂類,糖類,磷酸鹽等小分子作為結(jié)構(gòu)特征的前體或代謝功能的底物補充給細胞基因組;和/或?qū)⒓毎?組補充以例如核糖體,功能型細胞膜等復(fù)合組分。這些附加的成分可以補足 或促進基因組完成(例如,編程)小泡/細胞的復(fù)制的能力。在另一實施方式中, 基因組中的序列能夠提供生成細胞并且使細胞能夠在特定能量或環(huán)境條件 (例如,營養(yǎng)條件)下進行復(fù)制所需的所有元件(machinery)和組分。
進一步的實施方式和方法包括"最小基因組",其可以作為引入其他目的 序列的平臺,所述其他目的序列如編碼生物學(xué)制劑(例如,治療劑,藥物,疫 苗等)的基因,或編碼下述產(chǎn)物的基因,所述產(chǎn)物在適當(dāng)?shù)那绑w存在下可以產(chǎn) 生有用的化合物(例如,生物燃料,工業(yè)有機化學(xué)劑等)。在一個實施方式中, 這些其他目的序列可使產(chǎn)物以足以具有商業(yè)價值的量產(chǎn)生。
才艮據(jù) 一 個示例性實施方式及方法,合成型的生殖支原體(M少co/ /oswa gew'to/^m)基因組由基因表達盒組裝而成,該基因組具有482個編碼蛋白質(zhì)的 基因以及43個RNA基因,包含580kb環(huán)狀染色體。每個表達盒可以由化學(xué) 合成的寡核苷酸制備。每個表達盒可以制成數(shù)種形式,由此組合裝配成為完 整染色體,從而形成數(shù)以百萬計的不同基因組??梢酝ㄟ^"基因組移植"的方 式,以合成基因組替代細胞的固有染色體來檢驗這些基因組的功能性。根據(jù) 其他的實施方式及方法,合成細胞可以由各種亞細胞組分組裝而成。因此, 可以在不含細胞的環(huán)境中建立基因組,其包含表達基因所必要的轉(zhuǎn)錄和翻譯 "元件"。
附圖及實施例簡述
圖1顯示適于制備生殖支原體的寡核苦酸的圖解。
實施例1說明應(yīng)用支原體屬(Mycop/oyma)比較基因組學(xué)來鑒定可能與支 原體最小基因集合相關(guān)的基因。
實施例2顯示682個48-mer寡核苷酸的設(shè)計,以及將這些寡核香酸組裝 形成3個重疊的片段(表達盒)。
實施例3顯示生殖支原體基因組關(guān)鍵區(qū)域5kb表達盒的合成。
發(fā)明詳述
以下對本文所用多種術(shù)語的描述并不詳盡,而可能包含其他描述性內(nèi)容。 "細胞基因組"或"合成細胞基因組"是指包含序列的基因組,所述序列編
7碼并可表達核酸及蛋白質(zhì),這些核酸和蛋白為下述過程中的某些或全部所需 轉(zhuǎn)錄,翻譯,制造能量,運輸,制造細胞膜及細胞質(zhì)成分,DNA復(fù)制,細胞 分裂等等。"細胞基因組,,與病毒基因組或細胞器基因組不同,其區(qū)別至少在 于細胞基因組包含用于細胞復(fù)制的信息,而病毒和細胞器基因組包含它們自 身復(fù)制的信息(有時在細胞因子的幫助下),但是它們?nèi)狈?fù)制它們所處細胞的 信息。
"外源"基因或基因組是指源自不同于固有(原始)生物體的來源的基因組, 例如,源自另 一物種的生物體。
"基因組"可以包括病毒基因組,細胞器(例如,線粒體或葉綠體)的基因組, 以及那些自我復(fù)制生物體的基因組,如細菌,酵母,古細菌,或真核生物的 基因組。對于不屬于任何已知的林奈氏分類系統(tǒng)類別的生物體而言,基因組 也可以是全新的構(gòu)造。在一個實施方式中,基因來自微生物,例如,單細胞 微生物,如細菌?;蚩梢允前丛谖⑸镏写嬖诘捻樞颍蛘呖梢愿慕M;并 且也可能包括某些基因的突變形式。
"膜結(jié)合小泡"是指小泡,其中基于脂質(zhì)的保護性材料包裹著水溶液。
這里用到的關(guān)于細胞的"最小基因組,,是指由或基本上由足以使細胞能夠 在特定環(huán)境條件(例如,營養(yǎng)條件)下存活的遺傳序列的最小集合所組成的基因 組。這里用到的關(guān)于細胞器的"最小基因組"是指由或基本上由足以允許細胞 器發(fā)揮功能的遺傳序列的最小集合所組成的基因組。最小基因組必須包含足 夠的信息以使細胞或細胞器能夠執(zhí)行基本的生物學(xué)過程,例如,轉(zhuǎn)錄,翻譯, 利用能量資源,運送鹽類、營養(yǎng)物等進出細胞或細胞器等等。此外,關(guān)于細 胞或細胞器的"最小復(fù)制基因組"還包含足以允許該細胞或細胞器自我復(fù)制的 遺傳序列,因而,"最小復(fù)制合成基因組"是一條或一組至少部分為合成的多 核苷酸,并且所述多核苷酸包含細胞或細胞器在特定環(huán)境條件下存活和復(fù)制 所需的遺傳序列的最小集合。
"核酸"和"多核香酸"在這里相互通用。它們包括DNA和RNA兩種。其 他類型的核酸如PNA、 LNA、修飾的DNA或RNA等等,只要能夠參與這里 描述的合成操作,并且表現(xiàn)出期望的屬性和功能,則也包括于其中。對于這 里描述的任何特定的實施方式或方法而言,熟練的工作人員將能夠辨別哪一 種形式的核酸是可以應(yīng)用的。
"合成基因組"包括一個或一組多核苷酸,其包含在特定環(huán)境條件(例如,
8營養(yǎng)的或物理的)達到時,使功能性細胞器或生物體存活所需的信息,和任選 地復(fù)制自身所需的信息。全部或至少部分基因組(例如,表達盒)是由已經(jīng)化學(xué) 合成的組分或由化學(xué)合成的核酸組分的拷貝構(gòu)建而成??截惪梢杂啥喾N方法 中的任意方法制備,包括通過體內(nèi)或體外方法克隆和擴增。在一個實施方式 中,全部基因組由已經(jīng)化學(xué)合成的核酸或化學(xué)合成的核酸組分的拷貝構(gòu)建而 成。這樣的基因組有時在這里稱為"完全合成"基因組。在另一實施方式中, 基因組的一個或多個部分可能是從天然存在的核酸或克隆的核酸等組裝而 來。這樣的基因組有時在這里稱為"部分合成"基因組。
合成基因組比傳統(tǒng)的重組DNA技術(shù)可提供許多優(yōu)勢。例如,與經(jīng)典的重 組技術(shù)相比,合成基因組序列的選擇和構(gòu)建使更容易的序列操作成為可能, 并且可以構(gòu)建新的生物體及生物系統(tǒng)。此外,各種實施方式和方法適用于自 動化且適合于高通量方法,允許合成基因組以及合成細胞通過不需要人工干 預(yù)的計算機介導(dǎo)的方法和機器人方法來制備。本發(fā)明的技術(shù)為嚢括合成基因 組設(shè)計、構(gòu)建、導(dǎo)入生物系統(tǒng)、生物生產(chǎn)有用產(chǎn)品以及對設(shè)計的回饋改進在 內(nèi)的整合方法開啟了大門。
依照各種示例性的實施方案及方法可以采用各種合理的或巧妙的核酸設(shè) 計形式。按照一種方法,基因集合經(jīng)鑒定包含最小基因組,例如,細菌的基 因組,如生殖支原體(JW: gewY"http://ww), 山羊支原體(Af. capn'co/ww)(例如,山羊 亞種),大腸桿菌(五.co"),枯草芽孢桿菌CB. ^Z^'fc)或其它。為達到此目的可 以使用一種或多種常規(guī)或新型的方法,或者這些方法的組合。 一種方法包括 應(yīng)用隨才幾々包和通用轉(zhuǎn)位子i秀變(random saturation global transposon mutagenesis) 將微生物基因組(例如,細菌基因組)中每個基因的功能逐一敲除,并且在此基 礎(chǔ)上確定在不破壞細胞生存能力的情況下可以去除的推測基因。參見,例如, Sm///7 & a/. (7^9」A^/爿cad <SW 87, 826-830。另 一種方法是應(yīng)用多種 相關(guān)基因組的比較基因組學(xué)(例如,分析直向同源生物體的序列,宏基因組學(xué), 等)來預(yù)測作為所感興趣微生物(例如,細菌)的功能的基礎(chǔ)的共同基因,例如, 確定對分類單元中所有成員而言共同的基因??梢允褂矛F(xiàn)有的數(shù)據(jù)庫,或者
法,應(yīng)用破壞細胞團塊的方法分離及擴展(expand)個體細胞的克隆,來促進對 最小基因組中基因的鑒定。這里的實施例1說明應(yīng)用支原體屬比較基因組學(xué) 來鑒定與支原體屬最小基因集合相關(guān)的基因。
9在鑒定了于設(shè)定的 一 系列條件下生存所需以及任選的復(fù)制所需的推測的 最小基因集合之后,按這里的描述可構(gòu)建候選的最小基因組。按照一種方法,
構(gòu)建出一組重疊的核酸表達盒,通常每個約為5kb,包含基因的子集;進而 組裝表達盒以形成基因組??梢酝ㄟ^將組裝的基因組導(dǎo)入合適的生物系統(tǒng)中, 并監(jiān)測該基因組編碼基因的一種或更種功能/活性,例進一步研究該基因組的 功能/活性??梢詫铣苫蚪M進行進一步操作,例如,通過修飾(例如,缺失, 變更單個核苷酸,等)基因的部分或缺失一個或多個表達盒內(nèi)的全部基因;通 過將基因或表達盒用其它的基因或表達盒來替換,如用功能上相關(guān)的基因或 基因群來替換;通過重新排列基因或表達盒的順序(例如,通過組合裝配);等 等。這些操作的效果可以通過將合成基因重新導(dǎo)入適當(dāng)?shù)纳锵到y(tǒng)中來檢驗。 可以考慮的因素包括,例如,生長率,營養(yǎng)需求及其他代謝因子。通過這種 方式,可以進一步推敲(refine)哪些基因是最小基因組所需。
根據(jù)進一步的方法合理設(shè)計的另 一方面包括,確定在不破壞基因功能的 情況下,合成基因組內(nèi)的哪些位點可以經(jīng)受插入,如獨特標(biāo)識符(unique identifier)(例如,水印(watermark)),及感興趣的可表達序列等。通常來講,基 因組內(nèi)部能夠經(jīng)受此類破壞的位點位于基因間的接合部,或在非編碼區(qū)中等。
根據(jù)根進一步的方法合理設(shè)計的另 一方面包括適當(dāng)?shù)恼{(diào)節(jié)性控制元件的 選擇。例如,對于原核類型的細胞,這些調(diào)節(jié)性控制元件包括啟動子、終止 子、調(diào)節(jié)基因表達的信號(例如,阻抑物、刺激因子等)、與翻譯相關(guān)的信號、 與核酸修飾相關(guān)的信號(例如,通過曱基化修飾)等。對于真核類型的細胞,其 它調(diào)節(jié)性控制元件包括與剪接、翻譯后修飾相關(guān)的信號等等。
另一項可以應(yīng)用的設(shè)計過程是設(shè)計合適的表達盒來組合形成合成基因 組。在合成產(chǎn)生了與已知序列的基因組基本上完全相同的拷貝后,在該序列 中選擇彼此相鄰的表達盒,優(yōu)選彼此重疊以促進表達盒的拼接。在設(shè)計表達 盒時需要考慮的因素包括,例如,除重疊部分外,片段長度在大約4到6.5 kb; 除重疊部分外,片段只含完整基因;并且與相鄰序列的重疊部分為200至250 bp。因此,每個合成的約為5kb的部分為一個表達盒,包含一個或多個完整
的圖解。
在另一實施方式中,將表達盒設(shè)計為可以相互更換的形式,例如,通過 如限制性酶切位點或接頭位點的獨特序列將表達盒分界,這樣可以從基因組
10中將表達盒切割下來??梢詫⒈磉_盒移除,對表達盒進行操作(如,突變),然
后再放回基因組中原來的位置;可以將表達盒用其他表達盒替換,例如用具 有功能相關(guān)基因的表達盒替換;可以將表達盒與其他表達盒一起重新分配(重 新排列),例如以組合的形式;等等。可以引入突變或其他改變,例如,通過 插入天然來源的突變核酸;通過體內(nèi)或體外定點突變;通過合成含有預(yù)期變 異的核酸。
如這里所注,直接或間接致使目的產(chǎn)品(如,治療劑、生物燃料等)產(chǎn)生的 目的基因可以存在于合成基因組中。為了優(yōu)化這些產(chǎn)品的生產(chǎn),可以對目的 基因進行操作,然后將修飾過的合成基因組導(dǎo)入生物系統(tǒng)中以評估所述操作 的效果??赡芨淖兊膶傩园?,例如,編碼序列或調(diào)控序列、密碼子選擇、 對使用的特定生長培養(yǎng)基的適應(yīng),等等。屬于可評估的屬性的是,例如,目 的終產(chǎn)品的產(chǎn)量、對終產(chǎn)品的耐受性、強度(robustness),等等。為了進一步 優(yōu)化,還可進行額外的操作及評估循環(huán)。通過這樣反復(fù)的設(shè)計和評估過程(這 里有時稱為"反復(fù)(reiterative)"或"遞歸"改進,"遞歸設(shè)計",或"反饋循環(huán)的應(yīng) 用,,),可以使目的產(chǎn)品的生產(chǎn)優(yōu)化或使合成細胞的生長優(yōu)化。可以對細胞的 行為表現(xiàn)進行預(yù)測,可以對這些行為表現(xiàn)進行驗證,如果需要的話還可以進 行修飾。此外,通過根據(jù)這里描述的方法設(shè)計和操作合成基因組內(nèi)的基因, 可以進行實驗研究,例如,鑒定對于細胞的維持及分裂等重要的屬性,對于 賦予生物"生命"重要的屬性等。
多種方法可以用于制備和組裝核酸表達盒。作為第一步,通常將目的表 達盒細分為更小的部分,可以由這些更小的部分組裝所述表達盒。 一般地, 這些更小的部分是大約30 nt到大約lkb之間的寡核苷酸,例如,大約50 nt (例 如,在大約45到55之間)。在一個實施方式中,將寡核苷酸設(shè)計成與相鄰的 寡核苷酸重疊,以促進它們組裝成表達盒。例如,對于生殖支原體而言,可 以將它的全基因組劃分成相鄰的首尾寡核苷酸之間帶有24個重疊核苷酸的 重疊48-mer的列表。圖1顯示的是適合制備生殖支原體的寡核苷酸的實例。 寡核苷酸可以通過常規(guī)方法和設(shè)備合成,或者可以從公知的商業(yè)供應(yīng)商獲得。
在眾多可以用來將寡核苷酸組裝成較長的分子,如組裝成這里描述的表 達盒的方法中包括&ewmer等人(1995) (Ge"e 164, 49-53)及l(fā)btmg等人(2004) (A^c/ez'c ^c/A i e^arc/z 32, e59)描述的那些方法。 一種稱為聚合酶循環(huán)組裝 (PCA)的有效方法曾由Sm他等人(2003)(/VocA^/A^/5W t75^ 100, 15440-5)用于合成OX174的5386nt基因組。 一般而言優(yōu)選將這些表達盒克隆和/或擴 增以產(chǎn)生便于操作的足夠的材料。在一些實施方式中,通過基于細胞的常規(guī) 方法來克隆和擴增表達盒。在一個實施方式中,例如,當(dāng)通過基于細胞的常 規(guī)方法難以克隆表達盒時,則體外克隆表達盒。這種體外方法之一在共同待 決的美國臨時專利申請案序列號第60/675,850; 60/722,070;及60/725,300中 進行了討論,所述方法在將背景合成顯著降低的條件下,應(yīng)用滾環(huán)擴增。
按照各種示例性方法制備的表達盒可以是任意合適的大小。例如,表達 盒長度可以在大約1 kb到大約20kb。合適的大小是在大約4到大約7kb, 例如大約4.5到大約6.5kb,優(yōu)選大約5kb。這里在描述寡核普酸長度時用到 的術(shù)語"大約"是指從小于所述寡核苷酸大約10%到大于所述寡核苷酸大約 10%的范圍。為了促進表達盒的組裝,優(yōu)選每個表達框與其雙邊相鄰的表達 盒重疊,例如,重疊至少50、 80、 100、 150、 200、 250或1300 nt。還包括 包含表達盒組的較大的構(gòu)建體(大到例如最小基因組的大小),并且可以按照各
可以使用多種方法來組裝表達盒。例如,可以應(yīng)用包括"往回切除 (chew-back),,和修復(fù)步驟在內(nèi)的重組方法,利用3,或5,核酸外切酶的活性,以 一步或多步體外組裝表達盒。或者,可以用包含來自耐輻射奇球菌 (DZewocMCCRS raA'odMrara)同源重組系統(tǒng)的酶在內(nèi)的體外重組系統(tǒng)組裝表達 盒。體內(nèi)組裝方法可能也會用到。
實施例II描述的是通過組裝三個表達盒來制備16.3kb的小鼠線粒體基因 組。實施例II中展示了 682個48-mer寡核苷酸的設(shè)計,以及將這些寡核苷酸 組裝成三個重疊的片段(表達盒)。其后按照如5VwY/z等人(20(B),見上文,中 描述的方法將寡核苦酸組裝成表達盒,為降低對合成DNA的熱損傷對該進行 了修飾。
根據(jù)一種方法,表達盒一經(jīng)組裝,則可以證實它的序列。通常期望在制 備表達盒期間,例如,在合成或組裝核酸組分的過程中,將已經(jīng)產(chǎn)生的錯誤 去除。在可以使用的糾錯方法中有;(l)修飾、標(biāo)記和/或分離錯配的核苷酸從 而可以防止擴增錯誤的方法;(2)整體糾錯方法,使用酶來識別和剪切具有已 知或未知序列的DNA中的錯配,以產(chǎn)生可將錯誤從中去除的片段,并且從中 重新組裝成余下的無錯部分;(3)定點誘變的方法;和(4)識別錯誤、從獨立的 合成拷貝中選擇無誤的部分并且將無誤部分組裝的方法,例如,通過重疊延
12伸PCR (OE-PCR)組裝。其他識別錯誤的方法包括,例如,應(yīng)用分離的錯配識 別或突變識別蛋白,雜交寡核苷酸熒光探針共軛物,電泳/DNA芯片方法,以 及使用在溶液或固相中檢測堿基接觸能力(access ability)的試劑的差異化學(xué)剪 切(differential chemical cleavage)的方法;這些方法可能會與常規(guī)方法相結(jié)合來
消除錯誤。
在一個實施方式中,將向合成基因組導(dǎo)入一個或多個識別性特征,如獨 特的序列(例如,編碼特定的符號或名稱的序列,或者,例如,使用指定給氨 基酸的字母拼寫的序列)或不破壞功能的可以識別的突變。這些有時在這里也 被稱為"水印"的序列,其不僅顯示出基因組事實上已經(jīng)是人工合成的,且使 得進行標(biāo)記和追蹤成為可能,同時也使合成基因組區(qū)別于天然存在的基因組。 基因或表達盒中經(jīng)常包含可選擇的標(biāo)記,例如藥物抗性標(biāo)記,這些標(biāo)記可以 幫助挑選包含所述基因或表達盒的核酸。這類可選擇標(biāo)記的存在也可以區(qū)分 合成基因組與天然存在的基因組。與天然存在的基因組相同,但是包含一個 或多個上述識別性標(biāo)記的合成基因組,在此有時將它們稱為與天然存在的基 因組"基本上相同"。
根據(jù)一個實施方式的合成基因組可存在于允許其發(fā)揮功能的任何環(huán)境 下。例如,合成基因組可以存在于(例如,導(dǎo)入進)這里描述的任意生物系統(tǒng), 或其他系統(tǒng)。合成基因組的功能和活性,以及修飾基因組中元件的結(jié)果,可 以在合適的生物系統(tǒng)中進行研究。此外,合適的生物系統(tǒng)使感興趣的蛋白可 以生成(例如,治療劑)。在有些實施方式中,如果提供合適的底物,那么下游 的、非蛋白質(zhì)的產(chǎn)品,如能量源(例如,氫或乙醇)也可以產(chǎn)生,例如,以商業(yè) 上有用的量產(chǎn)生。
按照各種實施方式和方法,可以應(yīng)用多種合適的生物系統(tǒng)。例如,在一 個實施方式中,將合成基因組與包含常規(guī)轉(zhuǎn)錄/翻譯偶聯(lián)系統(tǒng)的溶液接觸。在 這樣的系統(tǒng)里,核酸可能能夠自我復(fù)制,或者可能有必要補充核酸,例如定 期補充。
在另一實施方式中,將合成基因組導(dǎo)入到小泡中,使基因組被基于脂質(zhì) 的保護材料包入嚢中。在一個實施方式中,任選地在期望的細胞質(zhì)元件例如 復(fù)雜細胞器(如,核糖體)和/或小分子存在下,將合成基因組與脂質(zhì)組合物, 或者與脂質(zhì)和其他功能細胞膜成分的組合,在脂質(zhì)成分將合成基因組及其他 任選成分包入嚢中的條件下接觸,由此將合成基因組導(dǎo)入小泡。在其它實施
13方式中,將合成基因組與轉(zhuǎn)錄/翻譯偶聯(lián)系統(tǒng)接觸,進而將其包裝進基于脂質(zhì) 的小泡。在進一步的實施方式中,內(nèi)部成分自然地由脂質(zhì)材料包裹進嚢。
示例性實施方式還包括導(dǎo)入已將固有(原始)基因組的部分或全部去除的 受體細胞的合成基因組,所述受體細胞如細菌細胞。例如,可以將全部固有 基因組移除而形成影細胞(無天然功能基因組的細胞),并且可以用合成基因組 替代固有基因組?;蛘?,可以將合成基因組導(dǎo)入含有部分或全部其固有基因 組的受體細胞。隨著細胞的復(fù)制,固有(原始)基因組與合成基因組將分離,進
含合成基因組作為唯一基因組物質(zhì)的子細胞(例如,合成基因組的拷貝)。按照 各種實施方式和方法,這樣的細胞即為合成細胞,在某些特性上與受體細胞 不同,例如,核香酸序列,核苷酸來源,或者非核苷酸生化成分。
許多體外方法可以用來將基因組(合成基因組、天然基因組或二者的組合)
導(dǎo)入細胞。這些方法包括,例如,電穿孔,脂質(zhì)轉(zhuǎn)染法,使用基因槍等。在
一個實施方式中,將基因組如合成基因組固定在瓊脂中,再將瓊脂塊(agar plug) 置于脂質(zhì)體上,然后再將該脂質(zhì)體插入宿主細胞。在有些實施方式中,在導(dǎo) 入細胞前將基因組做折疊和壓縮(fold and compress)處理。將大核酸分子如細 菌基因組插入或?qū)爰毎姆椒ㄔ谶@里有時稱為染色體轉(zhuǎn)移,運輸,或移植。 按照一個實施方式,合成細胞可以包含來自該合成細胞已經(jīng)插入其中的 宿主細胞的元件,例如,部分宿主基因組,細胞質(zhì),核糖體,膜等。在另一
由這些基因產(chǎn)生的副產(chǎn)物。當(dāng)然,可以由外部提供如營養(yǎng)物質(zhì)、代謝物質(zhì)及 其他物質(zhì)以及物理條件如光和熱來促進合成細胞的生長、復(fù)制和表達。
可以改變多種示例性方法以適用于計算機介導(dǎo)模式和/或自動化(如,機器 人)的模式。應(yīng)用高通量方法,可以同時制備和/或分析許多合成基因組(包括 感興趣的合成基因組的多種組合變異體)。包括用于執(zhí)行這里描述的各種方法 的自動化系統(tǒng)。自動化系統(tǒng)允許應(yīng)用生物信息學(xué)計算^L系統(tǒng)通過選擇^4居遺 傳組分設(shè)計目的基因組,允許組裝和構(gòu)建大量的基因組及合成細胞,并且允 許自動分析它們的特征,從而對建議的設(shè)計修改進行反饋。
盡管這里描述了多種實施方式和方法,應(yīng)該理解的是它們僅作為實例呈 現(xiàn),而不局限于這些實例。另外,優(yōu)選實施方式的范圍不應(yīng)受到上述示例性 實施方式的限制。
14在前文所述和以下實施例中,全部溫度以未修正的攝氏度表示;并且除
非另有說明,全部份數(shù)和百分比均為重量份和重量百分比。 實施例
實施例1.鑒定最小基因集合中基因的支原體屬比較基因組學(xué)
支原體屬比較基因組學(xué)。目前在本發(fā)明人的數(shù)據(jù)集中的13個完整基因組 序列和2個部分基因組序列包含在芯片上的實驗體系(/" w7/co laboratory),使 用全基因組比對工具MUMMER比較支原體屬的基因組對,顯示在緊密關(guān)聯(lián) 的種如山羊支原體、蕈狀支原體羊亞種(M m;;coW^ SC)和花支原體 (M;;wp/asm"y/on/w)之間,基因組重排相對于穿過復(fù)制起點和基因組等分點的 軸是對稱的。重排基因轉(zhuǎn)錄的方向相對于復(fù)制起點幾乎總是保持一致。在其 它種的細菌中已經(jīng)觀察到了這種現(xiàn)象,但是或許從未如在山羊支原體和蕈狀 支原體羊亞種中觀察到的那樣令人驚訝(參見實施例1圖A)。這些彼此相反的 交換(reciprocal crossover)表明,從基因組一側(cè)任何大段的DNA移除都可能需 要另 一側(cè)的相似缺失來匹配,從而使復(fù)制的末端保持恒定(constant)。
實施例1圖A顯示了山羊支原體和蕈狀支原體基因組在蛋白水平的 MUMMER比較,其表明了直向同源基因的位置。交叉的圖型顯示出基因位 置相對于這兩個種的復(fù)制起點和復(fù)制末端的保守性。
核心支原體基因集合。所述13個完整基因組序列包括5個源自柔膜體綱 種系肺炎分支(pneumoniae branch of Afo〃/cw^s phylogeny)的種、4個源自人分 支(hominis branch)的基因組、3個源自蟲原體目(五"tomop/aw2ato/as)分支的基 因纟具和1個源自無膽甾原體目(A^o/ep/osmato/e力分支的基因組。對于每個完 整基因組,我們使用了 BLASTp來產(chǎn)生直向同源基因表,基于一個基因組中 的基因X對于另一個基因組中的基因Y是否具有顯著的最佳BLASTp命中結(jié) 果(hit),以及Y是否是X的最佳命中結(jié)果,則將這些基因稱為直向同源基因。 使用這些表,我們鑒定出了核心支原體基因集合,即全部13個完整測序的支 原體種所共有的那些直向同源基因。另外,這些表鑒定了三個主要支原體系 統(tǒng)樹分支的直向同源基因集合。
核心支原體基因集合大約為165個基因。通過將僅在細胞內(nèi)寄生物植原 體CP/^top/oswa 中不存在的45個基因包括在內(nèi),則可以將該集合擴展
至大約200個基因,植原體從其寄生的植物細胞質(zhì)中獲得多數(shù)基礎(chǔ)代謝產(chǎn)物。通過將在某些情況下明顯是而在其它情況下假定是的非直向同源基因考慮在 內(nèi),可以將集合進一步擴展至大約310個基因。明顯的實例包括在兩個非糖
酵解種孩支小脈>^、體(C/rea/ /asw" / "rvw附)或關(guān)節(jié)炎支>^、體(綺co/ /os附a aW/2n力Vfe)中的一種或兩種中缺失的14個基因。因為在12個完全基因組(植 原體與其它種差異太大,在這種核心集合擴展過程中通常將其忽略)中僅有一 個缺失直向同源基因,所以將額外的96個基因包括在擴展的核心基因集合 內(nèi)。僅僅基于這種13個基因組的比較基因組學(xué)分析,我們便可預(yù)測我們的模 式合成生物實驗支原體(M /WoratoWMW)將只需要大約310個基因,并且將具 有僅含大約372 kbp的基因組。
假設(shè)支原體的4個分支由于它們的高進化率和對基因損失的不同響應(yīng)而 在彼此之間具有顯著的進化趨異,我們也測定出了支原體的肺炎組、人組和 蟲原體目組的共有基因。(參見下表)。有啟發(fā)性的是對于肺炎組的5個成員(包 括生殖支原體,其是我們?yōu)閷嶒炛гw構(gòu)建所安排的平臺)考慮一個擴展的核 心基因集合。如果僅僅包括在所述5個組員基因組的至少4個中存在的那些 基因,則擴展核心集合為391個蛋白編碼基因。
由支原體所有不同的亞組共有的直向同源基因集合的大小
直向同源基因集合 生殖支原體 關(guān)節(jié)炎支原體 山羊支原體
全部支原體中的基因 165
全部支原體和枯草芽孢桿菌和產(chǎn)氣莢膜梭菌(C. 153 peryh'"gera)中的基因
除洋蔥黃植原體(O"Zo" re〃owP/y;top/cw7Ka)的全部支原體 200 中的基因
在洋蔥黃植原體中缺失的核心支原體基因 35
全部5個肺炎進化枝成員中存在的基因 294
全部5個肺炎進化枝成員中和人組中存在的基因 220
全部5個肺炎進化枝成員中和蕈樣組中存在的基因 244
全部5個肺炎進化枝成員中和植原體中存在的基因 207
全部4個人進化枝成員中存在的基因 -
全部人進化枝成員中和蕈樣組中存在的基因 -
全部人進化枝成員中和植原體中存在的基因 -
全部3個中間原體(mesoplasma)/蕈樣進化枝成員中存在的 -基因
全部蕈樣進化枝成員中和植原體中存在的基因 -
蕈樣支原體中的山羊支原體直向同源基因 -實施例2.小鼠線粒體基因組的合成
小鼠線粒體基因組是16,299 bp的環(huán)狀DNA,已對其序列進行了嚴(yán)格的 檢查。我們設(shè)計了 682個48-mer來將其裝配成三個重疊的片段;Sl (6,528 bp)、 S2 (5,328 bp)、 S3 (4,508 bp),如實施例2圖A和實施例2圖B中圖解所示。
我們通過Smith等人(2003)的方法,見上文,裝配了這三個片段中的每一 個,其中對該方法進行了修飾以降低對合成產(chǎn)物的熱損傷。上述的凝膠顯示 由一個這樣的經(jīng)修飾方法產(chǎn)生的產(chǎn)物,所述方法顯著降低了在高溫下消耗的 時間。
合成包含完整小鼠線粒體基因組的三個重疊片段說明了將PCA和PCR 結(jié)合能夠以常規(guī)方法組裝5-6 kb的DNA片段,并且證明了我們?yōu)榱私M裝細 胞基因組而構(gòu)建5 kb表達盒的計劃的有效性。
實施例3.合成生殖支原體基因組關(guān)鍵區(qū)的5kb表達盒 構(gòu)建5 kb表達盒來制備生殖支原體基因組關(guān)鍵區(qū),核糖體蛋白基因 MG149.1至MG181的合成拷貝。這個18.5 kb的區(qū)域的側(cè)翼為耐受轉(zhuǎn)位子插 入的基因(MG149和MG182)。合成了 386個48 nt的上鏈寡核苦酸和386個 48nt的下鏈寡核苦酸來覆蓋這個區(qū)域。這些核酸示于實施例3圖A。 對包含這些寡核苷酸的四個重疊片段(表達盒)進行組裝。 使用這些技術(shù),能夠構(gòu)建包含感興趣的基因集合(例如源自單細胞微生物 的最小基因組)的表達盒,例如4-6kb的表達盒,并且可以將表達盒與例如其 它種"混搭"("mix and match"),或者通過取代,例如源自其它種的取代來進 行改變,以獲得定制基因組,可將這種定制基因組導(dǎo)入用于檢測的小泡或影 細胞,如上所述??梢栽诤线m的條件下培養(yǎng)由此構(gòu)建的合成細胞以測定功能。 在功能測定之后,可以通過取代表達盒來修飾基因組,并且重復(fù)該過程直至 獲得期望的結(jié)果。
綜上所述,本領(lǐng)域技術(shù)人員能夠容易地確定本發(fā)明的關(guān)鍵特性,并且在 不背離本發(fā)明的宗旨和范圍的前體下,能夠?qū)Ρ景l(fā)明進行改變和修飾以使其 適合于多種應(yīng)用和條件,以及在最全面的范圍內(nèi)應(yīng)用本發(fā)明。前述特定實施 方式的建立僅用作說明的目的,而非作為以任何方式對本發(fā)明的范圍進行限 制。上文引用的所有申請文件、專利文獻和公開文本以及附圖中的完整公開 內(nèi)容通過引用納入本文。
1權(quán)利要求
1. 一種構(gòu)建合成基因組的方法,其包括組裝包含部分合成基因組的核酸表達盒,其中至少一個核酸表達盒是由已經(jīng)化學(xué)合成的核酸成分或由化學(xué)合成的核酸成分的拷貝構(gòu)建而來。
2. 權(quán)利要求1中的方法,其中一個或多個核酸表達盒是通過組裝大約50個核苷酸的化學(xué)合成的、重疊的寡核苷酸來制備。
3. 權(quán)利要求l中的方法,其中表達盒的長度是大約4kb到大約7kb。
4. 權(quán)利要求1中的方法,其中表達盒的長度是大約4.5kb到大約6.5kb。
5. 權(quán)利要求1中的方法,其中表達盒的長度是大約5kb。
6. 權(quán)利要求l中的方法,其中表達盒與相鄰表達盒重疊至少大約200個核香酸。
7. 權(quán)利要求l中的方法,其中合成基因組為真核細胞的細胞器。
8. 權(quán)利要求l中的方法,其中合成基因組為細菌基因組。
9. 權(quán)利要求l中的方法,其中合成基因組為最小基因組。
10. 權(quán)利要求l中的方法,其中合成基因組為最小復(fù)制基因組。
11. 權(quán)利要求1中的方法,其中合成基因組基本上與天然存在的基因組相同。
12. 權(quán)利要求l中的方法,其中合成基因組是非天然存在的基因組。
13. 權(quán)利要求1中的方法,其中一個或多個表達盒可以在合成基因組中的容易地移除或替換。
14. 權(quán)利要求1中的方法,其中全部合成基因組由已經(jīng)化學(xué)合成的核酸成分,或由化學(xué)合成的核酸成分的拷貝構(gòu)建而來。
15. 權(quán)利要求l中的方法,其中合成基因組是合成細胞基因組。
16. 權(quán)利要求15中的方法,其中全部合成細胞基因組由已經(jīng)化學(xué)合成的核酸成分,或由化學(xué)合成的核酸成分的拷貝構(gòu)建而來。
17. 權(quán)利要求1中的方法,其中合成基因組進一步包含允許目的產(chǎn)物產(chǎn)生的序列。
18. 權(quán)利要求17中的方法,其中目的產(chǎn)物是能源。
19. 權(quán)利要求14中的方法,其中全部合成基因組進一步包含允許目的產(chǎn)物產(chǎn)生的序列。
20. 段落19的方法,其中目的產(chǎn)物是能源。
21. 權(quán)利要求15中的方法,其中合成細胞基因組進一步包含允許目的產(chǎn)物產(chǎn)生的序列。
22. 權(quán)利要求21中的方法,其中目的產(chǎn)物是能源。
23. 權(quán)利要求16中的方法,其中全部合成細胞基因組進一步包含允許目的產(chǎn)物產(chǎn)生的序列。
24. 權(quán)利要求23中的方法,其中目的產(chǎn)物是能源。
25. 權(quán)利要求l中的方法,還包括合理地設(shè)計合成基因組的成分。
26. 權(quán)利要求1中的方法,還包括通過將合成基因組導(dǎo)入小泡來構(gòu)建合成細月包。
27. 權(quán)利要求15中的方法,還包括通過將合成細胞基因組導(dǎo)入小泡,任選地在對于合成細胞的復(fù)制有效的條件下導(dǎo)入,來構(gòu)建自我復(fù)制的合成細胞。
28. 權(quán)利要求26中的方法,還包括通過將合成細胞在有效產(chǎn)生目的產(chǎn)物的條件下培養(yǎng)來產(chǎn)生該目的產(chǎn)物。
29. 權(quán)利要求27中的方法,還包括通過將自我復(fù)制的合成細胞在有效復(fù)
30. 權(quán)利要求l中的方法,還包括將所述方法自動化。
31. 權(quán)利要求l中的方法,還包括合成基因組。
32. —種合成基因組。
33. 權(quán)利要求26中的方法,還包括合成細胞。
34. —種合成細胞,其包含合成基因組。
35. —種制備合成細胞的方法,其包括從微生物中將固有基因組的部分或全部移除;和以合成基因組替換固有基因組,所述合成基因組表現(xiàn)出至少一種與固有基因組不同的屬性。
36. 權(quán)利要求35中的方法,還包括合成細胞。
37. —種合成細胞,其包含一個種的微生物,其中已將部分或全部固有基因組移除;和合成基因組,其表現(xiàn)出至少一種與固有基因組不同的屬性。
38. —種方法,包括設(shè)計合成基因組;構(gòu)建合成基因組; 將合成基因組導(dǎo)入生物系統(tǒng);和 表達合成基因組。
全文摘要
本發(fā)明提供構(gòu)建一種人造基因組的方法,包括該基因組核酸片斷的制備及裝配,其中至少有一個核酸片斷是由化學(xué)合成的核酸序列構(gòu)建而來的。在一項具體實施例中,全長的合成基因組是由化學(xué)合成的核酸組分或者其副本構(gòu)建而成??梢赃\用合理的方法設(shè)計合成基因組(如,創(chuàng)建一個最小的基因組及/或在一個基因組內(nèi)優(yōu)化基因的功能)。本發(fā)明中的合成基因組可以被導(dǎo)入囊泡(如,原基因組被部分或全部移除的細菌細胞或人工合成小泡中)以制備人工細胞。合成基因組或人工細胞有多種用途,包括制備人造燃料,如氫或乙醇。
文檔編號C12N5/04GK101501207SQ200680052444
公開日2009年8月5日 申請日期2006年12月6日 優(yōu)先權(quán)日2005年12月6日
發(fā)明者J·克雷格·文特爾, 漢密爾頓·O·史密斯 申請人:J.克雷格.文特爾學(xué)院