本專利申請要求2014年3月24日申請的英國專利申請第1405246.8號的公約優(yōu)先權(quán)。
技術(shù)領(lǐng)域
本發(fā)明涉及用于設(shè)計和實施實驗的方法和系統(tǒng),具體地通過自動化實驗室系統(tǒng)設(shè)計和實施生物過程制造。
背景技術(shù):
當(dāng)裝配生物合成工藝時,通常對于工藝中的每個操作和部件存在多個選擇,例如使用的遺傳構(gòu)造的結(jié)構(gòu)和同一性,用于完成諸如轉(zhuǎn)化、純化等步驟的具體方案等。因此,如何設(shè)計最有效的工藝的問題是這樣一個問題:選擇一組部件和操作,以滿足設(shè)計標(biāo)準(zhǔn),例如需要輸出的最大產(chǎn)量。
在生物合成工藝中有大量的影響產(chǎn)物總產(chǎn)率的變量,例如選擇的宿主有機體,以及使用的宿主物種的具體菌株,諸如溫度、pH和氧有效性及反應(yīng)時間的物理因素,僅舉了幾個例子。因此,在多維設(shè)計空間的情形下,必須做出構(gòu)成多步工藝的合適部件和操作的選擇。在一個制造設(shè)施中的情況下工作的變量的組合經(jīng)常不能容易地被轉(zhuǎn)移到其他設(shè)施。這導(dǎo)致標(biāo)準(zhǔn)化生物過程中相當(dāng)大的困難,并代表了未來合成生物學(xué)中的主要挑戰(zhàn)。通過示例的方式,《自然》在2012的一篇報道詳述了生物技術(shù)公司Amgen的科學(xué)家通過努力僅重復(fù)了他們前些年嘗試過的53篇公開的癌癥相關(guān)研究的約11%(Begley C.G&Ellis L.M.,Nature 483,531–533(2012年3月29日)。相似地,制藥公司拜耳(Bayer)表示他們估計僅有20~25%的公開數(shù)據(jù)符合他們自己的內(nèi)部發(fā)現(xiàn)(Prinz,F.,Schlange,T.&Asadullah,K.Nature Rev.Drug Discov.10,712(2011))。
到目前為止,在設(shè)置工藝或?qū)嶒灩芫€時通?;陬I(lǐng)域中的慣例、實驗者或制造商可用的或所知,隨意做出基本的過程或?qū)嶒灥脑O(shè)計決策。生物過程設(shè)計中的決策通常根據(jù)常規(guī),或者基于實驗室或工業(yè)組織內(nèi)傳下來的手工技術(shù)。隨著時間和資源限制,這通常變得復(fù)雜,導(dǎo)致試錯的發(fā)展,其中,通過替換獨立的零件和操作,或者改變參數(shù)而調(diào)節(jié)管線,以改善開始管線的特征。這導(dǎo)致設(shè)計決策通常是次優(yōu)的,或者需要大量的資源去鑒定可能僅僅符合要求的試劑、操作和參數(shù)。因此,由于與整體的優(yōu)化策略相關(guān)的內(nèi)在不確定性,一旦確定,對工藝的改變有相當(dāng)大的制度上的阻力。
盡管有這些問題,仍然依舊開發(fā)了許多成功的生物過程,并且認(rèn)識到基于生物的制造在許多領(lǐng)域中提供巨大效益的潛力。因此,現(xiàn)有技術(shù),尤其是合成生物學(xué)中,存在如下需求:從試驗臺水平直至達(dá)到且包括工業(yè)級別生物反應(yīng)器水平提供促進實驗管線或生產(chǎn)管線的設(shè)計的方法和系統(tǒng)。具體地,需要提供可促進工藝之間對等比較的方法和系統(tǒng),以及用于定義可用于實驗設(shè)計、生物過程和制造的部件和方案的標(biāo)準(zhǔn)化的方法。為了實現(xiàn)它,現(xiàn)有技術(shù)中存在如下需要:提供可促進從試驗臺水平直至達(dá)到或包括工業(yè)規(guī)模生物反應(yīng)器的可靠實驗設(shè)計的方法和系統(tǒng)。根據(jù)文中提供的教導(dǎo),本發(fā)明的這些和其他用途、特征和優(yōu)點對本領(lǐng)域技術(shù)人員來說顯而易見。
技術(shù)實現(xiàn)要素:
本發(fā)明人通過堆疊智能和可重復(fù)使用的元件而提供了用于可復(fù)制且可擴展的生物過程工作流的方法和系統(tǒng),從而克服了與所述技術(shù)相關(guān)的問題。
根據(jù)本發(fā)明的第一方面,提供了一種執(zhí)行生物過程的方法,其中,所述方法包括:實施至少一個單元操作,并且其中,根據(jù)標(biāo)準(zhǔn)化元件結(jié)構(gòu)定義所述單元操作,所述元件結(jié)構(gòu)包括多個功能區(qū)塊,并且其中,所述區(qū)塊包括由導(dǎo)入、參數(shù)、數(shù)據(jù)、物理輸入、要求、設(shè)置和執(zhí)行步驟組成的組中的至少一種。相稱地,所述元件結(jié)構(gòu)進一步包括選自由物理輸出、分析和驗證步驟組成的組中的至少一種額外的區(qū)塊。任選擇地,所述元件結(jié)構(gòu)至少包括定義導(dǎo)入、參數(shù)、數(shù)據(jù)、物理輸入、要求、設(shè)置和執(zhí)行步驟的區(qū)塊。
在本發(fā)明具體的實施方式中,所述生物過程包括至少兩個單元操作,其中,根據(jù)標(biāo)準(zhǔn)化的元件結(jié)構(gòu)定義每個單元操作。相稱地,可按順序或平行地布置多個單元操作,以產(chǎn)生工作流。在本發(fā)明的其它實施方式中,所述至少兩個單元操作不相同。
在本發(fā)明的其它實施方式中,所述單元操作選自由以下組成的群組中:轉(zhuǎn)導(dǎo)(conversion),反應(yīng),純化,結(jié)構(gòu)組裝步驟,諸如定量產(chǎn)物、副產(chǎn)物或反應(yīng)物的檢測或分析,合成核苷酸或蛋白質(zhì)/肽,細(xì)胞培養(yǎng),孵化,限制性酶切,連接,突變,接種,溶解,轉(zhuǎn)化(transformation),提取,產(chǎn)物的調(diào)節(jié)(例如用于儲藏),以及擴增(例如關(guān)于核酸)。任選擇地,所述生物過程為制造過程和/或分析過程。相稱地,所述過程可包括至少兩個單元操作,至少一個為過程操作,并且至少一個為分析過程操作。
本發(fā)明的第二方面提供了一種計算機實施的方法,包括上述任何方法步驟。
本發(fā)明的第三方面提供了用于執(zhí)行生物過程的系統(tǒng),包括:
(i)具有處理模塊的服務(wù)器,所述服務(wù)器適于上述方法;
(ii)用于維護標(biāo)準(zhǔn)化元件的記錄的數(shù)據(jù)存儲裝置,所述處理器可訪問所述數(shù)據(jù)存儲裝置,其中,每個所述的標(biāo)準(zhǔn)化元件定義生物過程中的單元操作;以及
(iii)用于訪問所述方法的界面。
相稱地,所述數(shù)據(jù)存儲裝置為數(shù)據(jù)庫,或者其中,通過云服務(wù)提供所述數(shù)據(jù)。任選擇地,所述系統(tǒng)包括網(wǎng)站或移動裝置或計算機應(yīng)用,以訪問所述服務(wù)。通常,所述系統(tǒng)可被合并為所述實驗室信息管理系統(tǒng)(LIMS)的一部分。
本發(fā)明的第四方面提供了一種計算機可讀介質(zhì),包括數(shù)據(jù)庫,其中,所述數(shù)據(jù)庫包括多個單元操作,每個單元操作適于在生物過程中使用,并且其中,根據(jù)標(biāo)準(zhǔn)化的元件結(jié)構(gòu)定義每個單元操作,所述元件結(jié)構(gòu)包括多個功能區(qū)塊,并且其中,所述區(qū)塊包括由導(dǎo)入、參數(shù)、數(shù)據(jù)、物理輸入、要求、設(shè)置和執(zhí)行步驟組成的組中的至少一種。通常,所述元件結(jié)構(gòu)進一步包括選自由物理輸出、分析和驗證步驟組成的組中的至少一種額外的區(qū)塊。相稱地,所述元件結(jié)構(gòu)至少包括定義導(dǎo)入、參數(shù)、數(shù)據(jù)、物理輸入、要求、設(shè)置和執(zhí)行步驟的區(qū)塊。
本發(fā)明的第五方面提供了一種設(shè)備,包括上述計算機可讀介質(zhì)。在具體的實施方式中,所述設(shè)備包括一個或多個存儲器和一個或多個處理器,并且其中,所述一個或多個存儲器和所述一個或多個處理器彼此電子通信,所述一個或多個存儲器有形地編碼用于實施本發(fā)明所述方法的指令的集合。
本發(fā)明的第六方面提供了一種計算機實施的實驗設(shè)計方法,所述方法包括如下步驟:
(i)選擇所述實驗的輸入和期望輸出,其中,所述輸入包括物理輸入,并且所述輸出選自物理輸出和信息輸出的任一種或兩種;以及
(ii)確定轉(zhuǎn)變所述輸入為所述期望輸出的過程,其中,所述過程包括至少一個單元操作,并且其中所述單元操作選自包括多個潛在單元操作的數(shù)據(jù)庫;
其中,根據(jù)標(biāo)準(zhǔn)化的元件結(jié)構(gòu)定義所述單元操作,所述元件結(jié)構(gòu)包括多個功能區(qū)塊,并且其中,所述區(qū)塊包括:導(dǎo)入、參數(shù)、數(shù)據(jù)、物理輸入、要求、設(shè)置以及執(zhí)行步驟。
本發(fā)明的第七方面提供了一種設(shè)備,所述設(shè)備包括一個或多個存儲器和一個或多個處理器,并且其中,所述一個或多個存儲器和所述一個或多個處理器彼此電子通信,所述一個或多個存儲器有形地編碼用于文中所述方法的指令的集合。
附圖說明
將參照附圖進一步描述本發(fā)明,附圖中:
圖1顯示了根據(jù)本發(fā)明一個實施方式的流程圖。
圖2(a)和(b)顯示了根據(jù)本發(fā)明實施方式的示例性生物過程工作流,由顯示為包含齒形輪的方框的元件定義每個單元操作。
圖3顯示了根據(jù)本發(fā)明一個實施方式的元件的多節(jié)結(jié)構(gòu)。
具體實施方式
文中引用的全部文獻通過引用的方式全部并入。除非另外定義,文中使用的全部技術(shù)和科學(xué)術(shù)語具有與本發(fā)明所屬的技術(shù)領(lǐng)域中的普通技術(shù)人員通常理解相同的含義。
在說明本發(fā)明之前,提供數(shù)個有助于理解本發(fā)明的定義。
如文中使用,術(shù)語“包括”表示必然包含任何列舉的元素,并且任選擇地還包含其他元素。“基本上由……組成”表示必然包括任何列舉的元素,在實質(zhì)上影響所列舉元素的基本特性和新特性的元素被排除,而任選地包括其它元素?!坝伞M成”表示排除所列舉的元素之外的所有元素。由這些術(shù)語的每一個所定義的實施方式均落入本發(fā)明的范圍。
定義術(shù)語“過程”為對原材料進行的變化事件的特定順序,以獲得特定的目的或目標(biāo)。過程可導(dǎo)致原材料變成產(chǎn)物—在這個情形下,過程為“過程工藝”?;蛘?,所述過程可導(dǎo)致確定關(guān)于原材料的信息—在這個情形下,過程在性質(zhì)上可為診斷性或預(yù)防性。整個過程可以再分成依次實施的單個過程步驟,以獲得期望的結(jié)果。根據(jù)本發(fā)明的實施方式,過程為使用完整的活細(xì)胞或它們的部件獲得期望產(chǎn)物的“生物過程”(例如原核細(xì)胞或真核細(xì)胞、酶或諸如葉綠體的細(xì)胞器)。本發(fā)明的過程經(jīng)過稱為因素的過程變量。因此,過程包括一組應(yīng)用于輸入(至少包括物理輸入)的步驟,以產(chǎn)生輸出(至少包括物理輸出,例如產(chǎn)物,以及可能的附加數(shù)據(jù)輸出)。輸入可包括選自以下組成的群組的一種或多種的物理原料:試劑、細(xì)胞、細(xì)胞衍生物、細(xì)胞提取物、組織提取物、多肽、肽、蛋白質(zhì)、核酸、小分子、寡糖、多糖、聚合物分子、元件、有機鹽或無機鹽、藥類化合物、前藥以及其他任何適用于生物過程的物質(zhì)的組合物。本發(fā)明的實施方式可包括如下工藝,所述工藝涉及導(dǎo)入一種或多種基因到微生物,然后表達(dá)這些基因編碼的一種或多種蛋白質(zhì),或者通過表達(dá)不編碼蛋白的基因或?qū)λ拗鬟z傳構(gòu)成的其他改變而改變有機體的代謝過程。蛋白質(zhì)自身可為期望的產(chǎn)物,或者它作用為通路的一部分,所述蛋白質(zhì)可有助于產(chǎn)生期望的產(chǎn)物。
定義術(shù)語“單元操作”為過程中的任何步驟或子步驟,可認(rèn)為其是獨立的過程或有助于一組連續(xù)的步驟—或單元—共同用于構(gòu)成完整工藝。相稱地,單元操作可選自下面的一種或多種:轉(zhuǎn)導(dǎo),反應(yīng),純化,結(jié)構(gòu)組裝步驟,諸如定量產(chǎn)物、副產(chǎn)物或反應(yīng)物的檢測或分析,核酸測序,物理混合,離心,散布或物理涂布樣品,諸如挑取菌落的選擇性取樣樣本的亞種群,三維布置樣品成構(gòu)造矩陣,合成核苷酸或蛋白質(zhì)/肽,發(fā)酵,細(xì)胞培養(yǎng),繁殖,限制酶切,連接,突變,轉(zhuǎn)化,諸如線性回歸、序列比對或基于模型的預(yù)測的具體的計算分析,諸如層析的分離,過濾,濃縮,蒸發(fā),干燥,洗滌,提取,產(chǎn)物的調(diào)節(jié)(例如用于儲藏),以及擴增(例如關(guān)于核酸)。應(yīng)理解,上述未表示潛在單元操作的詳細(xì)清單,其通常依賴于將進行的過程的確切性質(zhì)。
術(shù)語“部件”是指在過程或單元操作中使用的任何物理元件。相稱地,部件可為反應(yīng)物、產(chǎn)物或?qū)θ魏螁卧僮鞯妮斎?、或在過程或單元操作中使用的任何一件設(shè)備或裝置。典型的部件可選自下面的一種或多種:基因或多核苷酸的變體,基因構(gòu)造,全細(xì)胞或細(xì)胞系,酶,抗體,小分子,溶液(例如緩沖液、試劑、培養(yǎng)基等),固體支持物,容器(例如反應(yīng)罐、燒瓶、載玻片,珠子或物理相互作用基底等),肽,多肽,功能性或無功能的核酸,營養(yǎng)化合物,生長因子,細(xì)胞因子,元素,諸如有機或無極陽離子或陰離子的離子物質(zhì),以及過程的環(huán)境中的氣體或蒸汽。應(yīng)理解,上述不表示潛在部件的詳細(xì)清單,其通常依賴于將進行的過程的確切性質(zhì)。
定義術(shù)語“產(chǎn)物”為過程的任何期望的物理產(chǎn)出。相稱地,產(chǎn)物可包括真核有機體或原核有機體、病毒、納米結(jié)構(gòu)、蛋白質(zhì)、多肽、多核苷酸、聚合物、組織、由所述過程生產(chǎn)的復(fù)合物或小分子。在一些過程中,產(chǎn)物實際上是信息客體,例如數(shù)字遺傳序列,破壞性或非破壞性檢測產(chǎn)生的系統(tǒng)屬性的測量。應(yīng)理解,上述不表示潛在產(chǎn)物的詳細(xì)清單,其通常依賴于將進行的過程的確切性質(zhì)。
術(shù)語“方案”是指一組用于執(zhí)行單元操作的指令。通常,所述的一組指令可為必須執(zhí)行的動作及相關(guān)參數(shù)的非詳細(xì)清單,使得方案設(shè)定一系列的變量,而其它變量通常留給用戶。方案設(shè)定的典型變量可包括對于操作的輸入的同一性和/或濃度,執(zhí)行方案各個步驟的順序和/或時機,對于方案的某些或全部步驟必須設(shè)定的物理參數(shù)的值(例如溫度、pH、氧濃度、混合速度等)、使用的裝備的特征,以及諸如在供選擇的計算模型之間選擇或計算推導(dǎo)的步驟分析技術(shù)等因素。應(yīng)理解,上述不表示方案的潛在元素的詳細(xì)清單,其通常依賴于將進行的過程的確切性質(zhì)。
文中使用術(shù)語“因素”表示任何限定的過程的特征,或者過程內(nèi)的特征,只要不改變過程的最終目的,可對其進行修改。根據(jù)本發(fā)明的一個實施方式,有兩類因素:遺傳因素和過程因素。
“過程因素”相稱地涉及與構(gòu)造或宿主的遺傳無關(guān)的過程的特征。典型的過程因素可包括裝備特征(例如反應(yīng)罐的大小、葉輪結(jié)構(gòu)、探針的設(shè)置),環(huán)境(例如溫度、pH、氧合、氣壓),方案(例如,諸如接種和誘導(dǎo)重要階段或事項的時間控制),試劑(生長培養(yǎng)基的組成、營養(yǎng)水平、給料濃度、誘導(dǎo)物濃度)、細(xì)胞的操作(儲存條件、反應(yīng)器之間接種的大小)、過程設(shè)計(過程步驟的數(shù)目、反應(yīng)鍋的類型)的特征。應(yīng)理解,上述不表示方案的潛在過程因素的詳細(xì)清單,其通常依賴于將進行的過程的確切性質(zhì)?!斑z傳因素”相稱地涉及與過程包括的任何遺傳材料相關(guān)的定性特征或定量特征,例如,諸如用于引入諸如DNA的新核酸到宿主中的具體遺傳“構(gòu)造”的特征(例如載體的同一性或組成),宿主微生物的特征(例如菌株、遺傳背景(包括敲除不需要的基因及蛋白過表達(dá),表觀遺傳因素),功能DNA的特征(例如啟動子強度,核糖體位點結(jié)合強度,質(zhì)粒的復(fù)制起點,終止子,密碼子的使用策略,操縱子、激活子,基因變異)。應(yīng)理解,上述不表示方案的潛遺傳因素的詳細(xì)清單,其通常依賴于將進行的過程的確切性質(zhì)。
無論是過程因素或者遺傳因素,認(rèn)為當(dāng)一個因素變化的影響依賴于另一個因素的值時,因素相互作用。通常,過程中指定的過程步驟—例如生物過程—可包括多個彼此相互作用的因素。因此,當(dāng)一個因素因為過程參數(shù)的變化而變化時,或者改變與因素相關(guān)的內(nèi)在特征時,可有許多的相互作用,所述相互作用將以被動的方式改變所述過程步驟中其他因素的作用。當(dāng)過程包括超過一個過程步驟時,該級聯(lián)的相互作用可導(dǎo)致相鄰的過程步驟甚至遠(yuǎn)的過程步驟的因素之間另外的相互作用。因此得出結(jié)論:認(rèn)為許多過程在性質(zhì)上是多因素的。
術(shù)語“分?jǐn)?shù)”是指對過程內(nèi)的部件、單元操作或方案對于指定目的的合適度的任何可解釋的主觀或客觀測量。相稱地,分?jǐn)?shù)可為如下形式:用戶定義的等級(例如在星、點的數(shù)目的最小值至最大值的范圍內(nèi)),等級,一部分積極評價或者顏色(例如紅綠燈排名)、或者布爾指示符(布爾指示符,例如贊(thumbs up)或踩(thumbs down)符號)。在一些實施方式中,分?jǐn)?shù)可為部件或操作的可量化或可測量特征的形態(tài),例如數(shù)量、純度、生產(chǎn)率、輸出產(chǎn)物的效率,副產(chǎn)物或存在的雜質(zhì)的數(shù)量,工藝的產(chǎn)量,以及部件或單元操作的費用、能量或時間效率。應(yīng)理解,上述不表示潛在分?jǐn)?shù)的詳細(xì)清單,其通常依賴于將進行的工程的確切性質(zhì)。
文中使用的術(shù)語“環(huán)境”是指與具體用戶相關(guān)的環(huán)境信息。用于多維評級或分?jǐn)?shù)的環(huán)境為分?jǐn)?shù)提供了值歸因于分?jǐn)?shù)的視角。應(yīng)理解,事實上當(dāng)為任何指定的單元操作提供評級時,每個用戶具有獨特的視角。環(huán)境將部分依賴于用戶可用的部件,這些部件(例如裝置、基礎(chǔ)設(shè)施)成功執(zhí)行單元操作,在過程中作為整體或與其它單元操作組合的單元操作的成功(例如與其它單元操作兼容)以及與用戶相關(guān)的任何因素變量。
文中使用的術(shù)語“元件”包括可用在生物過程中的部件、方案和/或單元操作的標(biāo)準(zhǔn)化描述。這樣,元件表示可與其它元件組合形成工藝流和管線的可重復(fù)使用的單元。根據(jù)本發(fā)明的實施方式,元件魯棒地(robustly)描述了單元操作的輸入和輸出。這同時包括信息流和物理樣本流,強類型地(strong typing)確保與其它單元操作的兼容性。通常,元件涉及指定單元操作內(nèi)的單一工作流,定義的設(shè)定物理和信息輸入正被處理成定義組的物理和信息輸出。
在本發(fā)明具體的實施方式中,可通過一個或多個計算機系統(tǒng)實施所述的方法。在本發(fā)明的另一個實施方式中,提供了計算機可讀介質(zhì),其包含用于實施本發(fā)明的方法的程序指令,其中,通過計算機系統(tǒng)的一個或多個處理器執(zhí)行程序指令,使一個或多個處理器執(zhí)行文中所述的階段。相稱地,計算機系統(tǒng)至少包括:輸入設(shè)備、輸出設(shè)備、存儲介質(zhì)和微處理器)??赡艿妮斎胙b置包括鍵盤、電腦鼠標(biāo)、觸摸屏等。輸出裝置包括電腦顯示器、液晶顯示器(LCD)、發(fā)光二極管(LED)電腦顯示器、虛擬現(xiàn)實(VR)耳機等。此外,可輸出信息給用戶、用戶界面裝置、計算機可讀存儲介質(zhì),或另一臺本地計算機或網(wǎng)絡(luò)計算機。存儲介質(zhì)包括各種類型的存儲器,例如硬盤、RAM、閃存,以及其它磁性、光學(xué)、物理或電子存儲裝置。微處理器為用于進行計算以及指引進行數(shù)據(jù)的輸入、輸出、計算和顯示的其它功能的任何典型的計算機微處理器??墒褂糜芯€或無線方式連接兩個或多個計算機系統(tǒng),并且兩個或多個計算機系統(tǒng)可彼此通信,或者與其它計算機系統(tǒng)直接以及/或者使用例如因特網(wǎng)的公開的網(wǎng)絡(luò)系統(tǒng)進行通信。計算機網(wǎng)絡(luò)允許實施儲藏在計算機系統(tǒng)中或在一個或多個計算機系統(tǒng)間本地或遠(yuǎn)程共享的發(fā)明的各個方面。在本發(fā)明的另一個實施方式中,計算機處理器可包括人工神經(jīng)網(wǎng)絡(luò)(ANN)。在本發(fā)明的其它實施方式中,所述方法可合并為實驗室信息管理系統(tǒng)(LIMS)的一部分或者與LIMS兼容的軟件集。
可配置本發(fā)明的方法與自動化實驗室裝置相互作用,并控制該自動化實驗室裝置,所述自動化實驗室裝置包括液體處理和分配裝置或者更先進的實驗室機器人系統(tǒng)。在本發(fā)明的一個實施方式中,在因素篩選階段考慮更高數(shù)目的因素時,使用高級編程語言自動進行要素的篩選試驗是一個選項,以產(chǎn)生可復(fù)制且可擴展的工作流,從而支持本發(fā)明的篩選、提煉和優(yōu)化階段。合適的高水平編程語言可包C++、JavaTM、Visual Basic、Ruby、Go和PHP,以及生物學(xué)特定語言AnthaTM(www.antha-lang.org)。
圖1為顯示用戶使用各種交互模塊設(shè)計實驗或生物過程的計算機實施平臺的流程圖。在本發(fā)明的一個實施方式中,用戶可通過用戶界面(105)訪問平臺,以訪問工作流設(shè)計工具(101)。用戶界面(105)可通過專用軟件應(yīng)用(“app”)、通過網(wǎng)站或任何其它合適的用戶界面而被包含在實驗室信息管理系統(tǒng)(LIMS)軟件包內(nèi)。工作流設(shè)計工具(101)使得用戶能夠指定考慮中的實驗或生物過程的類型,尤其是通過指定輸入(例如原材料)和期望的輸出(例如產(chǎn)物)。在定義實驗或過程的對象時,工作流設(shè)計工具(101)使得用戶能夠訪問實驗設(shè)計模塊(101a),實驗設(shè)計模塊(101a)提供分解實驗或工程為一個或多個單元操作的機制。
每個單元操作將包括一個或多個部件或一個或多個方案。在部件模塊(101b)和方案模塊(101c)內(nèi)完成上述一個或多個單元操作的最適合組件的選擇。部件模塊(101b)和方案模塊(101c)分別能夠訪問在部件表征模塊(102)和方案定義模塊(103)中包含的兼容的標(biāo)準(zhǔn)化部件和方案的庫。完全組裝工作流提供了過程管線,包括至少一個單元操作,更典型地多個單元操作,如圖2(a)和(b)中顯示的那種??蓹z測完全組裝工作流與用戶可用部件的兼容性—包括實驗室自動化設(shè)備—以在用戶特定的環(huán)境中提供對工作流的驗證??赏ㄟ^分析模塊(101d)進行驗證。任選擇地,使單元操作經(jīng)過允許比較用戶獨特環(huán)境與建議的工作流的關(guān)聯(lián)評級或評分標(biāo)準(zhǔn)。因此,工作流設(shè)計工具(101)提供了建立由用戶獨特環(huán)境部分地定義的設(shè)計空間的性能,這樣做時,僅允許組裝與用戶情景化設(shè)計空間兼容的工作流。
平臺的一個重要方面為其允許用戶修改單元操作的某些自由度,以改善與可用部件及相關(guān)方案的兼容性。有利地,這使得在設(shè)計空間內(nèi)一定水平的靈活性以及單元操作的演變,以適應(yīng)稍微不同的用戶環(huán)境。一旦用戶批準(zhǔn)了驗證的過程管線,可通過完全自動化的實驗室系統(tǒng)或通過手工實施或兩者的組合實施工作流。當(dāng)完成管線內(nèi)的單元操作時,提示實驗室自動化設(shè)備和/或用戶針對單元操作及整體的組裝管線的成功性能提供反饋指標(biāo)。反饋指標(biāo)可包括例如分?jǐn)?shù)、評級,以及關(guān)于反應(yīng)條件、產(chǎn)品收率、完成方案需要的時間、產(chǎn)物的純化等數(shù)據(jù)和信息的因素。反饋指標(biāo)可與關(guān)于過程管線信息結(jié)合,并傳遞給標(biāo)準(zhǔn)化的引擎(104)。
標(biāo)準(zhǔn)化引擎(104)提供了數(shù)據(jù)標(biāo)準(zhǔn)化的功能,包括對輸入信息標(biāo)準(zhǔn)化、重新格式化和分析,所述輸入信息包括用戶做出的管線工藝組裝和任何附加的修改,以及相關(guān)的度量和分?jǐn)?shù)。數(shù)據(jù)標(biāo)準(zhǔn)化可包括去除外部的或不相關(guān)的信息,以及標(biāo)準(zhǔn)化數(shù)據(jù)或值成常用形式或標(biāo)準(zhǔn)形式,例如通過參考查找表。在這樣做時,標(biāo)準(zhǔn)化引擎(104)轉(zhuǎn)變輸入數(shù)據(jù)為值的常見表示,從而提供一致的記錄。標(biāo)準(zhǔn)化引擎(104)可包括標(biāo)準(zhǔn)單元操作、部件或方案的數(shù)據(jù)庫。任選擇地,標(biāo)準(zhǔn)化引擎(104)不包括數(shù)據(jù)庫自身,但是在單獨的模塊(未顯示)或者在工作流設(shè)計工具(101)內(nèi)包括的一個或多個數(shù)據(jù)庫內(nèi)與數(shù)據(jù)庫通信(未顯示)。標(biāo)準(zhǔn)化引擎分別提供部件的標(biāo)準(zhǔn)表示給部件表征模塊(102)和方案定義模塊(103)。因此,計算機實施平臺提供了從標(biāo)準(zhǔn)化部件組裝單元操作的迭代工藝以及根據(jù)用戶的環(huán)境不斷改善、改編和修改的工藝。相稱地,以下面進一步描述的標(biāo)準(zhǔn)化元件結(jié)構(gòu)定義單元操作。當(dāng)多個用戶訪問平臺時,例如在多用戶云或基于因特網(wǎng)的平臺的情況下,用戶將受益于新的和/或改善的部件、方案和相關(guān)單元操作的不斷產(chǎn)生。
根據(jù)本發(fā)明的一個實施方式,工作流設(shè)計工具(101)可選擇一個或多個定義為元件的單元操作。因此,如在圖2(a)和(b)中,最終組裝的工作流中的每個單元操作由元件組成。
本發(fā)明具體的實施方式提供了實施或設(shè)計生物過程的方法—包括一個或多個實驗步驟—其中所述方法由至少一個單元操作組成,并且其中,根據(jù)標(biāo)準(zhǔn)化的元件結(jié)構(gòu)定義單元操作。圖3中顯示了根據(jù)該實施方式的元件具有基于節(jié)的格式,定義了信息以及單元操作的物理輸入和輸出。使用具有領(lǐng)域特定的詞匯的結(jié)構(gòu)化、基于文本的格式還允許使用版本控制系統(tǒng),以追蹤協(xié)議如何隨時間發(fā)展和演變,并識別那些變化是特定狀況的原因,還避免了重復(fù)的錯誤。在本發(fā)明的一個實施方式中,使用基于流的方法配置元件作為通過網(wǎng)絡(luò)的通信的微服務(wù)而被運行。
元件通常包括至少具有以下功能區(qū)塊的基于節(jié)的格式:導(dǎo)入、參數(shù)、數(shù)據(jù)、物理輸入、要求、設(shè)置以及執(zhí)行步驟。任選擇地,元件可進一步包括至少一個與物理輸出、分析和/或驗證有關(guān)的附加的部分。
導(dǎo)入(Import)區(qū)塊合適地定義了元件的名稱,并指定需要哪些另外的方案、部件或單元操作執(zhí)行所述元件。
參數(shù)(Parameter)區(qū)塊合適地定義了輸入到元件的信息。數(shù)據(jù)類型可為來自諸如Go語言或AnthaTM的高級編程語言的內(nèi)裝類型的任一種,包括整數(shù)、字符串、字節(jié)、浮點以及方案需要的指定的公制單位。在這個區(qū)塊中可包括默認(rèn)的參數(shù)。
數(shù)據(jù)(Data)區(qū)塊合適地定義了來自元件的信息輸出。雖然通常不給出默認(rèn)值,但是數(shù)據(jù)部分具有與參數(shù)塊(block)相同的格式。
輸入(Input)塊合適地定義了對方案的物理輸入以及它們的合適類型。物理輸入可包括單元操作中使用的原料和部件。
輸出(Output)區(qū)塊是任選擇的,并且可僅存在于產(chǎn)生物理產(chǎn)品的單元操作中。因此,輸出物理樣品的方案的實例可包括含DNA、酶或細(xì)胞的新的液體溶液,包含生物材料的凍干制劑,或包含生物聚合物的冷凍樣品。
在開始工作前通常由方案執(zhí)行所述要求(Requirement)塊,以允許證實任何輸入的狀態(tài)適于成功地完成單元操作。
一旦首次執(zhí)行元件,就進行設(shè)置(Setup)區(qū)塊。這可用于實施元件全面需要的任何配置,并且還用于可同時執(zhí)行的并行任務(wù)的組需要的任何特定的設(shè)置。這里也可定義階梯函數(shù)全面訪問需要的任何變量。
在步驟(Step)區(qū)塊定義本發(fā)明元件的功能核心。步驟塊描述了轉(zhuǎn)換一組輸入?yún)?shù)和樣本成輸出數(shù)據(jù)和樣本所采用的實際步驟。步驟是核函數(shù),意味著他們對于處理的每個并行樣本不共享信息,并定義了轉(zhuǎn)換一塊輸入和樣本成一組輸出的工作流。
分析(Analysis)區(qū)塊是任選擇的,并限定了如果合適,如何轉(zhuǎn)變步驟塊的結(jié)果成終值。
驗證(Validation)區(qū)塊是任選擇的,并允許限定特異檢測,以驗證元件的正確執(zhí)行,以及報告性能及宣布執(zhí)行失敗的能力。
可在本發(fā)明的備選實施方式中,區(qū)塊在元件內(nèi)的放置順序變化。此外,可組合區(qū)塊,以產(chǎn)生雙功能,并且可增加額外的區(qū)塊,以超越圖3中說明的元件集合,從而擴展功能。
通過下面的非限制實施例進一步描述本發(fā)明。
實施例
在這個實施例中,在高水平生物語言AnthaTM定義生物過程的單元操作。元件定義了Bradford檢測,Bradford檢測是用于量化物理樣本中蛋白質(zhì)的量的分子生物學(xué)檢測。
語法智能(Syntax wise)的AnthaTM是Go語言(www.golang.org)的擴展,并關(guān)注于功能地描述并發(fā)進程。工作流的任何執(zhí)行旨在描述大量的并行過程,并從操作的最小合適單元的角度描述。在該元件的情況下,即使該方案通常同時運行樣本的陣列,但是它仍然是一組動作,以處理單一物理樣本。AnthaTM系統(tǒng)的核心目標(biāo)是建立定義用于生物實驗的方案和部件的實際標(biāo)準(zhǔn)語言。因此,設(shè)計它對于用戶掩藏一些編程的細(xì)節(jié),并專注于生物。
導(dǎo)入:
AnthaTM Element開始于定義方案的名稱,在這個情形下為bradford,并列出需要的其它方案或Go庫,以執(zhí)行bradford方案。AnthaTM編譯器足夠智能,以鑒定導(dǎo)入是否為存在的Go庫,或在其它AnthaTM元件,并且顯然可從諸如Github(www.github.com)的源代碼庫直接導(dǎo)入。
參數(shù):
參數(shù)塊定義了Bradford Element的輸入信息。數(shù)據(jù)類型可為Go語言的內(nèi)裝類型的任一種,例如整數(shù)、字符串、字節(jié)、浮點,以及AnthaTM語言引入的人任何強類型的科學(xué)類型,例如公制單位。參數(shù)說明遵循下面的語法
var VariableName VariableType=OptionalDefaultValue.(OptionalUnit)For Example:
go
var ExampleVolume Volume=15.(uL)
意思是“創(chuàng)建命名為ExampleVolume的參數(shù),僅接受體積單位,默認(rèn)值為15毫升。按照慣例,在UpperCamelCase中命名變量(對于每個名字的每個字,使用大寫字母)。其他的元件可見全部的參數(shù),因此按照慣例,他們也起始于大寫字母。
ReplicateCount是特殊的變量,它告知AnthaTM運行每個樣本的ReplicateCount的其它拷貝。系統(tǒng)自動處理結(jié)果的關(guān)聯(lián),以及對工作流的影響。
ReplicateCount是特殊的變量,它告知AnthaTM運行每個樣本的ReplicateCount的其它拷貝。系統(tǒng)自動處理結(jié)果的關(guān)聯(lián),以及對工作流的影響。
數(shù)據(jù)
數(shù)據(jù)塊定義了Bradford Element的輸出信息。雖然未給出默認(rèn)值,但是宣告遵循與參數(shù)塊相同的格式。按照慣例,以大寫第一個字母命名結(jié)果,所述結(jié)果可作為其他元件的輸出被處理(consumed)。首個字母以小寫開始的變量旨在僅在方案內(nèi)使用,并且雖然對變量取對數(shù),但是它們?nèi)圆荒苡糜谌魏纹渌麬nthaTM元件。此外,它們在元件的全部執(zhí)行版本之間共享,需要仔細(xì)地考慮它們的用途,以避免并發(fā)性問題。
輸入:
輸入塊定義方案的物理輸入以及它們的合適的類型。例如,在這個塊中,全部的類型為WaterSolution,意味著它們對標(biāo)準(zhǔn)的液體處理機器或手動吸移管操作起作用。AnthaTMExecution系統(tǒng)使用物理樣本的其它屬性,以基于它們的類型策劃進行物理作用的最優(yōu)方式,例如混合樣本。
宣告語法遵循信息變量的形式,除了未聲明默認(rèn)值。
輸出:
該協(xié)議是破壞性的協(xié)議,意味著該檢測創(chuàng)建的全部的中間體和最終樣本需要在執(zhí)行方案后被破壞。然而,許多協(xié)議還輸出物理樣本,例如包含DNA、酶或細(xì)胞的新液體溶液。默認(rèn)地,計劃破壞任何未傳到輸出的物理樣本,方法適合樣本的安全水平(例如必須高壓滅菌遺傳材料等)。
要求:
Requirements{
//None
}
在開始工作前由協(xié)議執(zhí)行要求塊,以允許證實任何輸入的狀態(tài)。例如,像require(!Sample.Expired())的檢測將基于AnthaTM系統(tǒng)可獲得的樣本的類型信息,明確地證實留在受控溫度環(huán)境外部太長時間的輸入樣本尚未失效。默認(rèn)地,AnthaTM驗證例如樣本是否已經(jīng)自動失效的項目,并且首先提供這個塊,以便于驗證諸如DNA裝備方案的復(fù)雜輸入需要的某類更復(fù)雜的檢測。
設(shè)置:
一旦執(zhí)行元件,就實施設(shè)置塊。這可用于實施元件整體需要的任何配置,并且還用于定義可同時執(zhí)行的并行任務(wù)的組需要的任何特定的設(shè)置。這里也可定義Steps函數(shù)全局訪問需要的任何變量,但是需要小心處理,以避免并發(fā)性問題。
在該Bradford Element的情形下,使用Control數(shù)據(jù)庫,使得協(xié)議能夠定義一批樣本,需要該批樣本以與任何一批任務(wù)一致地實施。例如,樣本的每個96孔板需要加入一組對照對照樣本,使得能夠計算每個樣本中蛋白質(zhì)的量。在每一塊中使用多達(dá)ControlCurvePoints+1個樣本,以通過已知蛋白質(zhì)樣本的連續(xù)稀釋生成這些對照樣本。
步驟:
Steps塊定義了轉(zhuǎn)變一組輸入?yún)?shù)和樣本成輸出數(shù)據(jù)和樣本所采取的實際步驟。Steps為核函數(shù),
意味著他們對于處理的每個并行樣本不共享信息,并定義了轉(zhuǎn)變一塊輸入和樣本成一組輸出的工作流,即使Element正作用于整個陣列(例如一次性的樣本微孔板)。
在該Bradford Element中,產(chǎn)生了新的樣本,該樣本是通過混合SampleVolume量的物理輸入Sample而生成的。備注:不需要物理位置、布局或方法,因為AnthaTM Execution層負(fù)責(zé)確定執(zhí)行庫函數(shù)的性能,例如根據(jù)系統(tǒng)注冊的設(shè)備的混合函數(shù)。當(dāng)不能獲得樣本運輸或液體處理的自動方法時,其后退,并提供手動指令。
然后,傳輸新產(chǎn)生的樣本產(chǎn)物到另一個AnthaTM Element,在這個情況下代表酶標(biāo)儀(plate reader)的設(shè)備驅(qū)動程序,以對樣本進行測量。當(dāng)需要分批處理這樣的過程時(例如一次對一個板實施),實施系統(tǒng)自動管理調(diào)度樣本在共享的酶標(biāo)儀上排列。
最后,存儲酶標(biāo)儀的結(jié)果為輸出數(shù)據(jù)變量SampleAbsorbance。
分析:
如果合適,Analysis塊定義了Steps的結(jié)果如何被轉(zhuǎn)變成終值。計算Bradford檢測的最終蛋白濃度需要具有來自對照樣本的數(shù)據(jù),進行線性回歸,然后使用這些結(jié)果標(biāo)準(zhǔn)化酶標(biāo)儀的結(jié)果。
開始時,control.WaitForCompletion()是實用方法,意思是說在繼續(xù)分析前,Analysis需要等待并行控制樣本被完成處理。然后使用現(xiàn)有的用于線性回歸的Go庫進行實際的線性回歸,類似于全部的Go代碼,可完美地包含在AnthaTM中。
最后,在下游元件可訪問的ProteinConc變量中存儲最終的標(biāo)準(zhǔn)化結(jié)果(樣本中的蛋白質(zhì)濃度)
驗證:
驗證(Validation)塊允許定義特定的檢測,以核實Element的正確執(zhí)行,以及報告的性能(以及宣布執(zhí)行失敗的能力)。例如,Bradford檢測僅可處理特定線性范圍內(nèi)的濃度,因此如果樣本中蛋白質(zhì)的量大于或小于該范圍,那么檢測將失敗。
這樣情形下的解決辦法是返回檢測,具有不同的稀釋系數(shù),然而,由于Bradford Element是破壞性檢測,需要產(chǎn)生更多的原料,這也許是不可能的,阻礙了Element獨自處理這樣的錯誤。
驗證檢查可分為破壞性或非破壞性。這個實施例中進行的全部檢測是非破壞性的,因為他們僅分析了數(shù)據(jù)。然而,在其他類型的Element中,驗證檢查可能需要消耗一些樣本,例如運行質(zhì)譜追蹤(trace),并且由于僅需要進行這樣隨機的試紙條檢測,而非驗證每個樣本。可在AnthaTM Execution環(huán)境下指定策略,例如試紙條的驗證檢測。
除非另外表明,本發(fā)明的實施使用化學(xué)、計算機科學(xué)、統(tǒng)計、分子生物學(xué)、微生物、重組DNA技術(shù)和化學(xué)方法的常規(guī)技術(shù),它們在本領(lǐng)域普通技術(shù)人員能力的范圍內(nèi)。文獻中也解釋了這樣的技術(shù),例如T.Cormen,C.Leiserson,R.Rivest,2009,Introduction to Algorithms,3rd Edition,The MIT Press,Cambridge,MA;L.Eriksson,E.Johansson,N.Kettaneh-Wold,J.Trygg,C.Wikstom,S.Wold,Multi-and Megavariate data Analysis,Part 1,2nd Edition,2006,UMetrics,UMetrics AB,Sweden;M.R.Green,J.Sambrook,2012,Molecular Cloning:A Laboratory Manual,Fourth Edition,Books 1-3,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY;Ausubel,F.M.et al.(1995and periodic supplements;Current Protocols in Molecular Biology,ch.9,13,and 16,John Wiley&Sons,New York,N.Y.);B.Roe,J.Crabtree,and A.Kahn,1996,DNA Isolation and Sequencing:Essential Techniques,John Wiley&Sons;J.M.Polak and James O'D.McGee,1990,In Situ Hybridisation:Principles and Practice,Oxford University Press;M.J.Gait(Editor),1984,Oligonucleotide Synthesis:A Practical Approach,IRL Press;以及D.M.J.Lilley and J.E.Dahlberg,1992,Methods of Enzymology:DNA Structure Part A:Synthesis and Physical Analysis of DNA Methods in Enzymology,Academic Press。這些普通文本的每個通過引用合并于此。
雖然文中已經(jīng)詳細(xì)公開了本發(fā)明的具體實施方式,這已經(jīng)通過實施例的方式進行,并且僅用于描述的目的。上述實施方式不旨在限制下面所附權(quán)利要求書的范圍。發(fā)明人預(yù)期可對本發(fā)明做出各種替換、改變和修改,而不背離權(quán)利要求書限定的本發(fā)明的精髓和范圍。