利用云計算環(huán)境來共享生物相關(guān)數(shù)據(jù)的方法和系統(tǒng)的制作方法
【專利說明】
【背景技術(shù)】
[0001]本公開總體上涉及與生物樣品相關(guān)的數(shù)據(jù)收集和分析的領(lǐng)域。更具體地說,該公開涉及用于與云計算環(huán)境交互以共享、儲存和分析生物相關(guān)信息(例如,生物數(shù)據(jù)、協(xié)議、分析方法等)的技術(shù)。
[0002]基因測序已經(jīng)成為基因研究中越來越重要的領(lǐng)域,將來有希望用在診斷應(yīng)用和其他應(yīng)用中。一般來說,基因測序涉及確定諸如RNA或DNA片段之類的核酸的核苷酸的順序。通常分析相對較短的序列,并且可以在各種生物信息學(xué)方法中使用所得到的序列信息,以在邏輯上將多個片段配合在一起以可靠地確定基因材料(這些片段來源于該基因材料)的更廣泛的長度的序列。已經(jīng)開發(fā)了特征片段的自動化的、基于計算機(jī)的檢查,并且這些檢查最近已經(jīng)用在基因組作圖、基因及其功能的識別等中。然而,現(xiàn)有的技術(shù)極為耗費(fèi)時間,所得到的基因組信息也因而極其昂貴。
[0003]許多另選的測序技術(shù)目前正在進(jìn)行調(diào)查研究和開發(fā)之中。在若干技術(shù)中,通常將單個核苷酸或幾條核苷酸(寡核苷酸)引入并允許或促進(jìn)結(jié)合至待測序的基因材料的模板。然后可以通過對位點(diǎn)進(jìn)行成像來收集序列信息。在目前某些技術(shù)中,例如,利用熒光標(biāo)記或染料對核苷酸類型進(jìn)行標(biāo)記,所述熒光標(biāo)記或染料允許通過分析圖像數(shù)據(jù)來確定附接于具體位點(diǎn)的核苷酸的分析。盡管這種技術(shù)在顯著提高生產(chǎn)量和降低測序成本方面表現(xiàn)了良好的前景,但是需要在數(shù)據(jù)處理的速度、可靠性和效率方面進(jìn)行進(jìn)一步改進(jìn)。
[0004]例如,在使用圖像數(shù)據(jù)來評估各個位點(diǎn)的一些測序方案中,在測序的順序循環(huán)期間可能產(chǎn)生大量圖像數(shù)據(jù)。在依賴合成法測序(SBS)的系統(tǒng)中,例如,可以采用幾十個循環(huán)來將核苷酸順序地附接至各個位點(diǎn)。在每個步驟形成的圖像導(dǎo)致了巨大數(shù)量的數(shù)字?jǐn)?shù)據(jù),這些數(shù)字?jǐn)?shù)據(jù)代表高分辨率圖像中的像素。對這些圖像進(jìn)行分析來確定在過程的每個循環(huán)向每個位點(diǎn)添加了什么核苷酸。可以采用其他圖像來驗(yàn)證操作中的解塊或類似步驟。
[0005]在許多測序方案中,圖像數(shù)據(jù)對于確定每一個單獨(dú)位點(diǎn)的正常序列數(shù)據(jù)來說都比較重要。盡管一旦識別出了序列中的個別核苷酸就可以將圖像數(shù)據(jù)丟棄,但是關(guān)于圖像的一些信息,例如涉及圖像或熒光品質(zhì)的信息可以被維持以允許研究人員確認(rèn)基本標(biāo)識或調(diào)用。隨著系統(tǒng)變得能夠進(jìn)行更快速、更大規(guī)模的測序,與用于構(gòu)成基因組的各個片段的基本標(biāo)識組合的圖像品質(zhì)數(shù)據(jù)將變得笨拙。因此,在測序過程期間以及測序過程之后對這樣的數(shù)據(jù)進(jìn)行管理時需要改進(jìn)的技術(shù)。
[0006]除了在測序期間和測序之后收集的數(shù)據(jù)以外,從樣品提取到數(shù)據(jù)分析報告的基因組分析工作流程可能涉及生成大量紙基信息,諸如實(shí)驗(yàn)室跟蹤表格、用戶向?qū)б约坝糜诟櫂悠泛蛢?nèi)容信息的各種清單。所有這些紙基信息都會使用于執(zhí)行基因組分析的個人和較大實(shí)體的基因組分析工作流程復(fù)雜化。因而,在基因組分析工作流程之前、期間和之后對這些信息進(jìn)行管理時都需要一種改進(jìn)的技術(shù)。
[0007]另外,基因組分析工作流程中的一些步驟可能由于執(zhí)行這些步驟的不同個人和實(shí)體而發(fā)生很大的變化。例如,樣品制備就包括高度的多樣性(例如,在許多步驟、處理時間、以及具體基因組分析應(yīng)用所需的具體化學(xué)過程中)。此外,樣品制備在歷史上已經(jīng)是基因組分析工作流程當(dāng)中的自動化和集成化最低的部分,同時在不同用戶、不同位點(diǎn)之間包含高度變化性。因而,需要一種改進(jìn)的技術(shù)來創(chuàng)造從樣品提取到報告的更緊密集成的工作流程,同時使得基因組分析工作流程更容易為個人和較大實(shí)體訪問,從而促進(jìn)這些個人和實(shí)體之間的共享。
[0008]此外,在制備用于基因組分析(例如,以上描述的測序)的樣品中使用的一些樣品制備盒可能無法滿足用戶的一些具體需要(例如,具體應(yīng)用)。另外,生產(chǎn)率需求較低且缺乏資源的個人或?qū)嶓w可能不利用自動化樣品制備系統(tǒng)和/或?qū)S脩?yīng)用樣品制備盒,而是轉(zhuǎn)而采用自源試驗(yàn)。因而,需要提供一種可定制的樣品制備系統(tǒng)供生產(chǎn)率需求較低和/或缺乏資源的那些個人或?qū)嶓w使用自動化樣品制備系統(tǒng)。
【發(fā)明內(nèi)容】
[0009]本公開提供了一種用于將各種信息(例如,協(xié)議、分析方法、樣品制備數(shù)據(jù)、測序數(shù)據(jù)等)轉(zhuǎn)移或分配給基于云的網(wǎng)絡(luò)(例如,本地云或遠(yuǎn)程云)的新穎方案。例如,該技術(shù)涉及云計算環(huán)境,該云計算環(huán)境被構(gòu)造成從一個或多個單獨(dú)的樣品制備裝置、測序裝置和/或計算系統(tǒng)接收該信息。在【具體實(shí)施方式】中,該信息可以利用所述云計算環(huán)境來存儲和/或分析,這可以降低與儀器本身或相關(guān)計算機(jī)有關(guān)的處理和/或存儲負(fù)擔(dān)。諸如樣品制備裝置和測序裝置之類的儀器給研究人員提供了相當(dāng)數(shù)量的資本投資,并且處理負(fù)擔(dān)的減少可以使每次運(yùn)營的成本降低。另外,因?yàn)榛蚪M工作流程分析的各種步驟可以在核心實(shí)驗(yàn)室設(shè)施處執(zhí)行,因此信息的擁有者可以不在儀器的位置。如這里提供的在云計算環(huán)境中存儲信息允許獨(dú)立于位置進(jìn)行訪問和存儲以及備份存儲。因而,高產(chǎn)出的設(shè)施以及較小的實(shí)驗(yàn)室可以減少現(xiàn)場存儲客戶端數(shù)據(jù)所需的存儲器要求。
[0010]所述云計算環(huán)境還可以提供協(xié)議、分析方法、庫、序列數(shù)據(jù)的共享以及用于測序、分析和報告的分布式處理。通過所述云計算環(huán)境獲得該信息可以以應(yīng)用為中心方式促進(jìn)從樣品提取到分析數(shù)據(jù)報告的緊密集成的工作流程。具體而言,在物理基因組分析過程期間,所述云計算環(huán)境和存儲在其中的信息可以用作工作流程管理器,該工作流程管理器改變用戶如何選擇應(yīng)用(例如樣品制備應(yīng)用)和用戶如何與通過所述云計算環(huán)境可用或生成的信息交互。
[0011]另外,共享和分布式處理還允許將計算資源分配(例如眾包)到云計算環(huán)境內(nèi)的具體項目或用戶。這種實(shí)現(xiàn)方案可以通過以相對較小的成本提供訪問(例如以賬單到期即付的方式)而允許較小的實(shí)驗(yàn)室或較小的客戶端訪問信息和規(guī)模否則專為大型實(shí)驗(yàn)室所獨(dú)有的前進(jìn)數(shù)據(jù)處理平臺。另選地或附加地,這種實(shí)現(xiàn)方案能夠?yàn)閺幕蚪M分析工作流程的組件(例如,樣品制備盒)的供應(yīng)商購買產(chǎn)品提供方便的通道或入口。該云計算環(huán)境還可以方便樣品制備裝置、測序裝置和數(shù)據(jù)分析平臺之間的虛擬即插即用的交互。也就是說,樣品制備裝置和測序裝置和云計算環(huán)境的通信是相對無縫的,并且可以在沒有大量IT支持的情況下實(shí)現(xiàn)。研究人員可以放棄維護(hù)和更新運(yùn)行用于分析序列數(shù)據(jù)的專用程序的裝置的責(zé)任,因?yàn)閿?shù)據(jù)分析軟件的維護(hù)通過云監(jiān)測系統(tǒng)進(jìn)行。這種布置將用戶或客戶端側(cè)的IT資源騰出來。
[0012]所述云計算環(huán)境還可以促進(jìn)供自動樣品制備系統(tǒng)使用的可定制化樣品制備協(xié)議的開發(fā)和共享。例如,用戶可以從供應(yīng)商(例如,制造商或提供商)購買通用樣品制備盒。所述通用樣品制備盒可以例如用來將核酸樣品(例如DNA或RNA)轉(zhuǎn)換到庫進(jìn)行測序(例如,大規(guī)模平行測序)。例如,在全基因組測序、目標(biāo)重測序或具有專門目的的任何其他基因組分析中可以利用這些庫?;跇悠分苽涞哪康?,用戶開發(fā)供通用樣品制備盒使用的定制化協(xié)議。樣品制備協(xié)議可以用來驅(qū)動樣品制備儀器在特定溫度執(zhí)行每個所需步驟(例如,樣品和試劑的混合、孵化、分裂等)預(yù)定時間量。樣品制備協(xié)議(例如,優(yōu)化協(xié)議)和/或?qū)?yīng)分析方法可以被提交給云計算環(huán)境供其他用戶使用。另外,云計算環(huán)境使得能夠使用具體協(xié)議(例如由請求者或出版物中的引證)、協(xié)議的等級和協(xié)議的認(rèn)證。實(shí)際上,專用應(yīng)用盒可以由通用樣品制備盒的供應(yīng)商部分地基于所提交的協(xié)議的接收來開發(fā)。為了進(jìn)一步促進(jìn)用于通用樣品制備盒的協(xié)議的開發(fā)和共享,協(xié)議的提交者可以被貸以貸款以從供應(yīng)商購買消耗品。因而,云計算環(huán)境提供了用于共享和開發(fā)樣品制備協(xié)議和/或供通用樣品制備盒使用的分析方法的平臺。
[0013]本公開提供了一種用于共享在云計算環(huán)境中使用通用樣品制備盒制備生物樣品的協(xié)議以及監(jiān)測該協(xié)議的使用的計算機(jī)實(shí)現(xiàn)的方法。該方法可以包括:在服務(wù)器處從提交者接收在所述云計算環(huán)境上使用通用樣品制備盒進(jìn)行樣品制備的協(xié)議。該方法還可以包括監(jiān)測請求者對所述協(xié)議或所述協(xié)議使用的請求。該方法可以進(jìn)一步包括針對所述協(xié)議或所述協(xié)議的使用的至少一個請求,從所述通用樣品制備盒將購買貸款貸給所述提交者。
[0014]本公開還提供了一種用于共享使用通用樣品制備盒制備生物樣品的協(xié)議并監(jiān)測該協(xié)議的使用的系統(tǒng)。該系統(tǒng)可以包括與多個計算機(jī)系統(tǒng)通信的云計算環(huán)境。所述云計算環(huán)境可以包括至少一個服務(wù)器和至少一個處理器。所述至少一個服務(wù)器可以被構(gòu)造成與所述計算機(jī)系統(tǒng)中的至少一個計算機(jī)系統(tǒng)通信以接收和存儲利用通用樣品制備盒進(jìn)行樣品制備的協(xié)議。所述至少一個處理器可以被構(gòu)造成監(jiān)測請求者對所述協(xié)議的請求并針對該協(xié)議的至少一個請求從所述通用樣品制備盒的供應(yīng)商給所述協(xié)議的提交者貸以購買貸款。
[0015]本公開進(jìn)一步提供了一種共享使用通用樣品制備盒制備生物樣品的協(xié)議并監(jiān)測該協(xié)議的使用的系統(tǒng),該系統(tǒng)可以包括與多個計算機(jī)系統(tǒng)通信的基于云的服務(wù)器。該系統(tǒng)還可以包括存儲器組件,該存儲器組件通過所述服務(wù)器接收使用通用樣品制備盒進(jìn)行樣品制備的協(xié)議并存儲所述協(xié)議。該系統(tǒng)可以進(jìn)一步包括處理器,該處理器被構(gòu)造成:接收對所述協(xié)議中的一個或多個協(xié)議的請求;監(jiān)測所述協(xié)議中的每個協(xié)議的請求或使用次數(shù);以及針對對相應(yīng)協(xié)議的至少一個請求或相應(yīng)協(xié)議的使用從所述通用樣品制備盒的供應(yīng)商給相應(yīng)協(xié)議的提交者貸以購買貸款。
[0016]本公開還進(jìn)一步提供了一種用于在云計算環(huán)境中分析生物樣品的計算機(jī)實(shí)現(xiàn)的方法。該方法可以包括在服務(wù)器處接收樣品制備相關(guān)數(shù)據(jù)并通過處理器至少基于所述樣品制備相關(guān)數(shù)據(jù)和樣品提取日志生成樣品制備日志。該方法還可以包括在所述服務(wù)器接收樣品制備相關(guān)數(shù)據(jù)并通過所述處理器生成至少基于所述樣品制備相關(guān)數(shù)據(jù)和所述樣品提取日志生成樣品制備日志。該方法可以進(jìn)一步包括在所述服務(wù)器處接收測序相關(guān)數(shù)據(jù)并通過所述處理器至少基于所述樣品提取日志和所述測序相關(guān)數(shù)據(jù)生成運(yùn)行日志。
[0017]本公開又進(jìn)一步提供了一種分析生物樣品的系統(tǒng)。該系統(tǒng)可以包括:云計算環(huán)境,該云計算環(huán)境與多個樣品制備裝置、多個測序裝置和多個計算裝置通信。所述云計算環(huán)境可以包括至少一個服務(wù)器。所述至少一個服務(wù)器可以被構(gòu)造成與遠(yuǎn)離所述至少一個服務(wù)器的所述樣品制備裝置中的至少一個樣品制備裝置、所述測序裝置中的至少一個測序裝置和所述計算裝置中的至少一個計算裝置通信,以在樣品制備數(shù)據(jù)和測序數(shù)據(jù)生成的同時從所述至少一個樣品制備裝置接收和存儲所述樣品制備數(shù)據(jù)并從所述至少一個測序裝置接收和存儲所述序列數(shù)據(jù)。
[0018]這里通過參照由樣品制備裝置生成的樣品制備數(shù)據(jù)、由測序裝置生成的測序數(shù)據(jù)和/或關(guān)于該類型數(shù)據(jù)的生成、分析和報告的信息描述了本技術(shù)的實(shí)施方式。然而,該公開并不限于上述實(shí)施方式的優(yōu)點(diǎn)。本技術(shù)可以另選地或附加地應(yīng)用于能夠生成其他類型的高產(chǎn)出生物數(shù)據(jù)(例如微陣列數(shù)據(jù))的裝置。微陣列數(shù)據(jù)可以采取表達(dá)數(shù)據(jù)的形式,而表達(dá)數(shù)據(jù)可以由初級或二級用戶與如這里提供的云計算環(huán)境結(jié)合地進(jìn)行儲存、處理和/或訪問。其他能夠被使用的裝置包括但不限于能夠生成關(guān)于酶活動(例如酶動能)、受體配體結(jié)合(例如,結(jié)合至表位的抗體或結(jié)合至候選藥物的受體)、蛋白結(jié)合相互作用(例如,調(diào)節(jié)成分與核酸酶的結(jié)合)或細(xì)胞活性(例如,細(xì)胞結(jié)合或細(xì)胞活性化驗(yàn))的生物數(shù)據(jù)的那些裝置。
【附圖說明】
[0019]圖1是用于根據(jù)本公開的結(jié)合有云計算環(huán)境的系統(tǒng)的圖解概述;
[0020]圖2是參照圖1討論的類型的云計算環(huán)境的單個節(jié)點(diǎn)的圖解概述;
[0021]圖3是可以與參照圖1討論的類型的云計算環(huán)境結(jié)合使用的測序裝置的圖解概述;
[0022]圖4是可以與與參照圖1討論的類型的云計算環(huán)境結(jié)合使用的樣品制備裝置的圖解概述;
[0023]圖5是使樣品制備協(xié)議能夠共享和流行性監(jiān)測的基于云的計算環(huán)境的示意性概述;
[0024]圖6是在參照圖1和5討論的類型的基于云的計算環(huán)境上相對于樣品制備協(xié)議的共享和監(jiān)測提交者、請求者和供應(yīng)商的相互作用的方法的流程圖;<