一種高性能微型基因測(cè)序以及自動(dòng)化分析裝置的設(shè)計(jì)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及基因測(cè)序技術(shù),尤其涉及一種高性能微型基因測(cè)序以及自動(dòng)化分析裝置的設(shè)計(jì)方法。
【背景技術(shù)】
[0002]自從哈佛大學(xué)遺傳學(xué)家George Church 和 454 Life Sciences 公司 JonathanRothberg掀起二代測(cè)序NGS的革命以來(lái),已經(jīng)過(guò)去了將近十年。測(cè)序儀也經(jīng)歷了翻天覆地的變化,從通量,測(cè)序準(zhǔn)確度,測(cè)序周期,讀長(zhǎng)等方面都在不斷提升,應(yīng)用也越來(lái)越廣泛。如越來(lái)越多的研宄者使用測(cè)序方法進(jìn)行腫瘤研宄,或者通過(guò)外顯子測(cè)序鑒定潛在的藥物靶點(diǎn)。在診斷兒童遺傳學(xué)疾病時(shí),人們也逐漸拋開了傳統(tǒng)的診斷方法,轉(zhuǎn)而使用全外顯子組測(cè)序。目前應(yīng)用于臨床或是研宄的測(cè)序基本都還是使用大型的工廠級(jí)或是桌面級(jí)的測(cè)序儀。這就需要專業(yè)的技術(shù)人員進(jìn)行樣品采集,樣品制備,進(jìn)行上樣等操作,技術(shù)要求非常高,非專業(yè)人士難以完成。一般都是現(xiàn)在大型測(cè)序平臺(tái)上由專業(yè)人員進(jìn)行樣品預(yù)處理,并且有很高的測(cè)序成本,測(cè)序的周一一般在I周以上,數(shù)據(jù)分析需要專門導(dǎo)入高性能集群,由專職生物信息人員在Iinux系統(tǒng)下進(jìn)行分析。在測(cè)序完成后的數(shù)據(jù)上傳分析由專人負(fù)責(zé),需要再大型計(jì)算機(jī)或是高性能集群上完成。因此目前醫(yī)院等都是委托生物信息公司或是研宄機(jī)構(gòu)進(jìn)行測(cè)序以及數(shù)據(jù)的分析,分析完成后反饋報(bào)告給醫(yī)院。這樣的一套流程,有很高的技術(shù)依賴性。
【發(fā)明內(nèi)容】
[0003]為了打破這一傳統(tǒng)的測(cè)序,分析的流程,設(shè)計(jì)一套便攜式測(cè)序儀以及自動(dòng)化的分析流程非常必要,能簡(jiǎn)化測(cè)序的操作并能快速獲得分析結(jié)果。
[0004]本發(fā)明的目的是提供一套測(cè)序以及測(cè)序結(jié)果自動(dòng)化分析的裝置,該裝置要滿足測(cè)序儀體積小、操作簡(jiǎn)單等特點(diǎn)。
[0005]本發(fā)明主要包括如下流程:確定測(cè)序的設(shè)備,確定結(jié)果分析的計(jì)算機(jī)硬件平臺(tái),確定數(shù)據(jù)分析的軟件,配置分析的流程以便實(shí)現(xiàn)自動(dòng)化分析。
[0006]一種高性能微型基因測(cè)序以及自動(dòng)化分析裝置,該套設(shè)備主要包含微型的測(cè)序儀,桌面式服務(wù)器,自動(dòng)化數(shù)據(jù)分析系統(tǒng)三部分。微型測(cè)序儀選擇牛津納米孔公司的Min1n測(cè)序儀;選擇噪音小,存儲(chǔ)空間大的桌面式服務(wù)器;對(duì)于自動(dòng)化數(shù)據(jù)分析系統(tǒng),采用配置galaxy分析平臺(tái),galaxy提供了數(shù)據(jù)分析的框架平臺(tái),在該平臺(tái)上配置常見(jiàn)生物信息學(xué)軟件,并配置數(shù)據(jù)集,并且可以組建流程,方便用戶自動(dòng)化運(yùn)行。
[0007]為滿足測(cè)序以及分析量大主要任務(wù),選擇了 Min1n測(cè)序儀,該測(cè)序儀即插即用,完成樣品制備后,通過(guò)移液槍點(diǎn)樣,插入計(jì)算機(jī)即可開始測(cè)序。該測(cè)序儀類似一個(gè)U盤大小,即插即用,重約100g,非常方便攜帶,并且可以直接通過(guò)USB接口和電腦互聯(lián),非常適合改裝置設(shè)計(jì)的理念,輕巧、操作簡(jiǎn)單、便于攜帶。
[0008]使用Min1n測(cè)序儀進(jìn)行基因測(cè)序,該測(cè)序儀體積只有U盤大小,讀長(zhǎng)在Ik到5kb,3天可以測(cè)到IG的數(shù)據(jù),測(cè)序速度較快;此外樣品制備也較為簡(jiǎn)便,經(jīng)過(guò)DNA提取、打斷、末端修復(fù),ATailing和加接頭后即可上機(jī)測(cè)序;上樣后通過(guò)USB接口插入桌面式服務(wù)器即可實(shí)現(xiàn)序列的讀取。
[0009]此外,對(duì)計(jì)算設(shè)備,選擇一臺(tái)桌面式服務(wù)器,采用的是haswell處理器,128GB內(nèi)存,存儲(chǔ)空間10TB,計(jì)算性能很高。在該計(jì)算平臺(tái)下部署Iinux系統(tǒng)。系統(tǒng)基礎(chǔ)上是測(cè)序結(jié)果分析的生物信息系統(tǒng),即galaxy分析系統(tǒng)。將galaxy系統(tǒng)部署在桌面服務(wù)器,galaxy是一套開源系統(tǒng)框架,現(xiàn)在有一下公共的galaxy可選,但是大部分的平臺(tái)的數(shù)據(jù)集以及軟件都不能滿足用戶的需求,將galaxy本地化非常有必要。借助這一開源的框架,將其部署在桌面式服務(wù)器中,在該框架下配置生物信息分析的軟件,如BLAST,BffA, BOWTIE,VELVET,F(xiàn)ASTQC, SAMTOOLS,SNPTOOLS ;此外還配置人類,小鼠,擬南芥,果蠅等的數(shù)據(jù)集。完成框架搭建,軟件和數(shù)據(jù)集的配置后,用戶只需要通過(guò)瀏覽器登陸網(wǎng)頁(yè),就可以訪問(wèn)galaxy平臺(tái),在該界面下進(jìn)行數(shù)據(jù)的上傳,運(yùn)行,結(jié)果可視化顯示,結(jié)果下載,還可以將配置的軟件組合成流程,實(shí)現(xiàn)一鍵式的運(yùn)行。
[0010]本發(fā)明可以快速進(jìn)行基因測(cè)序并能進(jìn)行數(shù)據(jù)的一鍵式,可視化的分析。該套設(shè)備是由微型測(cè)序儀和計(jì)算機(jī)以及自動(dòng)化數(shù)據(jù)分析系統(tǒng)組成。不僅僅是簡(jiǎn)單的硬件或是實(shí)驗(yàn)設(shè)備的組合,該套設(shè)備具有體積小,測(cè)序速度快,計(jì)算速度快,操作簡(jiǎn)便等特點(diǎn),能夠?qū)崿F(xiàn)實(shí)時(shí)測(cè)序以及分析。測(cè)序儀的選擇不同于以往工廠級(jí)以及桌面級(jí)測(cè)序儀體積大,重量大,價(jià)格昂貴等特點(diǎn),Min1n測(cè)序儀只有U盤大小,不足100g,并且讀長(zhǎng)較長(zhǎng),測(cè)序快速,和配置的桌面級(jí)服務(wù)器相連可實(shí)現(xiàn)實(shí)時(shí)測(cè)序,實(shí)時(shí)上傳,實(shí)時(shí)自動(dòng)化一鍵式分析。
[0011]本發(fā)明將基因測(cè)序平臺(tái)和基因計(jì)算平臺(tái)進(jìn)行了整合,可以快速高效的進(jìn)行測(cè)序,不再受限與實(shí)驗(yàn)室,機(jī)房等條件,并設(shè)計(jì)了一套自動(dòng)化進(jìn)行測(cè)序數(shù)據(jù)分析的系統(tǒng),能夠一鍵式可視化的分析測(cè)序數(shù)據(jù)。
【附圖說(shuō)明】
[0012]圖1是本發(fā)明測(cè)試方法的流程圖。
【具體實(shí)施方式】
[0013]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)勢(shì)更加清晰,下面對(duì)本發(fā)明的內(nèi)容進(jìn)行更加詳細(xì)的闡述:
1)測(cè)序平臺(tái)確定:選擇體積小,測(cè)序讀長(zhǎng)長(zhǎng),速度快,成本低的Min1n測(cè)序儀,上樣后,可以直接插入服務(wù)器USB接口,直接與服務(wù)器相連,快速完成測(cè)序;
2)計(jì)算平臺(tái)確定:計(jì)算平臺(tái)選擇桌面服務(wù)器,噪音小,此外考慮到拼接計(jì)算需要較大的內(nèi)存,配置128GB內(nèi)存,10TB的存儲(chǔ)空間,haswell處理器的計(jì)算平臺(tái);
3)服務(wù)器系統(tǒng)部署:配置操作系統(tǒng),基礎(chǔ)環(huán)境,編譯器等;
4)galaxy部署:下載galaxy的源碼包,安裝基本框架,配置http服務(wù),新建集群用戶以及galaxy用戶;
5)基因計(jì)算軟件部署:在galaxy界面通過(guò)ADMIN的選項(xiàng)添加BLAST,BffA,Β0ΕΤΙΕ,VELVET, FASTAC, SAMTOOLS, SNPT00S的工具,添加完成后用戶通過(guò)網(wǎng)頁(yè)登陸galaxy,即可在可視化的界面下進(jìn)行作業(yè)的提交;6)數(shù)據(jù)集部署:配置人類,小鼠,果蠅,擬南芥等物種的參考基因組的數(shù)據(jù)集文件。
[0014]該發(fā)明提供了高性能測(cè)序以及基因分析的整體解決方案以及整套設(shè)備的實(shí)現(xiàn)方式。實(shí)現(xiàn)了隨時(shí)測(cè)序,隨時(shí)分析。該套設(shè)備可以提供生命科學(xué)客戶使用,用戶不再受限于傳統(tǒng)的工廠級(jí)或是桌面級(jí)測(cè)序儀并能和桌面式服務(wù)器直接相連,大大簡(jiǎn)化了用戶硬件配置的復(fù)雜度,并行配合測(cè)序儀的數(shù)據(jù)類型,定制化了專業(yè)的生物信息分析系統(tǒng),讓用戶輕松實(shí)現(xiàn)一鍵式的分析;該套產(chǎn)品的推出,能實(shí)現(xiàn)和用戶的緊密對(duì)接或是耦合。
【主權(quán)項(xiàng)】
1.一種高性能微型基因測(cè)序以及自動(dòng)化分析裝置,其特征在于,該裝置主要包含微型的測(cè)序儀,桌面式服務(wù)器,自動(dòng)化數(shù)據(jù)分析系統(tǒng)三部分;微型測(cè)序儀采用Min1n測(cè)序儀;選擇噪音小、存儲(chǔ)空間大的桌面式服務(wù)器;對(duì)于自動(dòng)化數(shù)據(jù)分析系統(tǒng),采用配置galaxy分析平臺(tái),galaxy提供了數(shù)據(jù)分析的框架平臺(tái),在該平臺(tái)上配置常見(jiàn)生物信息學(xué)軟件,并配置數(shù)據(jù)集,并且組建流程。
2.根據(jù)權(quán)利要求1所述的裝置,其特征在于,使用Min1n測(cè)序儀進(jìn)行基因測(cè)序,該測(cè)序儀體積只有U盤大小,讀長(zhǎng)在Ik到5kb,3天可以測(cè)到IG的數(shù)據(jù);此外樣品制備經(jīng)過(guò)DNA提取、打斷、末端修復(fù),ATailing和加接頭后即可上機(jī)測(cè)序;上樣后通過(guò)USB接口插入桌面式服務(wù)器即可實(shí)現(xiàn)序列的讀取。
3.根據(jù)權(quán)利要求1所述的裝置,其特征在于,桌面式服務(wù)器采用haswell處理器、128GB內(nèi)存、存儲(chǔ)空間1TB。
4.根據(jù)權(quán)利要求1所述的裝置,其特征在于,自動(dòng)化數(shù)據(jù)分析系統(tǒng)配置了一個(gè)開放的基于網(wǎng)頁(yè)的生物信息分析系統(tǒng)一galaxy,Galaxy是一個(gè)開源的生物信息分析框架,在其上可以部署配置分析軟件以及數(shù)據(jù)集,配置完成后用戶可以在不下載和安裝任何軟件和工具的前提下做各種生物信息學(xué)分析,并能夠記錄每一步分析過(guò)程;同時(shí)也可以根據(jù)平臺(tái)上提供的軟件組建分析流程。
【專利摘要】本發(fā)明提供一種高性能微型基因測(cè)序以及自動(dòng)化分析裝置的設(shè)計(jì)方法,涉及基因測(cè)序技術(shù)領(lǐng)域,發(fā)明主要包含微型的測(cè)序儀,桌面式服務(wù)器,自動(dòng)化數(shù)據(jù)分析系統(tǒng)三部分。微型測(cè)序儀選擇MinIon測(cè)序儀,選擇噪音小,存儲(chǔ)空間大的桌面式服務(wù)器;自動(dòng)化數(shù)據(jù)分析系統(tǒng)配置了galaxy分析平臺(tái),galaxy提供了數(shù)據(jù)分析的框架平臺(tái),在該平臺(tái)上我們配置常見(jiàn)生物信息學(xué)軟件,并配置數(shù)據(jù)集,并且可以組建流程,方便用戶自動(dòng)化運(yùn)行。
【IPC分類】G06F19-20
【公開號(hào)】CN104573406
【申請(qǐng)?zhí)枴緾N201510057863
【發(fā)明人】金蓮
【申請(qǐng)人】浪潮電子信息產(chǎn)業(yè)股份有限公司
【公開日】2015年4月29日
【申請(qǐng)日】2015年2月4日