1.高通量Miseq測(cè)序數(shù)據(jù)自動(dòng)化過(guò)濾方法,其特征在于,具體包括如下步驟:
1)輸入要進(jìn)行分析的項(xiàng)目信息步驟
格式大致為一行表示一個(gè)項(xiàng)目的信息,前面幾列的元素分別為下機(jī)編號(hào),合同編號(hào),開(kāi)題單號(hào),測(cè)序平臺(tái),樣品名稱,其中間隔符設(shè)置為制表符;
2)高通量測(cè)序數(shù)據(jù)與項(xiàng)目信息的匹配步驟
進(jìn)入Linux環(huán)境,從存儲(chǔ)數(shù)據(jù)的服務(wù)器調(diào)取測(cè)序的下機(jī)數(shù)據(jù),與原來(lái)的不同是將數(shù)據(jù)的下機(jī)編號(hào)與項(xiàng)目信息匹配;
3)對(duì)相應(yīng)項(xiàng)目的數(shù)據(jù)進(jìn)行預(yù)處理步驟
包括對(duì)于樣品名字的處理,去除引物和barcode,去嵌合體,以及質(zhì)量過(guò)濾,隨后得到數(shù)據(jù)進(jìn)行下面的統(tǒng)計(jì)分析;
4)對(duì)數(shù)據(jù)進(jìn)行初步統(tǒng)計(jì)步驟
對(duì)得到的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)得到下機(jī)數(shù)據(jù)的基本信息,主要包括原始數(shù)據(jù)量大小、Reads的數(shù)量。