技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明屬于基因工程技術(shù)領(lǐng)域,公開了一種基于新一代測序數(shù)據(jù)的Indel檢測方法,包括:利用bwa比對軟件對原始的fastq數(shù)據(jù)做比對,生成sam文件;對二維點根據(jù)設(shè)定的閾值進行層次聚類;對hang.sam文件中的每一對reads,取出未正常比對的read;將read和截取下來的參考序列做比對即可確定變異類型,變異位置,以及變異大??;利用哈希結(jié)構(gòu)來存儲變異;對于某個變異,根據(jù)測序的覆蓋度設(shè)置閾值。本發(fā)明通過聚類確定一個變異的范圍,提取Split?read與變異范圍內(nèi)的參考序列進行比對,使得比對的過程變得簡單、范圍更加精確;使用層次聚類,突破提前設(shè)置聚類個數(shù)的限制,操作簡單。
技術(shù)研發(fā)人員:袁細國;許向彥;楊利英;張軍英;白俊
受保護的技術(shù)使用者:西安電子科技大學
技術(shù)研發(fā)日:2017.05.25
技術(shù)公布日:2017.10.03