本發(fā)明涉及DNA測(cè)序分析領(lǐng)域,尤其涉及一種根據(jù)相似度預(yù)先分組的DNA測(cè)序圖像處理系統(tǒng)。
背景技術(shù):
在DNA測(cè)序技術(shù)領(lǐng)域,焦磷酸測(cè)序技術(shù)(pyrosequencing),是由Nyren等人于1987年發(fā)展起來(lái)的一種新型的酶級(jí)聯(lián)測(cè)序技術(shù),其可重復(fù)性和精確性能與Sanger法DNA測(cè)序技術(shù)相媲美,而速度卻大大提高。
整體操作流程描述如下:DNA樣品通過(guò)破碎后,應(yīng)用建庫(kù)試劑進(jìn)行加接頭、單鏈捕獲、結(jié)合至微球、微乳液PCR擴(kuò)增、破乳液,獲得建立在微球上的DNA文庫(kù),應(yīng)用加樣板將文庫(kù)和測(cè)序反應(yīng)需要的酶等鋪放至具有微反應(yīng)池的測(cè)序芯片,測(cè)序芯片和測(cè)序試劑安裝至主機(jī)上,通過(guò)控制計(jì)算機(jī)根據(jù)模塊數(shù)量和位置啟動(dòng)測(cè)序程序,自動(dòng)化進(jìn)行測(cè)序反應(yīng),產(chǎn)生的數(shù)據(jù)傳輸至數(shù)據(jù)分析計(jì)算機(jī),完成測(cè)序后應(yīng)用計(jì)算分析軟件進(jìn)行圖像處理、序列讀出、質(zhì)量分析、序列拼接等工作,最終得到DNA樣本的序列信息。微反應(yīng)池測(cè)序芯片是測(cè)序反應(yīng)的載體,載有測(cè)序模板的DNA Beads及各種測(cè)序反應(yīng)用酶均位于刻有微反應(yīng)池的測(cè)序芯片中。
在實(shí)際的DNA測(cè)序的過(guò)程中,要求測(cè)序儀在試劑供應(yīng)、測(cè)序反應(yīng)過(guò)程中應(yīng)具有連續(xù)、可控的特性,并且;最終測(cè)序芯片的反應(yīng)過(guò)程及結(jié)果通過(guò)CCD相機(jī)進(jìn)行拍照獲取,CCD相機(jī)的控制系統(tǒng)通過(guò)對(duì)采集的連續(xù)的圖像判定堿基的類(lèi)型,A,T,C,G,由此確定最紅的DNA序列,但控制系統(tǒng)在分析時(shí),往往只對(duì)當(dāng)前的片段進(jìn)行截取分析,難以對(duì)間斷的片段進(jìn)行比較判定,因此準(zhǔn)確性不高。
鑒于上述缺陷,本發(fā)明創(chuàng)作者經(jīng)過(guò)長(zhǎng)時(shí)間的研究和實(shí)踐終于獲得了本創(chuàng)作。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種根據(jù)相似度預(yù)先分組的DNA測(cè)序圖像處理系統(tǒng),用以克服上述技術(shù)缺陷。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種根據(jù)相似度預(yù)先分組的DNA測(cè)序圖像處理系統(tǒng),包括:
反應(yīng)芯片,其上通過(guò)待測(cè)序的液體,并與反應(yīng)芯片內(nèi)的反應(yīng)液進(jìn)行反應(yīng);
CCD相機(jī),其設(shè)置在DNA測(cè)序儀一側(cè)用來(lái)獲取測(cè)序芯片上的反應(yīng)信息的圖像;
還包括與CCD相機(jī)連接并獲取拍攝的圖片信息的CCD相機(jī)獲取模塊;所述的CCD相機(jī)獲取模塊按照預(yù)設(shè)的程序獲取存儲(chǔ)在CCD相機(jī)內(nèi)的圖像信息;
信號(hào)分組模塊,其將CCD相機(jī)獲取模塊的信息按照相似度將各個(gè)堿基的圖像信息分別分組獲取并存儲(chǔ),在進(jìn)行分組時(shí),所述的信號(hào)分組模塊將各個(gè)堿基的時(shí)序進(jìn)行記載,數(shù)據(jù)格式按照獲取矩陣(p,q,f),其中,p表示各個(gè)堿基圖像的時(shí)間序列,q表示堿基的圖像拍攝信息,f表示某一堿基類(lèi)型;
堿基識(shí)別模塊,其將信號(hào)分組模塊獲取的各堿基信息與標(biāo)準(zhǔn)的堿基圖像信息進(jìn)行比對(duì),并且,將不符合的堿基圖像信息,分別傳輸至信號(hào)分組模塊中,由信號(hào)分組模塊重新進(jìn)行分組,重新進(jìn)行識(shí)別比對(duì);
堿基排序模塊,在堿基識(shí)別完全后,所有數(shù)據(jù)傳輸至堿基排序模塊中,并按照獲取矩陣(p,q,f)中的時(shí)間序列重新排列各個(gè)堿基信息;
還包括序列生成模塊,所述的序列生成模塊,將堿基排序模塊排序的各個(gè)堿基信息與CCD相機(jī)獲取圖像的順序一一比對(duì),完全一致時(shí),輸出堿基序列;在不一致時(shí),所述的堿基排序模塊重新進(jìn)行排序,然后輸出。
進(jìn)一步地,所述的信號(hào)分組模塊,對(duì)每一時(shí)刻的堿基信息進(jìn)行分類(lèi),獲取矩陣信息(p,q,f),其中,p表示各個(gè)堿基圖像的時(shí)間序列,q表示堿基的圖像拍攝信息,f表示某一堿基類(lèi)型;p,q,f分別通過(guò)獲取的電流值進(jìn)行判定;
所述的信號(hào)分組模塊,根據(jù)下述公式對(duì)相似度進(jìn)行判定;
式中,X1表示第一組重合度值,p1,q1,f1分別表示第一組單位時(shí)間內(nèi)的時(shí)間序列,堿基的圖像拍攝信息,某一堿基類(lèi)型;∑表示求和運(yùn)算,T表示均方差運(yùn)算,I表示積分運(yùn)算,上述公式采用均方差和積分運(yùn)算統(tǒng)計(jì)單位時(shí)間內(nèi)的電流情況;
所述的信號(hào)分組模塊內(nèi)有一額定重合度閾值X0;所述的信號(hào)分組模塊將所述計(jì)算所得的兩兩重合度值絕對(duì)值差值與額定重合度閾值X0進(jìn)行比對(duì),若實(shí)際重合度絕對(duì)值小于閾值,則確定按照相同的堿基完成分類(lèi)。
進(jìn)一步地,所述的堿基識(shí)別模塊,獲取所述DNA圖譜的第一像素和第二像素,其中,第一像素A為目標(biāo)像素,第一像素的灰度值大于或等于初始分割閾值T0,像素總數(shù)為N;第二像素B為背景像素,第二像素的灰度值小于初始分割閾值T0,像素總數(shù)為M;圖譜f(i,j)的最大值為Vmax,最小值為Vmin
其中,T0=1/2(Vmin+Vmax) (4);
計(jì)算第一像素和第二像素的灰度均值的全局閾值T;
若方差在預(yù)設(shè)范圍內(nèi),則以T為全局閾值對(duì)所述圖譜進(jìn)行分割。
進(jìn)一步地,所述的堿基排序模塊采用電流逆向修復(fù)的方式,對(duì)時(shí)間間隔t內(nèi)的信號(hào)進(jìn)行采樣,時(shí)間間隔t內(nèi),平均分配為N2個(gè)區(qū)間,在每個(gè)區(qū)間內(nèi)選擇M2個(gè)完整的波形,在每一周期內(nèi)選擇間斷的X2個(gè)點(diǎn),記錄每個(gè)點(diǎn)的瞬時(shí)電流值i0;
按照預(yù)設(shè)的參數(shù)對(duì)該信號(hào)進(jìn)行修正發(fā)送至所述排序電路;生成排序后的信號(hào)波形。
進(jìn)一步地,堿基排序模塊,對(duì)選擇的每個(gè)點(diǎn)進(jìn)行修正,按下述公式(6)進(jìn)行修正;
im=ρ×i0 (6)
其中,im表示修正后的采樣點(diǎn)的瞬時(shí)電流值,ρ表示修正系數(shù),i0表示采樣點(diǎn)的瞬時(shí)電流值;修正系數(shù)ρ按下述公式(7)計(jì)算,其值在0.95-1之間;
式中,ρ表示修正系數(shù),i01和i02表示排序時(shí),同一堿基序列處的兩個(gè)點(diǎn)的瞬時(shí)電流采樣值,N表示采樣次數(shù),k表示采樣序列。
本發(fā)明提供一種根據(jù)相似度預(yù)先分組的DNA測(cè)序圖像處理系統(tǒng),本發(fā)明在對(duì)各個(gè)圖像信息進(jìn)行處理時(shí),并不是按照?qǐng)D像獲取的先后順序與標(biāo)準(zhǔn)堿基圖像進(jìn)行比對(duì),而是預(yù)先將相似信息的圖像進(jìn)行分組集中進(jìn)行比對(duì),最后通過(guò)時(shí)序的先后順序堿基重新進(jìn)行排序,最終輸出堿基信息。該處理方法節(jié)約程序資源,便于集中進(jìn)行比對(duì),并且,比對(duì)結(jié)果的輸出便于排序處理。
堿基排序模塊,通過(guò)對(duì)上述堿基排序模塊獲取的比對(duì)后的堿基序列信息進(jìn)行適當(dāng)?shù)男拚?,保證對(duì)同一堿基的信號(hào)具有高度的同一性,在輸出排序完好的堿基序列時(shí),信號(hào)穩(wěn)定,不會(huì)產(chǎn)生信號(hào)傳輸?shù)奈蓙y,防止因信號(hào)傳輸及處理造成測(cè)試結(jié)果的偏差。
附圖說(shuō)明
圖1為本發(fā)明的根據(jù)相似度預(yù)先分組的DNA測(cè)序圖像處理系統(tǒng)的結(jié)構(gòu)示意圖。
具體實(shí)施方式
以下結(jié)合附圖,對(duì)本發(fā)明上述的和另外的技術(shù)特征和優(yōu)點(diǎn)作更詳細(xì)的說(shuō)明。
請(qǐng)參閱圖1所示,為本發(fā)明的DNA測(cè)序的圖像的磁珠提取裝置的結(jié)構(gòu)示意圖,本發(fā)明系統(tǒng)包括:
反應(yīng)芯片,其上通過(guò)待測(cè)序的液體,并與反應(yīng)芯片內(nèi)的反應(yīng)液進(jìn)行反應(yīng);
CCD相機(jī),其設(shè)置在DNA測(cè)序儀一側(cè)用來(lái)獲取測(cè)序芯片上的反應(yīng)信息的圖像;
還包括與CCD相機(jī)連接并獲取拍攝的圖片信息的CCD相機(jī)獲取模塊;所述的CCD相機(jī)獲取模塊按照預(yù)設(shè)的程序獲取存儲(chǔ)在CCD相機(jī)內(nèi)的圖像信息;
信號(hào)分組模塊,其將CCD相機(jī)獲取模塊的信息按照相似度將各個(gè)堿基的圖像信息分別分組獲取并存儲(chǔ),在進(jìn)行分組時(shí),所述的信號(hào)分組模塊將各個(gè)堿基的時(shí)序進(jìn)行記載,數(shù)據(jù)格式按照獲取矩陣(p,q,f),其中,p表示各個(gè)堿基圖像的時(shí)間序列,q表示堿基的圖像拍攝信息,f表示某一堿基類(lèi)型;
堿基識(shí)別模塊,其將信號(hào)分組模塊獲取的各堿基信息與標(biāo)準(zhǔn)的堿基圖像信息進(jìn)行比對(duì),并且,將不符合的堿基圖像信息,分別傳輸至信號(hào)分組模塊中,由信號(hào)分組模塊重新進(jìn)行分組,重新進(jìn)行識(shí)別比對(duì);
堿基排序模塊,在堿基識(shí)別完全后,所有數(shù)據(jù)傳輸至堿基排序模塊中,并按照獲取矩陣(p,q,f)中的時(shí)間序列重新排列各個(gè)堿基信息。
還包括序列生成模塊,所述的序列生成模塊,將堿基排序模塊排序的各個(gè)堿基信息與CCD相機(jī)獲取圖像的順序一一比對(duì),完全一致時(shí),輸出堿基序列;在不一致時(shí),所述的堿基排序模塊重新進(jìn)行排序,然后輸出。
本發(fā)明在對(duì)各個(gè)圖像信息進(jìn)行處理時(shí),并不是按照?qǐng)D像獲取的先后順序與標(biāo)準(zhǔn)堿基圖像進(jìn)行比對(duì),而是預(yù)先將相似信息的圖像進(jìn)行分組集中進(jìn)行比對(duì),最后通過(guò)時(shí)序的先后順序堿基重新進(jìn)行排序,最終輸出堿基信息。該處理方法節(jié)約程序資源,便于集中進(jìn)行比對(duì),并且,比對(duì)結(jié)果的輸出便于排序處理。
所述的信號(hào)分組模塊,對(duì)每一時(shí)刻的堿基信息進(jìn)行分類(lèi),獲取矩陣信息(p,q,f),其中,p表示各個(gè)堿基圖像的時(shí)間序列,q表示堿基的圖像拍攝信息,f表示某一堿基類(lèi)型;p,q,f分別通過(guò)獲取的電流值進(jìn)行判定;
所述的信號(hào)分組模塊,根據(jù)下述公式對(duì)相似度進(jìn)行判定。
式中,X1表示第一組重合度值,p1,q1,f1分別表示第一組單位時(shí)間內(nèi)的時(shí)間序列,堿基的圖像拍攝信息,某一堿基類(lèi)型;∑表示求和運(yùn)算,T表示均方差運(yùn)算,I表示積分運(yùn)算。上述公式采用均方差和積分運(yùn)算統(tǒng)計(jì)單位時(shí)間內(nèi)的電流情況。
式中,X2表示第二組重合度值,p2,q2,f2分別表示第二組單位時(shí)間內(nèi)的時(shí)間序列,堿基的圖像拍攝信息,某一堿基類(lèi)型;∑表示求和運(yùn)算,T表示均方差運(yùn)算,I表示積分運(yùn)算。上述公式采用均方差和積分運(yùn)算統(tǒng)計(jì)單位時(shí)間內(nèi)的電流情況。
式中,X3表示第三組重合度值,p3,q3,f3分別表示第三單位時(shí)間內(nèi)的時(shí)間序列,堿基的圖像拍攝信息,某一堿基類(lèi)型;∑表示求和運(yùn)算,T表示均方差運(yùn)算,I表示積分運(yùn)算。上述公式采用均方差和積分運(yùn)算統(tǒng)計(jì)單位時(shí)間內(nèi)的電流情況。
所述的信號(hào)分組模塊內(nèi)有一額定重合度閾值X0;所述的信號(hào)分組模塊將所述計(jì)算所得的兩兩重合度值絕對(duì)值差值與額定重合度閾值X0進(jìn)行比對(duì),若實(shí)際重合度絕對(duì)值小于閾值,則確定按照相同的堿基完成分類(lèi)。
若所述實(shí)際重合度絕對(duì)值差值大于閾值,則斷定其中兩組的重合度超標(biāo);將所有計(jì)算所得實(shí)際重合度分別與額定重合度閾值X0進(jìn)行比對(duì),若均大于額定重合度閾值X0,則斷定為不同的堿基類(lèi)型,需要重新進(jìn)行分組。
所述的堿基識(shí)別模塊,獲取所述DNA圖譜的第一像素和第二像素,其中,第一像素A為目標(biāo)像素,第一像素的灰度值大于或等于初始分割閾值T0,像素總數(shù)為N;第二像素B為背景像素,第二像素的灰度值小于初始分割閾值T0,像素總數(shù)為M;圖譜f(i,j)的最大值為Vmax,最小值為Vmin
其中,T0=1/2(Vmin+Vmax) (4);
計(jì)算第一像素和第二像素的灰度均值的全局閾值T;
若方差在預(yù)設(shè)范圍內(nèi),則以T為全局閾值對(duì)所述圖譜進(jìn)行分割。
通過(guò)上述公式(5)對(duì)所述中心點(diǎn)進(jìn)行融合處理,融合處理后,對(duì)分割后的圖像,分別按照像素關(guān)系進(jìn)行比對(duì),通過(guò)獲得第一像素和第二像素,計(jì)算第一像素和第二像素的灰度均值的全局閾值T;對(duì)所述中心點(diǎn)進(jìn)行融合處理,以獲得融合后的磁珠中心點(diǎn)。運(yùn)行時(shí)間短,對(duì)圖像配準(zhǔn)效果好,提高對(duì)反應(yīng)芯片的圖像識(shí)別后,對(duì)圖像識(shí)別的準(zhǔn)確性,進(jìn)而精確對(duì)堿基類(lèi)型的判定。避免了常規(guī)圖譜中圖像模糊不清,磁珠漏查的情況。并且,識(shí)別算法簡(jiǎn)單,速率快,提高了磁珠識(shí)別率。
所述的堿基排序模塊采用電流逆向修復(fù)的方式,對(duì)時(shí)間間隔t內(nèi)的信號(hào)進(jìn)行采樣,時(shí)間間隔t內(nèi),平均分配為N2個(gè)區(qū)間,在每個(gè)區(qū)間內(nèi)選擇M2個(gè)完整的波形,在每一周期內(nèi)選擇間斷的X2個(gè)點(diǎn),記錄每個(gè)點(diǎn)的瞬時(shí)電流值i0。
按照預(yù)設(shè)的參數(shù)對(duì)該信號(hào)進(jìn)行修正發(fā)送至所述排序電路;生成排序后的信號(hào)波形。
堿基排序模塊,對(duì)選擇的每個(gè)點(diǎn)進(jìn)行修正,按下述公式(6)進(jìn)行修正;
im=ρ×i0 (6)
其中,im表示修正后的采樣點(diǎn)的瞬時(shí)電流值,ρ表示修正系數(shù),i0表示采樣點(diǎn)的瞬時(shí)電流值;修正系數(shù)ρ按下述公式(7)計(jì)算,其值在0.95-1之間。
式中,ρ表示修正系數(shù),i01和i02表示排序時(shí),同一堿基序列處的兩個(gè)點(diǎn)的瞬時(shí)電流采樣值,N表示采樣次數(shù),k表示采樣序列。
堿基排序模塊,通過(guò)對(duì)上述堿基排序模塊獲取的比對(duì)后的堿基序列信息進(jìn)行適當(dāng)?shù)男拚WC對(duì)同一堿基的信號(hào)具有高度的同一性,在輸出排序完好的堿基序列時(shí),信號(hào)穩(wěn)定,不會(huì)產(chǎn)生信號(hào)傳輸?shù)奈蓙y,防止因信號(hào)傳輸及處理造成測(cè)試結(jié)果的偏差。
上述詳細(xì)說(shuō)明是針對(duì)本發(fā)明其中之一可行實(shí)施例的具體說(shuō)明,該實(shí)施例并非用以限制本發(fā)明的專(zhuān)利范圍,凡未脫離本發(fā)明所為的等效實(shí)施或變更,均應(yīng)包含于本發(fā)明技術(shù)方案的范圍內(nèi)。