本發(fā)明涉及一種色譜分析技術(shù),特別涉及一種從凝膠電泳條帶圖像中獲取DNA色譜的方法。
背景技術(shù):
平板凝膠電泳由于其在DNA片段的分離上有著較好效果,因此一直是色譜分析領(lǐng)域的一個(gè)重要手段。目前大多數(shù)的平板凝膠電泳均要人為地進(jìn)行定性分析,當(dāng)DNA片段數(shù)量較多時(shí),這種識(shí)別方法的效率會(huì)降低。
對(duì)于傳統(tǒng)的平板凝膠電泳,由于其采集圖像時(shí)是處于暗室中,且使用的相機(jī)成像質(zhì)量也較高,所以采集到的圖像噪聲小,清晰度高,但是這樣的裝置成本較高,不利于其推廣使用;對(duì)于新型的平板凝膠電泳來(lái)說(shuō),利用手機(jī)來(lái)取代相機(jī)拍攝已經(jīng)成為一種趨勢(shì),然而手機(jī)相機(jī)像素低,焦距短,成像電路較為簡(jiǎn)單,導(dǎo)致圖片成像質(zhì)量不高且存在較大噪聲。
常規(guī)的圖像處理算法在處理噪聲時(shí),會(huì)人為地添加一個(gè)閾值來(lái)進(jìn)行濾波,這種方法在成像裝置固定的情況下較為實(shí)用,然而在用手機(jī)拍照時(shí),由于有較多的隨機(jī)性因素,其圖像的噪聲分布往往會(huì)有較大差別,此時(shí)若仍然使用人工設(shè)定法來(lái)確定閾值,其濾波效果往往并不理想。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明是針對(duì)凝膠電泳定性分析存在的問(wèn)題,提出了一種從凝膠電泳條帶圖像中獲取DNA色譜的方法,該方法利用數(shù)字圖像處理算法,可自行計(jì)算灰度圖像的最佳閾值,實(shí)現(xiàn)凝膠條帶的自動(dòng)檢測(cè)。能取代人工對(duì)實(shí)驗(yàn)結(jié)果的定性分析,并且能適應(yīng)高噪聲圖像(手機(jī)圖像),以實(shí)現(xiàn)較快較好的色譜分析。
本發(fā)明的技術(shù)方案為:一種從凝膠電泳條帶圖像中獲取DNA色譜的方法,具體包括如下步驟:
1)用手機(jī)或相機(jī)采集凝膠電泳圖像,采集的數(shù)字圖像送入圖像處理算法中;
2)利用加權(quán)法將采集的真彩圖轉(zhuǎn)換為灰度圖像;
3)使用迭代法求灰度圖像的最佳閾值TN;
4)利用步驟3)所得最佳閾值TN對(duì)步驟2)的灰度圖像進(jìn)行一次濾波,增強(qiáng)圖像對(duì)比度;
5)平行于凝膠條帶的方向上提取步驟4)處理后灰度圖像的梯度信息,作為特征;
6)利用步驟5)所得灰度圖像的梯度信息對(duì)步驟4)一次濾波后的灰度圖像進(jìn)行圖像分割,即對(duì)圖像進(jìn)行二次濾波;
7)顯示結(jié)果:對(duì)步驟6)二次濾波后圖像,于平行凝膠電泳條帶方向上,分別將各像素點(diǎn)的灰度級(jí)進(jìn)行累加,并將累加后的數(shù)據(jù)進(jìn)行平滑濾波處理,最終以曲線圖形式作出“凝膠電泳DNA色譜圖”;在“凝膠電泳DNA色譜圖”上利用角點(diǎn)檢測(cè)算法獲取各個(gè)峰值點(diǎn)的位置,用最小二乘法擬合出“DNA片段大小—遷移位置”關(guān)系圖。
所述步驟3)迭代法具體步驟:設(shè)置一個(gè)初始閾值T0,T0為灰度圖像的最大灰度級(jí)與最小灰度級(jí)的平均值,然后遍歷整幅灰度圖像,利用T0將圖像的灰度級(jí)劃分為大于T0和小于T0的兩組數(shù)據(jù),記作數(shù)據(jù)集A0和B0,再求出數(shù)據(jù)集A0和B0的平均值,記為MA0,MB0, 將MA0,MB0的平均值(MA0+MB0)/2作為閾值T1;同理,利用T1將圖像的灰度級(jí)劃分為大于T1和小于T1的兩組數(shù)據(jù),記作數(shù)據(jù)集A1和B1,再求出數(shù)據(jù)集A1和B1的平均值,記為MA1,MB1,將MA1,MB1的平均值(MA1+MB1)/2作為閾值T2,以此類推,計(jì)算出T3,T4,……,TN,當(dāng)滿足條件|TN-T(N-1)|<0.1時(shí),即可求出最佳閾值TN。
所述步驟4)利用步驟3)所得最佳閾值TN對(duì)步驟2)的灰度圖像進(jìn)行一次濾波,即設(shè)步驟2)的灰度圖像數(shù)據(jù)為G,其最大灰度級(jí)為M,則增強(qiáng)后的灰度圖像數(shù)據(jù)為nG=255*(G-TN)/(M-TN),使其灰度分布從[TN,M]重新分布到[0,255]區(qū)間。
所述步驟5)平行于凝膠條帶的方向上提取步驟4)處理后灰度圖像的梯度信息,具體步驟:將平行于凝膠電泳條帶方向上的數(shù)據(jù)進(jìn)行提取,并對(duì)數(shù)據(jù)進(jìn)行一次求導(dǎo),即后一個(gè)像素點(diǎn)的灰度級(jí)減去前一個(gè)像素點(diǎn)的灰度級(jí),依次類推,最終獲得平行于條帶方向上的像素梯度信息,取絕對(duì)值后記錄至數(shù)據(jù)集D中,設(shè)步驟2)所得的灰度圖像的分辨率為m*n,則數(shù)據(jù)集D的分辨率為m*(n-1)。
所述步驟6)圖像分割具體步驟為:先找出數(shù)據(jù)集D中的最大值記為Dmax,利用公式:D1=D/Dmax將數(shù)據(jù)集D作歸一化處理;從步驟2)所得的灰度圖像中取m*(n-1)個(gè)像素點(diǎn)的數(shù)據(jù),記為G1,然后依次遍歷數(shù)據(jù)集G1與數(shù)據(jù)集D中的數(shù)據(jù),并將二者作點(diǎn)乘算,得到分割后的圖像數(shù)據(jù)Ge。
本發(fā)明的有益效果在于:本發(fā)明從凝膠電泳條帶圖像中獲取DNA色譜的方法,整個(gè)圖像處理過(guò)程自動(dòng)完成,用計(jì)算機(jī)來(lái)代替人工操作,并大大縮短了分析時(shí)間與工作量,使其最終結(jié)果更為直觀,準(zhǔn)確。適用于傳統(tǒng)的凝膠電泳成像系統(tǒng),可將其實(shí)驗(yàn)結(jié)果自動(dòng)進(jìn)行數(shù)據(jù)化處理;另外,對(duì)于新型的凝膠電泳成像裝置(如手機(jī)拍照)的缺點(diǎn),如其像素低,焦距短,成像質(zhì)量不高等,本發(fā)明方法也表現(xiàn)出較好的處理能力。
附圖說(shuō)明
圖1為本發(fā)明凝膠電泳條帶中獲取DNA色譜的方法流程圖;
圖2為本發(fā)明方法處理實(shí)例的各階段效果圖;
圖3為本發(fā)明方法處理具體實(shí)例 “凝膠電泳DNA色譜圖”;
圖4為本發(fā)明方法處理具體實(shí)例“DNA片段大小—遷移位置關(guān)系圖”。
具體實(shí)施方式
本發(fā)明方法的能夠自動(dòng)計(jì)算灰度圖像的最佳閾值并且能夠準(zhǔn)確提取圖像增強(qiáng)后的像素梯度信息。通過(guò)不斷地迭代計(jì)算使得相鄰閾值之差收斂并趨向于0,通過(guò)提取灰度圖像的像素梯度作為特征信息,最后通過(guò)識(shí)別信息作 “凝膠電泳DNA色譜圖”以及“DNA片段大小—遷移位置關(guān)系圖”。
如圖1所示凝膠電泳條帶中獲取DNA色譜的方法流程圖,本方法的流程分為7個(gè)步驟。其中,步驟2,3,4,5,6構(gòu)成了本發(fā)明關(guān)鍵的圖像特征自動(dòng)識(shí)別的過(guò)程。下面對(duì)7個(gè)步驟分別加以簡(jiǎn)要說(shuō)明:
1、凝膠電泳圖像的采集:實(shí)驗(yàn)人員主要利用手機(jī)進(jìn)行拍照,并將采集到的數(shù)字圖像送入圖像處理算法中。
2、 真彩圖轉(zhuǎn)灰度圖:加權(quán)法轉(zhuǎn)換,分別為真彩圖的紅色分量R,綠色分量G,以及藍(lán)色分量B設(shè)置加權(quán)系數(shù)分別為a,b,c,利用加權(quán)法將真彩圖轉(zhuǎn)換為灰度圖像,其中a,b,c的取值范圍為[0,1]且滿足a+b+c=1,然后進(jìn)行圖像處理。
3、迭代法求閾值:迭代法是基于逼近的思想,不斷地調(diào)整閾值的大小直至相鄰兩個(gè)閾值近乎相等,自動(dòng)計(jì)算圖像的最佳閾值。
設(shè)置一個(gè)初始閾值T0,T0為灰度圖像的最大灰度級(jí)與最小灰度級(jí)的平均值,然后遍歷整幅灰度圖像,利用T0將圖像的灰度級(jí)劃分為大于T0和小于T0的兩組數(shù)據(jù),記作數(shù)據(jù)集A0和B0,再求出數(shù)據(jù)集A0和B0的平均值,記為MA0,MB0, 將MA0,MB0的平均值(MA0+MB0)/2作為閾值T1;同理,利用T1將圖像的灰度級(jí)劃分為大于T1和小于T1的兩組數(shù)據(jù),記作數(shù)據(jù)集A1和B1,再求出數(shù)據(jù)集A1和B1的平均值,記為MA1,MB1,將MA1,MB1的平均值(MA1+MB1)/2作為閾值T2,以此類推,計(jì)算出T3,T4,……,TN,當(dāng)滿足條件|TN-T(N-1)|<0.1時(shí),即可求出最佳閾值TN。
4、濾波后對(duì)比度增強(qiáng):自動(dòng)對(duì)圖像灰度值進(jìn)行調(diào)整,增強(qiáng)圖像對(duì)比度。
確定閾值后,利用閾值TN對(duì)圖像進(jìn)行一次濾波, 對(duì)濾波后圖像的對(duì)比度進(jìn)行增強(qiáng),設(shè)原灰度圖像數(shù)據(jù)為G,其最大灰度級(jí)為M,則增強(qiáng)后的灰度圖像數(shù)據(jù)為nG=255*(G-TN)/(M-TN),使其灰度分布從[TN,M]重新分布到[0,255]區(qū)間。
5、特征提?。鹤鳛槟z電泳圖像條帶識(shí)別的關(guān)鍵,提取其像素梯度,作為特征點(diǎn),找出灰度變化顯著的區(qū)域。
將平行于凝膠電泳條帶方向上的數(shù)據(jù)進(jìn)行提取,并對(duì)數(shù)據(jù)進(jìn)行一次求導(dǎo),即后一個(gè)像素點(diǎn)的灰度級(jí)減去前一個(gè)像素點(diǎn)的灰度級(jí),依次類推,最終獲得平行于條帶方向上的像素梯度信息,取絕對(duì)值后記錄至數(shù)據(jù)集D中,設(shè)步驟2所得的灰度圖像的分辨率為m*n,則數(shù)據(jù)集D的分辨率為m*(n-1)。
6、圖像分割:即對(duì)圖像進(jìn)行二次濾波,可在一次濾波的基礎(chǔ)上有效的過(guò)濾掉剩余噪聲,從而獲得凝膠條帶的有效信息。
先找出數(shù)據(jù)集D中的最大值記為Dmax,利用公式:D1=D/Dmax將數(shù)據(jù)集D作歸一化處理;從步驟2所得的灰度圖像中取m*(n-1)個(gè)像素點(diǎn)的數(shù)據(jù),記為G1,然后依次遍歷數(shù)據(jù)集G1與數(shù)據(jù)集D中的數(shù)據(jù),并將二者作點(diǎn)乘算,得到分割后的圖像數(shù)據(jù)Ge。
7、顯示結(jié)果:圖像分割完畢后,于平行凝膠電泳條帶方向上,分別將各像素點(diǎn)的灰度級(jí)進(jìn)行累加,并將累加后的數(shù)據(jù)進(jìn)行平滑濾波處理,最終以曲線圖形式作出“凝膠電泳DNA色譜圖”;在“凝膠電泳DNA色譜圖”上利用角點(diǎn)檢測(cè)算法獲取各個(gè)峰值點(diǎn)的位置,用最小二乘法擬合出“DNA片段大小—遷移位置”關(guān)系圖。
對(duì)得到的圖像數(shù)據(jù)Ge進(jìn)行遍歷,于平行凝膠電泳條帶方向上,分別將各像素點(diǎn)的灰度級(jí)進(jìn)行疊加,得到一組1行n列的數(shù)據(jù)S,再對(duì)S進(jìn)行平滑濾波,即以某個(gè)點(diǎn)為中心,取其相鄰3個(gè)點(diǎn)的平均值為來(lái)代替該點(diǎn)的取值,最終根據(jù)新數(shù)據(jù)以曲線圖形式作“凝膠電泳DNA色譜圖”,并在“凝膠電泳DNA色譜圖”上利用角點(diǎn)檢測(cè)算法獲取各個(gè)峰值點(diǎn)的位置,用最小二乘法擬合出“DNA片段大小—遷移位置關(guān)系圖”。
實(shí)例:在對(duì)50bp的DNA ladder的瓊脂糖凝膠電泳上使用了本發(fā)明。Ladder的片段大小分別為50bp,100bp,150bp,250bp,300bp,350bp,400bp,450bp,500bp,600bp,700bp,800bp,900bp,1500bp,圖像處理結(jié)果如圖2各階段效果圖。
(1)圖像采集:用手機(jī)采集已經(jīng)分離好的凝膠電泳圖像,手機(jī)相機(jī)為300萬(wàn)像素。
(2)真彩圖轉(zhuǎn)為灰度圖:根據(jù)加權(quán)法,使各分量在轉(zhuǎn)換后的灰度圖中占比為R:0.1;G:0.75;B:0.15,其中R,G,B分別為紅色,綠色及藍(lán)色分量。
(3)求灰度圖像最佳閾值:利用迭代法對(duì)50bp的DNA ladder的瓊脂糖凝膠電泳圖像進(jìn)行計(jì)算,自動(dòng)獲取其最佳閾值。
(4)對(duì)比度增強(qiáng):一次濾波后,由于原灰度圖像的直方圖分布變窄,為了方便特征提取,對(duì)圖像作對(duì)比度增強(qiáng)處理。
(5)特征提?。?0bp的DNA ladder在電泳過(guò)程中條帶沒(méi)有變形且條帶間的距離也較大,在于條帶間有較強(qiáng)的熒光背景,所以適合提取相關(guān)信息。
(6)圖像分割:二次濾波后,可將條帶間的熒光背景噪聲濾除。
(7)顯示結(jié)果:將步驟(6)中的圖像信息作進(jìn)一步處理,并作出“凝膠電泳DNA色譜圖”及“DNA片段大小—遷移位置關(guān)系圖”并將二者關(guān)系用曲線進(jìn)行擬合。
凝膠電泳DNA色譜圖見(jiàn)附圖3。從圖中可以看到,各個(gè)DNA片段的表現(xiàn)形式均為一個(gè)峰值信號(hào),相對(duì)于原圖像來(lái)說(shuō),該方法獲得的圖像更為直觀;不難發(fā)現(xiàn),當(dāng)DNA片段小于500bp時(shí),其片段大小與遷移距離是呈線性關(guān)系,其線性擬合的結(jié)果見(jiàn)附圖4。圖中y=kx+d表示DNA片段長(zhǎng)度與遷移距離(像素坐標(biāo))的擬合直線,其中y表示DNA片段長(zhǎng)度,x表示遷移距離(像素坐標(biāo)),k表示直線的斜率,d表示直線在y軸上的截距,R為y與x的相關(guān)系數(shù)。