国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      采用演化算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位方法

      文檔序號(hào):6428619閱讀:178來源:國知局
      專利名稱:采用演化算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于生物醫(yī)學(xué)圖像處理及生物醫(yī)學(xué)儀器技術(shù)領(lǐng)域,具體涉及一種采用演化算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位方法。
      背景技術(shù)
      基因芯片技術(shù)已被廣泛地應(yīng)用于疾病診斷,藥物篩選等。基因芯片圖像分析是應(yīng)用基因芯片技術(shù)的一個(gè)重要環(huán)節(jié)。一幅基因圖像一般有多個(gè)基因區(qū)子圖像組成,每個(gè)基因區(qū)又有多個(gè)基因點(diǎn)組成。一般來說,基因芯片圖像分析包含三部分基因芯片圖像預(yù)處理、 基因芯片圖像基因點(diǎn)分割和基因點(diǎn)數(shù)據(jù)提取與分析?;蛐酒瑘D像在獲取和/或掃描過程中一般會(huì)受到一些噪聲污染?;蛐酒瑘D像預(yù)處理就是采用濾波的方法將這些引入的噪聲去掉。常用的濾波方法有中值濾波,均值濾波,和低通濾波等等。不同濾波方法各有其優(yōu)缺點(diǎn)。基因芯片圖像基因點(diǎn)定位一般需先對(duì)基因芯片圖像進(jìn)行網(wǎng)格定位?;蛐酒瑘D像網(wǎng)格定位是基因芯片圖像基因點(diǎn)定位的關(guān)鍵一步。它將基因芯片圖像中所有基因點(diǎn)進(jìn)行網(wǎng)格定位從而可進(jìn)一步將所有基因點(diǎn)數(shù)據(jù)提取與分析。網(wǎng)格定位一般分兩步。第一步基因區(qū)網(wǎng)格定位。第二步對(duì)每一基因區(qū)中基因點(diǎn)進(jìn)行網(wǎng)格定位。常用的基因芯片圖像基因點(diǎn)網(wǎng)格定位方法可分為三類手動(dòng)、半自動(dòng)、和全自動(dòng)方法。對(duì)于一規(guī)則的基因芯片圖像,它的基因區(qū)及基因點(diǎn)分布一般為已知值且規(guī)則分布,因而一般可手工選取基因區(qū)的區(qū)域,然后在該區(qū)域內(nèi)按已知基因點(diǎn)分布規(guī)則地將該基因區(qū)內(nèi)基因點(diǎn)進(jìn)行網(wǎng)格定位。如有差錯(cuò),再手工進(jìn)行一些局部微調(diào)。由于基因芯片圖像數(shù)量巨大并且每一基因芯片圖像含有上千數(shù)量的基因點(diǎn)。從而手動(dòng)非常耗時(shí),不實(shí)用。常用的自動(dòng)網(wǎng)格定位法有Liu Yan,Zhang Yong-de, and Sha Xian-zheng, Automatic Recognition of Microarray Images Using Projection Algorithm,4th International Conference on Bioinformatics and Biomedical Engineering,2010, Page(s) :1-4和胡園園,孫嘯等.基于圖像投影的基因芯片圖像網(wǎng)格定位.生物醫(yī)學(xué)工程學(xué)雜志,22 (4),2005年,第668-671頁中所述的圖像投影法,邵桂芳,張倩,許三耀,羅林開,基于啟發(fā)式原理的基因芯片圖像自動(dòng)網(wǎng)格定位,2010中國模式識(shí)別大會(huì),2010,第1-5 頁提出的基于啟發(fā)式的自動(dòng)網(wǎng)格定位,聶桂軍,王加俊等.基于爬山法的cDNA基因芯片圖像自動(dòng)劃格算法.南京工業(yè)職業(yè)技術(shù)學(xué)院學(xué)報(bào),W2),2009年,第42-46頁和Rueda L, Vidyadharan V. AHill-Climbing Approach for Automatic Gridding of cDNA Microarray Images. IEEE/ACM Transactions on Computational Biology andBioinformatics, 3 (1),2006,Pages :72-83提出的基于爬山法的自動(dòng)網(wǎng)格定位,Roberth Irata Jr., Juniorb Arrera, Ronaldof Hashimoto, and Daniel Dantas, Microarray Gridding by Mathematical Morphology, 2001 Proceedings of XIV Brazilian Symposium on Computer Graphics and Image Processing, 2001, Page (s) :112-119 提出的基于遺傳算法的網(wǎng)格定位算法等等。
      圖像投影法通過基因芯片圖像在水平和垂直方向的投影來對(duì)基因芯片圖像進(jìn)行網(wǎng)格定位。先針對(duì)基因區(qū)進(jìn)行定位,再對(duì)每一基因區(qū)中的基因點(diǎn)進(jìn)行網(wǎng)格定位。這種方法適用于規(guī)則分布的基因芯片圖像。在實(shí)際中,基因芯片圖像中并不都是規(guī)則的。操作及掃描過程形成的基因芯片圖像可能不規(guī)則。如基因芯片圖像中某一基因區(qū)可能被旋轉(zhuǎn)了一定的角度。單純地采用圖像投影法不能很好地對(duì)基因芯片圖像中旋轉(zhuǎn)后的基因區(qū)中的基因點(diǎn)進(jìn)行網(wǎng)格定位。需要對(duì)該基因區(qū)進(jìn)行一定角度旋轉(zhuǎn)校正,再采用圖像投影法對(duì)該基因區(qū)中基因點(diǎn)進(jìn)行網(wǎng)格定位?;趩l(fā)式的自動(dòng)網(wǎng)格定位方法假定基因點(diǎn)行列間分布是等間隔的,沒有變形的圖像。在此前提下,基因芯片圖像網(wǎng)格定位的關(guān)鍵是確定第一條線和線與線之間的間隔距離,然后采用了啟發(fā)式自動(dòng)搜索方法來對(duì)基因芯片圖像進(jìn)行自動(dòng)網(wǎng)格定位。這種方法同樣不適用于處理不規(guī)則的旋轉(zhuǎn)過后的基因芯片圖像。對(duì)于旋轉(zhuǎn)了的不規(guī)則基因芯片圖像可采用半自動(dòng)和自動(dòng)網(wǎng)格定位。半自動(dòng)基因芯片圖像網(wǎng)格定位一般采用在基因芯片圖像上人工確定兩點(diǎn)。依據(jù)這兩點(diǎn)來計(jì)算旋轉(zhuǎn)角度并將基因芯片圖像進(jìn)行旋轉(zhuǎn)得到規(guī)則的圖像。爬山法則是一種局部?jī)?yōu)化算法,從而基于爬山法的自動(dòng)網(wǎng)格定位很容易陷入局部最優(yōu)?;谶z傳算法的自動(dòng)網(wǎng)格定位算法通過對(duì)標(biāo)準(zhǔn)模板進(jìn)行變形來與基因芯片圖像進(jìn)行匹配,并采用遺傳算法來自動(dòng)尋找最佳標(biāo)準(zhǔn)模板變形參數(shù)。李興珊,孫嘯,袁春偉,基于遺傳算法的基因芯片圖像網(wǎng)格定位,生物物理學(xué)報(bào),第18 卷,第2期,2006年6月,第223-2 頁中假定了基因芯片圖像僅含有單一的基因區(qū),并且假定基因區(qū)內(nèi)所有基因點(diǎn)均勻規(guī)則地分布在基因區(qū)內(nèi)。另外采用了二值遺傳算法,既變形參數(shù)為二進(jìn)制表示。如旋轉(zhuǎn)角度由7位二進(jìn)制數(shù)表示,位移值由4位二進(jìn)制數(shù)表示,從而算法的精度有限。

      發(fā)明內(nèi)容
      本發(fā)明目的在于提供一種采用演化算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位方法, 解決了現(xiàn)有技術(shù)中難以對(duì)基因芯片圖像基因點(diǎn)進(jìn)行自動(dòng)定位或者定位精度不佳等問題。為了解決現(xiàn)有技術(shù)中的這些問題,本發(fā)明提供的技術(shù)方案是一種采用演化算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位方法,其特征在于所述方法包括以下步驟(1)獲取基因芯片圖像,然后在基因芯片圖像中確定基因區(qū)網(wǎng)格定位時(shí)對(duì)整幅圖像進(jìn)行旋轉(zhuǎn)操作的旋轉(zhuǎn)點(diǎn),采用演化算法找到旋轉(zhuǎn)角度后,先對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正,然后通過圖像投影法對(duì)基因芯片圖像進(jìn)行基因區(qū)網(wǎng)格定位;(2)基因芯片圖像基因區(qū)網(wǎng)格定位后提取所有基因區(qū),依次采用演化算法進(jìn)行基因芯片圖像的基因區(qū)內(nèi)基因點(diǎn)網(wǎng)格定位并輸出。優(yōu)選的,所述演化算法選自粒子群優(yōu)化算法、實(shí)數(shù)值遺傳算法、演化規(guī)則算法。優(yōu)選的,所述粒子群優(yōu)化算法包括以下步驟A)先初始化一組解;B)評(píng)估這組解;C)對(duì)每一解,如解的評(píng)估值比記錄的最好值好,則將當(dāng)前的解的評(píng)估值記為最好值;如果它的評(píng)估值比記錄的所有解的最好值還好,則將這一評(píng)估值記錄為所有解的最好評(píng)估值;D)依據(jù)公式⑴、(2)對(duì)每一粒子進(jìn)行迭代;vid = w*vid+Cl*rld (pid-xid)+c2*r2d* (pgd-xid)(1);xid = xid+vid(2);Ε)如已達(dá)最大設(shè)置的迭代次數(shù),則終止算法,輸出找到的最好解;否則轉(zhuǎn)去第B)

      少;其中將第i個(gè)解記為(xn,xi2,...,xin),解的飛行速度記為Vi= (Vil,Vi2,..., Vin),它的具有最好評(píng)估值的位置記為Pi = (Pil,Pi2,.. .,Pin),其中η為問題的維數(shù),所有解中擁有最好評(píng)估值的粒子的下標(biāo)記為g,每個(gè)解按照公式(1)和( 進(jìn)行飛行,一代一代迭代計(jì)算;w,C1,和C2為加速度常數(shù),如W = 0.729,C1 = c2 = 1.49445 ;rld和r2d為(0,1)之間的隨機(jī)數(shù)。其中Vid為第i個(gè)粒子的第d個(gè)速度分量;Pid為第i個(gè)粒子所搜索到的當(dāng)前最優(yōu)解的第d個(gè)分量;Xid為第i個(gè)粒子的第d個(gè)位置分量;Pgd為整個(gè)群體所搜索到的當(dāng)前最優(yōu)解的第d個(gè)位置分量。優(yōu)選的,當(dāng)使用粒子群優(yōu)化算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位時(shí),步驟(1) 中采用粒子群優(yōu)化算法尋找旋轉(zhuǎn)角度,其中步驟B)解的評(píng)估按照如下步驟進(jìn)行I)對(duì)每一解,依據(jù)解所表示的旋轉(zhuǎn)角度對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正;II)對(duì)旋轉(zhuǎn)校正過的圖像進(jìn)行水平和垂直方向的投影;III)對(duì)能進(jìn)行基因區(qū)網(wǎng)格定位的圖像賦予大的評(píng)估值,并且網(wǎng)格間距越大,評(píng)估值越大;旋轉(zhuǎn)后不能進(jìn)行基因區(qū)網(wǎng)格定位的圖像則賦予較小的評(píng)估值;通過如上步驟評(píng)估每一解,采用粒子群優(yōu)化算法找到旋轉(zhuǎn)角度,然后對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正。優(yōu)選的,當(dāng)使用粒子群優(yōu)化算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位時(shí),步驟(2) 中采用粒子群優(yōu)化算法進(jìn)行基因芯片圖像的基因區(qū)內(nèi)基因點(diǎn)網(wǎng)格定位,其中步驟B)解的評(píng)估包括如下步驟(i)對(duì)基因芯片圖像的基因區(qū)圖像進(jìn)行旋轉(zhuǎn)校正,然后將旋轉(zhuǎn)校正過后的基因芯片圖像的基因區(qū)依據(jù)已知行列數(shù)進(jìn)行均勻行列分格,每一格的中心暫定為一基因點(diǎn)的中心;(ii)對(duì)每一基因點(diǎn)的中心依據(jù)解所表示的對(duì)應(yīng)于每一基因點(diǎn)χ和y方向值對(duì)每一基因點(diǎn)中心作X和y方向微調(diào);(iii)在每一中心依據(jù)解所表示的半徑作圓形成每一基因點(diǎn)的范圍;(iv)在所有基因點(diǎn)內(nèi)包含信息的像素越多和在所有基因點(diǎn)外包含信息的像素越少,則該解的評(píng)估值越大,否則越??;通過上述步驟評(píng)估每一解,采用粒子群優(yōu)化算法尋找到的最佳解將基因區(qū)內(nèi)的基因點(diǎn)網(wǎng)格定位。本發(fā)明優(yōu)選采用粒子群優(yōu)化算法能對(duì)這種具有不完全規(guī)則的基因芯片圖像中的基因點(diǎn)進(jìn)行自動(dòng)定位,通過粒子群優(yōu)化算法在一維空間上獲得基因芯片圖像的旋轉(zhuǎn)角度, 通過獲得的旋轉(zhuǎn)角度對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正;然后在旋轉(zhuǎn)后的基因芯片圖像上進(jìn)行基因點(diǎn)的網(wǎng)格定位。根據(jù)基因芯片圖像每個(gè)基因區(qū)依據(jù)的已知行列數(shù)進(jìn)行均勻行列分格,將每一格的中心暫定為基因點(diǎn)的中心;然后采用演化算法確定基因點(diǎn)的圓半徑和基因點(diǎn)的中心的偏移量;通過尋找最優(yōu)解獲得基因區(qū)內(nèi)的基因點(diǎn)定位位置信息。由于在實(shí)際應(yīng)用中,許多掃描獲取的基因芯片圖像存在一定程度的變形(如旋轉(zhuǎn),位移),基因區(qū)內(nèi)基因點(diǎn)分布間距也不會(huì)完全等距,會(huì)有一定的偏差。本發(fā)明將基因點(diǎn)的定位問題分成兩步第一步對(duì)基因芯片圖像中基因區(qū)進(jìn)行定位;第二步分別對(duì)每一基因區(qū)中的基因點(diǎn)進(jìn)行定位。每一步都將網(wǎng)格定位問題表示為一個(gè)優(yōu)化問題,然后采用粒子群優(yōu)化方法確定基因芯片圖像中網(wǎng)格定位信息。一般來說,在確定的一段時(shí)間內(nèi)要處理的一批基因芯片圖像的基因區(qū)及基因點(diǎn)的排列是相同并已知的?;蛐酒瑘D像基因點(diǎn)定位方法要確定的是所有基因區(qū)及基因區(qū)基因點(diǎn)的位置信息。本發(fā)明采用的粒子群優(yōu)化算法屬于一種演化計(jì)算技術(shù)。它是通過模仿一群鳥尋找食物而產(chǎn)生的一種優(yōu)化算法。它與其它演化計(jì)算算法一樣,是一種基于一組解的迭代方法, 而不像傳統(tǒng)優(yōu)化算法如爬山法那樣是基于單一解的迭代算法。在粒子群算法中,每一解又稱為一粒子。一組粒子在所要求解問題的解空間中飛行。每一粒子記錄它飛行過程中至今為止所飛行軌跡中最好的位置(對(duì)優(yōu)化問題則是至今為止所表示的最好的解)。每一粒子朝著自己最好的位置和所有同伴中最好的位置隨機(jī)地飛行。統(tǒng)計(jì)意義上,這組粒子將會(huì)飛向越來越好的區(qū)域,從而能在有限的時(shí)間內(nèi)尋找到足夠好的解。采用粒子群優(yōu)化尋找最優(yōu)解的兩個(gè)關(guān)鍵因素是解的表征和解的評(píng)估。在基因芯片圖像基因點(diǎn)定位問題中就是確定所有基因點(diǎn)的位置信息,所以它的一個(gè)解可用所有基因點(diǎn)的位置信息來表征?;蛐酒瑘D像中基因點(diǎn)可以通過直角坐標(biāo)來確定,每個(gè)點(diǎn)都有X和 y坐標(biāo)值。所以粒子群優(yōu)化得到的每個(gè)解由2倍基因點(diǎn)數(shù)量個(gè)實(shí)數(shù)值組成。粒子(及解) 是隨機(jī)地朝著自己最好的位置和所有同伴中最好的位置飛行,從而需要能評(píng)估每一解(粒子)的好壞。當(dāng)某一解表征的基因點(diǎn)位置為基因芯片圖像中真實(shí)的基因點(diǎn)位置信息時(shí),該解具有最好的評(píng)估值。而某一解表征的基因點(diǎn)位置與基因芯片圖像中真實(shí)的基因點(diǎn)位置信息完全不符合時(shí),該解具有很差的評(píng)估值。粒子群算法的任務(wù)就是引導(dǎo)一組初始化時(shí)隨機(jī)產(chǎn)生的解朝著越來越好的區(qū)域飛行,最終找到所需要的解,既基因芯片圖像的所有基因點(diǎn)的真實(shí)位置信息。本發(fā)明中每一解(粒子)依據(jù)公式(1)和(2)飛行,既一代一代迭代。公式如下vid = w*vid+Cl*rld* (pid-xid)+c2*r2d* (pgd-xid)(1);xid = xid+vid(2);如已達(dá)最大設(shè)置的迭代次數(shù),則終止算法,輸出找到的最好解;否則繼續(xù)尋找下一解。然而,當(dāng)基因芯片圖像的基因點(diǎn)定位問題可轉(zhuǎn)化為在多維的解空間中尋找一最優(yōu)解問題(既所有個(gè)基因點(diǎn)的定位信息)時(shí),這會(huì)帶來一高維空間優(yōu)化問題不適合直接采用粒子群算法求解因?yàn)榱W尤核惴ㄍ渌莼惴皞鹘y(tǒng)優(yōu)化算法一樣具有“維數(shù)的詛咒” 的問題一一即問題求解的難度隨問題的維數(shù)指數(shù)增長(zhǎng)。因而本發(fā)明將這一問題分成兩步來解決第一步對(duì)基因區(qū)進(jìn)行優(yōu)化網(wǎng)格定位,第二步再對(duì)每一基因區(qū)的基因點(diǎn)進(jìn)行定位;這樣可以減少求解的難度。第一步、基因區(qū)網(wǎng)格定位
      對(duì)基因芯片圖像進(jìn)行基因區(qū)網(wǎng)格定位可先對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正,再采用圖像投影法。將旋轉(zhuǎn)角度作為要尋找的解,采用粒子群算法求解這個(gè)一維問題。對(duì)每一解的評(píng)估采用如下步驟a)依據(jù)解所表示的旋轉(zhuǎn)角度對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正;b)對(duì)旋轉(zhuǎn)校正過的圖像進(jìn)行水平和垂直方向的投影;c)對(duì)能進(jìn)行基因區(qū)網(wǎng)格定位的圖像賦予大的評(píng)估值,并且網(wǎng)格間距越大評(píng)估值相對(duì)來說越大;旋轉(zhuǎn)后不能進(jìn)行基因區(qū)網(wǎng)格定位的圖像則賦予較小的評(píng)估值;通過粒子群算法找到旋轉(zhuǎn)角度后,先對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正,然后通過圖像投影法對(duì)圖像進(jìn)行基因區(qū)網(wǎng)格定位。第二步、依次對(duì)基因區(qū)內(nèi)基因點(diǎn)定位對(duì)每一基因區(qū)基因點(diǎn)定位依據(jù)下列步驟a)先對(duì)基因區(qū)圖像進(jìn)行旋轉(zhuǎn)校正;b)再對(duì)旋轉(zhuǎn)校正過后的基因區(qū)圖像依據(jù)已知行列數(shù)進(jìn)行均勻行列分格,每一格的中心暫定為一基因點(diǎn)的中心;c)對(duì)每一基因點(diǎn)的中心作些微調(diào),并以該中心作半徑r的園,該園所對(duì)應(yīng)區(qū)域則為該基因點(diǎn)的位置及大小。從以上步驟可看出對(duì)每一基因區(qū)基因點(diǎn)定位需找到以下信息旋轉(zhuǎn)校正角度大小、每一基因點(diǎn)的中心位置的χ和y方向的微調(diào)值、每一基因點(diǎn)的半徑。然后采用粒子群優(yōu)化算法來尋找旋轉(zhuǎn)校正角度大小、每一基因點(diǎn)的中心位置的X和y方向的微調(diào)值、每一基因點(diǎn)的半徑的最佳解。每一解的評(píng)估依據(jù)以下步驟a)依據(jù)每一解所表示的旋轉(zhuǎn)角度對(duì)基因區(qū)圖像進(jìn)行旋轉(zhuǎn)校正;b)對(duì)旋轉(zhuǎn)校正過后的基因區(qū)圖像依據(jù)已知行列數(shù)進(jìn)行均勻行列分格,每一格的中心暫定為一基因點(diǎn)的中心;c)對(duì)每一基因點(diǎn)的中心依據(jù)解所表示的對(duì)應(yīng)于每一基因點(diǎn)χ和y方向值對(duì)每一基因點(diǎn)中心作X和y方向微調(diào);d)在每一中心依據(jù)解所表示的半徑作圓形成每一基因點(diǎn)的范圍;e)在所有基因點(diǎn)內(nèi)包含信息的像素越多和在所有基因點(diǎn)外包含信息的像素越少, 則該解的評(píng)估值越大,否則則越小。這樣通過粒子群算法尋找到的最佳解就將基因區(qū)內(nèi)的基因點(diǎn)定位。相對(duì)于現(xiàn)有技術(shù)中的方案,本發(fā)明的優(yōu)點(diǎn)是不同于已有方法,本發(fā)明所采用基于粒子群優(yōu)化的基因芯片圖像基因點(diǎn)自動(dòng)定位方法能對(duì)變形的基因芯片圖像的基因區(qū)及每一基因區(qū)內(nèi)基因點(diǎn)進(jìn)行自動(dòng)定位。由于將定位問題分兩步走,從而可將圖一所示類型的高維(圖一所以為9600維)優(yōu)化問題分解為兩類低維優(yōu)化問題(1維基因區(qū)網(wǎng)格定位問題和48個(gè)相同202維基因區(qū)內(nèi)基因點(diǎn)網(wǎng)格定位問題)。因而采用的粒子群優(yōu)化算法效果更好,解的精確度更高。本發(fā)明優(yōu)化算法可采用其它演化計(jì)算算法如實(shí)數(shù)值遺傳算法、演化規(guī)則算法等來替代粒子群優(yōu)化算法。


      下面結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步描述
      圖1為本發(fā)明實(shí)施例采用的基因芯片圖像;圖2為本發(fā)明實(shí)施例采用粒子群算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位方法的流程圖。
      具體實(shí)施例方式以下結(jié)合具體實(shí)施例對(duì)上述方案做進(jìn)一步說明。應(yīng)理解,這些實(shí)施例是用于說明本發(fā)明而不限于限制本發(fā)明的范圍。實(shí)施例中采用的實(shí)施條件可以根據(jù)具體廠家的條件做進(jìn)一步調(diào)整,未注明的實(shí)施條件通常為常規(guī)實(shí)驗(yàn)中的條件。實(shí)施例基因芯片圖像的基因點(diǎn)網(wǎng)格定位本實(shí)施例采用的基因芯片圖像如圖1所示,它有虹12個(gè)基因區(qū),每一基因區(qū)包含 10x10個(gè)基因點(diǎn)的基因芯片圖像。共含有48個(gè)基因區(qū),每個(gè)基因區(qū)含有100個(gè)基因點(diǎn)。如圖2所示,實(shí)施例按照?qǐng)D2的流程對(duì)基因芯片圖像進(jìn)行處理。首先對(duì)所獲取的基因芯片圖像首先進(jìn)行預(yù)處理濾去噪聲污染然后確定圖像中一點(diǎn)作為基因區(qū)網(wǎng)格定位中對(duì)整幅圖像進(jìn)行旋轉(zhuǎn)操作的旋轉(zhuǎn)點(diǎn)。旋轉(zhuǎn)點(diǎn)可選任意基因區(qū)內(nèi)任何一點(diǎn),這里取圖像的中間點(diǎn)。一旦確定旋轉(zhuǎn)點(diǎn),則固定不變。然后采用粒子群算法對(duì)整幅圖像進(jìn)行基因區(qū)網(wǎng)格定位。整幅圖像基因區(qū)網(wǎng)格定位完成后,則可提取出所有基因區(qū)。然后可以對(duì)每個(gè)基因區(qū)進(jìn)行基因區(qū)內(nèi)基因點(diǎn)的網(wǎng)格定位。如圖2所示,先對(duì)第一塊基因區(qū)采用粒子群算法進(jìn)行基因點(diǎn)網(wǎng)格定位,然后對(duì)第二塊,第三塊等等,直至完成所有基因區(qū)內(nèi)基因點(diǎn)網(wǎng)格定位,最后輸出整幅基因芯片圖像所有基因點(diǎn)定位信息。由于在確定的一段時(shí)間內(nèi)要處理的一批基因芯片圖像的基因區(qū)及基因點(diǎn)的排列是相同并已知的。如圖1所示,不失一般性,可假定已知基因區(qū)排列是4x12,每一基因區(qū)基因點(diǎn)排列是10x10?;蛐酒瑘D像基因點(diǎn)定位方法要確定的是所有基因區(qū)及基因區(qū)基因點(diǎn)的位置信息。在基因芯片圖像基因點(diǎn)定位問題中就是確定所有基因點(diǎn)的位置信息,所以粒子群算法的一個(gè)解可用所有基因點(diǎn)的位置信息來表征。對(duì)圖一所示基因芯片圖像,有4800個(gè)基因點(diǎn),每個(gè)點(diǎn)由χ和y坐標(biāo)值確定。所以每個(gè)解由4800x2 = 9600個(gè)實(shí)數(shù)值組成。粒子(及解)是隨機(jī)地朝著自己最好的位置和所有同伴中最好的位置飛行,從而需要能評(píng)估每一解 (粒子)的好壞。當(dāng)某一解表征的基因點(diǎn)位置為基因芯片圖像中真實(shí)的基因點(diǎn)位置信息時(shí), 該解具有最好的評(píng)估值。而某一解表征的基因點(diǎn)位置與基因芯片圖像中真實(shí)的基因點(diǎn)位置信息完全不符合時(shí),該解具有很差的評(píng)估值。粒子群算法的任務(wù)就是引導(dǎo)一組初始化時(shí)隨機(jī)產(chǎn)生的解朝著越來越好的區(qū)域飛行,最終找到所需要的解,既基因芯片圖像的所有基因點(diǎn)的真實(shí)位置信息。假設(shè)將第i個(gè)解記為& = (xn,xi2,...,xin),解的飛行速度記為Vi= (Vil,Vi2,..., Vin),它的具有最好評(píng)估值的位置記為Pi= (Pil,Pi2,...,Pin),其中η為問題的維數(shù),。所有解中擁有最好評(píng)估值的粒子的上標(biāo)記為g。則每個(gè)解依據(jù)公式(1)和( 飛行,既一代一代迭代。粒子群算法流程如下(a)初始化一組解;(b)評(píng)估這組解;
      (c)對(duì)每一解,如解的評(píng)估值比記錄的最好值好,則將當(dāng)前的解的評(píng)估值記為最好值;如果它的評(píng)估值比記錄的所有解的最好值還好,則將這一評(píng)估值記錄為所有解的最好評(píng)估值;(d)依據(jù)公式⑴、(2)對(duì)每一粒子進(jìn)行迭代;vid = w*vid+Cl*rld* (pid-xid)+c2*r2d* (pgd-xid)(1);xid = xid+vid(2);如已達(dá)最大設(shè)置的迭代次數(shù),則終止算法,輸出找到的最好解;否則轉(zhuǎn)去第(b) 步;其中 W,C1,和 C2 —般為常數(shù),如 W = 0. 729,C1 = C2 = 1.49445 ;rld 和 r2d 為(0,1)之間的隨機(jī)數(shù)。對(duì)如圖1所示基因芯片圖像,它的基因點(diǎn)定位問題可轉(zhuǎn)化為在一 9600維的解空間中尋找一最優(yōu)解(既4800個(gè)基因點(diǎn)的定位信息)。由于是高維解空間,求解復(fù)雜,本實(shí)施例將這一問題分成兩步,第一步對(duì)基因區(qū)進(jìn)行優(yōu)化網(wǎng)格定位,第二步再對(duì)每一基因區(qū)的基因點(diǎn)進(jìn)行定位。1)基因區(qū)網(wǎng)格定位對(duì)基因芯片圖像進(jìn)行基因區(qū)網(wǎng)格定位可先對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正,再采用圖像投影法。將旋轉(zhuǎn)角度作為要尋找的解,采用粒子群算法求解這一一維問題。對(duì)每一解的評(píng)估采用如下步驟a)依據(jù)解所表示的旋轉(zhuǎn)角度對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正;b)對(duì)旋轉(zhuǎn)校正過的圖像進(jìn)行水平和垂直方向的投影;c)對(duì)能進(jìn)行基因區(qū)網(wǎng)格定位的圖像賦予大的評(píng)估值,并且網(wǎng)格間距越大評(píng)估值相對(duì)來說越大;旋轉(zhuǎn)后不能進(jìn)行基因區(qū)網(wǎng)格定位的圖像則賦予較小的評(píng)估值;通過粒子群算法找到旋轉(zhuǎn)角度后,先對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正,圖像投影法對(duì)圖像進(jìn)行基因區(qū)網(wǎng)格定位。2)每一基因區(qū)內(nèi)基因點(diǎn)定位對(duì)每一基因區(qū)基因點(diǎn)定位依據(jù)下列步驟a)先對(duì)基因區(qū)圖像進(jìn)行旋轉(zhuǎn)校正;b)再對(duì)旋轉(zhuǎn)校正過后的基因區(qū)圖像依據(jù)已知行列數(shù)進(jìn)行均勻行列分格,每一格的中心暫定為一基因點(diǎn)的中心;c)對(duì)每一基因點(diǎn)的中心作些微調(diào),并以該中心作半徑r的園,該園所對(duì)應(yīng)區(qū)域則為該基因點(diǎn)的位置及大小。從以上步驟,可看出對(duì)每一基因區(qū)基因點(diǎn)定位需找到以下信息旋轉(zhuǎn)校正角度大小,每一基因點(diǎn)的中心位置的χ和y方向的微調(diào)值,每一基因點(diǎn)的半徑。一般來說,同一基因區(qū)內(nèi)基因點(diǎn)的半徑相同,因而對(duì)圖一中的每一基因區(qū)需要尋找的信息為1個(gè)旋轉(zhuǎn)校正角度,1個(gè)基因點(diǎn)的半徑,100個(gè)χ方向的微調(diào)值,和100個(gè)y方向的微調(diào)值,所以圖一中每一基因區(qū)內(nèi)基因點(diǎn)定位所需尋找的解的空間維數(shù)為202維。同樣采用粒子群優(yōu)化算法來尋找對(duì)應(yīng)的202維最佳解。每一 202維解的評(píng)估依據(jù)以下步驟a)依據(jù)每一解所表示的旋轉(zhuǎn)角度對(duì)基因區(qū)圖像進(jìn)行旋轉(zhuǎn)校正;b)對(duì)旋轉(zhuǎn)校正過后的基因區(qū)圖像依據(jù)已知行列數(shù)進(jìn)行均勻行列分格,每一格的中心暫定為一基因點(diǎn)的中心;
      c)對(duì)每一基因點(diǎn)的中心依據(jù)解所表示的對(duì)應(yīng)于每一基因點(diǎn)χ和y方向值對(duì)每一基因點(diǎn)中心作χ和y方向微調(diào);d)在每一中心依據(jù)解所表示的半徑作圓形成每一基因點(diǎn)的范圍;e)在所有基因點(diǎn)內(nèi)包含信息的像素越多和在所有基因點(diǎn)外包含信息的像素越少, 則該解的評(píng)估值越大,否則則越小。這樣通過粒子群算法尋找到的最佳解就將基因區(qū)內(nèi)的基因點(diǎn)定位。上述實(shí)例只為說明本發(fā)明的技術(shù)構(gòu)思及特點(diǎn),其目的在于讓熟悉此項(xiàng)技術(shù)的人是能夠了解本發(fā)明的內(nèi)容并據(jù)以實(shí)施,并不能以此限制本發(fā)明的保護(hù)范圍。凡根據(jù)本發(fā)明精神實(shí)質(zhì)所做的等效變換或修飾,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。
      權(quán)利要求
      1.一種采用演化算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位方法,其特征在于所述方法包括以下步驟(1)獲取基因芯片圖像,然后在基因芯片圖像中確定基因區(qū)網(wǎng)格定位時(shí)對(duì)整幅圖像進(jìn)行旋轉(zhuǎn)操作的旋轉(zhuǎn)點(diǎn),采用演化算法找到旋轉(zhuǎn)角度后,先對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正,然后通過圖像投影法對(duì)基因芯片圖像進(jìn)行基因區(qū)網(wǎng)格定位;(2)基因芯片圖像基因區(qū)網(wǎng)格定位后提取所有基因區(qū),依次采用演化算法進(jìn)行基因芯片圖像的基因區(qū)內(nèi)基因點(diǎn)網(wǎng)格定位并輸出。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于所述演化算法選自粒子群優(yōu)化算法、實(shí)數(shù)值遺傳算法、演化規(guī)則算法。
      3.根據(jù)權(quán)利要求2所述的方法,其特征在于所述粒子群優(yōu)化算法包括以下步驟A)先初始化一組解;B)評(píng)估這組解;C)對(duì)每一解,如解的評(píng)估值比記錄的最好值好,則將當(dāng)前的解的評(píng)估值記為最好值; 如果它的評(píng)估值比記錄的所有解的最好值還好,則將這一評(píng)估值記錄為所有解的最好評(píng)估值;D)依據(jù)公式(1)、(2)對(duì)每一粒子進(jìn)行迭代;Vid=w*Vid+Ci*rid* (Pid-Xid)+ c2*r2d* (Pgd-Xid) (1);xid=xid+vid(2);Ε)如已達(dá)最大設(shè)置的迭代次數(shù),則終止算法,輸出找到的最好解;否則轉(zhuǎn)去第B)步;其中將第i個(gè)解記為Xi=Uil, xi2,…,xin),解的飛行速度記為Vi =(vn, vi2, -,vin), 它的具有最好評(píng)估值的位置記為Pi= (Pil,Pi2,…,Pin),其中η為問題的維數(shù),所有解中擁有最好評(píng)估值的粒子的下標(biāo)記為g,每個(gè)解按照公式(1)和(2)進(jìn)行飛行,一代一代迭代計(jì)算; w、C1和C2為常數(shù),rld和r2d為(0,1)之間的隨機(jī)數(shù);Vid為第i個(gè)粒子的第d個(gè)速度分量; Pid為第i個(gè)粒子所搜索到的當(dāng)前最優(yōu)解的第d個(gè)分量;Xid為第i個(gè)粒子的第d個(gè)位置分量;Pgd為整個(gè)群體所搜索到的當(dāng)前最優(yōu)解的第d個(gè)位置分量。
      4.根據(jù)權(quán)利要求3所述的方法,其特征在于當(dāng)使用粒子群優(yōu)化算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位時(shí),步驟(1)中采用粒子群優(yōu)化算法尋找旋轉(zhuǎn)角度,步驟B)中解的評(píng)估按照如下步驟進(jìn)行I)對(duì)每一解,依據(jù)解所表示的旋轉(zhuǎn)角度對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正;II)對(duì)旋轉(zhuǎn)校正過的圖像進(jìn)行水平和垂直方向的投影;III)對(duì)能進(jìn)行基因區(qū)網(wǎng)格定位的圖像賦予大的評(píng)估值,并且網(wǎng)格間距越大,評(píng)估值越大;旋轉(zhuǎn)后不能進(jìn)行基因區(qū)網(wǎng)格定位的圖像則賦予較小的評(píng)估值;通過如上步驟評(píng)估每一解,采用粒子群優(yōu)化算法找到旋轉(zhuǎn)角度,然后對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正。
      5.根據(jù)權(quán)利要求3所述的方法,其特征在于當(dāng)使用粒子群優(yōu)化算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位時(shí),步驟(2)中采用粒子群優(yōu)化算法進(jìn)行基因芯片圖像的基因區(qū)內(nèi)基因點(diǎn)網(wǎng)格定位,步驟B)中解的評(píng)估包括如下步驟(i)對(duì)基因芯片圖像的基因區(qū)圖像依據(jù)解所表示的旋轉(zhuǎn)角度進(jìn)行旋轉(zhuǎn)校正,然后將旋轉(zhuǎn)校正過后的基因芯片圖像的基因區(qū)依據(jù)已知行列數(shù)進(jìn)行均勻行列分格,每一格的中心暫定為一基因點(diǎn)的中心;(ii)對(duì)每一基因點(diǎn)的中心依據(jù)解所表示的對(duì)應(yīng)于每一基因點(diǎn)X和y方向值對(duì)每一基因點(diǎn)中心作χ和y方向微調(diào);(iii)在每一中心依據(jù)解所表示的半徑作圓形成每一基因點(diǎn)的范圍;(iv)在所有基因點(diǎn)內(nèi)包含信息的像素越多和在所有基因點(diǎn)外包含信息的像素越少,則該解的評(píng)估值越大,否則越??;通過上述步驟評(píng)估每一解,采用粒子群優(yōu)化算法尋找到的最佳解將基因區(qū)內(nèi)的基因點(diǎn)網(wǎng)格定位。
      全文摘要
      本發(fā)明公開了一種采用演化算法進(jìn)行基因芯片圖像基因點(diǎn)自動(dòng)定位方法,其特征在于所述方法包括以下步驟(1)獲取基因芯片圖像,然后在基因芯片圖像中確定基因區(qū)網(wǎng)格定位時(shí)對(duì)整幅圖像進(jìn)行旋轉(zhuǎn)操作的旋轉(zhuǎn)點(diǎn),采用演化算法找到旋轉(zhuǎn)角度后,先對(duì)基因芯片圖像進(jìn)行旋轉(zhuǎn)校正,然后通過圖像投影法對(duì)基因芯片圖像進(jìn)行基因區(qū)網(wǎng)格定位;(2)基因芯片圖像基因區(qū)網(wǎng)格定位后提取所有基因區(qū),依次采用演化算法進(jìn)行基因芯片圖像的基因區(qū)內(nèi)基因點(diǎn)網(wǎng)格定位并輸出。該方法解決了對(duì)基因芯片圖像基因點(diǎn)進(jìn)行自動(dòng)定位的難題。
      文檔編號(hào)G06N3/00GK102254109SQ20111019810
      公開日2011年11月23日 申請(qǐng)日期2011年7月15日 優(yōu)先權(quán)日2011年7月15日
      發(fā)明者史玉回 申請(qǐng)人:西交利物浦大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1