專利名稱:棉花異性纖維目標(biāo)圖像的特征選擇方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及模式識(shí)別和機(jī)器視覺領(lǐng)域,特別涉及一種棉花異性纖維目 標(biāo)圖像的特征選擇方法和系統(tǒng)。
背景技術(shù):
棉花異性纖維是指在棉花采摘、攤曬、收購(gòu)等過程中混入棉花中的對(duì) 棉花及其制品的質(zhì)量有嚴(yán)重影響的非棉纖維和色纖維,主要包括丙綸絲、 麻繩和頭發(fā)等。異性纖維在皮棉中的含量雖少,但對(duì)棉紡織品的質(zhì)量影響 嚴(yán)重, 一旦混入并參與紡織將影響紗線強(qiáng)力,且在染色時(shí)影響著色,會(huì)對(duì) 棉紡織工業(yè)造成重大經(jīng)濟(jì)損失。
目前可以通過挑揀異性纖維的方法降低棉花異性纖維的含量,或者將 棉花生產(chǎn)的樣品進(jìn)行取樣后送到纖維檢驗(yàn)機(jī)構(gòu)分析確定異性纖維的含量。 但是,根據(jù)很多棉花行業(yè)專家的一致觀點(diǎn),應(yīng)該從源頭抓起,切斷異性纖 維混入的途徑,讓棉農(nóng)、棉花收購(gòu)和加工企業(yè)都自覺地防范異性纖維混入。 而這關(guān)鍵是需要在籽棉收購(gòu)或交易環(huán)節(jié)中快速準(zhǔn)確地分析籽棉中的異性 纖維含量,給銷售的籽棉分等定級(jí),并按等級(jí)定價(jià),這樣就可以促使棉花 銷售者自覺地降低棉花中異性纖維的含量。如果要實(shí)現(xiàn)在籽棉收購(gòu)或交易 環(huán)節(jié)快速準(zhǔn)確地確定籽棉中的異性纖維含量,其基礎(chǔ)和關(guān)鍵是將異性纖維 快速分類,而從棉花異性纖維目標(biāo)圖像的原始特征集合中選擇出最有分類 價(jià)值的最優(yōu)特征子集則是異性纖維實(shí)現(xiàn)正確快速分類的前提和保障。
發(fā)明人在實(shí)現(xiàn)本發(fā)明的過程中發(fā)現(xiàn),現(xiàn)有技術(shù)的特征選擇方法至少存
在如下技術(shù)缺陷特征選擇方法中的兩個(gè)關(guān)鍵技術(shù)"搜索策略"和"評(píng)價(jià)函數(shù)"存在計(jì)算量大等缺陷。其中,搜索策略中的遺傳算法試圖通過隨機(jī)
性來避免陷入局部最優(yōu)解,并且能夠以較大概率獲得全局最優(yōu)解;但是目 前的遺傳算法還存在一些不足之處,如早熟收斂問題等,尤其是沒有考慮 對(duì)棉花異性纖維目標(biāo)圖像中具有完全不同性質(zhì)的特征進(jìn)行局部化管理的 合理性和必要性。如果使用上述遺傳算法的特征選擇方法會(huì)使得特征選擇 的效率較低,異性纖維無法實(shí)現(xiàn)快速正確分類,從而無法實(shí)現(xiàn)在籽棉收購(gòu) 或交易環(huán)節(jié)快速準(zhǔn)確地確定籽棉中的異性纖維含量,不能通過檢測(cè)籽棉中 的異性纖維含量來影響其收購(gòu)價(jià)格,不能有效切斷異性纖維混入的途徑, 可能對(duì)棉紡織工業(yè)造成重大經(jīng)濟(jì)損失。
發(fā)明內(nèi)容
本發(fā)明的目的是提供 一 種棉花異性纖維目標(biāo)圖像的特征選擇方法和 系統(tǒng),實(shí)現(xiàn)對(duì)棉花異性纖維目標(biāo)圖像中不同性質(zhì)特征的覆蓋,選擇出具有 最佳分類能力的最優(yōu)特征子集,以便實(shí)現(xiàn)異性纖維的快速正確分類。
本發(fā)明實(shí)施例提供了 一種棉花異性纖維目標(biāo)圖像的特征選擇方法,包
括
步驟1、利用分段式二進(jìn)制編碼方案對(duì)棉花異性纖維目標(biāo)圖像的待選 擇的顏色特征、形狀特征和紋理特征進(jìn)行基因編碼,隨機(jī)生成含有多個(gè)分 別代表不同特征子集的個(gè)體的初始種群;每個(gè)所述個(gè)體表示的特征子集均 涵蓋所述顏色特征、形狀特征和紋理特征;設(shè)置進(jìn)化代數(shù)為0;
步驟2、計(jì)算所述初始種群中每個(gè)個(gè)體的適應(yīng)度;所述適應(yīng)度是按照 所述個(gè)體表示的特征子集構(gòu)造的分類器的分類正確率與所述特征子集的 加權(quán)大小作差得到的;
步驟3、根據(jù)所述適應(yīng)度對(duì)所述初始種群中的多個(gè)個(gè)體進(jìn)行選擇得到 最高適應(yīng)度個(gè)體和用于遺傳操作的新種群,所述遺傳操作包括分段交叉和 分段變異;步驟4、在所述新種群中隨機(jī)選擇兩個(gè)個(gè)體作為雙親個(gè)體,并根據(jù)交 叉概率進(jìn)行分段交叉,產(chǎn)生涵蓋所述顏色特征、形狀特征和紋理特征的兩 個(gè)子個(gè)體;并按照步驟2所述的方法計(jì)算所述兩個(gè)子個(gè)體的適應(yīng)度;
步驟5、對(duì)所述兩個(gè)子個(gè)體分別根據(jù)變異概率進(jìn)行分段變異,產(chǎn)生涵 蓋所述顏色特征、形狀特征和紋理特征的兩個(gè)新一代個(gè)體并替換所述雙親 個(gè)體,并按照步驟2所述的方法計(jì)算所述兩個(gè)新一代個(gè)體的適應(yīng)度;重復(fù) 所述步驟4和步驟5直到所述新種群中的所有個(gè)體都進(jìn)行所述遺傳操作后 得到新一代種群;所述遺傳操作結(jié)束后,令所述進(jìn)化代數(shù)加l;
步驟6、判斷所述進(jìn)化代數(shù)是否達(dá)到指定的最大進(jìn)化代數(shù)或者所述新 一代種群中所有個(gè)體的平均適應(yīng)度的差異連續(xù)G代都小于指定的閾值T, G和T為經(jīng)驗(yàn)常數(shù);若是,則繼續(xù)執(zhí)行步驟7,否則,繼續(xù)執(zhí)行步驟3-步驟5;
步驟7、將所述新一代種群中具有最高適應(yīng)度的個(gè)體解碼,得到所述 棉花異性纖維目標(biāo)圖像的最優(yōu)特征子集,所述最優(yōu)特征子集為從所述棉花 異性纖維目標(biāo)圖像的待選擇的顏色特征、形狀特征和紋理特征中選擇得到
的特征。
本發(fā)明實(shí)施例提供了 一種棉花異性纖維目標(biāo)圖像的特征選擇系統(tǒng),包 括初始化模塊、適應(yīng)度計(jì)算模塊、比例選擇模塊、分段交叉模塊、分段 變異模塊、進(jìn)化終止判斷模塊和最優(yōu)特征子集輸出模塊;
所述初始化才莫塊,用于利用分段式二進(jìn)制編碼方案對(duì)棉花異性纖維目標(biāo) 圖像的待選擇的顏色特征、形狀特征和紋理特征進(jìn)行基因編碼,隨機(jī)生成含 有多個(gè)分別代表不同特征子集的個(gè)體的初始種群;每個(gè)所述個(gè)體表示的特征 子集均涵蓋所述顏色特征、形狀特征和紋理特征;設(shè)置進(jìn)化代數(shù)為0;
所述適應(yīng)度計(jì)算模塊,用于計(jì)算所述初始種群中每個(gè)個(gè)體的適應(yīng)度; 所述適應(yīng)度是按照所述個(gè)體表示的特征子集構(gòu)造的分類器的分類正確率 與所述特征子集的加權(quán)大小作差得到的;所述比例選擇模塊,用于根據(jù)所述適應(yīng)度對(duì)所述初始種群中的多個(gè)個(gè) 體進(jìn)行選擇得到最高適應(yīng)度個(gè)體和用于遺傳操作的新種群,所述遺傳操作
包括分段交叉和分段變異;
所述分段交叉模塊,用于在所述新種群中隨機(jī)選擇兩個(gè)個(gè)體作為雙親 個(gè)體,并根據(jù)交叉概率進(jìn)行分段交叉,產(chǎn)生涵蓋所述顏色特征、形狀特征 和紋理特征的兩個(gè)子個(gè)體;并調(diào)用所述適應(yīng)度計(jì)算模塊來計(jì)算所述兩個(gè)子 個(gè)體的適應(yīng)度;
所述分段變異模塊,用于對(duì)所述兩個(gè)子個(gè)體分別根據(jù)變異概率進(jìn)行分 段變異,產(chǎn)生涵蓋所述顏色特征、形狀特征和紋理特征的兩個(gè)新一代個(gè)體 并替換所述雙親個(gè)體,并調(diào)用所述適應(yīng)度計(jì)算模塊來計(jì)算所述兩個(gè)新一代 個(gè)體的適應(yīng)度;重復(fù)執(zhí)行分段交叉模塊和分段變異模塊直到所述新種群中 的所有個(gè)體都進(jìn)行所述遺傳操作后得到新一代種群;所述遺傳操作結(jié)束 后,令所述進(jìn)化代數(shù)加1;
所述進(jìn)化終止判斷模塊,用于判斷所述進(jìn)化代數(shù)是否達(dá)到指定的最大 進(jìn)化代數(shù)或者所述新一代種群中所有個(gè)體的平均適應(yīng)度的差異連續(xù)G代 都小于指定的閾值T, G和T為經(jīng)驗(yàn)常數(shù);若是,則執(zhí)行最優(yōu)特征子集輸 出模塊,否則,繼續(xù)執(zhí)行所述比例選擇模塊、分段交叉模塊和分段變異模 塊;
所述最優(yōu)特征子集輸出模塊,用于將所述新一代種群中具有最高適應(yīng) 度的個(gè)體解碼,得到所述棉花異性纖維目標(biāo)圖像的最優(yōu)特征子集,所述最 優(yōu)特征子集為從所述棉花異性纖維目標(biāo)圖像的待選擇的顏色特征、形狀特 征和紋理特征中選擇得到的特征。
本發(fā)明實(shí)施例通過釆用分段式編碼管理方案對(duì)不同性質(zhì)的特征進(jìn)行 局部化管理,并對(duì)交叉算子和變異算子進(jìn)行局部化約束,解決了現(xiàn)有遺傳 算法的特征選擇方法中沒有考慮對(duì)諸如棉花異性纖維目標(biāo)圖像具有完全 不同性質(zhì)的特征進(jìn)行局部化管理而使得特征選擇的效率較低且容易早熟收斂的問題;能夠?qū)崿F(xiàn)對(duì)棉花異性纖維目標(biāo)圖像的不同性質(zhì)特征的覆蓋, 特征選擇的效率較高。
圖l為本發(fā)明實(shí)施例一提供的棉花異性纖維目標(biāo)圖像的特征選擇方法 的流程示意圖2是本發(fā)明實(shí)施例一提供的棉花異性纖維目標(biāo)圖像的特征選擇方法 中的分段式染色體管理方案示意圖3是本發(fā)明實(shí)施例一提供的棉花異性纖維目標(biāo)圖像的特征選擇方法 中的分段交叉方案示意圖4是本發(fā)明實(shí)施例一提供的棉花異性纖維目標(biāo)圖像的特征選擇方法 中的分段變異方案示意圖5是本發(fā)明實(shí)施例二提供的棉花異性纖維目標(biāo)圖像特征選擇系統(tǒng)的 結(jié)構(gòu)示意圖。
具體實(shí)施例方式
下面通過附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。 本發(fā)明實(shí)施例的棉花異性纖維目標(biāo)圖像的特征選擇方法和系統(tǒng),前提 是用戶已經(jīng)提供了棉花異性纖維目標(biāo)圖像的原始特征集,該原始特征集指 的是對(duì)棉花異性纖維目標(biāo)圖像進(jìn)行圖像處理后,得到的該目標(biāo)圖像的顏色 特征、形狀特征和紋理特征;即本發(fā)明實(shí)施例采用的是棉花異性纖維目標(biāo) 圖像的圖像處理結(jié)果。本發(fā)明實(shí)施例的目標(biāo)是從上述的待選擇的顏色特 征、形狀特征和紋理特征中選擇出具有最佳分類能力的顏色特征、形狀特 征和紋理特征即最優(yōu)特征子集,以利于后續(xù)步驟中的實(shí)現(xiàn)棉花異性纖維的 正確快速分類,從而快速測(cè)定棉花異性纖維的含量;即本發(fā)明實(shí)施例得到 的最優(yōu)特征子集為棉花異性纖維正確快速分類提供基礎(chǔ)。圖1為本發(fā)明實(shí)施例 一提供的棉花異性纖維目標(biāo)圖像的特征選擇方法
的流程示意圖,如圖l所示,本實(shí)施例主要包括以下步驟
步驟101、利用分段式二進(jìn)制編碼方案對(duì)棉花異性纖維目標(biāo)圖像的待 選擇的顏色特征、形狀特征和紋理特征進(jìn)行基因編碼并生成初始種群,該 初始種群中包括多個(gè)分別代表不同特征子集的個(gè)體,每個(gè)個(gè)體均涵蓋所述 顏色特征、形狀特征和紋理特征。
本實(shí)施例中的個(gè)體可也稱作染色體,分段式二進(jìn)制編碼方案是指將整 個(gè)染色體進(jìn)行分段基因編碼。下面結(jié)合圖2具體闡述本步驟中的分段式二 進(jìn)制編碼方案,圖2是本發(fā)明實(shí)施例一提供的棉花異性纖維目標(biāo)圖像的特 征選擇方法中的分段式染色體管理方案示意圖,如圖2所示,由于本實(shí)施 例中的棉花異性纖維目標(biāo)圖像的原始特征集包括顏色特征、形狀特征和紋 理特征三種性質(zhì)的特征,因此,本實(shí)施例中將染色體分為三個(gè)子段,第一 子段實(shí)現(xiàn)對(duì)顏色特征的基因編碼,表示為Ci CK, K為顏色特征的個(gè)數(shù); C產(chǎn)l表示第i個(gè)顏色特征被選中,C尸O表示第i個(gè)顏色特征落選。第二子段 實(shí)現(xiàn)對(duì)形狀特征的基因編碼,表示為Si-SM, M為形狀特征的個(gè)數(shù);Sj=l 表示第j個(gè)形狀特征被選中,Sj-O表示第j個(gè)形狀特征落選。第三子段實(shí)現(xiàn) 對(duì)紋理特征的基因編碼,表示為T廣TN, N為紋理特征的個(gè)數(shù);T^l表示 第k個(gè)紋理特征被選中,T^O表示第k個(gè)紋理特征落選。每個(gè)子段的長(zhǎng)度分 別等于對(duì)應(yīng)特征向量的長(zhǎng)度;整個(gè)染色體的長(zhǎng)度等于三個(gè)染色體子段的長(zhǎng) 度之和,亦等于原始特征空間的維數(shù)。
在對(duì)上述染色體進(jìn)行分段式二進(jìn)制編碼的基礎(chǔ)上,還需要進(jìn)行分段式染 色體管理,該分段式染色體管理是指需要限制上述染色體中的三個(gè)分段的內(nèi) 容不能全部為零來保證整個(gè)染色體能夠同時(shí)涵蓋顏色、形狀和紋理三種特征; 從而就可以實(shí)現(xiàn)對(duì)多質(zhì)特征空間的有效搜索。該限制條件表示為公式(1):
<formula>formula see original document page 11</formula>上述限制條件對(duì)初始種群中的染色體進(jìn)行約束,也同樣施加于后續(xù)步
驟104中分段交叉操作產(chǎn)生的新染色體和步驟105中分段變異操作產(chǎn)生的 新染色體;交叉和變異后產(chǎn)生的新染色體同樣要滿足分段基因不全為零的 約束條件。
上述對(duì)棉花異性纖維圖像的顏色、形狀和紋理特征按照不同的條件進(jìn)行 編碼,就可以得到多個(gè)染色體。例如,對(duì)于圖2中的染色體,假設(shè)顏色特征 有4個(gè),形狀特征有3個(gè),紋理特征有5個(gè);如果分別只選中三個(gè)分^:中的 第一個(gè)基因,則編碼后得到的染色體為"100010010000";如果分別只選中三 個(gè)分段中的第二個(gè)基因,則編碼后得到的染色體為"010001001000"。同理, 可以通過隨機(jī)方式得到多個(gè)染色體。上述多個(gè)染色體組成初始種群。該初始 種群的規(guī)模PopSize可以根據(jù)實(shí)際情況進(jìn)行設(shè)置, 一般取20SPo/^ze^l00;并 且要求該初始種群具有單一性,即初始種群中沒有完全相同的染色體,每個(gè) 染色體都分別表示不同的特征子集。
步驟102、將個(gè)體代表的特征子集構(gòu)造的分類器的分類正確率與該特 征子集的加權(quán)大小作差得到特征個(gè)體的適應(yīng)度。
適應(yīng)度是衡量特征個(gè)體即染色體優(yōu)劣的唯一指標(biāo),是根據(jù)單個(gè)染色體 中的特征子集大小及由此構(gòu)造的分類器在樣本數(shù)據(jù)集上的分類正確率確 定的。特征子集是指單個(gè)染色體中為l的基因表示的特征集合。該樣本數(shù) 據(jù)集也是由用戶預(yù)先提供。染色體的適應(yīng)度可以根據(jù)公式(2)計(jì)算得出
/(義,.W(A)-豐,|.............................. (2)
上述公式(2)中,《為個(gè)體/所表示的特征子集,J(義,)為根據(jù)《構(gòu)造
的分類器的分類正確率;分類器可以是任何一種分類器,如K-NN分類器、 神經(jīng)網(wǎng)絡(luò)分類器、模糊分類器等;Ix,l為特征個(gè)體/所表示的特征子集的大
小(亦即染色體串上"1"的個(gè)數(shù));w為權(quán)值(o^w<i )。
步驟103、根據(jù)個(gè)體的適應(yīng)度對(duì)初始種群中的個(gè)體進(jìn)行比例選擇得出包括部分個(gè)體的新種群,該新種群用于后續(xù)的遺傳操作。選擇操作使得適 應(yīng)度高的個(gè)體可能被選擇多次,而適應(yīng)度低的個(gè)體可能一次也沒選中,但 選出的新個(gè)體數(shù)目不變,因此新種群的規(guī)模仍然等于原始種群的規(guī)模。
本步驟是用于選擇可以保留下來的個(gè)體。根據(jù)精英策略將具有最高適
應(yīng)度的個(gè)體直接保留到下一代,作為新一代種群中的染色體;輪盤賭法則 是根據(jù)染色體的選中概率進(jìn)行選擇,使適應(yīng)度高的個(gè)體能以較高的概率被 選中以便進(jìn)行遺傳操作,體現(xiàn)了優(yōu)勝劣汰的進(jìn)化法則。其中選中概率與染 色體的適應(yīng)度具有公式(3)所示的關(guān)系
尸從)S /(D.............................. (3)
其中,Po/^fee為當(dāng)前種群大小,《(A)為染色體!'的選中概率。 步驟104、在選出的新種群中隨機(jī)選擇兩個(gè)個(gè)體作為雙親并根據(jù)交叉 概率進(jìn)行分段交叉,產(chǎn)生涵蓋所述顏色特征、形狀特征和紋理特征的兩個(gè) 子個(gè)體,并按照步驟102所述的方法計(jì)算兩個(gè)子個(gè)體的適應(yīng)度。
在新種群中通過對(duì)兩個(gè)父代染色體進(jìn)行分段交叉操作,產(chǎn)生兩個(gè)新的 染色體;產(chǎn)生的新染色體需要滿足"染色體的每個(gè)分段上的基因都不全為 零"的約束條件。兩個(gè)父代染色體的分段交叉是根據(jù)交叉概率進(jìn)行交叉的, 該交叉概率是隨進(jìn)化代數(shù)不斷變化的自適應(yīng)交叉概率,其可以隨著進(jìn)化代 數(shù)的不斷增加而逐漸變小。該自適應(yīng)交叉概率可以根據(jù)公式(4) ~ (6) 進(jìn)行定義
<formula>formula see original document page 13</formula>其中,《。為種群初始化時(shí)設(shè)置的交叉概率,0.4S《。20.9; g為當(dāng)前進(jìn)
化代數(shù),x,、 A為兩個(gè)父代染色體,/^為兩個(gè)父代染色體中的較大適應(yīng) 度,7為父代種群的平均適應(yīng)度。
下面結(jié)合圖3具體闡述本步驟中的分段交叉方案,圖3是本發(fā)明實(shí)施 例一提供的棉花異性纖維目標(biāo)圖像的特征選擇方法中的分段交叉方案示 意圖,如圖3所示,可以依次對(duì)染色體中的顏色特征分段、形狀特征分段 和紋理特征分段進(jìn)行交叉。例如,對(duì)顏色特征分段進(jìn)行交叉時(shí),對(duì)于長(zhǎng)度 為K的顏色特征分段,首先根據(jù)顏色特征分段的長(zhǎng)度產(chǎn)生一個(gè)1 ~ "K- 1" 之間的一個(gè)隨機(jī)數(shù)a;然后對(duì)兩個(gè)父代染色體的顏色特征分段在第a位以 交叉概率P。做單點(diǎn)交叉;最后判斷交叉后的新的顏色特征分段上的基因是 否全部為0,如果是,則釆用隨機(jī)反轉(zhuǎn)該顏色特征分段中某個(gè)基因的方式 進(jìn)行修正,例如將第a位基因置為"1",如果不全部為0,則進(jìn)入下一分 段,開始依次對(duì)形狀特征分段和紋理特征分段進(jìn)行交叉操作,操作原理同 顏色特征分段,在此不再贅述。
步驟105、分別對(duì)步驟104產(chǎn)生的兩個(gè)子個(gè)體根據(jù)變異概率進(jìn)行分段 變異,產(chǎn)生涵蓋所述顏色特征、形狀特征和紋理特征的兩個(gè)新一代個(gè)體并 替換步驟104選出的雙親,并按照步驟102的方法計(jì)算兩個(gè)新一代個(gè)體的 適應(yīng)度;重復(fù)步驟103- 105直到所有個(gè)體完成遺傳操作,此時(shí),該新種 群為新一代種群,進(jìn)化代數(shù)加l。
對(duì)分段交叉后的兩個(gè)子代個(gè)體分別進(jìn)行分段變異操作,產(chǎn)生兩個(gè)新一 代染色體;產(chǎn)生的新染色體需要滿足"染色體的每個(gè)分段上的基因都不全 為零"的約束條件。對(duì)兩個(gè)子代染色體的分段變異是根據(jù)變異概率進(jìn)行變 異的,該變異概率是隨進(jìn)化代數(shù)不斷變化的自適應(yīng)變異概率,其可以隨著 進(jìn)化代數(shù)的不斷增加而逐漸變小。該自適應(yīng)變異概率可以根據(jù)公式(7) 進(jìn)行定義尸,=
尸M。/l。g"g + l)
L "7…(7)
其中,幾。為初始設(shè)置的變異概率,O.BPm。S0.25; g為當(dāng)前進(jìn)化代數(shù),
/為準(zhǔn)備進(jìn)行變異操作的染色體的適應(yīng)度,7為父代種群的平均適應(yīng)度。
下面結(jié)合圖4具體闡述本步驟中的個(gè)體分段交叉方案,圖4是本發(fā)明 實(shí)施例 一 提供的棉花異'f生纖維目標(biāo)圖像的特征選擇方法中的分段變異方 案示意圖,如圖4所示,可以依次并逐位對(duì)染色體中的顏色特征分段、形 狀特征分段和紋理特征分段進(jìn)行變異。例如,對(duì)顏色特征分段進(jìn)行變異時(shí), 可以對(duì)該顏色特征分段逐位以和克率Pm進(jìn)行位取反才喿作,例如圖4中對(duì)顏 色特征分段的第3位和第5位進(jìn)行了位取反操作;然后判斷變異后的新的 顏色特征分段上的基因是否全部為0,如果是,則重新進(jìn)行變異運(yùn)算,對(duì) 該顏色特征分段再次逐位以概率Pm進(jìn)行位取反操作,直到變異成功,即 新顏色特征分段上的基因不全部為0。然后可以進(jìn)入下一分段,開始依次 對(duì)形狀特征分段和紋理特征逐位進(jìn)行位取反操作,操作原理同顏色特征分 段,在此不再贅述。.
步驟106、判斷進(jìn)化代數(shù)是否達(dá)到指定的最大進(jìn)化代數(shù)或者該新一代 種群中的個(gè)體的平均適應(yīng)度的差異是否連續(xù)G代都小于指定的閾值T, G 和T為經(jīng)驗(yàn)常數(shù);若是,則繼續(xù)執(zhí)行步驟107,否則,返回去重新繼續(xù)執(zhí) 行步驟103~步驟105;
步驟107、將新一代種群中具有最高適應(yīng)度的個(gè)體解碼,得到棉花異 性纖維目標(biāo)圖像的最優(yōu)特征子集,該最優(yōu)特征子集為從棉花異性纖維目標(biāo) 圖像的待選擇的顏色特征、形狀特征和紋理特征中選擇得到的最具有分類 價(jià)值的特征。
本實(shí)施例通過釆用分段式編碼管理方案對(duì)不同性質(zhì)的特征進(jìn)行局部 化管理,并對(duì)交叉算子和變異算子進(jìn)行局部化約束,能夠?qū)崿F(xiàn)對(duì)不同性質(zhì)特征的覆蓋,減少搜索次數(shù),加快算法收斂。
圖5是本發(fā)明實(shí)施例二提供的棉花異性纖維目標(biāo)圖像特征選擇系統(tǒng)的 結(jié)構(gòu)示意圖,如圖5所示,本實(shí)施例的棉花異性纖維目標(biāo)圖像特征選擇系 統(tǒng)包括初始化模塊21、適應(yīng)度計(jì)算模塊22、比例選擇模塊23、分段交叉模 塊24、分段變異模塊25、進(jìn)化終止判斷模塊26和最優(yōu)特征子集輸出模塊27。
具體實(shí)施中,初始化模塊21利用分段式二進(jìn)制編碼方案對(duì)棉花異性纖 維目標(biāo)圖像的待選擇的顏色特征、形狀特征和紋理特征進(jìn)行基因編碼;隨 機(jī)生成含有多個(gè)分別代表不同特征子集的個(gè)體的初始種群,所述初始種群 中的每個(gè)個(gè)體均涵蓋所述顏色特征、形狀特征和紋理特征;此外,還可以 設(shè)置初始化進(jìn)化代數(shù)、交叉概率、變異概率等參數(shù);
適應(yīng)度計(jì)算模塊22將個(gè)體表示的特征子集構(gòu)造的分類器的分類正確 率與特征子集的加權(quán)大小作差得到所述個(gè)體的適應(yīng)度;
比例選擇模塊23,根據(jù)適應(yīng)度計(jì)算模塊22得到的個(gè)體的適應(yīng)度對(duì)初 始種群中的個(gè)體進(jìn)行比例選擇得到用于遺傳操作的新種群;利用精英策略 將具有最高適應(yīng)度的個(gè)體直接保留到下 一代而無須進(jìn)行遺傳操作;
分段交叉模塊24在比例選擇模塊23得到的新種群中隨機(jī)選擇兩個(gè)個(gè) 體作為雙親染色體并根據(jù)交叉概率進(jìn)行分段交叉,產(chǎn)生涵蓋所述顏色特 征、形狀特征和紋理特征的兩個(gè)子個(gè)體,并計(jì)算所述兩個(gè)子個(gè)體的適應(yīng)度;
分段變異模塊25分別對(duì)分段交叉模塊24得到的兩個(gè)子個(gè)體根據(jù)變異概 率進(jìn)行分段變異,產(chǎn)生涵蓋所述顏色特征、形狀特征和紋理特征的兩個(gè)新一 代個(gè)體并替換雙親染色體,計(jì)算兩個(gè)新一代個(gè)體的適應(yīng)度;當(dāng)所述新種群中 的所有個(gè)體都完成了遺傳操作后,便完成了一代進(jìn)化,令進(jìn)化代數(shù)加l;
進(jìn)化終止判斷模塊26判斷完成了本次進(jìn)化的新一代種群是否符合進(jìn) 化終止條件,該進(jìn)化終止條件包括達(dá)到指定的最大進(jìn)化代數(shù)或者新一代種 群中的特征個(gè)體的平均適應(yīng)度的差異連續(xù)G代都小于指定的闊值T, G和 T為經(jīng)驗(yàn)常數(shù);最優(yōu)特征子集輸出模塊27在進(jìn)化終止判斷模塊26判斷新一代種群符 合進(jìn)化終止條件時(shí),將新一代種群中具有最高適應(yīng)度的個(gè)體解碼,得到棉 花異性纖維目標(biāo)圖像中的最優(yōu)特征子集,該最優(yōu)特征子集為從棉花異性纖 維目標(biāo)圖像的待選擇的顏色特征、形狀特征和紋理特征中選擇得到的最具 有分類價(jià)值的特征。
在上述方案的基礎(chǔ)上,進(jìn)一步的,比例選擇模塊23包括精英策略 單元,用于將具有最高適應(yīng)度的個(gè)體直接作為新一代種群中的個(gè)體;輪盤 賭法則單元,用于結(jié)合所述個(gè)體的選中概率選擇部分個(gè)體組成新種群以便 進(jìn)行后續(xù)的遺傳操作,所述選中概率與所述個(gè)體的適應(yīng)度成正比。
進(jìn)一步的,分段交叉模塊24包括第一修正單元,用于在產(chǎn)生不涵蓋所 述顏色特征、形狀特征和/或紋理特征的子個(gè)體時(shí),采用隨機(jī)反轉(zhuǎn)所述子個(gè) 體中某個(gè)基因的方式進(jìn)行修正,以使得所述子個(gè)體涵蓋所述顏色特征、形 狀特征和紋理特征。
進(jìn)一步的,分段變異模塊25包括第二修正單元,用于在產(chǎn)生不涵蓋所 述顏色特征、形狀特征和/或紋理特征的新一代個(gè)體時(shí),重新對(duì)所述新一代 個(gè)體根據(jù)變異概率進(jìn)行分段變異,直至所述新一代個(gè)體涵蓋所述顏色特 征、形狀特征和紋理特征。
本實(shí)施例通過采用分段式編碼管理方案對(duì)不同性質(zhì)的特征進(jìn)行局部 化管理,并對(duì)交叉算子和變異算子進(jìn)行局部化約束,能夠?qū)崿F(xiàn)對(duì)不同性質(zhì) 特征的覆蓋,減少搜索次數(shù),加快算法收斂,選擇出具有最佳分類能力的 最優(yōu)特征子集,以便實(shí)現(xiàn)異性纖維的快速正確分類。
最后應(yīng)說明的是以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非對(duì)其進(jìn) 行限制,盡管參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技 術(shù)人員應(yīng)當(dāng)理解其依然可以對(duì)本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換, 而這些修改或者等同替換亦不能使修改后的技術(shù)方案脫離本發(fā)明技術(shù)方案的 并奇神和范圍。
權(quán)利要求
1、一種棉花異性纖維目標(biāo)圖像的特征選擇方法,其特征在于,包括步驟1、利用分段式二進(jìn)制編碼方案對(duì)棉花異性纖維目標(biāo)圖像的待選擇的顏色特征、形狀特征和紋理特征進(jìn)行基因編碼,隨機(jī)生成含有多個(gè)分別代表不同特征子集的個(gè)體的初始種群;每個(gè)所述個(gè)體表示的特征子集均涵蓋所述顏色特征、形狀特征和紋理特征;設(shè)置進(jìn)化代數(shù)為0;步驟2、計(jì)算所述初始種群中每個(gè)個(gè)體的適應(yīng)度;所述適應(yīng)度是按照所述個(gè)體表示的特征子集構(gòu)造的分類器的分類正確率與所述特征子集的加權(quán)大小作差得到的;步驟3、根據(jù)所述適應(yīng)度對(duì)所述初始種群中的多個(gè)個(gè)體進(jìn)行選擇得到最高適應(yīng)度個(gè)體和用于遺傳操作的新種群,所述遺傳操作包括分段交叉和分段變異;步驟4、在所述新種群中隨機(jī)選擇兩個(gè)個(gè)體作為雙親個(gè)體,并根據(jù)交叉概率進(jìn)行分段交叉,產(chǎn)生涵蓋所述顏色特征、形狀特征和紋理特征的兩個(gè)子個(gè)體,并按照步驟2所述的方法計(jì)算所述兩個(gè)子個(gè)體的適應(yīng)度;步驟5、對(duì)所述兩個(gè)子個(gè)體分別根據(jù)變異概率進(jìn)行分段變異,產(chǎn)生涵蓋所述顏色特征、形狀特征和紋理特征的兩個(gè)新一代個(gè)體并替換所述雙親個(gè)體,并按照步驟2所述的方法計(jì)算所述兩個(gè)新一代個(gè)體的適應(yīng)度;重復(fù)所述步驟4和步驟5直到所述新種群中的所有個(gè)體都進(jìn)行所述遺傳操作后得到新一代種群;所述遺傳操作結(jié)束后,令所述進(jìn)化代數(shù)加1;步驟6、判斷所述進(jìn)化代數(shù)是否達(dá)到指定的最大進(jìn)化代數(shù)或者所述新一代種群中所有個(gè)體的平均適應(yīng)度的差異連續(xù)G代都小于指定的閾值T,G和T為經(jīng)驗(yàn)常數(shù);若是,則繼續(xù)執(zhí)行步驟7,否則,繼續(xù)執(zhí)行步驟3~步驟5;步驟7、將所述新一代種群中具有最高適應(yīng)度的個(gè)體解碼,得到所述棉花異性纖維目標(biāo)圖像的最優(yōu)特征子集,所述最優(yōu)特征子集為從所述棉花異性纖維目標(biāo)圖像的待選擇的顏色特征、形狀特征和紋理特征中選擇得到的特征。
2、 根據(jù)權(quán)利要求l所述的棉花異性纖維目標(biāo)圖像的特征選擇方法,其 特征在于,所述步驟3包括根據(jù)精英策略選擇具有最高適應(yīng)度的個(gè)體直接作為所述新一代種群 中的個(gè)體;根據(jù)輪盤賭法則結(jié)合所述個(gè)體的選中概率選出用于遺傳操作的 新種群,所述選中和克率與所述個(gè)體的適應(yīng)度成正比。
3、 根據(jù)權(quán)利要求l所述的棉花異性纖維目標(biāo)圖像的特征選擇方法,其概率,所述交叉概率隨著進(jìn)化代數(shù)的不斷增加而逐漸變小。
4、 根據(jù)權(quán)利要求l所述的棉花異性纖維目標(biāo)圖像的特征選擇方法,其 特征在于,所述步驟5中的變異概率為隨進(jìn)化代數(shù)不斷變化的自適應(yīng)變異 概率,所述變異概率隨著進(jìn)化代數(shù)的不斷增加而逐漸變小。
5、 根據(jù)權(quán)利要求l所述的棉花異性纖維目標(biāo)圖像的特征選擇方法,其 特征在于,所述步驟4還包括若產(chǎn)生不涵蓋所述顏色特征、形狀特征和/或紋理特征的個(gè)體,則采用 隨機(jī)反轉(zhuǎn)所述個(gè)體中某個(gè)基因的方式進(jìn)行修正,以使得所述個(gè)體涵蓋所述 顏色特征、形狀特征和統(tǒng)理特征。
6、 根據(jù)權(quán)利要求l所述的棉花異性纖維目標(biāo)圖像的特征選擇方法,其 特征在于,所述步驟5還包括若產(chǎn)生不涵蓋所述顏色特征、形狀特征和/或紋理特征的個(gè)體,則重新 對(duì)所述個(gè)體根據(jù)變異概率進(jìn)行分段變異,直至所述個(gè)體涵蓋所述顏色特 征、形狀特征和纟丈理特征。
7、 一種棉花異性纖維目標(biāo)圖像的特征選擇系統(tǒng),其特征在于,包括: 初始化模塊、適應(yīng)度計(jì)算模塊、比例選擇模塊、分段交叉模塊、分段變異 模塊、進(jìn)化終止判斷模塊和最優(yōu)特征子集輸出模塊;所述初始化模塊,用于利用分段式二進(jìn)制編碼方案對(duì)棉花異性纖維目 標(biāo)圖像的待選擇的顏色特征、形狀特征和紋理特征進(jìn)行基因編碼,隨機(jī)生成含有多個(gè)分別代表不同特征子集的個(gè)體的初始種群;每個(gè)所述個(gè)體表示 的特征子集均涵蓋所述顏色特征、形狀特征和紋理特征;設(shè)置進(jìn)化代數(shù)為 0;所述適應(yīng)度計(jì)算模塊,用于計(jì)算所述初始種群中每個(gè)個(gè)體的適應(yīng)度; 所述適應(yīng)度是按照所述個(gè)體表示的特征子集構(gòu)造的分類器的分類正確率 與所述特征子集的加權(quán)大小作差得到的;所述比例選擇模塊,用于根據(jù)所述適應(yīng)度對(duì)所述初始種群中的多個(gè)個(gè) 體進(jìn)行選擇得到最高適應(yīng)度個(gè)體和用于遺傳操作的新種群,所述遺傳操作 包括分段交叉和分段變異;所述分段交叉模塊,用于在所述新種群中隨機(jī)選擇兩個(gè)個(gè)體作為雙親 個(gè)體,并根據(jù)交叉概率進(jìn)行分段交叉,產(chǎn)生涵蓋所述顏色特征、形狀特征 和紋理特征的兩個(gè)子個(gè)體;并調(diào)用所述適應(yīng)度計(jì)算模塊來計(jì)算所述兩個(gè)子 個(gè)體的適應(yīng)度;所述分段變異模塊,用于對(duì)所述兩個(gè)子個(gè)體分別根據(jù)變異概率進(jìn)行分 段變異,產(chǎn)生涵蓋所述顏色特征、形狀特征和紋理特征的兩個(gè)新一代個(gè)體 并替換所述雙親個(gè)體,并調(diào)用所述適應(yīng)度計(jì)算模塊來計(jì)算所述兩個(gè)新一代 個(gè)體的適應(yīng)度;重復(fù)執(zhí)行分段交叉模塊和分段變異模塊直到所述新種群中 的所有個(gè)體都進(jìn)行所述遺傳操作后得到新一代種群;所述遺傳操作結(jié)束后,令所述進(jìn)化代數(shù)加1;所述進(jìn)化終止判斷模塊,用于判斷所述進(jìn)化代數(shù)是否達(dá)到指定的最大 進(jìn)化代數(shù)或者所述新一代種群中所有個(gè)體的平均適應(yīng)度的差異連續(xù)G代 都小于指定的閾值T, G和T為經(jīng)驗(yàn)常數(shù);若是,則執(zhí)行最優(yōu)特征子集輸 出模塊,否則,繼續(xù)執(zhí)行所述比例選擇模塊、分段交叉模塊和分段變異模 塊;所述最優(yōu)特征子集輸出模塊,用于將所述新一代種群中具有最高適應(yīng) 度的個(gè)體解碼,得到所述棉花異性纖維目標(biāo)圖像的最優(yōu)特征子集,所述最 優(yōu)特征子集為從所述棉花異性纖維目標(biāo)圖像的待選擇的顏色特征、形狀特 征和紋理特征中選擇得到的特征。
8、 根據(jù)權(quán)利要求7所述的棉花異性纖維目標(biāo)圖像的特征選擇系統(tǒng), 其特征在于,所述比例選擇模塊包括精英策略單元,用于選擇具有最高適應(yīng)度的個(gè)體并直接作為所述新一 代種群中的個(gè)體;輪盤賭法則單元,用于結(jié)合所述個(gè)體的選中概率選擇用于遺傳操作的 新種群,所述選中^t率與所述個(gè)體的適應(yīng)度成正比。
9、 根據(jù)權(quán)利要求7所述的棉花異性纖維目標(biāo)圖像的特征選擇系統(tǒng), 其特征在于,所述分段交叉模塊包括第一修正單元,用于在產(chǎn)生不涵蓋所述顏色特征、形狀特征和/或紋理 特征的個(gè)體時(shí),采用隨機(jī)反轉(zhuǎn)所述個(gè)體中某個(gè)基因的方式進(jìn)行修正,以使 得所述個(gè)體涵蓋所述顏色特征、形狀特征和紋理特征。
10、 根據(jù)權(quán)利要求7所述的棉花異性纖維目標(biāo)圖像的特征選擇系統(tǒng), 其特征在于,所述分段變異模塊包括第二修正單元,用于在產(chǎn)生不涵蓋所述顏色特征、形狀特征和/或紋理 特征的個(gè)體時(shí),重新對(duì)所述個(gè)體根據(jù)變異概率進(jìn)行分段變異,直至所述個(gè) 體涵蓋所述顏色特征、形狀特征和紋理特征。
全文摘要
本發(fā)明公開了一種棉花異性纖維目標(biāo)圖像的特征選擇方法及系統(tǒng)。其中方法包括利用分段式二進(jìn)制編碼方案對(duì)棉花異性纖維目標(biāo)圖像的待選擇的顏色特征、形狀特征和紋理特征進(jìn)行基因編碼并隨機(jī)生成初始種群;計(jì)算所述初始種群中個(gè)體的適應(yīng)度;根據(jù)所述適應(yīng)度對(duì)所述初始種群進(jìn)行選擇得出新種群;對(duì)所述新種群中的個(gè)體進(jìn)行分段交叉和變異產(chǎn)生新個(gè)體并替換原個(gè)體,計(jì)算新個(gè)體的適應(yīng)度;判斷是否符合終止條件;在符合終止條件時(shí),將具有最高適應(yīng)度的個(gè)體解碼,得到所述棉花異性纖維目標(biāo)圖像的最優(yōu)特征子集。本發(fā)明實(shí)現(xiàn)了對(duì)棉花異性纖維目標(biāo)圖像中不同性質(zhì)特征的覆蓋,選擇出具有最佳分類能力的最優(yōu)特征子集,利于后續(xù)實(shí)現(xiàn)異性纖維的快速正確分類。
文檔編號(hào)G01N21/88GK101587545SQ20091008739
公開日2009年11月25日 申請(qǐng)日期2009年6月19日 優(yōu)先權(quán)日2009年6月19日
發(fā)明者康玉國(guó), 李付堂, 李道亮, 楊文柱, 王金星, 魏新華 申請(qǐng)人:中國(guó)農(nóng)業(yè)大學(xué)