本發(fā)明涉及植物識(shí)別技術(shù)領(lǐng)域,具體涉及一種基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別方法及系統(tǒng)。
背景技術(shù):
在經(jīng)典的模式識(shí)別中,一般是事先提取預(yù)設(shè)的植物圖像的特征(如sift,hog,lbp特征)。提取特征后,對(duì)特征進(jìn)行編碼,比如常用bow,fishervector等。然后將特征放到一個(gè)分類器,比如svm,進(jìn)行2分類,訓(xùn)練出最優(yōu)分類面,找到最能代表某類植物的的特征,去掉對(duì)分類無關(guān)和自相關(guān)的特征。然而,這些特征的提取太過依賴人的經(jīng)驗(yàn)和主觀意識(shí),提取到的特征的不同對(duì)分類性能影響很大,甚至提取的特征的順序也會(huì)影響最后的植物分類性能。同時(shí),圖像預(yù)處理的好壞也會(huì)影響到提取的特征。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是簡化植物識(shí)別的步驟,降低植物識(shí)別過程的計(jì)算量并提高植物識(shí)別的精度。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別方法,包括如下步驟:
采集的植物圖像,將植物圖像中同類的植物進(jìn)行分類并標(biāo)記,得到植物數(shù)據(jù)庫;
將植物數(shù)據(jù)庫中植物圖像輸入至卷積神經(jīng)網(wǎng)絡(luò),對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練得到特征匹配模型;
接收待識(shí)別圖像,利用特征匹配模型提取待識(shí)別圖像的圖像特征值,并計(jì)算圖像特征值與植物數(shù)據(jù)庫中植物的相似度,根據(jù)相似度判斷待識(shí)別圖像所屬植物的分類。
進(jìn)一步,在上述基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別方法中,卷積神經(jīng)網(wǎng)絡(luò)依次包括輸入層、卷積操作層和輸出層,其中,
輸入層,用于接收植物圖像;
卷積操作層包括卷積層和池化層,其中,
卷積層,用于根據(jù)卷積核提取圖像特征矩陣;
池化層,用于提取出每個(gè)圖像特征矩陣中最能代表這個(gè)植物圖像局部特征的圖像特征值。
進(jìn)一步,在上述基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別方法中,所述接收待識(shí)別圖像,利用特征匹配模型提取待識(shí)別圖像的圖像特征值,并計(jì)算圖像特征值與植物數(shù)據(jù)庫中植物的相似度,根據(jù)相似度判斷待識(shí)別圖像所屬植物的分類包括
利用特征匹配模型中卷積核提取n個(gè)圖像特征矩陣,并提取每個(gè)圖像特征矩陣中圖像特征值;
根據(jù)所有圖像特征值得到特征值矩陣;
利用預(yù)設(shè)的函數(shù)計(jì)算特征值矩陣與植物數(shù)據(jù)庫中植物的相似度。
進(jìn)一步,在上述基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別方法中,所述將植物數(shù)據(jù)庫中植物圖像輸入至卷積神經(jīng)網(wǎng)絡(luò)之前還包括
對(duì)植物圖像進(jìn)行預(yù)處理,預(yù)處理至少包括歸一化、明亮度調(diào)整或降噪。
進(jìn)一步,在上述基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別方法中,圖像特征值至少包括顏色值、輪廓值、邊緣值、灰度值。
本發(fā)明還提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別系統(tǒng),包括
接收模塊,用于采集的植物圖像,將植物圖像中同類的植物進(jìn)行分類并標(biāo)記,得到植物數(shù)據(jù)庫;
特征提取模塊,用于將植物數(shù)據(jù)庫中植物圖像輸入至卷積神經(jīng)網(wǎng)絡(luò),對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練得到特征匹配模型;
識(shí)別模塊,用于接收待識(shí)別圖像,利用特征匹配模型提取待識(shí)別圖像的圖像特征值,并計(jì)算圖像特征值與植物數(shù)據(jù)庫中植物的相似度,根據(jù)相似度判斷待識(shí)別圖像所屬植物的分類。
進(jìn)一步,在上述基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別系統(tǒng)中,所述識(shí)別模塊包括
卷積單元,用于利用特征匹配模型中卷積核提取n個(gè)圖像特征矩陣,并提取每個(gè)圖像特征矩陣中圖像特征值;
池化單元,用于根據(jù)所有圖像特征值得到特征值矩陣;
計(jì)算單元,用于利用預(yù)設(shè)的函數(shù)計(jì)算特征值矩陣與植物數(shù)據(jù)庫中植物的相似度。
進(jìn)一步,在上述基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別系統(tǒng)中,所述特征提取模塊包括
預(yù)處理子單元,用于對(duì)植物圖像進(jìn)行預(yù)處理,預(yù)處理至少包括歸一化、明亮度調(diào)整或降噪。
在上述技術(shù)方案中,本發(fā)明與傳統(tǒng)的識(shí)別方法中必須先找到葉子的輪廓或者邊緣等完全不同,不用定義任何邊緣或者輪廓;本發(fā)明利用卷積神經(jīng)網(wǎng)絡(luò)避免了顯式的特征取樣,隱式地從訓(xùn)練數(shù)據(jù)中進(jìn)行學(xué)習(xí)。這使得卷積神經(jīng)網(wǎng)絡(luò)明顯有別于其他基于神經(jīng)網(wǎng)絡(luò)的分類器,通過結(jié)構(gòu)重組和減少權(quán)值將特征提取功能融合進(jìn)多層感知器。它可以直接處理灰度圖片,能夠直接用于處理基于圖像的分類。
附圖說明
為了更清楚地說明本申請(qǐng)實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明中記載的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明所述的基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別方法一個(gè)實(shí)施例的流程示意圖;
圖2為本發(fā)明所述的基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別方法一個(gè)實(shí)施例中
s103的流程示意圖;
圖3為本發(fā)明所述的基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別方法一個(gè)實(shí)施例中
s103中特征提取計(jì)算示意圖;
圖4為本發(fā)明所述的基于卷積神經(jīng)網(wǎng)絡(luò)的植物系統(tǒng)一個(gè)實(shí)施例的框圖結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本領(lǐng)域的技術(shù)人員更好地理解本發(fā)明的技術(shù)方案,下面將結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)介紹。
如圖1所示,本發(fā)明提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別方法,包括如下步驟:
s101、采集的植物圖像,將植物圖像中同類的植物進(jìn)行分類并標(biāo)記,得到植物數(shù)據(jù)庫;具體實(shí)施時(shí),采集的圖像可選的利用包括攝像頭在內(nèi)的設(shè)備進(jìn)行拍攝,如手機(jī)、ipad等。
該步驟目的在于收集足夠多的植物的圖像,并對(duì)每個(gè)圖像進(jìn)行標(biāo)記(即標(biāo)明每個(gè)植物圖像中存在哪類植物,如圖像中有玫瑰花,或者有松樹等),從而形成每個(gè)植物種類的圖像集(如玫瑰花這個(gè)類有200張照片,牡丹花有100張圖片等等,每張圖片對(duì)應(yīng)著一個(gè)植物的種類)。
s102、將歸類并標(biāo)記后的植物圖像輸入至卷積神經(jīng)網(wǎng)絡(luò),對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練得到圖像特征匹配模型;
本發(fā)明中所述卷積神經(jīng)網(wǎng)絡(luò)依次包括輸入層、卷積操作層和輸出層,其中,
輸入層,用于接收植物圖像;
卷積操作層包括卷積層和池化層,其中,
卷積層,用于根據(jù)卷積核提取圖像特征矩陣;
池化層,用于提取出每個(gè)圖像特征矩陣中最能代表這個(gè)植物圖像局部特征的圖像特征值。
訓(xùn)練過程:將過程s101中的采集到的植物圖像按批量輸入到cnn網(wǎng)絡(luò)中(cnn網(wǎng)絡(luò)需要進(jìn)行隨機(jī)的初始化),計(jì)算出該批量與目標(biāo)之間的差距(稱之為loss),然后根據(jù)這個(gè)loss對(duì)于網(wǎng)絡(luò)中的卷積核(即參數(shù))進(jìn)行求偏微分,計(jì)算出每個(gè)卷積核(具體可采用通用的函數(shù)如sigmoid,relu等進(jìn)行計(jì)算)與目標(biāo)之間的差距,并對(duì)相關(guān)的參數(shù)(參考學(xué)習(xí)比率)進(jìn)行更新,從而更新整個(gè)cnn神經(jīng)網(wǎng)絡(luò);更換圖像輸入至cnn網(wǎng)絡(luò)中,根據(jù)預(yù)先設(shè)定的批量、訓(xùn)練次數(shù)等重復(fù)執(zhí)行,對(duì)整個(gè)神經(jīng)網(wǎng)絡(luò)的相關(guān)參數(shù)進(jìn)行更新,直到最后得到一個(gè)完整的神經(jīng)網(wǎng)絡(luò)(包括相關(guān)的路徑與參數(shù)),即得到一個(gè)訓(xùn)練好的cnn神經(jīng)網(wǎng)絡(luò)模型。
s103、接收待識(shí)別圖像,利用特征匹配模型提取待識(shí)別圖像的圖像特征值,并計(jì)算圖像特征值與植物數(shù)據(jù)庫中植物的相似度,根據(jù)相似度判斷待識(shí)別圖像所屬植物的分類。
傳統(tǒng)的分類方式幾乎都是基于統(tǒng)計(jì)特征的,這就意味著在進(jìn)行分辨前必須提取某些特征。然而,顯式的特征提取并不容易,在一些應(yīng)用問題中也并非總是可靠的。本發(fā)明利用卷積神經(jīng)網(wǎng)絡(luò)較一般神經(jīng)網(wǎng)絡(luò)在圖像處理方面有如下優(yōu)點(diǎn):a)輸入圖像和網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)能很好的吻合;b)特征提取和模式分類同時(shí)進(jìn)行,并同時(shí)在訓(xùn)練中產(chǎn)生;c)權(quán)重共享可以減少網(wǎng)絡(luò)的訓(xùn)練參數(shù),使神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)變得更簡單,適應(yīng)性更強(qiáng)。
進(jìn)一步,如圖2所示具體實(shí)施時(shí)s103包括
s1031、利用特征匹配模型中卷積核提取n個(gè)圖像特征矩陣,并提取每個(gè)圖像特征矩陣中圖像特征值;進(jìn)一步,圖像特征值包括顏色值、輪廓值、邊緣值、灰度值等等。
s1032、根據(jù)所有圖像特征值得到特征值矩陣;
s1033、利用預(yù)設(shè)的函數(shù)計(jì)算特征值矩陣與植物數(shù)據(jù)庫中植物的相似度。
現(xiàn)以如圖3所示的示意圖可知,本發(fā)明通過圖像特征矩陣到特征值矩陣的變換極大的降低了相似度計(jì)算過程的計(jì)算量,提高了計(jì)算速度。
本發(fā)明中利用植物圖像對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),可首先將植物圖像進(jìn)行分類,將每一個(gè)植物的圖像進(jìn)行拆分,分為訓(xùn)練用圖像和校驗(yàn)用圖像。將校驗(yàn)圖像輸入到神經(jīng)網(wǎng)絡(luò)模型中,提取出對(duì)應(yīng)的特征,再與卷積神經(jīng)網(wǎng)絡(luò)中的算法路徑與參數(shù)集合進(jìn)行比較,根據(jù)圖像特征計(jì)算出該特征與該植物名稱的相似度,從而檢驗(yàn)?zāi)P偷臏?zhǔn)確性;如果模型準(zhǔn)確度低,可以再次對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,更深層次的去提取這些圖像的特征關(guān)系(更多的是算法路徑與參數(shù)),形成新的模型(即包括算法路徑+參數(shù)的集合);得到更新的模型后,在使用中,直接按照模型中的算法與參數(shù)來對(duì)新進(jìn)的數(shù)據(jù)如圖像進(jìn)行特征比對(duì),獲得相關(guān)的相似度值。
下面以接收?qǐng)D像為例說明本發(fā)明中卷積神經(jīng)網(wǎng)絡(luò)工作流程如下,輸入層由32×32個(gè)感知節(jié)點(diǎn)組成,接收原始圖像。然后,計(jì)算流程在卷積和子抽樣之間交替進(jìn)行,如下所述:
第一隱藏層進(jìn)行卷積,它由8個(gè)特征映射組成,每個(gè)特征映射由28×28個(gè)神經(jīng)元組成,每個(gè)神經(jīng)元指定一個(gè)5×5的接受域,這28×28個(gè)神經(jīng)元共享5×5個(gè)權(quán)值參數(shù),即卷積核;
第二隱藏層實(shí)現(xiàn)子抽樣和局部平均,它同樣由8個(gè)特征映射組成,但其每個(gè)特征映射由14×14個(gè)神經(jīng)元組成。每個(gè)神經(jīng)元具有一個(gè)2×2的接受域,一個(gè)可訓(xùn)練系數(shù),一個(gè)可訓(xùn)練偏置和一個(gè)sigmoid激活函數(shù)??捎?xùn)練系數(shù)和偏置控制神經(jīng)元的操作點(diǎn);
第三隱藏層進(jìn)行第二次卷積,它由20個(gè)特征映射組成,每個(gè)特征映射由10×10個(gè)神經(jīng)元組成。該隱藏層中的每個(gè)神經(jīng)元可能具有和下一個(gè)隱藏層幾個(gè)特征映射相連的突觸連接,它以與第一個(gè)卷積層相似的方式操作。
第四個(gè)隱藏層進(jìn)行第二次子抽樣和局部平均汁算。它由20個(gè)特征映射組成,但每個(gè)特征映射由5×5個(gè)神經(jīng)元組成,它以與第一次抽樣相似的方式操作。
第五個(gè)隱藏層實(shí)現(xiàn)卷積的最后階段,它由120個(gè)神經(jīng)元組成,每個(gè)神經(jīng)元指定一個(gè)5×5的接受域。
最后是個(gè)全連接得到輸出向量。
相繼的計(jì)算層在卷積和抽樣之間的連續(xù)交替,我們得到一個(gè)“雙尖塔”的效果,也就是在每個(gè)卷積或抽樣層,隨著空間分辨率下降,與相應(yīng)的前一層相比特征映射的數(shù)量增加。卷積之后進(jìn)行子抽樣的思想是受到動(dòng)物視覺系統(tǒng)中的“簡單的”細(xì)胞后面跟著“復(fù)雜的”細(xì)胞的想法的啟發(fā)而產(chǎn)生的。
進(jìn)一步,所述s101還包括
對(duì)植物圖像進(jìn)行預(yù)處理,預(yù)處理至少包括歸一化、明亮度調(diào)整或降噪。
圖像中由于各種原因,在拍攝或者傳輸壓縮的過程中,帶入了有規(guī)律的噪聲,可以通過技術(shù)手段對(duì)圖像進(jìn)行降噪處理,目的是加大對(duì)于圖像中特征部分的描述,凸顯特征,使特征更為鮮明。這種手段是預(yù)先的設(shè)置,與卷積的部分功用類似,即將植物的圖像與分類信息輸入到神經(jīng)網(wǎng)絡(luò)模型中,由模型中的算法、處理流程對(duì)圖像進(jìn)行處理(如對(duì)于圖像的處理包括了灰度、切分、特征映射等等)。該處理是對(duì)同一類別圖像中訓(xùn)練用圖像進(jìn)行處理,找到該類圖像比較一致的特征(該特征不一定為所有圖像所共有),根據(jù)處理的結(jié)果,生成對(duì)應(yīng)的算法路徑與參數(shù)集合。
如圖4所示,本發(fā)明提供了一種基于卷積神經(jīng)網(wǎng)絡(luò)的植物識(shí)別系統(tǒng),包括接收模塊10、特征提取模塊20、識(shí)別模塊30。其中,
接收模塊10,用于采集的植物圖像,將植物圖像中同類的植物進(jìn)行分類并標(biāo)記,得到植物數(shù)據(jù)庫;
特征提取模塊20,用于將植物數(shù)據(jù)庫中植物圖像輸入至卷積神經(jīng)網(wǎng)絡(luò),對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練得到特征匹配模型;
識(shí)別模塊30,用于接收待識(shí)別圖像,利用特征匹配模型提取待識(shí)別圖像的圖像特征值,并計(jì)算圖像特征值與植物數(shù)據(jù)庫中植物的相似度,根據(jù)相似度判斷待識(shí)別圖像所屬植物的分類。
采集100張菊花的不同照片,將照片分為90張的訓(xùn)練集a和10張圖像校驗(yàn)集合b;
首先將90張圖像分別輸入到卷積神經(jīng)網(wǎng)絡(luò)模型中,假設(shè)卷積神經(jīng)網(wǎng)絡(luò)模型中會(huì)做如下處理:
a)把每個(gè)圖像切分成16*16=256份圖像
b)提取每個(gè)圖像的灰度;
c)提取每個(gè)圖像的色彩;
d)提取每個(gè)圖像的邊緣特征等
e)以上完成基本特征的數(shù)據(jù)整理
f)在第一次訓(xùn)練中,模型對(duì)每個(gè)圖像切分出來的小的圖像的灰度值進(jìn)行比對(duì),統(tǒng)計(jì)出每個(gè)小的圖像的灰度分布比較;
g)在第二次訓(xùn)練中,對(duì)每個(gè)小的圖像的色彩值進(jìn)行比對(duì),統(tǒng)計(jì)出色彩值得分布;
h)在第三次訓(xùn)練中,統(tǒng)計(jì)出邊緣特征值得分布;
i)重復(fù)多次訓(xùn)練,通過對(duì)圖像進(jìn)行更細(xì)節(jié)的分割,特征提取,從而能夠形成該植物特有的處理路徑,參數(shù)集合(即特征分布);
其次,10張圖像可以用于生成的圖像特征識(shí)別模型是否形成了該植物特有的路徑集合與參數(shù)集合;
最后,判斷一個(gè)未知圖像中的花是否為菊花,則將該圖像輸入到模型,按照模型集合中每一類植物的路徑特征與參數(shù)集合,計(jì)算出該植物與模型中每類植物的相似度(該相似度其實(shí)是該植物不同維度特征權(quán)重與統(tǒng)計(jì)分布的統(tǒng)計(jì)結(jié)果,比如菊花的灰度值為100,統(tǒng)計(jì)分布區(qū)域?yàn)?80~120),正態(tài)分布,灰度特征在整個(gè)菊花的識(shí)別模型中權(quán)重為0.01)。
以上只通過說明的方式描述了本發(fā)明的某些示范性實(shí)施例,毋庸置疑,對(duì)于本領(lǐng)域的普通技術(shù)人員,在不偏離本發(fā)明的精神和范圍的情況下,可以用各種不同的方式對(duì)所描述的實(shí)施例進(jìn)行修正。因此,上述附圖和描述在本質(zhì)上是說明性的,不應(yīng)理解為對(duì)本發(fā)明權(quán)利要求保護(hù)范圍的限制。