本發(fā)明屬于圖像處理技術領域,通過結構化隨機森林實現(xiàn)油瓶裝箱圖像的邊緣檢測,通過實現(xiàn)提環(huán)清點完成油瓶清點,為一種基于結構化隨機森林的油瓶裝箱清點方法。
背景技術:
油瓶裝箱自動化對于工作效率的需求不斷提升,傳統(tǒng)的人工提環(huán)檢測模式已經(jīng)不能滿足生產(chǎn)的需要?;跈C器視覺的油瓶提環(huán)裝箱檢測系統(tǒng)由于其客觀性、精確性、以及成本低等優(yōu)勢,很好地代替了繁瑣的傳統(tǒng)人工勞動力,大大提高了提環(huán)清點的效率。
邊緣檢測是油瓶裝箱清點系統(tǒng)中必不可少的重要環(huán)節(jié),為后續(xù)的匹配過程提供裝箱圖片的真實邊緣圖像。由于油瓶裝箱圖片的復雜特征,傳統(tǒng)的邊緣檢測方法通常會產(chǎn)生無關的虛假邊緣,影響瓶蓋的圓擬合以及提環(huán)邊緣形狀的準確提取。油瓶裝箱清點系統(tǒng)中的邊緣檢測環(huán)節(jié)通?;赾anny算子、顯著性檢測和laplace算子來實現(xiàn)。顯著性檢測從一整幅圖像中找到最引人注目的局部,但當提環(huán)、油體顏色相近,瓶身紋路影響明顯時,無法檢出邊緣?;赾anny算子的方法和基于laplace算子的方法對噪聲敏感,無法排除非感興趣區(qū)域背景干擾,且參數(shù)需要手動設置,無法自適應地應對所有場景。
技術實現(xiàn)要素:
本發(fā)明要解決的問題是:現(xiàn)有裝箱清點系統(tǒng)依賴人眼觀察,效率低下;現(xiàn)有通過機械設備完成裝箱清點的方法耐用性不強,不滿足工業(yè)生產(chǎn)的長期耐用性要求;現(xiàn)有能夠快速進行裝箱清點的方法僅能應對簡單場景,對瓶身紋路、提環(huán)顏色、油體顏色等因素的造成的干擾效果較差??偠灾?,現(xiàn)有方法難以做到高實時性和高正確率的兼容。
本發(fā)明的技術方案為:一種基于結構化隨機森林的油瓶裝箱清點方法,包括以下步驟:
1)讀入訓練樣本圖像,包括油瓶裝箱圖像以及其對應的真實邊緣圖像,通過步長為2的滑動窗口將樣本圖像分割成16*16的圖像塊,提取圖像塊特征,由油瓶裝箱圖像得到相樣本特征集x,由真實邊緣圖像得到真實邊緣標簽集y,樣本特征集x和真實邊緣標簽集y相對應;
2)簡化真實邊緣標簽集y,將標簽集y通過函數(shù)
3)訓練決策樹,訓練決策樹的過程就是對決策樹中各個節(jié)點進行訓練的過程,對決策樹中的任一節(jié)點q,訓練集為sq∈x×y,訓練的目標是找到當前節(jié)點分裂函數(shù)h(x,θq)的參數(shù)θq;x為樣本特征集x的特征數(shù)據(jù),分裂函數(shù)選為二進制函數(shù):
h(x,θq)∈{0,1}(1)
h(x,θq)比較x中第k維特征的值與參數(shù)閾值τ的關系,即θq={k,τ},訓練θq的過程就是訓練τ和k的過程;
如果h(x,θq)=0,則將當前樣本x和對應的標簽y放到?jīng)Q策樹左葉,否則將樣本x和對應的標簽y放到右葉;
為了得到參數(shù)θq,定義節(jié)點q分裂后信息增益:
其中,sq為當前節(jié)點q上需要處理的圖像塊特征總集合,
這里的函數(shù)h(s)=-∑ypylog(py)為香農(nóng)熵,py為邊緣標簽y在s出現(xiàn)的概率;
對決策樹中每個節(jié)點進行上述訓練,得到各節(jié)點的分裂函數(shù)參數(shù),當一個節(jié)點分裂后香農(nóng)熵為0,停止分裂,設置該節(jié)點為結果節(jié)點,結果節(jié)點的輸出為該節(jié)點數(shù)量占比最大的邊緣標簽,
4)重復t次步驟3),生成的t棵決策樹,聯(lián)合形成訓練好的油瓶提環(huán)檢測隨機森林模型;
5)根據(jù)訓練后的隨機森林模型,實現(xiàn)待測油瓶裝箱圖像的真實邊緣檢測,檢測時,生成的決策樹輸入為待測圖像塊的特征數(shù)據(jù)x,根據(jù)特征數(shù)據(jù)x最終分配到的結果節(jié)點,輸出邊緣標簽y,得到邊緣圖;
6)通過霍夫圓方法檢測出步驟5)得到的邊緣圖中油瓶瓶蓋可能存在的位置,分割出可能存在油瓶提環(huán)的待測圖像塊,計算預設好的提環(huán)標準模板圖像塊邊緣點集與待測圖像塊邊緣點集的hausdorff距離,篩選真實提環(huán)個數(shù),實現(xiàn)提環(huán)清點,即完成油瓶數(shù)量的清點。
進一步的,步驟1)中特征集x和標簽集y的具體生成方法為:對訓練集圖像中一個16*16的塊,提取特征數(shù)據(jù)x(i,j,k),k為特征通道數(shù),i、j為像素點的位置,k為特征所在通道,同時將該圖像塊對應的真實邊緣圖記錄為為16*16的分割掩膜y,以步長2的滑動窗口在訓練集中所有圖像上滑動,生成的所有特征數(shù)據(jù)x(i,j,k)組成特征集x,所有的邊緣標簽y組成標簽集y。
其中,獲取特征數(shù)據(jù)x的通道包括:
a)rgb色彩空間中的三顏色通道圖像;
b)原始尺度和高斯濾波后圖像塊的梯度幅值圖,高斯濾波取卷積核尺寸5*5,標準差σ=1;
c)梯度圖在四個方向:垂直、水平和
特征通道總數(shù)k=13,每個特征數(shù)據(jù)的維度是16*16*13=3328;
增加特征描述x(i1,j1,k)-x(i2,j2,k),i1、j1、i2、j2表示像素對的位置,對每個通道圖像進行三角濾波并降采樣到5*5,采樣所有的像素對并計算它們的像素差值,每個通道的特征數(shù)據(jù)將再增加
作為優(yōu)選方式,步驟3)中,為了簡化信息增益的計算,在式(3)計算過程中,對已經(jīng)映射到z空間的y再做進一步的簡化,利用主成分分析法將z空間的標簽向量降到1維,此時標簽向量空間為離散的形式,便于信息增益的計算。
作為優(yōu)選,步驟4)中t∈[4,6],以保證實時性。
步驟5)中,在對整幅圖像進行檢測時,采用滑動窗口方法,每隔2個像素提取一個16*16的圖像塊,利用訓練后的決策樹獲得當前圖像塊的邊緣標簽y,由于圖像塊之間有重疊,因此對每個像素點,將有8*8*t=64t個決策樹構成的決策森林,每棵樹的決策結果進行融合,最終,利用決策森林算法獲得的該像素點的分類結果就是64t個決策樹的平均。
具體的,步驟6)對于模板圖像塊中邊緣點集a={a1,a2,…,an},待測圖像塊邊緣點b={b1,b2,…,bn},則集合a到集合b的hausdorff距離:
h(a,b)=max(h(a,b),h(b,a))(4)
h(a,b)和h(b,a)分別代表a集合到b集合前向和后向hausdorff距離,其中
本發(fā)明基于結構化隨機森林實現(xiàn)油瓶裝箱圖像的邊緣檢測,提出一種新的油瓶裝箱清點方法。本發(fā)明方法通過結構化隨機森林訓練油瓶裝箱圖像,自動生成各個決策樹模型,并將生成的模型應用于待檢測圖片,得到邊緣檢測圖像。最后利用hausdorff距離實現(xiàn)油瓶提環(huán)的模板匹配,統(tǒng)計邊緣圖中提環(huán)個數(shù)。由于本發(fā)明方法結合了訓練樣本的先驗知識,在提取單個像素點特征的同時結合圖像塊的上下文信息,因此能夠較好地排除瓶身紋路干擾,對不同顏色的提環(huán)、油體也有很好的自適性。實驗結果表明,本發(fā)明方法能有效地實現(xiàn)油瓶裝箱清點。
附圖說明
圖1為基于結構化隨機森林的油瓶裝箱清點方法流程圖。
圖2為白色提環(huán)油瓶裝箱圖片檢測樣例圖,(a)為原始圖像,(b)為譜殘差法檢測圖,(c)為laplace算子邊緣檢測圖,(d)為canny算子邊緣檢測圖,(e)為本發(fā)明邊緣檢測圖(f)為本發(fā)明檢測結果圖。
圖3為金色提環(huán)油瓶裝箱圖片檢測樣例圖,(a)為原始圖像,(b)為譜殘差法檢測圖,(c)為laplace算子邊緣檢測圖,(d)為canny算子邊緣檢測圖,(e)為本發(fā)明邊緣檢測圖(f)為本發(fā)明檢測結果圖。
具體實施方式
本發(fā)明公開了一種基于結構化隨機森林的油瓶裝箱清點方法,具體實施方式如下:
1、特征提取,提取圖像特征。
本發(fā)明針對油瓶提環(huán)圖像進行,讀入訓練樣本圖像,包括圖像本身以及其對應的真實邊緣圖,通過步長為2的滑動窗口將樣本圖像分割成16*16的圖像塊,采用這個數(shù)值能在計算速度和檢測精度之間取得良好的平衡,提取圖像塊特征,得到相對應的樣本特征集x和真實邊緣標簽集y。特征集x和標簽集y的具體生成方法為:對訓練集圖像中一個16*16的塊,提取特征數(shù)據(jù)x(i,j,k),k為特征通道數(shù),i、j為像素點的位置,k為特征所在通道,同時將該圖像塊對應的真實邊緣圖記錄為為16*16的分割掩膜y。以步長2的滑動窗口在訓練集中所有圖像上滑動,生成的所有特征數(shù)據(jù)x(i,j,k)組成了特征集x,所有的邊緣標簽y組成了標簽集y。獲取特征數(shù)據(jù)x的通道包括:
a)rgb色彩空間中的三顏色通道圖像
b)原始尺度和高斯濾波后(卷積核尺寸5*5,標準差σ=1)圖像塊的梯度幅值圖
c)梯度圖在四個方向(垂直、水平、
因此特征通道總數(shù)k=13。每個特征數(shù)據(jù)的維度是16*16*13=3328。
由于以上特征僅展現(xiàn)了單個像素點的像素值信息,無法表達像素間的位置信息,因此再增加特征描述x(i1,j1,k)-x(i2,j2,k),i1、j1、i2、j2表示像素對的位置,k表示像素對所在通道。對每個通道圖像進行三角濾波并降采樣到5*5,采樣所有的像素對并計算他們的像素差值,每個通道的特征數(shù)據(jù)將再增加
2、空間映射,簡化真實邊緣標簽集y:
標簽空間y維度較大,需簡化該空間才能提高檢測的效率。因此,將標簽集y通過函數(shù)
3、訓練決策樹
訓練決策樹的過程就是對決策樹中各個節(jié)點進行訓練的過程,即建立決策樹。對決策樹中的任一給定節(jié)點q,訓練集為sq∈x×y,訓練的目標是找到當前節(jié)點分裂函數(shù)h(x,θq)的參數(shù)θq。x為樣本特征集x的特征數(shù)據(jù),分裂函數(shù)選為二進制函數(shù):
h(x,θq)∈{0,1}(1)
如果h(x,θq)=0則將當前樣本x和對應的標簽y放到左葉,否則將樣本x和對應的標簽y放到右葉。h(x,θq)的具體實現(xiàn)就是比較x中第k維特征的值與參數(shù)閾值τ的關系,即θq={k,τ},
其中,sq為當前節(jié)點q上需要處理的特征總集合,
這里的函數(shù)h(s)=-∑ypylog(py)為香農(nóng)熵,py為邊緣標簽y在s出現(xiàn)的概率,計算時將s代入sq或
對決策樹中每個節(jié)點進行上述訓練,得到各節(jié)點的分裂函數(shù)參數(shù),當一個節(jié)點分裂后香農(nóng)熵為0,停止分裂,設置該節(jié)點為結果節(jié)點,結果節(jié)點的輸出為該節(jié)點數(shù)量占比最大的邊緣標簽。
為了簡化信息增益的計算,對已經(jīng)映射到z空間的y再做進一步的簡化,利用主成分分析法將z空間的標簽向量降到1維,此時標簽向量空間為離散的形式,便于信息增益的計算。
4、生成隨機森林模型
重復t次步驟3,生成的t棵決策樹聯(lián)合形成訓練好的油瓶提環(huán)檢測隨機森林模型,作為優(yōu)選,t∈[4,6],以保證實時性。
5、集成隨機森林模型
以t=4為例,即訓練4個決策樹。在對整幅圖像進行檢測時,采用滑動窗口方法,每隔2個像素提取一個16*16的圖像塊,利用訓練后的決策樹獲得當前圖像塊的邊緣標簽y,由于圖像塊之間有重疊,因此對每個像素點,將有8*8*4=256個決策樹構成的決策森林,每棵樹的決策結果需要進行融合。最終,利用決策森林算法獲得的該像素點的分類結果就是256個決策樹的平均。
6、模板匹配,清點提環(huán)數(shù)量。
通過霍夫圓方法檢測提環(huán)邊緣圖中瓶蓋可能存在的位置,分割出可能存在提環(huán)的待測圖像塊。計算預先設好的提環(huán)標準模板圖像邊緣點集與待測圖像塊邊緣點集的hausdorff距離:
對于模板圖像塊中邊緣點集a={a1,a2,…,an},待測圖像塊邊緣點b={b1,b2,…,bn},則集合a到集合b的hausdorff距離:
h(a,b)=max(h(a,b),h(b,a))(8)
h(a,b)和h(b,a)分別代表a集合到b集合前向和后向hausdorff距離,其中
圖2、3為本發(fā)明實施效果圖,待檢測圖像來源于某灌裝生產(chǎn)線上的油瓶裝箱圖像數(shù)據(jù)集。圖2(a)顯示了數(shù)據(jù)集中的白色提環(huán)油瓶裝箱圖像,圖2(b)、(c)、(d),(e)分別為譜殘差法、laplace算子、canny算子、本發(fā)明檢測后的白色提環(huán)油瓶裝箱邊緣檢測圖,圖2(f)為本發(fā)明白色提環(huán)油瓶裝箱清點結果圖。圖3(a)顯示了數(shù)據(jù)集中的金色提環(huán)油瓶裝箱圖像,圖3(b)、(c)、(d),(e)分別為譜殘差法、laplace算子、canny算子、本發(fā)明檢測后的金色提環(huán)油瓶裝箱邊緣檢測圖,圖3(f)為本發(fā)明金色提環(huán)油瓶裝箱清點結果圖。由圖2、圖3可見顯著性檢測當瓶身紋路影響明顯時,現(xiàn)有技術無法檢出提環(huán),基于canny算子的方法和基于laplace算子的方法對噪聲敏感,無法排除瓶身紋路干擾,且參數(shù)需要手動設置,無法自適應地應對所有場景,例如canny算法會帶來偽邊緣,同時它的兩個參數(shù)需要人手動設置,不同顏色的提環(huán),不同的打光條件下參數(shù)都不相同,實際檢測時這種算法并不實用。而本發(fā)明檢測結果準確,受瓶身紋路和油體顏色、提環(huán)顏色的影響較小,能夠準確檢測出與油瓶相關的邊緣,彌補以上三種傳統(tǒng)邊緣提取方法的不足。對整個數(shù)據(jù)集的測試統(tǒng)計表明,無漏檢、錯檢圖像,正確率達99%,且在vs平臺下平均每幅圖像處理時間僅需90ms以內(nèi),本發(fā)明所提算法實現(xiàn)了既高正確率又高實時性的檢測。
本發(fā)明提供了一種基于結構化隨機森林的油瓶裝箱清點方法,具體實現(xiàn)該技術方案的方法和途徑很多,以上所述僅是本發(fā)明的優(yōu)選實施方案。應當指出,對于本技術領域的普通人員來說,在不脫離發(fā)明原理的前提下做出的任何同等替換和改進,都應視為本發(fā)明的保護范圍。另外,本實例中未明確的各組成部分均可用現(xiàn)有技術加以實現(xiàn)。