數(shù)再乘以每個 細胞單元對應的特征向量,主要通過將局部圖像區(qū)域進行編碼,將每個細胞單元中所有像 素梯度方向按照加權(quán)的思想累加到相應的直方圖方向區(qū)間內(nèi),形成最初的特征,比如將角 度范圍0~180度劃分為8等份,即將細胞單元的梯度方向180度劃分成8個方向塊,對細胞單 元內(nèi)每個像素梯度方向在直方圖中按梯度大小作為投影的權(quán)值進行加權(quán)投影(映射到固定 的角度范圍),就可以得到這個細胞單元的梯度方向直方圖;
[0048] 將相鄰的2X2的細胞單元組成重疊的塊,塊滑動大小為一個細胞單元的大小,在 每個塊里面進行梯度直方圖的二范數(shù)歸一化,疊加每個塊的直方圖信息得到Y(jié)通道的特征 向量、U通道的特征向量以及V通道的特征向量,比如,將所有重疊的塊里面的直方圖按照從 上到下或從左到右的順序組合起來,就形成最終的某一通道的特征向量,重疊的塊可以保 證每個單元胞體在最后的向量中出現(xiàn)多次,所以需要對梯隊強度做歸一化,由于光照以及 前景背景的對比度造成梯度強度變換范圍很廣,所以有效的局部歸一化方法可以減少這些 影響,提尚性能;
[0049] 將三個通道的特征向量進行疊加得到最終的局部梯度統(tǒng)計特征;
[0050] 步驟3、將所述局部梯度統(tǒng)計特征以及對應場景類別標簽加入到單隱層神經(jīng)網(wǎng)絡 分類器進行層級式監(jiān)督學習,得到復數(shù)個不同的多類單隱層神經(jīng)網(wǎng)絡的最優(yōu)參數(shù),根據(jù)所 述最優(yōu)參數(shù)構(gòu)建多層級場景分類器,所述多層級場景分類器的層級數(shù)根據(jù)場景本身屬性 的從屬關系進行劃分,每一級包括至少一個多類的單隱層神經(jīng)網(wǎng)絡,不同的多類單隱層神 經(jīng)網(wǎng)絡可以分別進行訓練;對于每個多類的單隱層神經(jīng)網(wǎng)絡,要學習的參數(shù)包括正則項系 數(shù)及隱層節(jié)點個數(shù),采用分別調(diào)參的策略,先隨機設置隱層節(jié)點個數(shù),學習出最優(yōu)的正則項 系數(shù),再將正則項系數(shù)設為最優(yōu)值,學習出最優(yōu)的隱層節(jié)點個數(shù),得到最優(yōu)的正則項系數(shù)和 隱層節(jié)點個數(shù)。
[0051] 所述識別階段包括:
[0052] 步驟4、對待識別的圖像集進行預處理,所述預處理包括圖像對比度歸一化和 Gamma校正處理,所述圖像對比度歸一化具體包括:將圖像從RGB顏色空間轉(zhuǎn)到Y(jié)UV顏色空間 以及對YUV顏色空間進行全局和局部對比歸一化處理,所述全局和局部對比歸一化處理過 程只對Y通道進行操作,而其他兩個通道保持不變,所述全局歸一化是將圖像像素值歸一化 到圖像像素均值附近,所述局部歸一化是對邊緣進行加強,通過圖像對比度的歸一化處理, 可顯著減輕由于圖像局部的陰影和光照變化所造成的影響。
[0053]步驟5、提取預處理后的待識別圖像集的局部梯度統(tǒng)計特征,該提取局部梯度統(tǒng)計 特征與步驟2中提取局部梯度統(tǒng)計特征的操作過程一致:
[0054]將待識別圖像分為Y、U、V三通道,分別計算Y通道、U通道和V通道的一階梯度,每一 通道的一階梯度均通過以下方式計算得到:采用Sobel算子對原圖像進行卷積操作得到X方 向(水平方向)的梯度分類Gx(X,y)及Y方向(豎直方向)的梯度分量G y(X,y),求取圖像中每個 像素點的梯度大小G(x,y)和方向δ (X,y)的公式為:
[0055]
[0056] 5=仍竹綱〈(7,在J'j/G/T, J力,Sobel算子操作簡單,但是結(jié)果卻比其他復 雜算子效果好;
[0057] 將待識別圖像劃分成不重疊的細胞單元,計算每個細胞單元的梯度直方圖;每個 滑動窗口由復數(shù)個塊組成,每個塊再劃分成復數(shù)個細胞單元(每個細胞單元由多個像素組 成的),每個窗口對應的一維特征向量維數(shù)就等于窗口塊數(shù)乘以塊中細胞單元數(shù)再乘以每 個細胞單元對應的特征向量,主要通過將局部圖像區(qū)域進行編碼,將每個細胞單元中所有 像素梯度方向按照加權(quán)的思想累加到相應的直方圖方向區(qū)間內(nèi),形成最初的特征,比如將 角度范圍0~180度劃分為8等份,即將細胞單元的梯度方向180度劃分成8個方向塊,對細胞 單元內(nèi)每個像素梯度方向在直方圖中按梯度大小作為投影的權(quán)值進行加權(quán)投影(映射到固 定的角度范圍),就可以得到這個細胞單元的梯度方向直方圖;
[0058]將相鄰的2X2的細胞單元組成重疊的塊,塊滑動大小為一個細胞單元的大小,在 每個塊里面進行梯度直方圖的二范數(shù)歸一化,疊加每個塊的直方圖信息得到γ通道的特征 向量、u通道的特征向量以及v通道的特征向量,比如,將所有重疊的塊里面的直方圖按照從 上到下或從左到右的順序組合起來,就形成最終的某一通道的特征向量,重疊的塊可以保 證每個單元胞體在最后的向量中出現(xiàn)多次,所以需要對梯隊強度做歸一化,由于光照以及 前景背景的對比度造成梯度強度變換范圍很廣,所以有效的局部歸一化方法可以減少這些 影響,提尚性能;
[0059]將三個通道的特征向量進行疊加得到最終的局部梯度統(tǒng)計特征,通過特征提取能 夠有效地將顏色信息融合到最終的特征中去,提高識別精度;
[0060] 步驟6、將提取到的所述待識別圖像的局部梯度統(tǒng)計特征向量送入所述多層級場 景分類器中進行識別,得到所屬場景類的類別標注,從而實現(xiàn)場景識別。
[0061] 所述單隱層神經(jīng)網(wǎng)絡的模型包括三層:輸入層、隱藏層和輸出層,所述輸入層接收 提取到的圖像的特征向量,經(jīng)過隱藏層進行數(shù)據(jù)處理后從輸出層輸出,根據(jù)輸出量決定當 前數(shù)據(jù)所屬的類型,所述隱含層包括L個隱含神經(jīng)元,一般情況下L遠小于樣本個數(shù),輸出層 輸出m維的向量,忽略輸入層和隱含層,只考慮隱含層神經(jīng)元的輸出和輸出層,最后優(yōu)化過 程不僅使誤差最小,也使隱含層輸出權(quán)值達到最小,這樣模型的泛化能力就最好。在訓練學 習時,通過給定的已知類別的訓練數(shù)據(jù)的訓練樣本(即一組觀測量)來估計模型的參數(shù),在 識別時,通過輸入當前待識別場景圖像的特征向量,將其送入已訓練好的單隱層神經(jīng)網(wǎng)絡 模型中,最后根據(jù)單隱層神經(jīng)網(wǎng)絡模型的輸出量,來決定當前測試數(shù)據(jù)所述的類型,其所屬 的類別由最高的輸出節(jié)點確定。
[0062]雖然以上描述了本發(fā)明的【具體實施方式】,但是熟悉本技術(shù)領域的技術(shù)人員應當理 解,我們所描述的具體的實施例只是說明性的,而不是用于對本發(fā)明的范圍的限定,熟悉本 領域的技術(shù)人員在依照本發(fā)明的精神所作的等效的修飾以及變化,都應當涵蓋在本發(fā)明的 權(quán)利要求所保護的范圍內(nèi)。
【主權(quán)項】
1. 一種基于單隱層神經(jīng)網(wǎng)絡的場景識別方法,其特征在于:包括訓練階段和識別階段; 所述訓練階段包括:對預先采集的用于訓練的樣本圖像集進行預處理,提取預處理后 的樣本圖像集的局部梯度統(tǒng)計特征,將所述局部梯度統(tǒng)計特征以及對應場景類別標簽加入 到單隱層神經(jīng)網(wǎng)絡分類器進行層級式監(jiān)督學習,得到復數(shù)個不同的多類單隱層神經(jīng)網(wǎng)絡的 最優(yōu)參數(shù),根據(jù)所述最優(yōu)參數(shù)構(gòu)建多層級場景分類器; 所述識別階段包括:對待識別的圖像集進行預處理,提取預處理后的待識別圖像集的 局部梯度統(tǒng)計特征,將提取到的所述待識別圖像的局部梯度統(tǒng)計特征向量送入所述多層級 場景分類器中進行識別,得到所屬場景類的類別標注。2. 根據(jù)權(quán)利要求1所述的一種基于單隱層神經(jīng)網(wǎng)絡的場景識別方法,其特征在于:所述 預處理包括圖像對比度歸一化及Gamma校正處理。3. 根據(jù)權(quán)利要求2所述的一種基于單隱層神經(jīng)網(wǎng)絡的場景識別方法,其特征在于:所述 圖像對比度歸一化具體包括:將圖像從RGB顏色空間轉(zhuǎn)到Y(jié)UV顏色空間以及對YUV顏色空間 進行全局和局部對比歸一化處理,所述全局和局部對比歸一化處理過程只對Y通道進行操 作,而其他兩個通道保持不變,所述全局歸一化是將圖像像素值歸一化到圖像像素均值附 近,所述局部歸一化是對邊緣進行加強。4. 根據(jù)權(quán)利要求1所述的一種基于單隱層神經(jīng)網(wǎng)絡的場景識別方法,其特征在于:所述 局部梯度統(tǒng)計特征的提取具體如下: 將圖像分為Y、U、V三通道,分別計算Y通道、U通道和V通道的一階梯度; 將圖像劃分成不重疊的細胞單元,計算每個細胞單元的梯度直方圖; 將相鄰的2X2的細胞單元組成重疊的塊,塊滑動大小為一個細胞單元的大小,在每個 塊里面進行梯度直方圖的二范數(shù)歸一化,疊加每個塊的直方圖信息得到Y(jié)通道的特征向 量、U通道的特征向量以及V通道的特征向量; 將三個通道的特征向量進行疊加得到最終的局部梯度統(tǒng)計特征。5. 根據(jù)權(quán)利要求4所述的一種基于單隱層神經(jīng)網(wǎng)絡的場景識別方法,其特征在于:所述 一階梯度的計算方式為:采用Sobel算子對原圖像進行卷積操作得到X方向的梯度分量G x &,7)及¥方向的梯度分量6以1,7),求取圖像中每個像素點的梯度大小6(1,7)和方向 d (X, y):6. 根據(jù)權(quán)利要求1所述的一種基于單隱層神經(jīng)網(wǎng)絡的場景識別方法,其特征在于:所述 最優(yōu)參數(shù)的獲得方式具體為:對于每個多類的單隱層神經(jīng)網(wǎng)絡,要學習的參數(shù)包括正則項 系數(shù)及隱層節(jié)點個數(shù),采用分別調(diào)參的策略:先隨機設置隱層節(jié)點個數(shù),學習出最優(yōu)的正則 項系數(shù),再將正則項系數(shù)設為最優(yōu)值,學習出最優(yōu)的隱層節(jié)點個數(shù),得到最優(yōu)的正則項系數(shù) 和隱層節(jié)點個數(shù),即最優(yōu)參數(shù)。7. 根據(jù)權(quán)利要求1所述的一種基于單隱層神經(jīng)網(wǎng)絡的場景識別方法,其特征在于:所述 多層級場景分類器的層級數(shù)根據(jù)場景本身屬性的從屬關系進行劃分,每一級包括至少一個 多類的單隱層神經(jīng)網(wǎng)絡。8.根據(jù)權(quán)利要求1所述的一種基于單隱層神經(jīng)網(wǎng)絡的場景識別方法,其特征在于:所述 單隱層神經(jīng)網(wǎng)絡的模型包括三層:輸入層、隱藏層和輸出層,所述輸入層接收提取到的圖像 的特征向量,經(jīng)過隱藏層進行數(shù)據(jù)處理后從輸出層輸出,根據(jù)輸出量決定當前數(shù)據(jù)所屬的 類型。
【專利摘要】本發(fā)明提供一種基于單隱層神經(jīng)網(wǎng)絡的場景識別方法,其特征在于:包括訓練階段和識別階段;所述訓練階段包括:對預先采集的用于訓練的樣本圖像集進行預處理,提取預處理后的樣本圖像集的局部梯度統(tǒng)計特征,將所述局部梯度統(tǒng)計特征以及對應場景類別標簽加入到單隱層神經(jīng)網(wǎng)絡分類器進行層級式監(jiān)督學習,得到復數(shù)個不同的多類單隱層神經(jīng)網(wǎng)絡的最優(yōu)參數(shù),根據(jù)所述最優(yōu)參數(shù)構(gòu)建多層級場景分類器;所述識別階段包括:對待識別的圖像集進行預處理,提取預處理后的待識別圖像集的局部梯度統(tǒng)計特征,將該局部梯度統(tǒng)計特征向量送入所述多層級場景分類器中進行識別,得到所屬場景類的類別標注。本發(fā)明實現(xiàn)高精度場景識別。
【IPC分類】G06K9/00, G06K9/62, G06K9/36
【公開號】CN105678278
【申請?zhí)枴緾N201610069804
【發(fā)明人】程東生, 俞文靜, 范廣璐, 趙大青, 何曉玲, 孟輔賢, 吳昊, 石曉波, 倪時龍, 許成功, 呂君玉, 曾偉波
【申請人】國家電網(wǎng)公司, 國網(wǎng)安徽省電力公司, 福建億榕信息技術(shù)有限公司
【公開日】2016年6月15日
【申請日】2016年2月1日