一種基于深度學習的圖像模糊模型參數(shù)分析方法
【專利摘要】本發(fā)明設計一種基于深度學習的模糊模型參數(shù)分析方法,其特征在于包括:步驟1,以深度信念網(wǎng)絡結構來提取模糊特征并對其分類,即首先使用半監(jiān)督的深度信念網(wǎng)絡來將輸入圖像塊投射到差異特征空間,然后再對各特征進行分類;步驟2,對模糊核的參數(shù)進行識別,即由變換域的邊緣提取幫助深度信念網(wǎng)絡結構以較高的準確性來確認模糊參數(shù)。本發(fā)明能夠確保深度信念網(wǎng)絡結構以較高的準確性來確認模糊參數(shù),經(jīng)在如Berkeleysegmentation和PascalVOC2007等多個圖像數(shù)據(jù)庫中反復試用驗證,取得了滿意的優(yōu)于目前最好的模糊估計方法的性能效果。
【專利說明】一種基于深度學習的圖像模糊模型參數(shù)分析方法
【技術領域】
[0001] 本發(fā)明屬于圖像模糊分析【技術領域】,特別是涉及一種基于深度學習的圖像模糊模 型參數(shù)分析方法。
【背景技術】
[0002] 模糊圖像的修復是利用已有退化模型的不充分信息對原始高質(zhì)量圖像進行重建 的過程。圖像去模糊的方法主要可以分為盲去模糊和非盲去模糊。非盲去模糊方法需要模 糊核與其參數(shù)的先驗知識,而在盲去模糊方法中可假設模糊算子未知。在實際應用的各種 情形當中點擴散函數(shù)(PointSpreadFunction(PSF))未知,所以非盲去模糊的應用范圍 比盲去模糊的范圍狹窄很多。盲圖像去模糊算法可以分為兩類:多圖像和單一圖像的去模 糊方法。在實際應用中,后者比較常見。如:"A.LikasandN.Galasanos.Avariational approachforbayesianblindimagedeconvolution.IEEETransactionsonSignal Processing, 52(8) : 2222 - 2233, 2004" 一文中提出了利用貝葉斯模型進行單一圖像盲去卷 積;"F.Rooms,W.Philips,andJ.Porti11a.Parametricpsfestimationviasparseness maximizationinthewaveletdomain.InProc.SPIEvol. 5607,WaveletApplicationin IndustrialProcessingII,pages26 - 33, 2004" 一文中提出了用小波分解估計高斯模糊 模型的方法;"Rekleitis.Opticalflowrecognitionfromthepowerofspectrumof asingleblurredimage.InProc.ICIP,pages791 - 794, 1996" 一文中討論了如何修復 由運動模糊造成退化的圖像;類似的,還有"T.Cho,S.Paris,B.Horn,andFreemanW.Blur kernelestimationusingtheradontransform.InProc.CVPR,pages241 - 248,2011"一 文中提出了一個非常熱門的方法,使用radon變換來對圖像的邊緣進行估計,從而計算模 糊核。除此之外,還有其它許多方法也被用于運動模糊的估計,如倒頻譜方法(cepstral method)和方向可調(diào)濾波器(steerablefilters)等。
[0003] 雖然很多已有的研究集中在圖像去模糊這個問題上,但是圖像模糊的分類問題尚 未被很好的解決。圖像模糊的分類有較高的應用價值,因為實際拍攝得到的圖像中的模糊 類型通常是未知的。針對這類問題已有一些模糊分類方法并不做圖像去模糊,而是利用模 糊的特征參數(shù)來進行分類;其中一個現(xiàn)有技術是利用模糊特征即局部自相關一致性和貝葉 斯分類器進行分類的,參見R.Liu,Z.Li,andJ.Jia,Imagepartialblurdetectionand classification.InProc.CVPR,pages23 - 28, 2008 一文;另一個相似方法是由Su等人提 出的基于阿爾法通道的特征分類方法,該特征對模糊的擴展有不同的圓度;盡管這兩種方 法都能夠從實際的模糊圖像中檢測到局部模糊,它們都要很大程度依賴于手工提取的特 征。
[0004] 盡管先前的利用手工提取特征的模糊分類方法有較好的性能,它們的效果還是比 較有局限性的,因為自然圖像的變化很大。近年來,很多學者已經(jīng)將目光從直覺先驗轉(zhuǎn)移到 了深度學習來更好的提取用于分類的特征。深度神經(jīng)網(wǎng)絡大致模仿了哺乳動物的視覺視 皮層,這已經(jīng)被用于很多的計算機視覺應用,如物體識別,圖像分類,甚至是圖像分析。在 Jain等人的去噪工作中[6],參見V.JainandH.Seung.Naturalimagedenoisingwith convolutionalnetworks.InProc.NIPS,pages769 - 776, 2008 一文,他們展不了將卷積 的神經(jīng)網(wǎng)絡用于進行圖像去噪的潛力;在這樣的結構中,深度卷積神經(jīng)網(wǎng)絡中的學習到的 權值和bias的值是由訓練足夠大量的自然圖像得到的;在測試階段,神經(jīng)網(wǎng)絡中的的參數(shù) 對于退化圖像相當于貝葉斯模型的"先驗"信息;該方法相比于頂級的局部去噪方法來講效 果更佳。另一個例子是利用基于神經(jīng)網(wǎng)絡的多特征分類器來構造模糊內(nèi)容度量,經(jīng)證實,聯(lián) 合的學習到的特征優(yōu)于單獨的基于手工的特征。
[0005] 綜上所述,現(xiàn)有圖像模糊分析技術存在的主要不足可歸納為:一是對同一幅圖中 出現(xiàn)的不同模糊類型較難進行分別處理;二是現(xiàn)有的基于塊的圖像模糊分類方法利用的圖 像特征很難很好的同時描述各個不同模糊類型。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目的在于克服現(xiàn)有技術所存在的不足而提供一種基于深度學習的圖像 模糊模型參數(shù)分析方法,本發(fā)明針對現(xiàn)有的同一副圖像內(nèi)出現(xiàn)不同模糊類型和模糊參數(shù)大 小的問題,首先以兩步驟的深度信念網(wǎng)絡結構來首先對模糊類型進行分類,然后對模糊核 的參數(shù)進行識別,確保深度信念網(wǎng)絡結構以較高的準確性來確認模糊參數(shù)。
[0007] 根據(jù)本發(fā)明提出的一種基于深度學習的模糊模型參數(shù)分析方法,其特征在于包 括:
[0008] 步驟1,以深度信念網(wǎng)絡結構來提取模糊特征并對其分類,即首先使用半監(jiān)督的深 度信念網(wǎng)絡來將輸入圖像塊投射到差異特征空間,然后再對各特征進行分類;
[0009] 步驟2,對模糊核的參數(shù)進行識別,即由變換域的邊緣提取幫助深度信念網(wǎng)絡結構 以較高的準確性來確認模糊參數(shù)。
[0010] 本發(fā)明提出的一種基于深度學習的模糊模型參數(shù)分析方法的進一步優(yōu)選方案 是:
[0011] 本發(fā)明步驟1所述以深度信念網(wǎng)絡結構來提取模糊特征并對其分類,具體包括:
[0012] 步驟1. 1,對輸入深度信念網(wǎng)絡的模糊特征進行分類確認其退化模型;
[0013] 步驟1. 2,在步驟1. 1的基礎上,對每類的模糊模型進行參數(shù)分類。
[0014] 本發(fā)明步驟1. 1所述對輸入深度信念網(wǎng)絡的模糊特征進行分類確認其退化模型, 是指對輸入圖像進行第一步分塊預處理,預處理得到特征后,送入深度信念網(wǎng)絡做特征提 取和分類。
[0015] 本發(fā)明步驟1. 2所述在步驟1. 1的基礎上,對每類的模糊模型進行參數(shù)分類,是指 對已經(jīng)得到的模型分類結果進行預處理,預處理得到新的特征后,再次送入深度信念網(wǎng)絡 做特征提取和分類。
[0016]本發(fā)明步驟1. 1所述對輸入圖像塊進行第一步分塊預處理,是指使用一個基于傅 里葉變換稀疏的邊緣的差異特征,其公式如下:
【權利要求】
1. 一種基于深度學習的模糊模型參數(shù)分析方法,其特征在于包括: 步驟1,以深度信念網(wǎng)絡結構來提取模糊特征并對其分類,即首先使用半監(jiān)督的深度信 念網(wǎng)絡來將輸入圖像塊投射到差異特征空間,然后再對各特征進行分類; 步驟2,對模糊核的參數(shù)進行識別,即由變換域的邊緣提取幫助深度信念網(wǎng)絡結構以較 高的準確性來確認模糊參數(shù)。
2. 根據(jù)權利要求1所述的基于深度學習的模糊模型參數(shù)分析方法,其特征在于步驟1 所述以深度信念網(wǎng)絡結構來提取模糊特征并對其分類,具體包括: 步驟1. 1,對輸入深度信念網(wǎng)絡的模糊特征進行分類確認其退化模型; 步驟1. 2,在步驟1. 1的基礎上,對每類的模糊模型進行參數(shù)分類。
3. 根據(jù)權利要求2所述的基于深度學習的模糊模型參數(shù)分析方法,其特征在于步驟 1. 1所述對輸入深度信念網(wǎng)絡的模糊特征進行分類確認其退化模型,是指對輸入圖像進行 第一步分塊預處理,預處理得到特征后,送入深度信念網(wǎng)絡做特征提取和分類。
4. 根據(jù)權利要求2所述的基于深度學習的模糊模型參數(shù)分析方法,其特征在于步驟 1. 2所述在步驟1. 1的基礎上,對每類的模糊模型進行參數(shù)分類,是指對已經(jīng)得到的模型分 類結果進行預處理,預處理得到新的特征后,再次送入深度信念網(wǎng)絡做特征提取和分類。
5. 根據(jù)權利要求3所述的基于深度學習的模糊模型參數(shù)分析方法,其特征在于步驟 1. 1所述對輸入圖像塊進行第一步分塊預處理,是指使用一個基于傅里葉變換稀疏的邊緣 的差異特征,其公式如下:
上式中:G(u)為觀察圖像經(jīng)過傅里葉變換的值分別為G(u)的最大和最小 值。
6. 根據(jù)權利要求1所述的基于深度學習的模糊模型參數(shù)分析方法,其特征在于步驟1 所述以深度信念網(wǎng)絡結構來提取模糊特征,是指首先使用經(jīng)典的Canny算子進行初步的特 征提取,然后運用一個啟發(fā)式方法來細化邊緣提取的結果;細化的具體步驟如下: 一是對于兩種模糊類型,選擇孤立的邊緣;假設這個孤立區(qū)域的半徑是d,那些在當前 邊緣半徑為d的正交方向上的邊緣會被濾掉; 二是對于運動模糊,放棄非常短和非常彎曲的邊緣;考慮在區(qū)域半徑為d內(nèi)的,角度范 圍是0 = [0,31 ]的邊緣; 三是對于運動模糊,所有由前兩步提取出的邊緣應該有同樣的方向角a,因此,在這一 步可根據(jù)主方向角,再次去掉無用邊緣。
7. 根據(jù)權利要求1所述的基于深度學習的模糊模型參數(shù)分析方法,其特征在于步驟2 所述對模糊核的參數(shù)進行識別,是指對不同的模糊參數(shù)類型,不同的模糊參數(shù)被設定為: 一是高斯模糊有8種類型(標簽):〇 ={0? 5, 1,1. 5, 2, 2. 5, 3, 3. 5, 4}; 二是運動模糊有8種類型(標簽):M= {3, 9} ? = {0, 45, 90, 135}; 三是離焦模糊有8種類型(標簽):R= {2, 5, 8, 11,14, 17, 20, 23}; 在步驟2所述參數(shù)分類的過程中,每個DBN的層的大小設置是相同的,但它們的輸出層 的標簽均不相同,且每個DBN充當模糊參數(shù)模型的特征提取算子和分類器。
【文檔編號】G06T5/00GK104408692SQ201410692086
【公開日】2015年3月11日 申請日期:2014年11月25日 優(yōu)先權日:2014年11月25日
【發(fā)明者】邵嶺, 閻若梅 申請人:南京信息工程大學