基于迭代方向?yàn)V波器組可逆深度卷積網(wǎng)絡(luò)結(jié)構(gòu)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種數(shù)字圖像處理領(lǐng)域的圖像表示方案,具體是一種基于迭代方向?yàn)V 波器組的可逆深度卷積網(wǎng)絡(luò)結(jié)構(gòu)。
【背景技術(shù)】
[0002] 有效的圖像表示方法對(duì)各類(lèi)圖像處理應(yīng)用至關(guān)重要。小波的出現(xiàn)使一維信號(hào)的點(diǎn) 奇異性能很好地被捕捉到。然后對(duì)于二維甚至更高維信號(hào),小波并沒(méi)有理想的效果。對(duì)于二 維信號(hào),傳統(tǒng)方法通過(guò)對(duì)一維小波進(jìn)行張量積運(yùn)算構(gòu)造可分離的二維小波,然而這只對(duì)水 平與豎直方向信息敏感。因此,對(duì)于具有更復(fù)雜幾何信息的信號(hào)表示,需要新的方法。
[0003] 經(jīng)過(guò)對(duì)現(xiàn)有技術(shù)的文獻(xiàn)檢索發(fā)現(xiàn),Minh N.Do和Martin Vetterli在2005年的 ((IEEE Transactions on Image Processing〉〉(TIP)期干丨J 上發(fā)表的 "The Contour let Transform:An Efficient Directional Multiresolution Image Representation"一文 中提出了一種方法,它通過(guò)拉普拉斯金字塔將信號(hào)分為低頻和高頻兩個(gè)部分,再利用方向 濾波器組對(duì)高頻信號(hào)進(jìn)行頻率劃分,得到的低頻部分繼續(xù)利用拉普拉斯金字塔和方向?yàn)V波 器組重復(fù)這個(gè)過(guò)程。這種方法與小波相比在圖像的方向信息上表現(xiàn)有所提升。然后其高頻 信息在進(jìn)行一次劃分后便維持不變,這樣使的更精細(xì)的信息不能很好地得到表示。Joan Bruna和Stephane Mallat在2013年的《IEEE Transactions on Pattern Analysis and Machine Intelligence》期刊上發(fā)表的 "Invariant Scattering Convolution Networks" 一文中針對(duì)分類(lèi)與識(shí)別問(wèn)題提出了一種散射網(wǎng)絡(luò)。該網(wǎng)絡(luò)由一系列小波濾波器、取模操作 和平均運(yùn)算組成,每一層輸出一個(gè)低頻子圖和多個(gè)高頻子圖,而每個(gè)高頻子圖繼續(xù)在下一 層進(jìn)行分解。然而這種網(wǎng)絡(luò)結(jié)構(gòu)在第一層得到低頻子圖后,便不再對(duì)其進(jìn)行進(jìn)一步分解,而 且這種網(wǎng)絡(luò)是基于連續(xù)域討論的,并沒(méi)有很理想的離散實(shí)現(xiàn)方法,而且不具有精確重構(gòu)性。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明針對(duì)現(xiàn)有技術(shù)的不足,提供了一種基于迭代方向?yàn)V波器組可逆深度卷積網(wǎng) 絡(luò)結(jié)構(gòu),可以對(duì)低頻和高頻成分進(jìn)行多次劃分和重組,并且提供了方便有效的數(shù)字實(shí)現(xiàn)方 法,可以作為一種通用的圖像變換方法并進(jìn)一步應(yīng)用于多個(gè)領(lǐng)域。
[0005] 本發(fā)明是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的:
[0006] 本發(fā)明提供一種基于迭代方向?yàn)V波器組的可逆深度卷積網(wǎng)絡(luò)結(jié)構(gòu),包括:方向?yàn)V 波器組模塊、深度控制模塊、頻率重組模塊和分析應(yīng)用模塊,所述方向?yàn)V波器組模塊和所述 深度控制模塊共同決定輸入圖像的分解方式,其中:
[0007] 所述方向?yàn)V波器組模塊利用采樣矩陣與方向?yàn)V波器組對(duì)輸入圖像進(jìn)行方向?yàn)V波, 采樣矩陣與方向?yàn)V波器交替循環(huán),得到分解系數(shù)并輸出給所述頻率重組模塊;
[0008] 所述深度控制模塊對(duì)方向?yàn)V波器組模塊的循環(huán)次數(shù)進(jìn)行控制;
[0009] 所述頻率重組模炔基于所述方向?yàn)V波器組模塊輸出的分解系數(shù)進(jìn)行頻率重新組 合,并將重組后的新的頻率劃分結(jié)果輸出到所述分析應(yīng)用模塊;
[0010]所述分析應(yīng)用模塊接收頻率重組模塊輸出的具有新的頻率分布的分解系數(shù),并對(duì) 該系數(shù)進(jìn)行進(jìn)一步處理以解決應(yīng)用問(wèn)題。
[0011]優(yōu)選地,所述方向?yàn)V波器組模塊和所述深度控制模塊共同決定輸入圖像的分解方 式,其中:所述方向?yàn)V波器組模塊包括一扇形方向?yàn)V波器組和兩采樣矩陣,它們迭代地對(duì)輸 入圖像進(jìn)行多次分解,即得到輸入圖像的頻域的多次劃分;分解具體包括如下步驟:
[0012] 步驟一,將圖像輸入到雙通道扇形方向?yàn)V波器組和采樣矩陣Q〇,得到兩組系數(shù)矩 陣,分別應(yīng)對(duì)水平和垂直兩個(gè)方向的頻率劃分;
[0013] 步驟二,將步驟一的輸出輸入雙通道扇形方向?yàn)V波器組和采樣矩陣&,進(jìn)行濾波 和下采樣處理,得到四組系數(shù)矩陣,分別對(duì)應(yīng)四個(gè)方向頻率劃分;
[0014] 步驟三,重復(fù)步驟一和步驟二直至達(dá)到深度控制模塊設(shè)定的停止條件,得到全部 分解系數(shù)。
[0015] 更優(yōu)選地,所述采樣矩陣和扇形方向?yàn)V波器組交替循環(huán)次數(shù)由深度控制模塊的限 制條件決定,但需保證深度1 2 2。
[0016] 更優(yōu)選地,所述采樣矩陣采用非對(duì)角采樣矩陣,扇形方向?yàn)V波器組,利用麥克萊蘭 變換將一維雙正交雙通道濾波器組映射為不可分離的二維雙正交濾波器組;在完成步驟三 后,對(duì)應(yīng)頻域的每個(gè)象限與步驟一后得到的頻域具有相似的劃分。
[0017] 優(yōu)選地,所述深度控制模塊,其控制的卷積網(wǎng)絡(luò)深度可通過(guò)預(yù)先設(shè)置固定參數(shù)給 定,也可以結(jié)合應(yīng)用給出判斷條件,形成自適應(yīng)的深度卷積網(wǎng)絡(luò),需保證深度1 2 2。
[0018] 優(yōu)選地,所述方向?yàn)V波器組模塊,第i(i < 1)層分解得到的頻域劃分在每個(gè)1/21/2 子塊與第二層得到的頻域劃分具有相似形式;并且得到的所有21個(gè)頻域塊具有相同形狀, 都為等腰直角三角形。這兩種相似性保證了整個(gè)結(jié)構(gòu)的簡(jiǎn)單高效性。
[0019]優(yōu)選地,所述頻率重組模塊,通過(guò)對(duì)輸入的各子圖進(jìn)行重要系數(shù)的統(tǒng)計(jì)按照分析 應(yīng)用模塊的目的設(shè)計(jì)不同的重組方式,得到新的頻域劃分。
[0020] 更優(yōu)選地,所述頻率重組模塊,通過(guò)計(jì)算最終得到的不同方向不同尺度下的分解 系數(shù)的非零個(gè)數(shù)和重要程度進(jìn)行重新組合,以降低計(jì)算復(fù)雜度和優(yōu)化結(jié)果。
[0021] 本發(fā)明中采用的基于迭代方向?yàn)V波器組的可逆深度卷積網(wǎng)絡(luò)結(jié)構(gòu)為圖像處理提 供了一種新的表示方法。通過(guò)非對(duì)角采樣矩陣和不可分離二維方向?yàn)V波器組的結(jié)合實(shí)現(xiàn)網(wǎng) 絡(luò)的離散,這比直接對(duì)濾波器進(jìn)行旋轉(zhuǎn)操作具有更好的頻域精確劃分性和完美重構(gòu)性。利 用每個(gè)子塊頻域劃分的相似性通過(guò)兩組采樣矩陣和濾波器組的迭代完成更精細(xì)的頻域劃 分。利用迭代濾波器組輸出的分解系數(shù)的統(tǒng)計(jì)結(jié)果進(jìn)行頻率重組,以使其更好地適應(yīng)于不 同的應(yīng)用領(lǐng)域。
[0022] 與現(xiàn)有技術(shù)相比,本發(fā)明具有如下的有益效果:
[0023] 本發(fā)明建立了新的深度卷積網(wǎng)絡(luò)結(jié)構(gòu),所述方向?yàn)V波器組模塊采用基于迭代方向 濾波器組的二維離散實(shí)現(xiàn)方法,保證了計(jì)算簡(jiǎn)便性和精確重構(gòu)性。本發(fā)明利用頻域各子塊 的頻率分布相似性對(duì)低頻和高頻成分進(jìn)行多次劃分,提高了對(duì)豐富細(xì)節(jié)信息的捕捉能力。 通過(guò)引入頻率重組操作,提升了整個(gè)結(jié)構(gòu)的靈活性和可擴(kuò)展性。
【附圖說(shuō)明】
[0024]通過(guò)閱讀參照以下附圖對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、 目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
[0025]圖1為本發(fā)明系統(tǒng)一實(shí)施例的結(jié)構(gòu)框圖;
[0026]圖2為迭代方向?yàn)V波器組模塊和深度控制模塊的工作原理圖。
【具體實(shí)施方式】
[0027]下面結(jié)合具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)說(shuō)明。以下實(shí)施例將有助于本領(lǐng)域的技術(shù) 人員進(jìn)一步理解本發(fā)明,但不以任何形式限制本發(fā)明。應(yīng)當(dāng)指出的是,對(duì)本領(lǐng)域的普通技術(shù) 人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn)。這些都屬于本發(fā)明 的保護(hù)范圍。
[0028] 如圖1所示,一種基于迭代方向?yàn)V波器組的可逆深度卷積網(wǎng)絡(luò)結(jié)構(gòu),包括:方向?yàn)V 波器組模塊和深度控制模塊、頻率重組模塊和分析應(yīng)用模塊,其中:方向?yàn)V波器組模塊利用 扇形方向?yàn)V波器組對(duì)輸入圖像進(jìn)行方向?yàn)V波,深度控制模塊對(duì)方向?yàn)V波器組模塊的循環(huán)次 數(shù)進(jìn)行控制,得到的頻率分解結(jié)果在頻率重組模塊中進(jìn)行方向與尺度重新組合,最后用于 分析應(yīng)用模塊解決一系列圖像處理相關(guān)問(wèn)題。
[0029] 如圖2所示,所述方向?yàn)V波器組模塊包括一扇形方向?yàn)V波器組和兩采樣矩陣,它們 迭代地對(duì)輸入圖像進(jìn)行多次分解,即得到輸入圖像的頻域的多次劃分;所述方向?yàn)V波器組 模塊和深度控制模塊共同實(shí)現(xiàn)該深度卷積網(wǎng)絡(luò),兩組采樣矩陣與扇形方向?yàn)V波器組交替循 環(huán)對(duì)頻域進(jìn)行劃分,隨著深度的增加,得到越精細(xì)的尺度與方向的分解結(jié)果。
[0030] 所述方向?yàn)V波器組模塊,分解具體包括如下步驟:
[0031] 步驟一,將圖像輸入到雙通道扇形方向?yàn)V波器組和采樣矩陣Q〇,得到兩組系數(shù)矩 陣,分別應(yīng)對(duì)水平和垂直兩個(gè)方向的頻率劃分;
[0032] 步驟二,將步驟一的輸出輸入雙通道扇形方向?yàn)V波器組和采樣矩陣&,進(jìn)行濾波 和下采樣處理,得到四組系數(shù)矩陣,分別對(duì)應(yīng)四個(gè)方向頻率劃分;
[0033]步驟三,重復(fù)步驟一和步驟二直至達(dá)到深度控制模塊設(shè)定的停止條件,得到全部 分解系數(shù)。
[0034]本實(shí)施例中,所述的采樣矩陣分別為Qodi,扇形波波器的頻域表示為Η( ω ),其中 ω =( ωι,ωι)τ為二維角頻率;對(duì)原輸入圖像X,經(jīng)過(guò)第一組雙通道扇形濾波器出(ω )(i取 〇,1分別對(duì)應(yīng)雙通道濾波器的0通道和1通道)和采樣矩陣Qo后得到的頻域