国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于Gabor特征具有分形結(jié)構(gòu)的極深神經(jīng)網(wǎng)絡(luò)的動(dòng)物分類(lèi)方法與流程

      文檔序號(hào):11262159閱讀:399來(lái)源:國(guó)知局
      一種基于Gabor特征具有分形結(jié)構(gòu)的極深神經(jīng)網(wǎng)絡(luò)的動(dòng)物分類(lèi)方法與流程

      本發(fā)明涉及圖像處理、模式識(shí)別、深度學(xué)習(xí)領(lǐng)域,特別是涉及一種基于gabor特征具有分形結(jié)構(gòu)的極深神經(jīng)網(wǎng)絡(luò)的動(dòng)物分類(lèi)方法。



      背景技術(shù):

      在整個(gè)計(jì)算機(jī)視覺(jué)架構(gòu)中,物體分類(lèi)扮演著非常重要的角色,它是視頻跟蹤和場(chǎng)景描述的基礎(chǔ)。比如在場(chǎng)景描述任務(wù)中,首先要知道圖像中有什么物體,才能進(jìn)行后續(xù)的物體行為分析和圖像場(chǎng)景描述。其中分析圖像中有什么物體就屬于物體分類(lèi)和識(shí)別的范疇。

      隨著機(jī)器學(xué)習(xí)和人工智能的發(fā)展,計(jì)算機(jī)擁有了越來(lái)越強(qiáng)的物體分類(lèi)能力,雖然物體分類(lèi)在近幾年已經(jīng)有了快速的發(fā)展,但是物體分類(lèi)仍然是一個(gè)具有挑戰(zhàn)性的課題,具體的原因如下:

      1、外界環(huán)境多樣性:對(duì)于同樣一個(gè)物體,由于在圖像拍攝過(guò)程中的不同光照、不同距離、不同拍攝角度以及其他物體不同程度的遮擋影響,所拍得的圖片具有多樣性,由此增加了計(jì)算機(jī)物體分類(lèi)的難度。

      2、類(lèi)別復(fù)雜性:類(lèi)別復(fù)雜度來(lái)自于兩個(gè)方面。一是類(lèi)內(nèi)之間的差別大,對(duì)于同一類(lèi)物體,比如椅子,不同的椅子可能具有不同的形狀和大小,這樣會(huì)增大識(shí)別難度。二是類(lèi)間的差距小,比如狗與狼,雖然屬于兩個(gè)不同的種類(lèi),但是它們?cè)谕庥^表現(xiàn)上卻非常相似。

      3、語(yǔ)義多樣性:對(duì)于同一張圖,即便用人眼來(lái)看,不同的人的語(yǔ)義理解也不盡相同,對(duì)于計(jì)算機(jī)也是如此。

      物體分類(lèi)在過(guò)去五十年已經(jīng)有了快速的發(fā)展,目前主要有兩種物體分類(lèi)算法,一種是基于人工特征的物體分類(lèi)算法,另外一種是基于深度學(xué)習(xí)的物體分類(lèi)算法。

      其中基于人工特征的物體分類(lèi)算法是指首先人工提取出原始圖像中的底層特征,常見(jiàn)的底層特征提取方法有興趣點(diǎn)檢測(cè)和密集的局部特征提取。興趣點(diǎn)檢測(cè)能夠很好地檢測(cè)出原始圖像中的一些邊緣點(diǎn)、紋理性顯著的點(diǎn)、角點(diǎn)、區(qū)塊點(diǎn),這種檢測(cè)算法開(kāi)銷(xiāo)相對(duì)而言較小,并且能夠提取到具有幾何不變性的特征點(diǎn),常見(jiàn)的基于興趣點(diǎn)檢測(cè)的算子有fast算子、harris角點(diǎn)檢測(cè)算子、log算子等。

      然而近幾年采用更多的是密集的局部特征提取,按照固定的步長(zhǎng)和尺度,用密集提取的方式對(duì)原始圖像提取大量的局部特征,如sift特征、hog特征、lbp特征,其識(shí)別率會(huì)高于基于興趣點(diǎn)檢測(cè)的物體識(shí)別算法。提取完底層特征之后,由于密集提取的底層特征具有很大的冗余性,為了消去這些冗余,常常會(huì)利用特征編碼技術(shù),以便找出更加具有區(qū)分性的底層特征。常用的特征編碼技術(shù)有向量量化編碼、稀疏編碼、核詞典編碼、局部線性約束編碼、顯著性編碼、fisher向量編碼以及超向量編碼等。特征編碼后,利用壓縮后的特征向量集對(duì)原始圖像進(jìn)行表達(dá),生成特征向量直方圖表達(dá),直方圖的橫坐標(biāo)表示特征向量集的數(shù)目,縱坐標(biāo)表示對(duì)應(yīng)特征向量出現(xiàn)的頻率,這種方式可以把原始圖像的二維特征表達(dá)降為一維的特征向量直方圖表達(dá),有效降低了存儲(chǔ)空間。得到特征向量直方圖之后,再利用支持向量機(jī)等分類(lèi)器對(duì)原始圖像進(jìn)行分類(lèi),最終識(shí)別圖像。然而這種方法存在泛化性差、魯棒性低、局部依賴(lài)性強(qiáng)、實(shí)現(xiàn)困難、識(shí)別率低等缺點(diǎn)。

      另外一種方案是基于深度學(xué)習(xí)模型的物體識(shí)別算法,它通過(guò)層次化的網(wǎng)絡(luò)結(jié)構(gòu)自主學(xué)習(xí)數(shù)據(jù)集底層到高層的特征,并利用softmax等分類(lèi)器進(jìn)行分類(lèi)。典型的深度學(xué)習(xí)模型有卷積神經(jīng)網(wǎng)絡(luò)(cnn)、深度置信網(wǎng)絡(luò)(dbn)、自編碼器(auto-encoder)和限制玻爾茲曼機(jī)(rbm)。當(dāng)下流行的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對(duì)物體識(shí)別都有這樣的缺點(diǎn),包括網(wǎng)絡(luò)的訓(xùn)練速度慢,不易收斂等。



      技術(shù)實(shí)現(xiàn)要素:

      本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)的缺點(diǎn)與不足,一種基于gabor特征具有分形結(jié)構(gòu)的極深神經(jīng)網(wǎng)絡(luò)的動(dòng)物分類(lèi)方法,該方法利用了具有分形結(jié)構(gòu)的極深神經(jīng)網(wǎng)絡(luò)在物體分類(lèi)中的優(yōu)勢(shì),通過(guò)加入人工提取的gabor特征來(lái)加強(qiáng)網(wǎng)絡(luò)對(duì)紋理信息的學(xué)習(xí),達(dá)到對(duì)動(dòng)物圖片進(jìn)行精準(zhǔn)分類(lèi)的目的。

      本發(fā)明的目的通過(guò)以下的技術(shù)方案實(shí)現(xiàn):一種基于gabor特征具有分形結(jié)構(gòu)的極深神經(jīng)網(wǎng)絡(luò)的動(dòng)物分類(lèi)方法,首先通過(guò)單一擴(kuò)展規(guī)則的重復(fù)應(yīng)用生成一個(gè)極深的網(wǎng)絡(luò)(fractalnet),然后通過(guò)從imagenet數(shù)據(jù)集中獲取一定數(shù)量種類(lèi)的動(dòng)物圖片,進(jìn)行g(shù)abor特征提取以及歸一化等預(yù)處理,得到gabor特征偽彩圖之后,利用gabor特征偽彩圖作為網(wǎng)絡(luò)輸入,然后通過(guò)監(jiān)督學(xué)習(xí)的方法訓(xùn)練fractalnet網(wǎng)絡(luò)模型,最后進(jìn)行動(dòng)物圖片的測(cè)試分類(lèi)。

      本發(fā)明的工作過(guò)程:

      一種基于gabor特征具有分形結(jié)構(gòu)的極深神經(jīng)網(wǎng)絡(luò)的動(dòng)物分類(lèi)方法,其特征在于:對(duì)輸入圖像進(jìn)行0°、45°、90°三個(gè)方向的gabor濾波,并且將這三個(gè)方向的gabor特征圖合并成一張三通道的gabor特征偽彩圖,以得到的gabor特征偽彩圖作為分形結(jié)構(gòu)網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練網(wǎng)絡(luò)。具體包括如下步驟:

      s1、下載訓(xùn)練動(dòng)物圖像數(shù)據(jù)集;

      s2、對(duì)步驟s1數(shù)據(jù)集中的圖像進(jìn)行g(shù)abor特征提取,以及對(duì)數(shù)據(jù)集中的圖像進(jìn)行0°、45°、90°三個(gè)方向的gabor濾波;

      s3、對(duì)步驟s2獲得的gabor特征圖合并成三通道的特征偽彩圖;

      s4、對(duì)步驟s3中g(shù)abor特征偽彩圖進(jìn)行圖像預(yù)處理;

      s5、訓(xùn)練fractalnet網(wǎng)絡(luò)模型,采用了單一擴(kuò)展規(guī)則的重復(fù)應(yīng)用生成一個(gè)極深網(wǎng)絡(luò);

      s6、用同樣經(jīng)過(guò)gabor濾波生成的gabor特征偽彩圖測(cè)試圖像對(duì)步驟s4訓(xùn)練好的網(wǎng)絡(luò)模型進(jìn)行測(cè)試。

      優(yōu)選的,步驟s1中下載數(shù)據(jù)集:分別從http://www.image-net.org、http://mscoco.org這兩個(gè)網(wǎng)站下載imagenet;imagenet數(shù)據(jù)集分為訓(xùn)練圖像集和測(cè)試圖像集,訓(xùn)練集含有1000個(gè)類(lèi)別的圖片,每個(gè)類(lèi)別1300張,測(cè)試集含50000張圖片;ms-coco數(shù)據(jù)集(提供訓(xùn)練和測(cè)試網(wǎng)絡(luò)的圖片)分為訓(xùn)練圖像集合測(cè)試圖像集,訓(xùn)練圖像集包含82783張圖片,測(cè)試圖像集包含40504張圖片。

      優(yōu)選的,步驟s2中圖像gabor特征提取具體過(guò)程:

      gabor濾波器能夠很好地提取圖像的邊緣和頻率信息,很適合做紋理分離和表達(dá);gabor濾波器可以被定義成一個(gè)高斯函數(shù)和一個(gè)正弦函數(shù)的乘積,gabor濾波器的數(shù)學(xué)表達(dá)如下面公式(1-1):

      其中,x′=xcosθ+ysinθ,y′=-xcosθ+ysinθ

      各個(gè)參數(shù)的具體含義以及常用的參數(shù)配置如下面所述:

      x和y:為空間域像素的位置;

      標(biāo)準(zhǔn)方差σ:高斯函數(shù)沿兩個(gè)坐標(biāo)軸的標(biāo)準(zhǔn)方差;

      相位偏移:它的取值范圍為-180度到180度。其中,0度和180度分別對(duì)應(yīng)中心對(duì)稱(chēng)的center-on函數(shù)和center-off函數(shù),而-90度和90度對(duì)應(yīng)反對(duì)稱(chēng)函數(shù);

      波長(zhǎng)λ:該參數(shù)的設(shè)置和濾波器的輸入頻率有關(guān),一般來(lái)說(shuō),它的取值要大于等于2,且小于原始圖像的五分之一;

      方向θ:gabor具有方向性,這個(gè)參數(shù)指定了gabor條紋的方向,取值范圍是0°到360°;

      長(zhǎng)寬比γ:長(zhǎng)寬比γ決定了gabor濾波器形狀的橢圓度,它的取值小于等于1,等于1時(shí),gabor濾波器是一個(gè)圓形;

      其中步驟s2中方向θ為0°、45°、90°,將圖像數(shù)據(jù)集對(duì)以上的三個(gè)方向進(jìn)行g(shù)abor濾波,提取這三個(gè)方向的gabor特征圖。

      優(yōu)選的,所述步驟s3中合并成三通道的gabor特征偽彩圖,將步驟s2獲得的0°、45°、90°三個(gè)方向的gabor特征圖進(jìn)行簡(jiǎn)單的線性疊加合并成三通道的gabor特征偽彩圖(即將每個(gè)通道的值認(rèn)為是一個(gè)rgb的像素值)。

      優(yōu)選的,所述的步驟s4中的預(yù)處理方法,對(duì)于imagenet數(shù)據(jù)集上獲得的每一張圖像,將步驟s2和s3的gabor特征提取后獲得的gabor特征偽彩圖縮放到32×32大小。

      優(yōu)選的,所述的步驟s5中訓(xùn)練fractlnet網(wǎng)絡(luò)模型的采用單一擴(kuò)展規(guī)則的重復(fù)應(yīng)用生成一個(gè)極深的網(wǎng)絡(luò),其結(jié)構(gòu)布局正是一個(gè)截?cái)嗟姆中危痪W(wǎng)絡(luò)包含長(zhǎng)度不同的相互作用子路徑,但不包含任何直通式連接,每個(gè)內(nèi)部信號(hào)在被下一層看見(jiàn)之前,都被一個(gè)過(guò)濾器和非線性部件變換過(guò)了;

      其中所述的使用路徑舍棄方法正則化分形架構(gòu)里子路徑的協(xié)同適應(yīng)。通過(guò)這樣的正則化,使得分形網(wǎng)絡(luò)獲得一種性質(zhì):淺層子網(wǎng)絡(luò)給出快捷的答案,而深度子網(wǎng)絡(luò)(有較多延遲)給出更精準(zhǔn)的答案;

      兩種不同的規(guī)則產(chǎn)生的分形架構(gòu):

      1、簡(jiǎn)單的擴(kuò)展規(guī)則生成分形架構(gòu);基礎(chǔ)情形f1(z)包含輸入輸出之間單個(gè)選定類(lèi)型的層;連接層計(jì)算了逐元素平均;

      2、深度卷積網(wǎng)絡(luò)周期性地通過(guò)匯集來(lái)降低空間分辨率;分形版本使用fc(·),其中·為信號(hào)的輸入,作為匯集層之間的建構(gòu)單元;把b個(gè)這樣的塊堆起來(lái)就得到一個(gè)網(wǎng)絡(luò),其總深度是b·2c-1(通過(guò)卷積層衡量)。

      優(yōu)選的,訓(xùn)練fractlnet網(wǎng)絡(luò)模型的具體過(guò)程為:

      令c表示截?cái)喾中蝔c(·)的指標(biāo),網(wǎng)絡(luò)結(jié)構(gòu)、連接以及層類(lèi)型,通過(guò)fc(·)定義;包含單個(gè)卷積層的網(wǎng)絡(luò)是基礎(chǔ)情形如公式(1-2):

      f1(z)=conv(z)(1-2)

      遞歸定義接下來(lái)的分形如公式(1-3):

      表示復(fù)合,而表示連接操作,z表示輸入信號(hào),c對(duì)應(yīng)于列數(shù),或者說(shuō)網(wǎng)絡(luò)fc(·)的寬度;深度定義為從輸入到輸出的最長(zhǎng)路徑上的conv層的個(gè)數(shù),正比于2c-1;用于分類(lèi)的卷積網(wǎng)絡(luò)通常分散布置匯集層;為了達(dá)到相同目的,使用fc(·)作為構(gòu)建單元,將之與接下來(lái)的匯集層堆疊b次,得到總深度b·2c-1;連接操作把兩個(gè)特征塊合為一個(gè);一個(gè)特征塊是一個(gè)conv層的結(jié)果:在一個(gè)空間區(qū)域?yàn)楣潭ǖ囊恍┩ǖ谰S持活化的張量;通道數(shù)對(duì)應(yīng)于前面的conv層的過(guò)濾器的個(gè)數(shù);當(dāng)分形被擴(kuò)展,把相鄰的連接合并成單個(gè)連接層;連接層把所有其輸入特征塊合并成單個(gè)輸出塊;連接層行為的幾種選擇看起來(lái)都是合理的,包括拼接和加法;把每個(gè)連接實(shí)例化,計(jì)算其輸入的逐元素平均;這對(duì)于卷積網(wǎng)絡(luò)是恰當(dāng)?shù)?,在那里通道?shù)對(duì)一個(gè)分形塊里的所有conv層是相同的。

      優(yōu)選的,路徑舍棄的新正則化規(guī)則:dropout和drop-connect通過(guò)修改網(wǎng)絡(luò)層序列之間的相互作用來(lái)減弱共同適應(yīng)(co-adaptation);由于分形網(wǎng)絡(luò)包含額外的大尺度結(jié)構(gòu),提出使用一種類(lèi)似的粗粒度正則化策略來(lái)輔助這些技術(shù);

      dropout禁止了活化的共同適應(yīng),路徑舍棄通過(guò)隨機(jī)丟棄連接層的操作數(shù)來(lái)禁止平行路徑的共同適應(yīng);這種方式有效防止了網(wǎng)絡(luò)使用一個(gè)路徑作為錨標(biāo),另一個(gè)路徑作為修正而可能引起的過(guò)擬合行為;采用兩個(gè)采樣策略:

      局部:連接層以固定幾率舍棄每個(gè)輸入,但保證至少一個(gè)輸入保留;

      全局:每條路徑是為了整個(gè)網(wǎng)絡(luò)選出的,限制這條路徑是單列的,激勵(lì)每列成為有力的預(yù)測(cè)器。

      優(yōu)選的,步驟s6根據(jù)訓(xùn)練好模型測(cè)試圖像:根據(jù)前面步驟s1、s2、s3、s4和s5等步驟訓(xùn)練好的網(wǎng)絡(luò),使用經(jīng)過(guò)步驟s2和s3處理的測(cè)試gabor特征偽彩圖進(jìn)行測(cè)試。

      本發(fā)明與現(xiàn)有技術(shù)相比,具有如下優(yōu)點(diǎn)和有益效果:

      1、傳統(tǒng)的圖像分類(lèi)方法存在泛化性差、魯棒性低、局部依賴(lài)性強(qiáng)、實(shí)現(xiàn)困難、識(shí)別率低等缺點(diǎn),而使用神經(jīng)網(wǎng)絡(luò)對(duì)動(dòng)物圖像進(jìn)行識(shí)別具有更強(qiáng)的魯棒性和泛化能力,并克服了傳統(tǒng)圖像理解方法局部依賴(lài)性強(qiáng)、實(shí)現(xiàn)困難等缺點(diǎn)。

      2、已有的神經(jīng)網(wǎng)絡(luò)對(duì)于物體分類(lèi),只能夠提取到一些通用的特征點(diǎn),比如邊緣點(diǎn)和亮度變化很明顯的點(diǎn),無(wú)法對(duì)數(shù)據(jù)集進(jìn)行更本質(zhì)的刻畫(huà)。基于gabor特征的具有分形結(jié)構(gòu)的極深神經(jīng)網(wǎng)絡(luò)的動(dòng)物圖像分類(lèi)算法,通過(guò)加入gabor特征來(lái)加強(qiáng)網(wǎng)絡(luò)對(duì)紋理信息的學(xué)習(xí),提高物體分類(lèi)準(zhǔn)確率。

      3、本發(fā)明極深網(wǎng)絡(luò)開(kāi)發(fā)了一種路徑舍棄的新正則化規(guī)則。無(wú)需數(shù)據(jù)增強(qiáng),通過(guò)dropout和路徑舍棄訓(xùn)練的分形網(wǎng)絡(luò)遠(yuǎn)遠(yuǎn)超過(guò)了之前神經(jīng)網(wǎng)絡(luò)的性能。

      附圖說(shuō)明

      圖1為本發(fā)明的一種基于gabor特征具有分形結(jié)構(gòu)的極深神經(jīng)網(wǎng)絡(luò)的動(dòng)物分類(lèi)方法的具體流程圖;

      圖2為本發(fā)明實(shí)施例的簡(jiǎn)單的擴(kuò)展規(guī)則生成分形架構(gòu);

      圖3為本發(fā)明實(shí)施例的深度卷積網(wǎng)絡(luò)架構(gòu)。

      具體實(shí)施方式

      下面結(jié)合實(shí)施例及附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)的描述,但本發(fā)明的實(shí)施方式不限于此。

      首先通過(guò)單一擴(kuò)展規(guī)則的重復(fù)應(yīng)用生成一個(gè)極深的網(wǎng)絡(luò)(fractalnet),然后通過(guò)從imagenet數(shù)據(jù)集中獲取一定數(shù)量種類(lèi)的動(dòng)物圖片,進(jìn)行g(shù)abor特征提取以及歸一化等預(yù)處理,得到gabor特征偽彩圖之后,利用gabor特征偽彩圖作為網(wǎng)絡(luò)輸入,然后通過(guò)監(jiān)督學(xué)習(xí)的方法訓(xùn)練fractalnet網(wǎng)絡(luò)模型,最后進(jìn)行動(dòng)物圖片的測(cè)試分類(lèi)。

      圖1為本發(fā)明的整體流程圖,包括如下步驟:

      (1)下載訓(xùn)練數(shù)據(jù)集:分別從http://www.image-net.org、http://mscoco.org這兩個(gè)網(wǎng)站下載imagenet。imagenet數(shù)據(jù)集分為訓(xùn)練圖像集和測(cè)試圖像集,訓(xùn)練集含有1000個(gè)類(lèi)別的圖片,每個(gè)類(lèi)別1300張,測(cè)試集含50000張圖片;ms-coco數(shù)據(jù)集分為訓(xùn)練圖像集合測(cè)試圖像集,訓(xùn)練圖像集包含82783張圖片,測(cè)試圖像集包含40504張圖片。

      (2)圖像gabor特征提取:

      gabor濾波器能夠很好地提取圖像的邊緣和頻率信息,很適合做紋理分離和表達(dá)。

      gabor濾波器可以被定義成一個(gè)高斯函數(shù)和一個(gè)正弦函數(shù)的乘積,gabor濾波器的數(shù)學(xué)表達(dá)如下面公式(1-1):

      其中,x′=xcosθ+ysinθ,y′=-xcosθ+ysinθ

      各個(gè)參數(shù)的具體含義以及常用的參數(shù)配置如下面所述:

      波長(zhǎng)λ:該參數(shù)的設(shè)置和濾波器的輸入頻率有關(guān),一般來(lái)說(shuō),它的取值要大于等于2,且小于原始圖像的五分之一。

      方向θ:gabor具有方向性,這個(gè)參數(shù)指定了gabor條紋的方向,取值范圍是0°到360°。

      長(zhǎng)寬比γ:長(zhǎng)寬比γ決定了gabor濾波器形狀的橢圓度,它的取值小于等于1,等于1時(shí),gabor濾波器是一個(gè)圓形。

      所述步驟(2)中根據(jù)gabor濾波原理分別對(duì)方向?yàn)?°、45°、90°三個(gè)方向進(jìn)行g(shù)abor濾波。

      (3)合并成三通道的gabor特征偽彩圖:將步驟(2)獲得的0°、45°、90°三個(gè)方向的gabor灰度特征圖進(jìn)行簡(jiǎn)單的線性疊加合并成三通道的gabor特征偽彩圖。

      (4)對(duì)圖像的預(yù)處理方法:

      對(duì)于imagenet數(shù)據(jù)集上獲得的每一張圖像,進(jìn)行了步驟(2)和(3)的gabor特征提取后獲得的gabor特征偽彩圖縮放到32×32大小。

      (5)訓(xùn)練fractalnet網(wǎng)絡(luò)模型:

      通過(guò)單一擴(kuò)展規(guī)則的重復(fù)應(yīng)用生成一個(gè)極深的網(wǎng)絡(luò),其結(jié)構(gòu)布局正是一個(gè)截?cái)嗟姆中巍>W(wǎng)絡(luò)包含長(zhǎng)度不同的相互作用子路徑,但不包含任何直通式連接:每個(gè)內(nèi)部信號(hào)在被下一層看見(jiàn)之前,都被一個(gè)過(guò)濾器和非線性部件變換過(guò)了。

      使用路徑舍棄方法正則化分形架構(gòu)里子路徑的協(xié)同適應(yīng)。通過(guò)這樣的正則化,使得分形網(wǎng)絡(luò)獲得一種性質(zhì):淺層子網(wǎng)絡(luò)給出快捷的答案,而深度子網(wǎng)絡(luò)(有較多延遲)給出更精準(zhǔn)的答案。

      兩種不同的規(guī)則產(chǎn)生分形架構(gòu):

      1、簡(jiǎn)單的擴(kuò)展規(guī)則生成分形架構(gòu)。具體如圖2所示,基礎(chǔ)情形f1(z)包含輸入輸出之間單個(gè)選定類(lèi)型的層。連接層計(jì)算了逐元素平均;

      2、深度卷積網(wǎng)絡(luò)周期性地通過(guò)匯集來(lái)降低空間分辨率。具體如圖3所示,分形版本使用fc(·)作為匯集層之間的建構(gòu)單元。把b個(gè)這樣的塊堆起來(lái)就得到一個(gè)網(wǎng)絡(luò),其總深度是b·2c-1(通過(guò)卷積層衡量)。

      令c表示截?cái)喾中蝔c(·)的指標(biāo),網(wǎng)絡(luò)結(jié)構(gòu)、連接以及層類(lèi)型,通過(guò)fc(·)定義;包含單個(gè)卷積層的網(wǎng)絡(luò)是基礎(chǔ)情形如公式(1-2):

      f1(z)=conv(z)(1-2)

      遞歸定義接下來(lái)的分形如公式(1-3):

      表示復(fù)合,而表示連接操作,c對(duì)應(yīng)于列數(shù),或者說(shuō)網(wǎng)絡(luò)fc(·)的寬度;深度定義為從輸入到輸出的最長(zhǎng)路徑上的conv層的個(gè)數(shù),正比于2c-1;用于分類(lèi)的卷積網(wǎng)絡(luò)通常分散布置匯集層;為了達(dá)到相同目的,使用fc(·)作為構(gòu)建單元,將之與接下來(lái)的匯集層堆疊b次,得到總深度b·2c-1。

      連接操作把兩個(gè)特征塊合為一個(gè);一個(gè)特征塊是一個(gè)conv層的結(jié)果:在一個(gè)空間區(qū)域?yàn)楣潭ǖ囊恍┩ǖ谰S持活化的張量;通道數(shù)對(duì)應(yīng)于前面的conv層的過(guò)濾器的個(gè)數(shù);當(dāng)分形被擴(kuò)展,把相鄰的連接合并成單個(gè)連接層;如圖3的右側(cè)所示,連接層把所有其輸入特征塊合并成單個(gè)輸出塊。

      連接層行為的幾種選擇看起來(lái)都是合理的,包括拼接和加法;把每個(gè)連接實(shí)例化,計(jì)算其輸入的逐元素平均;這對(duì)于卷積網(wǎng)絡(luò)是恰當(dāng)?shù)?,在那里通道?shù)對(duì)一個(gè)分形塊里的所有conv層是相同的。

      路徑舍棄的新正則化規(guī)則:dropout和drop-connect通過(guò)修改網(wǎng)絡(luò)層序列之間的相互作用來(lái)減弱共同適應(yīng)(co-adaptation)。由于分形網(wǎng)絡(luò)包含額外的大尺度結(jié)構(gòu),提出使用一種類(lèi)似的粗粒度正則化策略來(lái)輔助這些技術(shù)。

      dropout禁止了活化的共同適應(yīng),路徑舍棄通過(guò)隨機(jī)丟棄連接層的操作數(shù)來(lái)禁止平行路徑的共同適應(yīng)。這壓制了網(wǎng)絡(luò)使用一個(gè)路徑作為錨標(biāo),用另一個(gè)作為修正(這可能導(dǎo)致過(guò)擬合)的行為。兩個(gè)采樣策略:

      局部:連接層以固定幾率舍棄每個(gè)輸入,但保證至少一個(gè)輸入保留。

      全局:每條路徑是為了整個(gè)網(wǎng)絡(luò)選出的。限制這條路徑是單列的,激勵(lì)每列成為有力的預(yù)測(cè)器。

      (6)根據(jù)訓(xùn)練好模型測(cè)試圖像:根據(jù)前面步驟(1)、(2)、(3)、(4)和(5)等步驟訓(xùn)練好的網(wǎng)絡(luò)使用經(jīng)過(guò)步驟(2)和(3)處理的測(cè)試gabor特征偽彩圖進(jìn)行測(cè)試。

      上述實(shí)施例為本發(fā)明較佳的實(shí)施方式,但本發(fā)明的實(shí)施方式并不受上述實(shí)施例的限制,其他的任何未背離本發(fā)明的精神實(shí)質(zhì)與原理下所作的改變、修飾、替代、組合、簡(jiǎn)化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護(hù)范圍之內(nèi)。

      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1