国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于圖像分類的方法和系統(tǒng)與流程

      文檔序號(hào):11635504閱讀:414來源:國知局
      用于圖像分類的方法和系統(tǒng)與流程

      本申請(qǐng)涉及用于圖像分類的方法及系統(tǒng)。



      背景技術(shù):

      逐像素分類的目標(biāo)是將圖像中的所有像素分類成不同的類別。逐像素分類任務(wù)包括圖像分割和對(duì)象檢測(cè),這需要將圖像分塊輸入到分類器中并且輸出中心像素的類別標(biāo)簽。

      卷積神經(jīng)網(wǎng)絡(luò)(cnn)是可訓(xùn)練的多級(jí)前饋神經(jīng)網(wǎng)絡(luò),已經(jīng)被廣泛地研究,以提取用于圖像分類任務(wù)的良好多層級(jí)特征表示。每一層的輸入和輸出被稱為特征圖。cnn一般包括卷積層、池化層和非線性層。卷積層利用3d濾波器組對(duì)輸入特征圖進(jìn)行卷積操作,以生成輸出特征圖。每個(gè)濾波器在輸入特征圖的所有位置提取相同類型的局部特征。池化層降低特征圖的分辨率,以使輸出特征圖對(duì)輸入偏移和失真不太敏感。最常用的是最大池化和平均池化。非線性層是應(yīng)用于特征圖的每個(gè)元素的逐點(diǎn)非線性函數(shù)。

      在利用多層卷積網(wǎng)絡(luò)提取特征之后,增加具有最終分類器的全連接層從而輸出類別預(yù)測(cè)。在給定訓(xùn)練樣本和它們的標(biāo)簽的情況下,以端對(duì)端監(jiān)督方式通過將訓(xùn)練數(shù)據(jù)上的損失函數(shù)最小化來學(xué)習(xí)cnn的參數(shù)。使用前向和反向傳播對(duì)輸入樣本進(jìn)行類別預(yù)測(cè)并且分別基于預(yù)測(cè)誤差來更新cnn參數(shù)。

      然而,前向和反向傳播最初是為整個(gè)圖像分類設(shè)計(jì)的。以逐個(gè)分塊掃描的方式直接將它應(yīng)用于逐像素分類效率極低,因?yàn)橄袼氐闹車謮K具有較大重疊,從而導(dǎo)致很多冗余的計(jì)算。



      技術(shù)實(shí)現(xiàn)要素:

      目前已經(jīng)有研究針對(duì)如何消除基于cnn的逐像素分類中的前向和反向傳播的所有冗余計(jì)算,并且取得了顯著進(jìn)展。

      在本申請(qǐng)的一方面,公開用于圖像分類的設(shè)備。該設(shè)備可以包括:轉(zhuǎn)換器,其被用于轉(zhuǎn)換卷積神經(jīng)網(wǎng)絡(luò),該卷積神經(jīng)網(wǎng)絡(luò)具有多個(gè)卷積層和連接到卷積層的多個(gè)池化層。該轉(zhuǎn)換器可以包括:第一轉(zhuǎn)換單元,其被配置成將全零行和列插入到卷積層中的每個(gè)的卷積核,使得卷積核中的每兩個(gè)鄰近元素彼此分開;以及第二轉(zhuǎn)換單元,其被配置成將無掩蔽的行和列插入到每個(gè)池化層的池化核,使得池化核中的每兩個(gè)鄰近元素彼此分開。該設(shè)備還可以包括:前向傳播器,其被配置成將圖像饋送到轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中,以預(yù)測(cè)圖像中的所有像素的類別。

      在一個(gè)實(shí)施例中,該設(shè)備還可以包括反向傳播器。反向傳播器可被配置成更新轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中的卷積核的參數(shù)。

      在一個(gè)實(shí)施例中,該設(shè)備還可以包括選擇器。選擇器可被配置成選擇感興趣像素的誤差,所述誤差反向傳播通過轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò),以更新卷積核的參數(shù)。

      本申請(qǐng)的另一方面公開了用于圖像分類的方法。該方法可包括:轉(zhuǎn)換卷積神經(jīng)網(wǎng)絡(luò),該卷積神經(jīng)網(wǎng)絡(luò)具有多個(gè)卷積層和連接到卷積層的多個(gè)池化層;以及將圖像饋送到轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中,以預(yù)測(cè)圖像中的所有像素的類別。轉(zhuǎn)換的步驟可包括:將全零行和列插入到每個(gè)卷積層的卷積核,使得卷積核中的每兩個(gè)鄰近元素彼此分開;以及將無掩蔽的行和列插入到每個(gè)池化層的池化核,使得池化核中的每兩個(gè)鄰近元素彼此分開。

      在一個(gè)實(shí)施例中,該方法還可以包括更新轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中的卷積核的參數(shù)的步驟。

      在一個(gè)實(shí)施例中,該方法還可以包括選擇感興趣像素的誤差,并且將誤差反向傳播通過轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò),以更新卷積核的參數(shù)的步驟。

      附圖說明

      下文參考附圖描述本發(fā)明的示例性非限制實(shí)施例。附圖是說明性的,并且一般不按確切比例。不同圖上的相同或類似元件引用相同的附圖標(biāo)號(hào)。

      圖1是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的示例性設(shè)備的示意圖。

      圖2是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的示例性前向傳播器的示意圖。

      圖3是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的另一示例性前向傳播器的示意圖。

      圖4是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的示例性選擇器的示意圖。

      圖5是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的示例性反向傳播器的示意圖。

      圖6是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的另一示例性反向傳播器的示意圖。

      圖7是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的又一示例性反向傳播器的示意圖。

      圖8是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的用于圖像分類的示例性方法的示意流程圖。

      圖9是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的用于將原始cnn轉(zhuǎn)換成轉(zhuǎn)換后的cnn的步驟的示意流程圖。

      圖10是示出將全零行和列分別插入到卷積核wk和池化核pk的示意圖,其中d=2和d=3。

      圖11是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的用于前向傳播的步驟的示意流程圖。

      圖12是示出利用轉(zhuǎn)換后的卷積核將卷積作為矩陣乘法執(zhí)行的示意圖。

      圖13是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的選擇步驟的示意流程圖。

      圖14是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的用于反向傳播的步驟的示意流程圖。

      圖15是用于基于cnn的逐像素分類的逐個(gè)分塊掃描與本申請(qǐng)中公開的先進(jìn)方法的比較。

      具體實(shí)施方式

      現(xiàn)在將詳細(xì)地解釋本發(fā)明的一些具體實(shí)施例,包括發(fā)明人預(yù)期的用于實(shí)施本發(fā)明的最佳模式。附圖中示出這些具體實(shí)施例的示例。盡管結(jié)合這些具體實(shí)施例描述本發(fā)明,但應(yīng)理解,并不意圖將本發(fā)明限于所述實(shí)施例。相反,意圖涵蓋可以包括在如所附權(quán)利要求書限定的本發(fā)明的精神和范圍內(nèi)的替代方案、修改和等效物。以下描述中列出了許多具體細(xì)節(jié),以便提供對(duì)本申請(qǐng)的全面理解。可以在沒有這些具體細(xì)節(jié)中的一些或全部的情況下實(shí)踐本發(fā)明。在其他情況下,沒有詳細(xì)地描述眾所周知的過程操作,以免不必要地使本發(fā)明變得模糊。

      本文中使用的術(shù)語僅僅是出于描述特定實(shí)施例的目的,而不意圖限制本發(fā)明。除非上下文另有明確指出,否則本文中使用的單數(shù)形式“一”、“一個(gè)”和“所述”也意圖包括復(fù)數(shù)形式。還應(yīng)理解,本說明書中使用的術(shù)語“包括”和/或“包括”用于說明存在所述特征、整數(shù)、步驟、操作、元件和/或部件,但并不排除存在或添加一個(gè)或多個(gè)其他特征、整數(shù)、步驟、操作、元件、部件和/或它們的組合。

      如本領(lǐng)域的技術(shù)人員將了解,本發(fā)明可以體現(xiàn)為系統(tǒng)、方法或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可以采用以下形式:全硬件實(shí)施例、全軟件實(shí)施例(包括固件、常駐軟件、微碼等),或者將在本文中通常都可稱為“電路”、“裝置”、“模塊”或“系統(tǒng)”的軟件和硬件方面組合起來的實(shí)施例。此外,本發(fā)明可以采用計(jì)算機(jī)程序產(chǎn)品的形式,所述計(jì)算機(jī)程序產(chǎn)品體現(xiàn)在任何有形的表達(dá)介質(zhì)中,所述介質(zhì)具有體現(xiàn)在介質(zhì)中的計(jì)算機(jī)可用程序代碼。

      還應(yīng)理解,諸如第一和第二等等相關(guān)術(shù)語(若有的話)單獨(dú)使用,以將一個(gè)實(shí)體、項(xiàng)目或動(dòng)作與另一個(gè)區(qū)分開來,而未必要求或暗示這些實(shí)體、項(xiàng)目或動(dòng)作之間的任何實(shí)際關(guān)系或順序。

      本發(fā)明功能中的很多功能和本發(fā)明原理中的很多原理在實(shí)施時(shí)由軟件或集成電路(ic)最好地支持,諸如,數(shù)字信號(hào)處理器和軟件或者專用ic。盡管存在可能大量的努力和由例如可用時(shí)間、當(dāng)前技術(shù)和經(jīng)濟(jì)考慮因素激勵(lì)的很多設(shè)計(jì)選擇,但預(yù)期本領(lǐng)域的技術(shù)人員在由本文中公開的概念和原理引導(dǎo)時(shí)將容易能夠利用最少的實(shí)驗(yàn)生成此類軟件指令或ic。因此,為了簡潔并且最小化模糊根據(jù)本發(fā)明的原理和概念的任何風(fēng)險(xiǎn),此類軟件和ic的進(jìn)一步論述(若有的話)將限于優(yōu)選實(shí)施例所使用的必要原理和概念。

      圖1是示出符合一些公開實(shí)施例的用于圖像分類的示例性設(shè)備100的示意圖。如圖所示,設(shè)備100可包括轉(zhuǎn)換器10和前向傳播器20。轉(zhuǎn)換器10被配置成獲取卷積神經(jīng)網(wǎng)絡(luò),該卷積神經(jīng)網(wǎng)絡(luò)具有多個(gè)卷積層和連接到卷積層的多個(gè)池化層。前向傳播器可被配置成將圖像饋送到轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò),以生成用于圖像分類的預(yù)測(cè)的標(biāo)簽圖。在本申請(qǐng)的一個(gè)實(shí)施例中,轉(zhuǎn)換器10可包括第一轉(zhuǎn)換單元11和第二轉(zhuǎn)換單元12。第一轉(zhuǎn)換單元11可被配置成將全零行和列插入到每個(gè)卷積層的卷積核,使得卷積核中的每兩個(gè)鄰近元素(entry)彼此分開。第二轉(zhuǎn)換單元12可以被配置成將無掩蔽的行和列插入到每個(gè)池化層中的池化核,使得池化核中的每兩個(gè)鄰近元素彼此分開。在一些實(shí)施例中,兩個(gè)鄰近元素被若干個(gè)像素彼此分開。

      參考圖1,為了使卷積神經(jīng)網(wǎng)絡(luò)能夠有效地工作,設(shè)備100還包括反向傳播器30,該反向傳播器用于計(jì)算更改后的cnn的參數(shù)的梯度。在本實(shí)施例中,反向傳播器30可被配置成更新轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中的卷積核的參數(shù)。在一些實(shí)施例中,設(shè)備100還包括選擇器40,該選擇器計(jì)算預(yù)測(cè)的標(biāo)簽圖的誤差并且只選擇感興趣像素的誤差以用于訓(xùn)練cnn參數(shù)。在本實(shí)施例中,選擇器40可被配置成選擇感興趣像素的誤差,所述誤差反向傳播通過轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò),以更新卷積核的參數(shù)。

      圖2是示出示例性前向傳播器20的示意圖。如圖所示,前向傳播器20可包括第一提取單元21、第一向量化單元22和第一卷積單元23。其中,第一提取單元21被配置成從將被分類的圖像的輸入特征中的每個(gè)鄰域提取由轉(zhuǎn)換后的卷積核中的非零元素指定的特征值。第一向量化單元22被配置成將轉(zhuǎn)換后的卷積核的非零元素向量化。第一卷積單元23被配置成對(duì)第一提取單元提取的特征值和第一向量化單元向量化的非零元素執(zhí)行卷積操作以生成輸出特征圖,所述輸出特征圖可在cnn中用作中間結(jié)果。

      圖3是示出另一示例性前向傳播器20’的示意圖。如圖3所示,前向傳播器20’可包括第二提取單元24和計(jì)算單元25,其中第二提取單元24被配置成從將被分類的圖像的輸入特征中的每個(gè)鄰域提取由轉(zhuǎn)換后的池化核中的掩蔽元素指定的特征值,并且計(jì)算單元25被配置成從在第二提取單元中提取的特征值來計(jì)算多個(gè)池化層中的平均池化層的平均值、或者多個(gè)池化層中的最大池化層的最大值,以生成輸出特征圖。如本領(lǐng)域中已知,池化層可是卷積神經(jīng)網(wǎng)絡(luò)中的層并且可處于cnn的任何層處,并且平均池化層根據(jù)從輸入特征圖的每個(gè)鄰域中提取的特征值來計(jì)算平均值。至于最大池化層,可根據(jù)從輸入特征圖的每個(gè)鄰域中提取的特征值來計(jì)算最大值。

      應(yīng)理解,在一些實(shí)施例中,前向傳播器20可包括第一提取單元21、第一向量化單元22、第一卷積單元23、第二提取單元24和計(jì)算單元25。應(yīng)理解,盡管圖2和圖3中示出一個(gè)前向傳播器20/20’,但在其他實(shí)施例中,可存在不止一個(gè)前向傳播器20/20’。

      圖4是示出示例性選擇器40的示意圖。如圖4所示,選擇器40可包括比較器41,所述比較器被配置成將在前向傳播器20中生成的預(yù)測(cè)標(biāo)簽圖與基本真實(shí)標(biāo)簽圖進(jìn)行比較,以獲取標(biāo)簽圖的逐像素誤差。

      在一些實(shí)施例中,選擇器40還可包括乘法器42,所述乘法器被配置成將逐像素誤差中的每個(gè)與感興趣像素的掩模相乘,以生成誤差的掩蔽圖(maskedmap)。

      圖5是示出示例性反向傳播器30的示意圖。如圖5所示,反向傳播器30可包括第三提取單元31、第二向量化單元32和第二卷積單元33。第三提取單元31被配置成從將被分類的圖像的輸入特征中的每個(gè)鄰域中提取由轉(zhuǎn)換后的卷積核中的非零元素指定的特征值。第二向量化單元32被配置成將從選擇器40接收的誤差圖或下一層的誤差圖向量化。第二卷積單元33被配置成對(duì)第三提取單元提取的特征圖和第二向量化單元32向量化的誤差圖執(zhí)行卷積操作,以計(jì)算卷積核的梯度,用于更新卷積核。

      在一些實(shí)施例中,反向傳播器30還包括第三向量化單元321、第四提取單元311和第三卷積單元331。第三向量化單元321可被配置成使轉(zhuǎn)換后的卷積核的非零元素旋轉(zhuǎn)一定角度并且將旋轉(zhuǎn)后的非零元素向量化。第四提取單元311可被配置成提取由旋轉(zhuǎn)后的非零元素指定的特征值。第三卷積單元331被配置成對(duì)第四提取單元311提取的特征值和第三向量化單元321向量化的非零元素執(zhí)行卷積操作,以生成誤差圖,所述誤差圖逐個(gè)層地反向傳播通過網(wǎng)絡(luò),以更新先前卷積層的卷積核。

      圖6是示出另一示例性反向傳播器30’的示意圖。如圖6所示,反向傳播器30’可包括第一轉(zhuǎn)移單元34和第一累積單元35。第一轉(zhuǎn)移單元34可被配置成將從選擇器40接收的誤差圖或下一層的誤差圖的誤差值轉(zhuǎn)移到當(dāng)前層的誤差圖上的對(duì)應(yīng)元素,該誤差圖的索引記錄在前向傳播器10中。第一累積單元35可被配置成累積當(dāng)前層的誤差圖的每個(gè)元素的轉(zhuǎn)移誤差值。

      圖7是示出又一示例性反向傳播器30”的示意圖。如圖7所示,反向傳播器30”可包括平均(dividing)單元36、第二轉(zhuǎn)移單元37和第二累積單元38。平均單元36可被配置成根據(jù)池化核中的掩蔽元素的數(shù)量,將從選擇器40接收的誤差圖或下一層的誤差圖上的每個(gè)誤差值平均。第二轉(zhuǎn)移單元37可被配置成將平均的誤差值轉(zhuǎn)移回到當(dāng)前層的誤差圖上的鄰域,所述誤差圖的索引記錄在前向傳播器10中。第二累積單元38可被配置成累積當(dāng)前層的誤差圖的每個(gè)元素的轉(zhuǎn)移誤差值,其中第一轉(zhuǎn)移單元34被配置成將下一層的誤差圖的誤差值轉(zhuǎn)移到當(dāng)前層的誤差圖上的對(duì)應(yīng)元素,所述誤差圖的索引記錄在前向傳播器10中。

      圖8是示出用于圖像分類的示例性方法200的示意圖。如圖所示,方法200可包括下列步驟。在步驟210處,獲取卷積神經(jīng)網(wǎng)絡(luò),該卷積神經(jīng)網(wǎng)絡(luò)具有多個(gè)卷積層和連接到卷積層的多個(gè)池化層。在步驟220處,將圖像饋送到卷積神經(jīng)網(wǎng)絡(luò),以預(yù)測(cè)圖像中的所有像素的類別。在步驟260處,選擇感興趣像素的誤差,并且將所述誤差反向傳播通過轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò),以更新卷積核。在步驟240處,更新轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中的卷積核。

      在本實(shí)施例中,通過將圖像分塊作為輸入的原始cnn轉(zhuǎn)換成能夠?qū)⒄麄€(gè)圖像作為輸入的轉(zhuǎn)換后的cnn來獲取或取得卷積神經(jīng)網(wǎng)絡(luò)。具體而言,由圖9所示的步驟來轉(zhuǎn)換一些參數(shù),諸如,卷積層的卷積核wk、池化層的池化核pk和層的跨距dk。在步驟211中,最初將d和k設(shè)置為1。在步驟212中,確定層k的類型。如果層既不是卷積層也不是池化層,那么卷積過程前進(jìn)到步驟214。如果在步驟212中,層是卷積層,那么方法前進(jìn)到步驟213,通過將全零行和列插入到卷積核wk來轉(zhuǎn)換卷積核wk,使得每兩個(gè)鄰近元素彼此遠(yuǎn)離d個(gè)像素。如果在步驟212處,層是池化層,那么在步驟213處,通過將無掩蔽的行和列插入到池化核pk來轉(zhuǎn)換核pk,使得每兩個(gè)鄰近元素彼此遠(yuǎn)離d個(gè)像素。隨后,過程前進(jìn)到步驟214中確定當(dāng)前層是不是最后一層。如果是的話,過程前進(jìn)到步驟215,該過程結(jié)束。如果不是的話,則使k加1(即,k=k+1),并且過程返回到步驟212,以處理下一層。

      圖10是示出將全零行和列分別插入到卷積核wk和池化核pk的視圖,其中d=2和d=3。

      圖11是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的前向傳播的示意流程圖,該前向傳播可由上述前向傳播器20實(shí)施。如圖11所示,前向傳播從步驟221開始,在該步驟處,將圖像設(shè)置為輸入特征圖并且將k設(shè)置為1。隨后,過程前進(jìn)到步驟222,確定當(dāng)前層(即,層k)的類型。如果當(dāng)前層既不是卷積層也不是池化層,例如,該層是非線性層,那么方法前進(jìn)到步驟223,以原始方式執(zhí)行操作。如果當(dāng)前層是具有轉(zhuǎn)換后的卷積核wk和偏置向量bk的卷積層,那么過程前進(jìn)到步驟224,將層的跨距設(shè)置為1,隨后前進(jìn)到步驟225,從圖像xk的輸入特征中的每個(gè)鄰域中提取由核中的非零元素指定的特征值,以創(chuàng)建矩陣。隨后,過程前進(jìn)到步驟226,將卷積核wk的非零元素向量化,以創(chuàng)建向量。隨后,過程前進(jìn)到步驟227,由在先前步驟中創(chuàng)建的矩陣與向量之間的矩陣乘法執(zhí)行卷積。隨后,過程前進(jìn)到步驟228,將結(jié)果存儲(chǔ)在輸出特征圖中。

      在步驟222處,如果當(dāng)前層是具有轉(zhuǎn)換后的池化核pk的池化層,那么過程前進(jìn)到步驟229,將層的跨距設(shè)置為1,隨后前進(jìn)到步驟230,從將被分類的圖像xk的輸入特征中的每個(gè)鄰域中提取由池化核中的掩蔽元素指定的特征值。隨后,過程前進(jìn)到步驟231,從在第二提取單元中提取的特征值來計(jì)算平均池化層的平均值或最大池化層的最大值,以生成標(biāo)簽圖,用于將圖像中的所有像素分類。類似于步驟228,在步驟232處,將計(jì)算結(jié)果存儲(chǔ)在輸出特征圖中。隨后,過程前進(jìn)到步驟233,確定當(dāng)前層是不是最后一層。如果是的話,過程前進(jìn)到步驟234,輸出最后一層的輸出特征圖,以生成預(yù)測(cè)的標(biāo)簽圖,并且過程結(jié)束。如果不是的話,則過程返回到步驟222,以處理下一層。

      在一些實(shí)施例中,可通過重新組織乘法結(jié)果來創(chuàng)建輸出特征圖xk+1。在一些實(shí)施例中,將偏置值bk(i)添加到輸出特征圖xk+1的第i個(gè)通道的所有值。

      圖12是示出利用轉(zhuǎn)換后的卷積核將卷積作為矩陣乘法執(zhí)行的示意圖。

      圖13是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的選擇步驟的示意流程圖,該選擇步驟可由上述選擇器40實(shí)施。如圖13所示,在步驟261中,將基于輸出特征圖在前向傳播器中生成的預(yù)測(cè)的標(biāo)簽圖與基本真實(shí)標(biāo)簽圖進(jìn)行比較,以計(jì)算標(biāo)簽圖的逐像素誤差,隨后在步驟262處,將逐像素誤差中的每個(gè)乘以感興趣像素的掩模,以生成誤差的掩蔽圖。最后,在步驟263處,輸出掩蔽的誤差圖。

      圖14是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的用于反向傳播的步驟的示意流程圖,該反向傳播可由上述反向傳播器30實(shí)施。

      如圖14所示,前向傳播從步驟241開始,在該步驟處,將當(dāng)前誤差圖設(shè)置為輸入誤差圖并且將k設(shè)置為k。隨后,過程前進(jìn)到步驟242中確定當(dāng)前層(即,層k)的類型。如果當(dāng)前層既不是卷積層也不是池化層,例如,該層是非線性層,那么方法前進(jìn)到步驟243,以原始方式執(zhí)行操作。

      在步驟242處,如果層k是具有轉(zhuǎn)換后的卷積核wk和偏置向量bk的卷積層,那么過程前進(jìn)到步驟244,從將被分類的圖像xk的輸入特征中的每個(gè)鄰域中提取由轉(zhuǎn)換后的卷積核中的非零元素指定的特征值,以創(chuàng)建矩陣。隨后,在步驟245處,將誤差圖δk+1旋轉(zhuǎn)一定角度,例如,180度,并且進(jìn)行向量化,以創(chuàng)建向量。之后,在步驟246處,利用創(chuàng)建的矩陣和向量將卷積作為矩陣乘法來執(zhí)行,以計(jì)算核wk的梯度。隨后,過程前進(jìn)到步驟247,將結(jié)果作為核的梯度存儲(chǔ)。針對(duì)誤差圖δk+1中的第i個(gè)通道,將每個(gè)誤差通道中的所有誤差值合計(jì)起來,作為偏置bk(i)的梯度。

      在步驟244的同時(shí),在步驟248處,可將核旋轉(zhuǎn)一定角度,諸如,180度,以創(chuàng)建向量。隨后,針對(duì)誤差圖δk+1中的每個(gè)鄰域,在步驟250處,從誤差圖中提取由核中的非零元素指定的誤差值,以創(chuàng)建矩陣。隨后,過程前進(jìn)到步驟251處,利用創(chuàng)建的矩陣和向量將卷積作為矩陣乘法來執(zhí)行,以計(jì)算該層的誤差圖。最后,將結(jié)果存儲(chǔ)在前一層(即,層k-1)的誤差圖δk中。

      在步驟242處,如果層k是具有更改的池化核pk的最大池化層,那么過程前進(jìn)到步驟249,針對(duì)誤差圖δk+1的每個(gè)誤差值,將誤差值轉(zhuǎn)移到誤差圖δk上的對(duì)應(yīng)元素,所述誤差圖的索引在前向傳播期間記錄。隨后,對(duì)δk的每個(gè)元素的轉(zhuǎn)移誤差值進(jìn)行累積。如果層k是具有更改后的池化核pk的平均池化層,那么在步驟249處,按照池化核pk中的掩蔽元素的數(shù)量將δk+1上的每個(gè)誤差值平均。隨后,將平均的值轉(zhuǎn)移回到誤差圖δk上的鄰域,所述誤差圖的索引在前向傳播期間記錄。最后,對(duì)δk的每個(gè)元素的轉(zhuǎn)移誤差值進(jìn)行累積。

      在上述步驟之后,過程前進(jìn)到步驟253,確定當(dāng)前層是不是第一層。如果是的話,過程前進(jìn)到步驟254,該過程結(jié)束。如果不是的話,則使k減1(即,k=k-1),并且過程返回到步驟242以繼續(xù)。

      在過程結(jié)束時(shí),輸出所有卷積核及其偏置向量的梯度。

      圖15是用于基于cnn的逐像素分類的逐個(gè)分塊掃描與本申請(qǐng)中公開的先進(jìn)方法的比較。與傳統(tǒng)分類方案相比,本發(fā)明的解決方案具有消除基于cnn的逐像素分類中的前向和反向傳播的冗余計(jì)算的優(yōu)點(diǎn),并且取得顯著進(jìn)展。

      所附權(quán)利要求書中的所有構(gòu)件或步驟加功能元件的對(duì)應(yīng)結(jié)構(gòu)、材料、動(dòng)作和等效物意圖包括用于與特別要求保護(hù)的其他要求元件結(jié)合執(zhí)行功能的任何結(jié)構(gòu)、材料或動(dòng)作。出于說明和描述的目的呈現(xiàn)了本發(fā)明的描述,但并不意圖詳細(xì)列舉或者將本發(fā)明限于所公開的形式。在不脫離本發(fā)明的范圍和精神的情況下,本領(lǐng)域的技術(shù)人員將清楚許多更改和變化。實(shí)施例經(jīng)過選擇和描述以便最好地闡釋本發(fā)明的原理和實(shí)際應(yīng)用,并且使本領(lǐng)域的技術(shù)人員能夠以適于預(yù)期的特定用途的各種實(shí)施例和各種更改來理解本發(fā)明。

      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1