用于圖像分類的方法和系統(tǒng)與流程

文檔序號(hào)：11635504閱讀：414來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本申請(qǐng)涉及用于圖像分類的方法及系統(tǒng)。

背景技術(shù)：

逐像素分類的目標(biāo)是將圖像中的所有像素分類成不同的類別。逐像素分類任務(wù)包括圖像分割和對(duì)象檢測(cè)，這需要將圖像分塊輸入到分類器中并且輸出中心像素的類別標(biāo)簽。

卷積神經(jīng)網(wǎng)絡(luò)(cnn)是可訓(xùn)練的多級(jí)前饋神經(jīng)網(wǎng)絡(luò),已經(jīng)被廣泛地研究，以提取用于圖像分類任務(wù)的良好多層級(jí)特征表示。每一層的輸入和輸出被稱為特征圖。cnn一般包括卷積層、池化層和非線性層。卷積層利用3d濾波器組對(duì)輸入特征圖進(jìn)行卷積操作，以生成輸出特征圖。每個(gè)濾波器在輸入特征圖的所有位置提取相同類型的局部特征。池化層降低特征圖的分辨率，以使輸出特征圖對(duì)輸入偏移和失真不太敏感。最常用的是最大池化和平均池化。非線性層是應(yīng)用于特征圖的每個(gè)元素的逐點(diǎn)非線性函數(shù)。

在利用多層卷積網(wǎng)絡(luò)提取特征之后，增加具有最終分類器的全連接層從而輸出類別預(yù)測(cè)。在給定訓(xùn)練樣本和它們的標(biāo)簽的情況下，以端對(duì)端監(jiān)督方式通過將訓(xùn)練數(shù)據(jù)上的損失函數(shù)最小化來學(xué)習(xí)cnn的參數(shù)。使用前向和反向傳播對(duì)輸入樣本進(jìn)行類別預(yù)測(cè)并且分別基于預(yù)測(cè)誤差來更新cnn參數(shù)。

然而，前向和反向傳播最初是為整個(gè)圖像分類設(shè)計(jì)的。以逐個(gè)分塊掃描的方式直接將它應(yīng)用于逐像素分類效率極低，因?yàn)橄袼氐闹車謮K具有較大重疊，從而導(dǎo)致很多冗余的計(jì)算。

技術(shù)實(shí)現(xiàn)要素：

目前已經(jīng)有研究針對(duì)如何消除基于cnn的逐像素分類中的前向和反向傳播的所有冗余計(jì)算，并且取得了顯著進(jìn)展。

在本申請(qǐng)的一方面，公開用于圖像分類的設(shè)備。該設(shè)備可以包括：轉(zhuǎn)換器，其被用于轉(zhuǎn)換卷積神經(jīng)網(wǎng)絡(luò)，該卷積神經(jīng)網(wǎng)絡(luò)具有多個(gè)卷積層和連接到卷積層的多個(gè)池化層。該轉(zhuǎn)換器可以包括：第一轉(zhuǎn)換單元，其被配置成將全零行和列插入到卷積層中的每個(gè)的卷積核，使得卷積核中的每兩個(gè)鄰近元素彼此分開；以及第二轉(zhuǎn)換單元，其被配置成將無掩蔽的行和列插入到每個(gè)池化層的池化核，使得池化核中的每兩個(gè)鄰近元素彼此分開。該設(shè)備還可以包括：前向傳播器，其被配置成將圖像饋送到轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中，以預(yù)測(cè)圖像中的所有像素的類別。

在一個(gè)實(shí)施例中，該設(shè)備還可以包括反向傳播器。反向傳播器可被配置成更新轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中的卷積核的參數(shù)。

在一個(gè)實(shí)施例中，該設(shè)備還可以包括選擇器。選擇器可被配置成選擇感興趣像素的誤差，所述誤差反向傳播通過轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)，以更新卷積核的參數(shù)。

本申請(qǐng)的另一方面公開了用于圖像分類的方法。該方法可包括：轉(zhuǎn)換卷積神經(jīng)網(wǎng)絡(luò)，該卷積神經(jīng)網(wǎng)絡(luò)具有多個(gè)卷積層和連接到卷積層的多個(gè)池化層；以及將圖像饋送到轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中，以預(yù)測(cè)圖像中的所有像素的類別。轉(zhuǎn)換的步驟可包括：將全零行和列插入到每個(gè)卷積層的卷積核，使得卷積核中的每兩個(gè)鄰近元素彼此分開；以及將無掩蔽的行和列插入到每個(gè)池化層的池化核，使得池化核中的每兩個(gè)鄰近元素彼此分開。

在一個(gè)實(shí)施例中，該方法還可以包括更新轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中的卷積核的參數(shù)的步驟。

在一個(gè)實(shí)施例中，該方法還可以包括選擇感興趣像素的誤差，并且將誤差反向傳播通過轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)，以更新卷積核的參數(shù)的步驟。

附圖說明

下文參考附圖描述本發(fā)明的示例性非限制實(shí)施例。附圖是說明性的，并且一般不按確切比例。不同圖上的相同或類似元件引用相同的附圖標(biāo)號(hào)。

圖1是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的示例性設(shè)備的示意圖。

圖2是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的示例性前向傳播器的示意圖。

圖3是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的另一示例性前向傳播器的示意圖。

圖4是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的示例性選擇器的示意圖。

圖5是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的示例性反向傳播器的示意圖。

圖6是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的另一示例性反向傳播器的示意圖。

圖7是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的又一示例性反向傳播器的示意圖。

圖8是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的用于圖像分類的示例性方法的示意流程圖。

圖9是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的用于將原始cnn轉(zhuǎn)換成轉(zhuǎn)換后的cnn的步驟的示意流程圖。

圖10是示出將全零行和列分別插入到卷積核wk和池化核pk的示意圖，其中d＝2和d＝3。

圖11是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的用于前向傳播的步驟的示意流程圖。

圖12是示出利用轉(zhuǎn)換后的卷積核將卷積作為矩陣乘法執(zhí)行的示意圖。

圖13是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的選擇步驟的示意流程圖。

圖14是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的用于反向傳播的步驟的示意流程圖。

圖15是用于基于cnn的逐像素分類的逐個(gè)分塊掃描與本申請(qǐng)中公開的先進(jìn)方法的比較。

具體實(shí)施方式

現(xiàn)在將詳細(xì)地解釋本發(fā)明的一些具體實(shí)施例，包括發(fā)明人預(yù)期的用于實(shí)施本發(fā)明的最佳模式。附圖中示出這些具體實(shí)施例的示例。盡管結(jié)合這些具體實(shí)施例描述本發(fā)明，但應(yīng)理解，并不意圖將本發(fā)明限于所述實(shí)施例。相反，意圖涵蓋可以包括在如所附權(quán)利要求書限定的本發(fā)明的精神和范圍內(nèi)的替代方案、修改和等效物。以下描述中列出了許多具體細(xì)節(jié)，以便提供對(duì)本申請(qǐng)的全面理解。可以在沒有這些具體細(xì)節(jié)中的一些或全部的情況下實(shí)踐本發(fā)明。在其他情況下，沒有詳細(xì)地描述眾所周知的過程操作，以免不必要地使本發(fā)明變得模糊。

本文中使用的術(shù)語僅僅是出于描述特定實(shí)施例的目的，而不意圖限制本發(fā)明。除非上下文另有明確指出，否則本文中使用的單數(shù)形式“一”、“一個(gè)”和“所述”也意圖包括復(fù)數(shù)形式。還應(yīng)理解，本說明書中使用的術(shù)語“包括”和/或“包括”用于說明存在所述特征、整數(shù)、步驟、操作、元件和/或部件，但并不排除存在或添加一個(gè)或多個(gè)其他特征、整數(shù)、步驟、操作、元件、部件和/或它們的組合。

如本領(lǐng)域的技術(shù)人員將了解，本發(fā)明可以體現(xiàn)為系統(tǒng)、方法或計(jì)算機(jī)程序產(chǎn)品。因此，本發(fā)明可以采用以下形式：全硬件實(shí)施例、全軟件實(shí)施例(包括固件、常駐軟件、微碼等)，或者將在本文中通常都可稱為“電路”、“裝置”、“模塊”或“系統(tǒng)”的軟件和硬件方面組合起來的實(shí)施例。此外，本發(fā)明可以采用計(jì)算機(jī)程序產(chǎn)品的形式，所述計(jì)算機(jī)程序產(chǎn)品體現(xiàn)在任何有形的表達(dá)介質(zhì)中，所述介質(zhì)具有體現(xiàn)在介質(zhì)中的計(jì)算機(jī)可用程序代碼。

還應(yīng)理解，諸如第一和第二等等相關(guān)術(shù)語(若有的話)單獨(dú)使用，以將一個(gè)實(shí)體、項(xiàng)目或動(dòng)作與另一個(gè)區(qū)分開來，而未必要求或暗示這些實(shí)體、項(xiàng)目或動(dòng)作之間的任何實(shí)際關(guān)系或順序。

本發(fā)明功能中的很多功能和本發(fā)明原理中的很多原理在實(shí)施時(shí)由軟件或集成電路(ic)最好地支持，諸如，數(shù)字信號(hào)處理器和軟件或者專用ic。盡管存在可能大量的努力和由例如可用時(shí)間、當(dāng)前技術(shù)和經(jīng)濟(jì)考慮因素激勵(lì)的很多設(shè)計(jì)選擇，但預(yù)期本領(lǐng)域的技術(shù)人員在由本文中公開的概念和原理引導(dǎo)時(shí)將容易能夠利用最少的實(shí)驗(yàn)生成此類軟件指令或ic。因此，為了簡潔并且最小化模糊根據(jù)本發(fā)明的原理和概念的任何風(fēng)險(xiǎn)，此類軟件和ic的進(jìn)一步論述(若有的話)將限于優(yōu)選實(shí)施例所使用的必要原理和概念。

圖1是示出符合一些公開實(shí)施例的用于圖像分類的示例性設(shè)備100的示意圖。如圖所示，設(shè)備100可包括轉(zhuǎn)換器10和前向傳播器20。轉(zhuǎn)換器10被配置成獲取卷積神經(jīng)網(wǎng)絡(luò)，該卷積神經(jīng)網(wǎng)絡(luò)具有多個(gè)卷積層和連接到卷積層的多個(gè)池化層。前向傳播器可被配置成將圖像饋送到轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)，以生成用于圖像分類的預(yù)測(cè)的標(biāo)簽圖。在本申請(qǐng)的一個(gè)實(shí)施例中，轉(zhuǎn)換器10可包括第一轉(zhuǎn)換單元11和第二轉(zhuǎn)換單元12。第一轉(zhuǎn)換單元11可被配置成將全零行和列插入到每個(gè)卷積層的卷積核，使得卷積核中的每兩個(gè)鄰近元素(entry)彼此分開。第二轉(zhuǎn)換單元12可以被配置成將無掩蔽的行和列插入到每個(gè)池化層中的池化核，使得池化核中的每兩個(gè)鄰近元素彼此分開。在一些實(shí)施例中，兩個(gè)鄰近元素被若干個(gè)像素彼此分開。

參考圖1，為了使卷積神經(jīng)網(wǎng)絡(luò)能夠有效地工作，設(shè)備100還包括反向傳播器30，該反向傳播器用于計(jì)算更改后的cnn的參數(shù)的梯度。在本實(shí)施例中，反向傳播器30可被配置成更新轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中的卷積核的參數(shù)。在一些實(shí)施例中，設(shè)備100還包括選擇器40，該選擇器計(jì)算預(yù)測(cè)的標(biāo)簽圖的誤差并且只選擇感興趣像素的誤差以用于訓(xùn)練cnn參數(shù)。在本實(shí)施例中，選擇器40可被配置成選擇感興趣像素的誤差，所述誤差反向傳播通過轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)，以更新卷積核的參數(shù)。

圖2是示出示例性前向傳播器20的示意圖。如圖所示，前向傳播器20可包括第一提取單元21、第一向量化單元22和第一卷積單元23。其中，第一提取單元21被配置成從將被分類的圖像的輸入特征中的每個(gè)鄰域提取由轉(zhuǎn)換后的卷積核中的非零元素指定的特征值。第一向量化單元22被配置成將轉(zhuǎn)換后的卷積核的非零元素向量化。第一卷積單元23被配置成對(duì)第一提取單元提取的特征值和第一向量化單元向量化的非零元素執(zhí)行卷積操作以生成輸出特征圖，所述輸出特征圖可在cnn中用作中間結(jié)果。

圖3是示出另一示例性前向傳播器20’的示意圖。如圖3所示，前向傳播器20’可包括第二提取單元24和計(jì)算單元25，其中第二提取單元24被配置成從將被分類的圖像的輸入特征中的每個(gè)鄰域提取由轉(zhuǎn)換后的池化核中的掩蔽元素指定的特征值，并且計(jì)算單元25被配置成從在第二提取單元中提取的特征值來計(jì)算多個(gè)池化層中的平均池化層的平均值、或者多個(gè)池化層中的最大池化層的最大值，以生成輸出特征圖。如本領(lǐng)域中已知，池化層可是卷積神經(jīng)網(wǎng)絡(luò)中的層并且可處于cnn的任何層處，并且平均池化層根據(jù)從輸入特征圖的每個(gè)鄰域中提取的特征值來計(jì)算平均值。至于最大池化層，可根據(jù)從輸入特征圖的每個(gè)鄰域中提取的特征值來計(jì)算最大值。

應(yīng)理解，在一些實(shí)施例中，前向傳播器20可包括第一提取單元21、第一向量化單元22、第一卷積單元23、第二提取單元24和計(jì)算單元25。應(yīng)理解，盡管圖2和圖3中示出一個(gè)前向傳播器20/20’，但在其他實(shí)施例中，可存在不止一個(gè)前向傳播器20/20’。

圖4是示出示例性選擇器40的示意圖。如圖4所示，選擇器40可包括比較器41，所述比較器被配置成將在前向傳播器20中生成的預(yù)測(cè)標(biāo)簽圖與基本真實(shí)標(biāo)簽圖進(jìn)行比較，以獲取標(biāo)簽圖的逐像素誤差。

在一些實(shí)施例中，選擇器40還可包括乘法器42，所述乘法器被配置成將逐像素誤差中的每個(gè)與感興趣像素的掩模相乘，以生成誤差的掩蔽圖(maskedmap)。

圖5是示出示例性反向傳播器30的示意圖。如圖5所示，反向傳播器30可包括第三提取單元31、第二向量化單元32和第二卷積單元33。第三提取單元31被配置成從將被分類的圖像的輸入特征中的每個(gè)鄰域中提取由轉(zhuǎn)換后的卷積核中的非零元素指定的特征值。第二向量化單元32被配置成將從選擇器40接收的誤差圖或下一層的誤差圖向量化。第二卷積單元33被配置成對(duì)第三提取單元提取的特征圖和第二向量化單元32向量化的誤差圖執(zhí)行卷積操作，以計(jì)算卷積核的梯度，用于更新卷積核。

在一些實(shí)施例中，反向傳播器30還包括第三向量化單元321、第四提取單元311和第三卷積單元331。第三向量化單元321可被配置成使轉(zhuǎn)換后的卷積核的非零元素旋轉(zhuǎn)一定角度并且將旋轉(zhuǎn)后的非零元素向量化。第四提取單元311可被配置成提取由旋轉(zhuǎn)后的非零元素指定的特征值。第三卷積單元331被配置成對(duì)第四提取單元311提取的特征值和第三向量化單元321向量化的非零元素執(zhí)行卷積操作，以生成誤差圖，所述誤差圖逐個(gè)層地反向傳播通過網(wǎng)絡(luò)，以更新先前卷積層的卷積核。

圖6是示出另一示例性反向傳播器30’的示意圖。如圖6所示，反向傳播器30’可包括第一轉(zhuǎn)移單元34和第一累積單元35。第一轉(zhuǎn)移單元34可被配置成將從選擇器40接收的誤差圖或下一層的誤差圖的誤差值轉(zhuǎn)移到當(dāng)前層的誤差圖上的對(duì)應(yīng)元素，該誤差圖的索引記錄在前向傳播器10中。第一累積單元35可被配置成累積當(dāng)前層的誤差圖的每個(gè)元素的轉(zhuǎn)移誤差值。

圖7是示出又一示例性反向傳播器30”的示意圖。如圖7所示，反向傳播器30”可包括平均(dividing)單元36、第二轉(zhuǎn)移單元37和第二累積單元38。平均單元36可被配置成根據(jù)池化核中的掩蔽元素的數(shù)量，將從選擇器40接收的誤差圖或下一層的誤差圖上的每個(gè)誤差值平均。第二轉(zhuǎn)移單元37可被配置成將平均的誤差值轉(zhuǎn)移回到當(dāng)前層的誤差圖上的鄰域，所述誤差圖的索引記錄在前向傳播器10中。第二累積單元38可被配置成累積當(dāng)前層的誤差圖的每個(gè)元素的轉(zhuǎn)移誤差值，其中第一轉(zhuǎn)移單元34被配置成將下一層的誤差圖的誤差值轉(zhuǎn)移到當(dāng)前層的誤差圖上的對(duì)應(yīng)元素，所述誤差圖的索引記錄在前向傳播器10中。

圖8是示出用于圖像分類的示例性方法200的示意圖。如圖所示，方法200可包括下列步驟。在步驟210處，獲取卷積神經(jīng)網(wǎng)絡(luò)，該卷積神經(jīng)網(wǎng)絡(luò)具有多個(gè)卷積層和連接到卷積層的多個(gè)池化層。在步驟220處，將圖像饋送到卷積神經(jīng)網(wǎng)絡(luò)，以預(yù)測(cè)圖像中的所有像素的類別。在步驟260處，選擇感興趣像素的誤差，并且將所述誤差反向傳播通過轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)，以更新卷積核。在步驟240處，更新轉(zhuǎn)換后的卷積神經(jīng)網(wǎng)絡(luò)中的卷積核。

在本實(shí)施例中，通過將圖像分塊作為輸入的原始cnn轉(zhuǎn)換成能夠?qū)⒄麄€(gè)圖像作為輸入的轉(zhuǎn)換后的cnn來獲取或取得卷積神經(jīng)網(wǎng)絡(luò)。具體而言，由圖9所示的步驟來轉(zhuǎn)換一些參數(shù)，諸如，卷積層的卷積核wk、池化層的池化核pk和層的跨距dk。在步驟211中，最初將d和k設(shè)置為1。在步驟212中，確定層k的類型。如果層既不是卷積層也不是池化層，那么卷積過程前進(jìn)到步驟214。如果在步驟212中，層是卷積層，那么方法前進(jìn)到步驟213，通過將全零行和列插入到卷積核wk來轉(zhuǎn)換卷積核wk，使得每兩個(gè)鄰近元素彼此遠(yuǎn)離d個(gè)像素。如果在步驟212處，層是池化層，那么在步驟213處，通過將無掩蔽的行和列插入到池化核pk來轉(zhuǎn)換核pk，使得每兩個(gè)鄰近元素彼此遠(yuǎn)離d個(gè)像素。隨后，過程前進(jìn)到步驟214中確定當(dāng)前層是不是最后一層。如果是的話，過程前進(jìn)到步驟215，該過程結(jié)束。如果不是的話，則使k加1(即，k＝k+1)，并且過程返回到步驟212，以處理下一層。

圖10是示出將全零行和列分別插入到卷積核wk和池化核pk的視圖，其中d＝2和d＝3。

圖11是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的前向傳播的示意流程圖，該前向傳播可由上述前向傳播器20實(shí)施。如圖11所示，前向傳播從步驟221開始，在該步驟處，將圖像設(shè)置為輸入特征圖并且將k設(shè)置為1。隨后，過程前進(jìn)到步驟222，確定當(dāng)前層(即，層k)的類型。如果當(dāng)前層既不是卷積層也不是池化層，例如，該層是非線性層，那么方法前進(jìn)到步驟223，以原始方式執(zhí)行操作。如果當(dāng)前層是具有轉(zhuǎn)換后的卷積核wk和偏置向量bk的卷積層，那么過程前進(jìn)到步驟224，將層的跨距設(shè)置為1，隨后前進(jìn)到步驟225，從圖像xk的輸入特征中的每個(gè)鄰域中提取由核中的非零元素指定的特征值，以創(chuàng)建矩陣。隨后，過程前進(jìn)到步驟226，將卷積核wk的非零元素向量化，以創(chuàng)建向量。隨后，過程前進(jìn)到步驟227，由在先前步驟中創(chuàng)建的矩陣與向量之間的矩陣乘法執(zhí)行卷積。隨后，過程前進(jìn)到步驟228，將結(jié)果存儲(chǔ)在輸出特征圖中。

在步驟222處，如果當(dāng)前層是具有轉(zhuǎn)換后的池化核pk的池化層，那么過程前進(jìn)到步驟229，將層的跨距設(shè)置為1，隨后前進(jìn)到步驟230，從將被分類的圖像xk的輸入特征中的每個(gè)鄰域中提取由池化核中的掩蔽元素指定的特征值。隨后，過程前進(jìn)到步驟231，從在第二提取單元中提取的特征值來計(jì)算平均池化層的平均值或最大池化層的最大值，以生成標(biāo)簽圖，用于將圖像中的所有像素分類。類似于步驟228，在步驟232處，將計(jì)算結(jié)果存儲(chǔ)在輸出特征圖中。隨后，過程前進(jìn)到步驟233，確定當(dāng)前層是不是最后一層。如果是的話，過程前進(jìn)到步驟234，輸出最后一層的輸出特征圖，以生成預(yù)測(cè)的標(biāo)簽圖，并且過程結(jié)束。如果不是的話，則過程返回到步驟222，以處理下一層。

在一些實(shí)施例中，可通過重新組織乘法結(jié)果來創(chuàng)建輸出特征圖xk+1。在一些實(shí)施例中，將偏置值bk(i)添加到輸出特征圖xk+1的第i個(gè)通道的所有值。

圖12是示出利用轉(zhuǎn)換后的卷積核將卷積作為矩陣乘法執(zhí)行的示意圖。

圖13是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的選擇步驟的示意流程圖，該選擇步驟可由上述選擇器40實(shí)施。如圖13所示，在步驟261中，將基于輸出特征圖在前向傳播器中生成的預(yù)測(cè)的標(biāo)簽圖與基本真實(shí)標(biāo)簽圖進(jìn)行比較，以計(jì)算標(biāo)簽圖的逐像素誤差，隨后在步驟262處，將逐像素誤差中的每個(gè)乘以感興趣像素的掩模，以生成誤差的掩蔽圖。最后，在步驟263處，輸出掩蔽的誤差圖。

圖14是示出根據(jù)本申請(qǐng)的一個(gè)實(shí)施例的用于反向傳播的步驟的示意流程圖，該反向傳播可由上述反向傳播器30實(shí)施。

如圖14所示，前向傳播從步驟241開始，在該步驟處，將當(dāng)前誤差圖設(shè)置為輸入誤差圖并且將k設(shè)置為k。隨后，過程前進(jìn)到步驟242中確定當(dāng)前層(即，層k)的類型。如果當(dāng)前層既不是卷積層也不是池化層，例如，該層是非線性層，那么方法前進(jìn)到步驟243，以原始方式執(zhí)行操作。

在步驟242處，如果層k是具有轉(zhuǎn)換后的卷積核wk和偏置向量bk的卷積層，那么過程前進(jìn)到步驟244，從將被分類的圖像xk的輸入特征中的每個(gè)鄰域中提取由轉(zhuǎn)換后的卷積核中的非零元素指定的特征值，以創(chuàng)建矩陣。隨后，在步驟245處，將誤差圖δk+1旋轉(zhuǎn)一定角度，例如，180度，并且進(jìn)行向量化，以創(chuàng)建向量。之后，在步驟246處，利用創(chuàng)建的矩陣和向量將卷積作為矩陣乘法來執(zhí)行，以計(jì)算核wk的梯度。隨后，過程前進(jìn)到步驟247，將結(jié)果作為核的梯度存儲(chǔ)。針對(duì)誤差圖δk+1中的第i個(gè)通道，將每個(gè)誤差通道中的所有誤差值合計(jì)起來，作為偏置bk(i)的梯度。

在步驟244的同時(shí)，在步驟248處，可將核旋轉(zhuǎn)一定角度，諸如，180度，以創(chuàng)建向量。隨后，針對(duì)誤差圖δk+1中的每個(gè)鄰域，在步驟250處，從誤差圖中提取由核中的非零元素指定的誤差值，以創(chuàng)建矩陣。隨后，過程前進(jìn)到步驟251處，利用創(chuàng)建的矩陣和向量將卷積作為矩陣乘法來執(zhí)行，以計(jì)算該層的誤差圖。最后，將結(jié)果存儲(chǔ)在前一層(即，層k-1)的誤差圖δk中。

在步驟242處，如果層k是具有更改的池化核pk的最大池化層，那么過程前進(jìn)到步驟249，針對(duì)誤差圖δk+1的每個(gè)誤差值，將誤差值轉(zhuǎn)移到誤差圖δk上的對(duì)應(yīng)元素，所述誤差圖的索引在前向傳播期間記錄。隨后，對(duì)δk的每個(gè)元素的轉(zhuǎn)移誤差值進(jìn)行累積。如果層k是具有更改后的池化核pk的平均池化層，那么在步驟249處，按照池化核pk中的掩蔽元素的數(shù)量將δk+1上的每個(gè)誤差值平均。隨后，將平均的值轉(zhuǎn)移回到誤差圖δk上的鄰域，所述誤差圖的索引在前向傳播期間記錄。最后，對(duì)δk的每個(gè)元素的轉(zhuǎn)移誤差值進(jìn)行累積。

在上述步驟之后，過程前進(jìn)到步驟253，確定當(dāng)前層是不是第一層。如果是的話，過程前進(jìn)到步驟254，該過程結(jié)束。如果不是的話，則使k減1(即，k＝k-1)，并且過程返回到步驟242以繼續(xù)。

在過程結(jié)束時(shí)，輸出所有卷積核及其偏置向量的梯度。

圖15是用于基于cnn的逐像素分類的逐個(gè)分塊掃描與本申請(qǐng)中公開的先進(jìn)方法的比較。與傳統(tǒng)分類方案相比，本發(fā)明的解決方案具有消除基于cnn的逐像素分類中的前向和反向傳播的冗余計(jì)算的優(yōu)點(diǎn)，并且取得顯著進(jìn)展。

所附權(quán)利要求書中的所有構(gòu)件或步驟加功能元件的對(duì)應(yīng)結(jié)構(gòu)、材料、動(dòng)作和等效物意圖包括用于與特別要求保護(hù)的其他要求元件結(jié)合執(zhí)行功能的任何結(jié)構(gòu)、材料或動(dòng)作。出于說明和描述的目的呈現(xiàn)了本發(fā)明的描述，但并不意圖詳細(xì)列舉或者將本發(fā)明限于所公開的形式。在不脫離本發(fā)明的范圍和精神的情況下，本領(lǐng)域的技術(shù)人員將清楚許多更改和變化。實(shí)施例經(jīng)過選擇和描述以便最好地闡釋本發(fā)明的原理和實(shí)際應(yīng)用，并且使本領(lǐng)域的技術(shù)人員能夠以適于預(yù)期的特定用途的各種實(shí)施例和各種更改來理解本發(fā)明。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王曉剛;李鴻升;趙瑞
技術(shù)所有人：北京市商湯科技開發(fā)有限公司
我是此專利的發(fā)明人

上一篇：卡處理裝置的制造方法
上一篇：對(duì)大樣本組的高效標(biāo)注的制造方法與工藝

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像分類系統(tǒng)相關(guān)技術(shù)

ct系統(tǒng)圖像重建方法相關(guān)技術(shù)

ct系統(tǒng)圖像重建的方法相關(guān)技術(shù)

遙感圖像分類方法相關(guān)技術(shù)

圖像分類結(jié)果分析方法相關(guān)技術(shù)

ct矩陣用于重建圖像相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

用于圖像分類的方法和系統(tǒng)與流程