国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      分割圖像的方法、應(yīng)用及計算設(shè)備與流程

      文檔序號:12471831閱讀:313來源:國知局
      分割圖像的方法、應(yīng)用及計算設(shè)備與流程

      本發(fā)明涉及視頻技術(shù)領(lǐng)域,尤其涉及分割圖像的方法、應(yīng)用及計算設(shè)備。



      背景技術(shù):

      圖像分割是圖像處理和編輯中的一項基本操作,精確地從圖像中分割出所需要的區(qū)域是基于內(nèi)容的圖像處理算法的關(guān)鍵。例如,從圖像中分割出頭發(fā)區(qū)域是圖像分割技術(shù)的一項實際應(yīng)用。在一些諸如頭發(fā)換色,頭發(fā)美化等實際任務(wù)中,頭發(fā)分割是必要的處理步驟,也是整個任務(wù)的重點和難點。

      現(xiàn)有的解決方案多是借鑒通用圖像分割的處理方法。常用的圖像分割方法包括基于閾值分割,基于邊緣分割,基于區(qū)域增長分割,基于聚類分割和圖割分割方式等。傳統(tǒng)的圖像分割方法對于簡單應(yīng)用場景(例如頭發(fā)與背景對面鮮明,頭發(fā)顏色紋理變化不明顯)可以得到較好的分割效果。但對一些復(fù)雜的應(yīng)用場景(比如頭發(fā)與背景界限模糊,頭發(fā)顏色變化較大,頭發(fā)紋理細(xì)節(jié)缺失等),很容易出現(xiàn)頭發(fā)錯分的現(xiàn)象。

      因此,本發(fā)明提出了一種新的分割圖像的技術(shù)方案。



      技術(shù)實現(xiàn)要素:

      為此,本發(fā)明提供一種新的分割圖像的技術(shù)方案,有效的解決了上面至少一個問題。

      根據(jù)本發(fā)明的一個方面,提供一種分割圖像的方法,適于在計算設(shè)備中執(zhí)行。該計算設(shè)備存儲有多個訓(xùn)練樣本。每個訓(xùn)練樣本包括一幅圖像和該圖像中目標(biāo)區(qū)域的標(biāo)注掩碼圖。例如,每個訓(xùn)練樣本中圖像為人臉圖像,該樣本中圖像的目標(biāo)區(qū)域為頭發(fā)區(qū)域。該方法包括下述步驟。將每個訓(xùn)練樣本中圖像、在待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型中正向傳遞,以獲取該訓(xùn)練樣本中目標(biāo)區(qū)域的分割掩碼圖?;谒@取的每個訓(xùn)練樣本中目標(biāo)區(qū)域的分割掩碼圖和對應(yīng)的標(biāo)注掩碼圖的偏差,利用下降梯度算法對待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行參數(shù)優(yōu)化。將待分割的圖像在已優(yōu)化參數(shù)的卷積神經(jīng)網(wǎng)絡(luò)模型中正向傳遞,以獲取該待分割的圖像中目標(biāo)區(qū)域的分割掩碼圖。

      可選地,在根據(jù)本發(fā)明的分割圖像的應(yīng)用中,待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型包括卷積層、激活層、池化層、歸一化層和輸出層。將每個訓(xùn)練樣本中圖像、在待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型中正向傳遞,以獲取該訓(xùn)練樣本中目標(biāo)區(qū)域的分割掩碼圖的步驟包括下述操作。將該訓(xùn)練樣本中圖像輸入到卷積層,并在卷積層中對圖像進(jìn)行特征提取以輸出包含多個特征圖的第一特征圖集合。通過激活層中激活函數(shù),對第一特征圖集合執(zhí)行特征映射,以獲取第二特征圖集合。在池化層中對第二特征圖集合進(jìn)行下采樣操作,以獲取第三特征圖集合。在歸一化層對第三特征圖集合執(zhí)行局部歸一化操作,以獲取第四特征圖集合。在輸出層中對所述第一、第二、第三和第四特征圖集合中至少兩個進(jìn)行特征融合,以獲取該訓(xùn)練樣本中目標(biāo)區(qū)域的分割掩碼圖。其中,特征融合的操作具體可以實施為下述方式:對第四特征圖集合進(jìn)行插值運(yùn)算,以獲取第五特征圖集合;將第五特征圖集合與第二特征圖集合進(jìn)行平均操作,并獲取該分割掩碼圖。

      可選地,在根據(jù)本發(fā)明的分割圖像的應(yīng)用中,激活函數(shù)包括Sigmoid函數(shù)和修正線性單元函數(shù)中任一種。待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型還包括損失函數(shù)層。基于所獲取的每個訓(xùn)練樣本中目標(biāo)區(qū)域的分割圖像和對應(yīng)的掩碼圖的偏差,利用下降梯度算法對待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行參數(shù)優(yōu)化的步驟包括下述操作。在損失函數(shù)層,根據(jù)下述代價函數(shù),計算所述待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型中其他每一層的參數(shù)調(diào)整量:

      其中,m表示多個訓(xùn)練樣本的數(shù)量,x(i)表示第i個訓(xùn)練樣本中圖像,y(i)表示第i個訓(xùn)練樣本中掩碼圖,n表示卷積神經(jīng)網(wǎng)絡(luò)的層數(shù),sl表示卷積神經(jīng)網(wǎng)絡(luò)中第l層的神經(jīng)元數(shù)目,表示連接第l層第i神經(jīng)元和第l+1層第j神經(jīng)元的權(quán)重參數(shù),b表示網(wǎng)絡(luò)模型偏置項,λ表示權(quán)重衰減系數(shù),hW,b(x(i))表示第i個樣本對應(yīng)的目標(biāo)區(qū)域的分割圖,y(i)表示第i個樣本的目標(biāo)區(qū)域的掩碼圖,J(W,b;x(i),y(i))表示第i個訓(xùn)練樣本的代價函數(shù)。

      根據(jù)本發(fā)明的又一個方面,提供一種分割圖像的應(yīng)用,適于駐留在計算設(shè)備中。該應(yīng)用包括存儲單元、模型訓(xùn)練單元和圖像分割單元。存儲單元存儲有多個訓(xùn)練樣本,每個訓(xùn)練樣本包括一幅圖像和該圖像中目標(biāo)區(qū)域的標(biāo)注掩碼圖。模型訓(xùn)練單元適于將每個訓(xùn)練樣本中圖像、在待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型中正向傳遞,以獲取該訓(xùn)練樣本中目標(biāo)區(qū)域的分割掩碼圖。基于所獲取的每個訓(xùn)練樣本中目標(biāo)區(qū)域的分割掩碼圖和對應(yīng)的標(biāo)注掩碼圖的偏差,模型訓(xùn)練單元利用下降梯度算法對待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行參數(shù)優(yōu)化。圖像分割單元適于將待分割的圖像在已優(yōu)化參數(shù)的卷積神經(jīng)網(wǎng)絡(luò)模型中正向傳遞,以獲取該待分割的圖像中目標(biāo)區(qū)域的分割掩碼圖。

      根據(jù)本發(fā)明的又一個方面,提供一種計算設(shè)備,包括根據(jù)本發(fā)明的分割圖像的應(yīng)用。

      綜上,不同于傳統(tǒng)的圖像分割方式,本發(fā)明的分割圖像的技術(shù)方案,可以利用實際應(yīng)用場景中采集的訓(xùn)練樣本對卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。這樣,經(jīng)過迭代訓(xùn)練,本發(fā)明的分割圖像的技術(shù)方案可以獲取到優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型。在此基礎(chǔ)上,本發(fā)明的分割圖像技術(shù)方案可以有較高的魯棒性和分割精度。特別是,本發(fā)明的分割圖像的技術(shù)方案在分割頭發(fā)區(qū)域時,能夠?qū)θ四槇D像中頭發(fā)區(qū)域進(jìn)行高精度分割,極大提高用戶體驗度。

      附圖說明

      為了實現(xiàn)上述以及相關(guān)目的,本文結(jié)合下面的描述和附圖來描述某些說明性方面,這些方面指示了可以實踐本文所公開的原理的各種方式,并且所有方面及其等效方面旨在落入所要求保護(hù)的主題的范圍內(nèi)。通過結(jié)合附圖閱讀下面的詳細(xì)描述,本公開的上述以及其它目的、特征和優(yōu)勢將變得更加明顯。遍及本公開,相同的附圖標(biāo)記通常指代相同的部件或元素。

      圖1示出了根據(jù)本發(fā)明一些實施例的計算設(shè)備100的示意圖;

      圖2示出了根據(jù)本發(fā)明一些實施例的分割圖像的方法200的流程圖;

      圖3A、3B和3C分別示出了根據(jù)本發(fā)明實施例中一個訓(xùn)練樣本的圖像和標(biāo)注掩碼圖;

      圖4示出了根據(jù)本發(fā)明一個實施例中待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型400的示意圖;以及

      圖5示出了根據(jù)本發(fā)明一些實施例的分割圖像的應(yīng)用500的示意圖。

      具體實施方式

      下面將參照附圖更詳細(xì)地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當(dāng)理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。

      圖1示出了根據(jù)本發(fā)明一些實施例的計算設(shè)備100的框圖。在基本的配置102中,計算設(shè)備100典型地包括系統(tǒng)存儲器106和一個或者多個處理器104。存儲器總線108可以用于在處理器104和系統(tǒng)存儲器106之間的通信。

      取決于期望的配置,處理器104可以是任何類型的處理,包括但不限于:微處理器((μP)、微控制器(μC)、數(shù)字信息處理器(DSP)、圖形處理器(GPU)或者它們的任何組合。處理器104可以包括諸如一級高速緩存110和二級高速緩存112之類的一個或者多個級別的高速緩存、處理器核心114和寄存器116。示例的處理器核心114可以包括運(yùn)算邏輯單元(ALU)、浮點數(shù)單元(FPU)、數(shù)字信號處理核心(DSP核心)、圖形處理器(GPU)或者它們的任何組合。示例的存儲器控制器118可以與處理器104一起使用,或者在一些實現(xiàn)中,存儲器控制器118可以是處理器104的一個內(nèi)部部分。

      取決于期望的配置,系統(tǒng)存儲器106可以是任意類型的存儲器,包括但不限于:易失性存儲器(諸如RAM)、非易失性存儲器(諸如ROM、閃存等)或者它們的任何組合。系統(tǒng)存儲器106可以包括操作系統(tǒng)120、一個或者多個應(yīng)用122以及程序數(shù)據(jù)124。

      計算設(shè)備100還可以包括有助于從各種接口設(shè)備(例如,輸出設(shè)備142、外設(shè)接口144和通信設(shè)備146)到基本配置102經(jīng)由總線/接口控制器130的通信的接口總線140。示例的輸出設(shè)備142包括圖形處理單元148和音頻處理單元150。它們可以被配置為有助于經(jīng)由一個或者多個A/V端口152與諸如顯示器或者揚(yáng)聲器之類的各種外部設(shè)備進(jìn)行通信。示例外設(shè)接口144可以包括串行接口控制器154和并行接口控制器156,它們可以被配置為有助于經(jīng)由一個或者多個I/O端口158和諸如輸入設(shè)備(例如,鍵盤、鼠標(biāo)、筆、語音輸入設(shè)備、觸摸輸入設(shè)備)或者其他外設(shè)(例如打印機(jī)、掃描儀等)之類的外部設(shè)備進(jìn)行通信。示例的通信設(shè)備146可以包括網(wǎng)絡(luò)控制器160,其可以被布置為便于經(jīng)由一個或者多個通信端口164與一個或者多個其他計算設(shè)備162通過網(wǎng)絡(luò)通信鏈路的通信。

      網(wǎng)絡(luò)通信鏈路可以是通信介質(zhì)的一個示例。通信介質(zhì)通??梢泽w現(xiàn)為在諸如載波或者其他傳輸機(jī)制之類的調(diào)制數(shù)據(jù)信號中的計算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊,并且可以包括任何信息遞送介質(zhì)?!罢{(diào)制數(shù)據(jù)信號”可以這樣的信號,它的數(shù)據(jù)集中的一個或者多個或者它的改變可以在信號中編碼信息的方式進(jìn)行。作為非限制性的示例,通信介質(zhì)可以包括諸如有線網(wǎng)絡(luò)或者專線網(wǎng)絡(luò)之類的有線介質(zhì),以及諸如聲音、射頻(RF)、微波、紅外(IR)或者其它無線介質(zhì)在內(nèi)的各種無線介質(zhì)。這里使用的術(shù)語計算機(jī)可讀介質(zhì)可以包括存儲介質(zhì)和通信介質(zhì)二者。

      計算設(shè)備100可以實現(xiàn)為小尺寸便攜(或者移動)電子設(shè)備的一部分,這些電子設(shè)備可以包括桌面計算機(jī)和筆記本計算機(jī)配置的個人計算機(jī)。計算設(shè)備還可以被實現(xiàn)為服務(wù)器。

      在一個典型的應(yīng)用場景中,計算設(shè)備100需要分割圖像。相應(yīng)地,計算設(shè)備100可以執(zhí)行分割圖像的方法(例如,下文中方法200)。應(yīng)用122可以包括分割圖像的應(yīng)用(例如下文中應(yīng)用500)。

      圖2示出了根據(jù)本發(fā)明一些實施例的分割圖像的方法200的流程圖。方法200適于在各種計算設(shè)備(100)中執(zhí)行。不限于此,方法200也可以被配置為在分布式集群中執(zhí)行。即,方法200可以在多個計算設(shè)備節(jié)點中并行執(zhí)行。這里,方法200需要先訓(xùn)練分割圖像的模型,然后利用已訓(xùn)練的模型來處理待分割的圖像。在對模型進(jìn)行訓(xùn)練時,執(zhí)行方法200的計算設(shè)備中存儲有多個訓(xùn)練樣本。每個訓(xùn)練樣本包括一幅圖像和該圖像中目標(biāo)區(qū)域的標(biāo)注掩碼圖。在根據(jù)本發(fā)明一個實施例中,每個訓(xùn)練樣本中圖像為人臉部圖像,目標(biāo)區(qū)域例如為頭發(fā)區(qū)域,但不限于此。需要說明的是,本發(fā)明的訓(xùn)練樣本集是通過對實際應(yīng)用場景進(jìn)行采樣所獲得的。換言之,本發(fā)明的訓(xùn)練樣本采樣自多種類型(不同的光照、尺寸和清晰度)的圖像。如圖3A、3B和3C分別示出了根據(jù)本發(fā)明實施例中一個訓(xùn)練樣本的圖像和標(biāo)注掩碼圖。下面對方法200進(jìn)行詳細(xì)說明。

      如圖2所示,方法200始于步驟S210。在步驟S210中,將每個訓(xùn)練樣本中圖像、在待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型中正向傳遞,以獲取該訓(xùn)練樣本中目標(biāo)區(qū)域的分割掩碼圖。需要說明的是,取決于期望的配置,本發(fā)明中卷積神經(jīng)網(wǎng)絡(luò)模型可以有多種選擇。例如,卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)可以被配置為CAFFE(相關(guān)網(wǎng)站:http://caffe.berkeleyvision.org/)架構(gòu),但不限于此。關(guān)于卷積神經(jīng)網(wǎng)絡(luò)更具體結(jié)構(gòu)說明可以參見“http://ufldl.stanford.edu/wiki”等公知內(nèi)容,這里不再贅述。

      圖4示出了根據(jù)本發(fā)明一個實施例中待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型400示意圖。下面模型400為例,對步驟S210的更具體實施方式進(jìn)行示例性說明,但本發(fā)明中模型結(jié)構(gòu)并不限于此。

      如圖4所示,本實施例的卷積神經(jīng)網(wǎng)絡(luò)模型400包括卷積層410、激活層420、池化層430、歸一化層440、輸出層450和損失函數(shù)層460。一般而言,為了優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的參數(shù),方法200可以多次迭代執(zhí)行步驟S210,并且針對不同訓(xùn)練樣本的執(zhí)行過程可以是并行執(zhí)行的,本發(fā)明對此不做過多限制。在每次執(zhí)行步驟S210時,首先將一個訓(xùn)練樣本中圖像輸入到卷積層410。在卷積層410中,步驟S210可以對圖像進(jìn)行特征提取,以輸出包含多個特征圖的第一特征圖集合。這里,圖像例如可以是RGB像素格式,但不限于此。隨后,步驟S210在激活層420中利用激活函數(shù)執(zhí)行特征映射操作(換言之,對第一特征圖集合中每個特征圖進(jìn)行二次特征提取),以獲取第二特征圖集合。這里,激活函數(shù)例如是Sigmoid函數(shù)或修正線性單元(Relu)函數(shù),但不限于此。在池化層430中,步驟S210對第二特征圖執(zhí)行下采樣操作,以獲取第三特征圖集合。這里,步驟S210可以采用多種公知的下采樣方式來減小特征圖的尺寸,這里不再贅述。在歸一化層440中,步驟S210可以對第三特征圖集合中每個特征圖進(jìn)行歸一化操作,以獲取第四特征圖。這里,歸一化操作例如可以起到“側(cè)抑制”的效果。在輸出層450中,步驟S210可以根據(jù)之前的不同深度(即不同層)中特征圖集合,獲取關(guān)于訓(xùn)練樣本中圖像目標(biāo)區(qū)域的分割掩碼圖。根據(jù)本發(fā)明一個實施例,步驟S210可以基于第二特征圖集合和第四特征圖集合來執(zhí)行平均操作,以獲取分割掩碼圖。具體地,步驟S210對第四特征圖集合中特征圖執(zhí)行插值運(yùn)算,以便獲取與第二特征圖集合尺寸一致的第五特征圖集合。隨后,步驟S210將第五特征圖集合和第二特征圖集合中對應(yīng)特征圖進(jìn)行數(shù)據(jù)平均操作,并獲取分割掩碼圖。

      在訓(xùn)練樣本中標(biāo)注掩碼圖和步驟S210所獲取的分割掩碼圖的基礎(chǔ)上,方法200執(zhí)行步驟S220。在步驟S220中,利用下降梯度算法對待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型400進(jìn)行參數(shù)優(yōu)化。在根據(jù)本發(fā)明一個實施例中,步驟S220可以在損失函數(shù)層460,根據(jù)下述代價函數(shù)計算卷積神經(jīng)網(wǎng)絡(luò)模型400其它層(即410至450)中每一層的參數(shù)調(diào)整量(換言之,步驟S220在卷積神經(jīng)網(wǎng)絡(luò)400中執(zhí)行反向傳遞)。

      其中,m表示多個訓(xùn)練樣本的數(shù)量,x(i)表示第i個訓(xùn)練樣本中圖像,y(i)表示第i個訓(xùn)練樣本中掩碼圖,n表示卷積神經(jīng)網(wǎng)絡(luò)的層數(shù),sl表示卷積神經(jīng)網(wǎng)絡(luò)中第l層的神經(jīng)元數(shù)目,表示連接第l層第i神經(jīng)元和第l+1層第j神經(jīng)元的權(quán)重參數(shù),b表示網(wǎng)絡(luò)模型偏置項,λ表示權(quán)重衰減系數(shù),hW,b(x(i))表示第i個樣本對應(yīng)的目標(biāo)區(qū)域的分割圖,y(i)表示第i個樣本的目標(biāo)區(qū)域的掩碼圖,J(W,b;x(i),y(i))表示第i個訓(xùn)練樣本的代價函數(shù)。另外,步驟S220也可以基于其他公知的代價函數(shù)來對卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)優(yōu)化,這里不再贅述。

      基于多次執(zhí)行步驟S210和S220而獲得的已優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型,方法200可以執(zhí)行步驟S230,將待分割的圖像在已優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型中正向傳遞,以獲取該待分割的圖像中目標(biāo)區(qū)域的分割掩碼圖。這里,將待分割的圖像在已優(yōu)化的模型中的正向傳遞方式與步驟S210的執(zhí)行方式類似,這里不再贅述。例如,頭發(fā)區(qū)域的分割掩碼圖是關(guān)于頭發(fā)區(qū)域的概率圖。高頭發(fā)概率的區(qū)域被顯示為白色,低頭發(fā)概率的區(qū)域顯示被為黑色。處于中間概率值的區(qū)域被顯示為灰色。

      綜上,不同于傳統(tǒng)的圖像分割方式,本發(fā)明的分割圖像的技術(shù)方案,可以利用實際應(yīng)用場景中采集的訓(xùn)練樣本對卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練。這樣,經(jīng)過迭代訓(xùn)練,本發(fā)明的分割圖像的技術(shù)方案可以獲取到優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型。在此基礎(chǔ)上,本發(fā)明的分割圖像技術(shù)方案可以有較高的魯棒性和分割精度。特別是,本發(fā)明的分割圖像的技術(shù)方案在分割頭發(fā)區(qū)域時,能夠?qū)θ四槇D像中頭發(fā)區(qū)域進(jìn)行高精度分割,極大提高用戶體驗度。

      圖5示出了根據(jù)本發(fā)明一些實施例的分割圖像的應(yīng)用500的示意圖。應(yīng)用500適于駐留在計算設(shè)備(100)中。另外,應(yīng)用500也可以被配置為在集群中執(zhí)行的分布式應(yīng)用,本發(fā)明對此不做過多限制。

      如圖5所示,應(yīng)用500包括存儲單元510、模型訓(xùn)練單元520和圖像分割單元530。存儲單元510存儲有多個訓(xùn)練樣本。每個訓(xùn)練樣本包括一幅圖像和該圖像中目標(biāo)區(qū)域的標(biāo)注掩碼圖。例如,每個訓(xùn)練樣本中圖像為人臉圖像,該樣本中圖像的目標(biāo)區(qū)域為頭發(fā)區(qū)域,但不限于此。

      模型訓(xùn)練單元520適于將每個訓(xùn)練樣本中圖像、在待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型中正向傳遞,以獲取該訓(xùn)練樣本中目標(biāo)區(qū)域的分割掩碼圖。在根據(jù)本發(fā)明一個實施例中,待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型包括卷積層、激活層、池化層、歸一化層和輸出層。模型訓(xùn)練單元520首先將該訓(xùn)練樣本中圖像輸入到卷積層,并在卷積層中對圖像進(jìn)行第一特征提取以輸出包含多個特征圖的第一特征圖集合。通過激活層中激活函數(shù),模型訓(xùn)練單元520對第一特征圖集合執(zhí)行第二次特征提取,以獲取第二特征圖集合。這里,激活函數(shù)例如是Sigmoid函數(shù)或修正線性單元(Relu)函數(shù),但不限于此。在池化層中,模型訓(xùn)練單元520對第二特征圖集合進(jìn)行下采樣操作,以獲取第三特征圖集合。在歸一化層中,模型訓(xùn)練單元520對第三特征圖集合執(zhí)行局部歸一化操作,以獲取第四特征圖集合。在輸出層中模型訓(xùn)練單元520對所述第一、第二、第三和第四特征圖集合中至少兩個進(jìn)行特征融合,以獲取該訓(xùn)練樣本中目標(biāo)區(qū)域的分割掩碼圖。例如,模型訓(xùn)練單元520可以根據(jù)第二和第四特征圖集合來獲取分割掩碼圖。具體地,模型訓(xùn)練單元520對第四特征圖集合進(jìn)行插值運(yùn)算,以獲取第五特征圖集合。在此基礎(chǔ)上,模型訓(xùn)練單元520將第五特征圖集合與第二特征圖集合進(jìn)行平均操作并獲取該分割掩碼圖。

      另外,基于所獲取的每個訓(xùn)練樣本中目標(biāo)區(qū)域的分割掩碼圖和對應(yīng)的標(biāo)注掩碼圖的偏差,模型訓(xùn)練單元520利用下降梯度算法對待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行參數(shù)優(yōu)化。在根據(jù)本發(fā)明一個實施例中,卷積神經(jīng)網(wǎng)絡(luò)還包括損失函數(shù)層。在損失函數(shù)層,模型訓(xùn)練單元520根據(jù)下述代價函數(shù),計算所述待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型中其他每一層的參數(shù)調(diào)整量:

      其中,m表示多個訓(xùn)練樣本的數(shù)量,x(i)表示第i個訓(xùn)練樣本中圖像,y(i)表示第i個訓(xùn)練樣本中掩碼圖,n表示卷積神經(jīng)網(wǎng)絡(luò)的層數(shù),sl表示卷積神經(jīng)網(wǎng)絡(luò)中第l層的神經(jīng)元數(shù)目,表示連接第l層第i神經(jīng)元和第l+1層第j神經(jīng)元的權(quán)重參數(shù),b表示網(wǎng)絡(luò)模型偏置項,λ表示權(quán)重衰減系數(shù),hW,b(x(i))表示第i個樣本對應(yīng)的目標(biāo)區(qū)域的分割圖,y(i)表示第i個樣本的目標(biāo)區(qū)域的掩碼圖,J(W,b;x(i),y(i))表示第i個訓(xùn)練樣本的代價函數(shù)。模型訓(xùn)練單元520更具體的實施方式與步驟S210和S220一致,這里不再贅述。

      圖像分割單元530適于將待分割的圖像在已優(yōu)化參數(shù)的卷積神經(jīng)網(wǎng)絡(luò)模型中正向傳遞,以獲取該待分割的圖像中目標(biāo)區(qū)域的分割掩碼圖。

      A10、如A8或A9所述的應(yīng)用,其中,所述激活函數(shù)包括Sigmoid函數(shù)和修正線性單元函數(shù)中任一項。A11、如A7-A10中任一項所述的應(yīng)用,其中,所述待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型還包括損失函數(shù)層;所述模型訓(xùn)練單元適于根據(jù)下述方式基于所獲取的每個訓(xùn)練樣本中目標(biāo)區(qū)域的分割圖像和對應(yīng)的掩碼圖的偏差,利用下降梯度算法對待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行參數(shù)優(yōu)化:在損失函數(shù)層,根據(jù)下述代價函數(shù),計算所述待優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)模型中其他每一層的參數(shù)調(diào)整量:

      其中,m表示所述多個訓(xùn)練樣本的數(shù)量,x(i)表示第i個訓(xùn)練樣本中圖像,y(i)表示第i個訓(xùn)練樣本中掩碼圖,n表示卷積神經(jīng)網(wǎng)絡(luò)的層數(shù),sl表示卷積神經(jīng)網(wǎng)絡(luò)中第l層的神經(jīng)元數(shù)目,表示連接第l層第i神經(jīng)元和第l+1層第j神經(jīng)元的權(quán)重參數(shù),b表示網(wǎng)絡(luò)模型偏置項,λ表示權(quán)重衰減系數(shù),hW,b(x(i))表示第i個樣本對應(yīng)的目標(biāo)區(qū)域的分割圖,y(i)表示第i個樣本的目標(biāo)區(qū)域的掩碼圖,J(W,b;x(i),y(i))表示第i個訓(xùn)練樣本的代價函數(shù)。A12、如A7-A11中任一項所述的應(yīng)用,其中,所述每個訓(xùn)練樣本中圖像為人臉圖像,該樣本中圖像的目標(biāo)區(qū)域為頭發(fā)區(qū)域。

      在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細(xì)節(jié)的情況下被實踐。在一些實例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。

      類似地,應(yīng)當(dāng)理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式的權(quán)利要求書由此明確地并入該具體實施方式,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。

      本領(lǐng)域那些技術(shù)人員應(yīng)當(dāng)理解在本文所公開的示例中的設(shè)備的模塊或單元或組件可以布置在如該實施例中所描述的設(shè)備中,或者可替換地可以定位在與該示例中的設(shè)備不同的一個或多個設(shè)備中。前述示例中的模塊可以組合為一個模塊或者此外可以分成多個子模塊。

      本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中??梢园褜嵤├械哪K或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。

      此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實施例的任意之一都可以以任意的組合方式來使用。

      此外,所述實施例中的一些在此被描述成可以由計算機(jī)系統(tǒng)的處理器或者由執(zhí)行所述功能的其它裝置實施的方法或方法元素的組合。因此,具有用于實施所述方法或方法元素的必要指令的處理器形成用于實施該方法或方法元素的裝置。此外,裝置實施例的在此所述的元素是如下裝置的例子:該裝置用于實施由為了實施該發(fā)明的目的的元素所執(zhí)行的功能。

      如在此所使用的那樣,除非另行規(guī)定,使用序數(shù)詞“第一”、“第二”、“第三”等等來描述普通對象僅僅表示涉及類似對象的不同實例,并且并不意圖暗示這樣被描述的對象必須具有時間上、空間上、排序方面或者以任意其它方式的給定順序。

      盡管根據(jù)有限數(shù)量的實施例描述了本發(fā)明,但是受益于上面的描述,本技術(shù)領(lǐng)域內(nèi)的技術(shù)人員明白,在由此描述的本發(fā)明的范圍內(nèi),可以設(shè)想其它實施例。此外,應(yīng)當(dāng)注意,本說明書中使用的語言主要是為了可讀性和教導(dǎo)的目的而選擇的,而不是為了解釋或者限定本發(fā)明的主題而選擇的。因此,在不偏離所附權(quán)利要求書的范圍和精神的情況下,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說許多修改和變更都是顯而易見的。對于本發(fā)明的范圍,對本發(fā)明所做的公開是說明性的,而非限制性的,本發(fā)明的范圍由所附權(quán)利要求書限定。

      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1