国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種圖像特征提取方法及裝置的制造方法

      文檔序號(hào):8544051閱讀:248來源:國知局
      一種圖像特征提取方法及裝置的制造方法
      【技術(shù)領(lǐng)域】
      [0001] 本發(fā)明設(shè)及通信技術(shù),尤其設(shè)及一種圖像特征提取方法及裝置。
      【背景技術(shù)】
      [0002] 特征提取是許多計(jì)算機(jī)視覺分析任務(wù)(如場景識(shí)別、物體識(shí)別、目標(biāo)檢測)的關(guān)鍵 步驟。因此,如何提取判別性強(qiáng)、魯椿性高的特征一直是一個(gè)研究熱點(diǎn)。傳統(tǒng)意義上,研究 人員的精力主要放在如何手工設(shè)計(jì)具有尺度、視點(diǎn)、光照W及類內(nèi)差異等等不變性的圖像 特征。但是手工設(shè)計(jì)圖像特征,需要研究人員具有非常專業(yè)的領(lǐng)域知識(shí),挑戰(zhàn)性很強(qiáng)。因 此,像尺度不變性特征轉(zhuǎn)換(SIFT,Scale-invariantFea1:ureTransformation)、方向梯度 直方圖(HOG,HistogramofOrientedGradients)、局部二進(jìn)制模式(LBP,LocalBinary 化ttern)等魯椿性較好的圖像特征非常稀少,通常每5到10年才能設(shè)計(jì)出一項(xiàng)較好的手工 特征。此外,手工設(shè)計(jì)的特征通常在某些視覺任務(wù)中表現(xiàn)出色,但在另外一些任務(wù)中卻表現(xiàn) 一般,例如LBP在人臉識(shí)別領(lǐng)域贏得了廣泛的聲譽(yù),而HOG主要是因?yàn)樾腥藱z測而出名。
      [0003] 近年來的研究熱點(diǎn)一直關(guān)注于如何從數(shù)據(jù)中直接學(xué)習(xí)得到特征表示。廣受關(guān)注的 是卷積神經(jīng)網(wǎng)絡(luò)模型(CNN,ConvolutionalNeuralNetwork),大規(guī)模視覺識(shí)別挑戰(zhàn)賽中圖 像分類比賽的冠軍都是基于的模型。
      [0004] 圖1所示為一個(gè)卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)示意圖,通過對(duì)局部感受野進(jìn)行一系列 的卷積,池化等操作,得到圖像的特征表示。在圖像特征進(jìn)行池化之后,需要將池化后的圖 像特征與標(biāo)注的圖像樣本進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果進(jìn)行誤差反傳,逐漸調(diào)整優(yōu)化模型參數(shù), 最終理想的圖像特征。CNN在訓(xùn)練過程中需要大量有標(biāo)注的數(shù)據(jù)樣本,例如,ImageNet大規(guī) 模視覺識(shí)別挑戰(zhàn)賽中的訓(xùn)練圖片有超過一百萬張,整個(gè)ImageNet數(shù)據(jù)集有超過一千萬張 的標(biāo)注圖片數(shù)據(jù)。盡管如此,對(duì)于訓(xùn)練一個(gè)超大的模型來說,標(biāo)注數(shù)據(jù)量仍顯得不足。 更加不用說標(biāo)注一個(gè)超大規(guī)模的數(shù)據(jù)集所需要耗費(fèi)的人力、財(cái)力。因此,研究如何從海量的 無標(biāo)注信息的數(shù)據(jù)當(dāng)中無監(jiān)督式的學(xué)習(xí)(unsupervisedlearning)得到判別性較強(qiáng)的特 征,顯得更加有意義一些,也歷來就是學(xué)術(shù)界研究的熱點(diǎn)。
      [0005] 在實(shí)際應(yīng)用中,訓(xùn)練一個(gè)大規(guī)模的模型同時(shí)其訓(xùn)練結(jié)果具有良好的性能并不 是一件容易的事情,因?yàn)榈挠?xùn)練嚴(yán)重依賴已標(biāo)注的大數(shù)據(jù)訓(xùn)練樣本,雖然ImageNet已 經(jīng)有眾多的標(biāo)注樣本,但是對(duì)于實(shí)際生活中的數(shù)據(jù)來說還遠(yuǎn)遠(yuǎn)不夠?;ヂ?lián)網(wǎng)上每天都會(huì)有 海量的圖片、視頻數(shù)據(jù)上傳,難W對(duì)海量新增的圖片樣本進(jìn)行標(biāo)注。

      【發(fā)明內(nèi)容】

      [0006] 本發(fā)明實(shí)施例提供了一種圖像特征提取方法及裝置,用于在無監(jiān)督圖像訓(xùn)練過程 中進(jìn)行高效的圖像特征提取。
      [0007] 本發(fā)明實(shí)施例第一方面提供的圖像特征提取方法,包括:
      [0008] 對(duì)輸入圖像的待提取像素所在的圖像區(qū)域內(nèi)的區(qū)域像素進(jìn)行稀疏編碼,從而得到 所述區(qū)域像素的M維的編碼系數(shù),M為大于0的整數(shù);
      [0009] 根據(jù)所述區(qū)域像素的編碼系數(shù),獲得所述圖像區(qū)域?qū)?yīng)的M個(gè)稀疏編碼圖,其中, 所述M個(gè)稀疏編碼圖中的第k個(gè)稀疏編碼圖中任意坐標(biāo)點(diǎn)的值為所述任意坐標(biāo)點(diǎn)對(duì)應(yīng)在所 述圖像區(qū)域內(nèi)的像素的編碼系數(shù)在第k個(gè)維度下的值,k為小于等于M的正整數(shù);
      [0010] 分別對(duì)所述M個(gè)稀疏編碼圖進(jìn)行池化處理,從而得到所述待提取像素的M維的池 化特征,所述M個(gè)稀疏編碼圖與所述池化特征的M個(gè)維度一一對(duì)應(yīng);
      [0011] 對(duì)所述池化特征進(jìn)行維度約減,從而得到所述待提取像素的用于表示所述池化特 征的約減特征,所述約減特征的維度小于所述池化特征的維度。
      [0012] 結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,所述對(duì)輸入圖像的待提取像素所在 的圖像區(qū)域內(nèi)的區(qū)域像素進(jìn)行稀疏編碼,從而得到所述區(qū)域像素的M維的編碼系數(shù)包括:
      [0013] 對(duì)所述區(qū)域像素對(duì)應(yīng)的像素樣本進(jìn)行稀疏編碼,從而得到所述區(qū)域像素的M維的 編碼系數(shù);
      [0014] 其中,根據(jù)W下公式求取所述區(qū)域像素的編碼系數(shù);
      [0015]
      【主權(quán)項(xiàng)】
      1. 一種圖像特征提取方法,其特征在于,包括: 對(duì)輸入圖像的待提取像素所在的圖像區(qū)域內(nèi)的區(qū)域像素進(jìn)行稀疏編碼,從而得到所述 區(qū)域像素的M維的編碼系數(shù),M為大于O的整數(shù); 根據(jù)所述區(qū)域像素的編碼系數(shù),獲得所述圖像區(qū)域?qū)?yīng)的M個(gè)稀疏編碼圖,其中,所述 M個(gè)稀疏編碼圖中的第k個(gè)稀疏編碼圖中任意坐標(biāo)點(diǎn)的值為所述任意坐標(biāo)點(diǎn)對(duì)應(yīng)在所述圖 像區(qū)域內(nèi)的像素的編碼系數(shù)在第k個(gè)維度下的值,k為小于等于M的正整數(shù); 分別對(duì)所述M個(gè)稀疏編碼圖進(jìn)行池化處理,從而得到所述待提取像素的M維的池化特 征,所述M個(gè)稀疏編碼圖與所述池化特征的M個(gè)維度一一對(duì)應(yīng); 對(duì)所述池化特征進(jìn)行維度約減,從而得到所述待提取像素的用于表示所述池化特征的 約減特征,所述約減特征的維度小于所述池化特征的維度。
      2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)輸入圖像的待提取像素所在的圖 像區(qū)域內(nèi)的區(qū)域像素進(jìn)行稀疏編碼,從而得到所述區(qū)域像素的M維的編碼系數(shù)包括: 對(duì)所述區(qū)域像素對(duì)應(yīng)的像素樣本進(jìn)行稀疏編碼,從而得到所述區(qū)域像素的M維的編碼 系數(shù); I中·枏抿W下公式龍取所沭嘆城像素的編碼紊數(shù);
      所述是由所述區(qū)域像素對(duì)應(yīng)的像素樣本中的坐標(biāo)點(diǎn)的值所列化的列向量,(i,j)為 所述區(qū)域像素的坐標(biāo),所述K為稀疏函數(shù)
      的稀疏度,所述為所述 區(qū)域像素的編碼系數(shù),所述Z為所述的字典。
      3. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述分別對(duì)所述M個(gè)稀疏編碼圖進(jìn)行 池化處理,從而得到所述M維的池化特征,包括: 根據(jù)以下公式求取所述M維的池化特征;
      所述表示所述池化特征,N(i,j)表示所述稀疏編碼圖相對(duì)于所述輸入圖像所在的 坐標(biāo)區(qū)域,所述P,q e N(i,j)表示坐標(biāo)(p,q)在所述坐標(biāo)區(qū)域之內(nèi),所述為對(duì)應(yīng)的空間 坐標(biāo)為(P,q)的編碼系數(shù)在第1維度下的值,所述<為對(duì)應(yīng)的空間坐標(biāo)為(p,q)的編碼系 數(shù)在第M維度下的值。
      4. 根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于,對(duì)所述池化特征進(jìn)行維度約 減,從而得到用于表示所述池化特征的約減特征,包括: 根據(jù)以下公式得到用于維度約減的編碼器對(duì)應(yīng)的函數(shù)f,利用函數(shù)f對(duì)所述池化特征 進(jìn)行維度約減,從而得到用于表示所述池化特征的約減特征;
      其中,g表示用于將所述約減特征恢復(fù)為所述池化特征的解碼器的函數(shù),η表示所述池 化特征。
      5. 根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于,在所述對(duì)所述池化特征進(jìn)行維 度約減之前,還包括: 對(duì)所述M維的池化特征進(jìn)行歸一化處理。
      6.
      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1