本公開涉及圖像處理,更具體地涉及一種基于局部線性嵌入的圖像數(shù)據(jù)的增廣方法及裝置。
背景技術(shù):
1、在機(jī)器學(xué)習(xí)中,年齡估計(jì)、溫度預(yù)測(cè)、深度估計(jì)等任務(wù)受到越來(lái)越多的關(guān)注。深度回歸的標(biāo)簽具有連續(xù)性,部分訓(xùn)練樣本的標(biāo)簽間存在模糊的信息,且大部分深度回歸任務(wù)的訓(xùn)練數(shù)據(jù)都具有不平衡的性質(zhì)。
2、相關(guān)技術(shù)中,針對(duì)深度回歸任務(wù)面臨的訓(xùn)練數(shù)據(jù)不平衡問(wèn)題,先將連續(xù)的標(biāo)簽離散化,并在離散標(biāo)簽的基礎(chǔ)上進(jìn)行對(duì)應(yīng)區(qū)間樣本的生成,導(dǎo)致標(biāo)簽的連續(xù)性被破壞,且生成的樣本也不具有連續(xù)性,難以輔助模型對(duì)標(biāo)簽間存在模糊信息的區(qū)間進(jìn)行學(xué)習(xí)。
技術(shù)實(shí)現(xiàn)思路
1、鑒于上述問(wèn)題,本公開提供了一種基于局部線性嵌入的圖像數(shù)據(jù)的增廣方法及裝置。
2、根據(jù)本公開的第一個(gè)方面,提供了一種基于局部線性嵌入的圖像數(shù)據(jù)的增廣方法,包括:對(duì)初始訓(xùn)練集的初始圖像樣本進(jìn)行增廣處理,得到中間訓(xùn)練集,其中,中間訓(xùn)練集包括多個(gè)圖像樣本,圖像樣本包括初始圖像樣本和經(jīng)增廣得到的噪聲圖像樣本,每個(gè)圖像樣本具有對(duì)應(yīng)的初始標(biāo)簽;針對(duì)中間訓(xùn)練集的第i個(gè)圖像樣本,根據(jù)第i個(gè)圖像樣本的初始標(biāo)簽,確定與第i個(gè)圖像樣本對(duì)應(yīng)的?近鄰圖像樣本集合,i≥0;根據(jù)第i個(gè)圖像樣本對(duì)應(yīng)的近鄰圖像樣本集合,對(duì)第i個(gè)圖像樣本進(jìn)行局部線性嵌入處理,得到與第i個(gè)圖像樣本對(duì)應(yīng)的目標(biāo)線性組合系數(shù),其中,第i個(gè)圖像樣本對(duì)應(yīng)的目標(biāo)線性組合系數(shù)是第i個(gè)圖像樣本被與第i個(gè)圖像樣本對(duì)應(yīng)的近鄰圖像樣本集合線性重構(gòu)的系數(shù);利用第i個(gè)圖像樣本對(duì)應(yīng)的目標(biāo)線性組合系數(shù)對(duì)第i個(gè)圖像樣本的初始標(biāo)簽進(jìn)行局部線性嵌入處理,得到第i個(gè)圖像樣本的目標(biāo)標(biāo)簽;根據(jù)每個(gè)圖像樣本各自對(duì)應(yīng)的目標(biāo)標(biāo)簽更新中間訓(xùn)練集,得到目標(biāo)訓(xùn)練集。
3、根據(jù)本公開的實(shí)施例,對(duì)初始訓(xùn)練集的初始圖像樣本進(jìn)行增廣處理,得到中間訓(xùn)練集,包括:根據(jù)初始圖像樣本的初始標(biāo)簽,對(duì)初始訓(xùn)練集進(jìn)行區(qū)域劃分,得到多個(gè)子區(qū)域;在多個(gè)子區(qū)域中,將不滿足預(yù)設(shè)區(qū)域閾值的子區(qū)域作為目標(biāo)子區(qū)域;對(duì)目標(biāo)子區(qū)域的初始圖像樣本添加高斯噪聲,得到噪聲圖像樣本;根據(jù)初始圖像樣本和噪聲圖像樣本,生成中間訓(xùn)練集。
4、根據(jù)本公開的實(shí)施例,根據(jù)初始圖像樣本的初始標(biāo)簽,對(duì)初始訓(xùn)練集進(jìn)行區(qū)域劃分,得到多個(gè)子區(qū)域,包括:根據(jù)初始標(biāo)簽的類型,確定與初始標(biāo)簽對(duì)應(yīng)的劃分長(zhǎng)度;根據(jù)劃分長(zhǎng)度對(duì)初始訓(xùn)練集進(jìn)行劃分,得到多個(gè)子區(qū)域。
5、根據(jù)本公開的實(shí)施例,針對(duì)中間訓(xùn)練集的第i個(gè)圖像樣本,根據(jù)第i個(gè)圖像樣本的初始標(biāo)簽,確定與第i個(gè)圖像樣本對(duì)應(yīng)的?近鄰圖像樣本集合,包括:根據(jù)第i個(gè)圖像樣本的初始標(biāo)簽,確定第i個(gè)圖像樣本的鄰近區(qū)間;將第i個(gè)圖像樣本的樣本特征分別與第i個(gè)圖像樣本的鄰近區(qū)間內(nèi)的n個(gè)初始近鄰圖像樣本的樣本特征進(jìn)行距離值計(jì)算,得到n個(gè)距離值,n≥0;根據(jù)預(yù)設(shè)選取范圍,在n個(gè)距離值中確認(rèn)m個(gè)目標(biāo)距離值,0≤m≤n;將m個(gè)目標(biāo)距離值對(duì)應(yīng)的m個(gè)初始近鄰圖像樣本作為與第i個(gè)圖像樣本對(duì)應(yīng)的近鄰圖像樣本集合。
6、根據(jù)本公開的實(shí)施例,根據(jù)第i個(gè)圖像樣本對(duì)應(yīng)的近鄰圖像樣本集合,對(duì)第i個(gè)圖像樣本進(jìn)行局部線性嵌入處理,得到與第i個(gè)圖像樣本對(duì)應(yīng)的目標(biāo)線性組合系數(shù),包括:構(gòu)建第i個(gè)圖像樣本的樣本特征和第i個(gè)圖像樣本對(duì)應(yīng)的近鄰圖像樣本集合的m個(gè)初始近鄰圖像樣本的樣本特征之間的線性關(guān)系;根據(jù)線性關(guān)系,確定與第i個(gè)圖像樣本對(duì)應(yīng)的目標(biāo)線性組合系數(shù)。
7、根據(jù)本公開的實(shí)施例,利用第i個(gè)圖像樣本對(duì)應(yīng)的目標(biāo)線性組合系數(shù)對(duì)第i個(gè)圖像樣本的初始標(biāo)簽進(jìn)行局部線性嵌入處理,得到第i個(gè)圖像樣本的目標(biāo)標(biāo)簽,包括:對(duì)m個(gè)近鄰圖像樣本的初始標(biāo)簽分別進(jìn)行格式轉(zhuǎn)換,得到m個(gè)近鄰圖像樣本各自對(duì)應(yīng)的中間標(biāo)簽,其中,中間標(biāo)簽為向量形式;根據(jù)預(yù)設(shè)關(guān)系,對(duì)第i個(gè)圖像樣本對(duì)應(yīng)的目標(biāo)線性組合系數(shù)和m個(gè)近鄰圖像樣本的中間標(biāo)簽進(jìn)行嵌入處理,得到第i個(gè)圖像樣本的目標(biāo)標(biāo)簽。
8、根據(jù)本公開的實(shí)施例,上述方法還包括:對(duì)初始圖像樣本和噪聲圖像樣本進(jìn)行歸一化處理,得到處理后的初始圖像樣本和處理后的噪聲圖像樣本;根據(jù)初始圖像樣本和噪聲圖像樣本,生成中間訓(xùn)練集包括:根據(jù)處理后的初始圖像樣本和處理后的噪聲圖像樣本,生成中間訓(xùn)練集。
9、根據(jù)本公開的實(shí)施例,根據(jù)每個(gè)圖像樣本各自對(duì)應(yīng)的目標(biāo)標(biāo)簽更新中間訓(xùn)練集,得到目標(biāo)訓(xùn)練集,包括:根據(jù)第i個(gè)圖像樣本的目標(biāo)標(biāo)簽,更新第i個(gè)圖像樣本的初始標(biāo)簽,得到更新后的第i個(gè)圖像樣本;根據(jù)更新后的第i個(gè)圖像樣本,確定更新訓(xùn)練集;將中間訓(xùn)練集的圖像樣本并入至更新訓(xùn)練集,得到目標(biāo)訓(xùn)練集。
10、本公開的第二方面提供了一種圖像回歸模型的訓(xùn)練方法,包括:利用上述目標(biāo)訓(xùn)練集對(duì)圖像回歸模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的圖像回歸模型。
11、本公開的第三方面提供了一種基于局部線性嵌入的圖像數(shù)據(jù)的增廣裝置,包括:增廣模塊,用于對(duì)初始訓(xùn)練集的初始圖像樣本進(jìn)行增廣處理,得到中間訓(xùn)練集,其中,中間訓(xùn)練集包括多個(gè)圖像樣本,圖像樣本包括初始圖像樣本和經(jīng)增廣得到的噪聲圖像樣本,每個(gè)圖像樣本具有對(duì)應(yīng)的初始標(biāo)簽;第一確定模塊,用于針對(duì)中間訓(xùn)練集的第i個(gè)圖像樣本,根據(jù)第i個(gè)圖像樣本的初始標(biāo)簽,確定與第i個(gè)圖像樣本對(duì)應(yīng)的近鄰圖像樣本集合,i≥0;第一處理模塊,用于根據(jù)第i個(gè)圖像樣本對(duì)應(yīng)的?近鄰圖像樣本集合,對(duì)第i個(gè)圖像樣本進(jìn)行局部線性嵌入處理,得到與第i個(gè)圖像樣本對(duì)應(yīng)的目標(biāo)線性?組合系數(shù),其中,第i個(gè)圖像樣本對(duì)應(yīng)的目標(biāo)線性組合系數(shù)是第i個(gè)圖像樣本被與第i個(gè)圖像樣本對(duì)應(yīng)的近鄰圖像樣本集合線性重構(gòu)的系數(shù);第二處理模塊,用于利用第i個(gè)圖像樣本對(duì)應(yīng)的目標(biāo)線性組合系數(shù)對(duì)第i個(gè)圖像樣本的初始標(biāo)簽進(jìn)行局部線性嵌入處理,得到第i個(gè)圖像樣本的目標(biāo)標(biāo)簽;以及更新模塊,用于根據(jù)每個(gè)圖像樣本各自對(duì)應(yīng)的目標(biāo)標(biāo)簽更新中間訓(xùn)練集,得到目標(biāo)訓(xùn)練集。
12、本公開的第四方面提供了一種電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)計(jì)算機(jī)程序,其中,上述一個(gè)或多個(gè)處理器執(zhí)行上述一個(gè)或多個(gè)計(jì)算機(jī)程序以實(shí)現(xiàn)上述方法的步驟。
13、本公開的第五方面還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序或指令,上述計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述方法的步驟。
14、本公開的第六方面還提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)程序或指令,上述計(jì)算機(jī)程序或指令被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述方法的步驟。
15、根據(jù)本公開的實(shí)施例,針對(duì)中間訓(xùn)練集的第i個(gè)圖像樣本,根據(jù)第i個(gè)圖像樣本的初始標(biāo)簽,確定與第i個(gè)圖像樣本對(duì)應(yīng)的近鄰圖像樣本集合;根據(jù)與第i個(gè)圖像樣本對(duì)應(yīng)的近鄰圖像樣本集合,對(duì)第i個(gè)圖像樣本進(jìn)行局部線性嵌入處理,得到與第i個(gè)圖像樣本對(duì)應(yīng)的目標(biāo)線性組合系數(shù);利用目標(biāo)線性組合系數(shù)對(duì)初始標(biāo)簽進(jìn)行局部線性嵌入處理,得到第i個(gè)圖像樣本的目標(biāo)標(biāo)簽。由于根據(jù)第i個(gè)近鄰圖像樣本集合,對(duì)第i個(gè)圖像樣本進(jìn)行局部線性嵌入處理,并基于得到的目標(biāo)線性組合系數(shù)對(duì)第i個(gè)樣本的初始標(biāo)簽進(jìn)行局部線性嵌入處理,避免了在離散標(biāo)簽的基礎(chǔ)上生成的標(biāo)簽的連續(xù)性被破壞的問(wèn)題,實(shí)現(xiàn)了在對(duì)圖像樣本進(jìn)行增廣的同時(shí),保留深度回歸中標(biāo)簽連續(xù)性,有助于增強(qiáng)模型對(duì)于模糊標(biāo)簽區(qū)間的樣本的預(yù)測(cè)能力。