本發(fā)明涉及圖像檢索領(lǐng)域,特別涉及一種繪畫圖像檢索方法及裝置。
背景技術(shù):
隨著人們生活水平的不斷提高,藝術(shù)品愛好者逐年增多。大部分藝術(shù)品愛好者知識積累有限,亟需有效的工具幫助其進行藝術(shù)品的鑒賞。假設(shè)愛好者有一幅繪畫作品,但不知該作品的歷史和特點。愛好者可以利用圖像搜索技術(shù),搜尋到與該作品最相似的作品,從而找到相關(guān)的背景知識和專業(yè)評論。
目前主流的圖像檢索方法主要分為兩類:基于關(guān)鍵字的方法和基于圖像內(nèi)容的方法?;陉P(guān)鍵字的圖像檢索方法根據(jù)用戶輸入的文字,搜索相似文字關(guān)聯(lián)的圖像。由于用戶難以對繪畫作品進行準(zhǔn)確描述,且與文字關(guān)聯(lián)的圖像常常風(fēng)馬牛不相及,所以這種方法不適合用在繪畫圖像檢索的場景?;趫D像內(nèi)容的圖像檢索方法無需文字描述,直接從圖像中提取描述圖像特點的特征向量,然后利用特征向量之間的差異進行檢索?,F(xiàn)有的圖像特征描述方法一般采用人工設(shè)計的方法提取顏色、梯度和紋理信息,如方向梯度直方圖(hog,histogramoforientedgridients)和局部二值模式(lbp,localbinarypattern)。這些特征容易受到光照和非線性形變等的影響,使得檢索精度難以滿足實際需求。
因此,如何克服復(fù)雜光照和非線性形變等對繪畫圖像的影響,進行更精確的繪畫圖像檢索,是有待解決的技術(shù)難題。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是針對上述現(xiàn)有技術(shù)中存在的問題,提供一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的繪畫圖像檢索方法及裝置。
為了實現(xiàn)上述目的,本發(fā)明提出的基于深度卷積神經(jīng)網(wǎng)絡(luò)的繪畫圖像檢索方法包括以下步驟:
步驟s1,構(gòu)建繪畫圖像訓(xùn)練樣本集,所述圖像訓(xùn)練樣本集中包含同一幅繪畫作品對應(yīng)的多個繪畫圖像訓(xùn)練樣本,并且所述圖像訓(xùn)練樣本集中的每一繪畫圖像訓(xùn)練樣本的圖像類別按精分類和粗分類進行標(biāo)記;
步驟s2,構(gòu)建繪畫圖像特征提取器,基于深度卷積神經(jīng)網(wǎng)絡(luò)自動從訓(xùn)練樣本集中學(xué)習(xí)精分類特征和粗分類特征,對深度卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,獲得繪畫圖像訓(xùn)練樣本的繪畫圖像特征向量并存儲至繪畫圖像特征數(shù)據(jù)庫中;
步驟s3,利用構(gòu)建的繪畫圖像特征提取器提取待檢索繪畫圖像的特征向量;以及
步驟s4,計算待檢索繪畫圖像的特征向量與繪畫圖像特征數(shù)據(jù)庫中每一個繪畫圖像特征向量之間的距離,基于計算出的距離得到圖像檢索結(jié)果。
優(yōu)選地,所述精分類特征對應(yīng)于一幅繪畫作品的紋理特征,所述粗分類特征對應(yīng)于繪畫作品所屬的畫種或題材內(nèi)容種類特征。
優(yōu)選地,所述基于深度卷積神經(jīng)網(wǎng)絡(luò)自動從訓(xùn)練樣本集中學(xué)習(xí)最具區(qū)分力的精分類特征和粗分類特征的步驟包括:基于精分類深度卷積神經(jīng)網(wǎng)絡(luò)自動從訓(xùn)練樣本集中學(xué)習(xí)精分類特征,得到精分類特征向量;以及基于粗分類深度卷積神經(jīng)網(wǎng)絡(luò)自動從訓(xùn)練樣本集中學(xué)習(xí)粗分類特征,得到粗分類特征向量。
優(yōu)選地,所述獲得繪畫圖像訓(xùn)練樣本的繪畫圖像特征向量的步驟包括:繪畫圖像特征提取器將精分類特征向量和粗分類特征向量串聯(lián)后得到繪畫圖像特征向量。
優(yōu)選地,所述構(gòu)建繪畫圖像訓(xùn)練樣本集的步驟包括:對繪畫作品進行以下中的一種或多種變換來豐富訓(xùn)練樣本:顏色變換、平移變換、尺度變換以及旋轉(zhuǎn)變換。
優(yōu)選地,本發(fā)明使用的深度卷積神經(jīng)網(wǎng)絡(luò)的卷積層和池化層對圖像的平移、縮放和扭曲等變化高度魯棒,通過擾動增多訓(xùn)練樣本進一步增強了繪畫圖像特征提取器對光照和形變的魯棒性。
優(yōu)選地,所述深度卷積神經(jīng)網(wǎng)絡(luò)的神經(jīng)元采用修正線性單元relu函數(shù)或雙曲正切函數(shù)作為激活函數(shù);通過反向傳播算法最小化來優(yōu)化深度卷積神經(jīng)網(wǎng)絡(luò)。
本發(fā)明還提供了一種繪畫圖像檢索裝置,該裝置包括存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于:所述處理器執(zhí)行如上所述的繪畫圖像檢索方法中的步驟。
本發(fā)明提出一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的繪畫圖像檢索方法。本發(fā)明所述方法對于提高繪畫圖像檢索系統(tǒng)中圖像檢索的精度和魯棒性具有重要的意義,其主要優(yōu)點如下
(1)本發(fā)明使用的深度卷積神經(jīng)網(wǎng)絡(luò)方法,自動從訓(xùn)練樣本中學(xué)習(xí)出極具區(qū)分力的圖像表觀特征,避免了傳統(tǒng)圖像檢索方法手工設(shè)計特征的局限性。
(2)本發(fā)明使用的深度卷積神經(jīng)網(wǎng)絡(luò)的卷積層和池化層對圖像的平移、縮放和扭曲等變化高度魯棒,并通過擾動增多訓(xùn)練樣本進一步增強繪畫圖像特征提取器對光照和形變的魯棒性。
(3)本發(fā)明融合精分類和粗分類特征,同時考慮圖像紋理細(xì)節(jié)和全局語義信息,顯著提高了圖像特征的表達能力,有效提高了圖像檢索的精度和魯棒性。
(4)本發(fā)明提出的繪畫圖像檢索方法便于應(yīng)用到各種不同藝術(shù)品圖像檢索系統(tǒng)中。實際應(yīng)用時,只需針對特定類別藝術(shù)品準(zhǔn)備一些具有代表性的訓(xùn)練樣本,并根據(jù)藝術(shù)品的特點設(shè)計粗分類方式,經(jīng)過訓(xùn)練得到的圖像特征提取器就可以進行準(zhǔn)確的圖像檢索。
得益于上述優(yōu)點,本發(fā)明能夠克服復(fù)雜光照和非線性形變對繪畫圖像的影響,提高了繪畫圖像檢索系統(tǒng)的精度、魯棒性和易用性。本發(fā)明可廣泛用于繪畫作品的鑒賞和拍賣等場景。
本領(lǐng)域技術(shù)人員將會理解的是,能夠用本發(fā)明實現(xiàn)的目的和優(yōu)點不限于以上具體所述,并且根據(jù)以下詳細(xì)說明將更清楚地理解本發(fā)明能夠?qū)崿F(xiàn)的上述和其他目的。
附圖說明
參考附圖,本發(fā)明更多的目的、功能和優(yōu)點將通過本發(fā)明實施方式的如下描述得以闡明,在附圖中:
圖1是本發(fā)明一實施例中基于深度卷積神經(jīng)網(wǎng)絡(luò)的繪畫圖像檢索方法算法流程示意圖。
圖2是本發(fā)明一實施例中深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖3是本發(fā)明一實施例中基于深度卷積神經(jīng)網(wǎng)絡(luò)的繪畫圖像特征提取器示意圖。
具體實施方式
下面,對本發(fā)明的優(yōu)選實施方式進行詳細(xì)說明。這些優(yōu)選實施方式的示例在附圖中進行了例示。附圖中所示和根據(jù)附圖描述的本發(fā)明的實施方式僅僅是示例性的,并且本發(fā)明的技術(shù)精神及其主要操作不限于這些實施方式。
在此,還需要說明的是,為了避免因不必要的細(xì)節(jié)而模糊了本發(fā)明,在附圖中僅僅示出了與根據(jù)本發(fā)明的方案密切相關(guān)的結(jié)構(gòu)和/或處理步驟,而省略了與本發(fā)明關(guān)系不大的其他細(xì)節(jié)。
目前,基于深度卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)技術(shù)具有極強的自主學(xué)習(xí)能力和高度的非線性映射,從而為設(shè)計復(fù)雜的高精度高速度的自動識別提供了可能。發(fā)明人發(fā)現(xiàn),深度卷積神經(jīng)網(wǎng)絡(luò)可以從大量標(biāo)記樣本中自動學(xué)習(xí)特征提取濾波器,采用權(quán)值共享和下采樣結(jié)構(gòu)使得其對圖像的平移、縮放和扭曲等變化高度魯棒。但深度卷積神經(jīng)網(wǎng)絡(luò)的成功依賴于大數(shù)據(jù)的支撐。由于繪畫圖像樣本較少,現(xiàn)有的深度卷積神經(jīng)網(wǎng)絡(luò)模型可以很好地描述自然圖像,但不能有效描述繪畫圖像。因此,如何針對繪畫圖像的特點,利用深度卷積神經(jīng)網(wǎng)絡(luò)搭建繪畫圖像檢索系統(tǒng),使其在訓(xùn)練樣本較少的情況下也可以取得優(yōu)良的效果,是繪畫圖像檢索領(lǐng)域亟待解決的難題。
發(fā)明人發(fā)現(xiàn),深度卷積神經(jīng)網(wǎng)絡(luò)可以從大量標(biāo)記樣本中自動學(xué)習(xí)特征提取濾波器,通過在不同圖像位置共享濾波器權(quán)值和池化(pooling)的下采樣操作可使得其對圖像的平移、縮放和扭曲等變化高度魯棒,可以將其應(yīng)用到繪畫圖像檢索任務(wù)中。考慮到深度卷積神經(jīng)網(wǎng)絡(luò)需要大量訓(xùn)練樣本才可以取得理想的效果,而繪畫圖像樣本較難搜集,數(shù)據(jù)量較小的問題,本發(fā)明利用繪畫圖像具有的屬性特點,如畫種、題材內(nèi)容種類等,通過按精分類和粗分類方式標(biāo)記訓(xùn)練樣本圖像類別,即利用精分類和粗分類特征準(zhǔn)確檢索繪畫圖像。
圖1為本發(fā)明一實施例中基于深度卷積神經(jīng)網(wǎng)絡(luò)的繪畫圖像檢索方法的流程圖。如圖1所示,該繪畫圖像檢索方法包括如下步驟:
步驟s1,構(gòu)建繪畫圖像訓(xùn)練樣本集。
本步驟中,可按精分類和粗分類兩種方式標(biāo)記訓(xùn)練樣本集中訓(xùn)練樣本圖像類別,并且,通過對訓(xùn)練樣本圖像進行平移、旋轉(zhuǎn)/扭曲、尺度、顏色變換等,來豐富訓(xùn)練樣本。
其中,精分類類別例如可對應(yīng)于一幅繪畫作品,例如可基于一幅繪畫作品特有的紋理特征,粗分類類別例如可對應(yīng)于繪畫作品所屬的畫種或題材內(nèi)容種類等。此精分類和粗分類方式僅為舉例,本發(fā)明并不限于此。
一幅繪畫作品可以在不同環(huán)境光照下被不同相機從不同角度拍攝,所以一幅繪畫作品可以產(chǎn)生多張繪畫圖像。一幅繪畫作品對應(yīng)一種精分類類別,來自同一幅繪畫作品的圖像屬于相同的精分類類別,來自不同繪畫作品的圖像屬于不同的精分類類別。繪畫圖像的粗分類類別可以根據(jù)作品所屬的畫種(如中國畫、油畫、版畫、水彩畫、水粉畫等)來確定,也可以根據(jù)作品的題材內(nèi)容(如人物畫、風(fēng)景畫、山水畫、花鳥畫、動物畫、靜物畫、歷史畫等)來確定。可以通過在不同角度、光線下拍攝同一幅繪畫作品來豐富繪畫圖像訓(xùn)練樣本。
豐富的訓(xùn)練樣本可以增強繪畫圖像特征提取器對光照和形變的魯棒性。本發(fā)明還可以通過對原始訓(xùn)練樣本圖像進行顏色、尺度、旋轉(zhuǎn)和平移變換當(dāng)中的一種或多種變換,從而增加訓(xùn)練樣本的豐富性。記圖像i的寬度為w像素,高度為h像素,像素點顏色用rgb通道的數(shù)值(r,g,b)表示,每個通道的取值范圍為[0,255]。對i進行變換的步驟例如包括:(1)顏色變換:圖像中每個像素點的r、g和b值分別疊加均值為0、標(biāo)準(zhǔn)差為10的高斯噪聲;(2)尺度變換:將圖像縮放到原圖的0.9倍至1.1倍之間;(3)旋轉(zhuǎn)變換:以圖像中心為圓心按順時針或逆時針方向旋轉(zhuǎn)圖像,旋轉(zhuǎn)角度不大于8度;(4)平移變換:對圖像進行水平和豎直方向的平移,位移量分別小于0.2w和0.2h。進行步驟(2)、(3)、(4)時,超出h×w的部分被裁剪掉,沒有原圖像素點對應(yīng)的部分用0值像素點補全。以上變換步驟中對圖像的變換參數(shù)僅為示例,本發(fā)明并不限于此。一幅圖像通過不同參數(shù)的變換可以產(chǎn)生成百上千張具有少量差異的圖像。這些圖像精分類和粗分類類別與原圖相同。通過同一圖像的變換增加的訓(xùn)練樣本能進一步增強繪畫圖像特征提取器對光照和形變的魯棒性。
步驟s2,基于深度卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建繪畫圖像特征提取器。
具體地,基于深度卷積神經(jīng)網(wǎng)絡(luò)自動從訓(xùn)練樣本集中學(xué)習(xí)最具區(qū)分力的精分類特征和粗分類特征,對深度卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,獲得繪畫圖像訓(xùn)練樣本的繪畫圖像特征向量并存儲至繪畫圖像特征數(shù)據(jù)庫中。
圖3是本發(fā)明一實施例中基于深度卷積神經(jīng)網(wǎng)絡(luò)的繪畫圖像特征提取器示意圖。本發(fā)明中的深度卷積神經(jīng)網(wǎng)絡(luò)可包括精分類深度卷積神經(jīng)網(wǎng)絡(luò)和粗分類深度卷積神經(jīng)網(wǎng)絡(luò)。構(gòu)建的繪畫圖像特征提取器基于精分類深度卷積神經(jīng)網(wǎng)絡(luò)自動從訓(xùn)練樣本集中學(xué)習(xí)精分類特征,得到精分類特征向量;并且進一步地,基于粗分類深度卷積神經(jīng)網(wǎng)絡(luò)自動從訓(xùn)練樣本集中學(xué)習(xí)粗分類特征,得到粗分類特征向量。
隨后,繪畫圖像特征提取器可通過將精分類特征向量和粗分類特征向量串聯(lián)后得到繪畫圖像特征向量。
本發(fā)明一實施例中深度卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)示例如圖2所示。輸入圖像通過縮放歸一化到256×256。具體地,按照256與長邊的比例縮放圖像,使長邊長度等于256,短邊長度小于256,然后盡可能對稱地用0值像素點擴充短邊兩側(cè),直至圖像大小變?yōu)?56×256。將彩色圖像的rgb三個通道層疊在一起輸入到卷積層,此時輸入圖像的大小和層數(shù)可以表示為256×256×3。將輸入圖像的四周用寬度為5的0值像素擴充后,使用48個11×11×3的濾波器對其進行步長為4的濾波,得到64×64×48的濾波結(jié)果。對濾波結(jié)果進行步長為2的3×3的最大池化(maxpooling),得到32×32×48的數(shù)據(jù)。第二層卷積層c2與第一層c1相似,也包括卷積和池化(pooling)兩個步驟,且池化的參數(shù)一樣。在卷積之前對數(shù)據(jù)的四周用寬度為2的0值像素擴充,然后使用128個5×5×48的濾波器對其進行步長為1的濾波。第三層c3和第四層c4只有卷積操作。其中第三層使用192個3×3×128、步長為1的濾波器;第四層使用192個3×3×192、步長為1的濾波器。第五層c5包括卷積和池化操作。其中卷積操作使用64個3×3×192的濾波器,池化操作與第一層相同。所以,池化之后將得到的8×8×64數(shù)據(jù)。將8×8×64數(shù)據(jù)一起送入到全連接層進行分類器的構(gòu)造。全連接層包括兩個隱含層(fc1、fc2)和一個輸出層,其神經(jīng)元數(shù)目分別為1024、1024和n(對應(yīng)于類別數(shù))。對于精分類深度卷積神經(jīng)網(wǎng)絡(luò),n等于訓(xùn)練樣本對應(yīng)的繪畫作品數(shù)目,例如訓(xùn)練樣本圖像來自于1000幅繪畫作品,則n=1000。對于粗分類深度卷積神經(jīng)網(wǎng)絡(luò),n等于訓(xùn)練樣本對應(yīng)的粗分類類別數(shù),例如根據(jù)作品的題材內(nèi)容將訓(xùn)練樣本粗分為人物畫、風(fēng)景畫、山水畫、花鳥畫、動物畫、靜物畫等6類,則n=6。
精分類深度卷積神經(jīng)網(wǎng)絡(luò)為了提升精分類準(zhǔn)確率,需要區(qū)分不同作品間的差異,特別是相似作品的細(xì)微差異。經(jīng)過迭代訓(xùn)練后,精分類網(wǎng)絡(luò)提取的特征主要描述了圖像的紋理細(xì)節(jié)。相反地,粗分類深度卷積神經(jīng)網(wǎng)絡(luò)重在提取圖像中的內(nèi)在屬性,而不過多關(guān)注同一粗類中不同作品的細(xì)節(jié)差異。經(jīng)過迭代訓(xùn)練后,粗分類網(wǎng)絡(luò)提取的特征主要描述了圖像的全局語義信息。
本發(fā)明將精分類網(wǎng)絡(luò)中1024維的全連接層fc2特征作為精分類特征向量,將粗分類網(wǎng)絡(luò)中1024維的全連接層fc2特征作為粗分類特征向量,然后將這兩個向量串接起來,形成2048維的向量作為特征數(shù)據(jù)庫中繪畫圖像特征向量(如圖3所示),從而同時考慮了圖像的紋理細(xì)節(jié)和全局語義信息。
根據(jù)訓(xùn)練樣本豐富程度、計算資源和性能要求可以合理設(shè)計網(wǎng)絡(luò)結(jié)構(gòu)。如果訓(xùn)練樣本十分豐富、計算資源充足、計算速度要求不高,我們可以增加卷積層的層數(shù),使網(wǎng)絡(luò)變得更深,以便得到更好的分類準(zhǔn)確度。如果訓(xùn)練樣本較少、計算資源有限、計算速度要求高,我們可以減少卷積層的層數(shù),縮小卷積核的大小和數(shù)目,從而減少計算量。
本發(fā)明一實施例中,深度卷積神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元均可采用修正線性單元(relu,rectifiedlinearunit)響應(yīng)函數(shù):
f(x)=max(0,x).
其中,x表示神經(jīng)元的輸入信號。relu函數(shù)將小于0的輸入置為0,同時保持大于等于0的輸入保持不變。當(dāng)然,也可以選用其他響應(yīng)函數(shù),如雙曲正切函數(shù)|tanh(x)|,本發(fā)明并不限于此。
每個神經(jīng)元有兩個參數(shù)需要優(yōu)化,即權(quán)值和偏移量。本發(fā)明中可使用均值為0、標(biāo)準(zhǔn)差為0.01的高斯分布隨機數(shù)對對網(wǎng)絡(luò)中的權(quán)值進行初始化。第二、第四和第五卷積層以及全連接隱含層的偏移量被初始化為1,其他層的偏移量被初始化為0。通過反向傳播算法最小化訓(xùn)練樣本的真實類別與網(wǎng)絡(luò)預(yù)測類別之間的logistic回歸損失來確定網(wǎng)絡(luò)的參數(shù),即通過反向傳播算法最小化來優(yōu)化深度卷積神經(jīng)網(wǎng)絡(luò)參數(shù)。具體地,使用隨機梯度下降法對初始化后的參數(shù)進行更新(優(yōu)化)。以權(quán)重參數(shù)w為例,其更新過程為:
wi+1←wi+vi+1.
其中,i表示迭代次數(shù),v為動量變量,v0等于0,ε為學(xué)習(xí)率,
本發(fā)明中,還可使用dropout技術(shù)來有效防止深度學(xué)習(xí)模型(深度卷積神經(jīng)網(wǎng)絡(luò)模型)過擬合。dropout技術(shù)是指在訓(xùn)練的時候,以0.5的概率隨機地將神經(jīng)元響應(yīng)置零,被置零的神經(jīng)元不參與反向傳播;在測試的時候,將每個神經(jīng)元的響應(yīng)值乘以0.5。本發(fā)明一實施例中可對全連接層的前兩層使用dropout技術(shù)。
步驟s3,待檢索繪畫圖像特征提取:利用構(gòu)建的繪畫圖像特征提取器提取待檢索繪畫圖像的特征向量。
對于待檢索的繪畫圖像,可利用步驟s2構(gòu)建的繪畫圖像特征提取器提取除待檢索繪畫圖像的特征向量,即通過將精分類網(wǎng)絡(luò)中1024維的全連接層fc2特征作為精分類特征向量,將粗分類網(wǎng)絡(luò)中1024維的全連接層fc2特征作為粗分類特征向量,然后將這兩個向量串接起來,來形成2048維的向量作為繪畫圖像特征向量(如圖3所示),從而同時考慮了圖像的紋理細(xì)節(jié)和全局語義信息。
步驟s4,特征匹配與排序:計算待檢索的圖像特征向量與特征數(shù)據(jù)庫中每一個特征向量之間的距離,基于計算出的距離得到圖像檢索結(jié)果,例如可按距離從小到大的順序輸出圖像檢索結(jié)果。
例如,對第i幅待入庫的圖像,利用圖3所示的繪畫圖像特征提取器提取2048維的特征向量pi,將特征向量保存在繪畫圖像特征數(shù)據(jù)庫中。使用同樣的繪畫圖像特征提取器提取待檢索圖像的特征向量q,q與數(shù)據(jù)庫中pi的歐式距離di即代表了這兩幅圖像的差異程度:
di=||pi-q||2
式中運算符||||2表示歐式距離。按di從小到大的順序返回圖像檢索結(jié)果。
本發(fā)明的上述方法對于提高繪畫圖像檢索系統(tǒng)中圖像檢索的精度和魯棒性具有重要的意義,其主要優(yōu)點如下:
1.本發(fā)明使用的深度卷積神經(jīng)網(wǎng)絡(luò)方法,自動從訓(xùn)練樣本中學(xué)習(xí)出極具區(qū)分力的圖像表觀特征,避免了傳統(tǒng)圖像檢索方法手工設(shè)計特征的局限性。
2.本發(fā)明使用的深度卷積神經(jīng)網(wǎng)絡(luò)的卷積層和池化層對圖像的平移、縮放和扭曲等變化高度魯棒,并通過擾動增多訓(xùn)練樣本進一步增強繪畫圖像特征提取器對光照和形變的魯棒性。
3.本發(fā)明融合了精分類和粗分類特征,同時考慮圖像紋理細(xì)節(jié)和全局語義信息,顯著提高了圖像特征的表達能力,有效提高了圖像檢索的精度和魯棒性。
4.本發(fā)明提出的繪畫圖像檢索方法便于應(yīng)用到各種不同藝術(shù)品圖像檢索系統(tǒng)中。實際應(yīng)用時,只需針對特定類別藝術(shù)品準(zhǔn)備一些具有代表性的訓(xùn)練樣本,并根據(jù)藝術(shù)品的特點設(shè)計粗分類方式,經(jīng)過訓(xùn)練得到的圖像特征提取器就可以進行準(zhǔn)確的圖像檢索。
得益于上述優(yōu)點,本發(fā)明能夠克服復(fù)雜光照和非線性形變對繪畫圖像的影響,提高了繪畫圖像檢索系統(tǒng)的精度、魯棒性和易用性。本發(fā)明可廣泛用于繪畫作品的鑒賞和拍賣等場景。
相應(yīng)地,本發(fā)明還提供了一種繪畫圖像檢索裝置,該裝置可包括存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,處理器可執(zhí)行前述的繪畫圖像檢索方法中的步驟來實現(xiàn)本發(fā)明。
本發(fā)明的各部分可以用硬件、軟件、固件或者它們的組合來實現(xiàn)。在上述實施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實現(xiàn)。例如,如果用硬件來實現(xiàn),和在另一實施方式中一樣,可以用本領(lǐng)域共知的下列技術(shù)中的任一項或者他們的組合來實現(xiàn):具有用于對數(shù)據(jù)信號實現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(pga),現(xiàn)場可編程門陣列(fpga)等。
在流程圖中表示或者在此以其它方式描述的邏輯和/或步驟,例
如,可以被認(rèn)為是用于實現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實現(xiàn)在任何計算機可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計算機的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。
如上針對一個實施例描述和/或示出的特征可以以相同或類似的方式在一個或更多個其它實施例中使用,和/或與其它實施例中的特征相結(jié)合或替代其它實施例中的特征使用。
結(jié)合這里披露的本發(fā)明的說明和實踐,本發(fā)明的其他實施例對于本領(lǐng)域技術(shù)人員都是易于想到和理解的。說明和實施例僅被認(rèn)為是示例性的,本發(fā)明的真正范圍和主旨均由權(quán)利要求所限定。