設(shè)的區(qū)域大小劃分區(qū)域,對(duì)所述區(qū)域運(yùn)用最大池 化方法獲取描述所述圖片的向量進(jìn)行處理,所述最大池化方法指對(duì)同一區(qū)域不同位置的特 征進(jìn)行聚合統(tǒng)計(jì);
[0041] 運(yùn)用隨機(jī)降維方法對(duì)所述描述所述圖片的向量進(jìn)行降維獲取到所述中層特征。
[0042] 本發(fā)明實(shí)施例圖片特征提取方法及裝置,通過(guò)使用聚類(lèi)算法從待分類(lèi)的圖片數(shù)據(jù) 集中獲取多個(gè)聚類(lèi)中心作為低層特征提取器;使用所述多個(gè)低層特征提取器對(duì)所述圖片數(shù) 據(jù)集中的每張圖片做卷積操作,分別生成與所述多個(gè)低層特征提取器相同數(shù)量的多個(gè)卷積 圖片;對(duì)所述多個(gè)卷積圖片分別進(jìn)行閾值化操作獲取多個(gè)稀疏圖片;對(duì)所述多個(gè)稀疏圖片 進(jìn)行低層特征整合獲取多個(gè)整合后的圖片;對(duì)所述多個(gè)整合后的圖片進(jìn)行中層特征提取操 作獲取中層特征,實(shí)現(xiàn)了從圖片數(shù)據(jù)本身自適應(yīng)地學(xué)習(xí)低層特征抽取器,即可以自適應(yīng)的 提取圖片特征且提取效率較高,解決了現(xiàn)有技術(shù)中不能針對(duì)每個(gè)圖片自適應(yīng)的提取特征且 提取耗時(shí)太長(zhǎng)的問(wèn)題。
【附圖說(shuō)明】
[0043] 為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā) 明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
[0044] 圖1為本發(fā)明圖片特征提取方法實(shí)施例一的流程圖;
[0045] 圖2為本發(fā)明圖片特征提取裝置實(shí)施例一的結(jié)構(gòu)示意圖;
[0046] 圖3為本發(fā)明圖片特征提取設(shè)備實(shí)施例一的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0047] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例 中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是 本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員 在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0048] 圖1為本發(fā)明圖片特征提取方法實(shí)施例一的流程圖,本實(shí)施例的執(zhí)行主體為圖片 特征提取裝置,該裝置可以通過(guò)軟件和/或硬件實(shí)現(xiàn)。該圖片特征提取裝置可以配置在終 端、或云端服務(wù)器等設(shè)備中。如圖1所示,本實(shí)施例的方法,可以包括:
[0049] 步驟101、使用聚類(lèi)算法從待分類(lèi)的圖片數(shù)據(jù)集中獲取多個(gè)聚類(lèi)中心作為低層特 征提取器。
[0050] 可選地,使用聚類(lèi)算法從待分類(lèi)的圖片數(shù)據(jù)集中獲取多個(gè)聚類(lèi)中心作為低層特征 提取器之前,還包括:
[0051] 對(duì)圖片數(shù)據(jù)集中的圖片進(jìn)行歸一化和去耦合的預(yù)處理操作得到待分類(lèi)的圖片數(shù) 據(jù)集。
[0052] 具體地,運(yùn)用聚類(lèi)算法例如是k-means聚類(lèi)算法,在已有的訓(xùn)練圖片數(shù)據(jù)集中隨 機(jī)選擇大量圖片,并從這些圖片中隨機(jī)再提取足夠量的圖像區(qū)域(例如5X5大?。┻\(yùn)行 k-means聚類(lèi)算法來(lái)取得一些聚類(lèi)中心作為低層特征提取器(例如5X5大小),并將聚類(lèi) 中心進(jìn)行歸一化,例如使用Ll歸一化,使得歸一化后的向量數(shù)值之和為1,在進(jìn)行聚類(lèi)分析 之前可以對(duì)圖片進(jìn)行歸一化和去耦合等預(yù)處理操作,這里的歸一化例如可以采用L2歸一 化,使得歸一化后的向量長(zhǎng)度為1,去耦合是對(duì)每一個(gè)圖像區(qū)域中的像素減去該圖像區(qū)域中 的像素均值,可以去掉每個(gè)圖像區(qū)域中的冗余信息,留下重要信息。
[0053] Ll歸一化,指將輸入的向量除以該向量的1-范數(shù)得到的向量,例如A = [al,a2], LI 歸一化操作就是得到 A' = [alA I al I +1 a2 I),a2A I al I +1 a2 I)]。
[0054] L2歸一化,指將輸入的向量除以該向量的2-范數(shù)得到的向量,例如,A = [al, a2],L2 歸一化操作就是得到 A' = [al/sqrt (al~2+a2~2),a2/sqrt (al~2+a2~2) ],sqrt ()是 開(kāi)根號(hào)運(yùn)算,al~2表示al的平方。
[0055] 低層特征主要指圖像的可視特征,可分為通用特征和專(zhuān)用特征。通用特征是指針 對(duì)通用圖像數(shù)據(jù)的一類(lèi)圖像特征,如顏色、紋理和形狀等。專(zhuān)用特征則針對(duì)特定應(yīng)用領(lǐng)域的 圖像數(shù)據(jù),如人臉、指紋和醫(yī)療圖像等所設(shè)計(jì)出的特征。本發(fā)明實(shí)施例中低層特征提取器作 為圖片的低層特征。
[0056] 步驟102、使用多個(gè)低層特征提取器對(duì)所述圖片數(shù)據(jù)集中的每張圖片做卷積操作, 針對(duì)每張圖片分別生成與多個(gè)低層特征提取器相同數(shù)量的多個(gè)卷積圖片。
[0057] 具體地,提取到這些低層特征提取器后,利用這些低層特征提取器對(duì)于每張圖片 做卷積操作,具體來(lái)說(shuō)就是將歸一化的低層特征提取器,以每個(gè)像素為中心,從左到右,從 上到下,低層特征提取器覆蓋的圖像區(qū)域進(jìn)行卷積操作,例如低層特征提取器大小為5X5, 那么將以該圖片的第一個(gè)像素為中心的5X5的圖像區(qū)域與低層特征提取器的對(duì)應(yīng)位置的 像素進(jìn)行相乘,并將所有乘積的結(jié)果相加,將最終得到的數(shù)值放到該像素位置,依次執(zhí)行上 述操作,直至該圖片中以每個(gè)像素為中心的圖像區(qū)域都計(jì)算完畢(圖像邊緣的像素可以忽 略),那么就形成了卷積圖片;一個(gè)低層特征提取器對(duì)應(yīng)一個(gè)卷積圖片,這樣一張圖片就生 成若干卷積圖片組成卷積圖片堆,如果有N個(gè)低層特征提取器,一個(gè)輸入圖片的卷積圖片 堆包含N個(gè)卷積圖片。
[0058] 步驟103、對(duì)多個(gè)卷積圖片分別進(jìn)行閾值化操作獲取多個(gè)稀疏圖片。
[0059] 可選地,對(duì)多個(gè)卷積圖片分別進(jìn)行閾值化操作獲取多個(gè)稀疏圖片之后,還包括:
[0060] 對(duì)多個(gè)稀疏圖片分別進(jìn)行標(biāo)準(zhǔn)化操作,標(biāo)準(zhǔn)化操作,包括:將多個(gè)稀疏圖片中的各 個(gè)圖片相同位置的像素值組成一個(gè)向量,對(duì)向量做歸一化后分別將所述向量的各個(gè)分量放 回到各個(gè)圖片的對(duì)應(yīng)位置得到多個(gè)標(biāo)準(zhǔn)化后的稀疏圖片;
[0061] 對(duì)應(yīng),所述對(duì)所述多個(gè)稀疏圖片進(jìn)行低層特征整合獲取多個(gè)整合后的圖片包括:
[0062] 對(duì)所述多個(gè)標(biāo)準(zhǔn)化后的稀疏圖片進(jìn)行低層特征整合獲取多個(gè)整合后的圖片。
[0063] 可選地,閾值化操作,包括:
[0064] 對(duì)多個(gè)卷積圖片中的每個(gè)卷積圖片的每一個(gè)像素值進(jìn)行判定,如果所述像素值大 于預(yù)設(shè)的閾值,保留所述像素值,否則將所述像素值設(shè)置為〇 ;將所述每個(gè)卷積圖片的所述 閾值化操作后的像素值對(duì)應(yīng)生成一個(gè)稀疏圖片,得到多個(gè)稀疏圖片。
[0065] 具體地,對(duì)卷積圖片進(jìn)行閾值化操作,例如是對(duì)卷積圖片中每一個(gè)像素進(jìn)行大小 判定,如果大于預(yù)設(shè)的閾值,該像素值保留,否則設(shè)置為0,由于像素值很多為0值,那么就 得到對(duì)應(yīng)的稀疏圖片。
[0066] 對(duì)于稀疏圖片堆中的所有稀疏圖片進(jìn)行標(biāo)準(zhǔn)化操作可以采用如下方式:即先將這 些稀疏圖片堆中各個(gè)圖片的每一個(gè)相同位置的像素組成一個(gè)向量,對(duì)該向量中的各個(gè)元素 做歸一化后放回到稀疏圖片堆中各個(gè)圖片的對(duì)應(yīng)位置。
[0067] 步驟104、對(duì)多個(gè)稀疏圖片進(jìn)行低層特征整合獲取多個(gè)整合后的圖片。
[0068] 可選地,對(duì)多個(gè)稀疏圖片進(jìn)行低層特征整合獲取多個(gè)整合后的圖片,包括:
[0069] 將多個(gè)稀疏圖片的每個(gè)稀疏圖片劃分成多個(gè)mXm的區(qū)域,分別將多個(gè)所述區(qū)域 的像素值組成m 2維的向量,將多個(gè)所述向量的相同位置的像素值組成多個(gè)整合后的圖片, 所述m為大于等于2的整數(shù),整合后的圖片的數(shù)量為所述稀疏圖片的數(shù)量的m 2倍。
[0070] 具體地,對(duì)上述標(biāo)準(zhǔn)化了的稀疏圖片進(jìn)行低層特征整合,得到整合后的圖片;在這 里,低層特征整合意味著:預(yù)先定義一個(gè)mXm的鄰域(例如2X2),在每個(gè)標(biāo)準(zhǔn)化的稀疏圖 片上,把由每個(gè)像素為基準(zhǔn)的mXm的區(qū)域的像素值組成m 2的向量,然后由m個(gè)m2維的向量 描述該區(qū)域(每一個(gè)向量分別描述該基準(zhǔn)像素),也就相當(dāng)于把原始的標(biāo)準(zhǔn)化稀疏圖片擴(kuò) 展到了 m2倍的維度。這樣,一張?jiān)紙D片的圖片堆數(shù)目就擴(kuò)大到m2倍。
[0071] 例如,一個(gè)圖像區(qū)域?yàn)?X3大/」
,以〇. 87為中心定義一個(gè) 2X2的鄰域
,將該鄰域的像素值組成4維的向量[0· 87 0· 29