本發(fā)明涉及圖像數(shù)據(jù)處理,具體涉及一種基于深度學(xué)習(xí)的數(shù)據(jù)分類方法及系統(tǒng)。
背景技術(shù):
1、隨著計算機(jī)相關(guān)產(chǎn)業(yè)的發(fā)展,各領(lǐng)域中的應(yīng)用系統(tǒng)飛速發(fā)展,其行業(yè)應(yīng)用在運行中產(chǎn)生的數(shù)據(jù)規(guī)模呈現(xiàn)指數(shù)倍增長。這些數(shù)據(jù)蘊(yùn)含著市場價值或戰(zhàn)略價值的信息。最常見的數(shù)據(jù)類型包括圖像數(shù)據(jù),圖像數(shù)據(jù)的經(jīng)典應(yīng)用場景有電商系統(tǒng),電商系統(tǒng)中包含著大量的圖像數(shù)據(jù),對圖像數(shù)據(jù)的有效使用首先需要對圖像數(shù)據(jù)進(jìn)行分類。
2、目前常用的圖像數(shù)據(jù)的數(shù)據(jù)分類方法有使用深度學(xué)習(xí),通過學(xué)習(xí)圖像的特征對圖像進(jìn)行自動分類,但若采用監(jiān)督學(xué)習(xí)的思想,會消耗大量的時間以及人力,而采用無監(jiān)督學(xué)習(xí)又會導(dǎo)致訓(xùn)練時間過長,且擬合能力不足,準(zhǔn)確率低。
技術(shù)實現(xiàn)思路
1、本發(fā)明提供一種基于深度學(xué)習(xí)的數(shù)據(jù)分類方法及系統(tǒng),以解決現(xiàn)有的問題。
2、本發(fā)明的一種基于深度學(xué)習(xí)的數(shù)據(jù)分類方法及系統(tǒng)采用如下技術(shù)方案:
3、本發(fā)明一個實施例提供了一種基于深度學(xué)習(xí)的數(shù)據(jù)分類方法,該方法包括以下步驟:
4、獲取任意一種商品的若干個商品圖像,以及分別在rgb顏色空間、hsv顏色空間、灰度空間的i型商品圖像、ii型商品圖像、iii型商品圖像;
5、分別將任意i型商品圖像和ii型商品圖像進(jìn)行分塊,獲得i型商品圖像的若干第一目標(biāo)分塊,以及ii型商品圖像的若干第二目標(biāo)分塊;綜合任意第一目標(biāo)分塊中所有像素點的所有顏色分量的數(shù)值,獲取所述第一目標(biāo)分塊的色彩偏移程度;根據(jù)任意ii型商品圖像中所有第二目標(biāo)分塊的亮度與所述ii型商品圖像的亮度差異,獲取所述ii型商品圖像的亮度均衡程度;
6、將任意iii型商品圖像進(jìn)行分塊,得到若干第三目標(biāo)分塊;根據(jù)任意第三目標(biāo)分塊的所有像素點的梯度信息,獲取所述第三目標(biāo)分塊的總體方向性;通過總體方向性篩選得到任意iii型商品圖像的若干個紋理分塊,對所有紋理分塊的色彩偏斜程度進(jìn)行篩選然后融合,得到所述iii型商品圖像的紋理復(fù)雜度;
7、將任意商品圖像的所有分塊的色彩偏移程度、亮度均衡程度、紋理復(fù)雜度進(jìn)行融合,獲取商品圖像的特征指數(shù);
8、利用商品圖像的特征指數(shù)對商品圖像進(jìn)行分類。
9、進(jìn)一步地,所述綜合任意第一目標(biāo)分塊中所有像素點的所有顏色分量的數(shù)值,獲取所述第一目標(biāo)分塊的色彩偏移程度,包括的具體方法為:
10、獲取任意第一目標(biāo)分塊的所有像素點的所有顏色分量的數(shù)值;
11、獲取任意顏色分量在任意第一目標(biāo)分塊中的偏斜程度;
12、將每個顏色分量在第一目標(biāo)分塊的偏斜程度相加,得到第一目標(biāo)分塊的色彩偏斜程度。
13、進(jìn)一步地,所述任意顏色分量在任意第一目標(biāo)分塊中的偏斜程度的具體獲取方法為:
14、計算任意顏色分量在任意第一目標(biāo)分塊的偏斜度,所述偏斜度與所述顏色分量在所述第一目標(biāo)分塊中的偏斜程度呈正比例關(guān)系。
15、進(jìn)一步地,所述根據(jù)任意ii型商品圖像中所有第二目標(biāo)分塊的亮度與所述ii型商品圖像的亮度差異,獲取所述ii型商品圖像的亮度均衡程度,包括的具體方法為:
16、將任意ii型商品圖像的所有像素點的v通道值的均值,記為所述ii型商品圖像的平均亮度;將任意第二目標(biāo)分塊內(nèi)所有像素點的v通道值的均值,記為所述第二目標(biāo)分塊的平均亮度;將任意ii型商品圖像中的任意第二目標(biāo)分塊的平均亮度與所述ii型商品圖像的平均亮度作差,取絕對值,獲得所述第二目標(biāo)分塊與所屬ii型商品圖像的亮度差異;將任意ii型商品圖像的所有第二目標(biāo)分塊與所屬ii型商品圖像的亮度差異進(jìn)行求和,取倒數(shù),得到所述ii型商品圖像的亮度均衡程度。
17、進(jìn)一步地,所述根據(jù)任意第三目標(biāo)分塊的所有像素點的梯度信息,獲取所述第三目標(biāo)分塊的總體方向性,包括的具體方法為:
18、獲取任意第三目標(biāo)分塊的若干個離散角度以及相應(yīng)的顯著像素點數(shù)量,并構(gòu)成所述第三目標(biāo)分塊的離散角度-顯著像素點數(shù)量坐標(biāo)系,離散角度-顯著像素點數(shù)量坐標(biāo)系中包含若干個數(shù)據(jù)點,每個數(shù)據(jù)點對應(yīng)一個離散角度和相應(yīng)的顯著像素點數(shù)量;
19、使用最小二乘法,將離散角度-顯著像素點數(shù)量坐標(biāo)系內(nèi)的若干個數(shù)據(jù)點擬合為離散角度-顯著像素點數(shù)量曲線,將離散角度-顯著像素點數(shù)量曲線中任意相鄰極小值間的曲線記為一個波,每個波的最大值記為波峰,獲取離散角度-顯著像素點數(shù)量曲線的若干個波以及對應(yīng)的波峰;
20、任意第三目標(biāo)分塊的方向性的獲取方法為:
21、
22、其中,表示任意第三目標(biāo)分塊的方向性;表示任意第三目標(biāo)分塊的離散角度-顯著像素點數(shù)量曲線的波峰數(shù)量;表示任意第三目標(biāo)分塊中第個波的離散角度數(shù)量;表示任意第三目標(biāo)分塊中第個波的第個離散角度,表示任意第三目標(biāo)分塊中第個波的峰值對應(yīng)的離散角度;表示任意第三目標(biāo)分塊中第個波的第個離散角度相應(yīng)的顯著像素點數(shù)量,表示歸一化函數(shù)。
23、進(jìn)一步地,所述獲取任意第三目標(biāo)分塊的若干個離散角度以及相應(yīng)的顯著像素點數(shù)量,并構(gòu)成所述第三目標(biāo)分塊的離散角度-顯著像素點數(shù)量坐標(biāo)系的具體方法為:
24、對所有iii型商品圖像的每個分塊使用sobel算子進(jìn)行計算,得到每個iii型商品圖像的每個像素點處的水平方向變化量和垂直方向變化量;
25、將第三目標(biāo)分塊中的任意像素點記為目標(biāo)像素點;
26、對目標(biāo)像素點處的水平方向變化量與垂直方向變化量求均值,作為所述目標(biāo)像素點處的梯度向量的模;
27、對目標(biāo)像素點處的垂直方向變化量與水平方向變化量作比,對比值使用正切函數(shù)的反函數(shù),再加,得到所述目標(biāo)像素點處的梯度向量的方向;
28、獲取第三目標(biāo)分塊中所有像素點處的梯度向量的方向和模,對第三目標(biāo)分塊中所有像素點處的梯度向量的方向使用等寬法進(jìn)行離散化,得到若干個離散角度,獲取每個離散角度包含的像素點以及對應(yīng)的像素點處的梯度向量的模;獲取每個離散角度包含的像素點處的梯度向量的模大于預(yù)設(shè)第五參數(shù)的像素點數(shù)量,記為每個離散角度相應(yīng)的顯著像素點數(shù)量;
29、以為坐標(biāo)原點,以離散角度為橫軸正方向,以每個離散角度相應(yīng)的顯著像素點數(shù)量為縱軸正方向,建立離散角度-顯著像素點數(shù)量坐標(biāo)系。
30、進(jìn)一步地,所述通過總體方向性篩選得到任意iii型商品圖像的若干個紋理分塊,對所有紋理分塊的色彩偏斜程度進(jìn)行篩選然后融合,得到所述iii型商品圖像的紋理復(fù)雜度,包括的具體方法為:
31、將總體方向性大于預(yù)設(shè)第六參數(shù)的第三目標(biāo)分塊記為紋理分塊;
32、獲取任意紋理分塊的離散角度-顯著像素點數(shù)量曲線的所有波峰,對任意顏色分量在任意波峰對應(yīng)的離散角度相應(yīng)的顯著像素點計算偏斜度,記為任意顏色分量在任意波峰對應(yīng)的離散角度的偏斜度;將所有顏色分量在任意波峰對應(yīng)的離散角度的偏斜度相加,記為任意波峰對應(yīng)的離散角度的色彩偏斜度;將所有波峰對應(yīng)的離散角度的色彩偏斜度相加,得到所述紋理分塊的色彩偏斜度;紋理分塊的色彩偏斜度與紋理分塊的色彩偏斜程度呈正比例關(guān)系;
33、將任意iii型商品圖像中所有色彩偏斜程度大于預(yù)設(shè)第七參數(shù)的紋理分塊的方向性相加,得到所述iii型商品圖像的紋理復(fù)雜度。
34、進(jìn)一步地,所述將任意商品圖像的所有分塊的色彩偏移程度、亮度均衡程度、紋理復(fù)雜度進(jìn)行融合,獲取商品圖像的特征指數(shù),包括的具體方法為:
35、對任意商品圖像,將對應(yīng)i型商品圖像所有第一目標(biāo)分塊的色彩偏斜程度相加,得到所述商品圖像的色彩偏斜程度,商品圖像的色彩偏斜程度與商品圖像的特征指數(shù)呈正比;商品圖像對應(yīng)ii型商品圖像的亮度均衡程度與商品圖像的特征指數(shù)呈反比;商品圖像對應(yīng)iii型圖像的紋理復(fù)雜度與商品圖像的特征指數(shù)呈反比。
36、進(jìn)一步地,所述利用商品圖像的特征指數(shù)對商品圖像進(jìn)行分類,包括的具體方法為:
37、將商品圖像的特征指數(shù)作為標(biāo)簽,對商品圖像根據(jù)交叉熵?fù)p失函數(shù),并使用隨機(jī)梯度下降算法訓(xùn)練深度神經(jīng)網(wǎng)絡(luò),使交叉熵?fù)p失函數(shù)收斂,得到訓(xùn)練完成的深度神經(jīng)網(wǎng)絡(luò),利用訓(xùn)練完成的深度神經(jīng)網(wǎng)絡(luò)獲取新的商品圖像的特征指數(shù),將新的商品圖像的特征指數(shù)大于等于預(yù)設(shè)第一超參數(shù)的商品圖像記為商家的商品圖像,小于預(yù)設(shè)第一超參數(shù)的商品圖像記為用戶的商品圖像。
38、本發(fā)明的實施例提供了一種基于深度學(xué)習(xí)的數(shù)據(jù)分類系統(tǒng),包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機(jī)程序,所述處理器執(zhí)行所述計算機(jī)程序時實現(xiàn)任意一項所述一種基于深度學(xué)習(xí)的數(shù)據(jù)分類方法的步驟。
39、本發(fā)明的技術(shù)方案的有益效果是:考慮商家方的商品圖像和用戶方的商品圖像的顏色廣度差異、亮度差異、商品平整度差異,分別獲取商品圖像的色彩偏移程度、亮度均衡程度、紋理復(fù)雜度,然后綜合獲取商品圖像的特征指數(shù),充分考慮了商家與用戶在拍攝商品時的不同因素。然后根據(jù)商品圖像的特征指數(shù),通過深度學(xué)習(xí)對所有商品圖像進(jìn)行分類,分析了數(shù)據(jù)本身的特點,極大地提高了商品圖像的分類準(zhǔn)確率和效率。