本發(fā)明涉及互聯(lián)網(wǎng)領(lǐng)域,特別涉及一種物品信息處理方法及處理裝置。
背景技術(shù):
:隨著通信及網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,互聯(lián)網(wǎng)成為了人們獲取物品的重要平臺。和傳統(tǒng)的獲取方式相比,通過互聯(lián)網(wǎng)平臺獲取物品的弊端在與用戶在拿到物品之前是無法親眼見到物品,也無法觸摸到物品,因此,通過互聯(lián)網(wǎng)平臺獲取物品的首要問題是如何從互聯(lián)網(wǎng)上呈現(xiàn)的眾多的物品中篩選出自己需要的物品。在互聯(lián)網(wǎng)平臺上呈現(xiàn)的海量物品中,有很多物品是相同、相似或相關(guān)性較高的,導(dǎo)致用戶篩選物品時(shí)冗余度很高,影響用戶的選擇,因此用戶獲取物品時(shí)通常需要判斷多個(gè)物品是否相同或相似。判斷多個(gè)物品是否相同或相似通常是通過分析物品信息來實(shí)現(xiàn)的,相同物品一般是指材質(zhì)、視覺外觀、規(guī)格、配置等屬性均一致的物品。物品信息包括文本信息和圖像信息?,F(xiàn)有技術(shù)中,判斷多個(gè)物品是否相似主要包括基于文本信息的識別方法和基于圖像信息的識別方法。單純的基于文本信息對物品進(jìn)行識別的缺陷是如果物品的所有者提供的文本信息不準(zhǔn)確,或不完備,或文字描述不規(guī)范時(shí),會導(dǎo)致誤判。單純的基于物品圖像信息的識別方法的識別方法,可能會因?yàn)閳D像的拍攝角度、圖像的變形、物品的擺放位置、擺放方式以及背景干擾的因素造成誤判??梢?,現(xiàn)有技術(shù)中由于對物品信息的處理方法還不完善,使物品信息識別時(shí)精確度較低,影響用戶的選擇。技術(shù)實(shí)現(xiàn)要素:本發(fā)明實(shí)施例中提供了一種物品信息處理方法及處理裝置,以解決物品信息識別時(shí)的精確度較低的問題。為了解決上述技術(shù)問題,本發(fā)明實(shí)施例公開了如下技術(shù)方案:一方面,提供了一種物品信息處理方法,所述方法包括:獲取目標(biāo)物品的屬性信息;根據(jù)所述目標(biāo)物品的屬性信息確定所述目標(biāo)物品的特征向量;獲取所述目標(biāo)物品中任意兩個(gè)目標(biāo)物品對應(yīng)的特征向量之間的相似度距離;若所述兩個(gè)目標(biāo)物品之間的相似度距離小于預(yù)設(shè)閾值,則判定所述兩個(gè)目標(biāo)物品為相同或相似的物品。可選的,所述根據(jù)目標(biāo)物品的屬性信息確定所述目標(biāo)物品的特征向量,所述方法包括:根據(jù)所述目標(biāo)物品的屬性信息,從所述目標(biāo)物品對應(yīng)的屬性字典中確定所述目標(biāo)物品的特征向量,所述屬性字典包括屬性及所述屬性對應(yīng)的特征向量??蛇x的,所述根據(jù)目標(biāo)物品的屬性,從目標(biāo)物品對應(yīng)的屬性字典中獲取目標(biāo)物品的特征向量之前,所述方法還包括:獲取目標(biāo)物品的圖像信息;將圖像信息相同的目標(biāo)物品構(gòu)成的集合作為第一參考集合;獲取目標(biāo)物品的文本信息;將所述文本信息相同的目標(biāo)物品構(gòu)成的集合作為第二參考集合;獲取所述第一參考集合和第二參考集合的并集作為第三參考集合;獲取第三參考集合中目標(biāo)物品的屬性名和對應(yīng)的屬性值;對所述屬性值進(jìn)行編碼生成所述屬性值對應(yīng)的子向量;根據(jù)所述屬性名、屬性名對應(yīng)的屬性值、以及所述屬性值對應(yīng)的子向量,生成所述屬性詞典。可選的,所述將圖像信息相同的目標(biāo)物品構(gòu)成的集合作為第一參考集合,包括:獲取所述圖像信息中的圖像特征數(shù)據(jù);根據(jù)所述圖像特征數(shù)據(jù)生成指紋編碼,所述相同圖像信息的指紋編碼相同;將所述指紋編碼相同的圖像信息所對應(yīng)的目標(biāo)物品構(gòu)成的集合作為第一參考集合??蛇x的,所述將所述文本信息相同的目標(biāo)物品構(gòu)成的集合作為第二參考集合,包括:獲取所述目標(biāo)物品的文本信息;獲取所述文本信息中的文本特征數(shù)據(jù);將所述文本特征數(shù)據(jù)相同的文本信息對應(yīng)的目標(biāo)物品構(gòu)成的集合作為第二參考集合??蛇x的,所述在判斷兩個(gè)目標(biāo)物品為相同或相似的物品之后,所述方法還包括:將所述相同或相似的物品作為第一同款物品集合中的元素;將所述第一同款物品集合和所述第三參考集合的并集作為第二同款物品集合??蛇x的,所述獲取目標(biāo)物品的屬性信息包括:獲取目標(biāo)物品的屬性名,以及所述屬性名對應(yīng)的屬性值;所述根據(jù)所述目標(biāo)物品的屬性信息,從所述目標(biāo)物品對應(yīng)的屬性字典中獲取所述目標(biāo)物品的特征向量,包括:根據(jù)所述目標(biāo)物品的屬性值,從所述目標(biāo)物品對應(yīng)的屬性字典中獲取所述屬性值對應(yīng)的子向量;根據(jù)所述屬性值對應(yīng)的子向量,獲取所述屬性名對應(yīng)的子向量;根據(jù)所述屬性名對應(yīng)的子向量,生成所述目標(biāo)物品對應(yīng)的特征向量。可選的,所述根據(jù)屬性值對應(yīng)的子向量,獲取屬性名對應(yīng)的子向量,包括:若所述屬性名對應(yīng)一個(gè)屬性值,則將所述屬性值對應(yīng)的子向量作為所述屬性名對應(yīng)的子向量;若所述屬性名對應(yīng)多個(gè)屬性值,則將所述多個(gè)屬性值對應(yīng)的多個(gè)子向量加權(quán)平均后作為所述屬性名對應(yīng)的子向量。第二方面,提供了一種物品信息處理裝置,所述裝置包括:屬性信息獲取單元,用于獲取目標(biāo)物品的屬性信息;特征向量獲取單元,用于根據(jù)所述目標(biāo)物品的屬性信息確定所述目標(biāo)物品的特征向量;相似度距離獲取單元,用于獲取所述目標(biāo)物品中任意兩個(gè)目標(biāo)物品對應(yīng)的特征向量之間的相似度距離;判定單元,用于若所述兩個(gè)目標(biāo)物品之間的相似度距離小于預(yù)設(shè)閾值,則判定所述兩個(gè)目標(biāo)物品為相同或相似的物品??蛇x的,所述判定單元還用于根據(jù)所述目標(biāo)物品的屬性信息,從所述目標(biāo)物品對應(yīng)的屬性字典中確定所述目標(biāo)物品的特征向量;所述屬性字典包括屬性及所述屬性對應(yīng)的特征向量。本發(fā)明的實(shí)施例中公開了一種物品信息處理方法,通過目標(biāo)物品對應(yīng)的屬性信息獲取目標(biāo)物品的特征向量,獲取目標(biāo)物品中任意兩個(gè)目標(biāo)物品對應(yīng)的特征向量之間的相似度距離和預(yù)設(shè)閾值的比較,來判斷上述任意兩個(gè)目標(biāo)物品是否為相同或相似的物品。本發(fā)明實(shí)施例的方法可以將物品的屬性信息轉(zhuǎn)變?yōu)樘卣飨蛄?,通過對特征向量的數(shù)學(xué)運(yùn)算,可以獲得 物品屬性之間的相關(guān)度或相似度,能在物品信息處理時(shí)提高精確度,便于用戶識別出相同或相似的物品,提高用戶的使用體驗(yàn)。附圖說明為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1所示為本發(fā)明實(shí)施例的一種物品信息處理方法的流程圖;圖2所示為本發(fā)明實(shí)施例的一種物品信息處理方法的流程圖;圖3所示為本發(fā)明實(shí)施例的一種物品信息處理裝置的示意圖。具體實(shí)施方式本發(fā)明如下實(shí)施例提供了一種物品信息處理方法,能提高物品信息處理的精確度。下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整的描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。圖1所示為本發(fā)明實(shí)施例的一種物品信息處理方法的流程圖,如圖1所示,所述方法包括:步驟101,獲取目標(biāo)物品的屬性信息。目標(biāo)物品可以是提供給用戶的各種物品,例如服裝、首飾和箱包等。目標(biāo)物品的屬性信息包括屬性名和屬性名對應(yīng)的屬性值。屬性名可以是顏色、樣式、材料、尺碼、風(fēng)格等,屬性值可以是屬性名對應(yīng)的具體內(nèi)容,例如屬性名為顏色,對應(yīng)的屬性值可以是紅色、白色、黑白;屬性名為樣式,對應(yīng)的屬性值可以是長裙、短裙、半裙等;屬性名為材料,對應(yīng)的屬性值可以是純棉、雪紡、歐根紗、毛呢、真皮等;屬性名為風(fēng)格,對應(yīng)的屬性值可以是森女、歐美、簡約等。所述獲取目標(biāo)物品的屬性信息包括:獲取目標(biāo)物品的屬性名,以及所述屬性名對應(yīng)的屬性值;步驟102,根據(jù)所述目標(biāo)物品的屬性信息確定所述目標(biāo)物品的特征向量。本發(fā)明實(shí)施例中,根據(jù)所述目標(biāo)物品的屬性信息確定所述目標(biāo)物品的特征向量,包括:根據(jù)所述目標(biāo)物品的屬性信息,從所述目標(biāo)物品對應(yīng)的屬性字典中獲取所述目標(biāo)物品的特征向量;所述屬性字典包括所述屬性及所述屬性對應(yīng)的向量。步驟103,獲取所述目標(biāo)物品中任意兩個(gè)目標(biāo)物品對應(yīng)的特征向量之間的相似度距離。本發(fā)明實(shí)施例中的兩個(gè)特征向量之間的相似度距離及兩個(gè)向量之間的距離。例如若兩個(gè)目標(biāo)物品A和B對應(yīng)的特征向量分別為(a,b,c)和(x,y,z),則相似度距離為d=(a-x)2+(b-y)2+(c-z)2]]>步驟104,若所述兩個(gè)目標(biāo)物品之間的相似度距離小于預(yù)設(shè)閾值,則判定所述兩個(gè)目標(biāo)物品為相同或相似的物品。本發(fā)明的實(shí)施例中公開了一種物品信息處理方法,通過目標(biāo)物品對應(yīng)的屬性信息獲取目標(biāo)物品的特征向量,獲取目標(biāo)物品中任意兩個(gè)目標(biāo)物品對應(yīng)的特征向量之間的相似度距離和預(yù)設(shè)閾值的比較,判斷上述任意兩個(gè)目標(biāo)物品是否為相同或相似的物品。本發(fā)明實(shí)施例的方法可以將物品的屬性信息轉(zhuǎn)變?yōu)樘卣飨蛄浚ㄟ^對特征向量的數(shù)學(xué)運(yùn)算來獲得物品屬性之間的相關(guān)度或相似度,以識別物品是否相同或相似,能在物品信息處理時(shí)提高精確度,便于使用戶識別出相同或相似的物品,提高用戶的使用體驗(yàn)。圖2所示為本發(fā)明實(shí)施例的一種物品信息處理方法的流程圖,如圖2所示,所述根據(jù)目標(biāo)物品的屬性,從目標(biāo)物品對應(yīng)的屬性字典中獲取目標(biāo)物品的特征向量之前,所述方法還包括:步驟201,獲取目標(biāo)物品的圖像信息。目標(biāo)物品的圖像信息可以是物品的照片,模特圖等,也可以是視頻信息。步驟202,將圖像信息相同的目標(biāo)物品構(gòu)成的集合作為第一參考集合。所述將圖像信息相同的目標(biāo)物品構(gòu)成的集合作為第一參考集合,包括:獲取所述圖像信息中的圖像特征數(shù)據(jù);根據(jù)所述圖像特征數(shù)據(jù)生成指紋編碼,所述相同圖像信息的指紋編碼相同;將所述指紋編碼相同的圖像信息所對應(yīng)的目標(biāo)物品構(gòu)成的集合作為第一參考集合。根據(jù)圖像特征數(shù)據(jù)生成指紋編碼,可以采用現(xiàn)有技術(shù)中圖像處理的方法,例如先提取重要特征,比如形狀特征,顏色特征,輪廓等,然后進(jìn)行編碼,在此不再贅述。步驟203,獲取目標(biāo)物品的文本信息。目標(biāo)物品的文本信息可以是以文字描寫的物品的分類、顏色、風(fēng)格、尺寸、貨號和品牌等信息。步驟204,將所述文本信息相同的目標(biāo)物品構(gòu)成的集合作為第二參考集合。所述將所述文本信息相同的目標(biāo)物品構(gòu)成的集合作為第二參考集合,包括:獲取所述目標(biāo)物品的文本信息;獲取所述文本信息中的文本特征數(shù)據(jù);將所述文本特征數(shù)據(jù)相同的文本信息對應(yīng)的目標(biāo)物品構(gòu)成的集合作為第二參考集合。步驟205,獲取所述第一參考集合和第二參考集合的并集作為第三參考集合。獲取第一參考集合和第二參考集合的并集時(shí),先將第一參考集合和第二參考集合合并,然后去掉合集中的重復(fù)元素。例如第一參考集合為(A1,B1,C1),第二參考集合為(A1,B2,C2),則第三參考集合為(A1,B1,C1,B2,C2)。步驟206,獲取第三參考集合中目標(biāo)物品的屬性名和對應(yīng)的屬性值。步驟207,對所述屬性值進(jìn)行編碼生成所述屬性值對應(yīng)的子向量。對屬性值進(jìn)行編碼時(shí),越相近的屬性值編碼越相相近,例如紅色可以是(0,0,1.1),那么酒紅色可以是(0,0,1.2),而藍(lán)色可以是(0,0,2.0)。編碼得到的子向量可以是三維的,也可以是多維的。步驟208,根據(jù)所述屬性名、屬性名對應(yīng)的屬性值、以及所述屬性值對應(yīng)的子向量,生成所述屬性詞典。屬性詞典可以用表格來表示,還可以用其他形式來表示,表1所示為一個(gè)實(shí)施例的屬性詞典,表1所示的實(shí)施例中的子向量為多維向量。表1屬性名屬性值子向量風(fēng)格荷葉邊0.268,0.074,…,0.732風(fēng)格蕾絲0.479,0.112,…,0.132風(fēng)格鏤空0.876,0.201,…,0.001年份季節(jié)2014年秋季0.321,0.101,…,0.009年份季節(jié)秋季0.318,0.099,…,0.011年份季節(jié)2014夏季0.891,0.321,…,0.033腰型中腰0.732,0.001,…,0.029腰型寬腰0.098,0.341,…,0.145腰型窄腰0.098,0.124,…,0.121顏色分類酒紅色0.546,0.782,…,0.003顏色分類紅色0.442,0.231,…,0.000顏色分類白色0.000,0.413,…,0.817裙型百褶裙0.417,0282,…,0.811裙型燈籠裙0.001,0.293,…,0.000裙型A字裙0.374,0.784,…,0.387本發(fā)明實(shí)施例中,可選的,本發(fā)明實(shí)施例中,在步驟104之后,即在判斷兩個(gè)目標(biāo)物品為相同或相似的物品之后,所述方法還包括:將所述相同或相似的物品作為第一同款物品集合中的元素;將所述第一同款物品集合和所述第三參考集合的并集作為第二同款物品集合。用戶可以設(shè)置預(yù)設(shè)閾值,以調(diào)整精確度。預(yù)設(shè)閾值越小,第一同款集合中的元素就越少,即相同的物品越少,預(yù)設(shè)閾值越大,第一同款集合中的元素就越多,即相同的物品越多。將第一同款物品集合和第三參考集合的并集作為第二同款物品集合,可以提高識別的精確度,避免遺漏物品。本發(fā)明實(shí)施例中,可選的,根據(jù)所述目標(biāo)物品的屬性信息,從所述目標(biāo)物品對應(yīng)的屬性 字典中獲取所述目標(biāo)物品的特征向量,包括:根據(jù)所述目標(biāo)物品的屬性值,從所述目標(biāo)物品對應(yīng)的屬性字典中獲取所述屬性值對應(yīng)的子向量;根據(jù)所述屬性值對應(yīng)的子向量,獲取所述屬性名對應(yīng)的子向量;根據(jù)所述屬性名對應(yīng)的子向量,生成所述目標(biāo)物品對應(yīng)的特征向量。可選的,所述根據(jù)屬性值對應(yīng)的子向量,獲取屬性名對應(yīng)的子向量,包括:若所述屬性名對應(yīng)一個(gè)屬性值,則將所述屬性值對應(yīng)的子向量作為所述屬性名對應(yīng)的子向量;若所述屬性名對應(yīng)多個(gè)屬性值,則將所述多個(gè)屬性值對應(yīng)的多個(gè)子向量加權(quán)平均后作為所述屬性名對應(yīng)的子向量。本發(fā)明一個(gè)實(shí)施例中,采用如表1所述的屬性字典,如果一件物品的風(fēng)格為:荷葉邊、蕾絲,即風(fēng)格屬性名對應(yīng)了兩個(gè)屬性值,則風(fēng)格屬性名的子向量為“荷葉邊”對應(yīng)的子向量以及“蕾絲”對應(yīng)的子向量的加權(quán)平均值,加權(quán)值可以根據(jù)經(jīng)驗(yàn)設(shè)置。獲得子向量以后,可以將子向量順序排列作為目標(biāo)物品對應(yīng)的特征向量,例如一件物品對應(yīng)的子向量為A1,A2,A3,那么該物品對應(yīng)的特征向量為(A1,A2,A3)。通過屬性字典,可以將物品的屬性信息轉(zhuǎn)變?yōu)樘卣飨蛄?,通過對特征向量的數(shù)學(xué)運(yùn)算,可以獲得物品屬性之間的相關(guān)度或相似度,來判斷目標(biāo)物品是否為相同物品或相似物品,能在物品信息處理時(shí)提高精確度,便于使用戶識別出相同或相似的物品,提高用戶的使用體驗(yàn)。圖3所示為本發(fā)明實(shí)施例的一種物品信息處理裝置的示意圖,如圖3所示,所述裝置包括:屬性信息獲取單元301,用于獲取目標(biāo)物品的屬性信息;特征向量獲取單元302,用于根據(jù)所述目標(biāo)物品的屬性信息確定所述目標(biāo)物品的特征向量;相似度距離獲取單元303,用于獲取所述目標(biāo)物品中任意兩個(gè)目標(biāo)物品對應(yīng)的特征向量之間的相似度距離;判定單元304,用于若所述兩個(gè)目標(biāo)物品之間的相似度距離小于預(yù)設(shè)閾值,則判定所述 兩個(gè)目標(biāo)物品為相同或相似的物品??蛇x的,所述判定單元還用于根據(jù)所述目標(biāo)物品的屬性信息,從所述目標(biāo)物品對應(yīng)的屬性字典中確定所述目標(biāo)物品的特征向量;所述屬性字典包括屬性及所述屬性對應(yīng)的特征向量。本發(fā)明實(shí)施例的物品信息處理裝置,可以將物品的屬性信息轉(zhuǎn)變?yōu)樘卣飨蛄浚ㄟ^對特征向量的數(shù)學(xué)運(yùn)算,可以獲得物品屬性之間的相關(guān)度或相似度,來判斷目標(biāo)物品是否為相同物品或相似物品,能在物品信息處理時(shí)提高精確度,便于用戶識別出相同或相似的物品,提高用戶的使用體驗(yàn)。本發(fā)明實(shí)施例提供了一種物品信息處理方法及處理裝置,通過目標(biāo)物品對應(yīng)的屬性字典獲取目標(biāo)物品的特征向量,獲取目標(biāo)物品中任意兩個(gè)目標(biāo)物品對應(yīng)的特征向量之間的相似度距離和預(yù)設(shè)閾值的比較,判斷上述任意兩個(gè)目標(biāo)物品是否為相同或相似的物品。本發(fā)明實(shí)施例的方法提供了一種物品信息處理方法,可以將物品的屬性信息轉(zhuǎn)變?yōu)樘卣飨蛄浚ㄟ^對特征向量的數(shù)學(xué)運(yùn)算,可以獲得物品屬性之間的相關(guān)度或相似度,能在物品信息處理時(shí)提高精確度,便于用戶識別出相同或相似的物品,提高用戶的使用體驗(yàn)。本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明實(shí)施例中的技術(shù)可借助軟件加必需的通用硬件的方式來實(shí)現(xiàn),通用硬件包括通用集成電路、通用CPU、通用存儲器、通用元器件等,當(dāng)然也可以通過專用硬件包括專用集成電路、專用CPU、專用存儲器、專用元器件等來實(shí)現(xiàn),但很多情況下前者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明實(shí)施例中的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如只讀存儲器(ROM,Read-OnlyMemory)、隨機(jī)存取存儲器(RAM,RandomAccessMemory)、磁碟、光盤等,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所述的本發(fā)明實(shí)施方式,并不構(gòu)成對本發(fā)明保護(hù)范圍的限定。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。當(dāng)前第1頁1 2 3