本發(fā)明涉及圖像識別領(lǐng)域,具體是指一種電商平臺展示圖片顏色信息采集方法。
背景技術(shù):
隨著電子商務(wù)和互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,電商平臺展示圖片顏色信息越來越為人們所重視,申請?zhí)枮?01610590862.3的發(fā)明專利申請公開了一種服裝圖像前景顏色特征提取方法及服裝檢索方法和系統(tǒng),通過分權(quán)重加權(quán)計算圖像各分區(qū)顏色特征值統(tǒng)計服裝圖像數(shù)據(jù)庫中服裝圖像的顏色特征值。該方法及系統(tǒng)存在的問題有:1)圖像分區(qū)無法判斷該區(qū)域是否為該產(chǎn)品的一部分,因此加權(quán)計算結(jié)果往往與實際情況大相徑庭;2)各步驟中的參數(shù)設(shè)定過于機械,不能自動調(diào)整適應(yīng),進一步加大了數(shù)據(jù)失真度;3)獲取顏色特征值過程計算量較大,影響獲取最終結(jié)果速度。
技術(shù)實現(xiàn)要素:
本發(fā)明的發(fā)明目的在于針對現(xiàn)有技術(shù)存在的上述問題,提供一種電商平臺展示圖片顏色信息采集方法。
上述發(fā)明目的通過以下方案實現(xiàn):
電商平臺展示圖片顏色信息采集方法,包括以下步驟:(1)按產(chǎn)品分類設(shè)置關(guān)鍵詞列表,通過關(guān)鍵詞列表中的主關(guān)鍵詞搜索并抓取電商平臺產(chǎn)品展示圖片;(2)讀取產(chǎn)品展示圖片對應(yīng)的產(chǎn)品文檔,產(chǎn)品文檔出現(xiàn)與關(guān)鍵詞列表中互斥的文檔信息時,將該產(chǎn)品展示圖片作為非本類產(chǎn)品加以剔除,本類產(chǎn)品對應(yīng)的所有產(chǎn)品展示圖片作為處理圖片集;(3)將處理圖片集中的每張圖片分為m×n塊區(qū)域,繪制m×n塊區(qū)域內(nèi)每塊區(qū)域像素點rgb值變化曲線,選取rgb值變化曲線平緩且像素點rgb值極限差值最小的區(qū)域作為基準區(qū)域,對各區(qū)域賦予相應(yīng)權(quán)重系數(shù),基準區(qū)域以外的其余區(qū)域權(quán)重系數(shù)小于基準區(qū)域權(quán)重系數(shù);(4)加權(quán)計算各區(qū)域rgb均值得到該圖片rgb均值;(5)遍歷處理圖片集內(nèi)所有圖片,一一計算所有圖片rgb均值;(6)繪制處理圖片集內(nèi)所有圖片rgb均值曲線,得到顏色分布信息。
作為優(yōu)選,基準區(qū)域以外的其余區(qū)域根據(jù)中心點位置與基準區(qū)域中心點距離由近至遠排列遞減設(shè)置權(quán)重系數(shù)。
作為權(quán)重設(shè)置的另一優(yōu)選方案,基準區(qū)域以外的其余區(qū)域根據(jù)區(qū)域rgb均值大小成比例設(shè)置權(quán)重系數(shù)。
進一步地,m和n的取值均為3。
進一步地,步驟(3)中還包括預(yù)處理步驟(3-1):設(shè)置基準尺寸,將處理圖片集中所有圖片縮放使之與基準尺寸一致。
本發(fā)明有益效果在于:通過關(guān)鍵詞列表排除非本類產(chǎn)品,大大提高數(shù)據(jù)分析的可靠性;通過計算圖片內(nèi)各區(qū)域rgb均值確定基準區(qū)域,遠比選擇幾何中心區(qū)域精準可靠;顏色信息獲取過程快速方便。
具體實施方式
以下結(jié)合具體實施例對本發(fā)明作進一步說明。
電商平臺展示圖片顏色信息采集方法,包括以下步驟:(1)按產(chǎn)品分類設(shè)置關(guān)鍵詞列表,通過關(guān)鍵詞列表中的主關(guān)鍵詞搜索并抓取電商平臺產(chǎn)品展示圖片;(2)讀取產(chǎn)品展示圖片對應(yīng)的產(chǎn)品文檔,產(chǎn)品文檔出現(xiàn)與關(guān)鍵詞列表中互斥的文檔信息時,將該產(chǎn)品展示圖片作為非本類產(chǎn)品加以剔除,本類產(chǎn)品對應(yīng)的所有產(chǎn)品展示圖片作為處理圖片集;(3)將處理圖片集中的每張圖片分為m×n塊區(qū)域,繪制m×n塊區(qū)域內(nèi)每塊區(qū)域像素點rgb值變化曲線,選取rgb值變化曲線平緩且像素點rgb值極限差值最小的區(qū)域作為基準區(qū)域,對各區(qū)域賦予相應(yīng)權(quán)重系數(shù),基準區(qū)域以外的其余區(qū)域權(quán)重系數(shù)小于基準區(qū)域權(quán)重系數(shù);(4)加權(quán)計算各區(qū)域rgb均值得到該圖片rgb均值;(5)遍歷處理圖片集內(nèi)所有圖片,一一計算所有圖片rgb均值;(6)繪制處理圖片集內(nèi)所有圖片rgb均值曲線,得到顏色分布信息。
本實施例中,基準區(qū)域以外的其余區(qū)域根據(jù)區(qū)域rgb均值大小成比例設(shè)置權(quán)重系數(shù)。為更簡捷起見,基準區(qū)域以外的其余區(qū)域也可以根據(jù)中心點位置與基準區(qū)域中心點距離由近至遠排列遞減設(shè)置權(quán)重系數(shù)。
為平衡計算精度和計算速度,本實施例中m和n的取值均為3。
本實施例中,步驟(3)中還包括預(yù)處理步驟(3-1):設(shè)置基準尺寸,將處理圖片集中所有圖片縮放使之與基準尺寸一致。
雖然本發(fā)明已通過參考優(yōu)選的實施例進行了描述,但是,本領(lǐng)域普通技術(shù)人員應(yīng)當了解,可以不限于上述實施例的描述,在權(quán)利要求書的范圍內(nèi),可作出形式和細節(jié)上的各種變化。