專利名稱:一種商品圖像視覺質(zhì)量的自動(dòng)分級(jí)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像搜索技術(shù)領(lǐng)域,特別是涉及開發(fā)了一種商品圖像視覺質(zhì)量的自動(dòng)分級(jí)方法。
背景技術(shù):
當(dāng)網(wǎng)上購物已經(jīng)成為一種潮流和趨勢(shì)時(shí),用戶通過圖像搜素技術(shù)不僅僅希望搜索到商品相同或者相似的圖片,更希望能提供一種導(dǎo)購方式,呈現(xiàn)更佳的商品。大量實(shí)驗(yàn)表明圖片質(zhì)量的好壞會(huì)直接影響用戶的購買行為,一張高質(zhì)量的商品圖往往更能激發(fā)用戶的購買欲望
發(fā)明內(nèi)容
本發(fā)明目的是作為圖像搜索技術(shù)的必要補(bǔ)充,用來提高用戶的購買欲望。本發(fā)明的目的通過以下步驟實(shí)現(xiàn)一種商品圖像視覺質(zhì)量的自動(dòng)分級(jí)方法,包括以下步驟(I)將一批量圖片作為訓(xùn)練樣本,定義質(zhì)量等級(jí)(非常好、好、一般、差、極差),人工標(biāo)定每張圖片的質(zhì)量等級(jí)。提取顏色直方圖、顏色簡潔度、顏色和諧度以及圖片規(guī)則度作為訓(xùn)練樣本的訓(xùn)練特征。(2)訓(xùn)練步驟I中提取的特征,得到上述特征向量的特征權(quán)值。(3)建立圖像質(zhì)量自動(dòng)分級(jí)SVM模型。(4)圖像質(zhì)量預(yù)分級(jí),具體步驟如下(4. I)提取模糊度模糊因子提取主要分為兩步提取邊緣以及計(jì)算模糊因子。首先得到水平方向和豎直方向的邊緣圖;其次求得模糊因子圖BR(x,y)以及反模糊因子,公式如下
I/(U)為 O,J,) IBR;, {x, V) =--=-;
-A(x^y)
\f(x,y)-^AXx,y)\BR, U, .V,)=-----;式中,Ah(x,y)、Av(x,y)分別為水平方向和豎直方向的邊緣圖,f(x,y)為原圖。BRh(x,y) ,BRv(x, y)分別表示水平方向和豎直方向的模糊因子,而反模糊因子則為BRh(x,y)和BRv (X,y)最大值。最后計(jì)算模糊均值和模糊比率。計(jì)算公式如下
Rhrr =Riui- = ^llilc,;.辦_Dl杉賄ratio ~,
fi/wr-Edgecnt式中,Sumblur為反模糊因子的值和,Blurcnt為滿足反模糊因子小于模糊度T的像素的個(gè)數(shù)和;Edgeent為水平和豎直方向邊緣像素的個(gè)數(shù),Blurfflean表示模糊均值,Blurrato表示模糊比率。(4. 2)提取噪音比噪音是影響圖片質(zhì)量的重要因子,具體步驟如下首先對(duì)原圖進(jìn)行中值濾波,并求得濾波后水平方向以及豎直方向的邊緣圖。其次求得噪音圖Nmd (x,y),計(jì)算公式如下
N JNcaJx^={max(Dr(x^A(x^)^^.
cmd,
Ofithemise式中,Dh(x,y)、Dv(x,y)分別是水平方向和豎直方向的邊緣圖,Dh__n、Dv__分別為水平方向和豎直方向上的閾值,Ncand(x, y) > Ncand分別表不噪音值和噪音圖。最后計(jì)算噪音均值以及噪音比,計(jì)算公式如下Nosiemean = S:-se Nosiemtio =
NosiecntM* N式中,SumMise、Noisemt分別為噪音圖的像素值值的和以及噪音圖非零值像素個(gè)數(shù),Noise_n、Noiseent分別表示噪音均值和噪音比,M、N為操作圖片的長和寬。而噪音圖的長和寬。進(jìn)行模糊度和噪音比的融合進(jìn)行模糊度和噪音比的融合公式如下Metric=I-(W1Blurniea^W2BlurratiJw3Noisen1eal^w4Noiserati0);式中,Metric表示融合后特征值,Blurfflean表示模糊均值,Blurrato表示模糊比率,,Noisemean表示噪音均值,Noisecnt表示噪音比。(4. 3)提取weber對(duì)比度以及顏色對(duì)比度其中,weber對(duì)比度公式如下fwc=-H---;
wxr/,—Iavg式中,fwc表示weber對(duì)比度,m、n為圖像的長和寬,Iavg為圖像的均值,I (x, y)表示在點(diǎn)(x,y)的像素值。顏色對(duì)比度公式如下fcc=( ImJ |/| |r| )/( Imi /I |i| I);式中,f。。表示顏色對(duì)比度,R為主體商品區(qū)域,I為原圖。M10M1表示商品主體區(qū)域和原圖區(qū)域像素值變化聚類像素的個(gè)數(shù)。(4.4)文字特征提取步驟如下(4. 4. I)離線學(xué)習(xí)訓(xùn)練圖像中紅色文字logo區(qū)域像素點(diǎn)值,根據(jù)公式計(jì)算色度的均值M和協(xié)方差C。(4. 4. 2)對(duì)于 輸入的每個(gè)像素,計(jì)算與離線訓(xùn)練模型的距離,檢測(cè)輸入相似是否為紅色文字區(qū)域。(4. 4. 3)閾值分割得到二值掩碼圖像,提取各個(gè)連通區(qū)域。(4. 4. 4)對(duì)各個(gè)連通區(qū)域根據(jù)ORC算法精確定位是否屬于文字logo區(qū)域,并識(shí)別文字在圖像中的位置以及個(gè)數(shù)。(4. 5)提取待分級(jí)圖片特征,特征為步驟I中所述特征。
(4. 6)根據(jù)步驟2中計(jì)算得到的特征向量權(quán)值,對(duì)步驟5提取的特征進(jìn)行多特征融
口 o(4. 7)對(duì)步驟6得到的融合特征作為輸入?yún)?shù)送入步驟3中所建立的SVM模型,得到待分級(jí)圖片質(zhì)量級(jí)別。本發(fā)明的有益效果是,本發(fā)明商品圖像視覺質(zhì)量的自動(dòng)分級(jí)方法在用戶通過圖像技術(shù)搜索得到的商品圖中優(yōu)先展示用戶滿意度高即高質(zhì)量的圖片。
圖I為系統(tǒng)框架圖;圖2為預(yù)處理流程圖;
圖3為顏色直方圖計(jì)算流程圖。
具體實(shí)施例方式下面以服飾類圖像為例,結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步詳細(xì)的說明。如圖I所示,商品的圖像視覺質(zhì)量自動(dòng)分級(jí)方法包括以下步驟步驟I :將一批量圖片作為訓(xùn)練樣本,定義質(zhì)量等級(jí)(非常好、好、一般、差、極差),人工標(biāo)定每張圖片的質(zhì)量等級(jí)。提取顏色直方圖、顏色簡潔度、顏色和諧度以及圖片規(guī)則度作為訓(xùn)練樣本的訓(xùn)練特征。I. I顏色直方圖的提取方法計(jì)算步驟如下顏色量化將每個(gè)通道8位共256級(jí)量化為16級(jí),RGB三個(gè)通道共4096級(jí),即4096個(gè) Bin。顏色聚類根據(jù)量化后的顏色分布,計(jì)算顏色直方圖。取前N (目前N=S)位顏色為初始聚類中心,利用Kmeans進(jìn)行顏色聚類,得到顏色分布情況。I. 2顏色簡潔度的提取整個(gè)步驟如下求得彩色圖的顏色分布,并對(duì)RGB每個(gè)通道量化到16bin,創(chuàng)建一個(gè)4096bin的直方圖,其顏色簡潔度計(jì)算公式如下fs=(| I S| I/4096) *100% ;式中,fs表不顏色簡潔度,S表不直方圖值大于某一閾值T的直方圖bin的個(gè)數(shù)。I. 3顏色和諧度的提取步驟如下采用Yiwen Luo, Xiaoou Tang Photo and VideoQuality Evaluation Focusing on the Subject. ECCV> 08 Procedings of the 10thEuropean Conference on Computer Vision,pages 386—399,Berlin,Heidelberg,2008.SpringerVerlag.所示方法將RGB彩色圖轉(zhuǎn)換到HSV空間,分別提取H、S、V空間的顏色直方圖,并加以合并,公式如下H(i, j) =Avg (H(i)+H(j));式中,i、j表示不同的H、S、V空間下直方圖的bin, H(i, j)表示在i、jbin下的顏色直方圖,Avg表示取平均值。其顏色和諧度計(jì)算公式如下fh=h (h) *s (h) *v (h);式中,fh表示顏色和諧度,h(h)、s(h)、v(h)分別表示該圖在h、S、v通道下的直方圖。
I. 4圖片規(guī)則度表示圖片內(nèi)容排列的混雜程度,用基于方向的梯度直方圖來表示,提取步驟如下首先將圖像分成4X4塊,并規(guī)定梯度的5個(gè)方向分別為垂直、水平、45度、135度以及無方向,得到4X4X5bin直方圖。其次,求得每個(gè)bin的值。使用數(shù)字濾波器提取每一個(gè)分塊的邊緣特征。應(yīng)用過程中,數(shù)字濾波器將每個(gè)分塊圖像繼續(xù)細(xì)分成4個(gè)子圖像塊,濾波器系數(shù)分別表示為fv (k)、fh(k)、f45(k)、f135(k)、fnd(k),其中k表示4個(gè)子圖像塊的位置。由此,五種邊緣類型的度量值計(jì)算如下,以垂直方向?yàn)槔?br>
權(quán)利要求
1.一種商品圖像視覺質(zhì)量的自動(dòng)分級(jí)方法,其特征在于,包括以下步驟 (1)將一批量圖片作為訓(xùn)練樣本,定義質(zhì)量等級(jí)(非常好、好、一般、差、極差),人工標(biāo)定每張圖片的質(zhì)量等級(jí);提取顏色直方圖、顏色簡潔度、顏色和諧度以及圖片規(guī)則度作為訓(xùn)練樣本的訓(xùn)練特征; (2)訓(xùn)練步驟I中提取的特征,得到上述特征向量的特征權(quán)值; (3)建立圖像質(zhì)量自動(dòng)分級(jí)SVM模型; (4)圖像質(zhì)量預(yù)分級(jí),具體步驟如下 (4. I)提取模糊度模糊因子提取主要分為兩步提取邊緣以及計(jì)算模糊因子; 首先得到水平方向和豎直方向的邊緣圖; 其次求得模糊因子圖BR(x,y)以及反模糊因子,公式如下
2.根據(jù)權(quán)利要求I所述商品圖像視覺質(zhì)量的自動(dòng)分級(jí)方法,其特征在于,所述步驟I中,所述顏色直方圖的提取方法如下 (a)顏色量化將每個(gè)通道8位共256級(jí)量化為16級(jí),RGB三個(gè)通道共4096級(jí),即4096個(gè) Bin ; (b)顏色聚類根據(jù)量化后的顏色分布,計(jì)算顏色直方圖;取前N位顏色為初始聚類中心,利用Kmeans進(jìn)行顏色聚類,得到顏色分布情況,N=S0
3.根據(jù)權(quán)利要求I所述商品圖像視覺質(zhì)量的自動(dòng)分級(jí)方法,其特征在于,所述步驟I中,所述顏色簡潔度的提取整個(gè)步驟如下求得彩色圖的顏色分布,并對(duì)RGB每個(gè)通道量化到16bin,創(chuàng)建一個(gè)4096bin的直方圖,其顏色簡潔度計(jì)算公式如下fs=( S Il /4096) *100% ; 式中,fs表不顏色簡潔度,S表不直方圖值大于某一閾值T的直方圖bin的個(gè)數(shù)。
4.根據(jù)權(quán)利要求I所述商品圖像視覺質(zhì)量的自動(dòng)分級(jí)方法,其特征在于,所述步驟I中,所述顏色和諧度的提取步驟如下將RGB彩色圖轉(zhuǎn)換到HSV空間,分別提取H、S、V空間的顏色直方圖,并加以合并,公式如下H(i, j)=Avg(H(i)+H(j)); 式中,i、j表示不同的H、S、V空間下直方圖的bin, H(i, j)表示在i、jbin下的顏色直方圖,Avg表示取平均值;其顏色和諧度計(jì)算公式如下 fh=h (h) *s (h) *v (h); 式中,fh表示顏色和諧度,h(h)、S (h)、V(h)分別表示該圖在h、S、V通道下的直方圖。
5.根據(jù)權(quán)利要求I所述商品圖像視覺質(zhì)量的自動(dòng)分級(jí)方法,其特征在于,所述步驟I中,所述圖片規(guī)則度表示圖片內(nèi)容排列的混雜程度,用基于方向的梯度直方圖來表示,提取步驟如下 首先將圖像分成4X4塊,并規(guī)定梯度的5個(gè)方向分別為垂直、水平、45度、135度以及無方向,得到4X4X5bin直方圖; 其次,求得每個(gè)bin的值;使用數(shù)字濾波器提取每一個(gè)分塊的邊緣特征;數(shù)字濾波器將每個(gè)分塊圖像繼續(xù)細(xì)分成4個(gè)子圖像塊,濾波器系數(shù)分別表示為fv(k)、fh(k)、f45(k)、f135 (k)、fnd (k),其中k表示4個(gè)子圖像塊的位置;由此,五種邊緣類型的度量值計(jì)算如下,以垂直方向?yàn)槔?br>
6.根據(jù)權(quán)利要求I所述商品圖像視覺質(zhì)量的自動(dòng)分級(jí)方法,其特征在于,所述步驟2具體為假設(shè)4…xf)為步驟I中提取的特征向量,i表示第i張訓(xùn)練圖片,M表示m維的特征組合;f (X)表示預(yù)測(cè)得到的分?jǐn)?shù),F(xiàn)(X)用戶定義的分?jǐn)?shù),可以得到一個(gè)損失函數(shù),目標(biāo)使損失函數(shù)能量損耗最低,再得到特征權(quán)值,公式如下
7.根據(jù)權(quán)利要求I所述商品圖像視覺質(zhì)量的自動(dòng)分級(jí)方法,其特征在于,所述步驟3建立的圖像質(zhì)量自動(dòng)分級(jí)SVM模型為
全文摘要
本發(fā)明公開了一種基于商品的圖像視覺質(zhì)量自動(dòng)分級(jí)方法。該方法首先將一批量圖片作為訓(xùn)練樣本,定義質(zhì)量等級(jí),人工標(biāo)定每張圖片的質(zhì)量等級(jí)。提取訓(xùn)練圖片的特征,包括顏色直方圖、顏色和諧度、圖片規(guī)則度,然后通過訓(xùn)練方式得到特征向量權(quán)值,建立圖像質(zhì)量自動(dòng)分級(jí)SVM訓(xùn)練模型,提取待分級(jí)圖片模糊因子、噪聲比和對(duì)比度,檢測(cè)文字在商品圖片的數(shù)量以及位置,預(yù)先分級(jí)低質(zhì)量圖片;然后提取待分級(jí)圖片訓(xùn)練特征并訓(xùn)練得到特征向量權(quán)值;最后計(jì)算待分級(jí)圖片質(zhì)量級(jí)別;本發(fā)明會(huì)在用戶通過圖像技術(shù)搜索得到的商品圖中優(yōu)先展示用戶滿意度高即高質(zhì)量的圖片。
文檔編號(hào)G06F17/30GK102799669SQ201210246598
公開日2012年11月28日 申請(qǐng)日期2012年7月17日 優(yōu)先權(quán)日2012年7月17日
發(fā)明者王海洋, 黃琦, 林建聰, 王豐年, 孫凱 申請(qǐng)人:杭州淘淘搜科技有限公司