国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      圖像分類方法和裝置的制作方法

      文檔序號(hào):6351705閱讀:188來源:國(guó)知局
      專利名稱:圖像分類方法和裝置的制作方法
      技術(shù)領(lǐng)域
      本申請(qǐng)涉及圖像處理技術(shù)領(lǐng)域,特別涉及一種圖像分類方法和裝置。
      背景技術(shù)
      圖像分類是根據(jù)不同圖像所反映的特征判定類別,將圖像進(jìn)行歸類的圖像處理技術(shù)。隨著互聯(lián)網(wǎng)上圖像數(shù)量急劇膨脹,特別是在電子商務(wù)領(lǐng)域,尤其涉及大量的圖像信息,而通過圖像分類,可以實(shí)現(xiàn)違禁物品檢測(cè),同類產(chǎn)品推薦等,因此圖像分類技術(shù)日漸成為研究的重點(diǎn)?,F(xiàn)有的圖像分類方法,通常是根據(jù)預(yù)先生成的視覺詞典,將待分類圖像表示為待分類視覺詞直方圖,然后由預(yù)先訓(xùn)練生成的圖像分類器確定待分類圖像的類別。其中,視覺詞典包括不同的視覺詞,每一視覺詞可代表一個(gè)類別,其是根據(jù)大量的訓(xùn)練圖像所提取的訓(xùn)練圖像特征,進(jìn)行聚類所得到的。待分類視覺詞直方圖是由多個(gè)數(shù)據(jù)形成的數(shù)據(jù)集,用向量形式表示,每一數(shù)據(jù)與每一視覺詞為一一映射關(guān)系,數(shù)據(jù)值等于與其對(duì)應(yīng)的視覺詞的權(quán)重,權(quán)重表示該待分類圖像與視覺詞所代表的那一類別的接近程度。預(yù)先訓(xùn)練的圖像分類器是根據(jù)每一訓(xùn)練圖像所對(duì)應(yīng)的視覺詞直方圖,利用機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練而生成的,每一訓(xùn)練圖像所對(duì)應(yīng)的視覺詞直方圖也是按照所述將待分類圖像表示為待分類視覺詞直方圖的方式來構(gòu)造的。將待分類圖像表示為待分類視覺詞直方圖具體是:根據(jù)提取的待分類圖像的圖像特征,確定出圖像特征與視覺詞典中哪一個(gè)視覺詞最接近,則將其量化為該視覺詞。視覺詞典中視覺詞每被量化一次,則其對(duì)應(yīng)的權(quán)重即加1,當(dāng)所有圖像特征均量化為視覺詞后,每一視覺詞的權(quán)重也即確定,即可建立待分類視覺詞直方圖。例如所訓(xùn)練的視覺詞典B ={bl,b2,b3},提取出的圖像特征包括Xl和X2,對(duì)應(yīng)該視覺詞典的分類視覺詞直方圖C ={cl,c2,c3},cl,c2,c3的初始值均為0,當(dāng)確定出Xl與視覺詞bl最接近,則對(duì)應(yīng)的cl加1,X2也是與視覺詞bl最接近,則將Cl再加1,從而最終建立的該待分類圖像的待分類視覺詞直方圖即為{2,0,0}。由上述過程可以看出,待分類視覺詞直方圖的建立過程,是將每一分類圖像特征量化為一個(gè)視覺詞。而在實(shí)際應(yīng)用中,所量化的一個(gè)視覺詞其并不能準(zhǔn)確表達(dá)該待分類圖像的特征,且在圖像出現(xiàn)畸變時(shí)容易導(dǎo)致量化錯(cuò)誤,例如圖像特征Xl實(shí)際是與視覺詞b2最相似,而采用現(xiàn)有的方法,圖像特征Xl仍會(huì)量化為視覺詞bl。因此導(dǎo)致建立的分類視覺詞直方圖并不準(zhǔn)確,出現(xiàn)誤差,最終導(dǎo)致圖像分類不準(zhǔn)確。

      發(fā)明內(nèi)容
      本申請(qǐng)所要解決的技術(shù)問題是提供一種圖像分類方法,用以解決現(xiàn)有技術(shù)中圖像分類不準(zhǔn)確的技術(shù)問題。本申請(qǐng)還提供了一種圖像分類裝置,用以保證上述方法在實(shí)際中的實(shí)現(xiàn)及應(yīng)用。為了解決上述問題,本申請(qǐng)公開了一種圖像分類方法,包括:
      提取一待分類圖像的分類圖像特征;依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中視覺詞的相似關(guān)系,將每一分類圖像特征量化為所述視覺詞典中的多個(gè)視覺詞,并確定每一分類圖像特征分別與其量化后的視覺詞的相似系數(shù);依據(jù)視覺詞典中每一視覺詞對(duì)應(yīng)不同分類圖像特征的相似系數(shù),確定視覺詞的權(quán)重以建立該待分類圖像的分類視覺詞直方圖;將所述分類視覺詞直方圖輸入預(yù)先根據(jù)大量樣本圖像所建立的樣本視覺詞直方圖進(jìn)行訓(xùn)練生成的圖像分類器中,根據(jù)輸出結(jié)果確定所述待分類圖像的類別。優(yōu)選地,所述依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中視覺詞的相似關(guān)系,將每一分類圖像特征量化為所述視覺詞典中的多個(gè)視覺詞,并確定每一分類圖像特征分別與其量化后的視覺詞的相似系數(shù)包括:依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中視覺詞的相似關(guān)系,按照稀疏編碼方式,構(gòu)建所述分類圖像特征與所述預(yù)先生成的視覺詞典的稀疏編碼模型;通過求解所述稀疏編碼模型,將每一分類圖像特征量化為所述視覺詞典中多個(gè)視覺詞,并得出每一分類圖像特征與其量化后視覺詞的相似系數(shù);所述稀疏編碼模型具體為:
      權(quán)利要求
      1.一種圖像分類方法,其特征在于,該方法包括: 提取一待分類圖像的分類圖像特征; 依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中視覺詞的相似關(guān)系,將每一分類圖像特征量化為所述視覺詞典中的多個(gè)視覺詞,并確定每一分類圖像特征分別與其量化后的視覺詞的相似系數(shù); 依據(jù)視覺詞典中每一視覺詞對(duì)應(yīng)不同分類圖像特征的相似系數(shù),確定視覺詞的權(quán)重以建立該待分類圖像的分類視覺詞直方圖; 將所述分類視覺詞直方圖輸入預(yù)先根據(jù)大量樣本圖像所建立的樣本視覺詞直方圖進(jìn)行訓(xùn)練生成的圖像分類器中,根據(jù)輸出結(jié)果確定所述待分類圖像的類別。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中視覺詞的相似關(guān)系,將每一分類圖像特征量化為所述視覺詞典中的多個(gè)視覺詞,并確定每一分類圖像特征分別與其量化后的視覺詞的相似系數(shù)包括: 依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中視覺詞的相似關(guān)系,按照稀疏編碼方式,構(gòu)建所述分類圖像特征與所述預(yù)先生成的視覺詞典的稀疏編碼模型; 通過求解所述稀疏編碼模型,將每一分類圖像特征量化為所述視覺詞典中多個(gè)視覺詞,并得出每一分類圖像特征與其量化后視覺詞的相似系數(shù); 所述稀疏編碼模型具體為: ^gTYjIlWx1-bc^W+ 其中,B代表視覺詞典,Xi代表分類圖像特征,Ci代表每一分類圖像特征與每一視覺詞的相似系數(shù)所組合的數(shù)據(jù)集,N表示分類圖像特征個(gè)數(shù),i = 1,2,...,N,λ為約束系數(shù),IlCiI表示Ci中元素相加的和值;該稀疏編碼模型用于求解該模型取最小值時(shí)Ci的值。
      3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中視覺詞的相似關(guān)系,將每一分類圖像特征量化為所述視覺詞典中的多個(gè)視覺詞,并確定每一分類圖像特征分別與其量化后的視覺詞的相似系數(shù)包括: 依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中視覺詞的相似關(guān)系,計(jì)算每一分類圖像特征與所述視覺詞典中的各視覺詞的歐式距離; 針對(duì)每一分類圖像特征,確定與其最小歐式距離所對(duì)應(yīng)的,以及與所述最小歐式距離相差預(yù)設(shè)倍數(shù)范圍的歐式距離所對(duì)應(yīng)的視覺詞,作為每一分類圖像特征量化后的視覺詞; 依據(jù)每一分類圖像特征與其量化后的視覺詞的歐式距離大小,計(jì)算每一分類圖像特征與其量化后的視覺詞的相似系數(shù)。
      4.根據(jù)權(quán)利要求1 3任一項(xiàng)所述的方法,其特征在于,所述依據(jù)所述每一視覺詞對(duì)應(yīng)不同分類圖像特征的相似系數(shù),確定視覺詞權(quán)重以建立該分類圖像的分類視覺詞直方圖具體為: 將所述每一視覺詞對(duì)應(yīng)不同分類圖像特征的相似系數(shù)累加,計(jì)算得到每一視覺詞的權(quán)重,以建立該分類圖像分類視覺詞直方圖。
      5.根據(jù)權(quán)利要求1 3任一項(xiàng)所述的方法,其特征在于,所述依據(jù)所述每一視覺詞對(duì)應(yīng)不同分類圖像特征的相似系數(shù),確定視覺詞的權(quán)重以建立分類視覺詞直方圖包括: 將所述待分類圖像,按照?qǐng)D像金字塔算法劃分為多個(gè)子圖像;確定每一子圖像包含的分類圖像特征; 將每一視覺詞對(duì)應(yīng)每一子圖像中所包括的不同分類圖像特征的相似系數(shù)進(jìn)行累加,計(jì)算得出對(duì)應(yīng)每一子圖像的視覺詞的權(quán)重,建立各子圖像的子分類視覺詞直方圖; 組合所述每一子分類視覺詞直方圖,形成該待分類圖像的分類視覺詞直方圖。
      6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述按照?qǐng)D像金字塔算法劃分為多個(gè)子圖像具體為: 按照?qǐng)D像金字塔算法將所述待分類圖像劃分為多層空間圖像; 分別針對(duì)每層空間圖像進(jìn)行子圖像劃分,形成多個(gè)子圖像。
      7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預(yù)先生成的視覺詞典是根據(jù)所述大量樣本圖像提取的樣本圖像特征進(jìn)行聚類得到的。
      8.一種圖像分類裝置,其特征在于,所述裝置包括: 特征提取模塊,用于提取一待分類圖像的分類圖像特征; 量化確定模塊,用于依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中視覺詞的相似關(guān)系,將每一分類圖像特征量化為所述視覺詞典中的多個(gè)視覺詞,并確定每一分類圖像特征分別與其量化后的視覺詞的相似系數(shù); 建立模塊,用于依據(jù)每一視覺詞對(duì)應(yīng)不同分類圖像特征的相似系數(shù),確定視覺詞權(quán)重以建立分類視覺詞直方圖; 分類模塊,用于將所述分類視覺詞直方圖輸入預(yù)先根據(jù)大量樣本圖像所建立的樣本視覺詞直方圖進(jìn)行訓(xùn)練生成的圖像分類器中,根據(jù)輸出結(jié)果確定所述待分類圖像的類別。
      9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述量化計(jì)算模塊包括: 模型構(gòu)建模塊,用于依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中視覺詞的相似關(guān)系,按照稀疏編碼方式,構(gòu)建所述分類圖像特征與所述預(yù)先生成的視覺詞典的稀疏編碼模型; 量化計(jì)算模塊,用于通過求解所述稀疏編碼模型,將每一分類圖像特征量化為所述視覺詞典的多個(gè)視覺詞,并得出每一分類圖像特征與其量化后的視覺詞的相似系數(shù); 所述稀疏編碼模型具體為:
      10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述量化計(jì)算模塊包括: 第一計(jì)算模塊,用于依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中視覺詞的相似關(guān)系,計(jì)算每一分類圖像特征分別與所述視覺詞典中的視覺詞的歐式距離; 量化模塊,用于針對(duì)每一分類圖像特征中,確定與其最小歐式距離所對(duì)應(yīng)的,以及與所述最小歐式距離相差預(yù)設(shè)倍數(shù)范圍的歐式距離所對(duì)應(yīng)的視覺詞,作為每一分類圖像特征量化后的視覺詞; 第二計(jì)算模塊,用于根據(jù)每一分類圖像特征與其所量化的視覺詞的歐式距離的大小,計(jì)算分類圖像特征與其量化后的視覺詞的相似系數(shù)。
      11.根據(jù)權(quán)利要求8 10所述的裝置,其特征在于,所述建立模塊具體用于將每一視覺詞對(duì)應(yīng)不同分類圖像特征的相似系數(shù)累加,計(jì)算得出每一視覺詞的權(quán)重,根據(jù)所述視覺詞權(quán)重建立分類視覺詞直方圖。
      12.根據(jù)權(quán)利要求8 10任一項(xiàng)所述的裝置,其特征在于,所述建立模塊包括: 劃分模塊,用于將所述待分類圖像,按照?qǐng)D像金字塔算法劃分為多個(gè)子圖像; 第一建立模塊,用于確定每一子圖像包含的分類圖像特征,并將每一視覺詞對(duì)應(yīng)每一子圖像中所包括的不同分類圖像特征的相似系數(shù)進(jìn)行累加,計(jì)算得出每一子圖像的視覺詞的權(quán)重,建立各子圖像的子分類視覺詞直方圖; 第二建立模塊,用于組合所述每一子分類視覺詞直方圖,形成分類視覺詞直方圖。
      13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述劃分模塊包括: 圖像層劃分模塊,用于按照?qǐng)D像金字塔算法將所述待分類圖像劃分為多層圖像; 子圖像劃分模塊,用于分 別針對(duì)每層圖像進(jìn)行子圖像劃分,形成多個(gè)子圖像。
      全文摘要
      本申請(qǐng)?zhí)峁┝艘环N圖像分類方法和裝置,所述方法包括提取一待分類圖像的分類圖像特征;依據(jù)每一分類圖像特征與預(yù)先生成的視覺詞典中各視覺詞的相似關(guān)系,將每一分類圖像特征量化為所述視覺詞典中的多個(gè)視覺詞,并確定每一分類圖像特征分別與其量化后的視覺詞的相似系數(shù);依據(jù)視覺詞典中每一視覺詞對(duì)應(yīng)不同分類圖像特征的相似系數(shù),確定視覺詞的權(quán)重以建立該待分類圖像的分類視覺詞直方圖;將所述分類視覺詞直方圖輸入預(yù)先根據(jù)大量樣本圖像所建立的樣本視覺詞直方圖進(jìn)行訓(xùn)練生成的圖像分類器中,根據(jù)輸出結(jié)果確定所述待分類圖像的類別。通過本申請(qǐng)實(shí)施例可以提高圖像分類的準(zhǔn)確性,減小分類誤差。
      文檔編號(hào)G06K9/66GK103164713SQ20111041253
      公開日2013年6月19日 申請(qǐng)日期2011年12月12日 優(yōu)先權(quán)日2011年12月12日
      發(fā)明者薛暉 申請(qǐng)人:阿里巴巴集團(tuán)控股有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1