一種基于魯棒多平面支持向量機的圖像識別方法及裝置的制造方法
【技術(shù)領域】
[0001] 本發(fā)明涉及計算機視覺和圖像識別技術(shù)領域,特別是涉及一種基于魯棒多平面支 持向量機的圖像識別方法及裝置。
【背景技術(shù)】
[0002] 隨著計算機技術(shù)和智能化的不斷發(fā)展,圖像識別與分類已經(jīng)發(fā)展成為計算機視覺 與模式識別研宄中的重要研宄課題之一。圖像識別通過計算機將紙質(zhì)圖像數(shù)字化,結(jié)合圖 像分析與描述,獲取圖像特征,在圖像檢索、人臉識別和機器人等研宄領域中有著重大的意 義,一旦研宄成功并投入應用,將產(chǎn)生巨大的社會和經(jīng)濟效益。但是抽取圖像特征的過程 具有一定難度,到目前為止,圖像識別方法距實用要求還有一定距離。目前,大部分研宄工 作集中在處理圖像特征提取和識別問題,且也已取得一定的成果。但是真實世界中的圖像 (例如人臉圖像、手寫體等)通常包含噪音、數(shù)據(jù)破壞、數(shù)據(jù)缺失等問題,因此如何有效減少 數(shù)據(jù)中的噪音或異類對圖像特征提取和圖像識別結(jié)果的不利影響需要進一步深入探討。
[0003] 近年來,鑒于傳統(tǒng)支持向量機(SVM)的優(yōu)越性能和泛化能力,被廣泛應用于數(shù)據(jù) 分類和圖像識別等領域。但是SVM只輸出一個超平面,對一些特殊分布的數(shù)據(jù)(如X0R) 處理效果較差。鑒于此,近年來基于多平面的支持向量機學習技術(shù)被廣泛關(guān)注。最具代表 性的多平面 SVM 學習方法有 GEPSVM(Generalized Proximal SVM)、TWSVM(TWIN SVM)和 MVSVM(Multi-weight Vector Projection SVM)等。但是目前的多平面SVM方法均基于傳 統(tǒng)的2-范數(shù)距離度量,對數(shù)據(jù)中噪音非常敏感。另外,MVSVM還會受模型最優(yōu)參數(shù)選擇的 困擾,且泛化特征值分析過程易遭遇奇異性問題。
[0004] 因此,本發(fā)明提出一種將1-范數(shù)度量應用于多平面支持向量機的圖像識別方法 及裝置,通過對訓練樣本進行魯棒的判別學習,優(yōu)化得到最具鑒別性的魯棒線性分類器,對 圖像數(shù)據(jù)中可能包含的噪音或異類數(shù)據(jù)具有較強的魯棒性和抗干擾性,且延續(xù)了多平面支 持向量的優(yōu)點。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是提供一種基于魯棒多平面支持向量機的圖像識別方法及裝置,目 的在于解決現(xiàn)有技術(shù)中容易受到噪聲干擾、易因參數(shù)選擇造成誤差以及學習系統(tǒng)不穩(wěn)定等 問題。
[0006] 為解決上述技術(shù)問題,本發(fā)明提供一種基于魯棒多平面支持向量機的圖像識別方 法,包括:
[0007] 將測試圖像向魯棒線性分類器進行投影,獲取所述測試圖像對應各個類別的第一 投影特征;其中,所述魯棒線性分類器中的投影向量為通過對訓練樣本集中的多個樣本圖 像進行訓練,將1-范數(shù)度量應用于多平面支持向量機,緊湊類內(nèi)散度矩陣與分離類間散度 矩陣,確定得到的魯棒投影最優(yōu)向量;
[0008] 將訓練樣本集中的樣本圖像的均值向所述魯棒線性分類器進行投影,獲取所述訓 練樣本集均值在各個類別的第二投影特征;
[0009] 分別計算各個類別的第一投影特征與對應類別的第二投影特征的距離;
[0010] 將所述距離的最小值所對應的類別確定為所述測試圖像的類別。
[0011] 可選地,所述魯棒線性分類器中的投影向量為通過對訓練樣本集中的多個樣本圖 像進行訓練,將1-范數(shù)度量應用于多平面支持向量機,緊湊類內(nèi)散度矩陣與分離類間散度 矩陣,確定得到的魯棒投影最優(yōu)向量包括:
[0012] 建立基于1-范數(shù)度量的多平面支持向量機分類器模型;
[0013] 對樣本圖像進行學習,確定以使類內(nèi)距離最小且類間距離最大的魯棒投影最優(yōu)向 量。
[0014] 可選地,所述建立基于1-范數(shù)度量的多平面支持向量機分類器模型包括:
[0015] 獲取預設的圖像數(shù)據(jù)向量集合X= [Χι,χ2,···,Χν] e RnXN,所述集合包括:有 類別標簽的訓練樣本集\= [X PX2,...,X1] e Rnxl以及無類別標簽的測試樣本集Xu= [Xl,X2,…,xu] e Rnxu,且滿足樣本數(shù)量l+u = N ;
[0016] 所述訓練樣本集包括兩個類別的樣本集,A類樣本集A;, = [X1,X2,e Xi 以及為B類樣本集Xb =[.?,…,.vje e X,,且滿足訓練樣本數(shù)量Ijl2= 1。
[0017] 可選地,所述對樣本圖像進行學習,確定以使類內(nèi)距離最小且類間距離最大的魯 棒投影最優(yōu)向量包括:
[0018] 通過迭代優(yōu)化,對魯棒投影最優(yōu)向量&、W2的值不斷更新,使得F (W1)、F(W2)的目 標函數(shù)值最大;在F(W1)、F (W2)最大化到趨于不變時,對應的Wp W2為魯棒投影最優(yōu)向量;
[0019] 其中 ,W1 = arg max F (w ),W11W1 = I,w 2 = arg max F (w 2),W21W2 = 1,
η是圖像數(shù)據(jù)樣本的維度,N是樣本的數(shù)量,WjPw2為所需求得的魯棒投影最優(yōu)向量 W1E RnX1,w2e RnX1,la、1,分別為兩類樣本的數(shù)量,Xi為樣本集合中的單個樣本,I卜I I 1 為1-范數(shù)度量,F(xiàn)(W1)的分母為實現(xiàn)類內(nèi)距離最小、分子為實現(xiàn)類間距離最大。
[0020] 本發(fā)明提供了一種基于魯棒多平面支持向量機的圖像識別裝置,包括:
[0021] 第一獲取模塊,用于將測試圖像向魯棒線性分類器進行投影,獲取所述測試圖像 對應各個類別的第一投影特征;其中,所述魯棒線性分類器中的投影向量為通過訓練模塊 對訓練樣本集中的多個樣本圖像進行訓練,將1-范數(shù)度量應用于多平面支持向量機,確定 得到的魯棒投影最優(yōu)向量;
[0022] 第二獲取模塊,將訓練樣本集中的樣本圖像的均值向所述魯棒線性分類器進行投 影,獲取所述訓練樣本集均值在各個類別的第二投影特征;
[0023] 計算模塊,用于分別計算各個類別的第一投影特征與對應類別的第二投影特征的 距離;
[0024] 確定模塊,用于將所述距離的最小值所對應的類別確定為所述測試圖像的類別。
[0025] 可選地,所述訓練模塊包括:
[0026] 建立模型單元,用于建立基于1-范數(shù)度量的多平面支持向量機分類器模型;
[0027] 確定單元,用于對樣本圖像進行學習,確定以使類內(nèi)距離最小且類間距離最大的 魯棒投影最優(yōu)向量。
[0028] 可選地,所述建立模型單元用于建立基于1-范數(shù)度量的多平面支持向量機分類 器模型包括:
[0029] 所述建立模型單元具體用于獲取預設的圖像數(shù)據(jù)向量集合X = [Xl,x2, . . .,xN] e RnXN,所述集合包括:有類別標簽的訓練樣本集\ = 匕1,&,...,叉1]£1^1以及無類別標簽的測試樣本集乂 11=[叉1,&,...,\]£1^'且滿足 樣本數(shù)量1+u = N ;
[0030] 所述訓練樣本集包括兩個類別的樣本集,A類樣本集Κ.η.λ·:,.....Yje/r" eX£ 以及為8類樣本集1=[.\-|,.\-:,...,.%]£/?";1/:£.丫,.,且滿足訓練樣本數(shù)量1 1+12=1。
[0031] 可選地,所述確定單元用于對樣本圖像進行學習,確定以使類內(nèi)距離最小且類間 距離最大的魯棒投影最優(yōu)向量包括:
[0032] 所述確定單元具體用于通過迭代優(yōu)化,對魯棒投影最優(yōu)向量^、《2的值不斷更新, 使得F (W1)、F (W2)的目標函數(shù)值最大;在F (W1)、F (W2)最大化到趨于不變時,對應的~《2為 魯棒投影最優(yōu)向量;
[0033] 其中,W1 = arg max F (w 丄),W11W1 = I,w 2 = arg max F (w 2),W21W2 = 1,
η是圖像數(shù)據(jù)樣本的維度,N是樣本的數(shù)量,^和《2為所需求得的魯棒投影最優(yōu)向量, W1E RnX1,w2e RnX1,la、1,分別為兩類樣本的數(shù)量,Xi為樣本集合中的單個樣本,I卜I I 1 為1-范數(shù)度量,F(xiàn)(W1)的分母為實現(xiàn)類內(nèi)距離最小、分子為實現(xiàn)類間距離最大。
[0034] 可選地,所述訓練模塊還包括:
[0035] 訓練預處理單元,用于對提取到的樣本圖像進行預處理操作。
[0036]