一種聯(lián)合魯棒主成分特征學(xué)習(xí)與視覺分類方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001 ]本發(fā)明設(shè)及計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域,更具體地說,設(shè)及一種聯(lián)合魯棒主 成分特征學(xué)習(xí)與視覺分類方法及系統(tǒng)。
【背景技術(shù)】
[0002] 在眾多的實(shí)際應(yīng)用中,現(xiàn)實(shí)生活中的許多模式(例如圖像、音頻、視頻等多媒體對 象)均可用高維的屬性或特征進(jìn)行描述,然而高維的數(shù)據(jù)通常含有許多無用的干擾性特征、 冗余特征、W及噪聲數(shù)據(jù)等。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,如何通過特征學(xué)習(xí)或低秩與稀疏 編碼技術(shù)來恢復(fù)原始數(shù)據(jù)或更準(zhǔn)確地描述數(shù)據(jù)已經(jīng)發(fā)展成為計(jì)算機(jī)視覺和圖像處理中非 常重要的一個(gè)研究課題。特征提取的目的在于找到一個(gè)潛在投影或映射,通過將高維的數(shù) 據(jù)變換到一個(gè)描述性更強(qiáng)特征空間,同時(shí)有效保持?jǐn)?shù)據(jù)中的重要幾何特性。
[0003] 最具代表性的數(shù)據(jù)特征提取方法是主成分分析(Principal Component Analysis,簡稱PCA)"PCA是基于變量協(xié)方差矩陣對信息進(jìn)行處理、壓縮和特征抽取的有效 方法。PCA可有效掲示數(shù)據(jù)間的線性關(guān)系,但是基于L2范式的PCA被證明對噪聲或異常非常 敏感。近年來,為了克服PCA的運(yùn)個(gè)缺點(diǎn),一些更加魯棒模型被提出,例如RPCAUobust Principal Component Analysis),基于Ll范式的PCA(PCA-Ll)和基于核范數(shù)的IRPCA (Inductive Robust Principal Component Analysis)等。PCA-Ll通過將PCA中的L2范數(shù)替 換成LI范數(shù)來衡量散度矩陣,因此運(yùn)種方法具有旋轉(zhuǎn)不變性并對噪音和異常值健壯。IRPCA 通過核范式最小化問題來恢復(fù)和表示原始數(shù)據(jù),學(xué)習(xí)得到一個(gè)低秩的投影將給定數(shù)據(jù)映射 到基礎(chǔ)子空間中,進(jìn)而除去或糾正樣本數(shù)據(jù)中可能含有的錯(cuò)誤。和PCA-Ll和IRPCA相比, RPCA無法處理新來數(shù)據(jù),即直推式模型。盡管上述PCA-Ll和IRPCA均能夠有效提升數(shù)據(jù)特征 描述過程中魯棒性,但是發(fā)明人發(fā)現(xiàn),上述技術(shù)方案只考慮了特征提取問題,且在特征提取 的過程中只考慮了數(shù)據(jù)的低秩或稀疏特性,但是卻無法保證提取得到的魯棒特征對于分類 是最優(yōu)的。
[0004] 綜上所述,如何提供一種能夠在進(jìn)行聯(lián)合低秩與稀疏主成分特征提取的同時(shí),確 保得到的聯(lián)合主成分特征對于分類是最優(yōu)的的技術(shù)方案,是目前本領(lǐng)域技術(shù)人員亟待解決 的問題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是提供一種聯(lián)合魯棒主成分特征學(xué)習(xí)與視覺分類方法及系統(tǒng),為了 確保得到的聯(lián)合主成分特征對于分類是最優(yōu)的,本發(fā)明將魯棒主成分特征學(xué)習(xí)、編碼錯(cuò)誤 和基于主成分特征的分類錯(cuò)誤集成到一個(gè)統(tǒng)一的最小化框架,W克服現(xiàn)有技術(shù)中只是單純 關(guān)注于編碼低秩或稀疏主成分特征,且沒有同時(shí)考慮聯(lián)合分類的問題,即本申請能夠在進(jìn) 行聯(lián)合低秩與稀疏主成分特征提取的同時(shí),確保得到的聯(lián)合主成分特征對于分類是最優(yōu) 的。
[0006] -種聯(lián)合魯棒主成分特征學(xué)習(xí)與視覺分類方法,包括:
[0007] 基于訓(xùn)練樣本集,通過將魯棒主成分特征學(xué)習(xí)、編碼錯(cuò)誤和基于主成分特征的分 類錯(cuò)誤集成到一個(gè)統(tǒng)一的最小化框架,可同時(shí)進(jìn)行聯(lián)合低秩與稀疏主成分特征提取和數(shù)據(jù) 糾錯(cuò),且可確保得到的聯(lián)合主成分特征對于分類是最優(yōu)的;為了得到描述性更強(qiáng)的魯棒特 征,同時(shí)考慮了數(shù)據(jù)的魯棒與稀疏特性,同時(shí)將經(jīng)過一個(gè)投影嵌入的特征進(jìn)行低秩和Ll-范 數(shù)最小化,確保提取的特征滿足低秩與稀疏特性;最終得到一個(gè)線性投影矩陣和一個(gè)線性 分類器;其中,所述訓(xùn)練樣本集中包含的訓(xùn)練樣本為已知其類別的樣本;
[0008] 利用所述線性投影矩陣通過嵌入方式提取待測樣本的聯(lián)合低秩與稀疏主成分特 征;其中,所述待測樣本為未知其類別的樣本;
[0009] 將提取到的所述待測樣本對應(yīng)的聯(lián)合低秩與稀疏主成分特征向所述線性分類器 進(jìn)行映射,得到所述待測樣本的軟類別標(biāo)簽,其中包括測試樣本歸屬各個(gè)類別的概率,根據(jù) 所述概率中最大值對應(yīng)的位置,確定為所述待測樣本的類別,完成分類過程。
[0010] 優(yōu)選的,在基于所述待測樣本集得到所述線性投影矩陣及所述線性分類器之前, 還包括:
[0011] 對所述訓(xùn)練樣本集中的訓(xùn)練樣本進(jìn)行預(yù)處理。
[0012] 優(yōu)選的,基于所述待測樣本集得到所述線性投影矩陣及所述線性分類器,包括:
[0013] 按照下列公式將所述訓(xùn)練樣本集分解為一個(gè)聯(lián)合特征矩陣PX和一個(gè)稀疏錯(cuò)誤矩 陣E,并得到所述線性投影矩陣P及所述線性分類器W:
[0014] 總聲圳I* +〇||腳| +尸|礦盧叫I" +義I怎I
[0015] s.t.X = PX+E
[0016] 其中,X表示所述訓(xùn)練樣本集,義=|>1,義2,...,而^]£化^&',]1表示每個(gè)所述訓(xùn)練樣本 的維度,N表示所述訓(xùn)練樣本的數(shù)量,化表示nXN的矩陣空間,MHT-xTpTw||2,i表示基于魯 棒1 2'1范數(shù)度量的分類錯(cuò)誤;QE [0,1]表示用于權(quán)衡低秩主成分特征編碼和稀疏主成分特 征編碼的最小化項(xiàng);丫表示正的權(quán)衡參數(shù),為了衡量分類錯(cuò)誤項(xiàng)||HT-xTpTw| ki的貢獻(xiàn)程 度;A>0表示依賴于錯(cuò)誤或噪音級別的權(quán)衡參數(shù);巧=執(zhí)為Jw]e政"W,表示與所述訓(xùn)練 樣本的類別對應(yīng)的初始標(biāo)簽,C表示所述訓(xùn)練樣本中包含的類別的個(gè)數(shù),政《^表示CXN的矩 陣空間;I IeMi表示稀疏錯(cuò)誤項(xiàng),Il ? II*表示核范數(shù),Il ? 111表示Ii范數(shù),Il ? Iki表示I2 '1范數(shù)。
[0017] 優(yōu)選的,利用所述線性投影矩陣通過嵌入方式提取待測樣本的聯(lián)合低秩與稀疏主 成分特征,包括:
[0018] 將所述待測樣本向所述線性投影矩陣進(jìn)行嵌入,得到對應(yīng)的嵌入結(jié)果即為所述待 測樣本的聯(lián)合低秩與稀疏主成分特征。
[0019] -種聯(lián)合魯棒主成分特征學(xué)習(xí)與視覺分類系統(tǒng),包括:
[0020] 訓(xùn)練模塊,用于:基于訓(xùn)練樣本集,通過將魯棒主成分特征學(xué)習(xí)、編碼錯(cuò)誤和基于 主成分特征的分類錯(cuò)誤集成到一個(gè)統(tǒng)一的最小化框架,可同時(shí)進(jìn)行聯(lián)合低秩與稀疏主成分 特征提取和數(shù)據(jù)糾錯(cuò),且可確保得到的聯(lián)合主成分特征對于分類是最優(yōu)的;為了得到描述 性更強(qiáng)的魯棒特征,同時(shí)考慮了數(shù)據(jù)的魯棒與稀疏特性,同時(shí)將經(jīng)過一個(gè)投影嵌入的特征 進(jìn)行低秩和Ll-范數(shù)最小化,確保提取的特征滿足低秩與稀疏特性;最終得到一個(gè)線性投影 矩陣和一個(gè)線性分類器;其中,所述訓(xùn)練樣本集中包含的訓(xùn)練樣本為已知其類別的樣本;
[0021 ]投影模塊,用于利用所述線性投影矩陣通過嵌入方式提取待測樣本的聯(lián)合低秩與 稀疏主成分特征;其中,所述待測樣本為未知其類別的樣本;
[0022] 分類模塊,用于將提取到的所述待測樣本對應(yīng)的聯(lián)合低秩與稀疏主成分特征向所 述線性分類器進(jìn)行映射,得到所述待測樣本的軟類別標(biāo)簽,其中包括測試樣本歸屬各個(gè)類 別的概率,根據(jù)所述概率中最大值對應(yīng)的位置,確定為所述待測樣本的類別,完成分類過 程。
[0023] 優(yōu)選的,還包括:
[0024] 訓(xùn)練預(yù)處理模塊,用于對所述訓(xùn)練樣本集中的訓(xùn)練樣本進(jìn)行預(yù)處理。
[0025] 優(yōu)選的,訓(xùn)練模塊包括:
[0026] 訓(xùn)練單元,用于按照下列公式將所述訓(xùn)練樣本集分解為一個(gè)聯(lián)合特征矩陣PX和一 個(gè)稀疏錯(cuò)誤矩陣E:
[0027] |^?(1-?)||尸義||*+?|Rr| +/Il巧7' +乂I 應(yīng)I [002引 s.t.X = PX+E
[0029] 其中,X表示所述訓(xùn)練樣本集,X = [.Yi,jc2,...,Xv] E化"<&',n表示每個(gè)所述訓(xùn)練樣本 的維度,N表示所述訓(xùn)練樣本的數(shù)量,ITXW表示n X N的矩陣空間,M HT-XTpTw M 2,1表示基于魯 棒12'1范數(shù)度量的分類錯(cuò)誤;QE [0,1]表示用于權(quán)衡低秩主成分特征編碼和稀疏主成分特 征編碼的最小化項(xiàng);丫表示正的權(quán)衡參數(shù),為了衡量分類錯(cuò)誤項(xiàng)||HT-xTpTw| ki的貢獻(xiàn)程 度;A>0表示依賴于錯(cuò)誤或噪音級別的權(quán)衡參數(shù);巧=化,/;2,...,4^,]€股"'\',表示與所述訓(xùn)練 樣本的類別對應(yīng)的初始標(biāo)簽,C表示所述訓(xùn)練樣本中包含的類別的個(gè)數(shù),吸aw表示CXN的矩 陣空間;I IeMi表示稀疏錯(cuò)誤項(xiàng),Il ? II*表示核范數(shù),Il ? 111表示Ii范數(shù),Il ? Iki表示I2 '1范數(shù)。
[0030] 優(yōu)選的,投影模塊包括:
[0031] 投影單元,用于將所述待測樣本向所述線性投影矩陣進(jìn)行嵌入,得到對應(yīng)的嵌入 結(jié)果即為所述待測樣本的聯(lián)合低秩與稀疏主成分特征。
[0032] 經(jīng)由本發(fā)明公開的上述技術(shù)方案可知,與現(xiàn)有技術(shù)相比,本發(fā)明公開了一種聯(lián)合 魯棒主成分特征學(xué)習(xí)與視覺分類的新方案,通過對訓(xùn)練樣本運(yùn)用該方案進(jìn)行聯(lián)合訓(xùn)練