一種魯棒視覺圖像分類方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,更具體地說,涉及一種魯棒視覺圖像分類方法及 系統(tǒng)。
【背景技術(shù)】
[0002] 分類技術(shù)一直是數(shù)據(jù)挖掘中最根本、最核心的研究課題。近年,分類技術(shù)發(fā)展迅 速,涌現(xiàn)了許多優(yōu)秀的分類方法,如SVM,決策樹,關(guān)聯(lián)規(guī)則,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等等。許多 分類系統(tǒng)已經(jīng)投入使用并產(chǎn)生了巨大的社會、經(jīng)濟(jì)效益。而標(biāo)簽傳播領(lǐng)域出現(xiàn)了一種基于 投影的快速誘導(dǎo)式分類方法,大大提高了標(biāo)簽傳播分類的精確度和速度。
[0003] 標(biāo)簽傳播分類是一種基于相似圖構(gòu)造的半監(jiān)督學(xué)習(xí)方法。在實(shí)際操作中,用于監(jiān) 督學(xué)習(xí)的監(jiān)督數(shù)據(jù)(具有類別標(biāo)簽的數(shù)據(jù))十分稀缺,只能通過人工來標(biāo)定,而這會耗費(fèi)大 量的時(shí)間及人力;但是大量的不具有類別標(biāo)簽的數(shù)據(jù)卻能輕易收集到,因此半監(jiān)督學(xué)習(xí)具 有極高的實(shí)用價(jià)值與現(xiàn)實(shí)意義。在半監(jiān)督學(xué)習(xí)中,標(biāo)簽傳播分類因其快速、有效、簡單的優(yōu) 點(diǎn)而引起人們的廣泛關(guān)注。但是,大多數(shù)標(biāo)簽傳播分類的方法均采用誘導(dǎo)式分類方法來實(shí) 現(xiàn),而誘導(dǎo)式分類方法由于其近鄰選擇會導(dǎo)致分類速度較慢。
[0004] 綜上所述,現(xiàn)有技術(shù)中的標(biāo)簽傳播分類的方法存在分類速度較慢的問題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是提供一種魯棒視覺圖像分類方法及系統(tǒng),以解決現(xiàn)有技術(shù)的標(biāo)簽 傳播分類的方法中存在的分類速度較慢的問題。
[0006] 為了實(shí)現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:
[0007] -種魯棒視覺圖像分類方法,包括:
[0008] 步驟1 :基于近鄰定義及重構(gòu)權(quán)的構(gòu)造方法對預(yù)先獲取的訓(xùn)練集中的訓(xùn)練樣本進(jìn) 行處理,得到相似度量矩陣,對所述相似度量矩陣進(jìn)行預(yù)設(shè)處理,得到重構(gòu)系數(shù)矩陣,所述 訓(xùn)練樣本包括已知其類別并標(biāo)定有與其類別對應(yīng)的類別標(biāo)簽的有標(biāo)簽樣本及未知其類別 且未標(biāo)定有類別標(biāo)簽的無標(biāo)簽樣本;根據(jù)每個(gè)所述訓(xùn)練樣本的類別標(biāo)簽確定初始類別標(biāo)簽 矩陣;
[0009] 步驟2 :基于所述重構(gòu)系數(shù)矩陣及所述初始類別標(biāo)簽矩陣,將歸一化流形正則化 項(xiàng)、標(biāo)簽擬合項(xiàng)及彈性回歸殘差項(xiàng)集成到統(tǒng)一的標(biāo)簽傳播模型的框架中,并利用參數(shù)權(quán)衡 所述歸一化流形正則化項(xiàng)、標(biāo)簽擬合項(xiàng)及彈性回歸殘差項(xiàng)的貢獻(xiàn)程度,通過迭代優(yōu)化所述 標(biāo)簽傳播模型獲得投影矩陣及與所述訓(xùn)練樣本的類別對應(yīng)的軟標(biāo)簽矩陣;
[0010] 步驟3 :利用所述投影矩陣對待測樣本進(jìn)行映射,得到與所述待測樣本的類別對 應(yīng)的軟標(biāo)簽;所述待測樣本為未知其類別且未標(biāo)定類別標(biāo)簽的樣本。
[0011] 優(yōu)選的,步驟2包括:
[0012] 利用下列公式計(jì)算所述投影矩陣及所述軟標(biāo)簽矩陣:
[0013]
[0014] Subj 0, e T fi= 1 for i = 1, 2, . . . , 1+u
[0015] 其中,F(xiàn)表示軟標(biāo)簽矩陣,P表示投影矩陣,b表示彈性常量;W表示重構(gòu)系數(shù)矩 陣,Wu表示訓(xùn)練樣本X ^勺近鄰訓(xùn)練樣本X ,對訓(xùn)練樣本X i的協(xié)同重構(gòu)權(quán)重;D是一個(gè)對角 矩陣,其對角元素 D"= ΣfeR"1為軟標(biāo)簽矩陣F中的一列,其最大值元素所在位 置對應(yīng)的軟標(biāo)簽為訓(xùn)練樣本軟標(biāo)簽,其中的肢表示c乘以1的矩陣空間;r1為矩陣
的一個(gè)行向量,其中的P+e紀(jì)' -f表示回歸 余數(shù)項(xiàng),而Μ(/+Μ>Λ表示1+u乘以c的矩陣空間;μι,α,β和γ均為大于零的參數(shù),用于權(quán) 衡所述歸一化流形正則化項(xiàng)、標(biāo)簽擬合項(xiàng)及彈性回歸殘差項(xiàng)的貢獻(xiàn)程度。
[0016] 優(yōu)選的,步驟2包括:
[0017] 利用下列公式計(jì)算所述投影矩陣及所述軟標(biāo)簽矩陣:
[0020] 其中,F(xiàn)表示軟標(biāo)簽矩陣,Ρ表示投影矩陣,b表示彈性常量;W表示重構(gòu)系數(shù)矩陣, Wh ,表示訓(xùn)練樣本X滿近鄰訓(xùn)練樣本X ,對訓(xùn)練樣本X i的協(xié)同重構(gòu)權(quán)重;D是一個(gè)對角矩陣, 其對角元素 D"= Σ AjL = D 1/2(D-W)D 1/2= I-D 1/2WD 1/2,其是一個(gè)歸一化的拉普拉斯矩 陣;U是一個(gè)對角矩陣,其對角元素為μ 1;α,β和γ均為大于零的參數(shù),用于權(quán)衡所述歸 一化流形正則化項(xiàng)、所述標(biāo)簽擬合項(xiàng)及所述彈性回歸殘差項(xiàng)的貢獻(xiàn)程度;Υ表示初始類別 標(biāo)簽矩陣,X表示原始的訓(xùn)練集,e為自然常數(shù)。
[0021] 優(yōu)選的,所述對所述相似度量矩陣進(jìn)行預(yù)設(shè)處理,得到重構(gòu)系數(shù)矩陣,包括:
[0022] 利用下列公式對所述相似度量矩陣進(jìn)行對稱化處理:
[0024] 利用下列公式對所述相似度量矩陣進(jìn)行歸一化處理:
[0026] 其中,f表示相似度量矩陣,i為對角矩陣,對角元素
[0027] 優(yōu)選的,步驟3包括:
[0028] 獲取待測樣本x1;
[0029] 利用PTXl將所述待測樣本X 入到投影矩陣P中,得到預(yù)測向量;
[0030] 確定所述預(yù)測向量中最大概率的元素對應(yīng)的軟標(biāo)簽即為所述待測樣本Xi的軟標(biāo) 簽。
[0031] 優(yōu)選的,所述基于近鄰定義及重構(gòu)權(quán)的構(gòu)造方法對預(yù)先獲取的訓(xùn)練集中的訓(xùn)練樣 本進(jìn)行處理,得到相似度量矩陣,包括:
[0032] 利用K近鄰算法對每個(gè)所述訓(xùn)練樣本進(jìn)行處理,得到每個(gè)訓(xùn)練樣本的K個(gè)最近鄰 樣本,Κ為正整數(shù);
[0033] 采用LLE-重構(gòu)權(quán)的構(gòu)造方法利用所述訓(xùn)練樣本及每個(gè)所述訓(xùn)練樣本的Κ個(gè)最近 鄰樣本獲取與所述訓(xùn)練樣本對應(yīng)的相似度量矩陣。
[0034] 優(yōu)選的,所述根據(jù)每個(gè)所述訓(xùn)練樣本的類別標(biāo)簽確定初始類別標(biāo)簽矩陣,包括:
[0035] 初始化定義一個(gè)行數(shù)為c、列數(shù)為Ν的矩陣Υ ;
[0036] 對于任一有標(biāo)簽樣本若該有標(biāo)簽樣本Xj屬于第i類,則Υ ^ j= 1,若有標(biāo)簽樣 本Xj不屬于第i類,則Υ 〇 ;對于任一無標(biāo)簽樣本X _j,則Υ?」=0。
[0037] -種魯棒視覺圖像分類系統(tǒng),包括:
[0038] 預(yù)處理模塊,用于:基于近鄰定義及重構(gòu)權(quán)的構(gòu)造方法對預(yù)先獲取的訓(xùn)練集中的 訓(xùn)練樣本進(jìn)行處理,得到相似度量矩陣,對所述相似度量矩陣進(jìn)行預(yù)設(shè)處理,得到重構(gòu)系數(shù) 矩陣,所述訓(xùn)練樣本包括已知其類別并標(biāo)定有與其類別對應(yīng)的類別標(biāo)簽的有標(biāo)簽樣本及未 知其類別且未標(biāo)定有類別標(biāo)簽的無標(biāo)簽樣本;根據(jù)每個(gè)所述訓(xùn)練樣本的類別標(biāo)簽確定初始 類別標(biāo)簽矩陣;
[0039] 訓(xùn)練模塊,用于:基于所述重構(gòu)系數(shù)矩陣及所述初始類別標(biāo)簽矩陣,將歸一化流形 正則化項(xiàng)、標(biāo)簽擬合項(xiàng)及彈性回歸殘差項(xiàng)集成到統(tǒng)一的標(biāo)簽傳播模型的框架中,并利用參 數(shù)權(quán)衡所述歸一化流形正則化項(xiàng)、標(biāo)簽擬合項(xiàng)及彈性回歸殘差項(xiàng)的貢獻(xiàn)程度,通過迭代優(yōu) 化所述標(biāo)簽傳播模型獲得投影矩陣及與所述訓(xùn)練樣本的類別對應(yīng)的軟標(biāo)簽矩陣;
[0040] 測試模塊,用于:利用所述投影矩陣對待測樣本進(jìn)行映射,得到與所述待測樣本的 類別對應(yīng)的軟標(biāo)簽;所述待測樣本為未知其類別且未標(biāo)定類別標(biāo)簽的樣本。
[0041] 本發(fā)明提供了一種魯棒視覺圖像分類方法及系統(tǒng),該方法包括:步驟1 :基于近鄰 定義及重構(gòu)權(quán)的構(gòu)造方法對預(yù)先獲取的訓(xùn)練集中的訓(xùn)練樣本進(jìn)行處理,得到相似度量矩 陣,對所述相似度量矩陣進(jìn)行預(yù)設(shè)處理,得到重構(gòu)系數(shù)矩陣,所述訓(xùn)練樣本包括已知其類別 并標(biāo)定有與其類別對應(yīng)的類別標(biāo)簽的有標(biāo)簽樣本及未知其類別且未標(biāo)定有類別標(biāo)簽的無 標(biāo)簽樣本;根據(jù)每個(gè)所述訓(xùn)練樣本的類別標(biāo)簽確定初始類別標(biāo)簽矩陣;步驟2 :基于所述重 構(gòu)系數(shù)矩陣及所述初始類別標(biāo)簽矩陣,將歸一化流形正則化項(xiàng)、標(biāo)簽擬合項(xiàng)及彈性回歸殘 差項(xiàng)集成到統(tǒng)一的標(biāo)簽傳播模型的框架中,并利用參數(shù)權(quán)衡所述歸一化流形正則化項(xiàng)、標(biāo) 簽擬合項(xiàng)及彈性回歸殘差項(xiàng)的貢獻(xiàn)程度,通過迭代優(yōu)化所述標(biāo)簽傳播模型獲得投影矩陣及 與所述訓(xùn)練樣本的類別對應(yīng)的軟標(biāo)簽矩陣;步驟3 :利用所述投影矩陣對待測樣本進(jìn)行映 射,得到與所述待測樣本的類別對應(yīng)的軟標(biāo)簽;所述待測樣本為未知其類別且未標(biāo)定類別 標(biāo)簽的樣本。
[0042]與現(xiàn)有技術(shù)相比,本發(fā)明公開的一種魯棒視覺圖像分類方法,為了有效實(shí)現(xiàn)訓(xùn)練 樣本內(nèi)無標(biāo)簽樣本的類別預(yù)測和待測樣本的快速歸納與合理降維,通過將基于彈性回歸分 析的誤差度量集成到訓(xùn)練樣本外的標(biāo)簽傳播模型,并通過參數(shù)權(quán)衡歸一化流形正則化項(xiàng)、 基于軟標(biāo)簽12ι1范數(shù)正則化的標(biāo)簽擬合項(xiàng)及基于12」范數(shù)正則化的彈性回歸殘差項(xiàng)對樣本 描述及類別鑒定的影響,完成標(biāo)簽傳播模型的建立;進(jìn)而通過對標(biāo)簽傳播模型的迭代優(yōu)化 獲取用于確定待測樣本的類別的投影矩陣。因此,本申請中通過引入基于12ι1范數(shù)正則化的 回歸誤差項(xiàng)及軟標(biāo)簽12ι1范數(shù)正則化,能夠在繼承標(biāo)簽傳播分類方法的優(yōu)點(diǎn)的同時(shí)有效提 高了系統(tǒng)的魯棒性,使待測樣本的歸納過程快速且精確,另外,增強(qiáng)了系統(tǒng)的可拓展性。即, 本發(fā)明提供的一種魯棒視覺圖像分類方法及系統(tǒng),能夠在提高分類性能的同時(shí)大大提高誘 導(dǎo)式過程的速度。
【附圖說明】
[0043] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù) 提供的附圖獲得其他的附圖。
[0044] 圖1為本發(fā)明實(shí)施例提供的一種魯棒視覺圖像分類