,Cj為相鄰的類;
[0011] 步驟三:建立一個(gè)大小為叫%的矩陣G,用于存儲(chǔ)步驟二中得到的任意兩個(gè)相鄰 的類之間樣本與樣本的關(guān)系,矩陣G初始化為全零,其中l(wèi)vnj為屬于任意兩個(gè)相鄰的類 Ci, Cj樣本的數(shù)目;
[0012] 步驟四:對于屬于(^的任意一個(gè)樣本c ik計(jì)算其與屬于c」的任意樣本c ^的相關(guān) 系數(shù)Pkl,如果兩個(gè)樣本的相關(guān)系數(shù)大于或等于cik與c 2上所有樣本的相關(guān)系數(shù)的均值m,即 Pkl> m,則置矩陣G中對應(yīng)位置上G (i,j) = 1,遍歷屬于c i的所有的樣本,由于相關(guān)系數(shù)的 性質(zhì)可知,G為對稱矩陣,即同時(shí)可以得到屬于的每個(gè)樣本與屬于c i的每個(gè)樣本之間的 關(guān)系;
[0013] 步驟五:按行掃描G,使用集合freq記錄每行中1所在的位置,也就是對應(yīng)樣本在 q類中的下標(biāo)號(hào),統(tǒng)計(jì)freq中一共出現(xiàn)多少個(gè)互異的樣本以及每個(gè)樣本出現(xiàn)的次數(shù),如果 某個(gè)樣本出現(xiàn)的次數(shù)大于或等于平均次數(shù)T,T = freq中樣本的總數(shù)目/互異的樣本數(shù)目, 則認(rèn)為該樣本與Ci類相鄰,并置這兩類的類間權(quán)重矩陣B對應(yīng)位置上B (i,j) = 1 ;
[0014] 步驟六:按列掃描G,使用集合freq記錄每列中1所在的位置,也就是對應(yīng)樣本在 Cj類中的下標(biāo)號(hào),統(tǒng)計(jì)freq中一共出現(xiàn)多少個(gè)互異的樣本以及每個(gè)樣本出現(xiàn)的次數(shù),如果 某個(gè)樣本出現(xiàn)的次數(shù)大于或等于平均次數(shù)T,T = freq中樣本的總數(shù)目/互異的樣本數(shù)目, 則認(rèn)為該樣本與h類相鄰,并置這兩類的類間權(quán)重矩陣B對應(yīng)位置上B (i,j) = 1 ;
[0015] 步驟七:根據(jù)步驟一和步驟六得到的類內(nèi)權(quán)重矩陣和類間權(quán)重矩陣,建立類內(nèi)散 布矩陣和類間散布矩陣,組成目標(biāo)函數(shù),在Fisher準(zhǔn)則下求解目標(biāo)函數(shù),得到最優(yōu)投影方 向,在此方向?qū)颖具M(jìn)行投影,完成特征提取。
[0016] 本發(fā)明與現(xiàn)有技術(shù)相比,本發(fā)明克服了現(xiàn)存的特征提取算法中存在的的需要設(shè)置 參數(shù)的問題,實(shí)現(xiàn)了自適應(yīng)無參數(shù)的特征提取算法。其優(yōu)點(diǎn)在于:
[0017] (1)為了減小圖像中噪聲的影響,使用相關(guān)系數(shù)替代傳統(tǒng)的歐式距離去衡量樣本 之間的關(guān)系。
[0018] (2)對于同一類樣本,依據(jù)樣本相關(guān)系數(shù)的均值和各個(gè)相關(guān)系數(shù)之間的關(guān)系自適 應(yīng)的建立類內(nèi)權(quán)重矩陣,實(shí)現(xiàn)建立類內(nèi)權(quán)重矩陣時(shí)的無參數(shù)化。
[0019] (3)對于不同類,依據(jù)類與類之間相關(guān)系數(shù)的關(guān)系自適應(yīng)的選擇出相互近鄰的類。 [0020] (4)對于任意兩個(gè)相鄰的類,采用基于相關(guān)系數(shù)的方法自適應(yīng)的選擇出更加能反 映出兩者關(guān)系的樣本來建立類間權(quán)重矩陣,實(shí)現(xiàn)建立類間權(quán)重矩陣時(shí)的無參數(shù)化。
[0021] 得到類內(nèi)權(quán)重矩陣和類間權(quán)重矩陣后,建立類內(nèi)散布矩陣和類間散布矩陣用于描 述類內(nèi)的局部結(jié)構(gòu)和類間的離散性,在Fisher準(zhǔn)則下求得一個(gè)最優(yōu)的投影方向,在此投影 方向上類間散布矩陣達(dá)到最大的同時(shí)類內(nèi)散布矩陣達(dá)到最小,從而完成特征提取。
【附圖說明】
[0022] 圖1是兩個(gè)相鄰類樣本之間相互關(guān)系的示意圖。
[0023] 圖2是本發(fā)明算法得到的矩陣G。
[0024] 圖3是AR數(shù)據(jù)集中兩個(gè)人的人臉圖像。
[0025] 圖4是紅外數(shù)據(jù)集中人和杯子不同姿態(tài)下的圖像。
[0026] 圖5是PIE數(shù)據(jù)集中兩個(gè)人不同姿態(tài)下的圖像。
【具體實(shí)施方式】
[0027] 假設(shè)樣本為X= [Xl,x2,...,xN] e Rm,一共有C類,每一類的樣本數(shù)目為叫,其中 i〈 = C,特征提取之后的對應(yīng)的樣本為Y = [yi,y2,…,yN] G Rd,其中d〈〈m,最優(yōu)投影矩陣 為 A,即 Y = At*X。
[0028] 原始的LPP算法以及由其衍生出的一些算法普遍存在著兩個(gè)明顯的缺陷:①原始 LPP是一種非監(jiān)督的算法,不能有效的利用不同類別之間的類別信息,這樣將其直接運(yùn)用于 分類時(shí),分類的效果不會(huì)很理想;②LPP的參數(shù)的選擇問題,對于同一個(gè)數(shù)據(jù)集如果LPP的 參數(shù)不一樣,最終的結(jié)果也不一樣。針對LPP存在的問題本文提出了一種新的基于LPP的 無參數(shù)特征提取算法。
[0029] 本發(fā)明的出發(fā)點(diǎn)是在盡量分開不同類的同時(shí)保持類內(nèi)局部關(guān)系不變。為此需要更 加準(zhǔn)確的衡量不同類之間的離散性,在LDA中使用每一類的均值和總的均值來衡量不同類 之間的離散性,但是由于類內(nèi)數(shù)據(jù)分布的不確定性,類均值不能很好的反映整個(gè)類上的數(shù) 據(jù)分布,因此用于計(jì)算出的類間散布矩陣就會(huì)有差錯(cuò)。在CMVM中,則是將兩類之間的全部 數(shù)據(jù)都不加區(qū)分的都考慮進(jìn)來,這樣雖然能將真正近鄰的數(shù)據(jù)包含進(jìn)來,但是同時(shí)也會(huì)將 許多不需要考慮的樣本帶入進(jìn)來,會(huì)干擾有用的信息,不利于后續(xù)的處理。在MMDA中,使用 每一類的類內(nèi)權(quán)重矩陣的和去加權(quán)該類的均值,然后使得類間散布矩陣達(dá)到最小,其本質(zhì) 上還是使用類內(nèi)均值去處理,不能完全的反映數(shù)據(jù)之間的信息。而在真是的數(shù)據(jù)之中,任意 兩類數(shù)據(jù)之間往往只是有一部分?jǐn)?shù)據(jù)距離較近,其他的部分距離相對較遠(yuǎn),為此,只要能找 出兩類數(shù)據(jù)之間距離較近的部分,然后使用這些距離較近的樣本進(jìn)行處理即可。
[0030] 由于真實(shí)的圖像的數(shù)據(jù)包含一定的噪聲,尤其是對于一些低照度下采集的圖像, 直接使用歐式距離來衡量兩幅圖像之間的距離在某些情況下可能會(huì)出現(xiàn)差錯(cuò),為了使這種 影響能夠達(dá)到最小同時(shí)為了能夠?qū)崿F(xiàn)自適應(yīng)和無參數(shù)化,使用樣本的相關(guān)性去衡量兩個(gè)樣 本之間的相似性,從而來實(shí)現(xiàn)參數(shù)的自適應(yīng)選擇。
[0031] 步驟一:計(jì)算任意兩個(gè)樣本之間的相關(guān)系數(shù)Pm如公式(1)所示。
[0032]
【主權(quán)項(xiàng)】
1. 一種自適應(yīng)無參數(shù)的特征提取方法,其特征在于包括w下步驟: 步驟一;計(jì)算任意兩個(gè)樣本之間的相關(guān)系數(shù)Pu,使用增強(qiáng)的無參數(shù)的局部保留算法建 立全部樣本所屬類的類內(nèi)權(quán)重矩陣W ; 步驟二;尋找相鄰類;依據(jù)步驟一中得到的相關(guān)系數(shù)Pu構(gòu)成的矩陣P,計(jì)算任意一類Ci 與其他所有類的相關(guān)系數(shù)的平均值IV計(jì)算任意一類Ci與某一類C j.的相關(guān)系數(shù)的平均值 m。,如果叫m i 1,則認(rèn)為Ci、Cj為相鄰的類; 步驟建立一個(gè)大小為的矩陣G,用于存儲(chǔ)步驟二中得到的任意兩個(gè)相鄰的類 之間樣本與樣本的關(guān)系,矩陣G初始化為全零,其中ni A為屬于任意兩個(gè)相鄰的類Ci、Cj梓 本的數(shù)目; 步驟四:對于屬于Ci的任意一個(gè)樣本C ik計(jì)算其與屬于C j的任意一個(gè)樣本C ji的相關(guān) 系數(shù)Pkl,如果該兩個(gè)樣本的相關(guān)系數(shù)Pkl,大于或等于Cik與屬于C j.的所有樣本的相關(guān)系數(shù) 的均值m,即Pki> m,則置矩陣G中對應(yīng)位置上G(i,如=1,遍歷屬于C i的所有的樣本,得 到屬于Ci的每個(gè)樣本與屬于C j.的每個(gè)樣本之間的關(guān)系,由于相關(guān)系數(shù)的性質(zhì)可知,G為對 稱矩陣,即同時(shí)可W得到屬于Cj.的每個(gè)樣本與屬于C i的每個(gè)樣本之間的關(guān)系; 步驟五:按行掃描G,使用集合化eq記錄每行中1所在的位置,也就是對應(yīng)樣本在Ci類 中的下標(biāo)號(hào),統(tǒng)計(jì)化eq中一共出現(xiàn)多少個(gè)互異的樣本W(wǎng)及每個(gè)樣本出現(xiàn)的次數(shù),如果某個(gè) 樣本出現(xiàn)的次數(shù)大于或等于平均次數(shù)T,T =化eq中樣本的總數(shù)目/互異的樣本數(shù)目,則認(rèn) 為該樣本與Ci類相鄰,并置該兩類的類間權(quán)重矩陣B對應(yīng)位置上B (i,j) = 1 ; 步驟六:按列掃描G,使用新的集合化eql記錄每列中1所在的位置,也就是對應(yīng)樣本 在Cj.類中的下標(biāo)號(hào),統(tǒng)計(jì)化eql中一共出現(xiàn)多少個(gè)互異的樣本W(wǎng)及每個(gè)樣本出現(xiàn)的次數(shù), 如果某個(gè)樣本出現(xiàn)的次數(shù)大于或等于平均次數(shù)T1,T1 =化eql中樣本的總數(shù)目/互異的樣 本數(shù)目,則認(rèn)為該樣本與Cj.類相鄰,并置該兩類的類間權(quán)重矩陣B對應(yīng)位置上B (i,j) = 1 ; 步驟走;根據(jù)步驟一和步驟六得到的類內(nèi)權(quán)重矩陣W和類間權(quán)重矩陣B,建立類內(nèi)散布 矩陣和類間散布矩陣,組成目標(biāo)函數(shù),在Fisher準(zhǔn)則下求解目標(biāo)函數(shù),得到最優(yōu)投影方向, 在此方向?qū)颖具M(jìn)行投影,完成特征提取。
【專利摘要】本發(fā)明公開了一種新的無參數(shù)的有監(jiān)督的特征提取算法。該發(fā)明在原有的特征提取算法的基礎(chǔ)上對其進(jìn)行改進(jìn),使之更加合理。首先該發(fā)明使用相關(guān)系數(shù)描述樣本之間的相似性,通過建立類內(nèi)散布矩陣來描述流形的局部結(jié)構(gòu),然后根據(jù)類與類之間相關(guān)系數(shù)的關(guān)系建立類間散布矩陣去描述流形之間的離散關(guān)系,最后建立目標(biāo)函數(shù)使用Fisher準(zhǔn)則對其進(jìn)行求解,使其在達(dá)到類內(nèi)散布矩陣最小的同時(shí),類間散布矩陣達(dá)到最大,在整個(gè)過程中不需要人為設(shè)定任何參數(shù),實(shí)現(xiàn)了無參數(shù)化。在三個(gè)數(shù)據(jù)庫上的實(shí)驗(yàn)表明該發(fā)明的識(shí)別率較原始算法有所提高,達(dá)到了預(yù)期的效果。
【IPC分類】G06K9-62
【公開號(hào)】CN104573714
【申請?zhí)枴緾N201410850457
【發(fā)明人】柏連發(fā), 張毅, 趙壯, 韓靜, 岳江, 陳錢, 顧國華
【申請人】南京理工大學(xué)
【公開日】2015年4月29日
【申請日】2014年12月31日