一種基于圖像空間金字塔特征包的手勢(shì)識(shí)別方法
【專利摘要】本發(fā)明涉及一種基于圖像空間金字塔特征包的手勢(shì)識(shí)別方法,包括以下步驟:對(duì)帶有手勢(shì)的圖像進(jìn)行手勢(shì)分割;對(duì)分割出來的手勢(shì)圖像進(jìn)行特征提取和描述;利用提取的特征訓(xùn)練直方圖相交核支持向量機(jī),并根據(jù)支持向量機(jī)得到該手勢(shì)圖像的特征向量所屬的手勢(shì)類別,實(shí)現(xiàn)手勢(shì)識(shí)別。本發(fā)明利用空間金字塔算法與特征包算法相結(jié)合,描述了手勢(shì)圖像特征點(diǎn)的全局?jǐn)?shù)量特性與分布特性;利用直方圖相交核支持向量機(jī)實(shí)現(xiàn)了手勢(shì)特征的分類,進(jìn)而實(shí)現(xiàn)了手勢(shì)識(shí)別;提高了識(shí)別多類相似手勢(shì)的識(shí)別率。
【專利說明】一種基于圖像空間金字塔特征包的手勢(shì)識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于圖像處理與模式識(shí)別領(lǐng)域,具體涉及一種基于圖像特征提取與支持向 量機(jī)的手勢(shì)識(shí)別方法。
【背景技術(shù)】
[0002] 現(xiàn)代人機(jī)交互方式正朝著一種更和諧、自然地方向發(fā)展。人機(jī)交互研究的一個(gè)熱 點(diǎn)問題是使得用戶可以方便、自然地使用人類所熟知的方式使用計(jì)算機(jī)。手勢(shì)語言具有簡(jiǎn) 潔、直觀的特點(diǎn),是人機(jī)交互方式的一種有效擴(kuò)展,在智能家電控制,機(jī)器人控制,手語識(shí) 另IJ,計(jì)算機(jī)游戲控制等方面有著廣泛的應(yīng)用。
[0003] 手勢(shì)識(shí)別的關(guān)鍵技術(shù)在于手勢(shì)圖像的特征提取與手勢(shì)識(shí)別兩個(gè)步驟。當(dāng)前最常用 的圖像特征提取的方法有利用邊緣特征像素點(diǎn)特征提取,利用傅里葉算子描述手勢(shì)特征, 利用手掌手指的空間分布特性表示手勢(shì),利用基于圖像特征包算法的手勢(shì)圖像特征提取。
[0004] 在手勢(shì)特征提取階段,現(xiàn)有技術(shù)的主要問題為:
[0005] (1)利用邊緣特征像素點(diǎn)特征提取。不能對(duì)尺度、旋轉(zhuǎn)、光照變化保持不變性,必須 收集各種情況下的手勢(shì)訓(xùn)練樣本。詳見:張國(guó)良,吳江琴,高文等.基于Hausdorff距離 的手勢(shì)識(shí)別[J].吉林圖象圖形學(xué)報(bào),2002, 7 (7) :1144-1150
[0006] (2)利用傅里葉算子描述手勢(shì)特征和利用手掌手指的空間分布特性表示手勢(shì), 這兩種方法解決了特征對(duì)尺度、旋轉(zhuǎn)、光照的適應(yīng)性,但運(yùn)算量大,運(yùn)算時(shí)間消耗長(zhǎng)。詳 見:葛元,郭興偉,王林泉.傅立葉描述子在手勢(shì)識(shí)別中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟 件,2005, 6(22) :91-93
[0007] 張汗靈,李紅英,周敏.融合多特征和壓縮感知的手勢(shì)識(shí)別[J].湖南大學(xué)學(xué)報(bào) (自然科學(xué)版),2013, 3 (40) :87-92
[0008] (3)利用基于圖像特征包(Bag of Features,BoF)算法的提取手勢(shì)圖像特征。該算 法較為有效。缺點(diǎn)是該算法只描述了手勢(shì)圖像的特征點(diǎn)的數(shù)量信息,而忽略了特征點(diǎn)的空 間分布特性。不能很好的識(shí)別相似的手勢(shì)。詳見:陳小波,謝秋生.基于Bag of Features 的手勢(shì)識(shí)別[J].計(jì)算機(jī)工程與設(shè)計(jì),2013, 3(34) :983-988
[0009] 當(dāng)前最常用的手勢(shì)識(shí)別的方法有:
[0010] (1)基于模板匹配的方法。(2)基于Adaboost的方法。通過一系列弱分類器構(gòu)成 一個(gè)強(qiáng)分類器,實(shí)現(xiàn)手勢(shì)識(shí)別。(3)基于支持向量機(jī)的方法。手勢(shì)識(shí)別通常為線性不可分的 樣本,支持向量機(jī)解決線性不可分樣本的方法是通過核函數(shù),將線性不可分樣本通過核函 數(shù)映射到線性可分的空間上,實(shí)現(xiàn)樣本分類。
[0011] 存在的主要技術(shù)問題為:
[0012] (1)模板匹配需要大量訓(xùn)練圖像,計(jì)算速度慢。(2)Adaboost分類器設(shè)計(jì)復(fù)雜,計(jì) 算量大,計(jì)算速度慢。詳見:丁友東,龐海波,吳學(xué)純等.一種用于手勢(shì)識(shí)別的局部均值模 式紋理描述子[J].應(yīng)用科學(xué)學(xué)報(bào),2013,(5) :526-532。(3)支持向量機(jī)能夠很好的解決線 性不可分,小樣本的分類問題。但選用的核函數(shù)及核函數(shù)的參數(shù)對(duì)識(shí)別結(jié)果影響較大。
【發(fā)明內(nèi)容】
[0013] 為了克服上述現(xiàn)有技術(shù)存在的不足,本發(fā)明設(shè)計(jì)了一種基于圖像特征提取與支持 向量機(jī)的手勢(shì)識(shí)別方法。
[0014] 本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:一種基于圖像空間金字塔特征包的 手勢(shì)識(shí)別方法,包括以下步驟:
[0015] 對(duì)帶有手勢(shì)的圖像進(jìn)行手勢(shì)分割;
[0016] 對(duì)分割出來的手勢(shì)圖像進(jìn)行特征提取和描述;
[0017] 利用提取的特征訓(xùn)練直方圖相交核支持向量機(jī),并根據(jù)支持向量機(jī)得到該手勢(shì)圖 像的特征向量所屬的手勢(shì)類別,實(shí)現(xiàn)手勢(shì)識(shí)別。
[0018] 所述對(duì)分割出來的手勢(shì)圖像進(jìn)行特征提取和描述包括以下步驟:
[0019] (2. 1)將手勢(shì)圖像構(gòu)造成三層手勢(shì)圖像,第一層將整張手勢(shì)圖像劃分為16個(gè)子 塊,第二層將整張手勢(shì)圖像劃分為4個(gè)子塊,第三層為整張手勢(shì)圖像;
[0020] (2. 2)將第三層的整張手勢(shì)圖像均勻分成若干個(gè)像素為16X 16的小塊,對(duì)每個(gè)小 塊生成尺度不變特征變換描述子;
[0021] (2. 3)將特征變換描述子用聚類的方法生成多個(gè)聚類中心,以聚類中心為視覺詞 匯,所有的聚類中心構(gòu)成特征包;
[0022] (2. 4)對(duì)每一層手勢(shì)圖像的每一塊進(jìn)行特征包量化,得到每層圖像的特征向量;
[0023] (2. 5)將三層的特征向量融合成一個(gè)新的向量,用于訓(xùn)練直方圖相交核支持向量 機(jī)。
[0024] 所述將特征變換描述子用聚類的方法生成多個(gè)聚類中心包括以下步驟:
[0025] ①?gòu)氖謩?shì)樣本庫的特征向量空間
【權(quán)利要求】
1. 一種基于圖像空間金字塔特征包的手勢(shì)識(shí)別方法,其特征在于包括以下步驟: 對(duì)帶有手勢(shì)的圖像進(jìn)行手勢(shì)分割; 對(duì)分割出來的手勢(shì)圖像進(jìn)行特征提取和描述; 利用提取的特征訓(xùn)練直方圖相交核支持向量機(jī),并根據(jù)支持向量機(jī)得到該手勢(shì)圖像的 特征向量所屬的手勢(shì)類別,實(shí)現(xiàn)手勢(shì)識(shí)別。
2. 根據(jù)權(quán)利要求1所述的一種基于圖像空間金字塔特征包的手勢(shì)識(shí)別方法,其特征在 于所述對(duì)分割出來的手勢(shì)圖像進(jìn)行特征提取和描述包括以下步驟: (2. 1)將手勢(shì)圖像構(gòu)造成三層手勢(shì)圖像,第一層將整張手勢(shì)圖像劃分為16個(gè)子塊,第 二層將整張手勢(shì)圖像劃分為4個(gè)子塊,第三層為整張手勢(shì)圖像; (2. 2)將第三層的整張手勢(shì)圖像均勻分成若干個(gè)像素為16 X 16的小塊,對(duì)每個(gè)小塊生 成尺度不變特征變換描述子; (2. 3)將特征變換描述子用聚類的方法生成多個(gè)聚類中心,以聚類中心為視覺詞匯,所 有的聚類中心構(gòu)成特征包; (2.4)對(duì)每一層手勢(shì)圖像的每一塊進(jìn)行特征包量化,得到每層圖像的特征向量; (2. 5)將三層的特征向量融合成一個(gè)新的向量,用于訓(xùn)練直方圖相交核支持向量機(jī)。
3. 根據(jù)權(quán)利要求1所述的一種基于圖像空間金字塔特征包的手勢(shì)識(shí)別方法,其特征在 于所述將特征變換描述子用聚類的方法生成多個(gè)聚類中心包括以下步驟: ① 從手勢(shì)樣本庫的特征向量空間
中,任取一個(gè)向量為第一個(gè)初始聚類 中心
;其中,
為每個(gè)特征點(diǎn)的SIFT特征描述向量,m為從手勢(shì)樣本庫的所有 手勢(shì)圖像中提取的特征點(diǎn)個(gè)數(shù); ② 任取一個(gè)其它向量,如果該向量所得概率
為目前選取 向量的所得概率中的最大概率時(shí)
這個(gè)向量g就為下一個(gè)初始聚 類中心
;其中
為選取向量f到目前已選出的所有聚類中心的最近距離; ③ 重復(fù)步驟②,直到選出K個(gè)初始聚類中心,
④ 計(jì)算特征向量空間中剩余的每個(gè)特征向量
與各聚類中心之間的距離
如果滿足
,則該特征向量屬于第j個(gè)類別即
⑤ 求出新的聚類中心
,其中F為迭代次數(shù),ip為屬于第j 個(gè)聚類中心的第i個(gè)樣本點(diǎn),r^_是屬于第j個(gè)聚類中心的樣本點(diǎn)的個(gè)數(shù),計(jì)算誤差的平方和 準(zhǔn)則函數(shù)
⑥判斷< ξ是否成立;其中,ξ為誤差閾值,F(xiàn)為迭代次數(shù);如果不 成立,則F = F+1,以Cj (F)為初始聚類中心,返回步驟④;如果成立,則此時(shí)所得的Κ個(gè)聚類 中心為最終聚類中心。
4. 根據(jù)權(quán)利要求1所述的一種基于圖像空間金字塔特征包的手勢(shì)識(shí)別方法,其特征在 于所述利用提取的特征訓(xùn)練直方圖相交核支持向量機(jī)具體為通過核函數(shù)將線性不可分樣 本映射到線性可分的高維空間,并得到分類超平面 :
其中,核函數(shù)為
,其中,氏、H2為圖像的直方圖;h n、h2i(i = l,2,...m)是直方圖氏、!12每個(gè)類的值
擁有最大間 隔分類線的權(quán)向量
為任一支持向量,yi為類別標(biāo)簽;fSLagrange乘子的 最優(yōu)解,通過將二次規(guī)劃問題采用SMO算法求解得到;X為待輸入樣本,η為樣本特征向量維 數(shù)。
5. 根據(jù)權(quán)利要求1所述的一種基于圖像空間金字塔特征包的手勢(shì)識(shí)別方法,其特征在 于所述根據(jù)支持向量機(jī)得到該手勢(shì)圖像的特征向量所屬的手勢(shì)類別包括以下步驟: 將分類超平面作為判別函數(shù)對(duì)輸入的新的向量進(jìn)行判別;如果
,則判別輸入樣本為+1類,否則為-1類;其中,Xi為任一支持向 量,xT為輸入待判別特征向量,yi為類別標(biāo)簽;a;為L(zhǎng)agrange乘子的最優(yōu)解,通過將二次 規(guī)劃問題采用SMO算法求解得到。
【文檔編號(hào)】G06K9/62GK104156690SQ201410301604
【公開日】2014年11月19日 申請(qǐng)日期:2014年6月27日 優(yōu)先權(quán)日:2014年6月27日
【發(fā)明者】曹江濤, 余思泉, 李平 申請(qǐng)人:遼寧石油化工大學(xué)