專利名稱:一種基于中值濾波和Hu矩向量的手語識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字幾何圖像的簡化處理領(lǐng)域,特別涉及一種基于中值濾波和Hu矩向量的手語識別方 法。
背景技術(shù):
隨著語音識別和圖像處理的研究,越來越多的研究者致力于幫助聾啞人和正常人進行正常溝通交流。同時近年來手勢識別也受到越來越多的重視,成為和指紋、人臉同等重要的識別方式。手語是一種通過動作來表達信息的語言,“手形是它的物質(zhì)載體,通過手的形狀、位置、運動來傳遞信息”。為了使聾啞人或聽覺障礙者更好地實現(xiàn)遠程交流,手語識別成為目前研究者重點關(guān)注的問題之一。目前手語識別的研究按照采集手語的輸入設(shè)備可以分為兩種依靠數(shù)據(jù)手套、視覺設(shè)備和肘部彎曲傳感器等輔助設(shè)備的手語識別和基于視覺技術(shù)的手語識別。利用數(shù)據(jù)手套作為輸入設(shè)備的方法是用戶通過一種佩戴特殊的數(shù)據(jù)手套,做出各種手語動作,通過一種位置跟蹤器把手的姿勢、手的運動空間的數(shù)據(jù)傳輸給計算機。另外,近年來研究者越來越多的使用圖像處理的方法進行手語識別,并且取得了一定的效果。基于計算機視覺的手語識別方法是利用攝像機等圖像采集設(shè)備輸入手勢,其方法的顯著優(yōu)點是打手語者不用佩戴復雜的數(shù)據(jù)手套,基本不受設(shè)備約束和影響。目前基于圖像處理的的手語識別大多采用圖像分割的方法。然而,上述方案存在以下缺點(1)利用數(shù)據(jù)手套作為輸入設(shè)備的方法,設(shè)備昂貴且攜帶不方便,而且給用戶帶來許多不便(如出汗),從而很難得到大規(guī)模的應用。 (2)基于圖像處理的的手語識別大多采用圖像分割的方法,但是,目前還沒有一種邊緣分割的方法可以達到很好的處理方法,必然導致圖像數(shù)據(jù)的缺失。因此,有必要提供一種基于中值濾波和Hu矩向量的手語識別方法來彌補上述缺陷。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種能夠提高手語圖像的正確識別率,具有較好的魯棒性,有效改善手語識別效果的手語識別方法。為實現(xiàn)上述目的,本發(fā)明提供一種基于中值濾波和Hu矩向量的手語識別方法,包括以下步驟步驟1 獲取待識別手語的彩色圖像;步驟2 對獲取到的彩色圖像進行歸一化處理;步驟3 對彩色圖像進行灰度變換處理;步驟4 對灰度圖像進行中值濾波處理;步驟5 提取處理后的手語圖像的矩不變量得到待匹配圖像的特征向量;步驟6 計算待匹配圖像與手語標準圖像的特征向量之間的歐氏距離;步驟7 識別手語。較佳地,所述步驟2中的歸一化處理將圖像統(tǒng)一成480*640。較佳地,所述步驟3的灰度變換將圖像變換成8位灰度圖像。具體地,所述步驟4進一步包括以下步驟步驟41 取得新采樣;步驟42 判斷輸入的采樣是否代表信號;若是,繼續(xù)步驟43 ;若否,重復步驟41 ;步驟43 使用滑動窗口處理窗口中的數(shù)值;步驟44 輸出中值。較佳地,所 述步驟7的識別手語的步驟為比較待匹配圖與手語標準圖特征向量的歐氏距離,當兩者的歐氏距離為最小值時,判斷該標準手語為對應的待識別手語。與現(xiàn)有技術(shù)相比,本發(fā)明所提供的一種基于中值濾波和Hu炬向量的手語識別方法,結(jié)合中值濾波與不變矩特征量,更好的克服手語圖像采集中光照不均的影響和傳統(tǒng)手語識別中基于圖像分割造成的邊緣信息損失。對于外界環(huán)境不同不可避免造成的手語圖像旋轉(zhuǎn)、縮放和平移等圖像的非本質(zhì)性改變具有很好的魯棒性。特別是對含有椒鹽噪聲信噪比較高的圖像具有很好的效果,可以有效的改善手語識別效果。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其它的附圖。圖1為本發(fā)明的基于中值濾波和Hu矩向量的手語識別方法的流程圖;圖2為圖1中步驟S104的子流程圖;圖3a及圖3b為本發(fā)明實施例中代表字母的一手語圖像的不同角度的示意圖;圖4為圖1中步驟S107的子流程圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其它實施例,都屬于本發(fā)明保護的范圍。如上所述,本發(fā)明提供一種基于中值濾波和Hu矩向量的手語識別方法,通過中值濾波和Hu矩特征量相結(jié)合識別手語的方法,可以有效的改善手語識別效果。通過中值濾波和灰度處理等圖像預處理降低了待識別圖像對光照和噪聲等的敏感度,而且對降低計算難度和提高手語的識別準確率上都有明顯的改善。圖像的7Hu特征向量整體描述手語信息, 克服圖像分割造成的邊緣信息的缺失,而且Hu矩向量對于外界環(huán)境不同不可避免造成的手語圖像旋轉(zhuǎn)、偏移、縮放等都有很好的魯棒性,從而提高手語正識率。參考圖1,本發(fā)明的基于中值濾波和Hu矩向量的手語識別方法,包括以下步驟步驟SlOl 獲取待識別手語的彩色圖像;步驟S102 對獲取到的彩色圖像進行歸一化處理; 步驟S103 對彩色圖像進行灰度變換處理;步驟S104 對灰度圖像進行中值濾波處理;步驟S105 提取處理后的手語圖像的矩不變量得到待匹配圖像的特征向量;步驟S106 計算待匹配圖像與手語標準圖像的特征向量之間的歐氏距離;步驟S107 識別手語。具體地,步驟S 101利用攝像頭或其它圖像采集設(shè)備來獲取待識別手語圖像,所獲取的手語圖像為彩色圖像。步驟S102及步驟S103為對手語圖像的預處理,由于Hu矩適用于提取整幅手語圖像中的像素的相對分布特征,因此在圖像采集過程中含有大量的背景噪聲信息或者是手臂占有大部分空間也會對識別結(jié)果產(chǎn)生較大的影響,因此需要對圖像進行預處理。本發(fā)明采用灰度變換和中值濾波進行圖像預處理。圖像預處理的目的是除去圖像中的大量噪聲信息,突出手語圖像中的手語細節(jié)信息,預處理的優(yōu)劣直接影響識別手語圖像提取特征的準確度。不同設(shè)備采集到的圖像大小不一,本發(fā)明實施例首先對圖像進行歸一化處理,統(tǒng)一成480*640。由于攝像光照程度、成像設(shè)備的非線性或圖像記錄設(shè)備動態(tài)范圍太窄等因素,對圖像都會產(chǎn)生對比度不足的弊病,使手語圖像細節(jié)分辨不清,為了減少背景、膚色等噪聲的影響,本發(fā)明將原始圖像進行灰度變換,統(tǒng)一成8位灰度圖像。 參考圖2,所述步驟S104進一步包括以下步驟步驟41 取得新采樣;步驟42 判斷輸入的采樣是否代表信號;若是,繼續(xù)步驟43 ;若否,重復步驟41 ;步驟43 使用滑動窗口處理窗口中的數(shù)值;步驟44:輸出中值。具體地,中值濾波是一種典型的非線性濾波技術(shù),在一定條件下可以克服線性濾波器如最小均方濾波、均值濾波等帶來的圖像細節(jié)模糊, 而且對濾除圖像噪聲非常有效。由于在實際計算過程中不需要圖像的統(tǒng)計特征,因此使用非常方便。中值濾波是一種基于空域排序統(tǒng)計的圖像降噪方法,是一種非線性平滑技術(shù), 對脈沖干擾級椒鹽噪聲的抑制效果特別好,在抑制隨機噪聲的同時能有效保護邊緣少受模糊。它將每一象素點的灰度值設(shè)置為該點某鄰域窗口內(nèi)的所有象素點灰度值的中值,從而消除孤立噪聲點,可以在有效抑制噪聲的同時有效地保留圖像的細節(jié)信息,適合對于手語圖像的預處理操作,標準一維中值濾波器的定義為yk = med{XK—ν,XK_N+1 ? · · · Χκ,· · · ι,Χκ+J式中,med表示取中值操作。中值濾波主要是檢查輸入信號中的采樣并判斷它是否代表了信號,使用滑動窗口處理窗口中的數(shù)值,使用中值作為輸出值,取得新的采樣,然后重復上面的計算過程。具體濾波方法是對滑動濾波窗口(2N+1)內(nèi)的像素作大小排序,濾波結(jié)果的輸出像素值規(guī)定為該序列的中值。預處理后有效的去除手語采集圖像中的椒鹽噪聲,而且能夠克服光照等外界環(huán)境變化造成的影響。所述步驟S105具體為,通過提取圖像Hu矩不變量對旋轉(zhuǎn)、縮放和平移等非本質(zhì)性變換具有很強的魯棒性,提取圖像整體信息作為識別基礎(chǔ),不需要對圖像進行分割,同時避免了圖像分割帶來的數(shù)據(jù)損失。7Hu矩不變量蘊含豐富的圖像信息,使用它們并選用適當?shù)木植刻卣髅枋鲎泳湍芙泼枋稣鶊D像的特征,從而減少了特征提取的復雜度。Hu將代數(shù)不變量理論用于歸一化的中心矩,構(gòu)造出了以下7個平移、旋轉(zhuǎn)和尺度不變矩。利用Hu不變矩進行圖像識別和圖像匹配是一個重要方法,Hu不變量可以用以下7個公式表示M1 = η 20+ η 02M2 ={η10-η02 +WuM3 = (η so" η 2)2+ (3 η 21- η 03)2M4 = (η 30+ η 2)2+ (η21- η 03)2M3 = (η 30-3 η 12) (η 30+ η 12) [ η 30+ η 12) 2-3 (η21- η 03) 2] + (3 η 21- η 03) (η 21+ η 03) [3(η3ο+η12)2-(η21+η03)2]M6 = (η20-η02) [(η30+ η12)2-( η21+ η03)2]+4 ηπ( η30+ η12) (η21+η03)2M7 = (3η21-η03) (η30+η12) [(η3ο+η12)2-3(η21+η03)2] + (3η12-η03) (η21+η03) [3(η3ο+η12)2-(η21+η03)2]規(guī)格化的中心距η X 定義為f^oo,其中 r = (p+q+2)/2, p+q = 2,3,...
權(quán)利要求
1.一種基于中值濾波和HU矩向量的手語識別方法,其特征在于,包括以下步驟 步驟1 獲取待識別手語的彩色圖像;步驟2 對獲取到的彩色圖像進行歸一化處理; 步驟3 對彩色圖像進行灰度變換處理; 步驟4 對灰度圖像進行中值濾波處理;步驟5 提取處理后的手語圖像的矩不變量得到待匹配圖像的特征向量; 步驟6 計算待匹配圖像與手語標準圖像的特征向量之間的歐氏距離; 步驟7 識別手語。
2.如權(quán)利要求1所述的方法,其特征在于,所述步驟2中的歸一化處理將圖像統(tǒng)一成 480祁40。
3.如權(quán)利要求1所述的方法,其特征在于,所述步驟3的灰度變換將圖像變換成8位灰度圖像。
4.如權(quán)利要求1所述的方法,其特征在于,所述步驟4進一步包括以下步驟 步驟41 取得新采樣;步驟42 判斷輸入的采樣是否代表信號;若是,繼續(xù)步驟43 ;若否,重復步驟41 ; 步驟43 使用滑動窗口處理窗口中的數(shù)值; 步驟44:輸出中值。
5.如權(quán)利要求1所述的方法,其特征在于,所述步驟7的識別手語的步驟為比較待匹配圖與手語標準圖特征向量的歐氏距離,當兩者的歐氏距離為最小值時,判斷該標準手語為對應的待識別手語。
全文摘要
本發(fā)明公開一種基于中值濾波和Hu矩向量的手語識別方法,包括以下步驟步驟1獲取待識別手語的彩色圖像;步驟2對獲取到的彩色圖像進行歸一化處理;步驟3對彩色圖像進行灰度變換處理;步驟4對灰度圖像進行中值濾波處理;步驟5提取處理后的手語圖像的矩不變量得到待匹配圖像的特征向量;步驟6計算待匹配圖像與手語標準圖像的特征向量之間的歐氏距離;步驟7識別手語。本發(fā)明通過中值濾波和灰度處理等圖像預處理降低了待識別圖像對光照和噪聲等的敏感度,圖像的Hu特征向量整體描述手語信息,克服圖像分割造成的邊緣信息的缺失,中值濾波和Hu矩向量相結(jié)合識別手語的方法,可以有效的改善手語識別效果,提高手語識別的正確率。
文檔編號G06K9/36GK102289666SQ20111025910
公開日2011年12月21日 申請日期2011年9月2日 優(yōu)先權(quán)日2011年9月2日
發(fā)明者崔榮基, 李苗, 殷偉 申請人:廣東中大訊通軟件科技有限公司