基于深度圖像的手勢(shì)識(shí)別方法和裝置制造方法

文檔序號(hào)：6491773閱讀：675來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

基于深度圖像的手勢(shì)識(shí)別方法和裝置制造方法
【專利摘要】提供了一種基于深度圖像的手勢(shì)識(shí)別方法、手勢(shì)識(shí)別裝置、開啟人機(jī)交互系統(tǒng)的方法和裝置。該手勢(shì)識(shí)別方法，可以包括：基于包括手部區(qū)域的深度圖像序列，檢測(cè)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡；以及根據(jù)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡，識(shí)別預(yù)定手勢(shì)。本發(fā)明實(shí)施例的上述手勢(shì)識(shí)別方法和裝置充分利用了連續(xù)識(shí)別圖像中的運(yùn)動(dòng)信息；由于未使用膚色模型，而是采用連續(xù)圖像的時(shí)空域運(yùn)動(dòng)信息和連續(xù)的深度值變化信息進(jìn)行手勢(shì)識(shí)別，因此該手勢(shì)識(shí)別方法性能較魯棒，所受光照條件影響較??；由于基于運(yùn)動(dòng)軌跡進(jìn)行手勢(shì)識(shí)別，它能在相對(duì)較遠(yuǎn)的距離范圍內(nèi)使用。
【專利說明】基于深度圖像的手勢(shì)識(shí)別方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明總體地涉及手勢(shì)識(shí)別，更具體地涉及基于深度圖像的手勢(shì)識(shí)別方法和裝置。
【背景技術(shù)】
[0002]已經(jīng)提出了一些基于圖像處理的手勢(shì)識(shí)別技術(shù)。
[0003]美國(guó)專利“US7340077B2”中，提出了一種基于深度傳感器的手勢(shì)識(shí)別系統(tǒng)。該方法通過對(duì)在一定時(shí)間范圍內(nèi)姿態(tài)的組合進(jìn)行手勢(shì)識(shí)別，主要針對(duì)所識(shí)別部分的形狀、位置和方向進(jìn)行手勢(shì)識(shí)別，最后通過識(shí)別到的手勢(shì)對(duì)相關(guān)的電器設(shè)備進(jìn)行控制。該方法主要采用靜態(tài)圖像信息進(jìn)行識(shí)別，丟掉了連續(xù)視頻圖像中的大量運(yùn)動(dòng)信息。另外，手勢(shì)的識(shí)別主要是基于組合姿態(tài)，因此用戶必須做多個(gè)姿態(tài)模式去完成一個(gè)手勢(shì)，這對(duì)于用戶操作不是很方便。
[0004]美國(guó)專利公開“US20120069168A1”提出了一種對(duì)電視進(jìn)行控制的手勢(shì)識(shí)別系統(tǒng)。手勢(shì)(手掌張開與閉合)用于電視的“選擇”和“確定”功能操作。首先，手的姿態(tài)(“開”或者“合”)被檢測(cè)基于手掌中心和手掌底部之間的計(jì)算距離，然后手勢(shì)(手掌張開與閉合)能被識(shí)別，基于手的“開”和“合”之間的狀態(tài)轉(zhuǎn)換關(guān)系。在該系統(tǒng)中，為了有效判斷手的開合狀態(tài)，用戶與電視的距離必須在有效的距離范圍內(nèi)。因此該方法不太適用于遠(yuǎn)距離操作。同時(shí)該系統(tǒng)采用膚色模型進(jìn)行手的檢測(cè)，檢測(cè)結(jié)果將很容易受到環(huán)境光照變化的影響。
[0005]題目為“Hand Gesture Recognition for Human-Machine Interaction，，, Journalof WSCG，2004的文章提出了一種實(shí)時(shí)的基于手勢(shì)識(shí)別的視覺應(yīng)用系統(tǒng)。首先，采用膚色模型進(jìn)行運(yùn)動(dòng)手區(qū)域分割；然后基于HausdorfT距離進(jìn)行手的姿態(tài)識(shí)別。該方法同樣容易受到光照的影響。
[0006]另外，有些文章使用2D運(yùn)動(dòng)軌跡進(jìn)行手勢(shì)識(shí)別，通常他們都是基于靜態(tài)圖像進(jìn)行特征提取或者采用膚色模型進(jìn)行前景分割。

【發(fā)明內(nèi)容】

[0007]根據(jù)本發(fā)明的實(shí)施例，提供了一種基于深度圖像的手勢(shì)識(shí)別方法，可以包括:基于包括手部區(qū)域的深度圖像序列，檢測(cè)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡；以及根據(jù)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡，識(shí)別預(yù)定手勢(shì)。
[0008]根據(jù)本發(fā)明的另一實(shí)施例，提供了一種開啟人機(jī)交互系統(tǒng)的方法，包括:獲得包括手部區(qū)域的深度圖像序列；基于包括手部區(qū)域的深度圖像序列，檢測(cè)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡；根據(jù)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡，識(shí)別抬手手勢(shì)；以及如果識(shí)別到抬手手勢(shì)，則開啟人機(jī)交互系統(tǒng)，進(jìn)入人機(jī)交互狀態(tài)中。
[0009]根據(jù)本發(fā)明的另一實(shí)施例，提供了一種基于深度圖像識(shí)別人體部位預(yù)定動(dòng)作的方法，可以包括:基于包括該人體部位區(qū)域的深度圖像序列，檢測(cè)人體部位候選區(qū)域的三維運(yùn)動(dòng)軌跡；以及根據(jù)人體部位候選區(qū)域的三維運(yùn)動(dòng)軌跡，識(shí)別人體部位的預(yù)定動(dòng)作。[0010]根據(jù)本發(fā)明的另一實(shí)施例，提供了一種基于深度圖像的手勢(shì)識(shí)別裝置，可以包括:三維運(yùn)動(dòng)軌跡檢測(cè)部件，用于基于包括手部區(qū)域的深度圖像序列，檢測(cè)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡；以及手勢(shì)識(shí)別部件，用于根據(jù)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡，識(shí)別預(yù)定手勢(shì)。
[0011]根據(jù)本發(fā)明實(shí)施例的基于深度圖像的手勢(shì)識(shí)別方法和裝置因?yàn)閷⑸疃扔蛏系倪\(yùn)動(dòng)軌跡納入手勢(shì)識(shí)別過程，因此充分利用了連續(xù)識(shí)別圖像中的運(yùn)動(dòng)信息；由于未使用膚色模型，而是采用連續(xù)圖像的時(shí)空域運(yùn)動(dòng)信息和連續(xù)的深度值變化信息進(jìn)行手勢(shì)識(shí)別，因此該手勢(shì)識(shí)別方法性能較魯棒，所受光照條件影響較小；由于基于運(yùn)動(dòng)軌跡進(jìn)行手勢(shì)識(shí)別，它能在相對(duì)較遠(yuǎn)的距離范圍內(nèi)使用。根據(jù)本發(fā)明實(shí)施例的手勢(shì)識(shí)別方法耗時(shí)短且魯棒性高。
[0012]根據(jù)本發(fā)明實(shí)施例的開啟人機(jī)交互系統(tǒng)的技術(shù)，提供了一種便利、可靠的系統(tǒng)啟動(dòng)控制方式，提示用戶是否已經(jīng)進(jìn)入系統(tǒng)控制狀態(tài)，防止用戶無意識(shí)動(dòng)作被錯(cuò)誤識(shí)別為可操作手勢(shì)，從而提供了一種更具用戶友好性的人機(jī)交互方式。
【專利附圖】

【附圖說明】
[0013]圖1示意性地示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的手勢(shì)識(shí)別技術(shù)用于人機(jī)交互的情景不意圖。
[0014]圖2示出了根據(jù)本發(fā)明第一實(shí)施例的手勢(shì)識(shí)別方法的總體流程圖。
[0015]圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的無需識(shí)別用戶手部來檢測(cè)用戶手部候選區(qū)域的三維運(yùn)動(dòng)軌跡的示例性方法的流程圖。
[0016]圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于三維運(yùn)動(dòng)軌跡識(shí)別抬手手勢(shì)的一個(gè)方法的總體流程圖。
[0017]圖5為根據(jù)本發(fā)明一個(gè)實(shí)施例的三維運(yùn)動(dòng)軌跡在不同維上的運(yùn)動(dòng)軌跡分解圖。
[0018]圖6(a)到6(c)示意性地示出了三維運(yùn)動(dòng)軌跡的形式和運(yùn)動(dòng)特征提取的示意圖。
[0019]圖7示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于可變大小的滑動(dòng)窗口從輸入的運(yùn)動(dòng)軌跡特征來識(shí)別手勢(shì)的方法的流程圖。
[0020]圖8示出根據(jù)本發(fā)明第二實(shí)施例的手勢(shì)識(shí)別方法的流程圖。
[0021]圖9示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的人體測(cè)量學(xué)模型驗(yàn)證預(yù)定手勢(shì)的方法的流程圖。
[0022]圖10(al)到(a3)、(bl)到(b3)以及(c)示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的、使用直方圖分析方法的頭部中心線定位、肩部水平方向定位、以及作為示例抬手手勢(shì)末端的手與頭部的相互位置關(guān)系的示意圖。
[0023]圖11示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種開啟人機(jī)交互系統(tǒng)的方法的流程圖。
[0024]圖12示出了根據(jù)本發(fā)明實(shí)施例的基于深度圖像的手勢(shì)識(shí)別裝置的功能配置框圖。
[0025]圖13是示出按照本發(fā)明實(shí)施例的手勢(shì)識(shí)別系統(tǒng)的總體硬件框圖。
【具體實(shí)施方式】
[0026]為了使本領(lǐng)域技術(shù)人員更好地理解本發(fā)明，下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本發(fā)明作進(jìn)一步詳細(xì)說明。
[0027]將按下列順序進(jìn)行描述:[0028]1、應(yīng)用場(chǎng)景示例
[0029]2、手勢(shì)識(shí)別方法的第一實(shí)施例
[0030]2.1手勢(shì)識(shí)別方法的總體流程
[0031]2.2、三維運(yùn)動(dòng)軌跡的獲取
[0032]2.3、基于三維運(yùn)動(dòng)軌跡識(shí)別抬手手勢(shì)
[0033]2.4、三維運(yùn)動(dòng)軌跡的運(yùn)動(dòng)特征提取
[0034]2.5、基于三維運(yùn)動(dòng)軌跡的運(yùn)動(dòng)特征識(shí)別預(yù)定手勢(shì)
[0035]2.6、利用窗口大小可變的滑動(dòng)窗口的手勢(shì)識(shí)別
[0036]3、手勢(shì)識(shí)別方法的第二實(shí)施例
[0037]3.1第二實(shí)施例的手勢(shì)識(shí)別方法的總體流程
[0038]3.2、根據(jù)人體測(cè)量學(xué)模型驗(yàn)證預(yù)定手勢(shì)
[0039]4、人機(jī)交互系統(tǒng)的開啟方法
[0040]5、基于深度圖像的手勢(shì)識(shí)別裝置
[0041]6、系統(tǒng)硬件配置
[0042]7、總結(jié)
[0043]1、應(yīng)用場(chǎng)景示例
[0044]圖1示意性地示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的手勢(shì)識(shí)別技術(shù)用于人機(jī)交互的情景的示意圖。如圖1所示，用戶站在諸如計(jì)算機(jī)的人機(jī)交互設(shè)備前，諸如雙目攝像機(jī)的立體攝像機(jī)，拍攝人的例如左右圖像序列或者直接得到深度圖像序列，并將其發(fā)給諸如個(gè)人計(jì)算機(jī)的手勢(shì)識(shí)別設(shè)備，個(gè)人計(jì)算機(jī)分析深度圖像序列而進(jìn)行手勢(shì)識(shí)別，并基于手勢(shì)識(shí)別的結(jié)果進(jìn)行響應(yīng)，例如如果識(shí)別到這是一個(gè)用于啟動(dòng)的抬手手勢(shì)，則得出這個(gè)有效的啟動(dòng)信號(hào)，并發(fā)出啟動(dòng)信號(hào)；反之如果識(shí)別到這并非用于啟動(dòng)的抬手手勢(shì)，則得出這是無效的啟動(dòng)信號(hào)，不發(fā)出啟動(dòng)信號(hào)。當(dāng)然，這只是一個(gè)示意性示例，用于識(shí)別手勢(shì)的設(shè)備不限于計(jì)算機(jī)，可以是例如游戲機(jī)，投影儀，電視機(jī)等等。
[0045]如本領(lǐng)域人員公知的，深度圖像(Depth image)是圖像中的像素點(diǎn)的值為深度的圖像。相比于灰度圖像，深度圖像具有物體的深度(距離)信息，因此特別適合于需要立體信息的各種應(yīng)用。
[0046]另外，如公知的，一個(gè)像素點(diǎn)的深度值和視差值之間具有簡(jiǎn)單的換算關(guān)系，因此本發(fā)明的深度圖像的含義是廣義的，包括視差圖像。
[0047]2、手勢(shì)識(shí)別方法的第一實(shí)施例
[0048]2.1手勢(shì)識(shí)別方法的總體流程
[0049]圖2示出了根據(jù)本發(fā)明第一實(shí)施例的手勢(shì)識(shí)別方法100的總體流程圖。
[0050]如圖2所示，在步驟110中，基于包括手部區(qū)域的深度圖像序列，檢測(cè)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡。
[0051]該深度圖像序列可以是從諸如雙目相機(jī)的任何一種可以獲取深度圖像的相機(jī)傳遞的，或者可以是本地實(shí)時(shí)從灰度圖像計(jì)算得到的，或者是通過網(wǎng)絡(luò)從外部深入的等等。
[0052]這里的三維運(yùn)動(dòng)軌跡，是指與傳統(tǒng)的二維圖像的二維軌跡不同，具有深度(距離)信息的運(yùn)動(dòng)軌跡，也即軌跡上的每個(gè)運(yùn)動(dòng)軌跡點(diǎn)具有既平面(x，y)坐標(biāo)信息，也具有表征深度(距離)的Z坐標(biāo)信息。[0053]檢測(cè)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡的方法可以粗略分為基于手部識(shí)別的方法和基于手部過濾的方法。
[0054]在基于手部識(shí)別的方法中，例如，從最初的深度圖像中，首先根據(jù)手部區(qū)域的特征，通過匹配處理等識(shí)別手部區(qū)域并確定手部區(qū)域的位置，然后利用運(yùn)動(dòng)跟蹤技術(shù)在后續(xù)的深度圖像中跟蹤手部，從而得到手部的三維運(yùn)動(dòng)軌跡。這里，為了從識(shí)別出手部，如果還存在對(duì)應(yīng)的灰度圖像，則也可以結(jié)合基于膚色模型的手部識(shí)別的技術(shù)。
[0055]在基于手部過濾的方法中，并不首先進(jìn)行手部區(qū)域識(shí)別，而是首先檢測(cè)深度圖像中的運(yùn)動(dòng)塊區(qū)域，然后例如基于手部的特種特征來從運(yùn)動(dòng)塊區(qū)域中選擇(或過濾)手部運(yùn)動(dòng)塊區(qū)域。這種方式可以無需識(shí)別手部，從而可以更快速的進(jìn)行手勢(shì)識(shí)別，特別適合實(shí)時(shí)的人機(jī)交互處理。后面將參考圖3來描述基于手部過濾的檢測(cè)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡。
[0056]不過，上述手部候選區(qū)域的三維運(yùn)動(dòng)軌跡檢測(cè)方式僅為示例，本發(fā)明并不局限于此，任何能夠基于深度圖像序列，得到某對(duì)象的三維運(yùn)動(dòng)軌跡的技術(shù)均可以應(yīng)用于本發(fā)明。
[0057]在步驟120中，根據(jù)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡，識(shí)別預(yù)定手勢(shì)。
[0058]一般而言，不同的手勢(shì)對(duì)應(yīng)于不同的三維運(yùn)動(dòng)軌跡，因此可以通過分析上述獲得的手部候選區(qū)域的三維運(yùn)動(dòng)軌跡，而進(jìn)行預(yù)定手勢(shì)的識(shí)別。
[0059]例如，對(duì)于抬手手勢(shì)，以人自身為參照物來說，其三維運(yùn)動(dòng)軌跡是個(gè)從下面開始向前凸到上面終止的拋物線；如果分解為深度域和與深度域垂直的二維平面域上的兩個(gè)運(yùn)動(dòng)軌跡，則在深度域上，相對(duì)于面前的攝像機(jī)而言，為距離從遠(yuǎn)到近再到遠(yuǎn)的拋物線，而在二維平面域上，為從下到上的直線運(yùn)動(dòng)。
[0060]再例如，作為與抬手手勢(shì)相對(duì)的放手手勢(shì)，以人自身為參照物來說，其三維運(yùn)動(dòng)軌跡是個(gè)從上面開始向前凸到下面終止的拋物線；如果分解為深度域和與深度域垂直的二維平面域上的兩個(gè)運(yùn)動(dòng)軌跡，則在深度域上，相對(duì)于面前的攝像機(jī)而言，為距離從遠(yuǎn)到近再到遠(yuǎn)的拋物線，而在二維平面域上，為從上到下的直線運(yùn)動(dòng)。順便說一下，關(guān)于抬手手勢(shì)和放手手勢(shì)之間的區(qū)別，還可根據(jù)按時(shí)間順序的位置點(diǎn)之間的關(guān)系所指示的運(yùn)動(dòng)方向、終點(diǎn)時(shí)刻的手部位置等來判斷。
[0061]再例如，對(duì)于畫圓手勢(shì)，其三維運(yùn)動(dòng)軌跡為近似圓形。對(duì)于擺手手勢(shì)，其運(yùn)動(dòng)軌跡為往復(fù)的鐘擺運(yùn)動(dòng)軌跡。
[0062]再例如，對(duì)于從手部自然下垂到向前推的手部運(yùn)動(dòng)，其三維軌跡可以視為半抬手加向前推的結(jié)合，其中向前推的動(dòng)作在深度域中為直線運(yùn)動(dòng)，而在平面域中近似不動(dòng)。
[0063]后續(xù)，將參考圖4、5、6，以抬手手勢(shì)為例，說明通過分析深度域上的運(yùn)動(dòng)軌跡和二維平面域上的運(yùn)動(dòng)軌跡兩者來識(shí)別抬手手勢(shì)的過程。
[0064]上面結(jié)合圖1說明了根據(jù)本發(fā)明實(shí)施例的基于深度圖像識(shí)別預(yù)定手勢(shì)的方法。不過，本發(fā)明并不局限于手勢(shì)識(shí)別，也可以應(yīng)用于其他人體部位的動(dòng)作識(shí)別，例如應(yīng)用于腳部的動(dòng)作識(shí)別，例如向前踢腳的腳步動(dòng)作識(shí)別。顯然，本發(fā)明也并不局限于應(yīng)用于人類，也可以應(yīng)用于其他能動(dòng)的物體，例如，動(dòng)物、機(jī)器人等。
[0065]2.2、三維運(yùn)動(dòng)軌跡的獲取
[0066]圖3示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的無需識(shí)別用戶手部來檢測(cè)用戶手部候選區(qū)域的三維運(yùn)動(dòng)軌跡的示例性方法110的流程圖。該示例性方法110可以應(yīng)用于圖2中所示的步驟SI 10。[0067]如圖3所示，在步驟Slll中，獲取深度圖像中的運(yùn)動(dòng)塊區(qū)域。
[0068]作為示例，運(yùn)動(dòng)塊區(qū)域的檢測(cè)和獲取可以通過常用的幀間差方法來實(shí)現(xiàn)。具體地，例如將當(dāng)前幀和前一幀相減，將有關(guān)區(qū)域的差值與預(yù)定的運(yùn)動(dòng)差分閾值相比，如果當(dāng)前的區(qū)域差值大于預(yù)定差分閾值，則將當(dāng)前區(qū)域檢測(cè)為運(yùn)動(dòng)區(qū)域塊。上面的區(qū)域可以例如通過連通域檢測(cè)得到。
[0069]作為替代示例，可以基于背景差來獲取運(yùn)動(dòng)塊區(qū)域，具體地，例如通過當(dāng)前圖像減去背景圖來進(jìn)行運(yùn)動(dòng)塊區(qū)域的獲取，關(guān)于背景圖的形成可以通過前面多幀圖像的累積和求均值得到。在步驟S112中，根據(jù)運(yùn)動(dòng)塊區(qū)域的位置、面積和形狀中的至少一個(gè)，從運(yùn)動(dòng)塊區(qū)域中選取手部候選區(qū)域。
[0070]例如，可以根據(jù)運(yùn)動(dòng)塊區(qū)域的位置、面積和形狀等和預(yù)先得知的人手的一般位置、面積和形狀的知識(shí)，來從運(yùn)動(dòng)塊區(qū)域中選取手部候選區(qū)域。具體地，如果該運(yùn)動(dòng)塊區(qū)域可能為手的運(yùn)動(dòng)區(qū)域，那么該區(qū)域面積大小應(yīng)該接近于人類平均手的面積大小。如果該運(yùn)動(dòng)塊區(qū)域面積過大或者過小，可剔除該區(qū)域。類似地，人類的手的形狀在長(zhǎng)寬比例上也存在一個(gè)固定比例，也可以根據(jù)運(yùn)動(dòng)塊區(qū)域是否滿足該比例關(guān)系來過濾運(yùn)動(dòng)塊區(qū)域。再例如，人手和人身體之間的距離一般在一定范圍之內(nèi)，如果運(yùn)動(dòng)塊區(qū)域不在此范圍之內(nèi)，也可以將運(yùn)動(dòng)塊區(qū)域剔除于手部候選運(yùn)動(dòng)區(qū)域之外。如果一個(gè)運(yùn)動(dòng)塊區(qū)域同時(shí)滿足位置、面積和形狀條件，則該運(yùn)動(dòng)塊為手區(qū)域。當(dāng)然，應(yīng)該至多選擇兩個(gè)運(yùn)動(dòng)塊區(qū)域作為手部候選運(yùn)動(dòng)區(qū)域，因此如果存在多于兩個(gè)運(yùn)動(dòng)塊區(qū)域滿足根據(jù)人手的位置、面積和形狀的過濾條件，則可以評(píng)估它們符合人手區(qū)域的置信度(或可能性)，從中選擇至多兩個(gè)運(yùn)動(dòng)塊區(qū)域來作為手部候選運(yùn)動(dòng)區(qū)域。下文中，為便于描述，以從所有運(yùn)動(dòng)塊中選出一個(gè)手部候選運(yùn)動(dòng)塊區(qū)域?yàn)槔右哉f明。
[0071]此外，上面基于人類手部的位置、面積和形狀的預(yù)先知識(shí)來從運(yùn)動(dòng)塊區(qū)域中選擇手部候選運(yùn)動(dòng)區(qū)域。不過這僅為示例，也可以根據(jù)各種其他因素、利用各種技術(shù)來選擇最可能為手部的運(yùn)動(dòng)塊區(qū)域，例如在存在灰度圖像的情況下，可以結(jié)合膚色模型來選擇手部的運(yùn)動(dòng)塊區(qū)域。
[0072]在步驟113中，計(jì)算并記錄手部候選區(qū)域的位置信息。作為示例，可以計(jì)算手部候選區(qū)域的質(zhì)心點(diǎn)位置信息，作為手部候選區(qū)域的位置信息。所謂手部候選區(qū)域的質(zhì)心點(diǎn)位置可以例如通過對(duì)手部候選區(qū)域內(nèi)的所有位置求平均得到。
[0073]在步驟114中，得到對(duì)應(yīng)于深度圖像序列的位置信息序列。
[0074]具體地，例如，可以在每次系統(tǒng)獲取到當(dāng)前手部運(yùn)動(dòng)塊的質(zhì)心點(diǎn)后，將該質(zhì)心點(diǎn)根據(jù)時(shí)間先后順序放入“運(yùn)動(dòng)點(diǎn)位置信息序列”存儲(chǔ)器中，“運(yùn)動(dòng)點(diǎn)位置信息序列”就形成了三維(3D)運(yùn)動(dòng)軌跡。此外，當(dāng)運(yùn)動(dòng)點(diǎn)序列長(zhǎng)度大于設(shè)定的運(yùn)動(dòng)序列長(zhǎng)度時(shí)，可以通過刪除老的運(yùn)動(dòng)點(diǎn)，放入新的運(yùn)動(dòng)點(diǎn)，進(jìn)行運(yùn)動(dòng)軌跡點(diǎn)更新。
[0075]在一個(gè)示例中，在運(yùn)動(dòng)點(diǎn)位置信息序列中，可以與位置信息相關(guān)聯(lián)地存儲(chǔ)對(duì)應(yīng)的時(shí)間信息。
[0076]在一個(gè)示例中，如果運(yùn)動(dòng)點(diǎn)序列長(zhǎng)度還未達(dá)到設(shè)定序列長(zhǎng)度時(shí)，系統(tǒng)可以不啟動(dòng)后續(xù)的3D運(yùn)動(dòng)軌跡分析。
[0077]2.3、基于三維運(yùn)動(dòng)軌跡識(shí)別抬手手勢(shì)
[0078]圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的基于三維運(yùn)動(dòng)軌跡識(shí)別抬手手勢(shì)的一個(gè)方法120的總體流程圖。該方法120可以應(yīng)用于圖2中所示的步驟S120。
[0079]如圖4所示，在步驟S121中，對(duì)所獲得的三維運(yùn)動(dòng)軌跡進(jìn)行運(yùn)動(dòng)特征提取。下面將參考圖5和圖6對(duì)此給出示例性具體描述。
[0080]在步驟S122中，基于所獲取的三維運(yùn)動(dòng)軌跡的運(yùn)動(dòng)特征，進(jìn)行手勢(shì)識(shí)別。
[0081]例如，可以通過將所獲得的三維運(yùn)動(dòng)軌跡的運(yùn)動(dòng)特征與預(yù)定手勢(shì)對(duì)應(yīng)的運(yùn)動(dòng)模型相比較，來識(shí)別該三維運(yùn)動(dòng)軌跡是否表征預(yù)定手勢(shì)。下面將參考圖7對(duì)此給出示例性具體描述。
[0082]不過，圖4所示的基于三維運(yùn)動(dòng)軌跡來識(shí)別預(yù)定手勢(shì)的方法僅為示例。例如，在某些情況下，可以不進(jìn)行運(yùn)動(dòng)特征提取，而僅通過數(shù)值分析來分析該三維運(yùn)動(dòng)軌跡是否滿足具體的數(shù)學(xué)形式例如拋物線形式來進(jìn)行手勢(shì)識(shí)別。
[0083]2.4、三維運(yùn)動(dòng)軌跡的運(yùn)動(dòng)特征提取
[0084]三維運(yùn)動(dòng)軌跡可以通過以對(duì)應(yīng)于各幀深度圖像的各個(gè)軌跡點(diǎn)的自己的運(yùn)動(dòng)特征和整體三維運(yùn)動(dòng)軌跡的特征來刻畫，
[0085]圖5為根據(jù)本發(fā)明一個(gè)實(shí)施例的三維運(yùn)動(dòng)軌跡在不同維上的運(yùn)動(dòng)軌跡分解圖。
[0086]如圖5所示，示例性地，每個(gè)軌跡點(diǎn)的自己的運(yùn)動(dòng)特征121可以包括:二維時(shí)空域特征1211、軌跡點(diǎn)的深度域運(yùn)動(dòng)特征1222，每個(gè)軌跡點(diǎn)的二維時(shí)空域特征和深度域運(yùn)動(dòng)特征均和該軌跡點(diǎn)的時(shí)間點(diǎn)相關(guān)聯(lián)。二維時(shí)空域特征可以包括軌跡點(diǎn)的位置、速度、角度。軌跡點(diǎn)的深度域運(yùn)動(dòng)特征可以包括軌跡點(diǎn)的深度值。
[0087]下面參考圖6 (a)到6 (c)來示意性地描述三維運(yùn)動(dòng)軌跡的形式和運(yùn)動(dòng)特征提取。
[0088]圖6(a)示出了世界坐標(biāo)系，其中Z軸為深度傳感器方向或者說深度方向。圖6 (b)為從X-Y平面觀察到的2D時(shí)空域運(yùn)動(dòng)軌跡，對(duì)應(yīng)于圖6(a)中由標(biāo)記601指出的部分。圖6 (c)為Z軸上觀察到的ID深度值運(yùn)動(dòng)軌跡，對(duì)應(yīng)于圖6 (a)中由標(biāo)記602指出的部分。圖中的深度值z(mì)表示從深度傳感器到運(yùn)動(dòng)塊之間的水平距離。
[0089]下面首先描述X-Y平面中的2D運(yùn)動(dòng)軌跡的特征提取。
[0090]從正視圖(X-Y平面)中觀察到的抬手2D運(yùn)動(dòng)軌跡近似于圖6 (b)中的直線運(yùn)動(dòng)。在時(shí)間范圍[ts, te],手部質(zhì)心點(diǎn)P從開始點(diǎn)Ps運(yùn)動(dòng)到終止點(diǎn)Ρε, tm為時(shí)間范圍[ts, te]之間的中間時(shí)刻點(diǎn)。由于不同的用戶抬手習(xí)慣不一樣，因此運(yùn)動(dòng)軌跡開始點(diǎn)可能不同，運(yùn)動(dòng)軌跡終止點(diǎn)也可能不同，可能的多條運(yùn)動(dòng)軌跡例如如圖6(b)所示。
[0091]根據(jù)本發(fā)明的一個(gè)實(shí)施例，X-Y平面中的直線運(yùn)動(dòng)特征包括:各個(gè)軌跡點(diǎn)的位置、運(yùn)動(dòng)速度和運(yùn)動(dòng)方向，以及整體軌跡而言的運(yùn)動(dòng)范圍。
[0092]每個(gè)軌跡點(diǎn)Pi在X-Y平面中的位置可以用2D坐標(biāo)(Xi，Yi)來表示。
[0093]運(yùn)動(dòng)速度speed可以由下面的公式(I)計(jì)算得到(公式I是否應(yīng)是計(jì)算Y方向的速度)。
[0094]sPeed1 = , ' = 1，2，…./i，r0 = tjn =te
l1- ,η(I)
[0095]其中，Clis(PilPi^1)為當(dāng)前運(yùn)動(dòng)塊質(zhì)心點(diǎn)PjP上一幀質(zhì)心點(diǎn)Ph之間的空間距離，例如歐式距離，\表示當(dāng)前幀的時(shí)刻，表示上一幀的時(shí)刻，假設(shè)要分析的連續(xù)軌跡點(diǎn)的數(shù)目(等于窗口大小，或者說要分析的幀數(shù))為η，η為大于等于2的整數(shù)，可以根據(jù)需要選取，例如取15，20等。[0096]運(yùn)動(dòng)方向可以用運(yùn)動(dòng)角度Θ來表示，而運(yùn)動(dòng)角度Θ的正切tan Θ可以用下式(2)表不。
[0097]
【權(quán)利要求】
1.一種基于深度圖像的手勢(shì)識(shí)別方法，包括: 基于包括手部區(qū)域的深度圖像序列，檢測(cè)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡；以及根據(jù)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡，識(shí)別預(yù)定手勢(shì)。
2.根據(jù)權(quán)利要求1的手勢(shì)識(shí)別方法，還包括: 如果根據(jù)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡識(shí)別出預(yù)定手勢(shì)，則確定手部候選區(qū)域與人體其他部位之間的位置關(guān)系是否符合做出預(yù)定手勢(shì)情況下的人體測(cè)量學(xué)模型，以驗(yàn)證該預(yù)定手勢(shì)。
3.根據(jù)權(quán)利要求1的手勢(shì)識(shí)別方法，其中，如果手部候選區(qū)域的三維運(yùn)動(dòng)軌跡在深度方向上符合拋物線運(yùn)動(dòng)模型，以及在垂直于深度方向的平面上的二維運(yùn)動(dòng)軌跡符合直線運(yùn)動(dòng)模型，則識(shí)別出向上抬手手勢(shì)或向下放手手勢(shì)。
4.根據(jù)權(quán)利要求1的手勢(shì)識(shí)別方法，基于深度圖像序列，檢測(cè)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡包括: 獲取深度圖像中的運(yùn)動(dòng)塊區(qū)域；從運(yùn)動(dòng)塊區(qū)域中選取手部候選區(qū)域；計(jì)算并記錄手部候選區(qū)域的位置信息；以及得到對(duì)應(yīng)于深度圖像序列的位置信息序列。
5.根據(jù)權(quán)利要求4 的手勢(shì)識(shí)別方法，其中三維運(yùn)動(dòng)軌跡包括對(duì)應(yīng)于各幀深度圖像的各個(gè)軌跡點(diǎn)的自己的運(yùn)動(dòng)特征，每個(gè)軌跡點(diǎn)的自己的運(yùn)動(dòng)特征包括:包括軌跡點(diǎn)的位置、速度、角度的二維時(shí)空域特征、包括軌跡點(diǎn)的深度值的深度域運(yùn)動(dòng)特征，每個(gè)軌跡點(diǎn)的二維時(shí)空域特征和深度域運(yùn)動(dòng)特征均和該軌跡點(diǎn)的時(shí)間點(diǎn)相關(guān)聯(lián)。
6.根據(jù)權(quán)利要求5的手勢(shì)識(shí)別方法，其中，采用窗口大小可變的滑動(dòng)窗口來決定基于哪些以及多少深度圖像來進(jìn)行三維運(yùn)動(dòng)軌跡檢測(cè)和分析，窗口的大小表示以連續(xù)多少幀的深度圖像作為手勢(shì)識(shí)別的輸入；如果基于預(yù)定大小的滑動(dòng)窗口內(nèi)的深度圖像序列的三維運(yùn)動(dòng)軌跡不能同時(shí)匹配與預(yù)定手勢(shì)對(duì)應(yīng)的深度域上的運(yùn)動(dòng)模型和與深度域垂直的平面上的二維運(yùn)動(dòng)軌跡模型，則增大該滑動(dòng)窗口的大小以便將更多的深度圖像幀作為手勢(shì)識(shí)別的輸入，并繼續(xù)進(jìn)行該增大后的滑動(dòng)窗口的大小對(duì)應(yīng)的三維運(yùn)動(dòng)軌跡與該預(yù)定手勢(shì)對(duì)應(yīng)的運(yùn)動(dòng)軌跡模型的匹配。
7.根據(jù)權(quán)利要求2的手勢(shì)識(shí)別方法，其中確定手部候選區(qū)域與人體其他部位之間的位置關(guān)系是否符合做出預(yù)定手勢(shì)情況下的人體測(cè)量學(xué)模型包括: 對(duì)深度圖像進(jìn)行前景分割，以得到人體區(qū)域；從人體區(qū)域中檢測(cè)頭部區(qū)域，計(jì)算頭部區(qū)域的位置；基于頭部位置和手部位置之間的垂直距離是否落入第一預(yù)定范圍，以及頭部位置和手部位置之間的空間距離是否落入第二預(yù)定范圍，驗(yàn)證手勢(shì)是否為預(yù)定手勢(shì)。
8.一種開啟人機(jī)交互系統(tǒng)的方法，包括: 獲得包括手部區(qū)域的深度圖像序列；基于包括手部區(qū)域的深度圖像序列，檢測(cè)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡；根據(jù)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡，識(shí)別抬手手勢(shì)；以及如果識(shí)別到抬手手勢(shì)，則開啟人機(jī)交互系統(tǒng)，進(jìn)入人機(jī)交互狀態(tài)中。
9.一種基于深度圖像的手勢(shì)識(shí)別裝置，包括:三維運(yùn)動(dòng)軌跡檢測(cè)部件，用于基于包括手部區(qū)域的深度圖像序列，檢測(cè)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡；以及手勢(shì)識(shí)別部件，用于根據(jù)手部候選區(qū)域的三維運(yùn)動(dòng)軌跡，識(shí)別預(yù)定手勢(shì)。
10.一種基于深度圖像識(shí)別人體部位預(yù)定動(dòng)作的方法，包括: 基于包括該人體部位區(qū)域的深度圖像序列，檢測(cè)人體部位候選區(qū)域的三維運(yùn)動(dòng)軌跡；以及根據(jù)人體部位候選區(qū)域的三維運(yùn)動(dòng)軌跡，識(shí)別人體部位的預(yù)定動(dòng)作。
【文檔編號(hào)】G06K9/00GK103839040SQ201210490622
【公開日】2014年6月4日申請(qǐng)日期:2012年11月27日優(yōu)先權(quán)日:2012年11月27日
【發(fā)明者】梁玲燕, 趙穎申請(qǐng)人:株式會(huì)社理光

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：梁玲燕;趙穎
技術(shù)所有人：株式會(huì)社理光
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像手勢(shì)識(shí)別相關(guān)技術(shù)

圖像識(shí)別裝置相關(guān)技術(shù)

圖像處理裝置相關(guān)技術(shù)

圖像采集裝置相關(guān)技術(shù)

零損耗深度限流裝置相關(guān)技術(shù)

深度限流裝置相關(guān)技術(shù)

碳化深度測(cè)量裝置相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

基于深度圖像的手勢(shì)識(shí)別方法和裝置制造方法