基于事件驅(qū)動的頭部姿態(tài)估計方法、系統(tǒng)、設(shè)備與介質(zhì)

文檔序號：39993747發(fā)布日期：2024-11-15 14:46閱讀：29來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

本發(fā)明涉及計算機視覺領(lǐng)域，尤其涉及一種基于事件驅(qū)動的頭部姿態(tài)估計方法、系統(tǒng)、設(shè)備與介質(zhì)。

背景技術(shù)：

1、頭部姿態(tài)估計在計算機視覺領(lǐng)域也是一個重要的研究方向。其主要任務(wù)是通過分析場景序列中的人臉圖像，準確計算出頭部的三個旋轉(zhuǎn)角度(俯仰角、偏航角和翻滾角)。頭部姿態(tài)估計技術(shù)在多個應(yīng)用領(lǐng)域中發(fā)揮著關(guān)鍵作用，包括駕駛員監(jiān)控系統(tǒng)中的注意力檢測、虛擬現(xiàn)實中的用戶交互、人機交互系統(tǒng)中的情感分析，以及安防監(jiān)控中的身份識別等。隨著深度學(xué)習(xí)技術(shù)的發(fā)展，頭部姿態(tài)估計的精度和魯棒性得到了顯著提升，現(xiàn)有的方法能夠更準確地估計頭部姿態(tài)，同時提高對快速運動和部分遮擋的適應(yīng)能力。

2、然而，盡管在較慢速度和正常光照下取得了顯著成就，頭部姿態(tài)估計技術(shù)在復(fù)雜光照條件和快速運動場景下的應(yīng)用仍然面臨重大挑戰(zhàn)。在這種條件下，傳統(tǒng)圖像的質(zhì)量通常會遭受嚴重的質(zhì)量退化，例如，在高速運動場景下會出現(xiàn)泛模糊的情況、強光條件下頭部紋理信息失真、弱光條件下頭部細節(jié)的大量丟失以及顏色信息的嚴重失真、光照動態(tài)變化的條件下信息捕捉不足等問題，都會影響到頭部姿態(tài)估計算法的精度和穩(wěn)定性。更為關(guān)鍵的是，大多數(shù)現(xiàn)行的傳統(tǒng)圖像估計算法比較依賴清晰、高質(zhì)量的圖像輸入作為前提，而這一條件在緊急制動、夜間駕駛或遠近光燈間接性閃爍等實際場景中往往難以滿足。正因為對清晰高質(zhì)量的頭部圖像的依賴性，極大地限制了傳統(tǒng)圖像頭部姿態(tài)估計技術(shù)在多樣環(huán)境下的應(yīng)用潛力和實際效果。

3、有鑒于此，特提出本發(fā)明。

技術(shù)實現(xiàn)思路

1、本發(fā)明的目的是提供一種基于事件驅(qū)動的頭部姿態(tài)估計方法、系統(tǒng)、設(shè)備與介質(zhì)，旨在利用事件數(shù)據(jù)的高動態(tài)特性以及捕捉物體的高速運動特性，從而能提高在高速運動時的頭部姿態(tài)估計的精度，并能提升多種光照條件下的魯棒性。

2、本發(fā)明的目的是通過以下技術(shù)方案實現(xiàn)的：

3、一種基于事件驅(qū)動的頭部姿態(tài)估計方法，包括：

4、收集不同分辨率下的場景事件流，進行體素網(wǎng)格化處理，并獲得標簽信息；

5、構(gòu)建多場景下的頭部姿態(tài)估計網(wǎng)絡(luò)，其包括：事件時空信息融合模塊、特征提取模塊、事件運動信息感知注意力模塊以及頭部姿態(tài)估計模塊；

6、使用體素網(wǎng)格化處理后的事件數(shù)據(jù)訓(xùn)練所述頭部姿態(tài)估計網(wǎng)絡(luò)，包括：輸入體素網(wǎng)格化處理后的事件數(shù)據(jù)，經(jīng)事件時空信息融合模塊分別提取均值信息和峰值信息，并進行邊緣檢測后生成融合空間信息的事件表征，經(jīng)過特征提取模塊提取特征信息后，所述事件運動信息感知注意力模塊采用注意力機制捕獲頭部信息，獲得事件運動信息感知的特征信息，再經(jīng)頭部姿態(tài)估計模塊估計出頭部姿態(tài)信息；結(jié)合估計出的頭部姿態(tài)信息與對應(yīng)的標簽信息計算訓(xùn)練損失函數(shù)，使用訓(xùn)練損失函數(shù)訓(xùn)練所述頭部姿態(tài)估計網(wǎng)絡(luò)；

7、對于輸入的體素網(wǎng)格化處理后的事件數(shù)據(jù)，通過訓(xùn)練后的頭部姿態(tài)估計網(wǎng)絡(luò)估計頭部姿態(tài)信息。

8、一種基于事件驅(qū)動的頭部姿態(tài)估計系統(tǒng)，包括：

9、數(shù)據(jù)收集與處理單元，用于收集不同分辨率下的場景事件流，進行體素網(wǎng)格化處理，并獲得標簽信息；

10、網(wǎng)絡(luò)構(gòu)建單元，用于構(gòu)建多場景下的頭部姿態(tài)估計網(wǎng)絡(luò)，其包括：事件時空信息融合模塊、特征提取模塊、事件運動信息感知注意力模塊以及頭部姿態(tài)估計模塊；

11、網(wǎng)絡(luò)訓(xùn)練單元，用于使用體素網(wǎng)格化處理后的事件數(shù)據(jù)訓(xùn)練所述頭部姿態(tài)估計網(wǎng)絡(luò)，包括：輸入體素網(wǎng)格化處理后的事件數(shù)據(jù)，經(jīng)事件時空信息融合模塊分別提取均值信息和峰值信息，并進行邊緣檢測后生成融合空間信息的事件表征，經(jīng)過特征提取模塊提取特征信息后，所述事件運動信息感知注意力模塊采用注意力機制捕獲頭部信息，獲得事件運動信息感知的特征信息，再經(jīng)頭部姿態(tài)估計模塊估計出頭部姿態(tài)信息；結(jié)合估計出的頭部姿態(tài)信息與對應(yīng)的標簽信息計算訓(xùn)練損失函數(shù)，使用訓(xùn)練損失函數(shù)訓(xùn)練所述頭部姿態(tài)估計網(wǎng)絡(luò)；

12、頭部姿態(tài)估計單元，用于對于輸入的體素網(wǎng)格化處理后的事件數(shù)據(jù)，通過訓(xùn)練后的頭部姿態(tài)估計網(wǎng)絡(luò)估計頭部姿態(tài)信息。

13、一種處理設(shè)備，包括：一個或多個處理器；存儲器，用于存儲一個或多個程序；

14、其中，當(dāng)所述一個或多個程序被所述一個或多個處理器執(zhí)行時，使得所述一個或多個處理器實現(xiàn)前述的方法。

15、一種可讀存儲介質(zhì)，存儲有計算機程序，當(dāng)計算機程序被處理器執(zhí)行時實現(xiàn)前述的方法。

16、由上述本發(fā)明提供的技術(shù)方案可以看出，基于事件信號驅(qū)動，通過利用事件信號的獨特優(yōu)勢應(yīng)用于多樣場景下的頭部姿態(tài)估計任務(wù)中，這種方法在提高傳統(tǒng)圖像在頭部高速運動場景下的泛模糊情況有顯著優(yōu)勢，同時對復(fù)雜光照場景下傳統(tǒng)圖像紋理失真也有很好的改善作用；構(gòu)建的網(wǎng)絡(luò)中通過事件時空信息融合模塊，降低了某些場景下事件信息的稀疏所帶來的影響，提高了多場景下頭部姿態(tài)估計的精度，通過事件運動信息感知模塊，將注意力集中于對頭部姿態(tài)估計幫助更大的人臉關(guān)鍵部位，有效提高了關(guān)注稀疏事件運動信息有效部分的能力，進一步增強了系統(tǒng)在復(fù)雜環(huán)境中的應(yīng)用能力；并且，采用有監(jiān)督的訓(xùn)練方式進行訓(xùn)練，利用事件信息的高動態(tài)和去模糊的特性提高了不同場景下的頭部姿態(tài)估計精度。

技術(shù)特征：

1.一種基于事件驅(qū)動的頭部姿態(tài)估計方法，其特征在于，包括：

2.根據(jù)權(quán)利要求1所述的一種基于事件驅(qū)動的頭部姿態(tài)估計方法，其特征在于，所述收集不同分辨率下的場景事件流，進行體素網(wǎng)格化處理，并獲得標簽信息包括：

3.根據(jù)權(quán)利要求1所述的一種基于事件驅(qū)動的頭部姿態(tài)估計方法，其特征在于，所述事件時空信息融合模塊包括：均值信息提取模塊、峰值信息模塊、邊緣檢測模塊與融合模塊；其中：

4.根據(jù)權(quán)利要求1所述的一種基于事件驅(qū)動的頭部姿態(tài)估計方法，其特征在于，所述事件運動信息感知注意力模塊包括：若干層處理模塊，每一層處理模塊包括：依次設(shè)置的第一卷積層、分組卷積模塊、深度膨脹卷積模塊、批量歸一化模塊、第二卷積層與注意力乘積模塊，且每一卷積層后方均設(shè)有激活函數(shù)；

5.根據(jù)權(quán)利要求1所述的一種基于事件驅(qū)動的頭部姿態(tài)估計方法，其特征在于，所述經(jīng)頭部姿態(tài)估計模塊估計出頭部姿態(tài)信息表示為：

6.根據(jù)權(quán)利要求1或5所述的一種基于事件驅(qū)動的頭部姿態(tài)估計方法，其特征在于，結(jié)合估計出的頭部姿態(tài)信息與對應(yīng)的標簽信息計算損失函數(shù)包括：

7.根據(jù)權(quán)利要求6所述的一種基于事件驅(qū)動的頭部姿態(tài)估計方法，其特征在于，

8.一種基于事件驅(qū)動的頭部姿態(tài)估計系統(tǒng)，其特征在于，包括：

9.一種處理設(shè)備，其特征在于，包括：一個或多個處理器；存儲器，用于存儲一個或多個程序；

10.一種可讀存儲介質(zhì)，存儲有計算機程序，其特征在于，當(dāng)計算機程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1～7任一項所述的方法。

技術(shù)總結(jié)
本發(fā)明公開了一種基于事件驅(qū)動的頭部姿態(tài)估計方法、系統(tǒng)、設(shè)備與介質(zhì)，方案中：基于事件信號驅(qū)動，通過利用事件信號的獨特優(yōu)勢應(yīng)用于多樣場景下的頭部姿態(tài)估計任務(wù)中，在提高傳統(tǒng)圖像在頭部高速運動場景下的泛模糊情況有顯著優(yōu)勢，同時對復(fù)雜光照場景下傳統(tǒng)圖像紋理失真也有很好的改善作用；通過網(wǎng)絡(luò)中的事件時空信息融合模塊，降低了某些場景下事件信息的稀疏所帶來的影響，提高了多場景下頭部姿態(tài)估計的精度，通過網(wǎng)絡(luò)中的事件運動信息感知模塊，將注意力集中于對頭部姿態(tài)估計幫助更大的人臉關(guān)鍵部位，有效提高了關(guān)注稀疏事件運動信息有效部分的能力，進一步增強了系統(tǒng)在復(fù)雜環(huán)境中的應(yīng)用能力。

技術(shù)研發(fā)人員：孫曉艷,袁嘉輝,張越一
受保護的技術(shù)使用者：中國科學(xué)技術(shù)大學(xué)
技術(shù)研發(fā)日：
技術(shù)公布日：2024/11/14

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：孫曉艷,袁嘉輝,張越一
技術(shù)所有人：中國科學(xué)技術(shù)大學(xué)
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

基于事件驅(qū)動的頭部姿態(tài)估計方法、系統(tǒng)、設(shè)備與介質(zhì)

基于事件驅(qū)動的頭部姿態(tài)估計方法、系統(tǒng)、設(shè)備與介質(zhì)