国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于環(huán)境信息主動感知的智能體具身交互規(guī)劃方法

      文檔序號:40283569發(fā)布日期:2024-12-11 13:25閱讀:31來源:國知局
      一種基于環(huán)境信息主動感知的智能體具身交互規(guī)劃方法

      本發(fā)明涉及協(xié)作智能體具身智能領(lǐng)域,尤其是涉及一種基于環(huán)境信息主動感知的智能體具身交互規(guī)劃方法。


      背景技術(shù):

      1、近年來,隨著智能體行業(yè)應(yīng)用深度和廣度顯著提升,其應(yīng)用場景逐漸從工廠走進社區(qū)開始與人共存的場景下進行作業(yè)。這類具有未知、復雜、稠密、人居特性的作業(yè)場景存在著大量的交互作業(yè)任務(wù)。這將會對智能體作業(yè)過程中的交互動作的適應(yīng)性提出更高的要求。以家居服務(wù)智能體為例,室內(nèi)環(huán)境高度非結(jié)構(gòu)化且動態(tài),人性化環(huán)境,房間內(nèi)充斥各種各樣的可移動物體,例如家具、鞋子、兒童玩具等;甚至是生活在這些環(huán)境中并進行日?;顒拥娜祟?我們自身)都對智能體的自主運動造成重大挑戰(zhàn)。智能體在應(yīng)用過程中既要考慮任務(wù)的完成水平和運動穩(wěn)定性更要考慮運動的安全性。智能體確保作業(yè)場景中動作的適應(yīng)性和安全性是服務(wù)智能體能夠得以應(yīng)用的前提。當前,基于視覺被動單一模態(tài)的環(huán)境感知與表征方法由于忽視了與具身交互密切相關(guān)的隱式物理屬性的感知往往難以滿足智能體運動規(guī)劃約束和具身交互可解釋性的需要。導致智能體在這類場景中的作業(yè)過程出現(xiàn)不協(xié)調(diào)甚至是運動失效的情況。

      2、當前,針對該類場景下的智能體動作規(guī)劃主要的解決方法為:將物體的交互屬性作為先驗存儲在神經(jīng)網(wǎng)絡(luò)的隱空間中,通過視覺觀測的方法,用訓練好的神經(jīng)網(wǎng)絡(luò)來推理物體的操作屬性,并以語義的形式來表征以約束智能體的具身交互動作。

      3、然而,這類方法的存在的主要問題在于缺乏對交互動作結(jié)果的可預測性,往往導致意外的運動失效情況。智能體難以在具身交互過程中理解物體的交互力-交互響應(yīng)時序特征,進而無法預測智能體交互動作的預期結(jié)果,這增加來了智能體交互動作的不穩(wěn)定風險,機器交互動作的安全性無法得到充分保證。


      技術(shù)實現(xiàn)思路

      1、本發(fā)明的目的就是為了提高智能體對配對的交互力-交互響應(yīng)時序信號的理解,進而提高智能體的具身交互適應(yīng)水平,提高機器動作安全性而提供的一種基于環(huán)境信息主動感知的智能體具身交互規(guī)劃方法。

      2、本發(fā)明的目的可以通過以下技術(shù)方案來實現(xiàn):

      3、一種基于環(huán)境信息主動感知的智能體具身交互規(guī)劃方法,方法包括以下步驟:

      4、s1、獲取控制機器人運動的智能體周圍的環(huán)境信息以及智能體與物體交互界面處的信息,所述智能體與物體交互界面處的信息為具身交互感知信號,所述環(huán)境信息為二維圖像和深度,從獲取的信息中抽取最近時刻的采樣數(shù)據(jù),并對采樣數(shù)據(jù)進行對齊,得到對齊的環(huán)境信息以及智能體與物體交互界面處的信息;

      5、s2、將對齊的環(huán)境信息進行目標識別和語義分割,得到語義特征信息,并對對齊的環(huán)境信息進行融合得到智能體作業(yè)環(huán)境,基于對齊的智能體與物體交互界面處的信息推斷交互特性參數(shù),將語義特征信息、智能體作業(yè)環(huán)境和交互特性參數(shù)進行多模態(tài)信息融合表征,得到環(huán)境多維信息;

      6、s3、獲取具身交互感知信號,基于所述具身交互感知信號進行機器人動作的可預期性判斷,若判斷結(jié)果為在預期內(nèi),則基于環(huán)境多維信息和規(guī)劃的具體任務(wù)步驟,基于能量梯度的方法生成一系列的第一具身交互動作,機器人執(zhí)行第一具身交互動作;

      7、反之基于交互特性參數(shù)能量梯度的方法生成一系列的具有交互力特性的第二交互動作,機器人執(zhí)行第二交互動作。

      8、進一步地,所述智能體與物體交互界面處的信息包括交互過程的交互力刺激、物體的響應(yīng)位移、溫度和震動信號,所述具身交互感知信號基于具身交互感知器件獲取。

      9、進一步地,所述具身交互感知器件的空間位置為:

      10、

      11、其中,pi表示第i個感知器件相對于母關(guān)節(jié)的笛卡爾空間位置,pi表示第i個感知器件相對于機器人質(zhì)心坐標系位置,表示感知器件所對應(yīng)的母關(guān)節(jié)相對于機器人質(zhì)心坐標系的齊次變換矩陣。

      12、進一步地,所述基于對齊的智能體與物體交互界面處的信息推斷交互特性參數(shù)的具體步驟為:

      13、獲取對齊的智能體與物體交互界面處的信息為:

      14、

      15、其中,δxm是交互位移,是交互界面處觀測點位的移動速度,fm是交互界面處的相互作用力;

      16、以上獲取的信息用于推斷物體的交互特性參數(shù)θ=[k,d,f]t,推斷過程中,首先物體交互特性被建模為:

      17、y(t)=h(t)θ+v(t)

      18、是系統(tǒng)疊加輸出向量,是系統(tǒng)疊加信息矩陣,是系統(tǒng)狀態(tài)噪聲;

      19、隨后,最小二乘參數(shù)估計方法對物體的交互特性參數(shù)進行估計:

      20、

      21、假設(shè)j1(θ)在時取得最小值,令j1(θ)對的偏導數(shù)為零,得到

      22、

      23、其中,y(j)表示表示交互界面處觀測時序輸入特征,v(t)表示噪聲,ψt表示交互界面處觀測時序輸入信號,j1(θ)表示系統(tǒng)預測誤差,k表示物體彈性操作系數(shù),d表示物體阻尼操作系數(shù),f表示物體操作損失常數(shù)。

      24、進一步地,所述基于所述具身交互感知信號進行機器人動作的可預期性判斷的具體步驟為:

      25、規(guī)劃器首先基于目標位置g生成下一時刻的目標追蹤點g*:

      26、

      27、其中,ε(x)是規(guī)劃器在笛卡爾空間下的有效求解空間,x是機器人當前位置;

      28、判斷機器人在接近目標點過程中,基于具身交互感知信號得到的機器人的運動速度和與外界的交互力是否超過最大安全速度vsafe和最大交互力fsafe,計算交互力的步驟為:計算機器人的在追蹤目標點時加速度

      29、

      30、其中m和c分別表示慣性矩陣和科里奧利矩陣,q表示機器人關(guān)節(jié)空間速度,g表示重力向量;

      31、于是機器人的在追蹤目標點時速度為交互力

      32、進行機器人動作的可預期性判斷,得到機器人動作a的判斷結(jié)果。

      33、進一步地,所述機器人動作a的判斷結(jié)果為:

      34、

      35、其中ad為危險動作,表示不在預期內(nèi),as為安全動作,表達在預期內(nèi)。

      36、進一步地,所述系統(tǒng)預測誤差為:

      37、

      38、其中,y(j)表示表示交互界面處觀測時序輸入特征,v(t)表示噪聲,ψt表示交互界面處觀測時序輸入信號,j1(θ)表示系統(tǒng)預測誤差。

      39、進一步地,所述基于能量梯度的方法生成一系列的第一具身交互動作,機器人執(zhí)行第一具身交互動作具體為:

      40、首先將機器人的工作空間拓撲為機器人本體域障礙物域和自由運動空間域其中表示機器人的位姿,r和h表示當前位姿下的機器人空間構(gòu)型,x表示機器人當前所在的位置,表示機器人的工作空間,表示障礙物域,表示機器本體域,表示工作空間與障礙物域和機器人本體域的差集;

      41、隨后,不同的空間拓撲被分別賦予不同的能量狀態(tài),其中目標域被賦予為具有彈性引力虛擬能量勢場自由運動空間域被定義為具有線性的阻尼場uf(x),障礙物域被定義為具有能量操作代價的uo,d(x)=w(θ,x)做功域,

      42、通過對能量狀態(tài)求導,得到機器人的驅(qū)動指令為:

      43、f*=-grad[u(x)]

      44、所述機器人的驅(qū)動指令為第一具身交互動作。

      45、進一步地,所述能量狀態(tài)為機器人在空間位置為x時所處的能量狀態(tài),具體為:

      46、

      47、其中,uo(x)表示uo,d(x)的集合。

      48、進一步地,,所述基于交互特性參數(shù)能量梯度的方法生成一系列的具有交互力特性的第二交互動作具體為:

      49、計算相第二交互動作具體fact,第二交互動作具體的特性由正弦函數(shù)確定:

      50、fact=fsafesin(ωt),t∈(0,100]

      51、其中w=π/100是交互變化頻率,t是采樣次數(shù)。

      52、與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果:

      53、通過對物體主動的施加一系列的交互力刺激,智能體得以通過多模態(tài)感知器件觀測物體應(yīng)激后的交互力-交互響應(yīng)時序特征?;谶@些觀測特征,智能體得以推斷物體的隱式交互特性進而約束智能體的交互動作,提高智能體對配對的交互力-交互響應(yīng)時序信號的理解,進而提高智能體的具身交互適應(yīng)水平,提高機器動作安全性。

      當前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1