基于多功能抓取及對(duì)象無(wú)關(guān)框架的機(jī)器人抓取方法及系統(tǒng)

文檔序號(hào)：39109782發(fā)布日期：2024-08-21 11:34閱讀：16來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>五金工具產(chǎn)品及配附件制造技術(shù)

本發(fā)明涉及機(jī)器人智能控制領(lǐng)域，特別是指一種基于多功能抓取及對(duì)象無(wú)關(guān)框架的機(jī)器人抓取方法及系統(tǒng)。

背景技術(shù)：

1、在機(jī)器人研究領(lǐng)域中，機(jī)器人智能抓取一直是熱門的研究方向之一，可廣泛應(yīng)用于工業(yè)制造、物流運(yùn)輸、家庭服務(wù)等領(lǐng)域。傳統(tǒng)的機(jī)器人抓取主要通過(guò)研究人員針對(duì)不同的抓取場(chǎng)景分別設(shè)計(jì)抓取特征，這不僅耗時(shí)，同時(shí)還要求研究人員具有一定的先驗(yàn)知識(shí)。研究人員提前規(guī)劃好機(jī)器人運(yùn)動(dòng)軌跡并通過(guò)數(shù)學(xué)的方法獲取物體的抓取位姿，通過(guò)這種方式抓取物體非常耗時(shí)且效率低下。隨著視覺(jué)技術(shù)的引入和人工智能的飛速發(fā)展，人們對(duì)機(jī)器人的抓取能力提出了更高要求?，F(xiàn)代抓取場(chǎng)景不再局限于結(jié)構(gòu)化環(huán)境，而是更貼近真實(shí)生活，物體擺放雜亂無(wú)章，甚至存在多個(gè)物體堆疊的情況。在這樣的背景下，深度學(xué)習(xí)技術(shù)，尤其是卷積神經(jīng)網(wǎng)絡(luò)在目標(biāo)檢測(cè)領(lǐng)域的突破，為機(jī)器人的抓取技術(shù)帶來(lái)了新的發(fā)展機(jī)遇。國(guó)內(nèi)外研究者在機(jī)器人抓取研究中廣泛采用基于深度學(xué)習(xí)的檢測(cè)算法，通過(guò)大量數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò)模型，網(wǎng)絡(luò)輸出最高質(zhì)量的抓取位姿，機(jī)器人得到該抓取位姿進(jìn)行抓取任務(wù)。這種方法使得機(jī)器人在面對(duì)非結(jié)構(gòu)化場(chǎng)景時(shí)也能取得良好的抓取效果。然而，現(xiàn)實(shí)生活中的抓取環(huán)境往往更為復(fù)雜，如大型垃圾場(chǎng)的垃圾分類和零件分揀等任務(wù)，這些場(chǎng)景中的物體堆疊、形狀各異，對(duì)機(jī)器人抓取是一項(xiàng)極其艱巨的挑戰(zhàn)。

2、現(xiàn)有技術(shù)主要存在下述問(wèn)題：

3、1)傳統(tǒng)的iou計(jì)算策略將抓取矩形框的中心區(qū)域和夾持器兩端的區(qū)域被視為同等重要的程度，在這種計(jì)算策略下網(wǎng)絡(luò)預(yù)測(cè)出的抓取位姿會(huì)使得機(jī)器人的夾持器在抓取時(shí)造成不穩(wěn)定的抓取，甚至造成物體與夾持器的碰撞。

4、2）iou在非重疊抓取框情況下作為損失函數(shù)存在局限性，當(dāng)網(wǎng)絡(luò)預(yù)測(cè)的抓取框與真值不相互重疊時(shí)，?iou指標(biāo)將無(wú)法準(zhǔn)確衡量它們之間的相對(duì)位置關(guān)系，直接給出零值，損失函數(shù)關(guān)于網(wǎng)絡(luò)參數(shù)的梯度也將為0，最終網(wǎng)絡(luò)無(wú)法通過(guò)梯度反向傳播來(lái)更新其權(quán)重以優(yōu)化預(yù)測(cè)抓取框的輸出。

5、3）現(xiàn)有的抓取檢測(cè)網(wǎng)絡(luò)缺乏對(duì)全局信息的感知力，使用卷積操作提取特征時(shí)導(dǎo)致輸入數(shù)據(jù)的位置信息丟失，無(wú)法對(duì)特征進(jìn)行全局建模。

技術(shù)實(shí)現(xiàn)思路

1、為了解決現(xiàn)有技術(shù)存在的技術(shù)問(wèn)題，本發(fā)明實(shí)施例提供了一種基于多功能抓取及對(duì)象無(wú)關(guān)框架的機(jī)器人抓取方法及系統(tǒng)，該對(duì)復(fù)雜環(huán)境及不同物體的適應(yīng)性極強(qiáng)，能夠在存在噪聲和干擾的情況下保持穩(wěn)定的抓取性能。所述技術(shù)方案如下：

2、一種基于多功能抓取及對(duì)象無(wú)關(guān)框架的機(jī)器人抓取方法，包括：

3、s1、對(duì)訓(xùn)練集中的rgb圖像信息進(jìn)行預(yù)處理，得到處理后的rgb圖像信息；

4、s2、根據(jù)所述處理后的rgb圖像信息和深度信息，搭建抓取檢測(cè)模型；

5、s3、基于iou計(jì)算得到損失計(jì)算策略；

6、s4、基于損失計(jì)算策略，對(duì)所述抓取檢測(cè)模型進(jìn)行訓(xùn)練，得到攜帶最優(yōu)的權(quán)重參數(shù)的抓取檢測(cè)模型；

7、s5、控制器根據(jù)所述攜帶最優(yōu)的權(quán)重參數(shù)的抓取檢測(cè)模型，建立抓取位姿配置在相機(jī)坐標(biāo)系與世界坐標(biāo)系間的轉(zhuǎn)化關(guān)系，得到三維世界坐標(biāo)系下的抓取位姿；

8、s6、機(jī)器人根據(jù)三維世界坐標(biāo)系下的抓取位姿，將物體運(yùn)輸至制定的目標(biāo)位置。

9、可選地，所述s1的對(duì)訓(xùn)練集中的rgb圖像信息進(jìn)行預(yù)處理，得到處理后的rgb圖像信息包括：

10、s101、對(duì)rgb圖像信息進(jìn)行放縮和旋轉(zhuǎn)后，對(duì)rgb圖像信息進(jìn)行水平方向和垂直方向上的隨機(jī)移位，得到隨機(jī)移位后的rgb圖像信息；

11、s102、以所述隨機(jī)移位后的rgb圖像信息的中心為基準(zhǔn)，裁剪預(yù)設(shè)尺寸的圖像塊；

12、s103、對(duì)所述圖像塊和對(duì)應(yīng)的標(biāo)簽進(jìn)行歸一化處理，得到處理后的rgb圖像信息。

13、可選地，所述s2的根據(jù)所述處理后的rgb圖像信息和深度信息，搭建抓取檢測(cè)模型包括：

14、s201、所述處理后的rgb圖像信息和深度信息依次經(jīng)過(guò)卷積層和歸一化層后，進(jìn)行非線性化處理，得到輸入特征；

15、s202、全局信息串聯(lián)與局部聚合模塊根據(jù)所述輸入特征，得到全局重要關(guān)鍵特征；

16、s203、基于卷積前饋跳躍子網(wǎng)絡(luò)，將全局重要關(guān)鍵特征轉(zhuǎn)為二維特征圖像的形式的輸出特征；

17、s204、多維多尺度關(guān)注及自適應(yīng)特征融合模塊對(duì)所述輸出特征處理，使所述輸出特征中的與抓取檢測(cè)關(guān)聯(lián)的特征的注意力增強(qiáng)，得到抓取檢測(cè)模型。

18、可選地，所述s202的局信息串聯(lián)與局部聚合模塊根據(jù)所述輸入特征，得到全局重要關(guān)鍵特征包括：

19、s2021、對(duì)所述輸入特征進(jìn)行窗口分割，并計(jì)算每個(gè)窗口的維度，所述輸入特征的維度為d；

20、s2022、每個(gè)窗口獨(dú)立執(zhí)行注意力計(jì)算，得到每個(gè)窗口對(duì)應(yīng)的查詢q、鍵k和值矩陣v；

21、s2023、分別計(jì)算每個(gè)窗口對(duì)應(yīng)的查詢q、鍵k和值矩陣v的點(diǎn)積，將查詢q、鍵k和值矩陣v的點(diǎn)積除以縮放因子，得到每個(gè)頭的注意力分?jǐn)?shù)；

22、s2024、基于softmax函數(shù)將所述每個(gè)頭的注意力分?jǐn)?shù)轉(zhuǎn)換為對(duì)應(yīng)的注意力權(quán)重，基于注意力權(quán)重對(duì)值矩陣v進(jìn)行加權(quán)求和，得到每個(gè)頭的輸出；

23、s2025、將所述每個(gè)頭的輸出沿著最后的輸入維度拼接，得到一個(gè)張量；

24、s2026、將所述張量經(jīng)過(guò)線性層變換為全局重要關(guān)鍵特征，所述全局重要關(guān)鍵特征與所述輸入特征的維度相等。

25、可選地，所述s3的基于iou計(jì)算得到損失計(jì)算策略包括：

26、s301、基于預(yù)測(cè)的抓取矩形框與真值矩形框之間的距離增加時(shí)，預(yù)測(cè)抓取框與真值抓取框相交的區(qū)域面積為0，損失函數(shù)的值對(duì)應(yīng)減小的原則，對(duì)損失函數(shù)iou進(jìn)行改進(jìn)，得到改進(jìn)后的損失函數(shù)；

27、其中，所述改進(jìn)后的損失函數(shù)的計(jì)算公式為公式（1）：

28、;（1）

29、a（a,b）是包含真值抓取框和預(yù)測(cè)抓取框的最小外接矩形面積，a為真值抓取框的最小外接矩形面積，b為預(yù)測(cè)抓取框的最小外接矩形面積；

30、η（a,b）是真值抓取框和預(yù)測(cè)抓取框的并集面積；

31、eiou為改進(jìn)后的損失函數(shù)；

32、s302、根據(jù)eiou定義eiou損失函數(shù)，其中，eiou損失函數(shù)的公式為公式（2）：

33、=0.5-eiou；（2）

34、為eiou損失函數(shù)，為損失計(jì)算策略。

35、可選地，所述s302的根據(jù)eiou定義eiou損失函數(shù)包括：

36、計(jì)算真值抓取框a和預(yù)測(cè)抓取框b不相交時(shí)，eiou的值，包括公式（3）：

37、；（3）

38、其中，m=包含真值抓取框a和預(yù)測(cè)抓取框b的最小外接矩形面積-真值抓取框a和預(yù)測(cè)抓取框b的并集面積；

39、計(jì)算真值抓取框a和預(yù)測(cè)抓取框b相交時(shí)，eiou的值，包括公式（4）：

40、；（4）

41、其中，q=真值抓取框a和預(yù)測(cè)抓取框b的交集面積；

42、根據(jù)公式（3）和公式（4）得到eiou損失函數(shù)。

43、可選地，所述s4的基于損失計(jì)算策略，對(duì)所述抓取檢測(cè)模型進(jìn)行訓(xùn)練，得到攜帶最優(yōu)的權(quán)重參數(shù)的抓取檢測(cè)模型包括：

44、s401、基于損失計(jì)算策略，得到抓取檢測(cè)模型的損失函數(shù)，其中，抓取檢測(cè)模型的總損失函數(shù)的計(jì)算公式為公式（5）：

45、；（5）

46、其中，為抓取檢測(cè)模型的總損失函數(shù)；是抓取置信度損失函數(shù)，是抓取角度損失函數(shù)總和，是抓取寬度損失函數(shù)；

47、s402、基于抓取檢測(cè)模型的損失函數(shù)，通過(guò)驗(yàn)證集對(duì)抓取檢測(cè)模型進(jìn)行測(cè)試，得到攜帶最優(yōu)的權(quán)重參數(shù)的抓取檢測(cè)模型。

48、可選地，所述s5的控制器根據(jù)所述攜帶最優(yōu)的權(quán)重參數(shù)的抓取檢測(cè)模型，建立抓取位姿配置在相機(jī)坐標(biāo)系與世界坐標(biāo)系間的轉(zhuǎn)化關(guān)系，得到三維世界坐標(biāo)系下的抓取位姿包括：

49、s501、控制器調(diào)用深度相機(jī)獲取外部場(chǎng)景信息，利用攜帶最優(yōu)的權(quán)重參數(shù)的抓取檢測(cè)模型生成所述外部場(chǎng)景信息下的多個(gè)的抓取位姿；

50、s502、基于深度相機(jī)的內(nèi)參hci，結(jié)合使用halcon標(biāo)定法得出的相機(jī)坐標(biāo)系與機(jī)器人末端工具坐標(biāo)系之間的旋轉(zhuǎn)矩陣hrc；

51、s503、基于相機(jī)內(nèi)參hci和旋轉(zhuǎn)矩陣hrc計(jì)算得到三維世界坐標(biāo)系下的抓取位姿gw，包括公式（6）：

52、gw?=?hrc(hci(g))；（6）。

53、可選地，所述s6的機(jī)器人根據(jù)三維世界坐標(biāo)系下的抓取位姿，將物體運(yùn)輸至制定的目標(biāo)位置包括：

54、機(jī)器人接受三維世界坐標(biāo)系下的抓取位姿，基于利用moveit接口與逆運(yùn)動(dòng)學(xué)解算，所述機(jī)器人運(yùn)動(dòng)到目標(biāo)位置抓取物體并將物體運(yùn)輸至制定的目標(biāo)位置。

55、一種基于多功能抓取及對(duì)象無(wú)關(guān)框架的機(jī)器人抓取系統(tǒng)，應(yīng)用于上述的基于多功能抓取及對(duì)象無(wú)關(guān)框架的機(jī)器人抓取，所述系統(tǒng)包括：

56、預(yù)處理模塊，用于對(duì)訓(xùn)練集中的rgb圖像信息進(jìn)行預(yù)處理，得到處理后的rgb圖像信息；

57、搭建模塊，用于根據(jù)所述處理后的rgb圖像信息和深度信息，搭建抓取檢測(cè)模型；

58、策略模塊，用于根據(jù)iou計(jì)算得到損失計(jì)算策略；

59、訓(xùn)練模塊，用于根據(jù)損失計(jì)算策略，對(duì)所述抓取檢測(cè)模型進(jìn)行訓(xùn)練，得到攜帶最優(yōu)的權(quán)重參數(shù)的抓取檢測(cè)模型；

60、坐標(biāo)系轉(zhuǎn)化模塊，用于控制器根據(jù)所述攜帶最優(yōu)的權(quán)重參數(shù)的抓取檢測(cè)模型，建立抓取位姿配置在相機(jī)坐標(biāo)系與世界坐標(biāo)系間的轉(zhuǎn)化關(guān)系，得到三維世界坐標(biāo)系下的抓取位姿；

61、驅(qū)動(dòng)模塊，用于驅(qū)動(dòng)機(jī)器人根據(jù)三維世界坐標(biāo)系下的抓取位姿，將物體運(yùn)輸至制定的目標(biāo)位置。

62、本發(fā)明實(shí)施例提供的技術(shù)方案帶來(lái)的有益效果至少包括：

63、本發(fā)明提升了機(jī)器人抓取物體的能力，從原先僅能抓取固定位置的特定物體，發(fā)展到能夠識(shí)別并抓取任意擺放位置的各種類型物體，實(shí)現(xiàn)從物體觀測(cè)數(shù)據(jù)到精確抓取位置和姿態(tài)的準(zhǔn)確映射。

64、本發(fā)明解決了抓取實(shí)時(shí)性難以得到保障的問(wèn)題，本發(fā)明設(shè)計(jì)的方法以毫秒級(jí)別的速度在一個(gè)復(fù)雜場(chǎng)景中生成多個(gè)高質(zhì)量的抓取姿態(tài)，在滿足實(shí)時(shí)性的同時(shí)具有極高的抓取成功率。

65、本發(fā)明可應(yīng)用于各類非結(jié)構(gòu)化場(chǎng)景，解決了傳統(tǒng)的機(jī)器人抓取技術(shù)依賴于物理模型的簡(jiǎn)化和完全可觀測(cè)環(huán)境的假設(shè)難題。給定一個(gè)未知的復(fù)雜工作場(chǎng)景，本發(fā)明的方法即可解算出該工作場(chǎng)景下最優(yōu)的抓取配置，具有智能性。

66、本發(fā)明搭建了一體化的機(jī)器人抓取軟件平臺(tái)系統(tǒng)，增強(qiáng)了人機(jī)交互性。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：高赫佳,趙俊杰,孫長(zhǎng)銀,馬駿杰,楊凌霄,沈杰
技術(shù)所有人：安徽大學(xué)
我是此專利的發(fā)明人

上一篇：廢電池回收箱的制作方法
上一篇：一種自曝光3D打印機(jī)成型平臺(tái)的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、平老師：1.功能涂層設(shè)計(jì)與應(yīng)用 2.柔性電子器件設(shè)計(jì)與應(yīng)用 3.結(jié)構(gòu)動(dòng)態(tài)參數(shù)測(cè)試與裝置研發(fā) 4.智能機(jī)電一體化產(chǎn)品研發(fā) 5.3D打印工藝與設(shè)備
2、潘老師：1.機(jī)電一體化裝備及其控制技術(shù) 2.多傳感器信息融合與質(zhì)量評(píng)定
3、王老師：機(jī)械制造
4、袁老師：1.薄膜氣敏傳感器 2.薄膜太陽(yáng)能電池
5、李老師：新型電力電子技術(shù)在微網(wǎng)中的應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

基于多功能抓取及對(duì)象無(wú)關(guān)框架的機(jī)器人抓取方法及系統(tǒng)