本發(fā)明涉及智能機(jī)器人,具體涉及單次示教的非剛性物體操作技能學(xué)習(xí)系統(tǒng)及方法。
背景技術(shù):
1、傳統(tǒng)的機(jī)器人操作技能學(xué)習(xí)方法通常需要多次示教和反復(fù)訓(xùn)練,特別是在處理非剛性物體時(shí)。非剛性物體,如軟體物體或變形物體,其形狀和特性在操作過程中會(huì)發(fā)生變化,因此對(duì)機(jī)器人操作技能的學(xué)習(xí)提出了更高的要求。然而,傳統(tǒng)方法需要大量的示教和訓(xùn)練數(shù)據(jù),且難以適應(yīng)非剛性物體的復(fù)雜性。
2、此外,傳統(tǒng)的非剛性物體操作方法通常依賴于手工建模和控制策略,這限制了機(jī)器人在實(shí)際操作中的靈活性和適應(yīng)性。手工建模需要專業(yè)知識(shí)和復(fù)雜的過程,并且無(wú)法應(yīng)對(duì)物體變形的不確定性。因此,需要一種新的方法來(lái)克服這些限制,使機(jī)器人能夠更有效地學(xué)習(xí)和執(zhí)行非剛性物體的操作技能。
3、為了解決上述問題,近年來(lái)出現(xiàn)了基于深度學(xué)習(xí)和增強(qiáng)學(xué)習(xí)的機(jī)器人操作技能學(xué)習(xí)方法。深度學(xué)習(xí)技術(shù)可以用于對(duì)物體形狀和變形進(jìn)行建模和識(shí)別,從而提供更準(zhǔn)確的操作信息。增強(qiáng)學(xué)習(xí)技術(shù)則可以通過反饋和優(yōu)化,使機(jī)器人逐步改進(jìn)和優(yōu)化操作策略。然而,這些方法仍然需要大量的示教數(shù)據(jù)和訓(xùn)練時(shí)間,且對(duì)非剛性物體的操作學(xué)習(xí)仍然存在一定的挑戰(zhàn)。
4、現(xiàn)有技術(shù)中,一種機(jī)器人視覺運(yùn)動(dòng)技能學(xué)習(xí)方法及系統(tǒng)(專利號(hào)cn117325174a),該方法只能針對(duì)某一特定物體進(jìn)行技能學(xué)習(xí),當(dāng)操作目標(biāo)物體更更換為同屬于一類但具備幾何形狀差異的新物體時(shí),所學(xué)技能失效,需要針對(duì)新目標(biāo)重新學(xué)習(xí);現(xiàn)有的機(jī)器人操作技能學(xué)習(xí)方法針對(duì)剛性目標(biāo),無(wú)法解決非剛性目標(biāo)的操作技能學(xué)習(xí)。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明目的是克服現(xiàn)有技術(shù)存在的上述不足,提供單次示教的非剛性物體操作技能學(xué)習(xí)系統(tǒng)及方法。該方法旨在解決傳統(tǒng)機(jī)器人操作技能學(xué)習(xí)中示教過程復(fù)雜、耗時(shí)的問題。所提出的方法基于機(jī)器學(xué)習(xí)算法和先進(jìn)的感知技術(shù),使機(jī)器人能夠快速、準(zhǔn)確地學(xué)習(xí)非剛性物體的操作技能。
2、本發(fā)明的目的至少通過如下技術(shù)方案之一實(shí)現(xiàn)。
3、單次示教的非剛性物體操作技能學(xué)習(xí)系統(tǒng),該系統(tǒng)包括:
4、標(biāo)準(zhǔn)典范空間狀態(tài)轉(zhuǎn)換模塊:用于將非剛性目標(biāo)物體的觀測(cè)數(shù)據(jù)從任意形變狀態(tài)轉(zhuǎn)換到統(tǒng)一的標(biāo)準(zhǔn)典范空間狀態(tài);
5、所述標(biāo)準(zhǔn)典范空間狀態(tài)是針對(duì)同屬一類的非剛性目標(biāo)物體所預(yù)定義的統(tǒng)一狀態(tài);針對(duì)同一類具有幾何形狀差異的不同非剛性目標(biāo)物體,將它們?cè)谥皇苤亓τ绊憼顟B(tài)下放置于某一相同的支撐載具后待其自然靜止,該情形下非剛性物體所展示的形變狀態(tài)即可定義為一種標(biāo)準(zhǔn)典范空間狀態(tài);
6、標(biāo)準(zhǔn)典范空間編碼模塊:利用標(biāo)準(zhǔn)典范狀態(tài)下的目標(biāo)點(diǎn)云數(shù)據(jù)進(jìn)行空間特征場(chǎng)構(gòu)建;
7、標(biāo)準(zhǔn)典范空間狀態(tài)轉(zhuǎn)換模塊接收非剛性目標(biāo)物體在任意形變狀態(tài)下的觀測(cè)點(diǎn)云作為輸入數(shù)據(jù),首先將非剛性目標(biāo)物體的點(diǎn)云數(shù)據(jù)轉(zhuǎn)換至標(biāo)準(zhǔn)典范空間狀態(tài),然后將轉(zhuǎn)換所得的標(biāo)準(zhǔn)典范空間狀態(tài)下的點(diǎn)云數(shù)據(jù)輸入標(biāo)準(zhǔn)典范空間編碼模塊,從而構(gòu)建非剛性目標(biāo)物體的空間特征場(chǎng),并將該空間特征場(chǎng)作為系統(tǒng)的輸出數(shù)據(jù)。
8、進(jìn)一步地,所述標(biāo)準(zhǔn)典范空間狀態(tài)模塊包括點(diǎn)云特征提取單元、對(duì)比學(xué)習(xí)單元以及點(diǎn)云坐標(biāo)預(yù)測(cè)單元;
9、點(diǎn)云特征提取單元以非剛性目標(biāo)物體的觀測(cè)點(diǎn)云為輸入,針對(duì)非剛性目標(biāo)物體的觀測(cè)點(diǎn)云中的每一個(gè)點(diǎn)編碼輸出一個(gè)維度大于三的特征向量;
10、對(duì)比學(xué)習(xí)單元以點(diǎn)云特征提取單元所輸出的逐點(diǎn)特征向量為輸入,輸出相應(yīng)對(duì)比學(xué)習(xí)損失;
11、點(diǎn)云坐標(biāo)預(yù)測(cè)單元將標(biāo)準(zhǔn)典范空間劃分為64×64×64的空間網(wǎng)格,針對(duì)輸入的目標(biāo)物體觀測(cè)點(diǎn)云中的每個(gè)點(diǎn),利用其對(duì)應(yīng)的特征向量分別對(duì)x,y,z三個(gè)維度進(jìn)行六十四分類,從而實(shí)現(xiàn)對(duì)非剛性目標(biāo)物體的觀測(cè)點(diǎn)云中的每個(gè)點(diǎn)的標(biāo)準(zhǔn)典范空間坐標(biāo)預(yù)測(cè);
12、所述標(biāo)準(zhǔn)典范空間為非剛性目標(biāo)物體處于標(biāo)準(zhǔn)典范空間狀態(tài)下所占據(jù)的立方體空間,該立方體空間的中心為非剛性目標(biāo)物體的質(zhì)心,該立方體空間的邊長(zhǎng)為非剛性目標(biāo)物體在x,y,z三個(gè)方向中所占據(jù)的最大距離。
13、進(jìn)一步地,點(diǎn)云特征提取單元包括:
14、點(diǎn)云采樣分組單元:利用最遠(yuǎn)點(diǎn)采樣方法,從輸入的非剛性目標(biāo)物體的觀測(cè)點(diǎn)云中選擇一系列關(guān)鍵點(diǎn);然后,以選擇的各關(guān)鍵點(diǎn)為球心,將非剛性目標(biāo)物體的觀測(cè)點(diǎn)云中處于指定半徑距離的球形空間內(nèi)的所有點(diǎn)劃分為同一小組,從而實(shí)現(xiàn)對(duì)非剛性目標(biāo)物體的觀測(cè)點(diǎn)云的采樣和分組;
15、一維卷積層:對(duì)點(diǎn)云采樣分組單元所劃分的每個(gè)小組進(jìn)行卷積操作,小組中的每個(gè)點(diǎn)通過卷積核卷積得到一個(gè)大于三維的特征向量,卷積核大小為1×3;
16、池化層:利用最大化值選擇策略,對(duì)一維卷積層輸出的特征向量進(jìn)行降維處理得到降維向量;
17、全連接層:將池化層所輸出的降維向量進(jìn)行全連接處理,得到關(guān)鍵特征向量;
18、上采樣插值層:對(duì)關(guān)鍵特征向量進(jìn)行上采樣插值計(jì)算,采樣后得到的向量數(shù)與點(diǎn)云采樣分組單元輸入的點(diǎn)數(shù)量一致。
19、進(jìn)一步地,點(diǎn)云坐標(biāo)預(yù)測(cè)單元包括三個(gè)三層全連接單元,分別對(duì)x,y,z三個(gè)維度進(jìn)行坐標(biāo)預(yù)測(cè);預(yù)測(cè)結(jié)果為非剛性目標(biāo)物體的觀測(cè)點(diǎn)云中的每個(gè)點(diǎn)轉(zhuǎn)換至標(biāo)準(zhǔn)典范空間狀態(tài)后的預(yù)測(cè)坐標(biāo),即標(biāo)準(zhǔn)典范空間預(yù)測(cè)坐標(biāo),對(duì)應(yīng)預(yù)測(cè)目標(biāo)點(diǎn);
20、單個(gè)三層全連接單元包括順次連接的三層全連接層,針對(duì)非剛性目標(biāo)物體的觀測(cè)點(diǎn)云中的逐點(diǎn)特征向量進(jìn)行全連接處理,最終輸出一個(gè)六十四維向量,并以最大值所在標(biāo)號(hào)作為三維坐標(biāo)中其中一維的預(yù)測(cè)值。
21、進(jìn)一步地,所述標(biāo)準(zhǔn)典范空間編碼模塊包括點(diǎn)云特征傳播單元和三維網(wǎng)格重建單元;
22、標(biāo)準(zhǔn)典范空間編碼模塊首先建立一個(gè)a×a×a(例如a=64)的三維空間特征向量矩陣,并將三維空間特征向量矩陣中的特征向量均勻分布在標(biāo)準(zhǔn)典范空間中,三維空間特征向量矩陣中的特征向量的初始值為零;將點(diǎn)云特征提取單元輸出的逐點(diǎn)特征向量按標(biāo)準(zhǔn)典范空間預(yù)測(cè)坐標(biāo)累加至該三維空間特征向量矩陣的對(duì)應(yīng)位置上,得到映射完成后的三維空間特征矩陣;點(diǎn)云特征傳播單元對(duì)映射完成后的三維空間特征矩陣進(jìn)行卷積操作,使不同空間位置的特征之間進(jìn)行上下文交互;
23、所述點(diǎn)云特征傳播單元包括三維卷積層,利用卷積(如3×3×3卷積)核對(duì)映射完成后的三維空間特征矩陣進(jìn)行卷積,輸出維度高于三的卷積處理后的三維空間特征矩陣;
24、三維網(wǎng)格重建單元利用卷積處理后的三維空間特征矩陣對(duì)標(biāo)準(zhǔn)典范空間內(nèi)的每個(gè)坐標(biāo)點(diǎn)進(jìn)行網(wǎng)格包圍數(shù)預(yù)測(cè);預(yù)測(cè)結(jié)果用來(lái)進(jìn)行網(wǎng)格重建;
25、三維網(wǎng)格重建單元在預(yù)測(cè)網(wǎng)格包圍數(shù)的過程中的所有中間特征,被按坐標(biāo)位置進(jìn)行拼接從而構(gòu)建與標(biāo)準(zhǔn)典范空間相同大小的空間特征場(chǎng);
26、所述三維網(wǎng)格重建單元包括:
27、特征采樣單元:根據(jù)預(yù)測(cè)目標(biāo)點(diǎn)的坐標(biāo),在三維特征空間矩陣中按坐標(biāo)進(jìn)行加權(quán)特征值采樣;
28、全連接單元:將采樣得到的特征值進(jìn)行全連接處理,最終得到一個(gè)浮點(diǎn)數(shù),作為網(wǎng)格包圍數(shù)預(yù)測(cè)值。
29、單次示教的非剛性物體操作技能學(xué)習(xí)方法,包括以下步驟:
30、s1、構(gòu)建非剛性物體操作技能學(xué)習(xí)系統(tǒng);
31、s2、系統(tǒng)訓(xùn)練數(shù)據(jù)收集:為了得到對(duì)非剛性物體操作技能學(xué)習(xí)系統(tǒng)進(jìn)行預(yù)訓(xùn)練的數(shù)據(jù),在虛擬仿真環(huán)境進(jìn)行訓(xùn)練數(shù)據(jù)的收集,得到訓(xùn)練數(shù)據(jù)集;
32、選定一類物體作為非剛性目標(biāo)物體,在互聯(lián)網(wǎng)中收集不少于二十個(gè)同屬于該類別具有不同幾何形狀差異的非剛性目標(biāo)物體的網(wǎng)格數(shù)據(jù),并對(duì)所收集的非剛性目標(biāo)物體的網(wǎng)格數(shù)據(jù)做簡(jiǎn)化、重建,補(bǔ)全操作;然后將其以設(shè)定的材質(zhì)參數(shù)加載至pybullet中進(jìn)行仿真數(shù)據(jù)收集;在仿真環(huán)境中,對(duì)每一個(gè)非剛性目標(biāo)物體,將其以隨機(jī)的位姿初始化在一桌面的上方,并讓其在重力的作用下自由墜落;在這個(gè)過程中,連續(xù)捕獲它處于不同變形狀態(tài)時(shí)的rgbd數(shù)據(jù);對(duì)所有的非剛性目標(biāo)物體的模型累計(jì)捕獲設(shè)定數(shù)量幀數(shù)據(jù);針對(duì)每一個(gè)不同的非剛性目標(biāo)物體,通過模擬將其在只受到重力影響下放置于相同支撐載具靜置后所達(dá)到的狀態(tài)作為標(biāo)準(zhǔn)典范空間狀態(tài);然后利用非剛性目標(biāo)物體的網(wǎng)格的頂點(diǎn)在形變狀態(tài)下與標(biāo)準(zhǔn)典范空間狀態(tài)下的對(duì)應(yīng)關(guān)系來(lái)生成非剛性目標(biāo)物體上的每點(diǎn)在標(biāo)準(zhǔn)典范空間下的坐標(biāo)真實(shí)值以及標(biāo)準(zhǔn)典范空間狀態(tài)中非剛性目標(biāo)物體上的每點(diǎn)的網(wǎng)格包圍數(shù)真實(shí)值;
33、s3、系統(tǒng)預(yù)訓(xùn)練:將觀測(cè)得到的非剛性目標(biāo)物體的點(diǎn)云數(shù)據(jù)輸入至非剛性物體操作技能學(xué)習(xí)系統(tǒng)輸入端,在標(biāo)準(zhǔn)典范空間狀態(tài)模塊中,點(diǎn)云特征提取單元為點(diǎn)云中的每個(gè)點(diǎn)提取一個(gè)高維特征;對(duì)比學(xué)習(xí)單元對(duì)所有點(diǎn)特征進(jìn)行計(jì)算構(gòu)建對(duì)比學(xué)習(xí)損失;點(diǎn)云坐標(biāo)預(yù)測(cè)單元以每點(diǎn)特征為輸入,并逐點(diǎn)預(yù)測(cè)對(duì)應(yīng)的標(biāo)準(zhǔn)典范空間坐標(biāo),并根據(jù)對(duì)應(yīng)的真實(shí)值計(jì)算預(yù)測(cè)損失;在標(biāo)準(zhǔn)典范空間編碼模塊中,首先構(gòu)建三維特征矩陣,并將其輸入至點(diǎn)云特征傳播單元,進(jìn)行卷積處理;后對(duì)典范空間中的坐標(biāo)點(diǎn)使用三維網(wǎng)格重建單元進(jìn)行網(wǎng)格包圍數(shù)預(yù)測(cè),并結(jié)合真實(shí)值構(gòu)建重建損失;而后根據(jù)對(duì)比損失,坐標(biāo)預(yù)測(cè)損失及重建損失更新系統(tǒng)的策略參數(shù),得到經(jīng)過預(yù)訓(xùn)練后的非剛性物體操作技能學(xué)習(xí)系統(tǒng);
34、s4、技能學(xué)習(xí):在技能演示過程中,給定關(guān)鍵操作步驟中的觀測(cè)點(diǎn)云,以及對(duì)應(yīng)的機(jī)械臂末端位姿t,將它們輸入至經(jīng)過預(yù)訓(xùn)練后的非剛性物體操作技能學(xué)習(xí)系統(tǒng)之中;觀測(cè)點(diǎn)云依次經(jīng)過標(biāo)準(zhǔn)典范空間轉(zhuǎn)換模塊以及標(biāo)準(zhǔn)典范空間編碼模塊最終構(gòu)建標(biāo)準(zhǔn)空間特征神經(jīng)場(chǎng);機(jī)械臂末端位姿t經(jīng)過標(biāo)準(zhǔn)典范空間轉(zhuǎn)換模塊一同被轉(zhuǎn)換至標(biāo)準(zhǔn)空間,表示為;轉(zhuǎn)換至標(biāo)準(zhǔn)空間狀態(tài)的機(jī)械臂末端位姿在神經(jīng)特征場(chǎng)中被進(jìn)行編碼成對(duì)應(yīng)的特征向量;
35、s5、技能泛化:當(dāng)技能應(yīng)用到新的非剛性目標(biāo)物體時(shí),同樣將觀測(cè)得到的目標(biāo)點(diǎn)云輸入至預(yù)訓(xùn)練完成的非剛性物體操作技能學(xué)習(xí)系統(tǒng)之中;點(diǎn)云數(shù)據(jù)經(jīng)過標(biāo)準(zhǔn)典范空間轉(zhuǎn)換模塊以及標(biāo)準(zhǔn)典范空間編碼模塊最終構(gòu)建新的非剛性目標(biāo)物體對(duì)應(yīng)的標(biāo)準(zhǔn)空間特征神經(jīng)場(chǎng);根據(jù)技能學(xué)習(xí)中編碼記錄的機(jī)械臂末端位姿特征向量在新的非剛性目標(biāo)物體的空間特征神經(jīng)場(chǎng)進(jìn)行特征匹配,從而得到針對(duì)新的非剛性目標(biāo)物體的機(jī)械臂末端位姿;根據(jù)新的非剛性目標(biāo)物體得到的在關(guān)鍵操作步驟下的機(jī)械臂末端位姿依次規(guī)劃執(zhí)行動(dòng)作及路徑,完成技能操作。
36、進(jìn)一步地,步驟s3中,所述對(duì)比學(xué)習(xí)損失表示為:
37、,
38、其中,為訓(xùn)練數(shù)據(jù)集中任意一觀測(cè)點(diǎn)云中的第個(gè)點(diǎn)經(jīng)點(diǎn)云特征提取模塊提取得到的特征向量,與分別為訓(xùn)練數(shù)據(jù)集中任意另一觀測(cè)點(diǎn)云中的第j個(gè)點(diǎn)與第個(gè)點(diǎn)經(jīng)點(diǎn)云特征提取模塊提取得到的特征向量;中的第個(gè)點(diǎn)與中的第j個(gè)點(diǎn)具有相同的標(biāo)準(zhǔn)典范空間狀態(tài)坐標(biāo),中的第個(gè)點(diǎn)與中的第k個(gè)點(diǎn)具有不同的標(biāo)準(zhǔn)典范空間狀態(tài)坐標(biāo);表示中任意一點(diǎn)與中任意一點(diǎn)構(gòu)成的所有點(diǎn)對(duì)的集合,為中任意一個(gè)與中的第個(gè)點(diǎn)不具有相同標(biāo)準(zhǔn)典范空間狀態(tài)坐標(biāo)值的點(diǎn)與中的第個(gè)點(diǎn)構(gòu)成的點(diǎn)對(duì);為比例因子常數(shù);
39、所述預(yù)測(cè)損失表示為:
40、,
41、其中,,,為每點(diǎn)觀測(cè)點(diǎn)云p中任意一點(diǎn)在標(biāo)準(zhǔn)典范空間中的坐標(biāo)真實(shí)值,,,為坐標(biāo)預(yù)測(cè)單元對(duì)該點(diǎn)三維坐標(biāo)值的預(yù)測(cè)概率;
42、所述重建損失表示為:
43、,
44、其中,為預(yù)測(cè)目標(biāo)點(diǎn)處的網(wǎng)格包圍數(shù)真實(shí)值,為預(yù)測(cè)目標(biāo)點(diǎn)處的網(wǎng)格包圍數(shù)預(yù)測(cè)值;
45、根據(jù)對(duì)比損失、預(yù)測(cè)損失以及重建損失更新非剛性物體操作技能學(xué)習(xí)系統(tǒng)策略參數(shù)的方式表示為:
46、,
47、其中,為更新前的非剛性物體操作技能學(xué)習(xí)系統(tǒng)的參數(shù),為基于所有損失更新的非剛性物體操作技能學(xué)習(xí)系統(tǒng)的參數(shù),為內(nèi)部學(xué)習(xí)率,為所有損失聯(lián)合梯度計(jì)算,為基于和觀測(cè)點(diǎn)云的對(duì)比學(xué)習(xí)損失,為基于和觀測(cè)點(diǎn)云的預(yù)測(cè)損失,為基于和觀測(cè)點(diǎn)云的重建損失;
48、為一批訓(xùn)練過程中所有樣本的三種損失之和。
49、進(jìn)一步地,步驟s4中,技能學(xué)習(xí)過程中的機(jī)器人末端位姿通過以下方法被變換至標(biāo)準(zhǔn)典范空間:
50、給定觀測(cè)點(diǎn)云p以及對(duì)應(yīng)的機(jī)械臂末端位姿t,取此時(shí)觀測(cè)目標(biāo)被機(jī)械臂末端平行夾爪夾持的點(diǎn)云集合記作并取它們?cè)跇?biāo)準(zhǔn)典范空間下的坐標(biāo)集合記為,利用最小二乘法計(jì)算兩個(gè)坐標(biāo)集合之間的位移旋轉(zhuǎn)矩陣;此時(shí),即可通過公式將機(jī)械臂末端位姿轉(zhuǎn)換至標(biāo)準(zhǔn)典范空間狀態(tài);其中,是觀測(cè)點(diǎn)云p中被夾爪所加持的第個(gè)點(diǎn),是點(diǎn)被轉(zhuǎn)換至標(biāo)準(zhǔn)典范空間狀態(tài)下的坐標(biāo);是將觀測(cè)點(diǎn)云p被夾爪加持部分從所觀測(cè)時(shí)的變形狀態(tài)轉(zhuǎn)換至標(biāo)準(zhǔn)典范空間狀態(tài)下的轉(zhuǎn)換矩陣。
51、進(jìn)一步地,步驟s4中,利用神經(jīng)特征場(chǎng)將轉(zhuǎn)換至標(biāo)準(zhǔn)空間狀態(tài)的機(jī)械臂末端位姿h編碼為特征向量的方法如下:
52、給定機(jī)械臂末端的三維網(wǎng)格模型m,利用均勻采樣法在三維網(wǎng)格模型m上采樣n個(gè)點(diǎn)構(gòu)成查詢點(diǎn)云;將查詢點(diǎn)云g按轉(zhuǎn)換至標(biāo)準(zhǔn)空間狀態(tài)的機(jī)械臂末端位姿h放置于標(biāo)準(zhǔn)典范空間中,此時(shí)的點(diǎn)云集合被表示為;對(duì)點(diǎn)云集合中的每一個(gè)坐標(biāo)點(diǎn),將其輸入至標(biāo)準(zhǔn)典范空間編碼模塊的網(wǎng)格數(shù)預(yù)測(cè)單元中,并將針對(duì)該點(diǎn)生成的中間特征向量進(jìn)行拼接得到該點(diǎn)的編碼特征向量;將中所有點(diǎn)生成的編碼特征向量構(gòu)成一個(gè)集合記為,即完成利用神經(jīng)特征場(chǎng)對(duì)該位姿的編碼;表示由n個(gè)三維坐標(biāo)點(diǎn)所構(gòu)成的點(diǎn)云集合。
53、進(jìn)一步地,步驟s5中,利用神經(jīng)特征場(chǎng)對(duì)新的非剛性目標(biāo)物體進(jìn)行位姿匹配的方法如下:
54、給定新的非剛性目標(biāo)物體的觀測(cè)點(diǎn)云,?將其依次輸入至標(biāo)準(zhǔn)典范空間轉(zhuǎn)換模塊,標(biāo)準(zhǔn)典范空間編碼模塊,構(gòu)建面向新的非剛性目標(biāo)物體的神經(jīng)特征場(chǎng);利用查詢點(diǎn)云,隨機(jī)初始化一個(gè)位姿,將點(diǎn)云按位姿移動(dòng)至該位置得到,并利用此時(shí)輸入新的非剛性目標(biāo)物體的觀測(cè)點(diǎn)云的三維重建單元對(duì)中的每個(gè)點(diǎn)生成編碼特征向量得到編碼特征向量集合;優(yōu)化與的差來(lái)優(yōu)化直到收斂,此時(shí)的所取得的值即為匹配得到的新的非剛性目標(biāo)物體在標(biāo)準(zhǔn)狀態(tài)下的末端操作位姿;
55、該過程用公式表示為:
56、,
57、其中,為將示教抓取位姿根據(jù)觀測(cè)到的新的非剛性目標(biāo)物體的形狀和形變狀態(tài)而將示教過程中的抓取位姿泛化到新的非剛性目標(biāo)物體上的泛化抓取位姿。
58、與現(xiàn)有技術(shù)相比,本發(fā)明具有以下有益效果及優(yōu)點(diǎn):
59、1.本發(fā)明相較于傳統(tǒng)方法,本方法只需要進(jìn)行一次示教,大大減少了示教的次數(shù)和時(shí)間,極大地提高了操作學(xué)習(xí)的效率和便利性;
60、2.該方法不依賴于手工建模和控制策略,能夠適應(yīng)非剛性物體的復(fù)雜性和不確定性。機(jī)器人能夠根據(jù)實(shí)際物體的形狀和變形,靈活地調(diào)整操作策略,提高操作的精確性和成功率;
61、3.所提出的方法可廣泛應(yīng)用于各種工業(yè)和服務(wù)領(lǐng)域,如物流、醫(yī)療、家庭助理等,為機(jī)器人在處理非剛性物體時(shí)提供了一種高效、智能的操作技能學(xué)習(xí)方法。