本發(fā)明屬于機(jī)器人控制,具體涉及一種基于環(huán)境位置及剛度影響的機(jī)器人接觸力穩(wěn)定控制方法。
背景技術(shù):
1、機(jī)械臂的工作任務(wù)已經(jīng)從非接觸式的任務(wù)轉(zhuǎn)變到接觸式任務(wù),對(duì)其功能和性能提出了更高的要求。在需要與環(huán)境交互的工作場景中,為了確保目標(biāo)或機(jī)械臂本身不被損壞以及任務(wù)的順利進(jìn)行,必須對(duì)機(jī)械臂進(jìn)行柔順控制。
2、機(jī)械臂的柔順控制的實(shí)現(xiàn)方法分為被動(dòng)柔順和主動(dòng)柔順;被動(dòng)柔順控制的力控制精度較低,對(duì)環(huán)境的適應(yīng)能力有限,因而主動(dòng)柔順控制是主要研究方向。目前研究的主要熱點(diǎn)為阻抗控制,其核心思想是機(jī)械臂與環(huán)境間的作用力和位移偏差當(dāng)成一個(gè)動(dòng)態(tài)系統(tǒng)從而實(shí)現(xiàn)對(duì)機(jī)械臂末端接觸力的間接控制?;谖恢玫淖杩箍刂破魇怯赏獠康淖杩箍刂仆猸h(huán)和位置控制內(nèi)環(huán)組成;通過給定的阻抗關(guān)系將接觸力誤差轉(zhuǎn)換成參考軌跡的修正量;然后控制機(jī)械臂末端沿著修正后的路徑運(yùn)動(dòng),即可實(shí)現(xiàn)對(duì)于接觸力的控制。
3、基于位置的阻抗控制器在控制過程中存在著三個(gè)主要的問題:一是若期望阻抗控制的穩(wěn)態(tài)力誤差為0,則需要準(zhǔn)確的環(huán)境位置信息以及剛度信息,但是這兩個(gè)信息在實(shí)際生產(chǎn)過程中很難準(zhǔn)確獲取。二是阻抗控制的阻抗參數(shù)的確定是算法的核心問題,只有確定合適的阻抗參數(shù)才能夠?qū)崿F(xiàn)機(jī)械臂與環(huán)境交互的準(zhǔn)確的力控制。三是普遍的阻抗控制器的設(shè)計(jì)過程中都是認(rèn)為機(jī)械臂的運(yùn)動(dòng)控制環(huán)不存在誤差,機(jī)械臂能夠完美地跟蹤補(bǔ)償后的軌跡。但是由于機(jī)械臂自身幾何參數(shù)因素,以及運(yùn)動(dòng)過程中存在的非幾何因素影響,導(dǎo)致機(jī)械臂的位置控制會(huì)出現(xiàn)誤差,無法跟蹤補(bǔ)償后的軌跡。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述問題,本發(fā)明的目的在于提供一種基于環(huán)境位置及剛度影響的機(jī)器人接觸力穩(wěn)定控制方法,該方法能在高精密加工制造中考慮到不同的影響因素,滿足加工制造的需求。
2、為實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
3、一種基于環(huán)境位置及剛度影響的機(jī)器人接觸力穩(wěn)定控制方法,包括如下步驟:
4、步驟1:采集機(jī)器人執(zhí)行末端與加工目標(biāo)之間的接觸力并通過訓(xùn)練好的極限學(xué)習(xí)機(jī)預(yù)測(cè)出環(huán)境剛度;
5、步驟2:利用估計(jì)的環(huán)境位置得到機(jī)械臂的估計(jì)理想軌跡ke為環(huán)境剛度,為估計(jì)的環(huán)境位置,fd是期望的接觸力;
6、計(jì)算出理想軌跡與估計(jì)理想軌跡之間的誤差
7、將理想軌跡與估計(jì)理想軌跡之間的誤差帶入阻抗模型中獲得環(huán)境位置估計(jì)誤差m、b、k為阻抗參數(shù);
8、基于迭代學(xué)習(xí)控制建立機(jī)械臂模型:
9、
10、式中,k為迭代次數(shù),第k+1次的輸出等于第k次輸出加上誤差補(bǔ)償項(xiàng),kp、kp、kd為學(xué)習(xí)系數(shù),τ為0~t之間的某個(gè)時(shí)刻的積分,ef為力誤差,為力誤差的微分;
11、設(shè)定采樣周期和當(dāng)前的迭代次數(shù),離散化機(jī)械臂模型獲得最終環(huán)境位置估計(jì)誤差;采用最終環(huán)境位置估計(jì)誤差對(duì)機(jī)械臂末端位置進(jìn)行補(bǔ)償,使機(jī)械臂按照補(bǔ)償后的軌跡進(jìn)行運(yùn)動(dòng),實(shí)現(xiàn)穩(wěn)定的力控制;
12、步驟3:采用mdpso算法對(duì)阻抗參數(shù)m、b、k、以及學(xué)習(xí)系數(shù)kp、kp、kd進(jìn)行優(yōu)化;具體包括如下步驟:
13、首先,隨機(jī)生成初始粒子群,每個(gè)粒子i=1,2…n,n是初始種群中的粒子數(shù);
14、其次,建立適應(yīng)度函數(shù);適應(yīng)度函數(shù)ef是接觸力誤差,ex是位置誤差,tmax是運(yùn)行時(shí)間;
15、然后,采用當(dāng)前個(gè)體極值pbest、當(dāng)前全局最優(yōu)值gbest、響應(yīng)速度最優(yōu)個(gè)體pv、穩(wěn)態(tài)誤差最優(yōu)個(gè)體pss、超調(diào)量最優(yōu)個(gè)體pos和振蕩最優(yōu)個(gè)體po更新粒子,得到粒子的更新率;
16、接著,對(duì)慣性權(quán)重進(jìn)行動(dòng)態(tài)變化,[a,b]為變化區(qū)間,i和itmax分別代表當(dāng)前迭代次數(shù)和最大迭代次數(shù);wi為慣性權(quán)重的初始值;
17、最后,采用變異操作來增強(qiáng)全局搜索能力;每次迭代后,根據(jù)選擇粒子進(jìn)行突變操作,計(jì)算得到的γ小于設(shè)定值的時(shí)對(duì)更新率進(jìn)行變異操作;
18、
19、其中,為變異操作后的更新率,λ為變異系數(shù),ζ是一個(gè)介于0和1之間的隨機(jī)數(shù),用于確定突變方向,ub為變異上限,lb為變異下限。
20、進(jìn)一步地,步驟1中所述極限學(xué)習(xí)機(jī)是通過如下步驟訓(xùn)練的:
21、首先,構(gòu)建初始極限學(xué)習(xí)機(jī)模型,所述極限學(xué)習(xí)機(jī)模型包括輸入層、帶有q個(gè)節(jié)點(diǎn)的隱藏層和輸出層;
22、其次,構(gòu)建訓(xùn)練樣本集,控制機(jī)器人運(yùn)動(dòng)使其執(zhí)行末端與加工目標(biāo)接觸,獲取單一方向上的接觸力和位移數(shù)據(jù)di,通過相鄰兩組數(shù)據(jù)計(jì)算出當(dāng)前接觸力下的環(huán)境剛度構(gòu)建訓(xùn)練樣本集為{fei,kei|i=1,2,…,n};
23、最后,采用構(gòu)建的訓(xùn)練樣本集訓(xùn)練初始極限學(xué)習(xí)機(jī)模型生成訓(xùn)練好的極限學(xué)習(xí)機(jī)。
24、進(jìn)一步地,所述極限學(xué)習(xí)機(jī)中隱藏層的節(jié)點(diǎn)數(shù)量q的確定:采集測(cè)試接觸力測(cè)試集ft并計(jì)算對(duì)應(yīng)的環(huán)境剛度kt,將接觸力數(shù)據(jù)集ft輸入到訓(xùn)練好的極限學(xué)習(xí)機(jī)預(yù)測(cè)出環(huán)境剛度計(jì)算極限學(xué)習(xí)機(jī)預(yù)測(cè)誤差平均值m為測(cè)試集中數(shù)據(jù)數(shù)量,為環(huán)境剛度kt中的第i個(gè)值,為環(huán)境剛度中的第i個(gè)值;
25、設(shè)定q的變化范圍為訓(xùn)練樣本集的10%~100%,對(duì)每個(gè)q對(duì)應(yīng)的極限學(xué)習(xí)機(jī)的誤差平均值,選擇最優(yōu)的誤差平均值所對(duì)應(yīng)的q作為elm的隱藏層節(jié)點(diǎn)數(shù)量。
26、進(jìn)一步地,步驟3中得到粒子的更新率具體包括:
27、首先,根據(jù)當(dāng)前個(gè)體極值pbest和當(dāng)前全局最優(yōu)值gbest更新速度和位置是粒子數(shù)量,k為當(dāng)前迭代次數(shù),為粒子當(dāng)前速度,為原始速度,w為慣性權(quán)重,為粒子當(dāng)前位置,為原始位置,c1為單個(gè)學(xué)習(xí)因子,c2為全局學(xué)習(xí)因子,r1和r2為區(qū)間[0,1]內(nèi)的隨機(jī)值;
28、然后,獲取響應(yīng)速度最優(yōu)個(gè)體pv、穩(wěn)態(tài)誤差最優(yōu)個(gè)體pss、超調(diào)量最優(yōu)個(gè)體pos和振蕩最優(yōu)個(gè)體po;
29、最后,計(jì)算當(dāng)前個(gè)體與響應(yīng)速度最優(yōu)個(gè)體pv、穩(wěn)態(tài)誤差最優(yōu)個(gè)體pss、超調(diào)量最優(yōu)個(gè)體pos和振蕩最優(yōu)個(gè)體po的總的誤差得到粒子的更新率為
30、進(jìn)一步地,所述響應(yīng)速度最優(yōu)個(gè)體pv是指在一個(gè)采用周期內(nèi)力誤差的響應(yīng)速度最快的,所述響應(yīng)速度響應(yīng)速度越小,速度越快,從而確定響應(yīng)速度最優(yōu)個(gè)體pv;t為采用周期,fe為接觸力;
31、穩(wěn)態(tài)誤差最優(yōu)個(gè)體pss是指在一個(gè)采用周期內(nèi)穩(wěn)態(tài)誤差最優(yōu)個(gè)體,所述穩(wěn)態(tài)誤差ess=fe(tdmax),fe(tmax)是最大運(yùn)行時(shí)間的接觸力,ess最小的就是穩(wěn)態(tài)誤差最優(yōu)個(gè)體pss;
32、所述超調(diào)量最優(yōu)個(gè)體pos是指在一個(gè)采用周期內(nèi)超調(diào)量最優(yōu)個(gè)體,所述超調(diào)量eos=femax-fd,femax為實(shí)際接觸力的最大值,fd是期望接觸力,ess最小的個(gè)體即為超調(diào)量優(yōu)個(gè)體;
33、所述振蕩最優(yōu)個(gè)體po是指在一個(gè)采用周期內(nèi)振蕩次數(shù)最少的,滿足[fd-fe(t-t)][fd-fe(t+t)]<0的為一次振蕩,振蕩次數(shù)最少的個(gè)體即為振蕩最優(yōu)個(gè)體po。
34、本發(fā)明具有如下有益效果:
35、(1)針對(duì)環(huán)境信息的獲取,提出一種基于極限學(xué)習(xí)機(jī)與迭代學(xué)習(xí)控制的環(huán)境信息獲取方法,基于得到的環(huán)境信息建立機(jī)械臂運(yùn)動(dòng)的理想軌跡。
36、(2)針對(duì)阻抗控器中參數(shù)的確定,提出了一種多方向粒子群優(yōu)化算法,得到更為準(zhǔn)確的阻抗控制參數(shù)。