本發(fā)明涉及自動(dòng)控制技術(shù)領(lǐng)域,特別是指一種針對(duì)仿生撲翼飛行機(jī)器人的控制方法。
背景技術(shù):
近年來(lái),隨著人們對(duì)無(wú)人機(jī)技術(shù)需求的持續(xù)增加,以及先進(jìn)制造技術(shù)、新材料技術(shù)和新能源技術(shù)的飛速發(fā)展,使仿生撲翼飛行機(jī)器人的研究成為技術(shù)熱點(diǎn)。科學(xué)家們受到飛行昆蟲(chóng)和蜂鳥(niǎo)的啟發(fā),提出了仿生撲翼飛行機(jī)器人的概念,并制造出多種仿生撲翼飛行機(jī)器人。仿生撲翼飛行機(jī)器人的優(yōu)點(diǎn)是體積小,擅長(zhǎng)低空飛行,并具有優(yōu)秀的懸停能力和盤(pán)旋能力。這些突出的優(yōu)點(diǎn)對(duì)目標(biāo)在特定環(huán)境下的搜尋,救援以及軍事偵察提供了可能。
六自由度仿生撲翼飛行機(jī)器人系統(tǒng)的動(dòng)態(tài)模型是很復(fù)雜的。雖然對(duì)動(dòng)態(tài)模型進(jìn)行了簡(jiǎn)化,但還是有很多模型參數(shù)需要獲取。然而,有些模型參數(shù)不能被測(cè)量。即使可以測(cè)得,也需要大量的傳感器,付出很高的代價(jià),并影響控制精度。因此,需要使用可減小仿生撲翼飛行機(jī)器人對(duì)動(dòng)態(tài)模型參數(shù)需求的控制方法來(lái)設(shè)計(jì)控制器。由于神經(jīng)網(wǎng)絡(luò)能很好地近似許多種類的非線性參數(shù),可以使用神經(jīng)網(wǎng)絡(luò)控制方法控制仿生撲翼飛行機(jī)器人。
目前,有關(guān)仿生撲翼飛行機(jī)器人的專利寥寥無(wú)幾,基于仿生撲翼飛行機(jī)器人模型設(shè)計(jì)的控制算法更是少之又少。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明要解決的技術(shù)問(wèn)題是提供一種針對(duì)仿生撲翼飛行機(jī)器人的控制方法,能夠填補(bǔ)仿生撲翼飛行機(jī)器人控制算法的空白。
為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例提供一種針對(duì)仿生撲翼飛行機(jī)器人的控制方法,包括:
對(duì)所述仿生撲翼飛行機(jī)器人進(jìn)行運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)分析,建立拉格朗日型模型;
基于所述拉格朗日型模型,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器;
基于設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器;
基于所述仿生撲翼飛行機(jī)器人的位置控制模型,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的基于模型的位置控制器;
根據(jù)設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器、神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器及基于模型的位置控制器,對(duì)所述仿生撲翼飛行機(jī)器人的姿態(tài)和位置進(jìn)行軌跡跟蹤控制。
進(jìn)一步地,所述拉格朗日型模型表示為:
其中,Dr(qr)、表示矩陣,Dr(qr)=IpT,Ip表示轉(zhuǎn)動(dòng)慣量矩陣,T表示由身體坐標(biāo)系到慣性坐標(biāo)系的坐標(biāo)轉(zhuǎn)換矩陣,表示T對(duì)時(shí)間t的一階導(dǎo)數(shù),L(t)表示一個(gè)使等式成立的矩陣,qr是qr(t)的簡(jiǎn)寫(xiě)形式,qr(t)表示系統(tǒng)姿態(tài)狀態(tài)矩陣,是的簡(jiǎn)寫(xiě)形式,表示qr(t)對(duì)時(shí)間t的一階導(dǎo)數(shù),表示qr(t)對(duì)時(shí)間t的二階導(dǎo)數(shù),τr是τr(t)的簡(jiǎn)寫(xiě)形式,τr(t)表示仿生撲翼飛行機(jī)器人姿態(tài)控制輸入。
進(jìn)一步地,所述帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器表示為:
er1=xr1-xr1d
er2=xr2-αr1
er3=dr(t)-Φ(er2)
其中,τr1表示姿態(tài)控制器,xr1=qr,xr1表示姿態(tài)狀態(tài)矩陣qr(t),xr2表示表示qr(t)對(duì)時(shí)間t的一階導(dǎo)數(shù),xr1d是xr1d(t)的簡(jiǎn)寫(xiě)形式,xr1d(t)=[θ1d(t),θ2d(t),θ3d(t)]T,θ1d(t),θ2d(t),θ3d(t)分別是身體坐標(biāo)系中的三個(gè)歐拉角要跟蹤的期望角度,Kr2表示控制增益,er1、er2表示狀態(tài)偏差,表示系統(tǒng)擾動(dòng)dr(t)的估計(jì)值,表示虛擬速度跟蹤軌跡αr1對(duì)時(shí)間t的一階導(dǎo)數(shù),er3為輔助函數(shù),為er3的估計(jì)值,Φ(er2)關(guān)于er2的函數(shù),為關(guān)于時(shí)間t的一階導(dǎo)數(shù),K(er2)為Φ(er2)關(guān)于er2的導(dǎo)數(shù),表示Dr(xr1)的逆矩陣。
進(jìn)一步地,所述帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器表示為:
er1=xr1-xr1d
er2=xr2-αr1
er3=dr(t)-Φ(er2)
其中,τr2表示神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器,xr1=qr,xr1表示姿態(tài)狀態(tài)矩陣,xr2表示表示姿態(tài)狀態(tài)矩陣對(duì)時(shí)間t的一階導(dǎo)數(shù),xr1d是xr1d(t)的簡(jiǎn)寫(xiě)形式,xr1d(t)=[θ1d(t),θ2d(t),θ3d(t)]T,θ1d(t),θ2d(t),θ3d(t)分別是身體坐標(biāo)系中的三個(gè)歐拉角要跟蹤的期望角度,Kr2表示控制增益,er1、er2表示狀態(tài)偏差,表示系統(tǒng)擾動(dòng)dr(t)的估計(jì)值,C0(xr1,xr2)表示Cr(xr1,xr2)的虛擬部分,αr1表示虛擬速度跟蹤軌跡,表示神經(jīng)網(wǎng)絡(luò)的權(quán)重估計(jì)值,表示的轉(zhuǎn)置,S(Z)表示神經(jīng)網(wǎng)絡(luò)基函數(shù),Z表示神經(jīng)網(wǎng)絡(luò)的輸入,er3為輔助函數(shù),為er3的估計(jì)值,Φ(er2)關(guān)于er2的函數(shù),為關(guān)于時(shí)間t的一階導(dǎo)數(shù),K(er2)為Φ(er2)關(guān)于er2的導(dǎo)數(shù),表示Dr(xr1)的逆矩陣,為表示Dr(xr1)虛擬部分的逆矩陣。
進(jìn)一步地,所述位置控制模型表示為:
其中,Dt、Gt表示矩陣,RIB(qr(t))表示坐標(biāo)系變換陣,qr(t)表示系統(tǒng)姿態(tài)狀態(tài)矩陣,是的簡(jiǎn)寫(xiě)形式,表示qr(t)對(duì)時(shí)間t的二階導(dǎo)數(shù),τt(t)表示位置控制器,dt(t)表示系統(tǒng)擾動(dòng)。
進(jìn)一步地,所述帶有擾動(dòng)觀測(cè)器的基于模型的位置控制器表示為:
et1=xt1-xt1d
et2=xt2-αt1
其中,τt為τt(t)的簡(jiǎn)寫(xiě)形式,τt表示位置控制器,qr是qr(t)的簡(jiǎn)寫(xiě)形式,(RIB(qr))-1表示RIB(qr(t))的逆矩陣,xt1=qt,xt1、qt表示位置變換狀態(tài)矩陣,xt2、表示位置變換狀態(tài)矩陣qt對(duì)時(shí)間t的一階導(dǎo)數(shù),xt1d(t)=[xd(t),yd(t),zd(t)]T,xd(t),yd(t),zd(t)分別表示大地坐標(biāo)系x、y、z方向上要跟蹤的期望位置軌跡,et1、et2表示位置偏差,Kd、Kt4表示控制增益,表示系統(tǒng)擾動(dòng)dt(t)的估計(jì)值,表示虛擬速度跟蹤軌跡αt1對(duì)時(shí)間t的一階導(dǎo)數(shù)。
進(jìn)一步地,所述方法還包括:
采用李雅普諾夫直接法,分析加入所述帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器后閉環(huán)系統(tǒng)的穩(wěn)定性以及系統(tǒng)狀態(tài)的有界性,構(gòu)造的李雅普諾夫函數(shù)表示為:
其中,V1表示構(gòu)造的李雅普諾夫函數(shù),表示與dr(t)之間的誤差,分別表示er1、er2、的轉(zhuǎn)置。
進(jìn)一步地,所述方法還包括:
若er1、er2、都有界,則加入所述帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器后閉環(huán)系統(tǒng)的系統(tǒng)狀態(tài)滿足有界性。
進(jìn)一步地,所述方法還包括:
采用李雅普諾夫直接法,分析加入所述帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器后閉環(huán)系統(tǒng)的穩(wěn)定性以及系統(tǒng)狀態(tài)的有界性,構(gòu)造的李雅普諾夫函數(shù)表示為:
其中,V2表示構(gòu)造的李雅普諾夫函數(shù),D0(xr1)表示Dr(xr1)的虛擬部分,表示與dr(t)之間的誤差,表示神經(jīng)網(wǎng)絡(luò)的權(quán)重誤差,表示的轉(zhuǎn)置,表示預(yù)設(shè)的常數(shù)矩陣的逆矩陣,i=1,2,3,n表示矩陣中元素的數(shù)目,分別表示er1、er2、的轉(zhuǎn)置。
進(jìn)一步地,所述方法還包括:
采用李雅普諾夫直接法,分析加入所述帶有擾動(dòng)觀測(cè)器的基于模型的位置控制器后閉環(huán)系統(tǒng)的穩(wěn)定性以及系統(tǒng)狀態(tài)的有界性,構(gòu)造的李雅普諾夫函數(shù)表示為:
其中,V3表示構(gòu)造的李雅普諾夫函數(shù),表示與dt(t)之間的誤差,分別表示et1、et2、的轉(zhuǎn)置。
本發(fā)明的上述技術(shù)方案的有益效果如下:
上述方案中,通過(guò)對(duì)所述仿生撲翼飛行機(jī)器人進(jìn)行運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)分析,得到處理具有大量未知系統(tǒng)參數(shù)的拉格朗日型模型;基于所述拉格朗日型模型,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器;基于設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器;基于所述仿生撲翼飛行機(jī)器人的位置控制模型,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的基于模型的位置控制器;根據(jù)設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器、神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器及基于模型的位置控制器,只需要較少的傳感器和執(zhí)行器,就能有效地對(duì)仿生撲翼飛行機(jī)器人的姿態(tài)和位置進(jìn)行軌跡跟蹤控制。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例提供的針對(duì)仿生撲翼飛行機(jī)器人的控制方法的流程示意圖;
圖2為本發(fā)明實(shí)施例提供的仿生撲翼飛行機(jī)器人的結(jié)構(gòu)示意圖;
圖3為本發(fā)明實(shí)施例提供的系統(tǒng)在帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器控制下的仿真效果圖;
圖4為本發(fā)明實(shí)施例提供的帶有擾動(dòng)觀測(cè)器的姿態(tài)控制輸入;
圖5為本發(fā)明實(shí)施例提供的系統(tǒng)在帶有擾動(dòng)觀測(cè)器的基于模型的位置控制器控制下的仿真效果圖;
圖6為本發(fā)明實(shí)施例提供的帶有擾動(dòng)觀測(cè)器的基于模型的位置控制輸入示意圖;
圖7為本發(fā)明實(shí)施例提供的系統(tǒng)在帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器控制下的仿真效果圖;
圖8為本發(fā)明實(shí)施例提供的帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制輸入;
圖9為本發(fā)明實(shí)施例提供的系統(tǒng)在帶有擾動(dòng)觀測(cè)器的基于模型的位置控制器控制下的仿真效果圖;
圖10為本發(fā)明實(shí)施例提供的帶有擾動(dòng)觀測(cè)器的基于模型的位置控制輸入示意圖。
具體實(shí)施方式
為使本發(fā)明要解決的技術(shù)問(wèn)題、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖及具體實(shí)施例進(jìn)行詳細(xì)描述。
為了更好地理解本實(shí)施例,先對(duì)本文中的一些簡(jiǎn)寫(xiě)進(jìn)行舉例說(shuō)明,例如,qr是qr(t)的簡(jiǎn)寫(xiě)形式,是的簡(jiǎn)寫(xiě)形式,是的簡(jiǎn)寫(xiě)形式,τr是τr(t)的簡(jiǎn)寫(xiě)形式,τt為τt(t)的簡(jiǎn)寫(xiě)形式,xr1d是xr1d(t)的簡(jiǎn)寫(xiě)形式,其他類似的簡(jiǎn)寫(xiě)不再一一說(shuō)明。
本文中,形式為表示一階導(dǎo)數(shù),表示二階導(dǎo)數(shù),在沒(méi)有特殊說(shuō)明的情況下,都是對(duì)時(shí)間t進(jìn)行求導(dǎo),例如,為w對(duì)時(shí)間t的一階導(dǎo)數(shù)。
參看圖1所示,本發(fā)明實(shí)施例提供的針對(duì)仿生撲翼飛行機(jī)器人的控制方法,包括:
S101,對(duì)所述仿生撲翼飛行機(jī)器人進(jìn)行運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)分析,建立拉格朗日型模型;
S102,基于所述拉格朗日型模型,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器;
S103,基于設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器;
S104,基于所述仿生撲翼飛行機(jī)器人的位置控制模型,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的基于模型的位置控制器;
S105,根據(jù)設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器、神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器及基于模型的位置控制器,對(duì)所述仿生撲翼飛行機(jī)器人的姿態(tài)和位置進(jìn)行軌跡跟蹤控制。
本發(fā)明實(shí)施例所述的針對(duì)仿生撲翼飛行機(jī)器人的控制方法,通過(guò)對(duì)所述仿生撲翼飛行機(jī)器人進(jìn)行運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)分析,得到處理具有大量未知系統(tǒng)參數(shù)的拉格朗日型模型;基于所述拉格朗日型模型,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器;基于設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器;基于所述仿生撲翼飛行機(jī)器人的位置控制模型,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的基于模型的位置控制器;根據(jù)設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器、神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器及基于模型的位置控制器,只需要較少的傳感器和執(zhí)行器,就能有效地對(duì)仿生撲翼飛行機(jī)器人的姿態(tài)和位置進(jìn)行軌跡跟蹤控制。
本實(shí)施例提供的針對(duì)仿生撲翼飛行機(jī)器人的控制方法具體步驟可以包括:
步驟1,如圖2所示為仿生撲翼飛行機(jī)器人的結(jié)構(gòu)示意圖,所述仿生撲翼飛行機(jī)器人可以是六自由度仿生撲翼飛行機(jī)器人,通過(guò)對(duì)所述六自由度仿生撲翼飛行機(jī)器人進(jìn)行運(yùn)動(dòng)學(xué)和動(dòng)力學(xué)分析,得到:
其中,Ip為轉(zhuǎn)動(dòng)慣量矩陣,w為由身體坐標(biāo)系的三個(gè)歐拉角經(jīng)坐標(biāo)轉(zhuǎn)換到慣性坐標(biāo)系的角速,qr(t)表示系統(tǒng)姿態(tài)狀態(tài)矩陣,T是由身體坐標(biāo)系到慣性坐標(biāo)系的坐標(biāo)轉(zhuǎn)換矩陣。
令其中,L(t)是一個(gè)使等式成立的矩陣,無(wú)實(shí)際意義,得到拉格朗日型模型:
式(2)中,矩陣Dr(qr)=IpT,和Dr(qr)無(wú)實(shí)際意義,用于簡(jiǎn)化拉格朗日型模型的表達(dá)形式;系統(tǒng)姿態(tài)狀態(tài)矩陣qr(t)=[θ1 θ2 θ3]T,θ1、θ2、θ3是身體坐標(biāo)系中的三個(gè)歐拉角,分別是俯仰角、扭轉(zhuǎn)角、偏航角;表示系統(tǒng)姿態(tài)狀態(tài)矩陣qr(t)對(duì)時(shí)間t的二階導(dǎo)數(shù),τr表示撲翼飛行器姿態(tài)控制輸入,由身體坐標(biāo)系到慣性坐標(biāo)系的坐標(biāo)轉(zhuǎn)換矩陣T表示為:
令xr1=qr=[θ1,θ2,θ3]T以及于是得到:
其中,dr(t)為系統(tǒng)擾動(dòng),是Dr(xr1)的逆矩陣,是xr1對(duì)時(shí)間t的一階導(dǎo)數(shù),是xr2對(duì)t的一階導(dǎo)數(shù)。
設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器時(shí),xr1和xr2是已知狀態(tài)變量,設(shè)xr1d(t)=[θ1d(t),θ2d(t),θ3d(t)]T,其中,θ1d(t),θ2d(t),θ3d(t)分別是身體坐標(biāo)系中的三個(gè)歐拉角(俯仰角,扭轉(zhuǎn)角,偏航角)要跟蹤的期望角度,則跟蹤的狀態(tài)偏差分別為:
式(4)中,er1、er2表示狀態(tài)偏差,虛擬速度跟蹤軌跡其中,Ar1=Kr1er1,Kr1≥0為控制增益。
根據(jù)式(3),對(duì)式(4)兩邊求關(guān)于時(shí)間t的導(dǎo)數(shù)得:
基于式(6)拉格朗日型模型,設(shè)計(jì)擾動(dòng)觀測(cè)器,對(duì)控制器進(jìn)行優(yōu)化處理,設(shè)輔助函數(shù)為:
er3=dr(t)-Φ(er2) (7)
其中,Φ(er2)為關(guān)于er2的函數(shù)
對(duì)式(8)兩邊求關(guān)于時(shí)間t的導(dǎo)數(shù)得
其中,Φ(er2)關(guān)于er2的導(dǎo)數(shù)為
令的估計(jì)值為
又有擾動(dòng)變量的估計(jì)值為
得到er3的誤差
所以可得干擾的誤差關(guān)于時(shí)間t的導(dǎo)數(shù)
為了證明加入姿態(tài)控制器后系統(tǒng)的穩(wěn)定性和一直有界性,構(gòu)造李雅普諾夫函數(shù)如下
對(duì)式(12)兩邊求關(guān)于時(shí)間t的導(dǎo)數(shù)得
Kr1≥0為控制增益,設(shè)Dr(xr1)和Cr(xr1,xr2)是已知的,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的基于拉格朗日型模型的姿態(tài)控制器為:
其中,τr1為基于拉格朗日型模型的姿態(tài)控制器,Kr2≥0為控制增益;
令其中,γ為大于零的常數(shù),得系統(tǒng)是穩(wěn)定的以及狀態(tài)是有界的
其中,式(16)中ε1,C1為大于0的常數(shù)
其中,γ為大于零的常數(shù),為了保證ε1>0,系統(tǒng)參數(shù)需滿足
λmin(Kr1)>0
其中,I表示單位矩陣,λmin(·)和λmax(·)為矩陣·的最小特征值和最大特征值。
對(duì)式(18)兩邊同時(shí)乘以得
對(duì)式(20)兩邊積分得
因此,狀態(tài)偏差er1有界,同理可得er2,有界,因此,加入所述帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器后閉環(huán)系統(tǒng)的系統(tǒng)狀態(tài)滿足有界性。
步驟2,基于設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器,采用李雅普諾夫直接法來(lái)分析加入神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器后閉環(huán)系統(tǒng)的穩(wěn)定性以及系統(tǒng)狀態(tài)的有界性。
針對(duì)撲翼飛行機(jī)器人設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋控制器,把Dr(xr1)和Cr(xr1,xr2)分成倆部分,虛擬部分設(shè)一個(gè)已知的D0(xr1),則不確定的部分為ΔDr(xr1)=Dr(xr1)-D0(xr1)。同理,設(shè)虛擬部分為C0(xr1,xr2),C0(xr1,xr2)是反對(duì)稱矩陣以及不確定部分為ΔCr(xr1,xr2)=Cr(xr1,xr2)-C0(xr1,xr2)。
設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋控制器為:
其中,τr2為神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋控制器,用于估計(jì)神經(jīng)網(wǎng)絡(luò)W*TS(Z),其中,和W*為神經(jīng)網(wǎng)絡(luò)的權(quán)重誤差,估計(jì)值和真實(shí)值,S(Z)為神經(jīng)網(wǎng)絡(luò)基函數(shù)。
其中,是神經(jīng)網(wǎng)絡(luò)的輸入,∈(Z)是神經(jīng)網(wǎng)絡(luò)的近似偏差。
神經(jīng)網(wǎng)絡(luò)的自適應(yīng)律為
其中,常數(shù)Γi,i=1,2,3為控制增益矩陣,小的正數(shù)σi>0,i=1,2,3。
根據(jù)式(21),重新定義式(5)為
擾動(dòng)觀測(cè)器輔助函數(shù)與基于拉格朗日型模型控制時(shí)一樣,同理可得
設(shè)輔助函數(shù)的估計(jì)值為
同理可得
因此
設(shè)計(jì)李雅普諾夫方程為
n表示矩陣中元素的數(shù)目,對(duì)式(28)兩邊求關(guān)于時(shí)間t的導(dǎo)得
代入式(20),(21),(282),(297)于(30)中得
化簡(jiǎn)得
由于S(Z)<s,其中S(Z)為RBF神經(jīng)網(wǎng)絡(luò)基函數(shù),s為正數(shù)。最終得
其中,C2為常數(shù);
為了保證常數(shù)ε2>0,系統(tǒng)參數(shù)需滿足
λmin(Kr1)>0,λmin(Kr2-I)>0,
λmin[K(er2)D0(xr1)-1-(||K(er2)D0(xr1)-1||2+1)I]>0
和設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器一樣,有er1,er2,有界,即:加入所述帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器后閉環(huán)系統(tǒng)的系統(tǒng)狀態(tài)滿足有界性。
步驟3,基于所述仿生撲翼飛行機(jī)器人的位置控制模型,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的基于模型的位置控制器,采用李雅普諾夫直接法來(lái)分析加入位置控制器后閉環(huán)系統(tǒng)的穩(wěn)定性以及系統(tǒng)狀態(tài)的有界性:
六自由度仿生撲翼飛行機(jī)器人的位置控制模型為
其中,以及坐標(biāo)系變換陣而且RIB(qr(t))=(RBI(qr(t)))-1;其中,Dt、Gt均無(wú)實(shí)際意義,只是用來(lái)簡(jiǎn)化公式,m是仿生撲翼飛行機(jī)器人總質(zhì)量,g表示重力系數(shù),mg是仿生撲翼飛行機(jī)器人的重力,τt為τt(t)的簡(jiǎn)寫(xiě)形式,τt(t)表示位置控制器,dt(t)為系統(tǒng)擾動(dòng)。
令xt1=qt=[x,y,z]T和得
其中,qt=[x,y,z]T為位置變換狀態(tài)矩陣
在設(shè)計(jì)基于模型的控制器時(shí),認(rèn)為xt1和xt2已知,xt1d(t)=[xd(t),yd(t),zd(t)]T,其中,xd(t),yd(t),zd(t)分別是大地坐標(biāo)系x、y、z方向上要跟蹤的期望位置軌跡,則跟蹤位置偏差為
式(37)中,et1、et2表示位置狀態(tài)偏差,虛擬速度跟蹤軌跡At1=Kt3et1,Kt3≥0為控制增益。
把式(36)代入式(37)中得
為設(shè)計(jì)擾動(dòng)觀測(cè)器,設(shè)輔助函數(shù)為
et3=dt(t)-Kdet2 (35)
其中,Kd>0為擾動(dòng)觀測(cè)器控制增益。
對(duì)輔助函數(shù)兩邊求關(guān)于時(shí)間t的導(dǎo)數(shù)得
令輔助函數(shù)的估計(jì)值為
因此
得
設(shè)李雅普諾夫函數(shù)為
對(duì)李雅普諾夫函數(shù)兩邊求關(guān)于時(shí)間t的導(dǎo)數(shù)得
設(shè)計(jì)帶有擾動(dòng)觀測(cè)器基于所述仿生撲翼飛行機(jī)器人的位置控制模型的位置控制器為
其中,Kt4≥0為控制增益。
最后得到
其中,
其中,C3為常數(shù);
為了保證常數(shù)ε3>0,系統(tǒng)參數(shù)需滿足
和設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器一樣,有et1,et2,有界,即:加入所述帶有擾動(dòng)觀測(cè)器的基于模型的位置控制器后閉環(huán)系統(tǒng)的系統(tǒng)狀態(tài)滿足有界性。
步驟4:根據(jù)設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器、神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器及基于模型的位置控制器,對(duì)所述仿生撲翼飛行機(jī)器人的姿態(tài)和位置進(jìn)行軌跡跟蹤控制:
本實(shí)施例中,將基于MATLAB平臺(tái)進(jìn)行數(shù)值仿真,驗(yàn)證針對(duì)仿生撲翼飛行機(jī)器人姿態(tài)和位置控制設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器、神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器及基于模型的位置控制器的控制效果,系統(tǒng)參數(shù)選取如下表1:
表1仿生撲翼飛行機(jī)器人參數(shù)表
對(duì)仿生撲翼飛行機(jī)器人的姿態(tài)和位置進(jìn)行軌跡跟蹤控制,姿態(tài)追蹤軌跡選為位置追蹤軌跡為又假設(shè)姿態(tài)控制以及位置控制的干擾均為狀態(tài)變量初值:xr1(0)=[0.01,0.01,0.01]T,xr2(0)=[0.01,0.01,0.01]T,xt1(0)=[0.01,0.01,0.01]T,xt2(0)=[0.01,0.01,0.01]T。
在設(shè)計(jì)基于模型的控制器時(shí),控制增益選為:Kr1=500,Kr2=500,K(er2)=30,Kt3=600,Kt4=600,Kd=5。
則由圖3和圖5可知,本文設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器和位置控制器能夠有效的對(duì)仿生撲翼飛行機(jī)器人的姿態(tài)和位置進(jìn)行軌跡跟蹤控制,由圖4和圖6可知,姿態(tài)控制器和位置控制器可以實(shí)現(xiàn)。
再根據(jù)設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的基于模型的姿態(tài)控制器,設(shè)計(jì)帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器時(shí),控制增益設(shè)定為:Kr1=300,Kr2=300,K(er2)=50,Kt3=500,Kt4=500,Kd=10,σ1=0.02,σ2=0.02,σ3=0.02,Γ1=100I,Γ2=100I,Γ3=100I。
則由圖7和圖9可知,本文設(shè)計(jì)的帶有擾動(dòng)觀測(cè)器的神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器和帶有擾動(dòng)觀測(cè)器的基于模型的位置控制器能夠有效的對(duì)仿生撲翼飛行機(jī)器人的姿態(tài)和位置進(jìn)行軌跡跟蹤控制。由圖8和圖10可知,神經(jīng)網(wǎng)絡(luò)全狀態(tài)反饋?zhàn)藨B(tài)控制器及基于模型的位置控制器可以實(shí)現(xiàn)。
以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明所述原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。