本發(fā)明涉及多智能體系統(tǒng)和編隊(duì)控制領(lǐng)域,具體涉及一種使用狀態(tài)觀測(cè)器的領(lǐng)導(dǎo)跟隨編隊(duì)軌跡跟蹤控制的方法。
背景技術(shù):
1、作為多智能體系統(tǒng)這一領(lǐng)域中最為熱門(mén)的研究方向,編隊(duì)控制問(wèn)題以其在各種應(yīng)用領(lǐng)域的使用前景及存在于其中的挑戰(zhàn)性理論問(wèn)題,近年來(lái)受到了越來(lái)越多的關(guān)注。其控制目標(biāo)一般為使得各智能體的狀態(tài)滿足某些規(guī)定的約束條件。
2、考慮到多智能體系統(tǒng)的規(guī)模與日俱增,大量信息通過(guò)網(wǎng)絡(luò)交換會(huì)產(chǎn)生阻塞導(dǎo)致時(shí)間延遲和數(shù)據(jù)丟失問(wèn)題,采用預(yù)測(cè)控制機(jī)制可以主動(dòng)補(bǔ)償網(wǎng)絡(luò)中的時(shí)間延遲和數(shù)據(jù)丟失,達(dá)到與本地控制系統(tǒng)相同的控制效果。對(duì)虛擬領(lǐng)導(dǎo)者進(jìn)行軌跡規(guī)劃可以使編隊(duì)控制更加靈活,更加貼合實(shí)際。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提出了一種考慮延遲和丟包的多智能體系統(tǒng)實(shí)現(xiàn)編隊(duì)軌跡跟蹤的方法,以建立網(wǎng)絡(luò)化多智能體系統(tǒng)的數(shù)學(xué)模型,設(shè)計(jì)狀態(tài)觀測(cè)器,解決具有通信約束的網(wǎng)絡(luò)化多智能體系統(tǒng)的編隊(duì)問(wèn)題。
2、本發(fā)明提出一種具有時(shí)間延遲和數(shù)據(jù)丟失的網(wǎng)絡(luò)化多智能體系統(tǒng)實(shí)現(xiàn)領(lǐng)導(dǎo)跟隨編隊(duì)軌跡跟蹤的方法,該方法包括以下步驟:
3、步驟一:建立網(wǎng)絡(luò)化多智能體系統(tǒng)虛擬領(lǐng)導(dǎo)者和跟隨者的數(shù)學(xué)模型,并對(duì)數(shù)學(xué)模型進(jìn)行簡(jiǎn)化;
4、步驟二:對(duì)虛擬領(lǐng)導(dǎo)者進(jìn)行軌跡規(guī)劃,設(shè)計(jì)一種基于改進(jìn)人工勢(shì)場(chǎng)法的路徑規(guī)劃算法,使虛擬領(lǐng)導(dǎo)者的避障軌跡更加平滑;
5、步驟三:在確保虛擬領(lǐng)導(dǎo)者能夠收斂到目標(biāo)點(diǎn)的前提下,解決傳統(tǒng)人工勢(shì)場(chǎng)法中的目標(biāo)不可達(dá)和局部極小值問(wèn)題;
6、步驟四:為了估計(jì)智能體當(dāng)前時(shí)刻的狀態(tài),根據(jù)智能體過(guò)時(shí)的狀態(tài)信息,設(shè)計(jì)狀態(tài)觀測(cè)器;
7、步驟五:利用觀測(cè)器得到的估計(jì)值,設(shè)計(jì)能夠主動(dòng)補(bǔ)償網(wǎng)絡(luò)中時(shí)間延時(shí)和數(shù)據(jù)丟失的預(yù)測(cè)控制協(xié)議;
8、步驟六:根據(jù)預(yù)測(cè)控制協(xié)議推導(dǎo)出閉環(huán)誤差系統(tǒng),獲得預(yù)測(cè)控制協(xié)議的反饋增益矩陣滿足的條件;
9、步驟七:將反饋增益矩陣代入預(yù)測(cè)控制協(xié)議中,利用預(yù)測(cè)控制協(xié)議實(shí)現(xiàn)領(lǐng)導(dǎo)跟隨編隊(duì)軌跡跟蹤控制;
10、進(jìn)一步的,步驟一中所述網(wǎng)絡(luò)化多智能體數(shù)學(xué)模型表示為:
11、跟隨者的動(dòng)力學(xué)模型描述如下:
12、xi(t+1)=xi(t)+tvi(t)
13、vi(t+1)=vi(t)+tui(t)
14、其中,和分別為第i個(gè)跟隨者在t時(shí)刻的位置、速度和控制輸入向量,t為采樣周期,i∈{1,2,...n}。
15、虛擬領(lǐng)導(dǎo)者的動(dòng)力學(xué)模型描述如下:
16、x0(t+1)=x0(t)+tv0(t)
17、v0(t+1)=v0(t)+tu0(t)
18、其中,和分別為虛擬領(lǐng)導(dǎo)者在t時(shí)刻的位置、速度和控制輸入向量。
19、顯然式跟隨者動(dòng)力學(xué)模型可簡(jiǎn)化成如下形式:
20、
21、其中,和為系統(tǒng)矩陣,表示跟隨者的輸出向量,表示跟隨者的狀態(tài)向量。
22、同理式虛擬領(lǐng)導(dǎo)者動(dòng)力學(xué)方程可簡(jiǎn)化成如下形式:
23、
24、其中,為系統(tǒng)矩陣,表示虛擬領(lǐng)導(dǎo)者的狀態(tài)向量。
25、進(jìn)一步的,步驟二中所述的改進(jìn)人工勢(shì)場(chǎng)法的路徑規(guī)劃算法表示為:
26、假設(shè)智能體的運(yùn)動(dòng)空間中存在n個(gè)障礙物,它們的外包圓圓心和半徑分別為xobsi和robsi,智能體的位置為x,速度目標(biāo)點(diǎn)的位置為xtar。智能體到第i個(gè)障礙物的最短距離為ρi=||x-xobsi||-robsi,各個(gè)障礙物的作用距離為ρ0。
27、將智能體與目標(biāo)點(diǎn)的距離||x-xtar||引入到引力中,且只讓其作用一半的路程,一是為了使路徑更加平滑,二是確保智能體能收斂到目標(biāo)點(diǎn),因此引力修改為如下形式:
28、
29、其中,kp和kv分別表示位置增益和速度增益,xtar表示目標(biāo)點(diǎn)的位置,xstarox表示起始點(diǎn)的橫坐標(biāo),xtarox表示目標(biāo)點(diǎn)的橫坐標(biāo),xx表示智能體當(dāng)前位置的橫坐標(biāo),。
30、進(jìn)一步的,步驟三中所述目標(biāo)不可達(dá)與局部極小值問(wèn)題解決方案為:
31、·針對(duì)局部極小值問(wèn)題解決方案:
32、在步驟二引力中的速度項(xiàng)引入偏移矩陣γ,當(dāng)引力與斥力中的位置項(xiàng)方向相反時(shí),由于引力中速度項(xiàng)偏移矩陣的γ的作用,使得平衡點(diǎn)位置的合力不為零,以此來(lái)解決局部極小值問(wèn)題。因此引力修改為如下形式:
33、
34、其中,偏移矩陣的選取不僅要使引力中速度項(xiàng)的方向產(chǎn)生微小偏移,而且還要確保不要對(duì)路徑規(guī)劃以及避障效果產(chǎn)生較大的影響,因此本文選取偏移矩陣
35、·針對(duì)目標(biāo)不可達(dá)問(wèn)題解決方案:
36、將智能體與目標(biāo)點(diǎn)的相對(duì)距離||x-xtar||引入斥力中,使智能體在靠近目標(biāo)點(diǎn)時(shí),即使目標(biāo)點(diǎn)附近有障礙物斥力也會(huì)變小,不至于遠(yuǎn)遠(yuǎn)大于引力造成合力仍處于一個(gè)較大的值,使得智能體無(wú)法到達(dá)目標(biāo)點(diǎn)。
37、對(duì)ρi=||x-xobsi||-robsi求梯度:
38、
39、代入斥力公式中,可以得到修改后障礙物斥力的坐標(biāo)表達(dá)式:
40、
41、總的人工勢(shì)場(chǎng)函數(shù)為故智能體在人工勢(shì)場(chǎng)中受到的合力為:
42、
43、設(shè)智能體的狀態(tài)方程為:
44、
45、令u=f,設(shè)置matlab中的ode45微分方程求解器的積分區(qū)間為相同間隔的長(zhǎng)向量,且間隔與采樣周期t相同,此時(shí)求解得到的狀態(tài)序列相當(dāng)于虛擬領(lǐng)導(dǎo)者軌跡規(guī)劃后的狀態(tài)序列。
46、進(jìn)一步的,步驟四中所述狀態(tài)觀測(cè)器的表達(dá)式為:
47、對(duì)于跟隨者智能體i,為了獲得其狀態(tài),設(shè)計(jì)如下形式的狀態(tài)觀測(cè)器:
48、
49、表示第i個(gè)智能體使用t-j時(shí)刻的信息對(duì)t-k時(shí)刻的狀態(tài)預(yù)測(cè),為觀測(cè)器增益矩陣可以通過(guò)觀測(cè)器設(shè)計(jì)得到。
50、進(jìn)一步的,根據(jù)步驟五所述預(yù)測(cè)控制協(xié)議的表達(dá)式為:
51、
52、其中,為待設(shè)計(jì)的反饋增益矩陣,為加權(quán)鄰接矩陣的非負(fù)元素,表示相對(duì)于的編隊(duì)偏移向量。
53、進(jìn)一步的,步驟六中所述閉環(huán)誤差系統(tǒng)的表達(dá)式為:
54、令εi(t+1)可以寫(xiě)成以下形式:
55、
56、閉環(huán)誤差系統(tǒng)為
57、
58、其中,
59、ε(t)=[ε1(t)t?ε2(t)t?…?εn(t)t]t
60、e(t)=[e1(t-τ1+1)t?e2(t-τ2+1)t?…?en(t-τn+1)t]t
61、
62、θ=diag{a-k0c,a-k0c,...,a-k0c}
63、因此,誤差系統(tǒng)可以表示為:
64、
65、其中,
66、
67、ω=-(υ+ξ)
68、θ=diag{a-k0c,a-k0c,...,a-k0c}
69、如果以下條件成立,則網(wǎng)絡(luò)化多智能體系統(tǒng)可以實(shí)現(xiàn)編隊(duì)軌跡跟蹤。
70、(1)
71、(2)
72、其中,||·||表示向量的范數(shù),是t時(shí)刻的估計(jì)誤差。
73、由定義可知,如果誤差系統(tǒng)是穩(wěn)定的,則當(dāng)t→∞,i=1,2,...,n時(shí),εi(t)→0,ei(t)→0。
74、由t→∞,ei(t)→0,得到:
75、
76、由t→∞,εi(t)→0,得到:
77、
78、因此,當(dāng)矩陣和a-k0c是schur穩(wěn)定時(shí),在控制協(xié)議的作用下多智能體系統(tǒng)可以實(shí)現(xiàn)編隊(duì)軌跡跟蹤;并且,利用matlab中的線性矩陣不等式工具箱求解下列問(wèn)題:
79、
80、a-k0c<0
81、可以得到反饋增益矩陣k1和k2以及觀測(cè)器增益矩陣k0。
82、進(jìn)一步的,步驟七中將步驟六求得的反饋增益矩陣k1和k2,代入步驟五中的網(wǎng)絡(luò)化多智能體系統(tǒng)編隊(duì)軌跡跟蹤預(yù)測(cè)控制協(xié)議,實(shí)現(xiàn)具有時(shí)間延遲和數(shù)據(jù)丟失的網(wǎng)絡(luò)化多智能體系統(tǒng)的領(lǐng)導(dǎo)跟隨編隊(duì)軌跡跟蹤;
83、本發(fā)明的有益技術(shù)效果是:
84、本發(fā)明研究了網(wǎng)絡(luò)化多智能體系統(tǒng)實(shí)現(xiàn)領(lǐng)導(dǎo)跟隨編隊(duì)軌跡跟蹤的方法,考慮了時(shí)間延遲和數(shù)據(jù)丟失對(duì)網(wǎng)絡(luò)化多智能體系統(tǒng)的影響,同時(shí)考慮了針對(duì)虛擬領(lǐng)導(dǎo)者的軌跡規(guī)劃。與現(xiàn)有的不考慮時(shí)間延遲和數(shù)據(jù)丟失問(wèn)題的多智能體系統(tǒng)相比,本發(fā)明的協(xié)議設(shè)計(jì)可以克服網(wǎng)絡(luò)中時(shí)間延遲和數(shù)據(jù)丟失對(duì)控制系統(tǒng)的影響,達(dá)到與本地控制系統(tǒng)相同的控制效果,并且改善了已有大多數(shù)編隊(duì)軌跡跟蹤控制研究只考慮跟蹤固定參考軌跡這一問(wèn)題,具有更大的理論與現(xiàn)實(shí)意義。借助于圖論和矩陣論等數(shù)學(xué)工具,基于線性矩陣不等式求解出反饋增益矩陣,使系統(tǒng)實(shí)現(xiàn)所期望的領(lǐng)導(dǎo)跟編隊(duì)軌跡跟蹤。