本發(fā)明涉及多智能體系統(tǒng)的協(xié)同控制與編隊,尤其涉及一種基于動態(tài)事件觸發(fā)的多智能體系統(tǒng)雙向編隊控制方法。
背景技術:
1、多智能體系統(tǒng)(multi-agent?system,簡稱為mas)由多個獨立的智能體節(jié)點組成,這些節(jié)點通過信息交流、協(xié)調(diào)合作來完成復雜的任務。由于其廣泛的應用前景,多智能體系統(tǒng)吸引了來自生物學、電子信息和工程領域等眾多研究人員的關注。其中,編隊問題作為多智能體系統(tǒng)的一個重要研究方向,在微電網(wǎng)、機器人協(xié)同控制、無人機協(xié)作等領域展現(xiàn)出巨大的應用潛力。
2、傳統(tǒng)上對多智能體編隊的研究多基于智能體節(jié)點間信息交互連續(xù)性的假設。然而,在現(xiàn)實應用中,由于能量限制、通信帶寬限制及外部干擾等實際因素的制約,長期的穩(wěn)定連續(xù)通信往往難以實現(xiàn)。為應對這一挑戰(zhàn),事件觸發(fā)控制策略被引入到多智能體控制的研究中。
3、在事件觸發(fā)機制下,智能體節(jié)點僅在特定條件(即事件觸發(fā)條件)滿足時與相鄰節(jié)點進行信息交流,控制器也僅在此時更新控制強度。這一策略能有效減少不必要的通信和控制更新,從而節(jié)省控制資源。
4、動態(tài)事件觸發(fā)機制是對靜態(tài)事件觸發(fā)策略的進一步改進。通過引入內(nèi)部動態(tài)參數(shù)來調(diào)整觸發(fā)閾值,動態(tài)事件觸發(fā)機制能更加靈活地應對系統(tǒng)狀態(tài)的變化,進一步降低控制頻率,優(yōu)化資源利用。值得注意的是,靜態(tài)事件觸發(fā)機制可以視為動態(tài)事件觸發(fā)機制的一種特例。
5、盡管多智能體協(xié)同編隊控制領域已取得顯著成果,但在某些現(xiàn)實情況下,系統(tǒng)節(jié)點間可能同時存在合作與競爭關系。對于存在競爭關系的多智能體雙向編隊問題,目前的研究尚不充分。此外,動態(tài)事件觸發(fā)機制在多智能體系統(tǒng)編隊分析中的應用也相對較少。
技術實現(xiàn)思路
1、為此,本發(fā)明實施例提供了一種基于動態(tài)事件觸發(fā)的多智能體系統(tǒng)雙向編隊控制方法,用于解決現(xiàn)有技術中難以在節(jié)點間復雜關系(如合作與競爭并存)下,有效平衡通信頻率與控制性能,導致資源利用率低且系統(tǒng)穩(wěn)定性受限的問題。
2、為了解決上述問題,本發(fā)明實施例提供一種基于動態(tài)事件觸發(fā)的多智能體系統(tǒng)雙向編隊控制方法,該方法包括:
3、建立包含競爭關系的二階非線性多智能體系統(tǒng)模型;
4、基于建立的包含競爭關系的二階非線性多智能體系統(tǒng)模型,通過在控制器中引入自適應控制增益機制,設計分布式自適應控制器;
5、基于設計的分布式自適應控制器,構建含動態(tài)參數(shù)的動態(tài)事件觸發(fā)機制;
6、基于分布式自適應控制器和動態(tài)事件觸發(fā)機制,構建受控誤差系統(tǒng),并對受控誤差系統(tǒng)進行分析,獲得多智能體系統(tǒng)實現(xiàn)自適應雙向編隊控制的充分條件和指數(shù)收斂速度。
7、優(yōu)選地,所述方法還包括:通過不等式推導證明在動態(tài)事件觸發(fā)機制與分布式自適應控制器作用下,多智能體系統(tǒng)實現(xiàn)雙向編隊過程中不會出現(xiàn)芝諾效應。
8、優(yōu)選地,所述建立包含競爭關系的二階非線性多智能體系統(tǒng)模型,具體包括:
9、定義二階非線性多智能體系統(tǒng)模型的動力學方程,包括智能體的位置與速度變量,以及非線性的連續(xù)函數(shù),其數(shù)學表達式為:
10、
11、式中,t表示時刻;表示xi(t)的導數(shù),xi(t)表示t時刻第i個智能體的位置;表示vi(t)的導數(shù),vi(t)∈rn表示t時刻第i個智能體的速度,其中i=1,2,…,n,rn表示n維歐幾里得空間,n表示智能體的個數(shù);ui(t)∈rn代表對第i個節(jié)點施加的控制作用;是非線性的連續(xù)函數(shù);
12、定義領導智能體的動力學性態(tài),其數(shù)學表達式為:
13、
14、式中,表示x0(t)的導數(shù),x0(t)∈rn表示領導智能體的位置;表示v0(t)的導數(shù),v0(t)∈rn表示領導智能體的速度;
15、引入帶符號有向圖表示多智能體系統(tǒng)的通信拓撲,包括:
16、帶符號有向圖:用帶符號有向圖g=(v,e,a)來表示多智能體系統(tǒng)的通信拓撲,其中v={1,2,...,n}是節(jié)點集合,代表各個智能體;是邊集合,表示智能體之間的通信連接;a=[aij]∈rn×n是圖g的鄰接矩陣;
17、鄰接矩陣a:矩陣中的元素aij定義了節(jié)點i和節(jié)點j之間的關系:
18、aij>0表示節(jié)點i和節(jié)點j間為合作關系;aij<0代表節(jié)點i和節(jié)點j存在競爭關系;aij=0則表示節(jié)點i和節(jié)點j間無通信連接;
19、拉普拉斯矩陣l:
20、在多智能體系統(tǒng)中,所有智能體節(jié)點被劃分為兩個集群和每個集群內(nèi)部相鄰節(jié)點間為合作關系,而兩個集群間節(jié)點連接為競爭關系;定義矩陣i=1,2,…,n,如果節(jié)點則qi=1,如果節(jié)點則qi=-1;
21、確定多智能體系統(tǒng)實現(xiàn)雙向編隊的條件,其表示為:
22、
23、式中,表示預設的編隊隊形,t表示轉置。
24、優(yōu)選地,通過在控制器中引入自適應控制增益機制,設計分布式自適應控制器,具體包括:
25、通過在控制器中引入自適應控制增益機制,設計的分布式自適應控制器的數(shù)學表達式為:
26、
27、式中,α表示自由權重參數(shù),α>0;代表第i個智能體的第k次觸發(fā)時間,k∈{1,2,...};表示時刻第j個智能體的位置;表示預設的編隊隊形;δ1i表示反饋控制增益,δ1i≥0;δ2i表示自適應控制增益;
28、通過定義誤差向量,得到自適應控制增益δ2i(t)的更新公式:
29、i=1,2,…,n
30、其中
31、
32、φvi(t)=qivi(t)-v0(t)
33、式中,表示δ2i(t)的導數(shù);p表示常數(shù),p>0;φxi(t)、φvi(t)表示誤差向量。
34、優(yōu)選地,構建含動態(tài)參數(shù)的動態(tài)事件觸發(fā)機制,具體包括:定義測量誤差γxi(t)、γvi(t)如下:
35、定義測量誤差γxi(t)、γvi(t)如下:
36、
37、基于定義的測量誤差γxi(t)、γvi(t),構建含動態(tài)參數(shù)的動態(tài)事件觸發(fā)機制,其表示如下:
38、
39、式中,inf{}表示下確界;gi(t)表示觸發(fā)函數(shù);表示si(t)的導數(shù),si(t)表示一個動態(tài)變量且滿足初始值s0(t)>0;βi表示事件更新參數(shù),βi>0;c表示權重系數(shù),c>0;λmin表示最小特征值;為一個正定矩陣,ψ2=||l+diag{δ21(t),...,δ2n(t)}||2。
40、優(yōu)選地,基于分布式自適應控制器和動態(tài)事件觸發(fā)機制,構建受控誤差系統(tǒng),并對受控誤差系統(tǒng)進行分析,獲得多智能體系統(tǒng)實現(xiàn)自適應雙向編隊控制的充分條件和指數(shù)收斂速度,具體包括:
41、基于分布式自適應控制器和動態(tài)事件觸發(fā)機制,構建受控誤差系統(tǒng);
42、運用lyapunov穩(wěn)定性理論,通過構建lyapunov函數(shù)并求導,分析多智能體系統(tǒng)的穩(wěn)定性和收斂性;
43、根據(jù)lyapunov函數(shù)的求導結果,獲得多智能體系統(tǒng)實現(xiàn)自適應雙向編隊控制的充分條件和指數(shù)收斂速度。
44、優(yōu)選地,所述受控誤差系統(tǒng)為:
45、
46、式中,分別表示φx(t)、φv(t)的導數(shù),表示卷積,in為n維的單位矩陣,
47、優(yōu)選地,所述lyapunov函數(shù)為:
48、
49、式中,v(t)表示lyapunov函數(shù)。
50、優(yōu)選地,根據(jù)lyapunov函數(shù)的求導結果,獲得多智能體系統(tǒng)實現(xiàn)自適應雙向編隊控制的充分條件為:
51、
52、式中,f表示收斂系數(shù);θ=2+h2+(c-2α)λminb-αλmin(l++l+t)+α2,h表示lipschitz系數(shù),l+t表示l+的轉置;
53、優(yōu)選地,根據(jù)lyapunov函數(shù)的求導結果,獲得多智能體系統(tǒng)實現(xiàn)自適應雙向編隊控制的指數(shù)收斂速度為-f。
54、從以上技術方案可以看出,本發(fā)明申請具有以下有益效果:
55、(1)聚焦于動態(tài)事件觸發(fā)框架下的二階多智能體系統(tǒng),致力于實現(xiàn)與孤立領導智能體的自適應雙向編隊控制。通過精心設計的分布式自適應控制器,確保多智能體系統(tǒng)能夠遵循并維持與領導者的雙向編隊模式。本發(fā)明運用動態(tài)事件觸發(fā)策略與lyapunov穩(wěn)定性理論,嚴格推導出實現(xiàn)雙向編隊的充分條件及其指數(shù)收斂速率,同時利用不等式分析等技術手段,有效規(guī)避了控制過程中潛在的芝諾現(xiàn)象。
56、(2)相較于傳統(tǒng)持續(xù)作用的控制策略,本發(fā)明采用的事件觸發(fā)控制策略展現(xiàn)出其獨特優(yōu)勢,即僅在滿足預設的動態(tài)觸發(fā)條件時激活控制輸入,顯著提升了系統(tǒng)在復雜多變工程環(huán)境中的適應性和資源效率。為進一步優(yōu)化性能,本發(fā)明創(chuàng)新性地引入了動態(tài)事件觸發(fā)機制,該機制通過動態(tài)調(diào)整觸發(fā)閾值,有效降低了觸發(fā)頻率,從而在減少計算負擔的同時,實現(xiàn)了控制資源的最大化利用。
57、(3)鑒于現(xiàn)實系統(tǒng)環(huán)境中合作與競爭關系的并存性,本發(fā)明在構建多智能體系統(tǒng)的通信拓撲模型時,特別考慮了競爭因素的存在。在控制器設計階段,創(chuàng)造性地集成了自適應控制增益,不僅能夠自動調(diào)整至最優(yōu)控制參數(shù),還顯著增強了系統(tǒng)的控制靈活性和魯棒性,為處理含競爭關系的多智能體系統(tǒng)編隊控制問題提供了有效解決方案。