本發(fā)明涉及智能體控制領(lǐng)域,具體涉及一種多智能體系統(tǒng)分布式固定時(shí)間和預(yù)定時(shí)間協(xié)同最優(yōu)共識(shí)控制方法。
背景技術(shù):
1、多智能體系統(tǒng)是指由多個(gè)獨(dú)立自主的智能體及其相應(yīng)的組織規(guī)則和信息交互協(xié)議組成的系統(tǒng),相較于單個(gè)智能體,多智能體系統(tǒng)能夠通過(guò)協(xié)同作業(yè)完成更復(fù)雜的特定任務(wù),并表現(xiàn)出“1+1>2”的優(yōu)勢(shì)。這種獨(dú)特的優(yōu)勢(shì)伴隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展掀起了對(duì)多智能體系統(tǒng)協(xié)同控制的研究熱潮。共識(shí)問題作為多智能體系統(tǒng)協(xié)同控制中的基礎(chǔ)問題,其理論成果可廣泛應(yīng)用于源點(diǎn)定位、無(wú)人機(jī)編隊(duì)、智能機(jī)器人、智能交通管理、資源勘探以及電網(wǎng)經(jīng)濟(jì)調(diào)度等領(lǐng)域。在這些應(yīng)用中,控制任務(wù)往往要求多智能體系統(tǒng)在實(shí)現(xiàn)共識(shí)的基礎(chǔ)上滿足一些優(yōu)化指標(biāo),即實(shí)現(xiàn)共識(shí)的同時(shí)最小化其局部成本函數(shù)之和。多智能體系統(tǒng)分布式最優(yōu)共識(shí)的核心目標(biāo)就是設(shè)計(jì)有效的控制協(xié)議,使系統(tǒng)中每個(gè)智能體根據(jù)鄰居傳來(lái)的信息不斷調(diào)整自己的行為,最終使得所有智能體的狀態(tài)在全局最優(yōu)點(diǎn)處實(shí)現(xiàn)一致。此外,實(shí)際應(yīng)用中通信距離變化、信號(hào)干擾、智能體和網(wǎng)絡(luò)發(fā)生故障等因素會(huì)導(dǎo)致多智能體系統(tǒng)通信鏈路的中斷或增加,使系統(tǒng)一致性控制面臨困難。
2、大多數(shù)分布式最優(yōu)控制方案只能在有限的時(shí)間內(nèi)使智能體的狀態(tài)收斂到全局最優(yōu)點(diǎn),基于此種方法估計(jì)優(yōu)化共識(shí)時(shí)間需提前獲知系統(tǒng)的初始狀態(tài),且不同的初始狀態(tài)可能會(huì)導(dǎo)致不同的優(yōu)化共識(shí)時(shí)間。而實(shí)際系統(tǒng)的初始狀態(tài)難以獲得或者無(wú)法獲得。此外,考慮不同的環(huán)境、操作等因素,系統(tǒng)的初始狀態(tài)在每次實(shí)驗(yàn)中可能并不相同,且系統(tǒng)通信拓?fù)鋾?huì)因通信距離和干擾等因素發(fā)生變化,這無(wú)疑增加了系統(tǒng)實(shí)現(xiàn)最優(yōu)共識(shí)的難度和估計(jì)優(yōu)化共識(shí)時(shí)間的計(jì)算負(fù)擔(dān)。盡管有一些考慮固定/預(yù)定時(shí)間內(nèi)實(shí)現(xiàn)最優(yōu)共識(shí)控制的算法,但是存在參數(shù)過(guò)多、算法設(shè)計(jì)及時(shí)間估計(jì)過(guò)于復(fù)雜、易引起抖振現(xiàn)象等缺點(diǎn)。
技術(shù)實(shí)現(xiàn)思路
1、針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明旨在提供一種更靈活簡(jiǎn)便的分布式固定時(shí)間和預(yù)定時(shí)間最優(yōu)共識(shí)控制方法,確保多智能體系統(tǒng)在初始狀態(tài)未知和通信拓?fù)渚W(wǎng)絡(luò)變化的情況下能在估計(jì)的或預(yù)先設(shè)定的時(shí)間內(nèi)實(shí)現(xiàn)在全局最優(yōu)點(diǎn)處的共識(shí),同時(shí)避免抖振現(xiàn)象。
2、實(shí)現(xiàn)本發(fā)明目的的技術(shù)方案為:一種多智能體系統(tǒng)分布式固定時(shí)間和預(yù)定時(shí)間協(xié)同最優(yōu)共識(shí)控制方法,包括步驟:
3、步驟1,構(gòu)建每個(gè)智能體的動(dòng)力學(xué)模型;
4、步驟2,基于動(dòng)力學(xué)模型,構(gòu)建全局成本函數(shù)并描述優(yōu)化問題;
5、步驟3,設(shè)計(jì)基于指數(shù)函數(shù)的兩階段分布式協(xié)同優(yōu)化共識(shí)算法,包括固定時(shí)間協(xié)同優(yōu)化共識(shí)算法和預(yù)定時(shí)間協(xié)同優(yōu)化共識(shí)算法;
6、步驟4,針對(duì)固定時(shí)間協(xié)同優(yōu)化共識(shí)算法和預(yù)定時(shí)間協(xié)同優(yōu)化共識(shí)算法,分別構(gòu)造lyapunov函數(shù),對(duì)兩種優(yōu)化共識(shí)算法分別進(jìn)行共識(shí)分析,實(shí)現(xiàn)最優(yōu)共識(shí)。
7、進(jìn)一步地,所述智能體為無(wú)向通信拓?fù)浣Y(jié)構(gòu)的麥克納姆輪無(wú)人車。
8、進(jìn)一步地,所述無(wú)人車的動(dòng)力學(xué)模型為:
9、
10、式中xi1、xi2、vi1、vi2分別表示第i個(gè)無(wú)人車在二維平面上運(yùn)動(dòng)的位置、線速度;θi表示第i個(gè)無(wú)人車的朝向角,即與x軸的夾角;表示第i個(gè)無(wú)人車的角速度;
11、由于θi=sinθi=0,cosθi=1,將第i個(gè)無(wú)人車的動(dòng)力學(xué)模型簡(jiǎn)化為:
12、
13、令xi(t)=[xi1,xi2]t,ui(t)=[vi1,vi2]t,得第i個(gè)無(wú)人車的動(dòng)力學(xué)方程為:
14、
15、進(jìn)一步地,所述步驟2考慮每個(gè)智能體i都擁有一個(gè)局部成本函數(shù)ci(xi),全局成本函數(shù)由所有局部成本函數(shù)求和而成,為:
16、
17、將優(yōu)化問題描述為:
18、
19、式中xi(t)、xj(t)分別表示第i個(gè)和第j個(gè)智能體的位置狀態(tài),
20、表示求函數(shù)的最小值點(diǎn)x,xi(t)=xj(t),i=1,2,…,n,i≠j表示n個(gè)智能體的位置狀態(tài)相同。
21、進(jìn)一步地,所述步驟3設(shè)計(jì)的固定時(shí)間協(xié)同優(yōu)化共識(shí)算法為:
22、
23、其中,控制參數(shù)λ1和λ2為正常數(shù);和q為正常數(shù)且滿足表示全局成本函數(shù)ci(xi(t))關(guān)于時(shí)間t的梯度,表示全局成本函數(shù)ci(xi(t))關(guān)于時(shí)間t的黑森矩陣;aij(t)表示鄰接矩陣a=(aij(t))n×n的元素,其中aij(t)>0表示在時(shí)刻t智能體i可以從智能體j獲取狀態(tài)信息,否則aij(t)=0;表示在時(shí)刻t與第i個(gè)智能體有通信連接的智能體集合;t1為所有智能體到達(dá)各自局部最優(yōu)解的時(shí)間估計(jì),xi(t)、xj(t)分別表示智能體i和智能體j在二維平面上運(yùn)動(dòng)的位置。
24、進(jìn)一步地,所述步驟3設(shè)計(jì)的預(yù)定時(shí)間協(xié)同優(yōu)化共識(shí)算法為:
25、
26、式中,控制參數(shù)q、和δ為正常數(shù)且滿足:0<q<1/2,0<δ<1;表示以e為底的對(duì)數(shù);為多智能體系統(tǒng)的無(wú)向連通通信拓?fù)鋱D的代數(shù)連通度,其中表示多智能體系統(tǒng)的通信拓?fù)鋱D,其隨時(shí)間變化,表示全局成本函數(shù)ci(xi(t))關(guān)于時(shí)間t的梯度,表示全局成本函數(shù)ci(xi(t))關(guān)于時(shí)間t的黑森矩陣;aij(t)表示鄰接矩陣a=(aij(t))n×n的元素,其中aij(t)>0表示在時(shí)刻t智能體i可以從智能體j獲取狀態(tài)信息,否則aij(t)=0;表示在時(shí)刻t與第i個(gè)智能體有通信連接的智能體集合;常數(shù)m和mi滿足不等式:m≥max{mi}和tp為預(yù)先設(shè)定的多智能體系統(tǒng)實(shí)現(xiàn)全局最優(yōu)共識(shí)的時(shí)間,xi(t)、xj(t)分別表示智能體i和智能體j在二維平面上運(yùn)動(dòng)的位置。
27、進(jìn)一步地,步驟4中構(gòu)造lyapunov函數(shù),對(duì)固定時(shí)間協(xié)同優(yōu)化共識(shí)算法進(jìn)行共識(shí)分析,包括:根據(jù)算法的兩個(gè)階段,分兩步進(jìn)行分析,其中第一階段的時(shí)間為0<t≤t1,對(duì)應(yīng)于算法的第一階段,目標(biāo)為使所有智能體能在固定時(shí)間內(nèi)到達(dá)各自局部最優(yōu)解第二階段的時(shí)間為t>t1,對(duì)應(yīng)于算法的第二階段,目標(biāo)為使所有智能體從各自的局部最優(yōu)解到達(dá)全局最優(yōu)解x*。
28、進(jìn)一步地,構(gòu)造lyapunov函數(shù),對(duì)固定時(shí)間協(xié)同優(yōu)化共識(shí)算法進(jìn)行共識(shí)分析,具體包括:
29、步驟4.1.1,分析多智能體系統(tǒng)的固定時(shí)間局部最優(yōu)性,并給出所需時(shí)間的估計(jì)值,包括:
30、對(duì)于第i個(gè)智能體,構(gòu)造半正定、徑向無(wú)界的lyapunov函數(shù)為:
31、
32、關(guān)于時(shí)間的導(dǎo)數(shù)為:
33、
34、其中,系數(shù)
35、基于固定時(shí)間穩(wěn)定性理論,智能體能在固定時(shí)間內(nèi)從初始狀態(tài)到達(dá)各自的局部最優(yōu)解對(duì)其所需時(shí)間的估計(jì)為:
36、
37、步驟4.1.2,分析多智能體系統(tǒng)的固定時(shí)間全局最優(yōu)性,并給出所需時(shí)間的估計(jì)值,包括:
38、基于零梯度和算法證明在算法的第二階段作用下多智能體系統(tǒng)的固定時(shí)間全局最優(yōu)性,構(gòu)造lyapunov函數(shù)為:
39、
40、式中x*表示優(yōu)化問題全局最優(yōu)解,由于局部成本函數(shù)ci(x)是mi強(qiáng)凸的,即對(duì)任意向量x,y以及mi>0有利用所構(gòu)造的lyapunov函數(shù)可得:
41、
42、是正定、徑向無(wú)界的,且當(dāng)且僅當(dāng)xi(t)=x*;
43、對(duì)進(jìn)行求導(dǎo)得:
44、
45、式中,表示克羅內(nèi)克積,im表示m維單位陣,基于固定時(shí)間穩(wěn)定性理論,智能體能在固定時(shí)間內(nèi)從各自的局部最優(yōu)值到達(dá)全局最優(yōu)解x*,對(duì)其所需時(shí)間的估計(jì)為:
46、
47、結(jié)合步驟4.1.1和步驟4.1.2,在算法第一階段的作用下智能體首先能在固定時(shí)間t1內(nèi)從初始狀態(tài)收斂到各自的局部最優(yōu)值,此時(shí)各個(gè)智能體對(duì)應(yīng)的局部成本函數(shù)最小;基于零梯度和算法,在算法第二階段的作用下,所有智能體的位置狀態(tài)收斂到全局最優(yōu)點(diǎn)處,此時(shí)整個(gè)系統(tǒng)對(duì)應(yīng)的全局成本函數(shù)最小,整個(gè)優(yōu)化共識(shí)過(guò)程在固定時(shí)間t1+t2內(nèi)完成。
48、進(jìn)一步地,步驟4中構(gòu)造lyapunov函數(shù),對(duì)預(yù)定時(shí)間協(xié)同優(yōu)化共識(shí)算法進(jìn)行共識(shí)分析,包括:根據(jù)算法的兩個(gè)階段,分兩步進(jìn)行分析,其中第一階段的時(shí)間為0<t≤δtp,對(duì)應(yīng)于算法的第一階段,目標(biāo)為使所有智能體能在預(yù)先設(shè)定的時(shí)間δtp內(nèi)到達(dá)各自的局部最優(yōu)解第二階段的時(shí)間為t>δtp,對(duì)應(yīng)于算法的第二階段,目標(biāo)為使所有智能體能在預(yù)先設(shè)定的時(shí)間(1-δ)tp內(nèi)從各自的局部最優(yōu)解到達(dá)優(yōu)化問題全局最優(yōu)解x*。
49、進(jìn)一步地,構(gòu)造lyapunov函數(shù),對(duì)預(yù)定時(shí)間協(xié)同優(yōu)化共識(shí)算法進(jìn)行共識(shí)分析,具體包括:
50、步驟4.2.1、分析多智能體系統(tǒng)的預(yù)定時(shí)間局部最優(yōu)性,包括:
51、對(duì)于第i個(gè)智能體,構(gòu)造半正定、徑向無(wú)界的lyapunov函數(shù)為:
52、
53、則關(guān)于時(shí)間的導(dǎo)數(shù)為;
54、
55、基于預(yù)定時(shí)間穩(wěn)定性理論,智能體能在預(yù)定時(shí)間δtp內(nèi)從初始狀態(tài)到達(dá)各自的局部最優(yōu)解此時(shí)滿足零梯度和算法的基本要求,即局部梯度的初始和為零;
56、步驟4.2.2、分析多智能體系統(tǒng)的預(yù)定時(shí)間全局最優(yōu)性,包括:
57、基于零梯度和算法,構(gòu)造的正定、徑向無(wú)界lyapunov函數(shù)為:
58、
59、對(duì)進(jìn)行求導(dǎo)得:
60、
61、其中
62、基于預(yù)定時(shí)間穩(wěn)定性理論,智能體能在預(yù)定時(shí)間(1-δ)tp內(nèi)從各自的局部最優(yōu)值到達(dá)全局最優(yōu)解x*;
63、結(jié)合步驟4.2.1和步驟4.2.2,在算法第一階段的作用下各個(gè)智能體首先能在預(yù)定時(shí)間δtp內(nèi)從初始狀態(tài)收斂到各自的局部最優(yōu)值,此時(shí)各個(gè)智能體對(duì)應(yīng)的局部成本函數(shù)最?。唤酉聛?lái)基于零梯度和算法,在算法第二階段的作用下,所有智能體車的位置狀態(tài)能在時(shí)間(1-δ)tp內(nèi)收斂到全局最優(yōu)點(diǎn)處,此時(shí)整個(gè)系統(tǒng)對(duì)應(yīng)的全局成本函數(shù)最小,整個(gè)優(yōu)化共識(shí)過(guò)程在預(yù)先設(shè)定的時(shí)間tp內(nèi)完成。
64、本發(fā)明與現(xiàn)有技術(shù)相比,其顯著效果為:
65、(1)本專利技術(shù)設(shè)計(jì)了基于指數(shù)函數(shù)的兩階段分布式固定時(shí)間優(yōu)化共識(shí)算法和預(yù)定時(shí)間優(yōu)化共識(shí)算法,其中第一階段的控制可以使智能體的任意初始狀態(tài)收斂到局部最優(yōu)點(diǎn),從而滿足零梯度和的基本要求(便于接下來(lái)利用零梯度和算法證明在第二階段控制下智能體的狀態(tài)能收斂到唯一的全局最優(yōu)點(diǎn))。因此所提算法解決了多智能體系統(tǒng)任意初始狀態(tài)下的優(yōu)化共識(shí)控制問題;
66、(2)在固定時(shí)間優(yōu)化算法下,智能體在最優(yōu)點(diǎn)處實(shí)現(xiàn)共識(shí)的時(shí)間不依賴于初始狀態(tài),并且可以估算出實(shí)現(xiàn)最優(yōu)共識(shí)的時(shí)間的一個(gè)固定上界;在預(yù)定時(shí)間優(yōu)化算法下,智能體在最優(yōu)點(diǎn)處實(shí)現(xiàn)共識(shí)的時(shí)間不依賴于初始狀態(tài)和系統(tǒng)參數(shù),可以把預(yù)先設(shè)定的優(yōu)化共識(shí)時(shí)間作為一個(gè)控制參數(shù),從而使智能體能在預(yù)定時(shí)間內(nèi)實(shí)現(xiàn)優(yōu)化共識(shí);
67、(3)所設(shè)計(jì)的算法適用于系統(tǒng)通信拓?fù)渚W(wǎng)絡(luò)變化的情況,具有較強(qiáng)的魯棒性和抗干擾性,且沒有使用不連續(xù)符號(hào)函數(shù),從而避免了實(shí)際控制中可能由此導(dǎo)致的影響控制效果的抖振現(xiàn)象;
68、(4)與基于判別條件中包含兩項(xiàng)的傳統(tǒng)固定/預(yù)定時(shí)間穩(wěn)定性定理所設(shè)計(jì)的分布式優(yōu)化共識(shí)算法相比,本專利技術(shù)所設(shè)計(jì)的算法基于指數(shù)函數(shù)型條件的固定/預(yù)定時(shí)間穩(wěn)定性定理,具有更少的參數(shù),結(jié)構(gòu)簡(jiǎn)單,且時(shí)間估算更簡(jiǎn)便。