本技術(shù)涉及集群控制的,具體涉及一種多智能體集群避障方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、無(wú)人系統(tǒng)集群是由多個(gè)自主或半自主的智能體組成的協(xié)同系統(tǒng),涵蓋了無(wú)人機(jī)、水面無(wú)人船、水下無(wú)人航行器、無(wú)人車、移動(dòng)式機(jī)器人等多種形式的無(wú)人裝備。這些智能體之間通過(guò)網(wǎng)絡(luò)進(jìn)行信息交互與協(xié)同工作,以共同完成復(fù)雜的任務(wù)。這類系統(tǒng)也被稱為“多智能體集群”,其顯著特點(diǎn)在于集群中的每個(gè)智能體具備一定的獨(dú)立決策能力,能夠在群體中通過(guò)分布式方式進(jìn)行協(xié)作、通信和決策,從而實(shí)現(xiàn)整體目標(biāo)的優(yōu)化和效率提升。
2、避障問(wèn)題是多智能體集群運(yùn)動(dòng)控制中的核心挑戰(zhàn)之一,尤其是在復(fù)雜環(huán)境中。1986年,reynolds提出了多智能體集群運(yùn)動(dòng)的三條基本原則:聚集、避碰和速度匹配。聚集原則要求每個(gè)智能體盡量向鄰近的智能體靠近,以保持群體的凝聚力;避碰原則確保智能體之間保持足夠的距離,避免發(fā)生碰撞;而速度匹配原則強(qiáng)調(diào)鄰近智能體之間的速度一致性,以維持集群的協(xié)調(diào)性。當(dāng)集群在運(yùn)動(dòng)過(guò)程中遇到障礙物時(shí),除了需要遵循避障策略避免與障礙物發(fā)生碰撞,還必須在整體避障過(guò)程中繼續(xù)滿足這三項(xiàng)基本原則。
3、傳統(tǒng)的flocking算法因其在集群控制中的穩(wěn)健性而廣泛應(yīng)用,尤其在保障集群成員的聚集、不相互碰撞以及速度一致性方面表現(xiàn)出色。然而,面對(duì)動(dòng)態(tài)和復(fù)雜環(huán)境下的避障需求,flocking算法顯現(xiàn)出一定的局限性。為了實(shí)現(xiàn)避障,通常需要結(jié)合人工勢(shì)場(chǎng)法,這種方法依賴于對(duì)全局環(huán)境的預(yù)先建模,通過(guò)計(jì)算智能體與障礙物之間的虛擬力場(chǎng),指導(dǎo)其避開障礙物。人工勢(shì)場(chǎng)法對(duì)環(huán)境的變化非常敏感,環(huán)境發(fā)生變化時(shí),往往需要重新設(shè)計(jì)算法和模型,導(dǎo)致其適應(yīng)性較差,難以應(yīng)對(duì)動(dòng)態(tài)或未知環(huán)境的挑戰(zhàn)。因此,需要一種方法提高多智能體集群避障算法的實(shí)用性。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)提供一種多智能體集群避障方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),能夠提高多智能體集群避障算法的實(shí)用性。
2、在本技術(shù)的第一方面提供了一種多智能體集群避障方法,所述方法包括:
3、獲取智能體集群包含多個(gè)智能體的初始動(dòng)力學(xué)參數(shù),所述初始動(dòng)力學(xué)參數(shù)包括位移、速度以及初始控制輸入;
4、根據(jù)所述初始動(dòng)力學(xué)參數(shù),確定第一智能體預(yù)設(shè)范圍內(nèi)的多個(gè)第二智能體,所述第一智能體為多個(gè)所述智能體中的任意一個(gè)智能體;
5、獲取所述第一智能體的運(yùn)動(dòng)參數(shù)以及觀測(cè)得到的障礙物位置;
6、基于所述運(yùn)動(dòng)參數(shù)、所述障礙物位置以及所述初始動(dòng)力學(xué)參數(shù),確定所述第一智能體的第一控制輸入;
7、根據(jù)所述第一控制輸入,對(duì)所述第一智能體進(jìn)行避障仿真驗(yàn)證。
8、可選的,所述基于所述運(yùn)動(dòng)參數(shù)、所述障礙物位置以及所述初始動(dòng)力學(xué)參數(shù),確定所述第一智能體的第一控制輸入,具體包括:
9、根據(jù)所述第一智能體的第一速度、第一智能體的第一位移、所述第二智能體的第二速度以及所述第二智能體的第二位移,確定所述第一智能體的避撞控制輸入,所述避撞控制輸入表示如下:
10、
11、其中,fig為所述避撞控制輸入,qi為所述第一智能體的第一位移,pi為所述第一智能體的第一速度,qj為第j個(gè)第二智能體的第二位移,pj為第j個(gè)第二智能體的第二速度,c1和c2為所述第一智能體的控制參數(shù),nij為所述第一智能體位移指向第j個(gè)第二智能體位移的位移向量,aij為交互強(qiáng)度系數(shù),φα為距離函數(shù);
12、獲取所述智能體集群的目標(biāo)點(diǎn)位置以及目標(biāo)點(diǎn)速度;
13、根據(jù)所述目標(biāo)點(diǎn)位置以及所述目標(biāo)點(diǎn)速度,確定初始控制輸入,所述初始控制輸入表示如下:
14、fin=-e1(qi-qtarget)-e2(pi-ptarget)
15、其中,fin為所述初始控制輸入,qi為所述第一位移,pi為所述第一速度,qtarget為所述目標(biāo)點(diǎn)位置,ptarget為所述目標(biāo)點(diǎn)速度,e1以及e2為控制參數(shù);
16、基于所述避撞控制輸入以及所述初始控制輸入,確定所述第一控制輸入,所述第一控制輸入表示如下:
17、
18、其中,ui為所述第一控制輸入,fig為避免多個(gè)所述智能體之間發(fā)生碰撞的避撞控制輸入,fin為所述初始控制輸入,fiβ為控制避障輸入。
19、可選的,所述基于所述控制避障輸入,確定所述第一控制輸入,具體還包括:
20、基于所述第一位移以及所述第一速度,確定觀測(cè)空間,所述觀測(cè)空間表示如下:
21、
22、其中,si為觀測(cè)空間,為所述第一位移以及所述第一速度,為所述第一智能體對(duì)所述第二智能體的觀測(cè),siobstacle為所述第一智能體對(duì)障礙物的觀測(cè);
23、基于所述觀測(cè)空間,確定所述控制避障輸入,所述控制避障輸入表示如下:
24、
25、其中,fiβ為所述控制避障輸入,δpi為所述速度變化量。
26、可選的,所述根據(jù)所述第一智能體的第一速度、第一智能體的第一位移、所述第二智能體的第二速度以及所述第二智能體的第二位移,確定所述第一智能體的避撞控制輸入,具體還包括:
27、根據(jù)所述第一位移以及所述第二位移,確定所述位移向量,所述位移向量具體表示如下:
28、
29、其中,nij為所述位移向量,qi為所述第一智能體的第一位移,qj為第j個(gè)第二智能體的第二位移;
30、基于所述第一位移以及所述第二位移,確定所述交互強(qiáng)度系數(shù),具體通過(guò)如下公式計(jì)算:
31、
32、其中,aij為所述交互強(qiáng)度系數(shù),‖qj-qi‖σ表示(qj-qi)的σ范數(shù),qi為所述第一智能體的第一位移,qj為第j個(gè)第二智能體的第二位移,σ范數(shù)定義如下:
33、
34、其中,常數(shù)ε>0,‖x‖σ表示向量x的σ范數(shù),‖x‖表示向量長(zhǎng)度,x是任意維度向量。
35、可選的,在所述基于所述運(yùn)動(dòng)參數(shù)、所述障礙物位置以及所述初始動(dòng)力學(xué)參數(shù),確定所述第一智能體的第一控制輸入之后,所述方法還包括:
36、獲取所述第一智能體以及多個(gè)所述第二智能體觀測(cè)得到的多個(gè)障礙物;
37、確定各個(gè)所述障礙物與所述第一智能體之間的距離;
38、確定多個(gè)障礙物中的目標(biāo)障礙物,所述目標(biāo)障礙物與所述第一智能體之間的距離最近;
39、基于所述目標(biāo)障礙物與所述第一智能體之間的距離,建立獎(jiǎng)勵(lì)函數(shù),所述獎(jiǎng)勵(lì)函數(shù)具體如下:
40、
41、其中,ri為所述獎(jiǎng)勵(lì)函數(shù),di為所述第一智能體與所述目標(biāo)障礙物之間的距離,d1為臨界安全距離,μ為排斥系數(shù),d0為獎(jiǎng)勵(lì)調(diào)節(jié)尺度。
42、可選的,基于所述第一智能體與所述第二智能體之間的距離確定所述距離函數(shù),具體通過(guò)如下公式表示:
43、
44、其中,φα(z)是以距離z為自變量的距離函數(shù),z=||qj-qi||,ra為歸一化尺度,da為常數(shù)偏移量。
45、可選的,所述根據(jù)所述第一控制輸入,對(duì)所述第一智能體進(jìn)行避障仿真驗(yàn)證,具體包括:
46、構(gòu)建仿真環(huán)境,所述仿真環(huán)境包括至少2個(gè)虛擬障礙物以及虛擬目標(biāo)點(diǎn);
47、基于所述第一控制輸入構(gòu)建虛擬智能體模型;
48、將所述虛擬智能體在所述仿真環(huán)境進(jìn)行交互;
49、判斷所述虛擬智能體能否避開所述虛擬障礙物并抵達(dá)所述虛擬目標(biāo)點(diǎn);
50、若確定所述虛擬智能體避開所述虛擬障礙物并抵達(dá)所述虛擬目標(biāo)點(diǎn),則確定所述第一控制輸入為避障策略。
51、在本技術(shù)的第二方面提供了一種多智能體集群避障裝置,所述裝置包括獲取模塊、判斷模塊、處理模塊以及仿真模塊,其中:
52、所述獲取模塊,用于獲取智能體集群包含多個(gè)智能體的初始動(dòng)力學(xué)參數(shù),所述初始動(dòng)力學(xué)參數(shù)包括位移、速度以及初始控制輸入;
53、所述判斷模塊,用于根據(jù)所述初始動(dòng)力學(xué)參數(shù),確定第一智能體預(yù)設(shè)范圍內(nèi)的多個(gè)第二智能體,所述第一智能體為多個(gè)所述智能體中的任意一個(gè)智能體;
54、所述獲取模塊,用于獲取所述第一智能體的運(yùn)動(dòng)參數(shù)以及觀測(cè)得到的障礙物位置;
55、所述處理模塊,用于基于所述運(yùn)動(dòng)參數(shù)、所述障礙物位置以及所述初始動(dòng)力學(xué)參數(shù),確定所述第一智能體的第一控制輸入;
56、所述仿真模塊,用于根據(jù)所述第一控制輸入,對(duì)所述第一智能體進(jìn)行避障仿真驗(yàn)證。
57、在本技術(shù)的第三方面提供了一種電子設(shè)備,包括處理器、存儲(chǔ)器、用戶接口以及網(wǎng)絡(luò)接口,所述存儲(chǔ)器用于存儲(chǔ)指令,所述用戶接口和所述網(wǎng)絡(luò)接口均用于與其他設(shè)備通信,所述處理器用于執(zhí)行所述存儲(chǔ)器中存儲(chǔ)的指令,以使所述電子設(shè)備執(zhí)行如上述任意一項(xiàng)所述的方法。
58、在本技術(shù)的第四方面提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有指令,當(dāng)所述指令被執(zhí)行時(shí),執(zhí)行如上述任意一項(xiàng)所述的方法。
59、綜上所述,本技術(shù)實(shí)施例中提供的一個(gè)或多個(gè)技術(shù)方案,至少具有如下技術(shù)效果或優(yōu)點(diǎn):
60、1.本技術(shù)通過(guò)動(dòng)態(tài)獲取和分析智能體的初始動(dòng)力學(xué)參數(shù)、預(yù)設(shè)范圍內(nèi)的其他智能體及障礙物位置,結(jié)合智能體的運(yùn)動(dòng)參數(shù),動(dòng)態(tài)確定智能體的控制輸入,能夠有效應(yīng)對(duì)復(fù)雜和動(dòng)態(tài)環(huán)境。通過(guò)在仿真環(huán)境中驗(yàn)證該控制輸入的避障效果,避免了對(duì)全局環(huán)境的靜態(tài)預(yù)設(shè)和依賴,大大提高了算法的適應(yīng)性和靈活性。此外,通過(guò)自適應(yīng)地調(diào)整智能體的行為,減少了對(duì)環(huán)境模型的依賴,從而提高了多智能體集群在不確定和動(dòng)態(tài)環(huán)境中的避障性能和實(shí)用性。
61、2.本發(fā)明提出的避障方法適用于環(huán)境未完全已知的情形,避免了對(duì)全局環(huán)境的建模需求。通過(guò)智能體在自身周邊的局部環(huán)境中進(jìn)行觀測(cè),并將觀測(cè)空間限制在較小范圍內(nèi),這種方法有助于快速學(xué)習(xí)和訓(xùn)練,提高了效率。同時(shí),該方法采用智能體的速度變化作為強(qiáng)化學(xué)習(xí)的動(dòng)作空間,符合實(shí)際的控制需求。在智能體與局部環(huán)境的交互過(guò)程中,通過(guò)強(qiáng)化學(xué)習(xí)策略使智能體能夠逐步探索并有效避障,從而提升了系統(tǒng)的適用性和擴(kuò)展性。
62、3.本技術(shù)通過(guò)基于智能體的局部觀測(cè)空間、運(yùn)動(dòng)參數(shù)和障礙物位置,動(dòng)態(tài)生成控制輸入,從而提升了多智能體集群在未知和復(fù)雜環(huán)境中的避障能力。避免了全局環(huán)境建模的復(fù)雜性和不確定性,使得每個(gè)智能體能夠根據(jù)局部信息進(jìn)行實(shí)時(shí)決策。結(jié)合了避撞控制、初始控制輸入以及基于觀測(cè)空間的控制避障輸入,這一方法有效提高了智能體在動(dòng)態(tài)環(huán)境中的反應(yīng)速度和適應(yīng)能力。同時(shí),通過(guò)獎(jiǎng)勵(lì)函數(shù)和距離函數(shù)的設(shè)計(jì),進(jìn)一步優(yōu)化了智能體的避障行為,確保在復(fù)雜環(huán)境中的穩(wěn)定性和安全性,具備較強(qiáng)的實(shí)用性和擴(kuò)展性。