本發(fā)明屬于態(tài)勢估計技術(shù)領(lǐng)域,特別涉及一種基于動態(tài)貝葉斯網(wǎng)絡(luò)的意圖分析方法,可用于態(tài)勢估計、指揮控制系統(tǒng)。
背景技術(shù):
當(dāng)今地區(qū)沖突呈現(xiàn)出對象多元化和環(huán)境復(fù)雜化的特點,面對觀測數(shù)據(jù)量急劇上升的情況,如果仍然依靠人工處理,則時效性和一致性均難以滿足實際需求。因此,需要利用計算機的存儲和計算優(yōu)勢來處理大量重復(fù)出現(xiàn)的有規(guī)律態(tài)勢,從而減輕指揮員的工作負擔(dān),使其能夠更為快速有效地掌握實時動態(tài)。其中,意圖分析屬于一種較高層級的態(tài)勢估計技術(shù),能夠在提取的態(tài)勢要素基礎(chǔ)之上,通過推理預(yù)測藍方的行動意圖,從而為紅方的應(yīng)對策略制定提供參考依據(jù)。
目前,典型的推理分析方法主要基于以下理論:d-s證據(jù)理論、貝葉斯網(wǎng)絡(luò)、因果網(wǎng)絡(luò)等。現(xiàn)有方法存在的缺陷主要有:a)部分方法只考慮各因素與關(guān)注事件之間的靜態(tài)關(guān)系,未能體現(xiàn)在時間上連續(xù)變化特性;b)針對單個目標(biāo)間的意圖分析,而實際中目標(biāo)通常是以編隊群目標(biāo)的形式執(zhí)行任務(wù);c)傳統(tǒng)動態(tài)貝葉斯網(wǎng)絡(luò)精確推理所耗費的計算量隨時間迅速增長,難以滿足實際應(yīng)用需求。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的在于針對上述已有技術(shù)中的不足,采用動態(tài)貝葉斯網(wǎng)絡(luò),綜合多種態(tài)勢要素實現(xiàn)對藍方群目標(biāo)行動意圖的動態(tài)評估,提出了一種基于動態(tài)貝葉斯網(wǎng)絡(luò)的意圖分析方法,有效提高意圖分析的可靠性和穩(wěn)定性。
實現(xiàn)本發(fā)明的技術(shù)關(guān)鍵是:在意圖分析過程中,首先綜合多種態(tài)勢要素構(gòu)建動態(tài)貝葉斯網(wǎng)絡(luò),經(jīng)訓(xùn)練學(xué)習(xí)得到網(wǎng)絡(luò)參數(shù),其次根據(jù)馬爾可夫性實現(xiàn)快速近似推理,進而通過融合估計得到藍方的行動意圖。
本發(fā)明采用的技術(shù)方案為:
基于動態(tài)貝葉斯網(wǎng)絡(luò)的意圖分析方法,包括以下步驟:
(1)初始設(shè)置為訓(xùn)練模式;
(2)數(shù)據(jù)匯集整理,具體包括以下步驟:
(2a)初始化性能參數(shù),包括:藍方目標(biāo)速度上限;
(2b)讀入當(dāng)前時刻觀測數(shù)據(jù),包括:紅方意圖、交火程度、藍方目標(biāo)數(shù)、紅方目標(biāo)數(shù)、藍方目標(biāo)實力量化數(shù)據(jù)、紅方目標(biāo)實力量化數(shù)據(jù)和藍方目標(biāo)徑向速度;
(2c)結(jié)合性能參數(shù)和觀測數(shù)據(jù),得到相對實力連續(xù)值和相對速度連續(xù)值;
(2d)對相對實力連續(xù)值和相對速度連續(xù)值進行離散化,得到相對實力和相對速度;
(3)建立動態(tài)貝葉斯網(wǎng)絡(luò)拓撲,具體包括以下步驟:
(3a)建立意圖分析動態(tài)貝葉斯網(wǎng)絡(luò)拓撲,網(wǎng)絡(luò)節(jié)點包括:可觀測節(jié)點和隱藏節(jié)點,所述的可觀測節(jié)點包括:紅方意圖、交火程度、相對實力和相對速度,所述的隱藏節(jié)點為藍方意圖;所述藍方意圖為紅方意圖、交火程度、相對實力和相對速度的融合;
(3b)設(shè)置各網(wǎng)絡(luò)節(jié)點概率分布,包括紅方意圖概率分布、交火程度概率分布、相對實力概率分布、相對速度概率分布和藍方意圖先驗概率分布;
(4)訓(xùn)練模式下對動態(tài)貝葉斯網(wǎng)絡(luò)參數(shù)進行學(xué)習(xí)與設(shè)置,具體包括以下步驟:
(4a)判斷當(dāng)前模式是否為訓(xùn)練模式,若是,則執(zhí)行步驟(4b),若否則執(zhí)行步驟(5);
(4b)判斷是否達到設(shè)定的學(xué)習(xí)次數(shù),若是,則通過對觀測數(shù)據(jù)學(xué)習(xí),得到各網(wǎng)絡(luò)節(jié)點間的條件概率分布;否則返回步驟(1);所述的各網(wǎng)絡(luò)節(jié)點間的條件概率分布包括:當(dāng)前時刻紅方意圖和藍方意圖的條件概率分布,當(dāng)前時刻交火程度和藍方意圖的條件概率分布,當(dāng)前時刻相對實力和藍方意圖的條件概率分布,當(dāng)前時刻相對速度和藍方意圖的條件概率分布,上一時刻藍方意圖和當(dāng)前時刻藍方意圖的條件概率分布;
(4c)將訓(xùn)練所得各網(wǎng)絡(luò)節(jié)點間的條件概率分布設(shè)置為動態(tài)貝葉斯網(wǎng)絡(luò)參數(shù);
(4d)將當(dāng)前模式設(shè)置為應(yīng)用模式,返回步驟(2);
(5)根據(jù)各網(wǎng)絡(luò)節(jié)點概率分布和各網(wǎng)絡(luò)節(jié)點間的條件概率分布,經(jīng)貝葉斯推理得到當(dāng)前時刻藍方意圖的后驗概率分布,具體包括以下步驟:
(5a)結(jié)合當(dāng)前時刻的紅方意圖、交火程度、相對實力、相對速度、上一時刻藍方意圖和當(dāng)前時刻的藍方意圖先驗概率分布經(jīng)貝葉斯推理得到當(dāng)前時刻藍方意圖的后驗概率分布;
(5b)根據(jù)馬爾可夫性,更新得到下一時刻的藍方意圖先驗概率分布;
(6)將當(dāng)前時刻藍方意圖的后驗概率分布融合為當(dāng)前時刻藍方意圖,具體包括以下步驟:
(6a)從當(dāng)前時刻藍方意圖的后驗概率分布中提取各種意圖的后驗概率;
(6b)將各種意圖的后驗概率融合為當(dāng)前時刻藍方意圖;
(7)輸出當(dāng)前時刻藍方意圖,檢查下一時刻的觀測數(shù)據(jù)是否到達,若是,將下一時刻更新為當(dāng)前時刻,將當(dāng)前時刻更新為上一時刻,跳轉(zhuǎn)到步驟(2);否則,結(jié)束本流程;
完成基于動態(tài)貝葉斯網(wǎng)絡(luò)的意圖分析。
其中,步驟(2c)所述的結(jié)合性能參數(shù)和觀測數(shù)據(jù),得到相對實力連續(xù)值和相對速度連續(xù)值,具體為:
計算相對實力連續(xù)值
其中,oi表示紅方第i個目標(biāo)實力量化值,i為紅方目標(biāo)標(biāo)號,取值為1,2,…,nk,nk為紅方目標(biāo)數(shù),ej表示藍方第j個目標(biāo)實力量化值,j為藍方目標(biāo)標(biāo)號,取值為1,2,…,mk,mk為藍方目標(biāo)數(shù);
計算相對速度連續(xù)值
其中,vk為藍方目標(biāo)徑向速度,vsup為藍方目標(biāo)速度上限。
其中,步驟(2d)所述的對相對實力連續(xù)值和相對速度連續(xù)值進行離散化,得到相對實力和相對速度,具體為:
離散化相對實力sk
離散化相對速度vk
其中,步驟(5a)所述的結(jié)合當(dāng)前時刻的紅方意圖、交火程度、相對實力、相對速度、上一時刻藍方意圖和當(dāng)前時刻的藍方意圖先驗概率分布推理得到當(dāng)前時刻藍方意圖的后驗概率分布,具體為:
其中,pu(bk)為k時刻威脅的后驗概率分布,p(rk)為k時刻紅方意圖概率分布,p(fk)為k時刻交火程度概率分布,p(sk)為k時刻相對實力概率分布,p(vk)為k時刻相對速度概率分布,pu(bk-1)為k-1時刻藍方意圖后驗概率分布,pf(bk)為k時刻藍方意圖先驗概率分布,p(rk|bk)為k時刻紅方意圖和藍方意圖的條件概率分布,p(fk|bk)為k時刻交火程度和藍方意圖的條件概率分布,p(sk|bk)為k時刻相對實力和藍方意圖的條件概率分布,p(vk|bk)為k時刻相對速度和藍方意圖的條件概率分布,p(bk-1|bk)為k-1時刻藍方意圖和k時刻藍方意圖的條件概率分布。
其中,步驟(5b)所述的根據(jù)馬爾可夫性,更新得到下一時刻的藍方意圖先驗概率分布,具體為:
pf(bk+1)=pu(bk);
其中,pf(bk+1)為k+1時刻的藍方意圖先驗概率分布。
其中,步驟(6a)所述的從當(dāng)前時刻藍方意圖的后驗概率分布中提取各種意圖的后驗概率,具體為:
pu(bk)={w1,w2,w3};
其中,w1為k時刻藍方意圖為“撤退”的概率,w2為k時刻藍方意圖為“防御”的概率,w3為k時刻藍方意圖為“進攻”的概率。
其中,步驟(6b)所述的將各種意圖的后驗概率融合為當(dāng)前時刻藍方意圖,具體為:
其中,ik為k時刻藍方意圖,取值為1、2、3,分別一一對應(yīng)“撤退”、“防御”或“進攻”,wc為“撤退”、“防御”或“進攻”各種意圖的概率,c為意圖種類標(biāo)號,取值為1、2、3,
本發(fā)明相比現(xiàn)有技術(shù)具有以下優(yōu)點:
1)本發(fā)明采用動態(tài)貝葉斯網(wǎng)絡(luò)實現(xiàn)意圖分析,能夠反映各態(tài)勢要素與藍方意圖的動態(tài)關(guān)系,體現(xiàn)藍方意圖在時間上連續(xù)變化特性;
2)本發(fā)明考慮了群目標(biāo)的相對實力,能夠有效反映編隊的行動意圖;
3)本發(fā)明根據(jù)馬爾可夫性實現(xiàn)快速近似推理,耗費的計算量和存儲空間都較小,且不隨時間變化,能夠有效滿足實際系統(tǒng)的應(yīng)用需求。
附圖說明
圖1是本發(fā)明的整體流程圖;
圖2是用本發(fā)明進行意圖分析的動態(tài)貝葉斯網(wǎng)絡(luò)拓撲;
圖3是用本發(fā)明進行意圖分析的實驗場景;
圖4是用本發(fā)明進行意圖分析的各可觀測節(jié)點隨時間變化曲線;
圖5是用本發(fā)明進行意圖分析的各種意圖后驗概率和藍方意圖估計結(jié)果。
具體實施方式
下面結(jié)合附圖及實施例對本發(fā)明做進一步詳細的說明。
參照圖1,本發(fā)明的基于動態(tài)貝葉斯網(wǎng)絡(luò)的意圖分析方法,具體包括以下步驟:
步驟1.初始設(shè)置為訓(xùn)練模式;
步驟2.數(shù)據(jù)匯集整理。
2.1)初始化性能參數(shù),包括:藍方目標(biāo)速度上限vsup;
2.2)令初始時刻k=1,讀入k時刻的觀測數(shù)據(jù),包括:紅方意圖rk,取值為“撤退”、“防御”或“進攻”,交火程度fk,取值為“低”、“中”或“高”,藍方目標(biāo)數(shù)mk,紅方目標(biāo)數(shù)nk,藍方目標(biāo)實力量化數(shù)據(jù)
2.3)結(jié)合性能參數(shù)和觀測數(shù)據(jù),得到相對實力連續(xù)值
計算相對實力連續(xù)值
計算相對速度連續(xù)值
2.4)對相對實力連續(xù)值和相對速度連續(xù)值進行離散化,得到相對實力sk和相對速度vk;
離散化相對實力
離散化相對速度
步驟3.建立動態(tài)貝葉斯網(wǎng)絡(luò)拓撲。
3.1)利用專家知識和經(jīng)驗建立意圖分析動態(tài)貝葉斯網(wǎng)絡(luò)拓撲,如圖2所示,網(wǎng)絡(luò)節(jié)點包括:可觀測節(jié)點和隱藏節(jié)點,所述的可觀測節(jié)點包括:紅方意圖rk、交火程度fk、相對實力sk、相對速度vk,所述的隱藏節(jié)點為藍方意圖bk,動態(tài)貝葉斯網(wǎng)絡(luò)包含一層推理結(jié)構(gòu),將紅方意圖rk、交火程度fk、相對實力sk、相對速度vk融合得到為藍方意圖bk;
3.2)設(shè)置各網(wǎng)絡(luò)節(jié)點概率分布:
3.2.1)由紅方意圖、交火程度、相對實力、相對速度,分別得到k時刻各態(tài)勢要素的概率分布,包括:紅方意圖概率分布p(rk)、交火程度概率分布p(fk)、相對實力概率分布p(sk)、相對速度概率分布p(vk);
3.2.2)藍方意圖bk,取值為“撤退”、“防御”或“進攻”,當(dāng)k=1時藍方意圖先驗概率分布pf(bk)設(shè)置為等概率分布其中,下標(biāo)f表示所屬概率分布為先驗概率分布;
步驟4.參數(shù)學(xué)習(xí)與設(shè)置。
對動態(tài)貝葉斯網(wǎng)絡(luò)參數(shù)進行學(xué)習(xí)與設(shè)置,具體包括以下步驟:
4.1)判斷當(dāng)前模式是否為訓(xùn)練模式,若是,則執(zhí)行步驟4.2),若否則執(zhí)行步驟5;
4.2)判斷是否達到設(shè)定的學(xué)習(xí)次數(shù),若是,則通過對觀測數(shù)據(jù)學(xué)習(xí),得到各網(wǎng)絡(luò)節(jié)點間的條件概率分布;否則返回步驟(1);所述的各網(wǎng)絡(luò)節(jié)點間的條件概率分布包括:k時刻紅方意圖和藍方意圖的條件概率分布p(rk|bk),k時刻交火程度和藍方意圖的條件概率分布p(fk|bk),k時刻相對實力和藍方意圖的條件概率分布p(sk|bk),k時刻相對速度和藍方意圖的條件概率分布p(vk|bk),k-1時刻藍方意圖和k時刻藍方意圖的條件概率分布p(bk-1|bk);
4.3)將訓(xùn)練所得各網(wǎng)絡(luò)節(jié)點間的條件概率分布設(shè)置為動態(tài)貝葉斯網(wǎng)絡(luò)參數(shù);
4.4)將當(dāng)前模式設(shè)置為應(yīng)用模式,返回步驟2。
步驟5.近似推理。
根據(jù)各網(wǎng)絡(luò)節(jié)點概率分布和各網(wǎng)絡(luò)節(jié)點間的條件概率分布,經(jīng)近似貝葉斯推理得到k時刻藍方意圖的后驗概率分布
5.1)結(jié)合k時刻的紅方意圖、交火程度、相對實力、相對速度、k-1時刻藍方意圖和k時刻藍方意圖的先驗概率分布推理得到k時刻藍方意圖的后驗概率分布
其中,下標(biāo)u表示所屬概率分布為后驗概率分布;
5.2)根據(jù)馬爾可夫性,更新得到k+1時刻的藍方意圖先驗概率分布
pf(bk+1)=pu(bk),6)
步驟6.意圖融合估計。
將k時刻藍方意圖的后驗概率分布融合為k時刻藍方意圖,具體包括以下步驟:
6.1)從k時刻藍方意圖的后驗概率分布中提取各種意圖的后驗概率
pu(bk)={w1,w2,w3},7)
其中,w1為k時刻藍方意圖為“撤退”的概率,w2為k時刻藍方意圖為“防御”的概率,w3為k時刻藍方意圖為“進攻”的概率。
6.2)將各種意圖的后驗概率融合為k時刻藍方意圖
其中,ik為k時刻藍方意圖,取值為1、2、3,分別一一對應(yīng)“撤退”、“防御”或“進攻”,wc為“撤退”、“防御”或“進攻”各種意圖的概率,c為意圖種類標(biāo)號,取值為1、2、3,
步驟7.意圖分析結(jié)果輸出。
7.1)輸出k時刻藍方意圖ik;
7.2)檢查下一時刻的觀測數(shù)據(jù)是否到達,若是,令k=k+1,返回步驟2進行迭代;否則,結(jié)束本流程。
本發(fā)明的效果可通過以下仿真實驗進一步說明:
1.仿真條件。
仿真環(huán)境:計算機采用intelcorei3-2130cpu3.4ghz,2gb內(nèi)存,軟件采用matlabr2011a仿真實驗平臺。
仿真參數(shù):藍方目標(biāo)速度上限vsup=360km/h。
2.仿真方法。
方法1:本發(fā)明方法。
3.仿真內(nèi)容與結(jié)果。
用方法1,實現(xiàn)圖3所示實驗場景中群目標(biāo)2(藍方)對群目標(biāo)6(紅方)的意圖分析,各可觀測節(jié)點隨時間變化曲線如圖4所示,藍方意圖估計結(jié)果如圖5所示,其中:
圖3為用本發(fā)明進行意圖分析的實驗場景;
圖4為用本發(fā)明進行意圖分析的各可觀測節(jié)點隨時間變化曲線;
圖5為用本發(fā)明進行意圖分析的各種意圖后驗概率和藍方意圖估計結(jié)果。
在圖3中,黑點表示各群目標(biāo)的位置量測,連續(xù)多個時刻的位置量測構(gòu)成了多編隊群目標(biāo)運動軌跡,黑色六角形為群目標(biāo)觀測起始位置,旁邊的數(shù)字為群目標(biāo)編號,各群目標(biāo)編隊情況如表1所示。圖3所描繪的態(tài)勢情況為藍方飛機與車輛多編隊突襲紅方車輛集群,遭遇紅方飛機群攔截后撤退。
表1
從圖3和圖4可以看出,隨時間變化,藍方意圖初始為防御,后半段轉(zhuǎn)為進攻;交火程度,在中間時段出現(xiàn)短暫交火;相對實力保持不變;相對速度初始為正向接近,后半段反向遠離。
從圖5可以看出,藍方各種意圖(撤退、防御、進攻)的概率,受輸入變量的影響,起伏變化;通過選取最大概率對應(yīng)意圖得到意圖融合估計結(jié)果。通過分析可以看出,在前半段藍方飛機編隊主動靠近,意圖攻擊紅方車輛編隊;而遭遇紅方攔截,發(fā)生短暫相持交火之后,藍方飛機編隊改變行動策略,選擇撤退。
綜上可以得出,本發(fā)明能夠綜合多種態(tài)勢要素,進行合理、智能的推理分析,實現(xiàn)了對藍方群目標(biāo)意圖的動態(tài)估計,顯著提升了態(tài)勢分析能力。