一種區(qū)間信息條件下的多無人機(jī)目標(biāo)分配決策方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種區(qū)間信息條件下的多無人機(jī)目標(biāo)分配決策方法,屬于無人機(jī)控制 與決策領(lǐng)域。
【背景技術(shù)】
[0002] 無人機(jī)在軍事和民用領(lǐng)域發(fā)揮著越來越重要的作用,在過去的幾十年里,無人機(jī) 作為智能體,在多種危險(xiǎn)和復(fù)雜的環(huán)境下的任務(wù)中得到應(yīng)用。由于多機(jī)協(xié)同執(zhí)行復(fù)雜任務(wù) 能夠大大增加任務(wù)完成概率,因此多無人機(jī)協(xié)同控制和決策問題,受到了極大的關(guān)注。多無 人機(jī)目標(biāo)分配的目的是將若干待攻擊的目標(biāo)分配給多個(gè)無人機(jī),使得總體的分配效能達(dá)到 最優(yōu)。在進(jìn)行目標(biāo)分配時(shí),需要考慮多個(gè)屬性,無人機(jī)的航程代價(jià),無人機(jī)的毀傷代價(jià),價(jià)值 收益等。
[0003] 目前,對(duì)多無人機(jī)目標(biāo)分配問題,往往使用數(shù)學(xué)規(guī)劃或群體協(xié)商等方法進(jìn)行求解。 但在真實(shí)的任務(wù)環(huán)境中,掌握的屬性信息是往往不確定的,表現(xiàn)為隨機(jī)性或者模糊性,比如 目標(biāo)的位置信息,雖然可以事先探測(cè),但不能保證完全準(zhǔn)確,具有一定的隨機(jī)性;保護(hù)目標(biāo) 的防空力量,其對(duì)無人機(jī)的威脅程度難以確定;目標(biāo)的價(jià)值,往往也是模糊的,難以精確給 定。不確定性來源于多種因素,有傳感器的不精確、目標(biāo)的移動(dòng)和偽裝、主觀判斷的不精確 等等,多種形式的不確定性往往混合在一起,形成一種深度不確定的局面,使得常規(guī)的數(shù)學(xué) 規(guī)劃方法和群體協(xié)商的方法難以奏效。因此,在深度不確定的條件下進(jìn)行目標(biāo)分配的研宄 具有現(xiàn)實(shí)的意義。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明是為了克服現(xiàn)有技術(shù)存在的不足之處,提供一種區(qū)間信息條件下的多無人 機(jī)目標(biāo)分配決策方法,以期能有效解決深度不確定條件下,屬性是不確定區(qū)間信息的多無 人機(jī)目標(biāo)分配問題,提高目標(biāo)分配的效果,從而滿足復(fù)雜戰(zhàn)場(chǎng)的決策需要。
[0005] 本發(fā)明為解決技術(shù)問題采取如下技術(shù)方案:
[0006] 本發(fā)明一種區(qū)間信息條件下的多無人機(jī)目標(biāo)分配決策方法,是應(yīng)用于由N"架無人 機(jī)攻打NT個(gè)地面目標(biāo)的戰(zhàn)場(chǎng)環(huán)境中,并有N "= N T;其特點(diǎn)是按照如下步驟進(jìn)行:
[0007] 步驟一、定義多無人機(jī)目標(biāo)分配決策的變量:
[0008] 將所述乂架無人機(jī)記為M =丨"!,七丨,i彡i彡Nu;,u廣示所述N "架 無人機(jī)U中第i架無人機(jī);將所述nt個(gè)地面目標(biāo)記為纟=…,&},1彡j彡nt;, tj表示所述N T個(gè)地面目標(biāo)t中第j個(gè)地面目標(biāo);
[0009] 定義xu為一個(gè)判斷值,x1表示第i架無人機(jī)u i攻打第j個(gè)地面目標(biāo)t」,xu =0表示第i架無人機(jī)1^不攻打第j個(gè)地面目標(biāo)t j;
[0010] 定義h表示所述第i架無人機(jī)11 i攻打第j個(gè)地面目標(biāo)t j寸的價(jià)值收益區(qū)間 信息,并有
服從均勻分布表示所述價(jià)值收益的權(quán)重區(qū)間信息,并有
服從均勾分布;
[0011] 定義表示所述第i架無人機(jī)u i攻打第j個(gè)地面目標(biāo)t j寸的航程代價(jià)區(qū)間 信息,并有
服從均勻分布表示所述航程代價(jià)的權(quán)重區(qū)間信息,并有
服從均勾分布;
[0012] 定義h表示所述第i架無人機(jī)11 i攻打第j個(gè)地面目標(biāo)t j寸的毀傷代價(jià)區(qū)間 信息,并有
服從均勻分布;表示所述毀傷代價(jià)的權(quán)重區(qū)間信息,并有
服從均勾分布;
[0013] 步驟二、利用蒙特卡羅仿真方法計(jì)算所述第i架無人機(jī)+攻打第j個(gè)地面目標(biāo)t」 時(shí)所有排名的可接受度分析指標(biāo)集合;
[0014] 步驟三、計(jì)算所述第i架無人機(jī)Ui攻打第j個(gè)地面目標(biāo)h的全局可接受度分析指 標(biāo) a。-;
[0015] 步驟四、建立目標(biāo)分配模型:
[0016] 步驟五、將所述全局可接受度分析指標(biāo)代入所述目標(biāo)分配模型中,從而獲得目 標(biāo)分配的最優(yōu)決策方案。
[0017] 本發(fā)明所述的區(qū)間信息條件下的多無人機(jī)目標(biāo)分配決策方法的特點(diǎn)也在于,
[0018] 所述步驟二是按如下步驟進(jìn)行:
[0019] 步驟2. 1、對(duì)所述價(jià)值收益區(qū)間信息Rij、航程代價(jià)區(qū)間信息Fij和毀傷代價(jià)區(qū)間信 息進(jìn)行歸一化處理;獲得歸一化處理后的價(jià)值收益區(qū)間信息
、航程代 價(jià)區(qū)間信息
和毀傷代價(jià)區(qū)間信息
[0020] 步驟2. 2、定義迭代次數(shù)為1;迭代閾值T;
[0021] 步驟2. 3、初始化j= 1 ;
[0022] 步驟2. 4、初始化1 = 1 ;
[0023] 步驟2. 5、利用式(1)、式⑵和式⑶分別獲得初始權(quán)重向量
[0027] 式⑴和式⑵中,unifrnd□函數(shù)表示產(chǎn)生服從均勻分布區(qū)間□的隨機(jī)數(shù);
[0028] 步驟2. 6、判斷
是否成立;若成立,則執(zhí)行步驟2. 7 ;否則清零并返 回步驟2. 5 ;
[0029] 步驟2. 7、利用式(4)、式(5)和式(6)分別獲得初始價(jià)值收益<、航程代價(jià)g和 毀傷代價(jià)4:
[0033] 步驟2.8、利用式(7)獲得所述第i架無人機(jī)七攻打第j個(gè)地面目標(biāo)寸的效用
[0035] 步驟2. 9、重復(fù)步驟2. 7和步驟2. 8,從而獲得第1次迭代下的乂架無人機(jī)的效用 集合
[0036] 步驟2. 10、將所述第1次迭代下的N"架無人機(jī)的效用集合
進(jìn)行降序排序,從而獲得第1次迭代下的所述第i架無人機(jī)4攻 打第j個(gè)地面目標(biāo)時(shí)的次序/<,進(jìn)而獲得第1次迭代下的乂架無人機(jī)攻打第j個(gè)地面目 標(biāo)tj時(shí)的次序集合
[0037] 步驟2. 11、將1+1賦值給1,并判斷1彡t是否成立,若成立,則返回步驟2. 5順 序執(zhí)行;否則獲得T次迭代下的所述第i架無人機(jī)^攻打第j個(gè)地面目標(biāo)時(shí)的次序集 合
,進(jìn)而獲得T次迭代下的乂架無人機(jī)攻打第j個(gè)地面目標(biāo)h時(shí)的次 序集合
[0038] 步驟2. 12、統(tǒng)計(jì)t次迭代下所述第i架無人機(jī)七攻打第j個(gè)地面目標(biāo)tj寸次 序1在所述次序集合
中出現(xiàn)的概率g; 1彡r彡Nu;以所述概率|作 為所述第i架無人機(jī)W攻打第j個(gè)地面目標(biāo)時(shí)排名第r的可接受度分析指標(biāo)%;從而 獲得所述第i架無人機(jī)W攻打第j個(gè)地面目標(biāo)時(shí)所有排名的可接受度分析指標(biāo)集合
,進(jìn)而獲得乂架無人機(jī)攻打第j個(gè)地面目標(biāo)時(shí)所有排名的可接受度分 析指標(biāo)集合
[0039] 步驟2. 13、將j+1賦值給j,并判斷j彡NT是否成立,若成立,則返回步驟2. 4 順序執(zhí)行;否則獲得N"架無人機(jī)一對(duì)一攻打NT個(gè)地面目標(biāo)時(shí)的可接受度分析指標(biāo)集合
[0040]所述步驟2. 1中是利用式(8)、式(9)和式(10)進(jìn)行歸一化處理:
[0047] 所述步驟三是利用式(11)獲得第i架無人機(jī)+攻打第j個(gè)目標(biāo)^的全局可接受 度分析指標(biāo)aij:
[0050] 所述步驟四的目標(biāo)分配模型為:
[0054] XijG{〇, 1} (15)
[0055] 式(13)和(14)表示每個(gè)地面目標(biāo)只能分配給一架無人機(jī);每架無人機(jī)只能攻打 一個(gè)地面目標(biāo)。
[0056] 與已有技術(shù)相比,本發(fā)明的有益效果體現(xiàn)在:
[0057] 1、本發(fā)明提出了一套新的解決復(fù)雜戰(zhàn)場(chǎng)環(huán)境下多無人機(jī)目標(biāo)分配的決策方法, 將無人機(jī)目標(biāo)分配問題看成是一個(gè)隨機(jī)多屬性決策問題,考慮了價(jià)值收益、航程代價(jià)、毀傷 代價(jià)這三個(gè)屬性,屬性和權(quán)重的隨機(jī)性通過區(qū)間信息來表示,利用仿真計(jì)算得到評(píng)估指標(biāo) 值,再結(jié)合目標(biāo)分配模型進(jìn)行綜合決策,從而得到最優(yōu)分配方案;
[0058] 2、本發(fā)明將屬性和權(quán)重用區(qū)間信息表示,可以充分利用評(píng)價(jià)者的模糊屬性信息和 決策者的部分偏好信息,使得在盡可能滿足決策者愿望的前提下,作出客觀合理的決策;
[0059] 3、本發(fā)明將計(jì)算出的全局可接受度指標(biāo)作為最終的評(píng)估指標(biāo),它是隨機(jī)多屬性決 策方法中考慮的一個(gè)重要指標(biāo),可以表示決策方案綜合的可接受度,相比排名可接受度指 標(biāo)來說更具有全局性,評(píng)估更加簡單方便;
[0060] 4、本發(fā)明計(jì)算評(píng)估指標(biāo)時(shí)采用的是蒙特卡羅仿真方法,它是通過大量而簡單的重 復(fù)抽樣實(shí)現(xiàn)的,計(jì)算方法和程序內(nèi)部都很簡單,適應(yīng)性強(qiáng),受問題條件限制的影響較小;
[0061] 5、本發(fā)明提出了一個(gè)目標(biāo)分配模型,是以分配方案的全局可接受度指標(biāo)加和最大 為最優(yōu)分配方案,并且每個(gè)地面目標(biāo)只能分配給一架無人機(jī),每架無人機(jī)只能攻打一個(gè)地 面目標(biāo),從一對(duì)一的分配層次上保證了無人機(jī)資源利用的最大化。
【附圖說明】
[0062] 圖1為本發(fā)明分配決策方法流程圖。
【具體實(shí)施方式】
[0063] 本實(shí)施例中,一種區(qū)間信息條件下的多無人機(jī)目標(biāo)分配決策方法,是應(yīng)用于由N" 架無人機(jī)攻打NT個(gè)地面目標(biāo)的戰(zhàn)場(chǎng)環(huán)境中,并有N"=NT;具體地說,是按照如下步驟進(jìn)行:
[0064] 步驟一、定義多無人機(jī)目標(biāo)分配決策的變量:
[0065] 將乂架無人機(jī)記為
,1 <i<Nu;,ui表示Nu架無人機(jī)u 中第i架無人機(jī);將化個(gè)地面目標(biāo)記為#=仏4,"_,9",&},1彡」_彡心,、表示^個(gè)地面目標(biāo)t中第j個(gè)地面目標(biāo);
[0066] 定義xu為一個(gè)判斷值,x1表示第i架無人機(jī)u i攻打第j個(gè)地面目標(biāo)t」,xu =0表示第i架無人機(jī)1^不攻打第j個(gè)地面目標(biāo)t j;
[0067] 在實(shí)際的復(fù)雜戰(zhàn)場(chǎng)環(huán)境中,很難獲得準(zhǔn)確的目標(biāo)分配信息,這些信息在數(shù)學(xué)上可 表述為不確定區(qū)間決策信息;多無人機(jī)目標(biāo)分配問題可以描述為基于區(qū)間信息的隨機(jī)多屬 性決策問題,屬性分別為價(jià)值收益指標(biāo),航程代價(jià)指標(biāo)和毀傷代價(jià)指標(biāo)。定義Ru表示第i 架無人機(jī)Ui攻打第j個(gè)地面目標(biāo)寸的價(jià)值收益區(qū)間信息,并有
服從均勻 分布;^^表不價(jià)值收益的權(quán)重區(qū)間信息,并有
服從均勾分布;
[0068] 定義匕表示第i架無人機(jī)u i攻打第j個(gè)地面目標(biāo)寸的航程代價(jià)區(qū)間信息,并 有
服從均勻分布;〇^表示航程代價(jià)的權(quán)重區(qū)間信息,并有
服從均勾分布;
[0069] 定義表示第i架無人機(jī)u