国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于多旅行商問題的多無人機(jī)軌跡規(guī)劃和數(shù)據(jù)獲取方法

      文檔序號(hào):40278505發(fā)布日期:2024-12-11 13:14閱讀:12來源:國(guó)知局
      基于多旅行商問題的多無人機(jī)軌跡規(guī)劃和數(shù)據(jù)獲取方法

      本發(fā)明屬于無人機(jī)協(xié)同軌跡規(guī)劃,具體涉及一種基于多旅行商問題的多無人機(jī)軌跡規(guī)劃和數(shù)據(jù)獲取方法。


      背景技術(shù):

      1、傳感器網(wǎng)絡(luò)作為物聯(lián)網(wǎng)的“感官系統(tǒng)”,以其無處不在、靈活拓?fù)涞奶攸c(diǎn),已經(jīng)成為連接物與物、人與物之間重要的數(shù)字化橋梁。在未來大規(guī)模傳感器場(chǎng)景中將分布數(shù)十億的傳感器設(shè)備,使得物聯(lián)網(wǎng)技術(shù)從工業(yè)自動(dòng)化到智能交通、智能家居到智慧城市成為可能。

      2、針對(duì)上述需求,為了能更有效地收集這些設(shè)備的數(shù)據(jù),同時(shí)依賴于6g網(wǎng)絡(luò)提供的多維智能協(xié)同服務(wù),裝載了紅外雷達(dá)、高精度傳感器和高清攝像頭的高精尖無人機(jī)的出現(xiàn)為研究人員們提供了新的解決思路。此外,用多無人機(jī)系統(tǒng)替換單個(gè)無人機(jī)系統(tǒng)可以以較低的總體成本提高空間覆蓋范圍、數(shù)據(jù)收集量和降低資源開銷。有人認(rèn)為,在提供通感一體化服務(wù)方面,使用多個(gè)無人機(jī)協(xié)同將會(huì)進(jìn)一步增強(qiáng)感知和通信的覆蓋范圍。也有人認(rèn)為可以使用博弈論來建模和平衡基于無人機(jī)的移動(dòng)邊緣計(jì)算系統(tǒng)的執(zhí)行時(shí)間和能源成本。

      3、然而,目前的技術(shù)大多專注于數(shù)據(jù)感知、資源分配或計(jì)算卸載中,無人機(jī)軌跡規(guī)劃對(duì)數(shù)據(jù)采集的性能也有著至關(guān)重要的作用。有人通過設(shè)計(jì)一種基于深度強(qiáng)化學(xué)習(xí)的方法來解決多任務(wù)的車輛群體感知問題,該方法可以在評(píng)估動(dòng)態(tài)環(huán)境中的感知任務(wù)時(shí)最大化能量效率。當(dāng)前環(huán)境建模問題隨著物理世界的發(fā)展變得越來越復(fù)雜,單個(gè)智能體也很難成為執(zhí)行任務(wù)的首選方案。

      4、為此,多智能體強(qiáng)化學(xué)習(xí)應(yīng)運(yùn)而生。利用多智能體強(qiáng)化學(xué)習(xí)的有用信息路徑規(guī)劃方法,在無需智能體間通信的情況下最大化收獲的數(shù)據(jù)。

      5、因此,解決最小化無人機(jī)工作的總時(shí)間以及均衡每架無人機(jī)的服務(wù)時(shí)間的問題,是本發(fā)明想要解決的技術(shù)問題。


      技術(shù)實(shí)現(xiàn)思路

      1、本發(fā)明的目的在于提供一種基于多旅行商問題的多無人機(jī)軌跡規(guī)劃和數(shù)據(jù)獲取方法,以解決上述背景技術(shù)中提出的問題。

      2、本發(fā)明目的是這樣實(shí)現(xiàn)的:基于多旅行商問題的多無人機(jī)軌跡規(guī)劃和數(shù)據(jù)獲取方法,其特征在于:其特征在于:該方法包括以下步驟:

      3、步驟s1:場(chǎng)景內(nèi)布置多個(gè)傳感器和簇頭節(jié)點(diǎn),傳感器將數(shù)據(jù)傳輸給簇頭節(jié)點(diǎn)進(jìn)行保存,無人機(jī)獲取簇頭節(jié)點(diǎn)數(shù)據(jù);

      4、步驟s2:建立問題模型,綜合考慮傳感器的分簇情況以及簇頭節(jié)點(diǎn)的位置、每架無人機(jī)服務(wù)簇的集合以及訪問這些位置節(jié)點(diǎn)的次序;

      5、步驟s3:將問題模型轉(zhuǎn)變?yōu)槎嗦眯猩虇栴};

      6、步驟s4:利用改進(jìn)遺傳算法對(duì)多無人機(jī)軌跡進(jìn)行全局規(guī)劃;

      7、步驟s5:利用多智能體強(qiáng)化學(xué)習(xí)規(guī)劃多無人機(jī)局部軌跡和數(shù)據(jù)獲取;

      8、步驟s6:利用coma算法制定無人機(jī)飛行策略實(shí)時(shí)調(diào)整無人機(jī)的飛行角度、軌跡和計(jì)算方法,完成多無人機(jī)軌跡規(guī)劃、數(shù)據(jù)傳輸和計(jì)算任務(wù)。

      9、優(yōu)選的,所述步驟s1中場(chǎng)景內(nèi)布置多個(gè)傳感器和簇頭節(jié)點(diǎn),傳感器將數(shù)據(jù)傳輸給簇頭節(jié)點(diǎn)進(jìn)行保存,無人機(jī)獲取簇頭節(jié)點(diǎn)數(shù)據(jù),具體為:

      10、場(chǎng)景內(nèi)隨機(jī)分布se個(gè)傳感器,每個(gè)傳感器收集其周圍地面環(huán)境的信息,傳感器收集的數(shù)據(jù)類型為濕度、溫度、噪聲、煙霧濃度和視頻數(shù)據(jù);

      11、場(chǎng)景內(nèi)部署k個(gè)簇頭節(jié)點(diǎn),k個(gè)簇頭節(jié)點(diǎn)對(duì)其采集范圍內(nèi)的傳感器se進(jìn)行預(yù)收集并等待無人機(jī)執(zhí)行數(shù)據(jù)獲取任務(wù),滿足k>>u,u為無人機(jī)總數(shù);

      12、假設(shè)簇頭節(jié)點(diǎn)的發(fā)射功率為pk,簇內(nèi)其他節(jié)點(diǎn)的發(fā)射功率為pse,pk>>pse;

      13、所有的傳感器節(jié)點(diǎn)一共分成k個(gè)簇,每個(gè)傳感器必須與一個(gè)簇頭節(jié)點(diǎn)k相綁,簇頭節(jié)點(diǎn)k的接收信噪比表示為:

      14、

      15、其中,dk,se是簇頭節(jié)點(diǎn)k與傳感器se之間的距離;α是路徑損耗指數(shù),σ2是噪聲功率。

      16、優(yōu)選的,所述步驟s2中建立問題模型,具體為:

      17、步驟s2-1:建立無人機(jī)運(yùn)動(dòng)學(xué)模型,約束無人機(jī)在飛行過程中獲取的數(shù)據(jù)速度、角度和距離;

      18、步驟s2-2:建立傳輸信道模型,分析無人機(jī)與簇頭節(jié)點(diǎn)之間傳輸信道的平均路徑損耗;

      19、步驟s2-3:建立無人機(jī)數(shù)據(jù)獲取模型,分析無人機(jī)在飛行過程中的數(shù)據(jù)獲取速率、數(shù)據(jù)獲取時(shí)間、數(shù)據(jù)獲取能耗;

      20、步驟s2-4:建立無人機(jī)計(jì)算模型,分析無人機(jī)在獲取完數(shù)據(jù)后的計(jì)算模式,分析無人機(jī)在一次數(shù)據(jù)獲取任務(wù)周期內(nèi)的時(shí)間組成;

      21、步驟s2-5:建立無人機(jī)獲取簇頭節(jié)點(diǎn)的數(shù)據(jù)量問題模型,優(yōu)化無人機(jī)服務(wù)的分簇情況、無人機(jī)一輪任務(wù)周期內(nèi)需要獲取每個(gè)簇的總數(shù)據(jù)量、無人機(jī)服務(wù)的簇頭節(jié)點(diǎn)的位置、無人機(jī)訪問這些位置的次序、無人機(jī)獲取數(shù)據(jù)時(shí)飛行軌跡的離散化位置以及無人機(jī)采用的通信計(jì)算策略。

      22、優(yōu)選的,所述步驟s2-4中建立無人機(jī)計(jì)算模型,分析無人機(jī)在獲取完數(shù)據(jù)后的計(jì)算模式,具體為:

      23、假設(shè)服務(wù)器具有總計(jì)算資源ctotal,令cu表示分配給無人機(jī)u的計(jì)算資源,則無人機(jī)計(jì)算模型為:

      24、

      25、其中,表示為數(shù)據(jù)獲取時(shí)間,表示無人機(jī)的獲取速率;當(dāng)無人機(jī)完成一輪數(shù)據(jù)獲取任務(wù)后,數(shù)據(jù)獲取任務(wù)放入本地隊(duì)列進(jìn)行計(jì)算;

      26、每架無人機(jī)都裝載了一個(gè)cpu作為計(jì)算設(shè)備,由于自身的能力有限,需要通過d2d的方式傳輸給附近無人機(jī)進(jìn)行協(xié)同計(jì)算,從而得到更好的性能;

      27、建立d2d通信模型,具體操作為:

      28、假設(shè)無人機(jī)的通信半徑為r,兩個(gè)無人機(jī)間只有在距離r以內(nèi)才能進(jìn)行通信,使用nu={n|n∈u,dn,u<r}表示無人機(jī)u的潛在可通信無人機(jī)集合,無人機(jī)u到無人機(jī)n之間的傳輸速率為:

      29、

      30、其中,是無人機(jī)分配給d2d通信的信道帶寬,為無人機(jī)u到無人機(jī)n的傳輸功率,為無人機(jī)u與無人機(jī)n之間的信道增益,dn,u表示無人機(jī)u和無人機(jī)n之間的距離;

      31、傳輸時(shí)間為:

      32、

      33、其中,ηu表示d2d通信的計(jì)算任務(wù)的比例,ηu∈[0,1];選擇d2d通信方式時(shí)數(shù)據(jù)傳輸?shù)哪芰肯臑椋?/p>

      34、

      35、計(jì)算時(shí)間為:

      36、

      37、其中,表示無人機(jī)n的本地cpu頻率;則采用d2d通信計(jì)算傳輸總時(shí)間為

      38、消耗能量為:

      39、

      40、其中,δn(fn)2為無人機(jī)n的單位cpu周期的能耗;則采用d2d通信計(jì)算傳輸總能耗為

      41、因此無人機(jī)u選擇d2d通信模式的時(shí)間和能耗加權(quán)和為:

      42、

      43、其中,θt和θe分別表示時(shí)間加權(quán)系數(shù)和能耗加權(quán)系數(shù),滿足θt+θe=1;

      44、假設(shè)無人機(jī)u選擇本地計(jì)算,時(shí)間為:

      45、

      46、其中,表示無人機(jī)u的本地cpu頻率,(1-ηu)是本地計(jì)算數(shù)據(jù)獲取任務(wù)的比例;

      47、能耗為:

      48、

      49、其中,δu(fu)2為無人機(jī)u的單位cpu周期的能耗;時(shí)間和能耗加權(quán)和為:

      50、

      51、優(yōu)選的,所述步驟s2-5中建立無人機(jī)獲取簇頭節(jié)點(diǎn)的數(shù)據(jù)量問題模型,具體為:

      52、

      53、其中,為傳輸時(shí)間,為計(jì)算時(shí)間,tu是無人機(jī)完成一輪數(shù)據(jù)獲取任務(wù)的時(shí)間;無人機(jī)所花費(fèi)的時(shí)間包括無人機(jī)飛行過程中獲取數(shù)據(jù)的時(shí)間、獲取完數(shù)據(jù)之后無人機(jī)之間傳輸數(shù)據(jù)的時(shí)間以及無人機(jī)本地計(jì)算和d2d通信計(jì)算的時(shí)間,無人機(jī)完成一輪數(shù)據(jù)獲取任務(wù)的時(shí)間不超過無人機(jī)遍歷完簇頭節(jié)點(diǎn)的飛行時(shí)間;

      54、

      55、其中,為無人機(jī)u到無人機(jī)n之間數(shù)據(jù)獲取時(shí)間;為無人機(jī)u到無人機(jī)n之間數(shù)據(jù)傳輸時(shí)間;為選擇d2d通信的方式時(shí)無人機(jī)u到無人機(jī)n之間數(shù)據(jù)計(jì)算時(shí)間;為無人機(jī)本地計(jì)算時(shí)間;為無人機(jī)飛行時(shí)間。

      56、優(yōu)選的,所述步驟s3中將問題模型轉(zhuǎn)變?yōu)槎嗦眯猩虇栴},具體為:

      57、由t(u)表達(dá)式知道,需要優(yōu)化傳感器的分簇情況以及簇頭節(jié)點(diǎn)的位置、每架無人機(jī)服務(wù)簇的集合以及訪問這些位置節(jié)點(diǎn)的次序,來最小化無人機(jī)工作的總時(shí)間,并且同時(shí)均衡每架無人機(jī)的服務(wù)時(shí)間,優(yōu)化問題表述如下:

      58、

      59、其中,mu為第u個(gè)無人機(jī)服務(wù)的簇的集合,表示無人機(jī)一輪任務(wù)周期內(nèi)需要獲取每個(gè)簇的總數(shù)據(jù)量;為無人機(jī)服務(wù)的簇頭節(jié)點(diǎn)的位置,為無人機(jī)獲取數(shù)據(jù)時(shí)飛行軌跡離散化位置的集合;u為無人機(jī)u,n為無人機(jī)n;表示無人機(jī)選擇本地計(jì)算,表示采用d2d傳輸?shù)綗o人機(jī)進(jìn)行計(jì)算,每個(gè)無人機(jī)只能選擇一種計(jì)算策略,即滿足γk為簇頭節(jié)點(diǎn)k的接收信噪比;為接收信噪比的閾值;pk為簇頭節(jié)點(diǎn)的發(fā)射功率;ζave(db)為平均路徑損耗;為無人機(jī)飛行的能量消耗;為無人機(jī)獲取簇頭節(jié)點(diǎn)數(shù)據(jù)的通信帶寬;為無人機(jī)分配給d2d通信的信道帶寬;dmin為無人機(jī)與障礙物之間和兩個(gè)無人機(jī)之間的最小安全距離;為第ob個(gè)障礙物的中心坐標(biāo),pth為閾值;為無人機(jī)u的起始位置;bu為分配給無人機(jī)u的帶寬資源;bmax為帶寬資源的最大值;

      60、約束c1表示簇頭節(jié)點(diǎn)的接收信噪比必須大于閾值,約束c2表示無人機(jī)在飛行過程中的接收功率必須大于接收門限;約束c3表示簇內(nèi)元素不相交,c4表示每架無人機(jī)服務(wù)的簇集合也不相交;約束c5表示所有無人機(jī)在獲取完數(shù)據(jù)之后必須重新回到起始位置進(jìn)行充電;約束c6表示無人機(jī)完成一輪數(shù)據(jù)獲取任務(wù)的時(shí)間不超過無人機(jī)遍歷完簇頭節(jié)點(diǎn)的飛行時(shí)間;約束c7表示一個(gè)周期結(jié)束后,無人機(jī)最長(zhǎng)的工作時(shí)間與最短的工作時(shí)間之間的差要小于閾值ε;約束c8表示每個(gè)無人機(jī)只能選擇一種計(jì)算策略,約束c9表示無人機(jī)完成一輪數(shù)據(jù)獲取任務(wù)的能耗要小于無人機(jī)自身的電量;約束c10是對(duì)無人機(jī)用于數(shù)據(jù)獲取和d2d通信的帶寬約束;約束c11是為了保障無人機(jī)飛行的可行性,約束c12是為了保障無人機(jī)飛行的安全性。

      61、優(yōu)選的,所述步驟s4中利用改進(jìn)遺傳算法對(duì)多無人機(jī)軌跡進(jìn)行全局規(guī)劃,具體為:

      62、根據(jù)無人機(jī)的數(shù)量將mtsp問題分解為獨(dú)立的tsp子問題,通過2-opt優(yōu)化改進(jìn)遺傳算法求解獨(dú)立的tsp子問題,具體為:

      63、步驟s4-1:初始化種群;

      64、對(duì)種群進(jìn)行二進(jìn)制編碼,即每個(gè)個(gè)體的基因型都是一個(gè)二進(jìn)制編碼符號(hào)串;

      65、步驟s4-2:引入2-opt優(yōu)化算子,在執(zhí)行每次遺傳操作前對(duì)劣勢(shì)個(gè)體單獨(dú)優(yōu)化;

      66、為了保持種群的多樣性,下一代種群中會(huì)由剩余的doping算子隨機(jī)產(chǎn)生新的個(gè)體直接加入。

      67、步驟s4-3:計(jì)算適應(yīng)度函數(shù);

      68、將得到的無人機(jī)任務(wù)完成時(shí)間函數(shù)的倒數(shù)作為評(píng)估個(gè)體適應(yīng)度大小的函數(shù),時(shí)間越短適應(yīng)度越高,時(shí)間越長(zhǎng)適應(yīng)度越低;

      69、設(shè)種群中個(gè)體總數(shù)為n,無人機(jī)u的適應(yīng)度為其中,t(u)表示無人機(jī)完成一輪數(shù)據(jù)獲取任務(wù)的時(shí)間;無人機(jī)u被選取的概率為

      70、步驟s4-4:判斷是否滿足終止條件,如果滿足則執(zhí)行步驟s5操作,如果不滿足則執(zhí)行步驟s4-5操作;

      71、步驟s4-5:對(duì)不滿足終止條件的種群,進(jìn)行選擇操作、交叉操作以及變異操作,進(jìn)行操作后返回步驟s4-2,直至滿足終止條件。

      72、優(yōu)選的,所述步驟s5中利用多智能體強(qiáng)化學(xué)習(xí)規(guī)劃多無人機(jī)局部軌跡和數(shù)據(jù)獲取,具體為:

      73、將多無人機(jī)傳感和計(jì)算問題建模為部分可觀測(cè)的馬爾可夫決策過程,定義為一個(gè)元組其中,為系統(tǒng)狀態(tài)空間,為動(dòng)作空間,為狀態(tài)轉(zhuǎn)移函數(shù),為系統(tǒng)觀測(cè)空間,為狀態(tài)-動(dòng)作對(duì),r為獎(jiǎng)勵(lì)函數(shù);γ為折現(xiàn)因子;ω為觀測(cè)函數(shù);

      74、每個(gè)智能體獲得一個(gè)基于當(dāng)前系統(tǒng)狀態(tài)觀測(cè)到的根據(jù)他們的策略πu(at|jt)選擇一個(gè)動(dòng)作作為動(dòng)作的結(jié)果,智能體將從環(huán)境中獲得獎(jiǎng)勵(lì)和下一次觀測(cè);觀測(cè)函數(shù)每個(gè)智能體都有一個(gè)動(dòng)作觀測(cè)歷史那么它們的策略為所有智能體都共享相同的獎(jiǎng)勵(lì)函數(shù)未來回報(bào)的折現(xiàn)因子為γ∈[0,1),則折扣反饋收益為智能體的聯(lián)合策略產(chǎn)生了一個(gè)價(jià)值函數(shù),即對(duì)折扣反饋的期望,表示為以及動(dòng)作價(jià)值函數(shù)優(yōu)勢(shì)函數(shù)相應(yīng)為fπ(st,at)=qπ(st,at)-vπ(st);

      75、對(duì)狀態(tài)空間、觀測(cè)空間、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù)進(jìn)行具體定義,定義如下:

      76、狀態(tài)空間sk是時(shí)變?nèi)蝿?wù)信息的集合,每個(gè)簇頭節(jié)點(diǎn)的狀態(tài)用元組表示,表示簇頭節(jié)點(diǎn)的位置坐標(biāo),cu表示完成數(shù)據(jù)獲取任務(wù)計(jì)算所需的cpu周期,du表示無人機(jī)一輪任務(wù)周期內(nèi)需要獲取每個(gè)簇的總數(shù)據(jù)量;sn是用作d2d通信無人機(jī);su是進(jìn)行數(shù)據(jù)獲取任務(wù)的無人機(jī)狀態(tài);

      77、觀測(cè)空間:智能體的觀測(cè)空間是狀態(tài)空間的子集,觀測(cè)空間是無人機(jī)觀測(cè)范圍內(nèi)最近的任務(wù)狀態(tài)的集合k′(k′≤k);表示最近的無人機(jī)狀態(tài)的集合u′(u′≤u);

      78、動(dòng)作空間:根據(jù)策略和觀測(cè)到的系統(tǒng)狀態(tài),每個(gè)無人機(jī)在每個(gè)時(shí)隙做出包括數(shù)據(jù)獲取、傳輸和計(jì)算的聯(lián)合動(dòng)作;動(dòng)作空間du,k是無人機(jī)的飛行距離,和ωu分別是無人機(jī)俯仰角和偏航角,ηu和nu分別是無人機(jī)進(jìn)行d2d通信的任務(wù)比例和選擇序號(hào),ηu和nu構(gòu)成了無人機(jī)u的計(jì)算策略;

      79、獎(jiǎng)勵(lì)函數(shù):對(duì)于每個(gè)狀態(tài),智能體選擇它們的動(dòng)作并從環(huán)境中獲得獎(jiǎng)勵(lì),將“狀態(tài)-動(dòng)作對(duì)作為輸入函數(shù);系統(tǒng)的獎(jiǎng)勵(lì)

      80、其中,是表示無人機(jī)u在時(shí)隙t獲取數(shù)據(jù)獲得的增益,表示無人機(jī)u的時(shí)間和能量消耗的總成本,為懲罰;

      81、

      82、其中,χu,k∈{0,1}表示簇頭節(jié)點(diǎn)k的數(shù)據(jù)是否由無人機(jī)u先獲??;如果是,則χu,k=1,否則χu,k=0;g(du,cu)是無人機(jī)u獲取的數(shù)據(jù)量du與其計(jì)算能量cu相關(guān)的增益函數(shù);對(duì)無人機(jī)飛出目標(biāo)區(qū)域和沒有獲取足夠數(shù)據(jù)量這兩種情況設(shè)置了懲罰因子表示為:

      83、

      84、其中,表示無人機(jī)u飛出目標(biāo)區(qū)域,否則τfly是無人機(jī)飛出區(qū)域的懲罰值;表示在時(shí)隙內(nèi)沒獲取的數(shù)據(jù)量,τina表示未獲取數(shù)據(jù)量的懲罰因子;

      85、表示為時(shí)間和能量消耗的總和,即:

      86、

      87、其中,和表示優(yōu)先考慮時(shí)間或能量消耗的權(quán)重,表示無人機(jī)u在t時(shí)刻獲取數(shù)據(jù)獲得的增益。

      88、優(yōu)選的,所述步驟s6中利用coma算法制定無人機(jī)飛行策略實(shí)時(shí)調(diào)整無人機(jī)的飛行角度、軌跡和計(jì)算方法,完成多無人機(jī)軌跡規(guī)劃、數(shù)據(jù)傳輸和計(jì)算任務(wù),具體為:

      89、采用集中式critic計(jì)算一個(gè)特定于智能體的優(yōu)勢(shì)函數(shù),進(jìn)而解決多智能體協(xié)作系統(tǒng)中的置信分配問題,集中式critic的q(st,at)估計(jì)以集中狀態(tài)st為條件的動(dòng)作at的q值;

      90、對(duì)于每個(gè)智能體u,都可以計(jì)算一個(gè)優(yōu)勢(shì)函數(shù),將當(dāng)前的動(dòng)作的q值與邊緣化的反事實(shí)基線進(jìn)行比較,同時(shí)保持其他智能體的動(dòng)作a-u固定,表示如下:

      91、

      92、其中,-u表示除智能體u之外的智能體,fu(st,at)為每個(gè)智能體計(jì)算一個(gè)單獨(dú)的基線,基線使用集中式critic來推理反事實(shí);其中,只有u的動(dòng)作發(fā)生變化,直接從智能體的經(jīng)驗(yàn)中學(xué)習(xí),而不是依賴額外的模擬、設(shè)計(jì)的默認(rèn)動(dòng)作或者獎(jiǎng)勵(lì)模型;

      93、為了優(yōu)化πu(·|ju),使用策略梯度定理,并最小化:

      94、

      95、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下改進(jìn)及優(yōu)點(diǎn):

      96、1、通過多無人機(jī)輔助大規(guī)模傳感器系統(tǒng)獲取數(shù)據(jù),綜合考慮傳感器的分簇情況以及簇頭節(jié)點(diǎn)的位置、每架無人機(jī)服務(wù)簇的集合以及訪問這些位置節(jié)點(diǎn)的次序等因素,最小化無人機(jī)工作的總時(shí)間,同時(shí)通過均衡每個(gè)簇內(nèi)的數(shù)據(jù)量均衡每架無人機(jī)的服務(wù)時(shí)間。

      97、2、通過改進(jìn)遺傳算法對(duì)多無人機(jī)軌跡進(jìn)行粗略的全局規(guī)劃,使得在獲取盡可能多的數(shù)據(jù)的同時(shí)減少無人機(jī)的飛行時(shí)間并降低其成本;對(duì)每個(gè)無人機(jī)粗粒度的全局軌跡中相鄰的數(shù)據(jù)獲取位置之間的局部軌跡進(jìn)行微調(diào),以提高數(shù)據(jù)獲取率。

      98、3、利用基于差異獎(jiǎng)勵(lì)的優(yōu)勢(shì)函數(shù)解決智能體的信用分配問題,在多無人機(jī)軌跡規(guī)劃的同時(shí)完成數(shù)據(jù)傳輸和計(jì)算任務(wù),有效地緩解單一無人機(jī)的負(fù)載壓力。

      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1