技術特征:1.一種經驗權重更新和時延敏感獎勵的多任務群體感知方法,所述方法包括以下步驟:
技術總結本發(fā)明涉及一種經驗權重更新和時延敏感獎勵的多任務群體感知方法,所述方法包括以下步驟:步驟1、仿真平臺進行算法的初始化;步驟2、指揮中心初始化環(huán)境;步驟3、仿真平臺根據當前保存的任務分配器策略π進行任務分配;步驟4、根據當前保存的時序預測器參數ψ對每個個體經驗緩沖區(qū)中的緊急任務興趣點進行更新等步驟;所述方法的優(yōu)越技術效果在于:通過分層多智能體強化學習算法,結合經驗緩沖區(qū)和時間預測器,有效提升了多任務移動群體感知的處理效率和能量利用率;移動群體在完成緊急任務后能夠利用剩余時間處理監(jiān)控任務,實現(xiàn)高效的任務調度和軌跡規(guī)劃,顯著提升系統(tǒng)整體響應速度和處理效率,同時最小化能量消耗。
技術研發(fā)人員:方辰,劉馳,王昊
受保護的技術使用者:北京理工大學
技術研發(fā)日:技術公布日:2024/12/23