1.一種自適應(yīng)路徑規(guī)劃的無人機(jī)電池動態(tài)管理強(qiáng)化學(xué)習(xí)方法,其特征在于:包括,
2.如權(quán)利要求1所述的自適應(yīng)路徑規(guī)劃的無人機(jī)電池動態(tài)管理強(qiáng)化學(xué)習(xí)方法,其特征在于:所述在地面控制站激活無人機(jī)的多模態(tài)感知,收集無人機(jī)的多模態(tài)感知數(shù)據(jù)并進(jìn)行預(yù)處理,具體步驟為:
3.如權(quán)利要求2所述的自適應(yīng)路徑規(guī)劃的無人機(jī)電池動態(tài)管理強(qiáng)化學(xué)習(xí)方法,其特征在于:所述利用深度學(xué)習(xí)模型對預(yù)處理后的多模態(tài)數(shù)據(jù)進(jìn)行融合分析,生成環(huán)境感知圖,具體步驟為:
4.如權(quán)利要求3所述的自適應(yīng)路徑規(guī)劃的無人機(jī)電池動態(tài)管理強(qiáng)化學(xué)習(xí)方法,其特征在于:所述基于環(huán)境感知圖,采用強(qiáng)化學(xué)習(xí)算法進(jìn)行自適應(yīng)路徑規(guī)劃,并通過無人機(jī)狀態(tài)和環(huán)境條件,動態(tài)生成最優(yōu)飛行路徑和電池管理策略,具體步驟為:
5.如權(quán)利要求4所述的自適應(yīng)路徑規(guī)劃的無人機(jī)電池動態(tài)管理強(qiáng)化學(xué)習(xí)方法,其特征在于:所述將路徑規(guī)劃和電池管理策略上傳至群體智能中心節(jié)點(diǎn),利用基于群體智能算法進(jìn)行全局優(yōu)化,生成優(yōu)化后的任務(wù)分配和飛行策略,具體步驟為:
6.如權(quán)利要求5所述的自適應(yīng)路徑規(guī)劃的無人機(jī)電池動態(tài)管理強(qiáng)化學(xué)習(xí)方法,其特征在于:所述執(zhí)行優(yōu)化后的飛行策略,持續(xù)監(jiān)測環(huán)境變化并實(shí)時(shí)更新環(huán)境感知圖,動態(tài)調(diào)整飛行路徑和電池管理策略,具體步驟為:
7.如權(quán)利要求6所述的自適應(yīng)路徑規(guī)劃的無人機(jī)電池動態(tài)管理強(qiáng)化學(xué)習(xí)方法,其特征在于:所述飛行任務(wù)完成后,收集飛行數(shù)據(jù)、環(huán)境感知數(shù)據(jù)和決策記錄反饋至地面控制站并進(jìn)行迭代訓(xùn)練,具體步驟為:
8.如權(quán)利要求7所述的自適應(yīng)路徑規(guī)劃的無人機(jī)電池動態(tài)管理強(qiáng)化學(xué)習(xí)方法,其特征在于:所述地面控制站接收數(shù)據(jù)后進(jìn)行預(yù)處理,具體步驟為:
9.一種計(jì)算機(jī)設(shè)備,包括存儲器和處理器,所述存儲器存儲有計(jì)算機(jī)程序,其特征在于:所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)權(quán)利要求1~8任一所述的自適應(yīng)路徑規(guī)劃的無人機(jī)電池動態(tài)管理強(qiáng)化學(xué)習(xí)方法的步驟。
10.一種計(jì)算機(jī)可讀存儲介質(zhì),其上存儲有計(jì)算機(jī)程序,其特征在于:所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1~8任一所述的自適應(yīng)路徑規(guī)劃的無人機(jī)電池動態(tài)管理強(qiáng)化學(xué)習(xí)方法的步驟。