1.一種移動機器人避障控制方法,基于深度強化學(xué)習(xí)和pid控制用于移動機器人軌跡跟蹤和避障,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的移動機器人避障控制方法,其特征在于,所述構(gòu)建強化學(xué)習(xí)訓(xùn)練,獲取所述強化學(xué)習(xí)模型中的最優(yōu)動作,包括:
3.根據(jù)權(quán)利要求2所述的移動機器人避障控制方法,其特征在于,所述構(gòu)建深度q網(wǎng)絡(luò),依次包括:
4.根據(jù)權(quán)利要求3所述的移動機器人避障控制方法,其特征在于,所述構(gòu)建深度q網(wǎng)絡(luò),還包括:
5.根據(jù)權(quán)利要求2所述的移動機器人避障控制方法,其特征在于,所述通過所述深度q網(wǎng)絡(luò)獲取q值最大的動作,并將所述最大的動作作為所述最優(yōu)動作,包括:
6.根據(jù)權(quán)利要求2所述的移動機器人避障控制方法,其特征在于,所述根據(jù)所述q值更新所述深度q網(wǎng)絡(luò)的權(quán)重,包括:
7.根據(jù)權(quán)利要求1所述的移動機器人避障控制方法,其特征在于,所述通過最佳動作與當(dāng)前動作的差異來獲得獎勵,鼓勵移動機器人采取更加接近最佳動作,以控制所述機器人模型進行避障和導(dǎo)航,包括:
8.根據(jù)權(quán)利要求7所述的移動機器人避障控制方法,其特征在于,所述設(shè)置獎勵函數(shù),且獎勵是由當(dāng)前動作以及最佳動作決定,包括:
9.根據(jù)權(quán)利要求7所述的移動機器人避障控制方法,其特征在于,所述添加pid控制器以控制移動機器人的線速度和角速度,包括:
10.一種多移動機器人的控制方法,其特征在于: