【技术实现步骤摘要】
本申请涉及无人机集群领域,尤其涉及一种自适应迭代分辨率的多智能体近端策略优化无人机博弈方法、装置、介质和设备。
技术介绍
1、近年来,固定翼无人机技术发展迅速,已广泛应用于农业、灾害救援、环境监测等多个领域,为社会生产和生活带来了显著的便利与效率的提升。然而,传统人工遥控方式在通信距离、天气条件和电磁干扰等方面的限制,难以适应复杂的实际应用场景。因此,提升无人机的智能化水平,赋予无人机更强的自主决策能力与环境适应能力,不仅能够提高无人机在任务中的效能,还能推动无人机在多领域中的广泛应用。此外,无人机技术的发展还可能推动相关学科如人工智能、通信技术和材料科学的进步,为经济发展和科技进步提供重要支撑,具有重要的研究意义和现实价值。
2、深度强化学习在无人机群体博弈领域具有重要的研究意义和研究价值;作为一种机器学习技术,深度强化学习通过与环境的交互自主学习行动策略,无需依赖样本数据,能够有效应对缺乏先验模型的复杂连续决策问题;在无人机群体作战中,深度强化学习能够为无人机提供自主决策能力,使其在动态复杂的环境中实现高效的群体博弈和任
...【技术保护点】
1.一种自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,包括:
2.如权利要求1所述的自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,所述构建引入分辨率缩小倍数参数的无人机的运动学模型和控制模型,包括:
3.如权利要求1所述的自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,在所述基于环境状态信息训练无人机集群博弈深度强化学习算法得到无人机的动作,并利用无人机的动作更新运动学模型、控制模型和预设的奖励函数之后,所述方法还包括:
4.如权利要求1所述的自适应迭代分辨率的多智能体近端策
...【技术特征摘要】
1.一种自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,包括:
2.如权利要求1所述的自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,所述构建引入分辨率缩小倍数参数的无人机的运动学模型和控制模型,包括:
3.如权利要求1所述的自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,在所述基于环境状态信息训练无人机集群博弈深度强化学习算法得到无人机的动作,并利用无人机的动作更新运动学模型、控制模型和预设的奖励函数之后,所述方法还包括:
4.如权利要求1所述的自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,所述基于环境状态信息训练无人机集群博弈深度强化学习算法得到无人机的动作,包括:
5.如权利要求1所述的自适应迭代分辨率的...
【专利技术属性】
技术研发人员:矫永康,符文星,曹昕莹,苏艳琴,王雅平,付博文,都海波,余兰林,申子祥,李浩瑞,朱文武,
申请(专利权)人:西北工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。