自适应迭代分辨率的多智能体近端策略优化无人机博弈方法技术

技术编号:46435052 阅读:6 留言:0更新日期:2025-09-19 20:39
本申请公开了一种自适应迭代分辨率的多智能体近端策略优化无人机博弈方法、装置、介质和设备,通过在无人机博弈环境中,构建引入分辨率缩小倍数参数的无人机的运动学模型和控制模型;基于无人机集群博弈深度强化学习算法与运动学模型和控制模型交互得到环境状态信息,得到各奖励函数差值;判断各奖励函数差值的绝对值均小于预设阈值,利用预设的分辨率参数更新算法更新分辨率缩小倍数参数,以更新运动学模型和控制模型;将自适应迭代分辨率的无人机集群博弈深度强化学习算法部署于各参与博弈的无人机智能体中,并利用智能体指导无人机在博弈环境中做出最优决策,本申请该方法通过动态调整策略更新的分辨率,显著提升了训练效率和收敛速度。

【技术实现步骤摘要】

本申请涉及无人机集群领域,尤其涉及一种自适应迭代分辨率的多智能体近端策略优化无人机博弈方法、装置、介质和设备。


技术介绍

1、近年来,固定翼无人机技术发展迅速,已广泛应用于农业、灾害救援、环境监测等多个领域,为社会生产和生活带来了显著的便利与效率的提升。然而,传统人工遥控方式在通信距离、天气条件和电磁干扰等方面的限制,难以适应复杂的实际应用场景。因此,提升无人机的智能化水平,赋予无人机更强的自主决策能力与环境适应能力,不仅能够提高无人机在任务中的效能,还能推动无人机在多领域中的广泛应用。此外,无人机技术的发展还可能推动相关学科如人工智能、通信技术和材料科学的进步,为经济发展和科技进步提供重要支撑,具有重要的研究意义和现实价值。

2、深度强化学习在无人机群体博弈领域具有重要的研究意义和研究价值;作为一种机器学习技术,深度强化学习通过与环境的交互自主学习行动策略,无需依赖样本数据,能够有效应对缺乏先验模型的复杂连续决策问题;在无人机群体作战中,深度强化学习能够为无人机提供自主决策能力,使其在动态复杂的环境中实现高效的群体博弈和任务执行。近端策略优化本文档来自技高网...

【技术保护点】

1.一种自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,包括:

2.如权利要求1所述的自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,所述构建引入分辨率缩小倍数参数的无人机的运动学模型和控制模型,包括:

3.如权利要求1所述的自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,在所述基于环境状态信息训练无人机集群博弈深度强化学习算法得到无人机的动作,并利用无人机的动作更新运动学模型、控制模型和预设的奖励函数之后,所述方法还包括:

4.如权利要求1所述的自适应迭代分辨率的多智能体近端策略优化无人机博弈方法...

【技术特征摘要】

1.一种自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,包括:

2.如权利要求1所述的自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,所述构建引入分辨率缩小倍数参数的无人机的运动学模型和控制模型,包括:

3.如权利要求1所述的自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,在所述基于环境状态信息训练无人机集群博弈深度强化学习算法得到无人机的动作,并利用无人机的动作更新运动学模型、控制模型和预设的奖励函数之后,所述方法还包括:

4.如权利要求1所述的自适应迭代分辨率的多智能体近端策略优化无人机博弈方法,其特征在于,所述基于环境状态信息训练无人机集群博弈深度强化学习算法得到无人机的动作,包括:

5.如权利要求1所述的自适应迭代分辨率的...

【专利技术属性】
技术研发人员:矫永康符文星曹昕莹苏艳琴王雅平付博文都海波余兰林申子祥李浩瑞朱文武
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1