一种基于协同强化学习的多无人机轨迹规划和数据收集方法技术

技术编号:43156792 阅读:37 留言:0更新日期:2024-11-01 19:52
本发明专利技术公开了一种基于协同强化学习的多无人机轨迹规划和数据收集方法,包括:建立无人机与基站间通信的信道模型和数据收集模型,提出多无人机时断时续信息共享模型,多无人机时断时续信息共享模型包括地图状态信息共享子模型和历史经验信息共享子模型;基于多智能体双深度Q网络算法,无人机在有限资源下对动态环境的信息获取不全时,将自身的观测值输入到神经网络拟合的策略函数中并根据其他无人机的协同信息交互,输出动作并获得相应的奖励,完成与环境和其他无人机的交互。本发明专利技术能够保障无人机在复杂地形或者恶意干扰隔断机间协同共享时,也能顺利完成轨迹规划和数据收集。

【技术实现步骤摘要】

本专利技术涉及无线通信,具体涉及一种基于协同强化学习的多无人机轨迹规划和数据收集方法


技术介绍

1、在战场作战、灾害救援、山区通信等复杂环境下的任务执行过程中,无人机集群往往会面临通信时断时续、信息获取不完全、任务需求变化等问题。因此,需要无人机集群在时断时续的信息共享彼此的地图探索信息与经验,以保障其在复杂地形隔断机间协同共享时能顺利完成任务;需要优化无人机集群的共享信息,以便在有限资源下应对高动态环境的信息获取不完全的问题,实现高鲁棒的无人机协同强化学习系统构建,以应对复杂环境时断时续的问题,实现无人机系统的高效轨迹规划与数据收集。

2、相关研究表明,强化学习是一种很有前景的解决方案,它可以有效地无人机导航和任务规划。在强化学习中,智能体从其外部环境中学习,并在每次连续迭代中根据分配的策略获得奖励或惩罚,目标是通过最大化奖励来达到最终状态。然而,单个无人机在执行复杂任务时存在的资源限制和能力欠缺问题,催生了多无人机协同作业的新研究方向。而良好的多无人机协同任务规划,能够显著地提升多无人机之间的资源利用效率,提升多无人机的生存概率,对多无人本文档来自技高网...

【技术保护点】

1.一种基于协同强化学习的多无人机轨迹规划和数据收集方法,其特征在于,所述多无人机轨迹规划和数据收集方法包括以下步骤:

2.根据权利要求1所述的基于协同强化学习的多无人机轨迹规划和数据收集方法,其特征在于,步骤S1中,所述地图状态信息共享子模型在多无人机在信息交互未被中断时,将区域探索情况作为一部分共享信息在无人机间信息交互时共享,通过协作学习覆盖未知的感兴趣领域的过程包括以下步骤:

3.根据权利要求1所述的基于协同强化学习的多无人机轨迹规划和数据收集方法,其特征在于,步骤S1中,所述无人机自身的历史经验对其他无人机在t时价值的度量为:

4.根据权利要...

【技术特征摘要】

1.一种基于协同强化学习的多无人机轨迹规划和数据收集方法,其特征在于,所述多无人机轨迹规划和数据收集方法包括以下步骤:

2.根据权利要求1所述的基于协同强化学习的多无人机轨迹规划和数据收集方法,其特征在于,步骤s1中,所述地图状态信息共享子模型在多无人机在信息交互未被中断时,将区域探索情况作为一部分共享信息在无人机间信息交互时共享,通过协作学习覆盖未知的感兴趣领域的过程包括以下步骤:

3.根据权利要求1所述的基于协同强化学习的多无人机轨迹规划和数据收集方法,其...

【专利技术属性】
技术研发人员:李思润江华徐振家母骁楠黄颖新戚楠
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1