【技术实现步骤摘要】
本专利技术涉及无线通信,具体涉及一种基于协同强化学习的多无人机轨迹规划和数据收集方法。
技术介绍
1、在战场作战、灾害救援、山区通信等复杂环境下的任务执行过程中,无人机集群往往会面临通信时断时续、信息获取不完全、任务需求变化等问题。因此,需要无人机集群在时断时续的信息共享彼此的地图探索信息与经验,以保障其在复杂地形隔断机间协同共享时能顺利完成任务;需要优化无人机集群的共享信息,以便在有限资源下应对高动态环境的信息获取不完全的问题,实现高鲁棒的无人机协同强化学习系统构建,以应对复杂环境时断时续的问题,实现无人机系统的高效轨迹规划与数据收集。
2、相关研究表明,强化学习是一种很有前景的解决方案,它可以有效地无人机导航和任务规划。在强化学习中,智能体从其外部环境中学习,并在每次连续迭代中根据分配的策略获得奖励或惩罚,目标是通过最大化奖励来达到最终状态。然而,单个无人机在执行复杂任务时存在的资源限制和能力欠缺问题,催生了多无人机协同作业的新研究方向。而良好的多无人机协同任务规划,能够显著地提升多无人机之间的资源利用效率,提升多无人机
...【技术保护点】
1.一种基于协同强化学习的多无人机轨迹规划和数据收集方法,其特征在于,所述多无人机轨迹规划和数据收集方法包括以下步骤:
2.根据权利要求1所述的基于协同强化学习的多无人机轨迹规划和数据收集方法,其特征在于,步骤S1中,所述地图状态信息共享子模型在多无人机在信息交互未被中断时,将区域探索情况作为一部分共享信息在无人机间信息交互时共享,通过协作学习覆盖未知的感兴趣领域的过程包括以下步骤:
3.根据权利要求1所述的基于协同强化学习的多无人机轨迹规划和数据收集方法,其特征在于,步骤S1中,所述无人机自身的历史经验对其他无人机在t时价值的度量为:
...【技术特征摘要】
1.一种基于协同强化学习的多无人机轨迹规划和数据收集方法,其特征在于,所述多无人机轨迹规划和数据收集方法包括以下步骤:
2.根据权利要求1所述的基于协同强化学习的多无人机轨迹规划和数据收集方法,其特征在于,步骤s1中,所述地图状态信息共享子模型在多无人机在信息交互未被中断时,将区域探索情况作为一部分共享信息在无人机间信息交互时共享,通过协作学习覆盖未知的感兴趣领域的过程包括以下步骤:
3.根据权利要求1所述的基于协同强化学习的多无人机轨迹规划和数据收集方法,其...
【专利技术属性】
技术研发人员:李思润,江华,徐振家,母骁楠,黄颖新,戚楠,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。