基于强化学习的多车合作式持续监控系统轨迹规划方法技术方案

技术编号：41363681 阅读：34 留言：0更新日期：2024-05-20 10:12

本发明专利技术公开了基于多智能体强化学习的多车系统合作式持续监控的轨迹规划方法，属于机器人智能决策与控制领域。首先构建面向目标区域合作式持续监控的多车轨迹规划问题的马尔科夫决策过程模型；引入栅格地图的发现度函数量化地图的搜索程度，并将其用于设计无人车合作式持续监控的状态空间，并设计动作空间和奖励函数；建立策略网络和评价网络；再基于多智能体强化学习算法，在无人车每前进一步后训练更新策略网络和评价网络，直至二者收敛；最终得到多无人车系统持续监控的策略网络。本发明专利技术基于无人车系统之间多车的分布式交互估计发现度地图，使该系统能够以较低地通信成本充分利用多车信息，解决合作方式下的轨迹规划问题，实现对目标监控区域尽可能多次的全覆盖。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及基于强化学习的多车合作式持续监控系统轨迹规划方法，属于机器人智能决策与控制，具体涉及一种基于多智能体强化学习的多车合作式持续监控的轨迹规划方法。

技术介绍

1、近年来，持续监测(persistent surveillance)引起了高度关注。持续监视是指在一段时间内对某个区域或目标进行连续、不间断的监视。持续监视的目标是持续监视特定位置、个人或事件，以增强态势感知、收集情报并支持不同领域的各种应用，这使得它在军事和民用领域都有广泛的应用。例如，持续监控可以在环境监测中跟踪环境变化，例如森林砍伐、野生动物移动和自然灾害，并且可以应用于犯罪预防、调查和监控公共空间，以确保公共安全。持续监视也可用于目标搜索问题，特别是对于动态目标。动态目标的状态(包括位置和速度)是随机的，搜索者无法获得，传统的解决方案是覆盖整个任务区域，而不是尝试直接寻找目标。考虑到目标有可能重新返回搜索过的区域，持续监视显然是更好的选择，可以对目标区域持续不断地进行监视。

2、无人车(ugv)可以自主运行，不需要由人操控，可以用于许多环境危险、复...

【技术保护点】

1.基于强化学习的多车合作式持续监控系统轨迹规划方法，其特征在于包括以下步骤：

2.根据权利要求1所述的基于强化学习的多车合作式持续监控系统轨迹规划方法，其特征在于：

3.根据权利要求2所述的基于强化学习的多车合作式持续监控系统轨迹规划方法，其特征在于：

4.根据权利要求3所述的基于强化学习的多车合作式持续监控系统轨迹规划方法，其特征在于：

5.根据权利要求4所述的基于强化学习的多车合作式持续监控系统轨迹规划方法，其特征在于：

6.根据权利要求5所述的基于强化学习的多车合作式持续监控系统轨迹规划方法，其特征在于：

7...

【技术特征摘要】

1.基于强化学习的多车合作式持续监控系统轨迹规划方法，其特征在于包括以下步骤：

2.根据权利要求1所述的基于强化学习的多车合作式持续监控系统轨迹规划方法，其特征在于：

3.根据权利要求2所述的基于强化学习的多车合作式持续监控系统轨迹规划方法，其特征在于：

4.根据权利要求3所述的基于强化学习的多车合作式持续监控系统轨迹规划方法，其特征在于：

5.根据权利要求4所述的基于强化学习的多车合作式持续监控系统轨迹规划方法，其特征在于：

...

【专利技术属性】
技术研发人员：孙健，李广正，李卓，王钢，王佳林，陈杰，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人