当前位置: 首页 > 专利查询>中移系统集成有限公司中国移动通信集团有限公司专利>正文

AGV控制方法、装置、电子设备及存储介质制造方法及图纸

技术编号：39182936 阅读：7 留言：0更新日期：2023-10-27 08:30

本申请涉及自动化控制技术领域，提供一种AGV控制方法、装置、电子设备及存储介质。所述方法包括：若接收到自动导引车AGV控制任务，则获取环境图像信息；基于预设深度学习平台结合所述环境图像信息与所述AGV控制任务的任务信息进行控制策略训练，得到包括最优路径的控制策略，以基于所述控制策略执行所述AGV控制任务；其中，所述预设深度学习平台包括改进奖励函数后的逆强化学习算法与增加基线后的确定性策略梯度算法。本申请通过快速确定最优路径及控制策略，可以提高AGV控制效率。可以提高AGV控制效率。可以提高AGV控制效率。

全部详细技术资料下载

【技术实现步骤摘要】
AGV控制方法、装置、电子设备及存储介质

[0001]本申请涉及自动化控制
，具体涉及一种AGV控制方法、装置、电子设备及存储介质。

技术介绍

[0002]目前，移动机器人AGV(Automated Guided Vehicle)装备有电磁或光学等自动导航装置，能够沿规定的导航路径行驶，是一种具有安全保护以及各种移载功能的运输车。传统园区AGV通过Wifi技术实现AGV与控制系统、AGV之间、AGV与周边设施的互联互通，导航系统采用核心控制器适配主流的激光雷达的方式，为AGV提供核心的地图构建、定位导航、模型编辑等功能。当前技术主要利用专家经验的奖励函数和通过传感器获取的环境，使车辆在贴合目标驾驶状态时给予的极大奖励值，引导无人车在目标状态基础之上进行车道保持，实现AGV控制。但是，人为设计的奖励函数往往具有较高的主观性和经验性，无人智能体在复杂环境中无法具有更高的自适应性，在这种情况下，强化学习算法将会很难收敛；同时，仅通过获取车道边界距离、自车状态、周围动态车辆的检测距离等易获取的关键信息，不能满足当前工业园区、制造车间等复杂道路和环境的需求，没有充分挖掘利用AGV所处环境所潜在的其他环境信息。因此，使得当前AGV在进行路径选择时效率低，导致AGV控制效率低。

技术实现思路

[0003]本申请实施例提供一种AGV控制方法、装置、电子设备及存储介质，用以解决当前AGV在进行路径选择时效率低导致AGV控制效率低的技术问题。
[0004]第一方面，本申请实施例提供一种AGV控制方法，包括：...

【技术保护点】

【技术特征摘要】
1.一种AGV控制方法，其特征在于，包括：若接收到自动导引车AGV控制任务，则获取环境图像信息；基于预设深度学习平台结合所述环境图像信息与所述AGV控制任务的任务信息进行控制策略训练，得到包括最优路径的控制策略，以基于所述控制策略执行所述AGV控制任务；其中，所述预设深度学习平台包括改进奖励函数后的逆强化学习算法与增加基线后的确定性策略梯度算法。2.根据权利要求1所述的AGV控制方法，其特征在于，所述改进奖励函数后的逆强化学习算法为将原逆强化学习算法中奖励函数的样本权值调整为回报更新特征后的逆强化学习算法。3.根据权利要求1所述的AGV控制方法，其特征在于，所述增加基线后的确定性策略梯度算法包括从原确定性策略梯度算法的经验池中选择样本并形成的基线。4.根据权利要求1所述的AGV控制方法，其特征在于，所述基于预设深度学习平台结合所述环境图像信息与所述AGV控制任务的任务信息进行控制策略训练，得到包括最优路径的控制策略的步骤之前，还包括：对所述环境图像信息进行压缩与修整处理，得到处理后的环境图像信息。5.根据权利要求1所述的AGV控制方法，其特征在于，所述若接收到自动导引车AGV控制任务，则获取环境图...

【专利技术属性】
技术研发人员：曲若鹏，
申请(专利权)人：中移系统集成有限公司中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人