一种多AGV调度方法、装置、设备及存储介质制造方法及图纸

技术编号:42103175 阅读:28 留言:0更新日期:2024-07-25 00:28
本申请公开了一种多AGV调度方法、装置、设备及存储介质,涉及物流仓储技术领域。该方法包括:收集实时环境信息并通过深度编解码网络建模为实时环境状态表示;构建基于扩散模型和多智能体强化学习的多AGV动态调度模型并利用实时环境状态表示对多AGV动态调度模型进行训练,以得到目标多AGV动态调度模型;其中,扩散模型使用无分类器指导以及在预设低温范围内进行采样,以及基于去噪扩散概率模型的训练方式生成动作序列;多智能体强化学习采用集中训练和分散执行的训练框架;将目标环境信息动态输入目标多AGV动态调度模型,以动态输出多AGV的动作序列。通过本申请的技术方案,可以实现多AGV动态调度并提升多AGV调度的效率。

【技术实现步骤摘要】

本专利技术涉及物流仓储,特别涉及一种多agv调度方法、装置、设备及存储介质。


技术介绍

1、近年来,人工智能及相关产业正迅速发展壮大,成为学术界、工业界以及世界各国政府关注的焦点,发布的《新一代人工智能发展规划》突出了人工智能研究和产业的国家战略地位。在物流仓储多agv(automated guided vehicle,又称自动导引运输车)调度领域,基于深度强化学习的方法已经取得了重大进展,但是这些方法大多数样本效率低。强化学习通常需要大量的数据才能学习有效的策略,这在现实世界应用中是一个重大障碍;以及传统的强化学习方法是在整体视角上对多agv作静态调度,对于复杂或不确定的环境,建立一个动态准确的模型非常迫切。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种多agv调度方法、装置、设备及存储介质,能够实现多agv动态调度并提升多agv调度的效率。其具体方案如下:

2、第一方面,本申请公开了一种多agv调度方法,包括:

3、收集实时环境信息并通过深度编解码网络建模为实时环境状态本文档来自技高网...

【技术保护点】

1.一种多AGV调度方法,其特征在于,包括:

2.根据权利要求1所述的多AGV调度方法,其特征在于,所述实时环境信息包括地图模块、任务模块和AGV模块;其中,所述地图模块包括入库点、入库缓冲区、高位缓冲区、出库缓冲区、出库点;所述任务模块包括出发点、目标点、任务就绪时间、目前任务执行时间;所述AGV模块包括行驶速度、实时坐标、负载容量、电池电量、故障率。

3.根据权利要求2所述的多AGV调度方法,其特征在于,所述收集实时环境信息并通过深度编解码网络建模为实时环境状态表示对应的计算公式为:

4.根据权利要求1所述的多AGV调度方法,其特征在于,所述构建基...

【技术特征摘要】

1.一种多agv调度方法,其特征在于,包括:

2.根据权利要求1所述的多agv调度方法,其特征在于,所述实时环境信息包括地图模块、任务模块和agv模块;其中,所述地图模块包括入库点、入库缓冲区、高位缓冲区、出库缓冲区、出库点;所述任务模块包括出发点、目标点、任务就绪时间、目前任务执行时间;所述agv模块包括行驶速度、实时坐标、负载容量、电池电量、故障率。

3.根据权利要求2所述的多agv调度方法,其特征在于,所述收集实时环境信息并通过深度编解码网络建模为实时环境状态表示对应的计算公式为:

4.根据权利要求1所述的多agv调度方法,其特征在于,所述构建基于扩散模型和多智能体强化学习的多agv动态调度模型,并利用所述实时环境状态表示对所述多agv动态调度模型进行训练,以得到目标多agv动态调度模型,包括:

5.根据权利要求4所述...

【专利技术属性】
技术研发人员:马仲能吴庆耀钟远光秦卓睿
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1