一种AGV导航控制方法及系统技术方案

技术编号:23602216 阅读:109 留言:0更新日期:2020-03-28 04:01
本发明专利技术涉及一种AGV车导航控制方法及系统,用于实现:为目标AGV车设定起始位置、目标位置及导航任务;目标AGV车根据起始位置和目标位置通过深度强化学习方法计算并进行评估,得到价值策略网络;根据价值策略网络确认AGV车从起始位置抵达目标位置的最大化预期收益。本发明专利技术通过提高AGV车的查找最优路径的效率,提高AGV车的导航效率。

An AGV navigation control method and system

【技术实现步骤摘要】
一种AGV导航控制方法及系统
本专利技术涉及计算机智能导航领域,特别涉及一种AGV导航控制方法及系统。
技术介绍
前AGV自动引导小车已经成为智能制造、先进物流以及数字化工厂中的重要设备,作为方便工厂运输、提高生产效率具有非常重要的作用。而所谓自动引导,即是沿着指定轨迹运行,目前常见的巡线导航有光电传感器、视觉、激光和磁导航传感器等等,对于光电传感器,配合黑白胶带整体便宜、简单,但是信号很容易因为地面不平导致不稳、胶带易受灰尘、垃圾影响等,导致巡线不能很稳定;视觉可视范围大,对线的要求不高,但是很容易受光线影响,且视频采集处理卡价格不菲,采样频率不高;而目前国内外市面上最常见的AGV产品大多采用磁条导航。而磁条导航AGV虽然相对价格便宜,且运行也较为可靠,但是每次运行AGV需要铺设磁条,特别路径较长时,铺设工作量较大,路径过长时,磁条的成本会比较高,同时更换路线后,由于磁条底部粘性变弱,不能重复使用,磁条后期在水、碾压、磨损等条件下,维护较麻烦,而随着工业4.0和智能制造需求,因此市场上对一种使用更灵活、方便的AGV导航方法的研发是迫在眉睫。<本文档来自技高网...

【技术保护点】
1.一种AGV车导航控制方法,其特征在于,该方法包括:/nS10,为目标AGV车设定起始位置、目标位置及导航任务;/nS20,目标AGV车根据起始位置和目标位置通过深度强化学习方法计算并进行评估,得到价值策略网络;/nS30,根据价值策略网络确认AGV车从起始位置抵达目标位置的最大化预期收益。/n

【技术特征摘要】
1.一种AGV车导航控制方法,其特征在于,该方法包括:
S10,为目标AGV车设定起始位置、目标位置及导航任务;
S20,目标AGV车根据起始位置和目标位置通过深度强化学习方法计算并进行评估,得到价值策略网络;
S30,根据价值策略网络确认AGV车从起始位置抵达目标位置的最大化预期收益。


2.根据权利要求1所述的AGV车导航控制方法,其特征在于,所述步骤S10具体包括:
S11,为目标AGV车设定固定运动场所,其中场所还包括有其他多个AGV车;
S12,根据所述目标AGV车的目标位置及首选速度矢量,确定导航的联合状态。


3.根据权利要求2所述的AGV车导航控制方法,其特征在于,所述步骤S20通过群机交互模型进行深度强化学习方法并得到价值策略网络,所述群机交互模型包括交互模块、池化模块及规划模块,其中,
所述交互模块用于模拟群机交互规则,并通过局部地图对群机交互进行编码,所述群机交互为多个AGV车的交互;
所述池化模块用于通过自注意机制将交互聚合到固定长度的嵌入向量;
所述规划模块用于评目标AGV车与其他AGV车的联合状态的值以进行导航。


4.根据权利要求3所述的AGV车导航控制方法,其特征在于,所述交互模块具体包括:
构建局部地图,所述局部地图包括以每个AGV车i为中心的地图张量Mi来编码邻居AGV车的存在和速度矢量,其中,

其中w′j=(vxj,vyj,1)为其他AGV车j的局部状态向量,δmn[xj-xi,yj-yi]为指标函数,Ni是第i个AGV车ith周围的邻近AGV车的集合;
使用多层感知器将其他AGV车i的状态、地图张量Mi以及机器人的状态嵌入到固定长度矢量ei中,具体为ei=φe(s,wi,Mi,We),其中φe(·)是具有ReLU激活的嵌入函数,We是嵌入权重,嵌入向量ei被馈送到随后的多层感知器以获得目标机AG...

【专利技术属性】
技术研发人员:李卓炜傅晓阳陈悦
申请(专利权)人:吉林大学珠海学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1