一种面向大型智慧工厂的AGV自学习导航避障方法技术

技术编号:37643679 阅读:36 留言:0更新日期:2023-05-25 10:10
本发明专利技术公开了一种面向大型智慧工厂的AGV自学习导航避障方法。首先移动机器人分别与环境交互并更新各自的局部网络参数,更新后将本地网络参数以及移动机器人表现传到中央服务器,中央服务器对比移动机器人本轮全局网络更新和上轮全局网络更新的表现,给局部网络赋予不同权重从而更新全局网络。然后将更新后的全局网络参数与各个移动机器人的局部网络进行软更新,得到更新后的局部网络。最后各个移动机器人再次与环境交互并更新各自局部网络,重复上述步骤直到所有移动机器人避障成功率达到指定阈值。通过上述过程能够加速移动机器人训练,增加移动机器人避障能力,并且只将参数传递到中央服务器能够保证各个移动机器人之间的数据隐私。间的数据隐私。间的数据隐私。

【技术实现步骤摘要】
一种面向大型智慧工厂的AGV自学习导航避障方法


[0001]本专利技术涉及AGV导航避障
,特别是涉及一种面向大型智慧工厂的AGV自学习导航避障方法。

技术介绍

[0002]AGV被广泛应用于智慧工厂,大型智慧工厂中复杂的工作任务要求AGV能够尽量快速准确地到达目的地,同时也需要移动机器人能够安全有效的躲避环境中的障碍物。在环境地图未知,依靠激光雷达等传感器的感知数据时,深度强化学习解决了移动机器人避障领域的许多问题。但是大量的传感器数据会造成深度强化学习模型收敛慢,并且单个AGV训练效率低下,很难快速训练得到一个泛化性强的神经网络模型。因此,需要一种有效的面向大型智慧工厂的AGV自学习导航避障方法。
[0003]分布式机器学习技术通常用来加速模型训练,但是传统的分布式训练技术需要进行原始数据的传输,既泄露了本地代理的隐私又增加了通信的压力。但是联邦学习(Federated Learning)作为一种新型分布式机器学习技术,可以在各个本地代理不上传数据情况下,联合多个分散的边缘设备协同训练全局模型,能有效提升模型训练效率,降低本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向大型智慧工厂的AGV自学习导航避障方法,其特征在于,包括以下步骤:S1:AGV分别与环境交互并更新各自的局部网络,判断是否进行全局网络更新,若进行全局网络更新则将更新后各个AGV局部网络参数以及AGV表现传到中央服务器,否则继续与环境交互;S2:中央服务器将依据本轮全局更新传入的AGV表现情况与上一轮传入的进行对比,分别计算每一个AGV的成长值,当全局更新轮数为第一轮时,给AGV赋相同成长值;S3:设定一个成长阈值M,然后判断各个AGV成长值是否大于阈值M,如果大于M,此AGV的局部网络参与模型聚合,否则不参与;S4:中央服务器根据每个参与模型聚合AGV的成长值进行归一化,将归一化后的成长值作为模型聚合每个AGV的权重,将各个AGV的局部网络参数进行模型聚合得到全局模型;S5:判断本轮全局网络更新所有AGV的表现是否达标,如果达到预定要求,说明训练完成保存全局模型并结束流程,如果不达标,则继续下一步骤S6;S6:将全局模型传递给各个AGV,与AGV的局部模型进行软更新得到新的局部模型,继续步骤S1。2.根据权利要求1所述的一种面向大型智慧工厂的AGV自学习导航避障方法,其特征在于,所述步骤S1中的AGV有K个,局部网络包括2K个Critic网络,K个Actor网络,2K个目标Critic网络和K个目标Actor网络,网络参数分别为Critic网络参数θ
11,12,...,1K
,Critic网络参数θ
21,22,...,2K
,Actor网络参数φ
1,2,...,K
,目标Critic网络参数θ

11,12,

,1K
,目标Critic网络参数θ

21,22,

,2K
,目标Actor网络参数φ

1,2,

,K
。3.根据权利要求1所述的一种面向大型智慧工厂的AGV自学习导航避障方法,其特征在于,所述步骤S1中AGV与环境交互包括以下步骤:S11:初始化起始点与目标点;S12:AGV从起始点出发,通过激光雷达获得状态信息s;S13:判断当前状态是否发生碰撞和是否到达目...

【专利技术属性】
技术研发人员:魏长赟李亚军田顺钰
申请(专利权)人:河海大学常州校区
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1