【技术实现步骤摘要】
一种面向大型智慧工厂的AGV自学习导航避障方法
:
[0001]本专利技术涉及AGV导航避障
,特别是涉及一种面向大型智慧工厂的AGV自学习导航避障方法。
技术介绍
:
[0002]AGV被广泛应用于智慧工厂,大型智慧工厂中复杂的工作任务要求AGV能够尽量快速准确地到达目的地,同时也需要移动机器人能够安全有效的躲避环境中的障碍物。在环境地图未知,依靠激光雷达等传感器的感知数据时,深度强化学习解决了移动机器人避障领域的许多问题。但是大量的传感器数据会造成深度强化学习模型收敛慢,并且单个AGV训练效率低下,很难快速训练得到一个泛化性强的神经网络模型。因此,需要一种有效的面向大型智慧工厂的AGV自学习导航避障方法。
[0003]分布式机器学习技术通常用来加速模型训练,但是传统的分布式训练技术需要进行原始数据的传输,既泄露了本地代理的隐私又增加了通信的压力。但是联邦学习(Federated Learning)作为一种新型分布式机器学习技术,可以在各个本地代理不上传数据情况下,联合多个分散的边缘设备协同训练全局模型,能有效提 ...
【技术保护点】
【技术特征摘要】
1.一种面向大型智慧工厂的AGV自学习导航避障方法,其特征在于,包括以下步骤:S1:AGV分别与环境交互并更新各自的局部网络,判断是否进行全局网络更新,若进行全局网络更新则将更新后各个AGV局部网络参数以及AGV表现传到中央服务器,否则继续与环境交互;S2:中央服务器将依据本轮全局更新传入的AGV表现情况与上一轮传入的进行对比,分别计算每一个AGV的成长值,当全局更新轮数为第一轮时,给AGV赋相同成长值;S3:设定一个成长阈值M,然后判断各个AGV成长值是否大于阈值M,如果大于M,此AGV的局部网络参与模型聚合,否则不参与;S4:中央服务器根据每个参与模型聚合AGV的成长值进行归一化,将归一化后的成长值作为模型聚合每个AGV的权重,将各个AGV的局部网络参数进行模型聚合得到全局模型;S5:判断本轮全局网络更新所有AGV的表现是否达标,如果达到预定要求,说明训练完成保存全局模型并结束流程,如果不达标,则继续下一步骤S6;S6:将全局模型传递给各个AGV,与AGV的局部模型进行软更新得到新的局部模型,继续步骤S1。2.根据权利要求1所述的一种面向大型智慧工厂的AGV自学习导航避障方法,其特征在于,所述步骤S1中的AGV有K个,局部网络包括2K个Critic网络,K个Actor网络,2K个目标Critic网络和K个目标Actor网络,网络参数分别为Critic网络参数θ
11,12,...,1K
,Critic网络参数θ
21,22,...,2K
,Actor网络参数φ
1,2,...,K
,目标Critic网络参数θ
′
11,12,
…
,1K
,目标Critic网络参数θ
′
21,22,
…
,2K
,目标Actor网络参数φ
′
1,2,
…
,K
。3.根据权利要求1所述的一种面向大型智慧工厂的AGV自学习导航避障方法,其特征在于,所述步骤S1中AGV与环境交互包括以下步骤:S11:初始化起始点与目标点;S12:AGV从起始点出发,通过激光雷达获得状态信息s;S13:判断当前状态是否发生碰撞和是否到达目...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。