一种基于联邦学习的机器人协同控制算法制造技术

技术编号:32486383 阅读:39 留言:0更新日期:2022-03-02 09:51
本发明专利技术公开了一种基于联邦学习的机器人协同控制算法,包括如下步骤:S1、机器人数据的预处理;S2、建立基于图神经网络建立本地模型,将S1得到的预处理之后的数据传输到图卷积层,后经过图池化层处理冗余特征,最后至全连接层输出本地模型;S3、建立基于自适应权重的异步传输联邦学习算法。该种基于联邦学习的机器人协同控制算法,在保护机器人厂家的隐私基础上,能够根据主从式机器人协同控制的主从关系来确定权重,同时可根据一个主从式机器人的联邦学习模型,可以推广到一个主机器人到多个从机器人,并可有效解决了现有技术中不同类型的机器人构成的主从式机器人协同控制模型中,存在的系统不匹配、参数不共享、通信延迟等问题。通信延迟等问题。通信延迟等问题。

【技术实现步骤摘要】
一种基于联邦学习的机器人协同控制算法


[0001]本专利技术涉及机器人协同控制
,尤其是在数据保护前提下,数据异构或者多机器人协同控制方法,具体为一种基于联邦学习的机器人协同控制算法。

技术介绍

[0002]随着机器人技术的发展,各类型的机器人被广泛运用于各行各业中,其智能化程度是评估一个国家科技水平的重要因素。如今移动机器人的应用领域与市场规模不断壮大,国家高度重视机器人产业的研究与发展,在面向2035年的机器人产业规划中,把该技术列为工业自动化领域的重要发展方向,这将对我国机器人产业发展形成强大推力。目前主流的自动化生产车间依旧是单机器人进行自动化生产,或者是多台同类型机器人协同运作,这样的生产效率比单机器人生产效率略有提升,但是执行效率比不上异构多台机器人。不同类型多种机器人具备单一类型机器人更好的任务执行能力,不同类型的机器人可以完成更多的自由度和更加复杂的任务。
[0003]目前现有的多机器人能够执行比单机器人更多的自由度,具有的更强的负载能力和可执行能力。但是在实际工作过程中,生产所需的多机器人都是不同品牌,对于不同公司的机器人之间的参数不会共享,则异构机器人协同控制就会有偏差。就目前的机器人之间协同工作只是采用简单的定位以及示教来完成,不能够根据任务来动态调整机器人与机器人之间的相对位置。随着互联网技术的发展,各个企业也越来越重视自己的数据安全。因此,2016年联邦学习横空出世,用于在不触及数据的前提下,分析数据。但是,现有的联邦学习算法在机器人数据的保护方面不完备,而这一领域却是十分具有商业价值的。因此将现有的多机器人协同操作存在的不足之处总结如下:
[0004]问题1:传统的多机器人协同控制利用的是同品牌同类型机器人控制,在自由度上和任务执行能力上不能够完成一些自动化流水车间的生产,同类型机器人例如搬运机器人在使用过久后,也会出现硬件磨损,引起定位误差,从而影响其运动参数;
[0005]问题2:对于不同品牌类型的机器人,或者异构或者多机器人协同控制时,不同机器人厂家的参数不共享,系统不兼容,协同控制是会存有一定的延时,对于自动化流水线的效率有很大的负面影响。不同厂家的机器人参数和结构数据,属于商业的机密,机器人生产厂家对于客户也不提供数据信息,因此机器人参数之间的共享信息需要能在保护各自利益的基础上解决。
[0006]对上述两个问题,本专利技术专利提出了一种基于联邦学习的机器人协同控制算法。
[0007]对于问题1,本专利技术提出采用多种机器人主从式协同控制,多机器人协调运动需要具有协调关系的各主从机器人在运动过程中保持机器人末端位姿之间的相对位姿关系不变。由于从动机器人跟随主动机器人运动,因此从动机器人不需要单独的轨迹示教指令,整个系统的示教和规划可以在主动机器人的基坐标系下完成。在多机器人系统中,任意时刻有且仅有一台机器人作为主动机器人,但可以存在多台从动机器人。
[0008]对于问题2,在解决问题1的基础上加入联邦学习,以各个机器人制造商为单位建
立本地模型,将本地模型参数上传至服务器端,采用联邦权重聚合算法,根据各个机器人制造商在协同控制时参与的任务量来确定权重。对于时间延迟问题,本专利采用异步传输,在联邦学习聚合分发过程中采取并发式网络进行传输,在一定程度上解决延迟带来的问题。为解决上述两个问题,最终本专利技术专利提出了一种基于联邦学习的机器人协同控制算法。

技术实现思路

[0009]本专利技术专利基于联邦学习算法、自适应主动加权和机器人主从式协同控制模型,提出了一种基于联邦学习的机器人协同控制算法,用于解决不同类型的机器人构成的主从式机器人协同控制模型中系统不匹配、参数不共享、通信延迟等问题。本专利技术提供了如下的技术方案:
[0010]本专利技术一种基于联邦学习的机器人协同控制算法,包括包括如下步骤:
[0011]S1、机器人数据的预处理,具体流程如下:
[0012]S1

1、建立机器人坐标系,对主从式机器人建立基座坐标系O
B
和世界坐标系O
W
,并设定多机器人中任意两台机器人的基座坐标系O
B
与世界坐标系O
W
的相对抓取物体的位姿是固定的,不随着时间变化,根据机器人当前时刻的关节角进行计算主从机器人末端坐标系的相对位姿矩阵并同步计算t时刻从动机器人R
s
在其基座坐标系O
Bs
下的目标轨迹矩阵
[0013]S1

2、机器人参数处理,获取机器人运动的行为特征的历史行为数据;
[0014]S1

3、参数归一化,在收集数据之后,将其分为训练集、测试集和验证集三个部分,并将D1数据作为训练序列,D2作为测试序列和D3作为验证集,对待进行非结构化数据进行最大

最小归一化,公式为其中x
*
为归一化之后的参数,x为待处理参数,x
min
为所有参数中的最小值,x
max
为所有参数中最大值,将所有参数预处理完成;
[0015]S2、建立基于图神经网络建立本地模型,将S1得到的预处理之后的数据传输到图卷积层,后经过图池化层处理冗余特征,最后至全连接层输出本地模型;
[0016]S3、建立基于自适应权重的异步传输联邦学习算法,具体流程如下:
[0017]S3

1、联邦学习异步传输,对于每个主从式机器人系统客户端采用异步传输更新,在本地训练固定轮次后,将各自神经网络参数发送给参数服务器,并等待最新的神经网络参数,当接受到参数后采用滑动平均的方式聚合成新的权重,定义公式为:参数,当接受到参数后采用滑动平均的方式聚合成新的权重,定义公式为:其中W
k+τ
为参数服务器在聚合时的保留权重,W
ki
为主从式机器人系统客户端工作节点k上传输到服务器的权重,k
i
为第k个主从式机器人系统客户端工作节点权重的更新值;
[0018]S3

2、自适应随机加权,对于多客户端的聚合问题,采用学习样本上不同类型信息对客户端节点簇结构有差异的K

means型算法,将多客户端两种类型的信息映射到同一维度空间上,再通过对其融合,得到具有统一的簇中心;
[0019]S3

3、聚合模型的评价指标,以均方误差损失函数的评价标准,在自适应加权的基础上,将联合训练的模型分发到各个主从式机器人系统参与的客户端,根据偏差来评估联合训练的模型好坏;
[0020]S3

4、联邦模型建立完成,上述步骤完成后,达到设定的评价标准,将基于自适应加权的图卷积联邦学习网络的联合训练模型聚合到服务器端聚合,聚合完成后再返回给各个本地客户端。
[0021]作为本专利技术的一种优选技术方案,所述S1

1中1中其中和分别为主动机器人R
m
和从本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的机器人协同控制算法,其特征在于,包括如下步骤:S1、机器人数据的预处理,具体流程如下:S1

1、建立机器人坐标系,对主从式机器人建立基座坐标系O
B
和世界坐标系O
W
,并设定多机器人中任意两台机器人的基座坐标系O
B
与世界坐标系O
W
的相对抓取物体的位姿是固定的,不随着时间变化,根据机器人当前时刻的关节角进行计算主从机器人末端坐标系的相对位姿矩阵并同步计算t时刻从动机器人R
s
在其基座坐标系O
Bs
下的目标轨迹矩阵S1

2、机器人参数处理,获取机器人运动的行为特征的历史行为数据;S1

3、参数归一化,在收集数据之后,将其分为训练集、测试集和验证集三个部分,并将D1数据作为训练序列,D2作为测试序列和D3作为验证集,对待进行非结构化数据进行最大

最小归一化,公式为其中x
*
为归一化之后的参数,x为待处理参数,x
min
为所有参数中的最小值,x
max
为所有参数中最大值,将所有参数预处理完成;S2、建立基于图神经网络建立本地模型,将S1得到的预处理之后的数据传输到图卷积层,后经过图池化层处理冗余特征,最后至全连接层输出本地模型;S3、建立基于自适应权重的异步传输联邦学习算法,具体流程如下:S3

1、联邦学习异步传输,对于每个主从式机器人系统客户端采用异步传输更新,在本地训练固定轮次后,将各自神经网络参数发送给参数服务器,并等待最新的神经网络参数,当接受到参数后采用滑动平均的方式聚合成新的权重,定义公式为:参数后采用滑动平均的方式聚合成新的权重,定义公式为:其中W
k+τ
为参数服务器在聚合时的保留权重,W
ki
为主从式机器人系统客户端工作节点k上传输到服务器的权重,k
i
为第k个主从式机器人系统客户端工作节点权重的更新值;S3

2、自适应随机加权,对于多客户端的聚合问题,采用学习样本上不同类型信息对客户端节点簇结构有差异的K

means型算法,将多客户端两种类型的信息映射到同一维度空间上,再通过对其融合,得到具有统一的簇中心;S3

3、聚合模型的评价指标,以均方误差损失函数的评价标准,在自适应加权的基础上,将联合训练的模型分发到各个主从式机器人系统参与的客户端,根据偏差来评估联合训练的模型好坏;S3

4、联邦模型建立完成,上述步骤完成后,达到设定的评价标准,将基于自适应加权的图卷积联邦学习网络的联合训练模型聚合到服务器端聚合,聚合完成后再返回给各个本地客户端。2.根据权利要求1所述的一种基于联邦学习的机器人协同控制算法,其特征在于,所述S1

1中其中和分别为主动机器人R
m
和从动机器人R
s
的正运动学转换矩阵,为主从机器人基座坐标系的相对位姿矩阵;其中为主动机器人R
m
在其基座坐标系O
Bm
下的
目标...

【专利技术属性】
技术研发人员:陈楠杨平化吕游徐俊杰吕云峰
申请(专利权)人:南京富尔登科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1