机器人关节误差补偿方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:36946592 阅读:46 留言:0更新日期:2023-03-22 19:07
本申请涉及一种机器人关节误差补偿方法、装置、计算机设备及存储介质,包括:根据关节规划值和动力学模型对目标关节进行前馈控制,得到第一关节参数;根据传感器反馈值对第一关节参数进行负反馈调节,得到第二关节参数;根据关节规划值、传感器反馈值和连杆状态预测网络,得到预测关节参数;根据传感器反馈值、预测关节参数、关节规划值以及强化学习系统,得到补偿参数;根据补偿参数对第二关节参数进行正反馈调节,实现误差补偿;本发明专利技术的机器人关节误差补偿方法,能消除减速器产生柔性特性对关节产生的误差,针对规划关节参数进行误差补偿,最终实现在高精度、高速度的工作状态下,对于机器人关节的振动抑制。于机器人关节的振动抑制。于机器人关节的振动抑制。

【技术实现步骤摘要】
机器人关节误差补偿方法、装置、计算机设备及存储介质


[0001]本专利技术涉及工业机械领域,具体而言,涉及一种机器人关节误差补偿方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着科技的发展,工业机械臂作为工业机械领域应用最广泛的机器人,机械臂由关节、连杆和减速器构成,并均为刚性连接,由于对机械臂高精度、高速度的运动特征有更高的要求,在机械臂工作,同时与外界接触的情况下,在高精度、高速度运动时,减速器自身会表现出部分柔性特性,即刚度不足,导致振动和误差的产生,导致某些情况下无法满足技术要求。
[0003]在现有技术中,对于误差的补偿和振动的抑制可以分为两类:反馈控制和前馈控制,其中,反馈控制通常需要额外的传感器对系统输出端进行测量,一般将连杆的实际位置误差为输入,以补偿的电机转矩作为为输出;前馈控制则需要精准的动力学模型,同时由于关节与关节之间存在复杂的关系,并且无法确定此关节和与其串联的其他关节之间具体的线性关系,造成误差补偿不精确,进而无法实现振动抑制。

技术实现思路

[0004]本专利技术要解决的技术问题是,在工作时不加装额外传感器的前提下,对机器人关节误差进行预测及补偿,同时由于关节与关节之间存在复杂的关系,并且无法确定此关节和与其串联的其他关节之间具体的线性关系,造成误差补偿不精确,进而无法实现振动抑制。
[0005]为解决上述问题,本专利技术提供一种机器人关节误差补偿方法,所述关节由电机驱动,所述关节通过减速器与连杆相连,所述方法包括:
[0006]根据关节规划值和动力学模型对目标关节进行前馈控制,得到第一关节参数;
[0007]根据传感器反馈值对所述第一关节参数进行负反馈调节,得到第二关节参数;
[0008]根据所述关节规划值、所述传感器反馈值和连杆状态预测网络,得到预测关节参数;
[0009]根据所述传感器反馈值、所述预测关节参数、所述关节规划值以及强化学习系统,得到补偿参数;
[0010]根据所述补偿参数对所述第二关节参数进行正反馈调节,实现误差补偿。
[0011]可选的,在所述根据所述关节规划值、所述传感器反馈值和连杆状态预测网络,得到预测关节参数之前,所述方法还包括:
[0012]构建所述连杆状态预测网络,所述构建所述连杆状态预测网络,包括:
[0013]获取初始连杆状态预测网络;
[0014]获取训练数据集,所述训练数据集包括规划连杆关节参数、电机反馈参数和实际连杆参数;
[0015]将所述训练数据集输入所述初始连杆状态预测网络进行训练,其中,所述初始连杆状态预测网络的输入为所述规划连杆关节参数和所述电机反馈参数,所述初始连杆状态预测网络的输出为预测连杆关节参数;
[0016]将训练后的所述初始连杆状态预测网络作为所述连杆状态预测网络。
[0017]可选的,所述训练数据集还包括:实际连杆参数,所述构建所述连杆状态预测网络,还包括:
[0018]通过所述预测连杆关节参数和所述实际连杆参数,获取损失函数;
[0019]根据所述损失函数判断所述初始连杆状态预测网络是否结束训练。
[0020]可选的,在所述根据所述传感器反馈值、所述预测关节参数、所述关节规划值以及强化学习系统,得到补偿参数之前,所述方法还包括:构建所述强化学习系统,
[0021]所述构建所述强化学习系统,包括:
[0022]获取强化学习神经网络;
[0023]采用强化学习方法,对所述强化学习神经网络进行训练,将所述训练后的强化学习神经网络,作为强化学习系统,
[0024]所述训练强化学习神经网络时,将所述规划连杆关节参数、所述实际连杆参数、所述电机反馈参数作为状态,补偿参数作为动作,将所述强化学习神经网络作为策略,将参考参数作为奖励,通过所述动作及所述状态得到所述奖励来优化所述策略,根据所述奖励判断训练是否结束;
[0025]其中,所述参考参数与所述目标关节的关联关节相关。
[0026]可选的,所述参考参数为:
[0027][0028]其中,j为关节总数,所述关节总数为目标关节的数量与所述目标关节的关联关节的数量的和,x[i]=[p[i],v[i]]T
,x

[i]=[p

[i],v

[i]]T
,p[i]为第i个关节的实际位置,p

[i]为第i个关节的规划位置,v[i]为第i个关节的实际速度,v

[i]为第i个关节的规划速度,为第i个关节的补偿量。
[0029]可选的,所述根据所述奖励判断训练是否结束,包括:
[0030]判断所述奖励是否大于等于预设校正阈值,若大于等于预设校正阈值,则结束训练。
[0031]可选的,所述目标关节包含连杆自由度,所述根据关节规划值和动力学模型对目标关节进行前馈控制,得到第一关节参数,包括:
[0032]根据所述关节规划值和所述动力学模型,对所述目标关节的连杆自由度进行前馈控制,得到第一关节参数。
[0033]本专利技术的机器人关节误差补偿方法,通过训练出连杆状态预测网络和强化学习补偿策略系统,并将其作为误差补偿的重要一环,来消除机械臂在高速运动下,减速器产生柔性特性对关节产生的误差和与所述关节串联的其他关节相互影响所带来的误差,针对规划关节参数进行误差补偿,最终实现在高精度、高速度的工作状态下,对于机器人关节的振动
抑制。
[0034]本专利技术还提供一种机器人关节误差补偿装置,包括:
[0035]前馈控制单元,用于根据关节规划值和动力学模型对目标关节进行前馈控制,得到第一关节参数;
[0036]调节单元,用于根据传感器反馈值对所述第一关节参数进行负反馈调节,得到第二关节参数;
[0037]预测单元,用于根据所述关节规划值、所述传感器反馈值和连杆状态预测网络,得到预测关节参数;
[0038]强化学习单元,用于根据所述传感器反馈值、所述预测关节参数、所述关节规划值以及强化学习系统,得到补偿参数;
[0039]所述调节单元还用于,根据所述补偿参数对所述第二关节参数进行正反馈调节,实现误差补偿。
[0040]本专利技术的机器人关节误差补偿装置,通过训练出连杆状态预测网络和强化学习补偿策略系统,并将其作为误差补偿的重要一环,来消除机械臂在高速运动下,减速器产生柔性特性对关节产生的误差和与所述关节串联的其他关节相互影响所带来的误差,针对规划关节参数进行误差补偿,最终实现在高精度、高速度的工作状态下,对于机器人关节的振动抑制。
[0041]本专利技术还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项机器人关节误差补偿方法。
[0042]本专利技术的计算机设备,通过训练出连杆状态预测网络和强化学习补偿策略系统,并将其作为误差补偿的重要一环,来消除机械本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种机器人关节误差补偿方法,其特征在于,所述关节由电机驱动,所述关节通过减速器与连杆相连,所述方法包括:根据关节规划值和动力学模型对目标关节进行前馈控制,得到第一关节参数;根据传感器反馈值对所述第一关节参数进行负反馈调节,得到第二关节参数;根据所述关节规划值、所述传感器反馈值和连杆状态预测网络,得到预测关节参数;根据所述传感器反馈值、所述预测关节参数、所述关节规划值以及强化学习系统,得到补偿参数;根据所述补偿参数对所述第二关节参数进行正反馈调节,实现误差补偿。2.根据权利要求1所述的方法,其特征在于,在所述根据所述关节规划值、所述传感器反馈值和连杆状态预测网络,得到预测关节参数之前,所述方法还包括:构建所述连杆状态预测网络,所述构建所述连杆状态预测网络,包括:获取初始连杆状态预测网络;获取训练数据集,所述训练数据集包括规划连杆关节参数、电机反馈参数和实际连杆参数;将所述训练数据集输入所述初始连杆状态预测网络进行训练,其中,所述初始连杆状态预测网络的输入为所述规划连杆关节参数和所述电机反馈参数,所述初始连杆状态预测网络的输出为预测连杆关节参数;将训练后的所述初始连杆状态预测网络作为所述连杆状态预测网络。3.根据权利要求2所述的方法,其特征在于,所述训练数据集还包括:实际连杆参数,所述构建所述连杆状态预测网络,还包括:通过所述预测连杆关节参数和所述实际连杆参数,获取损失函数;根据所述损失函数判断所述初始连杆状态预测网络是否结束训练。4.根据权利要求2所述的方法,其特征在于,在所述根据所述传感器反馈值、所述预测关节参数、所述关节规划值以及强化学习系统,得到补偿参数之前,所述方法还包括:构建所述强化学习系统,所述构建所述强化学习系统,包括:获取强化学习神经网络;采用强化学习方法,对所述强化学习神经网络进行训练,将所述训练后的强化学习神经网络,作为强化学习系统,所述训练强化学习神经网络时,将所述规划连杆关节参数、所述实际连杆参数、所述电机反馈参数作为状态,补偿参数作为动作,将所述强化学习神经网络作为策略,将参考参数作为奖励,通过所述动作及所述状态得到所述奖励来优化所述策略,根据所述奖励判断训练是否结束;其中,所...

【专利技术属性】
技术研发人员:王天昊曾子敬杨乐
申请(专利权)人:中铁科工集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1