基于确定学习的封闭机器人速度补偿跟踪控制方法、存储介质及机器人技术

技术编号:33145736 阅读:9 留言:0更新日期:2022-04-22 13:57
本发明专利技术公开了一种基于确定学习的封闭机器人速度补偿跟踪控制方法、存储介质及机器人,该控制方法具体步骤包括:建立具有内部速度PI控制器的封闭机器人动力学模型和期望的关节周期轨迹;设计自适应神经网络速度补偿控制指令,并利用确定学习理论获取经验知识;基于所获经验知识设计常值神经网络速度补偿控制指令。本发明专利技术所设计方法不仅实现了神经网络控制智能算法在具有未知动态封闭机器人系统上的应用,而且基于确定学习理论设计的常值神经网络速度补偿控制指令,使得机器人能够从复杂工作任务中获取和利用经验知识,并在执行重复任务时节省在线计算资源和提升暂态跟踪性能。能。能。

【技术实现步骤摘要】
基于确定学习的封闭机器人速度补偿跟踪控制方法、存储介质及机器人


[0001]本专利技术涉及机器人的智能跟踪控制的
,具体涉及一种基于确定学习的封闭机器人速度补偿跟踪控制方法、存储介质及机器人。

技术介绍

[0002]机器人作为一种涉及机械、控制等众多领域的高精技术产品,对工业生产起到了巨大的推动作用,常用于抓取、搬运等机械式的工作任务中,但是当前市面上的大多数工业机器人为封闭系统,出于使用安全、商业隐私等原因,不给予开放力矩控制接口,用户一般只能对关节(执行器)位置和速度进行设置,而传统工业机器人的内部控制以速度PI控制或位置PID控制为主要形式。机器人控制系统由于非线性环节、环境动态变化、零部件老化等因素的存在,导致工业机器人的精确建模较为困难,给机械臂的控制器和控制参数设计带来了挑战,为了克服建模不确定性问题和提高控制精度,现阶段通常运用自适应神经网络控制算法对机器人进行动力学控制,然而由于工业机器人的封闭性,自适应神经网络控制算法的实验与应用困难,这也导致多数算法实验以数值仿真为主,存在一定的局限性,算法控制性能说服力不足。此外,在传统的自适应神经网络控制中,无论任务是否相同或相似,每次控制都需要重复进行自适应训练,浪费大量在线调节时间和计算资源,并且存在自适应控制初期暂态效果较差的问题。21世纪来,确定学习理论的提出和发展解决了上述传统自适应神经网络控制中存在的问题,实现了在非线性系统的自适应控制过程中对未知动态经验知识的获取、存储和再利用,避免了在相同或相似控制任务下神经网络的无意义重复训练,同时提高了暂态阶段的控制性能。
[0003]因此,结合外环速度补偿思想和确定学习理论,设计适用于封闭机器人的速度补偿控制指令,促使封闭机器人可以在稳定的控制过程中获取、存储动态信息知识,对具有封闭结构的工业机器人的高性能控制问题以及确定学习理论的应用实验多样化具有重要意义。

技术实现思路

[0004]本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种基于确定学习的封闭机器人速度补偿跟踪控制方法、存储介质及机器人,该方法针对自适应神经网络控制算法无法在封闭机器人系统中应用的问题,该方法利用外环速度补偿思想,在封闭机器人内部速度控制器为PI控制器的前提下,结合李雅普诺夫稳定性理论进行自适应神经网络速度补偿控制指令和神经网络权值估计值更新率的设计;针对传统自适应神经网络控制中存在的执行相同或相似的控制任务时神经网络权值仍需重复训练的问题,该方法利用确定学习理论,将收敛后的神经网络权值作为对未知动态学习后获得的经验知识进行保存,当机器人再次执行相同或相似任务时,可以直接调用经验知识实现再利用。
[0005]为了达到上述目的,本专利技术采用以下技术方案:
[0006]本专利技术一方面提供了一种基于确定学习的封闭机器人速度补偿跟踪控制方法,包括下述步骤:
[0007]S1、建立具有内部速度PI控制器的封闭机器人动力学模型和期望的关节周期轨迹;
[0008]S2、结合李雅普诺夫稳定性理论设计自适应神经网络速度补偿控制指令,并利用确定学习理论将收敛后的神经网络权值估计值保存为常值权值即获取经验知识:
[0009]设计自适应神经网络速度补偿控制指令:
[0010][0011][0012]其中,α1为封闭机器人系统虚拟控制器,为输入封闭机器人系统的速度补偿控制指令,为封闭机器人的期望关节速度轨迹,为神经网络权值估计值,S(Z)=[s1(||Z

θ1||),

,s
N
(||Z

θ
N
)||]T
为神经网络高斯型径向基函数,s
j
(||Z

θ
j
||)=exp(

||Z

θ
j
||2/η
j2
),j=1,

,N,θ
j
为中心点,η
j
为宽度,N为神经网络布点数,为神经网络的输入,x1为封闭机器人的关节角位置向量,x2为封闭机器人的关节角速度向量,q
c
为补偿后的位置补偿控制指令,可通过对积分得到,为虚拟控制器α1的导数,c1为α1中设计的正常数控制增益,c2为中设计的正常数控制增益,z1,z2为控制器设计过程中的中间误差变量;
[0013]构造神经网络权值估计值的更新率为:
[0014][0015]其中,Γ为神经网络权值估计值更新率的增益项,σ为神经网络权值估计值更新率的设计常数;
[0016]S3、利用常值权值设计常值神经网络速度补偿控制指令:
[0017][0018]优选的,步骤S1中,所述PI控制器具体为:
[0019][0020]其中,K
p
为比例系数,K
i
为积分系数,均为对角正定矩阵且未知。
[0021]优选的,步骤S1中,所述封闭机器人动力学模型,具体为:
[0022][0023]将其化为状态空间表达式:
[0024][0025]其中,M(x1)为封闭机器人的未知惯性矩阵,该矩阵对称且一致正定,为封闭机器人的未知科氏力和离心力矩阵,G(x1)为封闭机器人的未知重力向量,u为封闭机器人内部速度PI控制器,K为封闭机器人系统内部的控制增益,是一个未知常值对角正定矩阵。
[0026]优选的,步骤S1中,所述关节周期轨迹,具体为:
[0027][0028]其中,x
d1
为封闭机器人期望的关节角位置周期轨迹,x
d2
为封闭机器人期望的关节角速度周期轨迹,f(x
d1
,x
d2
)为给定的连续函数。
[0029]优选的,步骤S2中,利用确定学习理论将收敛后的神经网络权值估计值保存为常值权值具体为:
[0030][0031]其中,t
b
>t
a
>T,代表权值收敛后的一段时间,T为收敛时间。
[0032]优选的,步骤S2中,所述控制器设计过程中的中间误差变量z1,z2为:
[0033]z1=x1‑
x
d1
[0034]z2=x2‑
α1[0035]本专利技术另一方面提供了一种基于确定学习的封闭机器人速度补偿跟踪控制系统,应用于所述的基于确定学习的封闭机器人速度补偿跟踪控制方法,包括模型构建模块、经验知识获取模块和补偿模块;
[0036]所述模型构建模块,用于建立具有内部速度PI控制器的封闭机器人动力学模型和期望的关节周期轨迹;
[0037]所述经验知识获取模块,用于结合李雅普诺夫稳定性理论设计自适应神经网络速度补偿控制指令,并利用确定学习理论将收敛后的神经网络权值估计值保存为常值权值即获取经验知识:
[0038]设计自适应神经网络速度补偿控制指令:
[0039][0040][0041]其中,α本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于确定学习的封闭机器人速度补偿跟踪控制方法,其特征在于,包括下述步骤:S1、建立具有内部速度PI控制器的封闭机器人动力学模型和期望的关节周期轨迹;S2、结合李雅普诺夫稳定性理论设计自适应神经网络速度补偿控制指令,并利用确定学习理论将收敛后的神经网络权值估计值保存为常值权值即获取经验知识:设计自适应神经网络速度补偿控制指令:速度补偿控制指令:其中,α1为封闭机器人系统虚拟控制器,为输入封闭机器人系统的速度补偿控制指令,为封闭机器人的期望关节速度轨迹,为神经网络权值估计值,S(Z)=[s1(||Z

θ1||),

,s
N
(||Z

θ
N
)||]
T
为神经网络高斯型径向基函数,s
j
(||Z

θ
j
||)=exp(

||Z

θ
j
||2/η
j2
),j=1,

,N,θ
j
为中心点,η
j
为宽度,N为神经网络布点数,为神经网络的输入,x1为封闭机器人的关节角位置向量,x2为封闭机器人的关节角速度向量,q
c
为补偿后的位置补偿控制指令,可通过对积分得到,为虚拟控制器α1的导数,c1为α1中设计的正常数控制增益,c2为中设计的正常数控制增益,z1,z2为控制器设计过程中的中间误差变量;构造神经网络权值估计值的更新率为:其中,Γ为神经网络权值估计值更新率的增益项,σ为神经网络权值估计值更新率的设计常数;S3、利用常值权值设计常值神经网络速度补偿控制指令:2.根据权利要求1所述基于确定学习的封闭机器人速度补偿跟踪控制方法,其特征在于,步骤S1中,所述PI控制器具体为:其中,K
p
为比例系数,K
i
为积分系数,均为对角正定矩阵且未知。3.根据权利要求2所述基于确定学习的封闭机器人速度补偿跟踪控制方法,其特征在于,步骤S1中,所述封闭机器人动力学模型,具体为:将其化为状态空间表达式:其中,M(x1)为封闭机器人的未知惯性矩阵,该矩阵对称且一致正定,为封闭机器人的未知科氏力和离心力矩阵,G(x1)为封闭机器人的未知重力向量,u为封闭机器人内部速度PI控制器,K为封闭机器人系统内部的控制增益,是一个未知常值对角正定矩阵。
4.根据权利要求1所述基于确定学习的封闭机器人速度补偿跟踪控制方法,其特征在于,步骤S1中,所述关节周期轨迹,具体为:其中,x
d1
为封闭机器人期望的关节角位置周期轨迹,x
d2
为封闭机器人期望的关节角速度周期轨迹,f(x
d1
,x
d2
)为给定的连续函数。5.根据权利要求1所述基于确定学习的封闭机器人速度补偿跟踪控制方法,其特征在于,步骤S2中,利用确定学习理论将收敛后的神经网络权值估计值...

【专利技术属性】
技术研发人员:王敏林梓欣曾宇鹏戴诗陆
申请(专利权)人:佛山纽欣肯智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1