【技术实现步骤摘要】
一种基于Actor
‑
Critic网络全状态反馈的柔性关节机械臂控制方法
[0001]本专利技术属于自动控制
,具体涉及一种基于
Actor
‑
Critic
网络全状态反馈的柔性关节机械臂控制方法
。
技术介绍
[0002]近年来,柔性关节机械臂的控制技术得到了突飞猛进的发展,且应用极为广泛,柔性机械臂的控制考虑机械臂关节柔性与弹性变形之间的耦合,因此它的运动方程是高度非线性的
。
同时,柔性机械臂是一个由柔性关节组成的集中式参数系统和由柔性杆组成的分布式参数系统组成的混合系统,其动态特性采用偏微分方程
(PDE)
来描述,这也增加了控制器设计的难度
。
[0003]由于运动过程中关节和连杆的柔性效应增加,导致结构变形,降低了执行任务的精度
。
因此,必须考虑机器人机械臂的结构柔性特性
。
连杆为柔性时,早期研究学者通常采用假设模态法
、
有限元法
、
集总质量法
、
传递矩阵法等方法来描述柔性机械臂的柔性变形,然后根据需要进行截断
。
又因为柔性变形只考虑弯曲变形,而忽略轴向变形和剪切变形,因此,从动力角度来看,每个柔性构件都可以看作是一根欧拉伯努利梁,即考虑到机械手连杆的长度总是远远大于其横截面尺寸;与此同时,与振动控制有关的问题便随之产生
。
[0004]目前,越来越多的研究者采用自适应方 ...
【技术保护点】
【技术特征摘要】
1.
一种基于
Actor
‑
Critic
网络全状态反馈的柔性关节机械臂控制方法,其特征在于,步骤包括:
S1、
搭建机器人仿真环境,选取
Baxter
模型作为柔性关节机械臂的动力学模型,并设定所述机械臂末端执行关节的期望轨迹
、
以及末端执行关节的约束力矩增益参数;
S2、
预先构建
Actor
和
Critic
神经网络,在设定仿真循环的时间周期内,依据所述期望轨迹,通过仿真环境输出末端执行关节的仿真结果,将所述仿真结果输入所述
Critic
神经网络中,将输出结果输入所述
Actor
神经网络中进行训练,并实时输出基于所述
Actor
神经网络控制下的
Baxter
模型末端执行关节的实际轨迹;
S3、
在所述仿真环境中,输出基于所述时间周期内期望轨迹和实际轨迹的轨迹误差,根据所述轨迹误差来验证所述机械臂控制方法
。2.
根据权利要求1所述的一种基于
Actor
‑
Critic
网络全状态反馈的柔性关节机械臂控制方法,其特征在于:步骤
S1
具体包括:
S1.1、
基于
ROS
系统创建工作空间;
S1.2、
在所述工作空间中安装与所述
Baxter
模型相关依赖;
S1.3、
完成
Baxter
模型编译后执行
IP
连接,并创建仿真环境;
S1.4、
基于所述仿真环境下启动
Baxter
模型机器人仿真测试;
S1.5、
重复执行上述步骤直至仿真测试运行正常,启动仿真环境并运行
Baxter
模型机器人的设定仿真指令;
S1.6、
生成
Baxter
模型机器人的执行控制例程
。3.
根据权利要求1所述的一种基于
Actor
‑
Critic
网络全状态反馈的柔性关节机械臂控制方法,其特征在于:步骤
S2
中,预先构建的
Actor
和
Critic
神经网络中包括自定义训练方法,其中包括设置
Za
函数,
Za
函数将设定构型机械臂所有关节的实际角度向量
、
实际速度向量
、
期望角度向量
、<...
【专利技术属性】
技术研发人员:高赫佳,张芷铭,胡钜奇,何传峰,孙长银,
申请(专利权)人:安徽大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。