不确定环境接触下的可重构机器人分散学习最优控制方法技术

技术编号:16968117 阅读:83 留言:0更新日期:2018-01-07 05:41
不确定环境接触下的可重构机器人分散学习最优控制方法,属于机器人控制算法领域,为了解决传统的可重构机器人控制方法中存在机器人关节的抖振效应及稳定性和控制精度低的问题,首先建立可重构机器人系统动力学模型,通过对可重构机器人关节子系统间的耦合力矩交联项的分析,然后构建代价函数与HJB方程,通过基于策略迭代的学习算法,来求HJB方程的解,接下来采用神经网络对代价函数进行近似,最后通过仿真验证所提出控制方法的有效性;该方法可以在面向不确定环境接触的条件下,使机器人系统实现良好的稳定性与控制精度,可以在提高可重构机器人控制精度的同时,降低系统执行器的能耗,并降低了机器人系统动力学模型的复杂性。

Optimal control method for decentralized learning of reconfigurable robots under uncertain environmental contact

Contact under the uncertain environment of reconfigurable robot distributed learning optimal control method, which belongs to the field of robot control algorithm, in order to Buffeting effect and stability and control precision of the robot joint to solve the traditional reconfigurable robot control method in the problem, the first step is to establish the dynamic reconfigurable robot system model, based on the analysis of cross coupling torque a reconfigurable robot joint between subsystems, and then construct the cost function and the HJB equation, by learning algorithms based on policy iteration, to find the solutions of HJB equation, then the neural network approximation of the cost function is verified by simulation, the effectiveness of the proposed control method; the method can in the uncertain environment of contact for the conditions, make the system achieve stability and good control accuracy, which can improve the reconstruction The control precision of the robot reduces the energy consumption of the system executor and reduces the complexity of the dynamic model of the robot system.

【技术实现步骤摘要】
不确定环境接触下的可重构机器人分散学习最优控制方法
本专利技术涉及一种可重构机器人系统的分散学习最优控制方法,属于机器人控制算法领域。
技术介绍
可重构机器人由电源、处理系统、执行器和传感器等模块组成。这些模块组合满足不同构形的标准机电接口来适应复杂工作环境的各种任务要求,基于上述优点,可重构机器人经常应用于不确定性和危险的环境中,如太空探测、灾害救援、高低温环境作业等。此外,在复杂和不确定的环境面前,可重构机器人需要兼顾控制精度和功耗的合适控制系统。一般来说,为了实现模块化和可重构的特点,可重构机器人应该具有可以添加、删除或者根据任务需要来替换的重要属性,这对于可重构机器人控制系统的设计是一个挑战。分散控制是构建可重构机器人控制系统的一种有效的控制策略。由于仅需要采用每个关节模块的局部信息,使得分散控制策略可以为机器人控制系统提供结构上的灵活性,使得可重构机器人可以根据不同任务的需求重组成不同的构形而无需调整控制器的参数。由于可重构机器人的子系统动力学模型具有关节子系统间的耦合力矩交联项,包括哥式力项、离心力项和重力项,因此对关节子系统间的耦合力矩交联项的处理是一个难题。近期的一类本文档来自技高网...
不确定环境接触下的可重构机器人分散学习最优控制方法

【技术保护点】
不确定环境接触下的可重构机器人分散学习最优控制方法,其特征是,首先建立可重构机器人系统动力学模型,通过对可重构机器人关节子系统间的耦合力矩交联项的分析,然后构建代价函数与HJB方程,通过基于策略迭代的学习算法,来求HJB方程的解,接下来采用神经网络对代价函数进行近似,最后通过仿真验证所提出控制方法的有效性。

【技术特征摘要】
1.不确定环境接触下的可重构机器人分散学习最优控制方法,其特征是,首先建立可重构机器人系统动力学模型,通过对可重构机器人关节子系统间的耦合力矩交联项的分析,然后构建代价函数与HJB方程,通过基于策略迭代的学习算法,来求HJB方程的解,接下来采用神经网络对代价函数进行近似,最后通过仿真验证所提出控制方法的有效性。2.根据权利要求1所述的不确定环境接触下的可重构机器人分散学习最优控制方法,其特征在于,该方法包括以下步骤:步骤一,建立可重构机器人系统动力学模型如下:上式中,下标i代表第i个模块,Imi是转动轴的转动惯量,γi是齿轮传动比,θi,和分别是关节位置,速度和加速度,是关节摩擦项,是关节子系统间的耦合力矩交联项,τfi是关节输出转矩,τi是电机输出转矩;定义系统的状态向量控制输入ui=τi;则子系统的状态空间的形式可以表示为:上式中,Bi=(Imiγi)-1,代表已建模的动力学模型部分,是模型不确定项,包括摩擦模型误差和关节子系统间的耦合力矩交联项,x是关节的位置向量,是关节的速度向量,是关节的加速度向量;步骤二,考虑式(11),构建代价函数如下:其中,si(ei)定义为且ei=xi1-xid和分别代表第i个关节的位置和速度跟踪误差,xid与分别是第i个关节的期望位置和速度,αei为确定常数,为效用函数,和是确定的正常数矩阵,Di∈R+为已知的上界函数;构建哈密顿方程和最优代价函数如下:其中,是第i个关节期望的加速度,为代价函数Ji(si)的梯度;在最优控制设计下,满足如下HJB方程:令满足式(16)的分散最优控制律定义为如下形式:其中,ui1是反馈控制律,是最优补偿控制律;处理式(11)中的和将(16)式的HJB方程改写成:接下来,定义反馈控制律ui1为其中,ui1是利用第i个关节模块的已知局部信息设计,设计分散最优控制的律的问题可以转化为找到一个最优补偿控制律来处理可重构机器人系统的不确定项;步骤三,通过神经网络来近似代价函数Ji(si),定义如下:

【专利技术属性】
技术研发人员:董博王梓旭周帆李岩刘克平李元春
申请(专利权)人:长春工业大学
类型:发明
国别省市:吉林,22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1