一种基于动态规划的模块化机械臂多故障容错控制方法技术

技术编号:21963021 阅读:22 留言:0更新日期:2019-08-27 23:57
本发明专利技术公开了一种基于自适应动态规划的可重构机械臂多故障容错控制方法,构建可重构机械臂系统的动力学模型及多故障动力学模型;根据多故障动力学模型,给出性能指标函数;设计自适应故障观测器,对系统故障进行故障估计;构建评价网络,利用神经网络近似估计性能指标函数;完成最优容错控制器的设计。本发明专利技术方法具有控制结构简单紧凑、减小控制过程计算量等优点。

A Dynamic Programming Based Fault Tolerant Control Method for Modular Manipulator

【技术实现步骤摘要】
一种基于动态规划的模块化机械臂多故障容错控制方法
本专利技术涉及机器人控制及容错控制领域,尤其是一种采用自适应动态规划的模块化机械臂多故障容错控制方法。
技术介绍
随着机器人技术更新换代的速度逐渐加快,使得对模块化机械臂的研究成为了热点,模块化机械臂可以利用关节模块与连杆模块的不同组合得以“变形”来适应不同工况需求。因此,在太空探索、智能工厂、高危作业等比较恶劣的环境下有着广泛的应用。由于模块化机械臂常用于遥远、未知和高危环境中,执行器、传感器以及其它部件会不可避免的发生故障。然而,计算机硬件与软件在国内外的技术发展已经达到很高的水平,其可靠性足以得到保障。故此,执行器与传感器故障成为导致模块化机械臂系统失效的主要原因。从目前研究现状来看,对于模块化机械臂的容错控制方法的研究虽然取得了一定的研究成果,但对于模块化机械臂多故障并发情形的研究还不够深入。而在实际工程应用中,执行器与传感器同时发生故障的情况并不罕见,若不能对系统所发生全部故障进行及时的处理,将会给人们的人身及财产安全造成不可估量的损失。因此对于多故障并发的模块化机械臂容错控制方法的研究有着重要的理论及实际意义。容错控制是以增加控制力矩为代价来维持模块化机械臂故障系统继续运行并完成指定任务的控制策略。任何电机都存在其自身能够输出的最大转矩值,长时间超过电机的最大输出转矩值则会彻底损毁电机从而导致任何形式的控制器都将失去控制作用。因此,在保证模块化机械臂轨迹跟踪控制的稳定性和准确性的前提下,实现控制性能和功耗的最优亦是当前机器人领域最具有理论研究价值的课题之一。模块化机械臂系统作为一种强耦合非线性系统,实现其最优控制的难点在于如何解决Hamilton–Jacobi–Bellman方程解析解的维数灾问题。自适应动态规划(AdaptiveDynamicProgramming)方法是一种能有效解决非线性系统最优控制问题的强有力工具,利用神经网络来近似HJB方程的解,采用在线更新方法获取最优控制策略可有效解决此类优化控制问题。在过去的数十年间,自适应动态规划理论算法研究在军事、工业上取得成功应用,显示出其卓越的最优控制性能。综上所述,针对模块化机械臂多故障系统,利用自适应动态规划策略设计一种多故障最优容错控制方法,以实现系统在进行有效容错控制的前提下尽量减少控制转矩的大小是十分必要的。
技术实现思路
本专利技术目的在于针对同时发生传感器故障与执行器故障的模块化机械臂系统,利用最优控制思想,结合自适应动态规划方法提出一种基于自适应动态规划的模块化机械臂多故障容错控制方法。其中,容错控制器由名义控制器和最优反馈控制器两部分组成,名义控制器用于保证系统的跟踪性能能够稳定到零,最优反馈控制器用于使跟踪误差以最优的方式收敛于稳定的状态,从而避免了在故障发生时系统失控等意外情形的发生。为实现上述目的,采用了以下技术方案,本专利技术所述方法包括以下步骤:S1,构建模块化机械臂系统的动力学模型及多故障动力学模型;S2,根据多故障动力学模型,给出性能指标函数;S3,设计自适应故障观测器,对系统故障进行故障估计;S4,构建评价网络,利用神经网络近似估计性能指标函数;S5,完成最优容错控制器的设计。进一步的,所述S1中,构建模块化机械臂系统的动力学模型,如下所示:其中,q∈Rn代表关节的位置向量,和为关节速度和加速度,M(q)∈Rn×n代表惯性矩阵,代表哥氏力和离心力项,G(q)∈Rn代表重力项,u∈Rn代表关节力矩向量。定义式(1)可以表示为如下的状态空间方程模型:上式中,g(x)=M-1(q)都是非线性局部Lipschitz连续函数。根据式(2)建立的系统状态空间方程,给出传感器和执行器同时发生故障时的数学模型,如下所示:其中,fa为系统执行器故障函数,fs为系统传感器故障函数。利用微分同胚原理将传感器故障转化为伪执行器故障,引入一阶滤波器za作为一个新的状态变量,即:其中,a>0和b≠0为常数。则可获得扩展后的故障模型如下所示:进一步的,所述S2中,给出性能指标函数如下:其中,e=x-xd为跟踪误差,为效应函数,且r(0,0)=0,对所有的e,u都有r(e,u)>0,Q∈Rn×n,R∈Rm×m为正定矩阵,是执行器故障的观测值,是传感器故障的观测值,ρ1>0,ρ2>0,γ>0为常数,ψ(Ω)是一组容许控制序列。给定的期望轨迹描述如下:其中,ud作为名义控制律,可以保证跟踪误差为零,据公式(10)可得:其中,g+(·)是g(·)的广义逆。对轨迹跟踪误差求导得:其中,fe=f(z)-f(zd),u=ud+ue。因此,性能指标函数可以改写为:接下来,需要寻找最优反馈控制策略使得性能指标函数式(13)最小,如果性能指标函数:连续可微,则(14)式的无穷小的形式即所谓的李雅普诺夫方程为:其中,定义哈密顿函数:并定义最优性能指标函数为:则最优性能指标函数满足最终得到最优反馈容错控制策略为:为获得最优反馈容错控制策略,需要求解HJB方程,然后求从而获得最优反馈控制律。进一步的,所述S3中,设计自适应故障观测器,对系统故障进行估计,形式如下:其中,表示为系统状态向量z的观测值,α1,α2表示的是观测器增益系数,且为正常数。执行器和传感器故障的观测值按照如下所示的自适应更新律进行更新:其中,α3、α4为正常数矩阵,为观测误差,且定义执行器和传感器的估计误差有未知上界。进一步的,所述S4中,构建评价网络,近似估计性能指标函数,则性能指标函数可近似表示为:其中,Wc是理想的权值向量,σc(e)是激活函数,εc是神经网络的逼近误差,V(e)的梯度通过神经网络近似为因此哈密顿函数可以表示为:其中,ecH为评价网络的逼近误差。因为理想权值Wc是未知的,用近似权值去建立一个评价神经网络估计性能指标函数,相应的近似HJB方程可以写成如下形式:定义训练过程中的最小化的性能准则为通过梯度下降法来更新权值其中,αc>0为评价网络的自适应增益。可得近似理想最优反馈容错控制策略为:进一步的,所述S5中,通过多故障并发的模块化机械臂系统动力学模型、故障模型、性能指标函数、最优反馈控制器,采用在线PolicyIteration(PI)算法进行循环迭代,如果迭代中前后两次性能指标数差值|V(i+1)(e)-V(i)(e)|≤ε,其中ε是一个正常数,则停止运算,得到近似最优控制律,否则进行循环迭代;如果迭代时间超过最大T,对数据进行存储,输出结果并结束,结果可采用word,excel或图表形式保存,输出最后一次迭代后的控制律。与现有技术相比,本专利技术方法具有如下优点:1、模块化机械臂可根据工作任务的需要,改变机械构形,使得比传统机械臂具有控制结构更加简单紧凑的优势。2、本专利技术提出的容错控制方法是针对模块化机械臂的多故障并发的情况设计的,更具有一般性和实际结合性。3、采用最优控制思想,结合自适应动态规划的方法,将模块化臂多故障并发的容错控制问题转化为最优控制问题,使得控制器结构简单,大大减小了控制过程的计算量。4、相比于经典自适应动态规划的执行-评价双网络结构来说,本专利技术舍弃执行网络,仅采用评价网络,并通过在线迭代的方法得出最优控制律,使得控制结构更为简单。附图说明图1是本专利技术方法的原理图。图2是本专利技术方法的流程图。图3是二本文档来自技高网
...

【技术保护点】
1.一种基于自适应动态规划的可重构机械臂多故障容错控制方法,其特征在于,所述方法包括以下步骤:S1,构建可重构机械臂系统的动力学模型及多故障动力学模型;S2,根据多故障动力学模型,给出性能指标函数;S3,设计自适应故障观测器,对系统故障进行故障估计;S4,构建评价网络,利用神经网络近似估计性能指标函数;S5,完成最优容错控制器的设计。

【技术特征摘要】
1.一种基于自适应动态规划的可重构机械臂多故障容错控制方法,其特征在于,所述方法包括以下步骤:S1,构建可重构机械臂系统的动力学模型及多故障动力学模型;S2,根据多故障动力学模型,给出性能指标函数;S3,设计自适应故障观测器,对系统故障进行故障估计;S4,构建评价网络,利用神经网络近似估计性能指标函数;S5,完成最优容错控制器的设计。2.根据权利要求1所述的一种基于自适应动态规划的可重构机械臂多故障容错控制方法,其特征在于:所述S1中,构建可重构机械臂系统的动力学模型,如下所示:其中,q∈Rn代表关节的位置向量,和为关节速度和加速度,M(q)∈Rn×n代表惯性矩阵,代表哥氏力和离心力项,G(q)∈Rn代表重力项,u∈Rn代表关节力矩向量;定义式(1)可以表示为如下的状态空间方程模型:上式中,g(x)=M-1(q)都是非线性局部Lipschitz连续函数;根据式(2)建立的系统状态空间方程,给出传感器和执行器同时发生故障时的数学模型,如下所示:其中,fa为系统执行器故障函数,fs为系统传感器故障函数;利用微分同胚原理将传感器故障转化为伪执行器故障,引入一阶滤波器za作为一个新的状态变量,即:其中,a>0和b≠0为常数;则可获得扩展后的故障模型如下所示:3.根据权利要求1所述的一种基于自适应动态规划的可重构机械臂多故障容错控制方法,其特征在于,所述S2中,给出性能指标函数如下:其中,e=x-xd为跟踪误差,为效应函数,且r(0,0)=0,对所有的e,u都有r(e,u)>0,Q∈Rn×n,R∈Rm×m为正定矩阵,是执行器故障的观测值,是传感器故障的观测值,ρ1>0,ρ2>0,γ>0为常数,ψ(Ω)是一组容许控制序列;给定的期望轨迹描述如下:其中,ud作为名义控制律,可以保证跟踪误差为零,据公式(10)可得:其中,g+(.)是g(.)的广义逆;对轨迹跟踪误差求导得:如果性能指标函数:连续可微,则(14)式的无穷小的形式即所谓的李雅普诺夫方程为:其中,定义哈密顿函数:并定义最优性能指标函数为:则最优性能指标函数满足最终得到最优反馈容错控制策略为:为获得最优反馈容错控制策略,需要求解HJB方程,然后求从而获得最优反馈控制律。4.根据权利要求1所述的一种基于自适应动态规划的可重构机械臂多故障容错控制方法,其特征在于,所述S3中,设计自适应故障观测器,对系统故障进行估计,形式如下:其中,表示为系统状态向量z的观测...

【专利技术属性】
技术研发人员:周帆
申请(专利权)人:长春工业大学
类型:发明
国别省市:吉林,22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1