一种基于DDPG算法的水下机器人推进器故障容错控制方法技术

技术编号:38207911 阅读:23 留言:0更新日期:2023-07-21 16:57
本发明专利技术公开了一种基于DDPG算法的水下机器人推进器故障容错控制方法,属于水下机器人容错控制技术领域。该容错控制方法包括:构建水下机器人非线性模型,设计比例

【技术实现步骤摘要】
一种基于DDPG算法的水下机器人推进器故障容错控制方法


[0001]本专利技术属于水下机器人容错控制
,具体涉及一种基于DDPG算法的水下机器人推进器故障容错控制方法。

技术介绍

[0002]作为人类探索海洋的得力助手,水下机器人是多种现代高科技技术集成的产物,通过远程遥控和特定的功能模块可完成资源探测、水下作业和特种作战等任务,对于未来海洋科学技术的发展具有特殊意义。推进器是水下机器人必备的动力部件,与其它部件相比,推进器要在高压、高盐环境下长时间高负荷运转,是水下机器人负荷最重的部件。推进器故障时性能明显低于正常水平,难以完成预期的作业任务,甚至会对水下机器人的安全构成威胁。潜深越大,承载的静水压力也越大,推进器出现故障的概率也成倍增加。因此,如果能在故障发生时及时采取容错控制策略,将大幅提高水下机器人的安全性。
[0003]容错控制的基本思想是在故障发生时使用系统的冗余资源来保持原始性能,或者在牺牲一定性能的情况下确保系统能够在指定的时间内安全地完成计划任务。目前,水下机器人多通过集成故障诊断单元提供推进器故障信息来实现容错本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于DDPG算法的水下机器人推进器故障容错控制方法,其特征在于,包括以下步骤:步骤1:同时考虑模型不确定性、推进器饱和、未知外部干扰和推进器故障,构建水下机器人非线性模型;步骤2:考虑系统正常运行时的情况,通过期望轨迹与水下机器人非线性模型的输出信息得到水下机器人轨迹跟踪误差,设计比例

积分

微分控制器实现水下机器人的轨迹跟踪控制;步骤3:基于步骤2得到的轨迹跟踪误差及控制器的输出信号,构建二次型性能指标实时检测系统性能,并给出检测策略用于判断系统是否发生推进器故障;步骤4:基于步骤3给出的检测策略,当判定系统发生故障时,设计DDPG算法的奖励函数,基于水下机器人的输出对DDPG算法中的策略网络和评价网络进行训练,得到控制器补偿信号,从而实现水下机器人的容错控制。2.根据权利要求1所述的基于DDPG算法的水下机器人推进器故障容错控制方法,其特征在于,所述步骤1的具体过程如下:步骤1.1:所述水下机器人非线性模型包括运动学模型和动力学模型,在不考虑故障时分别如式(1)和式(2)所示:分别如式(1)和式(2)所示:式中,为水下机器人的位置向量,其中η
x

y

z
为水下机器人在惯性坐标系中的位置坐标,η
θ

ψ
分别为水下机器人的横倾角、纵倾角、艏向角;为η的一阶导数;V=[V
u
,V
v
,V
w
,V
p
,V
q
,V
r
]
T
为水下机器人的速度向量,其中V
u
,V
v
,V
w
分别为水下机器人线速度矢量在载体坐标系中的3个分量,V
p
,V
q
,V
r
分别为水下机器人角速度矢量在载体坐标系中的3个分量;为V的一阶导数;M
RB
是刚体惯量矩阵,M
A
表示水下机器人在加速过程中所受到的来自周围液体惯性作用的水动力矩阵,C(V)是科氏力与向心力矩阵,D(|V|)是与航行器航行速度有函数关系的阻尼力矩阵,g(η)表示回复力;τ
RB
为水下机器人推进器产生的力和力矩向量,τ
env
表示因环境产生的未知外部干扰;J
c
(η)为坐标变换矩阵,其表达式为:式中,03表示大小为“3
×
3”的零矩阵,的零矩阵,由于水下机器人具有较强的非线性和耦合特性,基于动态建模技术获得的模型具有较
大的不确定性,表示如下:大的不确定性,表示如下:式中,分别为刚体惯量矩阵、水动力惯量矩阵、科氏力与向心力矩阵、水阻尼矩阵的标称值,ΔM
RB
,ΔM
A
,ΔC(V),ΔD(|V|)分别表示相对应矩阵的不确定性;步骤1.2:考虑B
T
为推力分配矩阵,T
RB
为推进器产生的推力矢量,则有τ
RB
=B
T
T
RB
;推进器的输出受到其输出能力的限制,考虑推进器输出的上限和下限分别为T
max
和T
min
,则推进器饱和由下式表示:sat(T
RB
)=T
RB
+Λ式中,考虑水下机器人发生推进器故障,此时推进器真实输出为T
RB,f
,则有:T
RB,f
=T
RB

T
f
式中T
f
=F
k
T
RB
+F
b
,F
k
=diag(k1,k2,k3,k4,k5,k6)和F
b
=diag(b1,b2,b3,b4,b5,b6)是未知的推进器故障系数矩阵,满足06≤F
k
≤I6,06≤F
b
≤I6,k1,k2,k3,k4,k5,k6分别表示对应推进器的乘性故障系数,b1,b2,b3,b4,b5,b6分别表示对应推进器的加性故障系数,其中06表示大小为“6
×
6”的零矩阵,I6表示大小为“6
×
6”的单位矩阵;步骤1.3:选取状态变量x1(t)=η(t),x2(t)=V(t),测量变量为y(t)=x1(t)=η(t),控制变量u(t)=T
RB
(t),则(1)、(2)式所示的水下机器人系统在考虑发生推进器故障的情况时描述成如下状态空间方程的形式:式中,h(x2(t))=

(M
RB
+M
A
)
‑1(C(x2(t))+D(|x2(t)|))≤0B
u
=(M
RB
+M
A
)
‑1B
T
,B
d
=(M
RB
+M
A
)
‑1,d(t)=τ
env
(t),f(t)=T
f
(t)。3.根据权利要求1所述的基于DDPG算法的水下机器人推进器故障容错控制方法,其特征在于,所述...

【专利技术属性】
技术研发人员:钟麦英秦娇盖文东张璐
申请(专利权)人:山东科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1