【技术实现步骤摘要】
弹簧
‑
质量
‑
阻尼关联系统的一种分散式智能评判跟踪控制方法
[0001]本专利技术针对于机械工业系统,研究了其中最常见的机械振动系统,即弹簧
‑
质量
‑
阻尼结构,并提出利用自适应动态规划的方法,解决一类具有外部扰动的连续时间非线性系统的分散跟踪控制问题。
技术介绍
[0002]随着社会经济的快速发展,涌现出诸多实际工业应用,如电力系统、运输系统、机械系统等等大规模互联系统。其中,弹簧、阻尼器、质量块是组成机械系统的理想元件。由它们组成的弹簧
‑
质量
‑
阻尼系统是最常见的机械振动系统,在生活中具有相当广泛的用途,缓冲器就是其中的一种。缓冲装置是吸收和耗散过程产生能量的主要部件,其吸收耗散能量的能力大小直接关系到系统的安全与稳定。因此,对弹簧
‑
质量
‑
阻尼系统的研究有着非常深的现实意义。然而,当我们继续采用传统集中式的控制方案时,无法解决实际当中的大规模系统等问题,这便引出了分散控制这一控制理论概念。分散控制依赖于局部可用的子系统信息和相关性能指标。其研究对象为大规模系统,将这个大系统划分为一系列可控的子系统是十分有必要的。此外,最优控制方法也被广泛应用于分散控制当中。自适应动态规划(Adaptive dynamic programming,ADP)是一种涉及强化学习和神经网络思想的智能优化方法,且由于神经网络的近似特性,在许多研究当中它被视为一种非常有利的工具。
[ ...
【技术保护点】
【技术特征摘要】
1.弹簧
‑
质量
‑
阻尼关联系统的一种分散式智能评判跟踪控制方法,其特征在于:即弹簧
‑
质量
‑
阻尼器实例系统中,M1和M2表示两个物体的质量,K1,K2和K3表示三个弹簧的刚度常数,C1,C2和C3表示三个阻尼器的阻尼;另外,P1和P2、V1和V2、F1和F2、f
μ1
和f
μ2
分别表示两个物体的位移、速度、施加在物体上的力和物体所受的摩擦力;对于物体M1,其动力学系统如下:其中,表示对物体M1的位移求导数,即得到物体M1的速度V1;表示对物体M1的速度求导数,即得到物体M1的加速度,根据牛顿第二定理便可得到以上物体M1的动力学方程;对于物体M2,其动力学系统如下:其中,表示对物体M2的位移求导数,即得到物体M2的速度V2;表示对物体M2的速度求导数,即得到物体M2的加速度,根据牛顿第二定理便可得到以上物体M2的动力学方程;在此,定义子系统1当中的一个状态分量为物体1的位移,即x
11
=P1;另一个状态分量为物体1的速度,即x
12
=V1;子系统1的控制输入为施加在物体1上的外力,即子系统1的扰动输入为物体1所受的摩擦力,即v1(x1)=f
μ1
;同理,定义子系统2当中的一个状态分量为物体2的位移,即x
21
=P2;另一个状态分量为物体2的速度,即x
22
=V2;子系统2的控制输入为施加在物体2上的外力,即子系统2的扰动输入为物体2所受的摩擦力,即v2(x2)=f
μ2
;因此,得到以下形式:;因此,得到以下形式:其中,x1=[x
11
,x
12
]
T
和x2=[x
21
,x
22
]
T
分别表示系统1和2的整体状态,x
11
和x
12
为子系统1当中的两个系统状态,x
21
和x
22
为子系统2当中的两个系统状态;与此同时,和分别表示系统1和2的整体状态对时间的导数;和为子系统1当中的两个子系统状态对时间的导数,和为子系统2当中的两个系统状态对时间的导数;和v1(x1)和v2(x2)分别表示子系统1和子系统2的反馈控制输入和干扰输入;另外,Z1(x)=K2(x
21
‑
x
11
)+C2(x
22
‑
x
12
)和Z2(x)=K2(x
11
‑
x
21
)+C2(x
12
‑
x
22
)为两个子系统的相互关联项;基于以上对弹簧
‑
质量
‑
阻尼器系统的描述,分散跟踪控制器的设计步骤可划分为三部
分;首先,对分散跟踪控制策略的介绍,包括跟踪问题描述以及相关问题转换;然后,采用最优控制方案,给出具体算法的实现过程;最后,详细说明了评判网络在线训练的过程;问题描述及其转化将弹簧
‑
质量
‑
阻尼器关联系统的跟踪问题进行转化,通过原系统与期望轨迹作差得到误差系统,对误差系统进行调节控制,使得原系统的跟踪误差为零,最终完成原系统的跟踪任务;上述关联机械系统用如下连续时间非线性系统描述:其中,i=1,2,x
i
为第i个系统的状态,为第i个系统状态对时间的导数,x为整个系统的状态,为第i个子系统的反馈控制输入、v
i
(x
i
)为第i个子系统的扰动输入;f
i
(x
i
)、g
i
(x
i
)、h
i
(x
i
)、Z
i
(x)依次表示第i个子系统的非线性内部动力学、输入增益矩阵、扰动增益矩阵和互连项;互联项的界限设定如下:其中,||Z
i
(x)||代表互联项的范数,j=1,2,α
ij
是非负常数,l
ij
(x
j
)是半正定函数,l
j
(x
j
)和β
ij
都是非负常数;此外,定义l
j
(x
j
)=max{l
1j
(x
j
),l
2j
(x
j
)},β
ij
≥α
ij
l
ij
(x
j
)/l
j
(x
j
);根据非线性系统(5),研究轨迹跟踪控制问题,其参考系统定义如下:式中,r
i
为参考状态,为参考状态对时间的导数,r1=[r
11
,r
12
]
T
和r2=[r
21
,r
22
]
T
分别表示系统1和2的整体参考状态期望轨迹,r
11
和r
12
为子系统1当中的两个参考状态,r
21
和r
22
为子系统2当中的两个参考状态;与此同时,和分别表示系统1和2的整体参考状态对时间的导数;和为子系统1当中的两个参考状态对时间的导数,和为子系统2当中的两个参考状态对时间的导数;ζ
i
(r
i
)为满足ζ
i
(0)=0的局部Lipschitz函数;定义第i个子系统的轨迹跟踪误差e
i
为实际状态与期望轨迹之差,即e
i
=x
i
‑
r
i
,则跟踪误差动态系统描述为:其中,e
i
为跟踪误差,为跟踪误差对时间的导数,与此同时,e1=[e
11
,e
12
]
T
=[x
11
‑
r
11
,x
12
‑
r
12
]
T
和e2=[e
21
,e
22
]
T
=[x
21
‑
r
21
,x
22
‑
r
22
]
T
分别表示子系统1和子系统2的跟踪误差状态,e
11
和e
12
为子系统1当中的两个跟踪误差状态,e
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。