弹簧-质量-阻尼关联系统的一种分散式智能评判跟踪控制方法技术方案

技术编号:37307746 阅读:30 留言:0更新日期:2023-04-21 22:51
本发明专利技术提供了弹簧

【技术实现步骤摘要】
弹簧

质量

阻尼关联系统的一种分散式智能评判跟踪控制方法


[0001]本专利技术针对于机械工业系统,研究了其中最常见的机械振动系统,即弹簧

质量

阻尼结构,并提出利用自适应动态规划的方法,解决一类具有外部扰动的连续时间非线性系统的分散跟踪控制问题。

技术介绍

[0002]随着社会经济的快速发展,涌现出诸多实际工业应用,如电力系统、运输系统、机械系统等等大规模互联系统。其中,弹簧、阻尼器、质量块是组成机械系统的理想元件。由它们组成的弹簧

质量

阻尼系统是最常见的机械振动系统,在生活中具有相当广泛的用途,缓冲器就是其中的一种。缓冲装置是吸收和耗散过程产生能量的主要部件,其吸收耗散能量的能力大小直接关系到系统的安全与稳定。因此,对弹簧

质量

阻尼系统的研究有着非常深的现实意义。然而,当我们继续采用传统集中式的控制方案时,无法解决实际当中的大规模系统等问题,这便引出了分散控制这一控制理论概念。分散控制依赖于局部可用的子系统信息和相关性能指标。其研究对象为大规模系统,将这个大系统划分为一系列可控的子系统是十分有必要的。此外,最优控制方法也被广泛应用于分散控制当中。自适应动态规划(Adaptive dynamic programming,ADP)是一种涉及强化学习和神经网络思想的智能优化方法,且由于神经网络的近似特性,在许多研究当中它被视为一种非常有利的工具。
[0003]在存在噪声和不确定的环境当中,实际信号能跟踪上参考信号的状态显得尤为重要,这便引入了最优跟踪控制设计问题。尤其是近年来很多人利用基于值迭代的自适应评判方法来处理跟踪控制问题。此外,随着最优跟踪控制的逐步发展,许多专利技术将其应用于分散控制系统,即引入了分散跟踪控制(Decentralized tracking control,DTC)问题。其中,大量研究包括具有未知互连的自适应渐近DTC方案,以及将其与事件触发控制等问题相结合。此外,在自适应DTC的基础上,对不确定互联非线性系统的输入量化和时滞等问题的研究也十分有必要。此外,博弈论是研究理性决策者战略行为的相互作用理论。一般来说,它包括合作和非合作博弈两大类,即零和博弈和非零和博弈。值得一提的是,零和博弈问题在跟踪控制方面得到了广泛应用。
[0004]在已有的专利技术中,针对非线性互联系统,零和博弈微分控制与DTC设计相结合的问题研究甚少。因此,本专利技术提出了一种新的基于ADP的方法来解决一类具有零和博弈的弹簧

质量

阻尼机械系统的DTC问题。更重要的是,为了克服选择初始容许控制的困难,在权值更新过程当中添加了一个稳定项。最后,基于机械系统的弹簧

质量

阻尼结构,给出了相关实例仿真,该仿真结果验证了所提方法的可行性。

技术实现思路

[0005]在这部分当中,将介绍常见的机械振动系统,即弹簧

质量

阻尼器实例系统,其机械系统结构简图如图1所示:
[0006]其中,M1和M2表示两个物体的质量,K1,K2和K3表示三个弹簧的刚度常数,C1,C2和C3表示三个阻尼器的阻尼。另外,P1和P2、V1和V2、F1和F2、f
μ1
和f
μ2
分别表示两个物体的位移、速度、施加在物体上的力和物体所受的摩擦力。
[0007]对于物体M1,其动力学系统如下:
[0008][0009]其中,表示对物体M1的位移求导数,即得到物体M1的速度V1;表示对物体M1的速度求导数,即得到物体M1的加速度,根据牛顿第二定理便可得到以上物体M1的动力学方程。
[0010]对于物体M2,其动力学系统如下:
[0011][0012]其中,表示对物体M2的位移求导数,即得到物体M2的速度V2;表示对物体M2的速度求导数,即得到物体M2的加速度,根据牛顿第二定理便可得到以上物体M2的动力学方程。
[0013]在此,定义子系统1当中的一个状态分量为物体1的位移,即x
11
=P1;另一个状态分量为物体1的速度,即x
12
=V1;子系统1的控制输入为施加在物体1上的外力,即子系统1的扰动输入为物体1所受的摩擦力,即v1(x1)=f
μ1
。同理,定义子系统2当中的一个状态分量为物体2的位移,即x
21
=P2;另一个状态分量为物体2的速度,即x
22
=V2;子系统2的控制输入为施加在物体2上的外力,即子系统2的扰动输入为物体2所受的摩擦力,即v2(x2)=f
μ2
。因此,得到以下形式:
[0014][0015][0016]其中,和分别表示系统1和2的整体状态,x
11
和x
12
为子系统1当中的两个系统状态,x
21
和x
22
为子系统2当中的两个系统状态。与此同时,和分别表示系统1和2的整体状态对时间的导数。和为子系统1当中的两个子系统状态对时间的导数,和为子系统2当中的两个系统状态对时间的导数。和v1(x1)和v2(x2)分别表示子系统1和子系统2的反馈控制输入和干扰输入。另外,Z1(x)=K2(x
21

x
11
)+C2(x
22

x
12
)和Z2(x)=K2(x
11

x
21
)+C2(x
12

x
22
)为两个子系统的相互关联项。由此可见,在这个弹簧

质量

阻尼系统中,弹簧K2和阻尼器C2对这两个子系统的关联起着重要作用。
[0017]综上所述,对于弹簧

质量

阻尼关联系统的研究,关键在于通过所设计的分散跟踪控制器,使得机械系统的实际状态跟踪上所期望的设定值。
[0018]基于以上对弹簧

质量

阻尼器系统的描述,分散跟踪控制器的设计步骤可划分为三部分。首先,对分散跟踪控制策略的介绍,包括跟踪问题描述以及相关问题转换;然后,采用最优控制方案,给出具体算法的实现过程;最后,详细说明了评判网络在线训练的过程。
[0019]本技术的创新之处主要体现在:利用新的ADP方法解决一类带有外部干扰的弹簧

质量

阻尼关联机械系统的跟踪期望轨迹问题。结合DTC相关原理,本专利技术利用了两个评判网络进行在线训练。整个训练过程中,在传统的权值更新基础上额外引入了一个稳定项,以保证系统的稳定性。整体来说,本专利技术采用了DTC算法和改进的在线训练方式,最终实现了弹簧

质量
‑本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.弹簧

质量

阻尼关联系统的一种分散式智能评判跟踪控制方法,其特征在于:即弹簧

质量

阻尼器实例系统中,M1和M2表示两个物体的质量,K1,K2和K3表示三个弹簧的刚度常数,C1,C2和C3表示三个阻尼器的阻尼;另外,P1和P2、V1和V2、F1和F2、f
μ1
和f
μ2
分别表示两个物体的位移、速度、施加在物体上的力和物体所受的摩擦力;对于物体M1,其动力学系统如下:其中,表示对物体M1的位移求导数,即得到物体M1的速度V1;表示对物体M1的速度求导数,即得到物体M1的加速度,根据牛顿第二定理便可得到以上物体M1的动力学方程;对于物体M2,其动力学系统如下:其中,表示对物体M2的位移求导数,即得到物体M2的速度V2;表示对物体M2的速度求导数,即得到物体M2的加速度,根据牛顿第二定理便可得到以上物体M2的动力学方程;在此,定义子系统1当中的一个状态分量为物体1的位移,即x
11
=P1;另一个状态分量为物体1的速度,即x
12
=V1;子系统1的控制输入为施加在物体1上的外力,即子系统1的扰动输入为物体1所受的摩擦力,即v1(x1)=f
μ1
;同理,定义子系统2当中的一个状态分量为物体2的位移,即x
21
=P2;另一个状态分量为物体2的速度,即x
22
=V2;子系统2的控制输入为施加在物体2上的外力,即子系统2的扰动输入为物体2所受的摩擦力,即v2(x2)=f
μ2
;因此,得到以下形式:;因此,得到以下形式:其中,x1=[x
11
,x
12
]
T
和x2=[x
21
,x
22
]
T
分别表示系统1和2的整体状态,x
11
和x
12
为子系统1当中的两个系统状态,x
21
和x
22
为子系统2当中的两个系统状态;与此同时,和分别表示系统1和2的整体状态对时间的导数;和为子系统1当中的两个子系统状态对时间的导数,和为子系统2当中的两个系统状态对时间的导数;和v1(x1)和v2(x2)分别表示子系统1和子系统2的反馈控制输入和干扰输入;另外,Z1(x)=K2(x
21

x
11
)+C2(x
22

x
12
)和Z2(x)=K2(x
11

x
21
)+C2(x
12

x
22
)为两个子系统的相互关联项;基于以上对弹簧

质量

阻尼器系统的描述,分散跟踪控制器的设计步骤可划分为三部
分;首先,对分散跟踪控制策略的介绍,包括跟踪问题描述以及相关问题转换;然后,采用最优控制方案,给出具体算法的实现过程;最后,详细说明了评判网络在线训练的过程;问题描述及其转化将弹簧

质量

阻尼器关联系统的跟踪问题进行转化,通过原系统与期望轨迹作差得到误差系统,对误差系统进行调节控制,使得原系统的跟踪误差为零,最终完成原系统的跟踪任务;上述关联机械系统用如下连续时间非线性系统描述:其中,i=1,2,x
i
为第i个系统的状态,为第i个系统状态对时间的导数,x为整个系统的状态,为第i个子系统的反馈控制输入、v
i
(x
i
)为第i个子系统的扰动输入;f
i
(x
i
)、g
i
(x
i
)、h
i
(x
i
)、Z
i
(x)依次表示第i个子系统的非线性内部动力学、输入增益矩阵、扰动增益矩阵和互连项;互联项的界限设定如下:其中,||Z
i
(x)||代表互联项的范数,j=1,2,α
ij
是非负常数,l
ij
(x
j
)是半正定函数,l
j
(x
j
)和β
ij
都是非负常数;此外,定义l
j
(x
j
)=max{l
1j
(x
j
),l
2j
(x
j
)},β
ij
≥α
ij
l
ij
(x
j
)/l
j
(x
j
);根据非线性系统(5),研究轨迹跟踪控制问题,其参考系统定义如下:式中,r
i
为参考状态,为参考状态对时间的导数,r1=[r
11
,r
12
]
T
和r2=[r
21
,r
22
]
T
分别表示系统1和2的整体参考状态期望轨迹,r
11
和r
12
为子系统1当中的两个参考状态,r
21
和r
22
为子系统2当中的两个参考状态;与此同时,和分别表示系统1和2的整体参考状态对时间的导数;和为子系统1当中的两个参考状态对时间的导数,和为子系统2当中的两个参考状态对时间的导数;ζ
i
(r
i
)为满足ζ
i
(0)=0的局部Lipschitz函数;定义第i个子系统的轨迹跟踪误差e
i
为实际状态与期望轨迹之差,即e
i
=x
i

r
i
,则跟踪误差动态系统描述为:其中,e
i
为跟踪误差,为跟踪误差对时间的导数,与此同时,e1=[e
11
,e
12
]
T
=[x
11

r
11
,x
12

r
12
]
T
和e2=[e
21
,e
22
]
T
=[x
21

r
21
,x
22

r
22
]
T
分别表示子系统1和子系统2的跟踪误差状态,e
11
和e
12
为子系统1当中的两个跟踪误差状态,e
...

【专利技术属性】
技术研发人员:王鼎范文倩
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1