基于强化学习的大型柔性结构传感器作动器优化配置方法技术

技术编号:34632598 阅读:11 留言:0更新日期:2022-08-24 15:05
本发明专利技术公开了一种基于强化学习的大型柔性结构传感器作动器优化配置方法,首先建立系统动力学模型,再将动力学模型转换到模态空间中表示,根据系统的动态方程和边界条件获得多自由度振动系统的各阶固有频率和相应的振型,然后将多自由度振动系统由模态空间转换到状态空间模型,接下来建立优化目标函数,最后采用强化学习策略的粒子群优化算法进行优化配置。本发明专利技术方法使得配置结果更加合理,有效提高了主动振动控制的性能。高了主动振动控制的性能。高了主动振动控制的性能。

【技术实现步骤摘要】
基于强化学习的大型柔性结构传感器作动器优化配置方法


[0001]本专利技术属于空间结构控制
,具体涉及一种大型柔性结构传感器作动器优化配置方法。

技术介绍

[0002]随着航天事业的蓬勃发展,火箭发射成功率和载荷能力的不断提高,空间大型结构的需求量变得越来越大。受制于载体空间,现代空间大型结构均被设计成可折叠和展开的形式而被大量采用。现代空间结构正朝着结构大型化、质量轻型化,刚度柔性化的方向不断发展,如大型空间站结构件、太阳能帆板和大型空间天线等。由于此类结构具有柔性大、固有频率低、模态密集等特点,在空间无阻尼的环境中一旦发生振动,将会对整个系统的稳定性和工作性能造成严重影响。
[0003]目前对空间大型柔性结构振动问题的研究主要集中在控制方法的研究上,对如何确定作动器的个数和位置问题研究较少。事实上,在大型柔性的振动控制研究中,传感器和作动器的数量和位置优化是一个十分重要的问题,其优化的结果好坏将直接影响控制的优劣。针对大型柔性结构传感器与作动器的优化配置,目前的研究主要可以分为以下两个方面:(1)作动器/传感器优化准则的研究,在这一方面国外的专家学者研究的起点比较早,因此国内的研究基本都是参考国外的研究成果。其中具有代表性的有基于Gram矩阵的系统可控/可观性准则,AMI ARBEL和A HAC等人对基于Gram矩阵的可控性/可观性准则分别做了详细的推导,由此验证了该准则的有效性;基于系统能量的准则也受到学术界的重视并且对其进行了广泛的应用,比如,Schula和Heimbold首次提出了基于系统能量耗散的作动器/传感器优化配置准则;基于系统可靠性的优化准则,由于传感器和作动器存在失效的风险,考虑如何配置使得在个别传感器和作动器失效的情况下仍能满足控制要求;还有考虑控制/观测溢出的优化准则等等。然后根据所求解的具体问题进行分析,选择相应的优化准则。(2)优化算法的研究,目前国内外学者在这方面做出了很多研究,但主要是集中在群体智能优化方法的研究上,如模拟退火算法、粒子群算法和遗传算法及这些方法的相关变体。
[0004]虽然针对大型柔性结构主动振动控制的传感器和作动器优化配置已有大量可行方法,但仍然存在问题。要么在寻优过程中由于计算复杂度过大导致收敛速度慢,要么假设配置数目已知只优化传感器和作动器的位置;相应的优化准则设置存在很大的改进空间,使得最终的优化结果并不理想。

技术实现思路

[0005]为了克服现有技术的不足,本专利技术提供了一种基于强化学习的大型柔性结构传感器作动器优化配置方法,首先建立系统动力学模型,再将动力学模型转换到模态空间中表示,根据系统的动态方程和边界条件获得多自由度振动系统的各阶固有频率和相应的振型,然后将多自由度振动系统由模态空间转换到状态空间模型,接下来建立优化目标函数,最后采用强化学习策略的粒子群优化算法进行优化配置。本专利技术方法使得配置结果更加合
理,有效提高了主动振动控制的性能。
[0006]本专利技术解决其技术问题所采用的技术方案包括如下步骤:
[0007]步骤1:建立系统动力学模型;
[0008]针对多自由度振动系统,通过拉格朗日法建立系统的动力学模型如下:
[0009][0010]y=P
s
x
[0011]其中M、C和K分别表示系统整体结构的质量矩阵、阻尼矩阵和刚度矩阵,P
a
、P
s
分别是作动器和传感器的位置矩阵,f
c
为作动器施加的作动力;x、y分别表示结构振动的位移和传感器处的观测值;
[0012]步骤2:将动力学模型转换到模态空间中表示,根据系统的动态方程和边界条件获得多自由度振动系统的各阶固有频率和相应的振型:
[0013][0014]其中Φ
i
和q
i
分别表示第i阶模态振型和模态空间坐标,由此可知振动位移为无穷阶模态的叠加;
[0015]通过模态截断法将系统的振动近似表示为前n
c
阶模态的叠加,即:
[0016][0017]其中,n
c
为所取阶数;
[0018]步骤3:将多自由度振动系统由模态空间转换到状态空间模型;
[0019]步骤4:建立优化目标函数;
[0020]步骤4

1:最大化作动器传递到柔性结构上的能量表示为:
[0021]max[trace(W
c
)][0022]前n
c
阶模态的每阶模态的最佳控制效果表示为:
[0023][0024]其中,W
c
为可控性格拉姆矩阵,σ(λ
ic
)为可控格拉姆矩阵特征值λ
ic
的标准差,n表示选取的模态阶数;
[0025]由此导出作动器综合指标为:
[0026][0027]步骤4

2:最大化传感器输出能量:
[0028]max[trace(W
o
)][0029]前n
c
阶模态的每阶模态的最佳观测效果表示为:
[0030][0031]W
o
为可观性格拉姆矩阵,σ(λ
io
)为可观格拉姆矩阵特征值λ
io
的标准差;
[0032]由此导出传感器综合指标为:
[0033][0034]步骤4

3:对于剩余模态,其对系统的影响越小越好,对应的指标越小越好,即:
[0035][0036][0037]其中,W
uc
为剩余模态的可控性格拉姆矩阵,σ(λ
iuc
)为剩余模态可控性格拉姆矩阵特征值λ
iuc
的标准差;W
uo
为剩余模态的可观性格拉姆矩阵,σ(λ
iuo
)为剩余模态可观性格拉姆矩阵特征值λ
iuo
的标准差;
[0038]步骤4

4:综合考虑截断模态和剩余模态,基于最大最小化方法得到最终的目标优化函数:
[0039]作动器:
[0040][0041]其中,ρ1为权重系数;
[0042]传感器:
[0043][0044]其中,ρ2为权重系数;
[0045]步骤5:采用强化学习策略的粒子群优化算法进行优化配置;
[0046]步骤5

1:初始化粒子种群,粒子群优化算法中的粒子指代传感器和作动器,则在三维空间中有以下位置向量需要进行初始化:
[0047]粒子的当前位置向量x
i
=[x
i1
,x
i2
,x
i3
],x
i1
,x
i2
,x
i3
为三维坐标轴上的标量表示;
[0048]搜索空间中所有粒子中的历史个体最优位置pbest
i
=[pbes本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的大型柔性结构传感器作动器优化配置方法,其特征在于,包括如下步骤:步骤1:建立系统动力学模型;针对多自由度振动系统,通过拉格朗日法建立系统的动力学模型如下:y=P
s
x其中M、C和K分别表示系统整体结构的质量矩阵、阻尼矩阵和刚度矩阵,P
a
、P
s
分别是作动器和传感器的位置矩阵,f
c
为作动器施加的作动力;x、y分别表示结构振动的位移和传感器处的观测值;步骤2:将动力学模型转换到模态空间中表示,根据系统的动态方程和边界条件获得多自由度振动系统的各阶固有频率和相应的振型:其中Φ
i
和q
i
分别表示第i阶模态振型和模态空间坐标,由此可知振动位移为无穷阶模态的叠加;通过模态截断法将系统的振动近似表示为前n
c
阶模态的叠加,即:其中,n
c
为所取阶数;步骤3:将多自由度振动系统由模态空间转换到状态空间模型;步骤4:建立优化目标函数;步骤4

1:最大化作动器传递到柔性结构上的能量表示为:max[trace(W
c
)]前n
c
阶模态的每阶模态的最佳控制效果表示为:其中,W
c
为可控性格拉姆矩阵,σ(λ
ic
)为可控格拉姆矩阵特征值λ
ic
的标准差,n表示选取的模态阶数;由此导出作动器综合指标为:步骤4

2:最大化传感器输出能量:max[trace(W
o
)]前n
c
阶模态的每阶模态的最佳观测效果表示为:
W
o
为可观性格拉姆矩阵,σ(λ
io
)为可观格拉姆矩阵特征值λ
io
的标准差;由此导出传感器综合指标为:步骤4

3:对于剩余模态,其对系统的影响越小越好,对应的指标越小越好,即:3:对于剩余模态,其对系统的影响越小越好,对应的指标越小越好,即:其中,W
uc
为剩余模态的可控性格拉姆矩阵,σ(λ
iuc
)为剩余模态可控性格拉姆矩阵特征值λ
iuc
的标准差;W
uo
为剩余模态的可观性格拉姆矩阵,σ(λ
iuo
)为剩余模态可观性格拉姆矩阵特征值λ
iuo
的标准差;步骤4

4:综合考虑截断模态和剩余模态,基于最大最小化方法得到最终的目标优化函数:作动器:其中,ρ...

【专利技术属性】
技术研发人员:黄攀峰赵卫建张帆张夷斋
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1