一种基于长短期记忆网络的控制律自动设计方法技术

技术编号：40968859 阅读：5 留言：0更新日期：2024-04-18 20:50

本发明专利技术一种基于长短期记忆网络的控制律自动设计方法，借鉴深度学习中网络架构搜索方法经验，利用循环神经网络在时序关联性发掘方面的优势，将控制律结构设计问题转化为有向无环图拓扑关系自动搜索问题，实现飞行控制律控制结构的自动生成，并基于遗传算法实现给定控制律结构下参数的自动整定，目的在于克服当前控制律自动优化只能针对已知控制器结构利用启发式算法对控制器参数进行自动整定的局限，降低了人工设计工作量，提升了复杂设计输入条件下的控制效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于长短期记忆网络的控制律自动设计方法，属于飞行器控制系统设计领域。

技术介绍

1、目前，控制律设计以人工设计为主，根据不同的功能要求先选定控制律结构，之后主要由设计人员根据被控对象特性完成控制律参数的人工调节，以适应特定的控制任务，对设计人员的设计经验要求较高，且调参过程主要依靠试凑，效率较低，费时费力。

2、目前人工智能技术发展迅猛，其中基于深度学习的目标识别算法得到广泛应用。但与控制律设计过程类似，各类目标识别神经网络的结构和权重设计问题往往需要人工试凑，耗费大量人力和时间。为了解决上述痛点，结合探索-试错启发式搜索的神经网络架构搜索(nas)技术应运而生，实现了神经网络架构及权重的自动寻优，降低人工设计难度。

3、但上述方法只适应于神经网络架构和权重的自动设计，无法解决控制器结构和参数的自动设计问题，目前存在的一些控制器参数自动整定方法，如灰狼算法、布谷鸟算法等，只能在给定控制器结构前提下进行参数调节，整体设计效率有待提升，需要借鉴神经网络架构和权重自动设计思路，给出一种一体化的控制器自动设计方法。

技术实现思路

1、本专利技术的目的在于：克服现有技术的不足，提供一种基于长短期记忆网络的控制律自动设计方法，实现了控制器结构和参数的一体化自动设计，降低了设计难度，提升了复杂设计输入条件下的控制效果。

2、本专利技术的技术方案予为：一种基于长短期记忆网络的控制律自动设计方法，包括：

3、通过bode图方式分析被控

4、按照基本控制器和滤波器两部分，拆分出每个级联层中可供选择的结构模块，形成级联控制器可行搜索空间；

5、根据得到的级联控制器可行搜索空间，建立基于长短期记忆网络lstm的结构生成器，完成串级控制器每层结构的循环生成；同时设定长短期记忆网络lstm隐层神经网络数量，并根据级联控制器每层可选结构数量明确长短期记忆网络lstm结构生成器输出分类个数；

6、对可行搜索空间组合成的任意控制器结构，设计统一可行的参数整定方法，分别给出基本控制器和滤波器部分的参数整定算法，确定待整定参数数量、参数可能的取值范围，构建能评价任意结构下控制器参数好坏的适应度函数；

7、结合步得到的基于长短期记忆网络lstm的结构生成器和参数整定方法，建立内外环分步优化的一体化训练学习架构，分别对外环的长短期记忆网络lstm结构生成器参数和内环的控制律参数进行训练，完成级联控制器结构和参数的一体化自动生成；

8、提取自动生成的适应度分数最高的级联控制器，通过bode图等方式分析加入控制器后的幅频特性，完成时域仿真及数据分析，分析是否满足设计要求，如果不能满足则调整超参数设置重新设计，直至满足设计要求。

9、所述通过bode图等方式分析被控对象幅频特性，根据刚体、弹性稳定条件，得到基本控制器形式和滤波器个数，将控制器结构转化为nl层典型单元级联的形式，包括：

10、将所有控制环节归一化到前向通道写成若干典型模块串行级联的形式，对任意闭环反馈系统，假设c(s)为控制器传递函数，考虑到任意控制器均可写成nl个传递函数相乘形式，即将控制器设置为nl层控制器串行级联的形式，则控制器传递函数c(s)：

11、

12、其中，表示第l层控制单元从典型模块中挑选出的一个传递函数,ncl表示每一层可选的传递函数介数。

13、所述按照基本控制器和滤波器两部分，包括：所述串级控制器由基本控制器和多个滤波器级联组成；对实际飞行器，除具有刚体特性外还存在多种高频弹性谐振模态，先确定一个基本控制器用于完成飞行器刚性模态的稳定控制，然后针对弹性谐振模态设计多个滤波器，最后反复调整控制器参数以达到整体性能最优。

14、根据具体被控对象特性及控制性能指标不同，基本控制器包括pid控制器、鲁棒控制器、lqr控制器、滑模控制器。

15、所述建立基于长短期记忆网络lstm的结构生成器，完成串级控制器每层结构的循环生成；同时设定长短期记忆网络lstm隐层神经网络数量，并根据级联控制器每层可选结构数量明确长短期记忆网络lstm结构生成器输出分类个数，包括：考虑到每层结构的选择是有关联性的，为完成串级控制器结构的逐层生成，利用长短期记忆网络lstm构建分类器，以自回归方式对每层结构类型进行分类，即将前一步的决策作为输入用于生成下一层的输出，而在第一步将0作为输入，生成器按照时序循环地生成每层的滤波器结构选择；长短期记忆网络lstm循环次数等于要生成的串级控制器层数；同时根据问题复杂程度设定长短期记忆网络lstm隐层神经网络数量。

16、所述设计统一可行的参数整定方法，分别给出基本控制器和滤波器部分的参数整定算法，确定待整定参数数量、参数可能的取值范围，构建能评价任意结构下控制器参数好坏的适应度函数，包括：针对每种可能的结构需要自动完成控制器参数ηc的设计；所述控制器参数ηc分为两部分，包括基本控制器参数ηbase和其它参数ηoth，参数需要在满足指定幅值裕度和相位裕度的同时尽可能扩大控制带宽；确定控制器参数种类后，根据经验给出待整定参数可能的取值范围，并构建适用于评价任意结构下控制器参数好坏的适应度函数；所述适应度函数根据被控对象特性和指标要求进行具体设置。

17、针对ηbase和ηoth两部分参数，分别采用不同的优化方法来整定参数；对于基本控制器的参数ηbase采用相应的自整定理论完成控制器参数整定，采用pid参数自动整定方法，而对于其它参数ηoth采用以基于遗传算法为代表的启发式方法进行参数整定。

18、所述步建立内外环分步优化的一体化训练学习架构，分别对外环的长短期记忆网络lstm结构生成器参数和内环的控制律参数进行训练，完成级联控制器结构和参数的一体化自动生成，包括：整个训练过程中，包括两组可学习的参数，即长短期记忆网络lstm参数θ和控制器参数ω；训练过程采用分步式的一体化训练方法，包括两个相互交错的阶段，第一阶段训练滤波器的控制器参数ω，从整体上通过参数自动整定方法优化参数，第二阶段训练长短期记忆网络lstm参数θ，两个阶段交替进行，训练总轮数根据问题复杂程度和收敛情况设置。

19、所述提取自动生成的适应度分数最高的级联控制器，通过bode图等方式分析加入控制器后的幅频特性，完成时域仿真及数据分析，分析是否满足设计要求，如果不能满足则调整超参数设置重新设计，包括：一体化训练学习完成后提取奖励分数最高的一组控制器，通过bode图方式分析加入控制器后幅频特性变化，完成时域仿真和数据分析，并根据传统分析方法分析是否满足设计指标要求，如果不能满足则调整超参数设置重新开始训练学习迭代优化，直到满足要求后，完成控制律自动设计。

20、所述超参数包括长短期记忆网络lstm结构生成器中的参数以及训练过程中的各种参本文档来自技高网...

【技术保护点】

1.一种基于长短期记忆网络的控制律自动设计方法，其特征在于，包括：

2.根据权利要求1所述的基于长短期记忆网络的控制律自动设计方法，其特征在于：所述通过bode图等方式分析被控对象幅频特性，根据刚体、弹性稳定条件，得到基本控制器形式和滤波器个数，将控制器结构转化为Nl层典型单元级联的形式，包括：

3.根据权利要求1所述的一种基于长短期记忆网络的控制律自动设计方法，其特征在于，所述按照基本控制器和滤波器两部分，包括：所述串级控制器由基本控制器和多个滤波器级联组成；对实际飞行器，除具有刚体特性外还存在多种高频弹性谐振模态，先确定一个基本控制器用于完成飞行器刚性模态的稳定控制，然后针对弹性谐振模态设计多个滤波器，最后反复调整控制器参数以达到整体性能最优。

4.根据权利要求3所述的一种基于长短期记忆网络的控制律自动设计方法，其特征在于，根据具体被控对象特性及控制性能指标不同，基本控制器包括PID控制器、鲁棒控制器、LQR控制器、滑模控制器。

5.根据权利要求1所述的一种基于长短期记忆网络的控制律自动设计方法，其特征在于，所述建立基于长短期记

6.根据权利要求1所述的一种基于长短期记忆网络的控制律自动设计方法，其特征在于，所述设计统一可行的参数整定方法，分别给出基本控制器和滤波器部分的参数整定算法，确定待整定参数数量、参数可能的取值范围，构建能评价任意结构下控制器参数好坏的适应度函数，包括：针对每种可能的结构需要自动完成控制器参数ηC的设计；所述控制器参数ηC分为两部分，包括基本控制器参数ηbase和其它参数ηoth，参数需要在满足指定幅值裕度和相位裕度的同时尽可能扩大控制带宽；确定控制器参数种类后，根据经验给出待整定参数可能的取值范围，并构建适用于评价任意结构下控制器参数好坏的适应度函数；所述适应度函数根据被控对象特性和指标要求进行具体设置。

7.根据权利要求6所述的一种基于长短期记忆网络的控制律自动设计方法，其特征在于，针对ηbase和ηoth两部分参数，分别采用不同的优化方法来整定参数；对于基本控制器的参数ηbase采用相应的自整定理论完成控制器参数整定，采用PID参数自动整定方法，而对于其它参数ηoth采用以基于遗传算法为代表的启发式方法进行参数整定。

8.根据权利要求1所述的一种基于长短期记忆网络的控制律自动设计方法，其特征在于，所述步建立内外环分步优化的一体化训练学习架构，分别对外环的长短期记忆网络LSTM结构生成器参数和内环的控制律参数进行训练，完成级联控制器结构和参数的一体化自动生成，包括：整个训练过程中，包括两组可学习的参数，即长短期记忆网络LSTM参数θ和控制器参数ω；训练过程采用分步式的一体化训练方法，包括两个相互交错的阶段，第一阶段训练滤波器的控制器参数ω，从整体上通过参数自动整定方法优化参数，第二阶段训练长短期记忆网络LSTM参数θ，两个阶段交替进行，训练总轮数根据问题复杂程度和收敛情况设置。

9.根据权利要求1所述的一种基于长短期记忆网络的控制律自动设计方法，其特征在于，所述提取自动生成的适应度分数最高的级联控制器，通过bode图等方式分析加入控制器后的幅频特性，完成时域仿真及数据分析，分析是否满足设计要求，如果不能满足则调整超参数设置重新设计，包括：一体化训练学习完成后提取奖励分数最高的一组控制器，通过bode图方式分析加入控制器后幅频特性变化，完成时域仿真和数据分析，并根据传统分析方法分析是否满足设计指标要求，如果不能满足则调整超参数设置重新开始训练学习迭代优化，直到满足要求后，完成控制律自动设计。

10.根据权利要求9所述的一种基于长短期记忆网络的控制律自动设计方法，其特征在于，所述超参数包括长短期记忆网络LSTM结构生成器中的参数以及训练过程中的各种参数。

...

【技术特征摘要】

1.一种基于长短期记忆网络的控制律自动设计方法，其特征在于，包括：

2.根据权利要求1所述的基于长短期记忆网络的控制律自动设计方法，其特征在于：所述通过bode图等方式分析被控对象幅频特性，根据刚体、弹性稳定条件，得到基本控制器形式和滤波器个数，将控制器结构转化为nl层典型单元级联的形式，包括：

4.根据权利要求3所述的一种基于长短期记忆网络的控制律自动设计方法，其特征在于，根据具体被控对象特性及控制性能指标不同，基本控制器包括pid控制器、鲁棒控制器、lqr控制器、滑模控制器。

5.根据权利要求1所述的一种基于长短期记忆网络的控制律自动设计方法，其特征在于，所述建立基于长短期记忆网络lstm的结构生成器，完成串级控制器每层结构的循环生成；同时设定长短期记忆网络lstm隐层神经网络数量，并根据级联控制器每层可选结构数量明确长短期记忆网络lstm结构生成器输出分类个数，包括：考虑到每层结构的选择是有关联性的，为完成串级控制器结构的逐层生成，利用长短期记忆网络lstm构建分类器，以自回归方式对每层结构类型进行分类，即将前一步的决策作为输入用于生成下一层的输出，而在第一步将0作为输入，生成器按照时序循环地生成每层的滤波器结构选择；长短期记忆网络lstm循环次数等于要生成的串级控制器层数；同时根据问题复杂程度设定长短期记忆网络lstm隐层神经网络数量。

6.根据权利要求1所述的一种基于长短期记忆网络的控制律自动设计方法，其特征在于，所述设计统一可行的参数整定方法，分别给出基本控制器和滤波器部分的参数整定算法，确定待整定参数数量、参数可能的取值范围，构建能评价任意结构下控制器参数好坏的适应度函数，包括：针对每种可能的结构需要自动完成控制器参数ηc的设计；所述控制器参数ηc分为两...

【专利技术属性】
技术研发人员：王昭磊，禹春梅，路坤锋，王露荻，林平，李晓敏，骆无意，黄旭，巩庆海，贾晨辉，胡瑞光，林玉野，翟雯婧，周辉，王晓峰，
申请(专利权)人：北京航天自动控制研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人