一种伺服控制系统及神经网络前馈控制器训练方法技术方案

技术编号:36803806 阅读:15 留言:0更新日期:2023-03-09 00:02
本发明专利技术涉及一种伺服控制系统及神经网络前馈控制器训练方法,包括:加减运算器、反馈控制器、神经网络前馈控制器、加法运算器和被控对象;采用迭代学习控制方法学习多个不同参考轨迹的最优前馈控制信号,确定神经网络的输入与输出;选择神经网络的架构与训练算法,利用遗传算法优化神经网络的超参数,根据参考轨迹和最优前馈控制信号训练神经网络前馈控制器,建立参考轨迹与最优前馈控制信号之间的映射关系;在伺服运动控制中,神经网络前馈控制器根据参考轨迹实时预测最优前馈控制信号,补偿参考轨迹引入的轨迹跟踪误差。本发明专利技术综合了迭代学习控制与神经网络的优点,使得伺服控制系统在重复性运动与非重复性运动中均能实现优良的轨迹跟踪性能。良的轨迹跟踪性能。良的轨迹跟踪性能。

【技术实现步骤摘要】
一种伺服控制系统及神经网络前馈控制器训练方法


[0001]本专利技术涉及伺服控制
,特别是涉及一种伺服控制系统及神经网络前馈控制器训练方法。

技术介绍

[0002]运动系统作为众多加工、制造、检测装备的核心部件,在工业生产、国防建设等领域发挥着重要作用,其伺服控制性能直接决定着上述装备的整机性能。在伺服控制系统中,采用前馈控制来减小参考轨迹引入的轨迹跟踪误差,以提高轨迹跟踪性能。迭代学习控制是典型的前馈控制方法,它根据上一次轨迹跟踪任务的前馈控制信号和轨迹跟踪误差,来修正下一次轨迹跟踪任务的前馈控制信号,通过多次迭代获得最优前馈控制信号。相比于其他前馈控制方法,迭代学习控制在重复性运动系统中具有更优的轨迹跟踪性能。
[0003]然而,迭代学习控制仅适用于重复性运动系统,当参考轨迹变化时,其性能会急剧恶化。因此,亟待提出一种前馈控制方法,既能发挥迭代学习控制在重复性轨迹跟踪任务中的优势,同时能保证对不同轨迹跟踪任务的适应性,使得伺服控制系统在重复性运动与非重复性运动中均能实现优良的轨迹跟踪性能。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种伺服控制系统及神经网络前馈控制器训练方法。
[0005]一种伺服控制系统,包括:加减运算器、反馈控制器、神经网络前馈控制器、加法运算器和被控对象;
[0006]所述加减运算器的输入端连接参考轨迹和所述被控对象的输出端;所述加减运算器的输出端连接所述反馈控制器的输入端;所述神经网络前馈控制器的输入端连接参考轨迹;所述反馈控制器的输出端和所述神经网络前馈控制器的输出端连接所述加法运算器的输入端;所述加法运算器的输出端连接所述被控对象的输入端;
[0007]所述加减运算器获取参考轨迹和所述被控对象输出的位置信号,进行求差运算生成轨迹跟踪误差,将轨迹跟踪误差输出至所述反馈控制器;所述反馈控制器根据轨迹跟踪误差生成反馈控制信号;所述神经网络前馈控制器根据参考轨迹实时预测最优前馈控制信号;所述加法运算器获取所述反馈控制器输出的反馈控制信号和所述神经网络前馈控制器输出的最优前馈控制信号,进行求和运算生成总控制信号,将总控制信号输出至所述被控对象;所述被控对象在总控制信号的驱动下进行轨迹跟踪运动。
[0008]在伺服运动控制中,神经网络前馈控制器根据参考轨迹实时预测最优前馈控制信号,补偿参考轨迹引入的轨迹跟踪误差。
[0009]一种伺服控制系统的神经网络前馈控制器训练方法,具体步骤包括:
[0010]步骤一,采用迭代学习控制方法学习多个不同参考轨迹的最优前馈控制信号,确定神经网络的输入与输出;
[0011]步骤二,选择神经网络的架构与训练算法;
[0012]步骤三,利用遗传算法优化神经网络的隐层数、隐层神经元数、权重初始值和学习率等超参数,根据参考轨迹和最优前馈控制信号训练神经网络前馈控制器,建立参考轨迹与最优前馈控制信号之间的映射关系。
[0013]所述神经网络的输入为当前时刻与之前若干时刻的参考轨迹、参考轨迹的多阶导数,所述神经网络的输出为最优前馈控制信号。
[0014]由于最优前馈控制信号具有时序性,所述神经网络的架构可选择为带有输入延迟的时间序列神经网络、循环神经网络。
[0015]当神经网络的权重总数小于1000时可选择Levenberg

Marquardt算法或拟牛顿算法训练神经网络,当神经网络规模的权重总数大于等于1000时可选择共轭梯度法。
[0016]采用遗传算法优化神经网络的超参数的具体步骤包括:
[0017]步骤1,初始化,记进化次数j=0,设置超参数的取值范围,选择编码方式;一组超参数值的集合视为遗传算法中的一个个体;确定个体数n,所有个体构成种群;随机生成初始个体,对初始个体进行编码后获得初始种群;采用神经网络前馈控制器的预测输出与期望输出间的均方误差设计适应度函数;确定选择、交叉操作方式,设置交叉概率与变异概率;设置进化终止条件;
[0018]步骤2,依次采用初始种群中每个个体的超参数值,对神经网络进行训练,根据适应度函数计算个体适应度值;
[0019]步骤3,根据个体适应度值确定每个个体的被选概率;根据被选概率,对种群中的个体进行n次选取,将选出的个体放入中间种群;
[0020]步骤4,将中间种群的个体两两配对,每对个体分配一个随机数,将随机数与交叉概率比较,若随机数小于交叉概率则两个体进行交叉操作,交叉操作产生的两个新个体取代原个体放入中间种群;否则不进行交叉操作,原个体保留在中间种群里;
[0021]步骤5,给中间种群里的每个个体分配一个随机数,将随机数与变异概率比较,若随机数小于变异概率,则该个体进行变异操作,变异操作产生的新个体取代原个体放入中间种群;否则不进行变异操作,原个体保留在中间种群里;
[0022]步骤6,变异操作后的中间种群为第j+1次进化产生的新种群,对新种群中的每个个体进行解码,解码的结果即为更新后的超参数值,采用更新后的超参数对神经网络进行训练,根据适应度函数计算个体适应度值;
[0023]步骤7,判断进化结果是否满足进化终止条件,若满足进化终止条件则结束进化,新种群中适应度值最高的个体的超参数即为最优超参数;否则,返回步骤3。
[0024]本专利技术中的伺服控制系统包括加减运算器、反馈控制器、神经网络前馈控制器、加法运算器和被控对象;伺服控制系统的神经网络前馈控制器训练方法为:采用迭代学习控制方法学习多个不同参考轨迹的最优前馈控制信号,确定神经网络的输入与输出,选择神经网络的架构与训练算法,利用遗传算法优化神经网络的超参数,根据参考轨迹和最优前馈控制信号训练神经网络前馈控制器。在伺服运动控制中,神经网络前馈控制器根据参考轨迹实时预测最优前馈控制信号,补偿参考轨迹引入的轨迹跟踪误差。本专利技术综合了迭代学习控制与神经网络的优点,使得伺服控制系统在重复性运动与非重复性运动中均能实现优良的轨迹跟踪性能。
附图说明
[0025]下面将结合附图及实施例对本专利技术作进一步说明,附图中:
[0026]图1为本专利技术一个实施例中伺服控制系统的结构示意图;
[0027]图2为本专利技术一个实施例中被控对象的伯德图;
[0028]图3为本专利技术一个实施例中伺服控制系统的神经网络前馈控制器训练方法的流程示意图;
[0029]图4为本专利技术一个实施例中所使用的参考轨迹曲线图;
[0030]图5为本专利技术一个实施例中本专利技术方法与迭代学习控制方法重复跟踪轨迹1时的轨迹跟踪误差对比图;
[0031]图6为本专利技术一个实施例中参考轨迹从轨迹1变化为轨迹2时本专利技术方法与迭代学习控制方法的轨迹跟踪误差对比图。
具体实施方式
[0032]本专利技术公开了一种伺服控制系统及神经网络前馈控制器训练方法,为了更清楚、全面地展示本专利技术特点与优势,下面将基于本专利技术的一个实施例,结合附图进行详细阐述。
[0033]本实施例中,伺服控制系统如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种伺服控制系统,其特征在于,包括:加减运算器、反馈控制器、神经网络前馈控制器、加法运算器和被控对象;所述加减运算器的输入端连接参考轨迹和所述被控对象的输出端;所述加减运算器的输出端连接所述反馈控制器的输入端;所述神经网络前馈控制器的输入端连接参考轨迹;所述反馈控制器的输出端和所述神经网络前馈控制器的输出端连接所述加法运算器的输入端;所述加法运算器的输出端连接所述被控对象的输入端;所述加减运算器获取参考轨迹和所述被控对象输出的位置信号,进行求差运算生成轨迹跟踪误差,将轨迹跟踪误差输出至所述反馈控制器;所述反馈控制器根据轨迹跟踪误差生成反馈控制信号;所述神经网络前馈控制器根据参考轨迹实时预测最优前馈控制信号;所述加法运算器获取所述反馈控制器输出的反馈控制信号和所述神经网络前馈控制器输出的最优前馈控制信号,进行求和运算生成总控制信号,将总控制信号输出至所述被控对象;所述被控对象在总控制信号的驱动下进行轨迹跟踪运动。2.根据权利要求1所述的伺服控制系统,其特征在于,在伺服运动控制中,神经网络前馈控制器根据参考轨迹实时预测最优前馈控制信号,补偿参考轨迹引入的轨迹跟踪误差。3.一种伺服控制系统的神经网络前馈控制器训练方法,其特征在于,具体步骤包括:步骤3

1),采用迭代学习控制方法学习多个不同参考轨迹的最优前馈控制信号,确定神经网络的输入与输出;步骤3

2),选择神经网络的架构与训练算法;步骤3

3),利用遗传算法优化神经网络的超参数,包括:隐层数、隐层神经元数、权重初始值和学习率,根据参考轨迹和最优前馈控制信号训练神经网络前馈控制器,建立参考轨迹与最优前馈控制信号之间的映射关系。4.根据权利要求3所述的伺服控制系统的神经网络前馈控制器训练方法,其特征在于,所述神经网络的输入为当前时刻与之前若干时刻的参考轨迹、参考轨迹的多阶导数,所述神经网络的输出为最优前馈控制信号。5.根据权利要求3所述的伺服控制系统的神经网络前馈控制器训练方法,其特征在于,由于最优前馈控制信号具有时序性,所述神经网络的架构选择为带有输入延迟的时间序列神经网络或循环神经网络。6.根据权利要求3所述的伺服控制系统的神经网络前馈控制器训练方法,其特征在于,...

【专利技术属性】
技术研发人员:李敏孙凡茗陈涛涛金思芃刘恋奇陈曦
申请(专利权)人:中国地质大学武汉
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1