一种基于两阶段训练强化学习的自抗扰控制器参数优化方法技术

技术编号:43374756 阅读:34 留言:0更新日期:2024-11-19 17:54
一种基于两阶段训练强化学习的自抗扰控制器参数优化方法,它属于计算机系统控制技术领域。本发明专利技术解决了现有方法采用自抗扰控制器时存在参数调节效率低、无法保证参数最优、依赖初始参数选择的问题。本发明专利技术的基于预训练和进阶强化学习的两阶段训练方法,在预训练阶段设计了基于速度误差的奖励函数,在进阶训练过程中设计了基于误差阈值的分段式奖励机制,将电机的速度跟踪过程划分为不同的区间,在不同区间以不同的奖励指导智能体训练,解耦性能指标,有效避免参数的局部最优,实现自抗扰控制器的参数最优。本发明专利技术方法可以应用于自抗扰控制器的参数优化。

【技术实现步骤摘要】

本专利技术属于计算机系统控制,具体涉及一种基于两阶段训练强化学习的自抗扰控制器参数优化方法


技术介绍

1、永磁同步电机具有功率密度大、转化效率高等优点,因而被广泛应用。提高速度环的动态响应能力对提升永磁同步电机的控制性能十分重要。自抗扰控制因其抗干扰能力以及无模型特性,使其具备应用于永磁同步电机的速度环控制的潜力。

2、但是自抗扰控制器的参数较多,参数之间存在耦合关系且敏感性较弱,参数调整通常依赖于识别的粗糙模型,即基于经验的手动调节方法,该方法既耗时又难以获得满意的控制性能。许多研究人员将人工智能算法与自抗扰控制器结合,通过参数调优以自适应输出控制策略,包括使用了aco(ant colony optimization)、dbo(dung beetleoptimization)以及pso(particle swarm optimization)等启发式算法来结合自抗扰控制器,通过算法的学习和迭代能力优化参数,获得更好性能的控制器输出。但是启发式算法通常基于经验来构造,在处理复杂的实际问题时表现不稳定,且不能保证找到最优解。还有一些研究人员使用本文档来自技高网...

【技术保护点】

1.一种基于两阶段训练强化学习的自抗扰控制器参数优化方法,其特征在于,所述方法具体包括以下步骤:

2.根据权利要求1所述的一种基于两阶段训练强化学习的自抗扰控制器参数优化方法,其特征在于,所述自抗扰控制器模型为一阶自抗扰控制器模型,自抗扰控制器模型包括跟踪微分单元、扩张状态观测单元和非线性状态反馈单元三个部分。

3.根据权利要求2所述的一种基于两阶段训练强化学习的自抗扰控制器参数优化方法,其特征在于,所述跟踪微分单元的工作过程为:

4.根据权利要求3所述的一种基于两阶段训练强化学习的自抗扰控制器参数优化方法,其特征在于,所述扩张状态观测单元的工作过程为...

【技术特征摘要】

1.一种基于两阶段训练强化学习的自抗扰控制器参数优化方法,其特征在于,所述方法具体包括以下步骤:

2.根据权利要求1所述的一种基于两阶段训练强化学习的自抗扰控制器参数优化方法,其特征在于,所述自抗扰控制器模型为一阶自抗扰控制器模型,自抗扰控制器模型包括跟踪微分单元、扩张状态观测单元和非线性状态反馈单元三个部分。

3.根据权利要求2所述的一种基于两阶段训练强化学习的自抗扰控制器参数优化方法,其特征在于,所述跟踪微分单元的工作过程为:

4.根据权利要求3所述的一种基于两阶段训练强化学习的自抗扰控制器参数优化方法,其特征在于,所述扩张状态观测单元的工作过程为:

5.根据权利要求4所述的一种基于两阶段训练强化学习的自抗扰控制器参数优化方法,其特征在于,...

【专利技术属性】
技术研发人员:刘健行刘壮范雨思朱乔曼林欣魄沈肖宁张欧阳徐睿琦高亚斌
申请(专利权)人:江淮前沿技术协同创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1