System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法技术_技高网

半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法技术

技术编号:39938639 阅读:7 留言:0更新日期:2024-01-08 22:23
本发明专利技术公开了一种半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法,该方法针对仅能测量永磁同步电机的转子角度等电机反馈信号,而无法测得负载机构实际位置的半闭环控制场景,并考虑到负载模型的高阶非线性特征,提出了在永磁同步电机FOC控制框架下,采用传统PID三环控制器作为基础控制方法,并使用双延迟深度确定策略梯度算法训练调优策略网络,使其观测永磁同步电机反馈量、输出位置环反馈位置的调优值,以改进传统PID三环控制在面对高阶非线性负载模型时的控制精度和响应速度。

【技术实现步骤摘要】

本专利技术属于计算机控制系统技术,具体涉及永磁同步电机的位置控制算法,尤其涉及一种负载的实际位置无法测得的半闭环反馈情景下,永磁同步电机位置控制优化方法。


技术介绍

1、永磁同步电机因其拥有结构紧凑、效率和功率密度高、调速性能好等优点,在电动交通、工业机器人、航空航天等领域均得到了广泛的应用。永磁同步电机位置伺服系统中常用的磁场定向控制(foc)策略往往是基于pid三环控制器对电机转动角度进行控制。虽然因算法的低复杂性和稳定性在工业实践中获得了广泛的应用,但是当其面临一些复杂和特殊的驱动场景,pid三环控制器也面临诸多挑战和不足:

2、首先,当伺服电机驱动一些高阶非线性的负载机构,pid控制器的参数难以通过模型和指标确定,因此需要依赖人工经验进行试错调整,并在动态响应方面难以拥有很好的性能。其次,考虑到电机系统对转速、电流的限幅和逆变器输出电压阈值限制,当控制器收到高度动态的位置、速度、电流指令时,指令的限幅会使控制器的性能进一步下降。最具挑战性的是,本专利技术面向的特种设备因特殊的工作环境,无法安装外部传感器或无法可靠地对负载机构的实际位置进行测量,而控制器得到的反馈仅仅是通过磁编码器检测得到的电机转轴角度,即一个半闭环控制系统。相较于对最终执行机构进行监控的闭环控制,半闭环场景会使得基于反馈误差进行控制的传统pid控制器出现较大的性能下降。例如,本专利技术中考虑电机转轴通过齿轮带动丝杆给进或收缩,进而使得与三角形连杆结构连接的摆动机构偏转一定的角度。其摆动机构的摆动角度无法通过传感器测量,且电机转动角度与摆动机构摆动角度受丝杆弹性运动的影响,涉及到高阶非线性的动力学方程,难用函数简单表达。因此,控制算法无法得到实际角度反馈以形成闭环控制。

3、因此,如何设计一种可运行在嵌入式芯片上的控制调优算法,使其能优化半闭环控制下实际负载角度对指令偏转角度的跟踪精度和响应速度,具有重要意义,并具有相当挑战性。


技术实现思路

1、专利技术目的:针对上述的pid三环控制方法在永磁同步电机半闭环情形下,面对高阶非线性的负载时出现的不足和问题,本专利技术提供了一种半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法

2、技术方案:一种半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法,所述的方法基于高阶非线性负载和foc控制框架下的电机仿真模型,在pid三环控制基础上,确定强化学习智能体的状态空间和动作设置,然后通过提升半闭环控制下负载摆动角度对指令目标角度的跟踪精度和响应速度为目标,使用仿真软件对系统模型进行建模并利用深度强化学习方法获得电机位置反馈的调优策略网络,以输出最优调优值;

3、所述方法包括如下步骤:

4、(1)构建基于foc控制框架的永磁同步电机运行模型,在foc控制下,电机系统将来自控制器的d,q两轴的电压指令值作为输入,输入向负载机构的动力矩,表现为电机转子转动角度;

5、(2)构建负载及其传动机构的数学模型,电机负载模型考虑包括传动机构的弹性形变、摆动机构的动力学方程,同时还考虑库伦摩擦、三角连杆机构中的力矩传递在内的非线性因素;

6、(3)对于上述建模的pmsm和高阶非线性负载模型,在foc控制框架上构建基于pid控制器的三环控制方案;

7、(4)采用强化学习算法训练策略网络,通过改变位置环pi控制器的输入以提升系统性能,包括使用状态和动作空间都连续的td3强化学习算法进行智能体优化。

8、进一步的说,为了使用仿真软件模拟所述的永磁同步电机运行模型在foc控制框架中的行为,所述的控制量和响应量以及相关的约束由如下变量和方程组描述:

9、(11)将相对旋转坐标系下的d、q两轴的电压vd和vq作为系统输入,驱动电机向传动机构施加动力矩,表现为电机转子的转动角度θm,同时负载及传动装置向电机施加时变负载转矩tl;

10、(12)控制器获得电机转子转动角度θm和角速度ωm作为计算参数,同时电流传感器还可以检测定子电流ia,ib,ic并使用clarke变换和park变化将其转换为d、q两轴的电流值id,iq;

11、(13)基于实际的电机模型,将电机模型确定为表贴式永磁同步电机,满足:

12、lq=ld

13、考虑到稳态下运行的永磁同步电机转子转速ωm和定子电流is应保持在阈值范围内,满足:

14、|ωm|≤ωlimit

15、

16、其中,ωlimit为转子转速最大值;ilimit为定子电流最大值。

17、(14)永磁同步电机的foc策略将电机的相变量分解为磁场分量和转矩分量,并对其进行独立控制,对电机磁场和转矩的精确控制中需要获取电机的转子位置和速度信息用于静止坐标系下的相变量和d-q坐标的相对旋转变量之间的变换计算,在d-q坐标系下,电机方程可描述为:

18、

19、其中:rs为定子电阻;vd,vq分别为d轴,q轴电压;id,iq分别为d轴,q轴电流;ld,lq分别为d轴,q轴电感;λm为永磁体d轴磁通;te,tl分别为输出转矩和负载转矩;b为轴承粘滞系数;j为电机和负载的总转动惯量;ωm,ωr分别为转子机械角速度和转子电磁角速度,p为永磁体对数,满足ωr=p×ωm。该模块响应输入的d-q两轴的电压,根据外部的负载力矩tl,输出电机角度θm和角速度ωr,并通过电流检测器检测得到d-q轴电流。

20、进一步的,为了模拟半闭环控制的特殊场景,使用simulink搭建传动和负载机构的动力学模型,并考虑到模型中的高阶非线性因素,其中:

21、(21)电机转轴的动力矩通过传动比为gr的二级齿轮传动驱动丝杆旋转,丝杆以nr的减速比产生相应的进程,其中转动产生对弹性丝杆的作用力为:

22、

23、(22)考虑质量为me、弹性阻尼为be,组合刚度为kp的丝杆受挤压的弹性运动,其动力学方程:

24、

25、其中,δl为丝杆压缩行程;

26、(23)丝杆产生的弹性形变产生的作用力推动三角形连杆机构的丝杆边,使得负载边的力臂产生一个力矩使得负载绕轴产生角度偏转;

27、其中,丝杆的伸出/缩进量l与偏转角度α的关系近似表述为:

28、

29、其中a,b分别为三角形连杆机构中,摆动角的两个相邻边oa,ob长;α0,l0分别为负载偏转角度为0时摆心角∠aob和边ab长度;

30、(24)考虑一个摆动惯量为jb,摆动阻尼为bb,位置阻力矩为kdelta,摩擦力矩为mf的摆动机构,收到大小为m的力矩,其动力学方程为:

31、

32、其中摩擦力矩建模为库伦摩擦力:

33、

34、进一步的,为了保证系统运行的稳定性和鲁棒性,所述方法在步骤(3)中是采用基于pi控制器的三环控制对最终的位置角度做基础控制,包括:

35、(31本文档来自技高网...

【技术保护点】

1.一种半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法,其特征在于:所述的方法基于高阶非线性负载和FOC控制框架下的永磁仿真模型,在PID三环控制基础上,确定强化学习智能体的状态空间和动作设置,然后通过提升半闭环控制下负载摆动角度对指令目标角度的跟踪精度和响应速度为目标,使用仿真软件对系统模型进行建模并利用深度强化学习方法获得电机位置反馈的调优策略网络,以输出最优调优值;

2.根据权利要求1所述的半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法,其特征在于:使用仿真软件模拟所述的永磁同步电机运行模型在FOC控制框架中的行为,其中控制量和响应量以及相关的约束由如下变量和方程组描述:

3.根据权利要求1所述的半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法,其特征在于:针对半闭环控制的特殊场景,使用simulink搭建传动和负载机构的动力学模型,并考虑到模型中的高阶非线性因素,包括:

4.根据权利要求1所述的半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法,其特征在于:针对FOC控制框架下的半闭环电动伺服系统,采用基于PI控制器的三环控制对最终的位置角度做基础控制,保证系统运行的稳定性和鲁棒性,其中:

5.根据权利要求1所述的半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法,其特征在于:针对半闭环控制场景下基础PID三环控制,使用状态和动作空间都连续的TD3强化学习算法进行智能体优化,使其预测丝杆进动长度与近似丝杆进动长度之间偏差的调优值,以缓解位置反馈误差导致的控制精度不足的问题,其中:

...

【技术特征摘要】

1.一种半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法,其特征在于:所述的方法基于高阶非线性负载和foc控制框架下的永磁仿真模型,在pid三环控制基础上,确定强化学习智能体的状态空间和动作设置,然后通过提升半闭环控制下负载摆动角度对指令目标角度的跟踪精度和响应速度为目标,使用仿真软件对系统模型进行建模并利用深度强化学习方法获得电机位置反馈的调优策略网络,以输出最优调优值;

2.根据权利要求1所述的半闭环场景下基于深度强化学习的电动伺服位置反馈动态调优方法,其特征在于:使用仿真软件模拟所述的永磁同步电机运行模型在foc控制框架中的行为,其中控制量和响应量以及相关的约束由如下变量和方程组描述:

3.根据权利要求1所述的半闭环场景下基于深度强化学习的电动伺服位置反馈...

【专利技术属性】
技术研发人员:易畅言吴昊郑好朱海峰祝可可戴兴安
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1