【技术实现步骤摘要】
永磁同步电机效率优化控制方法及系统
[0001]本专利技术属于永磁同步电机控制领域,涉及一种基于损耗模型法和深度强化学习相结合的复合式永磁同步电机效率优化控制方法及系统。
技术介绍
[0002][0003]永磁同步电机具有体积小,功率密度高等优点,在多个行业广泛应用,如何进一步提高其运行效率,是科研工作者持之以恒的追求目标。永磁同步电机效率优化控制技术归纳为两类:基于损耗模型的效率优化控制方法和基于搜索技术的效率优化控制方法。
[0004]损耗模型法是目前的主流方法,其建立电机的效率最大函数或电机的损耗最小函数,推导出最优效率时的励磁电流和励磁磁链,并加以控制实现效率优化。它能够较快达到控制目标,实现实时控制,但它忽略饱和效应等非线性因素对参数变化的影响,往往也没有考虑驱动器的开关动作对于电机效率的影响。特别是凸极永磁同步电机交直轴参数不相等,得到最优直轴电流初始值比较复杂,并且对电机参数依赖大,而这些参数随电机运行状况而改变,需要对电机参数进行在线辨识。因此,实现起来难度大,实践中经常要对模型简化,得到的近似最优解与实际最优值仍存在偏差,最终只能实现效率次优控制。
[0005]搜索法能够实现系统效率的全局最优,且不受电机参数变化的影响,但算法收敛时间长,收敛速度慢,容易引起磁通和转矩的脉动,存在收敛速度和转矩脉动的矛盾,此时控制算法步长选择不当,则会使算法收敛过慢甚至不收敛,从而导致总体效率下降,严重影响效率最优控制效果。
[0006]针对现有技术存在的不足,有必要设计一种新的永磁同步电机效 ...
【技术保护点】
【技术特征摘要】
1.一种永磁同步电机效率优化控制方法,其特征在于,包括以下步骤:步骤1、利用损耗模型法求得永磁同步电机的近似最优d轴电流;步骤2、以近似最优d轴电流为初始值,利用深度强化学习算法对d轴电流进行寻优,构建最优深度强化学习模型;步骤3、将当前采集的永磁同步电机状态数据送入最优深度强化学习模型,基于该模型预测出使电机运行在最优效率的控制参数值;根据该控制参数值对永磁同步电机进行控制。2.根据权利要求1所述的永磁同步电机效率优化控制方法,其特征在于,所述步骤2包括以下步骤:步骤2.1:构建深度强化学习模型,包括结构相同的值网络Q
v
和目标网络Q
T
,状态空间S、动作空间A和奖励函数Reward,状态空间S中的每个状态为表示为一个四维向量(T,v,acc,T1),其中T、v、acc、T1分别表示永磁同步电机的电磁转矩、转速、加速度和负载转矩,动作空间A中的每个动作为d轴电流i
d
的一种取值;步骤2.2、利用当前的深度强化学习模型对次优数据即近似最优d轴电流进行寻优,得到全局最优数据池;步骤2.3、对全局最优数据池中的异常数据进行检测和剔除;步骤2.4、将剔除异常数据后的全局最优数据池中的样本数据,对深度强化学习模型进行训练,并判断是否满足终止条件,若满足,则终止,得到最优深度强化学习模型;否则返回步骤2.2。3.根据权利要求2所述的永磁同步电机效率优化控制方法,其特征在于,所述步骤2.2具体包括以下步骤:步骤2.2.1:构建数据池D,其容量为C;步骤2.2.2:测得电机当前状态s,包括永磁同步电机的电磁转矩、转速、加速度和负载转矩;将近似最优d轴电流记为动作a,执行动作a,即根据近似最优d轴电流对永磁同步电机进行控制,永磁同步电机自动更新至下一状态s',通过奖励函数计算当前状态s下执行动作a的奖励值r;将当前样本数据(s,a,r,s')存入数据池D中;步骤2.2.3:将当前状态s更新为s',将当前状态s输入至值网络Q
v
中,利用值网络Q
v
的参数θ得到当前状态s下状态空间中各个动作的预测Q值,采用ε
‑
greedy策略选取最适合的动作,记为a;步骤2.2.4:执行动作a,即根据近似最优d轴电流对永磁同步电机进行控制,永磁同步电机自动更新至下一状态s';通过奖励函数计算当前状态s下执行动作a的奖励值r;将当前样本数据(s,a,r,s')存入数据池D中;步骤2.2.5:返回2.2.3进行循环,直至数据池D满,将此时的数据池D作为全局最优数据池。4.根据权利要求3所述的永磁同步电机效率优化控制方法,其特征在于,所述奖励函数设计如下:r(s,a)=α1·
Reward T(k+1)+α2·
Reward v(k+1)+α3·
Reward acc(k+1)+α4·
Reward T1(k+1)
其中,T(k)、v(k)、acc(k)、T1(k)分别表示执行动作a之前永磁同步电机的电磁转矩、转速、加速度和负载转矩;T(k+1)、v(k+1)、acc(k+1)、T1(k+1)分别表示执行动作a之后永磁同步电机的电磁转矩、转速、加速度和负载转矩;Reward T(k+1)、Reward v(k+1)、Reward acc(k+1)、Reward T1(k+1)分别表示动作a的电磁转矩、转速、加速度和负载转矩奖励;α1、α2、α3、α4为四种奖励因子的权重参数;r(s,a)表示当前状态s={T(k),v(k),acc(k),T1(k)}...
【专利技术属性】
技术研发人员:彭思齐,李伟俊,郭旦,彭鸿羽,李辉,谭平安,
申请(专利权)人:佛山湘潭大学绿色智造研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。