结合元学习和近端策略优化算法的能源管理方法技术

技术编号：44160928 阅读：40 留言：0更新日期：2025-01-29 10:32

本发明专利技术公开了一种结合元学习和近端策略优化算法的能源管理方法，属于自动化技术领域。本发明专利技术在一系列不同的锂电池/超级电容混动车任务上由内循环进行梯度更新，得到一组具有高度适应和泛化能力的参数；当内循环完成后，在外循环中通过整合多个任务的反馈重新更新基础EMS控制器的全局参数，以使其能够适应该辆新锂电池/超级电容混动车的特征。在元测试阶段进行参数微调，快速生成针对新的HEV控制对象且控制性能优良的新能源管理策略。在面对新的混合能源系统时，本发明专利技术的方法只需进行少量梯度下降计算步骤即可实现与基于传统强化学习的能源管理策略相似的控制性能，为开发高适应性和高工业效率的混合动力系统能源管理策略提供了解决方案。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于自动化，尤其涉及一种结合元学习和近端策略优化算法的能源管理方法。

技术介绍

1、对于新能源混动车而言，合理的能源管理策略(ems)有助于节能降耗提高电池寿命。常用的能源管理策略设计算法包括模糊逻辑、动态规划(dp)、模型预测控制(mpc)、强化学习(rl)等只能面对单一任务，即在算法训练完成后，只能用于控制特定的车辆。如果将能源管理策略应用于其他车辆，即使仅仅是能源的参数发生细微变化，如锂电池容量变化、锂电池最大输出功率约束变化等，整个控制策略也需要完全重新训练。这些算法多次训练的过程相互独立，无法积累从先前训练过程中获得的经验，重复而冗长的训练过程导致效率低下。为了解决该问题，亟需将基于元强化学习算法的元能源管理策略快速适应到新的应用场景中，以便快速生成新的混动车能源管理策略。

技术实现思路

1、本专利技术的目的在于解决传统能源管理策略无法适应新应用场景的限制，过程相互独立，无法积累从先前训练过程中获得的经验，重复而冗长的训练过程导致效率低下的问题，并提供一种结合元学习和近...

【技术保护点】

1.一种结合元学习和近端策略优化算法的能源管理方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种结合元学习和近端策略优化算法的能源管理方法，其特征在于，步骤S1中，构建卷积神经网络强化学习控制器，将其作为锂电池和超级电容混合动力车的主控制器，其包括输入层、第一卷积层、第二卷积层、全连接层以及输出层；

3.如权利要求1所述的一种结合元学习和近端策略优化算法的能源管理方法，其特征在于，步骤S2中，所述关键变量包括锂电池的额定容量、超级电容器的额定容量、锂电池的峰值和超级电容器的峰值功率，将锂电池的等效电阻作为一个相关的依赖变量。

<...

【技术特征摘要】

1.一种结合元学习和近端策略优化算法的能源管理方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种结合元学习和近端策略优化算法的能源管理方法，其特征在于，步骤s1中，构建卷积神经网络强化学习控制器，将其作为锂电池和超级电容混合动力车的主控制器，其包括输入层、第一卷积层、第二卷积层、全连接层以及输出层；

3.如权利要求1所述的一种结合元学习和近端策略优化算法的能源管理方法，其特征在于，步骤s2中，所述关键变量包括锂电池的额定容量、超级电容器的额定容量、锂电池的峰值和超级电容器的峰值功率，将锂电池的等效电阻作为一个相关的依赖变量。

4.如权利要...

【专利技术属性】
技术研发人员：陶吉利，王孝龙，张婧怡，许泽江，徐鸣，马龙华，
申请(专利权)人：浙大宁波理工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人