一种电量均衡策略模型训练方法、装置、设备及介质制造方法及图纸

技术编号：41186207 阅读：5 留言：0更新日期：2024-05-07 22:18

本发明专利技术公开了一种电量均衡策略模型训练方法、装置、设备及介质。通过获取车辆在行驶过程中的状态数据集；基于所述状态数据集生成电池模拟模型，所述电池模拟模型用于描述车辆行驶过程中电池运行过程；基于所述电池模拟模型采集电池的样本状态信息；对待训练的电量均衡策略模型进行训练，得到训练好的电量均衡策略模型：基于训练过程中的电量均衡策略模型生成所述电池的样本状态信息对应的预测动作请求，基于所述电池模拟模型得到所述预测动作请求对应的预测电池状态信息，基于所述预测电池状态信息和电池目标控制状态信息对所述电量均衡策略模型进行参数调节，能够基于电池模拟模型对电量均衡策略模型进行离线强化学习的训练。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电动车辆能量管理，尤其涉及一种电量均衡策略模型训练方法、装置、设备及介质。

技术介绍

1、在车辆中，电池管理系统(battery management system，bms)被视作不可或缺的重要部件。bms是一个专门用于监控、管理和保护电池的智能系统。其主要任务是保护每个电芯，增加电池使用寿命和循环寿命，防止电池过充和过放等故障。

2、目前，现有技术中基于模型的强化学习算法就具备了较大优势的样本高效性，它们能够在已有的样本基础上，结合模型进行快速的学习。

3、但是，样本获取成本高，已有的样本数量有限，无法表征真实世界的全部可能情况，导致强化学习训练得到的模型容易过拟合，泛化性差。

技术实现思路

1、本专利技术提供了一种电量均衡策略模型训练方法、装置、设备及介质，以解决电量均衡策略模型强化学习训练困难的问题。

2、根据本专利技术的一方面，提供了一种电量均衡策略模型训练方法，方法包括：

3、获取车辆在行驶过程中的状态数据集；其中，状态数据集包括电池动作信息和电池状态信息；电池状态信息包括电池组中多个单电池的剩余电量信息；

4、基于状态数据集生成电池模拟模型，电池模拟模型用于描述车辆行驶过程中电池运行过程；

5、基于电池模拟模型采集电池的样本状态信息；

6、对待训练的电量均衡策略模型进行训练，得到训练好的电量均衡策略模型：基于训练过程中的电量均衡策略模型生成电池的样本状态信息对应的预测动作请

7、根据本专利技术的另一方面，提供了一种电量均衡方法，方法包括：

8、基于预设时间间隔获取车辆的电池状态信息；

9、将电池状态信息输入电量均衡策略模型，得到控制动作指令；

10、基于控制动作指令对电池组中多个单电池的电量进行均衡调节，以实现多个单电池的电量均衡。

11、根据本专利技术的另一方面，提供了一种电子设备，电子设备包括：

12、至少一个处理器；以及

13、与至少一个处理器通信连接的存储器；其中，

14、存储器存储有可被至少一个处理器执行的计算机程序，计算机程序被至少一个处理器执行，以使至少一个处理器能够执行本专利技术任一实施例的电量均衡策略模型训练方法。

15、根据本专利技术的另一方面，提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机指令，计算机指令用于使处理器执行时实现本专利技术任一实施例的电量均衡策略模型训练方法。

16、本专利技术实施例的技术方案，通过获取车辆在行驶过程中的状态数据集；其中，状态数据集包括电池动作信息和电池状态信息；电池状态信息包括电池组中多个单电池的剩余电量信息；基于状态数据集生成电池模拟模型，电池模拟模型用于描述车辆行驶过程中电池运行过程；基于电池模拟模型采集电池的样本状态信息；对待训练的电量均衡策略模型进行训练，得到训练好的电量均衡策略模型：基于训练过程中的电量均衡策略模型生成电池的样本状态信息对应的预测动作请求，基于电池模拟模型得到预测动作请求对应的预测电池状态信息，基于预测电池状态信息和电池目标控制状态信息对电量均衡策略模型进行参数调节，能够基于电池模拟模型对电量均衡策略模型进行离线强化学习的训练，而不是进行实车的在线强化学习训练，能够降低电量均衡策略模型训练的成本，并且电池模拟模型生成的样本状态信息是对状态数据集中电池状态信息的数据增强，能够避免电量均衡策略模型训练过程中的过拟合，解决了电量均衡策略模型强化学习训练困难的问题，并且提高了电量均衡策略模型的泛化性。

17、应当理解，本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征，也不用于限制本专利技术的范围。本专利技术的其他特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种电量均衡策略模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述状态数据集生成电池模拟模型，包括：

3.根据权利要求1所述的方法，其特征在于，在生成所述电池模拟模型之后，还包括：对所述电池模拟模型进行验证，其中，所述验证过程包括：

4.根据权利要求1所述的方法，其特征在于，所述基于所述预测电池状态信息和电池目标控制状态信息对所述电量均衡策略模型进行参数调节，包括：

5.根据权利要求4所述的方法，其特征在于，所述奖惩函数为对所述预测电池状态信息和所述电池目标控制状态信息进行差值绝对值的相反数计算的函数。

6.根据权利要求1所述的方法，其特征在于，所述状态数据集还包括工况状态信息；

7.一种电量均衡方法，其特征在于，所述方法包括：

8.一种电量均衡策略模型训练装置，其特征在于，包括：

9.一种电子设备，其特征在于，所述电子设备包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指

...

【技术特征摘要】

1.一种电量均衡策略模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述状态数据集生成电池模拟模型，包括：

3.根据权利要求1所述的方法，其特征在于，在生成所述电池模拟模型之后，还包括：对所述电池模拟模型进行验证，其中，所述验证过程包括：

4.根据权利要求1所述的方法，其特征在于，所述基于所述预测电池状态信息和电池目标控制状态信息对所述电量均衡策略模型进行参数调节，包括：

5.根据权利要求4所述的方法，其特征在于，所述奖惩函数为对所述预测电池状态信息和所述电...

【专利技术属性】
技术研发人员：安博，周俊杰，姚志安，郭宇杰，
申请(专利权)人：南栖仙策南京高新技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人