电池包热管理模型的训练方法、装置和计算机设备制造方法及图纸

技术编号：37875740 阅读：9 留言：0更新日期：2023-06-15 21:04

本申请提供了电池包热管理模型的训练方法、装置和计算机设备，方法包括：获取电池包的样本数据，样本数据至少包括电池包的动作样本数据和状态样本数据；根据样本数据，建立初始热管理模型的奖励函数，初始热管理模型为强化学习模型；基于奖励函数，对所述初始热管理模型进行训练。通过获取电池包的样本数据，基于电池包的样本数据建立初始热管理模型的奖励函数，再基于奖励函数对初始热管理模型进行训练，得到的电池包热管理模型，解决了相关技术中对电池包的温度进行管理的技术方案的环境适应性较差，且无法自适应地调节电池包能耗的技术问题，提高了对电池包的温度进行管理时的环境适应性，可以自适应调节电池包能耗。可以自适应调节电池包能耗。可以自适应调节电池包能耗。

全部详细技术资料下载

【技术实现步骤摘要】
电池包热管理模型的训练方法、装置和计算机设备

[0001]本申请涉及电池
，特别是涉及一种电池包热管理模型的训练方法、装置和计算机设备。

技术介绍

[0002]随着电动汽车的不断发展，电池技术的应用价值变得越来越高。电池包作为电动汽车的唯一能量来源，需要在合适的温度范围内进行工作以维持电池包的正常健康状态，过高或者过低的温度都会对电池包的电芯造成损害。
[0003]在相关技术中，为了保证电池可以在合适的温度范围内工作，一般需要启动电池热管理系统对电池包进行加热或者冷却，以对电池包的温度进行调节。但是，热管理系统本身会消耗电池包的能量，并且热管理系统的运行依赖于预先制定的逻辑规则。在实际应用中由于使用环境和车辆工况的多样性，按照既定的逻辑规则运行热管理系统虽然可以维持电池包的温度正常，但是不能适用于各类场景，也不能保证在各类使用环境中将电池包的能耗降至最低。因此，相关技术中对电池包的温度进行管理的技术方案的环境适应性较差，且无法自适应地调节电池包能耗。
[0004]针对相关技术中存在的对电池包的温度进行管理的技术方案的环境适应性较差，且无法自适应地调节电池包能耗的技术问题，目前还没有提出有效地解决方案。

技术实现思路

[0005]基于此，有必要针对上述技术问题，提供一种电池包热管理模型的训练方法、装置和计算机设备，以解决相关技术中存在的对电池包的温度进行管理的技术方案的环境适应性较差，且无法自适应地调节电池包能耗地技术问题。
[0006]第一方面，本申请提供了一种电池包热管...

【技术保护点】

【技术特征摘要】
1.一种电池包热管理模型的训练方法，其特征在于，包括：获取电池包的样本数据，所述样本数据至少包括所述电池包的动作样本数据和状态样本数据；根据所述样本数据，建立初始热管理模型的奖励函数，所述初始热管理模型为强化学习模型；基于所述奖励函数，对所述初始热管理模型进行训练。2.根据权利要求1所述的电池包热管理模型的训练方法，其特征在于，所述奖励函数至少包括温度项、水泵能耗项以及温度调节能耗项，其中，所述温度项基于电池包的最高采样温度、最低采样温度、温度上限阈值以及温度下限阈值确定，所述水泵能耗项基于水泵转速确定，所述温度调节能耗项基于进水口的实际进水温度以及预设进水温度确定。3.根据权利要求1所述的电池包热管理模型的训练方法，其特征在于，所述样本数据采集于多个时间点，所述基于所述奖励函数，对所述初始热管理模型进行训练包括：基于所述奖励函数以及每个时间点的所述样本数据，计算每个时间点的奖励值；基于每个时间点的所述奖励值，计算每个时间点的未来奖励总值，所述未来奖励总值为当前时间点之后的所有时间点的奖励值的总和；将每个时间点的所述状态样本数据、所述动作样本数据以及所述未来奖励总值输入至所述初始热管理模型，并对所述初始热管理模型进行训练。4.根据权利要求3所述的电池包热管理模型的训练方法，其特征在于，所述初始热管理模型的前向通道的迭代过程包括：将当前时间点的当前推演状态值、当前推演未来奖励总值和所有历史时间点的历史推演状态值、历史推演未来奖励总值以及历史推演动作值作为输入，对当前时间点的当前推演动作值进行预测；根据...

【专利技术属性】
技术研发人员：戴认之，李志飞，高科杰，
申请(专利权)人：浙江零跑科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人