强化学习模型训练方法、滑行能量回收方法、装置和系统制造方法及图纸

技术编号：46591749 阅读：2 留言：0更新日期：2025-10-10 21:25

本发明专利技术涉及汽车能量回收技术领域，尤其是涉及一种强化学习模型训练方法、滑行能量回收方法、装置和系统。训练方法包括：获取预设的强化学习模型和多个样本状态参数，其中，每个样本状态参数至少包括下坡道路的样本坡度；将样本状态参数输入强化学习模型的策略网络和价值网络中，得到预测扭矩调整系数和优势评估值；根据优势评估值更新策略网络的参数，根据优势评估值对应的损失值更新价值网络的参数，继续训练强化学习模型，直至强化学习模型收敛；其中，训练后的强化学习模型用于在车辆处于下坡滑行工况中时，根据实时坡度得到用于调整基础能量回收扭矩的实时扭矩调整系数。采用本方法能够提高车辆下坡滑行工况中的滑行能量回收率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及汽车能量回收，特别是涉及一种强化学习模型训练方法、滑行能量回收方法、装置和系统。

技术介绍

1、随着新能源汽车技术的快速发展，能量回收系统已成为电动汽车和混合动力汽车提升能源利用率的核心技术之一，主要包括制动能量回收和滑行能量回收，其中，滑行能量回收是指将车辆滑行过程中的动能转化为电能存储于电池中，从而延长续航里程。

2、传统的滑行能量回收技术通常根据车速和踏板信号等确定能量回收扭矩的大小，实现滑行能量回收的控制，在实际应用场景中存在不足。例如，在车辆下坡滑行工况中，未能充分考虑实际路况对能量回收效率的动态影响，导致无法有效回收过剩能量，迫使驾驶员使用机械制动系统，不仅造成能量浪费，还会加剧制动部件磨损。

3、因此，在车辆下坡滑行工况中还存在能量回收率较低的问题。

技术实现思路

1、基于此，提供一种强化学习模型训练方法、滑行能量回收方法、装置和系统，以提高车辆下坡滑行工况中的滑行能量回收率。

2、第一方面，提供一种强化学习模型训练方法，所述方法包括：

本文档来自技高网...

【技术保护点】

1.一种强化学习模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的强化学习模型训练方法，其特征在于，每个所述样本状态参数还包括样本车速和样本电池剩余容量中的至少一项，所述训练后的强化学习模型还用于在车辆处于下坡滑行工况中时，根据实时车速和实时电池剩余容量中的至少一项以及实时坡度，预测实时扭矩调整系数。

3.根据权利要求1或2所述的强化学习模型训练方法，其特征在于，将任一所述样本状态参数输入所述价值网络中，得到所述预测扭矩调整系数对应的优势评估值，包括：

4.根据权利要求1或2所述的强化学习模型训练方法，其特征在于，根据所述优势评估值更新...

【技术特征摘要】

1.一种强化学习模型训练方法，其特征在于，所述方法包括：

4.根据权利要求1或2所述的强化学习模型训练方法，其特征在于，根据所述优势评估值更新所述策略网络的参数，包括：<...

【专利技术属性】
技术研发人员：凌青海，曹华军，庞俊康，胡平，李强，陈才勇，史鑫威，
申请(专利权)人：重庆大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人