基于TD3多目标HEV能量管理方法及系统技术方案

技术编号:29657123 阅读:32 留言:0更新日期:2021-08-13 21:34
公开了一种基于双延迟深度确定性策略梯度多目标HEV能量管理方法及系统。本发明专利技术创新地使用双延迟深度确定性策略梯度策略,解决基于离散动作空间深度强化学习能量管理策略维度灾难问题和深度确定性策略梯度过估计问题。而且将燃油消耗、电池温度和电池寿命(SOH)作为优化目标,提高能量管理策略的实用价值。

【技术实现步骤摘要】
基于TD3多目标HEV能量管理方法及系统
本专利技术涉及深度强化学习算法提高新能源汽车燃油经济性和电池使用寿命,尤其涉及一种基于双延迟深度确定性策略梯度(TwinDelayedDeepDeterministicPolicyGradient,TD3)的并联混合动力车辆(HEV)多目标能量管理方法。
技术介绍
能源危机和气候变化已经引起了世界各国的广泛关注,车辆的燃油消耗和尾气排放是不可忽视的关键因素。为了缓解严峻的能源危机和气候变化,车辆电动化是未来汽车工业发展的必由之路。在新能源汽车中,混合动力汽车由于相比于传统燃油汽车需要更少的燃料,相比于纯电动汽车具有更远的行驶里程,成为目前最行之有效的解决方案。但是混合动力车辆能量管理系统非常复杂,既要恰当地分配发动机功率和电机功率,又要全面保障车辆的驾驶性能和经济性,其能量管理方法涵盖了传统汽车、纯电动汽车和油电混合汽车能量管理多方面的内容,成为国内外汽车领域广泛研究的焦点。能量管理策略主要可以分为三类。a)基于规则的能量管理策略,其依赖于通过专业经验制定的规则集合而且不需要预知驾驶工况,虽然实本文档来自技高网...

【技术保护点】
1.一种HEV能量管理方法,其特征在于,包括:/n建立并联式混合动力汽车的动力学模型、电池热模型和电池寿命模型,将三个模型的发动机燃油消耗率m

【技术特征摘要】
1.一种HEV能量管理方法,其特征在于,包括:
建立并联式混合动力汽车的动力学模型、电池热模型和电池寿命模型,将三个模型的发动机燃油消耗率mf、发动机输出转矩Teng、电池温度Temp、电池SOC、SOH作为控制目标;
构建双延迟深度确定性策略梯度策略梯度TD3网络;
将所述控制目标的发动机燃油消耗率、发动机输出转矩、电池温度、电池SOH和电池SOC作为TD3状态空间信号S,将发动机输出转矩作为TD3动作空间信号A,并制定TD3的回报函数r;
获取车辆标准工况行驶中影响能量管理的参数和观测值,其包括作为所述控制目标的发动机燃油消耗率、发动机输出转矩、电池温度、电池SOH和电池SOC,利用所述标准工况行驶中影响能量管理的参数和观测值以及所述回报函数r,对TD3网络进行训练,使其根据接收到的状态信号S做出能够最大化回报函数r的动作,进而得到训练好的深度强化学习智能体;
获取车辆实际行驶中影响能量管理的参数和观测值,其包括作为所述控制目标的发动机燃油消耗率、发动机输出转矩、电池温度、电池SOH和电池SOC,将所述实际行驶中影响能量管理的参数和观测值输入所述训练好的深度强化学习智能体进行能量管理。


2.根据权利要求1所述的HEV能量管理方法,其特征在于,TD3状态空间信号为S=(SOC,mf,Teng,Te...

【专利技术属性】
技术研发人员:颜伏伍王金海杜常清彭可挥
申请(专利权)人:武汉理工大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1