【技术实现步骤摘要】
一种基于深度强化学习的混动汽车热管理策略生成方法
[0001]本专利技术涉及一种基于深度强化学习的混动汽车热管理策略生成方法,具体适用于提高汽车热管理策略的适配性。
技术介绍
[0002]近几年,随着汽车在全球范围内的普及,车辆热管理问题日益受到各大汽车厂家的重视并作为新兴领域有着大好的前景待人开发。为了保证汽车的动力部件能在合理的温度范围内工作,对车辆各系统的温度需求进行合理调控已成为汽车热管理
的一项重要研究发展方向。传统汽车热管理研究主要针对发动机的冷却系统,而电动汽车主要集中在动力电池温度场的技术研究上。
[0003]目前大多数都是基于规则的热管理策略和基于模糊控制算法的热管理策略,尽管这些方法对于特定车型直观且有效,但需根据工程经验进行标定,且不同车型需要重新设定,会耗费许多的人力资源与时间成本。此外,标定的结果也存在主观性较强、精确性较差现象。
技术实现思路
[0004]本专利技术的目的是克服现有技术中存在的热管理策略制定周期长、成本高、精确性差的问题,提供了一种通过建模方式生成热管 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习的混动汽车热管理策略生成方法,其特征在于:所述策略生成方法包括以下步骤:S1:获取混动汽车的车辆信息和状态信息:获取混动汽车的车辆信息:采集待生成策略车型的车辆信息数据,所述车辆信息数据包括:车辆的重量m、车辆迎风面积A和电池标称容量Q
bat
、发动机发热量map、是电机效率map;获取混动汽车的状态信息:采集待生成策略车型的相关实车测试的车辆状态数据、电池状态数据和环境状态数据;所述车辆状态信息包括:车速u、发动机转速n
en
、发动机输出扭矩T
en
、空调压缩机转速n
ac
、风扇转速n
fan
以及电磁阀的开闭状态K(K=0,1);所述电池状态信息包括:电池电流I
bat
、电压V、内阻R
int
以及电池温度T
bat
;所述环境状态信息包括:环境温度T
e
;S2:搭建混合动力汽车仿真模型:建立整车能量模型;在Simulink中建立整车动力模型,在GT
‑
SUITE中搭建热管理系统模型,将整车动力系统模型与热管理系统模型在simulink中进行耦合得到整车能量模型;S3:利用深度强化学习算法构建混动汽车热管理策略,求解包含燃油经济性,电池效率及电池散热量等多目标优化问题,从而得到最优热管理策略;首先,定义奖励函数,对S2中得到的整车能量模型进行仿真,在每一个仿真步长获取当前的状态S
t
和所获得奖励信息R
t
做出决策并采取动作A
t
,在下个时间步获得环境新的状态S
t+1
以及奖励信息R
t+1
,通过这个过程来学习并更新强化学习的策略,目标是通过试错的方式达到改进系统性能的目的,使奖励信息的累计值达到最大;随着训练进行,即损失达到收敛,所输出的状态
‑
动作集合即为最优控制策略;此时,混动汽车热管理策略生成完成。2.根据权利要求1所述的一种基于深度强化学习的混动汽车热管理策略生成方法,其特征在于:S2:搭建混合动力汽车仿真模型中:S2.1在Simulink中建立整车动力系统模型,车辆的驱动功率为:P
dem
=(P
en
+P
bat
η
m
)η
T
其中,P
dem
为驱动功率、P
en
为发动机输出功率、P
bat
为电池功率、η
m
为电动机效率、η
T
为变速器和车轴的效率;其中,P
en
为发动机输出功率、m为车辆的重量、f为滚动阻力系数、C
d
为空气阻力系数、A为迎风面积、为坡度、δ为旋转质量换算系数、u为车速、η
T
为变速器和车轴的效率;建立发动机模型:其中,T
en
为发动机输出扭矩、n
en
为发动机转速、P
en
为发动机输出功率,P
en
和燃油消耗率呈正比例关系,则燃油消耗率与发动机输出扭矩T
en
、发动机转速n
en
为函数关系,即:
建立动力电池模型:其中,I
bat
为电池电流、V
oc
为电池开路电压、R
int
为电池内阻、P
bat
为电池功率;其中,为电池的荷电状态对时间的导数、Q
bat
为电池标称容量;其中,T
bat
为电池温度、ΔT
bat
为电池温度变化量,ΔT
bat
是和T
bat
两者的函数。3.根据权利要求2所述的一种基于深度强化学习的混动汽车热管理策略生成方法,其特征在于:S2:搭建混合动力汽车仿真模型中:S2.2:在GT
‑
SUITE中搭建热管理系统模型,热管理模型的建立:在GT
‑
SUITE中根据实车参数调整热管理模型中的参数,对整车上的发热部件、散热器分别进行建模与标定,再根据实际热管理系统构型搭建系统模型。4.根据权利要求3所述的一种基于深度强化学习的混动汽车热管理策略生成方法,其特征在于:S2:搭建混合动力汽车仿真模型中:S2.3:将整车动力系统模型与热管理系统模型在simulink中进行耦合到整车能量模型:在整车动力系统模型中根据已知的车辆状态数据,可以分别得出发动机产热量、电机产热量、电池产热量,然后将其输入到热管理系统模型中,热管理系统模型经过模拟后将发动机温度、电机温度、电池温度及各个耗能部件消耗功率信息反馈给整车动力系统模型,整车动力系统模型根据反馈的温度信息更新相关的车辆状态数据;所述整车动力系统模型输出发动机转速n
en
、扭矩T
en
,根据发动机产热map查表得到的发动机产热量;所述整车动力系统模型输出电机输出功率、转速、扭矩,根据电机效率map得到对应状态的电机效率值,进而计算出电机产热量;所述整车动力系统模型输出电池输出功率、电流I
bat
及内阻R
int
,根据公式计算得到电池产热量。5.根据权利要求4所述的一种基于深度强化学习的混动汽车热管理策略生成方法,其特征在于:所述S3:利用深度强化学习算法构建混动汽车热管理策略中,将热管理策略中,奖励函数R定义为:其中,分别α是奖励信号中燃油经济性的权重因子、β是奖励信号中电池SOC维持的权重
因子、γ是奖励信号中电池温度保持的权重因子、为电池的荷电状态对时间的导数、ΔT
bat
为电池温度变化量、ΔT0为设定的温差限值为确定常数;所述权重因子是根据不同的策略目标设定不同数值。6...
【专利技术属性】
技术研发人员:袁晓红,孙卓松,周建刚,苏楚奇,汪怡平,刘珣,
申请(专利权)人:武汉理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。