一种燃料电池汽车节能驾驶优化方法及装置制造方法及图纸

技术编号:32519486 阅读:15 留言:0更新日期:2022-03-02 11:20
本发明专利技术公开了一种燃料电池汽车节能驾驶优化方法及装置,所述方法包括:建立燃料电池汽车系统模型和其系统功率平衡模型;在电量维持模式下,求解燃料电池汽车在各种工况下的最优能量管理策略;基于得到的最优数据库进行训练,得到数据驱动的能量管理模型;建立包含信号灯的训练场景,定义状态空间和动作空间;根据数据驱动的能量管理模型,得到燃料电池汽车在某个状态和相应动作下的燃料消耗,建立相关的回报函数模型;在训练场景中进行训练,得到节能驾驶优化模型。本发明专利技术所提出的方法结合了联合优化和分层优化的优点,可将预先优化的能量管理策略融合到基于深度强化学习的燃料电池汽车车速规划之中,实现了能耗经济性和实时性的平衡。性的平衡。性的平衡。

【技术实现步骤摘要】
一种燃料电池汽车节能驾驶优化方法及装置


[0001]本专利技术涉及燃料电池汽车车速规划和能量管理领域,特别是涉及一种燃料电池汽车节能驾驶优化方法。

技术介绍

[0002]车辆智能化和网联化有望革新人员和货物的运输,从而提高道路安全性、改善乘坐舒适性、提高交通效率并减少能源消耗。通过车对基础设施V2I通信,网联式汽车可以获取道路上的实时信号灯信息,并通过优化车速轨迹实现节能驾驶。
[0003]燃料电池汽车作为一种混合能源驱动的车辆,其节能驾驶涉及速度规划和能量管理。该问题的最优解决方案是以最小化混合能源的总能耗为目标,进行车速和能量的联合优化。然而由于维数诅咒,超高的计算负担使得一般的联合优化难以具备实时性。一种简化的解决方案是分层优化,即首先以最小化车轮处的功率需求为目标进行车速规划,然后基于车速进行能量管理。通过将车辆运动规划和动力传动系统控制完全解耦,分层优化能够降低计算代价,但是也牺牲了一定的最优性。
[0004]在现有技术中,涉及燃料电池汽车在信号灯场景中的节能驾驶方法较少,并且难以实现最优性和实时性的平衡。

技术实现思路

[0005]本专利技术的目的在于弥补现有技术的不足,提出一种燃料电池汽车节能驾驶优化方法和装置,其结合联合优化和分层优化的优点,可将预先优化的能量管理策略融合到基于深度强化学习的燃料电池汽车车速规划之中,实现能耗经济性和实时性的平衡。
[0006]本专利技术的技术方案如下:
[0007]一种燃料电池汽车节能驾驶优化方法,其包括:
[0008]S1.建立所述燃料电池汽车的系统模型和其系统功率平衡模型,其中,所述系统模型包括车辆的纵向动力学模型、其电机模型、其燃料电池和/或动力电池模型;
[0009]S2.基于所述系统模型和所述功率平衡模型,在电量维持模式下,利用动态规划算法求解所述燃料电池汽车在各种工况下的最优能量管理策略,由最优能量管理策略得到的最优系统和/或功率参数组成最优数据库;
[0010]S3.基于所述最优数据库,利用机器学习回归算法进行第一模型训练,得到数据驱动的能量管理模型;
[0011]S4.建立包含信号灯的训练场景,定义所述燃料电池汽车的状态空间和动作空间;
[0012]S5.根据所述数据驱动的能量管理模型,得到所述燃料电池汽车在某个状态和/或相应动作下的燃料消耗,建立和所述燃料消耗相关的回报函数模型;
[0013]S6.在所述训练场景中利用深度强化学习算法进行第二模型训练,得到训练后的节能驾驶优化模型;
[0014]S7.在包含信号灯的不同测试场景中利用所述节能驾驶优化模型得到经济车速,
和/或,在电量维持模式下利用动态规划算法评估与所述经济车速响应的燃料消耗。
[0015]根据本专利技术的一些优选实施方式,所述机器学习回归算法选自XGBoost算法、神经网络算法和随机森林算法中的一种或多种。
[0016]根据本专利技术的一些优选实施方式,所述深度强化学习算法选自DDPG、TD3、A3C和PPO算法中的一种或多种。
[0017]根据本专利技术的一些优选实施方式,所述第一模型训练的输入为车速、加速度、动力电池荷电状态SOC,输出为燃料电池系统净功率。
[0018]根据本专利技术的一些优选实施方式,所述状态空间包括车速、信号灯与车辆位置的差值、信号灯的实时相位配时信息SPaT,所述动作空间包括车辆的加速度。
[0019]根据本专利技术的一些优选实施方式,所述回报函数模型包括:整体回报函数,与车辆保持当前车速行驶到信号灯路口时的信号状态有关的第一回报函数,与车辆实际通过信号灯路口时的信号状态有关的第二回报函数,及分别与车辆的速度、加速度或能耗有关第三~第五回报函数。
[0020]根据本专利技术的一些优选实施方式,所述第五回报函数包括:与需求功率相关的代价函数及与燃料消耗相关的代价函数。
[0021]根据本专利技术的一些优选实施方式,所述第二模型的训练包括:
[0022]S61.初始化深度强化学习网络、经验池和随机探索噪声;
[0023]S62.根据当前状态和随机探索噪声选择动作,并将相关经验添加到所述经验池;
[0024]S63.从添加后的经验池中选取一定长度的批量数据,进行所述深度强化学习网络的参数更新;
[0025]S64.重复进行S62和S63,直至达到最大训练回合数。
[0026]更优选的,所述深度强化学习网络包含actor网络、critic网络以及相对应的目标网络。
[0027]进一步优选的,所述actor网络采用策略梯度进行参数更新,和/或,所述critic网络采用最小化损失函数进行参数更新。
[0028]根据本专利技术的一些优选实施方式,所述最优能量管理策略通过以下模型获得:
[0029][0030]其中,状态变量x=SOC表示动力电池荷电状态;表示状态变量x对时间t的一阶导数;控制变量u=P
fcs
表示燃料电池系统净功率;t
f
表示终端时间;t表示时间;φ表示终端代价;SOC
min
,SOC
max
,P
fcs,min
,P
fcs,max

mot,min

mot,max
均为常数,分别表示SOC的最小值和最
大值、P
fcs
的最小值和最大值、ω
mot
的最小值和最大值;P
bat,min
,P
bat,max
均为荷电状态SOC的函数,分别表示P
bat
的最小值和最大值;T
mot,min
,T
mot,max
均为ω
mot
的函数,分别表示T
mot
的最小值和最大值;ξ表示SOC的动力学参数,即SOC对时间t的一阶导数
[0031]更优选的,通过将下式(9)代入式(11)后得到:
[0032][0033][0034]其中,I
bat
表示动力电池电流,V
OC
,R0,P
bat
分别表示开路电压、内阻和电池功率,V
OC
和R0都是动力电池荷电状态SOC的函数,Q
bat
表示电池容量。
[0035]根据本专利技术的一些优选实施方式,所述系统模型和其系统功率平衡模型包括以下模型中的一个或多个:
[0036]车辆纵向动力学模型:
[0037][0038][0039]P
dmd
=(F
drv
+F
brk
)v
ꢀꢀ
(2)
[0040]其中,v,M,f
r
和A分别表示车辆的位置、车速、质量、滚动阻力系数和迎风面积,表示车辆位置对时间t的一阶导数,即车速v;车辆的加速度F
drv
和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种燃料电池汽车节能驾驶优化方法,其特征在于,其包括:S1.建立所述燃料电池汽车的系统模型和其系统功率平衡模型,其中,所述系统模型包括车辆的纵向动力学模型、其电机模型、其燃料电池和/或动力电池模型;S2.基于所述系统模型和所述功率平衡模型,在电量维持模式下,利用动态规划算法求解所述燃料电池汽车在各种工况下的最优能量管理策略,由最优能量管理策略得到的最优系统和/或功率参数组成最优数据库;S3.基于所述最优数据库,利用机器学习回归算法进行第一模型训练,得到数据驱动的能量管理模型;S4.建立包含信号灯的训练场景,定义所述燃料电池汽车的状态空间和动作空间;S5.根据所述数据驱动的能量管理模型,得到所述燃料电池汽车在某个状态和/或相应动作下的燃料消耗,建立和所述燃料消耗相关的回报函数模型;S6.在所述训练场景中利用深度强化学习算法进行第二模型训练,得到训练后的节能驾驶优化模型;S7.在包含信号灯的不同测试场景中利用所述节能驾驶优化模型得到经济车速,和/或,在电量维持模式下利用动态规划算法评估与所述经济车速响应的燃料消耗。2.根据权利要求1所述的优化方法,其特征在于:所述机器学习回归算法选自XGBoost算法、神经网络算法和随机森林算法中的一种或多种;和/或,所述深度强化学习算法选自DDPG、TD3、A3C和PPO算法中的一种或多种。3.根据权利要求1所述的优化方法,其特征在于:所述第一模型训练的输入为车速、加速度、动力电池荷电状态SOC,输出为燃料电池系统净功率。4.根据权利要求1所述的优化方法,其特征在于:所述状态空间包括车速、信号灯与车辆位置的差值、信号灯的实时相位配时信息SPaT,所述动作空间包括车辆的加速度。5.根据权利要求1所述的优化方法,其特征在于:所述回报函数模型包括:整体回报函数,与车辆保持当前车速行驶到信号灯路口时的信号状态有关的第一回报函数,与车辆实际通过信号灯路口时的信号状态有关的第二回报函数,及分别与车辆的速度、加速度或能耗有关第三~第五回报函数;优选的,所述第五回报函数包括:与需求功率相关的代价函数及与燃料消耗相关的代价函数。6.根据权利要求1所述的优化方法,其特征在于:所述第二模型的训练包括:S61.初始化深度强化学习网络、经验池和随机探索噪声;S62.根据当前状态和随机探索噪声选择动作,并将相关经验添加到所述经验池;S63.从添加后的经验池中选取一定长度的批量数据,进行所述深度强化学习网络的参数更新;S64.重复进行S62和S63,直至达到最大训练回合数;其中,所述深度强化学习网络包含actor网络、critic网络以及相对应的目标网络;优选的,所述actor网络采用策略梯度进行参数更新,和/或,所述critic网络采用最小化损失函数进行参数更新。7.根据权利要求1所述的优化方法,其特征在于:所述最优能量管理策略通过以下模型获得:
其中,状态变量x=SOC表示动力电池荷电状态;表示状态变量x对时间t的一阶导数;控制变量u=P
fcs
表示燃料电池系统净功率;t
f
表示终端时间;t表示时间;φ表示终端代价;SOC
min
,SOC
max
,P
fcs,min
,P
fcs,max

mot,min

mot,max
均为常数,分别表示SOC的最小值和最大值、P
fcs
的最小值和最大值、ω
mot
的最小值和最大值;P
bat,min
,P
bat,max
均为荷电状态SOC的函数,分别表示P
bat
的最小值和最大值;T
mot,min
,T
mot,max
均为ω
mot
的函数,分别表示T
mot
的最小值和最大值;ξ表示SOC的动力学参数,即SOC对时间t的一阶导数优选的,通过将下式(9)代入式(11)后得到:(9)代入式(11)后得到:其中,I
bat
表示动力电池电流,V
OC
,R0,P
bat
分别表示开路电压、内阻和电池功率,V
OC
和R0都是动力电池荷电状态SOC的函数,Q
bat
表示电池容量。8.根据权利要求1所述的优化方法,其特征在于:所述系...

【专利技术属性】
技术研发人员:孙超刘波孙逢春任强周飞鲲
申请(专利权)人:广州汽车集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1