当前位置: 首页 > 专利查询>东华大学专利>正文

电动汽车能源管理与分配方法组成比例

技术编号:23693766 阅读:44 留言:0更新日期:2020-04-08 09:00
本发明专利技术涉及一种电动汽车能源管理与分配方法,一个实施例的方法包括:建立电动汽车的系统模型,对汽车不同的工况进行量化,确定能源管理系统的状态空间;确定优化目标函数,使得电动汽车在一个行驶周期内的耗能最少;使用强化学习的方法对目标函数进行优化,确定马尔可夫决策过程的状态转移概率及回报函数;在多次工况运行后生成“状态‑动作映射”Q矩阵,并对其不断进行更新,获得最佳的能源管理策略。本实施例方案提高了电动汽车在行驶过程中的能源利用效率。

Energy management and distribution method of electric vehicle

【技术实现步骤摘要】
电动汽车能源管理与分配方法
本专利技术涉及信息处理
,特别是涉及一种电动汽车能源管理与分配策略以及其实现算法。
技术介绍
目前,推动汽车工业的节能化、信息化发展是大势所趋,大力推进传统汽车工业向新能源汽车转型升级也已成为全球汽车产业的首要任务。电动汽车包括纯电动汽车、混合动力汽车以及燃料电池汽车等。就目前的发展状况而言:混合动力汽车可以在一定程度上缓解汽车对石油能源的依赖,然而其终究无法实现无污染和零排放,只是一种向新能源过渡的暂时性方案;纯电动汽车兼具能源效率高、零排放、噪声小、维修方便、结构简单等优点,而且还可使用非化石燃料的其他能源转化为电能,是理想的实现节能减排的选择。然而,由于电池储能技术长时间未取得革命性突破,续航里程短、充电时间长的问题长期以来制约着电动汽车的大规模推广和应用。在电动汽车能源管理领域,基于规则的能量管理策略在实际应用中最为广泛,但这种策略不具有动态优化的特性,它们无法在复杂的行驶环境下充分发挥电动汽车节能潜质。还有一种基于优化的能源管理策略,这种策略需要将待优化的问题转化为若干数学约束式进行表示,并确定求解目标、设计反馈函数,利用优化算法探寻达到最值的方法,其缺点是需要预知行驶工况、计算量大、灵活性差,无法保证全局最优,使其实际优化效果大打折扣。有研究人员将机器学习应用于混动汽车的能源管理,通过不断尝试获得赏罚信息的方式进行探索,脱离了对被控系统模型的依赖。但是学习的方法有赖于执行完一个动作之后环境所反馈的奖励信号,这种反馈总是存在不可避免的噪声和延时。专利
技术实现思路
本专利技术的目的是:降低电动汽车在行驶过程中的能量损耗,提高电动汽车的能源利用率。为了达到上述目的,本专利技术的技术方案是提供了一种电动汽车能源管理与分配方法,其特征在于,包括以下步骤:步骤1、将电动汽车的电力设备分为高压供电网网络、低压供电网络、充电网络三大类,其中:高压供电网络包含热管理系统和驱动系统;低压供电网络用以支持全车低压电子部件的用电;充电系统用于从电网向车载电池补充能量,建立电动汽车能源系统模型如下式(1)所示,根据现实中复杂多变的汽车运行工况,对汽车不同的工况进行量化,确定能源系统的状态空间:式(1)中,ECR表示能源消耗率;kAC(t)表示热管理系统功率系数,表示将高压供电系统分配给热管理系统的功率占热管理系统峰值功率的比例;T表示一个行驶周期时长;Pmot(t)表示向驱动系统输出的最大功率;PHV(t)表示可被能源管理系统所分配的高压供电网络的总功率;PAC-max(t)表示电动汽车的制冷设备的峰值功率;Pdrv(t)表示电动汽车的驾驶员所期望的驱动系统实际输出功率;步骤2、根据步骤1建立的电动汽车能源系统模型确定优化目标函数,使得电动汽车在一个行驶周期内的耗能最少,将求解ECR最小化的问题转化为求解0~T时间段内电动汽车在[0,T]时间段内总电量消耗E(t)最小化的问题,E(t)如下式(2)所示:式(2)中,是驱动系统所消耗总能量;是热管理系统所消耗的能量;是车辆低压供电网络所消耗的能量,PLV(τ)表示低压供电网络所需的总功率;Eloss(ΔT(t))是0~t时间段内电池组温度变化而耗散的能量;步骤3、使用强化学习的方法对步骤2确定的目标函数进行优化,强化学习模型采用Markov决策过程;在车辆运行过程中,使用Q-learning算法对能量分配策略进行学习和优化,Q-learning算法其Q矩阵采用以下的策略不断更新,以得到更为节能的能源分配策略使得车辆的能源管理系统拥有一个状态动作值矩阵,即Q表,Q表内的每一项Q(s,a)为状态s与动作a的映射关系,当电动汽车能源管理系统在某一状态s下进行能量分配时,Q表采用式(3)的方法进行更新:Q(s,a)t+1←Q(s,a)t+α[rt+γmaxa(t+1)Q(s,a)t+1-Q(s,a)t](3)式(3)中,Q(s,a)t是在采取动作a之前智能体对映射(s,a)的估计;rt+γmaxa(t+1)Q(s,a)t+1是Q(s,a)的现实值;α是学习率,表示Q值的过去值和新获得奖励的加权关系;γ∈[0,1]是衰减系数,反应未来奖励对当前决策的重要性,γ越大表示智能体在采取动作a是越倾向于考虑未来奖励的影响;步骤4、当Q(s,a)t收敛于最优映射时,认为系统已经完成了学习过程,即Q-learning算法得到的最优策略为:式(4)中,argmax是对函数求参数的函数,即求得使得策略π(s)最大的Q表映射,对于离散性的马尔可夫决策问题,这是使得系统策略最佳的必要条件,即对于环境所处的任意状态s,能量管理系统总能选择使得Q值最大的动作a*。优选地,将新欧洲标准循环测试NEDC的循环测试工况表示为只有加速、减速、等速和停车四种状态;通过电动汽车的参数表计算出车辆处于每种测试状态时的电动机输出功率Pmot(t)。优选地,将驱动系统的功率Pmot(t)和电池组的温度ΔT(t)定义为步骤3中强化学习模型的状态空间,记为将电动汽车的制冷系统的运行功率分配系数kAC(t)定义为步骤3中强化学习模型的动作空间;步骤3中强化学习模型的奖励函数定义为r(t)=ravg(t)-E(t),其中,ravg(t)为0~t时刻智能体所获得的奖励的平均值,对于时间离散的系统奖励的平均值r(tn)为tn时刻智能体所获得的奖励。优选地,在所述Q-learning算法的基础上引入8-greedy策略,使得系统不仅会采取由Q表中所得出的最优动作,并且会以某个概率对当前Q值并非最大的动作进行试探。根据如上所述的本专利技术的方案,对电动汽车的能源管理系统而言,其需要事先有一定行驶工况的积累,根据不同工况下汽车能源消耗的情况,环境会给予管理系统的智能体反馈,评价先前的能源分配策略是否足够高效。经过足够多次的训练,可以使得电动汽车能源管理系统产生一张“工况-最佳动作”的映射Q表,即得到了车辆在某一工况下的最佳能量管理策略。根据这一策略进行能量分配,将显著提高电动汽车的能量利用率。附图说明图1是一个本实施例方案的电动汽车能源管理系统部件结构示意图;图2是一个实施例的能源管理系统能量流动示意图;图3是一个实施例的磷酸铁锂电池组不同温度下的放电效率示意图;图4是一个本实例的强化学习系统模型示意图;图5是一个本实例的能源管理系统Q-learning算法流程示意图。具体实施方式下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术本文档来自技高网
...

【技术保护点】
1.一种电动汽车能源管理与分配方法,其特征在于,包括以下步骤:/n步骤1、将电动汽车的电力设备分为高压供电网网络、低压供电网络、充电网络三大类,其中:高压供电网络包含热管理系统和驱动系统;低压供电网络用以支持全车低压电子部件的用电;充电系统用于从电网向车载电池补充能量,建立电动汽车能源系统模型如下式(1)所示,根据现实中复杂多变的汽车运行工况,对汽车不同的工况进行量化,确定能源系统的状态空间:/n

【技术特征摘要】
1.一种电动汽车能源管理与分配方法,其特征在于,包括以下步骤:
步骤1、将电动汽车的电力设备分为高压供电网网络、低压供电网络、充电网络三大类,其中:高压供电网络包含热管理系统和驱动系统;低压供电网络用以支持全车低压电子部件的用电;充电系统用于从电网向车载电池补充能量,建立电动汽车能源系统模型如下式(1)所示,根据现实中复杂多变的汽车运行工况,对汽车不同的工况进行量化,确定能源系统的状态空间:



式(1)中,ECR表示能源消耗率;kAC(t)表示热管理系统功率系数,表示将高压供电系统分配给热管理系统的功率占热管理系统峰值功率的比例;T表示一个行驶周期时长;Pmot(t)表示向驱动系统输出的最大功率;PHV(t)表示可被能源管理系统所分配的高压供电网络的总功率;PAC-max(t)表示电动汽车的制冷设备的峰值功率;Pdrv(t)表示电动汽车的驾驶员所期望的驱动系统实际输出功率;
步骤2、根据步骤1建立的电动汽车能源系统模型确定优化目标函数,使得电动汽车在一个行驶周期内的耗能最少,将求解ECR最小化的问题转化为求解0~T时间段内电动汽车在[0,T]时间段内总电量消耗E(t)最小化的问题,E(t)如下式(2)所示:



式(2)中,是驱动系统所消耗总能量;是热管理系统所消耗的能量;是车辆低压供电网络所消耗的能量,PLV(τ)表示低压供电网络所需的总功率;Eloss(ΔT(t))是0~t时间段内电池组温度变化而耗散的能量;
步骤3、使用强化学习的方法对步骤2确定的目标函数进行优化,强化学习模型采用Markov决策过程;
在车辆运行过程中,使用Q-learning算法对能量分配策略进行学习和优化,Q-learning算法其Q矩阵采用以下的策略不断更新,以得到更为节能的能源分配策略使得车辆的能源管理系统拥有一个状态动作值矩阵,即Q表,Q表内的每一项Q(s,a)为状态s与动作a的映射关系,当电动汽车能源管理系统在某一状态s下进行能量分配时,Q表采用式(3)的方法进行更新:
Q(s,a...

【专利技术属性】
技术研发人员:张光林黄淦赵萍
申请(专利权)人:东华大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1