当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于强化学习的电动汽车AMT升降挡方法技术

技术编号:39164686 阅读:12 留言:0更新日期:2023-10-23 15:04
本发明专利技术公开了一种基于强化学习的电动汽车AMT升降挡方法,包括如下步骤:包括:构建换挡网络模型,所述换挡网络模型包括策略网络和评价网络;以车速、车辆加速度和油门踏板开度作为所述策略网络的输入变量,以换挡指令作为所述策略网络的输出变量;以车速、车辆加速度和油门踏板开度和所述换挡指令为评价网络的输入变量,所述评价网路输出当前换挡指令的价值;计算换挡策略综合评价指数;以所述换挡策略综合评价指数和当前换挡指令的价值的差值最小作为优化目标,对所述换挡网络模型进行优化,得到最优换挡网络模型;在车辆行驶过程中,实时检测车速、车辆加速度和油门踏板开度作为最优换挡网络模型的输入变量,通过最优换挡网络模型得到换挡指令。络模型得到换挡指令。络模型得到换挡指令。

【技术实现步骤摘要】
一种基于强化学习的电动汽车AMT升降挡方法


[0001]本专利技术属于电动汽车升降挡控制
,特别涉及一种基于强化学习的电动汽车AMT升降挡方法。

技术介绍

[0002]近年来,全球能源与环境的严峻形势,推动各国加快交通能源战路转型。作为战路性新兴产业之一的新能源汽车产业,已经成为我国节能减排、振兴经济和转变产业结构的重要突破口。
[0003]《节能与新能源汽车产业发展规划(2012

2020年)》中强调我国坚持纯电驱动战路取向发展新能源汽车产业。市场占有率逐年提高,电动汽车产业正在迅速发展并成为全球汽车产业转型发展的主要方向和促进世界经济持续增长的重要引擎。
[0004]自动变速器是电动汽车实现自动操纵的核心总成之一,能大大减少驾驶员操纵疲劳、提高驾驶操纵性和行车安全性,其控制品质直接影响整车的操纵性、舒适性、安全性、动力性及经济性,是衡量汽车整体技术水平的重要标志之一,是汽车核心技术国际竞争力的主要体现,在汽车产业中占有重要的份额。随着传统汽车技术的不断进步以及各种新能源汽车的发展,对汽车动力传动系统自动操纵及匹配技术的要求越来越高,自动变速器控制技术日趋复杂挡位決策是汽车自动变速理论的核心内容,其主要功能是解决汽车行驶过程中何时换挡的问题,即根据驾驶员操作、车辆运行状态及行驶环境选择合理的换挡时机,其合理性直接影响整车的动力性、经济性和驾驶性等性能,提高自动变速器挡位决策系统的智能化水平是国际汽车传动领域的关注焦点和研究热点。
[0005]在这样的社会背景下,传统档位决策优化技术却存在一定的局限性:由于传统的挡位决策方法的制定过程大多建立在发动机/电机特性台架试验基础之上,并基于实验数据设计最佳换挡策略,因此其应用需要进行大量的人工标定,开发流程存在周期长、成本高、工作量大的缺点;而且由于车辆行驶的现实条件和最优规律所设定的条件有较大差别,因此传统的档位决策方法很难保证结果最优。

技术实现思路

[0006]本专利技术设计开发了一种基于强化学习的电动汽车AMT升降挡方法,本专利技术的目的是,将强化学习理论应用于电动汽车挡位决策与优化,并且在换挡决策中综合考虑动力性、经济性等多重整车性能,能够大大缩短换挡策略的开发周期,快速获取电动汽车最优挡位决策策略。
[0007]本专利技术提供的技术方案为:
[0008]一种基于强化学习的电动汽车AMT升降挡方法,包括如下步骤:
[0009]构建换挡网络模型,所述换挡网络模型包括策略网络和评价网络;
[0010]以车速、车辆加速度和油门踏板开度作为所述策略网络的输入变量,以换挡指令作为所述策略网络的输出变量;以车速、车辆加速度和油门踏板开度和所述换挡指令为所
述评价网络的输入变量,所述评价网路输出当前换挡指令的价值;
[0011]计算换挡策略综合评价指数;以所述换挡策略综合评价指数和当前换挡指令的价值的差值最小作为优化目标,对所述换挡网络模型进行优化,得到最优换挡网络模型;
[0012]其中,所述换挡策略综合评价指数通过如下公式计算:
[0013]r=k1*r1+k2*r2+k3*r3+k4*r4;
[0014]式中,r1为动力性评价分数,r2为经济性评价分数,r3为换挡原则评价分数,r4换挡间隔评价分数;k1、k2、k3、k4分别为各评分数的相对权重;
[0015]在车辆行驶过程中,实时检测车速、车辆加速度和油门踏板开度作为所述最优换挡网络模型的输入变量,通过所述最优换挡网络模型得到换挡指令。
[0016]优选的是,所述动力性评价分数的计算方法为:
[0017][0018]其中,J为车辆冲击度,J_max为最大冲击度,error_v为速度误差。
[0019]优选的是,所述经济性评价分数的计算方法为:
[0020][0021]其中,e0为电机当前效率,e为换挡后的电机效率。
[0022]优选的是,所述换挡原则评价分数的计算方法为:
[0023][0024]优选的是,所述换挡时间间隔评价分数的计算方法为:
[0025][0026]其中,delta_t表示当前次换挡距离上一次换挡经过的时间。
[0027]优选的是,采用ppo算法对所述换挡网络模型进行优化。
[0028]本专利技术的有益效果是:
[0029](1)本专利技术提供的基于强化学习的电动汽车AMT升降挡方法,能够在满足动力性要求和驾驶舒适性的情况下提高电动汽车续航里程,减小整车能耗,降低车辆的生产和使用成本。
[0030](2)本专利技术提供的基于强化学习的电动汽车AMT升降挡方法,采用强化学习(RL)来进行优化决策过程,在寻求最佳换挡MAP的过程中可以达到解放人力、实现自动化的目的。
[0031](3)本专利技术提供的基于强化学习的电动汽车AMT升降挡方法,能够是用于不同的车型,具有较好的通用性。
[0032](4)本专利技术提供的基于强化学习的电动汽车AMT升降挡方法,通过Matlab和Simulink进行联合建立挡位决策控制模型,并构建仿真平台,从而实现系统软件开发流程的前移化、模型化,提升开发效率、缩短开发周期、降低开发成本。
附图说明
[0033]图1为本专利技术所述的基于强化学习的电动汽车AMT升降挡方法的流程图。
[0034]图2为本专利技术所述的搭载两挡AMT纯电动汽车结构简图。
[0035]图3为本专利技术所述的强化学习算法的原理图。
具体实施方式
[0036]下面结合附图对本专利技术做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
[0037]如图1所示,本专利技术提供了一种基于强化学习的电动汽车AMT升降挡方法,具体实施过程如下。
[0038]一、确定预期行驶工况,并在Simulink中建立汽车纵向动力学模型,并设置好汽车各项参数、行驶工况参数。
[0039]汽车纵向动力学模型包括:
[0040]1.1整车模型
[0041]该模块以变速箱实际输出扭矩、整车制动扭矩和坡度为输入,计算得到整车的行驶阻力、车速、里程、车轮转速、加速度等车辆实时信息参数。
[0042]首先以获得变速箱实际输出转矩和整车制动扭矩相加然后除以车轮半径即得到车辆的总牵引力,然后跟据汽车动力平衡公式,即总牵引力=滚动阻力+加速阻力+风阻+滚动阻力,获得加速阻力。
[0043]其中四个阻力的计算公式如下:
[0044]加速阻力:
[0045]F=δma
[0046]式中:m为整车整备质量;δ为整车旋转质量系数。
[0047]风阻:
[0048][0049]式中:C
D
为空气阻力系数;A为整车迎风面积;
[0050]坡道阻力:
[0051]F=mgsin[arctan(α)][0052]滚动阻力:
[0053]F=mgcos[arctan(α)]*μ
r
[005本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的电动汽车AMT升降挡方法,其特征在于,包括:构建换挡网络模型,所述换挡网络模型包括策略网络和评价网络;以车速、车辆加速度和油门踏板开度作为所述策略网络的输入变量,以换挡指令作为所述策略网络的输出变量;以车速、车辆加速度和油门踏板开度和所述换挡指令为所述评价网络的输入变量,所述评价网路输出当前换挡指令的价值;计算换挡策略综合评价指数;以所述换挡策略综合评价指数和当前换挡指令的价值的差值最小作为优化目标,对所述换挡网络模型进行优化,得到最优换挡网络模型;其中,所述换挡策略综合评价指数通过如下公式计算:r=k1*r1+k2*r2+k3*r3+k4*r4;式中,r1为动力性评价分数,r2为经济性评价分数,r3为换挡原则评价分数,r4换挡间隔评价分数;k1、k2、k3、k4分别为各评分数的相对权重;在车辆行驶过程中,实时检测车速、车辆加速度和油门踏板开度作为所述最优换挡网络模型的输入变量,通过所述...

【专利技术属性】
技术研发人员:付尧滕宇涵欧阳欢雷雨龙董瑞刘科李成哲宫薪添回禹杭
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1