换挡策略生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:41793953 阅读:20 留言:0更新日期:2024-06-24 20:19
本发明专利技术提供了一种换挡策略生成方法、装置、电子设备及存储介质,属于交通技术领域,其方法包括:基于预设的变量与车辆挡位状态之间的对应关系建立第一模型,其中,变量包括状态变量以及动作变量;基于预设的换挡策略目标建立阶梯性引导奖励函数;基于分阶段训练方法以及不同速度梯度的路谱数据获取换挡曲线;基于深度强化学习方法、阶梯性引导奖励函数、第一模型以及换挡曲线确定第二模型;基于第二模型生成最终的换挡策略。解决了现有技术获取的换挡策略泛化性较低的问题。

【技术实现步骤摘要】

本专利技术涉及交通,尤其涉及一种换挡策略生成方法、装置、电子设备及存储介质


技术介绍

1、换挡策略就是根据车辆的状态、行驶环境和驾驶员意图来确定最好的挡位和换挡时机。这对amt变速器的效果有直接影响,还能影响到车辆的动力、舒适度和经济性。现有技术通常用图解法、解析法、遗传算法和动态规划法等方法来求解换挡策略。

2、随着计算机技术和深度强化学习等智能优化算法的发展,可以利用强化学习算法根据不同的需求场景训练出一套综合表现较好的换挡策略。现有技术已经公开了一种基于深度强化学习的换挡策略动态优化方法。它利用状态变量(比如车速、加速度和油门开度)和动作变量(比如挡位)确定了换挡策略的马尔科夫决策过程,并使用了dqn算法进行求解。

3、然而,该方法的训练工况较为单一,动力学模型也比较简单,所以训练得到的换挡策略泛化能力不够高,在实际驾驶情况下的性能还需要进一步验证和改进。


技术实现思路

1、有鉴于此,有必要提供一种换挡策略生成方法、装置、电子设备及可读存储介质,用以解决现有技术获取的换挡策略泛本文档来自技高网...

【技术保护点】

1.一种换挡策略生成方法,其特征在于,包括:

2.根据权利要求1所述的换挡策略生成方法,其特征在于,所述状态变量至少包括:车速、加速度、发动机需求力矩、单位距离油耗以及发动机转速;

3.根据权利要求2所述的换挡策略生成方法,其特征在于,所述第一模型,包括:

4.根据权利要求1所述的换挡策略生成方法,其特征在于,所述预设的换挡策略目标包括:速度跟随、油耗降低、发动机转速区间限制、运行时间,以及与先验知识重合度。

5.根据权利要求4所述的换挡策略生成方法,其特征在于,所述阶梯性引导奖励函数包括:

6.根据权利要求1所述的换挡策略生成...

【技术特征摘要】

1.一种换挡策略生成方法,其特征在于,包括:

2.根据权利要求1所述的换挡策略生成方法,其特征在于,所述状态变量至少包括:车速、加速度、发动机需求力矩、单位距离油耗以及发动机转速;

3.根据权利要求2所述的换挡策略生成方法,其特征在于,所述第一模型,包括:

4.根据权利要求1所述的换挡策略生成方法,其特征在于,所述预设的换挡策略目标包括:速度跟随、油耗降低、发动机转速区间限制、运行时间,以及与先验知识重合度。

5.根据权利要求4所述的换挡策略生成方法,其特征在于,所述阶梯性引...

【专利技术属性】
技术研发人员:李煜辉黄尹民
申请(专利权)人:武汉理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1