【技术实现步骤摘要】
本申请涉及汽车能量回收,特别是涉及一种强化学习模型训练方法、滑行能量回收方法、装置和系统。
技术介绍
1、随着新能源汽车技术的快速发展,能量回收系统已成为电动汽车和混合动力汽车提升能源利用率的核心技术之一,主要包括制动能量回收和滑行能量回收,其中,滑行能量回收是指将车辆滑行过程中的动能转化为电能存储于电池中,从而延长续航里程。
2、传统的滑行能量回收技术通常根据车速和踏板信号等确定能量回收扭矩的大小,实现滑行能量回收的控制,在实际应用场景中存在不足。例如,在车辆下坡滑行工况中,未能充分考虑实际路况对能量回收效率的动态影响,导致无法有效回收过剩能量,迫使驾驶员使用机械制动系统,不仅造成能量浪费,还会加剧制动部件磨损。
3、因此,在车辆下坡滑行工况中还存在能量回收率较低的问题。
技术实现思路
1、基于此,提供一种强化学习模型训练方法、滑行能量回收方法、装置和系统,以提高车辆下坡滑行工况中的滑行能量回收率。
2、第一方面,提供一种强化学习模型训练方法,所述方法
本文档来自技高网...
【技术保护点】
1.一种强化学习模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的强化学习模型训练方法,其特征在于,每个所述样本状态参数还包括样本车速和样本电池剩余容量中的至少一项,所述训练后的强化学习模型还用于在车辆处于下坡滑行工况中时,根据实时车速和实时电池剩余容量中的至少一项以及实时坡度,预测实时扭矩调整系数。
3.根据权利要求1或2所述的强化学习模型训练方法,其特征在于,将任一所述样本状态参数输入所述价值网络中,得到所述预测扭矩调整系数对应的优势评估值,包括:
4.根据权利要求1或2所述的强化学习模型训练方法,其特征在于,根
...【技术特征摘要】
1.一种强化学习模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的强化学习模型训练方法,其特征在于,每个所述样本状态参数还包括样本车速和样本电池剩余容量中的至少一项,所述训练后的强化学习模型还用于在车辆处于下坡滑行工况中时,根据实时车速和实时电池剩余容量中的至少一项以及实时坡度,预测实时扭矩调整系数。
3.根据权利要求1或2所述的强化学习模型训练方法,其特征在于,将任一所述样本状态参数输入所述价值网络中,得到所述预测扭矩调整系数对应的优势评估值,包括:
4.根据权利要求1或2所述的强化学习模型训练方法,其特征在于,根据所述优势评估值更新所述策略网络的参数,包括:<...
【专利技术属性】
技术研发人员:凌青海,曹华军,庞俊康,胡平,李强,陈才勇,史鑫威,
申请(专利权)人:重庆大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。