【技术实现步骤摘要】
本专利技术属于新能源汽车与人工智能算法的交叉领域,涉及一种深度强化学习型能量管理策略的无权重训练及测试方法。
技术介绍
1、纯电动汽车因其充电价格、环保动力和适用于城市驾驶等特点引起消费者的关注,燃料电池汽车使用氢气在燃料电池堆中产生电力,然后驱动电动机,而混合动力汽车处于更先进的技术阶段,能够满足长途旅行、便捷加油/充电、能效和减排的要求。能量管理策略是决定混合动力汽车燃油经济性的核心技术之一,需要在满足动力需求与系统约束的同时确保多个能源之间的最优能量分配。近年,强化学习在游戏和自动驾驶等领域取得了许多惊人的成就,研究热度逐年增加。同时,为了解决传统强化学习中的“离散误差”和“维度灾难”等缺陷,学者们开始更加关注于深度强化学习算法,如深度值网络、深度确定性策略梯度、软性演员-评论家等。然而,在针对能量管理策略的实际研究过程中存在以下两点问题:
2、(1)奖励函数中的soc偏差项可能误导强化学习智能体。许多研究都采用包含瞬时燃油消耗和电荷状态偏差的奖励函数,这可能受到以往基于等效燃油消耗最小策略算法的影响。在强化学习的背景
...【技术保护点】
1.一种深度强化学习型能量管理策略的无权重训练及测试方法,其特征在于,该方法具体包括以下步骤:
2.根据权利要求1所述的无权重训练及测试方法,其特征在于,步骤S1具体包括以下步骤:
3.根据权利要求1所述的无权重训练及测试方法,其特征在于,步骤S2具体包括以下步骤:
4.根据权利要求1所述的无权重训练及测试方法,其特征在于,步骤S3中,设计无权重化训练方法,具体包括以下步骤:
5.根据权利要求1所述的无权重训练及测试方法,其特征在于,步骤S32中,为了优化训练过程,两个优化项均以归一化形式进行表征,具体如下:
【技术特征摘要】
1.一种深度强化学习型能量管理策略的无权重训练及测试方法,其特征在于,该方法具体包括以下步骤:
2.根据权利要求1所述的无权重训练及测试方法,其特征在于,步骤s1具体包括以下步骤:
3.根据权利要求1所述的无权重训练及测试方法,其特征在于,步骤s2具体包括以...
【专利技术属性】
技术研发人员:唐小林,陈佳信,汪锋,杨为,李佳承,
申请(专利权)人:重庆大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。