【技术实现步骤摘要】
本申请涉及车辆智控,具体而言,涉及一种自适应交通决策引擎的训练方法及装置。
技术介绍
1、目前,随着城市交通的日益复杂化,传统的车辆导航系统在应对动态变化的交通环境方面显得力不从心。为了提高道路安全性并优化交通流,需要一种能够实时适应复杂交通模式的高级决策系统。此外,当前的强化学习方法在处理高度不确定和多变的环境时存在局限性,特别是在信息探索和利用平衡方面。
技术实现思路
1、本申请实施例的目的在于提供一种自适应交通决策引擎的训练方法及装置,能够通过训练得到的自适应交通决策引擎动态适应复杂的交通环境,优化行驶路径,并减少潜在风险;同时,提高决策过程的准确性、适应性和安全性。
2、本申请第一方面提供了一种自适应交通决策引擎的训练方法,包括:
3、获取车辆实际驾驶过程中的多模态数据;
4、基于所述多模态数据的模态,对所述多模态数据进行分别编码,得到多模态特征;
5、对所述多模态特征进行融合,以使所述多模态特征映射到统一的表示空间中;
...
【技术保护点】
1.一种自适应交通决策引擎的训练方法,其特征在于,包括:
2.根据权利要求1所述的自适应交通决策引擎的训练方法,其特征在于,所述对所述多模态特征进行融合,以使所述多模态特征映射到统一的表示空间中,包括:
3.根据权利要求1所述的自适应交通决策引擎的训练方法,其特征在于,所述经验池,用于存储所述多智能体强化学习模型中各智能体的状态、动作、奖励以及新状态,以使存储的数据用于所述多智能体强化学习模型训练过程中的学习和决策;其中,所述智能体用于指代新能源车辆。
4. 根据权利要求1所述的自适应交通决策引擎的训练方法,其特征在于,所述设置自适
...【技术特征摘要】
1.一种自适应交通决策引擎的训练方法,其特征在于,包括:
2.根据权利要求1所述的自适应交通决策引擎的训练方法,其特征在于,所述对所述多模态特征进行融合,以使所述多模态特征映射到统一的表示空间中,包括:
3.根据权利要求1所述的自适应交通决策引擎的训练方法,其特征在于,所述经验池,用于存储所述多智能体强化学习模型中各智能体的状态、动作、奖励以及新状态,以使存储的数据用于所述多智能体强化学习模型训练过程中的学习和决策;其中,所述智能体用于指代新能源车辆。
4. 根据权利要求1所述的自适应交通决策引擎的训练方法,其特征在于,所述设置自适应奖励函数,包括:
5.根据权利要求1所述的自适应交通决策引擎的训练方法,其特征在于,所述基于所述经验池和所述多智能体强化学习模型进行训练,得到自适应交通决策引...
【专利技术属性】
技术研发人员:王书敏,赵云峰,郭国盛,
申请(专利权)人:广汽埃安新能源汽车股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。