自动驾驶决策方法、装置、电子设备和存储介质制造方法及图纸

技术编号:42010104 阅读:17 留言:0更新日期:2024-07-12 12:29
本申请提供一种自动驾驶决策方法、装置、电子设备和存储介质,其中,自动驾驶决策方法包括:获取输入数据;将所述输入数据作为深度强化学习网络的输入,以使所述深度强化学习网络输出控制策略和所述控制策略的不确定性数值;当所述控制策略的不确定性数值大于预设阈值时,执行所述控制策略,否则执行备份策略。本申请能够基于认知不确定性作出自动驾驶决策。

【技术实现步骤摘要】

本申请涉及自动驾驶领域,具体而言,涉及一种自动驾驶决策方法、装置、电子设备和存储介质


技术介绍

1、自动驾驶车辆的决策系统需要应对各种不同的环境和情境,与其他交通参与者进行交互,并考虑不确定性。当前,使用机器学习方法创建通用决策智能体具有吸引力,但学习型智能体的缺陷在于其通常提供黑箱解决方案,只输出给定情况下的决策。理想情况下,智能体还将提供其决策估计的不确定性,即认知不确定性。这是由于缺乏知识而产生的,可以通过增加数据的观察量来减小。例如,如果决策系统只被训练用于处理“正常”驾驶情况,那么面临超速驾驶者或事故时将会出现认知不确定性。


技术实现思路

1、本申请实施例的目的在于提供一种自动驾驶决策方法、装置、电子设备和存储介质,用于基于认知不确定性作出自动驾驶决策。

2、第一方面,本专利技术提供一种自动驾驶决策方法,所述方法包括:

3、获取输入数据;

4、将所述输入数据作为深度强化学习网络的输入,以使所述深度强化学习网络输出控制策略和所述控制策略的不确定性数值;

...

【技术保护点】

1.一种自动驾驶决策方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述深度强化学习网络包括若干个集成成员,所述集成成员为组成所述深度强化学习网络的神经网络模型,所述集成成员用于基于动作价值函数输出在当前状态采取不同目标动作的动作价值,所述当前状态由所述输入数据确定,以及,所述方法还包括:

3.如权利要求2所述的方法,其特征在于,所述集成成员包括随机化先验函数,其中,所述随机化先验函数用于生成作为第一参数的先验函数参数;

4.如权利要求3所述的方法,其特征在于,所述方法还包括:

5.如权利要求2所述的方法,其特征在...

【技术特征摘要】

1.一种自动驾驶决策方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述深度强化学习网络包括若干个集成成员,所述集成成员为组成所述深度强化学习网络的神经网络模型,所述集成成员用于基于动作价值函数输出在当前状态采取不同目标动作的动作价值,所述当前状态由所述输入数据确定,以及,所述方法还包括:

3.如权利要求2所述的方法,其特征在于,所述集成成员包括随机化先验函数,其中,所述随机化先验函数用于生成作为第一参数的先验函数参数;

4.如权利要求3所述的方法,其特征在于,所述方法还包括:

5.如权利要求2所述的方法,其特征在于,所述方法还包括:<...

【专利技术属性】
技术研发人员:隋月李霓霞朱广盛
申请(专利权)人:广汽埃安新能源汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1