决策信息生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38042182 阅读:9 留言:0更新日期:2023-06-30 11:08
本公开提供了一种决策信息生成方法、装置、电子设备及存储介质,涉及人工智能技术领域和自动驾驶技术领域。该决策信息生成方法包括:响应于接收到目标车辆的驾驶服务请求,获取目标车辆的实时运动状态信息、目标区域的车道类型信息和交通参与对象与目标车辆的实时相对运动状态信息。利用驾驶场景分析模型对实时运动状态信息和车道类型信息进行处理,得到目标驾驶场景信息。根据目标驾驶场景信息,确定目标驾驶行为决策模型。利用目标驾驶行为决策模型对实时运动状态信息和实时相对运动状态信息进行处理,得到目标车辆的驾驶动作决策信息。信息。信息。

【技术实现步骤摘要】
决策信息生成方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能
和自动驾驶
,更具体地,涉及一种决策信息生成方法、装置、电子设备、存储介质和程序产品。

技术介绍

[0002]随着自动驾驶技术的不断发展,自动驾驶车辆作为一种能够进行感知环境、动态决策、线路规划、行为控制、命令执行等多种功能于一体的智能设备,被广泛应用于各种领域。相关技术中,通常是基于静态的地图数据结合预先设定好的规则,进行驾驶决策,以躲避驾驶路径中的静态障碍物。
[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题:在实际的驾驶环境中,除静态障碍物之外,还存在动态变化的动态障碍物,导致利用相关技术中得到的驾驶决策的准确度较低,使得自动驾驶过程存在安全性的风险。

技术实现思路

[0004]有鉴于此,本公开提供了一种决策信息生成方法、装置、电子设备、存储介质和程序产品。
[0005]本公开的一个方面提供了一种决策生成方法,包括:
[0006]响应于接收到目标车辆的驾驶服务请求,获取目标车辆的实时运动状态信息、目标区域的车道类型信息和交通参与对象与目标车辆的实时相对运动状态信息。利用驾驶场景分析模型对实时运动状态信息和车道类型信息进行处理,得到目标驾驶场景信息。根据目标驾驶场景信息,确定目标驾驶行为决策模型。利用目标驾驶行为决策模型对实时运动状态信息和实时相对运动状态信息进行处理,得到目标车辆的驾驶动作决策信息。
[0007]根据本公开的实施例,实时运动状态信息包括实时驾驶方向信息和实时位置信息,利用驾驶场景分析模型对实时运动状态信息和车道类型信息进行处理,得到目标驾驶场景信息,包括:
[0008]从目标区域中确定目标任务点的位置信息和场景切换点的位置信息。根据实时位置信息和场景切换点的位置信息,得到实时位置与场景切换点之间的距离信息。根据目标任务点的位置信息,从目标区域的车道类型信息中查询到目标任务点的车道类型信息。利用驾驶场景分析模型对距离信息、实时驾驶方向和目标任务点的车道类型信息进行处理,得到目标驾驶场景信息。
[0009]根据本公开的实施例,利用驾驶场景分析模型对距离信息、实时驾驶方向和目标任务点的车道类型信息进行处理,得到目标驾驶场景信息,包括:
[0010]根据实时驾驶方向和目标任务点的车道类型信息,确定多个候选场景切换条件。根据距离信息,从多个候选场景切换条件中确定目标驾驶场景信息。
[0011]根据本公开的实施例,利用目标驾驶行为决策模型对实时运动状态信息和实时相对运动状态信息进行处理,得到目标车辆的驾驶动作决策信息,包括:
[0012]根据目标驾驶场景信息和实时相对运动状态信息,确定目标交通参与对象。从实时相对运动状态信息中筛选到目标交通参与对象与目标车辆的目标实时相对运动状态信息。根据目标驾驶场景信息,确定目标运动状态的属性信息。从目标车辆的实时运动状态信息中筛选到与目标运动状态的属性信息对应的目标实时运动状态信息。利用目标驾驶行为决策模型对目标实时运动状态信息和目标实时相对运动状态信息,得到驾驶动作决策信息。
[0013]根据本公开的实施例,根据目标驾驶场景信息和实时相对运动状态信息,确定目标交通参与对象,包括:
[0014]根据实时相对运动状态信息,确定交通参与对象与目标车辆的相对位置关系。根据相对位置关系,确定交通参与对象对目标车辆在目标驾驶场景中的风险程度。根据风险程度,从交通参与对象中筛选到目标交通参与对象。
[0015]根据本公开的实施例,根据相对位置关系,确定交通参与对象对目标车辆在目标驾驶场景中的风险程度,包括:
[0016]根据相对位置关系,得到交通参与对象与目标车辆的驾驶轨迹的关联关系。根据驾驶轨迹的关联关系,确定风险程度。
[0017]根据本公开的实施例,目标驾驶行为决策模型的训练方法,包括:
[0018]在模拟驾驶场景中,获取测试车辆的运动状态信息、交通参与对象与测试车辆的相对运动状态信息。从目标车辆的动作概率分布空间中随机选择驾驶动作信息。基于近端策略优化算法,利用驾驶动作信息、测试车辆的运动状态信息、交通参与对象与测试车辆的相对运动状态信息进行处理对预设模型进行训练,得到目标驾驶行为决策模型。
[0019]根据本公开的实施例,驾驶动作信息包括S个驾驶动作信息,其中,S为大于1的整数,预设模型中包括策略网络和价值网络,基于近端策略优化算法,利用驾驶动作信息、测试车辆的运动状态信息、交通参与对象与测试车辆的相对运动状态信息进行处理对预设模型进行训练,得到目标驾驶行为决策模型,包括:
[0020]针对第s个驾驶动作信息,利用策略网络对第s个驾驶动作信息、测试车辆的运动状态信息、交通参与对象与测试车辆的相对运动状态信息进行处理,得到第s个驾驶结果信息,s为大于等于1且小于S的整数。利用价值网络对第s个驾驶动作信息和第s个驾驶结果信息进行处理,得到动作价值信息。基于目标函数,根据驾驶状态信息和动作价值信息得到策略优势值。在确定策略优势值不满足预定阈值的情况下,调整预设模型的模型参数,返回执行利用策略网络的处理操作和利用价值网络的处理操作,并递增s。在确定策略优势值满足预定阈值的情况下,确定第s个驾驶动作信息为目标决策动作信息。
[0021]本公开的另一个方面提供了一种决策信息生成装置,包括:获取模块、分析模块、确定模块和生成模块。其中,获取模块,用于响应于接收到目标车辆的驾驶服务请求,获取所述目标车辆的实时运动状态信息、目标区域的车道类型信息和交通参与对象与所述目标车辆的实时相对运动状态信息。分析模块,用于利用驾驶场景分析模型对所述实时运动状态信息和所述车道类型信息进行处理,得到目标驾驶场景信息。确定模块,用于根据所述目标驾驶场景信息,确定目标驾驶行为决策模型。生成模块,用于利用目标驾驶行为决策模型对所述实时运动状态信息和所述实时相对运动状态信息进行处理,得到所述目标车辆的驾驶动作决策信息。
[0022]根据本公开的实施例,实时运动状态信息包括实时驾驶方向信息和实时位置信息。分析模块包括:第一确定单元、第一获得单元、第一查询单元和第二获得单元。其中,第一确定单元,用于从目标区域中确定目标任务点的位置信息和场景切换点的位置信息。第一获得单元,用于根据实时位置信息和场景切换点的位置信息,得到实时位置与场景切换点之间的距离信息。第一查询单元,用于根据目标任务点的位置信息,从目标区域的车道类型信息中查询到目标任务点的车道类型信息。第二获得单元,用于利用驾驶场景分析模型对距离信息、实时驾驶方向和目标任务点的车道类型信息进行处理,得到目标驾驶场景信息。
[0023]根据本公开的实施例,第二获得单元包括第一确定子单元和第二确定子单元。其中,第一确定子单元,用于根据实时驾驶方向和目标任务点的车道类型信息,确定多个候选场景切换条件。第二确定子单元,用于根据距离信息,从多个候选场景切换条件中确定目标驾驶场景信息。
[0024]根据本公开的实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种决策信息生成方法,包括:响应于接收到目标车辆的驾驶服务请求,获取所述目标车辆的实时运动状态信息、目标区域的车道类型信息和交通参与对象与所述目标车辆的实时相对运动状态信息;利用驾驶场景分析模型对所述实时运动状态信息和所述车道类型信息进行处理,得到目标驾驶场景信息;以及根据所述目标驾驶场景信息,确定目标驾驶行为决策模型;利用目标驾驶行为决策模型对所述实时运动状态信息和所述实时相对运动状态信息进行处理,得到所述目标车辆的驾驶动作决策信息。2.根据权利要求1所述的方法,其中,所述实时运动状态信息包括实时驾驶方向信息和实时位置信息,所述利用驾驶场景分析模型对所述实时运动状态信息和所述车道类型信息进行处理,得到目标驾驶场景信息,包括:从所述目标区域中确定目标任务点的位置信息和场景切换点的位置信息;根据所述实时位置信息和所述场景切换点的位置信息,得到所述实时位置与所述场景切换点之间的距离信息;根据所述目标任务点的位置信息,从所述目标区域的车道类型信息中查询到所述目标任务点的车道类型信息;以及利用驾驶场景分析模型对所述距离信息、所述实时驾驶方向和所述目标任务点的车道类型信息进行处理,得到所述目标驾驶场景信息。3.根据权利要求2所述的方法,其中,所述利用驾驶场景分析模型对所述距离信息、所述实时驾驶方向和所述目标任务点的车道类型信息进行处理,得到所述目标驾驶场景信息,包括:根据所述实时驾驶方向和所述目标任务点的车道类型信息,确定多个候选场景切换条件;以及根据所述距离信息,从所述多个候选场景切换条件中确定目标驾驶场景信息。4.根据权利要求1所述的方法,其中,所述利用目标驾驶行为决策模型对所述实时运动状态信息和所述实时相对运动状态信息进行处理,得到所述目标车辆的驾驶动作决策信息,包括:根据所述目标驾驶场景信息和所述实时相对运动状态信息,确定目标交通参与对象;从所述实时相对运动状态信息中筛选到所述目标交通参与对象与所述目标车辆的目标实时相对运动状态信息;根据所述目标驾驶场景信息,确定目标运动状态的属性信息从所述目标车辆的实时运动状态信息中筛选到与所述目标运动状态的属性信息对应的目标实时运动状态信息;以及利用所述目标驾驶行为决策模型对所述目标实时运动状态信息和所述目标实时相对运动状态信息进行处理,得到所述驾驶动作决策信息。5.根据权利要求4所述的方法,其中,所述根据所述目标驾驶场景信息和所述实时相对运动状态信息,确定目标交通参与对象,包括:根据所述实时相对运动状态信息,确定所述交通参与对象与所述目标车辆的相对位置关系;
根据相对位置关系,确定所述交通参与对象对所述目标车辆在目标驾驶场景中的风险程度;以及根据所述风险程度,从所述交通参与对象中筛选到所述目标交通参与对象。6.根据权利要求4所述的方法,其中,所述根据相对位置关系,确定所述交通参与对象对所述目标车辆在目标驾驶场景中的风险...

【专利技术属性】
技术研发人员:王渤谦
申请(专利权)人:北京京东乾石科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1