自动驾驶数据的决策标注方法、装置、设备以及存储介质制造方法及图纸

技术编号:38563043 阅读:14 留言:0更新日期:2023-08-22 21:02
本公开提供了一种自动驾驶数据的决策标注方法、装置、设备以及存储介质,涉及自动驾驶技术领域,具体涉及自动驾驶数据的决策标注技术。具体实现方案为:获取自动驾驶车辆的样本行驶轨迹数据和样本决策标注数据,其中,上述样本决策标注数据用于标注样本行驶轨迹数据中的后验交汇点信息和后验决策标注信息;若后验决策标注信息指示后验避让障碍物,则根据样本行驶轨迹数据和后验决策标注信息,确定后验决策标注信息是否置信得到置信结果;根据置信结果和后验交汇点信息,确定样本行驶轨迹数据对应的目标决策标注信息。可以提升自动驾驶车辆在与障碍物(其他交通参与者)交互时的决策合理性,以保障自动驾驶车辆的驾驶安全性。以保障自动驾驶车辆的驾驶安全性。以保障自动驾驶车辆的驾驶安全性。

【技术实现步骤摘要】
自动驾驶数据的决策标注方法、装置、设备以及存储介质


[0001]本公开涉及自动驾驶
,具体涉及自动驾驶数据的决策标注技术,尤其涉及一种自动驾驶数据的决策标注方法、装置、设备以及存储介质。

技术介绍

[0002]目前,自动驾驶
中,现有基于学习的自动驾驶数据的决策方案,通常是采用后验行驶轨迹进行决策标注,例如,根据后验行驶轨迹确定自动驾驶车辆避让了某个障碍物,则标注结果就是从某一个时刻起应该一直避让障碍物,直到完成交互;后验行驶轨迹上如果自动驾驶车辆超了某个障碍物,就该从某一个时刻起一直超障碍物,直到完成交互。
[0003]但是,上述决策标注方案存在一些不合理问题,例如,现有自动驾驶车辆在道路上行驶时较为保守,让行了某个障碍物。但是,根据人类驾驶车辆的经验而言,其实自动驾驶车辆可以超过障碍物的,因此,直接采用后验行驶轨迹得到的大多是决策自动驾驶车辆让行的样本,会导致学习到的决策标注模型更为保守。
[0004]此外,上述决策标注方案中的超车时机、让车时机一般采用一个固定的数值,通常会导致样本中一些情况过于保守,一些情况过于激进,得到的决策标注结果,并不利于自动驾驶车辆在实际行驶中采用。

技术实现思路

[0005]本公开提供了一种自动驾驶数据的决策标注方法、装置、设备以及存储介质。
[0006]根据本公开的第一方面,提供了一种自动驾驶数据的决策标注方法,上述方法包括:
[0007]获取自动驾驶车辆的样本行驶轨迹数据和样本决策标注数据,其中,上述样本决策标注数据用于标注上述样本行驶轨迹数据中的后验交汇点信息和后验决策标注信息;
[0008]若上述后验决策标注信息指示后验避让障碍物,则根据上述样本行驶轨迹数据和上述后验决策标注信息,确定上述后验决策标注信息是否置信,得到置信结果;
[0009]根据上述置信结果和上述后验交汇点信息,确定上述样本行驶轨迹数据对应的目标决策标注信息。
[0010]进一步地,根据上述样本行驶轨迹数据和上述后验决策标注信息,确定上述后验决策标注信息是否置信,得到置信结果,包括:
[0011]获取上述样本行驶轨迹数据的最小加速度,其中,上述样本行驶轨迹数据是上述自动驾驶车辆在样本行驶轨迹上行驶得到的;
[0012]若确定上述最小加速度大于预设加速度,则确定上述样本行驶轨迹数据对应的后验决策标注信息为置信;
[0013]若确定上述最小加速度小于上述预设加速度,则确定上述样本行驶轨迹数据对应的后验决策标注信息为非置信。
[0014]进一步地,根据上述置信结果和上述后验交汇点信息,确定上述样本行驶轨迹数
据对应的目标决策标注信息,包括:
[0015]若确定上述样本行驶轨迹数据对应的后验决策标注信息为置信,则若根据上述后验交汇点信息,确定上述样本行驶轨迹数据中上述障碍物到达交汇点的时长是否超过最大让行时长;
[0016]根据上述障碍物到达交汇点的时长是否超过上述最大让行时长,划分上述样本行驶轨迹数据,得到超时行驶轨迹数据和未超时行驶轨迹数据,其中,上述超时行驶轨迹数据指示上述障碍物到达交汇点的时长超过上述最大让行时长;
[0017]确定上述超时行驶轨迹数据对应的目标决策标注信息为超过障碍物。
[0018]进一步地,上述方法还包括:
[0019]根据上述未超时行驶轨迹数据,确定上述自动驾驶车辆对上述障碍物的预估让行时长;
[0020]根据上述预估让行时长和上述最大让行时长之间的比较结果,确定上述未超时行驶轨迹数据对应的目标决策标注信息为超过障碍物或者避让障碍物。
[0021]进一步地,确定上述未超时行驶轨迹数据对应的目标决策标注信息为超过障碍物或者避让障碍物,包括:
[0022]根据上述未超时行驶轨迹数据,确定上述自动驾驶车辆的运动信息、上述障碍物的运动信息和道路拓扑信息;
[0023]根据上述自动驾驶车辆的运动信息、上述障碍物的运动信息和道路拓扑信息,确定上述自动驾驶车辆和上述障碍物是否安全交互;
[0024]若上述自动驾驶车辆和上述障碍物是安全交互,则根据上述自动驾驶车辆的运动信息和上述障碍物的运动信息确定的多个加速度组合,确定上述自动驾驶车辆避让障碍物对应的奖励值,以及超过障碍物对应的奖励值;
[0025]若上述超过障碍物对应的奖励值与上述避让障碍物对应的奖励值之间的差值大于预设阈值,则确定上述目标决策标注信息为超过障碍物;若上述超过障碍物对应的奖励值与上述避让障碍物对应的奖励值之间的差值小于或等于上述预设阈值,则确定上述目标决策标注信息为避让障碍物。
[0026]进一步地,根据上述置信结果和上述后验交汇点信息,确定上述样本行驶轨迹数据对应的目标决策标注信息,包括:
[0027]若上述样本行驶轨迹数据对应的后验决策标注信息为非置信,则若根据上述后验交汇点信息,确定上述样本行驶轨迹数据中的保留行驶轨迹数据,其中,上述保留行驶轨迹数据用于指示上述障碍物到达交汇点的时长包含在最小让行时长内;
[0028]确定上述保留行驶轨迹数据对应的目标决策标注信息为避让障碍物。
[0029]进一步地,上述方法还包括:
[0030]若上述后验决策标注信息指示后验超过障碍物,则获取上述样本行驶轨迹数据中的待过滤行驶轨迹数据,其中,上述待过滤行驶轨迹数据指示上述自动驾驶车辆后验避让上述障碍物,是由于上述障碍物急刹导致的;
[0031]确定上述样本行驶轨迹数据中,除上述待过滤行驶轨迹数据之外的其他行驶轨迹数据;
[0032]确定上述其他行驶轨迹数据对应的目标决策标注信息为超过障碍物。
[0033]进一步地,获取自动驾驶车辆的样本决策标注数据,包括:
[0034]获取上述自动驾驶车辆的真实行驶轨迹数据,其中,上述真实行驶轨迹数据中包含的真实行驶轨迹上,存在至少一个实际让超时机;
[0035]根据上述真实行驶轨迹数据确定多个行驶轨迹数据片段,以及上述多个行驶轨迹数据片段各自对应的样本行驶轨迹数据。
[0036]进一步地,获取上述自动驾驶车辆的真实行驶轨迹数据,包括:
[0037]获取上述自动驾驶车辆的至少一个上述实际让超时机;
[0038]根据至少一个上述实际让超时机所在的上述真实行驶轨迹,对应确定上述自动驾驶车辆的真实行驶轨迹数据。
[0039]进一步地,上述方法还包括:
[0040]若根据上述后验交汇点信息,确定上述自动驾驶车辆和障碍物之间不存在交汇点,则对上述样本行驶轨迹数据进行降采样处理;
[0041]确定降采样处理后的样本行驶轨迹数据对应的目标决策标注信息为超过障碍物。
[0042]进一步地,上述方法还包括:
[0043]若根据上述后验交汇点信息,确定上述自动驾驶车辆和障碍物之间存在交汇点,则对经过上述交汇点后的样本行驶轨迹数据中的部分行驶轨迹数据进行降采样处理;
[0044]确定降采样处理后的样本行驶轨本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动驾驶数据的决策标注方法,所述方法包括:获取自动驾驶车辆的样本行驶轨迹数据和样本决策标注数据,其中,所述样本决策标注数据用于标注所述样本行驶轨迹数据中的后验交汇点信息和后验决策标注信息;若所述后验决策标注信息指示后验避让障碍物,则根据所述样本行驶轨迹数据和所述后验决策标注信息,确定所述后验决策标注信息是否置信,得到置信结果;根据所述置信结果和所述后验交汇点信息,确定所述样本行驶轨迹数据对应的目标决策标注信息。2.根据权利要求1所述的方法,其中,根据所述样本行驶轨迹数据和所述后验决策标注信息,确定所述后验决策标注信息是否置信,得到置信结果,包括:获取所述样本行驶轨迹数据的最小加速度,其中,所述样本行驶轨迹数据是所述自动驾驶车辆在样本行驶轨迹上行驶得到的;若确定所述最小加速度大于预设加速度,则确定所述样本行驶轨迹数据对应的后验决策标注信息为置信;若确定所述最小加速度小于所述预设加速度,则确定所述样本行驶轨迹数据对应的后验决策标注信息为非置信。3.根据权利要求2所述的方法,其中,根据所述置信结果和所述后验交汇点信息,确定所述样本行驶轨迹数据对应的目标决策标注信息,包括:若确定所述样本行驶轨迹数据对应的后验决策标注信息为置信,则若根据所述后验交汇点信息,确定所述样本行驶轨迹数据中所述障碍物到达交汇点的时长是否超过最大让行时长;根据所述障碍物到达交汇点的时长是否超过所述最大让行时长,划分所述样本行驶轨迹数据,得到超时行驶轨迹数据和未超时行驶轨迹数据,其中,所述超时行驶轨迹数据指示所述障碍物到达交汇点的时长超过所述最大让行时长;确定所述超时行驶轨迹数据对应的目标决策标注信息为超过障碍物。4.根据权利要求3所述的方法,其中,所述方法还包括:根据所述未超时行驶轨迹数据,确定所述自动驾驶车辆对所述障碍物的预估让行时长;根据所述预估让行时长和所述最大让行时长之间的比较结果,确定所述未超时行驶轨迹数据对应的目标决策标注信息为超过障碍物或者避让障碍物。5.根据权利要求4所述的方法,其中,确定所述未超时行驶轨迹数据对应的目标决策标注信息为超过障碍物或者避让障碍物,包括:根据所述未超时行驶轨迹数据,确定所述自动驾驶车辆的运动信息、所述障碍物的运动信息和道路拓扑信息;根据所述自动驾驶车辆的运动信息、所述障碍物的运动信息和道路拓扑信息,确定所述自动驾驶车辆和所述障碍物是否安全交互;若所述自动驾驶车辆和所述障碍物是安全交互,则根据所述自动驾驶车辆的运动信息和所述障碍物的运动信息确定的多个加速度组合,确定所述自动驾驶车辆避让障碍物对应的奖励值,以及超过障碍物对应的奖励值;若所述超过障碍物对应的奖励值与所述避让障碍物对应的奖励值之间的差值大于预
设阈值,则确定所述目标决策标注信息为超过障碍物;若所述超过障碍物对应的奖励值与所述避让障碍物对应的奖励值之间的差值小于或等于所述预设阈值,则确定所述目标决策标注信息为避让障碍物。6.根据权利要求2所述的方法,其中,根据所述置信结果和所述后验交汇点信息,确定所述样本行驶轨迹数据对应的目标决策标注信息,包括:若所述样本行驶轨迹数据对应的后验决策标注信息为非置信,则若根据所述后验交汇点信息,确定所述样本行驶轨迹数据中的保留行...

【专利技术属性】
技术研发人员:邓寒柳长春苏亚博
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1