自动驾驶数据的决策标注方法、装置、设备以及存储介质制造方法及图纸

技术编号：38563043 阅读：14 留言：0更新日期：2023-08-22 21:02

本公开提供了一种自动驾驶数据的决策标注方法、装置、设备以及存储介质，涉及自动驾驶技术领域，具体涉及自动驾驶数据的决策标注技术。具体实现方案为：获取自动驾驶车辆的样本行驶轨迹数据和样本决策标注数据，其中，上述样本决策标注数据用于标注样本行驶轨迹数据中的后验交汇点信息和后验决策标注信息；若后验决策标注信息指示后验避让障碍物，则根据样本行驶轨迹数据和后验决策标注信息，确定后验决策标注信息是否置信得到置信结果；根据置信结果和后验交汇点信息，确定样本行驶轨迹数据对应的目标决策标注信息。可以提升自动驾驶车辆在与障碍物(其他交通参与者)交互时的决策合理性，以保障自动驾驶车辆的驾驶安全性。以保障自动驾驶车辆的驾驶安全性。以保障自动驾驶车辆的驾驶安全性。

全部详细技术资料下载

【技术实现步骤摘要】
自动驾驶数据的决策标注方法、装置、设备以及存储介质

[0001]本公开涉及自动驾驶
，具体涉及自动驾驶数据的决策标注技术，尤其涉及一种自动驾驶数据的决策标注方法、装置、设备以及存储介质。

技术介绍

[0002]目前，自动驾驶
中，现有基于学习的自动驾驶数据的决策方案，通常是采用后验行驶轨迹进行决策标注，例如，根据后验行驶轨迹确定自动驾驶车辆避让了某个障碍物，则标注结果就是从某一个时刻起应该一直避让障碍物，直到完成交互；后验行驶轨迹上如果自动驾驶车辆超了某个障碍物，就该从某一个时刻起一直超障碍物，直到完成交互。
[0003]但是，上述决策标注方案存在一些不合理问题，例如，现有自动驾驶车辆在道路上行驶时较为保守，让行了某个障碍物。但是，根据人类驾驶车辆的经验而言，其实自动驾驶车辆可以超过障碍物的，因此，直接采用后验行驶轨迹得到的大多是决策自动驾驶车辆让行的样本，会导致学习到的决策标注模型更为保守。
[0004]此外，上述决策标注方案中的超车时机、让车时机一般采用一个固定的数值，通常会导致样本中一些情况过于保守，一些情况过于激进，得到的决策标注结果，并不利于自动驾驶车辆在实际行驶中采用。

技术实现思路

[0005]本公开提供了一种自动驾驶数据的决策标注方法、装置、设备以及存储介质。
[0006]根据本公开的第一方面，提供了一种自动驾驶数据的决策标注方法，上述方法包括：
[0007]获取自动驾驶车辆的样本行驶轨迹数据和样本决策标注数据，其中，上述样本决策标注数据用于...

【技术保护点】

【技术特征摘要】
1.一种自动驾驶数据的决策标注方法，所述方法包括：获取自动驾驶车辆的样本行驶轨迹数据和样本决策标注数据，其中，所述样本决策标注数据用于标注所述样本行驶轨迹数据中的后验交汇点信息和后验决策标注信息；若所述后验决策标注信息指示后验避让障碍物，则根据所述样本行驶轨迹数据和所述后验决策标注信息，确定所述后验决策标注信息是否置信，得到置信结果；根据所述置信结果和所述后验交汇点信息，确定所述样本行驶轨迹数据对应的目标决策标注信息。2.根据权利要求1所述的方法，其中，根据所述样本行驶轨迹数据和所述后验决策标注信息，确定所述后验决策标注信息是否置信，得到置信结果，包括：获取所述样本行驶轨迹数据的最小加速度，其中，所述样本行驶轨迹数据是所述自动驾驶车辆在样本行驶轨迹上行驶得到的；若确定所述最小加速度大于预设加速度，则确定所述样本行驶轨迹数据对应的后验决策标注信息为置信；若确定所述最小加速度小于所述预设加速度，则确定所述样本行驶轨迹数据对应的后验决策标注信息为非置信。3.根据权利要求2所述的方法，其中，根据所述置信结果和所述后验交汇点信息，确定所述样本行驶轨迹数据对应的目标决策标注信息，包括：若确定所述样本行驶轨迹数据对应的后验决策标注信息为置信，则若根据所述后验交汇点信息，确定所述样本行驶轨迹数据中所述障碍物到达交汇点的时长是否超过最大让行时长；根据所述障碍物到达交汇点的时长是否超过所述最大让行时长，划分所述样本行驶轨迹数据，得到超时行驶轨迹数据和未超时行驶轨迹数据，其中，所述超时行驶轨迹数据指示所述障碍物到达交汇点的时长超过所述最大让行时长；确定所述超时行驶轨迹数据对应的目标决策标注信息为超过障碍物。4.根据权利要求3所述的方法，其中，所述方法还包括：根据所述未超时行驶轨迹数据，确定所述自动驾驶车辆对所述障碍物的预估让行时长；根据所述预估让行时长和所述最大让行时长之间的比较结果，确定所述未超时行驶轨迹数据对应的目标决策标注信息为超过障碍物或者避让障碍物。5.根据权利要求4所述的方法，其中，确定所述未超时行驶轨迹数据对应的目标决策标注信息为超过障碍物或者避让障碍物，包括：根据所述未超时行驶轨迹数据，确定所述自动驾驶车辆的运动信息、所述障碍物的运动信息和道路拓扑信息；根据所述自动驾驶车辆的运动信息、所述障碍物的运动信息和道路拓扑信息，确定所述自动驾驶车辆和所述障碍物是否安全交互；若所述自动驾驶车辆和所述障碍物是安全交互，则根据所述自动驾驶车辆的运动信息和所述障碍物的运动信息确定的多个加速度组合，确定所述自动驾驶车辆避让障碍物对应的奖励值，以及超过障碍物对应的奖励值；若所述超过障碍物对应的奖励值与所述避让障碍物对应的奖励值之间的差值大于预
设阈值，则确定所述目标决策标注信息为超过障碍物；若所述超过障碍物对应的奖励值与所述避让障碍物对应的奖励值之间的差值小于或等于所述预设阈值，则确定所述目标决策标注信息为避让障碍物。6.根据权利要求2所述的方法，其中，根据所述置信结果和所述后验交汇点信息，确定所述样本行驶轨迹数据对应的目标决策标注信息，包括：若所述样本行驶轨迹数据对应的后验决策标注信息为非置信，则若根据所述后验交汇点信息，确定所述样本行驶轨迹数据中的保留行...

【专利技术属性】
技术研发人员：邓寒，柳长春，苏亚博，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人