【技术实现步骤摘要】
自动驾驶样本集的数据筛选方法和装置
[0001]本申请涉及自动驾驶领域,具体而言,涉及一种自动驾驶样本集的数据筛选方法和装置。
技术介绍
[0002]在自动驾驶领域中,可通过摄像头或雷达等传感器,在现实世界搜集大量数据,进而按照任务的性质形成多种类型的数据集,用来训练对应的模型,将该模型应用在智能汽车上,使得汽车在一定程度上拥有了“智慧”,即可以在现实场景下进行部分的自主行驶操作。
[0003]车辆在行驶过程中,各类传感器实时产生的数据量巨大;为了提升系统性能,海量的训练和测试数据是非常重要的,综合考虑采集、标注和训练的时间和人力成本,如何提升样本数据的有效性成为数据处理环节的重要关注点,提取出对当前系统提升最大的数据集,并将数据集规模控制在一个合理范围内是非常重要的,目前这部分工作,主要是依据相关技术人员的工作经验进行人工判断,而判断结果取决于技术人员的经验、当时的工作状态等。
[0004]针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
[0005]本申请实施例提供了一种自动驾驶 ...
【技术保护点】
【技术特征摘要】
1.一种自动驾驶样本集的数据筛选方法,其特征在于,包括:接收样本筛选请求,其中,所述样本筛选请求用于请求筛选出能够提升模型组中第一模型的识别准确率的样本,所述模型组中的所述第一模型和第二模型用于执行相同的任务,所述第一模型部署在车载终端上运行,所述第二模型部署在服务器上运行;在确定待筛选的原始样本能够提升所述第一模型的识别准确率的情况下,将所述原始样本存入样本集合,其中,所述样本集合用于训练所述第一模型。2.根据权利要求1所述的方法,其特征在于,在将所述原始样本存入样本集合之前,所述方法包括按照如下条件中的至少之一确定所述原始样本是否为能够提升所述第一模型的识别准确率的样本:确定所述原始样本是否为所述第一模型预测效果不佳的样本;确定所述原始样本是否为所述样本集合中分布较少的样本;确定所述原始样本是否属于需要生效的场景;确定所述原始样本是否属于重复度较高的场景。3.根据权利要求2所述的方法,其特征在于,确定所述原始样本是否为能够提升所述第一模型的识别准确率的样本,包括:将所述原始样本输入场景识别模型中,得到场景识别结果;在所述场景识别结果不属于预设场景集合的情况下,确定所述原始样本不是能够提升所述第一模型的识别准确率的样本,其中,所述预设场景集合用于保存需要生效的场景;在所述场景识别结果属于所述预设场景集合的情况下,根据对所述原始样本的画质分析结果确定所述原始样本是否为能够提升所述第一模型的识别准确率的样本。4.根据权利要求3所述的方法,其特征在于,根据对所述原始样本的画质分析结果确定所述原始样本是否为能够提升所述第一模型的识别准确率的样本,包括:将所述原始样本输入图像清晰度的判断模型,得到所述原始样本的清晰度分值;在所述原始样本的清晰度分值低于清晰度阈值的情况下,确定所述原始样本不是能够提升所述第一模型的识别准确率的样本;在所述原始样本的清晰度分值不低于所述清晰度阈值的情况下,根据困难样本的选择结果确定所述原始样本是否为能够提升所述第一模型的识别准确率的样本。5.根据权利要求4所述的方法,其特征在于,根据困难样本的选择结果确定所述原始样本是否为能够提升所述第一模型的识别准确率的样本,包括:将所述原始样本分别输入所述第一模型和所述第二模型,得到所述...
【专利技术属性】
技术研发人员:陈睐,石驰宇,周艳宗,李亚伟,
申请(专利权)人:清智汽车科技苏州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。