System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 更新数据集的方法、装置、车辆和存储介质制造方法及图纸_技高网

更新数据集的方法、装置、车辆和存储介质制造方法及图纸

技术编号:41204402 阅读:2 留言:0更新日期:2024-05-07 22:29
本申请涉及一种更新数据集的方法、装置、车辆和存储介质。该方法包括:获取数据集,所述数据集包括样本图像;对所述数据集中的样本图像通过预先训练的二分类网络进行目标属性识别;依据识别结果对所述数据集中的样本图像进行筛选,得到子数据集;对所述子数据集中的样本图像进行目标属性标注,以供对所述数据集进行更新。本申请提供的方案,能够快速地完成目标属性的标注,加快后期产品的开发,有效缩短产品研发周期。

【技术实现步骤摘要】

本申请涉及数据挖掘,尤其涉及一种更新数据集的方法、装置、车辆和存储介质


技术介绍

1、在自动驾驶技术的相关算法中,移动物体的检测算法一直在快速地进行着数据更新和算法迭代,而庞大的数据集现阶段主要依靠于人工标注的方式,通过将车辆行驶过程中可能需要的移动物体属性进行标注,以进行相关模型的训练与产品开发。

2、然而产品开发实践中,对于移动物体的检测,新增移动物体的检测需求不断涌现,也就是说,会出现移动物体新属性无法被当前数据集的标注规则所涵盖,进而在相关模型的训练之前,大批量地对数据进行重标注也就成为了必然。其中模型训练中常使用全量数据集,大规模的全量数据集在人工盲筛后的重新标注也会严重拖慢整体开发进度,影响产品如期发布。


技术实现思路

1、为解决或部分解决相关技术中存在的问题,本申请提供一种更新数据集的方法、装置、车辆和存储介质,能够快速地完成目标属性的标注,加快后期产品的开发,有效缩短产品研发周期。

2、本申请样本方面提供一种更新数据集的方法,包括:

3、获取数据集,所述数据集包括样本图像;

4、对所述数据集中的样本图像通过预先训练的二分类网络进行目标属性识别;

5、依据识别结果对所述数据集中的样本图像进行筛选,得到子数据集;

6、对所述子数据集中的样本图像进行目标属性标注,以供对所述数据集进行更新。

7、在一实施方式中,所述数据集还包括所述样本图像的其他属性标注信息,且所述其他属性与所述目标属性相异。

8、在一实施方式中,所述预先训练的二分类网络按以下方式预先训练得到:

9、获取样本集,其中,所述样本集包括正样本集和负样本集,所述正样本集包括正样本图像、所述正样本图像的目标属性标注信息,所述负样本集包括负样本图像;

10、根据所述样本集,对待训练的二分类网络进行训练,得到所述预先训练的二分类网络。

11、在一实施方式中,所述对所述数据集中的样本图像通过预先训练的二分类网络进行目标属性识别,包括:

12、使用预先训练的二分类网络对所述数据集中的样本图像进行目标属性识别,得到所述样本图像的目标属性的置信度。

13、在一实施方式中,所述依据识别结果对所述数据集中的样本图像进行筛选,得到子数据集,包括:

14、选取所述目标属性的置信度满足设定条件所对应的样本图像集合作为所述子数据集。

15、在一实施方式中,所述选取所述目标属性的置信度满足设定条件所对应的样本图像集合作为所述子数据集,包括:

16、对所述数据集中的样本图像的目标属性的置信度进行排序,选取排名在设定名次前的样本图像作为所述子数据集;或者,

17、从所述数据集中的样本图像中选取目标属性的置信度在设定阈值以上的样本图像作为所述子数据集。

18、在一实施方式中,所述对所述子数据集中的样本图像进行目标属性标注,包括:

19、对所述子数据集中的样本图像的目标属性进行人工标注。

20、在一实施方式中,在所述获取数据集之后,对所述数据集中的样本图像通过预先训练的二分类网络进行目标属性识别之前,还包括:

21、对所述数据集中的样本图像进行裁剪和降采样。

22、本申请第二方面提供一种更新数据集的方法,包括:

23、获取模块,其被配置为获取数据集,所述数据集包括样本图像;

24、识别模块,其被配置为对所述数据集中的样本图像通过预先训练的二分类网络进行目标属性识别;

25、筛选模块,其被配置为依据识别结果对所述数据集中的样本图像进行筛选,得到子数据集;

26、标注模块,其被配置为对所述子数据集中的样本图像进行目标属性标注,以供对所述数据集进行更新。

27、本申请第三方面提供一种车辆,包括:

28、处理器;以及

29、存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。

30、本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。

31、本申请提供的技术方案可以包括以下有益效果:

32、本申请提供的技术方案,通过预先训练的二分类网络对数据集中的样本图像进行目标属性识别,并依据识别结果对数据集中的样本图像进行筛选,得到子数据集,再对子数据集中的样本图像进行目标属性标注,进而更新数据集,得到新数据集。本申请借助于二分类网络对数据集中的样本图像进行识别,与人工盲筛样本图像相比,可以快速地从数据集中筛选出需要标注的样本图像,再对筛选出的样本图像进行目标属性标注,快速完成目标属性的标注,加快后期产品的开发,有效缩短产品研发周期。

33、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

本文档来自技高网...

【技术保护点】

1.一种更新数据集的方法,其特征在于,包括:

2.根据权利要求1所述的更新数据集的方法,其特征在于,所述数据集还包括所述样本图像的其他属性标注信息,且所述其他属性与所述目标属性相异。

3.根据权利要求1所述的更新数据集的方法,其特征在于,所述预先训练的二分类网络按以下方式预先训练得到:

4.根据权利要求3所述的更新数据集的方法,其特征在于,所述对所述数据集中的样本图像通过预先训练的二分类网络进行目标属性识别,包括:

5.根据权利要求4所述的更新数据集的方法,其特征在于,所述依据识别结果对所述数据集中的样本图像进行筛选,得到子数据集,包括:

6.根据权利要求5所述的更新数据集的方法,其特征在于,所述选取所述目标属性的置信度满足设定条件所对应的样本图像集合作为所述子数据集,包括:

7.根据权利要求1所述的更新数据集的方法,其特征在于,所述对所述子数据集中的样本图像进行目标属性标注,包括:

8.根据权利要求1所述的更新数据集的方法,其特征在于,在所述获取数据集之后,对所述数据集中的样本图像通过预先训练的二分类网络进行目标属性识别之前,还包括:

9.一种更新数据集的装置,其特征在于,包括:

10.一种车辆,其特征在于,包括:

11.一种计算机可读存储介质,其特征在于,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1至8中任一项所述的方法。

...

【技术特征摘要】

1.一种更新数据集的方法,其特征在于,包括:

2.根据权利要求1所述的更新数据集的方法,其特征在于,所述数据集还包括所述样本图像的其他属性标注信息,且所述其他属性与所述目标属性相异。

3.根据权利要求1所述的更新数据集的方法,其特征在于,所述预先训练的二分类网络按以下方式预先训练得到:

4.根据权利要求3所述的更新数据集的方法,其特征在于,所述对所述数据集中的样本图像通过预先训练的二分类网络进行目标属性识别,包括:

5.根据权利要求4所述的更新数据集的方法,其特征在于,所述依据识别结果对所述数据集中的样本图像进行筛选,得到子数据集,包括:

6.根据权利要求5所述的更新数据集的方法,其特征在...

【专利技术属性】
技术研发人员:秦雨青刘宇洪刘汉鹏杨轶林章祯梁
申请(专利权)人:广州小鹏自动驾驶科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1