【技术实现步骤摘要】
本申请涉及深度学习,特别是涉及一种基于视觉模型的数据清洗方法、装置、设备以及存储介质。
技术介绍
1、在深度学习训练模型中,数据集非常重要,一个高质量的数据集能够提高模型训练的质量和预测准确率,有效提升算法方案性能,所以,在构造数据集与模型训练过程中往往会对数据集进行数据清洗与数据增强。
2、目前在进行数据标注时,大多是由数据标注人员进行人工标注,在人工标注的过程中常存在标注不准确或错误的情况发生,尤其是在视觉模型中会产生标签不准确、目标框位置不正确以及分割掩膜不准确的问题。
3、因此,如何对数据集进行高效清洗变得尤为重要。
技术实现思路
1、本申请至少提供一种基于视觉模型的数据清洗方法、装置、设备以及计算机可读存储介质。
2、本申请第一方面提供了一种基于视觉模型的数据清洗方法,包括:基于获取到的待清洗数据集的类型确定目标清洗策略,所述待清洗数据集中的待清洗数据带有初始标签;将所述待清洗数据集输入训练好的视觉模型中进行标签预测,得到所述视觉模型输出的每个
...【技术保护点】
1.一种基于视觉模型的数据清洗方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述待清洗数据集中各待清洗数据的初始标签和预测标签之间的相似度以及所述目标清洗策略对所述待清洗数据集进行数据清洗,得到清洗后的数据集的步骤,包括:
3.根据权利要求1所述的方法,其特征在于,所述待清洗数据集的类型包括分类数据集,所述目标清洗策略包括分类数据清洗策略,所述分类数据集和所述分类数据清洗策略对应,所述基于所述待清洗数据集中各待清洗数据的初始标签和预测标签之间的相似度以及所述目标清洗策略对所述待清洗数据集进行数据清洗,得到清
...【技术特征摘要】
1.一种基于视觉模型的数据清洗方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述待清洗数据集中各待清洗数据的初始标签和预测标签之间的相似度以及所述目标清洗策略对所述待清洗数据集进行数据清洗,得到清洗后的数据集的步骤,包括:
3.根据权利要求1所述的方法,其特征在于,所述待清洗数据集的类型包括分类数据集,所述目标清洗策略包括分类数据清洗策略,所述分类数据集和所述分类数据清洗策略对应,所述基于所述待清洗数据集中各待清洗数据的初始标签和预测标签之间的相似度以及所述目标清洗策略对所述待清洗数据集进行数据清洗,得到清洗后的数据集的步骤,包括:
4.根据权利要求1所述的方法,其特征在于,所述待清洗数据集的类型包括目标检测数据集,所述数据清洗策略包括目标检测数据清洗策略,所述目标检测数据集和所述目标检测数据清洗策略对应,所述基于所述待清洗数据集中各待清洗数据的初始标签和预测标签之间的相似度以及所述目标清洗策略对所述待清洗数据集进行数据清洗,得到清洗后的数据集的步骤,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述目标检测数据清洗策略,对所述目标重叠度小于预设的...
【专利技术属性】
技术研发人员:李越,陈亚松,罗彬,虞响,吴昌金,杨坤兴,
申请(专利权)人:浙江大华技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。