样本图像标签处理方法、装置及电子设备制造方法及图纸

技术编号:36692719 阅读:28 留言:0更新日期:2023-02-27 20:01
本申请提供一种样本图像标签处理方法、装置及电子设备,所述方法包括:获取多个待处理样本图像及各所述待处理样本图像对应的第一分类标签;从多个所述待处理样本图像中筛选获得多个标准样本图像;通过特征提取模型分别对各所述待处理样本图像进行特征提取,获取各所述待处理样本图像对应的图像特征信息;针对所述待处理样本图像中除所述标准样本图像以外的目标样本图像,根据所述目标样本图像与各所述标准样本图像之间的所述图像特征信息的相似度及各所述标准样本图像的第一分类标签,确定所述目标样本图像调整后的第二分类标签。如此,可以在不引入更多数据、无监督的情况下,自动地实现海量待处理样本图像的分类标签清洗。动地实现海量待处理样本图像的分类标签清洗。动地实现海量待处理样本图像的分类标签清洗。

【技术实现步骤摘要】
样本图像标签处理方法、装置及电子设备


[0001]本申请涉及大数据处理
,具体而言,涉及一种样本图像标签处理方法、装置及电子设备。

技术介绍

[0002]在大数据处理场景中,待处理数据的质量通常对处理结果有决定性的影响。但是,获取足够数量的待处理数据可能并不是一件难事,获得准确、可靠、干净的待处理数据相对较难。
[0003]例如,在涉及图像处理的大数据处理场景中,可能需要使用大量的样本图像进行训练或者对大量的样本图像进行处理。样本图像数据通常包括图像本体和与图像本体对应的分类标签,在具有海量的样本图像的样本集合中,各样本图像的分类标签可能是多个模型自动标注的,这可能导致整个样本集合中存在相同分类中样本特征不统一、样本分类标签存在分歧等问题。分类标签杂乱的样本集合难以用于后续的大数据处理流程,因此需要对样本图像的分类标签进行数据清洗,调整样本图像的分类标签。
[0004]在现有的一些数据清洗方式中,采用人工修正的方式,虽然准确度高,但成本高效率低;基于模型检测的方式能够识别出一些离群样本,但无法很好地应对同类别之内数据一致性本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种样本图像标签处理方法,其特征在于,所述方法包括:获取多个待处理样本图像及各所述待处理样本图像对应的第一分类标签;从多个所述待处理样本图像中筛选获得多个标准样本图像;通过特征提取模型分别对各所述待处理样本图像进行特征提取,获取各所述待处理样本图像对应的图像特征信息;针对所述待处理样本图像中除所述标准样本图像以外的目标样本图像,根据所述目标样本图像与各所述标准样本图像之间的所述图像特征信息的相似度及各所述标准样本图像的第一分类标签,确定所述目标样本图像调整后的第二分类标签。2.根据权利要求1所述的方法,其特征在于,所述从多个所述待处理样本图像中筛选获得多个标准样本图像的步骤,包括:通过多个所述待处理样本图像对一分类模型进行训练,获得训练后的分类模型;通过所述分类模型对各所述待处理样本图像进行分类识别,获得各所述待处理样本图像对应的预测分类结果;根据各所述待处理样本图像的所述预测分类结果与所述第一分类标签,确定各所述待处理样本图像的标签置信度;将所述标签置信度大于预设置信度阈值的所述待处理样本图像确定为所述标准样本图像。3.根据权利要求1所述的方法,其特征在于,所述通过特征提取模型分别对各所述待处理样本图像进行特征提取,获取各所述待处理样本图像对应的图像特征信息的步骤,包括:针对每个所述待处理样本图像,将所述待处理样本图像作为锚样本,将该待处理样本图像进行变换后的图像作为正样本,将其他所述待处理样本图像作为负样本,以使所述锚样本与所述正样本之间的特征距离最小化,所述锚样本与所述负样本之间的特征距离最大化为目的,训练一特征提取模型;通过所述特征提取模型分别对各所述待处理样本图像进行特征提取,获取各所述待处理样本图像对应的图像特征信息。4.根据权利要求3所述的方法,其特征在于,所述将该待处理样本图像进行变换后的图像作为正样本的步骤,包括:将该待处理样本图像进行剪裁和/或旋转变换后的图像作为正样本。5.根据权利要求1所述的方法,其特征在于,所述根据所述目标样本图像与各所述标准样本图像之间的所述图像特征信息的相似度及各所述标准样本图像的第一分类标签,确定所述目标样本图像调整后的第二分类标签的步骤,包括:根据所述目标样本图像与各所述标准样本图像之间的所述图像特征信息的相似度对所述标准样本图像进行排序;根据排序结果,确定与各所述标准样本图像之间的所述图像特征信息的相似度最接近的第一预设数量的所述标准样本图像作为候选样本图像;根据各所述候选样本图像的排序位置及各所述候选样本图像的第一分类标签确定所述目标样本图像的调整后的第二...

【专利技术属性】
技术研发人员:刘袁凯
申请(专利权)人:广州虎牙信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1