【技术实现步骤摘要】
一种数据处理方法、装置、设备及存储介质
[0001]本公开涉及计算机领域,具体而言,涉及一种数据处理方法、装置、设备及存储介质。
技术介绍
[0002]细粒度商品分类、检索是智慧零售中的重要研究课题,而这个课题的基础则是大量的物品数据。为了实现物品检测的精准和快捷,目前大多通过训练神经网络,以得到可以对物品进行识别、分类和检索的模型,而训练样本的数据质量很大程度上影响着模型的效果。然而,训练样本的标注可能有错误,在这种情况下使用错误标注的数据进行模型的训练,会在训练的过程中对错误的标签过拟合,影响训练出的模型精度和准确度,导致模型检测结果的精度低,模型检测结果的准确度低。
技术实现思路
[0003]本公开实施例至少提供一种数据处理方法、装置、设备及存储介质。
[0004]本公开实施例提供了一种数据处理方法,所述方法包括:
[0005]针对待处理数据集中的待处理图像,确定每个待处理图像的图像特征向量,其中,每个待处理图像对应一个被标注出的分类标签;
[0006]针对所述待处理数据集中任一 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:针对待处理数据集中的待处理图像,确定每个待处理图像的图像特征向量,其中,每个待处理图像对应一个被标注出的分类标签;针对所述待处理数据集中任一目标待处理图像,基于所述目标待处理图像的图像特征向量,确定所述目标待处理图像针对每个分类标签的置信度;基于所述目标待处理图像针对每个分类标签的置信度,确定所述目标待处理图像被标注出的分类标签是否正确;在所述目标待处理图像被标注出的分类标签不正确的情况下,对所述目标待处理图像进行处理。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:通过预先训练好的特征提取模型分别对每个待处理图像进行特征提取,得到每个待处理图像的图像特征向量,其中,所述特征提取模型通过多批训练图像分批训练得到,每批次训练图像的分类标签相同,不同批次训练图像的分类标签不同。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定每个分类标签对应的待处理图像;基于每个分类标签所对应的待处理图像的图像特征向量,分别确定每个分类标签对应的特征均值;所述基于所述目标待处理图像的图像特征向量,确定所述目标待处理图像针对每个分类标签的置信度,包括:基于每个分类标签对应的特征均值和所述目标待处理图像的图像特征向量,确定所述目标待处理图像针对每个分类标签的置信度。4.根据权利要求3所述的方法,其特征在于,所述基于每个分类标签所对应的待处理图像的图像特征向量,分别确定每个分类标签对应的特征均值,包括:确定每个分类标签所对应的待处理图像的图像特征向量中的多个预设特征维度;针对每个分类标签,基于所述分类标签所对应的待处理图像的图像特征向量中在每个预设特征维度下的特征值和所述多个预设特征维度,确定所述分类标签在每个预设特征维度下的特征维度均值;使用所述分类标签在每个预设特征维度下的特征维度均值和所述多个预设特征维度,计算所述分类标签对应的特征均值。5.根据权利要求3或4所述的方法,其特征在于,所述基于每个分类标签对应的特征均值和所述目标待处理图像的图像特征向量,确定所述目标待处理图像针对每个分类标签的置信度,包括:对每个分类标签对应的特征均值和所述目标待处理图像的图像特征向量进行相似度计算,得到所述目标待处理图像与每个分类标签之间的相似度;按照所述目标待处理图像与每个分类标签之间的相似度,对所述目标待处理图像与每个分类标签进行逻辑回归处理,得到所述目标待处理图像针对每个分类标签的置信度。6.根据权利要求1至5任一项所述的方法,其特征在于,所述置信度包括第一置信度和第二置信度,所述第一置信度为所述目标待处理图像针对所述目标待处理图像被标注出的分类标签的置信度,所述第二置信度为所述目标待处理图像针对所述多个分类标签中除所
述目标待处理图像被标注出的分类标签之外的其他分类标签的置信度;所述基于所述目标待处理图像针对每个分类标签的置信度,确定所述目标待处理图像被标注出的分类标签是否正确,包括:在所述第一置信...
【专利技术属性】
技术研发人员:刘美辰,田茂清,刘建博,伊帅,
申请(专利权)人:北京市商汤科技开发有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。