图像标签校正模型的训练方法和装置制造方法及图纸

技术编号:39294823 阅读:17 留言:0更新日期:2023-11-07 11:02
公开了图像标签校正模型的训练方法和装置。该方法包括,获取标签待校正图像和真实业务图像及其各自对应的初始标签,其中所述真实业务图像是针对具体业务场景并且标签准确性已验证的图像;基于所述真实业务图像的特征向量,确定所述真实业务图像的初始标签对应的类原型特征向量;对所述标签待校正图像的特征向量和所述类原型特征向量进行对比学习,以确定对比损失;根据所述对比损失,训练图像标签校正模型,使得所述标签待校正图像和所述真实业务图像的特征向量与对应的类原型特征向量之间的距离缩短。间的距离缩短。间的距离缩短。

【技术实现步骤摘要】
图像标签校正模型的训练方法和装置


[0001]本申请涉及图像识别的
,尤其涉及一种图像标签校正模型的训练方法、图像标签校正模型的训练装置,以及相应的计算设备、存储介质、和计算机程序产品。

技术介绍

[0002]在对图像进行深度学习时,普遍需要大量有标签、高质量的数据。然而,目前可得的公开图像中,许多图像的标签是不准确的。虽然可以对这些图像进行人工标记标签,但这样的成本非常高。而且,公开的图像也存在图像质量低下的问题,例如这些图像可能尺寸过小、存在破损等。
[0003]除了上述缺陷之外,公开图像的数据集中的数据分布可能并未充分覆盖实际业务场景下采集的图像,导致基于这些图像数据而进行的模型训练及后续操作与具体场景的适配性不高。此外,公开图像的数据集与实际业务中的数据集之间存在严重的领域偏差(domain bias)。例如,公开图像中存在大量的卡通图、特效图、游戏渲染图等,而实际业务中的图像多为自然拍摄图、摄像头采集图等等。训练时模型可能过拟合到公开图像的风格特征,而忽略其内容特征。如果不采用公开图像,又会面临实际场景中很难快速收集积累本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像标签校正模型的训练方法,其特征在于,所述方法包括:获取标签待校正图像和真实业务图像及其各自对应的初始标签,其中所述真实业务图像是针对具体业务场景并且标签准确性已验证的图像;基于所述真实业务图像的特征向量,确定所述真实业务图像的初始标签对应的类原型特征向量;对所述标签待校正图像的特征向量和所述类原型特征向量进行对比学习,以确定对比损失;根据所述对比损失,训练图像标签校正模型,使得所述标签待校正图像和所述真实业务图像的特征向量与对应的类原型特征向量之间的距离缩短。2.如权利要求1所述的方法,其中,基于所述真实业务图像的特征向量,确定所述真实业务图像的初始标签对应的类原型特征向量包括:对真实业务图像进行特征提取操作,以得到真实业务图像的第一特征向量;对所述真实业务图像的第一特征向量进行降维操作,以得到所述真实业务图像的第二特征向量,其中所述第二特征向量的维度数量小于所述第一特征向量的维度数量;对初始标签相同的真实业务图像的第二特征向量进行平均化操作,以得到各初始标签对应的类原型特征向量。3.如权利要求1所述的方法,其中,对所述标签待校正图像的特征向量和所述类原型特征向量进行对比学习,以确定对比损失包括:对标签待校正图像和真实业务图像进行特征提取操作,以得到标签待校正图像和真实业务图像的第三特征向量;对所述第三特征向量进行降维操作,以得到标签待校正图像和真实业务图像的第四特征向量,其中所述第四特征向量的维度数量小于所述第三特征向量的维度数量;基于所述第四特征向量与对应的类原型特征向量,确定样本与类原型损失。4.如权利要求3所述的方法,其中,对所述标签待校正图像的特征向量和所述类原型特征向量进行对比学习,以确定对比损失还包括:对标签待校正图像和真实业务图像进行图像增强操作,以得到标签待校正增强图像和真实业务增强图像;对标签待校正增强图像和真实业务增强图像进行特征提取操作,以得到所述标签待校正增强图像和真实业务增强图像的第五特征向量;对所述第五特征向量进行降维操作,以得到标签待校正增强图像和真实业务增强图像的第六特征向量,其中所述第六特征向量的维度数量小于所述第三特征向量的维度数量;基于标签待校正增强图像和真实业务增图像的第六特征向量与对应的标签待校正图像和真实业务图像的第四特征向量,确定样本与样本损失;并且,根据所述对比损失,训练图像标签校正模型包括:根据所述样本与类原型损失和所述样本与样本损失,训练所述图像标签校正模型。5.如权利要求4所述的方法,其中,所述图像增强操作包括下述操作中的至少一个:旋转所述标签待校正图像或真实业务图像;翻转所述标签待校正图像或真实业务图像;
调整所述标签待校正图像或真实业务图像的对比度;调整所述标签待校正图像或真实业务图像的亮度;剪裁所述标签待校正图像或真实业务图像。6.如权利要求1所述的方法,还包括:利用训练后的图像标签校正模型,获取标签待校正图像的经校正特征向量;基于标签待校正图像的经校正特征向量与类原型特征向量的相似度,校正所述标签待校正图像的初始标签。7.如权利要求6所述的方法,其中,所述标签待校正图像的经校正特征向量与类原型特征向量的相似度由关系模块确定,所述关系模块通过下述步骤训练:基于第一余弦相似度和第二余弦相似度,在所述标签待校正图像中筛选出干净样本图像,其中所述第一余弦相似度是标签待校正图像的特征向量与标签待校正图像的初始标签所对应的类原型特征向量之间的余弦相似度,所述第二余弦相似度是各个类原型特征向量彼此之间的余弦相似度;确定所述干净样本图像和所述真实业务图像的特征向量与其初始标签对应的类原型特征向量之间的余弦相似度,以得到第三余弦相似度;确定所述干净样本图像和所述真实业务图像的特征向量与...

【专利技术属性】
技术研发人员:秦玉磊陈星宇沈云航张琪吴桐傅朝友陈超
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1