分类模型的训练方法、装置、设备、介质及程序产品制造方法及图纸

技术编号:39255736 阅读:20 留言:0更新日期:2023-10-30 12:07
本申请公开了一种分类模型的训练方法、装置、设备、介质及程序产品,涉及人工智能技术领域。该方法包括:获取样本混合图像;通过候选分类模型对样本混合图像进行特征提取,得到至少两个样本图像分别对应的区域特征表示;基于至少两个样本图像分别对应的区域分类预测结果和至少两个样本图像分别对应的参考分类标签之间的差异,生成区域样本损失;基于区域样本损失对候选分类模型进行训练,得到目标分类模型。通过各样本图像的参考分类标签对样本混合图像各个区域的预测结果进行局部监督,从而提升了获取得到的损失的细粒度,提高了训练好的目标分类模型的准确度。目标分类模型的准确度。目标分类模型的准确度。

【技术实现步骤摘要】
分类模型的训练方法、装置、设备、介质及程序产品


[0001]本申请实施例涉及人工智能
,特别涉及一种分类模型的训练方法、装置、设备、介质及程序产品。

技术介绍

[0002]图像增强是指在对图像分类模型进行训练时,对输入模型的训练数据进行增强的操作,用于增强训练数据的多样性,提升模型的泛化性能。常见的图像增强方法包括图像混合、图像变换、噪声扰动、颜色变换等。
[0003]相关技术中,图像混合方法是通过从源图像中随机裁剪一个区域,将其粘贴到目标图像中得到混合图像,并通过将源图像和目标图像的标签按照组合图像的面积比例混合形成一个真实标签,通过样本分类模型对混合图像进行分类预测,得到预测类别,并基于预测类别和真实标签之间的差异对样本分类模型进行训练。
[0004]然而,相关技术的图像混合方法的一个显著缺点是:生成的混合图像存在图像

标签不一致的问题。一个典型的例子是混合图像不包含任何相关物体,但在生成的混合标签中却出现了类别响应,导致训练得到的图像分类模型的准度较低。

技术实现思路
<br/>[0005]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种分类模型的训练方法,其特征在于,所述方法包括:获取样本混合图像,所述样本混合图像是由至少两个标注有参考分类标签的样本图像以目标比例混合得到的图像,所述样本混合图像中包括至少两个样本图像分别对应的分类主体;通过候选分类模型对所述样本混合图像进行特征提取,得到所述至少两个样本图像分别对应的区域特征表示,所述区域特征表示用于表征所述样本混合图像中与样本图像分别对应的区域信息;对所述至少两个样本图像分别对应的区域特征表示进行分类预测,基于所述至少两个样本图像分别对应的区域分类预测结果和所述至少两个样本图像分别对应的参考分类标签之间的差异,生成区域样本损失;基于所述区域样本损失对所述候选分类模型进行训练,得到目标分类模型,所述目标分类模型用于对图像进行分类预测。2.根据权利要求1所述的方法,其特征在于,所述获取样本混合图像,包括:获取第一样本图像和第二样本图像,所述第一样本图像和所述第二样本图像的尺寸相同;基于所述目标比例在所述第一样本图像中确定第一图像区域,以及基于所述目标比例在所述第二样本图像中确定第二图像区域,所述第一图像区域和所述第二图像区域的尺寸相同;将所述第一图像区域粘贴到所述第二样本图像中的第二图像区域,得到所述样本混合图像。3.根据权利要求2所述的方法,其特征在于,所述基于所述目标比例在所述第一样本图像中确定第一图像区域,以及基于所述目标比例在所述第二样本图像中确定第二图像区域,包括:将所述第一样本图像分割为N个第一样本块;将所述第二样本图像分割为N个第二样本块,其中,N为大于1的正整数;通过所述候选分类模型中的注意力网络对所述N个第一样本块进行注意力分析,得到所述N个第一样本块分别对应的第一注意力分数;通过所述候选分类模型中的注意力网络对所述N个第二样本块进行注意力分析,得到所述N个第二样本块分别对应的第二注意力分数;基于所述目标比例和N个第一注意力分数,确定所述第一图像区域;基于所述目标比例和N个第二注意力分数,确定所述第二图像区域。4.根据权利要求3所述的方法,其特征在于,所述基于所述目标比例和N个第一注意力分数,确定所述第一图像区域;基于所述目标比例和N个第二注意力分数,确定所述第二图像区域,包括:从预设分布中采样目标边长比例;基于所述目标边长比例,确定所述第一图像区域和所述第二图像区域的面积参数;根据预设中心区域面积和所述N个第一注意力分数,从所述N个第一样本块中确定出m个相邻的第一样本块,所述m个相邻的第一样本块组成的区域面积和所述预设中心区域面积相同,所述m个相邻的第一样本块对应的第一注意力分数之和在所述N个第一样本块中所
占比例大于第一预设比例,m正整数;按照所述面积参数,对所述m个相邻的第一样本块组成的区域进行扩充,得到所述第一图像区域;根据所述预设中心区域面积和所述N个第二注意力分数,从所述N个第二样本块中确定出m个相邻的第二样本块,所述m个相邻的第二样本块组成的区域面积和所述预设中心区域面积相同,所述m个相邻的第二样本块对应的第二注意力分数之和在所述N个第二样本块中所占比例小于第二预设比例;按照所述面积参数,对所述m个相邻的第二样本块组成的区域进行扩充,得到所述第二图像区域。5.根据权利要求2所述的方法,其特征在于,所述基于所述目标比例在所述第一样本图像中确定第一图像区域,以及基于所述目标比例在所述第二样本图像中确定第二图像区域,包括:基于所述目标比例,确定分类主体检测框,所述分类主体检测框用于对样本图像上的分类主体进行标注;对所述第一样本图像进行分类主体检测,通过所述分类主体检测框在所述第一样本图像上标注所述第一样本图像的分类主体,将所述分类主体检测框在所述第一样本图像上标注的区域作为所述第一图像区域;对所述第二样本图像进行分类主体检测,通过所述分类主体检测框在所述第一样本图像上标注所述第二样本图像的分类主体,将所述分类主体检测框在所述第二样本图像上标注的区域作为候选图像区域;在所述第二样本图像的所述候选图像区域外,确定与所述第一图像区域的尺寸相同的第三图像区域,将所述第三图像区域作为所述第二图像区域。6.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取...

【专利技术属性】
技术研发人员:林明宝陈锰钊李珂任博纪荣嵘
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1