当前位置: 首页 > 专利查询>北京大学专利>正文

图像分类及图像分类模型的训练方法和装置制造方法及图纸

技术编号:41717335 阅读:28 留言:0更新日期:2024-06-19 12:44
本发明专利技术涉及一种图像分类及图像分类模型的训练方法和装置,获取目标训练样本集,目标训练样本集中包括至少一个图像;针对每个图像,基于所述每个图像和预训练好的骨干模型,确定每个图像的全局特征图、第一块特征图,以及第二块特征图;将目标训练样本集中所有图像对应的全局特征图、第一块特征图以及第二块特征图,输入预设损失函数中,迭代更新得到图像分类模型的参数;预设损失函数的正样本相似度计算项中,针对所述每个图像的数据增强图像,以及目标训练样本集中与所述每个图像同一类别的其他图像,分别设置有与每个图像对应的正样本数量相关的加权项,用于平衡不同图像的正样本数量对梯度的影响,还用于学习不同类别图像之间的相同特征。

【技术实现步骤摘要】

本专利技术涉及人工智能领域,特别是涉及图像分类及图像分类模型的训练方法和装置


技术介绍

1、针对大部分视觉识别问题,模型需要对所有类别都具有较高的性能,在封闭场景中,训练样本集会经过人工平衡来使训练样本集和测试样本集的标签一致,例如imagenet1k和coco。但是,在开放场景下,训练样本集中训练样本的类别标签会呈现长尾分布。在该分布中,小部分头部类别会拥有大量训练样本,大量尾部类别仅有少量样本。这种训练样本集和测试样本集标签分布的不一致性,会带来两个主要挑战:1)为平衡数据集设计的损失函数使模型对头部类别产生偏差;2)尾部类别样本不足,使训练得到的模型对这些类别欠表达,从而无法对尾部特征具有很好的判别能力。

2、监督对比学习(supervised contrastive loss,scl)通过优化类内和类间距离在平衡数据集上得到很好的性能。通常情况下,给定一张锚点图像,scl会将锚点图像与锚点图像对应的两种类型的正样本在特征空间中拉近。其中,两种类型的正样本包括锚点图像的数据增强图像和具有同样类别标签的其它图像,所述数据增强图像通过对锚点本文档来自技高网...

【技术保护点】

1.一种图像分类模型的训练方法,其特征在于,所述方法包括:

2.如权利要求1所述的图像分类模型的训练方法,其特征在于,所述预设损失函数中包括:解耦监督对比损失项和块特征自蒸馏损失项;所述预设损失函数为:

3.如权利要求2所述的图像分类模型的训练方法,其特征在于,所述将所述目标训练样本集中所有图像对应的全局特征图、第二块特征图以及第一块特征图,输入预设损失函数中,迭代更新得到图像分类模型的参数,包括:

4.如权利要求2所述的图像分类模型的训练方法,其特征在于,所述解耦监督对比损失项为:

5.如权利要求2所述的图像分类模型的训练方法,其特征在于...

【技术特征摘要】

1.一种图像分类模型的训练方法,其特征在于,所述方法包括:

2.如权利要求1所述的图像分类模型的训练方法,其特征在于,所述预设损失函数中包括:解耦监督对比损失项和块特征自蒸馏损失项;所述预设损失函数为:

3.如权利要求2所述的图像分类模型的训练方法,其特征在于,所述将所述目标训练样本集中所有图像对应的全局特征图、第二块特征图以及第一块特征图,输入预设损失函数中,迭代更新得到图像分类模型的参数,包括:

4.如权利要求2所述的图像分类模型的训练方法,其特征在于,所述解耦监督对比损失项为:

5.如权利要求2所述的图像分类模型的训练方法,其特征在于,所述块特征自蒸馏损失项为:其中,l表示块坐标及其对应的裁剪子图像的数量,τ是温度系数,m是目标训练样本集中所有图像对应的全局特征图的第一集合;zi是目标训练样本集中第i个图像对应的全局特征图,是目标训练样本集中第i个图像对应的数据增强图像的全局特征图;pi={zt∈m:yt=yi},表示所述目标训练样本集中与第i个图像属于同一类别yi的图像对应的全局特征图组成的第二集合;|pi|表示目标训练样本集中第i个图像对应的正样本数量,包括以及pi的数量;zt表示第三集合中的任一个全局特征图,所述第三集合中包括所述目标训练样本集中第i个图像对应的数据增强图像的全局特征图和所述第二...

【专利技术属性】
技术研发人员:张史梁轩诗宇
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1