【技术实现步骤摘要】
图像分类模型构建方法、图像分类方法及装置、电子设备
[0001]本申请涉及计算机视觉领域,尤其涉及一种图像分类模型构建方法、图像分类方法及装置、电子设备。
技术介绍
[0002]图像分类,即给定输入图像和分类标签集合,利用计算机算法把分类标签集合中的一个标签分配给输入图像,是计算机视觉领域的基础任务之一,在包括如智慧医疗、智能农业、自动驾驶等众多领域都有广泛应用。
[0003]深度神经网络的快速发展使得图像分类模型的性能得以大幅度提升。现有的神经网络系统大多建立在独立同分布的假设基础上,即假设训练数据(源域数据)和测试数据(目标域数据)具有相同的统计学分布。然而在实际应用场景中,这一假设往往由于各种因素而难以成立,导致训练良好的模型在具有不同分布的测试数据上,出现大幅度的性能下降。而域泛化图像分类方法可以有效解决以上问题。
[0004]现有的域泛化图像分类方法主要可以分为两类。一类是基于数据操纵的方法,另一类是基于对齐的方法。前者旨在通过不同的图像变换对源域数据进行增强,或者生成新的源域数据来模拟目标域数据, ...
【技术保护点】
【技术特征摘要】
1.一种图像分类模型构建方法,其特征在于,包括:使用多个源域分别各自训练对应的辅助学生模型;使用所述多个源域混合训练一个学生组长模型;对多个所述辅助学生模型的预测输出进行互相蒸馏,得到第一蒸馏损失;根据所述第一蒸馏损失,更新多个所述辅助学生模型;将更新后的多个所述辅助学生模型的预测输出蒸馏给所述学生组长模型,得到第二蒸馏损失;根据所述第二蒸馏损失,更新所述学生组长模型,所述学生组长模型用于对待分类的图像进行分类。2.根据权利要求1所述的方法,其特征在于,在使用多个源域分别各自训练对应的辅助学生模型之后,在对多个所述辅助学生模型的预测输出进行互相蒸馏之前,还包括:将所有辅助学生模型的预测输出与真实标签进行比对,正确的预测输出被保留,错误的预测输出则被直接剔除。3.根据权利要求1所述的方法,其特征在于,使用多个源域分别各自训练对应的辅助学生模型,包括:按照相同的类别获取多个源域的图像数据;调整所述多个源域图像的尺寸并编码,得到多个源域图像的编码矩阵;将所述多个编码矩阵分别输入至多个预训练的辅助学生模型,得到多个预测输出;根据所述预测输出和真实标签,计算分类损失;根据所述分类损失,更新对应的辅助学生模型的参数。4.根据权利要求1所述的方法,其特征在于,使用所述多个源域混合训练一个学生组长模型,包括:按照类别获取多个源域随机混合的图像数据;调整所述混合图像的尺寸并编码,获得混合图像的编码矩阵;将所述编码矩阵输入至一个预训练的学生组长模型,得到预测输出;根据所述预测输出和真实标签,计算分类损失;根据所述分类损失,更新学生组长模型的参数。5.根据权利要求1所述的方法,其特征在于,对多个所述辅助学生模型的预测输出进行互相蒸馏,得到第一蒸馏损失,包括:按照顺序依次选取一个辅助学生模型的预测输出作为临时的教师分布;将剩下所有的辅助学生模型的预测分布的均值作为学生分布;根据所述教师分布和学生分布,利用对齐损失函数,依次...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。