基于双特长教师模型知识融合的图像分类方法及存储介质技术

技术编号：28474819 阅读：31 留言：0更新日期：2021-05-15 21:43

本发明专利技术涉及一种基于双特长教师模型知识融合的图像分类方法及存储介质，其中图像分类方法包括：步骤1：通过调整训练数据分布分别对两个特长教师模型进行训练，获得双特长教师模型；步骤2：对于双教师模型的不同层特征采用基于注意力转移的逐层融合方式进行融合，训练时分别对教师模型和学生模型计算注意力特征图，通过注意力特征损失函数对学生模型的特征层进行约束；步骤3：采用选择性知识传递机制对教师模型特征进行选择性传递；步骤4：对双教师模型进行融合训练，获取目标模型；步骤5：使用步骤4获取的目标模型进行图像分类。与现有技术相比，本发明专利技术具有目标模型获取速度快、学生模型性能好等优点。型性能好等优点。型性能好等优点。

全部详细技术资料下载

【技术实现步骤摘要】
基于双特长教师模型知识融合的图像分类方法及存储介质

[0001]本专利技术涉及图像分类方法
，尤其是涉及一种基于双特长教师模型知识融合的图像分类方法及存储介质。

技术介绍

[0002]知识融合是由知识蒸馏衍生出的新的研究方向。传统的知识蒸馏通过教师模型
‑
学生模型的训练范式，达到提升学生模型的训练精度、加快其收敛速度、压缩模型体积的目的。不同于传统的知识蒸馏，知识融合的研究重点在于多教师模型和学生模型之间多对一的知识传递，即将多个能力各异的教师模型相融合，得到一个兼具所有源模型任务能力的目标模型。
[0003]作为一个新兴方向，知识融合的相关研究还不广泛。目前，对于知识融合方法的研究主要集中于不同任务下的教师模型融合(即多个教师模型分别负责不同类型的任务，如图像分类、语义分割、平面法向量估计等)，或者异构教师模型的融合(即多个教师模型负责同一个任务但结构各异)，而对于特长教师模型融合方法则鲜有探究。所述特长教师模型是指：针对某一任务而言，存在多个可用的教师模型，而不同的教师模型受训练数据、训练方式等影响，其性能存在差异，即特长教师模型。图像分类是知识融合技术在实际应用落地的一个典型场景与领域。以图像分类任务为例，对于给定的图像分类任务，假设类别及类别数目确定，存在多个教师模型能够完成该分类任务，但是各个教师模型在不同的类别上分别存在各自擅长的分类领域，展示出性能上的优异，例如教师模型1更擅长猫分类，而教师模型2更擅长狗分类。
[0004]中国专利CN112199535A中公开了...

【技术保护点】

【技术特征摘要】
1.一种基于双特长教师模型知识融合的图像分类方法，其特征在于，所述的图像分类方法包括：步骤1：通过调整训练数据分布分别对两个特长教师模型进行训练，获得双特长教师模型；步骤2：对于双教师模型的不同层特征采用基于注意力转移的逐层融合方式进行融合，训练时分别对教师模型和学生模型计算注意力特征图，通过注意力特征损失函数对学生模型的特征层进行约束；步骤3：采用选择性知识传递机制对教师模型特征进行选择性传递；步骤4：对双教师模型进行融合训练，获取目标模型；步骤5：使用步骤4获取的目标模型进行图像分类。2.根据权利要求1所述的一种基于双特长教师模型知识融合的图像分类方法，其特征在于，所述的步骤1具体为：按照类别信息将训练数据集均等且分为第一子数据集和第二子数据集，采样第一子数据集中的一半数据连同第二子数据集作为第一特长教师模型的训练数据；采样第二子数据集中的一半数据连同第一子数据集作为第二特长教师模型的训练数据；使用对应的训练数据分别对第一特长教师模型和第二特长教师模型进行训练。3.根据权利要求2所述的一种基于双特长教师模型知识融合的图像分类方法，其特征在于，所述的第一特长教师模型和第二特长教师模型均采用卷积神经网络的一般训练方式进行训练。4.根据权利要求1所述的一种基于双特长教师模型知识融合的图像分类方法，其特征在于，所述的步骤2具体为：基于注意力转移的逐层融合方式将教师模型的特征层分组，每一组获得的特征组计算注意力特征图，通过注意力特征图计算注意力特征损失函数，通过注意力特征损失函数对学生模型的特征层进行约束；注意力特征图的计算方法为：F:R
C
×
H
×
W
→
R
H
×
W
其中，C为类别数，A
i
为对应特征层的注意力特征图。5.根据权利要求4所述的一种基于双特长教师模型知识融合的图像分类方法，其特征在于，所述的注意力特征图的损失函数具体为：其中，为学生模型的注意力特征图，为教师模型的注意力特征图，p为范数。6.根据权利要求1所述的一种基于双特长教师模型知识融合的...

【专利技术属性】
技术研发人员：尤鸣宇，王伟昊，周洪钧，
申请(专利权)人：同济大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人