一种基于学生反馈的无数据知识蒸馏方法技术

技术编号：35780568 阅读：24 留言：0更新日期：2022-12-01 14:25

一种基于学生反馈的无数据知识蒸馏方法，具体涉及一种用于图像分类的基于学生反馈的无数据知识蒸馏方法。包括如下步骤：S1：初始化学生模型，并在学生模型的特征提取器后添加一个辅助分类器S2：利用辅助分类器反馈学生模型的当前学习能力，并同时根据学生反馈和教师反馈的损失函数联合训练噪声向量和生成器，从而获得最佳合成图片；S3：利用在S2中获得的合成图片通过知识蒸馏训练学生模型，并同时独立训练辅助分类器学习辅助任务；S4：重复S2和S3，直至学生模型被训练至收敛。本发明专利技术在无原始训练数据的情况下，根据学生模型的当前状态自适应地调整合成图片的内容，为学生模型量身定做合成图片，从而更加有效地训练学生模型以至提高最终表现。最终表现。最终表现。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于学生反馈的无数据知识蒸馏方法

[0001]本专利技术涉及知识蒸馏
，具体涉及一种基于学生反馈的无数据知识蒸馏方法。

技术介绍

[0002]近年来，卷积神经网络在各种实际应用中取得了显著的成功。但其昂贵的存储和计算成本使得在移动设备上部署模型变得困难。因此，Hinton等人提出知识蒸馏技术实现模型压缩，其主要思想是将暗知识从预训练好的重量级的教师模型迁移至轻量级的学生模型。
[0003]典型的知识蒸馏方法都基于一个强有力的前提，即用于训练教师模型的原始数据可直接用于训练学生模型。然而，在某些实际场景中，由于隐私、知识产权或数据集庞大等原因，数据不会公开共享，由此，无数据知识蒸馏被提出解决这一问题。现有的相关工作主要是利用教师模型的反馈来实现图片合成，然后利用合成图片来代替原始图片进行知识蒸馏过程。
[0004]然而，现有工作在图片合成过程中并没有显示地考虑学生的学习能力，合成的图片可能陷入相对于学生当前能力过于简单的境地，从而导致学生模型学习不到新知识，因此削弱模型的最终表现。

技术实现思路

[0005]本专利技术的主要目的在于克服现有技术中的上述缺陷，提出一种基于学生反馈的无数据知识蒸馏方法，利用一个自监督增强的辅助任务估计学生当前的学习能力，从而自适应地调整合成图片的内容，产生对于学生模型困难的样本，使得学生模型持续性获取新知识，以提高学生模型的最终表现。
[0006]本专利技术采用如下技术方案：
[0007]一种基于学生反馈的无数据知识蒸馏方法，包括如

【技术保护点】

【技术特征摘要】
1.一种基于学生反馈的无数据知识蒸馏方法，包括以下步骤：S1：初始化学生模型，并在学生模型的特征提取器后添加一个辅助分类器；S2：利用辅助分类器反馈学生模型的当前学习能力，并同时根据学生反馈和教师反馈的损失函数联合训练噪声向量和生成器，从而获得最佳合成图片；S3：利用在S2中获得的合成图片通过知识蒸馏训练学生模型，并同时独立训练辅助分类器学习辅助任务；S4：重复S2和S3，直至学生模型被训练至收敛。2.根据权利要求1所述的一种基于学生反馈的无数据知识蒸馏方法，其特征在于，所述S2中利用辅助分类器反馈学生模型的当前学习能力，具体过程包括：随机生成一个噪声向量z输入到生成器网络可以得到合成图片然后对合成图片旋转某一角度，将旋转后的图片输入至学生模型的特征提取器Φ，从而将获得的特征表示输入至辅助分类器利用辅助分类器的输出结果计算损失函数从而量化学生模型当前的学习能力，也就是学生反馈的损失函数，具体为：其中，k表示自监督增强任务的类别标签，自监督增强任务是将一个自监督旋转任务和原始的图像分类任务视为一个联合任务。3.根据权利要求2所述的一种基于学生反馈的无数据知识蒸馏方法，其特征在于，所述的自监督增强任务的类别的具体定义如下：给定原始的图像分类任务的总类别数为N，自监督旋转任务的总类别数为M；假定合成图片在图像分类任务中为n类，而其旋转版本在自监督旋转任务中为m类，那么其在自监督增强任务中的类别为n*M+m。4.根据权利要求3所述的一种基于学生反馈的无数据知识蒸馏方法，其特征在于，所述S2...

【专利技术属性】
技术研发人员：王灿，罗诗雅，陈德仿，冯雁，史麒豪，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人