一种基于辅助实例集成的分类网络知识蒸馏方法技术

技术编号：39155608 阅读：10 留言：0更新日期：2023-10-23 15:00

本发明专利技术公开了一种基于辅助实例集成的分类网络知识蒸馏方法，包括以下步骤：利用深度学习框架搭建部署实例；利用多阶段分支法构建多阶段实例群；基于多阶段实例群构建多对一的网络蒸馏损失函数；对多阶段实例群进行模型训练和优化，在训练结束后，固定并保存为多阶段实例群网络模型及网络模型参数；对优化后的多阶段实例群网络模型进行部署，优化裁剪网络模型参数，得到图像分类模型，图像分类模型的输出即为图像类别预测结果。本发明专利技术方法能够有效提高蒸馏后部署实例的性能，减少训练部署的时间及硬件需求，适用于多种时空受限或对精度要求更高的分类任务应用场景。求更高的分类任务应用场景。求更高的分类任务应用场景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于辅助实例集成的分类网络知识蒸馏方法

[0001]本专利技术属于图像处理
，具体涉及一种基于辅助实例集成的分类网络知识蒸馏方法。

技术介绍

[0002]图像分类任务是计算机视觉中的基本任务，通过将图像送入神经网络中进行前向推理得到基于类别的概率预测向量，从而对输入图像进行定界分类。在数据集确定的情况下，传统的训练优化流程能够达到比较好的分类性能。而当应用场景需求更可靠的分类性能时，可行的办法是使用更大更复杂的网络结构，但是这样的大型模型需要占用更多的时空资源，比如训练更耗时，显存、内存占用更大，将会进一步导致训练部署成本高等问题。因此大量研究投入到了模型优化领域中。
[0003]知识蒸馏作为一种模型压缩技术，近年来在深度学习的应用和研究中得到了人们的广泛关注。与单模型训练相比，知识蒸馏指的是一种训练过程，即预先准备一个高性能的大模型，并基于该大模型将所学知识提取到小模型中；训练过程中，大模型仅作为小模型的教师，提供优化的指导，大模型本身不再进行训练优化；部署时，仅使用小模型。经过知识蒸馏获得的小模型，在能耗比上往往优于一般训练得到小模型，即在等模型容量的情况下取得更好的性能。同时，知识蒸馏也可以看作是大模型对自身的一种压缩，在维持自身分类性能基本不变的情况下，裁剪自身参数量至更小的规模。
[0004]传统的知识蒸馏任务往往是离线的，即需要先进行大模型的训练，再利用大模型进行蒸馏得到小模型。目前先进的知识蒸馏方法为在线模式的互学习知识蒸馏算法，弱化了师生的概念，在训练阶段同时引入多个学生模型...

【技术保护点】

【技术特征摘要】
1.一种基于辅助实例集成的分类网络知识蒸馏方法，其特征在于，包括以下步骤：利用深度学习框架搭建部署实例，所述部署实例为含有多阶段串行网络结构的残差神经网络；利用多阶段分支法构建多阶段实例群，所述多阶段实例群包括基于部署实例串行结构解构得到的多个级联子实例，以及基于各子实例之间的分支点扩展得到的浅宽辅助分支，将子实例与浅宽辅助分支组合形成仅训练期出现的辅助实例；基于多阶段实例群构建多对一的网络蒸馏损失函数，所述多对一的网络蒸馏损失函数包括部署实例图像类别预测值与标签真值的交叉熵损失、辅助实例图像类别预测值与标签真值的交叉熵损失和辅助实例集成的图像类别预测值与部署实例图像类别预测值的KL散度；对多阶段实例群进行模型训练和优化，在训练数据集上，基于多对一的网络蒸馏损失函数利用梯度下降算法优化参数，在训练结束后，固定并保存为多阶段实例群网络模型及网络模型参数；对优化后的多阶段实例群网络模型进行部署，优化裁剪网络模型参数，得到图像分类模型，图像分类模型的输出即为图像类别预测结果。2.根据权利要求1所述的基于辅助实例集成的分类网络知识蒸馏方法，其特征在于，所述基于部署实例串行结构解构得到的多个级联子实例，包括：基于部署实例F的串行结构，选择N个分支点，将其解构为N+1个独立的级联子实例S
i
，从而导出其中间层特征f
i
，即对于输入图像x，有：其中，f
i
为第i个分支点输出的中间层特征，S
i
为第i个独立的子实例，S
i
接受输入f
i
‑1并将其转化为f
i
，则f
N+1
即为部署实例F关于x的输出F(x)，F(x)为部署实例图像类别预测值。3.根据权利要求2所述的基于辅助实例集成的分类网络知识蒸馏方法，其特征在于，所述基于各子实例之间的分支点扩展得到的浅宽辅助分支，将子实例与浅宽辅助分支组合形成仅训练期出现的辅助实例，包括：基于N个分支点扩展设计对应的浅宽辅助分支B
i
，将中间层特征f
i
通过浅宽辅助分支B
i
转化为辅助实例图像类别预测值p
i
，其表达式为：p
i
＝A
i
(x)＝B
i
(f
i
)其中，p
i
为辅助实例A
i
基于输入给出的图像类别预测输出，B
i
为f<...

【专利技术属性】
技术研发人员：田翔，叶欣，蒋荣欣，陈耀武，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人