模型压缩的方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号：21035942 阅读：19 留言：0更新日期：2019-05-04 06:01

本申请提供了模型压缩的方法、装置、电子设备及计算机存储介质。所述方法包括：获取训练样本数据，其中，所述训练样本数据包括有标签样本数据；利用所述训练样本数据对所述老师网络和学生网络模型分别进行训练，得到自适应蒸馏损失函数和焦点损失函数；根据所述自适应蒸馏损失函数和所述焦点损失函数对所述学生网络模型进行反向传播，获得训练后的学生网络。

Model Compression Method, Device, Electronic Equipment and Computer Storage Media

全部详细技术资料下载

【技术实现步骤摘要】
模型压缩的方法、装置、电子设备及计算机存储介质
本申请涉及人工智能领域，尤其涉及模型压缩的方法、装置、电子设备及计算机存储介质。
技术介绍
近年来，深度学习网络在计算机视觉领域的目标检测应用中取得了巨大的成功。但由于深度学习网络模型往往包含大量的模型参数，计算量大、处理速度慢，其应用也多在云端，在终端落地仍面临巨大的挑战。为了减少网络模型的冗余，国内外研究人员提出了蒸馏学习算法，在蒸馏学习中，通过将结构复杂的老师网络的知识提炼或者蒸馏到结构简单的学生网络模型，指导学生网络模型的训练，从而实现了对老师网络的压缩。但蒸馏后的学生网络性能不够理想，与老师网络的各方面检测性能仍存在一定差距。并且，当前的蒸馏学习都是基于两阶段(Two-stage)目标检测的网络，对单阶段(One-stage)目标检测中的应用也尚未得到探索。
技术实现思路
本申请提供了模型压缩的方法、装置、电子设备及计算机存储介质，能够使得模型压缩后得到的学生网络检测性能超越老师网络。第一方面，提供了一种模型压缩的方法，所述方法包括以下步骤：获取训练样本数据，其中，所述训练样本数据包括有标签样本数据；利用所述训练样本数据对所述老师网络和学生网络模型分别进行训练，得到自适应蒸馏损失函数和焦点损失函数；根据所述自适应蒸馏损失函数和所述焦点损失函数对所述学生网络模型进行反向传播，获得训练后的学生网络。可选地，在所述获取训练样本数据之前，所述方法还包括：利用所述有标签样本数据对老师网络模型进行训练，得到所述老师网络。可选地，在所述获取训练样本数据之前，所述方法还包括：获取无标签样本数据，并利用所述老师网络对所述...

【技术保护点】
1.一种模型压缩的方法，其特征在于，包括：获取训练样本数据，其中，所述训练样本数据包括有标签样本数据；利用所述训练样本数据对所述老师网络和学生网络模型分别进行训练，得到自适应蒸馏损失函数和焦点损失函数；根据所述自适应蒸馏损失函数和所述焦点损失函数对所述学生网络模型进行反向传播，获得训练后的学生网络。

【技术特征摘要】
1.一种模型压缩的方法，其特征在于，包括：获取训练样本数据，其中，所述训练样本数据包括有标签样本数据；利用所述训练样本数据对所述老师网络和学生网络模型分别进行训练，得到自适应蒸馏损失函数和焦点损失函数；根据所述自适应蒸馏损失函数和所述焦点损失函数对所述学生网络模型进行反向传播，获得训练后的学生网络。2.根据权利要求1所述的方法，其特征在于，在所述获取训练样本数据之前，所述方法还包括：利用所述有标签样本数据对老师网络模型进行训练，得到所述老师网络。3.根据权利要求1或2所述的方法，其特征在于，在所述获取训练样本数据之前，所述方法还包括：获取无标签样本数据，并利用所述老师网络对所述无标签样本数据进行标注，得到标注后的样本数据；将所述有标签样本数据和所述标注后的样本数据组成所述训练样本数据。4.根据权利要求1所述的方法，其特征在于，所述自适应蒸馏损失函数是根据所述老师网络和所述学生网络模型对同一样本数据的学习结果的差异从而确定的损失函数。5.根据权利要求1或4所述的方法，其特征在于，所述自适应蒸馏损失函数包括自适应蒸馏损失系数，所述自适应蒸馏损失系数用于调整所述训练样本数据中预定样本数据的权重，其中，所述预定样本数据包括所述老师网络难学习的样本和所述学生网络模型难模仿所述老师网络的样本。6.根据权利要求5所述的方法，其特征在于，所述自适应蒸...

【专利技术属性】
技术研发人员：唐诗涛，冯俐铜，旷章辉，张伟，陈益民，
申请(专利权)人：北京市商汤科技开发有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人