一种基于本征特征迁移的深度模型压缩方法技术

技术编号：24123612 阅读：20 留言：0更新日期：2020-05-13 03:51

本发明专利技术涉及一种基于本征特征迁移的深度模型压缩方法，所述方法包括以下步骤：基于奇异值分解方法，将老师深度模型中的一组特征图进行分解，提取老师深度模型中的本征特征图组；将学生深度模型中的一组特征图与老师深度模型中的本征特征图组进行对齐；基于奇异值计算各本征特征图的权重；通过最小化学生深度模型中特征图组和老师深度模型中本征特征图组的加权差值，将老师深度模型中的本征特征迁移给学生深度模型，从而提高学生深度模型的性能。本发明专利技术提取老师深度模型中最本质的本征特征图，并有效迁移给学生深度模型，有助于提高深度模型压缩的精度，获得高性能的学生深度模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于本征特征迁移的深度模型压缩方法
本专利技术涉及一种压缩方法，具体涉及基于本征特征迁移的深度模型压缩方法，属于模型压缩

技术介绍
深度神经网络模型在许多计算机视觉和模式识别任务中取得了非常好的性能，比如图像分类和目标检测。然而，深度神经网络模型的一个主要缺陷是模型中包含大量的参数，这就需要设备具有大容量的内存和强大的计算能力。这使得深度模型不能在具有有限内存的任务中进行应用，比如手机等移动设备。近期，有一部分研究者尝试在保持模型性能的前提下压缩深度网络模型并减少计算负担。在这些方法中，知识蒸馏是一类比较有效的方法，该方法的核心是将老师深度模型中的知识传递给学生深度模型。一般，老师深度模型是一个大且复杂的网络模型，而学生深度模型是一个小且快速的网络模型。将老师深度模型中学到的知识传递给学生深度模型，能够得到一个高性能的压缩模型。一部分学者通过生成并拟合老师深度模型的软标签来进行知识传递。另一部分学者将特征图的平均值或者分布作为知识传递给学生深度模型。这些工作都证明了知识蒸馏方法的有效性，然而这些方法都间接地使用特征图的知识，使得所传递的知识有限。因此，迫切的需要一种新的方案解决上述技术问题。
技术实现思路
本专利技术正是针对现有技术中存在的问题，提供一种基于本征特征迁移的深度模型压缩方法，该技术方案能够获得高性能的学生深度模型，能够提高压缩的学生深度模型在图像分类任务中的分类准确率。为了实现上述目的，本专利技术的技术方案如下，一种基于本征特征迁移的深度模型压缩...

【技术保护点】
1.一种基于本征特征迁移的深度模型压缩方法，其特征在于，所述方法包括以下步骤：/nS1：基于奇异值分解方法，将老师深度模型中的一组特征图进行分解，提取老师深度模型中的本征特征图组；/nS2：将学生深度模型中的一组特征图与老师深度模型中的本征特征图组进行对齐；/nS3：基于奇异值计算各本征特征图的权重；/nS4：通过最小化学生深度模型中特征图组和老师深度模型中本征特征图组的加权差值，将老师深度模型中的本征特征迁移给学生深度模型，从而获得高性能的学生深度模型。/n

【技术特征摘要】
1.一种基于本征特征迁移的深度模型压缩方法，其特征在于，所述方法包括以下步骤：
S1：基于奇异值分解方法，将老师深度模型中的一组特征图进行分解，提取老师深度模型中的本征特征图组；
S2：将学生深度模型中的一组特征图与老师深度模型中的本征特征图组进行对齐；
S3：基于奇异值计算各本征特征图的权重；
S4：通过最小化学生深度模型中特征图组和老师深度模型中本征特征图组的加权差值，将老师深度模型中的本征特征迁移给学生深度模型，从而获得高性能的学生深度模型。

2.根据权利要求1所述的基于本征特征迁移的深度模型压缩方法，其特征在于，所述步骤S1中，提取老师深度模型中卷积层对应的特征图张量A∈RH×W×C，该张量包含了C个特征图，每个特征图的高度为H，宽度为W，将三维的特征图张量A转换成二维的特征图矩阵M∈R(H×W)×C。

3.根据权利要求2所述的基于本征特征迁移的深度模型压缩方法，其特征在于，所述步骤S1中，使用已有的奇异值分解方法(SVD方法)，对老师深度模型中的一组特征图M进行分解：
M＝UΣVT
其中，U是分解之后的左奇异矩阵，U中每一列是一个左奇异向量，∑是奇异值矩阵，其对角元素包含了M的所有非零奇异值，VT是右奇异向量V的共轭转置，V中每一列是一个右奇异向量。

4.根据权利要求2所述的基于本征特征迁移的深度模型压缩方法，其特征在于，所述步骤S1中，使用左奇异矩阵U中前K个向量作为老师深度模型中的本征特征图组E：
E＝U[:,1:K]。

5.根据权利要求1所述的基于本征特征迁移的深度模型压缩方法，其特征在于，所述步骤S2中，提取学生深度模型中卷积层对应的特征图张量As∈RH×W×K，该张量包含了K个特征图，0<K<C，其中C为老师模型特征图的个数，每个特征图的高度为H，宽度为W，将三维的特征图张量A，转换成二维的特征图矩阵F∈R(H×W)×K。

6.根据权利要求5所述的基于本征特征迁移的深度模型压缩方法，其特征在于，所述步骤S2中，根据学生深度模型中特征图与老师深度模型中本征特征图的相似度...

【专利技术属性】
技术研发人员：张金霞，魏海坤，张侃健，
申请(专利权)人：东南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人