一种基于滤波器注意力机制和BN层缩放系数的动态结构化网络剪枝方法技术

技术编号：22168321 阅读：34 留言：0更新日期：2019-09-21 11:11

本发明专利技术公开了一种基于滤波器注意力机制和BN层缩放系数的动态结构化网络剪枝方法，具体利用了本发明专利技术提出的滤波器注意力机制和BN层缩放系数动态地选择冗余滤波器，对神经网络动态置零，得到训练收敛后的模型参数。根据训练收敛后的模型参数，结合本发明专利技术提出的硬剪枝方法，最终得到压缩后的神经网络，有效地降低了神经网络的存储空间，提高了神经网络的推理计算速度。

A Dynamic Structured Network Pruning Method Based on Filter Attention Mechanism and BN Layer Scaling Coefficient

全部详细技术资料下载

【技术实现步骤摘要】
一种基于滤波器注意力机制和BN层缩放系数的动态结构化网络剪枝方法
本专利技术涉及神经网络模型压缩技术，尤其是基于滤波器注意力机制和BN缩放系数的动态结构化网络剪枝方法。
技术介绍
自Alexnet夺得ISVRC2012冠军以来，深度神经网络在计算机视觉上取得了巨大的发展，尤其在图像分类、目标检测、面部识别、语义分割等多个领域取得了一系列的进展。随着这些深度神经网络复杂度的提高，一方面，神经网络在各种视觉任务上不断逼近精度极限；另一方面，神经网络的浮点运算率和存储空间也在不断的增加。由于移动设备和嵌入式设备等装置的资源限制，如计算能力，存储容量、电池消耗等，使得网络模型很难部署在这些装置上。在深度神经网络中，卷积层占据了绝大多数的计算量，巨大的计算量消耗了大量的CPU以及GPU等硬件资源。剪枝是一种流行的模型压缩方法，能够有效地降低网络运算量以及存储量。早期阶段，例如，参见HanS，MaoH，DallyWJ.Deepcompresion：Compressingdeepneuralnetworkswithpruning，trainedquantizationandhuffmancoding.arXivpreprintarXiv：1510.00149，其公开的全部内容通过援引加入进来。提出了迭代剪枝，其思想是不断对训练收敛后的剪枝，得到一个精简的模型。在此基础上，例如，参见HanS，MaoH，DallyWJ.Dally(2016)Deepcompression：Compressingdeepneuralnetworkwithpruning，trainedquan...

【技术保护点】
1.一种基于滤波器注意力机制和BN层缩放系数的动态结构化网络剪枝方法，其特征在于：利用结构化剪枝准则，动态裁剪卷积神经网络每层的滤波器，得到收敛后的网络模型，并根据收敛后的网络模型进行硬剪枝，得到压缩后的网络，具体步骤为：S1：利用滤波器注意图函数F得到滤波器注意力图，并根据滤波器的注意力重要性函数M，得到滤波器一级判断指标；S2：利用BN层的缩放系数得到滤波器的二级判断性指标；S3：综合利用滤波器的一级判断性指标和二级判断性指标对每层卷积层中的滤波器的重要性从小到大排序，选取前P的滤波器作为冗余滤波器；S4：根据得到的冗余滤波器的索引对这些冗余滤波器和相应的BN层偏置系数置零；S5：根据SGD算法对所有的神经网络参数更新，将之前置零的冗余滤波器和相应的BN层偏置系数再次恢复，在下一个Epoch之前，再次计算滤波器的一级判断性指标和二级判断性指标，根据滤波器的一级判断性指标和二级判断性指标再次选取每层卷积层的冗余滤波器，对重新判定的冗余滤波器和相应的BN层缩放系数置零；S6：重复步骤S1至S5,直到神经网络收敛，得到模型参数；S7：根据模型参数，对网络进行硬剪枝。

【技术特征摘要】
1.一种基于滤波器注意力机制和BN层缩放系数的动态结构化网络剪枝方法，其特征在于：利用结构化剪枝准则，动态裁剪卷积神经网络每层的滤波器，得到收敛后的网络模型，并根据收敛后的网络模型进行硬剪枝，得到压缩后的网络，具体步骤为：S1：利用滤波器注意图函数F得到滤波器注意力图，并根据滤波器的注意力重要性函数M，得到滤波器一级判断指标；S2：利用BN层的缩放系数得到滤波器的二级判断性指标；S3：综合利用滤波器的一级判断性指标和二级判断性指标对每层卷积层中的滤波器的重要性从小到大排序，选取前P的滤波器作为冗余滤波器；S4：根据得到的冗余滤波器的索引对这些冗余滤波器和相应的BN层偏置系数置零；S5：根据SGD算法对所有的神经网络参数更新，将之前置零的冗余滤波器和相应的BN层偏置系数再次恢复，在下一个Epoch之前，再次计算滤波器的一级判断性指标和二级判断性指标，根据滤波器的一级判断性指标和二级判断性指标再次选取每层卷积层的冗余滤波器，对重新判定的冗余滤波器和相应的BN层缩放系数置零；S6：重复步骤S1至S5,直到神经网络收敛，得到模型参数；S7：根据模型参数，对网络进行硬剪枝。2.根据权利要求1所述的一种基于滤波器注意力机制和BN层缩放系数的动态结构化网络剪枝方法，其特征在...

【专利技术属性】
技术研发人员：卢海伟，袁晓彤，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人