一种结构化剪枝的方法以及系统技术方案

技术编号：35297776 阅读：33 留言：0更新日期：2022-10-22 12:45

本发明专利技术提供了一种结构化剪枝的方法和系统，该方法包括：S1、将深度神经网络中指定的网络层设置为待剪枝层，得到待处理深度神经网络；S2、利用图像数据集多次训练待处理深度神经网络并在训练过程进行多次预剪枝处理，每次预剪枝处理包括：根据所有待剪枝层在图像数据集上的重要性将重要性排序靠后的且被预剪枝后能够满足每次预剪枝的剪枝量的多个待剪枝层设为被预剪枝，重要性基于待剪枝层的权重参数、梯度以及激活频次确定；S3、当预剪枝处理的次数达到预定的预剪枝次数时，利用图像数据集对预剪枝后的待处理深度神经网络进行微调，并且将与被预剪枝的待剪枝层对应的网络层进行剪枝处理；本发明专利技术在压缩模型的同时可更好地保障模型的精度。障模型的精度。障模型的精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种结构化剪枝的方法以及系统

[0001]本专利技术涉及神经网络
，具体来说涉及神经网络模型的压缩
，更具体地说，涉及一种结构化剪枝的方法以及系统。

技术介绍

[0002]随着人工智能的不断发展，人工神经网络(简称神经网络)的应用范围也在不断地扩展。神经网络可以应用于移动设备，以对图像、文字、音频等进行处理并执行相应的预测任务。在图像识别领域(例如：图像分类、目标检测和目标跟踪)，利用深度神经网络(一些文献也称深度学习模型)可以达到较高的准确率，但是，由于深度神经网络中各种网络层(一些文献也称处理层，是指卷积层、全连接层等完整的层结构)的数量非常多(比如十万甚至百万个)，其对移动设备的计算能力和存储空间具有较高的要求。而目前移动设备的计算能力和存储空间与台式计算机、服务器相比往往有很大差距，在资源有限的情况下，直接应用深度学习模型存在巨大障碍，导致深度神经网络难以直接部署到移动设备。所以，需要对深度神经网络进行剪枝，通过剪枝来减少模型的冗余连接和参数，以压缩深度神经网络的大小，加快模型推理速度。
[0003]剪枝的方式通常分为结构化剪枝和非结构化剪枝，其中：
[0004]结构化剪枝是以网络层为基本单位进行剪枝的方法；一个网络层被剪枝，那么其前一个特征图(Feature Map，通常也称特征或者特征向量)和下一个特征图都会发生相应的变化，但是模型的结构却没有被破坏，仍然能够通过GPU或其他硬件来加速，因此这类方法被称之为结构化剪枝。
[0005]而非结构化剪枝则包括对单一的权重参数和...

【技术保护点】

【技术特征摘要】
1.一种结构化剪枝的方法，用于对深度神经网络做剪枝处理，所述深度神经网络包括多个网络层，其特征在于，所述方法包括：S1、将深度神经网络中指定的网络层设置为待剪枝层，每个待剪枝层对应于一个网络层，得到待处理深度神经网络；S2、利用图像数据集多次训练待处理深度神经网络并在训练过程进行多次预剪枝处理，其中，每次预剪枝处理包括：确定所有待剪枝层在图像数据集上的重要性，将重要性排序靠后的且被预剪枝后能够满足每次预剪枝的剪枝量的多个待剪枝层设为被预剪枝，并且被预剪枝的待剪枝层的输出所含元素在后续训练中均被设为0，其中，所述每个待剪枝层在图像数据集上的重要性基于待剪枝层的权重参数、梯度以及激活频次按照预定计算规则进行确定，所述激活频次是训练时待剪枝层的输出大小超过预定的激活阈值的次数；S3、当预剪枝处理的次数达到预定的预剪枝次数时，利用图像数据集对预剪枝后的待处理深度神经网络进行微调，并且将与被预剪枝的待剪枝层对应的网络层进行剪枝处理，得到压缩后的深度神经网络。2.根据权利要求1所述的方法，其特征在于，所述每个待剪枝层在图像数据集上的重要性按照以下计算规则确定：根据待剪枝层对应的网络层最新的权重参数和梯度，确定显著度指标；对待剪枝层的显著度指标和激活频次求加权和，得到该待剪枝层在图像数据集上的重要性。3.根据权利要求2所述的方法，其特征在于，所述激活频次按照以下方式确定：确定图像数据集中每个样本输入待处理深度神经网络时各待剪枝层的输出对应的输出大小；将最新完成的预设次数的训练中待剪枝层的输出大小超过预定的激活阈值的次数作为激活频次；其中，所述输出大小是对输出中所含元素的平方和开根号得到，所述激活阈值是最新完成的预设次数的训练中所有输出大小的平均值。4.根据权利要求2所述的方法，其特征在于，所述显著度指标按照以下方式确定：将待剪枝层对应的网络层中最...

【专利技术属性】
技术研发人员：赵泽，余昉，崔莉，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人