一种卷积网络模型压缩方法、系统及存储介质技术方案

技术编号：29983328 阅读：13 留言：0更新日期：2021-09-08 10:20

本发明专利技术实施例公开了一种卷积网络模型压缩方法、系统及存储介质，本发明专利技术实施例提供的卷积网络模型压缩方法首先对卷积网络模型进行通道稀疏正则化训练，使卷积网络模型收敛，再采用BN层的缩放因子对收敛后的卷积网络模型的通道进行剪枝，然后对剪枝后的卷积网络模型进行微调并判断是否收敛，如果收敛则得到压缩后的卷积网络模型，从而有效地减小了卷积网络模型的大小和卷积网络模型运行时对内存的占用，并在不影响精度的同时降低了操作数，还可以使用传统硬件和深度学习软件包实现模型压缩和推理加速，而不需要使用其他特殊的软硬件加速器。件加速器。件加速器。

全部详细技术资料下载

【技术实现步骤摘要】
一种卷积网络模型压缩方法、系统及存储介质

[0001]本专利技术实施例涉及数据处理
，具体涉及一种卷积网络模型压缩方法、系统及存储介质。

技术介绍

[0002]卷积网络模型在现实中应用时通常要面临三个问题：(1)模型大小对嵌入式设备的影响:卷积网络模型优异的性能取决于模型内上百万可训练的参数，这些参数和网络结构信息需要被存储到硬盘中，然后在推理期间加载到内存中，例如一个在ImageNet上预训练好的模型需要超过300M空间，这对于嵌入式设备来说是一个很大的负担；(2)运行时间对占用内存的影响:在推理期间，卷积网络模型的中间激活值/响应对存储空间的需求甚至比存储模型参数的要更大，即使这对于高性能的GPU来说不是问题，但对于低计算能力的许多应用来说是一个较大的负担；(3)计算量：在高分辨率图片上卷积进行操作时可能会导致计算密集，一个大的卷积网络模型在嵌入式设备上可能要花费几分钟来处理一张图片，这使得在现实应用中并不可行。

技术实现思路

[0003]为此，本专利技术实施例提供一种卷积网络模型压缩方法、系统及存储介质，以解决上述
技术介绍
中出现的至少一个问题。
[0004]为了实现上述目的，第一方面，本专利技术实施例提供了一种卷积网络模型压缩方法，包括：
[0005]采集图像数据并制作训练数据集，利用深度学习框架搭建卷积网络模型，并对卷积网络模型执行如下步骤：
[0006]利用训练数据集对卷积网络模型进行通道稀疏正则化训练，直到卷积网络模型收敛；
[0007]利用BN层的缩...

【技术保护点】

【技术特征摘要】
1.一种卷积网络模型压缩方法，其特征在于，包括：采集图像数据并制作训练数据集，利用深度学习框架搭建卷积网络模型，并对所述卷积网络模型执行如下步骤：利用所述训练数据集对所述卷积网络模型进行通道稀疏正则化训练，直到所述卷积网络模型收敛；利用BN层的缩放因子对收敛后的卷积网络模型的通道进行剪枝；对剪枝后的卷积网络模型进行微调，并判断微调后的卷积网络模型是否收敛；若所述微调后的卷积网络模型收敛，则保存所述微调后的卷积网络模型的模型参数，得到压缩后的卷积网络模型；若所述微调后的卷积网络模型不收敛，则重复上述所述步骤。2.根据权利要求1所述的卷积网络模型压缩方法，其特征在于，所述采集图像数据并制作训练数据集，利用深度学习框架搭建卷积网络模型包括：根据应用场景采集图像数据并制作训练数据集；计算所述训练数据集的均值和标准差；根据所述均值和所述标准差对所述训练数据集做归一化处理，得到预处理后的训练数据集；根据所述应用场景包含的类别数量，配置卷积网络模型的通道数量；所述利用所述训练数据集对所述卷积网络模型进行通道稀疏正则化训练包括：利用所述预处理后的训练数据集对所述卷积网络模型进行通道稀疏正则化训练。3.根据权利要求2所述的卷积网络模型压缩方法，其特征在于，所述利用所述预处理后的训练数据集对所述卷积网络模型进行通道稀疏正则化训练包括：将所述预处理后的训练数据集输入所述卷积网络模型，对所述卷积网络模型进行通道稀疏正则化训练，得到所述卷积网络模型的输出值、更新后的权重参数和BN层的缩放因子。4.根据权利要求3...

【专利技术属性】
技术研发人员：李卫东，刘平涛，罗博文，张招，
申请(专利权)人：武汉莱克斯瑞科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人