基于灰色关联分析的深度卷积神经网络模型的裁剪方法技术

技术编号：23025428 阅读：19 留言：0更新日期：2020-01-03 17:03

本发明专利技术公开了一种基于灰色关联分析的深度卷积神经网络模型的裁剪方法，包括：对目标数据进行数据扩增以获得更多的训练数据；将未经训练的初始网络模型利用所述训练数据进行训练，获得一组拟合所述训练数据的模型参数作为进行裁剪的实验模型；利用灰色关联分析对实验模型中每个卷积核进行重要性的量化，得到每个卷积核的重要性的量化值；基于所述卷积核的重要性的量化值得到所有卷积的重要性，并将最不重要的卷积核作为目标卷积核；对目标卷积核及与所述目标卷积核相关的下一层卷积核进行重复裁剪，直至满足停止条件。实现准确找出被裁剪后对精度影响最小的卷积核，在保证精度的情况下提高模型裁剪比例，加快裁剪后新模型推理运算速度的优点。

Cutting method of neural network model of deep convolution based on grey correlation analysis

全部详细技术资料下载

【技术实现步骤摘要】
基于灰色关联分析的深度卷积神经网络模型的裁剪方法
本专利技术涉及神经网络领域，具体地，涉及一种基于灰色关联分析的深度卷积神经网络模型的裁剪方法。
技术介绍
卷积神经网络在图像分类、目标检测和图像分割等方面取得了令人瞩目的理论与技术突破和更能让市场接受的识别准确率。但卷积神经网络巨大的计算量与存储量，导致难以应用在计算能力和存储空间有限的嵌入式终端设备。因此，对模型结构进行裁剪，加速模型推理速度，减小模型存储量，对卷积神经网络普及应用具有重要意义。目前，已有设计紧凑模型网络、模型蒸馏、低秩分解、模型量化、模型裁剪等各种提高神经网络运算速度的技术。作为一种实现方便、精度保持性好、加速效果明显的运算速度提高方法，模型裁剪技术得到了越来越多的关注。在模型裁剪方法中，关键部分在于评价卷积核重要性，能否准确找出裁剪后对结果影响最小的卷积核决定了能否保持裁剪后模型的精度，也决定了裁剪算法能达到最大的推理速度提升倍数和体积压缩倍数。卷积核评价方法可以根据评价对象分为数据驱动型和参数驱动型两类。参数驱动型方法可以在模型裁剪过程中时间消耗较小，但是对模型的精度影响比较大，无法达到很高的速度提升。参数驱动型方法直接考察模型参数W，根据各通道参数值和的大小或者参数值是否大于阈值评价该卷积核通道的重要性。由于评价重要性的时候只需要遍历访问一次卷积核参数W并进行简单的求和计算即可，不需要进行额外的计算过程和重复过程，所以在裁剪的过程所需要花费的时间较少。数据驱动型方法能够在进行大比例裁剪后使得模型的精度仍然保持得...

【技术保护点】
1.一种基于灰色关联分析的深度卷积神经网络模型的裁剪方法，其特征在于，包括：/n对目标数据进行数据扩增以获得更多的训练数据；/n将未经训练的初始网络模型利用所述训练数据进行训练，获得一组拟合所述训练数据的模型参数作为进行裁剪的实验模型；/n利用灰色关联分析对所述实验模型中每个卷积核进行重要性的量化，得到每个卷积核的重要性的量化值；/n基于所述卷积核的重要性的量化值得到所有卷积的重要性，并将最不重要的卷积核作为目标卷积核；/n对所述目标卷积核及与所述目标卷积核相关的下一层卷积核进行重复裁剪，直至满足停止条件。/n

【技术特征摘要】
1.一种基于灰色关联分析的深度卷积神经网络模型的裁剪方法，其特征在于，包括：
对目标数据进行数据扩增以获得更多的训练数据；
将未经训练的初始网络模型利用所述训练数据进行训练，获得一组拟合所述训练数据的模型参数作为进行裁剪的实验模型；
利用灰色关联分析对所述实验模型中每个卷积核进行重要性的量化，得到每个卷积核的重要性的量化值；
基于所述卷积核的重要性的量化值得到所有卷积的重要性，并将最不重要的卷积核作为目标卷积核；
对所述目标卷积核及与所述目标卷积核相关的下一层卷积核进行重复裁剪，直至满足停止条件。

2.根据权利要求1所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法，其特征在于，所述目标数据为图片数据。

3.根据权利要求2所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法，其特征在于，所述数据扩增，包括：水平翻转或明亮度微调。

4.根据权利要求1所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法，其特征在于，将未经训练的初始网络模型利用所述训练数据进行训练，为：
将未经训练的初始网络模型利用所述训练数据利用随机梯度下降法进行训练，使得损失函数值达到全局最低点。

5.根据权利要求1所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法，其特征在于，所述停止条件为浮点运算数FLOPs；

其中，L是神经网络的总层数，i神经网络层的序号，h和w和c是当前层的输入特征图的高和宽和深度，n是输出特征图的深度，k是卷积核的尺寸。

6.根据权利要求1所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法，其特征在于，所述利用灰色关联分析对所述实...

【专利技术属性】
技术研发人员：黄世青，白瑞林，李新，
申请(专利权)人：无锡信捷电气股份有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人