基于灰色关联分析的深度卷积神经网络模型的裁剪方法技术

技术编号:23025428 阅读:19 留言:0更新日期:2020-01-03 17:03
本发明专利技术公开了一种基于灰色关联分析的深度卷积神经网络模型的裁剪方法,包括:对目标数据进行数据扩增以获得更多的训练数据;将未经训练的初始网络模型利用所述训练数据进行训练,获得一组拟合所述训练数据的模型参数作为进行裁剪的实验模型;利用灰色关联分析对实验模型中每个卷积核进行重要性的量化,得到每个卷积核的重要性的量化值;基于所述卷积核的重要性的量化值得到所有卷积的重要性,并将最不重要的卷积核作为目标卷积核;对目标卷积核及与所述目标卷积核相关的下一层卷积核进行重复裁剪,直至满足停止条件。实现准确找出被裁剪后对精度影响最小的卷积核,在保证精度的情况下提高模型裁剪比例,加快裁剪后新模型推理运算速度的优点。

Cutting method of neural network model of deep convolution based on grey correlation analysis

【技术实现步骤摘要】
基于灰色关联分析的深度卷积神经网络模型的裁剪方法
本专利技术涉及神经网络领域,具体地,涉及一种基于灰色关联分析的深度卷积神经网络模型的裁剪方法。
技术介绍
卷积神经网络在图像分类、目标检测和图像分割等方面取得了令人瞩目的理论与技术突破和更能让市场接受的识别准确率。但卷积神经网络巨大的计算量与存储量,导致难以应用在计算能力和存储空间有限的嵌入式终端设备。因此,对模型结构进行裁剪,加速模型推理速度,减小模型存储量,对卷积神经网络普及应用具有重要意义。目前,已有设计紧凑模型网络、模型蒸馏、低秩分解、模型量化、模型裁剪等各种提高神经网络运算速度的技术。作为一种实现方便、精度保持性好、加速效果明显的运算速度提高方法,模型裁剪技术得到了越来越多的关注。在模型裁剪方法中,关键部分在于评价卷积核重要性,能否准确找出裁剪后对结果影响最小的卷积核决定了能否保持裁剪后模型的精度,也决定了裁剪算法能达到最大的推理速度提升倍数和体积压缩倍数。卷积核评价方法可以根据评价对象分为数据驱动型和参数驱动型两类。参数驱动型方法可以在模型裁剪过程中时间消耗较小,但是对模型的精度影响比较大,无法达到很高的速度提升。参数驱动型方法直接考察模型参数W,根据各通道参数值和的大小或者参数值是否大于阈值评价该卷积核通道的重要性。由于评价重要性的时候只需要遍历访问一次卷积核参数W并进行简单的求和计算即可,不需要进行额外的计算过程和重复过程,所以在裁剪的过程所需要花费的时间较少。数据驱动型方法能够在进行大比例裁剪后使得模型的精度仍然保持得较好。数据驱动型方法需要利用训练集数据和模型参数得到每一层网络的激活值,根据激活值的一些数据特性评价卷积核的重要性。由于需要把每张图片逐一输入到网络中得到的各层的激活值,因此计算量相对较大,在裁剪过程中计算时间相对较长。但是由于大量训练集图片产生的激活值包含更多的信息,因此根据激活值来选择对应的卷积核作为裁剪目标可以更加准确找出最冗余的卷积核通道。不同的卷积核评价方法需要根据不同对象的数据信息特征进行排序,对象所包含的信息越简单,裁剪过程中计算量越少,处理时间短,但裁剪后对模型精度影响较大,无法达到很大的裁剪比例;对象包含的信息越丰富,裁剪过程中计算量越大,处理时间长,但裁剪后对模型精度影响较小,可以达到很大的裁剪比例。好的卷积核评价方法需要在保证精度下,尽可能多的对卷积核进行裁剪,提高模型在推理阶段的运行速度,从而保证在嵌入式平台的实时性需要。
技术实现思路
本专利技术的目的在于,针对上述问题,提出一种基于灰色关联分析的深度卷积神经网络模型的裁剪方法,以实现准确找出被裁剪后对精度影响最小的卷积核,在保证精度的情况下提高模型裁剪比例,加快裁剪后新模型推理运算速度的优点。为实现上述目的,本专利技术实施例采用的技术方案是:一种基于灰色关联分析的深度卷积神经网络模型的裁剪方法,包括:对目标数据进行数据扩增以获得更多的训练数据;将未经训练的初始网络模型利用所述训练数据进行训练,获得一组拟合所述训练数据的模型参数作为进行裁剪的实验模型;利用灰色关联分析对所述实验模型中每个卷积核进行重要性的量化,得到每个卷积核的重要性的量化值;基于所述卷积核的重要性的量化值得到所有卷积的重要性,并将最不重要的卷积核作为目标卷积核;对所述目标卷积核及与所述目标卷积核相关的下一层卷积核进行重复裁剪,直至满足停止条件。进一步的,所述目标数据为图片数据。进一步的,所述数据扩增,包括:水平翻转或明亮度微调。进一步的,将未经训练的初始网络模型利用所述训练数据进行训练,为:将未经训练的初始网络模型利用所述训练数据利用随机梯度下降法进行训练,使得损失函数值达到全局最低点。进一步的,所述停止条件为浮点运算数FLOPs;其中,L是神经网络的总层数,i神经网络层的序号,h和w和c是当前层的输入特征图的高和宽和深度,n是输出特征图的深度,k是卷积核的尺寸。进一步的,所述利用灰色关联分析对所述实验模型中每个卷积核进行重要性的量化,得到每个卷积核的重要性的量化值,包括:将所述实验模型中每个卷积核的特征层通过全局平均池化转变为二维矩阵;将所有卷积核特征层全局平均池化转变的二维矩阵合并为分析矩阵;在所述分析矩阵内选择参考序列;分别计算所述分析矩阵的比较序列和所述参考序列的关联系数;基于所述关联系数计算所述参考序列的重要性;基于所述参考序列的重要性,获取卷积核通道重要性量化值。进一步的,所述基于所述参考序列的重要性,获取卷积核通道重要性量化值,包括:基于所述参考序列的重要性,添加关于层数的正则化函数;基于所述正则化函数得到与层数无关的卷积核通道重要性量化值进一步的,所述关联系数为:其中,代表第k个比较序列与参考序列之间的关联度,ρ是分辨系数,和为分析矩阵的元素。进一步的,所述基于所述关联系数计算所述参考序列的重要性,包括:基于所述关联系数获取比较序列与参考序列之间的平均关联度,如所述平均关联度越高,则所述参考序列所代表的卷积核通道所提取的特征与其余通道提取的特征越相似,即所述参考序列所代表的卷积核通道重要性越低。进一步的,所述其中i代表层数,j代表卷积核通道的序号,代表第j个卷积核通道的重要性。本实施例具有以下有益效果:本实施例,利用灰色关联分析对所述实验模型中每个卷积核进行重要性的量化,从而根据量化值对每个卷积核的重要性进行判断,并根据重要性选择裁剪的目标卷积核,对目标卷积核及相关卷积核进行裁剪,从而达到了准确找出被裁剪后对精度影响最小的卷积核,在保证精度的情况下提高模型裁剪比例,加快裁剪后新模型推理运算速度的优点。本实施的方法采用灰色关联分析评价卷积核重要性,裁剪掉对结果贡献小的卷积核从而减小计算量提高推理速度;所有层的卷积核都需要被评价,并且不同层之间的卷积核重要性可以进行互相比较,免除了裁剪前对各层预先设置裁剪比例;通过模型裁剪前后的FLOTs比值满足要求作为裁剪停止的信号,可以在速度提升效果达到要求后及时停止裁剪,避免精度过多的下降;具有普适性,能广泛应用于目前常见的各种网络及其变体;相比于普通的数据驱动型评价方法,本实施例采用的灰色关联分析法作为一种量化衡量因素间关联性的方法,能够准确在多个因素中找出两个关系最密切的因素,适用于寻找卷积核之间的关联性作为裁剪依据,使得即使大比例裁剪了多数卷积核仍然能保持模型精度基本不变;在保证精度的同时提高了裁剪的百分比,从加快模型在推理阶段的运行速度。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明图1为本专利技术实施例所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法流程图;图2为本专利技术实施例所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法的原理框图;图3为本专利技术实施例所述的基于灰色关联分析的本文档来自技高网
...

【技术保护点】
1.一种基于灰色关联分析的深度卷积神经网络模型的裁剪方法,其特征在于,包括:/n对目标数据进行数据扩增以获得更多的训练数据;/n将未经训练的初始网络模型利用所述训练数据进行训练,获得一组拟合所述训练数据的模型参数作为进行裁剪的实验模型;/n利用灰色关联分析对所述实验模型中每个卷积核进行重要性的量化,得到每个卷积核的重要性的量化值;/n基于所述卷积核的重要性的量化值得到所有卷积的重要性,并将最不重要的卷积核作为目标卷积核;/n对所述目标卷积核及与所述目标卷积核相关的下一层卷积核进行重复裁剪,直至满足停止条件。/n

【技术特征摘要】
1.一种基于灰色关联分析的深度卷积神经网络模型的裁剪方法,其特征在于,包括:
对目标数据进行数据扩增以获得更多的训练数据;
将未经训练的初始网络模型利用所述训练数据进行训练,获得一组拟合所述训练数据的模型参数作为进行裁剪的实验模型;
利用灰色关联分析对所述实验模型中每个卷积核进行重要性的量化,得到每个卷积核的重要性的量化值;
基于所述卷积核的重要性的量化值得到所有卷积的重要性,并将最不重要的卷积核作为目标卷积核;
对所述目标卷积核及与所述目标卷积核相关的下一层卷积核进行重复裁剪,直至满足停止条件。


2.根据权利要求1所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法,其特征在于,所述目标数据为图片数据。


3.根据权利要求2所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法,其特征在于,所述数据扩增,包括:水平翻转或明亮度微调。


4.根据权利要求1所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法,其特征在于,将未经训练的初始网络模型利用所述训练数据进行训练,为:
将未经训练的初始网络模型利用所述训练数据利用随机梯度下降法进行训练,使得损失函数值达到全局最低点。


5.根据权利要求1所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法,其特征在于,所述停止条件为浮点运算数FLOPs;



其中,L是神经网络的总层数,i神经网络层的序号,h和w和c是当前层的输入特征图的高和宽和深度,n是输出特征图的深度,k是卷积核的尺寸。


6.根据权利要求1所述的基于灰色关联分析的深度卷积神经网络模型的裁剪方法,其特征在于,所述利用灰色关联分析对所述实...

【专利技术属性】
技术研发人员:黄世青白瑞林李新
申请(专利权)人:无锡信捷电气股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1