【技术实现步骤摘要】
本专利技术涉及计算机领域,特别涉及一种神经网络剪枝方法及装置。
技术介绍
目前,深度神经网络在计算机视觉领域取得了巨大的成功,如图像分类、目标检测、图像分割等。然而,效果较好的深度神经网络往往有着数量较大的模型参数,不仅计算量大而且在实际部署中模型占据较大一部分空间,这在一些需要实时运算的应用场景无法正常应用。因此,如何对深度神经网络进行压缩与加速则显得尤为重要,尤其是未来一些需要将深度神经网络应用到诸如嵌入式设备、集成硬件设备中的应用场景。目前,对深度神经网络进行压缩和加速的方式主要是通过网络剪枝的方式实现,例如,SongHan等人发表的论文“LearningbothWeightsandConnectionsforEfficientNeuralNetwork”中提出了一种基于权重的网络剪枝技术,以及ZeldaMariet等人发表的论文“DiversityNetworks”中提出了一种基于行列式点过程的神经网络剪枝技术。然而目前的网络剪枝技术的效果不理想,仍然存在压缩、加速和精度不能同时兼顾的技术问题。
技术实现思路
鉴于上述问题,本专利技术提供一种神经网络剪枝方法及装置,以解决现有技术存在压缩、加速和精度不能同时兼顾的技术问题。本专利技术一方面,提供一种神经网络剪枝方法,方法包括:根据待剪枝网络层中神经元的激活值,确定神经元的重要度值;根据所述待剪枝网络层中神经元与下一个网络层中神经元的连接权重,确定神经元的多样性值;根据所述待剪枝网络层中的神经元的重要度值和多样性值,采用体积最大化神经元选取策略从所述待剪枝网络层中选取保留的神经元;将所述待剪枝网络层中的 ...
【技术保护点】
一种神经网络剪枝方法,其特征在于,所述方法包括:根据待剪枝网络层中神经元的激活值,确定神经元的重要度值;根据所述待剪枝网络层中神经元与下一个网络层中神经元的连接权重,确定神经元的多样性值;根据所述待剪枝网络层中的神经元的重要度值和多样性值,采用体积最大化神经元选取策略从所述待剪枝网络层中选取保留的神经元;将所述待剪枝网络层中的其他神经元剪掉,得到剪枝网络层。
【技术特征摘要】
1.一种神经网络剪枝方法,其特征在于,所述方法包括:根据待剪枝网络层中神经元的激活值,确定神经元的重要度值;根据所述待剪枝网络层中神经元与下一个网络层中神经元的连接权重,确定神经元的多样性值;根据所述待剪枝网络层中的神经元的重要度值和多样性值,采用体积最大化神经元选取策略从所述待剪枝网络层中选取保留的神经元;将所述待剪枝网络层中的其他神经元剪掉,得到剪枝网络层。2.根据权利要求1所述的方法,其特征在于,所述根据待剪枝网络层中神经元的激活值,确定神经元的重要度值,包括:通过神经网络对输入数据进行一次前向操作,得到该待剪枝网络层中每个神经元的激活值向量;计算各神经元的激活值向量的方差;根据各神经元的方差得到所述待剪枝网络层的神经元方差重要性向量;根据所述神经元方差重要性向量,分别对各神经元的方差进行归一化处理,得到神经元的重要度值。3.根据权利要求2所述的方法,其特征在于,采用以下公式对各神经元的方差进行归一化处理:其中式中,qi为待剪枝网络层中第i个神经元的激活值向量的方差,Q为待剪枝网络层的神经元方差重要性向量。4.根据权利要求1所述的方法,其特征在于,根据所述待剪枝网络层中神经元与下一个网络层中神经元的连接权重,确定神经元的多样性值,包括:针对待剪枝网络层中的每个神经元,根据所述神经元与下一个网络层中神经元的连接权重,构建所述神经元的权重向量,并将所述权重向量的方向向量确定为所述神经元的多样性值。5.根据权利要求1所述的方法,其特征在于,所述根据所述待剪枝网络层中的神经元的重要度值和多样性值,采用体积最大化神经元选取策略从所述待剪枝网络层中选取保留的神经元,包括:针对待剪枝网络层中的每个神经元,将所述神经元的重要度值与多样性值的乘积确定为所述神经元的特征向量;从所述待剪枝网络层中的神经元中选取多组包含k个神经元的组合,所述k为预置的正整数;计算每个组合包含的神经元的特征向量所组成的平行六面体的体积,选取体积最大的组合作为保留的神经元。6.根据权利要求1所述的方法,其特征在于,所述根据所述待剪枝网络层中的神经元的重要度值和多样性值,采用体积最大化神经元选取策略从所述待剪枝网络层中选取保留的神经元,包括:针对待剪枝网络层中的每个神经元,将所述神经元的重要度值与多样性值的乘积确定为所述神经元的特征向量;采用贪心求解方法,从所述待剪枝网络层中的神经元中选取k个神经元作为保留的神经元。7.根据权利要求6所述的方法,其特征在于,采用贪心求解方法,从所述待剪枝网络层中的神经元中选取k个神经元作为保留的神经元,包括:初始化神经元集合为空集合;根据所述待剪枝网络层中的神经元的特征向量构建特征矩阵;采用多轮以下选取方式选取k个神经元:从本轮选取的特征矩阵中选取模长最大的特征向量,并将所述模长最大的特征向量对应的神经元添加至所述神经元集合中;判断所述神经元集合中的神经元数量是否达到k,若是则结束;若否,则:从本轮选取的特征矩阵中去掉所述模长最大的特征向量在其他特...
【专利技术属性】
技术研发人员:王乃岩,
申请(专利权)人:北京图森互联科技有限责任公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。