用于剪枝神经网络的方法及装置制造方法及图纸

技术编号：35090242 阅读：28 留言：0更新日期：2022-10-01 16:47

使用一种逐块重要性估计方法，以便准确估计块对目标的贡献。神经网络的层首先被分组为虚拟块，块大小由计算要求决定。每个块的最后一层连接到包括缩放层的第二层组。所述缩放层是与上一个特征图相乘的可训练标量。所有块的缩放输出将被求和并进行转发或预测。在训练期间，相对于地面真值贡献较高精度的块被分配较高的缩放因子。使用逐层解耦方法，减少每个层中的神经元之间的依赖关系。基于所述虚拟块的确定的重要性度量和所述层中神经元的多样性，从所述层中剪枝神经元。从所述层中剪枝神经元。从所述层中剪枝神经元。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于剪枝神经网络的方法及装置

[0001]本专利技术的方面大体上涉及神经网络，更具体地，涉及剪枝卷积神经网络。

技术介绍

[0002]深度神经网络(deep neural network，DNN)是一种强大的模型，已成功应用于图像识别、语音识别和机器翻译等各种人工智能(artificial intelligence，AI)任务。但是，深度神经网络对计算资源的要求非常高，需要大量的每秒浮点运算次数(floating point operation per second，FLOP)。模型压缩和加速在各种基于深度神经网络的AI应用中至关重要。
[0003]剪枝是一种通过压缩减小神经网络大小的方法。在预训练网络之后，对该网络进行微调以确定连接的重要性。以前的结构剪枝方法通常计算每个神经元的全局缩放因子作为重要性度量，并对重要性较低的神经元进行剪枝以保持精度。但是，有两个限制可能导致剪枝不当并损害精度。考虑到现代深度神经网络中有大量层，寻找一个全局公平的缩放因子十分困难。此外，缩放因子不能反映滤波器之间的相关性，因此剪枝重要性较低的滤波器仍然可能影响相关滤波器并损害精度。
[0004]因此，希望能够提供一种剪枝架构和方法，可以解决上述至少一些问题。

技术实现思路

[0005]所公开实施例的方面涉及一种用于深度神经网络的结构化剪枝方法。该目的通过独立权利要求的主题来实现。在从属权利要求中提供了其它有利修改。
[0006]根据第一方面，通过一种装置获得上述以及其它目的和优点。在一个实施例中，...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种装置(100)，其特征在于，包括处理器(102)，所述处理器(102)用于：将卷积神经网络的层分组为一个或多个虚拟块，其中，所述一个或多个虚拟块中的每个虚拟块包括至少一个层；确定所述一个或多个虚拟块中的虚拟块的重要性度量；对所述虚拟块的层中的神经元应用多样性正则化，以减少所述层中神经元之间的依赖关系；基于所述虚拟块的所述确定的重要性度量和所述层中神经元的多样性，从所述层中剪枝神经元。2.根据权利要求1所述的装置(100)，其特征在于，每个虚拟块的最后一个卷积层连接到第二层组中的相应层，其中，所述第二层组包括平均池化层、全连接层和缩放层。3.根据权利要求1或2所述的装置(100)，其特征在于，所述处理器(102)还用于通过以下操作确定所述一个或多个虚拟块的所述重要性度量：将与所述一个或多个虚拟块中的每个虚拟块相关联的所述缩放层的输出求和；将所述求和后的输出转发给预测层，用于训练期间的精度预测；为在训练期间贡献较高精度的虚拟块分配较高缩放因子，并为在训练期间贡献较低精度的虚拟块分配较低缩放因子。4.根据上述权利要求中任一项所述的装置(100)，其特征在于，所述多样性正则化定义为：其中，L是层数，W是每层L的权重矩阵，I是识别矩阵，||
·
||F是Frobenius范数。5.根据上述权利要求中任一项所述的装置(100)，其特征在于，处理器(102)用于通过以下操作，基于所述虚拟块的所述确定的重要性度量和所述层中神经元的多样性从所述层中剪枝神经元：从所述一个或多个虚拟块中选择所述虚拟块；从所述选择的虚拟块中选择所述层；计算所述选择层的两个神经元的权重矢量之间的相关值D；将所述相关值D按升序排序；基于所述相关值D从所述选择层中剪枝神经元。6.根据权利要求5所述的装置(100)，其特征在于，所述虚拟块是...

【专利技术属性】
技术研发人员：王廷槐，宽，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人