通用剪枝(UniPruning):用于神经网络加速的通用的硬件高效的剪枝方法技术

技术编号:42170025 阅读:33 留言:0更新日期:2024-07-27 00:16
描述了用于获得神经网络各层内权重集的分数的方法和装置。所述分数基于第一层中的权重集和以下中的一个或多个:(i)后续归一化层中的(可选)归一化系数和(ii)第二层中的权重集。根据所述分数,可以从所述层中删除所述权重集。这样剪枝可以减小相应层的大小。根据组分数,可以从所述神经网络的一个或多个层中剪枝多组权重集。例如,所述组的大小可以基于硬件规格。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、近年来,深度学习在许多实际应用中取得了重大突破,例如计算机视觉(例如对象检测、分割和人脸识别)、自然语言处理、语音识别等。多年来,研究的主要目标是提高模型的质量,即使模型大小和时延非常高。然而,对于通常需要实时工作的生产技术方案,模型的时延起着非常重要的作用。


技术实现思路

1、本专利技术的实施例提供了用于训练和剪枝神经网络的装置和方法。

2、本专利技术的实施例由独立权利要求的特征定义,并且实施例的其它有利实现方式由从属权利要求的特征定义。

3、根据一个实施例,提供了一种用于训练神经网络的方法,所述神经网络包括至少两个层,所述方法包括:获得贡献于特征张量中的特征的第一权重集的分数,所述特征张量是所述神经网络的第一层的输出;所述分数基于所述第一权重集,并且所述分数还基于以下中的一个或多个:归一化系数,所述归一化系数应用于紧跟在所述第一层之后的归一化层中;和/或第二权重集,所述第二集合包括在将第二层应用于所述特征张量时应用于所述特征的权重,所述第二层在所述第一层之后;所述方本文档来自技高网...

【技术保护点】

1.一种用于训练神经网络的方法,其特征在于,所述神经网络包括至少两个层,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述删除还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述获得分数还包括:

4.根据权利要求3所述的方法,其特征在于,还包括:

5.根据权利要求4所述的方法,其特征在于,所述排列还包括:

6.根据权利要求4或5所述的方法,其特征在于,还包括:

7.根据权利要求6所述的方法,其特征在于,组的组分数是通过将统计度量应用于所述组中的所述权重集的所述分数来获得的。p>

8.根据权...

【技术特征摘要】
【国外来华专利技术】

1.一种用于训练神经网络的方法,其特征在于,所述神经网络包括至少两个层,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述删除还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述获得分数还包括:

4.根据权利要求3所述的方法,其特征在于,还包括:

5.根据权利要求4所述的方法,其特征在于,所述排列还包括:

6.根据权利要求4或5所述的方法,其特征在于,还包括:

7.根据权利要求6所述的方法,其特征在于,组的组分数是通过将统计度量应用于所述组中的所述权重集的所述分数来获得的。

8.根据权利要求6或7所述的方法,其特征在于,所述删除包括:如果基于所述组的所述组分数的预定条件被满足,则从所述第一层中删除(s755)一组权重集。

9.根据权利要求6或7所述的方法,其特征在于,

10.根据权利要求9所述的...

【专利技术属性】
技术研发人员:弗拉基米尔·彼得罗维奇德米特里·谢尔盖耶维奇·米哈伊洛夫彼得·安德烈耶维奇·沃罗别夫伊万·列昂尼多维奇·马祖连科熊业攀申皓全
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1