神经网络模型的剪枝方法、装置、设备和人工智能芯片制造方法及图纸

技术编号：22187025 阅读：75 留言：0更新日期：2019-09-25 03:53

本发明专利技术实施例提供了一种神经网络模型的剪枝方法、装置、设备和人工智能芯片。神经网络模型的剪枝方法包括：获取对第一神经网络模型中的多个层进行训练过程中逐层分析时每层所使用的第一功耗；根据第一功耗分别制定每层对应的第一剪枝策略；根据第一剪枝策略对第一神经网络模型中的每层选择性地进行剪枝以获得剪枝完成的第二神经网络模型，从而有效减少神经网络模型训练过程中的功耗。

Pruning Method, Device, Equipment and Artificial Intelligence Chip of Neural Network Model

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型的剪枝方法、装置、设备和人工智能芯片
本专利技术涉及神经网络模型的
，特别涉及一种神经网络模型的剪枝方法、装置、设备和人工智能芯片。
技术介绍
随着神经网络不断地变深，其网络规模及复杂程度都在不断地变大，同时也会使得网络参数的数量变得越来越多，运算的过程变得越来越复杂，因而导致网络运行所占用的运算资源越来越大，所需的运算时间也越来越多，运算所需要的硬件资源(内存、CPU等)也越来越高，然而这并不利于神经网络在移动和嵌入式等资源受限型设备上的部署。为了降低运算和存储成本，目前已有许多研究者对神经网络模型进行压缩与加速的研究，参数剪枝则是其中的一种方法。然而，目前现有的参数剪枝方法大多基于通道对神经网络模型进行剪枝，这样并不能保证剪枝后，系统的功耗能够最大化降低。
技术实现思路
有鉴于此，本专利技术实施例为解决上述问题提供了一种神经网络模型的剪枝方法、装置、设备和人工智能芯片，有效减少了神经网络模型训练过程中的功耗。本专利技术实施例的第一方面提供一种神经网络模型的剪枝方法，该方法包括：获取对第一神经网络模型中的多个层进行训练过程中逐层分析时每层所使用的第一功耗；根据第一功耗分别制定每层对应的第一剪枝策略；根据第一剪枝策略对第一神经网络模型中的每层选择性地进行剪枝以获得剪枝完成的第二神经网络模型。本专利技术一实施例中，上述根据第一功耗分别制定每层对应的第一剪枝策略，包括：当第一神经网络模型的多个层中的第一层的第一功耗大于预设阈值时，第一层对应的第一剪枝策略为对第一层进行剪枝，当多个层中的第一层的第一功耗小于或等于预设阈值时，第一层对应的第一剪枝策略...

【技术保护点】
1.一种神经网络模型的剪枝方法，其特征在于，包括：获取对第一神经网络模型中的多个层进行训练过程中逐层分析时每层所使用的第一功耗；根据所述第一功耗分别制定每层对应的第一剪枝策略；根据所述第一剪枝策略对所述第一神经网络模型中的每层选择性地进行剪枝以获得剪枝完成的第二神经网络模型。

【技术特征摘要】
1.一种神经网络模型的剪枝方法，其特征在于，包括：获取对第一神经网络模型中的多个层进行训练过程中逐层分析时每层所使用的第一功耗；根据所述第一功耗分别制定每层对应的第一剪枝策略；根据所述第一剪枝策略对所述第一神经网络模型中的每层选择性地进行剪枝以获得剪枝完成的第二神经网络模型。2.根据权利要求1所述的剪枝方法，其特征在于，所述根据所述第一功耗分别制定每层对应的第一剪枝策略，包括：当所述第一神经网络模型的多个层中的第一层的第一功耗大于预设阈值时，所述第一层对应的第一剪枝策略为对所述第一层进行剪枝，当所述多个层中的第一层的第一功耗小于或等于预设阈值时，所述第一层对应的第一剪枝策略为不对所述第一层进行剪枝。3.根据权利要求1所述的剪枝方法，其特征在于，所述根据所述第一剪枝策略对所述第一神经网络模型中的每层选择性地进行剪枝以获得剪枝完成的第二神经网络模型，包括：根据所述第一剪枝策略对所述第一神经网络模型中的每层采用权衰减法、灵敏度计算方法或相关性剪枝方法选择性地进行剪枝以获得剪枝完成的第二神经网络模型。4.根据权利要求1所述的剪枝方法，其特征在于，所述剪枝方法还包括:对所述第二神经网络模型进行再训练；获取对所述第二神经网络模型中的多个层进行训练过程中逐层分析时每层所使用的第二功耗；判断所述每层所使用的第二功耗是否均小于或等于预设阈值；当所述每层所使用的第二功耗中存在至少一层的第二功耗大于所述预设阈值时，根据所述第二功耗分别制定每层对应的第二剪枝策略，并根据所述第二剪枝策略对所述第二神经网络模型中的每...

【专利技术属性】
技术研发人员：刘小涛，张韵东，徐祥，
申请(专利权)人：北京中星微电子有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人