一种神经网络的剪枝方法技术

技术编号:35702951 阅读:25 留言:0更新日期:2022-11-23 14:57
本发明专利技术提出了一种神经网络的剪枝方法,包括以下步骤:S1,根据硬件资源的规模、时序约束、以及先验知识,确定脉动阵列规模,再根据硬件资源的规模、时序约束、以及先验知识、脉动阵列规模,确定最大筛选通道数和过滤器分组的最小数量;S2,将S1得到的最大筛选通道数和过滤器分组的最小数量以及其它约束条件训练神经网络;S3,训练完毕后,通过编译器产生指令,对加速器的剪枝模式进行配置;S4,然后加速器接收解码后的指令,将输入特征图数据、经过训练压缩后的权重数据、根据训练生成的剪枝模式配置信息、以及经过训练生成的通道选择数据加载至加速器内部的硬件缓存单元中;S5,数据全部加载至硬件内部资源后,加速器开始进行卷积计算,脉动阵列开始工作,最终得到卷积结果。本发明专利技术能够在满足脉动阵列SA工作模式,保证其工作效率的前提下,减少了模型的参数量,提高了模型推理的速度。型推理的速度。型推理的速度。

【技术实现步骤摘要】
一种神经网络的剪枝方法


[0001]本专利技术涉及CNN卷积处理
,特别是涉及一种神经网络的剪枝方法。

技术介绍

[0002]近年来,神经网络被大量应用在计算机视觉、机器翻译、语音识别等领域中。随着神经网络技术的不断发展,其网络结构的设计愈发复杂。其最直观的表现就在于网络的层数越来越多、网络的参数量越来越大,这极大的增加了神经网络的运算工作量。过多的参数量使得神经网络难以部署在存储资源有限的硬件资源上、或因数据传输带宽的限制难以充分发挥硬件资源的计算能力。因此研究一种神经网络的剪枝方法,对神经网络进行剪枝处理是十分必要的。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种神经网络的剪枝方法。
[0004]为了实现本专利技术的上述目的,本专利技术提供了一种神经网络的剪枝方法,包括以下步骤:
[0005]S1,根据硬件资源的规模、时序约束、以及先验知识,确定脉动阵列规模,再根据硬件资源的规模、时序约束、以及先验知识、脉动阵列规模,确定最大筛选通道数和过滤器分组的最小本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种神经网络的剪枝方法,其特征在于,包括以下步骤:S1,根据硬件资源的规模、时序约束、以及先验知识,确定脉动阵列规模,再根据硬件资源的规模、时序约束、以及先验知识、脉动阵列规模,确定最大筛选通道数和过滤器分组的最小数量;S2,将S1得到的最大筛选通道数和过滤器分组的最小数量以及其它约束条件训练神经网络;S3,训练完毕后,通过编译器产生指令,对加速器的剪枝模式进行配置;S4,然后加速器接收解码后的指令,将输入特征图数据、经过训练压缩后的权重数据、根据训练生成的剪枝模式配置信息、以及经过训练生成的通道选择数据加载至加速器内部的硬件缓存单元中;S5,数据全部加载至硬件内部资源后,加速器开始进行卷积计算,脉动阵列开始工作,最终得到卷积结果。2.根据权利要求1所述的一种神经网络的剪枝方法,其特征在于,S3包括:S3

1,对通道选择模式进行配置:根据指令,选择输入特征图数据相邻2
n
个通道数据选择其中一个输入至SA脉动阵列中的其中一个运算处理单元PE中,也可以选择将每一通道的数据都输入至PE运算单元中;S3

2,对过滤器分组模式进行配置:进行卷积运算时,输入特征图数据需要分...

【专利技术属性】
技术研发人员:朴星泉汪成亮汪鹏吴昊杨镡黄哲通任骜
申请(专利权)人:中国人民解放军陆军军医大学第一附属医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1