神经网络的量化方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:32017009 阅读:24 留言:0更新日期:2022-01-22 18:35
本公开提供一种神经网络的量化方法、装置、计算机设备及存储介质。所述神经网络包括多个块,每个块包括所述神经网络中的至少一个网络层;所述方法包括:获取神经网络中一组块的目标量化配置集合;基于获取的一组块的目标量化配置集合,对神经网络中另一组块的候选量化配置集合进行过滤,得到另一组块的目标量化配置集合,使得在另一组块经所述另一组块的目标量化配置集合中的量化配置进行量化,且所述一组块经所述一组块的目标量化配置集合中的量化配置进行量化的情况下,神经网络的目标性能参数的边界值均不超出目标性能参数对应的预设参数范围;基于各个块的目标量化配置确定所述神经网络的目标量化配置,并对所述神经网络进行量化处理。络进行量化处理。络进行量化处理。

【技术实现步骤摘要】
神经网络的量化方法、装置、计算机设备及存储介质


[0001]本公开涉及人工智能
,尤其涉及一种神经网络的量化方法、装置、计算机设备及存储介质。

技术介绍

[0002]深度神经网络(Deep Neural Networks,DNN)、卷积神经网络(Convolutional Neural Network,CNN)等各种神经网络在图像分类、目标检测等多种计算机视觉领域中都得到了广泛的应用,一般来说,神经网络层数越多、参数越多,神经网络的输出结果就更准确,但同时也会导致计算复杂度更高以及内存需求更大。
[0003]在一些应用场景中,神经网络可用的内存等资源是有限的,例如要求在嵌入式设备上部署神经网络。对于这些应用场景,部署计算复杂度高、内存需求大的神经网络是不切实际的,因此需要对这些神经网络进行一定的处理,减少神经网络的内存需求,才能将神经网络部署在资源有限的场景中。
[0004]一种在资源有限的场景中部署神经网络的可行方法是,将神经网络中全精度的参数量化为较低精度,以便使用更少的位宽去保存参数,以此达到降低内存需求的目的。硬件本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种神经网络的量化方法,其特征在于,所述神经网络包括多个块,每个块包括所述神经网络中的至少一个网络层;所述方法包括:获取所述神经网络中一组块的目标量化配置集合,一组块包括至少一个块;基于获取的一组块的目标量化配置集合,对所述神经网络中另一组块的候选量化配置集合进行过滤,得到所述另一组块的目标量化配置集合,使得在所述另一组块经所述另一组块的目标量化配置集合中的量化配置进行量化,且所述一组块经所述一组块的目标量化配置集合中的量化配置进行量化的情况下,所述神经网络的目标性能参数的边界值均不超出所述目标性能参数对应的预设参数范围;基于各个块的目标量化配置确定所述神经网络的目标量化配置,并对所述神经网络进行量化处理。2.根据权利要求1所述的方法,其特征在于,所述一组块包括所述神经网络中的前j个块,所述另一组块包括所述神经网络中的前i个块,i为大于1的正整数,j为小于i的正整数。3.根据权利要求2所述的方法,其特征在于,所述基于获取的一组块的目标量化配置集合,对所述神经网络中另一组块的候选量化配置集合进行过滤,得到所述另一组块的目标量化配置集合,包括:针对所述前i个块的候选量化配置集合中的每种量化配置,确定所述前i个块经所述量化配置量化后,所述神经网络的目标性能参数的边界值;在所述神经网络的目标性能参数的边界值超出所述目标性能参数对应的预设参数范围的情况下,从所述前i个块的候选量化配置集合中过滤掉所述量化配置,得到所述前i个块的目标量化配置集合。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:基于前j个块的目标量化配置集合,确定前i个块的候选量化配置集合。5.根据权利要求4所述的方法,其特征在于,所述基于前j个块的目标量化配置集合,确定前i个块的候选量化配置集合,包括:对所述前j个块的目标量化配置集合中的每种量化配置与所述神经网络的第i个块的初始量化配置集合中的每种量化配置进行排列组合,得到前i个块的初始量化配置集合;针对所述前i个块的初始量化配置集合中的每种量化配置,确定所述前i个块中的每个网络层在所述量化配置下对应的量化敏感度参数,一个网络层对应的量化敏感度参数用于表征所述网络层量化前的输出结果与量化后的输出结果之间的差异;基于所述前i个块中的各个网络层在所述量化配置下对应的量化敏感度参数,确定所述前i个块在所述量化配置下对应的量化敏感度参数的估计值;从所述前i个块的初始量化配置集合中,选取至少一种量化配置,得到所述前i个块的候选量化配置集合,选取的量化配置对应的量化敏感度参数的估计值大于未被选取的量化配置对应的量化敏感度参数的估计值。6.根据权利要求5所述的方法,其特征在于,所述基于所述前i个块中的各个网络层在所述量化配置下对应的量化敏感度参数,确定所述前i个块在所述量化配置下对应的量化敏感度参数的估计值,包括:对所述前i个块中的各个网络层在所述量化配置下对应的量化敏感度参数求和,得到所述前i个块在所述量化配置下对应的量化敏感度参数的估计值。
7.根据权利要求3至6任意一项所述的方法,其特征在于,所述方法还包括:针对前i个块的目...

【专利技术属性】
技术研发人员:张卓翼
申请(专利权)人:上海商汤阡誓科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1