基于卷积神经网络的权重分段量化方法及装置制造方法及图纸

技术编号：43849890 阅读：22 留言：0更新日期：2024-12-31 18:42

本发明专利技术涉及卷积神经网络技术领域，公开了一种基于卷积神经网络的权重分段量化方法及装置，该方法包括：获取卷积神经网络的多个计算层中每一计算层的所有权重，计算层为卷积神经网络的带参数层，根据所有计算层的权重，从所有计算层中筛选出待分段量化的目标计算层，对于每一目标计算层，根据该目标计算层的所有权重，对该目标计算层的权重进行分段，得到该目标计算层的权重分段结果，对该目标计算层的第一权重组及第二权重组进行分段量化，得到该目标计算层的量化位宽。可见，实施本发明专利技术能够准确地筛选出需要分段量化的目标计算层，且能够准确地对各组权重进行量化，能够提高卷积神经网络中各层权重的量化精度，且有利于减少计算量。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及卷积神经网络，尤其涉及一种基于卷积神经网络的权重分段量化方法及装置。

技术介绍

1、当前，深度学习应用越来越广泛，但随着其卷积神经网络加深，参数量加大，在其运算推理的过程中存在巨大内存和算力开销。出于效率，带宽，功耗的考虑，目前绝大多数端侧soc npu只支持整型运算，因此权重量化将是深度学习部署在端侧的必然选择。

2、然而，实践发现，由于量化用低bit(量化位宽)整型运算替代高bit浮点运算的特性，存在运算精度损失的问题，而目前业内较为通用的解决方案是将浮点32位的网络量化成定点8位整型网络计算。由于网络学习过程有一定随机性，其中各个层的所需信息容量不同，有些层用8bit量化计算时容易出现其结果与浮点的精度相差甚远的情况。由此可见，提出一种新的权重量化方案以提高量化精度显得尤为重要。

技术实现思路

1、本专利技术提供了一种基于卷积神经网络的权重分段量化方法及装置，能够提高卷积神经网络中各层权重的量化精度。

2、为了解决上述技术问题，本专利技术第一方面...

【技术保护点】

1.一种基于卷积神经网络的权重分段量化方法，其特征在于，所述方法包括：

2.根据权利要求1所述的基于卷积神经网络的权重分段量化方法，其特征在于，所述根据所有所述计算层的权重，从所有所述计算层中筛选出待分段量化的目标计算层，包括：

3.根据权利要求2所述的基于卷积神经网络的权重分段量化方法，其特征在于，对于每一所述计算层，所述根据该计算层的所有权重，对该计算层进行损失计算，得到该计算层的量化信息损失，包括：

4.根据权利要求2或3所述的基于卷积神经网络的权重分段量化方法，其特征在于，对于每一所述计算层，所述根据该计算层的权重直方图，判断该计算层的权重分布...

【技术特征摘要】

1.一种基于卷积神经网络的权重分段量化方法，其特征在于，所述方法包括：

4.根据权利要求2或3所述的基于卷积神经网络的权重分段量化方法，其特征在于，对于每一所述计算层，所述根据该计算层的权重直方图，判断该计算层的权重分布情况是否满足预设的拖尾分布条件，包括：

5.根据权利要求4所述的基于卷积神经网络的权重分段量化方法，其特征在于，对于每一所述计算层，所述根据该计算层的权重直方图，从所述权重直方图中确定出满足预设面积条件的目标区域，...

【专利技术属性】
技术研发人员：袁新焰，钟午，
申请(专利权)人：珠海全志科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人