神经网络量化参数生成方法、装置、集成电路和计算设备制造方法及图纸

技术编号：42023216 阅读：15 留言：0更新日期：2024-07-16 23:14

本公开实施例公开了一种神经网络量化参数生成方法、装置、集成电路和计算设备，其中，该方法包括：将预设的校准数据集输入预先训练的神经网络模型，得到每层子网络的原始输出特征图；对于每层子网络，基于该子网络对应的原始输出特征图，初始化该子网络的校准输出特征图；基于预设的损失函数，确定表示校准输出特征图与期望输出特征图的误差的损失值；基于损失值，迭代更新校准输出特征图得到校准后输出特征图；基于校准后输出特征图、该子网络的权重数据集和输入特征图，对初始量化参数进行迭代更新，得到该子网络对应的量化参数。本公开实施例可以提高获得量化参数的准确性，进而提升使用少量校准数据集进行量化的神经网络的预测准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及计算机，尤其是一种神经网络量化参数生成方法、装置、集成电路和计算设备。

技术介绍

1、神经网络的量化是一种压缩技术，其将神经网络中的浮点数据替换为整数数据，将浮点运算替换为整数运算，可以减少运行神经网络的存储和计算开销。后训练量化(ptq，post-training quantization)算法是一种常见的神经网络量化的流程。后训练量化对训练调优完成后的神经网络进行调整，可以快速得到量化神经网络。

2、神经网络量化会改变原有的权重与输入输出，对权重与输出的不同量化参数会有不同的结果。后训练量化的优化目标就是调整量化参数以最小化神经网络量化后的输出与原始神经网络的输出之间的差异。后训练量化的标准流程是：收集一些不带标准的校准输入数据，如对于卷积神经网络可以是256张输入图片。将这些校准数据输入神经网络中进行前向传播运算，可以得到原始神经网络中每一层的输入与输出。每一层搜索最优的量化参数以最小化在校准数据上的量化前后差异。

3、但是，由于校准数据数量较少，数据的分布会和真实数据分布之间存在偏差，因此使用这...

【技术保护点】

1.一种神经网络量化参数生成方法，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述校准后输出特征图、该子网络的权重数据集和输入特征图，对所述初始量化参数进行迭代更新，得到该子网络对应的量化参数，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述校准后输出特征图和该子网络的权重数据集，确定量化参数搜索空间，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于预设的损失函数，确定表示所述校准输出特征图与期望输出特征图的误差的损失值，包括：

5.根据权利要求4所述的方法，其特征在于，所述至少一个原始统计数据集合中的...

【技术特征摘要】

1.一种神经网络量化参数生成方法，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述校准后输出特征图和该子网络的权重数据集，确定量化参数搜索空间，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于预设的损失函数，确定表示所述校准输出特征图与期望输出特征图的误差的损失值，包括：

5.根据权利要求4所述的方法，其特征在于，所述至少一个原始统计数据集合中的每个原始统计数据包括目标数量个数据，所述目标数量个数据中的每个数据分别对应于该子网络之后的一个下级子网络；

6.根...

【专利技术属性】
技术研发人员：袁之航，刘佳伟，杨大卫，
申请(专利权)人：南京后摩智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人