一种神经网络模型量化方法、设备、产品及介质技术

技术编号：33912429 阅读：13 留言：0更新日期：2022-06-25 19:41

本申请公开了一种神经网络模型量化方法、设备、产品及介质，应用于人工智能技术领域，用以解决利用直通估计器进行模型量化导致模型性能下降的问题。具体为：获取预先训练的用于对输入的图像数据进行处理且各权重为浮点数的第一神经网络模型；基于梯度调整函数分别对第一神经网络模型的各权重进行调整，得到第二神经网络模型；基于权重量化系数分别对第二神经网络模型的各权重进行量化，得到目标神经网络模型。这样，通过利用梯度调整函数调整神经网络模型的各权重使各权重分别收敛于其对应的量化整数值后再基于权重量化系数对各权重进行量化，可以实现完全绕过直通估计器的模型量化，保持了神经网络模型的最优性能和对输入的图像数据的处理精度。的图像数据的处理精度。的图像数据的处理精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络模型量化方法、设备、产品及介质

[0001]本申请涉及计算机
，尤其涉及一种神经网络模型量化方法、设备、产品及介质。

技术介绍

[0002]目前，神经网络模型通常包含有数百万的模型参数，这些模型参数一般是浮点数，占用了很大的磁盘空间，而由于普通的压缩算法很难压缩其占用的磁盘空间，因此，引入了神经网络模型量化技术。
[0003]现有技术中，通常是在神经网络模型训练过程中在梯度回传时对神经网络模型的权重进行量化，同时使用直通估计器规定量化运算的梯度为1，从而使梯度连续，然而，这种基于直通估计器的神经网络模型量化方法会使神经网络模型的性能出现一定下降。

技术实现思路

[0004]本申请实施例提供了一种神经网络模型量化方法、设备、产品及介质，用以解决现有技术利用直通估计器量化神经网络模型时导致神经网络模型性能下降的问题。
[0005]本申请实施例提供的技术方案如下：
[0006]一方面，本申请实施例提供了一种神经网络模型量化方法，包括：
[0007]获取预先训练的用于对输入的图像数据进行处理且各权重为浮点数的第一神经网络模型；
[0008]基于梯度调整函数，分别对第一神经网络模型的各权重进行调整，得到第二神经网络模型；其中，梯度调整函数在正向传播时为恒等函数，在反向传播时分别对第一神经网络模型的各权重进行调整，使得第一神经网络模型的各权重分别收敛于其对应的量化整数值；
[0009]基于权重量化系数，分别对第二神经网络模型的各权重进行量化，得到目...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型量化方法，其特征在于，包括：获取预先训练的用于对输入的图像数据进行处理且各权重为浮点数的第一神经网络模型；基于梯度调整函数，分别对所述第一神经网络模型的各权重进行调整，得到第二神经网络模型；其中，所述梯度调整函数在正向传播时为恒等函数，在反向传播时分别对所述第一神经网络模型的各权重进行调整，使得所述第一神经网络模型的各权重分别收敛于其对应的量化整数值；基于权重量化系数，分别对所述第二神经网络模型的各权重进行量化，得到目标神经网络模型；其中，所述权重量化系数用于将所述第二神经网络模型的各权重分别映射到其对应的整数域上。2.如权利要求1所述的神经网络模型量化方法，其特征在于，基于梯度调整函数，分别对所述第一神经网络模型的各权重进行调整，得到第二神经网络模型，包括：基于所述梯度调整函数，分别对所述第一神经网络模型的各权重进行变形，得到中间神经网络模型；基于训练样本集，对所述中间神经网络模型进行训练，得到所述第二神经网络模型。3.如权利要求2所述的神经网络模型量化方法，其特征在于，基于训练样本集，对所述中间神经网络模型进行训练，得到所述第二神经网络模型，包括：基于所述训练样本集，对所述中间神经网络模型进行迭代训练，直至确定迭代训练的次数达到设定次数时，基于最后一次迭代训练获得的各目标权重，得到所述第二神经网络模型；其中，每次迭代训练包括：从所述训练样本集中选取目标训练样本；将所述目标训练样本输入所述中间神经网络模型，得到所述目标训练样本的预测结果，并基于所述目标训练样本的预测结果和标注结果，得到目标损失值；基于所述中间神经网络模型的各权重和所述各权重的权重量化参数，确定所述各权重的梯度比例参数，分别基于所述各权重的梯度比例参数和当前梯度，确定所述各权重的第一目标梯度；其中，所述各权重的当前梯度为上次迭代训练获得的所述各权重的第一目标梯度；分别基于所述目标损失值和所述各权重的第一目标梯度，更新所述各权重，得到各目标权重。4.如权利要求3所述的神经网络模型量化方法，其特征在于，分别基于所述各权重的梯度比例参数和当前梯度，确定所述各权重的第一目标梯度之前，还包括：针对所述中间神经网络模型的每一权重，获取不包含所述梯度比例参数时所述权重的第二目标梯度，...

【专利技术属性】
技术研发人员：孙培钦，周赫斌，
申请(专利权)人：北京迈格威科技有限公司深圳旷视金智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人