神经网络模型量化方法及装置、存储介质及电子设备制造方法及图纸

技术编号：37119862 阅读：21 留言：0更新日期：2023-04-01 05:14

本公开涉及模型量化技术领域，具体涉及一种神经网络模型量化方法及装置、计算机可读存储介质及电子设备，方法包括：获取浮点型预训练神经网络模型；确定预设量化精度，并根据预设量化精度对预训练神经网络模型进行量化得到中间神经网络模型；获取训练数据，并利用训练数据对中间神经网络模型进行预设量化精度的量化感知训练得到目标神经网络模型。本公开实施例的技术方案提升模型量化方法的精度，克服了量化过程中模型精度损失较大的问题。服了量化过程中模型精度损失较大的问题。服了量化过程中模型精度损失较大的问题。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型量化方法及装置、存储介质及电子设备

[0001]本公开涉及模型量化
，具体而言，涉及一种神经网络模型量化方法及装置、计算机可读存储介质及电子设备。

技术介绍

[0002]随着深度学习的快速发展，深度学习模型的精度不断地得到提高。这些深度学习模型在应用时，也需要消耗巨大的硬件资源，不适用于移动终端等，为了解决在移动终端上应用高精度的深度学习模型，通常会采用对模型进行量化的方法来获得可以在移动终端上使用的模型。
[0003]但是，相关技术中的模型量化方法的量化精度较差，会造成模型的精度损失，且量化过程中的计算量较大。
[0004]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开的目的在于提供一种神经网络模型量化方法、神经网络模型量化装置、计算机可读介质和电子设备，进而至少在一定程度上提升模型量化方法的精度，克服了量化过程中模型精度损失较大的问题。
[0006]根据本公开的第一方面，提供一种神经网络模型量化方法，包括：获取浮点型预训练神经网络模型；确定预设量化精度，并根据所述预设量化精度对所述预训练神经网络模型进行量化得到中间神经网络模型；获取训练数据，并利用所述训练数据对所述中间神经网络模型进行预设量化精度的量化感知训练得到目标神经网络模型。
[0007]根据本公开的第二方面，提供一种神经网络模型量化装置，包括：获取模块，用于获取浮点型预...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型量化方法，其特征在于，包括：获取浮点型预训练神经网络模型；确定预设量化精度，并根据所述预设量化精度对所述预训练神经网络模型进行量化得到中间神经网络模型；获取训练数据，并利用所述训练数据对所述中间神经网络模型进行预设量化精度的量化感知训练得到目标神经网络模型。2.根据权利要求1所述的方法，其特征在于，所述根据所述预设量化精度对所述预训练神经网络模型进行量化得到中间神经网络模型，包括：根据所述预设量化精度确定中间量化位数；根据所述量化位数对所述预训练神经网络模型进行量化得到中间神经网络模型。3.根据权利要求1所述的方法，其特征在于，所述根据所述预设量化精度对所述预训练神经网络模型进行量化得到中间神经网络模型，包括：确定所述预训练神经网络模型中各层网络的量化范围；根据所述预设量化精度和所述量化范围对所述预训练神经网络模型中的至少一层网络进行量化得到中间神经网络模型。4.根据权利要求3所述的方法，其特征在于，所述确定所述预训练神经网络模型中各层网络的量化范围，包括：获取各层网络中的权重值集合；根据权重值集合和预设比例系数确定各层网络的量化范围。5.根据权利要求4所述的方法，其特征在于，根据权重值集合和预设比例系数确定各层网络的量化范围，包括：根据所述预设比例系数在所述权重值集合中确定最大值和最小值；根据所述最大值和所述最小值确定所述量化范围。6.根据权利要求1所述的方法，其特征在于，获取训练数据，并利用所述训练数据对所述中间神经网络模型进行预设量化精度的量化感知训练得到目标神...

【专利技术属性】
技术研发人员：陈腊梅，
申请(专利权)人：OPPO重庆智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人