神经网络模型的量化方法、电子设备及可读存储介质技术

技术编号：36227346 阅读：15 留言：0更新日期：2023-01-04 12:26

本申请涉及人工智能领域，公开了一种神经网络模型的量化方法、电子设备及可读存储介质。该方法通过确定量化的神经网络模型的预设结构，预设结构包括线性算子和非线性算子，并在非线性算子的类型为第一类型的情况下，将线性算子的输入数据的量化参数融合到非线性算子的第一浮点数权重数据中，确定第二浮点数权重数据，对第二浮点数权重数据进行量化，确定定点数权重数据，再根据定点数权重数据和线性算子的定点数输入数据的线性运算结果，进行与非线性算子功能对应的非线性运算，确定浮点数运算结果并生成定点数运算结果，从而能够优化算子之间传递数据的处理过程，减少神经网络模型的量化误差，提高神经网络模型的运行性能和计算精度。计算精度。计算精度。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型的量化方法、电子设备及可读存储介质

[0001]本申请涉及人工智能领域，特别涉及一种神经网络模型的量化方法、电子设备及可读存储介质。

技术介绍

[0002]随着人工智能(artificial intelligence，AI)的迅速发展，神经网络模型在人工智能领域的应用越来越广泛，神经网络模型在图像识别、目标检测、增强学习、语义分析等许多领域取得了显著的成果。由于运行神经网络模型的运算单元，例如神经网络处理器(Neural
‑
Network Processing Unit，NPU)，通常为定点运算单元，为提高神经网络模型的运行速度，通常将神经网络模型的各算子进行量化，得到定点运算的神经网络模型，再由电子设备来运行。
[0003]神经网络模型中往往包括大量由线性算子和非线性算子组成的网络结构，在对神经网络模型采用全定点量化方案进行量化时，分别对线性算子和非线性算子进行量化，会在量化后的线性算子和非线性算子中引入多次量化误差，导致神经网络模型的运行性能的降低和计算精度的下降。

技术实现思路

[0004]本申请实施例提供了一种神经网络模型的量化方法、电子设备及可读存储介质。电子设备通过将量化神经网络模型中由线性算子和非线性算子组成的网络结构进行算子融合，优化算子之间数据的量化过程，减少神经网络模型的量化误差，提高神经网络模型的运行性能和计算精度。
[0005]第一方面，本申请实施例提供了一种神经网络模型的量化方法，用于电子设备，该方法包括：
[0006]确...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型的量化方法，用于电子设备，其特征在于，包括：确定量化的神经网络模型的预设结构，其中，所述预设结构包括线性算子和非线性算子，所述量化的神经网络模型中各算子独立量化；在所述非线性算子的类型为第一类型的情况下，将所述线性算子的至少一个输入数据的量化参数融合到所述非线性算子的第一浮点数权重数据中，确定第二浮点数权重数据；对所述第二浮点数权重数据进行量化，确定定点数权重数据；根据所述定点数权重数据和所述线性算子的至少一个定点数输入数据的线性运算结果，进行与所述非线性算子功能对应的非线性运算，确定浮点数运算结果；对所述浮点数运算结果进行量化，生成定点数运算结果。2.根据权利要求1所述的方法，其特征在于，所述线性算子包括用于连接至少一个输入数据的连接算子，所述非线性算子包括用于实现卷积运算的卷积算子，所述量化参数包括缩放系数。3.根据权利要求2所述的方法，其特征在于，根据所述定点数权重数据和所述线性算子的至少一个定点数输入数据的线性运算结果，进行与所述非线性算子功能对应的非线性运算，确定浮点数运算结果，包括：根据所述定点数权重数据、所述连接算子的至少一个定点数输入数据的连接结果和第一定点数偏置数据，进行与所述卷积算子功能对应的卷积运算，确定卷积运算的浮点数运算结果。4.根据权利要求3所述的方法，其特征在于，所述第一定点数偏置数据通过对所述卷积算子的浮点数偏置数据使用所述定点数权重数据对应的缩放系数进行量化得到。5.根据权利要求1所述的方法，其特征在于，该方法还包括：在所述非线性算子的类型为第二类型的情况下，将所述线性算子的至少一个输入数据的量化参数与所述非线性算子在每个通道上的量化参数进行融合，确定融合的量化参数，其中，所述非线性算子在每个通道上进行量化；根据所述非线性算子在每个...

【专利技术属性】
技术研发人员：章小龙，黄敦博，刘超，高毅，
申请(专利权)人：安谋科技中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人