神经网络模型的量化方法、设备及计算机存储介质技术

技术编号：26033853 阅读：22 留言：0更新日期：2020-10-23 21:11

本申请提供一种神经网络模型的量化方法、设备及计算机存储介质。包括：对神经网络模型输入训练图片，进行第一数据类型的计算，获得神经网络模型中每一计算层的第一输入数据；根据至少两种算法获得每一计算层的至少两个初始量化因子；基于至少两个初始量化因子获得每一计算层量化后的至少两个第二输入数据；比较每一计算层中第一输入数据和每个第二输入数据的相关性；将相关性最大的第二输入数据对应的初始量化因子作为计算层的最终量化因子；将最终量化因子输入神经网络模型。本申请通过至少两种算法计算每一计算层的量化因子，并在比较后确定每一计算层的最优量化因子，从而提高了整个神经网络模型的量化精度。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型的量化方法、设备及计算机存储介质
本申请涉及神经网络
，特别是涉及一种神经网络模型的量化方法、设备及计算机存储介质。
技术介绍
目前，常见的神经网络量化方法是采用同一种算法对所有的卷积层和全连接层的输入激活值进行量化，但由于输入激活值的灵活可变性，采用一种算法会导致神经网络中某一层的误差变大，又因为网络结构的前馈性和复杂性，进一步导致神经网络在推理过程中误差越来越大，最终使神经网络模型的量化精度较差。
技术实现思路
本申请提供了一种神经网络模型的量化方法、设备及计算机存储介质，主要解决的技术问题是如何提高神经网络模型量化精度的问题。为解决上述技术问题，本申请提供了一种神经网络模型的量化方法，所述方法包括：对所述神经网络模型输入训练图片，进行第一数据类型的计算，获得所述神经网络模型中每一计算层的第一输入数据；根据至少两种算法获得所述每一计算层的至少两个初始量化因子；基于所述至少两个初始量化因子获得所述每一计算层量化后的至少两个第二输入数据；比较所述每一计算层中第一输入数据和每个第二输入数据的相关性；将相关性最大的第二输入数据对应的初始量化因子作为所述计算层的最终量化因子；将所述最终量化因子输入所述神经网络模型。根据本申请提供的一实施方式，所述方法还包括：将所述计算层之后的数据归一层合并至所述计算层以进行计算。根据本申请提供的一实施方式，所述计算层包括卷积层和全连接层；所述方法还包括：将所述卷积层、全连接层的前一...

【技术保护点】
1.一种神经网络模型的量化方法，其特征在于，所述方法包括：/n对所述神经网络模型输入训练图片，进行第一数据类型的计算，获得所述神经网络模型中每一计算层的第一输入数据；/n根据至少两种算法获得所述每一计算层的至少两个初始量化因子；/n基于所述至少两个初始量化因子获得所述每一计算层量化后的至少两个第二输入数据；/n比较所述每一计算层中第一输入数据和每个第二输入数据的相关性；/n将相关性最大的第二输入数据对应的初始量化因子作为所述计算层的最终量化因子；/n将所述最终量化因子输入所述神经网络模型。/n

【技术特征摘要】
1.一种神经网络模型的量化方法，其特征在于，所述方法包括：
对所述神经网络模型输入训练图片，进行第一数据类型的计算，获得所述神经网络模型中每一计算层的第一输入数据；
根据至少两种算法获得所述每一计算层的至少两个初始量化因子；
基于所述至少两个初始量化因子获得所述每一计算层量化后的至少两个第二输入数据；
比较所述每一计算层中第一输入数据和每个第二输入数据的相关性；
将相关性最大的第二输入数据对应的初始量化因子作为所述计算层的最终量化因子；
将所述最终量化因子输入所述神经网络模型。

2.根据权利要求1所述的量化方法，其特征在于，所述方法还包括：
将所述计算层之后的数据归一层合并至所述计算层以进行计算。

3.根据权利要求1所述的量化方法，其特征在于，所述计算层包括卷积层和全连接层；所述方法还包括：
将所述卷积层、全连接层的前一层的输出数据类型设置为第二数据类型。

4.根据权利要求3所述的量化方法，其特征在于，所述方法还包括：
将非计算层的前一层的输出数据类型设置为第二数据类型。

5.根据权利要求3所述的量化方法，其特征在于，所述量化因子包括权重量化因子...

【专利技术属性】
技术研发人员：周旭亚，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人