【技术实现步骤摘要】
【国外来华专利技术】网络量化方法、推理方法以及网络量化装置
本公开涉及网络量化方法、推理方法以及网络量化装置。
技术介绍
以往利用神经网络等网络进行机器学习。在此,将数值数据作为输入,执行一些运算来得到数值数据的输出值的模型,将这种模型称为网络。在将网络安装到计算机等硬件时,为了抑制硬件成本,则希望在保持安装后的推理精度与浮点精度为同等程度的基础上,来构建运算精度更低的网络。例如,在安装以浮点(floatingpoint)精度来进行所有的计算的网络的情况下,由于硬件成本增大,因此要求实现在保持推理精度的状态下,以定点(fixedpoint)精度来进行计算的网络。以下将浮点(floatingpoint)精度的网络也称为量化前网络,将定点(fixedpoint)精度的网络也称为量化网络。在此,将如下的处理称为量化,即,将能够连续地表现几乎任意的值的浮点的值,划分为规定的分区来进行编码的处理。更一般而言,量化被定义为缩小网络中所使用的数值的位数或范围的处理。在以由量化而限定的比特数来表现实数时,会有输入数据的分布与设想的分布不同的情况。在这种情况下所出现的问题是,量化误差增大,从而给机器学习的速度带来不良的影响,而且还会给学习后的推理的精度带来不良的影响。作为解决这种问题的方法,例如有已知的专利文献1所记载的方法。在专利文献1记载的方法中,针对卷积神经网络的各层内的权重以及数据的每一个分别定义定点格式。以浮点数来开始卷积神经网络的机器学习,为了估计输入数据的分布而进行解析。接着,根据输入数据的分布,来决 ...
【技术保护点】
1.一种网络量化方法,对神经网络进行量化,/n所述网络量化方法包括:/n准备步骤,准备所述神经网络;/n数据库构建步骤,对通过将多个测试数据集输入到所述神经网络的情况下而得到的所述神经网络所使用的张量的统计信息数据库进行构建;/n参数生成步骤,根据所述统计信息数据库和所述神经网络,对所述张量的值进行量化,从而生成量化参数集;以及/n网络构建步骤,使用所述量化参数集,对所述神经网络进行量化,从而构建量化网络,/n在所述参数生成步骤,根据所述统计信息数据库,将高频度区域中的量化步长间隔,设定为比低频度区域中的量化步长间隔窄,所述高频度区域是包括所述张量的值之中的频度成为极大的值的区域,所述低频度区域是包括频度比所述高频度区域低、且频度不为零的所述张量的值的区域。/n
【技术特征摘要】
【国外来华专利技术】1.一种网络量化方法,对神经网络进行量化,
所述网络量化方法包括:
准备步骤,准备所述神经网络;
数据库构建步骤,对通过将多个测试数据集输入到所述神经网络的情况下而得到的所述神经网络所使用的张量的统计信息数据库进行构建;
参数生成步骤,根据所述统计信息数据库和所述神经网络,对所述张量的值进行量化,从而生成量化参数集;以及
网络构建步骤,使用所述量化参数集,对所述神经网络进行量化,从而构建量化网络,
在所述参数生成步骤,根据所述统计信息数据库,将高频度区域中的量化步长间隔,设定为比低频度区域中的量化步长间隔窄,所述高频度区域是包括所述张量的值之中的频度成为极大的值的区域,所述低频度区域是包括频度比所述高频度区域低、且频度不为零的所述张量的值的区域。
2.一种网络量化方法,对神经网络进行量化,
所述网络量化方法包括:
准备步骤,准备所述神经网络;
数据库构建步骤,对通过将多个测试数据集输入到所述神经网络的情况下而得到的所述神经网络所使用的张量的统计信息数据库进行构建;
参数生成步骤,根据所述统计信息数据库和所述神经网络,对所述张量的值进行量化,从而生成量化参数集;以及
网络构建步骤,使用所述量化参数集,对所述神经网络进行量化,从而构建量化网络,
在所述参数生成步骤,根据所述统计信息数据库,决定所述张量的值之中的频度不为零的量化区域、以及频度不为零且不与所述量化区域重叠的非量化区域,所述量化区域中的所述张量的值被量化,所述非量化区域中的所述张量的值不被量化。
3.一种网络量化方法,对神经网络进行量化,
所述网络量化方法包括:
准备步骤,准备所述神经网络;
数据库构建步骤,对通过将多个测试数据集输入到所述神经网络的情况下而得到的所述神经网络所使用的张量的统计信息数据库进行构建;
参数生成步骤,根据所述统计信息数据库和所述神经网络,对所述张量的值进行量化,从而生成量化参数集;以及
网络构建步骤,使用所述量化参数集,对所述神经网络进行量化,从而构建量化网络,
在所述参数生成步骤,根据所述统计信息数据库,将所述张量的值量化为-1、0、+1这三值。
4.一种网络量化方法,对神经网络进行量化,
所述网络量化方法包括:
准备步骤,准备所述神经网络;
数据库构建步骤,对通过将多个测试数据集输入到所述神经网络的情况下而得到的所述神经网络所使用的张量的统计信息数据库进行构建;
参数生成步骤,根据所述统计信息数据库和所述神经网络,对所述张量的值进行量化,从而生成量化参数集;以及
网络构建步骤,使用所述量化参数集,对所述神经网络进行量化,从而构建量化网络,
在所述参数生成步骤,根据所述统计信息数据库,将所述张量的值量化为-1以及+1这二值。
5.如权利要求3或4所述的网络量化方法,
在所述参数生成步骤,根据所述统计信息数据库,作为量化参数而决定正阈值以及负阈值,所述正阈值是被量化为+1的最小的数值,所述负阈值是被量化为-1的最大的数值。
6.如权利要求5所述的网络量化方法,
在所述参数生成步骤,根据所述统计信息数据库,作为量化参数而决定正标度以及负标度,该正标度以及负标度是分别与+1以及-1对应的系数。
7.如权利要求2所述的网络量化方法,
所述量化区域包括所述张量的值之中的频度成为极大的值,所述非量化区域包括所述张量的值之中的频度比所述量化区域低的值。
8.如权利要求2所述的网络量化方法,
在所述参数生成步骤,按照对所述张量的值的分布与被量化的所述张量的值的分布的不同进行测定的尺度,来决定所述量化区域以及所述非量化区域。
9.如权利要求1所述的网络量化方法,
所述高频度区域包括第一区域以及第二区域,所述第一区域以及所述第二区域分别包括所述张量的值之中的频度成为极大的值,
所述低频度区域包括第三区域,该第三区域包括所述张量的值之中的位于所述第一区域与所述第二区域之间的值。
10.如权利要求1或...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。