用于学习低精度神经网络的方法及装置制造方法及图纸

技术编号：21116720 阅读：22 留言：0更新日期：2019-05-16 09:17

本发明专利技术提供一种用于学习低精度神经网络的方法及装置。所述方法包括：选择神经网络模型，其中所述神经网络模型包括多个层，且所述多个层中的每一者包括权重及激活；通过将多个量化层插入到所述神经网络模型内来修改所述神经网络模型；将成本函数与经修改的所述神经网络模型进行关联，其中所述成本函数包括与第一正则化项对应的第一系数，且所述第一系数的初始值是预定义的；以及训练经修改的所述神经网络模型，以通过增大所述第一系数来产生层的量化权重，直到所有权重均被量化且所述第一系数满足预定义的阈值为止，还包括优化所述量化权重的权重缩放因数及优化量化激活的激活缩放因数，其中所述量化权重是使用经优化的所述权重缩放因数进行量化。

全部详细技术资料下载

【技术实现步骤摘要】
用于学习低精度神经网络的方法及装置[相关申请的交叉参考]本申请主张在2017年11月7日以及2017年11月8日在美国专利与商标局提出申请且被授予序列号62/582,848及62/583,390的美国临时专利申请的优先权、以及在2018年3月7日在美国专利与商标局提出申请且被授予序列号15/914,229的美国非临时专利申请的优先权，所述申请中的每一者的全部内容并入本申请供参考。
本公开大体来说涉及神经网络，且更具体来说，涉及将权重量化与激活量化进行组合的用于学习低精度神经网络的方法及装置。
技术介绍
深度神经网络近来在许多计算机视觉任务(例如，图像分类、对象检测、语义分割(semanticsegmentation)及超分辨率(superresolution))中实现了主要的性能突破。最先进的神经网络的性能得益于非常深的及过度参数化的多层架构。目前，通常在多于一百个层中存在数百万或数千万个参数。然而，在大量层中增加网络参数的数目需要使用高性能矢量计算处理器，例如配备有大量存储器的图形处理单元(graphicsprocessingunit，GPU)。此外，当对高分辨率图像及尺寸增大的视频进行处理时，对计算能力及存储器资源的需求迅速增长。近来，深度神经网络的低精度实施方式受到极大的关注，特别是对于资源受限器件(例如，由电池供电的移动器件或便携式器件)上的深度神经网络的部署而言。在这种平台中，存储器及能力是有限的。此外，可能不支持基本浮点算术运算(floating-pointarithmeticoperation)。低精度权重(例如，参数)及激活(例如，特征图)...

【技术保护点】
1.一种用于学习低精度神经网络的方法，包括：选择神经网络模型，其中所述神经网络模型包括多个层，且其中所述多个层中的每一者包括权重及激活；通过将多个量化层插入到所述神经网络模型内来修改所述神经网络模型；将成本函数与经修改的所述神经网络模型进行关联，其中所述成本函数包括与第一正则化项对应的第一系数，且其中所述第一系数的初始值是预定义的；以及训练经修改的所述神经网络模型，以通过增大所述第一系数来产生层的量化权重，直到所有权重均被量化且所述第一系数满足预定义的阈值为止，还包括优化所述量化权重的权重缩放因数以及优化量化激活的激活缩放因数，且其中所述量化权重是使用经优化的所述权重缩放因数进行量化。

【技术特征摘要】
2017.11.07 US 62/582,848;2017.11.08 US 62/583,390;1.一种用于学习低精度神经网络的方法，包括：选择神经网络模型，其中所述神经网络模型包括多个层，且其中所述多个层中的每一者包括权重及激活；通过将多个量化层插入到所述神经网络模型内来修改所述神经网络模型；将成本函数与经修改的所述神经网络模型进行关联，其中所述成本函数包括与第一正则化项对应的第一系数，且其中所述第一系数的初始值是预定义的；以及训练经修改的所述神经网络模型，以通过增大所述第一系数来产生层的量化权重，直到所有权重均被量化且所述第一系数满足预定义的阈值为止，还包括优化所述量化权重的权重缩放因数以及优化量化激活的激活缩放因数，且其中所述量化权重是使用经优化的所述权重缩放因数进行量化。2.根据权利要求1所述的方法，其中优化所述权重缩放因数及所述激活缩放因数是基于将均方量化误差最小化。3.根据权利要求1所述的方法，还包括：将所述多个量化层中的每一量化层插入到所述神经网络模型内每一个层中的每一激活输出之后。4.根据权利要求1所述的方法，其中所述成本函数包括与第二正则化项对应的第二系数，所述第二正则化项是基于所述权重缩放因数及所述激活缩放因数为2的幂数字。5.根据权利要求1所述的方法，还包括将所述量化权重、所述权重缩放因数及所述激活缩放因数应用于固定点神经网络，其中所述固定点神经网络包括多个卷积层，其中所述多个卷积层中的每一者包括：卷积运算，被配置成接收特征图及所述量化权重，偏置加法运算，被配置成接收所述卷积运算的输出、及偏置，第一乘法运算，被配置成接收所述偏置加法运算的输出、及第一比例因数，激活运算，被配置成接收所述第一乘法运算的输出，第二乘法运算，被配置成接收所述激活运算的输出、及第二比例因数，以及量化运算，被配置成接收所述第二乘法运算的输出。6.根据权利要求5所述的方法，其中所述权重是固定点权重。7.根据权利要求5所述的方法，其中所述第一比例因数是所述权重缩放因数与所述激活缩放因数的乘积。8.根据权利要求5所述的方法，其中所述激活运算是非线性激活函数。9.根据权利要求1所述的方法，其中训练所述神经网络包括：通过随机梯度下降方法来更新所述权重；通过所述随机梯度下降方法来更新所述权重缩放因数；通过所述随机梯度下降方法来更新所述激活缩放因数；如果所述权重缩放因数及所述激活缩放因数是2的幂，则包括所述随机梯度下降方法的附加梯度；通过所述随机梯度下降方法来更新所述第一系数；以及如果所述第一系数大于预定常数或者所述用于学习低精度神经网络的方法的迭代次数大于预定限值，则结束训练。10.根据权利要求1所述的方法，还包括将所述量化权重、所述权重缩放因数及所述激活缩放因数应用于固定点神经网络，其中所述固定点神经网络包括多个卷积层，其中所述多个卷积层中的每一者包括：卷积运算，被配置成接收特征图及所述量化权重，偏置加法运算，被配...

【专利技术属性】
技术研发人员：崔裕镇，李正元，莫斯塔法·伊尔哈米，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国,KR

全部详细技术资料下载我是这个专利的主人