用于神经网络的压缩和推断加速的非对称量化制造技术

技术编号：26731502 阅读：40 留言：0更新日期：2020-12-15 14:34

本公开涉及用于神经网络的压缩和推断加速的非对称量化。改进的非对称量化的实施例，通常可被称为改进非对称量化(IAQ)实施例。IAQ实施例结合常规的非对称量化和对称量化的优点，但也提供了额外的计算效率。IAQ的实施例采用神经网络层的权重的非对称范围，因此它们规避了对称量化的对称范围的限制。另外，通过量化每个层的偏移值，通过IAQ实施例量化的神经网络的推断过程比由常规的非对称量化而量化的神经网络的推断过程快得多。

全部详细技术资料下载

【技术实现步骤摘要】
用于神经网络的压缩和推断加速的非对称量化
本公开一般涉及用于计算机学习的系统和方法，可以提供改进的计算机性能、特征和用途。更特别地，本公开涉及神经网络的改进的压缩和改进的加速推断的实施例。
技术介绍
深度神经网络(DeepNeuralNetwork,DNN)在人工智能中实现了惊人成就。然而，DNN的模型大小通常非常大。权重量化是通过使用用于DNN的每个浮动权重的低位表示压缩DNN的重要方法。传统的对称量化假设权重的范围关于零对称。这种假设在实践中通常不成立。因此，非对称量化已经被广泛地用于规避对称量化的缺点。然而，常规的非对称量化导致经量化的DNN的推断过程中的延迟，部分是因为添加的计算以及因为计算的类型。因此，需要提供神经网络的改进的非对称量化、改进的加速或两者的系统和方法，改进的非对称量化提供压缩，这有助于降低存储器和处理要求，通过降低由于量化引起的计算负荷提高神经网络的加速。
技术实现思路
在第一方面中，提供一种用于神经网络的量化的计算机实现的方法，包括：从用于所述神经网络的层的权重值中识别极值权重值的集合，所述极值权重值的集合包括最大权重值和最小权重值；使用所述极值权重值的集合和将用于以量化形式表示所述权重值的位的数量来获得用于量化用于所述神经网络的层的所述权重值的缩放因子；使用所述极值权重值中的一个以及所述缩放因子以量化用于所述神经网络的层的所述权重值；使用所述缩放因子和来自被用于量化所述层的所述权重值的所述极值权重值的集合的极值来获得用于所述层的...

【技术保护点】
1.一种用于神经网络的量化的计算机实现的方法，包括：/n从用于所述神经网络的层的权重值中识别极值权重值的集合，所述极值权重值的集合包括最大权重值和最小权重值；/n使用所述极值权重值的集合和将用于以量化形式表示所述权重值的位的数量来获得用于量化用于所述神经网络的层的所述权重值的缩放因子；/n使用所述极值权重值中的一个以及所述缩放因子以量化用于所述神经网络的层的所述权重值；/n使用所述缩放因子和来自被用于量化所述层的所述权重值的所述极值权重值的集合的极值来获得用于所述层的偏移值，所述偏移值是整数值；以及/n对于所述层，存储所述缩放因子、所述偏移值及经量化的权重以在推断期间使用，其中获得用于所述层的输出包括仅使用整数运算，以通过所述偏移值调整所述经量化的权重，以及将经调整的经量化的权重值与用于所述层的输入值相乘。/n

【技术特征摘要】
20190701 US 62/869,560;20200519 US 16/877,5821.一种用于神经网络的量化的计算机实现的方法，包括：
从用于所述神经网络的层的权重值中识别极值权重值的集合，所述极值权重值的集合包括最大权重值和最小权重值；
使用所述极值权重值的集合和将用于以量化形式表示所述权重值的位的数量来获得用于量化用于所述神经网络的层的所述权重值的缩放因子；
使用所述极值权重值中的一个以及所述缩放因子以量化用于所述神经网络的层的所述权重值；
使用所述缩放因子和来自被用于量化所述层的所述权重值的所述极值权重值的集合的极值来获得用于所述层的偏移值，所述偏移值是整数值；以及
对于所述层，存储所述缩放因子、所述偏移值及经量化的权重以在推断期间使用，其中获得用于所述层的输出包括仅使用整数运算，以通过所述偏移值调整所述经量化的权重，以及将经调整的经量化的权重值与用于所述层的输入值相乘。

2.如权利要求1所述的计算机实现的方法，还包括：
使用用于所述层的所述缩放因子、用于所述层的所述偏移值、用于所述层的所述经量化的权重和输入值计算用于所述神经网络的层的输出，其中使用整数运算以通过所述偏移值调整所述经量化的权重，以及将所述经调整的经量化的权重值与所述输入值相乘。

3.如权利要求1所述的计算机实现的方法，其中所述极值权重值是所述最大权重值，以及通过使用整数运算从所述偏移值减去所述经量化的值获得经调整的经量化的权重值。

4.如权利要求1所述的计算机实现的方法，其中所述极值权重值是所述最小权重值，以及通过使用...

【专利技术属性】
技术研发人员：杨颖振，赵志彪，赵宝新，浣军，欧阳剑，王勇，施佳鑫，
申请(专利权)人：百度美国有限责任公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人