混合精度神经网络制造技术

技术编号：31080350 阅读：20 留言：0更新日期：2021-12-01 11:53

本公开的实施例涉及混合精度神经网络。用于机器学习(ML)模型的混合精度量化技术。对于ML模型(114)，接收目标带宽增加(302)，ML模型(114)包括由第一位数目表示的第一数据类型的对象。目标带宽增加涉及将对象的第一部分改变为由不同于第一位数目的第二位数目表示的第二数据类型(310)。方法进一步包括基于带宽对ML模型中的对象进行排序(304)。方法进一步包括：基于目标带宽增加和多个对象的排序来标识对象的第一部分，以从第一数据类型改变为第二数据类型(508)。方法进一步包括将对象的第一部分从第一数据类型改变为第二数据类型(508)。(508)。(508)。

全部详细技术资料下载

【技术实现步骤摘要】
混合精度神经网络

[0001]本公开涉及机器学习，并且更具体地涉及使用以不止一个精度表示的值的神经网络。

技术介绍

[0002]神经网络和其他机器学习(ML)模型可以包括表示数值的变量。这些数值通常被表示为浮点数据类型。例如，浮点值通常用于表示：(1)网络中某个层(诸如卷积或内积)的权重或学习值，以及(2)特征图，也被称为激活或二进制大对象(BLOB)。这些权重和BLOB可以用于例如神经网络中给定层的输出以及后续层的输入。
[0003]然而，以浮点值执行神经网络在计算上可能是昂贵的(例如，执行可能较慢，并且功率密集)。许多神经网络包括大量的浮点值，并且浮点算术通常较慢并且消耗功率。另外，浮点数据类型通常为32位或更大，因此加载和存储这种值需要存储空间并且需要时间。因此，使用浮点值可能会抑制神经网络在可用计算资源较少或功率受限的设备(包括诸如智能手机和平板电脑的边缘设备)上的执行。

技术实现思路

[0004]实施例包括一种方法。该方法包括：接收针对机器学习(ML)模型的目标带宽增加，ML模型包括由第一位数目表示的第一数据类型的多个对象。目标带宽增加涉及将多个对象的第一部分改变为由不同于第一位数目的第二位数目表示的第二数据类型。方法还包括基于带宽对ML模型中的多个对象进行排序。方法还包括：基于目标带宽增加和多个对象的排序，标识多个对象的第一部分以从第一数据类型改变为第二数据类型。方法还包括将多个对象的第一部分从第一数据类型改变为第二数据类型。
[0005]实施例还包括一种系统，系统包括处理...

【技术保护点】

【技术特征摘要】
1.一种方法，包括：接收针对机器学习ML模型的目标带宽增加，所述ML模型包括由第一位数目表示的第一数据类型的多个对象，其中所述目标带宽增加涉及将所述多个对象的第一部分改变为由不同于所述第一位数目的第二位数目表示的第二数据类型；基于带宽，对所述ML模型中的所述多个对象进行排序；基于所述目标带宽增加和所述多个对象的所述排序，标识所述多个对象的所述第一部分，以从所述第一数据类型改变为所述第二数据类型；以及由处理器将所述多个对象的所述第一部分从所述第一数据类型改变为所述第二数据类型。2.根据权利要求1所述的方法，其中所述ML模型包括神经网络，并且其中所述多个对象包括多个权重和多个二进制大对象BLOB。3.根据权利要求1所述的方法，其中所述第一数据类型包括由所述第一位数目表示的第一整数数据类型，其中所述第二数据类型包括由所述第二位数目表示的第二整数数据类型，并且其中所述第二位数目大于所述第一位数目。4.根据权利要求1所述的方法，其中所述目标带宽增加还涉及将所述多个对象中的至少一些对象改变为由大于所述第二位数目的第三位数目表示的第三数据类型，所述方法还包括：基于所述目标带宽增加和对所述多个对象的所述排序，标识所述多个对象的第二部分，以从所述第一数据类型改变为所述第三数据类型；以及将所述多个对象的所述第二部分从所述第一数据类型改变为所述第三数据类型。5.根据权利要求4所述的方法，其中所述第一数据类型包括浮点数据类型，其中所述第二数据类型包括第一整数数据类型，并且其中所述第三数据类型包括第二整数数据类型。6.根据权利要求1所述的方法，其中对所述基于带宽对所述ML模型中的所述多个对象进行排序包括：基于大小对所述多个对象进行排序。7.根据权利要求6所述的方法，其中所述ML模型包括神经网络，并且其中对所述ML模型中的所述多个对象进行排序还基于相应对象与表示所述神经网络的网络图的根的接近度。8.一种系统，包括：处理器；以及存储器，存储指令，所述指令在由所述处理器执行时，使所述处理器执行操作，所述操作包括：接收针对神经网络的目标带宽增加，所述神经网络包括由第一位数目表示的第一数据类型的多个二进制大对象BLOB和权重，其中所述目标带宽增加涉及将所述多个BLOB和权重中的至少一些改变为由不同于所述第一位数目的第二位数目表示的第二数据类型；基于所述目标带宽增加，标识所述多个BLOB和权重的第一部分，以从所述第一数据类型改变为所述第二数据类型；以及将所述多个BLOB和权重的所述第一部分从所述第一数据类型改变为所述第二数据类型。9.根据权利要求8所述的系统，其中所述操作还包括：基于带宽对所述神经网络中的所述多个BLOB和权重进行排序，其中标识所述多个BLOB
和权重中的所述第一部分以从所述第一数据类型改变为所述第二数据类型还基于所述多个BLOB和权重的所述排序。10.根据权利要求8所述的系统，其中所述第一数据类型包括由所述第一位数目表示的第一整数数据类型，并且其中所述第二数据类型包括由所述第二位数目表示的第二整数数据类型。11.根据权利要求8所述的系统，其中所述目标带宽增加还涉及将所述多个BLOB和权重中的至少一些改变为由小于所述第二位数目的第三位数目表示的第三数据类型，所述操作还包括...

【专利技术属性】
技术研发人员：T，
申请(专利权)人：美商新思科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人