网络中的多个层的可变精度和混合类型表示制造技术

技术编号：19426705 阅读：25 留言：0更新日期：2018-11-14 10:52

在一个示例中，一种装置包括多个执行单元，该多个执行单元包括至少第一类型的执行单元和第二类型的执行单元以及至少部分地包括硬件逻辑的逻辑，该逻辑用于：显露出在加载指令或存储指令中的至少一个中的嵌入的投射操作；确定该投射操作的目标精度水平；并以该目标精度水平加载投射操作。还公开并要求保护其他实施例。

全部详细技术资料下载

【技术实现步骤摘要】
网络中的多个层的可变精度和混合类型表示
实施例总体上涉及数据处理，且更具体地,涉及经由通用图形处理单元的机器学习处理。
技术介绍
机器学习已经在解决许多类型的任务方面取得成功。当训练和使用机器学习算法(例如，神经网络)时产生的计算自然地适合于高效的并行实现。因此，诸如通用图形处理单元(GPGPU)之类的并行处理器在深度神经网络的实际实现中扮演着重要角色。具有单指令多线程(SIMT)架构的并行图形处理器被设计成使图形流水线中的并行处理量最大化。在SIMT架构中，并行线程组试图尽可能经常地一起同步执行程序指令以提高处理效率。由并行机器学习算法实现所提供的效率允许使用高容量网络并且使这些网络能在较大的数据集上进行训练。附图说明为了以能够详细理解本实施例的以上记载特征的方式，可以通过参考实施例来对以上简要概括的实施例进行更具体的描述，这些实施例中的一些在所附附图中被示出。然而，应当注意，所附附图仅示出典型实施例，并因此不应被认为是对其范围的限制。图1是示出了被配置成实现本文所述的实施例的一个或多个方面的计算机系统的框图；图2A至图2D示出了根据实施例的并行处理器部件；图3A至图3B是根据实施例的图形多处理器的框图；图4A至图4F示出了其中多个GPU通信地耦合至多个多核处理器的示例性架构；图5是根据实施例的图形处理流水线的概念图。图6A-6B和图7示出了根据实施例的技术中的示例性架构和操作。图8示出了根据实施例的机器学习软件栈；图9示出了根据实施例的高度并行的通用图形处理单元；图10示出了根据实施例的多GPU计算系统；图11A至图11B示出了示例性深度神经网络的层；...

【技术保护点】
1.一种装置，包括：多个执行单元；以及至少部分地包括硬件逻辑的逻辑，所述逻辑用于：显露出在加载指令或存储指令中的至少一个中的嵌入的投射操作；确定所述投射操作的目标精度水平；以及以所述目标精度水平加载所述投射操作。

【技术特征摘要】
2017.04.28 US 15/499,8961.一种装置，包括：多个执行单元；以及至少部分地包括硬件逻辑的逻辑，所述逻辑用于：显露出在加载指令或存储指令中的至少一个中的嵌入的投射操作；确定所述投射操作的目标精度水平；以及以所述目标精度水平加载所述投射操作。2.如权利要求1所述的装置，其特征在于：所述目标精度水平表示最佳精度水平。3.如权利要求1所述的装置，其特征在于：所述目标精度水平被确定成匹配硬件能力。4.如权利要求1所述的装置，其特征在于：不同数据类型被用于表示多层深度学习神经网络(DNN)的不同层中的各个权重。5.如权利要求4所述的装置，其特征在于：高精度浮点数据用于神经网络的一个或多个较低层。6.如权利要求5所述的装置，其特征在于：较低精度浮点数据和整数被用于所述神经网络的...

【专利技术属性】
技术研发人员：U·萨雷尔，E·科恩，T·施瓦茨，A·阿蒙，Y·沙德米，A·布莱韦斯，G·列伊博维奇，J·德赖弗斯，L·法伊维谢夫斯基，T·巴昂，Y·法伊斯，J·苏巴格，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人