频域中的子图和对GPU上的卷积实现的动态选择制造技术

技术编号：19240835 阅读：38 留言：0更新日期：2018-10-24 04:12

本发明专利技术涉及频域中的子图和对GPU上的卷积实现的动态选择。在示例中，一种装置包括多个执行单元；以及逻辑，所述逻辑至少部分地包括硬件逻辑，用以确定可以在频域中执行的网络的子图并且在频域中在所述子图中应用计算。还公开并要求保护其他实施例。

全部详细技术资料下载

【技术实现步骤摘要】
频域中的子图和对GPU上的卷积实现的动态选择
实施例一般地涉及数据处理，并且更具体地涉及经由通用图形处理单元的机器学习处理。
技术介绍
机器学习已经在解决许多种任务上获得成功。在训练和使用机器学习算法（例如，神经网络）时产生的计算自然地有助于高效的并行实现。因此，诸如通用图形处理单元（GPGPU）之类的并行处理器在深度神经网络的实际实现中发挥了重要作用。具有单指令多线程（SIMT）架构的并行图形处理器被设计成使图形流水线中的并行处理的量最大化。在SIMT架构中，并行线程的组尝试尽可能经常地一起同步执行程序指令以增加处理效率。并行机器学习算法实现所提供的效率允许对高容量网络的使用并且使得那些网络能够被关于较大数据集进行训练。附图说明使得可以详细地理解本专利技术的实施例的以上记载特征的方式，可以参考实施例对以上简要概括的实施例进行较具体的描述，所述实施例中的一些被图示在附图中。然而，要注意，附图仅图示典型实施例，并因此不要被认为限制其范围。图1是图示了被配置成实现本文中所描述的实施例的一个或多个方面的计算机系统的框图。图2A-2D图示了根据实施例的并行处理器部件。图3A-3B是根据实施例的图形多处理器的框图。图4A-4F图示了其中多个GPU通信地耦合至多个多核处理器的示例性架构。图5是根据实施例的图形处理流水线的概念图。图6A-6B和7A-7E图示了依照实施例的技术中的示例性架构和操作。图8图示了根据实施例的机器学习软件栈。图9图示了根据实施例的高度并行的通用图形处理单元。图10图示了根据实施例的多GPU计算系统。图11A-B图示了示例性深度神经网络的层。图1...

【技术保护点】
1.一种装置，包括：多个执行单元；以及逻辑，其至少部分地包括硬件逻辑，用以：确定能够在频域中执行的网络的子图；以及在频域中在所述子图中应用计算。

【技术特征摘要】
2017.04.08 US 15/4827241.一种装置，包括：多个执行单元；以及逻辑，其至少部分地包括硬件逻辑，用以：确定能够在频域中执行的网络的子图；以及在频域中在所述子图中应用计算。2.根据权利要求1所述的装置，进一步包括逻辑，至少部分地包括硬件逻辑，用以：至少部分地基于针对所述网络中的每个卷积运行短暂比较来动态地选择卷积实现。3.根据权利要求2所述的装置，其中：所述选择在运行时实现。4.一种电子设备，包括：处理器，其具有多个执行；以及逻辑，其至少部分地包括硬件逻辑，用以：确定能够在频域中执行的网络的子图；以及在频域中在所述子图中应用计算。5.根据权利要求4所述的电子设备，进一步...

【专利技术属性】
技术研发人员：E科亨，A布莱魏斯，U萨雷尔，M贝哈尔，J苏巴格，A阿蒙，G莱博维奇，G雅各布，L费维舍夫斯基，T巴尔安，Y沙的米伊，J德雷富斯，I本阿里，Y费斯，T施瓦茨，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人