具有堆栈存储器的硬件加速器上的深度神经网络处理制造技术

技术编号：17310192 阅读：157 留言：0更新日期：2018-02-19 10:04

提供一种用于在加速组件上处理深度神经网络的方法。该方法包括配置加速组件以执行深度神经网络的前向传播和后向传播阶段。加速组件包括布置在集成电路封装中的加速组件裸片和存储器堆栈。存储器堆栈具有大于约50GB/秒的存储器带宽和大于约20MB/秒/mW的功率效率。

Deep neural network processing on hardware accelerators with stack memory

A method for processing a deep neural network on an accelerated component is provided. The method consists of configuring an acceleration component to perform the forward and backward propagation stages of a deep neural network. The acceleration components include the bare pieces and the memory stack arranged in the integrated circuit package. The memory stack has a memory bandwidth greater than about 50GB/ seconds and power efficiency greater than about 20MB/ seconds /mW.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】具有堆栈存储器的硬件加速器上的深度神经网络处理
技术介绍
计算行业试图改善软件驱动的计算设备的速度和效率。软件驱动的计算设备采用以传统时间方式对机器可读指令进行处理的一个或多个中央处理单元(CPU)。硬件加速组件(诸如现场可编程门阵列(FPGA))已被用来对由软件驱动的计算设备执行的处理进行补充。
技术实现思路
根据第一方面，提供了一种用于在加速组件上处理深度神经网络的方法。该方法包括配置加速组件以执行深度神经网络的前向传播和后向传播阶段。加速组件包括被布置在集成电路封装中的加速组件裸片和存储器堆栈。存储器堆栈具有大于约50GB/秒的存储器带宽和大于约20MB/秒/mW的功率效率。根据第二方面，提供了一种用于处理深度神经网络的系统。该系统包括加速组件，该加速组件包括布置在集成电路封装中的加速组件裸片和存储器堆栈。存储器堆栈包括大于约50GB/秒的存储器带宽和大于约20MB/秒/mW的功率效率。该系统还包括被配置在加速组件裸片上的多个神经引擎。神经引擎包括用于实现深度神经网络的前向传播和后向传播阶段的逻辑。根据第三方面，提供了一种用于处理深度神经网络的系统。该系统包括加速组件，该加速组件包括被布置在集成电路封装中的加速组件裸片和存储器堆栈。存储器堆栈包括大于约50GB/秒的存储器带宽和大于约20MB/秒/mW的功率效率。该系统还包括被配置在加速组件裸片上的多个神经引擎以及在存储器堆栈上的多个DRAM通道，DRAM通道中的每个DRAM通道被耦合到神经引擎。神经引擎包括用于实现深度神经网络的前向传播和后向传播阶段的逻辑。上面概括的功能性可以表现在各种类型的系统、设备、组件...
具有堆栈存储器的硬件加速器上的深度神经网络处理

【技术保护点】
一种用于在加速组件上处理深度神经网络的方法，所述加速组件包括被布置在集成电路封装中的加速组件裸片和存储器堆栈，所述存储器堆栈包括大于约50GB/秒的存储器带宽和大于约20MB/秒/mW的功率效率，所述方法包括：配置所述加速组件以执行所述深度神经网络的前向传播和后向传播阶段。

【技术特征摘要】
【国外来华专利技术】2015.06.29 US 14/754,3441.一种用于在加速组件上处理深度神经网络的方法，所述加速组件包括被布置在集成电路封装中的加速组件裸片和存储器堆栈，所述存储器堆栈包括大于约50GB/秒的存储器带宽和大于约20MB/秒/mW的功率效率，所述方法包括：配置所述加速组件以执行所述深度神经网络的前向传播和后向传播阶段。2.根据权利要求1所述的方法，其中所述加速组件包括现场可编程门阵列设备、大规模并行处理器阵列设备、图形处理单元以及专用集成电路中的一个或多个。3.根据权利要求1所述的方法，其中所述加速组件进一步包括中介器，并且所述加速组件裸片和所述存储器堆栈被布置在所述中介器上。4.根据权利要求1所述的方法，其中配置所述加速组件包括利用包括用于实现所述前向传播和所述后向传播阶段的逻辑的多个神经引擎来配置所述加速组件裸片。5.根据权利要求4所述的方法，其中所述神经引擎中的每一个神经引擎包括用于计算点积、导数、误差和非线性函数中的一个或多个的逻辑。6.根据权利要求4所述的方法，其中：DNN包括多个权重、输入激活和误差；所述神经引擎的每一个神经引擎包括储存元件；和配置所述加速组件包括：将所述权重、输入激活和误差存储在所述存储器堆栈中；和将所述权重、输入激活和误差流...

【专利技术属性】
技术研发人员：D·C·伯格，D·邱，E·钟，A·R·帕特纳姆，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人