The invention discloses a system and a method for computing the depth of the neural network, including: CPU, for receiving the target data, processed by the depth of the neural network, the input layer data from the depth of the neural network; FPGA, for computing nodes and perform parallel computing program using the depth calculation process of neural networks in the GEMM, calculate the input data. The calculated results. The node transplanting depth GEMM neural network calculation to the FPGA, the target data received by the CPU user input, the depth of the neural network based on the target data into the depth of the neural network input layer data, and send to FPGA FPGA, using the depth of neural networks in the GEMM computing nodes and parallel computing program execution link calculation. The calculation of the input layer data, calculated results, complete the operation, the hardware based on the characteristics of FPGA, completed by FPGA calculation process, which greatly reduces the computation of energy consumption, reduce operating costs.
【技术实现步骤摘要】
一种深度神经网络运算系统及方法
本专利技术涉及深度神经网络加速计算领域,特别涉及一种深度神经网络运算系统及方法。
技术介绍
GPU通用计算技术发展已经引起业界不少的关注,事实也证明在浮点运算、并行计算等部分计算方面,GPU可以提供数十倍乃至于上百倍于CPU的性能。GPU通用计算方面的标准目前有OpenCL(OpenComputingLanguage,开放运算语言)、CUDA(ComputeUnifiedDeviceArchitecture)、ATISTREAM。其中,OpenCL是第一个面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的编程环境,便于软件开发人员为高性能计算服务器、桌面计算系统、手持设备编写高效轻便的代码,而且广泛适用于多核心处理器(CPU)、图形处理器(GPU)、Cell类型架构以及数字信号处理器(DSP)等其他并行处理器,在游戏、娱乐、科研、医疗等各种领域都有广阔的发展前景。目前对深度神经网络的加速方法通常采用GPU加速方法,其高度优化的计算库cudnn及高性能的GPU并行处理架构,使得深度神经网络在GPU平台上的加速性能十分优越,但其高耗电量造成能耗比很低,也是极大的弊端。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种深度神经网络运算系统及方法,以降低耗电量,提高能耗比,降低运行成本。其具体方案如下:一种深度神经网络运算系统,包括:CPU,用于接收目标数据,利用深度神经网络进行处理,得到深度神经网络的输入层数据;FPGA,用于利用深度神经网络中的GEMM计算节点和并行运算程序执行推算环节,计算所述输入层数据,得到计算结 ...
【技术保护点】
一种深度神经网络运算系统,其特征在于,包括:CPU,用于接收目标数据,利用深度神经网络进行处理,得到深度神经网络的输入层数据;FPGA,用于利用深度神经网络中的GEMM计算节点和并行运算程序执行推算环节,计算所述输入层数据,得到计算结果。
【技术特征摘要】
1.一种深度神经网络运算系统,其特征在于,包括:CPU,用于接收目标数据,利用深度神经网络进行处理,得到深度神经网络的输入层数据;FPGA,用于利用深度神经网络中的GEMM计算节点和并行运算程序执行推算环节,计算所述输入层数据,得到计算结果。2.根据权利要求1所述的深度神经网络运算系统,其特征在于,所述FPGA,包括:GEMM计算单元,用于利用激活函数所述输入层数据,得到所述计算结果;其中,所述激活函数为:式中,Sj表示中间输出结果,m表示神经元个数,wij表示第一隐含层节点i和第二隐含层节点j之间的权值,bj表示第二隐含层节点j的阀值,xj表示第二隐含层节点j的输出值。3.根据权利要求1所述的深度神经网络运算系统,其特征在于,所述FPGA,包括:并行运算单元,用于通过#pragaunrollx展开计算所述推算环节,其中,x表示利用PCIe带宽数确定的展开层数。4.一种深度神经网络运算方法,其特征在于,包括:接收目标数据,利用深度神...
【专利技术属性】
技术研发人员:李磊,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。