一种硬件加速器及数据处理方法、系统、设备、介质技术方案

技术编号：33499693 阅读：17 留言：0更新日期：2022-05-19 01:10

本申请公开了一种硬件加速器及数据处理方法、系统、设备、介质，方法包括获取神经网络运算指令；将神经网络运算指令拆分为卷积指令和其他指令；获取与神经网络运算指令对应的feature数据和filter数据，并对feature数据和filter数据进行分块，得到块数据；基于卷积指令和其他指令并行对块数据进行运算，得到目标运算结果。本申请中，硬件加速器在获取神经网络运算指令之后，会将神经网络运算指令拆分为卷积指令和其他指令，并对神经网络运算指令对应feature数据和filter数据进行分块，得到块数据，最后基于卷积指令和其他指令并行对块数据进行运算，可以快速得到目标运算结果，效率高。高。高。

全部详细技术资料下载

【技术实现步骤摘要】
一种硬件加速器及数据处理方法、系统、设备、介质

[0001]本申请涉及神经网络
，更具体地说，涉及一种硬件加速器及数据处理方法、系统、设备、介质。

技术介绍

[0002]当前随着人工智能在各个领域的发展，如农业、金融、安防、健康医疗、制造等，人们迫切的希望算法能够计算速度更快、精度更高，同时功耗更低。作为人工智能算法领域最重要的代表之一CNN（卷积神经网络），在图像分析和处理领域取得了众多突破性的进展，己经广泛应用于各类图像相关的应用中。
[0003]然而 CNN的特有计算模式，通用处理器对于CNN实现效率并不高，不能满足性能要求。因此，近来已经提出了基于FPGA（Field
‑
Programmable Gate Array，现场可编程门阵列），GPU（graphics processing unit，图形处理器）甚至ASIC（Application Specific Integrated Circuit，专用集成电路）设计的各种硬件加速器来提高CNN设计的性能。如果硬件加速器结构没有精心设计，其计算吞吐量与提供FPGA平台的内存带宽不匹配。这意味着由于逻辑资源或存储器带宽的利用不足将造成性能的降级。
[0004]综上所述，如何提高硬件加速器对神经网络的运算效率是目前本领域技术人员亟待解决的问题。

技术实现思路

[0005]本申请的目的是提供一种数据处理方法，其能在一定程度上解决如何提高硬件加速器对神经网络的运算效率的技术问题。本申请还提供了一种硬件加速器及数据...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法，其特征在于，应用于硬件加速器，包括：获取神经网络运算指令；将所述神经网络运算指令拆分为卷积指令和其他指令；获取与所述神经网络运算指令对应的feature数据和filter数据，并对所述feature数据和所述filter数据进行分块，得到块数据；基于所述卷积指令和所述其他指令并行对所述块数据进行运算，得到目标运算结果。2.根据权利要求1所述的方法，其特征在于，所述将所述神经网络运算指令拆分为卷积指令和其他指令，包括：按照通道相关性将所述神经网络运算指令拆分为所述卷积指令和所述其他指令。3.根据权利要求2所述的方法，其特征在于，所述其他指令包括池化指令、激活指令、拼接指令、拆分指令。4.根据权利要求1所述的方法，其特征在于，所述获取神经网络运算指令，包括：获取所述神经网络运算指令；其中，所述神经网络运算指令包括当前节点号、父节点号、父节点类型、子节点号、子节点类型、batch大小、权重kernel大小、高度方向上padding数、宽度方向上padding数、步幅、输入宽度、输入高度、输入通道数、输出通道数、输入featuremap地址、权重地址、量化参数地址、输出地址、计算块的大小。5.根据权利要求1所述的方法，其特征在于，所述获取神经网络运算指令，包括：获取json文件格式的神经网络计算图；基于python读取所述神经网络计算图并解析得到dict格式的所述神经网络运算指令。6.一种数据处理系统，其特征在于，应用于硬件加速器，包括：第一获取...

【专利技术属性】
技术研发人员：曹其春，董刚，胡克坤，杨宏斌，尹文枫，王斌强，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人