神经网络的数据处理方法技术

技术编号：39833226 阅读：9 留言：0更新日期：2023-12-29 16:16

本发明专利技术涉及人工智能芯片领域，提供一种神经网络的数据处理方法

全部详细技术资料下载

【技术实现步骤摘要】
神经网络的数据处理方法、装置、加速器、设备及介质

[0001]本专利技术涉及人工智能芯片
，尤其涉及一种神经网络的数据处理方法
、
装置
、
加速器
、
设备及介质
。

技术介绍

[0002]目前，神经网络已广泛应用于图像分类
、
目标检测
、
自然语言处理等应用场景中
。
为了对神经网络加速计算，可以设置神经网络加速器来实现硬件加速
。
但是，现有技术中，在设计神经网络加速器时，往往只针对一种卷积方式进行专用设计导致神经网络加速器的通用性差
。

技术实现思路

[0003]本专利技术提供一种神经网络的数据处理方法
、
装置
、
加速器
、
设备及介质，用以解决现有技术中只针对一种卷积方式进行专用设计导致神经网络加速器的通用性差的缺陷，实现神经网络加速器的通用性的提升
。
[0004]本专利技术提供一种神经网络的数据处理方法，包括：
[0005]获取输入特征图数据及对应的卷积方式；
[0006]基于卷积方式与数据组织方式的对应关系，确定所述输入特征图数据对应的卷积方式所需要的数据组织方式；所述数据组织方式表示向神经网络加速器中
M
个卷积计算单元分发所述输入特征图数据的方式，
M
为大于1的正整数；
[0007]采用所述确定的数据组织方式，向所述
>M
个卷积计算单元分发所述输入特征图数据；所述
M
个卷积计算单元用于计算获得所述输入特征图数据对应的卷积方式下的输出特征图数据
。
[0008]根据本专利技术提供的一种神经网络的数据处理方法，在所述输入特征图数据对应的卷积方式为标准卷积的情况下，所述确定的数据组织方式为广播方式；
[0009]所述采用所述确定的数据组织方式，向所述
M
个卷积计算单元分发所述输入特征图数据，包括：
[0010]在所述广播方式下，将所述输入特征图数据广播分发至每个所述卷积计算单元
。
[0011]根据本专利技术提供的一种神经网络的数据处理方法，在所述输入特征图数据对应的卷积方式为分组卷积的情况下，所述确定的数据组织方式为组播方式；
[0012]所述采用所述确定的数据组织方式，向所述
M
个卷积计算单元分发所述输入特征图数据，包括：
[0013]在所述组播方式下，将所述输入特征图数据分成
N
个数据组，且将所述
M
个卷积计算单元分成
N
个卷积计算单元组，其中，
N
个所述卷积计算单元组与
N
个所述数据组一一对应，
N
的取值为正整数，将每个所述数据组广播分发至对应的所述卷积计算单元组中每个所述卷积计算单元
。
[0014]根据本专利技术提供的一种神经网络的数据处理方法，在所述输入特征图数据对应的
卷积方式为深度可分离卷积的情况下，所述确定的数据组织方式为单播方式；
[0015]所述采用所述确定的数据组织方式，向所述
M
个卷积计算单元分发所述输入特征图数据，包括：
[0016]在所述单播方式下，将所述输入特征图数据分成
M
个数据组，其中，
M
个所述卷积计算单元与
M
个所述数据组一一对应，将每个所述数据组单播分发至对应的所述卷积计算单元中
。
[0017]根据本专利技术提供的一种神经网络的数据处理方法，所述神经网络加速器包括
K
个卷积计算单元簇，每个所述卷积计算单元簇包括
L
个卷积计算单元，
K
和
L
为正整数，所述神经网络加速器中所述卷积计算单元的个数为
L*K
；
[0018]所述获取输入特征图数据及对应的卷积方式之前，还包括：
[0019]获取多个所述输入特征图数据；
[0020]从所述
K
个卷积计算单元簇中确定每个所述输入特征图数据需要下发的所述卷积计算单元簇
。
[0021]根据本专利技术提供的一种神经网络的数据处理方法，所述卷积计算单元或者所述卷积计算单元簇能够用于一个或者多个神经网络的加速计算任务
。
[0022]本专利技术还提供一种神经网络的数据处理装置，包括：
[0023]获取模块，用于获取输入特征图数据及对应的卷积方式；
[0024]确定模块，用于基于卷积方式与数据组织方式的对应关系，确定所述输入特征图数据对应的卷积方式所需要的数据组织方式；所述数据组织方式表示向神经网络加速器中
M
个卷积计算单元分发所述输入特征图数据的方式，
M
为大于1的正整数；
[0025]分发模块，用于采用所述确定的数据组织方式，向所述
M
个卷积计算单元分发所述输入特征图数据；所述
M
个卷积计算单元用于计算获得所述输入特征图数据对应的卷积方式下的输出特征图数据
。
[0026]本专利技术还提供一种神经网络加速器，所述神经网络加速器包括如上述任一种所述的神经网络的数据处理装置和
M
个卷积计算单元
。
[0027]本专利技术还提供一种电子设备，包括如上述任一种所述的神经网络加速器
。
[0028]本专利技术还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述神经网络的数据处理方法
。
[0029]本专利技术提供的神经网络的数据处理方法，针对每种卷积方式设置对应的数据组织方式，不同的数据组织方式下，将输入特征图数据分发至神经网络加速器中
M
个卷积计算单元的方式不同，基于卷积方式与数据组织方式的对应关系，确定所述输入特征图数据对应的卷积方式所需要的数据组织方式，利用确定的数据组织方式，向
M
个卷积计算单元分发输入特征图数据，通过数据组织方式的调整，使得
M
个卷积计算单元适应不同的卷积方式，从而计算获得输入特征图数据对应的卷积方式下的输出特征图数据，如此，通过面向多种卷积方式的数据处理方式提升了神经网络加速器的通用性
。
附图说明
[0030]为了更清楚地说明本专利技术或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本专利技术的一些
实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图
。
[0031]图1是本专利技术提供的神经网络的数据处理方法的流程示意图之一；
[0032]图2是本专利技术提供的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种神经网络的数据处理方法，其特征在于，包括：获取输入特征图数据及对应的卷积方式；基于卷积方式与数据组织方式的对应关系，确定所述输入特征图数据对应的卷积方式所需要的数据组织方式；所述数据组织方式表示向神经网络加速器中
M
个卷积计算单元分发所述输入特征图数据的方式，
M
为大于1的正整数；采用所述确定的数据组织方式，向所述
M
个卷积计算单元分发所述输入特征图数据；所述
M
个卷积计算单元用于计算获得所述输入特征图数据对应的卷积方式下的输出特征图数据
。2.
根据权利要求1所述的神经网络的数据处理方法，其特征在于，在所述输入特征图数据对应的卷积方式为标准卷积的情况下，所述确定的数据组织方式为广播方式；所述采用所述确定的数据组织方式，向所述
M
个卷积计算单元分发所述输入特征图数据，包括：在所述广播方式下，将所述输入特征图数据广播分发至每个所述卷积计算单元
。3.
根据权利要求1所述的神经网络的数据处理方法，其特征在于，在所述输入特征图数据对应的卷积方式为分组卷积的情况下，所述确定的数据组织方式为组播方式；所述采用所述确定的数据组织方式，向所述
M
个卷积计算单元分发所述输入特征图数据，包括：在所述组播方式下，将所述输入特征图数据分成
N
个数据组，且将所述
M
个卷积计算单元分成
N
个卷积计算单元组，其中，
N
个所述卷积计算单元组与
N
个所述数据组一一对应，
N
的取值为正整数，将每个所述数据组广播分发至对应的所述卷积计算单元组中每个所述卷积计算单元
。4.
根据权利要求1所述的神经网络的数据处理方法，其特征在于，在所述输入特征图数据对应的卷积方式为深度可分离卷积的情况下，所述确定的数据组织方式为单播方式；所述采用所述确定的数据组织方式，向所述
M
个卷积计算单元分发所述输入特征图数据，包括：在所述单播方式下，将所述输入特征图数据分成
M
个数据组，其中，

【专利技术属性】
技术研发人员：李卫军，何金钟，徐健，张明，覃鸿，
申请(专利权)人：中国科学院半导体研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人