【技术实现步骤摘要】
神经网络的数据处理方法、装置、加速器、设备及介质
[0001]本专利技术涉及人工智能芯片
,尤其涉及一种神经网络的数据处理方法
、
装置
、
加速器
、
设备及介质
。
技术介绍
[0002]目前,神经网络已广泛应用于图像分类
、
目标检测
、
自然语言处理等应用场景中
。
为了对神经网络加速计算,可以设置神经网络加速器来实现硬件加速
。
但是,现有技术中,在设计神经网络加速器时,往往只针对一种卷积方式进行专用设计导致神经网络加速器的通用性差
。
技术实现思路
[0003]本专利技术提供一种神经网络的数据处理方法
、
装置
、
加速器
、
设备及介质,用以解决现有技术中只针对一种卷积方式进行专用设计导致神经网络加速器的通用性差的缺陷,实现神经网络加速器的通用性的提升
。
[0004]本专利技术提供一种神经网络的数据
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种神经网络的数据处理方法,其特征在于,包括:获取输入特征图数据及对应的卷积方式;基于卷积方式与数据组织方式的对应关系,确定所述输入特征图数据对应的卷积方式所需要的数据组织方式;所述数据组织方式表示向神经网络加速器中
M
个卷积计算单元分发所述输入特征图数据的方式,
M
为大于1的正整数;采用所述确定的数据组织方式,向所述
M
个卷积计算单元分发所述输入特征图数据;所述
M
个卷积计算单元用于计算获得所述输入特征图数据对应的卷积方式下的输出特征图数据
。2.
根据权利要求1所述的神经网络的数据处理方法,其特征在于,在所述输入特征图数据对应的卷积方式为标准卷积的情况下,所述确定的数据组织方式为广播方式;所述采用所述确定的数据组织方式,向所述
M
个卷积计算单元分发所述输入特征图数据,包括:在所述广播方式下,将所述输入特征图数据广播分发至每个所述卷积计算单元
。3.
根据权利要求1所述的神经网络的数据处理方法,其特征在于,在所述输入特征图数据对应的卷积方式为分组卷积的情况下,所述确定的数据组织方式为组播方式;所述采用所述确定的数据组织方式,向所述
M
个卷积计算单元分发所述输入特征图数据,包括:在所述组播方式下,将所述输入特征图数据分成
N
个数据组,且将所述
M
个卷积计算单元分成
N
个卷积计算单元组,其中,
N
个所述卷积计算单元组与
N
个所述数据组一一对应,
N
的取值为正整数,将每个所述数据组广播分发至对应的所述卷积计算单元组中每个所述卷积计算单元
。4.
根据权利要求1所述的神经网络的数据处理方法,其特征在于,在所述输入特征图数据对应的卷积方式为深度可分离卷积的情况下,所述确定的数据组织方式为单播方式;所述采用所述确定的数据组织方式,向所述
M
个卷积计算单元分发所述输入特征图数据,包括:在所述单播方式下,将所述输入特征图数据分成
M
个数据组,其中,
技术研发人员:李卫军,何金钟,徐健,张明,覃鸿,
申请(专利权)人:中国科学院半导体研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。