【技术实现步骤摘要】
数据处理装置、数据处理方法及相关产品
[0001]本披露一般地涉及数据处理领域。更具体地,本披露涉及一种数据处理装置、利用数据处理装置对数据执行分块指令的数据处理方法、芯片和板卡。
技术介绍
[0002]目前,深度学习(Deep Learning)已经成为机器学习中的重要分支,也大力助推着人工智能(AI)的发展。深度学习的核心技术——深度神经网络(DNN)已在诸多行业有着广泛的应用。
[0003]神经网络是人工智能、深度学习中最为关键的技术之一,其中卷积神经网络(Convolution Neural Network,CNN)是最为重要的一种网络类型。卷积神经网络中最为关键的计算即为卷积层(Conv layer)的卷积运算(Convolution Operation)。卷积层的功能是对输入数据进行特征提取,通过多层卷积,能够抽取复杂特征,以保证网络具有足够的表达能力和泛化能力。神经网络模型中包含了大量的、各种类型的卷积运算,卷积运算的计算性能极大地影响整个神经网络模型的计算性能。当神经网络模型应用于不同领域时,例如语音识别、机器翻译、图像处理等等,其对应的输入特征图和权值的各个维度大小可能各有不同。为了充分利用深度学习处理器的硬件优势,需要针对不同规模的、不同类型的卷积运算进行优化,以提高执行神经网络模型的计算性能。
技术实现思路
[0004]为了至少解决如上所提到的一个或多个技术问题,本披露在多个方面中提出了一种数据处理装置,其通过对数据执行分块指令,可以使得各种维度尺寸的数据能够适配卷积运算 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理装置,包括控制电路、第一存储电路和第二存储电路,其中:所述第一存储电路用于存储处理前的输入数据;所述第二存储电路用于存储处理后的输出数据;以及所述控制电路用于:根据所述处理前的输入数据的最低存储维度的大小,确定优选对齐值;根据所述优选对齐值配置分块指令;以及执行所述分块指令,以将按照第一维度存储顺序存储在第一存储电路上的输入数据以拆分单元为单位进行拆分并存储为第二存储电路上的输出数据,其中在所述第二存储电路上,各个拆分单元内按照第二维度存储顺序存储,拆分单元之间按照第三维度存储顺序存储。2.根据权利要求1所述的数据处理装置,其中所述控制电路进一步用于:当所述优选对齐值P小于所述分块指令的基准对齐值M时,将所述输入数据由原形状hi*wi*ci视为优化形状hi*(wi/Ws)*(Ws*ci),其中Ws=M/P,表示从所述输入数据的次低存储维度W拆分Ws倍的数据补至所述最低存储维度C,hi是输入数据的最高存储维度H的大小,wi是次低存储维度W的大小,ci是最低存储维度C的大小。3.根据权利要求2所述的数据处理装置,其中所述拆分单元的形状为CHW=U
Ci
×
U
H
×
U
W
,所述优选对齐值P是U
Ci
的2
n
倍,4.根据权利要求3所述的数据处理装置,其中所述控制电路进一步用于按如下规则根据所述输入数据的最低存储维度大小ci确定所述优选对齐值P:当0<ci≤U
Ci
时,P=U
Ci
,当2
n
*U
Ci
<ci≤2
n+1
*U
Ci
,时,P=2
n+1
*U
Ci
,当时,P=M。5.根据权利要求3
‑
4任一所述的数据处理装置,其中所述控制电路进一步用于按如下配置分块指令:当P≠U
Ci
时,根据所述优选对齐值P,设置分块指令的前配表,所述前配表用于将所述分块指令的输入张量的内层最低维度数据按照所述前配表的指示进行重排。6.根据权利要求5所述的数据处理装置,其中所述控制电路进一步用于按如下设置所述前配表:将所述分块指令的输入张量的内层最低维度数据转换成按照所述拆分单元的形状对齐,并且每个拆分单元的数据按照所述第一维度存储顺序排列。7.根据权利要求3
‑
6任一所述的数据处理装置,其中所述控制电路进一步用于按如下配置分块指令:设置分块指令的后配表,所述后配表用于将所述分块指令的输出张量的内层最低维度数据按照所述后配表的指示进行重排。8.根据权利要求7所述的数据处理装置,其中所述控制电路进一步用于按如下设置所...
【专利技术属性】
技术研发人员:ꢀ七四专利代理机构,
申请(专利权)人:安徽寒武纪信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。