用于展开卷积神经网络的张量数据的方法和装置制造方法及图纸

技术编号:20076132 阅读:39 留言:0更新日期:2019-01-15 00:56
公开了一种用于展开卷积神经网络的张量数据的方法和装置。该方法包括:根据第一张量和卷积神经网络加速器的硬件规格确定扩展维度;根据第一张量确定第二张量;以及根据用于第一张量的第一卷积核确定用于第二张量的第二卷积核。通过根据本公开的实施例的方法和装置,能够获得符合卷积神经网络加速器要求的规范形式的数据和运算参数,从而能够极大地提高卷积神经网络加速器的处理效率。

Method and Device for Tensor Data Expansion of Convolutional Neural Networks

A method and device for expanding tensor data of convolutional neural networks are disclosed. The method includes: determining the extended dimension according to the hardware specifications of the first tensor and the convolution neural network accelerator; determining the second tensor according to the first tensor; and determining the second convolution core for the second tensor according to the first convolution core for the first tensor. By means of the method and device according to the embodiment of the present disclosure, the data and operation parameters in the standard form that meet the requirements of the convolutional neural network accelerator can be obtained, thereby greatly improving the processing efficiency of the convolutional neural network accelerator.

【技术实现步骤摘要】
用于展开卷积神经网络的张量数据的方法和装置
本公开总体上涉及卷积神经网络的
,并且具体涉及用于展开卷积神经网络的张量数据的方法和装置。
技术介绍
基于卷积神经网络的深度学习技术已经被广泛地应用于图像识别、视频分析、自然语言处理、辅助驾驶等不同的领域。卷积神经网络中的运算量通常很大。期望能够使用诸如通用的中央处理器(CPU)、图形处理器(GPU)或专用加速器等硬件高效地执行卷积神经网络中的运算。由于芯片空间、硬件成本、设计复杂度等诸多方面的考虑和限制,卷积神经网络加速器(例如,可以包括乘加单元阵列)通常被设计为能够处理符合某些规范形状(例如,具有规定宽度、高度和/或通道数量)和/或规范数量的张量数据和卷积核,并且支持某些规范步长的卷积运算。然而,实际交由卷积神经网络加速器执行的卷积运算可能各种各样,例如,输入的张量数据和权重参数可能具有各种各样的形状,并且要执行的卷积运算可能具有各种步长。数据和运算的多样性导致卷积神经网络加速器无法直接或无法高效率地处理,甚至根本无法处理。
技术实现思路
一方面,本公开提供一种用于展开卷积神经网络的张量数据的方法,该方法包括:根据第一张量和卷积神经网本文档来自技高网...

【技术保护点】
1.一种用于展开卷积神经网络的张量数据的方法,包括:根据第一张量和卷积神经网络加速器的硬件规格确定扩展维度;根据所述第一张量确定第二张量,所述第二张量在所述扩展维度上的维度值和通道数量分别是所述第一张量在所述扩展维度上的维度值的两倍和所述第一张量的通道数量的一半;以及根据用于所述第一张量的第一卷积核确定用于所述第二张量的第二卷积核,基于所述第一卷积核和所述第一张量的第一卷积运算的结果与基于所述第二卷积核和所述第二张量的第二卷积运算的结果相同。

【技术特征摘要】
1.一种用于展开卷积神经网络的张量数据的方法,包括:根据第一张量和卷积神经网络加速器的硬件规格确定扩展维度;根据所述第一张量确定第二张量,所述第二张量在所述扩展维度上的维度值和通道数量分别是所述第一张量在所述扩展维度上的维度值的两倍和所述第一张量的通道数量的一半;以及根据用于所述第一张量的第一卷积核确定用于所述第二张量的第二卷积核,基于所述第一卷积核和所述第一张量的第一卷积运算的结果与基于所述第二卷积核和所述第二张量的第二卷积运算的结果相同。2.根据权利要求1所述的方法,所述第一卷积核在所述扩展维度的维度方向上的步长为1,并且所述第二卷积核在所述扩展维度的维度方向上的步长为2。3.根据权利要求1所述的方法,其中,对于所述第一张量在所述扩展维度的维度方向上的任意第i个切片,i是大于或等于1的整数,所述第i个切片的第一子切片和第二子切片分别对应于所述第二张量在所述扩展维度的维度方向上的第2i-1个切片和第2i个切片,所述第一子切片对应于所述第i个切片中在通道方向上的前半数通道上的数据,并且所述第二子切片对应于所述第i个切片中在通道方向上的后半数通道上的数据。4.根据权利要求1所述的方法,其中,所述第二卷积核取决于第三卷积核,对于所述第一卷积核在所述扩展维度的维度方向上的任意第j个切片,j是大于或等于1的整数,所述第j个切片的第一子切片和第二子切片分别对应于所述第三...

【专利技术属性】
技术研发人员:李德林凌坤李建军王振江
申请(专利权)人:地平线上海人工智能技术有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1