基于卷积神经网络的数据移位处理方法、装置及设备制造方法及图纸

技术编号:32580646 阅读:13 留言:0更新日期:2022-03-09 17:11
本申请涉及一种基于卷积神经网络的数据移位处理方法、装置及设备。该基于卷积神经网络的数据移位处理方法,应用于处理器,该方法包括:将输入数据通过预处理得到预处理数据;根据不同移位操作需求,在卷积神经网络中将所述预处理数据通过移位单元多个不同的卷积计算层进行处理,得到移位运算数据;将所述移位运算数据经过后处理得到输出数据。本申请提供的方案,能够实现在适配神经网络结构的运行处理设备上执行数据移位任务,可以提升运算效率,降低时延,提升硬件资源利用率。提升硬件资源利用率。提升硬件资源利用率。

【技术实现步骤摘要】
基于卷积神经网络的数据移位处理方法、装置及设备


[0001]本申请涉及数据处理
,尤其涉及一种基于卷积神经网络的数据移位处理方法、装置及设备。

技术介绍

[0002]在数据处理领域中,通常需要对张量(tensor)数据进行顺序上的重排,其一般利用Reshape、Transpose等算法实现。其中,张量数据可以是多维数组,而实现数据重排的一种常用方式为:数据的移位操作。
[0003]随着基于卷积神经网络的深度学习算法的快速发展,卷积神经网络已在不同的
得到了广泛的应用,卷积神经网络可以在适配神经网络结构的运行处理设备上运行,适配神经网络结构的运行处理设备包括神经网络专用芯片(例如卷积神经网络推理芯片、ASIC(Application Specific Integrated Circuit,专用集成电路)芯片等)、通用处理器以及图像处理器,这些能够适配神经网络结构的运行处理设备的性能优越,已在市场上得到广泛的运用。
[0004]然而,目前的数据移位处理任务一般通过外挂ARM(Advanced RISC Machine,进阶精简指令集机器)芯片或者通过使用DMA(Direct Memory Access,直接存储器访问)的方式来实现,无法直接在适配神经网络结构的运行处理设备上运行,进而导致了运算效率低、延时高、硬件资源利用率低等问题。

技术实现思路

[0005]为解决或部分解决相关技术中存在的问题,本申请提供一种基于卷积神经网络的数据移位处理方法、装置及设备,能够实现在适配神经网络结构的运行处理设备上执行数据移位任务,可以提升运算效率,降低时延,提升硬件资源利用率。
[0006]本申请第一方面提供一种基于卷积神经网络的数据移位处理方法,应用于处理器,所述方法包括:
[0007]将输入数据通过预处理得到预处理数据;
[0008]根据不同移位操作需求,在卷积神经网络中将所述预处理数据通过移位单元多个不同的卷积计算层进行处理,得到移位运算数据;
[0009]将所述移位运算数据经过后处理得到输出数据。
[0010]在一实施方式中,所述将输入数据通过预处理得到预处理数据,包括:将输入的串行数据流转换通过拼接操作转换为矩阵数据块;
[0011]所述将所述移位运算数据经过后处理得到输出数据,包括:将矩阵数据块格式的移位运算数据转换为串行数据流。
[0012]在一实施方式中,所述在卷积神经网络中将所述预处理数据通过移位单元多个不同的卷积计算层进行处理,得到移位运算数据,包括:
[0013]在逻辑移位单元的第一卷积计算层将预处理数据进行卷积处理输出两通道卷积
数据后,通过三个不同的中间卷积计算层进行卷积处理,再通过第五卷积计算层进行卷积数据通道合并处理,得到逻辑移位的移位运算数据;或,
[0014]在循环移位单元的第一卷积计算层将预处理数据进行卷积处理输出三通道卷积数据后,通过四个不同的中间卷积计算层进行卷积处理,再通过第六卷积计算层进行卷积数据通道合并处理,得到循环移位的移位运算数据。
[0015]在一实施方式中,所述在逻辑移位单元的第一卷积计算层将预处理数据进行卷积处理输出两通道卷积数据后,通过三个不同的中间卷积计算层进行卷积处理,再通过第五卷积计算层进行卷积数据通道合并处理,得到逻辑移位的移位运算数据,包括:
[0016]在逻辑移位单元的第一卷积计算层将预处理数据进行卷积处理输出两通道卷积数据后,通过针对逻辑左移运算规律或逻辑右移运算规律设置的三个不同的中间卷积计算层进行卷积处理,再通过第五卷积计算层进行卷积数据通道合并处理,分别得到逻辑左移或逻辑右移的移位运算数据。
[0017]在一实施方式中,所述在循环移位单元的第一卷积计算层将预处理数据进行卷积处理输出三通道卷积数据后,通过四个不同的中间卷积计算层进行卷积处理,再通过第六卷积计算层进行卷积数据通道合并处理,得到循环移位的移位运算数据,包括:
[0018]在循环移位单元的第一卷积计算层将预处理数据进行卷积处理输出三通道卷积数据后,通过针对循环左移运算规律或循环右移运算规律设置的四个不同的中间卷积计算层进行卷积处理,再通过第六卷积计算层进行卷积数据通道合并处理,分别得到循环左移或循环右移的移位运算数据。
[0019]在一实施方式中,所述三个不同的中间卷积计算层中的每个中间卷积计算层,包括两个互不相同的卷积核,其中每个卷积核包括两个通道参数;或,
[0020]所述四个不同的中间卷积计算层中的每个中间卷积计算层,包括三个互不相同的卷积核,其中每个卷积核包括三个通道参数。
[0021]在一实施方式中,所述输入的串行数据流的字节长度位数为任一正整数的平方数或非平方数;
[0022]其中为非平方数时,将所述串行数据流切分为包含重叠的字节长度位数为任一正整数的平方数的数据段后进行预处理,并且在得到移位运算数据之后,根据移位方向上的后端数据段优先的原则进行拼接合并。
[0023]本申请第二方面提供一种基于卷积神经网络的数据移位处理装置,应用于处理器,所述装置包括:
[0024]预处理模块,用于将输入数据通过预处理得到预处理数据;
[0025]移位运算模块,用于根据不同移位操作需求,在卷积神经网络中将所述预处理模块的预处理数据通过多个不同的卷积计算层进行处理,得到移位运算数据;
[0026]后处理模块,用于将所述移位运算模块得到的移位运算数据经过后处理得到输出数据。
[0027]在一实施方式中,所述移位运算模块包括:
[0028]逻辑移位单元,用于在第一卷积计算层将预处理数据进行卷积处理输出两通道卷积数据后,通过三个不同的中间卷积计算层进行卷积处理,再通过第五卷积计算层进行卷积数据通道合并处理,得到逻辑移位的移位运算数据;或,
[0029]循环移位单元,用于在第一卷积计算层将预处理数据进行卷积处理输出三通道卷积数据后,通过四个不同的中间卷积计算层进行卷积处理,再通过第六卷积计算层进行卷积数据通道合并处理,得到循环移位的移位运算数据。
[0030]本申请第三方面提供一种人工智能芯片,包括如上所述的基于卷积神经网络的数据移位处理装置。
[0031]本申请第四方面提供一种计算设备,所述计算设备包括上述的人工智能芯片。
[0032]本申请第五方面提供一种板卡,所述板卡包括:存储器件、接口装置和控制器件以及上述人工智能芯片;
[0033]其中,所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接;
[0034]所述存储器件,用于存储数据;
[0035]所述接口装置,用于实现所述人工智能芯片与外部设备之间的数据传输;
[0036]所述控制器件,用于对所述人工智能芯片的状态进行监控。
[0037]本申请第六方面提供一种计算设备,包括:
[0038]处理器;以及
[0039]存储器,其上存储有可执行代码,当所述可本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于卷积神经网络的数据移位处理方法,其特征在于,应用于处理器,所述方法包括:将输入数据通过预处理得到预处理数据;根据不同移位操作需求,在卷积神经网络中将所述预处理数据通过移位单元多个不同的卷积计算层进行处理,得到移位运算数据;将所述移位运算数据经过后处理得到输出数据。2.根据权利要求1所述的方法,其特征在于:所述将输入数据通过预处理得到预处理数据,包括:将输入的串行数据流转换通过拼接操作转换为矩阵数据块;所述将所述移位运算数据经过后处理得到输出数据,包括:将矩阵数据块格式的移位运算数据转换为串行数据流。3.根据权利要求1所述的方法,其特征在于,所述在卷积神经网络中将所述预处理数据通过移位单元多个不同的卷积计算层进行处理,得到移位运算数据,包括:在逻辑移位单元的第一卷积计算层将预处理数据进行卷积处理输出两通道卷积数据后,通过三个不同的中间卷积计算层进行卷积处理,再通过第五卷积计算层进行卷积数据通道合并处理,得到逻辑移位的移位运算数据;或,在循环移位单元的第一卷积计算层将预处理数据进行卷积处理输出三通道卷积数据后,通过四个不同的中间卷积计算层进行卷积处理,再通过第六卷积计算层进行卷积数据通道合并处理,得到循环移位的移位运算数据。4.根据权利要求3所述的方法,其特征在于,所述在逻辑移位单元的第一卷积计算层将预处理数据进行卷积处理输出两通道卷积数据后,通过三个不同的中间卷积计算层进行卷积处理,再通过第五卷积计算层进行卷积数据通道合并处理,得到逻辑移位的移位运算数据,包括:在逻辑移位单元的第一卷积计算层将预处理数据进行卷积处理输出两通道卷积数据后,通过针对逻辑左移运算规律或逻辑右移运算规律设置的三个不同的中间卷积计算层进行卷积处理,再通过第五卷积计算层进行卷积数据通道合并处理,分别得到逻辑左移或逻辑右移的移位运算数据。5.根据权利要求3所述的方法,其特征在于,所述在循环移位单元的第一卷积计算层将预处理数据进行卷积处理输出三通道卷积数据后,通过四个不同的中间卷积计算层进行卷积处理,再通过第六卷积计算层进行卷积数据通道合并处理,得到循环移位的移位运算数据,包括:在循环移位单元的第一卷积计算层将预处理数据进行卷积处理输出三通道卷积数据后,通过针对循环左移运算规律或循环右移运算规律设置的四个不同的中间卷积计算层进行卷积处理,再通过...

【专利技术属性】
技术研发人员:胡宇李天元刘嘉超刘兰个川
申请(专利权)人:广州小鹏自动驾驶科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1