当前位置: 首页 > 专利查询>奇跃公司专利>正文

用于卷积神经网络的有效数据布局制造技术

技术编号:37982256 阅读:22 留言:0更新日期:2023-06-30 09:57
公开了用于有效实现卷积神经网络的卷积层的系统和方法。在一个方面,卷积层的内核堆栈中的内核的权重值可以被重新排序为具有槽块的块布局。可以将卷积层的输入激活图的像素值重新排序为包括多个输入激活图像素集群的交错布局。输出激活图可以使用输入激活图像素集群和内核逐块地确定。集群和内核逐块地确定。集群和内核逐块地确定。

【技术实现步骤摘要】
用于卷积神经网络的有效数据布局
[0001]本申请是申请号为201780073892.X的中国专利申请的分案申请,原申请的申请日为2017年10月3日,优先权日为2016年10月4日,进入中国国家阶段的日期为2019年5月29日,专利技术名称为“用于卷积神经网络的有效数据布局”。
[0002]相关申请的交叉引用
[0003]本申请要求2016年10月4日提交的题为“EFFICIENT DATA LAYOUTS FOR CONVOLUTIONAL NEURAL NETWORKS”的美国专利申请号No.62/403,930的优先权的权益,其内容通过引用整体结合于此。
[0004]版权和商标声明
[0005]本专利文件的公开内容的一部分包含受版权保护的材料。版权所有者不反对任何人对专利文件或专利公开内容进行传真复制,因为它出现在专利和商标局专利文件或记录中,但在其它方面保留所有版权。


[0006]本公开一般涉及用于实现卷积神经网络的系统和方法,并且更特别地涉及用于实现卷积神经网络的卷积层的有效数据布局。r/>
技术介绍
...

【技术保护点】

【技术特征摘要】
1.一种由具有一个或多个处理器的系统执行的方法,所述方法包括:接收卷积神经网络的卷积层,其中,所述卷积层包括内核堆栈中的内核;接收所述卷积层的输入激活图;以及至少部分地基于所述内核和所述输入激活图确定所述卷积层的输出激活图,其中,所述输出激活图处于交互输出激活图布局中。2.根据权利要求1所述的方法,其中,所述输入激活图处于交错输入激活图布局中。3.根据权利要求1所述的方法,其中,所述输入激活图处于基本输入激活图布局中。4.根据权利要求3所述的方法,其中,所述方法进一步包括:将所述输入激活图的像素值从所述基本输入激活图布局重新排序为所述交互输入激活图布局,所述交互输入激活图布局包括多个输入激活图像素集群。5.根据权利要求1所述的方法,其中,所述内核堆栈的所述内核处于基本内核布局。6.根据权利要求5所述的方法,其中,将所述内核堆栈的所述内核的权重值从所述基本内核布局重新排序为包括多个内核块的块内核布局。7.根据权利要求6所述的方法,其中,内核块包括多个内核槽,并且其中,内核槽包括所述内核堆栈的所述内核的多个权重值。8.根据权利要求7所述的方法,其中,基于所述多个内核块和所述输入激活图确定所述输出激活图。9.根据权利要求8所述的方法,其中,所述输入激活图处于交错输入激活图布局中,所述交错输入激活图布局包括多个输入激活图像素集群,并且其中,确定所述输出激活图包括:对所述多个内核块和所述多个输入激活图像素集群逐块地执行融合乘加运算。10.根据权利要求7所述的方法,其中,所述内核块的第一内核槽对应于第一内核堆栈宽度边界,并且其中,所述内核块的最后一个内核槽对应于所述第一内核堆栈宽度边界之后的第二内核堆栈宽度边界。11.根据权利要求7所述的方法,其中,以比特为单位的第一内核槽的大小和以比特为单位的第一输入激活图槽的大小相同。12.根据权利要求11所述的方法,其中,以比特为单位的所述第一内核槽的大小和以比特为单位的第一输出激活图槽的大小相同。13.根据权利要求11所述的方法,其中,以比特为单位的所述第一内核槽的大小和以比特为单位的至少一个处理器的第一寄存器的大小相同。14.根据权利要求1所述的方法,其中,所述交错输出激活图布局包括多个输出激活图像素集群。15.根据权利要求1所述的方法,进一步包括将所述输出激活图的像素值从所述交错输出激活图布局重新排序为包括基本输出激活图布局。16.根据权利要求1所述的方法,其中,所述一个或多个处理器中的至少一个包括单指令多数据处理器。17.一种系统,包括存储指令的非暂态存储器,所述指令当由一个或多个处理器执行时,使所述一个或多个处理器执行包括如下的操作:接收卷积神经网络的卷积层,其中,所述卷积层包括内核堆栈中的内核;
接收所述卷积层的输入激活图;以及至少部分地基于所述内核和所述输入激活图确定所述卷积层的输出激活图,其中,所述输出激活图处于交互输出激活图布局中。18.根据权利要求17所述的系统,其中,将所述内核堆栈的所述内核的权重值重新排序为包括多个内核块的块内核布局,其中,内核块包括多个内核槽,并且其中内核槽包括所述内核堆栈的所述内核的多个权重值。19.根据权利要求18所述的系统,其中,以比特为单位的第一内核槽的大小和以比特为单位的第一输入激活图槽的大小相同。20.根据权利要求18所述的系统,其中,以比特为单位的第一内核槽的大小和以比特为单位的至少一个处理器的第一寄存器的大小相同。21.一种由具有一个或多个处理器的系统执行的方法,所述方法包括:接收卷积神经网络的卷积层,所述卷积层包括内核堆栈中的内核,其中,所述内核堆栈的所述内核处于块内核布局中,所述块内核布局包括多个内核槽的内核块;接收所述卷积层的输入激活图,其中,所述输入激活图处于基本输入激活图布局中;将所述输入激活图的像素值从所述基本输入激活图布局重新排序为交互输入激活图布局,所述交互输入激活图布局包括通过跨步的多个输入激活图像素集群;以及从所述多个内核块和所述多个输入激活图块确定所述卷积层的输出激活图。22.根据权利要求21所述的方法,其中,将所述输入激活图的像素值从所述基本输入激活图布局重新排序为所述交错输入激活图布局包括:...

【专利技术属性】
技术研发人员:A
申请(专利权)人:奇跃公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1