System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 加速卷积的方法和装置制造方法及图纸_技高网
当前位置: 首页 > 专利查询>英特尔公司专利>正文

加速卷积的方法和装置制造方法及图纸

技术编号:40561016 阅读:10 留言:0更新日期:2024-03-05 19:23
公开了方法、装置、系统和制品。一种示例装置包括:至少一个存储器;装置中的指令;和处理器电路,用于执行指令以检测经上采样的输入子矩阵的图案,通过选择经上采样的输入子矩阵的四个元素生成经变换输入子矩阵,基于图案来选择经变换权重子矩阵,并且对经变换输入子矩阵和经变换权重子矩阵进行卷积。

【技术实现步骤摘要】
【国外来华专利技术】

本公开总体涉及神经网络,更具体地涉及加速卷积的方法和装置


技术介绍

1、在机器学习中,卷积神经网络是一种前馈人工网络,其通过应用过滤器来捕获图像中的空间和时间依赖性。卷积神经网络(cnn)广泛地用于计算机视觉中,以允许计算机系统导出对图像的高级理解。常见的计算机视觉任务包括图像分类和对象检测。

2、cnn对于成像任务可能是特别有用的。例如,来自图像的原始像素可以被馈送到一系列上采样层、卷积层和最大池化层。随着数据移动通过cnn,可以从图像中提取越来越抽象的特征。然后,这些特征可以用于分类。


技术实现思路

【技术保护点】

1.一种装置,包括:

2.根据权利要求1所述的装置,其中,所述经上采样的输入子矩阵基于经上采样的输入矩阵,所述经上采样的输入矩阵通过对输入矩阵的最近邻上采样而生成。

3.根据权利要求1所述的装置,其中,所述经上采样的输入子矩阵是3×3矩阵。

4.根据权利要求1至3中任一项所述的装置,其中,所述经变换输入子矩阵是2×2矩阵,所述经变换权重子矩阵是2×2矩阵。

5.根据权利要求1至3中任一项所述的装置,其中,所述处理器电路用于执行所述指令以基于滑动窗口的位置选择所述经上采样的输入子矩阵。

6.根据权利要求1至3中任一项所述的装置,其中,所述经上采样的输入子矩阵的所选择的四个元素对应于所述经上采样的输入子矩阵的四个角。

7.根据权利要求1至3中任一项所述的装置,其中,所述处理器电路用于执行所述指令以聚合多个卷积输出,所述卷积输出通过所述卷积生成。

8.一种计算机可读介质,包括指令,所述指令在被执行时使得处理器电路至少:

9.根据权利要求8所述的计算机可读介质,其中,所述经上采样的输入子矩阵基于经上采样的输入矩阵,所述经上采样的输入矩阵通过对输入矩阵的最近邻上采样而生成。

10.根据权利要求8所述的计算机可读介质,其中,所述经上采样的输入子矩阵是3×3矩阵。

11.根据权利要求8至10中任一项所述的计算机可读介质,其中,所述经变换输入子矩阵是2×2矩阵,所述经变换权重子矩阵是2×2矩阵。

12.根据权利要求8至10中任一项所述的计算机可读介质,其中,所述指令在被执行时使得所述处理器电路基于滑动窗口的位置选择所述经上采样的输入子矩阵。

13.根据权利要求8至10中任一项所述的计算机可读介质,其中,所述经上采样的输入子矩阵的所选择的四个元素对应于所述经上采样的输入子矩阵的四个角。

14.根据权利要求8至10中任一项所述的计算机可读介质,其中,所述指令在被执行时使得所述处理器电路聚合多个卷积输出,所述卷积输出通过所述卷积生成。

15.一种装置,包括:

16.根据权利要求15所述的装置,其中,所述经上采样的输入子矩阵基于经上采样的输入矩阵,所述经上采样的输入矩阵通过对输入矩阵的最近邻上采样而生成。

17.根据权利要求15所述的装置,其中,所述经上采样的输入子矩阵是3×3矩阵,所述经变换输入子矩阵是2×2矩阵,并且所述经变换权重子矩阵是2×2矩阵。

18.根据权利要求15至17中任一项所述的装置,其中,所述经上采样的输入子矩阵的所选择的四个元素对应于所述经上采样的输入子矩阵的四个角。

19.根据权利要求15至17中任一项所述的装置,还包括用于基于滑动窗口的位置选择所述经上采样的输入子矩阵的构件。

20.根据权利要求15至17中任一项所述的装置,还包括用于聚合多个卷积输出的构件,所述卷积输出通过所述卷积生成。

21.一种方法,包括:

22.根据权利要求21所述的方法,其中,所述经上采样的输入子矩阵基于经上采样的输入矩阵,所述经上采样的输入矩阵通过对输入矩阵的最近邻上采样而生成。

23.根据权利要求21所述的方法,其中,所述经上采样的输入子矩阵是3×3矩阵,所述经变换输入子矩阵是2×2矩阵,并且所述经变换权重子矩阵是2×2矩阵。

24.根据权利要求21至23中任一项所述的方法,还包括通过用所述处理器电路执行指令来基于滑动窗口的位置选择所述经上采样的输入子矩阵。

25.根据权利要求21至23中任一项所述的方法,还包括通过用所述处理器电路执行指令来聚合多个卷积输出,所述卷积输出通过所述卷积生成。

...

【技术特征摘要】
【国外来华专利技术】

1.一种装置,包括:

2.根据权利要求1所述的装置,其中,所述经上采样的输入子矩阵基于经上采样的输入矩阵,所述经上采样的输入矩阵通过对输入矩阵的最近邻上采样而生成。

3.根据权利要求1所述的装置,其中,所述经上采样的输入子矩阵是3×3矩阵。

4.根据权利要求1至3中任一项所述的装置,其中,所述经变换输入子矩阵是2×2矩阵,所述经变换权重子矩阵是2×2矩阵。

5.根据权利要求1至3中任一项所述的装置,其中,所述处理器电路用于执行所述指令以基于滑动窗口的位置选择所述经上采样的输入子矩阵。

6.根据权利要求1至3中任一项所述的装置,其中,所述经上采样的输入子矩阵的所选择的四个元素对应于所述经上采样的输入子矩阵的四个角。

7.根据权利要求1至3中任一项所述的装置,其中,所述处理器电路用于执行所述指令以聚合多个卷积输出,所述卷积输出通过所述卷积生成。

8.一种计算机可读介质,包括指令,所述指令在被执行时使得处理器电路至少:

9.根据权利要求8所述的计算机可读介质,其中,所述经上采样的输入子矩阵基于经上采样的输入矩阵,所述经上采样的输入矩阵通过对输入矩阵的最近邻上采样而生成。

10.根据权利要求8所述的计算机可读介质,其中,所述经上采样的输入子矩阵是3×3矩阵。

11.根据权利要求8至10中任一项所述的计算机可读介质,其中,所述经变换输入子矩阵是2×2矩阵,所述经变换权重子矩阵是2×2矩阵。

12.根据权利要求8至10中任一项所述的计算机可读介质,其中,所述指令在被执行时使得所述处理器电路基于滑动窗口的位置选择所述经上采样的输入子矩阵。

13.根据权利要求8至10中任一项所述的计算机可读介质,其中,所述经上采样的输入子矩阵的所选择的四个元素对应于所述...

【专利技术属性】
技术研发人员:戴伦·克鲁斯姜勇李源源钱煦蒋佩卿洪海云
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1