当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于片矩阵乘法和累加的系统、方法和装置制造方法及图纸

技术编号:40096601 阅读:22 留言:0更新日期:2024-01-23 17:02
本申请公开了用于片矩阵乘法和累加的系统、方法和装置。具体而言,讨论了矩阵(片)乘法累加和负版本矩阵(片)乘法累加。例如,在一些实施例中,详述了:解码电路,用于对指令解码,该指令具有用于操作码、第一源矩阵操作数的标识符、第二源矩阵操作数的标识符、以及源/目的地矩阵操作数的标识符的字段;以及执行电路,用于执行经解码的指令以:将所标识的第一源矩阵操作数乘以所标识的第二源矩阵操作数;将乘法的结果加到所标识的源/目的地矩阵操作数;以及将加法的结果存储在所标识的源/目的地矩阵操作数中并将所标识的源/目的地矩阵操作数的未配置列归零。

【技术实现步骤摘要】

本专利技术的领域总体上涉及计算机处理器架构,更具体地涉及矩阵操纵。


技术介绍

1、在诸如机器学习和其他批量数据处理之类的许多计算任务中,矩阵正变得日益重要。


技术实现思路

【技术保护点】

1.一种方法,包括:

2.如权利要求2所述的方法,其中,所述执行使用融合乘法累加器的网格。

3.如权利要求1-2中的任一项所述的方法,其中,所述所标识的第二源矩阵操作数被存储在存储器中。

4.如权利要求1-3中的任一项所述的方法,其中,所述乘法逐所述所标识的第一源矩阵操作数的行且逐所述所标识的第二源矩阵操作数的列进行。

5.如权利要求1-4中的任一项所述的方法,其中,操作数中的至少一个操作数是配置成用于表示矩阵的多个寄存器。

6.如权利要求1-5中的任一项所述的方法,其中,数据元素是单精度浮点数据元素。>

7.如权利要...

【技术特征摘要】

1.一种方法,包括:

2.如权利要求2所述的方法,其中,所述执行使用融合乘法累加器的网格。

3.如权利要求1-2中的任一项所述的方法,其中,所述所标识的第二源矩阵操作数被存储在存储器中。

4.如权利要求1-3中的任一项所述的方法,其中,所述乘法逐所述所标识的第一源矩阵操作数的行且逐所述所标识的第二源矩阵操作数的列进行。

5.如权利要求1-4中的任一项所述的方法,其中,操作数中的至少一个操作数是配置成用于表示矩阵的多个寄存器。

6.如权利要求1-5中的任一项所述的方法,其中,数据元素是单精度浮点数据元素。

7.如权利要求1-6中的任一项所述的方法,其中,数据元素是半精度浮点数据元素。

8.一种存储指令的非暂态机器可读介质,所述指令使处理器执行方法,所述方法包括:

9.如权利要求8所述的非暂态机器可读介质,其中,所述执行使用融合乘法累加器的网格。

10.如权利要求8-9中的任一项所述的非暂态机器可读介质,其中,所述所标识的第二源矩阵操作数被存储在存储器中。

11.如权利要求8-10中的任一项所述的非暂态机器可读介质,其中,所述乘法逐所述所标识的第一源矩阵操作数的行且逐所述所标识的第二源矩阵操作数的列进行。

12.如权利要求8-11中的任一项所述的非暂态机器可读介质,其中,操作数中的至少一个操作数是配置成用于表示矩阵的多个寄存器。

13.如权利要求8-12中的任一项所述的非暂态机器可读介质,其中,数据元素是单精度浮点数据元素。

14.如权利要求8-13中的任一项所述的非暂态机器...

【专利技术属性】
技术研发人员:R·凡伦天Z·斯波伯M·J·查尼B·L·托尔R·拉波波特S·什沃茨曼D·鲍姆I·亚诺弗E·乌尔德阿迈德瓦尔M·阿德尔曼J·考博尔Y·戈比尔S·卢巴诺维奇
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1