用于片矩阵乘法和累加的系统、方法和装置制造方法及图纸

技术编号：22268838 阅读：46 留言：0更新日期：2019-10-10 18:03

本文中详述的实施例涉及矩阵操作。具体而言，讨论了矩阵(片)乘法累加和负版本矩阵(片)乘法累加。例如，在一些实施例中，详述了：解码电路，用于对指令解码，该指令具有用于操作码、第一源矩阵操作数的标识符、第二源矩阵操作数的标识符、以及源/目的地矩阵操作数的标识符的字段；以及执行电路，用于执行经解码的指令以：将所标识的第一源矩阵操作数乘以所标识的第二源矩阵操作数；将乘法的结果加到所标识的源/目的地矩阵操作数；以及将加法的结果存储在所标识的源/目的地矩阵操作数中并将所标识的源/目的地矩阵操作数的未配置列归零。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于片矩阵乘法和累加的系统、方法和装置
本专利技术的领域总体上涉及计算机处理器架构，更具体地涉及矩阵操纵。
技术介绍
在诸如机器学习和其他批量数据处理之类的许多计算任务中，矩阵正变得日益重要。附图说明在所附附图中以示例方式而非限制方式说明本专利技术，在附图中，类似的附图标记指示类似的要素，其中：图1图示经配置的片(tile)的实施例；图2图示矩阵存储的若干示例；图3图示利用矩阵(片)操作加速器的系统的实施例；图4和图5示出如何使用矩阵操作加速器来共享存储器的不同实施例；图6图示使用片的矩阵乘法累加操作(“TMMA”)的实施例；图7图示链式融合乘法累加指令的迭代的执行的子集的实施例；图8图示链式融合乘法累加指令的迭代的执行的子集的实施例；图9图示链式融合乘法累加指令的迭代的执行的子集的实施例；图10图示链式融合乘法累加指令的迭代的执行的子集的实施例；图11图示根据实施例的尺寸为2的幂的SIMD实现方式，其中，累加器使用比至乘法器的输入的尺寸大的输入尺寸；图12图示利用矩阵操作电路的系统的实施例；图13图示处理器核流水线的实施例，该处理器核流水线支持使用片的矩阵操作；图14图示处理器核流水线的实施例，该处理器核流水线支持使用片的矩阵操作；图15图示按行为主格式和列为主格式表达的矩阵的示例；图16图示矩阵(片)的使用的示例；图17图示矩阵(片)的使用的方法的实施例；图18图示TILECONFIG指令的示例性执行；图19(A)-图19(D)图示(多个)寄存器的示例；图20图示将被支持的矩阵(片)的描述的实施例；图21图示由处理器执行以处理TILECONFIG指令的...

【技术保护点】
1.一种处理器，包括：解码电路，用于对指令解码，所述指令具有用于操作码、第一源矩阵操作数的标识符、第二源矩阵操作数的标识符、以及源/目的地矩阵操作数的标识符的字段；以及执行电路，用于执行经解码的指令以：将所标识的第一源矩阵操作数乘以所标识的第二源矩阵操作数；将乘法的结果加到所标识的源/目的地矩阵操作数；以及将加法的结果存储在所述所标识的源/目的地矩阵操作数中。

【技术特征摘要】
【国外来华专利技术】2017.03.20 US 62/473,7321.一种处理器，包括：解码电路，用于对指令解码，所述指令具有用于操作码、第一源矩阵操作数的标识符、第二源矩阵操作数的标识符、以及源/目的地矩阵操作数的标识符的字段；以及执行电路，用于执行经解码的指令以：将所标识的第一源矩阵操作数乘以所标识的第二源矩阵操作数；将乘法的结果加到所标识的源/目的地矩阵操作数；以及将加法的结果存储在所述所标识的源/目的地矩阵操作数中。2.如权利要求1所述的处理器，其中，所述执行电路包括融合乘法累加器的网格。3.如权利要求1-2中的任一项所述的处理器，其中，所述所标识的第二源矩阵操作数被存储在存储器中。4.如权利要求1-3中的任一项所述的处理器，其中，所述乘法逐所述所标识的第一源矩阵操作数的行且逐所述所标识的第二源矩阵操作数的列进行。5.如权利要求1-4中的任一项所述的处理器，其中，操作数中的至少一个操作数是配置成用于表示矩阵的多个寄存器。6.如权利要求1-5中的任一项所述的处理器，其中，数据元素是单精度浮点数据元素。7.如权利要求1-5中的任一项所述的处理器，其中，数据元素是半精度浮点数据元素。8.一种方法，包括：对指令解码，所述指令具有用于操作码、第一源矩阵操作数的标识符、第二源矩阵操作数的标识符、以及源/目的地矩阵操作数的标识符的字段；以及执行经解码的指令以：将所标识的第一源矩阵操作数乘以所标识的第二源矩阵操作数；将乘法的结果加到所标识的源/目的地矩阵操作数；以及将加法的结果存储在所述所标识的源/目的地矩阵操作数中。9.如权利要求8所述的方法，其中，所述执行使用融合乘法累加器的网格。10.如权利要求8-9中的任一项所述的方法，其中，所述所标识的第二源矩阵操作数被存储在存储器中。11.如权利要求8-10中的任一项所述的方法，其中，所述乘法逐所述所标识的第一源矩阵操作数的行且逐所述所标识的第二源矩阵操作数的列进行。12.如权利要求8-11中的任一项所述的方法，其中，操作数中的至少一个操作数是配置成用于表示矩阵的多个寄存器。13.如权利要求8-12中的任一项所述的方法，其中，数据...

【专利技术属性】
技术研发人员：R·凡伦天，Z·斯波伯，M·J·查尼，B·L·托尔，R·拉波波特，S·什沃茨曼，D·鲍姆，I·亚诺弗，E·乌尔德阿迈德瓦尔，M·阿德尔曼，J·考博尔，Y·戈比尔，S·卢巴诺维奇，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人