【技术实现步骤摘要】
用于点积操作的系统、方法和装置
本申请是
PCT
国际申请号为
PCT/US2017/040534、
国际申请日为
2017
年7月1日
、
进入中国国家阶段的申请号为
201780086894.2
,题为“用于点积操作的系统
、
方法和装置”的专利技术专利申请的分案申请
。
[0001]本专利技术的领域总体上涉及计算机处理器架构,更具体地涉及矩阵操纵
。
技术介绍
[0002]在诸如机器学习和其他批量数据处理之类的许多计算任务中,矩阵正变得日益重要
。
附图说明
[0003]在所附附图中以示例方式而非限制方式说明本专利技术,在附图中,类似的附图标记指示类似的要素,其中:
[0004]图1图示经配置的片
(tile)
的实施例;
[0005]图2图示矩阵存储的若干示例;
[0006]图3图示利用矩阵
(
片
)
操作加速器的系统的实施例;
[0007]图4和图5示出如何使用矩阵操作加速器来共享存储器的不同实施例;
[0008]图6图示使用片的矩阵乘法累加操作
(“TMMA”)
的实施例;
[0009]图7图示链式融合乘法累加指令的迭代的执行的子集的实施例;
[0010]图8图示链式融合乘法累加指令的迭代的执行的子集的实施例;
[0011]图9图示链式 ...
【技术保护点】
【技术特征摘要】
1.
一种处理器,包括:解码电路,用于对单条矩阵指令解码,所述单条矩阵指令具有用于操作码
、
多个标识符和位的字段,所述多个标识符与第一源矩阵的第一多个4位尺寸的数据元素
、
第二源矩阵的第二多个4位尺寸的数据元素
、
第三源矩阵的多个双字尺寸的源数据元素
、
以及结果矩阵的多个双字尺寸的结果数据元素对应,所述位指示所述第一多个4位尺寸的数据元素和所述第二多个4位尺寸的数据元素中的一者或这两者是有符号还是无符号的;以及执行电路,用于执行所述单条矩阵指令,所述执行电路包括乘法累加电路,所述乘法累加电路包括:乘法器,用于将所述第一多个4位尺寸的数据元素的第一子集中的每个4位尺寸的数据元素与所述第二多个4位尺寸的数据元素的第一子集中的对应的4位尺寸的数据元素相乘,以生成多个乘积;以及累加器,用于将所述多个乘积与所述多个双字尺寸的源数据元素中的对应的双字尺寸的源数据元素相加,以生成所述多个双字尺寸的结果数据元素中的对应的双字尺寸的结果数据元素
。2.
如权利要求1所述的处理器,其中,所述第一多个4位尺寸的数据元素的第一子集包括八个4位尺寸的数据元素,并且所述第二多个4位尺寸的数据元素的第一子集包括八个4位尺寸的数据元素
。3.
如权利要求2所述的处理器,其中,所述第一源矩阵的多个4位尺寸的数据元素用于被存储在第一一个或多个源向量寄存器中,并且所述第二源矩阵的多个4位尺寸的数据元素用于被存储在第二一个或多个源向量寄存器中
。4.
如权利要求3所述的处理器,其中,所述第一源矩阵包括第一矩阵的片,并且所述第二源矩阵包括第二矩阵的片
。5.
如权利要求3所述的处理器,其中,所述第一多个4位尺寸的数据元素的第一子集用于被存储在所述第一一个或多个源向量寄存器中的第一源向量寄存器中,并且所述第二多个4位尺寸的数据元素的第一子集用于被存储在所述第二一个或多个源向量寄存器中的第二源向量寄存器中
。6.
如权利要求1‑5中的任一项所述的处理器,其中,乘法器包括用于执行所述第一多个4位尺寸的数据元素的第一子集中的每个4位尺寸的数据元素与所述第二多个4位尺寸的数据元素的第一子集中的对应的4位尺寸的数据元素的并行乘法以生成所述多个乘积的乘法器的集合
。7.
如权利要求1‑6中的任一项所述的处理器,其中,所述4位尺寸的数据元素包括4位整数数据元素,并且所述双字尺寸的数据元素包括双字整数元素
。8.
如权利要求1‑7中的任一项所述的处理器,其中,所述乘法
‑
累加电路包括矩阵处理加速器的乘法
‑
累加电路
。9.
如权利要求8所述的处理器,进一步包括:第一接口,用于将所述矩阵处理加速器耦合到加速器存储器;以及第二接口,用于将所述矩阵处理加速器耦合到主机存储器
。10.
一种用于矩阵操纵的方法,包括:由处理器的解码电路对单条矩阵指令解码,所述单条矩阵指令具有用于操作码
、
多个标识符和位的字段,所述多个标识符与第一源矩阵的第一多个4位尺寸的数据元素
、
第二源
矩阵的第二多个4位尺寸的数据元素
、
第三源矩阵的多个双字尺寸的源数据元素
、
以及结果矩阵的多个双字尺寸的结果数据元素对应,所述位指示所述第一多个4位尺寸的数据元素和所述第二多个4位尺寸的数据元素中的一者或这两者是有符号还是无符号的;以及由所述处理器的执行电路执行所述单条矩阵指令,所述执行电路包括乘法累加电路,所述乘法累加电路包括:乘法器,用于将所述第一多个4位尺寸的数据元素的第一子集中的每个4位尺寸的数据元素与所述第二多个4位尺寸的数据元素的第一子集中的对应的4位尺寸的数据元素相乘,以生成多个乘积;以及累加器,用于将所述多个乘积与所述多个双字尺寸的源数据元素中的对应的双字尺寸的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。