用于经融合的乘加的系统、装置和方法制造方法及图纸

技术编号：36000687 阅读：15 留言：0更新日期：2022-12-17 23:18

本申请公开了用于经融合的乘加的系统、装置和方法。在一些实施例中，第一和第二紧缩数据源操作数的紧缩数据元素具有与第三紧缩数据操作数的紧缩数据元素的第二大小不同的第一大小。执行电路执行经解码的单个指令，用以为目的地操作数的每个紧缩数据元素定位履行：来自第一和第二紧缩数据源的、与第三紧缩数据源的紧缩数据元素定位相对应的M个N大小的紧缩数据元素的乘法，将来自这些乘法的结果加到第三紧缩数据源的紧缩数据元素定位的全大小紧缩数据元素，并且将加法结果存储在与第三紧缩数据源的紧缩数据元素定位相对应的紧缩数据元素定位目的地中，其中M等于全大小紧缩数据元素除以N。据元素除以N。据元素除以N。

全部详细技术资料下载

【技术实现步骤摘要】
用于经融合的乘加的系统、装置和方法
本申请是PCT国际申请号为PCT/US2016/057991、国际申请日为2016年10月20日、进入中国国家阶段的申请号为201680089435.5，题为“用于经融合的乘加的系统、装置和方法”的专利技术专利申请的分案申请。

[0001]本专利技术的领域一般地涉及计算机处理器架构，并且更具体地涉及当被执行的时候引发特定结果的指令。

技术介绍

[0002]线性代数中的常见操作是乘法累加操作(例如c＝c+a*b)。乘法累加典型地是操作流中的子操作，例如在两个向量之间的点积，其还可以是矩阵乘法中列和行的单个乘积。例如，C＝0For(I)C+＝A[l]*B[l]。
附图说明
[0003]本专利技术作为示例而不是限制地在附图的各图中被图示，在所述附图中，同样的参考标记指示类似的元素并且其中：图1图示了根据实施例的使用不同大小的操作数的经融合的乘法累加指令的示例性执行；图2图示了根据实施例的二次幂大小的SIMD实现方式，其中累加器使用比到乘法器的输入更大的输入大小；图3图示了用于处理诸如经融合的乘法累加指令之类的指令的硬件的实施例；图4图示了由处理器执行以处理经融合的乘法累加指令的方法的实施例；图5图示了经融合的乘法累加的执行的子集的实施例；图6图示了用于在硬件中实现该指令的伪代码的实施例；图7图示了经融合的乘法累加的执行的子集的实施例；图8图示了用于在硬件中实现该指令的伪代码的实施例；图9图示了经融合的乘法累加的执行的子集的实施例；图10图示了用于在硬件中实现该指令...

【技术保护点】

【技术特征摘要】
1.一种用于计算的装置，包括：解码器，用于对单个指令解码，所述单个指令具有操作码字段和四个操作数字段，所述四个操作数字段包括：第一操作数字段，用于指示第一源紧缩数据寄存器，所述第一源紧缩数据寄存器用于存储第一源紧缩数据元素；第二操作数字段，用于指示第二源紧缩数据寄存器，所述第二源紧缩数据寄存器用于存储第二源紧缩数据元素；第三操作数字段，用于指示源/目的地紧缩数据寄存器，所述源/目的地紧缩数据寄存器用于存储第三源紧缩数据元素和结果紧缩数据元素；以及第四操作数字段，用于指示写掩码寄存器，所述写掩码寄存器用于存储用于有条件地控制由所述单个指令指示的逐元素操作的多个位值；其中，所述第一源紧缩数据元素和所述第二源紧缩数据元素是具有第一大小的数据元素，所述第一大小与所述第三源紧缩数据元素和所述结果紧缩数据元素的第二大小不同；寄存器堆，包括所述第一源紧缩数据寄存器、所述第二源紧缩数据寄存器、以及所述源/目的地紧缩数据寄存器；以及执行电路，用于执行经解码的单个指令，以针对每个结果紧缩数据元素执行以下操作：如果所述写掩码寄存器中的对应位的值被设置为第一值，则保留所述结果紧缩数据元素的现有值或将所述结果紧缩数据元素设置为零；以及如果所述写掩码寄存器中的所述对应位的值被设置为第二值，则：将第一数量的所述第一源紧缩数据元素与所述第二源紧缩数据元素中的对应的紧缩数据元素相乘，以产生第一数量的乘积；将所述第一数量的乘积与来自所述第三源紧缩数据元素的对应的紧缩数据元素相加，以在所述源/紧缩数据寄存器中的对应位置中产生具有所述第二大小的所述结果紧缩数据元素。2.如权利要求1所述的装置，其中，所述第一数量等于所述第二大小除以所述第一大小。3.如权利要求1或2所述的装置，其中，所述第一值包括值0，并且所述第二值包括值1。4.如权利要求1至3中的任一项所述的装置，其中，所述结果紧缩数据元素包括紧缩32位浮点值。5.如权利要求1至4中的任一项所述的装置，其中，所述第一大小和所述第二大小基于所述操作码值。6.如权利要求1至5中的任一项所述的装置，其中，所述第一大小是所述第二大小的一半或四分之一。7.如权利要求1至6中的任一项所述的装置，其中，所述寄存器堆进一步包括所述写掩码寄存器。8.一种用于计算的方法，包括：对单个指令解码，所述单个指令具有操作码字段和四个操作数字段，所述四个操作数字段包括：第一操作数字段，用于指示第一源紧缩数据寄存器，所述第一源紧缩数据寄存器用于
存储第一源紧缩数据元素；第二操作数字段，用于指示第二源紧缩数据寄存器，所述第二源紧缩数据寄存器用于存储第二源紧缩数据元素；第三操作数字段，用于指示源/目的地紧缩数据寄存器，所述源/目的地紧缩数据寄存器用于存储第三源紧缩数据元素和结果紧缩数据元素；以及第四操作...

【专利技术属性】
技术研发人员：R瓦伦丁，G利夫钦，P马吉切尔，MJ查尼，E奥尔德艾哈迈德瓦尔，J科巴尔，MB格卡尔，Z斯珀伯，S鲁巴诺维奇，A格拉德斯坦，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人