【技术实现步骤摘要】
【国外来华专利技术】用于向量运算的旋转累加器
[0001]本公开涉及一种处理器,该处理器具有用于实现诸如矩阵
‑
向量运算的向量运算的执行单元。
技术介绍
[0002]给定处理器的处理器体系结构被设计成执行从指定指令集中实例化的指令。处理器的指令集是处理器被配置成执行的机器代码指令种类的基本限定集。这些指令包括多个计算指令,例如,诸如加法、乘法等算术指令。执行的每个指令是指令集中的指令类型之一的实例。在所述指令集中限定的每个指令是由操作码和零个或多个操作数字段形成的机器代码指令,其中,所述操作码指定要执行的操作,并且操作数字段(如果有的话)用于指定由所述指定操作要操作的一个或多个操作数。
[0003]一些处理器配置有向量处理指令作为其指令集的一部分。这种类型的典型处理器包括向量处理单元(VPU),用于响应于相应的机器代码指令执行向量操作。例如,VPU可以响应于对应的机器代码指令对两个输入向量执行乘积
‑
累加操作乘积
‑
累加操作的输出等于两个输入向量的内(点)积。
技术实现思路
< ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于生成输出向量的处理单元,所述处理单元包括:输出寄存器,所述输出寄存器具有用于保存所述输出向量的不同分量的多个元素,所述多个元素包括第一端元素和第二端元素;以及向量单元,所述向量单元用于处理至少两个输入向量以生成相应的结果值;其中,所述处理单元被配置成执行机器代码指令,每个指令是所述处理单元的指令集中的预限定类型指令集的实例,其中,所述指令集包括由对应的操作码限定的向量处理指令,所述向量处理指令使得所述处理单元:i)使用所述向量单元处理第一输入向量和第二输入向量以生成所述结果值;ii)对所述输出寄存器的所述多个元素执行旋转操作,其中,所述结果值与在所述旋转之前存在于所述第二端元素中的值之和被放置在所述输出寄存器的第一端元素中。2.根据权利要求1所述的处理单元,其中,所述向量单元被配置成通过对所述输入向量执行乘法
‑
累加操作来执行所述第一输入向量和第二输入向量的处理i),所述结果值是从所述乘法
‑
累加操作得到的标量值。3.根据权利要求1至2中任一项所述的处理单元,其中,所述向量单元被配置成直接从存储器访问至少所述第二输入向量。4.根据权利要求1至3中任一项所述的处理单元,所述处理单元包括:用于至少保存所述第一输入向量的输入寄存器,其中,所述向量单元被配置成从所述输入寄存器访问所述第一输入向量。5.根据权利要求4所述的处理单元,其中,所述输入寄存器是从寄存器文件中的多个寄存器中选择的,并且其中,所述向量处理指令包括指定所述输入寄存器的操作。6.根据权利要求4所述的处理单元,其中,所述输入寄存器隐式地存在于所述向量处理指令的操作码中,而不是由所述向量处理指令的操作数指定。7.根据权利要求1至6中任一项所述的处理单元,其中,所述输出寄存器是从寄存器文件中的多个寄...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。