【技术实现步骤摘要】
【国外来华专利技术】数据处理装置中的乘-累加
本公开涉及数据处理,更具体地涉及执行算术运算的数据处理装置。
技术介绍
可以要求数据处理装置执行算术运算。这些算术运算例如可以包括可以在各种情况中找到应用性的矩阵乘法运算。这种矩阵乘法的实现方式的一个特征在于吞吐量是非常计算受限的(而不是加载/存储受限的)。随着向量长度增加并且更多工作数据可以存储于寄存器文件中,这种情况进一步凸显。例如,对于包含32位浮点值的256位向量,每次向量加载可以执行6个向量乘法(需要至少32个寄存器)。为了增加矩阵乘法性能,可以增大向量长度,以给出相应的性能改善,但是更长的向量需要更大的寄存器文件并且可能需要更复杂的加载/存储单元(如果需要加载更大的向量的话)。添加更多的向量乘法功能单元也可以增加矩阵乘法性能,但是这会对处理器的其他部分提出高要求。例如,由于每个乘法/累加运算需要三个寄存器读取端口和一个寄存器写入端口,所以四个乘法/累加单元将需要总共十二个读取端口和四个写入端口。此外,前端解码和调度逻辑将需要能够一次处理多个指令,以便调配到这些功能单元(例如,可靠地为四个乘法器提供馈入而所需要的“五倍宽”问题),因此非常复杂。
技术实现思路
本文描述的至少一个示例提供了一种数据处理装置,包括:寄存器存储电路,具有多个寄存器,每个寄存器用于存储多个数据元素;解码器电路,响应于数据处理指令而生成控制信号,该数据处理指令在多个寄存器中指定:第一源寄存器、第二源寄存器、以及一组N个累加寄存器;以及处理电路,响应于控制信号而执行数据处理操作,该数据处理操作包括:从第一源寄存器的内容中提取N个数据元素,执行N个数据元素 ...
【技术保护点】
1.一种数据处理装置,包括:寄存器存储电路,具有多个寄存器,每个寄存器用于存储多个数据元素;解码器电路,响应于数据处理指令而生成控制信号,所述数据处理指令在所述多个寄存器中指定:第一源寄存器、第二源寄存器、以及一组N个累加寄存器;以及处理电路,响应于所述控制信号而执行数据处理操作,该数据处理操作包括:从所述第一源寄存器的内容中提取N个数据元素,执行所述N个数据元素中的每个数据元素与所述第二源寄存器的内容的乘法,以及将每个乘法的结果应用于所述一组N个累加寄存器中的相应目标寄存器的内容。
【技术特征摘要】
【国外来华专利技术】2017.02.23 GR 201701000821.一种数据处理装置,包括:寄存器存储电路,具有多个寄存器,每个寄存器用于存储多个数据元素;解码器电路,响应于数据处理指令而生成控制信号,所述数据处理指令在所述多个寄存器中指定:第一源寄存器、第二源寄存器、以及一组N个累加寄存器;以及处理电路,响应于所述控制信号而执行数据处理操作,该数据处理操作包括:从所述第一源寄存器的内容中提取N个数据元素,执行所述N个数据元素中的每个数据元素与所述第二源寄存器的内容的乘法,以及将每个乘法的结果应用于所述一组N个累加寄存器中的相应目标寄存器的内容。2.如权利要求1所述的数据处理装置,其中,所述处理电路包括数据元素操控电路,该数据元素操控电路响应于所述控制信号而提供从所述第一源寄存器提取的数据元素的多个实例,其中,执行所述乘法包括将所述数据元素的所述多个实例乘以所述第二源寄存器的内容的相应部分。3.如权利要求2所述的数据处理装置,其中,所述数据元素操控电路响应于所述控制信号而提供所述数据元素的M个实例,其中,所述M个实例的大小小于所述多个寄存器的寄存器大小。4.如权利要求3所述的数据处理装置,其中,所述数据元素操控电路响应于所述控制信号而提供从所述第一源寄存器提取的一组数据元素中的每个数据元素的各自的M个实例,其中,所述一组数据元素的所述M个实例的总大小等于所述寄存器大小。5.如权利要求4所述的数据处理装置,其中,所述一组数据元素是由所述寄存器大小的重复子部分中的选定数据元素给出的。6.如权利要求2所述的数据处理装置,其中,所述数据元素的所述多个实例的组合大小等于所述多个寄存器的寄存器大小。7.如任意前述权利要求所述的数据处理装置,其中,N在2至8的范围内。8.如权利要求7所述的数据处理装置,其中,N是2。9.如权利要求7所述的数据处理装置,其中,N是4。10.如权利要求1至9中任一项所述的数据处理装置,其中,在所述数据处理操作中将每个乘法的结果应用于相应的目标寄存器的内容包括:将每个乘法的结果加和到相应的目标寄存器的内容。11.如权利要求1至9中任一项所述的数据处理装置,其中,在所述数据处理操作中将每个乘法的结果应用于相应的目标寄存器的内容包括:将每个乘法的结果从相应的目标寄存器的内容中减去。12.如权利要求1至9中任一项所述的数据处理装置,其中,在所述数据处理操作中将每个乘法的结果应用于相应的目标寄存器的内容包括:用每个乘法的结果替换相应的目标寄存器的内容。13.如任意前述权利要求所述的数据处理装置,其中,所述一组N个累加寄存器是连续寻址的寄存...
【专利技术属性】
技术研发人员:大卫·汉纳·曼塞尔,格里戈里奥斯·马格克里斯,
申请(专利权)人:ARM有限公司,
类型:发明
国别省市:英国,GB
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。