用于前端聚集/分散存储器合并的方法和装置制造方法及图纸

技术编号：38611154 阅读：9 留言：0更新日期：2023-08-26 23:39

用于处理聚集和分散指令的系统可以实现前端子系统、后端子系统或两者。前端子系统包括预测单元，其被配置为确定指令所需的合并的存储器访问操作的预测量。解码单元基于预测量将指令转换为多个访问操作，并且向发布队列传输多个访问操作和预测量的指示。后端子系统包括加载存储单元，其接收对应于指令的多个访问操作，确定可以被合并的多个访问操作的子集，并且从该子集形成合并的存储器访问操作。队列为给定的加载

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于前端聚集/分散存储器合并的方法和装置
[0001]相关申请
[0002]本申请是2020年7月30日提交的美国申请No.16/944,141的继续申请。上述申请的全部教导在本文引入作为参考。
[0003]政府支持
[0004]本专利技术是在美国能源部的政府合同第AC52
‑
07NA27344号和分包合同B 620872下在政府支持下完成的。政府具有本专利技术的某些权利。

技术介绍

[0005]聚集和分散指令是访问多个存储器位置的向量加载/存储指令的类型。聚集指令执行加载，分散指令执行存储。聚集/分散存储器操作(也称为索引存储器访问)通常出现在现代科学和数据分析应用中，其通常涉及稀疏和自适应数据提取，例如自适应网格、稀疏矩阵、张量和图。对于任何给定的应用上下文，聚集/分散操作可以涉及高度随机或规则的间接偏移。这些应用可以呈现具有或不具有局部性的模式，并且这些操作的序列可以高度串行化或高度并行化。
[0006]历史上，聚集/分散指令已经在向量超级计算机的上下文中得到支持，但是直到最近通用指令集架构还没有得到支持。最近，对这些指令的支持已经出现在通用指令集中，诸如x86和ARM。

技术实现思路

[0007]示例实施例包括用于处理聚集和分散指令的系统。该系统可以实现前端子系统和/或后端子系统。前端子系统可以包括预测单元，该预测单元被配置为确定指令所需的合并的存储器访问操作的预测量，该指令是分散指令或聚集指令。解码单元可以被配置为1)基于预测量将指令转换为多个访问操作，以及2...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于处理聚集和分散指令的系统，包括：预测单元，被配置为确定由指令所需的合并的存储器访问操作的预测量，所述指令是分散指令和聚集指令中的一个；以及解码单元，被配置为1)基于所述预测量将所述指令转换为多个访问操作，以及2)向发布队列传输所述多个访问操作和所述预测量的指示。2.根据权利要求1所述的系统，还包括加载存储单元，被配置为1)确定由所述指令所需的合并存储器访问的实际量，以及2)向所述预测单元提供所述实际量的指示。3.根据权利要求2所述的系统，其中所述预测单元还被配置为基于所述预测量和所述实际量来更新表。4.根据权利要求3所述的系统，其中所述预测单元还被配置为更新所述表的条目，所述条目对应于所述指令并且包括指示所述预测量的字段和指示所述预测量的估计准确度的置信度得分。5.根据权利要求4所述的系统，其中所述预测单元还被配置为基于所述实际量来更新所述预测量和所述置信度得分中的至少一个。6.根据权利要求2所述的系统，其中所述加载存储单元还被配置为1)确定能够被合并的所述多个访问操作的子集，以及2)从所述子集形成合并的存储器访问操作。7.根据权利要求6所述的系统，其中所述加载存储单元分析所述多个访问操作的部分，以确定能够被合并的所述多个访问操作的所述子集。8.根据权利要求6所述的系统，其中所述加载存储单元还被配置为1)将所述合并的存储器访问操作分配给至少一个寄存器条目，以及2)经由加载—存储单元管线来执行所述合并的存储器访问操作。9.根据权利要求2所述的系统，其中所述加载存储单元还被配置为基于所述预测量和所述实际量的比较来确定所述预测单元的误预测。10.根据权利要求1所述的系统，其中所述多个访问操作具有等于所述预测量的量。11.根据权利要求1所述的系统，其中所述预测单元还被配置为，通过基于所述指令的程序计数器来定位表的条目来确定所述预测量，所述预测量对应于所述条目的字段。12.根据权利要求11所述的系统，其中所述预测单元还被配置为基于误预测的指示来更新所述字段。13.根据权利要求11所述的系统，其中所述预测单元还被配置为如果所述预测量超过由所述指令所需的合并存储器访问的实际量，则制止更新所述表。14.根据权利要求...

【专利技术属性】
技术研发人员：H，
申请(专利权)人：克雷公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人