【技术实现步骤摘要】
【国外来华专利技术】专利
本专利技术的实施例一般涉及计算机系统的领域。本专利技术的实施例尤其涉及。
技术介绍
技术介绍
指令集,或指令集架构(ISA)是涉及编程的计算机架构的一部分,并可以包括本机数据类型、指令、寄存器架构、寻址模式、存储器架构,中断和异常处理,以及外部输入和输出(I/o)。在本文中术语指令一般指宏指令一即被提供给处理器(或指令转换器,该指令转换器(例如使用静态二进制翻译、包括动态编译的动态二进制翻译)翻译、变形、仿真,或以其他方式将指令转换成要由处理器处理的一个或多个指令)的指令)以用于执行的指令一而不是微指令或微操作(miCTo-op)—它们是处理器的解码器解码宏指令的结果。ISA与微架构不同,微架构是实现指令集的处理器的内部设计。带有不同的微架构的处理器可以共享共同的指令集。例如,INTEL?奔腾四(Pentium4)处理器、Intel?酷睿(Core?)处理器、以及来自加利福尼亚州桑尼威尔(Sunnyvale)的超微半导体有限公司(Advanced Micro Devices, Inc.)的诸多处理器执行几乎相同版本的x86指令集(在更新的版本中加入了一些扩展),但具有不同的内部设计。例如,ISA的相同寄存器架构在不同的微架构中可使用已知的技术以不同方法来实现,包括专用物理寄存器、使用寄存器重命名机制(诸如,使用寄存器别名表RAT、重排序缓冲器R0B、以及隐退寄存器组;使用多映射和寄存器池)的一个或多个动态分配物理寄存器等。除非另作说明,短语寄存器架构、寄存器组,以及寄存器在本文中被用来指代对软件/编程器以及指令指定寄存器的方式可见的东西。在需要 ...
【技术保护点】
一种用于执行指令的处理器,所述指令用于执行以下各项操作:确定N个矢量寄存器的集合,以将存储在系统存储器中始于存储器位置i=0,j=0和k=0处的数据流的N个指定部分读入所述N个矢量寄存器的集合;对于所述数据流的N个指定部分中的每一个,确定系统存储器地址;在系统存储器地址处从系统存储器获取所述数据流的N个指定部分;将所述数据流的N个指定部分存储到N个矢量寄存器;以及对于从i=1至X,j=0至Y以及k=0至Z的所有存储器位置,迭代上述操作,其中X、Y和Z是正整数。
【技术特征摘要】
【国外来华专利技术】1.一种用于执行指令的处理器,所述指令用于执行以下各项操作: 确定N个矢量寄存器的集合,以将存储在系统存储器中始于存储器位置i = O,j = O和k = O处的数据流的N个指定部分读入所述N个矢量寄存器的集合; 对于所述数据流的N个指定部分中的每一个,确定系统存储器地址; 在系统存储器地址处从系统存储器获取所述数据流的N个指定部分; 将所述数据流的N个指定部分存储到N个矢量寄存器;以及 对于从i = l至X,j = 0至Y以及k = 0至Z的所有存储器位置,迭代上述操作,其中X、Y和Z是正整数。2.如权利要求1所述的处理器,其特征在于,确定系统存储器地址包括根据指令直接确定第一系统存储器地址以及通过将滑动值的倍数与第一系统存储器地址相加来计算剩余的N -1个地址。3.如权利要求2所述的处理器,其特征在于,所述滑动值被设定为等于数据流的数据元素的大小。4.如权利要求1所述的处理器,其特征在于,所述数据流的部分包括所述数据流的数据元素。5.如权利要求1所述的处理器,其特征在于,所述指令被指定为形式INSTRUCTIONREGI, COUNT, MEML0CAT10N(指令寄存器1,计数,MEM位置),其中REGl包括用于存储数据流的第一部分的第一矢量寄存器,COUNT包括要从系统存储器获取的数据流的部分的数目,MEML0CAT10N包括数据流的第一部分的存储器位置。6.如权利要求5所述的处理器,其特征在于,对于数据流的16个部分,COUNT被设定为值16。7.如权利要求1所述的处理器,其特征在于,数据流的N个部分中的每一个包括浮点值,且其中N个矢量寄存器中的每一个包括浮点寄存器。8.如权利要求7所述的处理器,其特征在于,浮点值中的每一个包括标量浮点值。9.如权利要求7所述的处理器,其特征在于,浮点值中的每一个包括双浮点值。10.如权利要求1所述的处理器,其特征在于,数据流的N个部分中的每一个包括整数值。11.如权利要求10所述的处理器,其特征在于,整数值中的每一个包括打包双字值。12.如权利要求10所述的处理器,其特征在于,整数值中的每一个包括打包四字值。13.—种方法,包括: 确定N个矢量寄存器的集合,以将存储在系统存储器中的数据流的N个指定部分读入所述N个矢量寄存器的集合; 对于所述数据流的N个指定部分中的每一个,确定系统存储器地址; 在系统存储器地址处从系统存储器获取所述数据流的N个指定部分;以及 将所述数据流的N个指定部分存储到N个矢量寄存器。14.如权利要求13所述的方法,其特征在于,确定系统存储器地址包括根据指令直接确定第一系统存储器地址以及通过将滑动值的倍数与第一系统存储器地址相加来计算剩余的N -1个地址。15.如权利要求14所述的方法,其特征在于,所述滑动值被设定为等于数据流的数据元素的大小。16.如权利要求13所述的方法,其特征在于,所述数据流的部分包括所述数据流的数据元素。17.如权利要求13所述的方法,其特征在于,所述指令被指定为形式INSTRUCTIONREGI, COUNT, MEML0CAT10N(指令寄存器1,计数,MEM位置),,其中REGl包括用于存储数据流的第一部分的第一矢量寄存器,COUNT包括要从系统存储器获取的数据流的部分的数目,MEML0CAT10N包括数据流的第一部分的存储器位置。18.如权利要求17所述的方法,其特征在于,对于数据流的16个部分,COUNT被设定为值16。19.如权利要求13所述的方法,其特征在于,数据流的N个部分中的每一个包括浮点值,且其中N个矢量寄存器中的每一个包括浮点寄存器。20.如权利要求19所述的方法,其特征在于,浮...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。