当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于处理矢量数据的方法和设备技术

技术编号:9545263 阅读:94 留言:0更新日期:2014-01-08 21:33
本发明专利技术的名称为用于处理矢量数据的方法、设备和指令,一种计算机处理器包括用于执行LoadUnpack和PackStore指令的控制逻辑。在一个实施例中,处理器包括矢量寄存器和屏蔽码寄存器。响应含有指定存储器位置的自变量的PackStore指令,该处理器中的电路在所指定的存储器位置处开始将来自矢量寄存器的未屏蔽矢量元素复制到连续的存储器位置中,而不复制被屏蔽矢量元素。响应LoadUnpack指令,该电路在所标识的存储器位置处开始将来自连续的存储器位置的数据项复制到矢量寄存器的未屏蔽矢量元素中,而不将数据复制到被屏蔽矢量元素。还描述了其他实施例并且对这些其他实施例要求权利。

【技术实现步骤摘要】
【专利摘要】本专利技术的名称为用于处理矢量数据的方法、设备和指令,一种计算机处理器包括用于执行LoadUnpack和PackStore指令的控制逻辑。在一个实施例中,处理器包括矢量寄存器和屏蔽码寄存器。响应含有指定存储器位置的自变量的PackStore指令,该处理器中的电路在所指定的存储器位置处开始将来自矢量寄存器的未屏蔽矢量元素复制到连续的存储器位置中,而不复制被屏蔽矢量元素。响应LoadUnpack指令,该电路在所标识的存储器位置处开始将来自连续的存储器位置的数据项复制到矢量寄存器的未屏蔽矢量元素中,而不将数据复制到被屏蔽矢量元素。还描述了其他实施例并且对这些其他实施例要求权利。【专利说明】用于处理矢量数据的方法、设备和指令本分案申请的母案申请日为2008年12月26日、申请号为200810189736.2、专利技术名称为“用于处理矢量数据的方法、设备和指令”。
本专利技术公开一般涉及数据处理的领域,更具体地说,涉及用于处理矢量数据的方法和相关设备。
技术介绍
数据处理系统可以包括诸如中央处理单元(CPU)、随机存取存储器(RAM)、只读存储器(ROM)等的硬件资源。处理系统还可以包括诸如基本输入/输出系统(BIOS)、虚拟机监视器(VMM)和ー个或多个操作系统(OS)的软件资源。CPU可以提供对处理矢量的硬件支持。矢量是保存多个连续数据项的数据结构。大小为M的矢量寄存器可以包含大小为0的N个矢量元素,其中N=M/0。例如,64字节矢量寄存器可以划分成(a)64个矢量元素,其中每个元素保存占据I个字节的数据项,(b)32个矢量元素,其中每个元素保存各占据2个字节(或ー个“字”)的数据项,(c) 16个矢量元素以保存各占据4个字节(或一个“双字0”)的数据项,或(d) 8个矢量元素以保存各占据8个字节或(或一个“四倍字长0”)的数据项。为了提供数据级并行性,CPU可以支持单个指令多个数据(SIMD)操作。SIMD操作涉及对多个数据项应用相同的操作。例如,响应单个SIMD相加指令,CPU可以将ー个矢量中的每个元素加到另ー个矢量中的对应元素。CPU可以包括多个处理核以便利于并行运算。
技术实现思路
根据第一实施例,提供了一种用于处理矢量指令的方法,所述方法包括:接收指定矢量元素要占据的至少ー个可变分区大小的处理器指令,所述处理器指令具有指定存储器位置的源參数、指定屏蔽寄存器的屏蔽參数和指定矢量寄存器的目的地參数;以及响应于所述处理器指令,在所指定的存储器位置处开始,将数据从存储器位置复制到所指定的矢量寄存器的未屏蔽矢量元素中,而不将数据复制到所指定的矢量寄存器的被屏蔽矢量元素中。根据第二实施例,提供了一种处理器,包括:控制逻辑,对指定矢量元素要占据的至少ー个可变分区大小的处理器指令进行解码,所述处理器指令具有指定存储器位置的源參数、指定屏蔽寄存器的屏蔽參数和指定矢量寄存器的目的地參数;以及执行逻辑,响应于解码的处理器指令,在所指定的存储器位置处开始,将数据从存储器位置复制到所指定的矢量寄存器的未屏蔽矢量元素中,而不将数据复制到所指定的矢量寄存器的被屏蔽矢量元素中。根据第三实施例,提供了一种计算机系统,包括:存储器,存储指定矢量元素要占据的至少ー个可变分区大小的处理器指令,所述处理器指令具有指定存储器位置的源參数、指定屏蔽寄存器的屏蔽參数和指定矢量寄存器的目的地參数;以及处理器,与所述存储器耦合,所述处理器包括用于对处理器指令进行解码的控制逻辑,以及执行逻辑,响应于解码的处理器指令,在所指定的存储器位置处开始,将数据从存储器位置复制到所指定的矢量寄存器的未屏蔽矢量元素中,而不将数据复制到所指定的矢量寄存器的被屏蔽矢量元素中。本专利技术的第一方面在于ー种处理器,包括:执行逻辑,所述执行逻辑通过执行包括如下的操作来执行处理器指令:在指定的存储器位置处开始将来自源矢量寄存器的未屏蔽矢量元素复制到连续的存储器位置中,而不复制来自所述源矢量寄存器的被屏蔽矢量元素。本专利技术的第二方面在于ー种其上存储了 PackStore指令的机器可访问媒体,其中:所述PackStore指令包括标识存储器位置的自变量;以及所述PackStore指令在被处理器执行时,使所述处理器在所标识的存储器位置处开始将来自源矢量寄存器的未屏蔽矢量元素复制到连续的存储器位置中,而不复制被屏蔽矢量元素。本专利技术的第三方面在于ー种其上存储了 LoadUnpack指令的机器可访问媒体,其中:所述LoadUnpack指令包括标识存储器位置的自变量;以及所述LoadUnpack指令在被处理器执行吋,使所述处理器在所标识的存储器位置处开始将来自连续的存储器位置的数据项复制到目标矢量寄存器的未屏蔽矢量元素中,而不修改所述目标矢量寄存器的被屏蔽矢量元素。本专利技术的第四方面在于ー种用于处理矢量指令的方法,所述方法包括:接收处理器指令,所述处理器指令具有指定矢量寄存器的源參数、指定屏蔽寄存器的屏蔽參数和指定存储器位置的目的地參数;以及响应接收到所述处理器指令,在所指定的存储器位置处开始将来自所指定的矢量寄存器的未屏蔽矢量元素复制到连续的存储器位置,而不复制被屏蔽矢量元素。本专利技术的第五方面在于ー种用于处理矢量指令的方法,所述方法包括:接收处理器指令,所述处理器指令具有指定存储器位置的源參数、指定屏蔽寄存器的屏蔽參数和指定矢量寄存器的目的地參数;以及响应接收到所述处理器指令,在所指定的存储器位置处开始将来自连续的存储器位置的数据复制到所指定的矢量寄存器的未屏蔽矢量元素中,而不将数据复制到所述指定的矢量寄存器的被屏蔽矢量元素中。本专利技术的第六方面在于ー种计算机系统,包括:存储器,所述存储器存储PackStore指令;以及耦合到所述存储器的处理器,所述处理器包括对所述PackStore指令进行解码的控制逻辑。本专利技术的第七方面在于ー种计算机系统,包括:存储器,所述存储器存储LoadUnpack指令;以及耦合到所述存储器的处理器,所述处理器包括对所述LoadUnpack指令进行解码的控制逻辑。【专利附图】【附图说明】从所附权利要求、下文对ー个或多个示例实施例的详细描述以及对应的附图,本专利技术的特征和优点将变得更为明显,其中:图1是图解其中可实现本专利技术的示例实施例的某些方面的适当的数据处理环境的框图;图2是图1的处理系统中用于处理矢量的过程的示例实施例的流程图;以及图3和图4是图解图1的实施例中用于处理矢量的示例存储构造的框图。【具体实施方式】处理系统中的程序可以创建包含数千个元素的矢量。处理系统中的处理器还可以包括一次只能保存16个元素的矢量寄存器。因此,该程序可以ー批16个地处理矢量中数千个元素。处理器还可以包括多个处理単元或处理核(例如16个核),以用于并行地处理多个矢量元素。例如,16个核能够在16个单独线程或执行流中并行地处理16个矢量元素。但是,在一些应用中,矢量的大多数元素通常将需要很少或不需要处理。例如,光线跟踪程序可以使用矢量元素来表示光线,并且该程序可以测试超过10000个光线并确定它们中仅99个从给定物体反射。如果光线与给定物体相交,则光线跟踪程序可能需要对该光线元素执行额外的处理,以便实现光线与物体相互作用。但是,对于不与物体相交的大多数光线,则无需额外的处理。例本文档来自技高网
...

【技术保护点】
一种用于处理矢量指令的方法,所述方法包括:?接收指定矢量元素要占据的至少一个可变分区大小的处理器指令,所述处理器指令具有指定存储器位置的源参数、指定屏蔽寄存器的屏蔽参数和指定矢量寄存器的目的地参数;以及响应于所述处理器指令,在所指定的存储器位置处开始,将数据从存储器位置复制到所指定的矢量寄存器的未屏蔽矢量元素中,而不将数据复制到所指定的矢量寄存器的被屏蔽矢量元素中。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:RD卡温
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1