【技术实现步骤摘要】
【国外来华专利技术】用于基于通道的跨步存储操作的指令和逻辑
本公开涉及处理逻辑、微处理器以及关联的指令集架构的领域,所述指令集架构当由处理器或其它处理逻辑执行时执行逻辑、数学或其它功能操作。
技术介绍
微处理器系统正变得越来越常见。多处理器系统的应用包括动态域分区,一直到桌面计算。为了利用多处理器系统,要执行的代码可被分成多个线程以用于由各种处理实体执行。每个线程可彼此并行执行。当指令在处理器上接收时,它们可以被解码成项或指令字(其是本机(native)或更本机的)以用于在处理器上执行。处理器可在片上系统中实现。被组织成三个或四个元素的元组的数据结构可以在媒体应用、高性能计算应用以及分子动力学应用中使用。附图说明:在附图的图中作为示例而非限制示出了实施例:图1A是根据本公开的实施例用可包含执行指令的执行单元的处理器形成的示范计算机系统的框图;图1B示出了根据本公开的实施例的数据处理系统;图1C示出了用于执行文本字符串比较操作的数据处理系统的其它实施例;图2是根据本公开的实施例可包含执行指令的逻辑电路的处理器的微架构的框图;图3A示出了根据本公开的实施例的多媒体寄存器中的各种打包数据类型表示;图3B示出了根据本公开的实施例的可能寄存器中的数据存储格式;图3C示出了根据本公开的实施例的多媒体寄存器中的各种有符号和无符号的打包数据类型表示;图3D示出了操作编码格式的实施例;图3E示出了根据本公开的实施例的具有40位或更多位的另一可能操作编码格式;图3F示出了根据本公开的实施例的又一可能操作编码格式;图4A是示出根据本公开实施例的有序流水线和寄存器重命名阶段、无序发布/执行流水线的框 ...
【技术保护点】
1.一种处理器,包括:前端,用以接收指令;解码器,用以解码所述指令;核,用以执行所述指令,所述核包括:源向量寄存器,用以将数据元素存储在所述源向量寄存器内的两个或更多个通道中,其中每个通道要存储两个或更多个数据元素,并且所述两个或更多个通道包括第一通道和第二通道;第一逻辑,用以从所述源向量寄存器内的所述通道中的每个提取相应的第一数据元素;第二逻辑,用以从所述源向量寄存器内的所述通道中的每个提取相应的第二数据元素;第三逻辑,用以将要从所述源向量寄存器提取的所述数据元素进行置换,以将要从所述第二通道提取的所述第一数据元素紧邻要从所述第一通道提取的所述第一数据元素放置在目的地向量中;第四逻辑,用以将要从所述源向量提取的所述数据元素进行置换,以将要从所述第二通道提取的所述第二数据元素紧邻要从所述第一通道提取的所述第二数据元素放置在所述目的地向量中;以及第五逻辑,用以从所述指令中指定的位置开始,将所述目的地向量存储到存储器,其中在所述目的地向量中彼此紧邻放置的数据元素要存储在所述存储器中的连续存储器位置中;以及引退单元,用以引退所述指令。
【技术特征摘要】
【国外来华专利技术】2015.12.18 US 14/9744451.一种处理器,包括:前端,用以接收指令;解码器,用以解码所述指令;核,用以执行所述指令,所述核包括:源向量寄存器,用以将数据元素存储在所述源向量寄存器内的两个或更多个通道中,其中每个通道要存储两个或更多个数据元素,并且所述两个或更多个通道包括第一通道和第二通道;第一逻辑,用以从所述源向量寄存器内的所述通道中的每个提取相应的第一数据元素;第二逻辑,用以从所述源向量寄存器内的所述通道中的每个提取相应的第二数据元素;第三逻辑,用以将要从所述源向量寄存器提取的所述数据元素进行置换,以将要从所述第二通道提取的所述第一数据元素紧邻要从所述第一通道提取的所述第一数据元素放置在目的地向量中;第四逻辑,用以将要从所述源向量提取的所述数据元素进行置换,以将要从所述第二通道提取的所述第二数据元素紧邻要从所述第一通道提取的所述第二数据元素放置在所述目的地向量中;以及第五逻辑,用以从所述指令中指定的位置开始,将所述目的地向量存储到存储器,其中在所述目的地向量中彼此紧邻放置的数据元素要存储在所述存储器中的连续存储器位置中;以及引退单元,用以引退所述指令。2.如权利要求1所述的处理器,其中所述核还包括:第六逻辑,用以从所述源向量寄存器内的所述两个或更多个通道中的每个提取相应的第三数据元素;以及第七逻辑,用以将要从所述第二通道提取的所述第三数据元素紧邻要从所述第一通道提取的所述第三数据元素放置在所述目的地向量中。3.如权利要求1所述的处理器,其中:所述源向量寄存器要将所述数据元素存储在所述源向量寄存器内的三个或更多个通道中;以及所述核还包括:第六逻辑,用以从所述源向量寄存器内的第三通道提取相应的第一数据元素;以及第七逻辑,用以将要从所述第三通道提取的所述第一数据元素紧邻要从所述第二通道提取的所述第一数据元素放置在所述目的地向量中。4.如权利要求1所述的处理器,其中:要存储在所述源向量寄存器内的所述第一通道中的所述数据元素表示第一类型的两个或更多个数据元素;以及要存储在所述源向量寄存器内的所述第二通道中的所述数据元素表示与所述第一类型不同的第二类型的两个或更多个数据元素。5.如权利要求1所述的处理器,其中:要从所述第一通道提取的所述第一数据元素和要从所述第二通道提取的所述第一数据元素表示要存储在所述存储器中的第一数据结构的相应分量;要从所述第一通道提取的所述第二数据元素和要从所述第二通道提取的所述第二数据元素表示要存储在所述存储器中的第二数据结构的相应分量;以及所述第五逻辑要将所述第二数据结构的数据元素存储在所述存储器中的位置中,所述位置距所述第一数据结构的数据元素要存储在其中的位置固定距离。6.如权利要求1所述的处理器,其中:所述核还包括第六逻辑,用以当所述目的地向量存储到所述存储器时对其应用屏蔽操作;对于在所述指令中识别的屏蔽寄存器中的被设置的一个或多个位中的每个,要在所述目的地向量中彼此紧邻放置的两个或更多个数据元素要写入到所述存储器中的连续位置;以及对于在所述指令中识别的所述屏蔽寄存器中的未被设置的一个或多个位中的每个,要在所述目的地向量中彼此紧邻放置的并且否则将会已经写入到所述存储器中的连续位置的两个或更多个数据元素要不写入到所述存储器。7.如权利要求1所述的处理器,其中所述核还包括:第六逻辑,用以从所述源向量寄存器内的所述两个或更多个通道中的每个提取一个或多个附加数据元素;以及第七逻辑,用以将从所述源向量寄存器内的所述两个或更多个通道提取的所述附加数据元素进行置换,以将从所述源向量寄存器内的所述两个或更多个通道中的所述第一通道中和在所述源向量寄存器内的所述两个或更多个通道中的所述第二通道中的相同位置提取的附加数据元素彼此紧邻放置在所述目的地向量中。8.如权利要求1所述的处理器,其中所述核还包括:第六逻辑,用以取决于针对所述指令指定的参数值来确定要从所述源向量寄存器内的所述两个或更多个通道中的每个提取的数据元素的数量。9.如权利要求1所述的处理器,其中:所述源向量寄存器要将所述数据元素存储在所述源向量寄存器内的四个或更多个通道中。10.如权利要求1所述的处理器,其中:所述核包括单指令多数据(SIMD)协处理器来实现所述指令的执行。11.一种方法,包括,在处理器中:接收第一指令;解码所述第一指令;执行所述第一指令,包括:从源向量寄存器内的两个或更多个通道中的每个提取相应的第一数据元素;从所述源向量寄存器内的所述两个或更多个通道中的每个提取相应的第二数据元素;将从所述源向量寄存器提取的所述数据元素进行置换,以将从所述第二通道提取的所述第一数据元素紧邻从第一通道提取的所述第一数据元素放置在目的地向量中,并将从所述第二通道提取的所述第二数据元素紧邻从所述第一通道提取的所述第二数据元素放置在所述目的地向量中;以及从所述第一指令中指定的位置开始,将所述目的地向量存储到存储器,包括将在所述目的地向量中紧邻彼此放置的数据元素存储在所述存储器中的连续存储器位置中;以及引退所述第一指令。12.如权利要求11所述的方法,还包括:从所述源向量寄存器内的所述两个或更多个通道中的每个提取一个或多个附加数据元素;以及将从所述源向量寄存器内的所述两个或更多个通道提取的所述附加数据元素进行置换,以将从所述源向量寄存器内的所述第一通道中的和所述源向量寄存器内的所述第二通道中的相同...
【专利技术属性】
技术研发人员:E奥尔德艾哈迈德瓦尔,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。