【技术实现步骤摘要】
用于将打包四字移位并提取打包字的装置和方法
本专利技术的实施例一般地涉及计算机处理器的领域。更特别地,各实施例涉及用于移位和提取打包数据元素的装置和方法。
技术介绍
指令集或指令集架构(ISA)是与编程有关的计算机架构的一部分,包括原生数据类型、指令、寄存器架构、寻址模式、存储器架构、中断和异常处置以及外部输入和输出(I/O)。应当注意,术语“指令”在本文中一般指代宏指令——其是提供给处理器用于执行的指令——与微指令或微操作相对——其是处理器的解码器解码宏指令的结果。微指令或微操作可以被配置成命令处理器上的执行单元实行操作以实现与宏指令相关联的逻辑。ISA区别于微架构,微架构是用于实现指令集的处理器设计技术的集合。具有不同微架构的处理器可以共享公用的指令集。例如,Intel®奔腾4处理器、Intel®Core™处理器和来自加利福尼亚州森尼韦尔的超威半导体(AdvancedMicroDevices)公司的处理器实现x86指令集的几乎相同的版本(具有与较新的版本添加在一起的一些扩展),但是具有不同的内部设计。例如,ISA的相同寄存器架构可以使用公知的技术(包括专用物理寄存器、使用寄存器重命名机制(例如,使用寄存器别名表(RAT)、重排序缓冲器(ROB)和引退寄存器文件)的一个或多个动态分配的物理寄存器)在不同的微架构中以不同的方式实现。除非另外指定,否则短语寄存器架构、寄存器文件和寄存器在本文中用于指代对软件/编程者可见的寄存器架构、寄存器文件和寄存器以及指令指定寄存器的方式。在需要区别的情况下,形容词“逻辑的”、“架构的”或“软件可见的”将用于指示寄存器架构 ...
【技术保护点】
1.一种处理器,包括:解码器,用来解码左移位指令以生成经解码的左移位指令;第一源寄存器,用来存储多个打包四字数据元素,所述打包四字数据元素中的每个包括符号位;执行电路,用来执行经解码的左移位指令,所述执行电路包括具有符号保留逻辑的移位电路,所述移位电路用来将第一源寄存器中的分别来自第一和第二打包四字数据元素位置的第一和第二打包四字数据元素左移位在立即数值中或在第二源寄存器中的控制值中指定的量,所述左移位用来生成第一和第二经左移位的四字,所述移位电路将零写到由打包四字数据元素的左移位所暴露的位位置中;所述符号保留逻辑用来在所述移位电路实行左移位操作时维持符号位的副本;所述执行电路用来使得选择第一和第二经左移位的四字的包括符号位的16个最高有效位,以分别被写到目的地寄存器的第一和第二四字数据元素位置的16个最低有效位区域,从而将符号位写到每个16个最低有效位区域的最高有效位位置。
【技术特征摘要】
2017.12.21 US 15/8511451.一种处理器,包括:解码器,用来解码左移位指令以生成经解码的左移位指令;第一源寄存器,用来存储多个打包四字数据元素,所述打包四字数据元素中的每个包括符号位;执行电路,用来执行经解码的左移位指令,所述执行电路包括具有符号保留逻辑的移位电路,所述移位电路用来将第一源寄存器中的分别来自第一和第二打包四字数据元素位置的第一和第二打包四字数据元素左移位在立即数值中或在第二源寄存器中的控制值中指定的量,所述左移位用来生成第一和第二经左移位的四字,所述移位电路将零写到由打包四字数据元素的左移位所暴露的位位置中;所述符号保留逻辑用来在所述移位电路实行左移位操作时维持符号位的副本;所述执行电路用来使得选择第一和第二经左移位的四字的包括符号位的16个最高有效位,以分别被写到目的地寄存器的第一和第二四字数据元素位置的16个最低有效位区域,从而将符号位写到每个16个最低有效位区域的最高有效位位置。2.根据权利要求1所述的处理器,进一步包括:舍入电路,用来根据控制寄存器中指定的舍入模式对第一和第二经左移位的四字的16个最高有效位实行舍入操作。3.根据权利要求1或2所述的处理器,进一步包括:饱和电路,用来在在目的地寄存器中的存储之前使在第一和第二经左移位的四字的16个最高有效位中编码的值饱和。4.根据权利要求3所述的处理器,其中要响应于第一和第二经左移位的四字的16个最高有效位被饱和而更新一个或多个饱和标志。5.根据权利要求1或4所述的处理器,其中如果在立即数值中或控制值中指定的所述量高于阈值数目,则第一和第二经左移位的四字的16个最高有效位包括符号位的所有值。6.根据权利要求1或5所述的处理器,其中立即数值或第二源寄存器的控制值包括用来指示移位量的6位值。7.根据权利要求1或6所述的处理器,其中第一源寄存器和目的地寄存器包括128位打包数据寄存器。8.根据权利要求7所述的处理器,其中所述128位打包数据寄存器包括xmm寄存器。9.一种方法,包括:解码左移位指令以生成经解码的左移位指令;在第一源寄存器中存储多个打包四字数据元素,所述打包四字数据元素中的每个包括符号位;执行经解码的左移位指令,其中执行经解码的左移位指令包括:将第一源寄存器中的分别来自第一和第二打包四字数据元素位置的第一和第二打包四字数据元素左移位在立即数值中或在第二源寄存器中的控制值中指定的量,所述左移位用来生成第一和第二经左移位的四字;将零写到由打包四字数据元素的左移位所暴露的位位置中;在所述移位电路实行左移位操作时维持符号位的副本;选择第一和第二经左移位的四字的包括符号位的16个最高有效位,以分别被写到目的地寄存器的第一和第二四字数据元素位置的16个最低有效位区域,从而将符号位写到每个16个最低有效位区域的最高有效位位置。10.根据权利要求9所述的方法,进一步包括:根据控制寄存器中指定的舍入模式对第一和第二经左移位的四字的16个最高有效位实行舍入操作。11.根据权利要求9或10所述的方法,进一步包括:在在目的地寄存器中的存储之前,使在第一和第二经左移位的四字的16个最高有效位中编码的值饱和。12.根据权利要求11所述的方法,其中要响应于第一和第二经左移位的四字的16个最高有效位被饱和而更新一个或多个饱和标志。13.根据权利要求9或12所述的方法,其中如果在立...
【专利技术属性】
技术研发人员:E奥尔德艾哈迈德瓦尔,R瓦伦丁,M查尼,V马杜里,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。