【技术实现步骤摘要】
【国外来华专利技术】
本文所述的实施例一般涉及处理器。具体来说,本文所述的实施例一般涉及执行对打包数据进行操作的指令的处理器。
技术介绍
许多处理器具有单指令多数据(SIMD)架构。在SIMD架构中,多个数据元素可作为打包数据(packed data)或向量数据被打包在一个寄存器或存储器位置中。在打包数据中,寄存器或另一存储位置的位可在逻辑上划分为数据元素序列。例如,128位宽打包数据寄存器可具有两个64位宽数据元素、四个32位数据元素、八个16位数据元素等。数据元素的每个可表示单独的个体数据片(例如像素颜色等),其可与其他数据片分开和/或无关地操作。附图说明通过参照用来示出实施例的以下描述和附图,可以最透彻地了解本专利技术。附图包括:图1是可操作以执行采用传播的被屏蔽连续源元素存储指令的实施例的处理器的一实施例的框图。图2是执行采用传播的被屏蔽连续源元素存储的指令的实施例的方法的一实施例的流程图。图3是使最低阶被屏蔽元素保持不变的采用传播的被屏蔽连续源元素存储操作的一实施例的框图。图4是从最高阶元素存储最低阶被屏蔽元素的采用传播的被屏蔽连续源元素存储操作的一实施例的框图。图5是从最低阶元素存储最高阶被屏蔽元素的采用传播的被屏蔽连续源元素反向和后向存储操作的一实施例的框图。图6是从最低阶元素存储最高阶被屏蔽元素的采用传播的被屏蔽连续源元素反向存储操作的一实施例的框图。图7是打包数据寄存器的适当集合的一实施例的框图。图8是示出屏蔽位的数量取决于打包数据宽度和打包数据元素宽度的表。图9是打包数据操作屏蔽寄存器的适当集合的一实施例的框图。图10A-10B是示出按照本专利技术的实施例 ...
【技术保护点】
一种处理器,包括:用于对指令进行解码的解码单元,所述指令指示包括至少四个数据元素的第一源打包数据操作数,指示包括至少四个屏蔽元素的源屏蔽,并且指示目的地存储位置;与所述解码单元耦合的执行单元,所述执行单元响应所述指令而将结果打包数据操作数存储在目的地存储位置中,所述结果打包数据操作数具有:一系列至少两个未屏蔽结果数据元素,所述未屏蔽结果数据元素的每个按照相对顺序存储所述第一源打包数据操作数的至少两个连续数据元素的不同数据元素的值;以及最接近的对应未屏蔽结果数据元素对之间的所有被屏蔽结果数据元素具有与最靠近所述结果打包数据操作数的第一端的对应对的未屏蔽结果数据元素相同的值,所述被屏蔽结果数据元素对应于所述源屏蔽的被屏蔽的屏蔽元素。
【技术特征摘要】
【国外来华专利技术】1.一种处理器,包括:用于对指令进行解码的解码单元,所述指令指示包括至少四个数据元素的第一源打包数据操作数,指示包括至少四个屏蔽元素的源屏蔽,并且指示目的地存储位置;与所述解码单元耦合的执行单元,所述执行单元响应所述指令而将结果打包数据操作数存储在目的地存储位置中,所述结果打包数据操作数具有:一系列至少两个未屏蔽结果数据元素,所述未屏蔽结果数据元素的每个按照相对顺序存储所述第一源打包数据操作数的至少两个连续数据元素的不同数据元素的值;以及最接近的对应未屏蔽结果数据元素对之间的所有被屏蔽结果数据元素具有与最靠近所述结果打包数据操作数的第一端的对应对的未屏蔽结果数据元素相同的值,所述被屏蔽结果数据元素对应于所述源屏蔽的被屏蔽的屏蔽元素。2.如权利要求1所述的处理器,其中,所述执行单元存储包括所述第一端与最靠近所述第一端的所述系列的第一未屏蔽结果数据元素之间的至少一个被屏蔽结果数据元素的第一集合的所述结果打包数据操作数。3.如权利要求2所述的处理器,其中,所述执行单元存储所述结果打包数据操作数,其中所述第一集合的每个被屏蔽结果数据元素具有与所述结果打包数据操作数被存储之前最初在所述目的地存储位置中相同的值。4.如权利要求2所述的处理器,其中,所述解码单元对指示包括最高阶数据元素的第二源打包数据操作数的所述指令进行解码,并且其中所述执行单元存储所述结果打包数据操作数,其中所述第一集合的每个被屏蔽结果数据元素具有与所述第二源打包数据操作数的最高阶数据元素相同的值。5.如权利要求2所述的处理器,其中,所述解码单元对指示包括最低阶数据元素的第二源打包数据操作数的所述指令进行解码,并且其中所述执行单元存储所述结果打包数据操作数,其中所述第一集合的每个被屏蔽结果数据元素具有与所述第二源打包数据操作数的最低阶数据元素相同的值。6.如权利要求1所述的处理器,其中,所述执行单元存储包括所述结果打包数据操作数的第二端与最靠近所述第二端的所述系列的第二未屏蔽结果数据元素之间的至少一个被屏蔽结果数据元素的第二集合的所述结果打包数据操作数,并且所述第二集合的每个被屏蔽结果数据元素具有与所述第二未屏蔽结果数据元素相同的值。7.如权利要求1所述的处理器,其中,所述执行单元存储所述结果打包数据操作数,其中所述第一端包括最低阶端,以及其中所述连续数据元素是最低阶连续数据元素。8.如权利要求1所述的处理器,其中,所述执行单元存储所述结果打包数据操作数,其中所述第一端包括最低阶端,其中所述连续数据元素是最高阶连续数据元素。9.如权利要求1所述的处理器,其中,所述执行单元存储所述结果打包数据操作数,其中所述第一端包括最高阶端,以及其中所述连续数据元素是最低阶连续数据元素。10.如权利要求1所述的处理器,其中,所述执行单元存储所述结果打包数据操作数,其中所述第一端包括最高阶端,其中所述连续数据元素是最高阶连续数据元素。11.如权利要求1至10中的任一项所述的处理器,其中,所述源屏蔽存储在屏蔽寄存器中,并且其中所述指令包含在具有指示作为判定操作数的所述屏蔽寄存器的多个其他指令的指令集中。12.如权利要求1至10中的任一项所述的处理器,其中,所述解码单元对指示存储器中的位置中的所述第一源打包数据操作数的所述指令进行解码。13.如权利要求1至10中的任一项所述的处理器,其中,所述执行单元存储所述结果打包数据操作数,其中特性是最接近的对应未屏蔽结果数据元素对之间的所述所有被屏蔽结果数据元素具有与最靠近所述第一端的对应对的所述未屏蔽结果数据元素相同的值,所述特性对所述指令的操作码是隐式的。14.一种在处理器中的方法,包括:接收指令,所述指令指示包括至少四个数据元素的第一源打包数据操作数,指示包括至少四个屏蔽元素的源屏蔽,并且指示目的地存储位置;以及响应所述指令而将结果打包数据操作数存储在所述目的地存储位置中,所述结果打包数据操作数包括:一系列至少两...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。