【技术实现步骤摘要】
【国外来华专利技术】按索引分散至寄存器以及数据元素重布置处理器、方法、系统和指令背景
本文中所述的实施例总体上涉及处理器。具体而言,本文中所述的实施例总体上涉及用于处理紧缩数据的处理器。
技术介绍
许多处理器具有单指令多数据(SIMD)架构。在SIMD架构中,紧缩数据指令、向量指令或SIMD指令可对在寄存器或存储器位置内被紧缩为紧缩数据、向量数据或SIMD数据的多个数据元素进行操作。有代表性地,寄存器的多个位可在逻辑上被划分为数据元素的序列。例如,128位宽的紧缩数据寄存器可具有十六个8位数据元素、八个16位数据元素、四个32位数据元素或两个64位数据元素。数据元素中的每个数据元素可表示分开的单个数据片段(例如,像素颜色、复数的分量等),该分开的单个数据片段可被分别操作和/或独立于彼此被操作。处理器可具有并行执行硬件,其响应于紧缩数据指令以同时和/或并行地对多个数据元素操作。附图说明通过参考以下描述以及用于说明多个实施例的附图,可最佳地理解本专利技术。在附图中:图1是处理器的实施例的框图。图2是按索引聚集至寄存器操作的示例实施例的框图。图3是可操作用于执行按索引分散至寄存器指令的实施例的处理器的实施例的框图。图4是按索引分散至寄存器操作的示例实施例的框图。图5是按索引分散至寄存器执行单元的详细的示例实施例的框图。图6是执行按索引分散至寄存器指令的实施例的方法的实施例的流程框图。图7是可操作用于执行数据重布置指令的实施例的处理器实施例的框图。图8是数据元素重布置操作的第一示例实施例的框图。图9是数据元素重布置执行单元的详细的示例实施例的框图。图10是数据元素重布置操作的第二示例 ...
【技术保护点】
一种处理器,包括:解码单元,用于对数据元素重布置指令解码,所述指令用于指示将具有多个源数据元素的源紧缩数据操作数并用于指示目的地存储位置,所述多个源数据元素中的每个源数据元素都将具有源数据元素值和相对于所述源紧缩数据操作数的最低有效端的源数据元素位置;以及执行单元,与所述解码单元耦合,所述执行单元响应于所述指令,用于将结果紧缩数据操作数存储在所述目的地存储位置中,所述结果紧缩数据操作数将具有多个结果数据元素,每个结果数据元素都将具有结果数据元素值和相对于所述结果紧缩数据操作数的最低有效端的结果数据元素位置,其中,每个结果数据元素的结果数据元素值将是以下之一:等于最接近所述源紧缩数据操作数的一端的、将具有等于结果数据元素的结果数据元素位置的源数据元素位置的源数据元素值的源数据元素的源数据元素位置;以及当没有源数据元素将具有等于结果数据元素的结果数据元素位置的源数据元素值时,为替代值。
【技术特征摘要】
【国外来华专利技术】2015.09.25 US 14/865,6961.一种处理器,包括:解码单元,用于对数据元素重布置指令解码,所述指令用于指示将具有多个源数据元素的源紧缩数据操作数并用于指示目的地存储位置,所述多个源数据元素中的每个源数据元素都将具有源数据元素值和相对于所述源紧缩数据操作数的最低有效端的源数据元素位置;以及执行单元,与所述解码单元耦合,所述执行单元响应于所述指令,用于将结果紧缩数据操作数存储在所述目的地存储位置中,所述结果紧缩数据操作数将具有多个结果数据元素,每个结果数据元素都将具有结果数据元素值和相对于所述结果紧缩数据操作数的最低有效端的结果数据元素位置,其中,每个结果数据元素的结果数据元素值将是以下之一:等于最接近所述源紧缩数据操作数的一端的、将具有等于结果数据元素的结果数据元素位置的源数据元素位置的源数据元素值的源数据元素的源数据元素位置;以及当没有源数据元素将具有等于结果数据元素的结果数据元素位置的源数据元素值时,为替代值。2.如权利要求1所述的处理器,其中,所述源紧缩数据操作数将具有多组重复的源数据元素值,并且其中,对于每一组重复的源数据元素值,所述结果紧缩数据操作数用于存储重复的源数据元素值中的仅最高有效的源数据数据元素值的源数据元素位置。3.如权利要求1所述的处理器,其中,所述执行单元响应于所述指令,用于存储所述结果紧缩数据操作数,其中,所述源紧缩数据操作数的所述一端包括所述源紧缩数据操作数的最高有效端。4.如权利要求1所述的处理器,其中,所述执行单元响应于所述指令,用于存储所述结果紧缩数据操作数,其中,所述源紧缩数据操作数的所述一端包括所述源紧缩数据操作数的最低有效端。5.如权利要求1所述的处理器,其中,所述执行单元响应于所述指令,用于存储结果掩码操作数,所述结果掩码操作数将具有各自都将对应于结果数据元素中的一个不同结果数据元素的多个掩码元素。6.如权利要求5所述的处理器,其中,所述执行单元响应于所述指令,用于存储所述结果掩码操作数,在所述结果掩码操作数中:将对应于将等于源数据元素位置的结果数据元素值的每个掩码元素将具有第一值;并且将对应于将具有替代值的结果数据元素值的每个掩码元素将具有不同的第二值。7.如权利要求5所述的处理器,其中,每个掩码元素将仅包括单个位。8.如权利要求5所述的处理器,其中,所述执行单元响应于所述指令,用于将所述结果掩码操作数存储在掩码寄存器中,并且其中,包括所述数据元素重布置指令的指令集中的多条其他指令用于指定用于预测操作数的掩码寄存器,所述预测操作数用于预测紧缩数据操作。9.如权利要求1所述的处理器,其中,所述执行单元响应于所述指令,用于存储所述结果紧缩数据操作数,所述结果紧缩数据操作数将具有至少一个结果数据元素,所述至少一个结果数据元素将具有将为替代值的结果数据元素值,其中,所述替代值将为负数,并且其中,不是替代值的其他结果数据元素值中无一将为负数。10.如权利要求1所述的处理器,其中,所述执行单元响应于所述指令,用于存储所述结果紧缩数据操作数,所述结果紧缩数据操作数将具有至少一个结果数据元素,所述至少一个结果数据元素将具有将为替代值的结果数据元素值,并且其中,所述替代值将包括零值。11.如权利要求1所述的处理器,其中,所述执行单元响应于所述指令,将存储所述结果紧缩数据操作数,所述结果紧缩数据操作数将具有将为替代值的结果数据元素值,并且其中,所述替代值将包括恰在所述指令的执行之前被存储在所述目的地存储位置中的对应位置中的数据元素的值。12.如权利要求1-11中的任一项所述的处理器,其中,所述执行单元响应于所述指令用于存储所述结果紧缩数据操作数,所述结果紧缩数据操作数将具有至少四个结果数据元素,所述至少四个结果数据元素包括将具有作为结果数据元素值的所述替代值的至少一个结果数据元素。13.如权利要求1-11中的任一项所述的处理器,其中,所述源数据元素中的每个源数据元素都包括整数索引,并且其中,每个索引在每个源数据元素的最低有效字节的最低阶的位子集中被表示。14.如权利要求1-11中的任一项所述的处理器,其中所述解码单元还用于对按索引聚...
【专利技术属性】
技术研发人员:C·J·休斯,J·S·朴,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。