【技术实现步骤摘要】
【国外来华专利技术】数据元素比较处理器、方法、系统和指令背景
本文中所述的实施例总体上涉及处理器。具体而言,本文中所述的实施例总体上涉及用于处理紧缩数据操作数的处理器。
技术介绍
许多处理器具有单指令多数据(SIMD)架构。在SIMD架构中,紧缩数据指令、向量指令或SIMD指令可同时或并行地对多个数据元素或对多对数据元素进行操作。处理器可具有并行执行硬件,其响应于紧缩数据指令以同时或并行地执行多个操作。多个数据元素可在一个寄存器或存储器位置内被紧缩为紧缩数据或向量数据。在紧缩数据中,寄存器或其他存储位置的多个位可在逻辑上被划分为数据元素的序列。例如,256位宽的紧缩数据寄存器可具有四个64位宽的数据元素、八个32位数据元素、十六个16位数据元素,等等。数据元素中的每个数据元素可表示分开的单个数据片段(例如,像素颜色、复数的分量等),该分开的单个数据片段可被分别操作和/或独立于彼此被操作。附图说明通过参考以下描述以及用于说明多个实施例的附图,可最佳地理解本专利技术。在附图中:图1是示例稀疏矩阵的部分的框图。图2示出图1中的稀疏矩阵的第1行和第2行的列的子集的经压缩的稀疏行表示。图3是可操作用于执行数据元素比较指令的实施例的处理器的实施例的框图。图4是执行数据元素比较指令的实施例的方法的实施例的流程框图。图5是数据元素比较操作的第一示例实施例的框图。图6是数据元素比较操作的第二示例实施例的框图。图7是数据元素比较操作的第三示例实施例的框图。图8是数据元素比较操作的第四示例实施例的框图。图9是经掩蔽的数据元素合并操作的示例的框图。图10是紧缩数据操作掩码寄存器的合适的集合的示例实施 ...
【技术保护点】
一种处理器,包括:解码单元,用于对数据元素比较指令解码,所述数据元素比较指令用于指示将包括至少四个数据元素的第一源紧缩数据操作数,用于指示将包括至少四个数据元素的第二源紧缩数据操作数,并且用于指示一个或多个目的地存储位置;以及执行单元,与所述解码单元耦合,所述执行单元响应于所述数据元素比较指令,用于将至少一个结果掩码操作数存储在所述一个或多个目的地存储位置中,所述至少一个结果掩码操作数将包括用于在所述第一源紧缩数据操作数和所述第二源紧缩数据操作数中的一个中的、处于相同的相对位置中的每个对应数据元素的不同掩码元素,每个掩码元素用于指示所述第一源紧缩数据操作数和所述第二源紧缩数据操作数中的所述一个中的对应数据元素是否等于所述第一源紧缩数据操作数和所述第二源紧缩数据操作数中的另一个中的数据元素中的任何数据元素。
【技术特征摘要】
【国外来华专利技术】2015.09.26 US 14/866,9211.一种处理器,包括:解码单元,用于对数据元素比较指令解码,所述数据元素比较指令用于指示将包括至少四个数据元素的第一源紧缩数据操作数,用于指示将包括至少四个数据元素的第二源紧缩数据操作数,并且用于指示一个或多个目的地存储位置;以及执行单元,与所述解码单元耦合,所述执行单元响应于所述数据元素比较指令,用于将至少一个结果掩码操作数存储在所述一个或多个目的地存储位置中,所述至少一个结果掩码操作数将包括用于在所述第一源紧缩数据操作数和所述第二源紧缩数据操作数中的一个中的、处于相同的相对位置中的每个对应数据元素的不同掩码元素,每个掩码元素用于指示所述第一源紧缩数据操作数和所述第二源紧缩数据操作数中的所述一个中的对应数据元素是否等于所述第一源紧缩数据操作数和所述第二源紧缩数据操作数中的另一个中的数据元素中的任何数据元素。2.如权利要求1所述的处理器,其中,所述执行单元响应于所述指令,用于将两个结果掩码操作数存储在所述一个或多个目的地存储位置中,所述两个结果掩码操作数将包括:第一结果掩码操作数,将包括用于所述第一源紧缩数据操作数中的、处于相同的相对位置中的每个对应数据元素的不同掩码元素,所述第一结果掩码操作数的每个掩码元素用于指示所述第一源紧缩数据操作数中的对应数据元素是否等于所述第二源紧缩数据操作数中的数据元素中的任何数据元素;以及第二结果掩码操作数,将包括用于所述第二源紧缩数据操作数中的、处于相同的相对位置中的每个对应数据元素的不同掩码元素,所述第二结果掩码操作数的每个掩码元素用于指示所述第二源紧缩数据操作数中的对应数据元素是否等于所述第一源紧缩数据操作数中的数据元素中的任何数据元素。3.如权利要求2所述的处理器,其中,所述一个或多个目的地存储位置包括第一掩码寄存器和第二掩码寄存器,并且其中,所述执行单元响应于所述指令,用于将所述第一结果掩码操作数存储在所述第一掩码寄存器中,并用于将所述第二结果掩码操作数存储在所述第二掩码寄存器中。4.如权利要求2所述的处理器,其中,所述一个或多个目的地存储位置包括单个掩码寄存器,并且其中,所述执行单元响应于所述指令,用于将所述第一结果掩码操作数和所述第二结果掩码操作数存储在所述单个掩码寄存器中。5.如权利要求4所述的处理器,其中,所述执行单元响应于所述指令,用于将所述第一结果掩码操作数存储在所述单个掩码寄存器的最低有效部分中,并用于将所述第二结果掩码操作数存储在所述单个掩码寄存器的、比所述最低有效部分更高有效的部分中。6.如权利要求1所述的处理器,其中,所述执行单元响应于所述指令,用于将第一结果掩码操作数和第二结果掩码操作数两者存储在紧缩数据寄存器中,并且其中,所述紧缩数据寄存器中的每个数据元素将具有所述第一结果掩码操作数的掩码元素和所述第二结果掩码操作数的掩码元素两者。7.如权利要求1所述的处理器,其中,所述执行单元响应于所述指令,用于将单个结果掩码操作数存储在单个掩码寄存器中。8.如权利要求1所述的处理器,其中,所述执行单元响应于所述指令,用于将所述至少一个结果掩码操作数存储在至少一个掩码寄存器中,并且其中,所述处理器的指令集包括经掩蔽的紧缩数据指令,所述经掩蔽的紧缩数据指令能操作用于将所述至少一个掩码寄存器指示为用于源掩码操作数的存储位置,所述源掩码操作数将用于对紧缩数据操作进行掩蔽。9.如权利要求1-8中的任一项所述的处理器,其中,所述执行单元响应于所述指令,用于将数量不多于所述第一源紧缩数据操作数和所述第二源紧缩数据操作数中的数据元素的数量的结果掩码位存储在所述至少一个结果掩码操作数中。10.如权利要求1-8中的任一项所述的处理器,其中,所述执行单元响应于所述指令,用于存储所述至少一个结果掩码操作数,在所述至少一个结果掩码操作数中,每个掩码元素都包括单个掩码位。11.如权利要求1-8中的任一项所述的处理器,其中,所述解码单元用于对将用于指示所述第一源紧缩数据操作数并用于指示所述第二源紧缩数据操作数的所述指令进行解码,所述第一源紧缩数据操作数将包括至少八个数据元素,所述第二源紧缩数据操作数将包括至少八个数据元素。12.如权利要求1-8中的任一项所述的处理器,其中,所述解码单元用于对将用于指示所述第一源紧缩数据操作数并用于指示所述第二源紧缩数据操作数的所述指令进行解码,所述第一源紧缩数据操作数将包括至少512位,所述第二源紧缩数据操作数将包括至少512位。13.一种处理器中的方法,包括:接收数据元素比较指令,所述数据元素比较指令指示包括至少四个数据元素的第一源紧缩数据操作数,指示包括至少四个数据元素的第二源紧缩数据操作数,指示一个或多个目的地存储位置;以及响应于所述数据元素比较指令,将至少一个结果掩码操作数存储在所述一个或多个目的地存储位置中,所述至少一个结果掩码操作数包括用于在所述第一源紧缩数据操作数和所述第二源紧缩数据操作数中的一个中的、处于相同的...
【专利技术属性】
技术研发人员:A·K·米什拉,E·T·格罗科斯基,J·D·皮尔斯,D·T·马尔,E·科恩,E·乌尔德阿迈德瓦尔,J·考博尔圣阿德里安,R·凡伦天,M·J·查尼,C·J·休斯,M·B·吉尔卡尔,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。