【技术实现步骤摘要】
在不同的粒度水平下对数据值进行广播和掩码的指令执行本专利技术专利申请是国际申请号为PCT/US2011/067095,国际申请日为2011年12月23日,进入中国国家阶段的申请号为201180076281.3,名称为“在不同的粒度水平下对数据值进行广播和掩码的指令执行”的专利技术专利申请的分案申请。
本专利技术一般属于计算科学,更具体地涉及在不同的粒度水平下对数据值进行广播和掩码的指令执行。
技术介绍
图1示出了在半导体芯片上用逻辑电路实现的处理核100的高级图。该处理核包括流水线101。该流水线由各自被设计成在完全执行程序代码指令所需的多步骤过程中执行特定步骤的多个级组成。这些级通常至少包括:1)指令取出和解码;2)数据取出;3)执行;4)写回。执行级对由在先前级(例如在上述步骤1))中所取出和解码的指令所标识并在另一先前级(例如在上述步骤2))中被取出的数据执行由在先前级(例如在上述步骤1))中取出和解码的指令所标识的特定操作。被操作的数据通常是从(通用)寄存器存储空间102中取出的。在该操作完成时所创建的新数据通常也被“写回”寄存器存储空间(例如在上述级4))。与执行级相关联的逻辑电路通常由多个“执行单元”或“功能单元”103_1至103_N构成,这些单元各自被设计成执行其自身的唯一操作子集(例如,第一功能单元执行整数数学操作,第二功能单元执行浮点指令,第三功能单元执行从高速缓存/存储器的加载操作和/或到高速缓存/存储器的存储操作等等)。由所有这些功能单元执行的所有操作的集合与处理核100所支持的“指令集”相对应。计算机科学领域中广泛认可两种类型的处 ...
【技术保护点】
一种用于指令处理的装置,包括:解码器,用于将第一指令解码成经解码的第一指令,并用于将第二指令解码成经解码的第二指令;以及执行单元,用于执行经解码的第一指令和经解码的第二指令,所述执行单元包括以下部件:i)输入寄存器空间,用于存储在执行所述经解码的第一指令时要复制的第一数据结构,并用于存储在执行所述经解码的第二指令时要复制的第二数据结构,所述第一数据结构和第二数据结构均为打包数据结构,所述第一打包数据结构的数据值的尺寸是所述第二打包数据结构的数据值的尺寸的两倍大;ii)复制逻辑电路,用于在执行所述经解码的第一指令时复制所述第一数据结构以创建第一复制数据结构,并用于在执行所述经解码的第二指令时复制所述第二数据结构以创建第二复制数据结构;以及iii)掩码逻辑电路,用于在第一粒度下对所述第一复制数据结构进行掩码操作,并在第二粒度下对所述第二复制数据结构进行掩码操作,所述第二粒度是所述第一粒度的一半。
【技术特征摘要】
1.一种用于指令处理的装置,包括:解码器,用于将第一指令解码成经解码的第一指令,并用于将第二指令解码成经解码的第二指令;以及执行单元,用于执行经解码的第一指令和经解码的第二指令,所述执行单元包括以下部件:i)输入寄存器空间,用于存储在执行所述经解码的第一指令时要复制的第一数据结构,并用于存储在执行所述经解码的第二指令时要复制的第二数据结构,所述第一数据结构和第二数据结构均为打包数据结构,所述第一打包数据结构的数据值的尺寸是所述第二打包数据结构的数据值的尺寸的两倍大;ii)复制逻辑电路,用于在执行所述经解码的第一指令时复制所述第一数据结构以创建第一复制数据结构,并用于在执行所述经解码的第二指令时复制所述第二数据结构以创建第二复制数据结构;以及iii)掩码逻辑电路,用于在第一粒度下对所述第一复制数据结构进行掩码操作,并在第二粒度下对所述第二复制数据结构进行掩码操作,所述第二粒度是所述第一粒度的一半。2.如权利要求1所述的装置,其特征在于,所述第一复制数据结构包括所述第一数据结构的四个副本。3.如权利要求1所述的装置,其特征在于,所述第一复制数据结构包括所述第一数据结构的两个副本。4.如权利要求1所述的装置,其特征在于,所述第二复制数据结构包括所述第二数据结构的八个副本。5.如权利要求1所述的装置,其特征在于,所述第二复制数据结构包括所述第二数据结构的四个副本。6.如权利要求1所述的装置,其特征在于,所述第二复制数据结构包括所述第二数据结构的两个副本。7.如权利要求1所述的装置,其特征在于,所述第一打包数据结构的所述数据值均是64位,且所述第二打包数据结构的所述数据值均是32位。8.一种用于处理指令的方法,包括:将第一指令解码为经解码的第一指令;取出用于所述第一指令的第一数据结构,所述第一数据结构是第一打包数据结构;通过以下方式来执行所述经解码的第一指令:在执行单元内复制所述第一数据结构以创建第一复制数据结构,并对所述第一复制数据结构进行掩码操作;将第二指令解码为经解码的第二指令;取出用于所述第二指令的第二数据结构,所述第二数据结构是第二打包数据结构,所述第一打包数据结构的数据值的尺寸是所述第二打包数据结构的数据值的尺寸的两倍大;以及通过以下方式来执行所述经解码的第二指令:在所述执行单元内复制所述第二数据结构以创建第二复制数据结构,并在对所述第一复制数据结构的所述掩码操作的一半粒度下对所述第二复制数据结构进行掩码操作。9.如权利要求8所述的方法,其特征在于,所述第一打包数据结构的数据值和所述第二打包数据结构的数据值是浮点数据值。10.如权利要求9所述的方法,其特征在于,所述第一打包数据结构的所述数据值是64位,且所述第二打包数据结构的所述数据值是32位。11.如权利要求8所述的方法,其特征在于,所述第一复制数据结构包含以下任一数量的所...
【专利技术属性】
技术研发人员:E·乌尔德阿迈德瓦尔,R·凡伦天,J·考博尔,B·L·托尔,M·J·查尼,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。