用于单指令多数据处理器的高效硬件指令制造技术

技术编号：15022644 阅读：88 留言：0更新日期：2017-04-05 00:18

本申请涉及用于单指令多数据处理器的高效硬件指令。给出了用于在单指令多数据(“SIMD”)体系架构中高效处理各种格式的数据的方法和装置。具体而言，给出了在SIMD体系架构中将位流中固定宽度的位值解包成固定宽度字节流的方法。给出了在SIMD体系架构中解包字节流中可变长度字节的打包值的方法。给出了在SIMD体系架构中解压运行长度编码的压缩位向量的方法。给出了在SIMD体系架构中返回位向量中被设置为一的每一位的偏移量的方法。给出了在SIMD体系架构中相对于基数在指定的偏移量从位向量读取位的方法。给出了比较存储在两个SIMD寄存器中的值的方法。

全部详细技术资料下载

【技术实现步骤摘要】
本申请是申请日为2014年3月12日申请号为201480026982.X(国际申请号：PCT/US2014/024523)专利技术名称为“用于单指令多数据处理器的高效硬件指令”的专利技术专利申请的分案申请。
本专利技术涉及单指令多数据指令，并且更具体而言涉及用于单指令多数据处理器的高效硬件指令。
技术介绍
数据格式被设计为启用各种不同数据集特性的高效处理和存储。处理这些格式的数据的算法是关键的。不幸的是，当前的处理器不是总能高效地对特定数据格式工作。处理器设计者在历史上提供了对特定于应用的指令的最小直接支持。因此，软件开发者依靠增加现有处理器执行指令集的速度来提高特定算法的性能。但是，典型处理单元的性能不以相同的速率增加。因此，软件开发者不能够同样多地依靠增加计算机能力来更快地处理特定的数据格式。单指令多数据(“SIMD”)处理器同时对多个数据项执行相同的操作。通过对多个寄存器或子寄存器中的数据执行单条指令，SIMD处理器利用数据级并行化。因此，每条指令的吞吐量可以相应增加。SIMD处理器通常被用于图形和其它多媒体应用。相应地，可能难以使用SIMD体系架构来高效地处理特定的数据格式。本节中所描述的方法是可以推行的方法，但不一定是先前已经构想或推行的方法。因此，除非另外指出，否则不应当由于仅仅它们被包含在本节中就假设在本节中描述的任何方法有资格作为现有技术。术语和记号为了解释，以下术语和惯例在...

【技术保护点】
一种处理器，被配置为：将位向量加载到驻留在所述处理器中的第一寄存器中；将运行长度值向量中的每个运行长度值加载到驻留在所述处理器中的SIMD寄存器中的一系列子寄存器的对应子寄存器中；通过将所述位向量中的位解压缩到所述处理器中的第二寄存器中来对一条或多条指令进行响应；其中所述位向量中的位是连续的；其中，所述运行长度值向量中的运行长度值是连续的；其中，解压缩所述位向量中的位包括：针对所述一系列子寄存器中的所述运行长度值向量中的一个或多个运行长度值，根据所述运行长度值将第一寄存器中的所述位向量中的所述对应位拷贝到第二寄存器中，以使得所述对应位的拷贝如所述运行长度值指示的那样被连续地存储在第二寄存器中。

【技术特征摘要】
2013.03.15 US 61/801,207;2013.09.10 US 14/023,265;1.一种处理器，被配置为：
将位向量加载到驻留在所述处理器中的第一寄存器中；
将运行长度值向量中的每个运行长度值加载到驻留在所述处理器中的SIMD寄存器中
的一系列子寄存器的对应子寄存器中；
通过将所述位向量中的位解压缩到所述处理器中的第二寄存器中来对一条或多条指
令进行响应；
其中所述位向量中的位是连续的；
其中，所述运行长度值向量中的运行长度值是连续的；
其中，解压缩所述位向量中的位包括：
针对所述一系列子寄存器中的所述运行长度值向量中的一个或多个运行长度值，根据
所述运行长度值将第一寄存器中的所述位向量中的所述对应位拷贝到第二寄存器中，以使
得所述对应位的拷贝如所述运行长度值指示的那样被连续地存储在第二寄存器中。
2.如权利要求1所述的处理器，其中：
所述第一寄存器的宽度不足以保持所述位向量中的全部解压缩的位；以及
所述处理器还被配置为通过以下来对所述一条或多条指令作出响应：
在检测到所述SIMD寄存器是满的时，将第一寄存器中的位存储在存储器中；以及
继续将来自第二寄存器中的所述位向量的位拷贝到第一寄存器中。
3.如权利要求1所述的处理器，其中所述处理器还被配置为通过将第一寄存器中除了
存储解压缩的值的位之外的所有位设置为0来对所述一条或多条指令作出响应。
4.如权利要求1所述的处理器，其中所述一条或多条指令是单条指令。
5.如权利要求4所述的处理器，其中所述单条指令在一个循环中被执行。
6.一种处理器：
其中运行长度值向量中的每个运行长度值代表位向量中的每位应当分别被解压缩成
多少位；
其中所述位向量中的位被连续地存储在存储器中；
其中，所述运行长度值向量中的值被连续地存储在存储器中；
其中，结果被存储在存储器中；
其中，所述处理器被配置为响应于一条或多条指令：
将所述位向量中的位的集合从存储器拷贝到第一寄存器中；以及
将所述运行长度值向量中特定数目的运行长度值从存储器拷贝到SIMD寄存器中的一
系列子寄存器中，其中每个运行长度值被拷贝到所述一系列子寄存器中的不同子寄存器
中；
其中，所述位的集合中的每一位在所述一系列子寄存器中的一子寄存器中具有对应的
运行长度值；
解压缩每一位，以使得每一位的拷贝如所述一系列子寄存器中的所述子寄存器中的所
述对应的运行长度值所指示的那样被连续地存储在第二寄存器中。
7.如权利要求6所述的处理器，其中，结果被连续地存储在存储器中。
8.如权利要求6所述的处理器，其中，存储器是位于包括在处理器中的芯片上的高速缓
存存储器。
9.如权利要求6所述的处理器，其中所述一条或多条指令是单条指令。...

【专利技术属性】
技术研发人员：A·加内什，S·K·查万，V·玛瓦，J·卡姆普，A·C·帕蒂哈克，M·J·格尔森，A·L·霍利维，R·麦克尼科尔，
申请(专利权)人：甲骨文国际公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人