循环向量化方法和设备技术

技术编号：17345919 阅读：25 留言：0更新日期：2018-02-25 10:54

公开了循环向量化方法和设备。示例方法包含通过评估循环条件来生成循环迭代的集合的第一控制掩码，其中生成第一控制掩码包含：当条件指示循环操作要被执行时将控制掩码的位设置成第一值，而当条件指示循环操作要被绕过时将第一控制掩码的位设置成第二值。示例方法还包含根据第一控制掩码压缩对应于循环迭代的第一集合的索引。

全部详细技术资料下载

【技术实现步骤摘要】
循环向量化方法和设备
本公开一般涉及计算平台，并且更具体地说，涉及循环向量化方法和设备。
技术介绍
一些计算平台试图通过根据向量化技术转变代码来改进机器级代码执行。例如，对应于迭代循环的原始代码可被转换成向量化代码，以更好地利用计算平台的资源。附图说明图1是表示示例循环的伪代码。图2是表示用于向量化图1示例的已知技术的伪代码。图3是按照此公开的教导构造的示例循环向量化器的框图。图4-6图示了与图3的示例循环向量化器关联的示例数据寄存器和示例阵列的示例内容。图7是表示可执行以实现图3的示例循环向量化器的示例机器可读指令的流程图。图8是表示由图3的示例循环向量化器生成的图1的循环的示例向量化的伪代码。图9是按照此公开的教导构造的示例循环向量化器的框图。图10是表示可执行以实现图9的示例循环向量化器的示例机器可读指令的流程图。图11是表示由图9的示例循环向量化器生成的图1的循环的示例向量化的伪代码。图12是能够执行图7的示例机器可读指令以实现图3的示例循环向量化器和/或图10的示例机器可读指令以实现图9的示例循环向量化器的示例处理系统的框图。具体实施方式要由处理器编译和执行的原始代码可包含一个或多个迭代循环。在此类实例中，数据被加载到一个或多个寄存器中，一个或多个操作在数据上执行，并且作为结果的信息存储在存储器中。计算平台可经由循环向量化改进原始代码的机器级执行。具体地说，通过对循环进行向量化使得同时执行循环的多个迭代可基本上减少循环的执行时间。循环迭代基本上同时执行被称为并行执行。循环向量化包含将循环的多个迭代的数据加载到单个向量中(例如经由向量寄存器实现的)...
循环向量化方法和设备

【技术保护点】
一种方法，包括：通过评估循环条件来生成所述循环的迭代的第一集合的第一控制掩码，其中生成所述第一控制掩码包括：当所述条件指示所述循环的操作要被执行时将所述第一控制掩码的位设置成第一值；以及当所述条件指示所述循环的所述操作要被绕过时将所述第一控制掩码的所述位设置成第二值；以及通过以下步骤用处理器根据所述第一控制掩码压缩对应于所述循环的迭代的所述第一集合的索引：当与所述第一索引关联的所述第一控制掩码的第一位具有所述第一值时，保持所述索引中的第一索引；以及当与所述第二索引关联的所述第一控制掩码的第二位具有所述第二值时，在执行所述操作之前，丢弃所述索引中的第二索引。

【技术特征摘要】
1.一种方法，包括：通过评估循环条件来生成所述循环的迭代的第一集合的第一控制掩码，其中生成所述第一控制掩码包括：当所述条件指示所述循环的操作要被执行时将所述第一控制掩码的位设置成第一值；以及当所述条件指示所述循环的所述操作要被绕过时将所述第一控制掩码的所述位设置成第二值；以及通过以下步骤用处理器根据所述第一控制掩码压缩对应于所述循环的迭代的所述第一集合的索引：当与所述第一索引关联的所述第一控制掩码的第一位具有所述第一值时，保持所述索引中的第一索引；以及当与所述第二索引关联的所述第一控制掩码的第二位具有所述第二值时，在执行所述操作之前，丢弃所述索引中的第二索引。2.如权利要求1所述的方法，进一步包括：压缩对应于所述索引的数据元素，其中所述索引指示对于所述数据元素的相应数据元素所述操作的结果要存储在哪些存储器位置。3.如权利要求2所述的方法，进一步包括：将所述数据元素加载到第一寄存器中；以及将对应于所述循环迭代的所述第一集合的所述索引加载到第二寄存器中。4.如权利要求1所述的方法，进一步包括：用所述压缩的索引填充阵列，所述循环的操作要在对应于所述阵列的所述压缩索引的数据元素上执行。5.如权利要求4所述的方法，进一步包括：当已经被输入到所述阵列中的索引数量满足阈值时，将对应于所述阵列的所述索引的量的所述数据元素加载到要在其上执行所述操作的寄存器中。6.如权利要求5所述的方法，进一步包括：当已经被输入所述阵列中的索引数量不满足所述阈值时，...

【专利技术属性】
技术研发人员：CJ休斯，M普罗特尼科夫，A纳赖金，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人