向量化方法、系统及处理器技术方案

技术编号：11861360 阅读：129 留言：0更新日期：2015-08-12 11:24

在实施例中，一种向量化被瓦解的多嵌套循环的方法包括：在处理器的向量单元中执行被瓦解的循环以获得偏移向量，包括针对多次迭代中的每一个，将标量偏移计算到多维数据结构中，将所述标量偏移存储在第一向量寄存器的数据元素中，并更新多维循环计数器向量的循环计数器值。继而，使用来自所述偏移向量的基础值和索引从所述多维数据结构装载多个数据元素，对所装置的多个数据元素执行至少一个计算以获得多个结果，并使用来自所述偏移向量的所述基础值和所述索引将所述多个结果存储到所述多维数据结构中。描述和请求保护了其他实施例。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本公开通常涉及计算平台，更具体地说，本公开涉及循环瓦解（loop collapsing) 方法、装置和指令以及循环向量化方法。
技术介绍
例如，在高性能计算（HPC)编码中，例如二到五次的嵌套循环是非常常见的。循环瓦解通过减小分支的数目并因而减小分支错误预测的概率来改善性能。瓦解多嵌套循环的传统方式是创建没有嵌套的、由在瓦解的循环的每一次迭代上递增的新循环计数器控制的循环。新循环计数器总共递增次，其中t Cj是对ij进行循环的循环计数。然而，关于单个循环计数器的信息需要被保存用于循环内部的计算以及用作访问多维阵列的索引。并且，在一些情况下，尽管循环瓦解可以改善性能，但是当前的编译器很少能够有效地瓦解循环。阻止瓦解的一些最常见的原因包括：在η维阵列A中的非步长（stride)存储器存取（在瓦解之后）；存在对子维阵列B(m维，m<n)的访问；以及存在对单独的循环计数器（ij)的计算。【附图说明】图1是根据本专利技术实施例的处理器管线的框图。图2A和2B是根据本专利技术实施例的比较标量对向量操作的框图。图3A是根据本专利技术一个实施例的多维循环计数器向量和相关联的掩码的框图。图3B是根据本专利技术实施例与循环计数器更新指令相关联的值的框图。图4是根据本专利技术实施例的方法的流程图。图5是根据本专利技术实施例的向量执行单元的一部分的框图。图5A是根据本专利技术实施例的向量化代码段的方法的流程图。图5B是根据本专利技术另一实施例的方法的流程图。图6A是根据本专利技术实施例的示例性AVX指令格式的说明。图6B是...
<a href="http://www.xjishu.com/zhuanli/55/CN104838357.html" title="向量化方法、系统及处理器原文来自X技术">向量化方法、系统及处理器</a>

【技术保护点】
一种处理器，包括：执行模块，其包括向量单元和标量单元，其中，所述向量单元用于执行由多个循环形成的被瓦解的循环以获得偏移向量，其中，所述向量单元用于针对多次迭代的每一个，计算在多维数据结构中的标量偏移，将所述标量偏移存储在第一向量寄存器的数据元素中，并更新多维循环计数器向量的至少一个循环计数器值，并且之后用于使用来自所述偏移向量的基础值和索引从所述多维数据结构中装载多个数据元素，对所装载的多个数据元素执行至少一个计算以获得多个结果，并使用来自所述偏移向量的所述基础值和所述索引将所述多个结果存储到所述多维数据结构中。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员：M·普洛特尼科夫，A·纳赖金，E·乌尔德艾哈迈德瓦勒，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人