用于阵列处理器的数据推测制造技术

技术编号：14050172 阅读：83 留言：0更新日期：2016-11-24 04:26

公开了一种利用阵列处理器的多个算术逻辑单元(ALU)的方法。确定调度第一数量的ALU以在给定处理周期期间执行函数，每个ALU被调度为使用多个所选输入向量中的相应一个作为输入。还确定不调度第二数量的ALU用于在给定处理周期期间使用。确定与多个所选输入向量不同的多个预测的未来输入向量。调度第二数量的ALU以使用多个预测的未来输入向量中的相应预测的未来输入向量作为输入在给定处理周期期间执行函数。在完成处理周期之后，缓存从第一数量的ALU和第二数量的ALU接收的函数输出。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本公开涉及数据推测(speculation)，并且更具体地涉及在处理周期期间结合推测性输入数据利用计算装置的未调度算术逻辑单元(ALU)。
技术介绍
术语“单指令多线程”是指相同处理代码在许多线程(每个线程中具有不同输入数据)中的同时执行。SIMT技术已经被用于阵列处理器，阵列处理器被专门设计为对许多输入重复地执行类似操作。例如，现代图形处理单元(GPU)阵列处理器包括数百或数千个算术逻辑单元(ALU)，ALU均能够使用输入向量来计算函数。通过将不同输入向量馈送到不同ALU，可以通过许多输入在一个处理周期内多次计算给定函数。随着GPU继续变得更强大，计算机科学家已经开始使用GPU，GPU通常处理仅针对计算机图形的计算，以在传统上由CPU处理的应用中执行计算。该技术被称为“通用计算图形处理单元”(GPGPU)。然而，在给定处理周期期间，不能利用许多可用ALU。
技术实现思路
根据本公开的一方面，公开了一种利用阵列处理器的多个算术逻辑单元(ALU)的方法。确定调度第一数量的ALU以在给定处理周期期间执行函数，每个ALU被调度2002-158d为使用多个所选输入向量中的相应一个作为输入。还确定不调度第二数量的ALU用于在给定处理周期期间使用。确定与多个所选输入向量不同的多个预测的未来输入向量。调度第二数量的ALU以使用多个预测的未来输入向量中的相应预测的未来输入向量作为输入在给定处理周期期间执行所述函数。在完成处理周期之后，缓存从第一数量的ALU和第二数量的ALU接收的函数输出。根据本公开的另一方面，公开了一种计算装置，该计算装置的特征在于：包括多个算术逻辑单元(...
<a href="http://www.xjishu.com/zhuanli/55/201480077852.html" title="用于阵列处理器的数据推测原文来自X技术">用于阵列处理器的数据推测</a>

【技术保护点】
一种利用阵列处理器的多个算术逻辑单元(ALU)的方法，所述方法的特征在于：确定调度第一数量的所述ALU以在给定处理周期期间执行函数，每个ALU被调度为使用多个所选输入向量中的相应一个作为输入；确定不调度第二数量的所述ALU用于在所述给定处理周期期间使用；确定与所述多个所选输入向量不同的多个预测的未来输入向量；调度所述第二数量的ALU以使用所述多个预测的未来输入向量中的相应预测的未来输入向量作为输入在所述给定处理周期期间执行所述函数；以及在完成所述处理周期之后，缓存从所述第一数量的ALU和第二数量的ALU接收的函数输出。

【技术特征摘要】
【国外来华专利技术】1.一种利用阵列处理器的多个算术逻辑单元(ALU)的方法，所述方法的特征在于：确定调度第一数量的所述ALU以在给定处理周期期间执行函数，每个ALU被调度为使用多个所选输入向量中的相应一个作为输入；确定不调度第二数量的所述ALU用于在所述给定处理周期期间使用；确定与所述多个所选输入向量不同的多个预测的未来输入向量；调度所述第二数量的ALU以使用所述多个预测的未来输入向量中的相应预测的未来输入向量作为输入在所述给定处理周期期间执行所述函数；以及在完成所述处理周期之后，缓存从所述第一数量的ALU和第二数量的ALU接收的函数输出。2.根据权利要求1所述的方法，其中，所述确定所述多个预测的未来输入向量的特征在于：选择在一个或更多个先前处理周期内已被用作针对所述函数的输入的一个或更多个先前输入向量；以及将一个或更多个遗传算法应用至所述一个或更多个先前输入向量，以确定所述多个预测的未来输入向量的至少一部分。3.根据权利要求2所述的方法，所述方法的特征还在于：每当所述输入向量被选择作为针对所述函数的输入时，使针对给定输入向量的适合度得分递增；其中，基于所述先前输入值的所述适合度得分来执行所述选择在一个或更多个先前处理周期内已被用作针对所述函数的输入的一个或更多个先前输入向量。4.根据权利要求2所述的方法：其中，将一个或更多个遗传算法应用至所述一个或更多个先前输入向量的特征在于：对两个先前输入向量执行遗传交叉以确定两个不同的新输入向量。5.根据权利要求4所述的方法，所述方法的特征还在于：将变异算子应用至所述新输入向量中的一个或两个中的一个或更多个元素。6.根据权利要求5所述的方法，其中，所述变异算子包括以下中的一个：用随机值替换输入向量的元素的值，对输入向量的元素的值求反，使输入向量的元素的值增加预定义量，以及使输入向量的元素的值减小预定义量。7.根据权利要求1所述的方法：其中，所选输入向量是较大输入向量集合的一部分；以及其中，确定与所述多个所选输入向量不同的所述多个预测的未来输入向量的特征在于：从尚未用作到所述函数的输入的输入向量集合随机地选择输入向量作为所述预测的输入向量。8.一种计算装置，所述计算装置的特征在于：阵列处理器，所述阵列处理器包括多个算术逻辑单元(ALU)；以及处理电路，所述处理电路被构造...

【专利技术属性】
技术研发人员：J·拉斯穆松，H·琼森，J·古斯塔夫森，A·伊斯贝里，
申请(专利权)人：索尼公司，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人