使用访问请求响应动态批处理组件的图形执行制造技术

技术编号：35258736 阅读：22 留言：0更新日期：2022-10-19 10:17

本发明专利技术公开了用于加速执行有向图的方法和系统。所述执行可以涉及从提供给人工神经网络的一组输入中生成推理。在具体的示例中，用于执行有向图的方法包括接收至少两批索引。当批量索引用于访问一组嵌入时，提供至少两批嵌入输出，并执行所述有向图的一层。所述方法还包括使用所述至少两批索引访问所述一组嵌入。所述方法还包括基于所述访问步骤的一组延迟，将所述至少两批嵌入输出重新排列到至少两批或重新排列的嵌入中。所述方法还包括向所述有向图的后续层提供所述至少两批重新排列的嵌入。入。入。

全部详细技术资料下载

【技术实现步骤摘要】
使用访问请求响应动态批处理组件的图形执行

[0001]本专利技术涉及与有向图的加速执行领域相关的方法和系统，尤其涉及使用访问请求响应动态批处理组件的图形执行。

技术介绍

[0002]最近机器智能系统性能的激增并不是因为革命性的新算法的发展。事实上，如今机器智能应用中使用的核心算法源于一系列已有半个多世纪历史的工作。相反，硬件和软件的改进以高效的方式实现了机器智能算法，这推动了最近机器智能系统性能的激增。曾经计算量过大，即使是最复杂的计算机也无法以有用的方式实现的算法，现在可以在单个用户的智能手机上用专门的硬件执行。硬件和软件的改进有多种形式。例如，传统上用于处理用于为计算机图形绘制多边形的向量的图形处理单元，已经以有效的方式重新调整用途，以操纵机器智能过程中使用的数据元素。作为另一个示例，某些类别的硬件从一开始就被设计出来，通过使用诸如脉动阵列之类的专用处理元件来实现机器智能算法。进一步的进展集中在使用晶体管和存储元件的集合，直接在硬件中模拟传统人工神经网络(ANN)中神经元的行为。毫无疑问，机器智能领域已经从这些改进中受益匪浅。然而，尽管人们对这些方法有着浓厚的兴趣，机器智能系统仍然代表着现代计算和能源密集型计算应用之一，并呈现出一个有待进一步发展的领域。
[0003]机器智能应用程序如此消耗资源的原因是，所操作的数据结构通常非常大，并且必须在每个数据结构上执行的离散原始计算的数量同样巨大。传统的人工神经网络接收输入向量，使用输入向量和一组权重向量进行计算，并生成输出向量。权重向量组中的每个权重向量通常被称...

【技术保护点】

【技术特征摘要】
1.一种用于执行有向图的方法，其中每个步骤由至少一个处理器执行，包括：接收至少两批索引，其中当用于访问一组嵌入时，所述至少两批索引：(i)提供至少两批嵌入输出，所述嵌入输出对应于所述至少两批索引；以及(ii)执行所述有向图的一层；使用所述至少两批索引访问所述一组嵌入；基于所述访问步骤的一组延迟，将所述至少两批嵌入输出重新排列为至少两批重新排列的嵌入输出；和向所述有向图的后续层提供所述至少两批重新排列的嵌入输出。2.根据权利要求1所述的方法，其中：所述一组嵌入的所述访问，使用所述至少两批索引执行所述有向图的所述一层的次数，等于所述至少两批索引中的批数；和执行所述向所述有向图的后续层提供所述至少两批重新排列的嵌入的次数是所述有向图执行次数的一部分。3.根据权利要求1所述的方法，其中：所述重新排列基于所述一组延迟，所述重新排列的嵌入输出是在访问所述一组嵌入输出中的单个条目时动态形成的。4.根据权利要求1所述的方法，其中：使用计算节点网络执行所述有向图；所述至少一个处理器包括所述计算节点网络中的至少一个计算节点；所述重新排列步骤由所述计算节点网络中的第一计算节点执行；所述访问步骤包括向所述第一计算节点提供所述重新排列的嵌入输出；所述访问步骤的所述一组延迟包括所述第一计算节点等待所述一组嵌入输出的一组时间；和所述重新排列基于所述一组延迟，所述重新排列的嵌入输出在所述一组嵌入输出中的单个条目提供给所述第一计算节点时动态形成。5.根据权利要求1所述的方法，其中：所述重新排列基于使用所述延迟的估计值的所述一组延迟；和所述延迟的所述估计值在所述访问所述一组嵌入步骤之前存储。6.根据权利要求1所述的方法，其中：所述有向图是深度学习推荐引擎；所述至少两批索引中的第一批包括至少两组用户特定的索引；所述有向图的所述后续层是所述深度学习推荐引擎中的神经网络层；所述至少两批重新排列的嵌入输出中的第二批包括至少两组用户特定的嵌入；和由第一批表示的第一组用户与由第二批表示的第二组用户不同。7.根据权利要求1所述的方法，其中：所述至少两批索引中的所述批次包括至少两组特定推理的索引；所述至少两批重新排列的嵌入输出中的所述批次包括至少两组特定推理的嵌入；和从所述至少两组特定推理的索引生成的第一组推理不等于从所述至少两组特定推理的嵌入输出生成的第二组推理。8.根据权利要求1所述的方法，还包括：
响应于所述向所述有向图的所述后续层提供至少两批重新排列的嵌入输出，从所述有向图的输出层接收至少两批推理；和基于所述至少两批索引的原始组成，将所述至少两批推理重新排列为至少两批重新排列的推理。9.根据权利要求1所述的方法，其中：使用计算节点网络执行所述有向图；所述计算节点网络包括第一计算节点和第二计算节点；在所述第一计算节点处接收所述至少两批索引；所述重新排列步骤由所述第一计算节点执行；和使用所述第一计算节点和所述第二计算节点执行所述一组嵌入的所述访问步骤。10.根据权利要求9所述的方法，其中：所述计算节点网络是多核处理器的片上网络；和所述计算节点网络中的计算节点是所述多核处理器的处理核心。11.根据权利要求10所述的方法，其中：所述第一计算节点是嵌入查找编排器核心；所述提供和接收步骤由所述第一计算节点使用所述片上网络执行；所述第二计算节点是存储与索引相关的嵌入输出的嵌入缓存核心。12.根据权利要求1所述的方法，还包括：响应于所述向所述有向图的所述后续层提供所述至少两批重新排列的嵌入输出，从所述有向图的输出层接收至少两批推理；其中，使用计算节点网络执行所述有向图；其中，在所述计算节点网络的第一计算节点处接收所述至少两批索引；其中，所述重新排列步骤和所...

【专利技术属性】
技术研发人员：L，
申请(专利权)人：滕斯托伦特股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人