【技术实现步骤摘要】
【国外来华专利技术】基于先前的简化图执行的条件性图执行相关申请的交叉引用本申请要求于2018年4月4日提交的美国专利申请号15/945,454和于2017年4月7日提交的美国临时专利申请号62/483,133的权益,出于所有目的这两个申请通过引用整体结合于此。
XXX
技术介绍
机器智能系统性能的最近的激增不是由于革命性新算法的发展。事实上,今天机器智能应用中使用的核心算法源于如今有半个多世纪历史的大量工作。相反,正是硬件和软件方面的改进以高效的方式实施了机器智能算法,这推动了最近的激增。曾经在计算方面过于密集而甚至无法利用最复杂的计算机来实施的算法现在可以利用单个用户的智能手机上的专用硬件来执行。硬件和软件方面的改进采取了各种形式。例如,传统地处理用于为计算机图形渲染多边形的向量的图形处理单元已经以高效的方式被重新利用,来操纵机器智能处理中使用的数据元素。作为另一示例,某些类别的硬件已经被从头开始设计,以通过使用诸如脉动型(systolic)阵列的专门处理元件来实施机器智能算法。进一步的进展集中于使用晶体管和存储器元件的集合来直接在硬件中模拟传统人工神经网络(artificialneuralnetwork,ANN)中的神经元的行为。毫无疑问,机器智能领域已从这些改进中大大受益。然而,尽管对这些方法有着浓厚的兴趣,但机器智能系统仍然代表当今最有计算力和能量密集的计算应用之一,并且呈现了准备着进一步发展领域。机器智能应用如此渴求资源的原因是,对其进行操作的数据结构通常非常大,并且必须在数据结构中的每一个上执行的离散 ...
【技术保护点】
1.一种用于执行有向图的计算机实施的方法,其中每个步骤由处理器执行,所述方法包括:/n导出所述有向图的简化版本;/n将先导输入张量应用于所述有向图的简化版本;/n在将所述先导输入张量应用于所述有向图的简化版本期间获得执行数据的集合;/n将实时输入张量应用于所述有向图;/n在将所述实时输入张量应用于所述有向图期间,使用所述执行数据的集合来条件化所述有向图的执行;以及/n从所述有向图的条件性执行中获得输出张量。/n
【技术特征摘要】
【国外来华专利技术】20170407 US 62/483,133;20180404 US 15/945,4541.一种用于执行有向图的计算机实施的方法,其中每个步骤由处理器执行,所述方法包括:
导出所述有向图的简化版本;
将先导输入张量应用于所述有向图的简化版本;
在将所述先导输入张量应用于所述有向图的简化版本期间获得执行数据的集合;
将实时输入张量应用于所述有向图;
在将所述实时输入张量应用于所述有向图期间,使用所述执行数据的集合来条件化所述有向图的执行;以及
从所述有向图的条件性执行中获得输出张量。
2.根据权利要求1所述的计算机实施的方法,其中:
所述先导输入张量和所述实时输入张量不相同;以及
所述先导输入张量和所述实时输入张量随机相关。
3.根据权利要求1所述的计算机实施的方法,还包括:
将所述执行数据存储在存储器中作为存储的执行数据;以及
使用所述存储的执行数据,在所述有向图的条件性执行之前将所述有向图准备好用于所述条件性执行。
4.根据权利要求1所述的计算机实施的方法,其中:
所述有向图包括一组顶点和互连所述一组顶点的一组边;
所述有向图是神经网络;
有向图的所述一组边是涉及所述神经网络的一组权重的计算,其中所述一组权重包括至少一个权重张量;
所述一组顶点的至少一个子集是所述神经网络的权重;
所述有向图的条件性执行产生推理张量;以及
所述推理张量是所述神经网络对所述实时输入张量的响应。
5.根据权利要求4所述的计算机实施的方法,其中:
所述一组边中的边是使用四维张量的计算。
6.根据权利要求4所述的计算机实施的方法,其中:
所述有向图的简化版本的导出包括以采样因子对所述有向图进行下采样;
所述有向图的简化版本因此是所述有向图的下采样版本;
用于执行所述有向图的简化版本的第一完整组张量具有秩;以及
用于执行所述有向图的第二完整组张量具有所述秩。
7.根据权利要求6所述的计算机实施的方法,其中:
所述有向图的下采样利用多项式插值法。
8.根据权利要求4所述的计算机实施的方法,其中:
所述有向图的简化版本的导出包括利用一组替换值替换所述一组权重的一组原始值;以及
所述有向图的简化版本具有与所述有向图相同数量的层。
9.根据权利要求8所述的计算机实施的方法,其中所述替换包括以下之一:
减少用于表示所述一组原始值的比特数,以获得所述一组替换值;以及
使用所述一组原始值的一组指数计算所述一组替换值。
10.根据权利要求4所述的计算机实施的方法,其中:
所述执行数据的集合包括一组执行数据值;
所述一组执行数据值和所述一组顶点具有唯一相对应的元素;
所述一组顶点中的每个唯一相对应的顶点响应于所述先导输入张量产生对所述推理张量的贡献;以及
所述一组执行数据值中的每个执行数据值在量级方面与所述一组顶点中的每个唯一相对应的顶点对所述推理张量的贡献成比例。
11.根据权利要求4所述的计算机实施的方法,还包括:
将所述执行数据存储在分布式的一组存储器位置中;
使用单个地址从所述分布式的一组存储器位置中的存储器位置获得以下两者:(i)来自所述执行数据的执行数据的子集;和(ii)来自所述一组权重的权重张量;以及
其中,使用所述执行数据和所述一组权重实时进行所述有向图的执行的条件化。
12.根据权利要求4所述的计算机实施的方法,还包括:
使用所述执行数据的集合生成所述有向图的标记;
将所述标记存储在分布式的一组存储器位置中;以及
使用所述标记来条件化所述一组权重的更新。
13.根据权利要求4所述的计算机实施的方法,还包括:
使用所述执行数据的集合生成所述有向图的标记;
其中,所述标记标识权重张量的优先级值;以及
其中,所述有向图的执行的条件化使用所述标记。
14.根据权利要求13所述的计算机实施的方法,还包括:
将所述标记存储在分布式的一组存储器位置中;以及
使用单个地址从所述分布式的一组存储器位置中的存储器位置获得所述优先级值和所述权重张量。
15.根据权利要求13所述的计算机实施的方...
【专利技术属性】
技术研发人员:L巴吉克,M特拉杰科维奇,I哈默,
申请(专利权)人:滕斯托伦特股份有限公司,
类型:发明
国别省市:加拿大;CA
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。