【技术实现步骤摘要】
【国外来华专利技术】重塑和广播优化以避免不必要的数据移动
技术介绍
[0001]TensorFlow库可以用于创建机器学习模型,例如,递归神经网络(“RNN”)模型、卷积神经网络(“CNN”)模型、前馈神经网络模型和随机森林模型。(TensorFlow在Abadi等人的如下文献中进行了描述:《TensorFlow:用于大规模设计和实现的系统》(OSDI
’
16),第265
‑
283页,2016年11月2
‑
4日。该软件可从https://tensorflow.org获得)
[0002]TensorFlow库可以用于将机器学习模型表示为TensorFlow图。TensorFlow图中的每个节点表示一操作。TensorFlow图中的每条边是有向的,并且表示流入或流出该边所连接的节点的数据流。数据采用零维或多维张量的形式,其中每个元素具有相同的数据类型,例如,32位整数、双长度浮点数或字符串。张量由在外部有成对括号“[]”的向量表示。例如,3个元素的一维(1D)张量(又称为向量)会被表示为[1,2,3]。零维张量是 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种由一个或多个计算机执行的方法,所述方法包括:检测张量上的计算操作图形中的操作的原始模式,其中操作的所述原始模式返回最终输出张量并且将输入张量作为输入,其中所述原始模式包括原始重塑操作,所述原始重塑操作(i)返回原始张量并且(ii)可以被变换以使用更少存储;利用返回小于所述原始张量的张量的一个或多个重塑操作,将操作的所述原始模式变换成操作的新模式;以及生成特定于目标硬件平台并实现由操作的所述新模式表示的计算的可执行代码。2.根据权利要求1所述的方法,还包括:向所述目标硬件平台部署所生成的代码用于执行。3.根据权利要求1或2中任一项所述的方法,其中:操作的原始重塑模式需要数据被移动,以满足所述目标硬件平台上对于向量指令或向量存储的对齐要求。4.根据任一前述权利要求所述的方法,其中,变换操作的所述原始模式包括:确定由操作的所述原始模式返回的所述最终输出张量的最终输出维度;沿着既不在所述最终输出张量中也不影响所述原始重塑操作的重塑的所述输入张量的维度来进行归约,以返回第一中间结果张量;重塑所述第一中间结果张量以返回第二中间结果张量;以及沿着不在来自操作的所述原始模式的所述最终输出张量的维度中的任何维度来归约所述第二中间结果张量。5.一个或多个用指令编码的非暂时性计算机可读存储介质,当所述指令由一个或多个计算机执行时,使所述一个或多个计算机执行动作,所述动作包括:检测张量上的计算操作图形中的操作的原始模式,其中操作的所述原始模式返回最终输出张量并且将输入张量作为输入,其中所述原始模式包括原始重塑操作,所述原始重塑操作(i)返回原始张量并且(ii)可以被变换以使用更少存储;利用返回小于所述原始张量的张量的一个或多个重塑操作,将操作的所述原始模式变换成操作的新模式;以及生成特定于目标硬件平台并实现由操作的所述新模式表示的计算的可执行代码。6.根据权利要求5所述的非暂时性计算机可读存储介质,其中,所述动作还包括:向所述目标硬件平台部署所生成的代码用于执行。7.根据权利要求5或6中任一项所述的非暂时性计算机可读存...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。