【技术实现步骤摘要】
【国外来华专利技术】为神经网络生成并行计算方案
[0001]本专利技术大体上涉及神经网络和分布式并行计算
具体地,本专利技术的一些实施例涉及为神经网络生成并行计算方案。
技术介绍
[0002]神经网络或其他机器学习工具能够为各种类型的应用实现任务自动化。示例性应用包括文本数据、语音数据、图像数据或视频数据等的分析和处理。然而,即使神经网络为任务自动化提供了一个强大的工具,但复杂神经网络的处理可能较慢,甚至在所有设备中都不可行。
技术实现思路
[0003]提供本
技术实现思路
是为了以简化的形式引入概念的选择,这些概念将在以下具体实现方式中进行进一步的描述。本
技术实现思路
的目的不在于识别权利要求书保护的主题的关键特征或必要特征,也不在于限制权利要求书保护的主题的范围。
[0004]本专利技术的目的在于为神经网络提供一种高效且确定性的并行计算方案生成方法。上述和其他目的可以通过独立权利要求的特征来实现。进一步的实现方式在从属权利要求、具体说明和附图中显而易见。
[0005]第一方面,提供了一种用于确定神经网络的并 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于确定神经网络的并行计算方案的设备,其特征在于,用于:接收所述神经网络的计算图;将所述计算图变换为包括多个递归子图的递归数据流图,其中,每个递归子图是另一递归子图和算子节点的元组或者空图;基于并行计算设备的数量确定切分递归的次数;对于每次切分递归,确定与所述数据流图相关联的多个算子节点对应的多个成本;基于所述多个成本的从高到低的顺序,确定所述多个递归子图的处理顺序;按照所述确定的处理顺序处理所述多个递归子图,其中,处理递归子图包括:为与所述递归子图的算子节点相关联的张量选择切分轴;以及输出切分方案,其中,所述切分方案包括与所述多个算子节点相关联的每个张量的切分轴。2.根据权利要求1所述的设备,其特征在于,所述设备还用于:确定所述切分递归的次数,使得2
N
等于所述并行计算设备的数量,其中,N为所述切分递归的次数。3.根据权利要求1或2所述的设备,其特征在于,所述设备还用于:基于所述并行计算设备之间要为每个算子节点传输的数据量,确定所述多个算子节点对应的所述多个成本。4.根据前述任一权利要求所述的设备,其特征在于,所述设备还用于:基于算子内通信成本,为与所述算子节点相关联的所述张量选择所述切分轴,其中,所述算子内通信成本包括所述并行计算设备之间要为所述算子节点传输的数据量。5.根据权利要求4所述的设备,其特征在于,所述设备还用于:如果在当前切分递归中没有为相邻算子节点确定切分轴,则基于所述算子内通信成本,为与所述算子节点相关联的所述张量选择所述切分轴。6.根据权利要求1至4中任一项所述的设备,其特征在于,所述设备还用于:基于算子间通信成本,为与所述算子节点相关联的所述张量选择所述切分轴,其中,所述算子间通信成本包括所述并行计算设备之间基于所述算子节点与相邻算子节点间的共享张量执行所述相邻算子节点或者基于相邻算子节点的输出执行所述算子节点所要传输的数据量。7.根据权利要求4和6所述的设备,其特征在于,所述设备还用于:如果在所述当前切分递归中为所述相邻算子节点或另一相邻算子节点确定了至少一个切分轴,则基于所述算子内通信成本和所述算子间通信成本,为与所述算子节点相关联的所述张量选择所述切分轴。8.根据前述任一权利要求所述的设备,其特征在于,所述设备还用于:判断所述切分方案是否符合与所述并行计算设备相关联的至少一个内存需求;以及如果确定所述切分方案符合与所述并行计算设备相关联的所述至少一个内存需求,则输出所述切分方案。9.一种用于确定神经网络的并行计算方案的方法,其特征在于,所述方法包括:接收所述神经网络的计算图;
将所述计算图变换为包括多个递归子图的递归...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。