数据并行化处理方法、系统、设备及存储介质技术方案

技术编号：24124955 阅读：19 留言：0更新日期：2020-05-13 04:17

本发明专利技术公开了一种数据并行化处理方法、系统、设备及存储介质。其中，所述方法包括：将所述具有逻辑关系的至少三个第一计算节点定义为第一并行节点组，第一并行节点组包括第一前节点和至少两个第一后节点；获取第一前节点的第一输入数据模型并生成第一前节点的第一输入张量；根据第一输入数据模型和第一输入张量计算第一前节点的第一输出张量；获取至少两个第一后节点的第二输入数据模型并将第一输出张量作为第二输入张量；根据第二输入数据模型和第二输入张量分别计算至少两个第一后节点的第二输出张量，得到第一并行节点组的第一计算结果。本发明专利技术通过多个输入的图推理重叠运行，实现了充分利用CPU和运算卡资源的技术效果。

全部详细技术资料下载

【技术实现步骤摘要】
数据并行化处理方法、系统、设备及存储介质
本专利技术实施例涉及网络拓扑图推理
，尤其涉及一种数据并行化处理方法、系统、设备及存储介质。
技术介绍
深度学习网络通常由算法训练得来。多数情况下，算法开发人员倾向于使用已有的公开深度学习框架进行模型训练，而大部分公开深度学习框架是针对于中央处理器/图形处理器(CentralProcessingUnit/GraphicsProcessingUnit，CPU/GPU)这类计算设备设计的。CPU/GPU采用传统的指令集架构，架构效率较低，灵活性较高。随着深度学习相关技术的发展，对于计算能力的要求越来越高。相关技术中的指令集的架构效率缺陷已经不能满足应用场景的需求。对比而言，数据流架构效率更高，从技术路线来看更加适合深度学习技术的发展趋势。然而，数据流芯片只适用于深度学习算子，正常使用仍然需要CPU协助进行数据传输和处理。运行过程中，将处理好的数据从内存中搬运到片上内存中，等待运算卡运行完成之后将结果拿回，进行后处理，完成整个图推理过程。相关技术中采用的图推理方法多是单线程运行带有异步计算，而这种图推理方法容易导致不能充分利用CPU和运算卡的运算资源。
技术实现思路
本专利技术提供一种数据并行化处理方法、系统、设备及存储介质，以实现针对多个输入的图推理可以重叠运行，从而充分利用CPU和运算卡的资源的技术效果。第一方面，本专利技术实施例提供了一种数据并行化处理方法，包括：从多个第一计算节点中确认具有逻辑关系的至少三个第一计算节...

【技术保护点】
1.一种数据并行化处理方法，其特征在于，包括：/n从多个第一计算节点中确认具有逻辑关系的至少三个第一计算节点，将所述具有逻辑关系的至少三个第一计算节点定义为第一并行节点组，所述第一并行节点组包括第一前节点和至少两个第一后节点；/n获取所述第一前节点的第一输入数据模型并生成所述第一前节点的第一输入张量；/n根据所述第一输入数据模型和所述第一输入张量计算所述第一前节点的第一输出张量；/n获取所述至少两个第一后节点的第二输入数据模型并将所述第一输出张量作为第二输入张量；/n根据所述第二输入数据模型和所述第二输入张量分别计算所述至少两个第一后节点的第二输出张量，得到所述第一并行节点组的第一计算结果。/n

【技术特征摘要】
1.一种数据并行化处理方法，其特征在于，包括：
从多个第一计算节点中确认具有逻辑关系的至少三个第一计算节点，将所述具有逻辑关系的至少三个第一计算节点定义为第一并行节点组，所述第一并行节点组包括第一前节点和至少两个第一后节点；
获取所述第一前节点的第一输入数据模型并生成所述第一前节点的第一输入张量；
根据所述第一输入数据模型和所述第一输入张量计算所述第一前节点的第一输出张量；
获取所述至少两个第一后节点的第二输入数据模型并将所述第一输出张量作为第二输入张量；
根据所述第二输入数据模型和所述第二输入张量分别计算所述至少两个第一后节点的第二输出张量，得到所述第一并行节点组的第一计算结果。

2.根据权利要求1所述的方法，其特征在于，所述从多个第一计算节点中确认具有逻辑关系的至少三个第一计算节点，将所述具有逻辑关系的至少三个第一计算节点定义为第一并行节点组，包括：
判断所述至少三个第一计算节点是否包括具有逻辑关系的所述第一前节点和所述至少两个第一后节点；
响应于所述至少三个第一计算节点包括具有逻辑关系的所述第一前节点和所述至少两个第二后节点，将所述至少三个第一计算节点定义为所述第一并行节点组。

3.根据权利要求1所述的方法，其特征在于，在所述获取所述第一前节点的第一输入数据模型并生成所述第一前节点的第一输入张量之前，还包括：
根据所述至少两个第一后节点的数量确认所述第一前节点的引用次数。

4.根据权利要求1所述的方法，其特征在于，在所述获取所述第一前节点的第一输入数据模型并生成所述第一前节点的第一输入张量之前，还包括：
对所述第一并行节点组的所述第一前节点和所述至少两个第一后节点进行加锁。

5.根据权利要求3所述的方法，其特征在于，在所述根据所述第二输入数据模型和第二输入张量计算所述至少两个第一后节点的第二输出张量，得到所述第一并行节点组的第一计算结果之后，还包括：
判断每个第一后节点是否完成计算：
在每个第一后节点完成计算后，分别对所述第一前节点的引用次数减一；
判断所述第一前节点的引用次数是否为零；
在所述第一前节点的引用次数为零的情况下，删除片上存储的所述第一输出张量并将所述第一输出张量存储到片外存储器中。

6.根据权利要求5所述的方法，其特征在于，在所述第一前节点的引用次数为零的情况下，删除片上存储的所述第一输出张量并将所述第一输出张量存储到片外...

【专利技术属性】
技术研发人员：马恺，熊超，牛昕宇，蔡权雄，
申请(专利权)人：深圳鲲云信息科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人