用于异构架构的数据处理系统及其方法技术方案

技术编号：22075551 阅读：24 留言：0更新日期：2019-09-12 14:05

本公开公开了一种用于异构架构的数据处理系统，包括：作业分解组件，用于将所需完成的作业分解为一系列由异构架构中执行体来执行的任务；任务拓扑图生成组件，在作业分解组件进行作业分解的同时，基于所分解的任务之间的固有关系，生成任务关系拓扑图，所述任务拓扑图的任务节点含有执行对应任务所需的全部节点属性；执行体创建组件，基于任务关系拓扑图在计算资源中为每个任务创建对应的执行体；以及执行体网络组件，包含含有各种所创建的执行体的一条或多条数据处理路径，其在接收实际作业数据时，将实际作业数据分片成为任务数据，所述任务数据被连续输入数据处理路径中，以便完成任务数据的处理。

Data Processing System for Heterogeneous Architecture and Its Method

全部详细技术资料下载

【技术实现步骤摘要】
用于异构架构的数据处理系统及其方法
本公开涉及一种数据处理技术。更具体地说，本公开涉及一种用于异构架构的数据处理系统及其方法。
技术介绍
随着机器学习的发展以及人工神经网络的研究的逐步深入，深度学习的概念得到广泛的关注和应用。深度学习是一种特殊的机器学习，它采用网状层级结构来表达所学习的对象，通过简单概念来组合成抽象概念，通过简单概念计算来实现抽象的概念表达。目前，深度学习在图像识别、语音识别以及自然语言处理领域有了长足的进展。深度学习涉及的模型参数多，导致计算量巨大，而且训练数据的规模大，因此需要消耗较多的计算资源等特点。当前，无论是通用处理器GPU还是专用芯片TPU相对于CPU都强大了许多倍，但现实应用对计算力的渴求是无止境的，从业者需要以更快的速度，以更大规模的模型处理更大规模的数据，这单靠一个硬件设备无法满足。硬件的发展要受限于制造工艺(芯片面积，功耗，时钟信号传播范围)的限制，不可能无限制的提高一颗芯片的处理能力。因此，人们常常通过高速互联技术把多个高通量的设备连接在一起，协同完成大规模任务。一种常见的GPU集群架构，同一个节点(服务器)内部的GPU通过NVLink或者PCIe通信，多个节点通过高速以太网或者无限带宽(Infiniband)互联。Google内部TPUCloud的硬件部署中每个服务器管理若干个TPU，多个服务器通过高速互联技术连成大规模集群。如何使得多个互联的设备在一起高效工作，这给深度学习软件开发带来了严峻挑战。为此，本领域技术人员提出了数据并行是指把数据分成多份，每个设备处理一份，这样每个设备只需要处理整体数据的一小部分即可，...

【技术保护点】
1.一种用于异构架构的数据处理系统，包括：任务拓扑图生成组件，用于将所需完成的作业分解为一系列由异构架构中执行体来执行的任务，并在作业分解的同时，基于所分解的任务之间的固有关系，生成任务关系拓扑图，所述任务拓扑图的任务节点含有执行对应任务所需的全部节点属性；执行体创建组件，基于任务关系拓扑图在计算资源中为每个任务节点创建对应的执行体；以及执行体网络组件，包含含有各种所创建的执行体的一条或多条数据处理路径，其在接收实际作业数据时，将实际作业数据分片成为任务数据，所述任务数据被连续输入数据处理路径中，以便完成任务数据的处理。

【技术特征摘要】
1.一种用于异构架构的数据处理系统，包括：任务拓扑图生成组件，用于将所需完成的作业分解为一系列由异构架构中执行体来执行的任务，并在作业分解的同时，基于所分解的任务之间的固有关系，生成任务关系拓扑图，所述任务拓扑图的任务节点含有执行对应任务所需的全部节点属性；执行体创建组件，基于任务关系拓扑图在计算资源中为每个任务节点创建对应的执行体；以及执行体网络组件，包含含有各种所创建的执行体的一条或多条数据处理路径，其在接收实际作业数据时，将实际作业数据分片成为任务数据，所述任务数据被连续输入数据处理路径中，以便完成任务数据的处理。2.根据权利要求1所述的用于异构架构的数据处理系统，其还包括作业描述组件，用于基于作业类型描述作业神经网络模型以及作业所需申请的资源。3.根据权利要求2所述的用于异构架构的数据处理系统，其中所述作业描述组件用于按照彼此区分分离方式从不同维度来描述作业，并且各个维度之间彼此正交。4.根据权利要求1所述的用于异构架构的数据处理系统，其中所述异构架构包括一个或多个中央处理单元以及至少一个与其相连的协处理器设备端。5.根据权利要求4所述的用于异构架构的数据处理系统，其中所述异构架构还包括连接多个中央处理单元之间的网关。6.根据权利要求1所述的用于异构架构的数据处理系统，其中所述任务拓扑图的节点含有执行对应任务所需的全部节点属性。7.根据权利要求6所述的用于异构架构的数据处理系统，其中所述全部节点属性包含指明节点所对应的任务所需的资源的资源属性以及触发任务执行的条件的条件属性。8.根据权利要求1-7之一所述的用于异构架构的数据处理系统，其中所述任务拓扑图生成组件包括冗余节点消除单元以及阻塞节点消除单元之一或其组合。9.根据权利要求1-7之一所述的用于异构架构的数据处理系统，其中每条所述数据处理路径包括一个或多个上游执行体和一个或多个下游执行体，每个下游执行体接收其上游执行体输出的经过处理的任务数据。10.根据权利要求1-7之一所述的用于异构架构的数据处理系统，其中所述执行体包括有限状态机和处理组件，处理组件每次在所述有限状态机满足预定条件时执行被创建时指定的任务。11.根据权利要求1-7之一所述的用于异构架构的数据处理系统，其中所述执行体包括消息仓，并通过消息仓接收其上游或下游执行体的消息，从而基于来自上游执行体的消息获取上游执行体所产生的任务数据以及基于来自下游执行体的消息而空置本地内存。12.根据权利要求1-7之一所述的用于异构架构的数据处理系统，其中所述执行体为搬运执行体或计算执行体。13.一种用于异构架构的数据处...

【专利技术属性】
技术研发人员：袁进辉，
申请(专利权)人：北京一流科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人