同步分布式计算运行时间的系统和方法技术方案

技术编号:17202190 阅读:81 留言:0更新日期:2018-02-04 03:02
本发明专利技术提供一种计算系统(100),包括:多个集群计算节点(101、102、103);混合并行计算运行时间(104),包括:用于所述多个集群计算节点(101、102、103)上的并行计算的至少两个分布式计算运行时间(105、106),其中,所述混合并行计算运行时间104用于对分布到所述多个集群计算节点(101、102、103)的数据进行操作,并且包括用于同步所述至少两个分布式计算运行时间(105、106)和将所述至少两个分布式计算运行时间(105、106)中的至少一个分布式计算运行时间的数据提供给所述至少两个分布式计算运行时间中的至少另一个分布式计算运行时间的同步模块(107)。

【技术实现步骤摘要】
【国外来华专利技术】同步分布式计算运行时间的系统和方法
本专利技术涉及分布式并行计算领域,特别是涉及同步计算运行时间的系统和方法,即在多个集群计算节点上优化计算运行时间的同步。特别地,本专利技术涉及优化至少两个分布式计算运行时间的计算状态的同步。优化优选地在基于分布式集群的并行计算系统中进行。
技术介绍
在计算机集群,通常是指一组连接的计算机,例如,在数据中心,上运行并行或分布式计算被广泛采用。有多种可用于在计算机集群上执行并行计算的运行时间。运行时间的例子是MPI、Spark和Hadoop。它们通常基于不同的语言(MPI:C/C++,Spark:Scala,Hadoop:Java)。消息传递接口(MessagePassingInterface,简称MPI)是一种标准化的消息传递系统,它定义了一个库例程的核心的语法和语义,它们以独立于语言的方式在一组进程之间提供基本的同步和通信功能。更具体地说,它是一种独立于语言的通信协议,用于对在分布式系统上运行的并行程序进行编程。MPI的进一步优点在于它提供了一个低层标准接口,由组网硬件直接支持,从而实现了低开销的计算和通信,并提供了优化机会。缺点是实现算法的成本高本文档来自技高网...
同步分布式计算运行时间的系统和方法

【技术保护点】
一种计算系统(100),其特征在于,包括:多个集群计算节点(101、102、103);混合并行计算运行时间(104),包括:用于所述多个集群计算节点(101、102、103)上的并行计算的至少两个分布式计算运行时间(105、106);其中所述混合并行计算运行时间(104)用于对分布到所述多个集群计算节点(101、102、103)的数据进行操作,并且包括用于同步所述至少两个分布式计算运行时间(105、106)和将所述至少两个分布式计算运行时间(105、106)中的至少一个分布式计算运行时间的数据提供给所述至少两个分布式计算运行时间(105、106)中的至少另一个分布式计算运行时间的同步模块(10...

【技术特征摘要】
【国外来华专利技术】1.一种计算系统(100),其特征在于,包括:多个集群计算节点(101、102、103);混合并行计算运行时间(104),包括:用于所述多个集群计算节点(101、102、103)上的并行计算的至少两个分布式计算运行时间(105、106);其中所述混合并行计算运行时间(104)用于对分布到所述多个集群计算节点(101、102、103)的数据进行操作,并且包括用于同步所述至少两个分布式计算运行时间(105、106)和将所述至少两个分布式计算运行时间(105、106)中的至少一个分布式计算运行时间的数据提供给所述至少两个分布式计算运行时间(105、106)中的至少另一个分布式计算运行时间的同步模块(107)。2.根据权利要求1所述的系统,其特征在于,所述同步模块(107)用于同步所述至少两个分布式计算运行时间(105、106)的计算状态。3.根据权利要求1或2所述的系统,其特征在于,所述同步模块(107)用于在由所述至少两个分布式计算运行时间(105、106)中的至少一个分布式计算运行时间执行的计算的特定计算状态同步所述至少两个分布式计算运行时间(105、106)。4.根据前述权利要求中任一项所述的系统,其特征在于,所述同步模块(107)用于提供定向同步,其中,所述至少两个分布式计算运行时间(105、106)中的至少第一个分布式计算运行时间用于在所述至少两个分布式计算运行时间(105、106)中的至少第二个分布式计算运行时间发起计算。5.根据权利要求1所述的系统,其特征在于,所述同步模块(107)用于将所述至少两个分布式计算运行时间(105、106)中的至少第二个分布式计算运行时间的状态变量或状态变量的值提供给所述至少两个分布式计算运行时间(105、106)中的至少第一个分布式计算运行时间,其中,所述至少两个分布式计算运行时间(105、106)中的至少第一个分布式计算运行时间用于在其计算中使用所述至少两个分布式计算运行时间(105、106)中的至少第二个分布式计算运行时间的状态变量或状态变量的值。6.根据权利要求5所述的系统,其特征在于,所述同步模块(107)用于提供状态变量和所述状态变量的值,其中,所述至少两个分布式计算运行时间(105、106)中的至少第一个分布式计算运行时间用于在其计算中使用所述至少两个分布式计算运行时间(105、106)中的至少第二个分布式计算运行时间的状态变量和状态变量的值。7.根据前述权利要求中任一项所述的系统,其特征在于,所述同步模块(107)包括关于所述至少两个分布式计算运行时间(105、106)中的至少一个分布式计算运行时间的计算状态的信息,其中,所述同步模块(107)用于当所述至少两个分布式计算运行时间(105、106)中的至少一个分布式计算运行时间达到特定状态或指示另一个分布式计算运行时间(105、106)应该开始时,提供开始另一个分布式计算运行时间(105、106)的计算所需的数据。8.根据前述权利要求中任一项所述的系统,其特征在于,所述同步模块(107)用于通过将特定命令发送到...

【专利技术属性】
技术研发人员:德米特里·维亚切斯拉沃维奇·布舍夫亚历山大·弗拉基米罗维奇·斯莱萨连科亚历山大·尼古拉耶维奇·菲利波夫
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1