对称的多处理集群环境中的进程间的通信制造技术

技术编号:2823236 阅读:172 留言:0更新日期:2012-04-11 18:40
提供一种设置,用来在对称的多处理(SMP)集群环境中的各进程间通信,其中该SMP集群的至少某些SMP节点包括多个进程。该设置包括在一个SMP节点以节点内方式使用该SMP节点的共享存储器来在各进程间传送集合通信的消息;响应于该节点内传送,同时地以节点间方式从n个SMP节点向m个其它的SMP节点传送集合通信的多个消息,其中n或m至少之一大于1。该同时传送步骤由n个SMP节点或m个其它SMP节点的至少之一的多个进程实施。更具体地,该设置包括从下述之一以节点间方式同时传送多个消息:从一个SMP节点到多个其它SMP节点、多个SMP节点到其它一个SMP节点或者从多个SMP节点到多个其它的SMP节点。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总地涉及消息处理,更具体地,涉及在对称的多处理(SMP)集群环境中在各进程间传递集合通信的消息。
技术介绍
对称的多处理器(SMP)是指计算系统中硬件的一个方面,更具 体地,涉及处理器平面的物理布局和设计。这样的多处理器单元的一 个特征是全局存储器的共享以及对该SMP系统的输入/输出(I/O )的 同等的访问。SMP集群(cluster )是指这样一个环境,其中多个SMP 系统/节点耦合到一起用于并行计算。SMP集群变得越来越受欢迎, 目前广泛地应用在科学和工程并行计算领域中。这些集群环境典型地 包括数百个SMP节点,这些节点由低延迟、高带宽交换网络,(如 纽约Armonk的IBM公司提供的高性能交换机(HPS))连接。每 个SMP节点具有例如2到64个CPU并且总是具有多于一个交换机 适配器来桥接交换机与单个的适配器功能之间的差距。例如,可以在 具有8个IBM Power4的CPU的IBM的eServer pSeries655上安装 两个交换机适配器。作为进一步的
技术介绍
,消息传递接口 (MPI)标准定义了下面 的方案并行作业中的各进程在通信域(或者"通信集")内交换消息, 该通信域保证该域内消息的完整性。 一个域内发布的消息不与另 一域 内发布的消息互相干扰。 一旦一个并行作业开始,需要时,各进程的 子集可以协作来形成分开的通信域。MPI标准定义了 一组集合通信(collective communication )操作。 某些MPI集合通信是有根(rooted )的,意思是消息的源或者宿(sink) 之一仅为一个MPI进程。这些集合通信是用于一对多或多对一通信模式的。使用最多的是MPI_Bcast和MPI_Reduce。无根(non-rooted) 的集合通信,诸如MPI—Barrier 、 MPI—Allreduce和MPI—Alltotal是 用于多对多通信模式的。在SMP集群上,集合通信(例如发生在MPI通信集的上下文内) 通常遵守分层消息分布模型来利用每个SMP节点上的快速共享存储 器通信通道。但是,随着交换技术的快速发展,单个的MPI进程经 常不能充分利用可以得到的交换网络容量。剥离技术已经被用来获取 比一个适配器可提供的更高带宽,但是不能有助于满足对延迟的要 求。于是,需要一种用于SMP集群环境的集合通信的新的通信方法, 其中交换机/适配器容量被充分利用,共享的存储器有助于集合通信操 作的SMP间通信部分。
技术实现思路
通过提供一种在对称的多处理(SMP )集群环境中的进程间的通 信方法来克服已有技术的缺点并提供附加的优点,其中SMP集群的 至少一些SMP节点包括多个进程。该方法包括(i)在SMP节点 处以节点内方式利用该SMP节点的共享存储器在各进程之间传送集 合通信的消息;(ii)响应于传送(i),同时地从n个SMP节点向 m个其它SMP节点以节点间方式传送集合通信的多个消息,其中n 或m至少之一大于1,并且该同时传送由该n个SMP节点或m个其 它SMP节点至少之一的多个进程执行。在改进的方面,同时传送(ii)包括以节点间方式同时从以下之 一传送多个消息 一个SMP节点到多个其它SMP节点,多个SMP 节点到一个其它SMP节点,或者多个SMP节点到多个其它的SMP 节点。至少一个SMP节点或至少一个其它SMP节点的多个通信通道 用来方便多个进程执行同时传送,此外,传送(i)和同时传送(ii) 中涉及的SMP节点和进程可以在产生^f吏用的通信集时定义。在另外的方面,提供了一种在对称的多处理(SMP)集群环境中的进程间通信的系统,其中SMP集群的至少一些SMP节点包括多个 进程。该系统包括用来在SMP节点处以节点内方式利用SMP节点的 共享存储器在各进程之间传送集合通信的消息的装置;响应于该节点 内传送,同时地从n个SMP节点向m个其它SMP节点以节点间方 式传送集合通信的多个消息的装置,其中n或m至少之一大于l,并 且该同时传送过程由该n个SMP节点或m个其它SMP节点至少之 一的多个进程执行。在另外的方面,提供了由至少一个计算机可读的至少一个程序存 储设备,该存储设备有形地包含可由该至少一个计算机执行的指令的 至少一个程序来执行对称的多处理(SMP)集群环境中的各进程间的 通信的方法。该SMP集群的至少一些SMP节点包括多个进程。该方 法包括在SMP节点处以节点内方式利用该SMP节点的共享存储器 在各进程之间传送集合通信的消息响应于该节点内传送,同时地从 n个SMP节点向m个其它SMP节点以节点间方式传送集合通信的多 个消息,其中n或m至少之一大于1,并且该同时传送由该n个SMP 节点或m个其它SMP节点至少之一的多个进程执行。此外,通过本专利技术的技术还可以实现其它的特征和优点。本专利技术 的其它实施例和方面在这里将被详细说明并考虑作为权利要求的一 部分。附图说明作为本专利技术的主题被特别地指出并明确地限定在本说明书的结 束部分的权利要求中。本专利技术的前述的以及其它的目的、特征和优点 将从下面的结合附图的详细说明中变得显而易见。图1描述了结合和使用了本专利技术的一个或多个方面的对称的多 处理(SMP)集群环境的一个实施例;图2描述了在SMP环境或非SMP环境之一中的使用传统的二 元树来在各进程之间分配消息的MPI_Bcast通信方法;图3描述了在SMP集群环境中使用二元树来分配MPI一Bcast消息的另一通信方法;图4描述了又一通信方法,在SMP节点之间使用消息的二元树 分配,使用SMP内部的集合通信级共享存储器来分配MPI一Bcast消 息;图5描述了根据本专利技术的一个方面的同时通信方法的一个实施 例,用来在SMP节点内部传送MPI_Bcast消息,后继以消息在SMP 节点之间的同时传送;图6描述了检测结果的示图,显示出使用根据本专利技术的特定方面 的图3、 4、 5中的不同消息通信方法的MPI—Beast执行时间相对于消 息大小的关系;图7是根据本专利技术的一个方面的用来传送同时MPI_Bcast消息 的通信方法的一个实施例的流程图8是根据本专利技术的一个方面的用来在通信集产生时确定通信 算法的选择的一个实施例的流程图;及图9是根据本专利技术的一个方面的用来使用在通信集产生时选择 的通信算法在集合通信时间确定一种通信方法的实施例的流程图。具体实施例方式总地来说这里提供了一种新的通信方法,用来在对称的多处理 (SMP)集群环境中的各进程之间传送集合通信的消息。该SMP集 群的至少一些SMP节点包括多个进程。该技术包括初始地在SMP节 点以节点内方式在各进程间传送集合通信的消息。该节点内消息传送 是利用SMP节点的共享存储器来完成的。例如,在广播操作期间, SMP节点的根进程可以存储一个消息到共享存储器,后者于是可被该 SMP节点的多个其它进程访问。响应于该节点内传送,该通信方法然 后提供从n个SMP节点到m个其它SMP节点的节点间的集合通信 的多个消息的传送,其中至少n或m之一大于1。该同时传送由n个 SMP节点的多个进程或m个其它SMP节点的多个进程执行。虽然下 面是结合广播操作来说明,但是本领域的技术人员会注意到这里的通信方法很容易用于其它的有根或无根的集合通信。图1示出了结合和利用了本本文档来自技高网
...

【技术保护点】
一种在对称的多处理(SMP)集群中的进程(106)之间通信的方法,该集群具有多个SMP节点(102),其中该SMP集群的至少一些SMP节点包括多个进程,该方法包括:    (i)在SMP节点处以节点内方式利用该SMP节点的共享存储器(107)在进程间传送集合通信的消息;及    (ii)响应于传送(i),以节点间方式同时地从n个SMP节点向m个其它SMP节点传送集合通信的多个消息,其中n或m中的至少一个大于1,并且该同时传送由所述n个SMP节点和所述m个其它SMP节点中的至少一个的多个进程实施。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:贾彬R特鲁曼
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1