一种面向并行应用核间通信竞争的通信性能预测方法技术

技术编号:32328810 阅读:14 留言:0更新日期:2022-02-16 18:36
本发明专利技术公开了一种面向并行应用核间通信竞争的通信性能预测方法,包括以下步骤:一、构建多核架构下考虑核间通信竞争的点对点通信性能模型;二、获取并行应用通信时序信息与进程分布情况;三、按照通信性能模型测量应用运行环境中的通信性能指标;四、结合应用通信时序预测并行应用通信开销。本方法实现对多核架构高性能计算环境下对并行应用通信性能的预测,有益于较快速准确地描述存在核间通信竞争情况下的单次通信开销,从而较为准确地预测并行应用运行时通信开销,为并行应用通信优化方案提供优化效果评价,从而指导优化并行应用通信。信。信。

【技术实现步骤摘要】
一种面向并行应用核间通信竞争的通信性能预测方法


[0001]本专利技术涉及一种并行应用通信性能分析预测方法,尤其涉及一种运行于多核架构的高性能计算环境下存在核间通信竞争的并行应用通信性能预测方法。

技术介绍

[0002]随着多核架构在现代并行计算中的广泛应用,高性能计算集群从曾经单处理器的单级网络互联转变为更复杂的分层结构。通常,高性能计算集群由数量较多的节点组成,每个节点包含多个共享内存的多核处理器。与单核节点相比,多核节点内多个计算核间能进行更低开销的节点内通信,而在节点间通信时,多个计算核间可能存在彼此竞争链路带宽和网络资源的情况,这会导致额外的通信开销。
[0003]随着并行应用规模增加,应用通信开销逐渐成为限制并行应用整体性能的重要因素,因此,对应用通信性能的优化可以有效帮助优化应用整体性能。其中,优化方案效果评价是方案设计过程的一个关键步骤。由于大部分优化方案的设计与实现都是一个反复迭代的过程,通过将具体优化方案实现并进行并行应用在该种方案下的通信性能测试虽能得到每次迭代下的准确优化效果,但迭代过程中应用的反复执行将产生大量开销,导致优化方案设计周期延长。作为一种高效的评价手段,应用通信性能预测在优化方案设计过程中避免了应用实际运行开销,为优化方案设计与实现提供更低成本与较为准确的迭代方案性能评价方法。
[0004]现有的基于点对点通信模型的应用通信性能预测方法能为单核节点环境提供较为准确的应用通信性能预测,但在运行于多核架构的并行应用通信性能预测方面仍有局限。在多核架构场景下,并行应用运行时不同节点间计算核通信受相同节点内同一时刻进行通信的其他核心影响,导致产生额外的通信开销。现有的点对点通信模型并不包含对这些核间通信竞争的衡量,不能为多核架构下的并行应用提供较为准确的预测结果。

技术实现思路

[0005]针对上述方法所存在的问题,本专利技术提供一种面向并行应用核间通信竞争的通信性能预测方法,用于预测运行于多核架构的并行应用的通信性能。本方法首先构建多核架构下考虑核间通信竞争的点对点通信性能模型,然后获取并行应用通信时序信息与进程分布情况,接着按照通信性能模型测量应用运行环境中的通信性能指标,最后结合应用通信时序预测并行应用通信开销,实现面向多核架构高性能计算环境下对并行应用通信性能的预测。该方法具体步骤包括:
[0006](a)构建多核架构下存在核间通信竞争背景的点对点通信性能模型;将点对点通信发生时,通信源节点内同时存在其他点对点通信的情况,描述为存在核间通信竞争的通信模型;参考LogGPS模型,将一次点对点通信过程拆解为参数描述的多个部分,其中包括CPU处理通信发送或接收请求的最小时间开销o,CPU处理消息的每字节开销O
s
或O
r
,CPU连续两次发送或接收的时间间隔g,链路通信延迟L,发送消息长度k,单位长度消息通信需要花
费基础时间为G,核间通信竞争导致的网卡处理通信请求额外开销h,核间通信竞争导致的单位长度消息额外开销C,存在核间通信竞争情况下,一次点对点通信总时间开销为2o+2h+L+k(O
s
+O
r
+G+C),其中h和C随核间通信竞争数量增加而变化;
[0007](b)获取并行应用通信时序与进程分布情况;从并行应用出发,获取并行应用进程数量,使用现有的并行应用分析方法获取每个进程的所有通信操作,并将各个进程上通信操作按时序整理为并行应用完整的通信时序;根据运行环境默认布局,或用户指定的任务布局获取进程分布情况,即根据布局获得进程与节点映射关系,由此获得并行应用所涉及节点信息;
[0008](c)测量并行应用通信环境的网络性能参数;为了使用步骤(a)构建的模型刻画并行应用通信开销,基于步骤(b)中获取的并行应用所涉及节点信息,分别测量所涉及节点不同计算核间无竞争点对点往返通信参数与存在核间通信竞争时的点对点往返通信参数;对于每个计算核间通信,设计2+m次测量过程,记录测量时间为t1、t2、t
31
~t
3m
,其中,m为通信源计算核所在节点的核心数量;结合上述测得时间的开销表达式,构建能求得步骤(a)中描述的各项参数值的方程组,并求出各项参数值,从而刻画不同核间通信竞争下的点对点通信过程;
[0009](d)根据通信时序计算并行应用整体通信开销。
[0010]规定如下表示符号,用于描述一次点对点往返通信过程中拆分出的若干部分:
[0011][0012][0013]所述步骤(a)的具体过程为,
[0014](a

1)与分布在不同节点上的计算核相比,同一节点上的计算核之间具有更低的通信延迟与更高的通信带宽。因此,对于进程间通信分布均匀的并行应用,应用整体通信开销主要取决于具有更高通信开销的跨节点进程间通信。同时,核间通信竞争影响主要表现在源计算核与目标计算核位于不同节点情况中,而对于源计算核与目标计算核位于同一节
点时,核间通信竞争导致的额外通信开销并不明显。对于不同节点间的某次通信,除链路延迟,通信带宽,消息大小外,通信开销主要受同一时刻中源节点相同的其他通信影响,同一时刻源节点通信核心数越多,该次通信的额外开销越大。
[0015](a

2)由(a

1)可将点对点通信模型按照源计算核与目标计算核是否位于同一节点,划分两类情形,为当源计算核与目标计算核位于相同节点,即节点内通信时,点对点通信在存在核间通信竞争与不存在核间通信竞争下时间开销近乎相同,点对点通信总时间开销为2o+L+k(O
s
+O
r
+G);当源计算核与目标计算核位于不同节点,即节点间通信时,没有核间通信竞争情况下,点对点通信总时间开销为2o+L+k(O
s
+O
r
+G),存在核间通信竞争情况下,点对点通信总时间开销为2o+2h+L+k(O
s
+O
r
+G+C),其中h和C随核间通信竞争数量增加而变化。
[0016]所述步骤(c)的具体过程为,
[0017](c

1)对并行应用所涉及节点的所有计算核心,分别进行与除自己以外的所有核心的点对点往返通信测量,对于一次计算核间通信测量,令先发送消息再接收消息的计算核为源计算核,源计算核所在节点为源节点,令先接收消息再发送消息的计算核为目的计算核,目的计算核所在节点为目的节点。
[0018](c

2)对于核间点对点往返通信,通过指定消息发送过程,测量时间t1、t2、t
31
~t
3m
。t1、t2、t3的通信行为如附图2,附图3,附图4所示。其中,令t1中源计算核调用发送命令到调用接收命令的时间间隔w远大于一次消息往返开销,对于t3存在核间通信竞争的测量,令i为从1到源节点核心数最大值m,并进行在不同消息大小k下测量a组t1、t2、t3。
...

【技术保护点】

【技术特征摘要】
1.一种面向并行应用核间通信竞争的通信性能预测方法,其特征在于,包括以下步骤:(a)构建多核架构下存在核间通信竞争背景的点对点通信性能模型;将点对点通信发生时,通信源节点内同时存在其他点对点通信的情况,描述为存在核间通信竞争的通信模型;参考LogGPS模型,将一次点对点通信过程拆解为参数描述的多个部分,其中包括CPU处理通信发送或接收请求的最小时间开销o,CPU处理消息的每字节开销O
s
或O
r
,CPU连续两次发送或接收的时间间隔g,链路通信延迟L,发送消息长度k,单位长度消息通信需要花费基础时间为G,核间通信竞争导致的网卡处理通信请求额外开销h,核间通信竞争导致的单位长度消息额外开销C,存在核间通信竞争情况下,一次点对点通信总时间开销为2o+2h+L+k(O
s
+O
r
+G+C),其中h和C随核间通信竞争数量增加而变化;(b)获取并行应用通信时序与进程分布情况;从并行应用出发,获取并行应用进程数量,使用现有的并行应用分析方法获取每个进程的所有通信操作,并将各个进程上通信操作按时序整理为并行应用完整的通信时序;根据运行环境默认布局,或用户指定的任务布局获取进程分布情况,即根据布局获得进程与节点映射关系,由此获得并行应用所涉及节点信息;(c)测量并行应用通信环境的网络性能参数;为了使用步骤(a)构建的模型刻画并行应用通信开销,基于步骤(b)中获取的并行应用所涉及节点信息,分别测量所涉及节点不同计算核间无竞争点对点往返通信参数与存在核间通信竞争时的点对点往返通信参数;对于每个计算核间通信,设计2+m次测量过程,记录测量时间为t1、t2、t
31
~t
3m
,其中,m为通信源计算核所在节点的核心数量;结合上述测得时间的开销表达式,构建能求得步骤(a)中描述的各项参数值的方程组,并求出各项参数值,从而刻画不同核间通信竞争下的点对点通信过程;(d)根据通信时序计算并行应用整体通信开销。2.根据权利要求1所述的面向并行应用核间通信竞争的通信性能预测方法,其特征在于,所述步骤(a)的具体过程包括:(a

1)与分布在不同节点上的计算核相比,同一节点上的计算核之间具有更低的通信延迟与更高的通信带宽,因此,对于进程间通信分布均匀的并行应用,应用整体通信开销主要取决于具有更高通信开销的跨节点进程间通信,同时,核间通信竞争影响主要表现在源计算核与目标计算核位于不同节点情况中,而对于源计算核与目标计算核位于同一节点时,核间通信竞争导致的额外通信开销并不明显,对于不同节点间的某次通信,除链路延迟,通信带宽,消息大小外,通信开销主要受同一时刻中源节点相同的其他通信影响,同一时刻源节点通信核心数越多,该次通信的额外开销越大;(a

2)由步骤(a

1)可将点对点通信模型按照源计算核与目标计算核是否位于同一节点,划分两类情形,为当源计算核与目标计算核位于相同节点,即节点内通信时,点对点通信在存在核间通信竞争与不存在核间通信竞争下时间开销近乎相同,点对点通信总时间开销为2o+L+k(O
s
+O
r
+G);当源计算核与目标计算核位于不同节点,即节点间通信时,没有...

【专利技术属性】
技术研发人员:肖利民王泽红韩萌徐向荣朱乃威常佳辉王志鹏
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1