一种基于物理位置感知的集合通信方法技术

技术编号:12999515 阅读:38 留言:0更新日期:2016-03-10 12:37
本发明专利技术提供了一种基于物理位置感知的集合通信方法,包括:感知目的进程的位置;在目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。本发明专利技术进行大规模集合通信时,通过感知目的进程的位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。

【技术实现步骤摘要】

本专利技术涉及计算机
,具体涉及。
技术介绍
胖树网络是一种以树形结构采用多层路由芯片进行互连,高效可扩展的网络架构。胖树网络以其低成本、高可扩展性的特点受到业界青睐,但是由于需要通过多层交换芯片进行组网,当用户程序需要进行密集消息通信时,存在由于交换芯片端口冲突导致的通信性能下降问题,这是集合通信优化方法不可回避的重要问题之一。此外,异构众核平台的特点在于运算核心阵列拥有强大的聚合通信能力,也为部分邻近的消息密集通信的性能优化提供了可能。基于异构众核芯片的复合网络体系结构下,并行应用程序通常会因为映射到不同位置的物理核而产生通信带宽差异,从而并行应用程序的集合通信性能产生巨大的影响。另一方面,全交换集合通信广泛应用于各类并行应用中,以实现各进程间的数据并行。在全交换通信中,所有进程将本进程的数据平均分块,并将其发送到所有其他进程的指定位置。现有全交换通信实现方法过多地关注了点对点通信行为本身对于网络双向带宽能力的发挥,而忽略了大规模环境下的性能可扩展性问题,导致无法充分挖掘底层网络以及CPU本身的通信潜能。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术中存在上述缺陷,提供,其能够充分利用复合网络体系结构的特征以及异构众核平台中运算核心的强大聚合访存能力,以达到提高并行应用全交换集合通信性能的目的。本专利技术进行大规模集合通信时,通过感知目的进程的位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。具体地,根据本专利技术,提供了,包括:进行点对点通信时,通过物理位置感知,当目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。优选地,所述本进程是与目的进程不同的另一进程。根据本专利技术,还提供了,包括:感知采用一维通信算法的目的进程的位置;将一维通信算法修改为两维通信算法;将采用所述两维通信算法的通信局限于无冲突的底层交换芯片内;根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。根据本专利技术,还提供了,包括:感知采用一维通信算法的目的进程的位置;将一维通信算法修改为多维通信算法;将采用多维通信算法的通信局限于无冲突的底层交换芯片内;本专利技术根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。【附图说明】结合附图,并通过参考下面的详细描述,将会更容易地对本专利技术有更完整的理解并且更容易地理解其伴随的优点和特征,其中:图1示意性地示出了根据本专利技术优选实施例的基于物理位置感知的集合通信方法的流程图。图2示意性地示出了根据本专利技术第二优选实施例的基于物理位置感知的集合通信方法的流程图。需要说明的是,附图用于说明本专利技术,而非限制本专利技术。注意,表示结构的附图可能并非按比例绘制。并且,附图中,相同或者类似的元件标有相同或者类似的标号。【具体实施方式】为了使本专利技术的内容更加清楚和易懂,下面结合具体实施例和附图对本专利技术的内容进行详细描述。胖树网络通常由多层交换芯片构成,当用户消息数据在多层交换芯片中进行传输时,由交换芯片中的路由算法决定数据传输的路径。在密集通信条件下,如果采用单纯的一维视图进行通信,会由于路由芯片端口间的冲突导致集合通信中的某个步骤性能急剧下降,从而对整体通信性能造成影响。此外,在全交换通信的某个阶段,会集中出现所有进程在芯片内进行数据交互的情况,在这种情况下,消息数据虽然不会通过交换芯片进行传输,但会由于多个进程竞争芯片网络接口资源,导致带宽下降。本专利技术在充分提炼全交换通信行为特征的基础上,将通信过程细化为多个子过程,将常规的一维通信修改为多维通信,通过感知应用程序物理资源特征,采用不同优化策略对每个子过程进行有针对性的优化。下面将结合附图来描述本专利技术的具体优选实施例。<第一实施例>图1示意性地示出了根据本专利技术第一优选实施例的基于物理位置感知的集合通信方法的流程图。如图1所示,根据本专利技术第一优选实施例的基于物理位置感知的集合通信方法包括:第一步骤S1:进行点对点通信时,进行物理位置感知,当目的进程和本进程(当前进程,是与目的进程不同的另一进程)位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;第二步骤S2:在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。首先,通过感知目的进程的位置,并且在目的进程和本进程位于同一物理芯片内时,通过查询确定本地运算核心是否空闲,如果本地运算核心空闲则通过本地运算核心发起DMA(Direc tMemory Access,存储器直接访问)操作,将通信数据直接写入目的进程主存中。这样实现的好处在于,所述同一物理芯片内的通信不需要再通过网络接口进行中转,密集通信时,芯片内通信不会由于多对通信的冲突产生带宽损失。<第二实施例>图2示意性地示出了根据本专利技术第二优选实施例的基于物理位置感知的集合通信方法的流程图。如图2所示,根据本专利技术第二优选实施例的基于物理位置感知的集合通信方法包括:第一步骤S10:感知采用一维通信算法的目的进程的位置;第二步骤S20:将传统的一维通信算法修改为两维通信算法或多维通信算法;第三步骤S30:将采用所述两维通信算法或多维通信算法的通信局限于无冲突的底层交换芯片内;第四步骤S40:根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原贝1J,使得通信间的路由冲突最小化。可以看出,通过感知目的进程的位置,将传统的一维算法修改为两维算法甚至多维算法;先将通信局限于无冲突的底层交换芯片内;再根据目的进程位置,结合路由芯片路由算法,根据无端口冲突原则尽量降低通信间的路由冲突,以保证远距离跨路由芯片通信的消息性能。可以看出,本专利技术充分利用空闲计算核心的强大聚合访存能力对邻近进程的通信性能进行优化,而且本专利技术结合路由算法,采用多维方式降低路由芯片端口冲突,优化通信性能。本专利技术以物理节点的标记规则和网络路由交换方式为基础,感知物理节点之间的通信耦合的松紧强度,根据物理节点的形状和规则选择合适的相应的多层通信策略算法,根据不同的硬件资源选择满足一定条件的优化算法。此外,本专利技术通过感知消息通信的局部性,利用运算核心的空闲计算能力来加速芯片内邻近通信的消息性能。本专利技术的优点在于能够利用目标平台体系结构特征,充分挖掘目标平台的通信潜能,将无序通信变为有序通信,将一维通信变为多维通信,以达到获取最佳全交换集合通信性能的目的。此外,需要说明的是,除非特别指出,否则说明书中的术语“第一”、“第二”、“第三”等描述仅仅用于区分说明书中的各个组件、元素、步骤等,而不是用于表示各个组件、元素、步骤之间的逻辑关系或者顺序关系等。可以理解的是,虽然本专利技术已以较佳实施例披露如上,然而上述实施例并非用以限定本专利技术。对于任何熟悉本领域的技术人员而言,在不脱离本专利技术技术方案范围情况下,都可利用上述揭示的
技术实现思路
对本专利技术技术方案作出许多可本文档来自技高网
...
一种基于物理位置感知的集合通信方法

【技术保护点】
一种基于物理位置感知的集合通信方法,其特征在于包括:进行点对点通信时,通过物理位置感知,当目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。

【技术特征摘要】

【专利技术属性】
技术研发人员:何王全魏迪尹万旺刘勇
申请(专利权)人:无锡江南计算技术研究所
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1