【技术实现步骤摘要】
【国外来华专利技术】用于多核处理系统中的域分解感知处理器分配的系统、方法和计算机可存取介质
[0001]相关申请的交叉引用
[0002]本申请涉及并且要求2019年6月12日提交的美国专利申请第62/860,480号和2019年12月12日提交的美国专利申请第62/947,375号的优先权,上述美国专利申请的全部公开内容通过引用并入本文。
[0003]本公开总体上涉及多核处理,更具体地,涉及用于多核处理系统中的域分解感知处理器分配的示例性系统、方法和计算机可存取介质的示例性实施方式。
技术介绍
[0004]在2007年至2018年之间,在高性能计算(“HPC”)中使用的处理器设计从每个处理器4个核增长到28个核,并且互连带宽从大约1Gbps增长到大约100Gbps。然而,自2018年中期以来,已经有将处理器核的计数提升到64(例如,每个双处理器计算节点有128个核)的新的突破性的处理器设计。这些新的处理器设计显著降低了计算成本,提供了更高的经济效率。不幸的是,互连技术没有跟上处理器价格和性能的改进。
[0005]随着每个处理器的核数的增加,对处理器与计算机之间的扩展通信的需求也增加。多轨互连端口的使用可以通过促进多于1个互连链路以在节点之间传输数据来促进以太网、Omnipath和Mellanox Infmiband之类的扩展。不幸的是,这需要互连基础设施的尺寸和成本的两倍、三倍或者甚至四倍。因此,这降低或消除了大型核计数处理器系统的价格优势。
[0006]实际上,为了使互连电缆所维持的带宽加倍,光纤或铜电 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种非暂态计算机可存取介质,其上存储有用于将多个任务分配给多个计算节点的计算机可执行指令,其中,当计算机装置执行所述指令时,所述计算机装置被配置成执行以下过程,所述过程包括:接收与所述计算节点相关的第一信息,其中,所述第一信息包括所述计算节点中的每一个中的核的数目;通过分离所述计算节点中的每一个中的核的数目来生成第二信息;以及基于所述第二信息将所述任务分配给所述计算节点。2.根据权利要求1所述的计算机可存取介质,其中,所述第一信息还包括:(i)所述计算节点中的每一个之间的网络连接的距离;以及(ii)所述网络连接的带宽。3.根据权利要求1所述的计算机可存取介质,其中,所述第一信息还包括到至少一个最近相邻节点的距离。4.根据权利要求1所述的计算机可存取介质,其中,所述计算机装置被配置成:基于所述任务来生成所述第二信息。5.根据权利要求4所述的计算机可存取介质,其中,所述计算机装置被配置成:基于所述任务的维数来生成所述第二信息。6.根据权利要求4所述的计算机可存取介质,其中,所述计算机装置还被配置成:获得与和所述任务中的至少一个相关联的至少一个问题特性相关的信息;以及基于所述至少一个问题特性将所述任务分配给所述计算节点。7.根据权利要求6所述的计算机可存取介质,其中,所述至少一个问题特性包括以下中的至少一个:(i)网格中的第一维数;(ii)所述网格的至少一个轴中的第二维数;或者(iii)所述网格在消息传递接口进程中的第三点数。8.根据权利要求6所述的计算机可存取介质,其中,所述计算机装置被配置成:基于所述至少一个问题特性来确定最佳子网格布局;以及基于所述最佳子网格布局来分配所述任务。9.根据权利要求1所述的计算机可存取介质,其中,所述计算机装置被配置成:基于所述节点之间的通信数目的最小化来分配所述任务。10.根据权利要求1所述的计算机可存取介质,其中,所述任务是消息传递接口进程。11.根据权利要求1所述的计算机可存取介质,其中,所述计算机装置还被配置成:确定所述计算节点的计算拓扑。12.根据权利要求11所述的计算机可存取介质,其中,所述计算机装置被配置成:在确定所述计算拓扑之后生成所述第二信息。13.根据权利要求11所述的计算机可存取介质,其中,所述计算机装置还被配置成:确定与所述计算拓扑中的变化相关的第三信息;通过基于所述第三信息分离所述核的数目来生成第四信息;以及基于所述第三信息和所述第四信息来重新分配所述任务。14.根据权利要求1所述的计算机可存取介质,其中,所述计算机装置被配置成:轮询所述计算节点;以及基于所述轮询来生成所述第一信息。15.根据权利要求1所述的计算机可存取介质,其中,所述计算机装置被配置成:生成所
述第二信息,并且使用工作负荷管理器来分配所述任务。16.根据权利要求1所述的计算机可存取介质,其中,所述计算机装置还被配置成:执行至少一个模拟,所述至少一个模拟包括:模拟所述任务到所述计算节点的分配;以及基于所述至少一个模拟来分配所述任务。17.根据权利要求1所述的计算机可存取介质,其中,所述计算机装置被配置成:基于至少一个应用统计来执行所述至少一个模拟。18.根据权利要求17所述的计算机可存取介质,其中,所述至少一个应用统计包括来自至少一个先前模拟的统计。19.一种用于将多个任务分配给多个计算节点的系统,包括:计算机硬件装置,所述计算机硬件装置被配置成:接收与所述计算节点相关的第一信息,其中,所述第一信息包括所述计算节点中的每一个中的核的数目;通过分离所述计算节点中的每一个中的核的数目来生成第二信息;以及基于所述第二信息将所述任务分配给所述计算节点。20.根据权利要求19所述的系统,其中,所述第一信息还包括:(i)所述计算节点中的每一个之间的网络连接的距离;以及(ii)所述网络连接的带宽。21.根据权利要求19所述的系统,其中,所述第一信息还包括到至少一个最近相邻节点的距离。22.根据权利要求19所述的系统,其中,所述计算机硬件装置被配置成:基于所述任务来生成所述第二信息。23.根据权利要求22所述的系统,其中,所述计算机硬件装置被配置成:基于所述任务的维数来生成所述第二信息。24.根据权利要求22所述的系统,其中,所述计算机硬件装置还被配置成:获得与和所述任务中的至少一个相关联的至少一个问题特性相关的信息;以及基于所述至少一个问题特性将所述任务分配给所述计算节点。25.根据权利要求24所述的系统,其中,所述至少一个问题特性包括以下中的至少一个...
【专利技术属性】
技术研发人员:伯努瓦,
申请(专利权)人:纽约大学阿布扎比公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。