A system and method for scheduling highly parallel applications executed by high-performance computing systems. The example processing system can include: control registers and communication cores coupled to control registers. A processing kernel can be configured to receive a node allocation request to receive the expected run time of the specified application and the number of nodes of the node cluster requested; in view of the node allocation request and the current load on the multiple nodes, the number of actual nodes to be assigned to the application should be assigned to the actual number of nodes to be assigned to the application. It optimizes cluster load criteria; and uses control registers to notify the actual number of applications.
【技术实现步骤摘要】
【国外来华专利技术】调度高度并行的应用本公开一般地涉及高性能计算机(HPC)系统,并且更具体地,涉及用于调度高度并行的应用的指令集架构支持。
技术介绍
高性能计算(HPC)系统可以包括被分组到一个或多个计算集群中的多个计算节点。计算节点可以由控制节点管理。附图说明通过示例的方式而不是通过限制的方式来说明本公开,并且在结合附图考虑时可以参考以下详细描述来更加全面地理解本公开。图1示意性地图示了依照本公开的一个或多个方面操作的示例高性能计算系统的框图。图2A-2B示意性地图示了依照本公开的一个或多个方面的各种集群配置。图3是依照本公开的一个或多个方面操作的示例处理系统的框图。图4描绘了依照本公开的一个或多个方面的用于确定节点集群中的应用配置的示例方法400的流程图。图5图示了依照本公开的一个或多个方面的打包数据类型。图6A图示了依照本公开的一个或多个方面的处理器微架构的元件。图6B图示了依照本公开的一个或多个方面的处理器微架构的元件。图7是依照本公开的一个或多个方面操作的处理器的框图。图8是依照本公开的一个或多个方面操作的处理器的框图。图9是依照本公开的一个或多个方面操作的片上系统的框图。图10是依照本公开的一个或多个方面操作的计算机系统的框图。图11图示了针对依照本公开的一个或多个方面操作的计算系统的另一示例框图。图12图示了以依照本公开的一个或多个方面操作的计算系统的示例形式的机器的图解表示。具体实施方式本文描述的是用于调度高度并行的应用的系统和方法。高性能计算(HPC)系统可以包括被分组到一个或多个计算集群中的多个计算节点。驻留在专用节点上或计算节点之一上的批量调度器可以用于调度 ...
【技术保护点】
1. 一种处理系统,包括:控制寄存器;以及通信耦合到控制寄存器的处理核;其中处理核用于:接收指定应用的预期运行时间和所请求的节点集群的节点数目的节点分配请求;鉴于节点分配请求和所述多个节点上的当前负载,确定要分配给所述应用的实际节点数目,其中要分配给所述应用的实际节点数目优化集群负载准则;并且使用控制寄存器通知所述应用实际节点数目。
【技术特征摘要】
【国外来华专利技术】2015.12.21 US 14/9763601.一种处理系统,包括:控制寄存器;以及通信耦合到控制寄存器的处理核;其中处理核用于:接收指定应用的预期运行时间和所请求的节点集群的节点数目的节点分配请求;鉴于节点分配请求和所述多个节点上的当前负载,确定要分配给所述应用的实际节点数目,其中要分配给所述应用的实际节点数目优化集群负载准则;并且使用控制寄存器通知所述应用实际节点数目。2.权利要求1所述的处理系统,其中通知所述应用实际节点数目包括:在用于存储与所述应用相关联的节点配置的存储器数据结构中存储实际节点数目;以及在控制寄存器中存储存储器数据结构的地址。3.权利要求2所述的处理系统,其中在控制寄存器中存储存储器数据结构的地址包括获取控制寄存器的锁定。4.权利要求1所述的处理系统,其中处理核还用于:使得应用使用实际节点数目来执行。5.权利要求1所述的处理系统,其中集群负载准则反映在某个时间段内保持未被指派给任何当前运行的应用的节点数目。6.权利要求1所述的处理系统,其中集群负载准则反映在某个时间段内保持未被指派给任何运行的应用的节点数目乘以时间段。7.权利要求1所述的处理系统,其中确定实际节点数目还包括:生成要调度的多个应用组合;确定针对每一个所生成的组合的集群负载准则的值;以及选择与集群负载准则的最优值相关联的组合。8.权利要求1-7中任一项所述的处理系统,其中处理系统被实现为片上系统(SoC)。9.一种方法,包括:通过处理设备接收指定应用的预期运行时间和所请求的节点集群的节点数目的节点分配请求;鉴于节点分配请求和所述多个节点上的当前负载,确定要分配给所述应用的实际节点数目,其中要分配给所述应用的实际节点数目优化集群负载准则;以及使用处理系统的控制寄存器通知所述应用实际节点数目。10.权利要求9所述的方法,其中通知所述应用实际节点数目包括:在用于存储与所述应用相关联的节点配置的存储器数据结构中存储实际节点数目;以及在控制寄存器中存储存储器数据结构的地址。11.权利要求10所述的方法,其中在控制寄存器中存储存储器数据结构的地址包括获取控制寄存器的锁定。12.权利要求9所述的方法,还包括:使得应用使用实际节点数目来执行。13.权利要求9所述的方法,其中集群负载准则反映在某个时间段内保持未被指派给任何当前运行的应用的节点数目。14.权利要求9所述的方法,其中集群负载准则反映在某个时间段内保持未被指派给任何运行的应用的节点数目...
【专利技术属性】
技术研发人员:P蒂里,E奥尔德艾哈迈德瓦尔,
申请(专利权)人:英特尔公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。