System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种超算集群接入算力网络的方法及装置制造方法及图纸_技高网

一种超算集群接入算力网络的方法及装置制造方法及图纸

技术编号:40952944 阅读:3 留言:0更新日期:2024-04-18 20:28
本发明专利技术属于算力网络技术领域,具体涉及一种超算集群接入算力网络的方法及装置。该发明专利技术,在超算集群的边界部署超算集群网关,对接各种类型的集群管理软件,提供统一的用户管理、文件管理、资源管理和作业管理的接口,算网网络可以获取实时的算力资源状态,根据超算作业的算力需求和软件需求分配算力资源,并把超算作业发放到超算集群运行,能够把多个超算集群的算力资源接入算力网络,通过部署超算集群网关来适配各种超算集群,提供统一的资源管理和作业管理接口,提供超算资源管理、全局作业调度等能力,在算网网络增加全局作业调度能力,支持各种调度策略,根据资源需求和软件需求为超算作业分配集群和队列。

【技术实现步骤摘要】

本专利技术属于算力网络,具体涉及一种超算集群接入算力网络的方法及装置


技术介绍

1、高校、研究院、超算中心通常购买物理服务器、ib交换机、nas存储来搭建超算集群,部署集群管理软件来管理资源和作业。这些超算集群仅供内部人员使用,通常让用户登录头节点,通过命令行来查看资源和提交作业,没有提供对外的openapi,没有线上开账号的流程,不支持多租户,不提供资源管理、作业管理等功能的接口。这种超算集群是一些孤立的算力资源,没有与外部对接的能力,无法接入算力网络。


技术实现思路

1、本专利技术的目的是提供一种超算集群接入算力网络的方法,能够把多个超算集群的算力资源接入算力网络,通过部署超算集群网关来适配各种超算集群,提供统一的资源管理和作业管理接口,提供超算资源管理、全局作业调度等能力。

2、本专利技术采取的技术方案具体如下:

3、一种超算集群接入算力网络的方法,包括:

4、获取超算集群的环境数据,所述环境数据包括资源信息、软件信息和api信息;

5、根据超算集群网关获取的环境数据向超算集群注册中心发送注册请求,并将超算集群网关的api服务注册到超算api网关和超算文件网关;

6、获取注册请求中的集群列表,根据超算api网关调用查询集群列表的队列和资源信息的api;

7、根据超算集群的作业调度器类型,查询对应的请求协议和请求格式,调用作业调度器的查询队列和资源api;

8、根据获取到队列和资源信息,建立全局资源视图。

9、在一种优选方案中,所述资源信息包括节点规格、节点数量、历史资源利用率数据,所述软件信息包括编译器、数学库和应用软件,所述api信息包括集群api版本和服务地址。

10、在一种优选方案中,所述获取超算集群的环境数据的步骤,包括:

11、获取收集的超算集群环境数据的类型,所述类型包括资源、软件和api;

12、获取与超算集群通信链接建立;

13、获取集群的节点信息;

14、获取节点信息的历史资源利用率数据;

15、获取集群的api版本信息和服务地址;

16、将收集到节点信息和api整合并存储在数据结构中,并根据环境数据的类型分类成资源信息、软件信息和api信息。

17、在一种优选方案中,所述节点信息包括规格、数量和使用率。

18、在一种优选方案中,所述根据超算集群网关获取的环境数据向超算集群注册中心发送注册请求,并将超算集群网关的api服务注册到超算api网关和超算文件网关的步骤,包括:

19、整理超算集群网关获取的环境数据;

20、构建注册请求:

21、根据超算集群注册中心的接口规范和要求,构建注册请求;

22、通过通信协议建立与超算集群注册中心的通信链接;

23、将构建好的注册请求数据发送到超算集群注册中心;

24、注册中心确认了超算集群网关的注册,将超算集群网关的api服务信息注册到超算api网关和超算文件网关。

25、在一种优选方案中,所述获取注册请求中的集群列表,根据超算api网关调用查询集群列表的队列和资源信息的api的步骤,包括:

26、根据超算api网关的接口规范,构建一个集群列表查询请求;

27、通过通信协议建立与超算api网关的通信链接;

28、将构建好的集群列表查询请求发送到超算api网关的查询队列和资源信息的api端点。

29、在一种优选方案中,所述根据超算集群的作业调度器类型,查询对应的请求协议和请求格式,调用作业调度器的查询队列和资源api的步骤,包括:

30、根据超算集群的配置或预设信息,识别当前使用的作业调度器类型;

31、根据识别到的作业调度器类型,查找其对应的请求协议和请求格式;

32、基于识别到的协议和格式,构建符合作业调度器要求的查询请求;

33、建立与调度器的通信链接:

34、通过通信协议建立与作业调度器建立通信链接;

35、将构建好的查询请求发送到作业调度器的查询队列和资源api端点,获取队列和资源信息。

36、在一种优选方案中,所述根据获取到队列和资源信息,建立全局资源视图的步骤,包括:

37、获取队列和资源信息;

38、将收集到的队列和资源信息整合到数据库中;

39、获取全局资源视图。

40、本专利技术还提供了,一种超算集群接入算力网络的装置,用于上述超算集群接入算力网络的方法,包括:

41、超算集群网关模块,用于获取超算集群的环境数据,所述环境数据包括资源信息、软件信息和api信息;

42、超算集群注册中心模块,用于根据超算集群网关获取的环境数据向超算集群注册中心发送注册请求,并将超算集群网关的api服务注册到超算api网关和超算文件网关;

43、作业调度器模块,用于获取注册请求中的集群列表,根据超算api网关调用查询集群列表的队列和资源信息的api;

44、集群网关控制器模块,根据超算集群的作业调度器类型,查询对应的请求协议和请求格式,调用作业调度器的查询队列和资源api;

45、超算资源管理器模块,用于根据获取到队列和资源信息,建立全局资源视图。

46、以及,一种超算集群接入算力网络的终端,包括:

47、一个或多个处理器;

48、存储装置,其上存储有一个或多个程序;

49、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现所述超算集群接入算力网络的方法。

50、本专利技术取得的技术效果为:

51、本专利技术,在超算集群的边界部署超算集群网关,对接各种类型的集群管理软件,提供统一的用户管理、文件管理、资源管理和作业管理的接口,算网网络可以获取实时的算力资源状态,根据超算作业的算力需求和软件需求分配算力资源,并把超算作业发放到超算集群运行,能够把多个超算集群的算力资源接入算力网络,通过部署超算集群网关来适配各种超算集群,提供统一的资源管理和作业管理接口,提供超算资源管理、全局作业调度等能力;

52、本专利技术,在算网网络增加全局作业调度能力,支持各种调度策略,根据资源需求和软件需求为超算作业分配集群和队列。

本文档来自技高网...

【技术保护点】

1.一种超算集群接入算力网络的方法,其特征在于,包括:

2.根据权利要求1所述的超算集群接入算力网络的方法,其特征在于,所述资源信息包括节点规格、节点数量、历史资源利用率数据,所述软件信息包括编译器、数学库和应用软件,所述API信息包括集群API版本和服务地址。

3.根据权利要求1所述的超算集群接入算力网络的方法,其特征在于,所述获取超算集群的环境数据的步骤,包括:

4.根据权利要求3所述的超算集群接入算力网络的方法,其特征在于,所述节点信息包括规格、数量和使用率。

5.根据权利要求1所述的超算集群接入算力网络的方法,其特征在于,所述根据超算集群网关获取的环境数据向超算集群注册中心发送注册请求,并将超算集群网关的API服务注册到超算API网关和超算文件网关的步骤,包括:

6.根据权利要求1所述的超算集群接入算力网络的方法,其特征在于,所述获取注册请求中的集群列表,根据超算API网关调用查询集群列表的队列和资源信息的API的步骤,包括:

7.根据权利要求1所述的超算集群接入算力网络的方法,其特征在于,所述根据超算集群的作业调度器类型,查询对应的请求协议和请求格式,调用作业调度器的查询队列和资源API的步骤,包括:

8.根据权利要求7所述的超算集群接入算力网络的方法,其特征在于,所述根据获取到队列和资源信息,建立全局资源视图的步骤,包括:

9.一种超算集群接入算力网络的装置,应用于权利要求1至8任意一项所述的超算集群接入算力网络的方法,其特征在于,包括:

10.一种超算集群接入算力网络的终端,其特征在于,包括:

...

【技术特征摘要】

1.一种超算集群接入算力网络的方法,其特征在于,包括:

2.根据权利要求1所述的超算集群接入算力网络的方法,其特征在于,所述资源信息包括节点规格、节点数量、历史资源利用率数据,所述软件信息包括编译器、数学库和应用软件,所述api信息包括集群api版本和服务地址。

3.根据权利要求1所述的超算集群接入算力网络的方法,其特征在于,所述获取超算集群的环境数据的步骤,包括:

4.根据权利要求3所述的超算集群接入算力网络的方法,其特征在于,所述节点信息包括规格、数量和使用率。

5.根据权利要求1所述的超算集群接入算力网络的方法,其特征在于,所述根据超算集群网关获取的环境数据向超算集群注册中心发送注册请求,并将超算集群网关的api服务注册到超算api网关和超算文件网关的步骤...

【专利技术属性】
技术研发人员:曹俊杨锦
申请(专利权)人:天翼云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1