超级计算中心性能数据回传方法、系统及计算设备技术方案

技术编号:45412337 阅读:8 留言:0更新日期:2025-05-30 18:10
本发明专利技术公开了一种超级计算中心性能数据回传方法、系统及计算设备,超级计算中心的各计算节点被划分到多个子集群中;方法包括:对于每个子集群,通过子集群各计算节点上的各数据采集组件来定时采集各计算节点的性能数据,并转换为预定格式性能数据后发送至子集群的管理节点上的数据聚合组件;通过数据聚合组件对子集群各计算节点的预定格式性能数据进行聚合,并进行压缩处理得到子集群的压缩数据;通过数据接收组件接收各数据聚合组件经由管理网络发送的各子集群的压缩数据;通过数据处理组件对各子集群的压缩数据进行解压缩和格式转换,得到目标格式数据并存储。本发明专利技术能实现对超级计算中心的性能数据进行快速、高效、完整的采集、回传和存储。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种超级计算中心性能数据回传方法、超级计算中心性能数据回传系统及计算设备。


技术介绍

1、超大规模信创计算中心是指一种集中了大量国产信创计算资源、网络资源和存储资源的大型基础设施,其通常拥有成千上万甚至数十万个计算节点,通过并行计算、分布式计算等技术,能够实现每秒数亿次甚至更高的计算速度。超大规模信创计算中心微架构数据及性能数据的采集存在一定的技术难度,主要体现在如下几个方面:1)数据来源多样,且数据规模巨大,例如,一个拥有20万节点的超级计算中心,每个节点每秒产生15kb的性能数据,那么每秒数据量就高达2.86gb;2)实时性要求高,为了及时发现性能问题及优化系统性能,需要实时或准时采集性能数据,对数据采集的速度和传输延迟要求很高;3)网络带宽限制,为了数据采集不影响高速网络的使用,要求通过管理网络对采集的数据进行传输,管理网络的带宽通常是1gbps,大量的性能数据通过管理网络进行传输会给管理网络带来前所未有的带宽压力;4)性能数据可能包含敏感信息,如用户定制的性能指标数据、用户的涉密硬件信息等,存在数据安全和隐私问题。...

【技术保护点】

1.一种超级计算中心性能数据回传方法,所述超级计算中心的各个计算节点适于被划分到多个子集群中,每个所述子集群分别包含多个所述计算节点以及与多个所述计算节点通信连接的一个管理节点,每个所述子集群中的各个计算节点上分别部署有数据采集组件,每个所述子集群中的管理节点上部署有数据聚合组件;所述方法包括:

2.如权利要求1所述的方法,其中,各个子集群中的管理节点分别对应不同的当前发送时间;所述方法还包括:

3.如权利要求1或2所述的方法,其中,通过所述子集群中的管理节点上的数据聚合组件,对所述子集群中的各个计算节点的预定格式性能数据进行聚合,并进行压缩处理,得到所述子集群的...

【技术特征摘要】

1.一种超级计算中心性能数据回传方法,所述超级计算中心的各个计算节点适于被划分到多个子集群中,每个所述子集群分别包含多个所述计算节点以及与多个所述计算节点通信连接的一个管理节点,每个所述子集群中的各个计算节点上分别部署有数据采集组件,每个所述子集群中的管理节点上部署有数据聚合组件;所述方法包括:

2.如权利要求1所述的方法,其中,各个子集群中的管理节点分别对应不同的当前发送时间;所述方法还包括:

3.如权利要求1或2所述的方法,其中,通过所述子集群中的管理节点上的数据聚合组件,对所述子集群中的各个计算节点的预定格式性能数据进行聚合,并进行压缩处理,得到所述子集群的压缩数据,包括:

4.如权利要求1-3中任一项所述的方法,其中,所述数据接收组件为kafka集群;通过数据接收组件,接收各个所述数据聚合组件经由管理网络发送的各个所述子集群的压缩数据,包括:

5.如权利要求1-4中任一项所述的方法,其中,通过数据处理组件,对各个所述子集群的压缩数据进行解压缩和格式转换...

【专利技术属性】
技术研发人员:赵鸿冰田磊
申请(专利权)人:北京并行科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1