当前位置: 首页 > 专利查询>吉林大学专利>正文

一种集群数据处理方法、装置、设备及介质制造方法及图纸

技术编号:43633132 阅读:33 留言:0更新日期:2024-12-11 15:14
本申请公开了一种集群数据处理方法、装置、设备及介质,涉及计算机技术领域,包括:收集计算节点多个维度的当前负载数据;对当前负载数据进行预处理,并通过多个不同主题的消息队列及根据预处理后负载数据的维度信息对预处理后负载数据进行分类存储;根据当前待分析指标从至少一个主题的消息队列存储的预处理后负载数据中获取与目标维度对应的第一数据;将第一数据输入至目标时间序列模型,以输出得到与目标维度对应的预测负载数据,将第一数据输入至目标随机森林分类模型,以输出得到与目标维度对应的安全状态评分。本申请基于消息队列的特点对传统信息收集存储技术进行改进,解决了传统技术开销大、响应慢以及IO量不均衡的问题。

【技术实现步骤摘要】

本专利技术涉及计算机,特别涉及一种集群数据处理方法、装置、设备及介质


技术介绍

1、高性能计算(high-performance computing,hpc)技术的发展是推动科学研究、工业创新和国家安全的重要力量。随着计算需求的不断增长和技术的快速演进,hpc技术在近些年取得了显著进展。同时,高性能计算集群需要一个实时的数据收集和分析方法,及实时响应并处理集群安全事件的装置。

2、传统技术之一基于系统运行日志进行数据收集与分析,也即使用专门的日志收集工具(fluentd、logstash、rsyslog等)集中收集各类日志,并将其转发到集中存储和处理平台,以实现实时监控、性能分析、故障诊断与安全分析。传统技术之二基于集群管理软件进行数据收集与分析,也即集群管理软件通常通过守护进程(slurmctld、slurmd)实时收集和传输集群中各个节点和作业的状态信息,并进行作业调度分析、资源使用分析、故障检测与诊断等。

3、然而,上述两种方法需要将用户的数据写入磁盘,再定期从磁盘读取数据进行分析,该形式给系统增加了大量额外系统io(输入/本文档来自技高网...

【技术保护点】

1.一种集群数据处理方法,其特征在于,包括:

2.根据权利要求1所述的集群数据处理方法,其特征在于,还包括:

3.根据权利要求2所述的集群数据处理方法,其特征在于,所述将所述第一数据输入至预先训练完的目标时间序列模型之前,还包括:

4.根据权利要求2所述的集群数据处理方法,其特征在于,所述将所述第一数据输入至预先训练完的目标随机森林分类模型之前,还包括:

5.根据权利要求1所述的集群数据处理方法,其特征在于,所述根据预处理策略对所述当前负载数据进行预处理,得到预处理后负载数据,包括:

6.根据权利要求1至5任一项所述的集群数据处...

【技术特征摘要】

1.一种集群数据处理方法,其特征在于,包括:

2.根据权利要求1所述的集群数据处理方法,其特征在于,还包括:

3.根据权利要求2所述的集群数据处理方法,其特征在于,所述将所述第一数据输入至预先训练完的目标时间序列模型之前,还包括:

4.根据权利要求2所述的集群数据处理方法,其特征在于,所述将所述第一数据输入至预先训练完的目标随机森林分类模型之前,还包括:

5.根据权利要求1所述的集群数据处理方法,其特征在于,所述根据预处理策略对所述当前负载数据进行预处理,得到预处理后负载数据,包括:

6.根据权利要求1至5任一项所述的集群数据...

【专利技术属性】
技术研发人员:于洪梅魏晓辉郇安渝吴旗徐海啸董飒岳恒山李翔
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1