容器集群的监控告警方法及装置制造方法及图纸

技术编号:40590975 阅读:28 留言:0更新日期:2024-03-12 21:51
本申请公开了一种容器集群的监控告警方法及装置。其中,该方法包括:获取容器集群在目标维度的第一性能指标数据序列,并确定目标维度对应的目标性能指标阈值;对第一性能指标数据序列进行目标预处理操作,得到第二性能指标数据序列;利用预训练的数据预测大模型对第二性能指标数据序列进行分析处理,得到容器集群在未来目标时刻的目标维度的第三性能指标数据;分别将第二性能指标数据和第三性能指标数据与目标性能指标阈值进行比较,并依据比较结果生成对应的告警提示信息。本申请解决了传统的容器集群监控方案缺乏智能性和自适应性,难以满足使用需求的技术问题。

【技术实现步骤摘要】

本申请涉及云计算,具体而言,涉及一种容器集群的监控告警方法及装置


技术介绍

1、在现代云计算环境中,通常使用kubernetes管理云平台中多个主机上的容器化的应用,kubernetes可以为应用程序提供稳定的运行环境。传统的kubernetes集群监控主要依赖于诸如prometheus这样的时间序列数据库,以及grafana这样的可视化工具。这些工具能够从kubernetes组件,如kube-apiserver和kube-controller-manager中,捕获并展示关于集群健康、性能和资源使用的详细指标。

2、然而,这类传统的监控方法主要基于静态阈值来设置告警,例如当cpu使用率超过90%时发出告警。但这种方法存在一定弊端:该方法只能观察到当前集群的使用情况,无法发现集群潜在的问题并且无法预测未来的资源需求,同时,静态阈值可能无法适用所有场景,在高变化性的应用场景下,静态阈值可能导致大量的误报、漏报现象,而固定的告警阈值需要视集群的资源使用情况频繁的手动调整,进而增加了集群运维的负担。

3、针对上述的问题,目前尚未提出有效本文档来自技高网...

【技术保护点】

1.一种容器集群的监控告警方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,获取容器集群在目标维度的第一性能指标数据序列,包括:

3.根据权利要求1所述的方法,其特征在于,确定所述目标维度对应的目标性能指标阈值,包括:

4.根据权利要求2所述的方法,其特征在于,对所述第一性能指标数据序列进行目标预处理操作,得到第二性能指标数据序列,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述数据预测大模型的训练过程包括:

7.根据权利要求3述的方...

【技术特征摘要】

1.一种容器集群的监控告警方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,获取容器集群在目标维度的第一性能指标数据序列,包括:

3.根据权利要求1所述的方法,其特征在于,确定所述目标维度对应的目标性能指标阈值,包括:

4.根据权利要求2所述的方法,其特征在于,对所述第一性能指标数据序列进行目标预处理操作,得到第二性能指标数据序列,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述数据预测大模型的训练过程包括:

7.根据权利要求3述的方法,其特...

【专利技术属性】
技术研发人员:阮宜龙张云龙汤文峰
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1