System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 容器集群的监控告警方法及装置制造方法及图纸_技高网

容器集群的监控告警方法及装置制造方法及图纸

技术编号:40590975 阅读:23 留言:0更新日期:2024-03-12 21:51
本申请公开了一种容器集群的监控告警方法及装置。其中,该方法包括:获取容器集群在目标维度的第一性能指标数据序列,并确定目标维度对应的目标性能指标阈值;对第一性能指标数据序列进行目标预处理操作,得到第二性能指标数据序列;利用预训练的数据预测大模型对第二性能指标数据序列进行分析处理,得到容器集群在未来目标时刻的目标维度的第三性能指标数据;分别将第二性能指标数据和第三性能指标数据与目标性能指标阈值进行比较,并依据比较结果生成对应的告警提示信息。本申请解决了传统的容器集群监控方案缺乏智能性和自适应性,难以满足使用需求的技术问题。

【技术实现步骤摘要】

本申请涉及云计算,具体而言,涉及一种容器集群的监控告警方法及装置


技术介绍

1、在现代云计算环境中,通常使用kubernetes管理云平台中多个主机上的容器化的应用,kubernetes可以为应用程序提供稳定的运行环境。传统的kubernetes集群监控主要依赖于诸如prometheus这样的时间序列数据库,以及grafana这样的可视化工具。这些工具能够从kubernetes组件,如kube-apiserver和kube-controller-manager中,捕获并展示关于集群健康、性能和资源使用的详细指标。

2、然而,这类传统的监控方法主要基于静态阈值来设置告警,例如当cpu使用率超过90%时发出告警。但这种方法存在一定弊端:该方法只能观察到当前集群的使用情况,无法发现集群潜在的问题并且无法预测未来的资源需求,同时,静态阈值可能无法适用所有场景,在高变化性的应用场景下,静态阈值可能导致大量的误报、漏报现象,而固定的告警阈值需要视集群的资源使用情况频繁的手动调整,进而增加了集群运维的负担。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种容器集群的监控告警方法及装置,以至少解决传统的容器集群监控方案缺乏智能性和自适应性,难以满足使用需求的技术问题。

2、根据本申请实施例的一个方面,提供了一种容器集群的监控告警方法,包括:获取容器集群在目标维度的第一性能指标数据序列,并确定目标维度对应的目标性能指标阈值,其中,第一性能指标数据序列中包括:按时序排列的预设历史时间段内的多个性能指标数据和当前的第一性能指标数据;对第一性能指标数据序列进行目标预处理操作,得到第二性能指标数据序列,其中,第二性能指标数据序列中包括:与第一性能指标数据对应的第二性能指标数据;利用预训练的数据预测大模型对第二性能指标数据序列进行分析处理,得到容器集群在未来目标时刻的目标维度的第三性能指标数据;分别将第二性能指标数据和第三性能指标数据与目标性能指标阈值进行比较,并依据比较结果生成对应的告警提示信息。

3、可选地,获取容器集群在目标维度的第一性能指标数据序列,包括:利用目标性能监控工具获取容器集群在预设历史时间段和当前的目标维度的第一性能指标数据序列,其中,目标性能监控工具包括以下至少之一:prometheus工具、elasticsearch工具、influxdb工具、集群应用程序接口服务,目标维度包括以下至少之一:cpu使用率、内存使用率、磁盘输入输出、网络带宽、pod启动时间、应用程序接口服务的请求延迟。

4、可选地,确定目标维度对应的目标性能指标阈值,包括:确定容器集群当前已部署的微服务的类型和数量;依据预设函数关系对已部署的微服务的类型和数量进行计算,得到目标性能指标阈值,其中,目标性能指标阈值中包括:对应不同风险等级的多个性能指标阈值区间。

5、可选地,对第一性能指标数据序列进行目标预处理操作,得到第二性能指标数据序列,包括:对第一性能指标数据序列进行数据清洗操作,得到第三性能指标数据序列,其中,数据清洗操作包括以下至少之一:异常数据和噪声数据的检测及清理,缺失数据的插值处理,对不同性能监控工具采集的数据的时间对齐处理;对第三性能指标数据序列进行归一化处理,得到第四性能指标数据序列,其中,若第三性能指标数据序列中的离群值数量超过预设阈值,对第三性能指标数据序列进行robust标准化处理,若第三性能指标数据序列呈正态分布,对第三性能指标数据序列进行z-score标准化处理,否则,对第三性能指标数据序列进行min-max标准化处理;将第四性能指标数据序列作为第二性能指标数据序列。

6、可选地,确定与目标维度对应的多个数值分段区间;将第四性能指标数据序列中的每个指标数据用指标数据对应的数值分段区间进行离散化表示,得到第二性能指标数据序列。

7、可选地,数据预测大模型的训练过程包括:构建用于数据预测的大语言模型;获取多个历史时间段的目标维度的性能指标数据序列,并对每个性能指标数据序列进行目标预处理操作,得到多个训练样本;将多个训练样本划分为训练集和验证集;利用训练集对大语言模型进行迭代训练,并利用验证集对模型训练结果进行验证,直至得到满足预设要求的数据预测大模型;周期性利用新获取的性能指标数据序列重新对数据预测大模型进行训练,更新数据预测大模型的模型参数。

8、可选地,分别将第二性能指标数据和第三性能指标数据与目标性能指标阈值进行比较,并依据比较结果生成对应的告警提示信息,包括:将第二性能指标数据与目标性能指标阈值中的多个性能指标阈值区间进行匹配,若第二性能指标数据属于目标性能指标阈值区间,确定目标性能指标阈值区间对应的目标风险等级,并生成第一告警提示信息,其中,第一告警提示信息用于提示容器集群存在目标风险等级的问题需要处理;将第三性能指标数据与目标性能指标阈值中的多个性能指标阈值区间进行匹配,若第三性能指标数据属于目标性能指标阈值区间,确定目标性能指标阈值区间对应的目标风险等级,并生成第二告警提示信息,其中,第二告警提示信息用于提示容器集群可能发生目标风险等级的问题。

9、根据本申请实施例的另一方面,还提供了一种容器集群的监控告警装置,包括:获取模块,用于获取容器集群在目标维度的第一性能指标数据序列,并确定目标维度对应的目标性能指标阈值,其中,第一性能指标数据序列中包括:按时序排列的预设历史时间段内的多个性能指标数据和当前的第一性能指标数据;预处理模块,用于对第一性能指标数据序列进行目标预处理操作,得到第二性能指标数据序列,其中,第二性能指标数据序列中包括:与第一性能指标数据对应的第二性能指标数据;预测模块,用于利用预训练的数据预测大模型对第二性能指标数据序列进行分析处理,得到容器集群在未来目标时刻的目标维度的第三性能指标数据;告警模块,用于分别将第二性能指标数据和第三性能指标数据与目标性能指标阈值进行比较,并依据比较结果生成对应的告警提示信息。

10、根据本申请实施例的另一方面,还提供了一种非易失性存储介质,该非易失性存储介质包括存储的计算机程序,其中,非易失性存储介质所在设备通过运行该计算机程序执行上述的容器集群的监控告警方法。

11、根据本申请实施例的另一方面,还提供了一种电子设备,该电子设备包括:存储器和处理器,其中,存储器中存储有计算机程序,处理器被配置为通过计算机程序执行上述的容器集群的监控告警方法。

12、在本申请实施例中,获取容器集群在目标维度的第一性能指标数据序列,并确定目标维度对应的目标性能指标阈值,其中,第一性能指标数据序列中包括:按时序排列的预设历史时间段内的多个性能指标数据和当前的第一性能指标数据;对第一性能指标数据序列进行目标预处理操作,得到第二性能指标数据序列,其中,第二性能指标数据序列中包括:与第一性能指标数据对应的第二性能指标数据;利用预训练的数据预测大模型对第二性能指标数据序列进行分析处理,得到容器集群本文档来自技高网...

【技术保护点】

1.一种容器集群的监控告警方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,获取容器集群在目标维度的第一性能指标数据序列,包括:

3.根据权利要求1所述的方法,其特征在于,确定所述目标维度对应的目标性能指标阈值,包括:

4.根据权利要求2所述的方法,其特征在于,对所述第一性能指标数据序列进行目标预处理操作,得到第二性能指标数据序列,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述数据预测大模型的训练过程包括:

7.根据权利要求3述的方法,其特征在于,分别将所述第二性能指标数据和所述第三性能指标数据与所述目标性能指标阈值进行比较,并依据比较结果生成对应的告警提示信息,包括:

8.一种容器集群的监控告警装置,其特征在于,包括:

9.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的计算机程序,其中,所述非易失性存储介质所在设备通过运行所述计算机程序执行权利要求1至7中任意一项所述的容器集群的监控告警方法。

10.一种电子设备,其特征在于,包括:存储器和处理器,其中,所述存储器中存储有计算机程序,所述处理器被配置为通过所述计算机程序执行权利要求1至7中任意一项所述的容器集群的监控告警方法。

...

【技术特征摘要】

1.一种容器集群的监控告警方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,获取容器集群在目标维度的第一性能指标数据序列,包括:

3.根据权利要求1所述的方法,其特征在于,确定所述目标维度对应的目标性能指标阈值,包括:

4.根据权利要求2所述的方法,其特征在于,对所述第一性能指标数据序列进行目标预处理操作,得到第二性能指标数据序列,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述数据预测大模型的训练过程包括:

7.根据权利要求3述的方法,其特...

【专利技术属性】
技术研发人员:阮宜龙张云龙汤文峰
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1