【技术实现步骤摘要】
一种资源性能采集监控与告警系统
[0001]本专利技术涉及性能采集监控
,具体提供一种资源性能采集监控与告警系统。
技术介绍
[0002]在云计算,大数据等技术日趋成熟的情况下,用户的服务产品越来越多,用户对自有资源的资源使用情况、业务的运行状况和健康度,并及时收到异常告警做出反应的需求越来越迫切。监控作为一款可以对资源进行立体化监控的平台,监控告警的汇总及展示就显得尤为重要。
[0003]在业务规模不断增大、服务不断增多以及频繁变更的情况下,面对复杂的调用链路就带来一系列问题:如何快速发现问题,如何判断故障影响范围。监控作为底层基础设施的一环,是保障生产环境服务稳定性不可或缺的一部分,线上问题从发现到定位再到解决,通过监控和告警手段可以有效地覆盖「发现」和「定位」,甚至可以通过故障自愈等手段实现解决,服务开发和运维人员能及时有效地发现服务运行的异常,从而更有效率地排查和解决问题。Prometheus是一个开源的监控框架,它通过不同的组件完成数据的采集,数据的存储,告警,其中Prometheus server只 ...
【技术保护点】
【技术特征摘要】
1.一种资源性能采集监控与告警系统,其特征在于:包括数据收集层、数据提取层、数据展示层、告警规则配置层、告警发生层和用户展示层;所述数据收集层用于收集主机数据、系统数据和容器数据,并将收集到的数据进行规范化及存储;数据提取层用于将数据收集层获取到的数据进行规格化和过滤处理,提取需要的数据;数据展示层用于将数据收集层获取到的数据进行统一的展示;告警规则配置层用于根据数据展示层获取到的数据进行告警规则设置、告警阀值设置、告警联系人设置和告警方式设置;告警发生层用于在监控数据达到告警阀值时,进行告警;用户展示层将监控统计结果、告警故障结果进行统一展示。2.根据权利要求1所述的资源性能采集监控与告警系统,其特征在于:所述数据收集层根据业务及资源需求,搭建好集群,将集群作为监控目标,并在集群内安装exporter和cadvisor,获取集群性能数据。3.根据权利要求2所述的资源性能采集监控与告警系统,其特征在于:数据收集层通过exporter采集不同的监控指标,并通过Prometheus支持的数据格式暴露出来。4.根据权利要求3所述的资源性能采集监控与告警系统,其特征在于:...
【专利技术属性】
技术研发人员:于德江,魏金雷,杨继伟,
申请(专利权)人:浪潮云信息技术股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。