【技术实现步骤摘要】
本专利技术涉及互联网
,特别涉及一种集群监控处理系统及方法。
技术介绍
目前,对于计算机集群系统的监控主要有两种监控方式,一种是集中式监控,适用于小型集群,将监控的信息从每一台计算机上采集回来,并统一汇总做告警,例如Nagios、Zabbix(Nagios和Zabbix均为网络监视工具)等;另外一种是分布式监控,适用于大型集群,大型集群的特点是计算机数量庞大,一般分布在多个数据中心,这种情况下集中式监控无法处理庞大的信息采集,因此使用分布式的监控方法进行监控并将监控到的数据放回到消息总线上集中处理,例如OpenStack(云计算管理平台)中的Monasca(项目名称)项目。在传统的集中式监控和分布式监控中,当告警发生时均需要运维人员来跟进处理,而处理告警的效率取决于运维人员的经验,效率低下。这种从监控到告警再到运维人员处理告警的模式已经无法满足当前这种大规模集群运维的需求。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术集 ...
【技术保护点】
一种集群监控处理系统,其特征在于,包括一中央控制器、多个监控容器以及多个目标服务器,该些监控容器用于存储与可处理事件对应的处理程序以及与待分析事件对应的分析程序;中央控制器用于将监控参数分别传输至该些监控容器,并将该些监控容器分发出去;该些监控容器用于根据该监控参数监控该些目标服务器,并在该些目标服务器出现的事件为可处理事件时执行与该出现的事件对应的处理程序并将处理结果传输至该中央控制器,在该些目标服务器出现的事件为待分析事件时执行与该出现的事件对应的分析程序并将分析结果传输至该中央控制器;该中央控制器用于在接收到该分析结果时发出告警。
【技术特征摘要】
1.一种集群监控处理系统,其特征在于,包括一中央控制器、多个监
控容器以及多个目标服务器,
该些监控容器用于存储与可处理事件对应的处理程序以及与待分析事
件对应的分析程序;
中央控制器用于将监控参数分别传输至该些监控容器,并将该些监控容
器分发出去;
该些监控容器用于根据该监控参数监控该些目标服务器,并在该些目标
服务器出现的事件为可处理事件时执行与该出现的事件对应的处理程序并
将处理结果传输至该中央控制器,在该些目标服务器出现的事件为待分析事
件时执行与该出现的事件对应的分析程序并将分析结果传输至该中央控制
器;
该中央控制器用于在接收到该分析结果时发出告警。
2.如权利要求1所述的集群监控处理系统,其特征在于,该些监控容
器分为多个类型,各类型的监控容器分别用于监控目标服务器的不同性能,
中央控制器还用于根据该些目标服务器的数量和该些监控容器的处理能力
确定各类型的监控容器的数量使得每个目标服务器的待监控性能均被监控。
3.如权利要求1或2所述的集群监控处理系统,其特征在于,该监控
参数包括监控频率和/或访问密钥。
4.如权利要求1所述的集群监控处理系统,其特征在于,该些监控容
器均使用Docker。
5.一种集群监控处理方法,其特征在于,利用...
【专利技术属性】
技术研发人员:钱永超,
申请(专利权)人:携程计算机技术上海有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。