一种集群的告警方法、装置、设置及存储介质制造方法及图纸

技术编号:24455385 阅读:31 留言:0更新日期:2020-06-10 15:23
本发明专利技术实施例公开了一种集群的告警方法、装置、设置及存储介质。该方法通过检测在集群中部署的各资源的、针对运行故障的事件信息;基于预置的分发策略,确定所述事件信息所关联的目标用户;将所述事件信息分发至所述目标用户,以对所述资源进行针对所述运行故障的维护操作,解决因以分析同一监控指标来确定集群的监控状态所带来的过度监控、缺乏针对性的问题,实现增加对集群中各资源的运行故障进行维护操作的针对性,减少发现和修复运行故障的时间,增加集群正常运行的持续时间,减少集群宕机的频率。

An alarm method, device, setting and storage medium of cluster

【技术实现步骤摘要】
一种集群的告警方法、装置、设置及存储介质
本专利技术实施例涉及集群的技术,尤其涉及一种集群的告警方法、装置、设置及存储介质。
技术介绍
容器集群是部署有多个容器的计算机集群。在容器集群中的容器或微服务都可以接受管理并有序接入外部环境,从而实现调度、负载均衡以及分配等任务。一般的,可以使用容器集群管理工具,对容器集群进行监控。该容器集群管理工具可以是Kubernetes,该Kubernetes简称K8s,是一个开源的、用于管理云平台中多个主机上的容器化的应用。容器集群管理工具主要的监控对象为集群中的容器单元(Pod)、宿主机、虚拟机以及集群的核心进程,监控的指标则可以包括中央处理单元(CentralProcessingUnit,CPU)、内存、磁盘输入输出(InputandOutput,IO)、网络标识号、核心进程的性能指标等。集群中的用户可以包括运维人员、开发人员等,专门负责对集群进行不同维度的维护操作,如开发人员对集群中的代码进行维护,运维人员对集群的配置进行维护。但是,对集群进行维护操作的维度不同,所使用的监控指标不本文档来自技高网...

【技术保护点】
1.一种集群的告警方法,其特征在于,包括:/n检测在集群中部署的各资源的、针对运行故障的事件信息;/n基于预置的分发策略,确定所述事件信息所关联的目标用户;/n将所述事件信息分发至所述目标用户,以对所述资源进行针对所述运行故障的维护操作。/n

【技术特征摘要】
1.一种集群的告警方法,其特征在于,包括:
检测在集群中部署的各资源的、针对运行故障的事件信息;
基于预置的分发策略,确定所述事件信息所关联的目标用户;
将所述事件信息分发至所述目标用户,以对所述资源进行针对所述运行故障的维护操作。


2.根据权利要求1所述的方法,其特征在于,所述检测在集群中部署的各资源的、针对运行故障的事件信息,包括:
确定部署在所述集群中的资源;
以预置的检测方式检测所述资源所发生的运行故障的类型;
生成与所述类型的运行故障相匹配的事件信息。


3.根据权利要求2所述的方法,其特征在于,所述检测方式包括:监听方式;
所述以预置的检测方式检测所述资源所发生的运行故障的类型,包括:
在监听方式下,监听关于所述资源的运行状态发生变更的变更事件;
响应于所述变更事件,以获取所述资源在运行状态发生变更时的状态数据;
基于所述状态数据,确定所述资源所发生的运行故障的类型。


4.根据权利要求3所述的方法,其特征在于,所述资源包括容器单元,所述容器单元的运行状态包括:所述容器单元处于崩溃状态、进程退出状态、待定状态;
所述基于所述状态数据,确定所述资源所发生的运行故障的类型,包括:
从所述状态数据中确定所述资源所处的运行状态;
当所述容器单元处于崩溃状态、进程退出状态、待定状态中的一个时,确定所述容器单元所发生的故障类型为运行崩溃故障、进程退出故障、待定故障中相对应的一个。


5.根据权利要求4所述的方法,其特征在于,所述资源包括容器单元,所述容器单元的运行状态包括:创建状态;
所述基于所述状态数据,确定所述资源所发生的运行故障的类型,还包括:
从所述状态数据中确定所述容器单元处于所述创建状态的持续时间;
当所述持续时间超过阈值的时间值时,确定所述容器单元所发生的运行故障的类型为创建超时故障。

【专利技术属性】
技术研发人员:王玉君毛茂德王华夏王兴刚
申请(专利权)人:广州虎牙科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1