【技术实现步骤摘要】
一种集群的告警方法、装置、设置及存储介质
本专利技术实施例涉及集群的技术,尤其涉及一种集群的告警方法、装置、设置及存储介质。
技术介绍
容器集群是部署有多个容器的计算机集群。在容器集群中的容器或微服务都可以接受管理并有序接入外部环境,从而实现调度、负载均衡以及分配等任务。一般的,可以使用容器集群管理工具,对容器集群进行监控。该容器集群管理工具可以是Kubernetes,该Kubernetes简称K8s,是一个开源的、用于管理云平台中多个主机上的容器化的应用。容器集群管理工具主要的监控对象为集群中的容器单元(Pod)、宿主机、虚拟机以及集群的核心进程,监控的指标则可以包括中央处理单元(CentralProcessingUnit,CPU)、内存、磁盘输入输出(InputandOutput,IO)、网络标识号、核心进程的性能指标等。集群中的用户可以包括运维人员、开发人员等,专门负责对集群进行不同维度的维护操作,如开发人员对集群中的代码进行维护,运维人员对集群的配置进行维护。但是,对集群进行维护操作的维度不同 ...
【技术保护点】
1.一种集群的告警方法,其特征在于,包括:/n检测在集群中部署的各资源的、针对运行故障的事件信息;/n基于预置的分发策略,确定所述事件信息所关联的目标用户;/n将所述事件信息分发至所述目标用户,以对所述资源进行针对所述运行故障的维护操作。/n
【技术特征摘要】 【专利技术属性】
1.一种集群的告警方法,其特征在于,包括:
检测在集群中部署的各资源的、针对运行故障的事件信息;
基于预置的分发策略,确定所述事件信息所关联的目标用户;
将所述事件信息分发至所述目标用户,以对所述资源进行针对所述运行故障的维护操作。
2.根据权利要求1所述的方法,其特征在于,所述检测在集群中部署的各资源的、针对运行故障的事件信息,包括:
确定部署在所述集群中的资源;
以预置的检测方式检测所述资源所发生的运行故障的类型;
生成与所述类型的运行故障相匹配的事件信息。
3.根据权利要求2所述的方法,其特征在于,所述检测方式包括:监听方式;
所述以预置的检测方式检测所述资源所发生的运行故障的类型,包括:
在监听方式下,监听关于所述资源的运行状态发生变更的变更事件;
响应于所述变更事件,以获取所述资源在运行状态发生变更时的状态数据;
基于所述状态数据,确定所述资源所发生的运行故障的类型。
4.根据权利要求3所述的方法,其特征在于,所述资源包括容器单元,所述容器单元的运行状态包括:所述容器单元处于崩溃状态、进程退出状态、待定状态;
所述基于所述状态数据,确定所述资源所发生的运行故障的类型,包括:
从所述状态数据中确定所述资源所处的运行状态;
当所述容器单元处于崩溃状态、进程退出状态、待定状态中的一个时,确定所述容器单元所发生的故障类型为运行崩溃故障、进程退出故障、待定故障中相对应的一个。
5.根据权利要求4所述的方法,其特征在于,所述资源包括容器单元,所述容器单元的运行状态包括:创建状态;
所述基于所述状态数据,确定所述资源所发生的运行故障的类型,还包括:
从所述状态数据中确定所述容器单元处于所述创建状态的持续时间;
当所述持续时间超过阈值的时间值时,确定所述容器单元所发生的运行故障的类型为创建超时故障。
技术研发人员:王玉君,毛茂德,王华夏,王兴刚,
申请(专利权)人:广州虎牙科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。