Kubernetes组件的监控方法及服务器技术

技术编号:34483803 阅读:28 留言:0更新日期:2022-08-10 09:00
本申请实施例公开了一种Kubernetes组件的监控方法及服务器,属于云应用技术领域。该方法包括:基于监控内容确定监控pod的监控对象,监控内容为检测监控对象的网络连通性或功能完整性;通过监控pod与监控对象进行网络通信,确定监控对象对应的监控结果;响应于监控结果指示监控对象运行异常,向监控终端发送告警信息,告警信息用于指示异常组件以及异常类型。通过在集群中配置并启动预编写的监控资源文件,调用目标节点设备中的监控pod,即可对集群中的Kubernetes组件的运行状态进行监控,并提供可配置的处理策略,在组件发生故障或存在紧急情况时,对其进行处理以及告警,从而降低监控人员的工作量,节约成本开支。节约成本开支。节约成本开支。

【技术实现步骤摘要】
Kubernetes组件的监控方法及服务器


[0001]本申请实施例涉及云应用
,特别涉及一种Kubernetes组件的监控方法及服务器。

技术介绍

[0002]Kubernetes是当前主流的容器编排引擎,集群中存在着数量巨大的组件,例如服务(service)、分离舱(pod)、访问权(ingress)等,在运行过程中各种组件不可避免会出现故障。组件运行时若出现了各种故障,需要及时发出告警使运维人员知晓,以供处理,避免更大损失。
[0003]相关技术中,Kubernetes具有监控运行工具,如仪表盘(dashboard)和grafana等,可以查看到Kubernetes集群中部分组件如节点(node)、pod的运行状态等信息。
[0004]然而,上述监控运行工具只能简单地查看到pod和node是否处于运行状态,但是对于能否正常运行、正确地对外提供服务等状况无法得知,且只能针对部分组件进行监控,对于service、ingress等组件无法很好地进行监控,并且未与告警系统进行整合。以上缺点导致Kubernetes没有一套覆盖本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种Kubernetes组件的监控方法,其特征在于,所述方法应用于运行有Kubernetes的分布式集群中的目标节点设备,所述目标节点设备中创建有监控分离舱pod,所述监控pod是基于监控资源文件创建的,所述分布式集群由至少两个节点设备组成,所述方法包括:基于监控内容确定所述监控pod的监控对象,所述监控内容为检测所述监控对象的网络连通性或功能完整性,所述监控对象为部署在所述分布式集群中的Kubernetes组件或设备;通过所述监控pod与所述监控对象进行网络通信,确定所述监控对象对应的监控结果,所述监控结果用于指示所述监控对象的运行状态;响应于所述监控结果指示所述监控对象运行异常,向监控终端发送告警信息,所述告警信息用于指示异常组件以及异常类型。2.根据权利要求1所述的方法,其特征在于,所述目标节点设备为所述分布式集群中的所有节点设备,所述监控资源文件为守护进程内置资源DeamonSet文件;所述通过所述监控pod与所述监控对象进行网络通信,确定所述监控对象对应的监控结果,包括:响应于达到监控周期,通过第一监控pod与所述监控对象进行网络通信,确定所述监控对象的监控结果,所述第一监控pod是通过运行所述DeamonSet文件创建得到的。3.根据权利要求2所述的方法,其特征在于,所述基于监控内容确定所述监控pod的监控对象,包括:响应于所述监控内容为监控pod的网络连通性,确定所述监控对象为所述分布式集群中的pod;所述通过第一监控pod与所述监控对象进行网络通信,确定所述监控对象的监控结果,包括:基于因特网包探索器检测所述第一监控pod与第i个pod之间的网络连通性,i为正整数;响应于所述第i个pod满足第一网络连通条件,确定所述第i个pod的所述监控结果为网络连通正常,对第i+1个pod进行网络连通性检测,所述第一网络连通条件为连续n次检测中至少一次网络连通成功,n为正整数;响应于所述第i个pod不满足所述第一网络连通条件,且所述第i个pod不存在或所述pod标识改变,忽略/跳过所述第i个pod,对第i+1个pod进行网络连通性检测;响应于所述第i个pod不满足所述第一网络连通条件,所述第i个pod存在且所述pod标识未发生变化,对所述第i个pod进行二次检测,基于二次检测结果确定所述第i个pod的所述监控结果。4.根据权利要求3所述的方法,其特征在于,所述基于因特网包探索器检测所述第一监控pod与第i个pod之间的网络连通性之前,所述方法包括:获取所述第i个pod中容器的初始化进度;所述基于因特网包探索器检测所述第一监控pod与第i个pod之间的网络连通性,包括:响应于所述第i个pod中的所有容器初始化完成,基于所述因特网包探索器检测所述第一监控pod与所述第i个pod之间的网络连通性;
所述方法还包括:响应于所述第i个pod中存在未初始化的容器,确定所述第i个pod初始化异常并向所述监控终端发送所述告警信息。5.根据权利要求2所述的方法,其特征在于,所述基于监控内容确定所述监控pod的监控对象,包括:响应于所述监控内容为监控服务组件service的网络连通性,确定所述监控对象为所述分布式集群中的service;所述通过第一监控pod与所述监控对象进行网络通信,确定所述监控对象的监控结果,包括:获取service监控列表中第i个service的端点集endpoints以及端口,所述endpoints用于指示所述service对应的pod的访问地址;基于因特网包探索器检测所述第一监控pod与所述endpoints对应的pod之间的网络连通性;响应于所述第i个service满足第二网络连通条件,基于远程终端协议检测所述第一监控pod与所述端口之间的网络连通性,所述第二网络连通条件为连续m次检测中与各个pod之间至少一次网络连通成功,m为正整数;响应于所述第i个service满足第三网络连通条件,确定所述第i个service的所述监控结果为网络连通正常,对第i+1个service进行网络连通性检测,所述第三网络连通条件为连续m次检测中存在至少一次网络连通成功;响应于所述第i个service不满足所述第二网络连通条件或所述第三网络连通条件,确定所述第i个service的所述监控结果为网络连通异常。6.根据权利要求5所述的方法,其特征在于,所述基于因特网包探索器检测所述第一监控pod与所述endpoints对应的pod之间的网络连通性之前,所述方法包括:响应于所述第i个service所属的命名空间不属于指定命名空间或系统命名空间,获取所述第i个service的服务类型,所述指定命名空间为跳过service监控的命名空间;响应于所述第i个service的服务类型属于集群标识服务,获取所述endpoints;响应于所述第i个service绑定有endpoints,对所述第i个service进行网络连通性监控。7.根据权利要求1所述的方法,其特征在于,所述目标节点设备为所述分布式集群中配置有部署内置资源Deployment文件的节点设备;所述通过所述监控pod与所述监控对象进行网络通信,确定所述监控对象对应的监控结果,包括:响应于达到监控周期,通过第二监控pod与所述监控对象进行网络通信,确定所述监控对象的所述监控结果,所述第二监控pod是通过运行所述Deployment文件创建得到的。8.根据权利要求7所述的...

【专利技术属性】
技术研发人员:林智勇
申请(专利权)人:上海远景科创智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1