一种Kubernetes集群的巡检方法、装置及应用制造方法及图纸

技术编号:36606591 阅读:16 留言:0更新日期:2023-02-04 18:29
本申请提出了一种Kubernetes集群的巡检方法、装置及应用,包括以下步骤:在Kubernetes集群中部署巡检工具并启动,获取Kubernetes集群的配置文件,正向巡检模块获取所述Kubernetes集群内的每种资源的详细列表清单得到正向巡检参数,将正向巡检参数载入到策略引擎中定义的查询请求模板中得到正向巡检结果;反向巡检模块创建命名空间,并在命名空间中自定义资源得到反向巡检参数,将反向巡检参数载入查询请求模板后对命名空间中的资源进行资源检测,得到反向巡检结果;将正向巡检结果和反向巡检结果进行汇总返回给用户。本方案通过将正向巡检与反向巡检相结合,可以对整个集群的全部资源进行全面的健康检查,判断Kubernetes集群中存在或者可能存在的问题。Kubernetes集群中存在或者可能存在的问题。Kubernetes集群中存在或者可能存在的问题。

【技术实现步骤摘要】
一种Kubernetes集群的巡检方法、装置及应用


[0001]本申请涉及云计算
,特别是涉及一种Kubernetes集群的巡检方法、装置及应用。

技术介绍

[0002]随着云计算行业近些年的快速发展,以Kubernetes项目为基础的容器云平台逐渐成为了各大厂商和用户的主流选择。Kubernetes作为一个大型的分布式集群平台,在生产环境大规模使用的过程中,必然会出现些许异常现象,通常针对这些异常现象,需要运维人员通过监控进行问题排查和修复,而集群规模大了之后,必然会导致人工查找问题效率低下,对整个集群的可用性造成了一定的挑战。
[0003]当前的原生Kubernetes集群中,运维人员对集训巡检通常都会采用逐个查看监控,发现异常问题并依次去解决的方式来运行,然而这种方法并不能系统性的展现整个集群的健康状况,且巡检效率低下,容易发现很多监控无法察觉的问题,因此亟需一套快速、完善的巡检方法,对Kubernetes集训中的各种资源进行全方面的健康检查,以帮助用户检测到整个集群当前存在以及可能存在的问题。

技术实现思路

[0004]本申请实施例提供了一种Kubernetes集群的巡检方法、装置及应用,可以对整个集群的全部资源进行全面的健康检查,判断Kubernetes集群中存在或者可能存在的问题。
[0005]第一方面,本申请实施例提供了一种Kubernetes集群的巡检方法,所述方法包括:
[0006]在Kubernetes集群中部署巡检工具,所述巡检工具由正向巡检模块、策略引擎、反向巡检模块组成;
[0007]启动所述巡检工具以获取Kubernetes集群的配置文件,所述正向巡检模块根据所述配置文件获取集群的版本信息和每种资源的详细列表清单;
[0008]在所述策略引擎中针对Kubernetes集群创建健康检查规则库,根据所述健康检查规则库对每种资源的详细列表清单进行检查得到正向巡检结果;
[0009]所述反向巡检模块在所述Kubernetes集群中创建一个命名空间,并在所述命名空间中根据所述每种资源的详细列表清单创建自定义资源,根据所述自定义资源得到自定义资源列表,根据所述健康检查规则库对所述自定义资源列表进行检查得到反向巡检结果;
[0010]所述巡检工具将所述正向巡检结果和所述反向巡检结果进行汇总得到汇总结果,将所述汇总结果返回给用户。
[0011]第二方面,本申请实施例提供了一种Kubernetes集群的巡检装置,包括:
[0012]部署模块:在Kubernetes集群中部署巡检工具,所述巡检工具由正向巡检模块、策略引擎、反向巡检模块组成;
[0013]启动模块:启动所述巡检工具以获取Kubernetes集群的配置文件,所述正向巡检模块根据所述配置文件获取集群的版本信息和每种资源的详细列表清单;
[0014]正向巡检模块:在所述策略引擎中针对Kubernetes集群创建健康检查规则库,根据所述健康检查规则库对每种资源的详细列表清单进行检查得到正向巡检结果;
[0015]反向巡检模块:所述反向巡检模块在所述Kubernetes集群中创建一个命名空间,并在所述命名空间中根据所述每种资源的详细列表清单创建自定义资源,根据所述自定义资源得到自定义资源列表,根据所述健康检查规则库对所述自定义资源列表进行检查得到反向巡检结果;
[0016]汇总模块:所述巡检工具将所述正向巡检结果和所述反向巡检结果进行汇总得到汇总结果,将所述汇总结果返回给用户。
[0017]第三方面,本申请实施例提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行一种Kubernetes集群的巡检方法。
[0018]第四方面,本申请实施例提供了一种可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序包括用于控制过程以执行过程的程序代码,所述过程包括一种Kubernetes集群的巡检方法。
[0019]本专利技术的主要贡献和创新点如下:
[0020]本申请实施例专利技术了一种Kubernetes集群的巡检方法,包括正向巡检和反向巡检,正向巡检利用策略引擎对各种类型资源的健康程度进行判断并返回正向巡检结果,反向巡检利用Kubernetes可以自定义生成资源的机制生成一系列待执行任务,并将执行结果进行返回作为反向巡检结果,在正向巡检环节中,本方案提供了一套策略引擎健康规则库,方便用户根据定义好的规则模板简化健康检查规则编写,并按照各自集群特点编写使用于自身集群的规则,弥补了当今业界对Kubernetes集群的异常问题排查困难的缺点;在反向巡检环节中,本专利技术实现了Kubernetes自定义资源及其控制器,用来完成一系列Kubernetes常规资源的声明周期管理,并记录下这期间每个步骤的执行结果,反馈当前集群是否存在健康隐患,从而造成部分资源无法创建或者访问的故障;本方案可以帮助用户寻找集群中可能存在的潜在问题,并先于用户发现,且分别从正向和反向两个角度对Kubernetes集群的资源做了健康状况的评估,给予用户一个完备的Kubernetes集群健康状况报告,不仅仅能够看到当前所有创建出来的资源的健康状况(正向巡检),也可以感知到集群中未创建的资源中可能存在的问题(反向巡检),给到用户有关整个集群一个充分全面的反馈。
[0021]本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
[0022]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0023]图1是根据本申请实施例的一种Kubernetes集群的巡检方法的流程图;
[0024]图2是根据本申请实施例的一种Kubernetes集群的巡检方法在实际应用中的效果示意图;
[0025]图3是根据本申请实施例的一种Kubernetes集群的巡检装置的结构框图;
[0026]图4是根据本申请实施例的电子装置的硬件结构示意图。
具体实施方式
[0027]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
[0028]需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种Kubernetes集群的巡检方法,其特征在于,包括:在Kubernetes集群中部署巡检工具,所述巡检工具由正向巡检模块、策略引擎、反向巡检模块组成;启动所述巡检工具以获取Kubernetes集群的配置文件,所述正向巡检模块根据所述配置文件获取集群的版本信息和每种资源的详细列表清单;在所述策略引擎中针对Kubernetes集群创建健康检查规则库,根据所述健康检查规则库对每种资源的详细列表清单进行检查得到正向巡检结果;所述反向巡检模块在所述Kubernetes集群中创建一个命名空间,并在所述命名空间中根据所述每种资源的详细列表清单创建自定义资源,根据所述自定义资源得到自定义资源列表,根据所述健康检查规则库对所述自定义资源列表进行检查得到反向巡检结果;所述巡检工具将所述正向巡检结果和所述反向巡检结果进行汇总得到汇总结果,将所述汇总结果返回给用户。2.根据权利要求1所述的Kubernetes集群的巡检方法,其特征在于,所述正向巡检模块对所述详细列表清单进行遍历得到遍历结果,将所述遍历结果进行封装得到每种资源的正向巡检参数,所述策略引擎根据所述健康检查规则库对每种资源构造查询请求模板,将所述正向巡检参数载入对应的所述查询请求模板进行决策得到正向巡检结果。3.根据权利要求1所述的一种Kubernetes集群的巡检方法,其特征在于,所述正向巡检模块将所述Kubernetes集群中获取的资源按照资源类型不同分为不同种类,获取每一种类资源对应的api组以及资源版本号,将每一种类资源的api组和资源版本号封装为查询请求得到每一种类资源的查询请求,将所述查询请求发送给所述Kubernetes集群的API服务器,所述API服务器根据所述查询请求对对应种类的资源进行查询,得到当前Kubernetes集群内每种资源的资源详情列表。4.根据权利要求2所述的一种Kubernetes集群的巡检方法,其特征在于,在“根据所述健康检查规则库对每种资源的详细列表清单进行检查”步骤中,所述健康检查规则库内置对每种资源的健康情况进行定义的健康检查规则,所述策略引擎针对所述健康检查规则库的每种资源的健康检查规则构造对应的查询请求模板,将每种资源的正向巡检参数载入对应资源的查询请求模板中得到正向查询请求,所述策略引擎根据所述正向查询请求进行决策得到正向巡检结果。5.根据权利要求1所述的一种Kubernetes集群的巡检方法,其特征在于,在“根据所述健康检查规则库对所述自定义资源列表进行检查得到反向巡检结果”步骤中,对所述自定义资源列表进行遍历,将遍历结果封装得到每种自定义资源的反向巡检参数,将每种自定义资源的反向巡检参数载入对应资源种类的查询请求模板中得到反向查询请求,所述策略引擎根据所述反向查询请求进行决策得到反向决策结果,根据所述反...

【专利技术属性】
技术研发人员:李圣权王勇彭大蒙来佳飞叶海斌
申请(专利权)人:城云科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1