一种云平台的健康巡检调度管理方法、装置及电子设备制造方法及图纸

技术编号:23851698 阅读:59 留言:0更新日期:2020-04-18 08:59
本发明专利技术公开了一种云平台的健康巡检调度管理方法、装置及电子设备,该方法包括:获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各节点;响应于远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据;获取巡检数据,根据巡检数据和巡检阈值分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表;本发明专利技术将巡检任务异步发送至各节点上,巡检任务通过各节点异步执行并主动上报来完成,巡检请求与巡检任务的执行属于异步过程,巡检效率高,对系统性能影响小;且多个巡检任务同时执行但互不影响,容错率高。

A health inspection scheduling management method, device and electronic equipment based on cloud platform

【技术实现步骤摘要】
一种云平台的健康巡检调度管理方法、装置及电子设备
本专利技术属于云平台巡检
,更具体地,涉及一种云平台的健康巡检调度管理方法、装置及电子设备。
技术介绍
传统的数据中心服务模式下,运维人员需要对物理资源、云服务状态、云平台组件等进行周期性巡检。随着国内外云计算技术以及产品逐步成熟,云平台在各行业中的应用更加广泛,基于云计算产品的数据中心数量规模以及复杂度逐步上升,运维人员的手工巡检方式已经无法适应新的需求,因此基于云平台的数据中心需要更多的依赖自动化运维系统来完成周期性的巡检。对于大规模的数据中心,其包含的节点数量庞大,每次完整巡检的任务量大、时间长,需要对复杂的巡检任务进行编排处理,满足更为灵活的应用场景,因此对于巡检的任务编排能力提出了较高的要求。一般情况下,自动化运维过程中巡检任务如图1所示,平台健康巡检系统会根据设置的巡检时间自动开始对平台中的各节点进行巡检,在各节点上通过巡检脚本的执行获取到各节点上的巡检结果,生成巡检报告并通过FTP服务器、邮箱服务器等发送,整个过程几乎是个同步的流程,通过一次巡检请求来完成。然而在某些应用场景下,该方法会产生以下问题:1、单次巡检任务请求流程太长,资源利用效率太低。2、在云平台规模较大的情况下,由于巡检任务量较大,整体时间长,同步巡检请求会对巡检节点造成较大的负载压力。并且在openstack环境下长时间可能导致认证过期的问题。3、容错率较低,某些节点的巡检失败可能导致整个巡检任务不成功,而使得其他节点的巡检数据无法被成功获取到。
技术实现思路
针对现有技术的至少一个缺陷或改进需求,本专利技术提供了一种云平台的健康巡检调度管理方法、装置及电子设备,其目的在于解决现有的自动化巡检方式存在的巡检任务请求流程太长、资源利用效率太低,同步巡检请求会对巡检节点造成较大的负载压力以及容错率低的问题。为实现上述目的,按照本专利技术的第一个方面,提供了一种云平台的健康巡检调度管理方法,其特征在于,包括:获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各节点;响应于所述远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据;获取所述巡检数据,根据所述巡检数据和巡检阈值分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表。优选的,上述健康巡检调度管理方法还包括:实时监测和更新巡检任务的执行状态,所述执行状态包括任务建立、任务失败、执行中和任务完成。优选的,上述健康巡检调度管理方法,所述巡检任务包括本次巡检需要执行的子任务以及各子任务对应的巡检策略。优选的,上述健康巡检调度管理方法,所述巡检策略包括巡检节点、各巡检节点中的巡检对象及其所包含的巡检子对象、各巡检子对象对应的巡检开始时间和/或频率;所述巡检阈值为各巡检子对象的健康标准值。按照本专利技术的第二个方面,还提供了一种云平台的健康巡检调度管理装置,包括:调度管理模块,用于获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各执行模块;并用于获取各执行模块的巡检数据,根据所述巡检阈值和巡检数据分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表;多个执行模块,分别配置于待巡检的各节点上,响应于调度管理模块发送的远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据。优选的,上述健康巡检调度管理装置还包括状态监测模块,用于实时监测和更新巡检任务的执行状态,所述执行状态包括任务建立、任务失败、执行中和任务完成。优选的,上述健康巡检调度管理装置还包括存储模块和查询模块;所述存储模块用于存储用户自定义的巡检策略和巡检阈值,以及调度管理模块生成的巡检结果表;所述查询模块用于接收外部的查询请求,根据查询请求提取并输出所述存储模块中的巡检结果表。优选的,上述健康巡检调度管理装置,所述巡检任务包括本次巡检需要执行的子任务以及各子任务对应的巡检策略。优选的,上述健康巡检调度管理方法,所述巡检策略包括巡检节点、各巡检节点中的巡检对象及其所包含的巡检子对象、各巡检子对象对应的巡检开始时间和/或频率;所述巡检阈值为各巡检子对象的健康标准值。按照本专利技术的第三个方面,还提供了一种电子设备,包括至少一个处理单元、以及至少一个存储单元,其中,所述存储单元存储有计算机程序,当所述程序被所述处理单元执行时,使得所述处理单元执行上述任一项所述方法的步骤。总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,能够取得下列有益效果:本专利技术提供的一种云平台的健康巡检调度管理方法、装置及电子设备,调度管理模块将巡检任务异步发送至各节点上的执行模块,由执行模块去执行巡检脚本对对应的节点进行巡检,并在对应节点上的巡检任务完成后主动请求调度管理模块去更新巡检任务状态,巡检请求与巡检任务的执行属于异步过程,优点在于:(1)容错率高,部分节点巡检异常出错不影响其他节点的巡检结果以及巡检任务进程;(2)对各个节点的巡检任务通过各节点异步执行并主动上报来完成,效率高,对系统性能影响小;(3)在多个巡检任务同时进行的时候,互不影响,且在大规模场景下不会出现超时等问题。附图说明图1是传统的自动化运维过程的巡检流程图;图2是实施例一提供的健康巡检调度管理方法的流程图;图3是实施例一提供的健康巡检调度管理装置的逻辑框图;图4是实施例二提供的健康巡检调度管理装置的组成架构示意图;图5是实施例二提供的健康巡检调度管理方法的交互流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。此外,下面所描述的本专利技术各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。实施例一图2是本实施例提供的一种云平台的健康巡检调度管理方法的流程图,参见图2,该方法包括以下步骤:S1:获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各节点;首先采集用户自行设置的巡检策略和巡检阈值并存储在数据库中,根据该巡检策略、云平台中的节点数量和节点类型创建巡检任务并记录本次巡检的所有子任务;该巡检任务包括本次巡检需要执行的子任务以及各子任务对应的巡检策略;巡检策略包括巡检节点、各巡检节点中的巡检对象及其所包含的巡检子对象、各巡检子对象对应的巡检开始时间和/或频率;巡检阈值代表各巡检子对象的健康标准值;本实施例中,将各节点中不同的巡检对象或巡检子对象的巡检事件定义为本次巡检任务中的一本文档来自技高网
...

【技术保护点】
1.一种云平台的健康巡检调度管理方法,其特征在于,包括:/n获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各节点;/n响应于所述远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据;/n获取所述巡检数据,根据所述巡检数据和巡检阈值分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表。/n

【技术特征摘要】
1.一种云平台的健康巡检调度管理方法,其特征在于,包括:
获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各节点;
响应于所述远程调用请求选择执行与巡检任务对应的巡检脚本,采集对应节点的巡检数据;
获取所述巡检数据,根据所述巡检数据和巡检阈值分别判断各节点的巡检对象是否健康,并基于判断结果生成巡检结果表。


2.如权利要求1所述的健康巡检调度管理方法,其特征在于,还包括:
实时监测和更新巡检任务的执行状态,所述执行状态包括任务建立、任务失败、执行中和任务完成。


3.如权利要求1或2所述的健康巡检调度管理方法,其特征在于,所述巡检任务包括本次巡检需要执行的子任务以及各子任务对应的巡检策略。


4.如权利要求3所述的健康巡检调度管理方法,其特征在于,所述巡检策略包括巡检节点、各巡检节点中的巡检对象及其所包含的巡检子对象、各巡检子对象对应的巡检开始时间和/或频率;所述巡检阈值为各巡检子对象的健康标准值。


5.一种云平台的健康巡检调度管理装置,其特征在于,包括:
调度管理模块,用于获取用户自定义的巡检策略和巡检阈值,根据所述巡检策略、云平台中的节点数量以及节点类型创建巡检任务,生成远程调用请求并将其异步发送至各执行模块;
并用于获取各执行模块的巡检数据,根据所述巡检阈值和巡检数据分别判断各...

【专利技术属性】
技术研发人员:陈秉蔚张洪涛李寒雨
申请(专利权)人:烽火通信科技股份有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1