一种分布式IT自动化运维系统技术方案

技术编号:38772330 阅读:11 留言:0更新日期:2023-09-10 10:45
本发明专利技术提供的一种分布式IT自动化运维系统,所述系统包括代理模块、操作服务模块、服务编排模块、定时调度模块、场景模块、API网关、服务注册配置模块、运维管理模块、缓存模块和数据库模块,是适用于大规模网络环境、能满足多种业务场景IT自动化运维需求的分布式架构系统,其所有模块均可以各自独立横向扩展,实现操作性能扩展和高可用,能够有效解决目前多个IT自动化系统和工具分散建设、缺乏对IT基础设施统一操作管理和自服务能力、无法满足数字化时代对IT架构敏捷性要求的问题。时代对IT架构敏捷性要求的问题。时代对IT架构敏捷性要求的问题。

【技术实现步骤摘要】
一种分布式IT自动化运维系统


[0001]本专利技术涉及大规模网络环境领域,尤其涉及一种分布式IT自动化运维系统。

技术介绍

[0002]数字化转型在组织模式、内部流程、上下游合作模式等方面给企业经营理念带来深刻的变化,以应对越来越不确定、复杂化、个性化的内外部环境,敏捷的企业管理理念要求有与之相匹配的敏捷IT架构支撑。双模IT架构、分布式微服务应用架构、DevOps管理思想、云原生技术,在数字化时代构建与敏捷管理相适应的IT系统中发挥越来越重要作用,IT自动化是上述这些数字化转型支撑技术在质量和效率方面的催化剂,是推动数字化技术创造价值的引擎。
[0003]当前企业多个IT自动化系统和工具分散建设模式,缺乏对IT基础设施统一操作管理,不能为ITSM、DevOps、AI/MLOps系统提供安全、可靠、灵活的企业级IT基础设施操作自服务能力,无法满足数字化时代对IT架构敏捷性要求。

技术实现思路

[0004]鉴于上述问题,提出了本专利技术以便提供克服上述问题或者至少部分地解决上述问题的一种分布式IT自动化运维系统。
[0005]根据本专利技术的一个方面,提供了一种分布式IT自动化运维系统,所述系统包括:操作层、控制层、协调层、应用层、能力开放层,具体包括:
[0006]代理模块,为操作层部件,用于实现具体的自动化操作功能;
[0007]操作服务模块,为控制层部件,实现代理控制和分组管理;
[0008]服务编排模块,为协调层部件,实现自动化作业流程编排,接受各个场景模块的指令,执行自动化作业流程;
[0009]定时调度模块,为协调层部件,实现整个系统所有定时任务的触发执行;
[0010]场景模块,为应用层部件,实现特定应用场景功能;
[0011]API网关,为能力开放层部件,对外提供自动化服务能力;
[0012]服务注册配置模块,为全局管理部件,为除代理外的各个模块实例提供服务注册和集中配置管理;
[0013]运维管理模块,为全局管理部件,监控所有模块实例的健康状态;
[0014]数据存储模块,用于存储数据,包括缓存模块和数据库模块;
[0015]本专利技术提供的一种分布式IT自动化运维系统,所述系统包括:
[0016](1)代理模块以socket客户端身份与操作服务模块建立长连接,配置两个或以上操作服务模块地址实现主备模式高可用,当与当前操作服务模块通信异常时,代理模块自动切换到备份操作服务模块。
[0017](2)对于通过远程协议进行操作的IT资源对象,可以配置两个以上代理模块对这些IT资源对象进行操作,确保代理操作的高可靠性。操作服务模块从服务编排模块或者场
景模块接收到目标IT资源对象的操作指令后,从其中选择一个可用的代理执行操作。
[0018](3)对于代理所在宿主服务器的操作,可以将需要高可用或者负载分担的多个服务器划为一个组,服务编排模块或者场景模块将目标设备组发送给操作服务模块,操作服务模块按策略在同一个设备组的多个服务器之间进行任务分配,实现操作高可用。
[0019](4)上述三点确保从操作服务模块到代理到IT资源通信链路的高可用。
[0020](5)多个操作服务模块实现代理模块的分域管理,扩大自动化操作规模。操作服务模块负责维护其管理域范围内的IT资源对象、代理模块,并将三者通信关系维护在缓存模块中。代理启动时向操作服务模块注册自己,定时报告其负责操作的IT资源在线状态。当代理与当前连接的操作服务模块通信异常时自动切换到备份操作服务模块,后者自动更新缓存模块中的代理与操作服务模块连接关系。
[0021](6)运维管理模块通过心跳机制定时检测操作服务模块的在线状态,当操作服务模块离线时,会从缓存模块删除该操作服务模块及其下的所有代理、IT资源通信关系。
[0022](7)多个服务编排模块实现自动化流程的并行计算。服务编排模块定期向服务注册配置模块更新任务负载信息,场景模块、API网关模块、定时调度模块在调用编排服务模块执行自动化流程之前,先向服务注册配置模块申请负载最低的服务编排模块执行。服务编排模块在执行自动化流程的每个自动化任务时,根据目标IT资源找到操作服务模块,向其下发执行指令。服务编排模块将自动化流程实例信息、执行状态和结果信息写入数据库的同时也缓存在缓存模块中。正常情况下,操作服务模块向发送自动化任务的服务编排模块返回执行信息。如果发送自动化任务的服务编排模块出现故障,操作服务模块通过服务注册配置模块获取备份服务编排模块并返回自动化任务执行信息。新接管的服务编排模块从缓存模块中获取自动化流程实例信息,并驱动流程实例执行。
[0023](8)定时调度任务模块高可用。采用全局任务定时调度机制,由定时调度任务模块按设置的调度策略启动各个定时任务,具体任务执行由操作服务模块、服务编排模块、场景模块完成。结构上采用一主一从或者一主多从保证高可用,结合服务注册配置模块,本专利技术提出一种简化的选主算法,实现多个定时调度任务模块之间实时选主。
[0024](9)服务注册配置模块为本专利技术的分布式IT自动化运维系统除代理模块之外的所有模块提供服务注册和集中配置管理服务,采用多个模块集群结构。
[0025]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0026]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0027]图1为本专利技术实施例提供的系统结构示意图;
[0028]图2是本专利技术实施例提供的分布式操作示意图;
[0029]图3是本专利技术实施例提供的数据在各层间传递时带的寻址信息示意图;
[0030]图4是本专利技术实施例提供的分布式编排服务示意图;
[0031]图5是本专利技术实施例提供的选主算法流程图。
具体实施方式
[0032]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0033]本专利技术的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
[0034]下面结合附图和实施例,对本专利技术的技术方案做进一步的详细描述。
[0035]1、如图1所示,为本专利技术实施例系统结构示意图。
[0036]代理模块1部署在物理服务器或者虚机上,实现具体的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分布式IT自动化运维系统,其特征在于,所述运维系统包括:操作层、控制层、协调层、应用层、能力开放层,具体包括:代理模块,为操作层部件,用于实现具体的自动化操作功能;操作服务模块,为控制层部件,实现代理控制和分组管理;服务编排模块,为协调层部件,实现自动化作业流程编排,接受各个场景模块的指令,执行自动化作业流程;定时调度模块,为协调层部件,实现整个系统所有定时任务的触发执行;场景模块,为应用层部件,实现特定应用场景功能;API网关,为能力开放层部件,对外提供自动化服务能力;服务注册配置模块,为全局管理部件,为除代理外的各个模块实例提供;运维管理模块,为全局管理部件,监控所有模块实例的健康状态;缓存模块,用于实现自动化流程和操作相关的状态数据内存存储;数据库模块,用于保存各种配置参数、自动流程和操作相关的过程数据和结果数据。2.根据权利要求1所述的一种分布式IT自动化运维系统,其特征在于,所述系统支撑各种场景功能的服务编排模块是分布式的,在多个服务编排模块实例中并行执行多个自动化流程实例,自动化流程实例执行信息通过缓存模块实现全局共享;场景模块可以向任意一个服务编排模块发起自动化流程执行请求;在自动化流程实例执行过程中,当执行流程实例的服务编排模块宕机,备份服务编排模块会自动接管该自动化流程实例的执行;多个服务编排模块之间的相互故障转移机制是有序的、无需事先设置即可自动完成。3.根据权利要求1所述的一种分布式IT自动化运维系统,其特征在于,所述系统由操作服务模块和代理模块组成的自...

【专利技术属性】
技术研发人员:方宇炜
申请(专利权)人:神州数码系统集成服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1