一种中间件告警及智能恢复系统技术方案

技术编号:36539571 阅读:17 留言:0更新日期:2023-02-01 16:34
一种中间件告警及智能恢复系统,所述系统包括:中间件客户端,所述中间件客户端预先设置安装有AGENT程序算法,以收集发送主机指标信息、接收SERVER服务系统的服务操作命令及故障恢复命令;SERVER服务系统,所述SERVER服务系统通过KAFKA消息队列与中间件客户端建立通讯连接;故障恢复服务系统,所述故障恢复服务系统与SERVER服务系统建立通讯连接,以进行AI故障诊断和AI故障自愈处理操作,完成故障的诊断处理后,通知SERVER服务系统将故障处理详情在web显示装置上显示并通知工作人员;告警及故障信息处理器,所述告警及故障信息处理器与SERVER服务系统建立通讯连接,在告警及故障信息处理器上设有web显示装置,以显示告警信息和故障处理信息。和故障处理信息。和故障处理信息。

【技术实现步骤摘要】
一种中间件告警及智能恢复系统


[0001]本专利技术涉及一种中间件告警及智能恢复系统。

技术介绍

[0002]中间件是介于应用系统和系统软件之间的一类软件,它使用系统软件所提供的基础服务,衔接网络上应用系统的各个部分或不同的应用,能够达到资源共享、功能共享的目的。
[0003]随着业务规模越来越大,服务器主机数量越来越多,部署在主机上的中间件规模也越来越庞大,传统的告警人为处理故障会造成人力投入过多,存在大量重复性的处理工作;为了减少人力的大量工作,基于计算机AI处理故障的手段越来越重要,搭建故障处理库,收集历史故障恢复操作,再通过深度学习和大量模型训练,以使计算机AI处理故障成为了有效解决的手段。
[0004]而现有的人力告警处理方式稳定性和可靠性较差,不能保证平台的7*24稳定运行,实时性较差;同时工作人员的实际工作量较大,极易在监测过程中出现误差或疏漏,应用范围小,不能实现实时故障或问题检测,从而不能智能精准的实现告警检测。

技术实现思路

[0005]本专利技术实施例提供了一种中间件告警及智能恢复系统,结构设计合理,基于多个功能服务器组件的相互配合作用,替代现有人力处理方式,提升告警处理的稳定性和可靠性,保证平台的长时间稳定运行,实现实时监控和反馈,智能处理故障问题;同时也很大程度的减少工作人员的实际工作量,使工作人员可以投入更多的时间到更重要的工作中去,进一步保障平台的稳定运行,解决了现有技术中存在的问题。
[0006]本专利技术为解决上述技术问题所采用的技术方案是:
[0007]一种中间件告警及智能恢复系统,所述系统包括:
[0008]中间件客户端,所述中间件客户端预先设置安装有AGENT程序算法,以收集发送主机指标信息、接收SERVER服务系统的服务操作命令及故障恢复命令;
[0009]SERVER服务系统,所述SERVER服务系统通过KAFKA消息队列与中间件客户端建立通讯连接,用于主机指标信息的收集存储、检测异常指标、连接web显示装置显示告警及故障转移处理信息,并发送故障信息到故障恢复服务系统;
[0010]故障恢复服务系统,所述故障恢复服务系统与SERVER服务系统建立通讯连接,以进行AI故障诊断和AI故障自愈处理操作,完成故障的诊断处理后,通知SERVER服务系统将故障处理详情在web显示装置上显示并通知工作人员;
[0011]告警及故障信息处理器,所述告警及故障信息处理器与SERVER服务系统建立通讯连接,在告警及故障信息处理器上设有web显示装置,以显示告警信息和故障处理信息。
[0012]在SERVER服务系统上还连接有告警阈值配置装置,以设定中间件指标数据的相关阈值。
[0013]在故障恢复服务系统上还连接有存储器,所述存储器与SERVER服务系统建立通讯连接,在存储器内设有告警存储装置和故障处理存储装置。
[0014]在故障恢复服务系统上连接有故障处理数据库,所述故障处理数据库为SQL数据库。
[0015]所述web显示装置为web页面大屏,以显示监控主机概况、健康度、告警信息、告警恢复信息。
[0016]所述故障恢复服务系统的AI故障诊断和AI故障自愈采用深度学习、强化学习和复杂数值计算模型完成故障恢复。
[0017]所述SERVER服务系统采用微信通知的方式与工作人员进行通讯。
[0018]本专利技术采用上述结构,通过中间件客户端来安装AGENT程序算法以收集发送主机指标信息、接收SERVER服务系统的服务操作命令及故障恢复命令;通过SERVER服务系统进行主机指标信息的收集存储、检测异常指标、连接web显示装置显示告警及故障转移处理信息,并发送故障信息到故障恢复服务系统;通过故障恢复服务系统进行AI故障诊断和AI故障自愈处理操作,完成故障的诊断处理后,通知SERVER服务系统将故障处理详情在web显示装置上显示并通知工作人员;通过告警及故障信息处理器来显示告警信息和故障处理信息,具有稳定实用、精准安全的优点。
附图说明:
[0019]图1为本专利技术的结构示意图。
[0020]图2为本专利技术的中间件主机指标发送存储的流程示意图。
[0021]图3为本专利技术的中间件主机指标异常检测的流程示意图。
[0022]图4为本专利技术的故障处理详情的流程示意图。
具体实施方式:
[0023]为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本专利技术进行详细阐述。
[0024]如图1

4中所示,一种中间件告警及智能恢复系统,所述系统包括:
[0025]中间件客户端,所述中间件客户端预先设置安装有AGENT程序算法,以收集发送主机指标信息、接收SERVER服务系统的服务操作命令及故障恢复命令;
[0026]SERVER服务系统,所述SERVER服务系统通过KAFKA消息队列与中间件客户端建立通讯连接,用于主机指标信息的收集存储、检测异常指标、连接web显示装置显示告警及故障转移处理信息,并发送故障信息到故障恢复服务系统;
[0027]故障恢复服务系统,所述故障恢复服务系统与SERVER服务系统建立通讯连接,以进行AI故障诊断和AI故障自愈处理操作,完成故障的诊断处理后,通知SERVER服务系统将故障处理详情在web显示装置上显示并通知工作人员;
[0028]告警及故障信息处理器,所述告警及故障信息处理器与SERVER服务系统建立通讯连接,在告警及故障信息处理器上设有web显示装置,以显示告警信息和故障处理信息。
[0029]在SERVER服务系统上还连接有告警阈值配置装置,以设定中间件指标数据的相关阈值。
[0030]在故障恢复服务系统上还连接有存储器,所述存储器与SERVER服务系统建立通讯连接,在存储器内设有告警存储装置和故障处理存储装置。
[0031]在故障恢复服务系统上连接有故障处理数据库,所述故障处理数据库为SQL数据库。
[0032]所述web显示装置为web页面大屏,以显示监控主机概况、健康度、告警信息、告警恢复信息。
[0033]所述故障恢复服务系统的AI故障诊断和AI故障自愈采用深度学习、强化学习和复杂数值计算模型完成故障恢复。
[0034]所述SERVER服务系统采用微信通知的方式与工作人员进行通讯。
[0035]本专利技术实施例中的一种中间件告警及智能恢复系统的工作原理为:基于多个功能服务器组件的相互配合作用,替代现有人力处理方式,提升告警处理的稳定性和可靠性,保证平台的长时间稳定运行,实现实时监控和反馈,智能处理故障问题;同时也很大程度的减少工作人员的实际工作量,使工作人员可以投入更多的时间到更重要的工作中去,进一步保障平台的稳定运行,方便进行普及和推广,通用性强,对于提升平台长时间稳定性具有积极意义。
[0036]在整体方案中,主要包括中间件客户端,所述中间件客户端预先设置安装有AGENT程序算法,以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种中间件告警及智能恢复系统,其特征在于,所述系统包括:中间件客户端,所述中间件客户端预先设置安装有AGENT程序算法,以收集发送主机指标信息、接收SERVER服务系统的服务操作命令及故障恢复命令;SERVER服务系统,所述SERVER服务系统通过KAFKA消息队列与中间件客户端建立通讯连接,用于主机指标信息的收集存储、检测异常指标、连接web显示装置显示告警及故障转移处理信息,并发送故障信息到故障恢复服务系统;故障恢复服务系统,所述故障恢复服务系统与SERVER服务系统建立通讯连接,以进行AI故障诊断和AI故障自愈处理操作,完成故障的诊断处理后,通知SERVER服务系统将故障处理详情在web显示装置上显示并通知工作人员;告警及故障信息处理器,所述告警及故障信息处理器与SERVER服务系统建立通讯连接,在告警及故障信息处理器上设有web显示装置,以显示告警信息和故障处理信息。2.根据权利要求1所述的一种中间件告警及智能恢复系统,其特征在于:在SERVE...

【专利技术属性】
技术研发人员:程亚辉扈树锋赵书亭张晓刚
申请(专利权)人:海看网络科技山东股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1