系统异常的处理方法及系统技术方案

技术编号:19327333 阅读:80 留言:0更新日期:2018-11-03 14:21
本发明专利技术属于计算机技术领域,尤其涉及系统异常的处理方法和系统。所述方法包括:通信端实时采集其系统运行信息,并将系统运行信息上报至监控节点;监控节点根据系统运行信息生成告警邮件,并将所述告警邮件发送至所述中心服务器,所述告警邮件中记录了出现系统异常的通信端及用于表示该通信端系统异常的运行数据;所述中心服务器将所述告警邮件中的所述运行数据输出至预设的处理方案数据库中进行匹配,获取与所述运行数据匹配的处理脚本;所述中心服务器将所述处理脚本推送至所述出现系统异常的通信端,所述处理脚本被所述出现系统异常的通信端接收后自动执行,用于处理系统异常。本发明专利技术实现了自动化的系统运维,同时也保证了系统运维的时效性。

System exception handling method and system

The invention belongs to the field of computer technology, in particular to the processing method and system of system anomalies. The method includes: the communication terminal collects the system operation information in real time and reports the system operation information to the monitoring node; the monitoring node generates the alarm mail according to the system operation information, and sends the alarm mail to the central server. The alarm mail records the communication terminal where the system abnormality occurs and the application for it. Represents the abnormal operation data of the communication terminal system; the central server outputs the operation data in the alarm mail to the preset processing scheme database for matching, and obtains the processing script matching the operation data; the central server pushes the processing script to the system abnormal occurrence. The communication terminal, the processing script is automatically executed after being received by the communication terminal which has system abnormalities, and is used to process system abnormalities. The invention realizes the automatic operation and maintenance of the system, and ensures the timeliness of the operation and maintenance of the system.

【技术实现步骤摘要】
系统异常的处理方法及系统
本专利技术属于计算机
,尤其涉及系统异常的处理方法及系统。
技术介绍
随着网络技术的不断发展,服务器、网关等网络设备被大规模地投入使用,网络的容量和拓扑复杂度都越来越大,这就导致了网络系统在运行的过程中不可避免地会出现各种系统异常。现阶段,主要通过监控工具来对系统进行监控,一旦出现系统异常,通常是以邮件或电话的方式将告警信息传递给相关的运维人员,再由运维人员对系统异常进行处理。然而,许多系统故障是重复出现的,且存在相同的处理方法,现有的系统异常处理方式会导致大量繁琐而又重复的工作产生,降低了系统的运维效率。
技术实现思路
有鉴于此,本专利技术实施例提供了系统异常的处理方法及系统,以解决目前网络设备在出现系统异常时运维效率低的问题。本专利技术实施例的第一方面提供了系统异常的处理方法,所述处理方法包括:通信端实时采集其系统运行信息,并将所述系统运行信息上报至监控节点;所述监控节点根据所述系统运行信息生成告警邮件,并将所述告警邮件发送至中心服务器,所述告警邮件中记录了出现系统异常的通信端及用于表示该通信端系统异常的运行数据;所述中心服务器将所述告警邮件中的所述运行数据输出至预设的处理方案数据库中进行匹配,获取与所述运行数据匹配的处理脚本;所述中心服务器将所述处理脚本推送至所述出现系统异常的通信端,所述处理脚本被所述出现系统异常的通信端接收后自动执行,用于处理系统异常。本专利技术实施例的第二方面提供了一种系统异常的处理系统,包括中心服务器以及分布式部署的多个通信端及多个监控节点,所述通信端用于实时采集其系统运行信息,并将所述系统运行信息上报至所述监控节点;所述监控节点用于根据所述系统运行信息生成告警邮件,并将所述告警邮件发送至所述中心服务器,所述告警邮件中记录了出现系统异常的通信端及用于表示该通信端系统异常的运行数据;所述中心服务器用于将所述告警邮件中的所述运行数据输出至预设的处理方案数据库中进行匹配,获取与所述运行数据匹配的处理脚本;所述中心服务器还用于将所述处理脚本推送至所述出现系统异常的通信端,所述处理脚本被所述出现系统异常的通信端接收后自动执行,用于处理系统异常。本专利技术实施例与现有技术相比存在的有益效果是:本专利技术实施例在现有网络中部署了中心服务器,并分布式部署了多个监控节点,网络中原有的通信端实时采集其系统运行信息,并将系统运行信息上报至监控节点,监控节点根据系统运行信息,为出现系统异常的通信端生成告警邮件并发送至中心服务器,以使中心服务器在预设的处理方案数据库中匹配出对应的处理脚本,并推送至通信端自动处理。从出现系统异常至恢复系统异常,整个过程在通信端、监控节点和中心服务器之间自动完成,实现了自动化的系统运维,同时也保证了系统运维的时效性,节省了运维人员的时间与精力。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。图1为本专利技术实施例提供的系统异常的处理系统的网络拓扑架构示意图;图2为本专利技术实施例提供的系统异常的处理方法的交互流程图;图3为本专利技术另一实施例提供的系统异常的处理方法的实现流程图;图4为本专利技术另一实施例提供的系统异常的处理方法的实现流程图;图5为本专利技术另一实施例提供的系统异常的处理方法的实现流程图;图6为本专利技术另一实施例提供的系统异常的处理方法的实现流程图;图7为本专利技术另一实施例提供的系统异常的处理方法的实现流程图;图8为本专利技术另一实施例提供的系统异常的处理方法的实现流程图;图9为本专利技术另一实施例提供的系统异常的处理方法的交互流程图;图10为本专利技术一实施例提供的网络节点的示意图。具体实施方式为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。图1为本专利技术实施例提供的系统异常的处理系统的网络拓扑架构示意图,为了便于说明,仅示出了与本实施例相关的部分。参照图1,该系统在网络中部署有中心服务器,并分布式部署有多个通信端及多个监控节点。其中,通信端可以为原先就已部署在网络中的各个网络节点,例如服务器、网关、路由等网络设备,以及计算机、智能家电、智能手机等终端设备。在本专利技术实施例中,对通信端中安装并运行的系统进行运维,一旦出现系统异常,则基于本专利技术实施例提供的系统异常的处理方法来对该系统异常进行自动恢复。对通信端来说,其在系统运行过程中实时采集系统运行信息,并将系统运行信息上报至监控节点。中心服务器与监控节点为本专利技术实施例中为了实现对系统异常的自动恢复而部署于网络中的设备。监控节点分布式部署于网络中,其设备形态可以为具备较高数据处理能力的服务器,监控节点根据通信端上报的系统运行信息生成告警邮件,并将告警邮件发送至中心服务器,在告警邮件中,记录了出现系统异常的通信端及用于表示该通信系统异常的运行数据。在本专利技术实施例中,一个监控节点之下可以部署一个或多个通信端,每个监控节点负责对部署于其下的通信端的系统运行情况进行监控。中心服务器在一个网络区域内可以仅设置一个,且中心服务器可以同时与该网络区域内部署的所有监控节点和通信端通信。中心服务器上设置有处理方案数据库,在接收到监控节点上报的告警邮件后,中心服务器将告警邮件中的运行数据输出至处理方案数据库中进行匹配,获取对应的处理脚本,并将处理脚本推送至出现系统异常的通信端。通信端在接收到处理脚本后,自动执行该处理脚本,从而实现对系统异常的自动恢复。在图1所示的实施例的基础之上,进一步地,每个监控节点与向其上报系统运行信息的通信端位于同一网关之下,以便于监控节点及时准确地获取到通信端的系统运行信息,并且,通信端将其系统运行信息上报至同一网关下的监控节点,在通信可靠性及通信速率上更加有保证,也相对来说提高了系统运行信息的上报效率,且便于运维管理。接下来,基于本专利技术图1所示的实施例,对本专利技术实施例提供的系统异常的处理方法进行详细说明。图2示出了本专利技术实施例提供的系统异常的处理方法的交互流程,在该交互流程中,涉及交互的通信实体包括上述中心服务器、监控节点及通信端。如图2所示,该系统异常的处理方法包括:S1:所述通信端实时采集其系统运行信息,并将所述系统运行信息上报至所述监控节点。在本专利技术实施例中,预先在通信端中装载有用于采集系统运行信息的程序,通信端在系统运行过程中,通过该预先装置的程序实现系统运行信息的实时采集。采集到的系统运行信息包括但不限于系统处理的业务数据、系统运行日志、通信端基础资源使用情况、通信端数据库运行性能、中间件性能等。在采集到系统运行信息后,通信端采用定时上报或者实时上报的方式,将系统运行信息上报至监控节点。作为本专利技术的一个实施例,在S1之前,通信端需要预先确定其需要上报系统运行信息的监控节点。如图3所示:S301:所述通信端获取监控节点列表,所述监控节点列表本文档来自技高网...

【技术保护点】
1.一种系统异常的处理方法,其特征在于,所述处理方法包括:通信端实时采集系统运行信息,并将所述系统运行信息上报至监控节点;所述监控节点根据所述系统运行信息生成告警邮件,并将所述告警邮件发送至中心服务器,所述告警邮件中记录了出现系统异常的通信端及用于表示该通信端系统异常的运行数据;所述中心服务器将所述告警邮件中的所述运行数据输出至预设的处理方案数据库中进行匹配,获取与所述运行数据匹配的处理脚本;所述中心服务器将所述处理脚本推送至所述出现系统异常的通信端,所述处理脚本被所述出现系统异常的通信端接收后自动执行,用于处理系统异常。

【技术特征摘要】
1.一种系统异常的处理方法,其特征在于,所述处理方法包括:通信端实时采集系统运行信息,并将所述系统运行信息上报至监控节点;所述监控节点根据所述系统运行信息生成告警邮件,并将所述告警邮件发送至中心服务器,所述告警邮件中记录了出现系统异常的通信端及用于表示该通信端系统异常的运行数据;所述中心服务器将所述告警邮件中的所述运行数据输出至预设的处理方案数据库中进行匹配,获取与所述运行数据匹配的处理脚本;所述中心服务器将所述处理脚本推送至所述出现系统异常的通信端,所述处理脚本被所述出现系统异常的通信端接收后自动执行,用于处理系统异常。2.如权利要求1所述的处理方法,其特征在于,在所述通信端实时采集其系统运行信息,并将所述系统运行信息上报至所述监控节点之前,还包括:所述通信端获取监控节点列表,所述监控节点列表中记录了所述系统中的各个网关及每个所述网关下部署的所述监控节点;所述通信端在所述监控节点列表中查找到其所在的网关;所述通信端将查找到的所述网关下部署的监控节点确定为需要上报所述系统运行信息的监控节点。3.如权利要求1所述的处理方法,其特征在于,还包括:所述通信端对查找到的所述网关下部署的所有监控节点进行记录;若检测到所述系统运行信息上报失败,所述通信端在查找到的所述网关下选择另一所述监控节点,作为需要上报所述系统运行信息的监控节点。4.如权利要求1所述的处理方法,其特征在于,在所述监控节点根据所述系统运行信息生成告警邮件之前,还包括:在预设时间段内,所述监控节点对不同所述通信端的所述系统运行信息进行采集;所述监控节点对采集到的所述系统运行信息进行聚类,得到多个簇集;所述监控节点在所述多个簇集中标记用于表明系统正常运行的簇集;所述监控节点基于标记的所述簇集生成系统正常运行模型,所述系统正常运行模型被所述监控节点用于判断所述通信端上报的所述系统运行信息是否表明所述通信端的系统正常运行。5.如权利要求4所述的处理方法,其特征在于,所述监控节点在所述多个簇集中标记用于表明系统正常运行的簇集,包括:所述监控节点将所述多个簇集按照簇的大小降序排列;所述监控节点...

【专利技术属性】
技术研发人员:陈天豪杨海勇谢晓华袁少雄金鑫
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1