【技术实现步骤摘要】
系统监控方法和装置
[0001]本专利技术数据分析
,尤其涉及一种系统监控方法和装置。
技术介绍
[0002]随着计算机技术的不断发展,大型系统越来越多,大型系统需要处理的各类任务的数量也越来越多,越来越复杂。为保证大型系统的高可靠性、吞吐量及运行效率,经常把大型系统的任务拆分给多个工作节点,由各工作节点协同完成系统任务。由于各工作节点的部署情况、执行任务均不相同,现有技术中尚缺少能够快速发现处于异常状态的异常节点,并准确定位异常节点对应的故障信息的方案。
技术实现思路
[0003]有鉴于此,本专利技术实施例提供一种系统监控方法和装置,能够快速发现处于异常状态的异常节点,并准确定位异常节点对应的故障信息,为监控系统的运行情况提供便利。
[0004]第一方面,本专利技术实施例提供了一种系统监控方法,包括:
[0005]接收针对目标系统的监控指令,确定所述目标系统中的多个工作节点;
[0006]根据各所述工作节点的节点状态及节点依赖关系,从所述多个工作节点中,确定出异常节点; >[0007]根据所本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种系统监控方法,其特征在于,包括:接收针对目标系统的监控指令,确定所述目标系统中的多个工作节点;根据各所述工作节点的节点状态及节点依赖关系,从所述多个工作节点中,确定出异常节点;根据所述异常节点的节点状态及系统运行日志,确定所述异常节点对应的故障信息;根据所述异常节点对应的节点标识及故障信息,生成并返回所述目标系统对应的异常信息。2.根据权利要求1所述的方法,其特征在于,所述根据各所述工作节点的节点状态及节点依赖关系,从所述多个工作节点中,确定出异常节点,包括:从所述多个工作节点中,确定出当前节点;响应于所述当前节点的节点状态为等待,根据所述节点依赖关系,确定所述多个工作节点中是否存在所述当前节点的至少一个前置节点;响应于存在所述当前节点的至少一个前置节点,在各所述前置节点的节点状态均为运行成功的情况下,确定所述当前节点为异常节点;响应于不存在所述当前节点的前置节点,确定所述当前节点为异常节点。3.根据权利要求1所述的方法,其特征在于,所述根据各所述工作节点的节点状态及节点依赖关系,从所述多个工作节点中,确定出异常节点,包括:从所述多个工作节点中,确定出当前节点;响应于所述当前节点的节点状态为运行中或就绪,获取当前时间及所述当前节点的预设完成时间;响应于所述当前时间晚于所述预设完成时间,确定所述当前节点为异常节点。4.根据权利要求1所述的方法,其特征在于,所述根据各所述工作节点的节点状态及节点依赖关系,从所述多个工作节点中,确定出异常节点,包括:从所述多个工作节点中,确定出当前节点;响应于所述当前节点的节点状态为运行失败,确定所述当前节点为异常节点。5.根据权利要求1所述的方法,其特征在于,所述根据所述异常节点的节点状态及系统运行日志,确定所述异常节点对应的故障信息,包括:响应于所述异常节点的节点状态为就绪,根据所述系统运行日志,确定所述异常节点的就绪等待时长是否大于等待时长阈值;响应于所述就绪等待时长大于所述等待时长阈值,确定所述目标系统中的数据库连接数是否大于调度资源数;响应于所述数据库连接数大于所述调度资源数,确定所述故障信息表征所述目标系统的调度资源不足;响应于所述数据库连接数不大于所述调度资源数,确定所述故障信息表征所述目标系统的数据库负载过高。6.根据权利要求1所述的方法,其特征在于,所述根据所述异常节点的节点状态及系统运行日志,确定所述异常节点对应的故障信息,包括:响应于所述异常节点的节点状态为运行失败,从所述系统运行日志中,获取所述异常节点对应的报错信息;
根据所述报错信息,生成所述异常节点对应的故障信息。7.根据权利要求1所述的方法,其特征在于,所述根据所述异常节点的节点状态及系统运行日志,确定所述异常节点对应的故障信息,包括:响应于所述异常节点的节点状态为运行中,根据所述系统运行日志,确定所述异常节点的运行时长,并确定所述运行时长是否大于运行时长阈值;响应于所述运行时长大于所述运行时长...
【专利技术属性】
技术研发人员:范复得,
申请(专利权)人:建信金融科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。