一种告警监控方法及系统技术方案

技术编号:20118656 阅读:20 留言:0更新日期:2019-01-16 12:13
本发明专利技术公开了一种告警监控方法,包括:获取线上服务的告警信息;根据所述告警信息对应的项目类型不同累计告警次数;当达到设定的告警次数后,根据设置的管理员优先级进行上报处理。通过对告警信息的分析以及告警次数的统计,设置了对告警信息实现优先级的管理;因此实现了责任的分级管理,实时追踪告警信息,做到有效的对告警信息能够尽快尽早得到对应人及时响应。

An alarm monitoring method and system

The invention discloses an alarm monitoring method, which comprises acquiring alarm information of online service, accumulating alarm times according to different item types corresponding to the alarm information, and reporting processing according to the set administrator priority after reaching the set alarm times. Through the analysis of alarm information and the statistics of alarm times, the priority management of alarm information is set up; therefore, the hierarchical management of responsibility is realized, and the alarm information is tracked in real time, so that the effective alarm information can be timely responded by the corresponding person as soon as possible.

【技术实现步骤摘要】
一种告警监控方法及系统
本专利技术涉及信息交互领域,特别涉及一种告警监控方法及系统。
技术介绍
互联网在线车货匹配系统项目线上24小时不间断运营,系统的稳定就是企业的生命线,有故障问题必须第一时间及时通知项目负责人,为了保障系统告警响应的及时性就必有多种告警通知手段和方式并用,钉消息和短信这类弱唤醒形式都无法唤醒响应的情况下就要自动触发电话语音,通知手段逐步升级,及时尽早通知响应到负责人是问题保障的第一位。现有的互联网系统随着业务的横纵向的不断深入,围绕着核心业务衍生出很多旁系业务分支,多种业务和相互依赖增加了系统的复杂,形成一张相互交织的调用网,网络状的复杂服务之间有一个点出现物理波动或代码缺陷问题就会引发其他服务联动报错告警,系统变的更脆弱,一有大小问题就告警又必须要各服务负责人及时响应,不重要的小波动和小问题要是过于频繁的骚扰,就会形成骚扰影响大家的正常状态和涣散问题注意力,同时形成狼来了效应,状态和注意力被牵引而错失了关注重要问题,如何剔除这类问题引发的告警对大家的误导就需要策略处理。告警通知随着系统的运行是24小时不间断,随时可能发生,由于工作人员忙于其他事情影响了告警的处理时间,不能及时响应,影响了用户使用。基于以上存在的问题,本申请提供了解决以上技术问题的技术方案。
技术实现思路
本专利技术的目的是一种告警监控方法及系统,通过对告警信息的分析以及告警次数的统计,设置了对告警信息实现优先级的管理;因此实现了责任的分级管理,实时追踪告警信息,做到有效的对告警信息能够尽快尽早得到对应人及时响应。本专利技术提供的技术方案如下:一种告警监控方法,包括:获取线上服务的告警信息;根据所述告警信息对应的项目类型不同累计告警次数;当达到设定的告警次数后,根据设置的管理员优先级进行上报处理。在本专利技术中,通过对告警信息的分析以及告警次数的统计,设置了对告警信息实现优先级的管理;因此实现了责任的分级管理,实时追踪告警信息,做到有效的对告警信息能够尽快尽早得到对应人及时响应。进一步优选的,包括:将获取的告警信息进行解析;识别所述告警信息的告警类型;根据识别后的所述告警信息的告警类型在预设项目列表中对应的累计告警次数。在本专利技术中,通过对告警信息的解析,识别告警信息的任务类型,在预设项目列表对告警次数进行统计,对告警的级别的判断;实现了对告警信息的实时跟踪;本申请为24小时收集线上问题,每次有错误告警就累计错误次数累加,当这个值超过弱唤醒阀值就通过钉消息和短信通知到服务负责人,这样就剔除了各种物理波动和小问题也发骚扰告警。进一步优选的,所述预设项目列表包括:根据线上服务项目类型不同建立预警列表,在所述预警列表中对线上服务项目设置优先级;根据线上服务项目设置的优先级设置对应不同的告警机制。在本申请中,通过对告警信息优先级的设置,实现了对问题有节制处理,根据事件的轻重缓急,合理配置触发条件,实现资源的合理分配,避免了对工作人员的过度骚扰,减少了对正常工作和生活的影响。进一步优选的,包括:判断在设定的时间段内是否对未处理的告警信息进行处理;当未处理时,判断告警次数是否超过预设告警阈值;当超过预设告警阈值时,根据所述预设项目列表中设置的管理员优先级执行所述告警机制。在本专利技术中,依据业务服务的不同重要性,设置不同告警级别,不同级别事先设置强弱唤醒方式不同的阀值,及时发出不同程度的通知形式又合理的剔除骚扰;告警通知设置不同管理级别,业务服务负责人制,问题告警没及时响应上升到上一级,实现了问题的响应和跟踪到位。进一步优选的,所述管理员优先级设置包括:当接收到所述告警信息后,在第一预设时间内通知第一管理员进行处理;当在第一预设时间内所述第一管理员未收到处理完成的信息时,判断所述告警信息的次数是否达到设定阈值时,当达到时,通知第二管理员进行处理;在第二预设时间内仍未处理时,通知第三管理员进行处理;其中,所述第二管理员的优先级高于第一管理员,所述第二管理员的优先级高于第三管理员。一种告警监控系统,包括:告警信息获取模块,获取线上服务的告警信息;告警次数统计模块,与所述告警信息获取模块通信连接,根据所述告警信息对应的项目类型不同累计告警次数;告警信息处理模块,与所述告警次数统计模块通信连接,当达到设定的告警次数后,根据设置的管理员优先级进行上报处理。在本专利技术中,通过对告警信息的分析以及告警次数的统计,设置了对告警信息实现优先级的管理;因此实现了责任的分级管理,实时追踪告警信息,做到有效的对告警信息能够尽快尽早得到对应人及时响应。进一步优选的,所述告警次数统计模块包括:告警信息解析子模块,将获取的告警信息进行解析;告警类型识别子模块,识别所述告警信息的告警类型;并根据识别后的所述告警信息的告警类型在预设项目列表中对应的累计告警次数。在本专利技术中,通过对告警信息的解析,识别告警信息的任务类型,在预设项目列表对告警次数进行统计,对告警的级别的判断;实现了对告警信息的实时跟踪;本申请为24小时收集线上问题,每次有错误告警就累计错误次数累加,当这个值超过弱唤醒阀值就通过钉消息和短信通知到服务负责人,这样就剔除了各种物理波动和小问题也发骚扰告警。进一步优选的,所述预设项目列表包括:根据线上服务项目类型不同建立预警列表,在所述预警列表中对线上服务项目设置优先级;根据线上服务项目设置的优先级设置对应不同的告警机制。在本申请中,通过对告警信息优先级的设置,实现了对问题有节制处理,根据事件的轻重缓急,合理配置触发条件,实现资源的合理分配,避免了对工作人员的过度骚扰,减少了对正常工作和生活的影响。进一步优选的,所述告警信息处理模块包括:告警时间判断子模块,判断在设定的时间段内是否对未处理的告警信息进行处理;告警阈值判断子模块,当未处理时,判断告警次数是否超过预设告警阈值;告警机制执行子模块,当超过预设告警阈值时,根据所述预设项目列表中设置的管理员优先级执行所述告警机制。进一步优选的,所述管理员优先级设置包括:当接收到所述告警信息后,在第一预设时间内通知第一管理员进行处理;当在第一预设时间内所述第一管理员未收到处理完成的信息时,判断所述告警信息的次数是否达到设定阈值时,当达到时,通知第二管理员进行处理;在第二预设时间内仍未处理时,通知第三管理员进行处理;其中,所述第二管理员的优先级高于第一管理员,所述第二管理员的优先级高于第三管理员。。在本专利技术中,依据业务服务的不同重要性,设置不同告警级别,不同级别事先设置强弱唤醒方式不同的阀值,及时发出不同程度的通知形式又合理的剔除骚扰;告警通知设置不同管理级别,业务服务负责人制,问题告警没及时响应上升到上一级,实现了问题的响应和跟踪到位。本专利技术提供的一种告警监控方法及系统,能够带来以下至少一种有益效果:本专利技术是一种实时监控追踪线上服务系统,在项目负责人没及时响应的情况下,自动触发电话语音通知;依据服务的重要级别设置不同的报错阀值,达到了阀值才能触发电话语音通知,剔除小波动小问题的骚扰;以上两种情况服务负责人还没响应告警就要把问题上升到他的上一级,给上级领导发送告警通知,让问题通知到更多相关人。把系统的报错告警信息多种手段及时,合理的频率通知到负责人,得到响应跟踪处理,及早的把问题发现,消灭在早期是系统稳定性一个很重要的保障。附图本文档来自技高网...

【技术保护点】
1.一种告警监控方法,其特征在于,包括:获取线上服务的告警信息;根据所述告警信息对应的项目类型不同累计告警次数;当达到设定的告警次数后,根据设置的管理员优先级进行上报处理。

【技术特征摘要】
1.一种告警监控方法,其特征在于,包括:获取线上服务的告警信息;根据所述告警信息对应的项目类型不同累计告警次数;当达到设定的告警次数后,根据设置的管理员优先级进行上报处理。2.根据权利要求1所述的告警监控方法,其特征在于,包括:将获取的告警信息进行解析;识别所述告警信息的告警类型;根据识别后的所述告警信息的告警类型在预设项目列表中对应的累计告警次数。3.根据权利要求2所述的告警监控方法,其特征在于,所述预设项目列表包括:根据线上服务项目类型不同建立预警列表,在所述预警列表中对线上服务项目设置优先级;根据线上服务项目设置的优先级设置对应不同的告警机制。4.根据权利要求3所述的告警监控方法,其特征在于,包括:判断在设定的时间段内是否对未处理的告警信息进行处理;当未处理时,判断告警次数是否超过预设告警阈值;当超过预设告警阈值时,根据所述预设项目列表中设置的管理员优先级执行所述告警机制。5.根据权利要求1所述的告警监控方法,其特征在于,所述管理员优先级设置包括:当接收到所述告警信息后,在第一预设时间内通知第一管理员进行处理;当在第一预设时间内所述第一管理员未收到处理完成的信息时,判断所述告警信息的次数是否达到设定阈值时,当达到时,通知第二管理员进行处理;在第二预设时间内仍未处理时,通知第三管理员进行处理;其中,所述第二管理员的优先级高于第一管理员,所述第二管理员的优先级高于第三管理员。6.一种告警监控系统,其特征在于,包括:告警信息获取模块,获取线上服务的告警信息;告警次数统计模块,与所述告警信息获取模块通信连接...

【专利技术属性】
技术研发人员:周小溪喻志曾
申请(专利权)人:江苏满运软件科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1