【技术实现步骤摘要】
一种运维监控系统及方法
[0001]本专利技术涉及运维监控
,具体涉及了一种运维监控系统及方法。
技术介绍
[0002]运行日志是帮助运维人员了解应用运行状态、查找和分析故障根源的重要手段,对于大型企业,由于各个应用监控平台与日志管理系统之间是相互独立,各类日志信息分散,运维人员很难快速获取所需日志,一旦应用发生了故障,运维人员很难得到全面、最新的应用运行信息,难以有效定位故障的具体原因,导致应用故障恢复时间过长等问题。而为了提升运维效率和服务质量,快速有效的定位应用故障发生根源,有必要建设统一的运维监控平台,以完善在应用监控、告警和故障定位与解决的能力。
技术实现思路
[0003]本专利技术所解决的技术问题在于提供一种运维监控系统及方法,能够将多个应用程序运行日志集中处理,发现报错信息,发送给运维人员,使运维人员能够及时了解,并前往处理。
[0004]本专利技术提供的基础方案:一种运维监控系统,包括状态获取模块、日志获取模块、统一日志平台、告警生成模块、日志搜索模块、报错告警模块以及事件记录模 ...
【技术保护点】
【技术特征摘要】
1.一种运维监控系统,其特征在于:包括状态获取模块、日志获取模块、统一日志平台、告警生成模块、日志搜索模块、报错告警模块以及事件记录模块;状态获取模块,用于定时获取各个应用程序的关联组件的运行状态;日志获取模块,用于定时获取各个应用程序的运行日志,上传至统一日志平台;告警生成模块,预设有告警规则,当应用程序的关联组件的运行状态满足告警规则时,生成报错事件并给出告警等级;日志搜索模块,用于从统一日志平台搜索产生报错事件的应用程序的运行日志;报错告警模块,用于将报错事件、关联组件的运行状态和运行日志发送给运维人员;事件记录模块,用于记录报错事件以及运维人员的运维过程。2.根据权利要求1所述的一种运维监控系统,其特征在于:所述事件记录模块包括时间记录模块、质量记录模块、综合评定模块以及事件绑定模块;时间记录模块,用于记录运维人员响应报错事件的响应时间、处理报错事件的处理时间;质量记录模块,用于记录运维人员的运维质量;综合评定模块,用于根据运维人员的响应时间、处理时间以及运维质量,给出综合评分;事件绑定模块,预设有分数阈值,当综合评分高于预设分数阈值时,将该运维人员与其处理的报错事件类型绑定,所述报错告警模块还用于优先向运维人员推送与其绑定的报错事件类型。3.根据权利要求2所述的一种运维监控系统,其特征在于:所述告警生成模块给出的告警等级包括低、中、高三个告警等级,所述事件记录模块包括事件状态记录模块,所述事件状态记录模块用于记录报错事件的告警等级随时间推移的变化,并记录变化周期;所述告警生成模块还用于将随时间推移,告警等级降低的报错事件划分为降级事件,并根据变化周期给出降级时间;将随时间推移,告警等级提高,或者引发其他报错事件的报错事件划分为升级事件,并根据变化周期给出升级时间。4.根据权利要求3所述的一种运维监控系统,其特征在于:所述报错告警模块在升级事件的告警等级为高级时,向距离最近的运维人员发送该报错事件;在升级事件的告警等级为中级或低级时,根据所记录的运维人员的响应时间和处理时间,向能够在该报错事件的告警等级提升至下一告警等级前,能够处理完成的运维人员发送该报错事件;当降级事件的告警等级为低级时,则不向运维人员发送该报错事件。5.根据权利要求4所述的一种运维监控系统,其特征在于:所述报错告警模块通过邮件的方式向运维人员发送低级报错事件,通过短信的方式发送中级报错事件,通过语音电话的方式发送高级报错事件和升级时间。6.根据权利要求5所述的一种运维监控系统,其特征...
【专利技术属性】
技术研发人员:谢辉,赵羚志,
申请(专利权)人:珠海华发集团科技研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。