一种统一监控管理平台制造技术

技术编号:36814911 阅读:34 留言:0更新日期:2023-03-09 01:06
本发明专利技术涉及互联网技术领域,公开了一种统一监控管理平台。一种统一监控管理平台,包括:采集模块,采集各个应用的日志,进行格式转换处理,并进行统一存储,同时存储故障排查表;识别模块,识别异常日志信息及各系统运行状态,获取异常应用和异常事件,并生成带有拓扑图和时间的告警事件;收发模块,接收告警事件,并向运维人员发送告警消息;统计模块,对告警消息进行统计,得到各应用系统的运行指标数据,并进行综合显示。本申请能够完善在应用监控、告警和故障定位与解决等方面的能力,实现从底层网络资源到上层应用的立体化监控体系。网络资源到上层应用的立体化监控体系。网络资源到上层应用的立体化监控体系。

【技术实现步骤摘要】
一种统一监控管理平台


[0001]本专利技术涉互联网
,具体涉及一种统一监控管理平台。

技术介绍

[0002]目前涉及运维的团队主要分为网络硬件设施、IAAS云平台、通用PAAS平,其中,网络硬件设施使用了第三方提供的日志审计平台对日志和性能进行监控管理;IAAS云平台包括VMWare和OpenStack两部分,其中VMWare使用自带的vRealize Suite云管理平台对日志和性能进行监控管理;OpenStack使用自带的Celimeter和开源的Zabbix搭配进行性能监控,而日志方面目前仍未实现统一管理。
[0003]各个团队之间监控平台和日志管理系统相互独立,日志、监控、告警管理分散,信息不对称,造成了一旦应用发生故障,运维人员很难得到全面、最新的运行信息,难以有效定位故障具体原因,导致应用故障恢复时间过长等问题。为了提升运维效率和服务质量,快速有效的定位应用故障发生根源,有必要建设统一的监控平台。

技术实现思路

[0004]本专利技术意在提供一种统一监控管理平台,以完善在应用监控、告警和故障定位与解决等方面的能力,实现从底层网络资源到上层应用的立体化监控体系。
[0005]为达到上述目的,本专利技术采用如下技术方案:一种统一监控管理平台,包括:
[0006]采集模块,采集各个应用的日志,进行格式转换处理,并进行统一存储,同时存储故障排查表;
[0007]识别模块,识别异常日志信息及各系统运行状态,获取异常应用和异常事件,并生成带有拓扑图和时间的告警事件;
[0008]收发模块,接收告警事件,并向运维人员发送告警消息;
[0009]统计模块,对告警消息进行统计,得到各应用系统的运行指标数据,并进行综合显示。
[0010]本方案的原理及优点是:实际应用时,各个应用之间是相互独立的,因此需要先采集各个应用的日志,为了后续处理方便快捷,需进行格式转换处理,再统一存储;曾经发生过的异常事件,及其对应的故障排除操作均存储在故障排查表中,运维人员能够根据故障排查表迅速的处理异常事件,提高处理效率。
[0011]采集各个应用的日志后,需要对日志信息及各系统运行状态进行异常识别,获取异常应用和异常事件,获取异常应用的情况,异常应用中带有应用的拓扑关系,根据拓扑关系能够对故障点进行排查,获取异常事件,生成带有拓扑图和时间的告警事件,并将告警消息发送给运维人,运维人员能够及时追踪故障点,并对故障进行处理,缩短应用故障恢复时长,提升运维效率和服务质量。
[0012]最后,对告警消息进行统计,得到各应用系统的运行指标数据,并进行综合显示,运维人员能够得到全面、最新的运行信息,便于对各应用进行全局把控,提升管理效率。
[0013]优选的,作为一种改进,所述采集模块还包括:
[0014]频率设置模块,设置不同应用的采集频率;
[0015]定时获取日志模块,根据采集频率定时从ELK统一日志平台获取指定应用的日志信息。
[0016]技术效果:能够根据实际应用的情况,对出现异常情况次数多、时间间隔短、较高的重要性的应用设置较高的采集频率,确保异常获取的及时性。
[0017]优选的,作为一种改进,所述识别模块还包括:
[0018]告警规则配置模块,对日志告警规则进行配置,所述日志告警规则包括应用告警规则和异常事件告警规则;
[0019]定时查询模块,对各个应用的应用状态进行定时查询,同时对应用异常日志定时查询;
[0020]异常日志处理模块,对异常日志进行合并、过滤和升级处理。
[0021]技术效果:不同的公司、不同的项目,所关注的异常事件是不同的,提供告警规则配置利于个性化的应用;定时查询应用状态,利于管理人员及时掌握当前运行情况,并及时对不合理的地方做出调整,异常日定时查询,实现异常日志的监控;且异常日志会存在事件重合的情况,对异常事件进行合并有益于操作流程的简洁;对于重要程度低、紧急程度低的异常事件进行过滤,对于重要程度高、紧急程度高的异常事件进行升级处理,利于资源的高效分配。
[0022]优选的,作为一种改进,所述应用状态包括日志告警规则、应用的拓扑图及应用当前最新状态。
[0023]技术效果:根据应用拓扑图,能够了解应用相关联的节点,利于根据节点倒退异常事件发生源头,从根源解决问题,更好的设置日志告警规则。
[0024]优选的,作为一种改进,所述日志告警规则有应用的索引值配置、异常日志识别的参数及参数值、日志的刷新频率。
[0025]技术效果:根据日志告警规则对异常事件进行告警。
[0026]优选的,作为一种改进,所述告警消息的类别包括应用的事件告警、应用异常状态通知、异常日志告警。
[0027]技术效果:一个应用满足一种发送类型的条件就对通知对象发送消息,从应用本身、应用事件和日志内容三个角度考虑异常事件的生成,考虑更加全面。
[0028]优选的,作为一种改进,所述收发模块还包括:
[0029]自定义模块,自定义告警等级和告警消息模板;
[0030]故障排查模块,根据拓扑图定位故障点,并根据故障排查表排查异常原因,同时匹配出排除异常的操作手册;
[0031]异常分析模块,根据拓扑图定位新的异常事件的故障点,并根据对历史操作进行相关性分析,得到排除异常的操作建议;
[0032]操作建议发送模块,将故障点、排除异常的操作手册和操作建议发送给运维人员。
[0033]技术效果:根据告警事件,对告警等级进行自定义设置,并自主选择告警模板,能够实现个性化应用,提高使用好感;同时定位故障点及对应的排除故障的操作,利于运维人员高效排除故障,恢复正常运行。
[0034]优选的,作为一种改进,所述收发模块还包括:
[0035]新异常排除操作存储模块,将运维人员对新的异常事件实际的操作生成新的操作手册,并存入到故障排查表中。
[0036]技术效果:随着异常处理情况增多,故障排查表类型更加丰富,利于后续出现同样异常事件的处理。
[0037]优选的,作为一种改进,所述统计模块还包括:
[0038]运行指标数据生成模块,按时间段对各应用的告警事件、告警事件的级别、告警总数、最常见的告警事件名称、告警处理情况、告警信息发送情况进行统计,生成运行指标数据。
[0039]技术效果:将各应用的运行情况进行统计,利于清晰快捷的掌握运行情况。
[0040]优选的,作为一种改进,还包括显示频率设置模块,用于设置综合显示的更新频率;所述显示频率设置模块还包括:
[0041]重要性设置模块,赋予各应用的运行指标数据以不同的权重,并进行加权,得到重要性指标,根据重要性指标设置显示的更新频率;
[0042]排序模块,将最新的告警消息按重要性指标从大到小进行排序显示。
附图说明
[0043]图1为本专利技术实施例的流程示意图。
具体实施方式
[0044]实施例基本如附本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种统一监控管理平台,其特征在于,包括:采集模块,采集各个应用的日志,进行格式转换处理,并进行统一存储,同时存储故障排查表;识别模块,识别异常日志信息及各系统运行状态,获取异常应用和异常事件,并生成带有拓扑图和时间的告警事件;收发模块,接收告警事件,并向运维人员发送告警消息;统计模块,对告警消息进行统计,得到各应用系统的运行指标数据,并进行综合显示。2.根据权利要求1所述的一种统一监控管理平台,其特征在于,所述采集模块还包括:频率设置模块,设置不同应用的采集频率;定时获取日志模块,根据采集频率定时从ELK统一日志平台获取指定应用的日志信息。3.根据权利要求1所述的一种统一监控管理平台,其特征在于,所述识别模块还包括:告警规则配置模块,对日志告警规则进行配置,所述日志告警规则包括应用告警规则和异常事件告警规则;定时查询模块,对各个应用的应用状态进行定时查询,同时对应用异常日志定时查询;异常日志处理模块,对异常日志进行合并、过滤和升级处理。4.根据权利要求3所述的一种统一监控管理平台,其特征在于:所述应用状态包括日志告警规则、应用的拓扑图及应用当前最新状态。5.根据权利要求3所述的一种统一监控管理平台,其特征在于:所述日志告警规则有应用的索引值配置、异常日志识别的参数及参数值、日志的刷新频率。6.根据权利要求1所述的一种统一监控管理平台,其特征在于:所述告警消息的类别...

【专利技术属性】
技术研发人员:陈剑锋吴晔凯
申请(专利权)人:珠海华发新科技投资控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1