一种自动关联分析的云计算监控装置及方法制造方法及图纸

技术编号:14532806 阅读:70 留言:0更新日期:2017-02-02 15:39
本发明专利技术涉及一种自动关联分析的云计算监控装置及方法,所述系统包括配置推送组件、数据整理模块和关联分析系统;所述配置推送组件用于统一监控代理配置模板分发到相关的被监控设备;所述数据整理模块用于对监控数据按统一的频率定时采集生成监控项和主机状态数据,并对字符串数据进行整理,生成数值型和字符型监控值;所述关联分析系统用于对监控数据按时间段进行关联分析,结合同时间段的宕机情况和报警数量,依照时间关联显示监控项的趋势曲线,提供时间线的关联数据,为故障分析提供辅助信息。能够实现监控配置的集中下发,监控数据的自动收集,为运维人员提供综合性的系统运行指标和报警提示,同时通过自动关联分析提高故障处理的效率。

Automatic correlation analysis cloud computing monitoring device and method

The invention relates to a monitoring device and a method of calculating auto correlation analysis of cloud, the system comprises a push component, data processing module and association analysis system; the configuration push assembly for a unified monitoring proxy configuration template distributed to relevant monitoring equipment; the data processing module for monitoring data according to the unified the frequency of monitoring and timing acquisition and generation of host state data, and the string data, generate numeric and character monitoring value; the correlation analysis system for monitoring data according to the time correlation analysis, and the number of node downtime alarm time period of the contract, in accordance with the time correlation shows the trend curve monitoring item and the associated data provide time line, provide auxiliary information for fault analysis. To achieve centralized monitoring configuration issued, automatic monitoring data collection, provide comprehensive system operation index and alarm for the operation and maintenance personnel, at the same time through auto correlation analysis improves the efficiency of fault treatment.

【技术实现步骤摘要】

本专利技术涉及于云计算监控运维领域,更具体的说,是涉及一种自动关联分析的云计算监控装置及方法。
技术介绍
目前国内企业私有云系统建设正处于起始发展阶段,很多企业都有建立私有云的规划和意愿。私有云监控系统是大型云计算平台运行管理的必备工具,可以降低私有云整体的维护成本,发挥云计算技术的优势和灵活性,具有广阔的市场前景。目前私有云监控产品很少,大部分用户仍选择传统系统监控的软件对私有云系统进行监控,无法做到虚拟资源、物理资源、网络资源的整合监控,难以发挥云计算技术的优势。Amazon、Google、腾讯、阿里等公司拥有完善的云平台监控系统,但尚未形成成熟的商用软件销售。随着云计算技术的使用,用户对服务器数量的需求迅速增长。以前中等规模企业用户的服务器规模大约在几十台左右,采用了云计算平台以后大多创建几百台甚至上千台虚拟服务器,大量的测试系统建立、应用系统拆分,运行维护压力增大,系统监控数据暴增。云平台建设前,运维服务器数量约一百台,专职运维工程师三人,其中日常监控一人,故障处理两人。日常故障主要集中在文件系统满、数据库连接异常、服务器CPU或I/O过高、应用系统JVM内存溢出等问题,每天平均出现两到三次各类故障。每次故障分析大多涉及多台服务器的系统资源、数据库、应用系统运行信息收集和分析,平均处理时间约两个小时,其中50%的时间耗费在系统登录、信息收集和对比分析。云平台建成后,运维服务器系统数量超过五百台,如按原有方式,需要配备专职运维工程师十人以上。通过自动关联分析监控系统,可以实现系统资源、数据库、应用系统运行情况的集中展现和历史记录,对相关监控数据进行时间关联,并产生分析提示,省去人工登录、收集、对比的繁琐工作,缩短故障处理的时间,提高趋势预防的能力。该监控分析技术主要应用当前主流的开源监控框架,对各种监控数据进行同时采集、统一管理、解析记录、集中展现,最终形成时间关联和分析提示,供运行维护人员使用。
技术实现思路
有鉴于此,有必要针对上述问题,提供种自动关联分析的云计算监控装置及方法,能够实现监控配置的集中下发,监控数据的自动收集,为运维人员提供综合性的系统运行指标和报警提示,同时通过自动关联分析提高故障处理的效率。为了实现上述目的,本专利技术的技术方案如下:一种自动关联分析的云计算监控装置,包括配置推送组件、数据整理模块和关联分析系统;所述配置推送组件用于统一监控代理配置模板分发到相关的被监控设备;所述数据整理模块用于对监控数据按统一的频率定时采集生成监控项和主机状态数据,并对字符串数据进行整理,生成数值型和字符型监控值;所述关联分析系统用于对监控数据按时间段进行关联分析,结合同时间段的宕机情况和报警数量,依照时间关联显示监控项的趋势曲线,提供时间线的关联数据,为故障分析提供辅助信息。作为优选的,所述配置推送组件通过Puppet集中配置管理工具,统一后分发监控代理配置模板分发到相关的被监控设备。作为优选的,还包括集中展示单元,所述集中展示单元通过监控网络连接一监控大屏系统,用于按不同项目对监控信息进行分组统计,形成繁忙度、可用度、健康度指标值,并关联报警信息分类数量,以图表方式形成展现画面,并投射到监控大屏系统。作为优选的,所述配置推送组件通过服务器网络与被监控设备连接。作为优选的,还包括一运维终端,所述运维终端通过业务网络分别连接所述关联分析系统和集中展示单元,用于接收监控异常数据并为相关被监控设备出现的故障、报警信息提供维护服务。作为优选的,还包括一开源监控框架,用于搭建数据库整理模块、增加监控历史数据表、和主机状态历史数据表、增加关键资源数量历史数据表,所述开源监控框架和数据库整理模块连接有一数据库。一种根据上述系统进行自动关联分析的云计算监控方法,其特征在于,包括以下步骤:S1、配置推送组件将监控代理配置模板统一分发到相关的被监控设备,开始监控数据采集;S2、在开源监控框架上,搭建数据整理模块,增加监控历史数据表和主机状态历史数据表,存放监控项和主机状态数据;增加关键资源数量历史数据表,存放物理机、虚拟机、数据库、应用数量统计数据;S3、按每分钟固定频率读取收集的监控数据,对各监控项和主机状态的字符串数据进行整理,生成数值型和字符型监控值,并标以统一分钟标号,存入新增的监控项和主机状态历史数据表;S4、按用户设定频率定期查询监控数据和新增历史表数据,按不同项目对监控信息进行分组统计,形成繁忙度、可用度、健康度指标值,并关联报警信息分类数量,以图表方式形成展现画面,并投射到监控大屏系统。作为优选的,所述步骤S1具体包括:生成虚拟服务器,定制监控代理初始配置,通过配置推送组件对虚拟服务器按操作系统和重要等级进行分类,定制监控配置模板;通过Puppet集中配置平台,统一分发配置模板到被监控设备,开始监控数据采集。作为优选的,所述步骤S4具体包括:S41、按每分钟固定频率读取监控框架收集的监控数据,对各监控项和主机状态的字符串数据进行整理,生成数值型和字符型监控值,并标以统一分钟标号,存入新增的监控项和主机状态历史数据表;S42、每天统计物理机、虚拟机、数据库、应用数量,存入新增的关键资源数量历史数据表;S43、按用户设定频率定期查询监控框架数据和新增历史数据表,生成按项目统计的繁忙度、可用度、健康度指标值,缺省按30秒钟刷新一次;每次统计按最新的分钟标号进行统计,繁忙度为CPU超过10%的服务器的比率,可用度为应用系统正常响应的比率,健康度为没有报警服务器的比率;S44、显示关键资源数量的趋势直方图,数据从新增的关键资源数量历史数据表直接获取;S45、滚动显示最新的各系统报警信息,分类统计健康、繁忙、可用、告警的项目数量,同时显示对应分类的具体项目情况;S46、通过监控网络与监控大屏系统相连,将综合统计画面投射到监控大屏,供运维人员监控分析。作为优选的,所述步骤步骤S46具体包括:对所选项目的各服务器监控项进行关联分析,并显示对应时段的宕机比例、警告数量和警告信息;调整不同的时间段、服务器名、监控项名,关联分析所有监控项的时间线数据,结合报警信息,快速查找故障原因;点击告警信息,系统自动找出改项目同时段波动最大的监控项,提示运维人员进行分析。与现有技术相比,本专利技术的有益效果在于:本专利技术通过多种设备的合理运用,成功的的将云计算环境下的各类监控数据进行自动配置、同步解析、综合展现,并形成关联分析数据,方便运维人员监控系统整体运行情况,提高信息收集和故障处理的效率,为发挥云计算的灵活性提供了基础保障。对云计算各类资源的运行情况实时监控,自动收集整理生成监控值,统计形成运行维护的关键指标,时间关联分析辅助故障处理,大幅提升运维人员的工作效率,为相关产业云平台系统的稳定运行提供了重要支撑。附图说明图1为本专利技术实施例的装置结构框图;图2为本专利技术实施例的方法流程图;图3为本专利技术实施例中集中展示单元画面功能模块示意图;图4为本专利技术实施例中关联分析系统画面功能模块示意图。具体实施方式下面结合附图和实施例对本专利技术所述的一种自动关联分析的云计算监控装置及方法作进一步说明。以下是本专利技术所述的种自动关联分析的云计算监控装置及方法的最佳实例,并不因此限定本专利技术的保护范围。图1示出了一种自动关联分析的云计算监控装置,本文档来自技高网
...

【技术保护点】
一种自动关联分析的云计算监控装置,其特征在于,包括配置推送组件、数据整理模块和关联分析系统;所述配置推送组件用于统一监控代理配置模板分发到相关的被监控设备;所述数据整理模块用于对监控数据按统一的频率定时采集生成监控项和主机状态数据,并对字符串数据进行整理,生成数值型和字符型监控值;所述关联分析系统用于对监控数据按时间段进行关联分析,结合同时间段的宕机情况和报警数量,依照时间关联显示监控项的趋势曲线,提供时间线的关联数据,为故障分析提供辅助信息。

【技术特征摘要】
1.一种自动关联分析的云计算监控装置,其特征在于,包括配置推送组件、数据整理模块和关联分析系统;所述配置推送组件用于统一监控代理配置模板分发到相关的被监控设备;所述数据整理模块用于对监控数据按统一的频率定时采集生成监控项和主机状态数据,并对字符串数据进行整理,生成数值型和字符型监控值;所述关联分析系统用于对监控数据按时间段进行关联分析,结合同时间段的宕机情况和报警数量,依照时间关联显示监控项的趋势曲线,提供时间线的关联数据,为故障分析提供辅助信息。2.根据权利要求1所述的自动关联分析的云计算监控装置,其特征在于,所述配置推送组件通过Puppet集中配置管理工具,统一分发监控代理配置模板分发到相关的被监控设备。3.根据权利要求1所述的自动关联分析的云计算监控装置,其特征在于,还包括集中展示单元,所述集中展示单元通过监控网络连接一监控大屏系统,用于按不同项目对监控信息进行分组统计,形成繁忙度、可用度、健康度指标值,并关联报警信息分类数量,以图表方式形成展现画面,并投射到监控大屏系统。4.根据权利要求1所述的自动关联分析的云计算监控装置,其特征在于,所述配置推送组件通过服务器网络与被监控设备连接。5.根据权利要求1所述的自动关联分析的云计算监控装置,其特征在于,还包括一运维终端,所述运维终端通过业务网络分别连接所述关联分析系统和集中展示单元,用于接收监控异常数据并为相关被监控设备出现的故障、报警信息提供维护服务。6.根据权利要求1所述的自动关联分析的云计算监控装置,其特征在于,还包括一开源监控框架,用于搭建数据库整理模块、增加监控历史数据表、和主机状态历史数据表、增加关键资源数量历史数据表,所述开源监控框架和数据库整理模块连接有一数据库。7.一种根据权利要求1至6任一所述系统进行自动关联分析的云计算监控方法,其特征在于,包括以下步骤:S1、配置推送组件将监控代理配置模板统一分发到相关的被监控设备,开始监控数据采集;S2、在开源监控框架上,搭建数据整理模块,增加监控历史数据表和主机状态历史数据表,存放监控项和主机状态数据;增加关键资源数量历史数据表,存放物理机、虚拟机、数据库、应用数量统计数据;S3、按每分钟固定频率读取收集的监控数据,...

【专利技术属性】
技术研发人员:方文罗益超
申请(专利权)人:武汉钢信软件有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1