The invention relates to a monitoring device and a method of calculating auto correlation analysis of cloud, the system comprises a push component, data processing module and association analysis system; the configuration push assembly for a unified monitoring proxy configuration template distributed to relevant monitoring equipment; the data processing module for monitoring data according to the unified the frequency of monitoring and timing acquisition and generation of host state data, and the string data, generate numeric and character monitoring value; the correlation analysis system for monitoring data according to the time correlation analysis, and the number of node downtime alarm time period of the contract, in accordance with the time correlation shows the trend curve monitoring item and the associated data provide time line, provide auxiliary information for fault analysis. To achieve centralized monitoring configuration issued, automatic monitoring data collection, provide comprehensive system operation index and alarm for the operation and maintenance personnel, at the same time through auto correlation analysis improves the efficiency of fault treatment.
【技术实现步骤摘要】
本专利技术涉及于云计算监控运维领域,更具体的说,是涉及一种自动关联分析的云计算监控装置及方法。
技术介绍
目前国内企业私有云系统建设正处于起始发展阶段,很多企业都有建立私有云的规划和意愿。私有云监控系统是大型云计算平台运行管理的必备工具,可以降低私有云整体的维护成本,发挥云计算技术的优势和灵活性,具有广阔的市场前景。目前私有云监控产品很少,大部分用户仍选择传统系统监控的软件对私有云系统进行监控,无法做到虚拟资源、物理资源、网络资源的整合监控,难以发挥云计算技术的优势。Amazon、Google、腾讯、阿里等公司拥有完善的云平台监控系统,但尚未形成成熟的商用软件销售。随着云计算技术的使用,用户对服务器数量的需求迅速增长。以前中等规模企业用户的服务器规模大约在几十台左右,采用了云计算平台以后大多创建几百台甚至上千台虚拟服务器,大量的测试系统建立、应用系统拆分,运行维护压力增大,系统监控数据暴增。云平台建设前,运维服务器数量约一百台,专职运维工程师三人,其中日常监控一人,故障处理两人。日常故障主要集中在文件系统满、数据库连接异常、服务器CPU或I/O过高、应用系统JVM内存溢出等问题,每天平均出现两到三次各类故障。每次故障分析大多涉及多台服务器的系统资源、数据库、应用系统运行信息收集和分析,平均处理时间约两个小时,其中50%的时间耗费在系统登录、信息收集和对比分析。云平台建成后,运维服务器系统数量超过五百台,如按原有方式,需要配备专职运维工程师十人以上。通过自动关联分析监控系统,可以实现系统资源、数据库、应用系统运行情况的集中展现和历史记录,对相关监控数据进行 ...
【技术保护点】
一种自动关联分析的云计算监控装置,其特征在于,包括配置推送组件、数据整理模块和关联分析系统;所述配置推送组件用于统一监控代理配置模板分发到相关的被监控设备;所述数据整理模块用于对监控数据按统一的频率定时采集生成监控项和主机状态数据,并对字符串数据进行整理,生成数值型和字符型监控值;所述关联分析系统用于对监控数据按时间段进行关联分析,结合同时间段的宕机情况和报警数量,依照时间关联显示监控项的趋势曲线,提供时间线的关联数据,为故障分析提供辅助信息。
【技术特征摘要】
1.一种自动关联分析的云计算监控装置,其特征在于,包括配置推送组件、数据整理模块和关联分析系统;所述配置推送组件用于统一监控代理配置模板分发到相关的被监控设备;所述数据整理模块用于对监控数据按统一的频率定时采集生成监控项和主机状态数据,并对字符串数据进行整理,生成数值型和字符型监控值;所述关联分析系统用于对监控数据按时间段进行关联分析,结合同时间段的宕机情况和报警数量,依照时间关联显示监控项的趋势曲线,提供时间线的关联数据,为故障分析提供辅助信息。2.根据权利要求1所述的自动关联分析的云计算监控装置,其特征在于,所述配置推送组件通过Puppet集中配置管理工具,统一分发监控代理配置模板分发到相关的被监控设备。3.根据权利要求1所述的自动关联分析的云计算监控装置,其特征在于,还包括集中展示单元,所述集中展示单元通过监控网络连接一监控大屏系统,用于按不同项目对监控信息进行分组统计,形成繁忙度、可用度、健康度指标值,并关联报警信息分类数量,以图表方式形成展现画面,并投射到监控大屏系统。4.根据权利要求1所述的自动关联分析的云计算监控装置,其特征在于,所述配置推送组件通过服务器网络与被监控设备连接。5.根据权利要求1所述的自动关联分析的云计算监控装置,其特征在于,还包括一运维终端,所述运维终端通过业务网络分别连接所述关联分析系统和集中展示单元,用于接收监控异常数据并为相关被监控设备出现的故障、报警信息提供维护服务。6.根据权利要求1所述的自动关联分析的云计算监控装置,其特征在于,还包括一开源监控框架,用于搭建数据库整理模块、增加监控历史数据表、和主机状态历史数据表、增加关键资源数量历史数据表,所述开源监控框架和数据库整理模块连接有一数据库。7.一种根据权利要求1至6任一所述系统进行自动关联分析的云计算监控方法,其特征在于,包括以下步骤:S1、配置推送组件将监控代理配置模板统一分发到相关的被监控设备,开始监控数据采集;S2、在开源监控框架上,搭建数据整理模块,增加监控历史数据表和主机状态历史数据表,存放监控项和主机状态数据;增加关键资源数量历史数据表,存放物理机、虚拟机、数据库、应用数量统计数据;S3、按每分钟固定频率读取收集的监控数据,...
【专利技术属性】
技术研发人员:方文,罗益超,
申请(专利权)人:武汉钢信软件有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。