数据中心的监控方法及系统技术方案

技术编号:9835633 阅读:113 留言:0更新日期:2014-04-02 00:53
本发明专利技术公开了一种数据中心的监控方法及系统。其中,方法包括以下步骤:定时扫描数据中心的各个设备以获取故障数据并将故障数据记录到数据库中;实时获取数据中心的湿度数据以及数据中心的各个设备的温度数据;根据故障数据生成故障事件,并对故障事件进行预置项补全,其中预置项补全后的故障事件包括时间信息、真实故障信息、故障设备信息和故障设备所属的机房信息;根据故障事件的信息以及温度数据和湿度数据自动进行报修。本发明专利技术通过定时扫描和实时监控自动获取故障数据、温度数据和湿度数据等信息,并通过分析后自动进行报修,实现全自动监控及报修,全程无人干预,大大节省人力成本,提高效率。

【技术实现步骤摘要】
数据中心的监控方法及系统
本专利技术涉及数据安全
,特别涉及一种数据中心的监控方法及系统。
技术介绍
随着传统互联网产业和云计算的高速发展,数据中心规模的增长非常迅速。在这种大背景下,数据中心的安全性监控日益重要。当前数据中心的监控主要包括人工巡检、信息反馈和故障处理几个步骤。目前普遍使用的监控模式有如下两种:1)人工巡检+邮件主要通过工程师定期在机房巡检,手动记录设备故障信息,然后人工编辑邮件向厂商保修。这种方式存在的问题是,只适用于IT设备数量少(如500台以下)的超小型数据中心,当设备数量增多时,工程师数量将会成倍数增长,极大地增加数据中心的监控成本。而且,邮件报修的等待时间较长,效率较低。2)自动监控+callcenter(厂商提供的800客户服务平台)该模式利用不同厂商自带的监控工具进行故障监控,并通过系统向厂商保修以及跟踪故障处理进度。这种模式存在的问题是,由于使用不同厂商的IT设备,监控工具无法兼容所有设备类型,因此仍然存在大量的人工数据整理工作,无法实现全自动化;故障报修时虽然采用callcenter缩短了邮件报修的等待时间,但是在报修过程中仍然需要工程师参与。综上,该模式多适用于设备数量中等(如500~2000台)的小型数据中心,当设备数量增多时,工程师数量将会成倍数增长,极大地增加数据中心的监控成本。
技术实现思路
本专利技术的目的旨在至少解决上述技术缺陷之一。为此,本专利技术的一个目的在于提出一种数据中心的监控方法,通过该方法实现全自动监控数据中心,全程无人干预,节省人力成本,提高效率。本专利技术的另一个目的在于提出一种数据中心的监控系统。为达到上述目的,根据本专利技术一方面的实施例公开了一种数据中心的监控方法,包括以下步骤:定时扫描所述数据中心的各个设备以获取故障数据并将所述故障数据记录到数据库中;实时获取所述数据中心的湿度数据以及所述数据中心的各个设备的温度数据;根据所述故障数据生成故障事件,并对所述故障事件进行预置项补全,其中预置项补全后的故障事件包括时间信息、真实故障信息、故障设备信息和故障设备所属的机房信息;根据所述故障事件的信息以及所述温度数据和湿度数据自动进行报修。根据本专利技术实施例的数据中心的监控方法,通过定时扫描和实时监控自动获取故障数据、温度数据和湿度数据等信息,并通过分析后自动进行报修,实现全自动监控及报修,全程无人干预,大大节省人力成本,提高效率。为达到上述目的,根据本专利技术另一方面的实施例公开了一种数据中心的监控系统,包括:监控服务器,用于定时扫描所述数据中心的各个设备以获取所述数据中心的各个设备的故障数据,并记录所述故障数据,以及根据所述故障数据生成故障事件并对所述故障事件进行预置项补全,其中预置项补全后的故障事件包括时间信息、真实故障信息、故障设备信息和故障设备所属的机房信息;多个温度传感器,每个所述温度传感器配置在所述数据中心的每个设备上,用于实时采集所述设备的温度数据并将所述温度数据发送给所述监控服务器;湿度传感器,用于实时采集所述数据中心的湿度数据并将所述湿度数据发送给所述监控服务器;以及事件服务器,用于根据所述故障事件的信息、所述温度数据和所述湿度数据进行报修。根据本专利技术实施例的数据中心的监控系统,通过定时扫描和实时监控自动获取故障数据、温度数据和湿度数据等信息,并通过分析后自动进行报修,实现全自动监控及报修,全程无人干预,大大节省人力成本,提高效率。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本专利技术一个实施例的数据中心的监控方法的流程图;图2为根据本专利技术一个实施例的数据中心的监控示意图;图3为根据本专利技术一个实施例的数据中心的监控方法的流程图;图4为根据本专利技术一个实施例的数据中心的监控系统的结构框图;以及图5为根据本专利技术一个实施例的数据中心的监控系统的结构框图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。在本专利技术的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本专利技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。下面结合说明书附图详细描述根据本专利技术实施例的数据中心的监控方法。一种数据中心的监控方法,包括以下步骤:定时扫描数据中心的各个设备以获取故障数据并将故障数据记录到数据库中;实时获取数据中心的湿度数据以及数据中心的各个设备的温度数据;根据故障数据生成故障事件,并对故障事件进行预置项补全,其中预置项补全后的故障事件包括时间信息、真实故障信息、故障设备信息和故障设备所属的机房信息;以及根据故障事件的信息以及温度数据和湿度数据自动进行报修。图1为根据本专利技术一个实施例的数据中心的监控方法的流程图。图2为根据本专利技术一个实施例的数据中心的监控示意图。如图1和图2所示,根据本专利技术实施例的数据中心的监控方法,包括以下步骤:S101:定时扫描数据中心的设备以获取故障数据并将故障数据记录到数据库中。具体地,在数据中心的监控系统的监控服务器上启动cacti(一种网络流量监测图形分析工具)进程,cacti通过定时扫描发现数据中心设备的故障数据,并记录到数据库(monitor.db)中。更具体地,监控对象如果是服务器,可以通过以下两种方式进行监控:一种是带内监控方式,即在监控对象的操作系统上部署engine.sh脚本,并通过crontab(用于设置周期性被执行的指令)进行定时扫描,最终将监听结果通过snmp(simplenetworkmanagementprotocol,简单网络管理协议)传递给监控服务器。这种方式会占用一定的存储资源。另一种是带外监控方式,即通过服务器集成的带外管理工具ILO或DRC等采集故障日志并通过snmp传给监控服务器,由监控服务器中的日志分析工具(log.sh)进行日志分析,将不同厂商的故障信息统一标准。例如,建立故障信息与代码之间的对应关系,由此可以将不同厂商的相同故障信息转换为相同的代码表示形式。如果监控对象是交换机,则开启snmp选项,并将日志信息发送给监控服务器,监控服务器收到日志信息后自动运行日志分析工具提取故障数据存入数据库中。步骤S102:实时获取数据中心的湿度数据以及数据中心的各个设备的温度数据。具体地,数据中心的服务器以及网络设备均配备温度传感器,通过温度传感器获取温度数据并将温度变化数据记录到带外管理的日志中,然后监控服务器通过snmp将温度数据存入数据库中。此外,数据中心外置湿度传感器,通过湿度传感器获取数据中心的湿度数据并将湿度变化数据通过wifi传送给监控服务器,并记录到数据库中。S103:根据故障数据生本文档来自技高网...
数据中心的监控方法及系统

【技术保护点】
一种数据中心的监控方法,其特征在于,包括以下步骤:S1:定时扫描所述数据中心的各个设备以获取故障数据并将所述故障数据记录到数据库中;S2:实时获取所述数据中心的湿度数据以及所述数据中心的各个设备的温度数据;S3:根据所述故障数据生成故障事件,并对所述故障事件进行预置项补全,其中预置项补全后的故障事件包括时间信息、真实故障信息、故障设备信息和故障设备所属的机房信息;S4:根据所述故障事件的信息以及所述温度数据和湿度数据自动进行报修。

【技术特征摘要】
1.一种数据中心的监控方法,其特征在于,包括以下步骤:S1:定时扫描所述数据中心的各个设备以获取故障数据并将所述故障数据记录到数据库中,如果所述设备为服务器,则获取带外管理工具采集的所述服务器的故障日志,通过日志分析工具进行日志分析,并建立故障信息与代码之间的对应关系;S2:实时获取所述数据中心的湿度数据以及所述数据中心的各个设备的温度数据;S3:根据所述故障数据生成故障事件,并对所述故障事件进行预置项补全,其中预置项补全后的故障事件包括时间信息、真实故障信息、故障设备信息和故障设备所属的机房信息,发送所述预置项补全后的故障事件;S4:根据所述故障事件的信息以及所述温度数据和湿度数据自动进行报修,在确定对所述故障事件对应的故障设备进行报修后,更新所述故障设备的处理状态。2.根据权利要求1所述的数据中心的监控方法,其特征在于,所述步骤S1具体还包括:如果所述设备为服务器,还能通过带内监控方式自动获取所述服务器的故障数据;如果所述设备为交换机,则通过snmp选项获取所述交换机的日志信息并对所述日志信息进行分析以提取所述故障数据。3.根据权利要求1所述的数据中心的监控方法,其特征在于,所述步骤S4具体包括:获取所述故障事件对应的故障设备的优先级;根据所述故障设备的优先级对所述故障事件进行排序处理。4.根据权利要求1所述的数据中心的监控方法,其特征在于,所述步骤S4具体包括:根据所述故障事件的故障设备信息登陆厂商保修平台进行报修;或者,生成固定格式的保修邮件并发送至厂商进行报修;或者,发送短信至互联网供应商进行报修。5.一种数据中心的监控系统,其特征在于,包...

【专利技术属性】
技术研发人员:孙墨母学敏
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1