一种基于Zabbix的服务器性能监控方法及系统技术方案

技术编号:37044298 阅读:14 留言:0更新日期:2023-03-29 19:23
本发明专利技术公开一种基于Zabbix的服务器性能监控方法及系统,对数据中心的物理服务器进行性能监控,监控指标包括CPU使用率、内存使用率、磁盘使用率和网络流量信息:1.服务器数据采集;2.异常告警;3.数据存储管理。系统包括服务器数据采集单元、异常告警单元、数据存储管理单元。采用本发明专利技术后,采用该发明专利技术后,可以实时了解各服务器的性能状态,及时发现其中的异常情况,有效提高运维人员的工作效率。有效提高运维人员的工作效率。有效提高运维人员的工作效率。

【技术实现步骤摘要】
一种基于Zabbix的服务器性能监控方法及系统


[0001]本专利技术涉及数据监控
,具体涉及一种基于Zabbix的服务器性能监控方法及系统。

技术介绍

[0002]随着信息技术的飞速发展,各个行业都存在较大的计算需求。在此影响下,不同规模、架构的数据中心陆续上线运行。目前,各类数据中心机房的物理服务器动辄成百上千台,较为庞大的规模远远超出运维人员人工维护的能力范围。为了实时了解数据中心内各服务器的运行状态,对各服务器进行自动化的状态监控就变得十分必要。
[0003]服务器性能监控系统的使用,可以帮助运维人员实时了解各服务器关键性能指标的运行状态。如果某指标存在异常,可及时通知运维人员排查问题,定位原因,提高运维的效率,保障数据中心的正常运行。现有服务器性能监控系统普遍对异常情况的分类不够具体,当出现异常情况时,对异常状态的判定不够准确。

技术实现思路

[0004]为解决现有技术存在的技术问题,本专利技术公开一种基于Zabbix的服务器性能监控方法,该方法对数据中心的物理服务器进行性能监控,监控指标包括CPU使用率、内存使用率、磁盘使用率和网络流量信息,该方法包括以下步骤:
[0005]1.服务器数据采集:在各受控服务器上安装Zabbix Agent,Zabbix Agent采集受控服务器的性能监控指标,按照设定频率推送到主控服务器上的Zabbix Server中,存储在Zabbix Server指定的MySQL数据库中;
[0006]2.异常告警:使用基于时间窗口的方法进行异常告警,每个时间窗口内对应的各指标对应的时间序列为其中W为时间窗口的个数,为第k个时间窗口内第i个指标在第j次采集的指标值,1≤k≤W;i表示第i个指标,i=1,2,3,4,分别对应CPU使用率、内存使用率、磁盘使用率和网络流量信息;s表示该时间窗口内指标的采集次数,且1≤j≤s;不断滑动时间窗口,检测各指标是否正常;指标异常包括:
[0007]1)未上线异常:在某个时间窗口内,一直未获取到受控服务器的监控状态数据,则该受控服务器被定义为出现未上线异常;
[0008]2)波动异常:采用标准差度量波动大小,其中表示第k个时间窗口内第i个指标的波动大小,表示第k个时间窗口内第i个指标的均值,表示第k个时间窗口内第i个指标的均值,时,给出波动异常告警,δi表示第i个指标的波动阈值;
[0009]3)指标值漂移异常:指标值漂移指标用于度量第k个时间窗相对于
第k

1个时间窗第i个指标的漂移情况;时,给出波动异常告警,ξi表示第i个指标的指标值漂移阈值;
[0010]4)指标值过高异常:在一个时间窗口内,受控服务器的状态数据持续高于既定的阈值,该受控服务器被定义为出现指标值过高异常。
[0011]3.数据存储管理:将采集的受控服务器性能指标保存在服务器上的MySQL数据库中。
[0012]为实现上述方法,本专利技术又提出一种基于Zabbix的服务器性能监控系统,该系统包括服务器数据采集单元、异常告警单元、数据存储管理单元,具体地:
[0013]1.服务器数据采集单元:在各受控服务器上安装Zabbix Agent,构成服务器数据采集单元;Zabbix Agent采集受控服务器的性能监控指标,按照设定频率推送到主控服务器上的Zabbix Server中,存储在Zabbix Server指定的MySQL数据库中;
[0014]2.异常告警单元:使用基于时间窗口的方法进行异常告警,每个时间窗口内对应的各指标对应的时间序列为其中W为时间窗口的个数,为第k个时间窗口内第i个指标在第j次采集的指标值,1≤k≤W;i表示第i个指标,i=1,2,3,4,分别对应CPU使用率、内存使用率、磁盘使用率和网络流量信息;s表示该时间窗口内指标的采集次数,且1≤j≤s;不断滑动时间窗口,检测各指标是否正常;指标异常包括:
[0015]1)未上线异常:在某个时间窗口内,一直未获取到受控服务器的监控状态数据,则该受控服务器被定义为出现未上线异常。
[0016]2)波动异常:采用标准差度量波动大小,其中表示第k个时间窗口内第i个指标的波动大小,表示第k个时间窗口内第i个指标的均值,表示第k个时间窗口内第i个指标的均值,时,给出波动异常告警,δi表示第i个指标的波动阈值;
[0017]3)指标值漂移异常:指标值漂移指标用于度量第k个时间窗相对于第k

1个时间窗第i个指标的漂移情况;时,给出波动异常告警,ξi表示第i个指标的指标值漂移阈值。
[0018]4)指标值过高异常:在一个时间窗口内,受控服务器的状态数据持续高于既定的阈值,该受控服务器被定义为出现指标值过高异常。
[0019]3.数据存储管理单元:将采集的受控服务器性能指标保存在服务器上的MySQL数据库中。
[0020]采用本专利技术后,采用该专利技术后,可以实时了解各服务器的性能状态,及时发现其中的异常情况,有效提高运维人员的工作效率。
附图说明
[0021]图1为本专利技术的方法流程图。
[0022]图2为本专利技术的系统示意图。
[0023]图3为实施例的系统示意图。
具体实施方式
[0024]本专利技术公开一种基于Zabbix的服务器性能监控方法及系统,该方法包括以下步骤:
[0025]1.服务器数据采集:在主控服务器上安装Zabbix服务器,在各受控服务器上安装Zabbix Agent;Zabbix Agent采集受控服务器的性能监控指标,如受控服务器的CPU使用率、内存使用率、磁盘使用率和网络流量信息等,并按照设定频率推送到主控服务器上的Zabbix Server中,存储在Zabbix Server指定的MySQL数据库中。
[0026]2.异常告警:在Zabbix Server不断获得各受控服务器的性能监控指标的同时,对各性能监控指标进行异常检测。异常检测过程中,使用了基于时间窗口方法。时间窗口的个数为W,每个时间窗口内对应的各指标对应的时间序列为其中表示第k个时间窗口内第i个指标在第j次采集的指标值,1≤k≤W;i表示第i个指标,i=1,2,3,4,分别对应CPU使用率、内存使用率、磁盘使用率和网络流量信息;s表示在该时间窗口内指标的采集次数,且1≤j≤s。
[0027]不断滑动时间窗口,检测各指标是否正常。在本专利技术中,将指标异常划分为四类:未上线异常、波动异常、指标值漂移异常和指标值过高异常。
[0028]1)未上线异常:在某个时间窗口内,一直未获取到受控服务器的监控状态数据,则该受控服务器被定义为出现未上线异常。
[0029]2)波动异常:在一个时间窗口内,正常情况下一台受控服务器的状态数据应波动较小;如果出现了较大的波动,则该受控服务器被定义为出现波动异常。本部分采用标准差度量波动的大小,即:其中表示第k个时间窗口内第i个指标的波动大小,表示第k个时间窗口内第i个指标的均值,计算方法为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Zabbix的服务器性能监控方法,其特征在于,该方法包括以下步骤:1)服务器数据采集:在各受控服务器上安装Zabbix Agent,Zabbix Agent采集受控服务器的性能监控指标,按照设定频率推送到主控服务器上的Zabbix Server中,存储在Zabbix Server指定的MySQL数据库中;2)异常告警:使用基于时间窗口的方法进行异常告警,每个时间窗口内对应的各指标对应的时间序列为其中W为时间窗口的个数,为第k个时间窗口内第i个指标在第j次采集的指标值,1≤k≤W;i表示第i个指标,i=1,2,3,4,分别对应CPU使用率、内存使用率、磁盘使用率和网络流量信息;s表示该时间窗口内指标的采集次数,且1≤j≤s;不断滑动时间窗口,检测各指标是否正常;指标异常包括:(1)未上线异常:在某个时间窗口内,一直未获取到受控服务器的监控状态数据,则该受控服务器被定义为出现未上线异常;(2)波动异常:采用标准差度量波动大小,其中表示第k个时间窗口内第i个指标的波动大小,表示第k个时间窗口内第i个指标的均值,表示第k个时间窗口内第i个指标的均值,时,给出波动异常告警,δi表示第i个指标的波动阈值;(3)指标值漂移异常:指标值漂移指标用于度量第k个时间窗相对于第k

1个时间窗第i个指标的漂移情况;时,给出波动异常告警,ξi表示第i个指标的指标值漂移阈值;(4)指标值过高异常:在一个时间窗口内,受控服务器的状态数据持续高于既定的阈值,该受控服务器被定义为出现指标值过高异常。3)数据存储管理:将采集的受控服务器性能指标保存在服务器上的MySQL数据库中。2.一种基于Zabbix的服务器性能监控系统,其特征在于...

【专利技术属性】
技术研发人员:陈传凯杨小华朱浩王伟斌刘宁
申请(专利权)人:北京新数科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1