基于动态阈值的网络设备亚健康预警方法及装置制造方法及图纸

技术编号:14172654 阅读:100 留言:0更新日期:2016-12-13 00:36
一种基于动态阈值的网络设备亚健康预警方法及装置,该方法的步骤为:S1:采集网络设备性能参数数据;S2:评估网络交换设备健康值;通过对影响网络设备性能的多个重要性能参数进行各个参数权重的动态确定,原始采集数据的归一化处理,最后综合评估网络设备的运行状态;S3:定义并划分预警类型;根据网络设备的预警反映的各种原因,将预警分为若干类别以对应不同的故障问题;S4:设置网络设备预警的动态阈值区间;根据定义和划分的预警类型进行动态阈值区间的设置;S5:根据设定的动态阈值区间来进行网络设备亚健康预警。该装置用来执行上述预警方法。本发明专利技术具有原理简单、能够优化网络设备维稳效率、可进行自动监测和评价等优点。

Method and device for early warning of network equipment sub health based on dynamic threshold

A device and network device dynamic threshold method based on sub health warning, the method comprises the following steps: S1: performance data acquisition network equipment data; S2: evaluation of network switching equipment to determine the health value; dynamic parameters of weight through a number of important performance parameters of equipment affecting network performance, normalized original data collection finally, the running state of comprehensive evaluation of network equipment; S3: the definition and division of early warning types; according to various reasons of network equipment will reflect the early warning, early warning is divided into several categories to correspond to different fault problems; S4: dynamic threshold interval set early warning network equipment; dynamic threshold interval according to the definition and classification of the type of warning set; S5: for network equipment sub health warning based on dynamic threshold interval set. The device is used for carrying out the early warning method. The invention has the advantages of simple principle, optimization of the stability efficiency of the network equipment, automatic monitoring and evaluation, etc..

【技术实现步骤摘要】

本专利技术主要涉及到网络设备的健康预警
,特指一种基于动态阈值的网络设备亚健康预警方法及装置,适用于数据中心网络、大规模企业网和高性能巨型机等网络设备。
技术介绍
随着云计算及虚拟化技术的快速发展,数据中心具有高达数千个计算和存储节点,数据中心网络的发展面临着众多的挑战。网络资源作为数据中心的紧缺资源,往往会成为数据中心的性能瓶颈。网络配置错误、网络拥塞、负载不均衡等将导致服务瘫痪、丢包、重传、超时等,也严重影响数据中心性能,进而影响到服务质量、用户体验和投资回报。当前的网络设备预警方法主要有以下几种:(1)基于固定阈值的网络预警方法;固定阈值网络预警方法是根据管理员的历史经验,为各个性能参数赋予固定阈值。当某个性能参数或者多个性能参数小于系统配置阈值,则判定当前网络运行状态正常,没有预警事件;相反,当出现大于阈值的性能参数,系统产生网络预警信息。该方法直观简单,能够及时快速的发现以往出现过的导致网络性能降低故障。(2)基于统计预测相关算法的网络预警方法;统计预测相关算法是采用统计学和概率论的方法来分析网络性能参数数据,通过研究一段时间内数据的分布规律和发展趋势,推测和判断当前网络状态的一种方法。该方法通过对当前网络数据统计分析,识别出可能的网络异常情况,并给出不同级别的预警,发现在固定性能阈值预警系统中无法识别的潜在故障或性能问题。(3)基于一元回归模型的网络分析预警方法;一元回归模型主要通过利用回归分析预测方法,建立网络性能与其他网络参数间的线性回归方程式,即回归模型。网络各种参数之间相互关联,回归分析预测方法就是根据已观察到的参数,推测出网络性能的是否稳定,是否存在波动。在网络故障可能发生前做出决策,避免造成更多的损失。(4)基于支持向量机的网络预警方法;基于支持向量机的网络预警方法是将网络预警问题转化成机器学习问题,通过对历史的重大告警信息进行特征抽取,预处理,SVM分类器训练等过程,建立一个针对特定告警的SVM的网络预警预测模型。该模型可以在训练样本较少的情况下,具有较高精度和召回率,实现网络重大告警事件的识别和预警。(5)基于知识推理的网络预警方法;知识推理是人工智能的一个研究方向,在网络预警领域,该方法主要是根据已经发生网络故障或预警情况,建立网络故障知识库,再结合应用知识库中的知识,采取特定的处理策略,对网络中遇到的问题进行推理求解,实现网络故障事件的识别、定位、自学习、以及相应告警信息的生成。上述现有技术的网络预警方法存在的问题:1)网络环境复杂,固定阈值依赖管理员经验,无法预测各种突发异常情况;2)单纯依据网络流量情况来判定网络性能的正常与否,忽略了很多其他重要的判断因素,很可能导致做出过多无效的预警;3)对于潜在的性能瓶颈或不稳定设备节点,难以给出一个较为有效的预警方法。
技术实现思路
本专利技术要解决的技术问题就在于:针对现有技术存在的问题,本专利技术提供一种原理简单、持续优化网络设备维稳效率、进行自动监测和评价的基于动态阈值的网络设备亚健康预警方法及装置。为解决上述技术问题,本专利技术采用以下技术方案:一种基于动态阈值的网络设备亚健康预警方法,其步骤为:S1:采集网络设备性能参数数据;S2:评估网络交换设备健康值;通过对影响网络设备性能的多个重要性能参数进行各个参数权重的动态确定,原始采集数据的归一化处理,最后综合评估网络设备的运行状态,实现网络交换设备性能的量化评估;S3:定义并划分预警类型;根据网络设备的预警反映的各种原因,将预警分为若干类别以对应不同的故障问题;S4:设置网络设备预警的动态阈值区间;根据定义和划分的预警类型进行动态阈值区间的设置;S5:根据设定的动态阈值区间来进行网络设备亚健康预警。作为本专利技术方法的进一步改进:在所述步骤S1中,首次采集需要初始化得到整个网络设备集合,制定数据采集策略;然后,基于简单网络管理协议SNMP对整个网络设备集合进行轮询,获取设备性能参数;之后,每次进行数据采集,先获得数据库中故障设备或亚健康设备集合,及时更新采集策略中的特定设备集合,并根据数据采集策略对特定设备集合采用非定时重点采集。作为本专利技术方法的进一步改进:在所述步骤S3中,分成三个大类,包括:静态故障预警,动态故障预警,以及动态性能预警,分别对应网络设备出现严重故障,存在故障隐患,可能出现某些性能瓶颈。作为本专利技术方法的进一步改进:所述步骤S2的步骤为:S2.1首先得到网络交换设备的掉线率、平均丢包率、平均错误率DropRate(Si),AvgDisRate(Si)和AvgErrRate(Si),经过标准差系数公式后,最终得到各参数所对应的权重值w[DropRate(S)],w[AvgDisRate(S)]和w[AvgErrRate(S)];S2.2首先分别统计参数DropRate(Si),AvgDisRate(Si)和AvgErrRate(Si)在评估时间点下,出现概率次数最多幂值pmost、最大幂值pmax;根据分布情况,分别得到各个参数pmost的历史频率最高值pmid以及历史最大值pmaxhis,经过归一化处理后,最终各个参数的标准化值;S2.3计算网络交换设备健康值并根据设备运行状况分级,即先初始化健康值计算模块,在检查性能参数和权值的合理性后,通过对网络设备集合中所有设备进行各个性能参数的累加和运算,得到整个网络所有交换设备的健康值分布;最后,结合网络设备的健康值,对分布在不同健康值区间的设备进行分级,并描述不同级别的网络设备性能指标的运行状况。作为本专利技术方法的进一步改进:所述步骤S5的步骤为:S5.1分析亚健康设备特征,即根据网络设备的历史运行情况判断出是否为亚健康设备;在网络中运行的设备,当具有以下两方面特征时,认定其为亚健康设备:1)长期处于合理阈值区间内,未出现过或较少出现告警情况,但在此时间段内,该设备健康值均处于网络所有设备健康值的历史均值之下;2)一直处于正常或者较高健康值水平,但在此时间段内,该设备历史健康值波动水平大于网络所有设备的历史平均波动水平;S5.2初步判断亚健康设备,即检查预警信息表中的历史预警记录,查看该网络设备是否出现过预警信息,如果设备历史运行情况比较正常,没有历史不良预警记录,说明设备运行稳定较健康;相反,若多次出现过预警信息,则该设备为亚健康网络设备,给网络的稳定运行带来很大的危害,即当网络流量负担较小时,或者该网络设备整体运行负荷较轻时,设备的综合评估健康值在正常水平重;S5.3综合判断亚健康设备,首先计算所有网络设备的历史健康值均值和方差值,即求出在一个时间段内,所有网络设备健康值的历史均值μa,以及所有设备健康值的历史方差σi;下一步,评估网络设备的性能情况,即求出该设备在该时间段内的设备健康值均值μi,并与此时间段内网络所有设备健康值的历史均值μa相比,如果μi<μa,则给出相应的动态性能预警提示;然后,判断网络设备的故障状态,计算出该设备在该时间段内的设备健康值方差σi,并与此时间段内网络所有设备健康值的历史方差σa相比,如果|σi|>|σa|,给出相应的动态故障预警提示;最后,生成完整的预警报告信息,结束设备亚健康预警。作为本专利技术方法的进一步改进:所述步骤S4的步骤为:S4.1:静态故障预警;甄别出本文档来自技高网
...
基于动态阈值的网络设备亚健康预警方法及装置

【技术保护点】
一种基于动态阈值的网络设备亚健康预警方法,其特征在于,步骤为:S1:采集网络设备性能参数数据;S2:评估网络交换设备健康值;通过对影响网络设备性能的多个重要性能参数进行各个参数权重的动态确定,原始采集数据的归一化处理,最后综合评估网络设备的运行状态,实现网络交换设备性能的量化评估;S3:定义并划分预警类型;根据网络设备的预警反映的各种原因,将预警分为若干类别以对应不同的故障问题;S4:设置网络设备预警的动态阈值区间;根据定义和划分的预警类型进行动态阈值区间的设置;S5:根据设定的动态阈值区间来进行网络设备亚健康预警。

【技术特征摘要】
1.一种基于动态阈值的网络设备亚健康预警方法,其特征在于,步骤为:S1:采集网络设备性能参数数据;S2:评估网络交换设备健康值;通过对影响网络设备性能的多个重要性能参数进行各个参数权重的动态确定,原始采集数据的归一化处理,最后综合评估网络设备的运行状态,实现网络交换设备性能的量化评估;S3:定义并划分预警类型;根据网络设备的预警反映的各种原因,将预警分为若干类别以对应不同的故障问题;S4:设置网络设备预警的动态阈值区间;根据定义和划分的预警类型进行动态阈值区间的设置;S5:根据设定的动态阈值区间来进行网络设备亚健康预警。2.根据权利要求1所述的基于动态阈值的网络设备亚健康预警方法,其特征在于,在所述步骤S1中,首次采集需要初始化得到整个网络设备集合,制定数据采集策略;然后,基于简单网络管理协议SNMP对整个网络设备集合进行轮询,获取设备性能参数;之后,每次进行数据采集,先获得数据库中故障设备或亚健康设备集合,及时更新采集策略中的特定设备集合,并根据数据采集策略对特定设备集合采用非定时重点采集。3.根据权利要求1所述的基于动态阈值的网络设备亚健康预警方法,其特征在于,在所述步骤S3中,分成三个大类,包括:静态故障预警,动态故障预警,以及动态性能预警,分别对应网络设备出现严重故障,存在故障隐患,可能出现某些性能瓶颈。4.根据权利要求1~3中任意一项所述的基于动态阈值的网络设备亚健康预警方法,其特征在于,所述步骤S2的步骤为:S2.1首先得到网络交换设备的掉线率、平均丢包率、平均错误率DropRate(Si),AvgDisRate(Si)和AvgErrRate(Si),经过标准差系数公式后,最终得到各参数所对应的权重值w[DropRate(S)],w[AvgDisRate(S)]和w[AvgErrRate(S)];S2.2首先分别统计参数DropRate(Si),AvgDisRate(Si)和AvgErrRate(Si)在评估时间点下,出现概率次数最多幂值pmost、最大幂值pmax;根据分布情况,分别得到各个参数pmost的历史频率最高值pmid以及历史最大值pmaxhis,经过归一化处理后,最终各个参数的标准化值;S2.3计算网络交换设备健康值并根据设备运行状况分级,即先初始化健康值计算模块,在检查性能参数和权值的合理性后,通过对网络设备集合中所有设备进行各个性能参数的累加和运算,得到整个网络所有交换设备的健康值分布;最后,结合网络设备的健康值,对分布在不同健康值区间的设备进行分级,并描述不同级别的网络设备性能指标的运行状况。5.根据权利要求1~3中任意一项所述的基于动态阈值的网络设备亚健康预警方法,其特征在于,所述步骤S5的步骤为:S5.1分析亚健康设备特征,即根据网络设备的历史运行情况判断出是否为亚健康设备;在网络中运行的设备,当具有以下两方面特征时,认定其为亚健康设备:1)长期处于合理阈值区间内,未出现过或较少出现告警情况,但在此时间段内,该设备健康值均处于网络所有设备健康值的历史均值之下;2)一直处于正常或者较高健康值水平,但在此时间...

【专利技术属性】
技术研发人员:陈琳南洋黄杰张晓哲张飞朋张富强
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1