A device and network device dynamic threshold method based on sub health warning, the method comprises the following steps: S1: performance data acquisition network equipment data; S2: evaluation of network switching equipment to determine the health value; dynamic parameters of weight through a number of important performance parameters of equipment affecting network performance, normalized original data collection finally, the running state of comprehensive evaluation of network equipment; S3: the definition and division of early warning types; according to various reasons of network equipment will reflect the early warning, early warning is divided into several categories to correspond to different fault problems; S4: dynamic threshold interval set early warning network equipment; dynamic threshold interval according to the definition and classification of the type of warning set; S5: for network equipment sub health warning based on dynamic threshold interval set. The device is used for carrying out the early warning method. The invention has the advantages of simple principle, optimization of the stability efficiency of the network equipment, automatic monitoring and evaluation, etc..
【技术实现步骤摘要】
本专利技术主要涉及到网络设备的健康预警
,特指一种基于动态阈值的网络设备亚健康预警方法及装置,适用于数据中心网络、大规模企业网和高性能巨型机等网络设备。
技术介绍
随着云计算及虚拟化技术的快速发展,数据中心具有高达数千个计算和存储节点,数据中心网络的发展面临着众多的挑战。网络资源作为数据中心的紧缺资源,往往会成为数据中心的性能瓶颈。网络配置错误、网络拥塞、负载不均衡等将导致服务瘫痪、丢包、重传、超时等,也严重影响数据中心性能,进而影响到服务质量、用户体验和投资回报。当前的网络设备预警方法主要有以下几种:(1)基于固定阈值的网络预警方法;固定阈值网络预警方法是根据管理员的历史经验,为各个性能参数赋予固定阈值。当某个性能参数或者多个性能参数小于系统配置阈值,则判定当前网络运行状态正常,没有预警事件;相反,当出现大于阈值的性能参数,系统产生网络预警信息。该方法直观简单,能够及时快速的发现以往出现过的导致网络性能降低故障。(2)基于统计预测相关算法的网络预警方法;统计预测相关算法是采用统计学和概率论的方法来分析网络性能参数数据,通过研究一段时间内数据的分布规律和发展趋势,推测和判断当前网络状态的一种方法。该方法通过对当前网络数据统计分析,识别出可能的网络异常情况,并给出不同级别的预警,发现在固定性能阈值预警系统中无法识别的潜在故障或性能问题。(3)基于一元回归模型的网络分析预警方法;一元回归模型主要通过利用回归分析预测方法,建立网络性能与其他网络参数间的线性回归方程式,即回归模型。网络各种参数之间相互关联,回归分析预测方法就是根据已观察到的参数,推测出网络 ...
【技术保护点】
一种基于动态阈值的网络设备亚健康预警方法,其特征在于,步骤为:S1:采集网络设备性能参数数据;S2:评估网络交换设备健康值;通过对影响网络设备性能的多个重要性能参数进行各个参数权重的动态确定,原始采集数据的归一化处理,最后综合评估网络设备的运行状态,实现网络交换设备性能的量化评估;S3:定义并划分预警类型;根据网络设备的预警反映的各种原因,将预警分为若干类别以对应不同的故障问题;S4:设置网络设备预警的动态阈值区间;根据定义和划分的预警类型进行动态阈值区间的设置;S5:根据设定的动态阈值区间来进行网络设备亚健康预警。
【技术特征摘要】
1.一种基于动态阈值的网络设备亚健康预警方法,其特征在于,步骤为:S1:采集网络设备性能参数数据;S2:评估网络交换设备健康值;通过对影响网络设备性能的多个重要性能参数进行各个参数权重的动态确定,原始采集数据的归一化处理,最后综合评估网络设备的运行状态,实现网络交换设备性能的量化评估;S3:定义并划分预警类型;根据网络设备的预警反映的各种原因,将预警分为若干类别以对应不同的故障问题;S4:设置网络设备预警的动态阈值区间;根据定义和划分的预警类型进行动态阈值区间的设置;S5:根据设定的动态阈值区间来进行网络设备亚健康预警。2.根据权利要求1所述的基于动态阈值的网络设备亚健康预警方法,其特征在于,在所述步骤S1中,首次采集需要初始化得到整个网络设备集合,制定数据采集策略;然后,基于简单网络管理协议SNMP对整个网络设备集合进行轮询,获取设备性能参数;之后,每次进行数据采集,先获得数据库中故障设备或亚健康设备集合,及时更新采集策略中的特定设备集合,并根据数据采集策略对特定设备集合采用非定时重点采集。3.根据权利要求1所述的基于动态阈值的网络设备亚健康预警方法,其特征在于,在所述步骤S3中,分成三个大类,包括:静态故障预警,动态故障预警,以及动态性能预警,分别对应网络设备出现严重故障,存在故障隐患,可能出现某些性能瓶颈。4.根据权利要求1~3中任意一项所述的基于动态阈值的网络设备亚健康预警方法,其特征在于,所述步骤S2的步骤为:S2.1首先得到网络交换设备的掉线率、平均丢包率、平均错误率DropRate(Si),AvgDisRate(Si)和AvgErrRate(Si),经过标准差系数公式后,最终得到各参数所对应的权重值w[DropRate(S)],w[AvgDisRate(S)]和w[AvgErrRate(S)];S2.2首先分别统计参数DropRate(Si),AvgDisRate(Si)和AvgErrRate(Si)在评估时间点下,出现概率次数最多幂值pmost、最大幂值pmax;根据分布情况,分别得到各个参数pmost的历史频率最高值pmid以及历史最大值pmaxhis,经过归一化处理后,最终各个参数的标准化值;S2.3计算网络交换设备健康值并根据设备运行状况分级,即先初始化健康值计算模块,在检查性能参数和权值的合理性后,通过对网络设备集合中所有设备进行各个性能参数的累加和运算,得到整个网络所有交换设备的健康值分布;最后,结合网络设备的健康值,对分布在不同健康值区间的设备进行分级,并描述不同级别的网络设备性能指标的运行状况。5.根据权利要求1~3中任意一项所述的基于动态阈值的网络设备亚健康预警方法,其特征在于,所述步骤S5的步骤为:S5.1分析亚健康设备特征,即根据网络设备的历史运行情况判断出是否为亚健康设备;在网络中运行的设备,当具有以下两方面特征时,认定其为亚健康设备:1)长期处于合理阈值区间内,未出现过或较少出现告警情况,但在此时间段内,该设备健康值均处于网络所有设备健康值的历史均值之下;2)一直处于正常或者较高健康值水平,但在此时间...
【专利技术属性】
技术研发人员:陈琳,南洋,黄杰,张晓哲,张飞朋,张富强,
申请(专利权)人:中国人民解放军国防科学技术大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。