一种数据分析方法以及相关设备技术

技术编号:38470035 阅读:10 留言:0更新日期:2023-08-11 14:47
本申请公开了一种数据分析方法以及相关设备,本申请中,获取到的性能数据清单用于表示性能值的时间序列,性能数据清单中包括时刻值和与时刻值对应的、描述网络设备性能的性能值。根据性能数据清单把坐标点划分为不同的坐标分布区间,可以根据区间中性能值的大小确认网络设备的负载状况,噪声对于评估结果产生的影响较小。对于网络设备的负载状况评估时得出的结论的准确性较高。的结论的准确性较高。的结论的准确性较高。

【技术实现步骤摘要】
一种数据分析方法以及相关设备


[0001]本专利技术涉及电子领域,尤其涉及一种数据分析方法以及相关设备。

技术介绍

[0002]在网络设备的运行过程中,网络设备上运行有各式各样的业务,当业务繁忙时,网络 设备的负载较高。业务空闲时,网络设备的负载较低。通常,运维人员或者其他设备可以 通过多种方式来获取网络设备的负载的变化情况。
[0003]网络设备运行过程中具有多种性能值,例如每秒I/O次数(I/O per second,IOPS), 中央处理器(Central Processing Unit,CPU)的利用率等。为了准确获取负载的变化情 况,通常会采集某一性能值的时间序列,即某一性能值在一段时间内随时间变化的情况。 因此,通过分析一段时间内该性能值的高低变化可以间接评估网络设备的负载状况。 若一段时间内,性能值持续超过固定阈值时,则可以认为该网络设备处于忙时区间,若性 能值持续低于固定阈值时,则可以认为该网络设备处于闲时区间。
[0004]传统的分析方法中,不同的性能值所对应的固定阈值不同。针对不同的性能值,在不 同的工况下,固定阈值难以确定,且性能值中存在噪声时容易影响对于网络设备所处状态 的判断,对于网络设备的负载状况评估时得出的结论的准确性较差。

技术实现思路

[0005]本申请提供了一种数据分析方法以及相关设备,根据性能数据清单把坐标点划分为不 同的坐标分布区间,可以根据区间中性能值的大小确认网络设备的负载状况,噪声对于评 估结果产生的影响较小。对于网络设备的负载状况评估时得出的结论的准确性较高。
[0006]本申请第一方面提供了一种数据分析方法,该方法中包括:获取性能数据清单,所述 性能数据清单用于表示性能值的时间序列,所述性能数据清单中包括时刻值和与所述时刻 值对应的、描述网络设备性能的性能值,所述时刻值和所述性能值用于构成坐标系中的坐 标点;根据所述性能数据清单把坐标点划分为不同的坐标分布区间,其中:所述坐标分布 区间用于表示不同时段下所述网络设备的忙闲程度,所述坐标分布区间中包括相邻的第一 区间和第二区间,所述第一区间和所述第二区间中包括第一坐标点,以所述任意一个所述 第一坐标点为中心的检测区域内的其他坐标点的数量大于第一阈值,所述第一区间和所述 第二区之间存在第二坐标点,以所述任意一个第二坐标点为中心的检测区域内的其他坐标 点的数量小于所述第一阈值。
[0007]本申请中,获取到的性能数据清单用于表示性能值的时间序列,性能数据清单中包括 时刻值和与时刻值对应的、描述网络设备性能的性能值。根据性能数据清单把坐标点划分 为不同的坐标分布区间,可以根据区间中性能值的大小确认网络设备的负载状况,噪声对 于评估结果产生的影响较小。对于网络设备的负载状况评估时得出的结论的准确性较高。
[0008]在第一方面的一种可能的实现方式中,各个坐标点的所述检测区域为:以该坐标
点为 中心,并以第一参数为短轴长、以第二参数为长轴长的椭圆区域。
[0009]该种可能的实现方式中,由于性能数据清单中的数据在x方向和y方向的变化尺度不 一致,因此,可以让x方向和y方向的权重不一样,只要适当地设置椭圆的长轴长度和短 轴长度,就可以让x方向距离太远的点不会被纳入当前点的邻域中,同时y方向相邻点如 果波动较大也可以将其纳入其邻域中。进一步增加了区间划分的准确性。
[0010]在第一方面的一种可能的实现方式中,所述时刻值构成所述坐标点的横坐标值,所述 性能值构成所述坐标点的纵坐标值,所述第一参数为性能数据清单中包括的性能值的一阶 差分绝对值的最大值。
[0011]该种可能的实现方式中,确定椭圆短轴时,为了使相邻的样本点尽可能被纳入当前样 本点的椭圆邻域中,那么椭圆短轴应尽可能放大。但是椭圆短轴的最大值应该等于性能值 在时间序列中变化率绝对值的最大值。因此取性能值在时间序列中的一阶差分绝对值的 最大值作为椭圆短轴长。进一步增加了区间划分的鲁棒性。
[0012]在第一方面的一种可能的实现方式中,所述方法还包括:当第一区间内坐标点的性能 值的统计量与所述第二区间内坐标点中的性能值的统计量的差的绝对值小于第二阈值;将 所述第一区间和所述第二区间合并为同一区间。
[0013]该种可能的实现方式中,不同性能指标的时间序列对参数的敏感程度不同。这就导致 可能某些本来属于同一忙闲等级的数据被聚为了两类。通过比较第一区间内坐标点的性能 值的统计量和第二区间内坐标点的性能值的统计量之间差值的大小,可以分析得出第一区 间和第二区间是否属于同一忙闲等级,该种可能的实现方式还可以排除噪声的干扰,进一 步提升区间划分的准确性。
[0014]在第一方面的一种可能的实现方式中,所述方法还包括:根据所述性能数据清单中包 括的时间值获取索引值,所述索引值用于构成所述坐标点的横坐标值。
[0015]该种可能的实现方式中,由于时间戳格式不方便进行坐标间的距离计算,因此,为了能更 方便地计算坐标之间的距离,网络设备需要对性能数据清单中的时间值加以处理。可选的, 网络设备可以根据性能数据清单中的时间值获取索引值,使用索引值代替时间值,便可以 减少计算坐标距离是产生的负载,降低开销。
[0016]在第一方面的一种可能的实现方式中,所述方法还包括:确认第三参数小于第三阈值, 所述第三参数为所述第一区间内坐标点的性能值的统计量;在所述第一区间所在时间段内 向所述网络设备下发业务。
[0017]该种可能的实现方式中,网络设备根据以第一坐标点为中心的检测区域内的其他坐标 的数量获取坐标分布区间。根据坐标分布区间得到网络设备负载的忙闲时间段。当有新的 业务需要下发时,只需要把业务上传到业务下发模块,业务下发模块根据坐标分布区间自 动将业务选择在网络设备负载较低的时段下发,节约了人力成本。
[0018]在第一方面的一种可能的实现方式中,所述方法还包括:确认第三参数大于第四阈值, 所述第三参数为所述第一区间内坐标点的性能值的统计量;指示所述网络设备需要被维护。
[0019]该种可能的实现方式中,根据以第一坐标点为中心的检测区域内的其他坐标点的数量 获取坐标分布区间。根据坐标分布区间得到网络设备负载的忙闲时间段。根据网络设备的 忙闲时段分别统计网络设备的性能值的变化情况。分析业务繁忙时,网络设备的平均
骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它 步骤或单元。
[0039]在网络设备的运行过程中,网络设备上运行有各式各样的业务,当业务繁忙时,网络 设备的负载较高。业务空闲时,网络设备的负载较低。通常,运维人员或者其他设备可以 通过多种方式来获取网络设备的负载的变化情况。
[0040]网络设备运行过程中具有多种性能值,例如每秒I/O次数(I/O per second,IOPS), 中央处理器(Central Processing Unit,CPU)的利用率等。为了准确获取负载的变化情 况,通常会采集某一性能值的时间序列,即某一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据分析方法,其特征在于,包括:获取性能数据清单,所述性能数据清单用于表示性能值的时间序列,所述性能数据清单中包括时刻值和与所述时刻值对应的、描述网络设备性能的性能值,所述时刻值和所述性能值用于构成坐标系中的坐标点;根据所述性能数据清单把坐标点划分为不同的坐标分布区间,其中:所述坐标分布区间用于表示不同时段下所述网络设备的忙闲程度,所述坐标分布区间中包括相邻的第一区间和第二区间,所述第一区间和所述第二区间中包括第一坐标点,以所述任意一个所述第一坐标点为中心的检测区域内的其他坐标点的数量大于第一阈值,所述第一区间和所述第二区之间存在第二坐标点,以所述任意一个第二坐标点为中心的检测区域内的其他坐标点的数量小于所述第一阈值。2.根据权利要求1所述的数据分析方法,其特征在于,各个坐标点的所述检测区域为:以该坐标点为中心,并以第一参数为短轴长、以第二参数为长轴长的椭圆区域。3.根据权利要求2所述的数据分析方法,其特征在于,所述时刻值构成所述坐标点的横坐标值,所述性能值构成所述坐标点的纵坐标值,所述第一参数为性能数据清单中包括的性能值的一阶差分绝对值的最大值。4.根据权利要求1至3中任意一项所述的数据分析方法,其特征在于,所述方法还包括:当第一区间内坐标点的性能值的统计量与所述第二区间内坐标点中的性能值的统计量的差的绝对值小于第二阈值;将所述第一区间和所述第二区间合并为同一区间。5.根据权利要求1至4中任意一项所述的数据分析方法,其特征在于,所述方法还包括:根据所述性能数据清单中包括的时间值获取索引值,所述索引值用于构成所述坐标点的横坐标值。6.根据权利要求1至5中任意一项所述的数据分析方法,其特征在于,所述方法还包括:确认第三参数小于第三阈值,所述第三参数为所述第一区间内坐标点的性能值的统计量;在所述第一区间所在时间段内向所述网络设备下发业务。7.根据权利要求1至6中任意一项所述的数据分析方法,其特征在于,所述方法还包括:确认第三参数大于第四阈值,所述第三参数为所述第一区间内坐标点的性能值的统计量;指示所述网络设备需要被维护。8.一种网络设备,其特征在于,包括:获取单元,用于获取性能数据清单,所述性能数据清单用于表示性能值的时间序列,所述性能数据清单中包括时刻值和与所述时刻值对应的、描述网络设备性能的性能值,所述时刻值和所述性能值用于构成坐标系中的坐标点;划分单...

【专利技术属性】
技术研发人员:龙坤宁尚明
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1