一种网元健康状态的检测方法及设备技术

技术编号:19242513 阅读:29 留言:0更新日期:2018-10-24 05:15
本发明专利技术实施例涉及一种网元健康状态的检测方法及设备,涉及通信技术领域,具体方法包括:检测设备确定目标网元的至少一个关键性能指标KPI在第一时间窗内的采样数据;检测设备根据至少一个KPI中的任一KPI在第一时间窗内的采样数据与任一KPI的稳态值得到任一KPI的波动性的得分;检测设备根据至少一个KPI中的各KPI的波动性的得分确定目标网元的健康状态。由此,通过网元单点性能数据以及网元时间窗内的性能数据确定网元的健康状态。解决了仅考虑网元的单点时刻性能数据进行判断不准确的问题。所以本方案对网元健康状态的识别更加准确。

【技术实现步骤摘要】
一种网元健康状态的检测方法及设备
本专利技术涉及通信技术,尤其涉及一种网元健康状态的检测方法及设备。
技术介绍
网络运维管理,是指保障网络与业务正常、安全、有效运行而采取的生产组织管理活动,主要用于维护网络及业务的稳定,及时进行故障处理以及网络优化。随着网络系统日趋复杂,受到宕机、负载过高、硬件故障等各类繁杂问题的挑战,同时成本高、耗时长、服务质量差等是目前网络运维管理的一大难题。如何识别出网元的健康状态并进行故障预防成为了网络运维管理的关键。目前,通过主动式运维服务来实现网络运维管理中网元的健康状态的识别,该方案需要针对网元建立阈值检测体系,当某时刻点网元的指标值低于或超过基准阈值时,说明该网元的工作效率较低,甚至无法达到工作最低要求,则对该网元进行告警提示。现在的阈值报警体系仅考虑网络设备单时刻点性能数据,对网元健康状态的识别还不够准确。
技术实现思路
本专利技术实施例提供了一种网元健康状态的检测方法及设备,用以解决仅考虑网元的单点时刻性能数据与基线阈值确定网元健康状态不准确的问题。第一方面,本申请实施例提供了一种网元健康状态的检测方法。该方法具体包括:检测设备确定目标网元的至少一个关键性能指标(KeyPerformanceIndicator,KPI)在第一时间窗内的采样数据;检测设备根据至少一个KPI中的任一KPI在第一时间窗内的采样数据与任一KPI的稳态值得到任一KPI的波动性的得分;检测设备根据至少一个KPI中的各KPI的波动性的得分确定目标网元的健康状态。本方案中,通过网元时间窗内的性能数据确定波动性,根据波动性确定网元的健康状态。解决了仅考虑网元的单点时刻性能数据进行判断不准确的问题。所以本方案对网元健康状态的识别更加准确。在一个可选的实现方式中,上述波动性,用于表征任一KPI偏离稳态值所表征的稳定状态的程度。在另一个可选的实现方式中,上述“检测设备根据至少一个KPI中的任一KPI在第一时间窗内的采样数据与任一KPI的稳态值得到任一KPI的波动性的得分”的方法可以包括:计算任一KPI在第一时间窗内的采样数据与任一KPI的稳态值的距离,根据任一KPI在第一时间窗内的采样数据与任一KPI的稳态值的距离得到波动性的得分。其中,该稳态值用于表征KPI的稳定状态。在又一个可选的实现方式中,上述“计算任一KPI在第一时间窗内的采样数据与任一KPI的稳态值的距离”的方法可以包括:采用标准差方法、平均差方法和变异系数方法中的一种计算任一KPI在第一时间窗内的采样数据与任一KPI的稳态值的距离。由于任一KPI在第一时间窗内的采样数据与任一KPI的稳态值的距离得到波动性的得分,该波动性的得分确定目标网元的健康状态。因此,采用标准差方法、平均差方法和变异系数方法中的一种计算任一KPI在第一时间窗内的采样数据与稳态值的距离,然后根据该采样数据和稳态值的距离确定准确的波动性的得分,如此,可以保证得到更为准确的至任一KPI的波动性的得分,从而更加准确地确定目标网元的健康状态。在再一个可选的实现方式中,检测设备确定任一KPI在第二时间窗内的采样数据,第二时间窗的截止时刻小于或等于第一时间窗的截止时刻;检测设备根据任一KPI在第二时间窗内的采样数据计算任一KPI的稳态值。通常,第二时间窗大于第一时间窗。由于第二时间窗大于第一时间窗,所以,在第二时间窗内采集数据的数量多,更能代表任一KPI的状态,因此,考虑到第二时间窗内的采样数据计算出的稳态值并结合在第一时间窗内的采样数据得到的波动性的得分要更加准确。在再一个可选的实现方式中,上述“根据任一KPI在第二时间窗内的采样数据计算任一KPI的稳态值”的方法可以包括:根据去除异常点和/或噪声点后的任一KPI在第二时间窗内的采样数据计算任一KPI的稳态值。由于第二时间窗内的采样数据并不完全应用在计算任一KPI的稳态值中,因此,该方法需去除第二时间窗内的采样数据中的异常点和/或噪声点,根据去除异常点和/或噪声点之后的采样数据中任一KPI更加准确的计算任一KPI的稳态值。在再一个可选的实现方式中,上述“根据至少一个KPI中的各KPI的波动性的得分确定目标网元的健康状态”的方法可以包括:根据波动性的得分和任一KPI对应的离网元硬件特性门限距离的得分与任一KPI的趋势性的得分中的至少一个通过加权计算得到任一KPI的可靠性得分;根据至少一个KPI中的各KPI的可靠性得分确定目标网元的健康状态。若仅根据至少一个KPI中的各KPI的波动性的得分确定目标网元的健康状态,那么此过程中的波动性的得分就相当于可靠性得分。另一种方法,根据波动性的得分以及任一KPI对应的离网元硬件特性门限距离的得分通过加权计算得到目标网元的可靠性得分,根据目标网元的可靠性得分可以确定目标网元的健康状态。由于此方法中不仅考虑到了波动性的得分也考虑到了任一KPI对应的离网元硬件特性门限距离的得分。因此,该方法准确确定目标网元的健康状态。又一种方法,根据任一KPI波动性的得分以及任一KPI的趋势性的得分通过加权计算得到目标网元的可靠性得分,根据目标网元的可靠性得分可以确定目标网元的健康状态。由于此方法中不仅考虑到了波动性的得分也考虑到了趋势性的得分,因此,该方法准确确定目标网元的健康状态。在再一个可选的实现方式中,检测设备确定目标网元的任一KPI在待检测时刻的采样数据,待检测时刻为第一时间窗的截止时刻;检测设备根据任一KPI在待检测时刻的采样数据以及预设的任一KPI的网元硬件特性门限,确定任一KPI的离网元硬件特性门限距离得分。在再一个可选的实现方式中,上述“根据波动性的得分、和任一KPI对应的离网元硬件特性门限距离的得分与任一KPI的趋势性的得分中的至少一个通过加权计算得到任一KPI的可靠性得分”的方法可以包括:根据任一KPI的波动性得分、任一KPI的离网元硬件特性门限距离的得分以及任一KPI的趋势性的得分通过加权计算得到任一KPI的可靠性得分。由于同时考虑了任一KPI的波动性得分、任一KPI的离网元硬件特性门限距离的得分以及任一KPI的趋势性的得分,如此,不仅通过网元单点性能数据以及网元时间窗内的性能数据确定网元的性能,根据网元的性能获得可靠性得分,可靠性确定网元健康状态,此过程中对网元健康识别更加准确。在再一个可选的实现方式中,检测设备确定任一KPI在第三时间窗内的采样数据,第三时间窗大于第一时间窗,第三时间窗的截止时刻小于等于第一时间窗的截止时刻;检测设备根据任一KPI在第三时间窗内的采样数据的采集时间对采样数据进行先后排序,得到排序数据,对排序数据进行分解,确定任一KPI的趋势性分量;根据任一KPI的趋势性分量得到任一KPI的趋势性的得分。由于充分利用任一KPI在第三时间窗内的采样数据的采集时间对采样数据进行先后排序,得到排序数据,对排序数据进行分解,分解出任一KPI的趋势性分量,并根据任一KPI的趋势性分量得到任一KPI的趋势性的得分,此过程更能准确得到趋势性的得分。在再一个可选的实现方式中,上述“至少一个KPI包括多个KPI;根据至少一个KPI中的各KPI的可靠性得分确定目标网元的健康状态”的方法可以包括:对多个KPI的每个的可靠性得分进行加权计算计算确定目标网元的可靠性得分;根据目标网元的可靠性得分确定目标网本文档来自技高网...

【技术保护点】
1.一种网元健康状态的检测方法,其特征在于,包括:检测设备确定目标网元的至少一个关键性能指标KPI在第一时间窗内的采样数据;所述检测设备根据所述至少一个KPI中的任一KPI在所述第一时间窗内的采样数据与所述任一KPI的稳态值得到所述任一KPI的波动性的得分;所述检测设备根据所述至少一个KPI中的各KPI的波动性的得分确定所述目标网元的健康状态。

【技术特征摘要】
1.一种网元健康状态的检测方法,其特征在于,包括:检测设备确定目标网元的至少一个关键性能指标KPI在第一时间窗内的采样数据;所述检测设备根据所述至少一个KPI中的任一KPI在所述第一时间窗内的采样数据与所述任一KPI的稳态值得到所述任一KPI的波动性的得分;所述检测设备根据所述至少一个KPI中的各KPI的波动性的得分确定所述目标网元的健康状态。2.根据权利要求1所述的方法,其特征在于,所述波动性,用于表征所述任一KPI偏离所述稳态值所表征的稳定状态的程度。3.根据权利要求1-2任意一项所述的方法,其特征在于,所述检测设备根据所述至少一个KPI中的任一KPI在所述第一时间窗内的采样数据与所述任一KPI的稳态值得到所述任一KPI的波动性的得分,包括:计算所述任一KPI在所述第一时间窗内的采样数据与所述任一KPI的稳态值的距离,根据所述任一KPI在所述第一时间窗内的采样数据与所述任一KPI的稳态值的距离得到波动性的得分。4.根据权利要求3所述的方法,其特征在于,所述计算所述任一KPI在所述第一时间窗内的采样数据与所述任一KPI的稳态值的距离,包括:采用标准差方法、平均差方法和变异系数方法中的一种计算所述任一KPI在所述第一时间窗内的采样数据与所述任一KPI的稳态值的距离。5.根据权利要求1-4任意一项所述的方法,其特征在于,还包括:所述任一KPI在第二时间窗内的采样数据,所述第二时间窗大于第一时间窗,所述第二时间窗的截止时刻小于或等于所述第一时间窗的截止时刻;所述检测设备根据所述任一KPI在所述第二时间窗内的采样数据计算所述任一KPI的稳态值。6.根据权利要求5所述的方法,其特征在于,所述根据所述任一KPI在所述第二时间窗内的采样数据计算所述任一KPI的稳态值,包括:根据去除异常点和/或噪声点后的所述任一KPI在所述第二时间窗内的采样数据计算所述任一KPI的稳态值。7.根据权利要求1-6任意一项所述的方法,其特征在于,所述根据所述至少一个KPI中的各KPI的波动性的得分确定所述目标网元的健康状态,包括:根据所述波动性的得分、和所述任一KPI对应的离网元硬件特性门限距离的得分与所述任一KPI的趋势性的得分中的至少一个通过加权计算得到所述任一KPI的可靠性得分;根据所述至少一个KPI中的各KPI的可靠性得分确定所述目标网元的健康状态。8.根据权利要求7所述的方法,其特征在于,还包括:所述检测设备确定目标网元的所述任一KPI在待检测时刻的采样数据,所述待检测时刻为所述第一时间窗的截止时刻;所述检测设备根据所述任一KPI在所述待检测时刻的采样数据以及预设的所述任一KPI的网元硬件特性门限,确定所述任一KPI的离网元硬件特性门限距离得分。9.根据权利要求8所述的方法,其特征在于,还包括:所述检测设备确定所述任一KPI在第三时间窗内的采样数据,所述第三时间窗大于第一时间窗,所述第三时间窗的截止时刻小于等于所述第一时间窗的截止时刻;所述检测设备根据所述任一KPI在所述第三时间窗内的采样数据的采集时间对所述采样数据进行先后排序,得到排序数据,对所述排序数据进行分解,确定所述任一KPI的趋势性分量;根据所述任一KPI的趋势性分量得到所述任一KPI的趋势性的得分。10.根据权利要求5所述的方法,其特征在于,所述至少一个KPI包括多个KPI;所述根据所述至少一个KPI中的各KPI的可靠性得分确定所述目标网元的健康状态,包括:对所述多个KPI的每个的可靠性得分进行加权计算确定所述目标网元的可靠性得分;根据所述目标网元的可靠性得分确定所述目标网元的健康状态。11.根据权利要求1所述的方法,其特征在于,所述至少一个KPI包括多个KPI;所述检测设备根据所述至少一个KPI中的各KPI的波动性的得分确定所述目标网元的健康状态,包括:对所述多个KPI的每个的波动性的得分进行加权计算确定所述目标网元的可靠性得分;根据所述目标网元的可靠性得分确定所述目标网元的健康状态。12.根据权利要求1-11任意一项所述...

【专利技术属性】
技术研发人员:谢于明肖倩熊枝满薛莉陈明
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1