平台状态监控方法及装置、电子设备及存储介质制造方法及图纸

技术编号:37038441 阅读:14 留言:0更新日期:2023-03-29 19:17
本申请公开了一种平台状态监控方法及装置、电子设备及存储介质。所述平台状态监控方法包括:根据监控指标,监控目标平台得到时间序列数据;当所述时间序列数据不满足平稳条件时,对所述时间序列数据进行N次差分处理,得到满足所述平稳条件的平稳数据;其中,所述N为正整数;当所述平稳数据为非周期性数据时,将所述平稳数据输入到第一神经网络模型进行状态趋势预测得到输出结果,其中,所述输出结果,指示是否存在所述目标平台的告警和/或隐患。通过非周期数据的挖掘,使用神经网络模型确定出未来的趋势,从而实现了基于当前监控数据预判被监控的目标平台的未来状态,具有监控全面性更高和监控精度更高的特点。更高和监控精度更高的特点。更高和监控精度更高的特点。

【技术实现步骤摘要】
平台状态监控方法及装置、电子设备及存储介质


[0001]本申请涉及网络
,尤其涉及一种平台状态监控方法及装置、电子设备及存储介质。

技术介绍

[0002]相关技术对大数据任务调度平台的监控的,大多都是只关注监控的实时性、确定性及稳定性方面,即都仅仅关注平台当前的运行状态。例如,有的监控方法为:采集数据环境和任务调度的各种指标,根据采集的指标进行监控,无法对平台但接下来的运行进行预测,从而导致监控不够全面的问题。
[0003]还有的相关技术,针对特定的场景进行监控,基于监控阈值进行告警等,但这样静态设置的监控阈值的监控精确度并不高。

技术实现思路

[0004]本申请实施例提供了一种平台状态监控方法及装置、电子设备及存储介质,以解决相关技术中监控不够全面和/或监控精确度不高的问题。
[0005]本公开实施例第一方面提供一种平台状态监控方法,所述方法包括:
[0006]根据监控指标,监控目标平台得到时间序列数据;
[0007]当所述时间序列数据不满足平稳条件时,对所述时间序列数据进行N次差分处理,得到满足所述平稳条件的平稳数据;其中,所述N为正整数;
[0008]当所述平稳数据为非周期性数据时,将所述平稳数据输入到第一神经网络模型进行状态趋势预测得到输出结果,其中,所述输出结果,指示是否存在所述目标平台的告警和/或隐患。
[0009]基于上述方案,所述方法还包括:
[0010]当所述平稳数据在时域不具有周期性变化规律时,对所述平稳数据进行小波变换得到小波变换后的变换数据;
[0011]当所述变换数据在时域不具有周期性变化规律时,将所述变换数据对应的所述平稳数据确定为所述非周期性数据。
[0012]基于上述方案,所述方法还包括:
[0013]当所述输出结果指示存在满足第一告警条件的告警时,输出告警信息;
[0014]和/或,
[0015]当所述输出结果指示存在隐患时,将所述隐患的隐患信息写入监控报告,并在当前监控周期结束前输出所述监控报告。
[0016]基于上述方案,所述隐患信息指示以下至少之一:
[0017]隐患类型;
[0018]隐患的预测变化趋势;
[0019]隐患的风险评估;
[0020]隐患发生带来的负面后果。
[0021]基于上述方案,所述方法还包括:
[0022]将所述时间序列数据输入告警插件,其中,所述时间序列数据,用于供所述告警插件确定所述时间序列数据是否满足第二告警条件;
[0023]当所述时间序列数据满足所述第二告警条件时,所述告警插件输出告警信息。
[0024]基于上述方案,所述方法还包括:
[0025]将所述时间序列数据输入到第二神经网络模型进行分类预测得到分类结果;
[0026]当所述分类结果为满足第三告警条件时,输出告警信息。
[0027]基于上述方案,所述方法还包括:
[0028]当所述分类结果为不满足所述第三告警条件时,将不满足所述第三告警条件的所述时间序列数据写入历史数据库。
[0029]基于上述方案,所述方法还包括:
[0030]当存在告警时,将导致所述告警的所述时间序列数据输入到第三神经网络模型确定目标组件;其中,所述目标组件包括:所述目标平台内发生所述故障的故障组件;或者,所述目标组件包括:发生所述故障的故障组件和所述故障组件的关联组件;
[0031]通过重启所述目标组件排除所述故障。
[0032]基于上述方案,所述方法还包括:
[0033]在重启所述目标组件之后,确定是否重启发生所述故障的任务;
[0034]根据所述任务的执行结果,更新故障数据库,其中,所述故障数据库记录有重启可排除的故障信息和/或重启不能排除的故障信息。
[0035]基于上述方案,所述目标平台包括:任务调度平台;
[0036]所述时间序列数据包括以下至少之一:
[0037]所述目标平台内工作节点的健康状态信息;
[0038]所述目标平台内运行在所述工作节点上的工作组件的状态信息;
[0039]所述目标平台执行工作任务的作业状态信息。
[0040]本公开实施例第二方面提供一种平台状监控装置,所述装置包括:
[0041]监控模块,用于根据监控指标,监控目标平台得到时间序列数据;
[0042]得到模块,用于当所述时间序列数据不满足平稳条件时,对所述时间序列数据进行N次差分处理,得到满足所述平稳条件的平稳数据;其中,所述N为正整数;
[0043]第一预测模块,用于当所述平稳数据为非周期性数据时,将所述平稳数据输入到第一神经网络模型进行状态趋势预测得到输出结果,其中,所述输出结果,指示是否存在所述目标平台的告警和/或隐患。
[0044]基于上述方案,所述装置还包括:
[0045]变换模块,用于当所述平稳数据在时域不具有周期性变化规律时,对所述平稳数据进行小波变换得到小波变换后的变换数据;
[0046]确定模块,用于当所述变换数据在时域不具有周期性变化规律时,将所述变换数据对应的所述平稳数据确定为所述非周期性数据。
[0047]基于上述方案,所述装置还包括:
[0048]第一输出模块,用于当所述输出结果指示存在满足第一告警条件的告警时,输出
告警信息;
[0049]和/或,
[0050]第一写入模块,用于当所述输出结果指示存在隐患时,将所述隐患的隐患信息写入监控报告,并在当前监控周期结束前输出所述监控报告。
[0051]基于上述方案,所述隐患信息指示以下至少之一:
[0052]隐患类型;
[0053]隐患的预测变化趋势;
[0054]隐患的风险评估;
[0055]隐患发生带来的负面后果。
[0056]基于上述方案,所述装置还包括:
[0057]输入模块,用于将所述时间序列数据输入告警插件,其中,所述时间序列数据,用于供所述告警插件确定所述时间序列数据是否满足第二告警条件;
[0058]告警模块,用于当所述时间序列数据满足所述第二告警条件时,所述告警插件输出告警信息。
[0059]基于上述方案,所述装置还包括:
[0060]第二预测模块,用于将所述时间序列数据输入到第二神经网络模型进行分类预测得到分类结果;
[0061]第二输出模块,用于当所述分类结果为满足第三告警条件时,输出告警信息。
[0062]基于上述方案,所述装置还包括:
[0063]第二写入模块,用于当所述分类结果为不满足所述第三告警条件时,将不满足所述第三告警条件的所述时间序列数据写入历史数据库。
[0064]基于上述方案,所述装置还包括:
[0065]第一确定模块,用于当存在告警时,将导致所述告警的所述时间序列数据输入到第三神经网络模型确定目标组件;其中,所述目标组件包括:所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种平台状态监控方法,其特征在于,所述方法包括:根据监控指标,监控目标平台得到时间序列数据;当所述时间序列数据不满足平稳条件时,对所述时间序列数据进行N次差分处理,得到满足所述平稳条件的平稳数据;其中,所述N为正整数;当所述平稳数据为非周期性数据时,将所述平稳数据输入到第一神经网络模型进行状态趋势预测得到输出结果,其中,所述输出结果,指示是否存在所述目标平台的告警和/或隐患。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述平稳数据在时域不具有周期性变化规律时,对所述平稳数据进行小波变换得到小波变换后的变换数据;当所述变换数据在时域不具有周期性变化规律时,将所述变换数据对应的所述平稳数据确定为所述非周期性数据。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:当所述输出结果指示存在满足第一告警条件的告警时,输出告警信息;和/或,当所述输出结果指示存在隐患时,将所述隐患的隐患信息写入监控报告,并在当前监控周期结束前输出所述监控报告。4.根据权利要求2所述的方法,其特征在于,所述隐患信息指示以下至少之一:隐患类型;隐患的预测变化趋势;隐患的风险评估;隐患发生带来的负面后果。5.根据权利要求2所述的方法,其特征在于,所述方法还包括:将所述时间序列数据输入告警插件,其中,所述时间序列数据,用于供所述告警插件确定所述时间序列数据是否满足第二告警条件;当所述时间序列数据满足所述第二告警条件时,所述告警插件输出告警信息。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述时间序列数据输入到第二神经网络模型进行分类预测得到分类结果;当所述分类结果为满足第三告警条件时,输出告警信息。7.根据权利要求6所述的方法,其特征在于,所述方法还包括:当所述分类结果为不满足所述第三告警条件时,将不满足所述第三告警条件的所述时间序列数据写入历史数据库。8.根据权利要求1至6任一项所述的方法,其特征在于,所述方法还包括:当存在告警时,将导致所述告警的所述时间序列数据输入到第三神经网络模型确定目标组件;其中,所述目标组件包括:所述目标平台内发生所述故障的故障组件;或者,所述目标组件包括:发生所述故障的故障组件和所述故障组件的关联组件;通过重启所述目标组件排除所述故障。9.根据权利要求8所述的方法,其特征在于,所述方法还包括:在重启所述目标组件之后,确定是否重启发生所述故障的任务;
根据所述任务的执行结果,更新故障数据库,其中,所述故障数据库记录有重启可排除的故障信息和/或重启不能排除的故障信息。10.根据权利要求1所述的方法,其特征在于,所述目标平台包括:任务调度平台;所述时间序列数据包括以下至少之一:所述目标平台内工作节点的健康状态信息;所述目标平台内运行在所述工作节点上的工作组件的状态信息;所述目标平台执行工作任务的作业状态信息。11.一种平台状监控装置,其特征在于,所述装置包括:监控模块,用于根据监控指标,监控目标平台得到时间序列数据;得到模块,用于当所述时间序列数据不满足平稳条件时,对所述时间序列数据进行N次差分处理,得到满足所述平稳条件的平稳数据;其中,所述N为正整数;第一预测模块,用于当所述平稳数据为非周期性数据时,将所述平稳数据输入到第一神经网络模...

【专利技术属性】
技术研发人员:张强高恩伟闫岩
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1