一种具备故障检测的运维监控装置及工作方法制造方法及图纸

技术编号:37112886 阅读:14 留言:0更新日期:2023-04-01 05:09
一种具备故障检测的运维监控装置及工作方法,装置包括:数据采集模块,故障检测模块,故障处理模块,输出显示模块,警示模块和储存模块;其中,数据采集模块的输出端与故障检测模块的输入端连接,故障检测模块的输出端与故障处理模块的输入端连接,故障处理模块的输出端与输出显示模块的输入端连接,警示模块的输入端分别与故障检测模块和故障处理模块的输出端连接,储存模块分别与故障检测模块和故障处理模块双向连接;所述装置还包括:自管理模块;自管理模块的输出端与故障检测模块的输入端连接。其实现了对故障进行检测的能力,从而解决了在运维监控过程中,监控目标系统常常会存在故障,导致目标系统无法正常运行的问题。导致目标系统无法正常运行的问题。导致目标系统无法正常运行的问题。

【技术实现步骤摘要】
一种具备故障检测的运维监控装置及工作方法


[0001]本专利技术涉及运维监控
,具体为一种具备故障检测的运维监控装置及工作方法。

技术介绍

[0002]随着社会的不断发展,越来越多的设备产品开始智能化,运维监控是一系列IT管理产品的统称,能够正确和及时地了解系统的运行状态,发现影响整体系统运行的瓶颈,帮助系统人员进行必要的系统优化和配置变更,甚至为系统的升级和扩容提供依据,可极大地简化IT设施和业务系统的监控管理;
[0003]现有技术中,“一种运维监控装置及运维监控方法”(CN106709578B)提出的装置包括:任务存储单元、方法存储单元、结果存储单元、配置单元及处理单元;其中,任务存储单元存储所有的运维任务、执行每个运维任务所需的参数、以及执行每个运维任务所需的运维方法信息;方法存储单元存储所有的运维方法;结果存储单元存储执行运维任务的运维结果;配置单元配置并存储所有数据的配置信息;配置信息根据运维监控装置所在平台而配置;处理单元运行跨平台的Python语言编写的处理程序,并分别与任务存储单元、方法存储单元、结果存储单元及配置单元连接,用于读取并执行任务存储单元中存储的运维任务。现有技术虽然方便实现运维数据的集中管理,但仅能执行所获取的运维任务,不具备故障检测警示能力,而在运维监控过程中,监控目标系统常常会存在故障,导致目标系统无法正常运行,而在发现故障后,技术人员需要对目标系统故障进行整体检测,浪费大量时间,不利于目标系统的快速正常运行;因此急需一种具有故障检测功能的运维监控装置及其工作方法来帮助人们解决现有的问题。

技术实现思路

[0004]为解决现有技术中存在的不足,本专利技术提供一种一种具备故障检测的运维监控装置及工作方法,以解决上述
技术介绍
中提出的在运维监控过程中,监控目标系统常常会存在故障,导致目标系统无法正常运行的问题。
[0005]本专利技术采用如下的技术方案。
[0006]本专利技术一方面提出了一种具备故障检测的运维监控装置,包括:数据采集模块,故障检测模块,故障处理模块,输出显示模块,警示模块和储存模块;其中,数据采集模块的输出端与故障检测模块的输入端连接,故障检测模块的输出端与故障处理模块的输入端连接,故障处理模块的输出端与输出显示模块的输入端连接,警示模块的输入端分别与故障检测模块和故障处理模块的输出端连接,储存模块分别与故障检测模块和故障处理模块双向连接。
[0007]装置还包括:自管理模块;自管理模块的输出端与故障检测模块的输入端连接,自管理模块的输出端与故障处理模块的输入端连接,储存模块与自管理模块双向连接;自管理模块,用于从储存模块中提取故障检测标准数据对故障检测模块执行的故障检测流程进
行监控,还用于从储存模块中提取故障处理标准数据对故障处理模块执行的故障处理流程进行监控;
[0008]自管理模块包括:导入单元、分析监控单元和导出单元,导入单元的输出端与分析监控单元的输入端连接,分析监控单元的输出端与导出单元的输入端连接,进而在运维监控系统工作过程中,对储存的数据理流程步骤信息进行监控,查看数据处理流程步骤是否出错,对运维流程进行自监控。
[0009]数据采集模块,用于对监控目标的以纬度作为标识的数值型指示数据、字符型的日志数据和用于跟踪链路一个数据流过过程的跟踪数据进行采集;
[0010]数据采集模块将采集的数据输送至故障检测模块中。
[0011]数据采集模块实现的采集方式包括:插件采集、脚本采集、日志采集、进程采集、协议采集和API接口。
[0012]故障检测模块,用于对数据进行检测,判断是否存在故障;
[0013]故障检测模块包括数据清洗模块、数据分级模块和数据分析模块;其中,所述数据清洗模块的输出端与数据分级模块的输入端连接,数据清洗模块的输出端与数据分析模块的输入端连接。
[0014]数据清洗模块,用于对数据进行清洗;清洗包括:从来源端经过抽取、转换、加载至目的端,清理掉不符合要求的数据,提取出有用的数据。
[0015]数据分析模块,包括:计算单元,丰富单元,指标派生单元和算法单元;其中,计算单元对数据进行运算,丰富单元给数据打上tags标签,指标派生单元通过聚合计算对带tags标签的数据得出指标,算法单元采用算法对数据进行运输。
[0016]警示模块的内部设置有推送模块,推送模块的输出端分别与固定终端和移动终端的输入端连接;其中,固定终端为运维监控终端,移动终端为管理人员随身携带的手机或平板终端。
[0017]推送模块,用于在检测到故障时向固定终端和移动终端推送故障信息,其中推送方式包括:微信,短信,邮件。
[0018]输出显示模块的输出端分别与固定终端和移动终端的输入端连接;输出显示模块,用于向固定终端和移动终端传输视图文件,视图文件包括故障数据及位置原因。
[0019]储存模块包括信息库和数据库;信息库用于储存运维采集数据及在数据检测过程中需要联网下载的数据信息,数据库用于储存故障信息;信息库的输出端与数据库的输入端连接;
[0020]信息库的输入端分别与联网模块和清理模块的输出端连接;清理模块用于根据设置定期对信息库内数据进行清理,联网模块用于对网络大数据中存在的数据故障特征进行提取,实现对比检测故障及后续故障的修复指导;
[0021]数据库的输入端分别与上传模块和归纳模块的输出端连接;上传模块用于根据设置把处理故障的结果上传至数据库内,归纳模块用于对数据库内的故障信息进行整理归纳分为不同类型。
[0022]本专利技术另一方面还提出了一种具备故障检测的运维监控装置的工作方法,适用于具备故障检测的运维监控装置。
[0023]工作方法包括:
[0024]步骤1,在进行运维监控时,对监控目标的指示数据、日志数据和跟踪数据进行采集;
[0025]步骤2,对采集的数据进行检测,先通过数据清洗,提取出有用数据;
[0026]步骤3,对数据进行归类分级,将数据包含的运行参数、视频图像及调度指令进行分类,并根据产生的危害程度将数据从低到高划分为不同层次等级;数据的层次等级包括:普通数据、一般数据、重要数据和核心数据;
[0027]步骤4,对采集的数据进行处理及算法运算,通过从最底层的分级数据开始进行故障监测,并对数据中的运行参数、视频图像和调度指令进行结合及相互补充,判断是否存在异常,对故障进行故障定位和故障修复指导;
[0028]步骤5,若数据存在故障,自动从数据库内提取往期故障类型信息,进行故障对比匹配,检测出故障位置及类型;其中,故障类型包括:可自行修复故障,不可自动修复故障;
[0029]步骤6,若为可自行修复故障,通过提取数据库内往期处理方式内容进行自动修复;
[0030]步骤7,若为不可自动修复故障,将故障相关内容及视图文件传输至运维人员和管理人员,由运维人员和管理人员进行故障的及时解决。
[0031]一种终端,包括处理器及存储介质;存储介质用于存储指令;处理器用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种具备故障检测的运维监控装置,包括:数据采集模块,故障检测模块,故障处理模块,输出显示模块,警示模块和储存模块;其中,数据采集模块的输出端与故障检测模块的输入端连接,故障检测模块的输出端与故障处理模块的输入端连接,故障处理模块的输出端与输出显示模块的输入端连接,警示模块的输入端分别与故障检测模块和故障处理模块的输出端连接,储存模块分别与故障检测模块和故障处理模块双向连接;其特征在于,所述装置还包括:自管理模块;自管理模块的输出端与故障检测模块的输入端连接,自管理模块的输出端与故障处理模块的输入端连接,储存模块与自管理模块双向连接;自管理模块,用于从储存模块中提取故障检测标准数据对故障检测模块执行的故障检测流程进行监控,还用于从储存模块中提取故障处理标准数据对故障处理模块执行的故障处理流程进行监控;自管理模块包括:导入单元、分析监控单元和导出单元,导入单元的输出端与分析监控单元的输入端连接,分析监控单元的输出端与导出单元的输入端连接,进而在运维监控系统工作过程中,对储存的数据理流程步骤信息进行监控,查看数据处理流程步骤是否出错,对运维流程进行自监控。2.根据权利要求1所述的具备故障检测的运维监控装置,其特征在于,数据采集模块,用于对监控目标的以纬度作为标识的数值型指示数据、字符型的日志数据和用于跟踪链路一个数据流过过程的跟踪数据进行采集;数据采集模块将采集的数据输送至故障检测模块中。3.根据权利要求2所述的具备故障检测的运维监控装置,其特征在于,数据采集模块实现的采集方式包括:插件采集、脚本采集、日志采集、进程采集、协议采集和API接口。4.根据权利要求2所述的具备故障检测的运维监控装置,其特征在于,故障检测模块,用于对数据进行检测,判断是否存在故障;故障检测模块包括数据清洗模块、数据分级模块和数据分析模块;其中,所述数据清洗模块的输出端与数据分级模块的输入端连接,数据清洗模块的输出端与数据分析模块的输入端连接。5.根据权利要求4所述的具备故障检测的运维监控装置,其特征在于,数据清洗模块,用于对数据进行清洗;清洗包括:从来源端经过抽取、转换、加载至目的端,清理掉不符合要求的数据,提取出有用的数据。6.根据权利要求4所述的具备故障检测的运维监控装置,其特征在于,数据分析模块,包括:计算单元,丰富单元,指标派生单元和算法单元;其中,计算单元对数据进行运算,丰富单元给数据打上tags标签,指标派生单元通过聚合计算对带tags标签的数据得出指标,算法单元采用算法对数据进行运输。7.根据权利要求4所述的具备故障检测的运维监控装置,其特征在于,警示模块的内部设置有推送模块,推送模块的输出端分别与固定终端和移动终端的输入端连接;其中,固定终端为运维监控终端...

【专利技术属性】
技术研发人员:赵磊邹云峰徐超马玉龙戴露露
申请(专利权)人:国网江苏省电力有限公司营销服务中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1