高性能平台监控运维系统及方法技术方案

技术编号:34941290 阅读:17 留言:0更新日期:2022-09-17 12:14
本发明专利技术公开了高性能平台监控运维系统,包括自动巡视模块、报警模块、服务器运维模块、监控故障管理维护模块和数据处理模块;所述自动巡视模块用于自动检测服务器故障和监控结果故障;所述报警模块用于在所述自动巡视模块检测到故障时,进行提醒工作,及时进行运维工作;所述服务器运维模块用于通过平台建立多个应急通道对服务器故障进行处理;所述监控故障管理维护模块用于获取系统的监控指标数据,并对监控指标数据进行实时处理,对实时监控的结果进行故障管理和维护。本发明专利技术通过设置自动巡视模块能够自动检测服务器故障和监控结果故障,实现了自动地检测出故障,并通过设置的报警模块启动运维工作,从而提高了运维效率。从而提高了运维效率。从而提高了运维效率。

【技术实现步骤摘要】
高性能平台监控运维系统及方法


[0001]本专利技术属于监控运维
,具体涉及高性能平台监控运维系统及方 法。

技术介绍

[0002]各行各业对IT信息系统的应用广泛性和规模性越来越大,为了有效管理 这些IT系统,都会根据自己的实际情况建立系统运维管理平台,以便系统在 出现异常时,帮助运维管理人员快速、准确的定位系统存在的故障。
[0003]现有的高性能平台监控运维系统及方法还存在一些问题:不方便自动对 故障进行巡检,降低了运维效率;不方便对服务器故障和实时监控的结果的 故障进行分别管理和维护,为此我们提出高性能平台监控运维系统及方法。

技术实现思路

[0004]本专利技术的目的在于提供高性能平台监控运维系统及方法,以解决上述背 景技术中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:高性能平台监控运维系统, 包括自动巡视模块、报警模块、服务器运维模块、监控故障管理维护模块和 数据处理模块;
[0006]所述自动巡视模块用于自动检测服务器故障和监控结果故障;
[0007]所述报警模块用于在所述自动巡视模块检测到故障时,进行提醒工作, 及时进行运维工作;
[0008]所述服务器运维模块用于通过平台建立多个应急通道对服务器故障进行 处理;
[0009]所述监控故障管理维护模块用于获取系统的监控指标数据,并对监控指 标数据进行实时处理,对实时监控的结果进行故障管理和维护;
[0010]以及所述数据处理模块用于平台内的设备进行数据处理,实现创建一体 化的运维和监控。
[0011]优选的,所述自动巡视模块采用通信协议完成网络探测,通过对视频流 进行采集、分解、分析,完成自动巡视和故障原因上报。
[0012]优选的,所述服务器运维模块包括平台构建单元、应急通道构建单元、 故障分类单元和故障处理单元,所述平台构建单元用于基于云系统架构建设 平台;所述应急通道构建单元用于在建设的平台上预定义用于处理服务器故 障的多种应急通道;所述故障分类单元用于通过平台采集云系统的运行数据, 并从采集的运行数据获得服务器故障信息,再进行服务器故障信息的故障类 型评估;所述故障处理单元用于调动平台,针对不同类型的服务器故障,选 择预定义的应用通道来处理服务器故障。
[0013]优选的,所述监控故障管理维护模块包括监控数据采集单元、实时处理 单元、异常监控单元和故障管理单元;所述监控数据采集单元用于获取平台 的监控指标数据;所述监控指标数据为影响平台稳定运行的面向用户或业务 视角的指标数据;所述实时处理单元用于对获取的所述监控指标数据进行实 时处理,生成针对各监控指标随时间实时变动
的动态趋势线;所述异常监控 单元用于对所述动态趋势线进行实时监控,根据动态趋势线与参考区间的关 系,确定平台处于正常状态或面向用户或业务视角系统异常状态;所述故障 管理单元用于根据对动态趋势线进行实时监控的结果进行系统故障管理和维 护。
[0014]优选的,所述数据处理模块包括接入单元、数据单元、服务单元和应用 单元;所述接入单元用于接入系统中不同的物联网设备;所述数据单元用于 接收接入的物联网设备的设备数据,并按照数据系统的需求,对设备数据进 行处理;所述服务单元根据所述数据单元提供的数据,向所述应用单元中各 个对象提供服务,每个对象对应一数据系统。
[0015]本专利技术还提供了高性能平台监控运维方法,包括以下步骤:
[0016]S1.通过自动巡视模块自动检测服务器故障和监控结果故障;
[0017]S2.通过报警模块在所述自动巡视模块检测到故障时,进行提醒工作,及 时进行运维工作;
[0018]S3.通过服务器运维模块建立多个应急通道对服务器故障进行处理;
[0019]S4.通过监控故障管理维护模块获取系统的监控指标数据,并对监控指标 数据进行实时处理,对实时监控的结果进行故障管理和维护;
[0020]S5.通过数据处理模块对平台内的设备进行数据处理,实现创建一体化的 运维和监控。
[0021]优选的,所述S3中的具体方法包括以下步骤:
[0022]S301.基于云系统架构建设平台;
[0023]S302.在建设的平台上预定义用于处理服务器故障的多种应急通道;
[0024]S303.通过平台采集云系统的运行数据,并从采集的运行数据获得服务器 故障信息,再进行服务器故障信息的故障类型评估;
[0025]S304.调动平台,针对不同类型的服务器故障,选择预定义的应用通道来 处理服务器故障。
[0026]优选的,所述S4的具体方法包括以下步骤:
[0027]S401.获取平台的监控指标数据;
[0028]S402.对获取的所述监控指标数据进行实时处理,生成针对各监控指标随 时间实时变动的动态趋势线;
[0029]S403.对所述动态趋势线进行实时监控,根据动态趋势线与参考区间的关 系,确定平台处于正常状态或面向用户或业务视角系统异常状态;
[0030]S404.根据对动态趋势线进行实时监控的结果进行系统故障管理和维护。
[0031]优选的,所述S5的具体方法包括以下步骤:
[0032]S501.接入系统中不同的物联网设备;
[0033]S502.接收接入的物联网设备的设备数据,并按照数据系统的需求,对设 备数据进行处理;
[0034]S503.根据提供的数据,向各个对象提供服务,使每个对象对应一数据系 统。
[0035]优选的,所述数据处理模块采用二阶滤波器算法进行,当前的滤波输出 时刻,设置为n,压力滤波数据输出为y(n)由下列公式递推得到:
[0036]y(n)=b(0)x(n)+b(1)x(n

1)+b(2)x(n

2)+...+b(m)x(n

m)

a(1)y(n

1)
‑ꢀ
a(2)y(n

2)

a(m)y(n

m);
[0037]其中,a序列和b序列表示一组系列,m为整数,表示需要调用的相关的 数据池长度;
[0038]对进入数据池的数据进行分析,需要如下两个序列:
[0039]dy(n)=y(n)

y(n

1);
[0040]dx(n)=x(n)

x(n

1);
[0041]其中,x序列为补偿值x序列,表示进行压力补偿之后的第二补偿压力值;
[0042]y序列为滤波值y序列,表示进行滤波补偿之后的第二补偿压力值。
[0043]与现有技术相比,本专利技术的有益效果是:
[0044](1)本专利技术通过设置自动巡视模块能够自动检测服务器故障和监控结果 故障,实现了自动地检测出故障,并通过设置的报警模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.高性能平台监控运维系统,其特征在于:包括自动巡视模块、报警模块、服务器运维模块、监控故障管理维护模块和数据处理模块;所述自动巡视模块用于自动检测服务器故障和监控结果故障;所述报警模块用于在所述自动巡视模块检测到故障时,进行提醒工作,及时进行运维工作;所述服务器运维模块用于通过平台建立多个应急通道对服务器故障进行处理;所述监控故障管理维护模块用于获取系统的监控指标数据,并对监控指标数据进行实时处理,对实时监控的结果进行故障管理和维护;以及所述数据处理模块用于平台内的设备进行数据处理,实现创建一体化的运维和监控。2.根据权利要求1所述的高性能平台监控运维系统,其特征在于:所述自动巡视模块采用通信协议完成网络探测,通过对视频流进行采集、分解、分析,完成自动巡视和故障原因上报。3.根据权利要求1所述的高性能平台监控运维系统,其特征在于:所述服务器运维模块包括平台构建单元、应急通道构建单元、故障分类单元和故障处理单元,所述平台构建单元用于基于云系统架构建设平台;所述应急通道构建单元用于在建设的平台上预定义用于处理服务器故障的多种应急通道;所述故障分类单元用于通过平台采集云系统的运行数据,并从采集的运行数据获得服务器故障信息,再进行服务器故障信息的故障类型评估;所述故障处理单元用于调动平台,针对不同类型的服务器故障,选择预定义的应用通道来处理服务器故障。4.根据权利要求1所述的高性能平台监控运维系统,其特征在于:所述监控故障管理维护模块包括监控数据采集单元、实时处理单元、异常监控单元和故障管理单元;所述监控数据采集单元用于获取平台的监控指标数据;所述监控指标数据为影响平台稳定运行的面向用户或业务视角的指标数据;所述实时处理单元用于对获取的所述监控指标数据进行实时处理,生成针对各监控指标随时间实时变动的动态趋势线;所述异常监控单元用于对所述动态趋势线进行实时监控,根据动态趋势线与参考区间的关系,确定平台处于正常状态或面向用户或业务视角系统异常状态;所述故障管理单元用于根据对动态趋势线进行实时监控的结果进行系统故障管理和维护。5.根据权利要求1所述的高性能平台监控运维系统,其特征在于:所述数据处理模块包括接入单元、数据单元、服务单元和应用单元;所述接入单元用于接入系统中不同的物联网设备;所述数据单元用于接收接入的物联网设备的设备数据,并按照数据系统的需求,对设备数据进行处理;所述服务单元根据所述数据单元提供的数据,向所述应用单元中各个对象提供服务,每个对象对应一数据系统。6.高性能平台监控运维方法,其特征在于:包括以下步骤:S1.通过自动巡视模块自动检测服务器故障和监控结果故障;S2.通过报警模块在所述自动巡视模块检测到故障时,进行提醒工作,及时进行运维工作;S3.通过服务器运维模块建立多个应急通道对服务器故障进行处理...

【专利技术属性】
技术研发人员:周会群王玲
申请(专利权)人:南京信易达计算技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1