挖掘运维故障节点的方法、装置、电子设备和介质制造方法及图纸

技术编号:33289735 阅读:15 留言:0更新日期:2022-05-01 00:06
本公开提供了一种挖掘运维故障节点的方法、装置、电子设备、介质和计算机程序产品。挖掘运维故障节点的方法和装置可用于人工智能和计算机运维技术领域。挖掘运维故障节点的方法,包括:确定运维节点,其中,所述运维节点包括第一物理机、虚拟机、应用容器、第二物理机和数据库容器中的至少一个;获取所述运维节点的性能指标;对所述运维节点的性能指标进行异常检测;当所述性能指标异常时,输出异常检测结果;利用检测模型对所述异常检测结果进行验证,得到验证结果;以及当所述验证结果为所述异常检测结果通过所述检测模型的验证时,将所述异常检测结果对应的运维节点确定为运维故障节点。障节点。障节点。

【技术实现步骤摘要】
挖掘运维故障节点的方法、装置、电子设备和介质


[0001]本公开涉及人工智能和计算机运维
,更具体地,涉及一种挖掘运维故障节点的方法、装置、电子设备、介质和计算机程序产品。

技术介绍

[0002]金融科技的发展能够为银行的业务创新与变革提供关键支撑,甚至起到驱动引领的作用,目前为应对错综复杂的国际形势,顺应时代需要,提出了IT架构转型的策略,也即将大量应用从大型主机下放到开放系统设备,开放系统设备用以承载新一代银行核心系统。随着IT架构转型以及业务推广的不断深化,机房部署的云计算容器、分布式数据库电越来越多,这给开放平台的运维带来了极大的挑战。

技术实现思路

[0003]有鉴于此,本公开提供了一种时效性高、运维智能化水平高、问题影响小和风险程度低的挖掘运维故障节点的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0004]本公开的一个方面提供了一种挖掘运维故障节点的方法,包括:确定运维节点,其中,所述运维节点包括第一物理机、虚拟机、应用容器、第二物理机和数据库容器中的至少一个;获取所述运维节点的性能指标;对所述运维节点的性能指标进行异常检测;当所述性能指标异常时,输出异常检测结果;利用检测模型对所述异常检测结果进行验证,得到验证结果;以及当所述验证结果为所述异常检测结果通过所述检测模型的验证时,将所述异常检测结果对应的运维节点确定为运维故障节点。
[0005]根据本公开实施例的挖掘运维故障节点的方法,通过将第一物理机、虚拟机、应用容器、第二物理机和数据库容器中的至少一个作为运维节点,使得本公开可以整合多个渠道采集的信息,具备历史规律挖掘和和自我更新优化的潜力,也为其他应用、平台的故障诊断和应急提供了思路和启发,更为后续进一步实现简单故障自动应急奠定了基础;另外,本方法可以便于实现从监控到分析,到自动诊断和辅助决策的一体化解决方案,可以解决平台运维实际中的难点。本公开可以提升故障应急的时效性,提升运维智能化水平,降低问题影响和风险程度。
[0006]在一些实施例中,所述对所述运维节点的性能指标进行异常检测包括:动态基线模型根据判定规则对所述运维节点的性能指标进行异常检测;所述方法还包括:当所述验证结果为所述异常检测结果未通过所述检测模型的验证时,所述动态基线模型优化所述判定规则。
[0007]在一些实施例中,所述利用检测模型对所述异常检测结果进行验证,得到验证结果包括:基于所述运维节点的性能指标设定标准值;以及将所述异常检测结果与所述标准值比较,得到验证结果。
[0008]在一些实施例中,所述获取所述运维节点的性能指标包括:获取所述运维节点的t
时间段内的性能指标,t时间段内的所述性能指标形成性能趋势;对所述运维节点的性能指标进行异常检测,得到异常检测结果包括:对所述运维节点的所述性能趋势进行异常检测,得到异常检测结果;以及所述基于所述运维节点的性能指标设定标准值包括:基于所述运维节点的性能趋势设定标准值。
[0009]在一些实施例中,所述获取所述运维节点的性能指标包括:根据所述运维节点的不同类型,获取与该类型的运维节点对应的性能指标。
[0010]在一些实施例中,所述虚拟机、所述第一物理机和所述第二物理机的性能指标均包括中央处理器的速度、内存空间、磁盘读写速度和传输控制协议的流量。
[0011]在一些实施例中,所述应用容器的性能指标包括交易率、第一响应时间和成功率。
[0012]在一些实施例中,所述数据库容器的性能指标包括并发率、第二响应时间和数据库读写速度。
[0013]在一些实施例中,所述的方法还包括:当所述验证结果为所述异常检测结果通过所述检测模型的验证时,发送所述异常检测结果和与所述异常检测结果对应的运维故障节点。
[0014]在一些实施例中,所述的方法还包括:将多个所述性能指标、与每个所述性能指标对应的所述验证结果和与每个所述性能指标对应的所述运维节点以视图和/或报表的方式展示。
[0015]在一些实施例中,所述将多个所述性能指标、与每个所述性能指标对应的所述验证结果和与每个所述性能指标对应的所述运维节点以视图和/或报表的方式展示包括:展示多个所述性能指标的第一图标;根据所述验证结果渲染与所述验证结果对应的所述性能指标的第一图标;响应于对所述第一图标的点击请求,展示与该第一图标对应的所述运维节点。
[0016]在一些实施例中,所述展示多个所述性能指标的第一图标包括:给多个所述性能指标分类,同一类的所述性能指标用一个所述第一图标展示;以及所述响应于对所述第一图标的点击请求,展示与该第一图标对应的所述运维节点包括:响应于对同一类所述第一图标的点击请求,以第二图标或者报表的形式展示与该第一图标对应的g个所述运维节点,其中g为大于等于1的整数。
[0017]本公开的另一个方面提供了一种挖掘运维故障节点的装置,包括:确定模块,所述确定模块用于执行确定运维节点,其中,所述运维节点包括第一物理机、虚拟机、应用容器、第二物理机和数据库容器中的至少一个;获取模块,所述获取模块用于执行获取所述运维节点的性能指标;检测模块,所述检测模块用于执行对所述运维节点的性能指标进行异常检测;输出模块,所述输出模块用于执行当所述性能指标异常时,输出异常检测结果;验证模块,所述验证模块用于执行利用检测模型对所述异常检测结果进行验证,得到验证结果;以及故障确定模块,所述故障确定模块用于执行当所述验证结果为所述异常检测结果通过所述检测模型的验证时,将所述异常检测结果对应的运维节点确定为运维故障节点。
[0018]本公开的另一方面提供了一种电子设备,包括一个或多个处理器以及一个或多个存储器,其中,所述存储器用于存储可执行指令,所述可执行指令在被所述处理器执行时,实现如上所述方法。
[0019]本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,
所述指令在被执行时用于实现如上所述的方法。
[0020]本公开的另一方面提供了一种计算机程序产品,包括计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
附图说明
[0021]通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
[0022]图1示意性示出了根据本公开实施例的可以应用方法、装置的示例性系统架构;
[0023]图2示意性示出了根据本公开实施例的挖掘运维故障节点的方法的流程图;
[0024]图3示意性示出了根据本公开实施例的获取运维节点的性能指标的流程图;
[0025]图4示意性示出了根据本公开实施例的对运维节点的性能指标进行异常检测的流程图;
[0026]图5示意性示出了根据本公开实施例的挖掘运维故障节点的方法的流程图;
[0027]图6示意性示出了根据本公开实施例的利用检测模型对异常检测结果进行验证,得到验证结果的流程图;
[0028]图7示意性示出了根据本公开实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种挖掘运维故障节点的方法,其特征在于,包括:确定运维节点,其中,所述运维节点包括第一物理机、虚拟机、应用容器、第二物理机和数据库容器中的至少一个;获取所述运维节点的性能指标;对所述运维节点的性能指标进行异常检测;当所述性能指标异常时,输出异常检测结果;利用检测模型对所述异常检测结果进行验证,得到验证结果;以及当所述验证结果为所述异常检测结果通过所述检测模型的验证时,将所述异常检测结果对应的运维节点确定为运维故障节点。2.根据权利要求1所述的方法,其特征在于,所述对所述运维节点的性能指标进行异常检测包括:动态基线模型根据判定规则对所述运维节点的性能指标进行异常检测;所述方法还包括:当所述验证结果为所述异常检测结果未通过所述检测模型的验证时,所述动态基线模型优化所述判定规则。3.根据权利要求1所述的方法,其特征在于,所述利用检测模型对所述异常检测结果进行验证,得到验证结果包括:基于所述运维节点的性能指标设定标准值;以及将所述异常检测结果与所述标准值比较,得到验证结果。4.根据权利要求3所述的方法,其特征在于,所述获取所述运维节点的性能指标包括:获取所述运维节点的t时间段内的性能指标,t时间段内的所述性能指标形成性能趋势;对所述运维节点的性能指标进行异常检测,得到异常检测结果包括:对所述运维节点的所述性能趋势进行异常检测,得到异常检测结果;以及所述基于所述运维节点的性能指标设定标准值包括:基于所述运维节点的性能趋势设定标准值。5.根据权利要求1所述的方法,其特征在于,所述获取所述运维节点的性能指标包括:根据所述运维节点的不同类型,获取与该类型的运维节点对应的性能指标。6.根据权利要求1所述的方法,其特征在于,所述虚拟机、所述第一物理机和所述第二物理机的性能指标均包括中央处理器的速度、内存空间、磁盘读写速度和传输控制协议的流量。7.根据权利要求1所述的方法,其特征在于,所述应用容器的性能指标包括交易率、第一响应时间和成功率。8.根据权利要求1所述的方法,其特征在于,所述数据库容器的性能指标包括并发率、第二响应时间和数据库读写速度。9.根据权利要求1所述的方法,其特征在于,还包括:当所述验证结果为所述异常检测结果通过所述检测模型的验证时,发送所述异常检测结果和与所述异常检测结果对应的运维故障节点。10.根据权利要求1

9中任...

【专利技术属性】
技术研发人员:尤明超赵雁杨镇宇潘佳文
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1