一种数据分析方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36904975 阅读:7 留言:0更新日期:2023-03-18 09:24
本公开关于一种数据分析方法、装置、电子设备及存储介质,包括:获取云平台的部署架构图,并根据部署架构图,确定云平台中各个节点的业务承载关系;获取所述云平台中每个业务的调用链,并根据所述调用链,确定所述业务的调用流程;分别对云平台中各个节点进行监控,采集告警数据;基于业务承载关系及调用流程,对告警数据进行分析,确定云平台的故障节点。这样,当采集到告警数据之后,可以根据业务承载关系进行纵向的架构分析,同时根据调用流程进行横向的业务分析,使得对告警数据的分析范围由原本的独立节点及独立业务扩展至云平台的各个层级及节点,实现对告警数据的多维度分析以及对云平台的故障定位。以及对云平台的故障定位。以及对云平台的故障定位。

【技术实现步骤摘要】
一种数据分析方法、装置、电子设备及存储介质


[0001]本公开涉及数据处理
,尤其涉及一种数据分析方法、装置、电子设备及存储介质。

技术介绍

[0002]在云计算技术快速发展的当下,大量的业务系统由传统IT(Internet Technology,互联网技术)系统架构转向了SOA(Service Oriented Architecture,面向服务架构)及微服务架构,进一步地,将SOA及微服务架构与云计算的容器服务管理思路结合,产生了基于云计算的云平台架构,以适应当下快速迭代、高可用业务保障的业务要求。
[0003]在运行过程中,通常需要对云平台进行监控,当出现异常或故障时,生成相应的告警数据,运维人员通过对告警数据的分析,可以确定云平台中出现的异常或故障,并进行修复。
[0004]但是,目前对云平台的告警监控多依赖于云平台架构本身的高可用性,更多地关注云平台IaaS(Infrastructure as a Service,基础设施即服务)层的基础设施及内部服务状态,未能实现IaaS、PaaS(Platform as a Service,平台即服务)、Saas(Software as a Service,软件即服务)等不同层级的有效结合,而且,由于对不同的服务可能采用了各自独立的不同的监控模式,告警数据的对接关联难度高,因此,难以实现对告警数据的多维度分析,导致对云平台的故障定位较为困难。

技术实现思路

[0005]本公开提供一种数据分析系统、方法、装置、电子设备及存储介质,以至少解决相关技术中难以实现对告警数据的多维度分析,导致对云平台的故障定位较为困难的问题。本公开的技术方案如下:
[0006]根据本公开实施例的第一方面,提供一种数据分析方法,包括:
[0007]获取云平台的部署架构图,并根据所述部署架构图,确定所述云平台中各个节点的业务承载关系;
[0008]获取所述云平台中每个业务的调用链,并根据所述调用链,确定所述业务的调用流程;所述调用流程用于指示所述业务依次经过的各个节点;
[0009]分别对所述云平台中各个节点进行监控,采集告警数据;
[0010]基于所述业务承载关系及所述调用流程,对所述告警数据进行分析,确定所述云平台的故障节点。
[0011]可选地,所述基于所述业务承载关系及所述调用流程,对所述告警数据进行分析,确定所述云平台的故障节点,包括:
[0012]确定所述告警数据对应的目标节点;
[0013]基于所述业务承载关系,确定承载所述目标节点的节点,作为第一候选节点;
[0014]确定与所述目标节点在同一调用流程中的节点,作为第二候选节点;
[0015]对所述第一候选节点及所述第二候选节点进行故障查询,并根据故障查询结果确定所述云平台的故障节点。
[0016]可选地,在所述对所述第一候选节点及所述第二候选节点进行故障查询,并根据故障查询结果确定所述云平台的故障节点之后,还包括:
[0017]确定经过所述故障节点的业务,作为预警业务;
[0018]对所述预警业务进行预警处理。
[0019]可选地,所述节点包括基础设施节点;所述分别对所述云平台中各个节点进行监控,采集告警数据,包括:
[0020]基于预设协议,分别采集各个基础设施节点的告警消息;
[0021]对所述告警消息进行标准化处理,得到告警数据。
[0022]可选地,所述节点包括中间件节点;所述分别对所述云平台中各个节点进行监控,采集告警数据,包括:
[0023]获取所述中间件节点的告警日志信息,作为告警数据;和/或,
[0024]获取所述中间件节点的预设类别的日志信息,对所述预设类别的日志信息进行信息提取,得到告警数据;和/或,
[0025]对所述中间件节点进行可用性探测,得到所述中间件节点的可用性信息,作为告警数据。
[0026]可选地,所述节点包括容器节点;所述分别对所述云平台中各个节点进行监控,采集告警数据,包括:
[0027]调用容器集群管理工具,对所述容器节点进行监控,采集告警数据。
[0028]可选地,所述节点包括系统业务节点;所述分别对所述云平台中各个节点进行监控,采集告警数据,包括:
[0029]调用预设插件,对所述系统业务节点的预设业务指标进行监控,采集告警数据。
[0030]可选地,所述节点包括服务进程节点;所述分别对所述云平台中各个节点进行监控,采集告警数据,包括:
[0031]通过预设埋点和/或心跳监控进程,采集所述服务进程节点的告警数据。
[0032]根据本公开实施例的第二方面,提供一种数据分析装置,包括:
[0033]第一获取模块,用于获取云平台的部署架构图,并根据所述部署架构图,确定所述云平台中各个节点的业务承载关系;
[0034]第二获取模块,用于获取所述云平台中每个业务的调用链,并根据所述调用链,确定所述业务的调用流程;所述调用流程用于指示所述业务依次经过的各个节点;
[0035]采集模块,用于分别对所述云平台中各个节点进行监控,采集告警数据;
[0036]分析模块,用于基于所述业务承载关系及所述调用流程,对所述告警数据进行分析,确定所述云平台的故障节点。
[0037]可选地,所述分析模块,用于:
[0038]确定所述告警数据对应的目标节点;
[0039]基于所述业务承载关系,确定承载所述目标节点的节点,作为第一候选节点;
[0040]确定与所述目标节点在同一调用流程中的节点,作为第二候选节点;
[0041]对所述第一候选节点及所述第二候选节点进行故障查询,并根据故障查询结果确
定所述云平台的故障节点。
[0042]可选地,所述分析模块,还用于:
[0043]确定经过所述故障节点的业务,作为预警业务;
[0044]对所述预警业务进行预警处理。
[0045]可选地,所述节点包括基础设施节点;所述采集模块,用于:
[0046]基于预设协议,分别采集各个基础设施节点的告警消息;
[0047]对所述告警消息进行标准化处理,得到告警数据。
[0048]可选地,所述节点包括中间件节点;所述采集模块,用于:
[0049]获取所述中间件节点的告警日志信息,作为告警数据;和/或,
[0050]获取所述中间件节点的预设类别的日志信息,对所述预设类别的日志信息进行信息提取,得到告警数据;和/或,
[0051]对所述中间件节点进行可用性探测,得到所述中间件节点的可用性信息,作为告警数据。
[0052]可选地,所述节点包括容器节点;所述采集模块,用于:
[0053]调用容器集群管理工具,对所述容器节点进行监控,采集告警数据。
[0054]可选地,所述节点包括系统业务节点;所述采集模块,用于:
[0055]调用预设插件,对所述系本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据分析方法,其特征在于,包括:获取云平台的部署架构图,并根据所述部署架构图,确定所述云平台中各个节点的业务承载关系;获取所述云平台中每个业务的调用链,并根据所述调用链,确定所述业务的调用流程;所述调用流程用于指示所述业务依次经过的各个节点;分别对所述云平台中各个节点进行监控,采集告警数据;基于所述业务承载关系及所述调用流程,对所述告警数据进行分析,确定所述云平台的故障节点。2.根据权利要求1所述的数据分析方法,其特征在于,所述基于所述业务承载关系及所述调用流程,对所述告警数据进行分析,确定所述云平台的故障节点,包括:确定所述告警数据对应的目标节点;基于所述业务承载关系,确定承载所述目标节点的节点,作为第一候选节点;确定与所述目标节点在同一调用流程中的节点,作为第二候选节点;对所述第一候选节点及所述第二候选节点进行故障查询,并根据故障查询结果确定所述云平台的故障节点。3.根据权利要求2所述的数据分析方法,其特征在于,在所述对所述第一候选节点及所述第二候选节点进行故障查询,并根据故障查询结果确定所述云平台的故障节点之后,还包括:确定经过所述故障节点的业务,作为预警业务;对所述预警业务进行预警处理。4.根据权利要求1~3任一项所述的数据分析方法,其特征在于,所述节点包括基础设施节点;所述分别对所述云平台中各个节点进行监控,采集告警数据,包括:基于预设协议,分别采集各个基础设施节点的告警消息;对所述告警消息进行标准化处理,得到告警数据。5.根据权利要求1~3任一项所述的数据分析方法,其特征在于,所述节点包括中间件节点;所述分别对所述云平台中各个节点进行监控,采集告警数据,包括:获取所述中间件节点的告警日志信息,作为告警数据;和/或,获取所述中间件节点的预设类别的日志信息,对所述预设类别的日志信息进行信息提取,得到告警数据;和/或,对所述中间件节点进行可用性探测,得到所述中间件节点的可用性信息,作为告警数据。6.根据权利要求1~3任一项所述的数据分析方法,其特征在于,所述节点包括容器节点;所述分别对所述云平台中各个节点进行监控,采集告警数据,包括:调用容器集群管理工具,对所述容器节点进行监控,采集告警数据。7.根据权利要求1~3任一项所述的数据分析方法,其特征在于,所述节点包括系统业务节点;所述分别对所述云平台中各个节点进行监控,采集告警数据,包括:调用预设插件,对所述系统业务节点的预设业务指标进行监控,采集告警数据。8.根据权利要求1~3任一项所述的数据分析方法,其特征在于,所述节点包括服务进程节点;所述分别对所述云平台中各个节点进行监控,采集告警数据,包括:
通过预设埋点和/或心跳监控进程,采集所述服务进程节点的告警数据。9.一种数据分析装置,其特征在于,包括:第一获取模块,用于获取云平台的部署架构图,并根据所述部署架构图,确定...

【专利技术属性】
技术研发人员:杨巍王红晓李启新李树贤董亮
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1