【技术实现步骤摘要】
对数据执行链路监控的方法、系统、装置、设备及介质
[0001]本专利技术涉及大数据业务
,具体涉及一种对数据执行链路监控的监控方法
、
系统及装置
。
技术介绍
[0002]HDFS(Hadoop Distributed File System
,分布式系统基础架构分布式文件系统
)
是大数据业务的底层存储服务,也是大数据平台最为基础的依赖组件
。
如果
HDFS
服务异常,会导致数据丢失
、
上层业务大面积终止等一系列严重后果
。
由于
HDFS
服务中任务请求的处理流程复杂,因此难以对
HDFS
请求执行链路进行监控,难以获取
HDFS
完整链路信息
、
追溯
HDFS
服务异常的根源
、
识别异常情况并对异常情况进行告警
。
[0003]现有技术通过排查日志记录对
HDFS
请求执行链路进行监控
。
然而,由于日志记录信息杂乱,排查过程会占用大量的时间成本,使得
HDFS
服务异常的解决丧失了时效性,对数据业务造成不必要的损失
。
并且,现有技术没有将获取到的链路信息进行可视化展示,难以高效便捷的定位
HDFS
服务异常
。
[0004]因此,现有技术日志存在信息记录杂乱,排查日志的时间成本 ...
【技术保护点】
【技术特征摘要】
1.
一种对数据执行链路监控的方法,其特征在于,所述方法包括:获取数据访问请求执行过程中每个步骤的执行信息;根据所述执行信息中的上下游关系信息,得到所述数据访问请求执行过程的目标执行链路;根据所述执行信息,得到每个所述步骤的执行频次
、
所述数据访问请求执行过程的总执行耗时和异常步骤;将所述执行频次
、
所述总执行耗时以及所述异常步骤进行汇总,得到所述目标执行链路的告警关联信息
。2.
根据权利要求1所述的方法,其特征在于,在所述将所述执行频次
、
所述总执行耗时以及所述异常步骤进行汇总,得到所述目标执行链路的告警关联信息之前,所述方法还包括:根据所述执行信息判断是否存在执行超时的步骤,如果存在所述执行超时的步骤,则生成第一告警信息,其中,所述执行超时的步骤为耗时大于第一预设阈值的步骤;根据所述执行信息判断是否存在满足第一触发条件的步骤,如果存在,则生成第二告警信息,其中,所述第一触发条件用于表征所述步骤的参数出现异常;根据所述目标执行链路和所述执行信息判断是否存在满足第二触发条件的步骤,如果存在,则生成第三告警信息,其中,所述第二触发条件用于表征所述步骤的执行过程出现异常
。3.
根据权利要求2所述的方法,其特征在于,在所述根据所述执行信息判断是否存在执行超时的步骤之前,所述方法还包括:获取所述第一预设阈值
、
所述第一触发条件以及所述第二触发条件;将所述第一预设阈值
、
所述第一触发条件以及所述第二触发条件同步到信息聚合部件,其中,所述信息聚合部件用于生成所述第一告警信息
、
所述第二告警信息以及所述第三告警信息
。4.
根据权利要求2所述的方法,其特征在于,在所述得到所述目标执行链路的告警关联信息之后,所述方法还包括:在生成告警信息之后,将所述目标执行链路
、
所述执行信息
、
所述告警关联信息以及所述告警信息进行可视化展示,其中,所述告警信息包括所述第一告警信息
、
所述第二告警信息以及所述第三告警信息
。5.
根据权利要求1所述的方法,其特征在于,所述获取数据访问请求执行过程中每个步骤的执行信息,包括:将监控元件嵌入数据访问请求执行模块,其中,所述数据访问请求执行模块用于进行所述数据访问请求执行过程,所述数据访问请求执行模块包括客户端
、
管理节点服务子模块以及工作节点服务子模块,所述客户端执行所述数据访问请求执行过程中的第一数量个所述步骤,所述管理节点服务子模块执行所述数据访问请求执行过程中的第二数量个所述步骤,所述工作节...
【专利技术属性】
技术研发人员:和思扬,黄召军,王帅阳,
申请(专利权)人:济南浪潮数据技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。