System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据质量的校验方法及装置、电子设备、存储介质制造方法及图纸_技高网

一种数据质量的校验方法及装置、电子设备、存储介质制造方法及图纸

技术编号:40425451 阅读:4 留言:0更新日期:2024-02-20 22:45
本申请提供的一种数据质量的校验方法及装置、电子设备、存储介质,所述方法包括:获取Kafka日志集群以及检核要求;其中,Kafka日志集群至少包括目标日志文件;利用数据血缘关系分析,从上游系统中查找与目标日志文件对应的源头系统名、交易码以及报文域;从预先配置的各个检核规则中确定出与检核要求相匹配的目标检核规则;利用目标检核规则,对源头系统名、交易码以及报文域进行检核;若源头系统名、交易码以及报文域未通过检核,则输出源头系统名、交易码以及报文域。从而通过对数据源头的数据进行质量检核,能够及时地发现源头的数据出现质量问题,进而能够有效地推动对数据进行整改的效率。

【技术实现步骤摘要】

本申请涉及数据处理,尤其涉及一种数据质量的校验方法及装置、电子设备、存储介质


技术介绍

1、目前,监管机构对监管报送的数据质量进行严格的把控,其要求各银行机构的工作要符合“数字中国”的建设工作要求,并且还要开展east数据质量“提升工程”,以强化east数据治理,从而推动银行机构向数字化转型。因此对数据质量进行检核是尤为的重要。

2、在现有的技术中,主要根据数据库表以及校验文件对数据质量进行每日的检核,以实现对数据质量的严格管理。

3、由于每天只能按照固定的时间点对数据质量进行检核,无法支持实时地在线检核,因此当数据源头出现质量问题时,可能会导致未能及时地发现数据出现质量问题。


技术实现思路

1、基于上述现有技术的不足,本申请提供了一种数据质量的校验方法及装置、电子设备、存储介质,以解决现有技术无法及时地发现数据出现质量的问题。

2、为了实现上述目的,本申请提供了以下技术方案:

3、本申请第一方面提供了一种数据质量的校验方法,包括:

4、获取kafka日志集群以及检核要求;其中,所述kafka日志集群至少包括目标日志文件;

5、利用数据血缘关系分析,从上游系统中查找与所述目标日志文件对应的源头系统名、交易码以及报文域;

6、从预先配置的各个检核规则中确定出与所述检核要求相匹配的目标检核规则;

7、利用所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核;

8、若所述源头系统名、所述交易码以及所述报文域未通过检核,则输出所述源头系统名、所述交易码以及所述报文域。

9、可选地,在上述的数据质量的校验方法中,所述kafka日志集群的获取方法,包括:

10、接收上游系统发送的交易请求报文;

11、根据预设的交易处理逻辑,对所述交易请求报文进行处理,得到处理结果,并将所述处理报文组装成交易响应报文;

12、利用日志输出框架,将所述交易请求报文以及所述交易响应报文写入到日志文件中,得到目标日志文件;

13、通过调用流式报文sdk插件,将所述目标日志文件写入到大数据平台的kafka消息队列中,由所述大数据平台将kafka消息队列中的所述目标日志文件存储到kafka日志集群中。

14、可选地,在上述的数据质量的校验方法中,若所述目标检核规则为缺失检核规则,所述利用所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核,包括:

15、将所述源头系统名、所述交易码以及所述报文域添加至kafka消息队列中;

16、利用所述缺失检核规则中的缺失检核字段,判断所述kafka消息队列中所述源头系统名对应的字段值、所述交易码对应的字段值以及所述报文域对应的字段值是否为空值;

17、若所述kafka消息队列中所述源头系统名对应的字段值、所述交易码对应的字段值以及所述报文域对应的字段值均为空值,则确定所述源头系统名、所述交易码以及所述报文域未通过缺失检核;

18、若所述kafka消息队列中所述源头系统名对应的字段值、所述交易码对应的字段值以及所述报文域对应的字段值均为非空值,则确定所述源头系统名、所述交易码以及所述报文域通过缺失检核。

19、可选地,在上述的数据质量的校验方法中,若所述目标检核规则为规范检核规则,所述利用所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核,包括:

20、将所述源头系统名、所述交易码以及所述报文域添加至kafka消息队列中;

21、利用所述规范检核规则中的规范字段,判断所述kafka消息队列中所述源头系统名对应的字段值、所述交易码对应的字段值以及所述报文域对应的字段值是否满足预设的格式要求;

22、若所述kafka消息队列中所述源头系统名对应的字段值、所述交易码对应的字段值以及所述报文域对应的字段值不满足预设的格式要求,则确定所述源头系统名、所述交易码以及所述报文域未通过规范检核;

23、若所述kafka消息队列中所述源头系统名对应的字段值、所述交易码对应的字段值以及所述报文域对应的字段值满足预设的格式要求,则确定所述源头系统名、所述交易码以及所述报文域通过规范检核。

24、可选地,在上述的数据质量的校验方法中,若所述目标检核规则为表间关联检核规则,所述利用所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核,包括:

25、将所述源头系统名、所述交易码以及所述报文域添加至kafka消息队列中;

26、从数据湖获取与所述检核要求对应的关联表;

27、利用所述表间关联检核规则中的关联字段,检测所述关联表中是否存在所述kafka消息队列中所述源头系统名、所述交易码以及所述报文域,且所述kafka消息队列中所述源头系统名、所述交易码以及所述报文域是否满足所述检核要求;

28、若所述关联表中不存在所述kafka消息队列中所述源头系统名、所述交易码以及所述报文域,且所述kafka消息队列中所述源头系统名、所述交易码以及所述报文域不满足所述检核要求,则确定所述源头系统名、所述交易码以及所述报文域未通过关联检核;

29、若所述关联表中存在所述kafka消息队列中所述源头系统名、所述交易码以及所述报文域,且所述kafka消息队列中所述源头系统名、所述交易码以及所述报文域满足所述检核要求,则确定所述源头系统名、所述交易码以及所述报文域通过关联检核。

30、可选地,在上述的数据质量的校验方法中,所述根据所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核之后,还包括:

31、若所述源头系统名、所述交易码以及所述报文域通过检核,则反馈所述目标日志文件未存在质量问题的信息。

32、本申请第二方面提供了一种数据质量的校验装置,包括:

33、集群获取单元,用于获取kafka日志集群以及检核要求;其中,所述kafka日志集群至少包括目标日志文件;

34、查找单元,用于利用数据血缘关系分析,从上游系统中查找与所述目标日志文件对应的源头系统名、交易码以及报文域;

35、规则确定单元,用于从预先配置的各个检核规则中确定出与所述检核要求相匹配的目标检核规则;

36、检核单元,用于利用所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核;

37、输出单元,用于若所述源头系统名、所述交易码以及所述报文域未通过检核,则输出所述源头系统名、所述交易码以及所述报文域。

38、可选地,在上述的数据质量的校验装置中,还包括:

39、接收单元,用于接收上游系统发送的交易请求报文;

40、处理单元,用于根据预设的交易处理逻辑,对所述交易请求报文进行处理,得到处理结果,并将所述处理报文组装成交本文档来自技高网...

【技术保护点】

1.一种数据质量的校验方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述Kafka日志集群的获取方法,包括:

3.根据权利要求1所述的方法,其特征在于,若所述目标检核规则为缺失检核规则,所述利用所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核,包括:

4.根据权利要求1所述的方法,其特征在于,若所述目标检核规则为规范检核规则,所述利用所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核,包括:

5.根据权利要求1所述的方法,其特征在于,若所述目标检核规则为表间关联检核规则,所述利用所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核之后,还包括:

7.一种数据质量的校验装置,其特征在于,包括:

8.根据权利要求7所述的装置,其特征在于,还包括:

9.一种电子设备,其特征在于,包括:>

10.一种计算机存储介质,其特征在于,用于存储计算机程序,所述计算机程序被执行时,用于实现如权利要求1至6任意一项所述的一种数据质量的校验方法。

...

【技术特征摘要】

1.一种数据质量的校验方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述kafka日志集群的获取方法,包括:

3.根据权利要求1所述的方法,其特征在于,若所述目标检核规则为缺失检核规则,所述利用所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核,包括:

4.根据权利要求1所述的方法,其特征在于,若所述目标检核规则为规范检核规则,所述利用所述目标检核规则,对所述源头系统名、所述交易码以及所述报文域进行检核,包括:

5.根据权利要求1所述的方法,其特征在于,若所述目标检核规则为表间关联...

【专利技术属性】
技术研发人员:吕震郭玉章陈洁李颢刘莎刘志聪邱梦华
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1