System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机,特别涉及一种元数据血缘分析方法、装置、设备及存储介质。
技术介绍
1、在大数据时代,庞杂的数据在快速产生,这些海量复杂的数据通过各种加工融合、转换,又会生成新的数据,这些数据之间存在着天然的联系,称之为数据血缘。现有技术中,在许多业务场景中都需要数据血缘关系图谱,例如,数据溯源、数据质量评估等,因此,获得高质量的数据血缘迫在眉睫。其中,数据血缘分析建立在元数据整合的基础上,是在数据溯源的过程中找到相关数据之间的联系,记录数据治理过程中的血缘关系,实现数据融合处理的可追溯性。基于这些血缘关系信息,可以进行以数据流向为主线的血缘追溯功能,可以一直追溯到数据的产生。血缘分析的输出结果包括回溯过程中所找到的所有相关元数据对象,以及这些元数据对象之间的关系。因此,如何实现个性化的血缘分析也是目前有待解决的问题。
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种元数据血缘分析方法、装置、设备及存储介质,能够通过对元数据血缘关系信息进行生成、存储、分析和可视化显示,提供高质量的血缘关系信息,满足用户直观查看血缘关系的需求。其具体方案如下:
2、第一方面,本申请提供了一种元数据血缘分析方法,包括:
3、获取若干用户终端分别推送的基于若干种数据任务生成的若干元数据血缘关系信息,以及基于所述若干元数据血缘关系信息确定若干不同粒度元数据的血缘关系信息并存储至分布式搜索和分析引擎中;
4、确定目标用户的身份属性信息,以及从所述若干不同粒度元
5、当获取到所述目标用户选择的目标粒度元数据时,通过所述分布式搜索和分析引擎基于若干种分析方法分别从所述若干目标血缘关系信息中读取与所述目标粒度元数据对应的血缘数据,并对与所述目标粒度元数据对应的血缘数据分别进行分析以得到若干种分析结果;
6、基于分析结果选取指令从所述若干种分析结果中确定目标分析结果,并将所述目标分析结果以关系图的形式显示在当前界面上。
7、可选的,所述获取若干用户终端分别推送的基于若干种数据任务生成的若干元数据血缘关系信息,包括:
8、获取若干用户终端分别推送的基于数据集成同步任务、数据开发流程任务、数据服务接口配置任务和结构化查询语句加工任务生成的若干元数据血缘关系信息。
9、可选的,基于数据集成同步任务、数据开发流程任务、数据服务接口配置任务和结构化查询语句加工任务生成若干元数据血缘关系信息,包括:
10、获取与所述数据集成同步任务对应的包含数据来源、数据流向和字段映射的数据同步信息,并对所述数据同步信息进行解析,以得到统一数据结构的第一元数据血缘关系信息;
11、获取与所述数据开发流程任务对应的用于存储数据流信息的存储文件,并确定与所述存储文件对应的包含数据来源、数据流向和字段映射的存储属性信息,然后对所述存储属性信息进行分析,以得到统一数据结构的第二元数据血缘关系信息;
12、获取与所述数据服务接口配置任务对应的包含接口发布、接口下线和接口修改的数据服务接口配置信息,并对所述数据服务接口配置信息进行解析,以得到统一数据结构的第三元数据血缘关系信息;
13、获取与所述结构化查询语句加工任务对应的结构化查询语句,并对所述结构化查询语句进行词法分析以生成抽象语法树,遍历所述抽象语法树以对所述结构化查询语句进行语法分析,以得到统一数据结构的第四元数据血缘关系信息。
14、可选的,所述若干不同粒度元数据的血缘关系信息包括数据库级元数据的血缘关系信息、数据表级元数据的血缘关系信息和数据字段级元数据的血缘关系信息。
15、可选的,所述若干种分析方法包括全链分析方法、影响分析方法、血缘分析方法和关联度分析方法;
16、相应的,所述基于若干种分析方法分别从所述若干目标血缘关系信息中读取与所述目标粒度元数据对应的血缘数据,包括:
17、基于所述全链分析方法从所述若干目标血缘关系信息中读取与所述目标粒度元数据存在关联关系的所有血缘数据;
18、基于所述影响分析方法从所述若干目标血缘关系信息中读取与所述目标粒度元数据存在关联关系的下游血缘数据;
19、基于所述血缘分析方法从所述若干目标血缘关系信息中读取与所述目标粒度元数据存在关联关系的上游血缘数据;
20、基于所述关联度分析方法从所述若干目标血缘关系信息中读取与所述目标粒度元数据存在关联关系的所有血缘数据,以便利用基于所述所有血缘数据的数量确定的关联次数对所述目标粒度元数据进行关联度分析得到关联度分析结果。
21、可选的,所述将所述目标分析结果以关系图的形式显示在当前界面上,包括:
22、基于所述目标分析结果中的所述目标粒度元数据以及对应的所述血缘数据确定关系节点,并基于所述目标分析结果中的所述目标粒度元数据与所述血缘数据之间的关系信息以及各所述血缘数据之间的关系信息确定各所述关系节点之间的边信息;
23、基于各所述关系节点以及各所述关系节点之间的边信息确定关系图,并将所述关系图显示在当前界面上。
24、可选的,所述将所述目标分析结果以关系图的形式显示在当前界面上之后,还包括:
25、获取所述目标用户在当前界面上针对所述关系图中关系节点的点击操作,并将被点击的关系节点进行高亮显示,以及将与所述被点击的关系节点对应的节点属性信息显示在预设窗口中;
26、获取所述目标用户在当前界面上针对所述关系图中目标边的点击操作,并将与所述目标边对应的边属性信息显示在所述预设窗口中;所述目标边为所述关系图中的任意一条边。
27、第二方面,本申请提供了一种元数据血缘分析装置,包括:
28、血缘信息生成模块,用于获取若干用户终端分别推送的基于若干种数据任务生成的若干元数据血缘关系信息,以及基于所述若干元数据血缘关系信息确定若干不同粒度元数据的血缘关系信息并存储至分布式搜索和分析引擎中;
29、目标信息确定模块,用于确定目标用户的身份属性信息,以及从所述若干不同粒度元数据的血缘关系信息中确定与所述身份属性信息对应的若干目标血缘关系信息并显示在当前界面上;
30、血缘数据分析模块,用于当获取到所述目标用户选择的目标粒度元数据时,通过所述分布式搜索和分析引擎基于若干种分析方法分别从所述若干目标血缘关系信息中读取与所述目标粒度元数据对应的血缘数据,并对与所述目标粒度元数据对应的血缘数据分别进行分析以得到若干种分析结果;
31、关系图显示模块,用于基于分析结果选取指令从所述若干种分析结果中确定目标分析结果,并将所述目标分析结果以关系图的形式显示在当前界面上。
32、第三方面,本申请提供了一种电子设备,包括:
33、存储器,用于保存计算机程序;
34、处理器,用于执行所述计算机本文档来自技高网...
【技术保护点】
1.一种元数据血缘分析方法,其特征在于,包括:
2.根据权利要求1所述的元数据血缘分析方法,其特征在于,所述获取若干用户终端分别推送的基于若干种数据任务生成的若干元数据血缘关系信息,包括:
3.根据权利要求2所述的元数据血缘分析方法,其特征在于,基于数据集成同步任务、数据开发流程任务、数据服务接口配置任务和结构化查询语句加工任务生成若干元数据血缘关系信息,包括:
4.根据权利要求1所述的元数据血缘分析方法,其特征在于,所述若干不同粒度元数据的血缘关系信息包括数据库级元数据的血缘关系信息、数据表级元数据的血缘关系信息和数据字段级元数据的血缘关系信息。
5.根据权利要求1所述的元数据血缘分析方法,其特征在于,所述若干种分析方法包括全链分析方法、影响分析方法、血缘分析方法和关联度分析方法;
6.根据权利要求1至5任一项所述的元数据血缘分析方法,其特征在于,所述将所述目标分析结果以关系图的形式显示在当前界面上,包括:
7.根据权利要求6所述的元数据血缘分析方法,其特征在于,所述将所述目标分析结果以关系图的形式显示在当
8.一种元数据血缘分析装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的元数据血缘分析方法。
...【技术特征摘要】
1.一种元数据血缘分析方法,其特征在于,包括:
2.根据权利要求1所述的元数据血缘分析方法,其特征在于,所述获取若干用户终端分别推送的基于若干种数据任务生成的若干元数据血缘关系信息,包括:
3.根据权利要求2所述的元数据血缘分析方法,其特征在于,基于数据集成同步任务、数据开发流程任务、数据服务接口配置任务和结构化查询语句加工任务生成若干元数据血缘关系信息,包括:
4.根据权利要求1所述的元数据血缘分析方法,其特征在于,所述若干不同粒度元数据的血缘关系信息包括数据库级元数据的血缘关系信息、数据表级元数据的血缘关系信息和数据字段级元数据的血缘关系信息。
5.根据权利要求1所述的元数据血缘分析...
【专利技术属性】
技术研发人员:彭文净,赵敬,张明哲,
申请(专利权)人:浪潮云信息技术股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。