【技术实现步骤摘要】
一种数据资产地图的构建方法
[0001]本专利技术属于数据资产地图构建
,具体涉及一种数据资产地图的构建方法
。
技术介绍
[0002]随着业务的发展和数据体量的不断增加,企业内部数据孤岛问题日益显著
。
为解决企业找数难
、
用数难等问题,现基于已摄取的资产目录,以数据表为基本单元,构建一张数据地图来帮助用户实现快速查找数据
、
有效使用数据
、
以及链路分析等功能场景,进而实现数据价值最大化
。
[0003]目前大多数数据地图的构建都是基于任务配置和手动关联,然后将解析出来的血缘关系存储在
Mysql
库中
。
但无论是任务配置还是手动关联,总的来说都存在一个问题就是解析血缘关系均需要依赖开发人员主观意识的节点选定
。
[0004]另外这种构建方式还将会衍生出一下几个问题:
[0005]1.
无法解放开发人员的双手,增大开发人员的工作量;
[0006]2.
依赖配置将会导致血缘关系解析准确率低下;
[0007]3.
血缘解析的粒度不够细,应该包含表任务血缘
(
任务和表的血缘关系
)
;表表血缘
(
表和表之间的血缘关系
)
,字段血缘
(
字段和字段之间的血缘关系
)
;
[0008]4.
血缘查询或者链路分析时后 ...
【技术保护点】
【技术特征摘要】
1.
一种数据资产地图的构建方法,其特征在于,包括以下步骤:步骤
S1
:通过血缘摄取模块进行摄取,以获取所要解析的任务,包括实时获取和全量获取,其中:对于实时获取,当用户进行包括新建
、
测试
、
修改和删除任务时,数仓服务端会以实时事件的方式将用户进行的任务发送给资产平台服务端,最后解析出新的血缘替换老的血缘;对于全量获取,通过设定时间并且以定时方式解析当前所有被发布的任务,通过兜底操作从而防止实时事件遗漏某些任务的血缘解析;步骤
S2
:通过血缘解析模块进行解析,资产平台服务端获取到要解析的任务时,会获取任务的具体元数据信息,包括但不限于任务配置信息,然后依据任务配置信息构建出表任务关系,再将具体任务的
sql
发送给血缘解析服务,血缘解析服务会返回该任务的输入表信息和输出表信息,以及输入表信息被使用到的字段信息和产出的输出表信息的字段信息,最后资产平台服务端将根据输入输出信息以节点和边的关系构建出血缘关系并且存储在
mysql
;步骤
S3
:通过血缘查询模块进行查询,当每天全量解析完任务的血缘时,资产平台服务端会将
mysql
中的所有关系对读取出来,然后组装成
Janusgraph
图数据库接受的格式存储到图数据库;当用户进行简单查询时,资产平台服务端将会从
mysql
中查询出关系对并且组装成...
【专利技术属性】
技术研发人员:张婷婷,许彦超,李刚,谢素萍,
申请(专利权)人:数字扁担浙江科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。